R-poisson-regression
提供:Dev Guides
R-ポアソン回帰
ポアソン回帰には、応答変数が小数ではなくカウントの形式である回帰モデルが含まれます。 たとえば、サッカーの試合シリーズでの出生数または勝利数のカウント。 また、応答変数の値はポアソン分布に従います。
ポアソン回帰の一般的な数学方程式は-
log(y) = a + b1x1 + b2x2 + bnxn.....
以下は、使用されるパラメータの説明です-
- y は応答変数です。
- a および b は数値係数です。
- x は予測変数です。
ポアソン回帰モデルの作成に使用される関数は* glm()*関数です。
構文
ポアソン回帰の* glm()*関数の基本的な構文は次のとおりです-
glm(formula,data,family)
以下は、上記の機能で使用されるパラメータの説明です-
- *式*は、変数間の関係を表す記号です。
- data は、これらの変数の値を提供するデータセットです。
- family は、モデルの詳細を指定するRオブジェクトです。 ロジスティック回帰の値は「ポアソン」です。
例
ウールのタイプ(AまたはB)と張力(低、中、または高)が織機ごとの経糸破断の数に与える影響を記述する組み込みデータセット「経糸破断」があります。 「ブレーク」を、ブレークの数のカウントである応答変数として考えてみましょう。 ウールの「タイプ」と「テンション」は、予測変数として使用されます。
- 入力データ *
input <- warpbreaks
print(head(input))
上記のコードを実行すると、次の結果が生成されます-
breaks wool tension
1 26 A L
2 30 A L
3 54 A L
4 25 A L
5 70 A L
6 52 A L
回帰モデルを作成する
output <-glm(formula = breaks ~ wool+tension, data = warpbreaks,
family = poisson)
print(summary(output))
上記のコードを実行すると、次の結果が生成されます-
Call:
glm(formula = breaks ~ wool + tension, family = poisson, data = warpbreaks)
Deviance Residuals:
Min 1Q Median 3Q Max
-3.6871 -1.6503 -0.4269 1.1902 4.2616
Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) 3.69196 0.04541 81.302 < 2e-16* **
woolB -0.20599 0.05157 -3.994 6.49e-05 ***
tensionM -0.32132 0.06027 -5.332 9.73e-08 ***
tensionH -0.51849 0.06396 -8.107 5.21e-16 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
(Dispersion parameter for poisson family taken to be 1)
Null deviance: 297.37 on 53 degrees of freedom
Residual deviance: 210.39 on 50 degrees of freedom
AIC: 493.06
Number of Fisher Scoring iterations: 4
要約では、応答変数に対する予測変数の影響を考慮するために、最後の列のp値が0.05未満になるようにします。 ご覧のように、張力タイプMおよびHのウールタイプBは、破断回数に影響を与えます。