R-analysis-of-covariance
R-共分散分析
回帰分析を使用して、予測変数の変動が応答変数に与える影響を記述するモデルを作成します。 Yes/NoやMale/Femaleなどの値を持つカテゴリ変数がある場合、時々 単純回帰分析では、カテゴリー変数の各値に対して複数の結果が得られます。 このようなシナリオでは、予測変数と一緒に使用し、カテゴリ変数の各レベルの回帰直線を比較することにより、カテゴリ変数の効果を調べることができます。 このような分析は、 ANCOVA とも呼ばれる Analysis of Covariance と呼ばれます。
例
Rに組み込まれたデータセットmtcarsについて考えます。 その中で、フィールド「am」は伝送のタイプ(自動または手動)を表していることがわかります。 値0および1のカテゴリ変数です。 馬力( "hp")の値に加えて、車のガロンあたりのマイル値(mpg)もそれに依存します。
「mpg」と「hp」の間の回帰に対する「am」の値の影響を研究します。 これは、* aov()関数の後に anova()*関数を使用して、重回帰を比較することにより行われます。
入力データ
データセットmtcarsからフィールド「mpg」、「hp」、および「am」を含むデータフレームを作成します。 ここでは、応答変数として「mpg」、予測変数として「hp」、カテゴリ変数として「am」を使用します。
上記のコードを実行すると、次の結果が生成されます-
ANCOVA分析
「am」と「hp」の間の相互作用を考慮して、予測変数として「hp」、応答変数として「mpg」を使用する回帰モデルを作成します。
カテゴリ変数と予測変数の間の相互作用があるモデル
上記のコードを実行すると、次の結果が生成されます-
この結果は、両方の場合のp値が0.05未満であるため、馬力と伝達タイプの両方がガロンあたりのマイル数に大きな影響を与えることを示しています。 ただし、p値が0.05を超えるため、これら2つの変数間の相互作用は重要ではありません。
カテゴリ変数と予測変数間の相互作用のないモデル
上記のコードを実行すると、次の結果が生成されます-
この結果は、両方の場合のp値が0.05未満であるため、馬力と伝達タイプの両方がガロンあたりのマイル数に大きな影響を与えることを示しています。
2つのモデルの比較
ここで、2つのモデルを比較して、変数の相互作用が本当に重要でないかどうかを結論付けることができます。 このために、* anova()*関数を使用します。
上記のコードを実行すると、次の結果が生成されます-
p値が0.05より大きいため、馬力と伝達タイプの相互作用は重要ではないと結論付けます。 したがって、ガロンあたりの走行距離は、自動および手動変速モードの両方で、同様に自動車の馬力に依存します。