Sas-correlation-analysis

提供:Dev Guides
移動先:案内検索

SAS-相関分析

相関分析は、変数間の関係を扱います。 相関係数は、2つの変数間の線形関連性の尺度です。相関係数の値は常に-1〜+1です。 SASは、データセット内の変数ペア間の相関係数を見つけるための PROC CORR プロシージャを提供します。

構文

SASでPROC CORRを適用するための基本的な構文は次のとおりです-

PROC CORR DATA = dataset options;
VAR variable;

以下は、使用されるパラメータの説明です-

  • Dataset はデータセットの名前です。
  • *オプション*は、マトリックスのプロットなどの手順を備えた追加オプションです。
  • *変数*は、相関の検索に使用されるデータセットの変数名です。

データセットで使用可能な変数のペア間の相関係数は、VARステートメントで名前を使用して取得できます。次の例では、データセットCARS1を使用して、馬力と体重の相関係数を示す結果を取得します。

PROC SQL;
create table CARS1 as
SELECT invoice, horsepower, length, weight
   FROM
   SASHELP.CARS
   WHERE make in ('Audi','BMW')
;
RUN;

proc corr data = cars1 ;
VAR horsepower weight ;
BY make;
run;

上記のコードが実行されると、次の結果が得られます-

corr_ana_2

すべての変数間の相関

データセットで使用可能なすべての変数間の相関係数は、データセット名でプロシージャを適用するだけで取得できます。

以下の例では、データセットCARS1を使用して、変数の各ペア間の相関係数を示す結果を取得します。

proc corr data = cars1 ;
run;

上記のコードが実行されると、次の結果が得られます-

corr_ana_1

相関行列

*PROC* ステートメントで行列をプロットするオプションを選択することにより、変数間の散布図行列を取得できます。

以下の例では、馬力と体重のマトリックスを取得します。

proc corr data = cars1 plots = matrix ;
VAR horsepower weight ;
run;

上記のコードが実行されると、次の結果が得られます-

corr_ana_3