Sas-frequency-distributions
提供:Dev Guides
SAS-頻度分布
頻度分布は、データセット内のデータポイントの頻度を示すテーブルです。 表の各エントリには、特定のグループまたは間隔内での値の出現頻度またはカウントが含まれ、この方法で、表はサンプルの値の分布を要約します。
SASは、データセット内のデータポイントの頻度分布を計算する PROC FREQ と呼ばれる手順を提供します。
構文
SASで頻度分布を計算するための基本的な構文は次のとおりです-
PROC FREQ DATA = Dataset ;
TABLES Variable_1 ;
BY Variable_2 ;
以下は、使用されるパラメータの説明です-
- Dataset はデータセットの名前です。
- Variables_1 は、頻度分布を計算する必要があるデータセットの変数名です。
- Variables_2 は、頻度分布の結果を分類した変数です。
単一の可変頻度分布
- PROC FREQ。*を使用して、単一変数の度数分布を決定できます。この場合、結果には変数の各値の度数が表示されます。 結果には、パーセンテージ分布、累積頻度、累積パーセンテージも表示されます。
例
以下の例では、ライブラリ* SASHELP.CARS。から作成された *CARS1 という名前のデータセットの変数horsepowerの頻度分布を見つけます。結果は2つのカテゴリの結果に分かれています。 車のメーカーごとに1つ。
PROC SQL;
create table CARS1 as
SELECT make, model, type, invoice, horsepower, length, weight
FROM
SASHELP.CARS
WHERE make in ('Audi','BMW')
;
RUN;
proc FREQ data = CARS1 ;
tables horsepower;
by make;
run;
上記のコードが実行されると、次の結果が得られます-
複数の可変頻度分布
すべての可能な組み合わせにグループ化する複数の変数の頻度分布を見つけることができます。
例
以下の例では、*車種ごとにグループ化*された車のメーカーの頻度分布と、*各メーカーごとにグループ化された車の各タイプの頻度分布*を計算します。
proc FREQ data = CARS1 ;
tables make type;
run;
上記のコードが実行されると、次の結果が得られます-
重み付き頻度分布
重みオプションを使用すると、変数の重みで偏った頻度分布を計算できます。 ここでは、変数の値は、値のカウントではなく、観測数として取得されます。
例
次の例では、馬力に割り当てられた重みを使用して、変数makeおよびtypeの頻度分布を計算します。
proc FREQ data = CARS1 ;
tables make type;
weight horsepower;
run;
上記のコードが実行されると、次の結果が得られます-