Sas-frequency-distributions

提供:Dev Guides
移動先:案内検索

SAS-頻度分布

頻度分布は、データセット内のデータポイントの頻度を示すテーブルです。 表の各エントリには、特定のグループまたは間隔内での値の出現頻度またはカウントが含まれ、この方法で、表はサンプルの値の分布を要約します。

SASは、データセット内のデータポイントの頻度分布を計算する PROC FREQ と呼ばれる手順を提供します。

構文

SASで頻度分布を計算するための基本的な構文は次のとおりです-

PROC FREQ DATA = Dataset ;
TABLES Variable_1 ;
BY Variable_2 ;

以下は、使用されるパラメータの説明です-

  • Dataset はデータセットの名前です。
  • Variables_1 は、頻度分布を計算する必要があるデータセットの変数名です。
  • Variables_2 は、頻度分布の結果を分類した変数です。

単一の可変頻度分布

  • PROC FREQ。*を使用して、単一変数の度数分布を決定できます。この場合、結果には変数の各値の度数が表示されます。 結果には、パーセンテージ分布、累積頻度、累積パーセンテージも表示されます。

以下の例では、ライブラリ* SASHELP.CARS。から作成された *CARS1 という名前のデータセットの変数horsepowerの頻度分布を見つけます。結果は2つのカテゴリの結果に分かれています。 車のメーカーごとに1つ。

PROC SQL;
create table CARS1 as
SELECT make, model, type, invoice, horsepower, length, weight
   FROM
   SASHELP.CARS
   WHERE make in ('Audi','BMW')
;
RUN;

proc FREQ data = CARS1 ;
tables horsepower;
by make;
run;

上記のコードが実行されると、次の結果が得られます-

FREQ_By2

複数の可変頻度分布

すべての可能な組み合わせにグループ化する複数の変数の頻度分布を見つけることができます。

以下の例では、*車種ごとにグループ化*された車のメーカーの頻度分布と、*各メーカーごとにグループ化された車の各タイプの頻度分布*を計算します。

proc FREQ data = CARS1 ;
tables make type;
run;

上記のコードが実行されると、次の結果が得られます-

FREQ_tables1

重み付き頻度分布

重みオプションを使用すると、変数の重みで偏った頻度分布を計算できます。 ここでは、変数の値は、値のカウントではなく、観測数として取得されます。

次の例では、馬力に割り当てられた重みを使用して、変数makeおよびtypeの頻度分布を計算します。

proc FREQ data = CARS1 ;
tables make type;
weight horsepower;
run;

上記のコードが実行されると、次の結果が得られます-

FREQ_tables3