Sas-boxplots
SAS-箱ひげ図
Boxplotは、四分位数による数値データのグループのグラフィカルな表現です。 ボックスプロットには、ボックス(ヒゲ)から垂直に伸びる線があり、上下の四分位以外の変動を示します。 ボックスの下部と上部は常に1番目と3番目の四分位数であり、ボックス内のバンドは常に2番目の四分位数(中央値)です。 SASでは、 PROC SGPLOT を使用して単純なボックスプロットが作成され、 PROC SGPANEL を使用してパネル化されたボックスプロットが作成されます。
最初の例ではCARS1という名前のデータセットを作成し、後続のすべてのデータセットに同じデータセットを使用していることに注意してください。 このデータセットは、SASセッションが終了するまで作業ライブラリに残ります。
構文
SASで箱ひげ図を作成するための基本的な構文は次のとおりです-
PROC SGPLOT DATA = DATASET;
VBOX VARIABLE/category = VARIABLE;
RUN;
PROC SGPANEL DATA = DATASET;;
PANELBY VARIABLE;
VBOX VARIABLE>/category = VARIABLE;
RUN;
- DATASET -使用されるデータセットの名前です。
- VARIABLE -Boxplotのプロットに使用される値です。
シンプルな箱ひげ図
単純なBoxplotでは、データセットから1つの変数を選択し、別の変数を選択してカテゴリを形成します。 最初の変数の値は、2番目の変数の個別の値の数と同じ数のグループに分類されます。
例
以下の例では、変数horsepowerを最初の変数として選択し、カテゴリ変数として入力します。 そのため、車の種類ごとの馬力の値の分布の箱ひげ図を取得します。
PROC SQL;
create table CARS1 as
SELECT make, model, type, invoice, horsepower, length, weight
FROM
SASHELP.CARS
WHERE make in ('Audi','BMW')
;
RUN;
PROC SGPLOT DATA = CARS1;
VBOX horsepower
/category = type;
title 'Horsepower of cars by types';
RUN;
上記のコードを実行すると、次の出力が得られます-
垂直パネルの箱ひげ図
変数のBoxplotsを多くの垂直パネル(列)に分割できます。 各パネルには、すべてのカテゴリ変数の箱ひげ図が含まれています。 しかし、箱ひげ図は、グラフを複数のパネルに分割する別の3番目の変数を使用してさらにグループ化されます。
例
以下の例では、変数「make」を使用してグラフをパネル化しました。 'make’には2つの異なる値があるため、2つの垂直パネルを取得します。
PROC SGPANEL DATA = CARS1;
PANELBY MAKE;
VBOX horsepower /category = type;
title 'Horsepower of cars by types';
RUN;
上記のコードを実行すると、次の出力が得られます-
水平パネルの箱ひげ図
変数のBoxplotsを多くの水平パネル(行)に分割できます。 各パネルには、すべてのカテゴリ変数の箱ひげ図が含まれています。 しかし、箱ひげ図は、グラフを複数のパネルに分割する別の3番目の変数を使用してさらにグループ化されます。 以下の例では、変数「make」を使用してグラフをパネル化しました。 'make’には2つの異なる値があるため、2つの水平パネルを取得します。
PROC SGPANEL DATA = CARS1;
PANELBY MAKE/columns = 1 novarname;
VBOX horsepower /category = type;
title 'Horsepower of cars by types';
RUN;
上記のコードを実行すると、次の出力が得られます-