Sas-boxplots

提供:Dev Guides
移動先:案内検索

SAS-箱ひげ図

Boxplotは、四分位数による数値データのグループのグラフィカルな表現です。 ボックスプロットには、ボックス(ヒゲ)から垂直に伸びる線があり、上下の四分位以外の変動を示します。 ボックスの下部と上部は常に1番目と3番目の四分位数であり、ボックス内のバンドは常に2番目の四分位数(中央値)です。 SASでは、 PROC SGPLOT を使用して単純なボックスプロットが作成され、 PROC SGPANEL を使用してパネル化されたボックスプロットが作成されます。

最初の例ではCARS1という名前のデータセットを作成し、後続のすべてのデータセットに同じデータセットを使用していることに注意してください。 このデータセットは、SASセッションが終了するまで作業ライブラリに残ります。

構文

SASで箱ひげ図を作成するための基本的な構文は次のとおりです-

PROC SGPLOT  DATA = DATASET;
   VBOX VARIABLE/category = VARIABLE;
RUN;

PROC SGPANEL  DATA = DATASET;;
PANELBY VARIABLE;
   VBOX VARIABLE>/category = VARIABLE;
RUN;
  • DATASET -使用されるデータセットの名前です。
  • VARIABLE -Boxplotのプロットに使用される値です。

シンプルな箱ひげ図

単純なBoxplotでは、データセットから1つの変数を選択し、別の変数を選択してカテゴリを形成します。 最初の変数の値は、2番目の変数の個別の値の数と同じ数のグループに分類されます。

以下の例では、変数horsepowerを最初の変数として選択し、カテゴリ変数として入力します。 そのため、車の種類ごとの馬力の値の分布の箱ひげ図を取得します。

PROC SQL;
create table CARS1 as
SELECT make, model, type, invoice, horsepower, length, weight
   FROM
   SASHELP.CARS
   WHERE make in ('Audi','BMW')
;
RUN;

PROC SGPLOT  DATA = CARS1;
   VBOX horsepower
  /category = type;

   title 'Horsepower of cars by types';
RUN;

上記のコードを実行すると、次の出力が得られます-

box_plot_1

垂直パネルの箱ひげ図

変数のBoxplotsを多くの垂直パネル(列)に分割できます。 各パネルには、すべてのカテゴリ変数の箱ひげ図が含まれています。 しかし、箱ひげ図は、グラフを複数のパネルに分割する別の3番目の変数を使用してさらにグループ化されます。

以下の例では、変数「make」を使用してグラフをパネル化しました。 'make’には2つの異なる値があるため、2つの垂直パネルを取得します。

PROC SGPANEL  DATA = CARS1;
PANELBY MAKE;
   VBOX horsepower  /category = type;

   title 'Horsepower of cars by types';
RUN;

上記のコードを実行すると、次の出力が得られます-

box_plot_2

水平パネルの箱ひげ図

変数のBoxplotsを多くの水平パネル(行)に分割できます。 各パネルには、すべてのカテゴリ変数の箱ひげ図が含まれています。 しかし、箱ひげ図は、グラフを複数のパネルに分割する別の3番目の変数を使用してさらにグループ化されます。 以下の例では、変数「make」を使用してグラフをパネル化しました。 'make’には2つの異なる値があるため、2つの水平パネルを取得します。

PROC SGPANEL  DATA = CARS1;
PANELBY MAKE/columns = 1 novarname;

   VBOX horsepower  /category = type;

   title 'Horsepower of cars by types';
RUN;

上記のコードを実行すると、次の出力が得られます-

box_plot_3