R-boxplots

提供:Dev Guides
移動先:案内検索

R-ボックスプロット

箱ひげ図は、データセット内のデータがどれだけ適切に分散されているかの尺度です。 データセットを3つの四分位数に分割します。 このグラフは、データセットの最小値、最大値、中央値、最初の四分位数、3番目の四分位数を表します。 また、データセットごとに箱ひげ図を描くことにより、データセット全体でデータの分布を比較するのにも役立ちます。

ボックスプロットは、* boxplot()*関数を使用してRで作成されます。

構文

Rで箱ひげ図を作成するための基本的な構文は次のとおりです-

boxplot(x, data, notch, varwidth, names, main)

以下は、使用されるパラメータの説明です-

  • x はベクトルまたは数式です。
  • data はデータフレームです。
  • notch は論理値です。 ノッチを描画するにはTRUEに設定します。
  • varwidth は論理値です。 サンプルサイズに比例してボックスの幅を描画するには、trueに設定します。
  • names は、各箱ひげ図の下に印刷されるグループラベルです。
  • main は、グラフにタイトルを付けるために使用されます。

R環境で使用可能なデータセット「mtcars」を使用して、基本的な箱ひげ図を作成します。 mtcarsの「mpg」列と「cyl」列を見てみましょう。

input <- mtcars[,c('mpg','cyl')]
print(head(input))

上記のコードを実行すると、次の結果が生成されます-

                   mpg  cyl
Mazda RX4         21.0   6
Mazda RX4 Wag     21.0   6
Datsun 710        22.8   4
Hornet 4 Drive    21.4   6
Hornet Sportabout 18.7   8
Valiant           18.1   6

Boxplotの作成

以下のスクリプトは、mpg(1ガロンあたりのマイル数)とcyl(シリンダーの数)の関係を表す箱ひげ図を作成します。

# Give the chart file a name.
png(file = "boxplot.png")

# Plot the chart.
boxplot(mpg ~ cyl, data = mtcars, xlab = "Number of Cylinders",
   ylab = "Miles Per Gallon", main = "Mileage Data")

# Save the file.
dev.off()

上記のコードを実行すると、次の結果が生成されます-

Rを使用した箱ひげ図

ノッチ付きボックスプロット

ノッチ付きの箱ひげ図を描画して、異なるデータグループの中央値が互いにどのように一致するかを調べることができます。

以下のスクリプトは、データグループごとにノッチ付きの箱ひげ図グラフを作成します。

# Give the chart file a name.
png(file = "boxplot_with_notch.png")

# Plot the chart.
boxplot(mpg ~ cyl, data = mtcars,
   xlab = "Number of Cylinders",
   ylab = "Miles Per Gallon",
   main = "Mileage Data",
   notch = TRUE,
   varwidth = TRUE,
   col = c("green","yellow","purple"),
   names = c("High","Medium","Low")
)
# Save the file.
dev.off()

上記のコードを実行すると、次の結果が生成されます-

Rを使用したノッチ付きボックスプロット