R-boxplots
提供:Dev Guides
R-ボックスプロット
箱ひげ図は、データセット内のデータがどれだけ適切に分散されているかの尺度です。 データセットを3つの四分位数に分割します。 このグラフは、データセットの最小値、最大値、中央値、最初の四分位数、3番目の四分位数を表します。 また、データセットごとに箱ひげ図を描くことにより、データセット全体でデータの分布を比較するのにも役立ちます。
ボックスプロットは、* boxplot()*関数を使用してRで作成されます。
構文
Rで箱ひげ図を作成するための基本的な構文は次のとおりです-
boxplot(x, data, notch, varwidth, names, main)
以下は、使用されるパラメータの説明です-
- x はベクトルまたは数式です。
- data はデータフレームです。
- notch は論理値です。 ノッチを描画するにはTRUEに設定します。
- varwidth は論理値です。 サンプルサイズに比例してボックスの幅を描画するには、trueに設定します。
- names は、各箱ひげ図の下に印刷されるグループラベルです。
- main は、グラフにタイトルを付けるために使用されます。
例
R環境で使用可能なデータセット「mtcars」を使用して、基本的な箱ひげ図を作成します。 mtcarsの「mpg」列と「cyl」列を見てみましょう。
input <- mtcars[,c('mpg','cyl')]
print(head(input))
上記のコードを実行すると、次の結果が生成されます-
mpg cyl
Mazda RX4 21.0 6
Mazda RX4 Wag 21.0 6
Datsun 710 22.8 4
Hornet 4 Drive 21.4 6
Hornet Sportabout 18.7 8
Valiant 18.1 6
Boxplotの作成
以下のスクリプトは、mpg(1ガロンあたりのマイル数)とcyl(シリンダーの数)の関係を表す箱ひげ図を作成します。
# Give the chart file a name.
png(file = "boxplot.png")
# Plot the chart.
boxplot(mpg ~ cyl, data = mtcars, xlab = "Number of Cylinders",
ylab = "Miles Per Gallon", main = "Mileage Data")
# Save the file.
dev.off()
上記のコードを実行すると、次の結果が生成されます-
ノッチ付きボックスプロット
ノッチ付きの箱ひげ図を描画して、異なるデータグループの中央値が互いにどのように一致するかを調べることができます。
以下のスクリプトは、データグループごとにノッチ付きの箱ひげ図グラフを作成します。
# Give the chart file a name.
png(file = "boxplot_with_notch.png")
# Plot the chart.
boxplot(mpg ~ cyl, data = mtcars,
xlab = "Number of Cylinders",
ylab = "Miles Per Gallon",
main = "Mileage Data",
notch = TRUE,
varwidth = TRUE,
col = c("green","yellow","purple"),
names = c("High","Medium","Low")
)
# Save the file.
dev.off()
上記のコードを実行すると、次の結果が生成されます-