Ggplot2-scatter-plots-and-jitter-plots
提供:Dev Guides
ggplot2-散布図とジッタープロット
散布図は、通常プロットに使用される折れ線グラフに似ています。 散布図は、1つの変数が別の変数とどの程度関連しているかを示します。 変数間の関係は相関関係と呼ばれ、通常は統計手法で使用されます。 各変数間の多くの変動を含む「Iris」と呼ばれる同じデータセットを使用します。 これは有名なデータセットで、3種類のアイリスのそれぞれから得られた50の花の、花弁の長さと幅を伴う、はがきの長さと幅の変数をセンチメートル単位で測定します。 この種はアイリスセトサ、バージカラー、バージニカと呼ばれています。
基本的な散布図の作成
「ggplot2」パッケージで散布図を作成するには、次の手順が必要です-
基本的な散布図を作成するには、次のコマンドを実行します-
> # Basic Scatter Plot
> ggplot(iris, aes(Sepal.Length, Petal.Length)) +
+ geom_point()
属性を追加する
geom_point()関数でshapeというプロパティを使用して、ポイントの形状を変更できます。
> # Change the shape of points
> ggplot(iris, aes(Sepal.Length, Petal.Length)) +
+ geom_point(shape=1)
必要な散布図に追加されるポイントに色を追加できます。
> ggplot(iris, aes(Sepal.Length, Petal.Length, colour=Species)) +
+ geom_point(shape=1)
この例では、凡例に記載されている種ごとに色を作成しています。 3つの種は、前述のプロットで一意に区別されます。
次に、変数間の関係の確立に焦点を当てます。
> ggplot(iris, aes(Sepal.Length, Petal.Length, colour=Species)) +
+ geom_point(shape=1) +
+ geom_smooth(method=lm)
*geom_smooth* 関数は、必要な変数のパターンを重ねて作成するパターンを支援します。
属性メソッド「lm」は、開発する必要がある回帰直線を示します。
> # Add a regression line
> ggplot(iris, aes(Sepal.Length, Petal.Length, colour=Species)) +
+ geom_point(shape=1) +
+ geom_smooth(method=lm)
また、以下の構文を使用して、陰影付きの信頼領域のない回帰直線を追加することもできます-
># Add a regression line but no shaded confidence region
> ggplot(iris, aes(Sepal.Length, Petal.Length, colour=Species)) +
+ geom_point(shape=1) +
+ geom_smooth(method=lm, se=FALSE)
網掛けの領域は、信頼領域以外のものを表します。
ジッタプロット
ジッタプロットには、散布図を描くことができる特殊効果が含まれています。 ジッタは、以下に述べるようにドットを分離するためにドットに割り当てられるランダムな値に他なりません-
> ggplot(mpg, aes(cyl, hwy)) +
+ geom_point() +
+ geom_jitter(aes(colour = class))