Ggplot2-introduction

提供:Dev Guides
移動先:案内検索

ggplot2-はじめに

ggplot2は、特にデータの視覚化と最高の探索的データ分析を提供するために設計されたRパッケージです。 それは、伝説を描き、それらを表現するような細かい詳細を処理する、美しく、手間のかからないプロットを提供します。 プロットは繰り返し作成でき、後で編集できます。 このパッケージは、Rを使用した探索的データ分析中に収集された生データを表示するレイヤーから始めて、注釈と統計サマリーのレイヤーを追加することで、階層的に機能するように設計されています。

最も経験豊富なRユーザーでさえ、エレガントなグラフィックを作成するための助けが必要です。 このライブラリは、Rでグラフィックスを作成するための驚異的なツールですが、何年にもわたって毎日使用した後でも、チートシートを参照する必要があります。

このパッケージは、「グラフィックの文法」と呼ばれる深い文法の下で機能します。この文法は、さまざまな方法で作成できる一連の独立したコンポーネントで構成されています。 「グラフィックの文法」は、R開発者が他のパッケージで使用される事前に指定されたグラフィックのセットに限定されないため、ggplot2を非常に強力にする唯一の理由です。 文法には、基本的なルールと原則の単純なセットが含まれています。

2005年に、ウィルキンソンは、すべての統計グラフィックスの間に含まれる深い特徴を説明するために、グラフィックスの文法の概念を作成または作成しました。 Rに埋め込まれた適応機能を含むレイヤーの主要部分に焦点を当てています。

「文法文法」とRの関係

これは、データを美観的な属性(色、形、点、線、棒などの関連する幾何学的オブジェクトのサイズなど)にマッピングするために統計グラフィックが使用されることをユーザーまたは開発者に知らせます。 プロットには、上記の座標系で描画された関連データのさまざまな統計的変換も含まれます。 また、言及されたデータセットの異なるサブセットに対して同じプロットを作成するために一般的に使用される「ファセット」と呼ばれる機能も含まれています。 Rには、さまざまな組み込みデータセットが含まれています。 これらの独立したコンポーネントの組み合わせは、完全に特定のグラフィックを構成します。

ここで、文法を参照して作成できるさまざまなタイプのプロットに焦点を当てましょう-

Data

ユーザーが、マップされた美的属性を作成するために、データ内の必要な変数がどのように一緒にマップされるかを記述する美的マッピングの特定のセットを視覚化したい場合。

レイヤー

これは、幾何学的要素と必要な統計変換で構成されています。 レイヤーには、ポイント、ライン、ポリゴンなどの助けを借りて実際にプロットを表す短いデータのジオメトリオブジェクト、ジオメトリが含まれます。 最良のデモンストレーションは、特定の線形モデルの2D関係を要約するための特定のヒストグラムを作成するために、観測をビニングおよびカウントすることです。

スケール

スケールは、データスペース内の値をマッピングするために使用されます。データスペースは、色、サイズ、形状などの値の作成に使用されます。 逆マッピングを提供するために必要な凡例または軸を描画すると、前述のプロットから元のデータ値を読み取ることができます。

座標系

それは、データ座標がグラフィックの言及された平面に一緒にマッピングされる方法を説明します。 また、グラフを読み取るために必要な軸とグリッド線の情報も提供します。 通常、極座標とマップ投影を含むデカルト座標系として使用されます。

ファセット

これには、データを必要なサブセットに分割し、サブセットをデータの倍数として表示する方法の仕様が含まれています。 これは、コンディショニングまたはラチスプロセスとも呼ばれます。

テーマ

フォントサイズや背景色のプロパティなど、表示のより細かいポイントを制御します。 魅力的なプロットを作成するには、常に参照を検討することをお勧めします。

さて、文法が提供しない制限や機能について議論することも同様に重要です-

  • どのグラフィックスを使用すべきか、ユーザーが興味を持っているという提案はありません。
  • 静的グラフィックの説明のみが含まれているため、インタラクティブ性については説明しません。 動的グラフィックの作成には、他の代替ソリューションを適用する必要があります。

ggplot2で作成された単純なグラフは以下に記載されています-

ggplot2で作成されたグラフ