R-data-reshaping
R-データの形状変更
Rでのデータの再形成とは、データを行と列に編成する方法を変更することです。 Rでのデータ処理のほとんどは、入力データをデータフレームとして取得することによって行われます。 データフレームの行と列からデータを抽出するのは簡単ですが、受信した形式とは異なる形式のデータフレームが必要な場合があります。 Rには、データフレーム内で行を列に、またはその逆に分割、マージ、および変更するための多くの機能があります。
データフレーム内の列と行の結合
- cbind()*関数を使用して、複数のベクトルを結合してデータフレームを作成できます。 また、 rbind()*関数を使用して2つのデータフレームをマージできます。
上記のコードを実行すると、次の結果が生成されます-
データフレームの結合
- merge()*関数を使用して、2つのデータフレームをマージできます。 データフレームには、マージが発生する列名が同じである必要があります。
以下の例では、ライブラリ名「MASS」で利用可能なピマインド女性の糖尿病に関するデータセットを検討します。 血圧( "bp")とボディマスインデックス( "bmi")の値に基づいて2つのデータセットをマージします。 マージのためにこれらの2つの列を選択すると、これら2つの変数の値が両方のデータセットで一致するレコードが結合されて、単一のデータフレームが形成されます。
上記のコードを実行すると、次の結果が生成されます-
溶解と鋳造
Rプログラミングの最も興味深い側面の1つは、データの形状を複数のステップで変更して、目的の形状にすることです。 これを行うために使用される関数は、* melt()および cast()*と呼ばれます。
「MASS」というライブラリに存在する「ships」というデータセットを検討します。
上記のコードを実行すると、次の結果が生成されます-
データを溶かす
次に、データを融解して整理し、タイプと年以外のすべての列を複数の行に変換します。
上記のコードを実行すると、次の結果が生成されます-
溶融データのキャスト
溶融データを新しい形式にキャストして、各年の各タイプの船舶の集合体を作成できます。 * cast()*関数を使用して行われます。
上記のコードを実行すると、次の結果が生成されます-