Python-data-science-python-data-wrangling
提供:Dev Guides
Python-データラングリング
データラングリングでは、マージ、グループ化、連結などのさまざまな形式でデータを処理します。 それらを分析したり、別のデータセットで使用できるように準備したりするため。 Pythonには、分析目標を達成するためにこれらの論争方法をさまざまなデータセットに適用するための組み込み機能があります。 この章では、これらの方法を説明するいくつかの例を見ていきます。
データの結合
PythonのPandasライブラリは、DataFrameオブジェクト間のすべての標準データベース結合操作のエントリポイントとして、単一の関数 merge を提供します-
2つの異なるDataFrameを作成し、その上でマージ操作を実行してみましょう。
その*出力*は次のとおりです-
データのグループ化
データセットに存在するさまざまなグループの観点から結果を必要とするデータ分析では、データセットのグループ化が頻繁に必要になります。 Panadasには、データをさまざまなグループにロールできる組み込みメソッドがあります。
以下の例では、年ごとにデータをグループ化し、特定の年の結果を取得します。
その*出力*は次のとおりです-
データの連結
Pandasは、 Series、DataFrame 、および Panel オブジェクトを簡単に組み合わせるためのさまざまな機能を提供します。 以下の例では、 concat 関数は軸に沿って連結操作を実行します。 さまざまなオブジェクトを作成して連結してみましょう。
その*出力*は次のとおりです-