Python-data-science-python-data-operations
Python-データ操作
Pythonは、主に2つのライブラリ、PandasとNumpyを介してさまざまな形式のデータを処理します。 前の章で、これら2つのライブラリの重要な機能を既に見てきました。 この章では、データの操作方法に関する各ライブラリの基本的な例をいくつか見ていきます。
Numpyのデータ操作
NumPyで定義されている最も重要なオブジェクトは、ndarrayと呼ばれるN次元の配列型です。 同じタイプのアイテムのコレクションを記述します。 コレクション内のアイテムには、ゼロベースのインデックスを使用してアクセスできます。 ndarrayクラスのインスタンスは、チュートリアルで後述するさまざまな配列作成ルーチンによって構築できます。 基本的なndarrayは、次のようにNumPyの配列関数を使用して作成されます-
以下は、Numpy Dataの処理に関するいくつかの例です。
例1
出力は次のとおりです-
#最小寸法は、numpyをnp a = np.array([1、2、3,4,5]、ndmin = 2)としてインポートしますprint a
[[例3
出力は次のとおりです-
パンダのデータ操作
パンダは、 Series 、 Data Frame 、および Panel を介してデータを処理します。 これらのそれぞれからいくつかの例を見るでしょう。
パンダシリーズ
Seriesは、任意のタイプ(整数、文字列、浮動小数点、Pythonオブジェクトなど)のデータを保持できる1次元のラベル付き配列です。 軸ラベルはまとめてインデックスと呼ばれます。 パンダシリーズは、次のコンストラクタを使用して作成することができます-
例
ここでは、Numpy Arrayからシリーズを作成します。
その*出力*は次のとおりです-
Pandas DataFrame
データフレームは2次元のデータ構造です。つまり、データは表形式で行と列に配置されます。 パンダのDataFrameは、次のコンストラクタを使用して作成することができます-
ここで、配列を使用してインデックス付きDataFrameを作成します。
その*出力*は次のとおりです-
パンダパネル
パネル*は、データの3Dコンテナです。 「パネルデータ」という用語は計量経済学から派生したものであり、パンダという名前の一部を担っています- pan(el)-da(ta)*-s。
パネルは、次のコンストラクタを使用して作成できます-
以下の例では、DataFrameオブジェクトのdictからパネルを作成します
その*出力*は次のとおりです-