Python-pandas-indexing-and-selecting-data
Python Pandas-データのインデックス作成と選択
この章では、日付を切り刻み、パンダオブジェクトのサブセットを取得する方法について説明します。
PythonおよびNumPyのインデックス演算子「[]」および属性演算子「。」幅広いユースケースでPandasデータ構造にすばやく簡単にアクセスできます。 ただし、アクセスするデータのタイプは事前にはわからないため、標準演算子を直接使用すると最適化の制限がいくつかあります。 本番コードの場合、この章で説明する最適化されたパンダデータアクセス方法を利用することをお勧めします。
パンダは現在、3種類のマルチ軸インデックスをサポートしています。 3つのタイプは、次の表に記載されています-
Sr.No | Indexing & Description |
---|---|
1 |
.loc() ラベルベース |
2 |
.iloc() 整数ベース |
3 |
.ix() ラベルと整数ベースの両方 |
.loc()
パンダは、純粋に*ラベルベースのインデックス作成*を行うためのさまざまな方法を提供します。 スライスするとき、開始境界も含まれます。 整数は有効なラベルですが、位置ではなくラベルを参照します。
.loc()*には複数のアクセス方法があります-
単一のスカラーラベル
ラベルのリスト
スライスオブジェクト
ブール配列
例1
その*出力*は次のとおりです-
例2
その*出力*は次のとおりです-
実施例3
その*出力*は次のとおりです-
実施例4
その*出力*は次のとおりです-
実施例5
その*出力*は次のとおりです-
.iloc()
パンダは、純粋に整数ベースのインデックスを取得するためにさまざまなメソッドを提供します。 pythonやnumpyと同様に、これらは* 0ベースのインデックスです。
さまざまなアクセス方法は次のとおりです-
- 整数
- 整数のリスト
- 値の範囲
例1
その*出力*は次のとおりです-
例2
その*出力*は次のとおりです-
実施例3
その*出力*は次のとおりです-
.ix()
Pandasは、純粋なラベルベースと整数ベースに加えて、.ix()演算子を使用してオブジェクトを選択およびサブセット化するハイブリッドメソッドを提供します。
例1
その*出力*は次のとおりです-
例2
その*出力*は次のとおりです-
表記法の使用
Multi-axesインデックスを使用してPandasオブジェクトから値を取得するには、次の表記法を使用します-
Object | Indexers | Return Type |
---|---|---|
Series | s.loc[indexer] | Scalar value |
DataFrame | df.loc[row_index,col_index] | Series object |
Panel | p.loc[item_index,major_index, minor_index] | p.loc[item_index,major_index, minor_index] |
- 注意-.iloc()&.ix()*は、同じインデックスオプションと戻り値を適用します。
DataFrameオブジェクトで各操作を実行する方法を見てみましょう。 基本的なインデックス演算子「[]」を使用します-
例1
その*出力*は次のとおりです-
注意-値のリストを[]に渡して、それらの列を選択できます。
例2
その*出力*は次のとおりです-
実施例3
その*出力*は次のとおりです-
属性アクセス
列は、属性演算子「。」を使用して選択できます。
例
その*出力*は次のとおりです-