Python-pandas-reindexing
提供:Dev Guides
Pythonパンダ-インデックスの再作成
- 再インデックス*は、DataFrameの行ラベルと列ラベルを変更します。 _reindex_とは、特定の軸に沿ってラベルの特定のセットに一致するようにデータを適合させることを意味します。
複数の操作は、次のようなインデックス作成によって実現できます-
- 新しいラベルのセットと一致するように既存のデータを並べ替えます。
- ラベルのデータが存在しないラベル位置に欠損値(NA)マーカーを挿入します。
例
その*出力*は次のとおりです-
他のオブジェクトに合わせて再インデックス付け
オブジェクトを取得し、その軸のインデックスを再作成して、別のオブジェクトと同じラベルを付けることができます。 同じことを理解するには、次の例を検討してください。
例
その*出力*は次のとおりです-
注-ここでは、 df1 DataFrameが変更され、 df2 のようにインデックスが再作成されます。 列名は一致する必要があります。一致しない場合、列ラベル全体にNANが追加されます。
再インデックス中の塗りつぶし
- reindex()*は、オプションのパラメーターメソッドを取ります。これは、次のような値を持つ充填メソッドです-
- pad/ffill -値を前方に埋める
- bfill/backfill -値を逆方向に埋める
- nearest -最も近いインデックス値から塗りつぶします
例
その*出力*は次のとおりです-
注-最後の4行はパディングされます。
再インデックス中の塗りつぶしの制限
limit引数は、インデックス再作成中の塗りつぶしをさらに制御します。 制限は、連続した一致の最大カウントを指定します。 同じことを理解するために、次の例を考えてみましょう-
例
その*出力*は次のとおりです-
注-観察、7行目のみが前の6行目で埋められます。 その後、行はそのまま残ります。
改名
rename()メソッドを使用すると、マッピング(dictまたはSeries)または任意の関数に基づいて軸のラベルを変更できます。
これを理解するために次の例を考えてみましょう-
その*出力*は次のとおりです-
rename()メソッドは、 inplace という名前のパラメーターを提供します。このパラメーターはデフォルトでFalseであり、基になるデータをコピーします。 inplace = True を渡して、その場でデータの名前を変更します。