Python-pandas-dataframe
Pythonパンダ-DataFrame
データフレームは2次元のデータ構造です。つまり、データは表形式で行と列に配置されます。
DataFrameの機能
- 潜在的に列は異なるタイプです
- サイズ-可変
- ラベル付き軸(行と列) *行と列に対して算術演算を実行できます
構造
学生のデータでデータフレームを作成していると仮定しましょう。
SQLテーブルまたはスプレッドシートのデータ表現と考えることができます。
pandas.DataFrame
パンダのDataFrameは、次のコンストラクタを使用して作成することができます-
コンストラクタのパラメータは次のとおりです-
Sr.No | Parameter & Description |
---|---|
1 |
データは、ndarray、series、map、lists、dict、constant、および別のDataFrameなどのさまざまな形式を取ります。 |
2 |
index 行ラベルの場合、インデックスが渡されない場合、結果のフレームに使用されるインデックスはオプションのデフォルトnp.arrange(n)です。 |
3 |
columns 列ラベルの場合、オプションのデフォルト構文は-np.arrange(n)です。 これは、インデックスが渡されない場合にのみ当てはまります。 |
4 |
dtype 各列のデータ型。 |
5 |
copy デフォルトがFalseの場合、このコマンド(またはそれが何であれ)はデータのコピーに使用されます。 |
DataFrameを作成
パンダDataFrameはのような様々な入力を使用して作成することができます-
- リスト
- dict
- シリーズ
- Numpy ndarrays
- 別のデータフレーム
この章の以降のセクションでは、これらの入力を使用してDataFrameを作成する方法について説明します。
空のデータフレームを作成する
作成できる基本的なDataFrameは空のDataframeです。
例
その*出力*は次のとおりです-
リストからデータフレームを作成する
DataFrameは、単一のリストまたはリストのリストを使用して作成できます。
例1
その*出力*は次のとおりです-
例2
その*出力*は次のとおりです-
実施例3
その*出力*は次のとおりです-
注意- dtype パラメータは、Ageカラムのタイプを浮動小数点に変更します。
ndarrays/ListsのDictからDataFrameを作成します
すべての ndarrays は同じ長さでなければなりません。 インデックスが渡される場合、インデックスの長さは配列の長さと等しくなければなりません。
インデックスが渡されない場合、デフォルトでは、インデックスはrange(n)になります。ここで、 n は配列の長さです。
例1
その*出力*は次のとおりです-
注-値0、1、2、3を確認します。 それらは、関数range(n)を使用してそれぞれに割り当てられるデフォルトのインデックスです。
例2
ここで、配列を使用してインデックス付きDataFrameを作成します。
その*出力*は次のとおりです-
注-観察、 index パラメータは各行にインデックスを割り当てます。
辞書のリストからデータフレームを作成する
辞書のリストを入力データとして渡して、DataFrameを作成できます。 辞書キーはデフォルトで列名として使用されます。
例1
次の例は、辞書のリストを渡すことでDataFrameを作成する方法を示しています。
その*出力*は次のとおりです-
注-観察、NaN(Not a Number)が欠落領域に追加されます。
例2
次の例は、辞書と行インデックスのリストを渡すことでDataFrameを作成する方法を示しています。
その*出力*は次のとおりです-
実施例3
次の例は、辞書、行インデックス、および列インデックスのリストを使用してDataFrameを作成する方法を示しています。
その*出力*は次のとおりです-
注-観察、df2 DataFrameはディクショナリキー以外の列インデックスで作成されます。したがって、所定の位置にNaNを追加しました。 一方、df1は辞書キーと同じ列インデックスで作成されるため、NaNが追加されます。
シリーズの辞書からデータフレームを作成する
シリーズの辞書を渡して、DataFrameを作成できます。 結果のインデックスは、渡されたすべてのシリーズインデックスの結合です。
例
その*出力*は次のとおりです-
注-シリーズ1では、ラベル「」d *は渡されませんが、結果では、 *d ラベルではNaNにNaNが追加されます。
例を通して、列の選択、追加、および*削除*を理解しましょう。
列の選択
これを理解するには、DataFrameから列を選択します。
例
その*出力*は次のとおりです-
列の追加
これを理解するには、既存のデータフレームに新しい列を追加します。
例
その*出力*は次のとおりです-
列の削除
列は削除またはポップできます。その方法を理解するために例を挙げましょう。
例
その*出力*は次のとおりです-
行の選択、追加、および削除
例を通して行の選択、追加、削除を理解します。 選択の概念から始めましょう。
ラベルによる選択
行を選択するには、行ラベルを loc 関数に渡します。
その*出力*は次のとおりです-
結果は、DataFrameの列名としてラベルを持つシリーズです。 そして、シリーズの名前は、それが取得されるラベルです。
整数位置による選択
整数の位置を iloc 関数に渡すことで行を選択できます。
その*出力*は次のとおりです-
スライス行
「:」演算子を使用して、複数の行を選択できます。
その*出力*は次のとおりです-
行の追加
その*出力*は次のとおりです-
行の削除
インデックスラベルを使用して、DataFrameから行を削除またはドロップします。 ラベルが重複している場合、複数の行が削除されます。
上記の例では、ラベルが重複しています。 ラベルをドロップして、ドロップされる行数を確認します。
その*出力*は次のとおりです-
上記の例では、2つの行に同じラベル0が含まれているため、2つの行が削除されました。