Python-pandas-statistical-functions
Pythonパンダ-統計関数
統計的手法は、データの動作の理解と分析に役立ちます。 ここで、Pandasオブジェクトに適用できるいくつかの統計関数を学習します。
変化率
シリーズ、DatFrames、およびパネルには、すべて* pct_change()*関数があります。 この関数は、すべての要素をその前の要素と比較し、変化率を計算します。
その*出力*は次のとおりです-
デフォルトでは、* pct_change()は列に対して機能します。同じ行を適用する場合は、 axis = 1()*引数を使用します。
共分散
共分散は系列データに適用されます。 Seriesオブジェクトには、シリーズオブジェクト間の共分散を計算するメソッドcovがあります。 NAは自動的に除外されます。
Covシリーズ
その*出力*は次のとおりです-
DataFrameに適用された共分散法は、すべての列間で cov を計算します。
その*出力*は次のとおりです-
注-最初のステートメントの a と b 列の間の cov を観察します。これは、DataFrameのcovによって返される値です。
相関
相関関係は、任意の2つの値の配列(系列)の間の線形関係を示しています。 ピアソン(デフォルト)、スピアマン、ケンドールなど、相関を計算する方法は複数あります。
その*出力*は次のとおりです-
DataFrameに数値以外の列がある場合、自動的に除外されます。
データランキング
データのランキングは、要素の配列内の各要素のランキングを生成します。 同順位の場合、平均ランクを割り当てます。
その*出力*は次のとおりです-
ランクは、オプションで、デフォルトでtrueであるパラメータの昇順を取ります。 falseの場合、データは逆ランク付けされ、値が大きいほど小さいランクが割り当てられます。
ランクは、メソッドパラメータで指定されたさまざまなタイブレークメソッドをサポートしています-
- 平均-同順位グループの平均ランク
- min -グループ内の最低ランク
- max -グループ内の最高ランク
- first -配列に現れる順序で割り当てられたランク