Python-data-science-python-measuring-variance
提供:Dev Guides
Python-分散の測定
統計では、分散は、データセットの値が平均値からどれだけ離れているかの尺度です。 つまり、値がどの程度分散しているかを示します。 標準偏差を使用して測定されます。 一般的に使用される他の方法は歪度です。
これらは両方とも、pandasライブラリで使用可能な関数を使用して計算されます。
標準偏差の測定
標準偏差は分散の平方根です。 分散は、データセット内の値の平均値からの差の平方の平均です。 Pythonでは、pandasライブラリの関数std()を使用してこの値を計算します。
その*出力*は次のとおりです-
歪度の測定
データが対称か歪んでいるかを判断するために使用されていました。 インデックスが-1〜1の場合、分布は対称です。 インデックスが-1以下の場合、左にスキューされ、少なくとも1の場合、右にスキューされます。
その*出力*は次のとおりです-
したがって、年齢の分布は左右対称ですが、年齢の分布は右に偏っています。