R-mean-median-mode
R-平均、中央値、モード
Rの統計分析は、多くの組み込み関数を使用して実行されます。 これらの関数のほとんどは、Rベースパッケージの一部です。 これらの関数は、引数とともにRベクトルを入力として受け取り、結果を返します。
この章で説明する関数は、平均値、中央値、モードです。
Mean
値の合計を取り、データ系列の値の数で割ることによって計算されます。
関数* mean()*は、Rでこれを計算するために使用されます。
構文
Rの平均を計算するための基本的な構文は次のとおりです-
以下は、使用されるパラメータの説明です-
- x は入力ベクトルです。
- trim は、ソートされたベクトルの両端からいくつかの観測値を削除するために使用されます。
- na.rm は、入力ベクトルから欠損値を削除するために使用されます。
例
上記のコードを実行すると、次の結果が生成されます-
トリムオプションの適用
トリムパラメーターを指定すると、ベクトルの値が並べ替えられ、必要な観測数が平均の計算から除外されます。
trim = 0.3の場合、各端から3つの値が計算から除外されて平均が求められます。
この場合、ソートされたベクトルは(-21、-5、2、3、4.2、7、8、12、18、54)であり、平均を計算するためにベクトルから削除された値は(-21、-5、2)です。左から(12,18,54)右から。
上記のコードを実行すると、次の結果が生成されます-
NAオプションの適用
欠損値がある場合、平均関数はNAを返します。
計算から欠損値を削除するには、na.rm = TRUEを使用します。 つまり、NA値を削除します。
上記のコードを実行すると、次の結果が生成されます-
中央値
データ系列の中央の値は中央値と呼ばれます。 * median()*関数は、この値を計算するためにRで使用されます。
構文
Rの中央値を計算するための基本的な構文は次のとおりです-
以下は、使用されるパラメータの説明です-
- x は入力ベクトルです。
- na.rm は、入力ベクトルから欠損値を削除するために使用されます。
例
上記のコードを実行すると、次の結果が生成されます-
Mode
モードは、一連のデータ内で発生回数が最も多い値です。 Unikeの平均値と中央値、モードには数値データと文字データの両方が含まれます。
Rには、モードを計算するための標準の組み込み関数はありません。 そこで、Rのデータセットのモードを計算するユーザー関数を作成します。 この関数は、ベクトルを入力として受け取り、モード値を出力として提供します。
例
上記のコードを実行すると、次の結果が生成されます-