Machine-learning-with-python-classification-algorithms-logistic-regression
機械学習-ロジスティック回帰
ロジスティック回帰の概要
ロジスティック回帰は、ターゲット変数の確率を予測するために使用される教師あり学習分類アルゴリズムです。 ターゲット変数または従属変数の性質は二分されます。つまり、可能なクラスは2つだけです。
簡単に言えば、従属変数は、1(成功/はいを表す)または0(失敗/いいえを表す)としてコード化されたデータを持つ、本質的にバイナリです。
数学的には、ロジスティック回帰モデルはXの関数としてP(Y = 1)を予測します。 これは、スパム検出、糖尿病予測、癌検出などのさまざまな分類問題に使用できる最も単純なMLアルゴリズムの1つです。
ロジスティック回帰の種類
一般に、ロジスティック回帰とは、バイナリターゲット変数を持つバイナリロジスティック回帰を意味しますが、それによって予測できるターゲット変数のカテゴリがさらに2つあります。 これらのカテゴリ数に基づいて、ロジスティック回帰は次のタイプに分類できます-
バイナリまたは二項
このような分類では、従属変数には1と0の2つの可能な型しかありません。 たとえば、これらの変数は、成功または失敗、はいまたはいいえ、勝ちまたは負けなどを表す場合があります。
多項
このような種類の分類では、従属変数は3つ以上の unordered 型または定量的な意味を持たない型を持つことができます。 たとえば、これらの変数は「タイプA」または「タイプB」または「タイプC」を表す場合があります。
序数
このような分類では、従属変数は3つ以上の ordered 型または定量的な意味を持つ型を持つことができます。 たとえば、これらの変数は「悪い」または「良い」、「非常に良い」、「優れている」を表し、各カテゴリは0、1、2、3のようなスコアを持つことができます。
ロジスティック回帰の仮定
ロジスティック回帰の実装に飛び込む前に、私たちは同じことについて次の仮定を意識する必要があります-
- バイナリロジスティック回帰の場合、ターゲット変数は常にバイナリである必要があり、望ましい結果は因子レベル1で表されます。
- モデルには多重共線性があってはなりません。つまり、独立変数は互いに独立している必要があります。
- モデルに意味のある変数を含める必要があります。
- ロジスティック回帰には大きなサンプルサイズを選択する必要があります。
回帰モデル
- link:/machine_learning_with_python/machine_learning_with_python_binary_logistic_regression_model [Binary Logistic Regression Model]-ロジスティック回帰の最も単純な形式は、ターゲット変数または従属変数が1または0のいずれか2つの型しか持てないバイナリまたは二項ロジスティック回帰です。
- link:/machine_learning_with_python/machine_learning_with_python_multinomial_logistic_regression_model [Multinomial Logistic Regression Model]-もう1つの有用な形式のロジスティック回帰は、ターゲットまたは従属変数が3つ以上の unordered 型を取り得る多項ロジスティック回帰です。 量的な意味を持たないタイプ。