Logistic-regression-in-python-introduction
Pythonでのロジスティック回帰-はじめに
ロジスティック回帰は、オブジェクトの分類の統計的手法です。 この章では、いくつかの例を使用して、ロジスティック回帰の概要を説明します。
分類
ロジスティック回帰を理解するには、分類の意味を知っておく必要があります。 これをよりよく理解するために、次の例を考えてみましょう-
- 医師は腫瘍を悪性または良性に分類します。
- 銀行取引は不正または本物である可能性があります。
長年にわたって、人間はエラーを起こしやすいとはいえ、そのようなタスクを実行してきました。 問題は、これらのタスクをより正確に行えるようにマシンをトレーニングできるかどうかです。
分類を行うマシンのそのような例の1つは、すべての受信メールを「スパム」または「スパムではない」として分類し、かなり高い精度でそれを行う、マシン上のメール*クライアント*です。 ロジスティック回帰の統計手法が電子メールクライアントに正常に適用されました。 この場合、分類問題を解決するためにマシンをトレーニングしました。
ロジスティック回帰は、この種のバイナリ分類問題を解決するために使用される機械学習の一部にすぎません。 すでに開発され、他の種類の問題を解決するために実際に使用されている他の機械学習手法がいくつかあります。
上記のすべての例で注意した場合、予測の結果には2つの値(YesまたはNo)しかありません。 これらをクラスと呼びます-つまり、分類子はオブジェクトを2つのクラスに分類すると言います。 技術的に言えば、結果またはターゲット変数は本質的に二分されていると言えます。
出力が3つ以上のクラスに分類される可能性のある他の分類の問題があります。 たとえば、果物がいっぱい入ったバスケットがある場合、さまざまな種類の果物を分離するように求められます。 現在、バスケットにはオレンジ、リンゴ、マンゴーなどが含まれています。 したがって、果物を分離するときは、3つ以上のクラスに分けます。 これは多変量分類の問題です。