Machine-learning-with-python-random-forest
提供:Dev Guides
機械学習-ランダムフォレスト
これは、バギングされた決定木の拡張です。 個々の分類子の場合、トレーニングデータセットのサンプルは置換されて取得されますが、ツリーはそれらの間の相関を減らすように構築されます。 また、特徴のランダムなサブセットは、各ツリーの構築において最適な分割ポイントを貪欲に選択するのではなく、各分割ポイントを選択すると見なされます。
次のPythonレシピでは、Pima Indians糖尿病データセットでsklearnのRandomForestClassifierクラスを使用して、バギングされたランダムフォレストアンサンブルモデルを構築します。
まず、次のように必要なパッケージをインポートします-
さて、前の例のようにPima糖尿病データセットをロードする必要があります-
次に、次のように10倍クロス検証の入力を与えます-
構築するツリーの数を指定する必要があります。 ここでは、5つの特徴から選択された分割点で150本の木を構築しています-
次に、次のスクリプトの助けを借りてモデルを構築します-
次のように結果を計算して印刷します-
出力
上記の出力は、バギングされたランダムフォレスト分類子モデルの精度が約76%であることを示しています。