Logistic-regression-in-python-testing

提供:Dev Guides
移動先:案内検索

Pythonでのロジスティック回帰-テスト

上記で作成した分類器を実稼働で使用する前にテストする必要があります。 テストでモデルが目的の精度を満たしていないことが判明した場合は、上記のプロセスに戻って、別の機能セット(データフィールド)を選択し、モデルを再構築してテストする必要があります。 分類器が目的の精度の要件を満たすまで、これは反復ステップになります。 それでは、分類器をテストしましょう。

テストデータの予測

分類子をテストするには、前の段階で生成されたテストデータを使用します。 私たちは、作成されたオブジェクトで predict メソッドを呼び出し、次のコマンドに示すようにテストデータの X 配列を渡します-

In [24]: predicted_y = classifier.predict(X_test)

これにより、トレーニングデータセット全体に対して1次元配列が生成され、X配列の各行の予測が提供されます。 次のコマンドを使用して、この配列を調べることができます-

In [25]: predicted_y

以下は、上記の2つのコマンドの実行時の出力です-

Out[25]: array([0, 0, 0, ..., 0, 0, 0])

出力は、最初と最後の3人の顧客が*定期預金*の候補者ではないことを示しています。 アレイ全体を調べて、潜在的な顧客を整理できます。 これを行うには、次のPythonコードスニペットを使用します-

In [26]: for x in range(len(predicted_y)):
   if (predicted_y[x] == 1):
      print(x, end="\t")

上記のコードを実行した出力は以下に示されています-

定期預金

出力には、TDのサブスクライブの候補となる可能性のあるすべての行のインデックスが表示されます。 これで、この出力を銀行のマーケティングチームに渡すことができます。このチームは、選択した行の各顧客の連絡先の詳細を取得し、仕事を進めます。

このモデルを生産に導入する前に、予測の精度を検証する必要があります。

精度の検証

モデルの精度をテストするには、以下に示すように分類器でスコアメソッドを使用します-

In [27]: print('Accuracy: {:.2f}'.format(classifier.score(X_test, Y_test)))

このコマンドを実行する画面出力は以下に示されています-

Accuracy: 0.90

モデルの精度は90%であり、ほとんどのアプリケーションで非常に優れていると考えられます。 したがって、これ以上のチューニングは必要ありません。 これで、顧客は次のキャンペーンを実行し、潜在的な顧客のリストを取得し、TDを開いて高い確率で成功を収めることができます。