Weka-classifiers

提供:Dev Guides
移動先:案内検索

Weka-分類子

多くの機械学習アプリケーションは分類に関連しています。 たとえば、腫瘍を悪性または良性として分類することができます。 天候に応じて、屋外ゲームをプレイするかどうかを決めることができます。 一般的に、この決定は天気のいくつかの特徴/条件に依存します。 そのため、再生するかどうかを決定するためにツリー分類器を使用することをお勧めします。

この章では、気象データに基づいてこのようなツリー分類器を構築し、プレイ条件を決定する方法を学習します。

テストデータの設定

前のレッスンの前処理済みの気象データファイルを使用します。 Open file を使用して、保存したファイルを開きます…​ *前処理*タブの下のオプション、*分類*タブをクリックすると、次の画面が表示されます-

分類タブ

利用可能な分類器について学ぶ前に、テストオプションを調べてみましょう。 次の4つのテストオプションに気付くでしょう-

  • トレーニングセット
  • 付属のテストセット
  • 交差検証
  • 割合分割

独自のトレーニングセットまたはクライアントが提供するテストセットがない限り、相互検証またはパーセント分割オプションを使用します。 交差検定では、トレーニングの各反復中にデータ全体を分割して使用するフォールドの数を設定できます。 割合分割では、設定された分割割合を使用して、トレーニングとテストの間でデータを分割します。

ここで、出力クラスのデフォルトの play オプションを保持します-

再生オプション

次に、分類子を選択します。

分類子の選択

「選択」ボタンをクリックして、次の分類子を選択します-

*weka→classifiers> trees> J48*

これは、以下のスクリーンショットに示されています-

Weka Trees

[開始]ボタンをクリックして、分類プロセスを開始します。 しばらくすると、ここに示すように分類結果が画面に表示されます-

スタートボタン

画面の右側に表示される出力を調べてみましょう。

ツリーのサイズは6です。 ツリーの視覚的な表現が間もなく表示されます。 概要では、インスタンスを正しく2に分類し、インスタンスを3に誤って分類したことを示し、相対絶対誤差が110%であることも示しています。 また、混同マトリックスも示しています。 これらの結果の分析に入ることは、このチュートリアルの範囲外です。 ただし、これらの結果から分類が受け入れられないことを簡単に確認できます。モデルの精度に満足するまで、分析、フィーチャ選択の改良、モデルの再構築などのためにより多くのデータが必要になります。 とにかく、それがWEKAのすべてです。 アイデアをすばやくテストできます。

結果を視覚化する

結果を視覚的に表示するには、[結果リスト]ボックスで結果を右クリックします。 ここに示すように、いくつかのオプションが画面にポップアップ表示されます-

結果リスト

以下のスクリーンショットに示すように、「ツリーの視覚化」を選択して、トラバーサルツリーの視覚的表現を取得します-

可視化ツリー

  • 視覚化分類器エラー*を選択すると、ここに示すように分類の結果がプロットされます-

分類エラー

*cross* は正しく分類されたインスタンスを表し、 *squares* は誤って分類されたインスタンスを表します。 プロットの左下隅には、*見通し*が晴れているか、ゲームを*プレイ*しているかを示す*クロス*が表示されます。 したがって、これは正しく分類されたインスタンスです。 インスタンスを見つけるには、*ジッタ*スライドバーをスライドして、インスタンスにジッタを導入できます。

現在のプロットは、 outlookplay です。 これらは、画面上部の2つのドロップダウンリストボックスで示されます。

Outlook対Play

次に、これらの各ボックスで異なる選択を試して、X軸とY軸がどのように変化するかを確認します。 同じことは、プロットの右側にある水平ストリップを使用することで実現できます。 各ストリップは属性を表します。 ストリップを左クリックすると、選択した属性がX軸に設定され、右クリックするとY軸に設定されます。

より詳細な分析のために、他のプロットがいくつか用意されています。 それらを慎重に使用して、モデルを微調整してください。 *コスト/ベネフィット分析*のそのようなプロットは、クイックリファレンスのために以下に示されています。

費用便益分析

これらのチャートで分析を説明することは、このチュートリアルの範囲外です。 読者は、機械学習アルゴリズムの分析に関する知識を磨くことをお勧めします。

次の章では、機械学習アルゴリズムの次のセット、つまりクラスタリングについて学習します。