Weka-loading-data

提供:Dev Guides
移動先:案内検索

Weka-データの読み込み

この章では、データの前処理に使用する最初のタブから始めます。 これは、モデルを構築するためにデータに適用するすべてのアルゴリズムに共通であり、WEKAのすべての後続操作の共通ステップです。

機械学習アルゴリズムで許容可能な精度を実現するには、まずデータをクレンジングする必要があります。 これは、フィールドから収集された生データにヌル値、無関係な列などが含まれている可能性があるためです。

この章では、生データを前処理し、さらに使用するためのクリーンで意味のあるデータセットを作成する方法を学習します。

最初に、データファイルをWEKAエクスプローラーにロードする方法を学習します。 データは、次のソースからロードすることができます-

  • ローカルファイルシステム
  • Web
  • データベース

この章では、データをロードする3つのオプションすべてを詳細に説明します。

ローカルファイルシステムからのデータのロード

前のレッスンで学習したMachine Learningタブの下に、次の3つのボタンがあります-

  • ファイルを開く…​
  • URLを開く…​
  • DBを開く…​
  • ファイルを開く*をクリックしてください…​ ボタン。 次の画面に示すように、ディレクトリナビゲータウィンドウが開きます-

ローカルファイルシステム

次に、データファイルが保存されているフォルダーに移動します。 WEKAのインストールには、実験するための多くのサンプルデータベースが用意されています。 これらは、WEKAインストールの data フォルダーにあります。

学習目的で、このフォルダから任意のデータファイルを選択します。 ファイルの内容はWEKA環境にロードされます。 このロードされたデータを検査して処理する方法については、まもなく学習します。 その前に、Webからデータファイルを読み込む方法を見てみましょう。

Webからのデータの読み込み

*URLを開く...* ボタンをクリックすると、次のようなウィンドウが表示されます-

Webからのデータのロード

私たちは、パブリックURLからファイルを開きますポップアップボックスに次のURLを入力します-

https://storm.cis.fordham.edu/~gweiss/data-mining/weka-data/weather.nominal.arff

データが保存されている他のURLを指定できます。 Explorer は、リモートサイトから環境にデータをロードします。

DBからのデータのロード

*Open DB* をクリックすると... ボタン、次のようにウィンドウを見ることができます-

DBからのデータのロード

データベースへの接続文字列を設定し、データ選択用のクエリを設定し、クエリを処理して、選択したレコードをWEKAにロードします。