Weka-loading-data
Weka-データの読み込み
この章では、データの前処理に使用する最初のタブから始めます。 これは、モデルを構築するためにデータに適用するすべてのアルゴリズムに共通であり、WEKAのすべての後続操作の共通ステップです。
機械学習アルゴリズムで許容可能な精度を実現するには、まずデータをクレンジングする必要があります。 これは、フィールドから収集された生データにヌル値、無関係な列などが含まれている可能性があるためです。
この章では、生データを前処理し、さらに使用するためのクリーンで意味のあるデータセットを作成する方法を学習します。
最初に、データファイルをWEKAエクスプローラーにロードする方法を学習します。 データは、次のソースからロードすることができます-
- ローカルファイルシステム
- Web
- データベース
この章では、データをロードする3つのオプションすべてを詳細に説明します。
ローカルファイルシステムからのデータのロード
前のレッスンで学習したMachine Learningタブの下に、次の3つのボタンがあります-
- ファイルを開く…
- URLを開く…
- DBを開く…
- ファイルを開く*をクリックしてください… ボタン。 次の画面に示すように、ディレクトリナビゲータウィンドウが開きます-
次に、データファイルが保存されているフォルダーに移動します。 WEKAのインストールには、実験するための多くのサンプルデータベースが用意されています。 これらは、WEKAインストールの data フォルダーにあります。
学習目的で、このフォルダから任意のデータファイルを選択します。 ファイルの内容はWEKA環境にロードされます。 このロードされたデータを検査して処理する方法については、まもなく学習します。 その前に、Webからデータファイルを読み込む方法を見てみましょう。
Webからのデータの読み込み
私たちは、パブリックURLからファイルを開きますポップアップボックスに次のURLを入力します-
https://storm.cis.fordham.edu/~gweiss/data-mining/weka-data/weather.nominal.arff
データが保存されている他のURLを指定できます。 Explorer は、リモートサイトから環境にデータをロードします。
DBからのデータのロード
データベースへの接続文字列を設定し、データ選択用のクエリを設定し、クエリを処理して、選択したレコードをWEKAにロードします。