Weka-データの読み込み

この章では、データの前処理に使用する最初のタブから始めます。これは、モデルを構築するためにデータに適用するすべてのアルゴリズムに共通であり、WEKAのすべての後続操作の共通ステップです。

機械学習アルゴリズムで許容可能な精度を実現するには、まずデータをクレンジングする必要があります。これは、フィールドから収集された生データにヌル値、無関係な列などが含まれている可能性があるためです。

この章では、生データを前処理し、さらに使用するためのクリーンで意味のあるデータセットを作成する方法を学習します。

最初に、データファイルをWEKAエクスプローラーにロードする方法を学習します。データは、次のソースからロードすることができます-

この章では、データをロードする3つのオプションすべてを詳細に説明します。

ローカルファイルシステムからのデータのロード

前のレッスンで学習したMachine Learningタブの下に、次の3つのボタンがあります-

次に、データファイルが保存されているフォルダーに移動します。 WEKAのインストールには、実験するための多くのサンプルデータベースが用意されています。これらは、WEKAインストールの data フォルダーにあります。

学習目的で、このフォルダから任意のデータファイルを選択します。ファイルの内容はWEKA環境にロードされます。このロードされたデータを検査して処理する方法については、まもなく学習します。その前に、Webからデータファイルを読み込む方法を見てみましょう。

*URLを開く...* ボタンをクリックすると、次のようなウィンドウが表示されます-

私たちは、パブリックURLからファイルを開きますポップアップボックスに次のURLを入力します-

データが保存されている他のURLを指定できます。 Explorer は、リモートサイトから環境にデータをロードします。

*Open DB* をクリックすると... ボタン、次のようにウィンドウを見ることができます-

データベースへの接続文字列を設定し、データ選択用のクエリを設定し、クエリを処理して、選択したレコードをWEKAにロードします。