Weka-file-formats
提供:Dev Guides
Weka-ファイル形式
WEKAは、データ用に多数のファイル形式をサポートしています。 ここに完全なリストがあります-
- arff
- arff.gz
- bsi
- csv
- dat
- data
- json
- json.gz
- libsvm
- m
- 名前
- xrff
- xrff.gz
サポートするファイルの種類は、画面下部のドロップダウンリストボックスに一覧表示されます。 これは、以下のスクリーンショットに示されています。
お気づきのとおり、CSVやJSONを含むいくつかの形式をサポートしています。 デフォルトのファイルタイプはArffです。
Arffフォーマット
- ヘッダーは属性タイプを記述します。
- データセクションには、データのカンマ区切りリストが含まれています。
Arff形式の例として、WEKAサンプルデータベースからロードされた Weather データファイルを以下に示します-
スクリーンショットから、次の点を推測することができます-
- @relationタグは、データベースの名前を定義します。
- @attributeタグは属性を定義します。
- @dataタグは、各コンマ区切りフィールドを含むデータ行のリストを開始します。
- ここに示されている見通しの場合のように、属性は公称値を取ることができます-
- 属性は、この場合のように実際の値を取ることができます-
- また、ここに示すように、playというターゲット変数またはクラス変数を設定できます-
- ターゲットは、yesまたはnoの2つの公称値を想定しています。
その他の形式
Explorerは、前述の形式のいずれかでデータをロードできます。 arffはWEKAで推奨される形式であるため、任意の形式からデータをロードし、後で使用するためにarff形式に保存できます。 データを前処理した後、さらなる分析のためにそれをarff形式に保存するだけです。
次の章では、データをWEKAにロードする方法を学習したので、データを前処理する方法を学習します。