Weka-file-formats

提供:Dev Guides
移動先:案内検索

Weka-ファイル形式

WEKAは、データ用に多数のファイル形式をサポートしています。 ここに完全なリストがあります-

  • arff
  • arff.gz
  • bsi
  • csv
  • dat
  • data
  • json
  • json.gz
  • libsvm
  • m
  • 名前
  • xrff
  • xrff.gz

サポートするファイルの種類は、画面下部のドロップダウンリストボックスに一覧表示されます。 これは、以下のスクリーンショットに示されています。

ドロップダウンリスト

お気づきのとおり、CSVやJSONを含むいくつかの形式をサポートしています。 デフォルトのファイルタイプはArffです。

Arffフォーマット

*Arff* ファイルには、ヘッダーとデータの2つのセクションが含まれています。
  • ヘッダーは属性タイプを記述します。
  • データセクションには、データのカンマ区切りリストが含まれています。

Arff形式の例として、WEKAサンプルデータベースからロードされた Weather データファイルを以下に示します-

サンプルデータベース

スクリーンショットから、次の点を推測することができます-

  • @relationタグは、データベースの名前を定義します。
  • @attributeタグは属性を定義します。
  • @dataタグは、各コンマ区切りフィールドを含むデータ行のリストを開始します。
  • ここに示されている見通しの場合のように、属性は公称値を取ることができます-
@attribute outlook (sunny, overcast, rainy)
  • 属性は、この場合のように実際の値を取ることができます-
@attribute temperature real
  • また、ここに示すように、playというターゲット変数またはクラス変数を設定できます-
@attribute play (yes, no)
  • ターゲットは、yesまたはnoの2つの公称値を想定しています。

その他の形式

Explorerは、前述の形式のいずれかでデータをロードできます。 arffはWEKAで推奨される形式であるため、任意の形式からデータをロードし、後で使用するためにarff形式に保存できます。 データを前処理した後、さらなる分析のためにそれをarff形式に保存するだけです。

次の章では、データをWEKAにロードする方法を学習したので、データを前処理する方法を学習します。