Pybrain-working-with-datasets
PyBrain-データセットの操作
データセットは、ネットワークをテスト、検証、トレーニングするために提供される入力データです。 使用するデータセットのタイプは、機械学習で実行するタスクによって異なります。 この章では、以下を見ていきます-
- データセットの作成
- データセットへのデータの追加
最初に、データセットを作成し、指定された入力でデータセットをテストする方法を学びます。
データセットの作成
データセットを作成するには、pybrainデータセットパッケージを使用する必要があります: pybrain.datasets 。
Pybrainは、 _ SupervisedDataset ' 、SequentialDataset、ClassificationDataSetなどのデータセットクラスをサポートしています。 _SupervisedDataset' を使用して、データセットを作成します。使用するデータセットは、ユーザーが実装しようとしている機械学習タスクに依存します。
A | B | A XOR B |
---|---|---|
0 | 0 | 0 |
0 | 1 | 1 |
1 | 0 | 1 |
1 | 1 | 0 |
与えられる入力は2次元配列のようなもので、1つの出力が得られます。 したがって、ここで入力はサイズになり、ターゲットは1になります。 したがって、データセットの入力は2,1になります。
createdataset.py
これは、上記のコードpython createdataset.pyを実行したときに得られるものです-
上記のように、サイズ2の入力とサイズ1のターゲットが表示されます。
データセットへのデータの追加
サンプルデータをデータセットに追加しましょう。
createdataset.py
以下に示すように、XORModel配列を作成しました-
データセットにデータを追加するには、入力とターゲットを取得するaddSample()メソッドを使用します。
addSampleにデータを追加するには、以下に示すようにxorModel配列をループします-
実行後、次の出力が得られます-
python createdataset.py
print(sds ['input'])print(sds ['target'])