Pybrain-working-with-datasets
PyBrain-データセットの操作
データセットは、ネットワークをテスト、検証、トレーニングするために提供される入力データです。 使用するデータセットのタイプは、機械学習で実行するタスクによって異なります。 この章では、以下を見ていきます-
- データセットの作成
- データセットへのデータの追加
最初に、データセットを作成し、指定された入力でデータセットをテストする方法を学びます。
データセットの作成
データセットを作成するには、pybrainデータセットパッケージを使用する必要があります: pybrain.datasets 。
Pybrainは、 _ SupervisedDataset ' 、SequentialDataset、ClassificationDataSetなどのデータセットクラスをサポートしています。 _SupervisedDataset' を使用して、データセットを作成します。使用するデータセットは、ユーザーが実装しようとしている機械学習タスクに依存します。
*_SupervisedDataset dataset_* には、params入力とターゲットが必要です。 以下に示すように、XORの真理値表を考慮してください-
A | B | A XOR B |
---|---|---|
0 | 0 | 0 |
0 | 1 | 1 |
1 | 0 | 1 |
1 | 1 | 0 |
与えられる入力は2次元配列のようなもので、1つの出力が得られます。 したがって、ここで入力はサイズになり、ターゲットは1になります。 したがって、データセットの入力は2,1になります。
createdataset.py
from pybrain.datasets import SupervisedDataSet
sds = SupervisedDataSet(2, 1)
print(sds)
これは、上記のコードpython createdataset.pyを実行したときに得られるものです-
C:\pybrain\pybrain\src>python createdataset.py
input: dim(0, 2)
[]
target: dim(0, 1)
[]
上記のように、サイズ2の入力とサイズ1のターゲットが表示されます。
データセットへのデータの追加
サンプルデータをデータセットに追加しましょう。
createdataset.py
from pybrain.datasets import SupervisedDataSet
sds = SupervisedDataSet(2, 1)
xorModel = [
[(0,0), (0,)],
[(0,1), (1,)],
[(1,0), (1,)],
[(1,1), (0,)],
]
for input, target in xorModel:
sds.addSample(input, target)
print("Input is:")
print(sds['input'])
print("\nTarget is:")
print(sds['target'])
以下に示すように、XORModel配列を作成しました-
xorModel = [
[(0,0), (0,)],
[(0,1), (1,)],
[(1,0), (1,)],
[(1,1), (0,)],
]
データセットにデータを追加するには、入力とターゲットを取得するaddSample()メソッドを使用します。
addSampleにデータを追加するには、以下に示すようにxorModel配列をループします-
for input, target in xorModel:
sds.addSample(input, target)
実行後、次の出力が得られます-
python createdataset.py
C:\pybrain\pybrain\src>python createdataset.py
Input is:
[[Target is:
[[You can get the input and target details from the dataset created by simply using the input and target index as shown below −
[source,result,notranslate]
print(sds ['input'])print(sds ['target'])