Pybrain-working-with-datasets

提供:Dev Guides
移動先:案内検索

PyBrain-データセットの操作

データセットは、ネットワークをテスト、検証、トレーニングするために提供される入力データです。 使用するデータセットのタイプは、機械学習で実行するタスクによって異なります。 この章では、以下を見ていきます-

  • データセットの作成
  • データセットへのデータの追加

最初に、データセットを作成し、指定された入力でデータセットをテストする方法を学びます。

データセットの作成

データセットを作成するには、pybrainデータセットパッケージを使用する必要があります: pybrain.datasets

Pybrainは、 _ SupervisedDataset ' 、SequentialDataset、ClassificationDataSetなどのデータセットクラスをサポートしています。 _SupervisedDataset' を使用して、データセットを作成します。使用するデータセットは、ユーザーが実装しようとしている機械学習タスクに依存します。

*_SupervisedDataset dataset_* には、params入力とターゲットが必要です。 以下に示すように、XORの真理値表を考慮してください-
A B A XOR B
0 0 0
0 1 1
1 0 1
1 1 0

与えられる入力は2次元配列のようなもので、1つの出力が得られます。 したがって、ここで入力はサイズになり、ターゲットは1になります。 したがって、データセットの入力は2,1になります。

createdataset.py

from pybrain.datasets import SupervisedDataSet
sds = SupervisedDataSet(2, 1)
print(sds)

これは、上記のコードpython createdataset.pyを実行したときに得られるものです-

C:\pybrain\pybrain\src>python createdataset.py
input: dim(0, 2)
[]
target: dim(0, 1)
[]

上記のように、サイズ2の入力とサイズ1のターゲットが表示されます。

データセットへのデータの追加

サンプルデータをデータセットに追加しましょう。

createdataset.py

from pybrain.datasets import SupervisedDataSet
sds = SupervisedDataSet(2, 1)
xorModel = [
   [(0,0), (0,)],
   [(0,1), (1,)],
   [(1,0), (1,)],
   [(1,1), (0,)],
]
for input, target in xorModel:
sds.addSample(input, target)
print("Input is:")
print(sds['input'])
print("\nTarget is:")
print(sds['target'])

以下に示すように、XORModel配列を作成しました-

xorModel = [
   [(0,0), (0,)],
   [(0,1), (1,)],
   [(1,0), (1,)],
   [(1,1), (0,)],
]

データセットにデータを追加するには、入力とターゲットを取得するaddSample()メソッドを使用します。

addSampleにデータを追加するには、以下に示すようにxorModel配列をループします-

for input, target in xorModel:
   sds.addSample(input, target)

実行後、次の出力が得られます-

python createdataset.py

C:\pybrain\pybrain\src>python createdataset.py
Input is:
[[Target is:
[[You can get the input and target details from the dataset created by simply using the input and target index as shown below −

[source,result,notranslate]

print(sds ['input'])print(sds ['target'])