Pytorch-datasets
提供:Dev Guides
PyTorch-データセット
この章では、 torchvision.datasets およびそのさまざまなタイプに焦点を当てます。 PyTorchには次のデータセットローダーが含まれています-
- MNIST
- COCO(キャプションと検出)
データセットには、以下に示す2種類の関数の大部分が含まれます-
- Transform -画像を取り込んで、標準的なものの修正版を返す関数。 これらは、変換と一緒に構成できます。
- Target_transform -ターゲットを取得して変換する関数。 たとえば、キャプション文字列を受け取り、ワールドインデックスのテンソルを返します。
MNIST
以下は、MNISTデータセットのサンプルコードです-
dset.MNIST(root, train = TRUE, transform = NONE,
target_transform = None, download = FALSE)
パラメータは次のとおりです-
- root -処理されたデータが存在するデータセットのルートディレクトリ。
- train -True =トレーニングセット、False =テストセット
- download -True =インターネットからデータセットをダウンロードし、ルートに配置します。
COCO
これには、COCO APIがインストールされている必要があります。 次の例は、PyTorchを使用したデータセットのCOCO実装を実証するために使用されます-
import torchvision.dataset as dset
import torchvision.transforms as transforms
cap = dset.CocoCaptions(root = ‘ dir where images are’,
annFile = ’json annotation file’,
transform = transforms.ToTensor())
print(‘Number of samples: ‘, len(cap))
print(target)
達成される出力は次のとおりです-
Number of samples: 82783
Image Size: (3L, 427L, 640L)