PyTorch-データセット

この章では、 torchvision.datasets およびそのさまざまなタイプに焦点を当てます。 PyTorchには次のデータセットローダーが含まれています-

MNIST
COCO（キャプションと検出）

データセットには、以下に示す2種類の関数の大部分が含まれます-

Transform -画像を取り込んで、標準的なものの修正版を返す関数。これらは、変換と一緒に構成できます。
Target_transform -ターゲットを取得して変換する関数。たとえば、キャプション文字列を受け取り、ワールドインデックスのテンソルを返します。

MNIST

以下は、MNISTデータセットのサンプルコードです-

dset.MNIST(root, train = TRUE, transform = NONE,
target_transform = None, download = FALSE)

パラメータは次のとおりです-

root -処理されたデータが存在するデータセットのルートディレクトリ。
train -True =トレーニングセット、False =テストセット
download -True =インターネットからデータセットをダウンロードし、ルートに配置します。

COCO

これには、COCO APIがインストールされている必要があります。次の例は、PyTorchを使用したデータセットのCOCO実装を実証するために使用されます-

import torchvision.dataset as dset
import torchvision.transforms as transforms
cap = dset.CocoCaptions(root = ‘ dir where images are’,
annFile = ’json annotation file’,
transform = transforms.ToTensor())
print(‘Number of samples: ‘, len(cap))
print(target)

達成される出力は次のとおりです-

Number of samples: 82783
Image Size: (3L, 427L, 640L)

Pytorch-datasets

PyTorch-データセット

MNIST

COCO