Pytorch-datasets

提供:Dev Guides
移動先:案内検索

PyTorch-データセット

この章では、 torchvision.datasets およびそのさまざまなタイプに焦点を当てます。 PyTorchには次のデータセットローダーが含まれています-

  • MNIST
  • COCO(キャプションと検出)

データセットには、以下に示す2種類の関数の大部分が含まれます-

  • Transform -画像を取り込んで、標準的なものの修正版を返す関数。 これらは、変換と一緒に構成できます。
  • Target_transform -ターゲットを取得して変換する関数。 たとえば、キャプション文字列を受け取り、ワールドインデックスのテンソルを返します。

MNIST

以下は、MNISTデータセットのサンプルコードです-

dset.MNIST(root, train = TRUE, transform = NONE,
target_transform = None, download = FALSE)

パラメータは次のとおりです-

  • root -処理されたデータが存在するデータセットのルートディレクトリ。
  • train -True =トレーニングセット、False =テストセット
  • download -True =インターネットからデータセットをダウンロードし、ルートに配置します。

COCO

これには、COCO APIがインストールされている必要があります。 次の例は、PyTorchを使用したデータセットのCOCO実装を実証するために使用されます-

import torchvision.dataset as dset
import torchvision.transforms as transforms
cap = dset.CocoCaptions(root = ‘ dir where images are’,
annFile = ’json annotation file’,
transform = transforms.ToTensor())
print(‘Number of samples: ‘, len(cap))
print(target)

達成される出力は次のとおりです-

Number of samples: 82783
Image Size: (3L, 427L, 640L)