PyTorch-データの読み込み

PyTorchには、データセットのロードと準備に使用されるtorchvisionというパッケージが含まれています。これには、データセットとデータセットの変換と読み込みに役立つDataLoaderとDataLoaderという2つの基本機能が含まれています。

データセット

データセットは、指定されたデータセットからデータポイントを読み取り、変換するために使用されます。実装する基本的な構文は以下のとおりです-

trainset = torchvision.datasets.CIFAR10(root = './data', train = True,
   download = True, transform = transform)

DataLoaderは、データのシャッフルおよびバッチ処理に使用されます。マルチプロセッシングワーカーと並行してデータをロードするために使用できます。

trainloader = torch.utils.data.DataLoader(trainset, batch_size = 4,
   shuffle = True, num_workers = 2)

例：CSVファイルの読み込み

PythonパッケージPandaを使用して、csvファイルをロードします。元のファイルの形式は次のとおりです（イメージ名、68ランドマーク-各ランドマークにはx、y座標があります）。

landmarks_frame = pd.read_csv('faces/face_landmarks.csv')

n = 65
img_name = landmarks_frame.iloc[n, 0]
landmarks = landmarks_frame.iloc[n, 1:].as_matrix()
landmarks = landmarks.astype('float').reshape(-1, 2)

Pytorch-loading-data

PyTorch-データの読み込み

データセット

例：CSVファイルの読み込み