利用Python的read_data_sets()函数加载Fashion-MNIST数据集
Fashion-MNIST是一个替代MNIST手写数字数据集的图像识别数据集,它由10个类别的70,000个灰度图像组成。每个图像的尺寸为28x28像素。
在Python中,我们可以使用Tensorflow库的read_data_sets()函数来加载Fashion-MNIST数据集。这个函数可用于从互联网下载数据集并将其解析为可供我们使用的形式。
首先,我们需要安装Tensorflow库,然后导入所需的库和模块,如下所示:
pip install tensorflow import tensorflow as tf
接下来,我们可以使用read_data_sets()函数来加载Fashion-MNIST数据集。该函数接受一个参数,即下载和存储数据集的目录。如果指定的目录中没有Fashion-MNIST数据集的文件,该函数将自动从互联网上下载数据集。然后,它将数据集解析成可以在我们的代码中使用的形式。
以下是使用read_data_sets()函数加载Fashion-MNIST数据集的示例代码:
import tensorflow as tf # 加载Fashion-MNIST数据集 fashion_mnist = tf.keras.datasets.fashion_mnist (train_images, train_labels), (test_images, test_labels) = fashion_mnist.load_data() # 打印训练集的形状 print(train_images.shape) # 输出:(60000, 28, 28) # 打印测试集的形状 print(test_images.shape) # 输出:(10000, 28, 28)
在上面的代码中,我们首先导入Tensorflow库。然后,我们使用fashion_mnist.load_data()函数从互联网上下载Fashion-MNIST数据集,并将数据集解析为训练集和测试集。训练集包含60,000个图像,测试集包含10,000个图像。
在加载数据集后,我们可以使用train_images.shape和test_images.shape来获取训练集和测试集的形状。训练集的形状为(60000, 28, 28),表示训练集包含60,000个28x28像素的图像。测试集的形状为(10000, 28, 28),表示测试集包含10,000个28x28像素的图像。
除了训练图像之外,train_labels还包含与每个图像对应的标签。标签是一个0到9之间的整数,表示图像所属的类别。对于Fashion-MNIST数据集来说,每个标签都对应着一个不同的类别,包括T恤/上衣、裤子、套头衫、连衣裙、外套、凉鞋、衬衫、运动鞋、包和踝靴。
通过使用test_labels,我们可以获取测试集中每个图像的真实标签。
