欢迎访问宙启技术站
智能推送

使用load_data()函数在Python中加载CIFAR-10数据集

发布时间:2023-12-25 21:03:57

CIFAR-10是一个用于图像分类的广泛使用的数据集,包含了10个不同类别的60000张32x32彩色图像。每个类别包含6000张图像。这个数据集在机器学习和深度学习领域经常被用来测试算法的性能。

在Python中,我们可以使用load_data()函数来加载CIFAR-10数据集。load_data()函数是Keras库中的一个函数,可以用来下载并加载CIFAR-10数据集。以下是一个使用load_data()函数加载CIFAR-10数据集的示例代码:

from keras.datasets import cifar10

# 加载CIFAR-10数据集
(x_train, y_train), (x_test, y_test) = cifar10.load_data()

# 查看训练集和测试集的形状
print('训练集的形状:', x_train.shape)
print('训练集标签的形状:', y_train.shape)
print('测试集的形状:', x_test.shape)
print('测试集标签的形状:', y_test.shape)

在这个代码中,首先我们从keras.datasets模块中导入cifar10函数。然后,我们使用load_data()函数将CIFAR-10数据集分成训练集和测试集,并将它们分别存储在x_train、y_train、x_test和y_test这四个变量中。

接下来,我们使用print函数查看训练集和测试集的形状。训练集的形状是(50000, 32, 32, 3),表示训练集有50000个样本,每个样本是一个32x32像素的彩色图像(有三个通道,即红、绿、蓝)。训练集标签的形状是(50000, 1),表示训练集有50000个标签,每个标签对应一个类别。测试集的形状和训练集类似。

通过上述代码,我们成功地加载了CIFAR-10数据集,并获取了训练集和测试集的图像数据和标签。接下来,我们就可以对这些数据进行预处理和模型训练了。例如,我们可以使用图像分类模型来训练对CIFAR-10数据集进行分类的模型。