用Python编写的Nets.LeNet算法在MNIST数据集上进行数字识别

发布时间：2023-12-11 08:38:29

LeNet是由Yann LeCun等人于1998年提出的深度学习算法，用于手写数字识别。它是深度学习在计算机视觉领域的里程碑之一，为后来的深度学习算法奠定了基础。

MNIST数据集是深度学习算法中最经典的数据集之一，包含了大约60000张28x28像素的手写数字图像作为训练集，以及10000张作为测试集。每个图像都包含了一个0-9之间的手写数字。

下面是一个使用Python编写的Nets.LeNet算法在MNIST数据集上进行数字识别的示例代码：

import torch
import torch.nn as nn
import torch.optim as optim
import torchvision.transforms as transforms
import torchvision.datasets as datasets

# 定义LeNet网络结构
class LeNet(nn.Module):
    def __init__(self):
        super(LeNet, self).__init__()
        self.conv1 = nn.Conv2d(1, 6, 5)
        self.conv2 = nn.Conv2d(6, 16, 5)
        self.fc1 = nn.Linear(16*4*4, 120)
        self.fc2 = nn.Linear(120, 84)
        self.fc3 = nn.Linear(84, 10)

    def forward(self, x):
        x = nn.functional.relu(self.conv1(x))
        x = nn.functional.max_pool2d(x, 2)
        x = nn.functional.relu(self.conv2(x))
        x = nn.functional.max_pool2d(x, 2)
        x = x.view(x.size(0), -1)
        x = nn.functional.relu(self.fc1(x))
        x = nn.functional.relu(self.fc2(x))
        x = self.fc3(x)
        return x

# 加载MNIST数据集
train_dataset = datasets.MNIST(root='./data', train=True, transform=transforms.ToTensor(), download=True)
test_dataset = datasets.MNIST(root='./data', train=False, transform=transforms.ToTensor(), download=True)

# 定义训练和测试的参数
batch_size = 64
epochs = 10
learning_rate = 0.001

# 创建数据加载器
train_loader = torch.utils.data.DataLoader(dataset=train_dataset, batch_size=batch_size, shuffle=True)
test_loader = torch.utils.data.DataLoader(dataset=test_dataset, batch_size=batch_size, shuffle=False)

# 创建网络模型
model = LeNet()

# 定义损失函数和优化器
criterion = nn.CrossEntropyLoss()
optimizer = optim.Adam(model.parameters(), lr=learning_rate)

# 训练模型
total_step = len(train_loader)
for epoch in range(epochs):
    for i, (images, labels) in enumerate(train_loader):
        # 向前传播
        outputs = model(images)
        loss = criterion(outputs, labels)

        # 反向传播和优化
        optimizer.zero_grad()
        loss.backward()
        optimizer.step()

        if (i+1) % 100 == 0:
            print('Epoch [{}/{}], Step [{}/{}], Loss: {:.4f}'
                  .format(epoch+1, epochs, i+1, total_step, loss.item()))

# 测试模型
model.eval()
with torch.no_grad():
    correct = 0
    total = 0
    for images, labels in test_loader:
        outputs = model(images)
        _, predicted = torch.max(outputs.data, 1)
        total += labels.size(0)
        correct += (predicted == labels).sum().item()

    print('Accuracy of the model on the 10000 test images: {} %'.format(100 * correct / total))

在这个示例中，我们首先定义了LeNet网络结构，然后通过torchvision库加载了MNIST数据集。接下来，我们定义了训练和测试的参数，包括批量大小、迭代次数和学习率。

然后，我们使用torch.utils.data.DataLoader创建了数据加载器，并根据定义的网络结构、损失函数和优化器创建了模型。

在训练过程中，我们使用循环迭代训练集中的所有图像，并进行向前传播、计算损失、反向传播和优化等步骤。每100个批次打印一次当前的损失。

最后，我们使用训练好的模型进行测试，并计算模型的准确率。

总结：这个示例展示了使用Python编写的Nets.LeNet算法在MNIST数据集上进行数字识别的完整过程。你可以通过改变参数和网络结构来进一步优化模型的性能。