如何使用python中的save_checkpoint()函数来保存训练模型的权重

发布时间：2023-12-30 13:31:11

在Python中，可以使用PyTorch库的save_checkpoint()函数来保存训练模型的权重。该函数接受以下参数：

1. model_dict：训练模型的权重字典。

2. checkpoint_path：保存模型权重的路径。

3. optimizer_dict：优化器的状态字典（可选）。

下面是一个使用save_checkpoint()函数来保存训练模型权重的示例代码：

import torch
import torch.nn as nn
import torch.optim as optim

# 定义一个示例模型
class MyModel(nn.Module):
    def __init__(self):
        super(MyModel, self).__init__()
        self.fc = nn.Linear(10, 1)

    def forward(self, x):
        return self.fc(x)

# 实例化模型和优化器
model = MyModel()
optimizer = optim.SGD(model.parameters(), lr=0.1)

# 训练模型并保存权重
def train(model, optimizer):
    # 模拟训练过程
    for epoch in range(10):
        # 获取模型输出
        x = torch.randn(10)
        output = model(x)

        # 计算损失并更新模型
        loss = output.sum()
        optimizer.zero_grad()
        loss.backward()
        optimizer.step()

        # 在每个epoch结束时保存模型权重
        if (epoch + 1) % 5 == 0:
            checkpoint_path = f'checkpoint_epoch{epoch+1}.pth'
            save_checkpoint(model.state_dict(), checkpoint_path, optimizer.state_dict())  # 调用save_checkpoint()函数保存模型权重

# 保存训练模型权重的函数
def save_checkpoint(model_dict, checkpoint_path, optimizer_dict=None):
    # 创建一个字典来保存模型和优化器的状态
    checkpoint = {
        'model_state_dict': model_dict,
    }
    if optimizer_dict:
        checkpoint['optimizer_state_dict'] = optimizer_dict

    # 保存模型和优化器状态到指定路径
    torch.save(checkpoint, checkpoint_path)
    print(f'Model checkpoint saved to {checkpoint_path}.')

# 调用训练函数
train(model, optimizer)

在上面的代码中，使用了一个简单的线性模型作为示例模型，使用随机梯度下降（SGD）优化算法进行参数更新。训练函数train()中的save_checkpoint()函数用于保存模型权重。

在每个epoch结束时，使用save_checkpoint()函数保存模型权重。在save_checkpoint()函数中，我们创建一个字典checkpoint来保存模型和优化器的状态。通过调用torch.save()函数，将字典checkpoint保存到指定路径。在保存模型权重时，也可以选择保存优化器的状态，将优化器字典optimizer_dict添加到checkpoint中。

在控制台输出中，将显示保存模型权重的路径。

注意，保存的模型权重文件是二进制文件，因此加载时需要使用torch.load()函数进行加载。加载模型权重的方法请参考[如何使用Python中的load_checkpoint()函数来加载训练模型的权重带使用例子?]()