如何使用torch.utils.load()将预训练模型加载到PyTorch中

发布时间：2024-01-02 20:37:49

在PyTorch中，可以使用torch.utils.load()函数来加载预训练模型。该函数可以从磁盘上的文件加载相应的权重和状态字典，并应用于已定义的模型中。

以下是一个加载预训练模型的示例代码，该模型是ResNet-50模型在ImageNet数据集上预训练得到的：

import torch
from torchvision.models import resnet50

# 定义要加载的预训练模型
model = resnet50(pretrained=False)

# 加载预训练模型的权重和状态字典
model.load_state_dict(torch.load('resnet50_weights.pth'))

# 设置模型为推理模式
model.eval()

在上面的代码中，我们首先导入torch和resnet50模型类。接下来，我们使用resnet50(pretrained=False)来创建一个空的ResNet-50模型实例，pretrained=False表示不使用预训练的权重。

然后，我们使用torch.load()函数加载预训练模型的权重和状态字典。torch.load()函数将返回一个字典对象，其中包含了模型的权重。

最后，通过调用model.eval()方法，我们将模型设置为推理模式。在推理模式下，模型将禁用一些特定的层和操作，以提高推理速度。

需要注意的是，torch.load()函数默认使用CPU加载模型。如果要在GPU上加载模型，可以使用torch.load()函数的map_location参数来指定设备。

另外，如果在加载模型时遇到了版本不匹配的问题，可以使用torch.nn.Module.load_state_dict()函数加载模型参数，而不使用torch.load()函数。例如：

model = resnet50(pretrained=False)
model.load_state_dict(torch.load('resnet50_weights.pth', map_location=torch.device('cpu')))
model.eval()

在这个示例中，我们仍然加载了预训练模型的权重，但是使用了model.load_state_dict()方法来加载模型参数。map_location参数用于指定设备位置（例如CPU），以防止版本不匹配的问题。

总之，torch.utils.load()函数是加载预训练模型的常用方法，可以帮助我们在PyTorch中使用已训练好的模型。