使用torch.utils.serialization将PyTorch模型保存为HDF5格式

发布时间：2024-01-07 09:56:19

在PyTorch中，可以使用torch.utils.serialization模块将PyTorch模型保存为HDF5格式。HDF5是一种用于存储和管理大量科学数据的文件格式，具有跨平台和高效的特点。

下面是一个保存PyTorch模型为HDF5格式的示例：

import torch
import torch.nn as nn
from torch.utils.serialization import save_hdf5, load_hdf5

# 定义一个简单的模型
class Net(nn.Module):
    def __init__(self):
        super(Net, self).__init__()
        self.fc = nn.Linear(10, 5)
    
    def forward(self, x):
        x = self.fc(x)
        return x

# 创建模型实例
model = Net()

# 保存模型为HDF5格式
save_hdf5('model.h5', model)

# 加载HDF5格式的模型
loaded_model = load_hdf5('model.h5')

# 测试加载的模型
input_data = torch.randn(1, 10)
output_data = loaded_model(input_data)
print(output_data)

在上面的示例中，我们首先定义了一个简单的模型类Net，它包含一个全连接层。然后，我们创建了一个模型实例model并将其保存为HDF5格式的文件model.h5。接下来，我们使用load_hdf5函数加载HDF5格式的模型，并将其保存到loaded_model变量中。最后，我们测试加载的模型，使用随机生成的输入数据input_data进行推理，并打印输出结果。

需要注意的是，torch.utils.serialization模块在最新的PyTorch版本中已经被弃用。从PyTorch 1.7版本开始，推荐使用torch.save()和torch.load()函数来保存和加载模型。可以将上面的例子改写为：

import torch
import torch.nn as nn

# 定义一个简单的模型
class Net(nn.Module):
    def __init__(self):
        super(Net, self).__init__()
        self.fc = nn.Linear(10, 5)
    
    def forward(self, x):
        x = self.fc(x)
        return x

# 创建模型实例
model = Net()

# 保存模型
torch.save(model.state_dict(), 'model.pth')

# 加载模型
loaded_model = Net()
loaded_model.load_state_dict(torch.load('model.pth'))

# 测试加载的模型
input_data = torch.randn(1, 10)
output_data = loaded_model(input_data)
print(output_data)

在新的保存和加载方法中，我们使用torch.save()函数将模型的state_dict保存为.pth文件，然后使用torch.load()函数加载模型。这种方法比之前的旧方法更加简洁和方便。

总结来说，虽然PyTorch自带的torch.utils.serialization模块可以将PyTorch模型保存为HDF5格式，但是从PyTorch 1.7版本开始，推荐使用更简便的torch.save()和torch.load()函数来保存和加载模型。这两种方法中任何一种都可以方便地保存和加载PyTorch模型。