Sacred：Python中的神奇实验管理工具

发布时间：2024-01-14 22:48:24

Sacred是一个在Python中用于实验管理的工具。它可以帮助你记录实验的参数、指标、配置和结果，以及实验之间的依赖关系和版本控制。在实验过程中，你可以方便地管理实验的不同运行配置，进行跟踪和比较不同运行的结果。Sacred还可以与其他Python库和工具集成，如Tensorboard、Visdom和Matplotlib等，使实验管理更加便捷。

下面是一个使用Sacred进行实验管理的例子：

首先，你需要安装Sacred库。你可以使用pip命令来进行安装：

pip install sacred

接下来，我们将创建一个简单的神经网络实验，并使用Sacred进行实验管理。首先，我们需要导入Sacred相关的模块和库：

from sacred import Experiment
from sacred.observers import FileStorageObserver
import torch
import torch.nn as nn
import torch.optim as optim
import torchvision.datasets as datasets
import torchvision.transforms as transforms

然后，我们可以创建一个实验对象，并指定一个文件存储观察者，用于记录实验的参数和结果：

ex = Experiment('my_experiment')
ex.observers.append(FileStorageObserver.create('logs'))

在本例中，我们将实验保存在名为“logs”的文件夹中。

接下来，我们可以定义和运行我们的实验函数。在实验函数中，我们可以使用Sacred提供的装饰器来声明实验参数，并记录实验的指标和结果。

@ex.config
def my_experiment_config():
    learning_rate = 0.001
    batch_size = 32
    num_epochs = 10

@ex.automain
def my_experiment(learning_rate, batch_size, num_epochs):
    # 加载和预处理数据
    transform = transforms.Compose([transforms.ToTensor(), transforms.Normalize((0.5,), (0.5,))])
    train_dataset = datasets.MNIST(root='./data', train=True, transform=transform)
    train_loader = torch.utils.data.DataLoader(train_dataset, batch_size=batch_size, shuffle=True)
    test_dataset = datasets.MNIST(root='./data', train=False, transform=transform)
    test_loader = torch.utils.data.DataLoader(test_dataset, batch_size=batch_size, shuffle=False)
    
    # 定义神经网络模型
    model = nn.Sequential(
        nn.Linear(784, 128),
        nn.ReLU(),
        nn.Linear(128, 64),
        nn.ReLU(),
        nn.Linear(64, 10),
        nn.LogSoftmax(dim=1)
    )
    
    # 定义损失函数和优化器
    criterion = nn.NLLLoss()
    optimizer = optim.Adam(model.parameters(), lr=learning_rate)
    
    # 训练和评估模型
    for epoch in range(num_epochs):
        for i, (images, labels) in enumerate(train_loader):
            images = images.view(-1, 784)
            optimizer.zero_grad()
            outputs = model(images)
            loss = criterion(outputs, labels)
            loss.backward()
            optimizer.step()
        
        # 在测试集上评估模型
        correct = 0
        total = 0
        with torch.no_grad():
            for images, labels in test_loader:
                images = images.view(-1, 784)
                outputs = model(images)
                _, predicted = torch.max(outputs.data, 1)
                total += labels.size(0)
                correct += (predicted == labels).sum().item()
        accuracy = 100 * correct / total
        
        # 记录实验指标和结果
        ex.log_scalar('accuracy', accuracy, epoch+1)
        ex.log_scalar('loss', loss.item(), epoch+1)
    
    return accuracy

在这个例子中，我们定义了3个实验参数：学习率、批量大小和训练轮数。我们还定义了一个实验函数my_experiment，其中我们加载和预处理MNIST数据集，定义神经网络模型、损失函数和优化器，并进行训练和评估。在每个训练轮次结束时，我们记录了实验的准确率和损失。

最后，我们可以使用Sacred来运行我们的实验，并查看结果：

ex.run()

运行实验后，Sacred将自动记录实验的配置、指标和结果，并将其保存在指定的文件存储观察者中。

以上就是使用Sacred进行实验管理的一个简单例子。通过Sacred，你可以方便地管理实验的参数、指标和结果，以及实验之间的依赖关系和版本控制，从而更好地组织和管理你的实验代码。