Python中如何使用utils.lr_schedulerWarmupMultiFactorScheduler()实现学习率的自动调整

发布时间：2023-12-16 05:42:40

在Python中，可以使用utils.lr_scheduler.WarmupMultiFactorScheduler()来实现学习率的自动调整。这个调度器可以将初始学习率乘以一个因子，并在特定的迭代次数上进行学习率的调整。此外，该调度器还支持学习率的warmup（预热）操作，即在训练开始时逐渐增加学习率，以提高模型的稳定性和收敛速度。

下面是一个使用WarmupMultiFactorScheduler()的例子：

import paddle
import paddle.nn as nn
from paddle.optimizer import AdamW
from paddle.optimizer.lr import WarmupMultiFactorScheduler

# 定义一个简单的模型
class MyModel(nn.Layer):
    def __init__(self):
        super(MyModel, self).__init__()
        self.linear = nn.Linear(10, 1)
    
    def forward(self, x):
        return self.linear(x)

# 创建模型和优化器
model = MyModel()
optimizer = AdamW(parameters=model.parameters(), learning_rate=0.001)

# 定义学习率调度器
scheduler = WarmupMultiFactorScheduler(learning_rate=0.001, milestones=[10, 20, 30], gamma=0.1, warmup_factor=0.1, warmup_iters=5, warmup_method="linear")

# 训练模型
for epoch in range(50):
    for batch in dataloader:  # 假设有dataloader来提供训练数据
        x, y = batch
        pred = model(x)
        loss = paddle.mean(paddle.square(pred - y))
        loss.backward()
        optimizer.step()
        optimizer.clear_grad()
        
        # 更新学习率
        scheduler.step()

    print("Epoch %d - Loss: %.4f - Learning Rate: %.6f" % (epoch, loss.numpy(), optimizer.get_lr()))

上述代码中，首先定义了一个简单的模型MyModel，该模型包含一个全连接层。然后创建了优化器AdamW，并指定了初始学习率为0.001。接下来，定义了学习率调度器WarmupMultiFactorScheduler。这里设置了学习率调整的milestones为[10, 20, 30]，即在训练的第10、20、30个epoch时分别将学习率乘以gamma（gamma=0.1）。此外，设置了warmup_factor为0.1，即在训练的前5个epoch中逐渐增加学习率。设置了warmup_method为"linear"，表示使用线性增长的方式进行预热。

接下来，通过一个双层循环进行模型的训练。在内层循环中，计算模型的预测值并计算损失，然后进行反向传播和优化器的更新。在每次更新后，调用scheduler.step()方法来更新学习率。最后，打印出当前epoch的损失和学习率。

通过上述例子，我们可以看到学习率在特定的epoch上自动进行了调整。在开始时，学习率会逐渐增加，以提高模型的稳定性；然后，在epoch为10、20和30时，学习率会分别乘以0.1，以降低学习率并继续优化模型。