PyTorch中常用的学习率调度方法介绍

发布时间：2023-12-18 23:14:49

在PyTorch中，学习率调度方法用于动态地调整模型训练过程中的学习率。这些方法可以帮助我们更好地优化模型，提高训练效果。本文将介绍PyTorch中常用的学习率调度方法，并提供相应的使用例子。

1. StepLR

StepLR学习率调度器在训练过程中按照给定的步长进行学习率的衰减。使用步长step_size和衰减因子gamma来控制学习率的变化。每当训练epoch达到step_size倍数时，学习率会按照gamma进行衰减。

使用例子：

import torch
import torch.optim as optim
import torch.nn as nn
from torch.optim.lr_scheduler import StepLR

# 定义模型和优化器
model = nn.Linear(10, 2)
optimizer = optim.SGD(model.parameters(), lr=0.1)

# 定义学习率调度器
scheduler = StepLR(optimizer, step_size=10, gamma=0.1)

# 训练过程中每个epoch更新学习率
for epoch in range(100):
    # 正常训练过程
    optimizer.zero_grad()
    output = model(input)
    loss = criterion(output, target)
    loss.backward()
    optimizer.step()

    # 更新学习率
    scheduler.step()

2. MultiStepLR

MultiStepLR学习率调度器在训练过程中，在给定的milestones处将学习率按照给定的gamma进行衰减。milestones是一个列表，其中包含需要调整学习率的epoch数。可以根据需要设置多组milestones和gamma来实现多段学习率调整。

使用例子：

import torch
import torch.optim as optim
import torch.nn as nn
from torch.optim.lr_scheduler import MultiStepLR

# 定义模型和优化器
model = nn.Linear(10, 2)
optimizer = optim.SGD(model.parameters(), lr=0.1)

# 定义学习率调度器
scheduler = MultiStepLR(optimizer, milestones=[30, 80], gamma=0.1)

# 训练过程中每个epoch更新学习率
for epoch in range(100):
    # 正常训练过程
    optimizer.zero_grad()
    output = model(input)
    loss = criterion(output, target)
    loss.backward()
    optimizer.step()

    # 更新学习率
    scheduler.step()

3. ExponentialLR

ExponentialLR学习率调度器在训练过程中按照指数衰减更新学习率。使用gamma参数来控制指数衰减的速率。

使用例子：

import torch
import torch.optim as optim
import torch.nn as nn
from torch.optim.lr_scheduler import ExponentialLR

# 定义模型和优化器
model = nn.Linear(10, 2)
optimizer = optim.SGD(model.parameters(), lr=0.1)

# 定义学习率调度器
scheduler = ExponentialLR(optimizer, gamma=0.9)

# 训练过程中每个epoch更新学习率
for epoch in range(100):
    # 正常训练过程
    optimizer.zero_grad()
    output = model(input)
    loss = criterion(output, target)
    loss.backward()
    optimizer.step()

    # 更新学习率
    scheduler.step()

4. CosineAnnealingLR

CosineAnnealingLR学习率调度器在训练过程中按照余弦函数的形式更新学习率。使用T_max参数来设置学习率更新的周期。

使用例子：

import torch
import torch.optim as optim
import torch.nn as nn
from torch.optim.lr_scheduler import CosineAnnealingLR

# 定义模型和优化器
model = nn.Linear(10, 2)
optimizer = optim.SGD(model.parameters(), lr=0.1)

# 定义学习率调度器
scheduler = CosineAnnealingLR(optimizer, T_max=100)

# 训练过程中每个epoch更新学习率
for epoch in range(100):
    # 正常训练过程
    optimizer.zero_grad()
    output = model(input)
    loss = criterion(output, target)
    loss.backward()
    optimizer.step()

    # 更新学习率
    scheduler.step()

这些学习率调度方法都是PyTorch中常用的用于优化模型的方法，可以根据实际情况选择适合的学习率调度方法来优化模型的训练过程。