torch.nn.functional中的nll_loss()函数及其在深度学习中的应用解析

发布时间：2023-12-16 22:03:48

在深度学习中，Cross Entropy Loss (交叉熵损失)是一种常用的损失函数，用于评估模型的输出与真实标签之间的差异。而在PyTorch中，通过torch.nn.functional中的nll_loss()函数，可以方便地计算交叉熵损失。

nll_loss()函数的全称是Negative Log Likelihood Loss (负对数似然损失)，它的输入包括两部分：模型的输出和真实标签。它首先对模型的输出进行log_softmax操作，然后根据真实标签计算得到每个类别的负对数似然损失，最后求取平均值。

nll_loss()函数的定义如下：

torch.nn.functional.nll_loss(input, target, weight=None, size_average=None, ignore_index=-100, reduce=None, reduction='mean')

其中，input是一个张量，表示模型的输出；target是一个张量，表示真实标签。weight是一个张量，用于对不同类别的样本设置不同的权重。size_average和reduction参数用于控制损失的计算方式，reduce参数已弃用。

下面我们来讲解一下nll_loss()函数在深度学习中的应用，并通过一个例子来说明其使用方式。

首先，我们通常会使用Softmax作为模型输出的激活函数，将模型的输出转换为概率分布。而在训练过程中，我们希望模型的输出的概率分布越接近于真实标签，即越接近于一个one-hot向量。而负对数似然损失正是用来度量模型输出与真实标签的差异的。

假设我们有一个简单的分类任务，共有3个类别：猫、狗和鸟。我们使用一个全连接神经网络模型作为分类器，模型的输出是一个包含3个元素的向量。我们可以将模型的输出视为在每个类别上的预测概率，如[0.2, 0.5, 0.3]。而真实标签可以表示为一个one-hot向量，比如标签为狗可以表示为[0, 1, 0]。

接下来，我们可以使用nll_loss()函数来计算模型输出与真实标签之间的负对数似然损失。代码示例如下：

import torch
import torch.nn.functional as F

# 模型的输出和真实标签
output = torch.tensor([[0.2, 0.5, 0.3]])
target = torch.tensor([1])

# 对模型的输出进行log_softmax操作
log_probs = F.log_softmax(output, dim=1)

# 计算负对数似然损失
loss = F.nll_loss(log_probs, target)
print(loss.item())  # 输出损失值

在这个例子中，我们首先使用log_softmax函数对模型的输出进行操作，得到对数概率。然后，我们使用nll_loss()函数来计算负对数似然损失，其中log_probs是经过log_softmax操作后得到的对数概率向量，target是真实标签。最后，我们可以通过loss.item()来获取损失值。

总结来说，torch.nn.functional中的nll_loss()函数是用于计算交叉熵损失的函数。在深度学习中，交叉熵损失常被用来评估模型的输出与真实标签之间的差异。通过nll_loss()函数，我们可以很方便地计算损失，并在反向传播中使用它来更新模型的参数，从而提高模型的性能。