利用pad_sequence()函数处理不同长度序列的方法分享

发布时间：2023-12-27 03:07:49

pad_sequence()函数是torch.nn.utils中的一个方法，用于将一组不同长度的序列填充到相同长度。可以用于处理不定长的文本数据、时间序列数据等。

使用pad_sequence()函数，需要将输入的序列转化为一个list，其中每个元素是一个Tensor，表示一个序列。这些序列可以是torch.Tensor或者list。

pad_sequence()函数有三个参数：

- sequences：要填充的序列列表。

- batch_first：是否将输出的Tensor的batch维度放在维，默认为False。

- padding_value：填充值，默认为0。

pad_sequence()函数首先会按照序列的长度进行递减排序，然后将所有序列填充到与最长序列相同的长度，使用padding_value进行填充。如果不指定padding_value，则默认使用0进行填充。

下面是一个使用pad_sequence()函数处理不同长度序列的例子：

import torch
from torch.nn.utils.rnn import pad_sequence

# 定义不定长序列
seqs = [torch.tensor([1, 2, 3]), torch.tensor([4, 5]), torch.tensor([6])]
# 或者使用list表示序列
# seqs = [[1, 2, 3], [4, 5], [6]]

# 使用pad_sequence对序列进行填充
padded_seqs = pad_sequence(seqs, batch_first=True, padding_value=0)

print("原始序列：", seqs)
print("填充后的序列：", padded_seqs)
print("填充后的序列大小：", padded_seqs.size())

运行上面的代码，输出如下：

原始序列： [tensor([1, 2, 3]), tensor([4, 5]), tensor([6])]
填充后的序列： tensor([[1, 2, 3],
        [4, 5, 0],
        [6, 0, 0]])
填充后的序列大小： torch.Size([3, 3])

在这个例子中，我们定义了一个不定长序列的列表seqs。其中，个序列的长度为3，第二个序列的长度为2，第三个序列的长度为1。然后，我们使用pad_sequence()函数将其填充到最长序列的长度，即3。同时，我们指定了batch_first=True，将输出的Tensor的batch维度放在维，即维的大小为3。填充的值为0。

最后的输出显示了填充前的原始序列、填充后的序列，以及填充后的序列的大小。

总结来说，pad_sequence()函数是用来处理不同长度序列的方法之一，主要用于填充不定长序列到相同长度的操作。这在深度学习任务中经常使用，能够使得具有不同长度的序列可以直接作为模型的输入，提高了数据的利用效率。