在Python中如何使用torchtext.vocabVectors()加载中文词向量
发布时间:2024-01-09 09:47:22
在Python中,可以使用torchtext.vocab.Vectors()函数来加载预训练的词向量。下面是一个加载中文词向量的使用示例:
from torchtext.vocab import Vectors
# 创建词向量预处理对象
vectors = Vectors(name='path/to/chinese/word/vectors.txt')
# 加载预训练的词向量
chinese_embeddings = vectors.get_vecs_by_tokens(['词1', '词2', '词3'])
# 打印词向量维度和示例
print(f"词向量维度:{chinese_embeddings.size()}")
print(f"词1的词向量:{chinese_embeddings[0]}")
print(f"词2的词向量:{chinese_embeddings[1]}")
print(f"词3的词向量:{chinese_embeddings[2]}")
在上面的代码中,首先创建了一个Vectors对象,其中的name参数指定了词向量文件的路径。接着,使用get_vecs_by_tokens()函数加载指定词汇的词向量,参数是一个词汇列表。最后,打印词向量的维度和一些示例词汇的词向量。
请确保将path/to/chinese/word/vectors.txt替换为实际的中文词向量文件路径,并将['词1', '词2', '词3']替换为你想要查找的实际词汇列表。
