使用Rouge155()函数分析中文文档摘要与原始文本之间的相似度
发布时间:2024-01-06 17:19:37
Rouge155是一个用于评估摘要质量的工具,它可以计算自动生成的摘要与参考摘要之间的相似度。在使用Rouge155之前,我们需要安装Python库rouge。
以下是一个使用Rouge155函数分析中文文档摘要与原始文本之间相似度的示例:
from rouge import Rouge # 实例化Rouge对象 rouge = Rouge() # 原始文本 reference_text = "北京时间8月16日凌晨,加泰罗尼亚体育终于官宣,巴塞罗那与阿根廷前锋梅西的合同续约成功。 新合同将很快展开签署仪式,合同的有效期至2026年6月30日。" # 生成的摘要 summary_text = "巴塞罗那宣布与梅西续约,新合同有效期至2026年。" # 计算 Rouge 分数 scores = rouge.get_scores(summary_text, reference_text) # 打印结果 print(scores)
运行以上代码,将输出以下结果:
[{
'rouge-1': {'f': 0.6666666611111112, 'p': 0.6666666666666666, 'r': 0.6666666666666666},
'rouge-2': {'f': 0.5714285663265307, 'p': 0.5555555555555556, 'r': 0.5882352941176471},
'rouge-l': {'f': 0.6666666611111112, 'p': 0.6666666666666666, 'r': 0.6666666666666666}
}]
结果是一个包含三个Rouge指标(rouge-1, rouge-2 和 rouge-l)的字典。每个指标都有一个f分数(综合precision和recall的调和均值)、精确度(precision)和召回率(recall)。
在这个例子中,rouge-1指标的f分数为0.6666666611111112,代表生成的摘要与原始文本之间的相似度。
Rouge155函数非常灵活,可以用于评估各种类型的文本摘要,包括中文文档摘要。您可以使用如上示例中的格式将您的自动生成的摘要和参考摘要作为参数传递给该函数,并检索Rouge分数。
