欢迎访问宙启技术站
智能推送

使用fuzzywuzzy.process进行中文字符串相似度比较的Python代码示例

发布时间:2023-12-28 02:15:27

FuzzyWuzzy是一个Python库,用于计算字符串之间的相似度。它提供了一种简单的方法来比较两个字符串之间的相似性,并返回一个匹配度分数。

下面是一个使用FuzzyWuzzy进行中文字符串相似度比较的Python代码示例:

from fuzzywuzzy import fuzz, process

# 示例数据
choices = ["苹果手机", "华为手机", "小米手机", "三星手机", "魅族手机"]

# 目标字符串
target = "我想买个手机"

# 使用fuzzywuzzy.process.extractOne方法找出与目标字符串最相似的选项
best_match = process.extractOne(target, choices)

# 输出结果
print("目标字符串:", target)
print("最匹配的选项:", best_match[0])
print("相似度分数:", best_match[1])

# 使用fuzzywuzzy.fuzz.ratio方法计算两个字符串之间的相似度
similarity = fuzz.ratio(target, best_match[0])

# 输出结果
print("相似度:", similarity)

上述代码中,我们首先定义了示例数据(choices)和目标字符串(target)。然后使用fuzzywuzzy.process.extractOne方法找出与目标字符串最相似的选项,并将结果存储在best_match变量中。接着,我们输出了目标字符串、最匹配的选项及其相似度分数。

此外,我们还使用fuzzywuzzy.fuzz.ratio方法计算了目标字符串和最匹配选项之间的相似度,并将结果存储在similarity变量中。最后,输出了字符串的相似度。

请注意,使用FuzzyWuzzy进行中文字符串相似度比较时,需要确保已安装中文分词器(如jieba)。