欢迎访问宙启技术站
智能推送

Python函数:计算字符串中的词频

发布时间:2023-06-16 12:32:41

Python是一门流行的编程语言,有很多强大的功能和特性。其中之一是计算字符串中的词频。在这篇文章中,我们将介绍如何使用Python编写一个函数来计算字符串中每个单词出现的次数。

首先,我们需要定义一个函数。我们将称之为count_words。这个函数将接受一个字符串作为参数,并返回一个字典,其中包含每个单词和它在字符串中出现的次数。

代码如下所示:

def count_words(string):
    # 创建一个空字典来存储每个单词出现的次数
    word_counts = {}
    # 将字符串转换为小写,以便我们可以忽略大小写
    string = string.lower()
    # 将字符串分割成单词列表
    words = string.split()
    # 遍历单词列表并对每个单词进行计数
    for word in words:
        # 如果单词已经在字典中存在,则将计数器增加1
        if word in word_counts:
            word_counts[word] += 1
        # 如果单词尚未在字典中,则将其添加到字典中并将计数器设置为1
        else:
            word_counts[word] = 1
    # 返回包含单词计数的字典
    return word_counts

现在,我们可以测试我们的函数并检查它是否返回了正确的结果。

我们将使用以下字符串进行测试:

string = "This is a test. This is only a test."

我们将使用以下代码调用count_words函数并打印结果:

word_counts = count_words(string)
print(word_counts)

输出应该如下所示:

{"this": 2, "is": 2, "a": 2, "test.": 1, "only": 1, "test.": 1}

结果显示此测试字符串中每个单词的出现次数。

现在,我们已经成功地计算了字符串中每个单词的出现次数,并且可以在自己的Python程序中使用该函数来处理文本数据。