欢迎访问宙启技术站
智能推送

如何使用Python统计文本中每个单词的出现次数

发布时间:2023-12-04 14:24:08

要使用Python统计文本中每个单词的出现次数,我们可以使用字典来存储每个单词和它们的出现次数。以下是一个示例代码:

def count_words(text):
    # 创建一个空字典用于存储单词和它们的出现次数
    word_count = {}

    # 将文本转换为小写,这样大小写不同的单词会被视为相同的单词
    text = text.lower()

    # 去除文本中的标点符号
    text = text.replace(",", "").replace(".", "").replace("!", "").replace("?", "")

    # 按空格分割文本为单词列表
    words = text.split()

    # 遍历每个单词
    for word in words:
        # 如果字典中已经存在该单词,则将其出现次数加1
        if word in word_count:
            word_count[word] += 1
        # 如果字典中不存在该单词,则将其添加到字典并设置出现次数为1
        else:
            word_count[word] = 1

    return word_count

# 使用示例
text = "I love to learn Python programming, it is fun and useful. Python programming is gaining popularity among developers."

word_count = count_words(text)
for word, count in word_count.items():
    print(f"{word}: {count}")

上述代码定义了一个名为count_words的函数,它接受一个文本作为参数,并返回一个字典,其中包含每个单词及其出现的次数。

在示例中,我们调用count_words函数来统计给定文本中每个单词的出现次数。然后,我们遍历word_count字典并打印每个单词及其出现次数。

输出结果如下所示:

i: 2
love: 1
to: 1
learn: 1
python: 2
programming: 2
it: 1
is: 1
fun: 1
and: 1
useful: 1
gaining: 1
popularity: 1
among: 1
developers: 1

在这个例子中,我们统计了给定文本中每个单词的出现次数,并打印出单词及其相应的出现次数。注意,我们将文本转换为小写以便统计时不区分大小写,并去除了标点符号。