欢迎访问宙启技术站
智能推送

Python文本处理:统计一个文本文件中每个单词出现的次数

发布时间:2023-12-04 22:17:33

要统计一个文本文件中每个单词出现的次数,我们可以使用Python中的字典数据结构来实现。下面是一个例子,演示了如何统计一个文本文件中每个单词出现的次数:

def count_word_occurrences(file_path):
    # 创建一个空字典,用于存储单词和其出现次数
    word_count = {}

    # 打开文本文件
    with open(file_path, 'r') as file:
        # 逐行读取文件内容
        for line in file:
            # 移除行末的换行符和其他空格字符
            line = line.strip()
            # 将行拆分为单词列表
            words = line.split()
            
            # 遍历单词列表
            for word in words:
                # 统计每个单词的出现次数
                if word in word_count:
                    word_count[word] += 1
                else:
                    word_count[word] = 1

    return word_count

# 示例用法
file_path = 'example.txt'  # 替换为你的文本文件路径
word_count = count_word_occurrences(file_path)

# 打印每个单词及其出现次数
for word, count in word_count.items():
    print(f"{word}: {count}")

在这个例子中,我们定义了一个名为count_word_occurrences的函数,该函数接受一个文本文件路径作为参数。函数首先创建一个空的字典word_count,用于存储每个单词和其出现次数。

然后,我们使用with open语句打开文本文件,并逐行读取文件内容。为了处理每一行,我们首先使用strip方法移除行末的换行符和其他空格字符,然后使用split方法将行拆分为单词列表。

接下来,我们遍历单词列表,并使用字典的键值对结构来统计每个单词的出现次数。如果单词已经在字典中存在,我们将其对应的值加1;否则,我们将单词添加到字典中,并将其值初始化为1。

最后,函数返回统计好的字典word_count

在示例用法部分,我们定义了一个文件路径file_path(请将其替换为你自己的文本文件路径),然后调用count_word_occurrences函数来统计单词出现次数。最后,我们遍历统计结果的字典,并打印每个单词及其出现次数。

希望这个例子对你有所帮助!如果你有任何其他问题,请随时提问。