Python文本处理：统计一个文本文件中每个单词出现的次数

发布时间：2023-12-04 22:17:33

要统计一个文本文件中每个单词出现的次数，我们可以使用Python中的字典数据结构来实现。下面是一个例子，演示了如何统计一个文本文件中每个单词出现的次数：

def count_word_occurrences(file_path):
    # 创建一个空字典，用于存储单词和其出现次数
    word_count = {}

    # 打开文本文件
    with open(file_path, 'r') as file:
        # 逐行读取文件内容
        for line in file:
            # 移除行末的换行符和其他空格字符
            line = line.strip()
            # 将行拆分为单词列表
            words = line.split()
            
            # 遍历单词列表
            for word in words:
                # 统计每个单词的出现次数
                if word in word_count:
                    word_count[word] += 1
                else:
                    word_count[word] = 1

    return word_count

# 示例用法
file_path = 'example.txt'  # 替换为你的文本文件路径
word_count = count_word_occurrences(file_path)

# 打印每个单词及其出现次数
for word, count in word_count.items():
    print(f"{word}: {count}")

在这个例子中，我们定义了一个名为count_word_occurrences的函数，该函数接受一个文本文件路径作为参数。函数首先创建一个空的字典word_count，用于存储每个单词和其出现次数。

然后，我们使用with open语句打开文本文件，并逐行读取文件内容。为了处理每一行，我们首先使用strip方法移除行末的换行符和其他空格字符，然后使用split方法将行拆分为单词列表。

接下来，我们遍历单词列表，并使用字典的键值对结构来统计每个单词的出现次数。如果单词已经在字典中存在，我们将其对应的值加1；否则，我们将单词添加到字典中，并将其值初始化为1。

最后，函数返回统计好的字典word_count。

在示例用法部分，我们定义了一个文件路径file_path（请将其替换为你自己的文本文件路径），然后调用count_word_occurrences函数来统计单词出现次数。最后，我们遍历统计结果的字典，并打印每个单词及其出现次数。

希望这个例子对你有所帮助！如果你有任何其他问题，请随时提问。