欢迎访问宙启技术站
智能推送

Python中计算文本文件中单词的数量和平均长度

发布时间:2024-01-11 12:10:09

在Python中,我们可以使用以下步骤计算文本文件中单词的数量和平均长度:

1. 打开文本文件并读取内容。

2. 根据空格或其他分隔符将文本分割成单词列表。

3. 计算单词列表的长度,即单词的数量。

4. 遍历单词列表,计算每个单词的长度,将所有单词的长度相加。

5. 将所有单词的长度相加除以单词的数量,得到平均长度。

以下是一个完整的示例代码:

def calculate_word_count_and_avg_length(file_path):
    # 打开文本文件并读取内容
    with open(file_path, 'r') as file:
        content = file.read()
    
    # 根据空格或其他分隔符将文本分割成单词列表
    words = content.split()
    
    # 计算单词列表的长度,即单词的数量
    word_count = len(words)
    
    # 遍历单词列表,计算每个单词的长度,将所有单词的长度相加
    total_length = sum(len(word) for word in words)
    
    # 将所有单词的长度相加除以单词的数量,得到平均长度
    avg_length = total_length / word_count
    
    return word_count, avg_length

# 示例用法
file_path = 'example.txt'  # 文件路径
word_count, avg_length = calculate_word_count_and_avg_length(file_path)
print("单词数量:", word_count)
print("平均长度:", avg_length)

在示例中,我们首先定义了一个名为calculate_word_count_and_avg_length的函数,该函数接受一个文件路径作为参数。在函数内部,我们使用open函数打开文本文件并读取内容。接下来,我们使用split方法将文本分割成单词列表。然后,我们使用len函数计算单词列表的长度,并使用生成器表达式计算所有单词的长度总和。最后,我们将所有单词的长度总和除以单词的数量,得到平均长度。最后,我们使用示例文件路径调用该函数,并打印结果。

请注意,示例代码仅计算了以空格作为分隔符的单词数量和平均长度。如需根据其他分隔符进行计算,请相应地修改代码中的split函数的参数。