Python中计算文本文件中单词的数量和平均长度
发布时间:2024-01-11 12:10:09
在Python中,我们可以使用以下步骤计算文本文件中单词的数量和平均长度:
1. 打开文本文件并读取内容。
2. 根据空格或其他分隔符将文本分割成单词列表。
3. 计算单词列表的长度,即单词的数量。
4. 遍历单词列表,计算每个单词的长度,将所有单词的长度相加。
5. 将所有单词的长度相加除以单词的数量,得到平均长度。
以下是一个完整的示例代码:
def calculate_word_count_and_avg_length(file_path):
# 打开文本文件并读取内容
with open(file_path, 'r') as file:
content = file.read()
# 根据空格或其他分隔符将文本分割成单词列表
words = content.split()
# 计算单词列表的长度,即单词的数量
word_count = len(words)
# 遍历单词列表,计算每个单词的长度,将所有单词的长度相加
total_length = sum(len(word) for word in words)
# 将所有单词的长度相加除以单词的数量,得到平均长度
avg_length = total_length / word_count
return word_count, avg_length
# 示例用法
file_path = 'example.txt' # 文件路径
word_count, avg_length = calculate_word_count_and_avg_length(file_path)
print("单词数量:", word_count)
print("平均长度:", avg_length)
在示例中,我们首先定义了一个名为calculate_word_count_and_avg_length的函数,该函数接受一个文件路径作为参数。在函数内部,我们使用open函数打开文本文件并读取内容。接下来,我们使用split方法将文本分割成单词列表。然后,我们使用len函数计算单词列表的长度,并使用生成器表达式计算所有单词的长度总和。最后,我们将所有单词的长度总和除以单词的数量,得到平均长度。最后,我们使用示例文件路径调用该函数,并打印结果。
请注意,示例代码仅计算了以空格作为分隔符的单词数量和平均长度。如需根据其他分隔符进行计算,请相应地修改代码中的split函数的参数。
