使用Python计算文本文件中句子的平均长度
发布时间:2024-01-11 12:08:38
下面是一个使用Python计算文本文件中句子的平均长度的例子。
def calculate_avg_sentence_length(file_path):
num_sentences = 0
total_length = 0
with open(file_path, 'r') as file:
for line in file:
sentences = line.split('.')
num_sentences += len(sentences)
for sentence in sentences:
words = sentence.split()
total_length += len(words)
avg_sentence_length = total_length / num_sentences
return avg_sentence_length
file_path = 'example.txt' # 替换为你的文件路径
avg_length = calculate_avg_sentence_length(file_path)
print('平均句子长度:', avg_length)
在上面的例子中,我们首先定义了一个函数calculate_avg_sentence_length,该函数接受一个文件路径作为参数。函数的目标是计算文本文件中句子的平均长度。
在函数中,我们使用with open语句打开文件,并通过for循环逐行读取文件的内容。对于每一行,我们使用句号.分割成多个句子,并统计句子的数量。然后,对于每个句子,我们使用空格分割成多个单词,并统计单词的数量。我们使用变量total_length记录所有句子中的单词数量,使用变量num_sentences记录句子的数量。
计算得到平均句子长度的公式为平均句子长度 = 所有句子中的单词数量 / 句子的数量。
最后,我们调用calculate_avg_sentence_length函数并打印平均句子长度的结果。
请确保将file_path替换为你的文本文件的实际路径。
注意:上述代码的计算方式是将句子中的所有单词都计入平均句子长度中。如果你想排除某些特殊字符或忽略单词数量较少的句子,你可以根据具体需求对代码进行适当修改。
