欢迎访问宙启技术站
智能推送

使用Python计算文本文件中句子的平均长度

发布时间:2024-01-11 12:08:38

下面是一个使用Python计算文本文件中句子的平均长度的例子。

def calculate_avg_sentence_length(file_path):
    num_sentences = 0
    total_length = 0
    
    with open(file_path, 'r') as file:
        for line in file:
            sentences = line.split('.')
            num_sentences += len(sentences)
            
            for sentence in sentences:
                words = sentence.split()
                total_length += len(words)
    
    avg_sentence_length = total_length / num_sentences
    return avg_sentence_length

file_path = 'example.txt'  # 替换为你的文件路径
avg_length = calculate_avg_sentence_length(file_path)
print('平均句子长度:', avg_length)

在上面的例子中,我们首先定义了一个函数calculate_avg_sentence_length,该函数接受一个文件路径作为参数。函数的目标是计算文本文件中句子的平均长度。

在函数中,我们使用with open语句打开文件,并通过for循环逐行读取文件的内容。对于每一行,我们使用句号.分割成多个句子,并统计句子的数量。然后,对于每个句子,我们使用空格分割成多个单词,并统计单词的数量。我们使用变量total_length记录所有句子中的单词数量,使用变量num_sentences记录句子的数量。

计算得到平均句子长度的公式为平均句子长度 = 所有句子中的单词数量 / 句子的数量

最后,我们调用calculate_avg_sentence_length函数并打印平均句子长度的结果。

请确保将file_path替换为你的文本文件的实际路径。

注意:上述代码的计算方式是将句子中的所有单词都计入平均句子长度中。如果你想排除某些特殊字符或忽略单词数量较少的句子,你可以根据具体需求对代码进行适当修改。