欢迎访问宙启技术站
智能推送

用Python编写一个简单的分析CSV文件的脚本

发布时间:2023-12-04 17:46:01

下面是一个用Python编写的简单的分析CSV文件的脚本,它实现了读取CSV文件、计算列平均值和最大值的功能:

import csv

def analyze_csv(file_path):
    # 读取CSV文件
    with open(file_path, 'r') as file:
        csv_reader = csv.reader(file)
        header = next(csv_reader)  # 获取表头
        data = [row for row in csv_reader]  # 获取数据

    # 计算列平均值和最大值
    num_columns = len(header)
    column_sum = [0] * num_columns
    column_count = [0] * num_columns
    column_max = [-float('inf')] * num_columns

    for row in data:
        for i, value in enumerate(row):
            if value.isdigit():
                value = int(value)
                column_sum[i] += value
                column_count[i] += 1
                column_max[i] = max(column_max[i], value)

    # 计算平均值
    column_average = [sum/count if count > 0 else 0 for sum, count in zip(column_sum, column_count)]

    # 输出结果
    print("表头:", header)
    print("列平均值:", column_average)
    print("列最大值:", column_max)

# 使用例子
if __name__ == "__main__":
    file_path = "data.csv"
    analyze_csv(file_path)

在这个脚本中,先使用csv.reader函数读取CSV文件,从中获取表头和数据。然后,通过遍历数据的每一行,遍历每一列的值,计算每列的总和、计数和最大值。最后,计算出每列的平均值,并将结果输出。

在使用例子中,你需要将file_path变量修改为你要分析的CSV文件的路径。然后,运行脚本就会输出各列的平均值和最大值。

这是一个简单的CSV文件分析脚本,你可以根据自己的需求进行改进,添加更多的分析功能。例如,你可以计算每列的最小值、中位数、标准差等。你还可以对数据进行排序、筛选等操作,以满足不同的分析需求。