Python的读取CSV文件函数-read_csv()
发布时间:2023-07-01 15:52:12
读取CSV文件是Python中常见的操作之一。Python提供了一种简便的方法,即使用pandas库中的read_csv()函数。
read_csv()函数用于从CSV文件中读取数据,并返回一个DataFrame对象。DataFrame是pandas库中一个非常有用的数据结构,类似于电子表格或数据库中的表格,可以轻松处理和分析数据。
下面是read_csv()函数的基本语法:
pandas.read_csv(filepath_or_buffer, sep=',', delimiter=None, header='infer', names=None, index_col=None, usecols=None)
参数说明:
- filepath_or_buffer:CSV文件的路径或文件对象。文件路径可以是相对路径或绝对路径。
- sep:分隔符,默认为逗号。可以根据CSV文件的实际情况调整。
- delimiter:另一种指定分隔符的方式。如果sep参数已经被指定,delimiter则会被忽略。
- header:指定CSV文件中哪一行作为列名,默认为infer,意味着将 行作为列名。可以设置为None,表示没有列名。
- names:指定列名列表。如果header=None,则可以自定义列名。
- index_col:指定某列作为索引列。默认为None,不使用任何列作为索引列。
- usecols:指定读取哪些列。可以是列名列表,也可以是列序号列表。
例如,假设我们有一个名为data.csv的CSV文件,内容如下:
id, name, age, gender 1, Tom, 21, M 2, Jerry, 25, M 3, Alice, 22, F 4, Bob, 24, M
我们可以使用read_csv()函数读取该文件,并指定相应的参数:
import pandas as pd
df = pd.read_csv('data.csv', sep=',', header=0)
print(df)
运行以上代码,会输出如下结果:
id name age gender 0 1 Tom 21 M 1 2 Jerry 25 M 2 3 Alice 22 F 3 4 Bob 24 M
以上代码将CSV文件读取为一个DataFrame对象,并将其赋值给变量df。然后,通过print(df)打印出DataFrame的内容。
通过DataFrame对象,我们可以方便地进行数据分析、处理和操作。
