欢迎访问宙启技术站
智能推送

Python的读取CSV文件函数-read_csv()

发布时间:2023-07-01 15:52:12

读取CSV文件是Python中常见的操作之一。Python提供了一种简便的方法,即使用pandas库中的read_csv()函数。

read_csv()函数用于从CSV文件中读取数据,并返回一个DataFrame对象。DataFramepandas库中一个非常有用的数据结构,类似于电子表格或数据库中的表格,可以轻松处理和分析数据。

下面是read_csv()函数的基本语法:

pandas.read_csv(filepath_or_buffer, sep=',', delimiter=None, header='infer', names=None, index_col=None, usecols=None)

参数说明:

- filepath_or_buffer:CSV文件的路径或文件对象。文件路径可以是相对路径或绝对路径。

- sep:分隔符,默认为逗号。可以根据CSV文件的实际情况调整。

- delimiter:另一种指定分隔符的方式。如果sep参数已经被指定,delimiter则会被忽略。

- header:指定CSV文件中哪一行作为列名,默认为infer,意味着将 行作为列名。可以设置为None,表示没有列名。

- names:指定列名列表。如果header=None,则可以自定义列名。

- index_col:指定某列作为索引列。默认为None,不使用任何列作为索引列。

- usecols:指定读取哪些列。可以是列名列表,也可以是列序号列表。

例如,假设我们有一个名为data.csv的CSV文件,内容如下:

id, name, age, gender
1, Tom, 21, M
2, Jerry, 25, M
3, Alice, 22, F
4, Bob, 24, M

我们可以使用read_csv()函数读取该文件,并指定相应的参数:

import pandas as pd

df = pd.read_csv('data.csv', sep=',', header=0)

print(df)

运行以上代码,会输出如下结果:

   id   name   age  gender
0   1    Tom    21       M
1   2  Jerry    25       M
2   3  Alice    22       F
3   4    Bob    24       M

以上代码将CSV文件读取为一个DataFrame对象,并将其赋值给变量df。然后,通过print(df)打印出DataFrame的内容。

通过DataFrame对象,我们可以方便地进行数据分析、处理和操作。