欢迎访问宙启技术站
智能推送

Python中Pandas库的常用函数及其用法介绍

发布时间:2023-06-13 09:27:47

Pandas是一个基于NumPy的Python数据分析库,该库提供了高效的数据结构和数据分析工具。Pandas库中的常用函数可以方便地对数据进行处理、转换和分析,本文将对其中一些常用的函数进行介绍。

1. Series

Series是一种类似于数组的数据结构,将一组数据和对应的标签存储在一起,可以用于保存一维数组类型的数据。以下是Series的一些常用函数:

- series = pd.Series(data, index=index)

创建一个Series数据结构,其中data为数据,index为索引。

- series.values

返回Series中的数据。

- series.index

返回Series中的索引。

- series.head(n) / series.tail(n)

返回Series中的前n个/后n个数据。

- series.describe()

返回Series中数据的基本统计量,如count、mean、std、min、max等。

2. DataFrame

DataFrame是Pandas中最常用的数据结构,类似于Excel表格,可以用于保存二维数组类型的数据。以下是DataFrame的一些常用函数:

- df = pd.DataFrame(data, index=index, columns=columns)

创建一个DataFrame数据结构,其中data为数据,index为行索引,columns为列索引。

- df.head(n) / df.tail(n)

返回DataFrame中的前n行/后n行数据。

- df.info()

返回DataFrame的基本信息,如行数、列数、数据类型等。

- df.describe()

返回DataFrame中数值型数据的基本统计量,如count、mean、std、min、max等。

- df.columns

返回DataFrame中的列名。

- df.index

返回DataFrame中的行索引。

- df[‘column’]

返回DataFrame中指定列的数据。

3. 数据导入和导出

Pandas可以读取和写入多种格式的数据文件,如CSV文件、Excel文件、JSON文件等。以下是一些常用的文件读取和写入函数:

- pd.read_csv(filename)

读取CSV文件。

- pd.read_excel(filename)

读取Excel文件。

- df.to_csv(filename)

将DataFrame中的数据写入CSV文件。

- df.to_excel(filename)

将DataFrame中的数据写入Excel文件。

4. 数据筛选和操作

可以使用Pandas对数据进行筛选和操作,以下是一些常用的函数:

- df[df[‘column’] > value]

返回满足条件的行数据。

- df.iloc[row_index, column_index]

返回指定行列的数据。

- df.loc[row_name, column_name]

返回指定行列的数据。

- df.sort_values(by=[‘column’], ascending=False)

对指定列的数据进行降序排序。

- df.dropna()

删除包含缺失值的行。

5. 数据分组和聚合

可以将数据按照某些标准进行分组,然后对每组数据进行聚合操作,以下是一些常用的函数:

- df.groupby(‘column’).mean()

按照指定列对数据进行分组,并计算每组的平均值。

- df.groupby(‘column’).sum()

按照指定列对数据进行分组,并计算每组的总和。

- df.groupby(‘column’).count()

按照指定列对数据进行分组,并计算每组的个数。

以上是Pandas库中一些常用函数的介绍,它们可以帮助我们高效地对数据进行处理和分析。在实际应用中,我们可以根据具体的需求选择合适的函数进行操作。