Python中Pandas库的常用函数及其用法介绍

发布时间：2023-06-13 09:27:47

Pandas是一个基于NumPy的Python数据分析库，该库提供了高效的数据结构和数据分析工具。Pandas库中的常用函数可以方便地对数据进行处理、转换和分析，本文将对其中一些常用的函数进行介绍。

1. Series

Series是一种类似于数组的数据结构，将一组数据和对应的标签存储在一起，可以用于保存一维数组类型的数据。以下是Series的一些常用函数：

- series = pd.Series(data, index=index)

创建一个Series数据结构，其中data为数据，index为索引。

- series.values

返回Series中的数据。

- series.index

返回Series中的索引。

- series.head(n) / series.tail(n)

返回Series中的前n个/后n个数据。

- series.describe()

返回Series中数据的基本统计量，如count、mean、std、min、max等。

2. DataFrame

DataFrame是Pandas中最常用的数据结构，类似于Excel表格，可以用于保存二维数组类型的数据。以下是DataFrame的一些常用函数：

- df = pd.DataFrame(data, index=index, columns=columns)

创建一个DataFrame数据结构，其中data为数据，index为行索引，columns为列索引。

- df.head(n) / df.tail(n)

返回DataFrame中的前n行/后n行数据。

- df.info()

返回DataFrame的基本信息，如行数、列数、数据类型等。

- df.describe()

返回DataFrame中数值型数据的基本统计量，如count、mean、std、min、max等。

- df.columns

返回DataFrame中的列名。

- df.index

返回DataFrame中的行索引。

- df[‘column’]

返回DataFrame中指定列的数据。

3. 数据导入和导出

Pandas可以读取和写入多种格式的数据文件，如CSV文件、Excel文件、JSON文件等。以下是一些常用的文件读取和写入函数：

- pd.read_csv(filename)

读取CSV文件。

- pd.read_excel(filename)

读取Excel文件。

- df.to_csv(filename)

将DataFrame中的数据写入CSV文件。

- df.to_excel(filename)

将DataFrame中的数据写入Excel文件。

4. 数据筛选和操作

可以使用Pandas对数据进行筛选和操作，以下是一些常用的函数：

- df[df[‘column’] > value]

返回满足条件的行数据。

- df.iloc[row_index, column_index]

返回指定行列的数据。

- df.loc[row_name, column_name]

返回指定行列的数据。

- df.sort_values(by=[‘column’], ascending=False)

对指定列的数据进行降序排序。

- df.dropna()

删除包含缺失值的行。

5. 数据分组和聚合

可以将数据按照某些标准进行分组，然后对每组数据进行聚合操作，以下是一些常用的函数：

- df.groupby(‘column’).mean()

按照指定列对数据进行分组，并计算每组的平均值。

- df.groupby(‘column’).sum()

按照指定列对数据进行分组，并计算每组的总和。

- df.groupby(‘column’).count()

按照指定列对数据进行分组，并计算每组的个数。

以上是Pandas库中一些常用函数的介绍，它们可以帮助我们高效地对数据进行处理和分析。在实际应用中，我们可以根据具体的需求选择合适的函数进行操作。