欢迎访问宙启技术站
智能推送

Pandas常用函数和方法大全,让你轻松处理数据

发布时间:2023-06-27 04:17:48

Pandas是Python中广受欢迎的数据处理库,它可以处理大量的数据和各种类型的数据。它是基于Numpy构建的,因此它可以高效地处理类似于Excel表的二维表数据。在数据清洗、处理、分析、预测和机器学习等许多领域,Pandas都是非常强大的。这篇文章将为你介绍一些Pandas常用的函数和方法,让你更轻松地处理数据。

1. 读取数据函数

Pandas提供了多种读取数据的函数,常见的例如read_csv(), read_excel()和read_sql()等。这些函数可以将数据读取为DataFrame对象,方便后续的数据处理和分析。如:

import pandas as pd
df = pd.read_csv('data.csv')

2. 显示数据函数

Pandas提供了多种显示数据的函数,如head(), tail(), sample()等。可以用它们查看数据集的前几行、后几行或者随机几行数据。如:

df.head()  # 显示前几行数据
df.tail()  # 显示后几行数据
df.sample(5)  # 显示随机5条数据

3. 数据摘要函数

Pandas提供了多种数据摘要函数,如describe()、sum()、count()、mean()等。可以用它们生成数据的基本统计信息,如数据条数、平均值、方差、最小值、最大值等。如:

df.describe()  # 生成基本统计信息
df.sum()  # 计算每列数值总和
df.count()  # 统计每列数据个数
df.mean()  # 计算每列数值的平均值

4. 数据查询函数

Pandas提供了多种查询数据的函数,如loc[]、iloc[]、query()和where()等。loc[]和iloc[]可以基于标签或索引位置选择数据,query()则可以用类似SQL的语句查询数据,where()可以按条件筛选数据。如:

df.loc[df['name'] == '张三']  # 使用标签筛选数据
df.iloc[3, :]  # 使用索引位置筛选数据
df.query('age > 20 and age < 30')  # 按条件查询数据
df.where(df['age'] > 20)  # 按条件筛选数据

5. 数据合并函数

Pandas提供了多种合并数据的函数,如merge()、concat()和join()等。可以用它们将多个数据集合并成一个,使得数据分析更加方便。如:

df1 = pd.DataFrame({'id': [1, 2, 3], 'name': ['张三', '李四', '王五']})
df2 = pd.DataFrame({'id': [1, 4, 5], 'age': [20, 30, 40]})
df3 = pd.merge(df1, df2, on='id', how='outer')  # 使用外连接合并数据
df4 = pd.concat([df1, df2], axis=1)  # 沿列方向合并数据
df5 = df1.join(df2.set_index('id'), on='id')  # 使用连接函数合并数据

6. 数据清洗函数

Pandas提供了多种清洗数据的函数,如dropna()、fillna()、drop_duplicates()等。可以用它们去除重复数据、替换缺失值、去除空行等。如:

df.drop_duplicates()  # 去除重复数据
df.dropna()  # 去除含有空值的行
df.fillna(0)  # 将空值替换为0
df.dropna(thresh=3)  # 至少有3个非空值保留数据行

7. 数据转化函数

Pandas提供了多种数据转化的函数,如apply()、map()和replace()等。可以用它们将数据类型转换、对数据进行计算和替换数据值。如:

df['age'] = df['age'].astype('float')  # 将age列数据类型转化为float
df['age'].apply(lambda x: x**2)  # 将age列数据进行平方运算
df['gender'].map({'male': 0, 'female': 1})  # 将gender列的分类数据进行映射
df.replace({'gender': {'male': 1, 'female': 2}})  # 替换gender列的分类数据

总结:

这些是Pandas常用的一些函数和方法,能够帮助你更有效地分析和处理数据。利用Pandas中的这些数据操作函数,千万个数据也不在话下。当然,Pandas的函数和方法远不止这些,若想要学习更多Pandas相关知识,可以去查阅官方文档。