Python函数库:如何使用pandas创建数据框?
Pandas是Python数据科学中最重要的第三方库之一。Pandas是面向列的数据处理库,它提供了强大的数据结构来处理各种不同类型的数据和数据格式。Pandas的数据结构包括Series和DataFrame。
在这篇文章中,我们将学习如何使用pandas创建数据框。数据框是一种广泛使用的数据结构,它类似于电子表格或SQL表。数据框由一组命名的列和一组标识行的索引组成。它们使用二维标签化数据来表示和操作。
下面是创建数据框的步骤:
步骤1:导入Pandas库
要使用Pandas库创建数据框,必须首先导入Pandas库。
导入Pandas库的代码如下:
import pandas as pd
步骤2:从列表或字典创建数据框
Pandas数据框可以从多个不同的数据来源中创建,包括CSV文件、数据库、Excel文件等。 在这里,我们将从Python列表或字典中创建数据框。
创建数据框的基本方式是从列表或字典中创建。
以下是从列表或字典创建数据框的示例:
从列表中创建数据框
假设我们有以下的列表,包括三个列“年份”,“月份”和“销售额”。
my_list = [['2020', 'Jan', 29.98], ['2020', 'Feb', 22.54], ['2020', 'Mar', 34.20],
['2021', 'Jan', 36.02], ['2021', 'Feb', 28.01], ['2021', 'Mar', 39.08]]
我们可以使用pandas.DataFrame()方法从列表中创建数据框。
df = pd.DataFrame(my_list, columns=['Year', 'Month', 'Sales'])
我们可以使用 print() 方法查看数据框,如下所示:
print(df)
结果:
Year Month Sales 0 2020 Jan 29.98 1 2020 Feb 22.54 2 2020 Mar 34.20 3 2021 Jan 36.02 4 2021 Feb 28.01 5 2021 Mar 39.08
从字典中创建数据框
另一种从Python数据结构创建数据框的方法是从字典中创建。下面是一个包含三个列数据的字典。
my_dict = {'Year': ['2020', '2020', '2020', '2021', '2021', '2021'],
'Month': ['Jan', 'Feb', 'Mar', 'Jan', 'Feb', 'Mar'],
'Sales': [29.98, 22.54, 34.20, 36.02, 28.01, 39.08]}
我们可以使用pandas.DataFrame()方法从字典中创建数据框。
df = pd.DataFrame(my_dict)
我们可以使用 print() 方法查看数据框,如下所示:
print(df)
结果:
Year Month Sales 0 2020 Jan 29.98 1 2020 Feb 22.54 2 2020 Mar 34.20 3 2021 Jan 36.02 4 2021 Feb 28.01 5 2021 Mar 39.08
步骤3:保存数据框
我们可以使用.to_csv()方法将数据框保存为CSV文件。
df.to_csv("sales_data.csv", index=False, header=True)
这将保存数据框为“sales_data.csv”文件。
现在,你已经知道如何使用Pandas库创建数据框。Pandas还提供了丰富的数据操作和转换方法,可以很容易地对数据进行处理、分析和可视化。
