欢迎访问宙启技术站
智能推送

Python函数库:如何使用pandas创建数据框?

发布时间:2023-05-24 18:57:32

Pandas是Python数据科学中最重要的第三方库之一。Pandas是面向列的数据处理库,它提供了强大的数据结构来处理各种不同类型的数据和数据格式。Pandas的数据结构包括Series和DataFrame。

在这篇文章中,我们将学习如何使用pandas创建数据框。数据框是一种广泛使用的数据结构,它类似于电子表格或SQL表。数据框由一组命名的列和一组标识行的索引组成。它们使用二维标签化数据来表示和操作。

下面是创建数据框的步骤:

步骤1:导入Pandas库

要使用Pandas库创建数据框,必须首先导入Pandas库。

导入Pandas库的代码如下:

import pandas as pd

步骤2:从列表或字典创建数据框

Pandas数据框可以从多个不同的数据来源中创建,包括CSV文件、数据库、Excel文件等。 在这里,我们将从Python列表或字典中创建数据框。

创建数据框的基本方式是从列表或字典中创建。

以下是从列表或字典创建数据框的示例:

从列表中创建数据框

假设我们有以下的列表,包括三个列“年份”,“月份”和“销售额”。

my_list = [['2020', 'Jan', 29.98], ['2020', 'Feb', 22.54], ['2020', 'Mar', 34.20],
           ['2021', 'Jan', 36.02], ['2021', 'Feb', 28.01], ['2021', 'Mar', 39.08]]

我们可以使用pandas.DataFrame()方法从列表中创建数据框。

df = pd.DataFrame(my_list, columns=['Year', 'Month', 'Sales'])

我们可以使用 print() 方法查看数据框,如下所示:

print(df)

结果:

   Year Month  Sales
0  2020   Jan  29.98
1  2020   Feb  22.54
2  2020   Mar  34.20
3  2021   Jan  36.02
4  2021   Feb  28.01
5  2021   Mar  39.08

从字典中创建数据框

另一种从Python数据结构创建数据框的方法是从字典中创建。下面是一个包含三个列数据的字典。

my_dict = {'Year': ['2020', '2020', '2020', '2021', '2021', '2021'],
           'Month': ['Jan', 'Feb', 'Mar', 'Jan', 'Feb', 'Mar'],
           'Sales': [29.98, 22.54, 34.20, 36.02, 28.01, 39.08]}

我们可以使用pandas.DataFrame()方法从字典中创建数据框。

df = pd.DataFrame(my_dict)

我们可以使用 print() 方法查看数据框,如下所示:

print(df)

结果:

   Year Month  Sales
0  2020   Jan  29.98
1  2020   Feb  22.54
2  2020   Mar  34.20
3  2021   Jan  36.02
4  2021   Feb  28.01
5  2021   Mar  39.08

步骤3:保存数据框

我们可以使用.to_csv()方法将数据框保存为CSV文件。

df.to_csv("sales_data.csv", index=False, header=True)

这将保存数据框为“sales_data.csv”文件。

现在,你已经知道如何使用Pandas库创建数据框。Pandas还提供了丰富的数据操作和转换方法,可以很容易地对数据进行处理、分析和可视化。