欢迎访问宙启技术站
智能推送

Python中使用Pandas创建DataFrame数据结构的方法

发布时间:2024-01-03 22:43:22

Pandas是Python中的一个流行的数据处理和分析库,它提供了一个高效的数据结构DataFrame,能够轻松处理和操作大量的结构化数据。

在Python中,创建DataFrame有多种方法,下面将介绍几种常用的方法,并提供相应的使用示例:

1. 从字典创建DataFrame:

可以使用字典来创建DataFrame,其中字典的键将成为DataFrame的列名,而字典的值将成为相应列的数据。

import pandas as pd

data = {'Name': ['John', 'Alice', 'Mike'],
        'Age': [25, 28, 30],
        'Salary': [50000, 60000, 70000]}

df = pd.DataFrame(data)
print(df)

输出结果:

   Name  Age  Salary
0  John   25   50000
1 Alice   28   60000
2  Mike   30   70000

2. 从列表创建DataFrame:

可以使用列表来创建DataFrame,其中每个元素代表一列的数据。需要注意的是,列表的长度必须相等。

import pandas as pd

data = [['John', 25, 50000],
        ['Alice', 28, 60000],
        ['Mike', 30, 70000]]

df = pd.DataFrame(data, columns=['Name', 'Age', 'Salary'])
print(df)

输出结果:

   Name  Age  Salary
0  John   25   50000
1 Alice   28   60000
2  Mike   30   70000

3. 从CSV文件创建DataFrame:

可以使用pandas的read_csv函数,从CSV文件中读取数据并创建DataFrame对象。

import pandas as pd

df = pd.read_csv('data.csv')
print(df)

假设data.csv的内容如下:

Name,Age,Salary
John,25,50000
Alice,28,60000
Mike,30,70000

输出结果:

   Name  Age  Salary
0  John   25   50000
1 Alice   28   60000
2  Mike   30   70000

4. 从SQL查询创建DataFrame:

可以使用pandas的read_sql函数,从SQL查询结果中读取数据并创建DataFrame对象。

import pandas as pd
import sqlite3

connection = sqlite3.connect('database.db')
query = 'SELECT * FROM employees'
df = pd.read_sql(query, connection)
print(df)

输出结果:

   Name  Age  Salary
0  John   25   50000
1 Alice   28   60000
2  Mike   30   70000

5. 从多个Series创建DataFrame:

可以使用pandas的concat函数,将多个Series按列方向组合起来,形成一个DataFrame对象。

import pandas as pd

name = pd.Series(['John', 'Alice', 'Mike'])
age = pd.Series([25, 28, 30])
salary = pd.Series([50000, 60000, 70000])

df = pd.concat([name, age, salary], axis=1)
df.columns = ['Name', 'Age', 'Salary']
print(df)

输出结果:

   Name  Age  Salary
0  John   25   50000
1 Alice   28   60000
2  Mike   30   70000

以上是使用Pandas创建DataFrame数据结构的几种常用方法和相应的使用示例。Pandas提供了丰富的函数和方法,可以对DataFrame进行数据处理、转换和分析,让数据操作变得更加简单和高效。