如何在Pandas中读取sql脚本

发布时间：2023-05-18 22:00:31

在Pandas中，可以使用read_sql方法将SQL查询结果读取为DataFrame对象。它支持从各种SQL来源读取数据，包括SQLite、MySQL、PostgreSQL等。

如果你要读取一个SQL脚本，先需要将脚本中的查询语句执行，然后将结果读取为DataFrame。下面介绍两种方法实现这个过程。

方法1：使用pandas.read_sql()

pandas.read_sql()可以直接从数据库中读取数据。因此，要先将SQL脚本中的查询语句执行并存到数据库中，然后使用pandas.read_sql()读取查询结果。具体步骤如下：

1.使用Python的sqlite3或其他数据库连接库连接数据库。这里以sqlite3为例：

import sqlite3

conn = sqlite3.connect('test.db')

2.执行SQL脚本中的查询语句并将结果存入一个数据表。以SELECT语句为例：

query = 'SELECT * FROM my_table'

result = conn.execute(query)

conn.execute('CREATE TABLE my_temp_table AS ' + query)

3.使用pandas.read_sql()读取数据表内容并生成DataFrame对象：

import pandas as pd

df = pd.read_sql('SELECT * FROM my_temp_table', conn)

4.删除临时数据表：

conn.execute('DROP TABLE IF EXISTS my_temp_table')

完整代码如下：

import sqlite3

import pandas as pd

# 连接数据库

conn = sqlite3.connect('test.db')

# 执行查询语句并将结果存入数据表

query = 'SELECT * FROM my_table'

result = conn.execute(query)

conn.execute('CREATE TABLE my_temp_table AS ' + query)

# 读取数据表内容并生成DataFrame

df = pd.read_sql('SELECT * FROM my_temp_table', conn)

# 删除临时数据表

conn.execute('DROP TABLE IF EXISTS my_temp_table')

方法2：使用pandas.io.sql.execute()

pandas.io.sql.execute()可以直接执行SQL查询语句，并返回查询结果的iterator对象。可以通过iterator对象的fetchall()方法获取查询结果，再将结果转换为DataFrame。具体步骤如下：

1.使用Python的sqlite3或其他数据库连接库连接数据库。这里以sqlite3为例：

import sqlite3

conn = sqlite3.connect('test.db')

2.执行SQL脚本中的查询语句并获取iterator对象：

query = 'SELECT * FROM my_table'

result = pd.io.sql.execute(query, conn)

3.将查询结果转换为DataFrame：

df = pd.DataFrame(result.fetchall(), columns=result.keys())

完整代码如下：

import sqlite3

import pandas as pd

# 连接数据库

conn = sqlite3.connect('test.db')

# 执行查询语句并获取iterator

query = 'SELECT * FROM my_table'

result = pd.io.sql.execute(query, conn)

# 将查询结果转换为DataFrame

df = pd.DataFrame(result.fetchall(), columns=result.keys())

注意事项：

- 在数据库连接语句中，要根据不同的数据库类型获取相应的连接信息。

- 在读取查询结果时，要注意列名和列数与查询语句中是否一致。

- SQL脚本中的查询语句需要是可执行的，否则会报错。