Python中的数据可视化函数和库用法
发布时间:2023-06-09 00:35:04
Python作为一种高级编程语言,在数据可视化方面已拥有成熟的库和函数。本文将介绍Python中常用的数据可视化函数和库的用法。
1. Matplotlib
Matplotlib是Python的一种绘图库,提供了一系列绘图函数,可用于创建各种各样的静态、动态、交互式图表。它是Python中最常用的数据可视化工具之一。
(1)柱状图
柱状图是Matplotlib中最常用的图表之一,用于描述连续变量的分布情况。以下是一个简单的实现:
import matplotlib.pyplot as plt x = [4, 8, 12, 16, 20] y = [3, 7, 15, 19, 22] plt.bar(x, y, align='center') plt.show()
该代码会生成一个简单的柱状图,x轴是4, 8, 12, 16, 20,y轴是3, 7, 15, 19, 22。
(2)直方图
直方图可以展示连续变量的分布情况和频数情况。以下是一个简单的实现:
import numpy as np
import matplotlib.pyplot as plt
mu, sigma = 100, 15
x = mu + sigma * np.random.randn(10000)
n, bins, patches = plt.hist(x, 50, density=1, facecolor='g', alpha=0.75)
plt.xlabel('Smarts')
plt.ylabel('Probability')
plt.title('Histogram of IQ')
plt.text(60, .025, r'$\mu=100,\ \sigma=15$')
plt.axis([40, 160, 0, 0.03])
plt.grid(True)
plt.show()
该代码会生成一个直方图和一些相关标注。直方图展示了样本数据的分布情况。
(3)折线图
折线图常用于表示连续变量的趋势,以下是一个简单的实现:
import matplotlib.pyplot as plt import numpy as np x = np.linspace(-np.pi, np.pi, 256, endpoint=True) y = np.sin(x) plt.plot(x, y) plt.show()
该代码将展示一条正弦曲线。
2. Seaborn
Seaborn是一个基于Matplotlib的Python数据可视化库,提供了图形界面的API,并创建了一些更高级别的可视化函数。以下是一个简单的实现:
import seaborn as sns
import matplotlib.pyplot as plt
iris = sns.load_dataset("iris")
sns.pairplot(iris)
plt.show()
该代码将展示iris数据集的散点图矩阵,可用于查看变量之间的相互关系。
3. Plotly
Plotly是一个Python数据可视化库,可用于创造精美的、交互式的可视化图表。以下是一个简单的实现:
import plotly.express as px
data = px.data.gapminder()
fig = px.scatter(data_frame=data.query('year==2007'), x="gdpPercap", y="lifeExp", size="pop", color="continent",
hover_name="country", log_x=True, size_max=55)
fig.show()
该代码将展示一个气泡图,展示各国的GDP和预期寿命。
4. Bokeh
Bokeh是一个Python交互式可视化库,可用于创造交互式、动态的可视化图表。以下是一个简单的实现:
from bokeh.plotting import figure, output_file, show
import pandas as pd
# prepare data
data = pd.read_csv('https://people.sc.fsu.edu/~jburkardt/data/csv/hw_200.csv')
weight = data["Weight"]
height = data["Height"]
# create figure
p = figure(title="Height vs Weight", tools="pan,box_zoom,wheel_zoom,save,reset",
x_axis_label='Weight (lbs)', y_axis_label='Height (in)')
# add circle glyph
p.circle(weight, height, legend="All data", size=5)
# show the results
show(p)
该代码将展示一个标记圆圈的散点图。
以上是Python中常用的数据可视化函数和库用法。Python中数据可视化的方式和工具十分丰富,程序员可以根据自己的需求选择不同的库和函数。
