欢迎访问宙启技术站
智能推送

使用Python函数进行数据可视化:Matplotlib和Seaborn教程

发布时间:2023-06-27 06:35:07

Python是数据科学家、分析师和研究员经常使用的语言。它的强大之处在于可以进行数据可视化。它提供了两个非常流行的数据可视化库:Matplotlib和Seaborn。

这两个库允许用户生成各种类型的图表。Matplotlib是一个基本的数据可视化图表库,而Seaborn则提供了更多的功能,包括高级绘图功能和可视化调色板。

本文介绍了如何使用Matplotlib和Seaborn库生成各种类型的常见图表,包括线图、散点图、条形图、箱型图、热力图和小提琴图。

安装Matplotlib和Seaborn

在开始使用这两个库之前,需要安装和导入它们。Matplotlib是Python的一部分,可以使用pip命令自动安装Seaborn。

通过以下命令安装Seaborn:

pip install seaborn

然后,通过以下命令导入Matplotlib和Seaborn:

import matplotlib.pyplot as plt
import seaborn as sns

Matplotlib教程

Matplotlib是一个基本的数据可视化库,提供了几种类型的图形选择。

1. 线形图

线形图显示两个变量的关系。以下代码创建了一个简单的线形图:

import numpy as np

x = np.linspace(0, 10, 100)
y = np.sin(x)

plt.plot(x, y)
plt.show()

这将在显示屏上显示一张sine曲线线形图。

2. 散点图

散点图用于显示两个变量之间的关系。以下代码创建了一个简单的散点图:

x = np.random.rand(50)
y = np.random.rand(50)

plt.scatter(x, y)
plt.show()

这将显示一个显示x轴和y轴的随机分布的散点图。

3. 条形图

条形图用于比较几个项目之间的数值。以下代码创建了一个简单的条形图:

x = ['A', 'B', 'C', 'D', 'E']
y = [3, 7, 2, 4, 6]

plt.bar(x, y)
plt.show()

这将显示一张显示a、b、c、d和e之间的Y值的条形图。

4. 箱型图

箱型图用于显示数据的分布情况。以下代码创建了一个简单的箱型图:

x1 = np.random.normal(0, 1, 50)
x2 = np.random.normal(2, 1, 50)
x3 = np.random.normal(4, 1, 50)

data = [x1, x2, x3]

plt.boxplot(data)
plt.show()

这将显示一张包含三个箱型的图表,它们分别代表三个不同的对象/变量。

Seaborn教程

Seaborn比Matplotlib提供更多的功能和可视化功能。以下是在Seaborn中创建常见图表的几种方法:

1. 热力图

热力图用于展示两个变量之间的相关性,它会显示一个颜色比例图。以下代码创建了一个简单的热力图:

import numpy as np
import seaborn as sns

flights = sns.load_dataset('flights').pivot('month', 'year', 'passengers')
sns.heatmap(flights, annot=True, fmt="d")
plt.show()

这将显示一张月和年之间的乘客数的热力图。

2. 小提琴图

小提琴图用于显示数值分布和密度估计。以下代码创建了一个简单的小提琴图:

import seaborn as sns

tips = sns.load_dataset('tips')
sns.violinplot(x=tips["day"], y=tips["total_bill"])
plt.show()

这将显示一张总账单和日期之间的小提琴图。

3. 分类图

分类图用于显示分类变量和数值变量之间的关系。以下代码创建了一个简单的分类图:

import seaborn as sns

tips = sns.load_dataset('tips')
sns.catplot(x="day", y="total_bill", hue="sex", kind="swarm", data=tips)
plt.show()

这将显示一张分别显示天数、总账单、性别和“swarm”的分类图。

总结

使用Python的Matplotlib和Seaborn库,可以轻松创建各种类型的图表,包括线形图、散点图、条形图、箱型图、热力图和小提琴图。这些图表对于可视化数据十分关键,让数据科学家、分析家和研究人员可以更好地理解数据并找到有用的信息。