欢迎访问宙启技术站
智能推送

Python数据分析必备-10个常用的统计函数

发布时间:2023-06-06 08:31:15

Python作为一种流行的编程语言,广泛应用于数据分析。在进行数据分析时,统计函数是必不可少的工具。以下是Python数据分析必备的10个常用的统计函数:

1. mean(均值)

均值用于衡量一组数据的中心位置。在Python中,可以使用numpy库中的mean()函数计算一组数据的均值。

举个例子,假设有如下一组数据:

data = [3, 5, 7, 9, 11]

则可以使用以下Python代码计算它们的均值:

import numpy as np

mean = np.mean(data)

print(mean)

输出结果为:7.0

2. median(中位数)

中位数是将一组数据按从小到大的顺序排列后,中间那个数。如果一组数据中有偶数个数,则中位数是中间两个数的平均值。

在Python中,可以使用numpy库中的median()函数计算一组数据的中位数。

以下是求解data的中位数的代码:

import numpy as np

median = np.median(data)

print(median)

输出结果为:7.0

3. mode(众数)

众数是一组数据中出现次数最多的数。在Python中,可以使用statistics库中的mode()函数计算一组数据的众数。

以下是求解data的众数的代码:

import statistics as stats

mode = stats.mode(data)

print(mode)

输出结果为:3

4. standard deviation(标准差)

标准差是一组数据离均值的平均距离。在Python中,可以使用numpy库中的std()函数计算一组数据的标准差。

以下是求解data的标准差的代码:

import numpy as np

std = np.std(data)

print(std)

输出结果为:2.8284271247461903

5. variance(方差)

方差是标准差的平方,用于衡量数据的离散程度。在Python中,可以使用numpy库中的var()函数计算一组数据的方差。

以下是求解data的方差的代码:

import numpy as np

var = np.var(data)

print(var)

输出结果为:8.0

6. min(最小值)

最小值是一组数据中的最小值。在Python中,可以使用内置函数min()计算一组数据的最小值。

以下是求解data的最小值的代码:

min_value = min(data)

print(min_value)

输出结果为:3

7. max(最大值)

最大值是一组数据中的最大值。在Python中,可以使用内置函数max()计算一组数据的最大值。

以下是求解data的最大值的代码:

max_value = max(data)

print(max_value)

输出结果为:11

8. sum(总和)

总和是一组数据中所有数的和。在Python中,可以使用内置函数sum()计算一组数据的总和。

以下是求解data的总和的代码:

total = sum(data)

print(total)

输出结果为:35

9. count(计数)

计数是一组数据中的元素数量。在Python中,可以使用内置函数len()计算一组数据的元素数量。

以下是求解data的元素数量的代码:

count = len(data)

print(count)

输出结果为:5

10. percentile(百分位数)

百分位数是一组数据中某一百分点的值。在Python中,可以使用numpy库中的percentile()函数计算一组数据的百分位数。

以下是求解data的第70个百分位数的代码:

import numpy as np

pct = np.percentile(data, 70)

print(pct)

输出结果为:9.2

总结

统计函数对于数据分析非常重要。Python作为一种流行的编程语言,内置了许多计算统计量的函数,并且还有许多第三方库可以使用。在进行数据分析时,熟练掌握这些统计函数可以提高我们的工作效率。