Python机器学习的必备技能:10个常用的统计函数!
发布时间:2023-06-15 01:03:23
1. mean()函数:该函数用于计算一个数据集的平均值。例如,计算一组测试成绩的平均值。
2. median()函数:中位数是数据集中间值,即将数据集排序后,位于中心位置的值。median()函数用于计算一个数据集的中位数。
3. mode()函数:众数是数据集中出现次数最多的值。mode()函数用于计算一个数据集的众数。
4. var()函数:方差是数据集各个数据与其均值的差的平方的平均数。var()函数用于计算一个数据集的方差。
5. std()函数:标准差是方差的平方根。std()函数用于计算一个数据集的标准差。
6. corr()函数:相关系数是两个变量之间线性相关程度的度量。corr()函数用于计算两个变量之间的相关系数。
7. cov()函数:协方差表示两个变量之间的变化趋势,即变量是否一起变化。cov()函数用于计算两个变量之间的协方差。
8. percentile()函数:百分位数是数据集中给定百分比的数据的值。percentile()函数用于计算一个数据集的百分位数。
9. skew()函数:偏度是数据集中值分布偏斜程度的度量。skew()函数用于计算一个数据集的偏度。
10. kurtosis()函数:峰度是数据集中值分布峰态程度的度量。kurtosis()函数用于计算一个数据集的峰度。
这些统计函数是Python机器学习中必不可少的工具。使用这些函数可以更好地理解数据集,进而进行更准确的数据分析和机器学习建模。
