Python中常用的模型评估指标

发布时间：2024-01-18 04:29:32

在机器学习中，模型评估指标的选择非常重要，因为它们可以帮助我们了解模型的性能和错误类型。本文将介绍一些常用的模型评估指标，并提供使用例子来说明它们的应用。

1. 准确率（Accuracy）:

准确率是最常用的模型评估指标之一，它表示分类正确的样本占总样本的比例。可以使用 sklearn.metrics.accuracy_score 方法来计算准确率。

from sklearn.metrics import accuracy_score

y_true = [0, 1, 0, 1, 1]
y_pred = [0, 1, 0, 0, 1]

accuracy = accuracy_score(y_true, y_pred)
print("准确率：", accuracy)

2. 精确率（Precision）和召回率（Recall）:

精确率表示分类为 positive 的样本中真正为 positive 的比例，召回率表示所有真实为 positive 的样本中被正确分类为 positive 的比例。可以使用 sklearn.metrics.precision_score 和 sklearn.metrics.recall_score 方法来计算精确率和召回率。

from sklearn.metrics import precision_score, recall_score

y_true = [0, 1, 0, 1, 1]
y_pred = [0, 1, 0, 0, 1]

precision = precision_score(y_true, y_pred)
recall = recall_score(y_true, y_pred)

print("精确率：", precision)
print("召回率：", recall)

3. F1 分数:

F1 分数综合了精确率和召回率，是精确率和召回率的调和平均值。可以使用 sklearn.metrics.f1_score 方法来计算 F1 分数。

from sklearn.metrics import f1_score

y_true = [0, 1, 0, 1, 1]
y_pred = [0, 1, 0, 0, 1]

f1 = f1_score(y_true, y_pred)
print("F1 分数：", f1)

4. ROC 曲线和AUC:

ROC 曲线是一种用于表示二元分类模型性能的图形。横轴表示 false positive rate (FPR)，纵轴表示 true positive rate (TPR)。AUC (Area Under Curve) 表示 ROC 曲线下的面积，也是评估模型性能的指标之一。可以使用 sklearn.metrics.roc_curve 方法计算 ROC 曲线的 FPR 和 TPR，使用 sklearn.metrics.auc 方法计算 AUC。

import matplotlib.pyplot as plt
from sklearn.metrics import roc_curve, auc

y_true = [0, 1, 0, 1, 1]
y_pred_prob = [0.1, 0.4, 0.2, 0.9, 0.8]

fpr, tpr, thresholds = roc_curve(y_true, y_pred_prob)
roc_auc = auc(fpr, tpr)

plt.plot(fpr, tpr, label='ROC curve (area = %0.2f)' % roc_auc)
plt.plot([0, 1], [0, 1], 'k--')
plt.xlim([0.0, 1.0])
plt.ylim([0.0, 1.05])
plt.xlabel('False Positive Rate')
plt.ylabel('True Positive Rate')
plt.title('Receiver Operating Characteristic')
plt.legend(loc="lower right")
plt.show()

5. 均方误差（Mean Squared Error）:

均方误差度量了模型预测值与真实值之间的差异程度。可以使用 sklearn.metrics.mean_squared_error 方法计算均方误差。

from sklearn.metrics import mean_squared_error

y_true = [3, -0.5, 2, 7]
y_pred = [2.5, 0.0, 2, 8]

mse = mean_squared_error(y_true, y_pred)
print("均方误差：", mse)

以上是几个常用的模型评估指标和使用例子，根据具体的问题选择合适的评估指标能够更好地评估模型性能和指导调整模型。