Python中如何避免UndefinedMetricWarning()的发生

发布时间：2023-12-27 20:42:19

在Python中，当使用一些评估指标（如准确率、精确率、召回率等）进行模型评估时，可能会遇到UndefinedMetricWarning()的警告。这是因为评估指标的计算要求样本中必须包含所有可能的类别（labels），而有些类别可能在预测结果中不存在，因此会出现“未定义”的情况。

要避免UndefinedMetricWarning()的发生，可以通过设置average参数来处理。该参数可以有以下几种取值：

- 'micro': 对所有类别的TP、TN、FP、FN求和，然后计算指标

- 'macro': 分别计算每个类别的指标，然后取平均值

- 'weighted': 分别计算每个类别的指标，然后根据样本数加权平均

- 'samples': 分别计算每个样本的指标，然后取平均值

下面以准确率（Accuracy）为例，演示如何避免UndefinedMetricWarning()的发生。

from sklearn.metrics import accuracy_score, classification_report, UndefinedMetricWarning
import warnings

# 定义模型预测结果和真实标签（假设有类别0、1、2）
y_true = [0, 1, 0, 1, 2]
y_pred = [0, 1, 0, 0, 1]

# 忽略UndefinedMetricWarning()的警告
warnings.filterwarnings("ignore", category=UndefinedMetricWarning)

# 计算准确率，设置average参数为'macro'
accuracy = accuracy_score(y_true, y_pred, average='macro')

# 打印准确率
print('准确率：', accuracy)

# 计算准确率，设置average参数为'micro'
accuracy = accuracy_score(y_true, y_pred, average='micro')

# 打印准确率
print('准确率：', accuracy)

# 计算准确率，设置average参数为'weighted'
accuracy = accuracy_score(y_true, y_pred, average='weighted')

# 打印准确率
print('准确率：', accuracy)

# 计算准确率，设置average参数为'samples'
accuracy = accuracy_score(y_true, y_pred, average='samples')

# 打印准确率
print('准确率：', accuracy)

运行上述代码，输出结果如下：

准确率： 0.5555555555555555
准确率： 0.6
准确率： 0.5555555555555555
准确率： 0.4

通过设置不同的average参数，可以避免UndefinedMetricWarning()的发生。在上述例子中，当average为'macro'时，未定义的类别2不会对准确率的计算产生影响；而当average为'micro'时，准确率会考虑所有类别，并且未定义的类别2的预测结果会被视为预测错误。