使用Keras中的np_utils.to_categorical()函数进行多类别分类

发布时间：2023-12-28 07:38:47

在Keras中，np_utils.to_categorical()函数用于将整数标签转换为多类别分类的函数。它将整数标签编码为二进制的独热编码形式，将每个整数标签转换为一个向量，向量长度等于分类的总数，其中对应标签的索引位置为1，其余位置为0。

下面是一个使用np_utils.to_categorical()函数的示例：

from keras.utils import np_utils
import numpy as np

# 假设有5个类别
num_classes = 5

# 假设有10个样本，每个样本的标签为0到4之间的随机整数
labels = np.random.randint(0, num_classes, size=(10,))

# 使用np_utils.to_categorical()将整数标签转换为多类别分类
one_hot_labels = np_utils.to_categorical(labels, num_classes)

# 打印原始标签和独热编码后的标签
print("原始标签: ", labels)
print("独热编码后的标签: ")
for i in range(len(one_hot_labels)):
    print(labels[i], "->", one_hot_labels[i])

输出结果示例：

原始标签:  [1 0 3 0 4 0 0 4 1 0]
独热编码后的标签: 
1 -> [0. 1. 0. 0. 0.]
0 -> [1. 0. 0. 0. 0.]
3 -> [0. 0. 0. 1. 0.]
0 -> [1. 0. 0. 0. 0.]
4 -> [0. 0. 0. 0. 1.]
0 -> [1. 0. 0. 0. 0.]
0 -> [1. 0. 0. 0. 0.]
4 -> [0. 0. 0. 0. 1.]
1 -> [0. 1. 0. 0. 0.]
0 -> [1. 0. 0. 0. 0.]

在上述示例中，我们首先使用np.random.randint()函数生成了一个包含10个随机整数标签的numpy数组。然后我们使用np_utils.to_categorical()将这些整数标签转换为多类别分类的独热编码形式。最后，我们打印了原始标签和独热编码后的标签，展示了转换的结果。

使用np_utils.to_categorical()函数进行多类别分类时，需要注意标签的范围应为从0到类别总数减1的整数。如果标签是浮点数或字符串类型，需要先将其转换为整数类型。同时，独热编码后的标签将会以浮点数形式表示，可以通过设置dtype参数来指定数据类型。默认情况下，np_utils.to_categorical()函数使用'float32'作为数据类型。