欢迎访问宙启技术站
智能推送

使用Python的RandomForestClassifier()预测分类结果

发布时间:2023-12-19 03:51:48

RandomForestClassifier()是Python中的一个随机森林分类器模型,它是通过集成多个决策树来进行分类的。每个决策树的结果会进行投票或者取平均,最后得到最终的分类结果。下面我们将使用一个例子来演示如何使用RandomForestClassifier()进行分类预测。

首先,我们需要导入所需的库和数据集。

from sklearn.ensemble import RandomForestClassifier
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
from sklearn.metrics import accuracy_score

# 加载鸢尾花数据集
iris = load_iris()
X = iris.data
y = iris.target

# 划分训练集和测试集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=0)

接下来,我们可以创建一个RandomForestClassifier()的实例,并训练模型。

# 创建一个随机森林分类器实例
rfc = RandomForestClassifier()

# 训练模型
rfc.fit(X_train, y_train)

模型训练完成后,我们可以使用训练好的模型进行预测。

# 预测测试集
y_pred = rfc.predict(X_test)

最后,我们可以使用accuracy_score()函数计算预测结果的准确率。

# 计算准确率
accuracy = accuracy_score(y_test, y_pred)
print("准确率:", accuracy)

完整的代码如下所示:

from sklearn.ensemble import RandomForestClassifier
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
from sklearn.metrics import accuracy_score

# 加载鸢尾花数据集
iris = load_iris()
X = iris.data
y = iris.target

# 划分训练集和测试集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=0)

# 创建一个随机森林分类器实例
rfc = RandomForestClassifier()

# 训练模型
rfc.fit(X_train, y_train)

# 预测测试集
y_pred = rfc.predict(X_test)

# 计算准确率
accuracy = accuracy_score(y_test, y_pred)
print("准确率:", accuracy)

通过上述代码,我们可以使用RandomForestClassifier()模型对鸢尾花数据集进行分类预测,并计算出预测结果的准确率。