使用Python的RandomForestClassifier()预测分类结果
发布时间:2023-12-19 03:51:48
RandomForestClassifier()是Python中的一个随机森林分类器模型,它是通过集成多个决策树来进行分类的。每个决策树的结果会进行投票或者取平均,最后得到最终的分类结果。下面我们将使用一个例子来演示如何使用RandomForestClassifier()进行分类预测。
首先,我们需要导入所需的库和数据集。
from sklearn.ensemble import RandomForestClassifier from sklearn.datasets import load_iris from sklearn.model_selection import train_test_split from sklearn.metrics import accuracy_score # 加载鸢尾花数据集 iris = load_iris() X = iris.data y = iris.target # 划分训练集和测试集 X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=0)
接下来,我们可以创建一个RandomForestClassifier()的实例,并训练模型。
# 创建一个随机森林分类器实例 rfc = RandomForestClassifier() # 训练模型 rfc.fit(X_train, y_train)
模型训练完成后,我们可以使用训练好的模型进行预测。
# 预测测试集 y_pred = rfc.predict(X_test)
最后,我们可以使用accuracy_score()函数计算预测结果的准确率。
# 计算准确率
accuracy = accuracy_score(y_test, y_pred)
print("准确率:", accuracy)
完整的代码如下所示:
from sklearn.ensemble import RandomForestClassifier
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
from sklearn.metrics import accuracy_score
# 加载鸢尾花数据集
iris = load_iris()
X = iris.data
y = iris.target
# 划分训练集和测试集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=0)
# 创建一个随机森林分类器实例
rfc = RandomForestClassifier()
# 训练模型
rfc.fit(X_train, y_train)
# 预测测试集
y_pred = rfc.predict(X_test)
# 计算准确率
accuracy = accuracy_score(y_test, y_pred)
print("准确率:", accuracy)
通过上述代码,我们可以使用RandomForestClassifier()模型对鸢尾花数据集进行分类预测,并计算出预测结果的准确率。
