在Python中利用statsmodels.formula.apiols()函数进行线性回归拟合与预测
发布时间:2023-12-28 01:08:38
线性回归是统计学中一种常用的回归分析方法,用于建立两个变量之间的线性关系模型。在Python中,可以使用statsmodels库的ols()函数来进行线性回归拟合和预测。
首先,需要安装statsmodels库。可以使用pip命令进行安装:
pip install statsmodels
接下来,我们可以使用一个例子来说明如何使用ols()函数进行线性回归拟合和预测。假设我们有一个数据集,其中包含了房屋的面积和对应的价格。我们想要根据房屋的面积来预测价格。
首先,导入需要的库和模块:
import pandas as pd import numpy as np import statsmodels.api as sm import statsmodels.formula.api as smf
然后,创建一个包含房屋面积和价格的DataFrame:
data = pd.DataFrame({'area': [70, 91, 75, 80, 95],
'price': [250000, 340000, 280000, 300000, 360000]})
接下来,使用ols()函数来进行线性回归拟合。我们需要指定回归模型的公式,公式的形式为"因变量 ~ 自变量1 + 自变量2 + ..."。在这个例子中,我们只有一个自变量(房屋面积),所以公式为"price ~ area":
model = smf.ols(formula='price ~ area', data=data) result = model.fit()
通过fit()方法可以对模型进行拟合,并得到回归结果。
接下来,我们可以使用拟合的模型来进行预测。假设我们想要预测一间面积为90平方米的房屋的价格:
new_data = pd.DataFrame({'area': [90]})
predicted_price = result.predict(new_data)
print(predicted_price)
运行以上代码,会得到预测的价格。
除了使用单个自变量进行线性回归,我们还可以使用多个自变量进行多元线性回归。只需要在公式中添加更多的自变量即可。
以上就是利用statsmodels库的ols()函数进行线性回归拟合和预测的例子。使用ols()函数可以方便地进行线性回归的建模和预测,帮助我们分析变量之间的线性关系。
