欢迎访问宙启技术站
智能推送

在Python中利用statsmodels.formula.apiols()函数进行线性回归拟合与预测

发布时间:2023-12-28 01:08:38

线性回归是统计学中一种常用的回归分析方法,用于建立两个变量之间的线性关系模型。在Python中,可以使用statsmodels库的ols()函数来进行线性回归拟合和预测。

首先,需要安装statsmodels库。可以使用pip命令进行安装:

pip install statsmodels

接下来,我们可以使用一个例子来说明如何使用ols()函数进行线性回归拟合和预测。假设我们有一个数据集,其中包含了房屋的面积和对应的价格。我们想要根据房屋的面积来预测价格。

首先,导入需要的库和模块:

import pandas as pd
import numpy as np
import statsmodels.api as sm
import statsmodels.formula.api as smf

然后,创建一个包含房屋面积和价格的DataFrame:

data = pd.DataFrame({'area': [70, 91, 75, 80, 95],
                     'price': [250000, 340000, 280000, 300000, 360000]})

接下来,使用ols()函数来进行线性回归拟合。我们需要指定回归模型的公式,公式的形式为"因变量 ~ 自变量1 + 自变量2 + ..."。在这个例子中,我们只有一个自变量(房屋面积),所以公式为"price ~ area":

model = smf.ols(formula='price ~ area', data=data)
result = model.fit()

通过fit()方法可以对模型进行拟合,并得到回归结果。

接下来,我们可以使用拟合的模型来进行预测。假设我们想要预测一间面积为90平方米的房屋的价格:

new_data = pd.DataFrame({'area': [90]})
predicted_price = result.predict(new_data)
print(predicted_price)

运行以上代码,会得到预测的价格。

除了使用单个自变量进行线性回归,我们还可以使用多个自变量进行多元线性回归。只需要在公式中添加更多的自变量即可。

以上就是利用statsmodels库的ols()函数进行线性回归拟合和预测的例子。使用ols()函数可以方便地进行线性回归的建模和预测,帮助我们分析变量之间的线性关系。