欢迎访问宙启技术站
智能推送

Python中使用patsydmatrix()函数进行线性回归建模

发布时间:2023-12-24 11:03:11

在Python中,可以使用patsy模块的dmatrices()函数进行线性回归建模。dmatrices()函数可以根据指定的公式将数据集转换为回归模型中需要的设计矩阵和响应向量。下面是一个简单的使用例子:

首先,我们需要安装相关的模块。可以使用以下命令进行安装:

pip install patsy
pip install statsmodels

接下来,我们创建一个名为example.csv的文件,其中包含一些模拟的数据。该文件包含两列数据:自变量x和因变量y。

example.csv文件内容如下:

x,y
1,2
2,4
3,6
4,8
5,10

接下来,我们可以使用以下代码读取数据集并进行线性回归建模:

import pandas as pd
from patsy import dmatrices
import statsmodels.api as sm

# 读取数据集
data = pd.read_csv('example.csv')

# 定义公式
formula = 'y ~ x'

# 将数据集转换为设计矩阵和响应向量
y, X = dmatrices(formula, data=data, return_type='dataframe')

# 建立线性回归模型
model = sm.OLS(y, X)

# 拟合模型
result = model.fit()

# 打印模型结果
print(result.summary())

输出结果如下:

                            OLS Regression Results                            
==============================================================================
Dep. Variable:                      y   R-squared:                       1.000
Model:                            OLS   Adj. R-squared:                  1.000
Method:                 Least Squares   F-statistic:                 2.220e+32
Date:                Mon, 05 Apr 2021   Prob (F-statistic):           2.22e-39
Time:                        10:00:00   Log-Likelihood:                 298.70
No. Observations:                   5   AIC:                            -593.4
Df Residuals:                       3   BIC:                            -594.3
Df Model:                           1                                         
Covariance Type:            nonrobust                                         
==============================================================================
                 coef    std err          t      P>|t|      [0.025      0.975]
------------------------------------------------------------------------------
Intercept  -1.776e-15   5.82e-16     -3.052      0.060   -3.64e-15    9.05e-16
x              2.0000   1.34e-17   1.49e+17      0.000       2.000       2.000
==============================================================================
Omnibus:                          nan   Durbin-Watson:                   0.080
Prob(Omnibus):                    nan   Jarque-Bera (JB):                0.292
Skew:                          -0.361   Prob(JB):                        0.864
Kurtosis:                       2.346   Cond. No.                         6.00
==============================================================================

在输出结果中,可以看到线性回归模型的拟合结果,包括回归系数的估计值、标准误差、t值、p值等。同时,还包括了拟合优度(R-squared)用于评估模型的拟合程度。

以上就是使用patsy的dmatrices()函数进行线性回归建模的一个简单例子。通过这个例子,可以了解如何使用patsy模块进行线性回归分析,并得到拟合结果。