(一)回归分析的概念
1、回归分析:指根据相关关系的具体形态,选择一个合适的数学模型,来近似地表达变量间的依赖关系。
2、因变量:被预测或被解释的变量,一般用Y表示
3、自变量:用来预测或解释因变量的变量,一般用X表示。
【单选题】选择合适的统计模型从一个变量的变化来推测另一个变量的变化情况,适用的统计方法是( )。
A、散点图
B、移动平均
C、相关系数
D、回归分析
(二)一元线性回归模型
根据自变量的多少分为:一元回归模型和多元回归模型。
根据是否是线性分为:线性回归模型和非线性回归模型。
1、一元线性回归模型:描述两个变量之间相关关系的最简单的回归模型。回归模型可以用描述因变量Y如何依赖自变量X和误差项ε的方程来表示。
2、只涉及一个自变量的一元线性回归模型可以表示为:Y=β0+β1X+ε
β0、β1——模型的参数。
(1)Y是X的线性函数(β0+β1X)加上误差项ε。
(2)β0+β1X反映了由于X的变化而引起的Y的线性变化。
(3)误差项ε是个随机变量,反映了除X和Y之间的线性关系之外的随机因素对Y的影响,是不能由X和Y之间的线性关系所解释的Y的变异性。
3、描述因变量Y的期望E(Y)如何依赖自变量X的方程称为回归方程。一元线性回归方程的形式为:E(Y)=β0+β1X
一元线性回归方程的图示是一条直线,β0是回归直线的截距,β1是回归直线的斜率,表示X每变动一个单位时,E(Y)的变动量。
1、估计回归方程:
2、原理:最小二乘法就是使得因变量的观测值yi与估计值ŷi,之间的离差(又称残差)平方和最小来估计参数β0,和 β1,的方法。
【单选题】在回归分析中,估计回归系数的最小二乘法的原理是( )
A、使得因变量观测值与均值之间的离差平方和最小
B、使得因变量估计值与均值之间的离差平方和最小
C、使得观测值与估计值之间的乘积最小
D、使得因变量观测值与估计值之间的离差平方和最小
(一)回归模型的拟合效果分析
1、模型的检验
一般情况下,在使用估计的回归方程之前,需要对模型进行检验:
①结合经济理论和经验分析回归系数的经济含义是否合理;
②分析估计的模型对数据的拟合效果如何;
③对模型进行假设检验。
2、决定系数R2:也称为拟合优度或判定系数,可以测度回归模型对样本数据的拟合程度。
决定系数是回归模型所能解释的因变量变化占因变量总变化的比例,取值范围为[0,1]
(1)决定系数越高,模型的拟合效果就越好,即模型解释因变量的能力越强。
如果所有观测点都落在回归直线上,R2=1,说明回归直线可以解释因变量的所有变化。
R2=0,说明回归直线无法解释因变量的变化,因变量的变化与自变量无关。
(2)现实应用中R2大多落在0和1之间,R2越接近于1,回归模型的拟合效果越好;R2越接近于0,回归模型的拟合效果越差。
2、回归系数的显著性检验
在大样本假定的条件下,回归系数的最小二乘估计量和,渐进服从正态分布,可以用t检验方法验证自变量X对因变量Y是否有显著影响。
t检验的原理是反证法:在原假设=0(自变量X对因变量Y没有影响)正确的假设下,基于
的抽样分布计算一次抽样情况下得到该样本或更极端样本的概率(P值),如果P<0.05,则可以在0.05的显著性水平下拒绝原假设,认为自变量X对因变量Y有显著性影响,即≠0。
【单选题】回归系数检验的目的是( )
A、测算回归模型的拟合效果
B、估计回归系数的大小
C、检验自变量的经济含义是否正确
D、检验自变量对因变量是否有显著影响
(二)模型预测
回归分析的一个重要应用就是预测,即利用估计的回归模型预估因变量数值。
(三)二元回归模型案例
多元回归模型在实际应用中,随着自变量个数的增加,即使在有些自变量与因变量完全不相关的情况下,决定系数R2也会增大。为避免因增加自变量个数而高估拟合效果的情况,多元回归模型一般使用修正了自由度的调整后R2(Adjusted R Square)。调整后R2考虑了自变量个数增加带来的影响,在数值上小于R2。
【多选题】关于回归模型决定系数(R2)的说法,正确的有( )
A、R2越接近0,回归模型的拟合效果越差
B、R2是回归模型所能解释的因变量变化占因变量总变化的比例
C、R2数值越大,回归模型的拟合效果越好
D、R2的取值范围是>0
E、自变量个数对R2没有影响
温馨提示:文章由作者233网校-lxh独立创作完成,未经著作权人同意禁止转载。