线性回归模型 为什么要求随机误差的均值为0

如题所述

用概率来理解的话,随机误差有多个取值,这些取值关于零对称。对于同一个模型,当你的试验次数足够多,那么随即误差的每一个取值出现的概率是均等的,所以最终随机误差会相互抵消。

举例数学成绩和物理成绩的相关关系,假设数学成绩为90分时,利用回归方程算得应得的物理成绩是87分,但在你的统计过程中,有人考89分也有人考85分,其中误差绝对值相等。


相关如下

由于这两个分数出现的概率应该均等,所以当你统计的学生个数无限多时,这两个分数的频率也渐渐趋同,最终相互抵偿,均值为零。这个值不是数学计算出来的,是理论推理得到的,也可以算是人为规定吧。

首先是想用一个函数来拟合数据。但往往不能完美拟合。这时比较理想情况当然是偏多和偏少的一样多。这些偏差看作随机误差,当然要是0才最理想。

这里的0均值,并不是真实就是有0均值的随机误差,只是拟合的不完美导致的偏差。所以是人为的假设,而不是本来就有的。

温馨提示:答案为网友推荐,仅供参考
第1个回答  2017-10-23
1、随机误差项是一个期望值或平均值为0的随机变量;2、对于解释变量的所有观测值,随机误差项有相同的方差;3、随机误差项彼此不相关;4、解释变量是确定性变量,不是随机变量,与随机误差项彼此之间相互独立;5、解释变量之间不存在精确的(完全的)线性关系,即解释变量的样本观测值矩阵是满秩矩阵;6、随机误差项服从正态分布。本回答被提问者采纳
第2个回答  2018-12-06
如果均值不等于0,等式将会不可解。
相似回答