用概率来理解的话,随机误差有多个取值,这些取值关于零对称。对于同一个模型,当你的试验次数足够多,那么随即误差的每一个取值出现的概率是均等的,所以最终随机误差会相互抵消。
举例数学成绩和物理成绩的相关关系,假设数学成绩为90分时,利用回归方程算得应得的物理成绩是87分,但在你的统计过程中,有人考89分也有人考85分,其中误差绝对值相等。
相关如下
由于这两个分数出现的概率应该均等,所以当你统计的学生个数无限多时,这两个分数的频率也渐渐趋同,最终相互抵偿,均值为零。这个值不是数学计算出来的,是理论推理得到的,也可以算是人为规定吧。
首先是想用一个函数来拟合数据。但往往不能完美拟合。这时比较理想情况当然是偏多和偏少的一样多。这些偏差看作随机误差,当然要是0才最理想。
这里的0均值,并不是真实就是有0均值的随机误差,只是拟合的不完美导致的偏差。所以是人为的假设,而不是本来就有的。