消除异常值的常用方法有哪些

如题所述

在SPSS软件里有2种不同的删除方法,整条删除和成对删除。
当然,这种方法简单易行,但缺点也很明显,首先我们经常会遇到的情况是观测值很少,这种删除会造成样本量不足,其次,直接删除的观测很多,也可能会改变变量的原有分布,从而造成统计模型不够稳定。
(2)暂且保留,待结合整体模型综合分析
通常我们观测到的异常值,有时在对于整个模型而言,其异常性质并没有观测到的明显,因此最好综合分析一下,像回归分析,我们经常利用残差分布信息来判断模型优劣,残差有没有超出经验范围(+3标准差),呈现什么分布等,另外对于整个模型而言,会有一些指标像Mahalanobis、Cook's、协方差比率等可以提供某条观测或整体的拟合信息,这些指标也会提示分析人员的异常值信息。如果对于整个模型而言,并不是很明显时,建议保留。
(3)如果样本量很小,可以考虑使用均值或其他统计量取代
这不失为一种折中的方法,大部分的参数方法是针对均值来建模的,用均值取代,实际上克服了丢失样本的缺陷,但却丢失了样本“特色”,可以说是不大不小的错误。当然如果是时序数据,用于取代的统计量
温馨提示:答案为网友推荐,仅供参考
第1个回答  2019-07-02
薛宝琴 小螺、豆官(豆童)
相似回答