如何将数据按标志分组?

如题所述

按数量标志分组时,可先将数据进行排序,然后再根据需要进行分组,按数量标志分组的方法很多,主要有两种:单变量值分组和组距分组。

1、单变量值分组把每一个变量值作为一组,这种分组方法通常只适合于离散变量,且变量值较少的情况下使用。在数据较多的情况下,单变量值分组由于组数较多而不便于观察数据分布的特征和规律,而且对于连续变量或变量值较多的情况,可采用组距分组。

2、组距分组将全部变量值依次划分为若干个区间,并将这一区间的变量值作为一组。组距分组是数值型数据分组的基本形式。离散变量的整数值如果变动幅度较大,而且总体单位数N又很大,则也要进行组距分组。

采用组距分组时,需要遵循“不重不漏”的原则。“不重”是指一项数据只能分在其中的某一组,不能在其他组中重复出现;“不漏”是指组别能够穷尽,即在所分的全部组别中每项数据都能分在其中的某一组,不能遗漏。



扩展资料

单变量值分组就是将一个变量值作为一组,总体中有几个不同的离散型变量值就分几个组,适合变量值较少的情况。

例:居民家庭按照人口数进行分组,可分为1口人家庭、2口人家庭、3口人家庭、4口人家庭、5口人以上家庭的组别。

某班级同学按照网购次数进行单变量值分组可以分为1次、2次、3次、4次以上。

在组距分组中,如果全部数据中的最大值和最小值与其他数据相差悬殊,为避免出现空白组(即没有变量值的组)或个别极端值被漏掉,第一组和最后一组可以采取“××以下”及“××以上”这样的开口组。开口组通常以相邻组的组距作为其组距。

为了统计分析的需要,有时需要观察某一数值以下或某一数值以上的频数或频率之和,还可以计算出累积频数或累积频率。

参考资料来源:百度百科-单变量值分组

参考资料来源:百度百科-组距分组

温馨提示:答案为网友推荐,仅供参考
相似回答