在进行组距式分组时,组距两端的数值称为组限。其中,每组的起点值称为下限。连续型变量中,上一组的上限同时也是下一组的下限。在分组时,凡遇到单位的标志值刚好等于相邻两组上下限数值时,一般把此值归并到作为下限的那一组。
例如,可以根据人口成长的生理和心理特点将人群分为婴幼儿组、少年组、中青年组岁、老年组等。组距分组掩盖了各组内间的数据分布状况,为反映各组数据的一般水平,我们通常用组中值来作为该组数据的一个代表值。上限与下限之间的中点数值称为组中值,它是各组上下限数值的简单平均,即组中值=/2。
使用组中值代表一组数据时有一个必要的假定条件,即各组数据在本组内呈现均匀分布或在组中值两侧呈对称分布。如果实际数据的分布不符合这一假定,用组中值作为一组数据的代表就会有一定的误差。