1、平均数:一组数据,用这组数据的总和除以总分数,得出的数就是这组数据的平均数。平均数的大小与一组数据里的每个数据都有关系,任何一个数据的变动都会引起平均数的变动,即平均数受较大数和较小数的影响。
2.中位数:将一组数据按大小依次排列,把处在最中间位置的一个数(或最中间位置的两个数的平均数)叫做这组数据的中位数。中位数的大小仅与数据的排列位置有关。因此中位数不受偏大和偏小数的影响,当一组数据中的个别数据变动较大时,常用它来描述这组数据的集中趋势。
3.众数:在一组数据中出现次数最多的数据叫做这组数据的众数。因此求一组数据的众数既不需要计算,也不需要排序,而只要数出出现次数较多的数据的频率就行了。众数与概率有密切的关系。众数的大小仅与一组数据中的部分数据有关。当一组数据中有不少数据多次重复出现时,它的众数也往往是我们关心的一种集中趋势。
从这三个数的意义可知,这三个统计量都是表示一组数据的集中趋势情况,由于每个数表示的意义不同,因此,一般情况下一组数据的平均数、中位数、众数也往往不同.那如何使用这三个统计量呢,我认为这个没有明确的规定,要根据研究对象的具体情况,看哪个统计量最能反映这组数据的一般水平就用哪个。
平均数非常明显的优点之一是,它能够利用所有数据的特征,而且比较好算。另外,在数学上,平均数是使误差平方和达到最小的统计量,也就是说利用平均数代表数据,可以使二次损失最小。因此,平均数在数学中是一个常用的统计量。但是平均数也有不足之处,正是因为它利用了所有数据的信息,平均数容易受极端数据的影响。例如,在一个单位里,如果经理和副经理工资特别高,就会使得这个单位所有成员工资的平均水平也表现得很高,但事实上,除去经理和副经理之外,剩余所有人的平均工资并不是很高。这时,中位数和众数可能是刻画这个单位所有人员工资平均水平更合理的统计量。中位数和众数这两个统计量的特点都是能够避免极端数据,但缺点是没有完全利用数据所反映出来的信息。由于各个统计量有各自的特征,所以需要我们根据实际问题来选择合适的统计量。
当然,出现极端数据不一定用中位数,一般,统计上有一个方法,就要认为这个数据不是来源于这个总体的,因而把这个数据去掉。比如大家熟悉的跳水比赛评分,为什么要去掉一个最高分、一个最低分呢,就认为这两个分不是来源于这个总体,不能代表裁判的鉴赏力。于是去掉以后再求剩下数据的平均数。
需要指出的是,我们现在处理的数据,大部分是对称的数据,数据符合或者近似符合正态分布。这时候,均值(平均数)、中位数和众数是一样的。
只有在数据分布偏态(不对称)的情况下,才会出现均值、中位数和众数的区别。所以说,如果是正态的话,用哪个统计量都行。如果偏态的情况特别严重的话,可以用中位数。
发布于2018-8-15 15:57 成都
当前我在线
直接联系我