描述统计与推断统计
发布时间:2021-2-26 13:57阅读:1028
描述统计与推断统计
![](http://book.img.ireader.com/group61/M00/74/A4/CmQUOF-aZ-KEYY46AAAAAB76RfE149723260.png?v=ywDc_OF-&t=CmQUOF-aZ-I.)
统计理论和方法在定量分析中有着非常重要的作用。商务统计是对与商业有关的数字的收集、整理、总结、分析及报告结果(Weiers,2002) 。在定量分析中,我们会接触到两类统计:描述统计和推断统计。
在描述统计(descriptive statistics,也称叙述统计)中,我们将资料整理\总结,用数字或图表将收集到的资料表现出来。例如,你对所在部门的调查中发现35%的同事使用苹果手机,45%的同事使用三星手机,20%的同事使用其他手机。这里的35%、45%和20%就是描述统计。这里我们只是将调查结果表示出来,并没有根据这一调查来推断全公司或更大范围(如全国)的手机持有情况。又如,公司员工的工资中位数较上年增长10%。10% 在这里也是一个描述统计数字,它只总结和描述本公司今年工资中位数比上年增加10%这一调查结果。
推断统计(inferential statistics, inductive statistics)则根据从总体中所抽样本收集的资料“推断”出总体的情况,从而做出对总体的判断或做出关于总体的某些结论。例如,中国农业大学食品学院营养与食品安全系副教授范志红称,2010年,北京小学五六年级的肥胖率已高达26.9%相当于每四个人中就有一人肥胖 。这里“肥胖率已高达26.9%”就是一个推断统计的结论,是根据对一部分北京小学五六年级学生(样本)的调查结果而对所有北京小学五六年级学生(总体)做出的一个推断。
描述统计 :对资料进行总结,以数字或图表的形式将数据或数据的特征表现出来。
推断统计 :根据样本所得资料,推断总体的特征或对总体做出某些判断或结论。
下面介绍统计中要用到的几个重要概念。
总体 (population)或称母群体,指研究或分析对象(subject)的全部集合。研究对象因为研究目的不同而不同,可以是人,也可以是事或物,或其他。例如,总体可以是全体中国人,也可以是所有居住在海外的中国人;研究总体可以是联想制造的所有计算机,也可以是其制造的全部手提电脑。
从上述关于总体的例子可以看出,在研究开始前,对研究对象的明确定义是非常重要的。例如,如果你感兴趣的对象是所有联想计算机的质量,你的研究对象就是“所有”联想计算机,这时,“所有”联想计算机就构成了研究的总体,而联想手提电脑只是所有联想计算机的一部分。然而,如果你研究的课题是联想手提电脑的质量,则“所有”联想手提电脑就构成了研究的总体。
样本 (sample)是从总体中抽样所获得的观测值,是总体的一部分。
假设我们的课题是研究中国6岁男童的平均身高。在这个课题中,“所有”中国6岁男孩的身高就是研究的“总体”。在调查过程中,我们不可能也没必要测量全国所有6岁男童的身高,或者因为测量所有6岁男孩身高的成本(所花费的时间、金钱等)太高,使得测量所有6岁儿童身高变得不可能或很困难。我们只能或只需测量一部分6岁男孩的身高。由这一部分6岁男孩所测出的身高就是我们研究的样本,是所有6岁男童身高(总体)的一部分。
如果从样本观测值所获得的样本的特征能反映其总体的该特征,我们就说样本对该总体是“有代表性的”(representative)。只有从有代表性的样本获得的观测值才能推断总体的特征。
统计量 (statistic)是根据样本观测值计算出来的关于样本的特征,如样本的平均值。
总体 包括问题的所有研究对象, 样本 是总体的一部分。样本应尽可能从总体中随机抽取而得。
参数 是总体的统计特征,而 统计量 是样本的特征。我们一般根据样本统计量推断或估计总体参数。
参数 (parameter)是总体的特征。例如,在上面的例子中,如果对全国所有6岁男童的身高都进行测量(总体),再计算其平均值,我们就会得到一个全国6岁男童的平均身高。由此得到的就是全国所有6岁男童平均身高的参数。但是,正如前面所讨论的,由于各种原因,我们不会也不能对所有6岁男童都进行测量。我们用样本的统计量来估计总体的参数。本书将详细讨论如何用样本的统计量估计总体的参数。
常用的总体参数包括总体均值、标准差等。
温馨提示:投资有风险,选择需谨慎。