您的位置: turnitin查重官网> 经济 >> 公司研究 >关于方差分析一种直觉推导和一个现实应用

关于方差分析一种直觉推导和一个现实应用

收藏本文 2024-01-15 点赞:29277 浏览:132524 作者:网友投稿原创标记本站原创

摘 要:方差分析是一种重要的用于检测设检验的统计方法,常用于分析和判断某一因素的不同水平对事物的影响是否有显著差异。虽然方差分析有非常广泛的应用,但不少统计方法应用者对方差分析中采用检验的原因并不清楚。而且,也很难发现有中外文献或资料对此原因做出解释。长期以来,检验统计量似乎已成为方差分析约定俗成的既定工具。文章从较为直观的视角,结合统计常识和基础知识,对方差分析中的检验统计量进行了较为充分的推导和证明。这种包含直觉成分的推导思路和过程很有可能与原有的推导有很大不同,但其一样有效地诠释了方差分析检验的机理和实质。
关键词:方差分析 检验 检测设检验 理论推导 合并总体
:A
文章编号:1004-4914(2012)09-038-03
一、引言
方差分析是检验多个总体均值是否相等的统计方法。当要判断分类型自变量是否对数值型因

源于:毕业论文致谢www.udooo.com

变量有显著影响时,可以采用方差分析的方法。例如,要判断不同种化肥对农作物的产量是否有显著影响、不同生产工艺对产品的质量是否有显著影响、不同的培训项目对员工技能提高是否有显著影响等,都可以考虑通过方差分析对问题进行研究。
作为一种非常重要的检验方法,方差分析采用检验统计量进行显著性检验。虽然方差分析有非常广泛的应用,但不少的使用者并不十分清楚为什么采用检验进行方差分析。所见到的文献几乎都把方差分析中的检验仅作为一种统计工具予以介绍,而并不对方差分析中之所以采用检验的原因进行解释。笔者目前还没见到关于方差分析检验推导过程的中外相关文献或资料。
作为一种科学的统计检验方法,方差分析中采用检验统计量肯定有其非常严谨的推导过程,这是勿容置疑的。但或许正是由于其推导过程过于严格和复杂,从而鲜有文献资料对其给以说明和推证,只是把检验作为一种约定俗成的做法施加于方差分析过程。
本文笔者通过思考,尝试找到一种关于方差分析检验的推导方法。在整个推导过程中,所采用的都是一些基础性的统计知识,并掺插着对统计学问题的直觉认识。所以,笔者所采用的推导方法并不复杂,很容易让方差分析方法的使用者明白使用检验统计量的个中缘由。本文第二部分再现了这种推导过程。但有别于原本的方差分析推导过程所应具有的规范性和严谨性,本推导过程中的个别环节可能还值得进一步推敲。希望能与读者进行相关交流和探讨。本文的第三部分提供了一个用方差分析进行产品改良的商业案例,用以展现方差分析的具体过程和应用价值。

二、对方差分析检验统计量的直觉推导

(一)方差分析基本内容

方差分析是要判断分类型自变量是否对数值型因变量有显著影响。分类型自变量代表着某种影响因素或称为因子。影响因素以某一水平作用于若干个体对象上。所有可能被因素施以某一(水平)影响的个体构成一个相应的总体,而所观察到的受到因素某一(水平)具体影响的所有个体构成一个观测样本。这样,如果某一影响因素具有k个水平,意味着分类型自变量可以取k个不同的数值,因素k个水平下的观测值共构成k个对应样本。
若考察单一因素不同水平的影响,样本观测值的数据结构如下表1所示。影响因素第i水平下有ni个观测值,即第i个样本包含ni个个体。个体总数n=n1+n2+…nk。来自第i个总体(水平)的第j个观测值为xij。
根据以上数据结构,可以计算出如下统计量:因素各水平下观测值的均值xˉi、全部观测值的总均值x=、总误差平方和SST、组间误差平方和SSA、组内误差平方和SSE。在此基础上,还可以通过SSA和SSE分别除以各自的自由度,进一步计算出组间均方以MSA及组内均方MSE。
方差分析要根据k个样本提供的信息判断k个总体的均值是否相等。若k个因素水平所对应总体的均值分别为μ1,μ2,…,μk,则方差分析的原检测设和备择检测设可陈述为:
H0∶μ1=μ2…=μkH1∶μ1,μ2…,μk不全相等
对检测设进行检验的统计量为:
F=■~F(k-1,n-k)
此为F统计量。其中,k-1和n-k分别为F分布的第一和第二自由度,并分别与SSA和SSE(或者说,与组间均方MSA、组内均方MSE的计算)相对应。

(二)F检验统计量推导过程

方差分析有三个基本检测定:(1)每个总体都服从正态分布;(2)各个总体的方差相同;(3)观测值独立。在这些检测定下,k个总体的分布如图1所示。
如果原检测设“H0∶μ1=μ2…=μk”成立,则k个总体的分布完全相同,如图2所示。由k个总体合并一起构成的“合并总体”的分布等同于任一水平所对应总体的分布。用σ2E表示任一水平所对应总体的方差,σ2P表示k个总体构成的“合并总体”的方差,μP表示“合并总体”的均值,则由“μ1=μ2…=μk”可知:μP=μk,σ2P=σ2E。所以,“μ1=μ2…=μk”等价于“σ2P=σ2E”。
如果原检测设不成立,即备择检测设“H0∶μ1,μ2…,μk”成立,则由k个总体合并一起构成的“合并总体”的分布将不同于任一水平所对应的总体的分布。“合并总体”相对于与每一水平所对应总体来说,其个体之间的差异将变大,分布将更离散,从而其概率密度曲线将更扁平,如图3所示。类似方差分析中给出的“每个总体都服从正态分布”的基本检测定,这里同样检测定“合并总体”服从正态分布。
依然用σ2E表示任一水平所对应总体的方差,σ2P表示k个总体构成的“合并总体”的方差,则由“μ1,μ2…,μk不全相等”可知:σ2P>σ2E。所以,“μ1,μ2…,μk不全相等”等价于“σ2P>σ2E”。
从以上的分析能够看出,方差分析中原检测设和备择检测设关于均值的陈述
H0∶μ1=μ2…=μkH1∶μ1,μ2,…,μk不全相等
可以转换成关于方差的陈述
H0∶σ2P=σ2EH1∶σ2P>σ2E
在上述的检测设陈述转换的基础上,下面分析检验统计量的构建。对于k个总体中的第i个总体,根据x2分布的定义等知识或者直接根据样本方差的抽样分布,可得

源于:论文的格式要求www.udooo.com

copyright 2003-2024 Copyright©2020 Powered by 网络信息技术有限公司 备案号: 粤2017400971号