10669 阅读 2020-10-20 10:37:03 上传
以下文章来源于 奈提柯斯先生

在统计分析中,我们主要关注的是p值,它越小代表着越有充分的证据拒绝H0。然而,我们这里的检测数据有多大的说服力呢?换句话说,你的检测结果有多大的意义?比如说,我偏离0.1也是有差异,我偏移5也是有差异,可明显后者更具有意义和说服力。因此,现在在报告统计检验结果时候,也会同时报告另一个参数,以说明我的检验结果是有意义的,这个参数被称作效应量(effect size)。今天我们来讲讲都有哪些可以测量的效应量。
01
Cohen's d 系数
Cohen's d是一种用于比较均值差异效应大小的参数,在t检验中我们经常会用到这一参数。它通过平均数差和样本标准差的比值来定义效应大小,即Cohen's d = 平均数差 / 样本标准差。比如,检测男性和女性发音人在元音/a/的F1上有没有性别差异,假设我们得到了男性/a/发F1的均值M1,女性发F1的均值M2,通过t检验发现具有显著性差异,但是这个差异效应是大还是小,我们通过计算平均数差(M1-M2),除以样本标准差,那么我们就得到了Cohen's d的数值。

Cohen's d示意图
学者们针对不同的计算数值,将Cohen's d数值分成了不同的等级,以便研究者说明效应大小。根据Cohen (1988)的建议,我们认为小于.2的Cohen's d数值说明处理效应太小,小到这个研究不值得做。大于等于.8的数值说明这是一个大效应,但是也不至于大到一眼就能看出研究中的因果关系。

Cohen's d数值与效应大小
在R中,我们可以通过调用lsr包中的cohensD( )函数来计算我们Cohen's d数值。我们根据R中的帮助信息,可以看到该函数调用十分简单,只要说明你是做哪两组的t检验分析,哪两组是你要计算的效应大小即可。

cohensD( )函数示例
η2 (eta方) 和ω2 (omega方)
02
现在,我们了解到t检验的效应大小可以使用Cohen's d来进行评估,它适用于两个样本计算均数差。那么很明显,方差分析中我们需要另找一个参数来评估效应大小,因为方差分析涉及的组数较多。一般的,我们所采用的效应评估系数是η2(eta方),它是由处理间变形性与总体变异性的比值得来,它测量了由处理间差异解释的分数间的差异多大。在使用方差分析后(aov函数、ezANOVA函数等)的summary中,你看到的r2就是它。

η2的计算方法
为了实现较小η2偏差的效应评估,一些学者提出了使用ω2(omega方)来评估效应大小,通常适用于样本量较小的情况。ω2的计算方式如下所示。该测量中小于.06可以认为效应比较小,大于.14可以认为效应非常大。但是,它并不能应用于重复测量分析的效应评估。

ω2的计算方法
最后,方差分析中你还会遇到另一个评估效应大小的参数:偏eta方(partial eta squared)。当你加入更多的变量时,使用eta方评估效应大小会使得每一个变量的解释比例减少,因此学者提出了偏eta方的计算方法,这使研究人员可以在两个不同的研究中比较相同变量的影响。偏eta方的计算中,分子是检测的因素所造成的处理间变异,分母是由处理间变异和处理内变异的和。

偏eta方的计算方法
我们今天介绍的主要是t检验和方差检验中效应值的计算方法,这在统计报告中是不可或缺的一部分。而对于回归分析,我们可以使用回归系数来表示效应大小,之后的统计学习中我们还会介绍皮尔逊相关系数。此外,还有很多其他的效应评估办法,在不同的检验中选择合适的效应评估才是最重要的。
1
参考文献
Cohen, B. H. (2008). Explaining psychological statistics. John Wiley & Sons.
Gravetter, F. J., Wallnau, L. B., Forzano, L. A. B., & Witnauer, J. E. (2020). Essentials of statistics for the behavioral sciences. Cengage Learning.
Field, A., Miles, J., & Field, Z. (2012). Discovering statistics using R. Sage publications.
