[通俗易懂]相关与方差分析(二分变量)

各位,这两种统计方法听起来很混乱,但说白了,它们其实很直观。

首先我们来说说相关分析。
想一想,比如说,你想知道一个人学习的时间越长,他的成绩就会越高。
这里有两个变量:学习时间(X)和成绩(Y)。
相关性分析可以帮助您了解这两个变量是否“一起变化”。
你怎么认为?统计学中有一个“相关系数”,记住字母r,其值在-1 到1 之间。
r=1 表示两个人之间的关系非常强。
一个改变,另一个也一定会改变,而且是正相关的——学习时间长,成绩就高;学习时间长,成绩就高;学习时间长,成绩就高; r=-1 ,存在负相关,如果你学习时间长了,你的成绩会变差(这在现实中可能不常见,但在理论上是存在的);如果r=0,则表示学习时间和成绩无关,只要学习就一样。
这个r是怎么计算的呢?就是看两个变量偏离平均值的程度(这称为方差),然后看它们如何“一起偏离”(这称为协方差),最后得出一个比率。
简单来说,就是看它们的变化趋势是否一致。

我们来谈谈方差分析。
这次你关注的是不同人群的表现是否存在显着差异。
例如,你想知道使用新教学方法的学生(这称为自变量,分为两个级别:新方法组和旧方法组)与使用旧教学方法的学生的结果是否真的不同。
这里,因变量是成绩,自变量是教学方法。
如何判断?方差分析将所有学生的表现差异分为两部分:一部分是“组间差异”(例如,新方法组中学生的平均分数与旧方法组中学生的平均分数大致相同),另一部分是“组内差异”(例如,新方法组内,有些学生的分数较低,这种差异)。
然后看看这两个差异哪个更大。
它通常用F值来衡量,即组间差异除以组内差异。
如果F值很大,说明组间差异显着大于组内差异,则必须认为教学方法对结果有显着影响;如果F值不大,可能是学生自身表现波动较大,教学方法影响不大。

相关性分析和方差分析有一些共同点,即它们都着眼于数据中的“差异”。
但侧重点不同:相关分析着眼于两个变量“同步变化”的程度,而方差分析着眼于一个变量(分组后)在不同组中的“均差”。

二分变量,例如性别(男/女)或考试是否通过(通过/失败),是只有两个值的变量。
用于相关性分析时,可以将“男”编码为1 ,“女”编码为0,然后计算相关系数。
但需要注意的是,二分变量不是连续的,因此这样计算出来的相关系数可能会稍显不精确,必须谨慎解读。
用于方差分析时,例如比较男女学生的平均分时,可以直接以性别为自变量,男生一组,女生一组,计算两组的平均分是否不同。
此时还需要注意的是,分组方式会直接影响结果。

说说白了,相关分析是看两个变量是否“走在一起”,而方差分析是看两个变量分组后是否“走在一起”。
当你实际使用的时候,你要根据你要研究的问题和数据的特点来决定使用哪一种。

统计学中相关分析的方法有哪些

记得去年夏天,我去海边玩耍,看到两个孩子在沙滩上用贝壳搭建了一座城堡。
他们笑着把它们堆起来,讨论哪个贝壳应该放在哪个角落。
那天下午,我看着他们的笑脸,突然想到,这不就是生活中的统计相关性吗? 孩子们的笑容和用贝壳搭建城堡的动作就像两个变量。
他们的幸福感与建造城堡的行动之间存在正相关关系。

时间:去年夏天 地点:海边沙滩 详情:两个孩子用贝壳建了一座城堡,边建边笑
我想这可能就像统计学中的皮尔逊相关系数,衡量两个连续变量之间的线性相关程度。
然而,这里的变数却被微笑和建造城堡的行动所取代。
笑容越灿烂,建造城堡的行动越专注,他们的关系就越亲密。

等等,还有一件事。
我突然想到,如果和斯皮尔曼的水平有关的话,可能就是两个孩子的城堡建造技能和他们的幸福指数之间的相关性。
随着时间的推移,他们的技能可能会慢慢提高,但他们的快乐似乎总是伴随着他们,就像有序数据中两个变量之间的单调关系一样。

然而,这些只是随机联想,现实中可能没那么简单。
就像各种统计方法一样,它们都需要严谨的数据和合理的假设。
那么,你认为孩子们建造城堡的快乐与他们的城堡建造技能有关系吗?