SPSSPRO数据分析方法选择——根据变量类型分类

请问在SPSS中怎样制作多选题的条形图?

spss做的是实证吗

记得上大学的时候,导师让我们做一个关于城镇居民消费习惯的调查。
数据收集完毕后,就是一堆杂乱的表格。
我盯着数字,感觉脑子无法转动。
导师说,试试用SPSS吧,也许能帮助你理清思路。
当时我只知道SPSS是一个非常强大的统计软件。

SPSS 首先是数据管理领域的资深专家。
想想看,有成百上千份问卷,填满了不同的信息,其中有一些遗漏了一些东西。
SPSS 可以帮助您保持这些数据整洁有序。
然后我花了整个周末将所有杂乱的数据导入SPSS。
它会自动为您检查许多错误,例如重复记录和填写明显没有意义的数据。
用手去读每一篇会很累。

其次,SPSS是描述性统计的好帮手。
输入数据后,我点击了几下,SPSS就为我生成了各种图表,比如频数分布表、直方图等。
看着这些图表,那些抽象的数字突然活了过来。
例如,我们发现大多数受访者年龄在 2 0 至 3 0 岁之间,收入处于平均水平。
如果我们只看原始数据,这些信息可能包括猴年和马月。

让我觉得 SPSS 很棒的是它的推论统计功能。
我们想研究收入水平是否影响消费习惯,这是一个典型的回归分析问题。
在SPSS中,我选择相应的选项,设置自变量和因变量,运行一整晚,第二天早上得到结果。
SPSS为我提供了不同的回归系数、显着性水平等。
我愚蠢地查阅了统计书籍,并将它们与那些表格进行比较,看看结果是否有意义。
最后发现收入水平对消费习惯有显着影响。

但是现在想来,SPSS再强大,也只是一个工具而已。
重要的是数据的质量以及分析方法是否合适。
然后我的导师要求我们使用 R 语言重新分析我们的项目。
与SPSS结果基本一致。
不过,老师认为多一个验证方法会让我们更有安全感。

等一下,我最近看到一篇文章说,现在的一些研究人员为了追求结果,实际上在分析之前选择了统计方法。
这有点本末倒置了。
毕竟,统计方法服务于研究问题,而不是期望的结果。

单因素多变量方差分析详解

说实话,当我第一次遇到单向多元方差分析时,我完全困惑了。
但经过几次具体的实验,我逐渐掌握了窍门。
这个方法的本质是什么?粗略地说,取决于你手中的某个分类变量(例如地区、性别、药物组别)是否会导致几个指标(身高、体重、胸围,或者语文、数学、英语考试成绩)的相应变化。
我们不只关注一项指标,而是同时关注多个指标,以得出更完整的结论。

有趣的是,我之前在生物实验中使用过它。
当时,一位老人想了解不同的食物对老鼠的体重、脂肪百分比和毛发厚度有什么影响。
收集数据后,您只需将其放入SPSS并运行即可。
但在发射之前,必须克服一个障碍——分散的均匀性。
我记得这个数据。
Levene的测试表明,体重和皮毛厚度的差异并不均匀。
那一刻我有点紧张,但哥哥说一切都很好。
样本量足够大(每组 2 0 只动物),所以我拿了它并运行它。
结果公布后,Pillai's Trace 显示饲料的总体差异显着。
当按具体指标进行细分时,体重差异最大,其次是体脂百分比。
后来用Tamhane的方法进行多重比较,发现A组大鼠最重,B组居中,C组最轻。
这让我意识到,单向多元方差分析特别适合于你想同时看到多个结果,但又担心结果会混乱并相互干扰的情况。

但是,说实话,这种方法有一个令人不快的地方:要求严格。
特别是对于正态性,我多次遇到像山一样倾斜的数据。
巴特利特测试结果并不显着,所以我最终不得不使用非参数方法。
还有样本量。
虽然书上说每组2 0-3 0人就够了,但我遇到过一个实验,一组只有1 5 人。
结果一算出来,几个P值就飘在天上,下不去了。
所以我总觉得自己从来没有搞定过。
我记得N=3 0左右数据比较稳定,但是具体到实验的时候,就看数据的质量了。

最重要的是结果的解释。
例如,在我的小鼠实验中,虽然总体结果很显着,但你必须将它们逐一分解,看看哪些措施影响大,哪些措施影响小。
对于受试者间效应,无论是F值还是P值都需要引起重视,不能简单地看整体结果。
而且,在多重比较中,要选择正确的修正方法,是用Tamhane还是Dunnett,这直接影响到结论。
我的同事选择了错误的方法,差点错过了一个明显不同的组。

一般来说,单向多元方差分析是一个很好的工具,但使用它时,需要特别小心假设。
特别是对于方差同质性,有时候样本量足够大,可以勉强使用,但如果数据质量较差,你还是得考虑其他方法。
这种方法使我能够同时查看多个变量,但首先必须满足数据条件。