如何用spss进行两两相关性分析

老实说,即使使用SPSS进行相关分析,我仍然是在摸着石头过河。
您列出的步骤非常完整。
我补充一下我自己掉入陷阱的经历。
这句话可能有点啰嗦,但是却是事实。

1 .导入数据时要特别小心。
我曾经直接拖拽一个Excel文件,变量类型全乱了。
我以为是连续变量,但是SPSS默认是分类变量。
然后我花了大半天的时间重新定义它,这让我真的很生气。
我们建议您先纠正Excel中的数据格式,尤其是日期和货币单位,这些在SPSS中自动识别时容易出现问题。

2 分析方法的选择取决于具体情况。
例如,我们去年有一个项目,客户必须分析两个 7 点李克特量表(“强烈同意和强烈不同意”)之间的相关性。
我的第一反应是自己使用 Pearson,但我的老板告诉我这是错误的,所以我最终改用 Kendall 并获胜。
我了解到我需要知道为什么使用这些系数,而不仅仅是记住公式。
然而,对于连续变量的正态分布,我通常首先使用SPSS中的Shapiro-Wilk检验进行检查。
特别是,如果数据太多,往往不满足条件。

3 工作步骤有一个小技巧。
特别是在选择变量时,将连续变量和分类变量一起分析很容易出错。
最好先在“变量”视图中更改变量类型,以避免运行时匆忙。
还有一个“标记含义”部分。
你每次都必须检查一下。
否则,你会被结果蒙蔽双眼。

4 结果解释 该领域最常见的错误是随机解释 P 值。
我记得我的实习生认为 P=0.04 是分数 04 ,但他的结论完全错误。
另一个陷阱是当相关系数的绝对值超过0.9 时要小心。
去年我们有一个 r=0.9 2 的数据集。
事实证明,变量定义是重复的。
这些也是连续变量,一个称为“年龄”,另一个称为“年份”。
说白了,结果一定要结合业务场景,不能只关注数字。

5 处理异常值对于需要注意的问题尤其重要。
我的一个同事在分析销售数据时发现,某个月的一个系统bug导致销售额达到了2 00万,直接破坏了整个关联分析。
因此,异常值检测就像检查床上是否有老鼠。
你不能只看描述性统计数据。
要看到这一点,您需要使用散点图和箱线图。

最重要的是,相关性与因果关系不同。
我们必须牢记这个原则。
我参加了一项健康研究,研究运动频率与血压之间的相关性。
研究发现,进行高强度运动的人血压较低。
然而,这绝不是因果关系,还有其他隐藏变量在起作用。
SPSS 告诉你“是”,而不是“为什么”。

所有这些凌乱的经历都来自现实生活的经历。
遵循这些步骤当然是正确的,但记住容易出错的细节将帮助您更有效地工作。

spss如何进行两两相关分析?

用spss进行皮尔逊相关分析中,相关系数和显著性怎么求

上周,有朋友问我如何在SPSS中做Pearson相关。

先说操作。
打开 SPSS 并准备数据。
必须有连续的数据。
比如增长和收入。

然后浏览菜单。
分析、相关、双变量。
只需拖放两个变量即可。

系统默认使用Pearson。
通常这就足够了。
选择双面以确保意义。
这是最安全的。

单击“确定”查看结果。

结果有r值、P值、N。

r的值取决于它是正数还是负数。
积极的意思是它们一起成长,消极的意思是一个在上升,另一个在下降。
r 值越接近 1 或 -1 ,相关性越强。

P值小于0.05 ,这意味着关系相当可靠。
不是偶然的。

N——样本量。
没那么少。

朋友也问我,如果数据有曲线关系怎么办?例如,一个人先上升,然后下降。
那么皮尔逊就不好了。
去寻找另一种方式。

还有一个样本量问题。
如果样本太大,即使很小的关系也可能被认为是重要的。
如果样本太小,无论关系有多好,也可能不显着。

忘记它吧。
由你决定。