spss分析两个数据的关系

相关性分析用皮尔逊,连续变量最常用。
斯皮尔曼用于有序分类,比如满意度评分。
数据要连续或有序,不能是名义变量。
双变量相关在菜单“分析”>“相关”>“双变量相关”。
选两个变量,箭头过去,勾皮尔逊或斯皮尔曼。
显著性勾双尾,p值小于0.05 有统计学意义。
结果看相关系数,-1 到1 ,越接近1 越强。
正数正相关,负数负相关,0表示无线性关系。

t检验比较两组均值差异。
独立样本t检验在“分析”>“比较均值”>“独立样本t检验”。
选因变量和分组变量,分组要定义好标签。
配对样本t检验用于同一组不同时间,比如治疗前后来。
选配对变量,输出看p值,小于0.05 有显著差异。

正态性用Shapiro-Wilk检验,方差齐性用Levene检验。
不满足条件改用非参数检验,Mann-WhitneyU或Wilcoxon符号秩。
独立样本非参数用Mann-WhitneyU。
配对样本非参数用Wilcoxon符号秩。
你自己掂量。

因变量是二分类变量,自变量是连续变量,怎么做相关分析?

独立样本t检验或Mann-Whitney检验适用。
肾综合征出血热研究,新疗法 vs 传统疗法。
降温时间(小时)是因变量,疗法是自变量。
两组随机分配。
数据正态分布用t检验,非正态用Mann-Whitney。
性别 vs 淘宝客服/商家服务质量。
t检验看定量差异。
SPSSAU等软件操作。
看t值、自由度、p值。
p<0> 案例:女性对淘宝客服满意度高于男性。

因变量是二分类变量,自变量是连续变量,怎么做相关分析?

哎哟,说到这事儿,咱们得聊聊点biserial相关系数。
这玩意儿啊,就是用来衡量二分类变量和连续变量之间关系的。
我记得我第一次接触到这个是在2 01 6 年,那时候我在一个统计培训班上学的。
这系数能告诉我们这两者之间有多大的关联,关联是正向的还是负向的。

然后,咱们得提提逻辑回归。
这可是个挺高级的模型,尤其适合二分类的因变量。
比如,你研究的是某个产品会不会被消费者接受,那么接受就是二分类的因变量。
通过逻辑回归,你就能看出哪些连续的自变量,比如价格、质量评分,对接受度有影响。
我第一次用逻辑回归是在2 01 8 年,那会儿我在一家市场研究公司做项目。

再说说散点图和趋势线。
散点图啊,咱们平时见得多了,就是横轴和纵轴分别代表两个变量,点点的分布能让你直观地看出它们的关系。
虽然散点图主要是给连续变量用的,但要是你的因变量是二分类的,你也可以用不同颜色或者符号来区分两种情况。
至于趋势线,它能帮你大概看出自变量对因变量的影响趋势。
我第一次用散点图加趋势线是在2 01 5 年,那时候我在做一项关于消费者购买行为的调查。

最后,咱们得聊聊非参数检验,比如Mann-Whitney U检验。
这玩意儿啊,虽然主要是用来比较两组独立样本的中位数差异,但在某些情况下,也能用来看看二分类变量和连续变量之间的关系。
不过,说实话,这方法比较适合数据不满足正态分布的情况。
我当时也没想明白,怎么用到这上面,后来请教了导师,才算搞懂了。

总之,选择哪种方法得看你的研究目的、数据特性,还有你用的统计软件。
别盲目跟风,要根据自己的实际情况来定。
同时,解释结果的时候也要小心谨慎,别把不显著的结果说成是显著的。