分类变量和等级变量

二元分类变量和层次变量不是一回事。
前者分为两类,后者则有先后顺序。
排名变量是心理变量,使用序数尺度进行测量。
变量在数学中按值存储,在计算机中按名称访问。
在命令式语言中,变量是可以改变的,并且它们的值可以在运行时改变。

分类、有序、定量变量...你清楚你的变量类型吗?

2 02 3 年,我的朋友正在学习统计学,并向我询问分类变量、序数变量和定量变量之间的定义和区别。
我向他解释道:
分类变量就像性别一样,只有两类:男性和女性,并且没有等级顺序。

顺序变量,例如经济水平,包括低、中、高,这些类别是有顺序的。

定量变量,例如高度,可以精确测量并具有特定的数值。

然后我说在SPSS操作统计时要根据变量类型来设置。
卡方检验用于分类变量,有序逻辑回归用于序数变量,t 检验或方差分析用于定量变量。

他听起来有点困惑,所以我说我不太清楚这部分,并建议他查看统计书籍或询问专家。
他点点头说是的,就看你的了。
算了,我继续教他其他的统计知识。

什么是等级变量和等距变量

说白了,等距变量和分级变量的主要问题是它们是否可数。
所有变格都可以加减,但不能乘除,因为不存在绝对零;层次变量甚至不能相加或相减,只能进行比较。
这个问题的复杂性在于应用场景:我们去年进行的3 000个级别的市场调查中,用体温计测量体温是均匀分布的,但在询问客户的满意度时,只能用“非常不满意”到“非常满意”的级别。
说实话,这很令人困惑。
很多人没有注意到变格不能直接比较不同组的均值差异,必须使用独立样本t检验。
尽管分数变量不可数,但它们可用于非参数检验。
很多人不注意这一点。

一开始我认为等距变量是一个更准确的水平变量,但后来我发现这是错误的——例如,如果满意度分数是5 分制,你不能说4 分是5 分不满意的一半。
等等,还有别的事。
当数据不连续时,比如使用“高/中/低”三个档位,虽然也是一级,但有时可以处理得差不多均匀,但这个模糊区域很容易卡顿。

在进行数据分析之前,首先问自己:这个数据应该进行加减法计算还是应该进行排名?选择正确的变量会产生很大的影响。