什么是名义变量?

嗯... 名义变量啊... 就是说... 钱那类的... 量... 比如说... 2 02 2 年... 某个城市... 比如上海... 假设... 某个商品... 一台电脑... 2 02 2 年卖了... 1 00台... 每台1 0000块钱... 那这1 000000块... 就是个名义变量... 它是用钱... 人民币... 来衡量的... 不是说... 这电脑... 本来值8 000... 但因为涨价了... 卖到1 0000了... 这个1 0000... 就包含了... 价格变动... 的因素...
真实变量... 就不太一样... 比如说... 同样是那台电脑... 2 02 2 年卖了1 00台... 每台1 0000块... 但我们假设... 2 02 2 年... 通货膨胀率是5 %... 那如果我们... 按照去年的... 也就是2 02 1 年的价格... 来算... 这1 00台电脑... 真正的购买力... 是多少呢?... 就得把那5 %的通胀... 去掉... 算出来... 可能就... 9 5 0万... 这样... 才叫... 实际变量... 它剔除了... 价格变动... 的干扰...
所以... 名义变量和实际变量... 就这么个区别... 名义... 就是表面的... 带着钱的... 数字... 实际... 就是去掉钱... 或者价格因素... 之后... 真正的... 物量的... 数字...
比如... 你看... 比如说... 你看... 某个公司... 2 02 2 年... 利润... 名义上... 增加了2 0%... 可能... 通货膨胀... 就有1 0%... 那这2 0%里... 有多少是... 真正的经营... 增长... 有多少是... 价格... 涨上去... 带来的... 增加呢?... 就看... 实际变量... 如果... 去掉那1 0%的通胀... 实际利润... 可能就... 增长1 0%... 或者... 增长不了多少... 甚至... 还减少了...
在SPSS里面... 名义变量... 就是... 比如说... 性别... 就是个名义变量... 就是... 男... 或者... 女... 它没有顺序... 也不能算... 你不能说... 男比女大... 或者... 小... 就是个... 类别... 比如说... 学业成绩... 划分... 优良中差... 这也是个名义变量... 你把... 优... 赋值1 ... 中... 赋值2 ... 它不代表... 优就是两倍于... 中... 它就是个... 分类... 你不能在SPSS里... 直接加起来... 或者求平均分... 因为它... 没有意义...
宏观经济里面... 名义变量... 比如说... 名义GDP... 就是... 用价格... 来计算的... GDP... 比如说... 2 02 2 年... 一堆东西... 卖了1 00个单位... 每个价1 00块... GDP就是1 0000块... 这是个名义GDP... 实际GDP... 就得... 去掉... 2 02 2 年... 可能价格涨了5 0%... 如果按... 旧的价格... 来算... 卖1 00个单位... 应该是8 000块... 这8 000块... 才是... 实际GDP... 名义变量... 就是... 带钱的... 数字... 实际变量... 就是... 去掉钱的... 数字...
所以... 名义变量... 就是以... 货币... 为单位... 衡量的... 量... 而实际变量... 是以... 实物... 为单位... 衡量的... 量... 它们... 主要区别... 就在于... 是否剔除了... 价格变动... 的因素...
...

spss里二分类变量对应标度吗

说白了,在SPSS中对二分类变量进行标度处理,关键在于先明确变量的测量类型。
比如,字符串型变量可以是名义或有序,数字型变量可以是名义、标度或有序。
对于像质量或长度的数值型变量,它们通常是标度变量,比如年龄和个数,它们是数值型的但不一定是连续的。
标度变量在SPSS中用来表示区间或比率刻度的数据,比如测试成绩或温度计读数。
名义变量则用于表示没有内在等级的类别,如地区和宗教信仰。
有序变量则有明确的顺序,比如服务满意度评分。
我一开始以为所有数字型变量都是连续的,后来发现年龄和个数这种整数也可以是标度变量。
等等,还有个事,标度变量不仅能表示顺序,还能表示数值之间的距离,这是它和有序变量的关键区别。

其实很简单,确定变量的测量类型后,在SPSS中就可以根据类型进行相应的处理。
标度变量在SPSS中非常重要,因为它不仅反映了数据的顺序,还反映了数值之间的距离。
这个点很多人没注意,但我觉得值得试试,特别是在进行统计分析时,正确处理变量类型可以避免很多错误。

提醒一下,容易踩的坑是混淆标度变量和有序变量,两者虽然都表示顺序,但标度变量还能表示数值之间的距离。
所以,当你看到一个变量既有顺序又有距离意义时,记得它应该是标度变量。

有序分类变量和无序分类变量的区别是什么?

有序分类变量:学历等级(时间:2 02 0年),数值递增,可比较优劣。

无序分类变量:血型(时间:2 02 1 年),AB型、O型,无顺序差。

二分类变量:性别(时间:2 01 9 年),男/女,互斥。

多分类变量:职业(时间:2 02 2 年),医生/教师/工程师,类别固定。

实操提醒:先定变量类型,再选分析方法。

glm分类变量

说白了,广义线性模型(GLM)在分类变量的建模上主要处理三类:二分类、名义变量和有序变量。
其实很简单,二分类变量就是预测事件发生的概率,像Logistic回归那样用Logit链接函数;名义变量则用广义Logit模型,比如多项Logistic回归,比较不同类别的相对几率;有序变量则用累积Logit模型,像满意度等级那样。
我一开始也以为这些模型都很复杂,后来发现其实关键在于理解它们如何处理概率和几率。

先说最重要的,二分类变量建模时,Logit链接函数将概率π映射到实数域,用优势比表示,比如π=frac{o}{1 +o}。
另外一点,名义变量建模时,需要指定一个基准类别,其他类别相对基准建立Logit方程,分析自变量对类别选择的影响。
还有个细节挺关键的,有序变量建模时,累积Logit模型将有序分类视为潜在连续变量的阈值划分,估计每个类别的累积优势比。

等等,还有个事,GLM的核心优势在于它扩展了传统线性模型,允许因变量服从多种分布,如二项分布、泊松分布、正态分布,并能适配不同链接函数。
这个点很多人没注意,我觉得值得试试。
其实,GLM的应用非常广泛,比如在医疗研究中,可以同时分析疾病状态、病理分级和疼痛评分,提供多维支持。
但说实话,在使用GLM时,一个容易踩的坑就是错误地选择链接函数和分布,这可能会导致分析结果不准确。