变量是什么意思?

变量是描述现象某些特征的概念。
例如:“商品销量”、“教育程度”、“产品质量水平”等。
是变量。
变量的具体表示是数据,称为变量值。
变量可以分为几种类型:分类变量、序数变量和数值变量:分类变量是描述事物类别的名称,这些变量的数值表达式是分类数据。
例如,“性别”是一个分类变量,其变量值表示为“男”或“女”;“经济类型”也是一个分类变量,其变量值表示为“国有经济”、“集体经济”、“个体经济”、“经济”等。
序数变量是描述事物有序类别的名称。
数值这类变量的表示是序数数据,例如“产品类型”是一个序数变量,其变量值可以表示为“一类产品”、“二类产品”、“三流产品”、“次品产品”等也是序数变量。
其变量值可以表示为“小学”、“初中”、“高中”、“大学”等;一个人对某件事的看法也可以是序数变量,其变量值可以表示为“同意”、“持有”等。
“中立”、“反对”等变量是描述事物数字特征的名称。
这些变量的数值表达式是数值数据。
例如:“产品产量”、“商品销量”、“部门规模”、“年龄”、“时间”等。
都是数值变量,它们的变量值可以表示为不同的数值。
数值变量根据取值的不同可分为离散变量和连续变量。
离散变量可以取有限数量的值,它们的值用整数分隔,可以一一列出。
例如:“企业编号”、“产品数量”等。
是离散变量;连续变量可以取无穷大的值,其中的值是连续的,不能一一枚举。
例如:“年龄”、“温度”、“零件尺寸误差”等。
都是连续变量。
在研究经济社会问题时,当离散变量有多个取值时,我们也可以将离散变量视为连续变量。

分类变量是什么意思?

分类变量可以分为两类:无序变量和有序变量。

1.无序分类变量(unorderedcategoricalvariable):

表示类别或属性之间程度和顺序的差异。
可分为两类(如性别、药物相互作用等)和多类(如血型、职业等)。

要分析无序分类变量,首先必须将其按类别分组,统计每组中观察单元的数量,编制分类变量频数表,得到的数据就是无序分类数据。
也称为计数数据。

2.序数分类变量:

每个类别之间存在一定程度的差异。
例如,尿糖检测结果按照-、±、+、++、+++进行分类;治疗效果分为显效、显效、好转、无效。

对于有序分类变量,我们首先要按照层次顺序进行分组,统计每组中观察单元的数量,并编制出有序变量的频数表(结果数据在每一层调用)。
分层数据。

扩展信息:

分类变量的类型并不固定,根据研究目的的需要,可以变换不同类型的变量。
例如,血红蛋白量(g/L)本来就是一个数值变量,如果按照正常血红蛋白和低血红蛋白分为两类,就可以作为二元分类数据进行分析。

如果按照重度贫血、中度贫血、轻度贫血、正常、高血红蛋白分为五个级别,则可以按级别对数据进行分析(数据以临床数据为准)。
有时也可以测量分类数据,例如可以将患者的恶心反应表示为0、1、2和3,然后可以根据变量数值数据(定量数据)进行分析。

参考来源:百度百科-分类变量

lrchi2是什么意思

lrchi2是卡方统计量。

卡方统计量可用于测试独立性并确定分类变量之间的关联性。

例如,如果您有一个按选民性别划分的选举结果双向表,则卡方统计量将确定投票是独立于选民的性别还是独立于性别。
投票与性别之间的关系。
如果与卡方统计量相关的p值小于所选水平,则检验将拒绝两个变量彼此独立的原假设。

它还可用于确定统计模型是否充分拟合数据。

例如,逻辑回归计算卡方统计量以评估模型拟合度。
如果与卡方统计量相关的p值小于所选水平,则检验将拒绝模型拟合数据的原假设。

另一个例子是“基本统计”菜单中泊松数据的拟合优度检验。
这使用卡方统计量来确定数据是否遵循泊松分布。
如果您的数据是离散的,您可以通过报告每个类别对卡方值的贡献来量化每个类别差异对总体卡方值的贡献程度。

例如,如果拟合优度检验拒绝原假设,那么结果是因为所有类别与预期略有不同,还是因为其中一个类别与预期显着不同?假设您预期是蜡笔盒?包含一支蓝色、一支红色和一支绿色蜡笔,但它包含一支蓝色、两支绿色,但没有红色。

“绿色”和“红色”类别不符合您的期望,但“蓝色”确实符合您的期望。
因此,“蓝色”对生成的卡方值没有影响,并且数据中的所有差异都来自“绿色”和“红色”类别。

更多信息:

卡方检验的目的

<事实上,除了这种用途之外,卡方检验最常见的用途是确定无序分类变量的水平分布在两个或多个组之间是否一致。
卡方检验具有更广泛的用途。
具体来说,其应用主要包括以下几个方面:

1.测试连续变量的分布是否符合特定的理论分布。
是否服从正态分布、均匀分布、泊松分布等?

2.测试特定分类变量出现的概率是否等于指定概率。
例如,36中7的彩票中,每个数字出现的概率是1/36?如果抛硬币,正面和反面都出现的概率是0.5吗?

3.测试两个分类变量是否相互独立。
例如,吸烟(二类变量:是、否)是否与呼吸道疾病(二类变量:是、否)相关、产品成分类型(多类变量)是否相关(2个分类变量)的质量。

4.在控制了一个或多个calcategories变量的影响后,测试两个分类变量是否相互独立。
例如,在上例中,在控制了性别、年龄等因素的影响后,吸烟是否与呼吸系统疾病相关,在控制了产品加工工艺的影响后,产品的原材料类别由下式确定:判断是否与产品质量有关。

5.检查两种方法的结果是否匹配。
例如,使用两种诊断方法来诊断同一人群,结果是否一致?如果使用两种方法来预测客户的价值类别,其结果是否一致?

来源:百度百科-卡方统计