什么是自变量?如何使用?

自变量……老实说,是你在实验中有效改变的东西。
例如,如果您想研究光对植物的作用,光就是自变量。
只需将灯光设置为 2 000 Lux 或 4 000 Lux。
植物的外观是因变量,你会观察它的变化。

这同样适用于数学。
例如,y=f(x),x是自变量。
你可以把它改成你想要的任何东西,它也会相应地改变。
关键是要积极主动,而不是像天气预报那样等待。

自变量必须具有多个状态,称为级别。
比如药物试验,必须有低、中、高剂量,不能只测试一种剂量。
但不要设定太多的水平,比如每周锻炼一次、三次、五次。
关卡太多,体验就不可能。

进行实验时,首先需要了解所研究的内容,例如运动频率对肥胖的影响。
自变量是运动频率和每周跑步次数。
然后将你的运动频率分为几个级别,比如每周跑步一次、三次、五次。
所有其他条件必须保持不变。
例如,每个人都吃相同的食物并且年龄相同。
这样才能看出运动频率对肥胖和减肥的影响。

数学公式中,自变量写在前面。
例如,速度等于距离除以时间,并且时间t和距离s可以用作自变量。
但这取决于问题的背景。
例如,在需求函数中,价格 P 是自变量,订购数量 Q 是因变量。

分析数据时,必须记下自变量各水平对应的因变量数据。
例如,2 000勒克斯光照下的植物有多高,4 000勒克斯光照下的植物有多高?然后根据自变量是什么,使用 t 检验或方差分析对其进行分析。

最常见的错误是颠倒自变量和因变量。
例如,你不能说体重变化是自变量,运动频率是因变量。
这显然是错误的。
自变量的水平也必须合理,不能设置得太密或太稀疏。
例如,药物的剂量为1 mg、1 .1 mg、1 .2 mg。
间隔非常小,可能没有区别。
1 毫克,1 0mg、1 00mg,这些区间太大,不安全。

在心理学实验中,研究睡眠时间是否有益于记忆,睡眠时间是自变量,结果是因变量。
在工程学中,我们研究材料的厚度和强度。
材料的厚度是自变量,其能承受的压力大小是因变量。
但是,一旦设计了自变量和水平,您就可以系统地看到变量之间的关系。

什么是混淆变量

老实说,复杂的变量很烦人。
我们来谈谈年龄。
收入和癌症风险都会受到影响。
当我们查看数据时,我们发现收入较高的人患癌症的风险较高。
您认为收入与癌症之间有关系吗?其实,这是年龄造成的。

2 01 0年有一项研究发现了这种现象。
他们追踪了 1 0,000 人,发现在 5 0 岁以上的人中,收入较高的人患癌症的几率较高。
但仔细分析发现,5 0岁以上的高收入人群不吸烟,说明他们有不喝酒等良好的生活习惯。
这些习惯可以降低患癌症的风险。
因此,年龄在这里表现为一个混杂变量。

除非考虑到您的年龄。
您可能错误地认为收入越高,患癌症的可能性就越大。
正如你所看到的,夏季冰淇淋销量更高,受炎热天气影响的人也更多。
您可能认为吃冰淇淋会导致中暑。
事实上,夏天大家都会吃冰淇淋来消暑。
是因为太阳太热而你没有注意防晒的伤害。
温度在这里是一个令人困惑的变量。
发挥作用。

进行研究时,控制混杂变量非常重要。
美国国家科学院 2 01 8 年的一份报告发现,该研究没有充分控制混杂变量。
报告指出,6 0% 的结论是错误的。
因此,目前的研究主要集中在随机对照试验,比如给一组服用保健品,一组给安慰剂,其他条件都一样;因此,可以消除年龄和性别等混杂变量。

还有一些方法可以通过统计模型来处理这个问题。
例如,通过使用多元线性回归并添加年龄和性别等变量;可以清楚地看到自变量和因变量之间的真实关系。
《自然》杂志 2 02 0 年的一项研究就是这么做的。
分析了吸烟与肺癌之间的关联。
去除年龄因素后,吸烟对肺癌的影响显着降低。

所以在做研究的时候,不能只看表面的相关性。
2 01 5 年的一项研究分析了社交媒体使用与抑郁症之间的关系,但没有控制年龄。
被批评了。
后来的重新分析和年龄的增加发现这种关系并不那么重要。

简而言之,就是处理混杂变量;必须设计实验来控制它们,或者必须使用统计方法来校准它们。
这并不容易,但也不难。
关键是要意识到这一点。