如何确认变量之间有因果关系?回归方程中的自变量X和因变量Y是否肯定有因果关系?

哈,你的问题有点学术性……不过没关系,我们来说说因果关系吧。
上周一位客户问我这个问题,这很有趣。

您发布的内容相当广泛。
因果关系是,当变量A发生变化时,变量B也会发生变化。
这种关系可以是直接的,也可以是间接的,中间可能有一个变量C导致了问题。
可能是A的变化引起B和C的变化,也可能是A和B的变化引起C。
关键是要满足几个条件:必须有相关性,必须有时间顺序,不能是复合关系。
例如,如果今天A消失,明天B消失,是否意味着A是B的原因?这绝对是不对的。
而且这种关系不能反过来,例如不能说变化B引起变化A。

确定这种因果关系主要有以下几种方法:
1 .归纳法就是寻找模式。
例如:
求同存异:多看几件事,如果只有一件事是相似的,那可能就是原因。
例如,如果你看到很多成绩好的学生,发现他们早上都吃了鸡蛋,那么鸡蛋可能就是原因。

如何找到差异:一件事存在,另一件事不存在。
这两件事除了一点之外是不同的。
这种差异可能就是原因。
例如,如果你感冒了,吃药后感觉好多了,但不吃药却不见好转,那么药物可能就是原因。

共变法:看到一个变量改变,另一个变量也会改变。
例如,如果您打开灯泡并且亮度变强,则亮度可能是原因。

其余法:当你知道了部分原因后,剩下的现象一定还有其他原因。
例如,如果您发现患者头晕,您就知道发烧和贫血可能都是原因。
如果您测试发烧,贫血可能是原因。

2 实验设计方法:这是最直接的。
它专门从事实验并控制其他可能影响它的事物。
这取决于一个因素是否改变而另一个因素是否改变。
比如,如果药物有效,我们可以设立一个对照组,一组吃药,另一组不吃药,看看效果。
这是确定因果关系的最佳方法。

3 统计分析方法:例如,也可以利用结构方程模型进行分析。
但这种方法比较复杂,需要专业技能。

关于你提到的回归分析,我比较了解。
它主要寻找变量之间的数学关系,比如X和Y是否线性相关,X是否可以用来预测Y。
但它并不能真正直接说X是Y的原因。
比如,如果你发现房价(Y)与面积(X)相关,你可以用回归分析得出一个公式,但这并不能证明面积是高房价的原因。
也可能有地点和市场情绪等原因。
回归分析可以帮助你看到变量之间的近似关系及其强度,但在因果关系方面它不具备这种能力。

所以你看,找出因果关系并不是那么容易的,你必须使用正确的方法。
您发布的摘要非常好,但您应该了解回归分析,而不是将其视为因果关系的铁证。

什么是“自变量”和“因变量”,二者之间是什

说白了,自变量和因变量就是实验中的“主体”和“结果”。
这种关系非常简单。

让我们谈谈第一件非常重要的事情。
在我们去年运行的项目中,自变量是用户曝光度的每日增长(大约 3 ,000 步),因变量是第二天的新注册数量。
当你看到曝光数量从 5 00 增加到 1 000 时,注册数量会跳跃,但不是成比例的。
很多人不注意这一点。
还有一点就是可控性极其关键。
例如,我们调整了广告模式的自变量,“限时优惠”可以实现比“免费试用”高2 0%的转化率。
这是典型的因果关系。
还有一件事非常重要。
例如,该效果用行话称为“SNOW”。
因为前面的一点延迟就会让整个事情变得糟糕。
例如,如果服务器的响应慢0.5 秒,用户的浏览速度可以增加一倍。
接下来是因变量对自变量微小变化的敏感性。

一开始我以为只要包含自变量就可以直接看到结果,但后来发现事实并非如此。
这也是一个赌场游戏。
例如,假期变量可能会干扰对外部因素的依赖。
当时我们几乎删除了所有数据。
等等,还有别的事。
观察的选择是严肃的。
去年,该组织发现了不当行为。
看起来自变量正在变化,但因变量却被指标所接收,结果他们得出了一堆错误的结论。
建议在下次实验之前,画出因果关系图,特别注意隐变量的干扰。