多元回归分析的应用

说白了,多元回归分析就是利用多个自变量来预测一个或多个因变量。
重要的是它是“一对多”还是“多对多”,是线性的还是非线性的。

扩展一下,我们先来说说最重要的事情:“一对多”线性回归。
在我们去年进行的电商项目中,根据年龄和浏览时间(自变量)对用户消费(因变量)进行线性预测。
大约有 3 ,000 个数据级别,R² 到 0.7 5 的拟合优度就足够了。
还有一点,在估计回归系数时,不要只关注系数的大小,还要看t检验P值。
去年,有一个项目忽略了这一点,并在模型中包含了不相关的变量。
最后,模型的泛化能力极差。
还有另一个重要的细节。
Residue analysis must be performed.起初我以为只看系数就足够了,但后来我发现有些不对劲。
比如行话里叫雪崩效应。
事实上,前部的一个小延迟就会拉低整个后部。
这种类型的问题除了在残差图中是看不到的。
等等,还有一件事。
Unity Design 3 .00软件确实很方便,但不要认为它是万能的。
例如,非线性回归求解起来就相当麻烦。
很多人不重视这一点。

课本要求中提到的聚类分析,其实和回归没有直接关系,都是数据挖掘中的技术工作。
回归的核心是寻找变量之间的“粗略”线性关系,这种关系并不是绝对准确的。
You must be aware of this.
下次使用回归分析时,应该先画散点图看看趋势。
如果数据点看起来像杂乱的星星,则线性模型可能不合适。

多元线性回归分析有什么作用?通常可以得到那些结果

嘿,你多次提到线性回归......我以前在项目中使用过它。

上周一位客户向我询问这些数据。
他不明白为什么同样的信息,之前的结果与我之前给他的结果不同。
后来查了一下,好像是它的软件修复错误了。
他使用了一些不标准的插值方法,结果是他跑错了。
这说明“只要使用的模型和数据相同,通过标准统计方法就可以计算出唯一的结果”这句话是正确的。
这件事有点像解方程。
如果您遵循标准步骤,结果将是非凡的。

你说得对,比下线回去更有实用价值。
想一想,目前什么样的研究或者业务没有受到这么多因素的影响?例如,卖房子时,价格肯定不仅与面积有关,还与位置、房间类型、社区面积和当地设施有关。
如果只用当地的预测,肯定是不准确的。
如果把很多因素综合起来,预测结果会好很多。
当年我在上海做一个2 02 3 年的零售项目,用商店位置、人流量、3 公里内咖啡馆数量和天气温度来预测周末销售,这比单独使用一个变量更准确。

不过,我应该补充一下我后面提到的“自变量选择点”。
例如,第3 点“自变量之间必须存在某种程度的互斥”在实践中就特别有问题。
有时,您选择的自变量(例如“城市人口”和“每户收入中位数”)可能在某种程度上高度相关。
它们当然不是完全不兼容的。
如果此时强行执行,模型可能会不稳定,预测结果可能会被破坏。
当时我有一个数据集,客户告诉我输入“年龄”和“消费能力指数”。
我说放一个吧,如果把两者放在一起的话,模型会把“老年人消费能力指数较低”这个关系搞混了。
后来客户不听,模型带来了很多奇怪的结论。
最后,还是把其中一个去掉比较好。

还有第4 点,“自变量应该有完整的统计信息。
”这个很现实。
我在2 02 3 年冬天给杭州的一个农业客户做分析,他想预测玉米产量,选择了降雨量、日照时数、氮磷钾肥用量作为自变量。
2 01 8 年以后,当地农业部门完成了氮肥用量的全面调查,确认所有记录都是手写的,当时我很困惑。
我们建议客户只从2 01 8 年开始运行模型,稍后,但它并不那么容易使用,模型本身是标准的,但数据和变量的选择确实取决于你。

多元回归主要解决以下几个方面的问题

2 02 2 年,我参与了一个城市的大型回归分析项目。
当时,我们面临着大数据和很多变量。
首先,这些变量之间是否存在真实的关系;我们必须找出是否真的存在如此显着的相关性。
必须构建一个数学模型来描述这些关系,就像试图将拼图一块一块地拼凑起来一样。

当时的我很迷茫,思考了太多的变数。
他们之间可能是什么关系?然而,通过统计分析,我们发现了一些有趣的模式。
然后,我们开始使用这个模型进行预测,例如预测某些经济指标的变化或评估一项政策的影响。
这就像玩猜谜游戏,您使用给定的信息来预测未知值。

我记得有一次预测一个城市明年的失业率,结果相当准确。
当时我就很自豪,觉得我们的模式真的管用。
然而,我知道预测总是有风险的;事实上,在未来没有人能够预测会发生什么。

后来我们开始统计分析,找出主要影响失业率的因素。
有些因素是显而易见的,例如经济状况和政府政策,但人口结构和教育水平等次要因素也需要仔细研究。

通过这样的分析,我们对失业率背后复杂的因果关系有了更深入的了解。
这对我个人来说也是一次学习经历。
多元回归不仅仅是一个数学游戏;我慢慢意识到它可以帮助我们更好地了解世界并做出更好的决策。
嗯,现在就这样。