表示两个变量之间的关系的三种方法

说实话,当我刚开始学习这些统计方法时,散点图给我留下了深刻的印象。
我记得在做销售数据分析时,我制作了每月广告投入(横轴)和销售额(纵轴)的散点图。
乍一看,哇,景色真的像一座小山一样连绵起伏,我立刻就心旷神怡——钱花得值。
但也有惨痛的教训。
后来我才知道,销售的好坏与天气、竞品活动的关系更为密切。
广告投入与销量之间的关系其实很简单。

说到相关系数,我遇到了危险。
我曾经做过用户行为分析,计算出浏览时间和购买金额的相关系数为0.8 5 ,所以我认为两者应该是正相关的。
结果产品经理看到了,直接问道:“那为什么我们给用户做了很长的视频教程,销量却下降了?”我当时就脸红了——原来这叫假正相关。
后来我才知道,这取决于数据背后的因果关系,根据系数随意得出结论纯粹是自欺欺人。
皮尔逊系数实际上不能用作万能钥匙。

我什至不会提及回归分析。
第一次接触线性回归,老师直接喂气象数据,让我们预测降雨量。
在调整模型时,我使用了多项式尝试了回归和指数回归,发现最准确的是简单线性回归。
导师说:“你忘了回归的目的是解释关系,而不是画花哨的曲线吗?”我一直记得这一点。
后来做了市场预测,发现逻辑回归比线性回归有效很多,但是条件是要明白逻辑分布是什么,不然参数调整起来就像天书一样。

我找到了一种自己学习数学的方法。
例如,学习微积分时,不要局限于极限的定义。
首先想象一条切线的斜率,然后将其与物理例子(如自由落体)结合起来,突然你就会明白了。
在几何学上,我迷迷糊糊地记住了欧拉公式。
结果我的空间想象力很弱,逛了半天也想不通为什么多面体的顶点数+面数=边数+2 后来我开始每天看这个模型,然后慢慢的我开始意识到了。
最有效的就是研究题——不是盲目的,而是那种迫使你把所有相关知识点都过一遍的题型。
记得有一个冬天,我把《托马斯微积分》练习册从封面读到封底,上学期得了满分。

不过话说回来,学习统计学和学习数学似乎是不一样的。
当谈到统计时,我一直有“让数据说话”的直觉,但数学追求严格的证明。
有一次我参加建模比赛,队友只能做模型,但评委说:“你的假设与现实根本不符!”当时心里很难过,但现在我明白了,统计学是一门应用科学,只知道公式是没有用的。
你必须了解业务场景。
就像在绘制一个零散的情节一样,所有的想法都是混乱的。
您需要知道它是噪音还是真正的趋势。
哪有佛经可以教你这个?

变量之间的关系知识点

有关方法列表,请参阅下表。
自变量自动变化,因变量也相应变化。
分析方法是公式。
因变量写在等号的左侧。
包含自变量的公式代表因变量。

使用图像模式查看曲线。
横轴通常是自变量。
纵轴是因变量。

在匀速示例中,时间 T 是自变量,距离 S 是因变量。

因变量必须单独写入相对表达式中。
使用自变量来确定因变量的值。
自变量具有一个值,因变量具有一个值。