如何处理内生性问题

我记得有一次分析销售数据,发现促销活动和销售增长完全一致。
但经过调查,我们发现我们的竞争对手在此期间进行了价格竞争。
这让我想起了内生性问题,这是很难预防的。

例如,如果你想研究广告投入对销售额的影响,可以直接使用OLS模型,发现增加广告投入确实会增加销售额。
然而,销售额的增长实际上可能是由于季节性因素或整体市场复苏所致。
这些都没有包含在模型中,导致内生性。

有很多解决方案。
一项研究使用了工具变量方法。
例如,我们发现附近的区域。
那里的市场环境和我们差不多,但是广告策略是完全独立的。
我们发现,只有加大广告投入,销量才会大幅增长。
只有这样才能孤立广告的独立效应。

但是工具变量不小心丢失了。
它应该与密钥相同。
我阅读了寻找工具变量的研究,并尝试了几次但无济于事。
最后,我们发现当地政策变化仅影响广告成本,而不影响其他销售因素。
现在问题已经解决了。

话虽这么说,有时您的数据就是这样,最终控制变量中会出现残差。
既然如此,我们是否应该质疑,内生性是否真的无法消除?

固定效应模型的定义

个体效应和时间效应的含义

个体和时间的影响是不同的。

个体效应因人而异,并且不会随着时间的推移而改变。
例如,性别和性格终生不会改变。

时间效应是随着时间的推移影响每个人的东西。
比如政策调整、经济环境都会影响到每一个人。

固定效应模型(FE)只考虑人与人之间的差异。
双向固定效应模型 (TWFE) 同时考虑人和时间。

个体效应无法控制,人与人之间的差异可以作为变量。
在不控制时间效应的情况下,时间趋势可以被视为离散行为。

考虑到在分析工资时如果没有控制(个体效应),教育的预期回报肯定会不准确。
在分析投资时,如果经济周期(时间效应)无法控制,则必须将公司本身视为原因。

如果数据很多,可能无法处理高维虚拟变量,必须使用Lasso处理。
时间效应来回变化,导致分裂回归。

首先。

不随时间变化的工具变量怎么使用面板工具变量回归

坦白说,这很令人困惑。
不随时间变化的工具变量在面板回归中并没有真正的用处。
当时我不明白为什么会这样,后来我渐渐明白了。

你看,地理变量和历史变量不会随时间变化,但它们在经济研究中常用,因为它们通常是相当外生的。
然而,传统的 IV 方法,例如 ivreg2 或 xtivreg,需要工具变量的可变性,这是不可行的。

该怎么办?有很多技巧。

第一种方法是创建交互项并将工具变量和时间虚拟变量相乘。
例如,如果有一个不随时间变化的工具变量Z,我们可以根据时间段创建一些虚拟变量,例如2 01 0年的D1 和2 01 1 年的D2 ,然后计算ZD1 和ZD2 学者孙传旺2 01 9 年《经济研究》文章用它来研究交通基础设施对空气污染的影响。

第二种方法是将工具变量乘以时间趋势。
它与第一个类似,但使用时间趋势,例如年份。
它被用在 2 02 3 年《发展经济学杂志》一篇有关印度铁路的文章中。
只需取一年的变量T并计算ZT即可。
但需要注意的是,时间趋势应该是外生的,而不是内生的。
例如,您不能使用变量作为回归中的趋势。

第三种,Bartik工具变量。
这很特别。
它以不随时间变化的区域工业的比重来衡量全国工业的增长率。
随时间变化的乘数。
例如,如果计算S_ijG_j,则S_ij是行业i在行业j中的份额,G_j是行业j在全国范围内的增长率。
这个方法很好,可以利用横截面信息,解决内生性问题。

第四种方法是完全不使用面板数据,而只使用横截面数据。
例如,您获取 2 01 0 年或 2 01 1 年的数据并进行直接横截面回归。
这种方法虽然简单,但是比较浪费时间,而且效率可能不是很高。

老实说,使用哪种方法取决于你研究的具体情况、数据是什么样的、研究的目的是什么。