分行业回归吗?
谢邀,这个问题其实是一个统计分析的方法论问题。 很多答主回答了怎么做,我来说明一下为什么这样做。 先摆结论,如果只要求有效,那么只需简单回归。如果要有效且方差齐,则需要做分行业回归(这里所说的“分行业”是字面含义,指不同的行业分类法,如金融地产、信息技术等);若要同时满足有效和方差齐两个条件,则必须做混合回归。以上结论成立的前提是被解释变量和解释变量都不存在二阶序列相关。
首先明确一点,无论做什么样的回归,结果的预测能力都是基于数据能够准确描述现实世界而产生的期望值,因此所谓的预测能力的差异实际上是没有意义的。真正的差异在于对真实世界因果关系的捕捉能力,这一直是经济学研究的核心内容之一。
当然,我们很多时候并不需要知道真实的因果关系是什么,例如在宏观层面大多数情况下我们并不需要了解造成GDP增长的原因究竟是什么,我们感兴趣的是GDP对经济增长的影响,至于这种影响是否是由某个政策导致的或者某种突发事件引起的并不重要。这时候只需要一个简单的回归就足够了。 但是还有一些情况就需要更复杂的分析方法了。
比如在微观层面,我们可能更关注个人收入的决定因素,这时候简单的回归已经不够了。因为个体之间是有差异的,可能同一行业中的人收入差别非常大,这时候我们需要区分不同特征的人群以获得每个个体的特定信息。但是这样直接分群体做回归又可能会引入错配的问题(比如将收入低于平均收入水平的人与收入高于平均收入水平的人放在一起做回归就会有问题)。一种解决方法是加入个体固定效应,也就是对于每一个个体,将其收入同其特征进行回归再取平均值。这种方法解决了错配的问题,但同时也会带来其他的问题——当个体的特征很难度量或者个体特征的数值越大说明该个体越极端,这两种情况的出现都会使得估计有偏且不稳定。
此外还有一种情况就是当被解释变量是时间序列数据时,简单地做回归会带来序列相关的错误。这时应该使用工具变量的办法或者分地区回归的办法来解决。 总之,是否需要做分行业的回归取决于你所研究的样本特点。如果被解释变量和解释变量不存在共线性并且不含有未观察到的个体或时间相关性,那么只需简单回归即可。否则需要运用更为复杂的方法。