… and the Cross-Section of Expected Returns

这是2016年在金融学顶刊上的一篇文章,说的是世面上有大量的数据挖掘式的对于同一个时刻内股票回报率差异的研究。而华人金融学家张橹的文章Replicating Anomalies 更是复制了447个之前论文中的资产定价异象,发现其中80-90%的资产定价异象纯粹是噪音挖掘,完全没有任何统计上的证据。甚至我个人认为,这剩下的被论文复制成功的异象中,基本上也都是纯粹的基于历史的数据挖掘。比如说在回报率最高的异象R11^1,也就是持仓一个月的12个月动量(由于一个月反转因子的缘故扣掉最近一个月的收益),这个因子居然干掉了其他全部446个基本面和量价指标的因子。用最简单的常识想想,这个没有任何经济含义的因子肯定也是数据挖掘的产物。这种动量因子本身是由两种类型的股票构成的:(1)没有任何基本面支撑的垃圾题材股(2)那种有着强筋基本面支撑的常牛股。当然“基本面支撑”需要被良好的定义,这一点上每个人都有不同的观点和回测的依据。这些书呆子把(1)和(2)混为一谈给别人灌输,无非是因为(A)他们太笨了以至于认识不到这个问题(B)揭秘本质的规律会影响自己的投资表现。不过(B)的情况基本都是对冲基金不愿意发表论文的原因,而(A)恰恰是大部分知识分子faculty的真实写照了。

而张橹的q-factor甚至是q5-factor,在我看来都是非常错误的论文。一方面这种静态(time-series independent)的指标刻画未来股价变化的预测力,显然学过中学物理的人也知道量纲上存在问题。怎么能用一个静态的东西去预测变化?如果说未来资产价格的变化可以被现在的静态指标预测,为什么不一步到位现在就直接去到那个价格?ROE更是一个会计上扯淡的指标,很多公司会把ROE的分母用会计处理方式处理的匪夷所思,甚至Equity本身都会接近于0甚至是负数。在这种情况下ROE这个指标完全失真没有意义了。当然他们在这篇文章里他们对Fama的consumption CAPM的批判是完全成立的。Stochastic discount factor这个东西完全是错误的概念,如果所有消费者/投资者都能精确的计算出未来的现金流的分布的概率,那他们应该包办世界上所有的诺贝尔奖,甚至我可以说,他们就是上帝本人。他们甚至应该预测一下自己和地球上的任何人死亡时间的分布是什么样的,最大似然可能在哪一年哪一月哪一天死去。这样才能更好的给SDF的停时问题进行估计。

更准确的说,我对于CAPM模型也持否定的态度。我认同巴菲特和芒格说的CAPM是bullshit,波动率本身并不是风险的刻画。一个公司有2X的beta并不代表他的风险是index的2X。往往这种公司的各方面的指标都是index的2X才导致的beta接近于2。在这种情况下需要理解这些指标背后究竟是什么才能对公司有着正确的判断。过去10年内高beta股的绝对收益完全alpha策略,所有allocate alpha的money allocator从挣钱的角度(而不是从降低回撤的角度)都是严格的跑输高beta策略的。0和的alpha策略本身有点像money manager对于所有人(不管是Ultra-high-net-worth/pension/endowment/family office/穷人)的智商税。今年Citadel甚至开出5000万美元挖走了一个专门front-run 别人systemically alpha策略rebalancing的基金经理,可想而知这种数据挖掘式的0和alpha游戏纯粹是浪费时间,发现一个技巧就被人front-run一个。AQR这种智商税割韭菜的模式还能持续多久,真的不好说。但是按照绝大多数人类终极的韭菜性来看,我感觉AQR可能还能骗很长一段时间。