量化选股策略中的“幸存者偏差”是什么?对回测结果有什么影响?
发布时间:2小时前阅读:31
对于量化投资的探索者而言,“数据”是一切策略得以确立的基石。然而,如果数据源本身在源头上就存在污染或者不完整,那么基于这些数据计算出来的所有回测报告都将变成美丽的谎言。在基本面因子选股策略以及小市值轮动策略的回测中,最容易让市场参与者掉入且不自知的深坑,就是大名鼎鼎的“幸存者偏差”(Survivorship Bias)。
幸存者偏差这一概念源于军事学,在股票量化领域的表现形式可以白描为:在对历史数据进行回测时,回测系统所使用的股票池,只包含了当前这个时间节点依然在市场上正常上市交易的“幸存者”公司,而有意或无意地忽略了在历史演进过程中已经遭遇退市、被强制暂停上市、或者因重大重组而长期停牌更名的“失败者”公司。
这种数据上的残缺,会对量化策略的回测结果造成极其严重的扭曲,具体负面影响表现在以下两个核心维度:
首先,它会大幅度、虚假地调高策略的历史年化收益率。举个最具代表性的例子:假设某位投资者设计了一个专门买入全市场市值最小的后10只股票的“小市值轮动策略”,并在系统里跑通了2016到2026年的十年回测。如果回测系统使用的股票池是2026年当前的最新A股列表,系统在倒推回2018年时,选出的小市值股票全部是如今历经风雨依然存活的优质标的。然而在真实的2018年,那些真正市值垫底的公司,有很多在随后的几年里因为触发了面值退市新规、财务造假红线而彻底从A股退市消失了。真实的实盘如果买入它们,资产将直接面临清零。由于回测抹去了这些退市股的亏损记录,最终出来的净值曲线自然显得惊艳无比。
其次,它会严重低估策略的真实最大回撤。一个没有剔除幸存者偏差的策略,其回测报告显示的最大回撤可能只有区区10%,给投资者造成一种“低风险”的幻觉。而一旦到了实盘,由于真实的股票池里包含了各种随时可能爆雷、连续吃跌停甚至直接走向退市的风险标的,策略的真实回撤往往会超出想象,导致投资者的本金承受不可逆的器质性损伤。
要斩断幸存者偏差的魔爪,唯一的客观解决方案就是引入“动态全历史成分股数据库”。在历史回测的每一个具体的时间节点(例如2017年5月12日),系统进行选股过滤的基数股票池,必须严格等同于当天在交易所真正挂牌交易的实际股票总数,必须把当时还在市、后来退市的股票原封不动地包含进来。
量化交易的核心优势,是用程序代替人工,规避情绪干扰、提升交易效率。而我司打破“验资等待”的限制,10万入金即开QMT/PTRADE专业版,再加上线上办理的便捷、专业团队的全程指导、多重专属福利的加持,让普通投资者也能轻松解锁智能交易工具。针对幸存者偏差等常见的数据陷阱,我司提供的QMT与PTrade平台均内置了经过严格清洗、包含历史已退市股票的动态全生存期高精度行情数据库,确保您的每一个回测结果都百分之百贴近真实历史。同时,我们的专业量化社群答疑团队随时在线,帮您把关策略逻辑。配合我们线上办理提供的特惠超优惠佣金费率,用扎实的数据底座和低廉的摩擦成本,为您的量化实盘保驾护航。
温馨提示:投资有风险,选择需谨慎。


问一问

+微信
分享该文章
