浅谈多因子策略中的“市值中性化(Size Neutralization)”数学原理与技术纠偏
发布时间:5小时前阅读:20
在A股量化多因子选股策略的开发中,很多初学者在跑完历史回测后,会得出一个看似极其颠扑不破的真理:小盘股的整体超额收益(Alpha)远超大盘股。于是,在没有做深层次数据预处理的情况下,策略代码在根据各种财务因子(如低市净率PB、高净利润增长率)进行全市场打分时,算法筛选出来的全市场前50名优质个股,几乎清一色全都是市值在30亿元以下的小市值或微盘股。
这种多因子模型如果不做“市值中性化(Size Neutralization)”处理,在实盘运行中会面临极其致命的逻辑隐患。因为策略在表面上是一个“综合了价值、成长和质量的多因子策略”,但在底层数学结构上,它已经严重退化为了一个纯粹暴露在小市值风格(Size Factor)之下的单向赌博单。一旦市场风格发生剧烈切换(例如国家队资金集中护盘大盘蓝筹股,微盘股由于流动性危机遭遇集体无量踩踏),这类未经中性化处理的策略,其持仓净值会遭遇毁灭性的断崖式暴回撤。
市值中性化的底层技术原理
市值中性化的核心逻辑非常纯粹:在多因子打分前,通过数学手段强行剔除个股原始因子值中由于“市值体量不同”而带来的天然偏误,将所有个股拉回到同一个纯净的虚拟起跑线上。
为什么要这样做?因为A股市场中,许多核心财务指标与上市公司的市值体量之间,存在着天然的非线性绑定关系。例如:小盘股由于资产基数极小,其单季度的净利润增长率很容易飙升至100%甚至更高;而诸如工商银行、中国石油等市值数万亿元的巨型巨型航母,由于其业务体量极其庞大,其净利润增长率在数学上几乎不可能出现暴增。
如果直接对“净利润增长率”进行横截面全局排序,小盘股会凭借其天然的体积优势,天然地将大盘股全部挤出得分榜。市值中性化就是要消除这一不公平优势,让模型去精准寻找“谁是大盘股里成长性最好的企业”、“谁是小盘股里估值最低的明珠”。
核心技术实现:基于多元线性最小二乘法(OLS)的残差提取
在具体编写QMT或PTrade的Python策略时,市值中性化通常紧跟在行业中性化之后联合执行。为了在数学上最严密地切断市值因子的污染,量化界主流的技术手法是——横截面残差提取法。
其具体的数学回归方程如下:
F
a
c
t
o
r
i
=
β
0
+
β
1
⋅
ln
(
S
i
z
e
i
)
+
∑
k
=
1
M
γ
k
⋅
S
e
c
t
o
r
k
,
i
+
ϵ
i
Factor
i
=β
0
+β
1
⋅ln(Size
i
)+∑
k=1
M
γ
k
⋅Sector
k,i
+ϵ
i
其中:
F
a
c
t
o
r
i
Factor
i
代表个股
i
i 当前的原始因子分(如原始PB或原始成长得分)。
ln
(
S
i
z
e
i
)
ln(Size
i
) 是个股
i
i 当天真实总市值的自然对数。之所以要取对数,是为了将跨度极大、严重右偏的市值分布强行压缩并修正为近似服从正态分布的规整数据。
S
e
c
t
o
r
k
,
i
Sector
k,i
是行业独热编码哑变量,用于在剔除市值影响的同时,连带把行业背景偏误一并消解掉。
利用 Python 的 statsmodels 库中的 OLS 最小二乘法函数,我们可以轻松在代码中完成这一纠偏过程。回归方程计算完毕后,我们彻底丢弃掉由回归系数
β
1
β
1
和市值对数计算出来的“由体积决定的预测部分”,仅仅将回归方程的残差(Residuals)
ϵ
i
ϵ
i
提取出来,作为该个股最终用于选股打分的纯净因子分。
这个残差在几何数学意义上,已经与总市值对数轴实现了绝对的正交(Orthogonal),这意味着它的数值大小与公司市值是大是小再无半点线性因果关系,包含了纯粹由个股经营特异性所带来的独立超额超额Alpha。
市值中性化实操中的高频避坑小技巧
散户投资者在本地编写市值中性化回归函数时,极易落入“多重共线性(Multicollinearity)引发的矩阵奇异报错”陷阱中。
这通常发生在行业哑变量与市值因子同时参与回归计算的时刻。在A股的某些特定行业中,成分股的市值具有高度的单一集中性(例如银行板块内的成分股全都是千亿以上的巨型大盘股,而某些新兴软件服务行业的成分股清一色全都是几十亿的小盘股)。
如果代码中不加辨别地将所有的行业哑变量与市值对数共同塞进线性回归模型,会导致自变量之间出现极其严重的近乎完美的线性相关。这在数学上会导致多元回归的特征矩阵决定式逼近于零,系统直接抛出致命的 LinAlgError: Singular matrix 报错,导致程序化实盘在盘中调仓节点卡死挂起。
防范这一红线的硬核解决技术是:在调用OLS回归函数前,必须强制引入主成分分析(PCA)对自变量矩阵进行降维去噪;或者引入 脊回归(Ridge Regression)。通过在损失函数中人为加入一个
α
α 惩罚项(
L
2
L
2
正则化化),强行压制多重共线性带来的矩阵不稳定震荡,从而确保多因子流水线在任何复杂的截面市场风格下,都能极其平稳、流畅、高可用地运行下去。
量化交易的核心优势,是用程序代替人工,规避情绪干扰、提升交易效率。而国金证券打破“验资等待”的限制,10万资金即开QMT/PTrade专业版,再加上线上办理的便捷、专业量化社群答疑与全程指导、超优惠的佣金费率加持,让普通投资者也能轻松解锁智能交易工具。
温馨提示:投资有风险,选择需谨慎。
-
叩富网:18年财商教育,学练问一站式成长
2026-06-08 16:08
-
开通证券账户时涉及的账户、账号、密码都有哪些?
2026-06-08 16:08
-
新手选股总踩坑?国金AI选好股,帮你轻松找潜力股
2026-06-08 16:08


问一问

+微信
分享该文章
