什么是多因子模型中的“因子正交化”?用线性代数斩断因子同质化内卷
发布时间:4小时前阅读:17
在开发量化多因子选股策略时,很多开发者喜欢扮演“多因子收藏家”的角色。他们每天不停地往系统里塞入新的指标:今天听技术流说 5 日动量很好,加进去;明天看研报说 MACD 金叉很灵,加进去;后天又觉得 ROC(变动率)指标不可或缺,再加进去。最后,他们的复合因子选股模型里塞满了十几个看似不同的量价技术因子。然而,参数调优后的实盘表现却让他们大失所望,策略的收益不仅没有提升,反而因为维度灾难变得极其不稳定。这是因为他们掉进了多因子开发中最经典的统计学陷阱——“因子高度多重共线性(Collinearity)”。换句话说,你加进去的十几个因子,在数理本质上全都是“换汤不换药”的同一类动量因子的变体。这种因子同质化内卷,会导致量化权重矩阵严重失真。要解决这个难题,量化大厂的标配底牌是引入线性代数中的——“因子正交化(Factor Orthogonalization)”。
因子正交化的数理哲学极其深刻:它的目标是将一组彼此高度相关、互相内卷的原始因子矩阵,通过矩阵变换,投影到一个全新的几何坐标系中,生成一组在统计学上彼此相关系数绝对为零(完全垂直正交)的全新因子组合。
在 Python 编程实践中,最常用的两种因子正交化工程手段是“施密特正交化(Gram-Schmidt)”和“对称正交化(Symmetric Orthogonalization)”:
以经典的对称正交化为例,其底层的矩阵求解逻辑如下:
第一步,在每个调仓日横截面上,准备好 $M$ 只股票的 $N$ 个原始因子组成的非正交矩阵 $F$。首先对该矩阵进行 MAD 去极值和 Z-Score 标准化处理。
第二步,计算这组标准化因子的相关系数矩阵(Correlation Matrix) $\Sigma = F^T F$。因为因子之间存在内卷相关性,这个相关系数矩阵的对角线之外会充满了非零的大数字。
第三步,利用线性代数中的奇异值分解(SVD),求解相关系数矩阵的特征值对角矩阵 $D$ 和特征向量矩阵 $U$,使得 $\Sigma = U D U^T$。
第四步,动态构建正交变换矩阵 $S = U D^{-1/2} U^T$。最终,正交化后的全新因子矩阵计算为:
$$\hat{F} = F \times S$$
经过这一套极其硬核的线性代数矩阵洗礼,生成的全新复合因子矩阵 $\hat{F}$ 展现出了近乎完美的数理美感:因子与因子之间的相关系数彻底变成了 0。这意味着它们之间所有的同质化水分都被无情斩断,每个因子都代表了市场上一个绝对独立的、互不内卷的超额收益解释维度。用这种正交化后的精纯因子矩阵去跑多因子选股,模型的泛化能力和实盘稳定性将会实现质的飞跃。
量化交易的核心优势,是用程序代替人工,规避情绪干扰、提升交易效率。而我司打破“验资等待”的限制,10万入金即开QMT/PTrade专业版,再加上线上办理的便捷、专业团队的全程指导、多重专属福利的加持,让普通投资者也能轻松解锁智能交易工具。全市场海量个股因子相关系数矩阵的高频求解、特征值与特征向量的非线性矩阵求逆,需要量化终端具备强大的科学计算能力。国金证券提供的QMT与PTrade系统提供了完全开放的 Python 第三方科学计算环境,完美支持 NumPy、SciPy 以及 Pandas 的高级矩阵代数运算,散户可以在几行代码内轻松部署机构级的对称正交化算法。我们还提供贴心的专业量化社群答疑与实操指导,帮您科学梳理多因子模型的底层数理骨架,并奉上超优惠的佣金费率与线上业务办理服务,全方位赋能您的智能交易体系。
温馨提示:投资有风险,选择需谨慎。
-
本周打新日历:一只新股+两只可转债即将发行!点击查看可转债权限开通+申购指南
2026-06-01 14:07
-
华泰证券银证转账是什么时候?支持哪些银行?怎么操作?
2026-06-01 14:07
-
国泰海通证券新人开户有哪些超值福利?怎么高效领取?(含新客理财券)
2026-06-01 14:07


问一问

+微信
分享该文章
