量化交易为什么要进行因子正交化
发布时间:3小时前阅读:13
为什么要进行因子正交化
在数理统计学中,导致多因子模型失效的核心元凶叫做“多重共线性”(Multicollinearity)。简单来说,就是投资者精心挑选出来的不同因子之间,彼此存在着大量的“信息重叠和换汤不换药”。
举个典型的例子:市盈率(PE)和市净率(PB)这两个因子,在本质上都属于衡量股票是否便宜的“价值风格维度”。如果一家上市公司的盈利非常稳定,那么它的 PE 和 PB 通常会表现出极高度的线性正相关。如果我们在编写量化代码时,不加处理地直接把这两个因子同时乘以各自的权重放入打分模型里,就相当于在无形中对“价值这一单一种类的信息”进行了重复计算和变相的双倍加仓。这会导致打分系统发生严重倾斜,选出来的股票组合会极度集中于某一种单一的技术风格或行业板块,使得模型失去了应有的分散风险能力。
因子正交化的数学内涵与实现方法
所谓“正交化”,通俗来讲,就是利用线性代数的几何原理,将多只因子之间重叠的信息(相关性)彻底剔除和剥离,使得处理过后的新因子之间两两彼此独立,相关系数严格为零。
在具体的 Python 代码实现中,金融工程常用的正交化手段主要有两种:
- 施密特正交化(Gram-Schmidt Orthogonalization):这是一种基于顺序的线性逐层剥离法。先选定一个核心骨干因子(如市值因子),然后让第二个因子(如 PE 因子)对市值因子进行线性回归,提取出PE因子中无法被市值因子解释的“残差项(Residual)”作为全新的独立价值因子。通过这种逐个剔除重叠投影的做法,实现因子序列的两两清白。
- 对称正交化 / 独立成分分析(Symmetric Orthogonalization):这种方法不分先后,对所有因子一视同仁。它通过计算因子的协方差矩阵并进行特征值分解,将原始的因子矩阵一次性投影到一个全新的、彼此完全垂直(正交)的几何坐标系中,最大程度保留了原始因子的所有综合信息,同时消除了共线性。
经过正交化清洗后的因子打分模型,能够如同手术刀般精准地提炼出每只股票在价值、动量、质量、成长等各个完全不同维度的纯净含金量,选股组合的鲁棒性和稳定性通常会得到本质提升。
要把这样一套涉及高级线性代数、矩阵分解、每期调仓都需要进行全市场动态残差回归计算的复杂多因子正交化策略稳定推向实盘,手工操作是绝无可能完成的。无论是选择哪种工具,能提供完善投后支持的平台往往能让投资者少走弯路。目前国金证券在金融科技与创新交易通道的建设上走在了行业前列。散户投资者只需 10 万资金门槛即可快速开通国金证券官方支持的 QMT 或 PTrade 智能量化交易终端权限。在这两款标准的机构级系统运行环境里,内置了极其强悍的矩阵运算底座和丰富的数据科学扩展环境,支持无缝运行各种复杂的多因子去极值、标准化以及正交化算法。不仅如此,国金证券的基础信用配套健全,两融业务(融资融券)全面支持便捷的全线上开通。针对量化交易者在多因子选股模型构建、矩阵奇异值报错、财报披露期截面数据对齐等实操层面的技术痛点,国金证券更配备了专业的量化社群答疑与全套实操指导服务,陪伴技术型投资者科学、理性地搭建真正的机构级量化投资体系。
温馨提示:投资有风险,选择需谨慎。
-
REITs扩募是什么?普通人能参与吗?附APP实操指南
2026-06-15 13:24
-
投资Q&A:5个条件单“为什么没触发”之谜,一次答清
2026-06-15 13:24
-
理财问答选哪个?知乎vs叩富问财全面对比,一文搞懂
2026-06-15 13:24


问一问

+微信
分享该文章
