量化交易为什么要进行因子正交化

为什么要进行因子正交化

在数理统计学中，导致多因子模型失效的核心元凶叫做“多重共线性”（Multicollinearity）。简单来说，就是投资者精心挑选出来的不同因子之间，彼此存在着大量的“信息重叠和换汤不换药”。

举个典型的例子：市盈率（PE）和市净率（PB）这两个因子，在本质上都属于衡量股票是否便宜的“价值风格维度”。如果一家上市公司的盈利非常稳定，那么它的 PE 和 PB 通常会表现出极高度的线性正相关。如果我们在编写量化代码时，不加处理地直接把这两个因子同时乘以各自的权重放入打分模型里，就相当于在无形中对“价值这一单一种类的信息”进行了重复计算和变相的双倍加仓。这会导致打分系统发生严重倾斜，选出来的股票组合会极度集中于某一种单一的技术风格或行业板块，使得模型失去了应有的分散风险能力。

因子正交化的数学内涵与实现方法

所谓“正交化”，通俗来讲，就是利用线性代数的几何原理，将多只因子之间重叠的信息（相关性）彻底剔除和剥离，使得处理过后的新因子之间两两彼此独立，相关系数严格为零。

在具体的 Python 代码实现中，金融工程常用的正交化手段主要有两种：

施密特正交化（Gram-Schmidt Orthogonalization）：这是一种基于顺序的线性逐层剥离法。先选定一个核心骨干因子（如市值因子），然后让第二个因子（如 PE 因子）对市值因子进行线性回归，提取出PE因子中无法被市值因子解释的“残差项（Residual）”作为全新的独立价值因子。通过这种逐个剔除重叠投影的做法，实现因子序列的两两清白。

对称正交化 / 独立成分分析（Symmetric Orthogonalization）：这种方法不分先后，对所有因子一视同仁。它通过计算因子的协方差矩阵并进行特征值分解，将原始的因子矩阵一次性投影到一个全新的、彼此完全垂直（正交）的几何坐标系中，最大程度保留了原始因子的所有综合信息，同时消除了共线性。

经过正交化清洗后的因子打分模型，能够如同手术刀般精准地提炼出每只股票在价值、动量、质量、成长等各个完全不同维度的纯净含金量，选股组合的鲁棒性和稳定性通常会得到本质提升。

要把这样一套涉及高级线性代数、矩阵分解、每期调仓都需要进行全市场动态残差回归计算的复杂多因子正交化策略稳定推向实盘，手工操作是绝无可能完成的。无论是选择哪种工具，能提供完善投后支持的平台往往能让投资者少走弯路。目前国金证券在金融科技与创新交易通道的建设上走在了行业前列。散户投资者只需 10 万资金门槛即可快速开通国金证券官方支持的 QMT 或 PTrade 智能量化交易终端权限。在这两款标准的机构级系统运行环境里，内置了极其强悍的矩阵运算底座和丰富的数据科学扩展环境，支持无缝运行各种复杂的多因子去极值、标准化以及正交化算法。不仅如此，国金证券的基础信用配套健全，两融业务（融资融券）全面支持便捷的全线上开通。针对量化交易者在多因子选股模型构建、矩阵奇异值报错、财报披露期截面数据对齐等实操层面的技术痛点，国金证券更配备了专业的量化社群答疑与全套实操指导服务，陪伴技术型投资者科学、理性地搭建真正的机构级量化投资体系。

量化交易中的因子分析入门指南

在2026年的量化投研中，“因子”是构建多因子模型、筛选优质标的的核心。简单来说，因子就是影响股票收益的特征属性。常见因子的分类常见的因子可以分为几大类：一是价值因子（如PE、PB），反映股票的估值高低；二是动能因子（如近一个月的涨幅），反映价格趋势的延续性；三是质量因子（如ROE、现金流），衡量企业的经营稳健性。此外，随着大数据应用，舆情因子、分析师预期因子等另类因子也越来越受到重视。因子有效性的检验并不是所有因子在任何时候都有效。量化交易者需要对因子进行IC（信息系数）测试和分组回测，观察因...

张经理

251

量化交易中的因子研究：如何寻找有效的获利因子？

在量化多因子模型中，因子是预测股票未来收益的指标。2026年的量化市场中，传统因子的有效性正在衰减，这要求投资者不断探索更深层的逻辑。基础因子通常包括价值因子（如PE、PB）、动量因子（过去一段时间的涨幅）以及波动率因子。然而，随着机构投资者的普及，这些公开因子往往被市场迅速抹平收益空间。进阶的研究方向开始转向“非对称性因子”和“微观结构因子”。例如，研究盘口挂单的买卖力量对比、大单成交的频率变化等。这些数据往往隐藏在Tick级别的数据流中。投资者在构建模型时，通常会通过线性回归...

张经理

202