什么是多因子量化选股中的“因子共线性”？施密特正交化如何消除信息冗余_叩富网

立即提问“ ”

提问

北京[切换城市]

找证券公司 | 找期货公司

叩富问财>资讯>股票>什么是多因子量化选股中的“因子共线性”？施密特正交化如何消除信息冗余

什么是多因子量化选股中的“因子共线性”？施密特正交化如何消除信息冗余

发布时间：2026-6-6 15:29阅读：125

量化张经理股票

资质已认证

帮助10万+ 好评1293 入驻4年

问一问

在搭建量化多因子选股模型时，很多热衷于数据挖掘的投资者会利用计算机找出十几个甚至几十个在历史回测中表现优异的指标（如PE、PB、PS、EV/EBITDA等各种估值指标，或者10日、20日、60日等动量指标）。然而，当把这些因子组合在一起进行线性回归或者权重分派后，策略的最终选股效果不仅没有提升，反而比使用单一因子的效果还要差。导致这种尴尬现象的核心黑手，就是统计学中著名的“因子共线性”（Multicollinearity）。

因子共线性的本质，是信息的高度冗余。简单来说，你找出的这十几个因子，在数理本质上表达的是同一种市场逻辑。比如PE和PB高度相关，它们都属于估值维度的投影；20日动量和30日动量高度相关，它们都属于趋势维度的拷贝。

当你把高度相关的自变量同时输入线性回归模型时，会导致数学矩阵运算中的自变量协方差矩阵接近奇异矩阵。这不仅会使得计算出来的因子权重（回归系数）产生极大的方差和剧烈波动，还会放大历史数据中的随机噪声，最终导致整个策略在实盘中彻底翻车。

要在多因子框架中彻底解决共线性问题，必须在数据清洗和融合阶段，引入经典的数学投影工具——施密特正交化（Gram-Schmidt Orthogonalization）：

第一阶段，因子相关性截面检查。在每个调仓日，量化程序需要计算因子库中两两因子之间的相关系数（如Pearson或Spearman相关矩阵）。如果发现某两个因子的相关性持续超过0.65，说明共线性已经产生，必须激活正交化清洗算法。

第二阶段，执行几何正交化投影。施密特正交化的数学逻辑非常精妙：它将每一个新加入的因子，向由现有因子的向量空间进行垂直投影。通过向量减法，找出这个新因子中无法被现有因子解释的那一部分“残差向量”。这个新生成的残差向量与原有的因子空间是完全垂直（即相关系数为零）的。量化策略随后会使用这个洗净后的残差向量代替原始因子作为最终的选股排序标签。通过这种方式，既完美保留了新因子带来的独特增量信息，又彻底切断了它与旧因子之间的藕断丝连。

第三阶段，动态监控正交化后的有效性。正交化完成后，投资者需要重新计算各个残差因子的IC（信息系数）值。只有那些在剥离了其他因子影响后、依然具备独立Alpha贡献能力的残差因子，才配被赋予最终的权重。

量化交易的核心优势，是用程序代替人工，规避情绪干扰、提升交易效率。而我司打破“验资等待”的限制，10万入金即开QMT/PTrade专业版，再加上线上办理的便捷、专业团队的全程指导、多重专属福利的加持，让普通投资者也能轻松解锁智能交易工具。多因子截面正交化涉及极其庞大的线性代数矩阵运算和全市场历史财务/量价数据的实时对齐，手动或常规Excel工具完全无法承载。依托国金证券提供的QMT与PTrade系统，投资者可以利用内置的Python环境，直接调用NumPy和Pandas科学计算库轻松编写矩阵正交化算法。此外，我们提供贴心的专业量化社群答疑与实操指导，帮您梳理多因子量化框架，并配套超优惠的佣金费率与线上业务办理，助力您的智能选股策略稳定运行。

温馨提示：投资有风险，选择需谨慎。

量化张经理

两融账户可在线办理，支持智能条件单和网格交易，佣金成本价

+微信

当前我在线最快30秒解答立即追问 99%的人选择

文章很精彩？转发给需要的朋友吧

版权及免责声明：本文内容由入驻叩富问财的作者自发贡献，该文观点仅代表作者本人，与本网站立场无关，不对您构成任何投资建议。用户应基于自己的独立判断，自行决策投资行为并承担全部风险。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，请发送邮件至kf@cofool.com 举报，一经查实，本站将立刻删除。

推荐相关阅读

量化交易中的多因子策略，如何处理因子的非线性关系？

在量化交易的多因子策略里，处理因子的非线性关系有不少办法。一种是用多项式回归，把因子和预期收益的关系用多项式来表示，能捕捉到更复杂的关系。还有神经网络方法，它就像一个智能大脑，能自动学习因子间的...

资深张经理

AI策略在天勤量化中运行时，如何通过因子正交化处理减少因子间冗余？

天勤量化通过“因子正交化优化系统”减少因子冗余，核心措施有三。一是因子相关性检测，AI计算天勤策略中各因子的相关系数，对相关性＞0.7的因子对进行正交化处理（如用主成分分析提取独立因子），某策略...

量化交易中的多因子策略如何处理因子的共线性？

在量化交易的多因子策略里，处理因子的共线性是个重要事儿。首先，可以用因子筛选的方法，挑选那些相关性低的因子，把相关性高的因子剔除，让因子组合更合理。还能采用主成分分析，它能把多个相关因子转化成少...

资深张经理

如何衡量因子之间的相关性？因子共线性的处理方法？

皮尔逊相关系数、斯皮尔曼秩相关、信息系数（IC）。共线性处理：剔除高相关因子（阈值如|ρ|>0.7）、因子组合（如合成动量因子）、降维（PCA）

资深安老师

QMT量化中的多因子选股模型实战

多因子模型是2026年量化投资的中流砥柱。在QMT上，投资者可以轻松实现因子的筛选、打分与组合。因子的标准化处理原始数据往往量纲不同（如PE是几十，而ROE是百分比）。在QMT中，通过Python脚本对因子进行去极值、标准化处理是第一步。这能确保所有因子在同一个维度上公平地参与选股打分。动态权重的分配并不是每个因子的有效性都是恒定的。在牛市中，动量因子可能占主导；而在震荡市，估值因子可能更有效。QMT支持动态权重调整，系统可以根据过去一个月的因子IC值，自动调整模型中各个因子的占比，确保持仓时...

量化选股模型：从多因子到基本面量化

量化选股已从早期的纯技术指标扫描，演进到2026年的深度基本面量化。这种模式结合了机器的高效处理能力与对行业逻辑的深刻理解。一个典型的量化选股模型会首先进行“初选剔除”，过滤掉退市警示、流动性极低以及财务存疑的品种。随后，进入“多因子打分”环节。除了PE、ROE等财务因子，现在的模型会引入“研发投入强度”、“专利增长率”等代表成长质量的因子。更高级的模型会进行行业对冲，通过做多一篮子优质股并做空行业指数，获取超额收益（Alpha）。在白描式的量化视角下，个股不再是情感的寄托，而是...

#快进~大佬持仓股遭曝光# @ 群友热聊中~

你我皆凡人 11:51

@雅欣四月你好，如何衡量因子之间的相关性？因子共线性的处理方法？谢啦~

程老师 11:51

皮尔逊相关系数、斯皮尔曼秩相关、信息系数（IC）。共线性处理：剔除高相关因子（阈值如|ρ|>0.7）、因子组合（如合成动量因子）、降维（PCA）

津门富婆 11:51

我最近股票亏了，不想全仓冒险了，能否给我一些稳定收益+搏高收益的产品，我配置一些对冲风险？

刘老师 11:51

跟刚才的群友一样，还是需要70%的稳定增值的钱+30%搏高收益，我私信你了，看下配置单~

218人正在群聊

加入微信热聊>

上一篇资讯：

量化日内T+0策略的终极魔咒：如何用代码计算“冲击成本”以防微利被吞噬

下一篇资讯：

量化策略开发避坑：为什么说参数优化中的“参数孤岛”是实盘爆仓的温床

TA的文章全部>

TA的回答全部>

优选券商更多>

长城证券

极速开户、市场口碑好、新客服务

开户

银河证券

资金雄厚、极速开户、品质服务

开户

华泰证券

千万投资者之选，专业券商，品质服务

开户

国金证券

资金雄厚、实力认证、品质服务

开户

国金证券

实力认证、市场口碑好、安全可靠

开户

广发证券

服务一流、开户享VIP佣金费率

预约

银泰证券

资金雄厚、安全可靠、实力认证

开户

回到顶部

关于叩富问财/ 股票开户/ 期货开户/ 期货答主/ 股票答主/ 保险答主/ 炒股大赛

理财有风险，投资需谨慎

免责声明:本站问答内容均由入驻叩富问财的作者撰写，仅供网友交流学习，并不构成买卖建议。本站核实主体信息并允许作者发表之言论并不代表本站同意其内容，亦不代表本站对该信息内容予以核实，据此操作者，风险自担。同时提醒网友提高风险意识，请勿私下汇款给作者，避免造成金钱损失。点击查看全部>

App下载商务合作网站地图最新内容城市索引全国答主排行证券公司索引期货公司索引

公众服务

微信服务，随时可得，扫码一键关注

叩富问财

问一问，财不偏
30秒问财/秒答

叩富网销学苑

网络获客培训
分享获客经验

叩富简投

模拟交易/有奖大赛
ai炒股机器人/炒股百宝箱

联系我们

客服热线：010-59490342

客服咨询

入驻认证咨询
券商合作用户咨询/有奖炒股大赛咨询

意见反馈不良信息举报电话：010-59490342 举报微信：524272835 网站法律顾问叩富网2008年被上海证券交易所选为年度投资者教育训练网站 | 国家高新技术企业

ICP备案：京ICP备18019099号-3 增值电信业务经营许可证京B2-20241016 广播电视节目制作经营许可证：（京）字第18189号经营许可证编号：京B2-20190488 京公网安备：11010802032515号
叩富网版权所有 © 2007-2025