量化投资中的回测、因果关系与模型风险

量化金融持续辩论模型驱动投资策略的可靠性和局限性。一个核心问题是投资者应该对回测赋予多少权重。

《因子的幻象:量化模型如何出错》 中,Marcos López de Prado 博士和 Vincent Zoonekynd 博士阐述了为什么投资者应该超越仅仅接受历史表现,而应专注于理解模型为何有效。这是加强量化投资严谨性的宝贵贡献——同时也引发了对这种推理结构的进一步反思。

或许有助于将问题不是视为相关性和因果关系之间的二元选择,而是视为一个多层次的问题,其中不同的推理形式扮演着不同的角色。

在实践中,选择往往并非在简单的相关性与完全确定的因果关系之间。大多数投资研究都处于两者之间。有时我们可以直接描述和测试一个机制。有时则不能。系统可能变化太快,关键变量可能只有部分可观测,或者建立更丰富模型所需的时间和资源可能不可得。

在这种情况下,基于关联的推理仍然有价值。这不是金融学的缺陷;它是不确定性下决策的一般特征。

约束下的关联

当没有时间构建完整的因果解释时,人类常常依赖关联。这不一定是不理性的;它可以是适应性强的。快速关联可以在更慢、更复杂的推理成为可能之前指导行动。

投资实践中也是如此。当相关驱动因素无法直接观察或因果结构仅部分理解时,关联信号仍可能包含有用信息。

关联不等于解释。问题不在于关联是否有价值,而在于它是否足够。对于机构投资者而言,这一区别对尽职调查具有实际意义,包括管理者如何论证系统性模型中变量纳入和排除的合理性。当更强的结构知识存在时,忽视它并非精明;而是信息损失。关联有其位置,但它不应成为终点。

金融领域加强因果关系纪律的呼声并非新事物。更有趣的问题在于,如何在不简化市场本身性质的前提下,将这种纪律融入其中。

流行病学作为结构化推理的模型

流行病学家不会将流行病分析为一个与已知传播方式无关的纯粹统计模式。如果易感者可能被感染,感染者可能康复或被移除,那么这些知识就成为了模型结构的一部分。

SIR(易感者、感染者、康复者)和 SEIR(易感者、潜伏者、感染者、康复者)等隔室模型形式化了这些转变。统计方法仍然是估计参数和检验拟合度的关键。但分析并非从一张白纸开始;它始于既定的因果结构。

金融可以从中学到类似的教训。如果耐久机制得到合理理解,就应该明确表示。如果杠杆放大了被迫卖出,再融资条件塑造了违约风险,库存影响了定价能力,被动资金影响了需求,或者网络结构传递了困境,这些不仅仅是反复出现的相关性。它们是可以建模、测试和挑战的机制。

动态模型在这里特别有用。回归捕捉了同步运动;动态模型代表了股票、流量、延迟和反馈。在金融领域,这可能意味着资产负债表能力、融资条件、资本流动或采用动态。这类模型有助于阐明系统状态如何演变以及今天的条件如何塑造明天的结果。

反射性与适应性市场

金融与流行病学不同。

市场具有反身性。信念影响价格,而价格又反过来重塑信念、激励和融资条件。一个叙事可以吸引资本;资本流动可以推动价格;价格上涨可以强化最初的叙事。看似持久的关系,在一段时间内可能只是自我强化的循环。

因果关系推理仍然至关重要,但相关的结构本身可能包含信念、流动和结果之间的反馈。

三层框架

投资研究可以在三个不同但相关的层面上进行:

  1. 关联性: 哪些因素看似具有预测性,即使是不完美的?
  2. 因果: 哪种机制可能产生这种关系?
  3. 反射性: 信号的使用本身如何改变行为、拥挤交易、改变流量或重塑被建模的环境?

从这个角度来看,这场辩论不是关于选择相关性而非因果关系。它在于知道何时关联足够,何时必须明确建模机制,以及何时反射性反馈使系统比任何方法所假设的更具适应性。

很少有严肃的量化研究人员会不加审视地捍卫相关性。稳健的实践已经包括压力测试、经济直觉和结构推理。问题不在于因果关系是否重要,而在于我们是否明确知道哪一层在做工作——以及这些层如何相互作用。

迈向更规范的量化实践

当因果知识可用时,我们应该使用它;当有因果假设时,我们应该进行检验。当一个现象涉及积累、延迟或反馈时,动态模型可能比静态统计拟合更合适。

基于关联的思维方式仍然扮演着重要角色,尤其是在时间和可观测性的限制下。但在存在既定结构的地方,忽视它并非高明;而是信息损失。

量化金融的机会不在于用一种方法论口号替换另一种。而在于变得更加自律,更加透明地阐述不同推理形式如何为稳健的投资研究做出贡献——何时模式足够,何时需要机制,以及当反身性要求我们将市场视为由我们自身参与塑造的自适应系统时。

因此,投资研究的未来不太可能仅仅是相关性研究或狭隘的因果关系研究。它将更加多元化、更加动态,并且更加明确地揭示那些仅仅看似稳定和那些能够维持这种稳定性的机制之间的区别。


参考文献

López de Prado, Marcos,和 Vincent Zoonekynd。《 因子的幻象:量化模型如何出错 》。《企业家投资者》,CFA 协会,2025 年 10 月 30 日。

Delli Gatti D, Gusella F, Ricchiuti G. 内生波动与外生波动:揭示异质预期的冲击影响。宏观经济学动态。2025;29:e125. doi:10.1017/S1365100525100345

Gigerenzer, Gerd, 和 Daniel G. Goldstein. “快速且节俭的推理方式:有限理性的模型。”心理评论 103, 第 4 期 (1996): 650–669.

Kermack, W. O., 和 A. G. McKendrick. “对流行病数学理论的贡献.” 伦敦皇家学会会议录. 系列 A 115, 第 772 期 (1927): 700–721.

Greenwood, Robin, Samuel G. Hanson, 和 Lawrence Jin. “信贷市场中的反射性.” NBER 工作论文 No. 25747, 2019 年 4 月.

韭菜热线原创版权所有,发布者:风生水起,转载请注明出处:https://www.9crx.com/97534.html

(0)
打赏
风生水起的头像风生水起普通用户
上一篇 2026年4月20日 01:28
下一篇 2026年4月23日 23:12

相关推荐

  • 加密货币 ETF:以太币与比特币并非非此即彼

    加密货币 ETF:以太币与比特币并非非此即彼 有人喜欢加密货币,有人讨厌加密货币,但不可否认的是,加密货币已经撼动了金融市场。这种兴奋感已经蔓延到 ETF 领域,这标志着加密货币(新的数字前沿)和 ETF(通常处于创新前沿)之间的完美结合。现货比特币 ETF 的推出似乎是这一传奇的重要里程碑。但推出后,兴奋感并没有消退,关于现货以太币 ETF 的讨论保持了这…

    2024年7月29日
    8700
  • 北京大学R语言教程(李东风)第4章: 数值型向量及其运算

    数值型向量 向量是将若干个基础类型相同的值存储在一起,各个元素可以按序号访问。如果将若干个数值存储在一起可以用序号访问,就叫做一个数值型向量。 用c()函数把多个元素或向量组合成一个向量。如 marks <- c(10, 6, 4, 7, 8) x <- c(1:3, 10:13) x1 <- c(1, 2) x2 <- c(3, 4…

    2023年10月23日
    23000
  • 北京大学R语言教程(李东风)第29章: 探索性数据分析

    探索性数据分析(Exploratory data analysis, EDA)是在进行推断性统计建模之前, 对数据的分布、变量之间的关系、观测之间的聚集等特性用汇总统计、作图等方法进行探索, 这是必不可少的步骤。 有时我们不知道数据告诉我们什么信息, 不知道要提什么问题, 这就必须用EDA来获得对数据的洞察, 提示我们随后要进行的研究。 即使一开始研究目标就…

    2023年11月18日
    26300
  • 美元成本平均法是否会影响投资结果?

    美元成本平均法会影响投资结果吗? 平均成本法是指将资金逐渐投入股市,而不是一次性全部投入。这段时间远离股市会导致收益降低,但风险也会相应降低。 在与投资者交谈时,我们经常听到这样的想法:如果一个人有一定数量的现金可以投资股票,那么最好不要立即投资,而是先买入股票,同时将现金存放在货币市场账户中。随着标准普尔 500 指数连续创下新高,投资者对在如此高的水平进…

    2024年9月10日
    15900
  • 长期投资,第 2 部分:股票始终存在风险

    这是一个由五部分组成的系列的第二部分,该系列为长期、退休导向的投资开发了一个分析框架。您可以在此处阅读第 1 部分。作者要感谢 Joe Tomlinson 和 Michael Finke 对本系列文章提供的有益评论。 介绍 正如我在本系列的第 1 部分中指出的那样,有关股票收益的常见格言和假设真理通常意味着风险在长期内消失。(例如,“你将有时间让股市复苏”或…

    2024年3月12日
    14500
客服
客服
关注订阅号
关注订阅号
分享本页
返回顶部