NLP 与央行会议纪要中的收益率曲线预测

NLP 与央行会议纪要中的收益率曲线预测

自然语言处理能否揭示央行会议纪要中的信号?

自然语言处理已经重塑了股票研究和宏观分析。但它能否在固定收益市场创造优势?具体而言,分析央行语言的算法能否帮助预测收益率曲线的下一步动向?

对于固定收益投资者而言,预测收益率曲线形态变化是期限配置、曲线交易和关键利率敞口的核心。即使预测收益率曲线变陡、变平或平行移动的微小改进,也可能影响投资组合结果。

央行会议纪要并不仅仅是过去决策的总结。它们是结构化的沟通,旨在引导市场预期。如果其语言中包含系统性模式,能够预示特定的收益率曲线变动,那么自然语言处理就不仅仅是一个研究工具,而成为潜在的预测信号来源。

这项分析使用巴西央行会议纪要和收益率曲线数据来检验这一命题。我训练了机器学习分类器,将文本特征映射到随后的曲线配置,包括平行移动、变平、变陡和其他标准形态。研究结果表明,系统性的文本分析可以提高分类准确率,超越主观解释。

收益率曲线变动有多重要?

考虑一张面值为1,000美元、年息为10%的五年期债券。购买时,收益率曲线呈上升趋势,从一年的15.5%上升到五年的17.5%。按这些利率折现现金流,得到现值为768.64美元。

一年后,如果收益率曲线保持不变,该债券剩余四年到期,但仍然使用相同的期限结构定价。在这种恒定曲线假设下,其价值上升到799.41美元。

现在假设收益率曲线平行上移。该债券的信用风险和现金流保持不变,但更高的折现率使其价值降至776.62美元。相对于恒定曲线情景,投资者仅因收益率曲线上升而损失22.79美元。

其启示是明确的。债券收益不仅取决于信用风险,还取决于收益率水平及形状的变化。向上移动损害债券持有人;向下移动则有利于他们。影响程度取决于到期敞口,可通过关键利率或部分久期来衡量。

文献和 CFA 课程都识别出 11 种标准的收益率曲线变动,包括熊市平坦化、熊市陡峭化、牛市平坦化、牛市陡峭化、平行移动和蝴蝶结构。如果这些变动能够被合理准确地预测,投资者可以调整期限和曲线定位以改善投资组合结果。

收益率曲线的理论与模型

一系列经济理论和计量经济学模型试图解释和预测收益率曲线的变动。在经济学中,无偏预期理论将期限结构与预期的未来短期利率联系起来。流动性偏好和偏好栖息地理论引入了风险和期限溢价。分割市场理论强调了不同期限的供求动态。

计量经济学方法将这些思想转化为数学预测。Cox–Ingersoll–Ross (CIR)、Vasicek 以及后来的无套利框架等模型试图描述利率的随机行为,并将曲线校准到观察到的市场价格。这些模型关注利率本身的动态。

这项研究采取了不同的视角。它不是直接对利率过程进行建模,而是考察央行沟通是否包含关于后续收益率曲线变动的可测量信号。自然语言处理使得政策会议纪要能够转化为可进行统计检验的结构化输入。


NLP 的力量

在人工智能成为公众讨论热点之前,自然语言处理(NLP)已经处于积极开发阶段,主要应用于文本翻译或修正拼写和语法错误。借助人工智能的力量,NLP 能够将非结构化文本转化为结构化、可分析的数据。

迄今为止,自然语言处理主要应用于经济分析和股票研究。算法能够“阅读”经济学家发表的论文和股票研究报告,并评估这些叙述在预测通货膨胀、GDP 增长或股价变动方面的有效性。

这项研究将自然语言处理的应用扩展到了固定收益市场。我使用了 4,000 天的巴西收益率曲线数据,其中大部分具有 16 个顶点,以及自 2000 年以来可用的 273 份巴西中央银行会议纪要(“COPOM 的 Atas”)。目标是构建一个机器学习模型,该模型读取每份会议纪要,映射最频繁的词语,将其与过去的会议纪要进行比较,并估计下一次收益率曲线变动将是蝴蝶形态、熊市压平形态、驼峰形态或其他标准配置的概率。

巴西案例研究的实证发现

该模型在市场行为和语言结构中产生了多种可观察的模式。这些发现说明了基于文本的信号如何与随后的收益率曲线变动相吻合。

市场结构与曲线动态

巴西固定收益市场的短期波动性高于长期波动性。这与传统理论相悖,表明在新兴市场中,投资者对短期新闻和政策信号的反应更为强烈。长期工具的波动性相对较低,反映了机构投资者在长期期限上的主导地位。

此外,84%的每日收益率曲线变动属于文献中确定的11种标准配置中的四种,平行向上和向下移动是最常见的(这也证实了短期波动性的特点)。这种集中性突显了正确分类一小部分主导曲线动态的重要性。

从语言中提取信号

为了准备文本数据,像“委员会”、“情景”、“数十亿”和“价格”这样的常用词被作为停用词移除,因为它们对分类没有贡献。然后,为每个收益率曲线变动类别映射了词频,从而能够比较不同曲线配置下的语言模式。

曲线变动的季节性

在检查与特定变动相关的语言时,出现了一种季节性模式。例如,熊市趋平变动经常与8月、9月和10月的参考相关联,而牛市趋平变动则更多与1月、2月和3月相关联。卡方检验提供了几个收益率曲线变动季节性的统计证据。

模型性能

测试了四种分类算法:朴素贝叶斯、逻辑回归和随机森林(包括和不包括 PCA)。使用准确率、F1 分数、科恩 Kappa 系数和对数损失来评估模型性能。不包括 PCA 的随机森林产生了最佳结果。其预测准确率明显高于主观解释,表明系统文本分析可以从央行沟通中提取信号,超越了主观阅读会议纪要。

扩展与启示

该框架可以在多种方式上进行扩展。未来的工作可能会探索改进的类别平衡技术、替代算法如 SVM 或 XGBoost、交叉验证程序或更丰富的语言嵌入,包括 Word2Vec 和 BERT。

尽管这些改进可能提升预测性能,但核心发现依然如此:央行沟通包含了关于未来收益率曲线变动的可量化信息。在政策信号实质性影响预期的市场中,系统文本分析为自由裁量解读提供了结构化的补充。

数据科学并不能取代判断。它提供了一种从复杂和嘈杂信息中提取意义的有纪律的方法。巴西的案例研究说明了这种方法如何应用于固定收益市场。

韭菜热线原创版权所有,发布者:风生水起,转载请注明出处:https://www.9crx.com/97342.html

(0)
打赏
风生水起的头像风生水起普通用户
上一篇 1天前
下一篇 1小时前

相关推荐

  • 半导体行业估值用什么方法?(半导体行业估值多少合理?)

    因为实际清算非常难,只是作为企业估值的一个最低价。

    2022年2月25日
    21800
  • 预算协议继续推动各州国防费总体增加

    盖蒂图片社 美国政府通过购买军事装备、军人和平民的工资、养老金、医疗保健服务以及向各州拨款等方式在每个州花费国防资金。2020 财年(有数据的最近一年),联邦政府在各州和哥伦比亚特区的国防支出为 6,780 亿美元,人均 2,058 美元。 从各州来看,人均国防开支从俄勒冈州的 549 美元到弗吉尼亚州的 8,358 美元不等。哥伦比亚特区的人均领取金额为全…

    2023年9月17日
    12700
  • 了解不同类型的保险:人寿保险、健康保险、残疾保险和长期护理保险

    在一个充满不确定性的不断变化的世界中,保险是一个重要的安全工具,为个人和家庭提供财务保护和安心。不同类型的保单可满足特定需求并为各种生活事件提供承保。本综合指南旨在更深入地探讨四种基本保险类型的复杂性:人寿保险、健康保险、残疾保险和长期护理保险。 ‍ 1. 人寿保险 ‍ 什么是人寿保险? ‍ 人寿保险是个人与保险提供者之间签订的合同,保证在被保险人死亡时向受…

    2023年11月29日
    17700
  • 市场效率较低=阿尔法较高?

    介绍 学生经常向我寻求职业建议。这并不是一次特别令人满意的经历。一方面,这些人通常都是非常聪明和勤奋的人,拥有牛津或剑桥化学工程、天体物理学或其他一些具有挑战性学科的博士学位。我希望他们能够坚持科学,为我们的文明创造一些有意义的东西,而不是试图每年产生一些多余的基点。 另一方面,一些学生很早就决定从事金融职业并进行相应的学习。告诉他们建造更好的化肥或火箭飞船…

    2023年7月21日
    20900
  • 美国各州最富有的 1% 人群的收入有所不同:从 37 万美元到 95 万美元不等

    美国的财富越来越集中在经济阶梯的最顶端。根据美国国会预算办公室 2022 年的报告,最富有的 1% 的家庭拥有美国总财富的三分之一以上(高于 1989 年的 27%)。与此同时,所有最底层的一半家庭仅控制着 2% 的财富。 但这群超级富有的纳税人中有哪些人呢?在全国范围内,年收入 652,657 美元的家庭被视为收入最高的 1%。他们的收入是中位家庭(约 7…

    2023年8月23日
    36900
客服
客服
关注订阅号
关注订阅号
分享本页
返回顶部