在金融数据科学中使用具有经济意义的因素的好处

因素选择是我们构建财务模型时最重要的考虑因素之一。那么,随着机器学习 (ML) 和数据科学越来越融入金融,我们应该为 ML 驱动的投资模型选择哪些因素以及如何选择它们?

这些都是开放且关键的问题。毕竟,机器学习模型不仅可以帮助因子处理,还可以帮助因子发现和创建。

传统统计和机器学习模型中的因素:(非常)基础知识

机器学习中的因素选择称为“特征选择”。因素和特征有助于解释目标变量的行为,而投资因素模型则描述投资组合行为的主要驱动因素。

也许多因素模型构建方法中最简单的是普通最小二乘(OLS)回归,其中投资组合回报是因变量,风险因素是自变量。只要自变量具有足够低的相关性,不同的模型将在统计上有效,并在不同程度上解释投资组合的行为,揭示相关模型对投资组合行为的百分比以及投资组合的回报对每个变量的敏感程度因子的行为由每个因子附加的 beta 系数表示。

与传统的统计模型一样,机器学习回归模型也描述变量对一个或多个解释变量的敏感性。然而,与非 ML 模型相比,ML 模型通常可以更好地解释非线性行为和交互效应,并且它们通常不提供 OLS 回归输出的直接模拟,例如 beta 系数。

为什么因素应该具有经济意义

尽管合成因素很受欢迎,但经济上直观且经过经验验证的因素比此类“统计”因素具有优势,尽管高频交易(HFT)和其他特殊情况除外。作为研究人员,我们大多数人都喜欢最简单的模型。因此,我们通常从 OLS 回归或类似的东西开始,获得令人信服的结果,然后可能转向更复杂的 ML 模型。

但在传统回归中,因素必须足够不同,或者不是高度相关,以避免多重共线性问题,而多重共线性问题可能会导致传统回归不合格。多重共线性意味着模型的一个或多个解释因素过于相似而无法提供可理解的结果。因此,在传统的回归中,较低的因素相关性(避免多重共线性)意味着这些因素在经济上可能是不同的。

但多重共线性通常并不像 OLS 回归那样适用于 ML 模型构建。这是因为与 OLS 回归模型不同,ML 模型估计不需要协方差矩阵的逆。此外,机器学习模型没有严格的参数假设,也不依赖同方差(误差独立性)或其他时间序列假设。

然而,虽然机器学习模型相对无规则,但可能需要大量的模型前工作来确保给定模型的输入既具有投资相关性又具有经济一致性,并且足够独特以产生实际结果而无需任何解释性冗余。

尽管因子选择对于任何因子模型都至关重要,但在使用基于机器学习的方法时尤其重要。在预模型阶段选择不同但经济直观的因素的一种方法是采用最小绝对收缩和选择算子(LASSO)技术。这使模型构建者能够将大量因素提炼成较小的因素集,同时提供相当大的解释力和因素之间的最大独立性。

部署具有经济意义的因素的另一个根本原因是:它们有数十年的研究和实证验证来支持。例如,Fama-French – Carhart 因子的实用性已有详细记录,研究人员已经在 OLS 回归和其他模型中研究了它们。因此,它们在机器学习驱动模型中的应用是直观的。事实上,在也许是第一篇将机器学习应用于股权因子的研究论文中,吴晨威、Daniel Itano、Vyshaal Narayana 和我证明了 Fama-French-Carhart 因子与两个著名的机器学习框架(随机森林和关联)相结合规则学习——确实可以帮助解释资产回报并塑造成功的投资交易模型。

最后,通过部署具有经济意义的因素,我们可以更好地理解某些类型的机器学习输出。例如,随机森林和其他机器学习模型提供所谓的相对特征重要性值。这些分数和排名描述了模型中每个因素相对于其他因素提供的解释力有多大。当模型的各个因素之间的经济关系被清晰地描述出来时,这些值就更容易掌握。

结论

机器学习模型的吸引力很大程度上取决于其相对无规则的性质以及它们如何很好地适应不同的输入和启发式方法。尽管如此,一些道路规则应该指导我们如何应用这些模型。通过依靠具有经济意义的因素,我们可以使机器学习驱动的投资框架更易于理解,并确保只有最完整和最具指导意义的模型才能为我们的投资流程提供信息。

韭菜热线原创版权所有,发布者:风生水起,转载请注明出处:https://www.9crx.com/76259.html

(0)
打赏
风生水起的头像风生水起普通用户
上一篇 2023年9月14日 01:12
下一篇 2023年9月15日 00:03

相关推荐

  • 机会就在你眼皮底下

    当媒体谈到收益率曲线时,他们可能指的是国债收益率曲线。它是利率水平和投资比较的参考点。尽管国债可能是投资组合的组成部分,但利差产品通常是主要的固定收益资产。价差产品是指主要以保证金交易或与可比国债价差进行交易的证券。例如,如果 10 年期国债收益率为 4.59%,那么公司债券的交易价格可能为 4.59%,加上 165 个基点的利差,即收益率为 6.24%。国…

    2023年10月17日
    19700
  • 顾问的价值:A 代表主动再平衡和资产配置

    作者:Nancy Fahmy,2024 年 6 月 14 日 执行摘要: 确保投资组合积极且定期地重新平衡是财务顾问的主要职责之一 重新平衡可以使投资组合保持在理想的资产配置范围内,从而与投资者的目标保持一致 这也有助于让投资组合保持在投资者的舒适区内 许多投资者和顾问认为重新平衡是理所当然的,因为它通常是在幕后进行的——但我们认为它具有重要价值 这不仅仅关…

    2024年8月8日
    7000
  • 债券:比股票更大、更广泛、更多样化的机会

    纽带,世界还不够 “先生们更喜欢债券。” – 安德鲁·梅隆 (1835 – 1919) 债券市场是迄今为止世界上最大的证券市场。根据所使用的方法,全球固定收益市场的市值是全球股票市场的三分之一到三倍。1但全球和国内债券市场的不透明是出了名的。 是时候拨开迷雾了。 全球债务市场规模约为 300 万亿美元(见下图),而全球股票市值则在 101 至 108 万亿美…

    2023年9月8日
    19100
  • 北京大学Julia语言入门第19章: Julia统计图形–Plots库

    介绍 Julia语言没有内建作图能力,作图需要通过扩展包提供,因为Julia语言的历史还比较短,现在有多种作图用的扩展包但是没有一个占绝对优势的包。比较常用的有Plots, Makie, Gadfly, PyPlot包。其中Makie出现较晚,功能比较强大,后端安装容易。 本文演示Plots包。参见: https://docs.juliaplots.org/…

    2023年9月1日
    48800
  • 联交所股票每个交易日首个输入交易系统的买盘和卖盘,是受一套开市报价规则所监管?(港股股票的买卖盘报价规则及价位表是怎样的??)

    以下是证券(债券除外)的价位表,供投资者参考:证券价格 最小报价单位由 0.01至 0.25 0.001高于 0.25至 0.50 0.005高于 0.50至 10.00 0.010高于 10.00至 20.00 0.020高于 20.00至 100.00 0.050高于 100.00至 200.00 0.100高于 200.00至 500.00 0.200高于 500.00至 1,000.00 0.500高于 1,000.00至 2,000.00 1.000高于 2,000.00至 5,000.00 2.000高于 5,000.00至 9,995.00 5.000上述报价规则一般不适用于竞价限价盘,但是竞价限价买盘或竞价限价卖盘的价格也不得偏离上个交易日收市价9倍或以上,也不得低于上个交易日收市价九分之一或以下。

    2017年9月11日
    20700

发表回复

登录后才能评论
客服
客服
关注订阅号
关注订阅号
分享本页
返回顶部