在金融数据科学中使用具有经济意义的因素的好处

因素选择是我们构建财务模型时最重要的考虑因素之一。那么,随着机器学习 (ML) 和数据科学越来越融入金融,我们应该为 ML 驱动的投资模型选择哪些因素以及如何选择它们?

这些都是开放且关键的问题。毕竟,机器学习模型不仅可以帮助因子处理,还可以帮助因子发现和创建。

传统统计和机器学习模型中的因素:(非常)基础知识

机器学习中的因素选择称为“特征选择”。因素和特征有助于解释目标变量的行为,而投资因素模型则描述投资组合行为的主要驱动因素。

也许多因素模型构建方法中最简单的是普通最小二乘(OLS)回归,其中投资组合回报是因变量,风险因素是自变量。只要自变量具有足够低的相关性,不同的模型将在统计上有效,并在不同程度上解释投资组合的行为,揭示相关模型对投资组合行为的百分比以及投资组合的回报对每个变量的敏感程度因子的行为由每个因子附加的 beta 系数表示。

与传统的统计模型一样,机器学习回归模型也描述变量对一个或多个解释变量的敏感性。然而,与非 ML 模型相比,ML 模型通常可以更好地解释非线性行为和交互效应,并且它们通常不提供 OLS 回归输出的直接模拟,例如 beta 系数。

为什么因素应该具有经济意义

尽管合成因素很受欢迎,但经济上直观且经过经验验证的因素比此类“统计”因素具有优势,尽管高频交易(HFT)和其他特殊情况除外。作为研究人员,我们大多数人都喜欢最简单的模型。因此,我们通常从 OLS 回归或类似的东西开始,获得令人信服的结果,然后可能转向更复杂的 ML 模型。

但在传统回归中,因素必须足够不同,或者不是高度相关,以避免多重共线性问题,而多重共线性问题可能会导致传统回归不合格。多重共线性意味着模型的一个或多个解释因素过于相似而无法提供可理解的结果。因此,在传统的回归中,较低的因素相关性(避免多重共线性)意味着这些因素在经济上可能是不同的。

但多重共线性通常并不像 OLS 回归那样适用于 ML 模型构建。这是因为与 OLS 回归模型不同,ML 模型估计不需要协方差矩阵的逆。此外,机器学习模型没有严格的参数假设,也不依赖同方差(误差独立性)或其他时间序列假设。

然而,虽然机器学习模型相对无规则,但可能需要大量的模型前工作来确保给定模型的输入既具有投资相关性又具有经济一致性,并且足够独特以产生实际结果而无需任何解释性冗余。

尽管因子选择对于任何因子模型都至关重要,但在使用基于机器学习的方法时尤其重要。在预模型阶段选择不同但经济直观的因素的一种方法是采用最小绝对收缩和选择算子(LASSO)技术。这使模型构建者能够将大量因素提炼成较小的因素集,同时提供相当大的解释力和因素之间的最大独立性。

部署具有经济意义的因素的另一个根本原因是:它们有数十年的研究和实证验证来支持。例如,Fama-French – Carhart 因子的实用性已有详细记录,研究人员已经在 OLS 回归和其他模型中研究了它们。因此,它们在机器学习驱动模型中的应用是直观的。事实上,在也许是第一篇将机器学习应用于股权因子的研究论文中,吴晨威、Daniel Itano、Vyshaal Narayana 和我证明了 Fama-French-Carhart 因子与两个著名的机器学习框架(随机森林和关联)相结合规则学习——确实可以帮助解释资产回报并塑造成功的投资交易模型。

最后,通过部署具有经济意义的因素,我们可以更好地理解某些类型的机器学习输出。例如,随机森林和其他机器学习模型提供所谓的相对特征重要性值。这些分数和排名描述了模型中每个因素相对于其他因素提供的解释力有多大。当模型的各个因素之间的经济关系被清晰地描述出来时,这些值就更容易掌握。

结论

机器学习模型的吸引力很大程度上取决于其相对无规则的性质以及它们如何很好地适应不同的输入和启发式方法。尽管如此,一些道路规则应该指导我们如何应用这些模型。通过依靠具有经济意义的因素,我们可以使机器学习驱动的投资框架更易于理解,并确保只有最完整和最具指导意义的模型才能为我们的投资流程提供信息。

韭菜热线原创版权所有,发布者:风生水起,转载请注明出处:https://www.9crx.com/76259.html

(0)
打赏
风生水起的头像风生水起普通用户
上一篇 2023年9月14日 01:12
下一篇 2023年9月15日 00:03

相关推荐

  • 为什么说诞生50年的资产类别投资策略能帮到你?

    如今许多投资者认为,传统的指数投资——购买并持有一篮子股票和/或债券,以获取市场的总体回报减去小额费用——是最好的选择。试图通过主动管理(选择和时机)来预测市场是浪费时间,所以如果你不能打败它,就加入它。 传统指数化是一种很好的方法,当然比主动投资更好。所有的数据都证实了这一点。我们不认为指数化是最好的投资方式。为什么呢? 因为资产类别投资更好。 什么是资产…

    2023年11月9日
    22200
  • 您应该在首次公开募股前窗口期间行使股票期权吗?

    在公司上市之前行使股票期权是一个好主意吗?拥有首次公开募股前激励或不合格股票期权的员工经常想知道他们是否应该在公司上市之前(可能在最后的开放窗口期间)行使或等到首次公开募股之后行使。假设你手头有现金来资助它(稍后会详细介绍),这可能是一个很难回答的问题,因为我们只有在事后才知道(在看到股票的表现之后)在首次公开募股之前行使是否是一个好主意或不。因此,最终的选…

    2023年10月13日
    12800
  • 绩效指标如何关联? 基金经理可能会精挑细选吗?

    投资组合经理使用夏普比率、特雷诺比率、信息比率和索蒂诺比率以及其他流行指标来报告其风险调整后的业绩。 当然,有多种衡量标准可供选择,基金经理是否会倾向于挑选那些最能反映其业绩的指标呢?也许吧,但只有当绩效指标具有弱相关性或负相关性时,战略选择的潜力才会成为真正的问题。 如果它们都具有很高的正相关性,那么就真的没有选择游戏可玩。如果夏普比率的好坏意味着相似的特…

    2023年9月21日
    17100
  • 大流行性通货膨胀过山车 第3部分

    这是由四部分组成的系列中的第三部分。 本系列的第一部分以阿波罗全球管理公司的图表开头,暗示我们将在未来 10 年经历通货膨胀过山车,类似于 1965 年至 1982 年的经历。第一部分和第二部分解释了长期通货膨胀的原因和补救措施暴发。第三部分研究近期的大流行性通货膨胀。 历史教训已经过去,我们继续讨论最近由大流行引发的通货膨胀。这个总结让我们更好地体会现在和…

    2024年3月5日
    12500
  • 北京大学R语言教程(李东风)第54章:Rcpp 属性

    Rcpp属性介绍 Rcpp属性(attributes)用来简化把C++函数变成R函数的过程,这可以方便在交互使用中将C++和C代码载入到R中,也有利于扩展包中C++和C代码的使用。做法是在C++源程序中加入一些特殊注释,利用其指示自动生成C++与R的接口程序。属性是C++11标准的内容,现在的编译器支持还不多,所以在Rcpp支持的C++程序中写成了特殊格式的…

    2023年12月18日
    31700

发表回复

登录后才能评论
客服
客服
关注订阅号
关注订阅号
分享本页
返回顶部