量化

  • 使用 ChatGPT 生成基于 NLP 的投资策略

    由巴普蒂斯特·莱福尔、Eric Benhamou(博士)、Jean-Jacques Ohana(特许金融分析师)、Béatrice Guez、David Saltiel 和 Thomas Jacquot(特许金融分析师) 金融世界依赖及时的洞察、准确的分析和前瞻性的策略。多年来,自然语言处理(NLP)已成为解读大量金融文本的宝贵工具,帮助投资者和分析师做出明…

    3天前
    300
  • 投资分析师指南:使用历史市场数据

    Q: 美国股票和债券的历史记录可以追溯到多远? A: 从 1790 年代开始,有良好的数据系列。 这是三篇针对分析老历史数据的分析师的文章中的第一篇。很容易下载历史数据集并立即进行统计分析。但不谨慎的分析师会遇到陷阱。时间越久远,环境差异越大。解读结果时背景很重要。 我也关注那些喜欢阅读历史记录的投资者。现在我在报纸和白皮书中看到这些记录比 15 年前我刚开…

    2025年1月9日
    1100
  • 一些对冲基金错过了一个窍门

    社乔纳森·莱文(Jonathan Levin)撰写,2024 年 10 月 16 日 机器学习在金融市场无处不在,我们倾向于将其与对冲基金投资的性感部分联系起来:买什么,卖什么,如何选择底部或顶部。但如果你运行一个价值数十亿美元的高周转率量化投资策略,那么关键问题往往是,“我如何避免因交易执行不佳而自食其果?”从这个意义上讲,预测交易量与预测价格同样重要。如…

    2024年10月26日
    3100
  • 基于Excel和Python的投资基础(一)金钱的时间价值

    现金流的估值有三个维度。第一个维度是简单的现金总值——收到更多的钱总是好的,付出更多的钱总是坏的。第二个维度称为“金钱的时间价值”———对于一笔钱,明天才能得到它总是不如今天就得到它更好(也就是更踏实,言外之意还是现金为王,如果能今天就把一笔钱拿到,那宁愿付出一点折扣也可以接受,因为明天可能的意外也许会导致这笔钱血本无归)。第三个维度是风险———带有风险的现…

    2024年10月26日
    2300
  • 因子策略属于您的完成投资组合工具包

    因子投资作为独立策略的好处已广为人知。鲜为人知的是,当因子策略被添加到机构投资者的完成投资组合中时,它们可以产生积极的影响。 通过在计划层面采用因子策略,资产所有者可以高效且经济地调整其分配以适应其特定目标。在这篇文章中,我将讨论如何在完成投资组合中有效利用因子策略来提高计划绩效和风险控制。 机构投资组合中这两个共同追求的目标具有共生性,这引出了一个问题:“…

    2024年6月25日
    1200
  • 高科技交易公司竞相抢占债券市场地盘

    高科技交易公司竞相抢占债券市场 他们压制了股市,夺取了一大笔外汇,并强行进入商品市场。现在,Citadel Securities LLC 和 Jane Street 等高科技交易公司正比以往任何时候都更深入地进军固定收益市场。 借助数字化浪潮和 ETF 的蓬勃发展,电子做市商(通过以闪电般的速度不断买卖来保持证券流通)正在扩大其在政府债券交易中的影响力,并最…

    2024年6月4日
    4100
  • 移动平均线:标准普尔 2 月份收盘上涨 5.2%

    有效期至2024年3月31日收市为止 标准普尔 500 指数 2 月份收盘涨幅为 5.17%,一月份涨幅为 1.59%。本月最后一天收盘后,五只 Ivy 投资组合 ETF 之一——景顺 DB 商品指数跟踪基金 (DBC) ——发出“现金”信号,与上个月最终的单一“现金”信号相同。 根据 12 个月简单移动平均线,五个 Ivy 投资组合 ETF 之一——景顺 …

    2024年3月28日
    5300
  • 中国量化投资者在股市动荡中进行大盘押注

    作者:Justina Lee,24 年 3 月 3 日 一群押注中国大型企业的系统性投资者在今年引发股市动荡和监管机构打击的“量化地震”中基本上毫发无伤。 投资于大型股票的基于规则的基金经受住了股市风暴,因为蓝筹股公司因避险需求和国家基金的购买而表现出色。从不透明的量化交易世界的角度来看,彭博社编制的一个对中国大型股进行多头和空头押注的投资组合今年截至周四的…

    2024年3月21日
    6100
  • 华尔街量化分析师努力应对现金实际支付的新时代

    作者:彭博新闻 飙升的通胀和快速加息带来了投资聪明人所喜爱的那种大幅波动和混乱的可喜回归,但这并不是对所有类型的量化分析师来说都是福音。 要素策略旨在通过根据证券看起来有多便宜或上涨有多快等特征来做多和做空证券,从而从信贷和股票市场中获取稳定的资金,但在 2023 年却集体失败。 由于资产受到通货膨胀和人工智能热潮的打击,彭博社追踪的 12 个多空因素中有 …

    2024年1月18日
    20500
  • 北京大学R语言教程(李东风)附录D:制作幻灯片

    介绍 R Markdown文件(.Rmd)文件支持多种输出,如网页(html_document)、MS Word(word_document)、PDF(pdf_document, 需要LaTeX编译器支持)等,还支持生成网页格式的幻灯片(slidy_presentation, ioslides_presentation),以及LaTeX beamer格式的P…

    2023年12月27日
    9500
  • 北京大学R语言教程(李东风)附录C:用R Markdown制作简易网站

    介绍 为了从多个.Rmd源文件制作网站,可以使用blogdown扩展包或者bookdown扩展包。bookdown扩展包可以生成gitbook格式的网站,带有左侧的章节目录和前后页面的导航链接,很适用于一本书的网站。但是,bookdown使用时需要重新编译整个网站才能产生正确的链接。 也可以仅利用rmarkdown包的render.site()功能制作简易的…

    2023年12月25日
    21400
  • 北京大学R语言教程(李东风)附录B:用bookdown制作图书

    介绍 R的bookdown扩展包(https://github.com/rstudio/bookdown)是继knitr和rmarkdown扩展包之后,另一个增强markdown格式的扩展,使得Rmd格式可以支持公式、定理、图表自动编号和引用、链接,文献引用和链接等适用于编写书籍的功能。在bookdown的管理下一本书的内容可以分解成多个Rmd文件,其中可以…

    2023年12月24日
    10000
  • 北京大学R语言教程(李东风)附录A:R Markdown文件格式

    附录A-D的内容现在已经升级为Quarto(第22章)内容,这些内容放在这里备查。 R Markdown文件 借助于R的knitr和rmarkdown扩展包的帮助,可以在Markdown格式的源文件中插入R代码,使得R代码的结果能够自动插入到最后生成的研究报告中。这种格式称为R Markdown格式,简称为Rmd格式,相应的源文件扩展名为.Rmd。输出格式可…

    2023年12月23日
    24700
  • 北京大学R语言教程第58章:R编程例子(附:第59章:使用经验)

    因为这些例子要用作学生习题,所以这里只有问题,没有解答。 R语言 用向量作逆变换 设向量x长度为n,其中保存了1到n的正整数的一个排列。把x看成是在集合{1,2,…,n}上的一个一一变换,求向量y使得y能够表示上述变换的逆变换。即任给长度为n的向量z, z[x]表示按照x的次序重新排列z的元素,而z[x][y]则应该恢复为z。 斐波那契数列计算 设数列x0=…

    2023年12月22日
    24900
  • 北京大学R语言教程第57章:用Rcpp帮助制作R扩展包

    R扩展包是把解决某种问题的可复用代码、文档整合在一起的最好的方法。写成R扩展包后,可以自己用,也可以利用CRAN分发。扩展包用户一般不用自己编译。 使用扩展包来组织程序,多个源程序、头文件之间的依赖关系可以自动得到处理。 扩展包提供了测试、文档和一致性检查的统一框架。 扩展包中代码可以仅有R程序,也可以包括C程序、C++程序、Fortran程序。如果仅有R代…

    2023年12月21日
    7900
  • 北京大学R语言教程(李东风)第56章:Rcpp糖

    在C++中,向量和矩阵的运算通常需要逐个元素进行,或者调用相应的函数。Rcpp通过C++的表达式模板(expression template)功能和懒惰求值(lazy evaluation)功能,可以在C++中写出像R中对向量和矩阵运算那样的向量化表达式。这称为Rcpp糖(sugar)。 R中的很多函数如sin等是向量化的,Rcpp糖也提供了这样的功能。Rc…

    2023年12月19日
    14300
  • 北京大学R语言教程(李东风)第55章: Rcpp提供的C++数据类型

    RObject类 Rcpp包为C++定义了NumericVector, IntegerVector,CharacterVector, Matrix等新数据类型,可以直接与R的numeric, charactor, matrix对应。 Rcpp最基础的R数据类型是RObject, 这是NumericVector, IntegerVector等的基类,通常不直接…

    2023年12月19日
    21100
  • 北京大学R语言教程(李东风)第54章:Rcpp 属性

    Rcpp属性介绍 Rcpp属性(attributes)用来简化把C++函数变成R函数的过程,这可以方便在交互使用中将C++和C代码载入到R中,也有利于扩展包中C++和C代码的使用。做法是在C++源程序中加入一些特殊注释,利用其指示自动生成C++与R的接口程序。属性是C++11标准的内容,现在的编译器支持还不多,所以在Rcpp支持的C++程序中写成了特殊格式的…

    2023年12月18日
    17200
  • 北京大学R语言教程(李东风)第53章: R与C++的类型转换

    R程序与由Rcpp支持的C++程序之间需要传递数据,就需要将R的数据类型经过转换后传递给C++函数,将C++函数的结果经过转换后传递给R。 用wrap()把C++变量返回到R中 在R API中用.Call()函数调用C程序库函数时,R对象的数据类型一般是SEXP。Rcpp提供了模板化的wrap()函数把C++的函数返回值转换成R的SEXP数据类型。此函数的声…

    2023年12月16日
    10900
  • 北京大学R语言教程(李东风)第52章:Rcpp介绍

    为了提高R程序的运行效率,可以尽量使用向量化编程,减少循环,尽量使用内建函数。对于效率的瓶颈,尤其是设计迭代算法时,可以采用编译代码,而Rcpp扩展包可以很容易地将C++代码连接到R程序中,并且支持在C++中使用类似于R的数据类型。 没有学过C++语言的读者,如果需要编写比较独立的不太依赖于R的已有功能的算法,可以考虑学习使用Julia语言编写。Julia语…

    2023年12月16日
    14000
  • 北京大学R语言教程(李东风)第51章:数据库访问

    51.1 介绍 对于大型的数据, 或者保存在多个表中的复杂数据, 经常会保存在一个数据库中。 数据库可以存在于专用的数据库服务器硬件上, 也可以是本机中的一个系统程序, 或者R直接管理的一个文件。 比较通用的数据库是关系数据库, 这样的数据库已经有很标准的设计理念和管理方法, 从用户使用的角度来看, 都可以使用一种专用的SQL语言来访问和管理。 常…

    2023年12月14日
    13300
  • 北京大学R语言教程第50章: 文本应用

    50.1 正则表达式应用例子 50.1.1 数据预处理 在原始数据中, 经常需要审核数据是否合法, 已经把一些常见错误输入自动更正。 这都可以用正则表达式实现。 50.1.1.1 除去字符串开头和结尾的空格 函数stringr::str_trim()和base::trimws()可以除去字符串开头与结尾的空格, 也可以仅除去开头…

    2023年12月11日
    9200
  • 北京大学R语言教程第49章: 正则表达式

    49.1 正则表达式详解 在对字符串进行查找或替换时, 有时要查找替换的不是固定的子串而是某种模式。 比如,要查找或替换连续的三个数字,正文中的电子邮件地址, 网址,电话号码,等等。 正则表达式(regular expressions)用于表示各种复杂模式。 基本R中的正则表达式规则可以用POSIX 1003.2标准或者Perl规则。 建议使用pe…

    2023年12月11日
    7300
  • 北京大学R语言教程第48章: R语言的文本处理

    48.1 介绍 在信息爆炸性增长的今天, 大量的信息是文本型的, 如互联网上的大多数资源。 R具有基本的文本数据处理能力, 而且因为R的向量语言特点和强大的统计计算和图形功能, 用R处理文本数据是可行的。 48.2 字符型常量与字符型向量 字符串常量写在两个双撇号或者两个单撇号中间, 建议仅使用双撇号, 因为这是大多数常见程序语言的做法。…

    2023年12月9日
    7700
  • 北京大学R语言教程第47章: 整洁建模中模型调优

    47.1 用再抽样技术计算模型评价指标 47.1.1 拟合效果 再抽样技术是指从同一个样本数据集中多次抽样产生多个样本, 这些样本当然不能做到相互独立, 但是也可以用来增大样本容量, boostrap是典型的再抽样技术, 而统计建模、机器学习中的交叉验证(cross validation)也是一种再抽样技术。 将全体样本划分为训练集(tr…

    2023年12月8日
    10900
  • 北京大学R语言教程第46章: 整洁建模基础

    从前面的模型介绍可以看出, 常见的有监督学习问题为回归问题和判别问题, 每一种问题都可以用许多种不同模型解决, 而每一个模型都可能包含需要调优的超参数集合, 对数据可能有不同的预处理、转码、函数变换、降维等变换。 这些模型由许多个R扩展包实现, 而且接口、选项各自不同。 tidymodels包提供了针对统计建模用户简便易用的建模功能和使用规范。 R有许多建模…

    2023年12月6日
    19100
  • 北京大学R语言教程(李东风)第45章: 用H2O包进行统计学习

    介绍 H2O是一个开源的、集成的机器学习环境,基于Java语言开发,支持并行处理,支持大型数据。R的H2O扩展包提供了对H2O软件的接口,可以用比较统一的界面访问各种机器学习方法。 H2O使用自己的数据格式,R的data.frame和data.table可以用as.h2o()函数转换为H2O的H2OFrame格式。 H2O的R扩展包利用网络服务访问正在运行的…

    2023年12月5日
    30400
  • 北京大学R语言教程(李东风)第44章:支持向量机

    介绍 支持向量机是1990年代由计算机科学家发明的一种有监督学习方法,使用范围较广,预测精度较高。 最大分隔边界判别法 分隔超平面 对因变量为两分类的情形,设自变量xi,i=1,2,…,n在ℝp空间中,如果存在曲面将ℝp分隔成两部分,使得两类的样本可以分开,就有了一种简单的判别准则。超平面是最简单的分隔曲面。 在平面空间ℝ2={(x1,x2):x1,x2∈ℝ…

    2023年12月4日
    12500
  • 北京大学R语言教程(李东风)第43章:基于树的方法

    43.1 树回归的简单演示 决策树方法按不同自变量的不同值, 分层地把训练集分组。 每层使用一个变量, 所以这样的分组构成一个二叉树表示。 为了预测一个观测的类归属, 找到它所属的组, 用组的类归属或大多数观测的类归属进行预测。 这样的方法称为决策树(decision tree)。 决策树方法既可以用于判别问题, 也可以用于回归问题,称为回归树。 …

    2023年12月2日
    22700
  • 北京大学R语言教程(李东风)第42章: 正则化与惩罚回归

    42.1 介绍 这一章用Hitters数据集演示线性回归、回归自变量选择, 岭回归、lasso回归, 以及如何进行超参数调优。 考虑ISLR包的Hitters数据集。 此数据集有322个运动员的20个变量的数据, 其中的变量Salary(工资)是我们关心的。 变量包括: 数据集的详细变量信息如下: 希望以Salary为因变量,查看其缺失值个数: 为…

    2023年12月1日
    8700
客服
客服
关注订阅号
关注订阅号
分享本页
返回顶部