基于XGBoost和隐马尔可夫模型的多因子量化投资策略研究文献综述

 2023-03-27 10:31:51

基于XGboost和隐马尔可夫模型的多因子量化投策略研究

摘要:近年来,随着计算机科学的金融化应用,人工智能的量化模型与金融大数据造就了目前量化产品的高速发展。金融量化交易有着科学的数理性,弱化了人性在市场交易中的不足,其中,机器学习作为量化交易模型中的先进分支,在因子预测、风格识别、风险感知领域已有诸多成绩。截止2021年8月,我国私募量化产品规模突破百亿大关,年增长额43%,但相比于传统的投资模式,量化交易依旧是中国资本市场的新兴力量,其发展水平与国外顶尖机构仍有较大差距。

本文主要研究梯度提升算法XGboost和隐马尔可夫模型相结合的量化方式。首先,提取多个周期沪深300和沪深500的特征数据,包括指数价格、换手率、成交额等,作为隐马尔可夫模型的变量参数,得出大盘相较于中小盘的相对强弱,并设置比例,使仓位在两个市场中轮动配置。然后,提取因子数据,对因子做标准化的操作,选取有效因子并使用XGboost预测股票收益率。最后设置风险控制,并持仓。回测结果显示:机器学习策略累计收益率为49.99%,远高于OLS多元线性回归模型32.86%,并且远超沪深300的累计收益27.21%。这说明在传统的多因子量化择股上加入XGBoost对股票收益率进行预测择股,将会大大提高量化选股的成功率。

关键词:XGboost梯度学习; 隐马尔可夫; 量化策略;机器学习

一、文献综述

1.因子模型在量化投资方面的应用

Markowits(1952)提出均值方差理论,第一次在投资组合中使用数理方法,对资本市场收益率的来源做出了合理解释,现代资产组合理论就此拉开序幕。Sharpe(1964)在均值方差模型的前提下,提出CAPM模型,重点探究了资本运行机制及均衡价格的形成问题。CAPM模型对目标资产进行了细分,分为无风险资产和风险资产两类,为风险研究建立的基础。Ross(1976)在对市场资产定价问题进行了探究,在研究中构建了ATP套利定价模型,模型表明,资本资产的收益率是各种因素综合作用的结果,诸如GDP的增长、通货膨胀的水平等因素的影响,为多因素分析提供了基础。

在以上研究基础上, French和Fama(1992)进一步研究了美股市场,他们基于市场资产组合构建了Fama-French三因子模型,在股票收益波动方面进行了充分揭示。股票的市场的beta值不能解释不同股票回报率的差异,而上市公司的市值、账面市值比、市盈率可以解释股票回报率的差异。Fama 和 French 认为,上述超额收益是对CAPM 中beta;未能反映的风险因素的补偿。三因子模型在研究中存在一定缺陷,对此,之后的研究通过动量因子指数对该模型进行了优化,能够全面评估基金业绩。在此之后,学者们不断丰富多因子模型理论,陆续将更多因子加入其中,形成了六因子模型、八因子模型等。

Barth、Beaver 和 Landsman(1993)研究结果显示,上市公司的股票价格受到诸多因素的影响,具体包括公司的净利润、资产与负债的账面价值等,同时,公司股票价格的波动与资产规模呈现正相关关系,与负债规模呈现负相关关系,并且这种相关关系并不稳定,是会随着公司的资产以及负债的变动而发生相应的变动的。Piotroski(2000)提出了在多因子选股中使用较普遍的打分法,共选取九个财务指标对股票进行打分,选取的指标主要涉及到公司的盈利能力、资金的来源、资金的流动性、杠杆率以及公司运营效率等方面,根据这九个指标的好坏程度对股票进行打分并按照分数进行排序,选取分数排名靠前的股票构建不同的投资组合,实证研究结果表明基本面数据较好的公司往往有更好的收益以及较小的风险。刘毅(2012)选取 2000 年到 2012 年的股票数据进行实证分析,在成长、估值、质量以及动量因子四类因子中,挑选了 25 个对股票收益率影响较大的因子,最终从中挑选出 8 个具有良好选股效果的因子构建了最优因子组合,同时与其他四类不同的投资组合进行对比,实证结果表明最优因子组合明显优于其他四种投资组合。高鑫(2017)借鉴了 Fama-French 三因子模型的构建原理,将投资者情绪因素融入资产定价模型当中,并在理论的基础上选择两阶段回归模型进行实证分析,实证结果表明情绪因子不仅对资产的定价有着显著的影响,同时能够合理的解释股票市场的各种金融异象,情绪因子与市场、规模、账面市值比、流动性以及动量因子共同成为对资产定价产生重要影响的几大因素。陈志文(2019)在考虑上市公司财务指标的同时,将基于市场的预测因子也作为了备选因子,一方面按照打分法对财务指标进行打分,另一方面给出股票的预测情况,选取全部 A 股来进行实证分析,同时给予预测因子更高的权重,研究结果表明构造的新型选股模型具有良好的表现,得到的投资组合收益率均高于市场平均表以及 A 股指数。

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

以上是毕业论文文献综述,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。