alpha因子的沪深300指数择时量化投资策略的分析方法研究(附件)
量化投资通过分析大量的历史数据,运用计算机的运算结果来取代人类的主观思考,大幅度减少了因为投资者自身情绪对投资决策产生的影响,因此避免了人为的非理性决策。目前量化投资在国外已经取得了显著的成绩,而在国内也有大量的学者对此进行研究。为了获得纯Alpha的收益,本文以昨日收盘价、当日开盘价、当日收盘价、当日最高价、和当日最低价五个数据为基础,参照《101 Formulaic Alphas》[1]中的因子和部分其他因子对数据进行纯数学运算进而得出因子的数据。然后,采用Support Vector Machine(SVM), Logistic Regression(LR), Random Forest(RF), Ada-boost(AB)四种机器学习的方法对2009年至2015年期间沪深300指数的数据进行滚动的训练与预测。并对四种模型的预测结果进行分析与比较,选择三种最优模型运用等权投票的方法来获得一个胜率更高的综合模型。
目录
摘要3
关键词3
Abstract3
Key words3
1综述3
1.1研究背景及意义 3
1.2国内外研究现状4
1.2.1国外研究现状4
1.2.2国内研究现状5
1.3研究内容及结构5
1.4技术路线6
2量化择时策略研究6
2.1 Alpha策略6
2.1.1 资产定价模型CAMP6
2.1.2 Alpha策略的概念7
2.2量化择时策略的概念7
3方法理论研究 8
3.1 Support Vector Machine 8
3.2 Logistic Regression 9
3.3 Random Forest 9
3.4 Adaboost 10
3.5等权投票模型 11
4方法在股票市场中的实证分析 11
4.1因子选择 11
4.2实证结果 12
4.2.1 Support Vector Machine结果12
4.2.2 Logistic Reg *好棒文|www.hbsrm.com +Q: #351916072#
ression结果13
4.2.3 Random Forest结果13
4.2.4 Adaboost结果14
4.2.5等权投票模型结果15
4.3结果分析 15
5创新点 16
致谢18
参考文献19
基于Alpha因子的沪深300指数择时量化
投资策略的分析方法研究
引言
1 综述
研究背景及意义
金融资产的定价和分析是金融市场中最为重要的部分之一。以往,传统投资者对于有价证券的价格预测和分析主要基于两种方式:
一种方式是技术分析。分析某支股票的历史走势,并认为其历史走势在某种程度上会出现反复,参考历史的走势图来预测未来的价格的升高或者下降并以此确定买卖的时机。然而,对于股票市场尤其是国内的股票市场,过度依赖历史的反复,会导致去追寻某些特定情况的出现带来较大的预测误差。另一种是基本面的分析。这种方法的基础是经济学基本理论,对于某各公司的股票,分析这个公司的综合实力包括财政政策、行业背景、财务状况等。但是这种投资对于进入时间和投资期限无法有准确的预测,使得投资效率底下[1]。
量化投资把技术分析和基本面分析的缺点抹去,既不依赖于历史的反复同时也对进入的时间和投资的期限有了一定的预测。相比于传统的投资方式,量化投资更加客观、更加快速。量化投资的实现是依赖于计算机的运算,这样极大的减少了主观情感对于客观数据分析的干扰;同时,计算机对于数据的处理更加具有准确性和及时性,计算机可以更快的获取股票市场中有价值的信息转化为数据符号并加以利用。
同时,随着计算机技术的快速发展和在各个领域的广泛深入的应用,人工智能的思想和技术应用也逐渐出现在量化投资的领域之中。以往,大量的研究者都认为股票是随机波动的。但是,现在越来越多的研究认为我国股票市场在表面的随即、无序之下存在着一定的变动规律,在某种程度上依靠某些指标的变动股票市场的未来是可以预测的。许多学者认为,在股票市场中存在着大量的线性相关和非线性相关,可以利用这些规律来对股票市场进行预测。机器学习为寻找这些规律提供了许多有效准确的模型,机器学习可以随时根据新进入的数据进行自我调整,及时的适应市场变化。当下的机器学习多使用半监督学习的机制,但是在未来机器学习将不需要人的介入。
中国的股票市场在经历了诸多波动与完善之后正在逐渐形成成熟的机制,与国际相比我国的股票市场仍旧属于新兴市场,存在更多的的套利机会。将机器学习与量化投资相结合发挥两者的优势来构架投资模型可以充分克服传统择时投资中的缺点,实现短时高频交易,效率和收益率将会远远高于传统投资方式。对于各种各样的机器学习方法,在量化投资领域的实用性与有效性暂时没有充分的验证与比较,把它们放在一起进行比较对于模型的选择和量化投资的实践具有一定的参考价值。
国内外研究现状
1.2.1 国外研究现状
Irwin[2](1986)等学者很早就开始了对于建立自动化交易程序的研究,在程序的控制下,该交易系统能自动化的发出买卖信号,结果显示这个程序发出的一半以上的信号是有效的;Neftic[3](1991)等学者将将150日均线所产生的作为一个重要的因子加入到量化投资的模型之中,以150日均线作为参考标准,对琼斯工业指数进行分析和预测,结果表明均线的信号确实提高了预测的准确性;Ritter[4](1992)等研究者首次在量化投资中引入了金融学的理论,通过实证研究提出了著名的反转策略,即在过去一个月表现不好的那部分股票极有可能在之后的一个月表现良好;Jegadeesh[5](1993)发现在更大的时间跨度上,某只股票的趋势具有动量效应,即某只股票如果在短期内表现良好则长期来看它将会获得更高的收益;Jennifer [6](1998)等学者研究比较了动量的Alpha策略和反转的Alpha策略,他们发现在成功的策略中,动量Alpha策略和反转Alpha策略的因子相当。
之后,随着计算机技术的进一步发展,机器学习的理论和方法不断地完善。机器学习的方法逐渐被使用到了量化投资之中。Kim K[7](2003)等研究者运用了SVM算法对市场的数据进行学习与预测,并且把SVM和神经网络算法进行了比较,证明了SVM算法在股票市场中切实有效;Khan[8](2010)等学者使用了多种深度学习的方法盒量化投资结合,他们把神经网络算法、反向传播神经网络算法和基于遗传的反向传播神经网络算法进行了对比分析,结果显示,基于遗传的反向传播神经网络显著的提高了预测的准确性;Nair[9](2010)等学者使用技术分析提取特征并使用决策树来选择特征,其结果显示,使用决策树选择后的特征相较于单纯使用技术分析提取出的特征显著提高了预测的准确率。Ticknor J L[10](2013)等学者将贝叶斯算法与神经网络算法相结合,提出贝叶斯正则化神经网络算法,构造了一个普适性的模型对于任何周期和品种,即使不进行数据的预处理也会有比较良好的预测结果。Takeuchi[11](2013)等学者使用机器学习中的前沿算法深度学习对股票市场进行了分析,最终取得了远超传统动量策略的回报收益。
目录
摘要3
关键词3
Abstract3
Key words3
1综述3
1.1研究背景及意义 3
1.2国内外研究现状4
1.2.1国外研究现状4
1.2.2国内研究现状5
1.3研究内容及结构5
1.4技术路线6
2量化择时策略研究6
2.1 Alpha策略6
2.1.1 资产定价模型CAMP6
2.1.2 Alpha策略的概念7
2.2量化择时策略的概念7
3方法理论研究 8
3.1 Support Vector Machine 8
3.2 Logistic Regression 9
3.3 Random Forest 9
3.4 Adaboost 10
3.5等权投票模型 11
4方法在股票市场中的实证分析 11
4.1因子选择 11
4.2实证结果 12
4.2.1 Support Vector Machine结果12
4.2.2 Logistic Reg *好棒文|www.hbsrm.com +Q: #351916072#
ression结果13
4.2.3 Random Forest结果13
4.2.4 Adaboost结果14
4.2.5等权投票模型结果15
4.3结果分析 15
5创新点 16
致谢18
参考文献19
基于Alpha因子的沪深300指数择时量化
投资策略的分析方法研究
引言
1 综述
研究背景及意义
金融资产的定价和分析是金融市场中最为重要的部分之一。以往,传统投资者对于有价证券的价格预测和分析主要基于两种方式:
一种方式是技术分析。分析某支股票的历史走势,并认为其历史走势在某种程度上会出现反复,参考历史的走势图来预测未来的价格的升高或者下降并以此确定买卖的时机。然而,对于股票市场尤其是国内的股票市场,过度依赖历史的反复,会导致去追寻某些特定情况的出现带来较大的预测误差。另一种是基本面的分析。这种方法的基础是经济学基本理论,对于某各公司的股票,分析这个公司的综合实力包括财政政策、行业背景、财务状况等。但是这种投资对于进入时间和投资期限无法有准确的预测,使得投资效率底下[1]。
量化投资把技术分析和基本面分析的缺点抹去,既不依赖于历史的反复同时也对进入的时间和投资的期限有了一定的预测。相比于传统的投资方式,量化投资更加客观、更加快速。量化投资的实现是依赖于计算机的运算,这样极大的减少了主观情感对于客观数据分析的干扰;同时,计算机对于数据的处理更加具有准确性和及时性,计算机可以更快的获取股票市场中有价值的信息转化为数据符号并加以利用。
同时,随着计算机技术的快速发展和在各个领域的广泛深入的应用,人工智能的思想和技术应用也逐渐出现在量化投资的领域之中。以往,大量的研究者都认为股票是随机波动的。但是,现在越来越多的研究认为我国股票市场在表面的随即、无序之下存在着一定的变动规律,在某种程度上依靠某些指标的变动股票市场的未来是可以预测的。许多学者认为,在股票市场中存在着大量的线性相关和非线性相关,可以利用这些规律来对股票市场进行预测。机器学习为寻找这些规律提供了许多有效准确的模型,机器学习可以随时根据新进入的数据进行自我调整,及时的适应市场变化。当下的机器学习多使用半监督学习的机制,但是在未来机器学习将不需要人的介入。
中国的股票市场在经历了诸多波动与完善之后正在逐渐形成成熟的机制,与国际相比我国的股票市场仍旧属于新兴市场,存在更多的的套利机会。将机器学习与量化投资相结合发挥两者的优势来构架投资模型可以充分克服传统择时投资中的缺点,实现短时高频交易,效率和收益率将会远远高于传统投资方式。对于各种各样的机器学习方法,在量化投资领域的实用性与有效性暂时没有充分的验证与比较,把它们放在一起进行比较对于模型的选择和量化投资的实践具有一定的参考价值。
国内外研究现状
1.2.1 国外研究现状
Irwin[2](1986)等学者很早就开始了对于建立自动化交易程序的研究,在程序的控制下,该交易系统能自动化的发出买卖信号,结果显示这个程序发出的一半以上的信号是有效的;Neftic[3](1991)等学者将将150日均线所产生的作为一个重要的因子加入到量化投资的模型之中,以150日均线作为参考标准,对琼斯工业指数进行分析和预测,结果表明均线的信号确实提高了预测的准确性;Ritter[4](1992)等研究者首次在量化投资中引入了金融学的理论,通过实证研究提出了著名的反转策略,即在过去一个月表现不好的那部分股票极有可能在之后的一个月表现良好;Jegadeesh[5](1993)发现在更大的时间跨度上,某只股票的趋势具有动量效应,即某只股票如果在短期内表现良好则长期来看它将会获得更高的收益;Jennifer [6](1998)等学者研究比较了动量的Alpha策略和反转的Alpha策略,他们发现在成功的策略中,动量Alpha策略和反转Alpha策略的因子相当。
之后,随着计算机技术的进一步发展,机器学习的理论和方法不断地完善。机器学习的方法逐渐被使用到了量化投资之中。Kim K[7](2003)等研究者运用了SVM算法对市场的数据进行学习与预测,并且把SVM和神经网络算法进行了比较,证明了SVM算法在股票市场中切实有效;Khan[8](2010)等学者使用了多种深度学习的方法盒量化投资结合,他们把神经网络算法、反向传播神经网络算法和基于遗传的反向传播神经网络算法进行了对比分析,结果显示,基于遗传的反向传播神经网络显著的提高了预测的准确性;Nair[9](2010)等学者使用技术分析提取特征并使用决策树来选择特征,其结果显示,使用决策树选择后的特征相较于单纯使用技术分析提取出的特征显著提高了预测的准确率。Ticknor J L[10](2013)等学者将贝叶斯算法与神经网络算法相结合,提出贝叶斯正则化神经网络算法,构造了一个普适性的模型对于任何周期和品种,即使不进行数据的预处理也会有比较良好的预测结果。Takeuchi[11](2013)等学者使用机器学习中的前沿算法深度学习对股票市场进行了分析,最终取得了远超传统动量策略的回报收益。
版权保护: 本文由 hbsrm.com编辑,转载请保留链接: www.hbsrm.com/jsj/jsjkxyjs/1642.html