量化投资技术分析实战:解码股票与期货交易模型(txt+pdf+epub+mobi电子书下载)


发布时间:2020-08-27 12:04:54

点击下载

作者:濮元恺

出版社:电子工业出版社

格式: AZW3, DOCX, EPUB, MOBI, PDF, TXT

量化投资技术分析实战:解码股票与期货交易模型

量化投资技术分析实战:解码股票与期货交易模型试读:

作者简介

濮元恺

从2009年开始研究并撰写技术指标分析资料,拥有十年的A股投资经历和程序化交易模型开发经历。

2016年加入中国量化投资学会专家委员会,目前在励京投资管理(北京)有限公司任研究总监、基金经理。

作者创立的“量化投资训练营”微信公众号,聚集了一批活跃且热心交流分享的投资业内人士,储备了大量知识类文章。

推荐序

第一次知道濮元恺先生是因为他的公共号“量化投资训练营”,里面提供了众多原创性的量化策略源码,这对业内的发展,特别是刚入行的新手来说,无疑是一个重要的助力。2018年年初,他将自己多年的从业经验整理成一本新书,并邀请我写序,欣然同意。

本书的重要特点是从学习者的经验出发,对章节内容进行了有针对性的安排,例如将择时策略放在最前面讲解,这点我觉得非常有价值,因为大多数交易员一开始就是通过高抛低吸来获得收益的,对于资产配置、组合投资、收益风险的调整等复杂的概念,只有等到真正管理大资金的时候才会有更加深入的体会。由于本书是一个以策略编写为核心导向的教材,所以循序渐进地安排了相关的内容。

第1章和第2章重点介绍了几个重要的编程语言和编程系统,包括聚宽、米狗、Python、TB等。目前业内的量化策略环境已经有了很大的改观,这有赖于众多第三方系统提供商的努力,特别对于初级用户来说,如果不是对交易速度有要求的策略,利用第三方平台快速验证策略模型,是一个不错的选择。

在第3章的择时章节中,作者选择是以技术分析为主的几个择时指标,特别是通道、自适应均线和海龟系统,这是在传统的技术分析中得到广泛应用的择时模型,作为趋势跟随策略,往往并不需要复杂的模型,简单的指标反而更有效。

在股票基本面量化的章节中,本书选取的几个指标,也是业内同行公认的长期有效的几个因子,包括小市值因子、PEG指标、反转因子、资金流和筹码模型。虽然2017年A股市场大白马暴涨,使得众多因子失去了效果,但从一个较长的周期来看,前述的几个因子长期一定会有超额收益,从2018年年初开始,市场又进入正常规律,这些长期有效的因子也一定会在未来的市场中贡献价值。同时在第6章的股票多因子中,对于多因子模型的基础方法做了更加深入的探讨,介绍了多个统计学的模型,特别是对机器学习如何用于股票多因子做了一定程度的普及。机器学习作为人工智能的重要分支,有着普通投资人不具备的广数据的覆盖能力,从而可以根据市场规律尽快找到市场风格特征,从而获得风格收益。

CTA也是量化投资一个重要领域,虽然商品期货和期权的交易量目前还不是很大,但是从国际的发展来看,CTA已经是资本配置中一个重要的选择,在国际上很多资产管理机构也采用量化的方法实行CTA策略交易,本书的第5章和第7章对此进行了实战层面的探讨。

毫无疑问,本书是一个以实战为导向的工具书,濮元恺先生也将自己的策略和模型应用于实战中,且取得了不错的收益,在业内颇有知名度,同时获得了众多投资人的认可。这本书内容翔实、案例众多,特别是提供了可以共享的策略代码,对于作者的分享精神,是比盈利更加重要的价值,特此推荐此书。中国量化投资学会(CQIA)理事长 丁鹏2018/5/1

通向量化投资之路并不平坦

每一位读者翻开这本书都不是巧合,虽然“量化投资”这一概念已经被反复提起,但是量化投资领域的关注者和试图通过学习来搭建模型的交易者,依然是投资圈的少数派。由于政策限制和市场发展不成熟,虽然量化投资基金在中国市场取得了良好且稳定的业绩,但是个人投资者想要通过量化的方式完成下单交易,依然存在很多障碍。量化交易股票期货优势所在

量化投资没有确切的定义,它泛指通过数学分析、挖掘价格波动规律,或者通过对相关宏观经济、财务数据、量价关系、资金交易等数据进行建模,寻找数据之间的关系,以获得稳定利润为目标,持续计算生成定量化的投资信号,并通过计算机严格执行。

在我看来,量化投资方式和传统的“主观分析+手工下单交易”相比有以下显著区别。(1)业绩稳定:目前大部分量化产品长期跑赢基准指数,虽然有时也经历震荡回撤,但是只要核心策略不变、逻辑清晰稳健,其投资风格就都是稳定的并且可回测的。(2)概率取胜可精确回测:量化分析方法一定在寻找大概率事件,这样的投资方式相对于传统投资者一定是大概率获利的,因为量化投资在数据的获取方面领先主观投资太多,且数据加工效率也领先很多。量化投资方式的不足之处是信息加工深度还不及主观投资者在少数个股上深刻。(3)严谨且执行力强:每一次决策,都有周密的数学模型发出信号,模型的搭建者深刻地知晓为什么会在这一时刻做出这一选择。完全定量化,毫不含糊的分析方式和客观的决策方式,保证了量化投资业绩,杜绝了主观投资中人性贪婪和恐惧的弊病。

如此看来,量化投资作为一种工具或者一种方法,应该被广泛普及,并让掌握它的交易者稳定获利。但实际上并非如此,通向量化投资的路途充满坎坷,一道道知识和经验门槛在阻拦投资者做出合格的模型,而且很容易造成知识误用和滥用,带来非常危险的投资亏损后果。

我个人从2007年开始进入股票市场,当时作为一名大学生受到大牛市的鼓舞,本着“配置股票跑赢通胀”的想法开始自己的投资实践,仅2008年一年就亏损资金过半。整个过程中最大的感触除亏损带来的痛心外,还有对于个人投资者信息不对称的深恶痛绝,这恰巧也成为我最初转向量价分析的主要原因。后来我在量化领域做了一些实践,看到了投资的转机。十几年时间过去了,电子工业出版社的黄爱萍编辑和我沟通时,突然觉得有必要将自己的学习和从业过程中经历的量化投资类知识做一个整理,并尽我所能公开一些机构投资者的模型框架和投资建模方法。这就是本书的由来。

在总结的过程中,也回忆了这些年得到的帮助和公司和客户的支持,以及市场的恩惠,这些力量汇合起来,让一个交易者逐步转变为私募基金管理人,并得以在高烈度的竞争中生存下来。此时我意识到对于交易者而言“长期健康的生存”比短期获利更为重要,因为投资不是短期行为,而是伴随着我们的投资生命周期的一个过程。量化投资的思路和我们所搭建的模型,能够显著改善投资者的投资决策能力,延长大部分交易者的生存时间,为交易者通过“积小胜为大胜”的路径,赢得宝贵的资金筹码和时间筹码。

正因如此,学习和探索的路途虽然不平坦,但是我对量化投资方式充满信心。

在这几年的投资历程中,以私募产品方式为客户服务,我们运用多资产搭配和完全的计算机量化决策方式,发行了励京投资-稳利一号、稳利二号、励京私募学院菁英335号等几个产品,目前均取得了非常好的正回报。虽然基金产品收益率和我之前的个人账户投资收益率相比略低,但是夏普比率远高于之前投资思路的,回撤控制严格,这也是量化的魅力所在。量化与传统交易模式融会贯通

用科学解释市场变化,用数据推导答案,这与部分交易者缺乏原则的人为主观决策,用感性面对市场波动,然后为答案寻找原因(特别是不总结失败教训,仅用少数成功案例构建起摇摇欲坠的投资逻辑)相比,显然数学的定量分析方法更值得信任。

并不是随着计算机的普及量化投资才得以实现,早在20世纪初,《股票大作手回忆录》的主角杰西·利弗莫尔(Jesse Lauriston Livermore,1877—1940年),从报纸刊登的个股开盘与收盘的高低数据、交易量等数据预测第二天的交易价格,这实际上就是最原始的量化投资。而更早的还有道氏理论的提出者查尔斯·亨利·道(Charles Henry Dow,1851—1902年),已经使用了移动平均线来表达趋势。而现代的科学家詹姆斯·西蒙斯(James Simons),在1989年到2009年间,他设计并主导的大奖章基金平均年回报率高达35%,较同期标普500指数年均回报率高20多个百分点。

我们反复强调量化投资的优势,但并不意味着这和非量化模式是冲突的,不仅不冲突,我们经常向采用非量化模式的投资者学习,他们也在分析过程中更大比例地引入量化方式加速数据的获取和对其的分析。毫无疑问,量化和主观的融合与渗透越来越明显,两种投资方法的边界反而越来越模糊。我非常钦佩基本面分析者对于好公司的判断,以及交易员对于好价格点位的判断。在本书中也试图重现投资大师彼得·林奇的PEG选股方法,重现主力资金和散户资金博弈的资金流入占比,以及经典技术指标双均线在期货和股票系统中的应用效果,毫无疑问,这些知识都来自对投资者行为的学习。

本书将着力公布一批基于动量效应的期货CTA模型,以及股票基本面和量价关系投资模型,进而到更加复杂的CTA模型和股票多因子模型,最后讲解机器学习方法在多因子建模中的实战。本书的特色之一是每个模型都公布源码,公布我们的思考假设和路径,并考虑到读者的编程门槛,从基本的语言结构讲起,并对模型做充分注释。

关于为什么要涉及机器学习的问题,首先是因为这种算法有绝对的数据挖掘优势,对于数据的拟合度非传统模型能比,其次是因为在我们严格进行因子筛选,且逻辑清晰的情况下,机器学习算法可以完全保证模型的稳健性,或者叫鲁棒性(Robustness)。最后感谢所有机器学习的开发者所编写的可调用程序,这让普通金融建模者几乎只用一两行代码,即可完成对于机器学习的初级使用。

本书面向有一定金融学知识的交易者,或者在校学生,或者具备部分编程知识的IT从业人士,你们可以结合自身的知识结构放大自己的长项,补充自己在量化投资领域所缺乏的知识,最终构建出可以实盘交易的稳健的模型。我不希望本书像教科书式的学术论文那样晦涩难懂,对于在量化行业从业的基金经理和研究者,以及资金曲线异常完美的资深交易者,可能仅能从本书中得到一些灵感启示,但我相信这些模型都是他们成长道路上已经走过的路。向付出者致敬

量化行业的付出者不仅有前线作战的交易者和基金经理,还有中间战场的模型构建、因子分析人员,以及后台的数据加工人员和数据收集人员,这是一个团队作战的成果,技术的成熟会替换其中一些环节,为一些环节加速,但是无法彻底取代一个角色。在量化学习的道路上,一次次尝试失败或者偶尔收获成功喜悦的学徒们,以及为他们指导方向的老师们,也同样是付出者,如果有幸遇到好老师或找到好方法,则学习者的收获感是非常高的;如果自己闭门造车且长时间没有收获,那么收获感将持续降低。

作为本书作者,我能够体会探索过程中的各种艰辛,以及付出的不必要的成本,特别是时间成本。所以我一直在构思如何设计内容、布局章节关系,给各位读者一个尽可能低的学习本书内容的门槛,而在读者踏入门槛后,又要尽可能快地取得进步,感知A股市场和期货市场的波动特性。本书最终内容构成如下。(1)将择时类模型内容放在本书靠前的章节,通过体会动量效应在期货多品种和股票中的运行效果,达成初步的稳健模型。(2)紧接着讲解股票市场的基本面和技术面模型构建,熟悉ETF择时交易、风格选股模型、技术指标选股模型和动量选股模型。(3)了解较为复杂的期货模型,并观察其实战效果和缺陷。(4)掌握基本的数学,特别是统计学知识后,开始涉及部分股票因子的测试和绩效分析。(5)在股票多因子模型阶段,讲解简单易懂的机器学习模型框架。(6)回顾模型搭建过程中的各种问题,然后讲解绩效评估和避免幸存者偏差的一些建议。感谢

本书在撰写过程中得到了同事和朋友们的支持,更重要的是,在量化投资的研究历程中,有诸多朋友搀扶帮助,因此才有了今天的成果,我将这些逻辑整理成书,在这条路上他们都有付出,这是我们共同的作品。非常感谢经常帮助我校对代码的王远洪先生,身在国外仍帮助我昼夜迭代程序的何文硕先生(我们的作息时间刚好适合这样连续工作),给我最初始程序化交易思路的石咏老师,让我意识到“模型不完美和自己能力不完整”的葛老师,以及家人的关心与理解。

我在每个模型下方都放置了二维码,读者通过手机扫描,打开链接,即可获得该模型的完整源码,而不用从书本上誊抄一遍。

我希望不断认识新朋友,认识有意向在市场中大展身手的交易者,我们可以通过本书对应的公众号“量化投资训练营”或对应的 QQ 群“量化投资-学习园地(474952692)”进行交流沟通。濮元恺2018年6月

其他

轻松注册成为博文视点社区用户(www.broadview.com.cn),扫码直达本书页面。

◎ 提交勘误:您对书中内容的修改意见可在 提交勘误 处提交,若被采纳,将获赠博文视点社区积分(在您购买电子书时,积分可用来抵扣相应金额)。

◎ 交流互动:在页面下方 读者评论 处留下您的疑问或观点,与我们和其他读者一同学习交流。

页面入口:http://www.broadview.com.cn/34561第1章量化投资入门建议与行业概况1.1学习路线图与重要知识节点

2016年我被一个问题困扰了很久,一位读者朋友请我提供量化投资学习的“路线图”,或者说进入这个行业的学习路径。我从来没有思考过这个问题,自己和身边从事量化工作的同事都没有想过知识图谱是如何构建的,又是以哪里作为突破口构建的。后来我意识到问题的严重性,如果路线图制定得当,学习效率将会得以提高;如果制定不妥甚至错误,则可能会使学习者几年时间毫无进展。

在调研了多位量化交易者之后,我总结出量化投资学习方面的路线图,如图1-1所示。(1)体会各类资产的择时建模,激发学习兴趣。

各类资产的择时问题较难且有深度,但是也相对简单,因为门槛低,“低买高卖”思路非常清晰。在单一时间序列模型上,动量容易被均线类、突破类模型捕捉,典型应用是股票指数择时。相信很多读者最初也是被一条能够跑赢大盘指数的资金曲线所吸引的。图1-1 量化投资学习路线图

在个股上择时较为困难,除了少数大盘股有较为持续的动量之外,大部分中小盘股票不容易做择时,很容易追高买入,并在不利点位卖出。择时的工具简单多样,比如移动平均线、布林通道,各类技术指标如MACD、RSI之类基本上就是因为能择时才拥有广泛的“群众基础”。

将这些指标加工处理后,配上止损、止盈条件,即可直接应用于商品期货市场,该市场的中低频交易策略大部分以动量类技术指标为主,原理并不难理解,也有部分技术指标可以反向使用,作为“超买超卖”类指标来表示过度乖离。择时在外汇类资产上也能大量使用,基本上也是将商品期货的模型搬运过去,然后做适当修改。在进行大类资产配置时,由于择时工具面对更低的数据噪声,往往效果更好,使用一个逻辑简单的模型去应对债市或者房地产市场相关数据,能带来令人惊讶的效果。

这个阶段的研究进度因人而异,有一定基础的研究者可能几周即可找到能赚钱的择时模型,而大部分交易者可能需要数月甚至数年时间来培养对动量的把握能力,或者因为基本的编程语言关口无法通过而停留在这一阶段。(2)编程语言障碍要在模型开发中逐一克服,否则会陷入对程序的恐慌和无助。

编程语言对大部分交易者来说是量化学习的拦路虎(对于少部分程序员而言,金融市场知识和分析经验可能更复杂),建议积累必要的语法知识后,直接从模型搭建开始学习。比如我们能够调用系统自定义函数,获取按规则选取的股票池,就走出了策略撰写的第一步,然后尝试构建最基本的交易策略、买卖条件,这时就需要嵌套、循环、逻辑判断等知识。再向复杂的领域推进,可能要涉及对个股表格做筛选、计算等“增删改查”的处理,需要接触Python语言的list、dict、dataframe等数据格式。

如果一个缺乏编程知识的人为了学习量化投资而学习MATLAB或Python,可能需要至少一个月甚至数月的时间。而且在面对实际的股票问题时会再度陷入僵局,因为需要从脑中将抽象的代码规则转化成实际问题,以看懂某个语句;或者需要一定时间将股票、期货数据格式,抽象成一行代码,这一过程来回消耗精力,很多人在这一过程中会忘记学习量化的初衷。

我们在面对海量的新知识时都会产生敬畏和莫名的恐慌情绪,不过在代码学习过程中不用担心,毕竟它是辅助我们更好地进行投资决策的工具,它要简化模型构建过程,而非让问题复杂化。学习复杂的程序开发有一个好办法——写注释,阅读大量投资模型,为它们逐行添加注释,有必要时再对照敲击一遍代码,你的代码能力会得到快速提升。如图1-2所示。图1-2 量化投资是金融知识用编程表达后的结果,两种能力都要具备(3)探索股票和期货波动特征,尝试较为复杂的股票和期货模型。

具体到可以被量化交易的各类交易资产方面,建议大家在股票和期货上重点研究,而不要轻易涉及外汇资产和数字货币,因为股票和期货这两类市场都有足够的容量可以交易,且杠杆率可控,资金安全有保障。

首先股票是没有杠杆的,而且市场上有很多只股票可以选择,每只股票又带有大量财务因子信息、量价和资金因子信息、舆情信息,这促使股票类资产可以调换标的操作,并且调仓是以日期为横截面的。我们不必抓住几只股票反复操作,因为在固定标的上,只有择时收益,可以反复调仓换股,获得多只股票的收益。

事实上你会发现:如果你不换股,在单独股票上使用择时模型,则难以跑赢静态持有个股,而到了期货市场上,积极主动的择时交易、突破类交易,都可以获得良好收效。用几个看似简单的逻辑构建模型,在期货市场波动率充足的情况下,可以始终保持盈利,所以大部分交易者入行量化领域,真正实盘程序化交易模型并不是从股票开始的,而是从期货开始的,特别是资金需求量较低的商品期货。如图1-3所示。图1-3 遗传算法(Genetic Algorithm)作用于股指期货,分为训练集(左侧)和测试集(右侧)

在这个阶段,你会遇到很多听起来黑科技感十足的模型,比如低通滤波器、隐马尔可夫链、模式识别等,要学习的知识会多到“爆炸”,但是如果本着技不压身的初衷将它们都学完并做成模型,或许你依然难以盈利,这是很令人烦恼的问题,因为择时问题的深度会限制你的眼界和看市场的广度,所以先给自己打造出能用的工具,然后再去追求“高精尖”的知识也不迟。

建议大家给自己半年到一年时间,为了加速进度、督促自律,可以列一个任务清单和时间表,定期学习、总结经验。(4)做足单因子分析功课,然后切换到多因子学习。

在过渡到本阶段之前,你需要补充一些数学知识,比如线性回归、数据清洗等,因为在股票市场上,要面对的不仅是期货时间序列,还有每只股票时间序列背后的多维度信息。初学者可以想象,在大智慧或同花顺软件上看到上市公司 F10资料里有多少信息,在因子分析阶段就要涉及多少信息(甚至远比这更多),可谓任务繁重。如图1-4所示。图1-4 样本内与样本外因子选择的比较

建议读者按照科学的评估方法,观察因子值对于个股收益率的描述能力,重点分析IC和因子收益率单调性,以便发现高质量的Alpha收益(超额收益)因子。做好数据清洗和数据表格的基本操作,才能到达多因子建模阶段。

在多因子阶段需要注意一点:做好数据处理工作,让你的模型更加简单有效和安全、易解释,对算法知识可以浅尝辄止,因为可供调用的算法包很多,这部分知识的深度也难以理解,消耗的学习成本过大。而且这样能让你更加集中精力做出能够实战的多因子模型,而不是沉浸在算法的知识中无法看清股票市场现状。1.2稳步上升的资金曲线是否存在

资金曲线在行业交流中不仅是模型盈利能力的体现,也是建模者实力的体现。我们被行业高手的资金曲线所吸引的同时,也会产生类似以下疑问:回测规则是否合理?是否有虚假成分?在实际投资中,该业绩能否保证?我们甚至会认为这种资金曲线是完全不存在的。

而实际上这种资金曲线不仅存在,而且可以被复制。

特别是在本书开头部分,希望给予读者信心,我们以量化为工具进行投资,目标就是面向这样的资金曲线开发模型,这深藏于我们内心,不敢表达或者怕被同行耻笑的目标,也是我们投身于此行业最原始的驱动力,本书将以数量化模型投资的方式向你解读如何靠近这一目标。

为达成稳步上升的资金曲线,本节简单表达我们的观点。1.基于强壮稳健的投资逻辑

确保自己的模型拥有清晰的逻辑是立于市场不被轻易击败的重要保证。我们看到业界和学界大部分知名投资模型或者投资方法,都有可以解释的、非常贴合市场(模型所针对的各类资产)的逻辑。

比如沃伦·巴菲特的选股逻辑,程序化交易行业最坚定执行模型,创造可观回报的理查德·丹尼斯,以及已经被反复举例、名扬海外的詹姆斯·西蒙斯博士。他们分别以基本面价值选股、程序化多品种趋势追踪交易、市场多维度信息量化分析作为自己的投资逻辑,通过选取合理的数据、精细加工、科学建模计算,得到了稳健的、可被验证有效的,特别是可被证伪的投资模型。

所以通过阅读书本知识了解金融市场规则,然后通过实践了解股票、期货、外汇、数字货币等市场的不同波动特性,或者通过数学工具,抽取市场价量信息分析这些特性,是量化投资的第一步。我们要敏感地看待测试结果,发掘市场到底是偏向趋势还是反转趋势,是偏向价值投资还是价格投机,才能初步形成下一步的模型构建方向。

在此过程中你要做的是不断产生假设,反复提出各种投资逻辑,并设定严格的回测条件,证实和证伪你的假设。同时,阅读大量金融服务行业研究报告也是必须的,他们是策略开发的思路来源。但是也要清醒地、有针对性地看待这些报告,其中混杂着很多逻辑错误,市场解释力度弱,没有持续性支撑的投资逻辑,仅靠特定的数据样本和规则回测得到的资金曲线,可能在实盘阶段面临巨大风险。

刚才我们谈到了经济学逻辑方面的稳健,在量化模型的构建过程中,还要保证另一层面的稳健,这就是模型对于不同样本有盈利的共性,且模型参数有限、有效、有合理参数解释,或者你拿出先进的工具保障模型构建过程中能够驾驭多种市场变量。

比如参数的稳健,参数最好能够确定固化(或者使其自适应),最好降低对于性能的影响,比如针对商品期货类模型,尽管各类资产波动特征不同,但是如果能找到尽可能通用的参数,回测出一条平稳上升的资金曲线(而不是靠多参数拟合),则实盘赢面会大幅度上升。

再比如股票量化建模,机器学习理论认为:如果不考虑除金融市场行情历史数据外的其他数据,只考虑行情股票价格内部数据,投资t+1t-st-1t公式可以简化为Y=F(P,…P,P)。如图1-5所示。

量化建模的实质是通过现有训练数据,以适当的方法模拟人脑分析学习的神经网络,模仿大脑解决问题的机制来解决数据问题,无限逼近金融市场的真实函数。看似黑箱的机器学习,在此解释和训练方法的约束下,以及通过后文要讲解的套利定价理论APT产生的多因子模型框架,也具有稳健的投资逻辑。图1-5 机器学习类模型净值曲线,固定资金单利,利润不再投2.基于“时间的玫瑰”《时间的玫瑰》原是一本诗集,在投资领域这本书知名度不高,但另一本书《时间的玫瑰:但斌投资札记》成为很多基本面投资者的信仰,作者是知名投资人、私募基金管理人但斌先生,其穿越历史、穿越牛熊表达出自己的观点:投资像孤独的乌龟与时间竞赛。

我们从原理方面不切分量化与非量化投资,因为基本面分析者目前也大量借助量化工具辅助决策,而且我们要学习基本面投资者和知名投资公司的发展历程,特别是投资产品历程,他们都经过漫长的坚守,才最终打磨出一条可以被投资人接受的资金曲线。

如图1-6所示是一段CTA商品期货量化投资模型资金曲线,如果我们缩短时间范围,会发现看似光滑平整的曲线充满坎坷,如果精确到更短时间段内,表现会更差,但是从长时间范围内观察,它又令人满意。原因在于,不同市场阶段的波动率和波动特征不同,只有水平极高的投资模型才能做到在每个阶段(比如每季度、甚至每月)都有较好的上升和低回撤表现,而大部分模型需要靠时间来弥合各种回撤,形成一条效果较好的资金曲线。图1-6 一段资金曲线的某两个时间段,表现不令人满意

所以时间的重要性,在这里更加被强调。尤其是针对个人投资者和量化投资爱好者,投资研发能力和信息获取能力不比机构投资者,但是我们能忍受的回撤期较长,没有固定开发成本(如高额的公司运营成本),资金属性也决定了个人的可承受回撤风险大于机构投资者(机构投资者多接受实业资本、保险资本等刚性兑付资本的资金,因此小幅度亏损也无法接受),所以我们可以用时间作为工具,通过时间长出投资的玫瑰。也同样借助此观点和读者共勉,坚守自己的模型,保持强大的连续性和投资定力,这在一定程度上比开发更先进的模型更重要。3.基于多资产多策略配置

我们应该了解国家的货币供应总量是逐步递增的,这是经济正常上行的必然结果,其反应在日常生活中的表现是资产价格上涨和货币购买力缓慢降低(温和通胀),很多人因为自己没能抓住房地产上涨、股票牛市而自责,认为自己没能跑赢通胀或者没能跑赢国家货币供应量,因为这些大类金融资产都是货币体系的最终流向和流动性储藏容器。如图1-7所示。图1-7 央行统计的货币供应量数据

试问我们在不掌握货币发行权的情况下,能否稳健跑赢货币供应的增长速度?答案是我们可以通过配置多种资产,从流动性容器终端拦截,以达到资产升值方式,进而逼近货币供应增长,获得较为长期稳健的资产增长,这就是资产配置的魅力。在本书发行之前,电子工业出版社于2017年发行了王前锋所著的《量化大类资产配置》一书,书中描述了大量的资产配置案例和量化处理方法。

如图1-8所示是我们基于保险资管行业资产配置要求所做的简单模拟,首先确定产品投资期限,并给出一个固定收益率,如年化6.5%。其次我们精选股票和债券的投资策略。举例来说,股票指数相比于沪深300指数,选取中证高红利低波动指数(历史上该指数显著跑赢沪深300指数);债券指数选择上证企债指数(长期来看企债指数的收益率高于国债)并放两倍杠杆,且根据风险平价策略配置股票和债券的比例。由于需要进行比较,我们将中证风险平价指数和两倍企业债杠杆加入进来。

修改后的风险平价策略收益率更加可观,最大回撤大幅下降,同时收益率更高;同中证风险平价相比,主要是收益率大幅增加,同时波动率和最大回撤在可控范围之内。行业内还有知名度更高的耶鲁基金,其通过最优化资产配置,完全资产配置式满仓持有不同市场(本国股票、全球股票、固定收益债券、大宗商品、私募股权、房地产等)权益,打造出一个高回报基金会,以实际投资回报说明了资产配置是最赚钱的方式。图1-8 股票+债券风险平价配置方法

将资产配置下降一个层级,我们在一个市场内,比如商品期货市场(可以理解为一个迷你版本的多资产配置市场),也可以做类似操作。首先我们主张一定要进行多品种模型覆盖,其次就是在每个品种上,部署多套不同源模型,以获取该资产不同波动情况下的不同收益来源。如图1-9所示。

比如某类商品或股票价格长期以趋势波动为主,但是短期经常产生均值回复,又有相当长一段时间,该商品或股票定价并非受自身因素影响,而是受到其他上下游或者行业影响,这就产生了趋势交易、均值回复交易、套利交易。它们的利润来源不同,出现时机不同,建议对其进行并行部署,不要错过机会。

多品种配置原因还在于货币流动性游走于不同资产(品种)上。比如美国大选驱动的工业复苏和大宗商品价格上涨,2018年美中贸易战驱动的工业品价格快速下跌,历史上还有经济危机和自然灾害驱动的农产品价格异常波动,所以当我们不知道波动即将在什么时候、什么市场发生时,选择并行持有各市场头寸,等待模型将波动转化成利润,是最稳妥的方案。如果这些头寸之间还带有必然的对冲性质,比如股票多头和股指期货空头,再上一个层面到股票多头和期权,他们会形成更稳健的对冲结构。图1-9 将三类商品期货策略等资金量部署之后的资金曲线更加平滑1.3有保留地相信回测结果

我们拥有历史数据,可以用于回测建模,然后将其用于目前的新市场环境交易,我们给这种行为起了一个听起来“高大上”的名字:量化投资。似乎一切波动都可以用定量方法完全解读,可以封杀一切风险暴露,只取得利润,其实不然。

早在1900年以前,查尔斯·亨利·道(Charles Henry Dow)就已经创立了股票市场平均指数——“道琼斯工业指数”。他们引入了移动平均线这种分析方法。当时的历史价格数据质量很差,只能通过纸质出版物印刷保存。但是基本的指数编订、权重规则、移动平均动量分析方法,已经被引入了,这就是典型地想通过定量化分析来预测市场和战胜市场的表现。

所以通过回测构建模型是一门古老的融合学科,甚至包括很多对于市场运行规律的不尊重(金融数据研究属于非实践性科学)。回到本章节主体,我们为什么要相信回测结果,能否相信回测结果,甚至将其应用到未来的实际投资中?

主要原因是,模型运行在样本数据(历史数据,in-sample部分),我们相信样本数据能够在一定程度上反应总体数据,特别是真实数据(样本外实盘数据,out-of-sample部分)。样本容量过小,则样本对总体缺乏足够的代表性,从而难以保证推算结果的精确度和可靠性,所以历史数据不足的问题不容忽视。训练模型首先要获取尽可能多的历史数据,然后假设历史数据能够尽可能推断未来走势,这是我们做量化投资相信回测结果的基本假设。

可以阅读一下技术分析理论的三大假设(市场行为包容消化一切信息、市场运行以趋势方式演变、历史会重演),或者道氏理论的三大假设,从这里寻找一些可以轻松理解的答案。实际上我初入这个行业时,心中也是抱定信念,坚信这些假设成立。虽然后来随着研究发现某些假设并不十分稳固,但是这些假设还是很有市场的,并且交易者愿意按照其指导自己的操作。

回到刚才所说样本和总体的关系,我们将此问题转到统计学角度来分析,既然手中的数据是样本,那么我们要分析研究对象(股票和期货价格)的变化程度和所要求或允许的误差大小,在不同的模型中这两点要求不一样,但是总体来看,样本永远无法满足要求,且现实数据变化较大,所以我们仅能获取到粗略统计结论。

因此一定要有保留地相信回测结果,而不是按照回测结果达到多少年化收益率和胜率等绩效指标,就认为实盘中也能达到如此结果,实盘和回测一定是有偏差的(当然我们都希望实盘比回测绩效更好,但是很遗憾这种情况很少出现)。

所以需要注意:我们是用模型效果在样本数据上推测真实数据也按照此规则运行,一切前提都在数据端,如果数据一旦不按照此规则运行,则模型随数据变化程度而衰减甚至失效。如图1-10所示。图1-10 矩阵推进(walk-forward)建模方法适用于数据量巨大的高频领域

在承认衰减是必然的之后,模型开发者希望绩效尽可能少地衰减,但是无论使用什么数据切分方法、矩阵推进(walk-forward),都只是在样本内部说明你的模型对于数据有较好的适应能力,此时我们希望得到的结果是,在训练和测试部分,资金曲线都有较好的上升斜率,并保证了相似的交易次数(交易密度验证)。如图1-11所示。图1-11 随着样本量增加,样本特征趋近于总体,所以我们永远面临样本不足

当我们站在更远的时间点看现在(手中的回测数据)时,会认识到再长时间的测试样本,依然只是样本而不是总体。高盛公司数量策略部门的董事总经理 Emanuel Derman认为:样本和总体相似,但这种相似性也是有限的。仅以回测数据建模,导致模型缺少深刻的结构和坚实的原理。大部分传统的权益模型专注于数据之上,这是一个危险的现象。

我们的回测报告只是逼近模型在实盘阶段的表现,或者说近似说明该模型有哪些风险收益特征。相信回测并不等于死板地恪守,要看清回测的实质。

除了认识到样本仅是总体的一部分概率表示之外,还要考虑以下这样几个问题:(1)样本内数据的交易规则、交易成本、市场参与主体是否和目前的实盘一致?(2)在样本内数据上,单笔交易的利润贡献是否平稳,还是说来自于少数高盈利的交易?(3)样本内数据的不同周期波动率,是否和目前的市场波动率相似?(4)样本内数据是否质量低下,以及政策过度干预?

以上几个问题如果出现了和目前市场不符的情况,则要人工地过滤掉一些和目前不符的模型或参数配置或品种配置。如果你是一个资深交易者,则可以通过对市场规则的熟悉来完成过滤,如果你是一个细心的数据分析师,则可以将数据对应到基本面在历史上发生的变化来实现过滤。

如图1-12所示,实盘绩效可以看作是预测数据,这部分数据随时间运行偏差越来越大,这是接下来我们要通过模型对抗的核心问题。它严重干扰着量化投资行业,使得我们即使做出可以回测盈利的模型,在实盘也实盘无法跑赢市场,甚至出现较大绩效衰减。我们在本书中的不同地方会提到解决方案,也会给出我们的建议。

以上问题都是说起来容易,做起来需要高度专注和长时间付出才可以完成。我尽可能说出这些内容,希望缩短投资者建立长期盈利模型的时间,各位读者要在数据分析方面下功夫。也只有尽量避免各种不利的数据影响,我们才能在更大程度上相信回测结果。图1-12 用时间序列预测误差理解回测和实盘绩效

量化投资的危险之处在于,目标函数在推动你从数据里挖出黄金,也在放大噪声的影响力,所以到了某个奇怪的交易规则设置临界点下,模型由噪声主导,得到的完全都是幸存者偏差。事实上定量管理的核心问题和导致模型奔溃的主要原因,正是在于对历史数据的过度依赖,市场环境的变化可能导致股票、期货市场运行模式的改变,所以我们要相信回测结果,在一定程度上也要尝试走在市场前面,预判性地应对风险。1.4绩效评估常见指标和方法

考虑到大部分读者都具备相关绩效评估知识基础和敏感度,本节仅做简单铺垫,但是在叙述这些绩效指标公式过程中,会融入一些实际评价策略模型的案例,以及我们推荐的方法。1.Sharpe Ratio夏普比率

绩效指标也被称为风险指标,它们也是量化投资的基石,正因为有这些指标我们可以横向对比不同模型。首先以被模型开发者熟知的夏普比率开始介绍,Sharpe Ratio(夏普比率)目的是计算投资组合每承受一单位总风险,会产生多少的超额报酬。它的优点是不仅考虑收益,还考虑每次的波动率(回撤幅度),可以同时对策略的收益与风险进行综合考虑。

夏普比率的计算公式是:夏普比率=策略年化收益率-无风险回报率 /策略回报率标准差。如果某股票型基金,过去一年上涨15%,1年期国债或者1年期定存的无风险回报是3%,基金净值的标准差是6%,那么用15%-3%,可以得出12%(这个12%是超出无风险投资的回报),再用12%÷6%=2,就是夏普比率。2.Alpha阿尔法

投资中面临着系统性风险(即Beta)和非系统性风险(即Alpha),Alpha是投资者获得与市场波动无关的回报。比如投资者获得了10%的回报,其基准获得了5%的回报,那么Alpha或者价值增值的部分就是5%。

阿尔法计算公式是:Alpha=Rp-[Rf+βp(Rm-Rf)],含义是策略年化收益率-[无风险利率+β×(基准或市场年化收益率-无风险利率)]。我们看到这里需要先计算β,才能计算出Alpha。3.Beta贝塔

贝塔表示投资的系统性风险,反映了策略对大盘变化的敏感性。具体计算方法为:策略每日收益与基准或市场每日收益协方差 /基准或市场每日收益方差。

例如一个策略的Beta为1.5,则大盘涨1%的时候,策略可能涨1.5%,反之亦然。我们大多数情况下希望自己搭建的股票模型是低Beta的,因为股票市场的波动太过于剧烈,我们如果能找到互相对冲的资产,那么在获取正收益的同时,也能降低持仓波动。4.Annualized Returns策略年化收益率

表示投资期限为一年的预期收益率。具体计算方式为(策略最终价值 /策略初始价值-1)/回测交易日数量×250。自然地,Benchmark Annualized Returns(基准年化收益)是将策略收益换成市场收益。5.Max Drawdown最大回撤比率

描述策略可能出现的最糟糕的情况。具体计算方法为max(1-策略当日价值 /当日之前资金最高价值)。最大回撤通常以比率作为计算,比如我们的净值从1开始运行,或者投资从10万元开始运行,经过一个月亏损1万元,则本阶段回撤比率是10%。最大回撤就是在投资全程,寻找到亏损最严重的这一次。

还有一个潜在的风险指标一般各大软件或模型开发平台都没有列出,就是最大回撤持续时间。该指标决定了模型能够在多短的时间内重新回到一个净值高点(超越之前的高点),或者换一种理解方式:净值创新高时间间隔,也是对于该指标的描述。我们做投资非常在乎资金曲线多长时间内没有创新高,一般夏普比率较高的策略这一时间会越短。6.Sortino索提诺比率

表示策略每承担一单位的下行风险,将会获得多少超额回报。其公式是:索提诺比率=策略年化收益率-无风险回报率 /策略下行波动率。索提诺比率越高,表明基金承担相同单位下行风险能获得的超额回报率越高。索提诺比率可以看作是夏普比率在衡量对冲基金/私募基金时的一种修正方式。

相应地给出下行波动率(Downside Risk)计算指标,它等于当(今日或本阶段策略收益率–平均收益率)为负时的波动率,你可以理解为它在波动率计算公式后加入一个信号函数f(t)。

如果近期策略收益相比平均收益为负数,则f(t)=1,下行波动率=波动率,如果近期策略收益相比平均收益为负数,则f(t)=0,不计算此波动率。相应地,波动率计算公式=(收益率–平均收益率)平方和×250/当前策略运行天数-1,对以上结果开平方。7.Information Ratio信息比率

信息比率简称IR,用于衡量单位超额风险带来的超额收益。信息比率越大,说明该策略单位跟踪误差所获得的超额收益越高,因此,信息比率较大的策略的表现要优于信息比率较低的基准。

信息比率的计算公式是:(策略年化收益率-基准年化收益率)/策略与基准每日收益差值的年化标准差,由此可以看出它高度依赖基准或者说市场收益来衡量一个策略的质量,IR指标认为合理的投资目标,应该是在承担适度风险下,尽可能追求高信息比率。相对而言,夏普比率从绝对收益和总风险角度来描述策略表现能力,所以IR更适合评估单一股票市场内的每一个交易策略。

在期货量化交易方面,比较常见且市场占有率较高的软件如交易开拓者,也提供了一些绩效分析指标,如图1-13所示,这里抽取几个最重要的做讲解。图1-13 7个模型组合成的绩效报告表格(1)收益风险比

其公式为:年度收益/全段最大资产回撤。收益风险比表示了一个策略的风险控制和收益平衡能力,类似夏普比率,但是它仅考察最大一次的资产回撤和年度收益的比值。比如同样达到100万元年度利润,A策略最大回撤达到50万元,收益风险比=2。B策略最大回撤为25万元,收益风险比=4。显然B策略在实盘情况下的风险要低很多。(2)R平方值

R平方值含义是根据交易盈亏曲线拟合的趋势线与收益曲线之间相关系数的平方。如果总趋势是上升的资金曲线,且波动极小,理论上用一条直线可以回归解释其收益,则R平方值无限趋近等于1。当然这是理论情况,但是实际上随着我们的不同源策略的添加,以及模型回撤下降,当很多模型堆叠在一起运行时,R平方值确实趋近于1。(3)平均资产回撤

计算公式为:资产回撤总金额/资产回撤计数(都是以超过最大回撤基准线以上的回撤来计算的前N个最大回撤),这里的N可以在软件中设定,一般我们设定为5,这样就不是只考虑最大的那次回撤,而是考虑亏损最严重的5次的平均回撤,更有参考价值。(4)调整收益风险比

调整收益风险比对应刚才所说的平均资产回撤,调整收益风险比=年度收益/平均资产回撤。该指标在建模过程中也被经常参考,其可信度强于收益风险比。(5)TB系数

TB系数计算公式为:(平均利润×平均利润×交易手数)/(平均盈利×平均亏损)。该指标是TB自定义的一个绩效评价指标,有一定的参考价值。特别是考虑到交易手数,让绩效的可信度提升。(6)头寸系数

头寸系数计算公式为:收益风险比×R平方值×置信度/最大资产回撤。该指标考虑了收益风险比(间接考虑了最大回撤)、R平方值(间接考虑了平均回撤)、置信度(间接考虑了交易次数)。除以最大回撤是为了通过极端情况下的亏损来确定系统的稳定性,是一个可以参考的TB自定义的绩效评价标准。(7)置信度

在TB软件中,“置信度”这一绩效并未在回测报告中显示,但它是推导出“头寸系数”的重要过程,在这里简单做描述:该指标根据测试的交易次数计算的置信水平,计算公式为:。在同等利润或者夏普比率下,越高的绩效置信度说明实盘阶段该绩效保持不变的可能性越高。

我们需要牢记一点,绩效永远不仅只评估收益,而且还评估风险情况。所以大部分个人交易者往往只看收益率、年化收益率,忽视了最大回撤和夏普比率。殊不知能推动我们在这个行业走多远的正是风险控制能力,且部分资产可以通过保证金模式做杠杆交易,一旦回撤无法控制,会造成资金曲线大幅度波动和衰减,更坏的结果是人为干预模型导致资金曲线失去一致性,一般此方式带来的都是负面影响。1.5部分可视化免编程量化分析平台

虽然编程实现了自由打造交易策略,并通过程序化下单的方式完成量化交易,但是不得不承认因为需要学习代码的门槛,使得量化投资的用户群受到严重制约。目前国内有上亿名股民,上千万名的活跃交易者,其中一部分可以通过数量化统计方式获得选股信息,而绝大部分投资者是通过大智慧、文华财经等软件,或者东方财富、新浪财经等网站获得并不透彻且信息量有局限的静态统计数据。

如何全市场回测我们的一个想法,一个完整严谨的投资思路,甚至获得专业的资金曲线和绩效评估?除了使用编程开发模型之外,国内出现了一些可视化免编程量化分析平台,为更广大的用户提供了解决方案。本节我们介绍其中4个平台,他们分别具备优势和特色,也试图成为证券行业的互联网流量入口。1.同花顺i问财模型工具

同花顺的i问财平台上线较早,知名度高,用户量庞大,其以独有的文本化“策略问句”形式(意味着向平台发问),放低了量化投资的门槛,甚至都不需要借助太多财务方面的基本知识,即可实现回测,这与其背靠同花顺金融数据库是有很大关系的。其量化频道地址:https://www.iwencai.com/traceback。如图1-14所示。

比如它会引导用户输入类似这样的“策略问句”:前两天涨跌幅小于-2%;跳空高开;振幅小于2%;缩量;今日收盘价大于前两日最高价。然后点击“回测一下”,即可生成对于该选股规则的统计数据。这里的绩效和我们看到的长期绩效不同,以股票上涨为核心目标,分析“最优平均涨跌幅”和“最大上涨概率”,并通过“历史发生次数”告知用户该统计绩效的可信度。如图1-15所示。

持股周期是重要参数,平台默认测试1、2、3、4、5、10天的绩效。按照3.5%、7.5%两个分位数,平台生成了持股涨幅饼图供用户参考。由于整个回测过程完全基于数据支撑,所以底部“历史明细查询”栏,可以提供“股票简称”“起始时间”“终止时间”“起始价”“终止价”“区间涨跌幅”细节数据。参考我们订立的规则复杂程度,以及回测时间,我们认为i问财的回测效率是非常快的,适合普通投资者以极快的速度生成自己的交易策略,并验证效果。

该产品设计以“股票上涨”为核心目标,紧盯涨幅、上涨概率等关键绩效,可以说透彻地把握了自己的目标客户心态。平台搜索框甚至提供了免打字的功能,可以用鼠标勾选策略关键字。如图1-16所示。图1-14 i问财首页入口,通过“策略问句”引导用户图1-15 以上涨为核心分析点的绩效结果图1-16 “策略广场”中较为高质量的策略模型“创建策略”频道设计方式类似,但是绩效输出更为详细,由之前的仅以上涨为分析目标,转变成“单次收益平均值、预期年化收益率、盈亏比、最大回撤率、夏普比率、交易次数”等接近量化投资的绩效。资金曲线固定以沪深300为基准,按照回测时间绘制。“策略广场”展示了在全部策略中表现较好的一些策略,相信投资者看到资金曲线都会动心。我们仔细分析了几个策略,发现条件设置较为周密,但是信号数量可能偏少,或者持股没有构成一个组合,所以在未来实盘的稳定性方面显得略有疑问。但是总体上它们都真实呈现了市场风险和收益来源结构,系统本身的回测平台效率也较高。

特点如下:(1)基本面数据充实准确、维度多。(2)量价关系表述简单,策略语句易掌握。(3)回测速度快,图表呈现简洁易懂。2.果仁网可视化策略平台

果仁网在专业程度方面略高于i问财,其创始人从曾担任通联数据CTO和研发总监,所以第一次登录该平台时会发现它更接近一个量化策略开发网站,而且是标准的多因子模型开发网站。

但是果仁网缺乏类似“策略问句”这样语言的识别能力(在一定程度上它不是非常入门的平台),所以该网站任何选项,都要通过鼠标点选或者输入值,一步步按规则完成。通过查阅资料我们注意到果仁网官方的观点,果仁认为量化可以不编程,但不能没有数学做基础。自然语言的不精确性,很难满足严肃的量化研究的需求。如图1-17所示。

在其核心频道“股票策略研究”,果仁网推荐用户按照“择股设置→交易模型→大盘择时→股指对冲”的顺序,依次搭建模型。第一个选项卡“择股设置”可通过设置“行情、技术指标、财务指标、财报条目、公司、大盘指标”选择到需要的股票。这就是我们常说的因子,你可以通过选择“财务指标”,然后选择“估值→市盈率、市净率”等,最后在右侧输入需要的值。图1-17 果仁网严谨详细的选股界面

这样就可以实现静态的财务因子选股,比如低PB、高ROE等因子组合,都可以通过这个界面组合出来。当然如果读者们有一定的因子模型知识,还可以组织低动量因子、高成长因子、低估值因子,做出一个更加高性能的多因子模型。“交易模型”选项也是本书后文要讲的调仓规则,可以选择模型I,这是大多数多因子模型的调仓模式,通过定期轮动的方式调整当前持仓股,使之符合模型要求,非调仓日不调整,以免产生过度频繁的交易。模型II增加了卖出条件的限制,我们可以设置止盈、止损、追踪止损等一些列条件。“大盘择时”选项可以不使用,该模块作为一个附加模块来增强收益,在股灾或者大面积下跌时清仓股票降低损失。如果开启,大盘的动量效应充足则可以使用择时类技术指标交易,一旦确认选择的条件由熊变牛,或者由牛变熊,则可以调整仓位到空仓或仓位降低30%、50%、70%来降低风险。“股指对冲”选项也是可选项,通过该方式可以做空一定比例的股指期货,几乎完全对冲掉Beta风险,保留Alpha收益,形成中性产品。为了回测尽可能详细,对冲比例、保证金比例都可以调整。如图1-18所示。图1-18 较为专业的绩效展示和资金曲线图

果仁网也提供了策略商城和共享策略频道,可以在这里购买更专业的用户开发的交易策略,或者交流自编策略。总体来看,该网站更适合进行多因子模型开发,而且是严谨的定量模型开发。我们可以在这里看到更多有价值的、股票数量组合更合理的交易策略,还能看到部分股市内资产配置策略,带来更稳定的年度收益率。3.聚宽向导式因子策略生成器

聚宽JoinQuant并非是可视化免编程平台,而是国内较大的量化研究平台,面向成熟的交易者使用Python为基础开发语言。但是为了扩大用户群,聚宽使用自己的数据储备和因子储备,开发了向导式策略生成器这个频道。向导式策略生成器的访问地址是:https://www.joinquant.com/algorithm/index/generateStock。如图1-19所示。图1-19 聚宽平台因子选股界面

该频道和果仁网有一定类似之处,首先是“选股”规则建立,这里的因子选股有财务因子、行情因子、技术指标、资金流和其他条件,读者们可以详细体验两个网站的不同之处。

然后是买卖条件频道,这里有轮动和择时两个选择方式,如果选择轮动则略微简单,如果选择择时,将更多的是按照技术指标进行动量交易,这里需要单独设置买入和卖出条件,同时需要设置交易周期、持股比例等。

对于量化初学者可能会造成一定程度的选择性障碍,因为我们大多数时间没有准确描述自己的交易持股方法,甚至选股方法也没有系统地回忆和总结过,但是作为量化开发的规则,它们都是必须存在的。而且我们在模型开发后期能体会到,聚宽通过该频道大量鼠标点选的功能,将复杂的代码开发完全屏蔽掉。而如果交易者自己开发这些选股持股规则代码,仅熟悉代码、阅读API文档和准确完成交易模型代码构建,就需要数月时间。“风险控制”多是对止损、止盈的设置,如果是多因子模型特别是中性Alpha模型,则可以放弃择时模块的构建。如图1-20所示。图1-20 向导式策略开发工具拥有和编程开发同样的绩效界面“其他参数”可以认为是回测环境。向导式策略开发工具的回测条件和聚宽的策略开发平台完全吻合,可以设置时间、资金量、频率(数据推送或者说模型运行频率),还有资金曲线图的对比基准。在“我的策略”频道,该策略会和Python开发编写的策略一样,在该频道被保存,以便后期回测和修改。

聚宽也在策略实盘方面做了很多探索工作,这保证了策略能够被有效使用,也降低了模型和交易之间的差距。4.米狗K线模式识别量化平台

作为新晋免编程平台产品,米狗量化比起前面三个平台关注者较少。但是它有自己独特的工具与巨头竞争,这就是K线形态模型和图形组合模型。米狗最大的不同之处在于可以通过鼠标点选或圈选一段时间内的K线数据,或者调用系统内置的形态如“弧形底”“纺锤型K线”等形态,然后系统通过智能匹配后台历史数据,找到类似形态出现后的各项绩效,完成这种另类的模型搭建。米狗量化的访问地址是:http://www.migou360.cn/。

最初我们也考虑过这种K线形态建模方式作为量化模型是否稳健,但是经过回测和基于交易者行为的分析,这种模式通过数学和编程代码撰写也被认为是可行的,而且A股大部分投资者对于K线形态印象深刻,也在日常交易中反复使用类似经验,所以以此方法构建模型有用户认知基础,也有内在逻辑。

进入米狗平台“模型列表”频道,首先设置初始资金,每次开仓使用权益的百分比和交易成本。米狗没有严格规定持仓股数量,可以大致认为每次使用10%资金,就是买入10只股票,实际上会有上下浮

试读结束[说明:试读内容隐藏了图片]

下载完整电子书


相关推荐

最新文章


© 2020 txtepub下载