【教学】什么是量化投资和策略历史回溯?


什么是量化投资?

量化投资,最有名的当属1988年在美国成立的大奖章基金,随后11年的平均年化收益高达67.5%,扣除44%的收益分成和5%的管理费后,给投资人的平均年回报率高达35%,把巴菲特和索罗斯甩出10条街,被称为华尔街的印钞机。

神奇的是,大奖章基金的创始人并不是金融人士,而是两位来自校园的数学教授——西蒙斯和埃克斯,决定基金每一笔交易的也不是基金经理或者操盘手,而是电脑,准确的说,是运行在电脑上的量化投资策略。这才是大奖章基金最牛逼,或者说之所以这么牛逼的地方——量化投资。

什么是量化策略?

量化策略是一套完整的交易算法规则,详细定义了买卖的触发条件和仓位管理,包括:

  • 什么条件发生时,买什么,买多少?
  • 什么条件发生时,卖什么,卖多少?

    什么是策略回溯(backtesting)?


    策略回溯就是用简单粗暴的试错方法来对历史数据进行测试。就像走迷宫,大多人类一般就是使用回溯法,当走到一条死路,就往回退到前一个岔路,尝试另外一条,直到走出。

    量化研究主要是用历史数据进行回溯研究,所有的策略收益等统计指标都只能代表历史,但是未来怎样,需要持续的跟踪与研究。因此不要用历史来预测未来,而是要用新纳入的数据,对策略进行持续的跟踪验证与优化。这也是量化大师策略可以“发布”的重大意义,策略一旦发布到云端,策略将在每天自动的按照新纳入的数据进行回溯计算,并更正策略回溯报告修正后的策略统计数据可能变好,也可能变坏)。

    当然,这种每天回溯的机制也给部分用户带来了困扰,尤其是还不太了解量化策略研究的投资者。因为新纳入的数据不仅仅增加了“新的数据”,还有可能对“旧的”、“脏的”股票历史行情数据进行了清洗更正(包括但不限于除复权数据调整、财报数据调整、高频数据数据补全等等),这样可能会导致策略回溯计算后,前后策略发生了变化。

    如果想在量化这条路上走的更远,这个周而复始的研究过程是必须的。我们量化大师在对历史行情数据进行清洗的过程中,使用了三家金融数据商的数据进行了较差对比校验,但发现三家数据上的数据往往都有差异,这时就需要人工介入对数据进行审核更正,这时往往会导致平台上已发布的策略数据,因为历史数据的变动而发生变动。

    注意:只有那些对于策略参数较为敏感的策略,才会因为历史数据的细微变化,而产生较大的变动,尤其是单仓位轮动的策略,我们这里强烈建议,策略跟踪者可以根据自身风险偏好,来选择策略。

    延伸阅读
    什么样的策略算是好的策略?
    如何寻找适合自己的交易系统


    策略历史回溯目的是什么?

    回溯检验的目的是提供历史数据证据,剔除偏差,证明策略的盈利预期。

    剔除偏差包括剔除先窥偏差(Look-Ahead Bias)、幸存者偏差(biais par survie)、数据透视偏差(Data-Snooping Bias)。

    简单介绍一下这三种偏差: 

    先窥偏差是误将当时之后的数据作为了当时数据,比如在年报公布前使用年报后的市盈率,在收盘前使用收盘价。将未知当做已知,会使回测收益率偏高。 

    幸存者偏差是误排除了目前已被退市或因其它原因消失的品种。将已淘汰的品种排除掉,只留下幸存者,也会使回测收益率偏好。它与先窥偏差的错误其实是一样的,都是错误了使用了未来的数据,只不过先窥偏差是主观上存在的偏差,幸存者偏差是客观上存在的偏差。 

    数据透视偏差,它还有个名字叫做优化偏差(Optimisation Bias),类似于机器学习算法中的“过拟合”(Overfit),主要是指过度优化模型参数(也包括其它令参数失效的因素)。要避免这个错误,参数不要太多,优化参数时需要样本足够多,并进行样本外测评和敏感性分析,优化的理由最好经济学上的道理、或者源于透彻研究过的市场现象,而不是根据一些试错法则,从而使参数可以覆盖过去以及未来更广泛的数据。