在前面的内容中我们为大家讲过,量化交易系统需要交易者去注意到的一个问题是我们用来参考的历史数据是否可靠。那么关于数据是否可靠我们也可以从测试结果和数据的质量、数量以及样本是否缺失等几方面进行分析。 ![]() 一、测试结果的思考
我们在对长线交易系统的组合策略进行测试中往往会隐藏一些内在的限制。比如当交易者对由多个品种组成的策略进行测试时,通常无法确定真正的策略最大回调。这就造成交易者只能利用平仓日的数据来计算出最大回调,但是这种方法计算出的结果是与真实结果有所差异的。
当数据失去了其可靠性就会在很大程度上影响交易系统表现最重要的衡量标准。所以不管怎样,如果交易者必须在一个只能大致估计表现的分散化多品种组合策略和另一个能够准确计算的单一品种策略之间选择一个,那么绝大多数的量化交易系统开发者都会毫不犹豫地选择前者。
系统开发者做出这样的选择是有其依据的。单一品种的测试结果存在一定程度的误导性,一个历史亏损的系统在未来也可能会盈利,当然也有可能会亏损的更加厉害。
二、质量、数量和样本缺失
一些交易者常会问的问题是,到底多大量的数据测试出来的结果才会是相对准确的。其实这个问题并没有一个非常准确的答案。我们可以通过一些经验来推导出一些结论。例如,在保证测试数据包含了所有市场特征的情况下,包括:牛市、熊市、振荡市和趋势市。
在此基础上还有一个可以用来确定采用多大量数据的因素就是单笔交易平均的持仓时间。一般来说,如果持仓的时间越长,那么就徐亚更多的数据来保证样本统计的正确性。所以我们可以利用十年的数据来对长线交易系统进行测试。对于5分钟图的交易系统则可以采用7个月的数据来进行测试。
我们可以通过测试做一个简单的比较,通过比较可以发现数据越多其实并不意味着就越好。我们尽管可以保证选择的某时间段内的数据是没有问题的,但是这段时间数据的权重却未必与后面数据的权重相等。
也许交易者在使用长线数据时,应当引入一个线性权重系数或者是一个指数,那么这样的方案可以让我们使用更多的历史数据去进行测试,同时也会给越近的数据越高的权重。
但是这样的方法同样会带来很多新的问题,比如应该给最近的数据赋予多大的权重。这些问题都是没有一个标准答案的。那么量化交易者就可以利用不同的权重系数进行实验,找到一个合理的并且在统计学上也完全能够解释的方案。
技术热点、行业资讯,教学视频,尽在程序化交易者与量化投资官方微信,低成本传递高端知识!好技术成就致富梦想!欢迎关注!
打开微信,轻松扫一扫,即刻关注程序化交易者与量化投资官方微信账户,不容错过的精彩,期待您的体验!!!
![]() |