时间序列预测

楼主  收藏   举报   帖子创建时间:  2019-05-05 05:07 回复:0 关注量:506

预测金融时间序列
2008年8月12日,07:33

metaQUOTES软件公司
6
5 715
介绍
本文讨论神经网络最流行的实际应用之一,市场时间序列的预测。在这个领域,预测与盈利关系最为密切,可以被视为商业活动之一。
预测金融时间序列是任何投资活动的要素。投资本身的概念- 现在投资以获得未来的利润 - 基于预测未来的概念。因此,预测时间序列预测时间序列预测金融时间序列是整个投资行业活动的基础 - 所有有组织的交易所和其他证券交易系统。
让我们给出一些数字来说明这个预测行业的规模(夏普,1997)。美国股市每日成交额超过10亿美元。美国的托管信托公司在美国注册了11万亿美元(全部18万亿美元)的证券,标志着每天约250亿美元。交易世界FOREX更加活跃。其日收益超过1亿美元。这大约是全球总资本的1/50。
所有交易中有99%被认为是投机性的,即它们并非针对真正的商品流通服务,而是为了从“买得更便宜,卖得更好”的计划中获利。它们都是基于交易者对利率变化的预测。同时,每一笔交易的参与者所做的预测都是极其重要的。所以投机交易量是衡量市场参与者预测差异的指标,也就是现实中金融时间序列不可预测性的度量。
这个市场时间序列中最重要的特性是路易斯•巴赫利(Louis Bachelier)在1900年的论文中提出的有效市场假说。根据这个学说,投资者只能希望利用诸如道琼斯或标准普尔500指数(为纽约交易所)。然而,每一笔投机性利润都是随机发生的,与赌博类似。市场曲线的不可预测性取决于在繁忙的街道上难以找到钱的原因:有太多的志愿者把它拿起来。
有效的市场理论很自然地不被市场参与者自己支持(因为他们正在寻找这个“撒谎”的钱)。他们中的大多数都确定市场时间序列虽然看起来是随机的,却充满了隐藏的规律性,即至少部分是可预测的。技术分析的创始人拉尔夫•埃利奥特(Ralph Elliott)试图在30年代发现这种隐藏的经验规律。
在80年代,这种观点在不久前发生的动力学混沌理论中得到了惊人的支持。该理论基于混沌状态和随机性(随机性)的对立。混沌系列只是随机的,但作为一个确定的动力学过程,他们留下了相当的空间来进行短期预测。可行预测的面积在时间上受到预测时间的限制,但这可能足以通过预测获得实际利润(Chorafas,1994)。那些具有更好的数学方法从嘈杂的混沌系列中提取规律性的人可能希望获得更好的利润率 - 以牺牲装备更差的人为代价。
在这篇文章中,我们将给出具体的事实来证实财务时间序列的部分可预测性,甚至对这种可预测性进行数值评估。

技术分析和神经网络
近几十年来,技术分析 - 一套基于各种市场行为指标的经验规则 - 越来越受欢迎。技术分析集中于特定证券的个人行为,与其他证券无关(Pring,1991)。
这种方法在心理上是基于经纪人专注于在特定时刻正在使用的安全性。据知名技术分析师亚历山大•埃尔德(Alexander Elder)说,市场社区的行为与以大众心理学特殊定律为特征的人群行为非常相似。人群效应简化了思想,降低了个人的特点,并产生了比个人更原始的集体,合群行为的形式。特别是,社会本能增强了领导者的角色,一个男性/女性。按照埃德尔的说法,价格曲线就是把市场集体意识集中在自己身上的领导者。这种市场价格行为的心理学解释证明了动态混沌理论的应用。市场的部分可预测性是由一个相对较原始的玩家组成的集体行为所决定的,这个行为形成一个内部自由度相对较小的单个混沌动力系统。
根据这个理论,你必须“脱离人群的纽带”,超越人群,变得比人群更聪明,才能预测市场曲线。为此,你应该开发一个赌博系统,对以前的时间序列行为进行评估,严格遵循这个系统,不受在特定市场流传的情绪和流言的影响。换句话说,预测必须基于算法,也就是说,它们甚至必须交给计算机(LeBeau,1992)。一个人应该创建这个算法,为了什么目的他有各种各样的软件产品,这些产品可以帮助开发和进一步支持基于技术分析工具的编程策略。
根据这个逻辑,为什么不在计算策略发展阶段使用计算机,而不是计算已知市场指标和测试给定策略的助手,而是为找到的指标找到 最优指标和最优策略。自90年代初以来,神经网络技术的应用得到了越来越多的追随者的支持(Beltratti,1995,Baestaens,1997),因为它具有许多无可争议的优势。
首先,神经网络分析与技术分析不同,对输入数据的性质没有任何限制。既可以是既定时间序列的指标,也可以是其他市场证券行为的信息。这不是没有理由的,它们是积极使用神经网络的机构投资者(例如大型养老基金)。这些投资者使用大量的投资组合,因此不同市场之间的相关性是最重要的。
其次,与基于一般建议的技术分析不同,神经网络可以找到最适合给定安全性的指标,并根据给定的时间序列对预测策略进行最优化。而且,这些策略是可以适应的,随着市场的变化而变化,这对于年轻的,动态发展的市场尤其是俄罗斯市场来说是最重要的。
单独的神经网络建模仅基于数据,而不涉及任何先验考虑。这就是它的力量,同时也是它的致命弱点。可用数据可能不足以进行学习,潜在投入的维度可能会变得太高。在本文中,我们将演示技术分析积累的经验如何能够帮助克服财务预测领域中典型的困难。

时间序列预测技术

作为第一步,我们来描述使用神经网络的时间序列预测的一般方案(图1)。



图1时间序列预测技术周期方案
在本文中,我们将简要讨论这个流程的所有阶段。尽管神经网络建模的一般原理完全适用于这一任务,但金融时间序列的预测具有其自身的特点。这些是本文将尽可能详细描述的这些特定功能。
沉浸技术。Tackens定理
我们先从沉浸阶段开始。正如我们现在所看到的,对于所有的预测似乎是数据的外推,神经网络确实解决了插值问题,这大大增加了解的有效性。时间序列的预测解决了神经分析的常规问题 - 使用将时间序列浸入多维空间的过程(Weigend,1994),对给定的一组示例近似多变量函数。例如,时间序列的一维滞后空间 由连续时刻的时间序列值组成:

下面的Tackens定理证明了动力学系统:如果一个时间序列是由动力系统产生的 ,也就是这个系统的状态的一个任意函数,就有这样的浸入深度 (近似等于有效这个动力系统的自由度数)提供了对时间序列下一个值的明确预测(Sauer,1991)。因此,选择一个相当大的时间序列的未来价值和前面的价值之间可以保证一个明确的依赖关系: 即时间序列的预测解决了多变量函数插值的问题。然后,您可以使用神经网络在此时间序列的历史定义的一组示例的基础上恢复此未知函数。
相反,对于随机时间序列,过去的知识并不能提供预测未来的有用的线索。因此,根据有效的市场理论,时间序列预测值的离差在浸入滞后空间时不会改变。
图2显示了混沌动力学和随机(随机)浸泡过程中检测到的差异。


图2.浸泡时检测到的随机过程与混沌动力学的区别。

时间序列可预测性的实证验证
沉浸方法使我们能够定量衡量真实证券的可预测性,即证明或驳斥有效的市场假说。根据后者,所有滞后空间坐标中的点的离散是相同的(如果点是独立随机值的相同分布)。相反,混沌动力学提供了一定的可预测性,必然导致观测将围绕某个超曲面进行分组 ,即实验样本形成的维数小于整个滞后空间的维数。
要度量尺寸,可以使用以下直观属性:如果一个集合具有D的维数,那么,如果它被分成更小和更小的立方体曲面 ,则这些立方体的数量将增加为 。这个事实是根据我们从以前的考虑中得知的盒子计数法来检测集合的维度的基础。一组点的维数通过增加包含该集合的所有点的盒子的数量的速率来检测。为了加速该算法,我们采用 2的倍数的尺寸,即,分辨率尺度是以比特来衡量的。
作为一个典型的市场时间序列的例子,我们来看看一个众所周知的金融工具,如标普500指数,它反映了纽约证券交易所的平均价格动态。图3显示了679个月的指数动态。图4中示出了通过箱子计数方法计算的这个时间序列的增量的维度(信息维度)。

  

图3.本文中以S&P500的679个时间序列为例。                图4. S&P500时间序列的增量信息维度。

从图4可以看出,实验点在15维浸没空间中形成了约4维的集合。这远远低于我们基于有效市场理论所获得的15,这个市场理论认为增量的时间序列是独立的随机值。
因此,经验数据提供了一个令人信服的证据表明在金融时间序列中存在某个可预测的成分,尽管我们不能说在这里有一个完全确定的混沌动力学。然后,将神经网络分析应用于市场预测的尝试基于强有力的理由。
但是,应该指出的是,理论上的可预测性并不能保证达到实际重要水平的预测。可以通过测量交叉熵来获得特定时间序列的可预测性的定量估计,这也可以使用箱子计数技术。例如,我们将测量S&P500增量与浸入深度相关的可预测性。交叉熵

下图给出了其中的图表(图5),通过了解此时间序列的先前值来支持时间序列的下一个值的附加信息。

图5.与浸入深度(“窗口”宽度)相关的S&P500时间序列的增量符号的可预测性。
浸入深度超过25的情况将伴随着可预测性的下降。
我们将进一步评估实际可达到的可预测性的利润。

形成属性的输入空间
在图5中,可以看到时间序列浸入式窗口的增加宽度最终导致可预测性下降 - 当输入维度不再被信息值所补偿时。在这种情况下,如果滞后空间维数对于给定数量的例子来说太大,我们不得不使用特殊的方法来形成具有较小维度的属性空间。下面将描述选择属性和/或增加可用示例的数量的金融时间序列特定的方式。

选择错误功能
为了进行神经网络学习,仅仅形成输入/输出的教学集是不够的。网络预测错误也必须确定。默认情况下,大多数神经网络应用中使用的均方根误差对市场时间序列没有多少“财务意义”。这就是为什么我们会在文章的特殊部分考虑财务时间序列的具体错误,并且说明它们如何与可能的利润率相关联。
例如,为了选择一个市场的位置,比率变化的符号的可靠检测比均方差的降低要重要得多。虽然这些迹象是相互关联的,但为其中一个网络优化的网络将为另一个网络提供更差的预测。如我们在本文中进一步证明的那样,选择一个适当的错误函数必须基于一定的理想策略,例如由最大化利润的愿望(或尽量减少可能的损失)来决定。

神经网络学习
时间序列预测的主要特点是在数据预处理领域。单独的神经网络的教学过程是标准的。像往常一样,可用参数分为三个样本:学习,验证和测试。第一个用于网络学习,第二个用于选择最佳的网络结构和/或选择停止教授网络的时刻。最后,第三个没有用于教学的服务为“训练好的”神经网络的预测质量控制服务。
然而,对于非常嘈杂的金融时间序列,小圈子神经网络的使用可能导致预测可靠性的显着提高。我们将结束这篇文章,讨论这种技术。
在一些研究中,由于使用反馈神经网络,我们可以找到更好的预测质量的证据。这种网络可以有一个本地存储器,可以保存比输入中明确可用的更远的数据。然而,考虑到这样的体系结构会让我们离开主体,更多的是因为下面介绍的特殊的时间序列浸入技术,有一些替代方法可以有效地扩展网络“视界”。

形成属性空间
输入的高效编码是更好预测质量的关键。对于难以预测的财务时间序列来说,这是特别重要的。有关数据预处理的所有标准建议也适用于此。但是,有一些财务时间序列特定的数据预处理方法,我们将在本节中更详细地考虑。

时间序列浸入法
首先,我们应该注意,我们不应该把我们指定的引号值  作为神经网络的输入或输出。这些报价变化对于预测非常重要。由于这些变化通常在比报价本身小得多的范围内,因此利率价值之间存在很强的相关性 - 最可能的下一个利率值等于它的前值: 。同时,反复强调,为了提高学习质量,我们应该努力实现投入的统计独立性,即没有这种相关性。
这就是为什么选择统计上最独立的值作为输入的逻辑,例如报价变化 或相对增量对数 。后一种选择对长期的时间序列是有利的,通货膨胀的影响变得相当明显。在这种情况下,系列不同部分的简单差异将在不同的范围内,因为实际上,它们是以不同的单位来衡量的。相反,连续报价之间的比率并不取决于计量单位,即使计量单位因通货膨胀而改变,其比例也是相同的。因此,时间序列的更大平稳性将使我们能够使用更大的历史进行教学,并提供更好的学习。
浸入滞后空间的缺点是网络的有限“视野”。相反,技术分析不固定窗口过去有时使用时间序列的非常远的值。例如,一个时间序列的最大值和最小值,即使是从一个相对遥远的过去,也被认为是相当强烈地影响交易者的心理,因此,这些值必须仍然是重要的预测。浸入滞后空间的窗口不够宽,不能提供这样的信息,这自然会降低预测的效率。另一方面,将窗口扩展到涵盖时间序列的远端极值的这些值将增加网络的尺寸。这反过来又会导致神经网络预测的准确性下降 - 现在是由于网络的增长。
摆脱这种看似僵局的一种方法,可以在对时间序列的过去行为进行编码的替代方法中找到。直观地显而易见的是,时间顺序历史可以追溯到更早的时候,其行为细节越少影响预测结果。这是由贸易商对过去的主观认识所决定的,严格来说就是形成未来。因此,我们应该找到这样的时间序列动态的表示,这将有一个选择的准确性:越来越多的细节。同时,曲线的整体外观必须保持完整。这里所谓的小波分解可能是非常有前景的。其信息价值相当于滞后沉浸,

减小输入的尺寸:属性
这种数据压缩是一个从大量输入变量中提取最重要的预测属性的例子。上面已经描述了系统提取属性的方法。他们也可以(也必须)先后应用于时间序列预测。
输入的表示可能有助于数据提取。小波表示就是一个很好的例子(从属性提取的角度来看)编码(Kaiser,1995)。例如,下一个图(图6)显示了由10个特别选择的小波系数重构的时间序列的50个值的一部分。请注意,虽然需要少五倍的数据,但是时间序列的最近的过去被准确地重建,远处的过去被恢复为总体概况,高低点被正确地反映出来。因此,可以用仅具有可接受的精度的10维输入向量来描述50维窗口。


图6. 50维窗口(实线)及其10个小波系数(o)的重构示例。
另一种可能的方法是使用属性空间的候选对象,使用适当的软件包(如metaStock或Windows On Wall Street)自动计算各种技术指标。许多这样的经验属性(Colby,1988)使得它们的使用困难,尽管如果将它们应用于给定的时间序列,它们中的每一个都可能变得有用。上述方法将允许您选择最重要的技术指标组合作为神经网络中的输入。

提示方法
在金融预测方面最薄弱的一点是缺乏神经网络学习的例子。一般来说,金融市场(尤其是俄罗斯的)并不固定。那里没有历史积累的新指标,旧市场交易的性质随着时间而变化。在这些条件下,神经网络学习的时间序列长度是相当有限的。
但是,我们可以通过使用一些关于时间序列动态不变量的先验考虑来增加例子的数量。这是另一个物理数学术语,可以显着提高财务预测的质量。这个问题是通过对它们进行各种转换而从现有的例子中获得的人为例子(提示)的产生。
我们用一个例子来解释主要思想。以下假设在心理上是合理的:交易者主要关注价格曲线的形状,而不是关注轴上的具体数值。所以,如果我们沿着引号轴把整个时间序列拉伸一点,我们就可以使用这种变换产生的时间序列(和最初的那个一起)用于神经网络学习。因此,由于使用交易者如何看待时间序列的心理特征而产生的先验信息,我们已经使示例的数量增加了一倍。此外,随着例子数量的增加,我们限制了在其中搜索解决方案的功能类别,这也增加了预测质量(当然,如果所使用的不变量是真实的话)。
计算S&P500盒式计数方法(见图7,8)的可预测性的结果说明了提示的作用。在这种情况下,属性的空间是由正交技术形成的。我们使用30个主要组件作为100维滞后空间中的输入变量。然后我们选择了这些主成分的7个属性 - 最显着的正交线性组合。从下图可以看出,在这种情况下,只有应用提示才能提供明显的可预见性。



图7. S&P500报价变化的可预测性。         

图8.标准普尔500的报价变化符号的可预测性,通过在价格轴上拉伸四倍。
请注意,与标准浸入方法相比,使用正交空间导致可预测性有一定的提高:从0.12位(图5)到0.17位(图8)。稍后,当我们开始讨论可预测性对利润的影响时,我们将证明,由此,利润率可能再次成为一半。
使用这种成功的另一个不那么简单的例子,暗示在什么方向为神经网络来寻找一个解决方案是在外汇交易中使用隐藏的对称性。这种对称性的意义在于,外汇报价可以从两个“观点”来考虑,例如,作为一系列的DM / $或者作为一系列的$ / DM。其中一个的增加与另一个的减少相对应。该属性可用于将示例数量加倍:添加到每个示例中,  如其对称模拟 。神经网络预测实验表明,对于基本的外汇市场,考虑到对称性,考虑到实际交易成本(Abu-Mostafa,1995),对利润的考虑几乎增加了两倍,特别是从每年5%到10%。

测量预测质量
虽然预测金融时间序列解决了多维函数逼近问题,但它在形成输入和选择输出的神经网络方面都有自己的特点。我们已经在上面考虑了输入。现在我们来研究一下选择输出变量的特点。但是,首先要回答的主要问题是:如何衡量财务预测的质量?这将帮助我们找到最好的神经网络学习策略。

可预测性和利润率之间的关系
财务时间序列预测的一个特点就是努力获得最大的利润,而不是最小化均方差,正如在函数逼近中的惯例。
在日常交易最简单的情况下,利润取决于正确预测的报价变化的标志。这就是为什么神经网络必须旨在精确预测符号而不是价值本身。现在让我们来看看利润率与日常进入市场最简单的表现(如图9)中的符号检测精度有关。

图9.每日进入市场
让我们指定一下 :交易者的全部资本是 相对的报价变化 ,并且作为网络输出让我们把它的置信水平作为这个变化的标志: 。该网络以输出的非线性 形式学习如何预测变化符号和预测符号与其概率成正比的符号。那么步进的资本收益 将记录如下:
   
资本份额在“ 在场”在哪里。这是整个交易期间的利润:

我们将通过选择最优的利率规模来实现最大化 。让交易者正确预测 符号,并相应地错误地预测 符号的概率 。那么利润率的对数,

利润本身将是最高的 ,平均值为:

这里我们介绍了系数 。例如,对于高斯分布, 。符号可预测性的水平与可以通过盒子计数方法先验估计的 交叉熵直接相关。对于二进制输出(见图10):




图10.正确预测的时间序列变化方向的分数作为已知输入的输出符号的交叉熵函数。
最终,我们得到的利润率的给定标志预测值以下估计我在比特来表示:

这意味着,对于具有我的可预测性的时间序列,原则上有可能使 投入市场的资本加倍。因此,例如,以前计算的S&P500时间序列可预测性等于I = 0.17(见图8),假设 市场入场的平均资本翻一番 。因此,即使一个小小的报价变化符号的可预见性,可以提供非常显着的利润率。
在这里,我们应该强调的是,当每次进入市场时,玩家都会面临严格界定的资本份额风险,所以最优利润率需要相当谨慎的玩法:

这个市场波动的 典型盈利/亏损大小在哪里 ?利率的较小和较大值都会降低利润,一个风险太大的交易可能导致任何可预测性的损失。这个事实如图11所示。



图11.平均利润率与所选股票“在小猫”中的依存关系。
这就是为什么上面的估计仅能够洞察利润率的上限。考虑波动效应的更仔细的研究超出了本文的范围。然而,从定性的角度来看,最优合同规模的选择需要在每一步估计预测的准确性。

选择错误功能
如果我们以预测金融时间序列为目的来最大化利润,那么将神经网络调整到最终结果是合理的。例如,如果按照上述方案进行交易,则可以从学习样本的所有示例中选择神经网络学习以下平均学习误差函数:

在这里,引入的资本份额作为额外的网络输出被引入,以在学习期间进行调整。对于这种方法,第一个 具有激活功能的神经元 会给我们增加或减少的概率,而第二个网络输出 将产生给定阶段投资资本的推荐份额。
然而,根据前面的分析,由于这个份额必须与预测置信水平成正比,所以可以通过放置 和限制自己只优化一个全局参数来替换两个网络输出 ,这将最小化错误:

这就产生了根据网络预测的风险水平来调节费率的机会。玩浮动利率产生更多的利润比固定利率。事实上,如果你用定义的平均可预测性来确定这个比率,那么资本增长率就会成比例  ,而如果你在每一步中选择了最优的比率,那它就会成正比 。

使用Coterie网络
一般来说,由于选择突触权值初始值的随机性,对同一样本进行不同网络训练的预测结果会有所不同。这种缺点(不确定因素)可以转化为组织由不同神经网络组成的小圈神经专家的优势。专家预测的分散性将给出这些预测的置信水平的概念,这可以用于选择正确的交易策略。
很容易证明小组值的平均值必须比同一小圈的普通专家产生更好的预测结果。让第i位专家的误差 等于输入值 。考虑到Cauchy不等式,小圈子的平均误差总是小于专家的均方误差:

必须指出,减少错误可能是相当重要的。如果个体专家的误差不相关,即 由L专家组成的小圈子的均方误差 小于一个专家的平均个体误差!

这就是为什么根据整个小圈子的平均值做一个预测的原因。这个事实如图12所示。

图12.当使用10个网络小组进行预测时,时间序列sp500的最后100个值的利润率。
小圈子(圈子)的利润高于普通专家的利润。正确预测小圈子的得分为59:41。
从图12可以看出,在这种情况下,小圈子的利润甚至高于每个专家的利润。因此,小圈法可以从根本上改善预测质量。请注意利润率的绝对值:在市场上有100个入场券的时候,小圈子的资本增加了3.25倍(如果考虑交易成本,这个比率当然会更低)。
该预测是在网络学习时获得指数增量时间序列的30个连续指数移动平均线(EMA 1 ... EMA 30)。预测下一步的增量符号。
在这个实验中, 对于给定的预测准确度,这个比率被固定在接近最佳值的水平(59个正确预测的符号与41个错误预测的符号),即 。在图13中,您可以看到相同预测的高风险交易结果,即 。


图13.使用10个网络的同一小组进行预测时,采用较高风险策略的时间序列sp500的最后100个值的利润率。
小圈子的利润保持在同一水平(有点增加),因为这个风险值与前一个风险值接近最佳。但是,对于大多数网络而言,这些网络的预测比整个小圈子的预测要不准确,这样的网络风险太高,导致其实际上已经完全崩溃。
上面的例子说明了能够正确估计预测质量的重要性,以及如何使用这个估计值来提高同样预测的收益率。
我们可以走更大的极端,并使用专家网络的加权意见而不是平均意见。自适应地选择权重,以最大化小组对学习样本的预测能力。结果,一个小圈子训练有素的网络做出的贡献会更小,不会破坏预测。
这种方法的可能性可以通过下面25个专家组成的两类小圈网络(见图14和15)的预测比较来说明。预测是按照相同的方案进行的:作为输入,时间序列的指数移动平均值被用于等于前10个斐波那契数的周期。根据从100个实验中获得的结果,加权预测提供了正确预测符号的平均超过错误预测的符号,大约等于15,而对于平均预测,这个因子大约是12.应当指出,总量的价格上涨幅度相比,在给定的时间内下降率恰好等于12.因此,考虑到增加的主要倾向,作为一个微不足道的常数预测“
  
图14.在25位专家的平均预测中正确预测符号总和的直方图。标准偏差为3.2时,平均值为100 cot = 11.7。        图15.相同的25位专家的加权预测正确预测符号的和的直方图。标准偏差为4.9时,平均100 cot = 15.2

神经网络预测可能的利润率

到目前为止,我们已经将数字实验的结果制定为正确预测符号的百分比。现在让我们来了解一下使用神经网络进行交易时真正可以获得的利润率。上面得到的利润率的上限不考虑波动,在实践中难以达到,更多的是我们没有考虑交易成本,在此之前可以抵消达到的可预测性水平。
事实上,考虑到佣金会导致衰退常数的出现:

而且,与可预测性水平不同 ,佣金  线性地进入,而不是二次方。因此,在上面的例子中,可预测性的典型值 不能超过佣金 。
为了给出这个领域中神经网络的真实可能性,我们将给出神经网络在不同典型时间的三个指标上的自动交易结果:指标S $ P500的值,每月读数间隔,每日报价DM / $,以及卢克石油公司在俄罗斯交易所的股票的小时读数。预测统计收集在50个不同的神经网络系统(每个网络包含50个神经网络)。时间序列本身以及预测每个时间序列的最后100个值的测试集上的符号的结果如图16所示。


图16. 三个实际财务指标的100个值的测试样本正确( )和错误( )预测符号的平均值和直方图。
这些结果证实了直观明显的规律性:时间序列是更可预测的,读数之间的时间越少。事实上,时间序列的连续值之间的时间越长,对于市场参与者而言,对于其动态而言外部的信息就越多,因此关于未来的信息就越少。
然后,将上面获得的预测用于测试集上的交易。同时,根据预测的置信度选择每一步合同的规模,同时 对学习样本的全局参数值进行优化。此外,根据其成功,小圈子中的每个网络都有自己的浮动评级。在每一步的预测中,我们只使用网络中实际“最好”的部分。这些“神经”交易者的结果如图17所示。


图17.根据佣金数量获得50个实现的统计。
佣金的实际价值以虚线表示真正可达的利润率区域。
最后的胜利(如游戏策略本身)当然取决于佣金的大小。上图中显示了这种依赖关系。图中标出了作者已知的所选计量单位的佣金实际值。在这些实验中,我们没有考虑实际交易的“量化”性质,即我们没有考虑交易规模必须等于典型合约整数的事实。这种情况对应于交易大型资本,典型的交易包含许多合约。此外,保证交易是隐含的,即利润率是作为一个比安全资本的比例,远小于合同本身的比例。
以上结果表明,基于神经网络的交易是非常有前途的,至少在短期内是如此。此外,鉴于金融时间序列的自相似性(Peters,1994),单位时间的利润率越高,典型的交易时间越少。因此,使用神经网络的自动交易者在实时模式下交易时效率最高,在实时模式下,他们的优势比典型的经纪人更为明显:抗疲劳,对情绪不敏感,潜在的反应率更高。与自动交易系统连接的训练有素的神经网络可以比人类经纪人更早识别其终端图表中的价格变化来作出决定。

结论
我们证明(至少有一些)市场时间序列是部分可预测的。像任何其他类型的神经分析一样,预测时间序列需要相当复杂和谨慎的数据预处理。但是,时间序列的工作有其自身的特点,可以用来增加利润。这涉及输入的选择(使用数据表示的特殊方法)和输出的选择,以及使用特定的错误函数。最后,我们证明了使用小组神经专家相比单独的神经网络有更多的利润,同时也提供了多个实际证券的实际利润率数据。

打赏