CN104794235B - 金融时间序列分段分布特征计算方法及系统 - Google Patents

金融时间序列分段分布特征计算方法及系统 Download PDF

Info

Publication number
CN104794235B
CN104794235B CN201510227872.6A CN201510227872A CN104794235B CN 104794235 B CN104794235 B CN 104794235B CN 201510227872 A CN201510227872 A CN 201510227872A CN 104794235 B CN104794235 B CN 104794235B
Authority
CN
China
Prior art keywords
sequence
quantum
distribution
data
segment
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201510227872.6A
Other languages
English (en)
Other versions
CN104794235A (zh
Inventor
曹东
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guanyan Shanghai Patent Technology Co ltd
Shanghai Kafang Information Technology Co ltd
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to CN201510227872.6A priority Critical patent/CN104794235B/zh
Publication of CN104794235A publication Critical patent/CN104794235A/zh
Application granted granted Critical
Publication of CN104794235B publication Critical patent/CN104794235B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Complex Calculations (AREA)
  • Magnetic Resonance Imaging Apparatus (AREA)

Abstract

本发明公开了一种金融时间序列分段分布特征计算方法。所述方法基于交易价格的TICK数据,采用差分去直流的数据预处理方法,构造一种新的分段序列数据结构,对差分序列进行连续分段,统计分段序列先验概率分布,实现金融交易数据趋势分布计算。本发明还提供一种金融时间序列分段分布特征计算系统,相比于其他金融时间序列特征提取算法,本发明具有更简洁的数据处理结构,更优的识别性能和良好的数据一致性;同时,本发明的数据处理方法得到的序列分布特性明显,在模糊估计方面相比于其他同类算法具有更优性能。

Description

金融时间序列分段分布特征计算方法及系统
技术领域
本发明涉及一种金融时间序列数据分布特征提取方法,属于计算机数据处理技术领域。
背景技术
时间序列分析在理论和经验上已成为金融市场研究的不可缺少的部分。时间序列分析方法已是金融定量分析的主流方法之一。近代计量经济和金融市场的许多研究成果都建立在时间序列分析的基础之上。Engle和Grange因为他们的时间序列模型在经济金融中的广泛应用而获得2003年的诺贝尔经济学奖,就是时间序列分析方法的重要性在世界上被广泛认可的有力证明。
金融时间序列分析研究的是资产价值随时间演变的理论与实践。对于金融资产收益率序列,波动率往往不能被观察到,此时统计技术与方法起到了很重要的作用。时间序列预测就是利用统计技术与方法,从预测指标的时间序列中找出演变模式,建立数学模型,对预测指标的未来发展趋势做出定量估计。时间序列预测主要是以连续性原理作为依据的,连续性原理是指客观事物的发展具有合乎规律的连续性,事物发展是按照它本身固有的规律进行的。在一定条件下,只要规律赖以发生作用的条件不产生质的变化,则事物的基本发展趋势在未来就还会延续下去。
程序化交易方法在专业投资领域被广泛采用,近年来呈现高速发展趋势,金融时间序列分析方法在程序化交易设计等等量化投资领域给出有效的解决方案。可以为投资机构在进行算法交易与投资组合管理时提供模型依据,并且可以提供风险分析的数据源。
但是,金融时间序列实时数据随市场波动性强,每交易日的TICK数据量大,在分析处理过程中的计算复杂度较大,增加了数据特征提取的难度。
发明内容
本发明所要解决的技术问题是针对金融时间序列数据分段分布特征提取难度大的现状,提出一种金融时间序列数据分段分布特征计算方法。
本发明为解决上述技术问题采用以下技术方案:
一种金融时间序列分段分布特征计算方法,包括如下步骤:
步骤A、对获取的金融交易数据按照价格-时间序列进行差分处理,去除数据中的直流成分,得到差分序列;
步骤B、对差分序列按照时间顺序进行连续分段,得到若干个w元向量,w为分段窗口的大小;
步骤C、进行连续分段的分布特性统计,筛选出不同种类的分段,对于同一种分段统计其出现的次数;然后对于不同种类的分段进行排序构成分段特征矩阵,其中:矩阵中每行的第一列至第w列构成的行向量代表每个分段,第w+1列代表对应分段出现的次数;第w+2列到最末列为分段特征向量;
步骤D、根据分段特征矩阵,在已知差分序列第k位取值的条件下,得到差分序列第k+1至第k+w-1位取值的概率分布,具体操作过程是:首先确定差分序列第k位取值Vk,然后从分段特征矩阵中挑选出第一列元素等于Vk的所有行构成新的子矩阵Mj,将子矩阵Mj的第二至w列作为子向量按照升序排列,然后以第二至第w列的升序子向量作为横轴,各子向量对应出现的次数为纵轴,得到第k+1至第k+w-1位的取值频度分布情况。
进一步的,本发明所提出的金融时间序列分段分布特征计算方法,步骤A所述的差分处理为一阶差分处理,得到一阶差分序列。
进一步的,本发明所提出的金融时间序列分段分布特征计算方法,步骤B所述分段窗口w=2、3、4、5、6、7。
进一步的,本发明所提出的金融时间序列分段分布特征计算方法,步骤C中分段特征矩阵中的列排序是按照各分段的w元向量的第一元至第w元从小到大进行排列,先以分段向量第一元素的大小从小往大进行升序排列,如果分段向量第一元素的大小相同时,再以分段向量第二元素的大小从小到大进行升序排列,依此类推。
进一步的,本发明所提出的金融时间序列分段分布特征计算方法,分段特征向量代表对应分段在步骤A所述差分序列中的位置,分段特征向量中出现1的位置代表对应分段在序列中出现的位置,其余位置用0元素表示。
进一步的,本发明所提出的金融时间序列分段分布特征计算方法,步骤B所述分段窗口w=2。
进一步的,本发明所提出的金融时间序列分段分布特征计算方法,步骤D中将子矩阵Mj的第二至w列作为子向量按照升序排列,是按照各子向量第一元素的大小从小往大进行升序排列,如果第一元素的大小相同时,再以第二元素的大小从小到大进行升序排列,依此类推。
进一步的,本发明所提出的金融时间序列分段分布特征计算方法,步骤A所述的差分处理,是采用量子熵分布模糊哈希算法以确定差分阶数:
(1)分析原始金融时间序列的各阶差分序列的量子广义信息熵及其相似性:
将各阶差分序列表示成量子序列形式,给定一个具有t个数据元素的量子数据序列|φ>t,每个数据元素表示为qutrit态,qutrit态的一系列正交基表示为|0>,|1>与|2>,纯态|μ>为|0>,|1>与|2>的叠加态,量子态|μ>表示为:
其中,e代表自然对数的底,i代表单位纯虚数,0≤μ12≤2π;
(2)量子qutrit态基的表现形式是SU(3)生成子,SU(3)生成子的矩阵形式表示如下:
(3)根据(2)的矩阵形式来得到各阶差分序列的基态分布概率P,进一步求得各阶差分序列对应的量子广义信息熵Ht(|φ>t)为:
按照从大到小顺序排列,取最大的量子广义信息熵Ht(|φ>t)对应的序列的阶数为差分阶数。
本发明还提出一种金融时间序列分段分布特征计算系统,包括:
数据处理模块,对获取的金融交易数据按照价格-时间序列进行差分处理,去除数据中的直流成分,得到差分序列;
分段模块,对差分序列按照时间顺序进行连续分段,得到若干个w元向量;
分段特征矩阵构建模块,进行连续分段的分布特性统计,筛选出不同种类的分段,对于同一种分段统计其出现的次数,然后对于不同种类的分段进行排序构成分段特征矩阵;
分布统计模块,根据分段特征矩阵,在已知差分序列第k位取值的条件下,得到差分序列第k+1至第k+w-1位取值的概率分布。
本发明采用以上技术方案与现有技术相比,具有以下技术效果:
本发明在金融时间序列的TICK数据基础上构造一种新的分段序列数据结构,新结构的算法实现与计算复杂度显著降低,数据处理能力显著提高,序列数字特征提取效率显著提高。同时,在金融时间序列基础上实现一阶差分特征提取,相比于二阶等其他高阶差分幅度范围更集中,更利于数据处理。通过最大似然概率优化算法给出分段序列最优分布,降低特征提取算法计算复杂度,实现了程序化交易算法的优化。
相比于其他金融时间序列特征提取算法,本发明具有更简洁的数据处理结构,更优的识别性能和良好的数据一致性。本发明的数据处理方法得到的序列分布特性明显,在模糊估计方面相比于其他同类算法具有更优性能。
附图说明
图1是交易日为2015年01月28日的沪深300股指期货IF1503分段序列依时间顺序的概率分布。
图2是交易日为2015年01月28日的沪深300股指期货IF1503分段序列依升序排列的概率分布。
图3是根据差分序列第i=268位的值0.2统计出第i+1=269位可能取值概率矩阵M268
图4是根据差分序列第i=268位的值0.2统计出第i+1=269位可能取值升序概率分布图。
图5是交易日为2015年01月28日的沪深300股指期货IF1503金融时间序列与一阶差分序列。
图6是交易日为2015年01月28日的沪深300股指期货IF1503分段特征矩阵的部分结构。
图7是本发明的方法流程图。
图8是本发明的系统结构框图。
具体实施方式
下面结合附图对本发明的技术方案做进一步的详细说明。本技术领域技术人员可以理解的是,除非另外定义,这里使用的所有术语(包括技术术语和科学术语)具有与本发明所属领域中的普通技术人员的一般理解相同的意义。还应该理解的是,诸如通用字典中定义的那些术语应该被理解为具有与现有技术的上下文中的意义一致的意义,并且除非像这里一样定义,不会用理想化或过于正式的含义来解释。
本发明基于交易价格的TICK数据,采用差分去直流的数据预处理方法,构造一种新的分段序列数据结构,对差分序列进行连续分段,统计分段序列先验概率分布,实现金融交易数据趋势分布计算。
实施例一:
首先参考图7所示,本发明的方法流程如下:
对获取的金融交易数据按照价格-时间序列进行差分处理,去除数据中的直流成分,得到差分序列;
对差分序列按照时间顺序进行连续分段,得到若干个二元向量;
进行连续分段的分布特性统计,筛选出不同种类的分段,对于同一种分段统计其出现的次数;然后对于不同种类的分段进行排序构成分段特征矩阵,其中:矩阵中每行的第一列至第二列构成的行向量代表每个分段,第三列代表对应分段出现的次数;第四列到最末列为分段特征向量;
根据分段特征矩阵,在已知差分序列第k位取值的条件下,得到差分序列第k+1位取值的概率分布,具体操作过程是:首先确定差分序列第k位取值Vk,然后从分段特征矩阵中挑选出第一列元素等于Vk的所有行构成新的子矩阵Mj,将子矩阵Mj的第二列作为子向量按照升序排列,然后以第二列的升序子向量作为横轴,各子向量对应出现的次数为纵轴,得到第k+1位的取值频度分布情况。
在进行差分处理时,本发明是采用量子熵分布模糊哈希算法以确定采用几阶差分:
(1)、分析原始金融时间序列的一阶、二阶......等等差分序列的量子广义信息熵及其相似性,本实施例选取一阶到五阶差分序列进行分析;具体为:
将一阶、二阶......五阶差分序列表示成量子序列形式。给定一个具有t数据元素的量子数据序列|φ>t,每个数据元素可以表示为qutrit态,qutrit态的一系列正交基可以表示为|0>,|1>与|2>,纯态|μ>为|0>,|1>与|2>的叠加态,量子态|μ>可以表示为如下:
其中,e代表自然对数的底,i代表单位纯虚数,0≤μ12≤2π;
sinαcosβ代表在基态|0>上面的分量,sinαsinβ代表在基态|1>上面的分量,cosβ代表在基态|2>上面的分量。
(2)、量子qutrit态基的表示是SU(3)生成子,生成子的矩阵形式表示如下:
(3)、根据(2)的矩阵形式来得到各阶差分序列的基态分布概率P,进一步求得一阶、二阶……五阶差分序列对应的量子广义信息熵Ht(|φ>t)为:
按照从大到小顺序排列,取最大的量子广义信息熵Ht(|φ>t)对应的序列的阶数为差分阶数。
在本实施例中,计算最终的结果是采用一阶差分序列,即差分阶数为一时所对应的量子广义信息熵Ht(|φ>t)最大。
如图8所示,本发明还提出一种金融时间序列分段分布特征计算系统,包括:
数据处理模块,对获取的金融交易数据按照价格-时间序列进行差分处理,去除数据中的直流成分,得到差分序列;
分段模块,对差分序列按照时间顺序进行连续分段,得到若干个二元向量;
分段特征矩阵构建模块,进行连续分段的分布特性统计,筛选出不同种类的分段,对于同一种分段统计其出现的次数,然后对于不同种类的分段进行排序构成分段特征矩阵;
分布统计模块,根据分段特征矩阵,在已知差分序列第k位取值的条件下,统计差分序列第k+1位取值的概率分布。
下面举一个实例来进一步详述本发明的实施过程:
如图1所示,以沪深300股指期货一个交易日的TICK交易价格为数据源,合约为IF1503,交易日期2015年01月28日。对交易价格的一阶差分序列进行连续分段,统计其分布概率,并提取其数字特征。
1、对价格时间序列差分,去除直流成分,通过对比一阶、二阶、三阶差分取值范围分别为8.2000、27.8000和70.4000,一阶差分取值范围最小,所以下文均采用一阶差分处理。金融时间序列与一阶差分序列如图5。
2、对一阶差分序列进行按照时间顺序进行连续分段,分段窗口w=2、3、4、5、6、7。比如w=2时,得到矩阵Mw形式如下:
其中每一列为一个分段,从左到右以时间为顺序。
3、统计矩阵Mw中分段的分布特性,得到439*32406分段特征矩阵,其部分结构如图6示意:每行的第一、第二列构成的行向量代表每个分段,第三列代表对应分段出现次数;每行的第四列到最末列称为“分段特征向量”,长度与矩阵Mw的长度相同,“分段特征向量”中出现1的位置代表对应分段在矩阵Mw序列中的位置。整体构成“分段特征矩阵”(439*32406),表明在32406个顺序分段中,存在439个相异分段。
4、如图1所示,以分段特征矩阵中每个分段首次出现的时间先后为顺序建立横轴,以每个分段对应出现的次数为纵轴。如图2所示,图中以同样的数据源,横轴以分段向量升序排列作图。
5、以w=2为例,在已知差分序列第k位取值的条件下,统计差分序列第k+1位取值的概率分布,具体操作过程是:首先确定差分序列第k位取值Vk,然后从分段特征矩阵中挑选出第一列元素等于Vk的所有行构成新的子矩阵Mj,将子矩阵Mj第二列、第三列按照升序排列,升序后的可能取值为横轴,对应概率为纵轴,根据差分序列第k位的值统计出第k+1位的可能取值分布情况,以k=268为例,Vk=V268=0.2,则第k+1=269位取值的概率子矩阵M268见图3,升序排列的概率矩阵分布图见图4。
以上所述仅是本发明的部分实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (9)

1.一种金融时间序列分段分布特征计算方法,其特征在于,包括如下步骤:
步骤A、对获取的金融交易数据按照价格-时间序列进行差分处理,去除数据中的直流成分,得到差分序列;所述的差分处理,是采用量子熵分布模糊哈希算法以确定差分阶数:
(1)分析原始金融时间序列的各阶差分序列的量子广义信息熵及其相似性:
将各阶差分序列表示成量子序列形式,给定一个具有t个数据元素的量子数据序列|φ>t,每个数据元素表示为qutrit态,qutrit态的一系列正交基表示为|0>,|1>与|2>,纯态|μ>为|0>,|1>与|2>的叠加态,量子态|μ>表示为:
<mrow> <mo>|</mo> <mi>&amp;mu;</mi> <mo>&gt;</mo> <mo>=</mo> <msup> <mi>e</mi> <mrow> <msub> <mi>i&amp;mu;</mi> <mn>1</mn> </msub> </mrow> </msup> <mi>s</mi> <mi>i</mi> <mi>n</mi> <mi>&amp;alpha;</mi> <mi>c</mi> <mi>o</mi> <mi>s</mi> <mi>&amp;beta;</mi> <mo>|</mo> <mn>0</mn> <mo>&gt;</mo> <mo>+</mo> <msup> <mi>e</mi> <mrow> <msub> <mi>i&amp;mu;</mi> <mn>2</mn> </msub> </mrow> </msup> <mi>s</mi> <mi>i</mi> <mi>n</mi> <mi>&amp;alpha;</mi> <mi>s</mi> <mi>i</mi> <mi>n</mi> <mi>&amp;beta;</mi> <mo>|</mo> <mn>1</mn> <mo>&gt;</mo> <mo>+</mo> <mi>c</mi> <mi>o</mi> <mi>s</mi> <mi>&amp;beta;</mi> <mo>|</mo> <mn>2</mn> <mo>&gt;</mo> </mrow>
其中,e代表自然对数的底,i代表单位纯虚数,0≤μ12≤2π;
(2)设量子qutrit态基的表现形式是SU(3)生成子,将SU(3)生成子的矩阵形式表示如下:
<mrow> <msub> <mi>&amp;sigma;</mi> <mn>1</mn> </msub> <mo>=</mo> <mfenced open = "[" close = "]"> <mtable> <mtr> <mtd> <mn>0</mn> </mtd> <mtd> <mn>1</mn> </mtd> <mtd> <mn>0</mn> </mtd> </mtr> <mtr> <mtd> <mn>1</mn> </mtd> <mtd> <mn>0</mn> </mtd> <mtd> <mn>0</mn> </mtd> </mtr> <mtr> <mtd> <mn>0</mn> </mtd> <mtd> <mn>0</mn> </mtd> <mtd> <mn>0</mn> </mtd> </mtr> </mtable> </mfenced> <mo>,</mo> <msub> <mi>&amp;sigma;</mi> <mn>5</mn> </msub> <mo>=</mo> <mfenced open = "[" close = "]"> <mtable> <mtr> <mtd> <mn>0</mn> </mtd> <mtd> <mn>0</mn> </mtd> <mtd> <mrow> <mo>-</mo> <mi>i</mi> </mrow> </mtd> </mtr> <mtr> <mtd> <mn>0</mn> </mtd> <mtd> <mn>0</mn> </mtd> <mtd> <mn>0</mn> </mtd> </mtr> <mtr> <mtd> <mi>i</mi> </mtd> <mtd> <mn>0</mn> </mtd> <mtd> <mn>0</mn> </mtd> </mtr> </mtable> </mfenced> </mrow>
<mrow> <msub> <mi>&amp;sigma;</mi> <mn>2</mn> </msub> <mo>=</mo> <mfenced open = "[" close = "]"> <mtable> <mtr> <mtd> <mn>0</mn> </mtd> <mtd> <mrow> <mo>-</mo> <mi>i</mi> </mrow> </mtd> <mtd> <mn>0</mn> </mtd> </mtr> <mtr> <mtd> <mi>i</mi> </mtd> <mtd> <mn>0</mn> </mtd> <mtd> <mn>0</mn> </mtd> </mtr> <mtr> <mtd> <mn>0</mn> </mtd> <mtd> <mn>0</mn> </mtd> <mtd> <mn>0</mn> </mtd> </mtr> </mtable> </mfenced> <mo>,</mo> <msub> <mi>&amp;sigma;</mi> <mn>6</mn> </msub> <mo>=</mo> <mfenced open = "[" close = "]"> <mtable> <mtr> <mtd> <mn>0</mn> </mtd> <mtd> <mn>0</mn> </mtd> <mtd> <mn>0</mn> </mtd> </mtr> <mtr> <mtd> <mn>0</mn> </mtd> <mtd> <mn>0</mn> </mtd> <mtd> <mn>1</mn> </mtd> </mtr> <mtr> <mtd> <mn>0</mn> </mtd> <mtd> <mn>1</mn> </mtd> <mtd> <mn>0</mn> </mtd> </mtr> </mtable> </mfenced> </mrow>
<mrow> <msub> <mi>&amp;sigma;</mi> <mn>3</mn> </msub> <mo>=</mo> <mfenced open = "[" close = "]"> <mtable> <mtr> <mtd> <mn>1</mn> </mtd> <mtd> <mn>0</mn> </mtd> <mtd> <mn>0</mn> </mtd> </mtr> <mtr> <mtd> <mn>0</mn> </mtd> <mtd> <mrow> <mo>-</mo> <mn>1</mn> </mrow> </mtd> <mtd> <mn>0</mn> </mtd> </mtr> <mtr> <mtd> <mn>0</mn> </mtd> <mtd> <mn>0</mn> </mtd> <mtd> <mn>0</mn> </mtd> </mtr> </mtable> </mfenced> <mo>,</mo> <msub> <mi>&amp;sigma;</mi> <mn>7</mn> </msub> <mo>=</mo> <mfenced open = "[" close = "]"> <mtable> <mtr> <mtd> <mn>0</mn> </mtd> <mtd> <mn>0</mn> </mtd> <mtd> <mn>0</mn> </mtd> </mtr> <mtr> <mtd> <mn>0</mn> </mtd> <mtd> <mn>0</mn> </mtd> <mtd> <mrow> <mo>-</mo> <mi>i</mi> </mrow> </mtd> </mtr> <mtr> <mtd> <mn>0</mn> </mtd> <mtd> <mi>i</mi> </mtd> <mtd> <mn>0</mn> </mtd> </mtr> </mtable> </mfenced> </mrow>
<mrow> <msub> <mi>&amp;sigma;</mi> <mn>4</mn> </msub> <mo>=</mo> <mfenced open = "[" close = "]"> <mtable> <mtr> <mtd> <mn>0</mn> </mtd> <mtd> <mn>0</mn> </mtd> <mtd> <mn>1</mn> </mtd> </mtr> <mtr> <mtd> <mn>0</mn> </mtd> <mtd> <mn>0</mn> </mtd> <mtd> <mn>0</mn> </mtd> </mtr> <mtr> <mtd> <mn>1</mn> </mtd> <mtd> <mn>0</mn> </mtd> <mtd> <mn>0</mn> </mtd> </mtr> </mtable> </mfenced> <mo>,</mo> <msub> <mi>&amp;sigma;</mi> <mn>8</mn> </msub> <mo>=</mo> <mfrac> <mn>1</mn> <msqrt> <mn>3</mn> </msqrt> </mfrac> <mfenced open = "[" close = "]"> <mtable> <mtr> <mtd> <mn>1</mn> </mtd> <mtd> <mn>0</mn> </mtd> <mtd> <mn>0</mn> </mtd> </mtr> <mtr> <mtd> <mn>0</mn> </mtd> <mtd> <mn>1</mn> </mtd> <mtd> <mn>0</mn> </mtd> </mtr> <mtr> <mtd> <mn>0</mn> </mtd> <mtd> <mn>0</mn> </mtd> <mtd> <mrow> <mo>-</mo> <mn>2</mn> </mrow> </mtd> </mtr> </mtable> </mfenced> </mrow>
(3)根据(2)中所描述的矩阵形式来得到各阶差分序列的基态分布概率P,进一步求得各阶差分序列对应的量子广义信息熵为:
<mfenced open = "" close = ""> <mtable> <mtr> <mtd> <mrow> <msub> <mi>H</mi> <mi>t</mi> </msub> <mrow> <mo>(</mo> <mo>|</mo> <mi>&amp;phi;</mi> <mo>&gt;</mo> <mo>)</mo> </mrow> <mo>=</mo> <mo>-</mo> <munderover> <mo>&amp;Sigma;</mo> <mrow> <mi>k</mi> <mo>=</mo> <mn>0</mn> </mrow> <mn>2</mn> </munderover> <mi>p</mi> <mrow> <mo>(</mo> <mo>|</mo> <mi>k</mi> <mo>&gt;</mo> <mo>)</mo> </mrow> <mi>log</mi> <mi> </mi> <mi>p</mi> <mrow> <mo>(</mo> <mo>|</mo> <mi>k</mi> <mo>&gt;</mo> <mo>)</mo> </mrow> </mrow> </mtd> </mtr> <mtr> <mtd> <mrow> <mo>=</mo> <mo>-</mo> <mrow> <mo>(</mo> <mo>|</mo> <mn>0</mn> <mo>&gt;</mo> <mo>)</mo> </mrow> <mi>log</mi> <mi> </mi> <mi>p</mi> <mrow> <mo>(</mo> <mo>|</mo> <mn>0</mn> <mo>&gt;</mo> <mo>)</mo> </mrow> </mrow> </mtd> </mtr> <mtr> <mtd> <mrow> <mo>-</mo> <mi>p</mi> <mrow> <mo>(</mo> <mo>|</mo> <mn>1</mn> <mo>&gt;</mo> <mo>)</mo> </mrow> <mi>log</mi> <mi> </mi> <mi>p</mi> <mrow> <mo>(</mo> <mo>|</mo> <mn>1</mn> <mo>&gt;</mo> <mo>)</mo> </mrow> </mrow> </mtd> </mtr> <mtr> <mtd> <mrow> <mo>-</mo> <mi>p</mi> <mrow> <mo>(</mo> <mo>|</mo> <mn>2</mn> <mo>&gt;</mo> <mo>)</mo> </mrow> <mi>log</mi> <mi> </mi> <mi>p</mi> <mrow> <mo>(</mo> <mo>|</mo> <mn>2</mn> <mo>&gt;</mo> <mo>)</mo> </mrow> </mrow> </mtd> </mtr> </mtable> </mfenced>
按照从大到小顺序排列,取最大的量子广义信息熵Ht(|φ>t)对应的序列的阶数为差分阶数;
步骤B、对差分序列按照时间顺序进行连续分段,得到若干个w元向量,w为分段窗口的大小;
步骤C、进行连续分段的分布特性统计,筛选出不同种类的分段,对于同一种分段统计其出现的次数;然后对于不同种类的分段进行排序构成分段特征矩阵,其中:矩阵中每行的第一列至第w列构成的行向量代表每个分段,第w+1列代表对应分段出现的次数;第w+2列到最末列为分段特征向量;
步骤D、根据分段特征矩阵,在已知差分序列第k位取值的条件下,得到差分序列第k+1至第k+w-1位取值的概率分布。
2.根据权利要求1所述的一种金融时间序列分段分布特征计算方法,其特征在于,步骤D具体操作过程是:首先确定差分序列第k位取值Vk,然后从分段特征矩阵中挑选出第一列元素等于Vk的所有行构成新的子矩阵Mj,将子矩阵Mj的第二至w列作为子向量按照升序排列,然后以第二至第w列的升序子向量作为横轴,各子向量对应出现的次数为纵轴,得到第k+1至第k+w-1位的取值频度分布情况。
3.根据权利要求1所述的一种金融时间序列分段分布特征计算方法,其特征在于,步骤A所述的差分处理为一阶差分处理,得到一阶差分序列。
4.根据权利要求1所述的一种金融时间序列分段分布特征计算方法,其特征在于,步骤B所述分段窗口的大小w为2或3或4或5或6或7中的任意一个。
5.根据权利要求1所述的一种金融时间序列分段分布特征计算方法,其特征在于,步骤C中分段特征矩阵中的列排序是按照各分段的w元向量的第一元至第w元从小到大进行排列,先以分段向量第一元素的大小从小往大进行升序排列,如果分段向量第一元素的大小相同时,再以分段向量第二元素的大小从小到大进行升序排列,依此类推。
6.根据权利要求1所述的一种金融时间序列分段分布特征计算方法,其特征在于,分段特征向量代表对应分段在步骤A所述差分序列中的位置,分段特征向量中出现1的位置代表对应分段在序列中出现的位置,其余位置用0元素表示。
7.根据权利要求1或4所述的一种金融时间序列分段分布特征计算方法,其特征在于,步骤B所述分段窗口的大小w=2。
8.根据权利要求2所述的一种金融时间序列分段分布特征计算方法,其特征在于,步骤D中将子矩阵Mj的第二至w列作为子向量按照升序排列,是按照各子向量第一元素的大小从小往大进行升序排列,如果第一元素的大小相同时,再以第二元素的大小从小到大进行升序排列,依此类推。
9.一种金融时间序列分段分布特征计算系统,其特征在于,包括:
数据处理模块,对获取的金融交易数据按照价格-时间序列进行差分处理,去除数据中的直流成分,得到差分序列;所述的差分处理,是采用量子熵分布模糊哈希算法以确定差分阶数:
(1)分析原始金融时间序列的各阶差分序列的量子广义信息熵及其相似性:
将各阶差分序列表示成量子序列形式,给定一个具有t个数据元素的量子数据序列|φ>t,每个数据元素表示为qutrit态,qutrit态的一系列正交基表示为|0>,|1>与|2>,纯态|μ>为|0>,|1>与|2>的叠加态,量子态|μ>表示为:
<mrow> <mo>|</mo> <mi>&amp;mu;</mi> <mo>&gt;</mo> <mo>=</mo> <msup> <mi>e</mi> <mrow> <msub> <mi>i&amp;mu;</mi> <mn>1</mn> </msub> </mrow> </msup> <mi>s</mi> <mi>i</mi> <mi>n</mi> <mi>&amp;alpha;</mi> <mi>c</mi> <mi>o</mi> <mi>s</mi> <mi>&amp;beta;</mi> <mo>|</mo> <mn>0</mn> <mo>&gt;</mo> <mo>+</mo> <msup> <mi>e</mi> <mrow> <msub> <mi>i&amp;mu;</mi> <mn>2</mn> </msub> </mrow> </msup> <mi>s</mi> <mi>i</mi> <mi>n</mi> <mi>&amp;alpha;</mi> <mi>s</mi> <mi>i</mi> <mi>n</mi> <mi>&amp;beta;</mi> <mo>|</mo> <mn>1</mn> <mo>&gt;</mo> <mo>+</mo> <mi>c</mi> <mi>o</mi> <mi>s</mi> <mi>&amp;beta;</mi> <mo>|</mo> <mn>2</mn> <mo>&gt;</mo> </mrow>
其中,e代表自然对数的底,i代表单位纯虚数,0≤μ12≤2π;
(2)设量子qutrit态基的表现形式是SU(3)生成子,将SU(3)生成子的矩阵形式表示如下:
<mrow> <msub> <mi>&amp;sigma;</mi> <mn>1</mn> </msub> <mo>=</mo> <mfenced open = "[" close = "]"> <mtable> <mtr> <mtd> <mn>0</mn> </mtd> <mtd> <mn>1</mn> </mtd> <mtd> <mn>0</mn> </mtd> </mtr> <mtr> <mtd> <mn>1</mn> </mtd> <mtd> <mn>0</mn> </mtd> <mtd> <mn>0</mn> </mtd> </mtr> <mtr> <mtd> <mn>0</mn> </mtd> <mtd> <mn>0</mn> </mtd> <mtd> <mn>0</mn> </mtd> </mtr> </mtable> </mfenced> <mo>,</mo> <msub> <mi>&amp;sigma;</mi> <mn>5</mn> </msub> <mo>=</mo> <mfenced open = "[" close = "]"> <mtable> <mtr> <mtd> <mn>0</mn> </mtd> <mtd> <mn>0</mn> </mtd> <mtd> <mrow> <mo>-</mo> <mi>i</mi> </mrow> </mtd> </mtr> <mtr> <mtd> <mn>0</mn> </mtd> <mtd> <mn>0</mn> </mtd> <mtd> <mn>0</mn> </mtd> </mtr> <mtr> <mtd> <mi>i</mi> </mtd> <mtd> <mn>0</mn> </mtd> <mtd> <mn>0</mn> </mtd> </mtr> </mtable> </mfenced> </mrow>
<mrow> <msub> <mi>&amp;sigma;</mi> <mn>2</mn> </msub> <mo>=</mo> <mfenced open = "[" close = "]"> <mtable> <mtr> <mtd> <mn>0</mn> </mtd> <mtd> <mrow> <mo>-</mo> <mi>i</mi> </mrow> </mtd> <mtd> <mn>0</mn> </mtd> </mtr> <mtr> <mtd> <mi>i</mi> </mtd> <mtd> <mn>0</mn> </mtd> <mtd> <mn>0</mn> </mtd> </mtr> <mtr> <mtd> <mn>0</mn> </mtd> <mtd> <mn>0</mn> </mtd> <mtd> <mn>0</mn> </mtd> </mtr> </mtable> </mfenced> <mo>,</mo> <msub> <mi>&amp;sigma;</mi> <mn>6</mn> </msub> <mo>=</mo> <mfenced open = "[" close = "]"> <mtable> <mtr> <mtd> <mn>0</mn> </mtd> <mtd> <mn>0</mn> </mtd> <mtd> <mn>0</mn> </mtd> </mtr> <mtr> <mtd> <mn>0</mn> </mtd> <mtd> <mn>0</mn> </mtd> <mtd> <mn>1</mn> </mtd> </mtr> <mtr> <mtd> <mn>0</mn> </mtd> <mtd> <mn>1</mn> </mtd> <mtd> <mn>0</mn> </mtd> </mtr> </mtable> </mfenced> </mrow>
<mrow> <msub> <mi>&amp;sigma;</mi> <mn>3</mn> </msub> <mo>=</mo> <mfenced open = "[" close = "]"> <mtable> <mtr> <mtd> <mn>1</mn> </mtd> <mtd> <mn>0</mn> </mtd> <mtd> <mn>0</mn> </mtd> </mtr> <mtr> <mtd> <mn>0</mn> </mtd> <mtd> <mrow> <mo>-</mo> <mn>1</mn> </mrow> </mtd> <mtd> <mn>0</mn> </mtd> </mtr> <mtr> <mtd> <mn>0</mn> </mtd> <mtd> <mn>0</mn> </mtd> <mtd> <mn>0</mn> </mtd> </mtr> </mtable> </mfenced> <mo>,</mo> <msub> <mi>&amp;sigma;</mi> <mn>7</mn> </msub> <mo>=</mo> <mfenced open = "[" close = "]"> <mtable> <mtr> <mtd> <mn>0</mn> </mtd> <mtd> <mn>0</mn> </mtd> <mtd> <mn>0</mn> </mtd> </mtr> <mtr> <mtd> <mn>0</mn> </mtd> <mtd> <mn>0</mn> </mtd> <mtd> <mrow> <mo>-</mo> <mi>i</mi> </mrow> </mtd> </mtr> <mtr> <mtd> <mn>0</mn> </mtd> <mtd> <mi>i</mi> </mtd> <mtd> <mn>0</mn> </mtd> </mtr> </mtable> </mfenced> </mrow>
<mrow> <msub> <mi>&amp;sigma;</mi> <mn>4</mn> </msub> <mo>=</mo> <mfenced open = "[" close = "]"> <mtable> <mtr> <mtd> <mn>0</mn> </mtd> <mtd> <mn>0</mn> </mtd> <mtd> <mn>1</mn> </mtd> </mtr> <mtr> <mtd> <mn>0</mn> </mtd> <mtd> <mn>0</mn> </mtd> <mtd> <mn>0</mn> </mtd> </mtr> <mtr> <mtd> <mn>1</mn> </mtd> <mtd> <mn>0</mn> </mtd> <mtd> <mn>0</mn> </mtd> </mtr> </mtable> </mfenced> <mo>,</mo> <msub> <mi>&amp;sigma;</mi> <mn>8</mn> </msub> <mo>=</mo> <mfrac> <mn>1</mn> <msqrt> <mn>3</mn> </msqrt> </mfrac> <mfenced open = "[" close = "]"> <mtable> <mtr> <mtd> <mn>1</mn> </mtd> <mtd> <mn>0</mn> </mtd> <mtd> <mn>0</mn> </mtd> </mtr> <mtr> <mtd> <mn>0</mn> </mtd> <mtd> <mn>1</mn> </mtd> <mtd> <mn>0</mn> </mtd> </mtr> <mtr> <mtd> <mn>0</mn> </mtd> <mtd> <mn>0</mn> </mtd> <mtd> <mrow> <mo>-</mo> <mn>2</mn> </mrow> </mtd> </mtr> </mtable> </mfenced> </mrow>
(3)根据(2)中所描述的矩阵形式来得到各阶差分序列的基态分布概率P,进一步求得各阶差分序列对应的量子广义信息熵为:
<mfenced open = "" close = ""> <mtable> <mtr> <mtd> <mrow> <msub> <mi>H</mi> <mi>t</mi> </msub> <mrow> <mo>(</mo> <mo>|</mo> <mi>&amp;phi;</mi> <mo>&gt;</mo> <mo>)</mo> </mrow> <mo>=</mo> <mo>-</mo> <munderover> <mo>&amp;Sigma;</mo> <mrow> <mi>k</mi> <mo>=</mo> <mn>0</mn> </mrow> <mn>2</mn> </munderover> <mi>p</mi> <mrow> <mo>(</mo> <mo>|</mo> <mi>k</mi> <mo>&gt;</mo> <mo>)</mo> </mrow> <mi>log</mi> <mi> </mi> <mi>p</mi> <mrow> <mo>(</mo> <mo>|</mo> <mi>k</mi> <mo>&gt;</mo> <mo>)</mo> </mrow> </mrow> </mtd> </mtr> <mtr> <mtd> <mrow> <mo>=</mo> <mo>-</mo> <mrow> <mo>(</mo> <mo>|</mo> <mn>0</mn> <mo>&gt;</mo> <mo>)</mo> </mrow> <mi>log</mi> <mi> </mi> <mi>p</mi> <mrow> <mo>(</mo> <mo>|</mo> <mn>0</mn> <mo>&gt;</mo> <mo>)</mo> </mrow> </mrow> </mtd> </mtr> <mtr> <mtd> <mrow> <mo>-</mo> <mi>p</mi> <mrow> <mo>(</mo> <mo>|</mo> <mn>1</mn> <mo>&gt;</mo> <mo>)</mo> </mrow> <mi>log</mi> <mi> </mi> <mi>p</mi> <mrow> <mo>(</mo> <mo>|</mo> <mn>1</mn> <mo>&gt;</mo> <mo>)</mo> </mrow> </mrow> </mtd> </mtr> <mtr> <mtd> <mrow> <mo>-</mo> <mi>p</mi> <mrow> <mo>(</mo> <mo>|</mo> <mn>2</mn> <mo>&gt;</mo> <mo>)</mo> </mrow> <mi>log</mi> <mi> </mi> <mi>p</mi> <mrow> <mo>(</mo> <mo>|</mo> <mn>2</mn> <mo>&gt;</mo> <mo>)</mo> </mrow> </mrow> </mtd> </mtr> </mtable> </mfenced>
按照从大到小顺序排列,取最大的量子广义信息熵Ht(|φ>t)对应的序列的阶数为差分阶数;
分段模块,对差分序列按照时间顺序进行连续分段,得到若干个w元向量,w为分段窗口的大小;
分段特征矩阵构建模块,进行连续分段的分布特性统计,筛选出不同种类的分段,对于同一种分段统计其出现的次数,然后对于不同种类的分段进行排序构成分段特征矩阵;
分布统计模块,根据分段特征矩阵,在已知差分序列第i位取值的条件下,得到差分序列第k+1至第k+w-1位取值的概率分布。
CN201510227872.6A 2015-05-06 2015-05-06 金融时间序列分段分布特征计算方法及系统 Active CN104794235B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510227872.6A CN104794235B (zh) 2015-05-06 2015-05-06 金融时间序列分段分布特征计算方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510227872.6A CN104794235B (zh) 2015-05-06 2015-05-06 金融时间序列分段分布特征计算方法及系统

Publications (2)

Publication Number Publication Date
CN104794235A CN104794235A (zh) 2015-07-22
CN104794235B true CN104794235B (zh) 2018-01-05

Family

ID=53559027

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510227872.6A Active CN104794235B (zh) 2015-05-06 2015-05-06 金融时间序列分段分布特征计算方法及系统

Country Status (1)

Country Link
CN (1) CN104794235B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107918914A (zh) * 2017-11-02 2018-04-17 浙江富帝科技有限公司 一种金融软件中的时间序列数据分段方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6941287B1 (en) * 1999-04-30 2005-09-06 E. I. Du Pont De Nemours And Company Distributed hierarchical evolutionary modeling and visualization of empirical data
CN104317681A (zh) * 2014-09-02 2015-01-28 上海交通大学 针对计算机系统的行为异常自动检测方法及检测系统
CN104504601A (zh) * 2015-01-15 2015-04-08 曹东 基于ctp金融数据的量子信息特征提取方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6941287B1 (en) * 1999-04-30 2005-09-06 E. I. Du Pont De Nemours And Company Distributed hierarchical evolutionary modeling and visualization of empirical data
CN104317681A (zh) * 2014-09-02 2015-01-28 上海交通大学 针对计算机系统的行为异常自动检测方法及检测系统
CN104504601A (zh) * 2015-01-15 2015-04-08 曹东 基于ctp金融数据的量子信息特征提取方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Quantum Fuzzy Classification Hashing Algorithm with the One-Time Pad Security Properties;CAO Dong;《Applied Mechanics and Materials》;20141205;第701-702卷;第1102-1105页 *
簇态量子模糊哈希与隐蔽信息搜索;曹东;《量子电子学报》;20150131;第32卷(第1期);第58-68页 *

Also Published As

Publication number Publication date
CN104794235A (zh) 2015-07-22

Similar Documents

Publication Publication Date Title
Zhou et al. Subspace segmentation-based robust multiple kernel clustering
CN104572886B (zh) 基于k线图表示的金融时间序列相似性查询方法
CN107563645A (zh) 一种基于大数据的金融风险分析方法
CN109492673A (zh) 一种基于谱聚类采样的不平衡数据预测方法
CN110990775B (zh) 基于多流形对偶图正则化非负矩阵分解的多视图聚类方法
CN111078895B (zh) 基于去噪卷积神经网络的远程监督实体关系抽取方法
Chakrabarty A regression approach to distribution and trend analysis of quarterly foreign tourist arrivals in India
CN111539444A (zh) 一种修正式模式识别及统计建模的高斯混合模型方法
CN111259397A (zh) 一种基于马尔科夫图和深度学习的恶意软件分类方法
Fang et al. Multiscale CNNs ensemble based self-learning for hyperspectral image classification
CN111383732B (zh) 一种基于互斥识别的药品审核方法、装置、计算机系统及可读存储介质
Gu et al. Image-based hot pepper disease and pest diagnosis using transfer learning and fine-tuning
Yu et al. A recognition method of soybean leaf diseases based on an improved deep learning model
Wu et al. AAE-SC: A scRNA-seq clustering framework based on adversarial autoencoder
CN104794235B (zh) 金融时间序列分段分布特征计算方法及系统
CN111127407B (zh) 一种基于傅里叶变换的风格迁移伪造图像检测装置及方法
CN114978931B (zh) 基于流形学习的网络流量预测方法、装置及存储介质
US11961277B2 (en) Image information detection method and apparatus and storage medium
CN115115920A (zh) 一种数据训练方法及装置
CN109299260B (zh) 数据分类方法、装置以及计算机可读存储介质
CN113516275A (zh) 一种配电网超短期负荷预测方法、装置及终端设备
CN111882441A (zh) 一种基于理财产品推荐场景的用户预测解释Treeshap方法
CN103488997A (zh) 基于各类重要波段提取的高光谱图像波段选择方法
Ye et al. Semisupervised classification based on tensor convolutional neural network for hyperspectral images
Chen et al. Financial vision based differential privacy applications

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
EXSB Decision made by sipo to initiate substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20220330

Address after: 214029 999-8-d2-201-228, gaolang East Road, Wuxi Economic Development Zone, Wuxi City, Jiangsu Province

Patentee after: Wuxi Dongru Technology Co.,Ltd.

Address before: 210003, 66 new model street, Gulou District, Jiangsu, Nanjing

Patentee before: Cao Dong

TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20221114

Address after: Floor 6, the podium building base of Lancun Building, No. 1381 and 1383, Dongfang Road, Pudong New Area, Shanghai, 200127

Patentee after: Shanghai Kafang Information Technology Co.,Ltd.

Address before: 200232 Room 418, Building 9, No. 509 Caobao Road, Xuhui District, Shanghai

Patentee before: GUANYAN (SHANGHAI) PATENT TECHNOLOGY CO.,LTD.

Effective date of registration: 20221114

Address after: 200232 Room 418, Building 9, No. 509 Caobao Road, Xuhui District, Shanghai

Patentee after: GUANYAN (SHANGHAI) PATENT TECHNOLOGY CO.,LTD.

Address before: 214029 999-8-d2-201-228, gaolang East Road, Wuxi Economic Development Zone, Wuxi City, Jiangsu Province

Patentee before: Wuxi Dongru Technology Co.,Ltd.

TR01 Transfer of patent right
PE01 Entry into force of the registration of the contract for pledge of patent right

Denomination of invention: Calculation method and system for segmented distribution characteristics of financial time series

Effective date of registration: 20231219

Granted publication date: 20180105

Pledgee: Bank of Shanghai Limited by Share Ltd. Minhang branch

Pledgor: Shanghai Kafang Information Technology Co.,Ltd.

Registration number: Y2023980072254

PE01 Entry into force of the registration of the contract for pledge of patent right