CN107577648A - 用于处理多元时间序列数据的方法及装置 - Google Patents

用于处理多元时间序列数据的方法及装置 Download PDF

Info

Publication number
CN107577648A
CN107577648A CN201710785479.8A CN201710785479A CN107577648A CN 107577648 A CN107577648 A CN 107577648A CN 201710785479 A CN201710785479 A CN 201710785479A CN 107577648 A CN107577648 A CN 107577648A
Authority
CN
China
Prior art keywords
time series
series data
multivariate time
variable
whole
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201710785479.8A
Other languages
English (en)
Inventor
申肆
刘朋飞
李爱华
刘亚男
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Jingdong Century Trading Co Ltd
Beijing Jingdong Shangke Information Technology Co Ltd
Original Assignee
Beijing Jingdong Century Trading Co Ltd
Beijing Jingdong Shangke Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Jingdong Century Trading Co Ltd, Beijing Jingdong Shangke Information Technology Co Ltd filed Critical Beijing Jingdong Century Trading Co Ltd
Priority to CN201710785479.8A priority Critical patent/CN107577648A/zh
Publication of CN107577648A publication Critical patent/CN107577648A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请公开一种用于处理多元时间序列数据的方法及装置。设计计算机信息处理领域,该方法包括:对多元时间序列数据进行平稳性检验,获取第一检验结果,所述多元时间序列数据中包含多个变量;如果所述第一检验结果为非平稳,则对所述多元时间序列数据进行协整关系检验,获取第二检验结果;如果所述第二检验结果为存在协整关系,则根据所述多元时间序列数据构建协整回归模型;以及通过所述协整回归模型,确定所述多元时间序列数据的变量之间的关系。本申请公开的用于处理多元时间序列数据的方法及装置,能够避免由于非平稳时间序列数据而造成的伪回归模型,进而得到变量之间的正确关系。

Description

用于处理多元时间序列数据的方法及装置
技术领域
本发明涉及大数据处理领域,具体而言,涉及一种用于处理多元时间序列数据的方法及装置。
背景技术
要想企业持续稳定的发展,在维系老用户的同时还必须发展新用户,而发展一个新用户比维系一个老用户投入的成本要大,那么如何在控制较小成本的基础上能最大化的发展新用户,就成为一个重要的问题。所以需要根据历史数据利用模型发现新用户与投入成本之间的相互关系。在进行如上文所述的大数据分析时,经常会存在根据某些变量在一段时间内的趋势进行分析,进而预测变量在未来的走势的需求。变量在一段时间序列中的观测结果,可以称之为时间序列数据(其中时间可以为周,天,月等时间)在电子商务中,多元线性回归模型的应用是最普遍的,即分析一段时间内多个变量之间的关系,从而确定变量间相互依赖的定量关系,进而对变量进行预测。可例如,利用用户购买频次和购买金额预测用户的收入;再比如利用销售金额和库存金额预测采购金额等。
在现有技术中,在对时间序列进行多元线性回归模型时,并没有考虑时间序列是否为平稳时间序列,一般都假设有关的时间序列数据是平稳的,从而建立相关的回归模型,进行预测。但是,在实际的分析中时间序列并非为都为平稳的,这样就可能会造成伪回归现象。即变量之间本身并没有实际性的关系,但是一个变量对另一个变量的回归却表现出一种显著的关系,若直接利用伪回归模型进行预测,会得到错误的结果,可能会产生错误的决策,从而带来严重的损失。
因此,需要一种新的用于处理多元时间序列数据的方法及装置。
在所述背景技术部分公开的上述信息仅用于加强对本发明的背景的理解,因此它可以包括不构成对本领域普通技术人员已知的现有技术的信息。
发明内容
有鉴于此,本发明提供一种用于处理多元时间序列数据的方法及装置,能够避免由于非平稳时间序列数据而造成的伪回归模型进而得到变量之间的正确关系。
本发明的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本发明的实践而习得。
根据本发明的一方面,提出一种用于处理多元时间序列数据的方法,该方法包括:对多元时间序列数据进行平稳性检验,获取第一检验结果,所述多元时间序列数据包含多个变量,所述变量为时间序列数据;如果第一检验结果为非平稳,则对多元时间序列数据进行协整关系检验,获取第二检验结果;如果第二检验结果为存在协整关系,则根据多元时间序列数据构建协整回归模型;以及通过协整回归模型,确定多元时间序列数据的变量之间的关系。
在本公开的一种示例性实施例中,还包括:如果第一检验结果为平稳,则根据多元时间序列数据构建经典回归模型;通过经典回归,确定多元时间序列数据的变量之间的关系。
在本公开的一种示例性实施例中,还包括:通过多个变量的观测值构建多元时间序列数据。
在本公开的一种示例性实施例中,对多元时间序列数据进行平稳性检验,获取第一检验结果,包括:通过单位根算法对多元时间序列数据进行平稳性检验,获取第一检验结果。
在本公开的一种示例性实施例中,对多元时间序列数据进行协整关系检验,获取第二检验结果,包括:根据恩格尔-格兰杰算法对多元时间序列数据进行协整关系检验,获取第二检验结果。
在本公开的一种示例性实施例中,根据恩格尔-格兰杰算法对多元时间序列数据进行协整关系检验,获取第二检验结果,包括:对多元时间序列数据中的变量进行回归估计,获取估计数据;获取估计数据的残差数据;如果残差数据为非平稳时间序列,则确定多元时间序列数据不具有协整关系;否则,确定多元时间序列数据具有协整关系。
在本公开的一种示例性实施例中,根据多元时间序列数据构建协整回归模型,包括:通过最小二乘法与多元时间序列数据构建协整回归模型。
在本公开的一种示例性实施例中,协整回归模型,包括:其中,Y为因变量,Xi为自变量,ut为误差项,β0与βi为估计系数。
在本公开的一种示例性实施例中,通过协整回归模型,确定多元时间序列数据的变量之间的关系,包括:对协整回归模型进行误差修正;通过修正后的协整回归模型确定多元时间序列数据的变量之间的关系。
在本公开的一种示例性实施例中,还包括:通过变量之间的关系,获取变量趋势数据。
根据本发明的一方面,提出一种用于处理多元时间序列数据的装置,该装置包括:平稳检验模块,用于对多元时间序列数据进行平稳性检验,获取第一检验结果,所述多元时间序列数据包含多个变量,所述变量为时间序列数据;协整检验模块,用于如果第一检验结果为非平稳,则对多元时间序列数据进行协整关系检验,获取第二检验结果;协整模块,用于如果第二检验结果为存在协整关系,则根据多元时间序列数据构建协整回归模型;以及第一分析模块,用于通过协整回归模型,确定多元时间序列数据的变量之间的关系。
在本公开的一种示例性实施例中,还包括:回归模块,用于如果第一检验结果为平稳,则根据多元时间序列数据构建经典回归模型;第二分析模块,用于通过经典回归,确定多元时间序列数据的变量之间的关系。
根据本发明的一方面,提出一种电子设备,该电子设备包括:一个或多个处理器;存储装置,用于存储一个或多个程序;当一个或多个程序被一个或多个处理器执行,使得一个或多个处理器实现如上文的方法。
根据本发明的一方面,提出一种计算机可读介质,其上存储有计算机程序,其特征在于,程序被处理器执行时实现如上文中的方法。
根据本发明的用于处理多元时间序列数据的方法及装置,能够避免由于非平稳时间序列数据而造成的伪回归模型进而得到变量之间的正确关系。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性的,并不能限制本发明。
附图说明
通过参照附图详细描述其示例实施例,本发明的上述和其它目标、特征及优点将变得更加显而易见。下面描述的附图仅仅是本发明的一些实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是根据一示例性实施例示出的一种用于处理多元时间序列数据的方法的流程图。
图2是根据另一示例性实施例示出的一种用于处理多元时间序列数据的方法的流程图。
图3是根据一示例性实施例示出的一种用于处理多元时间序列数据的装置的框图。
图4是根据另一示例性实施例示出的一种用于处理多元时间序列数据的装置的框图。
图5是根据一示例性实施例示出的一种电子设备的框图。
图6是根据一示例性实施例示出的一种计算机可读介质示意图。
具体实施例
现在将参考附图更全面地描述示例实施例。然而,示例实施例能够以多种形式实施,且不应被理解为限于在此阐述的实施例;相反,提供这些实施例使得本发明将全面和完整,并将示例实施例的构思全面地传达给本领域的技术人员。在图中相同的附图标记表示相同或类似的部分,因而将省略对它们的重复描述。
此外,所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施例中。在下面的描述中,提供许多具体细节从而给出对本发明的实施例的充分理解。然而,本领域技术人员将意识到,可以实践本发明的技术方案而没有特定细节中的一个或更多,或者可以采用其它的方法、组元、装置、步骤等。在其它情况下,不详细示出或描述公知方法、装置、实现或者操作以避免模糊本发明的各方面。
附图中所示的方框图仅仅是功能实体,不一定必须与物理上独立的实体相对应。即,可以采用软件形式来实现这些功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。
附图中所示的流程图仅是示例性说明,不是必须包括所有的内容和操作/步骤,也不是必须按所描述的顺序执行。例如,有的操作/步骤还可以分解,而有的操作/步骤可以合并或部分合并,因此实际执行的顺序有可能根据实际情况改变。
应理解,虽然本文中可能使用术语第一、第二、第三等来描述各种组件,但这些组件不应受这些术语限制。这些术语乃用以区分一组件与另一组件。因此,下文论述的第一组件可称为第二组件而不偏离本公开概念的教示。如本文中所使用,术语“及/或”包括相关联的列出项目中的任一个及一或多者的所有组合。
本领域技术人员可以理解,附图只是示例实施例的示意图,附图中的模块或流程并不一定是实施本发明所必须的,因此不能用于限制本发明的保护范围。
下面结合附图对本公开示例实施方式进行详细说明。
图1是根据一示例性实施例示出的一种用于处理多元时间序列数据的方法的流程图。
如图1所示,在S102中,对多元时间序列数据进行平稳性检验,获取第一检验结果,所述多元时间序列数据包含多个变量,所述变量为时间序列数据。变量在一段时间序列中的观测结果,称之为时间序列数据(其中时间可以为周,天,月等时间),时间序列是指将同一统计指标的数值按其发生的时间先后顺序排列而成的数列,时间序列分析的主要目的是根据已有的历史数据对未来进行预测。在本发明实施例中,多个时间序列构成了多元时间序列数据,其中,每一个时间序列作为多元时间序列中的一个变量。在本发明实施例中,平稳性可例如为:如果一个时间序列数据的均值和方差不随时间而系统的变化,那它就是平稳的。可例如,通过单位根方法,对多元序列数据进行平稳性检验。单位根检验是指检验序列中是否存在单位根,因为存在单位根就是非平稳时间序列了。单位根就是指单位根过程,可以证明,序列中存在单位根过程就不平稳,会使回归分析中存在伪回归。
在S104中,如果第一检验结果为非平稳,则对多元时间序列数据进行协整关系检验,获取第二检验结果。如背景介绍中所述,由于实际应用中大多数时间序列是非平稳的,对于非平稳变量,不能使用经典回归模型,否则会出现虚假回归等诸多问题。目前通常采用差分方法消除序列中含有的非平稳趋势,使得序列平稳化后建立模型。但是变换后的序列限制了所讨论问题的范围。协整理论(co-integration)为非平稳序列的建模提供了另一种途径。虽然一些变量的本身是非平稳序列,但是,它们的线性组合却有可能是平稳序列。这种平稳的线性组合被称为协整方程,且可解释为变量之间的长期稳定的均衡关系,协整可被看作这种均衡关系性质的统计表示。在本实施例中,可例如,新用户与注册用户和投入成本分别为时间序列中的数据,其中,这个三个特征为变量,这三个特征由各自的子时间序列组成,通过子时间序列组成了时间序列数据。如果时间序列数据中的变量具有相同的单整阶数,且某种线性组合使得组合时间序列的单整阶数降低,则称这些时间序列数据的变量之间存在显著的协整关系。
在S106中,如果第二检验结果为存在协整关系,则根据多元时间序列数据构建协整回归模型。可例如,通过最小二乘法与多元时间序列数据构建协整回归模型。还可例如,根据本实施例的协整回归模型,包括:其中,Y为因变量,在本发明实施例中,可例如为发展新用户的数量,Xi为自变量,可例如为新注册用户数以及发展新注册用户所使用的成本,ut为误差项,β0与βi为估计系数。在构建协整回归模型的过程中,还可例如,对该模型进行误差修正,以获得优选的协整回归模型,然而本发明不以此为限。
在S108中,通过协整回归模型,确定多元时间序列数据的变量之间的关系。可例如,最后输出的结果为变量之间的函数关系式,根据变量之间的关系,可例如对不平稳的多元序列数据进行分析,还可例如,通过变量之间的关系预测下个时间序列中,可例如为下个月或者下一年中,发展新用户所使用的成本与成功发展的新用户数量。
根据本发明的用于处理多元时间序列数据的方法,通过对时间序列数据进行平稳性与协整关系的判断,进而建立协整关系模型对非平稳时间序列数据进行分析,能够避免由于非平稳时间序列数据而造成的伪回归模型,进而得到变量之间的正确关系。
应清楚地理解,本发明描述了如何形成和使用特定示例,但本发明的原理不限于这些示例的任何细节。相反,基于本发明公开的内容的教导,这些原理能够应用于许多其它实施例。
在本公开的一种示例性实施例中,还包括:如果第一检验结果为平稳,则根据多元时间序列数据构建经典回归模型;通过经典回归,确定多元时间序列数据的变量之间的关系。经典回归模型可例如为经典线性回归模型,是基于多元时间序列进行的回归模型,从而确定变量之间的关系。经典线性回归模型可以用公式Yi=β12Xi+ui说明,其中Yi为因变量,可例如为发展新用户的数量,Xi为自变量,可例如为新注册用户数以及发展新注册用户所使用的成本,β1和β2可例如为,利用最小二乘法求出的确定因变量Yi与多元时间序列Xi之间的关系系数。可例如,建立关于新用户数Yi和自变量Xi的多元线性回归模型,其中Xi为二维向量,X1表示新注册的用户数,X2为拉新投入的成本费(可例如包括广告费,优惠券等费用),根据近两年每月的数据,利用最小二乘法得出拉新用户数与注册用户数和投入成本费的关系。
图2是根据另一示例性实施例示出的一种用于处理多元时间序列数据的方法的流程图。
如图2所示,在S202中,构建多元时间序列数据。通过多个变量的观测值构建多元时间序列数据。
可例如,确定时间维度:近2年每月。还可例如,获取如下指标作为变量:(下标t表示不同的月份)新注册的用户数X1t为拉新投入的成本费X2t,本月拉新的用户数Yt。通过上述数据构建多元时间序列数据。
在S204中,对多元时间序列数据进行平稳性检验。可例如,通过单位根算法对多元时间序列数据进行平稳性检验,获取第一检验结果。单位根检验是随机过程的问题,检测Yt是否为平稳序列,检验过程可例如:
其中Δ表示一阶差分,ut为误差项。
现在对方程(1)进行估计。即Yt的一阶差分,并将他们对Yt-1做回归,然后观测回归中估计的斜率系数ρ是否为1,若ρ=1,即存在单位根,从而说明所检验的时间序列Yt为非平稳的时间序列。若ρ<1,则断定Yt为平稳的。
同理,利用上述方法对Xit(i=1,2)时间序列进行单位根检验判断其是否为平稳的。如果上述变量均为平稳的时间序列,则进入步骤S206,如果上述变量不都为平稳的时间序列,则可例如认为多元时间序列数据为不平稳,则进入S208。
在S206中,根据多元时间序列数据构建经典回归模型。
则直接利用经典的线性回归模型,将上文中加工的自变量以及因变量的观测值带入下列方程中
再利用最小二乘法得到得到平方损失最小的回归估计系数β0和βi,将值带入方程(2),就得到变量Y与多元变量Xi的线性回归模型。
在S208中,对多元时间序列数据进行协整关系检验,根据恩格尔-格兰杰算法对多元时间序列数据进行协整关系检验,获取第二检验结果。包括:对多元时间序列数据中的变量进行回归估计,获取估计数据;获取估计数据的残差数据;如果残差数据为非平稳时间序列,则确定多元时间序列数据不具有协整关系;否则,确定多元时间序列数据具有协整关系。
协整回归包括:
1)判断时间序列Xit(i=1,2)是否为同阶单整。计算时间序列X1t的一阶差分,即利用上文中单根检验判断出是否为平稳时间序列,若为平稳序列,则得出X1t为一阶单整,若得出的一阶时间变量仍为非平稳序列,则进一步计算的一阶差分即Yt的二级差分判断其是否为平稳序列,依次类推。同理得出其他X2t的单整阶数,若X1t和X2t不是同阶单整,则结束;否则继续进行下一步协整判断。
2)在本实施例中,X1t和X2t为二阶单整,则继续判断时间序列Yt与Xit(i=1,2)是否具有协整关系。利用恩格尔-格兰杰(Engle-Granger)两步检验法。可例如,用普通最小二乘法(ordinary least square,OLS)估计法对Yt和Xit(i=1,2)进行回归估计,得到:进行变化得到残差对残差ut进行单位根检验,若残差为平稳时间序列,即说明Yt和Xit(i=1,2)具有协整关系,进入步骤S212。
在S210中,确定不存在协整关系。通过上文中对残差ut进行单位根检验,若残差为非平稳时间序列,即说明Yt和Xit(i=1,2)不具有协整关系。
在S212中,根据多元时间序列数据构建协整回归模型,包括:通过最小二乘法与多元时间序列数据构建协整回归模型。
协整回归模型,包括:其中,Y为因变量,Xi为自变量,ut为误差项,β0与βi为估计系数。
在S214中,对协整关系模型进行误差修正。包括:对协整回归模型进行误差修正;通过修正后的协整回归模型确定多元时间序列数据的变量之间的关系。
对协整回归模型进行误差修正。上文中的残差:
将残差的一期之后带入
利用最小二乘估计计算出相应的参数,最终得出拉新用户数Yt和新注册用户以及投入成本费Xit(i=1,2)的协整回归模型。
在S216中,通过变量之间的关系,获取变量趋势数据。输出本月发展新用户数Yt和新注册用户数以及为发展新投入的成本费X2t之间的关系,从而可以根据投入投入成本费和当月注册用户数预测拉新的用户数。
变量之间的关系可例如:(1)如果不满足协整或经典线性回归条件,则属于随机过程,不存在相互依存或预测关系,输出随机结果;(2)如果存在协整或经典线性回归关系,则可以据此得出前推预测结果,用于需要预测的情况;(3)如果只是需要对历史数据进行回归性解释,则可以根据对应的回归参数进行使用,回归参数的大小表示依存关系的强弱,回归参数越大说明依存关系越强,在整个模型中的相对重要性越高。
根据本发明的用于处理多元时间序列数据的方法,通过对多元时间序列数据进行分析和判断,分别通过经典回归模型与协整回归模型对多元时间序列数据进行分析,可以在满足现有的时间序列数据处理方式的同时,有效的避免的因为非平稳时间序列造成的伪回归模型,进而对于时间序列数据给出全面准确的分析结果。
本领域技术人员可以理解实现上述实施例的全部或部分步骤被实现为由CPU执行的计算机程序。在该计算机程序被CPU执行时,执行本发明提供的上述方法所限定的上述功能。所述的程序可以存储于一种计算机可读存储介质中,该存储介质可以是只读存储器,磁盘或光盘等。
此外,需要注意的是,上述附图仅是根据本发明示例性实施例的方法所包括的处理的示意性说明,而不是限制目的。易于理解,上述附图所示的处理并不表明或限制这些处理的时间顺序。另外,也易于理解,这些处理可以是例如在多个模块中同步或异步执行的。
下述为本发明装置实施例,可以用于执行本发明方法实施例。对于本发明装置实施例中未披露的细节,请参照本发明方法实施例。
图3是根据一示例性实施例示出的一种用于处理多元时间序列数据的装置的框图。
平稳检验模块302用于对多元时间序列数据进行平稳性检验,获取第一检验结果,所述多元时间序列数据包含多个变量,所述变量为时间序列数据。
协整检验模块304用于如果第一检验结果为非平稳,则对多元时间序列数据进行协整关系检验,获取第二检验结果。
协整模块306用于如果第二检验结果为存在协整关系,则根据多元时间序列数据构建协整回归模型。
第一分析模块308用于通过协整回归模型,确定多元时间序列数据的变量之间的关系。
根据本发明的用于处理多元时间序列数据的装置,通过对时间序列数据进行平稳性与协整关系的判断,进而建立协整关系模型对非平稳时间序列数据进行分析,能够避免由于非平稳时间序列数据而造成的伪回归模型进而得到变量之间的正确关系。
在本公开的一种示例性实施例中,还包括:
回归模块(图中未示出)用于如果第一检验结果为平稳,则根据多元时间序列数据构建经典回归模型。
第二分析模块(图中未示出)用于通过经典回归,确定多元时间序列数据的变量之间的关系。
图4是根据另一示例性实施例示出的一种用于处理多元时间序列数据的装置的框图。
其中,时序指标加工模块402,用于计算一段时间序列内(可以为日,周,季度等)多个变量的观测结果值,形成需要构建回归模型的多元时间序列。
平稳性检验模块404用于时序指标加工模块402中计算的多元时间序列是否为平稳的,可例如利用单位根方法进行检验。
回归模型模块406用于根据平稳性检验模块404中平稳检验结果,分为两部分内容。当平稳性检验模块404中平稳检验结果为是,也就是说时序指标加工模块402中加工的多元时间序列为平稳的,此时直接利用经典线性回归模型模块4062对该时间序列构建模型;若平稳性检验模块404中平稳检验为否,即时序指标加工模块402中加工的多元时间序列为非平稳的,那么就需要进一步判断多元时间序列之间是否存在协整关系进而通过协整模型模块4064计算数据,还可例如,利用误差修正模型模块4066建立协整回归模型。
结果输出模块408输出搭建回归模型模块406中利用时序指标加工模块402中加工的多元时间序列构建的回归模型
图5是根据一示例性实施例示出的一种电子设备的框图。
下面参照图5来描述根据本发明的这种实施方式的电子设备200。图5显示的电子设备200仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图5所示,电子设备200以通用计算设备的形式表现。电子设备200的组件可以包括但不限于:至少一个处理单元210、至少一个存储单元220、连接不同系统组件(包括存储单元220和处理单元210)的总线230、显示单元240等。
其中,所述存储单元存储有程序代码,所述程序代码可以被所述处理单元210执行,使得所述处理单元210执行本说明书上述电子处方流转处理方法部分中描述的根据本发明各种示例性实施方式的步骤。例如,所述处理单元210可以执行如图1中所示的步骤。
所述存储单元220可以包括易失性存储单元形式的可读介质,例如随机存取存储单元(RAM)2201和/或高速缓存存储单元2202,还可以进一步包括只读存储单元(ROM)2203。
所述存储单元220还可以包括具有一组(至少一个)程序模块2205的程序/实用工具2204,这样的程序模块2205包括但不限于:操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。
总线230可以为表示几类总线结构中的一种或多种,包括存储单元总线或者存储单元控制器、外围总线、图形加速端口、处理单元或者使用多种总线结构中的任意总线结构的局域总线。
电子设备200也可以与一个或多个外部设备300(例如键盘、指向设备、蓝牙设备等)通信,还可与一个或者多个使得用户能与该电子设备200交互的设备通信,和/或与使得该电子设备200能与一个或多个其它计算设备进行通信的任何设备(例如路由器、调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口250进行。并且,电子设备200还可以通过网络适配器260与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。网络适配器260可以通过总线230与电子设备200的其它模块通信。应当明白,尽管图中未示出,可以结合电子设备200使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。
通过以上的实施方式的描述,本领域的技术人员易于理解,这里描述的示例实施方式可以通过软件实现,也可以通过软件结合必要的硬件的方式来实现。因此,根据本公开实施方式的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM,U盘,移动硬盘等)中或网络上,包括若干指令以使得一台计算设备(可以是个人计算机、服务器、或者网络设备等)执行根据本公开实施方式的上述电子处方流转处理方法。
图6是根据一示例性实施例示出的一种计算机可读介质示意图。
参考图6所示,描述了根据本发明的实施方式的用于实现上述方法的程序产品600,其可以采用便携式紧凑盘只读存储器(CD-ROM)并包括程序代码,并可以在终端设备,例如个人电脑上运行。然而,本发明的程序产品不限于此,在本文件中,可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
所述程序产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以为但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
所述计算机可读存储介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了可读程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。可读存储介质还可以是可读存储介质以外的任何可读介质,该可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。可读存储介质上包含的程序代码可以用任何适当的介质传输,包括但不限于无线、有线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言的任意组合来编写用于执行本发明操作的程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、C++等,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中,远程计算设备可以通过任意种类的网络,包括局域网(LAN)或广域网(WAN),连接到用户计算设备,或者,可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。
在本公开的示例性实施例中,还提供一种电子设备,该电子设备可以包括处理器,以及用于存储所述处理器的可执行指令的存储器。其中,所述处理器配置为经由执行所述可执行指令来执行上述任意一个实施例中所述电子处方流转处理方法的步骤。
所属技术领域的技术人员能够理解,本发明的各个方面可以实现为系统、方法或程序产品。因此,本发明的各个方面可以具体实现为以下形式,即:完全的硬件实施方式、完全的软件实施方式(包括固件、微代码等),或硬件和软件方面结合的实施方式,这里可以统称为“电路”、“模块”或“系统”。
本领域技术人员可以理解上述各模块可以按照实施例的描述分布于装置中,也可以进行相应变化唯一不同于本实施例的一个或多个装置中。上述实施例的模块可以合并为一个模块,也可以进一步拆分成多个子模块。
通过以上的实施例的描述,本领域的技术人员易于理解,这里描述的示例实施例可以通过软件实现,也可以通过软件结合必要的硬件的方式来实现。因此,根据本发明实施例的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM,U盘,移动硬盘等)中或网络上,包括若干指令以使得一台计算设备(可以是个人计算机、服务器、移动终端、或者网络设备等)执行根据本发明实施例的方法。
通过以上的详细描述,本领域的技术人员易于理解,根据本发明实施例的用于处理多元时间序列数据的方法及装置具有以下优点中的一个或多个。
根据一些实施例,本发明的用于处理多元时间序列数据的方法,通过对时间序列数据进行平稳性与协整关系的判断,进而建立协整关系模型对非平稳时间序列数据进行分析,能够避免由于非平稳时间序列数据而造成的伪回归模型进而得到变量之间的正确关系。
根据另一些实施例,本发明的用于处理多元时间序列数据的方法,通过对多元时间序列数据进行分析和判断,分别通过经典回归模型与协整回归模型的对多元时间序列数据进行分析,可以在满足现有的时间序列数据处理方式的同时,有效的避免的因为非平稳时间序列造成的伪回归模型,进而对于时间序列数据给出全面准确的分析结果。
以上具体地示出和描述了本发明的示例性实施例。应可理解的是,本发明不限于这里描述的详细结构、设置方式或实现方法;相反,本发明意图涵盖包含在所附权利要求的精神和范围内的各种修改和等效设置。
此外,本说明书说明书附图所示出的结构、比例、大小等,均仅用以配合说明书所公开的内容,以供本领域技术人员了解与阅读,并非用以限定本公开可实施的限定条件,故不具技术上的实质意义,任何结构的修饰、比例关系的改变或大小的调整,在不影响本公开所能产生的技术效果及所能实现的目的下,均应仍落在本公开所公开的技术内容得能涵盖的范围内。同时,本说明书中所引用的如“上”、“第一”、“第二”及“一”等的用语,也仅为便于叙述的明了,而非用以限定本公开可实施的范围,其相对关系的改变或调整,在无实质变更技术内容下,当也视为本发明可实施的范畴。

Claims (14)

1.一种用于处理多元时间序列数据的方法,其特征在于,包括:
对多元时间序列数据进行平稳性检验,获取第一检验结果,所述多元时间序列数据包含多个变量,所述变量为时间序列数据;
如果所述第一检验结果为非平稳,则对所述多元时间序列数据进行协整关系检验,获取第二检验结果;
如果所述第二检验结果为存在协整关系,则根据所述多元时间序列数据构建协整回归模型;以及
通过所述协整回归模型,确定所述多元时间序列数据的变量之间的关系。
2.如权利要求1所述的方法,其特征在于,还包括:
如果所述第一检验结果为平稳,则根据所述多元时间序列数据构建经典回归模型;
通过所述经典回归,确定所述多元时间序列数据的变量之间的关系。
3.如权利要求1所述的方法,其特征在于,还包括:
通过所述多个变量的观测值构建所述多元时间序列数据。
4.如权利要求1所述的方法,其特征在于,所述对多元时间序列数据进行平稳性检验,获取第一检验结果,包括:
通过单位根算法对所述多元时间序列数据进行平稳性检验,获取第一检验结果。
5.如权利要求1所述的方法,其特征在于,所述对所述多元时间序列数据进行协整关系检验,获取第二检验结果,包括:
根据恩格尔-格兰杰算法对所述多元时间序列数据进行协整关系检验,获取第二检验结果。
6.如权利要求5所述的方法,其特征在于,所述根据恩格尔-格兰杰算法对所述多元时间序列数据进行协整关系检验,获取第二检验结果,包括:
对所述多元时间序列数据中的变量进行回归估计,获取估计数据;
获取所述估计数据的残差数据;
如果所述残差数据为非平稳时间序列,则确定所述多元时间序列数据不具有协整关系;
否则,确定所述多元时间序列数据具有协整关系。
7.如权利要求1所述的方法,其特征在于,所述根据所述多元时间序列数据构建协整回归模型,包括:
通过最小二乘法与所述多元时间序列数据构建协整回归模型。
8.如权利要求7所述的方法,其特征在于,所述协整回归模型,包括:
<mrow> <mi>Y</mi> <mo>=</mo> <msub> <mi>&amp;beta;</mi> <mn>0</mn> </msub> <mo>+</mo> <munder> <mo>&amp;Sigma;</mo> <mi>i</mi> </munder> <msub> <mi>&amp;beta;</mi> <mi>i</mi> </msub> <msub> <mi>X</mi> <mi>i</mi> </msub> <mo>+</mo> <msub> <mi>u</mi> <mi>i</mi> </msub> <mo>;</mo> </mrow>
其中,Y为因变量,Xi为自变量,ut为误差项,β0与βi为估计系数。
9.如权利要求1所述的方法,其特征在于,所述通过所述协整回归模型,确定所述多元时间序列数据的变量之间的关系,包括:
对所述协整回归模型进行误差修正;
通过修正后的协整回归模型确定所述多元时间序列数据的变量之间的关系。
10.如权利要求1所述的方法,其特征在于,还包括:
通过所述变量之间的关系,获取变量趋势数据。
11.一种用于处理多元时间序列数据的装置,其特征在于,包括:
平稳检验模块,用于对多元时间序列数据进行平稳性检验,获取第一检验结果,所述多元时间序列数据包含多个变量,所述变量为时间序列数据;
协整检验模块,用于如果所述第一检验结果为非平稳,则对所述多元时间序列数据进行协整关系检验,获取第二检验结果;
协整模块,用于如果所述第二检验结果为存在协整关系,则根据所述多元时间序列数据构建协整回归模型;以及
第一分析模块,用于通过所述协整回归模型,确定所述多元时间序列数据的变量之间的关系。
12.如权利要求11所述的装置,其特征在于,还包括:
回归模块,用于如果所述第一检验结果为平稳,则根据所述多元时间序列数据构建经典回归模型;
第二分析模块,用于通过所述经典回归,确定所述多元时间序列数据的变量之间的关系。
13.一种电子设备,其特征在于,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-10中任一所述的方法。
14.一种计算机可读介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现如权利要求1-10中任一所述的方法。
CN201710785479.8A 2017-09-04 2017-09-04 用于处理多元时间序列数据的方法及装置 Pending CN107577648A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710785479.8A CN107577648A (zh) 2017-09-04 2017-09-04 用于处理多元时间序列数据的方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710785479.8A CN107577648A (zh) 2017-09-04 2017-09-04 用于处理多元时间序列数据的方法及装置

Publications (1)

Publication Number Publication Date
CN107577648A true CN107577648A (zh) 2018-01-12

Family

ID=61029782

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710785479.8A Pending CN107577648A (zh) 2017-09-04 2017-09-04 用于处理多元时间序列数据的方法及装置

Country Status (1)

Country Link
CN (1) CN107577648A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109473972A (zh) * 2018-08-31 2019-03-15 长沙理工大学 基于多功率曲线协整的源荷储优化控制方法
CN110186533A (zh) * 2019-05-30 2019-08-30 河海大学 一种高精度的河口短期潮位预报方法
CN111198982A (zh) * 2019-12-25 2020-05-26 深圳猛犸电动科技有限公司 一种时间序列遥测数据的补偿方法、装置及服务器
CN111414398A (zh) * 2020-02-22 2020-07-14 中国平安财产保险股份有限公司 数据分析模型确定方法、装置及存储介质
CN112347653A (zh) * 2020-11-11 2021-02-09 中国人民解放军陆军工程大学 轴承的退化特征提取方法及终端设备

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109473972A (zh) * 2018-08-31 2019-03-15 长沙理工大学 基于多功率曲线协整的源荷储优化控制方法
CN109473972B (zh) * 2018-08-31 2021-07-13 长沙理工大学 基于多功率曲线协整的源荷储优化控制方法
CN110186533A (zh) * 2019-05-30 2019-08-30 河海大学 一种高精度的河口短期潮位预报方法
CN111198982A (zh) * 2019-12-25 2020-05-26 深圳猛犸电动科技有限公司 一种时间序列遥测数据的补偿方法、装置及服务器
CN111414398A (zh) * 2020-02-22 2020-07-14 中国平安财产保险股份有限公司 数据分析模型确定方法、装置及存储介质
CN111414398B (zh) * 2020-02-22 2023-05-30 中国平安财产保险股份有限公司 数据分析模型确定方法、装置及存储介质
CN112347653A (zh) * 2020-11-11 2021-02-09 中国人民解放军陆军工程大学 轴承的退化特征提取方法及终端设备

Similar Documents

Publication Publication Date Title
CN107577648A (zh) 用于处理多元时间序列数据的方法及装置
US11861464B2 (en) Graph data structure for using inter-feature dependencies in machine-learning
AU2013326911A1 (en) Systems and methods for determining a fair price range for commodities
US11681931B2 (en) Methods for automatically configuring performance evaluation schemes for machine learning algorithms
JP2017514252A (ja) システム運転および性能データをモデル化に基づいた将来信頼度予測の改善
US10482491B2 (en) Targeted marketing for user conversion
JP7559762B2 (ja) 情報処理装置、情報処理方法、及びプログラム
US11289178B2 (en) Identifying chemical substructures associated with adverse drug reactions
Bandaru et al. Development, analysis and applications of a quantitative methodology for assessing customer satisfaction using evolutionary optimization
US20180060885A1 (en) Segmentation based estimation method for demand models under censored data
CN111754278A (zh) 物品推荐方法、装置、计算机存储介质和电子设备
CN109829763A (zh) 消费能力评估方法及装置、电子设备、存储介质
US20080208788A1 (en) Method and system for predicting customer wallets
Peng et al. Transformer‐based choice model: A tool for assortment optimization evaluation
Zakria et al. Big data analytics implementation and practices in medical institute libraries of Pakistan
Moetamedzadeh et al. Intelligent nonlinear model predictive control of gas pipeline networks
Duran et al. A framework for comparing high performance computing technologies
JP4993097B2 (ja) 企業施策の決定支援装置、企業施策の決定支援方法及びそのプログラム
US20140278770A1 (en) Generating economic model based on business transaction messages
KR20140056801A (ko) 사용자의 구매 영향력 지수를 산출하는 방법 및 장치
Schneider et al. Predicting energy consumption using machine learning
CN113792931A (zh) 数据预测方法、装置、物流货量预测方法、介质和设备
Grabill et al. AI-augmented failure modes, effects, and criticality analysis (AI-FMECA) for industrial applications
CN111105274A (zh) 数据处理方法、装置、介质及电子设备
Rong et al. Kernel Cox partially linear regression: Building predictive models for cancer patients' survival

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20180112