CN103620625A - 信息处理装置、信息处理方法、记录介质、以及程序 - Google Patents

信息处理装置、信息处理方法、记录介质、以及程序 Download PDF

Info

Publication number
CN103620625A
CN103620625A CN201280030592.0A CN201280030592A CN103620625A CN 103620625 A CN103620625 A CN 103620625A CN 201280030592 A CN201280030592 A CN 201280030592A CN 103620625 A CN103620625 A CN 103620625A
Authority
CN
China
Prior art keywords
node
model
signal conditioning
time series
conditioning package
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201280030592.0A
Other languages
English (en)
Inventor
中村知道
樱田一洋
谷泽俊弘
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Publication of CN103620625A publication Critical patent/CN103620625A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/02Knowledge representation; Symbolic representation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Business, Economics & Management (AREA)
  • Mathematical Physics (AREA)
  • Operations Research (AREA)
  • Economics (AREA)
  • Pure & Applied Mathematics (AREA)
  • Mathematical Optimization (AREA)
  • Mathematical Analysis (AREA)
  • Strategic Management (AREA)
  • Computational Mathematics (AREA)
  • Human Resources & Organizations (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Game Theory and Decision Science (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Databases & Information Systems (AREA)
  • Algebra (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Development Economics (AREA)
  • Marketing (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Probability & Statistics with Applications (AREA)
  • General Business, Economics & Management (AREA)
  • Evolutionary Biology (AREA)
  • Tourism & Hospitality (AREA)
  • Quality & Reliability (AREA)
  • Computational Linguistics (AREA)
  • Artificial Intelligence (AREA)
  • Computing Systems (AREA)
  • Evolutionary Computation (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本技术涉及能够提取时间序列数据的结构的信息处理装置和方法、记录介质、以及程序。获取单元获取时间序列数据,转换单元将所获得的时间序列数据转换为RAR模型,并且预测单元使用RAR模型预测当前进行中的事件的未来。当根据时间序列数据预测诸如天气、地震、自然环境、人体健康、以及经济的随时间改变的现象的未来时可应用本技术。

Description

信息处理装置、信息处理方法、记录介质、以及程序
技术领域
本技术涉及信息处理装置、信息处理方法、记录介质、以及程序,并且具体涉及能够提取时间序列数据的结构的信息处理装置、信息处理方法、记录介质、以及程序。
背景技术
诸如天气、地震、自然环境、人体健康、以及经济的时间发展现象(即,随时间改变的现象)的预测是预先处理灾难、疾病、危机等等的一个重要问题。现象出现即刻之后,对于现象的高精度预测可被预期。在这种情况下,观察当前出现的现象,研究其事件,并且利用从其中的得到的知识,从而使得在短期内可预测当前出现现象之后将立即出现的现象。由于执行预测是对所观察的现象出现之后即将出现的现象进行的,所以用于预测的系统被假定为与所观察现象的系统相同。
另一方面,极难预测诸如自当前出现的现象已经过去几天、几月、几年、以及几十年的时间的长时间之后将会发生什么。仅延长当前出现的现象的预测时间是没有意义的。如果用于预测的系统与所观察的现象的系统相同,那么由于起始值的精确度和存在系统噪声的问题而不可能获得高精度的预测值。此外,十分可能的是系统会在长时间过程中改变以便适应各种改变。
为了有效处理有关天气、地震、自然环境、人体健康、经济等等的许多各种问题,不是如上所述的短期预测,而是重要的是预测未来(即,经过长时间之后)将会出现的现象。然而,如上所述,用于预测随时间改变的现象的未来的方法还没有被科学地建立。因此,为了解决现代社会面对的问题,诸如反常天气、严重地震、环境破坏、疾病发展、以及危机,其中持续性破坏之后执行修复的依据以往实际的方法是主要方法。为了适当处理并从而解决诸如天气、地震、自然环境、人体健康、及经济的随时间改变的现象的问题,必须预先预测持续性破坏的征兆,并且为问题做预先的准备。
然而,随时间改变的现象中,未来不是过去的简单重复。此外,过去的输入输出时具有时间延迟。因此,随时间改变的现象的未来不能仅通过理解和利用现象的当前状态来预测。随时间改变的现象的未来的预测是提供是允许维持持续性还是引发新状态的选择。为此,必须将时间序列数据划分为具体的时间帧并且从时间帧中找到具有共同结构的变化模式。
如果长时间已观察的现象中存在相同系统或相似系统,那么该现象的未来可通过找到系统的变化规律使用过去的和当前的数据来预测。然而,如果不再有相同的或相似的状态或系统,那么仅通过使用有关现象的信息是不可能预测系统的变化的。然而,即使在这种情况下,可使用相似系统,或者相同系统的转变可存在于另一现象之中。在这种情况下,如果从另一现象得到的大量系统转变存在相似的变化模式,那么相似的转变模式可被用于未来的预测中。
用于提取时间序列数据特征的方法的实例包括状态空间模型的应用。从状态空间模型提取的时间序列元素包括多个项(即,基本函数)和参数(即,系数)。例如,广泛使用的线性模型包括时间延迟项及其参数。具有时间延迟的元素之间的相互关系可从包括在模型中的项中发现(K.Judd和A.I.Mees,PhySICa D120,273(1998)T.Nakamura,K.Judd,A.I.Mees,和M.Small,Int.J.Bifurcation Chaos Appl.Sci.Eng.16,2153(2006))。然而,不可能了解包括在时间序列数据中的结构,诸如仅根据模型的表达式的元素之间分级连接的方式。
此外,在专利文献1中,未来值是以下文中的方式预测的。将预测的目标时间序列数据投影到特征空间上,并且规定与投影模式相关的学习模式。然后,与规定的学习模式相对应的第一时间序列数据已预先相关联的、并且在晚于第一时间序列数据的定时生成的第二时间序列数据被确定为未来值。
引用列表
专利文献
专利文献1:日本专利申请公开第2005-216202号
发明内容
本发明解决的问题
为了使用时间序列数据执行未来预测,需要分析巨大量的过去时间序列数据,并且提取和分类包括在时间序列数据中的时间延迟的结构。为实现该目的,需要一种用于从时间序列数据中创建时间结构的方法。
然而,很难使用现有技术提取时间序列数据的结构。
考虑到上述情况提出本技术,使得提取时间序列数据的结构成为可能。
问题解决方案
本技术的一个方面是一种信息处理装置,该装置包括获取时间序列数据的获取单元、将所获得的时间序列数据转换为RAR模型的转换单元、以及使用RAR模型预测当前进行中的事件的未来的预测单元。
信息处理装置还可以包括根据RAR模型创建网络结构的创建单元。
创建单元可将RAR模型的时间延迟项确定为网络结构节点,并且将节点连接至RAR模型的当前时间的项以创建网络结构。
RAR模型的节点中的两个节点之间的直接距离可通过这两个节点中的一个的参数与RAR模型的所有参数的平方和的平方根的比例来定义。
当两个节点通过其他一个或多个节点连接至彼此时,创建单元可将各个连接的节点之间的直接距离的总和确定为间接距离。
创建单元可通过使用具有直接距离和间接距离之间最短距离的路径连接至彼此的节点创建网络结构。
信息处理装置还可包括检索单元,从网络结构的特征中检索不同时间序列数据之间的相同性。
检索单元可能将网络结构转换为矩阵,并且检索矩阵的相同性。
检索单元可在水平方向和垂直方向上安排节点,并且将1和0中的一个和另一个放在彼此连接的节点和彼此不连接的节点的相应位置以形成矩阵。
矩阵包括多个矩阵,并且检索单元通过以在匹配多个矩阵的尺寸之后计算多个矩阵之间的差值并且将构成差值的元素的平方和的平方根除以元素的数量的方式获得的值检索相同性。
本技术的一方面的每个方法、记录介质和程序中的每一个与上面描述的本技术的一方面的成象装置对应。
本技术的一方面中,获取单元获取时间序列数据,转换单元将所获得的时间序列数据转换为RAR模型,并且预测单元使用RAR模型预测当前进行中的事件的未来。
本发明的效果
如上所述,根据本技的一方面,可以提取时间序列数据的结构。
附图说明
图1是示出了本技术的信息处理装置的实施方式的配置的框图。
图2是示出了执行预测处理的CPU的功能块的配置的示图。
图3是示出预测处理的流程图。
图4是示出了模型尺度和信息标准之间的关系的示图。
图5是示出了网络结构的矩阵公式的示图。
图6是示出了矩阵的实例的示图。
图7是示出网络的示图。
图8是示出最优路径的示图。
图9是示出了心率变化的示图。
图10是示出了心率数据的网络的示图。
具体实施方式
在下文,将描述用于实施本技术的实施方式。将按照以下顺序进行描述。
1.过程
2.预测处理
3.RAR模型
4.网络构造方法
5.用于检测网络相同性的方法
6.用于检测网络次结构之间关系的方法
7.用于检测构成现象的元素的时间结构之间关系的方法
8.网络实例1
9.网络实例2
<进行>
本技术人员想到,为了找出包括在时间结构中的特征,诸如包括在时间序列数据中的时间序列数据与时间延迟的函数,根据时间序列数据构造反映时间序列数据的函数的模型,并且构造该模型的网络结构是有用的。为了实现这个目的,已想到首先必须找到存在于作为构成网络的元素的时间序列中的时间延迟,然后将发现的时间延迟项表示为网络。为了准确地了解时间延迟,本发明技术人员已决定使用缩小的自回归(RAR)模型(K.Judd和A.I.Mees,PhySICa D120,273(1998))。
平均自回归(AR)模型包括具有时间延迟的连续项。然而,一些项(例如,一些时间延迟)对于把握现象的基本特征是不必要的。在RAR模型中,仅使用利用信息标准评估为对于模型具有主要作用的项。因此,RAR模型可示出时间延迟项之间精确的相互关系和包括在时间序列中的基本线性结构。
RAR模型可包括具有弱相关的两个项。然而,实际上并不总是仅仅具有强相关的两个项对于系统是重要的而具有弱相关的两个项对于系统就是是不必要的。具有弱相关的项作为系统的催化剂可具有重要的作用。这样的项不能通过仅仅使用两个项之间的相关的方法找出。
这就是为什么当选择时间延迟项时本技术不是采用相关函数,而是采用可将整个时间序列作为一个系统进行把握的模型的原因。在本技术中,构造RAR模型之后,包括在模型中包括的各个项被转换为节点,并且模型的每个参数被转换为网络的各个节点之间的链接的长度。
本技术的RAR模型包括以下两个阶段。
(1)从时间序列数据产生RAR模型
(2)从RAR模型构造网络
<预测处理>
用于本技术的未来预测的信息处理是由例如图1中示出的信息处理装置1执行的。
图1是示出了本技术的信息处理装置1的实施方式的构造的框图。
在执行预测处理的信息处理装置1中,中央处理器(CPU)21、只读存储器(ROM)22、随机存取存储器(23)是通过总线24连接至彼此的。
输入/输出(I/O)接口25被进一步连接至总线24。输入单元26、输出单元27、存储单元28、通信单元29、及驱动30被连接至I/O接口25。
输入单元26包括键盘、鼠标、话筒等等。输出单元27包括显示器、扬声器等等。存储单元28包括硬盘、非易失存储器等等。通信单元29包括网络接口等等。驱动30驱动诸如磁盘、光盘、磁电光盘、及半导体存储器的可移除介质31。
在具有以上构造的信息处理装置1中,CPU21通过I/O接口25和总线24将存储单元28中存储的程序加载到RAM23中以执行程序,从而执行一系列处理。
在信息处理装置1中,程序可通过例如将作为程序包介质(packagemedia)的可移除介质31加载到驱动30上,经由I/O接口25被安装到存储单元28中。此外,程序可通过经由有线或无线传输介质在通信装置29中接收程序而被安装到存储单元28中。可选地,程序可被预先安装在ROM22中或者存储单元28中。
图2是示出了执行预测处理的CPU21的功能块的配置的示图。CPU21包括获取单元51、转换单元52、创建单元53、检索单元54、以及预测单元55。
获取单元51获取时间序列数据。转换单元52将时间序列数据转换为RAR模型。创建单元53根据RAR模型创建网络结构。检索单元54检索网络结构的相同性(homology)。预测单元55根据当前进行中的现象的时间序列数据预测未来的现象。
下面,将参考图3描述未来预测的信息处理。
图3是示出预测处理的流程图。在步骤S1中,获取单元51获取时间序列数据。更具体地,获取用于创建网络结构的时间序列数据。时间序列数据被存储在存储单元28中。
在步骤S2中,转换单元52将时间序列数据转换为RAR模型。随后将描述根据时间序列数据中生成RAR模型的方法。
在步骤3中,创建单元53根据RAR模型创建网络结构。就是说,根据步骤S2中已转换的RAR模型来创建网络结构。在步骤S4中,检索单元54检索网络结构的相同性。就是说,不同时间序列数据之间的相同性是根据步骤S3中已创建的网络结构的特征进行检索。具体地,网络结构通过相同性群集。
在步骤S5中,预测单元55根据当前进行中的现象的时间序列数据中预测未来的现象。更具体地,未来的现象是利用步骤S4中检索的具有相同网络结构的过去的时间序列数据,根据当前进行中的预测目标现象的时间序列数据进行预测的。
例如,时间序列数据作为比较目标被预先存储在存储单元28中。检索比较目标时间序列数据与步骤S1中获取的预测目标时间序列数据之间的相同性(当然,预测目标时间序列数据同样可被预先存储在存储单元28中)。预测单元预测与具有高相同性的比较目标时间序列所对应的事件相似的事件可作为预测目标时间序列数据的事件发生。
此外,可利用心率数据预测引起心肌梗死或者糖尿病的时间,或者把握胰腺的状况,以及利用血糖水平预测糖尿病或胰腺癌的征兆。
此外,随后在<用于检测网络相同性的方法>中将同样描述预测未来现象的处理。
<RAR模型>
在下文,将描述图3的步骤2中执行的生成RAR模型的方法。步骤S1中获取的时间序列数据以可把握时间序列数据的特征的抽样率被测量。利用具有长度n的由方程(1)表示的测量的时间序列数据生成的具有最大时间延迟w的RAR模型,是由方程(2)表示的。
[方程1]
( X t ) t = 1 n . . . ( 1 )
[方程2]
x(t)=a0+a1x(t-l1)+a2x(t-l2)+…awx(t-lw)+ε(t)…(2)
在方程(2)中,ai(i=0、1、2、…、w)是个未知参数,并且ε(t)是近似误差(或者预测误差)。参数ai和近似误差ε(t)是独立于彼此的随机数并且服从相同的分布。参数ai被选择为产生近似误差最小值。
通过测量获得的时间序列数据包含观察噪声。因此,时间序列数据包含现象本身的数据和观察噪声的数据两者。通常,包括在模型中的参数数量越大(就是说,模型的尺寸变得越大),模型和时间序列数据之间的近似误差变得越小。因此,可以更准确地把握使用的时间序列数据的特征。
然而,由于包含在测量获得的时间序列数据中的观察噪声,模型的尺寸(即参数数量)变大,并且近似误差变小的事实意味着模型不仅把握现象的特征,而且同样被迫接受与测量目标的结构无关的观察噪声的偶然变化。另一方面,具有小尺寸的模型不足以把握现象的特征,并且因此变得不稳定。因此,不能信任从模型中获得的数据的特征。因此,必须找到可以尽可能地把握现象的特征,并且同样尽可能地消除观察噪声的影响的模型。
为了找到上述模型,已提出了各种信息标准。在信息标准中,不仅比较近似误差的大小,而且考虑参数的数量。具有从信息标准中获得的最小值的模型被确定为最佳的。
图4是示出了模型尺度和信息标准之间的关系的示图。在图4中,水平轴代表模型尺度(也就是,参数数量),并且垂直轴代表信息标准。线L1代表当近似误差ε(t)是预定值时的关系。当模型尺度小时,信息标准变大。当模型尺度大时,信息标准变小。
在图4中,由模型尺度的增加而近似误差随着模型尺度的增加而变小所引起的影响是由示出损益(penalty)的线L2表示的。就是说,在损益中,模型尺度和信息标准基本上是彼此成正比的。线L3代表当考虑近似误差ε(t)和不利后果两者时的特征,就是说,通过结合线L1和线L2所获得的特征。具有与由线L3表示的信息标准的最小值相对应的尺寸的模型是最优化模型。
存在用于选择最优化模型的各种信息标准。然而,本技术采用Schwarz信息标准(SIC)(T.Nakamura,K.Judd,A.I.Mees,和M.Small,Int.J.Bifurcation Chaos Appl.Sci.Eng.16,2153(2006).G.Schwartz,Annals of Statistics6,461(1978))。SIC是从贝叶斯分析法中获得的信息标准。通过使用贝叶斯定理,可以获得参数与数据之间的结合概率。SIC是给定其可能性的最大值的信息标准。SIC的方程是由以下方程(3)表示的。在方程(3)中,n表示数据的数量,并且k表示模型尺度。此外,由方程(4)表示的e表示近似误差。
[方程3]
SIC ( k ) = n ln e 2 n + k ln n . . . ( 3 )
[方程4]
e = &Sigma; t = 1 n &epsiv; ( t ) . . . ( 4 )
方程(3)的左边对应图4的线L3,并且其右边的第二项对应关于图4中的模型尺度示出损益的线L2
当生成RAR模型时,需要选择必要的时间延迟项。找到必要项的组合是非确定性的多项式时间(NP)问题,并且存在多个直接推断法。这些方法中的普遍问题的一个就是由于局部最小值导致的选择整体最优化模型的困难。
为了避免上述问题,在本技术中已执行完全搜索。然而,在用于通过完全搜索找到最佳项的组合的方法中,当项的数量增加时,计算时间变得巨大,并且该方法因此变得不切实际。在这种情况下,通过使用直接推断法使用次最佳解决方案。
在上文中,已描述了使用单个变量的模型构造。然而,本技术可被用于多个变量。
<网络构造方法>
RAR模型以上述方式生成之后,在图3的步骤S3中执行将模型转换成网络的处理。包括在RAR模型中的时间延迟项被认为是网络的节点,并且被连接至当前时间的项x(t)。因此,网络可通过直接转换使用的RAR模型来获得。
在RAR模型中,具有大系数的项被认为是对当前时间的项x(t)具有大影响。对于作为网路拓扑学引入这个“大的影响”的方法,可考虑几个可能的方法。这里,作为一种方法,引入与当前时间的项x(t)与包括在RAR模型中的任何时间延迟项x(t-i)之间的系数相对应的“节点之间的距离”。更具体地,认为具有大系数的项被定位在当前时间的项x(t)附近,并且具有小系数的项被定位为远离项x(t)。
方程(2)可被解释为系数向量a≡(a1、a2、…aw)与线性独立项(x(t-l1)、x(t-l2)、…、x(t-lw))的乘积。由于参数a0和近似误差ε(t)不具有时间信息,所以在本技术中不使用。
下面,引入当前时间的项x(t)与包括在RAR模型中的任何单个时间延迟项x(t-i)之间的角度θi,该角度θi是由方程(5)表示的。就是说,角度θi是由RAR模型中的单个时间延迟项x(t-i)与各个项的参数的平方的总和的平方根的比例来定义。更具体地,角度θi是由比例的反余弦定义的。
[方程5]
&theta; i = arccos ( a 1 a 1 2 + a 2 2 + . . . + a w 2 ) . . . ( 5 )
此外,距离x(t)和x(t-i)之间的距离di是被定义为由方程(6)表示的。就是说,距离di是由RAR模型中的单个时间延迟项x(t-i)与各个项的参数的平方的总和的平方根的比例来定义。更具体地,距离di由角度θi定义的。此外具体地,距离di是由角度的正切的绝对值来定义的。
[方程6]
di≡|tanθi|…(6)
在本技术中,根据目标系统,怎样定义被引入为一个测量值的距离可能不同。例如,系数的倒数可能最适合于某个系统。然而,因为由方程(6)定义的距离di以良好平衡的方式反映使用的模型中的所有参数的大小,所以距离di被认为在很多情况下都是适合的。
从线性时间序列模型到本技术提出的网络拓扑的转换不取决于如何定义节点之间的距离。
当只看方程(2)时,包括在RAR模型中的所有节点可被视为其被直接连接至当前时间的项x(t)。因此,从方程(6)中获得的距离di被定义为“直接距离”。
另一方面,当考虑系统的时间发展(即,动态的属性)时,因为网络上的节点被耦接至各个节点,网络上的一对节点可以经由其他多个节点被间接彼此连接。在这种情况下,存在经由任何两个节点之间的另一个节点的不同路径。因此,可获得与直接距离不同的距离。上述经由任何两个节点之间的另一个节点的路径的距离被定义为“间接距离”。
在一些网络中,间接路径中的间接距离比直接路径中的直接距更短。信息通过最短路径的间接路径是最更有效的。基本上,一对节点被认为是以具有最短距离的路径连接至彼此。具有最短距离的路径被收集,并且以所收集的路径的集合为目标的线性模型被认为是将被表征的网络。
通过研究以这种方式构造的网络,仅通过观察线性模型不能理解的分级结构变得显而易见。因此,可以了解一项的影响如何通过另一项而传递的细节。
<用于检测网络相同性的方法>
为了了解已观察长时间的现象的状态改变,必须了解以某种方法获得的状态是相同状态还是不同状态。因此,可以了解是否状态以改变或转换。这里,提出将网络结构转换成矩阵以检验网络结构的相同性的方法。该方法在图3中的步骤4中执行。
例如,存在其中由RAR模型揭示最大延迟时间为6的时间序列数据,并且如下连接存在。更具体地,x(t-1)和x(t-3)被直接连接至x(t),x(t-2)和x(t-4)被直接连接至x(t-1),x(t-6)被直接连接至x(t-3),以及x(t-5)被直接连接至x(t-2)。
将参考图5和图6描述上述耦接关系。图5是示出了网络结构的矩阵公式的示图。图6是示出了矩阵的实例的示图。
上述耦接关系可使用矩阵表示。当节点被耦接至彼此时,给定除0以外的数值。当节点未被耦接至彼此时,给定0。这里,将描述当节点被耦接至彼此时给定1的实例。此外,相同变量之间的耦接被确定为0。因此,以上连接的时间序列数据被表示为图5中所示。在图5中,各个节点被安排在水平方向上和垂直方向上,并且1和0分别被安排在连接节点之间的位置和不连接的节点之间的位置。
图5的节点之间的耦接关系被表示为图6中所示的矩阵。
通过执行上述转换,可以将网络结构转换成矩阵。使用这个方法获得的矩阵是对称矩阵。
以这种方式获得的多个矩阵之间的相同性被验证。当验证相同性时,矩阵的尺寸应该等于彼此。因此,需要将具有小尺寸的矩阵的最大延迟时间与具有大尺寸的矩阵的最大延迟时间相匹配。
下面,两个矩阵之间的差值以以下方式计算。更具体地,待验证的矩阵被定义为A和B。A和B之间的差值C被计算(C=A-B)。然后,计算的矩阵的各个元素的平方的总和被计算。然后,获得总和的平方根,并且所获得的值被除以元件数量。以这种方式,可以表达矩阵A和矩阵B之间的差值。当两个矩阵彼此完全相同时所获得的值变为零。
多个矩阵之间的相同性可通过使用以这种方式获得的值来表示。然而,最好不要通过设置特定临界值唯一地确定相同性。适当的临界值取决于使用的数据的属性。因此,使用的数据的属性被充分检查,然后适当的临界值根据数据设置从而验证相同性。
<用于检测网络次结构之间关系的方法>
可获得足够数量的用于建模的数据的区间(包括100个数据的区间,例如)被预先设置,并且时间序列数据被分成各个区间。对各个区间中的时间序列数据构造时间序列模型以获得其网络。对于从其他事件中获得的大量时间序列数据同样执行相同的操作。
接着,由此获得的大量网络结构之间的相同性通过以上方法验证。在网网络结构之中,具有高相同性的网络被作为相同网络处理。通过使用从大量不同事件中获得的数据,即使在每个事件中系统只出现一次,通过与另一事件比较也可能存在相同系统。因此,可对每个系统执行标记。通过比较大量事件的标记的变换,可以提取改变模式。
<用于检测构成现象的元素的时间结构之间关系的方法>
作为传统方法,存在通过使用自相关函数利用最大值和最小值检测时间结构的方法。然而,因为自相关函数使用时间序列数据的相似性,所以不可能反映时间结构中的整个相互关系。因此,本技术使用如上所述的RAR模型。
为了准确反映整个相互关系,需要利用准备的时间延迟项的所有组合(即,函数)构造模型,计算模型的信息标准,并且采用具有最小信息标准的模型作为最优化模型。包括在最优化模型中的多个项被确定为组成现象的元素的时间结构。
选择最佳模式所需要的时间优选地为不要太长。例如,时间优选地为最长大约几天。在通过函数的所有组合搜索最优化模型中,当函数的数量近似30时,搜索不用使用太长时间。然而,当函数的数量多于约30时,搜索使用极长的时间。因此,已提出替换完全搜索的多个方法(直接推断法),并且已证实提出的方法的有效性。
当执行完全搜索时,可以选择最优化模型。然而,当使用直接推断法选择模型时,不能保证所选择的模型是最佳的。因此,所选择的模型被处理为次最佳模型。
<网络实例1>
将示出本技术的应用实例。首先,假设获得以下RAR模型。
x(t)=1.01x(t-1)+0.7x(t-3)-0.1x(t-6)(7)
从由方程(5)和方程(6)获得的方程(7)中的节点x(t-1)、节点x(t-3)和节点x(t-6)至节点x(t)的直接距离由方程(8)表示。
d=(0.7001,1.4499,12.2886)    (8)
这些直接距离d是由方程(5)和方程(6)计算的。更具体地,从节点x(t-1)至节点x(t)的直接距离d(=0.7001)是通过将ai=1.01代入方程(5)中计算角度θi,然将计算的θi代入方程(6)中获得的值。以同样方式,从节点x(t-3)至节点x(t)的直接距离d(=1.4499)是通过将ai=0.7代入方程(5)中计算角度θi,然后将计算的θi代入方程(6)中获得的值。此外,从节点x(t-6)至节点x(t)的直接距离d(=12.2886)是通过将ai=-0.1代入方程(5)中计算角度θi,然后将计算的θi代入方程(6)中获得的值。
图7是示出网络的示图。图7通过从1至15的时间区间的节点示出了从方程(7)中获得的网络的节点之间的连接的整个图像。节点之间的距离代表对于其他节点的影响的程度。方程(7)是节点x(t-1)、节点x(t-3)、节点x(t-6)被直接耦接至节点x(t)的模型。
RAR模型中任何节点之间的直接距离是通过将t的任何值代入RAR模型来从方程(5)和方程(6)计算的。例如,当将t为8代入方程(7)的RAR模型中时,方程(7)被表示为方程(9)中所示的。
x(8)=1.01x(7)+0.7x(5)-0.1x(2)    (9)
当将i=7代入方程(5)和方程(6)以计算从节点x(7)至节点x(8)的直接距离时,方程(5)中ai(i=7)是根据方程(9)获得为1.01。这个值与方程(7)中的节点x(t-1)的参数相同。因此,从节点x(7)至节点x(8)的直接距离与从节点x(t-1)至节点x(t)的直接距离是相同值(=0.7001)。
此外,当将t为7代入方程(7)的RAR模型中时,方程(7)被表示为方程(10)中所示。
x(7)=1.01x(6)+0.7x(4)-0.1x(1)    (10)
当将i=1代入方程(5)和方程(6)以计算从节点x(1)至节点x(7)的直接距离时,方程(5)中的ai(i=1)获得为方程(10)中的-0.1。这个值与方程(7)中的节点x(t-6)的参数相同。因此,从节点x(1)至节点x(7)的直接距离与从节点x(t-6)至x(t)的直接距离是相同值(=12.2886)。
此外,当将t为9代入方程(7)的RAR模型中时,方程(7)被表示为方程(11)中所示。
x(9)=1.01x(8)+0.7x(6)-0.1x(3)    (11)
当将i=6代入方程(5)和方程(6)以计算从节点x(6)至节点x(9)的直接距离时,方程(5)中ai(i=6)根据方程(11)被获得为0.7。这个值与方程(7)中的节点x(t-3)的参数相同。因此,从节点x(6)至节点x(9)的直接距离与从节点x(t-3)至节点x(t)的直接距离是相同值(=1.4499)。
在图7中,每个箭头的点描述的值代表节点之间的直接距离。各个节点之间的距离通过线的类型示出。粗线表示节点之间的距离是0.7,虚线表示节点之间的距离是12.3,并且细线表示节点之间的距离是1.45。图中节点的位置不具有任何特殊含义,并且只有网路拓扑是重要的。此外,图中每个箭头的长度不与实际距离对应。
例如,图7中,节点x(6)、节点x(4)和节点x(1)被直接耦接至节点x(7)。然而,如上所述,直接距离不总是节点之间的最短距离。例如,节点x(15)被直接耦接至节点x(9)。然而,从节点x(9)至节点x(15)的最短路径是经由节点x(12)的路径,就是说“从节点x(9)至节点x(12)”的路径和“从节点x(12)至节点x(15)”的路径的总和。
“从节点x(9)至节点x(12)”的直接距离和“从节点x(12)至节点x(15)”的直接距离均是1.45。因此,节点x(9)与节点x(15)之间的间接距离是2.9(=1.45+1.45)。节点x(9)和节点x(15)之间的直接距离是12.29,并且因此长于其之间的间接距离。因此,可以理解,节点x(t-6)对方程(7)中的节点x(t)的最大影响不是经由直接耦接在节点之间的一个,而是经由节点x(t-3)的一个。
为了更清楚地示出方程(7)的网络的结构,只包括最佳路径的网络在图8中示出。图8是示出最佳路径的示图。
图8示出了节点x(t-1)和节点x(t-3)被直接连接至节点x(t),并且节点x(t-6)经由节点x(t-3)被连接至节点x(t)。这个结果反映包括方程(7)中所示的模型的全局时间信息和分级结构的节点之间的相互关系。这个信息不能只通过检查方程(7)来发现。
在图8中,由粗线表示的节点x(t-1)、x(t-3)和x(t-6)是包括在方程(7)的模型中的项。此外,由细线表示的节点x(t-2)、x(t-4)和x(t-5)是包括在方程(7)中的项,而且落在方程(7)的最大时间延迟6内。
<网络实例2>
将示出使用本技术的方法获得的健康的男性成年人的心率数据的结果。获得心率数据对象是22岁的成年男性,并且在眼睛闭上且安静状态下的对象上进行测量。图9示出了使用的心率数据。图9是示出了心率变化的示图。水平轴代表心跳的数量并且垂直轴代表心跳间隔(秒)。
用于生成RAR模型的心率数据的总数是600,并且使用的最大时间延迟是15。所获得的RAR模型是如方程(12)中所示的一个。
x(t)=0.085+1.375x(t-1)-0.681x(t-2)+0.157x(t-7)-0.065x(t-10)+0.105x(t-12)    (12)
从方程(12)的各个项的节点x(t-1)、x(t-2)、x(t-7)、x(t-10)、以及x(t-12)至从方程(6)中获得的节点x(t)是由方程(13)表示。
d=(0.5162,2.0399,9.8214,23.6943,14.6556)    (13)
从方程(12)和方程(13)中获得的网络是图10中所示的。图10是示出了心率数据的网络的示图。从图10中可以理解本文中使用的心率数据具有简单的链式结构。
在本技术中,已描述基于从时间序列中获得的确定性模型的结构构造具有时间结构的网络的方法。根据这个方法,可以从时间序列数据中预测诸如天气、地震、自然环境、人体健康、及经济的随时间改变的现象的未来。此外,可以将具有各个时间延迟的线性模型转换成网络拓扑。本技术相对于现有方法的的优点是含有包括在时间序列模型中的全局时间结构的项之间的相互关系可被直接转换成网络拓扑。通过从构造的网络中提取最佳路径,可以了解模型的相互关系和分级结构。
[本技术的编程应用]
以上描述的一系列处理可通过硬件执行,并且同样可通过软件执行。
当一系列处理通过软件执行时,组成软件的程序被安装到被嵌入专用硬件的计算机或者能够经由网络或经由通过安装各个程序的记录介质执行各个功能的个人计算机中。
如图1所示,包含上述程序的记录介质不仅包括从装置主体中独立分布以便提供程序并且具有记录在其上的程序的可移除介质31,诸如磁盘(包括软盘)、光盘(包括紧致磁盘-只读存储器(CD-ROM)和DVD)、磁光盘(包括迷你盘(MD))、和半导体存储器,而且还包括提供给用户的具有预先嵌入装置主体中的并且具有记录在其上的程序的ROM22,和包括在存储单元28中的硬盘。
在本说明书中,描述被记录在记录介质上的程序的步骤包括,当然,根据顺序以时间序列方式进行处理。然而,处理不一定以时间序列方式进行,并且因此步骤同样包括以平行或独立方式进行的处理。
此外,在本说明书中,系统表示包括多个装置的整个设备。
同时,本发明的实施方式不限于以上描述的实施方式并且在不背离本发明的精神的情况下可进行各种变型。
本技术可具有以下配置。
(1)
一种信息处理装置,包括:
获取单元,获取时间序列数据;
转换单元,将所获取的时间序列数据转换为RAR模型;以及
预测单元,使用RAR模型预测当前进行中的事件的未来。
(2)
根据(1)的信息处理装置,还包括根据RAR模型来创建网络结构的创建单元。
(3)
根据(2)的信息处理装置,其中,创建单元将RAR模型的时间延迟项确定为网络结构的节点,并且将节点连接至RAR模型的当前时间的项以创建网络结构。
(4)
根据(3)的信息处理装置,其中,RAR模型的两个节点之间的直接距离通过两个节点中的一个的参数与RAR模型的所有参数的平方的总和的平方根的比例来定义。
(5)
根据(4)的信息处理装置,其中,当两个节点通过一个或多个其他节点彼此连接时,创建单元将连接的各个节点之间的直接距离的总和确定为间接距离。
(6)
根据(5)的信息处理装置,其中,创建单元通过使用具有直接距离和间接距离之间最短距离的路径彼此连接的节点来创建网络结构。
(7)
根据(2)到(6)中的任一项的信息处理装置,还包括根据网络结构的特征来检索不同的时间序列数据之间的相同性的检索单元。
(8)
根据(7)的信息处理装置,其中,检索单元将网络结构转换成矩阵,并且检索矩阵的相同性。
(9)
根据(8)的信息处理装置,其中,检索单元在水平方向和垂直方向上排列节点,并且将1和0中的一个和另一个放在彼此连接的节点和彼此不连接的节点的相应位置以形成矩阵。
(10)
根据(8)或(9)的信息处理装置,其中,矩阵包括多个矩阵,并且检索单元通过以在匹配多个矩阵的尺寸之后计算多个矩阵之间的差值并且将构成差值的元素的平方和的平方根除以元素的数量的方式获得的值检索相同性。
(11)
一种信息处理方法,包括:
获取时间序列数据;
将所获得的时间序列数据转换为RAR模型;以及
使用RAR模型预测当前进行中的事件的未来。
(12)
一种通过计算机可读的具有记录在其上的程序的记录介质,程序使得计算机执行:
获取步骤,获取时间序列数据;
转换步骤,将所获得的时间序列数据转换为RAR模型;以及
预测步骤,使用RAR模型预测当前进行中的事件的未来。
(13)
一种程序使得计算机执行:
获取步骤,获取时间序列数据;
转换步骤,将所获得的时间序列数据转换为RAR模型的;以及预测步骤,使用RAR模型预测当前进行中的事件的未来。
符号说明
51  获取单元
52  转换单元
53  创建单元
54  检索单元
55  预测单元

Claims (13)

1.一种信息处理装置,包括:
获取单元,获取时间序列数据;
转换单元,将所获取的时间序列数据转换为RAR模型;以及
预测单元,使用所述RAR模型预测当前进行中的事件的未来。
2.根据权利要求1所述的信息处理装置,还包括根据所述RAR模型来创建网络结构的创建单元。
3.根据权利要求2所述的信息处理装置,其中,所述创建单元将所述RAR模型的时间延迟项确定为所述网络结构的节点,并且将所述节点连接至所述RAR模型的当前时间的项以创建所述网络结构。
4.根据权利要求3所述的信息处理装置,其中,所述RAR模型的两个所述节点之间的直接距离通过两个所述节点中的一个的参数与所述RAR模型的所有参数的平方的总和的平方根的比例来定义。
5.根据权利要求4所述的信息处理装置,其中,当两个所述节点通过一个或多个其他所述节点彼此连接时,所述创建单元将所述连接的各个节点之间的直接距离的总和确定为间接距离。
6.根据权利要求5所述的信息处理装置,其中,所述创建单元通过使用具有所述直接距离和所述间接距离之间最短距离的路径彼此连接的节点来创建所述网络结构。
7.根据权利要求6所述的信息处理装置,还包括根据所述网络结构的特征来检索不同的时间序列数据之间的相同性的检索单元。
8.根据权利要求7所述的信息处理装置,其中,所述检索单元将所述网络结构转换成矩阵,并且检索所述矩阵的相同性。
9.根据权利要求8所述的信息处理装置,其中,所述检索单元在水平方向和垂直方向上排列所述节点,并且将1和0中的一个和另一个放在彼此连接的节点和彼此不连接的节点的相应位置以形成所述矩阵。
10.根据权利要求9所述的信息处理装置,其中,所述矩阵包括多个矩阵,并且所述检索单元通过以在匹配所述多个矩阵的尺寸之后计算所述多个矩阵之间的差值并且将构成所述差值的元素的平方和的平方根除以所述元素的数量的方式获得的值检索所述相同性。
11.一种信息处理方法,包括:
获取时间序列数据;
将所获得的时间序列数据转换为RAR模型;以及
使用所述RAR模型预测当前进行中的事件的未来。
12.一种通过计算机可读的具有记录在其上的程序的记录介质,所述程序使得计算机执行:
获取步骤,获取时间序列数据;
转换步骤,将所获得的时间序列数据转换为RAR模型;以及
预测步骤,使用所述RAR模型预测当前进行中的事件的未来。
13.一种程序使得计算机执行:
获取步骤,获取时间序列数据;
转换步骤,将所获得的时间序列数据转换为RAR模型的;以及
预测步骤,使用所述RAR模型预测当前进行中的事件的未来。
CN201280030592.0A 2011-06-29 2012-06-21 信息处理装置、信息处理方法、记录介质、以及程序 Pending CN103620625A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2011144894A JP5915006B2 (ja) 2011-06-29 2011-06-29 情報処理装置および方法、記録媒体、並びにプログラム
JP2011-144894 2011-06-29
PCT/JP2012/065816 WO2013002107A1 (ja) 2011-06-29 2012-06-21 情報処理装置および方法、記録媒体、並びにプログラム

Publications (1)

Publication Number Publication Date
CN103620625A true CN103620625A (zh) 2014-03-05

Family

ID=47424004

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201280030592.0A Pending CN103620625A (zh) 2011-06-29 2012-06-21 信息处理装置、信息处理方法、记录介质、以及程序

Country Status (5)

Country Link
US (2) US9727817B2 (zh)
EP (1) EP2728519A4 (zh)
JP (1) JP5915006B2 (zh)
CN (1) CN103620625A (zh)
WO (1) WO2013002107A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11314615B2 (en) * 2018-12-20 2022-04-26 Fujitsu Limited Recording medium and information processing apparatus

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10372718B2 (en) 2014-11-03 2019-08-06 SavantX, Inc. Systems and methods for enterprise data search and analysis
US10915543B2 (en) 2014-11-03 2021-02-09 SavantX, Inc. Systems and methods for enterprise data search and analysis
US10970288B2 (en) 2017-02-09 2021-04-06 Nec Corporation Analysis device
US11328128B2 (en) 2017-02-28 2022-05-10 SavantX, Inc. System and method for analysis and navigation of data
US10528668B2 (en) * 2017-02-28 2020-01-07 SavantX, Inc. System and method for analysis and navigation of data
US11663493B2 (en) 2019-01-30 2023-05-30 Intuit Inc. Method and system of dynamic model selection for time series forecasting
US11423250B2 (en) 2019-11-19 2022-08-23 Intuit Inc. Hierarchical deep neural network forecasting of cashflows with linear algebraic constraints
US11657302B2 (en) 2019-11-19 2023-05-23 Intuit Inc. Model selection in a forecasting pipeline to optimize tradeoff between forecast accuracy and computational cost
CN113807522A (zh) * 2021-03-03 2021-12-17 京东科技控股股份有限公司 贝叶斯网络结构的生成方法、装置、电子设备和存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005216202A (ja) * 2004-02-02 2005-08-11 Fuji Heavy Ind Ltd 未来値予測装置および未来値予測方法
US20060129395A1 (en) * 2004-12-14 2006-06-15 Microsoft Corporation Gradient learning for probabilistic ARMA time-series models
CN101989127A (zh) * 2009-08-03 2011-03-23 索尼公司 数据处理装置、数据处理方法以及程序

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TW342478B (en) * 1996-01-08 1998-10-11 Matsushita Electric Ind Co Ltd Time series signal predicting apparatus

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005216202A (ja) * 2004-02-02 2005-08-11 Fuji Heavy Ind Ltd 未来値予測装置および未来値予測方法
US20060129395A1 (en) * 2004-12-14 2006-06-15 Microsoft Corporation Gradient learning for probabilistic ARMA time-series models
CN101989127A (zh) * 2009-08-03 2011-03-23 索尼公司 数据处理装置、数据处理方法以及程序

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
KEVIN JUDD*等: "Embedding as a modeling problem", 《PHYSICA D: NONLINEAR PHENOMENA》 *
KEVIN JUDD*等: "Embedding as a modeling problem", 《PHYSICA D: NONLINEAR PHENOMENA》, vol. 120, 15 September 1998 (1998-09-15), pages 273 - 286, XP055138930, DOI: doi:10.1016/S0167-2789(98)00089-X *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11314615B2 (en) * 2018-12-20 2022-04-26 Fujitsu Limited Recording medium and information processing apparatus

Also Published As

Publication number Publication date
EP2728519A1 (en) 2014-05-07
WO2013002107A1 (ja) 2013-01-03
US9727817B2 (en) 2017-08-08
US20140114897A1 (en) 2014-04-24
EP2728519A4 (en) 2015-05-06
JP2013012081A (ja) 2013-01-17
US20170330085A1 (en) 2017-11-16
JP5915006B2 (ja) 2016-05-11

Similar Documents

Publication Publication Date Title
CN103620625A (zh) 信息处理装置、信息处理方法、记录介质、以及程序
Jang et al. Bayesian model updating of a full‐scale finite element model with sensitivity‐based clustering
Lam et al. Bayesian model updating of a coupled-slab system using field test data utilizing an enhanced Markov chain Monte Carlo simulation algorithm
Bower et al. Galaxy formation: a Bayesian uncertainty analysis
Song et al. Bayesian model updating of nonlinear systems using nonlinear normal modes
Wang et al. Bayesian dynamic forecasting of structural strain response using structural health monitoring data
Khalaf et al. Particle swarm optimization based approach for estimation of costs and duration of construction projects
Liu et al. Study of structural damage detection with multi-objective function genetic algorithms
Clark et al. Specifying performance measures for PEPA
Yuan et al. Calibration of stochastic computer models using stochastic approximation methods
Ding et al. Simultaneous identification of structural stiffness and mass parameters based on Bare-bones Gaussian Tree Seeds Algorithm using time-domain data
CN115455793A (zh) 基于多尺度模型修正的高层结构复杂构件受力分析方法
US10248462B2 (en) Management server which constructs a request load model for an object system, load estimation method thereof and storage medium for storing program
Qian et al. Surrogate-assisted seismic performance assessment incorporating vine copula captured dependence
Gangopadhyay et al. Phantom dark energy as a natural selection of evolutionary processes a^ la genetic algorithm and cosmological tensions
Tong et al. Analytical probability propagation method for reliability analysis of general complex networks
Yi Selection of initial weights and thresholds based on the genetic algorithm with the optimized back-propagation neural network
West et al. Efficient evaluation of high-order moments and cumulants in tensor network states
Jin et al. High precision variational Bayesian inference of sparse linear networks
Lin et al. Multiple crack identification of a free–free beam with uniform material property variation and varied noised frequency
Younsi et al. Integration of multiple regression model in an epidemiological decision support system
JP7207531B2 (ja) 経路別交通量推定装置、経路別交通量推定方法、及び経路別交通量推定プログラム
Branisavljević et al. Uncertainty reduction in water distribution network modelling using system inflow data
Bayissa et al. Structural damage identification using a global optimization technique
Ding et al. Gaussian process metamodel and Markov chain Monte Carlo-based Bayesian inference framework for stochastic nonlinear model updating with uncertainties

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20140305