CN102087721B - 信息处理设备和观测值预测方法 - Google Patents

信息处理设备和观测值预测方法 Download PDF

Info

Publication number
CN102087721B
CN102087721B CN201010570579.7A CN201010570579A CN102087721B CN 102087721 B CN102087721 B CN 102087721B CN 201010570579 A CN201010570579 A CN 201010570579A CN 102087721 B CN102087721 B CN 102087721B
Authority
CN
China
Prior art keywords
formula
characteristic extraction
observed reading
predictor
observed
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201010570579.7A
Other languages
English (en)
Other versions
CN102087721A (zh
Inventor
小林由幸
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Publication of CN102087721A publication Critical patent/CN102087721A/zh
Application granted granted Critical
Publication of CN102087721B publication Critical patent/CN102087721B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/12Computing arrangements based on biological models using genetic models
    • G06N3/126Evolutionary algorithms, e.g. genetic algorithms or genetic programming

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biophysics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Theoretical Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Molecular Biology (AREA)
  • Biomedical Technology (AREA)
  • Genetics & Genomics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Physiology (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

提供了一种信息处理设备和信息处理设备中的观测值预测方法。信息处理设备包括:预测器构建单元,通过基于遗传算法的机器学习以及通过组合预先准备的处理函数来创建用于从预定时刻之前观测到的观测值中提取观测值的特征量的多个特征量提取公式,通过多个特征量提取公式的线性组合创建用于预测在预定时刻的观测值的预测公式和向预测公式的每个特征量提取公式分配组合系数,基于组合系数计算每个特征量提取公式对预测公式的贡献率,计算对预测公式的总贡献率,并且判定总贡献率是否满足预定终止条件以确定是否将预测公式用于预测预定时刻的观测值;以及预测单元,使用所创建的预测公式、根据在时刻t之前观测到的观测值来预测时刻t的观测值。

Description

信息处理设备和观测值预测方法
技术领域
本发明涉及信息处理设备、观测值预测方法及程序。
背景技术
近年来,用于从难以定量地确定特征的任意数据组中提取数据组特征量的方法正受到关注。例如,已知有如下这种方法:把任意音乐数据作为输入并且自动构建用于自动提取该音乐数据所属音乐流派的算法。音乐流派(诸如,爵士、古典和流行等)并非是根据演奏模式或乐器的类型定量地确定的。因此,以前,通常认为难以在给出任意音乐数据时从音乐数据中自动提取音乐流派。
然而,事实上,信息项的各种组合(诸如,音乐数据中包括的音调的组合、组合音调的方式、乐器类型的组合、低音线或旋律线的结构等)中潜在地包括划分音乐流派的特征。因此,已对于通过机器学习来自动构建用于提取这种特征的算法(在下文中,特征量提取器)的可能性进行了特征量提取器的研究。作为一项研究结果,可以列举出基于遗传算法的特征量提取器的自动构建方法(在JP-A-2009-48266中描述)。遗传算法是在机器学习的处理中模仿生物进化过程并且把选择、交叉(特征交换)和突变考虑在内的算法。
通过使用以上提到的专利文献中描述的特征量提取器自动构建算法,可以自动构建用于从任意音乐数据中提取该音乐数据所属音乐流派的特征量提取器。另外,该专利文献中描述的特征量提取器自动构建算法非常灵活并且能够自动构建用于不仅从音乐数据中而且从任意数据组中提取数据组特征量的特征量提取器。因此,预期把该专利文献中描述的特征量提取器自动构建算法应用于对人工数据(诸如音乐数据和图像数据等)的特征量分析以及对自然存在的各种观测量的特征量分析。
发明内容
已开发了该专利文献中描述的特征量提取器自动构建算法来用于对任意数据特征量的分析。然而,虽然一方面期望分析现有数据,但另一方面,还期望根据现有数据来创建特征与现有数据相同的新数据。这种期望的主要示例是时序数据的未来预测。即,期望实现自动构建如下这种预测器的方法:根据过去累积的时序数据来创建特征与过去时序数据相同的未来时序数据。针对此方法,本发明的发明人已设计了通过使用上述特征量提取器自动构建算法来自动构建根据过去时序数据来预测未来时序数据的预测器的方法。本发明涉及这种预测器的自动构建方法。
鉴于以上内容,期望提供的信息处理设备、观测值预测方法和程序是新的、改进的并且能够通过使用基于遗传算法的特征量提取器自动构建算法来自动创建根据过去时序数据预测未来时序数据的预测器。
根据本发明的实施例,提供了信息处理设备,包括:预测器构建单元,用于通过基于遗传算法的机器学习以及通过组合预先准备的处理函数来创建用于从在预定时刻之前观测到的观测值中提取观测值的多个特征量的多个特征量提取公式,通过多个特征量提取公式的线性组合来创建用于预测在预定时刻的观测值的预测公式和向预测公式的每个特征量提取公式分配组合系数,基于组合系数计算每个特征量提取公式对预测公式的贡献率,计算对预测公式的总贡献率,并且判定总贡献率是否满足预定终止条件以确定是否将预测公式用于预测在预定时刻的观测值;以及预测单元,用于使用由预测器构建单元创建的预测公式、根据在时刻t之前观测到的观测值来预测在时刻t的观测值。
在根据在时刻t之前观测到的观测值预测在时刻t的观测值之后,该预测单元可通过使用由预测器构建单元创建的预测公式以及所述多个特征量提取公式、根据预测出的在时刻t的观测值以及在时刻t之前观测到的观测值来预测要在继时刻t之后的时刻t,观测的观测值。
该信息处理设备可还包括:预测数据创建单元,用于准备与物体的运动相关的观测值在时刻t0的初始值,在把初始值作为第一输入的情况下对时刻t0之后的时刻tj(j=1、......、N)相继地执行预测单元对观测值的预测处理,以及创建在时刻t1至tN的观测值的预测数据;以及运动模拟器,通过使用由预测数据创建单元创建的预测数据来模拟物理物体的运动。
在创建所述多个特征量提取公式和预测公式之后观测到新观测值的情况下,预测器构建单元可以基于创建出的预测公式和所述多个特征量提取公式以及根据新观测到的观测值重新创建所述多个特征量提取公式和所述预测公式。
根据本发明的另一实施例,提供了观测值预测方法,包括下列步骤:通过基于遗传算法的机器学习以及通过组合预先准备的处理函数来创建用于从在预定时刻之前观测到的观测值中提取观测值的多个特征量的多个特征量提取公式,通过多个特征量提取公式的线性组合来创建用于预测在预定时刻的观测值的预测公式和向预测公式的每个特征量提取公式分配组合系数,基于组合系数计算每个特征量提取公式对预测公式的贡献率,计算对预测公式的总贡献率,并且判定总贡献率是否满足预定终止条件以确定是否将预测公式用于预测在预定时刻的观测值;以及使用在创建步骤中创建的预测公式、根据在时刻t之前观测到的观测值来预测在时刻t的观测值。
根据本发明的另一实施例,提供了用于使计算机实现以下功能的程序:预测器构建功能,用于通过基于遗传算法的机器学习以及通过组合预先准备的处理函数来创建用于从在预定时刻之前观测到的观测值中提取观测值的多个特征量的多个特征量提取公式,以及基于通过所述多个特征量提取公式计算出的所述多个特征量来创建用于预测在预定时刻的观测值的预测公式;以及预测功能,用于使用由预测器构建功能创建的预测公式、根据在时刻t之前观测到的观测值来预测在时刻t的观测值。
根据上面描述的本发明的实施例,可以通过使用基于遗传算法的特征量提取器自动构建算法来自动创建根据过去时序数据预测未来时序数据的预测器。
附图说明
图1是示出了根据本发明实施例的信息处理设备的功能配置的说明图;
图2是示出了根据所述实施例的观测值输入单元的观测值的配置的说明图;
图3是示出了根据所述实施例的通过预测器构建数据准备单元实现的用于预测器构建的数据集的创建方法的说明图;
图4是示出了根据所述实施例的通过预测器构建单元实现的预测器构建方法以及通过预测单元实现的对观测值的预测方法的说明图;
图5是示出了根据所述实施例的通过预测单元实现的对观测值的预测方法的说明图;
图6是示出了根据所述实施例的通过预测单元实现的对预测值的输出方法的说明图;
图7是示出了根据所述实施例的观测值预测方法的总体情况的说明图;
图8是示出了根据所述实施例的预测器构建数据集准备方法的说明图;
图9是示出了根据所述实施例的预测器的自动构建方法的说明图;
图10是示出了根据所述实施例的预测器的自动构建方法的说明图;
图11是示出了根据所述实施例的预测器的自动构建方法的说明图;
图12是示出了根据所述实施例的预测器的自动构建方法的说明图;
图13是示出了根据所述实施例的预测器的自动构建方法的说明图;
图14是示出了根据所述实施例的预测器的自动构建方法的说明图;
图15是示出了根据所述实施例的预测器的自动构建方法的说明图;
图16是示出了根据所述实施例的预测器的自动构建方法的说明图;
图17是示出了根据所述实施例的预测器的自动构建方法的说明图;
图18是示出了根据所述实施例的预测器的自动构建方法的说明图;
图19是示出了根据所述实施例的预测器的自动构建方法的说明图;
图20是示出了根据所述实施例的预测器的自动构建方法的说明图;
图21是示出了根据所述实施例的预测器的自动构建方法的说明图;
图22是示出了根据所述实施例的预测器的自动构建方法的说明图;
图23是示出了根据所述实施例的使用预测器实现的对观测值的预测方法的说明图;
图24是示出了把观测值的预测方法应用于单摆运动预测的情形的具体应用方法的说明图;
图25是示出了根据所述实施例的在把观测值的预测方法应用于单摆运动预测的情形中获得的结果的说明图;
图26是示出了把观测值的预测方法应用于二维细胞自动机的模式改变预测的情形的具体应用方法的说明图;
图27是示出了在把观测值的预测方法应用于二维细胞自动机的模式改变预测的情形中获得的结果的说明图;
图28是示出了基于鸟群算法把观测值的预测方法应用于鸟运动预测的情形的具体应用方法的说明图;
图29是示出了在基于鸟群算法把观测值的预测方法应用于鸟运动预测的情形中获得的结果的说明图;以及
图30是示出了能够实现实施例的信息处理设备功能的硬件配置的示例的说明图。
具体实施方式
在下文中,将参照附图详细描述本发明的优选实施例。注意,在本说明书和附图中,功能和结构基本上相同的结构元件被标注了相同的附图标记,并略去了对这些结构元件的重复说明。
<描述流程>
此处将简要提到后面描述的本发明实施例的描述流程。首先,将参照图1描述根据实施例的信息处理设备100的功能配置。接下来,将参照图2描述根据实施例的观测值的输入方法。随后,将参照图3描述根据实施例的用于预测器构建的数据集的准备方法。随后,将参照图4描述根据实施例的预测器的自动构建方法以及通过预测器实现的对观测值的预测方法。随后,将参照图5描述根据实施例的对观测值的预测方法。随后,将参照图6描述根据实施例的对预测值的输出方法。
接下来,将针对根据实施例的观测值的预测方法参照图7来描述处理的整体流程。随后,在根据实施例的观测值的预测方法中,将参照图8描述与用于预测器构建的数据集的准备方法有关的处理流程。随后,在根据实施例的观测值的预测方法中,将参照图9至图22描述与预测器构建方法有关的处理流程。随后,在根据实施例的观测值的预测方法中,将参照图23描述与使用预测器的观测的预测方法有关的处理流程。
接下来,将参照图24和图25描述通过使用根据实施例的观测值的预测方法来执行单摆运动预测的方法以及通过实际执行实验获得的结果。随后,将参照图26和图27描述通过使用根据实施例的观测值的预测方法来执行二维细胞自动机的模式改变预测的方法以及通过实际执行实验获得的结果。随后,将参照图28和图29描述通过使用根据实施例的观测值的预测方法基于鸟群算法来预测鸟的运动的方法以及通过实际执行实验获得的结果。
接下来,将参照图30描述能够实现根据实施例的信息处理设备100的功能的硬件配置示例。最后,将总结实施例的技术思想,将简要描述通过技术思想获得的操作效果。
(描述项)
1:实施例
1-1:信息处理设备100的功能配置
1-2:观测值预测方法的概述
1-3:算法的详细内容
1-3-1:整体流程
1-3-2:用于预测器构建的数据集的准备
1-3-3:预测器的自动构建
1-3-4:通过预测器对观测值的预测
1-4:实验1(应用于单摆)
1-5:实验2(应用于二维细胞自动机)
1-6:实验3(应用于鸟群算法)
2:硬件配置示例
3:总结
<1:实施例>
首先,将描述本发明的实施例。本实施例涉及使用基于遗传算法的特征量提取器自动构建算法来自动构建根据过去时序数据创建未来时序数据的预测器的方法(在下文中,预测器自动构建方法)。
下面,将顺序地说明能够实现根据本实施例的预测器自动构建方法的信息处理设备100的功能配置、预测器自动构建方法的概述、预测器自动构建方法的算法以及预测器自动构建方法的应用示例。另外,在描述中,将说明使用根据本实施例的预测器自动构建方法创建的预测器对观测值的预测方法。
<1-1:信息处理设备100的功能配置>
首先,将参照图1描述能够实现根据本实施例的预测方法和预测器自动构建方法的信息处理设备100的功能配置。图1是示出根据本实施例的信息处理设备100的功能配置的示例的说明图。
如图1中所示,信息处理设备100由观测值输入单元102、预测器构建数据准备单元104、预测器构建单元106以及预测单元108配置成。另外,预测器构建单元106由特征量提取公式列表创建单元132、特征量计算单元134以及机器学习单元136配置成。下面,将按照根据预测器自动构建方法的处理流程以及根据预测方法的处理流程来描述每个结构元件的功能。
首先,观测值输入单元102获取作为过去时序数据的观测值。另外,观测值输入单元102可以是时序数据的观测装置或者可以是从外部观测装置获取观测值的获取装置。另外,观测值输入单元102可以是通过有线网络或无线网络从外界获取观测值的通信装置或者可以是用于用户输入观测值的输入装置。当获取了观测值时,观测值输入单元102把获取的观测值输入到预测器构建数据准备单元104。
观测值输入单元102输入的观测值例如是具有如图2中所示结构的时序数据。如图2中所示,时序数据是通过直到时刻t(t=1至i;i≥1)为止收集在某些时刻t观测到的观测值1至K(K≥1)获得的观测值组。另外,观测值的类型可以是任何类型。虽然使用了表述“观测”,但是并不一定执行使用观测装置或测量装置的量化。例如,观测值可以是人工创建作为样本的数据。下面,将使用通过观测装置观测某个物理量而获得的观测值给出说明。
当输入了这种观测值(时序数据)时,预测器构建数据准备单元104根据观测值来创建用于学习的数据集(在下文中,用于预测器构建的数据集)。该用于预测器构建的数据集是根据用于预测的预测基础数据以及根据预测基础数据创建的预测数据的组合而形成的。例如,如图3中所示,预测器构建数据准备单元104从观测值中提取具有预定时间长度w的从时刻t至t+w-1的预测基础数据t(t=1至d;d=j-w)。此外,预测器构建数据准备单元104提取与每项预测基础数据t的下一时刻t+w相对应的观测值,以及创建更根据每项预测基础数据t预测的预测数据t。
把预测器构建数据准备单元104以此方式创建的用于预测器构建的数据集输入到预测器构建单元106。如图4中所示,当输入了用于预测器构建的数据集(A)时,预测器构建单元106使用输入的用于预测器构建的数据集通过基于遗传算法的机器学习来自动构建预测器(B)。另外,用于预测器的预测器构建单元106的自动构建算法将在后面进行详细描述。
首先,特征量提取公式列表创建单元132通过随机组合和选择预先准备的处理函数,来创建输出一个标量(在下文中,特征量)的特征量提取公式。另外,由特征量提取公式列表创建单元132创建的特征量提取公式的组合被称作特征量提取公式列表。由特征量提取公式列表创建单元132创建的特征量提取公式列表被输入到特征量计算单元134。
特征量计算单元134通过把用于预测器构建的数据集中的预测基础数据输入到特征量提取公式列表中包括的每个特征量提取公式来计算特征量。随后,由特征量计算单元134计算出的特征量被输入到机器学习单元136。机器学习单元136使用用于预测器构建的数据集中的预测数据以及由特征量计算单元134计算出的特征量来执行机器学习,并且创建由特征量提取公式的组合表示的预测公式。例如用特征量提取公式的线性组合表示预测公式。在此情形中,通过使用统计方法(诸如线性回归等)根据与同一预测基础数据和预测数据相对应的特征量组来计算组合系数。
此外,机器学习单元136通过使用AIC(赤池信息准则)、BIC(贝叶斯信息准则)等来执行对预测公式的评价,以及对形成预测公式的特征量提取公式执行选择、交叉(特征交换)和突变中的每个处理以使得评价将会高。通过这些处理来创建要作为形成预测公式的元素的特征量提取公式的新组合(下一代)。随后,机器学习单元136通过使用特征量提取公式的新组合来评价预测公式,以及通过选择、交叉和突变中的每个处理来更新(换代)特征量提取公式的组合以使得评价将会更高。
在重复换代直到评价不再改变之后,机器学习单元136针对评价最高的预测公式基于预测公式中包括的每个特征量提取公式的组合系数来计算每个特征量提取公式对预测公式的贡献率。此外,机器学习单元136把特征量提取公式的贡献率相加并计算对预测公式的总贡献率。使用此总贡献率作为预测公式的评价值。当通过机器学习单元136的功能计算了评价值时,预测器构建单元106判定评价值是否满足预定终止条件。在预测值满足终止条件的情形中,预测器构建单元106把预测公式输入到预测单元108作为预测器。
另一方面,在评价值不满足预定终止条件的情形中,预测器构建单元106通过再次使用特征量提取公式列表创建单元132、特征量计算单元134和机器学习单元136的功能以及使用由机器学习单元136计算出的每个特征量提取公式的贡献率,来通过基于遗传算法的机器学习创建新的预测公式。此时,预测器构建单元106把预测公式中包括的特征量提取公式作为下一代(第二代)特征量提取公式,并且把特征量提取公式的组合输入到特征量提取公式列表创建单元132。
特征量提取公式列表创建单元132从第二代特征量提取公式中选择贡献率高的特征量提取公式、在特征量提取公式之间交换形成元素(处理函数)、随机改变特征量提取公式的形成元素或者通过随机组合处理函数创建新的特征量提取公式。随后,特征量提取公式列表创建单元132通过根据第二代特征量提取公式获得的特征量提取公式以及新创建的特征量提取公式来创建第二代特征量提取公式列表。随后,把第二代特征量提取公式列表输入到特征量计算单元134。
特征量计算单元134对第二代特征量提取公式列表的处理以及机器学习单元136对处理结果的处理是与特征量提取公式列表创建单元132首次随机创建的特征量提取公式的处理基本上相同的。即,通过已经描述的特征量计算单元134和机器学习单元136的功能对第二代特征量提取公式列表执行各种类型的处理,通过机器学习单元136创建预测公式和第三代特征量提取公式。此外,机器学习单元136计算每个第三代特征量提取公式对预测公式的贡献率以及预测公式的评价值。
随后,预测器构建单元106基于由机器学习单元136计算出的预测公式的评价值来判定是否满足终止条件。在评价值满足终止条件的情形中,预测器构建单元106把预测公式输入到预测单元108作为预测器。
另一方面,在评价值不满足预定终止条件的情形中,预测器构建单元106通过再次使用特征量提取公式列表创建单元132、特征量计算单元134和机器学习单元136的功能以及使用机器学习单元136计算出的每个特征量提取公式的贡献率,来通过基于遗传算法的机器学习创建新的预测公式。此时,预测器构建单元106把预测公式中包括的特征量提取公式作为下一代(第三代)特征量提取公式,以及把特征量提取公式的组合输入到特征量提取公式列表创建单元132。另外,预测器构建单元106对第三代特征量提取公式的处理与对第二代特征量提取公式的处理基本上相同。
此外,预测器构建单元106在从第三代、第四代、...、至第N代重复换代的情况下重复执行已经描述的处理,直到机器学习单元136相继创建的预测公式中一个预测公式的评价值满足终止条件为止。随后,预测器构建单元106在机器学习单元136计算出的预测公式的评价值满足终止条件的时间点结束换代,并且输出预测公式作为评价器。以此方式,预测器构建单元106通过使用遗传算法来构建高度准确的预测器。另外,与预测器构建单元106的操作有关的算法将在后面进行更详细的描述。
现在,作为实际期望预测的预测数据的基础的预测基础数据输入到预测单元108。例如,如图4中所示,把从时刻t-w至t-1的观测值输入到预测单元108作为预测基础数据(C)。因此,预测单元108把预测基础数据从预测器构建单元106输入到预测器输入,并预测可以在下一时刻观测到的观测数据(预测数据)。例如,在预测基础数据是从时刻t-w至t-1的观测值的情形中,将会从预测器针对此预测基础数据的输入来输出可以在时刻t观测到的观测值作为预测数据(D)。
此外,预测器108把从时刻t-w+1至t-1的观测值以及与从预测器输出的时刻t的观测值相对应的预测值输入到预测器作为预测基础数据,并计算与时刻t+1相对应的预测值。随后,如图5中所示,预测单元108通过在相继改变要输入到预测器的预测基础数据的时间范围的情况下重复使用预测器来预测可到未来某个时刻为止观测到的观测数据的时序数据。
在图5的示例中,首先,预测器使用在直到时刻j为止的预定时间内观测到的观测值1至K作为预测基础数据的初始值(预测基础数据1),以及把时刻j+1的观测值1至K计算为预测数据1。接下来,预测器使用在直到时刻j+1为止的预定时间内观测到的观测值1至K作为预测基础数据2,以及把在时刻j+2观测到的观测值1至K计算为预测数据2。此后重复执行相同的处理,作为结果,获得预测数据1至f。在此情形中,如图6中所示,预测单元108输出预测数据1至f作为预测值。另外,例如向外部输出、保存或者在屏幕上显示预测数据1至f。
至此,已描述了根据本实施例的信息处理设备100的功能配置。另外,在以上说明中,预测单元108被配置成通过重复使用同一预测器来计算预测值。然而,根据本实施例的信息处理设备100的配置不限于此,在计算了预测值之后输入新观测值的情形中,信息处理设备100可以通过预测器构建单元106的功能来更新预测器并通过使用更新后的预测器来计算用于新观测值和随后观测值的预测值。此外,可以通过使用预测值来执行预测器的更新。这样的修改也包括在本实施例的技术范围中。
<1-2:观测值预测方法的概述>
接下来,在详细描述预测器自动构建以及与后面要描述的预测有关的算法之前,将浏览在算法中执行的处理的整体流程以帮助理解算法的整体情况。
根据本实施例的观测值预测方法被大致划分为预测器的自动构建方法以及使用预测器的预测方法。预测器的自动构建方法是通过基于遗传算法的机器学习来创建如下这种预测器的方法:该预测器根据迄今为止的观测值来计算可在未来观测到的观测值。使用预测器的预测方法就其本身而言是通过重复使用预测器来计算时序数据形式的未来观测值的方法。
根据预测器的自动构建方法的处理以如图2中所示的观测值的输入开始(步骤1)。如图3中所示,当输入了观测值时,根据输入的观测值来创建用于预测器构建的数据集(步骤2)。根据从观测值中提取的预定时间长度的预测基础数据以及与预测基础数据之后的时刻相对应的预测数据来形成用于预测器构建的数据集。可以根据算法的执行效率或其执行环境酌情由用户任意确定或者可以自动选择该预定时间长度。如图4的(A)和(B)中所示,当创建了用于预测器构建的数据集时,通过使用用于预测器构建的所创建的数据集通过遗传搜索方法(基于遗传算法的机器学习)来自动构建预测器(步骤3)。
步骤1至3是根据预测器的自动构建方法的主要处理内容。在根据使用预测器的预测方法的步骤4和5的处理中使用通过步骤3创建的预测器。
如图4的(C)中所示,根据使用预测器的预测方法的处理开始于把要作为预测基础数据的观测值输入到预测器。如图4的(B)中所示,当输入观测值时,预测器输出与继输入的观测值之后的时刻相对应的观测值的预测值。随后,如图5中所示,通过向预测器输入预测器的输出和输入的观测值作为预测基础数据,计算下一观测值(步骤4)。此外,通过重复使用预测器,计算如图6中所示的未来时序数据。输出计算出的该未来时序数据作为预测值(步骤5)。
至此,已大致描述了根据本实施例的观测值预测方法。
<1-3:算法的细节>
接下来,将详细描述用于实现根据本实施例的观测值预测方法的算法。
(1-3-1:整体流程)
首先,将参照图7描述根据本实施例观测值预测方法的处理的整体流程。图7是示出了根据按照本实施例的观测值预测方法的处理的整体流程的说明图。另外,由上述信息处理设备100执行此处描述的处理。
如图7中所示,首先,信息处理设备100使用观测值输入单元102的功能以及把观测值输入到预测器构建数据准备单元104(步骤1)。接下来,信息处理设备100使用预测器构建数据准备单元104的功能并通过使用输入的观测值来准备用于预测器构建的数据集(步骤2)。
接下来,信息处理设备100使用预测器构建单元106的功能并使用用于预测器构建的数据集通过基于遗传算法的机器学习自动构建预测器(步骤3)。随后,信息处理设备100使用预测单元108的功能并通过重复使用预测器来计算可在未来观测到的观测值的预测值(步骤4)。随后,信息处理设备100输出通过使用预测单元108的功能计算出的预测值(步骤5)。
至此,描述了根据本实施例的观测值预测方法的处理的整体流程。
(1-3-2:用于预测器构建的数据集的准备)
接下来,将参照图8描述图7中的步骤2对应的用于预测器构建的数据集的准备处理的流程。图8是示出了图7中的步骤2对应的用于预测器构建的数据集的准备处理的流程的说明图。
通过预测器构建数据准备单元104的功能来执行此处描述的用于预测器构建的数据集的准备处理。另外,假定在步骤1中把在时刻t=1至j-w观测到的观测值1至K输入到预测器构建数据准备单元104。另外,假定把预测基础数据的时间长度设置为预定值w。
如图8中所示,预测器构建数据准备单元104对与时刻t=1至j-w相对应的观测值中的每个观测值连续执行如下处理(S202、S208;观测值的时间循环)。
首先,预测器构建数据准备单元104把参数q设置为1(S202)。随后,预测器构建数据准备单元104取出从时刻q至q+w-1的观测值1至K作为预测基础数据Dq(S204)。随后,预测器构建数据准备单元104取出时刻q+w的观测值1至K作为预测数据Dq(S206)。
接下来,预测器构建数据准备单元104在使参数q递增1的情况下重复执行步骤S204和206的处理。当对于参数q=1至j-w执行了步骤S204和206的处理时,预测器构建数据准备单元104把用于预测器构建的数据集输入到预测器构建单元106。随后,预测器构建数据准备单元104结束用于预测器构建的数据集的准备处理。
至此,描述了用于预测器构建的数据集的准备处理的流程。
(1-3-3:预测器的自动构建)
接下来,将参照图9至图22描述图7中的步骤3对应的预测器的自动构建处理的流程。图9至图22是示出与图7中的步骤3相对应的预测器的自动构建处理的流程的说明图。通过预测器构建单元106的功能执行此处描述的预测器的自动构建处理。
(整体流程)
如图9中所示,首先,预测器构建单元106使用特征量提取公式列表创建单元132的功能并通过随机组合处理函数来创建特征量提取公式列表(S302)。接下来,预测器构建单元106使用特征量计算单元134的功能并通过使用用于预测器构建的数据集以及特征量提取公式列表中包括的每个特征量提取公式来计算特征量(S304)。随后,预测器构建单元106使用机器学习单元136的功能并使用用于预测器构建的数据集中的预测数据以及特征量通过基于遗传算法的机器学习来创建通过组合特征量提取公式而创建的预测公式(S306)。
接下来,预测器构建单元106通过使用机器学习单元136的功能来计算预测公式中包括的特征量提取公式(第二代特征量提取公式)对预测公式的贡献率以及基于贡献率对预测公式的评价值,以及基于评价值对终止条件做出判定(S308)。在步骤S308中满足终止条件的情形中,预测器构建单元106输出预测公式作为预测器(S310)。另一方面,在评价值不满足终止条件的情形中,预测器构建单元106通过特征量提取公式列表创建单元132的功能基于遗传算法根据第二代特征量提取公式来创建第二代特征量提取公式列表(S302)。
接下来,预测器构建单元106通过基于第二代特征量提取公式列表执行步骤S304至S310的处理来创建预测公式,并计算其评价值(S304至S310)。在评价值满足终止条件的情形中,预测器构建单元106输出预测公式作为预测器。另一方面,在评价值不满足终止条件的情形中,预测器构建单元106以与对第二代特征量提取公式类似的方式再次执行步骤S302至S306的处理。以此方式重复换代直到预测公式的评价值满足终止条件。随后,在预测值的评价值满足终止条件的时间点,输出预测公式作为预测器。
下面,将详细描述步骤S302、S304和S306的处理。另外,以上提到的终止条件是用户执行结束运算或者上一代的预测器足够准确(评价值足以在预定值以上)。
(S302:特征量提取公式列表的创建)
首先,将参照图10至图18更详细地描述步骤S302的处理。主要通过特征量提取公式列表创建单元132的功能来执行此处执行的处理。
如图10中所示,特征量提取公式列表创建单元132判定要在步骤S302中创建的特征量提取公式列表是否是第二代或更后代的特征量提取公式列表(S3002)。在创建第二代或更后代的特征量提取公式列表的情形中,特征量提取公式列表创建单元132使处理进行到步骤S3006。另一方面,在创建第一代特征量提取公式列表的情形中,特征量提取公式列表创建单元132使处理进行到步骤S3004。
在处理进行到步骤S3004的情形中,特征量提取公式列表创建单元132通过随机组合预先准备的处理函数(后面描述的运算符和处理目标轴)创建特征量提取公式列表(S3004)。另一方面,在处理进行到步骤S3006的情形中,特征量提取公式列表创建单元132通过把下一代特征量提取公式输入到遗传算法中来创建下一代特征量提取公式列表(S3006)。把步骤S3004或S3006中创建的特征量提取公式列表输入到特征量计算单元134。随后,预测器构建单元106使处理进行到步骤S306。
(S3004(参看S302):特征量提取公式列表的随机创建)
此处,将参照图11更详细地描述根据以上提到的步骤S3004的处理。另外,假定把特征量提取公式列表中包括的特征量提取公式的数量预先设置为m。
首先,在步骤S3004中,特征量提取公式列表创建单元132把通过随机组合处理函数获得的特征量提取公式的创建处理重复m次(S3012、S3016)。即,特征量提取公式列表创建单元132在使参数M从1递增至m的情况下重复执行步骤S3014的处理。首先,特征量提取公式列表创建单元132把参数M设置为1(S3012),并通过随机组合处理函数创建特征量提取公式(S3014)。
接下来,特征量提取公式列表创建单元132使参数M递增1并再次执行步骤S3014的处理(S3016)。在重复执行步骤S3014的处理直到参数M达到m为止之后,特征量提取公式列表创建单元132把通过步骤S3014的处理创建的m个特征量提取公式(特征量提取公式列表)输入到特征量计算单元134。随后,特征量提取公式列表创建单元132结束步骤S3004的处理。
(S3014(参见S3004):特征量提取公式的随机创建)
此处,将参照图12更详细地描述根据以上提到的步骤S3014的处理。另外,假定预先设置用于特征量提取公式构建的处理函数(处理目标轴、运算符)。此外,处理目标轴此处意思是要作为运算目标的坐标轴,诸如,观测值的类型、位置、频率或者时间。即,通过处理目标轴指定关于如下内容的信息:要沿着什么坐标轴执行根据运算符的运算。
此外,此处的运算符是表明处理内容的运算符。可以通过使用各种类型的运算符(诸如微分运算、最大值输出、低通滤波器、高通滤波器、均方差、快速傅立叶变换或绝对值输出等)构建特征量提取公式。另外,根据运算符的类型,指定运算参数作为运算符。例如,在低通滤波器或高通滤波器的情形中,指定用于指定阻带或通带的参数。此外,除了处理函数之外,特征量提取公式中还可以包括表示要作为处理目标的数据的类型的信息(在下文中,类型信息)。
首先,在步骤S3014中,特征量提取公式列表创建单元132随机确定输入数据的类型(类型信息)(S3022)。然而,在输入数据的类型是一个的情形中,可以跳过步骤S3014的处理。接下来,特征量提取公式列表创建单元132随机确定用于构建特征量提取公式的运算符(处理函数)和处理目标轴的组合(S3024)。随后,特征量提取公式列表创建单元132通过组合已随机确定的处理函数来创建特征量提取公式,以及判定特征量提取公式的输出是否是一个值(标量)(S3026)。
在特征量提取公式的输出在步骤S3026中成为一个值的情形中,特征量提取公式列表创建单元132使处理进行到图11中的步骤S3016。另一方面,在特征量提取公式的输出未成为一个值的情形中,特征量提取公式列表创建单元132使处理返回步骤S3024,并通过随机确定处理函数再次创建特征量提取公式。
(S3006(参见S302):根据遗传算法的特征量提取公式创建)
此处,将参照图13更详细地描述根据以上提到的步骤S3006的处理。
另外,假定把第g(g≥2)代特征量提取公式输入到特征量提取公式列表创建单元132。另外,假定要通过步骤S3006中执行的选择运算创建的特征量提取公式的数量是ms,要通过交叉运算创建的特征量提取公式的数量是mx,要通过突变创建的特征量提取公式的数量是mm,要随机创建的特征量提取公式的数量是mr。此外,假定特征量提取公式列表中要包括的特征量提取公式的数量是m。
首先,特征量提取公式列表创建单元132确定选择数量ms、交叉数量mx、突变数量mm和随机创建数量mr(S3032)。另外,选择数量ms、交叉数量mx、突变数量mm和随机创建数量mr可以随机确定以满足m=ms+mx+mm+mr或者可以预先部分或全部确定,或者可以基于对第g代特征量提取公式的贡献率确定选择数量ms以及可以根据选择数量ms随机确定交叉数量mx、突变数量mm和随机创建数量mr。
当确定了选择数量ms、交叉数量mx和突变数量mm时,特征量提取公式列表创建单元132从第g代特征量提取公式中选择贡献率最高的ms个特征量提取公式并把其添加到特征量提取公式列表(S3034)。接下来,特征量提取公式列表创建单元132交换第g代特征量提取公式之间处理函数的一部分,创建mx个新的特征量提取公式,以及将其添加到特征量提取公式列表(S3036)。
接下来,特征量提取公式列表创建单元132从第g代特征量提取公式中选择mm个特征量提取公式,随机改变组建特征量提取公式的处理函数的一部分,以及把改变之后的特征量提取公式添加到特征量提取公式列表(S3038)。接下来,特征量提取公式列表创建单元132随机创建mr个特征量提取公式,以及将其添加到特征量提取公式列表(S3040)。当步骤S3032至S3040的处理完成时,特征量提取公式列表创建单元132把包括m个特征量提取公式的特征量提取公式列表输入到特征量计算单元134。随后,预测器构建单元106使处理进行到步骤S304。
(S3034(参见S3006):选择)
此处,将参照图14更详细地描述根据以上提到的步骤S3034的处理(选择处理)。另外,此处执行的选择处理是与以下机制相对应的遗传算法的特征处理之一:在把特征量提取公式作为活体以及把处理函数作为基因时,具有上等基因的活体在进化过程中存活的概率较高。
如图14中所示,首先,特征量提取公式列表创建单元132按后面描述的贡献率的降序来排列第g代特征量提取公式(S3042)。接下来,特征量提取公式列表创建单元132按贡献率的降序向特征量提取公式列表添加排在顶部的ms个特征量提取公式(S3044)。随后,特征量提取公式列表创建单元132使处理进行到步骤S3036。
(S3036(参见S3006):交叉)
此处,将参照图15更详细地描述根据以上提到的步骤S3036的处理(交叉处理)。另外,此处执行的交叉处理是与以下机制相对应的遗传算法的特征处理之一:在把特征量提取公式作为活体以及把处理函数作为基因时,在进化过程中部分地交换活体的基因以及产生具有新基因组合的活体。
如图15中所示,特征量提取公式列表创建单元132在从1至mx改变用于指定要通过交叉处理创建的特征量提取公式的索引MX的情况下(S3052、S3062)重复执行步骤S3054至S3060的处理mx次。首先,特征量提取公式列表创建单元132把索引MX设置为1,以及使处理进行到步骤S3054(S3052)。当处理进行到步骤S3054时,特征量提取公式列表创建单元132基于贡献率从第g代特征量提取公式中选择一个特征量提取公式(公式A)(S3054)。
接下来,特征量提取公式列表创建单元132基于贡献率从第g代特征量提取公式中选择一个特征量提取公式(公式B)(S3056)。随后,特征量提取公式列表创建单元132通过交换步骤S3054中选择的公式A中包括的处理函数的一部分以及步骤S3056中选择的公式B中包括的处理函数的一部分来创建新的特征量提取公式(S3058)。随后,特征量提取公式列表创建单元132把步骤S3058中创建的新的特征量提取公式添加到特征量提取公式列表(S3060)。
在执行步骤S3054至S3060的处理之后,特征量提取公式列表创建单元132使索引MX递增1,以及再次执行步骤S3054至S3060的处理。特征量提取公式列表创建单元132重复步骤S3054至S3060的处理直到索引MX达到mx为止,并创建mx个特征量提取公式。随后,特征量提取公式列表创建单元132使处理进行到步骤S3038。
(S3054、S3056(参见S3036):特征量提取公式的选择)
此处,将参照图16更详细地描述根据以上提到的步骤S3054和S3056的处理。
如图16中所示,特征量提取公式列表创建单元132首先对每个特征量提取公式的选择概率进行加权,以使得特征量提取公式的贡献率越高,特征量提取公式被选择的概率越高,以及随后从第g代特征量提取公式中选择一个特征量提取公式(S3072)。随后,特征量提取公式列表创建单元132判定所选择的特征量提取公式是否是已经针对交叉处理选择了的特征量提取公式(S3074)。
在特征量提取公式是已经对交叉处理选择了的特征量提取公式的情形中,特征量提取公式列表创建单元132使处理进行到步骤S3076。另一方面,在特征量提取公式并非是已经对交叉处理选择了的特征量提取公式的情形中,特征量提取公式列表创建单元132使处理进行到形成步骤S3036的下一处理步骤(S3056(在S3054的情形中)或S3058(在S3056的情形中))。
在处理进行到步骤S3076的情形中,特征量提取公式列表创建单元132判定是否已经选择了同一特征量提取公式(S3076)。在已经选择了同一特征量提取公式的情形中,特征量提取公式列表创建单元132使处理再次返回步骤S3072,以及新选择一个特征量提取公式(S3072)。另一方面,在并未选择同一特征量提取公式的情形中,特征量提取公式列表创建单元132使处理进行到形成步骤S3036的下一处理步骤(S3056(在S3054的情形中)或S3058(在S3056的情形中))。
(S3038(参见S3006):突变)
此处,将参照图17更详细地描述根据以上提到的步骤S3038的处理(突变处理)。另外,此处执行的突变处理是与以下机制相对应的遗传算法的特征处理之一:在把特征量提取公式作为活体以及把处理函数作为基因时,在进化过程中部分地使活体的基因突变以及生成具有新基因组合的活体。
如图17中所示,特征量提取公式列表创建单元132在使索引MM从1递增至mm的情况下(S3082、S3090)重复执行步骤S3084至S3088的处理,以及创建mm个特征量提取公式。首先,特征量提取公式列表创建单元132把索引MM设置为1(S3082),以及从第g代特征量提取公式中选择一个特征量提取公式(公式A)(S3084)。此时,特征量提取公式列表创建单元132执行与图16中所示步骤S3054的处理相同的处理以及基于特征量提取公式的贡献率选择一个特征量提取公式(公式A)。
接下来,特征量提取公式列表创建单元132把特征量提取公式中包括的处理函数的一部分变成随机选择的处理函数,并创建新的特征量提取公式(S3086)。随后,特征量提取公式列表创建单元132把步骤S3086中创建的新特征量提取公式添加到特征量提取公式列表(S3088)。随后,特征量提取公式列表创建单元132使索引MM递增1,以及再次执行步骤S3084至S3088的处理(S3090)。
接下来,特征量提取公式列表创建单元132重复执行步骤S3084至S3088的处理直到索引MM达到mm为止,并创建mm个特征量提取公式。随后,特征量提取公式列表创建单元132使处理进行到步骤S3040。
(S3040(参见S3006):随机创建)
此处,将参照图18更详细地描述根据以上提到的步骤S3040的处理(随机创建处理)。
如图18中所示,特征量提取公式列表创建单元132在使索引MR从1递增至mr的情况下(S3092、S3098)重复执行步骤S3094至S3096的处理,并创建mr个特征量提取公式。首先,特征量提取公式列表创建单元132把索引MR设置为1(S3092),并通过随机组合处理函数来创建新的特征量提取公式(S3094)。
接下来,特征量提取公式列表创建单元132把步骤S3092中创建的新的特征量提取公式添加到特征量提取公式列表(S3096)。随后,特征量提取公式列表创建单元132使MR递增1,并再次执行步骤S3094和S3096的处理(S3098)。随后,特征量提取公式列表创建单元132重复执行步骤S3094和S3096的处理直到索引MR达到mr为止,并创建mr个特征量提取公式。另外,每个特征量提取公式被创建为使得输出将会是标量。
当步骤S3040的处理完成时,步骤S3006的处理完成。把包括通过步骤S3034、S3036、S3038和S3040创建的总共m个特征量提取公式的特征量提取公式列表输入到特征量计算单元134。随后,如图9中所示,预测器构建单元106使处理进行到步骤S304。
(S304:特征量的计算)
接下来,将参照图19更详细地描述步骤S304的处理。主要通过特征量计算单元134的功能来执行此处执行的处理。另外,假定把步骤S3004或S3006中创建的特征量提取公式列表从特征量提取公式列表创建单元132输入到特征量计算单元134。还假定此特征量提取公式列表包括m个特征量提取公式。
如图19中所示,特征量计算单元134在从1至m更新索引M(S3102、S3110)的情况下重复执行步骤S3104至S3108的处理。另外,特征量计算单元134在从1至d更新索引q(S3104、S3108)的情况下重复执行步骤S3106的处理。
首先,特征量计算单元134把索引M设置为1并且使处理进行到步骤S3104(S3102)。接下来,特征量计算单元134把索引q设置为1并且使处理进行到步骤S3106(S3104)。
接下来,特征量计算单元134把从时刻q至q+w-1的预测基础数据Dq输入到特征量提取公式[M]中并计算特征量(S3106)。此处,特征量提取公式[M]意思是特征量提取公式列表中包括的特征量提取公式之中的第M个特征量提取公式。随后,特征量计算单元134使处理返回步骤S3104(S3108),使索引q递增1(S3104),以及使处理再次进行到步骤S3106。
随后,特征量计算单元134重复执行步骤S3104至S3108的处理直到索引q达到d为止,以及计算通过把预测基础数据Dq(q=1、...、d)输入到特征量提取公式[M]中获得的特征量[M][q]。
接下来,特征量计算单元134使处理进行到步骤S3110,以及使处理返回步骤S3102(S3110)。随后,特征量计算单元134使索引M递增1(S3102),使处理再次进行到步骤S3104,以及重复执行步骤S3104至S3108的处理。
特征量计算单元134重复执行步骤S3104至S3108的处理直到索引M达到m为止,以及计算通过把预测基础数据Dq(q=1、...、d)输入到特征量提取公式[M]中获得的特征量[M][q](M=1、...、m;q=1、...、d)。
以此方式,在步骤S304中,特征量计算单元134通过把预测基础数据Dq(q=1、...、d)输入到每个特征量提取公式[M](M=1、...、m)中来计算特征量[M][q](M=1、...、m;q=1、...、d)。此外,把通过步骤S304的处理计算出的特征量[M][q]输入到机器学习单元136。随后,如图9中所示,预测器构建单元106使处理进行到步骤S306。
(S306:机器学习)
接下来,将参照图20更详细地描述步骤S306的处理。主要通过机器学习单元136的功能来执行此处执行的处理。另外,假定把特征量[M][q](M=1、...、m;q=1、...、d)从特征量计算单元134输入到机器学习单元136。还假定把预测数据Dq(q=1、...、d)输入到机器学习单元136。
如图20中所示,机器学习单元136在使索引x从1递增至K的情况下(S3112、S3116)重复执行步骤S3114的处理。首先,机器学习单元136把索引x设置为1(S3112),以及使处理进行到步骤S3114。接下来,机器学习单元136通过使用与观测值x对应的预测数据Dq和特征量[M][q]来执行机器学习,并计算用于观测值x的预测公式(S3114)。在通过线性组合多个特征量提取公式来创建预测公式的情形中,在步骤S3114中计算每个组合系数。
接下来,机器学习单元136使处理返回步骤S3112(S3116),使索引x递增1(S3112),以及执行步骤S3114的处理。此外,机器学习单元136重复执行步骤S3114的处理直到索引x达到K为止,以及创建用于观测值1至K中每个观测值的预测公式。
接下来,机器学习单元136计算每个特征量提取公式对步骤S3112至S3116中构建的预测公式的贡献率(S3118)。此时,机器学习单元136基于预测公式中包括的每个特征量提取公式的组合系数来计算每个特征量提取公式对预测公式的贡献率。随后,如图9中所示,预测器构建单元106使处理进行到步骤S308。
(S3114(参见S306):通过机器学习对预测器的创建)
此处,将参照图21更详细地描述根据以上提到的步骤S3114的处理。
如图21中所示,机器学习单元136从特征量提取公式列表中随机选择要用于创建预测公式的特征量提取公式,以及创建初始群体(第一代基因)(S3122)。此处,假定预先把形成初始群体的特征量提取公式的数量设置为p。随后,机器学习单元136在从1至p更新索引P的情况下重复执行步骤S3126和S3128的处理。
首先,机器学习单元136把索引P设置为1,以及使处理进行到步骤S3126(S3124)。随后,机器学习单元136通过基于特征量计算单元134针对初始群体中包括的特征量提取公式以及预测基础数据所计算出的特征量执行线性回归和确定,来创建用于观测值1至K中每个观测值的预测公式(S3126)。接下来,机器学习单元136通过使用AIC来评价步骤S3126中创建的预测公式(S3128)。
接下来,机器学习单元136使处理返回步骤S3124(S3130),使索引P递增1以及使处理进行到步骤S3126(S3124)。随后,机器学习单元136再次执行步骤S3126和S3128的处理。随后,机器学习单元136重复步骤S3126和S3128的处理直到索引P达到p为止,以及使处理进行到步骤S3132。
当处理进行到步骤S3132时,机器学习单元136使用AIC作为评价值,以及通过选择、交叉和突变来改变用于创建预测公式的特征量提取公式的组合(S3132)。即,在步骤S3132中,机器学习单元136根据第一代基因来创建第二代基因。
接下来,机器学习单元136判定是否历经预定数量的世代仍未更新最佳基因的评价值(S3134)。在情况并非是历经预定数量的世代仍未更新最佳基因的评价值的情形中,机器学习单元136使处理返回步骤S3124,并再次执行步骤S3124至S3134的处理。
另一方面,如图20中所示,在历经预定数量的世代仍未更新最佳基因的评价值的情形中,机器学习单元136使处理进行到步骤S116。此外,当步骤S3112至S3116的重复处理完成时,机器学习单元136使处理进行到步骤S3118。
(S3118(参见S306):贡献率的计算)
此处,将参照图22更详细地描述根据以上提到的步骤S3118的处理。
如图22中所示,机器学习单元136把总贡献率Cont[M]初始化成0(S3142)。接下来,机器学习单元136在从1至K更新索引x的情况下(S3144、S3152)重复执行步骤S3146至S3150的处理。另外,在处理进行到步骤S3146的情形中,机器学习单元136在从1至m更新索引M的情况下重复执行步骤S3148的处理。
在步骤S3148中,机器学习单元136首先针对观测值x计算特征量提取公式[M]对预测公式的贡献率。基于创建预测公式时对每个观测值计算出的特征量提取公式[M]的组合系数计算此贡献率。例如,贡献率是包括组合系数的平方的值。另外,预测公式中未包括的特征量提取公式的贡献率是0。接下来,机器学习单元136计算总贡献率Cont[M]=Cont[M]+特征量提取公式[M]对观测值x的贡献率(S3148)。
通过重复步骤S3144至S3152的处理以及重复步骤S3146至S3150的处理,将会对特征量提取公式列表中包括的所有特征量提取公式计算每个特征量提取公式对观测值1至K的总贡献率Cont[M]。将会使用在步骤S3118中计算出的每个特征量提取公式的总贡献率Cont[M]作为对预测公式的评价值。当步骤S3118的处理完成时,机器学习单元136结束步骤S306的处理。
至此,描述了预测器的自动构建处理的流程。
(1-3-4:通过预测器对观测值的预测)
接下来,将参照图23描述与图7中的步骤4对应的通过预测器对观测值的预测处理的流程。图23是示出与图7中的步骤4相对应的通过预测器对观测值的预测处理的流程的说明图。另外,由预测单元108执行此处描述的处理。另外,假定预测单元108具有从预测器构建单元106到预测单元108的预测器输入的预测器。
如图23中所示,预测单元108在从1至f更新索引F的情况下(S402、S408)重复执行步骤S404和S406的处理。在步骤S404中,预测单元108取出时刻j+F-w至j+F-1的观测值作为预测基础数据DF(S404)。接下来,预测单元108把预测基础数据DF输入到预测器并计算可在时刻j+F观测到的预测值(预测数据DF)(S406)。随后,通过在更新索引F的情况下重复执行步骤S404和S406的处理,计算从时刻j至j+f的预测值,如图6中所示。
至此,描述了通过预测器对观测值的预测处理的流程。
如上所述,当采用根据本实施例的技术时,可以高度准确地自动构建通过基于遗传算法的机器学习根据过去观测值预测未来观测值的预测器。此外,可以通过重复使用此预测器来预测未来观测值。随后,用户不必从观测值中取出用于预测的适当数据、处理该数据或者构建预测模型。
<1-4:实验1(应用于单摆)>
此处,将在图24和图25中示出把根据本实施例的预测算法应用于具体示例(通过扭矩驱动的单摆的运动预测)的实验(在下文中,实验1)的结果。
如图24中所示,实验1的条件如下。
(条件1)执行通过扭矩驱动的二维单摆的运动预测。
(条件2)扭矩是-1、0和+1中的任何一项。
(条件3)观测值是扭矩、角度和角速度。
(仅扭矩和角度被用于学习。)
(条件4)扭矩每30个周期随机改变一次。
(条件5)把100,000个步骤的观测值用于学习。
(预测基础数据的时间宽度是10个步骤。)
图25中示出了实验结果。图25示出了在通过使用用于通过以上提到的扭矩驱动的二维单摆的算法实际移动的单摆的运动(观测值)与通过使用预测器预测的单摆的运动(预测值)之间比较的结果。为了定量地比较这二者,图25中示出了观测值与预测值之间的相关值。如图25中所示,相关值随着时间接近于1,并在一定时间逝去之后变得大致为1。即,可以看出以足够高的准确度预测了单摆的运动。
此外,图25中还示出了用于预测器构建的特征量的数量。参考特征量数量的改变,可以看出特征量的数量随着时间的过去逐渐减小。即,可以看出,紧接开始预测处理之后,用大量特征量预测观测值的改变,但是随学习的进展,可以用越来越少的特征量预测观测值的改变。
<1-5:实验2(应用于二维细胞自动机)>
接下来,将在图26和图27中示出把根据本实施例的预测算法应用于另一具体示例(二维细胞自动机)的实验(在下文中,实验2)的结果。
如图26中所示,实验2的条件如下。
(条件1)在相邻3×3的区域内具有两个或三个活细胞的活细胞成活。
(条件2)在相邻3×3的区域内具有三个活细胞的死细胞变活。
使用在32×24个细胞内改变的10个步骤的活细胞的模式(在下文中,细胞模式)用于学习。然而,并非学习所有的32×24个细胞,如图26中所示,使5×5个细胞(输入矩阵)作为输入的目标以及使中心细胞的成活/死亡作为预测的目标,自动构建下一次预测中心细胞成活/死亡的预测器,通过使用预测器来执行细胞模式的预测处理。
图27中示出了实验结果。图27示出了通过使用用于以上提到的二维细胞自动机的算法实际改变的细胞模式(观测值)与通过使用预测器预测的细胞模式(预测值)之间比较的结果。为了定量地比较这二者,图27中示出了活细胞的预测F值。如图27中所示,F值随着时间接近于1,以及在一定时间逝去之后变得大致为1。即,可以看出以足够高的准确度预测了细胞模式的改变。
此外,图27中还示出了用于预测器构建的特征量的数量。参考特征量数量的改变,可以看出特征量的数量在一定量的时间逝去后的时间点减小。即,可以看出,紧接开始预测处理之后,用大量特征量预测观测值,但是随学习进行,可以用越来越少的特征量预测观测值。
<1-6:实验3(应用于鸟群算法)>
接下来,将在图28和图29中示出把根据本实施例的预测算法应用于另一具体示例(鸟群算法Boids=Bird-oid(类鸟群))的实验(在下文中,实验3)的结果。
如图28中所示,实验3的条件如下。
(条件1)鸟朝着目的地前进。
(条件2)鸟试图与另一鸟分开以避免碰撞。
(条件3)鸟试图在与其它鸟同样的方向上飞行。
(条件4)鸟试图朝向鸟群的中央。
此外,以鸟朝着前进的目的地作为参考的相对坐标、鸟的加速历史、以及相对于其它鸟中每个鸟的相对坐标被用于学习。此外,随机改变目的地的地点。此外,把鸟的数量设置为20,把学习步骤的数量设置为1000。
图29中示出了实验结果。图29示出了通过使用以上提到鸟群算法实际改变的鸟群模式(观测值)与通过使用预测器预测的鸟群模式(预测值)之间比较的结果。为了定量地比较这二者,图29中示出了观测值与预测值之间的相关值。如图29中所示,相关值随着时间接近于1,虽然它瞬间不时地降低,但它在一定时间逝去之后变得大致为1。即,可以看出以足够高的准确度预测了鸟群模式的改变。
此外,图29中还示出了用于预测器构建的特征量的数量。参考特征量数量的改变,可以看出特征量的数量在一定时间逝去之后减小至一定程度。即,可以看出,紧接开始预测处理之后,用大量特征量预测观测值,但是随学习进行,可以用相对较小数量的特征量预测观测值。
至此,已描述了根据本实施例的预测方法、预测器的自动构建方法以及使用这些方法的实验结果。可以使用上述预测器的自动构建方法作为实现计算机图形真实背景图像(鸟的运动、树或云的移动、其它移动体的移动)的算法创建手段。如已描述了的,根据本实施例的预测器的自动构建算法可以在只是输入作为学习数据的观测值时自动构建适当的预测器。因此,可以减少创建用于创建背景图像的算法的麻烦。此外,预测器的操作本身得以用小的处理负荷实现,并且因此,可以足以由小型游戏机或小型视频装置执行。如所描述的,根据本实施例的技术从实用性的角度而言也是极其有益的技术。
<6:硬件配置>
此处,将描述上述信息处理设备100的硬件配置的示例。例如可以通过使用图30中所示的信息处理设备的硬件配置来实现上述信息处理设备100每个结构元件的功能。即,通过使用计算机程序控制图30中所示的硬件来实现结构元件中每个结构元件的功能。
如图30中所示,此硬件主要包括CPU902、ROM904、RAM906、主机总线908以及桥910。此外,此硬件包括外部总线912、接口914、输入单元916、输出单元918、存储单元920、驱动器922、连接端口924以及通信单元926。此外,CPU是中央处理单元的缩写。另外,ROM是只读存储器的缩写。此外,RAM是随机存取存储器的缩写。
CPU902例如作为算术处理单元或控制单元,以及基于ROM904、RAM906、存储单元920或者可移除记录介质928上记录的各种程序来控制每个结构元件的操作的一部分或全部操作。ROM904是用于存储例如CPU902上要加载的程序或者算术运算中使用的数据等的装置。RAM906暂时地或永久地存储例如CPU902上要加载的程序或者在程序执行中任意改变的各种参数等。
通过例如能够执行高速数据传输的主机总线908把这些结构元件彼此相连。就其本身而言,例如通过桥910把主机总线908连接到数据传输速度相对较低的外部总线912。此外,输入单元916是例如鼠标、键盘、触摸板、按钮、开关或者控制杆。另外,输入单元916可以是可以通过使用红外线或其它无线电波传输控制信号的远程控制器。
输出单元918是例如可以在视觉上或在听觉上把获取的信息通知用户的显示装置(诸如CRT、LCD、PDP或ELD等)、音频输出装置(诸如扬声器或耳机等)、打印机、移动电话或者传真机。此外,CRT是阴极射线管的缩写。LCD是液晶显示器的缩写。PDP是等离子显示面板的缩写。另外,ELD是电致发光显示器的缩写。
存储单元920是用于存储各种数据的装置。存储单元920是例如磁存储装置(诸如硬盘驱动器(HDD))、半导体存储装置、光学存储装置、或者磁光存储装置。HDD是硬盘驱动器的缩写。
驱动器922是这样的装置:该装置读取可移除记录介质928(诸如磁盘、光盘、磁光盘或半导体存储器等)上记录的信息,或者在可移除记录介质928中写入信息。可移除记录介质928是例如DVD介质、蓝光介质、HD-DVD介质、各种类型的半导体存储媒体等。当然,可移除记录介质928可以是例如其上装配了非接触式IC芯片的IC卡或者电子装置。IC是集成电路的缩写。
连接端口924是这样的端口:诸如USB端口、IEEE1394端口、SCSI、RS-232C端口,或者用于连接外部连接设备930(诸如光学音频终端等)的端口。外部连接设备930是例如打印机、移动音乐播放器、数码相机、数码摄像机或者IC记录器。此外,USB是通用串行总线的缩写。另外,SCSI是小型计算机系统接口的缩写。
通信单元926是用于连接到网络932的通信装置,以及是例如用于有线或无线LAN、蓝牙(注册商标)、或者WUSB的通信卡,光通信路由器,ADSL路由器,或者各种通信调制解调器。连接到通信单元926的网络932由有线连接或无线连接的网络配置成,以及例如是互联网、家用LAN、红外线通信、可见光通信、广播、或者卫星通信。此外,LAN是局域网的缩写。另外,WUSB是无线USB的缩写。此外,ADSL是非对称数字用户线的缩写。
<3:总结>
最后,将简要描述根据本发明实施例的技术内容。可以把此处叙述的技术内容应用于各种信息处理设备,诸如,个人计算机、游戏机等。
可以把上述信息处理设备的功能配置表示如下。信息处理设备包括:预测器构建单元,用于通过基于遗传算法的机器学习以及通过组合预先准备的处理函数来创建用于从在预定时刻之前观测到的观测值中提取观测值的特征量的多个特征量提取公式,以及基于通过多个特征量提取公式计算出的特征量来创建用于预测在预定时刻的观测值的预测公式;以及预测单元,用于使用由预测器构建单元创建的预测公式、根据在时刻t之前观测到的观测值来预测在时刻t的观测值。
根据此配置,可以直接使用观测值作为用于学习的数据,因此,可以减少从观测值中取出用于学习的适当数据或者把观测值处理成适当数据格式的麻烦。另外,自动创建预测公式而无需做出预测模型,由此使得对作为观测值基础的现象的建模或分析没有必要。此外,由于使用遗传算法,所以创建了能够用高准确度预测观测值的预测公式。
本领域技术人员应当理解,根据设计需要和其它因素,可以进行各种修改、组合、子组合和替换,只要它们在所附权利要求或其等同内容的范围内。
本申请包含的主题与2009年12月4日提交日本专利局的日本优先权专利申请JP2009-277084中公开的主题相关,其全部内容经引用而合并于此。

Claims (5)

1.一种用于基于预定时刻之前观测到的作为过去时序数据的观测值来预测在所述预定时刻的观测值的信息处理设备,包括:
预测器构建单元,用于通过基于遗传算法的机器学习以及通过组合预先准备的处理函数来创建用于从在预定时刻之前观测到的观测值中提取所述观测值的多个特征量的多个特征量提取公式,通过所述多个特征量提取公式的线性组合来创建用于预测在所述预定时刻的观测值的预测公式和向所述预测公式的每个特征量提取公式分配组合系数,基于所述组合系数计算每个特征量提取公式对所述预测公式的贡献率,计算对所述预测公式的总贡献率,并且判定总贡献率是否满足预定终止条件以确定是否将所述预测公式用于预测在所述预定时刻的观测值;以及
预测单元,用于使用由所述预测器构建单元创建的所述预测公式、根据在时刻t之前观测到的观测值来预测在时刻t的观测值。
2.根据权利要求1所述的信息处理设备,其中,在根据在时刻t之前观测到的观测值预测在时刻t的观测值之后,所述预测单元通过使用由所述预测器构建单元创建的所述预测公式以及所述多个特征量提取公式、根据预测出的在时刻t的观测值以及在时刻t之前观测到的观测值来预测要在继时刻t之后的时刻t’观测的观测值。
3.根据权利要求2所述的信息处理设备,还包括:
预测数据创建单元,所述预测数据创建单元准备与物体的运动相关的观测值在时刻t0的初始值,在把所述初始值作为第一输入的情况下对时刻t0之后的时刻tj相继地执行所述预测单元对观测值的预测处理,其中,j=1、......、N,以及创建在时刻t1至tN的观测值的预测数据;以及
运动模拟器,通过使用由所述预测数据创建单元创建的预测数据来模拟物理物体的运动。
4.根据权利要求2所述的信息处理设备,其中,在创建所述多个特征量提取公式和所述预测公式之后观测到新观测值的情况下,所述预测器构建单元基于创建出的预测公式和所述多个特征量提取公式,根据新观测到的观测值重新创建所述多个特征量提取公式和所述预测公式。
5.一种用于信息处理设备中的观测值预测方法,所述信息处理设备用于基于预定时刻之前观测到的作为过去时序数据的观测值来预测在所述预定时刻的观测值,所述观测值预测方法包括以下步骤:
通过基于遗传算法的机器学习以及通过组合预先准备的处理函数来创建用于从在预定时刻之前观测到的观测值中提取所述观测值的多个特征量的多个特征量提取公式;
通过所述多个特征量提取公式的线性组合来创建用于预测在所述预定时刻的观测值的预测公式和向所述预测公式的每个特征量提取公式分配组合系数;
基于所述组合系数计算每个特征量提取公式对所述预测公式的贡献率;
计算对所述预测公式的总贡献率;
判定总贡献率是否满足预定终止条件以确定是否将所述预测公式用于预测在所述预定时刻的观测值;以及
使用在所述创建步骤中创建的所述预测公式、根据在时刻t之前观测到的观测值来预测在时刻t的观测值。
CN201010570579.7A 2009-12-04 2010-11-26 信息处理设备和观测值预测方法 Expired - Fee Related CN102087721B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2009277084A JP2011118786A (ja) 2009-12-04 2009-12-04 情報処理装置、観測値予測方法、及びプログラム
JP2009-277084 2009-12-04

Publications (2)

Publication Number Publication Date
CN102087721A CN102087721A (zh) 2011-06-08
CN102087721B true CN102087721B (zh) 2015-04-01

Family

ID=44082983

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201010570579.7A Expired - Fee Related CN102087721B (zh) 2009-12-04 2010-11-26 信息处理设备和观测值预测方法

Country Status (3)

Country Link
US (1) US8635174B2 (zh)
JP (1) JP2011118786A (zh)
CN (1) CN102087721B (zh)

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5678620B2 (ja) * 2010-12-03 2015-03-04 株式会社日立製作所 データ処理方法、データ処理システム、及びデータ処理装置
US9063636B2 (en) 2013-06-10 2015-06-23 International Business Machines Corporation Management of input methods
JPWO2015037165A1 (ja) * 2013-09-12 2017-03-02 日本電気株式会社 情報処理装置、予測制御方法、及び、プログラム
CN104283717B (zh) * 2014-10-24 2017-12-26 东软集团股份有限公司 一种预测虚拟网络资源状态的方法及装置
US10713140B2 (en) 2015-06-10 2020-07-14 Fair Isaac Corporation Identifying latent states of machines based on machine logs
US10360093B2 (en) * 2015-11-18 2019-07-23 Fair Isaac Corporation Detecting anomalous states of machines
CN106383766B (zh) * 2016-09-09 2018-09-11 北京百度网讯科技有限公司 系统监控方法和装置
CN107704952A (zh) * 2017-09-19 2018-02-16 中国电子科技集团公司第二十八研究所 一种基于随机子空间的恐怖袭击预测方法
JP6969990B2 (ja) * 2017-11-28 2021-11-24 株式会社東芝 情報処理装置、情報処理方法及びコンピュータプログラム
KR102089772B1 (ko) * 2017-12-18 2020-03-17 두산중공업 주식회사 전력 사용량 예측 시스템 및 방법
US20220198303A1 (en) * 2019-04-15 2022-06-23 Riken Device, method and program for environmental factor estimation, learned model and recording medium
WO2022214847A1 (en) * 2021-04-06 2022-10-13 Akbari Seyedmohammadarian New formula for predicting people's chances of success
JP2023020166A (ja) * 2021-07-30 2023-02-09 京セラ株式会社 予測装置、予測方法、予測プログラム、および記録媒体

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101211383A (zh) * 2007-12-21 2008-07-02 浙江大学 一种高炉铁水硅含量的特征分析预报方法
CN101369320A (zh) * 2007-08-14 2009-02-18 索尼株式会社 信息处理装置和方法、记录介质及计算机程序
CN101517602A (zh) * 2006-09-22 2009-08-26 皇家飞利浦电子股份有限公司 使用基于分类器集成的遗传算法进行特征选择的方法

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10207857A (ja) * 1997-01-20 1998-08-07 Fujitsu Ltd 時系列予測装置
JP2004326200A (ja) * 2003-04-21 2004-11-18 Mitsubishi Heavy Ind Ltd 自動機械、機械の自動運転システム、及び、機械の自動運転方法
US7526461B2 (en) * 2004-11-17 2009-04-28 Gm Global Technology Operations, Inc. System and method for temporal data mining
US20080154808A1 (en) * 2006-10-20 2008-06-26 Genalytics, Inc. Use and construction of time series interactions in a predictive model
US7797259B2 (en) * 2007-04-12 2010-09-14 Hrl Laboratories, Llc System for temporal prediction
US20110028827A1 (en) * 2009-07-28 2011-02-03 Ranganatha Sitaram Spatiotemporal pattern classification of brain states
US8407163B2 (en) * 2009-08-27 2013-03-26 Xerox Corporation Monitoring a device, network, or system with adaptive dynamic classification employing a hidden Markov model operating on a time sequence of information

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101517602A (zh) * 2006-09-22 2009-08-26 皇家飞利浦电子股份有限公司 使用基于分类器集成的遗传算法进行特征选择的方法
CN101369320A (zh) * 2007-08-14 2009-02-18 索尼株式会社 信息处理装置和方法、记录介质及计算机程序
CN101211383A (zh) * 2007-12-21 2008-07-02 浙江大学 一种高炉铁水硅含量的特征分析预报方法

Also Published As

Publication number Publication date
US8635174B2 (en) 2014-01-21
CN102087721A (zh) 2011-06-08
US20110137838A1 (en) 2011-06-09
JP2011118786A (ja) 2011-06-16

Similar Documents

Publication Publication Date Title
CN102087721B (zh) 信息处理设备和观测值预测方法
Adrion et al. Predicting the landscape of recombination using deep learning
Foll et al. Identifying the environmental factors that determine the genetic structure of populations
US20180365557A1 (en) Information processing method and information processing apparatus
Jean et al. RNA‐Seq read alignments with PALMapper
US8250007B2 (en) Method of generating precedence-preserving crossover and mutation operations in genetic algorithms
CN101369320B (zh) 信息处理装置和方法
CN108804704A (zh) 一种用户深度画像方法及装置
CN105528652A (zh) 一种预测模型的建立方法及终端
CN114154412A (zh) 基于深度强化学习的优化芯片布局系统及方法
US9626155B2 (en) Determining recommended optimization strategies for software development
Zhang et al. Permutation-based particle swarm optimization for resource-constrained project scheduling
Vasant et al. Hybrid genetic algorithms and line search method for industrial production planning with non-linear fitness function
Barlow et al. Multiobjective memetic algorithm applied to the optimisation of water distribution systems
CN109213831A (zh) 事件检测方法和装置、计算设备及存储介质
CN101681447B (zh) 学习设备、学习方法、信息修改设备、信息修改方法和程序
CN117095753A (zh) 一种蛋白质稳定性预测方法及网络app
CN115543638B (zh) 基于不确定性的边缘计算数据收集分析方法、系统及设备
CN111695967A (zh) 一种报价的确定方法、装置、设备及存储介质
CN116955808A (zh) 一种游戏推荐方法、装置、电子设备及介质
CN116563007A (zh) 授信信用风险预测方法、电子设备及可读存储介质
CN115438249A (zh) QoS预测模型构建方法、装置、设备及可读存储介质
JP2020177508A (ja) 予測システム、予測方法、および予測プログラム
KR20090019636A (ko) 유전 알고리즘을 이용한 점진적인 구조물의 설계 방법 및그 시스템
CN116151505B (zh) 小区动线规划方法、装置、电子设备及可读存储介质

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20150401

Termination date: 20201126