CN103368787A - 信息处理装置、信息处理方法和程序 - Google Patents

信息处理装置、信息处理方法和程序 Download PDF

Info

Publication number
CN103368787A
CN103368787A CN201310092362.3A CN201310092362A CN103368787A CN 103368787 A CN103368787 A CN 103368787A CN 201310092362 A CN201310092362 A CN 201310092362A CN 103368787 A CN103368787 A CN 103368787A
Authority
CN
China
Prior art keywords
information
state
amount
data
model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201310092362.3A
Other languages
English (en)
Inventor
井手直纪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Publication of CN103368787A publication Critical patent/CN103368787A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01SRADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
    • G01S19/00Satellite radio beacon positioning systems; Determining position, velocity or attitude using signals transmitted by such systems
    • G01S19/01Satellite radio beacon positioning systems transmitting time-stamped messages, e.g. GPS [Global Positioning System], GLONASS [Global Orbiting Navigation Satellite System] or GALILEO
    • G01S19/13Receivers
    • G01S19/34Power consumption
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01SRADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
    • G01S19/00Satellite radio beacon positioning systems; Determining position, velocity or attitude using signals transmitted by such systems
    • G01S19/01Satellite radio beacon positioning systems transmitting time-stamped messages, e.g. GPS [Global Positioning System], GLONASS [Global Orbiting Navigation Satellite System] or GALILEO
    • G01S19/13Receivers

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Radar, Positioning & Navigation (AREA)
  • Remote Sensing (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Mathematical Physics (AREA)
  • Pure & Applied Mathematics (AREA)
  • Computational Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Mathematical Optimization (AREA)
  • Mathematical Analysis (AREA)
  • Evolutionary Biology (AREA)
  • Operations Research (AREA)
  • Probability & Statistics with Applications (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Algebra (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Testing Or Calibration Of Command Recording Devices (AREA)
  • Position Fixing By Use Of Radio Waves (AREA)

Abstract

公开了一种信息处理装置、信息处理方法和程序。该信息处理装置包括:传感器,所述传感器测量预定数据;模型存储单元,所述模型存储单元存储通过对在过去测量的时间序列数据建模而获得的模型;信息量计算单元,所述信息量计算单元基于根据所述模型的状态变量的先验分布决定的、不执行所述传感器的测量时的信息量与根据所述模型的状态变量的后验分布决定的、执行所述传感器的测量时的信息量之间的差,来计算根据测量获得的信息量;以及测量控制单元,所述测量控制单元基于根据测量获得的信息量来控制所述传感器。

Description

信息处理装置、信息处理方法和程序
技术领域
本技术涉及一种信息处理装置、信息处理方法和程序,并特别地涉及能控制传感器高效地执行测量而无需不必要的测量的信息处理装置、信息处理方法和程序。
背景技术
在现有技术中,存在一种控制多个传感器的方法,该方法被配置成在空间和时间预测是可能的情况下,在用于收集由多个传感器检测的信息的传感器网络上的传感器节点中不执行与网络的通信(例如,参考日本未审查专利申请公开2007-80190)。
各种传感器被安装在诸如智能电话的移动装置上,以有利于对其的使用。已经开发了如下应用:这些应用使用由这样安装的传感器获得的数据来向用户提供适当的服务。
发明内容
然而,如果传感器始终通用地进行操作,则会发生以下不便。
如果测量次数高,那么即使每次测量时传感器消耗的电力低,耗电也终究会增加,并且电池(可再充电电池)由此很快用尽,这使得用户不方便。作为这样的示例,安装在诸如智能电话的移动装置中的GPS(全球定位系统)传感器等被举例。注意,希望测量次数降低的这样的示例不限于耗电。可能会通过测量而对人体造成损害的传感器希望实现降低测量次数。
此外,存在即使根据传感器类型想要测量也不能够执行测量的情况。例如,在上述GPS传感器的示例中,存在在室内场所、建筑物之间、隧道内等难以执行测量的情况。此外,即使测量是可以的,也存在没有一直获得满意的准确度的情况,并且在这种情况下执行测量显示出低效率。
此外,当累积了使用传感器在过去测量的数据时,存在由于与先前获取的数据相似的数据而不必再次执行测量的情况,并且在这种情况下执行测量也显示出低效率。在GPS传感器的示例中,当用户不移动他或她的位置时,测量数据具有基本相同的值,并由此重复测量意味着低效率。
本技术希望控制传感器高效地执行测量而不执行不必要的测量。
根据本技术的实施例,提供了一种信息处理装置,该信息处理装置包括:传感器,所述传感器测量预定数据;模型存储单元,所述模型存储单元存储通过对在过去测量的时间序列数据建模而获得的模型;信息量计算单元,所述信息量计算单元基于根据所述模型的状态变量的先验分布决定的、不执行所述传感器的测量时的信息量与根据所述模型的状态变量的后验分布决定的、执行所述传感器的测量时的信息量之间的差,来计算根据测量获得的信息量;以及测量控制单元,所述测量控制单元基于根据测量获得的信息量来控制所述传感器。
根据本技术的另一实施例,提供了一种信息处理装置的信息处理方法,该信息处理装置包括传感器以及模型存储单元,该传感器测量预定数据,并且该模型存储单元存储通过对在过去测量的时间序列数据建模而获得的模型,所述方法包括以下步骤:基于根据所述模型的状态变量的先验分布决定的、不执行所述传感器的测量时的信息量与根据所述模型的状态变量的后验分布决定的、执行所述传感器的测量时的信息量之间的差,来计算根据测量获得的信息量;以及基于根据测量获得的信息量来控制所述传感器。
根据本技术的又一实施例,提供了一种程序,用于使得计算机装置执行处理,该计算机装置包括传感器以及模型存储单元,该传感器测量预定数据,并且该模型存储单元存储通过对在过去测量的时间序列数据建模而获得的模型,所述处理包括:基于根据所述模型的状态变量的先验分布决定的、不执行所述传感器的测量时的信息量与根据所述模型的状态变量的后验分布决定的、执行所述传感器的测量时的信息量之间的差,来计算根据测量获得的信息量;以及基于根据测量获得的信息量来控制所述传感器。
根据本技术的实施例,基于根据模型的状态变量的先验分布决定的、不执行传感器的测量时的信息量与根据该模型的状态变量的后验分布决定的、执行传感器的测量时的信息量之间的差,来计算根据测量获得的信息量,其中该模型是通过对在过去测量的时间序列数据建模而获得的;并且,基于根据测量获得的信息量来控制传感器。
注意,程序可以通过经由传输介质来传输或记录在记录介质上而被提供。
信息处理装置可以是独立装置或者是构成一个装置的内部块。
根据本技术的实施例,可以控制传感器高效地执行测量而不执行不必要的测量。
附图说明
图1是示出了应用本技术的测量系统的第一实施例的配置示例的框图;
图2是示出了当图1的测量系统被实现为计算机时的配置示例的框图;
图3是示出了实现图1的测量系统的计算机的硬件的配置示例的框图;
图4是示出了时间序列数据的示例的图;
图5是示出了隐马尔可夫模型的状态转移的图;
图6是示出了隐马尔可夫模型的转移表的示例的图;
图7是示出了其中存储有隐马尔可夫模型的观测概率的状态表的示例的图;
图8A和图8B是示出了其中存储有隐马尔可夫模型的观测概率的状态表的示例的图;
图9是示出了表示时间序列数据与隐马尔可夫模型之间的关系的图形模型的图;
图10是描述了由测量信息量计算单元进行的预测计算的格图;
图11是描述了数据丢失时的处理的图;
图12是描述了测量信息量计算单元的处理的概念图;
图13是描述了信息熵的差ΔH的近似计算方法的图;
图14是示出了变量转换表的示例的图;
图15是描述了感测控制处理的流程图;
图16是描述了直到预定阶段的预测的处理的格图;
图17是描述了直到预定阶段的预测的感测控制处理的流程图;
图18是描述了数据恢复处理的流程图;
图19是示出了当考虑了测量失败的情况时的状态表的示例的图;
图20是描述了其中考虑了处于未知状态的情况的实施例的图;
图21是描述了其中考虑了处于未知状态的情况的实施例的图;
图22是描述了使用GPS传感器的应用的应用示例的图;
图23A和图23B是描述了使用GPS传感器的应用的应用示例的图;
图24是描述了使用GPS传感器的应用的应用示例的图;
图25是描述了使用GPS传感器的应用的应用示例的图;
图26是描述了使用GPS传感器的应用的应用示例的图;
图27是描述了使用GPS传感器的应用的应用示例的图;
图28是描述了使用GPS传感器的应用的应用示例的图;以及
图29是描述了使用GPS传感器的应用的应用示例的图。
具体实施方式
下文中,将描述用于实现本技术的优选实施例(下文中被称作实施例)。注意,将按照以下顺序提供描述。
1.第一实施例(基本实施例)
2.第二实施例(考虑测量失败的实施例)
3.第三实施例(考虑处于未知状态的实施例)
4.第四实施例(使用数据库的实施例)
5.应用的应用示例
1.第一实施例
测量系统的配置示例
图1示出了应用本技术的测量系统的第一实施例的配置示例。
图1所示的测量系统1被配置成包括时间序列数据输入单元11、测量信息量计算单元12、测量控制单元13、传感器(测量单元)14、数据存储单元15、数据恢复单元16、模型更新单元17、以及模型存储单元18。
时间序列数据输入单元11针对由传感器14测量的时间序列数据,从数据存储单元15获取直到前次测量的预定时间内累积的时间序列数据,并将该数据输入到测量信息量计算单元12。
测量信息量计算单元12测量从传感器14的下次测量获得的信息量。测量信息量计算单元12可以根据功能来主要分成用于预测数据的概率分布的概率分布预测单元12A、以及用于基于预测的概率分布而预测在测量中获得的信息量的信息量预测单元12B。
更具体地,测量信息量计算单元12使用从模型存储单元18提供的学习模型和从时间序列数据输入单元11提供的时间序列数据,来计算下次测量的信息量(信息熵)与不执行测量时的信息量(信息熵)之间的差(信息熵差)。
然后,测量信息量计算单元12基于所计算的信息量的差来决定是否要执行传感器14的下次测量,并且然后将决定结果提供到测量控制单元13。换言之,当后续执行测量时的信息量与不执行测量时的信息量之间的差大时,换言之,当从后续测量获得的信息量大时,测量信息量计算单元12决定操作传感器14。另一方面,当即使操作传感器14、信息量也小时,测量信息量计算单元12决定不操作传感器14。注意,在本实施例中,如稍后将描述的,作为模型存储单元18中的、其中在过去获得了时间序列数据并存储了时间序列数据的学习模型,将采用隐马尔可夫模型。
当测量信息量计算单元12决定操作传感器14时,测量控制单元13控制传感器14执行测量。
传感器14用作测量预定数据的测量单元,并根据测量控制单元13的控制来执行或暂停测量。例如,传感器14是被安装在诸如智能电话的移动装置上以获取当前位置(纬度和经度)的GPS传感器等。
数据存储单元15是用于临时存储从传感器14提供的数据的缓冲器。在数据存储单元15中,由传感器14以短的时间间隔(诸如一秒钟或一分钟的间隔)测量的数据被存储比测量间隔长的预定累积时段(诸如一天或一周)。然后,在经过了给定的累积时段之后,累积的时间序列数据被提供到数据恢复单元16。此外,在数据存储单元15中累积的时间序列数据还在预定的定时处被提供到时间序列数据输入单元11。
注意,如在GPS传感器执行隧道内的测量的情况下那样,存在下述情况:其中,取决于测量状态而无法获取数据,并且在数据存储单元15中累积的时间序列数据的一些片段丢失。
当在给定时段内累积的时间序列数据的一些片段丢失时,数据恢复单元16对时间序列数据应用维特比算法(Viterbi algorithm),以执行使得丢失数据片段被存储的数据恢复处理。维特比算法是用于基于给定的时间序列数据和隐马尔可夫模型来估计最可能的状态序列的算法。
此外,模型更新单元17使用其丢失片段由数据恢复单元16恢复的时间序列数据,来更新存储在模型存储单元18中的学习模型的参数。注意,在更新学习模型时,包括丢失片段的数据恢复之前的时间序列数据可以在不进行改变的情况下被使用。
模型存储单元18存储如下的学习模型的参数:在该学习模型中,使用由传感器14在过去获得的时间序列数据,来学习传感器14的时间转移。在本实施例中,隐马尔可夫模型(HMM)被用作学习模型,并且隐马尔可夫模型的参数被存储在模型存储单元18中。
注意,传感器14在过去获得时间序列数据的学习模型不限于隐马尔可夫模型,并且还可以采用其它学习模型,例如,基于累积的时间序列数据库来预测将来数据的概率分布的回归模型。此外,模型存储单元18可以采用下述方法:其中,由传感器14在过去获得的时间序列数据被存储为数据库,以便在不进行改变的情况下被直接使用。稍后将描述下述方法作为第三实施例:在该方法中,过去的时间序列数据在模型存储单元18中被存储为数据库而不进行改变,以便被使用。
使用数据恢复单元16中新累积的时间序列数据,由模型更新单元17对存储在模型存储单元18中的学习模型的参数进行更新。换言之,数据被添加到存储在模型存储单元18中的学习模型,或数据库被扩展。
在如上配置的测量系统1中,基于由传感器14获得的直到前次测量的时间序列数据,来计算由传感器14执行测量时的信息量与在传感器14中不执行测量时的信息量之间的差。然后,从传感器14的测量获得的信息量被确定为大,传感器14被控制为被操作。因此,传感器14可以被控制为高效地执行测量而无需执行不必要的测量。
使用计算机实现时的配置示例
图2是示出了当通过使得计算机执行预定程序来实现图1的测量系统1时的配置示例的框图。
当图1的测量系统1被实现为计算机时,如图2所示,准备了测量信息量预测程序33、传感器控制程序34、模型学习程序37和数据恢复程序38,以作为在计算机中执行的程序。此外,作为其中存储有预定数据的存储单元,准备了测量数据缓冲存储器31、模型参数存储器32和测量数据库36。
测量数据缓冲存储器31是其中临时存储有由传感器35输出的数据的存储器。每当由传感器35执行测量并且然后数据被输出时,输出数据被另外存储在测量数据缓冲存储器31中。
模型参数存储器32存储在模型学习程序37基于测量数据库36中累积的过去的时间序列数据来执行对预定学习模型的建模时的参数。这里,作为存储在模型参数存储器32中的学习模型,例如,考虑了隐马尔可夫模型(HMM)等。注意,直到该时间获取的过去的时间序列数据可以被存储在模型参数存储器32中作为数据库而不进行改变。
测量信息量预测程序33获取从模型参数存储器32获取的学习模型(隐马尔可夫模型)的模型参数、以及存储在测量数据缓冲存储器31中的时间序列数据,以计算从传感器35的测量获得的信息量。然后,测量信息量预测程序33基于所计算的信息量来决定是否要操作传感器35,并且当决定执行操作时,将意图指示到传感器控制程序。此外,测量信息量预测程序33将经过时间设置为定时器30A中的下一操作确定定时,其中在该操作确定定时处确定是否要操作传感器35。
定时器30A对由测量信息量预测程序33指定的经过时间进行计数,并且在过去了指定的经过时间时,向测量信息量预测程序33通知处于操作确定定时处。
传感器控制程序34控制传感器35的操作等级。在本实施例中,作为传感器35的操作等级,假定以最简单的方式存在开和关两种等级,因此,传感器控制程序34控制传感器35处于开或关。注意,当存在多个操作等级(诸如高、中和低)作为传感器35的操作等级时,例如,测量信息量预测程序33基于计算的信息量来决定多个操作等级之一,并且然后传感器控制程序34进行控制,以使得在由测量信息量预测程序33决定的操作等级处执行操作。此外,传感器控制程序34可以控制连续的信号输出等级、信号准确度等,而不是划分为高、中和低的操作等级。
传感器35的操作由传感器控制程序34控制,并且在传感器35的功能被执行时,测量数据被输出到测量数据缓冲存储器31。
测量数据库36存储由传感器35测量的过去的时间序列数据,所述时间序列数据用作使用预定学习模型进行建模的学习数据。
当根据由定时器30B指示的定时、使用预定学习模型对作为数据库被存储在测量数据库36中的用于学习的时间序列数据进行建模时,模型学习程序37执行学习以获得参数。在本实施例中,隐马尔可夫模型被用作学习模型以学习在过去获得的时间序列数据,但是也可以采用其它学习模型。稍后将描述隐马尔可夫模型的细节。由模型学习程序37学习(更新)的模型参数被提供到模型参数存储器32和数据恢复程序38。
定时器30B对到模型学习程序37执行下次参数更新的时间进行计数,其中该参数更新是通过模型学习程序37以给定时间间隔执行学习模型的参数更新来进行的。然后,当到执行参数更新的时间时,定时器30B向模型学习程序37通知该事实。注意,定时器30B通知到执行参数更新的时间的时间间隔比定时器30A通知到执行操作确定的时间的时间间隔更长。因此,当在测量数据缓冲存储器31中累积给定量(给定时段内)的时间序列数据时,执行学习模型的参数更新。
数据恢复程序38使用由模型学习程序37学习(更新)的模型参数恢复下述数据部分:传感器35不能够测量该数据部分,并且在该数据部分中,数据从存储在测量数据缓冲存储器31中的时间序列数据中丢失。数据恢复程序38例如是要执行维特比算法的程序,并且使用在隐马尔可夫模型中估计的似然性数据来对数据丢失部分进行插值。注意,全体时间序列数据还可以被配置成通过将传感器35执行测量的时间序列数据的部分切换成在隐马尔可夫模型中估计的似然性数据而生成。在对数据丢失部分进行补充或者将不均匀的数据获取间隔校正为均匀时,数据恢复程序38是有用的。
如上面那样,通过使得CPU(中央处理单元)以并行方式在多个分离的程序中执行数据测量并使得存储器(存储单元)存储测量数据和学习模型的参数,可以将图1的测量系统1实现为计算机。
图3是示出了实现图1的测量系统1的计算机的硬件的配置示例的框图。
在计算机中,CPU(中央处理单元)51、ROM(只读存储器)52和RAM(随机存取存储器)53经由总线54而彼此连接。
此外,输入和输出接口55被连接到总线54。输入单元56、输出单元57、存储单元58、通信单元59和驱动器60被连接到输入和输出接口55。
输入单元56包括键盘、鼠标、麦克风等。输出单元57包括显示器、扬声器等。存储单元58包括硬盘、非易失性存储器等。通信单元59包括经由因特网、移动电话网络、无线LAN、卫星广播网络等与其它通信装置或基站通信的通信模块。传感器62是对应于图1的传感器14或图2的传感器35的传感器。驱动器60驱动可拆卸记录介质61,可拆卸记录介质61诸如为磁盘、光盘、磁光盘、或半导体存储器。
在如上配置的计算机中,CPU51使得存储在例如存储单元58中的程序经由输入和输出接口55和总线54被加载到RAM53上,以便被执行。这里,加载到RAM53上并且然后被执行的程序包括关于图2的示例中的测量信息量预测程序33、传感器控制程序34、模型学习程序37、以及数据恢复程序38。此外,图2的测量数据缓冲存储器31和模型参数存储器32对应于图3的RAM53,并且图2的测量数据库36对应于图3的存储单元58。
在计算机中,通过将可拆卸记录介质61加载到驱动器60上,可以使用输入和输出接口55来将诸如测量信息量预测程序33的各种程序安装在存储单元58中。此外,可以经由有线或无线传输介质(诸如局域网、因特网或数字卫星广播)在通信单元59中接收程序,以便将其安装在存储单元58中。替选地,程序可以被预先安装在ROM52或存储单元58中。
下文中,将描述测量系统1的每个单元的细节。以下,将使用图1所示的测量系统1的功能框图的配置来提供描述。
时间序列数据的示例
图4示出了由传感器14获得的时间序列数据的示例。
图4的时间序列数据是下述数据:其包括以时间序列的方式布置的三种类型的数据片段(数据1、数据2和数据3)以及获得数据片段的时间。数据片段的类型和数目、获取数据片段的时间间隔(时间的阶段宽度)等根据传感器14的类型而不同。此外,获得数据片段的时间间隔不一定是均匀的间隔。注意,当获得数据片段的时间间隔是均匀的间隔时,可以省略时间的字段,或者可以存储用于表示阶段顺序的编号等以替代时间。除了时间以外的多个数据片段中的每个可以由离散符号、连续量、或离散符号和连续量的组合来表示。此外,除了时间以外的多个数据片段的维数不一定是一维,而是可以是二维或更高维。
作为测量时间序列数据的最简单的方法,存在下述方法:其中,以预先决定的给定时间间隔连续地执行测量。然而,关于获取测量数据的间隔,存在下述情况:其中,取决于情况,希望以短的时间间隔进行测量,或者长时间段暂停测量不会产生问题。在测量系统1中,使用隐马尔可夫模型(学习模型)来学习时间序列数据,并且可以根据学习模型的状态来自适应地改变测量时间间隔。
隐马尔可夫模型
将参照图5至图9来描述对由传感器14获得的时间序列数据建模的隐马尔可夫模型。
图5示出了隐马尔可夫模型的状态转移。
隐马尔可夫模型是使用隐含层中的状态的观测概率和转移概率来对时间序列数据进行建模的概率模型。例如在Yoshinori Uesaka和KazuhikoOzeki所著的“Algorithm for Pattern Recognition and Learning”(Bun-ichi Sogo Shuppan)和C.M.Bishop所著的“Pattern Recognitionand Machine Learning”(Springer Japan)等中描述了隐马尔可夫模型的细节。
图5示出了状态S1、状态S2和状态S3这三个状态、以及转移T1至T9这九个转移T。转移T中的每个由以下的三个参数来定义:表示转移前的状态的开始状态、表示转移后的状态的结束状态、以及表示状态从开始状态转移为结束状态的概率的转移概率。此外,每个状态具有观测概率,该观测概率表示每个符号被用作以下参数的概率:将基于所述参数来采用预先决定其数据的离散符号。因此,这种参数被存储在模型存储单元18中,在模型存储单元18中隐马尔可夫模型被存储为学习模型,在该学习模型中学习由传感器14在过去获得的时间序列数据。状态的参数根据数据的配置(换言之,如稍后将参照图7、图8A和图8B描述的,数据空间(观测空间)是离散空间还是连续空间)而不同。
图6示出了转移表的示例,其中存储有隐马尔可夫模型的每个转移t的开始状态、结束状态和转移概率的参数。
图6所示的转移表在对其给出用于标识每个转移t的转移编号(序列号)的状态下存储每个转移t的开始状态、结束状态和转移概率。例如,第t个转移表示从状态it到状态jt的转移,并且其概率(转移概率)是aitjt。注意,针对具有相同开始状态的转移而对转移概率进行标准化。
图7、图8A和图8B示出了其中存储有作为状态S的参数的观测概率的状态表的示例。
图7示出了当数据空间(观测空间)是离散空间时(换言之,当数据采用离散符号中的任一个时)、其中存储有每个状态的观测概率的状态表的示例。
在图7所示的状态表中,针对以预定顺序对隐马尔可夫模型的每个状态给出的状态编号来存储每个符号被采用的概率。存在N个状态,即S1,…,Si,…,SN,并且在数据空间中可以采用的符号为1,…,j,…,K。在这种情况下,例如,在第i状态Si下采用符号j的概率为pij。然而,该概率pij针对相同状态Si被标准化。
图8A和图8B示出了其中存储有在数据空间(观测空间)是连续空间时(换言之,当数据采用连续符号并且还遵循针对每个状态预先决定的正态分布时)的每个状态的观测概率的状态表的示例。
当数据采用连续符号并且遵循针对每个状态预先决定的正态分布时,代表每个状态的正态分布的、正态分布的中心值和方差值被存储为状态表。
图8A是其中存储有每个状态的正态分布的中心值的状态表,并且图8B是其中存储有每个状态的正态分布的方差值的状态表。在图8A和图8B的示例中,存在N个状态,即S1,…,Si,…,SN,并且数据空间的维数是1,…,j,…,D。
根据图8A和图8B所示的状态表,在遵循中心值cij和方差值vij的正态分布的分布中,获得在例如第i状态Si下获得的数据的j维分量。
在其中存储有隐马尔可夫模型的参数的模型存储单元18中,存储有图6所示的一个转移表以及对应于由传感器14获得的数据(传感器数据)的状态表。当传感器数据的数据空间是离散空间时,对应于传感器数据的状态表以图7的形式被存储在模型存储单元18中,并且当传感器数据的数据空间是连续空间时,对应于传感器数据的状态表以图8A和图8B的形式被存储在模型存储单元18中。
例如当传感器数据是由GPS传感器获得的GPS数据时,传感器数据是采用实数值而非整数值的连续数据,因而传感器数据的状态表以图8A和图8B所示的用于连续符号的状态表的形式被存储在模型存储单元18中。
在这种情况下,传感器数据的状态表变为以下述方式获得的表:持握安装有GPS传感器的移动装置的用户使他或她频繁去往或通过的位置离散化为状态,并且每个离散化状态的中心值和方差值被存储在其中。
因此,GPS数据的状态表中的参数cij表示对应于经由用户频繁通过的离散化位置而获得的状态当中的状态Si的位置的中心值。GPS数据的状态表中的参数vij表示对应于状态Si的位置的方差值。
注意,由于GPS数据被配置成包括纬度和经度的两种类型的数据片段,所以通过将j=1设置为纬度(x轴)并将j=2设置为经度(y轴),可以认为GPS数据的维数是2。注意,通过将时间信息并入GPS数据中,GPS数据的维数可以是3。
图9示出了如下的图形模型:该图形模型表示由传感器14获得的时间序列数据与作为学习该数据的学习模型的隐马尔可夫模型之间的关系。
隐马尔可夫模型的图形模型是下述模型:其中,时间(阶段)t的状态Zt是使用时间t-1的状态Zt-1来以概率的方式确定的(马尔可夫特性),并且时间t的观测Xt是仅使用状态Zt来以概率的方式确定的。
在图9中,小写字母x表示已经测量的数据,而大写字母X表示未测量的数据。因此,在图9中,从时间1到时间t-1的数据片段x1,x2,…,xt-1表示已经测量的数据片段,并且时间t处的数据片段表示未测量的数据。
由时间序列数据输入单元11将图9所示的从时间1到时间t-1的、测量的数据片段x1,x2,…,xt-1从数据存储单元15输入到测量信息量计算单元12。测量信息量计算单元12使用隐马尔可夫模型来确定是否要通过操作传感器14获取时间t的数据片段Xt
测量信息量计算单元12的概率分布预测单元12A针对没有测量时间t的传感器数据Xt以及测量了该数据的每种情况,来预测时间t处的状态Zt的概率分布P(Zt)。信息量预测单元12B使用没有测量时间t的传感器数据Xt以及测量了该数据的每种情况的概率分布P(Zt),来计算信息熵差。概率分布预测单元12A
图10是描述了由概率分布预测单元12A对时间t处的状态Zt的概率分布P(Zt)的预测计算的格图。
在图10中,白色圆圈表示隐马尔可夫模型的状态,并且预先准备了四种状态。灰色圆圈表示观测结果(测量数据)。阶段(时间)t=1表示初始状态,并且由实线箭头示出每个阶段(时间)中可实现的状态转移。
在初始状态的阶段t=1中的每个状态的概率分布P(Z1)被给定为如在例如公式(1)中那样的均等概率。
P(Z1)=1/N…(1)
在公式(1)中,Z1是在阶段t=1中的状态(初始状态)的ID,并且在下文中,ID=Zt的、阶段t中的状态被简称为状态Zt。公式(1)中的N表示隐马尔可夫模型的状态数目。
注意,当给出每个状态的初始概率π(Z1)时,可以使用初始概率π(Z1)满足P(Z1)=π(Z1)。在多数情况下,初始概率被保存作为隐马尔可夫模型中的参数。
使用在阶段t-1中的状态Zt-1的概率分布P(Zt-1)来在递推公式中给出在阶段t中的状态Zt的概率分布P(Zt)。然后,当从阶段1至阶段t-1的所测量的数据片段x1:t-1是已知的时,在阶段t-1中的状态Zt-1的概率分布P(Zt-1)可以由条件概率表示。换言之,在阶段t-1中的状态Zt-1的概率分布P(Zt-1)可以由公式(2)来表示。
P(Zt-1)=P(Zt-1|x1:t-1)(Zt-1=1,…,n)…(2)
在公式(2)中,x1:t-1表示从阶段1至阶段t-1的已知的所测量的数据x。公式(2)的右侧是更精确的P(Zt-1|X1:t-1=x1:t-1)。
在阶段t中的状态Zt中,通过使用转移概率P(Zt|Zt-1)=aij更新在阶段t-1中的状态Zt-1的概率分布P(Zt-1),来获得测量前的概率分布(先验概率)P(Zt)=P(Zt|x1:t-1)。换言之,当不执行传感器14的测量时的概率分布(先验概率)P(Zt)=P(Zt|x1:t-1)可以由公式(3)来表示。注意,上述转移概率aij是被保存在图6的转移表中的参数。
P ( Z t ) = P ( Z t | x 1 : t - 1 ) = Σ Z t - 1 = 1 N P ( Z t | Z t - 1 ) P ( Z t - 1 ) . . . ( 3 )
公式(3)表示直到阶段t中的状态Zt的所有状态转移的概率被相加到一起的处理。
注意,还可以使用下面的公式(3')来替代公式(3)。
P ( Z t ) = max Z t - 1 ( P ( Z t | Z t - 1 ) P ( Z t - 1 ) ) / Ω . . . ( 3 , )
这里,Ω是公式(3')的概率的标准化常数。当与选择概率的绝对值相比从每个阶段中的状态转移当中仅选择具有最高发生概率的转移是更重要的时,例如当希望知道诸如维特比算法的具有最高发生概率的状态转移序列时,使用公式(3')。
另一方面,如果根据测量获得了观测Xt,则可以获取状态Zt在获得了观测Xt的条件下的条件概率(后验概率)的概率分布P(Zt|Xt)。换言之,根据观测Xt的测量的后验概率P(Zt|Xt)可以被表示如下。
P ( Z t | X t ) = P ( X t | Z t ) P ( Z t ) Σ Z t = 1 N P ( X t | Z t ) P ( Z t ) . . . ( 4 )
其中,在阶段t中的大写字母的观测Xt是尚未测量的数据,并表示概率变量。
如公式(4)所示,可以基于贝叶斯定理,使用由状态Zt生成观测Xt的似然性P(Xt|Zt)和先验概率P(Zt)来表示根据观测Xt的测量的后验概率P(Zt|Xt)。这里,先验概率P(Zt)通过公式(3)的递推公式而得知。此外,如果观测Xt是离散变量,则由状态Zt生成观测Xt的似然性P(Xt|Zt)是图7的隐马尔可夫模型的状态表的参数pxt,zt
此外,如果观测Xt是连续变量、并且每一维度j的分量在遵循针对每个状态i=Zt预先决定的中心μij=cij和方差σij 2=vij的正态分布的情况下被建模,则该似然性如下。
[数学式5]
P ( X t | Z t ) = Π j = 1 D N ( X t | μ ij , σ ij 2 )
其中,用作中心和方差的参数的cij和vij是图8A和图8B所示的状态表的参数。
因此,如果得到概率变量Xt(如果概率变量Xt根据测量变为正态变量xt),则可以容易地计算公式(4),并且可以计算在获得直到观测Xt的时间序列数据的条件下的后验概率。
通过公式(4)的更新规则来表示更新隐马尔可夫模型中的概率的公式,在该更新规则中,已知当前时间t处的数据xt。换言之,通过下述公式来表示更新隐马尔可夫模型中的概率的公式:其中,用数据xt来替代公式(4)的观测Xt。然而,测量信息量计算单元12希望获取在执行当前时间t处的测量之前的状态的概率分布。在这种情况下,可以使用如下公式:其中,公式(4)中的更新规则的P(Xt|Zt)被设置为“1”。换言之,公式(4)的P(Xt|Zt)被设置为“1”的公式是公式(3)或(3'),并对应于在执行传感器14在时间t处的测量之前的先验概率P(Zt)。
此外,如图11所示,上面的内容还能够以相同的方式应用于以下情况:其中,在从在当前时间之前的时间1到时间t-1的过去的时间序列数据中,发生数据丢失。换言之,当在时间序列数据中示出数据丢失时,可以用“1”来置换公式(4)的更新公式中的数据丢失部分的P(X|Z),以进行计算(由于没有指定数据丢失部分的时间,所以省略了P(X|Z)的下标)。
信息量预测单元12B
当从传感器14的测量获得的信息量大时,信息量预测单元12B决定操作传感器14。换言之,信息量预测单元12B通过在可以减小不执行测量时的模糊度的情况下执行传感器14的测量,来决定操作传感器14。该模糊度是概率分布中的模糊度,并且可以由概率分布具有的信息熵来表示。
信息熵H(Z)一般通过以下公式(5)来表示。
H ( Z ) = - ∫ dZP ( Z ) log P ( Z ) = - ΣP ( Z ) log P ( Z ) . . . ( 5 )
如果信息熵H(Z)的间隔变量(Z)是连续的,则其可以用Z的整个空间中的积分符号来表示,并且如果间隔变量Z是离散的,则其可以通过所有Z的相加符号来表示。
为了计算执行和不执行传感器14的测量时的信息量的差,首先,考虑了执行传感器14的测量时以及不执行传感器14的测量时的各个信息量。
不执行传感器14的测量时的先验概率P(Zt)可以由公式(3)或(3')来表示。因此,不执行传感器14的测量时的信息熵Hb可以由使用公式(3)的公式(6)来表示。
H b = H ( Z t )
= - Σ Z t = 1 N P ( Z t | x t ) log P ( Z t | x t )
= - Σ Z t = 1 N P ( Z t ) log P ( Z t ) . . . ( 6 )
不执行传感器14的测量时的信息量是基于下述后验概率P(Zt-1|xt-1)和下述先验概率P(Zt|xt)来计算的信息量:根据直到前次测量的时间序列数据而获得的状态变量的后验概率P(Zt-1|xt-1),以及根据隐马尔可夫模型的转移概率而预测的当前时间处的状态变量的先验概率P(Zt|xt)。
另一方面,执行传感器14的测量时的后验概率P(Zt|Xt)可以由公式(4)来表示,但是由于观测Xt实际上尚未被测量,所以其是概率变量。因此,必需获取在概率变量Xt的分布条件下的、执行传感器14的测量时的信息熵Ha。换言之,执行传感器14的测量时的信息熵Ha可以由公式(7)来表示。
H a = E X t [ H ( Z t ) ]
= H ( Z t | X t )
= - ∫ d X t P ( X t ) Σ Z t = 1 N P ( Z t | x t , X t ) log P ( Z t | x t X t )
= - ∫ dX t Σ Z t = 1 N P ( X t | Z t ) P ( Z t ) log P ( X t | Z t ) P ( Z t ) Σ Z t , = 1 N P ( X t | Z t , ) P ( Z t , ) . . . ( 7 )
公式(7)的第一行中的公式表明,作为概率变量Xt的期望值而获取在获得观测Xt的条件下的后验概率的信息熵。然而,由于该公式等于关于状态Zt在获得观测Xt的条件下的条件信息熵的定义公式,所以其可以被表示为第二行中的公式。第三行中的公式是通过根据公式(5)展开第二行中的公式而获得的公式,并且第四行中的公式是通过根据公式(4)进行展开而获得的公式。
执行传感器14的测量时的信息量是按照如下方式获得的信息量:使用观测变量Xt来表示根据测量获得的数据,并通过计算观测变量Xt的期望值,来获得可以根据隐马尔可夫模型中的状态Zt在获得观测变量Xt的条件下的后验概率P(Zt|Xt)而计算的信息量。
如上,执行和不执行传感器14的测量时的信息熵的差ΔH可以使用公式(6)和(7)来表示如下。
ΔH = H a - H b = H ( Z t | X t ) - H ( Z t )
= - I ( Z t ; X t )
= - ∫ dX t Σ Z t = 1 N P ( X t | Z t ) P ( Z t ) log P ( X t | Z t ) P ( Z t ) Σ Z t , = 1 N P ( X t | Z t , ) P ( Z t , ) + Σ Z t = 1 N P ( Z t ) log P ( Z t )
= - ∫ dX t Σ Z t = 1 N P ( X t | Z t ) P ( Z t ) log P ( X t | Z t ) Σ Z t , = 1 N P ( X t | Z t , ) P ( Z t , ) . . . ( 8 )
公式(8)的第二行中的公式示出,信息熵的差ΔH是通过使隐马尔可夫模型中的状态Zt和观测Xt的相互信息量I(Zt;Xt)乘以-1而获得的。公式(8)的第三行中的公式是通过用如上所述的公式(6)和(7)来进行替代而获得的公式,并且公式(8)的第四行中的公式是通过整理第三行中的公式而获得的公式。信息熵的差ΔH是状态变量中的减小的模糊度的量,而通过使该量乘以-1而获得的相互信息量I可以被理解为解决该模糊度所必需的信息量。
如上所述,按照如图12所示的顺序方式,作为第一步骤,使用公式(3)和(4)预测状态Zt的概率分布P(Zt),作为第二步骤,使用公式(6)和(7)计算执行和不执行测量时的信息熵,并且最后,获得信息熵的差ΔH。
然而,为了确定是否要操作传感器14,希望最后获得公式(8)的信息熵的差ΔH,因而测量信息量计算单元12被配置成直接计算公式(8)的信息熵的差ΔH。因此,可以容易地执行计算信息熵的差ΔH的处理。
信息熵的差ΔH的近似计算
如果观测Xt是离散数据空间中的概率变量,则公式(8)中所表示的信息熵的差ΔH的计算可以通过列举来实现。然而,当观测Xt是连续数据空间中的概率变量时,必需进行积分以获得信息熵的差ΔH。由于在这种情况下积分难以以分析的方式处理公式(8)中包括的具有许多峰值的正态分布,所以必须依赖于数值积分,诸如蒙地卡罗积分(Monte Carlointegration)等。然而,信息熵的差ΔH本来是用于减小测量成本的测量效率计算中的算术运算,而将具有高处理负荷的、诸如数值积分等的算术运算包括在前述算术运算中并不是优选的。因此,在公式(8)的信息熵的差ΔH的计算中,优选避免数值积分。
因此,下文中,将描述在信息熵的差ΔH的计算中避免数值积分的近似计算方法。
为了避免因观测Xt是连续变量这一事实而导致为计算公式(8)带来成本,如图13所示,引入了根据连续概率变量Xt而新生成的、被表示为离散概率变量的观测Xt
图13是概念性地示出了通过被表示为离散概率变量的观测Xt 进行近似的图,其中该观测Xt 是根据连续概率变量Xt而新生成的。
如果如上使用离散概率变量Xt ,则公式(8)可以被修改成公式(9)。
ΔH ≅ Δ H ~ ≡ - I ( Z t ; X t ~ )
= - Σ X t ~ Σ Z t = 1 N P ( X t ~ | Z t ) P ( Z t ) log P ( X t ~ | Z t ) Σ Z t , = 1 N P ( X t ~ | Z t , ) P ( Z t , ) . . . ( 9 )
根据公式(9),由于可以将全体元素相加到一起来替代积分,所以可以避免具有高处理负荷的积分计算。
然而,由于这里用离散变量Xt 来替代连续变量Xt,所以可以容易地设想信息量的减少。实际上,在公式(8)中获得的信息熵与在公式(9)中获得的信息熵之间大体满足以下不等式,信息熵减小至近似值。
I ( Z t ; X t ~ ) ≤ I ( Z t ; X t ) . . . ( 10 )
注意,公式(10)的等号仅在Xt=Xt 时满足。因此,当用离散变量Xt 来取代连续变量Xt时,不满足等号。
当用离散变量Xt 来取代连续变量Xt(变量转换)时,优选使得Xt和Xt 彼此对应为尽可能地接近,以减小公式(10)的不等式两边之间的差。因此,为了减小公式(10)的不等式两边之间的差,离散变量Xt 被定义为与状态变量Z具有相同符号的离散变量。换言之,可以使用任何以离散变量Xt 来取代连续变量Xt的方法,但是可以通过将该变量转换成隐马尔可夫模型的状态变量Z来执行有效的变量转换,在该隐马尔可夫模型中,有效地学习时间序列数据。
关于离散变量Xt ,给出在给定X时的观测Xt 的概率如下。
P ( X ~ | X ) = P ( X | X ~ , λ ) Σ X ~ = 1 N P ( X | X ~ , λ ) . . . ( 11 )
这里,λ是用于决定观测X在状态Z下被观测的概率(概率密度)的参数。基于该事实,公式(11)可以被表示如下。
P ( X ~ | Z ) = P ( X ~ , Z ) P ( Z ) = ∫ dx P ( X ~ , X , Z ) P ( Z )
= ∫ dXP ( X ~ | X ) P ( X | Z ) = ∫ dX P ( X | X ~ ) P ( X ~ | Z ) Σ X ~ = 1 N P ( X | X ~ ) . . . ( 12 )
如果在状态Z下生成观测X的概率密度被设置为遵循正态分布并且观测X的维度被设置为D维,针对j维分量从状态Z=i获得的数据遵循中心值cij和方差值vij的正态分布,则如下写出公式(13)。
P ( X = i | Z = j ) = Π d = 1 D ∫ - ∞ ∞ d X d N ( X d | c id , v id ) N ( X d | c jd , v id ) Σ j = 1 N N ( X d | c jd , v jd ) . . . ( 13 )
这里,N(x|c,v)是图8A和图8B所示的中心c和方差v的正态分布的x的概率密度。
公式(13)在分母中包括具有许多峰值的正态分布,并且一般难以以分析方式获得。因此,按照与计算公式(8)的信息熵的差ΔH相同的方式,必需使用利用正态分布的随机数的蒙地卡罗积分等来获得数值。
然而,如获得公式(8)时那样,在执行测量之前,不必每次都执行公式(13)的计算。可以仅在隐马尔可夫模型的首次构造或模型更新时计算一次公式(13),并且存储用于保留结果的表以便在必要时针对公式(9)进行替代。
图14示出了变量转换表的示例,该变量转换表是下述表:其中,针对每个状态Z保留获得离散变量Xt 的观测概率,作为公式(13)的计算结果。
图14的状态编号i对应于公式(13)的状态Z,并且图14的状态编号j对应于公式(13)的离散变量Xt 。换言之,公式(13)的P(Xt |Z)是图14中的P(j|i),并且P(j|i)=rij
注意,在一般的隐马尔可夫模型中,这种变量转换表不是必要的。当然,如果存在计算资源中的空间、到了公式(8)可以通过数值计算来计算的程度,则这种变量转换表不是必要的。当不存在足以执行数值积分的计算资源时,在执行某种程度的公式(8)的严格近似时,使用这种变量转换表。
此外,对于该变量转换表中的元素rij,必需其量为状态编号的平方的参数。然而,在多数情况下,特别是在数据空间中存在很少交叠和隐藏的模式下,该变量转换表中的元素rij变为0。因此,为了省略存储器资源,可以按照以下方式来进行各种类型的简化:仅存储变量转换表中的不为0的元素,仅存储每行中的具有高值的高级元素,使得所有元素为相同常数等。最大胆的简化是在假定状态i和j很少占用同一数据空间的情况下设置rijij。δij是克罗内克函数(Kronecker delta),并且在i=j时为1,而在其它情况下为0。在这种情况下,公式(9)被无限制地简化,以被表示为公式(14)。
ΔH ≅ Δ H ~ ≡ - I ( Z t ; X t ~ ) = Σ Z t = 1 N P ( Z t ) log P ( Z t ) . . . ( 14 )
公式(14)意味着测量后的预测熵为0,并且估计了仅具有测量前的预测熵的、可通过测量获取的信息量。换言之,公式(14)假定测量后的熵变为0,这是由于当通过设置rijij来执行测量时必然统一地决定状态。此外,关于公式(14),如果测量前的数据的模糊度为高,则公式(14)的值增大,并且可以根据测量获取的信息量变大,但是如果测量前的数据的模糊度为低,则公式(14)的值减小,这意味着可以在不执行测量的情况下仅根据预测来充分地解决模糊度。
感测控制处理的流程图
接着,将参照图15的流程图来描述由测量系统1控制传感器14的开启和关闭的感测控制处理。注意,假定从模型存储单元18中获取的作为学习模型的隐马尔可夫模型的参数在该处理之前就存在于测量信息量计算单元12中。
在步骤S1中,首先,时间序列数据输入单元11从数据存储单元15获取直到当前时间t的前一时间t-1测量的并且然后被累积的时间序列数据,并且然后将该数据提供到测量信息量计算单元12。
在步骤S2中,测量信息量计算单元12使用公式(4)计算在当前时间t的前一时间t-1处获得数据的条件下的后验概率P(Zt-1|xt-1)。
在步骤S3中,测量信息量计算单元12使用公式(3)预测在传感器14执行当前时间t处的测量之前的先验概率P(Zt)=P(Zt|x1:t-1)。
在步骤S4中,测量信息量计算单元12使用公式(8)计算执行和不执行传感器14的测量时的信息熵的差ΔH。替选地,作为步骤S4,测量信息量计算单元12通过执行作为公式(8)的近似计算的、使用图14的变量转换表的公式(9)或(14)的计算,来计算执行和不执行传感器14的测量时的信息熵的差ΔH。
在步骤S5中,测量信息量计算单元12通过确定所计算的信息熵的差ΔH是否低于或等于预定阈值ITH,来确定在时间t处是否应执行传感器14的测量。
当在步骤S5中信息熵的差ΔH低于或等于阈值ITH并且传感器14的测量被确定为执行时,处理进行到步骤S6,并且测量信息量计算单元12确定操作传感器14,并将该确定提供到测量控制单元13。测量控制单元13控制传感器14操作,以便从传感器14获取测量数据。所获取的测量数据被提供到数据存储单元15。
另一方面,当在步骤S5中信息熵的差ΔH大于阈值ITH并且传感器14的测量被确定为不执行时,跳过步骤S6的处理,并且然后处理结束。
以传感器14的给定测量间隔(例如以一秒的间隔等)执行上述处理。
在上述感测控制处理中,可以仅在根据传感器14的测量获得的信息量大时执行传感器14的测量。此外,当执行传感器14的测量时,使用传感器14的测量数据,并且当不执行传感器14的测量时,基于在时间t之前累积的时间序列数据,使用作为学习模型的隐马尔可夫模型来估计时间t处的数据。因此,传感器14可以被控制为执行高效的测量,而不执行不必要的测量。
注意,在上述感测控制处理中,用于确定是否要操作传感器14的阈值ITH可以是预先决定的固定值,或者可以是根据用于决定测量成本的指标的当前裕度而改变的变化值。例如如果假定测量成本对应于电池的消耗电力,则阈值ITH(R)根据电池的剩余量R而改变,并且当电池的剩余量低时,阈值ITH可以根据该剩余量改变,以使得在获得的信息量不是非常大的情况下不操作传感器14。此外,当测量成本对应于CPU的使用率时,阈值ITH可以根据CPU的使用率来改变,并且当CPU的使用率高时,如果获得的信息量不是非常大,则传感器14可以被控制为不操作等。
注意,作为控制传感器14的测量以实现高效测量的方法,还考虑了降低传感器14的测量准确度的方法。例如,考虑了用于使测量信号的强度变弱的、控制传感器14以改变近似计算的收敛时间的设置的方法等。当如上所述为了降低测量准确度而执行改变操作等级的控制时,希望执行控制以使得根据改变后的操作等级测量的信息熵的差ΔH至少小于0。
直到预定阶段的感测控制处理
在上述感测控制处理中,每当到测量的时间到来,确定是否要执行测量。接下来,将描述感测控制,在该感测控制中,确定是否要执行测量直到预先设置的预定阶段,并且感测转入睡眠模式,直到测量被确定为必要时为止。
图16是描述了确定直到预先设置的预定阶段的测量的必要性的处理的格图。
在确定直到预定阶段的测量的必要性的处理中,将通过进行如下设置来提供描述:如图16所示,获得到当前时间t的观测(测量数据)xt,并且测量信息量计算单元12确定在将来时间t+1,t+2,…处的测量的必要性。
图17是描述了如下感测控制处理的流程图:在该感测控制处理中确定直到预定阶段的测量的必要性。
首先,在步骤S21中,时间序列数据输入单元11从数据存储单元15获取到当前时间t的时间序列数据,并将该数据提供到测量信息量计算单元12。
在步骤S22中,测量信息量计算单元12使用公式(15)计算获得当前时间t处的数据的条件的后验概率P(Zt|xt)。由于在当前时间t处获得观测(测量数据)xt,所以以如下公式表示当前时间t处的后验概率P(Zt|xt):其中,用数据xt替代公式(4)的观测xt。也就是,后验概率P(Zt|xt)被表示如下。
P ( Z t | x t ) = P ( x t | Z t ) P ( Z t ) Σ Z t = 1 N P ( x t | Z t ) P ( Z t ) . . . ( 15 )
然后,在步骤S23中,测量信息量计算单元12使用公式(16),预测从当前时间t开始的第k阶段的将来时间t+k处的先验概率p(Zt+k)。
P ( Z t + k ) = P ( Z t + k | x 1 : t ) = Σ Z t + k - 1 = 1 N P ( Z t + k | Z t + k - 1 ) P ( Z t + k - 1 ) . . . ( 16 )
在步骤S23中,测量信息量计算单元12可以使用以下公式(17)来替代公式(16)。
P ( Z t + k ) = max Z t + k - 1 ( P ( Z t + k | Z t + k - 1 ) P ( Z t + k - 1 ) ) / Ω . . . ( 17 )
注意,对于指定从当前时间t开始的预定阶段的时间的变量k,1被替代为初始值。
在步骤S24中,测量信息量计算单元12计算从当前时间t开始的第k阶段的将来时间t+k的信息熵的差ΔHt+k。信息熵的差ΔHt+k可以把上述公式(8)的右边的下标t计算为t+k。当执行公式(9)和(14)的近似时,也可以执行相同计算。
在步骤S25中,测量信息量计算单元12确定是否计算了从当前时间t到预先规定的阶段的信息熵的差ΔHt+k。在步骤S25中,确定了尚未获取到限定阶段的信息熵的差ΔHt+k,处理进行到步骤S26,k递增一,并且然后处理返回到步骤S23。因此,上述步骤S23和S24被执行,并且计算下一阶段的信息熵的差ΔHt+k
另一方面,在步骤S25中,当到限定阶段的信息熵的差ΔHt+k的计算被确定为结束时,处理进行到步骤S27,并且然后测量信息量计算单元12获取从当前时间t到限定阶段的预测信息熵的差ΔH的预测时间序列数据。具体地,如果预测了从当前时间t到第K阶段的时间t+K的信息熵的差ΔH,则通过测量信息量计算单元12获取{ΔHt+1,ΔHt+2,ΔHt+3,…,ΔHt+K}。
在步骤S28中,测量信息量计算单元12对如下阶段数目进行计数:其中,暂停到限定阶段的信息熵的差ΔH的预测时间序列数据的测量;具体地,对大于阈值ITH的值持续的阶段数目进行计数。该计数结果被从测量信息量计算单元12提供到测量控制单元13。
在步骤S29中,测量控制单元13按照从测量信息量计算单元12提供的计数数目而使得传感器14暂停测量。传感器14根据测量控制单元13的控制暂停测量。
在经过了从测量信息量计算单元12提供的计数数目之后,在步骤S30中测量控制单元13使得传感器14操作以开始测量。传感器14获取测量的数据,并使得数据存储单元15存储该数据。
如上,通过预测从当前时间t到限定阶段的信息熵的差ΔH,测量系统1可以确定是否执行到预先设置的预定阶段的测量,并使得传感器14停止测量,直到测量被确定为必要时为止。
数据恢复处理的流程图
接着,将描述由数据恢复单元16执行的数据恢复处理。
当在给定时间段内累积的时间序列数据中的一些丢失时,数据恢复单元16通过将维特比算法应用于时间序列数据来恢复丢失数据。维特比算法是根据给定的时间序列数据和隐马尔可夫模型来估计最可能的状态序列的算法。
图18是由数据恢复单元16执行的数据恢复处理的流程图。该处理在给定的定时处被执行,其中给定的定时例如像一天一次的周期性定时、或模型存储单元18的学习模型被更新的定时。
首先,在步骤S41中,数据恢复单元16获取作为传感器14的测量结果而新累积在数据存储单元15中的时间序列数据。这里获取的时间序列数据中的一些包括数据丢失。
在步骤S42中,数据恢复单元16执行前进处理(forward process)。具体地,数据恢复单元16关于在从阶段1到阶段t的时间方向上获取的t个时间序列数据片段,从阶段1开始按顺序计算直到阶段t的每个状态的概率分布。在阶段t中的状态Zt的概率分布是使用上述公式(15)计算的。
对于公式(15)的P(Zt),采用以下公式(18),以使得只有到状态Zt的各转移当中的具有最高概率的转移被选择。
P(Zt)=max(P(Zt-1|x1:t-1)P(Zt|Zt-1))/Ω…(18)
公式(18)中的Ω是公式(18)的概率的标准化常数。此外,对初始状态的概率分布给出与公式(1)相等的概率,或当已知初始概率π(Z1)时使用初始概率π(Z1)。
在维特比算法中,当仅选择了按顺序从阶段1至阶段t的到状态Zt的各转移当中的具有最高概率的转移时,必需存储被选择的转移。因此,数据恢复单元16通过计算阶段t中的、在以下公式(19)中表示的mt(Zt),来计算和存储到阶段t的各转移当中的具有最高概率的转移的状态Zt-1。数据恢复单元16通过执行与公式(19)的处理相同的处理,来存储从阶段1到阶段t的每个状态中的具有最高概率的转移的状态。
m t ( Z t ) = arg ma x Z t - 1 ( P ( Z t - 1 | x 1 : t - 1 ) P ( Z t | Z t - 1 ) ) . . . ( 19 )
接着,在步骤S43中,数据存储单元16执行回溯处理(backtraceprocess)。回溯处理是如下处理:其中,在时间序列数据中,在从最新的阶段t到阶段1的时间方向的相反方向上选择具有最高状态概率(似然性)的状态。
在步骤S44中,数据恢复单元16通过以时间序列的方式布置在回溯处理中获得的状态,来生成最大似然性状态序列。
在步骤S45中,数据恢复单元16基于对应于时间序列数据的丢失数据部分的最大似然性状态序列的状态,来恢复测量数据。假定例如丢失数据部分是从阶段1到阶段t的阶段p的数据片段。当数据序列数据具有离散符号时,恢复数据xp是使用以下公式(20)来生成的。
x p = max x p ( P ( x p | z p ) ) . . . ( 20 )
根据公式(20),具有最高似然性的观测xp被指派为阶段p的状态zp下的恢复数据。
此外,当时间序列数据具有连续符号时,恢复数据xp的j维分量xpj是使用以下公式(21)生成的。
x pj = μ z p , j . . . ( 21 )
在步骤S45的处理中,当针对时间序列数据的所有丢失数据部分恢复了测量数据时,数据恢复处理结束。
如上,当时间序列数据具有丢失数据时,数据恢复单元16通过应用维特比算法来估计最大似然性状态序列,并基于估计的最大似然性状态序列来恢复对应于时间序列数据的丢失数据部分的测量数据。
注意,在本实施例中,基于最大似然性状态序列,仅针对时间序列数据的丢失数据部分来生成(恢复)数据,但是可以针对全体时间序列数据生成数据,以便在更新学习模型时使用。
如上配置的测量系统1可以由信息处理装置和服务器来配置,其中该信息处理装置上安装有传感器14,而该服务器对学习模型进行学习并将学习到的学习模型的参数提供到信息处理装置。在此情况下,信息处理装置包括时间序列数据输入单元11、测量信息量计算单元12、测量控制单元13、传感器14、以及数据存储单元15。此外,服务器包括数据恢复单元16、模型更新单元17、以及模型存储单元18。然后,信息处理装置一天一次地等将在数据存储单元15中累积的时间序列数据周期性地发送给服务器,并且服务器在时间序列数据被添加时更新学习模型,并将更新后的参数提供到信息处理装置。信息处理装置可以是移动装置,例如智能电话、平板终端等。当信息处理装置具有基于累积的时间序列数据对学习模型进行学习的处理能力时,该装置当然可以具有测量系统1的整体配置。
2.第二实施例
考虑测量失败的情况的实施例
在上述第一实施例中(在第二实施例的描述中,第一实施例被称作基本实施例),假定传感器14的测量在包括当前时间的将来当然会成功。然而,在上述示例中,还考虑了以下情况:其中,由于在过去的时间序列数据中包括丢失数据,因此传感器14测量失败。例如当传感器14是获取当前位置的GPS传感器时,GPS传感器可能无法获取当前位置,这是由于该传感器因其位于车辆、室内场所等而不能找到卫星。此外,即使测量成功,也考虑了测量准确度变得更差的情况。
因此,作为上述基本实施例的修改示例,接着将描述考虑传感器14的测量失败的情况的示例。注意,在以下描述中,适当地将不再重复与基本实施例中相同的部分的描述。
首先,当考虑测量失败的情况时,不执行测量时的状态的概率分布(先验概率)P(Zt)和信息熵Hb与基本实施例中的相同。换言之,不执行测量时的状态的概率分布(先验概率)P(Zt)是:
P ( Z t ) = P ( Z t | x 1 : t - 1 ) = Σ Z t - 1 = 1 N P ( Z t | Z t - 1 ) P ( Z t - 1 ) . . . ( 3 )
并且不执行测量时的信息熵Hb是:
H b = H ( Z t )
= - Σ Z t = 1 N P ( Z t | x t ) log P ( Z t | x t )
= - Σ Z t = 1 N P ( Z t ) log P ( Z t ) . . . ( 6 )
另一方面,由于必需考虑期望测量但是失败的情况,所以当在时间t处执行测量时的后验概率的概率分布P(Zt|Xt)和信息熵Ha与基本实施例不同。
在考虑测量失败的情况的第二实施例中,如图19所示,测量成功的概率(成功率)sProb_i被新添加到状态表中的每个状态i,在该状态表中存储有图8A和图8B所示的每个状态的观测概率。注意,在图19中,对应于状态i的中心值c_i是通过简化图8A的中心值cij(j=1,2,…,j,…,J)来表示的中心值,而对应于状态i的方差值v_i是通过简化图8B的方差值vij(j=1,2,…,j,…,J)来表示的方差值。
例如如下给出图19的成功率sProb_i。首先,使用作为学习数据而准备的时间序列数据来决定学习模型的参数,并使用学习模型对时间序列数据的每个测量数据片段给出状态。然后,针对每个状态来对时间序列数据的每个测量数据片段进行分类,根据状态中的成功测量的次数和失败测量的次数获得每个频率概率,并由此获得成功率sProb_i。
图19的状态表可以被认为是观测离散符号时的状态表的一种类型,其中存储有观测如下两个符号Mt中的任一个的概率:这两个符号Mt包括被称为测量成功的符号(Mt=0)以及被称为测量失败的符号(Mt=1)。换言之,图6的状态表可以用作存在两种离散符号的情况。此刻,在状态Z中,成功测量的概率由P(M=0|Z)来表示。此外,执行测量时的概率分布(后验概率)P(Zt|Xt,Mt)可以由公式(22)表示。
P ( Z t | X t , M t ) = P ( M t | Z t ) P ( Z t ) Σ Z t = 1 N P ( X t , M t | Z t ) P ( Z t ) . . . ( 22 )
此外,执行测量时的信息熵Ha'可以由公式(23)表示。
H a , = - Σ M t = 0 1 ∫ dX t Σ Z t = 1 N P ( X t , M t | Z t ) P ( Z t ) log P ( X t , M t | Z t ) P ( Z t ) Σ Z t , = 1 N P ( X t , M t | Z t , ) P ( Z t , ) . . . ( 23 )
结果,使用公式(6)和(23)来将执行和不执行传感器14的测量时的信息熵的差ΔH表示如下。
ΔH = H a , - H b
= - Σ Z t = 1 N P ( M t = 0 | Z t )
∫ dX t P ( X t | Z t ) P ( Z t ) log P ( M t = 0 | Z t ) P ( X t | Z t ) Σ Z t , N P ( M t = 0 | Z t , ) P ( X t | Z t , ) P ( Z t , ) . . . ( 24 )
公式(24)等同于通过下述方式来形成的公式:在基本实施例中的信息熵的差ΔH的公式(8)中,用在状态Zt中测量成功并由此获得概率变量Xt的似然性P(Mt=0|Zt)P(Xt|Zt)来替代从状态Zt获得概率变量Xt的似然性P(Xt|Zt)。
关于公式(24)的信息熵的差ΔH,可以按照与基本实施例中相同的方式执行用于避免每个时间的数值积分的近似。如果针对公式(24)执行用离散变量Xt 替代连续变量Xt的近似(变量转换),则获得以下公式(25)。
ΔH = - Σ Z t = 1 N P ( M t = 0 | Z t ) P ( Z t )
Σ X t ~ = 1 N P ( X t ~ | Z t ) log P ( M t = 0 | Z t ) P ( X t ~ | Z t ) Σ Z t , = 1 N P ( M t = 0 | Z t ) P ( X t ~ | Z t , ) P ( Z t , ) . . . ( 25 )
公式(25)等同于通过下述方式来形成的公式:在基本实施例中的信息熵的差ΔH的近似公式(9)中,用在状态Zt中测量成功并由此获得概率变量Xt的似然性P(Mt=0|Zt)P(Xt|Zt)来替代从状态Zt获得概率变量Xt的似然性P(Xt|Zt)。
如果针对通过学习时间序列数据而获得的状态变量Z高效地执行变量转换,并且还以相同方式执行简化以使得rijij成立,则由公式(26)来表示公式(25)。
ΔH = Σ Z t = 1 N P ( M t = 0 | Z t ) P ( Z t ) log P ( Z t ) . . . ( 26 )
如上,通过添加每个状态i的成功率sProb_i作为状态参数,在考虑测量失败的情况下计算信息熵的差ΔH,并且由此可以执行基于计算结果的感测控制。
3.第三实施例
考虑处于未知状态的实施例
在上述第一实施例和第二实施例(在第三实施例的描述中,第一实施例和第二实施例被称作基本实施例)中,假定通过测量估计的状态变量的当前状态当然包括在模型中。然而,在模型中准备的状态中,还考虑了难以被表示的数据的处理。例如当传感器14是获取当前位置的GPS传感器时,并且当用户位于用户未曾去往的地点时,难以利用状态变量对该地点进行建模,因此该模型难以表示该状态。
因此,将通过进一步修改上述基本实施例和修改示例,而描述考虑了难以使用现有模型表示观测数据的情况的示例。注意,在以下描述中,适当地将不再重复与基本实施例和上述修改示例中相同的部分的描述。
首先,考虑了包括未知状态时的模型的状态转移图。如图20所示,例如,考虑了如下情况下的状态转移图:在该情况下,将未知状态添加到包括图5的三个状态的模型的状态转移图。存在未知状态的模型可以被设置为如下模型:在该模型中,以该方式将除了现有状态之外的仅一个未知状态添加到状态转移图。
此外,作为用于决定该未知状态的转移参数和状态参数的方法,例如,存在在本公开的发明人发明的日本未审查专利申请公开2012-8659中所公开的方法等。
根据本文件,该未知状态的状态参数可以:
·以给定的概率获得从所有状态到未知状态的转移;
·以给定的概率获得从未知状态到所有状态的逆向转移;以及
·被设置为使得:关于未知状态的中心和方差,中心可以是任意位置,但是在观测涉及连续量的情况下,方差是与该观测的可能范围相同的大的方差。
注意,在用于决定状态参数的方法当中,示出的第三状态中的参数可以被更加简单地处理。关于未知状态,取代准备中心、方差等的状态参数,例如存在如下方法:其中,仅预先准备使用参数计算的似然性P(X|Z=zu)。这里,zu表示未知状态,并且通过对现有模型的状态数目N加1,而使考虑未知状态的隐马尔可夫模型的状态数目为N+1。此外,观测X的范围被预先决定,并且该值在该范围中是恒定的,但是该值在该值超过该范围的情况下为0。
综上所述,当考虑未知状态时,可以通过对现有隐马尔可夫模型的参数添加以下概率而生成考虑未知状态的模型:
·从所有状态到未知状态的转移概率P(Z=Zu|Z=Zi)(i=1,…,N);
·从未知状态到所有状态的转移概率P(Z=Zi|Z=Zu);以及
·从未知状态获得观测的似然性P(X|Z=zu)。
图21是如下情况下的格图:在该情况下,基于如图11所示的存在四种已知状态时的格图,添加一个未知状态以考虑未知状态。
如图21所示,包括该未知状态的隐马尔可夫模型中的未知状态可以从所有已知状态转移和向所有已知状态转移。此外,预先决定转移概率。
注意,在图21中,存在从观测到未知状态的输入,但是这些输入并非一直都是必需的。当必需虚拟输入(dummy input)时,设置这种输入,而当如上所述预先决定未知状态的似然性时,不必设置输入。
如上,通过预先决定从已知状态到未知状态的转移概率、从未知状态到已知状态的转移概率以及未知状态的似然性,能够以与图11所示的格图中的情况相同的方式来处理图21所示的格图中的情况。
换言之,通过处理如图21中的格图,也可以在包括未知状态的模型中获得上述先验概率和后验概率。此外,用于先验概率的公式(3)和用于后验概率的公式(4)或(22)可以由以下公式来替换:该公式是通过用包括未知状态的状态数目N+1来替代状态数目N而形成的。
最后,将描述存在未知状态时的信息熵的计算。
对于存在未知状态时的信息熵,必须考虑未知状态中的信息熵。在这种情况下,未知状态中的信息熵与均等地生成所有已知状态时的信息熵相同或者比它更大。因此,将未知状态中的信息熵视为均等地生成已知状态时的信息熵。在这种假设下,首先,不执行测量时的信息熵Hb由公式(27)表示。
H b = - Σ Z t = 1 N P ( Z t ) log P ( Z t ) + P ( Z t = z u ) log N
= - Σ Z t = 1 N + 1 P ( Z t ) log P ( Z t ) + P ( Z t = z u ) log NP ( Z t = z u ) . . . ( 27 )
通过对公式(6)的第一行的信息熵Hb进一步添加直到此时的P(Zt=zu)LogN,而获得了公式(27)的信息熵Hb。该增加项是通过添加状态未知时的信息熵而获得的。
另一方面,可以按照与公式(7)中相同的方式使用后验概率将执行测量时的信息熵Ha表示如下。
H a = - ∫ dX t Σ Z t = 1 N + 1 P ( Z t | X t ) log P ( Z t | X t )
= - ∫ dX t Σ Z t = 1 N + 1 P ( X t | Z t ) P ( Z t ) log P ( X t | Z t ) P ( Z t ) Σ Z t , = 1 N + 1 P ( X t | Z t , ) P ( Z t , ) . . . ( 28 )
公式(28)与公式(7)的差别是要相加的部分跨度为从1到N+1而不是从1到N。公式(27)不采用在未知状态中以相同的概率1/N发生N个状态的假设,这不同于公式(28)。原因是在不执行测量时难以根据未知状态的数据来估计状态变量,但是如果执行测量并且确定了作为测量结果而获得的观测是未知状态,则可以将在其中新生成所获得的观测的状态添加到模型。
因此,根据公式(27)和(28),信息熵的差ΔH如下。
ΔH = H a - H b
= - ∫ dX t Σ Z t = 1 N + 1 P ( X t | Z t ) P ( Z t ) log P ( X t | Z t ) Σ Z t , = 1 N + 1 P ( X t | Z t , ) P ( Z t , )
- P ( z u ) log NP ( z u ) . . . ( 29 )
以与上述实施例相同的方式,如果进行了通过执行测量而统一地决定状态的近似,则公式(29)可以被修改如下。
ΔH ≅ Σ Z t = 1 N P ( Z t ) log P ( Z t ) - P ( Z t = z u ) log N . . . ( 30 )
此外,如果测量成功,则统一地决定状态,但是当还考虑了失败时,公式(29)可以被表示如下。
ΔH ≅ Σ Z t = 1 N P ( M t = 0 | Z t ) log P ( Z t ) - P ( Z t = z u ) log N . . . ( 31 )
4.第四实施例
在上述实施例中,已经描述了如下示例:其中,使用隐马尔可夫模型学习过去的时间序列数据,并预测传感器14的测量的信息量。
然而,如上面参照图1所描述的,还可以使用作为数据库而被存储在模型存储单元18中而不改变的、过去的时间序列数据,来预测预测传感器14的测量的信息量。因此,在第三实施例中,将描述如下方法:该方法用于将过去的时间序列数据在模型存储单元18中存储为数据库并且将其用作数据库,而不进行改变。注意,在以下描述中,图1的测量系统1的模型存储单元18将被数据库存储单元18所替代,并且将适当地采用测量系统1的其它配置。
时间序列数据输入单元11将最近获得的并且被存储在作为数据缓冲器的数据存储单元15中的、具有预定长度(阶段数)L的时间序列数据x1:L提供到测量信息量计算单元12。
测量信息量计算单元12从存储在数据库存储单元18中的、具有长度T的过去的时间序列数据z1:T中提取具有与最近的时间序列数据x1:L相同的长度L的、以第t个(t=1,…,T-L)片段作为尾部的时间序列数据zt-L:t,并计算所提取的部分和最近的时间序列数据x1:L的相似度D(x1:L,zt-L:t)。为了计算相似度D(x1:L,zt-L:t),可以采用例如在以下公式(32)中表示的具有相同长度L的最近的时间序列数据x1:L和时间序列数据zt-L:t的欧几里得距离(Euclidean distance)。
D ( x 1 : L , z t - L : t ) = Σ l = 1 L | | x l - x t - L + l | | 2 . . . ( 32 )
在公式(32)中,时间序列数据zt-L:t表示在通过对存储在数据库存储单元18中的每个阶段的数据给出序列号zt(t=1,…,T)而获得数据的情况下,从数据库存储单元18中提取的、序列号为zt-L到zt的、具有长度L的时间序列数据。
测量信息量计算单元12通过从序列号zt-L=1开始按顺序对存储在数据库存储单元18中的过去的全体时间序列数据执行计算,来计算数据库中的所有位置(更具体地,尾部处于第t个(t=L,…,T-L)顺序的所有位置)与最近的时间序列数据x1:L的相似度D(x1:L,zt-L:t)。
通过以下公式(33)来表示从提取自数据库存储单元18的一个时间序列数据片段zt-L:t来观测最近的时间序列数据x1:L的似然性P(x1:L|zt-L:t)。
P ( x 1 : L , z t - L : t ) = exp ( - β 2 D ( x 1 : L , z t - L : t ) ) . . . ( 33 )
其中,β是预定系数。
此外,使用该似然性P(x1:L|zt-L:t),以在获得最近的时间序列数据x1:L时的时间序列数据zt-L:t的贡献的形式,使用以下公式(34)来获取在获得最近的时间序列数据x1:L时的时间序列数据zt-L:t的后验概率P(zt-L:t|x1:L)。
P ( z t - L : t | x 1 : L ) = P ( x 1 : L | z t - L : t ) P ( z t - L : t ) Σ t = 1 T P ( x 1 : L | z t - L : t ) P ( z t - L : t )
P ( x 1 : L | z t - L : t ) Σ t = 1 T P ( x 1 : L | z t - L : t ) . . . ( 34 )
公式(34)的右边的第一行和第二行的修改基于以下假设:所提取的时间序列数据zt-L:t的贡献是恒定的,并且P(zt-L:t)=1。此外,公式(34)的和(Σ)表示当跨越存储在数据库存储单元18中的全体的过去的时间序列数据来改变序列号zt-L时获得的和。
通过这样做,可以将下一阶段(在时间序列数据Z的编号上的第T+1阶段和在时间序列数据x的编号上的第L+1阶段)的数据XL+1=ZT+1的先验概率P(ZT+1)预测如下。
P(ZT+1)=ΣP(zt-L:t|X1:L)N(ZT+1|zt+12)…(35)
这里,有区别地使用XL+1和ZT+1,但是XL+1意味着通过测量获得的数据,而ZT+1意味着实际数据。用于计算信息量的状态变量意味着是实际数据ZT+1。此外,存在XL+1=ZT+1,但是这是由于假设不存在测量误差,并且当不存在测量误差时,观测变量和状态变量是一样的。另一方面,当存在测量误差时,根据测量获得的数据XL+1不一定与实际数据ZT+1一致,但是将在假设表示根据测量获得的数据的观测X与表示实际数据的状态变量Z一致的情况下进行以下描述。
在公式(35)中,N(Z|z,σ2)表示如下正态分布:数据被分布为以z为中心,具有方差σ2。此外,公式(35)假定下一观测XL+1(=ZT+1)是如下的概率变量:该概率变量被分布为以从数据库存储单元18中提取的、在时间序列数据zt-L:t的前一个阶段中的位置zt+1作为中心,具有预先决定的方差σ2
基于以上内容,由于获得了观测XL+1(=ZT+1)的先验分布P(XL+1=ZT+1),因此使用先验分布P(XL+1=ZT+1)不执行测量时的信息熵Hb可以通过公式(36)来表示。
H b = - ∫ dZ T + 1 P ( Z T + 1 ) log P ( Z T + 1 ) . . . ( 36 )
另一方面,当不执行测量时,统一地决定数据XL+1=ZT+1。因此,执行测量时的信息熵Ha为0(Ha=0)。
结果,在过去的时间序列数据被存储为数据库而不进行改变的情况下的信息熵的差ΔH通过公式(37)来表示。
ΔH = H a - H b = ∫ dZ T + 1 P ( Z T + 1 ) log P ( Z T + 1 ) . . . ( 37 )
可以如上计算在过去的时间序列数据被存储为数据库而不进行改变的情况下的信息熵的差ΔH,并且基于计算的信息熵的差ΔH,可以控制传感器14的测量。
注意,在上述描述中,信息熵Ha一定被设置为0。这是基于根据观测获得的数据x一定是实际数据的假设。然而,在大多数情况下,根据观测获得的数据x包括关于实际数据z的误差。归根到底,上述信息熵Ha一定为0的示例是表示实际数据的状态变量z与表示测量数据的观测变量x一致时的示例。如果测量数据不与实际数据一致,并且测量结果包括数据、表示误差幅度的方差和标准偏差、或任何置信度,则信息熵Ha通过与这种信息结合而不变为0。用于在这种情况下计算信息熵的大小的方法根据呈现误差的方式而不同。例如,假定关于第i观测Xi,观测的j维分量和误差的j维分量作为测量值xij和误差的标准偏差eij 2而存在。在这种情况下,第i实际数据Zi的j维实际数据Zij被认为存在于以测量值xij作为中心的方差eij 2的正态分布的范围中。因此,具有状态变量Z的信息熵Ha为:
H a = ∫ Π j = 1 D d Z ij N ( Z ij | x ij , e ij 2 ) P ( Z ij ) log N ( Z ij | x ij , e ij 2 ) P ( Z ij )
并且信息熵Ha不一定为0。其中,P(Zij)表示根据公式(35)获得的、第i实际数据的预测Zi的j维分量的先验概率。
5.应用的应用示例
接着,将参照图22至图29描述应用上述测量系统1的情况。下面要描述的情况是:利用作为GPS传感器的传感器14,使用隐马尔可夫模型学习用户的过去的移动历史,以针对用户的当前移动来控制安装在移动装置等上的GPS传感器的操作。
当操作安装在移动装置等上的GPS传感器时,消耗移动装置的电池。因此,由GPS传感器的操作而导致的电力消耗可以被认为是测量成本,并且如果没有产生这种测量成本,则GPS传感器可以一直被操作,但是实际上,由于因测量而产生成本,所以必需高效地执行测量同时抑制测量成本。例如如果用户连续位于(停留)同一位置,则获取目前的数据是无意义的,因此,希望暂停测量。相反,如果用户移动,则希望比他或她停留时更密集地获取数据。
更具体地,作为操作安装在移动装置等上的GPS传感器时的一般请求,存在以下项目。
·如果用户当前移动,则希望测量次数增加。相反,如果预测用户暂时停留,则希望测量次数减小。
·如果位置是用户过去已经通过(一次或多次)的道路并且由此可以在不进行测量的情况下被预测,则希望测量次数减小。
·即使由于测量次数减少而稀少地存在移动历史(观测数据),也在稍后执行数据填充,以便将数据恢复为与获取间隔稠密的部分相同。
·即使预测路径是已知道路、处于分路中等,也希望执行测量以便知道其终点。
·如果预测路径是隧道、山谷等而使得测量是困难的,则希望暂停测量。
根据应用本技术的测量系统1,通过计算执行和不执行GPS传感器的测量时的信息熵的差ΔH来统一地处理上述请求,并且由此可以控制GPS传感器的操作。
隐马尔可夫模型
图22示出了通过使用隐马尔可夫模型学习用户的移动历史而获得的学习结果。
在图22中,学习数据是用户的过去的移动历史,并且时间序列数据包括当用户在过去移动时由GPS传感器测量的时间、纬度和经度。此外,图22中被设置成覆盖移动路径的多个椭圆中的每个椭圆示出了从隐马尔可夫模型的状态生成的测量数据的概率分布的轮廓线。
对应于图22所示的多个椭圆中的每个椭圆的状态的中心值和方差值以图8A和图8B的形式被存储在模型存储单元18中,作为状态表。此外,对应于图22所示的多个椭圆中的每个椭圆的状态的成功率也以图19的形式被存储在模型存储单元18中,作为状态表。此外,对应于图22所示的多个椭圆中的每个椭圆的状态之间的转移概率也以图6的形式被存储在模型存储单元18中。注意,在日本未审查专利申请公开2011-59924和2012-8659等中,公开了隐马尔可夫模型的模型参数的计算方法,该日本未审查专利申请公开2011-59924和2012-8659是本公开的发明人的专利文件。
图23A和图23B示出了基于所学习的隐马尔可夫模型而计算的将来时间的状态的概率分布、以及基于该概率分布而预测的信息量。
图23A是示出了基于所学习的隐马尔可夫模型而计算的将来时间的状态的概率分布的表。
在图23中,时间t=0对应于当前时间,并且时间t=1、2、3和4表示将来。在图23A所示的示例中,状态被定义为在时间t=0处以概率1仅处于状态1,并且在时间t=1处以概率1仅处于状态2。另一方面,状态被定义为在时间t=2处以概率0.5处于状态1和3这两种状态中的任一种,在时间t=3处以概率0.5处于状态2和4这两种状态中的任一种,并且在时间t=4处以概率0.25处于状态1至4这四种状态中的任一种。
图23B示出了根据图23A的概率分布而计算的信息量、以及基于这些信息量而控制的传感器14的操作等级。
注意,图23B示出了通过计算执行和不执行测量时的信息量而获得的值,但是实际上这些值不是直接计算的。在图23B中假设存在这些值,以使得容易理解。
在图23B中,通过设置当前时间t=0,不执行测量时的信息量根据时间t=1、2、3和4依次为0.0、0.0、1.0、1.0和2.0。这意味着根据对远离当前时间的将来的预测,并未统一地决定状态。
另一方面,执行测量时的信息量根据时间t=1、2、3和4依次为0.0、0.0、1.0、0.0和0.0。由于信息量为“0.0”表示统一地决定状态,所以意味着甚至在将来时间通过测量而统一地决定状态。然而,当t=2时,信息量为1.0,这与不执行测量时相同。这意味着该量在执行和不执行测量时一样,从而暗示了测量失败。因此,执行测量时的信息量具有下述值:该值考虑了执行测量但失败的情况。
从图23B的顶部开始的第四行表示每个时间处的信息量的增益,并且接下来的第五行表示通过基于第四行中的信息量的增益来控制GPS传感器的操作等级而获得的控制结果。
信息量的增益是通过从不执行测量时的信息量中减去执行测量时的信息量而获得的值,并且对应于具有信息熵的差ΔH的反号的公式(8)的相互信息量。如根据公式(8)可见的那样,由于执行测量时的信息量(信息熵Ha)小于不执行测量时的信息量(信息熵Hb),所以信息熵的差ΔH始终为负。换言之,这意味着当信息熵的差ΔH小时,根据测量获得的信息量大,但是人很容易在瞬间认为当根据测量获得的信息量大时执行测量。因此,下文中,将使用与信息熵的差ΔH反号的信息量的增益的方面来提供描述。
信息量的增益随着时间t=0、1、2、3和4依次为0.0、0.0、0.0、1.0和2.0。因此,当时间t=0和1时,没有获得信息量的增益,并且甚至当在预测测量失败的时间t=2时,也没有获得信息量的增益。然后,当时间t=3和4时,首次获得信息量的增益。
在图23A和图23B的示例中,用于确定是否操作GPS传感器的阈值ITH被设置为1.0(ITH=1.0)。当时间t=0、1和2时,信息量的增益为0,确定即使操作GPS传感器也没有获得许多信息,因此,GPS传感器被控制为关闭。另一方面,当时间t=3和4时,信息量的增益为1.0或更大,因此确定根据GPS传感器的操作获得许多信息,并且GPS传感器被控制为开启。因此,测量信息量计算单元12安排将GPS传感器设置为处于睡眠模式直到时间t=2为止,并且在时间t=3处操作GPS传感器。因此,相比于以相等间隔操作GPS传感器时,能够更高效地收集数据。
将参照图24至图29来更详细地描述以下示例:在该示例中,基于隐马尔可夫模型来控制GPS传感器的操作,其中借助该隐马尔可夫模型来学习用户的移动历史。
图24示出了学习用户的移动历史所借助的隐马尔可夫模型的状态转移的一部分。
图25至图28描述了图24所示的四种请求。
(1)如果对应于当前值的状态不清楚,则执行测量。
(2)如果到移动目的地的路径是一条道路并且在将来状态之间存在一个转移(统一地决定状态),则不执行测量。
(3)当存在作为将来状态之间的转移的分路时,在经过分路点的位置处执行测量。
(4)如果由于停留在隧道或山谷处而不可以测量,则不执行测量。
图25是使用信息量的增益来描述请求“(1)如果对应于当前值的状态不清楚,则执行测量”的图。
在图25至图18中,附图中的黑色圆圈表示已知的过去的时间处的信息量的增益,而白色圆圈表示通过预测获得的信息量的将来增益。
如图25所示,如果当前状态(当前位置)不清楚,则在当前时间t=0处的执行测量时的信息量的增益变大。因此,请求“(1)如果对应于当前值的状态不清楚,则执行测量”可以利用以下处理来处理:在该处理中,如果在当前时间t=0处的执行测量时的信息量的增益等于或大于预定阈值ITH',则执行测量,并且如果该增益小于预定阈值ITH',则不执行测量。
图26是使用信息量的增益来描述请求“(2)如果到移动目的地的路径是一条道路并且在将来状态之间存在一个转移(统一地决定状态),则不执行测量”的图。
当到移动目的地的路径是一条道路时,统一地决定状态,因而获取初始地足够的信息量。因此,根据测量获得的信息量的增益很少。由于此原因,请求“(2)如果到移动目的地的路径是一条道路并且在将来状态之间存在一个转移(统一地决定状态),则不执行测量”也利用以下处理来处理:在该处理中,如果执行测量时的信息量的增益等于或高于预定阈值ITH',则执行测量,并且如果该增益在将来时间t=1.0,2.0,…处小于预定阈值ITH',则不执行测量。
图27是使用信息量的增益来描述请求“(3)当存在作为将来状态之间的转移的分路时,在经过分路点的位置处执行测量,在该位置处不是统一地决定状态”的图。
当存在分路时,在分路点之前统一地决定状态,但是在分路点之后,不是统一地决定状态。因此,在分路前的状态中,执行测量时的信息量的增益小,但是在分路后的状态中,执行测量时的信息量的增益大。因此,请求“(3)当存在作为将来状态之间的转移的分路时,在经过分路点的位置处执行测量”可以利用以下处理来处理:在该处理中,如果增益等于或高于预定阈值ITH',则执行测量,并且如果增益小于预定阈值ITH',则不执行测量。
图28是使用信息量的增益来描述请求“(4)如果由于停留在隧道或山谷处而不可以测量,则不执行测量”的图。
由于当处于隧道或山谷中时不能很好地执行测量,所以执行测量时的信息量的增益变小。因此,请求“(4)如果由于停留在隧道或山谷处而不可以测量,则不执行测量”可以利用以下处理来处理:在该处理中,如果增益等于或高于预定阈值ITH',则执行测量,并且如果增益小于预定阈值ITH',则不执行测量。
注意,如果仅利用如上的信息量的增益的预测来控制GPS传感器,则存在下述问题:当隐马尔可夫模型(学习模型)处于未知状态时,测量失败。因此,通过设置睡眠时间的上限(诸如不实施睡眠模式到特定阶段或更高阶段),可以避免测量失败的风险。
图29示出了通过执行连续测量来恢复稀少的时间序列数据的处理的示例。
在该数据恢复处理中,如图29的左边那样,首先根据稀少的时间序列数据生成状态序列。状态序列的这种生成是通过如上所述的维特比算法来实现的。然后,通过选择生成的状态序列中的、对应于时间序列数据的丢失部分的状态的数据来对时间序列数据的丢失数据部分进行插值。在图29中,加下划线的编号是在数据恢复处理中恢复的数据片段。
在上述示例中,虽然描述了在把根据测量产生的成本考虑为电池的消耗电力的情况下控制传感器14以高效地执行测量的示例,但是本技术还可以应用于希望执行高效测量的其它测量、检查等。作为本技术的应用示例,例如,考虑了产品缺陷检查、医学检查等。在这种检查中,如果以相等的时间间隔执行检查,则必定产生检查的负荷的成本。因此,通过计算根据检查获得的信息量,可以将检查控制为高效地执行而不执行不必要的检查。
注意,在本说明书中,流程图中描述的步骤可以按照遵循描述顺序的时间序列方式、按照并行方式、或者在存在调用的必要时间点处来执行,而不一定以时间序列方式执行。
注意,在本说明书中,系统是指被配置成包括多个装置的整个系统。
本技术的实施例不限于上述实施例,并且在不脱离本技术的主旨的范围内,可以以各种方式进行改变。
注意,本技术可以具有以下配置。
(1)一种信息处理装置,包括:传感器,所述传感器测量预定数据;模型存储单元,所述模型存储单元存储通过对在过去测量的时间序列数据建模而获得的模型;信息量计算单元,所述信息量计算单元基于根据所述模型的状态变量的先验分布决定的、不执行所述传感器的测量时的信息量与根据所述模型的状态变量的后验分布决定的、执行所述传感器的测量时的信息量之间的差,来计算根据测量获得的信息量;以及测量控制单元,所述测量控制单元基于根据测量获得的信息量来控制所述传感器。
(2)以上(1)中所述的信息处理装置,其中,存储在所述模型存储单元中的模型是隐马尔可夫模型。
(3)以上(2)中所述的信息处理装置,其中,不执行所述传感器的测量时的信息量是基于下述后验概率以及下述先验概率来计算的信息量:根据直到前次测量的时间序列数据而获得的所述隐马尔可夫模型的状态变量的后验概率,以及根据所述隐马尔可夫模型的转移概率而预测的当前时间的状态变量的先验概率。
(4)以上(2)或(3)中所述的信息处理装置,其中,执行所述传感器的测量时的信息量是按照下述方式获得的信息量:由观测变量来表示根据测量获得的数据,并且关于所述观测变量来计算如下信息量的期望值,该信息量能够根据所述隐马尔可夫模型的状态变量在获得所述观测变量的条件下的后验概率而计算。
(5)以上(4)中所述的信息处理装置,其中,根据测量获得的信息量是表示所述隐马尔可夫模型的状态的状态变量和所述观测变量的相互信息量。
(6)以上(4)或(5)中所述的信息处理装置,其中,所述信息量计算单元使用通过从所述观测变量执行针对所述状态变量的最大似然性估计而获得的近似观测变量,来计算所述状态变量和所述近似观测变量的相互信息量,作为根据测量获得的信息量。
(7)以上(6)中所述的信息处理装置,其中,所述信息量计算单元设置有变量转换表,在所述变量转换表中针对每个状态变量而存储获得所述近似观测变量的观测概率。
(8)以上(2)至(7)中的任一项中所述的信息处理装置,其中,通过对所述时间序列数据建模而获得的所述模型针对所述隐马尔可夫模型的每个状态而具有测量成功的概率或测量失败的概率,以作为参数。
(9)以上(2)至(8)中的任一项中所述的信息处理装置,其中,通过对所述时间序列数据建模而获得的所述模型还保留用于表示未知状态的状态,并具有用于计算从初始模型的状态到所述未知状态的转移概率、从所述未知状态到初始状态的转移概率、以及从所述未知状态生成观测的似然性的参数,以作为参数。
(10)以上(1)至(9)中的任一项中所述的信息处理装置,其中,所述信息量计算单元通过将根据测量获得的信息量与预定阈值进行比较,来确定是否使所述传感器执行测量。
(11)以上(1)至(10)中的任一项中所述的信息处理装置,其中,所述信息量计算单元计算直到预定阶段的根据测量获得的信息量,并且,基于计算结果而确定是否使所述传感器执行测量直到所述预定阶段。
(12)以上(1)至(11)中的任一项中所述的信息处理装置,还包括:数据恢复单元,当在由所述传感器测量并且然后被累积的、累积的时间序列数据中存在丢失数据时,所述数据恢复单元使用所述模型来估计与所述累积的时间序列数据相对应的最大似然性状态序列,并且基于所估计的最大似然性状态序列来恢复所述累积的时间序列数据的丢失数据部分。
(13)一种信息处理装置的信息处理方法,所述信息处理装置包括:传感器,用于测量预定数据;以及模型存储单元,用于存储通过对在过去测量的时间序列数据建模而获得的模型,所述方法包括以下步骤:基于根据所述模型的状态变量的先验分布决定的、不执行所述传感器的测量时的信息量与根据所述模型的状态变量的后验分布决定的、执行所述传感器的测量时的信息量之间的差,来计算根据测量获得的信息量;以及基于根据测量获得的信息量来控制所述传感器。
(14)一种程序,用于使得装置的计算机执行处理,所述装置包括:传感器,用于测量预定数据;以及模型存储单元,用于存储通过对在过去测量的时间序列数据建模而获得的模型,所述处理包括:基于根据所述模型的状态变量的先验分布决定的、不执行所述传感器的测量时的信息量与根据所述模型的状态变量的后验分布决定的、执行所述传感器的测量时的信息量之间的差,来计算根据测量获得的信息量;以及基于根据测量获得的信息量来控制所述传感器。
本公开包含与在2012年3月28日向日本专利局提交的日本优先权专利申请JP2012-073504中公开的主题相关的主题,该申请的全部内容通过引用合并于此。
本领域技术人员应理解,可以根据设计要求和其它因素进行各种修改、组合、子组合和变型,只要这些修改、组合、子组合和变型在所附权利要求或其等同的范围内即可。

Claims (14)

1.一种信息处理装置,包括:
传感器,所述传感器测量预定数据;
模型存储单元,所述模型存储单元存储通过对在过去测量的时间序列数据建模而获得的模型;
信息量计算单元,所述信息量计算单元基于根据所述模型的状态变量的先验分布决定的、不执行所述传感器的测量时的信息量与根据所述模型的状态变量的后验分布决定的、执行所述传感器的测量时的信息量之间的差,来计算根据测量获得的信息量;以及
测量控制单元,所述测量控制单元基于根据测量获得的信息量来控制所述传感器。
2.根据权利要求1所述的信息处理装置,其中,存储在所述模型存储单元中的模型是隐马尔可夫模型。
3.根据权利要求2所述的信息处理装置,其中,不执行所述传感器的测量时的信息量是基于下述后验概率以及下述先验概率来计算的信息量:根据直到前次测量的时间序列数据而获得的所述隐马尔可夫模型的状态变量的后验概率,以及根据所述隐马尔可夫模型的转移概率而预测的当前时间的状态变量的先验概率。
4.根据权利要求2所述的信息处理装置,其中,执行所述传感器的测量时的信息量是按照下述方式获得的信息量:由观测变量来表示根据测量获得的数据,并且关于所述观测变量来计算如下信息量的期望值,该信息量能够根据所述隐马尔可夫模型的状态变量在获得所述观测变量的条件下的后验概率而计算。
5.根据权利要求4所述的信息处理装置,其中,根据测量获得的信息量是表示所述隐马尔可夫模型的状态的状态变量和所述观测变量的相互信息量。
6.根据权利要求5所述的信息处理装置,其中,所述信息量计算单元使用通过从所述观测变量执行针对所述状态变量的最大似然性估计而获得的近似观测变量,来计算所述状态变量和所述近似观测变量的相互信息量,作为根据测量获得的信息量。
7.根据权利要求6所述的信息处理装置,其中,所述信息量计算单元设置有变量转换表,在所述变量转换表中针对每个状态变量而存储获得所述近似观测变量的观测概率。
8.根据权利要求2所述的信息处理装置,其中,通过对所述时间序列数据建模而获得的所述模型针对所述隐马尔可夫模型的每个状态而具有测量成功的概率或测量失败的概率,以作为参数。
9.根据权利要求2所述的信息处理装置,其中,通过对所述时间序列数据建模而获得的所述模型还保留用于表示未知状态的状态,并具有用于计算从初始模型的状态到所述未知状态的转移概率、从所述未知状态到初始状态的转移概率、以及从所述未知状态生成观测的似然性的参数,以作为参数。
10.根据权利要求1所述的信息处理装置,其中,所述信息量计算单元通过将根据测量获得的信息量与预定阈值进行比较,来确定是否使所述传感器执行测量。
11.根据权利要求1所述的信息处理装置,其中,所述信息量计算单元计算直到预定阶段的根据测量获得的信息量,并且,基于计算结果而确定是否使所述传感器执行测量直到所述预定阶段。
12.根据权利要求1所述的信息处理装置,还包括:
数据恢复单元,当在由所述传感器测量并且然后被累积的、累积的时间序列数据中存在丢失数据时,所述数据恢复单元使用所述模型来估计与所述累积的时间序列数据相对应的最大似然性状态序列,并且基于所估计的最大似然性状态序列来恢复所述累积的时间序列数据的丢失数据部分。
13.一种信息处理装置的信息处理方法,所述信息处理装置包括:传感器,用于测量预定数据;以及模型存储单元,用于存储通过对在过去测量的时间序列数据建模而获得的模型,所述方法包括:
基于根据所述模型的状态变量的先验分布决定的、不执行所述传感器的测量时的信息量与根据所述模型的状态变量的后验分布决定的、执行所述传感器的测量时的信息量之间的差,来计算根据测量获得的信息量;以及
基于根据测量获得的信息量来控制所述传感器。
14.一种程序,用于使得计算机装置执行处理,所述计算机装置包括:传感器,用于测量预定数据;以及模型存储单元,用于存储通过对在过去测量的时间序列数据建模而获得的模型,所述处理包括:
基于根据所述模型的状态变量的先验分布决定的、不执行所述传感器的测量时的信息量与根据所述模型的状态变量的后验分布决定的、执行所述传感器的测量时的信息量之间的差,来计算根据测量获得的信息量;以及
基于根据测量获得的信息量来控制所述传感器。
CN201310092362.3A 2012-03-28 2013-03-21 信息处理装置、信息处理方法和程序 Pending CN103368787A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2012073504A JP2013205170A (ja) 2012-03-28 2012-03-28 情報処理装置、情報処理方法、およびプログラム
JP2012-073504 2012-03-28

Publications (1)

Publication Number Publication Date
CN103368787A true CN103368787A (zh) 2013-10-23

Family

ID=49236153

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310092362.3A Pending CN103368787A (zh) 2012-03-28 2013-03-21 信息处理装置、信息处理方法和程序

Country Status (3)

Country Link
US (1) US20130262013A1 (zh)
JP (1) JP2013205170A (zh)
CN (1) CN103368787A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017114400A1 (zh) * 2015-12-31 2017-07-06 华为技术有限公司 时序数据检测方法及装置
CN110874645A (zh) * 2019-11-14 2020-03-10 北京首汽智行科技有限公司 一种数据还原方法

Families Citing this family (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5861619B2 (ja) * 2012-11-22 2016-02-16 富士通株式会社 データ補間装置、データ補間プログラム及びデータ補間方法
US9317415B2 (en) * 2013-06-03 2016-04-19 Google Inc. Application analytics reporting
US20140372157A1 (en) * 2013-06-18 2014-12-18 Ge Intelligent Platforms, Inc. Apparatus and method for time series data analytics marketplace
JP6103540B2 (ja) * 2014-03-14 2017-03-29 インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation 生成装置、生成方法、情報処理方法、及び、プログラム
JP6481297B2 (ja) * 2014-09-08 2019-03-13 オムロン株式会社 モニタリング装置、モニタリングシステム、およびモニタリング方法
KR101625757B1 (ko) * 2014-11-25 2016-05-31 한국과학기술원 무선랜 라디오맵 자동 구축 방법 및 시스템
JP2016138816A (ja) * 2015-01-28 2016-08-04 アルパイン株式会社 ナビゲーション装置及びコンピュータプログラム
JP6225927B2 (ja) 2015-02-02 2017-11-08 トヨタ自動車株式会社 車両状態予測システム
JP6093790B2 (ja) * 2015-03-12 2017-03-08 エヌ・ティ・ティ・コミュニケーションズ株式会社 測位装置、測位方法、測位プログラム、測位システム及び測位端末
JP6093791B2 (ja) * 2015-03-12 2017-03-08 エヌ・ティ・ティ・コミュニケーションズ株式会社 測位装置、測位方法、測位プログラム、および、測位システム
JP6093792B2 (ja) * 2015-03-12 2017-03-08 エヌ・ティ・ティ・コミュニケーションズ株式会社 測位装置、測位方法、測位プログラム、および、測位システム
US10438126B2 (en) 2015-12-31 2019-10-08 General Electric Company Systems and methods for data estimation and forecasting
CN105678587B (zh) * 2016-01-12 2020-11-24 腾讯科技(深圳)有限公司 一种推荐特征确定方法、信息推荐方法及装置
JP6866870B2 (ja) * 2018-03-30 2021-04-28 横河電機株式会社 データアクイジションシステム、データアクイジション装置、およびデータ合成装置
GB2578430B (en) * 2018-10-25 2023-01-18 Kalibrate Tech Limited Data communication
US20220043888A1 (en) * 2018-12-07 2022-02-10 Nec Corporation Data analysis apparatus, method, and computer readable method
JP7310137B2 (ja) * 2018-12-28 2023-07-19 株式会社Gsユアサ データ処理装置、データ処理方法、及びコンピュータプログラム
US11250350B2 (en) * 2019-07-31 2022-02-15 Rohde & Schwarz Gmbh & Co. Kg Measurement apparatus
CN115062270B (zh) * 2022-06-10 2024-05-31 浙江工商大学 基于最大似然的缺失值填充的传感器数据处理方法

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5129001A (en) * 1990-04-25 1992-07-07 International Business Machines Corporation Method and apparatus for modeling words with multi-arc markov models
US6985858B2 (en) * 2001-03-20 2006-01-10 Microsoft Corporation Method and apparatus for removing noise from feature vectors
US7523034B2 (en) * 2002-12-13 2009-04-21 International Business Machines Corporation Adaptation of Compound Gaussian Mixture models
US20090066641A1 (en) * 2005-03-10 2009-03-12 Motus Corporation Methods and Systems for Interpretation and Processing of Data Streams
WO2007058301A1 (ja) * 2005-11-21 2007-05-24 Nec Corporation 検知対象の識別・位置推定システムと、その方法及びプログラム
US7991722B1 (en) * 2006-04-14 2011-08-02 George Mason Intellectual Properties, Inc. Information request generator
US7626889B2 (en) * 2007-04-06 2009-12-01 Microsoft Corporation Sensor array post-filter for tracking spatial distributions of signals and noise
US20090164186A1 (en) * 2007-12-20 2009-06-25 Bhp Billiton Innovation Pty Ltd. Method for determining improved estimates of properties of a model
JP2009159336A (ja) * 2007-12-26 2009-07-16 Panasonic Corp 行動範囲把握方法および行動把握装置
US8725510B2 (en) * 2009-07-09 2014-05-13 Sony Corporation HMM learning device and method, program, and recording medium
JP2012008659A (ja) * 2010-06-22 2012-01-12 Sony Corp データ処理装置、データ処理方法、およびプログラム
US8756173B2 (en) * 2011-01-19 2014-06-17 Qualcomm Incorporated Machine learning of known or unknown motion states with sensor fusion

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017114400A1 (zh) * 2015-12-31 2017-07-06 华为技术有限公司 时序数据检测方法及装置
CN106937241A (zh) * 2015-12-31 2017-07-07 华为技术有限公司 时序数据检测方法及装置
US10911970B2 (en) 2015-12-31 2021-02-02 Huawei Technologies Co., Ltd. Method and apparatus for detecting time series data
US11979761B2 (en) 2015-12-31 2024-05-07 Huawei Technologies Co., Ltd. Method and apparatus for detecting time series data
CN110874645A (zh) * 2019-11-14 2020-03-10 北京首汽智行科技有限公司 一种数据还原方法

Also Published As

Publication number Publication date
US20130262013A1 (en) 2013-10-03
JP2013205170A (ja) 2013-10-07

Similar Documents

Publication Publication Date Title
CN103368787A (zh) 信息处理装置、信息处理方法和程序
Yu et al. k-Nearest neighbor model for multiple-time-step prediction of short-term traffic condition
Yang et al. Travel cost inference from sparse, spatio temporally correlated time series using markov models
Hofleitner et al. Learning the dynamics of arterial traffic from probe data using a dynamic Bayesian network
TWI564834B (zh) 電力需求預測裝置,電力供給系統,電力需求預測方法及程式
CN104715285B (zh) 处理订单的方法和设备
JP6761789B2 (ja) 人流予測装置、システムおよびプログラム
Hu et al. Crowdsourcing-based real-time urban traffic speed estimation: From trends to speeds
CN111985710A (zh) 一种公交乘客出行站点预测方法、存储介质及服务器
CN103368788A (zh) 信息处理设备、信息处理方法和程序
JP6521835B2 (ja) 移動経路予測装置、移動経路予測方法、及び移動経路予測プログラム
JP6462264B2 (ja) 目的地予測装置、目的地予測方法、及びプログラム
CN102087709A (zh) 学习设备、学习方法以及程序
CN110414732A (zh) 一种出行未来轨迹预测方法、装置、储存介质及电子设备
US9292800B2 (en) Statistical estimation of origin and destination points of trip using plurality of types of data sources
CN111915104A (zh) 一种预测出行位置的方法及装置
JP6283331B2 (ja) 流れ推定装置、予測装置、及びプログラム
US20180144266A1 (en) Learning apparatus and method for learning a model corresponding to real number time-series input data
Ozdemir et al. A hybrid HMM model for travel path inference with sparse GPS samples
JP2016038741A (ja) 移動状況判定装置、移動状況判定方法及びプログラム
JP2017204174A (ja) 目的地予測装置、目的地予測方法、及び目的地予測プログラム
Xu et al. A taxi dispatch system based on prediction of demand and destination
JP6433877B2 (ja) 目的地予測装置、目的地予測方法、及び目的地予測プログラム
JP2017091435A (ja) 滞在場所予測装置
Chen et al. The design and implementation of a garbage truck fleet management system

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20131023