CN102183252A - 数据处理装置、数据处理方法和程序 - Google Patents
数据处理装置、数据处理方法和程序 Download PDFInfo
- Publication number
- CN102183252A CN102183252A CN2010105737285A CN201010573728A CN102183252A CN 102183252 A CN102183252 A CN 102183252A CN 2010105737285 A CN2010105737285 A CN 2010105737285A CN 201010573728 A CN201010573728 A CN 201010573728A CN 102183252 A CN102183252 A CN 102183252A
- Authority
- CN
- China
- Prior art keywords
- time series
- state
- series data
- incident
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N7/00—Computing arrangements based on specific mathematical models
- G06N7/01—Probabilistic graphical models, e.g. probabilistic networks
Landscapes
- Physics & Mathematics (AREA)
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Pure & Applied Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Algebra (AREA)
- Mathematical Analysis (AREA)
- Mathematical Optimization (AREA)
- Computational Mathematics (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Probability & Statistics with Applications (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Navigation (AREA)
Abstract
本发明涉及一种数据处理装置、数据处理方法以及程序。数据处理装置包括状态序列生成单元和计算单元。状态序列生成单元根据事件的时间序列数据来生成状态节点的时间序列数据。将事件的状态转变模型表达为随机状态转变模型。计算单元通过计算与状态节点的出现频率、在状态节点之中的转变出现频率等对应的时间序列数据的参数来计算用于事件的随机状态转变模型的参数。
Description
技术领域
本发明涉及一种数据处理装置、数据处理方法和程序、具体地涉及更简单地对学习参数进行学习以预测处于在当前时间的不远将来或者以后进行特定动作的地点或者特定位置的概率、路线和流逝时间。
背景技术
近来积极研究通过使用从用户佩戴的可佩戴传感器获得的时间序列数据进行建模来学习用户的状态并且通过使用从学习中获得的模型来识别用户的当前状态(例如参见第2006-134080号日本公开待审专利申请、第2008-204040号日本公开待审专利申请和Brian Patrick Clarkson于2002年的MIT博士论文″Life Patterns:structure from wearable sensors″)。
本发明人作为第2009-180780号日本专利申请首先提出随机估计用户的动作状态在将来预期时间的多个可能性的方法。在第2009-180780号日本专利申请的方法中,从时间序列数据中学习用户动作状态作为随机状态转变模型,并且通过使用学习的随机状态转变模型,有可能识别当前动作状态并且随机估计所谓“在预定时间之后”的用户动作状态。然后,作为对在“预定时间”之后的用户动作状态的估计例子,建议用于通过识别用户当前位置来估计在预定时间之后的用户目的地(位置)的例子。
另外,本发明人还改进了第2009-180780号日本专利申请并且作为第2009-208064号日本专利申请提出用于即使在未指定从所谓“在预定时间”的当前时间起的流逝时间时仍然估计通向多个目的地的到达概率、路线和时间的方法。在第2009-208064号日本专利申请的方法中,有可能通过发现与概率模型中的节点之中的目的地节点对应的位置来自动检测目的地候选。
发明内容
在第2009-180780号日本专利申请和第2009-208064号日本专利申请的方法中,采用隐马尔科夫模型作为表达用户动作状态的随机状态转变模型的例子。然后,在第2009-208064号日本专利申请的方法中,采用两步过程(将第一隐马尔科夫模型所获得的输出结果输入到将作为后续步骤的第二隐马尔科夫模型)用于对表达用户动作状态的隐马尔科夫模型的学习手段。对于两步过程,学习时间需要两倍之久,并且该过程负担大。
希望更简单地对学习参数进行学习以预测处于在当前时间的不远将来或者以后进行特定动作的地点或特定位置的概率、路线和流逝时间。
根据本发明的一个实施例的一种数据处理装置包括:状态序列生成装置,在第一事件的状态转变模型表达为随机状态转变模型时根据在第一事件和第二事件的时间序列数据之间的第一事件的时间序列数据来生成状态节点的时间序列数据;以及计算装置,通过使用第一事件的时间序列数据和状态节点的时间序列数据来计算与状态节点的出现频率、在状态节点之中的转变出现频率和状态节点对应的时间序列数据的参数,以计算用于第一事件和第二事件的随机状态转变模型的参数。
根据本发明的另一实施例,提供一种使用数据处理装置的数据处理方法,该数据处理装置通过包括状态序列生成装置和计算装置来输出第一事件和第二事件的随机状态转变模型的参数,该方法包括:使数据处理装置的状态序列生成装置在第一事件的状态转变模型表达为随机状态转变模型时根据在第一事件和第二事件的时间序列数据之间的第一事件的时间序列数据来生成状态节点的时间序列数据;以及使计算装置通过使用第一事件的时间序列数据和状态节点的时间序列数据来计算与状态节点的出现频率、在状态节点之中的转变出现频率和状态节点对应的时间序列数据的参数,以计算第一事件和第二事件的随机状态转变模型的参数。
根据本发明的又一实施例,提供一种使计算机作为以下装置来工作的程序:状态序列生成装置,在第一事件的状态转变模型表达为随机状态转变模型时根据在第一事件和第二事件的时间序列数据之间的第一事件的时间序列数据来生成状态节点的时间序列数据;以及计算装置,通过使用第一事件的时间序列数据和状态节点的时间序列数据来计算与状态节点的出现频率、在状态节点之中的转变出现频率和状态节点对应的时间序列数据的参数,以计算第一事件和第二事件的随机状态转变模型的参数。
在本发明的实施例中,当第一事件的状态转变模型表达为随机状态转变模型时根据在第一事件和第二事件的时间序列数据之间的第一事件的时间序列数据来生成状态节点的时间序列数据,并且通过使用第一事件的时间序列数据和状态节点的时间序列数据计算与状态节点的出现频率、在状态节点之中的转变出现频率和状态节点对应的时间序列数据的参数来计算第一事件和第二事件的随机状态转变模型的参数。
数据处理装置可以是独立装置或者是组成一个装置的中间块。
根据本发明的实施例,可以更容易地对学习参数进行学习以预测处于在当前时间的不远将来或者以后进行特定动作的地点或者特定位置的概率、路线和流逝时间。
附图说明
图1是示出用于第2009-208064号日本专利申请的预测系统的配置例子的框图。
图2是示出该预测系统的硬件配置例子的框图。
图3是示出向预测系统输入的时间序列数据的图表。
图4是示出HMM(隐马尔科夫模型)例子的图。
图5是示出在语音识别中使用的HMM例子的图。
图6A和6B是示出给予稀疏约束的HMM例子的图。
图7是示出动作预测部的路线发现过程的简单例子的图。
图8是示出其中可以采用图1的动作学习部的配置例子的图。
图9是描述预测系统标识的动作模式的图。
图10是到达时间预测处理的流程图。
图11是到达时间预测处理的流程图。
图12是示出用于应用本发明的预测系统的动作学习部的配置例子的框图。
图13是学习处理的流程图。
图14是描述状态序列纠正单元的循环纠正过程的图。
图15是状态序列纠正单元的循环纠正过程的流程图。
图16是描述状态序列纠正单元的共享节点纠正过程的图。
图17是状态序列纠正单元的共享节点纠正过程的流程图。
图18是描述其它共享节点纠正过程的图。
图19是描述采用图12中所示动作学习部的效果的图。
图20是描述采用图12中所示动作学习部的效果的图。
图21是描述采用图12中所示动作学习部的效果的图。
图22是描述采用状态序列纠正单元的效果的图。
图23是描述采用状态序列纠正单元的效果的图。
图24是描述采用状态序列纠正单元的效果的图。
图25是示出用于应用本发明的计算机的实施例形式的配置例子的框图。
具体实施方式
下文描述了用于实施本发明的形式(下文称为实施例)。
为了与在“背景技术”中描述的相关技术比较,简要地描述在第2009-208064号日本专利申请中建议的方法,然后描述应用于本发明的实施例。也就是说,按照以下顺序进行描述。
1.第2009-208064号日本专利申请的实施例
2.本发明的实施例(该实施例比在第2009-208064号日本专利申请的实施例中更容易地获得学习参数)
<1.第2009-208064号日本专利申请的实施例>
[用于第2009-208064号日本专利申请的预测处理系统的配置例子]
图1是示出用于第2009-208064号日本专利申请的预测系统的配置例子的框图。
预测系统1被配置成具有GPS传感器10、速度计算部11、时间序列数据存储器部12、动作学习部13、动作识别部14、动作预测部15、目的地预测部16、操作部17和显示部18。
预测系统1进行学习处理,以便从由GPS传感器10获得的表明当前位置的时间序列数据中学习用户动作状态(该状态是表达的动作和活动模式)作为随机状态转变模型。
预测系统1也进行预测过程,以通过使用由通过学习处理而获得的参数表示的随机状态转变模型(用户活动模型)、在预测用户目的地之后预测到达目的地的到达概率、路线和到达时间。此外,目的地可以预测为多个目的地以及单个目的地。
在诸如住所、办公室、车站、购物目的地和餐馆等目的地中,用户一般逗留预定时间,并且用户的移动速度基本上为零。另一方面,对于当用户移向目的地时的情况,用户的移动速度将是取决于交通手段以特定模式改变的状态。因此有可能通过从用户移动速度的信息中识别用户动作状态(也就是说,用户是静止于目的地(静止状态)还是正移动(移动状态))来预测静止状态的地点作为目的地。
在图1中,虚线箭头示出学习处理中的数据流而实线箭头示出预测过程中的数据流。
GPS传感器10以规律的时间间隔(例如15秒间隔)顺序地获取表明它自己的位置的纬度和经度数据。此外,GPS传感器10可能不能够以规律的时间间隔获取位置数据。例如,可能当用户例如在隧道中或者地下时难以搜寻卫星,并且获取间隔变长。在此情况下,有可能通过进行插值过程等来补偿数据。
在学习处理中,GPS传感器10向速度计算部11供应所获得的纬度和经度位置数据以及获取数据的获取时间。在预测处理中,GPS传感器10向速度计算部11供应所获取的位置数据。
数据计算部11根据由GPS传感器10供应的位置数据来计算移动速度。
具体而言,以恒定的时间间隔在第k个步骤(kth)获得的位置数据通过时间tk、经度yk和纬度xk来表达,并且可以按照以下等式(1)来计算第k个步骤在x方向上的移动速度vxk和第k个步骤在y方向上的移动速度vyk。
在等式(1)中使用从GPS传感器10获得的纬度和经度数据。然而,如果在必需时,则可以适当地进行比如将纬度和经度数据转换成距离或者代表速度的每小时速度或者每分钟速度这样的处理。
速度计算部11还获得根据从等式(1)获得的移动速度vxk和vyk来计算等式(2)中表达的在第k个步骤的移动速度vk和移动方向变化θk。
使用在等式(2)中表达的在第k个步骤的移动速度vk和移动方向变化θk的方法出于以下原因是一种比移动速度vxk和vyk更好的取回移动特征的方式。
1.由于移动速度vxk和vyk在纬度或者经度轴中的数据分布有偏差,所以可能存在如下可能性:即使使用相同移动手段(比如火车或者徒步),在不同角度的情况下仍然难以进行标识。然而由于使用移动速度vk,这样的可能性是低的。
2.对于仅按照移动速度的绝对量(|v|)进行学习的情况,由于因装置中的噪声而出现|v|所以难以标识步行和静止。有可能通过也考虑移动方向变化来减少噪声影响。
3.移动方向变化在移动期间是小的,但是由于在静止之时未限定移动方向,所以易于通过使用移动方向变化来标识移动和静止状态。
出于上述原因,速度计算部11在寻求到由等式(2)表达的移动速度vk和移动方向变化θk作为移动速度数据之后向时间序列数据存储器部12或者动作识别部14供应位置数据。
速度计算部11也在计算移动速度vk和移动方向变化θk之前通过使用移动平均来进行过滤过程(预处理)以去除噪声分量。
另外,下文将移动方向变化θk简写为移动方向θk。
GPS传感器10也包含可以输出移动速度的元件。对于运用GPS传感器10的情况,有可能省略速度计算部11并且原样使用GPS传感器11输出的移动速度。
时间序列数据存储器部12存储以时间序列从速度计算部11供应的位置数据和移动速度、也就是位置数据和移动速度的时间序列数据。由于学习用户的动作和活动模式,所以可能需要在约数天的时间段内积累的时间序列数据。
动作学习部13基于在时间序列数据存储器部12存储的时间序列数据来学习携带具有内置GPS传感器10的设备的用户的动作状态作为随机状态转变模型。由于时间序列数据是表明用户的位置和移动速度的数据,所以作为随机状态转变模型而学习的用户动作状态变成用户的移动轨迹和动作状态。例如,可以采用诸如遍历HMM(隐马尔科夫模型)等包含隐状态的随机状态转变模型作为用于进行学习的随机状态转变模型。在预测系统1中,采用其中在遍历HMM中给予稀疏约束的模型作为随机状态转变模型。此外,后文将参照图4至图6描述其中已经给予稀疏约束的遍历HMM的参数计算方法和遍历HMM。
动作学习部13供应和在显示部18上显示其中示出学习结果的数据。另外,动作学习部13向动作识别部14、动作预测部15和目的地预测部16供应通过学习处理而获得的随机状态转变模型的参数。
动作识别部14使用通过学习从速度计算部11实时供应的位置和移动速度的时间序列数据而获得的参数的随机状态转变模型来识别用户当前动作状态、即用户当前位置。动作识别部14向动作预测部15供应用户当前状态节点的节点编号。
动作预测部15使用通过学习而获得的参数的随机状态转变模型来适当地搜寻(预测)用户可以从动作识别部14供应的状态节点的节点编号表明的用户当前位置取道的路线。另外,动作预测部15通过针对曾搜寻的每条路线计算出现概率来预测如下选择概率,该选择概率是曾搜寻的路线被选择的概率。
从动作预测部15向目的地预测部16供应用户可以取道的路线及其选择概率。另外,用户输入的信息在可能需要时从操作部17供应到目的地预测部16。
目的地预测部16使用通过学习而获得的参数的随机状态转变模型来预测用户目的地。
具体而言,目的地预测部16首先列举目的地候选。目的地预测部16使目的地候选为所识别的用户动作状态处于静止状态的地点。
接着,目的地预测部16确定在动作预测部15在所列举的目的地候选之中针对用户进行搜索而该用户可以取道的路线上的目的地候选作为目的地,并且针对每条路线预测通向目的地的到达时间。
接着,目的地预测部16针对每个确定的目的地计算到达概率。目的地预测部16在关于该目的地存在两条或更多条路线时计算两条或更多条路线的选择概率之和作为目的地的到达概率。当通向目的地的路线数目仅为一时,路线的选择概率原样变成目的地的到达概率。
目的地预测部16计算通向所预测的目的地的路线的到达时间并且将它显示于显示部18上。
包括该目的地的路线数目为多个。当对于显示所有路线的情况难以看见时或者当路线数目设置为预定数目时,有必要从包括该目的地的所有路线之中确定显示部18上显示的路线(下文也适当地称为所显示的路线)。在这样的情况下,在动作预测部15中,由于关于各路线计算选择概率,所以目的地预测部16可以按照高选择概率的顺序确定预定数目的路线作为显示路线。
另外,当存在通向目的地的许多路线时,除了按照被选择概率高的顺序确定显示路线之外,也有可能按照通向目的地的最短到达时间或者最短距离的顺序确定显示路线。例如在按照最短到达时间的顺序确定显示路线时,目的地预测部16首先关于通向目的地的所有路线计算到达时间并且基于所计算的到达时间来确定显示路线。例如,首先在按照通向目的地的最短距离的顺序确定显示路线时,关于通向目的地的所有路线,目的地预测部16基于关于与状态节点对应的纬度和经度的信息来计算通向目的地的距离,并且基于所计算的距离来确定显示路线。
另外,以针对目的地的类似方式,可以缩小用于显示对象的目的地,从而可以仅仅显示到达概率高的预定数目的目的地和超出预定到达概率值的目的地。此外,显示的目的地和路线数目可以不同。
操作部17接收用户输入的预定信息(例如显示路线的选择方向等)并且将它供应到目的地预测部16。显示部18显示从动作学习部13或者目的地预测部16供应的信息。
[预测系统的硬件配置例子]
例如图2中所示硬件配置可以用于如上文提到的那样构造的预测系统1。也就是说,图2是示出预测系统1的硬件配置例子的框图。
预测系统1在图2中由从21-1到21-3的三组移动终端和服务器22构成。虽然从21-1到21-3的移动终端是具有相同功能的相同类型的移动终端21,但是拥有从21-1到21-3的移动终端的用户不同。因此,在图2中虽然示出从21-1到21-3的仅仅三组移动终端,但是在实践中可以存在数目视用户数目而定的移动终端21。
移动终端21可以通过网络(比如无线通信和因特网)通信来进行与服务器22的数据传送。服务器22接收从移动终端21发送的数据并且对接收到的数据进行预定处理。然后,服务器22通过无线通信等向移动终端21发送数据处理的处理结果。
因此,移动终端21和服务器22至少具有进行无线电或者有线通信的通信单元。
另外,移动终端21可以配备有图1的GPS传感器10、速度计算部11、操作部17和显示部18。服务器22可以采用如下配置,其中它配备有图1的时间序列数据存储部12、动作学习部13、动作识别部14、动作预测部15和目的地预测部16。
当采用该配置时,在学习处理中,移动终端21发送GPS传感器10和速度计算部11所获取的时间序列数据。服务器22基于所接收的用于学习的时间序列数据通过随机状态转变模型来学习用户的动作状态。然后,在预测处理中,移动终端21发送由GPS传感器10和速度计算部11实时获取的位置数据。使用通过学习而获得的参数,服务器22识别用户当前动作状态、即用户当前位置,并且还向移动终端21发送目的地以及到达该目的地的路线和时间作为处理结果。移动终端21在显示部18上显示从服务器22发送的处理结果。
另外,例如移动终端21可以配备有图1的GPS传感器10、速度计算部11、动作识别部14、动作预测部15、目的地预测部16、操作部17和显示部18。服务器22可以采用如下配置,其中它配备有图1的时间序列数据存储器部12和动作学习部13。
当采用该配置时,在学习处理中,移动终端21发送由GPS传感器10和速度计算部11获取的时间序列数据。基于所接收的用于学习的时间序列数据,服务器22通过随机状态转变模型来学习用户动作状态,并且向移动终端21发送通过学习而获得的参数。然后,在预测处理中,使用从服务器22接收的参数以及由GPS传感器10和速度计算部11实时获取的位置数据,移动终端21识别用户当前位置,并且还计算通向该目的地的路线和时间。然后,移动终端21在显示部18上显示目的地以及通向该目的地的路线和时间作为计算结果。
可以根据各数据处理设备的吞吐量和通信环境来确定在上述移动终端21与服务器22之间的作用分配。
对于学习处理,虽然用于各处理的时间很长,但是不必如此频繁处理。因此,由于服务器22而不是可以携带的移动终端21的吞吐量一般为高,所以服务器22可以基于约一天一次积累的时间序列数据来进行学习处理(参数更新)。
另一方面,由于希望预测处理被快速进行并且与在每个时刻实时更新的位置数据对应地被显示,所以更希望在移动终端21处理。如果通信环境充足,则希望服务器22进行如上文提到的预测处理并且仅预测结果从服务器22接收,从而可以减轻要求便携性和小型化的移动终端21的负担。
另外,当对于移动终端21有可能作为数据处理设备独立地高速进行学习处理和预测处理时,移动终端21当然也能够配备有图1的预测系统1的所有配置。
[输入的时间序列数据例子]
图3示出由预测系统1获取的位置数据的时间序列数据例子。在图3中,水平轴表示经度而竖直轴表示纬度。
图3中所示的时间序列数据示出实验者在约一个半月的时段中积累的时间序列数据。如图3中所示,时间序列数据主要是向比如在住所、办公室等附近的四个外出地点移动的数据。此外,时间序列数据由于卫星的获取故障而有一些遗漏数据。
此外,图3中所示的时间序列数据是与用于后文提到的验证实验的数据不同的数据例子。
[关于遍历HMM]
接着,预测系统1关于采用为学习模型的遍历HMM进行说明。
图4示出HMM的例子。
HMM是具有状态和在状态之间的转变的状态转变模型。
图4示出三个状态的HMM例子。
在图4(后续图也相同)中,圆形标记表达状态而箭头表达状态转变。此外,状态也称为与上文提到的用户动作状态对应的状态节点或者简称为节点。
此外,在图4中,si(在图4中为i=1、2、3)表达状态,并且aij表达从状态si向状态sj的状态转变概率。另外,bj(x)表达在向状态sj的状态转变时观测到观测值x的输出概率密度函数,并且πi表达状态si为初始状态的初始概率。
此外,例如使用混合正则概率分布作为输出概率密度函数bj(x)。
这里,HMM(连续HMM)由状态转变概率aij、输出概率密度函数bj(x)和初始概率πi限定。状态转变概率aij、输出概率密度函数bj(x)和初始概率πi称为HMMλ={aij,bj(x),πi,i=1,2,…,M,j=1,2,…,M}的参数。M代表HMM的状态数目。
对于一种估计HMM的参数λ的方法,广泛使用Baum-Welch最大似然度估计方法。Baum-Welch最大似然度估计方法是一种基于EM算法(EM(期望最大化)算法)的参数估计方法。
根据Baum-Welch最大似然度估计方法,基于观测的时间序列数据x=x1,x2,…,xT来进行对HMM的参数λ的估计以最大化将根据如下出现概率被发现的似然度,该出现概率是观测到(出现)时间序列数据的概率。这里,xt表达在时间t观测的信号(样本值),并且T表达时间序列数据的长度(样本数目)。
例如在Chriostopher M.BishopSpringer的″Pattern Recognition and Machine Learning(Information Science and Statistics,New York 2006,第333页)(下文称为参考文献A)″中公开上述Baum-Welch最大似然度估计方法。
此外,虽然Baum-Welch最大似然度估计方法是一种基于似然度最大化的参数估计方法,但是它并不保证最佳拟合而是根据HMM的参数λ和结构的初始值来收敛于局部部位解(局部最小值)。
在声音识别中广泛使用HMM,但是在使用于声音识别中的HMM中一般预先决定状态转变的状态数目和方式等。
图5示出在声音识别中使用的HMM例子。
图5的HMM称作左到右型。
在图5中,状态数目为3并且状态转变受如下结构约束,该结构仅允许自转变(从状态si向状态si的转变)和从左状态向右状态的状态转变。
图4中所示HMM可能称为遍历HMM,该HMM无状态转变约束、即从任意状态si到任意状态sj的状态转变(对于HMM(比如图5的HMM)有状态转变约束)。
虽然遍历HMM是作为结构具有最高灵活性的HMM,但是对于状态数目增加的情况,将变得难以估计参数λ。
例如,当遍历HMM的状态数目为1000时,状态转变数目设置成1百万(=1000×1000)。
因此,在此情况下,例如关于参数λ的状态转变概率aij,有必要估计1百万个状态转变概率aij。
因此,例如可以在对状态设置的状态转变中施加稀疏结构的约束(稀疏约束)。
这里,稀疏结构是如下结构,其中它并非稠密状态转变(比如遍历HMM,其中从任意状态向任意状态的状态转变是可能的),但是它是如下很有限的结构,其中可以完成从某个状态的状态转变。此外,即使它为稀疏结构,仍然存在向其它状态的至少一个状态转变并且有自转变。
图6A和6B示出其中给予稀疏约束的HMM。
这里,在图6A和6B中,连接两个状态的双向箭头表达从两个状态的一侧向另一侧的状态转变和从另一侧向一侧的状态转变。另外,在图6A和6B中,对于各状态,自转变是可能的,并且省略示出自转变的箭头图示。
在图6A和6B中,在二维空间上以格状形状布置16个状态。也就是说,在图6A和6B,四个状态布置于横向方向上而四个状态也布置于纵向方向。
如果在横向方向上邻接的状态的距离和在纵向方向上邻接的状态的距离中的各距离现在设置成1,则图6A设置对向一状态的状态转变而言距离可能在一以下,并且示出如下HMM,其中给予向其它状态的状态转变不可能这样的稀疏约束。
在图1的例子中,向时间序列数据存储器部12供应GPS传感器10获取的位置数据作为时间序列数据x=x1,x2,…,xT。动作学习部13使用时间序列数据存储器部12中存储的时间序列数据x=x1,x2,…,xT来估计示出用户动作模型的HMM的参数λ。
也就是说,认为示出各时间的位置(纬度和经度)的用户移动轨迹的数据是如下概率变量的观测数据,该概率变量具有从地图上的与HMM的任一状态sj对应的一点带有预定分布值的广度的正态分布。动作学习部13优化地图上的与各状态sj对应的一点及其分布值以及状态转变概率aij。
此外,状态si的初始概率πi可以设置为统一值。例如,M个状态si中的各状态的初始概率πi设置成1/M。另外,可以向时间序列数据存储器部12供应在对GPS传感器10获取的位置数据进行插值处理等预定处理之后的位置数据作为时间序列数据x=x1,x2,…,xT。
动作识别部14将Viterbi方法应用于通过学习而获得的用户动作模型(HMM)并且寻求使从GPS传感器10观测到位置数据x=x1,x2,…,xT的似然度程度最大的状态转变过程(状态序列)(路线)(下文称为最大似然度路线)。由此,识别用户当前动作状态、也就是与用户当前位置对应的状态si。
这里,Viterbi方法是如下算法,该算法确定如下线路(最大似然度路线),该线路使得在处理使在各状态si进入起点的状态转变路线之中在时间t哪个状态从状态si转变成状态sj的状态转变概率aij以及在它的状态转变中观测到位置数据x=x1,x2,…,xT之中的时间t的样本值xt的概率(根据输出概率密度函数bj(x)获得的输出概率)之后在时间序列数据x的长度T内积累的值(出现概率)最大。上文提到的参考文献A的第347页表明Viterbi方法的细节。
[动作预测部15的路线搜索处理]
接着描述动作预测部15的路线搜索处理。
通过学习而获得的HMM的各状态si表达地图上的预定点(位置)并且可以在状态si和状态sj相互连接时视为表达从状态si移向状态sj的路线。
在此情况下,与状态si对应的各点可以分类成终点、途经点、分岔或者回路。终点是除自转变之外的概率可能极小(除自转变之外的概率低于预定值)的点并且是如下点,该点不是可以移向下一个的点。途经点是具有一个如下点的点,该点具有除自转变之外的一个有效转变,换言之,有一个如下点,该点是可以移向下一个的点。分岔是除了自转变之外的两个或更多个有效转变可用的点。换言之,它是两个如下点,这些点是可以移向下一个的点。回路是与迄今途经的任一路线一致的点。
当在搜寻通向目的地的路线期间有不同路线时,希望示出关于各路线的诸如所需时间等信息。然后,设置如下条件以便适当地搜寻可能路线。
(1)即使在曾分岔的路线再次汇合时它仍然视为另一路线。
(2)当有在迄今途经的路线中包括的点或者在路线中的终点时,路线搜索结束。
动作预测部15重复按照终止条件(2)通过产生动作识别部14识别的用户当前动作状态的起点(即用户当前点),将其中有可能状态转变作为后继移动地点的点分类为终点、途经点、分岔或者回路。
当将当前点分类为终点时,动作预测部15在将当前点连接到迄今路线之后结束对该路线的搜索。
另一方面,当将当前点分类为途经点时,动作预测部15在将当前点连接到迄今路线之后移向后继点。
另外,当分类为当前点是分岔时,动作预测部15将当前点连接到迄今路线并且还仅按照支路数目的数量复制迄今路线而且将它与分岔连接。并且动作预测部15移动以分岔之一作为后继点。
当分类为当前点是回路时,动作预测部15结束对该路线的搜索而不将当前点连接到迄今路线。此外,当在该路线从当前点反向到当前点之后的点时,由于在回路中包含当前点,所以并不考虑它。
[搜索处理例子]
图7示出动作预测部15的路线搜索处理的简单例子。
当状态s1为当前位置时,在图7的例子中将最终搜寻三种路线。第1种路线是从状态s1经由状态s5、状态s6等通向状态s10的路线(下文称为路线A)。第2种路线是从状态s1经由状态s5、状态s11、状态s14和状态23等通向状态s26的路线(下文称为路线B)。第3种路线是从状态s1经由状态s5、状态s11、状态s19和状态s23等通向状态s26的路线(下文称为路线C)。
动作预测部15计算选择各搜索的路线的概率(路线的选择概率)。通过依次进行在构成路线的状态之间的转变概率的相乘来搜寻路线的选择概率。然而,由于仅在考虑向后继状态的转变情况时不必考虑何时逗留于该地点,所以使用根据通过学习而获得的各状态的状态转变概率aij除自转变概率之外标准化的转变概率[aij]来搜寻路线的选择概率。
可以用以下等式(3)表达除自转变概率之外标准化的转变概率[aij]。
这里,δ代表克罗内克尔函数,它仅在下标i和j相同的情况下设置成1,并且它是在所有其它情况下用作0的函数。
因此,例如当图7的状态s5的状态转变概率aij是自转变概率a5,5=0.5、转变概率a5,6=0.2并且转变概率a5,11=0.3的情况时,在从状态s5向状态s6或者状态s11分岔的情况下的转变概率[a5,6]和转变概率[a5,11]分别设置成0.4和0.6。
当搜索的路线的状态si的节点编号i为(y1,y2,…,yn)时,可以使用标准化的转变概率[aij]用以下等式(4)表达路线的选择概率。
事实上,由于在途经点中的标准化转变概率[aij]为1,所以如果进行在分叉时标准化的转变概率[aij]的依次相乘则足够了。
在图7的例子中,路线A的选择概率为0.4。另外,路线B的选择概率为0.24=0.6×0.4。路线C的选择概率为0.36=0.6×0.6。并且计算的路线的选择概率之和为1=0.4+0.24+0.36,并且可以理解为适当的搜索均可适当地实现。
如上文提到的那样,从动作预测部15向目的地预测部16供应基于各路线的当前位置及其选择概率来搜索的各路线。
目的地预测部16从动作预测部15搜索的路线中提取包括用户指定的目的地的路线,并且关于各提取的路线预测通向目的地的时间。
例如,对于图7的例子,在曾搜寻的从A到C的三条路线之中的包括作为目的地的状态s28的路线为路线B和路线C。目的地预测部16途经路线B或者路线C并且预测在到达作为目的地的状态s28为止的时间。
假设当前时间t1的当前位置处于状态sy1并且在时间{t1,t2,…,tg}的确定路线为(sy1,sy2,…,syg)。换言之,假设确定的路线的状态si的节点编号i为(y1,y2,…,yg)。下文为求简化,可以仅用节点编号i表达与位置对应的状态si。
由于通过动作识别部14的识别来固定在当前时间t1的当前位置y1,所以当前时间t1的当前位置为y1的概率Py1(t1)为1。另外,在当前时间t1存在除y1之外的其它状态的概率为0。
另一方面,按照以下等式表达在预定时间tn的节点编号yn的概率Pyn(tn)。
等式(5)的右手侧的第一项代表在位置yn从第一位置进行自转变时的概率,而右手侧的第二项代表在位置yn从一个位置以前的位置yn-1转变的情况下的概率。在等式(5),不同于计算路线的选择概率,原样使用通过学习而获取的状态转变概率aij。
可以使用“在一个时段之前的时间tg-1处于目的地yg之前一个位置的位置yg-1在时间tg移向目的地yg的概率”来表达到达目的地yg的时间tg的预测值<tg>。
也就是说,用从当前时间直至“在一个时段之前的时间tg-1处于状态syg之前一个位置的状态syg-1在时间tg移向状态syg的时间”的时间的预期值来表达预测值<tg>。
[用于动作学习部13的详细配置例子]
图8示出图1的动作学习部13能够采用的配置例子。
动作学习部13使用时间序列数据存储器部12(图1)中存储的移动速度和位置的时间序列数据来同时学习用户移动轨迹和动作状态。
动作学习部13由学习数据转换部31和集成学习部32构成。
学习数据转换部31由状态序列生成单元41和动作模式生成单元42构成。状态序列生成单元41将位置数据的时间序列数据改变成状态节点si的时间序列数据(状态序列数据)并且向集成学习部32供应该数据。动作模式生成单元42将移动速度数据改变成动作模式的时间序列数据(动作模式序列数据)并且向集成学习部32供应该数据。
向状态序列生成单元41供应从时间序列数据存储器部12供应的位置数据的时间序列数据。与图1的动作识别部14相同的配置可以用于状态序列生成单元41。也就是说,状态序列生成单元41基于通过学习而获得的参数根据用户动作模型来识别与用户的输入当前位置对应的用户当前动作状态。然后,状态序列生成单元41向集成学习部32依次供应用户的当前状态节点si作为识别结果。
向动作模式生成单元42供应从时间序列数据存储器部12供应的移动速度的时间序列数据。动作模式生成单元42使用通过学习用户动作状态作为随机状态转变模型而获得的参数来识别与供应的移动速度对应的用户动作状态,并且向集成学习部32依次供应识别结果作为动作模式。作为动作模式生成单元42识别的用户动作状态,至少静止状态和移动状态是必需的。另外,还可以根据步行、自行车、汽车等交通手段对移动状态的动作模式进行进一步分类。
[动作模式的分类]
图9是说明动作模式生成单元42识别的用户动作状态(动作模式)的图。
如图9中所示,可以首先将用户动作状态分类成静止状态和移动状态。由于至少静止状态和移动状态如上文提到的那样作为动作模式生成单元42识别的用户动作状态是必需的,所以必须在预测系统1中分类成这两个状态。
另外,可以根据交通手段将移动状态分类成火车、汽车(包括公共汽车等)、自行车和步行。还可以将T火车分类成特快、高速、慢车等,并且还可以将汽车分类成快速、普通道路等。另外可以将步行分类成跑步、平常步行、漫步等。
在预测系统1中假设如图9中的斜线所示将用户动作状态分类成“静止”、“火车(高速)”、“火车(慢车)”、“汽车(快速)”、“汽车(普通道路)”、“自行车”和“步行”。此外,省略“火车(特快)”,因为未获得学习数据。
无需赘言,动作模式分类方法并不限于图9中所示例子。另外由于交通手段的移动速度转变并不随用户而很大地改变,所以作为学习数据的移动速度的时间序列数据不必属于作为识别目标的用户。
回到图8,集成学习部32通过随机状态转变模型来集成对两个或更多事件(形态)的时间序列数据的学习。向集成学习部32供应状态序列数据作为第1个事件的时间序列数据并且供应动作模式序列数据作为第2个事件的时间序列数据。因此,集成学习部32使用状态序列数据和动作模式序列数据来学习作为示出用户动作状态的随机状态转变模型的多流HMM的参数λ。
多流HMM是输出如下数据的HMM,该数据从具有与通常HMM相同的转变概率的状态节点遵循两个或更多个不同概率法则。在多流HMM中,在参数λ之中针对每条时间序列数据单独预备输出概率密度函数bj(x)。
在此例子中,由于时间序列数据是状态序列数据和动作模式序列数据这二者,所以预备输出概率密度函数b1j(x)以及与动作模式的时间序列数据对应的输出概率密度函数b2j(x),其中该输出概率密度函数b1j(x)输出与地点索引的时间序列数据对应的概率密度函数bj(x)。输出概率密度函数b1j(x)是在多流HMM的状态节点为j时地图上的索引变成x的概率。输出概率密度函数b2j(x)是在多流HMM的状态节点为j时动作模式变成x的概率。因此,在多流HMM,以地图上的索引与动作模式关联的形式学习用户动作状态(集成学习)。
具体而言,集成学习部32学习各状态节点的概率(输出哪个状态节点的概率)和各状态节点输出的动作模式概率(输出哪个动作模式的概率)。根据通过学习而获得的集成模型(多流HMM),获得其中易于随机输出“静止状态”动作模式的状态节点。然后,可以根据所识别的状态节点来识别目的地候选的位置。另外,可以根据示出目的地候选的位置的纬度和经度分布来识别目的地的位置。
如上文提到的那样,将如下地点估计为用户静止的位置,状态节点在该地点具有观测的动作模式为“静止状态”的高概率。然后,如上文提到的那样,由于多数情况为变成“静止状态”的位置为目的地,所以可以将这些静止地点估计为目的地。
集成学习部32向动作识别部14、动作预测部15和目的地预测部16供应通过学习而获得的示出用户动作状态的多流HMM的参数λ。
此外,在上文提到的例子中,在状态序列生成单元41和动作模式生成单元42中,通过按照HMM产生模型将从时间序列数据存储器部12供应的位置的时间序列数据和移动速度变换成状态序列数据和动作模式序列数据。
然而,可以通过除此之外的方法将移动速度和位置的数据变换成状态序列数据和动作模式序列数据。
例如关于动作模式,独立于GPS传感器10根据使用诸如加速度传感器、陀螺传感器等运动传感器的加速度等检测结果来检测用户移动的存在,并且可以有可能获取确定动作模式的确定结果。在此情况下,有可能省略动作模式生成单元42。
[目的地到达时间的预测处理]
接着参照图10和图11的流程图描述图1的预测系统1的目的地到达时间预测处理。
对于第一次,在步骤S51中,动作识别部14获取移动速度和位置的时间序列数据。也就是说,在步骤S51中,GPS传感器10向速度计算部11供应位置数据的时间序列数据,并且速度计算部11根据位置的数据来计算移动速度并且向动作识别部14依次供应位置和移动速度的数据。预定数目的样本的关于移动速度和位置的时间序列数据暂时存储于动作识别部14中。
在步骤S52中,动作识别部14基于通过学习而获得的参数根据用户活动模型来识别用户当前动作状态。也就是说,动作识别部14识别用户当前位置。然后,动作识别部14向动作预测部15供应用户当前状态节点的节点编号。
在步骤S53中,动作预测部15确定与它当前搜寻的状态节点(下文适当称为当前状态节点)对应的点是否为终点、途经点、分岔或者回路中的任一点。紧接在步骤S52的处理之后,与用户当前位置对应的状态节点变成当前状态节点。
在步骤S53,当确定与当前状态节点对应的点为终点时,该过程继续到步骤S54。然后,动作预测部15将当前状态节点连接到迄今路线,并且该过程结束对该路线的搜索并且继续到步骤S61。此外,由于在当前状态节点是与它的当前位置对应的状态节点时迄今路线并不存在,所以未进行连接过程。相同过程应用于步骤S55、S57和S60。
在步骤S53,当确定与当前状态节点对应的点为途经点时,该过程继续到步骤S55。然后,动作预测部15将当前状态节点连接到迄今路线。然后在步骤S56中,动作预测部15以后继状态节点为当前状态节点移动。过程在步骤S56的过程之后返回到步骤S53。
在步骤S53,当确定与当前状态节点对应的点为分岔时,该过程继续到步骤S57,并且动作预测部15将当前状态节点与迄今路线连接。然后在步骤S58中,动作预测部15在仅按照支路数目复制迄今路线之后连接分岔前面的状态节点。另外,在步骤S59中,动作预测部15选择复制的路线之一并且以在所选路线之前的状态节点为当前状态节点移动。过程在步骤S59的过程之后再次从步骤S53继续。
另一方面,在步骤S53,当确定与当前状态节点对应的点为回路时,该过程继续到步骤S60。然后,动作预测部15结束对该路线的搜索而不将当前状态节点与迄今路线连接,并且继续到步骤S61。
在步骤S61中,动作预测部15确定是否有它尚未搜索的任何路线。在步骤S61,当它确定有它尚未搜索的路线时,该过程继续到步骤S62。然后,动作预测部15返回到当前状态节点并且以它尚未搜索的路线的后继状态节点作为当前状态节点并且移动。过程在步骤S62的过程之后返回到步骤S53。由此,关于它尚未搜索的路线进行路线搜索,直至因终点或者回路而完成搜索。
当动作预测部15在步骤S61确定没有它尚未搜索的路线时,该过程继续到步骤S63,并且动作预测部15计算各搜索的路线的选择概率(出现概率)。动作预测部15向目的地预测部16供应各路线及其选择概率。
已通过从图10的步骤S51到步骤S63的处理来识别用户当前位置并且适当地搜寻用户可以从此取道的路线,并且在计算各路线的选择概率之后,该过程继续图11的步骤S64。
在步骤S64中,目的地预测部16预测用户目的地。具体而言,目的地预测部16首先列举目的地候选。目的地预测部16产生用户动作状态处于静止状态的位置的目的地候选。然后,目的地预测部16确定在列举的目的地候选之中在曾被动作预测部15搜寻的线路上的目的地候选作为目的地。
在步骤S65中,目的地预测部16针对每个目的地计算到达概率。也就是说,对于存在两条或更多条路线的目的地,目的地预测部16计算两条或更多条路线的选择概率之和作为目的地的到达概率。对于仅有一条路线的目的地,路线的选择概率按原样为目的地的到达概率。
在步骤S66,目的地预测部16确定是否有多于预定数目的预测目的地。当它在步骤S66确定有多于预定数目的预测目的地时,该过程继续到步骤S67,并且目的地预测部16确定显示部18上显示的预定数目的目的地。例如,目的地预测部16可以按照到达概率最高的目的地的顺序确定预定数目的路线。
另一方面,当目的地预测部16在步骤66确定预测的目的地数目未多于预定数目时,略过步骤S67。也就是说,在此情况下,所有预测的目的地显示于显示部18上。
在步骤S68中,目的地预测部16从动作预测部15曾搜寻的路线中提取包括预测的目的地的路线。当预测两个或更多个目的地时,针对各预测的目的地来提取路线。
在步骤S69中,目的地预测部16确定是否有比作为呈现数目而预先设置的预定数目更多的提取路线。
当目的地预测部16在步骤S69确定有多于预定数目的提取路线时,该过程继续到步骤S70,并且目的地预测部16确定显示部18上显示的预定数目的路线。例如,目的地预测部16可以按照被选择概率最高的路线的顺序确定预定数目的路线。
另一方面,当目的地预测部16在步骤S69确定提取的路线数目未多于预定数目时,略过步骤S70的过程。也就是说,在此情况下,用于到达目的地的所有路线显示于显示部18上。
在步骤S71中,目的地预测部16计算被确定为将在显示部18上显示的各路线的到达时间,并且向显示部18供应如下画面的信号,该画面显示目的地的到达概率以及通向目的地的路线和到达时间。
在步骤S72中,显示部18基于从目的地预测部16供应的画面的信号来显示目的地的到达概率以及通向目的地的路线和到达时间,并且结束该过程。
如上文提到的那样,根据图1的预测系统1,有可能根据位置和移动速度的时间序列数据预测目的地并且计算目的地的到达概率以及通向目的地的路线和到达时间,并且将它们建议给用户。
然而,在图1的预测系统1中采用如下两步过程作为学习机的配置,该两步过程考虑HMM的输出结果作为以后的HMM的输入。也就是说,如图8中所示,采用如下两步过程,该两步过程考虑状态序列生成单元41中的HMM的输出结果作为集成学习部32中的HMM的输入。在该两步过程中的学习时间耗时两倍之久,并且它的处理负担大。
<2.本发明的实施例>
其中描述本发明的如下实施例,该实施例可以学习如下预测系统的学习参数,该预测系统更容易地预测到达特定地点或者在当前时间之后的不远将来进行特定动作的地点的概率、路线和流逝时间而不是上文提到的第2009-208064号日本专利申请的方法。也就是说,将描述本发明的优选实施例。
[在应用本发明实施例的预测系统中的动作学习部的配置例子]
图12是示出在应用本发明实施例的预测系统中的动作学习部的配置例子的框图。
应用本发明实施例的预测系统配置采用与图1的预测系统1类似的配置。然而通过将图1的预测系统1中的动作学习部13替换为图12的动作学习部51,对用于向动作识别部14、动作预测部15和目的地预测部16供应的参数的学习(计算)变得更容易。
动作学习部51被配置成具有学习数据转换部61和参数计算部62。学习数据转换部61对应于图1的动作学习部13中的学习数据转换部31(图8),而参数计算部62对应于图1的动作学习部13中的集成学习部32(图8)。
学习数据转换部61被配置成具有模型学习单元71、状态序列生成单元72、状态序列纠正单元73和动作模式生成单元74。模型学习单元71、状态序列生成单元72和状态序列纠正单元73这三个部分对应于图8的状态序列生成单元41,而动作模式生成单元74对应于图8中的动作模式生成单元42。
另一方面,参数计算部62被配置成具有转变频率计数单元81、转变参数计算单元82、状态频率计数单元83、时间序列数据分类单元84和观测参数计算单元85。
下文描述构成学习数据转换部61和参数计算部62的各单元。
模型学习单元71基于从时间序列数据存储器部12供应的位置数据的时间序列数据来学习用户动作状态作为随机状态转变模型。由于时间序列数据是其中示出用户位置的数据,所以作为随机状态转变模型而学习的用户动作状态变成用户移动轨迹。作为用于学习的随机状态转变模型,类似于上文提到的例子采用其中向遍历HMM给予稀疏约束的模型。
模型学习单元71向状态序列生成单元72和状态序列纠正单元73供应通过学习而获得的学习模型(HMM)的参数。
状态序列生成单元72将从时间序列数据存储器部12供应的位置数据的时间序列数据改变成与用户当前位置对应的状态节点si的时间序列数据(路线)、生成状态序列数据并且将它供应到状态序列纠正单元73。具体而言,状态序列生成单元72基于从模型学习单元71供应的参数根据用户活动模型来识别与用户的输入当前位置对应的用户当前动作状态。然后,状态序列生成单元72向状态序列纠正单元73依次供应用户当前状态节点si作为识别结果。
状态序列纠正单元73如果需要则纠正从状态序列生成单元72供应的状态序列数据,并且向转变频率计数单元81、状态频率计数单元83和时间序列数据分类单元84供应纠正之后的状态序列数据。当在状态序列纠正单元73中未进行状态序列数据纠正时,向转变频率计数单元81、状态频率计数单元83和时间序列数据分类单元84原样供应从状态序列生成单元72供应的状态序列数据。因此下文对当在状态序列生成单元72中无状态序列数据纠正时进行说明,此后描述在状态序列生成单元72中进行的纠正过程。
动作模式生成单元74根据从时间序列数据存储器部12供应的移动速度的时间序列数据来生成动作模式序列数据、即动作模式的时间序列数据,并且向时间序列数据分类单元84供应该数据。
动作模式生成单元74可以通过与上文提到的图8的动作模式生成单元42相同的方法来生成动作模式的时间序列数据,并且可以通过另一方法生成动作模式的时间序列数据。另外以以上文提到的第2009-208064号日本专利申请的方法类似的方式,当从外界供应动作模式的时间序列数据时,可以省略动作模式生成单元74,并且可以原样使用来自外界的动作模式的时间序列数据。
转变频率计数单元81针对从状态序列纠正单元73供应的所有状态序列数据对各转变状态的频率进行计数。也就是,如果转变频率计数单元81将从状态节点si移向状态节点sj的路线的频率(计数值)表达为nij,则针对从状态序列纠正单元73供应的所有状态序列数据来获得各状态转变的频率nij(i=1到N,j=1到N,并且N是最后时间序列数据的节点编号(=节点数目))。
转变参数计算单元82计算与HMM的状态转变概率aij对应的转变参数。具体而言,转变参数计算单元82基于从转变频率计数单元81供应的各状态转变的频率nij按照等式(7)来计算转变概率Aij。
按照等式(7),未出现状态转变的转变概率Aij变为零。在使用已知HMM的学习模型中,如果重复次数未足够大,则难以使以往未出现的转变的概率小。然而,根据等式(7),存在可以使未出现的状态转变的转变概率Aij为零这样的特征。该特征的重要益处在于减少在搜寻将来路线的可能性的算法中搜寻不必要的路线。
转变参数计算单元82输出计算的转变概率Aij作为与HMM的状态转变概率aij对应的转变参数。
状态频率计数单元83针对从状态序列纠正单元73供应的所有状态序列数据对状态频率进行计数。也就是说,状态频率计数单元83可以针对从状态序列纠正单元73供应的所有状态序列数据对各状态节点si的合计cnti进行计数。每个状态节点si的合计cnti(计数结果)供应给观测参数计算单元85。
从状态序列纠正单元73向时间序列数据分类单元84供应状态序列数据。另外,从时间序列数据存储器部12向时间序列数据分类部单元84供应位置数据的时间序列数据,并且从活动模式生成单元74向时间序列数据分类单元84供应动作模式的时间序列数据。
时间序列数据分类单元84对从时间序列数据存储器部12依次供应的位置数据x的每个状态节点进行分类和分组。可以用以下等式(8)表达在状态si中的位置数据的集合数据Xi。
由于状态节点si的合计为cnti,所以集合数据Xi的元素数目变为cnti。此外,作为集合数据Xi的各元素的位置数据x具体而言为包括纬度、经度和时间的三维数据,但是缩写它以便用一维来表达。
另外,时间序列数据分类单元84对从动作模式生成单元74依次供应的动作模式m的每个状态节点进行分类和分组。可以用以下等式(9)表达状态节点si中的动作模式的集合数据Mi。
等式(9)中的集合数据Mi的元素数目也为cnti。
时间序列数据分类单元84向如上文提到的观测参数计算单元85供应如下分类结果,该分类结果具有用于每个状态节点的分类位置数据和动作模式的时间序列数据。换言之,时间序列数据分类单元84向观测参数计算单元85供应各状态节点的集合数据X和集合数据M。
观测参数计算单元85关于在从状态序列计算单元73供应的状态序列数据中包含的所有状态节点来计算位置数据和动作模式的各时间序列数据的观测参数。
观测参数计算单元85使用来自状态频率计数单元83的状态节点si的合计cnti和来自时间序列数据分类单元84的集合数据Xi来计算状态节点si的平均值μi和标准偏差σi作为位置数据的时间序列数据的观测参数。
该状态节点si的平均值μi和标准偏差σi是状态节点si中的位置数据x的观测概率,并且对应于如上文提到的集成学习部32(见图8)输出的多流HMM的输出概率密度函数b1i(x)。
此外,给定有少数元素的情况,可以预备关于标准偏差σi的约束,其中当它大于预定值时有约束。或者,可以转向在模型学习单元71中学习的标准偏差。
另外,观测参数计算单元85计算用以下等式(12)表达的各动作模式m相对于在状态节点si中的动作模式的集合数据Mi而言的出现频率P(si|m),作为动作模式的时间序列数据的观测参数。
在等式(12)中,N(Mi=m)代表在集合数据Mi内部的动作模式m的数目。
该动作模式m的出现频率P(si|m)是在状态节点si中的动作模式m的观测概率,并且对应于上文提到的集成学习部32(在图8中)输出的多流HMM的输出概率密度函数b2i(x)。
观测参数计算单元85输出各状态的出现频率P(si|m)、平均值μi和标准偏差σi(位置数据和动作模式的观测概率)作为观测参数。
如上文提到的那样,参数计算部62可以根据从状态序列纠正单元73供应的状态序列数据和从动作模式生成单元74供应的动作模式序列数据来计算第1事件和第2事件的随机状态转变模型的参数。
[参数学习处理]
参照图13的流程图描述图12的动作学习部51进行的学习处理。此外,在该学习处理之前进行模型学习单元71的学习处理,并且将向状态序列生成单元72和状态序列纠正单元73供应作为学习结果的参数。
在一开始,在步骤S101中,状态序列生成单元72根据从时间序列数据存储器部12供应的位置数据的时间序列数据来生成状态序列数据。也就是状态序列生成单元72将位置数据的时间序列数据变换成状态节点si的时间序列数据并且向状态序列纠正单元73供应该数据。
在步骤S102中,状态序列纠正单元73对从状态序列生成单元72供应的状态序列数据进行状态序列数据纠正处理,并且向转变频率计数单元81、状态频率计数单元83和时间序列数据分类单元84供应纠正之后的状态序列数据。后文参照图14至图18提到状态序列数据纠正处理的细节。当无需纠正状态序列数据时,向转变频率计数单元81、状态频率计数单元83和时间序列数据分类单元84原样供应从状态序列生成单元72供应的状态序列数据。
在步骤S103中,动作模式生成单元74根据从时间序列数据存储器部12供应的移动速度的时间序列数据来生成动作模式序列数据,并且将它供应到时间序列数据分类单元84。
可以在上文提到的步骤S101和S102的处理之前进行并且可以与步骤S101和S102的处理并行进行步骤S103的处理。
在步骤S104中,转变频率计数单元81针对从状态序列纠正单元73供应的所有状态序列数据对各状态转变的频率进行计数。也就是说,转变频率计数单元81获得各状态转变的频率nij(i=1到N,j=1到N,并且N是最后时间序列数据的节点编号(=节点数目))。
在步骤S105中,转变参数计算单元82计算与HMM的状态转变概率aij对应的转变参数。具体而言,转变参数计算单元82基于从转变频率计数单元81供应的各状态转变的频率nij按照上文提到的等式(7)来计算转变概率Aij。转变参数计算单元82输出计算的转变概率Aij作为与HMM的状态转变概率aij对应的转变参数。
在步骤S106中,状态频率计数单元83针对从状态序列纠正单元73供应的所有状态序列数据对状态频率进行计数。也就是说,状态频率计数单元83针对从状态序列纠正单元73供应的所有状态序列数据对各状态节点si的合计cnti进行计数。向观测参数计算单元85供应作为计数结果的各状态节点si的合计cnti。
在步骤S107中,时间序列数据分类单元84针对每个状态节点对位置数据和动作模式的时间序列数据进行分类。也就是,时间序列数据分类单元84对从时间序列数据存储器部12依次供应的位置数据x的每个状态节点进行分类和分组。另外,时间序列数据分类单元84对从动作模式生成单元74供应的动作模式的时间序列数据的每个状态节点进行分类和分组。
在步骤S108中,观测参数计算单元85关于在从状态序列纠正单元73供应的状态序列数据中包含的所有状态节点来计算位置数据和动作模式的时间序列数据的各观测参数。
具体而言,观测参数计算单元85使用来自状态频率计数单元83的状态节点si的合计cnti和来自时间序列数据分类单元84的集合数据Xi来计算状态节点si的平均值μi和标准偏差σi。
另外,观测参数计算单元85计算用等式(12)表达的各动作模式m相对于在状态节点si中的动作模式的集合数据Mi而言的出现频率P(si|m)。
在步骤S108中,如果向动作识别部14、动作预测部15和目的地预测部16供应通过计算而获得的动作模式和位置数据的时间序列数据的各观测参数,则观测参数计算单元85结束图13的学习处理。
根据图13的学习处理,尽管图8的动作学习部13的集成学习部32通过学习HMM来获得待输出的参数,但是图12的动作学习部51的参数计算部62可以通过统计过程来获得待输出的参数。因此可以更容易地获得动作识别部14、动作预测部15和目的地预测部16用于预测处理的参数。也就是说,可以更容易地获得用于预测到达特定地点或者在当前时间之后的将来进行特定动作的地点的概率、路线和流逝时间的学习参数。
[描述状态序列纠正单元73对状态序列数据的纠正处理]
接着描述状态序列纠正单元73对状态序列数据进行的纠正处理。
状态序列纠正单元73根据预定规则来纠正从状态序列生成单元72供应的状态序列数据,并且向转变频率计数单元81、状态频率计数单元83和时间序列数据分类单元84供应纠正之后的状态序列数据。
在本发明的本实施例中,状态序列纠正单元73纠正从状态序列生成单元72供应的状态序列数据,从而该数据可以变成左到右型状态序列数据。
对于本发明的本实施例,从状态序列生成单元72供应的状态序列数据是示出与GPS传感器10获取的用户位置对应的用户移动轨迹的数据。假定,用户移动可以近似为从某个目的地到其它目的地的左到右型状态转变模型。另外,虽然可以在用户长时间静止于地点之时用两个或更多个状态节点来表达相同地点,但是假定它可以一起聚集成一个状态节点。
状态序列纠正单元73简化从状态序列生成单元72供应的状态序列数据进行的纠正,从而数据可以变成左到右型状态序列数据。
希望预先获取时间序列数据存储部12中存储的位置数据的时间序列数据,从而可以易于通过细分数据序列以免成为一个数据序列而是划分成针对每天、针对每次去往或者返回或者针对每个目的地(静止地点)等的数据来对左到右型的状态序列数据做出响应。或者,希望在细分成针对每天、针对每次去往或者返回或者针对每个目的地(静止地点)等的数据之后,使用时间序列数据存储器部12中存储的一条位置数据的时间序列数据。
图14示出状态序列纠正单元73的纠正处理。
为了纠正使得状态序列数据满足左到右约束,状态序列纠正单元73先在状态序列数据搜寻是否有任何回路、即返回到相同状态节点的部分。然后,当检测到回路时,状态序列纠正单元73合并回路(删除状态节点并且将它吸收到母节点)或者进行拆分(生成和划分新状态节点)。
具体而言,状态序列纠正单元73通过在回路中的节点数目为一时合并而且通过在回路中的节点数目为二或者更多时拆分来纠正状态序列数据。
[状态序列纠正单元73的回路纠正处理]
图15示出状态序列纠正单元73的回路纠正处理的流程图。状态序列纠正单元73具有如下的内部存储器,该内部存储器存储预定数目的步骤的状态序列数据,当某一数目的步骤的状态序列数据从状态序列生成单元72存储在内部存储器中时开始此处理。
首先在步骤S121中,状态序列纠正单元73关于从状态序列生成单元72供应的状态序列数据确定关注节点。也就是说,状态序列纠正单元73从状态序列生成单元72供应的状态序列数据之中选择的前导状态节点并且以它为关注节点。
在步骤S122中,状态序列纠正单元73判断关注节点的节点编号是否与先前节点的节点编号相同。当状态转变为自转变时,关注节点的节点编号变成相同。因此,换言之,状态序列纠正单元73确定它们是否为自状态转变。此外,当前导状态节点为关注节点时确定关注节点的节点编号与先前节点的节点编号相同。
当状态序列纠正单元73在步骤S122确定关注节点的节点编号与先前节点的节点编号相同时,处理继续到后文提到的步骤S127。
另一方面,当状态序列纠正单元73在步骤S122确定关注节点的节点编号未与先前节点的节点编号相同时,处理继续到步骤S123,状态序列纠正单元73确定关注节点是否存在于以往状态序列中。在步骤S123中,当回路存在于状态序列数据中并且有通过回路过程向以往状态序列的返回时确定关注节点存在于以往状态序列中。
在步骤S123,当确定关注节点未存在于以往状态序列中时,处理继续到后文提到的步骤S127。
另一方面,在步骤S123,当确定关注节点存在于以往状态序列中时,处理继续到步骤S124,并且状态序列纠正单元73确定回路中的节点数目为一。
在步骤S124中,当确定回路中的节点数目为一时,在步骤S125中,状态序列纠正单元73将回路的节点合并到母节点(返回地点的节点)中。
在步骤S124,当确定回路中的节点数目为二或更多时,在步骤S126中,状态序列纠正单元73生成和划分新节点。
在步骤S125或者步骤S126的处理之后,在步骤S127中确定在状态序列数据中是否在关注节点之后有节点。
当在步骤S127确定在关注节点之后有节点时,在步骤S128中,状态序列纠正单元73确定后继节点作为关注节点,并且处理返回到步骤S122。
另一方面,当在步骤S127确定在关注节点之后无节点时,也就是说,当关于从状态序列生成单元72供应的状态序列数据的所有状态节点发现回路时,处理结束。
状态序列纠正单元73通过进行上述处理来纠正从状态序列生成单元72供应的状态序列数据,并且向状态频率计数单元81、状态频率计数单元83和时间序列数据分类单元84供应纠正之后的状态序列数据。
此外,对于本发明的该实施例,确定状态序列纠正单元73是否通过合并或者拆分来纠正了回路或者在回路中的节点数目是否为一。然而,在有通过合并或者拆分来纠正的情况下,诸如似然度是否变高或者学习模型的复杂度等其它确定判据可以用来确定是否曾有通过合并或者拆分来纠正。
另外,当可以使用其它信息时,也有可能确定是否通过合并或者拆分来纠正。例如,即使回路中的节点数目为一,但是它们可以例如是重要节点,比如目的地候选的节点。在这样的情况下,合并不合适而将使用拆分过程。另外,即使在回路中有2个或更多个节点,仍然各自可以是不重要节点。另外可替选地,可以考虑如下情况,其中可以不增加节点总数为更多,因为有节点总数约束等。对于该情况,可以视情况进行改变。
[描述状态序列纠正单元73的其它纠正处理]
接着描述状态序列纠正单元73的状态序列数据的其它纠正处理例子。
图16示出纠正如下共享节点的处理例子,其中共享节点是在两个或更多个序列之间共享的一个节点。
在图16的上部的状态转变图中,在中间通过附带斜线示出的节点为共享节点。也就是说,在共享节点之前和之后的各节点为单独节点。如图16的下部的状态转变图中所示,状态序列纠正单元73拆分共享节点(生成和划分新状态节点)并且将原状态序列数据纠正为两个序列。
当节点的似然度低时,虽然地点将是单独节点,但是它可能由于初始条件和模型的节点数目不足等而在学习时陷入局部最小值并且可以变成这样的共享节点。节点的似然度在示出位置数据的节点处为低的情况意味着在节点示出的位置(中心位置)与实际数据的位置之间的距离大的情况。
可以通过如下处理来取消因初始条件和模型的节点数目不足等而生成的共享节点,该处理进行对共享节点的拆分作为状态序列纠正单元73中的状态序列数据纠正处理。换言之,在状态序列纠正单元73中可以在事后(附加地)实现模型学习单元71不能在约束条件(稀疏约束的遍历HMM)下实现的处理。
[状态序列纠正单元73的共享节点纠正处理]
图17示出状态序列纠正单元73的共享节点纠正处理的流程图。当所有状态序列数据存储于内部存储器中时从状态序列生成单元72开始该处理。
首先在步骤S141中,状态序列纠正单元73在内部存储器存储的状态序列数据中搜索低似然度节点(似然度不大于预定值的节点)并且继续到步骤S142。在本发明的实施例中,在通过学习而获得的节点的中心位置与实际数据的位置之间的距离大的节点变成低似然度节点。
在步骤S142中,状态序列纠正单元73确定是否曾检测到低似然度节点。
当在步骤S142确定已经检测到低似然度节点时,处理继续到步骤S143,并且状态序列纠正单元73确定检测到的低似然度节点作为关注节点。
在步骤S144中,状态序列纠正单元73确定关注节点是否为共享节点。当在步骤S144确定关注节点并非共享节点时,处理返回到步骤S141。
另一方面,当在步骤S144确定关注节点为共享节点时,处理继续到步骤S145,并且状态序列纠正单元73确定在该节点之前和之后是否有多个节点。
在步骤S145,当确定在该节点之前和之后均无多个节点时,处理返回到步骤S141。另一方面,在步骤S145,当确定在该节点之前或者之后有多个节点时,处理继续到步骤S146,并且状态序列纠正单元73通过生成新节点来将原状态序列数据纠正为两个序列。而且在步骤S146的处理之后,处理返回到步骤S141。
然后通过重复和进行从上文提到的步骤S141到步骤S146的处理,依次检测所有低似然度节点,并且进行对共享节点的拆分。
当检测了所有低似然度节点时,在步骤S142确定尚未检测到低似然度节点,则处理继续到步骤S147。然后在步骤S147中,状态序列纠正单元73输出在对原状态序列数据曾进行的纠正之后的状态序列数据并且结束处理。当未检测到低似然度节点时,原样输出原状态序列数据。
状态序列纠正单元73可以进行上述共享节点纠正处理,并且可以纠正从状态序列生成单元72供应的状态序列数据。
此外,在图16和图17中所示处理中,只有当关于之前和之后方向有两个或更多个序列时才进行对节点的拆分。然而,如图18的右手侧中所示,即使在之前或者之后方向上有多个序列的情况,仍然进行对节点的拆分。
另外如图18的左手侧中所示,即使在之前或者之后方向上无多个序列的情况,如果节点的似然度针对已经进行拆分的情况变高,则仍然进行对节点的拆分。在任何情况下,似然度由于拆分而变得高于纠正之前是一个条件。另外,在针对在之前或者之后方向上无多个序列的情况拆分时,如图18的左手侧中所示,自转变已经出现以使得步骤数目可以在纠正之前和之后不变,这也变成节点纠正的条件。
根据上述状态序列纠正单元73对状态序列数据的纠正处理,纠正不仅在向状态序列数据新添加约束的情况下是可能的,而且在由于通过学习而陷入局部最小值所以没有可能使似然度足够高的情况下也是可能的。
在图16和图17中所述处理中,虽然对学习数据的似然程度进行检查,但是可以通过与学习数据同时获得的其它数据来检查似然程度。如果在其它数据序列之中有影响学习模型中的状态转变的事物,则它将学习为多形态模型。然而,数据序列的作用不大或者它可能不规则,学习仅按照作用大的数据,并且可以通过仅当在状态序列纠正单元73中纠正根据学习的模型而获得的状态序列数据时反应该影响来避免作用小的时间序列数据向学习模型给予多于必需的影响。
[验证动作学习部51的效果]
参照图19至图21描述与第2009-208064号日本专利申请的方法比较的动作学习部51的效果。
图19示出当已经使用第2009-208064号日本专利申请的方法的用户来学习用户动作模式时的学习结果。因此,学习模型是其中给予稀疏约束的遍历HMM。
图19中所示小椭圆形示出通过学习而获得的各状态节点。状态节点数目可以为400个。绘制椭圆形使得它可以变成视聚焦于状态节点的观测参数μ而定的尺寸。
另外虽然将各状态节点分类为各状态节点是目的地节点(静止节点)还是移动节点这一学习结果,但是鉴于在附图中的约束,因为难以表达它们的区别,所以在图19中为具有目的地节点的地点添加大圆圈。
图20是改写图以便使图19的学习模型中的状态节点之间的转变关系更为清楚。在图20中,用圆圈示出的各节点布置成格状形状,并且箭头仅连接和表达非零转变。因此,意味着转变概率在无箭头连接的节点之间为0。各节点的深度区分它是否为目的地节点,浅灰色圆圈示出目的地节点,而黑圆圈示出其它节点。此外,在图20中,关于目的地节点的部分附带“目的地”。
在节点之间的许多状态转变存在于图20的学习结果中。换言之,在仅使其中给予稀疏约束的遍历HMM变成学习模型的情况下存在在节点之间的多个转变。按照第2009-208064号日本专利申请的方法,由于它搜寻多个转变所考虑的多个路线,所以预计处理变得繁重,因为它需要时间搜寻路线。然而为了简化该处理,由于如果在分岔进行省略低概率路线的处理以便简化该处理则不再会在目的地到达概率中反映省略的路线的部分概率,所以到达概率变低。因此,难以进行这样的处理。
图21示出动作学习部51的学习结果。所示方法与图20的方法相同。
当参照图21时可以理解在节点之间的转变概率为0的转变显著减少。也就是说,可以理解在节点之间的转变数目显著减少。因此,有可能进一步加速目的地的自动搜索、路线搜索、概率计算和时间预测等处理。
另外,在动作学习部51的学习结果中,如图21中所示,由于减少支路数目,所以不必进行省略低概率路线的处理,并且目的地到达概率未必变低。此外,实质上在动作学习部51中,虽然进行省略低概率路线的处理,但是如第2009-208064号日本专利申请的方法那样的目的地到达概率变低这一现象未明显出现。
另外,在图21的学习结果中,用浅灰色圆圈示出的目的地节点也显著减少。因此,在动作学习部51中也可以极大地抑制目的地节点数目,这有别于第2009-208064号日本专利申请的方法。
接着,参照图22至图24,状态序列纠正单元73说明在通过回路纠正处理来纠正状态序列数据时的效果。
图22示出与图19的例子不同的用户动作模式和在模型学习单元71学习时的学习结果。图22中所示学习模型是如下模型,其中因为遗漏截至当日的位置数据,尽管途经相同路线的位置数据用于学习的时间序列数据,也产生两个或者更多个支路路线。因而预测处理已经耗费很长时间。
在图22中,在节点的上部绘制的粗实线示出作为预测处理结果的预测路线。
图23是如下图,其中图22中的学习模型和预测路线如图20中所示格状那样布置,并且图23放大示出其中存在预测路线的状态节点部分。
在图23中,粗灰实线对应于预测路线、即图9中所示的预测路线。
如图23中所示,如图14中所示字符“T”的回路路线存在于模型学习单元71的学习结果中。图23示出在学习结果中包含的并且由粗线圆圈包围的如字符“T”那样的回路路线的四个地点。在有一个这样的回路时,在该回路之后的路线搜寻将倍增。
参照图14和15描述的状态序列纠正单元73纠正原状态序列数据,从而它可以变成左右型状态序列数据。
图24示出用于回路纠正处理的处理之前和之后。类似示出图23中的粗线圆圈包围的四个地点。
通过清楚地参照图24,按照原状态序列数据存在的回路按照纠正之后的状态序列数据已经消失。因此可以通过状态序列纠正单元73的回路纠正处理来消除回路。
在图14和图15的回路纠正处理中,可以认为将学习模型纠正为给予稀疏约束的约束条件的遍历HMM,从而可以进一步给予左到右型的约束条件。也就是说,可以在状态序列纠正单元73中实现在学习时按照初始条件不能在稀疏约束的约束条件下实现的约束。
另一方面,在图16和图17的共享节点纠正处理中,可以选择似然程度减少的节点,并且可以进行使似然程度更高的纠正。即使这在学习时陷入局部最小值,其仍然变成避免它的措施。另外也可以在该纠正处理中采取未用于学习的其它条件。
也可以通过硬件和通过软件进行上文提到的系列处理。当通过软件进行系列处理时,构成该软件的程序安装于计算机中。这里,安装内置有专用硬件的计算机和可以通过安装各种程序来执行各种功能的通用个人计算机作为计算机。
图25是示出通过程序进行上文提到的系列处理的计算机的硬件配置例子的框图。
在计算机中,CPU(中央处理单元)201、ROM(只读存储器)202和RAM(随机存取存储器)203由总线204相互连接。
输入和输出接口205还连接到总线204。输入单元206、输出单元207、存储器单元208、通信单元209、驱动器210和GPS传感器211连接到输入和输出接口205。
输入单元206包括键盘、鼠标和麦克风。输出单元207包括显示器和扬声器。存储器单元208包括硬盘和非易失性存储器。通信单元209包括网络接口。驱动期210驱动可拆卸记录介质212,比如磁盘、光盘、磁光盘或者半导体存储器。GPS传感器211等同于图1的GPS传感器10。
在如上文提到的那样构成的计算机中,CPU 201例如通过输入和输出接口205和总线204向RAM 203加载存储器单元208中存储的程序并且执行它来进行上文提到的系列处理。
例如可以在作为包介质等的可拆卸记录介质212上存储计算机(CPU201)执行的程序并且从该介质提供该程序。另外,可以通过有线或者无线电传输介质(比如局域网、因特网和数字卫星广播)提供程序。
在计算机中,可以通过在驱动器210中配备可拆卸记录介质212来通过输入和输出接口205在存储器单元208中安装程序。另外,可以通过有线或者无线电传输介质在通信单元209中接收程序并且可以在存储器单元208中安装程序。此外,程序可以预先安装于ROM 202或者存储器单元208中。
计算机执行的程序可以是如下程序,根据该程序按照在此详细论述的说明顺序对时间序列进行处理,并且可以是如下程序,按照该程序根据必要定时(比如在调用它时)或者并行完成处理。
此外,对于该详细论述以及当根据所示顺序串行进行流程图中描述的步骤时,即使当然未必串行处理它,但是可以根据必要定时(比如在调用它时)或者并行进行它。
此外,在该详细论述中,系统表达由两个或更多个设备构成的整个设备。
在并不限于上文提到的实施例形式而且并不脱离本发明的发明内容的范围中,各种修改对于本发明的实施形式是可能的。
本申请包含于2009年12月4日向日本专利局提交的第2009-276999号日本优先权专利申请中公开的主题内容有关的主题内容,其全部内容通过引用结合于此。
本领域技术人员应当理解,可以根据设计要求和迄今其它因素出现各种修改、组合、次组合和变更,只要它们在所附权利要求或者其等同物的范围内。
Claims (13)
1.一种数据处理装置,包括:
状态序列生成装置,在第一事件的状态转变模型表达为随机状态转变模型时根据在所述第一事件和第二事件的时间序列数据之间的所述第一事件的时间序列数据来生成状态节点的时间序列数据;以及
计算装置,通过使用所述第一事件的时间序列数据和所述状态节点的时间序列数据来计算与所述状态节点的出现频率、在所述状态节点之中的转变出现频率和所述状态节点对应的时间序列数据的参数,以计算用于所述第一事件和所述第二事件的随机状态转变模型的参数。
2.根据权利要求1所述的数据处理装置,
其中所述第一事件的时间序列数据是用于用户的位置数据的时间序列数据,
所述第二事件的时间序列数据是用于所述用户的动作模式的时间序列数据,
所述状态序列生成装置在示出用户的动作状态的动作模型表达为所述随机状态转变模型时根据所述用户的位置数据的时间序列数据来生成所述状态节点的时间序列数据,以及
所述计算装置通过使用所述位置数据的时间序列数据和所述状态节点的时间序列数据来计算与所述状态节点的出现频率、在所述状态节点之中的转变出现频率和所述状态节点对应的时间序列数据的参数,以计算所述随机状态转变模型的参数。
3.根据权利要求2所述的数据处理装置,
其中所述状态序列生成装置采用隐马尔科夫模型作为所述随机状态转变模型并且通过使用通过学习而寻求的所述隐马尔科夫模型的参数根据所述用户的位置数据的时间序列数据来生成所述状态节点的时间序列数据。
4.根据权利要求3所述的数据处理装置,
其中所述计算装置具有:
计数装置,针对所述状态节点的时间序列数据对各状态的频率和各状态转变的频率进行计数,以及
统计计算装置,在时间序列数据分离成对应状态节点之后计算分类成各状态节点的时间序列数据的统计,以及
根据分类成各状态的频率、各状态转变的频率和所述状态节点的时间序列数据的所述统计来计算所述隐马尔科夫模型的转变概率和观测概率。
5.根据权利要求4所述的数据处理装置,还包括:
状态序列纠正装置,修改状态节点的时间序列数据,所述状态节点的时间序列数据由所述状态序列生成装置生成。
6.根据权利要求5所述的数据处理装置,
其中所述状态序列纠正装置修改状态节点的时间序列数据以便满足针对所述状态转变的新约束。
7.根据权利要求5所述的数据处理装置,
其中所述状态序列纠正装置修改所述状态节点的时间序列数据,从而状态节点的似然度高。
8.根据权利要求5所述的数据处理装置,
其中所述状态序列纠正装置还利用其它信息通过鉴别来修改所述状态节点的时间序列数据。
9.一种使用数据处理装置的数据处理方法,所述数据处理装置通过包括状态序列生成装置和计算装置来输出第一事件和第二事件的随机状态转变模型的参数,所述方法包括:
使所述数据处理装置的状态序列生成装置在所述第一事件的状态转变模型表达为随机状态转变模型时根据在所述第一事件和所述第二事件的时间序列数据之间的所述第二事件的时间序列数据来生成状态节点的时间序列数据;以及
使所述计算装置通过使用所述第一事件的时间序列数据和所述状态节点的时间序列数据来计算与所述状态节点的出现频率、在所述状态节点之中的转变出现频率和所述状态节点对应的时间序列数据的参数,以计算所述第一事件和第二事件的随机状态转变模型的参数。
10.一种使计算机作为以下装置来工作的程序:
状态序列生成装置,在第一事件的状态转变模型表达为随机状态转变模型时根据在所述第一事件和第二事件的时间序列数据之间的所述第一事件的时间序列数据来生成状态节点的时间序列数据;以及
计算装置,通过使用所述第一事件的时间序列数据和所述状态节点的时间序列数据来计算与所述状态节点的出现频率、在所述状态节点之中的转变出现频率和所述状态节点对应的时间序列数据的参数,以计算所述第一事件和第二事件的随机状态转变模型的参数。
11.一种数据处理装置,包括:
状态序列生成单元,在第一事件的状态转变模型表达为随机状态转变模型时根据在所述第一事件和第二事件的时间序列数据之间的所述第一事件的时间序列数据来生成状态节点的时间序列数据;以及
计算单元,通过使用所述第一事件的时间序列数据和所述状态节点的时间序列数据来计算与所述状态节点的出现频率、在所述状态节点之中的转变出现频率和所述状态节点对应的时间序列数据的参数,以计算用于所述第一事件和所述第二事件的随机状态转变模型的参数。
12.一种使用数据处理装置的数据处理方法,所述数据处理装置通过包括状态序列生成单元和计算单元来输出第一事件和第二事件的随机状态转变模型的参数,所述方法包括:
使所述数据处理装置的状态序列生成单元在所述第一事件的状态转变模型表达为随机状态转变模型时根据在所述第一事件和所述第二事件的时间序列数据之间的所述第二事件的时间序列数据来生成状态节点的时间序列数据;以及
使所述计算单元通过使用所述第一事件的时间序列数据和所述状态节点的时间序列数据来计算与所述状态节点的出现频率、在所述状态节点之中的转变出现频率和所述状态节点对应的时间序列数据的参数,以计算所述第一事件和第二事件的随机状态转变模型的参数。
13.一种使计算机作为以下单元来工作的程序:
状态序列生成单元,在第一事件的状态转变模型表达为随机状态转变模型时根据在所述第一事件和第二事件的时间序列数据之间的所述第一事件的时间序列数据来生成状态节点的时间序列数据;以及
计算单元,通过使用所述第一事件的时间序列数据和所述状态节点的时间序列数据来计算与所述状态节点的出现频率、在所述状态节点之中的转变出现频率和所述状态节点对应的时间序列数据的参数,以计算所述第一事件和第二事件的所述随机状态转变模型的参数。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009276999A JP2011118776A (ja) | 2009-12-04 | 2009-12-04 | データ処理装置、データ処理方法、およびプログラム |
JP2009-276999 | 2009-12-04 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN102183252A true CN102183252A (zh) | 2011-09-14 |
Family
ID=44082980
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2010105737285A Pending CN102183252A (zh) | 2009-12-04 | 2010-11-26 | 数据处理装置、数据处理方法和程序 |
Country Status (3)
Country | Link |
---|---|
US (1) | US20110137833A1 (zh) |
JP (1) | JP2011118776A (zh) |
CN (1) | CN102183252A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103365731A (zh) * | 2013-06-28 | 2013-10-23 | 中国科学院计算技术研究所 | 一种降低处理器软错误率的方法和系统 |
CN108319704A (zh) * | 2018-02-05 | 2018-07-24 | 北京中关村科金技术有限公司 | 一种分析数据的方法、装置、设备及存储介质 |
CN110494862A (zh) * | 2017-03-30 | 2019-11-22 | 佳能株式会社 | 序列产生装置及其控制方法 |
Families Citing this family (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10065628B2 (en) * | 2011-05-09 | 2018-09-04 | Ford Global Technologies, Llc | Location enhanced distance until charge (DUC) estimation for a plug-in hybrid electric vehicle (PHEV) |
KR101365993B1 (ko) | 2011-12-29 | 2014-02-21 | 홍익대학교 산학협력단 | 데이터처리방법, 데이터처리장치, 데이터수집방법, 및 정보제공방법 |
WO2013100287A1 (ko) * | 2011-12-29 | 2013-07-04 | Song Ha Yoon | 데이터처리방법, 데이터처리장치, 데이터수집방법, 및 정보제공방법 |
KR101369261B1 (ko) | 2012-02-10 | 2014-03-06 | 서울대학교산학협력단 | 스마트 단말을 이용한 사용자의 이동 경로 실시간 예측 방법 및 그 시스템 |
JP2013205171A (ja) * | 2012-03-28 | 2013-10-07 | Sony Corp | 情報処理装置、情報処理方法、およびプログラム |
WO2013168495A1 (ja) * | 2012-05-10 | 2013-11-14 | 日本電気株式会社 | 階層型確率モデル生成システム、階層型確率モデル生成方法、およびプログラム |
KR101425891B1 (ko) * | 2012-10-26 | 2014-08-01 | 홍익대학교 산학협력단 | 사용자 예측위치를 이용한 홍보 서비스 제공방법 및 이를 위한 시스템 |
KR101446099B1 (ko) * | 2013-03-04 | 2014-10-07 | 서울대학교산학협력단 | 스마트 단말을 이용한 안정적인 사용자의 이동 경로 실시간 예측 방법 및 그 시스템 |
JP6464447B2 (ja) * | 2013-09-02 | 2019-02-06 | 本田技研工業株式会社 | 観測値の予測装置及び観測値の予測方法 |
KR101603921B1 (ko) * | 2014-05-15 | 2016-03-17 | 에스케이텔레콤 주식회사 | 이동체의 이동성 예측 방법 및 이를 위한 장치 |
WO2016017171A1 (ja) * | 2014-08-01 | 2016-02-04 | 日本電気株式会社 | 流量予測装置、混合比推定装置、方法およびコンピュータ読み取り可能記録媒体 |
US9984154B2 (en) * | 2015-05-01 | 2018-05-29 | Morpho Detection, Llc | Systems and methods for analyzing time series data based on event transitions |
JP6368684B2 (ja) * | 2015-05-15 | 2018-08-01 | 日本電信電話株式会社 | 推定方法、装置、及びプログラム |
US10110634B2 (en) * | 2016-02-04 | 2018-10-23 | Amadeus S.A.S. | Monitoring user authenticity in distributed system |
US20190004926A1 (en) * | 2017-06-29 | 2019-01-03 | Nicira, Inc. | Methods and systems that probabilistically generate testing loads |
JP6981860B2 (ja) * | 2017-11-30 | 2021-12-17 | 日本電信電話株式会社 | 系列データ解析装置、系列データ解析方法及びプログラム |
US11481647B1 (en) * | 2019-03-19 | 2022-10-25 | Humana Inc. | Determining high impact features for a prediction of a machine learning model |
US11201893B2 (en) | 2019-10-08 | 2021-12-14 | The Boeing Company | Systems and methods for performing cybersecurity risk assessments |
JP7094342B2 (ja) * | 2020-10-22 | 2022-07-01 | 株式会社サイバーエージェント | 画像生成プログラム、画像生成装置及び画像生成方法 |
JP7401716B1 (ja) | 2022-04-28 | 2023-12-19 | 楽天グループ株式会社 | 情報処理装置、情報処理方法、プログラム、および学習モデル |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006134080A (ja) * | 2004-11-05 | 2006-05-25 | Ntt Docomo Inc | 携帯端末、及び、個人適応型コンテキスト獲得方法 |
CN1877340A (zh) * | 2005-06-09 | 2006-12-13 | 索尼株式会社 | 活动识别设备、方法、以及程序 |
JP2008204040A (ja) * | 2007-02-19 | 2008-09-04 | Kddi Corp | 携帯端末、プログラム及び携帯端末への表示画面制御方法 |
-
2009
- 2009-12-04 JP JP2009276999A patent/JP2011118776A/ja not_active Withdrawn
-
2010
- 2010-11-24 US US12/954,194 patent/US20110137833A1/en not_active Abandoned
- 2010-11-26 CN CN2010105737285A patent/CN102183252A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006134080A (ja) * | 2004-11-05 | 2006-05-25 | Ntt Docomo Inc | 携帯端末、及び、個人適応型コンテキスト獲得方法 |
CN1877340A (zh) * | 2005-06-09 | 2006-12-13 | 索尼株式会社 | 活动识别设备、方法、以及程序 |
JP2008204040A (ja) * | 2007-02-19 | 2008-09-04 | Kddi Corp | 携帯端末、プログラム及び携帯端末への表示画面制御方法 |
Non-Patent Citations (2)
Title |
---|
EMILY B. FOX,ET AL: "Hierarchical Dirichlet Processes for Tracking Maneuvering Targets", 《THE 2007 INTERNATIONAL CONFERENCE ON INFORMATION FUSION》 * |
LIN LIAO, ET AL: "Extracting Places and Activities from GPS Traces Using Hierarchical Conditional Random Fields", 《J. ROBOTICS RESEARCH》 * |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103365731A (zh) * | 2013-06-28 | 2013-10-23 | 中国科学院计算技术研究所 | 一种降低处理器软错误率的方法和系统 |
CN103365731B (zh) * | 2013-06-28 | 2016-07-06 | 中国科学院计算技术研究所 | 一种降低处理器软错误率的方法和系统 |
CN110494862A (zh) * | 2017-03-30 | 2019-11-22 | 佳能株式会社 | 序列产生装置及其控制方法 |
CN110494862B (zh) * | 2017-03-30 | 2023-06-20 | 佳能株式会社 | 序列产生装置及其控制方法 |
CN108319704A (zh) * | 2018-02-05 | 2018-07-24 | 北京中关村科金技术有限公司 | 一种分析数据的方法、装置、设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
JP2011118776A (ja) | 2011-06-16 |
US20110137833A1 (en) | 2011-06-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102183252A (zh) | 数据处理装置、数据处理方法和程序 | |
CN102087722A (zh) | 学习设备和方法、预测设备和方法及程序 | |
JP5495014B2 (ja) | データ処理装置、データ処理方法、およびプログラム | |
US20110302116A1 (en) | Data processing device, data processing method, and program | |
CN109974735B (zh) | 到达时间的预估方法、装置及计算机设备 | |
US20110319094A1 (en) | Information processing apparatus, information processing system, information processing method, and program | |
JP2012008659A (ja) | データ処理装置、データ処理方法、およびプログラム | |
WO2012066951A1 (ja) | データ処理装置、データ処理方法、およびプログラム | |
CN102298608A (zh) | 信息处理装置、信息处理方法和程序 | |
JP2011138487A (ja) | 空間−時間関係に基づく交通予測方法およびシステム | |
JP5070574B2 (ja) | 局所交通量予測プログラム生成装置、局所交通量予測装置、局所交通量予測プログラム生成方法、局所交通量予測方法及びプログラム | |
Ozdemir et al. | A hybrid HMM model for travel path inference with sparse GPS samples | |
CN110598917B (zh) | 一种基于路径轨迹的目的地预测方法、系统及存储介质 | |
Halim et al. | On finding optimum commuting path in a road network: a computational approach for smart city traveling | |
Garcia et al. | Hybrid approach for the public transportation time dependent orienteering problem with time windows | |
Li et al. | Route restoration method for sparse taxi GPS trajectory based on Bayesian network | |
CN113903171B (zh) | 一种基于高速路网时空特性的车辆群智感知节点优化方法 | |
CN107038252B (zh) | 一种基于多模态数据的路由度量的生成方法 | |
Ajani et al. | Dynamic path planning approaches based on artificial intelligence and machine learning | |
Zhou et al. | Refined taxi demand prediction with ST-Vec | |
Liu et al. | TTDM: A travel time difference model for next location prediction | |
Neto et al. | Prediction of Destinations and Routes in Urban Trips with Automated Identification of Place Types and Stay Points. | |
Chen et al. | Intelligent travel route recommendation algorithm based on big data | |
Estalayo et al. | Deep recurrent neural networks and optimization meta-heuristics for green urban route planning with dynamic traffic estimates | |
Guangyao et al. | Route Restoration Method for Sparse Taxi GPS trajectory based on Bayesian Network. |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20110914 |
|
WD01 | Invention patent application deemed withdrawn after publication |