CN102298729A - 数据处理装置、数据处理方法和程序 - Google Patents

数据处理装置、数据处理方法和程序 Download PDF

Info

Publication number
CN102298729A
CN102298729A CN201110166329A CN201110166329A CN102298729A CN 102298729 A CN102298729 A CN 102298729A CN 201110166329 A CN201110166329 A CN 201110166329A CN 201110166329 A CN201110166329 A CN 201110166329A CN 102298729 A CN102298729 A CN 102298729A
Authority
CN
China
Prior art keywords
model
state
node
data
historical data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201110166329A
Other languages
English (en)
Inventor
井手直纪
伊藤真人
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Publication of CN102298729A publication Critical patent/CN102298729A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01CMEASURING DISTANCES, LEVELS OR BEARINGS; SURVEYING; NAVIGATION; GYROSCOPIC INSTRUMENTS; PHOTOGRAMMETRY OR VIDEOGRAMMETRY
    • G01C21/00Navigation; Navigational instruments not provided for in groups G01C1/00 - G01C19/00
    • G01C21/20Instruments for performing navigational calculations
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01CMEASURING DISTANCES, LEVELS OR BEARINGS; SURVEYING; NAVIGATION; GYROSCOPIC INSTRUMENTS; PHOTOGRAMMETRY OR VIDEOGRAMMETRY
    • G01C21/00Navigation; Navigational instruments not provided for in groups G01C1/00 - G01C19/00
    • G01C21/26Navigation; Navigational instruments not provided for in groups G01C1/00 - G01C19/00 specially adapted for navigation in a road network
    • G01C21/34Route searching; Route guidance
    • G01C21/36Input/output arrangements for on-board computers
    • G01C21/3605Destination input or retrieval
    • G01C21/3617Destination input or retrieval using user history, behaviour, conditions or preferences, e.g. predicted or inferred from previous use or current movement
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning

Abstract

本发明公开了一种数据处理装置、数据处理方法和程序。根据本发明的数据处理装置包括:学习部,其获得概率模型的参数;目的地和中途停留地估计部,其估计与移动目的地对应的目的地节点和与移动中途停留地对应的中途停留地节点;当前位置估计部,其使用通过学习而获得的参数向概率模型输入用户在从当前时间起的预定时间内的移动历史数据,并且估计与用户的当前位置对应的当前位置节点;搜索部,其搜寻从用户的当前位置至目的地的路线;以及计算部,其计算到达搜索的目的地的到达概率和时间。学习部包括已知或者未知确定部、参数更新部、新模型生成部和新模型组合部。

Description

数据处理装置、数据处理方法和程序
技术领域
本发明涉及一种数据处理装置、数据处理方法及其程序,并且具体地涉及一种其中当获得关于未知路线的移动历史数据时差异学习可以被简单地执行的数据处理装置、数据处理方法及其程序。
背景技术
近来,已经研究了一种技术,在所述技术中,使用从可佩戴传感器(用户佩戴的传感器)获得的时间序列数据对用户的状态进行建模和学习,并且使用通过学习而获得的模型来识别用户的当前状态(例如日本待审专利申请公布第2006-134080号、日本待审专利申请公布第2008-204040号和Brian Patrick Clarkson于2002年在MIT的博士论文“Life Patterns:structure from wearable sensors”)。
本申请人在日本专利申请第2009-180780号(下文称为“在先申请1”)中已经提出了一种在概率上预测用户在将来预期时间的活动状态的多个可能性的方法。在在先申请1中提出的方法中,根据时间序列数据学习用户的活动状态作为概率状态转变模型,使用学习的概率状态转变模型来识别当前活动状态,因此可以在概率上预测用户“在预定时间之后”的活动状态。在在先申请1中,就预测用户“在预定时间之后”的活动状态而言,提出其中使用概率状态转变模型来识别用户当前位置的例子,其中学习关于用户移动历史的时间序列数据(移动历史数据)并且预测用户在预定时间之后的目的地(位置)。
进一步,本申请人在从在先申请1进一步发展的日本专利申请第2009-208064号(下文称为“在先申请2”)中已经提出了一种即使在未指定从当前时间起的经过时间(称为“在预定时间之后”)的情况下仍然预测去往多个目的地的到达概率、路线和时间的方法。在在先申请2中提出的方法中,向形成概率状态转变模型的状态节点分配属性“移动状态”或者“静止状态”。进一步,随着从形成概率状态转变模型的状态节点中发现“静止状态”的状态节点(目的地的状态节点),可以自动检测目的地的候选。
发明内容
然而,在使用作为学习数据而新获得的移动历史数据来进行附加学习的情况下,一般进行其中仅学习新获得的移动历史数据的差异学习,以减少学习时间。
然而,差异学习通常改变同一模型的参数。如果新获得的移动历史数据是在用户再次沿着已知路线移动时获得的数据,则希望更新现有概率状态转变模型的参数。然而,如果获得的移动历史数据是在用户沿着迄今尚未出现的未知路线移动时获得的数据,则优选向模型添加新状态节点,并且针对添加的状态节点进行学习。然而,在有关的差异学习中,难以在用户的行为范围内扩展拓扑。
因而希望在获得关于未知路线的移动历史数据时简单地进行差异学习。
根据本发明的实施例,提供了一种数据处理装置,该数据处理装置包括:学习部,其在用户的作为学习数据而获得的移动历史数据被表达为表明用户的活动的概率模型时获得概率模型的参数;目的地和中途停留地估计部,其使用由学习部获得的参数来估计在概率模型的状态节点之中与移动目的地对应的目的地节点和与移动中途停留地对应的中途停留地节点;当前位置估计部,其使用通过学习而获得的参数向概率模型输入用户在从当前时间起的预定时间内的与学习数据不同的移动历史数据,并且估计与用户的当前位置对应的当前位置节点;搜索部,其使用关于估计的目的地节点、中途停留地节点和当前位置节点的信息以及通过学习而获得的概率模型来搜寻从用户的当前位置至目的地的路线;以及计算部,其计算到达搜索的目的地的到达概率和时间。这里,学习部包括:已知或者未知确定部,其在获得概率模型的参数一次之后供应作为新学习数据的移动历史数据的情况下,确定新学习数据是关于已知路线的移动历史数据还是关于未知路线的移动历史数据;参数更新部,其在已知或者未知确定部中确定新学习数据为关于已知路线的移动历史数据的情况下,更新作为已经获得的概率模型的现有模型的参数;新模型生成部,其在已知或者未知确定部中确定新学习数据为关于未知路线的移动历史数据的情况下,获得作为与关于未知路线的移动历史数据对应的新模型的概率模型的参数;以及新模型组合部,其通过组合现有模型的参数与新模型的参数来生成其中现有模型与新模型相互组合的更新模型。进一步,在按照新学习数据更新概率模型的情况下,在目的地和中途停留地估计部、当前位置估计部、搜索部和计算部中执行使用更新之后的概率模型的过程。
根据本发明的实施例,提供了一种数据处理方法,该数据处理方法包括:通过处理用户的移动历史数据的数据处理装置的学习部,在用户的作为学习数据而获得的移动历史数据被表达为表明用户的活动的概率模型时,获得概率模型的参数;通过数据处理装置的目的地和中途停留地估计部,使用获得的参数来估计在概率模型的状态节点之中与移动目的地对应的目的地节点和与移动中途停留地对应的中途停留地节点;通过数据处理装置的当前位置估计部,使用通过学习而获得的参数向概率模型输入用户在从当前时间起的预定时间内的与学习数据不同的移动历史数据,并且估计与用户的当前位置对应的当前位置节点;通过数据处理装置的搜索部,使用关于估计的目的地节点、中途停留地节点和当前位置节点的信息以及通过学习而获得的概率模型来搜寻从用户的当前位置至目的地的路线;以及通过数据处理装置的计算部,计算到达搜索的目的地的到达概率和时间。这里,在学习部中的过程包括:通过学习部的已知或者未知确定部,在获得概率模型的参数一次之后供应作为新学习数据的移动历史数据的情况下,确定新学习数据是关于已知路线的移动历史数据还是关于未知路线的移动历史数据;通过学习部的参数更新部,在已知或者未知确定部中确定新学习数据为关于已知路线的移动历史数据的情况下,更新作为已经获得的概率模型的现有模型的参数;通过学习部的新模型生成部,在已知或者未知确定部中确定新学习数据为关于未知路线的移动历史数据的情况下,获得作为与关于未知路线的移动历史数据对应的新模型的概率模型的参数;以及通过学习部的新模型组合部,通过组合现有模型的参数与新模型的参数来生成其中现有模型与新模型相互组合的更新模型。进一步,在按照新学习数据更新概率模型的情况下,在目的地和中途停留地估计部、当前位置估计部、搜索部和计算部中执行使用更新之后的概率模型的过程。
根据本发明的实施例,提供了一种允许计算机作为以下部分来工作的程序,这些部分包括:学习部,其在用户的作为学习数据而获得的移动历史数据被表达为表明用户的活动的概率模型时获得概率模型的参数;目的地和中途停留地估计部,其使用由学习部获得的参数来估计在概率模型的状态节点之中与移动目的地对应的目的地节点和与移动中途停留地对应的中途停留地节点;当前位置估计部,其使用通过学习而获得的参数向概率模型输入用户在从当前时间起的预定时间内的与学习数据不同的移动历史数据,并且估计与用户的当前位置对应的当前位置节点;搜索部,其使用关于估计的目的地节点、中途停留地节点和当前位置节点的信息以及通过学习而获得的概率模型来搜寻从用户的当前位置至目的地的路线;以及计算部,其计算到达搜索的目的地的到达概率和时间。这里,学习部包括以下各部的功能:已知或者未知确定部,其在获得概率模型的参数一次之后供应作为新学习数据的移动历史数据的情况下,确定新学习数据是关于已知路线的移动历史数据还是关于未知路线的移动历史数据;参数更新部,其在已知或者未知确定部中确定新学习数据为关于已知路线的移动历史数据的情况下,更新作为已经获得的概率模型的现有模型的参数;新模型生成部,其在已知或者未知确定部中确定新学习数据为关于未知路线的移动历史数据的情况下,获得作为与关于未知路线的移动历史数据对应的新模型的概率模型的参数;以及新模型组合部,其通过组合现有模型的参数与新模型的参数来生成其中现有模型与新模型相互组合的更新模型。进一步,在按照新学习数据更新概率模型的情况下,在目的地和中途停留地估计部、当前位置估计部、搜索部和计算部中执行使用更新之后的概率模型的过程。
根据本发明的实施例,在学习部中,在用户的作为学习数据而获得的移动历史数据被表达为表明用户的活动的概率模型时,获得概率模型的参数;在目的地和中途停留地估计部中,使用由学习部获得的参数来估计在概率模型的状态节点之中与移动目的地对应的目的地节点和与移动中途停留地对应的中途停留地节点;在当前位置估计部中,使用通过学习而获得的参数向概率模型输入用户在从当前时间起的预定时间内的与学习数据不同的移动历史数据,并且估计与用户的当前位置对应的当前位置节点;在搜索部中,使用关于估计的目的地节点、中途停留地节点和当前位置节点的信息以及通过学习而获得的概率模型来搜寻从用户的当前位置至目的地的路线;并且在计算部中计算到达搜索的目的地的到达概率和时间。这里,在学习部中,在获得概率模型的参数一次之后供应作为新学习数据的移动历史数据的情况下,在已知或者未知确定部中确定新学习数据是关于已知路线的移动历史数据还是关于未知路线的移动历史数据;在已知或者未知确定部中确定新学习数据为关于已知路线的移动历史数据的情况下,在参数更新部中更新作为已经获得的概率模型的现有模型的参数;在已知或者未知确定部中确定新学习数据为关于未知路线的移动历史数据的情况下,在新模型生成部中获得作为与关于未知路线的移动历史数据对应的新模型的概率模型的参数;并且在新模型组合部中通过组合现有模型的参数与新模型的参数来生成其中现有模型与新模型相互组合的更新模型。进一步,在按照新学习数据更新概率模型的情况下,在目的地和中途停留地估计部、当前位置估计部、搜索部和计算部中执行使用更新之后的概率模型的过程。
根据本发明的实施例,可以在获得关于未知路线的移动历史数据时简单地进行差异学习。
附图说明
图1是图示了根据本发明实施例的预测系统的配置例子的框图;
图2是图示了预测系统的硬件配置例子的框图;
图3是图示了移动历史数据的例子的图;
图4是图示了HMM的例子的图;
图5是图示了从左至右的HMM的例子的图;
图6A和6B是图示了具有稀疏约束的HMM的例子的图;
图7是图示了学习预处理部的具体配置例子的框图;
图8是图示了学习预处理部的过程的图;
图9是图示了如下框图的图,该框图图示了移动属性识别和分配部的具体配置例子;
图10是图示了如下框图的图,该框图图示了移动属性识别部的学习机的配置例子;
图11是图示了在根据类别对行为状态进行分类的情况下的分类例子的图;
图12是图示了行为状态标记部的过程例子的图;
图13是图示了行为状态标记部的过程例子的图;
图14是图示了图10中的行为状态学习部的配置例子的框图;
图15是图示了移动属性识别部的具体配置例子的框图;
图16是图示了移动属性识别部的学习机的另一配置例子的框图;
图17是图示了移动属性识别部的另一配置例子的框图;
图18是图示了学习预处理部的过程的流程图;
图19是图示了图1中的学习主处理部的具体配置例子的框图;
图20是图示了已知或者未知确定部的具体配置例子的框图;
图21是图示了未知状态节点添加部中的未知状态添加模型构建过程的流程图;
图22是图示了未知状态添加模型的初始概率表的图;
图23是图示了未知状态添加模型的转变概率表的图;
图24是图示了未知状态添加模型的中心值表的图;
图25是图示了未知状态添加模型的方差值表的图;
图26是图示了已知或者未知确定部的已知或者未知确定过程的流程图;
图27是图示了已知或者未知确定过程获得的结果例子的图;
图28是图示了已知或者未知确定过程获得的结果例子的图;
图29是图示了新模型生成部的具体配置例子的框图;
图30是图示了通过正态HMM的学习模型与通过新模型学习部执行的学习模型之间的差异的图;
图31是图示了通过正态HMM的学习模型与通过新模型学习部执行的学习模型之间的差异的图;
图32A和32B是图示了使用图形模型的新模型学习部的学习模型的图;
图33是图示了新模型学习部的新模型学习过程的流程图;
图34是图示了参数重新计算部的参数重新计算过程的流程图;
图35是图示了新模型生成部进行的总体新模型生成过程的流程图;
图36是图示了新模型组合部中的拓扑更新模型生成过程的流程图;
图37A和37B是图示了拓扑更新模型的初始概率表的图;
图38是图示了拓扑更新模型的转变概率表的图;
图39是图示了拓扑更新模型的转变概率表的图;
图40是图示了拓扑更新模型的转变概率表的图;
图41是图示了拓扑更新模型的中心值表的图;
图42是图示了拓扑更新模型的方差值表的图;
图43是图示了参数更新部进行的总体参数更新过程的流程图;
图44A和44B是图示了现有技术中的模型的初始概率表的图;
图45是图示了现有技术中的模型的转变概率表的图;
图46是图示了现有技术中的模型的转变概率表的图;
图47是图示了现有技术中的模型的转变概率表的图;
图48是图示了现有技术中的模型中的中心值表的图;
图49是图示了现有技术中的模型中的方差值表的图;
图50是图示了学习主处理部的总体学习主处理过程的流程图;
图51A至51C是图示了目的地和中途停留地检测部的过程的图;
图52是图示了学习块的总体过程的流程图;
图53是图示了树搜索过程的流程图;
图54是进一步图示了树搜索过程的图;
图55A至55D是进一步图示了树搜索过程的图;
图56是图示了树搜索过程中的搜索结果列表例子的图;
图57是图示了代表性的中途停留地选择过程的流程图;
图58是图示了预测块的总体过程的流程图;
图59A和59B是图示了图1中的学习主处理部的学习过程结果例子的图;
图60是图示了图1中的学习主处理部的学习过程结果例子的图;
图61是图示了图1中的学习主处理部的学习过程结果例子的图;
图62是图示了图1中的学习主处理部的学习过程结果例子的图;
图63是图示了图1中的学习主处理部的学习过程结果例子的图;并且
图64是图示了根据本发明实施例的计算机的配置例子的框图。
具体实施方式
[预测系统的配置例子]
根据本发明实施例的数据处理装置包括:学习部,其在用户的作为学习数据而获得的移动历史数据被表达为表明所述用户的活动的概率模型时获得所述概率模型的参数;目的地和中途停留地估计部,其使用由所述学习部获得的所述参数来估计在所述概率模型的状态节点之中与移动目的地对应的目的地节点和与移动中途停留地对应的中途停留地节点;当前位置估计部,其使用通过学习而获得的所述参数向所述概率模型输入所述用户在从当前时间起的预定时间内的与所述学习数据不同的移动历史数据,并且估计与所述用户的当前位置对应的当前位置节点;搜索部,其使用关于估计的目的地节点、中途停留地节点和当前位置节点的信息以及通过学习而获得的所述概率模型来搜寻从所述用户的当前位置至目的地的路线;以及计算部,其计算到达搜索的目的地的到达概率和时间,其中,所述学习部包括:已知或者未知确定部,其在获得所述概率模型的参数一次之后供应作为新学习数据的移动历史数据的情况下,确定所述新学习数据是关于已知路线的移动历史数据还是关于未知路线的移动历史数据;参数更新部,其在所述已知或者未知确定部中确定所述新学习数据为关于已知路线的移动历史数据的情况下,更新作为已经获得的概率模型的现有模型的参数;新模型生成部,其在所述已知或者未知确定部中确定所述新学习数据为关于未知路线的移动历史数据的情况下,获得作为与关于未知路线的移动历史数据对应的新模型的概率模型的参数;以及新模型组合部,其通过组合所述现有模型的参数与所述新模型的参数来生成其中所述现有模型与所述新模型相互组合的更新模型,并且其中,在按照所述新学习数据更新概率模型的情况下,在所述目的地和中途停留地估计部、所述当前位置估计部、所述搜索部和所述计算部中执行使用更新之后的概率模型的过程。
图1是示出了根据本发明实施例的预测系统的配置例子的图。
图1中的预测系统1包括学习块11、用户模型参数存储部12和预测块13。
向学习块11供应在传感器装置(未示出)如全球定位系统(GPS)传感器中在预定时期内获得的表明用户在预定时间的位置(纬度和经度)的时间序列数据。亦即,向学习块11供应关于按照恒定时间间隔(例如15秒)依次获得的位置(纬度和经度)的数据和表明用户在对应时间的三维移动路线的时间序列数据(下文称为移动历史数据)。形成时间序列数据的包括纬度、经度和时间的一个数据集被适当地称为三维数据。
学习块11使用用户的移动历史数据来进行下述学习过程:学习用户的活动模型(表明用户的行为和活动模式的状态模型)作为概率状态转变模型。
作为用于学习的概率状态转变模型,例如可以运用包括隐藏状态的概率模型如遍历的隐藏马尔可夫模型(HMM)。预测系统1运用其中向遍历HMM给予稀疏约束的概率状态转变模型。后文将参照图4至图6描述具有稀疏约束的遍历HMM和遍历HMM的参数等的计算方法。
用户模型参数存储部12存储表明通过学习块11中的学习而获得的用户活动模型的参数。
预测块13从用户模型参数存储部12获得通过学习块11中的学习而获得的用户活动模型的参数。进一步,预测块13参照新获得的用户移动历史数据,根据通过学习而获得的参数,使用用户活动模型来估计用户的当前位置,然后根据当前位置预测移动目的地。进一步,预测块13针对预测的目的地计算到达概率、路线和到达时间(必要的时间)。这里,目的地不限于仅一个,而是可以预测多个目的地。
将具体描述学习块11和预测块13。
学习块11包括历史数据积累部21、学习预处理部22、学习主处理部23、学习后处理部24以及目的地和中途停留地检测部25。
历史数据积累部21积累(存储)从传感器装置供应的用户的移动历史数据作为学习数据。历史数据积累部21在必要时向学习预处理部22供应移动历史数据。
学习预处理部22解决从传感器装置出现的问题。具体而言,学习预处理部22形成移动历史数据,并且通过插值过程等填充暂时数据间隙。另外,学习预处理部22参照形成移动历史数据的各条三维数据给予表明用户逗留(停止)于同一位置的“静止状态”和表明用户移动的“移动状态”中的任一移动属性。在给予移动属性之后,向学习主处理部23以及目的地和中途停留地检测部25供应移动历史数据。
学习主处理部23将用户的移动历史建模为用户活动模型。亦即,学习主处理部23获得当用户的移动历史数据被建模为用户活动模型时的参数。向学习后处理部24和用户模型参数存储部12供应通过学习获得的用户活动模型的参数。
进一步,在用户的移动历史数据被学习作为用户活动模型之后,在供应作为新学习数据的移动历史数据的情况下,学习主处理部23从用户模型参数存储部12获得当前用户活动模型的参数并且更新参数。
具体而言,学习主处理部23首先确定作为新学习数据的移动历史数据是关于已知路线的移动历史数据还是关于未知路线的移动历史数据。然后,在确定新学习数据是已知路线的移动历史数据的情况下,学习主处理部23更新现有用户活动模型(下文简称为“现有模型”)的参数。另一方面,在确定新学习数据是关于未知路线的移动历史数据的情况下,学习主处理部23获得如下用户活动模型的参数,该用户活动模型是与关于未知路线的移动历史数据对应的新模型。然后,学习主处理部23合成现有模型的参数与新模型的参数,从而生成通过组合现有模型与新模型而获得的更新模型。
下文将其中用关于已知路线的移动历史数据更新参数的用户活动模型称为参数更新模型。另一方面,将其中用关于未知路线的移动历史数据更新参数的用户活动模型称为拓扑更新模型,因为根据未知路线的扩张也更新拓扑。进一步,下文也将关于已知路线的移动历史数据和关于未知路线的移动历史数据简称为“已知移动历史数据”和“未知移动历史数据”。
向学习后处理部24和用户模型参数存储部12供应参数更新模型或者拓扑更新模型的参数,并且在后续阶段中使用更新之后的用户活动模型来执行过程。
学习后处理部24使用通过学习主处理部23的学习而获得的用户活动模型,将形成移动历史数据的各条三维数据转换成用户活动模型的状态节点。亦即,学习后处理部24生成与对应于移动历史数据的用户活动模型的状态节点有关的时间序列数据(节点序列数据)。学习后处理部24向目的地和中途停留地检测部25供应转换之后的节点序列数据。
目的地和中途停留地检测部25将从学习预处理部22供应的在给予移动属性之后的移动历史数据与从学习后处理部24供应的节点序列数据进行匹配。亦即,目的地和中途停留地检测部25向形成移动历史数据的各条三维数据分派用户活动模型的状态节点。
进一步,目的地和中途停留地检测部25向在节点序列数据的各个状态节点之中与三维数据对应的状态节点给予目的地或者中途停留地属性,其中移动属性是“静止状态”。因此,向目的地或者中途停留地分派用户在移动历史中的预定位置(与该位置对应的状态节点)。向用户模型参数存储部12供应并且在其中存储与目的地和中途停留地检测部25向状态节点给予的目的地和中途停留地的属性有关的信息。
预测块13包括缓冲部31、预测预处理部32、预测主处理部33和预测后处理部34。根据本发明实施例的数据处理装置中的搜索部和计算部可以通过预测主处理部33来实现。
缓冲部31缓冲(存储)实时获得的移动历史数据用于预测过程。作为用于预测过程的移动历史数据,具有比学习过程期间的移动历史数据的时期更短的时期的数据,例如约100步的移动历史数据,即足够。缓冲部31在预定时期内不变地存储最新的移动历史数据,并且在获得新数据时,缓冲部31删除存储的数据之中的最旧数据。
预测预处理部32以与学习预处理部22类似的方式解决从传感器装置出现的问题。亦即,预测预处理部32形成移动历史数据,并且通过插值过程等填充暂时数据间隙。
预测主处理部33包括当前位置节点估计部41以及目的地和中途停留地预测部42。从用户模型参数存储部12向预测主处理部33供应通过学习块11中的学习而获得的表明用户活动模型的参数。
使用从预测预处理部32供应的移动历史数据和通过学习块11中的学习而获得的用户活动模型,当前位置节点估计部41估计与用户的当前位置对应的状态节点(当前位置节点)。为了估计状态节点,可以运用维特比(Viterbi)最大似然度估计或者软判决维特比估计。
目的地和中途停留地预测部42计算抵达目的地的状态节点(目的地节点)的节点序列及其在树结构中的出现概率,该树结构包括能够从由当前位置节点估计部41估计的当前位置节点转变的多个状态节点。由于抵达目的地的状态节点的节点序列(路线)可以包括中途停留地的节点,所以目的地和中途停留地预测部42同时预测目的地和中途停留地。
预测后处理部34获得抵达相同目的地的多个路线的选择概率(出现概率)之和作为去往目的地的到达概率。进一步,预测后处理部34选择在去往目的地的路线之中有代表性的一个或者多个路线(下文称为“代表路线”),并且计算代表路线的必要时间。进一步,预测后处理部34输出到达预测目的地的代表路线、到达概率和时间作为预测结果。可以输出频率而不是路线的出现概率作为预测结果,并且可以输出到达频率而不是去往目的地的到达概率作为预测结果。
[预测系统的硬件配置例子]
具有上述配置的预测系统1例如可以运用图2中所示的硬件配置。亦即,图2是图示了预测系统1的硬件配置例子的框图。
在图2中,预测系统1包括三个移动终端51-1至51-3和服务器52。移动终端51-1至51-3是功能相同的同类型移动终端51,但是移动终端51-1至51-3为不同用户所拥有。因此,在图2中示出了仅三个移动终端51-1至51-3,但是在现实中存在数目与用户数目对应的移动终端51。
移动终端51可以通过网络如无线通信网络和因特网的通信来进行向/从服务器52发送和接收数据。服务器52接收从移动终端51发送的数据,并且针对接收的数据执行预定的过程。进一步,服务器52通过无线通信等向移动终端51发送数据处理的过程结果。
因而,移动终端51和服务器52至少具有以无线或者有线方式进行通信的通信部。
进一步,各移动终端51可以包括图1中的预测块13,并且服务器52可以包括图1中的学习块11和用户模型参数存储部12。
在这样的配置的情况下,例如在学习过程中,向服务器52发送由移动终端51的传感器装置获得的移动历史数据。服务器52基于接收的用于学习的移动历史数据来学习和存储用户活动模型。进一步,在预测过程中,移动终端51获得通过学习而获得的用户活动模型的参数,根据实时获得的移动历史数据来估计用户的当前位置节点,并且计算目的地节点以及抵达目的地的到达概率、代表路线和必要时间。进一步,移动终端51在显示部(未示出)如液晶显示器上显示过程结果。
可以根据各数据处理装置的处理能力或者通信环境来适当确定在如上文所述的移动终端51与服务器52之间的任务划分。
在学习过程中,一个过程所必需的时间很长,但是不必频繁进行该过程。因而,由于服务器52一般具有比便携移动终端51更高的处理能力,所以可以允许服务器52基于一天积累一次的移动历史数据来进行学习过程(参数更新)。
另一方面,优选的是,与用于显示的时时刻刻地实时更新的移动历史数据一致地迅速进行并显示预测过程,因此优选在移动终端51中进行该过程。如果通信环境富裕,则优选在服务器52中进行预测过程,并且从服务器52仅接收预测结果,以减少偏好于便携式最小尺寸的移动终端51的负担。
进一步,在移动终端51可以作为高速数据处理装置独立进行学习过程和预测过程的情况下,移动终端51可以具有图1中的预测系统1的整体配置。
[输入的移动历史数据的例子]
图3是图示了在预测系统1中获取的移动历史数据的例子的图。在图3中,横轴代表经度,而纵轴代表纬度。
图3中所示的移动历史数据是实验者在约一个半月的时期内积累的移动历史数据。如图3中所示,移动历史数据主要包括关于居住区和四个外出移动位置(比如工作位置)的数据。移动历史数据也包括如下数据,其中位置数据在空中而未捕获卫星信号。
[遍历HMM]
接着将描述预测系统1作为学习模型而运用的遍历HMM。
图4是图示了HMM的例子的图。
HMM是具有状态节点和状态节点间转变的状态转变模型。
图4是图示了三个状态的HMM的例子的图。
在图4(同后续图)中,圆圈代表状态节点,而箭头代表状态节点转变。下文将状态节点简称为节点或者状态。
进一步,在图4中,si(在图4中为i=1、2和3)代表状态,aij代表从状态si向状态sj的状态转变概率。进一步,bj(x)代表其中在向状态sj的状态转变中观测到观测值x的输出概率密度函数,而πi代表其中状态si为初始状态的初始概率。
作为输出概率密度函数bj(x),例如可以使用正态概率分布等。
这里,HMM(连续HMM)由状态转变概率aij、输出概率密度函数bj(x)和初始概率πi定义。状态转变概率aij、输出概率密度函数bj(x)和初始概率πi被称为HMM参数λ={aij,bj(x),πi,其中i=1,2,...M,j=1,2,...M}。这里,M代表HMM状态的数目。
作为一种用于估计HMM参数λ的方法,广泛使用Baum-Welch最大似然估计法。Baum-Welch最大似然估计法是一种基于EM算法(期望最大化方法)的参数估计方法。
根据Baum-Welch最大似然估计法,基于观测的时间序列数据x=x1,x2,...xT来估计HMM参数λ,使得根据出现概率(观测到(出现)时间序列数据的概率)计算的似然度最大化。这里,xt代表在时间t观测的信号(样本值),而T代表时间序列数据的长度(样本数目)。
例如在C.M.Bishop的下文称为“文件A”的“Pattern Recognitionand Machine Learning(II)”第333页(英文原文:“Pattern Recognition andMachine Learning(Information Science and Statistics)”,Christopher M.Bishop,Springer,New York,2006)中公开了Baum-Welch最大似然估计法。
Baum-Welch最大似然估计法是一种基于似然度最大化的参数估计方法,但是不保证最佳性,并且可能根据HMM的结构或者参数λ的初始值向局部解(局部最小值)收敛。
HMM一般使用于声音识别中。在使用于声音识别的HMM中,一般预先确定状态的数目、状态转变的类型等。
图5是图示了在声音识别中使用的HMM的例子的图。
图5中的HMM称为从左至右类型。
在图5中,状态的数目变成3,并且将状态转变约束为如下结构,在该结构中仅允许自转变(从状态si向状态si的状态转变)和从左向右邻近状态的状态转变。
参照约束为如图5中所示的状态转变的HMM,未约束为如图4中所示的状态转变的HMM(亦即其中可以从任意状态si向任意状态sj的状态转变的HMM)称为“遍历HMM”。
遍历HMM是结构具有最高自由度的HMM,但是如果增加状态的数目,则难以估计参数λ。
例如,如果遍历HMM中的状态数目为1000,则状态转变的数目变成1,000,000(=1000×1000)。
因而在这种情况下,例如就参数λ中的状态转变概率aij而言,有必要估计1,000,000项的状态转变概率aij
因此例如可以向针对状态设置的状态转变施加称为稀疏结构的约束(稀疏约束)。
这里,稀疏结构是其中对能够从某一状态进行状态转变的状态加以限制的结构,该结构不是稠密状态转变结构,比如其中有可能从任意状态向另一任意状态进行状态转变的遍历HMM。就这一点而言,假设即使在稀疏结构中也存在向其它状态的至少一个状态转变,并且存在自转变。
图6A和6B图示了向其施加稀疏约束的HMM。
在图6A和6B中,连接两个状态的双向箭头代表从两个状态的第一方向向其第二方向的状态转变和从其另一方向向其第一方向的状态转变。进一步,在图6A和6B中,可以在各状态中进行自转变,而在图中未示出表明自转变的箭头。
在图6A和6B中,16个状态以栅格形状布置于二维空间中。亦即,在图6A和6B中,4个状态布置于横向方向上,而4个状态也布置于纵向方向上。
如果假设在横向方向上彼此相邻的状态之间的距离和在纵向方向上彼此相邻的状态之间的距离都为1,则图6A图示了向其施加稀疏约束的HMM,其中允许向距离等于1或者更小的状态的状态转变,而不允许向其它状态的状态转变。
进一步,图6B图示了向其施加稀疏约束的HMM,其中允许向距离等于
Figure BSA00000521531100151
或者更小的状态的状态转变,而不允许向其它状态的状态转变。
在图1中的例子中,向预测系统1供应移动历史数据x=x1,x2,...xT,并且学习块11使用移动历史数据x=x1,x2,...xT来估计表明用户活动模型的HMM参数λ。
亦即,表明用户移动踪迹的在各时间的位置(纬度和经度)数据被视为与概率变量有关的观测数据,所述概率变量使用预定方差值从地图上的与任一HMM状态si对应的一点的扩展来进行正态分布。学习块11优化地图上的与各状态si对应的一点(中心值μi)及其方差值σi 2和状态转变概率aij
状态si的初始概率πi可以设置成定值。例如,M个状态中的各状态si的初始概率πi设置成1/M。
当前位置节点估计部41将维特比算法应用于通过学习而获得的用户活动模型(HMM),并且计算状态转变的其中观测到移动历史数据x=x1,x2,...xT的似然度变成最大值的进程(状态序列)(路线)(下文称为“最大似然度路线”)。这样一来就识别了与用户的当前位置对应的状态si
这里,维特比算法是一种用于确定在使用各状态si作为起点的状态转变的路线之中的如下路线(最大似然度路线)的算法,其中通过积累其中状态si在时间t向sj转变的状态转变概率aij和其中在状态转变中观测到移动历史数据x=x1,x2,...xT中的在时间t的样本值xt的概率(根据输出概率密度函数bj(x)获得的输出概率)而获得的值(出现概率)在处理之后的时间序列数据x的长度T之上变成最大值。在上述文件A的第347页中公开了维特比算法的细节。
[学习预处理部22的配置例子]
图7是图示了学习块11的学习预处理部22的具体配置例子的框图。
学习预处理部22包括数据连接和划分部71、数据异常删除部72、重新采样处理部73、移动属性识别和分配部74以及静止状态处理部75。
数据连接和划分部71进行移动历史数据的连接和划分过程。从传感器装置以预定单位(比如一天)向数据连接和划分部71供应移动历史数据作为日志文件。因而,可以多日划分和获得在移向某个目的地期间连续的移动历史数据。数据连接和划分部71连接划分的移动历史数据。具体而言,如果一个日志文件中的最新三维(纬度、经度和时间)数据与在该日志文件之后创建的日志文件中的第一个三维数据之间的时间差在预定时间内,则数据连接和划分部71连接文件中的移动历史数据。
进一步,例如由于GPS传感器在隧道中或者地下不能捕获卫星信号,所以移动历史数据的获取间隔可能长。在长时间缺乏移动历史数据的情况下,难以估计用户的位置。因而,在获取时间之前与之后之间的间隔等于或长于获得的移动历史数据中的预定时间间隔(下文称为“间隙阈值时间”)的情况下,数据连接和划分部71划分在间隔之前和之后的移动历史数据。这里,间隙阈值时间例如等于5分钟、10分钟、1小时等。
数据异常删除部72执行删除明显异常的移动历史数据的过程。例如在某一时间的关于位置的数据与先前或者后继位置隔开(跳跃)100m或者更长的情况下,关于位置的数据有误。因此,在某一时间的关于位置的数据与先前和后继位置隔开预定距离或者更长的情况下,数据异常删除部72从移动历史数据中删除三维数据。
重新采样处理部73执行通过线性插值等填充如下数据中的间隙的过程,其中,在所述数据中,获取时间之间的时间间隔短于间隙阈值时间。亦即,在获取时间之间的时间间隔等于或长于间隙阈值时间的情况下,数据连接和划分部71划分移动历史数据,但是保持其中获取时间之间的时间间隔短于间隙阈值时间的数据间隙。因此,重新采样处理部73填充如下数据中的间隙,其中,在所述数据中,获取时间之间的数据间隔短于间隙阈值时间。
移动属性识别和分配部74识别移动属性并且分配移动属性,所述移动属性与以下有关:关于移动历史数据的各条三维数据是否为表明用户逗留(停止)于相同位置的“静止状态”和表明用户移动的“移动状态”中的任一个。因而生成具有移动属性的移动历史数据,其中向移动历史数据的各项三维数据给予移动属性。
基于从移动属性识别和分配部74供应的具有移动属性的移动历史数据,静止状态处理部75处理其中移动属性为“静止状态”的三维数据。具体而言,在“静止状态”这样的移动属性持续预定时间或者更长(下文称为“静止阈值时间”)的情况下,静止状态处理部75划分在静止阈值时间之前和之后的移动历史数据。进一步,在“静止状态”这样的移动属性持续时间短于静止阈值时间的情况下,静止状态处理部75保持多条三维数据的位置数据,该三维数据的“静止状态”持续的预定时间在静止阈值时间内(修改为相同位置数据)。因此可以防止向关于同一目的地或者中途停留地的移动历史数据分派多个“静止状态”节点。换而言之,可以防止将同一目的地或者中途停留地表达为多个节点。
[学习预处理部22的过程]
图8是在概念上图示了学习预处理部22的学习预过程的示图。
参照在图8的上部示出的在重新采样处理部73填充数据之后的移动历史数据81,移动属性识别和分配部74识别“静止状态”或者“移动状态”这样的移动属性并且分配移动属性。结果,生成在图8的中间示出的具有移动属性的移动历史数据82。
在图8的中间示出的具有移动属性的移动历史数据82中,“m1”和“m2”代表“移动状态”这样的移动属性,而“u”则代表“静止状态”这样的移动属性。这里,“m1”和“m2”代表同一“移动状态”,但是交通手段(车辆、公共汽车、火车、徒步等)不同。
进一步,参照在图8的中间示出的具有移动属性的移动历史数据82,静止状态处理部75执行划分和保持移动历史数据的过程,因此在图8的下部生成具有移动属性的移动历史数据83(83A和83B)。
在具有移动属性的移动历史数据83中,在具有移动属性的移动历史数据82中第二次生成的“移动状态”位置(三维数据)处执行划分过程,并且将具有移动属性的移动历史数据83划分成具有两个移动属性的移动历史数据83A和83B。
在划分过程中,起初将移动历史数据划分成在具有移动属性的移动历史数据82中第二次生成的“移动状态”和其后的多条三维数据,从而生成具有移动属性的两个移动历史数据83A和83B。然后,在划分之后的具有移动属性的移动历史数据83A和83B之中,关于多个“移动状态”(其等于或长于在时间上更早的具有移动属性的移动历史数据83A的最新静止阈值时间)的三维数据被分组成关于一个“静止状态”的三维数据。因此删除不必要的移动历史数据,因此可以减少学习时间。
在图8所示的例子中,关于在具有移动属性的移动历史数据82中第三次生成的多个“移动状态”的三维数据是其中“移动状态”持续静止阈值时间或者更长的数据,并且针对其进行相同划分过程。然而由于在划分之后的三维数据不存在,所以将关于持续静止阈值时间或者更长的多个“移动状态”的三维数据分组成关于一个“静止状态”的三维数据。
另一方面,在具有移动属性的移动历史数据83A中的关于第一“移动状态”的移动历史数据中进行保持过程。在保持过程之后,关于三个“移动状态”的三维数据{(tk-1,xk-1,yk-1),(tk,xk,yk),(tk+1,xk+1,yk+1)}变成{(tk-1,xk-1,yk-1),(tk,xk-1,yk-1),(tk+1,xk-1,yk-1)}。亦即,将位置数据修改成关于“移动状态”的初始位置数据。在保持过程中,可以不将位置数据改变成“移动状态”的初始位置数据,而是可以改变成位置的平均值、在“移动状态”时期的中间时间的位置数据等。
[移动属性识别和分配部74的配置例子]
图9是图示了移动属性识别和分配部74的具体配置例子的框图。
移动属性识别和分配部74包括移动速度计算部91、移动属性识别部92和移动属性分配部93。
移动速度计算部91根据供应的移动历史数据计算移动速度。
具体而言,当按照预定时间间隔在第k步(第k个)获得的三维数据被表达为时间tk、经度yk和纬度xk时,可以按照以下公式(1)计算在x方向上的第k步移动速度vxk和在y方向上的第k步移动速度vyk
vx k = x k - x k - 1 t k - t k - 1 vy k = y k - y k - 1 t k - t k - 1 . . . ( 1 )
在公式(1)中,原样使用关于纬度和经度的数据,但是可以按照需要适当进行将纬度和经度转换成距离或者将速度转换成以每小时或者每分钟来表达的过程。
进一步,移动速度计算部91可以根据按照公式(1)获得的移动速度vxk和vyk来计算按照以下公式(2)表达的第k个移动速度vk和行进方向的改变θk,并且可以利用它们。
v k = vx k 2 + vy k 2 θ k = sin - 1 ( vx k · vy k - 1 - vx k - 1 · vy k v k · v k - 1 ) . . . ( 2 )
如果使用按照公式(2)表达的移动速度vk和行进方向的改变θk,则与公式(1)中的移动速度vxk和vyk相比,可以鉴于以下方面有希望地提取特性。
1.由于移动速度vxk和vyk的数据分布参照纬度和经度轴偏移,所以如果甚至就相同交通手段(火车、徒步等)而言仍然角度不同,则可能难以识别它。然而在移动速度vk的情况下减少了这样的可能性。
2.如果仅按照移动速度的绝对值(|v|)进行学习,则由于设备中的噪声生成的绝对值(|v|)而难以区别徒步与逗留静止。因此可以在考虑行进方向的改变时减少噪声的影响。
3.由于行进方向的改变在移动期间小、但是在逗留静止期间未确定行进方向,所以如果使用行进方向的改变,则易于识别移动和逗留静止。
根据这些原因,移动速度计算部91计算公式(2)所示的移动速度vk和行进方向的改变θk作为关于移动速度的数据,并且将其供应到移动属性识别部92。
进一步,为了在计算移动速度vk和行进方向的改变θk之前去除噪声分量,移动速度计算部91可以使用移动平均值来进行滤波过程(预处理)。
传感器装置可以包括能够输出移动速度的传感器装置。如果采用这样的传感器装置,则可以省略移动速度计算部91,并且可以原样使用传感器装置输出的移动速度。下文将行进方向的改变θk简称为“行进方向θk”。
移动属性识别部92基于供应的移动速度来识别移动属性,并且向移动属性分配部93供应识别结果。具体而言,移动属性识别部92学习用户的行为状态(移动状态)作为概率状态转变模型(HMM),并且使用通过学习而获得的概率状态转变模型来识别移动属性。作为移动属性,有必要至少存在“静止状态”和“移动状态”。在这一实施例中,如后文参照图11等所述,移动属性识别部92输出通过按照多个交通手段如徒步、自行车或者车辆对“移动状态”进行分类而获得的移动属性。
移动属性分配部93向来自重新采样处理部73的形成移动历史数据的各条三维数据分配由移动属性识别部92识别的移动属性,生成具有移动属性的移动历史数据,然后将其输出至静止状态处理部75。
接着将参照图10至图17描述一种获得在移动属性识别部92中使用的表明用户行为状态的概率状态转变模型的参数的方法。
[移动属性识别部92中的学习机的第一配置例子]
图10是图示了学习机100A的配置例子的图,该学习机按照类别HMM学习在移动属性识别部92中使用的概率状态转变模型的参数。
在类别HMM中,用于学习的教导数据是预先属于任一类别(分类)的数据,并且根据类别学习HMM参数。
学习机100A包括移动速度数据存储部101、行为状态标记部102和行为状态学习部103。
移动速度数据存储部101存储关于移动速度的时间序列数据作为学习数据。
行为状态标记部102向以时间序列方式从移动速度数据存储部101依次供应的关于移动速度的数据分配用户的行为状态作为标记(类别)。行为状态标记部102向行为状态学习部103供应其中完成行为状态与移动速度数据匹配这一标记的移动速度数据。例如可以向行为状态学习部103供应如下数据,在该数据中,向第k个移动速度vk和行进方向θk分配表明行为状态的标记M。
行为状态学习部103根据类别对从行为状态标记部102供应的其中完成标记的移动速度数据进行分类,并且以类别为单位学习用户行为模型(HMM)的参数。向移动属性识别部92供应作为学习的结果而获得的用于各类别的参数。
[行为状态的分类例子]
图11是图示了在根据类别对行为状态进行分类的情况下的分类例子的图。
如图11中所示,首先可以将用户的行为状态分类成静止状态和移动状态。在这一实施例中,由于有必要如上文所述至少存在静止状态和移动状态作为由移动属性识别部92识别的用户行为状态,所以有必要将行为状态分类成上述两个状态。
进一步,可以根据交通手段将移动状态分类成火车、车辆(包括公共汽车等)、自行车和徒步。可以将火车分类成特别快车、快车、慢车等。可以将车辆分类成快行线、公共道路等。进一步,可以将徒步分类成跑步、普通步、漫步等。
在这一实施例中,可以如图11中的斜线所示将用户的行为状态分类成“静止”、“火车(快车)”、“火车(慢车)”、“车辆(快行线)”、“车辆(公共道路)”、“自行车”和“步行”。进一步,省略“火车(特别快车)”,因为很难获得学习数据。
类别的分类方法不限于图11中所示的例子。进一步,根据交通手段的移动速度改变未因用户而明显不同,因此作为学习数据的关于移动速度的时间序列数据不必限于作为识别目标的特定用户。
[行为状态标记部102的处理例子]
接着将参照图12和图13描述行为状态标记部102的处理例子。
图12是图示了向行为状态标记部102供应的关于移动速度的时间序列数据的例子的图。
在图12中,向行为状态标记部102供应的移动速度数据(v,θ)被示出为(t,v)和(t,θ)的图案。在图12中,方块绘图(■)代表移动速度v,而圆圈绘图(●)代表行进方向θ。进一步,横轴代表时间t,右纵轴代表行进方向θ,而左纵轴代表移动速度v。
添加字符(比如在图12中的时间轴下部示出的“火车(慢车)”、“徒步”和“静止”)进行描述。图12中的时间序列数据的初始部分是在用户乘坐火车(慢车)移动的情况下的移动速度数据,其后继部分是在用户步行(“徒步”)移动的情况下的移动速度数据,而其最终部分是在用户处于“静止”状态的情况下的移动速度数据。
在用户乘坐火车(慢车)移动的情况下,由于火车反复地停止于火车站、在离开时加速并且通过再次减速来停止于火车站,所以移动速度v的绘图重复并且上下波动。移动速度即使在火车停止的情况下仍未变成0的原因在于使用移动平均值来进行滤波过程。
进一步,在用户“步行(徒步)”移动的情况下和在用户处于“静止”状态的情况下,难以相互区别这些状态,但是通过使用移动平均值的滤波过程则有移动速度v的明显差异。进一步,在“静止”状态中,行进方向θ瞬间并明显改变,因此区别于“徒步”变得容易。以这一方式,可以理解的是,通过使用移动平均值的滤波过程并且按照移动速度v和行进方向θ来表达用户的移动,“徒步”被容易地从“静止”状态区别开来。
在“火车(慢车)”与“徒步”之间的部分是其中行为切换点对于滤波过程而言不清楚的模糊部分。
图13是图示了其中向图12中所示的时间序列数据进行标记的例子的图。
例如行为状态标记部102在显示器上显示图12中所示的移动速度数据。进一步,用户使用鼠标等进行如下操作:用矩形区域包围显示器上显示的移动速度数据中的待标记部分。进一步,用户通过键盘等输入将要向指定的数据分配的标记。行为状态标记部102向用户指定的包括在矩形区域中的移动速度数据分配输入的标记,从而进行标记。
图13图示了如下例子,在该例子中,在矩形区域中表明与“徒步”对应的部分中的移动速度数据。这时,可以在表明的区域中不包括其中行为切换点不清楚的部分用于滤波过程。根据在时间序列数据明显出现行为差异时的长度来确定时间序列数据的长度。例如长度可以约为20步(15秒×20步=300秒)。
[行为状态学习部103的配置例子]
图14是图示了图10中的行为状态学习部103的配置例子的框图。
行为状态学习部103包括分类部121和HMM学习部1221至1227
分类部121参考从行为状态标记部102供应的其中完成标记的移动速度数据的标记,并且将其供应到HMM学习部1221至1227中的与标记对应的任一HMM学习部。亦即,在行为状态学习部103中,根据标记(类别)预备HMM学习部122,并且根据标记对从行为状态标记部102供应的其中完成标记的移动速度数据进行分类,并且供应该移动速度数据。
各HMM学习部1221至1227使用供应的完成标记的移动速度数据对学习模型(HMM)进行学习。进一步,各HMM学习部1221至1227向图9中的移动属性识别部92供应通过学习而获得的HMM参数λ。
HMM学习部1221在标记表明“静止”状态的情况下对学习模型(HMM)进行学习。HMM学习部1222在标记表明“徒步”状态的情况下对学习模型(HMM)进行学习。HMM学习部1223在标记表明“自行车”的情况下对学习模型(HMM)进行学习。HMM学习部1224在标记表明“火车(慢车)”的情况下对学习模型(HMM)进行学习。HMM学习部1225在标记表明“车辆(公共道路)”的情况下对学习模型(HMM)进行学习。HMM学习部1226在标记表明“火车(快车)”的情况下对学习模型(HMM)进行学习。HMM学习部1227在标记表明“车辆(快行线)”的情况下对学习模型(HMM)进行学习。
[移动属性识别部92的第一配置例子]
图15是图示了移动属性识别部92A的配置例子的框图,该移动属性识别部92A是在使用由学习机100A学习的参数的情况下的移动属性识别部92。
移动属性识别部92A包括似然度计算部1411至1417和似然度比较部142。
使用通过HMM学习部1221的学习而获得的参数,似然度计算部1411针对从移动速度计算部91(图9)供应的关于移动速度的时间序列数据计算似然度。亦即,似然度计算部1411计算其中行为状态为“静止”状态的似然度。
使用通过HMM学习部1222的学习而获得的参数,似然度计算部1412针对从移动速度计算部91供应的关于移动速度的时间序列数据计算似然度。亦即,似然度计算部1412计算其中行为状态为“徒步”状态的似然度。
使用通过HMM学习部1223的学习而获得的参数,似然度计算部1413针对从移动速度计算部91供应的关于移动速度的时间序列数据计算似然度。亦即,似然度计算部1413计算其中行为状态为“自行车”的似然度。
使用通过HMM学习部1224的学习而获得的参数,似然度计算部1414针对从移动速度计算部91供应的关于移动速度的时间序列数据计算似然度。亦即,似然度计算部1414计算其中行为状态为“火车(慢车)”的似然度。
使用通过HMM学习部1225的学习而获得的参数,似然度计算部1415针对从移动速度计算部91供应的关于移动速度的时间序列数据计算似然度。亦即,似然度计算部1412计算其中行为状态为“车辆(公共道路)”的似然度。
使用通过HMM学习部1226的学习而获得的参数,似然度计算部1416针对从移动速度计算部91供应的关于移动速度的时间序列数据计算似然度。亦即,似然度计算部1416计算其中行为状态为“火车(快车)”的似然度。
使用通过HMM学习部1227的学习而获得的参数,似然度计算部1417针对从移动速度计算部91供应的关于移动速度的时间序列数据计算似然度。亦即,似然度计算部1417计算其中行为状态为“车辆(快行线)”的似然度。
似然度比较部142比较从各个似然度计算部1411至1417供应的似然度,选择似然度最高的行为状态,并且将其输出作为移动属性。
[移动属性识别部92中的学习机的第二配置例子]
图16是图示了学习机100B的配置例子的图,该学习机100B通过多流HMM学习在移动属性识别部92中使用的用户行为模型的参数。
学习机100B包括移动速度数据存储部101、行为状态标记部161和行为状态学习部162。
行为状态标记部161向以时间序列方式从移动速度数据存储部101依次供应的移动速度数据分配用户的行为状态作为标记(行为模式)。行为状态标记部161向行为状态学习部162供应关于移动速度的时间序列数据(v,θ)和关于与它关联的行为模式M的时间序列数据。
行为状态学习部162通过多流HMM学习用户的行为状态。
这里,多流HMM是如下HMM,在该HMM中,从具有与正态HMM相同的转变概率的状态节点中,根据多个不同的概率规则输出数据。在多流HMM中,为各条时间序列数据预备参数λ之中的输出概率密度函数bj(x)。在多流HMM中,可以在关联不同类型的时间序列数据(流)之时进行学习。
向行为状态学习部162供应关于移动速度v(连续量)和行进方向θ的时间序列数据以及关于行为模式M(离散量)的时间序列。行为状态学习部162学习从各状态节点输出的移动速度的分布参数和行为模式的概率。根据通过学习而获得的多流HMM,例如根据关于移动速度的时间序列数据获得当前状态节点。进一步,可以根据获得的状态节点识别行为模式。
在使用类别HMM的第一配置例子中,有必要针对每个类别预备七个HMM,但是一个HMM在多流HMM中就足够了。这里有必要在第一配置例子中预备与在七个类别中使用的状态节点的总数一样多的状态节点。
[移动属性识别部92的第二配置例子]
图17是图示了移动属性识别部92B的配置例子的框图,该移动属性识别部92B是在使用由学习机100B学习的参数的情况下的移动属性识别部92。
移动属性识别部92B包括状态节点识别部181和行为模式识别部182。
使用由学习机100B学习的多流HMM的参数,状态节点识别部181根据从移动速度计算部91供应的关于移动速度的时间序列数据来识别多流HMM的状态节点。状态节点识别部181向行为模式识别部182供应识别的当前状态节点的节点编号。
行为模式识别部182输出在状态节点识别部181中识别的状态节点中的概率最高的行为模式作为移动属性。
[学习预处理部22的过程]
图18是图示了通过学习预处理部22进行的学习预处理过程的流程图。
在学习预处理过程中,首先在步骤S1中,数据连接和划分部71进行连接和划分移动历史数据的过程。
在步骤S2中,数据异常删除部72进行删除明显异常的移动历史数据的过程。
在步骤S3中,重新采样处理部73进行使用插值等来填充如下数据中的间隙的过程,其中,在所述数据中,获取时间之间的时间间隔短于静止阈值时间。
在步骤S4中,移动属性识别和分配部74参照关于移动历史的各条三维数据来识别“静止状态”或者“移动状态”这样的移动属性,并且分配移动属性。
在步骤S5中,基于从移动属性识别和分配部74供应的具有属性属性的移动历史数据,静止状态处理部75处理其中移动属性为“静止状态”的三维数据。进一步,静止状态处理部75向学习主处理部23输出处理过程之后的具有移动属性的移动历史数据,然后终止过程。
如上文所述,在学习预处理部22中,按照需要划分移动历史数据,然后分配移动属性,因此向学习主处理部23供应具有移动属性的移动历史数据。
[学习主处理部23的具体配置例子]
图19是图示了学习块11的学习主处理部23的具体配置例子的框图。
学习主处理部23包括已知或者未知确定部201、新模型生成部202、新模型组合部203、参数更新部204和更新模型组织部205。
向已知或者未知确定部201供应从学习预处理部22(图1)供应的移动历史数据。进一步,在通过学习主处理部23已经进行学习至少一次的情况下,从用户模型参数存储部12(图1)获得通过先前学习而获得的用户活动模型的参数作为现有模型的参数。向已知或者未知确定部201、新模型组合部203和参数更新部204供应现有模型的参数。
已知或者未知确定部201确定从学习预处理部22供应的移动历史数据是否为关于已知路线的移动历史数据。在第二次以及随后的学习中,供应的移动历史数据的一部分可以是关于未知路线的移动历史数据,而其余部分则可以是关于已知路线的移动历史数据。参照被确定为已知移动历史数据的移动历史数据,已知或者未知确定部201估计关于移动历史数据的各项三维数据对应于现有模型的任何状态节点。进一步,已知或者未知确定部201向参数更新部204供应已知移动历史数据和与之对应的节点序列数据。
另一方面,在确定移动历史数据为关于未知路线的移动历史数据的情况下,已知或者未知确定部201向新模型生成部202供应关于未知路线的移动历史数据。进一步,在关于未知路线的移动历史数据与关于已知路线的移动历史数据连接的情况下,已知或者未知确定部201向新模型生成部202供应现有模型的与先前和后继如下已知移动历史数据对应的状态节点,该已知移动历史数据变成关于未知路线的移动历史数据的连接目标。进一步,在现有模型的在未知移动历史数据之后的状态节点不存在的情况下,例如在用户从已知路线经过未知路线到达未知目的地并且返回的情况下,仅向新模型生成部202供应先前现有模型的状态节点。
在第一次学习中,向新模型生成部202供应从学习预处理部22供应的所有移动历史数据作为未知移动历史数据。进一步,在第一次学习中,由于现有模型的先前和后继状态节点不存在,所以不进行向新模型生成部202的供应。
新模型生成部202使用从已知或者未知确定部201供应的未知移动历史数据来学习用户活动模型。亦即,新模型生成部202获得在使用概率状态转变模型对未知移动历史数据进行建模时的参数,并且将其供应到新模型组合部203。这里,学习的用户活动模型变成与通过先前学习而获得的现有模型不同的新模型。在第一次和第二次以及随后的学习中,作为学习目标的未知移动历史数据的数据量只是互不相同,因此可以通过相同的学习来计算用户活动模型的参数。
新模型生成部202向新模型组合部203供应通过学习而获得的新模型的参数。进一步,在从已知或者未知确定部201供应现有模型的先前和后继状态节点的情况下,新模型生成部202向新模型组合部203供应现有模型的先前和后继状态节点。
新模型组合部203在第二次和随后学习中基于未知移动历史数据来更新通过先前学习而获得的现有模型。亦即,新模型组合部203基于未知移动历史数据的现有模型的先前和后继状态节点来组合现有模型与来自新模型生成部202的新模型,并且生成更新之后的用户活动模型。由新模型组合部203更新的用户活动模型是根据未知移动历史数据向其添加状态节点的拓扑更新模型。
在新模型组合部203中,在向学习主处理部23供应的移动历史数据中未包括关于已知路线的移动历史数据的情况下,与来自新模型生成部202的新模型组合的现有模型变成从用户模型参数存储部12(图1)获得的现有模型。另一方面,在向学习主处理部23供应的移动历史数据中部分地包括关于已知路线的移动历史数据的情况下,与新模型组合的现有模型变成由参数更新部204更新的现有模型。
基于已知移动历史数据和与已知移动历史数据对应的节点序列数据,参数更新部204更新通过先前学习而获得的现有模型。向新模型组合部203和更新模型组织部205输出更新的现有模型的参数。在通过参数更新部204进行的更新中,没有如上文所述添加状态节点。
更新模型组织部205删除其中不存在从其它状态节点的转变的状态节点,并且从新模型组合部203更新的拓扑更新模型或者参数更新部204更新的参数更新模型之中仅使用自转变来组织更新模型。向学习后处理部24和用户模型参数存储部12供应组织之后的更新模型的参数,作为通过学习(更新学习)而获得的用户活动模型的参数。
接着将描述已知或者未知确定部201的细节。
[已知或者未知确定部201的具体配置例子]
图20是图示了已知或者未知确定部201的具体配置例子的框图。
在使用学习主处理部23来进行学习过程至少一次的情况下,从用户模型参数存储部12(图1)向现有模型构建部221供应现有模型的参数。现有模型构建部221基于供应的现有模型的参数来构建现有模型,并且将其供应到未知状态节点添加部222。
在甚至一次都未进行学习过程的状态中,向现有模型构建部221预先设置现有模型的初始参数。在现有模型的初始参数中,节点数目为1,一个状态节点的转变概率仅为自转变,中心值为在其中可以获得三维数据(时间、纬度和经度)的范围以外的值,方差值为最小方差值,而节点频率设置成1。由于进行至少一次学习过程并且从用户模型参数存储部12(图1)供应现有模型的参数,所以改写和删除现有模型的初始参数。
未知状态节点添加部222向现有模型构建部221构建的现有模型添加取用未知移动历史数据的一个状态节点(下文称为“未知状态节点”)。因此构建并且向状态节点估计部223供应其中向现有模型添加一个状态节点的学习模型(下文称为“未知状态添加模型”)。
使用从未知状态节点添加部222供应的未知状态添加模型,按照维特比算法,状态节点估计部223估计未知状态添加模型的与供应的移动历史数据的各项三维数据对应的状态节点。由于向未知状态添加模型添加取用未知移动历史数据的一个节点,所以即使输入的移动历史数据为未知移动历史数据,维特比估计也被执行而没有失败。对照而言,在未添加取用移动历史数据的一个节点的情况下,参照未知移动历史数据未发现对应状态节点,因此维特比估计失败。
样本似然度计算部224计算观测释然度的期望值作为用于已知或者未知确定的指标。获得观测似然度在时间t的期望值为L(t)。在移动历史数据是关于已知路线的数据的情况下,观测似然度的期望值L(t)变大,而在移动历史数据是关于未知路线的数据的情况下,观测似然度的期望值L(t)变小。
针对与观测似然度的期望值L(t)有关的时间序列数据(观测似然度序列数据),使用已知或者未知模型存储部225中存储的两个已知或者未知状态模型,已知或者未知确定部226进行维特比确定,从而进行已知或者未知确定。
已知或者未知后处理部227将由状态节点估计部223估计为未知的状态节点中的由已知或者未知确定部226确定为已知的状态节点修改成未知状态。亦即,在未知确定中,状态节点估计部223中的估计结果具有优先级。
进一步,已知或者未知后处理部227参照在修改之后的确定结果向新模型生成部202或者参数更新部204输出从学习预处理部22(图1)供应的移动历史数据。亦即,已知或者未知后处理部227向参数更新部204(图19)供应其中确定结果为已知的移动历史数据和与该移动历史数据对应的节点序列数据。另一方面,已知或者未知后处理部227向新模型生成部202供应其中确定结果为未知的移动历史数据。在未知移动历史数据与已知移动历史数据连接的情况下,已知或者未知后处理部227向新模型生成部202供应现有模型的与先前和后继如下已知移动历史数据对应的状态节点,该已知移动历史数据变成未知移动历史数据的连接目标。
[未知状态添加模型的配置过程]
将参照图21中的流程图描述通过未知状态节点添加部222进行的未知状态添加模型的构建过程。
首先在步骤S21中,未知状态节点添加部222生成未知状态添加模型的初始概率表,该概率表存储未知状态添加模型的各状态节点的初始概率。
如图22中所示,在初始概率表中,各状态节点的初始概率例如在(M+1)行和一列的表中设置成概率相等的1/(M+1),其中向现有模型的M个状态节点添加取用未知移动历史数据的一个状态节点。
在步骤S22中,未知状态节点添加部222生成未知状态添加模型的转变概率表,其中存储未知状态添加模型的各状态节点的转变概率。
如图23中所示,状态转变表包括(M+1)行和(M+1)列的表。在转变概率表中,(1-eps)乘以第一行和第一列至第M行和第M列的现有模型的各个状态之间的状态转变概率aij。进一步,转变概率表的除了最低的第(M+1)行之外的第(M+1)列的各表元设置成“eps”,并且除了最低的第(M+1)列之外的第(M+1)行的各表元设置成eps。这里“eps”是充分小于1的预定值(例如约为1.0E-8),并且低于现有模型的状态节点之间的任何转变概率。在未知状态添加模型中,从现有模型的各状态节点向未知状态节点的转变概率设置成eps,并且从未知状态节点向现有模型的各状态节点的转变概率设置成eps。进一步,第(M+1)行和第(M+1)列的表元代表未知状态节点的自转变(1-M×eps)。在图23中的未知状态添加模型中,各个行中之和变成1。
在步骤S23中,未知状态节点添加部222生成未知状态添加模型的中心值表,其中存储未知状态添加模型的各状态节点的观测概率的中心值μsi(d)。
图24是图示了在步骤S23中生成的未知状态添加模型的中心值表的图。未知状态添加模型的中心值表的列数对应于移动历史数据的维数D,而其行数对应于状态节点的数目。因而在这一实施例中,未知状态添加模型的中心值表包括(M+1)行和三列。进一步,通过向现有模型的M行和D列的中心值表添加具有未知状态节点的中心值μsM+1(1)=E1、μsM+1(2)=E2和μsM+1(3)=E3的一行作为第(M+1)行来获得未知状态添加模型的中心值表。
这里,任意值可以分别设置成E1、E2和E3。例如E1可以设置成“12”(获得的时间(0至24)的中心值),而E2和E3可以设置成“0”(获得的纬度和经度的中心值(-180至180)。进一步,例如各E1、E2和E3可以设置成现有模型的M个中心值μs1(d)至μsM(d)的平均值。
在步骤S24中,未知状态节点添加部222生成未知状态添加模型的方差值表,其中存储未知状态添加模型的各状态节点的观测概率的方差值μsi(d)’2
图25是图示了在步骤S24中生成的未知状态添加模型的方差值表的图。未知状态添加模型的方差值表的列数对应于移动历史数据的维数D,而其行数对应于状态节点的数目。因而在这一实施例中,未知状态添加模型的方差值表包括(M+1)行和三列。进一步,通过向现有模型的M行和D列的方差值表添加具有未知状态节点方差值σsM+1(1)2=V1、σsM+1(2)2=V2和σsM+1(3)2=V3的一行作为第(M+1)行来获得未知状态添加模型的方差值表。
这里,V1、V2和V3可以分别设置成任意值,但是优选使用大的值。例如,V1设置成比“12”的平方更大的值,以便覆盖从0至24的所得时间范围。进一步,V2和V3设置成比180的平方更大的值,以便覆盖从-180至180的所得纬度和经度范围。
通过上述过程,设置未知状态添加模型的各个参数,并且构建未知状态添加模型。
[样本似然度计算部224的观测似然度计算]
接着将描述样本似然度计算部224进行的观测似然度计算。
样本似然度计算部224计算观测似然度的期望值L(t)作为用于已知或者未知确定的指标。可以按照以下公式(3)计算观测似然度的期望值L(t)。
L ( t ) = Σ Si = 1 M + 1 N ( x t | μ si , σ si 2 ) · δ ( si , t ) . . . ( 3 )
这里,N(xtsi,σsi 2)代表其中从状态节点si观测到观测数据xt的观测似然度。观测数据基于(μsi,σsi 2)的正态分布。进一步,δ(si,t)是其中从状态节点si输出在时间t的观测数据xt的概率。使用维特比算法来计算概率δ(si,t)。具体而言,根据以下过程1)和2)来计算概率δ(si,t)。1)从紧接在状态节点si之前的状态节点si-1选择其中维特比估计概率与观测概率N(xtsi,σsi 2)的乘积最大的状态节点。2)正规化当前状态节点si的维特比估计概率,以与所选紧接先前状态节点si-1的维特比估计概率的观测似然度成比例。这里,1)意味着在考虑模型转变约束之时使用维特比算法在最大似然度方面估计迄今为止的移动历史数据,而2)意味着由于正规化在最大似然度中幸存的似然度,计算用户当前存在于特定状态节点中的概率。
如果未知状态添加模型可以充分描述观测数据,则按照以下公式(3)计算的观测似然度的期望值L(t)变大。另一方面,在未知状态添加模型未充分描述观测数据的情况下,以及在使用未知状态节点描述观测数据的情况下,观测似然度的期望值L(t)变小。因而可以使用观测似然度的期望值L(t)的大小来进行已知或者未知确定。下文将观测似然度的期望值L(t)简称为“观测似然度L(t)”。
[已知或者未知确定部226的已知或者未知确定过程]
接着将参照图26中的流程图描述使用在样本似然度计算部224中计算的观测似然度L(t)来进行已知或者未知确定的已知或者未知确定部226的已知或者未知确定过程。
首先在步骤S31中,已知或者未知确定部226从样本似然度计算部224获得与节点序列数据对应的关于观测似然度L(t)的时间序列数据。进一步,已知或者未知确定部226将关于观测似然度L(t)的各时间序列数据项转换成对数似然度logL(t)。亦即,已知或者未知确定部226计算在各时间t的观测似然度L(t)的对数。
在步骤S32中,已知或者未知确定部226进行获得其中对数似然度logL(t)被饱和的饱和对数似然度的过程。具体而言,已知或者未知确定部226向双曲正切函数输入通过将对数似然度logL(t)减去预定偏移(阈值)并且将它除以预定值而获得的结果,从而使对数似然度logL(t)饱和。通过步骤S31和S32中的过程,将观测似然度L(t)转换成范围从-1至1的参数。
在步骤S33中,已知或者未知确定部226使用包括两个已知或者未知状态的HMM来进行维特比确定,从而针对饱和的对数似然度进行已知或者未知确定。
将包括已知状态和未知状态这两个状态的HMM表达为以下公式(4)。
π = 1 2 1 1 , A = 1 - ϵ ϵ ϵ 1 - ϵ , μ = 1 - 1 , σ 2 = 1 1
···(4)
亦即,已知状态和未知状态的初始概率π为相同概率(0.5)。进一步,在考虑用户移动历史的情况下,难以频繁切换已知状态和未知状态。进一步,在用户沿着已知路线移动的情况下,以及在用户沿着未知路线移动的情况下,可以认为用户在切换之后在某种程度上继续沿着路线移动。因而使用比1小得多的预定值作为ε来设置转变概率A,使得自转变概率在已知状态和未知状态中的各状态中变高。观测概率分布在已知状态中的1与未知状态中的-1之间,并且将方差值设置成1。
图27和图28图示了参照关于两个一定观测似然度L(t)的时间序列数据,通过进行图26中的已知或者未知确定过程而获得的结果。
在图27和图28中,上曲线图图示了通过将关于观测似然度L(t)的时间序列数据转换成对数似然度logL(t)而获得的结果,中间曲线图图示了其中对数似然度logL(t)被饱和的饱和对数似然度,而下曲线图图示了已知或者未知确定结果。根据已知或者未知确定结果,“-1”代表未知状态,而“1”代表已知状态。
参照图27和图28,在简单比较对数似然度logL(t)与预定阈值的情况下,可以频繁切换已知状态和未知状态。然而如上文所述,由于以某种意图进行用户移动行为,所以难以频繁切换已知状态和未知状态。
因此,按照两个状态集合的隐藏马尔可夫模型进行确定,以便自转变概率在各已知状态和未知状态中变高,因此如在下方已知或者未知确定结果中所示,可以在适当时刻切换已知状态和未知状态。如根据饱和对数似然度的计算结果可见,可以在图27中仅在短暂时间内生成已知状态,并且可以在图28中生成振动,但是已知或者未知确定结果示出了可以获得稳定的已知或者未知状态。因而可以使用图27中的已知或者未知确定过程参照关于观测似然度L(t)的时间序列数据来进行稳定的已知或者未知确定。
由于如果可以基于关于观测似然度L(t)的时间序列数据鉴别已知状态和未知状态的两个值则已知或者未知状态确定方法就足够了,所以不限于上述方法。例如可以使用如下方法,其中针对关于观测似然度L(t)的时间序列数据进行低通滤波,以二值化未知状态和已知状态。
进一步,在使用维特比估计或者低通滤波器的已知或者未知确定中,在状态节点估计部223中估计为未知状态的状态节点很少被确定为已知状态。在这样的情况下,可以运用以下方法(1)和(2)中的任一种。(1)状态节点的估计结果(亦即未知)在上述已知或者未知确定的确定结果之前。(2)在未知估计结果的状态节点出现之前或者之后,用状态节点的估计结果(亦即已知)替换状态节点。这里,变成替换目标的状态节点可以预先确定为在未知估计结果的状态节点出现之前和之后的任一状态节点,或者可以是在先前和后继状态节点之中的观测似然度高的状态节点。在(1)中,估计结果具有优先级,并且将确定结果修改成未知状态。在(2)中,确定结果具有优先级,并且将估计结果修改成已知状态。
接着将描述新模型生成部202的细节。
[新模型生成部202的具体配置例子]
图29是图示了新模型生成部202的具体配置例子的框图。
新模型生成部202包括新模型初始化部241、新模型约束部242、新模型学习部243、节点序列确定部244、参数重新计算部245和新模型组织部246。
从已知或者未知确定部201向新模型生成部202供应未知移动历史数据。进一步,在未知移动历史数据与已知移动历史数据连接的情况下,也供应现有模型的在未知移动历史数据之前和之后的状态节点。新模型生成部202的各部在必要时可以获取从已知或者未知确定部201供应的未知移动历史数据以及现有模型的先前和后继状态节点。
新模型初始化部241指定(在保证存储器之时生成)状态节点数目与供应的未知移动历史数据的样本数目相同的HMM作为新模型。
新模型约束部242向在新模型初始化部241中声明的新模型设置从左至右约束。这意味着,即使在移动方向上不存在单向特性,一个移动行为也具有强单向特性,并且时间也具有单向特性约束。
新模型学习部243使用已知移动历史数据来学习新模型。亦即,使用从已知或者位置确定部201供应的未知移动历史数据,新模型学习部243获得表明新模型的具有从左至右约束的HMM的参数。
使用通过新模型学习部243中的学习而获得的新模型,节点序列确定部244生成通过将关于未知移动历史数据的各项三维数据转换成新模型的状态节点si而获得的节点序列数据,然后将其供应到参数重新计算部245。具体而言,从未知移动历史数据的初始步骤开始直至最终步骤,节点序列确定部244重复以下过程:基于从新模型学习部243供应的参数,识别与来自新模型的输入的用户时间、纬度和经度对应的用户当前状态节点si
基于从节点序列确定部244供应的节点序列数据,参数重新计算部245计算与移动历史数据的HMM参数对应的节点序列数据的参数。亦即,参数重新计算部245计算与未知移动历史数据的HMM的初始概率πi、状态转变概率aij和观测概率(中心值μi和方差值σi 2)对应的节点序列数据的初始概率<πi>、状态转变概率<Aij>和观测概率(中心值<μi>和方差值<σi 2>)。在下文中,“<>”包围的初始概率πi、状态转变概率aij和观测概率(中心值μi和方差值σi 2)代表在节点序列数据中重新计算的参数。
进一步,参数重新计算部245计算各状态转变的转变频率ij>、状态频率<CNT_ALLi>和各状态节点si的状态初始频率<CNT_STARTi>。
这里,转变频率ij>代表其中进行从状态节点si向状态节点sj的转变的频率(计数值),其中,i=1至N,并且j=1至N(N为时间序列数据的最终节点编号(=节点数目))。状态频率<CNT_ALLi>是所有节点序列数据中的状态节点si的总数,而状态初始频率<CNT_STARTi>是状态节点(其中节点序列数据的头节点为状态节点si)的数目。
一般而言,更新之后的初始概率πi_update、状态转变概率aij_updat以及观测概率的中心值μi_update和方差值σi_update 2可以表达如下。
&mu; i _ update = &mu; i _ current &CenterDot; n i _ current + &mu; i _ new &CenterDot; n i _ new n i _ current + n i _ new
&sigma; i _ update 2 + &mu; i _ update 2 = ( &sigma; i _ current 2 + &mu; i _ current 2 ) &CenterDot; n i _ current + ( &sigma; i _ new 2 + &mu; i _ new 2 ) &CenterDot; n i _ new n i _ current + n i _ new
&pi; i _ update = &pi; i _ current &CenterDot; n i _ current + &pi; i _ new &CenterDot; n i _ new n i _ current + n i _ new
a ij _ update = a ij _ current &CenterDot; n i _ current + a ij _ new &CenterDot; n i _ new n i _ current + n i _ new
这里,πi_current、aij_current以及μi_current和σi_current 2是现有节点序列数据中的状态节点si的初始概率、状态转变概率以及观测概率的中心值和方差值。进一步,πi_new、aij_new以及μi_new和σi_new 2是添加的节点序列数据中的状态节点si的初始概率、状态转变概率以及观测概率的中心值和方差值。这里,ni_current和ni_new是与节点序列数据的状态节点si的现有部分对应的节点数目及其添加部分的节点数目。
因而,参数重新计算部245计算各状态转变的转变频率ij>、状态频率<CNT_ALLi>和各状态节点si的状态初始频率<CNT_STARTi>用于存储,从而容易进行后继更新计算。
代替频率计算和存储,可以在概率上对频率进行计数,以处置非整数分量。进一步,代替频率,可以存储比如频率×平均值或者频率×方差值这样的参数。
参数重新计算部245计算状态初始频率<CNT_STARTi>和节点序列数据项的数目(从节点序列确定部244供应的节点序列数据项的总数)。
新模型组织部246从HMM(新模型初始化部241声明的新模型)的各状态节点si中删除未用状态节点,从而优化新模型。具体而言,新模型组织部246删除其中在参数重新计算部245中计算的状态频率<CNT_ALLi>为0的状态节点si。向新模型组合部203输出由新模型组织部246组织之后的新模型(参数)。进一步,在从已知或者未知确定部201供应现有模型的在未知移动历史数据之前和之后的状态节点的情况下,也向新模型组合部203输出这些状态节点。
[新模型学习部243的学习过程]
接着将参照图30至图33描述新模型学习部243的学习过程。
首先将参照图30和图31描述通过正态HMM的学习模型与通过新模型学习部243执行的学习模型之间的差异。
在离散状态如HMM中对用户移动历史进行建模的情况下,对通过按照恒定时间间隔对移动路线进行采样而获得的数据进行正态建模。当获得移动历史数据时,在由于功率节省要求等在未缩短采样间隔时未获得充分样本的情况下,样本数目和节点数目可以改变不多,或者样本数目可以与节点数目相比为少数。在这样的情况下,在假设其中观测的数据正态分布于预定位置周围的状态节点的情况下,一个节点可以对一个样本进行建模。在这种情况下,节点的方差值向小值(或0)收敛,并且可以不对样本的邻域进行建模。因此,采样的样本之间的路线未被建模。
图30是图示了在正态HMM对移动历史进行建模时的概念的图。图30中的直线(线段)代表用户的实际移动路线,X-标志(X)代表作为移动历史数据获得的样本,而包围样本的圆圈(O)代表节点。
如图30中所示,由于例如在用户乘坐火车高速移动的情况下,未对其中以短距离获得样本的地点(区域)进行建模,所以未对样本之间的路线进行建模。另一方面,在用户步行慢速移动的情况下,可以在一个节点中对多个样本进行建模。在这样的情况下,节点可能未适当表达移动历史。
进一步,在用户穿过相同移动路线两次的情况下,如果节点的方差值向很小值(或者0)收敛,则在用户第一次穿过时表达的节点未对用户第二次穿过的位置进行建模,并且可能向其分派不同节点。
为了避免这样的问题,可以认为下限设置成节点的方差值,并且必然根据样本对预定区域的路线进行建模。
然而如果方差值设置成大,则增加了不同路线被视为相同路线的概率。例如存在如下问题:认为相互平行行进的不同路线为相同路线。进一步,如果方差值设置成大,则难以高度准确地再现移动速度缓慢时的移动历史数据。对照而言,如果方差值过小,则移动速度高时的移动历史数据不被识别为相同路线。由于实际移动历史数据样本由于移动速度的差异而具有多种距离感测,所以难以确定适合于所有样本的节点方差值下限。
因此如图31中所示,新模型学习部243假设其中一个状态节点必然反映两个连续样本的模型,因此对样本和在样本之间的路线进行建模。在所有新模型中,新模型学习部243进行其中各节点依次连接两个连续样本的建模。因而所有路线的区域可以表达为将要连接成链的新模型。
进一步,即使样本之间的间隔长,但是由于进行建模以包括两个样本,所以节点的方差值可以设置成小。对照而言,由于即使在样本之间的间隔短的情况下仍然可以类似地进行建模,所以可以实现自由尺度的建模。
如后文所述,新模型学习部243可以进行建模,使得一个状态节点反映三个或者更多连续样本,并且可以适当确定一个状态节点为建模而反映的样本的数目。
图32A和32B是图示了使用图形模型的新模型学习部243的学习模型的图。
图32A中的学习模型是如下模型,在该模型中,某个当前状态节点观测当前数据和先前(后继)两个样本。在图32A中,来自一个状态节点的箭头标志指向下方和右下部,但是可以使用其中箭头指向下方和左下部的某个模型。
在这一实施例中,如图31中所示,运用了其中一个状态节点表达两个连续样本的模型,但是可以运用其中一个状态节点表达三个或者更多连续样本的模型。图32B中的模型是其中一个状态节点表达三个连续样本的图形模型。
[新模型学习部243的新模型学习过程]
接着将参照图33中的流程图描述新模型学习部243的新模型学习过程。
首先在步骤S51中,新模型学习部243针对未知移动历史数据计算各状态的似然度。具体而言,新模型学习部243使用以下公式(5)来计算观测似然度P(xt,xt+1|si),其中假设在表明用户活动模型的HMM中,在向状态si转变时,输出移动历史数据的在时间t的位置数据xt和在时间t+1的位置数据xt+1这两个样本。
P(xt,xt+1|si)=N(xt(1)|μsi(1),σsi(1)2)·N(xt+1(1)|μsi(1),σsi(1)2)
×N(xt(2)|μsi(2),σsi(2)2)·N(xt+1(2)|μsi(2),σsi(2)2)
×N(xt(3)|μsi(3),σsi(3)2)·N(xt+1(3)|μsi(3),σsi(3)2)
···(5)
这里,时间t代表时间序列数据的阶数(步数)(不是时间序列数据的测量时间),并且取值1至T(时间序列数据的样本数目)。进一步,在公式(5)中,xt(1)、xt(2)和xt(3)分别代表移动历史数据xt的时间、纬度和经度。进一步,公式(5)中的N()代表奇异正态分布,μsi(1)和σsi(1)2代表奇异正态分布在时间上的中心值和方差值。进一步,μsi(2)和σsi(2)2代表奇异正态分布在纬度上的中心值和方差值,而μsi(3)和σsi(3)2代表在经度上的中心值和方差值。
观测似然度P(xt,xt+1|si)变成各个观测序列中的分布乘积,因为原时间序列数据具有与邻近于它的时间序列数据相同的时间分布。
可以按照以下公式(6)表达其中一个状态节点表达W个或者更多连续样本的模型的观测似然度P(xt,...,xt+w |si)。可以将时间序列数据的维数D推广为大于3的值。
P ( x t , . . . , x t + w | s i ) = &Pi; w = 1 W N ( x t + w - 1 ( 1 ) | &mu; si ( 1 ) , &sigma; si ( 1 ) 2 )
&times; &Pi; w = 1 W N ( x t + w - 1 ( 2 ) | &mu; si ( 2 ) , &sigma; si ( 2 ) 2 )
&times; &Pi; w = 1 W N ( x t + w - 1 ( 3 ) | &mu; si ( 3 ) , &sigma; si ( 3 ) 2 )
···(6)
在步骤S51中,参照所有状态si与三维数据xt的组合,新模型学习部243通过公式5计算观测似然度P(xt,xt+1|si)。
接着在步骤S52中,新模型学习部243计算在各时间t的所有状态si中的前向似然度αt(si)。亦即,使用以下公式(7)和(8),新模型学习部243从时间1至最终时间T依次计算在各时间t的状态si中的前向似然度αt(si)。
α1(si)=πsi    ···(7)
&alpha; t ( s i ) = &Sigma; j = 1 M &alpha; t - 1 ( s j ) a ji P ( x t , x t + 1 | s i ) . . . ( 8 )
这里,公式(7)中的“πsi”代表状态si的初始概率。进一步,公式(8)中的“aji”代表从状态sj向状态si的状态转变概率。例如从外界给予初始概率πsi和状态转变概率aji的初始值。
在步骤S53中,新模型学习部243计算在各时间t的所有状态si的后向似然度βt(si)。亦即,使用以下公式(9)和(10),新模型学习部243从最终时间T至时间1依次计算在各时间t的状态si的后向似然度βt(si)。
&beta; T ( s i ) = 1 M . . . ( 9 )
&beta; t ( s i ) = &Sigma; j = 1 M a ij P ( x t , x t + 1 | s i ) &beta; t + 1 ( s j ) . . . ( 10 )
在公式(9)中,假设在时间T的各个状态si的概率都相同。
以这一方式,通过步骤S51至S53的过程,计算针对移动历史数据的隐藏马尔可夫模型的各种似然度。
在步骤S54中,新模型学习部243更新初始概率和状态转变概率。亦即,新模型学习部243分别将各状态si中的初始概率si和在状态之间的状态转变概率aij更新为按照以下公式(11)和(12)计算的初始概率πsi′和状态转变概率aij′。
&pi; si , = &alpha; 1 ( s i ) &beta; 1 ( s i ) &Sigma; i = 1 M &alpha; t ( s i ) . . . ( 11 )
a ij , = &Sigma; t = 1 T - 1 &alpha; t ( s i ) a ij P ( x t , x t + 1 | s i ) &beta; t + 1 ( s j ) &Sigma; t = 1 T - 1 &alpha; t ( s i ) &beta; t ( s i ) . . . ( 12 )
通过将观测似然度P(xt,xt+1|si)应用于一般在Baum-Welch最大似然度估计法中使用的公式来获得公式(11)和(12)。
在步骤S55中,新模型学习部243更新观测概率。亦即,新模型学习部243分别将各状态si中的观测概率(概率分布)的中心值μsi(d)和方差值σsi(d)2更新为按照以下公式(13)和(14)计算的中心值μsi(d)′和方差值σsi(d)′2
&mu; si ( d ) , = 1 &Sigma; t = 1 T - 1 &alpha; t ( s i ) &beta; t ( s i )
&CenterDot; &Sigma; t = 1 T - 1 &alpha; t ( s i ) &beta; t ( s i ) ( x t ( d ) + x t + 1 ( d ) 2 )
d=1,2,3
···(13)
&sigma; si ( d ) , 2 = 1 &Sigma; t = 1 T - 1 &alpha; t ( s i ) &beta; t ( s i )
&CenterDot; &Sigma; t = 1 T - 1 &alpha; t ( s i ) &beta; t ( s i ) ( x t ( d ) 2 + x t + 1 ( d ) 2 2 )
- &mu; si ( d ) , 2
d=1,2,3
···(14)
这里,公式(13)和(14)中的“d”对应于变成1、2和3中的任一个的数据维数D。
可以在维数在其中一个状态节点表达W个或者更多连续样本的模型中为D的情况下,按照以下公式(15)和(16)计算观测概率的中心值μsi(d)′和方差值σsi(d)′2
&mu; si ( d ) , = 1 &Sigma; t = 1 T - W + 1 &alpha; t ( s i ) &beta; t ( s i )
&CenterDot; &Sigma; t = 1 T - W + 1 &alpha; t ( s i ) &beta; t ( s i ) ( &Sigma; w = 1 W x t + w - 1 ( d ) W )
d=1,2,3…D
···(15)
&sigma; si ( d ) , 2 = 1 &Sigma; t = 1 T - W + 1 &alpha; t ( s i ) &beta; t ( s i )
&CenterDot; &Sigma; t = 1 T - 1 &alpha; t ( s i ) &beta; t ( s i ) ( &Sigma; w = 1 W x t + w - 1 ( d ) 2 W )
- &mu; si ( d ) , 2
d=1,2,3…D
···(16)
可以通过求解使似然度最大化的公式来容易地计算公式(13)和(15)中的中心值μsi(d)′以及公式(14)和(16)中的方差值σsi(d)′2
在步骤S56中,新模型学习部243确定是否终止参数更新。例如在各似然度的增量变成预定值或者更低并且满足参数更新的收敛条件的情况下,新模型学习部243确定终止参数更新。代替地,在反复进行步骤S51至S55中的过程预定次数的情况下,新模型学习部243可以确定终止参数更新。
在步骤S56中,在确定不终止参数更新的情况下,该过程返回到步骤S51。
在步骤S51中,新模型学习部243基于更新的参数计算各状态中的似然度。亦即,基于如下数据计算各状态中的似然度,该数据表明了在步骤S54和S55中的过程中更新的初始概率πsi′、在各状态si中的中心值μsi(d)′和方差值σsi(d)′2以及状态之间的状态转变概率aij′。
然后类似地进行步骤S52至S55中的过程。因此进行HMM参数更新,使得状态si序列的各种似然度(亦即观测似然度P(xt,xt+1|si)、前向似然度αt(si)、后向似然度βt(si))最终依次增加至最大。进一步,在步骤S56中确定是否再次终止参数更新。
在步骤S56中确定终止参数更新的情况下,该过程进行步骤S57。
在步骤S57中,新模型学习部243向节点序列确定部244输出最终参数。亦即,新模型学习部243向节点序列确定部244输出如下数据,然后终止该过程,该数据表明了最终获得的初始概率πsi′、在各状态si中的中心值μsi(d)′和方差值σsi(d)′2以及状态之间的状态转变概率aij′。
[参数重新计算部245的参数重新计算过程]
接着将参照图34中的流程图描述参数重新计算部245的参数重新计算过程。
首先在步骤S71中,使用从节点序列确定部244供应的所有节点序列数据作为目标,参数重新计算部245对各个状态转变中的转变频率cntij>进行计数(i=1至N,j=1至N,N为时间序列数据的最终节点编号(节点数目))。
在步骤S72中,使用从节点序列确定部244供应的所有节点序列数据作为目标,参数重新计算部245对各状态节点si中的状态频率<CNT_ALLi>、状态初始频率<CNT_STARTi>和节点序列数据数目进行计数。
在步骤S73中,参数重新计算部245计算(更新)节点序列数据的初始概率<πi>′和状态转变概率<Aij>′。可以按照以下公式(17)和(18)计算节点序列数据的初始概率<πi>′和状态转变概率<Aij>′。
< &pi; i > , = < cnt _ star t i > < seq _ cnt > . . . ( 17 )
< a ij > , = < trans _ cn t ij > < cnt _ a ll i > . . . ( 18 )
在步骤S74中,参数重新计算部245计算(更新)节点序列数据的观测概率,亦即各状态节点si中的中心值<μi>′和方差值<σi 2>′。可以按照以下公式(19)和(20)计算各状态节点si中的中心值<μi>′和方差值<σi 2>′。
< &mu; si > , = 1 < cnt _ all i > &Sigma; k = 1 < cnt _ all i > ( x t _ k + x t _ k + 1 2 )
···(19)
< &sigma; si 2 > , = 1 < cnt _ all i > &Sigma; k = 1 < cnt _ all i > ( ( x t _ k ) 2 + ( x t _ k + 1 ) 2 2 )
- < &mu; si > , 2
···(20)
在公式(19)和(20)中,xt_k代表在关于移动历史数据的三维数据xt之中的与状态节点si对应的三维数据。因而,xt_k的数目变成等于状态节点si中的状态频率<CNT_ALLi>。
在其中一个状态节点表达W个或者更多连续样本的模型中,可以按照以下公式(21)和(22)计算各状态节点si中的中心值<μj>′和方差值<σj 2>′。
< &mu; si > , = 1 < cnt _ all i > &Sigma; k = 1 < cnt _ all i > ( &Sigma; w = 1 W x t _ k + w - 1 W )
···(21)
< &sigma; si 2 > , = 1 < cnt _ all i > &Sigma; k = 1 < cnt _ all i > ( &Sigma; w = 1 W ( x t _ k + w - 1 ) 2 W )
- < &mu; si > , 2
···(22)
以这一方式终止通过参数重新计算部245进行的参数重新计算过程。
这里使用了图32A和32B中的图形模型,但是在图29中的新模型学习部243(公式(5)、(6)和(13)至(16))和参数重新计算部245(公式(19)至(22))中反映了这一点。因而例如,如果要求简化该过程,则可以运用如下实施例,在该实施例中,仅在图29中的参数重新计算部245中反映图32A和32B中的图形模型。在这种情况下,通过正态Baum-Welch算法进行的学习可以运用于图29中的新模型学习部243。进一步,为了进一步简化,代替正态Baum-Welch算法,可以改变如下过程,在该过程中,向来自以前的所得移动历史数据依次分派编号,以使用该编号作为状态节点的编号。在这种情况下,如果关于当前移动历史的三维数据的移动属性在图7中的移动属性识别和分配部74中给予的移动属性方面不是静止状态,则分派其中向先前三维数据分派的编号加1的编号作为状态节点的编号。另一方面,如果关于当前移动历史的三维数据的移动属性为静止状态,则分派与向先前三维数据分派的编号相同的编号作为状态节点的编号。
[新模型生成部202的新模型生成过程]
图35图示了新模型生成部202进行的总体新模型生成过程的流程图。
首先在步骤S91中,新模型初始化部241获得从已知或者未知确定部201供应的未知移动历史数据,并且生成与获得的数据对应的新模型。亦即,新模型初始化部241生成状态节点数目与获得的未知移动历史数据的样本数目相同的HMM。
在步骤S92中,新模型约束部242向在新模型初始化部241中生成的HMM设置从左至右约束。
在步骤S93中,新模型学习部243使用未知移动历史数据来学习新模型。亦即,在步骤S93中,如图31中所示,新模型是其中一个状态节点必然反映两个连续样本的模型,其中进行参照图33描述的新模型学习过程。
在步骤S94中,使用通过步骤S93中的新模型学习过程而获得的新模型,节点序列确定部244生成与未知移动历史数据对应的节点序列数据,并且将其供应到参数重新计算部245。
在步骤S95中,基于从节点序列确定部244供应的节点序列数据,参数重新计算部245计算与移动历史数据的HMM参数对应的节点序列数据参数。具体而言,参数重新计算部245计算节点序列数据中的初始概率<πi>′和状态转变概率<Aij>′以及各状态节点si中的中心值<μi>′和方差值<σi 2>′。进一步,参数重新计算部245计算各状态节点si中的状态频率<CNT_ALLi>和状态初始频率<CNT_STARTi>。
在步骤S96中,新模型组织部246从HMM(生成的新模型)的各状态节点si中删除未用状态节点,从而组织新模型。进一步,新模型组织部246向新模型组合部203输出组织之后的新模型的参数以及从已知或者未知确定部201供应的未知移动历史数据的现有模型的先前和后继状态节点,然后终止该过程。
[新模型组合部203的拓扑更新模型生成过程]
接着将描述新模型组合部203的拓扑更新模型生成过程,其中通过组合通过先前学习而获得的现有模型与按照未知移动历史数据生成的新模型来生成拓扑模型。
首先在描述的前提下定义以下变量:
现有模型:xhmm
新模型:yhmm
拓扑更新模型:zhmm
现有模型xhmm、新模型yhmm和拓扑更新模型zhmm分别具有以下变量。这里,hmm是学习模型(HMM)中的共同符号表示,该符号表示可以解释为现有模型中的xhmm、新模型中的yhmm和拓扑更新模型中的zhmm。
状态节点的数目:hmm.node
现有模型xhmm的状态节点的数目:xhmm.node=M
新模型yhmm的状态节点的数目:yhmm.node=N
拓扑更新模型zhmm的状态节点的数目:zhmm.node=M+N
关于学习目标的时间序列数据的维数D:hmm.D
各状态节点中的初始概率πi:hmm.pi(i)
所有hmm的初始概率hmm.pi形成hmm.node行和一列的表(初始概率表)。
各状态节点中的转变概率aij:hmm.a(i,j)
所有hmm的转变概率hmm.a形成hmm.node行和hmm.node列的表(转变概率表)。
各状态节点中的概率分布的中心值μi:hmm.mu(i)
所有hmm的概率分布的中心值hmm.mu形成hmm.node行和hmm.D列的表(中心值表)
各状态节点中的概率分布的方差值σi 2:hmm.sigma2(i)
所有hmm的概率分布的方差值hmm.sigma2形成hmm.node行和hmm.D列的表(方差值表)。
学习的时间序列数据的数目seq_cnt:hmm.seq_cnt
各状态节点中的状态频率cnt_alli:hmm.cnt_alli
所有hmm的状态频率hmm.cnt_all形成hmm.node行和一列的表(状态频率表)。
将参照图36中的流程图描述通过新模型组合部203进行的拓扑更新模型生成过程。
首先在步骤S101中,新模型组合部203计算拓扑更新模型的初始概率zhmm.pi。
在步骤S101中,新模型组合部203首先如图37A中所示生成(M+N)行和一列的初始概率表作为初始概率zhmm.pi,因为现有模型包括M个状态节点而新模型包括N个状态节点。
进一步,如图37A中所示,新模型组合部203将拓扑更新模型的初始概率表中的第一行至第M行中的第m行(m=1,2,...M)设置成通过将现有模型的时间序列数据数目xhmm.seq_cnt乘以现有模型的初始概率xhmm.pi(m)而获得的值。进一步,新模型组合部203将拓扑更新模型的初始概率表中的第(M+1)行至第(M+N)行中的第(M+n)行(n=1,2,...N)设置成通过将新模型的时间序列数据数目yhmm.seq_cnt乘以新模型的初始概率yhmm.pi(n)而获得的值。
进一步,如图37B中所示,将拓扑更新模型的初始概率表中的各行除以初始概率表的所有表元之和SUM_pi进行正规化,然后终止生成拓扑更新模型的初始概率表zhmm.pi。
接着在步骤S102中,新模型组合部203计算拓扑更新模型的时间序列数据数目zhmm.seq_cnt。具体而言,新模型组合部203计算现有模型的时间序列数据数目xhmm.seq_cnt与新模型的时间序列数据数目yhmm.seq_cnt之和,以获得拓扑更新模型的时间序列数据数目zhmm.seq_cnt。
在步骤S103中,新模型组合部203计算拓扑更新模型的转变概率zhmm.a和状态频率zhmm.cnt_all。
在步骤S103中,新模型组合部203首先如图38中所示生成(M+N)行和(M+N)列的转变概率表,因为现有模型包括M个状态节点而新模型包括N个状态节点。在转变概率表中,从第一行和第一列起的第M行和第N列称为左上区域,从第(M+1)行和第(M+1)列起的第(M+N)行和第(M+N)列称为右下区域,从第一行和第(M+1)列起的第M行和第(M+N)列称为右上区域,而从第(M+1)行和第一列起的第(M+N)行和第M列称为左下区域。
进一步,新模型组合部203将生成的转变概率表的左上区域中的各表元设置成通过将现有模型的状态节点sm中的状态频率xhmm.cnt_all(m)乘以现有模型的状态节点sm中的转变概率xhmm.a(m,j)而获得的值(j=1,...,M)。
进一步,新模型组合部203将生成的转变概率表的右下区域中的各表元设置成通过将新模型的状态节点sm中的状态频率yhmm.cnt_all(m)乘以新模型的状态节点sm中的转变概率yhmm.a(m,j)而获得的值(j=1,...,M)。
在图38中,由于空间限制而在相同行中示出了xhmm.a(m,j)×xhmm.cnt_all(m)和yhmm.a(m,j)×yhmm.cnt_all(m)。
进一步,新模型组合部203基本上向生成的转变概率表中的右上区域中的各表元分配“0”。这里,在从新模型生成部202供应未知移动历史数据的现有模型的先前状态节点并且新模型被连接以跟随现有模型的节点序列数据的情况下,仅向与连接目标的状态节点对应的表元分配“1”。具体而言,在连接目标的状态节点为si的情况下,将第i行和第(M+1)列的表元设置成“1”。
类似地,新模型组合部203基本上向生成的转变概率表中的左下区域中的各表元分配“0”。这里,在从新模型生成部202供应未知移动历史数据的现有模型的后继状态节点并且现有模型的节点序列数据被连接以跟随新模型的情况下,仅向与连接目标的状态节点对应的表元分配“1”。具体而言,在连接目标的状态节点为sj的情况下,将第(M+N)行和第j列的表元设置成“1”。
接着如图39中所示,新模型组合部203参照在生成的概率表中的左上区域和右下区域计算在行方向上的求和,从而计算拓扑更新模型的状态频率zhmm.cnt_all。图39中的状态频率表包括(M+N)行和一列的表。
最终如图40中所示,新模型组合部203将图38中的转变概率表中的左上区域和右下区域中的各行除以拓扑更新模型的状态频率表中的相应行zhmm.cnt_all(i)进行正规化。以这一方式终止生成拓扑更新模型的转变概率表。
进一步,该过程进行步骤S104,并且新模型组合部203计算拓扑更新模型的概率分布的中心值zhmm.mu和方差值zhmm.sigma2。
在步骤S104中,与拓扑更新模型的中心值zhmm.mu对应的中心值表包括(M+N)行和D列,因为现有模型包括M个状态节点而新模型包括N个状态节点。
如图41中所示,向(M+N)行和D列的中心值表中的从第一行至第M行的各个行分配现有模型的中心值xhmm.mu(i,1)、xhmm.mu(i,2)和xhmm.mu(i,3)(这里i=1,...M)。进一步,向(M+N)行和D列的中心值表中的从(M+1)行至第(M+N)行的各个行分配新模型的中心值yhmm.mu(i,1)、yhmm.mu(i,2)和yhmm.mu(i,3)(这里i=1,...N)。这里,xhmm.mu(i,1)和yhmm.mu(i,1)是移动历史数据中的时间的中心值,xhmm.mu(i,2)和yhmm.mu(i,2)是移动历史数据中的纬度的中心值,而xhmm.mu(i,3)和yhmm.mu(i,3)是移动历史数据中的经度的中心值。
类似地,与拓扑更新模型的概率分布的方差值zhmm.sigma2对应的方差值表包括(M+N)行和D列。
如图42中所示,向(M+N)行和D列的方差值表中的从第一行至第M行的相应行分配现有模型的方差值xhmm.sigma2(i,1)、xhmm.sigma2(i,2)和xhmm.sigma2(i,3)(这里i=1,...M)。进一步,向(M+N)行和D列的方差值表中的从(M+1)行至第(M+N)行的相应行分配新模型的方差值yhmm.sigma2(i,1)、yhmm.sigma2(i,2)和yhmm.sigma2(i,3)(这里i=1,...N)。这里,xhmm.sigma2(i,1)和yhmm.sigma2(i,1)是移动历史数据中的时间的方差值,xhmm.sigma2(i,2)和yhmm.sigma2(i,2)是移动历史数据中的纬度的方差值,而xhmm.sigma2(i,3)和yhmm.sigma2(i,3)是移动历史数据中的经度的方差值。
进一步,该过程进行步骤S105,并且新模型组合部203向更新模型组织部205输出拓扑更新模型的参数。亦即,向更新模型组织部205输出拓扑更新模型中的初始概率zhmm.pi、时间序列数据数目zhmm.seq_cnt、转变概率zhmm.a、状态频率zhmm.cnt_all以及概率分布的中心值zhmm.mu和方差值zhmm.sigma2。以这一方式终止拓扑更新模型生成过程。
[参数更新部204的参数更新过程]
接着将描述通过参数更新部204进行的参数更新过程。
图43是参数更新部204进行的总体参数更新过程的流程图。
首先在步骤S121中,参数更新部204获得从已知或者未知确定部201供应的已知移动历史数据和与供应的数据对应的节点序列数据。下文为了便于说明,假设获得一条已知移动历史数据和与之对应的节点序列数据。
在步骤S122中,参数更新部204更新现有模型的初始概率xhmm.pi。
在步骤S122中,首先在作为初始概率xhmm.pi的M行和一列的初始概率表中,向与获得的状态节点序列的头节点对应的初始概率xhmm.pi(i)添加“1”。在图44A中,作为其中状态节点序列的头节点为状态节点s18的例子,向xhmm.pi(18)添加“1”。
进一步,如图44B中所示,由于满足概率条件,所以将初始概率表中的各行除以所有表元之和SUM_pi进行正规化,并且终止更新现有模型的初始概率xhmm.pi。
然后在步骤S123中,参数更新部204更新现有模型的时间序列数据数目xhmm.seq_cnt。由于时间序列数据数目仅加一,所以获得通过向当前数目xhmm.seq_cnt添加“1”而获得的数目作为在更新之后的现有模型的时间序列数据数目xhmm.seq_cnt。
在步骤S124中,参数更新部204更新现有模型的转变概率xhmm.a和状态频率xhmm.cnt_all。
在步骤S124中,首先向与在获得的状态节点序列中生成的状态转变对应的转变概率表中的各表元添加“1”。例如在图45中的例子中,至少出现从状态节点s18向状态节点s2的转变和从状态节点sM向状态节点s2的转变,并且向各xhmm.a(18,2)×xhmm.cnt_all(18)和xhmm.a(M,2)×xhmm.cnt_all(M)添加“1”。
进一步,参照获得的状态节点序列的最终末端部分的状态节点,向转变概率表中的与自转变对应的表元添加“1”。例如在图45中,作为其中状态节点的最终末端部分的状态节点为s2的例子,向xhmm.a(2,2)×xhmm.cnt_all(2)添加“1”。
接着如图46中所示,参数更新部204针对在向其添加“1”之后的转变概率表计算在行方向上的求和,以计算(更新)现有模型的状态频率xhmm.cnt_all。
最终如图47中所示,参数更新部204将在向其添加“1”之后的转变概率表中的各行除以更新之后的现有模型的状态频率xhmm.cnt_all(i)进行正规化。通过上述计算来更新现有模型的转变概率表。
然后该过程进行步骤S125,并且参数更新部204更新现有模型的概率分布的中心值xhmm.mu和方差值xhmm.sigma2。
一般而言,在M个状态节点si出现在现有模型中并且它的平均值为μsi的情况下,在增加被识别为第(M+1)个状态节点si的新样本xM+1时在更新之前的平均值μsi (M)与在其更新之后的平均值μsi (M+1)之间建立以下关系。
&mu; si ( M ) = 1 M &Sigma; i = 1 M x i . . . ( 23 )
&mu; si ( M + 1 ) = 1 M + 1 &Sigma; i = 1 M + 1 x i
= 1 M + 1 ( M &times; &mu; si ( M ) + x M + 1 ) . . . ( 24 )
在公式(23)和(24)中,在括号之外的上标代表状态节点si的出现次数。
因此如图48中所示,在步骤S124中更新状态频率xhmm.cnt_all(i)之前,参数更新部204将M行和D列的中心值表中的各行的表元乘以紧接先前状态频率xhmmOLD.cnt_all(i)(这里i=1,...,M)。因而有必要在进行步骤S124的过程之前,在预定地点存储紧接先前状态频率xhmmOLD.cnt_all(i)。
接着,参数更新部204向中心值表中的与对应于新样本xM+1的状态节点对应的行添加已知移动历史数据(各项三维数据)作为新样本xM+1
进一步,参数更新部204将M行和D列的中心值表中的各行的表元除以在步骤S124中更新的状态频率xhmm.cnt_all(i)。以这一方式终止更新现有模型的概率分布的中心值xhmm.mu。
另一方面,在M个状态节点si出现于现有模型中并且它的平均值为μsi而方差值为σsi 2的情况下,在增加被识别为第(M+1)个状态节点si的新样本xM+1时在更新之前的方差值σsi 2(M)与在其更新之后的方差值σsi 2(M+1)之间建立以下关系。
&sigma; si 2 ( M ) = 1 M &Sigma; i = 1 M x i 2 - ( &mu; si ( M ) ) 2 . . . ( 25 )
&sigma; si 2 ( M + 1 ) = 1 M + 1 &Sigma; i = 1 M + 1 x i 2 - ( &mu; si ( M + 1 ) ) 2
= M &times; { &sigma; si 2 ( M ) + ( &mu; si ( M ) ) 2 } + X M + 1 2 M + 1 - - - ( &mu; si ( M + 1 ) ) 2
···(26)
在公式(25)和(26)中,在括号以外的上标代表状态节点si的出现次数。
然后,参数更新部204向M行和D列的方差值表中的各行的表元添加在更新现有模型的概率分布的中心值xhmm.mu之前的紧接先前中心值xhmmOLD.mu的平方(i=1,...,M)。因而有必要也在进行上述更新之前,在预定地点存储紧接先前中心值xhmmOLD.mu。
接着,参数更新部204将在添加紧接先前中心值xhmmOLD.mu的平方之后的M行和D列的方差值表中的各行的表元乘以紧接先前状态频率xhmmOLD.cnt_all(i)。
图49是图示了在乘以状态频率xhmmOLD.cnt_all(i)之后的方差值表的图。
进一步,参数更新部204向中心值表中的与对应于新样本xM+1的状态节点对应的行添加已知移动历史数据(各项三维数据)的平方作为新样本xM+1
最终,参数更新部204将M行和D列的中心值表中的各行的表元除以在步骤S124中更新的状态频率xhmm.cnt_all(i),并且从中减去更新之后的中心值xhmm.mu(i)的平方。以这一方式终止更新现有模型的概率分布的方差值xhmm.sigma2。
然后该过程进行步骤S126,并且参数更新部204向新模型组合部203和更新模型组织部205输出更新的现有模型的参数。亦即,输出更新的现有模型中的初始概率xhmm.pi、时间序列数据数目xhmm.seq_cnt、转变概率xhmm.a、状态频率xhmm.cnt_all以及概率分布的中心值xhmm.mu和方差值xhmm.sigma2。以这一方式终止参数更新过程。
[学习主处理部23的总体过程]
接着将参照图50中的流程图描述学习主处理部23的总体学习主处理过程。
首先在步骤S141中,学习主处理部23获得从学习预处理部22(图1)供应的移动历史数据和从用户模型参数存储部12(图1)供应的现有模型的参数。已知或者未知确定部201获得移动历史数据,并且已知或者未知确定部201、新模型组合部203和参数更新部204获得现有模型的参数。
在步骤S142中,已知或者未知确定部201进行已知或者未知确定过程,其中确定供应的移动历史数据是否为关于已知路线的移动历史数据。
如参照图20至图28所述,在已知或者未知确定过程中,在其中向现有模型的状态节点添加未知状态节点的未知状态添加模型中进行维特比估计,以通过两个已知或者未知状态模型进行维特比确定,从而进行已知或者未知确定。
在已知或者未知确定过程中,在确定供应的移动历史数据为已知的情况下,向参数更新部204供应所供应的移动历史数据和节点序列数据(对应状态节点的时间序列数据)。另一方面,在已知或者未知确定过程中,在确定供应的移动历史数据为未知的情况下,向新模型生成部202供应所供应的移动历史数据。进一步,在未知移动历史数据与已知状态节点(路线)连接的情况下,也向新模型生成部202供应连接目标的状态节点。
在步骤S142中确定供应的移动历史数据为已知的情况下,该过程进行步骤S143,并且参数更新部204进行参数更新过程,其中基于已知移动历史数据和与之对应的节点序列数据来更新现有模型的参数。亦即,进行参照图43至图49描述的过程。
另一方面,在步骤S142中确定供应的移动历史数据为未知的情况下,该过程进行步骤S144,并且新模型生成部202进行新模型生成过程,其中生成与未知移动历史数据对应的新模型。换而言之,新模型生成部202获得表达未知移动历史数据的新模型的参数。新模型生成过程是参照图29至图35描述的过程。
在步骤S145中,新模型组合部203进行拓扑更新过程,该过程组合现有模型和新模型并且生成拓扑更新模型,在该拓扑更新模型中,在学习之后的现有模型中导入并扩展未知移动历史数据。亦即,新模型组合部203进行参照图36至图42描述的过程。
在步骤S143或者S145的过程之后,在步骤S146中,更新模型组织部205删除其中从其它状态节点的转变不存在而仅使用自转变的状态节点,以组织参数更新模型或者拓扑更新模型。更新模型组织部205向学习后处理部24和用户模型参数存储部12供应组织之后的更新模型的参数,然后终止该过程。
[目的地和中途停留地检测部25的过程]
接着将参照图51A至图51C描述学习块11的目的地和中途停留地检测部25(图1)的过程。
如上文所述,使用在进行划分和保持移动历史数据的过程之后的移动历史数据(具有移动属性)作为学习数据,学习主处理部23学习用户活动模型的参数。进一步,学习后处理部24使用通过学习而获得的参数来生成与移动历史数据对应的状态序列数据。
图51A是图示了在学习预处理部22划分和保持移动历史数据之后的在图8的下部示出的具有移动属性的移动历史数据83A和83B的图。
图51B是图示了如下状态的图,其中向在图8的下部示出的具有移动属性的移动历史数据83A和83B添加对应状态序列数据。
状态序列节点s1,s2,...,sk,...,st对应于具有移动属性的移动历史数据83A。状态序列节点st+1,st+2,...,sT对应于具有移动属性的移动历史数据83B。
目的地和中途停留地检测部25检测与一组具有移动属性的移动历史数据的最终“静止状态(u)”的三维数据对应的状态节点,并且向其分配目的地属性。在图51B中的例子中,向具有移动属性的移动历史数据83A的状态节点st和具有移动属性的移动历史数据83B的状态节点sT分配目的地属性。状态节点st和状态节点sT是其中静止状态持续预定静止阈值时间或者更长的状态节点。以这种方式,使用目的地和中途停留地检测部25进行的与其中静止状态持续静止阈值时间或者更长的移动历史数据对应的状态节点被估计为目的地。
在参照图8描述的划分过程中,在持续最终静止阈值时间或者更长的划分的移动历史数据中,将多个“移动状态”减少至一个“静止状态”。然而在划分过程中,可以删除在持续最终静止阈值时间或者更长的移动历史数据中的所有多个“移动状态”。参照图51A中的例子,可以省略与具有移动属性的移动历史数据83A和83B的各最终“静止状态(u)”有关的三维数据。在这种情况下,目的地和中途停留地检测部25向与一组具有移动属性的移动历史数据的最终三维数据对应的状态节点分配目的地属性。参照图51B中的例子,可以确定紧接在具有移动属性的移动历史数据83A的状态节点st之前的状态节点st-1和紧接在具有移动属性的移动历史数据83B的状态节点sT之前的状态节点sT-1为目的地。
进一步,目的地和中途停留地检测部25检测与在具有移动属性的一组移动历史数据中间的关于“静止状态(u)”的三维数据对应的状态节点,并且向它分配中途停留地属性。亦即,估计与其中静止状态的连续时间比静止阈值时间更短的移动历史数据对应的状态节点为中途停留地。参照图51B中的例子,将具有移动属性的移动历史数据83A的状态节点sk确定为中途停留地。
当改变交通手段时,目的地和中途停留地检测部25可以如图51C中所示向改变之前的最终状态节点sh分配中途停留地属性。
[学习块11的过程]
将参照图52中的流程图描述学习块11的总体过程。
首先在步骤S241中,历史数据积累部21积累从传感器装置供应的移动历史数据作为学习数据。
在步骤S242中,学习预处理部22进行参照图18描述的学习预处理过程。亦即,例如进行在历史数据积累部21中积累的移动历史数据的连接和划分过程,以及向形成移动历史数据的各项三维数据分配“静止状态”或者“移动状态”这样的移动属性。
在步骤S243中,学习主处理部23进行参照图50描述的学习主处理过程。亦即,学习主处理部23确定供应的用户移动历史数据是已知还是未知,并且根据确定结果来更新HMM(用户活动模型)的参数。在供应未知移动历史数据的情况下,获得其中根据移动范围的扩张来扩展拓扑的HMM的参数。向学习后处理部24和用户模型参数存储部12供应并且在用户模型参数存储部12中存储通过学习主处理过程而获得的用户活动模型的参数。
在步骤S244中,学习后处理部24使用通过学习而获得的参数所表达的用户获得模型来生成与移动历史数据对应的节点序列数据。
在步骤S245中,目的地和中途停留地检测部25向与具有移动属性的移动历史数据对应的状态序列节点的预定状态节点分配目的地属性。具体而言,目的地和中途停留地检测部25向与其中静止状态持续静止阈值时间或者更长的移动历史数据对应的状态节点分配目的地属性。
在步骤S246中,目的地和中途停留地检测部25向与具有移动属性的移动历史数据对应的状态序列节点的预定状态节点分配中途停留地属性。具体而言,目的地和中途停留地检测部25向与其中静止状态的连续时间比静止阈值时间更短的移动历史数据对应的状态节点分配中途停留地属性。
在步骤S247中,目的地和中途停留地检测部25在用户模型参数存储部12中存储关于向状态节点分配的目的地属性和中途停留地属性的信息,然后终止该过程。
[预测主处理部33的过程]
接着将描述预测块13进行的过程。
首先将描述通过预测主处理部33进行的针对当前位置节点和随后位置节点的树搜索过程。
针对当前位置节点和随后位置节点的树搜索过程是如下过程,在该过程中,获得从预测主处理部33的当前位置节点估计部41估计的当前位置节点起的可达目的地节点和去往该目的地节点的路线。可达目的地节点存在于可以从当前位置节点转变的节点所形成的树结构中。因而可以通过从形成树的状态节点中搜寻目的地节点来预测目的地。进一步,在针对当前位置节点和随后位置节点的树搜索过程中,在检测到向其分配中途停留地属性的状态节点(下文称为“中途停留地节点”)的情况下,存储去往中途停留地的路线。
可以认为通过学习而获得的HMM的各状态si代表地图上的预定点(位置),并且可以在状态si和状态sj相互连接时代表从状态si至状态sj的路线。
在这种情况下,可以将与状态si对应的各点分类为端点、穿过点、分叉点和回路中的任一个。端点是其中除了自转变之外的概率很小(除了自转变之外的概率等于预定值或者更低)的点,其中不存在进一步可移动点。穿过点是其中存在除了自转变之外的一个显著转变(换而言之,存在一个进一步的可移动点)的点。分叉点是其中存在除了自转变之外的两个或者更多显著转变(亦即,存在两个或者更多进一步的可移动点)的点。回路是与路线上的目前已经穿过的任一点重合的点。
在搜寻针对目的地的路线的情况下,如果有不同路线,则优选呈现与用于各个路线的必要时间等有关的信息。因此为了适度搜寻可用路线,设置以下条件。
(1)即使路线分岔一次而再次会合,它仍然被视为不同路线。
(2)在搜寻的路线到达分叉点的情况下,创建未搜索列表,以在未搜索列表中搜寻分岔目标。
(3)在端点或者回路出现于路线中的情况下,终止路线搜索。在路线从当前点回到紧接先前点的情况下,它包括在回路中。
图53是图示了通过预测主处理部33的目的地和中途停留地预测部42进行的针对当前位置节点和随后节点的树搜索过程的流程图。
在图53中的过程中,首先在步骤S261中,目的地和中途停留地预测部42获得由预测主处理部33的当前位置节点估计部41估计的当前位置节点,并且将它设置成要被聚焦的重点节点。
在步骤S262中,目的地和中途停留地预测部42确定转变目标是否存在于重点节点中。如果在步骤S262中确定转变目标未存在于重点节点中,则该过程进行后文将描述的步骤S271。
另一方面,如果在步骤S262中确定转变目标存在于重点节点中,则该过程进行步骤S263,然后目的地和中途停留地预测部42确定转变目标是否为目的地节点。
如果在步骤S263中确定转变目标是目的地节点,则该过程进行步骤S264,然后目的地和中途停留地预测部42在内部存储器中的搜索结果列表中存储目前路线(状态节点序列)。在步骤S264之后,该过程进行步骤S271。
另一方面,如果在步骤S263中确定转变目标不是目的地节点,则该过程进行步骤S265,然后目的地和中途停留地预测部42确定转变目标是否为中途停留地节点。
如果在步骤S265中确定转变目标为中途停留地节点,则该过程进行步骤S266,然后目的地和中途停留地预测部42在内部存储器的搜索结果列表中存储目前路线(状态节点序列)。
为了输出到达目的地的代表路线、到达概率和时间作为预测结果,可以在搜索结果列表中存储在转变目标为目的地时的仅有路线。然而如果也存储在转变目标为中途停留地时的路线,则可以在必要时直接获得去往中途停留地的路线、概率和时间。
在步骤S265中确定转变目标不是中途停留地节点的情况下,或者在步骤S266之后,该过程进行步骤S267,然后目的地和中途停留地预测部42确定转变目标是否为分叉点。
如果在步骤S276中确定转变目标为分叉点,则该过程进行步骤S268,然后目的地和中途停留地预测部42在内部存储器的未搜索列表中存储(添加)分岔目标的两个状态节点。在步骤S268之后,该过程进行步骤S271。这里,由于在分岔目标是搜寻的路线上的任何状态节点的情况下,分岔目标形成回路,所以目的地和中途停留地预测部42在未搜索列表中存储分岔目标的状态节点。
如果在步骤S267中确定转变目标不是分岔点,则该过程进行步骤S269,然后目的地和中途停留地预测部42确定转变目标是否为端点。如果在步骤S269中确定转变目标为端点,则该过程进行步骤S271。
另一方面,如果在步骤S269中确定转变目标不是端点,则该过程进行步骤S270,然后目的地和中途停留地预测部42将转变目标的状态节点设置成重点节点,并且使该过程返回到步骤S262。亦即,在转变目标不是目的地节点、中途停留地节点、分叉点和端点中的任一个的情况下,搜索目标的状态节点前进到转变目标的下一状态节点。
在该过程在步骤S264、S268或者S269之后进行步骤S271的情况下,目的地和中途停留地预测部42确定是否有在未搜索列表中登记的状态节点或者是否存在未搜索分岔目标。
如果在步骤S271中确定存在未搜索分岔目标,则该过程进行步骤S272,然后目的地和中途停留地预测部42将未搜索列表中的最高分岔目标的状态节点设置成重点节点,并且读取直至重点节点的路线。然后该过程返回至步骤S262。
另一方面,在步骤S271中确定不存在未搜索分岔目标的情况下,终止树搜索过程。
如上文所述,在树搜索过程中,在包括能够从用户的当前位置节点转变的状态节点的树结构中进行该过程,以便搜索范围从作为起点的当前位置节点至目的地节点或者其中不存在转变目标的末端节点(端点)的所有状态节点。然后在搜索结果列表中存储从用户的当前位置至目的地的路线,作为从当前位置节点起的状态节点序列。可以进行树搜索过程,直至搜索次数达到作为终止条件的预定次数。
[树搜索过程的例子]
将参照图54进一步描述目的地和中途停留地预测部42的树搜索过程。
在图54中的例子中,在状态s1为当前位置的情况下,搜索以下三个路线或者更多。第一路线是从状态s1经过状态s5、状态s6等通向状态s10的路线(下文称为路线A)。第二路线是从状态s1经过状态s5、状态s11、状态s14、状态s23等通向状态s29的路线(下文称为路线B)。第三路线是从状态s1经过状态s5、状态s11、状态s19、状态s23等通向状态s29的路线(下文称为路线C)。
目的地和中途停留地预测部42计算选择各搜索路线的概率(路线选择概率)。通过依次乘以在用于形成路线的状态之间的转变概率来获得路线选择概率。这里,由于仅有必要考虑向下一状态转变的情况而不必考虑逗留于该位置的情况,所以使用通过从通过学习而获得的各状态的状态转变概率aij中删除自转变概率而正规化的转变概率[aij]来计算路线选择概率。
通过删除自转变概率而正规化的转变概率[aij]可以表达为以下公式(27)。
[ a ij ] = ( 1 - &delta; ij ) a ij &Sigma; j = 1 N ( 1 - &delta; ij ) a ij . . . ( 27 )
这里,δ代表仅在下标i和j相互一致时变成1而在除了这一情况之外变成0的Kronecker函数。
因而例如在图54中的状态s5的状态转变概率aij中,在自转变概率a5,5为0.5的情况下,转变概率a5,6为0.2,而转变概率a5,11为0.3,在状态a5分岔至状态s6或者s11的情况下的转变概率[a5,6]和转变概率[a5,11]分别为0.4和0.6。
当搜索路线的状态si的节点编号i为(y1,y2,...,yn)时,可以使用正规化转变概率[aij]将路线选择概率表达为以下公式(28)。
P ( y 1 , y 2 , . . . , y n ) = [ a y 1 y 2 ] [ a y 2 y 3 ] . . . [ a y n - 1 y n ]
= &Pi; i = 1 n - 1 [ a y i - 1 y i ] . . . ( 28 )
事实上,由于在穿过点中的正规化转变概率[aij]为1,所以可以依次乘以在分岔时的正规化转变概率[aij]。因而目的地和中途停留地预测部42可以同时在进行图53中的树搜索过程之时使用公式(28)来计算所选路线的选择概率。
在图54所示的例子中,路线A的选择概率为0.4。进一步,路线B的选择概率为0.24=0.6×0.4。路线C的选择概率为0.36=0.6×0.6。进一步,可以发现路线的计算选择概率的总和为1=0.4+0.24+0.36,并且可以高效进行搜索。
在图54中的例子中,当重点节点从当前位置的状态s1依次移动、然后状态节点s4为重点节点时,由于移动目标的状态s5为分叉点,所以进行图53中的步骤S268,并且如图55A中所示在未搜索列表中存储分岔目标的状态s11和状态s6。这里,由于状态s11的选择概率在状态s11和状态s6中为高,所以在未搜索列表的上部中存储状态s11
然后进行图53中的步骤S271和S272,将存储于未搜索列表的上部中的状态s11设置成重点节点,并且搜索状态s11和随后状态的路线。当状态s11设置成重点节点时,如图55B中所示从未搜索列表中删除状态s11
然后如果使用状态s11作为重点节点来进行搜索,则由于检测到状态s14和状态s19的分岔目标,所以进行图53中的步骤S268,并且在未搜索列表中存储状态s14和状态s19。这时,在当前未搜索列表的最高级别存储状态s14和状态s19,并且由于状态s19的选择概率在状态s14和状态s19中为高,所以在比状态s14更高的级别存储状态s19。因而未搜索列表变成如图55C中所示。
下文类似地进行图53中的步骤S271和S272,将存储于未搜索列表的上部中的状态s19设置成重点节点,并且搜索状态s19和随后状态的路线。当状态s19设置成重点节点时,如图55D中所示从未搜索列表中删除状态s19
以这一方式,在通过目的地和中途停留地预测部42进行的树搜索过程中,按照深度优先算法进行该过程,其中通过在未搜索列表的最上部中记录检测到的分岔目标,从分岔目标的路线之中首先搜寻选择概率更高的路线。
可以认为随着搜索深度增加(亦即,随着使用当前位置节点作为最高级别,更低级别的层变深),难以搜索所有路线。在这样的情况下,例如通过添加以下条件可以中间终止搜索:1)不搜索转变概率低的分岔目标;2)不搜索出现概率低的路线;3)限制搜索深度;4)限制搜索分岔的数目。
图56是图示了树搜索过程中的搜索结果列表的例子的图。
在按照深度优先算法进行树搜索过程时,在搜索结果列表中优先登记选择概率高的路线。
在图56中的例子中,在第一搜索结果列表中登记直至目的地g1的路线R1(r1、r2、r3和r4),并且在这种情况下,选择路线R1的概率为P1,并且使用路线R1来达到目的地g1的时间为T1。在第二搜索结果列表中登记直至目的地g2的路线R2(r1、r2、r3和r5),并且在这种情况下,选择路线R2的概率为P2,并且使用路线R2来达到目的地g2的时间为T2。在第三搜索结果列表中登记直至目的地g3的路线R3(r1、r2和r6),并且在这种情况下,选择路线R3的概率为P3,并且使用路线R3来达到目的地g3的时间为T3
在第四搜索结果列表中登记直至中途停留地w2的路线R4(r1、r2和r7),并且在这种情况下,选择路线R4的概率为P4,并且使用路线R4来达到中途停留地w2的时间为T4。在第五搜索结果列表中登记直至中途停留地w1的路线R5(r1和r8),并且在这种情况下,选择路线R5的概率为P5,并且使用路线R5来达到中途停留地w1的时间为T5
在第六搜索结果列表中登记直至目的地g3的路线R6(r1、r8、w1、r8和r9),并且在这种情况下,选择路线R6的概率为P6,并且使用路线R6来达到目的地g3的时间为T6。在第七搜索结果列表中登记直至目的地g2的路线R7(r1、r10和r11),并且在这种情况下,选择路线R7的概率为P7,并且使用路线R7来达到目的地g2的时间为T7
使用上述公式(13)来计算选择直至目的地或者中途停留地的各路线的概率。进一步,在存在直至目的地的多个路线的情况下,直至目的地的多个路线的选择概率之和变成针对目的地的到达概率。
因而在图56中的例子中,由于路线R2和路线R7可以用来到达目的地g2,所以针对目的地g2的到达概率变成(P2+P7)。类似地,由于路线R3和路线R6可以用来到达目的地g3,所以针对目的地g3的到达概率变成(P3+P6)。针对目的地g1的到达概率与其中选择路线R1的概率P1相同。
[预测后处理部34的过程]
接着将描述预测后处理部34进行的过程。
将描述一种计算沿着直至目的地或者中途停留地的所选路线移动所花费的时间的方法。
例如假设当前时间t1的当前位置为状态sy1,并且在时间(t1,t2,...tg)确定的路线为(sy1,sy2,...syg)。换而言之,假设确定的路线状态si的节点编号i为(y1,y2,...yg)。下文为了简化描述,与位置对应的状态si可以简单地指示为节点编号i。
由于当前位置节点估计部41指定在当前时间t1的当前位置y1,所以在当前时间t1的当前位置为y1的概率Py1(t1)为1。进一步,当前位置为除了在当前时间t1的y1之外的状态的概率为0。
另一方面,当前位置为在预定时间tn的节点编号yn中的概率可以表达为以下公式(29)。
P y n ( t n ) = P y n ( t n - 1 ) a y n y n + P y n - 1 ( t n - 1 ) a y n - 1 y n . . . ( 29 )
这里,在公式(29)的右手侧上的第一项代表当前位置设置于原位置yn的概率并且进行自转变;而在右手侧上的第二项代表从设置于紧接在前的位置yn-1向位置yn进行转变的概率。在公式(29)中,不同于路线选择概率的计算,原样使用通过学习而获得的状态转变概率aij
使用“当前位置在紧接在时间tg之前的时间tg-1设置于紧接在目的地yg之前的位置yg-1并且在时间tg移向目的地yg的概率”,可以将时间tg在到达目的地yg时的预测值<tg>表达为以下公式(30)。
< t g > = &Sigma; t t g ( P x g - 1 ( t g - 1 - 1 ) a x g - 1 x g &Sigma; t P x g - 1 ( t g - 1 ) a x g - 1 x g ) . . . ( 30 )
亦即,预测值<tg>被表达为时间的期望值,直到“当前位置在紧接在时间tg之前的时间tg-1设置于紧接在状态syg之前的状态syg-1并且在时间tg移向状态syg”。
如上文所述,按照公式(30)的预测值<tg>计算沿着直至预定目的地或者中途停留地的所选路线移动所花费的时间。
将参照图56中的例子描述其中在搜寻去往目的地的路线的情况下选择代表路线的代表路线选择过程。
在获得图56中这样的搜索结果列表的情况下,由于在搜索结果列表中优先(以高级别)登记选择概率高的路线,所以输出其中选择概率高并且给予不同目的地的第一至第三搜索结果列表作为预测结果。亦即,选择目的地g1及其路线R1、目的地g2及其路线R2和目的地g3及其路线R3作为目的地及其代表路线。
接着考虑跳过第四和第五搜索结果列表,因为第四和第五搜索结果列表是直至中途停留地的路线,而在第六搜索结果列表中的用于到达目的地g3的路线R6用作代表路线。路线R6使用中途停留地w1,该中途停留地w1未包括在已经选择作为代表路线的相同目的地g3的路线R3中。因而也选择用于到达目的地g3的路线R6作为代表路线。
接着考虑使用第七搜索结果列表中的用于到达目的地g2的路线R7作为代表路线。代表路线R7未以与其中已经选择代表路线的相同目的地g2类似的方式穿过预定中途停留地路线。因而未选择用于到达目的地g2的路线R7作为代表路线。
以这一方式,在代表路线选择过程中,即使在相同目的地的情况下,仍然可以呈现穿过视为有益于用户的不同中途停留地的路线作为预测结果,而不呈现穿过几乎相同路线的类似路线。
在第六搜索结果列表中的用于到达目的地g3的路线R6中,在现有技术中的在先申请2中公开的前一种方法中,在中途停留地w1中终止搜索中途停留地。然而根据预测系统1,可以进行搜索过程直至使用中途停留地w1到达目的地g3的路线,而不在中途停留地w1中终止。
根据预测系统1,在划分目的地和中途停留地之时向通过学习而获得的状态节点分配属性时,可以防止将在中间的中途停留地预测为目的地。进一步,在搜索针对相同目的地的多个路线的情况下,可以呈现穿过视为有益于用户的不同中途停留地的路线,而不呈现穿过几乎相同路线的路线。
图57是图示了预测后处理部34进行的代表路线选择过程的流程图。
首先在步骤S301中,根据由目的地和中途停留地预测部42创建的搜索结果列表,预测后处理部34生成目的地列表,该目的地列表是除了去往中途停留地的路线之外的仅针对目的地的搜索结果列表。
在步骤S302中,预测后处理部34将目的地列表改变成根据目的地重排的目的地列表。这时,预测后处理部34根据目的地生成目的地列表,使得不改变相同目的地中的顺序。
在步骤S303中,预测后处理部34计算各目的地的到达概率。在各目的地仅有一个路线的情况下,路线的选择概率变成到达概率,而在目的地有多个路线的情况下,多个选择概率(出现概率)之和变成目的地的到达概率。
在步骤S304中,预测后处理部34确定在选择代表路线时是否考虑中途停留地。在步骤S304中确定不考虑中途停留地的情况下,该过程进行步骤S305,然后预测后处理部34根据目的地选择处在最高级别的路线作为各目的地的代表路线。然后终止该过程。结果,在有直至目的地的多个路线的情况下,选择概率高的直至目的地的路线用作各目的地的代表路线,并且呈现它的必要时间作为直至目的地的必要时间。在有多个目的地的情况下,可以仅呈现从最高级别起的预定数目的目的地。
另一方面,在步骤S304中确定考虑中途停留地的情况下,该过程进行步骤S306,然后预测后处理部34将根据目的地的目的地列表分类为无中途停留地的根据目的地的目的地列表和有中途停留地的根据目的地的目的地列表。
然后在步骤S307中,预测后处理部34从无中途停留地的根据目的地的目的地列表中根据目的地选择级别最高的路线作为代表路线。因此确定各目的地的无中途停留地的路线作为代表路线。
接着在步骤S308中,预测后处理部34还根据中途停留地对有中途停留地的根据目的地的目的地列表进行分类。
在步骤S309中,预测后处理部34根据中途停留地从有中途停留地的根据目的地的目的地列表中根据目的地选择各中途停留地的在最高级别的路线作为代表路线。因此将各目的地的具有中途停留地的路线确定为代表路线。结果,在存在无中途停留地的路线和有中途停留地的路线作为直至目的地的路线的情况下,两个路线用作各目的地的代表路线,并且呈现各必要时间作为直至目的地的必要时间。
以这一方式终止代表路线选择过程。如上文所述,在目的地有多个路线的情况下,如果使用其中根据中途停留地对出现概率进行分类和呈现的方法而不是其中呈现级别高的多个出现概率的方法,则可以使预测更接近用户的实际预测。
[预测块13的总体过程]
将参照图58中的流程图描述预测块13的总体过程。
首先在步骤S321中,缓冲部31缓冲实时获得的移动历史数据用于预测过程。
在步骤S322中,预测预处理部32进行预测预处理过程。具体而言,预测预处理部32进行与学习预处理部22类似的连接和划分移动历史数据的过程、删除明显异常的移动历史数据的过程、填充数据中的间隙的过程。这里,在划分移动历史数据时变成参考的静止阈值时间可以是与在学习预处理过程中的时间不同的时间。
在步骤S323中,预测主处理部33从用户模型参数存储部12获得通过学习块11的学习而获得的用户活动模型的参数。不同于图33中的预测目的地的过程,可以预先进行获得参数的过程。
在步骤S324中,使用通过学习块11的学习而获得的参数,通过用户活动模型,预测主处理部33的当前位置节点估计部41估计与用户的当前位置对应的状态节点(当前位置节点)。具体而言,使用通过学习块11的学习而获得的参数,通过用户活动模型,当前位置节点估计部41计算与移动历史数据对应的节点序列数据。因此,当前位置节点估计部41使用节点序列数据中的最终状态节点作为当前位置节点。将维特比算法运用于计算节点序列数据。
在步骤S325中,预测主处理部33的目的地和中途停留地预测部42进行参照图53描述的针对当前位置节点和随后节点的树搜索过程。在进行树搜索过程的同时,按照公式(28)获得直至目的地和中途停留地的路线(节点序列)的出现概率。
在步骤S326中,预测后处理部34进行参照图57描述的代表路线选择过程。
在步骤S327中,预测后处理部34使用公式(30)来计算各所选代表路线的必要时间。
在步骤S328中,预测后处理部34输出到达预测的目的地的代表路线、到达概率和时间作为预测结果,然后终止该过程。
如上文所述,在预测块13的过程中,使用关于预测的目的地节点、中途停留地节点和当前节点的信息以及通过学习而获得的表示为参数的用户活动模型来搜寻从用户的当前位置至目的地的路线。由于向通过学习而获得的状态节点分配目的地和中途停留地属性,所以可以防止将中途停留地预测为目的地。
进一步,由于向通过学习而获得的状态节点分配目的地和中途停留地属性,所以即使在去往相同目的地的路线的情况下,仍可以输出无中途停留地的路线和有中途停留地的路线作为代表路线。
[数据处理结果的例子]
图59A、59B至图63图示了在根据上述本发明的预测系统1中的学习主处理部23学习某个用户的移动历史数据时的学习过程结果。
图59A和59B是通过比较在根据本发明的建模(学习主处理部23)中的状态节点学习结果与在通过现有技术中的HMM的建模中的状态节点学习结果而获得的图。
图59A图示了通过根据本发明建模的学习模型的学习结果,亦即进行建模使得如图31中所示一个状态节点必然反映两个连续样本。
图59B图示了通过根据现有技术中的HMM建模的学习模型的学习结果。
在图59A和59B中,椭圆代表各状态节点表示的数据的分布(正态分布)轮廓线。这里,椭圆的中心是相应状态节点的纬度和经度的平均值,而椭圆的大小与相应状态节点的纬度和经度的方差值成比例。
在图59B中所示的现有技术中的建模中,状态节点方差向样本的中心收敛(达到下限),但是在根据本发明的图59A中的建模中,节点方差扩展以便覆盖样本之间的间隙。结果,可以理解的是,在图59B中所示的现有技术中的建模中有如下部分,在这些部分中,在所有状态节点中仅覆盖样本的附近,但是在根据本发明的图59A中的建模中覆盖所有路线。
在图59A和59B中,在时间、纬度和经度的各个维度中预备方差参数。在这样的情况下,表达为椭圆的状态节点对移动历史数据进行建模,这些椭圆的长轴平行于纬度和经度。然后,在移动方向与纬度和经度中的任一个平行的情况下,对路线进行建模而不覆盖除了路线之外的区域。然而,在移动方向倾斜的情况下,明显覆盖除了路线之外的额外区域。因此在希望尽可能避免额外区域的建模的情况下,协方差可以用于方差参数。在这种情况下,表达为斜椭圆的状态节点对移动历史数据进行建模。结果,即使在移动方向倾斜的情况下,仍然可以对除了路线之外的额外区域进行建模而不覆盖。
图60图示了第一次学习的移动路线及其学习结果。移动历史数据是在用户从某人的住处外出去往某个目的地时按照15条线的间隔采样的三维数据。
在图60中的左地图上,将预测系统1学习的移动历史数据表示为黑圆圈,并且定位于黑圆圈附近的椭圆代表学习结果的状态节点。可以理解的是,对状态节点进行学习,以便参照学习结果对样本之间的路线进行建模。
由于移动历史数据是用于学习主处理部23第一次学习的数据,所以应当确定移动历史数据是已知或者未知确定部201的已知或者未知确定过程中的未知移动历史数据。
在图60中的右手侧的两幅图图示了在图60中的左手侧的移动历史数据的已知或者未知确定结果。上图代表饱和对数似然度,而下图代表通过维特比确定得到的已知或者未知确定结果。已知或者未知确定结果示出了与未知路线对应的“-1”被连续输出,并且被正确地学习为未知路线。
图61图示了在用户从用户经过图60中的移动路线到达的目的地经过相同路线返回时学习返回移动历史数据时的学习结果。
在这种情况下,由于用户穿过的各位置是用户已知的位置,所以已知或者未知确定结果看来已知。然而用户的意图在进行行为预测时是重要的,因此即使在相同位置的情况下,仍有必要通过正确区别用户的意图是外出还是返回来进行建模。因而在已知或者未知确定中,应当在已知或者未知确定中确定图61中的返回移动历史数据为未知。
参照图61中的右手侧的已知或者未知确定结果,与未知路线对应的“-1”被连续输出,并且学习主处理部23的已知或者未知确定部201正确确定它为未知路线。
图62图示了在用户经过完全不同路线移向与图60中相同的目的地的情况下移动历史数据的学习结果。
在横向方向上的椭圆链代表在图62中的左图上所示路线的学习结果,而在纵向方向上的长椭圆链代表经过图60中所示完全不同路线的学习结果。地图上的比例在图60和图62中互不相同。
参照在图62中的右手侧的已知或者未知确定结果,与未知路线对应的“-1”被连续输出,并且学习主处理部23的已知或者未知确定部201参照路线完全不同的移动历史数据来正确确定它为未知路线。
图63图示了在学习进一步不同移动路线时的学习结果。
具体而言,图63图示了在经过第一路线第一次学习之后经过第二路线第二次学习某个用户从某人的住处至某人的办公室的移动路线时的学习结果。
这里,第一路线和第二路线代表了以下两种情况之间的差异:用户在某人的住处与途中的中途停留地之间移动而未做出旁边行程的情况;以及用户在做出旁边行程之时移向预定位置的情况。进一步,从途中的中途停留地至作为目的地的办公室的后一半移动路线相同。
参照在图63中的右手侧的已知或者未知确定结果,在移动路线的前一半部分中输出与未知路线对应的“-1”,而在移动路线的后一半中示出与已知路线对应的“1”。这意味着确定从住处至途中的中途停留地的路线为“未知”,而从途中的中途停留地至办公室的路线为“已知”。因而可以理解,学习主处理部23的已知或者未知确定部201可以正确区分用于学习的已知或者未知路线。
进一步,在图63中的左手侧地图上描述的状态节点中,难以通过单色显示可靠区分它们,但是在第二次学习中新添加的状态节点未包括在覆盖第一学习数据路线的状态节点中。另一方面,覆盖第二学习数据路线的状态节点完全变成在第二次学习中新添加的状态节点。亦即,在没有拓扑变化的情况下,通过参照关于已知路线的移动历史数据更新现有模型参数来进行学习,并且仅向关于未知路线的移动历史数据添加新状态节点。因而在学习主处理部23的学习中,可以向学习模型反映新移动历史数据,并且对学习模型适度建模,而没有无用地添加状态节点。换而言之,可以在获得关于未知路线的移动历史数据时简单进行差异学习。
[计算机的配置例子]
可以通过硬件或者软件进行如上文所述系列过程。在通过软件进行系列过程的情况下,用于形成软件的程序安装于计算机中。这里,计算机包括装配于一款专用硬件中的计算机或者安装有多种程序以执行多种功能的通用计算机。
图64是图示了通过程序执行如上文所述系列过程的计算机的硬件配置例子的框图。
在计算机中,CPU(中央处理单元)321、ROM(只读存储器)322和RAM(随机存取存储器)323通过总线324来相互连接。
进一步,输入和输出接口325连接到总线324。输入部326、输出部327、存储部328、通信部329、驱动器330和GPS传感器331连接到输入和输出接口325。
输入部326包括键盘、鼠标、麦克风等。输出部327包括显示器、扬声器等。存储部328包括硬盘、非易失性存储器等。通信部329包括网络接口等。驱动器330驱动诸如磁盘、光盘、磁光盘、半导体存储器等可移动记录介质332。作为上述传感器装置的GPS传感器331输出包括关于当前位置(纬度和经度)和在该时间的时间的数据的三维数据。
在具有这样的配置的计算机中,例如CPU 321通过输入和输出接口325以及总线324向RAM 323加载存储于存储部328中的程序进行执行,以由此进行如上文所述系列过程。
计算机(CPU 321)执行的程序可以记录于可移动记录介质332(例如封装介质等)中用于供应。进一步,可以通过有线或者无线传输介质(比如局域网、因特网或者数字卫星广播)供应程序。
在计算机中,通过在驱动器330上安装可移动记录介质332,可以通过输入和输出接口325在存储部328中安装程序。进一步,可以通过有线或者无线传输介质在通信部329中接收,然后可以在存储部328中安装程序。另外,程序可以预先安装于ROM 322或者存储部328中。
计算机执行的程序可以是其中按照如本说明书中描述的顺序以时间序列方式执行过程的程序,或者可以是其中并行或者在必要时刻(例如在进行调用时)执行过程的程序。
在本说明书中,可以按照描述的顺序以时间序列方式进行或者可以并行或者在必要时刻(例如在进行调用时)进行在流程图中公开的步骤。
在本说明书中,系统是指包括多个装置的整个设备。
本发明包含与2010年6月22日向日本专利局申请的日本优先权专利申请JP 2010-141946中公开的主题有关的主题,该专利申请的整体内容通过引用结合于此。
本领域技术人员应当理解,可以根据设计要求和其它因素出现各种修改、组合、再组合和变更,只要它们处在所附权利要求或者其等效含义的范围内。

Claims (14)

1.一种数据处理装置,包括:
学习部,其在用户的作为学习数据而获得的移动历史数据被表达为表明所述用户的活动的概率模型时获得所述概率模型的参数;
目的地和中途停留地估计部,其使用由所述学习部获得的所述参数来估计在所述概率模型的状态节点之中与移动目的地对应的目的地节点和与移动中途停留地对应的中途停留地节点;
当前位置估计部,其使用通过学习而获得的所述参数向所述概率模型输入所述用户在从当前时间起的预定时间内的与所述学习数据不同的移动历史数据,并且估计与所述用户的当前位置对应的当前位置节点;
搜索部,其使用关于估计的目的地节点、中途停留地节点和当前位置节点的信息以及通过学习而获得的所述概率模型来搜寻从所述用户的当前位置至目的地的路线;以及
计算部,其计算到达搜索的目的地的到达概率和时间,
其中,所述学习部包括:
已知或者未知确定部,其在获得所述概率模型的参数一次之后供应作为新学习数据的移动历史数据的情况下,确定所述新学习数据是关于已知路线的移动历史数据还是关于未知路线的移动历史数据;
参数更新部,其在所述已知或者未知确定部中确定所述新学习数据为关于已知路线的移动历史数据的情况下,更新作为已经获得的概率模型的现有模型的参数;
新模型生成部,其在所述已知或者未知确定部中确定所述新学习数据为关于未知路线的移动历史数据的情况下,获得作为与关于未知路线的移动历史数据对应的新模型的概率模型的参数;以及
新模型组合部,其通过组合所述现有模型的参数与所述新模型的参数来生成其中所述现有模型与所述新模型相互组合的更新模型,并且
其中,在按照所述新学习数据更新概率模型的情况下,在所述目的地和中途停留地估计部、所述当前位置估计部、所述搜索部和所述计算部中执行使用更新之后的概率模型的过程。
2.根据权利要求1所述的数据处理装置,其中,所述新模型生成部运用其中一个状态节点反映在所述用户的移动历史数据中的至少两个连续样本的模型作为所述概率模型。
3.根据权利要求2所述的数据处理装置,其中,其中一个状态节点反映在所述用户的移动历史数据中的至少两个连续样本的所述模型是其中在向一个状态节点转变时同时输出在所述用户的移动历史数据中的至少两个连续样本的模型。
4.根据权利要求3所述的数据处理装置,其中,其中一个状态节点反映在所述用户的移动历史数据中的至少两个连续样本的所述模型也是向其设置从左至右约束的模型。
5.根据权利要求1所述的数据处理装置,其中,所述新模型生成部通过使用Baum-Welch最大似然度估计法来获得所述概率模型的参数。
6.根据权利要求5所述的数据处理装置,其中,所述新模型生成部通过使用所述Baum-Welch最大似然度估计法来获得与关于未知路线的移动历史数据对应的新模型的参数,生成通过将关于未知路线的移动历史数据转换成新模型的状态节点而获得的节点序列数据,计算各状态节点的状态频率和转变频率,并且获得在与新模型的参数对应的关于未知路线的移动历史数据中的节点序列数据的参数。
7.根据权利要求6所述的数据处理装置,其中,
所述已知或者未知确定部在确定所述新学习数据为关于已知路线的移动历史数据的情况下,生成通过将关于已知路线的移动历史数据转换成现有模型的状态节点而获得的节点序列数据,并且
所述参数更新部根据通过将关于已知路线的移动历史数据转换成现有模型的状态节点而获得的节点序列数据来更新各状态节点的状态频率和转变频率,并且更新作为现有模型的参数的节点序列数据的参数。
8.根据权利要求6所述的数据处理装置,其中,所述已知或者未知确定部通过使用通过向现有模型添加取用关于未知路线的移动历史数据的一个状态节点而获得的未知状态添加模型来识别与作为新学习数据的移动历史数据对应的状态节点,计算所述未知状态添加模型中的与作为新学习数据的移动历史数据对应的节点序列数据的观测似然度,并且根据计算的观测似然度的大小来进行已知或者未知确定。
9.根据权利要求8所述的数据处理装置,其中,向现有模型添加的取用关于未知路线的移动历史数据的一个状态节点与已知模型的各状态节点之间的转变概率低于现有模型的状态节点之间的任一转变概率,并且其方差值是覆盖移动历史数据中的可得范围的值。
10.根据权利要求8所述的数据处理装置,其中,所述已知或者未知确定部针对所述未知状态添加模型中的节点序列数据的观测似然度使用HMM来进行维特比确定,以进行已知或者未知确定,所述HMM包括两个已知或者未知状态并且具有高的自转变概率。
11.根据权利要求1所述的数据处理装置,其中,
在关于未知路线的移动历史数据连接到关于已知路线的移动历史数据的情况下,所述已知或者未知确定部输出与连接目标的关于已知路线的移动历史数据对应的状态节点,
在现有模型包括M个状态节点并且新模型包括N个状态节点的情况下,所述新模型组合部生成其中对所述更新模型的转变概率进行定义的(M+N)行和(M+N)列的转变概率表,
生成的所述转变概率表中的从第一行和第一列至第M行和第M列的左上区域中的各表元对应于现有模型的状态节点的转变概率,
生成的所述转变概率表中的从第(M+1)行和第(M+1)列至第(M+N)行和第(M+N)列的右下区域中的各表元对应于新模型的状态节点的转变概率,
生成的所述转变概率表中的从第一行和第(M+1)列至第M行和第(M+N)列的右上区域中的各表元对应于当新模型被连接以跟随现有模型中的节点序列数据时的连接目标的状态节点,并且
生成的所述转变概率表中的从第(M+1)行和第一列至第(M+N)行和第M列的左下区域中的各表元对应于当现有模型中的节点序列数据被连接以跟随新模型时的连接目标的状态节点。
12.根据权利要求1所述的数据处理装置,进一步包括:
移动属性识别部,其参照形成移动历史数据的各条三维数据来至少识别静止状态或者移动状态,
其中,所述目的地和中途停留地估计部将与其中静止状态持续预定阈值时间或者更长的移动历史数据对应的状态节点估计为目的地节点,并且将与其中静止状态的持续时间比所述预定阈值时间更短的移动历史数据对应的状态节点估计为中途停留地节点。
13.一种数据处理方法,包括:
通过处理用户的移动历史数据的数据处理装置的学习部,在所述用户的作为学习数据而获得的所述移动历史数据被表达为表明所述用户的活动的概率模型时,获得所述概率模型的参数;
通过所述数据处理装置的目的地和中途停留地估计部,使用获得的所述参数来估计在所述概率模型的状态节点之中与移动目的地对应的目的地节点和与移动中途停留地对应的中途停留地节点;
通过所述数据处理装置的当前位置估计部,使用通过学习而获得的所述参数向所述概率模型输入所述用户在从当前时间起的预定时间内的与所述学习数据不同的移动历史数据,并且估计与所述用户的当前位置对应的当前位置节点;
通过所述数据处理装置的搜索部,使用关于估计的目的地节点、中途停留地节点和当前位置节点的信息以及通过学习而获得的所述概率模型来搜寻从所述用户的当前位置至目的地的路线;以及
通过所述数据处理装置的计算部,计算到达搜索的目的地的到达概率和时间,
其中,获得所述参数包括:
通过所述学习部的已知或者未知确定部,在获得所述概率模型的参数一次之后供应作为新学习数据的移动历史数据的情况下,确定所述新学习数据是关于已知路线的移动历史数据还是关于未知路线的移动历史数据;
通过所述学习部的参数更新部,在所述已知或者未知确定部中确定所述新学习数据为关于已知路线的移动历史数据的情况下,更新作为已经获得的概率模型的现有模型的参数;
通过所述学习部的新模型生成部,在所述已知或者未知确定部中确定所述新学习数据为关于未知路线的移动历史数据的情况下,获得作为与关于未知路线的移动历史数据对应的新模型的概率模型的参数;以及
通过所述学习部的新模型组合部,通过组合所述现有模型的参数与所述新模型的参数来生成其中所述现有模型与所述新模型相互组合的更新模型,并且
其中,在按照所述新学习数据更新概率模型的情况下,在所述目的地和中途停留地估计部、所述当前位置估计部、所述搜索部和所述计算部中执行使用更新之后的概率模型的过程。
14.一种允许计算机作为以下部分来工作的程序,所述部分包括:
学习部,其在用户的作为学习数据而获得的移动历史数据被表达为表明所述用户的活动的概率模型时获得所述概率模型的参数;
目的地和中途停留地估计部,其使用由所述学习部获得的所述参数来估计在所述概率模型的状态节点之中与移动目的地对应的目的地节点和与移动中途停留地对应的中途停留地节点;
当前位置估计部,其使用通过学习而获得的所述参数向所述概率模型输入所述用户在从当前时间起的预定时间内的与所述学习数据不同的移动历史数据,并且估计与所述用户的当前位置对应的当前位置节点;
搜索部,其使用关于估计的目的地节点、中途停留地节点和当前位置节点的信息以及通过学习而获得的所述概率模型来搜寻从所述用户的当前位置至目的地的路线;以及
计算部,其计算到达搜索的目的地的到达概率和时间,
其中,所述学习部包括以下各部的功能:
已知或者未知确定部,其在获得所述概率模型的参数一次之后供应作为新学习数据的移动历史数据的情况下,确定所述新学习数据是关于已知路线的移动历史数据还是关于未知路线的移动历史数据;
参数更新部,其在所述已知或者未知确定部中确定所述新学习数据为关于已知路线的移动历史数据的情况下,更新作为已经获得的概率模型的现有模型的参数;
新模型生成部,其在所述已知或者未知确定部中确定所述新学习数据为关于未知路线的移动历史数据的情况下,获得作为与关于未知路线的移动历史数据对应的新模型的概率模型的参数;以及
新模型组合部,其通过组合所述现有模型的参数与所述新模型的参数来生成其中所述现有模型与所述新模型相互组合的更新模型,并且
其中,在按照所述新学习数据更新概率模型的情况下,在所述目的地和中途停留地估计部、所述当前位置估计部、所述搜索部和所述计算部中执行使用更新之后的概率模型的过程。
CN201110166329A 2010-06-22 2011-06-15 数据处理装置、数据处理方法和程序 Pending CN102298729A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2010-141946 2010-06-22
JP2010141946A JP2012008659A (ja) 2010-06-22 2010-06-22 データ処理装置、データ処理方法、およびプログラム

Publications (1)

Publication Number Publication Date
CN102298729A true CN102298729A (zh) 2011-12-28

Family

ID=45329562

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201110166329A Pending CN102298729A (zh) 2010-06-22 2011-06-15 数据处理装置、数据处理方法和程序

Country Status (3)

Country Link
US (1) US20110313957A1 (zh)
JP (1) JP2012008659A (zh)
CN (1) CN102298729A (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106918324A (zh) * 2015-12-24 2017-07-04 卡西欧计算机株式会社 信息处理装置、信息处理方法
WO2017124560A1 (zh) * 2016-01-24 2017-07-27 邓娟 收集路线推荐技术的数据的方法以及路线系统
WO2017124562A1 (zh) * 2016-01-24 2017-07-27 邓娟 根据定位服务自动推荐路线的方法以及路线系统
CN107424022A (zh) * 2016-05-23 2017-12-01 滴滴(中国)科技有限公司 一种订单的推送方法及系统
CN110537212A (zh) * 2017-05-22 2019-12-03 北京嘀嘀无限科技发展有限公司 确定预估到达时间的系统与方法
CN111680956A (zh) * 2019-03-11 2020-09-18 丰田自动车株式会社 信息处理装置、信息处理方法以及存储有程序的计算机可读取的非临时性存储介质
US11086881B2 (en) 2015-09-23 2021-08-10 Industrial Technology Research Institute Method and device for analyzing data

Families Citing this family (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103443584A (zh) * 2011-03-25 2013-12-11 索尼公司 信息处理设备、信息处理方法和程序
JP2013205170A (ja) * 2012-03-28 2013-10-07 Sony Corp 情報処理装置、情報処理方法、およびプログラム
CN105683716B (zh) 2012-06-22 2018-07-17 谷歌有限责任公司 场境交通或通行警示
CN104396284B (zh) 2012-06-22 2016-09-07 谷歌公司 呈现针对当前位置或时间的信息
CN103581939B (zh) * 2012-07-27 2016-10-26 诺基亚技术有限公司 用于参与式感知数据采集的方法和设备
US9208447B1 (en) * 2012-09-14 2015-12-08 Lockheed Martin Corporation Method and system for classifying vehicle tracks
CN103308054A (zh) * 2013-05-20 2013-09-18 江苏新科软件有限公司 一种导航路径旅行时间测算方法
US9317415B2 (en) * 2013-06-03 2016-04-19 Google Inc. Application analytics reporting
JP2015045573A (ja) 2013-08-28 2015-03-12 富士通株式会社 携帯型情報処理装置、情報処理方法及び情報処理プログラム
JP6160399B2 (ja) 2013-09-20 2017-07-12 富士通株式会社 行先情報提供プログラム、行先情報提供装置および行先情報提供方法
US9503516B2 (en) 2014-08-06 2016-11-22 Google Technology Holdings LLC Context-based contact notification
JP2016166800A (ja) * 2015-03-10 2016-09-15 株式会社東芝 位置状態推定装置及び方法
US11240286B2 (en) * 2015-06-29 2022-02-01 International Business Machines Corporation Software request-filtering predictive technique based on resource usage probabilities
US10310852B2 (en) * 2016-09-29 2019-06-04 Entit Software Llc Timing estimations for application lifecycle management work items determined through machine learning
KR102552013B1 (ko) * 2016-12-20 2023-07-05 현대자동차 주식회사 목적지 예측 기반 차량 제어 방법 및 시스템
WO2019026703A1 (ja) * 2017-07-31 2019-02-07 株式会社エイシング 学習済モデル統合方法、装置、プログラム、icチップ、及びシステム
CN109425341B (zh) * 2017-08-22 2022-09-27 富士通株式会社 定位方法、定位装置和电子设备
CN109100537B (zh) 2018-07-19 2021-04-20 百度在线网络技术(北京)有限公司 运动检测方法、装置、设备和介质
US11268992B2 (en) * 2018-09-12 2022-03-08 Siemens Corporation Method and system for online multi-layered grid admittance estimation with limited data measurements
JP2020112917A (ja) * 2019-01-09 2020-07-27 日本電信電話株式会社 目的地予測装置、方法、及びプログラム
CN109961106B (zh) * 2019-04-18 2022-03-18 北京百度网讯科技有限公司 轨迹分类模型的训练方法和装置、电子设备
CN112183859B (zh) * 2020-09-28 2024-04-05 上海寻梦信息技术有限公司 路由配置表更新方法、装置、电子设备以及存储介质
CN112685531B (zh) * 2021-01-26 2021-12-03 腾讯科技(深圳)有限公司 车辆匹配方法和装置、计算设备以及计算机可读存储介质

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11086881B2 (en) 2015-09-23 2021-08-10 Industrial Technology Research Institute Method and device for analyzing data
CN106918324A (zh) * 2015-12-24 2017-07-04 卡西欧计算机株式会社 信息处理装置、信息处理方法
WO2017124560A1 (zh) * 2016-01-24 2017-07-27 邓娟 收集路线推荐技术的数据的方法以及路线系统
WO2017124562A1 (zh) * 2016-01-24 2017-07-27 邓娟 根据定位服务自动推荐路线的方法以及路线系统
CN107424022A (zh) * 2016-05-23 2017-12-01 滴滴(中国)科技有限公司 一种订单的推送方法及系统
CN107424022B (zh) * 2016-05-23 2022-02-11 北京嘀嘀无限科技发展有限公司 一种订单的推送方法及系统
CN110537212A (zh) * 2017-05-22 2019-12-03 北京嘀嘀无限科技发展有限公司 确定预估到达时间的系统与方法
CN110537212B (zh) * 2017-05-22 2022-06-07 北京嘀嘀无限科技发展有限公司 确定预估到达时间的系统与方法
CN111680956A (zh) * 2019-03-11 2020-09-18 丰田自动车株式会社 信息处理装置、信息处理方法以及存储有程序的计算机可读取的非临时性存储介质
CN111680956B (zh) * 2019-03-11 2023-11-07 丰田自动车株式会社 信息处理装置、信息处理方法以及存储有程序的计算机可读取的非临时性存储介质

Also Published As

Publication number Publication date
US20110313957A1 (en) 2011-12-22
JP2012008659A (ja) 2012-01-12

Similar Documents

Publication Publication Date Title
CN102298729A (zh) 数据处理装置、数据处理方法和程序
CN103201754B (zh) 数据处理设备和数据处理方法
CN102087722A (zh) 学习设备和方法、预测设备和方法及程序
Liu et al. How machine learning informs ride-hailing services: A survey
Wang et al. Voyage optimization combining genetic algorithm and dynamic programming for fuel/emissions reduction
Yu et al. Real-time partway deadheading strategy based on transit service reliability assessment
CN102270191A (zh) 数据处理设备、数据处理方法和程序
CN105091889B (zh) 一种热点路径的确定方法及设备
CN102183252A (zh) 数据处理装置、数据处理方法和程序
Sundaram et al. Simulation-based dynamic traffic assignment for short-term planning applications
CN102087709A (zh) 学习设备、学习方法以及程序
US20130124088A1 (en) Vessel Routing System
CN102298608A (zh) 信息处理装置、信息处理方法和程序
JP5070574B2 (ja) 局所交通量予測プログラム生成装置、局所交通量予測装置、局所交通量予測プログラム生成方法、局所交通量予測方法及びプログラム
Di Puglia Pugliese et al. The last-mile delivery process with trucks and drones under uncertain energy consumption
Rabie et al. Smart electrical grids based on cloud, IoT, and big data technologies: state of the art
Zhao et al. A deep inverse reinforcement learning approach to route choice modeling with context-dependent rewards
Mahajan et al. Design analysis of a decentralized equilibrium-routing strategy for intelligent vehicles
Low et al. Recent advances in scaling up Gaussian process predictive models for large spatiotemporal data
Cui et al. A road-aware neural network for multi-step vehicle trajectory prediction
Ye et al. A unified theory of the mobile sequential recommendation problem
He et al. Station importance evaluation in dynamic bike-sharing rebalancing optimization using an entropy-based TOPSIS approach
Irio et al. An adaptive learning-based approach for vehicle mobility prediction
JP7456497B2 (ja) 災害復旧計画生成装置、災害復旧計画生成方法、及びプログラム
Catalano et al. A forecasting model for inland navigation based on route enumeration

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20111228