CN109558961B - 确定位置信息的方法和系统、存储介质、处理器以及装置 - Google Patents
确定位置信息的方法和系统、存储介质、处理器以及装置 Download PDFInfo
- Publication number
- CN109558961B CN109558961B CN201710880637.8A CN201710880637A CN109558961B CN 109558961 B CN109558961 B CN 109558961B CN 201710880637 A CN201710880637 A CN 201710880637A CN 109558961 B CN109558961 B CN 109558961B
- Authority
- CN
- China
- Prior art keywords
- positions
- track information
- vector
- information
- track
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 121
- 230000008569 process Effects 0.000 claims abstract description 39
- 239000013598 vector Substances 0.000 claims description 511
- 230000006399 behavior Effects 0.000 claims description 165
- 238000013507 mapping Methods 0.000 claims description 66
- 238000012545 processing Methods 0.000 claims description 47
- 238000004364 calculation method Methods 0.000 claims description 14
- 238000012935 Averaging Methods 0.000 claims description 8
- 238000010586 diagram Methods 0.000 description 24
- 238000012549 training Methods 0.000 description 20
- 238000007781 pre-processing Methods 0.000 description 17
- 238000004458 analytical method Methods 0.000 description 13
- 230000005540 biological transmission Effects 0.000 description 7
- 238000011156 evaluation Methods 0.000 description 5
- 230000006870 function Effects 0.000 description 5
- 240000001829 Catharanthus roseus Species 0.000 description 4
- 230000009471 action Effects 0.000 description 4
- 230000008859 change Effects 0.000 description 4
- 239000004576 sand Substances 0.000 description 4
- JXLYSJRDGCGARV-WWYNWVTFSA-N Vinblastine Natural products O=C(O[C@H]1[C@](O)(C(=O)OC)[C@@H]2N(C)c3c(cc(c(OC)c3)[C@]3(C(=O)OC)c4[nH]c5c(c4CCN4C[C@](O)(CC)C[C@H](C3)C4)cccc5)[C@@]32[C@H]2[C@@]1(CC)C=CCN2CC3)C JXLYSJRDGCGARV-WWYNWVTFSA-N 0.000 description 3
- 238000004891 communication Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 229960003048 vinblastine Drugs 0.000 description 3
- JXLYSJRDGCGARV-XQKSVPLYSA-N vincaleukoblastine Chemical compound C([C@@H](C[C@]1(C(=O)OC)C=2C(=CC3=C([C@]45[C@H]([C@@]([C@H](OC(C)=O)[C@]6(CC)C=CCN([C@H]56)CC4)(O)C(=O)OC)N3C)C=2)OC)C[C@@](C2)(O)CC)N2CCC2=C1NC1=CC=CC=C21 JXLYSJRDGCGARV-XQKSVPLYSA-N 0.000 description 3
- 230000008878 coupling Effects 0.000 description 2
- 238000010168 coupling process Methods 0.000 description 2
- 238000005859 coupling reaction Methods 0.000 description 2
- 238000013135 deep learning Methods 0.000 description 2
- 230000014509 gene expression Effects 0.000 description 2
- 238000010295 mobile communication Methods 0.000 description 2
- 230000006978 adaptation Effects 0.000 description 1
- 230000003542 behavioural effect Effects 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000007667 floating Methods 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Economics (AREA)
- Strategic Management (AREA)
- Marketing (AREA)
- Game Theory and Decision Science (AREA)
- Entrepreneurship & Innovation (AREA)
- Development Economics (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Tourism & Hospitality (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请公开了一种确定位置信息的方法和系统、存储介质、处理器以及装置。其中,该方法包括:获得对象在当前时刻的轨迹信息,轨迹信息包括:对象在移动过程中的多个位置以及对象在多个位置发生的行为信息;以及基于对象在多个位置发生的行为信息,通过预测模型,预测得到对象在下一时刻的位置。本申请解决了如何根据轨迹序列进行行为预测、轨迹分析,并进行实时预警的技术问题。
Description
技术领域
本申请涉及数据处理的领域,具体而言,涉及一种确定位置信息的方法和系统、存储介质、处理器以及装置。
背景技术
近些年来,轨迹(Trajectory)类数据在位置信息处理领域中被广泛使用。目前业务应用的主要技术方案包括三类:统计报表:如流动人口统计,属于现宏观态势展现,无法感知细节;碰撞比对:如指定人员的比对,属于结构化信息检索,多用于事后信息过滤;规则预警:如入境30天无行为,属于人工规则模型。
轨迹数据指一系列行为事件发生的位置序列,不仅包括火车飞机等跨省市出行行为,也包括根据电围数据(或手机定位数据)、卡口等等所有记录行为位置的数据。由于轨迹数据通常涉及多个节点,而一般的案件也会涉及多个节点,因此一系列行为位置组成的轨迹更能代表犯罪行为的“运动”特征。
轨迹类数据目前业务应用的主要技术方案多基于规则,需要人工总结,存在召回率低、准确率难评估等问题,而且受时效性影响,需要不断分析历史案件总结新规则。而且,目前现有的技术方案都是针对单次行为的分析,不能充分挖掘轨迹数据中丰富的信息。
针对上述的问题,目前尚未提出有效的解决方案,使得能够根据轨迹序列进行行为预测、轨迹分析,并进行实时预警。
发明内容
本申请实施例提供了一种确定位置信息的方法和系统、存储介质、处理器以及装置,以至少解决如何根据轨迹序列进行行为预测、轨迹分析,并进行实时预警的技术问题。
根据本申请实施例的一个方面,提供了一种确定位置信息的方法,包括:获得对象在当前时刻的轨迹信息,轨迹信息包括:对象在移动过程中的多个位置以及对象在每个位置发生的行为信息;以及基于对象在多个位置发生的行为信息,通过预测模型,预测得到对象在下一时刻的位置。
根据本申请实施例的另一方面,还提供了一种确定位置信息的方法,包括:获得对象在预定时间段内的多个位置以及对象在每个位置发生的行为信息;以及基于多个位置,通过预测模型,预测得到对象在下一时刻的位置。
根据本申请实施例的另一方面,还提供了一种存储介质,存储介质包括存储的程序,其中,在程序运行时控制存储介质所在设备执行上述实施例中的确定位置信息的方法。
根据本申请实施例的另一方面,还提供了一种处理器,处理器用于运行程序,其中,程序运行时执行上述实施例中的确定位置信息的方法。
根据本申请实施例的另一方面,还提供了确定位置信息的系统,包括:处理器;以及存储器,与处理器连接,用于为处理器提供处理以下处理步骤的指令:获得对象在当前时刻的轨迹信息,轨迹信息包括:对象在移动过程中的多个位置以及对象在每个位置发生的行为信息;以及基于对象在多个位置发生的行为信息,通过预测模型,预测得到对象在下一时刻的位置。
根据本申请实施例的另一方面,还提供了确定位置信息的系统,包括:处理器;以及存储器,与处理器连接,用于为处理器提供处理以下处理步骤的指令:获得对象在预定时间段内的多个位置以及对象在每个位置发生的行为信息;以及基于多个位置,通过预测模型,预测得到对象在下一时刻的位置。
根据本申请实施例的另一方面,还提供了确定位置信息的装置,包括:获取单元,用于获得对象在当前时刻的轨迹信息,所述轨迹信息包括:所述对象在移动过程中的多个位置以及所述对象在每个位置发生的行为信息;以及预测单元,用于基于所述对象在多个位置发生的行为信息,通过预测模型,预测得到所述对象在下一时刻的位置。
根据本申请实施例的另一方面,还提供了确定位置信息的装置,包括:获取单元,用于获得对象在预定时间段内的多个位置以及所述对象在每个位置发生的行为信息;以及预测单元,基于所述多个位置,通过预测模型,预测得到所述对象在下一时刻的位置。
在本申请实施例中,采用获得对象在当前时刻的轨迹信息;以及基于对象在多个位置发生的行为信息,通过预测模型,预测得到对象在下一时刻的位置的方式,通过向量化表示轨迹信息,并且使用轨迹向量进行行为预测,通过单个位置的位置向量和多个位置的轨迹向量,结合分类器和频繁项集预测对象在下一时刻的位置,能够从数据角度对轨迹信息进行分析,实现对轨迹信息的预测。由于轨迹信息包含有多个位置以及每个位置发生的行为信息,既能够唯一标识位置,又能包含位置的语义含义,丰富了轨迹信息所表达的内容,并且,根据多个位置发生的行为信息,利用预测模型进行预测,充分利用了轨迹信息中的丰富数据,避免人工进行分析总结存在的召回率低、准确率难评估等问题,从而简化预测流程,提升预测准确度,进而解决了如何根据轨迹序列进行行为预测、轨迹分析,并进行实时预警的技术问题。
附图说明
此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1是根据本申请实施例的一种确定位置信息的系统的示意图;
图2是根据本申请实施例的另一种确定位置信息的系统的示意图;
图3是根据本申请实施例的一种用于实现确定位置信息的方法的计算机终端的硬件结构框图;
图4是根据本申请实施例的一种确定位置信息的方法的流程图;
图5是根据本申请实施例的另一种确定位置信息的方法的流程图;
图6是根据本申请实施例的一种轨迹分析方法的流程图;
图7是根据本申请实施例的一种确定位置信息的装置的示意图;
图8是根据本申请实施例的另一种确定位置信息的装置的示意图;
图9是根据本申请实施例的一种计算机终端的结构框图;
图10是根据本申请实施例的位置信息确定系统的示意图;
图11是根据本申请实施例的轨迹向量生成装置的示意图;
图12是根据本申请实施例的训练语料库的方法的流程图;
图13是根据本申请实施例的用于对语料进行训练的映射模型的示意图;
图14是根据本申请实施例的语料库中15个位置的位置向量分别从K维降维到2维向量空间中的示意图;
图15是根据本申请实施例的根据另一个包含更多位置的语料库中,基于降维后的位置向量的,每个出发地和目的地的行为向量的示意图;
图16是根据本申请实施例的将轨迹序列中的位置映射为位置向量的流程图;
图17是根据本申请实施例的位置预测装置的示意图;以及
图18是根据本申请实施例的从各个候选位置中确定预测位置的流程图。
具体实施方式
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分的实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。
需要说明的是,本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
首先,在对本申请实施例进行描述的过程中出现的部分名词或术语适用于如下解释:
频繁项集和支持度:是一个二项集,包含出现频率和支持度,其中,定义支持度为相对支持度,频率为绝对支持度,当一个项集的相对支持度满足预设最小支持度阈值时,确定该项集为频繁项集。
电围数据:是电子围栏的前端探测围栏的状态数据,在本申请中可以是手机定位数据。
实施例1
根据本申请实施例,提供了一种确定位置信息的系统的实施例。
图1是根据本申请实施例的一种确定位置信息的系统的示意图。如图1所示,该确定位置信息的系统100包括:处理器102和存储器104。
处理器102。
存储器104,与处理器102连接,用于为处理器102提供处理以下处理步骤的指令:获得对象在当前时刻的轨迹信息,轨迹信息包括:对象在移动过程中的多个位置以及对象在多个位置发生的行为信息;以及基于对象在多个位置发生的行为信息,通过预测模型,预测得到对象在下一时刻的位置。
在上述实施例中,对象可以是需要进行轨迹预测的人员,例如流动人员、犯罪人员、可疑人员等,对象在移动过程中的多个位置可以是人员在移动过程中所处城市、地区等具体位置,每个位置可以通过名称表示,也可以通过行政区划编码表示,但不仅限于此,任何能够唯一标识每个位置的表示方式均可以适用于本申请。而且,对象每一次的移动均对应相应的行为信息,可以在轨迹信息中增加对象在每个位置发生的行为信息,例如,人员1可以去城市A出差,轨迹信息中可以包括城市A,以及对应的行为信息“出差”,人员1回到住所地城市B之后,轨迹信息中可以包括城市B,以及对应的行为信息“住所”,在人员1前往城市C探亲之后,轨迹信息中可以包括城市C,以及对应的行为信息“探亲”,在人员1前往城市D度假之后,轨迹信息中可以包括城市D,以及对应的行为信息“旅游”。
上述实施例中的处理器102与存储器104连接,处理器102可以从存储器104中读取获得对象在当前时刻的轨迹信息,轨迹信息包括:对象在移动过程中的多个位置以及对象在多个位置发生的行为信息;以及基于对象在多个位置发生的行为信息,通过预测模型,预测得到对象在下一时刻的位置的指令。当需要对对象进行行为预测时,处理器102可以根据读取到的指令获取该对象当前时刻的轨迹信息,并在获取到轨迹信息之后,可以获取轨迹信息中的多个位置发生的行为信息,并根据多个位置发生的行为信息,通过预先建立的预测模型,对对象下一个时刻的位置进行预测,
上述实施例提供了一种确定位置信息的方法,可以获取对象的轨迹信息,根据轨迹信息中多个位置发生的行为信息,预测得到对象在下一时刻的位置,由于轨迹信息包含有多个位置以及多个位置发生的行为信息,丰富了轨迹信息所表达的内容,且通过多个位置发生的行为信息进行预测,而不是根据对象的单次行为进行预测,充分利用了轨迹信息中的丰富数据,并且,通过预设模型进行预测,无需人工进行分析总结,从而简化预测流程,提升预测准确度。
作为一种可选地实施方式,存储器104用于为处理器102提供处理以下处理步骤的指令:根据轨迹信息中的多个位置生成与轨迹信息对应的轨迹向量;以及根据轨迹向量预测得到对象在下一时刻的位置。
作为一种可选地实施方式,为了生成与轨迹信息对象的轨迹向量,存储器104还用于为处理器102提供处理以下处理步骤的指令:利用至少包括多个位置的语料,将多个位置映射为对应的位置向量;以及基于多个位置中的至少一个位置的位置向量生成轨迹向量。
可选地,语料为包括多个轨迹信息的轨迹信息集合,存储器104还用于为处理器102提供处理以下处理步骤的指令:按照如下方式训练语料:将轨迹信息集合所包含的不同位置分别映射为作为初始向量的位置向量;以及利用轨迹信息集合所包含的轨迹信息对轨迹信息集合所包含的位置的位置向量进行更新,确定轨迹信息集合所包含的位置的位置向量。具体地,存储器104还用于为处理器102提供处理以下处理步骤的指令:对于轨迹信息集合中所包含的一个位置,执行以下操作:从轨迹信息集合中选择包含该一个位置的第二轨迹信息;在第二轨迹信息中,确定在该一个位置之前和在该一个位置之后分别与该一个位置邻近的多个相邻位置;以及利用多个相邻位置的位置向量更新该一个位置的位置向量。具体地,存储器104用于为处理器102提供处理以下处理步骤的指令:对多个相邻位置的位置向量求和,并将求和的结果作为该一个位置的位置向量。进一步地,存储器104用于为处理器102提供处理以下处理步骤的指令:作为初始向量的位置向量为只有一个维度为1,而其他维度为0的向量,其中取值为1的维度是与作为初始向量的位置向量所对应的位置相关联的维度。在上述实施例中,可以采用one-hot表示方法,将多个位置标识为作为初始向量的K维位置向量,每个作为初始向量的位置向量只有一个维度的值为1,其他维度的值均为0,维度的值为1的维度表示该位置向量对应的位置。
上述实施例中,处理器可以通过将轨迹信息进行向量化表示,得到对应的轨迹向量,具体地,可以采用one-hot表示方式,将每个位置表示为一个K维位置向量,即作为初始向量的位置向量,只有一个维度的值为1,其他维度的值均为0,维度的值为1的维度表示了该位置向量对应的位置。由于,通过one-hot表示方式表示的位置之间是相互孤立的,无法表示多个位置之间的关系。可以为每个位置发生的行为信息添加上下文语义,利用深度学习的思想,通过大量语料的训练,将轨迹信息中的多个位置映射到K维向量空间中。例如,一个位置w(t)可以与其前后相邻的m个位置,即w(t-m),…,w(t-1),w(t+1),…,w(t+m)相关,在训练过程中,可以不断通过前后相邻的m个位置的位置向量来更新该位置w(t)的位置向量,通过计算前后相邻的m个位置的位置向量之和,得到该位置w(t)的位置向量,从而将每个位置映射到K维向量空间中。
可选地,存储器104用于为处理器102提供处理以下处理步骤的指令:将至少一个位置的位置向量求平均值,并将计算结果作为轨迹向量。具体地,存储器104用于为处理器102提供处理以下处理步骤的指令:至少一个位置为在当前时刻的轨迹信息所包括的全部位置。具体地,存储器104用于为处理器102提供处理以下处理步骤的指令:至少一个位置的位置向量的方向与在当前时刻的轨迹信息的多个位置的位置向量的主方向一致。
上述实施例中,处理器在得到每个位置对应的位置向量之后,可以将多个位置对应的位置向量映射到一个轨迹向量中,由于每个位置向量能够标识多个位置之间的前后关系,因此可以采用计算所有位置向量的平均值的方式来生成轨迹向量。例如,至少一个位置的位置向量为w(1)、w(2)、w(3)和w(4),则轨迹向量W=avg(w(1),w(2),w(3),(4))。此外,也可以从当前时刻的轨迹信息所包括的位置中,选择其方向与在当前时刻的轨迹信息的多个位置的位置向量的主方向一致的至少一个位置,通过对其位置向量取平均值来或的所述轨迹向量。
可选地,存储器104用于为处理器102提供处理以下处理步骤的指令:预设对应于在当前时刻的轨迹信息的预设向量;并且将至少一个位置的位置向量与预设向量一起求平均值,并将计算结果作为轨迹向量,其中至少一个位置的位置向量的方向与在当前时刻的轨迹信息的多个位置信息的位置向量的主方向一致。
如上所述,处理器可以根据语料大小直接生成轨迹向量,即预设向量。然后将预设向量和至少一个位置对应的位置向量映射到一个轨迹向量中,具体地,可以计算预设向量和多个位置对应的位置向量的平均值,得到轨迹向量。其中,所选择的至少一个位置的位置向量的方向与在当前时刻的轨迹信息的多个位置的位置向量的主方向一致。
作为一种可选地实施方式,存储器104用于为处理器102提供处理以下处理步骤的指令:基于轨迹向量,利用分类器产生可能作为对象在下一时刻的位置的多个候选位置,并且产生多个候选位置的可信度;以及基于多个候选位置的可信度,确定一个候选位置作为对象在下一时刻的位置。具体地,存储器104用于为处理器102提供处理以下处理步骤的指令:将多个候选位置分别添加到在当前时刻的轨迹信息中从而形成分别包括多个候选位置的多个预测轨迹信息;在轨迹信息集合中统计多个预测轨迹信息各自的频繁项集以及支持度;以及比较多个候选位置的可信度以及对应的预测轨迹信息的支持度,确定一个候选位置作为对象在下一时刻的位置。
上述实施例,处理器通过将轨迹信息进行向量化表示,得到对应的轨迹向量,并利用轨迹向量预测对象在下一时刻的位置,实现对象的行为预测。由于轨迹向量的计算方法中未考虑位置之间的先后顺序的影响,并且向量的平均值无法表示出轨迹信息的全部信息,可以将利用轨迹向量预测得到的结果与频繁项集进行结合,得到对象在下一时刻的位置。具体地,可以预先构造分类器,根据训练好的分类器预测得到候选位置w'(t+1)及可信度I(t+1),将候选位置以及可信度添加至当前时刻的轨迹信息中,得到多个预测轨迹信息,并对多个预测轨迹信息统计频繁项集及支持度,选择支持度最高的预测轨迹信息中的候选位置w”(t+1)及支持度P(t+1),并根据可信度I(t+1)和支持度P(t+1)比较得出最终预测结果w(t+1),即对象在下一时刻的位置。此外,可选地,本申请也可以仅仅根据可信度来确定最终的预测结果,从而减少运算量。
通过以上方式,本申请通过向量化表示轨迹信息,并且使用轨迹向量进行行为预测,通过单个位置的位置向量和多个位置的轨迹向量,结合分类器和频繁项集预测对象在下一时刻的位置,能够从数据角度对轨迹信息进行分析,实现对轨迹信息的预测。由于轨迹信息包含有多个位置以及多个位置发生的行为信息,既能够唯一标识位置,又能包含位置的语义含义,丰富了轨迹信息所表达的内容,并且,根据多个位置发生的行为信息,利用预测模型进行预测,充分利用了轨迹信息中的丰富数据,避免人工进行分析总结存在的召回率低、准确率难评估等问题,从而简化预测流程,提升预测准确度。
图2是根据本申请实施例的另一种确定位置信息的系统的示意图。如图2所示,该确定位置信息的系统200包括:处理器202和存储器204。
处理器202。
存储器204,与处理器202连接,用于为处理器202提供处理以下处理步骤的指令:获得对象在预定时间段内的多个位置以及对象在多个位置发生的行为信息;以及基于多个位置,通过预测模型,预测得到对象在下一时刻的位置。
在上述实施例中,对象可以是需要进行轨迹预测的人员,例如流动人员、犯罪人员、可疑人员等,对象在移动过程中的多个位置可以是人员在移动过程中所处城市、地区等具体位置,每个位置可以通过名称表示,也可以通过行政区划编码表示,但不仅限于此,任何能够唯一标识每个位置的表示方式均可以适用于本申请。而且,对象每一次的移动均对应相应的行为信息,例如,人员1可以去城市A出差,轨迹信息中可以包括城市A,以及对应的行为信息“出差”,人员1回到住所地城市B之后,轨迹信息中可以包括城市B,以及对应的行为信息“住所”,在人员1前往城市C探亲之后,轨迹信息中可以包括城市C,以及对应的行为信息“探亲”,在人员1前往城市D度假之后,轨迹信息中可以包括城市D,以及对应的行为信息“旅游”。
上述实施例中的处理器202与存储器204连接,处理器202可以从存储器204中读取获得对象在预定时间段内的多个位置以及对象在每个位置发生的行为信息;以及基于多个位置,通过预测模型,预测得到对象在下一时刻的位置的指令。当需要对对象进行行为预测时,处理器202可以根据读取到的指令获取该对象在预定时间段内的多个位置以及多个位置发生的行为信息,并在获取到多个位置以及多个位置发生的行为信息之后,可以根据多个位置以及每个位置发生的行为信息,通过预先建立的预测模型,对对象下一个时刻的位置进行预测,
上述实施例提供了一种确定位置信息的方法,可以获取对象的多个位置以及对象在多个位置发生的行为信息,根据多个位置以及多个位置发生的行为信息,预测得到对象在下一时刻的位置,由于所述多个位置以及多个位置发生的行为信息,丰富了轨迹信息所表达的内容,且通过多个位置发生的行为信息进行预测,而不是根据对象的单次行为进行预测,充分利用了轨迹信息中的丰富数据,并且,通过预设模型进行预测,无需人工进行分析总结,从而简化预测流程,提升预测准确度。
作为一种可选地实施方式,存储器204还用于为处理器202提供处理以下处理步骤的指令:在生成轨迹信息之前,将多个位置以及行为信息预处理为预定格式,其中预定格式包括对象信息、位置信息、时间信息以及行为信息。
上述实施例中,处理器202可以获取电围数据(即手机定位数据)、火车飞机出行数据等行为数据,并将行为数据统一处理为4W格式(Who、When、Where、What),如表1所示,其中,Who表示人员ID即,对象信息;When表示行为发生的时间,即时间信息;Where表示行为位置序号,即位置信息,可以是位置名称、行政区划编码,也可以是基于经纬度生成的行政区划;What表示行为类型,即行为信息。进一步地,将4W格式数据按照时间信息的顺序转换成序列数据(Who、Trajectory),得到轨迹信息。
表1
Who | When | Where | What |
U1 | 2016-01-10 | L101 | T1 |
U1 | 2016-02-10 | L32 | T2 |
U1 | 2016-02-17 | L18 | T1 |
U1 | 2016-05-18 | L323 | T1 |
U2 | 2015-01-08 | L97 | T1 |
U2 | 2015-03-07 | L76 | T1 |
U2 | 2015-04-20 | L122 | T2 |
需要说明的是,火车飞机出行数据具有明显的跨地域区别,并且行为较稀,且时间信息由于行为信息的不同出现不同;电围数据描述了每时刻的行为变化,位置变化范围较小,行为密集,具有较大偶然性。由于两种行为数据的稀疏程度不同,可以将两种行为数据进行单独处理。
作为一种可选地实施方式,存储器204还用于为处理器202提供处理以下处理步骤的指令:基于多个位置形成轨迹信息;以及根据轨迹信息,通过预测模型,预测得到对象在下一时刻的位置。
可选地,存储器204用于为处理器202提供处理以下处理步骤的指令:根据轨迹信息中的多个位置生成与轨迹信息对应的轨迹向量;以及根据轨迹向量预测得到对象在下一时刻的位置。具体地,为了生成与轨迹信息对象的轨迹向量,存储器204还用于为处理器202提供处理以下处理步骤的指令:利用至少包括多个位置的语料,将多个位置映射为对应的位置向量;以及基于多个位置中的至少一个位置的位置向量生成轨迹向量。可选地,语料为包括多个轨迹信息的轨迹信息集合,存储器204用于为处理器202提供处理以下处理步骤的指令:按照如下方式训练语料:将轨迹信息集合所包含的不同位置分别映射为作为初始向量的位置向量;以及利用轨迹信息集合所包含的轨迹信息对轨迹信息集合所包含的位置的位置向量进行更新,确定轨迹信息集合所包含的位置的位置向量。进一步地,存储器204用于为处理器202提供处理以下处理步骤的指令:对于轨迹信息集合中所包含的一个位置,执行以下操作:从轨迹信息集合中选择包含该一个位置的第二轨迹信息;在第二轨迹信息中,确定在该一个位置之前和在该一个位置之后分别与该一个位置邻近的多个相邻位置;以及利用多个相邻位置的位置向量更新该一个位置的位置向量。进一步地,存储器204用于为处理器202提供处理以下处理步骤的指令:对多个相邻位置的位置向量求和,并将求和的结果作为该一个位置的位置向量。
可选地,存储器204用于为处理器202提供处理以下处理步骤的指令:基于轨迹向量,利用分类器产生可能作为对象在下一时刻的位置的多个候选位置,并且产生多个候选位置的可信度;以及基于多个候选位置的可信度,确定一个候选位置作为对象在下一时刻的位置。具体地,存储器204用于为处理器202提供处理以下处理步骤的指令:将多个候选位置分别添加到在当前时刻的轨迹信息中从而形成分别包括多个候选位置的多个预测轨迹信息;在轨迹信息集合中统计多个预测轨迹信息各自的频繁项集以及支持度;以及比较多个候选位置的可信度以及对应的预测轨迹信息的支持度,确定一个候选位置作为对象在下一时刻的位置。
上述实施例中,处理器202可以根据多个位置以及多个位置发生的行为信息,生成对象在当前时刻的轨迹信息,具体地,可以按照每个位置发生的时间信息的先后顺序,将每个位置以及每个位置发生的行为信息进行拼接,得到轨迹信息,例如,人员U1的轨迹信息可以表示为:U1:L101->L32->L18->L323;人员U2的轨迹信息可以表示为:U2:L97->L76->L122。进一步可以根据轨迹信息,利用预测模型,预测得到对象在下一时刻的位置。其中,处理器202根据轨迹信息,利用预测模型,预测得到对象在下一时刻的位置的具体实施方式,与处理器201的具体实施方式相同,在此不做赘述。
需要说明的是,如果两个行为信息之间持续长时间无行为(例如,一周、一月、一年),则可以将其作为一种特殊轨迹行为(休止符)添加至轨迹信息中,从而表示多个位置之间的连续性。特殊轨迹行为可以通过时长进行划分,划分成一周、一月、一年,例如,U1:L101->month->L32->week->L18->week->week->week->L323,U2:L97->year->month->L76->month->L122,由上可知,人员U1在从L101移到L32中间间隔了一个月,从L32到L18中间间隔了一周,从L18移动到L323中间间隔了3周;人员U2在从L197移到L76中间间隔了一年一个月,从L76到L122中间间隔了一周。
作为一种可选地实施方式,存储器204用于为处理器202提供处理以下处理步骤的指令:在生成轨迹信息后,从轨迹信息中去除高频出现的位置节点的位置信息。
上述实施例中,由于在轨迹信息中,存在一些出现频率非常高的位置,对区分不同类型的轨迹信息没有影响,例如,人员U1从位置A去其他位置均需经过位置B,因此,处理器202可以将轨迹信息中可以去除出现频率非常高的位置B。
通过以上方式,本申请通过向量化表示轨迹信息,并且使用轨迹向量进行行为预测,通过单个位置的位置向量和多个位置的轨迹向量,结合分类器和频繁项集预测对象在下一时刻的位置,能够从数据角度对轨迹信息进行分析,实现对轨迹信息的预测。由于轨迹信息包含有多个位置以及多个位置发生的行为信息,既能够唯一标识位置,又能包含位置的语义含义,丰富了轨迹信息所表达的内容,并且,根据多个位置发生的行为信息,利用预测模型进行预测,充分利用了轨迹信息中的丰富数据,避免人工进行分析总结存在的召回率低、准确率难评估等问题,从而简化预测流程,提升预测准确度。
实施例2
根据本申请实施例,还提供了一种确定位置信息的方法的实施例,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
本申请实施例一所提供的方法实施例可以在移动终端、计算机终端或者类似的运算装置中执行。图3示出了一种用于实现确定位置信息的方法的计算机终端的硬件结构框图。如图3所示,计算机终端30可以包括一个或多个(图中采用302a、302b,……,302n来示出)处理器302(处理器302可以包括但不限于微处理器MCU或可编程逻辑器件FPGA等的处理装置)、用于存储数据的存储器304、以及用于通信功能的传输装置306。除此以外,还可以包括:显示器、输入/输出接口(I/O接口)、通用串行总线(USB)端口(可以作为I/O接口的端口中的一个端口被包括)、网络接口、电源和/或相机。本领域普通技术人员可以理解,图3所示的结构仅为示意,其并不对上述电子装置的结构造成限定。例如,计算机终端30还可包括比图3中所示更多或者更少的组件,或者具有与图3所示不同的配置。
应当注意到的是上述一个或多个处理器302和/或其他数据处理电路在本文中通常可以被称为“数据处理电路”。该数据处理电路可以全部或部分的体现为软件、硬件、固件或其他任意组合。此外,数据处理电路可为单个独立的处理模块,或全部或部分的结合到计算机终端30中的其他元件中的任意一个内。如本申请实施例中所涉及到的存储器和存储器,该数据处理电路作为一种处理器控制(例如与接口连接的可变电阻终端路径的选择)。
存储器304可用于存储应用软件的软件程序以及模块,如本申请实施例中的确定位置信息的方法对应的程序指令/数据存储装置,处理器302通过运行存储在存储器304内的软件程序以及模块,从而执行各种功能应用以及数据处理,即实现上述的确定位置信息的方法。存储器304可包括高速随机存储器,还可包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器304可进一步包括相对于处理器302远程设置的存储器,这些远程存储器可以通过网络连接至计算机终端30。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
传输装置306用于经由一个网络接收或者发送数据。上述的网络具体实例可包括计算机终端30的通信供应商提供的无线网络。在一个实例中,传输装置306包括一个网络适配器(Network Interface Controller,NIC),其可通过基站与其他网络设备相连从而可与互联网进行通讯。在一个实例中,传输装置306可以为射频(Radio Frequency,RF)模块,其用于通过无线方式与互联网进行通讯。
显示器可以例如触摸屏式的液晶显示器(LCD),该液晶显示器可使得用户能够与计算机终端30(或移动设备)的用户界面进行交互。
此处需要说明的是,在一些可选实施例中,上述图3所示的计算机设备(或移动设备)可以包括硬件元件(包括电路)、软件元件(包括存储在计算机可读介质上的计算机代码)、或硬件元件和软件元件两者的结合。应当指出的是,图3仅为特定具体实例的一个实例,并且旨在示出可存在于上述计算机设备(或移动设备)中的部件的类型。
在上述运行环境下,本申请提供了如图4所示的确定位置信息的方法。图4是根据本申请实施例的一种确定位置信息的方法的流程图。如图4所示,该方法可以包括以下步骤:
步骤S402,获得对象在当前时刻的轨迹信息,轨迹信息包括:对象在移动过程中的多个位置以及对象在多个位置发生的行为信息。
步骤S404,基于对象在多个位置发生的行为信息,通过预测模型,预测得到对象在下一时刻的位置。
作为一种可选的实施方式,通过预测模型,预测得到对象在下一时刻的位置的操作包括:根据轨迹信息中的多个位置生成与轨迹信息对应的轨迹向量;以及根据轨迹向量预测得到对象在下一时刻的位置。
作为一种可选的实施方式,生成轨迹向量的操作包括:利用至少包括多个位置的语料,将多个位置映射为对应的位置向量;以及基于多个位置中的至少一个位置的位置向量生成轨迹向量。
作为一种可选的实施方式,语料为包括多个轨迹信息的轨迹信息集合,其中语料按照如下方式进行训练:将轨迹信息集合所包含的不同位置分别映射为作为初始向量的位置向量;以及利用轨迹信息集合所包含的轨迹信息对轨迹信息集合所包含的位置的位置向量进行更新,确定轨迹信息集合所包含的位置的位置向量。
作为一种可选的实施方式,对位置向量进行更新的操作包括:对于轨迹信息集合中所包含的一个位置,执行以下操作:从轨迹信息集合中选择包含该一个位置的第二轨迹信息;在第二轨迹信息中,确定在该一个位置之前和在该一个位置之后分别与该一个位置邻近的多个相邻位置;以及利用多个相邻位置的位置向量更新该一个位置的位置向量。
作为一种可选的实施方式,利用多个相邻位置的位置向量更新该一个位置的位置向量的操作包括:对多个相邻位置的位置向量求和,并将求和的结果作为该一个位置的位置向量。
作为一种可选的实施方式,作为初始向量的位置向量为只有一个维度为1,而其他维度为0的向量,其中取值为1的维度是与作为初始向量的位置向量所对应的位置相关联的维度。
作为一种可选的实施方式,生成轨迹向量的操作包括:将至少一个位置的位置向量求平均值,并将计算结果作为轨迹向量。
作为一种可选的实施方式,至少一个位置为在当前时刻的轨迹信息所包括的全部位置。
作为一种可选的实施方式,至少一个位置的位置向量的方向与在当前时刻的轨迹信息的多个位置的位置向量的主方向一致。
作为一种可选的实施方式,形成轨迹向量的操作包括:预设对应于在当前时刻的轨迹信息的预设向量;并且将至少一个位置的位置向量与预设向量一起求平均值,并将计算结果作为轨迹向量,其中至少一个位置的位置向量的方向与在当前时刻的轨迹信息的多个位置信息的位置向量的主方向一致。
作为一种可选的实施方式,预测得到对象在下一时刻的位置的操作包括:基于轨迹向量,利用分类器产生可能作为对象在下一时刻的位置的多个候选位置,并且产生多个候选位置的可信度;以及基于多个候选位置的可信度,确定一个候选位置作为对象在下一时刻的位置。
作为一种可选的实施方式,预测得到对象在下一时刻的位置的操作还包括:将多个候选位置分别添加到在当前时刻的轨迹信息中从而形成分别包括多个候选位置的多个预测轨迹信息;在轨迹信息集合中统计多个预测轨迹信息各自的频繁项集以及支持度;以及比较多个候选位置的可信度以及对应的预测轨迹信息的支持度,确定一个候选位置作为对象在下一时刻的位置。
本申请实施例还提供了一种确定位置信息的方法。本申请实施例所提供的确定位置信息的方法可以在移动终端、计算机终端或者类似的运算装置中执行。在图3所示的计算机终端的运行环境下,本申请可以提供了如图5所示的数据访问方法。图5是根据本申请实施例的另一种确定位置信息的方法的流程图。如图5所示,该方法包括以下步骤:
步骤S502,获得对象在预定时间段内的多个位置以及对象在多个位置发生的行为信息。
步骤S504,基于多个位置,通过预测模型,预测得到对象在下一时刻的位置。
作为一种可选的实施方式,预测得到对象在下一时刻的位置的操作包括:基于多个位置形成轨迹信息;以及根据轨迹信息,通过预测模型,预测得到对象在下一时刻的位置。
作为一种可选的实施方式,该确定位置信息的方法还包括:在生成轨迹信息之前,将多个位置以及行为信息预处理为预定格式,其中预定格式包括对象信息、位置信息、时间信息以及行为信息。
作为一种可选的实施方式,该确定位置信息的方法还包括:在生成轨迹信息后,从轨迹信息中去除高频出现的位置节点的位置信息。
作为一种可选的实施方式,通过预测模型,预测得到对象在下一时刻的位置的操作包括:根据轨迹信息中的多个位置生成与轨迹信息对应的轨迹向量;以及根据轨迹向量预测得到对象在下一时刻的位置。
作为一种可选的实施方式,生成轨迹向量的操作包括:利用至少包括多个位置的语料,将多个位置映射为对应的位置向量;以及基于多个位置中的至少一个位置的位置向量生成轨迹向量。
作为一种可选的实施方式,语料为包括多个轨迹信息的轨迹信息集合,其中语料按照如下方式进行训练:将轨迹信息集合所包含的不同位置分别映射为作为初始向量的位置向量;以及利用轨迹信息集合所包含的轨迹信息对轨迹信息集合所包含的位置的位置向量进行更新,确定轨迹信息集合所包含的位置的位置向量。
作为一种可选的实施方式,对位置向量进行更新的操作包括:对于轨迹信息集合中所包含的一个位置,执行以下操作:从轨迹信息集合中选择包含该一个位置的第二轨迹信息;在第二轨迹信息中,确定在该一个位置之前和在该一个位置之后分别与该一个位置邻近的多个相邻位置;以及利用多个相邻位置的位置向量更新该一个位置的位置向量。
作为一种可选的实施方式,利用多个相邻位置的位置向量更新该一个位置的位置向量的操作包括:对多个相邻位置的位置向量求和,并将求和的结果作为该一个位置的位置向量。
作为一种可选的实施方式,预测得到对象在下一时刻的位置的操作包括:基于轨迹向量,利用分类器产生可能作为对象在下一时刻的位置的多个候选位置,并且产生多个候选位置的可信度;以及基于多个候选位置的可信度,确定一个候选位置作为对象在下一时刻的位置。
作为一种可选的实施方式,预测得到对象在下一时刻的位置的操作还包括:将多个候选位置分别添加到在当前时刻的轨迹信息中从而形成分别包括多个候选位置的多个预测轨迹信息;在轨迹信息集合中统计多个预测轨迹信息各自的频繁项集以及支持度;以及比较多个候选位置的可信度以及对应的预测轨迹信息的支持度,确定一个候选位置作为对象在下一时刻的位置。
下面结合一种优选的实施例对本申请实施例的技术方案进行说明。图6是根据本申请实施例的一种轨迹分析方法的流程图,如图6所示,该方法包括以下步骤:
步骤S602,数据预处理。
在获取到对象的原始行为数据之后,可以将行为数据统一成预定格式,包括对象信息、位置信息、时间信息以及行为信息。
步骤S604,生成序列数据。
在得到预定格式的行为数据之后,可以按照时间顺序将预定格式的行为数据转换成序列数据,即得到上述的轨迹信息,并去除轨迹信息中高频出现的位置节点的位置信息。
步骤S606,通过映射模型训练生成位置向量和轨迹向量。
在生成序列数据,即生成轨迹信息之后,可以为轨迹信息中每个行为信息添加上下文语义,并使用映射算法对序列数据进行建模,获取所有位置的位置向量,具体地,可以利用语料,根据每个位置之前和之后相邻的多个位置的位置向量,对每个位置的位置向量进行更新,从而得到每个位置的位置向量。进一步地,可以计算所有位置的位置向量,得到轨迹向量。
步骤S608,利用频繁项集和分类器,预测对象在下一时刻的位置。
在得到轨迹向量之后,可以通过分类器进行预测,得到对象在下一时刻的多个优选位置以及每个位置的可信度,将每个优选位置添加入轨迹序列中,得到预测序列,通过统计预测序列的频繁项集及支持度,获取支持度最高的预测序列中的优选位置以及支持度,根据可信度和支持度,预测得到对象在下一时刻的位置。
通过以上方式,本申请通过向量化表示根据行为数据得到的轨迹信息,并且使用轨迹向量进行行为预测,通过单个位置的位置向量和多个位置的轨迹向量,结合分类器和频繁项集预测对象在下一时刻的位置,能够从数据角度对轨迹信息进行分析,实现对轨迹信息的预测。由于轨迹信息包含有多个位置以及多个位置发生的行为信息,既能够唯一标识位置,又能包含位置的语义含义,丰富了轨迹信息所表达的内容,并且,根据多个位置发生的行为信息,利用预测模型进行预测,充分利用了轨迹信息中的丰富数据,避免人工进行分析总结存在的召回率低、准确率难评估等问题,从而简化预测流程,提升预测准确度。
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本申请并不受所描述的动作顺序的限制,因为依据本申请,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本申请所必须的。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到根据上述实施例的方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本申请各个实施例所述的方法。
实施例3
根据本申请实施例,还提供了一种用于实施上述确定位置信息的方法的确定位置信息的装置。图7是根据本申请实施例的一种确定位置信息的装置的示意图。如图7所示,该装置700包括:获取单元702和预测单元704。
获取单元702,用于获得对象在当前时刻的轨迹信息,轨迹信息包括:对象在移动过程中的多个位置以及对象在多个位置发生的行为信息。
预测单元704,用于基于对象在多个位置发生的行为信息,通过预测模型,预测得到对象在下一时刻的位置。
可选地,预测单元包括:生成模块,用于根据轨迹信息中的多个位置生成与轨迹信息对应的轨迹向量;以及预测模块,用于根据轨迹向量预测得到对象在下一时刻的位置。
可选地,生成模块包括:映射子模块,用于利用至少包括多个位置的语料,将多个位置映射为对应的位置向量;以及生成子模块,用于基于多个位置中的至少一个位置的位置向量生成轨迹向量。
可选地,语料为包括多个轨迹信息的轨迹信息集合,其中该装置还包括训练单元,用于按照如下方式对语料进行训练:将轨迹信息集合所包含的不同位置分别映射为作为初始向量的位置向量;以及利用轨迹信息集合所包含的轨迹信息对轨迹信息集合所包含的位置的位置向量进行更新,确定轨迹信息集合所包含的位置的位置向量。
可选地,训练单元还用于对于轨迹信息集合中所包含的一个位置,执行以下操作:从轨迹信息集合中选择包含该一个位置的第二轨迹信息;在第二轨迹信息中,确定在该一个位置之前和在该一个位置之后分别与该一个位置邻近的多个相邻位置;以及利用多个相邻位置的位置向量更新该一个位置的位置向量。
可选地,训练单元包括:第一处理模块,用于对多个相邻位置的位置向量求和,并将求和的结果作为该一个位置的位置向量。
可选地,作为初始向量的位置向量为只有一个维度为1,而其他维度为0的向量,其中取值为1的维度是与作为初始向量的位置向量所对应的位置相关联的维度。
可选地,生成子模块还用于将至少一个位置的位置向量求平均值,并将计算结果作为轨迹向量。
可选地,至少一个位置为在当前时刻的轨迹信息所包括的全部位置。
可选地,至少一个位置的位置向量的方向与在当前时刻的轨迹信息的多个位置的位置向量的主方向一致。
可选地,生成子模块包括:预设重子模块,用于预设对应于在当前时刻的轨迹信息的预设向量;以及第二处理模块,用于将至少一个位置的位置向量与预设向量一起求平均值,并将计算结果作为轨迹向量,其中至少一个位置的位置向量的方向与在当前时刻的轨迹信息的多个位置信息的位置向量的主方向一致。
可选地,预测模块包括:产生子模块,用于基于轨迹向量,利用分类器产生可能作为对象在下一时刻的位置的多个候选位置,并且产生每个候选位置的可信度;以及第一确定子模块,用于基于多个候选位置的可信度,确定一个候选位置作为对象在下一时刻的位置。
可选地,预测模块还包括:添加子模块,用于将多个候选位置分别添加到在当前时刻的轨迹信息中从而形成分别包括多个候选位置的多个预测轨迹信息;统计子模块,用于在轨迹信息集合中统计多个预测轨迹信息各自的频繁项集以及支持度;以及该第一确定子模块,还用于比较多个候选位置的可信度以及对应的预测轨迹信息的支持度,确定一个候选位置作为对象在下一时刻的位置。
此处需要说明的是,上述获取单元702和预测单元704对应于实施例2中的步骤S402至步骤S404,两个模块与对应的步骤所实现的实例和应用场景相同,但不限于上述实施例2所公开的内容。需要说明的是,上述模块作为装置的一部分可以运行在实施例2提供的计算机终端30中。
根据本申请实施例,还提供了另一种用于实施上述确定位置信息的方法的确定位置信息的装置。图8是根据本申请实施例的另一种确定位置信息的装置的示意图。如图8所示,该装置800包括:获取单元802和预测单元804。
获取单元802,用于获得对象在预定时间段内的多个位置以及对象在多个位置发生的行为信息。
预测单元804,用于基于多个位置,通过预测模型,预测得到对象在下一时刻的位置。
可选地,预测单元包括:形成模块,用于基于多个位置形成轨迹信息;以及预测模块,用于根据轨迹信息,通过预测模型,预测得到对象在下一时刻的位置。
可选地,该装置还包括:预处理单元,用于在生成轨迹信息之前,将多个位置以及行为信息预处理为预定格式,其中预定格式包括对象信息、位置信息、时间信息以及行为信息。
可选地,该装置还包括:去除单元,用于在生成轨迹信息后,从轨迹信息中去除高频出现的位置节点的位置信息。
可选地,预测模块包括:生成子模块,用于根据轨迹信息中的多个位置生成与轨迹信息对应的轨迹向量;以及预测子模块,用于根据轨迹向量预测得到对象在下一时刻的位置。
可选地,生成子模块包括:映射重子模块,用于利用至少包括多个位置的语料,将多个位置映射为对应的位置向量;以及生成重子模块,用于基于多个位置中的至少一个位置的位置向量生成轨迹向量。
可选地,语料为包括多个轨迹信息的轨迹信息集合,其中该装置还包括训练单元,用于按照如下方式对语料进行训练:将轨迹信息集合所包含的不同位置分别映射为作为初始向量的位置向量;以及利用轨迹信息集合所包含的轨迹信息对轨迹信息集合所包含的位置的位置向量进行更新,确定轨迹信息集合所包含的位置的位置向量。
可选地,训练单元还用于对于轨迹信息集合中所包含的一个位置,执行以下操作:从轨迹信息集合中选择包含该一个位置的第二轨迹信息;在第二轨迹信息中,确定在该一个位置之前和在该一个位置之后分别与该一个位置邻近的多个相邻位置;以及利用多个相邻位置的位置向量更新该一个位置的位置向量。
可选地,训练单元包括:第一处理模块,用于对多个相邻位置的位置向量求和,并将求和的结果作为该一个位置的位置向量。
可选地,预测子模块包括:产生重子模块,用于基于轨迹向量,利用分类器产生可能作为对象在下一时刻的位置的多个候选位置,并且产生多个候选位置的可信度;以及第一确定重子模块,用于基于多个候选位置的可信度,确定一个候选位置作为对象在下一时刻的位置。
可选地,预测子模块还包括:添加重子模块,用于将多个候选位置分别添加到在当前时刻的轨迹信息中从而形成分别包括多个候选位置的多个预测轨迹信息;统计重子模块,用于在轨迹信息集合中统计多个预测轨迹信息各自的频繁项集以及支持度;以及所述第一确定重子模块还用于比较多个候选位置的可信度以及对应的预测轨迹信息的支持度,确定一个候选位置作为对象在下一时刻的位置。
此处需要说明的是,上述获取单元802和预测单元804对应于实施例2中的步骤S502至步骤S504,两个模块与对应的步骤所实现的实例和应用场景相同,但不限于上述实施例2所公开的内容。需要说明的是,上述模块作为装置的一部分可以运行在实施例2提供的计算机终端30中。
实施例4
本申请的实施例可以提供一种计算机终端,该计算机终端可以是计算机终端群中的任意一个计算机终端设备。可选地,在本实施例中,上述计算机终端也可以替换为移动终端等终端设备。
可选地,在本实施例中,上述计算机终端可以位于计算机网络的多个网络设备中的至少一个网络设备。
在本实施例中,上述计算机终端可以执行一种确定位置信息的方法中以下步骤的程序代码:获得对象在当前时刻的轨迹信息,轨迹信息包括:对象在移动过程中的多个位置以及对象在多个位置发生的行为信息;以及基于对象在多个位置发生的行为信息,通过预测模型,预测得到对象在下一时刻的位置。
可选地,图9是根据本申请实施例的一种计算机终端的结构框图。如图9所示,该计算机终端A可以包括:一个或多个(图中仅示出一个)处理器902、存储器904、以及传输装置906。
其中,存储器可用于存储软件程序以及模块,如本申请实施例中的确定位置信息的方法和装置对应的程序指令/模块,处理器通过运行存储在存储器内的软件程序以及模块,从而执行各种功能应用以及数据处理,即实现上述的确定位置信息的方法。存储器可包括高速随机存储器,还可以包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器可进一步包括相对于处理器远程设置的存储器,这些远程存储器可以通过网络连接至终端A。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
处理器可以通过传输装置调用存储器存储的信息及应用程序,以执行下述步骤:获得对象在当前时刻的轨迹信息,轨迹信息包括:对象在移动过程中的多个位置以及对象在多个位置发生的行为信息;以及基于对象在多个位置发生的行为信息,通过预测模型,预测得到对象在下一时刻的位置。
可选的,上述处理器还可以执行如下步骤的程序代码:根据轨迹信息中的多个位置生成与轨迹信息对应的轨迹向量;以及根据轨迹向量预测得到对象在下一时刻的位置。
可选的,上述处理器还可以执行如下步骤的程序代码:利用至少包括多个位置的语料,将多个位置映射为对应的位置向量;以及基于多个位置中的至少一个位置的位置向量生成轨迹向量。
可选的,语料为包括多个轨迹信息的轨迹信息集合,上述处理器还可以执行如下步骤的程序代码:按照如下方式训练语料:将轨迹信息集合所包含的不同位置分别映射为作为初始向量的位置向量;以及利用轨迹信息集合所包含的轨迹信息对轨迹信息集合所包含的位置的位置向量进行更新,确定轨迹信息集合所包含的位置的位置向量。
可选的,上述处理器还可以执行如下步骤的程序代码:对于轨迹信息集合中所包含的一个位置,执行以下操作:从轨迹信息集合中选择包含该一个位置的第二轨迹信息;在第二轨迹信息中,确定在该一个位置之前和在该一个位置之后分别与该一个位置邻近的多个相邻位置;以及利用多个相邻位置的位置向量更新该一个位置的位置向量。
可选的,上述处理器还可以执行如下步骤的程序代码:对多个相邻位置的位置向量求和,并将求和的结果作为该一个位置的位置向量。
可选的,作为初始向量的位置向量为只有一个维度为1,而其他维度为0的向量,其中取值为1的维度是与作为初始向量的位置向量所对应的位置相关联的维度。
可选的,上述处理器还可以执行如下步骤的程序代码:将至少一个位置的位置向量求平均值,并将计算结果作为轨迹向量。可选的,至少一个位置为在当前时刻的轨迹信息所包括的全部位置。可选的,所述至少一个位置的位置向量的方向与在当前时刻的所述轨迹信息的所述多个位置的位置向量的主方向一致。
可选的,上述处理器还可以执行如下步骤的程序代码:预设对应于在当前时刻的轨迹信息的预设向量;并且将至少一个位置的位置向量与预设向量一起求平均值,并将计算结果作为轨迹向量,其中至少一个位置的位置向量的方向与在当前时刻的轨迹信息的多个位置信息的位置向量的主方向一致。
可选的,上述处理器还可以执行如下步骤的程序代码:基于轨迹向量,利用分类器产生可能作为对象在下一时刻的位置的多个候选位置,并且产生多个候选位置的可信度;以及基于多个候选位置的可信度,确定一个候选位置作为对象在下一时刻的位置。
可选的,上述处理器还可以执行如下步骤的程序代码:将多个候选位置分别添加到在当前时刻的轨迹信息中从而形成分别包括多个候选位置的多个预测轨迹信息;在轨迹信息集合中统计多个预测轨迹信息各自的频繁项集以及支持度;以及比较多个候选位置的可信度以及对应的预测轨迹信息的支持度,确定一个候选位置作为对象在下一时刻的位置。
在本实施例中,上述计算机终端可以执行另一种确定位置信息的方法中以下步骤的程序代码:获得对象在预定时间段内的多个位置以及对象在多个位置发生的行为信息;以及基于多个位置,通过预测模型,预测得到对象在下一时刻的位置。
处理器可以通过传输装置调用存储器存储的信息及应用程序,以执行下述步骤:获得对象在预定时间段内的多个位置以及对象在多个位置发生的行为信息;以及基于多个位置,通过预测模型,预测得到对象在下一时刻的位置。
可选的,上述处理器还可以执行如下步骤的程序代码:基于多个位置形成轨迹信息;以及根据轨迹信息,通过预测模型,预测得到对象在下一时刻的位置。
可选的,上述处理器还可以执行如下步骤的程序代码:在生成轨迹信息之前,将多个位置以及行为信息预处理为预定格式,其中预定格式包括对象信息、位置信息、时间信息以及行为信息。
可选的,上述处理器还可以执行如下步骤的程序代码:在生成轨迹信息后,从轨迹信息中去除高频出现的位置节点的位置信息。
可选的,上述处理器还可以执行如下步骤的程序代码:根据轨迹信息中的多个位置生成与轨迹信息对应的轨迹向量;以及根据轨迹向量预测得到对象在下一时刻的位置。
可选的,上述处理器还可以执行如下步骤的程序代码:利用至少包括多个位置的语料,将多个位置映射为对应的位置向量;以及基于多个位置中的至少一个位置的位置向量生成轨迹向量。
可选的,语料为包括多个轨迹信息的轨迹信息集合,上述处理器还可以执行如下步骤的程序代码:按照如下方式训练语料:将轨迹信息集合所包含的不同位置分别映射为作为初始向量的位置向量;以及利用轨迹信息集合所包含的轨迹信息对轨迹信息集合所包含的位置的位置向量进行更新,确定轨迹信息集合所包含的位置的位置向量。
可选的,上述处理器还可以执行如下步骤的程序代码:对于轨迹信息集合中所包含的一个位置,执行以下操作:从轨迹信息集合中选择包含该一个位置的第二轨迹信息;在第二轨迹信息中,确定在该一个位置之前和在该一个位置之后分别与该一个位置邻近的多个相邻位置;以及利用多个相邻位置的位置向量更新该一个位置的位置向量。
可选的,上述处理器还可以执行如下步骤的程序代码:对多个相邻位置的位置向量求和,并将求和的结果作为该一个位置的位置向量。
可选的,上述处理器还可以执行如下步骤的程序代码:基于轨迹向量,利用分类器产生可能作为对象在下一时刻的位置的多个候选位置,并且产生多个候选位置的可信度;以及基于多个候选位置的可信度,确定一个候选位置作为对象在下一时刻的位置。
可选的,上述处理器还可以执行如下步骤的程序代码:将多个候选位置分别添加到在当前时刻的轨迹信息中从而形成分别包括多个候选位置的多个预测轨迹信息;在轨迹信息集合中统计多个预测轨迹信息各自的频繁项集以及支持度;以及比较多个候选位置的可信度以及对应的预测轨迹信息的支持度,确定一个候选位置作为对象在下一时刻的位置。
采用本申请实施例,提供了一种确定位置信息方案。采用获得对象在当前时刻的轨迹信息;以及基于对象在多个位置发生的行为信息,通过预测模型,预测得到对象在下一时刻的位置的方式,通过向量化表示轨迹信息,并且使用轨迹向量进行行为预测,通过单个位置的位置向量和多个位置的轨迹向量,结合分类器和频繁项集预测对象在下一时刻的位置,能够从数据角度对轨迹信息进行分析,实现对轨迹信息的预测。由于轨迹信息包含有多个位置以及多个位置发生的行为信息,既能够唯一标识位置,又能包含位置的语义含义,丰富了轨迹信息所表达的内容,并且,根据多个位置发生的行为信息,利用预测模型进行预测,充分利用了轨迹信息中的丰富数据,避免人工进行分析总结存在的召回率低、准确率难评估等问题,从而简化预测流程,提升预测准确度,进而解决了如何根据轨迹序列进行行为预测、轨迹分析,并进行实时预警的技术问题。
本领域普通技术人员可以理解,图9所示的结构仅为示意,计算机终端也可以是智能手机(如Android手机、iOS手机等)、平板电脑、掌声电脑以及移动互联网设备(MobileInternet Devices,MID)、PAD等终端设备。图9其并不对上述电子装置的结构造成限定。例如,计算机终端9还可包括比图9中所示更多或者更少的组件(如网络接口、显示装置等),或者具有与图9所示不同的配置。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令终端设备相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:闪存盘、只读存储器(Read-Only Memory,ROM)、随机存取器(RandomAccess Memory,RAM)、磁盘或光盘等。
实施例5
本申请的实施例还提供了一种存储介质。可选地,在本实施例中,上述存储介质可以用于保存上述实施例2所提供的一种确定位置信息的方法所执行的程序代码。
可选地,在本实施例中,上述存储介质可以位于计算机网络中计算机终端群中的任意一个计算机终端中,或者位于移动终端群中的任意一个移动终端中。
可选地,在本实施例中,存储介质被设置为存储用于执行以下步骤的程序代码:获得对象在当前时刻的轨迹信息,轨迹信息包括:对象在移动过程中的多个位置以及对象在多个位置发生的行为信息;以及基于对象在多个位置发生的行为信息,通过预测模型,预测得到对象在下一时刻的位置。
存储介质还被设置为存储用于执行以下步骤的程序代码:根据轨迹信息中的多个位置生成与轨迹信息对应的轨迹向量;以及根据轨迹向量预测得到对象在下一时刻的位置。
存储介质还被设置为存储用于执行以下步骤的程序代码:利用至少包括多个位置的语料,将多个位置映射为对应的位置向量;以及基于多个位置中的至少一个位置的位置向量生成轨迹向量。
存储介质还被设置为存储用于执行以下步骤的程序代码:按照如下方式训练作为包括多个轨迹信息的轨迹信息集合的语料:将轨迹信息集合所包含的不同位置分别映射为作为初始向量的位置向量;以及利用轨迹信息集合所包含的轨迹信息对轨迹信息集合所包含的位置的位置向量进行更新,确定轨迹信息集合所包含的位置的位置向量。具体的,作为初始向量的位置向量为只有一个维度为1,而其他维度为0的向量,其中取值为1的维度是与作为初始向量的位置向量所对应的位置相关联的维度。
存储介质还被设置为存储用于执行以下步骤的程序代码:对于轨迹信息集合中所包含的一个位置,执行以下操作:从轨迹信息集合中选择包含该一个位置的第二轨迹信息;在第二轨迹信息中,确定在该一个位置之前和在该一个位置之后分别与该一个位置邻近的多个相邻位置;以及利用多个相邻位置的位置向量更新该一个位置的位置向量。
存储介质还被设置为存储用于执行以下步骤的程序代码:对多个相邻位置的位置向量求和,并将求和的结果作为该一个位置的位置向量。
存储介质还被设置为存储用于执行以下步骤的程序代码:生成轨迹向量的操作包括:将至少一个位置的位置向量求平均值,并将计算结果作为轨迹向量。具体的,至少一个位置为在当前时刻的轨迹信息所包括的全部位置。或具体的,所述至少一个位置的位置向量的方向与在当前时刻的所述轨迹信息的所述多个位置的位置向量的主方向一致。
存储介质还被设置为存储用于执行以下步骤的程序代码:预设对应于在当前时刻的轨迹信息的预设向量;并且将至少一个位置的位置向量与预设向量一起求平均值,并将计算结果作为轨迹向量,其中至少一个位置的位置向量的方向与在当前时刻的轨迹信息的多个位置信息的位置向量的主方向一致。
存储介质还被设置为存储用于执行以下步骤的程序代码:基于轨迹向量,利用分类器产生可能作为对象在下一时刻的位置的多个候选位置,并且产生多个候选位置的可信度;以及基于多个候选位置的可信度,确定一个候选位置作为对象在下一时刻的位置。
存储介质还被设置为存储用于执行以下步骤的程序代码:将多个候选位置分别添加到在当前时刻的轨迹信息中从而形成分别包括多个候选位置的多个预测轨迹信息;在轨迹信息集合中统计多个预测轨迹信息各自的频繁项集以及支持度;以及比较多个候选位置的可信度以及对应的预测轨迹信息的支持度,确定一个候选位置作为对象在下一时刻的位置。
可选地,在本实施例中,上述存储介质可以用于保存上述实施例2所提供的另一种确定位置信息的方法所执行的程序代码。
可选地,在本实施例中,存储介质被设置为存储用于执行以下步骤的程序代码:获得对象在预定时间段内的多个位置以及对象在多个位置发生的行为信息;以及基于多个位置,通过预测模型,预测得到对象在下一时刻的位置。
存储介质还被设置为存储用于执行以下步骤的程序代码:基于多个位置形成轨迹信息;以及根据轨迹信息,通过预测模型,预测得到对象在下一时刻的位置。
存储介质还被设置为存储用于执行以下步骤的程序代码:在生成轨迹信息之前,将多个位置以及行为信息预处理为预定格式,其中预定格式包括对象信息、位置信息、时间信息以及行为信息。
存储介质还被设置为存储用于执行以下步骤的程序代码:在生成轨迹信息后,从轨迹信息中去除高频出现的位置节点的位置信息。
存储介质还被设置为存储用于执行以下步骤的程序代码:根据轨迹信息中的多个位置生成与轨迹信息对应的轨迹向量;以及根据轨迹向量预测得到对象在下一时刻的位置。
存储介质还被设置为存储用于执行以下步骤的程序代码:利用至少包括多个位置的语料,将多个位置映射为对应的位置向量;以及基于多个位置中的至少一个位置的位置向量生成轨迹向量。
存储介质还被设置为存储用于执行以下步骤的程序代码:按照如下方式训练语料,所述语料为包括多个轨迹信息的轨迹信息集合:将轨迹信息集合所包含的不同位置分别映射为作为初始向量的位置向量;以及利用轨迹信息集合所包含的轨迹信息对轨迹信息集合所包含的位置的位置向量进行更新,确定轨迹信息集合所包含的位置的位置向量。
存储介质还被设置为存储用于执行以下步骤的程序代码:对于轨迹信息集合中所包含的一个位置,执行以下操作:从轨迹信息集合中选择包含该一个位置的第二轨迹信息;在第二轨迹信息中,确定在该一个位置之前和在该一个位置之后分别与该一个位置邻近的多个相邻位置;以及利用多个相邻位置的位置向量更新该一个位置的位置向量。
存储介质还被设置为存储用于执行以下步骤的程序代码:对多个相邻位置的位置向量求和,并将求和的结果作为该一个位置的位置向量。
存储介质还被设置为存储用于执行以下步骤的程序代码:基于轨迹向量,利用分类器产生可能作为对象在下一时刻的位置的多个候选位置,并且产生多个候选位置的可信度;以及基于多个候选位置的可信度,确定一个候选位置作为对象在下一时刻的位置。
存储介质还被设置为存储用于执行以下步骤的程序代码:将多个候选位置分别添加到在当前时刻的轨迹信息中从而形成分别包括多个候选位置的多个预测轨迹信息;在轨迹信息集合中统计多个预测轨迹信息各自的频繁项集以及支持度;以及比较多个候选位置的可信度以及对应的预测轨迹信息的支持度,确定一个候选位置作为对象在下一时刻的位置。
实施例6
下面,在实施例6中,将详细解释本申请技术方案的各个细节,为了便于理解本实施例的技术方案,本实例分为以下几个部分进行说明:
(一)位置信息确定系统
附图10示出了根据本申请实施例6的位置信息确定系统的示意图。如附图10所示,实施例6所述的位置信息确定系统包括轨迹向量生成装置100和位置预测装置200。
其中,轨迹向量生成装置100用于接收位置数据,并根据所接收的位置数据生成向量轨迹,位置预测装置200用于接收从轨迹向量生成装置输出的轨迹向量,并根据所述轨迹向量对可能的下一个位置进行预测,并输出预测位置。在下文中,将详细对所述轨迹向量生成装置100以及位置预测装置200做出详细说明。
虽然在图10中示出的轨迹向量生成装置100和位置预测装置200是作为分离部件说明的装置,但是它们也可以是或者也可以不是物理上分开的。在本实施例6中,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。
(二)轨迹向量生成装置
附图11示出了根据本申请实施例6所述的轨迹向量生成装置100的示意图。
如附图11所示,所述轨迹向量生成装置100包括:数据预处理单元101、序列生成单元102、位置向量映射单元103、轨迹向量生成单元104以及语料库105。尽管在图11中数据预处理单元101、序列生成单元102、位置向量映射单元103、轨迹向量生成单元104以及语料库105是包括在轨迹向量生成装置100中的,但是上述各个组件也可以是彼此分离的。例如语料库105也可以在轨迹向量生成装置100之外。
<数据预处理单元101>
所述数据预处理单元101用于通过有线或无线的方式接收位置数据,所述位置数据包括但不限于来自不同人员的电围数据(即手机定位数据)、火车出行数据以及飞机出行数据等。并且,所述数据预处理单元101还将接收到的位置数据统一预处理为预定格式的数据。
例如,所述数据预处理单元101设置为将接收到的定位数据预处理为由人员ID(who)、行为时间(when)、行为发生位置(where)、行为(what)所定义的格式的数据。为了便于说明,下面表2中示出了关于人员U1的预处理后的数据,表3示出了关于人员U2的预处理后的数据。
表2
人员ID | 行为时间 | 行为发生位置 | 行为 |
U1 | 2017-01-01 | 北京 | 住所 |
U1 | 2017-01-11 | 长春 | 出差 |
U1 | 2017-02-15 | 北京 | 住所 |
U1 | 2017-03-01 | 深圳 | 出差 |
U1 | 2017-03-06 | 广州 | 出差 |
U1 | 2017-03-13 | 上海 | 出差 |
U1 | 2017-03-18 | 苏州 | 出差 |
U1 | 2017-03-20 | 杭州 | 出差 |
U1 | 2017-03-23 | 北京 | 住所 |
U1 | 2017-04-06 | 桂林 | 度假 |
U1 | 2017-04-15 | 北京 | 住所 |
U1 | 2017-05-04 | 苏州 | 出差 |
U1 | 2017-05-07 | 杭州 | 出差 |
U1 | 2017-05-12 | 武汉 | 出差 |
U1 | 2017-05-15 | 长沙 | 出差 |
U1 | 2017-05-20 | 北京 | 住所 |
表3
人员ID | 行为时间 | 行为发生位置 | 行为 |
U2 | 2017-01-01 | 北京 | 住所 |
U2 | 2017-01-7 | 哈尔滨 | 出差 |
U2 | 2017-01-18 | 北京 | 住所 |
U2 | 2017-03-18 | 广州 | 出差 |
U2 | 2017-03-27 | 北京 | 住所 |
U2 | 2017-06-27 | 苏州 | 出差 |
U2 | 2017-06-29 | 杭州 | 出差 |
根据表2所示,预处理后的数据按照时间顺序示出了U1在2017年上半年的位置数据。其中,U1的住所地在北京,于2017年01月11日前往长春出差并于2017年02月18日返回北京。然后U1于2017年03月01日至2017年03月23日期间先后前往深圳、广州、上海、苏州以及杭州出差,直到2017年3月23日返回北京。然后U1于2017年04月05日前往桂林度假、直到2017年04月15日返回北京。然后U1于2017年05月04日至2017年05月20日期间先后前往苏州、杭州、武汉以及长沙出差,并于2017年05月20日返回北京。
与表2类似的,根据表3所示,预处理后的数据按照时间顺序示出了U2在2017年上半年的位置数据。
此外,本实施例中,行为发生位置既可以如表2和表3所示的那样用具体的位置名称表示,也可以用行政区划编码表示(例如下面表4中列出了表2和表3中各个位置的行政区划编码),也可以用基于经纬度生成的geohash行政区划。只要能够清楚地表示行为发生位置的表示方式都可以适用于本申请。
表4
行为发生位置 | 行政区划编码 |
北京 | 110000 |
长春 | 220100 |
深圳 | 440300 |
广州 | 440100 |
上海 | 310000 |
苏州 | 320500 |
杭州 | 330100 |
桂林 | 450300 |
武汉 | 420100 |
长沙 | 430121 |
哈尔滨 | 230100 |
此外,考虑到火车飞机等出行行为有明显的跨省市的特点,并且行为较稀,其行为间隔可能根据不同的出差、旅游、探亲等语义有长短不同。而电围事件(或手机定位事件)则描述了每时刻的行为变化,邻近行为地理位置变化范围较小,行为密集,并且具有很大的偶然性。在后续训练中由于行为的稀疏程度不一致,考虑到的行为上下文窗口大小也不一样,所以可选地,这两种行为数据可以分开处理。
在完成位置数据的预处理之后,数据预处理单元101将按照所述预定格式预处理的数据输出至所述序列生成单元102。
<序列生成单元102>
所述序列生成单元102用于从数据预处理单元101接收所述预定格式的数据,并且将所述预定格式的数据转换为轨迹序列。
例如,表2和表3中的数据可以分别根据时间顺序排列为下面表达式形式的序列:
U1:北京->长春->北京->深圳->广州->上海->苏州->杭州->北京->桂林->北京->苏州->杭州->武汉->长沙->北京;
U2:北京->哈尔滨->北京->广州->北京->苏州->杭州。
从而形成了关于U1和U2的轨迹序列。
此外,也可以利用所述预定格式中的时间数据和行为数据来形成更加详细的轨迹序列,例如的轨迹序列可采用如下方式表示:
U1:(北京,住所)->周->日->日->日->(长春,出差)->月->日->日->日->日->(北京,住所)->周->周->(深圳,出差)->日->日->日->日->日->(广州,出差)->周->(上海,出差)->日->日->日->日->日->(苏州,出差)->日->日->(杭州,出差)->日->日->日->(北京,住所)->周->周->(桂林,度假)->周->日->日->(北京,住所)->周->周->日->日->日->日->日->(苏州,出差)->日->日->日->(杭州,出差)->日->日->日->日->日->(武汉,出差)->日->日->日->(长沙,出差)->日->日->日->日->日->(北京,住所);
U2:(北京,住所)->日->日->日->日->日->日->(哈尔滨,出差)->周->日->日->日->日->(北京,住所)->月->月->(广州,出差)->周->日->日->(北京,住所)->月->月->月->(苏州,出差)->日->日->(杭州,出差)。
如上所示,两个行为之间间隔一周和间隔一月代表不同含义,如果把持续长时间无行为(如一日、一周、一月、一年)作为一种特殊轨迹行为(休止符)加入轨迹序列。就可以更好的表示轨迹的连续性。在近邻两个行为间增加“空行为”,“空行为”可根据时长分为多种,如“一日”、“一周”,“一月”,“一年”等,具体可根据实际数据统计情况决定。
例如,在关于U1的序列中,由于U1在2017年01月01日在北京而2017年01月11日到达长春,期间相隔1周又3天,因此关于U1在北京与长春之间的序列数据可以表示为“(北京,住所)->周->日->日->日->(长春,出差)”,以此类推。
此外,通过“(位置,行为)”的形式,不仅可以在序列中表示位置,也可以表示在该位置的行为,从而丰富了轨迹序列所表达的内容。
可选地,在不同的轨迹序列中,有一些非常高频的位置,对与区分不同类型的轨迹可能没有意义,可根据不同应用决定是否需要去掉这些高频行为,从而避免这些高频行为对后续的模型训练的影响。例如,假设从a地出发去所有的其他位置,都必须要在b地中转,所以在对a地的所有轨迹序列进行训练分类时,就可以忽略高频位置“b”的影响,从而可以考虑在轨迹序列中删除该“b”位置。
如上所述,所述序列生成单元102将从数据预处理单元101接收所述预定格式的数据转换为轨迹序列,并进一步将所述生成的轨迹序列传输至位置向量映射单元103。
<位置向量映射单元103>
位置向量映射单元103用于从序列生成单元102接收由序列生成单元102所生成的轨迹序列,并且位置向量映射单元103与语料库105进行交互。从而位置向量映射单元103利用从序列生成单元102所生成的轨迹序列对语料库105中的语料进行训练,此外还利用语料库105将所述轨迹序列中的每一个位置映射成K维的位置向量(K大于等于1)。
为了便于解释位置向量映射单元103,下文针对关于U2的轨迹序列“U2:北京->哈尔滨->北京->广州->北京->苏州->杭州”说明所述位置向量映射单元103的操作。但是本领域技术人员应当知晓,根据下文所说明的操作也同样适用于上文所述的关于U1的轨迹序列“北京->长春->北京->深圳->广州->上海->苏州->杭州->北京->桂林->北京->苏州->杭州->武汉->长沙->北京”。
对于包含时间和行为的轨迹序列“U1:(北京,住所)->周->日->日->日->(长春,出差)->月->日->日->日->日->(北京,住所)->周->周->(深圳,出差)->日->日->日->日->日->(广州,出差)->周->(上海,出差)->日->日->日->日->日->(苏州,出差)->日->日->(杭州,出差)->日->日->日->(北京,住所)->周->周->(桂林,度假)->周->日->日->(北京,住所)->周->周->日->日->日->日->日->(苏州,出差)->日->日->日->(杭州,出差)->日->日->日->日->日->(武汉,出差)->日->日->日->(长沙,出差)->日->日->日->日->日->(北京,住所)”和“(北京,住所)->日->日->日->日->日->日->(哈尔滨,出差)->周->日->日->日->日->(北京,住所)->月->月->(广州,出差)->周->日->日->(北京,住所)->月->月->月->(苏州,出差)->日->日->(杭州,出差)”,本领域技术人员可以通过对本实施例的方法进行合理地变形从而将其中的位置映射为位置向量,或者将位置与行为的组合映射为预定向量或将位置、行为以及时间的结合映射为预定向量。
如上所述,位置向量映射单元103从序列生成单元102接收关于U2的轨迹序列“U2:北京->哈尔滨->北京->广州->北京->苏州->杭州”。然后,位置向量映射单元103利用该轨迹序列训练语料库105,并且利用语料库105获得该轨迹序列中的每一个位置的位置向量。
图12示出了位置向量映射单元103对语料库105进行训练的方法流程。
在步骤S1202,位置向量映射单元103将语料库105所包含的所有位置映射为初始向量。
其中,所述语料库105为包含有多个位置语料的语料库,作为一个示例性的实例,所述位置语料可以为先前所采集的大量的轨迹序列。例如,下面表5示出了一个由所采集的轨迹序列所构成的语料库105的实例。从而,所述语料库中包含有多个位置的信息。
表5语料库
此外,表5中所示的语料库仅仅是作为实例性的说明,除了以上轨迹序列的形式之外,也可以将实际出现过的语言描述作为语料使用,例如“张先生于2017年4月13日从苏州出发前往上海,后来又于2017年5月1日离开上海飞往北京”。位置向量映射单元103可以从这样的描述中提取出“苏州->上海->北京”这样的轨迹序列,以用于训练。
假定语料库105中所收集的所有位置的数目为K个。为了便于说明,本实施例假定K=15,但是本领域技术人员应当知晓,K的大小是根据实际采集到的位置数据中的位置的数目确定的,而不仅仅限于15个(实际上可能远大于这个数量)。基于语料库中所收集的位置的数量K,位置向量映射单元103将语料库中的每一个位置,映射为如下面表6所示的K维初始向量。
表6语料库中语料的初始向量
序号 | 位置 | K维向量 |
1 | 哈尔滨 | θ1=100000000000000 |
2 | 长春 | θ2=010000000000000 |
3 | 北京 | θ3=001000000000000 |
4 | 德州 | θ4=000100000000000 |
5 | 上海 | θ5=000010000000000 |
6 | 苏州 | θ6=000001000000000 |
7 | 杭州 | θ7=000000100000000 |
8 | 成都 | θ8=000000010000000 |
9 | 桂林 | θ9=000000001000000 |
10 | 南宁 | θ10=000000000100000 |
11 | 北海 | θ11=000000000010000 |
12 | 深圳 | θ12=000000000001000 |
13 | 广州 | θ13=000000000000100 |
14 | 武汉 | θ14=000000000000010 |
15 | 长沙 | θ15=000000000000001 |
上面表6示出了语料库105中所收集的K个位置与K维向量之间的对应关系。如表6所示,所述的K维向量中只有1个维度为“1”,其余各维度皆为“0”。其中,设置为“1”的维度与具体的位置相对应。例如表示“哈尔滨”的K维向量中的第一维度为“1”,表示“长春”的K维向量中的第二维度为“1”,以此类推。
通过这样的方式,位置向量映射单元103将语料库105中的所包含的位置分别映射为初始向量。
通过上述操作生成的K维初始向量存在以下问题,即任意位置之间的向量都是孤立的,彼此之间没有联系,因此很难基于这样的位置向量来预测轨迹序列中的下一个位置。
因此,在步骤S1204,所述位置向量映射单元103基于映射模型,利用语料库中的语料,对语料库中每个位置对应的位置向量进行更新。从而,利用深度学习的思想,对语料库中的大量语料进行训练,将语料库中所包含的位置的K维初始向量更新为最终的位置向量。
图13示出了本实施例所使用的用于对语料进行训练的映射模型的示意图。其中,所述映射模型包括:输入层、映射层以及输出层。其中,目标位置w(t)是一个序列串中间的位置向量,其拥有的上下文为前后各m个位置:w(t-m)、……、w(t-1)、w(t+1)、……、w(t+m)。在训练过程中,在输入层分别将w(t-m)、……、w(t-1)、w(t+1)、……、w(t+m)输入至输入1、……、输入m、输入m+1、……、输入2m。然后在映射层,对向量w(t-m)、……、w(t-1)、w(t+1)、……、w(t+m)求和,并且在输出层将计算结果来更新位置向量w(t)。
对于本实例,具体过程如下面表7所示。假设m=2,因此可以利用w(t-2)、w(t-1)、w(t+1)以及w(t+2)来对目标向量w(t)进行更新。
针对表6所示的语料库105中的轨迹序列1(北海->桂林->广州->深圳->上海)可以利用北海、桂林、深圳、上海的向量对广州的向量进行更新,即:
θ13=θ11+θ9+θ12+θ5
=(000000000010000)+(000000001000000)+(000000000001000)+(000010000000000)
=(000010001011000)
由于语料库105中的轨迹序列2(北京->上海->深圳->广州)所包括的位置的数目不够计算,因此跳到轨迹序列3
针对轨迹序列3(北京->上海->深圳->广州->南宁->北海),首先利用北京、上海、广州和南宁的向量对深圳的向量进行更新,即:
θ12=θ3+θ5+θ13+θ10
=(001000000000000)+(000010000000000)+(000010001011000)+(000000000100000)
=(001020001111000)
然后,利用上海、深圳、南宁、北海的向量继续对广州的向量进行更新,即
θ13=θ5+θ12+θ10+θ11
=(000010000000000)+(001020001111000)+(000000000100000)+(000000000010000)
=(001030001221000)
由于轨迹4(北京->上海->深圳)所包括的位置的数目不够计算,因此跳到轨迹序列5。
针对轨迹5(北京->上海->广州->深圳->桂林->北海),首先利用北京、上海、深圳和桂林的向量对广州的向量进行更新,即:
θ13=θ3+θ5+θ12+θ9
=(001000000000000)+(000010000000000)+(001020001111000)+(000000001000000)
=(002030002111000)
然后利用上海、广州、桂林和北海的向量对深圳的向量进行更新,即:
θ12=θ5+θ13+θ9+θ11
=(000010000000000)+(002030002111000)+(000000001000000)+(000000000010000)
=(002040003121000)
以此类推,利用语料库105中的所有语料提取的轨迹序列,对语料库中的位置所对应的向量进行更新。
表7
然后在步骤S1206,每当位置向量映射单元103从序列生成单元102接收新的轨迹序列时,就用新的轨迹序列基于该映射模型对对语料库105所包含的位置所对应的位置向量进行更新。
例如,位置向量映射单元103在接收轨迹序列“U2:北京->哈尔滨->北京->广州->北京->苏州->杭州”后,利用该轨迹序列对语料库105中对应于“北京”和“广州”的位置向量进行更新。从而得到了语料库105所包含的各个位置最终的位置向量。
训练好的位置向量不仅能唯一标识一个位置,而且能表示出位置的语义含义,比如那些位置经常会有前后关系。为了可视化展示,图14中示出了语料库中15个位置的位置向量分别从K维降维到2维向量空间中(例如,利用T-SNE算法进行降维)的示图,我们可以看出,语义较近的位置向量会更接近。
此外,图15示出了根据另一个包含更多位置的语料库中,基于降维后的位置向量的,每个出发地和目的地的行为向量的示意图。其中,图中的小方框标识的行为向量在下面表8中显示,我们可以看出,语义较近的位置向量会更接近。
表8降维后的行为向量示例
行为名称 | 行为向量 |
上海-苏州 | (-10.5489609043,2.06380957108) |
苏州-上海虹桥 | (-10.5036444997,2.02106782459) |
吐鲁番-喀什 | (3.66495783547,-5.31660730789) |
广州-乌鲁木齐 | (-0.903410713969,1.60578128733) |
从而,位置向量映射单元103可以利用语料库105将接收到的轨迹序列“U2:北京->哈尔滨->北京->广州->北京->苏州->杭州”中的各个位置映射为K维位置向量。
图16示出了位置向量映射单元103将轨迹序列中的位置映射为位置向量的流程图。
在步骤S1602中,位置向量映射单元103针对轨迹序列中的每一个位置,在语料库105中搜索到对应的位置。例如针对轨迹序列“U2:北京->哈尔滨->北京->广州->北京->苏州->杭州”,位置向量映射单元103在语料库105中搜索“北京”、“哈尔滨”、“广州”、“苏州”和“杭州”。
在步骤S1604中,位置向量映射单元103利用语料库中的位置向量,作为轨迹序列中的对应位置的位置向量。例如,参考上面的表6,表示北京的K维向量为θ3,表示哈尔滨的K维向量为θ1,表示广州的K维向量为θ13,表示苏州的K维向量为θ6,表示杭州的K维向量为θ7。从而,位置向量映射单元103分别将语料库105中的位置向量θ3、θ1、θ13、θ6、θ7作为与轨迹序列“U2:北京->哈尔滨->北京->广州->北京->苏州->杭州”中的各个位置对应的K维位置向量,从而完成映射。
通过该方式,位置向量映射单元103对语料库105中的语料进行训练,并且根据语料库105中更新的各个位置的位置向量将所接收到的关于U2的轨迹序列“U2:北京->哈尔滨->北京->广州->北京->苏州->杭州”中的每一个位置映射到K维向量空间,即(θ3,θ1,θ3,θ13,θ3,θ6,θ7)。然后,位置向量映射单元103将由表示位置的位置向量构成的轨迹序列发送到轨迹向量生成单元104。
<轨迹向量生成单元104>
参见图11,轨迹向量生成单元104用于从位置映射向量单元103接收由表示位置的位置向量构成的轨迹序列,并且根据接收的轨迹序列中的位置向量,生成表示所述轨迹的轨迹向量。
具体地,例如轨迹向量生成单元104从位置映射单元103接收关于U2的由表示位置的位置向量构成的轨迹序列(θ3,θ1,θ3,θ13,θ3,θ6,θ7),其表示轨迹序列“U2:北京->哈尔滨->北京->广州->北京->苏州->杭州”。因此轨迹向量生成单元104根据接收到的位置向量θ3、θ1、θ3、θ13、θ3、θ6以及θ7生成轨迹向量W。
例如,轨迹向量生成单元104可以通过预定的函数F()将上述位置向量映射为轨迹向量W,即:
W=F(θ3,θ1,θ3,θ13,θ3,θ6,θ7)。
根据位置向量生成单元103的描述可知,所生成的每一个位置向量都是根据上下文的m个位置向量求和不断更新得到的,因此作为函数F()的一个实例,是对序列中的所有位置向量求平均值。
即,W=avg(θ3,θ1,θ3,θ13,θ3,θ6,θ7)
=(x1,x2,x3,……,xK)。
此外,可选地,也可以从U2的轨迹序列的多个位置中选择体现轨迹向量的主要方向的位置(譬如该位置的位置向量的方向与轨迹序列中多个位置的位置向量的主方向一致)来形成该轨迹序列的轨迹向量。例如,在U2的轨迹序列的位置中,我们认为位置“哈尔滨”与其他位置的关联性较小,从而不能体现轨迹序列的轨迹向量,因此将该位置去除。而仅利用位置北京、广州、苏州和杭州的向量来计算轨迹序列W,例如:
W=avg(θ3,θ3,θ13,θ3,θ6,θ7)
=(x1,x2,x3,……,xK)。
并且在此基础上,可以为每一个轨迹序列预先设置一个轨迹向量Vid,从而利用该轨迹向量Vid与轨迹序列中的体现轨迹向量的主要方向的位置来生成该轨迹序列。例如:
W=avg(θ3,θ3,θ13,θ3,θ6,θ7,Vid)
=(x1,x2,x3,……,xK)。
然后,轨迹向量生成单元104将生成的轨迹向量发送至位置预测装置200。需要注意的是,尽管本是实例中采用了基于多个位置向量求平均值的方式来得到轨迹向量W,但是这仅仅是用于实例性的说明所述轨迹向量生成单元104的操作。本申请的保护范围不限于此,本领域技术人员可以采用其他的方式利用位置向量生成轨迹向量。
(三)位置预测装置
如图10所示,位置预测装置200从轨迹向量生成装置100接收轨迹向量,并且根据所接收的轨迹向量产生作为所述轨迹序列的下一个位置的预测位置。
图17示出了根据本实施例的位置预测装置200的示意图。如图17所示,所述位置预测装置200包括分类器单元201以及判定单元202。其中,所述分类器单元201从所述轨迹向量生成装置100接收轨迹向量,并且根据所述轨迹向量产生可能作为该轨迹序列的下一个位置的多个候选位置以及分别与多个候选位置中的每一个对应的可信度,并将其发送给判定单元202。判定单元202从分配器单元201接收所述候选位置以及相应的可信度,并最后产生作为所述轨迹序列的下一个位置的预测位置。
<分类器单元>
分类器单元201用于从轨迹向量产生单元接收轨迹向量并根据该轨迹向量产生可能作为所述轨迹序列的下一个位置的多个候选位置以及对应的可信度。
下文描述了分类器单元201的具体操作。对于接收的轨迹向量W,针对m个候选位置,本实施例所使用的分类器单元201所执行的分类函数如下所示:
其中,P(i)表示第i个候选位置的概率,即可信度,其中i为1到m之间的整数。
yi和yj分别表示第i个和第j个候选位置的位置向量,其中j也为1到m之间的整数。
对于候选位置,可以选择语料库中除U2的轨迹序列中最后一个位置杭州(其位置向量为θ7)之外的所有位置作为候选位置。
结合上述公式,
候选位置哈尔滨的概率(即可信度)为:
候选位置长春的概率(即可信度)为:
以此类推,可以分别根据北京、德州、上海、苏州、成都、桂林、南宁、北海、深圳、广州、武汉和长沙的位置向量θ3到θ6和θ8到θ15求出各个位置的概率(即可信度)。
此外,可选地,分类器单元201可以根据对语料库的统计,先从语料库中粗选出一定范围的候选位置,例如北京、苏州、上海、深圳和广州,然后在该候选位置的范围内运用上述公式计算各个候选位置的可信度。
如上所述,所述分类器单元201产生得到各候选位置及其可信度。并将各候选位置以及可信度发送至判定单元202。
<判定单元>
参考图17所示,本实施例的判定单元202从分类器单元201接收各个候选位置以及与之对应的可信度。其中,图18示出了判定单元202的操作流程。
参见图18所示,在步骤S1802,所述判定单元202首先将各个候选位置添加到轨迹序列中从而形成多个预测轨迹,例如针对轨迹序列U2:北京->哈尔滨->北京->广州->北京->苏州->杭州,分别添加候选位置哈尔滨、长春、……、苏州、成都、桂林、……长沙,即语料库中除了杭州之外的其他14个位置,从而生成如下的预测轨迹:
预测轨迹1:北京->哈尔滨->北京->广州->北京->苏州->杭州->哈尔滨;
预测轨迹2:北京->哈尔滨->北京->广州->北京->苏州->杭州->长春;
预测轨迹3:北京->哈尔滨->北京->广州->北京->苏州->杭州->北京;
预测轨迹4:北京->哈尔滨->北京->广州->北京->苏州->杭州->德州;
……
预测轨迹14:北京->哈尔滨->北京->广州->北京->苏州->杭州->长沙。
然后,在步骤S1804,所述判定单元202在各个语料库中统计各个预测轨迹的频繁项集和支持度。
所谓频繁项集,是指在一系列集合中同时出现频率高的元素的集合。所谓支持度,就是包含频繁项集的集合的数目。参见如下面表9所示,以预测轨迹1(北京->哈尔滨->北京->广州->北京->苏州->杭州->哈尔滨)为例,所谓统计预测轨迹1的频繁项集,就是在语料库中统计包含预测轨迹1的轨迹。
表9
表9示出了语料库中包含预测轨迹1的各个轨迹,判定单元202在语料库中找出包含预测轨迹3的轨迹以便统计预测轨迹1的频繁项集并且统计包含预测轨迹1的轨迹的数量作为预测轨迹1的频繁项集的支持度。
以此类推,判定单元202在语料库中分别统计出预测轨迹2至14的频繁项集以及支持度。并且确定与支持度最高的预测轨迹对应的候选位置。
最后,在步骤S1806,判定单元根据各个候选位置的可信度以及支持度的比较,最终确定作为关于U2的轨迹序列中的下一个位置的预测位置。
此外,可选地,当分类器单元201根据对语料库的统计,从语料库中粗选出一定范围的候选位置,例如北京、苏州、上海、深圳和广州时。所述判定单元202可以在该范围内针对北京、苏州、上海、深圳和广州统计其对应的频繁项集以及支持度,并且根据可信度和支持度确定预测位置。
此外,尽管本实施中是根据可信度和支持度确定预测位置,但是可选地,也可以仅仅依据各个候选位置的可信度来确定最后的预测位置。
上述本申请实施例序号仅仅为了描述,不代表实施例的优劣。
在本申请的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的技术内容,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述仅是本申请的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本申请原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本申请的保护范围。
Claims (24)
1.一种确定位置信息的方法,其特征在于,包括:
获得对象在当前时刻的轨迹信息,所述轨迹信息包括:所述对象在移动过程中的多个位置以及所述对象在所述多个位置发生的行为信息;以及
基于所述对象在所述多个位置发生的行为信息,通过预测模型,预测得到所述对象在下一时刻的位置;
其中,预测得到所述对象在下一时刻的位置还包括:根据所述轨迹信息中的所述多个位置生成与所述轨迹信息对应的轨迹向量;基于所述轨迹向量,利用分类器产生可能作为所述对象在下一时刻的位置的多个候选位置,并且产生所述多个候选位置的可信度;以及将多个候选位置分别添加到在当前时刻的所述轨迹信息中从而形成分别包括所述多个候选位置的多个预测轨迹信息;在所述轨迹信息集合中统计所述多个预测轨迹信息各自的频繁项集以及支持度;以及比较所述多个候选位置的可信度以及对应的预测轨迹信息的支持度,确定一个所述候选位置作为所述对象在下一时刻的位置。
2.根据权利要求1所述的方法,其特征在于,生成所述轨迹向量的操作包括:
利用至少包括所述多个位置的语料,将所述多个位置映射为对应的位置向量;以及
基于所述多个位置中的至少一个位置的位置向量生成所述轨迹向量。
3.根据权利要求2所述的方法,其特征在于,所述语料为包括多个轨迹信息的轨迹信息集合,其中所述语料按照如下方式进行训练:
将所述轨迹信息集合所包含的不同位置分别映射为作为初始向量的位置向量;以及
利用所述轨迹信息集合所包含的轨迹信息对所述轨迹信息集合所包含的位置的位置向量进行更新,确定所述轨迹信息集合所包含的位置的位置向量。
4.根据权利要求3所述的方法,其特征在于,对所述位置向量进行更新的操作包括:
对于所述轨迹信息集合中所包含的一个位置,执行以下操作:
从所述轨迹信息集合中选择包含所述一个位置的第二轨迹信息;
在所述第二轨迹信息中,确定在所述一个位置之前和在所述一个位置之后分别与所述一个位置邻近的多个相邻位置;以及
利用所述多个相邻位置的位置向量更新所述一个位置的位置向量。
5.根据权利要求4所述的方法,其特征在于,利用所述多个相邻位置的位置向量更新所述一个位置的位置向量的操作包括:
对所述多个相邻位置的位置向量求和,并将求和的结果作为所述一个位置的位置向量。
6.根据权利要求3所述的方法,其特征在于,所述作为初始向量的位置向量为只有一个维度为1,而其他维度为0的向量,其中取值为1的维度是与所述作为初始向量的位置向量所对应的位置相关联的维度。
7.根据权利要求2或3所述的方法,其特征在于,生成所述轨迹向量的操作包括:
将所述至少一个位置的位置向量求平均值,并将计算结果作为所述轨迹向量。
8.根据权利要求7所述的方法,其特征在于,所述至少一个位置为在当前时刻的所述轨迹信息所包括的全部位置。
9.根据权利要求7所述的方法,其特征在于,所述至少一个位置的位置向量的方向与在当前时刻的所述轨迹信息的所述多个位置的位置向量的主方向一致。
10.根据权利要求2或3所述的方法,其特征在于,形成所述轨迹向量的操作包括:
预设对应于在当前时刻的所述轨迹信息的预设向量;并且
将所述至少一个位置的位置向量与所述预设向量一起求平均值,并将计算结果作为所述轨迹向量,其中
所述至少一个位置的位置向量的方向与在当前时刻的所述轨迹信息的所述多个位置的位置向量的主方向一致。
11.一种确定位置信息的方法,其特征在于,包括:
获得对象在预定时间段内的多个位置以及所述对象在所述多个位置发生的行为信息;以及
基于所述多个位置,通过预测模型,预测得到所述对象在下一时刻的位置;
其中,预测得到所述对象在下一时刻的位置的操作包括:基于所述多个位置形成轨迹信息;以及基于所述轨迹向量,利用分类器产生可能作为所述对象在下一时刻的位置的多个候选位置,并且产生所述多个候选位置的可信度;以及将所述多个候选位置分别添加到在当前时刻的所述轨迹信息中从而形成分别包括所述多个候选位置的多个预测轨迹信息;在所述轨迹信息集合中统计所述多个预测轨迹信息各自的频繁项集以及支持度;以及比较所述多个候选位置的可信度以及对应的预测轨迹信息的支持度,确定一个所述候选位置作为所述对象在下一时刻的位置。
12.根据权利要求11所述的方法,其特征在于,还包括:
在生成所述轨迹信息之前,将所述多个位置以及所述行为信息预处理为预定格式,其中所述预定格式包括对象信息、位置信息、时间信息以及行为信息。
13.根据权利要求11所述的方法,其特征在于,还包括:
在生成所述轨迹信息后,从所述轨迹信息中去除高频出现的位置节点的位置信息。
14.根据权利要求11所述的方法,其特征在于,通过预测模型,预测得到所述对象在下一时刻的位置的操作包括:
根据所述轨迹信息中的所述多个位置生成与所述轨迹信息对应的轨迹向量;以及
根据所述轨迹向量预测得到所述对象在下一时刻的位置。
15.根据权利要求14所述的方法,其特征在于,生成所述轨迹向量的操作包括:
利用至少包括所述多个位置的语料,将所述多个位置映射为对应的位置向量;以及
基于所述多个位置中的至少一个位置的位置向量生成所述轨迹向量。
16.根据权利要求15所述的方法,其特征在于,所述语料为包括多个轨迹信息的轨迹信息集合,其中所述语料按照如下方式进行训练:
将所述轨迹信息集合所包含的不同位置分别映射为作为初始向量的位置向量;以及
利用所述轨迹信息集合所包含的轨迹信息对所述轨迹信息集合所包含的位置的位置向量进行更新,确定所述轨迹信息集合所包含的位置的位置向量。
17.根据权利要求16所述的方法,其特征在于,对所述位置向量进行更新的操作包括:
对于所述轨迹信息集合中所包含的一个位置,执行以下操作:
从所述轨迹信息集合中选择包含所述一个位置的第二轨迹信息;
在所述第二轨迹信息中,确定在所述一个位置之前和在所述一个位置之后分别与所述一个位置邻近的多个相邻位置;以及
利用所述多个相邻位置的位置向量更新所述一个位置的位置向量。
18.根据权利要求17所述的方法,其特征在于,利用所述多个相邻位置的位置向量更新所述一个位置的位置向量的操作包括:
对所述多个相邻位置的位置向量求和,并将求和的结果作为所述一个位置的位置向量。
19.一种存储介质,其特征在于,所述存储介质包括存储的程序,其中,在所述程序运行时控制所述存储介质所在设备执行权利要求1至18中任意一项所述的确定位置信息的方法。
20.一种处理器,其特征在于,所述处理器用于运行程序,其中,所述程序运行时执行权利要求1至18中任意一项所述的确定位置信息的方法。
21.一种确定位置信息的系统,其特征在于,包括:
处理器;以及
存储器,与所述处理器连接,用于为所述处理器提供处理以下处理步骤的指令:
获得对象在当前时刻的轨迹信息,所述轨迹信息包括:所述对象在移动过程中的多个位置以及所述对象在所述多个位置发生的行为信息;以及
基于所述对象在所述多个位置发生的行为信息,通过预测模型,预测得到所述对象在下一时刻的位置;
其中,预测得到所述对象在下一时刻的位置还包括:根据所述轨迹信息中的所述多个位置生成与所述轨迹信息对应的轨迹向量;基于所述轨迹向量,利用分类器产生可能作为所述对象在下一时刻的位置的多个候选位置,并且产生所述多个候选位置的可信度;以及将多个候选位置分别添加到在当前时刻的所述轨迹信息中从而形成分别包括所述多个候选位置的多个预测轨迹信息;在所述轨迹信息集合中统计所述多个预测轨迹信息各自的频繁项集以及支持度;以及比较所述多个候选位置的可信度以及对应的预测轨迹信息的支持度,确定一个所述候选位置作为所述对象在下一时刻的位置。
22.一种确定位置信息的系统,其特征在于,包括:
处理器;以及
存储器,与所述处理器连接,用于为所述处理器提供处理以下处理步骤的指令:
获得对象在预定时间段内的多个位置以及所述对象在所述多个位置发生的行为信息;以及
基于所述多个位置,通过预测模型,预测得到所述对象在下一时刻的位置;
其中,预测得到所述对象在下一时刻的位置的操作包括:基于所述多个位置形成轨迹信息;以及基于所述轨迹向量,利用分类器产生可能作为所述对象在下一时刻的位置的多个候选位置,并且产生所述多个候选位置的可信度;以及将所述多个候选位置分别添加到在当前时刻的所述轨迹信息中从而形成分别包括所述多个候选位置的多个预测轨迹信息;在所述轨迹信息集合中统计所述多个预测轨迹信息各自的频繁项集以及支持度;以及比较所述多个候选位置的可信度以及对应的预测轨迹信息的支持度,确定一个所述候选位置作为所述对象在下一时刻的位置。
23.一种确定位置信息的装置,其特征在于,包括:
获取单元,用于获得对象在当前时刻的轨迹信息,所述轨迹信息包括:所述对象在移动过程中的多个位置以及所述对象在所述多个位置发生的行为信息;以及
预测单元,用于基于所述对象在多个位置发生的行为信息,通过预测模型,预测得到所述对象在下一时刻的位置;
其中,所述预测单元包括:生成模块,用于根据所述轨迹信息中的所述多个位置生成与所述轨迹信息对应的轨迹向量;以及
预测模块,用于基于所述轨迹向量,利用分类器产生可能作为所述对象在下一时刻的位置的多个候选位置,并且产生所述多个候选位置的可信度;
所述预测模块包括:产生子模块,用于基于所述轨迹向量,利用分类器产生可能作为所述对象在下一时刻的位置的多个候选位置,并且产生所述多个候选位置的可信度;以及
第一确定子模块,用于基于所述多个候选位置的可信度,确定一个所述候选位置作为所述对象在下一时刻的位置;
所述预测模块还包括:添加子模块,用于将所述多个候选位置分别添加到在当前时刻的所述轨迹信息中从而形成分别包括所述多个候选位置的多个预测轨迹信息;
统计子模块,用于在所述轨迹信息集合中统计所述多个预测轨迹信息各自的频繁项集以及支持度;以及
所述第一确定子模块,还用于比较所述多个候选位置的可信度以及对应的预测轨迹信息的支持度,确定一个所述候选位置作为所述对象在下一时刻的位置。
24.一种确定位置信息的装置,其特征在于,包括:
获取单元,用于获得对象在预定时间段内的多个位置以及所述对象在所述多个位置发生的行为信息;以及
预测单元,基于所述多个位置,通过预测模型,预测得到所述对象在下一时刻的位置;
其中,所述预测单元包括:生成模块,用于基于所述多个位置形成轨迹信息;以及
预测模块,用于根据所述轨迹信息,通过所述预测模型,预测得到所述对象在下一时刻的位置;
所述预测模块包括:产生子模块,用于基于所述轨迹向量,利用分类器产生可能作为所述对象在下一时刻的位置的多个候选位置,并且产生所述多个候选位置的可信度;以及
第一确定子模块,用于基于所述多个候选位置的可信度,确定一个所述候选位置作为所述对象在下一时刻的位置;
所述预测模块还包括:添加子模块,用于将所述多个候选位置分别添加到在当前时刻的所述轨迹信息中从而形成分别包括所述多个候选位置的多个预测轨迹信息;
统计子模块,用于在所述轨迹信息集合中统计所述多个预测轨迹信息各自的频繁项集以及支持度;以及
所述第一确定子模块,还用于比较所述多个候选位置的可信度以及对应的预测轨迹信息的支持度,确定一个所述候选位置作为所述对象在下一时刻的位置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710880637.8A CN109558961B (zh) | 2017-09-25 | 2017-09-25 | 确定位置信息的方法和系统、存储介质、处理器以及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710880637.8A CN109558961B (zh) | 2017-09-25 | 2017-09-25 | 确定位置信息的方法和系统、存储介质、处理器以及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109558961A CN109558961A (zh) | 2019-04-02 |
CN109558961B true CN109558961B (zh) | 2023-05-02 |
Family
ID=65862040
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710880637.8A Active CN109558961B (zh) | 2017-09-25 | 2017-09-25 | 确定位置信息的方法和系统、存储介质、处理器以及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109558961B (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110716925B (zh) * | 2019-09-05 | 2023-08-04 | 中电科大数据研究院有限公司 | 一种基于轨迹分析的跨境行为识别方法 |
CN111401233A (zh) * | 2020-03-13 | 2020-07-10 | 商汤集团有限公司 | 轨迹预测方法、装置、电子设备及介质 |
CN113256713B (zh) * | 2021-06-10 | 2021-10-15 | 浙江华睿科技股份有限公司 | 一种栈板位置识别方法、装置、电子设备及存储介质 |
Family Cites Families (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2014055939A1 (en) * | 2012-10-04 | 2014-04-10 | Huawei Technologies Co., Ltd. | User behavior modeling for intelligent mobile companions |
CN103942229B (zh) * | 2013-01-22 | 2017-05-03 | 日电(中国)有限公司 | 目的地预测设备和方法 |
CN104239556B (zh) * | 2014-09-25 | 2017-07-28 | 西安理工大学 | 基于密度聚类的自适应轨迹预测方法 |
CN104462190B (zh) * | 2014-10-24 | 2018-01-05 | 中国电子科技集团公司第二十八研究所 | 一种基于海量空间轨迹挖掘的在线的位置预测方法 |
CN105704657B (zh) * | 2014-11-27 | 2019-10-08 | 深圳市腾讯计算机系统有限公司 | 监测移动终端位置的方法及装置 |
CN104820905B (zh) * | 2015-05-19 | 2018-11-20 | 威海北洋电气集团股份有限公司 | 基于空间轨迹大数据分析的人员管控方法及系统 |
CN106339769B (zh) * | 2015-07-08 | 2020-01-03 | 北京大学 | 一种面向移动社会网络的用户出行预测方法 |
CN105183800A (zh) * | 2015-08-25 | 2015-12-23 | 百度在线网络技术(北京)有限公司 | 信息预测的方法和装置 |
CN105718576B (zh) * | 2016-01-22 | 2019-07-16 | 西安电子科技大学 | 与地理特征相关的个性化位置推荐系统 |
CN106022934A (zh) * | 2016-05-05 | 2016-10-12 | 北京邮电大学 | 一种基于移动轨迹模式的潜在好友发现方法及系统 |
CN106028444A (zh) * | 2016-07-01 | 2016-10-12 | 国家计算机网络与信息安全管理中心 | 预测移动终端位置的方法及装置 |
CN106506705B (zh) * | 2016-12-29 | 2020-07-28 | 平安科技(深圳)有限公司 | 基于位置服务的人群分类方法及装置 |
CN107133269B (zh) * | 2017-04-01 | 2021-06-18 | 中国人民解放军国防科技大学 | 基于移动目标的频繁位置轨迹生成方法及装置 |
-
2017
- 2017-09-25 CN CN201710880637.8A patent/CN109558961B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
CN109558961A (zh) | 2019-04-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Feng et al. | Deepmove: Predicting human mobility with attentional recurrent networks | |
Kaiser et al. | Advances in crowd analysis for urban applications through urban event detection | |
US10511933B2 (en) | Travel recommendations on online social networks | |
Zhong et al. | Inferring building functions from a probabilistic model using public transportation data | |
Zheng et al. | Urban computing: concepts, methodologies, and applications | |
Zheng et al. | Diagnosing New York city's noises with ubiquitous data | |
CN105532030B (zh) | 用于分析目标实体的移动的装置、系统和方法 | |
Jiang et al. | Transfer urban human mobility via poi embedding over multiple cities | |
Luca et al. | Deep learning for human mobility: a survey on data and models | |
US20170046802A1 (en) | Travel Itinerary Generation on Online Social Networks | |
CN109948066B (zh) | 一种基于异构信息网络的兴趣点推荐方法 | |
CN113139140B (zh) | 基于时空感知gru并结合用户关系偏好的旅游景点推荐方法 | |
CN104680250A (zh) | 一种位置预测系统 | |
Gao et al. | Mining human mobility in location-based social networks | |
CN109558961B (zh) | 确定位置信息的方法和系统、存储介质、处理器以及装置 | |
Qin et al. | Spatio-temporal routine mining on mobile phone data | |
Bonnetain et al. | Can we map-match individual cellular network signaling trajectories in urban environments? Data-driven study | |
EP3192061B1 (en) | Measuring and diagnosing noise in urban environment | |
Kapp et al. | Generative models for synthetic urban mobility data: A systematic literature review | |
CN112395502A (zh) | 一种页面显示方法、装置、电子设备及计算机存储介质 | |
CN111182463A (zh) | 一种区域实时客流来源分析方法及装置 | |
Ahmad et al. | Context-aware services based on spatio-temporal zoning and crowdsourcing | |
Cheng et al. | An unsupervised approach for semantic place annotation of trajectories based on the prior probability | |
Sun et al. | Predicting future locations with semantic trajectories | |
KR101935161B1 (ko) | Sns와 여론조사를 융합한 예측 시스템 및 방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |