CN110309434A - 一种轨迹数据处理方法、装置以及相关设备 - Google Patents

一种轨迹数据处理方法、装置以及相关设备 Download PDF

Info

Publication number
CN110309434A
CN110309434A CN201811178191.5A CN201811178191A CN110309434A CN 110309434 A CN110309434 A CN 110309434A CN 201811178191 A CN201811178191 A CN 201811178191A CN 110309434 A CN110309434 A CN 110309434A
Authority
CN
China
Prior art keywords
event
behavior
user
data
track
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201811178191.5A
Other languages
English (en)
Other versions
CN110309434B (zh
Inventor
李勇
徐丰力
秦震宇
金德鹏
孙福宁
孟凡超
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tsinghua University
Tencent Technology Shenzhen Co Ltd
Tencent Dadi Tongtu Beijing Technology Co Ltd
Original Assignee
Tsinghua University
Tencent Technology Shenzhen Co Ltd
Tencent Dadi Tongtu Beijing Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tsinghua University, Tencent Technology Shenzhen Co Ltd, Tencent Dadi Tongtu Beijing Technology Co Ltd filed Critical Tsinghua University
Priority to CN201811178191.5A priority Critical patent/CN110309434B/zh
Publication of CN110309434A publication Critical patent/CN110309434A/zh
Application granted granted Critical
Publication of CN110309434B publication Critical patent/CN110309434B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9537Spatial or temporal dependent retrieval, e.g. spatiotemporal queries

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mobile Radio Communication Systems (AREA)

Abstract

本发明实施例公开了一种轨迹数据处理方法、装置以及相关设备,方法包括:获取用户行为轨迹数据,并获取与用户行为轨迹数据相关联的用户时间信息;根据用户行为轨迹数据和用户时间信息设置多个时空点;一个时空点对应一个时间段内的一个位置区域;根据用户轨迹数据,提取各时空点分别对应的目标表征向量;根据目标表征向量,分别确定每个时空点与多种位置兴趣点类别之间的访问频率。采用本发明,可以提高识别不同区域在不同时段各类POI的访问频率的正确率。

Description

一种轨迹数据处理方法、装置以及相关设备
技术领域
本发明涉及计算机技术领域,尤其涉及一种轨迹数据处理方法、装置以及相关设备。
背景技术
城市中分布有各类的POI(Point Of Interest,位置兴趣点),例如,汽车服务类、餐饮服务类、生活服务类、医疗保健服务类等。为了反映出不同区域的动态功能变化,需要推测不同区域在不同时段各类POI的访问频率,为后续动态场景估计提供数据来源。例如,在推荐系统中,在不同时段为处于不同区域的用户推送访问频率较高的POI。
现有技术中,主要是基于各类POI的分布数据进行预测,即是根据各区域中各类POI的分布数据提取各区域的特征信息,进而预测各区域访问各类POI的频率。由于分布数据是静态数据,因此只能预测到不同区域访问各类POI的访问频率。
例如,区域A包括一个景区以及分布在景区周围的大量餐饮店,若根据餐饮店的分布数据就会预测该区域的功能是餐饮功能,进而预测区域A餐饮POI的访问频率会很高。若用户B下午15:00处于区域A中,由于预测区域A餐饮POI访问频率较高,终端中的推荐系统就会向用户B推荐周边的餐饮店,但用户B在下午15:00的实际需求是游玩景区(景区对应娱乐POI),这样就与所预测出的访问频率不符,从而造成预测结果的准确率低下。
发明内容
本发明实施例提供一种轨迹数据处理方法、装置以及相关设备,可以提高识别不同区域在不同时段各类POI的访问频率的正确率。
本发明一方面提供了一种轨迹数据处理方法,包括:
获取用户行为轨迹数据,并获取与所述用户行为轨迹数据相关联的用户时间信息;
根据所述用户行为轨迹数据和所述用户时间信息设置多个时空点;一个时空点对应一个时间段内的一个位置区域;
根据所述用户行为轨迹数据和所述用户时间信息,提取各时空点分别对应的目标表征向量;
根据所述目标表征向量,分别确定每个时空点与多种位置兴趣点类别之间的访问频率。
其中,所述获取用户行为轨迹数据,并获取与所述用户行为轨迹数据相关联的用户时间信息,包括:
获取原始轨迹数据和与所述原始轨迹数据相关联的原始时间信息;
在所述原始轨迹数据中,查找处于目标范围内,且在所述目标范围内的驻留时长大于第一时间阈值的原始轨迹分段数据,将所查找到的所述原始轨迹分段数据合并为驻留点;
构建包含所述驻留点的所述用户行为轨迹数据,并将所述驻留点对应的原始时间信息确定为所述用户时间信息。
其中,所述根据所述用户行为轨迹数据和所述用户时间信息,提取各时空点分别对应的目标表征向量,包括:
根据所述用户时间信息,识别所述用户轨迹数据的用户活动行为;
根据所述用户行为的数量和所述多个时空点构建轨迹移动网络,并根据所述轨迹移动网络,提取每个时空点对应的目标表征向量。
其中,所述用户活动行为包括:驻留行为、周期访问行为和跳转行为;
所述根据所述用户时间信息,识别所述用户轨迹数据的用户活动行为,包括:
根据所述用户轨迹数据和所述用户时间信息,将在同一位置区域内的驻留时间大于第二时间阈值的第一轨迹分段数据对应的用户活动行为,确定为所述驻留行为;
根据所述用户轨迹数据和所述用户时间信息,将每间隔目标周期访问同一位置区域的第二轨迹分段数据对应的用户活动行为,确定为所述周期访问行为;
根据所述用户轨迹数据和所述用户时间信息,将在两个不同位置区域之间移动的第三轨迹分段数据对应的用户活动行为,确定为所述跳转行为;
其中所述第一轨迹分段数据、所述第二轨迹分段数据和所述第三轨迹分段数据均属于所述用户轨迹数据。
其中,所述轨迹移动网络包括:驻留行为对应的第一轨迹移动网络、周期访问行为对应的第二轨迹移动网络和跳转行为对应的第三轨迹移动网络;
所述根据所述用户行为的数量和所述多个时空点构建轨迹移动网络,包括:
将位置区域相同,且时间段相邻的两个时空点确定为第一时空点对;
统计在所述第一时空点对内的驻留行为数量,将所述驻留行为数量作为所述第一时空点对中两个时空点之间的驻留权重;
根据所述多个时空点和所述多个时空点之间的驻留权重,构建所述第一轨迹移动网络;
将位置区域相同,且间隔目标时长的两个时空点确定为第二时空点对;
统计与所述第二时空点对中两个时空点对应的周期访问行为数量,将所述周期访问行为数量作为所述第二时空点对中两个时空点之间的周期访问权重;
根据所述多个时空点和所述多个时空点之间的周期访问权重,构建所述第二轨迹移动网络;
从所有时空点中提取两个时空点,分别作为第一时空点和第二时空点;
统计从所述第一时空点跳转至所述第二时空点的跳转行为数量,根据所述跳转行为数量、所述第一时空点和所述第二时空点之间的真实位置距离,确定从所述第一时空点到所述第二时空点的跳转权重;
根据所述多个时空点和所述多个时空点之间的跳转权重,构建所述第三轨迹移动网络。
其中,所述根据所述轨迹移动网络,提取每个时空点对应的目标表征向量,包括:
根据所述第一轨迹移动网络,确定所述第一轨迹移动网络中各时空点分别对应的驻留权重分布;
根据所述第二轨迹移动网络,确定所述第二轨迹移动网络中各时空点分别对应的周期访问权重分布;
根据所述第三轨迹移动网络,确定所述第三轨迹移动网络中各时空点分别对应的跳转权重分布;
根据梯度下降模型、所述驻留权重分布、所述周期访问权重分布和所述跳转权重分布,计算各时空点分别对应的目标表征向量,使得辅助时空点的目标表征向量对应的目标权重分布和所述辅助时空点对应驻留权重分布之间的相对熵、所述目标权重分布和所述辅助时空点对应周期访问权重分布之间的相对熵、所述目标权重分布和所述辅助时空点对应跳转权重分布之间的相对熵之和最小;所述辅助时空点属于所述多个时空点。
其中,所述根据所述目标表征向量,分别确定每个时空点与多种位置兴趣点类别之间的访问频率,包括:
将所述目标表征向量输入目标多层感知机模型的输入层;
基于所述目标多层感知机模型中的隐藏层所对应的连接权重和偏移项,更新各时空点对应的目标表征向量,得到所述各时空点对应的目标感知向量;
基于所述目标多层感知机模型中的输出层,识别各目标感知向量与所述目标多层感知机模型中的多种位置兴趣点类别之间的匹配度,将各目标感知向量对应的多个匹配度确定为各时空点与多种位置兴趣点类别之间的访问频率。
其中,还包括:
获取目标终端的目标时间点和目标位置区域,将与所述目标时间点和所述目标位置区域对应的时空点,作为目标时空点;
在所述目标时空点对应的多种访问频率中,选择最大访问频率所关联的位置兴趣点类别,作为目标位置兴趣点类别;
在所述目标终端中显示所述目标位置兴趣点类别。
本发明另一方面提供了一种轨迹数据处理装置,包括:
获取模块,用于获取用户行为轨迹数据,并获取与所述用户行为轨迹数据相关联的用户时间信息;
设置模块,用于根据所述用户行为轨迹数据和所述用户时间信息设置多个时空点;一个时空点对应一个时间段内的一个位置区域;
提取模块,用于根据所述用户行为轨迹数据和所述用户时间信息,提取各时空点分别对应的目标表征向量;
确定模块,用于根据所述目标表征向量,分别确定每个时空点与多种位置兴趣点类别之间的访问频率。
其中,所述获取模块,包括:
获取单元,用于获取原始轨迹数据和与所述原始轨迹数据相关联的原始时间信息;
查找单元,用于在所述原始轨迹数据中,查找处于目标范围内,且在所述目标范围内的驻留时长大于第一时间阈值的原始轨迹分段数据,将所查找到的所述原始轨迹分段数据合并为驻留点;
构建单元,用于构建包含所述驻留点的所述用户行为轨迹数据,并将所述驻留点对应的原始时间信息确定为所述用户时间信息。
其中,所述提取模块,包括:
识别单元,用于根据所述用户时间信息,识别所述用户轨迹数据的用户活动行为;
第一提取单元,用于根据所述用户行为的数量和所述多个时空点构建轨迹移动网络;
第二提取单元,用于根据所述轨迹移动网络,提取每个时空点对应的目标表征向量。
其中,所述用户活动行为包括:驻留行为、周期访问行为和跳转行为;
所述识别单元,包括:
第一确定子单元,用于根据所述用户轨迹数据和所述用户时间信息,将在同一位置区域内的驻留时间大于第二时间阈值的第一轨迹分段数据对应的用户活动行为,确定为所述驻留行为;
第二确定子单元,用于根据所述用户轨迹数据和所述用户时间信息,将每间隔目标周期访问同一位置区域的第二轨迹分段数据对应的用户活动行为,确定为所述周期访问行为;
所述第二确定子单元,还用于根据所述用户轨迹数据和所述用户时间信息,将在两个不同位置区域之间移动的第三轨迹分段数据对应的用户活动行为,确定为所述跳转行为;
其中,所述第一轨迹分段数据、所述第二轨迹分段数据和所述第三轨迹分段数据均属于所述用户轨迹数据。
其中,所述轨迹移动网络包括:驻留行为对应的第一轨迹移动网络、周期访问行为对应的第二轨迹移动网络和跳转行为对应的第三轨迹移动网络;
所述第一提取单元,包括:
第三确定子单元,用于将位置区域相同,且时间段相邻的两个时空点确定为第一时空点对;
统计子单元,用于统计在所述第一时空点对内的驻留行为数量,将所述驻留行为数量作为所述第一时空点对中两个时空点之间的驻留权重;
构建子单元,用于根据所述多个时空点和所述多个时空点之间的驻留权重,构建所述第一轨迹移动网络;
所述第三确定子单元,还用于将位置区域相同,且间隔目标时长的两个时空点确定为第二时空点对;
所述统计子单元,还用于统计与所述第二时空点对中两个时空点对应的周期访问行为数量,将所述周期访问行为数量作为所述第二时空点对中两个时空点之间的周期访问权重;
所述构建子单元,还用于根据所述多个时空点和所述多个时空点之间的周期访问权重,构建所述第二轨迹移动网络;
所述第三确定子单元,还用于从所有时空点中提取两个时空点,分别作为第一时空点和第二时空点;
所述统计子单元,还用于统计从所述第一时空点跳转至所述第二时空点的跳转行为数量,根据所述跳转行为数量、所述第一时空点和所述第二时空点之间的真实位置距离,确定从所述第一时空点到所述第二时空点的跳转权重;
所述构建子单元,还用于根据所述多个时空点和所述多个时空点之间的跳转权重,构建所述第三轨迹移动网络。
其中,所述第二提取单元,包括:
第四确定子单元,用于根据所述第一轨迹移动网络,确定所述第一轨迹移动网络中各时空点分别对应的驻留权重分布;
所述第四确定子单元,还用于根据所述第二轨迹移动网络,确定所述第二轨迹移动网络中各时空点分别对应的周期访问权重分布;
所述第四确定子单元,还用于根据所述第三轨迹移动网络,确定所述第三轨迹移动网络中各时空点分别对应的跳转权重分布;
计算子单元,用于根据梯度下降模型、所述驻留权重分布、所述周期访问权重分布和所述跳转权重分布,计算各时空点分别对应的目标表征向量,使得辅助时空点的目标表征向量对应的目标权重分布和所述辅助时空点对应驻留权重分布之间的相对熵、所述目标权重分布和所述辅助时空点对应周期访问权重分布之间的相对熵、所述目标权重分布和所述辅助时空点对应跳转权重分布之间的相对熵之和最小;所述辅助时空点属于所述多个时空点。
其中,所述确定模块,包括:
输入单元,用于将所述目标表征向量输入目标多层感知机模型的输入层;
更新单元,用于基于所述目标多层感知机模型中的隐藏层所对应的连接权重和偏移项,更新各时空点对应的目标表征向量,得到所述各时空点对应的目标感知向量;
输出单元,用于基于所述目标多层感知机模型中的输出层,识别各目标感知向量与所述目标多层感知机模型中的多种位置兴趣点类别之间的匹配度,将各目标感知向量对应的多个匹配度确定为各时空点与多种位置兴趣点类别之间的访问频率。
其中,还包括:
所述设置模块,还用于获取目标终端的目标时间点和目标位置区域,将与所述目标时间点和所述目标位置区域对应的时空点,作为目标时空点;
选择模块,用于在所述目标时空点对应的多种访问频率中,选择最大访问频率所关联的位置兴趣点类别,作为目标位置兴趣点类别;
显示模块,用于在所述目标终端中显示所述目标位置兴趣点类别。
本发明另一方面提供了一种电子设备,包括:处理器和存储器;
所述处理器和存储器相连,其中,所述存储器用于存储程序代码,所述处理器用于调用所述程序代码,以执行如本发明实施例中一方面中的方法。
本发明另一方面提供了一种计算机存储介质,所述计算机存储介质存储有计算机程序,所述计算机程序包括程序指令,所述程序指令当被处理器执行时,执行如本发明实施例中一方面中的方法。
本发明实施通过获取用户行为轨迹数据,并获取与用户行为轨迹数据相关联的用户时间信息;根据用户行为轨迹数据和用户时间信息设置多个时空点;一个时空点对应一个时间段内的一个位置区域;根据用户轨迹数据,提取各时空点分别对应的目标表征向量;根据目标表征向量,分别确定每个时空点与多种位置兴趣点类别之间的访问频率。上述可知,根据表征用户行为的行为轨迹数据以及与行为轨迹数据对应的时间信息,可以分别提取不同时空点的动态特征向量,进而识别每个时空点与多种POI类别的访问频率,由于从时间和空间两个维度上共同分析不同时空点与各类POI之间的访问频率,可以从时间上动态地预测不同区域不同时间段访问各类POI的访问频率,避免单一地预测出同一个区域在所有时间段访问各类POI的频率都相同,可以提高识别不同区域在不同时段对各类POI的访问频率的准确率。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1a是本发明实施例提供的一种轨迹数据处理方法的系统架构图;
图1b-图1c是本发明实施例提供的一种轨迹数据处理方法的场景示意图;
图2a是本发明实施例提供的一种轨迹数据处理方法的流程示意图;
图2b是发明实施例提供的一种轨迹数据处理方法的结果对比示意图;
图2c是发明实施例提供的另一种轨迹数据处理方法的结果对比示意图;
图3是本发明实施例提供的另一种轨迹数据处理方法的流程示意图;
图4是本发明实施例提供的一种轨迹数据处理装置的结构示意图;
图5是本发明实施例提供的一种电子设备的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参见图1a,是本发明实施例提供的一种轨迹数据处理方法的系统架构图,服务器20a为用户终端集群提供服务,用户终端集群可以包括:用户终端20b、用户终端20c...用户终端20d。当用户(可以是用户20e、20f或者20g)携带用户终端发生活动行为时,用户终端采集用户的原始轨迹数据以及与原始轨迹数据相关联的原始时间信息。用户终端将采集到的数据发送至服务器20a,服务器20a对原始轨迹数据以及原始时间信息进行识别处理,得到不同时间段不同位置区域的多种POI类别访问频率。当用户终端需要向用户推荐POI时,用户终端可以向服务器20a发送用户终端当前的时间点和当前位置区域,服务器20a在与当前时间点和当前位置区域对应的多种POI类别访问频率中,选择最大访问频率对应的POI类别。服务器20a向用户终端推送属于上述最大访问频率的POI类别的POI,以提高推荐准确率。下述对原始轨迹数据和原始时间信息的识别处理进行详细说明,以获得不同时间段不同位置区域访问多种POI类别的访问频率。
其中,用户终端可以包括手机、平板电脑、笔记本电脑、掌上电脑、智能音响、智能音箱、移动互联网设备(MID,mobile internet device)、POS(Point Of Sales,销售点)机、可穿戴设备(例如智能手表、智能手环等)等。
请参见图1b,是本发明实施例提供的一种轨迹数据处理方法的场景示意图。如图1b所示,获取原始轨迹数据以及与原始轨迹数据相关联的原始时间信息,原始时间信息用于记录对应原始轨迹数据的行为发生时间,将上述原始轨迹数据和原始时间信息组合为数据集10a。
由于每个用户的原始轨迹数据比较精细,对同一个用户的原始轨迹数据来说,可以将那些移动轨迹在预设的移动范围内,且驻留时间超过预设的第一时间阈值的原始轨迹数据合并为一个驻留点,那么原始轨迹数据就可以转换为包含驻留点的用户行为轨迹数据,对其余不满足条件的原始轨迹数据可以直接略过。例如预设移动范围是300米,第一时间阈值为15分钟,也就是将那些移动范围在300米内,且停留时间超过15分钟的原始轨迹数据合并为驻留点。相应地,将驻留点对应的原始时间信息确定为用户时间信息。用户行为轨迹数据可以表示为多个驻留点之间的跳转行为,可以将多个驻留点之间的跳转行为组合为驻留点跳转网络10b,用户时间信息即是驻留点跳转网络10b中的各驻留点之间跳转行为对应的时间信息。
根据用户行为轨迹数据所涉及的位置区域,以及用户时间信息所涉及的时间区间,设置多个时空点,一个时空点对应一个时间段内的一个位置区域。下述以用户行为轨迹数据涉及的位置区域是区域A和区域B,用户时间信息涉及的时间区间是周一0点到周二24点为例进行说明。根据上述用户行为轨迹数据和用户时间信息可以划分2个位置区域、4个时间段(周一0:00-12:00、周一12:00-24:00、周二0:00-12:00、周二12:00-24:00),位置区域和时间段可以根据实际需求任意划分。根据2个位置区域和4个时间段,可以设置8个时空点。其中,时空点1对应位置区域A、周一0:00-12:00;时空点2对应位置区域A、周一12:00-24:00;时空点3对应位置区域A、周二0:00-12:00;时空点4对应位置区域A、周二12:00-24:00;时空点5对应位置区域B、周一0:00-12:00;时空点6对应位置区域B、周一12:00-24:00;时空点7对应位置区域B、周二0:00-12:00;时空点8对应位置区域B、周二12:00-24:00。
识别用户行为轨迹数据对应的用户活动行为,用户活动行为包括:驻留行为、周期访问行为和跳转行为。其中,将在同一位置区域内的驻留时间大于第二时间阈值的用户轨迹数据对应的用户活动行为,确定为驻留行为,例如,第二时间阈值为1小时,那么将在区域A中驻留时间超过1小时的用户轨迹数据对应的用户活动行为,确定为驻留行为。将每间隔目标周期访问同一位置区域的用户轨迹数据对应的用户活动行为,确定为周期访问行为。例如,预设的目标周期是24小时-36小时(目标周期的时长等于一个时间段的时长),若用户轨迹数据A在周一8:00访问位置区域A,且用户轨迹数据A在周二的9:00也访问位置区域A,那么用户轨迹数据A对应的用户活动行为就是周期访问行为。将在两个不同位置区域之间移动的用户轨迹数据对应的用户活动行为,确定为跳转行为。需要说明的是,驻留行为是同一个时空点中,或者位置区域相同但时间段相邻的两个时空点之间才存在的用户活动行为,周期访问行为是同一位置区域但间隔目标时长的两个时空点之间才存在的用户活动行为,跳转行为是位置区域不同(时间段可以相同也可以不同)的两个时空点之间才存在的用户活动行为。
确定了各用户轨迹数据对应的用户活动行为后,进而可以根据用户活动行为的数量和8个时空点构建轨迹移动网络。轨迹移动网络中的节点集合对应8个时空点,轨迹移动网络中各节点之间的权重是由用户活动行为数量决定的,由于用户活动行为包括3种行为,对应地轨迹移动网络也包括3种网络,分别是驻留行为对应的第一轨迹移动网络;周期访问行为对应的第二轨迹移动网络;跳转行为对应的第三轨迹移动网络。对第一轨迹移动网络来说,该网络包括8节点,每个节点对应一个时空点,统计上述8个时空点中位置区域相同但时间段相邻的两个时空点中的驻留行为的数量,将上述驻留行为的数量作为上述两个时空点之间的权重。例如,对时空点1(位置区域A、周一0:00-12:00)和时空点2(位置区域A、周一12:00-24:00)来说,统计时空点1和时空点2中的驻留行为的数量(即是统计在位置区域A中,时间段处于周一0:00-24:00之间的驻留行为的数量),将统计出来的驻留行为数量作为时空点1和时空点2之间的权重,即在第一轨迹移动网络中只有位置区域相同且时间段相邻的两个时空点之间才存在连接边,连接边的权重是两个时空点中驻留行为的数量。采用上述方法,可以构建第一移动轨迹网络10c。
对第二轨迹移动网络来说,该网络同样包括8节点,每个节点对应一个时空点。统计上述8个时空点中位置区域相同但时间段间隔目标时长的两个时空点对应的周期访问行为的数量,将上述周期访问行为的数量作为上述两个时空点之间的权重。需要注意的是,目标周期是一个时间区间,左区间的数值就等于目标时长,且该时间区间的时长等于时空点中一个时间段的时长。例如,目标周是24小时-36小时,那么对应地目标时长为24小时,对时空点1(位置区域A、周一0:00-12:00)和时空点3(位置区域A、周二0:00-12:00)来说,统计与时空点1和时空点3对应的周期访问行为的数量(即统计在周一0:00-12:00之间访问过位置区域A,且在周二0:00-12:00之间也访问过位置区域A的周期访问行为数量),将统计出来的周期访问行为数量作为时空点1和时空点3之间的权重。可以知道第二轨迹移动网络中只有位置区域相同且时间段间隔目标时长的两个时空点之间才存在连接边,连接边的权重是两个时空点中周期访问行为的数量。采用上述方法,可以构建第二移动轨迹网络10d。
对第三轨迹移动网络来说,该网络同样包括8节点,每个节点对应一个时空点。统计上述8个时空点中位置区域不同的两个时空点中的跳转行为的数量,将上述跳转行为的数量作为上述两个时空点之间的权重。可以知道,第三轨迹移动网络中节点之间的连接边是有向边。例如,对时空点1(位置区域A、周一0:00-12:00)和时空点5(位置区域B、周一0:00-12:00)来说,统计从时空点1跳转至时空点3的跳转行为的数量(即统计周一0:00-12:00时间段,从位置区域A移动至位置区域B的跳转行为的数量),将统计出来的跳转行为数量与两个时空点之间的真实距离的倒数之积,作为时空点1和时空点3之间的权重。可以知道第三轨迹移动网络中只有位置区域不同的两个时空点之间才存在连接边,连接边的权重是两个时空点中跳转行为的数量以及两个时空点之间的真实距离共同决定的。采用上述方法,可以构建第三移动轨迹网络10e。
构建完成第一移动轨迹网络10c、第二移动轨迹网络10d、第三移动轨迹网络10e后,根据第一移动轨迹网络10c中各时空点之间的权重,采用经验概率公式度量各时空点分别对应驻留权重分布,基于同样方法,计算各时空点分别对应的周期访问权重分布、各时空点分别对应的跳转权重分布。基于梯度下降方法,以及驻留权重分布、周期访问权重分布、跳转权重分布迭代优化各时空点对应的目标向量,使得同一个时空点的目标向量对应的目标权重分布和该时空点对应的驻留权重分布之间的相对熵、该时空点对应的目标权重分布和该时空点对应的周期访问权重分布之间的相对熵、该时空点对应的目标权重分布和该时空点对应的跳转权重分布之间的相对熵之和最小。如图1c所示,将8个时空点分别对应的目标向量(时空点1对应目标向量1、时空点2对应目标向量2、...、时空点7对应目标向量7、时空点8对应目标向量8)输入感知机模型10f中的输入层,基于感知机模型10f中的隐藏层对应的权重矩阵以及偏移项,更新各时空点分别对应的目标向量。隐藏层的数量可以是一个也可以是多个,将更新后的目标向量(即从隐藏层中输出的向量)称为感知向量。基于感知机模型10f中的输出层中的分类器回归,计算每个时空点对应的感知向量与多种POI类别之间的匹配度,将计算得到的匹配度作为时空点与多种POI类别之间的访问频率。
根据用户的轨迹数据,从时间和空间两个维度上共同分析不同时空点与各类POI之间的访问频率,避免单一地预测出同一个区域在所有时间段访问各类POI的频率都相同,提高识别不同区域在不同时段对各类POI的访问频率的准确率。
本发明是通过用户轨迹数据所对应的活动行为(驻留行为、周期访问行为和跳转行为),确定每个时空点对应的表征向量,表征向量表示的是每个时空点的活动行为特征,通过多层感知机模型将这些活动行为特征和多种POI类别进行匹配,所得到的匹配度即是与多种POI类别之间的访问频率。从中可以得知表征向量是不需要考虑到POI类别的,通过多层感知机模型即可计算出表征向量与每一种POI类别的特征信息的匹配度,匹配度越高的POI类别,说明该表征向量对应的时空点与该POI类别之间的访问频率越高。其中,多层感知机模型包括预先训练得到的每一种POI类别的特征信息,上述POI类别的特征信息是通过大量的样本训练得到的,样本包括时空点的表征向量,以及与每个表征向量对应的每一种POI类别的访问频率。
例如,从其他时空点发生大量的跳转行为至时空点A,在短时间内,又从时空点A发生大量的跳转行为至其他时空点,那么根据上述的活动行为所得到的时空点A对应的表征向量和餐饮POI的匹配度较高,相反与住宅小区POI的匹配度较低,因此,与时空点A之间具有较高访问频率的POI类别为餐饮POI。上述可知,由于表征向量是不需要考虑到POI类别,所以本发明中的用于计算表征向量的用户轨迹数据可以是未被标注的轨迹数据,其中未被标注的轨迹数据是指在轨迹数据中没有标记出访问过的POI类别,那么对应地已标注的轨迹数据是指在轨迹数据中标记出访问过的POI类型。相比已标注的轨迹数据,未被标注的轨迹数据不需要进一步地加工处理,例如,用户只需通过GPS记录用户的日常活动轨迹,将该日常活动轨迹作为用户轨迹数据即可,而无需再在日常活动轨迹中添加每一处位置的POI类别。进一步地,获取已标注的轨迹数据的方式要依赖于具有POI类别标识的高质量地图,而未标注轨迹数据由于不需要标识POI,因此对地图的质量要求较低,所以本发明所涉及的数据来源(未标注的轨迹数据)更容易获取到,进而具有更高的普适性。
其中,识别用户活动行为、计算目标表征向量(图1b对应实施例中的目标向量)的具体过程可以参见以下图2a至图3所对应的实施例。
进一步地,请参见图2a,是本发明实施例提供的一种轨迹数据处理方法的流程示意图。如图2a所示,所述轨迹数据处理方法可以包括:
步骤S101,获取用户行为轨迹数据,并获取与所述用户行为轨迹数据相关联的用户时间信息。
具体的,获取原始轨迹数据,以及与原始轨迹数据对应的原始时间信息,该原始时间信息是用于记录对应的原始轨迹数据发生活动行为的时间。由于原始轨迹数据中记录了停留时间过短,仅仅是路过的一些停留点,这些停留点可以认为是无意义的,可以将那些无意义的停留点进行删除。即是在原始轨迹数据中,查找处于预设的目标范围内,且在该目标范围内的驻留时长大于预设的第一时间阈值的原始轨迹分段数据,将上述查找到的原始轨迹数据合并为驻留点(如上述图1b中的驻留点跳转网络10b中的各驻留点)。构建包含驻留点的轨迹数据,称为用户行为轨迹数据,对应地,将驻留点对应的原始时间信息确定为与用户行为轨迹数据相关联的用户时间信息。上述可知,通过合并驻留点,将原始轨迹数据转换为驻留点之间的跳转行为数据(用户行为轨迹数据)。举例来说,预设的目标范围是400米,预设的第一时间阈值是10分钟,那么就是在原始轨迹数据中,将那些在400米范围内停留超过10分钟的原始轨迹数据,合并为驻留点。通过将部分原始轨迹数据合并为驻留点,可以减少原始轨迹数据的数据量,进而提高后续的计算效率。
步骤S102,根据所述用户行为轨迹数据和所述用户时间信息设置多个时空点;一个时空点对应一个时间段内的一个位置区域。
具体的,根据用户时间信息所涉及的时长划分为多个连续的时间段。例如,用户时间信息所涉及的时长是24小时,那么可以划分为24个连续的时间段,分别是0:00-1:00、1:00-2:00、...、23:00-24:00,其中每个时间区间中,左面是闭区间右面是开区间。根据用户行为轨迹数据所涉及到的位置区域,以及用户时间信息所涉及到的多个时间段,设置多个时空点(如上述图1b中的时空点1、时空点2、...、时空点8),一个时空点对应一个时间段内的一个位置区域。若位置区域有M个,时间段有N个,那么就存在M*N个时空点。上述可知,一个时空点对应时间和空间2个维度。
步骤S103,根据所述用户行为轨迹数据和所述用户时间信息,提取各时空点分别对应的目标表征向量。
具体的,根据用户轨迹数据以及用户时间信息,识别用户轨迹数据对应的用户活动行为,用户活动行为包括:驻留行为、周期访问行为、以及跳转行为。其中,将在同一位置区域内的驻留时间大于第二时间阈值的轨迹数据作为第一轨迹分段数据,并将上述第一轨迹分段数据对应的用户活动行为,确定为驻留行为。例如,预设的第二时间阈值为2小时,那么将在区域A中驻留时间超过2小时的第一轨迹分段数据对应的用户活动行为,确定为驻留行为。将每间隔目标周期访问同一位置区域的轨迹数据作为第二轨迹分段数据,将上述第二轨迹分段数据对应的用户活动行为,确定为周期访问行为。由于每个时空点对应的是一段持续时间,那么目标周期对应地也应该是一段持续时间,且目标周期的时长等于一个时间段的时长。例如,预设的目标周期是24小时-25小时,那么将间隔24小时-25小时访问同一位置区域的第二轨迹分段数据对应的用户活动行为,确定为周期访问行为。将在两个不同位置区域之间移动的轨迹数据作为第三轨迹分段数据,并将上述第三轨迹分段数据对应的用户活动行为,确定为跳转行为。需要说明的是,第一轨迹分段数据、第二轨迹分段数据和第三轨迹分段数据中均携带与之对应的用户时间信息,且与第一轨迹分段数据对应的用户时间信息是包含在第一轨迹分段数据中的;与第二轨迹分段数据对应的用户时间信息是包含在第二轨迹分段数据中的;与第三轨迹分段数据对应的用户时间信息是包含在第三轨迹分段数据中的。
举例来说,若一个用户的用户轨迹数据以及用户时间信息具体是:周一8:10从位置区域A出发,周一8:50到达位置区域B。然后在位置区域B中,从周一8:50一直驻留至周一19:00。周一19:00从位置区域B出发,周一20:10达到区域A。在位置区域A中,从周一20:10一直驻留至周二8:05。周二8:05从位置区域A出发,周二8:55到达位置区域B。在上述用户轨迹数据中,若预设的第二时间阈值为2小时,驻留行为对应的第一轨迹分段数据是:在位置区域B中,从周一8:50一直驻留至周一19:00的轨迹数据,以及在位置区域A中,从周一20:10一直驻留至周二8:05的轨迹数据。若预设的目标周期为24小时-25小时,周期访问行为对应的第二轨迹分段数据是:周一8:50到达位置区域B一直到周二8:55到达位置区域B之间的所有轨迹数据。跳转行为对应的第三轨迹分段数据是:周一8:10从位置区域A出发,周一8:50到达位置区域B的轨迹数据、周一19:00从位置区域B出发,周一20:10达到区域A的轨迹数据以及周二8:05从位置区域A出发,周二8:55到达位置区域B的轨迹数据。
确定了用户轨迹数据对应的用户活动行为后,根据用户活动行为的数量和多个时空点构建轨迹移动网络。由于用户活动行为包括驻留行为、周期访问行为以及跳转行为,对应地,轨迹移动网络包括驻留行为对应的第一轨迹移动网络(如上述图1b对应实施例中的第一移动轨迹网络10c),周期访问行为对应的第二轨迹移动网络(如上述图1b对应实施例中的第一移动轨迹网络10d),以及跳转行为对应的第三轨迹移动网络(如上述图1b对应实施例中的第一移动轨迹网络10e)。
构建第一轨迹移动网络的具体过程是:首先将位置区域相同,且时间段相邻的两个时空点作为第一时空点对。下面以一个第一时空点对为例进行说明,统计在第一时空点对中的驻留行为数量,即是统计在第一时空点对对应的位置区域和两个连续时间段中,驻留时间大于第二时间阈值的驻留行为数量,将统计得到的驻留行为数量作为该第一时空点对中两个时空点之间的驻留权重。
举例来说,时空点1对应位置区域A,周一8:00-9:00;时空点2对应位置区域A,周二9:00-10:00;时空点3对应位置区域A,周二10:00-11:00;第二时间阈值为30分钟。由于时空点1和时空点2位置区域相同,且时间段相邻,因此上述2个时空点是一个第一时空点对。同样地,时空点2和时空点3是一个第一时空点对。若轨迹数据A1是在位置区域A中从周一8:10驻留至周一8:45,且预设的第二时间阈值为30分钟,那么轨迹数据A1对应的用户活动行为是驻留行为,且轨迹数据A1可以被确定为第一轨迹分段数据A1;若轨迹数据A2是在位置区域A中从周一8:20驻留至周一9:45,且预设的第二时间阈值为30分钟,那么轨迹数据A2对应的用户活动行为是驻留行为,且轨迹数据A2可以被确定为第一轨迹分段数据A2;若轨迹数据A3是在位置区域A中从周一9:50驻留至周一10:30,且预设的第二时间阈值为30分钟,那么轨迹数据A3对应的用户活动行为是驻留行为,且轨迹数据A3可以被确定为第一轨迹分段数据A3;若轨迹数据A4是在位置区域A中从周一8:05驻留至周一11:00,且预设的第二时间阈值为30分钟,那么轨迹数据A4对应的用户活动行为是驻留行为,且轨迹数据A4可以被确定为第一轨迹分段数据A4。上述可知,4个轨迹数据均对应驻留行为,在时空点1和时空点2对应的第一时空点对中,驻留行为数量为3,分别由第一轨迹分段数据A1,第一轨迹分段数据A2,以及第一轨迹分段数据A4确定。在时空点2和时空点3对应的第一时空点对中,驻留行为数量为2,分别由第一轨迹分段数据A3,以及第一轨迹分段数据A4确定。
采用上述方法,可以为所有的第一时空点对中的两个时空点之间设置驻留权重。根据驻留权重和时空点,可以构建第一轨迹移动网络,上述第一轨迹移动网络中的每个节点对应一个时空点,时空点的数量就等于第一轨迹移动网络中节点的数量,且第一轨迹移动网络中节点之间的权重即是对应时空点之间的驻留权重,上述可知,在第一轨迹移动网络中,只有位置区域相同且时间段相邻的两个时空点(第一时空点对)之间才存在对应的连接边,连接边的权重即是驻留权重。
构建第二轨迹移动网络的具体过程是:首先将位置区域相同,但间隔目标时长的两个时空点作为第二时空点对。下面以一个第二时空点对为例进行说明,统计与第二时空点对两个时空点对应的周期访问行为数量,由于周期访问行为是间隔目标周期访问同一区域的行为,且目标周期是一个时间区间,因此目标时长的取值等于目标周期的左区间取值。例如,一个时空点的时间段为1小时,且目标周期是24小时-25小时,那么对应地目标时长是24小时。需要说明的是,只有周期访问行为对应的第二轨迹分段数据的起点(位置区域起点以及时间起点)和终点(位置区域终点以及时间终点)分别属于第二时空点对中的两个时空点,该周期访问行为才能被确定为与第二时空点中两个时空点对应的周期访问行为。
举例来说,时空点1对应位置区域A,周一8:00-9:00;时空点2对应位置区域A,周二8:00-9:00;时空点3对应位置区域A,周二,9:00-10:00。若目标周期是24小时-25小时,那么目标时长为24小时。若轨迹数据A是:在周一的8:20访问区域A一直到在周二的9:10访问区域A之间的所有轨迹数据,那么轨迹数据A对应的用户活动行为是周期访问行为,且轨迹数据A可以被确定为第二轨迹分段数据A。对时空点1和时空点2来说,由于间隔24小时,因此是一个第二时空点对。第二轨迹分段数据A的起点是位置区域A,周一的8:20,终点是位置区域A,周二的9:10,由于起点属于时空点1,但终点不属于时空点2(而是属于时空点3),因此第二轨迹分段数据A对应周期访问行为不能被确定为与第二时空点对中两个时空点1和时空点2对应的周期访问行为。若轨迹数据B是在周一的8:20访问区域A一直到在周二的8:50访问区域A之间的所有轨迹数据,那么轨迹数据B对应的用户活动行为是周期访问行为,且轨迹数据B可以被确定为第二轨迹分段数据B。第二轨迹分段数据B的起点是位置区域A,周一的8:20,终点是位置区域A,周二的8:50,由于起点属于时空点1,且终点属于时空点2,因此第二轨迹分段数据B对应周期访问行为可以被确定为与第二时空点对中两个时空点1和时空点2对应的周期访问行为。
采用上述方法,可以为所有的第二时空点对中的两个时空点之间设置周期访问权重。根据周期访问权重和时空点,可以构建第二轨迹移动网络,上述第二轨迹移动网络中的每个节点对应一个时空点,且第二轨迹移动网络中节点之间的权重即是对应时空点之间的周期访问权重,上述可知,在第二轨迹移动网络中,只有位置区域相同且间隔目标时长的两个时空点(第二时空点对)之间才存在对应的连接边,连接边的权重即是周期访问权重。
构建第三轨迹移动网络的具体过程是:从所有时空点中提取两个时空点,分别为第一时空点和第二时空点。统计从第一时空点跳转至第二时空点的跳转行为数量,由于发生跳转行为的两个时空点是位置区域不同的两个时空点,为了提高运算效率,选取的第一时空点和第二时空点可以是位置区域不同的两个时空点,对那些位置区域相同的两个时空点就不被选取。将跳转行为数量除以第一时空点对应的位置区域和第二时空点对应的位置区域之间的真实位置距离所得到的商,确定为第一时空点到第二时空点之间的跳转权重。根据跳转权重和时空点,可以构建第三轨迹移动网络,上述第三轨迹移动网络中的每个节点对应一个时空点,且第三轨迹移动网络中节点之间的权重即是对应时空点之间的跳转权重,上述可知,在第三轨迹移动网络中,只有位置区域不同的两个时空点之间才存在对应的连接边,连接边的权重即是跳转权重,且第三轨迹移动网络中的连接边的有向边,第一轨迹移动网络和第二轨迹移动网络中的连接边是无向边。
下面以多个时空点中的任意一个时空点(辅助时空点vi)为例进行说明,如何计算辅助时空点vi的目标表征向量。根据第一轨迹移动网络中辅助时空点vi与其余时空点之间的驻留权重,采用公式(1)可以计算辅助时空点vi与其余辅助时空点之间的驻留权重分布:
其中,公式(1)是计算辅助时空点vi和时空点vj之间的实际生成概率,由辅助时空点vi与其余所有时空点之间的实际生成概率组合而成的向量,即是辅助时空点vi对应的驻留权重分布,可以采用相同的方式计算所有时空点分别对应的驻留权重分布。wij是辅助时空点vi和时空点vj之间的驻留权重,di是辅助时空点vi的度,辅助时空点vi的度的计算方式是辅助时空点vi与k近邻时空点之间的驻留权重之和。若两个时空点之间不存在驻留权重,那么它们之间的驻留权重被确定为0。
相似地,根据第二轨迹移动网络中多个时空点之间的周期访问权重,和公式(1)可以计算所有时空点分别对应的周期访问权重分布:根据第三轨迹移动网络中多个时空点之间的跳转权重,和公式(1)可以计算所有时空点分别对应的跳转权重分布。若两个时空点之间不存在周期访问权重,那么它们之间的周期访问权重被确定为0。若两个时空点之间不存在跳转权重,那么它们之间的跳转权重被确定为0。
采用梯度下降模型中梯度下降算法,根据所有时空点分别对应的驻留权重分布、所有时空点分别对应的周期访问权重分布以及所有时空点分别对应的跳转权重分布,计算辅助时空点vi对应的目标表征向量,使得辅助时空点vi的目标表征向量对应的目标权重分布和辅助时空点vi对应的驻留权重分布之间的相对熵、辅助时空点vi对应的目标权重分布和辅助时空点vi对应的周期访问权重分布之间的相对熵、辅助时空点vi对应的目标权重分布和辅助时空点vi对应的跳转权重分布之间的相对熵之和最小。辅助时空点vi的目标表征向量是通过学习关于辅助时空点vi的3种权重分布,不断地迭代优化,使得该时空点的目标权重分布和上述3种权重分布尽可能相似得到的。其中,辅助时空点vi的目标表征向量对应的目标权重分布可以采用公式(2)计算:
其中,公式(2)表示辅助时空点vi和时空点vj之间估计生成概率,由辅助时空点vi与其余所有时空点之间的估计生成概率组合而成的向量,即是辅助时空点vi的目标表征向量对应的目标权重分布。其中的表示辅助时空点vi对应的目标表征向量,公式(2)定义了辅助时空点vi的条件分布p(·|vi)。为了保持二阶相似性,梯度下降模型中的目标函数可以为公式(3):
其中,公式(3)中的KL函数是用于计算的真实权重分布(包括:驻留权重分布、周期访问权重分布和跳转权重分布)和目标权重分布之间的相对熵,OWW表示所有时空点对应的驻留权重分布和与之对应的目标权重分布之间的相对熵之和;OLL表示所有时空点对应的周期访问权重分布和与之对应的目标权重分布之间的相对熵之和;OTT表示表示所有时空点对应的跳转权重分布和与之对应的目标权重分布之间的相对熵之和。通过梯度下降模型中的梯度下降算法,迭代更新每个时空点的目标权重分布,使得每个时空点的目标权重分布和对应的3种真实权重分布之间的相对熵之和最小,即学习3种轨迹网络中的特征。
上述是采用3种轨迹移动网络,学习每个时空点对应的目标表征向量。在平衡精度和计算量中,也可以只采用任意一种轨迹移动网络学习每个时空点对应的目标表征向量;或者采用任意两种轨迹移动网络学习每个时空点对应的目标表征向量。
步骤S104,根据所述目标表征向量,分别确定每个时空点与多种位置兴趣点类别之间的访问频率。
具体的,确定了每个时空点对应的目标表征向量后,将每个时空点对应的目标表征向量输入多层感知机模型(如上述图1c对应实施例中的感知机模型10f)中的输入层。基于多层感知机模型中的隐藏层所对应的连接权重、偏移项以及激活函数,更新每个目标表征向量。一个隐藏层更新一次目标表征向量的具体过程是:将目标表征向量乘以连接权重,加上偏移项,所得到的结果采用激活函数运算一次,运算完成后,所得到的向量即是一个隐藏层更新一次目标表征向量所得到的结果。隐藏层更新目标表征向量可以用公式(4)表示:
S(x)=f(b1+W1x) (4)
其中,公式(4)中的f为激活函数,b1和W1分别表示一个隐藏层的偏移项和连接权重。当然,多层感知机模型中可以包括多个隐藏层,一个隐藏层对应一次更新。激活函数可以是公式(5)对应的函数:
若多层感知机模型中包括多个隐藏层,那么上述对目标表征向量的多次更新可以表示为公式(6):
S(x)=f(bn+Wn...f(f(b2+W2f(b1+W1x)))) (6)
将经过隐藏层对目标表征向量更新后得到的向量称为目标感知向量,即是将从隐藏层输出的向量称为目标感知向量。每个时空点都存在与之对应的目标感知向量。
将目标感知向量输入多层感知模型中的输出层,该输出层是一个训练完成的多分类器回归函数,该分类器中包括多种POI类别,多分类器回归函数即是计算目标感知向量和该分类器中的多个POI类别之间的匹配度,将计算得到的匹配度作为该时空点与多种POI类别之间的访问频率。例如,时空点A对应目标感知向量A,分类器中包括3种POI类别,分别是:餐饮服务类别、医疗服务类别以及生活服务器类别,计算目标感知向量A与餐饮服务类别之间的匹配度为50;目标感知向量A与医疗服务类别之间的匹配度为80;目标感知向量A与生活服务类别之间的匹配度为60。因此,时空点A访问餐饮服务类别的访问频率是50;时空点A访问医疗服务类别的访问频率是80;时空点A访问生活服务类别的访问频率是60。其中,多层感知机模型中隐藏层的连接权重、偏移项以及多分类器回归函数的训练方式可以采用反向传播算法获得。
请一并参见图2b,是发明实施例提供的一种轨迹数据处理方法的结果对比示意图。为了说明本发明确定的不同时空点访问各类POI访问频率的准确性,将根据静态POI分布预测不同区域不同时间段各类POI的访问频率为参考对象,和本发明中的以各时空点分别对应的目标表征向量预测不同区域不同时间段各类POI的访问频率作对比。其中,静态POI分布是指多种类型的POI在不同区域的分布数量。采用均方误差度量预测的结果,均方误差越小,说明预测结果越准确;相反均方误差越大,说明预测结果越差。从图2b可以看出,使用本发明的目标表征向量进行预测相比使用静态POI分布进行预测,均方误差降低了13%;进一步地,即使同时使用两种特征(即同时使用静态POI分布和目标表征向量),均方误差没有明显的提高。因此,可以看出降低均方误差的影响因素主要还是本发明中的目标表征向量,本发明所预测的结果具有显著性。
进一步地,请参见图2c,是发明实施例提供的另一种轨迹数据处理方法的结果对比示意图。从图2c可以看出,相比推测存在平均数量(平均数量小于300)驻留点对应的区域不同时间段各类POI访问频率,推测存在300个驻留点以上的区域不同时间段各类POI访问频率具有更低的均方误差,进一步地,推测存在1000个驻留点以上的区域不同时间段各类POI访问频率具有最低的均方误差,由此可以看出,如果获得的用户轨迹数据中具有更多的驻留点,即用户发生更稠密的移动行为,那么由上述用户轨迹数据所确定的每个时空点与多种位置兴趣点类别之间的访问频率具有更好的预测效果。
本发明实施根据表征用户行为的行为轨迹数据以及,与行为轨迹数据对应的时间信息,可以分别提取不同时空点的动态特征向量,即确定不同区域在不同时间段的功能,进而识别时空点与多种POI类别的访问频率,由于从时间和空间两个维度上共同分析不同时空点与各类POI之间的访问频率,可以从时间上动态地预测不同区域不同时间段访问各类POI的访问频率,避免单一地预测出同一个区域在所有时间段访问各类POI的频率都相同,可以提高识别不同区域在不同时段对各类POI的访问频率的准确率。
请参见图3,是本发明实施例提供的一种轨迹数据处理方法的流程示意图。如图3所示,所述轨迹数据处理方法可以包括:
步骤S201,获取用户行为轨迹数据,并获取与所述用户行为轨迹数据相关联的用户时间信息。
步骤S202,根据所述用户行为轨迹数据和所述用户时间信息设置多个时空点;一个时空点对应一个时间段内的一个位置区域。
步骤S203,根据所述用户行为轨迹数据和所述用户时间信息,提取各时空点分别对应的目标表征向量。
步骤S204,根据所述目标表征向量,分别确定每个时空点与多种位置兴趣点类别之间的访问频率。
其中,步骤S201-步骤S204的具体实现方式可以参见上述图2a所对应实施例中的步骤S101-步骤S104。
下述步骤S205-步骤S207描述的是根据每个时空点与多个POI类别之间访问频率,向终端显示当前所处时空点对应的访问频率较高的POI。下述过程可以应用在用户推荐系统中,可以根据每个时空点与多个POI类别之间访问频率,向用户推荐当前所处时空点对应的访问频率较高的POI,以提高推荐准确率。
步骤S205,获取目标终端的目标时间点和目标位置区域,将与所述目标时间点和所述目标位置区域对应的时空点,作为目标时空点。
具体的,获取目标终端当前时间点和当前位置区域,将获取到的当前时间点作为目标时间点,获取到的当前位置区域作为目标位置区域。在多个时空点中确定目标时空点,其中目标时空点中的位置区域和目标位置区域相同,且目标时间点处于目标时空点中的时间段内。例如,时空点1对应位置区域A,8:00-9:00;时空点2对应位置区域A,9:00-10:00;时空点3对应位置区域B,10:00-11:00;若获取到目标终终端的目标时间点是9:20,且目标位置区域是区域A,那么与目标时间点“9:20”、目标位置区域“区域A”对应的时空点是时空点2。
步骤S206,在所述目标时空点对应的多种访问频率中,选择最大访问频率所关联的位置兴趣点类别,作为目标位置兴趣点类别。
具体的,在目标时空点对应的与多种位置兴趣点类别的访问频率中,选择最大访问频率对应的位置兴趣点类别,作为目标位置兴趣点类别。
步骤S207,在所述目标终端中显示所述目标位置兴趣点类别。
具体的,在目标终端的屏幕上显示选择出来的目标位置兴趣点类别。
本发明实施根据表征用户行为的行为轨迹数据以及,与行为轨迹数据对应的时间信息,可以分别提取不同时空点的动态特征向量,即确定不同区域在不同时间段的功能,进而识别时空点与多种POI类别的访问频率,由于从时间和空间两个维度上共同分析不同时空点与各类POI之间的访问频率,可以从时间上动态地预测不同区域不同时间段访问各类POI的访问频率,避免单一地预测出同一个区域在所有时间段访问各类POI的频率都相同,可以提高识别不同区域在不同时段对各类POI的访问频率的准确率。
进一步的,请参见图4,是本发明实施例提供的一种轨迹数据处理装置的结构示意图。如图4所示,轨迹数据处理装置1可以包括:获取模块11、设置模块12、提取模块13、确定模块14;
获取模块11,用于获取用户行为轨迹数据,并获取与所述用户行为轨迹数据相关联的用户时间信息;
设置模块12,用于根据所述用户行为轨迹数据和所述用户时间信息设置多个时空点;一个时空点对应一个时间段内的一个位置区域;
提取模块13,用于根据所述用户行为轨迹数据和所述用户时间信息,提取各时空点分别对应的目标表征向量
确定模块14,用于根据所述目标表征向量,分别确定每个时空点与多种位置兴趣点类别之间的访问频率。
其中,获取模块11、设置模块12、提取模块13、确定模块14的具体功能实现方式可以参见上述图2a对应实施例中的步骤S101-步骤S104,这里不再进行赘述。
请参见图4,获取模块11可以包括:获取单元111、查找单元112、构建单元113。
获取单元111,用于获取原始轨迹数据和与所述原始轨迹数据相关联的原始时间信息;
查找单元112,用于在所述原始轨迹数据中,查找处于目标范围内,且在所述目标范围内的驻留时长大于第一时间阈值的原始轨迹分段数据,将所查找到的所述原始轨迹分段数据合并为驻留点;
构建单元113,用于构建包含所述驻留点的所述用户行为轨迹数据,并将所述驻留点对应的原始时间信息确定为所述用户时间信息。
其中,获取单元111、查找单元112、构建单元113的具体功能实现方式可以参见上述图2a对应实施例中的步骤S101,这里不再进行赘述。
请参见图4,提取模块13可以包括:识别单元131、第一提取单元132、第二提取单元133。
识别单元131,用于根据所述用户时间信息,识别所述用户轨迹数据的用户活动行为;
第一提取单元132,用于根据所述用户行为的数量和所述多个时空点构建轨迹移动网络;
第二提取单元133,用于根据所述轨迹移动网络,提取每个时空点对应的目标表征向量。
其中,识别单元131、第一提取单元132、第二提取单元133的具体功能实现方式可以参见上述图2a对应实施例中的步骤S103,这里不再进行赘述。
请参见图4,用户活动行为包括:驻留行为、周期访问行为和跳转行为;
识别单元131可以包括:第一确定子单元1311、第二确定子单元1312。
第一确定子单元1311,用于根据所述用户轨迹数据和所述用户时间信息,将在同一位置区域内的驻留时间大于第二时间阈值的第一轨迹分段数据对应的用户活动行为,确定为所述驻留行为;
第二确定子单元1312,用于根据所述用户轨迹数据和所述用户时间信息,将每间隔目标周期访问同一位置区域的第二轨迹分段数据对应的用户活动行为,确定为所述周期访问行为;
所述第二确定子单元1312,还用于根据所述用户轨迹数据和所述用户时间信息,将在两个不同位置区域之间移动的第三轨迹分段数据对应的用户活动行为,确定为所述跳转行为;
其中,所述第一轨迹分段数据、所述第二轨迹分段数据和所述第三轨迹分段数据均属于所述用户轨迹数据。
其中,第一确定子单元1311、第二确定子单元1312的具体功能实现方式可以参见上述图2a对应实施例中的步骤S103,这里不再进行赘述。
请参见图4,轨迹移动网络包括:驻留行为对应的第一轨迹移动网络、周期访问行为对应的第二轨迹移动网络和跳转行为对应的第三轨迹移动网络;
第一提取单元132可以包括:第三确定子单元1321、统计子单元1322、构建子单元1323。
第三确定子单元1321,用于将位置区域相同,且时间段相邻的两个时空点确定为第一时空点对;
统计子单元1322,用于统计在所述第一时空点对内的驻留行为数量,将所述驻留行为数量作为所述第一时空点对中两个时空点之间的驻留权重;
构建子单元1323,用于根据所述多个时空点和所述多个时空点之间的驻留权重,构建所述第一轨迹移动网络;
所述第三确定子单元1321,还用于将位置区域相同,且间隔目标时长的两个时空点确定为第二时空点对;
所述统计子单元1322,还用于统计与所述第二时空点对中两个时空点对应的周期访问行为数量,将所述周期访问行为数量作为所述第二时空点对中两个时空点之间的周期访问权重;
所述构建子单元1323,还用于根据所述多个时空点和所述多个时空点之间的周期访问权重,构建所述第二轨迹移动网络;
所述第三确定子单元1321,还用于从所有时空点中提取两个时空点,分别作为第一时空点和第二时空点;
所述统计子单元1322,还用于统计从所述第一时空点跳转至所述第二时空点的跳转行为数量,根据所述跳转行为数量、所述第一时空点和所述第二时空点之间的真实位置距离,确定从所述第一时空点到所述第二时空点的跳转权重;
所述构建子单元1323,还用于根据所述多个时空点和所述多个时空点之间的跳转权重,构建所述第三轨迹移动网络。
其中,第三确定子单元1321、统计子单元1322、构建子单元1323的具体功能实现方式可以参见上述图2a对应实施例中的步骤S103,这里不再进行赘述。
请参见图4,第二提取单元133可以包括:第四确定子单元1331、计算子单元1332。
第四确定子单元1331,用于根据所述第一轨迹移动网络,确定所述第一轨迹移动网络中各时空点分别对应的驻留权重分布;
所述第四确定子单元1331,还用于根据所述第二轨迹移动网络,确定所述第二轨迹移动网络中各时空点分别对应的周期访问权重分布;
所述第四确定子单元1331,还用于根据所述第三轨迹移动网络,确定所述第三轨迹移动网络中各时空点分别对应的跳转权重分布;
计算子单元1332,用于根据梯度下降模型、所述驻留权重分布、所述周期访问权重分布和所述跳转权重分布,计算各时空点分别对应的目标表征向量,使得辅助时空点的目标表征向量对应的目标权重分布和所述辅助时空点对应驻留权重分布之间的相对熵、所述目标权重分布和所述辅助时空点对应周期访问权重分布之间的相对熵、所述目标权重分布和所述辅助时空点对应跳转权重分布之间的相对熵之和最小;所述辅助时空点属于所述多个时空点。
其中,第四确定子单元1331、计算子单元1332的具体功能实现方式可以参见上述图2a对应实施例中的步骤S103,这里不再进行赘述。
请参见图4,确定模块14可以包括:输入单元141、更新单元142、输出单元143。
输入单元141,用于将所述目标表征向量输入目标多层感知机模型的输入层;
更新单元142,用于基于所述目标多层感知机模型中的隐藏层所对应的连接权重和偏移项,更新各时空点对应的目标表征向量,得到所述各时空点对应的目标感知向量;
输出单元143,用于基于所述目标多层感知机模型中的输出层,识别各目标感知向量与所述目标多层感知机模型中的多种位置兴趣点类别之间的匹配度,将各目标感知向量对应的多个匹配度确定为各时空点与多种位置兴趣点类别之间的访问频率。
其中,输入单元141更新单元142、输出单元143的具体功能实现方式可以参见上述图2a对应实施例中的步骤S104,这里不再进行赘述。
请参见图4,轨迹数据处理装置1可以包括:获取模块11、设置模块12、提取模块13、确定模块14,还可以包括:选择模块15、显示模块16。
所述设置模块12,还用于获取目标终端的目标时间点和目标位置区域,将与所述目标时间点和所述目标位置区域对应的时空点,作为目标时空点;
选择模块15,用于在所述目标时空点对应的多种访问频率中,选择最大访问频率所关联的位置兴趣点类别,作为目标位置兴趣点类别;
显示模块16,用于在所述目标终端中显示所述目标位置兴趣点类别。
其中,设置模块12、选择模块15、显示模块16的具体功能实现方式可以参见上述图3对应实施例中的步骤S205-步骤S207,这里不再进行赘述。
本发明实施根据表征用户行为的行为轨迹数据以及,与行为轨迹数据对应的时间信息,可以分别提取不同时空点的动态特征向量,即确定不同区域在不同时间段的功能,进而识别时空点与多种POI类别的访问频率,由于从时间和空间两个维度上共同分析不同时空点与各类POI之间的访问频率,可以从时间上动态地预测不同区域不同时间段访问各类POI的访问频率,避免单一地预测出同一个区域在所有时间段访问各类POI的频率都相同,可以提高识别不同区域在不同时段对各类POI的访问频率的准确率。
进一步地,请参见图5,是本发明实施例提供的一种电子设备的结构示意图。如图5所示,上述图5中的轨迹数据处理装置1可以应用于所述电子设备1000,所述电子设备1000可以包括:处理器1001,网络接口1004和存储器1005,此外,所述电子设备1000还可以包括:用户接口1003,和至少一个通信总线1002。其中,通信总线1002用于实现这些组件之间的连接通信。其中,用户接口1003可以包括显示屏(Display)、键盘(Keyboard),可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如WI-FI接口)。存储器1005可以是高速RAM存储器,也可以是非不稳定的存储器(non-volatile memory),例如至少一个磁盘存储器。存储器1005可选的还可以是至少一个位于远离前述处理器1001的存储装置。如图5所示,作为一种计算机存储介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及设备控制应用程序。
在图5所示的电子设备1000中,网络接口1004可提供网络通讯功能;而用户接口1003主要用于为用户提供输入的接口;而处理器1001可以用于调用存储器1005中存储的设备控制应用程序,以实现:
获取用户行为轨迹数据,并获取与所述用户行为轨迹数据相关联的用户时间信息;
根据所述用户行为轨迹数据和所述用户时间信息设置多个时空点;一个时空点对应一个时间段内的一个位置区域;
根据所述用户行为轨迹数据和所述用户时间信息,提取各时空点分别对应的目标表征向量;
根据所述目标表征向量,分别确定每个时空点与多种位置兴趣点类别之间的访问频率。
在一个实施例中,所述处理器1001在执行获取用户行为轨迹数据,并获取与所述用户行为轨迹数据相关联的用户时间信息时,具体执行以下步骤:
获取原始轨迹数据和与所述原始轨迹数据相关联的原始时间信息;
在所述原始轨迹数据中,查找处于目标范围内,且在所述目标范围内的驻留时长大于第一时间阈值的原始轨迹分段数据,将所查找到的所述原始轨迹分段数据合并为驻留点;
构建包含所述驻留点的所述用户行为轨迹数据,并将所述驻留点对应的原始时间信息确定为所述用户时间信息。
在一个实施例中,所述处理器1001在执行根据所述用户行为轨迹数据和所述用户时间信息,提取各时空点分别对应的目标表征向量时,具体执行以下步骤:
根据所述用户时间信息,识别所述用户轨迹数据的用户活动行为;
根据所述用户行为的数量和所述多个时空点构建轨迹移动网络,并根据所述轨迹移动网络,提取每个时空点对应的目标表征向量。
在一个实施例中,所述用户活动行为包括:驻留行为、周期访问行为和跳转行为;
所述处理器1001在执行根据所述用户时间信息,识别所述用户轨迹数据的用户活动行为时,具体执行以下步骤:
根据所述用户轨迹数据和所述用户时间信息,将在同一位置区域内的驻留时间大于第二时间阈值的第一轨迹分段数据对应的用户活动行为,确定为所述驻留行为;
根据所述用户轨迹数据和所述用户时间信息,将每间隔目标周期访问同一位置区域的第二轨迹分段数据对应的用户活动行为,确定为所述周期访问行为;
根据所述用户轨迹数据和所述用户时间信息,将在两个不同位置区域之间移动的第三轨迹分段数据对应的用户活动行为,确定为所述跳转行为;
其中所述第一轨迹分段数据、所述第二轨迹分段数据和所述第三轨迹分段数据均属于所述用户轨迹数据。
在一个实施例中,所述轨迹移动网络包括:驻留行为对应的第一轨迹移动网络、周期访问行为对应的第二轨迹移动网络和跳转行为对应的第三轨迹移动网络;
所述处理器1001在执行根据所述用户行为的数量和所述多个时空点构建轨迹移动网络时,具体执行以下步骤:
将位置区域相同,且时间段相邻的两个时空点确定为第一时空点对;
统计在所述第一时空点对内的驻留行为数量,将所述驻留行为数量作为所述第一时空点对中两个时空点之间的驻留权重;
根据所述多个时空点和所述多个时空点之间的驻留权重,构建所述第一轨迹移动网络;
将位置区域相同,且间隔目标时长的两个时空点确定为第二时空点对;
统计与所述第二时空点对中两个时空点对应的周期访问行为数量,将所述周期访问行为数量作为所述第二时空点对中两个时空点之间的周期访问权重;
根据所述多个时空点和所述多个时空点之间的周期访问权重,构建所述第二轨迹移动网络;
从所有时空点中提取两个时空点,分别作为第一时空点和第二时空点;
统计从所述第一时空点跳转至所述第二时空点的跳转行为数量,根据所述跳转行为数量、所述第一时空点和所述第二时空点之间的真实位置距离,确定从所述第一时空点到所述第二时空点的跳转权重;
根据所述多个时空点和所述多个时空点之间的跳转权重,构建所述第三轨迹移动网络。
在一个实施例中,所述处理器1001在执行根据所述轨迹移动网络,提取每个时空点对应的目标表征向量时,具体执行以下步骤:
根据所述第一轨迹移动网络,确定所述第一轨迹移动网络中各时空点分别对应的驻留权重分布;
根据所述第二轨迹移动网络,确定所述第二轨迹移动网络中各时空点分别对应的周期访问权重分布;
根据所述第三轨迹移动网络,确定所述第三轨迹移动网络中各时空点分别对应的跳转权重分布;
根据梯度下降模型、所述驻留权重分布、所述周期访问权重分布和所述跳转权重分布,计算各时空点分别对应的目标表征向量,使得辅助时空点的目标表征向量对应的目标权重分布和所述辅助时空点对应驻留权重分布之间的相对熵、所述目标权重分布和所述辅助时空点对应周期访问权重分布之间的相对熵、所述目标权重分布和所述辅助时空点对应跳转权重分布之间的相对熵之和最小;所述辅助时空点属于所述多个时空点。
在一个实施例中,所述处理器1001在执行根据所述目标表征向量,分别确定每个时空点与多种位置兴趣点类别之间的访问频率时,具体执行以下步骤:
将所述目标表征向量输入目标多层感知机模型的输入层;
基于所述目标多层感知机模型中的隐藏层所对应的连接权重和偏移项,更新各时空点对应的目标表征向量,得到所述各时空点对应的目标感知向量;
基于所述目标多层感知机模型中的输出层,识别各目标感知向量与所述目标多层感知机模型中的多种位置兴趣点类别之间的匹配度,将各目标感知向量对应的多个匹配度确定为各时空点与多种位置兴趣点类别之间的访问频率。
在一个实施例中,所述处理器1001还执行以下步骤:
获取目标终端的目标时间点和目标位置区域,将与所述目标时间点和所述目标位置区域对应的时空点,作为目标时空点;
在所述目标时空点对应的多种访问频率中,选择最大访问频率所关联的位置兴趣点类别,作为目标位置兴趣点类别;
在所述目标终端中显示所述目标位置兴趣点类别。
本发明实施根据表征用户行为的行为轨迹数据以及,与行为轨迹数据对应的时间信息,可以分别提取不同时空点的动态特征向量,即确定不同区域在不同时间段的功能,进而识别时空点与多种POI类别的访问频率,由于从时间和空间两个维度上共同分析不同时空点与各类POI之间的访问频率,可以从时间上动态地预测不同区域不同时间段访问各类POI的访问频率,避免单一地预测出同一个区域在所有时间段访问各类POI的频率都相同,可以提高识别不同区域在不同时段对各类POI的访问频率的准确率。
应当理解,本发明实施例中所描述的电子设备1000可执行前文图2a到图3所对应实施例中对所述轨迹数据处理方法的描述,也可执行前文图4所对应实施例中对所述轨迹数据处理装置1的描述,在此不再赘述。另外,对采用相同方法的有益效果描述,也不再进行赘述。
此外,这里需要指出的是:本发明实施例还提供了一种计算机存储介质,且所述计算机存储介质中存储有前文提及的轨迹数据处理装置1所执行的计算机程序,且所述计算机程序包括程序指令,当所述处理器执行所述程序指令时,能够执行前文图2a到图3所对应实施例中对所述轨迹数据处理方法的描述,因此,这里将不再进行赘述。另外,对采用相同方法的有益效果描述,也不再进行赘述。对于本发明所涉及的计算机存储介质实施例中未披露的技术细节,请参照本发明方法实施例的描述。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)或随机存储记忆体(Random AccessMemory,RAM)等。
以上所揭露的仅为本发明较佳实施例而已,当然不能以此来限定本发明之权利范围,因此依本发明权利要求所作的等同变化,仍属本发明所涵盖的范围。

Claims (15)

1.一种轨迹数据处理方法,其特征在于,包括:
获取用户行为轨迹数据,并获取与所述用户行为轨迹数据相关联的用户时间信息;
根据所述用户行为轨迹数据和所述用户时间信息设置多个时空点;一个时空点对应一个时间段内的一个位置区域;
根据所述用户行为轨迹数据和所述用户时间信息,提取各时空点分别对应的目标表征向量;
根据所述目标表征向量,分别确定每个时空点与多种位置兴趣点类别之间的访问频率。
2.根据权利要求1所述的方法,其特征在于,所述获取用户行为轨迹数据,并获取与所述用户行为轨迹数据相关联的用户时间信息,包括:
获取原始轨迹数据和与所述原始轨迹数据相关联的原始时间信息;
在所述原始轨迹数据中,查找处于目标范围内,且在所述目标范围内的驻留时长大于第一时间阈值的原始轨迹分段数据,将所查找到的所述原始轨迹分段数据合并为驻留点;
构建包含所述驻留点的所述用户行为轨迹数据,并将所述驻留点对应的原始时间信息确定为所述用户时间信息。
3.根据权利要求1所述的方法,其特征在于,所述根据所述用户行为轨迹数据和所述用户时间信息,提取各时空点分别对应的目标表征向量,包括:
根据所述用户时间信息,识别所述用户轨迹数据的用户活动行为;
根据所述用户行为的数量和所述多个时空点构建轨迹移动网络,并根据所述轨迹移动网络,提取每个时空点对应的目标表征向量。
4.根据权利要求3所述的方法,其特征在于,所述用户活动行为包括:驻留行为、周期访问行为和跳转行为;
所述根据所述用户时间信息,识别所述用户轨迹数据的用户活动行为,包括:
根据所述用户轨迹数据和所述用户时间信息,将在同一位置区域内的驻留时间大于第二时间阈值的第一轨迹分段数据对应的用户活动行为,确定为所述驻留行为;
根据所述用户轨迹数据和所述用户时间信息,将每间隔目标周期访问同一位置区域的第二轨迹分段数据对应的用户活动行为,确定为所述周期访问行为;
根据所述用户轨迹数据和所述用户时间信息,将在两个不同位置区域之间移动的第三轨迹分段数据对应的用户活动行为,确定为所述跳转行为;
其中,所述第一轨迹分段数据、所述第二轨迹分段数据和所述第三轨迹分段数据均属于所述用户轨迹数据。
5.根据权利要求4所述的方法,其特征在于,所述轨迹移动网络包括:驻留行为对应的第一轨迹移动网络、周期访问行为对应的第二轨迹移动网络和跳转行为对应的第三轨迹移动网络;
所述根据所述用户行为的数量和所述多个时空点构建轨迹移动网络,包括:
将位置区域相同,且时间段相邻的两个时空点确定为第一时空点对;
统计在所述第一时空点对内的驻留行为数量,将所述驻留行为数量作为所述第一时空点对中两个时空点之间的驻留权重;
根据所述多个时空点和所述多个时空点之间的驻留权重,构建所述第一轨迹移动网络;
将位置区域相同,且间隔目标时长的两个时空点确定为第二时空点对;
统计与所述第二时空点对中两个时空点对应的周期访问行为数量,将所述周期访问行为数量作为所述第二时空点对中两个时空点之间的周期访问权重;
根据所述多个时空点和所述多个时空点之间的周期访问权重,构建所述第二轨迹移动网络;
从所有时空点中提取两个时空点,分别作为第一时空点和第二时空点;
统计从所述第一时空点跳转至所述第二时空点的跳转行为数量,根据所述跳转行为数量、所述第一时空点和所述第二时空点之间的真实位置距离,确定从所述第一时空点到所述第二时空点的跳转权重;
根据所述多个时空点和所述多个时空点之间的跳转权重,构建所述第三轨迹移动网络。
6.根据权利要求5所述的方法,其特征在于,所述根据所述轨迹移动网络,提取每个时空点对应的目标表征向量,包括:
根据所述第一轨迹移动网络,确定所述第一轨迹移动网络中各时空点分别对应的驻留权重分布;
根据所述第二轨迹移动网络,确定所述第二轨迹移动网络中各时空点分别对应的周期访问权重分布;
根据所述第三轨迹移动网络,确定所述第三轨迹移动网络中各时空点分别对应的跳转权重分布;
根据梯度下降模型、所述驻留权重分布、所述周期访问权重分布和所述跳转权重分布,计算各时空点分别对应的目标表征向量,使得辅助时空点的目标表征向量对应的目标权重分布和所述辅助时空点对应驻留权重分布之间的相对熵、所述目标权重分布和所述辅助时空点对应周期访问权重分布之间的相对熵、所述目标权重分布和所述辅助时空点对应跳转权重分布之间的相对熵之和最小;所述辅助时空点属于所述多个时空点。
7.根据权利要求1所述的方法,其特征在于,所述根据所述目标表征向量,分别确定每个时空点与多种位置兴趣点类别之间的访问频率,包括:
将所述目标表征向量输入目标多层感知机模型的输入层;
基于所述目标多层感知机模型中的隐藏层所对应的连接权重和偏移项,更新各时空点对应的目标表征向量,得到所述各时空点对应的目标感知向量;
基于所述目标多层感知机模型中的输出层,识别各目标感知向量与所述目标多层感知机模型中的多种位置兴趣点类别之间的匹配度,将各目标感知向量对应的多个匹配度确定为各时空点与多种位置兴趣点类别之间的访问频率。
8.根据权利要求1所述的方法,其特征在于,还包括:
获取目标终端的目标时间点和目标位置区域,将与所述目标时间点和所述目标位置区域对应的时空点,作为目标时空点;
在所述目标时空点对应的多种访问频率中,选择最大访问频率所关联的位置兴趣点类别,作为目标位置兴趣点类别;
在所述目标终端中显示所述目标位置兴趣点类别。
9.一种轨迹数据处理装置,其特征在于,包括:
获取模块,用于获取用户行为轨迹数据,并获取与所述用户行为轨迹数据相关联的用户时间信息;
设置模块,用于根据所述用户行为轨迹数据和所述用户时间信息设置多个时空点;一个时空点对应一个时间段内的一个位置区域;
提取模块,用于根据所述用户行为轨迹数据和所述用户时间信息,提取各时空点分别对应的目标表征向量;
确定模块,用于根据所述目标表征向量,分别确定每个时空点与多种位置兴趣点类别之间的访问频率。
10.根据权利要求9所述的装置,其特征在于,所述获取模块,包括:
获取单元,用于获取原始轨迹数据和与所述原始轨迹数据相关联的原始时间信息;
查找单元,用于在所述原始轨迹数据中,查找处于目标范围内,且在所述目标范围内的驻留时长大于第一时间阈值的原始轨迹分段数据,将所查找到的所述原始轨迹分段数据合并为驻留点;
构建单元,用于构建包含所述驻留点的所述用户行为轨迹数据,并将所述驻留点对应的原始时间信息确定为所述用户时间信息。
11.根据权利要求9所述的装置,其特征在于,所述提取模块,包括:
识别单元,用于根据所述用户时间信息,识别所述用户轨迹数据的用户活动行为;
第一提取单元,用于根据所述用户行为的数量和所述多个时空点构建轨迹移动网络;
第二提取单元,用于根据所述轨迹移动网络,提取每个时空点对应的目标表征向量。
12.根据权利要求11所述的装置,其特征在于,所述用户活动行为包括:驻留行为、周期访问行为和跳转行为;
所述识别单元,包括:
第一确定子单元,用于根据所述用户轨迹数据和所述用户时间信息,将在同一位置区域内的驻留时间大于第二时间阈值的第一轨迹分段数据对应的用户活动行为,确定为所述驻留行为;
第二确定子单元,用于根据所述用户轨迹数据和所述用户时间信息,将每间隔目标周期访问同一位置区域的第二轨迹分段数据对应的用户活动行为,确定为所述周期访问行为;
所述第二确定子单元,还用于根据所述用户轨迹数据和所述用户时间信息,将在两个不同位置区域之间移动的第三轨迹分段数据对应的用户活动行为,确定为所述跳转行为;
其中所述第一轨迹分段数据、所述第二轨迹分段数据和所述第三轨迹分段数据均属于所述用户轨迹数据。
13.根据权利要求12所述的装置,其特征在于,所述轨迹移动网络包括:驻留行为对应的第一轨迹移动网络、周期访问行为对应的第二轨迹移动网络和跳转行为对应的第三轨迹移动网络;
所述第一提取单元,包括:
第三确定子单元,用于将位置区域相同,且时间段相邻的两个时空点确定为第一时空点对;
统计子单元,用于统计在所述第一时空点对内的驻留行为数量,将所述驻留行为数量作为所述第一时空点对中两个时空点之间的驻留权重;
构建子单元,用于根据所述多个时空点和所述多个时空点之间的驻留权重,构建所述第一轨迹移动网络;
所述第三确定子单元,还用于将位置区域相同,且间隔目标时长的两个时空点确定为第二时空点对;
所述统计子单元,还用于统计与所述第二时空点对中两个时空点对应的周期访问行为数量,将所述周期访问行为数量作为所述第二时空点对中两个时空点之间的周期访问权重;
所述构建子单元,还用于根据所述多个时空点和所述多个时空点之间的周期访问权重,构建所述第二轨迹移动网络;
所述第三确定子单元,还用于从所有时空点中提取两个时空点,分别作为第一时空点和第二时空点;
所述统计子单元,还用于统计从所述第一时空点跳转至所述第二时空点的跳转行为数量,根据所述跳转行为数量、所述第一时空点和所述第二时空点之间的真实位置距离,确定从所述第一时空点到所述第二时空点的跳转权重;
所述构建子单元,还用于根据所述多个时空点和所述多个时空点之间的跳转权重,构建所述第三轨迹移动网络。
14.一种电子设备,其特征在于,包括:处理器和存储器;
所述处理器和存储器相连,其中,所述存储器用于存储程序代码,所述处理器用于调用所述程序代码,以执行如权利要求1-8任一项所述的方法。
15.一种计算机存储介质,其特征在于,所述计算机存储介质存储有计算机程序,所述计算机程序包括程序指令,所述程序指令当被处理器执行时,执行如权利要求1-8任一项所述的方法。
CN201811178191.5A 2018-10-10 2018-10-10 一种轨迹数据处理方法、装置以及相关设备 Active CN110309434B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811178191.5A CN110309434B (zh) 2018-10-10 2018-10-10 一种轨迹数据处理方法、装置以及相关设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811178191.5A CN110309434B (zh) 2018-10-10 2018-10-10 一种轨迹数据处理方法、装置以及相关设备

Publications (2)

Publication Number Publication Date
CN110309434A true CN110309434A (zh) 2019-10-08
CN110309434B CN110309434B (zh) 2023-10-13

Family

ID=68074122

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811178191.5A Active CN110309434B (zh) 2018-10-10 2018-10-10 一种轨迹数据处理方法、装置以及相关设备

Country Status (1)

Country Link
CN (1) CN110309434B (zh)

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111148045A (zh) * 2019-12-30 2020-05-12 中国联合网络通信集团有限公司 用户行为周期提取方法及设备
CN111291092A (zh) * 2020-02-14 2020-06-16 腾讯科技(深圳)有限公司 一种数据处理方法、装置、服务器及存储介质
CN111403021A (zh) * 2020-03-11 2020-07-10 中国电子工程设计院有限公司 一种监测方法及装置
CN111461077A (zh) * 2020-05-12 2020-07-28 北京爱笔科技有限公司 一种移动轨迹事件识别方法及装置
CN111639092A (zh) * 2020-05-29 2020-09-08 京东城市(北京)数字科技有限公司 一种人员流动分析方法、装置、电子设备及存储介质
CN112927270A (zh) * 2021-03-30 2021-06-08 中国建设银行股份有限公司 轨迹生成方法、装置、电子设备及存储介质
CN112991804A (zh) * 2019-12-18 2021-06-18 浙江大华技术股份有限公司 停留区域确定方法以及相关装置
WO2021147431A1 (zh) * 2020-01-21 2021-07-29 腾讯科技(深圳)有限公司 无线热点与兴趣点的映射方法、装置、计算机可读存储介质和计算机设备
CN113407858A (zh) * 2021-08-20 2021-09-17 明品云(北京)数据科技有限公司 信息推送方法、系统、介质和电子设备
CN113901165A (zh) * 2021-10-25 2022-01-07 青岛中科曙光科技服务有限公司 轨迹数据的处理方法、装置、终端及存储介质
CN114530018A (zh) * 2022-04-24 2022-05-24 浙江华眼视觉科技有限公司 一种基于取件人轨迹分析的语音提示方法及装置

Citations (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100211308A1 (en) * 2009-02-19 2010-08-19 Microsoft Corporation Identifying interesting locations
CN103154928A (zh) * 2010-06-24 2013-06-12 奥比融移动有限公司 用于处理非参数化的多维的空间和时间人类行为或普遍测量的技术观测数据的网络服务器装配及其相关方法
US20140019450A1 (en) * 2012-07-12 2014-01-16 Daniela Rus Text characterization of trajectories
CN103679172A (zh) * 2013-10-10 2014-03-26 南京理工大学 一种通过转动红外探测器检测地面远距离运动目标的方法
CN103914563A (zh) * 2014-04-18 2014-07-09 中国科学院上海微系统与信息技术研究所 一种时空轨迹的模式挖掘方法
US20150039217A1 (en) * 2013-07-31 2015-02-05 International Business Machines Corporation Computing a similarity measure over moving object trajectories
CN104391853A (zh) * 2014-09-25 2015-03-04 深圳大学 Poi推荐方法、poi信息处理方法及服务器
CN105095909A (zh) * 2015-07-13 2015-11-25 中国联合网络通信集团有限公司 一种应用于移动网络的用户相似性评估方法及装置
CN105205408A (zh) * 2015-09-07 2015-12-30 中国科学院深圳先进技术研究院 基于空间聚合的轨迹数据隐私保护方法及系统
JP2016057649A (ja) * 2014-09-05 2016-04-21 株式会社明電舎 時系列データの解析方法及び時系列データの異常監視装置
CN105590096A (zh) * 2015-12-18 2016-05-18 运城学院 基于深度映射的人体活动识别特征表达方法
CN106959113A (zh) * 2016-01-08 2017-07-18 中兴通讯股份有限公司 移动终端运动轨迹的匹配方法及装置
CN108256914A (zh) * 2018-01-17 2018-07-06 华东师范大学 一种基于张量分解模型的兴趣点种类预测方法
CN108509434A (zh) * 2017-02-23 2018-09-07 中国移动通信有限公司研究院 一种群体用户的挖掘方法及装置

Patent Citations (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100211308A1 (en) * 2009-02-19 2010-08-19 Microsoft Corporation Identifying interesting locations
CN103154928A (zh) * 2010-06-24 2013-06-12 奥比融移动有限公司 用于处理非参数化的多维的空间和时间人类行为或普遍测量的技术观测数据的网络服务器装配及其相关方法
US20140019450A1 (en) * 2012-07-12 2014-01-16 Daniela Rus Text characterization of trajectories
US20150039217A1 (en) * 2013-07-31 2015-02-05 International Business Machines Corporation Computing a similarity measure over moving object trajectories
CN103679172A (zh) * 2013-10-10 2014-03-26 南京理工大学 一种通过转动红外探测器检测地面远距离运动目标的方法
CN103914563A (zh) * 2014-04-18 2014-07-09 中国科学院上海微系统与信息技术研究所 一种时空轨迹的模式挖掘方法
JP2016057649A (ja) * 2014-09-05 2016-04-21 株式会社明電舎 時系列データの解析方法及び時系列データの異常監視装置
CN104391853A (zh) * 2014-09-25 2015-03-04 深圳大学 Poi推荐方法、poi信息处理方法及服务器
CN105095909A (zh) * 2015-07-13 2015-11-25 中国联合网络通信集团有限公司 一种应用于移动网络的用户相似性评估方法及装置
CN105205408A (zh) * 2015-09-07 2015-12-30 中国科学院深圳先进技术研究院 基于空间聚合的轨迹数据隐私保护方法及系统
CN105590096A (zh) * 2015-12-18 2016-05-18 运城学院 基于深度映射的人体活动识别特征表达方法
CN106959113A (zh) * 2016-01-08 2017-07-18 中兴通讯股份有限公司 移动终端运动轨迹的匹配方法及装置
CN108509434A (zh) * 2017-02-23 2018-09-07 中国移动通信有限公司研究院 一种群体用户的挖掘方法及装置
CN108256914A (zh) * 2018-01-17 2018-07-06 华东师范大学 一种基于张量分解模型的兴趣点种类预测方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
FENGLI XU等: "Big data driven mobile traffic understanding and forecasting: A time series approach", 《IEEE TRANSACTIONS ON SERVICES COMPUTING》, vol. 9, no. 5, pages 796 - 805, XP011624744, DOI: 10.1109/TSC.2016.2599878 *
YAQIONG LIU等: "Points of interest recommendation from GPS trajectories", 《INTERNATIONAL JOURNAL OF GEOGRAPHICAL INFORMATION SCIENCE》, vol. 29, no. 6, pages 953 - 979 *
周勍: "基于时空数据场与复杂网络的城市热点提取及动态演化研究", 《中国优秀硕士学位论文全文数据库基础科学辑》, no. 8, pages 002 - 26 *

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112991804A (zh) * 2019-12-18 2021-06-18 浙江大华技术股份有限公司 停留区域确定方法以及相关装置
CN111148045A (zh) * 2019-12-30 2020-05-12 中国联合网络通信集团有限公司 用户行为周期提取方法及设备
CN111148045B (zh) * 2019-12-30 2022-02-11 中国联合网络通信集团有限公司 用户行为周期提取方法及设备
WO2021147431A1 (zh) * 2020-01-21 2021-07-29 腾讯科技(深圳)有限公司 无线热点与兴趣点的映射方法、装置、计算机可读存储介质和计算机设备
CN111291092A (zh) * 2020-02-14 2020-06-16 腾讯科技(深圳)有限公司 一种数据处理方法、装置、服务器及存储介质
CN111403021A (zh) * 2020-03-11 2020-07-10 中国电子工程设计院有限公司 一种监测方法及装置
CN111403021B (zh) * 2020-03-11 2023-12-05 中国电子工程设计院有限公司 一种监测方法及装置
CN111461077A (zh) * 2020-05-12 2020-07-28 北京爱笔科技有限公司 一种移动轨迹事件识别方法及装置
CN111461077B (zh) * 2020-05-12 2024-01-12 北京爱笔科技有限公司 一种移动轨迹事件识别方法及装置
CN111639092B (zh) * 2020-05-29 2023-09-26 京东城市(北京)数字科技有限公司 一种人员流动分析方法、装置、电子设备及存储介质
CN111639092A (zh) * 2020-05-29 2020-09-08 京东城市(北京)数字科技有限公司 一种人员流动分析方法、装置、电子设备及存储介质
CN112927270A (zh) * 2021-03-30 2021-06-08 中国建设银行股份有限公司 轨迹生成方法、装置、电子设备及存储介质
CN113407858A (zh) * 2021-08-20 2021-09-17 明品云(北京)数据科技有限公司 信息推送方法、系统、介质和电子设备
CN113901165A (zh) * 2021-10-25 2022-01-07 青岛中科曙光科技服务有限公司 轨迹数据的处理方法、装置、终端及存储介质
CN114530018A (zh) * 2022-04-24 2022-05-24 浙江华眼视觉科技有限公司 一种基于取件人轨迹分析的语音提示方法及装置

Also Published As

Publication number Publication date
CN110309434B (zh) 2023-10-13

Similar Documents

Publication Publication Date Title
CN110309434A (zh) 一种轨迹数据处理方法、装置以及相关设备
CN105532030B (zh) 用于分析目标实体的移动的装置、系统和方法
US9183497B2 (en) Performance-efficient system for predicting user activities based on time-related features
CN103747523B (zh) 一种基于无线网络的用户位置预测系统和方法
KR20190070911A (ko) 온라인 강의 시스템에서 강사를 추천하는 방법
CN108108821A (zh) 模型训练方法及装置
KR101312927B1 (ko) 광고 제공 시스템
CN106956271A (zh) 预测情感状态的方法和机器人
CN110267206A (zh) 用户位置预测方法及装置
WO2020250723A1 (ja) 情報処理方法、情報処理装置、及び、プログラム
CN111695046B (zh) 基于时空移动数据表征学习的用户画像推断方法及装置
Kulkarni et al. Mobidict: A mobility prediction system leveraging realtime location data streams
Yang et al. Recurrent spatio-temporal point process for check-in time prediction
Xin et al. A location-context awareness mobile services collaborative recommendation algorithm based on user behavior prediction
CN106909560A (zh) 兴趣点排序方法
CN110322067A (zh) 基于因子图模型的移动用户位置预测方法
CN115860179B (zh) 轨迹预测方法、装置、设备、存储介质及程序产品
US20180285758A1 (en) Methods for creating and analyzing dynamic trail networks
Loumponias et al. Kalman filtering with censored measurements
Du et al. Analysis of university fitness center data uncovers interesting patterns, enables prediction
KR101935161B1 (ko) Sns와 여론조사를 융합한 예측 시스템 및 방법
Yu et al. A location prediction algorithm with daily routines in location-based participatory sensing systems
JP6158053B2 (ja) 学習支援装置、学習支援方法、およびプログラム
JP7500504B2 (ja) 情報処理装置、情報処理方法およびプログラム
Wang et al. Comparing sequential and temporal patterns from human mobility data for next-place prediction

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant