CN109947874B - 移动轨迹的聚合方法、装置及设备 - Google Patents

移动轨迹的聚合方法、装置及设备 Download PDF

Info

Publication number
CN109947874B
CN109947874B CN201711139091.7A CN201711139091A CN109947874B CN 109947874 B CN109947874 B CN 109947874B CN 201711139091 A CN201711139091 A CN 201711139091A CN 109947874 B CN109947874 B CN 109947874B
Authority
CN
China
Prior art keywords
movement
tracks
track
moving
time
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201711139091.7A
Other languages
English (en)
Other versions
CN109947874A (zh
Inventor
李勇
徐丰力
孙福宁
孟凡超
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN201711139091.7A priority Critical patent/CN109947874B/zh
Publication of CN109947874A publication Critical patent/CN109947874A/zh
Application granted granted Critical
Publication of CN109947874B publication Critical patent/CN109947874B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Position Fixing By Use Of Radio Waves (AREA)

Abstract

一种移动轨迹的聚合方法、装置及设备。所述方法包括:获取m个移动轨迹;根据m个移动轨迹的定位信息和时间信息,获取m个移动轨迹各自的时间特征,定位信息用于指示移动轨迹中进行定位的位置,时间信息用于指示移动轨迹中进行定位的时刻,时间特征用于表示移动轨迹中的不同位置分别对应的时间段;根据时间特征,聚合m个移动轨迹,得到k类移动轨迹。本申请实施例通过m个移动轨迹各自的时间特征,聚合m个移动轨迹,得到k类移动轨迹。因为时间特征能够体现用户在移动轨迹上的时间分配模式,所以,根据时间特征聚合得到的k类移动轨迹能够体现出用户在生活中的时间分配模式的相似程度,从而使得聚类结果的应用可以进一步得到扩展。

Description

移动轨迹的聚合方法、装置及设备
技术领域
本申请实施例涉及计算机领域,特别涉及一种移动轨迹的聚合方法、装置及设备。
背景技术
随着大数据技术的发展,人们开始将大数据和定位技术结合,通过对大量用户的移动轨迹的数据进行降维和聚类处理,将相似的移动轨迹聚合为一类,从而得到多个类型的移动轨迹。将多个类型的移动轨迹在地图上进行可视化,能够对多个类型的移动轨迹进行分析,并将分析结果运用到交通管理,商业推广和城市规划等各个领域。
在相关技术中,对大量用户的移动轨迹的数据进行降维和聚类处理,都采用主成分分析(principal component analysis,PCA)、非负矩阵分解(non-negative matrixfactorization,NMF)等传统降维方式。这类方案是根据轨迹间子序列的共同出现频率来挖掘出相似的移动轨迹,即根据不同轨迹之间的重合部分来聚合相似的移动轨迹。这类方案实际上是基于移动轨迹在物理位置上的相似程度来聚合移动轨迹,得到的多个类型的移动轨迹反映的只是用户在物理位置上的移动规律。例如,同是上班族的A和B,两者在工作日都是往返住所和公司的生活模式,但因两者分别处于不同区域:城南和城北,上述方式不会将两者的移动轨迹聚合为一类。
相关技术中,采用PCA、NMF等传统降维方式对大量用户的移动轨迹的数据进行降维和聚类处理,得到的多个类型的移动轨迹只能反映用户在物理位置上的移动规律,使得聚类结果具有一定的局限性,从而限制了聚类结果的应用。
发明内容
本申请实施例提供了一种移动轨迹的聚合方法、装置及设备,可用于解决相关技术中降维、聚类得到多个类型的移动轨迹只能反映用户在物理位置上的移动规律的问题。所述技术方案如下:
第一方面,提供了一种移动轨迹的聚合方法,所述方法包括:
获取m个移动轨迹,所述m为大于2的整数;
根据所述m个移动轨迹的定位信息和时间信息,获取所述m个移动轨迹各自的时间特征,所述定位信息用于指示移动轨迹中进行定位的位置,所述时间信息用于指示移动轨迹中进行定位的时刻,所述时间特征用于表示移动轨迹中的不同位置分别对应的时间段;
根据所述时间特征,聚合所述m个移动轨迹,得到k类移动轨迹,所述k 为小于m的正整数。
第二方面,提供了一种移动轨迹的聚合装置,所述装置包括:
轨迹获取模块,用于获取m个移动轨迹,所述m为大于2的整数;
特征获取模块,用于根据所述m个移动轨迹的定位信息和时间信息,获取所述m个移动轨迹各自的时间特征,所述定位信息用于指示移动轨迹中进行定位的位置,所述时间信息用于指示移动轨迹中进行定位的时刻,所述时间特征用于表示移动轨迹中的不同位置分别对应的时间段;
轨迹聚合模块,用于根据所述时间特征,聚合所述m个移动轨迹,得到k 类移动轨迹,所述k为小于m的正整数。
可选地,所述特征获取模块,用于:将所述m个移动轨迹中的每个移动轨迹的时长划分为时长相等的时间片,各个移动轨迹被划分的时间片的时长相等;对于所述m个移动轨迹中的任一移动轨迹,根据所述任一移动轨迹的定位信息和时间信息,确定所述任一移动轨迹的每一个时间片在所述任一移动轨迹中对应的位置;根据所述任一移动轨迹的时间片和所述任一移动轨迹的每一个时间片在所述任一移动轨迹中对应的位置,确定所述任一移动轨迹的时间特征。
可选地,所述轨迹聚合模块,用于:从所述m个移动轨迹中选取k个移动轨迹作为所述k类移动轨迹对应的代表移动轨迹;根据所述m个移动轨迹的时间特征和k个代表移动轨迹,聚合所述m个移动轨迹,得到k个类别;根据所述k个类别中每个移动轨迹的时间特征,更新所述k个代表移动轨迹,根据更新结果得到k类移动轨迹。
可选地,所述轨迹聚合模块,用于:当更新后的所述代表移动轨迹与更新前的所述代表移动轨迹不同时,根据所述m个移动轨迹的时间特征和所述更新后的k个代表移动轨迹,聚合所述m个移动轨迹;根据所述m个移动轨迹的时间特征,更新所述k个代表移动轨迹;以此类推,直至更新后的k个代表移动轨迹与更新前的k个代表移动轨迹相同,得到所述k类移动轨迹。
可选地,所述轨迹聚合模块,用于:对于所述m-k个移动轨迹中的第i个移动轨迹,根据所述第i个移动轨迹与各个所述代表移动轨迹的距离度量,将与所述第i个移动轨迹距离度量最小的代表移动轨迹和所述第i个移动轨迹归为一类移动轨迹,所述i为不大于m-k的正整数;其中,所述距离度量用于表示两个移动轨迹的时间特征的相似度。
可选地,所述轨迹聚合模块,用于:对于所述k类移动轨迹中的第z类移动轨迹,若所述第z类移动轨迹中的移动轨迹个数不为1,则根据所述第z类移动轨迹中所有移动轨迹的时间特征,更新所述第z类移动轨迹对应的代表移动轨迹,所述z为不大于k的正整数。
可选地,所述轨迹聚合模块,用于:根据所述第z类移动轨迹中所有移动轨迹的时间特征,计算所述第z类移动轨迹中的每一个移动轨迹与所述第z类移动轨迹中其它移动轨迹的距离度量的平方和;选择所述平方和最小的移动轨迹更新为所述第z类移动轨迹对应的代表移动轨迹。
可选地,所述装置还包括:信息获取模块和信息推送模块;
所述信息获取模块,用于确定所述k类移动轨迹对应的时间特征;
所述信息推送模块,用于根据所述k类移动轨迹对应的时间特征,获取待推送信息,并将所述待推送信息进行推送。
可选地,所述轨迹获取模块,用于:获取降噪前的定位信息;对所述降噪前的定位信息进行降噪处理,得到所述m个移动轨迹的定位信息,所述降噪处理用于减小定位产生的误差;根据所述m个移动轨迹的定位信息,确定所述m 个移动轨迹。
第三方面,提供了一种计算机设备,所述计算机设备包括处理器和存储器,所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或所述指令集在被所述处理器执行时实现如第一方面所述的方法。
第四方面,提供了一种计算机可读存储介质,所述存储介质中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或所述指令集在被执行时实现如第一方面所述的方法。
本申请实施例提供的技术方案可以带来如下有益效果:
通过m个移动轨迹各自的时间特征,聚合m个移动轨迹,得到k类移动轨迹。因为时间特征能够体现用户在移动轨迹上的时间分配模式,所以,根据时间特征聚合得到的k类移动轨迹能够体现出不同用户在生活中的时间分配模式的相似程度,而不仅仅是反映用户在物理位置上的移动规律,从而使得聚类结果的应用可以进一步得到扩展。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1A是本发明一实施例提供的实施环境的示意图;
图1B是本申请一个实施例提供的移动轨迹的聚合方法的流程图;
图2是本申请另一个实施例提供的移动轨迹的聚合方法的示意图;
图3是本申请一个实施例提供的降噪处理的示意图;
图4是本申请一个实施例提供的时间特征的示意图;
图5是本申请一个实施例提供的距离度量的计算过程的示意图;
图6是本申请一个实施例提供的各类移动轨迹占比的示意图;
图7是本申请另一个实施例提供的移动轨迹的聚合装置的示意图;
图8是本申请一个实施例提供的服务器的结构示意图。
具体实施方式
为使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请实施方式作进一步地详细描述。
请参考图1A,其示出了本发明一个实施例提供的实施环境的示意图。该实施环境包括:多个终端11和服务器12。
终端11可以是诸如手机、平板电脑、电子书阅读器、多媒体播放设备、可穿戴设备等电子设备。其中,终端11具有定位的功能。
多个终端11通过无线网络与服务器12建立通信连接,服务器12通过与终端11的通信连接获取终端11定位的数据。
服务器12可以是一台服务器,也可以是由多台服务器组成的服务器集群,或者是一个云计算服务中心。
本公开实施例提供的方法,各步骤的执行主体可以是一台服务器,也可以是由多台服务器组成的服务器集群,或者是一个云计算服务中心。为了便于说明,在下述方法实施例中,仅以各步骤的执行主体为服务器进行介绍说明,但对此不构成限定。
请参考图1B,其示出了本申请一个实施例提供的移动轨迹的聚合方法的流程图。该方法可应用于图1A所示的实施环境中。该方法可以包括如下几个步骤:
步骤101,获取m个移动轨迹。
服务器获取m个移动轨迹,m为大于2的整数。当需要对大量用户的移动轨迹进行降维、聚类时,就需要先获取到用户的移动轨迹,而每一个用户都对应着一个移动轨迹。对于m个用户,服务器能够获取到m个移动轨迹。对于一个用户,该用户会通过终端进行定位,而服务器则获取该用户通过终端定位的定位信息,根据该用户的定位信息,确定该用户的移动轨迹。例如,用户上班的途中多次使用手机,每次使用手机时都会进行一次定位,或者手机每隔一段时间自动进行一次定位,根据多次定位的位置,即可确定用户上班的过程对应的移动轨迹。其中,移动轨迹代表了该移动轨迹对应的用户在一段时间的移动情况。
步骤102,根据m个移动轨迹的定位信息和时间信息,获取m个移动轨迹各自的时间特征。
服务器根据m个移动轨迹的定位信息和时间信息,获取m个移动轨迹各自的时间特征。其中,定位信息用于指示移动轨迹中进行定位的位置,时间信息用于指示移动轨迹中进行定位的时刻。对于一个移动轨迹,其包括了多个定位的位置,并且定位信息和时间信息一一对应。时间特征用于表示移动轨迹中的不同位置分别对应的时间段,即时间特征能够表示用户对应的移动轨迹中位于不同位置时所处的时间段。示例性地,用户A每天早上7:00从家出发去公司,途中在早饭店用餐,在8:00到达公司并在公司工作直到18:00下班回家,在下班回家途中在快餐店用餐,在19:00到家并在第二天7:00前一直位于家中。通过用户A对应的移动轨迹的时间特征能够体现在该移动轨迹中:7:00-8:00的时间段对应一个位置,8:00-18:00的时间段对应另一个位置,18:00-19:00的时间段对应又一个位置,19:00-7:00的时间段对应除上述3个位置外的又一个位置。定位信息指示时间,时间信息指示时刻,则服务器能够根据m个移动轨迹的定位信息和时间信息,获取m个移动轨迹各自的时间特征。关于根据移动轨迹的定位信息和时间信息获取移动轨迹的时间特征的具体方式,详情请参考图2提供的实施例。
步骤103,根据时间特征,聚合m个移动轨迹,得到k类移动轨迹。
服务器在获取到m个移动轨迹各自对应的时间特征之后,根据m个移动轨迹的时间特征,聚合m个移动轨迹即对m个移动轨迹进行聚类,得到k类移动轨迹,k为小于m的正整数。例如,可以根据时间特征的相似度聚合m个移动轨迹。其中,k为需要聚合移动轨迹后得到的移动轨迹的类型的数量,可以根据实际经验设定。
可选地,上述步骤103包括如下子步骤:
步骤103a,从m个移动轨迹中选取k个移动轨迹作为k类移动轨迹对应的代表移动轨迹。
在聚合m个移动轨迹时,先选取k个移动轨迹作为k类移动轨迹对应的代表移动轨迹。其中,代表移动轨迹的时间特征代表了该代表移动轨迹对应的一类移动轨迹的时间特征。选取k个移动轨迹时,可以随机从m个移动轨迹中选取k个移动轨迹,也可以根据实际经验从m个移动轨迹中选取,本申请实施例对此不做限定。
步骤103b,根据m个移动轨迹的时间特征和k个代表移动轨迹,聚合m个移动轨迹,得到k个类别。
在选取k个代表移动轨迹之后,根据m个移动轨迹各自的时间特征与k个代表移动轨迹的时间特征之间的相似程度,聚合m个移动轨迹。对于除k个代表移动轨迹之外的m-k个移动轨迹中的每一个移动轨迹,将其和k个代表移动轨迹中与其时间特征最相似的代表移动轨迹归为一类移动轨迹。
步骤103c,根据k个类别中每个移动轨迹的时间特征,更新k个代表移动轨迹,根据更新结果得到k类移动轨迹。
在聚合m个移动轨迹之后,对于同一类移动轨迹,根据同一类移动轨迹中两两移动轨迹之间的相似程度,更新该类移动轨迹中的代表移动轨迹,即在同一类移动轨迹中确定出时间特征最能准确体现该类移动轨迹的时间分配模式的移动轨迹,并将该移动轨迹作为代表移动轨迹,最终得到k类移动轨迹以及k 类移动轨迹对应的代表移动轨迹。通过上述方式,能够准确地在一类移动轨迹中选出该类移动轨迹对应的代表移动轨迹,从而在后续步骤中能够准确地得到该类移动轨迹对应的时间特征。
在本申请实施例中,通过m个移动轨迹各自的时间特征,聚合m个移动轨迹,得到k类移动轨迹。因为时间特征能够体现用户在移动轨迹上的时间分配模式,所以,根据时间特征聚合得到的k类移动轨迹能够体现出不同用户在生活中的时间分配模式的相似程度,而不仅仅是反映用户在物理位置上的移动规律,从而使得聚类结果的应用可以进一步得到扩展。
请参考图2,其示出了本申请另一个实施例提供的移动轨迹的聚合方法的流程图。该方法可应用于图1A所示的实施环境中。该方法可以包括如下几个步骤:
步骤201,获取降噪前的定位信息。
终端每进行一次定位,服务器都会获取的终端发送的进行定位的数据,该数据就是降噪前的定位信息。服务器获取的降噪前的定位信息存在定位上的误差,该误差使得用户在同一位置进行定位也会产生不同的定位信息。因此,根据降噪前的定位信息无法准确地确定用户的移动轨迹,或者无法准确地确定移动轨迹中定位的位置。
步骤202,对降噪前的定位信息进行降噪处理。
对降噪前的定位信息进行降噪处理,降噪处理用于减小定位产生的误差。通过降噪处理,可以将降噪前的定位信息中存在误差的定位信息滤除掉,减小定位产生的误差,得到m个移动轨迹的定位信息。
可选地,降噪处理采用密度核心算法。密度核心算法是在每个用户的降噪前的定位信息中识别出存在的密度核心,将这些密度核心作为降噪后的定位信息指示的位置。密度核心算法的具体算法是:计算一个移动轨迹的每个定位信息指示的定位位置周围预设范围内的定位次数,将该定位次数作为该定位位置的密度。其中,预设范围可以根据实际经验设定。对于该定位位置,确定与其距离最近、且密度大于该定位位置的其它定位位置。计算该定位位置与确定的其它定位位置之间的距离。若上述距离大于预设阈值,则将对应的定位位置作为一个密度核心,作为密度核心的定位位置对应的定位信息即是降噪后的定位信息。其中,预设阈值可以根据实际经验设定。最后,将非密度核心的定位位置的对应的定位信息合并到离其最近的密度核心对应的定位信息,从而达到去噪的效果。
步骤203,根据m个移动轨迹的定位信息,确定m个移动轨迹。
根据降噪后的定位信息,能够准确确定m个移动轨迹。示例性地,如图3 所示,对于移动轨迹31,根据其降噪前的定位信息可以看出,即使在同一地点 32,降噪前的定位信息也指示的多个定位的位置,在进行降噪处理后,根据降噪后的定位信息能够准确确定用户的移动轨迹31。
步骤204,将m个移动轨迹中的每个移动轨迹的时长划分为时长相等的时间片。
对于m个移动轨迹中的任一移动轨迹,都将其对应的时长划分为时长相等的时间片,即将移动轨迹的时长等分的划分为多个时间片,且m个移动轨迹中的任一移动轨迹的时间片与其它移动轨迹的时间片的时长相等。示例性地,一个移动轨迹的时长为24小时,将时间片的时长设定为30分钟,则将该移动轨迹的时长划分为48个时间片。
步骤205,对于m个移动轨迹中的任一移动轨迹,根据任一移动轨迹的定位信息和时间信息,确定任一移动轨迹的每一个时间片在任一移动轨迹中对应的位置。
任一移动轨迹对应的每一个时间片都对应着不同的时间,例如,一个时间片对应着7:30-8:00,则下一个时间片对应着8:00-8:30。在不同时间片对应着的不同的时间内,用户在移动轨迹上都有一个对应的位置。根据移动轨迹的定位信息和时间信息,可以确定用户在一时间片对应的时间内在移动轨迹上对应的位置,该位置即该时间片在移动轨迹中对应的位置。示例性地,用户A在8:00 至8:30位于公司,则8:00至8:30对应的时间片在用户A的移动轨迹中的位置是用户A的公司的位置。
可选地,若在一个时间片对应的时间内,移动轨迹有多个定位信息,则在该多个定位信息指示的位置中,选取定位次数最多的位置作为该时间片在移动轨迹中对应的位置。
步骤206,根据任一移动轨迹的时间片和任一移动轨迹的每一个时间片在任一移动轨迹中对应的位置,确定任一移动轨迹的时间特征。
在确定一个移动轨迹对应的每一个时间片在该移动轨迹中的位置后,将位置相同的时间片归为一个集合,则可以确定不同位置对应的时间段,即得到了该移动轨迹的时间特征。其中,位置相同的时间片的集合即为该位置对应的时间段。示例性地,用户A每天早上7:00从家出发去公司,途中在早饭店用餐,在8:00到达公司并在公司工作直到18:00下班回家,在下班回家途中在快餐店用餐,在19:00到家并在第二天7:00前一直位于家中,如图4所示,7:00-8:00 对应的时间片归为一个集合41,8:00-18:00对应的时间片归为一个集合42,18:00-19:00对应的时间片归为一个集合43,19:00-7:00对应的时间片归为一个集合44。最终,时间特征45包括上述四个集合,每个集合都对应着移动轨迹中的一个位置。
步骤207,从m个移动轨迹中选取k个移动轨迹作为k类移动轨迹对应的代表移动轨迹。
上述步骤207与图1B提供的实施例中的步骤103a,详情请参照图1B实施例,在此不再进行赘述。
步骤208,对于m-k个移动轨迹中的第i个移动轨迹,根据第i个移动轨迹与各个代表移动轨迹的距离度量,将与第i个移动轨迹距离度量最小的代表移动轨迹和第i个移动轨迹归为一类移动轨迹。
距离度量用于表示两个移动轨迹的时间特征的相似度,且距离度量与两个移动轨迹的时间特征的相似度为负相关关系。距离度量越大,相似度越小;距离度量越小,相似度越大。计算第i个移动轨迹与每个代表移动轨迹的距离度量,确定距离度量最小的代表移动轨迹,则该代表移动轨迹的时间特征与第i个移动轨迹的时间特征最为相似,所以该代表移动轨迹和第i个移动轨迹归为一类移动轨迹。通过上述方式,达到聚合m个移动轨迹的目的。
可选地,在两个移动轨迹的时间特征中删除j个对应着相同时间的时间片,使得两个移动轨迹的时间特征相同,则j的最小值即为两个移动轨迹的距离度量。示例性地,如图5所示,两个移动轨迹的时间特征分别为时间特征51和时间特征52,其中,时间特征51包括:8:00-18:00的时间片集合53和18:00-8:00 的时间片集合54,时间特征52包括:8:00-17:30的时间片集合55、17:30-18:30 的时间片集合56、18:30-7:00的时间片集合57和7:00-8:00的时间片集合58,在各自删除了对应着7:00-8:00和5:30-6:30的4个时间片后,时间特征51和时间特征52就完全相同,则该两个移动轨迹的距离度量为4。
在一种可能的实施方式中,m个移动轨迹各自对应的时间相同,例如都对应0:00至24:00的时间,则直接聚合m个移动轨迹。
在另一种可能的实施方式中,m个移动轨迹各自对应的时间不同,则确定 m个移动轨迹重合的时间,并将对应该重合的时间在m个移动轨迹中对应的轨迹更新为m个移动轨迹,再聚合更新后的m个移动轨迹。示例性地,聚合三个移动轨迹:移动轨迹A,移动轨迹B和移动轨迹C,三个移动轨迹对应的时间分别为:0:00-24:00,0:00-24:00和0:00-12:00,三个移动轨迹重合的时间为 0:00-12:00,则分别确定三个移动轨迹在0:00-12:00内的移动轨迹,将三个移动轨迹在0:00-12:00内的移动轨迹更新为m个移动轨迹,再聚合更新后的m个移动轨迹。
步骤209,根据k类移动轨迹中的第z类移动轨迹中所有移动轨迹的时间特征,计算第z类移动轨迹中的每一个移动轨迹与第z类移动轨迹中其它移动轨迹的距离度量的平方和。
计算第z类移动轨迹中的每一个移动轨迹与第z类移动轨迹中其它移动轨迹的距离度量的平方和,为后续更新代表移动轨迹提供依据,z为不大于k的正整数。
步骤210,若第z类移动轨迹中的移动轨迹个数不为1,则选择平方和最小的移动轨迹更新为第z类移动轨迹对应的代表移动轨迹。
示例性地,第z类移动轨迹中包括:移动轨迹A,移动轨迹B和移动轨迹C,三个移动轨迹与其它移动轨迹的距离度量的平方和分别为:5,13和10,则选取移动轨迹A更新为第z类移动轨迹对应的代表移动轨迹。
可选地,对于k类移动轨迹中的第z类移动轨迹,若第z类移动轨迹中的移动轨迹个数为1,则不更新第z类移动轨迹对应的代表移动轨迹。
步骤211,若更新后的代表移动轨迹与更新前的代表移动轨迹不同,则执行步骤206。
其中,k个代表移动轨迹中的任一个代表移动轨迹更新前与更新后不同,则更新后的代表移动轨迹与更新前的代表移动轨迹不同。若更新后的代表移动轨迹与更新前的代表移动轨迹不同,则需要再次聚合m个移动轨迹和更新代表移动轨迹。
步骤212,若更新后的代表移动轨迹与更新前的代表移动轨迹相同,得到k 类移动轨迹。
通过上述方式,迭代地聚合m个移动轨迹、更新代表移动轨迹,使得最终得到的k类移动轨迹是依据时间特征对m个移动轨迹的准确地划分。
可选地,上述步骤210之后,还包括如下步骤:
步骤213,确定k类移动轨迹对应的时间特征。
k类移动轨迹对应的代表移动轨迹的时间特征即为k类移动轨迹对应的时间特征。根据k类移动轨迹对应的代表移动轨迹,即可确定k类移动轨迹对应的时间特征。
步骤214,根据k类移动轨迹对应的时间特征,获取待推送信息,并将待推送信息进行推送。
对于k类移动轨迹中的任一类移动轨迹,根据该类移动轨迹对应的时间特征,就能确定类移动轨迹对应的用户在生活中时间分配模式,根据用户在生活中时间分配模式,确定待推送信息,并将待推送信息进行推送。
可选地,待推送信息为位置兴趣点(Points of Interest,PoI)信息。根据用户的生活中时间分配模式,确定用户的生活模式,根据用户的生活模式,向用户推送PoI信息。示例性地,一类移动轨迹对应的时间特征如图4所示,确定这类用户的时间分配模式为7:00-8:00,8:00-18:00,18:00-19:00和19:00-7:00,确定这类用户的生活模式为早出晚归,则向该类用户推送与早出晚归相关的PoI 信息,如早餐店信息、地铁信息和早晚天气信息等等。可选地,对于单个用户,可以在确定其生活模式,再结合其移动轨迹和当前时刻,预测用户下一时刻可能采取的行动,并以此确定待推送信息。
可选地,在确定一类用户的生活模式后,可以结合对应的一类移动轨迹中的移动轨迹的具体位置,确定这类用户的人口构成。示例性地,确定一类用户的生活模式为早出晚归,根据对应的一类移动轨迹中的移动轨迹的具体位置,确定出这类用户经常定位在学校,则确定这类用户中学生所占比例较大,则在确定待推送消息时,多与学生相关,例如书店信息,培训班信息和考试信息等。可选地,可以根据该类用户的生活模式和人口构成,确定向商家推送的待推送信息。
可选地,对于k类移动轨迹,可以根据每一类移动轨迹的具体移动轨迹数量,确定每一类移动轨迹在m个移动轨迹中所占的比例,在确定待推送消息时,多采用与所占比例高的一类移动轨迹相关的信息。示例性地,如图6所示,聚合得到了8类移动轨迹,其中,所占比例最高为第一类移动轨迹61,则在确定待推送消息时,多采用与第一类移动轨迹61相关的信息。
在本申请实施例中,通过m个移动轨迹各自的时间特征,聚合m个移动轨迹,得到k类移动轨迹。因为时间特征能够体现用户在移动轨迹上的时间分配模式,所以,根据时间特征聚合得到的k类移动轨迹能够体现出不同用户在生活中的时间分配模式的相似程度,而不仅仅是反映用户在物理位置上的移动规律,从而使得聚类结果的应用可以进一步得到扩展。
另外,在本申请实施例中,对移动轨迹降维得到时间特征时,是对单个移动轨迹进行降维。相较于现有技术将大量移动轨迹在同一台服务器中同时降维的方法,能够将大量移动轨迹在多台服务器上并行化处理,处理效率得到了提高。
下述为本申请装置实施例,可以用于执行本申请方法实施例。对于本申请装置实施例中未披露的细节,请参照本申请方法实施例。
请参考图7,其示出了本申请一个实施例提供的移动轨迹的聚合装置的框图。该装置具有实现上述实施例中移动轨迹的聚合方法的功能,所述功能可以由硬件实现,也可以由硬件执行相应的软件实现。该装置可以包括:轨迹获取模块701,特征获取模块702和轨迹聚合模块703。
轨迹获取模块701,用于获取m个移动轨迹,所述m为大于2的整数。
特征获取模块702,用于根据所述m个移动轨迹的定位信息和时间信息,获取所述m个移动轨迹各自的时间特征,所述定位信息用于指示移动轨迹中进行定位的位置,所述时间信息用于指示移动轨迹中进行定位的时刻,所述时间特征用于表示移动轨迹中的不同位置分别对应的时间段。
轨迹聚合模块703,用于根据所述时间特征,聚合所述m个移动轨迹,得到k类移动轨迹,所述k为小于m的正整数。
在本申请实施例中,通过m个移动轨迹各自的时间特征,聚合m个移动轨迹,得到k类移动轨迹。因为时间特征能够体现用户在移动轨迹上的时间分配模式,所以,根据时间特征聚合得到的k类移动轨迹能够体现出不同用户在生活中的时间分配模式上的相似程度,而不仅仅是反映用户在物理位置上的移动规律,从而使得聚类结果的应用可以进一步得到扩展。
可选地,所述特征获取模块702,用于:
将所述m个移动轨迹中的每个移动轨迹的时长划分为时长相等的时间片,各个移动轨迹被划分的时间片的时长相等;对于所述m个移动轨迹中的任一移动轨迹,根据所述任一移动轨迹的定位信息和时间信息,确定所述任一移动轨迹的每一个时间片在所述任一移动轨迹中对应的位置;根据所述任一移动轨迹的时间片和所述任一移动轨迹的每一个时间片在所述任一移动轨迹中对应的位置,确定所述任一移动轨迹的时间特征。
可选地,所述轨迹聚合模块703,用于:
从所述m个移动轨迹中选取k个移动轨迹作为所述k类移动轨迹对应的代表移动轨迹;根据所述m个移动轨迹的时间特征和k个代表移动轨迹,聚合所述m个移动轨迹,得到k个类别;根据所述k个类别中每个移动轨迹的时间特征,更新所述k个代表移动轨迹,根据更新结果得到k类移动轨迹。
可选地,所述轨迹聚合模块703,用于:
当更新后的所述代表移动轨迹与更新前的所述代表移动轨迹不同时,根据所述m个移动轨迹的时间特征和所述更新后的k个代表移动轨迹,聚合所述m 个移动轨迹;根据所述m个移动轨迹的时间特征,更新所述k个代表移动轨迹;以此类推,直至更新后的k个代表移动轨迹与更新前的k个代表移动轨迹相同,得到所述k类移动轨迹。
可选地,所述轨迹聚合模块703,用于:
对于所述m-k个移动轨迹中的第i个移动轨迹,根据所述第i个移动轨迹与各个所述代表移动轨迹的距离度量,将与所述第i个移动轨迹距离度量最小的代表移动轨迹和所述第i个移动轨迹归为一类移动轨迹,所述i为不大于m-k的正整数;其中,所述距离度量用于表示两个移动轨迹的时间特征的相似度。
可选地,所述轨迹聚合模块703,用于:对于所述k类移动轨迹中的第z类移动轨迹,若所述第z类移动轨迹中的移动轨迹个数不为1,则根据所述第z类移动轨迹中所有移动轨迹的时间特征,更新所述第z类移动轨迹对应的代表移动轨迹,所述z为不大于k的正整数。
可选地,所述轨迹聚合模块703,用于:根据所述第z类移动轨迹中所有移动轨迹的时间特征,计算所述第z类移动轨迹中的每一个移动轨迹与所述第z 类移动轨迹中其它移动轨迹的距离度量的平方和;选择所述平方和最小的移动轨迹更新为所述第z类移动轨迹对应的代表移动轨迹。
可选地,所述装置还包括:信息获取模块和信息推送模块;
所述信息获取模块,用于确定所述k类移动轨迹对应的时间特征。
所述信息推送模块,用于根据所述k类移动轨迹对应的时间特征,获取待推送信息,并将所述待推送信息进行推送。
可选地,所述轨迹获取模块701,用于:获取降噪前的定位信息;对所述降噪前的定位信息进行降噪处理,得到所述m个移动轨迹的定位信息,所述降噪处理用于减小定位产生的误差;根据所述m个移动轨迹的定位信息,确定所述 m个移动轨迹。
需要说明的是,上述实施例提供的装置在实现其功能时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将设备的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的装置与方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。
请参考图8,其示出了本申请一个实施例提供的服务器的结构示意图。该服务器用于实施上述实施例提供的服务器侧的移动轨迹的聚合方法。具体来讲:
所述服务器800包括中央处理单元(CPU)801、包括随机存取存储器(RAM) 802和只读存储器(ROM)803的系统存储器804,以及连接系统存储器804和中央处理单元801的系统总线805。所述服务器800还包括帮助计算机内的各个器件之间传输信息的基本输入/输出系统(I/O系统)806,和用于存储操作系统813、应用程序814和其他程序模块815的大容量存储设备807。
所述基本输入/输出系统806包括有用于显示信息的显示器808和用于用户输入信息的诸如鼠标、键盘之类的输入设备809。其中所述显示器808和输入设备809都通过连接到系统总线805的输入输出控制器810连接到中央处理单元 801。所述基本输入/输出系统806还可以包括输入输出控制器810以用于接收和处理来自键盘、鼠标、或电子触控笔等多个其他设备的输入。类似地,输入输出控制器810还提供输出到显示屏、打印机或其他类型的输出设备。
所述大容量存储设备807通过连接到系统总线805的大容量存储控制器(未示出)连接到中央处理单元801。所述大容量存储设备807及其相关联的计算机可读介质为服务器800提供非易失性存储。也就是说,所述大容量存储设备807 可以包括诸如硬盘或者CD-ROM驱动器之类的计算机可读介质(未示出)。
不失一般性,所述计算机可读介质可以包括计算机存储介质和通信介质。计算机存储介质包括以用于存储诸如计算机可读指令、数据结构、程序模块或其他数据等信息的任何方法或技术实现的易失性和非易失性、可移动和不可移动介质。计算机存储介质包括RAM、ROM、EPROM、EEPROM、闪存或其他固态存储其技术,CD-ROM、DVD或其他光学存储、磁带盒、磁带、磁盘存储或其他磁性存储设备。当然,本领域技术人员可知所述计算机存储介质不局限于上述几种。上述的系统存储器804和大容量存储设备807可以统称为存储器。
根据本申请的各种实施例,所述服务器800还可以通过诸如因特网等网络连接到网络上的远程计算机运行。也即服务器800可以通过连接在所述系统总线805上的网络接口单元811连接到网络812,或者说,也可以使用网络接口单元811来连接到其他类型的网络或远程计算机系统。
所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、至少一段程序、代码集或指令集经配置以由一个或者一个以上处理器执行,以实现上述移动轨迹的聚合方法中各个步骤的功能。
在示例性实施例中,还提供了一种计算机可读存储介质,所述存储介质中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或所述指令集在被终端的处理器执行时实现如上述移动轨迹的聚合方法中各个步骤的功能。
可选地,上述计算机可读存储介质可以是ROM、随机存取存储器(RAM)、 CD-ROM、磁带、软盘和光数据存储设备等。
应当理解的是,在本文中提及的“多个”是指两个或两个以上。“和/或”,描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。
上述本申请实施例序号仅仅为了描述,不代表实施例的优劣。
以上所述仅为本申请的示例性实施例,并不用以限制本申请,凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。

Claims (8)

1.一种移动轨迹的聚合方法,其特征在于,所述方法包括:
获取m个用户分别对应的降噪前的定位信息;
计算所述降噪前的定位信息指示的定位位置周围预设范围内的定位次数,以及将所述定位次数作为所述定位位置的密度;
确定与所述定位位置距离最近、且密度大于所述定位位置的其它定位位置;
若所述定位位置与所述其它定位位置之间的距离大于预设阈值,则将所述定位位置确定为密度核心,作为密度核心的所述定位位置对应的定位信息为移动轨迹的定位信息,每个用户对应一个移动轨迹;
根据m个移动轨迹的定位信息,确定所述m个移动轨迹,所述m为大于2的整数;
将所述m个移动轨迹中的每个移动轨迹的时长划分为时长相等的时间片,各个移动轨迹被划分的时间片的时长相等;
对于所述m个移动轨迹中的任一移动轨迹,根据所述任一移动轨迹的定位信息和时间信息,确定所述任一移动轨迹的每一个时间片在所述任一移动轨迹中对应的位置;其中,所述定位信息用于指示移动轨迹中进行定位的位置,所述时间信息用于指示移动轨迹中进行定位的时刻;
根据所述任一移动轨迹的时间片和所述任一移动轨迹的每一个时间片在所述任一移动轨迹中对应的位置,确定所述任一移动轨迹的时间特征,所述时间特征用于表示移动轨迹中的不同位置分别对应的时间段,所述时间特征用于表征用户的生活模式;
从所述m个移动轨迹中选取k个移动轨迹作为k类移动轨迹对应的代表移动轨迹;
对于m-k个移动轨迹中的第i个移动轨迹,根据所述第i个移动轨迹与各个所述代表移动轨迹的距离度量,将与所述第i个移动轨迹距离度量最小的代表移动轨迹和所述第i个移动轨迹归为一类移动轨迹,得到k个类别;其中,所述i为不大于m-k的正整数,所述距离度量用于表示两个移动轨迹的时间特征的相似度,在两个移动轨迹的时间特征中删除j个对应着相同时间的时间片,使得所述两个移动轨迹的时间特征相同,则j的最小值即为所述两个移动轨迹的距离度量,j为整数;
根据所述k个类别中每个移动轨迹的时间特征,得到所述k类移动轨迹,所述k为小于m的正整数;
根据所述k类移动轨迹对应的时间特征,确定所述k类移动轨迹对应的用户的生活模式;
对于所述k类移动轨迹中的任一类移动轨迹,根据所述任一类移动轨迹中的移动轨迹的位置信息,确定所述任一类移动轨迹对应的人口构成;
根据所述任一类移动轨迹对应的人口构成和生活模式,获取待推送信息,并将所述待推送信息进行推送;其中,所述待推送信息为位置兴趣点信息。
2.根据权利要求1所述的方法,其特征在于,所述根据所述k个类别中每个移动轨迹的时间特征,得到所述k类移动轨迹,包括:
根据所述k个类别中每个移动轨迹的时间特征,更新所述k个代表移动轨迹,根据更新结果得到所述k类移动轨迹。
3.根据权利要求2所述的方法,其特征在于,所述根据更新结果得到所述k类移动轨迹,包括:
若更新后的所述代表移动轨迹与更新前的所述代表移动轨迹不同,则根据所述m个移动轨迹的时间特征和所述更新后的k个代表移动轨迹,聚合所述m个移动轨迹;
根据所述m个移动轨迹的时间特征,更新所述k个代表移动轨迹;
以此类推,直至更新后的k个代表移动轨迹与更新前的k个代表移动轨迹相同,得到所述k类移动轨迹。
4.根据权利要求2所述的方法,其特征在于,所述根据所述m个移动轨迹的时间特征,更新所述k个代表移动轨迹,包括:
对于所述k类移动轨迹中的第z类移动轨迹,若所述第z类移动轨迹中的移动轨迹个数不为1,则根据所述第z类移动轨迹中所有移动轨迹的时间特征,更新所述第z类移动轨迹对应的代表移动轨迹,所述z为不大于k的正整数。
5.根据权利要求4所述的方法,其特征在于,所述根据所述第z类移动轨迹中所有移动轨迹的时间特征,更新所述第z类移动轨迹对应的代表移动轨迹,包括:
根据所述第z类移动轨迹中所有移动轨迹的时间特征,计算所述第z类移动轨迹中的每一个移动轨迹与所述第z类移动轨迹中其它移动轨迹的距离度量的平方和;
选择所述平方和最小的移动轨迹更新为所述第z类移动轨迹对应的代表移动轨迹。
6.一种移动轨迹的聚合装置,其特征在于,所述装置包括:
轨迹获取模块,用于获取m个用户分别对应的降噪前的定位信息;计算所述降噪前的定位信息指示的定位位置周围预设范围内的定位次数,以及将所述定位次数作为所述定位位置的密度;确定与所述定位位置距离最近、且密度大于所述定位位置的其它定位位置;若所述定位位置与所述其它定位位置之间的距离大于预设阈值,则将所述定位位置确定为密度核心,作为密度核心的所述定位位置对应的定位信息为移动轨迹的定位信息,每个用户对应一个移动轨迹;根据m个移动轨迹的定位信息,确定所述m个移动轨迹,所述m为大于2的整数;
特征获取模块,用于将所述m个移动轨迹中的每个移动轨迹的时长划分为时长相等的时间片,各个移动轨迹被划分的时间片的时长相等;对于所述m个移动轨迹中的任一移动轨迹,根据所述任一移动轨迹的定位信息和时间信息,确定所述任一移动轨迹的每一个时间片在所述任一移动轨迹中对应的位置;其中,所述定位信息用于指示移动轨迹中进行定位的位置,所述时间信息用于指示移动轨迹中进行定位的时刻;根据所述任一移动轨迹的时间片和所述任一移动轨迹的每一个时间片在所述任一移动轨迹中对应的位置,确定所述任一移动轨迹的时间特征,所述时间特征用于表示移动轨迹中的不同位置分别对应的时间段;
轨迹聚合模块,用于从所述m个移动轨迹中选取k个移动轨迹作为k类移动轨迹对应的代表移动轨迹;对于m-k个移动轨迹中的第i个移动轨迹,根据所述第i个移动轨迹与各个所述代表移动轨迹的距离度量,将与所述第i个移动轨迹距离度量最小的代表移动轨迹和所述第i个移动轨迹归为一类移动轨迹,得到k个类别;其中,所述i为不大于m-k的正整数,所述距离度量用于表示两个移动轨迹的时间特征的相似度,在两个移动轨迹的时间特征中删除j个对应着相同时间的时间片,使得所述两个移动轨迹的时间特征相同,则j的最小值即为所述两个移动轨迹的距离度量,j为整数;根据所述k个类别中每个移动轨迹的时间特征,聚合所述m个移动轨迹,得到所述k类移动轨迹,所述k为小于m的正整数;
信息推送模块,用于根据所述k类移动轨迹对应的时间特征,确定所述k类移动轨迹对应的用户的生活模式;对于所述k类移动轨迹中的任一类移动轨迹,根据所述任一类移动轨迹中的移动轨迹的位置信息,确定所述任一类移动轨迹对应的人口构成;根据所述任一类移动轨迹对应的人口构成和生活模式,获取待推送信息,并将所述待推送信息进行推送;其中,所述待推送信息为位置兴趣点信息。
7.一种计算机设备,其特征在于,所述计算机设备包括处理器和存储器,所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或所述指令集在被所述处理器执行时实现如权利要求1至5任一项所述的方法。
8.一种计算机可读存储介质,其特征在于,所述存储介质中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或所述指令集在被执行时实现如权利要求1至5任一项所述的方法。
CN201711139091.7A 2017-11-16 2017-11-16 移动轨迹的聚合方法、装置及设备 Active CN109947874B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711139091.7A CN109947874B (zh) 2017-11-16 2017-11-16 移动轨迹的聚合方法、装置及设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711139091.7A CN109947874B (zh) 2017-11-16 2017-11-16 移动轨迹的聚合方法、装置及设备

Publications (2)

Publication Number Publication Date
CN109947874A CN109947874A (zh) 2019-06-28
CN109947874B true CN109947874B (zh) 2023-02-24

Family

ID=67003922

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711139091.7A Active CN109947874B (zh) 2017-11-16 2017-11-16 移动轨迹的聚合方法、装置及设备

Country Status (1)

Country Link
CN (1) CN109947874B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112541646B (zh) * 2019-09-20 2024-03-26 杭州海康威视数字技术股份有限公司 周期行为分析方法及装置
CN110851430B (zh) * 2019-10-12 2023-10-03 中国平安财产保险股份有限公司 移动轨迹信息的存储方法、服务器以及计算机存储介质
CN111563137B (zh) * 2020-04-28 2022-05-17 厦门市美亚柏科信息股份有限公司 一种用于重合轨迹的分析方法和系统
CN113487865B (zh) * 2021-07-02 2022-07-22 江西锦路科技开发有限公司 一种高速公路行驶车辆信息采集系统及方法

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5805169B2 (ja) * 2013-11-25 2015-11-04 ヤフー株式会社 行動パターン分析装置および行動パターン分析方法
CN104765873B (zh) * 2015-04-24 2019-03-26 百度在线网络技术(北京)有限公司 用户相似度确定方法和装置
CN105117424B (zh) * 2015-07-31 2019-08-02 中国科学院软件研究所 一种基于停留时间的移动对象语义行为模式挖掘方法
US10831827B2 (en) * 2016-04-01 2020-11-10 International Business Machines Corporation Automatic extraction of user mobility behaviors and interaction preferences using spatio-temporal data
CN106339417B (zh) * 2016-08-15 2019-10-01 浙江大学 基于移动轨迹中停留点的用户群体行为规律检测方法

Also Published As

Publication number Publication date
CN109947874A (zh) 2019-06-28

Similar Documents

Publication Publication Date Title
Eyada et al. Performance evaluation of IoT data management using MongoDB versus MySQL databases in different cloud environments
CN109947874B (zh) 移动轨迹的聚合方法、装置及设备
CN111212383B (zh) 区域常住人口数量的确定方法、装置、服务器和介质
CN114422267B (zh) 流量检测方法、装置、设备及介质
CN111476270A (zh) 基于K-means算法的课程信息确定方法、装置、设备及存储介质
US11468349B2 (en) POI valuation method, apparatus, device and computer storage medium
CN110765280B (zh) 地址识别方法和装置
WO2022193872A1 (zh) 空间关系的确定方法、装置、计算机设备及存储介质
CN104239453A (zh) 数据处理方法及装置
CN113326449B (zh) 预测交通流量的方法、装置、电子设备和介质
CN108880872B (zh) 一种互联网测试床拓扑结构分解方法及装置
CN115757987B (zh) 基于轨迹分析的伴随对象确定方法、装置、设备及介质
CN110737691B (zh) 用于处理访问行为数据的方法和装置
CN108133234B (zh) 基于稀疏子集选择算法的社区检测方法、装置及设备
CN111182465A (zh) 终端归属的确定方法及装置
CN113010642B (zh) 语义关系的识别方法、装置、电子设备及可读存储介质
CN111611337B (zh) 终端数据处理系统
CN114638308A (zh) 一种获取对象关系的方法、装置、电子设备和存储介质
Liu et al. MissingFound: An assistant system for finding missing companions via mobile crowdsourcing
CN111461118A (zh) 兴趣特征确定方法、装置、设备及存储介质
US20230334096A1 (en) Graph data processing method and apparatus, computer device, and storage medium
CN111611336B (zh) 终端数据处理系统
CN117435963B (zh) 数字资产欺诈群体确定方法、装置、电子设备和存储介质
Krumm et al. Spatial Gems, Volume 1
CN111832304B (zh) 楼盘名称的查重方法、装置、电子设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant