CN109034454B

CN109034454B - 路线挖掘方法、装置、计算机可读存储介质和计算机设备

Info

Publication number: CN109034454B
Application number: CN201810663726.1A
Authority: CN
Inventors: 孙福宁; 孟凡超
Original assignee: Tencent Technology Shenzhen Co Ltd; Tencent Dadi Tongtu Beijing Technology Co Ltd
Current assignee: Tencent Technology Shenzhen Co Ltd; Tencent Dadi Tongtu Beijing Technology Co Ltd
Priority date: 2018-06-25
Filing date: 2018-06-25
Publication date: 2022-07-08
Anticipated expiration: 2038-06-25
Also published as: CN109034454A

Abstract

本申请涉及一种路线挖掘方法、装置、计算机可读存储介质和计算机设备，所述方法包括：获取移动轨迹定位点；确定所述移动轨迹定位点所属的定位分片；按照所述移动轨迹定位点所对应定位时间的时序，对所述移动轨迹定位点所属的定位分片进行组合，得到定位分片序列；从所述定位分片序列中搜索目标分片序列；根据所述目标分片序列确定相应的路线。本申请提供的方案可以挖掘出准确且完整的用户出行路线。

Description

路线挖掘方法、装置、计算机可读存储介质和计算机设备

技术领域

本申请涉及计算机技术领域，特别是涉及一种路线挖掘方法、装置、计算机可读存储介质和计算机设备。

背景技术

随着计算机技术的发展，出现了与定位或导航等相关的智能交通技术，使得人们在出行时可方便的通过随身携带的计算机设备进行地理位置的定位和导航。并且，随着经济的发展，人们外出的频率也在不断增加。如果根据用户的出行数据，挖掘出或还原出用户经常使用的路线，以便进行相应轨道交通规划或出行交通的安排，将会给人们的生活带来极大的便利。

传统的用户出行路线的挖掘通常都是基于用户的导航数据，根据用户的导航数据挖掘出用户的出行路线。然而传统的基于用户导航行为的轨迹，挖掘用户出行路线的方式覆盖的用户群体不全面，无法覆盖那些选择熟悉或固定路线出行的用户，使得根据用户出行数据挖掘出的用户出行路线不够准确。

发明内容

基于此，有必要针对基于用户连续导航行为而挖掘出的用户出行路线不准确的技术问题，提供一种路线挖掘方法、装置、计算机可读存储介质和计算机设备。

一种路线挖掘方法，包括：

获取移动轨迹定位点；

确定所述移动轨迹定位点所属的定位分片；

按照所述移动轨迹定位点所对应定位时间的时序，对所述移动轨迹定位点所属的定位分片进行组合，得到定位分片序列；

从所述定位分片序列中搜索目标分片序列；

根据所述目标分片序列确定相应的路线。

一种路线挖掘装置，包括：

获取模块，用于获取移动轨迹定位点；

确定模块，用于确定所述移动轨迹定位点所属的定位分片；

组合模块，用于按照所述移动轨迹定位点所对应定位时间的时序，对所述移动轨迹定位点所属的定位分片进行组合，得到定位分片序列；

搜索模块，用于从所述定位分片序列中搜索目标分片序列；

所述确定模块还用于根据所述目标分片序列确定相应的路线。

一种计算机可读存储介质，存储有计算机程序，所述计算机程序被处理器执行时，使得所述处理器执行所述路线挖掘方法的步骤。

一种计算机设备，包括存储器和处理器，所述存储器存储有计算机程序，所述计算机程序被所述处理器执行时，使得所述处理器执行所述路线挖掘方法的步骤。

上述路线挖掘方法、装置、计算机可读存储介质和计算机设备，确定移动轨迹定位点所属的定位分片，按照移动轨迹定位点所对应定位时间的时序，对移动轨迹定位点所属的定位分片进行组合，得到定位分片序列。可根据用户的移动轨迹定位点，组合出多种用户可能的出行路线所对应的定位分片序列。再从定位分片序列中搜索目标分片序列，以确定相应的路线。这样，通过移动轨迹定位点进行用户出行路线的挖掘，可充分利用用户的定位数据而不仅仅局限于用户的导航数据。根据用户的移动轨迹定位点，挖掘出用户经常使用的出行路线，具有更高的用户覆盖度和场景覆盖度，使得挖掘出的用户出行路线准确且完整。

附图说明

图1为一个实施例中路线挖掘方法的应用环境图；

图2为一个实施例中路线挖掘方法的流程示意图；

图3(1)、图3(2)、图3(3)、图3(4)和图3(5)分别是不同移动轨迹周期内用户定位点累积的示意图；

图4为一个实施例中用户常驻点、用户偶然点、用户出行点和用户停留点的分布示意图；；

图5为一个实施例中根据聚类密度和聚类距离区分用户偶然点、用户常驻点、用户停留点以及用户出行点的界面示意图；

图6为一个实施例中不同象限空间中的轨迹簇的界面示意图；

图7为一个实施例中确定移动轨迹定位点所属的定位分片的界面示意图；

图8为一个实施例中表示单个定位分片的出入度信息的示意图；

图9为一个实施例中从用户定位点中，按照相应的聚类特征，确定两个聚类中心点的步骤的流程示意图；

图10为一个实施例中计算定位分片序列对应的分值的步骤的流程示意图；

图11(1)为一个实施例中将用户通勤轨迹定位点进行分片化的结果示意图；

图11(2)为一个实施例中单个定位分片的局部分布界面图；

图11(3)为一个实施例中用户通勤路线的展示图；

图12为又一个实施例中路线挖掘方法的流程示意图；

图13为一个实施例中路线挖掘装置的结构框图；

图14为一个实施例中计算机设备的结构框图；

图15为另一个实施例中计算机设备的结构框图。

具体实施方式

为了使本申请的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本申请进行进一步详细说明。应当理解，此处所描述的具体实施例仅仅用以解释本申请，并不用于限定本申请。

图1为一个实施例中路线挖掘方法的应用环境图。参照图1，该路线挖掘方法应用于路线挖掘系统。该路线挖掘系统包括终端110和服务器120。终端110和服务器120通过网络连接。路线挖掘方法可以在终端110或服务器120中完成，终端110可采集相应的用户定位数据后在终端110采用上述路线挖掘方法以进行路线的挖掘。或者终端110可采集相应的用户定位数据后，通过网络连接将用户定位数据发送至服务器120，服务器120采用上述路线挖掘方法以进行路线的挖掘。终端110具体可以是台式终端或移动终端，移动终端具体可以手机、平板电脑和笔记本电脑等中的至少一种。服务器120可以用独立的服务器或者是多个服务器组成的服务器集群来实现。

如图2所示，在一个实施例中，提供了一种路线挖掘方法。本实施例主要以该方法应用于上述图1中的终端110或服务器120来举例说明。参照图2，该路线挖掘方法具体包括如下步骤：

S202，获取移动轨迹定位点。

其中，移动轨迹定位点是用户在出行过程中表征移动轨迹的定位点。移动轨迹是人类生活模式的外在表现，刻画了个体在不同生活区域(如公司、住宅、娱乐地等)间的切换模式。

具体地，计算机设备可获取本地采集的移动轨迹定位点，或者通过网络连接获取来自于用户所携带的移动终端的移动轨迹定位点。用户在出行过程中，可通过随身携带的移动终端获取用户当前的定位数据。其中定位数据包括移动轨迹定位点和相应的定位时间等。

在一个实施例中，用户可通过终端上的应用程序触发定位动作，终端通过内置的GPS(Global Positioning System，全球定位系统)芯片或基于移动运营网的基站进行定位。在一个实施例中，可将定位sdk(Software Development Kit，软件开发工具包)嵌入到应用程序中，通过用户主动触发的方式获取的终端采集的定位数据。

在一个实施例中，终端可采集定位数据，并将定位数据发送至服务器，在服务器端执行路线挖掘的方法。或者，终端在采集定位数据后，直接在终端本地执行路线挖掘的方法。

在一个实施例中，获取移动轨迹定位点的步骤包括：获取多个移动轨迹周期内累积的用户定位点；从用户定位点中筛选表征移动轨迹的移动轨迹定位点。

其中，用户定位点是用户通过终端触发定位动作时的定位点。移动轨迹周期，比如一天、一周或一个月等。具体地，计算机设备可获取多个移动轨迹周期内累积的用户定位点。比如，可以一天为一个移动轨迹周期，计算机设备获取用户一个月内的历史用户定位点。根据用户定位点进行聚类计算，从用户定位点中筛选表征移动轨迹的移动轨迹定位点，过滤掉用户偶然点等噪音数据。

在一个实施例中，如图3所示，图3(1)-图3(5)分别是不同移动轨迹周期内用户定位点累积的示意图。图3(1)所示为1个工作日内用户定位点累积叠加的示意图；如图3(2)所示为5个工作日内用户定位点累积叠加的示意图；如图3(3)所示为15个工作日内用户定位点累积叠加的示意图；如图3(4)所示为30个工作日内用户定位点累积叠加的示意图；如图3(5)所示为根据用户30天内的用户定位点，从统计角度还原出的用户出行路线，特别是用户通勤路线。从上图中可知，通过1天，5天，15天，30天的用户定位点的轨迹可以看出，单日用户定位点是非常离散的，也不具备位置簇的特征，但是通过多日的叠加之后，就可以看出这个用户的出行路线了，具有统计意义。

在一个实施例中，计算机设备在获取移动轨迹定位点时可获取如下格式的数据：uid，lng，lat，daytime，timestamp。例如：用户标识X，116.4356，39.2345，2018-01-02，12:13:11。表示用户X，在2018年的1月2日，12点13分11秒钟的时刻上，出现在经度116.4356，纬度为39.2345的位置上。

上述实施例中，通过从多个移动轨迹周期内累积的用户定位点中，筛选表征移动轨迹的移动轨迹定位点，可从多个移动轨迹周期内累积的用户定位点中筛选出符合出行语义特征的定位点作为移动轨迹定位点，过滤了噪音数据，使得移动轨迹定位点都是有效的，且是多个移动轨迹周期内累积的，可以更好的挖掘出用户出行路线。

在一个实施例中，获取移动轨迹定位点的步骤包括：获取用户定位点；确定每个用户定位点相应的聚类特征；从用户定位点中，按照相应的聚类特征，筛选表征移动轨迹的移动轨迹定位点。

其中，聚类特征是表征用户定位点的聚类特性的特征，比如聚类密度和/或聚类距离等。聚类密度是用户定位点的局部密度，当用户定位点的局部密度越大，表示在该用户定位点周围的点越多。聚类距离是指用户定位点到最近密度更高点的距离，聚类距离越大，表示该用户定位点与其他密度更大的用户定位点之间的“距离”相对更大。

具体地，计算机设备可获取用户定位点，根据用户定位点的坐标或各用户定位点间的距离，通过聚类算法计算每个用户定位点相应的聚类特征。从用户定位点中，按照相应的聚类特征，筛选表征移动轨迹的移动轨迹定位点。聚类算法，比如，k-means(基于划分的聚类方法)、fuzzy cluster(模糊聚类算法)、DBSCAN(Density-Based Spatial Clusteringof Applications with Noise，基于密度的聚类算法)或Fast Search and Find ofDensity Peaks(快速搜索和发现密度峰的聚类算法)等聚类算法。

在一个实施例中，通过聚类算法对用户定位点进行聚类计算，得到用户定位点相应的聚类密度和聚类距离。根据用户定位点的语义特征，可将用户定位点划分为用户常驻点、用户偶然点、用户出行点，以及用户停留点。由用户定位点的聚类特征可知，用户常驻点是聚类密度和聚类距离都较大的点；用户偶然点是聚类密度较小、聚类距离较大的点；用户出行点是聚类密度较小、聚类距离较小的点；用户停留点是聚类密度较大、聚类距离较小的点。因此，如图4所示，图4示出了一个实施例中用户常驻点、用户偶然点、用户出行点和用户停留点的分布示意图。比如，可以聚类密度为横坐标，聚类距离为纵坐标建立用户定位点的二维坐标系，可得到四个象限空间。根据四个象限中用户定位点所具有的语义特征，将落入第一象限内的用户定位点作为用户常驻点；将落入第二象限内的用户定位点作为用户偶然点；将落入第三象限内的用户定位点作为用户出行点；将落入第四象限内的用户定位点作为用户停留点。

进一步地，可根据图5来更好的区分不同象限空间中的用户定位点。图5示出了一个实施例中根据聚类密度和聚类距离区分用户偶然点、用户常驻点、用户停留点以及用户出行点的界面示意图。用ρ表示聚类密度；δ表示聚类距离，如图5左上的坐标系所示，以聚类密度为横轴，聚类距离为纵轴，建立直接坐标系，在坐标系中表示用户定位点，可以看出较分散的点为用户偶然点。如图5右上的坐标系所示，以聚类密度和聚类距离的乘积作为y轴，以用户定位点的标号为x轴，在坐标系中表示出用户定位点。其中，纵坐标取值较大的点为用户常驻点。如图5左下的坐标系所示，以ρ/(1+δ)为y轴，以用户定位点的标号为x轴，在坐标系中表示出用户定位点。其中，y值较大的用户定位点为用户出行点。如图5右下的坐标系所示，以1/((1+ρ)(1+δ))为y轴，以用户定位点的标号为x轴，在坐标系中表示出用户定位点。其中，y值较大的用户定位点为用户停留点。

进一步地，如图6所示，图6示出了一个实施例中不同象限空间中的轨迹簇的界面示意图。可对上述图3(4)中30天内累积叠加的用户定位点根据语义上的区分度，用不同象限空间的轨迹簇作为定位分片序列中的定位分片的表示。

上述实施例中，通过每个用户定位点相应的聚类特征，从用户定位点中，按照相应的聚类特征，筛选表征移动轨迹的移动轨迹定位点，可从用户定位点中筛选出符合出行语义特征的定位点作为移动轨迹定位点，过滤了噪音数据，使得移动轨迹定位点都是有效的，提高了路线挖掘的准确性。

S204，确定移动轨迹定位点所属的定位分片。

其中，定位分片是对地理空间按一定的分片精度进行分片划分得到的分片。比如，当分片精度为200米时，可将200*200米的空间区间作为一个分片，当分片精度为1000米时，可将1000*1000米的空间区间作为一个分片。具体地，计算机设备可根据移动轨迹点所对应的坐标，确定移动轨迹定位点所属的定位分片。

在一个实施例中，确定移动轨迹定位点所属的定位分片的步骤包括：获取分片精度；根据分片精度和移动轨迹定位点的坐标，确定在按照分片精度进行分片划分时移动轨迹定位点所属的定位分片。

具体地，计算机设备可获取分片精度，根据分片精度确定预先划分的定位分片。根据移动轨迹定位点，确定移动轨迹点所属的定位分片。

在一个实施例中，根据分片精度和移动轨迹定位点的坐标，确定在按照分片精度进行分片划分时移动轨迹定位点所属的定位分片的步骤包括：将移动轨迹定位点的坐标除以分片精度并取整，获得分片标识；分片标识表示移动轨迹定位点所属的定位分片。

具体地，计算机设备可将移动轨迹定位点的坐标除以分片精度后取整，根据取整后的数值确定分片标识，该移动规定定位点所属的定位分片就是确定的分片标识所对应的定位分片。

在一个实施例中，为避免经纬度在计算过程中的浮点数，可将移动轨迹定位点的经纬度转换成墨卡托坐标。对于移动轨迹定位点的经纬度的墨卡托值除以分片精度，向下取整数，分别获得经纬度的标识。对经纬度标识进行运算，以得到包含经纬度标识信息的分片标识。与经纬度坐标所对应的分片标识可以清楚地表示出该定位分片在地里空间中所处的地里位置。

举例说明，计算机设备可对移动轨迹定位点的经纬度的墨卡托值除以分片精度，如200，后向下取整数，分别获得经纬度的标识，如lng_id，lat_id。针对lng_id进行位运算左移8位，然后与lat_id进行或运算，最后得到一个64位的整形数字作为该移动轨迹定位点所属的分片标识，可以叫做grid_id。

在一个实施例中，可直接对移动轨迹定位点所对应的经纬度或墨卡托坐标除以分片精度并取整后，再进行计算，比如直接对经纬度进行MD5(Message Digest Algorithm，消息摘要算法第五版)运算，或者hashcode运算(哈希码值运算，根据地址或者字符串或者数字计算出对应的整型的数值)等，将计算结果作为分片标识。

如图7所示，图7示出了一个实施例中确定移动轨迹定位点所属的定位分片的界面示意图。参照图7，当用户的移动轨迹被分片化之后，呈现在地图上就是一个个小方格。图7中的小方格是分片精度为200米的定位分片，图7中的大方格是分片精度为1000米的定位分片。图7中在地图中的连线，连接了具体用户某一次出行的起始点，由此可以看出，用户在单次出行中的移动轨迹定位点并不连续，但是通过多个移动轨迹周期内的移动轨迹定位点，就可以较丰富的还原出整条路线了。

在一个实施例中，计算机设备可按照移动轨迹定位点的定位时间的时序，对移动轨迹定位点进行排序，以保障用户出行的顺序的正确性。再对每个移动轨迹定位点进行分片化，也就是确定每个移动轨迹定位点所属的定位分片。计算机设备确定了移动轨迹定位点所属的定位分片后，离散的移动轨迹定位点可以更加集中的在各个定位分片上有了统计上的含义。比如，每个定位分片都会有定位的次数，也就是移动轨迹定位点的出现次数，定位分片的出度及入度的次数，以及出度和入度的定位分片信息。其中，出度是定位分片的出边条数；入度是定位分片的入边条数。

参考图8，图8为一个实施例中表示单个定位分片的出入度信息的示意图。对单个定位分片进行局部放大，如图8所示，对于当前定位分片A而言，有5分出度下一跳转的定位分片，分别是从定位分片A跳转至定位分片B、定位分片C、定位分片D、定位分片E以及定位分片F。并且，定位分片B、定位分片C、定位分片D、定位分片E和定位分片F在方向上并不区域一致，也就是说，定位分片A是一个很重要的定位分片，在用户的一次出行中，这个定位分片是一个往返都经过的位置。

S206，按照移动轨迹定位点所对应定位时间的时序，对移动轨迹定位点所属的定位分片进行组合，得到定位分片序列。

具体地，计算机设备可按照移动轨迹定位点所对应定位时间的时序，对移动轨迹定位点所属的定位分片进行组合排序，以得到多个不同组合的定位分片序列。

在一个实施例中，计算机设备可通过dfs(Depth First Search，深度优先遍历)搜索方式对所有的移动轨迹定位点进行遍历，按照移动轨迹定位点所对应定位时间的时序，枚举所有定位分片跳转的可能性，组合定位分片得到定位分片序列。比如，用grid_id表示定位分片的标识，按照移动轨迹定位点所对应定位时间的时序，对移动轨迹定位点所属的定位分片进行组合，得到定位分片序列：grid_sequence＝{[grid_id1,grid_id2,…,rid_idN],[gird_id1,grid_id5,gri d_id3,…,grid_idM]…}。grid_sequence可由多个定位分片序列组成。

其中，定位分片跳转具体指的是，从一个定位分片跳转到另一个定位分片，也就是这两个定位分片中存在时序上相邻的移动轨迹定位点。举例说明，比如定位分片A中存在定位时间为10:00的移动轨迹定位点a，定位分片B中存在定位时间为10:05的移动轨迹定位点b，对移动轨迹定位点按照时序进行排序时，移动轨迹定位点a和移动轨迹定位点b相邻。则，可以认为在用户的出行过程中，是从移动轨迹定位点a移动到移动轨迹定位点b，也就是从定位分片A跳转至定位分片B。将此次跳转过程记为(A,B)，则在(A,B)中A是上一跳，B是下一跳。其中，(A,B)即为一个定位分片二元组，可以分别用相应的定位分片的分片标识表示，比如(g_cur,g_next)。

S208，从定位分片序列中搜索目标分片序列。

其中，目标分片序列是符合目标条件的定位分片序列。目标条件，比如出现概率最高或预设前几名，出现次数做多或达到预设次数等。具体地，计算机设备可从定位分片序列中按目标条件搜索符合目标条件的目标分片序列。

在一个实施例中，计算机设备可计算各定位分片序列出现的次数，将出现次数最高的定位分片序列作为目标分片序列。或者，计算机设备可计算各定位分片出现的概率，将最大概率对应的定位分片序列作为目标定位分片序列。还或者，计算机设备可获取预先设置的目标条件，将满足目标条件的定位分片序列作为目标分片序列。

S210，根据目标分片序列确定相应的路线。

具体地，当计算机设备从定位分片序列中搜索出目标分片序列后，可根据目标分片序列确定相应的路线。

在一个实施例中，计算机设备可确定目标定位序列中的各定位分片的中心点，将中心点连接的线作为与目标定位分片相应的路线。或者，计算机设备也可确定目标定位序列中的各定位分片的预设位置点，比如左上角或右上角的定位点，将各定位分片中的预设位置点连接的线作为与目标定位分片相应的路线。

在一个实施例中，计算机设备可根据目标定位序列中的各定位分片在地图中的位置，确定与目标分片序列重合度最高的交通路线作为与目标定位分片相应的路线。

上述路线挖掘方法，确定移动轨迹定位点所属的定位分片，按照移动轨迹定位点所对应定位时间的时序，对移动轨迹定位点所属的定位分片进行组合，得到定位分片序列。可根据用户的移动轨迹定位点，组合出多种用户可能的出行路线所对应的定位分片序列。再从定位分片序列中搜索目标分片序列，以确定相应的路线。这样，通过移动轨迹定位点进行用户出行路线的挖掘，可充分利用用户的定位数据而不仅仅局限于用户的导航数据。根据用户的移动轨迹定位点，挖掘出用户经常使用的出行路线，具有更高的用户覆盖度和场景覆盖度，使得挖掘出的用户出行路线准确且完整。

在一个实施例中，移动轨迹定位点包括用于确定路线端点的用户常驻点；从用户定位点中，按照相应的聚类特征，筛选表征移动轨迹的移动轨迹定位点的步骤包括：从用户定位点中，按照相应的聚类特征，确定两个聚类中心点；将两个聚类中心点分别确定为用户常驻点。

具体地，计算机设备可获取用户定位点，根据用户定位点的坐标或各用户定位点间的距离，通过聚类算法计算每个用户定位点相应的聚类特征。从用户定位点中，按照相应的聚类特征，确定两个聚类中心点，并将两个聚类中心点分别作为用户常驻点。用户定位点中的两个聚类中心点相对其他定位点而言存在聚类密度更大的特点。对于用户在出行中进行定位时的用户定位点，在统计上来说，用户的出发点和到达点通常是聚类中心点。特别是当用户定位点是统计用户在工作日出行的定位点，所需挖掘的路线为用户通勤路线时，聚类中心点必然是用户的常驻点，比如用户的工作地和居住地的地址等。对于用户的出行路线而言，用户常驻点可以认为是用于确定路线端点的移动轨迹定位点。

上述实施例中，按照用户定位点相应的聚类特征，确定两个聚类中心点，并将两个聚类中心点分别确定为用户常驻点，可以根据用户定位点的聚类特征，方便快捷地确定用户常驻点。

在一个实施例中，聚类特征包括聚类密度和聚类距离；从用户定位点中，按照相应的聚类特征，确定两个聚类中心点的步骤包括：

S902，确定用于将用户定位点相应的聚类密度和聚类距离最大化的目标函数。

其中，目标函数是用设计变量来表示所追求的目标形式，所以目标函数就是设计变量的函数，是一个标量。在本实施例中，设计变量具体可以是聚类密度和聚类距离。目标函数则是用于确定用户定位点相应的聚类密度和聚类距离最大化的函数。建立目标函数的过程就是寻找设计变量与目标的关系的过程，目标函数和设计变量的关系可用曲线、曲面或超曲面表示。假设用ρ表示聚类密度，δ表示聚类距离，目标函数具体可以是表示为y＝f(ρ,δ)，比如可以是y＝ρ*δ这样的形式，或者是y＝aρ+bδ这样的形式，其中，a和b都为常量。

在一个实施例中，将用户定位点组成的数据集作为

I_E＝{1,2,…,N}为相应地指标集，d_ij＝dist(X_i,X_j)表示用户定位点X_i和X_j之间的距离。对于数据集E中的任何一个用户定位点X_i，可以定义ρ_i和δ_i。

其中，聚类密度ρ_i包括Cut-off kernel(截断核)和Gaussian kernel(高斯核)两种计算方法。对于Cut-off kernel的计算方法：

其中，函数

其中，参数d_c>0为截断距离，可预先设置。由上述计算公式可知，ρ_i表示E中与X_i之间距离小于d_c的数据点的个数。

对于Gaussian kernel的计算方法：

对于聚类距离而言，设

表示

的一个降序排列下标序，即它满足

则可定义

至此，对于由用户定位点组成的数据集E中的每一个用户定位点X_i，都可计算相应的聚类密度ρ_i和聚类距离δ_i。

具体地，计算机设备可预先设置用于将用户定位点相应的聚类密度和聚类距离最大化的目标函数，比如，y＝ρ*δ。

S904，筛选使得相应目标函数的值按降序排前两位的用户定位点。

具体地，计算机设备可以根据各用户定位点相应的聚类密度和聚类距离，计算目标函数的值，根据目标函数的值降序排列用户定位点。筛选排名在前两名的用户定位点，筛选出的两个用户定位点可以认为是聚类密度和聚类距离都相对较大的点，也就是用户定位点的聚类中心点。比如，如图5右上角的坐标图所示，筛选虚线框中的两个用户定位点。

S906，将筛选出的用户定位点确定为聚类中心点。

具体地，计算机设备可将筛选出的用户定位点作为聚类中心点，也就是用户常驻点。

上述实施例中，确定用于将用户定位点相应的聚类密度和聚类距离最大化的目标函数，筛选使得相应目标函数的值按降序排前两位的用户定位点作为聚类中心点，通过目标函数可以方便快捷地筛选聚类中心点。

在一个实施例中，移动轨迹定位点包括有效用户出行点；从用户定位点中，按照相应的聚类特征，筛选表征移动轨迹的移动轨迹定位点的步骤包括：从用户定位点所包括的用户出行点中，筛选符合第一有效用户出行点条件的用户出行点，并作为有效用户出行点；从用户定位点所包括的用户停留点中，筛选符合第二有效用户出行点条件的用户停留点，并作为有效用户出行点。

其中，有效用户出行点条件是用户定位点符合出行语义特征的条件。第一有效用户出行点条件主要针对的是用户出行点；第二有效用户出行点条件主要针对的是用户停留点。

具体地，移动轨迹定位点包括有效用户出行点。计算机设备可从用户定位点所包括的用户出行点中，筛选符合第一有效用户出行点条件的用户出行点，并作为有效用户出行点；从用户定位点所包括的用户停留点中，筛选符合第二有效用户出行点条件的用户停留点，并作为有效用户出行点。

在一个实施例中，计算机设备可根据用户定位点的聚类特征，比如聚类密度和聚类距离，从用户定位点中筛选出有效用户出行点。

在一个实施例中，对于用户定位点中的用户出行点而言，可以根据用户出行点相应的聚类密度和聚类距离，筛选出符合出行语义特征的有效用户出行点。比如筛选出聚类密度相对较小、且聚类距离相对较大的用户定位点作为有效用户出行点。

在一个实施例中，计算机设备还可确定用于筛选有效用户出行点的目标函数。对于用户出行点和用户停留点而言，可以采用不同的目标函数。同样地，目标函数也是关于聚类密度和聚类距离的函数。比如，对于用户出行点而言，计算机设备可将y＝ρ/1+δ作为用户出行点的目标函数，计算机设备可筛选y>a₁所对应的用户出行点作为有效用户出行点。对于用户停留点而言，计算机设备可将y＝1/((1+ρ)(1+δ))作为用户停留点的目标函数，计算机设备可筛选y>a₂所对应的用户停留点作为有效用户出行点。其中，a₁和a₂分别是预先设置的阈值。

在一个实施例中，聚类特征包括聚类密度和聚类距离；计算机设备可通过以下公式表示第一有效用户出行条件：

其中，ρ表示聚类密度；δ表示聚类距离；a₁表示第一阈值。具体地，对于第一阈值a₁的取值，可根据经验法则选择0.8。

在一个实施例中，聚类特征包括聚类密度和聚类距离；计算机设备可通过以下公式表示第二有效用户出行条件：

其中，ρ表示聚类密度；δ表示聚类距离；a₂表示第二阈值。具体地，对于第二阈值a₂的取值，可根据经验法则选择0.2。

在一个实施例中，计算机设备可通过以下公式表示第二有效用户出行条件：

此时，对于第二阈值a₂的取值，可相应的调整为0.25。同样地，

上述实施例中，从用户定位点所包括的用户出行点中，筛选符合第一有效用户出行点条件的用户出行点，并作为有效用户出行点；从用户定位点所包括的用户停留点中，筛选符合第二有效用户出行点条件的用户停留点，并作为有效用户出行点。可以全面准确地筛选满足出行语义特征的有效用户出行点，过滤掉干扰数据，大大提高了路线挖掘的准确性。

在一个实施例中，步骤S208，即从定位分片序列中搜索目标分片序列的步骤具体包括以下步骤：计算定位分片序列对应的分值，分值表示定位分片序列中的定位分片按时序组合的概率；筛选所对应分值最大的定位分片序列，得到目标分片序列。

具体地，计算机设备可计算各定位分片序列对应的分值，将对应分值最大的定位分片序列作为目标分片序列。其中，分值表示定位分片序列中的定位分片按移动轨迹定位点所对应定位时间的时序进行组合的概率。

在一个实施例中，计算机设备可根据单个定位分片序列出现的次数，和有所由定位分片序列组成的定位分片序列集合所对应的总次数，计算定位分片序列对应的分值。

在一个实施例中，计算机设备可根据定位分片序列中单个定位分片出现的概率，以及多个定位分片同时出现的概率，计算定位分片序列对应的分值。

在一个实施例中，计算定位分片序列对应的分值的步骤包括：

S1002，获取定位分片序列中首个定位分片对应的第一出现概率。

具体地，定位分片对应的第一出现概率可以根据该定位分片出现的次数，以及由所有定位分片组成的定位分片集合所对应的总次数进行计算。其中，定位分片出现的次数是指，定位分片中出现的移动轨迹定位点的次数的和。

S1004，获取定位分片序列中各定位分片二元组对应的第二出现概率；定位分片二元组包括在定位分片序列中按时序相邻的两个定位分片。

具体地，定位分片二元组包括在定位分片序列中按时序相邻的两个定位分片。计算机设备可以根据定位分片序列中各定位分片二元组出现的次数计算相应的第二出现概率。

在一个实施例中，计算机设备可针对每个定位分片序列及相应的定位分片，进行最大概率的匹配。假设在定位分片序列中，下一个定位分片的出现依赖它前面的一个定位分片，则可通过计算最大似然估计(Maximum Likelihood Estimate)构造模型，进行最佳估计。可采用如下公式计算：

p(w_i|w_i-1)＝count(w_i-1,w_i)/count(w_i-1)

其中，w_i-1和w_i分别是同一个定位片序列中时序相邻的两个定位分片，也就是一个定位分片二元组。定位分片w_i-1的排序在前，定位分片w_i的排序在后。p(w_i|w_i-1)表示该定位分片二元组出现的概率。count(w_i-1,w_i)表示该定位分片二元组出现的次数，count(w_i-1)表示定位分片w_i-1出现的次数。

S1006，根据第一出现概率和第二出现概率计算定位分片序列对应的分值；第一出现概率和第二出现概率均与分值正相关。

具体地，计算机设备可根据第一出现概率和第二出现概率计算定位分片序列中的定位分片按时序组合的概率所对应的分值。

在一个实施例中，计算机设备可根据如下公式计算定位分片序列中的定位分片按时序组合的概率：

p(S)＝p(w₁)p(w₂|w₁)p(w₃|w₁,w₂)…p(w_n|w₁,w₂,…,w_n-1)

＝p(w₁)p(w₂|w₁)p(w₃|w₂)…p(w_n|w_n-1)

其中，p(S)表示定位分片序列S出现的概率；p(w₁)表示定位分片w₁对应的第一出现概率；p(w₂|w₁)表示由定位分片w₂和定位分片w₃所组成的定位分片二元组对应的第二出现概率；p(w₃|w₂)表示由定位分片w₃和定位分片w₂所组成的定位分片二元组对应的第二出现概率；p(w_n|w_n-1)表示由定位分片w_n-1和定位分片w_n所组成的定位分片二元组对应的第二出现概率。在一个实施例中，为了避免数据溢出、提高性能，通常会使用取log后使用加法运算替代乘法运算。比如，可通过

的运算规律对p(S)进行log运算，以得到定位分片序列对应的分值。

在一个实施例中，可用通过以下公式计算定位分片序列对应的分值：

其中，a为常数，且a>0，a≠1；w₁、w₂、w₃…w_n-1至w_n是定位分片序列S中按时序进行组合的定位分片；p(w₁)表示定位分片w₁对应的第一出现概率；p(w₂|w₁)表示由定位分片w₂和定位分片w₃所组成的定位分片二元组对应的第二出现概率；p(w₃|w₂)表示由定位分片w₃和定位分片w₂所组成的定位分片二元组对应的第二出现概率；p(w_n|w_n-1)表示由定位分片w_n-1和定位分片w_n所组成的定位分片二元组对应的第二出现概率。

上述实施例中，根据定位分片序列中首个定位分片对应的第一出现概率，以及定位分片序列中各定位分片二元组对应的第二出现概率，共同计算定位分片序列对应的分值，可以用分值表示定位分片序列出现的概率大小，以便快速地根据分值的大小来挖掘出最合适的路线。

在一个实施例中，移动轨迹定位点包括用户通勤轨迹定位点；路线包括用户通勤路线。

具体地，在移动轨迹中最频繁的模式，是用户通勤路线，也就是用户从工作地到居住地的路线。当移动终端采集用户的用户定位点中，可根据定位时间筛选用户在工作日进行定位的用户通勤轨迹定位点，以便更准确地挖掘出用户通勤路线。

在本实施例中，计算机设备可通过用户非连续的离散轨迹，筛选出用户通勤轨迹定位点，并基于用户通勤轨迹定位点进行路线挖掘，以还原用户通勤路线。

参考图11(1)、图11(2)和图11(3)，图11(1)、图11(2)和图11(3)完整地诠释用户通勤路线挖掘的过程。图11(1)为一个实施例中将用户通勤轨迹定位点进行分片化的结果示意图。图11(1)右侧图片中通过圈圈中的移动轨迹定位点连接的线条表示出了该用户某一天的定位行为，可以看出是非常分散的，只有6-7个定位点信息，虽然在通勤路线上有所表示，但是通勤路线并不完整。图11(2)为一个实施例中单个定位分片的局部分布界面图，该定位分片有可能为用户通勤路线中的一个分片。图11(3)是通过上述路线挖掘方法挖掘出的用户通勤路线的展示图。从图11(3)可以看出，通过执行上述路线挖掘方法，可以准确地还原出用户通勤路线。

上述实施例中，通过用户通勤轨迹定位点可以挖掘出用户通勤路线。

在具体应用场景中，移动终端可采集用户在工作日出行过程中的移动轨迹定位点。根据移动轨迹定位点挖掘出用户最长使用的通勤路线。这对于交通拥堵预测及出行路线规划上，能起到很大的作用。比如，当还原出用户通勤路线后，对于目标用户群在上下班期间的途中，能够有针对性的进行推广信息的投放。并且，同时针对用户途径中的不同站点，也可以进行与站点相应的推广信息的投放。还比如，基于用户通勤路线，可以更好的挖掘出使用频繁的路线，为班车的路线规划和运营提供更好的规划建议。

如图12所示，在一个具体的实施例中，路线挖掘方法包括：

S1202，获取多个移动轨迹周期内累积的用户定位点。

S1204，确定每个用户定位点相应的聚类特征，其中，聚类特征包括聚类密度和聚类距离。

S1206，确定用于将用户定位点相应的聚类密度和聚类距离最大化的目标函数。

S1208，筛选使得相应目标函数的值按降序排前两位的用户定位点。

S1210，将筛选出的用户定位点确定为聚类中心点。

S1212，将两个聚类中心点分别确定为用户常驻点。

S1214，从用户定位点所包括的用户出行点中，筛选符合第一有效用户出行点条件的用户出行点，并作为有效用户出行点。

S1216，从用户定位点所包括的用户停留点中，筛选符合第二有效用户出行点条件的用户停留点，并作为有效用户出行点。

S1218，获取分片精度。

S1220，将移动轨迹定位点的坐标除以分片精度并取整，获得分片标识；分片标识表示移动轨迹定位点所属的定位分片；其中，移动轨迹定位点包括用户常驻点和有效用户出行点。

S1222，按照移动轨迹定位点所对应定位时间的时序，对移动轨迹定位点所属的定位分片进行组合，得到定位分片序列。

S1224，获取定位分片序列中首个定位分片对应的第一出现概率。

S1226，获取定位分片序列中各定位分片二元组对应的第二出现概率；定位分片二元组包括在定位分片序列中按时序相邻的两个定位分片。

S1228，根据第一出现概率和第二出现概率计算定位分片序列对应的分值；第一出现概率和第二出现概率均与分值正相关；分值表示定位分片序列中的定位分片按时序组合的概率。

S1230，筛选所对应分值最大的定位分片序列，得到目标分片序列。

S1232，根据目标分片序列确定相应的路线。

图12为一个实施例中路线挖掘方法的流程示意图。应该理解的是，虽然图12的流程图中的各个步骤按照箭头的指示依次显示，但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明，这些步骤的执行并没有严格的顺序限制，这些步骤可以以其它的顺序执行。而且，图12中的至少一部分步骤可以包括多个子步骤或者多个阶段，这些子步骤或者阶段并不必然是在同一时刻执行完成，而是可以在不同的时刻执行，这些子步骤或者阶段的执行顺序也不必然是依次进行，而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。

如图13所示，在一个实施例中，提供了一种路线挖掘装置1300，包括：获取模块1301、确定模块1302、组合模块1303和搜索模块1304。

获取模块1301，用于本获取移动轨迹定位点。

确定模块1302，用于确定移动轨迹定位点所属的定位分片。

组合模块1303，用于按照移动轨迹定位点所对应定位时间的时序，对移动轨迹定位点所属的定位分片进行组合，得到定位分片序列。

搜索模块1304，用于从定位分片序列中搜索目标分片序列。

确定模块1302还用于根据目标分片序列确定相应的路线。

在一个实施例中，获取模块1301还用于获取多个移动轨迹周期内累积的用户定位点；从用户定位点中筛选表征移动轨迹的移动轨迹定位点。

在一个实施例中，获取模块1301还用于获取用户定位点；确定每个用户定位点相应的聚类特征；从用户定位点中，按照相应的聚类特征，筛选表征移动轨迹的移动轨迹定位点。

在一个实施例中，移动轨迹定位点包括用于确定路线端点的用户常驻点；获取模块1301还用于从用户定位点中，按照相应的聚类特征，确定两个聚类中心点；将两个聚类中心点分别确定为用户常驻点。

在一个实施例中，聚类特征包括聚类密度和聚类距离；获取模块1301还用于确定用于将用户定位点相应的聚类密度和聚类距离最大化的目标函数；筛选使得相应目标函数的值按降序排前两位的用户定位点；将筛选出的用户定位点确定为聚类中心点。

在一个实施例中，移动轨迹定位点包括有效用户出行点；获取模块1301还用于从用户定位点所包括的用户出行点中，筛选符合第一有效用户出行点条件的用户出行点，并作为有效用户出行点；从用户定位点所包括的用户停留点中，筛选符合第二有效用户出行点条件的用户停留点，并作为有效用户出行点。

在一个实施例中，聚类特征包括聚类密度和聚类距离；获取模块1301在执行从用户定位点所包括的用户出行点中，筛选符合第一有效用户出行点条件的用户出行点，并作为有效用户出行点的步骤时，还用于用以下公式表示第一有效用户出行条件：

其中，ρ表示聚类密度；δ表示聚类距离；a₁表示第一阈值。

在一个实施例中，聚类特征包括聚类密度和聚类距离；获取模块1301在执行从用户定位点所包括的用户停留点中，筛选符合第二有效用户出行点条件的用户停留点，并作为有效用户出行点的步骤时，还用于用以下公式表示第二有效用户出行条件：

其中，ρ表示聚类密度；δ表示聚类距离；a₂表示第二阈值。

在一个实施例中，确定模块1302还用于获取分片精度；根据分片精度和移动轨迹定位点的坐标，确定在按照分片精度进行分片划分时移动轨迹定位点所属的定位分片。

在一个实施例中，确定模块1302还用于将移动轨迹定位点的坐标除以分片精度并取整，获得分片标识；分片标识表示移动轨迹定位点所属的定位分片。

在一个实施例中，搜索模块1304还用于计算定位分片序列对应的分值，分值表示定位分片序列中的定位分片按时序组合的概率；筛选所对应分值最大的定位分片序列，得到目标分片序列。

在一个实施例中，搜索模块1304还用于获取定位分片序列中首个定位分片对应的第一出现概率；获取定位分片序列中各定位分片二元组对应的第二出现概率；定位分片二元组包括在定位分片序列中按时序相邻的两个定位分片；根据第一出现概率和第二出现概率计算定位分片序列对应的分值；第一出现概率和第二出现概率均与分值正相关。

在一个实施例中，搜索模块1304在执行根据第一出现概率和第二出现概率计算定位分片序列对应的分值的步骤时，还用于通过以下公式计算定位分片序列对应的分值：

上述路线挖掘装置，确定移动轨迹定位点所属的定位分片，按照移动轨迹定位点所对应定位时间的时序，对移动轨迹定位点所属的定位分片进行组合，得到定位分片序列。可根据用户的移动轨迹定位点，组合出多种用户可能的出行路线所对应的定位分片序列。再从定位分片序列中搜索目标分片序列，以确定相应的路线。这样，通过移动轨迹定位点进行用户出行路线的挖掘，可充分利用用户的定位数据而不仅仅局限于用户的导航数据。根据用户的移动轨迹定位点，挖掘出用户经常使用的出行路线，具有更高的用户覆盖度和场景覆盖度，使得挖掘出的用户出行路线准确且完整。

图14示出了一个实施例中计算机设备的内部结构图。该计算机设备具体可以是图1中的终端110。如图14所示，该计算机设备包括该计算机设备包括通过系统总线连接的处理器、存储器、网络接口、输入装置和显示屏。其中，存储器包括非易失性存储介质和内存储器。该计算机设备的非易失性存储介质存储有操作系统，还可存储有计算机程序，该计算机程序被处理器执行时，可使得处理器实现路线挖掘方法。该内存储器中也可储存有计算机程序，该计算机程序被处理器执行时，可使得处理器执行路线挖掘方法。计算机设备的显示屏可以是液晶显示屏或者电子墨水显示屏，计算机设备的输入装置可以是显示屏上覆盖的触摸层，也可以是计算机设备外壳上设置的按键、轨迹球或触控板，还可以是外接的键盘、触控板或鼠标等。

图15示出了一个实施例中计算机设备的内部结构图。该计算机设备具体可以是图1中的服务器120。如图15所示，该计算机设备包括该计算机设备包括通过系统总线连接的处理器、存储器以及网络接口。其中，存储器包括非易失性存储介质和内存储器。该计算机设备的非易失性存储介质存储有操作系统，还可存储有计算机程序，该计算机程序被处理器执行时，可使得处理器实现路线挖掘方法。该内存储器中也可储存有计算机程序，该计算机程序被处理器执行时，可使得处理器执行路线挖掘方法。

本领域技术人员可以理解，图14以及图15中示出的结构，仅仅是与本申请方案相关的部分结构的框图，并不构成对本申请方案所应用于其上的计算机设备的限定，具体的计算机设备可以包括比图中所示更多或更少的部件，或者组合某些部件，或者具有不同的部件布置。

在一个实施例中，本申请提供的路线挖掘装置可以实现为一种计算机程序的形式，计算机程序可在如图14或图15所示的计算机设备上运行。计算机设备的存储器中可存储组成该路线挖掘装置的各个程序模块，比如，图13所示的获取模块、确定模块、组合模块和搜索模块。各个程序模块构成的计算机程序使得处理器执行本说明书中描述的本申请各个实施例的路线挖掘方法中的步骤。

例如，图14或图15所示的计算机设备可以通过如图13所示的路线挖掘装置中的获取模块执行步骤S202。计算机设备可通过确定模块执行步骤S204和S2010。计算机设备可通过组合模块执行步骤S206。计算机设备可通过搜索模块执行步骤S208。

在一个实施例中，提供了一种计算机设备，包括存储器和处理器，存储器中储存有计算机程序，计算机程序被处理器执行时，使得处理器执行以下步骤：获取移动轨迹定位点；确定移动轨迹定位点所属的定位分片；按照移动轨迹定位点所对应定位时间的时序，对移动轨迹定位点所属的定位分片进行组合，得到定位分片序列；从定位分片序列中搜索目标分片序列；根据目标分片序列确定相应的路线。

在一个实施例中，计算机程序使得处理器在执行获取移动轨迹定位点的步骤时具体执行以下步骤：获取多个移动轨迹周期内累积的用户定位点；从用户定位点中筛选表征移动轨迹的移动轨迹定位点。

在一个实施例中，计算机程序使得处理器在执行获取移动轨迹定位点的步骤时具体执行以下步骤：获取用户定位点；确定每个用户定位点相应的聚类特征；从用户定位点中，按照相应的聚类特征，筛选表征移动轨迹的移动轨迹定位点。

在一个实施例中，移动轨迹定位点包括用于确定路线端点的用户常驻点；计算机程序使得处理器在执行从用户定位点中，按照相应的聚类特征，筛选表征移动轨迹的移动轨迹定位点的步骤时具体执行以下步骤：从用户定位点中，按照相应的聚类特征，确定两个聚类中心点；将两个聚类中心点分别确定为用户常驻点。

在一个实施例中，聚类特征包括聚类密度和聚类距离；计算机程序使得处理器在执行从用户定位点中，按照相应的聚类特征，确定两个聚类中心点的步骤时具体执行以下步骤：确定用于将用户定位点相应的聚类密度和聚类距离最大化的目标函数；筛选使得相应目标函数的值按降序排前两位的用户定位点；将筛选出的用户定位点确定为聚类中心点。

在一个实施例中，移动轨迹定位点包括有效用户出行点；计算机程序使得处理器在执行从用户定位点中，按照相应的聚类特征，筛选表征移动轨迹的移动轨迹定位点的步骤时具体执行以下步骤：从用户定位点所包括的用户出行点中，筛选符合第一有效用户出行点条件的用户出行点，并作为有效用户出行点；从用户定位点所包括的用户停留点中，筛选符合第二有效用户出行点条件的用户停留点，并作为有效用户出行点。

在一个实施例中，聚类特征包括聚类密度和聚类距离；用以下公式表示第一有效用户出行条件：

在一个实施例中，聚类特征包括聚类密度和聚类距离；用以下公式表示第二有效用户出行条件：

在一个实施例中，计算机程序使得处理器在执行确定移动轨迹定位点所属的定位分片的步骤时具体执行以下步骤：获取分片精度；根据分片精度和移动轨迹定位点的坐标，确定在按照分片精度进行分片划分时移动轨迹定位点所属的定位分片。

在一个实施例中，计算机程序使得处理器在执行根据分片精度和移动轨迹定位点的坐标，确定在按照分片精度进行分片划分时移动轨迹定位点所属的定位分片的步骤时具体执行以下步骤：将移动轨迹定位点的坐标除以分片精度并取整，获得分片标识；分片标识表示移动轨迹定位点所属的定位分片。

在一个实施例中，计算机程序使得处理器在执行从定位分片序列中搜索目标分片序列的步骤时具体执行以下步骤：计算定位分片序列对应的分值，分值表示定位分片序列中的定位分片按时序组合的概率；筛选所对应分值最大的定位分片序列，得到目标分片序列。

在一个实施例中，计算机程序使得处理器在执行计算定位分片序列对应的分值的步骤时具体执行以下步骤：获取定位分片序列中首个定位分片对应的第一出现概率；获取定位分片序列中各定位分片二元组对应的第二出现概率；定位分片二元组包括在定位分片序列中按时序相邻的两个定位分片；根据第一出现概率和第二出现概率计算定位分片序列对应的分值；第一出现概率和第二出现概率均与分值正相关。

在一个实施例中，计算机程序使得处理器在执行根据第一出现概率和第二出现概率计算定位分片序列对应的分值的步骤时具体执行以下步骤：通过以下公式计算定位分片序列对应的分值：

上述计算机设备，确定移动轨迹定位点所属的定位分片，按照移动轨迹定位点所对应定位时间的时序，对移动轨迹定位点所属的定位分片进行组合，得到定位分片序列。可根据用户的移动轨迹定位点，组合出多种用户可能的出行路线所对应的定位分片序列。再从定位分片序列中搜索目标分片序列，以确定相应的路线。这样，通过移动轨迹定位点进行用户出行路线的挖掘，可充分利用用户的定位数据而不仅仅局限于用户的导航数据。根据用户的移动轨迹定位点，挖掘出用户经常使用的出行路线，具有更高的用户覆盖度和场景覆盖度，使得挖掘出的用户出行路线准确且完整。

一种计算机可读存储介质，存储有计算机程序，该计算机程序被处理器执行时实现以下步骤：获取移动轨迹定位点；确定移动轨迹定位点所属的定位分片；按照移动轨迹定位点所对应定位时间的时序，对移动轨迹定位点所属的定位分片进行组合，得到定位分片序列；从定位分片序列中搜索目标分片序列；根据目标分片序列确定相应的路线。

上述计算机可读存储介质，确定移动轨迹定位点所属的定位分片，按照移动轨迹定位点所对应定位时间的时序，对移动轨迹定位点所属的定位分片进行组合，得到定位分片序列。可根据用户的移动轨迹定位点，组合出多种用户可能的出行路线所对应的定位分片序列。再从定位分片序列中搜索目标分片序列，以确定相应的路线。这样，通过移动轨迹定位点进行用户出行路线的挖掘，可充分利用用户的定位数据而不仅仅局限于用户的导航数据。根据用户的移动轨迹定位点，挖掘出用户经常使用的出行路线，具有更高的用户覆盖度和场景覆盖度，使得挖掘出的用户出行路线准确且完整。

需要说明的是，本申请所涉及的用户信息(包括但不限于用户设备信息、用户定位信息等)和数据(包括但不限于用于分析的数据、存储的数据、展示的数据等)，均为经用户授权或者经过各方充分授权的信息和数据，且相关数据的收集、使用和处理需要遵守相关国家和地区的相关法律法规和标准。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，所述的程序可存储于一非易失性计算机可读取存储介质中，该程序在执行时，可包括如上述各方法的实施例的流程。其中，本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用，均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限，RAM以多种形式可得，诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。

以上实施例的各技术特征可以进行任意的组合，为使描述简洁，未对上述实施例中的各个技术特征所有可能的组合都进行描述，然而，只要这些技术特征的组合不存在矛盾，都应当认为是本说明书记载的范围。

以上所述实施例仅表达了本申请的几种实施方式，其描述较为具体和详细，但并不能因此而理解为对本申请专利范围的限制。应当指出的是，对于本领域的普通技术人员来说，在不脱离本申请构思的前提下，还可以做出若干变形和改进，这些都属于本申请的保护范围。因此，本申请专利的保护范围应以所附权利要求为准。

Claims

1.一种路线挖掘方法，包括：

获取移动轨迹定位点；

确定所述移动轨迹定位点所属的定位分片；

按照所述移动轨迹定位点所对应定位时间的时序，确定各定位分片发生跳转的可能性，并基于各定位分片发生跳转的可能性对所述移动轨迹定位点所属的定位分片进行组合，得到定位分片序列；其中，若两个定位分片中存在时序上相邻的移动轨迹定位点，则表征发生了定位分片跳转；

对于每个定位分片序列，根据定位分片序列中单个定位分片出现的概率，以及多个定位分片同时出现的概率，计算相应定位分片序列对应的分值，所述分值表示所述定位分片序列中的定位分片按所述时序组合的概率；

基于各所述定位分片序列分别对应的分值的大小，从所述定位分片序列中搜索目标分片序列；

根据所述目标分片序列确定相应的路线。

2.根据权利要求1所述的方法，其特征在于，所述获取移动轨迹定位点，包括：

获取多个移动轨迹周期内累积的用户定位点；

从所述用户定位点中筛选表征移动轨迹的移动轨迹定位点。

3.根据权利要求1所述的方法，其特征在于，所述获取移动轨迹定位点，包括：

获取用户定位点；

确定每个用户定位点相应的聚类特征；

从所述用户定位点中，按照相应的聚类特征，筛选表征移动轨迹的移动轨迹定位点。

4.根据权利要求3所述的方法，其特征在于，所述移动轨迹定位点包括用于确定路线端点的用户常驻点；所述从所述用户定位点中，按照相应的聚类特征，筛选表征移动轨迹的移动轨迹定位点包括：

从所述用户定位点中，按照相应的聚类特征，确定两个聚类中心点；

将所述两个聚类中心点分别确定为用户常驻点。

5.根据权利要求4所述的方法，其特征在于，所述聚类特征包括聚类密度和聚类距离；所述从所述用户定位点中，按照相应的聚类特征，确定两个聚类中心点包括：

确定用于将用户定位点相应的聚类密度和聚类距离最大化的目标函数；

筛选使得相应目标函数的值按降序排前两位的用户定位点；

将筛选出的用户定位点确定为聚类中心点。

6.根据权利要求3所述的方法，其特征在于，所述移动轨迹定位点包括有效用户出行点；所述从所述用户定位点中，按照相应的聚类特征，筛选表征移动轨迹的移动轨迹定位点包括：

从所述用户定位点所包括的用户出行点中，筛选符合第一有效用户出行点条件的用户出行点，并作为有效用户出行点；

从所述用户定位点所包括的用户停留点中，筛选符合第二有效用户出行点条件的用户停留点，并作为有效用户出行点。

7.根据权利要求6所述的方法，其特征在于，所述聚类特征包括聚类密度和聚类距离；所述第一有效用户出行点条件为：

用以下公式表示第一有效用户出行条件：

其中，

表示聚类密度；

表示聚类距离；

表示第一阈值。

8.根据权利要求6所述的方法，其特征在于，所述聚类特征包括聚类密度和聚类距离；所述第二有效用户出行点条件为：

用以下公式表示第二有效用户出行条件：

其中，

表示聚类密度；

表示聚类距离；

表示第二阈值。

9.根据权利要求1所述的方法，其特征在于，所述确定所述移动轨迹定位点所属的定位分片包括：

获取分片精度；

根据所述分片精度和所述移动轨迹定位点的坐标，确定在按照所述分片精度进行分片划分时所述移动轨迹定位点所属的定位分片。

10.根据权利要求9所述的方法，其特征在于，所述根据所述分片精度和所述移动轨迹定位点的坐标，确定在按照所述分片精度进行分片划分时所述移动轨迹定位点所属的定位分片包括：

将所述移动轨迹定位点的坐标除以所述分片精度并取整，获得分片标识；所述分片标识表示所述移动轨迹定位点所属的定位分片。

11.根据权利要求1所述的方法，其特征在于，所述基于各所述定位分片序列分别对应的分值的大小，从所述定位分片序列中搜索目标分片序列包括：

筛选所对应分值最大的定位分片序列，得到目标分片序列。

12.根据权利要求11所述的方法，其特征在于，所述根据定位分片序列中单个定位分片出现的概率，以及多个定位分片同时出现的概率，计算相应定位分片序列对应的分值包括：

获取所述定位分片序列中首个定位分片对应的第一出现概率；

获取所述定位分片序列中各定位分片二元组对应的第二出现概率；所述定位分片二元组包括在所述定位分片序列中按所述时序相邻的两个定位分片；

根据所述第一出现概率和所述第二出现概率计算所述定位分片序列对应的分值；所述第一出现概率和所述第二出现概率均与所述分值正相关。

13.根据权利要求12所述的方法，其特征在于，所述根据所述第一出现概率和所述第二出现概率计算所述定位分片序列对应的分值，包括：

通过以下公式计算定位分片序列对应的分值：

其中，

为常数，且

，

；

、

、

…

至

是定位分片序列

中按所述时序进行组合的定位分片；

表示定位分片

对应的第一出现概率；

表示由定位分片

和定位分片

所组成的定位分片二元组对应的第二出现概率；

表示由定位分片

和定位分片

所组成的定位分片二元组对应的第二出现概率；

表示由定位分片

和定位分片

所组成的定位分片二元组对应的第二出现概率。

14.一种路线挖掘装置，其特征在于，所述装置包括：

获取模块，用于获取移动轨迹定位点；

确定模块，用于确定所述移动轨迹定位点所属的定位分片；

组合模块，用于按照所述移动轨迹定位点所对应定位时间的时序，确定各定位分片发生跳转的可能性，并基于各定位分片发生跳转的可能性对所述移动轨迹定位点所属的定位分片进行组合，得到定位分片序列；其中，若两个定位分片中存在时序上相邻的移动轨迹定位点，则表征发生了定位分片跳转；

搜索模块，用于对于每个定位分片序列，根据定位分片序列中单个定位分片出现的概率，以及多个定位分片同时出现的概率，计算相应定位分片序列对应的分值，所述分值表示所述定位分片序列中的定位分片按所述时序组合的概率；基于各所述定位分片序列分别对应的分值的大小，从所述定位分片序列中搜索目标分片序列；

所述确定模块，还用于根据所述目标分片序列确定相应的路线。

15.根据权利要求14所述的装置，其特征在于，所述获取模块，还用于获取多个移动轨迹周期内累积的用户定位点；从所述用户定位点中筛选表征移动轨迹的移动轨迹定位点。

16.根据权利要求14所述的装置，其特征在于，所述获取模块，还用于获取用户定位点；确定每个用户定位点相应的聚类特征；从所述用户定位点中，按照相应的聚类特征，筛选表征移动轨迹的移动轨迹定位点。

17.根据权利要求15所述的装置，其特征在于，所述移动轨迹定位点包括用于确定路线端点的用户常驻点；所述获取模块，还用于从所述用户定位点中，按照相应的聚类特征，确定两个聚类中心点；将所述两个聚类中心点分别确定为用户常驻点。

18.根据权利要求17所述的装置，其特征在于，所述聚类特征包括聚类密度和聚类距离；所述获取模块，还用于确定用于将用户定位点相应的聚类密度和聚类距离最大化的目标函数；筛选使得相应目标函数的值按降序排前两位的用户定位点；将筛选出的用户定位点确定为聚类中心点。

19.根据权利要求16所述的装置，其特征在于，所述移动轨迹定位点包括有效用户出行点；所述获取模块，还用于从所述用户定位点所包括的用户出行点中，筛选符合第一有效用户出行点条件的用户出行点，并作为有效用户出行点；从所述用户定位点所包括的用户停留点中，筛选符合第二有效用户出行点条件的用户停留点，并作为有效用户出行点。

20.根据权利要求19所述的装置，其特征在于，所述聚类特征包括聚类密度和聚类距离；所述第一有效用户出行点条件为：

用以下公式表示第一有效用户出行条件：

其中，

表示聚类密度；

表示聚类距离；

表示第一阈值。

21.根据权利要求19所述的装置，其特征在于，所述聚类特征包括聚类密度和聚类距离；所述第二有效用户出行点条件为：

用以下公式表示第二有效用户出行条件：

其中，

表示聚类密度；

表示聚类距离；

表示第二阈值。

22.根据权利要求14所述的装置，其特征在于，所述确定模块，还用于获取分片精度；根据所述分片精度和所述移动轨迹定位点的坐标，确定在按照所述分片精度进行分片划分时所述移动轨迹定位点所属的定位分片。

23.根据权利要求22所述的装置，其特征在于，所述确定模块，还用于将所述移动轨迹定位点的坐标除以所述分片精度并取整，获得分片标识；所述分片标识表示所述移动轨迹定位点所属的定位分片。

24.根据权利要求14所述的装置，其特征在于，所述搜索模块，还用于筛选所对应分值最大的定位分片序列，得到目标分片序列。

25.根据权利要求24所述的装置，其特征在于，所述搜索模块，还用于获取所述定位分片序列中首个定位分片对应的第一出现概率；获取所述定位分片序列中各定位分片二元组对应的第二出现概率；所述定位分片二元组包括在所述定位分片序列中按所述时序相邻的两个定位分片；根据所述第一出现概率和所述第二出现概率计算所述定位分片序列对应的分值；所述第一出现概率和所述第二出现概率均与所述分值正相关。

26.根据权利要求25所述的装置，其特征在于，所述搜索模块在执行根据所述第一出现概率和所述第二出现概率计算所述定位分片序列对应的分值时，还用于通过以下公式计算定位分片序列对应的分值：