CN111831769A

CN111831769A - 轨迹处理方法、装置、电子设备及存储介质

Info

Publication number: CN111831769A
Application number: CN202010562178.0A
Authority: CN
Inventors: 刘册; 刘东旭
Original assignee: Hanhai Information Technology Shanghai Co Ltd
Current assignee: Hanhai Information Technology Shanghai Co Ltd
Priority date: 2020-06-18
Filing date: 2020-06-18
Publication date: 2020-10-27

Abstract

本发明的实施例公开了一种轨迹处理方法和装置。该方法包括：将候选轨迹转换为地理位置索引序列；基于所述地理位置索引序列中每个地理位置索引对应的热度信息，获取所述候选轨迹的目标热度；基于与任意两条所述候选轨迹对应的两个地理位置索引序列，获取所述任意两条候选轨迹之间的相似度。本发明能够对候选轨迹间的相似度以及候选轨迹的热度进行计算时，提升计算结果的准确度以及减少计算耗时。

Description

轨迹处理方法、装置、电子设备及存储介质

技术领域

本发明的实施例涉及计算机技术领域，特别是涉及一种轨迹处理方法、装置、电子设备及计算机可读存储介质。

背景技术

随着计算机技术的不断发展，各种应用场景下(例如配送业务场景下的轨迹挖掘和路线排序的应用)都需要对轨迹间的相似性进行度量以及对轨迹的热度进行计算。其中，轨迹的热度可以表达出该轨迹的受欢迎程度，例如在配送业务中，该轨迹被大量配送运力使用来完成配送服务，则该轨迹的热度较高。

相关技术中在计算任意两条轨迹间的相似性时，主要通过以下方式1或方式2来实现：

方式1，例如轨迹p1和轨迹p2(其中，记轨迹p2的距离为d2)，通过遍历轨迹p1的所有轨迹点，来确定落在轨迹p2(这里为基线轨迹)内的多个目标轨迹点，然后，计算每两个目标轨迹点之间的距离，并对距离求和得到d1，那么轨迹p1和轨迹p2的相似度f(p₁，p₂)＝d1/d2。

但是，方式1的计算轨迹相似度的方法需要遍历每两个目标轨迹点之间的距离，效率较低；而且，基线轨迹(指代上述轨迹p2)越短，对相似性的计算结果越有利，以及上述方式1的计算方法不满足交换律，即f(p₁，p₂)！＝f(p₂，p₁)，因此，该方法还存在着计算的相似度不准确的问题。

方式2，轨迹p1和轨迹p2分别进行地图匹配，确定每条轨迹分别经过了哪些地理道路l，从而获取到轨迹p1和轨迹p2分别经过的地理道路所构成的集合

以及

最后，基于这两个集合来确定轨迹p1和轨迹p2之间的相似度。

但是，上述方式2在计算集合L时需要依赖地图匹配服务，而地图匹配属于计算密集型服务，响应时间较慢，那么依赖地图匹配进行相似度计算会增加服务链路，拖慢系统响应时间；而且，地图匹配在步骑行场景下存在主路辅路区分不清的问题，进而还会导致相似度的计算结果不准确的问题。

而相关技术中在计算轨迹的热度时，主要是基于轨迹间的相似度，来确定某条轨迹的热度，而由于上述方式1或方式2所计算的轨迹间的相似度就存在着效率低、响应慢以及准确度差的问题，因此，相关技术中的计算的轨迹热度的方法同样存在着计算耗时长，从而在线上应用会大幅拉升响应时间的问题，以及计算准确度低的问题。

发明内容

本发明的实施例提供一种轨迹处理方法，以解决相关技术中的轨迹间的相似度以及轨迹的热度的计算方法所存在的耗时长和准确度低的问题。

为了解决上述问题，第一方面，本发明实施例提供了一种轨迹处理方法，包括：

将候选轨迹转换为地理位置索引序列；

基于所述地理位置索引序列中每个地理位置索引对应的热度信息，获取所述候选轨迹的目标热度；

基于与任意两条所述候选轨迹对应的两个地理位置索引序列，获取所述任意两条候选轨迹之间的相似度。

第二方面，本发明实施例提供了一种轨迹处理装置，包括：

转换模块，用于将候选轨迹转换为地理位置索引序列；

第一获取模块，用于基于所述地理位置索引序列中每个地理位置索引对应的热度信息，获取所述候选轨迹的目标热度；

第二获取模块，用于基于与任意两条所述候选轨迹对应的两个地理位置索引序列，获取所述任意两条候选轨迹之间的相似度。

第三方面，本发明实施例还公开了一种电子设备，包括存储器、处理器及存储在所述存储器上并可在处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现本发明实施例所述的轨迹处理方法。

第四方面，本发明实施例提供了一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时本发明实施例公开的轨迹处理方法的步骤。

在本发明实施例中，可以通过将候选轨迹转换为地理位置索引序列，来计算某条候选轨迹的热度，或计算不同候选轨迹间的相似度，通过将候选轨迹转化为地理位置索引序列进行轨迹的热度挖掘，或轨迹间的相似度度量，可以提升对相似度和轨迹热度的计算结果的准确度；而且，在基于候选轨迹的地理位置索引序列来计算轨迹的热度时，是基于地理位置索引序列中每个地理位置索引的热度信息而进行的计算，从而可以减少对轨迹热度的计算耗时；此外，在计算两条候选轨迹间的相似度时，可以基于该两条候选轨迹对应的两个地理位置索引序列进行计算，使得相似度的计算维度从路线维度转换为地理位置索引序列中的地理位置索引的维度，可以提升相似度的计算效率，减少计算耗时以及提升算法的鲁棒性。

附图说明

为了更清楚地说明本发明实施例的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1是本发明一个实施例的轨迹处理方法的步骤流程图；

图2是本发明一个实施例的轨迹区域的示意图；

图3是本发明一个实施例的地理位置索引填充轨迹区域的示意图；

图4是本发明一个实施例的地理位置索引的热度的示意图；

图5是本发明一个实施例的轨迹处理装置的结构框图；

图6示意性地示出了用于执行根据本公开的方法的计算处理设备的框图；以及

图7示意性地示出了用于保持或者携带实现根据本公开的方法的程序代码的存储单元。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

本发明实施例提供了一种轨迹处理方法，如图1所示，该方法可以包括如下步骤：

步骤101，将候选轨迹转换为地理位置索引序列；

其中，由于步骤103需要计算两条候选轨迹间的相似度，因此，本步骤中的候选轨迹的数量为至少两个。

根据业务需求的不同，该候选轨迹可以是历史轨迹，也可以是实时的历史轨迹。

在一些业务场景下，该候选轨迹优选为历史轨迹。在配送业务场景下，骑手已经完成的配送业务的配送路线都可以存储在历史轨迹库中。例如地点A到地点B之间有骑手走过的很多条路线，那么为了对地点A与地点B之间的多条路线进行排序，可以参考路线的热度进行排序，因此，需要计算多条路线的热度。

在本场景下，可以将历史轨迹库中的所有历史轨迹进行聚类，找到起始点和终止点相近的一些路线。在进行聚类时，由于历史轨迹中轨迹点的经纬度的精度较高，如果采用经纬度进行轨迹的聚类，那么聚类结果较少，因此，本发明实施例可以对历史轨迹中的起始点的经纬度和终止点的经纬度分别计算地理位置索引，然后，按照起始点和终止点的地理位置索引，对历史轨迹库中的各个历史轨迹进行聚类，从而找到起始点(例如上述地点A)和终止点(上述地点B)相近的一些路线(例如从北京西站附近到望京西站附近的多条历史轨迹)，聚类得到的这一组路线构成轨迹集合M，该轨迹集合M中的每条历史轨迹可以是本步骤中的候选轨迹。

此外，一条候选轨迹可以是由多个轨迹点构成的线，每个轨迹点可以用经纬度来表示，因此，一条候选轨迹可以使用经纬度序列来表示。

在一个示例1中，例如一条轨迹p的经纬度序列如下：

118.12431335449219,24.426040649414062；118.124313,24.426041；118.124306,24.426043；118.124326,24.426101；118.124329,24.426113；118.124337,24.426153；118.124353,24.426351；118.124424,24.426617；118.124255,24.426627

其中，上述经纬度序列中，每个经纬度的轨迹点之间使用分号分割，经度和纬度之间使用逗号分割。

由于任意一个经纬度的轨迹点都可以转换为一个地理位置索引，因此，本步骤中可以将候选轨迹对应的经纬度序列，转换为由多个地理位置索引构成的地理位置索引序列。

其中，在将任何一个经纬度的地理坐标转换为一个地理位置索引时，可以采用的地理索引计算方法包括但不限于GeoHash、H3、S2等算法。

其中，地理位置索引可以将经纬度坐标，编码为由字母和数字所构成的短字符串，可以用这个短字符串值来做索引，用于表达地图上的某个坐标点或区域。其中，在地图上点相近的点就可以转化成有相同前缀的地理位置索引(例如地图上相近的地点1和地点2，它们的地理位置索引分别为abc123,abc124，前缀均为abc12)。而且，地理位置索引可以表示任意精度的地理位置坐标，只要该地理位置索引的字符串长度足够长，其中，地理位置索引的精度越高，其字符串长度越长，其所表达的地理位置的区域就越小、越精准；那么在使用地理位置索引的编码(即字符串)来确定两个地点之间的远近程度时，两组编码的前缀匹配的越长，说明两个地点的地理位置越邻近。

可选地，在执行步骤101时，可以通过S301～S303来实现：

S301，对候选轨迹的宽度进行扩充，生成与所述候选轨迹对应的轨迹区域；

如图2所示的一条轨迹p，可以在垂直轨迹p的方向上，对轨迹p的宽度进行扩充，扩充为宽度为6m的轨迹区域。例如对轨迹p向左扩充3m得到线条a，向右扩充3m得到线条b，由线条a和线条b所框出的区域构成轨迹区域c。例如以轨迹p为中心线进行扩充，且扩充得到的线条a和线条b都是与轨迹p平行的。

其中，在进行宽度扩充时，所需要扩充得到的宽度(这里为6m)一般是接近地理道路的实际宽度的取值。该宽度可以是根据经验而预设的取值。

此外，在对轨迹p进行宽度的扩充时，并不限制于左右扩充的宽度一致，都是3m，可以不对称的扩充，例如左边宽度扩充2m，右边宽度扩充4m。但是，不对称的宽度扩充，会导致所得的该轨迹p的地理位置索引不够准确，进而影响轨迹间的相似度以及轨迹的热度的计算准确度。

此外，由于候选轨迹是带有位置信息的(例如经纬度信息)，那么本步骤中仅仅是对候选轨迹的宽度进行扩充，来生成一个与该候选轨迹对应的轨迹区域，相当于道路区域，所以，该轨迹区域也是具有该区域的地理位置信息(例如经纬度信息)的。

S302，获取填充所述轨迹区域、且精度级别为预设精度级别的多个地理位置索引，以及所述多个地理位置索引对所述轨迹区域的填充顺序，其中，每个地理位置索引表示所述轨迹区域中的一个子区域；

其中，S301已经确定轨迹区域的地理位置，本步骤中还需要已知用于填充该轨迹区域的地理位置索引的精度信息(即上述预设精度级别)，由于一个地理位置索引可以表示任意精度的地理位置坐标，那么在已知地理位置索引的精度级别的情况下，则可以确定精度级别为该预设精度级别的地理位置索引所能够表示的地理区域的形状以及大小。

例如本实施例中以边长为4m的正六边形来作为该预设精度级别的一个示例来说明，也就是说，在已知需要采用多个边长为4m的正六边形来表示，每个地理位置索引所表示的子区域(这里为格子区域)的大小，以及已知需要待填充的轨迹区域的地理位置的情况下，可以利用这两项信息来计算得到能够填充该轨迹区域的多个地理位置索引的字符串取值，其中，这里计算得到的多个地理位置索引的精度级别都是预设精度级别，例如都为8位的字符串。

例如如图3所示，以附图的方式示意性地示出了能够填充由线条a和线条b所框出的区域(例如轨迹区域c)内的各个子区域的多个正六边形(实际由精度级别为预设精度级别的地理位置索引来表示)，每个正六边形的边长为4m。而且，由于各个正六边形所在的子区域不同，即地理位置不同，因此，各个正六边形对应的各个地理位置索引的字符串的取值也是不同的。而且，图3中可以看出，各个正六边形之间存在排列顺序(或者说对轨迹区域c的填充顺序)，因此，本步骤还可以得到能够填充该轨迹区域的多个地理位置索引之间的填充顺序，例如依次是索引1、索引2、索引3……的顺序。

S303，按照所述填充顺序，对所述多个地理位置索引进行排序，生成与所述候选轨迹对应的地理位置索引序列。

由于图3中每个正六边形的子区域用一个S302所得到的一个地理位置索引来表达，且不同正六边形的子区域对应的地理位置索引不同，因此，按照上述填充顺序对S302得到的多个地理位置索引进行排序，则可以得到用于表达该轨迹区域的地理位置索引序列，该序列中的各个地理位置索引即为S302得到的各个地理位置索引。

例如，原本由上述示例1所表示的轨迹p，转换为由这里的示例2所表示的地理位置索引序列，其中，不同地理位置索引之间以逗号间隔：

示例2：

8d41a541c0b48ff,8d41a541c8a677f,8d41a541c5495bf,8d41a541c1ac0ff,8d41a541c1aa4bf,8d41a541c54a8bf,8d41a541c8a66ff,8d41a541c8a24bf,8d41a541c19d93f,8d41a541c12e67f,8d41a541c19b53f,8d41a541c89d67f,8d41a541c11373f,8d41a541c1986ff,8d41a541c19d57f,8d41a541c8837bf,8d41a541c0b6aff

这里示例2中的地理位置索引序列包括了17个地理位置索引，即表示轨迹区域c可以由这里示例的17个上述正六边形的子区域来填充，而各个正六边形的子区域之间可以存在地理位置的重叠、相邻或者间隔中的任意一种位置关系。当然，需要注意的是，上述示例2只是示意性地展示了图3中的部分填充轨迹区域c的正六边形的地理位置索引，未示出填充该轨迹区域c的全部正六边形的地理位置索引。

另外，需要说明的是，该预设精度级别的地理位置索引所表示的子区域的形状并不限于上述举例的边长为4m的正六边形，还可以是其他尺寸的其他形状，而预设精度级别所表示的精度级别的差异，会导致该预设精度级别的地理位置索引所表示的子区域的形状和尺寸存在差异。

例如边长同为4m的正三角形所对应的地理位置索引的精度级别，是高于边长为4m的上述正六边形对应的地理位置索引的精度级别的。

那么采用精度级别更高的地理位置索引来填充轨迹区域，或者说，将候选轨迹转换成精度级别更高的地理位置索引所构成的地理位置索引序列，可以提升所计算的轨迹间的相似度的准确度，以及轨迹的热度的准确度。

在本发明实施例中，通过对候选轨迹的宽度进行扩充，生成与所述候选轨迹对应的轨迹区域；然后，获取填充所述轨迹区域、且精度级别为预设精度级别的多个地理位置索引，以及所述多个地理位置索引对所述轨迹区域的填充顺序，其中，每个地理位置索引表示所述轨迹区域中的一个子区域；最后，按照所述填充顺序，对所述多个地理位置索引进行排序，生成与所述候选轨迹对应的地理位置索引序列。能够将候选轨迹转换为地理位置索引序列，那么在对候选轨迹计算其热度，或计算候选轨迹间的相似度时，则可以将计算维度从轨迹粒度(或者说路线粒度)转换为地理位置索引序列中各个地理位置索引所表示的子区域粒度(例如格子粒度)，使得相似度和热度的计算结果更加准确。

步骤102，基于所述地理位置索引序列中每个地理位置索引对应的热度信息，获取所述候选轨迹的目标热度；

其中，可以预先对各个地理位置索引计算其热度信息，那么当需要计算某条轨迹的热度时，只需要获取该轨迹所对应的地理位置索引序列中每个地理位置索引所分别对应的热度信息，就可以基于各个地理位置索引的热度来直接确定该轨迹的目标热度。

可选地，在执行步骤102时，可以在预设数据库中，查询所述地理位置索引序列中每个地理位置索引对应的热度信息；然后，对所述热度信息的取值进行预设运算，得到所述候选轨迹的目标热度。

预先可以挖掘各个地理位置索引的热度信息，并写入预设数据库(例如K-V数据库)，那么当需要获取某条轨迹的热度时，只需要查询该预设数据库就可以获取到该轨迹所涉及的每个地理位置索引的热度信息，然后，对这些热度信息进行预设运算(例如加法运算，或者加权求和运算等)，就可以快速得到该轨迹的热度。

例如遍历例如轨迹p的地理位置索引序列中每个地理位置索引，并查询每个地理位置索引在K-V数据库中对应的热度值(由于地理位置索引可以理解为Hash(哈希)值，因此，这里相当于进行数次Hash查找)，然后，将该地理位置索引序列中所有地理位置索引在K-V数据库中查询到的热度值进行累加，得到该轨迹p的目标热度。

示例3，示例了部分地理位置索引与其热度值在预设数据库中的存储结构：

{“8d41a541c0b48ff”:65,

“8d41a541c8a677f”:19,

“8d41a541c5495bf”:27,

“8d41a541c1ac0ff”:6,

“8d41a541c1aa4bf”:5,

“8d41a541c54a8bf”:46

}

例如，地理位置索引“8d41a541c0b48ff”的热度值为65。

在本发明实施例中，可以预先对候选轨迹所途径的子区域(即地理位置索引所表示的子区域)进行挖掘，并将各个地理位置索引的热度预先存储到预设数据库中，那么当需要计算某条轨迹的热度时，对轨迹热度的实时计算过程只需要进行数次的数据库查询以及对查询到的热度值进行累加计算，大幅降低了系统的性能损耗，提升了系统响应速度。

可选地，在执行步骤102之前，根据本发明实施例的方法还可以包括S201和S202，来实现对多条候选轨迹所涉及的地理位置索引的热度挖掘，并入库的操作。

S201，在与多条所述候选轨迹对应的多个地理位置索引序列中，识别各候选地理位置索引各自出现的总次数，其中，每个所述地理位置索引序列包括多个所述候选地理位置索引；

例如在步骤101示例的业务场景下，这里的多条候选轨迹可以是经过聚类操作后，从历史轨迹中找到的一组路线(该组路线间起始点是相近的，终止点也是相近的)，例如上述轨迹集合M中的路线。

经过步骤101，轨迹集合M中的每条候选路线都分别转换为各自的地理位置索引序列，例如轨迹集合M包括轨迹p1、轨迹p2和轨迹p3，轨迹p1对应于由索引1，索引2，索引3构成的这一地理位置索引序列；轨迹p2对应于由索引2，索引3构成的这一地理位置索引序列；轨迹p3对应于由索引1，索引3构成的这一地理位置索引序列。那么对上述三条轨迹对应的各个候选地理位置索引(分别为索引1、索引2、索引3)分别计算它们在这三条轨迹的三个地理位置索引序列中出现的总次数，可知，索引1出现了2次，索引2出现了2次，索引3出现了3次。

S202，将所述各候选地理位置索引各自出现的总次数，设置为所述各候选地理位置索引的热度信息并存储至所述预设数据库。

其中，基于上述举例，可以将索引1所出现的2次设置为索引1的热度(热度值为2)，将索引2所出现的2次设置为索引2的热度(热度值为2)，索引3所出现的3次设置为索引3的热度(热度值为3)，并将这三个索引及其热度值写入例如K-V数据库，存储结构类似于上述示例3。

在另一个示例中，如图4所示，示出了各个候选轨迹的地理位置索引序列中所涉及的各个地理位置索引(以图4中的正六边形的区域表示)，并且，每个地理位置索引中所填写的数值用于表示该地理位置索引的热度值。

其中，本发明对于S201和步骤101的执行顺序不做限制。

在上述示例的业务场景下，由于本发明实施例预先对起始点相近和终止点相近的一组历史路线，进行该路线中涉及的各个地理位置索引的热度挖掘，并写入数据库中，那么当需要计算该组历史路线中任意一条路线的热度时，只需要将该路线转换为地理位置索引序列，并查询该地理位置索引序列中每个地理位置索引在数据库中的热度值，并对热度值进行预设运算，即可快速得到该组历史路线中各条路线的热度，那么就可以基于各条路线的热度，结合应用场景找到该组历史路线中热度较优的路线。

在本发明实施例中，可以将候选轨迹转换为地理位置索引序列，并在多条候选轨迹对应的多个地理位置索引序列中，识别各个候选地理位置索引在多个地理位置索引序列中出现的总次数，将该总次数设置为该候选地理位置索引的热度，并写入数据库。从而可以基于地理位置索引进行轨迹热度的计算，并且计算维度由路线粒度优化为地理位置索引所表达的子区域(例如格子)粒度，使得对轨迹的热度计算结果更加准确。而且，历史轨迹途经的格子在挖掘后，可以将挖掘到的格子的热度预先存储到K-V数据库中，使得轨迹热度的实时计算只需要进行数次Hash查找以及数值累加计算，性能消耗低。

步骤103，基于与任意两条所述候选轨迹对应的两个地理位置索引序列，获取所述任意两条候选轨迹之间的相似度。

其中，当需要计算两条候选轨迹之间的相似度时，这两条候选轨迹并不限制为起始点相近，以及终止点相近的两条路线，可以基于这两条候选轨迹所对应的地理位置索引序列，来计算两条路线之间的相似度。

可选地，在一个实施例中，在执行步骤103时，可以识别与任意两条所述候选轨迹对应的两个地理位置索引序列之间，地理位置索引的交集以及地理位置索引的并集；然后，计算所述交集中地理位置索引的数量，与所述并集中地理位置索引的数量的比值，得到所述任意两条候选轨迹之间的相似度。

例如轨迹p1和轨迹p2各自的地理位置索引序列分别为s1和s2，其中，s1为索引1、索引2、索引3、索引4的地理位置索引序列；s2为索引7、索引2、索引3、索引6地理位置索引序列。那么s1和s2之间的地理位置索引的交集为{索引2，索引3}，并集为{索引1，索引2，索引3，索引4，索引6，索引7}，其中，交集中地理位置索引的数量为2个，并集中地理位置索引的数量为6个，那么轨迹p1和轨迹p2之间的相似度为2/6＝1/3。

例如，记s₁和s₂之间的交集中地理位子索引的个数为n,并集中地理位置索引的个数为m，则轨迹p1和轨迹p2之间的相似度为n/m；

其中，在将候选轨迹转换为地理位置索引序列时，所采用的预设精度级别越高，则这里得到的候选轨迹间的相似度的准确性也越高。

可选地，在计算两个地理位置索引序列s1和s2之间的地理位置索引的交集和并集时，还可以通过将s1转换为一个哈希表，将S2转换为一个哈希表，然后，计算两个哈希表之间的交集和并集，从而由空间计算转换为hash查找问题，可以进一步提升本发明实施例的方法的鲁棒性。

在本发明实施例中，在计算任意两条候选轨迹之间的相似度时，可以将轨迹间的相似性度量转换为两个地理位置索引序列之间的相似度度量，并基于两个地理位置索引序列之间地理位置索引的交集和并集，来准确计算两个候选轨迹之间的相似度，使得轨迹间的相似度的计算速度更快，准确度更高；而且，在计算相似度时，转换为获取地理位置索引的交集和并集，由于地理位置索引是字符串形式，相当于由空间的相似度计算转换为字符串的哈希查询过程，算法的鲁棒性更高。

其中，本发明对于步骤102和步骤103的执行顺序不做限制，两个步骤为并列步骤。

在本发明实施例中，可以通过将候选轨迹转换为地理位置索引序列，来计算某条候选轨迹的热度，或计算不同候选轨迹间的相似度，通过将候选轨迹转化为地理位置索引序列进行轨迹的热度挖掘，或轨迹间的相似度度量，可以提升对相似度和轨迹热度的计算结果的准确度；而且，在基于候选轨迹的地理位置索引序列来计算轨迹的热度时，是基于地理位置索引序列中每个地理位置索引的热度信息而进行的计算，从而可以减少对轨迹热度的计算耗时；此外，在计算两条候选轨迹间的相似度时，可以基于该两条候选轨迹对应的两个地理位置索引序列进行计算，使得相似度的计算维度从路线维度转换为地理位置索引序列中的地理位置索引的维度，可以提升相似度的计算效率，减少响应时长以及提升算法的鲁棒性。

对于本发明实施例的上述方法在各个业务场景的应用上也可以具有显著效果。

例如将上述方法应用到路线排序模型中，可以对多条路线分别计算上述热度的参数，那么路线排序模型在评价多条路线时，不仅仅可以基于已有的路况参数、距离参数等对路线进行评价，还可以参考上述热度参数来对路线进行评价，从而完成路线的排序，选出最优路线。应用该类热度参数的特征后，对路线排序评估的准确率指标可以从39.5％提升到40.5％。

此外，上述方法还可以应用到对轨迹的聚类业务上，可以依据上述方法计算的两个轨迹间的相似度，来对多个轨迹进行聚类，提升聚类的准确度。

另外，还可以借助于上述方法计算轨迹的热度的方案，来评估轨迹质量，筛选出高质量(即热度较高)轨迹进行进一步的轨迹挖掘。

并且，结合上述图4示例的热度示意图，还可以看出，利用上述方法还可以进行区域热度分析，具体为，基于骑手的地理位置索引信息可以挖掘出城市中的热门区域，该热门区域即为图4中热度值较高的正六边形的区域(即地理位置索引所表示的子区域)。

本实施例公开了一种轨迹处理装置，如图5所示，所述装置包括：

转换模块41，用于将候选轨迹转换为地理位置索引序列；

第一获取模块42，用于基于所述地理位置索引序列中每个地理位置索引对应的热度信息，获取所述候选轨迹的目标热度；

第二获取模块43，用于基于与任意两条所述候选轨迹对应的两个地理位置索引序列，获取所述任意两条候选轨迹之间的相似度。

可选地，所述第二获取模块43包括：

识别子模块，用于识别与任意两条所述候选轨迹对应的两个地理位置索引序列之间，地理位置索引的交集以及地理位置索引的并集；

计算子模块，用于计算所述交集中地理位置索引的数量，与所述并集中地理位置索引的数量的比值，得到所述任意两条候选轨迹之间的相似度。

可选地，所述第一获取模块42包括：

查询子模块，用于在预设数据库中，查询所述地理位置索引序列中每个地理位置索引对应的热度信息；

运算子模块，用于对所述热度信息的取值进行预设运算，得到所述候选轨迹的目标热度。

可选地，所述装置还包括：

识别模块，用于在与多条所述候选轨迹对应的多个地理位置索引序列中，识别各候选地理位置索引各自出现的总次数，其中，每个所述地理位置索引序列包括多个所述候选地理位置索引；

存储模块，用于将所述各候选地理位置索引各自出现的总次数，设置为所述各候选地理位置索引的热度信息并存储至所述预设数据库。

可选地，所述转换模块41包括：

扩充子模块，用于对候选轨迹的宽度进行扩充，生成与所述候选轨迹对应的轨迹区域；

获取子模块，用于获取填充所述轨迹区域、且精度级别为预设精度级别的多个地理位置索引，以及所述多个地理位置索引对所述轨迹区域的填充顺序，其中，每个地理位置索引表示所述轨迹区域中的一个子区域；

生成子模块，用于按照所述填充顺序，对所述多个地理位置索引进行排序，生成与所述候选轨迹对应的地理位置索引序列。

本发明实施例公开的轨迹处理装置，用于实现本发明上述各个实施例所述的轨迹处理方法的各步骤，装置的各模块的具体实施方式参见相应步骤，此处不再赘述。

本发明实施例公开的轨迹处理装置，可以通过将候选轨迹转换为地理位置索引序列，来计算某条候选轨迹的热度，或计算不同候选轨迹间的相似度，通过将候选轨迹转化为地理位置索引序列进行轨迹的热度挖掘，或轨迹间的相似度度量，可以提升对相似度和轨迹热度的计算结果的准确度；而且，在基于候选轨迹的地理位置索引序列来计算轨迹的热度时，是基于地理位置索引序列中每个地理位置索引的热度信息而进行的计算，从而可以减少对轨迹热度的计算耗时；此外，在计算两条候选轨迹间的相似度时，可以基于该两条候选轨迹对应的两个地理位置索引序列进行计算，使得相似度的计算维度从路线维度转换为地理位置索引序列中的地理位置索引的维度，可以提升相似度的计算效率，减少计算耗时以及提升算法的鲁棒性。

相应的，本发明还公开了一种电子设备，包括存储器、处理器及存储在所述存储器上并可在处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现如本发明上述任意一个实施例所述的轨迹处理方法。所述电子设备可以为PC机、移动终端、个人数字助理、平板电脑等。

本发明还公开了一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现如本发明上述任意一个实施例所述的轨迹处理方法的步骤。

本说明书中的各个实施例均采用递进的方式描述，每个实施例重点说明的都是与其他实施例的不同之处，各个实施例之间相同相似的部分互相参见即可。对于装置实施例而言，由于其与方法实施例基本相似，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

以上对本发明提供的一种轨迹处理方法及装置进行了详细介绍，本文中应用了具体个例对本发明的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本发明的方法及其核心思想；同时，对于本领域的一般技术人员，依据本发明的思想，在具体实施方式及应用范围上均会有改变之处，综上所述，本说明书内容不应理解为对本发明的限制。

以上所描述的装置实施例仅仅是示意性的，其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下，即可以理解并实施。

本公开的各个部件实施例可以以硬件实现，或者以在一个或者多个处理器上运行的软件模块实现，或者以它们的组合实现。本领域的技术人员应当理解，可以在实践中使用微处理器或者数字信号处理器(DSP)来实现根据本公开实施例的计算处理设备中的一些或者全部部件的一些或者全部功能。本公开还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序(例如，计算机程序和计算机程序产品)。这样的实现本公开的程序可以存储在计算机可读介质上，或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到，或者在载体信号上提供，或者以任何其他形式提供。

例如，图6示出了可以实现根据本公开的方法的计算处理设备。该计算处理设备传统上包括处理器1010和以存储器1020形式的计算机程序产品或者计算机可读介质。存储器1020可以是诸如闪存、EEPROM(电可擦除可编程只读存储器)、EPROM、硬盘或者ROM之类的电子存储器。存储器1020具有用于执行上述方法中的任何方法步骤的程序代码1031的存储空间1030。例如，用于程序代码的存储空间1030可以包括分别用于实现上面的方法中的各种步骤的各个程序代码1031。这些程序代码可以从一个或者多个计算机程序产品中读出或者写入到这一个或者多个计算机程序产品中。这些计算机程序产品包括诸如硬盘，紧致盘(CD)、存储卡或者软盘之类的程序代码载体。这样的计算机程序产品通常为如参考图7所述的便携式或者固定存储单元。该存储单元可以具有与图6的计算处理设备中的存储器1020类似布置的存储段、存储空间等。程序代码可以例如以适当形式进行压缩。通常，存储单元包括计算机可读代码1031’，即可以由例如诸如1010之类的处理器读取的代码，这些代码当由计算处理设备运行时，导致该计算处理设备执行上面所描述的方法中的各个步骤。

本文中所称的“一个实施例”、“实施例”或者“一个或者多个实施例”意味着，结合实施例描述的特定特征、结构或者特性包括在本公开的至少一个实施例中。此外，请注意，这里“在一个实施例中”的词语例子不一定全指同一个实施例。

在此处所提供的说明书中，说明了大量具体细节。然而，能够理解，本公开的实施例可以在没有这些具体细节的情况下被实践。在一些实例中，并未详细示出公知的方法、结构和技术，以便不模糊对本说明书的理解。

在权利要求中，不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本公开可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中，这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。

最后应说明的是：以上实施例仅用以说明本公开的技术方案，而非对其限制；尽管参照前述实施例对本公开进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本公开各实施例技术方案的精神和范围。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件实现。基于这样的理解，上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品可以存储在计算机可读存储介质中，如ROM/RAM、磁碟、光盘等，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。

Claims

1.一种轨迹处理方法，其特征在于，包括：

将候选轨迹转换为地理位置索引序列；

2.根据权利要求1所述的方法，其特征在于，所述基于与任意两条所述候选轨迹对应的两个地理位置索引序列，获取所述任意两条候选轨迹之间的相似度，包括：

识别与任意两条所述候选轨迹对应的两个地理位置索引序列之间，地理位置索引的交集以及地理位置索引的并集；

计算所述交集中地理位置索引的数量，与所述并集中地理位置索引的数量的比值，得到所述任意两条候选轨迹之间的相似度。

3.根据权利要求1所述的方法，其特征在于，所述基于所述地理位置索引序列中每个地理位置索引对应的热度信息，获取所述候选轨迹的目标热度，包括：

在预设数据库中，查询所述地理位置索引序列中每个地理位置索引对应的热度信息；

对所述热度信息的取值进行预设运算，得到所述候选轨迹的目标热度。

4.根据权利要求3所述的方法，其特征在于，所述基于所述地理位置索引序列中每个地理位置索引对应的热度信息，获取所述候选轨迹的目标热度之前，所述方法还包括：

在与多条所述候选轨迹对应的多个地理位置索引序列中，识别各候选地理位置索引各自出现的总次数，其中，每个所述地理位置索引序列包括多个所述候选地理位置索引；

将所述各候选地理位置索引各自出现的总次数，设置为所述各候选地理位置索引的热度信息并存储至所述预设数据库。

5.根据权利要求1所述的方法，其特征在于，所述将候选轨迹转换为地理位置索引序列，包括：

对候选轨迹的宽度进行扩充，生成与所述候选轨迹对应的轨迹区域；

获取填充所述轨迹区域、且精度级别为预设精度级别的多个地理位置索引，以及所述多个地理位置索引对所述轨迹区域的填充顺序，其中，每个地理位置索引表示所述轨迹区域中的一个子区域；

按照所述填充顺序，对所述多个地理位置索引进行排序，生成与所述候选轨迹对应的地理位置索引序列。

6.一种轨迹处理装置，其特征在于，包括：

转换模块，用于将候选轨迹转换为地理位置索引序列；

7.根据权利要求6所述的装置，其特征在于，所述第二获取模块包括：

8.根据权利要求6所述的装置，其特征在于，所述第一获取模块包括：

9.一种电子设备，包括存储器、处理器及存储在所述存储器上并可在处理器上运行的计算机程序，其特征在于，所述处理器执行所述计算机程序时实现权利要求1至5任意一项所述的轨迹处理方法。

10.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，该程序被处理器执行时实现权利要求1至5任意一项所述的轨迹处理方法的步骤。