CN110443156B

CN110443156B - 轨迹相似度度量方法、数据处理设备及存储设备

Info

Publication number: CN110443156B
Application number: CN201910642821.8A
Authority: CN
Inventors: 戴泽林
Original assignee: Zhejiang Dahua Technology Co Ltd
Current assignee: Zhejiang Dahua Technology Co Ltd
Priority date: 2019-07-16
Filing date: 2019-07-16
Publication date: 2022-03-25
Anticipated expiration: 2039-07-16
Also published as: CN110443156A

Abstract

本申请公开了一种轨迹相似度度量方法、数据处理设备及存储设备，该方法包括：获取第一轨迹和第二轨迹；分别对所述第一轨迹和所述第二轨迹的轨迹点进行编码，以获得对应的第一轨迹指纹序列和第二轨迹指纹序列；计算所述第一轨迹指纹序列和所述第二轨迹指纹序列之间的指纹相似度，以得到所述第一轨迹和所述第二轨迹的轨迹相似度。通过上述方式，本申请能够降低轨迹相似度的计算复杂度，提高计算准确性。

Description

轨迹相似度度量方法、数据处理设备及存储设备

技术领域

本申请涉及数据分析技术领域，特别是涉及一种轨迹相似度度量方法、数据处理设备及存储设备。

背景技术

随着移动通讯设备，如GPS、车载导航系统等的快速发展，移动对象的分析和研究越来越受到人们的重视。在分析移动对象行为时，移动对象轨迹因包含大量的信息而具有重要的作用。分析移动对象轨迹最常用的应用之一是寻找具有相似轨迹的移动对象并将它们归类。移动对象轨迹，也称时空轨迹。目前，时空轨迹相似度计算较为流行的度量方法主要有两种：动态时间规整(Dynamic Time Warping，DTW)技术和离散弗雷歇距离(DiscreteFréchet distance，DFD)技术，均是基于对空间轨迹点相对距离的大小来确定轨迹之间的相似度。

但是，这些基于距离的相似度度量方案计算复杂度较高，不利于实时查询。例如，度量两条包含n个轨迹点的时空轨迹相似度，DTW方法的时间复杂度为O(n²)，而DFD方法则需要计算n⁴对子轨迹的离散弗雷歇距离。另一方面，由于基于距离的计算方法考虑的是轨迹点间的相对位置，在比较两条长度相差较大的轨迹相似度时易产生较大误差。

发明内容

本申请主要解决的技术问题是提供一种轨迹相似度度量方法、数据处理设备及存储设备，能够降低轨迹相似度的计算复杂度，提高计算准确性。

为解决上述技术问题，本申请采用的一个技术方案是：提供一种轨迹相似度度量方法，包括：获取第一轨迹和第二轨迹；分别对所述第一轨迹和所述第二轨迹的轨迹点进行编码，以获得对应的第一轨迹指纹序列和第二轨迹指纹序列；计算所述第一轨迹指纹序列和所述第二轨迹指纹序列之间的指纹相似度，以得到所述第一轨迹和所述第二轨迹的轨迹相似度。

为解决上述技术问题，本申请采用的另一个技术方案是：提供一种数据处理设备，包括：相互连接的存储器和处理器；所述存储器用于存储所述处理器执行所需指令和数据；所述处理器用于执行指令以实现如上所述的轨迹相似度度量方法。

为解决上述技术问题，本申请采用的又一个技术方案是：提供一种存储设备，内部存储有指令，所述指令被执行时实现如上所述的轨迹相似度度量方法。

本申请的有益效果是：区别于现有技术的情况，本申请的实施例中，在获取第一轨迹和第二轨迹后，分别对第一轨迹和第二轨迹的轨迹点进行编码，以获得对应的第一轨迹指纹序列和第二轨迹指纹序列，计算第一轨迹指纹序列和第二轨迹指纹序列之间的指纹相似度，即可得到第一轨迹和第二轨迹的轨迹相似度。通过上述方式，本申请将轨迹相似度对比转化为轨迹指纹的对比，由于轨迹指纹包含轨迹点的位置特征信息，通过直接对比轨迹指纹的相似度即可以体现轨迹相似度，不需要计算轨迹点之间的距离，可以减少计算复杂度；而且轨迹指纹保留了轨迹点的绝对位置信息，提高了轨迹相似度计算的准确性，在实际应用中更为准确。

附图说明

图1是本申请一种轨迹相似度度量方法第一实施例的流程示意图；

图2是图1中步骤S12的具体流程示意图；

图3是图2中步骤S122的具体流程示意图；

图4是利用宽度为2的滑动窗口对编码序列进行滑窗操作的过程示意图；

图5是本申请一种轨迹相似度度量方法第二实施例的流程示意图；

图6是图5中步骤S24的具体流程示意图；

图7是利用宽度为3的滑动窗口对哈希序列进行滑窗操作的过程示意图；

图8是本申请一种数据处理设备一实施例的结构示意图；

图9是本申请一种存储设备一实施例的结构示意图。

具体实施方式

下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅是本申请的一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

如图1所示，本申请一种轨迹相似度度量方法第一实施例包括：

S11：获取第一轨迹和第二轨迹。

其中，第一轨迹和第二轨迹可以是同一时间段内获取的两个移动对象的运动轨迹，也可以是同一移动对象在不同时间段内的两条运动轨迹，还可以是不同时间段内两个移动对象的运动轨迹。该第一轨迹和第二轨迹中包含移动对象的位置信息，通常包括按时间排序的多个轨迹点。其中，每个轨迹点可以是以经纬度表示的二维空间轨迹点，也可以是以位置坐标表示的空间轨迹点等。

具体地，利用车载导航系统或者交通监控系统可以获取车辆的运动轨迹，其中车辆的运动轨迹可以包括一系列卡口点的经纬度数据。而针对移动终端设备，则可以利用移动终端自身的GPS定位系统获取移动终端的运动轨迹，或者可以利用与移动终端通信的基站或局域网网关等设备，获取移动终端设备的MAC(Media Access Control，媒体访问控制)地址，然后利用MAC地址定位移动终端的位置，以获取移动终端的运动轨迹。

S12：分别对第一轨迹和第二轨迹的轨迹点进行编码，以获得对应的第一轨迹指纹序列和第二轨迹指纹序列。

其中，轨迹指纹是单个轨迹点或多个轨迹点组成的序列进行映射后，得到的表征轨迹点或轨迹序列特征的编码值。轨迹指纹可以表征轨迹点的绝对位置特征，还可以表征轨迹点之间的相对位置特征。

具体地，对第一轨迹和第二轨迹进行编码时，需要采用相同的编码方法，将轨迹点编码映射成对应的编码值。其中，可以对单个轨迹点进行编码映射成一个编码值，也可以对多个轨迹点进行编码映射成一个编码值。

可选地，在进行编码时，还可以进行多次编码，例如第一次编码时对单个轨迹点依次进行编码，第二次编码时对第一次编码的编码序列的至少两个相邻编码值进行依次编码，从而可以使得编码得到的轨迹指纹同时包含轨迹点的绝对位置信息和相对位置信息，使得轨迹指纹可以准确表征轨迹特征，有利于提高轨迹相似度计算的准确性。

具体如图2所示，步骤S12包括：

S121：分别对第一轨迹和第二轨迹的轨迹点进行Geohash编码，获得第一轨迹对应的第一编码序列以及第二轨迹对应的第二编码序列。

其中，GeoHash是一种地址编码方法，能够把二维的空间经纬度数据编码成一个字符串。Geohash基本原理是将地球理解为一个二维平面，将平面递归分解成更小的子块，每个子块在一定经纬度范围内拥有相同的编码值。编码后的字符串相似的表示距离相近，在大部分情况下，字符串前缀匹配越多的距离越近。

不同的编码长度或编码位数，表示不同的范围区间，字符串越长或者编码位数越高，表示的范围越精确。本实施例中，GeoHash编码位数可根据实际精度要求选择，优选在4～12之间，即可以不过多增加编码及后续相似度计算的复杂度，还可以达到较高精度。

具体地，在一个应用例中，针对一轨迹(例如第一轨迹m1)，该轨迹包括一系列采用经度和纬度二维表示的轨迹点，例如轨迹m1可以表示为{(lat1,lon1),(lat2,lon2),(lat3,lon3),…,(lat20,lon20)}，其中lat1……lat20表示轨迹点1～20的纬度，lon1……lon20表示轨迹点1～20的经度。利用GeoHash编码可以将上述20个轨迹点依次编码形成一个编码序列(例如第一编码序列)，该编码序列中包括编码后的编码值。例如轨迹m1编码后的编码序列可以表示为(g1,g2,g3,…,g20)，其中g1……g20表示每个轨迹点的编码值。

GeoHash编码过程可以轨迹点(lat1,lon1)为例进行说明。该轨迹点中纬度lat1为39.928167，经度lon1为116.390705。首先，对纬度39.928167进行逼近编码，其中地球纬度区间是[-90,90]。区间[-90,90]进行二分为[-90,0),[0,90]，称为左右区间，可以确定39.928167属于右区间[0,90]，给标记为1，接着将区间[0,90]进行二分为[0,45),[45,90]，可以确定39.928167属于左区间[0,45)，给标记为0，递归上述过程39.928167总是属于某个区间[a,b]，随着每次迭代区间[a,b]总在缩小，并越来越逼近39.928167。在迭代过程中，如果给定的纬度x(39.928167)属于左区间，则记录0，如果属于右区间则记录1。编码序列的长度跟给定的区间划分次数有关，如下表1所示：

表1

类似地，地球经度区间为[-180,180]，可以对经度116.389550进行编码。通过上述逼近编码，纬度39.928167编码后的编码值为1 1 0 1 0 0 1 0 1 1 0 0 0 1 0，经度产生的编码为1 0 1 1 1 0 0 0 1 1 0 0 0 1 1。

其次，将上述纬度和经度编码进行合并可以得到新的字符串11100 11101 0010001111 0000 01101。其中，新的字符串中偶数位放经度编码值，奇数位放纬度编码值。

最后，将该合并后得到的新的字符串按照base32进行编码即可以得到对应的编码值wx4g0e。其中，GeoHash编码还可以采用base64等其他方法进行编码。

将第一轨迹和第二轨迹的每个轨迹点均按照上述步骤进行GeoHash编码，即可以得到对应的编码值，编码值按照时间进行排序形成序列即可以得到对应的第一编码序列和第二编码序列。

S122：分别对第一编码序列和第二编码序列进行哈希编码，以得到第一编码序列对应的第一轨迹指纹序列以及第二编码序列对应的第二轨迹指纹序列。

具体地，通过对编码序列中的编码值与相邻一个或多个编码值进行哈希编码处理，可以使得编码后得到的轨迹指纹既包含轨迹点绝对位置信息，也包含轨迹点间的相对位置信息，从而有利于轨迹相似度比较的准确性。其中，哈希编码可以采用移位哈希编码，也可以采用加法或乘法哈希编码等。

可选地，可以采用滑窗操作获取编码值与相邻一个或多个编码值进行哈希编码处理，从而可以控制滑窗的窗口大小来控制轨迹指纹提取的精度。具体如图3所示，步骤S122包括：

S1221：获取滑窗宽度系数k。

其中，滑窗宽度系数k是决定滑动窗口每次提取的数据量的多少。k值越小每次提取的数据量越少，需要滑动的次数越多，最后得到的数据组数越多，因此在提取轨迹指纹时，k值越小获取的用于计算轨迹指纹的数据越多，轨迹指纹提取越准确。本实施例中，为了获取相邻至少一个编码值，k≥2。

S1222：以宽度为k的滑窗，分别对第一编码序列和第二编码序列进行滑窗操作，形成第一编码序列对应的第一子序列组以及第二编码序列对应的第二子序列组。

滑窗操作是以宽度k的滑动窗口，依次向前滑动获取数据，每次向前滑动的距离为一个数据宽度。

具体地，利用宽度为k的滑动窗口对具有n个编码值的编码序列进行滑窗操作，可以得到n-k+1个子序列。例如图4所示，利用宽度k＝2的滑动窗口对编码序列(g1,g2,g3,…,g20)进行滑窗操作时，首先得到子序列(g1,g2)，然后滑动窗口向前滑动一位，得到子序列(g2,g3)，以此类推，滑动窗口依次向前滑动后提取子序列，最终可以得到19个子序列。将子序列根据提取顺序进行排序，即可得到对应的子序列组{(g1,g2)，(g2,g3)，……，(g19,g20)}。第一编码序列和第二编码序列均可以根据上述滑窗操作得到对应的第一子序列组和第二子序列组。

S1223：获取移位哈希函数。

该移动哈希函数是预先定义的对每个子序列中的数据进行计算得到哈希值的函数。其中，该移位哈希函数包括移位叠加操作，可以根据实际需求定义不同形式的函数。

S1224：利用移位哈希函数，分别对第一子序列组和第二子序列组中的每个子序列进行移位哈希操作，得到第一子序列组对应的第一哈希序列以及第二子序列组对应的第二哈希序列。

具体地，在一个应用例中，移位哈希函数采用如下公式：

其中，h_j为每个子序列j的哈希值，g_i为子序列中的每个元素，k为步骤S1221中的滑窗宽度系数，i为子序列中每个元素的索引，⊕为异或操作。

将每个子序列中的元素代入上述公式(1)中，即可计算得到每个子序列对应的哈希值。例如，将第一子序列组{(g1,g2)，(g2,g3)，……，(g19,g20)}中的第一个子序列(g1,g2)的元素g1和g2代入公式(1)中，可以得到第一个子序列(g1,g2)对应的哈希值h1＝[(g1<<16)⊕(g1>>4)⊕1]+[(g2<<16)⊕(g2>>4)⊕2]。每个子序列均根据公式(1)进行计算，则可以得到第一子序列组对应的第一哈希序列(h1,h2,h3,……,h19)。类似地，第二子序列组对应的第二哈希序列也可以根据上述公式(1)计算得到。该第一哈希序列和第二哈希序列即可以作为第一轨迹指纹序列和第二轨迹指纹序列。

通过上述滑窗操作及移位哈希编码处理，获取的轨迹指纹序列中的轨迹指纹包含轨迹点的绝对位置信息和相对位置信息，使得轨迹指纹可以准确表征轨迹特征，避免由于两个编码序列中编码值相同而顺序/方向不同(例如编码序列(g1,g2,g3,…,g20)和编码序列(g20,g19,g18,…,g1))，导致轨迹相似度计算错误，有利于提高轨迹相似度计算的准确性。同时，还可以减少轨迹相似度计算的数据量(例如20个轨迹点只得到19个轨迹指纹)，降低计算复杂度。

S13：计算第一轨迹指纹序列和第二轨迹指纹序列之间的指纹相似度，以得到第一轨迹和第二轨迹的轨迹相似度。

其中，在计算指纹相似度时，可以计算两个轨迹指纹序列之间的杰卡德Jaccard相似度，或者计算两个轨迹指纹序列之间的汉明距离等，作为两个轨迹的轨迹相似度。

具体地，在一个应用例中，获取第一轨迹指纹序列A和第二轨迹指纹序列B之后，则可以利用如下公式(2)计算第一轨迹指纹序列A和第二轨迹指纹序列B之间的杰卡德相似度，以该杰卡德相似度作为A和B之间的轨迹相似度。

其中，当A，B均为空集合时，J(A,B)定义为1。

本实施例中，由于轨迹指纹中包含轨迹点的位置信息，例如绝对位置信息、相对位置信息等，因此通过计算轨迹指纹之间的相似度即可以表征轨迹相似度，例如采用Jaccard相似度，不需要计算轨迹点间的距离，避免了复杂的空间距离计算，使得时间复杂度仅为轨迹指纹相似度的时间复杂度O(n)，低于DTW和DFD方法的计算时间复杂度，有效降低轨迹相似度的时间复杂度，可在秒级别内从千万数据库中检索出相似的轨迹指纹，更好地支持实时计算查询。而且，轨迹指纹保留了轨迹点的绝对位置信息，提高了轨迹相似度计算的准确性，在实际应用中更为准确。进一步地，轨迹指纹的精度还可以根据实际业务需求进行调节，其中GeoHash编码精度和滑窗的窗口宽度大小均可调，从而可以更好地适应不同地区、不同设备来源的时空轨迹数据。

在其他实施例中，为了进一步减少计算复杂度，可以对哈希编码后的哈希序列进行采样操作。

具体如图5所示，本申请一种轨迹相似度度量方法第二实施例包括：

S21：获取第一轨迹和第二轨迹。

S22：分别对第一轨迹和第二轨迹的轨迹点进行Geohash编码，获得第一轨迹对应的第一编码序列以及第二轨迹对应的第二编码序列。

S23：分别对第一编码序列和第二编码序列进行哈希编码，以得到第一编码序列对应的第一哈希序列以及第二编码序列对应的第二哈希序列。

S24：分别对第一哈希序列和第二哈希序列进行采样，以得到第一哈希序列对应的第一轨迹指纹序列以及第二哈希序列对应的第二轨迹指纹序列。

其中，步骤S21～S23的具体执行过程可以参考本申请一种轨迹相似度度量方法第一实施例中的步骤，此处不再重复。

具体地，对第一编码序列和第二编码序列进行哈希编码得到对应的第一哈希序列和第二哈希序列后，可以分别对两个哈希序列进行采样，其中对两个哈希序列进行采样的方法相同。例如，可以先对其中一个哈希序列进行随机采样后，对另一个哈希序列采样对应位置的数据。或者，对两个哈希序列均进行相同间隔采样。

可选地，为了便于控制采样精度，控制采样间隔，保留足够数据，可以先采用滑窗操作获取子序列组后，再对子序列组中的每个子序列进行采样。具体如图6所示，步骤S24包括：

S241：获取采样窗口系数w。

该采样窗口系数w是预先定义的用于采样的滑动窗口的窗口宽度。其中，w≥2，例如3。

S242：以宽度为w的滑窗，分别对第一哈希序列和第二哈希序列进行滑窗操作，形成第一哈希序列对应的第一指纹子序列组以及第二哈希序列对应的第二指纹子序列组。

具体地，利用宽度为w的滑动窗口对具有n-k+1个哈希值的哈希序列进行滑窗操作，可以得到n-k-w+2个子序列。

例如图7所示，利用宽度w＝3的滑动窗口对哈希序列(h1,h2,h3,…,h19)进行滑窗操作时，首先得到子序列(h1,h2,h3)，然后滑动窗口向前滑动一位，得到子序列(h2,h3,h4)，以此类推，滑动窗口依次向前滑动后提取子序列，最终可以得到17个子序列。将子序列根据提取顺序进行排序，即可得到对应的子序列组{(h1,h2,h3)，(h2,h3,h4)，……，(h17,h18,h19)}。第一哈希序列和第二哈希序列均可以根据上述滑窗操作得到对应的第一指纹子序列组和第二指纹子序列组。

S243：依次在第一指纹子序列组和第二指纹子序列组的每个子序列中选择最小值作为每个子序列的轨迹指纹，以得到第一指纹子序列组对应的第一轨迹指纹序列以及第二指纹子序列组对应的第二轨迹指纹序列。

具体地，在上述应用例中，针对指纹子序列组{(h1,h2,h3)，(h2,h3,h4)，……，(h17,h18,h19)}，首先选择第一个子序列(h1,h2,h3)的元素h1、h2和h3中最小的一个哈希值作为第一个子序列的轨迹指纹，由于每个哈希值均为二进制数，只需要对h1、h2和h3进行比较，即可以得到其中的最小值。类似地，针对后续子序列，依次选择每个子序列(h2,h3,h4)，……，和(h17,h18,h19)中的最小值作为对应子序列的轨迹指纹，然后将轨迹指纹依次排序，即可以得到对应的轨迹指纹序列。第一轨迹指纹序列和第二轨迹指纹序列均可以通过上述方式得到。

当然，在其他实施例中，也可以获取每个子序列中的最大值，或者中间值，又或者其他类型的值(例如随机获取的值)作为该子序列的轨迹指纹。

本实施例中，利用滑窗操作以及采样操作，可以进一步减少轨迹指纹的数据量，有利于降低轨迹相似度计算的复杂度。同时，调节滑窗的窗口大小还可以调节采样的精度，且利用滑窗有利于进行比较均匀的采样，保留足够数据量。

如图8所示，本申请一种数据处理设备一实施例中，数据处理设备100包括：相互连接的存储器110和处理器120。

其中，存储器110用于存储处理器120执行所需指令和数据。例如存储第一轨迹和第二轨迹。

处理器120还可以称为CPU(Central Processing Unit，中央处理单元)。处理器120可能是一种集成电路芯片，具有信号的处理能力。处理器120还可以是通用处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现成可编程门阵列(FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。

该处理器120用于执行指令以实现如本申请一种轨迹相似度度量方法第一或第二实施例所提供的方法。

该数据处理设备100还可以包括通信电路(图未示)、显示器(图未示)等其他部件。

本实施例中，数据处理设备将轨迹相似度对比转化为轨迹指纹的对比，由于轨迹指纹包含轨迹点的位置特征信息，通过直接对比轨迹指纹的相似度即可以体现轨迹相似度，不需要计算轨迹点之间的距离，可以减少计算复杂度；而且轨迹指纹保留了轨迹点的绝对位置信息，提高了轨迹相似度计算的准确性，在实际应用中更为准确。

如图9所示，本申请一种存储设备一实施例中，存储设备90内部存储有指令901，该指令901用于执行以实现如本申请一种轨迹相似度度量方法第一或第二实施例所提供的方法。

该存储设备90为U盘、移动硬盘、只读存储器(ROM，Read-Only Memory)、随机存取存储器(RAM，Random Access Memory)、磁碟或者光盘等可以存储程序指令的介质，或者也可以为存储有该程序指令的服务器，该服务器可将存储的程序指令发送给其他设备运行，或者也可以自运行该存储的程序指令。

在一实施例中，存储设备90可以是如图8所示的存储器110。

在本申请所提供的几个实施例中，应该理解到，所揭露的方法和装置，可以通过其它的方式实现。例如，以上所描述的装置实施方式仅仅是示意性的，例如，模块或单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，装置或单元的间接耦合或通信连接，可以是电性，机械或其它的形式。

作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施方式方案的目的。

另外，在本申请各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。

集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)或处理器(processor)执行本申请各个实施方式方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(ROM，Read-Only Memory)、随机存取存储器(RAM，Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述仅为本申请的实施方式，并非因此限制本申请的专利范围，凡是利用本申请说明书及附图内容所作的等效结构或等效流程变换，或直接或间接运用在其他相关的技术领域，均同理包括在本申请的专利保护范围内。

Claims

1.一种轨迹相似度度量方法，其特征在于，包括：

获取第一轨迹和第二轨迹；

分别对所述第一轨迹和所述第二轨迹的轨迹点进行Geohash编码，获得所述第一轨迹对应的第一编码序列以及所述第二轨迹对应的第二编码序列；

分别对所述第一编码序列和所述第二编码序列进行哈希编码，以得到所述第一编码序列对应的所述第一轨迹指纹序列以及所述第二编码序列对应的所述第二轨迹指纹序列；

其中，所述分别对所述第一编码序列和所述第二编码序列进行哈希编码包括：

获取滑窗宽度系数k，其中，k≥2，所述Geohash编码的编码位数在4～12之间；

以宽度为k的滑窗，分别对所述第一编码序列和所述第二编码序列进行滑窗操作，形成所述第一编码序列对应的第一子序列组以及所述第二编码序列对应的第二子序列组，其中所述第一编码序列和所述第二编码序列均分别包括n个编码值，所述第一子序列组以及所述第二子序列组均分别包括n-k+1个子序列；

获取移位哈希函数；

利用所述移位哈希函数，分别对所述第一子序列组和所述第二子序列组中的每个子序列进行移位哈希操作，得到所述第一子序列组对应的第一哈希序列以及所述第二子序列组对应的第二哈希序列；

计算所述第一轨迹指纹序列和所述第二轨迹指纹序列之间的杰卡德相似度，以所述杰卡德相似度作为所述轨迹相似度。

2.根据权利要求1所述的方法，其特征在于，所述移位哈希函数如下：

其中，h_j为子序列j的哈希值，g_i为所述子序列中第i个元素，k为所述滑窗宽度系数，i为所述元素的索引，从1开始，

为异或操作。

3.根据权利要求1所述的方法，其特征在于，所述利用所述移位哈希函数，分别对所述第一子序列组和所述第二子序列组中的每个子序列进行移位哈希操作，得到所述第一子序列组对应的第一哈希序列以及所述第二子序列组对应的第二哈希序列之后，还包括：

分别对所述第一哈希序列和所述第二哈希序列进行采样，以得到所述第一哈希序列对应的所述第一轨迹指纹序列以及所述第二哈希序列对应的所述第二轨迹指纹序列。

4.根据权利要求3所述的方法，其特征在于，所述分别对所述第一哈希序列和所述第二哈希序列进行采样，以得到所述第一哈希序列对应的所述第一轨迹指纹序列以及所述第二哈希序列对应的所述第二轨迹指纹序列包括：

获取采样窗口系数w；

以宽度为w的滑窗，分别对所述第一哈希序列和所述第二哈希序列进行滑窗操作，形成所述第一哈希序列对应的第一指纹子序列组以及所述第二哈希序列对应的第二指纹子序列组，所述第一指纹子序列组和所述第二指纹子序列组均包括n-k-w+2个子序列；

依次在所述第一指纹子序列组和所述第二指纹子序列组的每个子序列中选择最小值作为每个子序列的轨迹指纹，以得到所述第一指纹子序列组对应的所述第一轨迹指纹序列以及所述第二指纹子序列组对应的所述第二轨迹指纹序列。

5.根据权利要求1所述的方法，其特征在于，所述计算所述第一轨迹指纹序列和所述第二轨迹指纹序列之间的杰卡德相似度，以所述杰卡德相似度作为所述轨迹相似度包括：

利用如下公式计算所述第一轨迹指纹序列和所述第二轨迹指纹序列之间的杰卡德相似度：

其中，A为所述第一轨迹指纹序列，B为所述第二轨迹指纹序列，J(A,B)为A和B之间的杰卡德相似度。

6.根据权利要求1-5任一项所述的方法，其特征在于，所述轨迹点为以纬度和经度表示的二维空间轨迹点，所述第一轨迹和所述第二轨迹均包括按时间排序的多个所述轨迹点。

7.一种数据处理设备，其特征在于，包括：相互连接的存储器和处理器；

所述存储器用于存储所述处理器执行所需指令和数据；

所述处理器用于执行指令以实现如权利要求1-6任一项所述的轨迹相似度度量方法。

8.一种存储设备，内部存储有指令，其特征在于，所述指令被执行时实现如权利要求1-6任一项所述的轨迹相似度度量方法。