CN114201695A

CN114201695A - 一种基于热点网格维度转换的移动轨迹隐私保护匹配方法

Info

Publication number: CN114201695A
Application number: CN202111550522.5A
Authority: CN
Inventors: 张海涛; 刘晋源; 宋锐
Original assignee: Nanjing University of Posts and Telecommunications
Current assignee: Nanjing University of Posts and Telecommunications
Priority date: 2021-12-17
Filing date: 2021-12-17
Publication date: 2022-03-18
Anticipated expiration: 2041-12-17
Also published as: CN114201695B

Abstract

一种基于热点网格维度转换的移动轨迹隐私保护匹配方法，包括如：基于移动轨迹空间范围的空间编码、基于轨迹点计数统计的热点网格发现、基于热点网格的多维度空间构建和权重计算、移动轨迹数据的嵌入编码、基于嵌入编码的轨迹匹配计算、基于匹配结果的移动轨迹数据交换。本方法移动轨迹基于编码网格进行映射，可以快速筛选出轨迹点频繁分布的热点网格，保证了空间匹配计算的高效性；保证了空间匹配计算的准确性，使转换后的数据仍保持了原有数据的空间拓扑邻近性；原始空间到嵌入空间的映射转换不可逆，保证了空间匹配计算的安全性。

Description

一种基于热点网格维度转换的移动轨迹隐私保护匹配方法

技术领域

本发明涉及时空数据隐私保护技术研究领域，具体是涉及一种基于热点网格维度转换的移动轨迹隐私保护匹配方法。

背景技术

随着移动计算、无线通信、地理信息系统等技术的发展与相互融合，基于位置的服务成为多学科领域研究的热点。位置服务的各种移动通讯设备产生了大量具有时空特性的移动轨迹数据。利用大数据技术对大量的移动轨迹数据进行分析，可以发现一系列的个体行为习惯和群体行为模式，从而可为城市交通、规划等众多行业应用提供一定的辅助决策。但是，目前对于移动轨迹数据的分析应用存在一个共性问题：数据的有偏性。也即，单一的数据来源很难实现对区域内用户完整活动的描述。因此，对多源异构的移动轨迹数据进行有效集成，成为移动轨迹数据挖掘分析的关键技术。

但是，近年来随着人们对于位置隐私保护的关注，国内外先后出台了一系列针对个人位置隐私保护的系列法律法规。例如，2016年欧盟新通过的数据保护法案《通用数据保护指令》，以及2021年8月20日我国新颁布的《中华人民共和国个人信息保护法》等。因此，大批量的移动轨迹数据的集成分析，必须首先处理好个人隐私问题。由于传统的直接基于去标识和假名替换的方法，会存在基于轨迹数据地理场景分析的重标识攻击问题。基于隐私保护的匹配技术成为目前的一个主流实现方法。数据交换双方可以通过隐私保护的匹配计算，只交换各自已匹配的数据，从而避免因关联分析带来的重标识攻击问题。传统的移动轨迹匹配方法主要包括直接筛选法和基于移动轨迹相似度的加权匹配法。这些方法虽然具有匹配精度高的优点，但是在匹配过程中同样会产生隐私泄露的问题。即在进行匹配时，需要以明文的形式将移动轨迹数据提供给第三方。因此，不可靠的第三方势必引发用户位置隐私泄露的问题。

发明内容

针对上述背景技术中存在的问题，本发明提供一种不依赖第三方的基于热点网格维度转换的移动轨迹隐私保护匹配方法。

一种基于热点网格维度转换的移动轨迹隐私保护匹配方法，包括如下步骤：

步骤1，基于移动轨迹空间范围的空间编码；基于数据交换双方的移动轨迹数据集的二维空间范围，进行等间隔空间网格划分与网格编码，并且进行时间分段离散；

步骤2，基于轨迹点计数统计的热点网格发现；对数据双方落在每个网格中的轨迹点数进行统计，选择轨迹点数最多的网格作为热点网格；

步骤3，基于热点网格的多维度空间构建和权重计算；根据热点网格的轨迹点计数计算各自权重，并将所有热点网格的编码、中心坐标、权重等以热点网格集合的形式表示；

步骤4，移动轨迹数据的嵌入编码；基于热点网格集合，将所有移动轨迹数据嵌入多维度空间中，以嵌入值和时间序列的形式表示；

步骤5，基于嵌入编码的轨迹匹配计算；数据双方交换嵌入后的移动轨迹数据，并基于时间序列和对应嵌入值的差值得到匹配的移动轨迹和子轨迹的集合；

步骤6，基于匹配结果的移动轨迹数据交换；数据双方将匹配成功的移动轨迹和子轨迹集合发送给对方，完成隐私保护匹配的轨迹数据交换。

进一步地，步骤1中，空间网格划分为，给定二维平面空间范围：

SE²＝{x_min，x_max，y_min，y_max}

其中，SE²的左上、右上、左下，右下四个边角点的坐标分别为，l₁＝(x_min，y_max)，l₂＝(x_max，y_max)，l₃＝(x_min，y_min)，l₄＝(x_max，y_min)；对SE²采用等间隔的空间划分，得到系列空间网格组成的空间网格集合DR2＝{M_1×1，M_1×2，...，M_m×n}，其中，

Δx表示网格在横轴方向的长，Δy表示网格在竖轴方向的长，m表示网格的行号，n表示网格的列号。

进一步地，步骤1中，时间分段离散为，给定时间范围TE＝{st，et}，其中，st，et分别表示开始时间和结束时间，对TE采用等间隔时间分段离散，得到系列时间段集合DT＝{T₁，T₂，...，T_k}，其中，

Δt表示时间间隔，k表示时间段的编号。

进一步地，步骤2中，数据交换双方将其移动轨迹数据转化为基于空间网格划分与时间段集合，即时空离散空间表达，并通过对计算落在各网格的轨迹点数量，即空间网格的轨迹点计数统计，从而发现热点网格。

进一步地，移动轨迹的时空离散空间表达为，给定一条移动轨迹T_ID＝{[p₁，t₁]，[p₂，t₂]，...，[p_n，t_n]}，t₁＜t₂＜，...＜t_n，其中，ID表示移动轨迹的编号，[p_i，t_i]，1≤i≤n表示一个移动轨迹点，p_i＝(x，y)表示用户在t_i时刻所处的空间位置，x，y表示空间位置的横、纵坐标值，则T_ID在空间网格划分集合DR²以及时间分段离散集合DT中的时空离散表达为：STT_ID＝[M₁，p₁，T₁]，[M₂，p₂，T₂]，...，[M_m，P_m，T_k]，对于其中的任一元素[M_j，p_j，T_s]，1≤j≤m，1≤s≤k，都满足条件：p_i∈M_j，且t_i∈T_s，1≤i≤n。

进一步地，热点网格为，给定空间网格计数矩阵，其行数和列数与空间网格集合DR²相同，且其每个元素cdr_i×j只与一个空间网格M_i×j对应，记作CountDR；其中，cdr_i×j用Count(STTs，M_i×j)表示，即移动轨迹STTs的轨迹点落在网格M_i×j中的数量；给定一个阈值θ，对矩阵CountDR的所有元素进行排序，选择其数值最大的θ个值；其中，若可选元素大于θ，则先选定较大者，较小者进行随机选择；选定的θ个网格称为热点网格，记为HM。

进一步地，步骤3中，将热点网格以热点网格集合的形式表示，并根据步骤2求得空间网格统计矩阵中的对应元素值计算热点网格权重；

热点网格权重为，给定空间网格划分集合DR²＝{M₁，M₂，...，M_n}、时空离散表达移动轨迹集合STTs＝{STT₁，STT₂，...，STT_n}以及空间网格计数矩阵CountDR，如果DR²中的热点网格集合为HMs＝{HM₁，HM₂，...，HM_k}，1≤k≤n，则对于HMs中任一元素HM_i，1≤i≤k，其权重为：

进一步地，步骤4中，数据双方各自计算其移动轨迹点在热点网格构成的多维度空间中的嵌入值，并将移动轨迹数据以嵌入形式进行表达；

移动轨迹的热点网格嵌入为，给定时空离散表达移动轨迹集合STTs＝{STT₁，STT₂，...，STT_n}，及其支持的热点网格集合HMs＝{HM₁，HM₂，...，HM_m}，对于STTs中的一条移动轨迹STT_i，其包含的轨迹点[M，p，T]，在热点网格集合HMs元素构成m维空间中的嵌入值为：

其中，Distance(HM_i，p)是轨迹点所处位置与热点网格HM_i的欧式距离；

对于STT_i＝[M₁，p₁，T₁]，[M₂，p₂，T₂]，...，[M_m，P_m，T_k]，其基于嵌入值的表达为：Emb_STT_i＝{Emb(HMs，[M₁，p₁，T₁])，Emb(HMs，[M₂，p₂，T₂])，…，{Emb(HMs，[M_m，p_m，T_k])}。

进一步地，步骤5中，数据双方交换其嵌入表达的移动轨迹数据，协定轨迹点嵌入值的差值阈值σ，移动轨迹的匹配度阈值τ，并进行匹配计算；

移动轨迹嵌入值的匹配计算为，给定两条基于嵌入值表达的移动轨迹：

Emb_STT_A＝{Emb₁，Emb₂，...，Emb_n}

Emb_STT_B＝{Emb₁，Emb₂，...，Emb_m}

其中，对于时间序列相同的元素Emb_STT_A.Emb_i和Emb_STT_B.Emb_j，如果满足

则定义Emb_STT_A与Emb_STT_B时间序列相同轨迹点的数量为时间匹配值，记作T_count；

对于Emb_STT_A、Emb_STT_B中的时间序列相同的元素Emb_STT_A·Emb_i、Emb_STT_B·Emb_j，1≤i≤m，1≤j≤n，如果其差值|Emb_STT_A·Emb_i-Emb_STT_B·Emb_j|不超过自定义阈值σ，也即|Emb_STT_A·Emb_i-Emb_STT_B·Emb_j|≤σ，则称嵌入值Emb_STT_A·Emb_i与嵌入值Emb_STT_B·Emb_j匹配；

在所有匹配成功的嵌入值中，统计其中时间段相邻的嵌入值对，将Emb_STT_A与Emb_STT_B匹配轨迹点对的时间段数量定义为：

Match_Count(Emb_STT_A，Emb_STT_B)

将Emb_STT_A与Emb_STT_B的匹配度定义为：

如果匹配度值不小于自定义阈值τ，即：

Match_Degree(Emb_STT_A-Emb_STT_B)≥τ

则称Emb_STT_A与Emb_STT_B匹配。

本发明的有益效果是：

(1)高效性：移动轨迹基于编码网格进行映射，保证了空间匹配计算的高效性。将移动轨迹数据进行的空间网格划分和时间分段离散，可以快速筛选出轨迹点频繁分布的热点网格，进一步，以热点网格为基准，将移动轨迹嵌入一个独特的空间，并以次转换简化后的数据进行匹配计算，保证了空间匹配计算的高效性。

(2)准确性：嵌入空间基于空间拓扑邻近性的保持特性，保证了空间匹配计算的准确性。移动轨迹数据嵌入计算过程中，使用轨迹点与热点网格空间的欧氏距离，使转换后的数据仍保持了原有数据的空间拓扑邻近性，保证了空间匹配计算的准确性。

(3)安全性：原始空间到嵌入空间的映射转换不可逆，保证了空间匹配计算的安全性。双方的轨迹匹配在经转换后的嵌入空间中进行，双方无法均不能进行原始数据的反推计算，充分保证了双方数据的隐私机密性以及空间匹配计算的安全性。

附图说明

图1为本发明实施例中的移动轨迹隐私保护匹配方法流程图。

图2为本发明实施例中的A方空间范围及移动轨迹分布图。

图3为本发明实施例中的B方空间范围及移动轨迹分布图。

图4为本发明实施例中的A、B双方基于交换的空间范围得到的编码空间网格。

图5为本发明实施例中的A方移动轨迹空间网格中分布。

图6为本发明实施例中的B方移动轨迹空间网格中分布。

图7为本发明实施例中的A、B双方成功匹配的移动轨迹数据分布图。

具体实施方式

下面结合说明书附图对本发明的技术方案做进一步的详细说明。

首先，给出几个基本定义：

定义1，空间网格划分：给定二维平面空间范围SE²＝{x_min，x_max，y_min，y_max}，其中，SE²的左上、右上、左下，右下四个边角点的坐标分别为，l₁＝(x_min，y_max)，l₂＝(x_max，y_max)，l₃＝(x_min，y_min)，l₄＝(x_max，y_min)。对SE²采用等间隔的空间划分，得到系列空间网格组成的空间网格集合DR²＝{M_1×1，M_1×2，...，M_m×n}，其中，

定义2，时间分段离散：给定时间范围TE＝{st，et}，其中，st，et分别表示开始时间和结束时间，对TE采用等间隔时间分段离散，得到系列时间段集合DT＝{T₁，T₂，...，T_k}，其中，

Δt表示时间间隔，k表示时间段的编号。

定义3，移动轨迹的时空离散表达。

：给定一条移动轨迹T_ID＝{[p₁，t₁]，[p₂，t₂]，...，[p_n，t_n]}，t₁＜t₂＜…＜t_n，其中，ID表示移动轨迹的编号，[p_i，t_i]，1≤i≤n表示一个移动轨迹点，p_i＝(x，y)表示用户在t_i时刻所处的空间位置，x，y表示空间位置的横、纵坐标值，则T_ID在空间网格划分集合DR²以及时间分段离散集合DT中的时空离散表达为：

STT_ID＝[M₁，p₁，T1]，[M₂，p₂，T₂]，...，[M_m，P_m，T_k]，对于其中的任一元素[M_j，p_j，T_s]，1≤j≤m，1≤s≤k，都满足条件：p_i∈M_j，且t_i∈T_s，1≤i≤n。

定义4，热点网格：给定空间网格计数矩阵，其行数和列数与空间网格集合DR²相同，且其每个元素cdr_i×j只与一个空间网格M_i×j对应，记作CountDR。其中，cdr_i×j可以用Count(STTs，M_i×j)表示，即移动轨迹STTs的轨迹点落在网格M_i×j中的数量。

给定一个阈值θ，对矩阵CountDR的所有元素进行排序，选择其数值最大的θ个值。其中，若可选元素大于θ，则先选定较大者，较小者进行随机选择。选定的θ个网格称为热点网格，记为HM。

定义5，热点网格权重：给定空间网格划分集合DR²＝{M₁，M₂，...，M_n}、时空离散表达移动轨迹集合STTs＝{STT₁，STT₂，...，STT_n}以及空间网格计数矩阵CountDR，如果DR²中的热点网格集合为HMs＝{HM₁，HM₂，...，HM_k}，1≤k≤n，则对于HMs中任一元素HM_i，1≤i≤k，其权重为：

定义6，移动轨迹的热点网格嵌入：给定时空离散表达移动轨迹集合STTs＝{STT₁，STT₂，...，STT_n}，及其支持的热点网格集合HMs＝{HM₁，HM₂，...，HM_m}，对于STTs中的一条移动轨迹STT_i，其包含的轨迹点[M，p，T]，在热点网格集合HMs元素构成m维空间中的嵌入值为：

其中，Distance(HM_i，p)是轨迹点所处位置与热点网格HM_i的欧式距离。

定义7，移动轨迹嵌入值的匹配：给定两条基于嵌入值表达的移动轨迹Emb_STT_A＝{Emb₁，Emb₂，...，Emb_n}、Emb_STT_B＝{Emb₁，Emb₂，...，Emb_m}，其中，对于时间序列相同的元素Emb_STT_A.Emb_i和Emb_STT_B.Emb_j，如果满足

则定义Emb_STT_A与Emb_STT_B时间序列相同轨迹点的数量为时间匹配值，记作T_count。

对于Emb_STT_A、Emb_STT_B中的时间序列相同的元素Emb_STT_A·Emb_i、Emb_STT_B·Emb_j，1≤i≤m，1≤j≤n，如果其差值|Emb_STT_A·Emb_i-Emb_STT_B·Emb_j|不超过自定义阈值σ，也即：|Emb_STT_A·Emb_i-Emb_STT_B·Emb_j|≤σ，则称嵌入值Emb_STT_A·Emb_i与嵌入值Emb_STT_B·Emb_j匹配。

Match_Count(Emb_STT_A，Emb_STT_B)

进一步，将Emb_STT_A与Emb_STT_B的匹配度定义为：

如果匹配度值不小于自定义阈值τ，也即Match_Degree(Emb_STT_A-Emb_STT_B)≥τ，则称Emb_STT_A与Emb_STT_B匹配。

操作步骤：

步骤1，基于移动轨迹空间范围的空间编码。

数据双方交换其移动轨迹数据的时空分布，协定时空离散的参数，并依据定义1、2各自进行空间网格划分与时间分段离散。

本实施例中，A、B双方由各自移动轨迹的空间分布确定其移动轨迹集合所在的最小二维时空范围。

S11、A方计算其移动轨迹数据的最小时空范围。

A方移动轨迹有5条，分别为T_a1，T_a2，T_a3，T_a4，T_a5，其具体时空分布如下：

由上式时空分布可知，A方移动轨迹集合所处最小时空范围为SE1²＝{-10.14，11.82，-11.37，14.74，}，其轨迹分布及空间范围如图2所示，其时间范围为TE1＝{1，5}。

S12、B方计算其移动轨迹数据的最小时空范围。

B方移动轨迹有5条，分别为T_b1，T_b2，T_b3，T_b4，T_b5，其具体时空分布如下：

T_b3＝{[(6.18，2.56)，1]，[(2，6)，2]，[(4，8)，3]，[(6，11)，4]，[(8，14)，5]}

由上式移动轨迹时空分布可知，B方移动轨迹最小时空范围为SE2²＝{-5.17，11，-11.37，14}，其移动轨迹分布及空间范围如图3所示，其时间范围为TE2＝{1，5}。

S13、空间网格划分及时间段离散。

双方交换各自时空范围SE2²和时间范围TE2，协定数据交换双方的移动轨迹二维空间范围为SE²＝{-15，15，-15，15}，时间范围TE＝[1，5]，并协定空间网格划分参数为，将空间范围划分成6行6列，36个网格；时间段离散参数为，将时间范围等间隔划分成5个时间段。

接着，进行空间网格划分，可以得到一个空间网格集合DR²＝{M_1×1，M_1×2，...，M_6×6}，其包含6行6列共36个网格，其中，M_1×1＝M_1×2＝，...，M_6×6＝(5，5)。A、B双方基于交换的空间范围得到的编码空间网格如图4所示。

进一步，对时间范围TE进行时间分段离散，得到时间段集合DT＝{T₁，T₂，…，T₅}，其中，T₁＝(0，1]，T₂＝(1，2]，T₃＝(2，3]，T₄＝(3，4]，T₅＝(4，5]。数据交换上方接下来将基于如上空间网格及时间段集合进行计算。

步骤2，基于轨迹点计数统计的热点网格发现。

数据交换双方依据定义3、4，将其移动轨迹数据转化为基于空间网格划分与时间段集合，即时空离散空间表达，并通过对计算落在各网格的轨迹点数量，即空间网格的轨迹点计数统计，从而发现热点网格。

在本实施例中，数据交换双方首先基于步骤1协定的空间网格及时间段集合，分别将各自的移动轨迹数据转化为时空离散空间下表达。

S21、移动轨迹时空离散表达。

对A方数据进行转化，将其5条移动轨迹放于网格如图5所示。

对于第一条移动轨迹T_a1，首先转化时间T₁的轨迹点[(-10.14，14.74)，1]，其所处网格为M_1×1；时间T₂的轨迹点[(-4.17，13.41)，2]所处网格为M_1×3；时间T₃的轨迹点[(-3.43，9.36)，3]所处网格为M_2×3；时间T₄的轨迹点[(-4.35，3.26)，4]所处网格为M_3×3；时间T₅的轨迹点[(-2.41，2.07)，5]所处网格为M_3×3。综上，移动轨迹T_a1转化后的表示为：

STT_a1＝

{[M_1×1，(-10.14，14.74)，T₁]，[M_1×3，(-4.17，13.41)，T₂]，[M_2×3，(-3.43，9.36)，T₃]，[M_3×3，(-4.17，13.41)，T₄]，[M_3×3，(-2.41，2.07)，T₅]}

进一步，对A方其余4条移动轨迹T_a2，T_a3，T_a4，T_a5进行时空离散转换，结果如下，结果如下：

STT_a2＝{[M_3×3，(-0.09，1.04)，T₁]，[M_3×3，(-0.53，1.22)，T₂]，[M_4×3，(

-2.48，-1.39)，T₃]，[M_4×2，(-5.17，

-1.48)，T₄]，[M_5×2，(-6.37，-5.73)，T₅]}

STT_a3＝{[M_3×5，(6.18，2.56)，T₁]，[M_3×4，(3.08，2.76)，T₂]，

[M_2×4，(1.44，5.15)，T₃]，[M_3×4，(1.97，1.63)，T₄]，[M_3×4，(2.25，0.05)，T₅]}

STT_a4＝{[M_4×3，(-4.84，-4.52)，T₁]，[M_4×3，(-2.24，

-3.15)，T₂]，[M_4×4，(2.3，-3.09)，T₃]，[M_4×4，(3.23，

-3.27)，T₄]，[M_4×4，(1.18，-0.23)，T₅]}

STT_a5＝{[M_6×4，(1.65，-11.37)，T₁]，[M_5×4，(3.06，

-5.38)，T₂]，[M_5×5，(6.69，-7.48)，T₃]，[M_4×5，(8.24，

-0.21)，T₄]，[M_5×6，(11.82，-8.16)，T₅]}

同理，对B方的5条移动轨迹Tb₁，Tb₂，Tb₃，Tb₄，Tb₅进行时空离散转换，其5条移动轨迹在网格中的位置分布如图6所示，转换结果如下：

STT_b1

＝{[M_1×4，(2.14，11.74)，T₁]，[M_1×3，(-2.5，11)，T₂]，[M_2×3，(-3.43，7.36)，T₃]，[M_3×3，(-4.35，3.26)，T₄]，[M_3×3，(-2.41，2.07)，T₅]}

STT_b2

＝[M_3×3，(-0.09，1.04)，T₁]，[M_3×3，(-2.53，0.2)，T₂]，[M_4×3，(-3.9，

-0.1)，T₃]，[M_4×2，(-5.17，-1.48)，T₄]，[M_3×3，(-4.5，1)，T₅]}STT_b3

＝[M_3×5，(6.18，2.56)，T₁]，[M_2×4，(2，6)，T₂]，[M_2×4，(4，8)，T₃]，[M_1×5，(6，11)，T₄]，[M_1×5，(8，14)，T₅]}

STT_b4＝[M_4×3，(-4.84，-4.52)，T₁]，[M_4×3，(-3，3)，T₂]，[M_4×3，(-1.5，

-1)，T₃]，[M_4×4，(-0.2，1)，T₄]，[M_3×3，(1.18，-0.23)，T₅]}

STT_b5＝[M_6×4，(1.65，-11.37)，T₁]，[M_5×4，(3.06，

-5.38)，T₂]，[M_5×5，(6.69，-7.48)，T₃]，[M_4×5，(8.24，

-0.21)，T₄]，[M_3×6，(11，1)，T₅]}

S22、计数矩阵计算。

首先，为A方定义一个空间网格计数矩阵CountDR_A，并令其初始化为6行6列的0矩阵，其值为：

进一步，对A方时空离散表达的5条移动轨迹依次进行遍历。

对于ID为a1的轨迹STT_a1的时间T₁轨迹点[M_1×1，(-10.14，14.74)，T₁]，其所处网格为M_1×1，令元素cdra_1×1数值加1，则计数矩阵C_ountDR_A的值更新为

对于时间T₂轨迹点[M_1×3，(-4.17，13.41)，T₂]，其所处网格为M_1×3，令元素cdra_1×3数值加1，则计数矩阵CountDR_A的值更新为

重复以上步骤，直到轨迹STT_a1的轨迹点遍历结束，此时计数矩阵CountDR_A的值更新为

同理，继续对其余4条轨迹STT_a1，STT_a1，STT_a1，STT_a1进行遍历，得到A方轨迹点计数矩阵CountDR_A的值最终为

S23、同理，求得B方空间网格计数矩阵CountDR_B的值为

最后，双方交换计数矩阵，进行相加，得到共享计数矩阵CountDR，记作：

S24、热点网格发现。

双方协定热点值θ＝5，并对CountDR的非零元素进行排序，即

cdr_3×3＝10＞cdr_4×3＝7＞cdr_4×4＝4＞cdr_2×4＝cdr_3×4＝3＞

cdr_1×3＝cdr_1×5＝cdr_2×3＝cdr_3×5＝cdr_4×2＝cdr_4×5＝cdr_5×4＝

cdr_5×5＝cdr_6×4＝2＞cdr_1×1＝cdr_1×4＝cdr_3×6＝cdr_5×2＝

cdr_5×6＝1。

选择5个最大值，即cdr_3×3＝10，cdr_4×3＝7，cdr_4×4＝4，cdr_2×4，cdr_3×4＝3，故可以确定5个热点网格，记作HM₁＝M_3×3，HM₂＝M_4×3，HM₃＝M_4×4，HM₄＝M_2×4，HM₅＝M_3×4。

步骤3，基于热点网格的多维度空间构建和权重计算。

数据双方依据定义5，将热点网格以热点网格集合的形式表示，并根据步骤2求得空间网格统计矩阵中的对应元素值计算热点网格权重。

在本实施例中，首先将热点网格以热点网格集合的形式表达。

S31、热点网格以集合表示。

以网格的中心点坐标作为该网格的空间位置，记作place.HM。则热点网格集合为HMs＝{HM₁，HM₂，HM₃，HM₄，HM₅}。其中，

HM₁＝M_3×3，Count(STTs，HM₁)＝cdra_3×3＝10，place.HM₁＝(-2.5，2.5)；

HM₂＝M_4×3，Count(STTs，HM₂)＝cdra_3×3＝7，place.HM₂＝(-2.5，-2.5)；

HM₃＝M_4×4，Count(STTs，HM₃)＝cdra_3×3＝4，place.HM₃＝(2.5，-2.5)；

HM₄＝M_2×4，Count(STTs，HM₄)＝cdra_3×3＝3，place.HM₄＝(2.5，7.5)；

HM₅＝M_3×4，Count(STTs，HM₅)＝cdra_3×3＝3，place.HM₅＝(2.5，2.5)。

S32、计算热点网格权重。

对于热点网格HM₁，Count(STTs，HM₁)＝cdra_3×3＝10，

也即热点网格HM₁的权重为

同理，可以得到其他热点网格的权重分别为，

步骤4，移动轨迹数据的嵌入编码。

数据双方依据定义6，各自计算其移动轨迹点在热点网格构成的多维度空间中的嵌入值，并将移动轨迹数据以嵌入形式进行表达。

在本实施例中，依次将A、B双方的10条移动轨迹，基于热点网格集合HM₁与其对应的热点网格权重Weigh(HM_i)嵌入至热点网格空间中。

S41、首条轨迹嵌入值计算及表达。

首先对A方ID为a1的轨迹STT_a1进行嵌入计算。对于时间T₁轨迹点[M_1×1，(-10.14，14.74)，T₁]，m＝5，T＝T₁，M＝M_1×1，p＝(-10.14，14.74)，则对其嵌入表达Emb(HMs，[M，p，T])的计算过程如下：

其中，

则有轨迹点[M_1×1，(-10.14，14.74)，T₁]的对应嵌入值为Emb(HMs，[M_1×1，(-10.14，14.74)，T₁])＝[16.99，T₁]。

同理，可以得到：

Emb(HMs，[M_1×3，(-4.17，13.41)，T₂])＝[13.22，T₂]

Emb(HMs，[M_2×3，(-3.43，9.36)，T₃])＝[7.63，T₃]

Emb(HMs，[M_3×3，(-4.17，13.41)，T₄])＝[5.30，T₄]

Emb(HMs，[M_3×3，(-2.41，2.07)，T₅])＝[3.70，T₅]

综上，可以得到时空离散表达移动轨迹STT₁的嵌入表达为Emb_STT_a1＝{[16.99，T₁]，[13.22，T₂]，[7.63，T₃]，[5.30，T₄]，[3.70，T₅]}。

S42、A方轨迹嵌入。

同理，可以得到A方另4条移动轨迹的嵌入表达如下：

Emb_STT_a2＝{[3.91，T₁]，[3.81，T₂]，[4.31，T₃]，[5.93，T₄]，[9.17，T₅]}

Emb_STT_a3＝{[8.39，T₁]，[5.45，T₂]，[5.75，T₃]，[4.65，T₄]，[4.85，T₅]}

Emb_STT_a4＝{[7.35，T₁]，[5.09，T₂]，[5.86，T₃]，[6.50，T₄]，[4.41，T₅]}

Emb__STT_a5

＝{[12.85，T₁]，[7.92，T₂]，[11.62，T₃]，[9.64，T₄]，[15.81，T₅]}

S43、B方轨迹嵌入。

同理，可以求得B方移动轨迹的嵌入表达如下：

Emb_STT_b1＝{[11.34，T₁]，[10.57，T₂]，[7.63，T₃]，[5.30，T₄]，[3.70，T₅]}

Emb_STT_b2＝{[3.91，T₁]，[3.99，T₂]，[4.69，T₃]，[5.93，T₄]，[4.99，T₅]}Emb_STT_b3＝{[8.39，T₁]，[6.45，T₂]，[8.75，T₃]，[12.24，T₄]，[15.79，T₅]}

Emb_STT_b4＝{[7.35，T₁]，[5.22，T₂]，[4.07，T₃]，[3.88，T₄]，[4.41，T₅]}

Emb__STT_b5

＝{[12.85，T₁]，[7.92，T₂]，[11.62，T₃]，[9.64，T₄]，[12.16，T₅]}

步骤5，基于嵌入编码的轨迹匹配计算。

数据双方交换其嵌入表达的移动轨迹数据，协定轨迹点嵌入值的差值阈值σ，移动轨迹的匹配度阈值τ，并依据定义7进行匹配计算。

在本实施例中，基于A方数据依次进行匹配计算，即依次对A方嵌入表达的5条移动轨迹进行匹配计算。其中，每次匹配需要与B方嵌入表达的5条移动轨迹进行一一匹配，直至出现达到匹配条件的对象。同时，要求B方匹配成功的移动轨迹不再参加后续的匹配计算。

S51、首先双方协定轨迹点嵌入值的差值阈值σ＝0.2，及移动轨迹的匹配度阈值τ＝0.6。

S52、第一对轨迹匹配

对

Emb_STT_a1＝{[16.99，T1]，[13.22，T₂]，[7.63，T₃]，[5.30，T₄]，[3.70，T₅]}

和

Emb_STT_b1＝{[11.34，T1]，[10.57，T₂]，[7.63，T₃]，[5.30，T₄]，[3.70，T₅]}

两条轨迹进行匹配，计算其时间匹配值，由于Emb_STT_a1.Emb₁.T＝Emb_STT_b1.Emb₁.T＝T₁，则两条轨迹时间T₁的轨迹点满足时间匹配。重复计算，可以得到两轨迹在时间T₂，T₃，T₄和T₅的轨迹点满足时间匹配，即得到时间匹配值为T_count(Emb_STT_a1，Emb_STT_b1)＝5。

进一步，对时间T₁至T₅的轨迹点嵌入值求差，对于时间T₁，由于|Emb_STT_A·Emb₁-Emb_STT_B·Emb₁|＝5.65＞σ＝0.2，则时间T₁轨迹点不匹配。

同理，对其他时间序列轨迹点进行匹配计算得到：

|Emb_STT_a1·Emb₂-Emb_STT_b1·Emb₂|＝2.65＞σ

|Emb_STT_a1·Emb₃-Emb_STT_b1·Emb₃|＝0≤σ

|Emb_STT_a1·Emb₄-Emb_STT_b1·Emb₄|＝0≤σ

|Emb_STT_a1·Emb₅-Emb_STT_b1·Emb₅|＝0≤σ

由于相邻时间段T₃，T₄和T₅的轨迹点满足匹配条件，则轨迹Emb_STT_a1和Emb_STT_b1匹配的轨迹点对数量Match_Count(Emb_STT_a1，Emb_STT_b1)＝3。

最后，得到轨迹

和

的匹配度为：

因此，移动轨迹STT_a1与STT_b1匹配。

S53、其他轨迹匹配。

由于轨迹Emb_STT_a1与Emb_STT_b1匹配，下一步对Emb_STT_a2进行匹配，且Emb_STT_b1不再参加后续的匹配计算，也即对轨迹Emb_STT_a2与Emb_STT_b2进行匹配计算。

同理，得到两轨迹匹配成功的有相邻时间段为T₁，T₂的轨迹点，其匹配度为：

因此，移动轨迹STT_a2与STT_b2不匹配。

进一步得到匹配计算结果如下：

Match_Degree(Emb_STT_a2-Emb_STT_b3)＝0＜τ

Match_Degree(Emb_STT_a2-Emb_STT_b4)＝0＜τ

Match_Degree(Emb_STT_a2-Emb_STT_b5)＝0＜τ

则移动轨迹STT_a2无匹配对象。

Match_Degree(Emb_STT_a3-Emb_STT_b2)＝0.2＜τ

Match_Degree(Emb_STT_a3-Emb_STT_b3)＝0.2＜τ

Match_Degree(Emb_STT_a3-Emb_STT_b4)＝0＜τ

Match_Degree(Emb_STT_a3-Emb_STT_b5)＝0＜τ

则移动轨迹STT_a3无匹配对象。

Match_Degree(Emb_STT_a4-Emb_STT_b2)＝0＜τ

Match_Degree(Emb_STT_a4-Emb_STT_b3)＝0＜τ

Match_Degree(Emb_STT_a4-Emb_STT_b4)＝0＜τ

Match_Degree(Emb_STT_a4-Emb_STT_b5)＝0＜τ

则移动轨迹STT_a4无匹配对象。

Match_Degree(Emb_STT_a5-Emb_STT_b2)＝0＜τ

Match_Degree(Emb_STT_a5-Emb_STT_b3)＝0.2＜τ

Match_Degree(Emb_STT_a5-Emb_STT_b5)＝0.8≥τ

则移动轨迹STT_a5与STT_b5匹配。

S54、综上，可以得到匹配结果，如下表：

步骤6，基于匹配结果的移动轨迹数据交换。

数据双方将匹配成功的移动轨迹和子轨迹集合发送给对方，完成隐私保护匹配的轨迹数据交换。

在本实施例中，数据双方基于步骤5的匹配结果，将成功匹配的移动轨迹发送给对方，完成数据交换。双方成功匹配的移动轨迹数据分布如图7所示，其中，(a)为A方的轨迹，(b)为B方轨迹。

其中，A方交换给B方的数据为：

T_a1′＝{[(-3.43，9.36)，3]，[(-4.35，3.26)，4]，[(-2.41，2.07)，5]}

T_a5′＝{[(1.65，-11.37)，1]，[(3.06，-5.38)，2]，[(6.69，

-7.48)，3]，[(8.24，-0.21)，4]}

B方交换给A方的数据为：

T_b1′＝{[(-3.43，7.36)，3]，[(-4.35，3.26)，4]，[(-2.41，2.07)，5]}

T_b5′＝{[(1.65，-11.37)，1]，[(3.06，-5.38)，2]，[(6.69，-7.48)，3]，[(8.24，-0.21)，4]}。

以上所述仅为本发明的较佳实施方式，本发明的保护范围并不以上述实施方式为限，但凡本领域普通技术人员根据本发明所揭示内容所作的等效修饰或变化，皆应纳入权利要求书中记载的保护范围内。

Claims

1.一种基于热点网格维度转换的移动轨迹隐私保护匹配方法，其特征在于：所述方法包括如下步骤：

2.根据权利要求1所述的一种基于热点网格维度转换的移动轨迹隐私保护匹配方法，其特征在于：步骤1中，空间网格划分为，给定二维平面空间范围：

SE²＝{x_min,x_max,y_min,y_max}

其中，SE²的左上、右上、左下，右下四个边角点的坐标分别为，l₁＝(x_min,y_max),l₂＝(x_max,y_max)，l₃＝(x_min,y_min)，l₄＝(x_max,y_min)；对SE²采用等间隔的空间划分，得到系列空间网格组成的空间网格集合DR²＝{M_1×1,M_1×2,…,M_m×n}，其中，M_1×1＝M_1×2＝,…,M_m×n＝(Δx,Δy)，

3.根据权利要求1所述的一种基于热点网格维度转换的移动轨迹隐私保护匹配方法，其特征在于：步骤1中，时间分段离散为，给定时间范围TE＝{st,et}，其中，st，et分别表示开始时间和结束时间，对TE采用等间隔时间分段离散，得到系列时间段集合DT＝{T₁,T₂,…,T_k}，其中，T₁＝T₂＝,…,＝T_k＝Δt，

Δt表示时间间隔，k表示时间段的编号。

4.根据权利要求1所述的一种基于热点网格维度转换的移动轨迹隐私保护匹配方法，其特征在于：步骤2中，数据交换双方将其移动轨迹数据转化为基于空间网格划分与时间段集合，即时空离散空间表达，并通过对计算落在各网格的轨迹点数量，即空间网格的轨迹点计数统计，从而发现热点网格。

5.根据权利要求4所述的一种基于热点网格维度转换的移动轨迹隐私保护匹配方法，其特征在于：移动轨迹的时空离散空间表达为，给定一条移动轨迹T_ID＝{[p₁,t₁],[p₂,t₂],…,[p_n,t_n]},t₁<t₂<…<t_n，其中，ID表示移动轨迹的编号，[p_i,t_i],1≤i≤n表示一个移动轨迹点，p_i＝(x,y)表示用户在t_i时刻所处的空间位置，x,y表示空间位置的横、纵坐标值，则T_ID在空间网格划分集合DR²以及时间分段离散集合DT中的时空离散表达为：STT_ID＝[M₁,p₁,T₁],[M₂,p₂,T₂],…,[M_m,p_m,T_k]，对于其中的任一元素[M_j,p_j,T_s],1≤j≤m,1≤s≤k，都满足条件：p_i∈M_j，且t_i∈T_s，1≤i≤n。

6.根据权利要求4所述的一种基于热点网格维度转换的移动轨迹隐私保护匹配方法，其特征在于：热点网格为，给定空间网格计数矩阵，其行数和列数与空间网格集合DR²相同，且其每个元素cdr_i×j只与一个空间网格M_i×j对应，记作CountDR；其中，cdr_i×j用Count(STTs，M_i×j)表示，即移动轨迹STTs的轨迹点落在网格M_i×j中的数量；给定一个阈值θ，对矩阵CountDR的所有元素进行排序，选择其数值最大的θ个值；其中，若可选元素大于θ，则先选定较大者，较小者进行随机选择；选定的θ个网格称为热点网格，记为HM。

7.根据权利要求1所述的一种基于热点网格维度转换的移动轨迹隐私保护匹配方法，其特征在于：步骤3中，将热点网格以热点网格集合的形式表示，并根据步骤2求得空间网格统计矩阵中的对应元素值计算热点网格权重；

热点网格权重为，给定空间网格划分集合DR²＝{M₁,M₂,…,M_n}、时空离散表达移动轨迹集合STTs＝{STT₁,STT₂,…,STT_n}以及空间网格计数矩阵CountDR，如果DR²中的热点网格集合为HMs＝{HM₁,HM₂,…,HM_k}，1≤k≤n，则对于HMs中任一元素HM_i，1≤i≤k，其权重为：

8.根据权利要求1所述的一种基于热点网格维度转换的移动轨迹隐私保护匹配方法，其特征在于：步骤4中，数据双方各自计算其移动轨迹点在热点网格构成的多维度空间中的嵌入值，并将移动轨迹数据以嵌入形式进行表达；

移动轨迹的热点网格嵌入为，给定时空离散表达移动轨迹集合STTs＝{STT₁,STT₂,…,STT_n}，及其支持的热点网格集合HMs＝{HM₁,HM₂,…,HM_m}，对于STTs中的一条移动轨迹STT_i，其包含的轨迹点[M,p,T]，在热点网格集合HMs元素构成m维空间中的嵌入值为：

其中，Distance(HM_i,p)是轨迹点所处位置与热点网格HM_i的欧式距离；

对于STT_i＝[M₁,p₁,T₁],[M₂,p₂,T₂],…,[M_m,p_m,T_k]，其基于嵌入值的表达为：Emb_STT_i＝{Emb(HMs,[M₁,p₁,T₁]),Emb(HMs,[M₂,p₂,T₂]),...,{Emb(HMs,[M_m,p_m,T_k])}。

9.根据权利要求1所述的一种基于热点网格维度转换的移动轨迹隐私保护匹配方法，其特征在于：步骤5中，数据双方交换其嵌入表达的移动轨迹数据，协定轨迹点嵌入值的差值阈值σ，移动轨迹的匹配度阈值τ，并进行匹配计算；

Emb_STT_A＝{Emb₁,Emb₂,…,Emb_n}

Emb_STT_B＝{Emb₁,Emb₂,…,Emb_m}

Match_Count(Emb_STT_A，Emb_STT_B)

将Emb_STT_A与Emb_STT_B的匹配度定义为：

如果匹配度值不小于自定义阈值τ，即：

Match_Degree(Emb_STT_A-Emb_STT_B)≥τ

则称Emb_STT_A与Emb_STT_B匹配。