CN111539023B

CN111539023B - 一种基于多次迭代过滤的移动轨迹数据隐私保护匹配方法

Info

Publication number: CN111539023B
Application number: CN202010344077.6A
Authority: CN
Inventors: 张海涛; 沈慧娴; 陈德良; 王俊; 胡栋
Original assignee: Nanjing University of Posts and Telecommunications
Current assignee: Nanjing University of Posts and Telecommunications
Priority date: 2020-04-27
Filing date: 2020-04-27
Publication date: 2021-02-02
Anticipated expiration: 2040-04-27
Also published as: CN111539023A

Abstract

本发明提供一种基于多次迭代过滤的移动轨迹数据隐私保护匹配方法，所述方法包括以下步骤：数据拥有的双方将移动轨迹数据映射到Bloom过滤器，基于Bloom过滤器的1值位数的最大间距的粗略匹配计算，基于Bloom过滤器的交换位中位值为1的共同位的最小值的精确匹配计算。不需要第三方参与，仅需双方协定具体实现参数，对交换数据和已有数据进行处理，即可得到匹配结果；基于相似度计算的匹配过程，在具有不可逆转性的Bloom过滤器上进行实现，可以保证原始数据的机密性。进一步提高原始数据的机密性。实现不匹配数据的快速排除，大大减少数据计算量和交换量，从而提高匹配运算的效率。

Description

一种基于多次迭代过滤的移动轨迹数据隐私保护匹配方法

技术领域

本发明涉及空间数据隐私保护技术研究领域，尤其涉及一种基于多次迭代过滤的移动轨迹数据隐私保护匹配方法。

背景技术

随着移动通讯技术的快速发展，提供定位服务的智能手机得到了广泛的普及，产生了大量具有时空特性的移动轨迹数据。分析移动轨迹数据从中发现潜在、有价值的移动性规律，对于分析、预测人类或动物的相关行为习惯，进行疾病传播控制等应用具有重要的参考价值。目前众多的针对移动轨迹数据分析应用存在一个十分严重的共性问题：数据的有偏性。也即是，分析应用中通常使用单一来源的移动轨迹数据，很难实现区域内用户的完整活动描述。例如，产生于社交媒体的移动轨迹数据，通常被不同的互联网公司收集、存储，基于这类移动轨迹数据的分析通常无法覆盖该区域内的所有用户(例如，成年用户大多使用微博，而青少年更倾向于使用微信)。因此，为保证针对移动轨迹数据分析应用的无偏性，需要对多种来源的移动轨迹数据进行集成分析。

移动轨迹数据集成分析实现的主要手段是：以匹配的移动轨迹数据为对象，以隐含知识和空间关系发现为目标的各类移动轨迹数据挖掘技术(例如：轨迹模式挖掘，轨迹不确定性，异常值检测和分类等)。因此，移动轨迹数据的匹配分析是移动轨迹数据集成分析的基础。传统的移动轨迹匹配方法主要包括直接筛选法和基于移动轨迹相似度的加权匹配法。这些方法虽然具有匹配精度高的优点，但是在匹配过程中会产生隐私泄露的问题：包含个人敏感信息的移动轨迹数据，需要以明文的形式提供给第三方，也即匹配运算会产生用户位置隐私安全问题。

发明内容

本发明的目的是提供一种基于多次迭代过滤的移动轨迹数据隐私保护匹配方法，利用多次迭代过滤，无需第三方参与，只需数据拥有者双方直接进行多次迭代过滤的移动轨迹数据隐私保护匹配，解决了用户位置隐私安全不佳问题。

本发明提供一种基于多次迭代过滤的移动轨迹数据隐私保护匹配方法，所述方法包括以下步骤：

步骤1：数据拥有的双方将移动轨迹数据映射到Bloom过滤器，包括移动轨迹数据在统一时空格下进行表达，移动轨迹字符串转的q-gram分组和Bloom过滤器的映射存储；

步骤2：基于Bloom过滤器的1值位数的最大间距的粗略匹配计算，包括匹配Bloom过滤器1值位数的最大间距的计算，以及基于最大间距的Bloom过滤器间的粗略匹配计算；

步骤3：基于Bloom过滤器的交换位中位值为1的共同位的最小值的精确匹配计算，包括计算匹配Bloom过滤器的交换位中位值为1的共同位的最小值的，基于共同位的最小值的迭代精确匹配计算，以及依据精确匹配计算结果的原始移动轨迹数据的交换。进一步改进在于：所述步骤1中的数据拥有的双方将移动轨迹数据映射到Bloom过滤器的具体操作步骤如下：

步骤1.1：将移动轨迹数据在统一的时空格空间下进行表达；

步骤1.2：协定q值参数，采用q-gram的方法将移动轨迹字符串，转换成对应的q-gram序列；

步骤1.3：协定使用Bloom过滤器的位数组长度、Hash函数方法；

步骤1.4：依据协定的映射方法，将q-gram序列的每个元素映射到Bloom过滤器的位数组中，得到对应的Bloom过滤器。

进一步改进在于：所述步骤2中的基于Bloom过滤器的1值位数的最大间距的粗略匹配计算方法具体步骤如下：

步骤2.1：协定相似度阈值，双方交换Bloom过滤器中位值为1的位数，并计算匹配Bloom过滤器的1值位数的最大间距；

步骤2.2：Bloom过滤器的1值位数的最大间距进行粗略匹配计算。进一步改进在于：所述步骤3中的基于Bloom过滤器的交换位中位值为1的共同位的最小值的精确匹配计算的具体步骤如下：

步骤3.1：基于相似度阈值、双方交换Bloom过滤器中位值为1的位数，计算匹配Bloom过滤器的交换位中位值为1的共同位的最小值；

步骤3.2：双方首次交换Bloom过滤器的位值，并基于交换位中位值为1的共同位的最小值进行精确匹配计算；

步骤3.3：协定累计交换最大位数阈值，迭代选取前次计算的ε最小值进行位数交换、精确匹配计算，直至得到所有精确匹配结果或者达到最大交换位数的阈值；

步骤3.4：双方依据精确匹配计算结果彼此交换原始的移动轨迹数据。

本发明的有益效果：具有高隐私保护、高效率计算的优势，匹配运算不需要第三方参与，仅需双方协定具体实现参数，对交换数据和已有数据进行处理，即可得到匹配结果；基于相似度计算的匹配过程，在具有不可逆转性的Bloom过滤器上进行实现，可以保证原始数据的机密性。同时，Bloom过滤器的位值交换采用渐进发布的方式，可以有效避免双方Bloom过滤器位值的全值公开，进一步提高原始数据的机密性。在基于Bloom过滤器相似度计算的过程中，通过初次过滤、二次过滤和多次迭代过滤的方法，可实现不匹配数据的快速排除，大大减少数据计算量和交换量，从而提高匹配运算的效率。

附图说明

图1是本发明的数据拥有者A、B的6条轨迹所在的时空格空间示意图。

图2是本发明的移动轨迹T₁与图1中时空格空间的表达示意图。

图3是本发明的qT₁映射到Bloom过滤器的位数组示意图。

图4是本发明的基于双方Bloom过滤器的1值位数的最大间距的粗略匹配计算示意图。

图5是本发明的基于双方第1次交换Bloom过滤器位值的精确匹配计算示意图。

图6是本发明的基于双方第2次交换Bloom过滤器位值的精确匹配计算示意图。

图7是本发明的基于双方第3次交换Bloom过滤器位值的精确匹配计算示意图。

图8是本发明的基于双方第4次交换Bloom过滤器位值的精确匹配计算示意图。

图9是本发明的基于双方第5次交换Bloom过滤器位值的精确匹配计算示意图。

图10是本发明的基于双方第6次交换Bloom过滤器位值的精确匹配计算示意图。

图11是本发明的基于双方第7次交换Bloom过滤器位值的精确匹配计算示意图。

图12是本发明的精确匹配结果移动轨迹T₁与移动轨迹T_c的图示表达示意图。

具体实施方式

为了加深对本发明的理解，下面将结合实施例对本发明作进一步详述，该实施例仅用于解释本发明，并不构成对本发明保护范围的限定。

首先，给出几个基本定义：

定义1移动轨迹：给定一等间隔的划分时空格空间

T_ID＝{[(col¹，row¹)，k¹]，[(col²，row²)，k²]，...，[(colⁿ，rowⁿ)，kⁿ]}是STC中的一条移动轨迹。其中，DR²是等间隔的划分的空间域，DT是等间隔的划分的时间域。[(col，row)，k]称为一个时空格，col，row表示时空格在几何空间平面划分中所处的列号、行号，col_count、row_count分别是设定的空间等间隔划分的列数、行数。k表示时空格所在的时间段编号，period_count是设定的时间等间隔划分的数量。ID是移动轨迹的编号，k¹＜k²＜…＜kⁿ，对于T_ID中的任一轨迹点[(colⁱ，rowⁱ)，kⁱ]，1≤i≤n，都满足如下条件：(colⁱ，rowⁱ)∈DR²·(col，row)，而且kⁱ∈DT·k。

移动轨迹T_ID也可采用字符串形式表达，T_ID＝(col¹row¹k¹col²row²k²…colⁿrowⁿkⁿ)，简记为：T_ID＝(c₁c₂c₃…c_3n)，其中，c_3×(i-1)+1＝colⁱ、c_3x(i-1)+2＝rowⁱ、c_3×i＝kⁱ，i≥1。

定义2移动轨迹的q-gram序列：对于移动轨迹T_ID＝(c₁c₂c₃…c_3n)，其对应的基于q-gram的分组序列定义为：

qT_ID＝(c₁…c_q，c₂…c_q+1，...c_3n-q+1…c_3n)，其中，ID表示移动轨迹的q-gram序列的编号，q≥1表示分组的长度。

该分组序列也可简记为：qT_ID＝(qg₁，qg₂，...，qg_3n-q+1)，其中，qg_i＝c_i…c_i+q-1，1≤i≤(3n-q+1)，qg_i表示第i个q-gram。

定义3移动轨迹的Bloom过滤器：给定一个移动轨迹的q-gram序列qT_ID＝(qg₁，qg₂，…，qg_3n-q+1)，其对应的Bloom过滤器定义为：bf_ID＝{b₀b₁…b_m-1}，其中，ID表示Bloom过滤器的编号；b_i∈{0，1}，0≤i≤m-1，m为Bloom过滤器的位数组长度。

对于q-gram序列qT_ID中的任一元素qg_j，1≤j≤(3n-q+1)，q≥1，在bf_ID中存在两个元素b_s＝1。其中，0≤s≤m-1，s＝h(qg_j)mod m，h是一个hash函数，h(qg_j)、是h对qT_ID中qg_j的散列值。

定义4移动轨迹Bloom过滤器间的相似系数：对于两个移动轨迹的Bloom过滤器bf_ID1和bf_ID2，其相似系数定义为：

其中，0≤BSim(bf_ID1，bf_ID2)≤1；comm(bf_ID1，bf_ID2)表示Bloom过滤器bf_ID1，bf_ID2中位值为1的相同位的数量；n_bit_1_ID1，n_bit_1_ID2分别表示Bloom过滤器bf_ID1，bf_ID2中位值为1的位的数量。

如果bf_ID1，bf_ID2的相似系数满足用户设定的相似度阈值S_t，也即BSim(bf_ID1，bf_ID2)≥S_t，则称bf_ID1与bf_ID2匹配。

定义5匹配Bloom过滤器的1值位数的最大间距：给定两个Bloom过滤器bf_ID1、bf_ID2，相似度阈值S_t，bf_ID1、bf_ID2中位值为1的位数n_bit_1_ID1、n_bit_1_ID2，如果bf_ID1，bf_ID2匹配，则n_bit_1_ID1、n_bit_1_ID2的差值δ＝|n_bit_1_ID1-n_bit_1_ID2|的最大值，定义为bf_ID1、bf_ID2中位值为1的位数的最大间距为：

其中，

为向下取整符号，min(n_bit_1_ID1，n_bit_1_ID2)为n_bit_1_ID1、n_bit_1_ID2的较小值。

定义6基于Dmax的粗略匹配计算：给定两个Bloom过滤器bf_ID1，bf_ID2，以及其1值位数的最大间距Dmax，则粗略计算bf_ID1、bf_ID2匹配结果的规则是：

如果bf_ID1、bf_ID2中位值为1的位数n_bit-1_ID1、n_bit_1_ID2的差值δ＝|n_bit_1_ID1-n_bit_1_ID2|不小于Dmax，也即：δ≥Dmax，则粗略计算bf_ID1、bf_ID2不匹配，记为：Matc_R(bf_ID1，bf_ID2)＝0；

否则，粗略计算bf_ID1、bf_ID2可能匹配，记为：Matc_R(bf_ID1，bf_ID2)＝-1。定义7Bloom过滤器匹配计算所需的交换位中位值为1的共同位的最小值：给定两个Bloom过滤器bf_ID1、bf_ID2，相似度阈值S_t，判定bf_ID1、bf_ID2匹配结果所需的交换位中位值为1的共同位的最小值为：

其中，

为向上取整符号，n_bit_1_ID1、n_bit_1_ID2是bf_ID1、bf_ID2中位值为1的位数。

定义8基于C_min的精确匹配计算：给定两个Bloom过滤器bf_ID1，bf_ID2，bf_ID1和bf_ID2交换位中位值为1的共同位最小值C_min，累计i次交换的位

中位值为1的位数

以及

中位值为1的共同位的数量

则精确计算bf_ID1、bf_ID2匹配结果的规则是：

如果εⁱ≤0，则精确计算bf_ID1，bf_ID2匹配，记为：Matc_A(bf_ID1，bf_ID2)＝1；如果εⁱ＞0，且

则精确计算bf_ID1、bf_ID2不匹配，记为：Matc_A(bf_ID1，bf_ID2)＝0；

如果ε＞0，且

则精确计算bf_ID1、bf_ID2可能匹配，记为：Matc_A(bf_ID1，bf_ID2)＝-1。

其中，

称为交换位中位值为1的共同位的最小值C_min，与累计i次交换的位中位值为1的共同位的数量

的差值。

第一阶段：数据拥有的双方将移动轨迹数据映射到Bloom过滤器

步骤1)将移动轨迹数据在统一的时空格空间下进行表达。

本实例中，等间隔的划分时空格空间为

图形表达如图1所示。

数据拥有者A拥有基于STC表达的3条移动轨迹，具体数据信息为：

T₁＝{[(1，1)，1]，[(2，1)，2]，[(2，2)，3]}，T₂＝{[(1，1)，4]，[(2，2)，6]，[(5，4)，8]}，

T₃＝{[(1，2)，2]，[(3，2)，5]，[(4，3)，7]}。也可简记为：T₁＝(111212223)，

T₂＝(114226548)，T₃＝(122325437)。

其中，T₁在STC图1中的图形表达如图2所示。

数据拥有者B拥有基于STC表达的3条移动轨迹，具体数据信息为：

T_a＝{[(2，1)，3]，[(2，2)，6]，[(3，2)，8]}，T_b＝{[(1，1)，4]，[(1，2)，6]，[(3，3)，2]}，

T_c＝{[(1，2)，1]，[(2，2)，2]，[(3，5)，7]}。也可简记为：T_a＝(213226328)，

T_b＝(114126332)，T_c＝(121222357)。

步骤2)协定q值参数，采用q-gram的方法将移动轨迹字符串，转换成对应的q-gram序列。

本实例中，数据拥有者A、B协定参数q值为3。依照定义2，分别将T₁～T₃，T_a～T_c转换成q-gram序列qT₁～qT₃，qT_a～qT_c。

以T₁为例，给出具体的计算过程：

T₁＝(c₁c₂c₃c₄c₅c₆c₇c₈c₉)，以3-gram的形式进行划分得到的q-gram序列为：qT₁＝(c₁c₂c₃，c₂c₃c₄，c₃c₄c₅₅，c₄c₅c₆，c₅c₆c₇，c₆c₇c₈，c₇c₈c₉)。

也即：T₁＝(111212223)，对应的q-gram序列为qT₁＝(111，112，121，212，122，222，223)。

同理，计算得到T₂～T₃，T_a～T_c的q-gram序列分别为：

qT₂＝(114，142，422，226，265，654，548)，

qT₃＝(122，223，232，325，254，543，437)，

qT_a＝(213，132，322，226，263，632，328)，

qT_b＝(114，141，412，126，263，633，332)，

qT_c＝(121，212，122，222，223，235，357)。

步骤3)协定使用Bloom过滤器的位数组长度、Hash函数方法。

本实例中，数据拥有者A、B协定使用Bloom过滤器的位数组长度为10bit，Hash函数方法为SHA256。

步骤4)依据协定的映射方法，将q-gram序列的每个元素映射到Bloom过滤器的位数组中，得到对应的Bloom过滤器。

本实例中，数据拥有者A、B协定依照定义3的映射方法，分别将q-gram序列qT₁～qT₃，qT_a～qT_c映射到Bloom过滤器的位数组中，得到对应的Bloom过滤器bf₁～bf₃，bf_a～bf_c。

以qT₁为例，给出具体的计算过程：

qT₁＝(qg₁，qg₂，qg₃，qg₄，qg₅，qg₆，qg₇)

＝(c₁c₂c₃，c₂c₃c₄，c₃c₄c₅，c₄c₅c₆，c₅c₆c₇，c₆c₇c₈，c₇c₈c₉)

＝(111，112，121，212，122，222，223)，

h、m分别是SHA256、10。

对于qg₁＝111，

h(qg₁)＝SHA256(111)＝{f6e0a1e2ac41945a9aa7ff8a8aaa0cebc12a3bcc981a929ad5cf810a090e11ae}s＝h(qg₁)mod 10＝SHA256(111)mod 10＝1、

因此，在bf₁中存在元素b₁＝1。

同理，对于qT₁中的qg₂～qg₇，可以计算得到：

b₁＝1，b₄＝1，b₉＝1。

也即，b₁＝b₄＝b₉＝1，得到qT₁的Bloom过滤器bf₁＝(0100100001)。

qT₁映射到Bloom过滤器的位数组的图形表达如图3所示。

进一步，计算qT₂～qT₃，qT_a～qT_c，得到对应的Bloom过滤器分别为：

bf₂＝(0100011001)，bf₃＝(1001000011)，bf_a＝(1100100101)，bf_b＝(0100001101)，bf_c＝(0100100001)。

第二阶段：基于Bloom过滤器的1值位数的最大间距的粗略匹配计算

步骤5)协定相似度阈值，双方交换Bloom过滤器中位值为1的位数，并计算匹配Bloom过滤器的1值位数的最大间距。

在本实例中，数据拥有者A、B协定相似度阈值S_t＝0.65。数据拥有者A将bf₁～bf₃中位值为1的位数n_bit-1₁～n_bit_1₃发送给数据拥有者B。数据拥有者B将bf_a～bf_c中位值为1的位数n_bit_1_a～n_bit_1_c发送给数据拥有者A。数据拥有者A、B，依照定义5分别计算bf₁～bf₃与bf_a～bf_c匹配所需的1值位数的最大间距。

以bf₁和bf_a之间的1值位数的最大间距为例，说明具体的计算过程。

n_bit_1₁＝3、n_bit_1_a＝5、min(n_bit_1₁，n_bit-1_a)＝3，

同理，计算bf₁和bf_b、bf_c之间的1值位数的最大间距，得到：

Dmax(bf₁，bf_b)＝3、Dmax(bf₁，bf_c)＝3。

进一步，计算bf₂与bf_a～bf_c之间的1值位数的最大间距，得到：

Dmax(bf₂，bf_a)＝4、Dmax(bf₂，bf_b)＝4、Dmax(bf₂，bf_c)＝3。

进一步，计算bf₃与bf_a～bf_c之间的1值位数的最大间距，得到：

Dmax(bf₃，bf_a)＝4、Dmax(bf₃，bf_b)＝4、Dmax(bf₃，bf_c)＝3。

步骤6)Bloom过滤器的1值位数的最大间距进行粗略匹配计算。

在本实例中，基于bf₁～bf₃与bf_a～bf_c匹配所需的1值位数的最大间距，以及f₁～bf₃与bf_a～bf_c中位值为1的位数n_bit_1₁～n_bit_1₃与n_bit-1_a～n_bit_1_c，依照定义6，进行bf₁～bf₃与bf_a～bf_c间的粗略匹配计算。

以bf₁和bf_a为例，说明具体的粗略匹配计算过程。

bf₁、bf_a中位值为1的位数分别为：n_bit_1₁＝3、n_bit_1_a＝5。

bf₁、bf_a中位值为1的位数的差值为：

δ(bf₁，bf_a)＝|n_bit_1₁-n_bit_1_a|＝|3-5|＝2。

bf₁、bf_a匹配所有的1值位数的最大间距：Dmax(bf₁，bf_a)＝3。

因此，δ(bf₁，bf_a)＝2＜Dmax(bf₁，bf_a)＝3，粗略判定bf₁与bf_a可能匹配，也即Matc_R(bf₁，bf_a)＝-1。

再以bf₁和bf_b为例，说明具体的粗略匹配计算过程。

bf₁、bf_b中位值为1的位数分别为：n_bit_1₁＝3、n_bit_1_b＝7。

bf₁、bf_b中位值为1的位数的差值为：δ(bf₁，bf_b)＝|n_bit_1₁-n_bit_1_b|＝|3-7|＝4。

bf₁、bf_a匹配所有的1值位数的最大间距：Dmax(bf₁，bf_b)＝3。

因此，δ(bf₁，bf_b)＝4＞Dmax(bf₁，bf_b)＝3，粗略判定bf₁与bf_b不匹配，也即Matc_R(bf₁，bf_b)＝0。

同理，计算bf₁和bf_c之间的粗略匹配结果为：

δ(bf₁，bf_c)＝0＜Dmax(bf₁，bf_b)＝3，也即Matc_R(bf₁，bf_b)＝-1。

进一步，计算bf₂与bf_a～bf_c之间的粗略匹配结果为：

δ(bf₂，bf_a)＝1＜Dmax(bf₂，bf_a)＝4，也即Matc_R(bf₂，bf_a)＝-1；

δ(bf₂，bf_b)＝3＜Dmax(bf₂，bf_b)＝4，也即Matc_R(bf₂，bf_b)＝-1；

δ(bf₂，bf_c)＝1＜Dmax(bf₂，bf_c)＝3，也即Matc_R(bf₂，bf_c)＝-1。

进一步，计算bf₃与bf_a～bf_c之间的粗略匹配结果为：

δ(bf₃，bf_a)＝1＜Dmax(bf₃，bf_a)＝4，也即Matc_R(bf₃，bf_a)＝-1；

δ(bf₃，bf_b)＝3＜Dmax(bf₃，bf_b)＝4，也即Matc_R(bf₃，bf_b)＝-1；

δ(bf₃，bf_c)＝1＜Dmax(bf₃，bf_c)＝3，也即Matc_R(bf₃，bf_c)＝-1。

上述基于双方Bloom过滤器的1值位数的最大间距的粗略匹配计算过程示意，如图4所示。

第三阶段：基于Bloom过滤器的交换位中位值为1的共同位的最小值的精确匹配计算

步骤7)基于相似度阈值、双方交换Bloom过滤器中位值为1的位数，计算匹配Bloom过滤器的交换位中位值为1的共同位的最小值。

在本实例中，相似度阈值S_t＝0.65。依据交换的n_bit-1₁～n_bit-1₃、n_bit-1_a～n_bit_1_c，依照定义5分别计算bf₁～bf₃与bf_a～bf_c匹配所需的交换位中位值为1的共同位的最小值。

以bf₁和bf_a为例，说明具体的计算过程。

n_bit_1₁＝3、n_bit_1_a＝5，

同理，计算bf₁和bf_c之间的交换位中位值为1的共同位的最小值，得到：C_min(bf₁，bf_c)＝2。

进一步，计算bf₂与bf_a～bf_c之间的交换位中位值为1的共同位的最小值，得到：C_min(bf₂，bf_a)＝3、C_min(bf₂，bf_b)＝4、C_min(bf₂，bf_c)＝3。进一步，计算bf₃与bf_a～bf_c之间的交换位中位值为1的共同位的最小值，得到：C_min(bf₃，bf_a)＝3、C_min(bf₃，bf_b)＝4、C_min(bf₃，bf_c)＝3。步骤8)双方首次交换Bloom过滤器的位值，并基于交换位中位值为1的共同位的最小值进行精确匹配计算。

在本实例中，首先，选取步骤7)计算的bf₁～bf₃与bf_a～bf_c的C_min最小值C_min(bf₁，bf_c)＝2，作为双方交换Bloom过滤器第1次交换位值的数量。其次，双方交换Bloom过滤器bf₁～bf₃与bf_a～bf_c的前2位的位值。最后，依照定义6，进行bf₁～bf₃与bf_a～bf_c间的精确匹配计算。

以bf₁和bf_a为例，说明具体的计算过程。

bf₁和bf_a交换的2位分别是：

中位值为1的共同位的数量：

C_min(bf₁，bf_a)＝3。

交换位中位值为1的共同位的最小值C_min，与累计i次交换的位中位值为1的共同位的数量

的差值：

bf₁和bf_a中位值为1的位数：n_bit_1₁＝3、n_bit_1_a＝5。

中位值为1的位数：

bf₁和bf_a中为交换位中位值为1的位数：

因此，

判定bf₁、bf_a可能匹配，也即：Matc_A(bf₁，bf_a)＝-1。

同理，计算bf₁和bf_c之间的匹配，得到：

判定bf₁、bf_c可能匹配，也即：Matc_A(bf₁，bf_c)＝-1。

进一步，计算bf₂与bf_a～bf_c之间的匹配，得到：

也即：Matc_A(bf₂，bf_a)＝-1。

也即：Matc_A(bf₂，bf_b)＝-1。

也即：Matc_A(bf₂，bf_c)＝-1。

进一步，计算bf₃与bf_a～bf_c之间的匹配，得到：

也即：Matc_A(bf₃，bf_a)＝-1。

也即：Matc_A(bf₃，bf_b)＝0。

也即：Matc_A(bf₃，bf_c)＝0。

Matc_A(bf₃，bf_b)＝0，Matc_A(bf₃，bf_c)＝0，也即是bf₃和bf_b不匹配，bf₃和bf_b不匹配，均进行了二次过滤。

以bf₃和bf_b为例，对匹配计算过程进行详细说明：

bf₃和bf_b交换的2位分别是：

中位值为1的共同位的数量：

C_min(bf₃，bf_b)＝4。

的差值：

bf₃和bf_b中位值为1的位数：n_bit_1₃＝4、n_bit_1_b＝7。

中位值为1的位数：

bf₃和bf_b中为交换位中位值为1的位数：

因此，

判定bf₃、bf_b不匹配，也即：Matc_A(bf₃，bf_b)＝0。

上述基于双方第1次交换Bloom过滤器位值的精确匹配计算过程示意，如图5所示。

步骤9)协定累计交换最大位数阈值，迭代选取前次计算的ε最小值进行位数交换、精确匹配计算，直至得到所有精确匹配结果或者达到最大交换位数的阈值。

在本实例中，累计交换最大位数阈值为8位。第1次交换位置后计算的ε分别为：

(1)第2次迭代

双方第2次交换bf₁～bf₃与bf_a～bf_c的1位的位值，也即交换bf₁～bf₃与bf_a～bf_c的第3位的位值，并依照定义6，再次进行bf₁～bf₃与bf_a～bf_c间的精确匹配计算。

计算bf₁和bf_a～bf_c之间的匹配，得到：

判定bf₁、bf_a可能匹配，也即：Matc_A(bf₁，bf_a)＝-1。

判定bf₁、bf_c可能匹配，也即：Matc_A(bf₁，bf_c)＝-1。

进一步，计算bf₂与bf_a～bf_c之间的匹配，得到：

也即：Matc_A(bf₂，bf_a)＝-1。

也即：Matc_A(bf₂，bf_b)＝-1。

也即：Matc_A(bf₂，bf_c)＝-1。

进一步，计算bf₃与bf_a～bf_c之间的匹配，得到：

也即：Matc_A(bf₃，bf_a)＝-1。

上述基于双方第2次交换Bloom过滤器位值的精确匹配计算过程示意，如图6所示。

第2次交换位置后计算的ε分别为：

因此，双方第3次交换bf₁～bf₃与bf_a～bf_c的1位的位值，也即交换bf₁～bf₃与bf_a～bf_c的第4位的位值，并依照定义6，再次进行bf₁～bf₃与bf_a～bf_c间的精确匹配计算。

(2)第3次迭代

双方第3次交换bf₁～bf₃与bf_a～bf_c的1位的位值，也即交换bf₁～bf₃与bf_a～bf_c的第3位的位值，并依照定义6，再次进行bf₁～bf₃与bf_a～bf_c间的精确匹配计算。计算得到：

Matc_A(bf₁，bf_a)＝Matc_A(bf₁，bf_c)＝Matc_A(bf₂，bf_a)＝Matc_A(bf₂，bf_b)＝Matc_A(bf₂，bf_c)＝Matc_A(bf₃，bf_a)＝-1。

上述基于双方第3次交换Bloom过滤器位值的精确匹配计算过程示意，如图7所示。

第3次交换位置后计算的ε分别为：

(3)第4次迭代

双方第4次交换bf₁～bf₃与bf_a～bf_c的1位的位值，也即交换bf₁～bf₃与bf_a～bf_c的5位的位值，并依照定义6，再次进行bf₁～bf₃与bf_a～bf_c间的精确匹配计算。计算得到：

Matc_A(bf₁，bf_a)＝Matc_A(bf₂，bf_a)＝Matc_A(bf₂，bf_b)＝Matc_A(bf₃，bf_a)＝-1。

Matc_A(bf₂，bf_c)＝0。Matc_A(bf₁，bf_c)＝1。

至此，发现bf₁和bf_c相匹配。对bf₁和bf_c的匹配过程进行详细的说明。bf₁和bf_c交换的5位分别是：

中位值为1的共同位的数量：

C_min(bf₁，bf_c)＝2。交换位中位值为1的共同位的最小值C_min，与累计i次交换的位中位值为1的共同位的数量

的差值：

依照定义7，判定bf₁、bf_c匹配，也即：Matc_A(bf₁，bf_c)＝1。

上述基于双方第4次交换Bloom过滤器位值的精确匹配计算过程示意，如图8所示。

第4次交换位置后计算的ε分别为：

(4)第5次迭代

双方第5次交换bf₁～bf₃与bf_a～bf_c的1位的位值，也即交换bf₁～bf₃与bf_a～bf_c的第6位的位值，并依照定义6，再次进行bf₁～bf₃与bf_a～bf_c间的精确匹配计算。计算得到：

上述基于双方第5次交换Bloom过滤器位值的精确匹配计算过程示意，如图9所示。

第5次交换位置后计算的ε分别为：

(5)第6次迭代

双方第6次交换bf₁～bf₃与bf_a～bf_c的1位的位值，也即交换bf₁～bf₃与bf_a～bf_c的第7位的位值，并依照定义6，再次进行bf₁～bf₃与bf_a～bf_c间的精确匹配计算。计算得到：

Matc_A(bf₁，bf_a)＝Matc_A(bf₂，bf_b)＝Matc_A(bf₃，bf_a)＝-1。

Matc_A(bf₂，bf_a)＝0

上述基于双方第6次交换Bloom过滤器位值的精确匹配计算过程示意，如图10所示。

第6次交换位置后计算的ε分别为：

(6)第7次迭代

双方第7次交换bf₁～bf₃与bf_a～bf_c的1位的位值，也即交换bf₁～bf₃与bf_a～bf_c的第8位的位值，并依照定义6，再次进行bf₁～bf₃与bf_a～bf_c间的精确匹配计算。计算得到：

Matc_A(bf₁，bf_a)＝Matc_A(bf₂，bf_b)＝-1。

Matc_A(bf₃，bf_a)＝0。

此时，累计交换位数达到协定阈值8，停止迭代。

上述基于双方第7次交换Bloom过滤器位值的精确匹配计算过程示意，如图11所示。

步骤10)，双方依据精确匹配计算结果彼此交换原始的移动轨迹数据。本实例中，依据计算的Matc_A(bf₁，bf_c)＝1。

数据拥有者A依据编号，将对应的将移动轨迹T₁发送给数据拥有者B。数据拥有者B依据编号，将对应的将移动轨迹T_c发送给数据拥有者A。最终，实现匹配移动轨迹数据的交换。移动轨迹T₁与移动轨迹T_c匹配的图形示意，如图12所示。

Claims

1.一种基于多次迭代过滤的移动轨迹数据隐私保护匹配方法，其特征在于：所述方法包括以下步骤：

步骤3：基于Bloom过滤器的交换位中位值为1的共同位的最小值的精确匹配计算，包括计算匹配Bloom过滤器的交换位中位值为1的共同位的最小值的，基于共同位的最小值的迭代精确匹配计算，以及依据精确匹配计算结果的原始移动轨迹数据的交换；

所述步骤1中的数据拥有的双方将移动轨迹数据映射到Bloom过滤器的具体操作步骤如下：

步骤1.1：将移动轨迹数据在统一的时空格空间下进行表达；

步骤1.3：协定使用Bloom过滤器的位数组长度、Hash函数方法；

步骤1.4：依据协定的映射方法，将q-gram序列的每个元素映射到Bloom过滤器的位数组中，得到对应的Bloom过滤器；

所述步骤2中的基于Bloom过滤器的1值位数的最大间距的粗略匹配计算方法具体步骤如下：

步骤2.2：Bloom过滤器的1值位数的最大间距进行粗略匹配计算；

所述步骤3中的基于Bloom过滤器的交换位中位值为1的共同位的最小值的精确匹配计算的具体步骤如下：

步骤3.3：协定累计交换最大位数阈值，迭代选取前次计算的

最小值进行位数交换、精确匹配计算，直至得到所有精确匹配结果或者达到最大交换位数的阈值；