CN111506918A

CN111506918A - 一种基于Bloom过滤器的移动轨迹隐私保护匹配方法

Info

Publication number: CN111506918A
Application number: CN202010275089.8A
Authority: CN
Inventors: 张海涛; 罗城; 陈一祥; 吴标兵; 乐洋
Original assignee: Nanjing University of Posts and Telecommunications
Current assignee: Sinopec Yangzi Petrochemical Co Ltd
Priority date: 2020-04-09
Filing date: 2020-04-09
Publication date: 2020-08-07
Anticipated expiration: 2040-04-09
Also published as: CN111506918B

Abstract

本发明提供一种基于Bloom过滤器的移动轨迹隐私保护匹配方法，所述方法包括以下步骤：步骤一：数据拥有的双方基于时空转换进行数据预处理，步骤二：数据拥有的双方将时空格序列字符串映射到Bloom过滤器，步骤三：第三方基于Bloom过滤器进行移动轨迹隐私保护匹配。具有隐私保护性好、计算速度快的优势，把基于原始移动轨迹数据明文的相似度计算，转换成基于Bloom过滤器的计算。转换过程由只具有单向性的Hash散列和求模运算实现，保证原始移动轨迹数据的机密性。基于Bloom过滤器的位值的相似度计算，充分利用Bloom过滤器位值运算的高效性，大大提高相似度计算的速度。

Description

一种基于Bloom过滤器的移动轨迹隐私保护匹配方法

技术领域

本发明涉及时空数据隐私保护集成的技术领域，尤其涉及一种基于Bloom过滤器的移动轨迹隐私保护匹配方法。

背景技术

随着移动通讯技术的快速发展，提供定位服务的智能手机得到了广泛的普及，产生了大量具有时空特性的移动轨迹数据。分析移动轨迹数据从中发现潜在、有价值的移动性规律，对于分析、预测人类或动物的相关行为习惯具有重要的参考价值。

目前众多的针对移动轨迹数据分析应用存在一个十分严重的共性问题：数据的有偏性。也即是，分析应用中通常使用单一来源的移动轨迹数据，很难实现区域内用户的完整活动描述。例如，产生于社交媒体的移动轨迹数据，通常被不同的互联网公司收集、存储，基于这类移动轨迹数据的分析通常无法覆盖该区域内的所有用户(例如，成年用户大多使用腾讯的微信，而青少年更倾向于使用阿里的钉钉)。因此，为保证针对移动轨迹数据分析应用的无偏性，需要对多种来源的移动轨迹数据进行集成分析。

移动轨迹数据集成分析实现的主要手段是：以匹配的移动轨迹数据为对象，以隐含知识和空间关系发现为目标的各类移动轨迹数据挖掘技术(例如：轨迹模式挖掘，轨迹不确定性，异常值检测和分类等)。因此，移动轨迹数据的匹配分析是移动轨迹数据集成分析的基础。传统的移动轨迹匹配方法主要包括直接筛选法和基于移动轨迹相似度的加权匹配法。这些方法虽然具有匹配精度高的优点，但是在匹配过程中会产生隐私泄露的问题：包含个人敏感信息的移动轨迹数据，需要以明文的形式提供给第三方，也即匹配运算会产生用户位置隐私安全问题。

发明内容

本发明的目的是提供一种基于Bloom过滤器的移动轨迹隐私保护匹配方法，通过三个阶段：数据拥有的双方基于时空转换进行数据预处理、数据拥有的双方将时空格序列字符串映射到Bloom过滤器和第三方基于Bloom过滤器进行移动轨迹隐私保护匹配对信息进行保护，具有隐私保护性好、计算速度快的优势，解决了匹配过程中会产生隐私泄露的问题。

本发明提供一种基于Bloom过滤器的移动轨迹隐私保护匹配方法，所述方法包括以下步骤：

步骤一：数据拥有的双方基于时空转换进行数据预处理，首先，依据协定的参数，对原始的移动轨迹数据进行时空划分；然后，基于移动轨迹数据与时空格的匹配得到对应的时空格序列；最后，合并时空格序列得到时空格序列字符串；

步骤二：数据拥有的双方将时空格序列字符串映射到Bloom过滤器，首先，对时空格序列字符串进行q-gram的分组；然后，将所有分组散列映射到Bloom过滤器中；最后，双方将Bloom过滤器发送给第三方；

步骤三：第三方基于Bloom过滤器进行移动轨迹隐私保护匹配，首先，第三方计算Bloom过滤器之间的相似系数；然后，将其与设定的相似度阈值比较，得到满足要求的移动轨迹匹配组；最后，第三方将匹配编号发回给数据拥有的双方,双方依照标识彼此交换原始的移动轨迹数据。

进一步改进在于：所述步骤一中数据拥有的双方基于时空转换的数据预处理的具体步骤如下：

步骤1.1：彼此交换所拥有的移动轨迹的时空分布范围，并协定采用时空等间隔的方法划分双方时空分布范围的并集，构建时空格空间；

步骤1.2：将移动轨迹数据与时空格空间进行匹配，得到时空格序列；

步骤1.3：以时空格序列为单元，将序列中包含的时空格进行合并，

对应得到时空格序列字符串。

进一步改进在于：所述步骤二中数据拥有的双方将时空格序列字符串映射到Bloom过滤器的具体步骤如下：

步骤2.1：协定q值参数，采用q-gram的方法，将时空格序列字符串转换成对应的q-gram序列；

步骤2.2：协定使用Bloom过滤器的位数组长度、Hash函数的个数及方法；

步骤2.3：依据协定的映射方法，将q-gram序列的每个元素映射到Bloom过滤器的位数组中，得到对应的Bloom过滤器；

步骤2.4：将所有Bloom过滤器以及协定的相似度阈值发送给第三方。

进一步改进在于：所述步骤三中基于Bloom过滤器进行移动轨迹隐私保护匹配的具体步骤如下：

步骤3.1：计算Bloom过滤器之间的相似系数；

步骤3.2：比较相似系数与设定的相似度阈值，得到满足要求的匹配组；

步骤3.3：第三方将匹配编号发送给数据拥有的双方，双方依据编号彼此交换原始的移动轨迹数据。

本发明的有益效果：具有隐私保护性好、计算速度快的优势，把基于原始移动轨迹数据明文的相似度计算，转换成基于Bloom过滤器的计算。转换过程由只具有单向性的Hash散列和求模运算实现，保证原始移动轨迹数据的机密性。基于Bloom过滤器的位值的相似度计算，充分利用Bloom过滤器位值运算的高效性，大大提高相似度计算的速度。

附图说明

图1是本发明的数据拥有者A、B包含的6条轨迹数据所对应的时空格空间示意图。

图2是本发明的数据拥有者A中的移动轨迹T_a与图1中的时空格空间进行匹配后，得到的时空格序列SeSTC_a示意图。

图3是本发明的数据拥有者A、B中时空格序列字符串StrSeSTC_a和StrSeSTC₁映射得到的Bloom过滤器示意图。

图4是本发明的第三方基于数据拥有者A、B提供Bloom过滤器的相似系数计算示意图。

图5是本发明的数据拥有者A、B基于第三方提供匹配编号的原始移动轨迹数据交换示意图。

具体实施方式

为了加深对本发明的理解，下面将结合实施例对本发明作进一步详述，该实施例仅用于解释本发明，并不构成对本发明保护范围的限定。

首先，给出几个基本定义：

定义1移动轨迹：记录用户的连续运动的位置的有序列表，定义为T_ID＝{[p₁，t₁]，[p₂，t₂]，…，[p_n，t_n]}，t₁＜t₂＜…＜t_n，其中，ID表示移动轨迹的编号，[p_i，t_i]，1≤i≤n表示一个移动轨迹点，p_i＝(x，y)表示用户在t_i时刻所处的空间位置，x，y表示空间位置的横、纵坐标值。

定义2时空格空间：给定一个2维几何空间R²和一个时间域T，其对应的等间隔的划分时空格空间定义为：

其中，DR²是对R²的等间隔的划分的几何空间，DT是对T进行等间隔的划分的时间域。[(col，row)，k]称为一个时空格，col，row表示时空格在几何空间平面划分中所处的列号、行号，col_count、row_count分别是设定的空间等间隔划分的列数、行数。k表示时空格所在的时间段编号，period_count是设定的时间等间隔划分的数量。

定义3时空格序列：对于一条移动轨迹T_ID＝{[p₁，t₁]，[p₂，t₂]，...，[p_n，t_n]}，t₁＜t₂＜…＜t_n和一个时空格空间，

T_ID匹配到STC的时空格序列定义为：

SeSTC_ID＝{[(col¹，row¹)，k¹]，[(col²，row²)，k²]，…，[(colⁿ，rowⁿ)，kⁿ]}

其中，ID是时空格序列的编号，它与移动轨迹T_ID编号一致，对任一时空格[(colⁱ，rowⁱ)，kⁱ]，1≤i≤n都满足如下条件：p_i∈(colⁱ，rowⁱ)p_i∈(colⁱ，rowⁱ)，也即移动轨迹点的空间位置包含于对应的空间格，而且t_i∈kⁱt_i∈kⁱ，也即移动轨迹点的时刻包含于对应的时间段。

定义4时空格序列字符串：给定一个时空格序列{[(col¹，row¹)，k¹]，[(col²，row²)，k²]，…，[(colⁿ，rowⁿ)，kⁿ]}，其对应的时空格序列字符串为：

StrSeSTC_ID＝(col¹row¹k¹col²row²k²…colⁿrowⁿkⁿ)

该时空格序列字符串也可简记为：StrSeSTC_ID＝(c₁c₂c₃…c_3n)，

其中，c_3×(i-1)+1＝colⁱ、c_3×(i-1)+2＝rowⁱ、c_3×i＝kⁱ，i≥1。

定义5时空格序列字符串的q-gram序列：对于一个时空格序列字符串StrSeSTC_ID＝(c₁c₂c₃…c_3n)，其对应的基于q-gram的分组序列定义为：

qStrSeSTC_ID＝(c₁…c_q，c₂…c_q+1，…，c_3n-q+1…c_3n)

qStrSeSTC_ID＝(c₁…c_q，c₂…c_q+1，...，c_3n-q+1…c_3n)，

其中，ID表示时空格序列字符串的q-gram序列的随机编号，qq表示分组的长度，q≥1。

该分组序列也可简记为：qStrSeSTC_ID＝(qg₁，qg₂，...，qg_3n-q+1)，

其中，qg_i＝c_i…c_i+q-1，1≤i≤(3n-q+1)，qg_i表示第i个q-gram。

定义6时空格序列字符串的Bloom过滤器：给定一个时空格序列字符串的q-gram分组序列qStrSeSTC_ID＝(qg₁，qg₂，…，qg_3n-q+1)，其对应的时空格序列字符串的Bloom过滤器定义为：

bf_ID＝{b₀b₁…b_m-1)

其中，ID表示字符串的Bloom过滤器的编号；b_i∈{0，1}，0≤i≤m-1，m为Bloom过滤器的位数组长度。

对于q-gram序列qStrSeSTC_ID中的任一元素qg_j，1≤j≤(3n-q+1)，q≥1，在bf_ID中存在两个元素b_s＝b_t＝1。0≤s，t≤m-1，s＝h₁(Qg_j)mod m，t＝[h₁(qg_j)+h₂(qg_j)]mod m，h₁、h₂是两个相互独立的Hash函数，h₁(qg_j)、h₂(qg_j)分别是h₁、h₂对qStrSeSTC_ID中qg_j的散列值。

定义7时空格序列字符串的Bloom过滤器间的相似系数：对于两个时空格序列字符串的Bloom过滤器bf_ID1和bf_ID2，其相似系数定义为：

其中，0≤BSim(bf_ID1，bf_ID2)≤1；comm(bf_ID1，bf_ID2)表示Bloom过滤器bf_ID1，bf_ID2中位值为1的相同位的数量；leng_ID1，leng_ID2分别表示Bloom过滤器bf_ID1，bf_ID2中位值为1的位的数量。

第一阶段：数据拥有的双方基于时空转换的数据预处理步骤1)彼此交换所拥有的移动轨迹的时空分布范围，并协定采用时空等间隔的方法划分双方时空分布范围的并集，构建时空格空间。本实例中，数据拥有者A拥有2条移动轨迹，具体数据信息为:

T_a＝{[(410，520)，11:25]，[(510，520)，12:10]，[(530，640)，13:05]}

T_b＝{[(510，510)，13:21]，[(560，620)，16:35]，[(620，690)，18:55]}

数据拥有者B拥有4条移动轨迹，具体数据信息为:

T₁＝{[(470，530)，11:05]，[(540，590)，12:27]，[(580，620)，13:43]}

T₂＝{[(440，630)，12:25]，[(510，690)，15:32]，[(670，620)，17:09]}

T₃＝{[(410，520)，14:15]，[(510，502)，15:10]，[(530，640)，16:06]}

T₄＝{[(510，520)，13:12]，[(510，620)，14:13]，[(630，640)，18:05]}

数据拥有者A拥有的移动轨迹的横坐标范围是410～620(精确到m)；纵坐标范围是510～690；时间范围是11:25～18:55(精确到s)。数据拥有者B拥有的移动轨迹的横坐标范围是410～670；纵坐标范围是502～690；时间范围是11:05～18:05。

A、B双方交换彼此拥有的移动轨迹的时空分布范围。

6条移动轨迹数据中横坐标的最小值是410，最大值是670，横坐标范围的跨度是260。6条移动轨迹数据中纵坐标的最小值是502，最大值是690，纵坐标范围的跨度是188。因此，2维几何空间R²＝{(410，670)，(502，690)}。

6条移动轨迹中最早移动轨迹点的产生时间是11:05，最晚移动轨迹点的产生时间是18:55，时间范围的跨度是7:50。因此，时间域T＝{11:05,18:55}。

A、B双方协定：以100m作为1个划分，把横坐标范围分为3个划分，即400作为起点，400～500为划分1，500～600为划分2，600～700为划分3。把纵坐标范围分为2个划分，即500作为起点，500～600为划分1，600～700为划分2。因此，等间隔的划分的几何空间

A、B双方协定：以1分钟作为1个时间格，根据时间分辨率把时间划分为8个时间格，即把11:00作为起点，11:00～12:00作为时间格1,12:00～13:00作为时间格2，…，18:00～19:00作为时间格8。因此，等间隔的划分的时间域DT＝{period·k|1≤k≤8}。

最终，构建的6条移动轨迹所对应的时空格空间为

图形表达如图1所示，其中：空间格的横坐标(X轴)范围为400～700m，空间格的纵坐标(Y轴)范围为500～700m，时间格(T轴)的范围为11～19min。步骤2)将移动轨迹数据与时空格空间进行匹配，得到时空格序列。本实例中，数据拥有者A、B，按照定义3分别将T_a～T_b，T₁～T₄与时空格空间

进行匹配，对应得到6个时空格序列SeSTC_a～SeSTC_b，SeSTC₁～SeSTC₄。

以T_a为例，给出具体的计算过程：

T_a中第一个移动轨迹点[p₁，t₁]中的空间位置p₁＝(410，520)与空间格(col¹，row¹)存在包含关系，也即(400≤410≤500)∧(500≤520≤600)，因此，[p₁]∈(col¹，row¹)。[p₁]∈(col¹，row¹)

T_a中第一个移动轨迹点[p₁，t₁]中的时间点t₁＝11:25与时间段k¹存在包含关系，也即(11:00≤11:15≤12:00)，因此，

因此，T_a中第一个移动轨迹点[p₁，t₁]匹配的时空格为：[(col¹，row¹)，k¹]＝[(1，1)，1]。

同理，对于T_a中其他移动轨迹点[p₂，t₂]＝[(510，520)，12:10]、[p₃，t₃]＝[(530，640)，13:05]，计算得到：[(col²，row¹)，k²]＝[(2，1)，2]，[(col²，row²)，k³]＝[(2，2)，3]，也即：SeSTC_a＝{[(1，1)，1]，[(2，1)，2]，[(2，2)，3]}，图形表达如图2所示，其中：T_a匹配到X轴的范围值1～2是空间格的列编号，T匹配到Y轴的范围值1～2是空间格的行编号，T匹配到T轴的范围值1～3是时间格的编号。

然后，计算得到T_b匹配的时空格序列为：SeSTC_b＝{[(2，1)，3]，[(2，2)，6]，[(3，2)，8]}。

进一步，计算得到T₁～T₄匹配的时空格序列分别为：

SeSTC₁＝{[(1，1)，1]，[(2，1)，2]，[(2，2)，3]}，

SeSTC₂＝{[(1，2)，2]，[(2，2)，5]，[(3，2)，7]}，

SeSTC₃＝{[(1，1)，4]，[(2，1)，5]，[(2，2)，6]}，

SeSTC₄＝{[(2，1)，3]，[(2，2)，4]，[(3，2)，8]}。

步骤3)以时空格序列为单元，将序列中包含的时空格进行合并，对应得到时空格序列字符串。

本实例中，数据拥有者A、B，按照定义4分别将SeSTC_a～SeSTC_b，SeSTC₁～SeSTC₄时空格进行合并，对应得到6时空格序列字符串StrSeSTC_a～StrSeSTC_b，StrSeSTC₁～StrSeSTC₄。

以SeSTC_a为例，给出具体的计算过程：

给定一个时空格序列SeSTC_a＝{[(1，1)，1]，[(2，1)，2]，[(2，2)，3]}

SeSTC_a＝{[(1，1)，1]，[(2，1)，2]，[(2，2)，3]}，对应的时空格序列字符串为

StrSeSTC_a＝(111212223)StrSeSTC_a＝(111212223)。

同理，计算得到SeSTC_b，SeSTC₁～SeSTC₄的时空格序列字符串分别为：

StrSeSTC_b＝(213226328)，

StrSeSTC₁＝(111212223)，

StrSeSTC₂＝(122225327)，

StrSeSTC₃＝(114215226)，

StrSeSTC₄＝(213224328)。

第二阶段：数据拥有的双方将时空格序列字符串映射到Bloom过滤器

步骤4)协定q值参数，采用q-gram的方法将时空格序列字符串，转换成对应的q-gram序列。

本实例中，数据拥有者A、B协定参数q值为3。依照定义5，分别将StrSeSTC_a～StrSeSTC_b，StrSeSTC₁～StrSeSTC₄转换成q-gram序列qStrSeSTC_a～qStrSeSTC_b，qStrSeSTC₁～qStrSeSTC₄。

以StrSeSTC_a为例，给出具体的计算过程：

StrSeSTC_a＝(c₁c₂c_ac₄c₅c₆c₇c₈c₉)，以3-gram的形式进行划分得到的q-gram序列为：qStrSeSTC_a＝(c₁c₂c₃，c₂c₃c₄，c₃c₄c₅，c₄c₅c₆，c₅c₆c₇，c₆c₇c₈，c₇c₈c₉)。

也即：StrSeSTC_a＝(111212223)，对应的q-gram序列为qStrSeSTC_a＝(111，112，121，212，122，222，223)。

同理，计算得到StrSeSTC_b，StrSeSTC₁～StrSeSTC₄的q-gram序列分别为：

qStrSeSTC_b＝(213，132，322，226，263，632，328)，

qStrSeSTC₁＝(111，112，121，212，122，222，223)，

qStrSeSTC₂＝(122，222，222，225，253，532，327)，

qStrSeSTC₃＝(114，142，421，215，152，522，226)，

qStrSeSTC₄＝(213，132，322，224，243，432，328)。

步骤5)协定使用Bloom过滤器的位数组长度、Hash函数的个数及方法。

本实例中，数据拥有者A、B协定使用Bloom过滤器的位数组长度为30bit，Hash函数的个数为2，分别是SHA1和MD5。

步骤6)依据协定的映射方法，将q-gram序列的每个元素映射到Bloom过滤器的位数组中，得到对应的Bloom过滤器。

本实例中，数据拥有者A、B协定依照定义6的映射方法，分别将q-gram序列qStrSeSTC_a～qStrSeSTC_b，qStrSeSTC₁～qStrSeSTC₄映射到Bloom过滤器的位数组中，得到对应的Bloom过滤器bf_a～bf_b，bf₁～bf₄。

qStrSeSTC_a为例，给出具体的计算过程：

qStrSeSTC_a＝(qg₁，qg₂，qg₃，qg₄，qg₅，qg₆，qg₇)

＝(c₁c₂c₃，c₂c₃c₄，c₃c₄c₅，c₄c₅c₆，c₅c₆c₇，c₆c₇c₈，c₇c₈c₉)

＝(111，112，121，212，122，222，223)

h₁、h₂、m分别是SHA1、MD5、30。

对于qg₁＝111，

h₁(qg₁)＝SHA1(111)＝{6216f8a75fd5bb3d5f22b6f9958cdede3fc086c2}，

h₂(qg₁)＝MD5(111)＝{698d51a19d8a121ce581499d7b701668}；

s＝h₁(qg₁)mod 30＝SHA1(111)mod 30＝12，

t＝[h₁(qg₁)+h₂(qg₁)]mod m＝[SHA1(111)+MD5(111)]mod 30＝20。

因此，在bf_a中存在两个元素b₁₂＝b₂₀＝1。

同理，对于qStrSeSTC_a中的qg₂～qg₇，可以计算得到：

b₅＝b₂₈＝1，b₂₁＝b₁₅＝1，b₂₆＝b₁₃＝1，

b₂₆＝b1₃＝1，b₂₉＝b₂₈＝1，b₂₁＝b₂₉＝1。

也即，b₅＝b₁₂＝b₁₃＝b₁₅＝b₂₀＝b₂₁＝b₂₆＝b₂₈＝b₂₉＝1，得到qStrSeSTC_a的Bloom过滤器bf_a＝(000001000000110100001100001011)。

进一步，计算qStrSeSTC_b，qStrSeSTC₁～qStrSeSTC₄，得到对应的Bloom过滤器分别为：

bf_b＝(110111101000000110000010100001)，

bf₁＝(000001000000110100001100001011)，

bf₂＝(100000000001010100000000111111)，

bf₃＝(010001000010010110011000110010)，

bf₄＝(110100101000001110000111100001)。

其中，qStrSeSTC_a、qStrSeSTC₁映射到bf_a、bf₁的图形表达如图3所示。步骤7)将所有Bloom过滤器以及协定的相似度阈值发送给第三方。本实例中，数据拥有者A、B分别将得到Bloom过滤器bf_a～bf_b，bf₁～bf₄，以及双方协定的相似度阈值为0.80发送给第三方。

第三阶段：第三方基于Bloom过滤器进行移动轨迹隐私保护匹配步骤8)第三方计算Bloom过滤器之间的相似系数。

本实例中，按照定义7，计算数据拥有者A、B发送来bf_a～bf_b，bf₁～bf₄之间的相似系数。

以bf_a和bf₁之间的相似系数为例，说明具体的计算过程。

bf_a＝(000001000000110100001100001011)，

bf₁＝(000001000000110100001100001011)，

bf_a中位值为1的位的数量leng_a＝9，bf₁中位值为1的位的数量leng₁＝9，bf_a，bf₁中位值为1的相同位的数量comm(bf_a，bf₁)＝9。

因此，

同理，计算bf_a与bf₂～bf₄之间的相似系数，精确到小数点后两位，得到：

BSim(bf_a，bf₂)≈0.53，

BSim(bf_a，bf₃)＝0.50，

BSim(bf_a，bf₄)≈0.27。

进一步，计算bf_b与bf₁～bf₄之间的相似系数，得到：

BSim(bf_b，bf₁)≈0.29，

BSim(bf_b，bf₂)≈0.36，

BSim(bf_b，bf₃)≈0.43，

BSim(bf_b，bf₄)＝0.80。

该步骤计算过程的图形表达，如图4所示。

步骤9)比较相似系数与设定的相似度阈值，得到满足要求的匹配组。本实例中，第三方将计算的bf_a、bf_b，bf₁～bf₄之间相似系数，与数据拥有者A、B双方协定的相似度阈值0.80比较，得到满足要求的匹配组为：(T_a，T₁)和(T_b，T₄)。

步骤10)第三方将匹配编号发送给数据拥有的双方，双方依据编号彼此交换原始的移动轨迹数据。

本实例中，第三方将匹配组(T_a，T₁)和(T_b，T₄)的编号(α，1)和(b，4)发送数据拥有者A、B双方。数据拥有者A依据编号，将对应的将移动轨迹T_a、T_b发送给数据拥有者B。数据拥有者B依据编号，将对应的将移动轨迹T₁、T₄发送给数据拥有者A。最终，实现匹配移动轨迹数据的交换。该步骤计算过程的图形表达，如图5所示。

Claims

1.一种基于Bloom过滤器的移动轨迹隐私保护匹配方法，其特征在于：所述方法包括以下步骤：

2.如权利要求1所述的一种基于Bloom过滤器的移动轨迹隐私保护匹配方法，其特征在于：所述步骤一中数据拥有的双方基于时空转换的数据预处理的具体步骤如下：

步骤1.3：以时空格序列为单元，将序列中包含的时空格进行合并，对应得到时空格序列字符串。

3.如权利要求1所述的一种基于Bloom过滤器的移动轨迹隐私保护匹配方法，其特征在于：所述步骤二中数据拥有的双方将时空格序列字符串映射到Bloom过滤器的具体步骤如下：

4.如权利要求1所述的一种基于Bloom过滤器的移动轨迹隐私保护匹配方法，其特征在于：所述步骤三中基于Bloom过滤器进行移动轨迹隐私保护匹配的具体步骤如下：

步骤3.1：计算Bloom过滤器之间的相似系数；