CN111506918A - 一种基于Bloom过滤器的移动轨迹隐私保护匹配方法 - Google Patents

一种基于Bloom过滤器的移动轨迹隐私保护匹配方法 Download PDF

Info

Publication number
CN111506918A
CN111506918A CN202010275089.8A CN202010275089A CN111506918A CN 111506918 A CN111506918 A CN 111506918A CN 202010275089 A CN202010275089 A CN 202010275089A CN 111506918 A CN111506918 A CN 111506918A
Authority
CN
China
Prior art keywords
space
time
bloom filter
data
matching
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010275089.8A
Other languages
English (en)
Other versions
CN111506918B (zh
Inventor
张海涛
罗城
陈一祥
吴标兵
乐洋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sinopec Yangzi Petrochemical Co Ltd
Original Assignee
Nanjing University of Posts and Telecommunications
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing University of Posts and Telecommunications filed Critical Nanjing University of Posts and Telecommunications
Priority to CN202010275089.8A priority Critical patent/CN111506918B/zh
Publication of CN111506918A publication Critical patent/CN111506918A/zh
Application granted granted Critical
Publication of CN111506918B publication Critical patent/CN111506918B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/62Protecting access to data via a platform, e.g. using keys or access control rules
    • G06F21/6218Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
    • G06F21/6272Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database by registering files or documents with a third party
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/62Protecting access to data via a platform, e.g. using keys or access control rules
    • G06F21/6218Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
    • G06F21/6245Protecting personal data, e.g. for financial or medical purposes

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Bioethics (AREA)
  • General Health & Medical Sciences (AREA)
  • Computer Hardware Design (AREA)
  • Databases & Information Systems (AREA)
  • Computer Security & Cryptography (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Medical Informatics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提供一种基于Bloom过滤器的移动轨迹隐私保护匹配方法,所述方法包括以下步骤:步骤一:数据拥有的双方基于时空转换进行数据预处理,步骤二:数据拥有的双方将时空格序列字符串映射到Bloom过滤器,步骤三:第三方基于Bloom过滤器进行移动轨迹隐私保护匹配。具有隐私保护性好、计算速度快的优势,把基于原始移动轨迹数据明文的相似度计算,转换成基于Bloom过滤器的计算。转换过程由只具有单向性的Hash散列和求模运算实现,保证原始移动轨迹数据的机密性。基于Bloom过滤器的位值的相似度计算,充分利用Bloom过滤器位值运算的高效性,大大提高相似度计算的速度。

Description

一种基于Bloom过滤器的移动轨迹隐私保护匹配方法
技术领域
本发明涉及时空数据隐私保护集成的技术领域,尤其涉及一种基于Bloom过滤器的移动轨迹隐私保护匹配方法。
背景技术
随着移动通讯技术的快速发展,提供定位服务的智能手机得到了广泛的普及,产生了大量具有时空特性的移动轨迹数据。分析移动轨迹数据从中发现潜在、有价值的移动性规律,对于分析、预测人类或动物的相关行为习惯具有重要的参考价值。
目前众多的针对移动轨迹数据分析应用存在一个十分严重的共性问题:数据的有偏性。也即是,分析应用中通常使用单一来源的移动轨迹数据,很难实现区域内用户的完整活动描述。例如,产生于社交媒体的移动轨迹数据,通常被不同的互联网公司收集、存储,基于这类移动轨迹数据的分析通常无法覆盖该区域内的所有用户(例如,成年用户大多使用腾讯的微信,而青少年更倾向于使用阿里的钉钉)。因此,为保证针对移动轨迹数据分析应用的无偏性,需要对多种来源的移动轨迹数据进行集成分析。
移动轨迹数据集成分析实现的主要手段是:以匹配的移动轨迹数据为对象,以隐含知识和空间关系发现为目标的各类移动轨迹数据挖掘技术(例如:轨迹模式挖掘,轨迹不确定性,异常值检测和分类等)。因此,移动轨迹数据的匹配分析是移动轨迹数据集成分析的基础。传统的移动轨迹匹配方法主要包括直接筛选法和基于移动轨迹相似度的加权匹配法。这些方法虽然具有匹配精度高的优点,但是在匹配过程中会产生隐私泄露的问题:包含个人敏感信息的移动轨迹数据,需要以明文的形式提供给第三方,也即匹配运算会产生用户位置隐私安全问题。
发明内容
本发明的目的是提供一种基于Bloom过滤器的移动轨迹隐私保护匹配方法,通过三个阶段:数据拥有的双方基于时空转换进行数据预处理、数据拥有的双方将时空格序列字符串映射到Bloom过滤器和第三方基于Bloom过滤器进行移动轨迹隐私保护匹配对信息进行保护,具有隐私保护性好、计算速度快的优势,解决了匹配过程中会产生隐私泄露的问题。
本发明提供一种基于Bloom过滤器的移动轨迹隐私保护匹配方法,所述方法包括以下步骤:
步骤一:数据拥有的双方基于时空转换进行数据预处理,首先,依据协定的参数,对原始的移动轨迹数据进行时空划分;然后,基于移动轨迹数据与时空格的匹配得到对应的时空格序列;最后,合并时空格序列得到时空格序列字符串;
步骤二:数据拥有的双方将时空格序列字符串映射到Bloom过滤器,首先,对时空格序列字符串进行q-gram的分组;然后,将所有分组散列映射到Bloom过滤器中;最后,双方将Bloom过滤器发送给第三方;
步骤三:第三方基于Bloom过滤器进行移动轨迹隐私保护匹配,首先,第三方计算Bloom过滤器之间的相似系数;然后,将其与设定的相似度阈值比较,得到满足要求的移动轨迹匹配组;最后,第三方将匹配编号发回给数据拥有的双方,双方依照标识彼此交换原始的移动轨迹数据。
进一步改进在于:所述步骤一中数据拥有的双方基于时空转换的数据预处理的具体步骤如下:
步骤1.1:彼此交换所拥有的移动轨迹的时空分布范围,并协定采用时空等间隔的方法划分双方时空分布范围的并集,构建时空格空间;
步骤1.2:将移动轨迹数据与时空格空间进行匹配,得到时空格序列;
步骤1.3:以时空格序列为单元,将序列中包含的时空格进行合并,
对应得到时空格序列字符串。
进一步改进在于:所述步骤二中数据拥有的双方将时空格序列字符串映射到Bloom过滤器的具体步骤如下:
步骤2.1:协定q值参数,采用q-gram的方法,将时空格序列字符串转换成对应的q-gram序列;
步骤2.2:协定使用Bloom过滤器的位数组长度、Hash函数的个数及方法;
步骤2.3:依据协定的映射方法,将q-gram序列的每个元素映射到Bloom过滤器的位数组中,得到对应的Bloom过滤器;
步骤2.4:将所有Bloom过滤器以及协定的相似度阈值发送给第三方。
进一步改进在于:所述步骤三中基于Bloom过滤器进行移动轨迹隐私保护匹配的具体步骤如下:
步骤3.1:计算Bloom过滤器之间的相似系数;
步骤3.2:比较相似系数与设定的相似度阈值,得到满足要求的匹配组;
步骤3.3:第三方将匹配编号发送给数据拥有的双方,双方依据编号彼此交换原始的移动轨迹数据。
本发明的有益效果:具有隐私保护性好、计算速度快的优势,把基于原始移动轨迹数据明文的相似度计算,转换成基于Bloom过滤器的计算。转换过程由只具有单向性的Hash散列和求模运算实现,保证原始移动轨迹数据的机密性。基于Bloom过滤器的位值的相似度计算,充分利用Bloom过滤器位值运算的高效性,大大提高相似度计算的速度。
附图说明
图1是本发明的数据拥有者A、B包含的6条轨迹数据所对应的时空格空间示意图。
图2是本发明的数据拥有者A中的移动轨迹Ta与图1中的时空格空间进行匹配后,得到的时空格序列SeSTCa示意图。
图3是本发明的数据拥有者A、B中时空格序列字符串StrSeSTCa和StrSeSTC1映射得到的Bloom过滤器示意图。
图4是本发明的第三方基于数据拥有者A、B提供Bloom过滤器的相似系数计算示意图。
图5是本发明的数据拥有者A、B基于第三方提供匹配编号的原始移动轨迹数据交换示意图。
具体实施方式
为了加深对本发明的理解,下面将结合实施例对本发明作进一步详述,该实施例仅用于解释本发明,并不构成对本发明保护范围的限定。
首先,给出几个基本定义:
定义1移动轨迹:记录用户的连续运动的位置的有序列表,定义为TID={[p1,t1],[p2,t2],…,[pn,tn]},t1<t2<…<tn,其中,ID表示移动轨迹的编号,[pi,ti],1≤i≤n表示一个移动轨迹点,pi=(x,y)表示用户在ti时刻所处的空间位置,x,y表示空间位置的横、纵坐标值。
定义2时空格空间:给定一个2维几何空间R2和一个时间域T,其对应的等间隔的划分时空格空间定义为:
Figure BDA0002444485490000051
其中,DR2是对R2的等间隔的划分的几何空间,DT是对T进行等间隔的划分的时间域。[(col,row),k]称为一个时空格,col,row表示时空格在几何空间平面划分中所处的列号、行号,col_count、row_count分别是设定的空间等间隔划分的列数、行数。k表示时空格所在的时间段编号,period_count是设定的时间等间隔划分的数量。
定义3时空格序列:对于一条移动轨迹TID={[p1,t1],[p2,t2],...,[pn,tn]},t1<t2<…<tn和一个时空格空间,
Figure BDA0002444485490000061
TID匹配到STC的时空格序列定义为:
SeSTCID={[(col1,row1),k1],[(col2,row2),k2],…,[(coln,rown),kn]}
其中,ID是时空格序列的编号,它与移动轨迹TID编号一致,对任一时空格[(coli,rowi),ki],1≤i≤n都满足如下条件:pi∈(coli,rowi)pi∈(coli,rowi),也即移动轨迹点的空间位置包含于对应的空间格,而且ti∈kiti∈ki,也即移动轨迹点的时刻包含于对应的时间段。
定义4时空格序列字符串:给定一个时空格序列{[(col1,row1),k1],[(col2,row2),k2],…,[(coln,rown),kn]},其对应的时空格序列字符串为:
StrSeSTCID=(col1row1k1col2row2k2…colnrownkn)
该时空格序列字符串也可简记为:StrSeSTCID=(c1c2c3…c3n),
其中,c3×(i-1)+1=coli、c3×(i-1)+2=rowi、c3×i=ki,i≥1。
定义5时空格序列字符串的q-gram序列:对于一个时空格序列字符串StrSeSTCID=(c1c2c3…c3n),其对应的基于q-gram的分组序列定义为:
qStrSeSTCID=(c1…cq,c2…cq+1,…,c3n-q+1…c3n)
qStrSeSTCID=(c1…cq,c2…cq+1,...,c3n-q+1…c3n),
其中,ID表示时空格序列字符串的q-gram序列的随机编号,qq表示分组的长度,q≥1。
该分组序列也可简记为:qStrSeSTCID=(qg1,qg2,...,qg3n-q+1),
其中,qgi=ci…ci+q-1,1≤i≤(3n-q+1),qgi表示第i个q-gram。
定义6时空格序列字符串的Bloom过滤器:给定一个时空格序列字符串的q-gram分组序列qStrSeSTCID=(qg1,qg2,…,qg3n-q+1),其对应的时空格序列字符串的Bloom过滤器定义为:
bfID={b0b1…bm-1)
其中,ID表示字符串的Bloom过滤器的编号;bi∈{0,1},0≤i≤m-1,m为Bloom过滤器的位数组长度。
对于q-gram序列qStrSeSTCID中的任一元素qgj,1≤j≤(3n-q+1),q≥1,在bfID中存在两个元素bs=bt=1。0≤s,t≤m-1,s=h1(Qgj)mod m,t=[h1(qgj)+h2(qgj)]mod m,h1、h2是两个相互独立的Hash函数,h1(qgj)、h2(qgj)分别是h1、h2对qStrSeSTCID中qgj的散列值。
定义7时空格序列字符串的Bloom过滤器间的相似系数:对于两个时空格序列字符串的Bloom过滤器bfID1和bfID2,其相似系数定义为:
Figure BDA0002444485490000071
其中,0≤BSim(bfID1,bfID2)≤1;comm(bfID1,bfID2)表示Bloom过滤器bfID1,bfID2中位值为1的相同位的数量;lengID1,lengID2分别表示Bloom过滤器bfID1,bfID2中位值为1的位的数量。
第一阶段:数据拥有的双方基于时空转换的数据预处理步骤1)彼此交换所拥有的移动轨迹的时空分布范围,并协定采用时空等间隔的方法划分双方时空分布范围的并集,构建时空格空间。本实例中,数据拥有者A拥有2条移动轨迹,具体数据信息为:
Ta={[(410,520),11:25],[(510,520),12:10],[(530,640),13:05]}
Tb={[(510,510),13:21],[(560,620),16:35],[(620,690),18:55]}
数据拥有者B拥有4条移动轨迹,具体数据信息为:
T1={[(470,530),11:05],[(540,590),12:27],[(580,620),13:43]}
T2={[(440,630),12:25],[(510,690),15:32],[(670,620),17:09]}
T3={[(410,520),14:15],[(510,502),15:10],[(530,640),16:06]}
T4={[(510,520),13:12],[(510,620),14:13],[(630,640),18:05]}
数据拥有者A拥有的移动轨迹的横坐标范围是410~620(精确到m);纵坐标范围是510~690;时间范围是11:25~18:55(精确到s)。数据拥有者B拥有的移动轨迹的横坐标范围是410~670;纵坐标范围是502~690;时间范围是11:05~18:05。
A、B双方交换彼此拥有的移动轨迹的时空分布范围。
6条移动轨迹数据中横坐标的最小值是410,最大值是670,横坐标范围的跨度是260。6条移动轨迹数据中纵坐标的最小值是502,最大值是690,纵坐标范围的跨度是188。因此,2维几何空间R2={(410,670),(502,690)}。
6条移动轨迹中最早移动轨迹点的产生时间是11:05,最晚移动轨迹点的产生时间是18:55,时间范围的跨度是7:50。因此,时间域T={11:05,18:55}。
A、B双方协定:以100m作为1个划分,把横坐标范围分为3个划分,即400作为起点,400~500为划分1,500~600为划分2,600~700为划分3。把纵坐标范围分为2个划分,即500作为起点,500~600为划分1,600~700为划分2。因此,等间隔的划分的几何空间
Figure BDA0002444485490000091
A、B双方协定:以1分钟作为1个时间格,根据时间分辨率把时间划分为8个时间格,即把11:00作为起点,11:00~12:00作为时间格1,12:00~13:00作为时间格2,…,18:00~19:00作为时间格8。因此,等间隔的划分的时间域DT={period·k|1≤k≤8}。
最终,构建的6条移动轨迹所对应的时空格空间为
Figure BDA0002444485490000092
图形表达如图1所示,其中:空间格的横坐标(X轴)范围为400~700m,空间格的纵坐标(Y轴)范围为500~700m,时间格(T轴)的范围为11~19min。步骤2)将移动轨迹数据与时空格空间进行匹配,得到时空格序列。本实例中,数据拥有者A、B,按照定义3分别将Ta~Tb,T1~T4与时空格空间
Figure BDA0002444485490000093
进行匹配,对应得到6个时空格序列SeSTCa~SeSTCb,SeSTC1~SeSTC4
以Ta为例,给出具体的计算过程:
Ta中第一个移动轨迹点[p1,t1]中的空间位置p1=(410,520)与空间格(col1,row1)存在包含关系,也即(400≤410≤500)∧(500≤520≤600),因此,[p1]∈(col1,row1)。[p1]∈(col1,row1)
Ta中第一个移动轨迹点[p1,t1]中的时间点t1=11:25与时间段k1存在包含关系,也即(11:00≤11:15≤12:00),因此,
Figure BDA0002444485490000101
因此,Ta中第一个移动轨迹点[p1,t1]匹配的时空格为:[(col1,row1),k1]=[(1,1),1]。
同理,对于Ta中其他移动轨迹点[p2,t2]=[(510,520),12:10]、[p3,t3]=[(530,640),13:05],计算得到:[(col2,row1),k2]=[(2,1),2],[(col2,row2),k3]=[(2,2),3],也即:SeSTCa={[(1,1),1],[(2,1),2],[(2,2),3]},图形表达如图2所示,其中:Ta匹配到X轴的范围值1~2是空间格的列编号,T匹配到Y轴的范围值1~2是空间格的行编号,T匹配到T轴的范围值1~3是时间格的编号。
然后,计算得到Tb匹配的时空格序列为:SeSTCb={[(2,1),3],[(2,2),6],[(3,2),8]}。
进一步,计算得到T1~T4匹配的时空格序列分别为:
SeSTC1={[(1,1),1],[(2,1),2],[(2,2),3]},
SeSTC2={[(1,2),2],[(2,2),5],[(3,2),7]},
SeSTC3={[(1,1),4],[(2,1),5],[(2,2),6]},
SeSTC4={[(2,1),3],[(2,2),4],[(3,2),8]}。
步骤3)以时空格序列为单元,将序列中包含的时空格进行合并,对应得到时空格序列字符串。
本实例中,数据拥有者A、B,按照定义4分别将SeSTCa~SeSTCb,SeSTC1~SeSTC4时空格进行合并,对应得到6时空格序列字符串StrSeSTCa~StrSeSTCb,StrSeSTC1~StrSeSTC4
以SeSTCa为例,给出具体的计算过程:
给定一个时空格序列SeSTCa={[(1,1),1],[(2,1),2],[(2,2),3]}
SeSTCa={[(1,1),1],[(2,1),2],[(2,2),3]},对应的时空格序列字符串为
StrSeSTCa=(111212223)StrSeSTCa=(111212223)。
同理,计算得到SeSTCb,SeSTC1~SeSTC4的时空格序列字符串分别为:
StrSeSTCb=(213226328),
StrSeSTC1=(111212223),
StrSeSTC2=(122225327),
StrSeSTC3=(114215226),
StrSeSTC4=(213224328)。
第二阶段:数据拥有的双方将时空格序列字符串映射到Bloom过滤器
步骤4)协定q值参数,采用q-gram的方法将时空格序列字符串,转换成对应的q-gram序列。
本实例中,数据拥有者A、B协定参数q值为3。依照定义5,分别将StrSeSTCa~StrSeSTCb,StrSeSTC1~StrSeSTC4转换成q-gram序列qStrSeSTCa~qStrSeSTCb,qStrSeSTC1~qStrSeSTC4
以StrSeSTCa为例,给出具体的计算过程:
StrSeSTCa=(c1c2cac4c5c6c7c8c9),以3-gram的形式进行划分得到的q-gram序列为:qStrSeSTCa=(c1c2c3,c2c3c4,c3c4c5,c4c5c6,c5c6c7,c6c7c8,c7c8c9)。
也即:StrSeSTCa=(111212223),对应的q-gram序列为qStrSeSTCa=(111,112,121,212,122,222,223)。
同理,计算得到StrSeSTCb,StrSeSTC1~StrSeSTC4的q-gram序列分别为:
qStrSeSTCb=(213,132,322,226,263,632,328),
qStrSeSTC1=(111,112,121,212,122,222,223),
qStrSeSTC2=(122,222,222,225,253,532,327),
qStrSeSTC3=(114,142,421,215,152,522,226),
qStrSeSTC4=(213,132,322,224,243,432,328)。
步骤5)协定使用Bloom过滤器的位数组长度、Hash函数的个数及方法。
本实例中,数据拥有者A、B协定使用Bloom过滤器的位数组长度为30bit,Hash函数的个数为2,分别是SHA1和MD5。
步骤6)依据协定的映射方法,将q-gram序列的每个元素映射到Bloom过滤器的位数组中,得到对应的Bloom过滤器。
本实例中,数据拥有者A、B协定依照定义6的映射方法,分别将q-gram序列qStrSeSTCa~qStrSeSTCb,qStrSeSTC1~qStrSeSTC4映射到Bloom过滤器的位数组中,得到对应的Bloom过滤器bfa~bfb,bf1~bf4
qStrSeSTCa为例,给出具体的计算过程:
qStrSeSTCa=(qg1,qg2,qg3,qg4,qg5,qg6,qg7)
=(c1c2c3,c2c3c4,c3c4c5,c4c5c6,c5c6c7,c6c7c8,c7c8c9)
=(111,112,121,212,122,222,223)
h1、h2、m分别是SHA1、MD5、30。
对于qg1=111,
h1(qg1)=SHA1(111)={6216f8a75fd5bb3d5f22b6f9958cdede3fc086c2},
h2(qg1)=MD5(111)={698d51a19d8a121ce581499d7b701668};
s=h1(qg1)mod 30=SHA1(111)mod 30=12,
t=[h1(qg1)+h2(qg1)]mod m=[SHA1(111)+MD5(111)]mod 30=20。
因此,在bfa中存在两个元素b12=b20=1。
同理,对于qStrSeSTCa中的qg2~qg7,可以计算得到:
b5=b28=1,b21=b15=1,b26=b13=1,
b26=b13=1,b29=b28=1,b21=b29=1。
也即,b5=b12=b13=b15=b20=b21=b26=b28=b29=1,得到qStrSeSTCa的Bloom过滤器bfa=(000001000000110100001100001011)。
进一步,计算qStrSeSTCb,qStrSeSTC1~qStrSeSTC4,得到对应的Bloom过滤器分别为:
bfb=(110111101000000110000010100001),
bf1=(000001000000110100001100001011),
bf2=(100000000001010100000000111111),
bf3=(010001000010010110011000110010),
bf4=(110100101000001110000111100001)。
其中,qStrSeSTCa、qStrSeSTC1映射到bfa、bf1的图形表达如图3所示。步骤7)将所有Bloom过滤器以及协定的相似度阈值发送给第三方。本实例中,数据拥有者A、B分别将得到Bloom过滤器bfa~bfb,bf1~bf4,以及双方协定的相似度阈值为0.80发送给第三方。
第三阶段:第三方基于Bloom过滤器进行移动轨迹隐私保护匹配步骤8)第三方计算Bloom过滤器之间的相似系数。
本实例中,按照定义7,计算数据拥有者A、B发送来bfa~bfb,bf1~bf4之间的相似系数。
以bfa和bf1之间的相似系数为例,说明具体的计算过程。
bfa=(000001000000110100001100001011),
bf1=(000001000000110100001100001011),
bfa中位值为1的位的数量lenga=9,bf1中位值为1的位的数量leng1=9,bfa,bf1中位值为1的相同位的数量comm(bfa,bf1)=9。
因此,
Figure BDA0002444485490000141
同理,计算bfa与bf2~bf4之间的相似系数,精确到小数点后两位,得到:
BSim(bfa,bf2)≈0.53,
BSim(bfa,bf3)=0.50,
BSim(bfa,bf4)≈0.27。
进一步,计算bfb与bf1~bf4之间的相似系数,得到:
BSim(bfb,bf1)≈0.29,
BSim(bfb,bf2)≈0.36,
BSim(bfb,bf3)≈0.43,
BSim(bfb,bf4)=0.80。
该步骤计算过程的图形表达,如图4所示。
步骤9)比较相似系数与设定的相似度阈值,得到满足要求的匹配组。本实例中,第三方将计算的bfa、bfb,bf1~bf4之间相似系数,与数据拥有者A、B双方协定的相似度阈值0.80比较,得到满足要求的匹配组为:(Ta,T1)和(Tb,T4)。
步骤10)第三方将匹配编号发送给数据拥有的双方,双方依据编号彼此交换原始的移动轨迹数据。
本实例中,第三方将匹配组(Ta,T1)和(Tb,T4)的编号(α,1)和(b,4)发送数据拥有者A、B双方。数据拥有者A依据编号,将对应的将移动轨迹Ta、Tb发送给数据拥有者B。数据拥有者B依据编号,将对应的将移动轨迹T1、T4发送给数据拥有者A。最终,实现匹配移动轨迹数据的交换。该步骤计算过程的图形表达,如图5所示。

Claims (4)

1.一种基于Bloom过滤器的移动轨迹隐私保护匹配方法,其特征在于:所述方法包括以下步骤:
步骤一:数据拥有的双方基于时空转换进行数据预处理,首先,依据协定的参数,对原始的移动轨迹数据进行时空划分;然后,基于移动轨迹数据与时空格的匹配得到对应的时空格序列;最后,合并时空格序列得到时空格序列字符串;
步骤二:数据拥有的双方将时空格序列字符串映射到Bloom过滤器,首先,对时空格序列字符串进行q-gram的分组;然后,将所有分组散列映射到Bloom过滤器中;最后,双方将Bloom过滤器发送给第三方;
步骤三:第三方基于Bloom过滤器进行移动轨迹隐私保护匹配,首先,第三方计算Bloom过滤器之间的相似系数;然后,将其与设定的相似度阈值比较,得到满足要求的移动轨迹匹配组;最后,第三方将匹配编号发回给数据拥有的双方,双方依照标识彼此交换原始的移动轨迹数据。
2.如权利要求1所述的一种基于Bloom过滤器的移动轨迹隐私保护匹配方法,其特征在于:所述步骤一中数据拥有的双方基于时空转换的数据预处理的具体步骤如下:
步骤1.1:彼此交换所拥有的移动轨迹的时空分布范围,并协定采用时空等间隔的方法划分双方时空分布范围的并集,构建时空格空间;
步骤1.2:将移动轨迹数据与时空格空间进行匹配,得到时空格序列;
步骤1.3:以时空格序列为单元,将序列中包含的时空格进行合并,对应得到时空格序列字符串。
3.如权利要求1所述的一种基于Bloom过滤器的移动轨迹隐私保护匹配方法,其特征在于:所述步骤二中数据拥有的双方将时空格序列字符串映射到Bloom过滤器的具体步骤如下:
步骤2.1:协定q值参数,采用q-gram的方法,将时空格序列字符串转换成对应的q-gram序列;
步骤2.2:协定使用Bloom过滤器的位数组长度、Hash函数的个数及方法;
步骤2.3:依据协定的映射方法,将q-gram序列的每个元素映射到Bloom过滤器的位数组中,得到对应的Bloom过滤器;
步骤2.4:将所有Bloom过滤器以及协定的相似度阈值发送给第三方。
4.如权利要求1所述的一种基于Bloom过滤器的移动轨迹隐私保护匹配方法,其特征在于:所述步骤三中基于Bloom过滤器进行移动轨迹隐私保护匹配的具体步骤如下:
步骤3.1:计算Bloom过滤器之间的相似系数;
步骤3.2:比较相似系数与设定的相似度阈值,得到满足要求的匹配组;
步骤3.3:第三方将匹配编号发送给数据拥有的双方,双方依据编号彼此交换原始的移动轨迹数据。
CN202010275089.8A 2020-04-09 2020-04-09 一种基于Bloom过滤器的移动轨迹隐私保护匹配方法 Active CN111506918B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010275089.8A CN111506918B (zh) 2020-04-09 2020-04-09 一种基于Bloom过滤器的移动轨迹隐私保护匹配方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010275089.8A CN111506918B (zh) 2020-04-09 2020-04-09 一种基于Bloom过滤器的移动轨迹隐私保护匹配方法

Publications (2)

Publication Number Publication Date
CN111506918A true CN111506918A (zh) 2020-08-07
CN111506918B CN111506918B (zh) 2021-03-16

Family

ID=71864069

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010275089.8A Active CN111506918B (zh) 2020-04-09 2020-04-09 一种基于Bloom过滤器的移动轨迹隐私保护匹配方法

Country Status (1)

Country Link
CN (1) CN111506918B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114201695A (zh) * 2021-12-17 2022-03-18 南京邮电大学 一种基于热点网格维度转换的移动轨迹隐私保护匹配方法

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140254612A1 (en) * 2013-03-07 2014-09-11 4Ulab - Agnieszka Piotrowska Method and filter for erasing hidden data
CN104331466A (zh) * 2014-10-31 2015-02-04 南京邮电大学 基于时空邻近搜索的移动轨迹序列模式快速挖掘方法
CN105933121A (zh) * 2016-04-11 2016-09-07 南京邮电大学 一种具有隐私保护功能的服务发现机制实现方法和系统
CN106127075A (zh) * 2016-06-27 2016-11-16 湖南大学 一种云存储环境下基于隐私保护的可搜索加密方法
CN106529336A (zh) * 2016-11-16 2017-03-22 西安电子科技大学 一种基于时空关联性的假轨迹隐私保护方法
CN106716964A (zh) * 2014-09-26 2017-05-24 微软技术许可有限责任公司 用于没有用户跟踪的个人化的隐私保护cookie
CN108734022A (zh) * 2018-04-03 2018-11-02 安徽师范大学 基于三维网格划分的隐私保护轨迹数据发布方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140254612A1 (en) * 2013-03-07 2014-09-11 4Ulab - Agnieszka Piotrowska Method and filter for erasing hidden data
CN106716964A (zh) * 2014-09-26 2017-05-24 微软技术许可有限责任公司 用于没有用户跟踪的个人化的隐私保护cookie
CN104331466A (zh) * 2014-10-31 2015-02-04 南京邮电大学 基于时空邻近搜索的移动轨迹序列模式快速挖掘方法
CN105933121A (zh) * 2016-04-11 2016-09-07 南京邮电大学 一种具有隐私保护功能的服务发现机制实现方法和系统
CN106127075A (zh) * 2016-06-27 2016-11-16 湖南大学 一种云存储环境下基于隐私保护的可搜索加密方法
CN106529336A (zh) * 2016-11-16 2017-03-22 西安电子科技大学 一种基于时空关联性的假轨迹隐私保护方法
CN108734022A (zh) * 2018-04-03 2018-11-02 安徽师范大学 基于三维网格划分的隐私保护轨迹数据发布方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
M. FONTANI ET AL: "Hiding traces of median filtering in digital images", 《IEEE》 *
刘彦 等: "位置大数据中一种基于Bloom Filter的匿名保护方法", 《计算机科学》 *
王璐 等: "位置大数据隐私保护研究综述", 《软件学报》 *
邓密文: "LBS中位置隐私保护关键技术分析与方案探究", 《网络安全技术与应用》 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114201695A (zh) * 2021-12-17 2022-03-18 南京邮电大学 一种基于热点网格维度转换的移动轨迹隐私保护匹配方法
CN114201695B (zh) * 2021-12-17 2022-10-21 南京邮电大学 一种基于热点网格维度转换的移动轨迹隐私保护匹配方法

Also Published As

Publication number Publication date
CN111506918B (zh) 2021-03-16

Similar Documents

Publication Publication Date Title
Hao et al. Towards efficient and privacy-preserving federated deep learning
Qi et al. Time-aware distributed service recommendation with privacy-preservation
Zhao et al. Synthesizing privacy preserving traces: Enhancing plausibility with social networks
Primault et al. Time distortion anonymization for the publication of mobility data with high utility
Erdemir et al. Privacy-aware time-series data sharing with deep reinforcement learning
CN110768936B (zh) 隐私数据的上报方法、装置与存储介质
CN107222851A (zh) 一种利用差分隐私保护Wifi Fingerprint室内定位系统隐私的方法
Qu et al. Generative adversarial networks enhanced location privacy in 5G networks
CN111506918B (zh) 一种基于Bloom过滤器的移动轨迹隐私保护匹配方法
Dwork 14 Differential Privacy: A Cryptographic Approach to Private Data Analysis
CN110502919B (zh) 一种基于深度学习的轨迹数据去匿名方法
Zhang et al. Locmia: Membership inference attacks against aggregated location data
CN113688408A (zh) 一种基于安全多方计算的最大信息系数方法
CN116415079A (zh) 一种隐私保护的top-K轨迹相似性查询方法
Han et al. PCFed: Privacy-enhanced and communication-efficient federated learning for industrial IoTs
Hung et al. A regression-based approach for mining user movement patterns from random sample data
CN114884682A (zh) 基于自适应本地差分隐私的群智感知数据流隐私保护方法
CN111539023B (zh) 一种基于多次迭代过滤的移动轨迹数据隐私保护匹配方法
Liu et al. Distributed incomplete pattern matching via a novel weighted bloom filter
CN110457940B (zh) 一种基于图论和互信息量的差分隐私度量方法
Liu et al. Machine learning-based similarity attacks for chaos-based cryptosystems
Ning et al. Allocation of carbon quotas with local differential privacy
Ren et al. DPCrowd: Privacy-preserving and communication-efficient decentralized statistical estimation for real-time crowdsourced data
CN107886463B (zh) 一种基于Chen系统和细胞自动机的数字图像加密方法
CN108111968B (zh) 一种基于泛化的位置隐私保护方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20211229

Address after: 210000 No. 28, Gaoke 1st Road, Jiangbei new area, Nanjing, Jiangsu

Patentee after: SINOPEC YANGZI PETROCHEMICAL Co.,Ltd.

Address before: 210023 no.30-06 GuangYue Road, Qixia street, Qixia District, Nanjing City, Jiangsu Province

Patentee before: NANJING University OF POSTS AND TELECOMMUNICATIONS