CN114201695A - 一种基于热点网格维度转换的移动轨迹隐私保护匹配方法 - Google Patents
一种基于热点网格维度转换的移动轨迹隐私保护匹配方法 Download PDFInfo
- Publication number
- CN114201695A CN114201695A CN202111550522.5A CN202111550522A CN114201695A CN 114201695 A CN114201695 A CN 114201695A CN 202111550522 A CN202111550522 A CN 202111550522A CN 114201695 A CN114201695 A CN 114201695A
- Authority
- CN
- China
- Prior art keywords
- emb
- stt
- grid
- space
- track
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9537—Spatial or temporal dependent retrieval, e.g. spatiotemporal queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Image Analysis (AREA)
Abstract
一种基于热点网格维度转换的移动轨迹隐私保护匹配方法,包括如:基于移动轨迹空间范围的空间编码、基于轨迹点计数统计的热点网格发现、基于热点网格的多维度空间构建和权重计算、移动轨迹数据的嵌入编码、基于嵌入编码的轨迹匹配计算、基于匹配结果的移动轨迹数据交换。本方法移动轨迹基于编码网格进行映射,可以快速筛选出轨迹点频繁分布的热点网格,保证了空间匹配计算的高效性;保证了空间匹配计算的准确性,使转换后的数据仍保持了原有数据的空间拓扑邻近性;原始空间到嵌入空间的映射转换不可逆,保证了空间匹配计算的安全性。
Description
技术领域
本发明涉及时空数据隐私保护技术研究领域,具体是涉及一种基于热点网格维度转换的移动轨迹隐私保护匹配方法。
背景技术
随着移动计算、无线通信、地理信息系统等技术的发展与相互融合,基于位置的服务成为多学科领域研究的热点。位置服务的各种移动通讯设备产生了大量具有时空特性的移动轨迹数据。利用大数据技术对大量的移动轨迹数据进行分析,可以发现一系列的个体行为习惯和群体行为模式,从而可为城市交通、规划等众多行业应用提供一定的辅助决策。但是,目前对于移动轨迹数据的分析应用存在一个共性问题:数据的有偏性。也即,单一的数据来源很难实现对区域内用户完整活动的描述。因此,对多源异构的移动轨迹数据进行有效集成,成为移动轨迹数据挖掘分析的关键技术。
但是,近年来随着人们对于位置隐私保护的关注,国内外先后出台了一系列针对个人位置隐私保护的系列法律法规。例如,2016年欧盟新通过的数据保护法案《通用数据保护指令》,以及2021年8月20日我国新颁布的《中华人民共和国个人信息保护法》等。因此,大批量的移动轨迹数据的集成分析,必须首先处理好个人隐私问题。由于传统的直接基于去标识和假名替换的方法,会存在基于轨迹数据地理场景分析的重标识攻击问题。基于隐私保护的匹配技术成为目前的一个主流实现方法。数据交换双方可以通过隐私保护的匹配计算,只交换各自已匹配的数据,从而避免因关联分析带来的重标识攻击问题。传统的移动轨迹匹配方法主要包括直接筛选法和基于移动轨迹相似度的加权匹配法。这些方法虽然具有匹配精度高的优点,但是在匹配过程中同样会产生隐私泄露的问题。即在进行匹配时,需要以明文的形式将移动轨迹数据提供给第三方。因此,不可靠的第三方势必引发用户位置隐私泄露的问题。
发明内容
针对上述背景技术中存在的问题,本发明提供一种不依赖第三方的基于热点网格维度转换的移动轨迹隐私保护匹配方法。
一种基于热点网格维度转换的移动轨迹隐私保护匹配方法,包括如下步骤:
步骤1,基于移动轨迹空间范围的空间编码;基于数据交换双方的移动轨迹数据集的二维空间范围,进行等间隔空间网格划分与网格编码,并且进行时间分段离散;
步骤2,基于轨迹点计数统计的热点网格发现;对数据双方落在每个网格中的轨迹点数进行统计,选择轨迹点数最多的网格作为热点网格;
步骤3,基于热点网格的多维度空间构建和权重计算;根据热点网格的轨迹点计数计算各自权重,并将所有热点网格的编码、中心坐标、权重等以热点网格集合的形式表示;
步骤4,移动轨迹数据的嵌入编码;基于热点网格集合,将所有移动轨迹数据嵌入多维度空间中,以嵌入值和时间序列的形式表示;
步骤5,基于嵌入编码的轨迹匹配计算;数据双方交换嵌入后的移动轨迹数据,并基于时间序列和对应嵌入值的差值得到匹配的移动轨迹和子轨迹的集合;
步骤6,基于匹配结果的移动轨迹数据交换;数据双方将匹配成功的移动轨迹和子轨迹集合发送给对方,完成隐私保护匹配的轨迹数据交换。
进一步地,步骤1中,空间网格划分为,给定二维平面空间范围:
SE2={xmin,xmax,ymin,ymax}
其中,SE2的左上、右上、左下,右下四个边角点的坐标分别为,l1=(xmin,ymax),l2=(xmax,ymax),l3=(xmin,ymin),l4=(xmax,ymin);对SE2采用等间隔的空间划分,得到系列空间网格组成的空间网格集合DR2={M1×1,M1×2,...,Mm×n},其中, Δx表示网格在横轴方向的长,Δy表示网格在竖轴方向的长,m表示网格的行号,n表示网格的列号。
进一步地,步骤1中,时间分段离散为,给定时间范围TE={st,et},其中,st,et分别表示开始时间和结束时间,对TE采用等间隔时间分段离散,得到系列时间段集合DT={T1,T2,...,Tk},其中, Δt表示时间间隔,k表示时间段的编号。
进一步地,步骤2中,数据交换双方将其移动轨迹数据转化为基于空间网格划分与时间段集合,即时空离散空间表达,并通过对计算落在各网格的轨迹点数量,即空间网格的轨迹点计数统计,从而发现热点网格。
进一步地,移动轨迹的时空离散空间表达为,给定一条移动轨迹TID={[p1,t1],[p2,t2],...,[pn,tn]},t1<t2<,...<tn,其中,ID表示移动轨迹的编号,[pi,ti],1≤i≤n表示一个移动轨迹点,pi=(x,y)表示用户在ti时刻所处的空间位置,x,y表示空间位置的横、纵坐标值,则TID在空间网格划分集合DR2以及时间分段离散集合DT中的时空离散表达为:STTID=[M1,p1,T1],[M2,p2,T2],...,[Mm,Pm,Tk],对于其中的任一元素[Mj,pj,Ts],1≤j≤m,1≤s≤k,都满足条件:pi∈Mj,且ti∈Ts,1≤i≤n。
进一步地,热点网格为,给定空间网格计数矩阵,其行数和列数与空间网格集合DR2相同,且其每个元素cdri×j只与一个空间网格Mi×j对应,记作CountDR;其中,cdri×j用Count(STTs,Mi×j)表示,即移动轨迹STTs的轨迹点落在网格Mi×j中的数量;给定一个阈值θ,对矩阵CountDR的所有元素进行排序,选择其数值最大的θ个值;其中,若可选元素大于θ,则先选定较大者,较小者进行随机选择;选定的θ个网格称为热点网格,记为HM。
进一步地,步骤3中,将热点网格以热点网格集合的形式表示,并根据步骤2求得空间网格统计矩阵中的对应元素值计算热点网格权重;
热点网格权重为,给定空间网格划分集合DR2={M1,M2,...,Mn}、时空离散表达移动轨迹集合STTs={STT1,STT2,...,STTn}以及空间网格计数矩阵CountDR,如果DR2中的热点网格集合为HMs={HM1,HM2,...,HMk},1≤k≤n,则对于HMs中任一元素HMi,1≤i≤k,其权重为:
进一步地,步骤4中,数据双方各自计算其移动轨迹点在热点网格构成的多维度空间中的嵌入值,并将移动轨迹数据以嵌入形式进行表达;
移动轨迹的热点网格嵌入为,给定时空离散表达移动轨迹集合STTs={STT1,STT2,...,STTn},及其支持的热点网格集合HMs={HM1,HM2,...,HMm},对于STTs中的一条移动轨迹STTi,其包含的轨迹点[M,p,T],在热点网格集合HMs元素构成m维空间中的嵌入值为:
其中,Distance(HMi,p)是轨迹点所处位置与热点网格HMi的欧式距离;
对于STTi=[M1,p1,T1],[M2,p2,T2],...,[Mm,Pm,Tk],其基于嵌入值的表达为:Emb_STTi={Emb(HMs,[M1,p1,T1]),Emb(HMs,[M2,p2,T2]),…,{Emb(HMs,[Mm,pm,Tk])}。
进一步地,步骤5中,数据双方交换其嵌入表达的移动轨迹数据,协定轨迹点嵌入值的差值阈值σ,移动轨迹的匹配度阈值τ,并进行匹配计算;
移动轨迹嵌入值的匹配计算为,给定两条基于嵌入值表达的移动轨迹:
Emb_STTA={Emb1,Emb2,...,Embn}
Emb_STTB={Emb1,Emb2,...,Embm}
对于Emb_STTA、Emb_STTB中的时间序列相同的元素Emb_STTA·Embi、Emb_STTB·Embj,1≤i≤m,1≤j≤n,如果其差值|Emb_STTA·Embi-Emb_STTB·Embj|不超过自定义阈值σ,也即|Emb_STTA·Embi-Emb_STTB·Embj|≤σ,则称嵌入值Emb_STTA·Embi与嵌入值Emb_STTB·Embj匹配;
在所有匹配成功的嵌入值中,统计其中时间段相邻的嵌入值对,将Emb_STTA与Emb_STTB匹配轨迹点对的时间段数量定义为:
Match_Count(Emb_STTA,Emb_STTB)
将Emb_STTA与Emb_STTB的匹配度定义为:
如果匹配度值不小于自定义阈值τ,即:
Match_Degree(Emb_STTA-Emb_STTB)≥τ
则称Emb_STTA与Emb_STTB匹配。
本发明的有益效果是:
(1)高效性:移动轨迹基于编码网格进行映射,保证了空间匹配计算的高效性。将移动轨迹数据进行的空间网格划分和时间分段离散,可以快速筛选出轨迹点频繁分布的热点网格,进一步,以热点网格为基准,将移动轨迹嵌入一个独特的空间,并以次转换简化后的数据进行匹配计算,保证了空间匹配计算的高效性。
(2)准确性:嵌入空间基于空间拓扑邻近性的保持特性,保证了空间匹配计算的准确性。移动轨迹数据嵌入计算过程中,使用轨迹点与热点网格空间的欧氏距离,使转换后的数据仍保持了原有数据的空间拓扑邻近性,保证了空间匹配计算的准确性。
(3)安全性:原始空间到嵌入空间的映射转换不可逆,保证了空间匹配计算的安全性。双方的轨迹匹配在经转换后的嵌入空间中进行,双方无法均不能进行原始数据的反推计算,充分保证了双方数据的隐私机密性以及空间匹配计算的安全性。
附图说明
图1为本发明实施例中的移动轨迹隐私保护匹配方法流程图。
图2为本发明实施例中的A方空间范围及移动轨迹分布图。
图3为本发明实施例中的B方空间范围及移动轨迹分布图。
图4为本发明实施例中的A、B双方基于交换的空间范围得到的编码空间网格。
图5为本发明实施例中的A方移动轨迹空间网格中分布。
图6为本发明实施例中的B方移动轨迹空间网格中分布。
图7为本发明实施例中的A、B双方成功匹配的移动轨迹数据分布图。
具体实施方式
下面结合说明书附图对本发明的技术方案做进一步的详细说明。
首先,给出几个基本定义:
定义1,空间网格划分:给定二维平面空间范围SE2={xmin,xmax,ymin,ymax},其中,SE2的左上、右上、左下,右下四个边角点的坐标分别为,l1=(xmin,ymax),l2=(xmax,ymax),l3=(xmin,ymin),l4=(xmax,ymin)。对SE2采用等间隔的空间划分,得到系列空间网格组成的空间网格集合DR2={M1×1,M1×2,...,Mm×n},其中,Δx表示网格在横轴方向的长,Δy表示网格在竖轴方向的长,m表示网格的行号,n表示网格的列号。
定义2,时间分段离散:给定时间范围TE={st,et},其中,st,et分别表示开始时间和结束时间,对TE采用等间隔时间分段离散,得到系列时间段集合DT={T1,T2,...,Tk},其中, Δt表示时间间隔,k表示时间段的编号。
定义3,移动轨迹的时空离散表达。
:给定一条移动轨迹TID={[p1,t1],[p2,t2],...,[pn,tn]},t1<t2<…<tn,其中,ID表示移动轨迹的编号,[pi,ti],1≤i≤n表示一个移动轨迹点,pi=(x,y)表示用户在ti时刻所处的空间位置,x,y表示空间位置的横、纵坐标值,则TID在空间网格划分集合DR2以及时间分段离散集合DT中的时空离散表达为:
STTID=[M1,p1,T1],[M2,p2,T2],...,[Mm,Pm,Tk],对于其中的任一元素[Mj,pj,Ts],1≤j≤m,1≤s≤k,都满足条件:pi∈Mj,且ti∈Ts,1≤i≤n。
定义4,热点网格:给定空间网格计数矩阵,其行数和列数与空间网格集合DR2相同,且其每个元素cdri×j只与一个空间网格Mi×j对应,记作CountDR。其中,cdri×j可以用Count(STTs,Mi×j)表示,即移动轨迹STTs的轨迹点落在网格Mi×j中的数量。
给定一个阈值θ,对矩阵CountDR的所有元素进行排序,选择其数值最大的θ个值。其中,若可选元素大于θ,则先选定较大者,较小者进行随机选择。选定的θ个网格称为热点网格,记为HM。
定义5,热点网格权重:给定空间网格划分集合DR2={M1,M2,...,Mn}、时空离散表达移动轨迹集合STTs={STT1,STT2,...,STTn}以及空间网格计数矩阵CountDR,如果DR2中的热点网格集合为HMs={HM1,HM2,...,HMk},1≤k≤n,则对于HMs中任一元素HMi,1≤i≤k,其权重为:
定义6,移动轨迹的热点网格嵌入:给定时空离散表达移动轨迹集合STTs={STT1,STT2,...,STTn},及其支持的热点网格集合HMs={HM1,HM2,...,HMm},对于STTs中的一条移动轨迹STTi,其包含的轨迹点[M,p,T],在热点网格集合HMs元素构成m维空间中的嵌入值为:
其中,Distance(HMi,p)是轨迹点所处位置与热点网格HMi的欧式距离。
对于STTi=[M1,p1,T1],[M2,p2,T2],...,[Mm,Pm,Tk],其基于嵌入值的表达为:Emb_STTi={Emb(HMs,[M1,p1,T1]),Emb(HMs,[M2,p2,T2]),…,{Emb(HMs,[Mm,pm,Tk])}。
定义7,移动轨迹嵌入值的匹配:给定两条基于嵌入值表达的移动轨迹Emb_STTA={Emb1,Emb2,...,Embn}、Emb_STTB={Emb1,Emb2,...,Embm},其中,对于时间序列相同的元素Emb_STTA.Embi和Emb_STTB.Embj,如果满足 则定义Emb_STTA与Emb_STTB时间序列相同轨迹点的数量为时间匹配值,记作T_count。
对于Emb_STTA、Emb_STTB中的时间序列相同的元素Emb_STTA·Embi、Emb_STTB·Embj,1≤i≤m,1≤j≤n,如果其差值|Emb_STTA·Embi-Emb_STTB·Embj|不超过自定义阈值σ,也即:|Emb_STTA·Embi-Emb_STTB·Embj|≤σ,则称嵌入值Emb_STTA·Embi与嵌入值Emb_STTB·Embj匹配。
在所有匹配成功的嵌入值中,统计其中时间段相邻的嵌入值对,将Emb_STTA与Emb_STTB匹配轨迹点对的时间段数量定义为:
Match_Count(Emb_STTA,Emb_STTB)
进一步,将Emb_STTA与Emb_STTB的匹配度定义为:
如果匹配度值不小于自定义阈值τ,也即Match_Degree(Emb_STTA-Emb_STTB)≥τ,则称Emb_STTA与Emb_STTB匹配。
操作步骤:
步骤1,基于移动轨迹空间范围的空间编码。
数据双方交换其移动轨迹数据的时空分布,协定时空离散的参数,并依据定义1、2各自进行空间网格划分与时间分段离散。
本实施例中,A、B双方由各自移动轨迹的空间分布确定其移动轨迹集合所在的最小二维时空范围。
S11、A方计算其移动轨迹数据的最小时空范围。
A方移动轨迹有5条,分别为Ta1,Ta2,Ta3,Ta4,Ta5,其具体时空分布如下:
由上式时空分布可知,A方移动轨迹集合所处最小时空范围为SE12={-10.14,11.82,-11.37,14.74,},其轨迹分布及空间范围如图2所示,其时间范围为TE1={1,5}。
S12、B方计算其移动轨迹数据的最小时空范围。
B方移动轨迹有5条,分别为Tb1,Tb2,Tb3,Tb4,Tb5,其具体时空分布如下:
Tb3={[(6.18,2.56),1],[(2,6),2],[(4,8),3],[(6,11),4],[(8,14),5]}
由上式移动轨迹时空分布可知,B方移动轨迹最小时空范围为SE22={-5.17,11,-11.37,14},其移动轨迹分布及空间范围如图3所示,其时间范围为TE2={1,5}。
S13、空间网格划分及时间段离散。
双方交换各自时空范围SE22和时间范围TE2,协定数据交换双方的移动轨迹二维空间范围为SE2={-15,15,-15,15},时间范围TE=[1,5],并协定空间网格划分参数为,将空间范围划分成6行6列,36个网格;时间段离散参数为,将时间范围等间隔划分成5个时间段。
接着,进行空间网格划分,可以得到一个空间网格集合DR2={M1×1,M1×2,...,M6×6},其包含6行6列共36个网格,其中,M1×1=M1×2=,...,M6×6=(5,5)。A、B双方基于交换的空间范围得到的编码空间网格如图4所示。
进一步,对时间范围TE进行时间分段离散,得到时间段集合DT={T1,T2,…,T5},其中,T1=(0,1],T2=(1,2],T3=(2,3],T4=(3,4],T5=(4,5]。数据交换上方接下来将基于如上空间网格及时间段集合进行计算。
步骤2,基于轨迹点计数统计的热点网格发现。
数据交换双方依据定义3、4,将其移动轨迹数据转化为基于空间网格划分与时间段集合,即时空离散空间表达,并通过对计算落在各网格的轨迹点数量,即空间网格的轨迹点计数统计,从而发现热点网格。
在本实施例中,数据交换双方首先基于步骤1协定的空间网格及时间段集合,分别将各自的移动轨迹数据转化为时空离散空间下表达。
S21、移动轨迹时空离散表达。
对A方数据进行转化,将其5条移动轨迹放于网格如图5所示。
对于第一条移动轨迹Ta1,首先转化时间T1的轨迹点[(-10.14,14.74),1],其所处网格为M1×1;时间T2的轨迹点[(-4.17,13.41),2]所处网格为M1×3;时间T3的轨迹点[(-3.43,9.36),3]所处网格为M2×3;时间T4的轨迹点[(-4.35,3.26),4]所处网格为M3×3;时间T5的轨迹点[(-2.41,2.07),5]所处网格为M3×3。综上,移动轨迹Ta1转化后的表示为:
STTa1=
{[M1×1,(-10.14,14.74),T1],[M1×3,(-4.17,13.41),T2],[M2×3,(-3.43,9.36),T3],[M3×3,(-4.17,13.41),T4],[M3×3,(-2.41,2.07),T5]}
进一步,对A方其余4条移动轨迹Ta2,Ta3,Ta4,Ta5进行时空离散转换,结果如下,结果如下:
STTa2={[M3×3,(-0.09,1.04),T1],[M3×3,(-0.53,1.22),T2],[M4×3,(
-2.48,-1.39),T3],[M4×2,(-5.17,
-1.48),T4],[M5×2,(-6.37,-5.73),T5]}
STTa3={[M3×5,(6.18,2.56),T1],[M3×4,(3.08,2.76),T2],
[M2×4,(1.44,5.15),T3],[M3×4,(1.97,1.63),T4],[M3×4,(2.25,0.05),T5]}
STTa4={[M4×3,(-4.84,-4.52),T1],[M4×3,(-2.24,
-3.15),T2],[M4×4,(2.3,-3.09),T3],[M4×4,(3.23,
-3.27),T4],[M4×4,(1.18,-0.23),T5]}
STTa5={[M6×4,(1.65,-11.37),T1],[M5×4,(3.06,
-5.38),T2],[M5×5,(6.69,-7.48),T3],[M4×5,(8.24,
-0.21),T4],[M5×6,(11.82,-8.16),T5]}
同理,对B方的5条移动轨迹Tb1,Tb2,Tb3,Tb4,Tb5进行时空离散转换,其5条移动轨迹在网格中的位置分布如图6所示,转换结果如下:
STTb1
={[M1×4,(2.14,11.74),T1],[M1×3,(-2.5,11),T2],[M2×3,(-3.43,7.36),T3],[M3×3,(-4.35,3.26),T4],[M3×3,(-2.41,2.07),T5]}
STTb2
=[M3×3,(-0.09,1.04),T1],[M3×3,(-2.53,0.2),T2],[M4×3,(-3.9,
-0.1),T3],[M4×2,(-5.17,-1.48),T4],[M3×3,(-4.5,1),T5]}STTb3
=[M3×5,(6.18,2.56),T1],[M2×4,(2,6),T2],[M2×4,(4,8),T3],[M1×5,(6,11),T4],[M1×5,(8,14),T5]}
STTb4=[M4×3,(-4.84,-4.52),T1],[M4×3,(-3,3),T2],[M4×3,(-1.5,
-1),T3],[M4×4,(-0.2,1),T4],[M3×3,(1.18,-0.23),T5]}
STTb5=[M6×4,(1.65,-11.37),T1],[M5×4,(3.06,
-5.38),T2],[M5×5,(6.69,-7.48),T3],[M4×5,(8.24,
-0.21),T4],[M3×6,(11,1),T5]}
S22、计数矩阵计算。
首先,为A方定义一个空间网格计数矩阵CountDRA,并令其初始化为6行6列的0矩阵,其值为:
进一步,对A方时空离散表达的5条移动轨迹依次进行遍历。
对于ID为a1的轨迹STTa1的时间T1轨迹点[M1×1,(-10.14,14.74),T1],其所处网格为M1×1,令元素cdra1×1数值加1,则计数矩阵CountDRA的值更新为
对于时间T2轨迹点[M1×3,(-4.17,13.41),T2],其所处网格为M1×3,令元素cdra1×3数值加1,则计数矩阵CountDRA的值更新为
重复以上步骤,直到轨迹STTa1的轨迹点遍历结束,此时计数矩阵CountDRA的值更新为
同理,继续对其余4条轨迹STTa1,STTa1,STTa1,STTa1进行遍历,得到A方轨迹点计数矩阵CountDRA的值最终为
S23、同理,求得B方空间网格计数矩阵CountDRB的值为
最后,双方交换计数矩阵,进行相加,得到共享计数矩阵CountDR,记作:
S24、热点网格发现。
双方协定热点值θ=5,并对CountDR的非零元素进行排序,即
cdr3×3=10>cdr4×3=7>cdr4×4=4>cdr2×4=cdr3×4=3>
cdr1×3=cdr1×5=cdr2×3=cdr3×5=cdr4×2=cdr4×5=cdr5×4=
cdr5×5=cdr6×4=2>cdr1×1=cdr1×4=cdr3×6=cdr5×2=
cdr5×6=1。
选择5个最大值,即cdr3×3=10,cdr4×3=7,cdr4×4=4,cdr2×4,cdr3×4=3,故可以确定5个热点网格,记作HM1=M3×3,HM2=M4×3,HM3=M4×4,HM4=M2×4,HM5=M3×4。
步骤3,基于热点网格的多维度空间构建和权重计算。
数据双方依据定义5,将热点网格以热点网格集合的形式表示,并根据步骤2求得空间网格统计矩阵中的对应元素值计算热点网格权重。
在本实施例中,首先将热点网格以热点网格集合的形式表达。
S31、热点网格以集合表示。
以网格的中心点坐标作为该网格的空间位置,记作place.HM。则热点网格集合为HMs={HM1,HM2,HM3,HM4,HM5}。其中,
HM1=M3×3,Count(STTs,HM1)=cdra3×3=10,place.HM1=(-2.5,2.5);
HM2=M4×3,Count(STTs,HM2)=cdra3×3=7,place.HM2=(-2.5,-2.5);
HM3=M4×4,Count(STTs,HM3)=cdra3×3=4,place.HM3=(2.5,-2.5);
HM4=M2×4,Count(STTs,HM4)=cdra3×3=3,place.HM4=(2.5,7.5);
HM5=M3×4,Count(STTs,HM5)=cdra3×3=3,place.HM5=(2.5,2.5)。
S32、计算热点网格权重。
步骤4,移动轨迹数据的嵌入编码。
数据双方依据定义6,各自计算其移动轨迹点在热点网格构成的多维度空间中的嵌入值,并将移动轨迹数据以嵌入形式进行表达。
在本实施例中,依次将A、B双方的10条移动轨迹,基于热点网格集合HM1与其对应的热点网格权重Weigh(HMi)嵌入至热点网格空间中。
S41、首条轨迹嵌入值计算及表达。
首先对A方ID为a1的轨迹STTa1进行嵌入计算。对于时间T1轨迹点[M1×1,(-10.14,14.74),T1],m=5,T=T1,M=M1×1,p=(-10.14,14.74),则对其嵌入表达Emb(HMs,[M,p,T])的计算过程如下:
则有轨迹点[M1×1,(-10.14,14.74),T1]的对应嵌入值为Emb(HMs,[M1×1,(-10.14,14.74),T1])=[16.99,T1]。
同理,可以得到:
Emb(HMs,[M1×3,(-4.17,13.41),T2])=[13.22,T2]
Emb(HMs,[M2×3,(-3.43,9.36),T3])=[7.63,T3]
Emb(HMs,[M3×3,(-4.17,13.41),T4])=[5.30,T4]
Emb(HMs,[M3×3,(-2.41,2.07),T5])=[3.70,T5]
综上,可以得到时空离散表达移动轨迹STT1的嵌入表达为Emb_STTa1={[16.99,T1],[13.22,T2],[7.63,T3],[5.30,T4],[3.70,T5]}。
S42、A方轨迹嵌入。
同理,可以得到A方另4条移动轨迹的嵌入表达如下:
Emb_STTa2={[3.91,T1],[3.81,T2],[4.31,T3],[5.93,T4],[9.17,T5]}
Emb_STTa3={[8.39,T1],[5.45,T2],[5.75,T3],[4.65,T4],[4.85,T5]}
Emb_STTa4={[7.35,T1],[5.09,T2],[5.86,T3],[6.50,T4],[4.41,T5]}
Emb__STTa5
={[12.85,T1],[7.92,T2],[11.62,T3],[9.64,T4],[15.81,T5]}
S43、B方轨迹嵌入。
同理,可以求得B方移动轨迹的嵌入表达如下:
Emb_STTb1={[11.34,T1],[10.57,T2],[7.63,T3],[5.30,T4],[3.70,T5]}
Emb_STTb2={[3.91,T1],[3.99,T2],[4.69,T3],[5.93,T4],[4.99,T5]}Emb_STTb3={[8.39,T1],[6.45,T2],[8.75,T3],[12.24,T4],[15.79,T5]}
Emb_STTb4={[7.35,T1],[5.22,T2],[4.07,T3],[3.88,T4],[4.41,T5]}
Emb__STTb5
={[12.85,T1],[7.92,T2],[11.62,T3],[9.64,T4],[12.16,T5]}
步骤5,基于嵌入编码的轨迹匹配计算。
数据双方交换其嵌入表达的移动轨迹数据,协定轨迹点嵌入值的差值阈值σ,移动轨迹的匹配度阈值τ,并依据定义7进行匹配计算。
在本实施例中,基于A方数据依次进行匹配计算,即依次对A方嵌入表达的5条移动轨迹进行匹配计算。其中,每次匹配需要与B方嵌入表达的5条移动轨迹进行一一匹配,直至出现达到匹配条件的对象。同时,要求B方匹配成功的移动轨迹不再参加后续的匹配计算。
S51、首先双方协定轨迹点嵌入值的差值阈值σ=0.2,及移动轨迹的匹配度阈值τ=0.6。
S52、第一对轨迹匹配
对
Emb_STTa1={[16.99,T1],[13.22,T2],[7.63,T3],[5.30,T4],[3.70,T5]}
和
Emb_STTb1={[11.34,T1],[10.57,T2],[7.63,T3],[5.30,T4],[3.70,T5]}
两条轨迹进行匹配,计算其时间匹配值,由于Emb_STTa1.Emb1.T=Emb_STTb1.Emb1.T=T1,则两条轨迹时间T1的轨迹点满足时间匹配。重复计算,可以得到两轨迹在时间T2,T3,T4和T5的轨迹点满足时间匹配,即得到时间匹配值为T_count(Emb_STTa1,Emb_STTb1)=5。
进一步,对时间T1至T5的轨迹点嵌入值求差,对于时间T1,由于|Emb_STTA·Emb1-Emb_STTB·Emb1|=5.65>σ=0.2,则时间T1轨迹点不匹配。
同理,对其他时间序列轨迹点进行匹配计算得到:
|Emb_STTa1·Emb2-Emb_STTb1·Emb2|=2.65>σ
|Emb_STTa1·Emb3-Emb_STTb1·Emb3|=0≤σ
|Emb_STTa1·Emb4-Emb_STTb1·Emb4|=0≤σ
|Emb_STTa1·Emb5-Emb_STTb1·Emb5|=0≤σ
由于相邻时间段T3,T4和T5的轨迹点满足匹配条件,则轨迹Emb_STTa1和Emb_STTb1匹配的轨迹点对数量Match_Count(Emb_STTa1,Emb_STTb1)=3。
因此,移动轨迹STTa1与STTb1匹配。
S53、其他轨迹匹配。
由于轨迹Emb_STTa1与Emb_STTb1匹配,下一步对Emb_STTa2进行匹配,且Emb_STTb1不再参加后续的匹配计算,也即对轨迹Emb_STTa2与Emb_STTb2进行匹配计算。
同理,得到两轨迹匹配成功的有相邻时间段为T1,T2的轨迹点,其匹配度为:
因此,移动轨迹STTa2与STTb2不匹配。
进一步得到匹配计算结果如下:
Match_Degree(Emb_STTa2-Emb_STTb3)=0<τ
Match_Degree(Emb_STTa2-Emb_STTb4)=0<τ
Match_Degree(Emb_STTa2-Emb_STTb5)=0<τ
则移动轨迹STTa2无匹配对象。
Match_Degree(Emb_STTa3-Emb_STTb2)=0.2<τ
Match_Degree(Emb_STTa3-Emb_STTb3)=0.2<τ
Match_Degree(Emb_STTa3-Emb_STTb4)=0<τ
Match_Degree(Emb_STTa3-Emb_STTb5)=0<τ
则移动轨迹STTa3无匹配对象。
Match_Degree(Emb_STTa4-Emb_STTb2)=0<τ
Match_Degree(Emb_STTa4-Emb_STTb3)=0<τ
Match_Degree(Emb_STTa4-Emb_STTb4)=0<τ
Match_Degree(Emb_STTa4-Emb_STTb5)=0<τ
则移动轨迹STTa4无匹配对象。
Match_Degree(Emb_STTa5-Emb_STTb2)=0<τ
Match_Degree(Emb_STTa5-Emb_STTb3)=0.2<τ
Match_Degree(Emb_STTa5-Emb_STTb3)=0.2<τ
Match_Degree(Emb_STTa5-Emb_STTb5)=0.8≥τ
则移动轨迹STTa5与STTb5匹配。
S54、综上,可以得到匹配结果,如下表:
步骤6,基于匹配结果的移动轨迹数据交换。
数据双方将匹配成功的移动轨迹和子轨迹集合发送给对方,完成隐私保护匹配的轨迹数据交换。
在本实施例中,数据双方基于步骤5的匹配结果,将成功匹配的移动轨迹发送给对方,完成数据交换。双方成功匹配的移动轨迹数据分布如图7所示,其中,(a)为A方的轨迹,(b)为B方轨迹。
其中,A方交换给B方的数据为:
Ta1′={[(-3.43,9.36),3],[(-4.35,3.26),4],[(-2.41,2.07),5]}
Ta5′={[(1.65,-11.37),1],[(3.06,-5.38),2],[(6.69,
-7.48),3],[(8.24,-0.21),4]}
B方交换给A方的数据为:
Tb1′={[(-3.43,7.36),3],[(-4.35,3.26),4],[(-2.41,2.07),5]}
Tb5′={[(1.65,-11.37),1],[(3.06,-5.38),2],[(6.69,-7.48),3],[(8.24,-0.21),4]}。
以上所述仅为本发明的较佳实施方式,本发明的保护范围并不以上述实施方式为限,但凡本领域普通技术人员根据本发明所揭示内容所作的等效修饰或变化,皆应纳入权利要求书中记载的保护范围内。
Claims (9)
1.一种基于热点网格维度转换的移动轨迹隐私保护匹配方法,其特征在于:所述方法包括如下步骤:
步骤1,基于移动轨迹空间范围的空间编码;基于数据交换双方的移动轨迹数据集的二维空间范围,进行等间隔空间网格划分与网格编码,并且进行时间分段离散;
步骤2,基于轨迹点计数统计的热点网格发现;对数据双方落在每个网格中的轨迹点数进行统计,选择轨迹点数最多的网格作为热点网格;
步骤3,基于热点网格的多维度空间构建和权重计算;根据热点网格的轨迹点计数计算各自权重,并将所有热点网格的编码、中心坐标、权重等以热点网格集合的形式表示;
步骤4,移动轨迹数据的嵌入编码;基于热点网格集合,将所有移动轨迹数据嵌入多维度空间中,以嵌入值和时间序列的形式表示;
步骤5,基于嵌入编码的轨迹匹配计算;数据双方交换嵌入后的移动轨迹数据,并基于时间序列和对应嵌入值的差值得到匹配的移动轨迹和子轨迹的集合;
步骤6,基于匹配结果的移动轨迹数据交换;数据双方将匹配成功的移动轨迹和子轨迹集合发送给对方,完成隐私保护匹配的轨迹数据交换。
2.根据权利要求1所述的一种基于热点网格维度转换的移动轨迹隐私保护匹配方法,其特征在于:步骤1中,空间网格划分为,给定二维平面空间范围:
SE2={xmin,xmax,ymin,ymax}
4.根据权利要求1所述的一种基于热点网格维度转换的移动轨迹隐私保护匹配方法,其特征在于:步骤2中,数据交换双方将其移动轨迹数据转化为基于空间网格划分与时间段集合,即时空离散空间表达,并通过对计算落在各网格的轨迹点数量,即空间网格的轨迹点计数统计,从而发现热点网格。
5.根据权利要求4所述的一种基于热点网格维度转换的移动轨迹隐私保护匹配方法,其特征在于:移动轨迹的时空离散空间表达为,给定一条移动轨迹TID={[p1,t1],[p2,t2],…,[pn,tn]},t1<t2<…<tn,其中,ID表示移动轨迹的编号,[pi,ti],1≤i≤n表示一个移动轨迹点,pi=(x,y)表示用户在ti时刻所处的空间位置,x,y表示空间位置的横、纵坐标值,则TID在空间网格划分集合DR2以及时间分段离散集合DT中的时空离散表达为:STTID=[M1,p1,T1],[M2,p2,T2],…,[Mm,pm,Tk],对于其中的任一元素[Mj,pj,Ts],1≤j≤m,1≤s≤k,都满足条件:pi∈Mj,且ti∈Ts,1≤i≤n。
6.根据权利要求4所述的一种基于热点网格维度转换的移动轨迹隐私保护匹配方法,其特征在于:热点网格为,给定空间网格计数矩阵,其行数和列数与空间网格集合DR2相同,且其每个元素cdri×j只与一个空间网格Mi×j对应,记作CountDR;其中,cdri×j用Count(STTs,Mi×j)表示,即移动轨迹STTs的轨迹点落在网格Mi×j中的数量;给定一个阈值θ,对矩阵CountDR的所有元素进行排序,选择其数值最大的θ个值;其中,若可选元素大于θ,则先选定较大者,较小者进行随机选择;选定的θ个网格称为热点网格,记为HM。
8.根据权利要求1所述的一种基于热点网格维度转换的移动轨迹隐私保护匹配方法,其特征在于:步骤4中,数据双方各自计算其移动轨迹点在热点网格构成的多维度空间中的嵌入值,并将移动轨迹数据以嵌入形式进行表达;
移动轨迹的热点网格嵌入为,给定时空离散表达移动轨迹集合STTs={STT1,STT2,…,STTn},及其支持的热点网格集合HMs={HM1,HM2,…,HMm},对于STTs中的一条移动轨迹STTi,其包含的轨迹点[M,p,T],在热点网格集合HMs元素构成m维空间中的嵌入值为:
其中,Distance(HMi,p)是轨迹点所处位置与热点网格HMi的欧式距离;
对于STTi=[M1,p1,T1],[M2,p2,T2],…,[Mm,pm,Tk],其基于嵌入值的表达为:Emb_STTi={Emb(HMs,[M1,p1,T1]),Emb(HMs,[M2,p2,T2]),...,{Emb(HMs,[Mm,pm,Tk])}。
9.根据权利要求1所述的一种基于热点网格维度转换的移动轨迹隐私保护匹配方法,其特征在于:步骤5中,数据双方交换其嵌入表达的移动轨迹数据,协定轨迹点嵌入值的差值阈值σ,移动轨迹的匹配度阈值τ,并进行匹配计算;
移动轨迹嵌入值的匹配计算为,给定两条基于嵌入值表达的移动轨迹:
Emb_STTA={Emb1,Emb2,…,Embn}
Emb_STTB={Emb1,Emb2,…,Embm}
对于Emb_STTA、Emb_STTB中的时间序列相同的元素Emb_STTA·Embi、Emb_STTB·Embj,1≤i≤m,1≤j≤n,如果其差值|Emb_STTA·Embi-Emb_STTB·Embj|不超过自定义阈值σ,也即|Emb_STTA·Embi-Emb_STTB·Embj|≤σ,则称嵌入值Emb_STTA·Embi与嵌入值Emb_STTB·Embj匹配;
在所有匹配成功的嵌入值中,统计其中时间段相邻的嵌入值对,将Emb_STTA与Emb_STTB匹配轨迹点对的时间段数量定义为:
Match_Count(Emb_STTA,Emb_STTB)
将Emb_STTA与Emb_STTB的匹配度定义为:
如果匹配度值不小于自定义阈值τ,即:
Match_Degree(Emb_STTA-Emb_STTB)≥τ
则称Emb_STTA与Emb_STTB匹配。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111550522.5A CN114201695B (zh) | 2021-12-17 | 2021-12-17 | 一种基于热点网格维度转换的移动轨迹隐私保护匹配方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111550522.5A CN114201695B (zh) | 2021-12-17 | 2021-12-17 | 一种基于热点网格维度转换的移动轨迹隐私保护匹配方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114201695A true CN114201695A (zh) | 2022-03-18 |
CN114201695B CN114201695B (zh) | 2022-10-21 |
Family
ID=80654888
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111550522.5A Active CN114201695B (zh) | 2021-12-17 | 2021-12-17 | 一种基于热点网格维度转换的移动轨迹隐私保护匹配方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114201695B (zh) |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104331466A (zh) * | 2014-10-31 | 2015-02-04 | 南京邮电大学 | 基于时空邻近搜索的移动轨迹序列模式快速挖掘方法 |
CN109409499A (zh) * | 2018-09-20 | 2019-03-01 | 北京航空航天大学 | 一种基于深度学习和卡尔曼滤波修正的轨迹恢复方法 |
US10542441B1 (en) * | 2018-08-09 | 2020-01-21 | Baidu Online Network Technology (Beijing) Co., Ltd. | Method, computer device and storage medium for matching mobile hotspot with mobile point of interest |
CN110727958A (zh) * | 2019-10-15 | 2020-01-24 | 南京航空航天大学 | 一种基于前缀树的差分隐私轨迹数据保护方法 |
CN111506918A (zh) * | 2020-04-09 | 2020-08-07 | 南京邮电大学 | 一种基于Bloom过滤器的移动轨迹隐私保护匹配方法 |
CN111539023A (zh) * | 2020-04-27 | 2020-08-14 | 南京邮电大学 | 一种基于多次迭代过滤的移动轨迹数据隐私保护匹配方法 |
US20210019425A1 (en) * | 2019-07-17 | 2021-01-21 | Here Global B.V. | Quantification of privacy risk in location trajectories |
CN112861171A (zh) * | 2021-01-20 | 2021-05-28 | 华中科技大学 | 基于粒子群优化算法的轨迹间相关性隐私保护方法和系统 |
CN113128607A (zh) * | 2021-04-25 | 2021-07-16 | 思创数码科技股份有限公司 | 一种轨迹相似度计算方法 |
CN113204718A (zh) * | 2021-04-22 | 2021-08-03 | 武汉大学 | 一种顾及时空语义及驾驶状态的车辆轨迹目的地预测方法 |
-
2021
- 2021-12-17 CN CN202111550522.5A patent/CN114201695B/zh active Active
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104331466A (zh) * | 2014-10-31 | 2015-02-04 | 南京邮电大学 | 基于时空邻近搜索的移动轨迹序列模式快速挖掘方法 |
US10542441B1 (en) * | 2018-08-09 | 2020-01-21 | Baidu Online Network Technology (Beijing) Co., Ltd. | Method, computer device and storage medium for matching mobile hotspot with mobile point of interest |
CN109409499A (zh) * | 2018-09-20 | 2019-03-01 | 北京航空航天大学 | 一种基于深度学习和卡尔曼滤波修正的轨迹恢复方法 |
US20210019425A1 (en) * | 2019-07-17 | 2021-01-21 | Here Global B.V. | Quantification of privacy risk in location trajectories |
CN110727958A (zh) * | 2019-10-15 | 2020-01-24 | 南京航空航天大学 | 一种基于前缀树的差分隐私轨迹数据保护方法 |
CN111506918A (zh) * | 2020-04-09 | 2020-08-07 | 南京邮电大学 | 一种基于Bloom过滤器的移动轨迹隐私保护匹配方法 |
CN111539023A (zh) * | 2020-04-27 | 2020-08-14 | 南京邮电大学 | 一种基于多次迭代过滤的移动轨迹数据隐私保护匹配方法 |
CN112861171A (zh) * | 2021-01-20 | 2021-05-28 | 华中科技大学 | 基于粒子群优化算法的轨迹间相关性隐私保护方法和系统 |
CN113204718A (zh) * | 2021-04-22 | 2021-08-03 | 武汉大学 | 一种顾及时空语义及驾驶状态的车辆轨迹目的地预测方法 |
CN113128607A (zh) * | 2021-04-25 | 2021-07-16 | 思创数码科技股份有限公司 | 一种轨迹相似度计算方法 |
Non-Patent Citations (6)
Title |
---|
HAITAOZHANG: "《A Method of Sanitizing Privacy-Sensitive Sequence Pattern Networks Mined From Trajectories Released》", 《INTERNATIONAL JOURNAL OF DATA WAREHOUSING AND MINING》 * |
吴俊伟等: "基于网格聚类的热点路径探测", 《吉林大学学报(工学版)》 * |
汪逸飞等: "基于信息熵抑制的轨迹隐私保护方法", 《计算机应用》 * |
潘晓等: "基于时间序列的轨迹数据相似性度量方法研究及应用综述", 《燕山大学学报》 * |
潘雨: "《基于分段聚类的轨迹数据发布隐私保护技术研究》", 《中国优秀硕士学位论文全文数据库 (信息科技辑)》 * |
顾贞等: "轨迹数据隐私保护综述", 《网络空间安全》 * |
Also Published As
Publication number | Publication date |
---|---|
CN114201695B (zh) | 2022-10-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110012428B (zh) | 一种基于WiFi的室内定位方法 | |
US20230134964A1 (en) | A distributed network traffic data decomposition method | |
CN109495920B (zh) | 一种无线通信网络特征画像方法、设备和计算机程序产品 | |
CN107682319B (zh) | 一种基于增强型角度异常因子的数据流异常检测及多重验证的方法 | |
CN106717082A (zh) | 减轻信号噪声的基于指纹的室内定位 | |
Bettstetter et al. | An inhomogeneous spatial node distribution and its stochastic properties | |
CN105205052A (zh) | 一种数据挖掘方法及装置 | |
Li et al. | A top–bottom clustering algorithm based on crowd trajectories for small group classification | |
CN114201695B (zh) | 一种基于热点网格维度转换的移动轨迹隐私保护匹配方法 | |
Lei et al. | Enhanced geometric filtering method based device-free localization with UWB wireless network | |
Li et al. | Enhancing federated learning robustness in adversarial environment through clustering Non-IID features | |
Sharma et al. | Iot in smart cities: Exploring information theoretic and deep learning models to improve parking solutions | |
Hong et al. | Training object detectors from scratch: An empirical study in the era of vision transformer | |
Gasperini et al. | Signal clustering with class-independent segmentation | |
CN106251004B (zh) | 基于改进空间距离划分的目标分群方法 | |
CN110621025B (zh) | 一种设备选型方法和装置 | |
CN112307286A (zh) | 一种基于并行st-agnes算法的车辆轨迹聚类方法 | |
CN108460424B (zh) | 一种基于线点转换和聚类对比的空间运动轨迹识别方法 | |
Vaidya et al. | Comprehensive Comparative Analysis of Methods for Crime Rate Prediction | |
CN111539023B (zh) | 一种基于多次迭代过滤的移动轨迹数据隐私保护匹配方法 | |
CN114462093A (zh) | 基于差分隐私的时空泛化轨迹数据发布方法 | |
CN111506918B (zh) | 一种基于Bloom过滤器的移动轨迹隐私保护匹配方法 | |
Rumi et al. | Modelling regional crime risk using directed graph of check-ins | |
Achtzehn et al. | Large-scale cellular network modeling from population data: An empirical analysis | |
CN104965190A (zh) | 基于位置指纹的轴向解耦室内定位方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |