CN108734022B - 基于三维网格划分的隐私保护轨迹数据发布方法 - Google Patents

基于三维网格划分的隐私保护轨迹数据发布方法 Download PDF

Info

Publication number
CN108734022B
CN108734022B CN201810288419.XA CN201810288419A CN108734022B CN 108734022 B CN108734022 B CN 108734022B CN 201810288419 A CN201810288419 A CN 201810288419A CN 108734022 B CN108734022 B CN 108734022B
Authority
CN
China
Prior art keywords
track
sub
time
tracks
distance
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810288419.XA
Other languages
English (en)
Other versions
CN108734022A (zh
Inventor
陈传明
俞庆英
胡桂银
陈付龙
罗永龙
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Anhui Normal University
Original Assignee
Anhui Normal University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Anhui Normal University filed Critical Anhui Normal University
Priority to CN201810288419.XA priority Critical patent/CN108734022B/zh
Publication of CN108734022A publication Critical patent/CN108734022A/zh
Application granted granted Critical
Publication of CN108734022B publication Critical patent/CN108734022B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/62Protecting access to data via a platform, e.g. using keys or access control rules
    • G06F21/6218Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
    • G06F21/6245Protecting personal data, e.g. for financial or medical purposes
    • G06F21/6254Protecting personal data, e.g. for financial or medical purposes by anonymising data, e.g. decorrelating personal data from the owner's identification

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Bioethics (AREA)
  • General Health & Medical Sciences (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Hardware Design (AREA)
  • Databases & Information Systems (AREA)
  • Computer Security & Cryptography (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Medical Informatics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明适用于数据挖掘技术领域,提供了一种基于三维网格的隐私保护轨迹数据发布方法,该方法包括:对轨迹数据进行预处理;基于位置点采样时间对每条轨迹首尾位置点间的缺失位置进行插值;对轨迹区域进行网格划分,划分为若干个时空单元;基于各时空单元内子轨迹的时间、方向及空间位置来计算子轨迹间距离;在距离最近的两条子轨迹上寻找满足约束条件的位置点对,交换位置点对的时间及空间位置,获得匿名子轨迹;将分布在各时空单元内属于同一轨迹的匿名子轨迹进行重构,获得匿名轨迹数据集。本发明根据每个时空单元内的子轨迹之间的相似性进行位置交换,实现轨迹匿名化,在保护用户隐私信息的同时,有效地提高了轨迹发布数据的可用性。

Description

基于三维网格划分的隐私保护轨迹数据发布方法
技术领域
本发明属于数据挖掘技术领域,提供了一种基于三维网格的隐私保护轨迹数据发布方法。
背景技术
随着移动智能终端、定位和存储技术的快速发展,研究人员可以收集和存储大量移动物体的位置和轨迹数据。这些轨迹数据包含丰富的时间和空间信息。收集、挖掘和分析轨迹数据可以支持与移动物体有关的各种应用。例如定位服务、交通监控、城市和道路规划、用户行为分析和旅行推荐等。
轨迹数据表示运动物体的移动路线。大量轨迹数据的发布势必会对用户的隐私和安全构成威胁。例如,结合其他相关背景信息,攻击者通过分析轨迹数据,可以很容易地获得用户的一些隐私信息,如:姓名、性别、单位、家庭住址、爱好、行为模式、社交习惯等,导致用户的切身利益受到伤害。对于一定时间内某个地点的隐私保护问题,目前已经取得了一些研究成果。但是,连续位置信息的轨迹隐私保护方法还有待进一步研究。随着人们对个人隐私信息保护问题的日益关注,隐私保护的轨迹数据发布问题逐渐成为数据挖掘领域的研究热点之一。发布轨迹数据时,数据发布者应确保匿名轨迹数据不会泄露个人隐私信息,同时保持高可用性以进行准确地分析。因此,如何在不破坏数据可用性的前提下有效保护运动物体的轨迹隐私已成为轨迹数据发布中需要迫切解决的问题,即本发明关注的研究问题。
轨迹隐私保护能力和轨迹数据的可用性是相互制约的。目前大多数轨迹数据隐私保护发布方法存在不足:一方面,根据访问频率抑制数据、根据时间干扰数据、使用假名交换用户标识符等方法,均未考虑包含在轨迹本身中的信息,所以在匿名过程中信息丢失非常大;另一方面,大多数方法都是基于整条轨迹的处理,忽略了子轨迹之间高度相似的可能性。因此,发布的匿名化轨迹数据集会降低轨迹数据挖掘的质量。
由于泛化方法能够在个人隐私保护和轨迹数据可用性之间取得良好的平衡,因此基于泛化方法的轨迹k-匿名模型得到了广泛的应用,大多数现有的匿名方法直接删除违反特定约束条件的轨迹或位置,很可能造成大量的信息丢失。
发明内容
本发明实施例提供一种基于三维网格的隐私保护轨迹数据发布方法,旨在解决现有的匿名方法直接删除违反特定约束条件的轨迹或位置,造成大量的信息丢失问题。
本发明是这样实现的,一种基于三维网格的隐私保护轨迹数据发布方法,该方法包括如下步骤:
S1、对轨迹数据进行预处理,预处理是指提取轨迹数据的时间及空间位置属性;
S2、基于位置点采样时间对每条轨迹首尾位置点间的缺失位置进行插值;
S3、对轨迹区域进行网格划分,划分为若干个时空单元;
S4、基于各时空单元内子轨迹的时间、方向及空间位置来计算子轨迹间距离;
S5、在距离最近的两条子轨迹上寻找满足约束条件的位置点对,交换位置点对的时间及空间位置,获得匿名子轨迹;
S6、将分布在各时空单元内属于同一轨迹的匿名子轨迹进行重构,获得匿名轨迹数据集。
进一步的,所述时空单元为G×G×G三维单元,G为划分参数,其中,
Figure BDA0001616666340000021
N为插补后的轨迹数据数目。
进一步的,子轨迹Ti与子轨迹Tj间的距离计算方法包括如下步骤:
S41、识别子轨迹Ti及子轨迹Tj上的位置点数目;
S42、若子轨迹Ti及子轨迹Tj都只有一个位置点,则基于公式(2)进行计算:
Figure BDA0001616666340000031
其中,dist(Ti,Tj)为子轨迹Ti及子轨迹Tj间的距离,
Figure BDA0001616666340000032
Figure BDA0001616666340000033
分别是子轨迹Ti及子轨迹Tj上的唯一位置点,ε是用于测量具有不同时间值的两个位置之间差异的距离调整参数,ε设置为|ti-tj|;
若子轨迹Ti上只有一个位置点,子轨迹Tj上至少有两个位置点,则基于公式(3)进行计算:
Figure BDA0001616666340000034
其中,dist(Ti,Tj)为子轨迹Ti及子轨迹Tj间的距离,st和et分别为子轨迹Tj的起始时间和结束时间,
Figure BDA0001616666340000035
为三个位置点
Figure BDA0001616666340000036
Figure BDA0001616666340000037
组成的三角形面积,δ是一个距离调整参数;
若子轨迹Ti及子轨迹Tj上均至少有两个位置点,则基于公式(4)进行计算:
dist(Ti,Tj)=η*disto(Ti,Tj)+(1-η)*distl(Ti,Tj) (4)
其中,η为距离权值,设置为0.5,dist0(Ti,Tj)是轨迹方向距离,为两条子轨迹中重叠时间内所有轨迹段方向距离的平均值,distl(Ti,Tj)是轨迹位置距离,为轨迹中所有轨迹段位置距离的平均值,其中,dist0(Ti,Tj)的计算公式如(5)所示:
Figure BDA0001616666340000038
其中,
Figure BDA0001616666340000039
是指子轨迹Ti的第r个轨迹段,|ol(Ti,Tj)|表示子轨迹Ti和子轨迹Tj的重叠时间长度,stij和etij分别表示两条子轨迹重叠时间的起始时刻和终止时刻;
distl(Ti,Tj)的计算公式如(6)所示:
Figure BDA0001616666340000041
其中,当子轨迹Ti和子轨迹Tj之间存在共同周期,则令pt=100*min(ratio1,ratio2),ratio1是Ti和Tj重叠时长与Ti时长的比值,ratio2是Ti和Tj重叠时长与Tj时长的比值,若子轨迹Ti和子轨迹Tj不是同时段轨迹,则令pt=0,σr表示四个时空位置
Figure BDA0001616666340000042
Figure BDA0001616666340000043
组成的两个三角形面积之和。
进一步的,步骤S5中的约束条件为:时间差小于或等于时间阈值θt,且空间距离小于或等于距离阈值θd
本发明提供的隐私轨迹数据发布方法如下三个功能:第一个是针对时空轨迹数据集进行三维网格划分,提出了一种新的有效的轨迹分割方法,该方法保留了轨迹数据的潜在特征,有利于轨迹相似性评估和轨迹匿名化;第二个是基于不同场景的轨迹相似性测量,分析了三种不同的轨迹分布情况,提出了一种综合轨迹距离计算方法,用于度量任意两条轨迹之间的相似度;第三个是对相似性高的位置点对进行时间交换及位置交换,获得匿名轨迹,实现轨迹匿名化,在保护用户隐私信息的同时,有效地提高了轨迹发布数据的可用性。
附图说明
图1为本发明实施例提供的基于三维网格划分的隐私保护轨迹数据发布方法的流程图;
图2为本发明实施例提供的时空单元内子轨迹间时空关系的三种场景示意图;
图3(a)为本发明实施例提供的TPPG算法在两个数据集SynDS和RealDS上运行的avgLL值随θd变化的结果示意图;
图3(b)为本发明实施例提供的TPPG算法在两个数据集SynDS和RealDS上运行的avgLL值随θt变化的结果示意图;
图4(a)为本发明实施例提供的TPPG算法在两个数据集SynDS和RealDS上运行的
Figure BDA0001616666340000051
值随θd变化的结果示意图;
图4(b)为本发明实施例提供的TPPG算法在两个数据集SynDS和RealDS上运行的
Figure BDA0001616666340000052
值随θt变化的结果示意图;
图5(a)为本发明实施例提供的TPPG算法在两个数据集SynDS和RealDS上运行的TL值随θd变化结果示意图;
图5(b)为本发明实施例提供的TPPG算法在两个数据集SynDS和RealDS上运行的TL值随θt变化结果示意图;
图6(a)为本发明实施例提供的TPPG算法在两个数据集SynDS和RealDS上运行的TIL值随θd变化结果示意图;
图6(b)为本发明实施例提供的TPPG算法在两个数据集SynDS和RealDS上运行的TIL值随θt变化结果示意图;
图7(a)为本发明实施例提供的TPPG算法在两个数据集SynDS和RealDS上运行的ARAOI值随θd变化结果示意图;
图7(b)为本发明实施例提供的TPPG算法在两个数据集SynDS和RealDS上运行的ARAOI值随θt变化结果示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
图1为本发明实施例提供的基于三维网格划分的隐私保护轨迹数据发布方法的流程图,该方法包括如下步骤:
S1、对轨迹数据进行预处理,预处理是指提取轨迹数据中的时间及空间位置属性;
对原始轨迹数据集进行形式化预处理,提取轨迹数据的时间及空间位置属性,生成如下形式的轨迹:
T={Tid,(t1,x1,y1),(t2,x2,y2),…,(tn,xn,yn)} (1)
其中,Tid表示轨迹的序号,(ti,xi,yi)(1≤i≤n)表示第i个位置点的时间和空间位置属性三元组(也称为位置点),n是轨迹中位置点的个数。
设TS是所有形如T的轨迹构成的集合,可表示为:TS={T1,T2,…,Tp},|TS|指的是TS中轨迹的条数,即|TS|=p。
S2、基于位置点采样时间对每条轨迹首尾位置点间的缺失位置进行插值;
记录轨迹数据集的所有位置点采样时间,对每条轨迹首尾位置点之间的缺失位置点进行插值,使得每条轨迹首尾位置点之间的时刻具有连续性。
S3、对轨迹区域进行网格划分,划分为S个时空单元,其中S为正整数;
对轨迹区域进行网格划分,划分为S个时空单元,所有轨迹数据都分布在这些时空单元中,每个时空单元中可能有零条或多条子轨迹。时空单元为G×G×G三维单元,其中,G是划分参数,
Figure BDA0001616666340000061
N为插补后的轨迹数据数目。
S4、采用轨迹相似性度量方法计算每个时空单元内子轨迹间的距离,即基于各时空单元内子轨迹的时间、方向及空间位置来计算子轨迹间距离;
在每个时空单元内部,基于子轨迹的时间、方向及空间位置特征来评估时空单元内两子轨迹间的相似度,通过两子轨迹间的距离来表征两子轨迹间的相似度,距离越近的两子轨迹相似度越高,如图2所示,子轨迹Ti及子轨迹Tj为时空单元内部的两子轨迹,子轨迹Ti和子轨迹Tj的时空关系有三种情况,两条子轨迹Ti、Tj间距离计算取决于其所处的具体情况:
第一种情况:子轨迹Ti、Tj都只有一个位置点;
距离是根据欧几里得距离计算的,对应于图2(a)及图2(b),计算公式如下:
Figure BDA0001616666340000071
其中,
Figure BDA0001616666340000072
Figure BDA0001616666340000073
分别是子轨迹Ti及子轨迹Tj的唯一位置点,ε是用于测量具有不同时间值的两个位置之间差异的距离调整参数,在我们的实验中,ε被设置为|ti-tj|,在图2(a)中,两个位置都在t2时刻,即ti=tj=t2;在图2(b)中,ti=t8,tj=t10
第二种情况:子轨迹Ti只有一个位置点,子轨迹Tj至少有两个位置点。
计算由子轨迹Ti位置点与子轨迹Tj中每对相邻两位置点组成三角形的面积,根据三角形的面积计算距离,不失一般性,我们假设子轨迹Ti只包含一个位置点
Figure BDA0001616666340000074
对于图2(c)及图2(d),计算公式如下:
Figure BDA0001616666340000075
st和et分别为子轨迹Tj的起始时间和结束时间,σtr为三个位置点
Figure BDA0001616666340000076
Figure BDA0001616666340000077
Figure BDA0001616666340000078
组成的三角形面积,即为轨迹Ti中的位置点与轨迹Tj中相邻两位置点组成三角形的面积,δ是一个距离调整参数,用于测量两个情景(c)和(d)之间的差异,若st<ti<et,如图2(c)所示,ti=t2,st=t1,et=t4;若ti<st或者是et<ti,如图2(d)所示,ti<st(ti=t7,st=t8),
第三种情况:子轨迹Ti及子轨迹Tj均至少有两个位置点。
如图2(e)-(f)所示,在子轨迹Ti及子轨迹Tj中至少有两个位置,若子轨迹Ti和子轨迹Tj之间存在共同周期,令pt>0,pt=100*min(ratio1,ratio2),ratio1是Ti和Tj重叠时长与Ti时长的比值,ratio2是Ti和Tj重叠时长与Tj时长的比值,如图2(e)所示,子轨迹Ti和子轨迹Tj中存在共同周期t2~t3,若子轨迹Ti和子轨迹Tj不是同时段轨迹,即子轨迹Ti和子轨迹Tj之间不存在共同周期,令pt=0,如图2(f)所示,距离计算公式如(4)所示:
dist(Ti,Tj)=η*disto(Ti,Tj)+(1-η)*distl(Ti,Tj) (4)
其中,η为距离权值,设置为0.5,dist0(Ti,Tj)是轨迹方向距离,为两条子轨迹中重叠时间内所有轨迹段方向距离的平均值,distl(Ti,Tj)是轨迹位置距离,为轨迹中所有轨迹段位置距离的平均值,其中,dist0(Ti,Tj)的计算公式如(5)所示:
Figure BDA0001616666340000081
其中,
Figure BDA0001616666340000082
是指子轨迹Ti的第r个轨迹段,|ol(Ti,Tj)|表示子轨迹Ti和子轨迹Tj的重叠时间长度,stij和etij分别表示两条子轨迹重叠时间的起始时刻和终止时刻。
distl(Ti,Tj)的计算公式如(6)所示:
Figure BDA0001616666340000083
其中,σr表示四个时空位置
Figure BDA0001616666340000084
Figure BDA0001616666340000085
组成的两个三角形面积之和。
S5、在距离最近的两条子轨迹上寻找满足约束条件的位置点对,交换位置点对的时间及位置,获得匿名子轨迹;
对于两条距离最近的子轨迹,寻找时间差小于或等于θt,且空间距离小于或等于θd的位置点对,然后对满足时间阈值θt和距离阈值θd约束条件的位置点对进行时间交换及位置交换。
S6、将分布在不同时空单元内属于同一轨迹的子轨迹进行重构,获得匿名的轨迹数据集,该匿名轨迹数据集是基于实际数据形成的。
本发明提供的隐私轨迹数据发布方法如下三个功能:第一个是针对时空轨迹数据集进行三维网格划分,提出了一种新的有效的轨迹分割方法,该方法保留了轨迹数据的潜在特征,有利于轨迹相似性评估和轨迹匿名化;第二个是基于不同场景的轨迹相似性测量,分析了三种不同的轨迹分布情况,提出了一种综合轨迹距离计算方法,用于度量任意两条轨迹之间的相似度;第三个是对相似性高的位置点对进行时间交换及位置交换,获得匿名轨迹,实现轨迹匿名化,在保护用户隐私信息的同时,有效地提高了轨迹发布数据的可用性。
该方法适用于具有时间属性和空间位置属性的时空轨迹数据集,理论分析与实验结果均表明,本发明是能够有效地保护轨迹数据的隐私性,并提高匿名轨迹数据集的准确性和可用性。
为了说明效果,本发明的具体实施例,列举了在2个数据集上评价提出方法的有效性。数据来源1是用Brinkhoff生成器生成的基于德国奥登堡市的合成轨迹数据集SynDS,具体包括1005条合成轨迹、45727个时空位置;数据来源2是取自美国三藩市真实出租车移动轨迹数据集RealDS,具体包括2008年5月25日12:04到5月26日12:04之间的500辆出租车的运行轨迹,包括480条真实轨迹,平均每条轨迹含有244个时空位置。本发明的实验中抽取轨迹位置点的时间、纬度、经度三个属性。
图3(a)给出了本发明所描述方法基于数据集SynDS和RealDS的avgLL值随θd变化的结果示意图,图3(b)给出了本发明所描述方法基于数据集SynDS和RealDS的avgLL值随θt变化的结果示意图,avgLL是匿名轨迹数据集的平均位置损失结果,每条轨迹的位置损失是指匿名轨迹和原始轨迹在同一时间不同位置的数量与原始轨迹中原始位置数量的比率,如3(a)所示,随着θd的变化,对于SynDS数据集来说,avgLL值范围从10%到38%,对于RealDS数据集来说,avgLL值范围从8%到11%。在图3(b)中,随着θt的变化,对于SynDS数据集来说,avgLL值大约保持在21.8%,对于RealDS数据集来说,avgLL值范围从13%到14%。总的趋势是,θd的值越大,平均位置损失就越高。因为θd是距离阈值,所以当它越来越大时,满足交换条件的子轨迹的数量将会更大,然后平均位置损失会更大。这与avgLL和时间阈值θt(单位:秒)的关系是相同的。另外,在两个数据集上运行的结果之间的巨大差异取决于数据集的长度,SynDS的长度大约是RealDS长度的两倍。与其他两个算法GC_DM和MDAV的结果(约99.8%)相比,本发明所描述方法的平均位置损失率要小得多。
图4(a)给出了本发明所描述方法基于数据集SynDS和RealDS的
Figure BDA0001616666340000101
值随θd变化的结果示意图,图4(b)给出了本发明所描述方法基于数据集SynDS和RealDS的
Figure BDA0001616666340000102
值随θt变化的结果示意图,
Figure BDA0001616666340000103
是衡量原始数据集和匿名数据集中位置出现次数变化的指标,
Figure BDA0001616666340000104
值越大,数据可用性越大。如图4(a)所示,随着θd的变化,对于SynDS数据集来说,
Figure BDA0001616666340000105
值范围从97%到97.5%,对于RealDS数据集来说,
Figure BDA0001616666340000106
值范围从94.5%到96.1%。在图4(b)中,随着时间阈值θt(单位:秒)的变化,对于SynDS数据集来说,
Figure BDA0001616666340000107
值大约保持在97.33%,对于RealDS数据集来说,
Figure BDA0001616666340000108
值大约保持在97.05%。总的趋势是,θd的值越大,平均位置出现率越高。与其他两个算法GC_DM和MDAV的结果(不超过24%)相比,本发明所描述方法的
Figure BDA0001616666340000109
值要高得多。
图5(a)给出了本发明所描述方法基于数据集SynDS和RealDS的TL值随θd变化的结果示意图,图5(b)给出了本发明所描述方法基于数据集SynDS和RealDS的TL值随θt变化的结果示意图,TL值是指删除的轨迹条数与原始轨迹条数的比值。如图5(a)所示,随着θd的变化,对于SynDS数据集来说,TL值范围从1.9%到2.2%,对于RealDS数据集来说,TL值大约保持在0.2%。在图5(b)中,随着时间阈值θt(单位:秒)的变化,对于SynDS数据集来说,TL值大约保持在2%,对于RealDS数据集来说,TL值大约保持在0.2%。与其他两个算法GC_DM和MDAV的结果(55%到100%)相比,本发明所描述方法的轨迹损失率要低得多。
图6(a)给出了本发明所描述方法基于数据集SynDS和RealDS的TIL值随θd变化的结果示意图,图6(b)给出了本发明所描述方法基于数据集SynDS和RealDS的TIL值随θt变化的结果示意图,TIL值是指将匿名轨迹与原始轨迹进行比较而导致的一些错误。通过比较原始轨迹数据集TS与匿名数据集TS*,计算时空信息损失以获得信息失真度。如图6(a)所示,随着时间阈值θd(单位:秒)的变化,对于SynDS数据集来说,TIL值范围从0.5×106到6.5×106,对于RealDS数据集来说,TIL值范围从0.5×106到1×106。在图6(b)中,随着θt的变化,对于SynDS数据集来说,TIL值大约保持在2.4×106,对于RealDS数据集来说,TIL值大约保持在0.4×106。与其他两个算法GC_DM和MDAV的结果(0.1×107到2.8×107)相比,本发明所描述方法的位置错误值要小得多。
图7(a)给出了本发明所描述方法基于数据集SynDS和RealDS的ARAOI值随θd变化结果示意图,图7(b)给出了本发明所描述方法基于数据集SynDS和RealDS的ARAOI值随θt变化结果示意图,ARAOI是指AOI查询度量的准确率,是基于相同的检索机制估计在匿名数据集中正确检索的AOI数量的比率,其中AOI指的是点密度高于指定阈值的区域。AOI是一项统计结果,可用于许多应用,包括个性化推荐和路径规划。为了测量ARAOI,将匿名轨迹数据集上的检索结果与原始数据集上的检索结果进行比较。如图7(a)所示,随着θd的变化,对于SynDS数据集来说,ARAOI值保持在100%,对于RealDS数据集来说,ARAOI值保持90%。在图7(b)中,随着时间阈值θt(单位:秒)的变化,ARAOI取值情况与图7(a)相同。与其他两个算法GC_DM和MDAV的结果(不超过50%)相比,本发明所描述方法的AOI查询度量准确率要高得多。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

Claims (3)

1.一种基于三维网格划分的隐私保护轨迹数据发布方法,其特征在于,所述方法包括如下步骤:
S1、对轨迹数据进行预处理,预处理是指提取轨迹数据的时间及空间位置属性;
S2、基于位置点采样时间对每条轨迹首尾位置点间的缺失位置进行插值;
S3、对轨迹区域进行网格划分,划分为S个时空单元,S为正整数;
S4、基于各时空单元内子轨迹的时间、方向及空间位置来计算子轨迹间距离;
S5、在距离最近的两条子轨迹上寻找满足约束条件的位置点对,交换位置点对的时间及空间位置,获得匿名子轨迹;
S6、将分布在各时空单元内属于同一轨迹的匿名子轨迹进行重构,获得匿名轨迹数据集;
子轨迹Ti与子轨迹Tj间的距离计算方法包括如下步骤:
S41、识别子轨迹Ti及子轨迹Tj上的位置点数目;
S42、若子轨迹Ti及子轨迹Tj都只有一个位置点,则基于公式(2)进行计算:
Figure FDA0003051954400000011
其中,dist(Ti,Tj)为子轨迹Ti及子轨迹Tj间的距离,
Figure FDA0003051954400000012
Figure FDA0003051954400000013
分别是子轨迹Ti及子轨迹Tj上的唯一位置点,ε是用于测量具有不同时间值的两个位置之间差异的距离调整参数,ε设置为|ti-tj|;
若子轨迹Ti上只有一个位置点,子轨迹Tj上至少有两个位置点,则基于公式(3)进行计算:
Figure FDA0003051954400000021
其中,dist(Ti,Tj)为子轨迹Ti及子轨迹Tj间的距离,st和et分别为子轨迹Tj的起始时间和结束时间,
Figure FDA0003051954400000022
为三个位置点
Figure FDA0003051954400000023
Figure FDA0003051954400000024
组成的三角形面积,δ是一个距离调整参数;
若子轨迹Ti及子轨迹Tj上均至少有两个位置点,则基于公式(4)进行计算:
dist(Ti,Tj)=η*disto(Ti,Tj)+(1-η)*distl(Ti,Tj) (4)
其中,η为距离权值,设置为0.5,dist0(Ti,Tj)是轨迹方向距离,为两条子轨迹中重叠时间内所有轨迹段方向距离的平均值,distl(Ti,Tj)是轨迹位置距离,为轨迹中所有轨迹段位置距离的平均值,其中,dist0(Ti,Tj)的计算公式如(5)所示:
Figure FDA0003051954400000025
其中,
Figure FDA0003051954400000026
是指子轨迹Ti的第r个轨迹段,|ol(Ti,Tj)|表示子轨迹Ti和子轨迹Tj的重叠时间长度,stij和etij分别表示两条子轨迹重叠时间的起始时刻和终止时刻;
distl(Ti,Tj)的计算公式如(6)所示:
Figure FDA0003051954400000027
其中,当子轨迹Ti和子轨迹Tj之间存在共同周期,则令pt=100*min(ratio1,ratio2),ratio1是Ti和Tj重叠时长与Ti时长的比值,ratio2是Ti和Tj重叠时长与Tj时长的比值,若子轨迹Ti和子轨迹Tj不是同时段轨迹,则令pt=0,σr表示四个时空位置
Figure FDA0003051954400000028
Figure FDA0003051954400000029
组成的两个三角形面积之和。
2.如权利要求1所述基于三维网格划分的隐私保护轨迹数据发布方法,其特征在于,所述时空单元为G×G×G三维单元,G为划分参数,其中,
Figure FDA00030519544000000210
N为插补后的轨迹数据数目。
3.如权利要求1所述基于三维网格划分的隐私保护轨迹数据发布方法,其特征在于,步骤S5中的约束条件为:时间差小于或等于时间阈值θt,且空间距离小于或等于距离阈值θd
CN201810288419.XA 2018-04-03 2018-04-03 基于三维网格划分的隐私保护轨迹数据发布方法 Active CN108734022B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810288419.XA CN108734022B (zh) 2018-04-03 2018-04-03 基于三维网格划分的隐私保护轨迹数据发布方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810288419.XA CN108734022B (zh) 2018-04-03 2018-04-03 基于三维网格划分的隐私保护轨迹数据发布方法

Publications (2)

Publication Number Publication Date
CN108734022A CN108734022A (zh) 2018-11-02
CN108734022B true CN108734022B (zh) 2021-07-02

Family

ID=63940600

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810288419.XA Active CN108734022B (zh) 2018-04-03 2018-04-03 基于三维网格划分的隐私保护轨迹数据发布方法

Country Status (1)

Country Link
CN (1) CN108734022B (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110162997B (zh) * 2019-04-25 2021-01-01 安徽师范大学 基于插值点的匿名隐私保护方法
CN111506918B (zh) * 2020-04-09 2021-03-16 南京邮电大学 一种基于Bloom过滤器的移动轨迹隐私保护匹配方法
CN111460513B (zh) * 2020-04-27 2021-02-02 南京邮电大学 一种基于相似度分箱的空间点集数据隐私保护匹配的方法
CN112102357B (zh) * 2020-09-08 2023-07-25 杭州海康威视数字技术股份有限公司 轨迹调整方法、装置及设备、存储介质
CN113573234B (zh) * 2021-08-03 2022-04-12 中国矿业大学 一种大型室内位置服务场景下位置隐私保护方法
CN117835185B (zh) * 2023-12-14 2024-09-13 华南理工大学 一种车联网中基于区块链的条件轨迹隐私保护方法

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104331424A (zh) * 2014-10-15 2015-02-04 南京邮电大学 一种用户移动轨迹中敏感轨迹模式的净化方法
CN104618896A (zh) * 2015-01-07 2015-05-13 上海交通大学 一种基于网格密度的位置服务隐私保护方法及系统
CN105493587A (zh) * 2013-06-21 2016-04-13 慧与发展有限责任合伙企业 自适应位置扰动
CN105760780A (zh) * 2016-02-29 2016-07-13 福建师范大学 基于路网的轨迹数据隐私保护方法
CN105912616A (zh) * 2016-04-07 2016-08-31 电子科技大学 一种增强的基于轨迹重构的隐私保护方法
CN107072625A (zh) * 2014-08-11 2017-08-18 柯惠有限合伙公司 治疗程序规划系统和方法
CN107430402A (zh) * 2015-03-31 2017-12-01 深圳市大疆创新科技有限公司 用于对地理围栏设备进行标识和认证的系统和方法

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2993385B1 (fr) * 2012-07-16 2014-08-01 Egidium Technologies Procede et systeme de reconstruction de trajectoire 3d en temps reel
IN2014CH01331A (zh) * 2014-03-13 2015-09-18 Infosys Ltd
CN104200523B (zh) * 2014-09-11 2017-09-26 中国科学院自动化研究所 一种融合附加信息的大场景三维重建方法
CN104732588B (zh) * 2015-03-30 2016-06-01 中国测绘科学研究院 一种基于机载激光雷达点云的电力线三维重建方法
CN104992441B (zh) * 2015-07-08 2017-11-17 华中科技大学 一种面向个性化虚拟试衣的真实人体三维建模方法
US10044679B2 (en) * 2016-03-14 2018-08-07 Palo Alto Research Center Incorporated System and method for proxy-based privacy protection
CN106295395A (zh) * 2016-07-27 2017-01-04 福建师范大学 基于图划分的不确定轨迹隐私保护方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105493587A (zh) * 2013-06-21 2016-04-13 慧与发展有限责任合伙企业 自适应位置扰动
CN107072625A (zh) * 2014-08-11 2017-08-18 柯惠有限合伙公司 治疗程序规划系统和方法
CN104331424A (zh) * 2014-10-15 2015-02-04 南京邮电大学 一种用户移动轨迹中敏感轨迹模式的净化方法
CN104618896A (zh) * 2015-01-07 2015-05-13 上海交通大学 一种基于网格密度的位置服务隐私保护方法及系统
CN107430402A (zh) * 2015-03-31 2017-12-01 深圳市大疆创新科技有限公司 用于对地理围栏设备进行标识和认证的系统和方法
CN105760780A (zh) * 2016-02-29 2016-07-13 福建师范大学 基于路网的轨迹数据隐私保护方法
CN105912616A (zh) * 2016-04-07 2016-08-31 电子科技大学 一种增强的基于轨迹重构的隐私保护方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
Privacy protection for users of location-based services;Kang G. Shin 等;《 IEEE Wireless Communications》;20120223;第19卷(第1期);30-39页 *
基于位置服务的连续查询隐私保护研究;孙琪;《中国优秀硕士学位论文全文数据库 信息科技辑》;20160115(第01期);I138-60页 *
基于轨迹形状多样性的隐私保护算法;孙丹丹 等;《计算机应用》;20160610;第36卷(第6期);1544-1551页 *
基于非敏感信息分析的轨迹数据隐私保护发布;邓劲松 等;《计算机应用》;20170210;第37卷(第2期);488-493页 *

Also Published As

Publication number Publication date
CN108734022A (zh) 2018-11-02

Similar Documents

Publication Publication Date Title
CN108734022B (zh) 基于三维网格划分的隐私保护轨迹数据发布方法
Li et al. Reconstruction of human movement trajectories from large-scale low-frequency mobile phone data
Yan et al. Semantic trajectories: Mobility data computation and annotation
Si et al. An adaptive point-of-interest recommendation method for location-based social networks based on user activity and spatial features
Chen et al. Nlpmm: A next location predictor with markov modeling
Monreale et al. Movement data anonymity through generalization.
Parent et al. Semantic trajectories modeling and analysis
Zhou et al. A “semi-lazy” approach to probabilistic path prediction in dynamic environments
Chen et al. Constructing and comparing user mobility profiles
US20140089036A1 (en) Dynamic city zoning for understanding passenger travel demand
Pratesi et al. PRUDEnce: a system for assessing privacy risk vs utility in data sharing ecosystems
CN110602631B (zh) Lbs中抵御推测攻击的位置数据的处理方法和处理装置
CN110334293A (zh) 一种面向位置社交网络基于模糊聚类的具有时间感知位置推荐方法
Da Silva et al. Discovering frequent mobility patterns on moving object data
Tang et al. Trajectory clustering method based on spatial-temporal properties for mobile social networks
Vanhulsel et al. Measuring dissimilarity of geographically dispersed space–time paths
Nishida et al. Extracting arbitrary-shaped stay regions from geospatial trajectories with outliers and missing points
Li et al. Toward translating raw indoor positioning data into mobility semantics
Cavallaro et al. Measuring the impact of COVID-19 restrictions on mobility: A real case study from Italy
Xue et al. A novel destination prediction attack and corresponding location privacy protection method in geo-social networks
Zhao et al. GLTC: A metro passenger identification method across AFC data and sparse wifi data
Wei et al. Delle: Detecting latest local events from geotagged tweets
Li et al. An adaptive POI recommendation algorithm by integrating user's temporal and spatial features in LBSNs
Wen et al. Loc2Vec-Based cluster-level transition behavior mining for successive POI recommendation
Hajela et al. Crime hotspot prediction based on dynamic spatial analysis

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant