CN108111968B - 一种基于泛化的位置隐私保护方法 - Google Patents
一种基于泛化的位置隐私保护方法 Download PDFInfo
- Publication number
- CN108111968B CN108111968B CN201711380659.4A CN201711380659A CN108111968B CN 108111968 B CN108111968 B CN 108111968B CN 201711380659 A CN201711380659 A CN 201711380659A CN 108111968 B CN108111968 B CN 108111968B
- Authority
- CN
- China
- Prior art keywords
- time
- track
- equivalence class
- anonymous
- equivalence
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W4/00—Services specially adapted for wireless communication networks; Facilities therefor
- H04W4/02—Services making use of location information
- H04W4/023—Services making use of location information using mutual or relative location information between multiple location based services [LBS] targets or of distance thresholds
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W12/00—Security arrangements; Authentication; Protecting privacy or anonymity
- H04W12/02—Protecting privacy or anonymity, e.g. protecting personally identifiable information [PII]
Landscapes
- Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Computer Security & Cryptography (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种基于泛化的位置隐私保护方法,包括:将轨迹数据的起止时间规格化,并基于此进行等价类划分;寻找等价类间的包含关系,并按序进行分组;每个分组内,根据时间区间进行k‑匿名集合构建。本发明设计了有效的匿名分组方式,在提升匿名成功率的同时,平衡了隐私保护和数据可用性之间的矛盾,保证了挖掘型位置服务的质量。
Description
技术领域
本发明涉及一种基于泛化的位置隐私保护方法,属于位置隐私保护技术领域。
背景技术
随着无线技术的快速发展,智能手机等终端设备的普及,基于位置服务(location-based service,LBS)的应用日益广泛。服务商需要对收集的历史数据进行分析挖掘以获得用户的兴趣特点,在此过程中,可能造成用户隐私的泄露。Terrovitis M等人提出了基于敏感数据抑制的隐私保护算法,不仅考虑了攻击者可能具备的背景知识,还分析了时间因素对隐私保护的影响,在保护用户隐私的同时提高了减小了数据损失。Chen等人使用了局部敏感数据抑制策略,保护用户位置数据中存在的隐私信息,有效地平衡了数据可用性与隐私保护之间的矛盾。目前位置服务中急需能够防止服务商通过历史数据恶意挖掘用户隐私的技术。
发明内容
本发明所要解决的技术问题是克服现有技术的缺陷,提供一种基于泛化的位置隐私保护方法,通过设计有效的匿名分组方式,提升了匿名成功率。
为解决上述技术问题,本发明提供一种基于泛化的位置隐私保护方法,包括如下步骤:
1)采集不同用户在位置服务器采样时间内生成的各自的轨迹,构成原始轨迹数据集D={tr1,tr2...trm},将原始轨迹数据集中的每条轨迹进行预处理,然后进行等价类划分,得到原始轨迹数据集D的等价类集D′,下标m表示轨迹的数量;
其中,轨迹为位置服务商采集的用户位置数据按时间顺序排列形成的坐标集合,表示为:
trp={p1,p2,...pn},
下标n表示节点数;
轨迹中每个节点pi都包含一组时间与坐标信息,表示为:
pi=(ti,xi,yi);
2)对等价类进行分组;
3)在每个等价类分组内,根据时间区间进行k-匿名集构建。
前述的对轨迹进行预处理具体为,假设位置服务器对轨迹tri的采样时间区间为[tb,te],选取时间划分参数π,将轨迹tri中的数据起止时间规格化为π的整数倍,具体为,将轨迹tri的采样时间范围内能够被π除尽的最小时间点作为该轨迹的开始时间,能够被π除尽的最大时间点作为该轨迹的结束时间,表示为:tmin=min{t|t∈[tb,te]∧t modπ=0},tmax=max{t|t∈[tb,te]∧t modπ=0},t指的是[tb,te]中的任意值,tmin表示开始时间,tmax表示结束时间。
前述的进行等价类划分是指,规格化后的具有相同的开始和结束时间的轨迹构成一个等价类;将不同的等价类分别记为T1,T2,...,Ts,则原始轨迹数据集D的等价类集为:D′=T1∪T2∪...∪Ts,s为划分后等价类的个数。
前述的对等价类进行分组,包括以下步骤:
2-1)将所述步骤1)得到的等价类按照时间区间长度进行降序排序;
2-2)将每个等价类根据时间区间包含关系分组,存在包含关系的等价类按顺序依次加入到集合ST,构成一个等价类分组;
2-3)合并所有集合ST,形成有包含关系等价类分组的集合SD输出。
前述的在进行等价类分组时,对于彼此间不完全相交或者完全不相交的等价类,则单独构成一个等价类,同样通过集合SD输出,并进行下一步的k-匿名集构建。
前述的进行k-匿名集构建,包括以下步骤:
3-1)从每个等价类分组中找出时间区间最大的等价类开始匿名划分;匿名划分的过程分为两步,首先按照距离阈值d进行k-匿名划分构成Gtemp,即构成Gtemp的各条轨迹间距离必须大于等于d,接着对其中各条轨迹相同时刻的位置点采用随机交换方式进行数据扰动并重构;
3-2)如果在处理的等价类分组中的等价类产生不可匿名的轨迹,则判断该等价类分组中是否存在未匿名划分的等价类,如果存在,则转入步骤3-3);如果不存在,则丢弃该不可匿名的轨迹,然后转入步骤3-4);如果在处理的等价类分组中的等价类没有不可匿名的轨迹,则直接转入步骤3-4);所述不可匿名的轨迹就是无法满足距离阈值的轨迹,不能作为构成Gtemp的轨迹;
3-3)将所述步骤3-2)不可匿名的轨迹截去头尾多出的时间段,即可归入到后续的等价类中,然后对加入了该不可匿名轨迹后构成的新的等价类,继续进行匿名划分,直至该等价类分组的等价类都匿名划分完成;
3-4)生成该等价类分组的k-匿名集合;
3-5)合并所有等价类分组的k-匿名集合,输出最终匿名集合G。
前述的步骤3-1)中,轨迹间的距离计算如下:
若轨迹trp和轨迹trq为具有相同的时间采样序列的同步轨迹,那么两条轨迹之间的距离定义为:
时间采样序列指的是对轨迹进行离散采样的时间点的集合,同步轨迹指的是具有相同的采样起止时间,且时间采样序列完全一致的轨迹。
本发明所达到的有益效果:
(1)本发明设计了有效的匿名分组方式,在提升匿名成功率的同时,平衡了隐私保护和数据可用性之间的矛盾,保证了挖掘型位置服务的质量。
(2)本发明保护了用户的隐私安全,适用于现有的众多位置服务场景。
附图说明
图1是本发明的等价类分组过程示意图;图1(a)为等价类预处理示意图;图1(b)为等价类排序示意图;图1(c)为等价类分组示意图;
图2是本发明的基于泛化的位置隐私保护方法的流程图。
具体实施方式
下面结合附图对本发明作进一步描述。以下实施例仅用于更加清楚地说明本发明的技术方案,而不能以此来限制本发明的保护范围。
如图2所示,本发明的基于泛化的位置隐私保护方法,包括如下步骤:
1)轨迹数据集预处理:
位置服务商采集的用户位置数据按时间顺序排列形成的坐标集合称为轨迹,可以表示为:trp={p1,p2,...pn},其中,每个节点都包含一组时间与坐标信息,即pi=(ti,xi,yi),下标n表示节点数。
采集不同用户在位置服务器采样时间内生成的各自的轨迹,构成原始轨迹数据集,将原始轨迹数据的起止时间规格化,并基于此进行等价类划分,具体过程如下:
对原始轨迹数据集D={tr1,tr2...trm}中的每条轨迹tri进行预处理,下标m表示轨迹的数量,tri表示第i用户的轨迹。假设位置服务器对轨迹tri的采样时间区间为[tb,te],选取时间划分参数π,将轨迹tri中的数据起止时间规格化为π的整数倍,具体为,将轨迹tri的起止时间范围内能够被π除尽的最小时间点作为该轨迹的开始时间,能够被π除尽的最大时间点作为该轨迹的结束时间,表示为:
tmin=min{t|t∈[tb,te]∧tmodπ=0},tmax=max{t|t∈[tb,te]∧tmodπ=0},t指的是[tb,te]中的任意值。
所有的轨迹都进行起止时间规格化,规格化后具有共同的开始和结束时间的轨迹构成一个等价类,如图1(a)。
将不同的等价类分别记为T1,T2,...,Ts,s为划分后等价类的个数,那么最终的关于原始轨迹数据集D的等价类集为D′=T1∪T2∪...∪Ts。
2)等价类分组:寻找等价类间的包含关系,并按序进行分组;
寻求等价类集D′中等价类间的包含关系,具体过程为,首先将经过步骤1)预处理后的等价类按照时间区间(等价类的开始时间和结束时间区间)长度进行降序排序,如图1(b)。然后将每个等价类根据时间区间包含关系分组,存在包含关系的等价类按顺序依次加入到集合ST,构成一个等价类分组,最后合并所有集合ST,形成有包含关系等价类分组的集合SD输出,如图1(c)。
例如,若轨迹tr1的起止时间为15.11到15.47,轨迹tr2的起止时间为15.13到15.52,设时间参数为π=5min,那么计算tmin,发现tr1的起止时间范围内15.15为最小的能除尽5的数,故tmin=15.15,同理15.45为tr1的起止时间范围内最大的能除尽5的数,故tmax=15.45。而对于轨迹tr2,tmin=15.15,tmax=15.5。
在两条轨迹的时间段内15.15为最小的能整除5的数,故tmin=15.15,同理15.45为两条轨迹时间段内最大的能整除5的数,故tmax=15.45。如此,两条轨迹都被规格化为相同的起止时间15.15到15.45。由此可见,两者的开始时间相同,但结束时间不同,故不属于一个等价类,但是存在包含关系,是一个等价类的分组。
经过规格化后的轨迹具有相同的起止时间,构成了一个等价类。不同等价类间的起止时间当然是不同的,彼此间存在三种关系,区间包含、时间区间相交、时间区间不相交。对于区间包含的等价类,构成一个等价类的分组;对于彼此间只部分相交或者完全不相交的等价类,则单独构成一个等价类的分组,同样通过集合SD输出,并进行下一步的k-匿名集构建。
具体等价类分组算法程序如下:
3)构建匿名集:每个等价类分组内,根据时间区间进行k-匿名集构建,具体过程为,
首先从每个等价类分组中找出时间区间最大的等价类开始匿名划分,匿名划分的过程分为两步,首先按照距离阈值d进行k-匿名划分构成Gtemp,即构成Gtemp的各条轨迹间距离必须大于等于d,接着对其中各条轨迹相同时刻的位置点采用随机交换方式进行数据扰动并重构。
轨迹间的距离计算如下:
若轨迹trp和轨迹trq为具有相同的时间采样序列的同步轨迹,那么两条轨迹之间的距离可以定义为:
采样序列指的是对轨迹进行离散采样的时间点的集合,如:(8点,8点半,9点,9点半)就是一个时间采样序列,同步轨迹指的是具有相同的采样起止时间,且采样序列完全一致的轨迹。
匿名划分过程中,对于产生的不可匿名的轨迹,截去头尾多出的时间段,即可归入到后续的等价类中,然后对新的等价类进行匿名划分。不可匿名的轨迹就是无法满足距离阈值的轨迹,不能作为构成Gtemp的轨迹。
由于等价类分组中,各等价类的起始时间依次后延,终止时间依次提前,如图1(c),所以产生的不可匿名的轨迹经过处理后可以加入到下一个等价类中,然后对新的等价类进行匿名划分。新的等价类就是加入了上一个等价类中的不可匿名轨迹后构成的等价类。
不断重复此过程,直至一个等价类分组内的所有等价类都完成匿名划分,生成一个k-匿名集合。对于不同的等价类分组,产生的不可匿名的轨迹则予以删除,最终合并所有等价类分组的k-匿名集合,输出最终匿名集合G。
构建匿名集的算法程序如下:
术语解释:k-匿名是指一个用户的位置信息不能与其他k-1个用户相区别,攻击者在不具备其他背景知识的前提下,将匿名集中的查询请求关联到真实用户概率不超过1/k。
用户在请求位置服务过程中采用本发明的位置隐私保护算法,即使位置服务商拥有大量用户的历史数据,但整个数据集由多个k-匿名集合,每个集合内的用户历史位置数据具有较高的相似性,最终位置服务商进行挖掘时,可以获得所需的关于用户整体性的模式信息,进而提供相应的位置服务,而无法获取用户个人的位置隐私。另外,数据在匿名集构建过程中,经过扰动处理,服务商内部的恶意攻击者无法将某些位置数据与具体的用户进行关联,进一步保护了用户的隐私。所以本发明保护了用户的隐私安全,同时提升了挖掘型位置服务的服务质量,尤其适用于现有的众多位置服务场景。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明技术原理的前提下,还可以做出若干改进和变形,这些改进和变形也应视为本发明的保护范围。
Claims (5)
1.一种基于泛化的位置隐私保护方法,其特征在于,包括如下步骤:
1)采集不同用户在位置服务器采样时间内生成的各自的轨迹,构成原始轨迹数据集D={tr1,tr2...trm},将原始轨迹数据集中的每条轨迹进行预处理,然后进行等价类划分,得到原始轨迹数据集D的等价类集D′,下标m表示轨迹的数量;
其中,轨迹为位置服务商采集的用户位置数据按时间顺序排列形成的坐标集合,表示为:
trp={p1,p2,...pn},
下标n表示节点数;
轨迹中每个节点pi都包含一组时间与坐标信息,表示为:
pi=(ti,xi,yi);
对轨迹进行预处理具体为,假设位置服务器对轨迹tri的采样时间区间为[tb,te],选取时间划分参数π,将轨迹tri中的数据起止时间规格化为π的整数倍,具体为,将轨迹tri的采样时间范围内能够被π除尽的最小时间点作为该轨迹的开始时间,能够被π除尽的最大时间点作为该轨迹的结束时间,表示为:tmin=min{t|t∈[tb,te]∧t modπ=0},tmax=max{t|t∈[tb,te]∧t modπ=0},t指的是[tb,te]中的任意值,tmin表示开始时间,tmax表示结束时间;
所述进行等价类划分是指,规格化后的具有相同的开始和结束时间的轨迹构成一个等价类;将不同的等价类分别记为T1,T2,...,Ts,则原始轨迹数据集D的等价类集为:D′=T1∪T2∪...∪Ts,s为划分后等价类的个数;
2)对等价类进行分组;
3)在每个等价类分组内,根据时间区间进行k-匿名集构建,包括:
3-1)从每个等价类分组中找出时间区间最大的等价类开始匿名划分;匿名划分的过程分为两步,首先按照距离阈值d进行k-匿名划分构成Gtemp,即构成Gtemp的各条轨迹间距离必须大于等于d,接着对其中各条轨迹相同时刻的位置点采用随机交换方式进行数据扰动并重构;
3-2)如果在处理的等价类分组中的等价类产生不可匿名的轨迹,则判断该等价类分组中是否存在未匿名划分的等价类,如果存在,则转入步骤3-3);如果不存在,则丢弃该不可匿名的轨迹,然后转入步骤3-4);如果在处理的等价类分组中的等价类没有不可匿名的轨迹,则直接转入步骤3-4);所述不可匿名的轨迹就是无法满足距离阈值的轨迹,不能作为构成Gtemp的轨迹;
3-3)将所述步骤3-2)不可匿名的轨迹截去头尾多出的时间段,即可归入到后续的等价类中,然后对加入了该不可匿名轨迹后构成的新的等价类,继续进行匿名划分,直至该等价类分组的等价类都匿名划分完成;
3-4)生成该等价类分组的k-匿名集合;
3-5)合并所有等价类分组的k-匿名集合,输出最终匿名集合G。
2.根据权利要求1所述的一种基于泛化的位置隐私保护方法,其特征在于,所述对等价类进行分组,包括以下步骤:
2-1)将所述步骤1)得到的等价类按照时间区间长度进行降序排序;
2-2)将每个等价类根据时间区间包含关系分组,存在包含关系的等价类按顺序依次加入到集合ST,构成一个等价类分组;
2-3)合并所有集合ST,形成有包含关系等价类分组的集合SD输出。
4.根据权利要求2所述的一种基于泛化的位置隐私保护方法,其特征在于,在进行等价类分组时,对于彼此间不完全相交或者完全不相交的等价类,则单独构成一个等价类,同样通过集合SD输出,并进行下一步的k-匿名集构建。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711380659.4A CN108111968B (zh) | 2017-12-20 | 2017-12-20 | 一种基于泛化的位置隐私保护方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711380659.4A CN108111968B (zh) | 2017-12-20 | 2017-12-20 | 一种基于泛化的位置隐私保护方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108111968A CN108111968A (zh) | 2018-06-01 |
CN108111968B true CN108111968B (zh) | 2020-08-21 |
Family
ID=62210373
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201711380659.4A Active CN108111968B (zh) | 2017-12-20 | 2017-12-20 | 一种基于泛化的位置隐私保护方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108111968B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11641346B2 (en) | 2019-12-30 | 2023-05-02 | Industrial Technology Research Institute | Data anonymity method and data anonymity system |
CN113438603B (zh) * | 2021-03-31 | 2024-01-23 | 南京邮电大学 | 一种基于差分隐私保护的轨迹数据发布方法及系统 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103281672A (zh) * | 2013-06-08 | 2013-09-04 | 南京大学 | 一种移动终端进行位置隐私保护的方法 |
EP2701133A1 (de) * | 2012-08-22 | 2014-02-26 | Kapsch TrafficCom AG | Verfahren und Vorrichtungen zur Bildaufnahme eines geschwindigkeitsübertretenden Fahrzeugs |
CN105760780A (zh) * | 2016-02-29 | 2016-07-13 | 福建师范大学 | 基于路网的轨迹数据隐私保护方法 |
CN106650486A (zh) * | 2016-09-28 | 2017-05-10 | 河北经贸大学 | 路网环境中的轨迹隐私保护方法 |
CN107145796A (zh) * | 2017-04-24 | 2017-09-08 | 公安海警学院 | 一种不确定环境下轨迹数据k‑匿名隐私保护方法 |
-
2017
- 2017-12-20 CN CN201711380659.4A patent/CN108111968B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2701133A1 (de) * | 2012-08-22 | 2014-02-26 | Kapsch TrafficCom AG | Verfahren und Vorrichtungen zur Bildaufnahme eines geschwindigkeitsübertretenden Fahrzeugs |
CN103281672A (zh) * | 2013-06-08 | 2013-09-04 | 南京大学 | 一种移动终端进行位置隐私保护的方法 |
CN105760780A (zh) * | 2016-02-29 | 2016-07-13 | 福建师范大学 | 基于路网的轨迹数据隐私保护方法 |
CN106650486A (zh) * | 2016-09-28 | 2017-05-10 | 河北经贸大学 | 路网环境中的轨迹隐私保护方法 |
CN107145796A (zh) * | 2017-04-24 | 2017-09-08 | 公安海警学院 | 一种不确定环境下轨迹数据k‑匿名隐私保护方法 |
Non-Patent Citations (2)
Title |
---|
基于K_匿名技术的隐私保护研究;李林;《中国优秀硕士学位论文全文数据库信息科技辑》;20140910;全文 * |
基于轨迹预测的动态匿名算法;马佳仕等;《计算机与现代化》;20160126;全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN108111968A (zh) | 2018-06-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Cheng et al. | K-isomorphism: privacy preserving network publication against structural attacks | |
Monreale et al. | Movement data anonymity through generalization. | |
Zawoad et al. | Digital forensics in the age of big data: Challenges, approaches, and opportunities | |
Jin et al. | A survey and experimental study on privacy-preserving trajectory data publishing | |
Primault et al. | Time distortion anonymization for the publication of mobility data with high utility | |
CN109117669B (zh) | MapReduce相似连接查询的隐私保护方法及系统 | |
Fan et al. | A practical framework for privacy-preserving data analytics | |
CN111475838B (zh) | 基于深度神经网络的图数据匿名方法、装置、存储介质 | |
CN110602631B (zh) | Lbs中抵御推测攻击的位置数据的处理方法和处理装置 | |
WO2022142268A1 (zh) | 面向本质计算的跨dikw模态的相对差分隐私保护方法 | |
CN108111968B (zh) | 一种基于泛化的位置隐私保护方法 | |
Qiu et al. | Mobile semantic-aware trajectory for personalized location privacy preservation | |
Tai et al. | Structural diversity for privacy in publishing social networks | |
CN107070932B (zh) | 社会网络动态发布中防止标签邻居攻击的匿名方法 | |
Qian et al. | Social network de-anonymization: More adversarial knowledge, more users re-identified? | |
Zhang et al. | Large-scale dynamic social network directed graph k-in&out-degree anonymity algorithm for protecting community structure | |
Zou et al. | Verifiable keyword-based semantic similarity search on social data outsourcing | |
Huang et al. | On the understanding of interdependency of mobile app usage | |
CN106778352B (zh) | 集值数据和社会网络数据联合发布的多源隐私保护方法 | |
Zhang et al. | A local differential privacy trajectory protection method based on temporal and spatial restrictions for staying detection | |
Wang et al. | Top-k socially constrained spatial keyword search in large siot networks | |
Yao et al. | Topic-based rank search with verifiable social data outsourcing | |
Li et al. | Privacy preservation in social network against public neighborhood attacks | |
Li et al. | LRDM: Local Record-Driving Mechanism for Big Data Privacy Preservation in Social Networks | |
CN112069532B (zh) | 一种基于差分隐私的轨迹隐私保护方法与装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |