CN112035880B - 一种基于偏好感知的轨迹隐私保护服务推荐方法 - Google Patents
一种基于偏好感知的轨迹隐私保护服务推荐方法 Download PDFInfo
- Publication number
- CN112035880B CN112035880B CN202010945126.1A CN202010945126A CN112035880B CN 112035880 B CN112035880 B CN 112035880B CN 202010945126 A CN202010945126 A CN 202010945126A CN 112035880 B CN112035880 B CN 112035880B
- Authority
- CN
- China
- Prior art keywords
- user
- preference
- zone
- mix
- attribute
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 59
- 230000008447 perception Effects 0.000 title claims abstract description 16
- 230000007246 mechanism Effects 0.000 claims abstract description 11
- 238000004422 calculation algorithm Methods 0.000 claims description 79
- 230000008569 process Effects 0.000 claims description 16
- 230000006870 function Effects 0.000 claims description 12
- 238000004364 calculation method Methods 0.000 claims description 8
- 230000008859 change Effects 0.000 claims description 6
- 230000035945 sensitivity Effects 0.000 claims description 5
- 101000947178 Homo sapiens Platelet basic protein Proteins 0.000 description 12
- 102100036154 Platelet basic protein Human genes 0.000 description 12
- KMGARVOVYXNAOF-UHFFFAOYSA-N benzpiperylone Chemical compound C1CN(C)CCC1N1C(=O)C(CC=2C=CC=CC=2)=C(C=2C=CC=CC=2)N1 KMGARVOVYXNAOF-UHFFFAOYSA-N 0.000 description 12
- 238000004458 analytical method Methods 0.000 description 6
- 238000010586 diagram Methods 0.000 description 4
- 230000001965 increasing effect Effects 0.000 description 4
- 238000011160 research Methods 0.000 description 4
- 230000000694 effects Effects 0.000 description 3
- 238000000605 extraction Methods 0.000 description 3
- 238000012502 risk assessment Methods 0.000 description 3
- 238000012545 processing Methods 0.000 description 2
- 238000004088 simulation Methods 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 238000012795 verification Methods 0.000 description 2
- 101100256916 Caenorhabditis elegans sid-1 gene Proteins 0.000 description 1
- 101100256918 Caenorhabditis elegans sid-2 gene Proteins 0.000 description 1
- 101000911753 Homo sapiens Protein FAM107B Proteins 0.000 description 1
- 102100026983 Protein FAM107B Human genes 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 230000001934 delay Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 238000013139 quantization Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/60—Protecting data
- G06F21/62—Protecting access to data via a platform, e.g. using keys or access control rules
- G06F21/6218—Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
- G06F21/6245—Protecting personal data, e.g. for financial or medical purposes
- G06F21/6254—Protecting personal data, e.g. for financial or medical purposes by anonymising data, e.g. decorrelating personal data from the owner's identification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9537—Spatial or temporal dependent retrieval, e.g. spatiotemporal queries
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Bioethics (AREA)
- Data Mining & Analysis (AREA)
- Computer Security & Cryptography (AREA)
- Software Systems (AREA)
- Computer Hardware Design (AREA)
- Medical Informatics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种基于偏好感知的轨迹隐私保护服务推荐方法,包括:步骤1、对待查询用户的初始位置进行匿名;步骤2、确定所述待查询用户的偏好以及背景信息后,根据所述待查询用户的对位置的不同偏好,划分出不同的隐私风险等级;步骤3、采取拉普拉斯保护机制向查询结果中添加噪声;步骤4、将添加噪声后的位置进行组合形成行的匿名轨迹。
Description
技术领域
本发明涉及信息安全领域,尤其涉及一种基于偏好感知的轨迹隐私保护服务推荐方法。
背景技术
基于位置的个性化服务推荐系统能较好地结合用户的地理位置,帮助用户获得个人所需的信息,快速的为用户提供有效的个性化服务。但在推荐的过程中,用户信息的泄露问题十分严峻,用户的个人信息以及推荐列表中的敏感信息的泄露会对用户造成一定的威胁,如何防止用户信息的泄露,同时又能精确高效地为用户提供个性化服务,是当前研究面临的主要难点。
现如今越来越多的学者重视隐私保护的问题,在过去的研究中,提出的研究方案大都是在用户信息和位置服务中混淆,现有方法对用户信息大多采用mix-zone、k-匿名、扰动、泛化等方法,但却忽视了信息追踪问题;对位置服务大多采用基于差分隐私的加密方法,但却忽视了加躁机制的添加问题。
发明内容
基于上述技术问题,本发明设计开发了一种基于偏好感知的轨迹隐私保护服务推荐方法,解决了用户敏感信息泄露、数据可用性低以及缺乏自适应的问题。
本发明提供的技术方案为:
一种基于偏好感知的轨迹隐私保护服务推荐方法,包括如下步骤:
步骤1、对待查询用户的初始位置进行匿名;
步骤2、确定所述待查询用户的偏好以及背景信息后,根据所述待查询用户的对位置的不同偏好,划分出不同的隐私风险等级;
步骤3、采取拉普拉斯保护机制向查询结果中添加噪声;
步骤4、将添加噪声后的位置进行组合形成行的匿名轨迹。
优选的是,在所述步骤1中,基于聚类的mix-zone算法对初始位置进行匿名过程包括:
步骤1.1、使用sim(As,As′)量化属性相似性,若存在sim(As,As′)<λ则认为进出mix-zone的用户为同一用户;
其中,sim(.)为相似性,As=(a1,a2,……,am)为某一指定被追踪用户的属性,As′=(a1′,a2′,……,am′)为所述指定被追踪用户离开mix-zone之后表现出的属性,m为可被识别的属性数量,a1,a2,……,am为As的属性,a1′,a2′,……,am′为As′的属性,λ为可被攻击者使用的相似属性最小阈值;
步骤1.2、假设拟将数据聚类为k个种类,则选取k个初始中心位置后,分别计算样本数据至各个初始中心位置的欧式距离:
其中,sj,表示计算(i,j)位置的欧氏距离;sjn表示第n个点的第j维坐标,/>表示第n个点的第i维坐标;
步骤1.3、从n个位置数据集中随机选择k个对象作为初始的代表对象,将剩下的所有对象分配到最近的代表所代表的簇,随机选择一个非代表对象Orandom,计算用Orandom代替代表对象Oi的总代价S,如果S<0,Oi代替Orandom,生成一组新的k个代表对象,直到没有发生更改;每个簇分别做下列步骤:
RSU集合SMZ←Φ,初始化节点数目SMZ,N←0,当N≤K时,SMZ←SMZ∪AZT,N←N+n,将SMZ合并到List(SMZ),通过计算H,选择聚类中最大的mix-zone。
优选的是,在所述步骤2中,通过构建用户的用户熟悉度确定所述待查询用户的偏好以及背景信息:
式中,为用户从位置i转移到位置j的概率,/>为用户对每一语义类型的用户熟悉度,/>为位置在对应语义类型中的位置流行度。
优选的是,在所述步骤2中,通过构建用户的位置流行度确定所述待查询用户的偏好以及背景信息:
式中,为用户从位置i转移到位置j的概率,/>为用户对每一语义类型的用户熟悉度,/>为位置在对应语义类型中的位置流行度。
优选的是,在所述步骤3中,采取拉普拉斯保护机制向查询结果中添加噪声过程包括:
对于任一一个函数f:D→Rd,函数f的全局敏感性为Δf=maxD,D′|f(D)-f(D′)|,D和D′为相邻数据集,d为函数输出的维度,所述概率差异公式为
本发明与现有技术相比较所具有的有益效果:
1、本发明提出的基于偏好感知的轨迹隐私保护服务推荐算法分两部分进行隐私保护,首先提出了一种能够实现用户属性不可关联且mix-zone中用户无法获知彼此真实信息的隐私保护方法,该方法通过秘密选择代理,并由代理完成私密相似属性计算,最终实现离开mix-zone的用户彼此间的属性不可关联;通过与现有相关mix-zone的算法进行比较,证明本发明所提基于聚类的mix-zone算法的有效性和算法执行效率更有优势;
2、本发明还提出了一种基于差分隐私的偏好感知算法(PPBP),针对位置社交网络下敏感位置攻击,通过语义描述和行为模式提取的方法进行偏好建模,根据偏好模型进行隐私风险评定,按照位置匿名规则添加对应的拉普拉斯噪声机制,将匿名后的位置按原轨迹序列的顺序连接起来,以生成匿名的轨迹序列;
3、本发明提供的算法既能在一定程度上减少运行的花费时间又能提高数据的可用性且能够有效的保护敏感数据的隐私性,未来将继续研究隐私保护在位置轨迹中的应用。
附图说明
图1为属性变化导致的信息熵变化曲线示意图。
图2为随用户数量变化导致的进出mix-zone用户可关联性差异图。
图3为随属性变化的算法执行成功率示意图。
图4为随用户数变化的算法执行成功率示意图。
图5为轨迹匿名算法示例示意图。
图6为数据效应对比图。
图7为执行效率对比图。
具体实施方式
下面结合附图对本发明做进一步的详细说明,以令本领域技术人员参照说明书文字能够据以实施。
本发明提出的一种基于偏好感知的轨迹隐私保护服务推荐方法,为了提高个性化服务轨迹隐私的保护性能,基于现有研究结果及存在的问题,提出并设计了基于偏好感知的轨迹隐私保护服务推荐方法;本发明考虑到mix-zone在路网中生成一个隐私保护的区域,当用户过多时,可被攻击者利用属性追踪的方法进行拦截,所以需要利用聚类方法对用户进行聚类,同一簇中的用户同时进行属性泛化,提高相似属性的混淆性和算法执行效率;另外,还考虑到差分隐私加躁机制的添加问题,所以需要对噪声的添加进行合理的分配,采用了偏好感知的方法,针对不同用户对不同位置的敏感程度的不同,设计偏好感知模型和噪声分布表,提高轨迹数据安全性的同时也有利于算法的执行效率。
本发明提出的基于偏好感知的轨迹隐私保护服务推荐方法的核心思想在于:第一层隐私保护:当用户需要进行推荐查询时,用户的真实位置和真实信息就会暴露出来,此时运用基于聚类的mix-zone算法进行隐私保护,mix-zone在路网中生成一个隐私保护的区域,然后对输入查询命令的所有用户进行聚类,同一簇中的用户同时进行属性泛化,提高了相似属性的混淆性,这既节省加密时间又增强了隐私保护;第二层保护:由于不同用户对于不同位置的敏感程度不同,所以需要根据用户对不同位置的偏好划分风险等级,运用基于差分隐私的偏好感知算法,按照重要程度设置不同的隐私预算,在服务推荐数据集中加入与其对应的Laplace噪声;
具体流程包括如下步骤:
步骤1、位置空间匿名:通过基于聚类的mix-zone算法对查询用户的初始位置进行匿名;
步骤2、偏好模型建立:通过HITS算法的中心节点和权威节点找出用户的偏好以及背景信息;
步骤3、隐私风险评定:根据用户对位置的不同偏好,划分出不同的隐私风险等级,采取不同程度的Laplace保护机制;
步骤4、位置轨迹匿名:根据加躁后各个位置的布局,按照顺序将已经加噪的位置组合到一起形成新的匿名轨迹。
在步骤1中,mix-zone算法:使用sim(As,As′)量化属性相似性,其中sim(.)表示相似性,设某一指定被追踪用户的属性为As=(a1,a2,……,am),该用户离开mix-zone之后表现出的属性为As′=(a1′,a2′,……,am′),若存在sim(As,As′)<λ,则可认为这2种属性为同一用户所表现,即进出mix-zone用户为同一用户,其中,m为可被识别的属性数量;其中,As为指定用户的原本属性,a1,a2,……,am为As的属性,As′为指定用户在离开匿名域后用户的属性,a1′,a2′,……,am′为As′的属性,λ为攻击者可使用的属性相似最小阈值。
聚类算法:一种适用于大规模数据的高效数据挖掘方法;假设拟将数据聚类为k个种类,则首先选取k个初始中心位置,记为其中i=1,2,3,…,k;然后,分别计算样本数据至各个初始中心位置的欧式距离如下:
式中,sj,/>表示计算(i,j)位置的欧氏距离;sjn表示第n个点的第j维坐标,/>表示第n个点的第i维坐标;
聚类算法把数据对象集划分成多个组或簇,簇内的对象具有很高的相似性,但与其他簇中的对象很不相似,mix-zone在路网中生成一个隐私保护的区域,然后对输入查询命令的所有用户进行聚类,同一簇中的用户同时进行属性泛化,提高了相似属性的混淆性。
在步骤2中,偏好模型建立通过偏好感知建立:偏好感知是用来解决如何有效的从移动轨迹数据中提取用户的运动模式,进而实现一种轨迹匿名;
本发明需要构建用户的偏好模型,主要从用户熟悉度和位置流行度两个方面进行:
用户熟悉度:中心节点的个数表示用户熟悉度,可以通过权威节点的值的综合来计算用户熟悉度,计算过程如下:
式中,表示用户从位置i转移到位置j的概率,/>表示用户对每一语义类型的用户熟悉度,/>表示位置在对应语义类型中的位置流行度;
位置流行度:权威节点的个数表示位置流行度,可以通过中心节点的值的总和来计算位置流行度,计算过程如下:
式中,表示用户从位置i转移到位置j的概率,/>表示用户对每一语义类型的用户熟悉度,/>表示位置在对应语义类型中的位置流行度;
应用服务器根据用户的兴趣对用户进行个性化服务推荐,对推荐的原始轨迹K进行语义描述和行为模式提取,然后考虑用户对语义类型的熟悉度以及位置流行度的分析计算,生成偏好模型,根据用户在偏好模型中地理位置的偏好,生成隐私风险评级标准,并加入适当的差分隐私预算ε,生成匿名轨迹K′,最后将结果返回服务器,以实现位置社交网络的个性化轨迹隐私保护。
在步骤3中,差分隐私:Laplace机制通过向查询结果中添加噪声,使真实输出值产生概率波动,从而实现ε-差分隐私保护;由于Laplace噪声服从概率分布,在相邻数据集上分别进行相同的查询,可能得到相同的结果,对于任意一个函数f:D→Rd,函数f的全局敏感性为Δf=maxD,D′|f(D)-f(D′)|,D和D′为相邻数据集,d为函数输出的维度;概率差异公式如下:
对本发明中的算法进行进一步的算法描述包括:
算法1:
输入:初始位置数据集SID1、SID2、...、SIDn,更新增量n;
输出:位置空间匿名标识符Alias(SID1)、Alias(SID2)、...、Alias(SIDn);
1.真实位置标识符SIDm→Alias(SIDm);
2.从n个位置数据集中随机选取k个对象作为初始的代表对象
3.repeat;
4.将每个剩余的对象分配到最近的代表所代表的簇;
5.随机选择一个非代表对象Orandom;
6.计算用Orandom代替代表对象Oj的总代价S;
7.if S<0,then Orandom替换Oj,形成新的k个代表对象的集合;
8.Until不发生变化;
9.每个簇分别做下列步骤;
10.RSU集合SMZ←Φ;
11.初始化节点数目SMZ,N←0;
12.当N≤K时;
13.SMZ←SMZ∪AZT;
14.N←N+n;
15.将SMZ合并到List(SMZ);
16.通过计算H;
17.选择聚类中最大的mix-zone;
18.结束。
其中,公式H中的参数定义:j、h表示用户位置点;n表示最大位置数;k表示聚类个数。
算法2:
输入:用户熟悉度阈值λ,位置流行度阈值τ,原始轨迹序列K,位置匿名空间Z;
输出:匿名轨迹K′;
1.定义len表示原始轨迹序列的长度;
2.初始化K′=φ,i=1,j=1;
3.when i<len do
4.判断位置Li的类型C;
5.计算用户熟悉度和位置流行度/>的值;
6.While j<t do;
7.If&&/>then;
8.将位置Li加入到
9.Else If&&/>then
10.随机选择一个与Li具有相同语义类型的位置Li′;
11.将位置Li′加入到
12.Else If&&/>then
13.随机选择一个与Li不具有相同语义类型的位置
14.将位置加入到/>
15.Else If&&/>then
16.将位置Li从中删除;
17.End if
18.j=j+1;
19.End while
20.i=i+1;
21.End while
22.返回加入不同隐私预算参数ε噪音;
23.输出匿名轨迹K*;
24.结束。
实施例
为了证明本发明方法的有效性,仿真实验采用GPS Trajectories withtransportationmode labels数据集作为实验数据集,它包含了17621个轨迹信息,并采用Python语言、虚拟机和My Eclipse集成开发软件开发实现。为了有效验证本发明方法的性能,分别从隐私保护能力、数据效应和算法执行效率进行仿真实验与结果分析。
基于聚类的mix-zone算法:
1、隐私保护能力分析
为了验证本发明所提基于聚类的mix-zone算法在隐私保护能力和算法执行效率这2个方面的优势,在测试的过程中与当前的一些同类算法进行了比较,参与比较的算法有AG mix-zone算法、通过移动耽搁泛化查询间隔时间的等待忍耐mix-zone(delay-tolerantmix-zone)、利用mix-zone变形降低关联程度的偏移mix-zone(shifted mix-zone)、多维mix-zone授权的多维mix-zone(multiple mix-zone)、和基于身份验证加密的加密mix-zone(cryptographic mix-zone)。
从图1中可以看出,除了本发明所提基于聚类的mix-zone算法外,在用户数量一定的前提下,其余算法的信息熵均随属性数量的增加而减小。这是由于本发明算法主要针对mix-zone中的用户利用量化的多属性相似计算完成属性泛化,该方法处理的属性数量大大超过了其他算法;从图2中可以看出,随着用户数量的变化,成对熵表示的用户可关联性均无变化,呈直线状态。这是由于在实验测试过程中,针对的是已确定的进出用户,成对熵表现的是同一用户在进入和离开mix-zone中的可关联性变化,这种变化不随其他用户的加入而受影响。但是在这些平行的直线中,基于聚类的mix-zone算法的成对熵取值要高于其他算法,这是由于基于聚类的mix-zone算法对表现出来的所有属性展开了泛化,其可关联特性降到最低,即使在确定进出用户是同一用户的前提下,仍不可用属性相似的原理来确定该用户。
2、算法执行效率分析
从图3中可以看出,在mix-zone下随属性变化导致的算法执行产生的成功率差异。基于聚类的mix-zone算法的执行成功率受属性变化的影响较小,仅当属性数量超过某一阈值时才逐渐表现出成功率的降低,这是由于该算法是通过属性量化后展开的相似属性泛化实现的隐私保护,算法所处理的是属性共有值而不是单独某一个值,而表现为不受属性数量影响的处理过程。而其他算法中,由于是直接对属性展开泛化,因此在属性增加的情况下,需要寻找满足属性相似的大量用户,在一定程度上,因属性数量增加而导致的相似属性用户寻找的困难造成了算法执行成功率的降低。从图4中可以看出,在mix-zone中随着用户数量的增加,各算法的执行成功率逐渐降低,这是由于所有算法均需要在mix-zone中找到足够的用户以满足当前属性泛化所要求的用户数量,当不能找到足够数量的用户情况下,算法执行失败。在这些算法中,基于聚类的mix-zone算法的执行成功率受用户数量的影响较小,这是由于该算法通过mix-zone中用户彼此间的聚类和多方安全计算来完成属性泛化,算法的执行仅需要找到足够数量的用户即可,并不需要对用户情况加以限制。
实验验证结果可以看出,该算法可更好地应用在实际路网环境的部署当中,有效地提高了隐私保护能力和算法执行效率。
基于差分隐私的偏好感知算法:
如图5所示为偏好感知的轨迹匿名算法的一个示例。上半部分表示一个用户的原始轨迹,下半部分表示对应的匿名轨迹序列。其中,位置L1,与位置L5属于隐私风险评级NFNP,位置L2属于隐私风险评级FP,位置L3属于隐私风险评级FNP,位置L4属于隐私风险评级NFP。
表1显示了轨迹隐私保护中ε的分类情况,可信第三方可以针对不同的隐私风险评级,利用差分隐私加躁的方法,对不同的轨迹位置添加相应的噪声。
表1 ε的添加分布情况
1、数据效用分析对比
通过基于差分隐私的偏好感知算法(PPBP)与现有的匿名方法和偏好感知隐私保护算法(PTPP),在数据效用和执行效率两个方面的对比,来观察PPBP算法的优势。首先是数据效应的对比,本发明采用轨迹隐私保护过程中的信息丢失量来衡量其数据效用。信息丢失量可以由以下公式得出。
公式中m表示删除位置的个数、q表示删除位置的终值、n表示匿名空间的位置个数、i、j表示匿名空间的位置。
其中,area(zone(Zi,tj))表示位置匿名空间Zi在tj时刻的区域大小,Lm表示删除的位置,|T|表示轨迹中总的位置个数。
图6显示了PPBP算法与PTPP算法和匿名方法在数据效用方面的性能对比。从图中可以出,PPBP算法的信息丢失量比PTPP算法和/> 匿名方法的信息丢失量低,主要因为匿名方法在进行轨迹隐私保护时,没有考虑用户对位置的偏好以及隐私风险评级,并且该方法对轨迹序列中所有的位置采用统一的位置匿名规则,而PTPP算法也考虑用户对位置的偏好以及隐私风险评级,但匿名规则不能很好的对应风险评级标准。PPBP算法在进行轨迹隐私保护时,轨迹序列中的位置能够根据用户偏好及背景信息自适应地釆取不同位置匿名规则,从而有效地减少了轨迹隐私保护过程中的信息丢失量。
2、执行效率分析对比
图7显示了PPBP算法与PTPP算法和匿名方法在执行效率方面的性能对比本发明采用运行时间来衡量两种方法的执行效率。从图中可以看出,当T小于4时,PPBP算法与PTPP算法的运行时间比/>匿名方法的运行时间长,而当T大于4时,PPBP算法与PTPP算法的运行时间逐渐比匿名方法的运行时间短。主要原因是PPBP算法与PTPP算法首先需要生成位置匿名空间,对位置匿名空间进行语义描述,并构建用户对位置的偏好模型,这样会增加轨迹隐私保护的运行时间。但是,用户偏好模型构建完成之后,其运行会逐渐加快,即:随着T的增大,运行时间逐渐变短。而/>匿名方法随着T的增大,运行时间逐渐变长,主要是因为/>匿名方法需要不断增加其匿名区域的大小。当T大于4时,PPBP算法比PTPP算法执行速度快,是因为PPBP算法比PTPP算法对位置匿名规则的添加速度快,极大的减少了算法的执行时间。
因此,本发明采用双重加密保护的方法,针对用户信息提出了基于聚类的mix-zone加密算法,对输入查询命令的所有用户进行聚类,同一簇中的用户同时进行属性泛化,提高了相似属性的混淆性,同时秘密计算的属性处理不会泄露任何信息给参与者,这既节省加密时间又增强了隐私保护。针对位置服务提出了基于差分隐私的偏好感知算法,针对位置社交网络下敏感位置攻击,通过语义描述和行为模式提取的方法进行偏好建模,根据偏好模型进行隐私风险评定,按照位置匿名规则添加对应的拉普拉斯噪声机制,增加了轨迹数据安全性的同时,也有效控制了算法复杂度,提高了数据的可用性。
尽管本发明的实施方案已公开如上,但其并不仅仅限于说明书和实施方式中所列运用,它完全可以被适用于各种适合本发明的领域,对于熟悉本领域的人员而言,可容易地实现另外的修改,因此在不背离权利要求及等同范围所限定的一般概念下,本发明并不限于特定的细节和这里示出与描述的图例。
Claims (1)
1.一种基于偏好感知的轨迹隐私保护服务推荐方法,其特征在于,包括如下步骤:
步骤1、对待查询用户的初始位置进行匿名;
步骤2、确定所述待查询用户的偏好以及背景信息后,根据所述待查询用户的对位置的不同偏好,划分出不同的隐私风险等级;
步骤3、采取拉普拉斯保护机制向查询结果中添加噪声;
步骤4、将添加噪声后的位置进行组合形成行的匿名轨迹;
在所述步骤1中,基于聚类的mix-zone算法对初始位置进行匿名过程包括:
步骤1.1、使用sim(As,As′)量化属性相似性,若存在sim(As,As′)<λ则认为进出mix-zone的用户为同一用户;
其中,sim(.)为相似性,As=(a1,a2,……,am)为某一指定被追踪用户的属性,As′=(a1′,a2′,……,am′)为所述指定被追踪用户离开mix-zone之后表现出的属性,m为可被识别的属性数量,a1,a2,……,am为As的属性,a1′,a2′,……,am′为As′的属性,λ为可被攻击者使用的相似属性最小阈值;
步骤1.2、假设拟将数据聚类为k个种类,则选取k个初始中心位置后,分别计算样本数据至各个初始中心位置的欧式距离:
其中,sj,表示计算(i,j)位置的欧氏距离;sjn表示第n个点的第j维坐标,/>表示第n个点的第i维坐标;
步骤1.3、从n个位置数据集中随机选择k个对象作为初始的代表对象,将剩下的所有对象分配到最近的代表所代表的簇,随机选择一个非代表对象Orandom,计算用Orandom代替代表对象Oi的总代价S,如果S<0,Oi代替Orandom,生成一组新的k个代表对象,直到没有发生更改;每个簇分别做下列步骤:
RSU集合SMZ←Φ,初始化节点数目SMZ,N←0,当N≤K时,SMZ←SMZ∪AZT,N←N+n,将SMZ合并到List(SMZ),通过计算H,选择聚类中最大的mix-zone;
在所述步骤2中,通过构建用户的用户熟悉度确定所述待查询用户的偏好以及背景信息:
式中,为用户从位置i转移到位置j的概率,/>为用户对每一语义类型的用户熟悉度,/>为位置在对应语义类型中的位置流行度;
在所述步骤2中,通过构建用户的位置流行度确定所述待查询用户的偏好以及背景信息:
式中,为用户从位置i转移到位置j的概率,/>为用户对每一语义类型的用户熟悉度,/>为位置在对应语义类型中的位置流行度;
在所述步骤3中,采取拉普拉斯保护机制向查询结果中添加噪声过程包括:
对于任一一个函数f:D→Rd,函数f的全局敏感性为△f=maxD,D′|f(D)-f(D′)|,D和D′为相邻数据集,d为函数输出的维度,所述概率差异公式为
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010945126.1A CN112035880B (zh) | 2020-09-10 | 2020-09-10 | 一种基于偏好感知的轨迹隐私保护服务推荐方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010945126.1A CN112035880B (zh) | 2020-09-10 | 2020-09-10 | 一种基于偏好感知的轨迹隐私保护服务推荐方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112035880A CN112035880A (zh) | 2020-12-04 |
CN112035880B true CN112035880B (zh) | 2024-02-09 |
Family
ID=73585342
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010945126.1A Active CN112035880B (zh) | 2020-09-10 | 2020-09-10 | 一种基于偏好感知的轨迹隐私保护服务推荐方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112035880B (zh) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112632614A (zh) * | 2020-12-30 | 2021-04-09 | 郑州轻工业大学 | 一种偏好感知的轨迹匿名方法及系统 |
CN112752232B (zh) * | 2021-01-07 | 2022-07-12 | 重庆大学 | 面向隐私保护的司机-乘客匹配方法 |
CN113177166B (zh) * | 2021-04-25 | 2022-10-21 | 重庆邮电大学 | 一种基于差分隐私的个性化位置语义发布方法及系统 |
CN113609523B (zh) * | 2021-07-29 | 2022-04-01 | 南京邮电大学 | 一种基于区块链和差异隐私的车联网隐私数据保护方法 |
CN117708421B (zh) * | 2023-12-16 | 2024-07-05 | 辽宁工业大学 | 基于模块化神经网络的动态推荐方法及系统 |
Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106021305A (zh) * | 2016-05-05 | 2016-10-12 | 北京邮电大学 | 一种模式与偏好感知的poi推荐方法及系统 |
CN106953876A (zh) * | 2017-04-27 | 2017-07-14 | 华南理工大学 | 一种基于语义上下文的位置隐私保护方法 |
CN108446568A (zh) * | 2018-03-19 | 2018-08-24 | 西北大学 | 一种去趋势分析差分隐私保护的直方图数据发布方法 |
CN109005539A (zh) * | 2018-09-06 | 2018-12-14 | 东北大学 | 基于加密Mix-Zone的VANETs中车辆节点位置隐私保护方法 |
CN109617877A (zh) * | 2018-12-12 | 2019-04-12 | 上海海事大学 | 基于差分隐私噪声添加选择的位置隐私保护系统及方法 |
CN109618282A (zh) * | 2019-01-14 | 2019-04-12 | 安徽师范大学 | 路网环境下面向连续查询的敏感语义位置隐私保护方法 |
CN110134879A (zh) * | 2019-03-06 | 2019-08-16 | 辽宁工业大学 | 一种基于差分隐私保护的兴趣点推荐算法 |
CN110727959A (zh) * | 2019-10-15 | 2020-01-24 | 南京航空航天大学 | 一种基于聚类的差分隐私轨迹数据保护方法 |
CN111447181A (zh) * | 2020-03-04 | 2020-07-24 | 重庆邮电大学 | 一种基于差分隐私的位置隐私保护方法 |
CN111797433A (zh) * | 2020-07-17 | 2020-10-20 | 辽宁工业大学 | 一种基于差分隐私的lbs服务隐私保护方法 |
CN112632614A (zh) * | 2020-12-30 | 2021-04-09 | 郑州轻工业大学 | 一种偏好感知的轨迹匿名方法及系统 |
-
2020
- 2020-09-10 CN CN202010945126.1A patent/CN112035880B/zh active Active
Patent Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106021305A (zh) * | 2016-05-05 | 2016-10-12 | 北京邮电大学 | 一种模式与偏好感知的poi推荐方法及系统 |
CN106953876A (zh) * | 2017-04-27 | 2017-07-14 | 华南理工大学 | 一种基于语义上下文的位置隐私保护方法 |
CN108446568A (zh) * | 2018-03-19 | 2018-08-24 | 西北大学 | 一种去趋势分析差分隐私保护的直方图数据发布方法 |
CN109005539A (zh) * | 2018-09-06 | 2018-12-14 | 东北大学 | 基于加密Mix-Zone的VANETs中车辆节点位置隐私保护方法 |
CN109617877A (zh) * | 2018-12-12 | 2019-04-12 | 上海海事大学 | 基于差分隐私噪声添加选择的位置隐私保护系统及方法 |
CN109618282A (zh) * | 2019-01-14 | 2019-04-12 | 安徽师范大学 | 路网环境下面向连续查询的敏感语义位置隐私保护方法 |
CN110134879A (zh) * | 2019-03-06 | 2019-08-16 | 辽宁工业大学 | 一种基于差分隐私保护的兴趣点推荐算法 |
CN110727959A (zh) * | 2019-10-15 | 2020-01-24 | 南京航空航天大学 | 一种基于聚类的差分隐私轨迹数据保护方法 |
CN111447181A (zh) * | 2020-03-04 | 2020-07-24 | 重庆邮电大学 | 一种基于差分隐私的位置隐私保护方法 |
CN111797433A (zh) * | 2020-07-17 | 2020-10-20 | 辽宁工业大学 | 一种基于差分隐私的lbs服务隐私保护方法 |
CN112632614A (zh) * | 2020-12-30 | 2021-04-09 | 郑州轻工业大学 | 一种偏好感知的轨迹匿名方法及系统 |
Non-Patent Citations (7)
Title |
---|
一种支持用户风险偏好的服务评估方法;王海艳;曲汇直;;哈尔滨工业大学学报(第05期);110-116 * |
一种轨迹隐私保护服务推荐模型研究;李晓会等;小型微型计算机系统;第42卷(第5期);990-995 * |
大数据中服务推荐隐私保护模型研究;陈潮阳;中国优秀硕士学位论文全文数据库信息科技辑(第3期);I138-28 * |
移动计算环境下基于动态上下文的个性化Mashup服务推荐;何伟;崔立真;任国珍;李庆忠;李婷;;中国科学:信息科学(第06期);677-697 * |
轨迹数据隐私保护综述;顾贞等;网络空间安全;第10卷(第11期);32-40 * |
连续空间查询的位置隐私保护综述;吴振刚;孙惠平;关志;陈钟;;计算机应用研究;第32卷(第02期);321-325+342 * |
面向关联攻击的轨迹匿名方法;张磊;马春光;杨松涛;李增鹏;;网络与信息安全学报(第06期);8-20 * |
Also Published As
Publication number | Publication date |
---|---|
CN112035880A (zh) | 2020-12-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112035880B (zh) | 一种基于偏好感知的轨迹隐私保护服务推荐方法 | |
Dong et al. | Novel privacy-preserving algorithm based on frequent path for trajectory data publishing | |
Jain et al. | Differential privacy: its technological prescriptive using big data | |
Zhao et al. | A survey of local differential privacy for securing internet of vehicles | |
Ghasemzadeh et al. | Anonymizing trajectory data for passenger flow analysis | |
Ni et al. | An anonymous entropy-based location privacy protection scheme in mobile social networks | |
Jin et al. | A survey and experimental study on privacy-preserving trajectory data publishing | |
Primault et al. | Time distortion anonymization for the publication of mobility data with high utility | |
Xiong et al. | A differentially private algorithm for location data release | |
Gupta et al. | OMCPR: Optimal mobility aware cache data pre-fetching and replacement policy using spatial K-anonymity for LBS | |
Yu et al. | Privacy preservation based on clustering perturbation algorithm for social network | |
Tang et al. | Long-term location privacy protection for location-based services in mobile cloud computing | |
CN111797433B (zh) | 一种基于差分隐私的lbs服务隐私保护方法 | |
Kuang et al. | Using location semantics to realize personalized road network location privacy protection | |
Xu et al. | Personalized location privacy protection for location-based services in vehicular networks | |
Wang et al. | Achieving effective $ k $-anonymity for query privacy in location-based services | |
Wang et al. | Protecting multi-party privacy in location-aware social point-of-interest recommendation | |
Ravi et al. | SECRECSY: A secure framework for enhanced privacy-preserving location recommendations in cloud environment | |
Jiang et al. | Differential privacy in privacy-preserving big data and learning: Challenge and opportunity | |
Zhao et al. | A novel dummy-based KNN query anonymization method in mobile services | |
Li et al. | A personalized trajectory privacy protection method | |
Long et al. | Physical Trajectory Inference Attack and Defense in Decentralized POI Recommendation | |
Beach et al. | q-Anon: Rethinking anonymity for social networks | |
Peng et al. | Location correlated differential privacy protection based on mobile feature analysis | |
Qian et al. | LBS user location privacy protection scheme based on trajectory similarity |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |