CN112995987B - 基于多目标优化问题的自适应路网语义位置隐私保护方法 - Google Patents

基于多目标优化问题的自适应路网语义位置隐私保护方法 Download PDF

Info

Publication number
CN112995987B
CN112995987B CN202110175304.1A CN202110175304A CN112995987B CN 112995987 B CN112995987 B CN 112995987B CN 202110175304 A CN202110175304 A CN 202110175304A CN 112995987 B CN112995987 B CN 112995987B
Authority
CN
China
Prior art keywords
road network
semantic
anonymous
serialized
network edge
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110175304.1A
Other languages
English (en)
Other versions
CN112995987A (zh
Inventor
徐红云
田岑熙
陆涛
蒋睿
旷勇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
South China University of Technology SCUT
Original Assignee
South China University of Technology SCUT
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by South China University of Technology SCUT filed Critical South China University of Technology SCUT
Priority to CN202110175304.1A priority Critical patent/CN112995987B/zh
Publication of CN112995987A publication Critical patent/CN112995987A/zh
Application granted granted Critical
Publication of CN112995987B publication Critical patent/CN112995987B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W12/00Security arrangements; Authentication; Protecting privacy or anonymity
    • H04W12/02Protecting privacy or anonymity, e.g. protecting personally identifiable information [PII]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/004Artificial life, i.e. computing arrangements simulating life
    • G06N3/006Artificial life, i.e. computing arrangements simulating life based on simulated virtual individual or collective life forms, e.g. social simulations or particle swarm optimisation [PSO]

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Evolutionary Computation (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Data Mining & Analysis (AREA)
  • Signal Processing (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Computer Security & Cryptography (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于多目标优化问题的自适应路网语义位置隐私保护方法,包括:1)将真实路网地图转化为语义位置路网图,并在语义位置路网图上,基于用户真实位置,获取多条邻近路网边作为候选匿名路网边,生成候选匿名路网边集合;2)针对候选匿名路网边集合进行序列化处理,生成多个序列化匿名路网边排列集合,每个序列化匿名路网边排列集合都包含多个排列子集;3)利用序列化匿名路网边排列集合构造粒子群空间,基于多目标优化问题定义适应度函数,启发式选择最优的序列化匿名路网边排列子集,发送给LBS服务器进行匿名查询处理,实现路网语义位置隐私保护。本发明提高了匿名查询服务的抗语义相关性攻击能力的同时,也保证了位置服务器的查询效率。

Description

基于多目标优化问题的自适应路网语义位置隐私保护方法
技术领域
本发明涉及网络安全和隐私保护的技术领域,特别涉及一种基于多目标优化问题的自适应路网语义位置隐私保护方法。
背景技术
随着基于位置服务技术(Location Based Service,LBS)的不断发展,如已于近日完成全面部署的中国北斗卫星导航系统,移动用户在获得更精确更高效的位置服务的同时,用户隐私信息的泄露风险也随之不断攀升。移动用户在路网中进行位置移动的过程中,可以通过社交应用软件的位置共享功能,发送自己的真实位置信息以及位置查询请求,位置服务器通过进一步处理用户查询请求,将查询结果反馈给用户,例如用户可以直接在手机界面上查看距离最近的餐厅等。在上述请求反馈过程中,恶意攻击者很有可能通过位置服务器窃取得到用户相关隐私信息,并应用于其他商业用途,如发送商业广告邮件等,同时其他攻击者也可以通过攻击位置服务器获得用户位置信息,进一步推断得到用户其他关联信息,如用户移动行为模式等,上述两种情况都会导致用户隐私信息泄露,降低系统隐私保护程度,削弱用户服务质量,非常不利于位置服务技术的长远发展。
目前大部分位置隐私保护方法很少考虑到语义位置信息,一些相关的语义位置隐私保护工作也缺少对于语义相关性的明确定义,这显然不适用于包含丰富语义位置类型的实际路网情景,同时攻击者也很可能通过实施语义相关性攻击窃取得到用户隐私信息。相关论文在讨论隐私保护和用户效益之间的权衡问题之时,一般都采用加权参数法实现,即分别在隐私指标和效益指标前面添加权值参数,根据用户隐私保护需求调节权值大小。这类方法普遍以牺牲某一方的优化效果为代价,获得另一方的效果提升,这显然不能实现二者的同步优化,并且使用调参方式很可能会产生计算精度误差,特别当数据集较大时,计算误差也会变得越大,位置服务器的查询效率也会因此降低,并可能最终导致隐私保护效果与预期估计有较大出入。
发明内容
本发明的目的在于克服现有技术的缺点与不足,提出了一种基于多目标优化问题的自适应路网语义位置隐私保护方法,该方法对语义位置进行序列化处理,基于语义位置路网图定义了隐私评价指标和效益评价指标,并引用作为改进后多目标粒子群算法的多个适应度函数,使用改进后的多目标粒子群算法提高了匿名集合的搜索效率,实现了隐私保护能力和效益水平的自适应权衡,在提高了匿名查询服务的抗语义相关性攻击能力的同时,也保证了位置服务器的查询效率。
为实现上述目的,本发明提供的技术方案为:基于多目标优化问题的自适应路网语义位置隐私保护方法,包括以下步骤:
1)将真实路网地图转化为语义位置路网图,并在语义位置路网图上,基于用户真实位置,获取多条邻近路网边作为候选匿名路网边,生成候选匿名路网边集合;
2)针对候选匿名路网边集合进行序列化处理,生成多个序列化匿名路网边排列集合,每个序列化匿名路网边排列集合都包含多个排列子集;
3)利用序列化匿名路网边排列集合构造粒子群空间,基于多目标优化问题定义适应度函数,启发式选择最优的序列化匿名路网边排列子集,发送给LBS(基于位置服务)服务器进行匿名查询处理,实现路网语义位置隐私保护。
在步骤1)中,首先,进行如下定义:
定义1、语义属性集合semtype
单个语义位置类型定义为语义属性集合semtype{t1h,t2h,t3h},其中type为语义位置类型,t1h,t2h,t3h为语义位置包含的不同属性;
然后,在真实路网地图上随机生成多个语义位置,形成语义位置路网图;使用广度优先算法获取候选匿名路网边集合的过程如下:
1.1)设定候选匿名路网边数量阈值,设定计数器初始数值为0,从查询用户所在路网边euser出发,遍历语义位置路网图;
1.2)根据跳数选择候选匿名路网边,与euser有一个公共交点的路网边跳数为1,跳数越小,被选为候选匿名路网边的可能性越大,每次成功选择一条候选匿名路网边,计数器的数值加一;
1.3)当计数器数值等于数量阈值,终止遍历,获得候选匿名路网边集合。
在步骤2)中,将匿名路网边搜索问题建模为多旅行商问题,使用顺序编码对候选匿名路网边进行序列化处理,转化为序列化匿名路网边,每条序列化匿名路网边都被赋予数值编码,且所有数值编码按照从小到大的顺序排列,随机生成多种无重叠的排列顺序,构成多个序列化匿名路网边排列集合;根据k-匿名性隐私保护思想,由用户设定参数k,针对不同序列化匿名路网边排列集合,生成中断点集合Sbreakpoint{sb1,sb2,...,sbn},其中sb1,sb2,…,sbn代表不同中断点,根据中断点能够确定子集的元素分布范围,sbn表示第n个子集的元素包含从下标为sbn-1的元素到下标为sbn-1的元素,通过中断点集合将序列化匿名路网边排列集合内部分裂为多个排列子集,每个排列子集的集合大小都大于或等于参数k的数值。
在步骤3)中,首先,进行如下定义:
定义2、语义相关性semantic_relativity
semantic_relativity(semtype1,semtype2)表示语义位置类型semtype1和语义位置类型semtype2的语义相关性,由式(1)计算如下:
Figure GDA0003535062280000041
其中,semdist表示两种不同语义位置类型之间的语义相对距离,由式(2)计算:
Figure GDA0003535062280000042
当两个语义位置类型之间的相对语义距离越大,这两个语义位置类型的语义相关性也会越小,二者之间的语义关联度也因此减弱;
定义3、语义相关性攻击semantic_relativity_attack
语义相关性攻击由式(3)表示:
P(semantic_relativity_attack)=P(background,attackanony) (3)
其中,P(semantic_relativity_attack)表示攻击者实施语义相关性攻击的成功率,P(background,attackanony)表示攻击者基于背景知识和序列化匿名路网边排列集合,实施语义相关性攻击的成功率,background表示攻击者具备的背景知识,attackanony为攻击者通过位置服务器窃取得到序列化匿名路网边排列集合,结合背景知识,重新生成的新序列化匿名路网边排列集合,即当生成的真实序列化匿名路网边排列集合中,每条序列化匿名路网边和用户真实所在边的相对语义距离的总和越大,则该序列化匿名路网边排列集合与用户真实位置之间的整体语义相关性就越小,而attackanony和真实序列化匿名路网边排列集合的重合度也会越小,攻击者实施语义相关性攻击的成功概率也会因此降低;
定义4、路网边距离差的总和sumΔe
路网边距离差的总和sumΔe代表任意序列化匿名路网边,与用户真实所在序列化匿名路网边之间边距离差的总和,具体由式(4)计算:
Figure GDA0003535062280000051
其中,n代表序列化匿名路网边排列子集的所有元素个数,i表示序列化匿名路网边排列子集中任意元素,eanony、euser分别代表序列化匿名路网边和用户真实所在序列化匿名路网边,边距离由边之间的跳数表示;
定义5、语义隐私度PRMCR
语义隐私度PRMCR表示匿名集合的语义隐私程度,由式(5)计算:
Figure GDA0003535062280000052
其中,CR表示序列化匿名路网边排列集合,POPCR代表序列化匿名路网边排列集合的流行度,SENCR代表序列化匿名路网边排列集合的语义敏感度,分别由式(6)、式(7)计算:
Figure GDA0003535062280000053
Figure GDA0003535062280000054
其中,|CR.Locs|表示CR所包含的语义位置的数量总和,等式(6)中|CR.Locs.pop|表示CR中所有语义位置的语义流行度值的总和,等式(7)中|CR.Locs.sen|表示CR中所有语义位置的语义敏感度值的总和;
定义6、算法平均运行时间avgtime_cost
算法平均运行时间avgtime_cost表示多次重复实验后算法运行平均开销,由式(8)计算:
Figure GDA0003535062280000061
其中,sumtime表示算法运行从开始到结束总共所花费时间,sumcount表示算法多次重复执行的总次数;
定义7、适应度函数fitness_function(par)
适应度函数fitness_function(par)用于选取隐私评价指标和效益评价指标的最优值,由式(9)计算:
fitness_function(par)=optimize{privacy,utility} (9)
其中,optimize{privacy,utility}表示同步地选取隐私评价指标和效益评价指标的最优值,par表示不同粒子,privacy代表隐私评价指标,也能够表示为privacy{semdist,PRMCR},utility代表效益评价指标,也能够表示为uility{sumΔe,avgtime_cost};
定义8、改进后粒子中断点序列
Figure GDA0003535062280000062
单个粒子中断点序列更新公式由式(10)计算
Figure GDA0003535062280000063
其中,
Figure GDA0003535062280000064
代表在第i+1次执行迭代算法中,单个粒子更新后的最优中断点序列;
Figure GDA0003535062280000065
代表经过第i次迭代计算之后,单个粒子当前最优中断点序列;
Figure GDA0003535062280000066
代表经过第i次迭代计算之后,单个粒子当前最优排列顺序;pbest代表单个粒子局部最优解,gbest代表粒子群空间的全局最优解,这里的最优解包含了序列化匿名路网边的最优排列方式,以及相对应的内部子集最优分化方式,ω代表惯性参数,c1和c2都代表加速因子,r1和r2都代表随机因子;
定义9、改进后粒子排列顺序
Figure GDA0003535062280000071
Figure GDA0003535062280000072
其中,
Figure GDA0003535062280000073
代表在第i+1次执行迭代算法中,单个粒子更新后的最优排列顺序;
然后,对序列化匿名路网边排列集合执行改进后的MOPSO算法(多目标粒子群优化算法):
3.1)初始化粒子群空间,将序列化匿名路网边排列集合中,每个元素都作为粒子群空间的单个粒子,使用
Figure GDA0003535062280000074
表示单个粒子的原始排列顺序,
Figure GDA0003535062280000075
表示该粒子所对应的中断点序列;
3.2)设置pbest的初始值为
Figure GDA0003535062280000076
并使用式(9)在原始粒子群空间寻找适应度函数值最优的粒子,并设置为gbest的初始值;
3.3)设定最大迭代次数为maxit,初始化迭代计数器数值为0;
3.4)在当前粒子群空间启发式寻找最优的序列化匿名路网边排列集合,遍历所有粒子,分别使用式(11)、式(10)对单个粒子的
Figure GDA0003535062280000077
Figure GDA0003535062280000078
进行更新,根据更新后的
Figure GDA0003535062280000079
Figure GDA00035350622800000710
由式(9)得到更新后的单个粒子的适应度函数值,若该更新值优于历史适应度函数值,则更新pbest;
3.5)遍历完粒子群空间之后,通过式(9)计算所有更新后粒子的适应度函数值,并选择适应度函数值最优的粒子放入最优解集合中,迭代计数器数值加一;
3.6)判断当前迭代计数器数值,若大于maxit,则执行步骤3.7),否则跳转至步骤3.4)继续执行;
3.7)在最优解集合中随机选择一个元素作为最优序列化匿名路网边排列集合,再在其中随机选择一个子集作为最终的最优序列化匿名路网边排列子集,发送给LBS(基于位置服务)服务器进行匿名查询处理。
本发明与现有技术相比,具有如下优点与有益效果:
1、本发明结合实际路网情景,对语义属性进行细粒度划分,针对不同语义位置间的关联性,定义了语义相关性和语义相关性攻击,提高了匿名集合抗语义相关性攻击的能力,提升了匿名集合语义隐私保护程度。
2、本发明通过对包含标签化语义属性信息的语义位置,进行序列化处理,改善了路网空间和粒子群空间之间的适配性,提高了本发明在实际路网情境中的实操性。
3、本发明考虑路网边之间的边距离,定义路网边距离差的总和用于衡量位置查询服务效率,序列化匿名路网边集合与用户真实所在路网边之间的边距离越近,LBS(基于位置服务)服务器进行查询请求的处理速度也越小,提高匿名查询处理效率,提升隐私保护系统的效益水平。
4、本发明在选择最优匿名集合过程中,通过同时判断多个适应度函数,实现了隐私保护能力和效益水平的自适应权衡。
附图说明
图1是本发明方法的逻辑流程图。
图2是本发明中真实路网地图和语义位置路网图转换示意图。
图3是本发明实现隐私保护过程示意图;图中e1,...,e11代表路网边,“医院”、“商场”、“学校”、“银行”、“居民小区”、“酒店”代表语义路网图中的所有语义位置类型,“用户”代表移动用户发出位置查询的真实位置。
具体实施方式
下面结合实施例及附图对本发明作进一步详细的描述,但本发明的实施方式不限于此。
如图1所示,本实施例所提供的基于多目标优化问题的自适应路网语义位置隐私保护方法,使用多目标优化粒子群算法选择最优的序列化匿名路网边排列子集,包括以下步骤:
1)在真实路网地图上随机生成多个语义位置,构造语义位置路网图,并在语义位置路网图上,使用广度优先算法获取多条候选匿名路网边,生成候选匿名路网边集合,具体如下:
首先,进行如下定义:
定义1、语义属性集合semtype
单个语义位置类型可定义为语义属性集合semtype{t1h,t2h,t3h},其中type为语义位置类型,t1h,t2h,t3h为语义位置包含的不同属性;
使用广度优先算法获取候选匿名路网边集合的过程如下:
1.1)设定候选匿名路网边数量阈值,设定计数器初始数值为0,从查询用户所在路网边euser出发,遍历语义位置路网图;
1.2)根据跳数选择候选匿名路网边,与euser有一个公共交点的路网边跳数为1,跳数越小,被选为候选匿名路网边的可能性越大,每次成功选择一条候选匿名路网边,计数器的数值加一;
1.3)当计数器数值等于数量阈值,终止遍历,获得候选匿名路网边集合。
2)将匿名路网边搜索问题建模为多旅行商问题,使用顺序编码对候选匿名路网边进行序列化处理,转化为序列化匿名路网边,每条序列化匿名路网边都被赋予数值编码,且所有数值编码可按照从小到大的顺序排列,随机生成多种无重叠的排列顺序,构成多个序列化匿名路网边排列集合;根据k-匿名性隐私保护思想,由用户设定参数k,针对不同序列化匿名路网边排列集合,生成中断点集合Sbreakpoint{sb1,sb2,...,sbn},其中sb1,sb2,…,sbn代表不同中断点,根据中断点可确定子集的元素分布范围,例如sb2表示第二个子集的元素包含从下标为sb1的元素到下标为sb2-1的元素,通过中断点集合将序列化匿名路网边排列集合内部分裂为多个排列子集,每个排列子集的集合大小都大于或等于参数k的数值。
3)用序列化匿名路网边排列集合构造粒子群空间,基于多目标优化问题定义适应度函数,启发式选择最优的序列化匿名路网边排列子集,发送给LBS(基于位置服务)服务器进行匿名查询处理,实现路网语义位置隐私保护,具体如下:
首先,进行如下定义:
定义2、语义相关性semantic_relativity
semantic_relativity(semtype1,semtype2)表示语义位置类型semtype1和语义位置类型semtype2的语义相关性,可由式(1)计算如下:
Figure GDA0003535062280000101
其中semdist表示两种不同语义位置类型之间的语义相对距离,可由式(2)计算:
Figure GDA0003535062280000102
当两个语义位置类型之间的相对语义距离越大,这两个语义位置类型的语义相关性也会越小,二者之间的语义关联度也因此减弱;
定义3、语义相关性攻击semantic_relativity_attack
语义相关性攻击可由式(3)表示:
P(semantic_relativity_attack)=P(background,attackanony) (3)
其中P(semantic_relativity_attack)表示攻击者实施语义相关性攻击的成功率,P(background,attackanony)表示攻击者基于背景知识和序列化匿名路网边排列集合,实施语义相关性攻击的成功率,background表示攻击者具备的背景知识,如语义位置路网图的转换等,attackanony为攻击者通过位置服务器窃取得到序列化匿名路网边排列集合,结合背景知识,重新生成的新序列化匿名路网边排列集合,即当生成的真实序列化匿名路网边排列集合中,每条序列化匿名路网边和用户真实所在边的相对语义距离的总和越大,则该序列化匿名路网边排列集合与用户真实位置之间的整体语义相关性就越小,而attackanony和真实序列化匿名路网边排列集合的重合度也会越小,攻击者实施语义相关性攻击的成功概率也会因此显著地降低;
定义4、路网边距离差的总和sumΔe
路网边距离差的总和sumΔe代表任意序列化匿名路网边,与用户真实所在序列化匿名路网边之间边距离差的总和,具体可由式(4)进行计算:
Figure GDA0003535062280000111
其中n代表序列化匿名路网边排列子集的所有元素个数,i表示序列化匿名路网边排列子集中任意元素,ei、euser分别代表序列化匿名路网边和用户真实所在序列化匿名路网边,边距离由边之间的跳数表示,如有一个公共交点的两条路网边的边距离为1;
定义5、语义隐私度PRMCR
语义隐私度PRMCR表示匿名集合的语义隐私程度,可由式(5)计算:
Figure GDA0003535062280000121
其中CR表示序列化匿名路网边排列集合,POPCR代表序列化匿名路网边排列集合的流行度,SENCR代表序列化匿名路网边排列集合的语义敏感度,可分别可由式(6)、式(7)计算:
Figure GDA0003535062280000122
Figure GDA0003535062280000123
其中|CR.Locs|表示CR所包含的语义位置的数量总和,等式(6)中|CR.Locs.pop|表示CR中所有语义位置的语义流行度值的总和,等式(7)中|CR.Locs.sen|表示CR中所有语义位置的语义敏感度值的总和;当POPCR保持不变,SENCR取值越小,则CR的语义隐私程度越高,语义隐私保护能力也越强;
定义6、算法平均运行时间avgtime_cost
算法平均运行时间avgtime_cost表示多次重复实验后算法运行平均开销,可由式(8)计算:
Figure GDA0003535062280000124
其中sumtime表示算法运行从开始到结束总共所花费时间,sumcount表示算法多次重复执行的总次数,avgtime_cost的值越小,算法平均运行时间越短,算法效率也更高;
定义7、适应度函数fitness_function(par)
适应度函数fitness_function(par)用于选取隐私评价指标和效益评价指标的最优值,可由式(9)计算:
fitness_function(par)=optimize{privacy,utility} (9)
其中,optimize{privacy,utility}表示同步地选取隐私评价指标和效益评价指标的最优值,par表示不同粒子,privacy代表隐私评价指标,也可表示为privacy{semdist,PRMCR},utility代表效益评价指标,也可表示为uility{sumΔe,avgtime_cost};
定义8、改进后粒子中断点序列
Figure GDA0003535062280000131
单个粒子中断点序列更新公式可由式(10)计算
Figure GDA0003535062280000132
其中
Figure GDA0003535062280000133
代表在第i+1次执行迭代算法中,单个粒子更新后的最优中断点序列;
Figure GDA0003535062280000134
代表经过第i次迭代计算之后,单个粒子当前最优中断点序列;
Figure GDA0003535062280000135
代表经过第i次迭代计算之后,单个粒子当前最优排列顺序;pbest代表单个粒子局部最优解,gbest代表粒子群空间的全局最优解,这里的最优解包含了序列化匿名路网边的最优排列方式,以及相对应的内部子集最优分化方式,ω代表惯性参数,c1和c2都代表加速因子,r1和r2都代表随机因子;
定义9、改进后粒子排列顺序
Figure GDA0003535062280000136
Figure GDA0003535062280000137
其中
Figure GDA0003535062280000138
代表在第i+1次执行迭代算法中,单个粒子更新后的最优排列顺序;
然后,对序列化匿名路网边排列集合执行改进后的MOPSO算法(多目标粒子群优化算法):
3.1)初始化粒子群空间,将序列化匿名路网边排列集合中,每个元素都作为粒子群空间的单个粒子,使用
Figure GDA0003535062280000141
表示单个粒子的原始排列顺序,
Figure GDA0003535062280000142
表示该粒子所对应的中断点序列;
3.2)设置pbest的初始值为
Figure GDA0003535062280000143
并使用式(9)在原始粒子群空间寻找适应度函数值最优的粒子,并设置为gbest的初始值
3.3)设定最大迭代次数为maxit,初始化迭代计数器数值为0;
3.4)在当前粒子群空间启发式寻找最优的序列化匿名路网边排列集合,遍历所有粒子,分别使用式(11)、式(10)对单个粒子的
Figure GDA0003535062280000144
Figure GDA0003535062280000145
进行更新,根据更新后的
Figure GDA0003535062280000146
Figure GDA0003535062280000147
由式(9)得到更新后的单个粒子的适应度函数值,若该更新值优于历史适应度函数值,则更新pbest;
3.5)遍历完粒子群空间之后,通过式(9)计算所有更新后粒子的适应度函数值,并选择适应度函数值最优的粒子放入最优解集合中,迭代计数器数值加一;
3.6)判断当前迭代计数器数值,若大于maxit,则执行步骤3.7),否则跳转至步骤3.4)继续执行;
3.7)在最优解集合中随机选择一个元素作为最优序列化匿名路网边排列集合,再在其中随机选择一个子集作为最终的最优序列化匿名路网边排列子集,发送给LBS(基于位置服务)服务器进行匿名查询处理。
下面我们结合具体数据对本实施例上述自适应路网语义隐私保护方法作进一步描述,其具体情况如下:
1)构造语义位置路网图:根据系统预设的语义位置信息在Oldenburg城市的真实路网地图上随机生成多个语义位置,假设六种语义位置类型{医院,商场,学校,银行,居民小区,酒店},六种语义位置类型的语义属性集合可分别表示为:医院{服务,医疗,病人},商场{服务,商品,客户},学校{学习,教育,学生},银行{金融,金融,客户},居民小区{生活,环境,居民},酒店{服务,住宿,客户},对应的语义流行度集合为{0.8,0.6,0.5,0.3,0.7,0.4},流行度集合中的元素分别代表六种语义位置类型的语义流行度值,语义流行度值越高,代表该语义位置类型被任意移动用户查询访问的概率就越大,如图2所示,转化后的Oldenburg城市的语义位置路网图中包含了随机分布的语义位置信息。
2)自定义隐私需求:将语义位置路网图抽象为无向图,由用户自定义隐私需求,假设用户设置语义敏感度集合{0.3,0.8,0.4,0.5,0.6,0.1},语义敏感度集合中的元素分别代表六种语义位置类型的语义敏感度值,语义敏感度值越高,代表该移动用户查询访问该语义位置类型的概率就越大,并设置k-匿名性的参数k值为4。如图3所示,用户在路网边e9上发出位置查询请求。
3)构造粒子群空间:利用广度优先算法获取候选匿名路网边集合,假设候选匿名路网边数量阈值为3,如图3所示,可得候选匿名路网边集合{e7,e10,e11},并进行序列化处理,对该集合中候选匿名路网边进行顺序编码,使用数值编码1-3分别表示集合中各元素,用户所在路网边编号为4;随机生成无重叠的2种排列顺序:S1{e7,e10,e11},S2{e10,e7,e11},序列化处理后表示为:seq1{1,2,3},seq2{2,1,3},根据值为2的参数k,将这三个序列化匿名路网边排列集合进行子集划分,划分后的序列化匿名路网边排列集合可表示为:seq1{{1}{2}{3}},seq2{{2}{1}{3}},将划分后的seq1、seq2都作为初始粒子群空间的粒子。
4)设置算法初始值:假设最大迭代次数为1,迭代计数器初始值为0。
5)初始化粒子群空间:使用
Figure GDA0003535062280000151
表示单个粒子的初始排列顺序,
Figure GDA0003535062280000152
表示该粒子所对应的初始中断点序列,如粒子seq1
Figure GDA0003535062280000153
可表示为{1,2,3},对应的
Figure GDA0003535062280000154
可表示为{1,2,3},粒子seq2
Figure GDA0003535062280000155
可表示为{2,1,3},对应的
Figure GDA0003535062280000156
可表示为{1,2,3},初始化局部最优解pbest为各自粒子的
Figure GDA0003535062280000161
两个粒子seq1,seq2的pbest分别为{1,2,3},{1,2,3},根据适应度函数寻找当前初始粒子群空间的全局最优解gbest,将适应度函数值最优的粒子设置为gbest的初始值,结合图3,各粒子的适应度函数值fitness_value计算如下:
Figure GDA0003535062280000162
Figure GDA0003535062280000163
其中粒子seq1的{(sumdist,PRMCR,sumΔe,avgtime_cost)1}的计算过程如下:
Figure GDA0003535062280000164
Figure GDA0003535062280000165
Figure GDA0003535062280000166
考虑到参数avgtime_cost需要根据实际操作时间计算,本次实例描述中暂不考虑;{(sumdist,PRMCR,sumΔe,avgtime_cost)2}和{(sumdist,PRMCR,sumΔe,avgtime_cost)3}的计算方式与上述相同,计算后分别为{1,0.6,1},{1,2.67,2},则粒子seq1的适应度函数值为{1,1.17,1};粒子seq2的适应度函数计算过程与粒子seq1相同,计算后为{1,0.6,1},则gbest的初始值为seq1
6)在当前粒子群空间启发式寻找最优的序列化匿名路网边排列集合:对单个粒子的
Figure GDA0003535062280000171
Figure GDA0003535062280000172
进行更新,更新公式具体如下:
Figure GDA0003535062280000173
Figure GDA0003535062280000174
假设ω为1,c1,c2分别为0.1,0.2,r1,r2分别为0.2,0.1,粒子seq1的更新过程具体如下:
Figure GDA0003535062280000175
Figure GDA0003535062280000176
根据更新后的
Figure GDA0003535062280000177
Figure GDA0003535062280000178
重复步骤5)中的适应度函数计算,可得粒子seq1更新后的适应度函数值为{3,1.29,4},与历史pbest进行比较后,更新后的适应度函数值表现更优,使用更新后pbest{3}代替历史pbest{1,2,3}。
粒子seq2的更新方式与seq1相同,粒子seq2更新后的
Figure GDA0003535062280000181
Figure GDA0003535062280000182
分别为{1,2,3},{1,2,3},同样重复步骤5)计算对应的适应度函数值,并获取更新后的pbest为{1,2,3},判断更新后pbest与该粒子的历史pbest一致,保留历史pbest{1,2,3}。
7)更新gbest:遍历完粒子群空间之后,重复步骤5)计算所有更新后粒子的适应度函数值,并选择适应度函数值最优的粒子seq2放入最优解集合中,迭代计数器数值加一。
8)判断算法终止条件:判断当前迭代计数器数值为2,大于最大迭代次数,则执行步骤9)。
9)发送匿名集合:在最优解集合中随机选择seq2作为最优序列化匿名路网边排列集合,再在其中随机选择一个子集{1,2,3}作为最终的最优序列化匿名路网边排列子集,发送给LBS(基于位置服务)服务器进行匿名查询处理
上述实施例为本发明较佳的实施方式,但本发明的实施方式并不受上述实施例的限制,其他的任何未背离本发明的精神实质与原理下所作的改变、修饰、替代、组合、简化,均应为等效的置换方式,都包含在本发明的保护范围之内。

Claims (3)

1.基于多目标优化问题的自适应路网语义位置隐私保护方法,其特征在于,包括以下步骤:
1)将真实路网地图转化为语义位置路网图,并在语义位置路网图上,基于用户真实位置,获取多条邻近路网边作为候选匿名路网边,生成候选匿名路网边集合;
2)针对候选匿名路网边集合进行序列化处理,生成多个序列化匿名路网边排列集合,每个序列化匿名路网边排列集合都包含多个排列子集;
将匿名路网边搜索问题建模为多旅行商问题,使用顺序编码对候选匿名路网边进行序列化处理,转化为序列化匿名路网边,每条序列化匿名路网边都被赋予数值编码,且所有数值编码按照从小到大的顺序排列,随机生成多种无重叠的排列顺序,构成多个序列化匿名路网边排列集合;根据k-匿名性隐私保护思想,由用户设定参数k,针对不同序列化匿名路网边排列集合,生成中断点集合Sbreakpoint{sb1,sb2,…,sbn},其中sb1,sb2,…,sbn代表不同中断点,根据中断点能够确定子集的元素分布范围,sbn表示第n个子集的元素包含从下标为sbn-1的元素到下标为sbn-1的元素,通过中断点集合将序列化匿名路网边排列集合内部分裂为多个排列子集,每个排列子集的集合大小都大于或等于参数k的数值;
3)利用序列化匿名路网边排列集合构造粒子群空间,基于多目标优化问题定义适应度函数,启发式选择最优的序列化匿名路网边排列子集,发送给LBS服务器进行匿名查询处理,实现路网语义位置隐私保护。
2.根据权利要求1所述的基于多目标优化问题的自适应路网语义位置隐私保护方法,其特征在于,在步骤1)中,首先,进行如下定义:
定义1、语义属性集合semtype
单个语义位置类型定义为语义属性集合semtype{t1h,t2h,t3h},其中type为语义位置类型,t1h,t2h,t3h为语义位置包含的不同属性;
然后,在真实路网地图上随机生成多个语义位置,形成语义位置路网图;使用广度优先算法获取候选匿名路网边集合的过程如下:
1.1)设定候选匿名路网边数量阈值,设定计数器初始数值为0,从查询用户所在路网边euser出发,遍历语义位置路网图;
1.2)根据跳数选择候选匿名路网边,与euser有一个公共交点的路网边跳数为1,跳数越小,被选为候选匿名路网边的可能性越大,每次成功选择一条候选匿名路网边,计数器的数值加一;
1.3)当计数器数值等于数量阈值,终止遍历,获得候选匿名路网边集合。
3.根据权利要求1所述的基于多目标优化问题的自适应路网语义位置隐私保护方法,其特征在于,在步骤3)中,首先,进行如下定义:
定义2、语义相关性semantic_relativity
semantic_relativity(semtype1,semtype2)表示语义位置类型semtype1和语义位置类型semtype2的语义相关性,由式(1)计算如下:
Figure FDA0003535062270000021
其中,semdist表示两种不同语义位置类型之间的语义相对距离,由式(2)计算:
Figure FDA0003535062270000022
当两个语义位置类型之间的相对语义距离越大,这两个语义位置类型的语义相关性也会越小,二者之间的语义关联度也因此减弱;
定义3、语义相关性攻击semantic_relativity_attack
语义相关性攻击由式(3)表示:
P(semantic_relativity_attack)=P(background,attackanony) (3)
其中,P(semantic_relativity_attack)表示攻击者实施语义相关性攻击的成功率,P(background,attackanony)表示攻击者基于背景知识和序列化匿名路网边排列集合,实施语义相关性攻击的成功率,background表示攻击者具备的背景知识,attackanony为攻击者通过位置服务器窃取得到序列化匿名路网边排列集合,结合背景知识,重新生成的新序列化匿名路网边排列集合,即当生成的真实序列化匿名路网边排列集合中,每条序列化匿名路网边和用户真实所在边的相对语义距离的总和越大,则该序列化匿名路网边排列集合与用户真实位置之间的整体语义相关性就越小,而attackanony和真实序列化匿名路网边排列集合的重合度也会越小,攻击者实施语义相关性攻击的成功概率也会因此降低;
定义4、路网边距离差的总和sumΔe
路网边距离差的总和sumΔe代表任意序列化匿名路网边,与用户真实所在序列化匿名路网边之间边距离差的总和,具体由式(4)计算:
Figure FDA0003535062270000031
其中,n代表序列化匿名路网边排列子集的所有元素个数,i表示序列化匿名路网边排列子集中任意元素,eanony、euser分别代表序列化匿名路网边和用户真实所在序列化匿名路网边,边距离由边之间的跳数表示;
定义5、语义隐私度PRMCR
语义隐私度PRMCR表示匿名集合的语义隐私程度,由式(5)计算:
Figure FDA0003535062270000041
其中,CR表示序列化匿名路网边排列集合,POPCR代表序列化匿名路网边排列集合的流行度,SENCR代表序列化匿名路网边排列集合的语义敏感度,分别由式(6)、式(7)计算:
Figure FDA0003535062270000042
Figure FDA0003535062270000043
其中,|CR.Locs|表示CR所包含的语义位置的数量总和,等式(6)中|CR.Locs.pop|表示CR中所有语义位置的语义流行度值的总和,等式(7)中|CR.Locs.sen|表示CR中所有语义位置的语义敏感度值的总和;
定义6、算法平均运行时间avgtime_cost
算法平均运行时间avgtime_cost表示多次重复实验后算法运行平均开销,由式(8)计算:
Figure FDA0003535062270000044
其中,sumtime表示算法运行从开始到结束总共所花费时间,sumcount表示算法多次重复执行的总次数;
定义7、适应度函数fitness_function(par)
适应度函数fitness_function(par)用于选取隐私评价指标和效益评价指标的最优值,由式(9)计算:
fitness_function(par)=optimize{privacy,utility} (9)
其中,optimize{privacy,utility}表示同步地选取隐私评价指标和效益评价指标的最优值,par表示不同粒子,privacy代表隐私评价指标,也能够表示为privacy{semdist,PRMCR},utility代表效益评价指标,也能够表示为uility{sumΔe,avgtime_cost};
定义8、改进后粒子中断点序列
Figure FDA0003535062270000051
单个粒子中断点序列更新公式由式(10)计算
Figure FDA0003535062270000052
其中,
Figure FDA0003535062270000053
代表在第i+1次执行迭代算法中,单个粒子更新后的最优中断点序列;
Figure FDA0003535062270000054
代表经过第i次迭代计算之后,单个粒子当前最优中断点序列;
Figure FDA0003535062270000055
代表经过第i次迭代计算之后,单个粒子当前最优排列顺序;pbest代表单个粒子局部最优解,gbest代表粒子群空间的全局最优解,这里的最优解包含了序列化匿名路网边的最优排列方式,以及相对应的内部子集最优分化方式,ω代表惯性参数,c1和c2都代表加速因子,r1和r2都代表随机因子;
定义9、改进后粒子排列顺序
Figure FDA0003535062270000056
Figure FDA0003535062270000057
其中,
Figure FDA0003535062270000058
代表在第i+1次执行迭代算法中,单个粒子更新后的最优排列顺序;
然后,对序列化匿名路网边排列集合执行改进后的MOPSO算法,即多目标粒子群优化算法:
3.1)初始化粒子群空间,将序列化匿名路网边排列集合中,每个元素都作为粒子群空间的单个粒子,使用
Figure FDA0003535062270000059
表示单个粒子的原始排列顺序,
Figure FDA00035350622700000510
表示该粒子所对应的中断点序列;
3.2)设置pbest的初始值为
Figure FDA0003535062270000061
并使用式(9)在原始粒子群空间寻找适应度函数值最优的粒子,并设置为gbest的初始值;
3.3)设定最大迭代次数为maxit,初始化迭代计数器数值为0;
3.4)在当前粒子群空间启发式寻找最优的序列化匿名路网边排列集合,遍历所有粒子,分别使用式(11)、式(10)对单个粒子的
Figure FDA0003535062270000062
Figure FDA0003535062270000063
进行更新,根据更新后的
Figure FDA0003535062270000064
Figure FDA0003535062270000065
由式(9)得到更新后的单个粒子的适应度函数值,若该更新值优于历史适应度函数值,则更新pbest;
3.5)遍历完粒子群空间之后,通过式(9)计算所有更新后粒子的适应度函数值,并选择适应度函数值最优的粒子放入最优解集合中,迭代计数器数值加一;
3.6)判断当前迭代计数器数值,若大于maxit,则执行步骤3.7),否则跳转至步骤3.4)继续执行;
3.7)在最优解集合中随机选择一个元素作为最优序列化匿名路网边排列集合,再在其中随机选择一个子集作为最终的最优序列化匿名路网边排列子集,发送给LBS服务器进行匿名查询处理。
CN202110175304.1A 2021-02-07 2021-02-07 基于多目标优化问题的自适应路网语义位置隐私保护方法 Active CN112995987B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110175304.1A CN112995987B (zh) 2021-02-07 2021-02-07 基于多目标优化问题的自适应路网语义位置隐私保护方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110175304.1A CN112995987B (zh) 2021-02-07 2021-02-07 基于多目标优化问题的自适应路网语义位置隐私保护方法

Publications (2)

Publication Number Publication Date
CN112995987A CN112995987A (zh) 2021-06-18
CN112995987B true CN112995987B (zh) 2022-05-24

Family

ID=76347915

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110175304.1A Active CN112995987B (zh) 2021-02-07 2021-02-07 基于多目标优化问题的自适应路网语义位置隐私保护方法

Country Status (1)

Country Link
CN (1) CN112995987B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116702247B (zh) * 2023-08-08 2023-10-10 天津天石休闲用品有限公司 基于原始面料的户外针织品布料模块化裁剪方法及设备

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019104077A1 (en) * 2017-11-21 2019-05-31 El Kaed Charbel Joseph Semantic search method for a distributed data system with numerical time series data

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103258241B (zh) * 2013-04-02 2014-09-24 中国南方电网有限责任公司 一种基于空间分布特性的最小断点集优化方法
CN109618282A (zh) * 2019-01-14 2019-04-12 安徽师范大学 路网环境下面向连续查询的敏感语义位置隐私保护方法
US11669059B2 (en) * 2019-07-16 2023-06-06 University College Cardiff Consultants Limited (Uc3) Autonomous and semantic optimization approach for real-time performance management in a built environment
CN111079208B (zh) * 2019-11-20 2024-01-23 杭州电子科技大学 基于粒子群算法的cad模型之间面对应关系识别方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019104077A1 (en) * 2017-11-21 2019-05-31 El Kaed Charbel Joseph Semantic search method for a distributed data system with numerical time series data

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
OnStar源位置网络隐私保护的区域模糊搜索算法;李瑞俊;《科技通报》;20151231;第76-78页 *

Also Published As

Publication number Publication date
CN112995987A (zh) 2021-06-18

Similar Documents

Publication Publication Date Title
Dong et al. Novel privacy-preserving algorithm based on frequent path for trajectory data publishing
Sun et al. Location privacy preservation for mobile users in location-based services
Ni et al. An anonymous entropy-based location privacy protection scheme in mobile social networks
Li et al. Privacy preserving participant recruitment for coverage maximization in location aware mobile crowdsensing
Menaga et al. Least lion optimisation algorithm (LLOA) based secret key generation for privacy preserving association rule hiding
Yang et al. Location privacy preservation mechanism for location-based service with incomplete location data
Wu et al. A novel dummy-based mechanism to protect privacy on trajectories
Wei et al. Differential privacy-based trajectory community recommendation in social network
CN112995987B (zh) 基于多目标优化问题的自适应路网语义位置隐私保护方法
CN112632614A (zh) 一种偏好感知的轨迹匿名方法及系统
Kuang et al. An improved privacy‐preserving framework for location‐based services based on double cloaking regions with supplementary information constraints
Zhang et al. An efficient privacy-preserving multi-keyword query scheme in location based services
Li et al. Location privacy protection scheme for LBS in IoT
Wu et al. TCPP: achieving privacy-preserving trajectory correlation with differential privacy
Guo et al. LuxGeo: Efficient and Security-Enhanced Geometric Range Queries
Alyousef et al. Preserving location privacy in the IoT against advanced attacks using deep learning
Ni et al. Privacy protection model for location-based services
Zhao et al. Privacy-area aware all-dummy-based location privacy algorithms for location-based services
Dewri et al. Mobile local search with noisy locations
Luo et al. Unchained Cellular Obfuscation Areas for Location Privacy in Continuous Location‐Based Service Queries
CN112861171B (zh) 基于粒子群优化算法的轨迹间相关性隐私保护方法和系统
Pan et al. P 3 RN: personalized privacy protection using query semantics over road networks
Xu et al. Location-semantic aware privacy protection algorithms for location-based services
CN117972795B (zh) 基于异或过滤器的密态空间关键字安全检索方法及装置
Xiong et al. Semantic analysis in location privacy preserving

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant