CN109063836A - 一种基于进化扰动的隐私链路保护方法 - Google Patents

一种基于进化扰动的隐私链路保护方法 Download PDF

Info

Publication number
CN109063836A
CN109063836A CN201810683667.4A CN201810683667A CN109063836A CN 109063836 A CN109063836 A CN 109063836A CN 201810683667 A CN201810683667 A CN 201810683667A CN 109063836 A CN109063836 A CN 109063836A
Authority
CN
China
Prior art keywords
disturbance
chromosome
company
operator
evolving
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201810683667.4A
Other languages
English (en)
Inventor
宣琦
赵明浩
俞山青
傅晨波
黄慧敏
殳欣成
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang University of Technology ZJUT
Original Assignee
Zhejiang University of Technology ZJUT
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang University of Technology ZJUT filed Critical Zhejiang University of Technology ZJUT
Priority to CN201810683667.4A priority Critical patent/CN109063836A/zh
Publication of CN109063836A publication Critical patent/CN109063836A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/12Computing arrangements based on biological models using genetic models
    • G06N3/126Evolutionary algorithms, e.g. genetic algorithms or genetic programming
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/01Social networking

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Theoretical Computer Science (AREA)
  • Evolutionary Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Business, Economics & Management (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Computing Systems (AREA)
  • Primary Health Care (AREA)
  • Artificial Intelligence (AREA)
  • Tourism & Hospitality (AREA)
  • Strategic Management (AREA)
  • Marketing (AREA)
  • Human Resources & Organizations (AREA)
  • Economics (AREA)
  • Physiology (AREA)
  • Genetics & Genomics (AREA)
  • General Business, Economics & Management (AREA)
  • Biomedical Technology (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Molecular Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

一种基于进化扰动的隐私链路保护方法,包括以下步骤:S1:将网络连边划分为训练集和测试集,其中训练集是扰动对象,测试集用来评价算法有效性;S2:遗传算法包括染色体、适应度函数、选择算子、交叉算子和变异算子,具体设计如下:染色体由删除和增加的连边组成;适应度函数综合考虑了精度和AUC;选择算子为轮盘赌算法;使用单点交叉并处理了交叉冲突;变异算子为基于概率的逐点变异并处理了变异冲突;S3:将交叉和变异产生的子代以及父代的精英个体组成新的子代种群,迭代至遗传算法收敛。本发明利用遗传算法寻找最优连边扰动,在扰动量相同的情况下,达到比随机扰动或者启发式扰动更优的效果,同时也具备较好的迁移效果。

Description

一种基于进化扰动的隐私链路保护方法
技术领域
本发明涉及网络科学与链路预测领域,特别是涉及一种基于进化扰动的隐私链路保护方法。
背景技术
随着社交媒体的兴起,网上存有海量的用户数据。然而其中很多数据涉及到个人隐私,所以隐私数据安全性问题日益突出。链路预测是根据已观测到的网络结构预测缺失的或者未来会形成的链路。社交网络中某些涉及到隐私的连边需要隐藏,但是直接删除这些隐私连边,攻击者可能会利用链路预测技术重新预测出来,从而不能有效的保护这些隐私连边。传统的做法是在网络里加入连边扰动,即增加或者删除一些连边,从而达到降低隐私链路的可预测性。但是传统的连边扰动不能保证最优性,即扰动量一定的条件下,扰动效果不一定最好。
发明内容
为了克服传统随机扰动的盲目性以及启发式扰动的次优性的不足,本发明提出了一种基于进化扰动的隐私链路保护方法,即基于遗传算法的进化扰动策略,为了使得扰动更有意义,限制了扰动量,即增加和删除的连边数量,且假设增加和删除的连边总数相同,即维持扰动前后网络的总连边数不变。经过在多种链路预测算法的比较下,可以达到更优的结果并具有较好的迁移性。其中,本发明以资源分配指标(RA)为例,使用遗传算法找到最优的连边扰动。
本发明解决其技术问题所采用的技术方案如下:
一种基于进化扰动的隐私链路保护方法,所述方法包括以下步骤:
S1:假设无权无向网络G(V,E),将网络所有连边划分为训练集ET和测试集EV,其中训练集是扰动对象,即向训练集增加以及删除连边,测试集是需要保护的隐私连边;
S2:使用遗传算法,迭代进化连边扰动,过程如下:
S2-1:染色体的设计:染色体由两部分组成,一部分是删除的连边,另一部分是增加的连边,限制了增加和删除的连边数量,且维持扰动前后网络的总连边数不变;
S2-2:适应度函数的设计:评价链路预测的效果是精度和AUC,设计了一种适应度函数,综合考虑了两者的影响;
S2-3:选择算子的设计:采用轮盘赌的选择方法,即根据适应度的值确定被选择的概率,通过指数函数变换,确保适应度函数恒为正值;
S2-4:交叉算子的设计:通过选择算子选择出一对较优的染色体,根据交叉率,使用单点交叉的方法;如果交叉后出现冲突,即染色体内包含相同的连边,则撤回该连边的交叉操作;
S2-5:变异算子的设计:通过选择算子选择出较优的染色体,遍历染色体内所有删除以及增加的连边,根据变异率随机替换染色体内的连边;如果变异后出现冲突,即染色体内包含相同的连边,则重新选取连边代替;
S3:将交叉和变异产生的子代以及父代的精英个体组成新的子代种群,迭代至遗传算法收敛后,将最优个体取出,加入到训练集里,分别用多种链路预测算法计算测试集的预测精度,检验算法的迁移性。
进一步,所述步骤2-2中,适应度函数如下:
其中δ(x)是指示函数,即x是真的话,取值为1;否则取值为0。α是可调参数,用来调节精度和AUC对适应度函数的影响程度;是扰动后网络的不存在连边的节点对,显然表示节点对的相似度值,选取RA作为衡量相似度的指标,即:
其中Γ(x)表示x的一跳邻居节点,kz表示节点z的度值。
再进一步,所述步骤S3中,所述多种链路预测算法是指Common Neighbors,Jaccard,Preferential Attachment以及Adamic-Adar index。
更进一步,所述步骤S1中,Ω是网络里所有的节点对,其中Ω={(i,j)|{i,j}∈V,i≠j},N是网络里所有不存在连边的节点对,显然N=Ω-E;
所述S2-1中,删除的连边集合Edel,其中增加的连边集合Eadd,其中由于维持扰动前后网络的总连边数不变,两者的数量相等,均为m;
所述S2-3中,根据适应度的值确定被父代被选择的概率为
所述S2-5中,随机选取删除的连边以及增加的连边替换染色体内的相应的连边,其中
本发明的有益效果为:利用遗传算法寻找最优连边扰动,在扰动量相同的情况下,达到比随机扰动或者启发式扰动更优的效果,同时也具备较好的迁移效果。
附图说明
图1为本发明实例涉及的基于进化扰动的隐私链路保护方法的流程图。
图2为本发明实例涉及的遗传算法中染色体的示意图。
图3为本发明实例涉及的遗传算法中交叉算子的示意图。
具体实施方式
下面结合附图对本发明做进一步说明。
参照图1~图3,一种基于进化扰动的隐私链路保护方法,包括以下步骤:
S1:假设无权无向网络G(V,E),将网络所有连边划分为训练集ET和测试集EV,其中训练集是扰动对象,即向训练集增加以及删除连边,测试集是需要保护的隐私链路。Ω是网络里所有的节点对,其中Ω={(i,j)|{i,j}∈V,i≠j}。N是网络里所有不存在连边的节点对,显然N=Ω-E;
S2:为保证扰动前后网络总边数不变,假设增加及删除的连边条数均为m。使用遗传算法,迭代进化连边扰动,遗传算法中各个组成部分的设计如下:
S2-1:染色体的设计:染色体由两部分组成,一部分是删除的连边集合Edel,其中另一部分是增加的连边集合Eadd,其中由于维持扰动前后网络的总连边数不变,两者的数量相等,均为m。图2为染色体的示意图;
S2-2:适应度函数的设计:链路预测的效果主要有精度和AUC衡量,本发明设计了一种新的适应度函数,综合考虑了两者的影响。适应度函数如下:
其中δ(x)是指示函数,即x是真的话,取值为1;否则取值为0。α是可调参数,用来调节精度和AUC对适应度函数的影响程度。是扰动后网络的不存在连边的节点对,显然表示节点对的相似度值,本发明选取resource allocation index(RA)作为衡量相似度的指标,即:
其中Γ(x)表示x的一跳邻居节点,kz表示节点z的度值;
S2-3:选择算子的设计:通过指数函数变换,确保适应度函数恒为正值。采用轮盘赌的选择方法,根据适应度的值确定被父代被选择的概率,即
S2-4:交叉算子的设计:通过选择算子选择出一对较优的染色体,根据交叉率,使用单点交叉的方法,即随机选择交叉位置,并将两个染色体在交叉位置后的部分置换。如果交叉后出现冲突,即染色体内包含相同的连边,则撤回该连边的交叉操作,交叉算子的具体操作见图3;
S2-5:变异算子的设计:通过选择算子选择出较优的染色体,遍历染色体内所有删除以及增加的连边,根据变异率,随机选取删除的连边以及增加的连边替换染色体内的相应的连边,其中如果变异后出现冲突,即染色体内包含相同的连边,则重新选取连边代替;
S3:随机初始化以后,将交叉和变异得到的子代以及选择出来的父代精英组成新的子代种群,迭代进化至遗传算法收敛,最后将最优个体取出,加入到训练集里,分别用多种链路预测算法,包括Common Neighbors,Jaccard,Preferential Attachment以及Adamic-Adar index,计算测试集的预测精度,检验算法的迁移性。
如上所述为本发明的实例介绍,本发明是一种基于进化扰动的隐私链路保护方法,最终的实验结果表明基于遗传算法的进化扰动比随机扰动以及启发式扰动的效果要好,而且也具备较好的迁移性,达到了实际使用的要求。对发明而言仅仅是说明性的,而非限制性的。本专业技术人员理解,在发明权利要求所限定的精神和范围内可对其进行许多改变,修改,甚至等效,但都将落入本发明的保护范围内。

Claims (4)

1.一种基于进化扰动的隐私链路保护方法,其特征在于,所述方法包括以下步骤:
S1:假设无权无向网络G(V,E),将网络所有连边划分为训练集ET和测试集EV,其中训练集是扰动对象,即向训练集增加以及删除连边,测试集是需要保护的隐私连边;
S2:使用遗传算法,迭代进化连边扰动,过程如下:
S2-1:染色体的设计:染色体由两部分组成,一部分是删除的连边,另一部分是增加的连边,限制了增加和删除的连边数量,且维持扰动前后网络的总连边数不变;
S2-2:适应度函数的设计:评价链路预测的效果是精度和AUC,设计了一种适应度函数,综合考虑了两者的影响;
S2-3:选择算子的设计:采用轮盘赌的选择方法,即根据适应度的值确定被选择的概率,通过指数函数变换,确保适应度函数恒为正值;
S2-4:交叉算子的设计:通过选择算子选择出一对较优的染色体,根据交叉率,使用单点交叉的方法;如果交叉后出现冲突,即染色体内包含相同的连边,则撤回该连边的交叉操作;
S2-5:变异算子的设计:通过选择算子选择出较优的染色体,遍历染色体内所有删除以及增加的连边,根据变异率随机替换染色体内的连边;如果变异后出现冲突,即染色体内包含相同的连边,则重新选取连边代替;
S3:将交叉和变异产生的子代以及父代的精英个体组成新的子代种群,迭代至遗传算法收敛后,将最优个体取出,加入到训练集里,分别用多种链路预测算法计算测试集的预测精度,检验算法的迁移性。
2.如权利要求1所述的一种基于进化扰动的隐私链路保护方法,其特征在于,所述步骤2-2中,适应度函数如下:
其中δ(x)是指示函数,即x是真的话,取值为1;否则取值为0,α是可调参数,用来调节精度和AUC对适应度函数的影响程度;是扰动后网络的不存在连边的节点对,显然 表示节点对的相似度值,选取RA作为衡量相似度的指标,即:
其中Γ(x)表示x的一跳邻居节点,kz表示节点z的度值。
3.如权利要求1或2所述的一种基于进化扰动的隐私链路保护方法,其特征在于,所述步骤S3中,所述多种链路预测算法是指Common Neighbors,Jaccard,PreferentialAttachment以及Adamic-Adar index。
4.如权利要求1或2所述的一种基于进化扰动的隐私链路保护方法,其特征在于,所述步骤S1中,Ω是网络里所有的节点对,其中Ω={(i,j)|{i,j}∈V,i≠j},N是网络里所有不存在连边的节点对,显然N=Ω-E;
所述S2-1中,删除的连边集合Edel,其中增加的连边集合Eadd,其中由于维持扰动前后网络的总连边数不变,两者的数量相等,均为m;
所述S2-3中,根据适应度的值确定被父代被选择的概率为
所述S2-5中,随机选取删除的连边以及增加的连边替换染色体内的相应的连边,其中
CN201810683667.4A 2018-06-28 2018-06-28 一种基于进化扰动的隐私链路保护方法 Pending CN109063836A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810683667.4A CN109063836A (zh) 2018-06-28 2018-06-28 一种基于进化扰动的隐私链路保护方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810683667.4A CN109063836A (zh) 2018-06-28 2018-06-28 一种基于进化扰动的隐私链路保护方法

Publications (1)

Publication Number Publication Date
CN109063836A true CN109063836A (zh) 2018-12-21

Family

ID=64818096

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810683667.4A Pending CN109063836A (zh) 2018-06-28 2018-06-28 一种基于进化扰动的隐私链路保护方法

Country Status (1)

Country Link
CN (1) CN109063836A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110032902A (zh) * 2019-03-12 2019-07-19 佛山市顺德区中山大学研究院 一种基于单亲遗传算法的阅读器防碰撞方法及其装置
CN110175634A (zh) * 2019-05-06 2019-08-27 浙江工业大学 一种基于扰动子图的网络隐私保护方法
CN111159768A (zh) * 2019-12-31 2020-05-15 广西师范大学 社交网络链接隐私保护效果的评价方法
CN113992375A (zh) * 2021-10-21 2022-01-28 中国人民解放军国防科技大学 一种基于遗传算法的异质复杂网络防御方法

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110032902A (zh) * 2019-03-12 2019-07-19 佛山市顺德区中山大学研究院 一种基于单亲遗传算法的阅读器防碰撞方法及其装置
CN110032902B (zh) * 2019-03-12 2022-04-15 佛山市顺德区中山大学研究院 一种基于单亲遗传算法的阅读器防碰撞方法及其装置
CN110175634A (zh) * 2019-05-06 2019-08-27 浙江工业大学 一种基于扰动子图的网络隐私保护方法
CN111159768A (zh) * 2019-12-31 2020-05-15 广西师范大学 社交网络链接隐私保护效果的评价方法
CN113992375A (zh) * 2021-10-21 2022-01-28 中国人民解放军国防科技大学 一种基于遗传算法的异质复杂网络防御方法
CN113992375B (zh) * 2021-10-21 2023-08-25 中国人民解放军国防科技大学 一种基于遗传算法的异质复杂网络防御方法

Similar Documents

Publication Publication Date Title
CN109063836A (zh) 一种基于进化扰动的隐私链路保护方法
CN111309824B (zh) 实体关系图谱显示方法及系统
Rueda et al. Robustness comparison of 15 real telecommunication networks: Structural and centrality measurements
CN109800573B (zh) 基于度匿名与链路扰动的社交网络保护方法
CN112819300B (zh) 网络攻击下基于随机博弈网的配电网风险评估方法
CN105553869B (zh) 一种电力通信网的风险均衡方法及系统
CN109962773B (zh) 广域量子密码网络数据加密路由方法
CN106789190A (zh) 一种电力通信网脆弱性评估及路由优化方法
CN109218304B (zh) 一种基于攻击图和协同进化的网络风险阻断方法
CN109753797B (zh) 针对流式图的密集子图检测方法及系统
CN111428323A (zh) 复杂网络中利用广义折扣度与k-shell识别一组关键节点的方法
CN109657268B (zh) 一种基于特征值的不确定网络中免疫策略设计方法
US20130211873A1 (en) Determining a churn risk
CN106203172A (zh) 网络最短路径上的加权敏感边隐私保护方法
Tommasel et al. Do recommender systems make social media more susceptible to misinformation spreaders?
CN110213261B (zh) 对抗链路预测的用于网络结构隐私保护的链路删除方法
CN109962813B (zh) 一种用于网络结构隐私保护的网络结构生成方法
CN103812696B (zh) 一种基于混合蛙跳算法的物联网节点信誉评估方法
Imani et al. Guard sets in tor using as relationships
CN108683534A (zh) 一种面向社区发现的网络薄弱节点搜索方法
CN109981526A (zh) 一种确定网络攻击源的方法、装置、介质及设备
CN114117306B (zh) 一种基于本地化差分隐私保护的多目标推荐方法
Li et al. A hybrid trust management framework for wireless sensor and actuator networks in cyber-physical systems
CN106789645A (zh) 路由优化方法和装置
CN105704026A (zh) 一种区分服务网络中低风险路由方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20181221

RJ01 Rejection of invention patent application after publication