CN105682174A

CN105682174A - 促进节点合作的机会网络演化算法及装置

Info

Publication number: CN105682174A
Application number: CN201610027070.5A
Authority: CN
Inventors: 王岢; 徐晓飞; 叶允明
Original assignee: Harbin Institute of Technology Shenzhen
Current assignee: Harbin Institute of Technology Shenzhen
Priority date: 2016-01-15
Filing date: 2016-01-15
Publication date: 2016-06-15

Abstract

本发明提出了一种促进节点合作的机会网络演化算法，首先，建立社会化分布式的信誉模型，包括量化信誉度，信誉的直接计算法和间接信誉评估法；然后，基于信誉度建立相应的激励模型，包含基于信誉的支付函数的设计、基于信誉优选的自适应学习机制等；接下来，建立了多种群非对称演化模型，包括多种群分类、策略更新机制等；最后，基于以上模型设计并实现了演化算法，包括安全协作演化算法以及解决多目标搜索最优问题的萤火虫算法。本发明所提出的演化模型、信誉激励和信誉评估具有适用性和可靠性，动态安全机制具有可操作性。

Description

促进节点合作的机会网络演化算法及装置

技术领域

本发明属于互联网通信技术领域，具体涉及一种促进节点合作的机会网络演化算法及装置。

背景技术

随着智能移动设备的飞速发展，一种即兴、即时的新型关系型网络-机会网络应运而生，成为继社交网络之后未来五年内的一个新的热门发展方向,机会网络中的社交关系是基于主题-兴趣-需求-位置等随机产生，例如基于位置的近距离相遇通信，或者基于算法的动态耦合-关系连接等等；它是机会网络与社交网络相结合的一种创新应用型网络形态。

在机会网络的通信过程中，消息是通过节点相遇“存储-携带-转发”的协作模式传递。然而，在完全开放式的机会网络中，还存在着来自内部恶意节点或自私节点的干扰和破坏，如恶意节点重放消息或阻塞消息传输致网络紊乱的行为等，因此，达成可靠消息传递的本质在于节点间维持着可信的协作状态。节点可信协作是指节点自愿参与路由合作，协助可信节点转发消息，不实施欺骗、伪装或攻击行为，同时，不协助转发恶意信息或与恶意节点交互。实际上，在机会网络中，广泛存在着节点之间互相信任协作的现象，例如，大部分节点会原意协助与自己具有一定社交关系或频繁相遇的其他节点，只是这种协作行为亦同时受到空间、时间、历史行为等其它未知因素的影响。因此，机会网络中的可信协作行为的涌现和维持是一个亟待解决的新问题。

将上述问题总结为一个关键的科学问题：动态机会网络中节点可信协作涌现原理及演化规律问题。可进一步定义该问题为：如何能在包含自私及恶意节点的机会网络中促进节点之间可信协作的产生并能维持在稳定的普遍协作状态。该问题可以分解为两个子问题，一是可信协作产生机理问题，另一个是演化均衡问题。要解决可信协作问题，需要从两方面着手，一是探寻网络内中节点协作现象发生必要条件；二是降低自私节点与恶意节点对整个网络的破坏力。要解决演化均衡问题，主要是需要从机会网络复杂演化过程的建模着手，能准确刻画出节点协作行为演化的实际过程。

针对这些新问题，利用传统的方法无法有效地解决，即使近年来针对分布式P2P网络的安全机制也不能有效地解决这些问题。

针对机会网络的安全合作问题，相关的国内外研究工作可以归纳为以下几点:

●缺乏针对机会网络的消息安全传递过程的本质性研究。虽然近几年目前国外一些研究组提出了针对机会网络中的路由、通信等协议或算法，但通信和路由的本质问题在于节点之间的相遇并发生可信协作行为，如何解决好相遇节点之间的自发性协作及协作可靠性问题是关键，但目前针对此类问题的研究国外和国内均还处于起步阶段。

●现有的信任模型并不适用于机会网络。信任模型相关技术研究虽然已经很久，但并不能直接应用于机会网络；由于机会网络的社会性，即时性、资源有限、P2P分布式等特点，决定了其对信任的影响是多方面多角度的，虽然信任的环境决策因素在一定程度上已知，然而如何计算这些影响因素的权重仍是一个非常大的挑战，并且，信任是动态变化的，如何建立机会网络的动态信誉评估模型是一个亟待解决的问题。

综上所述，由于机会网络兼具社会性、即时性和P2P分布式等特征，所以传统的安全保护技术并不能很好地适应，虽然当前有少数研究学者开始关注到机会网络中的安全问题，但均属于机会网络的问题类综述及调研，而针对机会网络中安全合作的研究目前却处于起步状态。

发明内容

本发明具体通过如下技术方案实现：

一种促进节点合作的机会网络演化算法，包括以下步骤：

(1)初始化机会网络，设置相应参数：网络节点数量、移动速度、随机初始化节点策略S₀和博弈历史H₀，将博弈收益清0，信誉值清0；

(2)它们互相进行m代博弈，即重复执行步骤(3)、(4)、(5)m次，每一代时间间隔为t；

(3)每代开始博弈时，所有的两两相遇的节点在该时间间隔中同时博弈，根据当前支付矩阵利用基于信誉的支付函数计算各自收益，并将各自所有的博弈的收益累积；

(4)当时间间隔t满后，每个节点评估本轮博弈过的节点的信誉度，初筛出学习目标的候选集；

(5)实施萤火虫算法，搜索出最优学习目标，并复制该学习目标的策略作为下一轮博弈的策略；

(6)记录m次演化完成后的相关数据，包括协作水平、博弈的历史。

一种促进节点合作的机会网络演化装置，包括：

初始化装置，用于初始化机会网络，设置相应参数：网络节点数量、移动速度、随机初始化节点策略S₀和博弈历史H₀，将博弈收益清0，信誉值清0；

m代博弈装置，用于所有的两两相遇的节点互相进行m代博弈，每一代时间间隔为t；

记录装置：用于记录m次演化完成后的相关数据，包括协作水平、博弈的历史；

所述m代博弈装置包括：

博弈子装置，用于每代开始博弈时，所有的两两相遇的节点在该时间间隔中同时博弈，根据当前支付矩阵利用基于信誉的支付函数计算各自收益，并将各自所有的博弈的收益累积；

信誉度评估子装置，用于当时间间隔t满后，每个节点评估本轮博弈过的节点的信誉度，初筛出学习目标的候选集；

最优学习目标搜索子装置，用于实施萤火虫算法，搜索出最优学习目标，并复制该学习目标的策略作为下一轮博弈的策略。

附图说明

图1是本发明的主要技术路线总览图；

图2是模糊逻辑的信誉量化方法示意图；

图3是直接信任与间接信任的计算示意图，其中，图3(a)是直接交互产生直接信任，图3(b)是推荐信息产生间接信任,图3(c)是混合方法产生综合信任；

图4是函数f(ρ,y)的图像；

图5是支付矩阵示意图；

图6是系统演化的相位图；

图7是本发明的演化算法的流程图；

图8是本发明所采用的改进的萤火虫算法流程图。

具体实施方式

下面结合附图说明及具体实施方式对本发明进一步说明。

本发明在分析机会网络特征的基础上，引入演化博弈理论工具，对机会网络中的合作机制和演化规律进行深入探究，提供机会网络的节点之间的相互作用(合作、自私、攻击等)关系及演化动力学；我们认为网络中节点节点与生物演化具有共性，通常是通过不断进化(继承、突变)的方法达到演化均衡的，但社会、历史、空间等因素均会对博弈的多重均衡的选择产生影响。本课题研究对象即是随着时间、空间变化的机会网络群体，本发明目的是为了分析从节点到群体普遍协作行为的形成机理，以“优胜劣汰”的进化方法淘汰恶意策略或自私行为，促进网络中节点整体趋向稳定可靠的协作状态。

首先，应将机会网络中的即时性、社会性、动态化、分布式、资源受限等特点纳入到模型研究中，系统性地探究多维因素影响下的信誉度的建模，例如社交关系、时效性、地理位置等因素对信誉度影响的权重。其中涉及到三个子核心问题：如何量化信誉？如何确定信誉的多维影响因子的权重？如何解决信誉度的动态变化？其次，应将信誉引入演化博弈中，探究演化博弈中促进合作涌现的正向激励机制，其中包括：如何选择学习目标？如何制定策略更新规则？如何设计适合的策略收益函数？最后，如何能构建出演化博弈模型准确地描绘节点可信协作的过程？

根据以上需求，本发明提出了“动态机会网络中节点可信协作产生机理和演化机制研究”的方案，从演化博弈模型、信誉激励系统、信誉评估模型三个方面进行探究，并在此基础上，实现了相关算法并进行综合实验验证模型和算法的有效性和准确性。本发明的研究成果将有助于为动态网络中可信协作领域提供理论依据。

因此，如附图1所示，本发明的主要技术路线总体思路如下：1)建立社会化分布式的信誉模型，包括量化信誉度，信誉的直接计算法和间接信誉评估法，以及自适应平滑指数与马尔科夫链相结合的信誉度预估方法；2)基于信誉度建立相应的激励模型，包含基于信誉的支付函数的设计、基于信誉优选的自适应学习机制等；3)建立了多种群非对称演化模型，包括多种群分类、策略更新机制等；4)基于以上模型设计并实现了演化算法，包括安全协作演化算法以及解决多目标搜索最优问题的萤火虫算法。最后，建立模拟机会网络场景的实验模型，将模型和算法效果进行定量评估，验证提出的演化模型、信誉激励和信誉评估的适用性和可靠性，验证动态安全机制的可操作性。具体说明如下：

一、多特征融合的动态社会化信誉评估模型

考虑到机会网络中，基于模糊逻辑的量化方法适合将来的动态信任预估过程，因此，本发明采取模糊逻辑的信任度量方法。基于模糊逻辑的量化表示方法主要是将一些自然语言中的描述与信任相关的程度词赋予某个范围的数值，例如附图2所示，信任值范围在[3.75,6.25]的表示是“高度信任”，如果某个取值是0.25,则有75％的概率是“不信任”，25％的概率是“低信任”。

信誉评估计算方法主要分为两类，一类是直接信任计算，一类是间接信任计算，直接信任是节点与邻居节点直接交互产生的信任值，如图3(a)所示，A节点与B节点直接交互，根据交互情况，产生信任值，属于直接信任；另一类是间接信任，如图3(b)所示即节点C向A推荐B的可信任度，而A此前并未和B产生过直接交互，此时A获得的B的信任值是属于间接信任；如图3(c)所示的是混合方法产生综合信任。

采用效率高、速度快的加权平均法对信誉值进行初步计算，这里关键需要确定其中有哪些影响因子，以及它们的权重：

T＝γT_social×(1-γ)T_unsocial

其中T_social＝α×R_p+β×R_q+γ×R_n，α+β+γ＝1。在影响因子中将引入社交型因子T_social，例如相遇次数R_p、成功协作次数R_q，双方共同好友数R_n等，而T_unsocial则是除了社交因子外的其它影响信誉的因素，例如物理位置等因素，将重点研究必要的社交型因子和非社交型因子对信誉度的具体影响以确定其相应的权重值。

二、基于信誉的激励模型

为了应对自私节点和恶意节点，本发明采用引入综合信誉度作为奖惩因子的思路，在支付矩阵中加入适当的激励奖惩因子。

首先可以把每个博弈阶段抽象为一个四元组D＝(G,S,U,§)，G表示系统中节点的集合，也是博弈参与者，G_i＝{i,N_-i},其中N_-i表示此次博弈除了节点i以外的其它相邻的博弈节点。S表示策略集，S＝{s_i,s_-i}为博弈者的策略组合，其中s_i表示合作的正面行为，s_-i表示其它负面行为。U为博弈参与方各方的收益，§为奖惩因子，T_j为博弈对手j的信誉值，T_i为邻居节点对博弈者i的综合信誉评估值，u_i(s_i,s_-i)为博弈者策略组合下所获得的收益，因此，在时间t时间段，

此项奖惩因子可以调节到：当对方信誉度越高，如果选择与对方不合作，则信誉风险开销越大；当对方信誉度越低，如果选择与对方不合作，则信誉风险开销越低；因此，最终目的是使得，促进与信誉度高的节点合作，信誉度低的节点不合作，这样，形成一个激励机制，即节点必须努力正面行为使得自身的信誉度增高才会有让更多其它节点与它合作的可能性。

信誉优选学习机制的思路是，根据信誉值初步筛选出一些潜在的可模仿学习的目标对象，作为学习目标的候选者集，通常信誉值高的节点，可被看做信任节点，其诚信度较高，虚报收益值的可能性相对较低；考虑到新节点或陌生节点的加入，机会网络中并不总能准确地预估出对方的信誉度，此刻加入一个信誉评估信心值ε，如果大于某个阀值，则信誉度评估值挑选，如果小于某个阀值，则可再结合用传统的三种挑选模仿者的方式。

模仿学习的演化动力学规则如下：

w ({P_{i} (t)} &LeftArrow; P_{k}) = \frac{1}{1 + e^{- (u_{k} - u_{i}) ϵ}}

其中，u_i表示p_i的累积收益，{P_i(t)}表示节点i筛选的学习目标的候选择集，参数ε代表了一种对博弈对方的信誉评估的信心值，当ε值越大，表示对信誉评估有较高的判定信心，即可以确定以信誉优选的方式初筛模仿对象；当ε→0时，则进行完全随机的挑选。

因此，ε是关键点，这里需要解决信誉评估的信心值ε的量化计算法。另外，初筛出候选集后，还需要在候选集中搜索最优目标作为本轮学习对象，这是一个典型的多目标搜索最优问题，可以采用群智能的优化算法，因此，本发明改进萤火虫算法，解决搜索最优问题。

三、演化博弈模型及动力学分析

演化博弈思路主要是分为两类，一是解决种群内演化，构建单群体对称演化博弈模型，另一种是种群间演化的过程，构建多种群非对称演化博弈模型。最后，还需要通过仿真方法研究外界变量、内部参数对演化动力学的影响问题。

3.1种群内节点可信协作演化博弈模型

3.1.1问题描述与模型假设

种群内协作可看作对称博弈，博弈双方的策略空间相同,每个节点缓存中有相同的纯策略，而任意的策略的支付则依赖于节点所选的交互策略，因此有如下的定义：

博弈G＝(I,S,u)称为二人对称博弈，如果I＝{i,j}，纯策略集为N＝{1,2,.....,n}，混合策略集为当博弈方i选择x∈Δ而博弈方j选择y∈Δ时，博弈方i的支付矩阵为A，则此时支付函数为u(x,y)＝x·Ay。

3.1.2建模关键点思路

假设种群内每个节点都参与交互，每个节点选择“可信协作”策略x的概率为1-ρ，选择突变(例如“自私”)策略y∈Δ的概率为ρ，单一种群下的收益可看作某一节点选择策略w＝ρy+(1-ρ)x∈Δ时产生的支付。那么相应的,节点选择现任策略x的支付函数值为u(x,w)＝u(x,ρy+(1-ρ)x),并且u(y,w)＝u(y,ρy+(1-ρ)x)。

此时，整个模型的目标是为了寻找(ESS)演化稳定策略，则需要判断，存在任意使是否满足以下条件：

u (x, w) = u [x, ρ y + (1 - ρ) x] > u (y, w) = u [y, ρ y + (1 - ρ) x], &ForAll; y &NotEqual; x - - - (a - 1)

其中u(x,w)＝x^TAw。

策略x∈Δ在任意的策略y∈Δ下的最优回应集合为ψ^*(y)。此时若x是该博弈的演化稳定策略，则它必须满足x∈ψ^*(y)，即x必须是该博弈的Nash均衡即x∈Δ^Nash，但还需要满足另外的条件才能保证x是演化稳定的策略，由此可知，若用Δ^ESS表示博弈的进化稳定策略集合，那么有由进化稳定策略的含义可以更详细的表示Δ^ESS的形式如下：

Δ^{E S S} = {\begin{matrix} x &Element; Δ^{N a s h} : u (x, y) > u (y, y) & &ForAll; y &Element; ψ^{*} (x), y &NotEqual; x \end{matrix}} - - - (a - 2)

称x是该博弈的进化稳定策略，若满足如下两个条件：

u (x, x) &GreaterEqual; u (x, y), &ForAll; y - - - (a - 3)

当存在y满足u(x,x)＝u(x,y)时有

u (x, y) > u (y, y), &ForAll; y &NotEqual; x - - - (a - 4)

将式(a-1)在定义计数函数：f:[0,1]×Δ→R下可写为f(ρ,y)，且其等于f(ρ,y)＝u(x-y,ρy+(1-ρ)x)

由x是进化稳定的可知当ρ足够小且y≠x时，f(ρ,y)＞0，由于函数u是双线性的，f(ρ,y)可写为：f(ρ,y)＝u(x-y,x)+ρu(x-y,y-x)

当x,y∈Δ固定时，计数函数f(ρ,y)是一个关于ρ的仿射函数，它的截距为u(x-y,x)斜率为u(x-y,y-x)，如附图4所示。

条件(a-3)等价于截距是非负的，而条件(a-4)则等价于当截距为零时斜率是正值。因此当两个条件都满足时，才存在使得对于所有的都有f(ε,y)＞0成立，则判断x∈Δ^ESS。

因此，达到Nash均衡并不一定是演化均衡，这里需要进一步研究均衡关系、结合仿真协助解决模型参数确定、演化均衡判定的问题。

3.2多种群非对称演化模型

3.2.1问题描述与模型假设

节点之间相遇时交互可看作是一次博弈，在演化过程中，节点与相遇节点进行博弈，获得收益值；如果同时相遇节点不止一个，则进行逐一博弈，将统计博弈总体收益值。接下来，节点移动，位置变化，相遇邻居也得到变化，进行下一轮的博弈。如果一个选择纯策略s_i的节点得到的支付收益少于混合群体平均收益，那么选择纯策略s_i的节点在群体中所占比例将会随着时间的演化而不断减少；如果一个选择策略s_i的节点得到的支付多于混合群体平均收益，那么选择策略s_i的节点在群体中所占比例将会随着时间的演化而不断地增加；如果节点选择纯策略s_i所得的收益恰好等混合群体平均收益，则选择该纯策略的节点在群体中所占比例不变。

按照之前所述，首先需要将将博弈参与者分类，抽象为两类，一类是正常节点NormalNodes，一类是异常节点AbnormalNodes。那么博弈的参与者集合就是{NormalNodes,AbnormalNodes}。对于NormalNode来说，它的策略空间NN＝(协作α₁，不协作α₂)；而AbnormalNode的策略空间AN＝(自私β₁，攻击β₂)，其中“自私β₁”包含多种自私行为，例如{沉默、背叛....}，“攻击β₂”包含多种攻击行为，例如{欺骗、纂改、窃听、DOS攻击等}。这里，将恶意节点的行为策略抽象为{自私，攻击}。

其中，收益U、策略V和成本规则C等具体内容是需要研究的，例如，双种群非对称协作博弈的支付函数可用如附图5所示的支付矩阵表示：

矩阵

(\begin{matrix} a_{1} & b_{1} \\ c_{1} & d_{1} \end{matrix})

是博弈方i的收益矩阵系数，

(\begin{matrix} a_{1} & b_{1} \\ c_{1} & d_{1} \end{matrix})

是博弈方j的收益矩阵,需要研究博弈方的非对称策略{α₁，α₂}，{β₁，β₂}，以及采取相应策略的收益与成本具体的计算方法，即需要设计{a₁，a₂，b₁,b₂,c₁,c₂,d₁,d₂}计算规则。

并且，博弈方i采用策略α₁的概率是i₁,期望收益u₁₁,采用α₂的概率i₂，期望收益u₁₂，博弈方i群体的平均收益，而博弈方j采用策略β₁，β₂的期望收益分别是u₂₁、u₂₂，并且j群体的平均收益

\begin{matrix} U_{i} = \{\begin{matrix} u_{11} = (1, 0) (\begin{matrix} a_{1} & b_{1} \\ c_{1} & d_{1} \end{matrix}) (\begin{matrix} j_{1} \\ j_{2} \end{matrix}) \\ u_{12} = (0, 1) (\begin{matrix} a_{1} & b_{1} \\ c_{1} & d_{1} \end{matrix}) (\begin{matrix} j_{1} \\ j_{2} \end{matrix}) \\ {\overset{&OverBar;}{u}}_{1} = (i_{1}, i_{2}) (\begin{matrix} a_{1} & b_{1} \\ c_{1} & d_{1} \end{matrix}) (\begin{matrix} j_{1} \\ j_{2} \end{matrix}) \end{matrix} & U_{j} = \{\begin{matrix} u_{21} = (i_{1}, i_{2}) (\begin{matrix} a_{2} & b_{2} \\ c_{2} & d_{2} \end{matrix}) (\begin{matrix} 1 \\ 0 \end{matrix}) \\ u_{22} = (i_{1}, i_{2}) (\begin{matrix} a_{2} & b_{2} \\ c_{2} & d_{2} \end{matrix}) (\begin{matrix} 0 \\ 1 \end{matrix}) \\ {\overset{&OverBar;}{u}}_{2} = (i_{1}, i_{2}) (\begin{matrix} a_{2} & b_{2} \\ c_{2} & d_{2} \end{matrix}) (\begin{matrix} y_{1} \\ y_{2} \end{matrix}) \end{matrix} \end{matrix}

3.2.2模型关键点思路

建立复制动态动力学方程：

\begin{matrix} \frac{d_{i} (t)}{d t} &RightArrow; {\frac{\frac{{di}_{1} (t)}{d t} \overset{Δ}{=} F_{i_{1}} (i, j) = i_{1} (t) (u_{11} - \overset{&OverBar;}{u_{1}})}{\frac{{di}_{2} (t)}{d t} \overset{Δ}{=} F_{i_{2}} (i, j) = i_{2} (t) (u_{12} - \overset{&OverBar;}{u_{1}})} & \frac{d_{j} (t)}{d t} &RightArrow; {\frac{\frac{{dj}_{1} (t)}{d t} \overset{Δ}{=} F_{j_{1}} (i, j) = j_{1} (t) (u_{11} - \overset{&OverBar;}{u_{2}})}{\frac{{dj}_{2} (t)}{d t} \overset{Δ}{=} F_{j_{2}} (i, j) = j_{2} (t) (u_{22} - \overset{&OverBar;}{u_{2}})} \end{matrix}

演化均衡分析：根据该系统相应的雅可边(Jakobian)矩阵的局部稳定性来分析系统在这些均衡点的局部稳定性。分别对两个复制动态求关于i和j的偏导数,可得雅可边矩阵为:

J = (\begin{matrix} \frac{\partial F_{1} (i, j)}{\partial i}, \frac{\partial F_{1} (i, j)}{\partial y} \\ \frac{\partial F_{2} (i, j)}{\partial i}, \frac{\partial F_{2} (i, j)}{\partial j} \end{matrix})

代入计算J,并根据ESS判定条件，判定局部均衡点是否是演化均衡点。例如，附图6是系统演化的相位图示例，E₄(1,1)是表示双方都愿意协作，E₁(0,0)则表示双方都不协作，图中箭头方向指出系统有可能收敛于E₄(1,1)，也有可能收敛于E₁(0,0)，这主要取决于i和j在动态博弈过程中的学习及策略调整速度，需要进一步细化研究。

3.3社交因素、物理因素对演化动力学的影响的分析思路

社交因素，主要研究社交关系、社区对合作水平的影响。从理论上，可以假设通常在同一个社区的群体之间产生合作的概率会比不同社区的群体合作概率高，同样，之前有过社交关系的节点之间比无任何社交关系的节点之间更容易产生协作行为。目的主要是要研究和分析社区和社交关系对协作水平的推进作用。

将社交关系r_i进行分类，分为强关系s_i和弱关系l_i两种。同时，节点的影响力因子m_i。

同时，考虑物理因素，网络拓扑结构o_i、密度k_i、均匀度j_i、节点移动速度v_i等对协作水平的影响，在演化博弈模型中，重点在于复制动力学的学习机制，因此将重点以此为目标，即研究上述因素对节点i复制j策略的概率的综合影响力：

w(P_i←P_j)＝f(r_i,m_i,o_i,k_i,j_i,v_i)。

四、算法思路

这里重点陈述两个主要算法的基本思路及相关问题，一个是演化算法，一个是改进萤火虫多目标搜索最优算法。

节点安全协作的演化过程是一个反复博弈最终形成演化均衡稳定状态的过程，因此，演化算法需要包含迭代、单阶段博弈等元素。

如附图7所示，演化算法框架的基本思路：

(1)初始化机会网络，设置相应参数，例如网络节点数量、移动速度等、随机初始化节点策略S₀和博弈历史H₀,博弈收益清0，信誉值初始化清0；

(2)它们互相进行了m(例如m＝5000)代博弈(重复执行3，4,5步m次)，每一代时间间隔为t；

(3)每代开始博弈时，所有的两两相遇的节点在该时间间隔中同时博弈，根据当前支付矩阵计算各自收益，并将各自所有的博弈的收益累积；

(6)记录m次演化完成后的相关数据，包括协作水平、博弈的历史等。

这里，演化算法中，单阶段时间间隔t大小对演化过程是有影响的，可通过仿真观察不同的影响结果。

本发明引进萤火虫算法解决在初筛候选集中搜索最优学习目标的问题。总体思路是用策略搜索空间中的点模拟自然界中的萤火虫节点，将搜索和优化过程模拟成萤火虫节点的吸引和移动过程，将求解问题的目标函数度量成节点所处位置的优劣，将节点的优胜劣汰过程类比为搜索和优化过程中用较好的可行解取代较差的可行解的迭代过程。

本发明的多目标搜索最优问题的改进型萤火虫算法的流程化如附图8所示，其中，关键点在于将候选者集的收益作为目标函数，Rij表示萤火虫节点j和节点i的距离，这里将其构造为自身节点与候选目标集节点的策略数目差R_ij＝R_i-R_j，则表示对方策略数量与其整体吸引力成反比，当对方比自身的策略数目越多，即对方的吸引度应越大，则萤火虫位置就越靠近，表示学习对方的积极性就越大，反之，学习的积极性越少。

然而，此处存在早熟收敛等问题，因此，还将通过增加局部寻优的改进方式提高萤火虫算法每次迭代的搜索速度，即在更新完萤火虫位置后，对策略相差最少的x％比例的节点，进行局部寻优，不同比例x的取值会对提高的搜索速度有不同的影响。

本发明的主要贡献在于：

(1)基于信誉的自适应学习目标初筛法

演化博弈模型中，恶意节点虚报收益导致相遇邻居节点纷纷学习该恶意节点策略，干扰正常的协作演化效果。因此，本发明设计一种更适合机会网络的模仿学习机制-信誉优选的学习机制，根据信誉值挑选模仿对象，通常信誉值高的节点，则可认为其诚实度高，可以将其加入学习目标的候选者集，作为初选对象。并且，加入自适应因子ε，当对信誉值评估信心不足时，则在多个候选者中，引入萤火虫算法实现多目标搜索最优，保持在每个博弈阶段学习的策略都是相邻最优。同时，通过在支付函数中加入了信誉奖惩因子，可以调节到：当对方信誉度越高，如果选择与对方不合作，则信誉风险开销越大；当对方信誉度越低，如果选择与对方不合作，则信誉风险开销越低；因此，最终目的是使得，促进与信誉度高的节点合作，信誉度低的节点不合作，这样，形成一个激励机制，即节点必须努力正面行为使得自身的信誉度增高才会有让更多其它节点与它合作的可能性。

(2)引入萤火虫优化算法解决策略空间搜索最优学习问题

在每一个博弈阶段，首先会根据信誉值筛选出一批信誉度高的相遇节点作为学习目标候选者集，然后，再在候选集中挑选本轮博弈的学习目标，该问题可以转化为多目标搜索最优问题。通过引进萤火虫算法，利用自然界中萤火虫的聚集发光行为构造随机优化算法，将萤火虫自身亮度构造为节点策略的总体收益或平均收益，亮度越高，对其它萤火虫的吸引度越大。用策略搜索空间中的点模拟自然界中的萤火虫节点，将搜索学习目标候选集过程模拟成萤火虫节点的吸引和位置移动过程，将求解问题的目标函数度量成萤火虫节点所处位置的优劣，将学习目标的优胜劣汰过程类比为搜索和优化过程中用较好的可行解取代较差可行解的迭代过程。

(3)针对机会网络的多种群非对称演化博弈模型

为了解决网络中的协作、自私和攻击等问题，需要引入博弈机制，传统解决动态网络的合作问题的方法主要是针对单种群对称性的演化博弈方法，然而，机会网络是一个典型的动态复杂网络形态，具有多种特征，包含多个种群，例如正常节点、自私节点和恶意节点等不同种群，不同种群的策略空间有所不同，所具备的理性知识不同，演化速度也有所不同。因此，除了单种群对称演化博弈模型，本发明还提出构建多种群非对称演化博弈模型以模拟不同群体节点之间的协作博弈状态。

以上内容是结合具体的优选实施方式对本发明所作的进一步详细说明，不能认定本发明的具体实施只局限于这些说明。对于本发明所属技术领域的普通技术人员来说，在不脱离本发明构思的前提下，还可以做出若干简单推演或替换，都应当视为属于本发明的保护范围。

Claims

1.一种促进节点合作的机会网络演化算法，其特征在于：所述算法包括以下步骤：

2.根据权利要求1所述的机会网络演化算法，其特征在于：所述步骤4中评估信誉度基于社会化分布式的信誉模型，包括量化信誉度，利用信誉的直接计算法和间接计算法计算信誉度，以及自适应平滑指数与马尔科夫链相结合的信誉度预估。

3.根据权利要求2所述的机会网络演化算法，其特征在于：所述计算信誉度采用效率高、速度快的加权平均法对信誉值进行初步计算：

T＝γT_social×(1-γ)T_unsocial

其中T_social＝α×R_p+β×R_q+γ×R_n，α+β+γ＝1；在影响因子中将引入社交型因子T_social，相遇次数R_p、成功协作次数R_q，双方共同好友数R_n，而T_unsocial则是除了社交因子外的其它影响信誉的因素。

4.根据权利要求1所述的机会网络演化算法，其特征在于：所述步骤4中初筛出学习目标的候选集具体为：根据信誉值初步筛选出一些潜在的可模仿学习的目标对象，作为学习目标的候选者集，通常信誉值高的节点，被看做信任节点，其诚信度较高，虚报收益值的可能性相对较低。

5.根据权利要求1所述的机会网络演化算法，其特征在于：所述步骤5中的萤火虫算法为改进的萤火虫算法，关键点在于将候选者集的收益作为目标函数，Rij表示萤火虫节点j和节点i的距离，将其构造为自身节点与候选目标集节点的策略数目差R_ij＝R_i-R_j，则表示对方策略数量与其整体吸引力成反比，当对方比自身的策略数目越多，即对方的吸引度应越大，则萤火虫位置就越靠近，表示学习对方的积极性就越大，反之，学习的积极性越少。

6.根据权利要求1所述的机会网络演化算法，其特征在于：所述步骤3中的博弈基于多种群非对称演化博弈模型，以模拟不同群体节点之间的协作博弈状态，所述不同群体分为正常节点、自私节点和恶意节点群体。

7.一种促进节点合作的机会网络演化装置，其特征在于：所述装置包括：初始化装置，用于初始化机会网络，设置相应参数：网络节点数量、移动速度、随机初始化节点策略S₀和博弈历史H₀，将博弈收益清0，信誉值清0；

所述m代博弈装置包括：

8.根据权利要求6所述的机会网络演化装置，其特征在于：所述信誉度评估子装置中，评估信誉度基于社会化分布式的信誉模型，包括量化信誉度，利用信誉的直接计算法和间接计算法计算信誉度。

9.根据权利要求6所述的机会网络演化装置，其特征在于：所述信誉度评估子装置中，初筛出学习目标的候选集具体为：根据信誉值初步筛选出一些潜在的可模仿学习的目标对象，作为学习目标的候选者集，通常信誉值高的节点，被看做信任节点，其诚信度较高，虚报收益值的可能性相对较低。

10.根据权利要求6所述的机会网络演化装置，其特征在于：所述萤火虫算法为改进的萤火虫算法，关键点在于将候选者集的收益作为目标函数，Rij表示萤火虫节点j和节点i的距离，将其构造为自身节点与候选目标集节点的策略数目差R_ij＝R_i-R_j，则表示对方策略数量与其整体吸引力成反比，当对方比自身的策略数目越多，即对方的吸引度应越大，则萤火虫位置就越靠近，表示学习对方的积极性就越大，反之，学习的积极性越少。