CN104408306A - Vanet中利用演化博弈来激励停靠车辆合作转发进行分析建模的方法 - Google Patents

Vanet中利用演化博弈来激励停靠车辆合作转发进行分析建模的方法 Download PDF

Info

Publication number
CN104408306A
CN104408306A CN201410683430.8A CN201410683430A CN104408306A CN 104408306 A CN104408306 A CN 104408306A CN 201410683430 A CN201410683430 A CN 201410683430A CN 104408306 A CN104408306 A CN 104408306A
Authority
CN
China
Prior art keywords
vehicle
strategy
group
formula
parked vehicles
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201410683430.8A
Other languages
English (en)
Other versions
CN104408306B (zh
Inventor
吴迪
赵鑫
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dalian University of Technology
Original Assignee
Dalian University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dalian University of Technology filed Critical Dalian University of Technology
Priority to CN201410683430.8A priority Critical patent/CN104408306B/zh
Publication of CN104408306A publication Critical patent/CN104408306A/zh
Application granted granted Critical
Publication of CN104408306B publication Critical patent/CN104408306B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Traffic Control Systems (AREA)

Abstract

本发明属于移动通信技术领域,实现了一种在VANET中利用路边停靠车辆进行庞大的多媒体服务的方法。其特征是利用了演化博弈理论构建解决了停靠车辆不合作的情况。首先本发明将系统模型分为两种。第一种是将停靠车辆看做单群体,即单群体演化博弈模型。第二种是将停靠车辆和即走车辆看做两个群体,即多群体演化博弈模型。然后通过演化博弈理论得出本发明的复制动态方程。最后通过改变相关参数证明本发明所提出的基于演化博弈的激励机制是成功的。本发明的效果和益处是证明了对路边停靠车辆基于演化博弈的激励机制是有效的,通过分析论证都可以得到复制动态方程,解得进化稳定策略,并且分析了影响ESS的因素。

Description

VANET中利用演化博弈来激励停靠车辆合作转发进行分析建模的方法
技术领域
本发明属于移动通信技术领域,涉及到在VANET(vehicle Ad Hoc Network,车联网)中利用演化博弈理论的激励机制对路边停靠车辆的合作转发进行分析建模的方法。给出了两种不同场景下构建演化博弈模型的方法,能够通过对成本和收益的分析论证,保证路边停靠车辆都积极合作转发,为其余车辆提供多媒体服务。
背景技术
在VANET中,通过RSU(Road Side Units,路侧单元)的设置来进行多媒体服务是一种流行的方式,但是RSU设置花费较大,还有在RSU稀疏的情况下,延迟也是不容忽视的。为此,研究人员通过基于V2V(Vehicle To Vehicle,车到车)的通信来进行多媒体服务,但是VANET的这种高度移动性,间断性连接等独有的特点,使得这种方式也不稳定。因此利用路边停靠车辆进行庞大的多媒体服务倍加引起重视,场景如图1所示。
现阶段在VANET中对停靠车辆的研究主要存在的问题是着重研究怎么利用停靠车辆或者是怎么管理停靠车辆进行多媒体的服务,假设停靠车辆都是积极合作的。而没有考虑停靠车辆提供服务和接受消息都是要花费能量,正是这种花费可能导致车辆不合作。也就是忽略了停靠车辆的自私性。例如:(1)在城市场景的VANET中,把停靠车辆看成是静止的节点接入VANET(Nianbo liu,Ming liu,“PVA in VANETs Stopped Cars Are Not Silent”,2011,INFOCOM.)。(2)一种管理停靠车辆的集群方法(Nianbo liu,Ming liu,“The sharing at roadsideVehicular content distribution using parked vehicles”,2012,INFOCOM.)。(3)路边停靠车辆的一个应用,利用路边停靠车辆及时发现在拐角处,被障碍物挡住的车辆,有效的防止交通事故的发生(Huibin Feng,Shunyi Zhang,Chao Liu,Junrong Yan,Ming Zhang,“P2P Incentive Model On Evolutionary GameTheory”,2008,WiCOM.)。
发明内容
本发明要解决的问题是在城市允许停靠车辆的道路中,在服务不对称的情况下,通过演化博弈的方法,提出激励机制,激励停靠车辆合作转发,从而实现所有停靠车辆都提供多媒体服务。
本发明的技术方案如下:
通过对路边停靠车辆的场景分析,得出此场景符合演化博弈的基本特征:第一停靠车辆并不固定,它是随着时间变化的一个群体。第二影响停靠车辆选择合作的因素并不唯一,同时通过演化过程可以达到一定的规律性。第三是停靠车辆的选择过程,具有一定的惯性,也就是说通过博弈,当多次选择合作的时候,以后都会合作。所以这里我们采用演化博弈的方法,来分析影响合作因素的激励机制。本专利将影响合作因素归为两大类,一为成本,包括电量消耗、电瓶损耗等。二为收益,包括个人声誉值、出行满意度等。通过对成本收益的演化分析来激励停靠车辆积极合作。
本发明的具体步骤如下:
分为两种情况:第一种是停靠的车辆在一定时间内是静止的,也就是把停靠车辆看成是密集、廉价、少资源的类似RSU。第二种是有些停靠车辆是在一定时间内静止不动的,但是还有一部分车辆是即走的。
在这两种情况下,对第一种情况我们利用单群体的演化博弈(SCEGT)激励机制,来激励停靠车辆的合作;对第二种情况我们利用多种群的演化博弈,其中停靠的车辆为一个种群,即走的车辆为另外一个种群,提出一种多群体的演化博弈(MCEGT)激励机制,激励其合作。
模型描述:
A系统模型
在VANET中,常常研究的是V2V以及V2R(Vehicle To Rode Side Unit)这两种通信方式。常把VANET看作是车辆集合的网络,每辆车辆配备有通信设备,允许不同车辆间的基于802.11p协议的通信。本发明中主要考虑的是V2V的通信。特别地,是在城市中,允许停车的道路的场景下,移动车辆和停靠在路边的车辆之间的通信。有两种通信模型:
第一种情况:路边停靠车辆是在一定时间内一直停靠。当车辆Vs要传递大的多媒体文件给车辆Vd。Vd不在Vs的传输范围内,并且道路上也没有移动的车辆可以作为中间节点传输。那么就利用道路旁边停靠的车辆协助多媒体服务。车辆Vs将多媒体资源分发给停靠的车辆3,4,5,6,7,如图2所示。然后当车辆Vd通过这些拥有资源的停靠车辆时,就会从这些车辆上下载自己满意的多媒体资源,如图3所示。
第二种情况:路边停靠的车辆有的是长时间停靠的,有的是即走的。如图2所示,当车辆Vs要传递大的多媒体文件给车辆Vd。Vd不在Vs的传输范围内,并且道路上也没有移动的车辆可以作为中间节点传输。那么就利用道路旁边停靠的车辆协助多媒体服务。车辆Vs将多媒体资源分发给停靠的车辆3,4,5,6,7。当车辆Vd正在下载车辆6上的资源时,有停靠的车辆3要离开停靠车辆团体,那么它就会把Vs传递给自己的多媒体服务,移交给停靠的邻居车辆2,然后离开,如图4所示。当车辆Vd往前行驶,在从车辆2上下载所有的多媒体资源,如图5所示。
停靠的车辆,虽然速度为0,但是内置的无线设备是开放的,可以允许所有路过车辆接入。并且有充足的电源,使得停靠的车辆能够跟所有经过他的车辆进行通信。在城市场景的VANET中,大量的停靠车辆,使得车与车之间资源传输的有效性和传输成功率大大提高。
B、演化博弈模型
Smith结合了博弈理论中分析的动态演化过程来研究复杂系统,并首次提出了演化博弈,同时他提供了一个工具来解释个体的组织关系。定义G={I,S,π}是基本的演化博弈模型,其中I表示参与者集合,S表示参与者策略集合,π表示参与者效用函数集合。演化博弈理论关键的概念是ESS。如果y≠x∈S,存在满足等式:
u[x,εy+(1-ε)x]>u[y,εy+(1-ε)x]
这里x就是这个模型的ESS。
演化博弈论的核心理论有两个:即演化稳定策略、复制者动态方程。演化稳定策略强调一个动态演化系统达到稳定状态的过程,演化稳定策略x*需要满足如下两个条件:第一,x'=Ω(x*)=0;第二,Ω'(x*)<06 复制者动态方程描述采取变异的频数关于时间t的一个动态微分方程。用xi'=[φ(xi,x)-φ(x,x)]xi来表示复制者动态方程,其中xi(t)采取纯策略的人占总人数的比例,φ(xi,x)为策略i的适应度,φ(x,x)为平均适应度(JW Weibull,“Evolutionary game theory,”MITpress,1995.)。
下面介绍演化博弈理论的标准设置(Sandholm,W.H.Population Games andEvolutionary Dynamics[M].Forthcoming,MIT Press,Cambridge,2008.):
(1)有一个用户的种群。种群中的用户数量很大。
(2)假设有有限的纯策略或行为。种群的每个成员从同一个策略集合Α={1,2,...,I}中选择策略。
(3)设为纯策略集合I上的概率分布集合。M可以解释为混合策略集合。事实上,假设从种群中随机选择出的用户:使用标记策略的参与者遇到使用策略j的参与者的概率是yj。几个博弈过程以后,对于使用j的参与者等价于面对使用混合策略(y1,...,yI)的参与者。
为了使演化博弈更好的适应我们提出的模型,除了以上的基本假设以外,本发明模型假设:
(1)考虑随机选择的用户的数量是随机变量K,K∈{0,1,...}。
(2)每个参与者不知道会有多少参与者与之竞争。
(3)路边停靠车辆和即走车辆电量是充足的,但是也是消耗的。
(4)每辆车辆都装有无线接入设备,并且是开放的。
下面是单群体的演化博弈(SCEGT)激励机制分析
A.SCEGT模型
我们考虑在第一种情况下,酒店路边停靠的车辆是长时间不移动的。那所有的停靠车辆是一个团体。在这个团体中,因为两个博弈参与者的演化分析,最终就代表整个团体的稳定状态。所以在单团体中,我们不考虑博弈参与者的数量。又因为车辆都是静止的,所以车辆之间的连接概率都是1。
假设该团体,在每个固定的slot中,他们随机选择配对,策略空间是{0,1},策略0表示停靠车辆会给需要资源的路过移动车辆或者停靠车辆提供服务,同时从他们那下载自己感兴趣的资源;策略1表示停靠车辆只从其他车辆上下载自己喜欢的资源,不服务路过车辆或者停靠车辆。每个节点下载和提供服务都是需要消耗一定能量的。因为车辆在停靠的时候,无线设备等开放是靠电量支持的。
假设每个节点提供一个单元的多媒体服务得到的车辆收益是P,成本是d;而每个节点接收其他车辆的每个单元多媒体资源的收益是R,需要的成本是c。其中,P>R,d>c。因为接收到其他车辆的资源可能是对自己有用的,但也可能没有任何价值,只是做了一个载体,那么收益R也就是很微小的。在单团体中,路边停靠的车辆没有迁移发生,那么我们就假设每个车辆都是接收一个单元资源,也是提供一个单元的多媒体服务。根据演化博弈规则,参与者j的收益矩阵如下:
选择0 选择1
选择0 R+P-c-d,R+P-c-d P-d,R-c
选择1 R-c,P-d 0,0
我们定义γ0(t)表示团体中选择策略0的节点数目。γ1(t)表示团体中选择策略1的节点数目。那么得到公式(1)。
γ(t)=γ0(t)+γ1(t)   (1)
定义表示团体中选择策略0的比例,那么团体中选择策略1的比例就是1-x(t)。
根据博弈矩阵,选择策略0的期望收益如公式(2)所示:
U0(t)=x(t)*(R+P-c-d)+[1-x(t)]*(P-d)   (2)
=x(t)*(R-c)+P-d
选择策略1的期望收益如公式(3)所示:
U1(t)=x(t)*(R-c)+[1-x(t)]*0   (3)
=x(t)*(R-c)
整个团体的平均收益如公式(4)所示:
U ‾ ( t ) = x ( t ) * U 0 + [ 1 - x ( t ) ] * U 1 = x ( t ) * ( R + P - c - d ) - - - ( 4 )
B.动态复制分析
下面的复制动态指出了演化是如何发生动态变化的,特别是可以使用复制子动态来动态收敛到均衡解。复制子动态描述了一个具有多种策略的种群的演化过程,在种群中每个个体遵从以下模仿规则:即每次学习后,个体选择以正比于收益之差的概率选择任意能够获得比自身更多的收益的策略。最终的动态是,策略的分组在种群中增长的速率与该策略的收益与种群的平均收益之差成比例。在动态演化博弈中,种群中的单个个体,能够通过变异和选择过程复制自己的个体称作复制子。这种情况下,有较高收益的复制子能够快速复制它本身。重复此博弈,并且在博弈演化的每代中,参与者观察同一种群中其他参与者的收益,那么在下一次演化中,参与者就会选择具有较高收益当然策略。
我们假设每个阶段博弈是从kt,k∈N开始,在(k+1)t,k∈N结束。节点的平均收益是与博弈对手有关的。假设在一个很小的时间间隔ε中,只有ε部分参与博弈。那么由(Huibin Feng,Shunyi Zhang,Chao Liu,Junrong Yan,Ming Zhang,“P2PIncentive Model On Evolutionary Game Theory”,2008,WiCOM.)我们可得,在时间t+ε时的复制动态方程如公式(9)所示:
dx ( t ) dt = x ( t ) [ U 0 ( t ) - U ‾ ( t ) ] - - - ( 9 )
也就是得到复制动态方程,如公式(10)所示:
dx ( t ) dt = x ( t ) [ U 0 ( t ) - U ‾ ( t ) ] = x ( t ) * [ 1 - x ( t ) ] ( P - d ) - - - ( 10 )
由以上分析得到定理1:在SMEGT激励机制作用下,ESS是存在的,并且只有一个进化稳定策略。
证明如下:
根据上面提到的ESS满足的第一个条件,我们令dx/dt=0,即:
x(t)*[1-x(t)](P-d)=0。由于P-d在上面定义是大于0的,那么解得的稳定状态、不动点仅有两个,也就是x(t)1=0,x(t)2=1。动态微分方程的相位图如图6所示。
根据ESS满足的第二个条件,我们知道,在ESS处F(x)满足的条件是:
F ( x * ) = 0 F &prime; ( x * ) < 0 那么,有以下分析:
假设有η比例的博弈方偏离了策略0而选择了策略1,那么有:
U0(t)=(1-η)*(R+P-c-d)+η*(P-d)=(1-η)*(R-c)+P-d
U1(t)=(1-η)*(R-c)+η*0=(1-η)*(R-c)
U &OverBar; ( t ) = ( 1 - &eta; ) * U 0 + &eta; * U 1 = ( 1 - &eta; ) * ( R + P - c - d )
U0(t)=(1-η)*(R-c)+P-d>0
所以x(t)2=1是演化稳定策略ESS。
假设有η比例的博弈方选择策略0而偏离策略1,那么有:
U0(t)=η*(R+P-c-d)+(1-η)*(P-d)=η*(R-c)+P-d
U1(t)=η*(R-c)+(1-η)*0=η*(R-c)
U &OverBar; ( t ) = &eta; * U 0 + ( 1 - &eta; ) * U 1 = &eta; * ( R + P - c - d )
U0(t)=η*(R-c)+P-d>U1(t)
所以x(t)1=0不是演化稳定策略。
综上,本模型中存在ESS,x*(t)=1,并且是唯一的ESS。
证毕。
下面是多群体的演化博弈(MCEGT)激励机制
A.MCEGT模型
在多群体演化博弈激励机制中,也就是系统模型中的第二种情况,有些停靠车辆是在一定时间内静止不动的,但是还有一部分车辆是随时开走的。我们考虑利用两个种群的演弈,长时间停靠的车辆为一个种群,即走的车辆为一个种群,都作为激励对象,提出MCEGT激励机制,激励他们合作。
因为车辆是移动的,那么两个车辆之间的连接时间服从指数分布,其参数λ>0,那么在时间τ内,两个车辆连接的概率为1-Qτ,其中Qτ如公式(11)所示(Rachid El-Azouzi,F.D.Pellegini and V.Kamble,“Evolutionary forwardinggames in Delay Tolerant Networks,”in the Proceeding of WiOpt,pp.76-84,29May-5June,Avignon,2010.)。
Qτ=(1+λτ)e-λτ   (11)
这个博弈中的种群就是两个团体。每个团体的节点数量是未知的,两个团体中的个体可能在某一时刻成为对方团体中的成员。为了建立方程式,我们假设团体Pop1和团体Pop2的节点数量分别是m和n。考虑各个团体的车辆在平面的分布都服从泊松分布,参数是γ>0(Rachid El-Azouzi,F.D.Pellegini and V.Kamble,“Evolutionary forwarding games in Delay Tolerant Networks,”in theProceeding of WiOpt,pp.76-84,29May-5June,Avignon,2010.)。那么在一次演化博弈过程中,存在n个车辆的概率如公式(12)所示:
P ( K = n ) = &gamma; n - 1 ( n - 1 ) ! e - &gamma; , n &GreaterEqual; 1 - - - ( 12 )
团体1(用pop1表示)中都是停靠的车辆,pop1的策略空间是p1∈{0,1}。因为我们要考虑两个团体的博弈,那么演化博弈是在车辆离开时开始的。所以在这里pop1要与单团体的时候策略有变化。策略0表示接受离开车辆移交的资源。策略1,不接受离开车辆的移交资源。团体2(用pop2表示)包含的是即走的车辆,pop2的策略空间是p2∈{0,1}。策略0代表离开时移交资源给相邻车辆。策略1代表车辆离开,车辆自私,不把资源移交给相邻的车辆。每个节点下载和提供服务都是需要成本的。因为车辆在停靠的时候,无线设备等开放是靠电量支持的。假设每个离开节点移交一个单元的多媒体服务得到的收益是P,需要成本是d;而每个节点接收其他车辆的每个单元多媒体资源的收益是R,需要成本c。本发明假设每个车辆上携带一个单元的资源。
因为在两个团体中,两个团体之间不存在竞争。所以在pop1中,如果其中的节点采取策略0,那么它得到收益的概率是如公式(13)所示(Rachid El-Azouzi,F.D.Pellegini and V.Kamble,“Evolutionary forwarding games in Delay TolerantNetworks,”in the Proceeding of WiOpt,pp.76-84,29May-5June,Avignon,2010):
P 1 ( x , y ) = ( 1 - ( 1 - x&alpha; ) m ) mx - - - ( 13 )
同理,在pop2中,节点采取策略0的收益概率如公式(14)所示:
P 2 ( x , y ) = ( 1 - ( 1 - y&alpha; ) n ) ny - - - ( 14 )
其中α=1-Qτ
在pop1中每个博弈参与者选择策略0的概率是x,在pop2中博弈参与者选择策略0的概率是y。表示团体n在选择策略s时的期望收益。那么在pop1中选择策略0的个体的收益可以用公式(15)计算:
U 1 0 ( x , y ) = y [ R &Sigma; m = 1 &infin; P ( K = m ) P 1 ( x , y ) - c ] - - - ( 15 )
同理,在pop2中选择策略0的个体期望收益计算如公式(16)所示:
U 2 0 ( x , y ) = x [ P &Sigma; n = 1 &infin; P ( K = n ) P 2 ( x , y ) - d ] - - - ( 16 )
在两个团体中,个体选择策略1的收益定义为:
在pop1中,采用策略0的节点比例是x,采取策略1的节点比例是1-x,那么团体的平均效用函数如公式(17)所示:
U &OverBar; 1 = x U 1 0 ( x , y ) + ( 1 - x ) U 1 1 ( x , y ) = xy [ R &Sigma; m = 1 &infin; P ( K = m ) P 1 ( x , y ) - c ] - - - ( 17 )
同理,团体Pop2的平均效用函数如公式(18)所示:
U &OverBar; 2 = y U 2 0 ( x , y ) + ( 1 - y ) U 2 1 ( x , y ) = xy [ P &Sigma; n = 1 &infin; P ( K = n ) P 2 ( x , y ) - d ] - - - ( 18 )
B.复制动态分析
根据Simple SCEGT Incentive Mechanism中关于复制动态方程的分析可知,演化博弈的复制动态方程可以用公式(19)表示:
dx ( t ) dt = x ( t ) [ U 0 ( t ) - U &OverBar; ( t ) ] - - - ( 19 )
【把代入】那么两个团体的复制动态方程为为公式(20):
dx dt = x ( U 1 0 ( x , y ) - U &OverBar; 1 ) = x ( 1 - x ) U 1 0 ( x , y ) dy dt = y ( U 2 0 ( x , y ) - U &OverBar; 2 ) = y ( 1 - y ) U 2 0 ( x , y ) - - - ( 20 )
把公式(15)(16)带入公式(20)整理可得公式(21):
dx dt = xy ( 1 - x ) [ R x&gamma; ( 1 - e - x&gamma;&alpha; ) - c ] dy dt = xy ( 1 - y ) [ P y&gamma; ( 1 - e - y&gamma;&alpha; ) - d ] - - - ( 21 )
定理2:在MCEGT激励机制作用下,并且经过一定时间演化两个团体稳定到各自的ESS。
证明如下:
根据动态复制方程满足条件得公式(22):
dx dt = 0 dy dt = 0 - - - ( 22 )
也就是如公式(23)所示:
dx dt = xy ( 1 - x ) [ R x&gamma; ( 1 - e - x&gamma;&alpha; ) - c ] = 0 dy dt = xy ( 1 - y ) [ P y&gamma; ( 1 - e - y&gamma;&alpha; ) - d ] = 0 - - - ( 23 )
根据上式,我们可以得到pop1和pop2的不动点如公式(24)(25)所示:
x 1 = 0 x 2 = 1 x 3 = - LambertW ( - c &alpha;R ) &gamma;&alpha; - - - ( 24 ) y 1 = 0 y 2 = 1 y 3 = - LambertW ( - d &alpha;P ) &gamma;&alpha; - - - ( 25 )
其中LambertW是超越函数的反函数。
根据公式(21)的基本成立条件可知,x,y不能为0。那么x2=1和 x 3 = - LambertW ( - c &alpha;R ) &gamma;&alpha; 是在一定条件下的稳定的ESS。因为 x 3 = - LambertW ( - c &alpha;R ) &gamma;&alpha; 是受参数影响的,那么调整参数变化,是可以得到x2=1的结果,也就是说包含了x2=1稳定ESS。所以我们可以用一个表示pop1的稳定演化策略ESS。
同理,在pop2中,我们用来表示pop2的稳定演化策略ESS。
综上,在MCEGT激励机制中,两个团体都有一个稳定的ESS,如公式(26)所示:
x * = - LambertW ( - c &alpha;R ) &gamma;&alpha; y * = - LambertW ( - d &alpha;P ) &gamma;&alpha; - - - ( 26 )
证毕。
本发明的效果和益处是证明了对路边停靠车辆基于演化博弈的激励机制是有效的,通过分析论证都可以得到复制动态方程,解得进化稳定策略,并且分析了影响ESS的因素。通过设置合适范围的参数在就会激励所有节点都合作。
附图说明
附图1是路边停靠车辆的示意图。
附图2是路过车辆Vs向路边停靠车辆3,4,5,6,7下传多媒体资源示意图。
附图3是路过车辆Vd接受路边停靠车辆3,4,5,6,7上多媒体资源示意图。
附图4是即走车辆3将得到的多媒体资源移交给邻居车辆2的示意图。
附图5是路过车辆Vd从车辆2上下载所有的多媒体资源的示意图。
附图6是单群体演化博弈中复制动态微分方程的相位示意图。
附图7是单群体演化博弈激励机制有效性的示意图。
附图8是在单群体演化博弈激励机制下改变停靠车辆起始参与比例x后,收益和成本差值p-d保持不变,收敛速度逐渐加快的示意图。
附图9是在单群体演化博弈激励机制下停靠车辆起始参与比例x不变,改变收益和成本的差值p-d后,差值越大收敛速度越快的示意图。
附图10是多群体演化博弈激励机制下给定所有参数后说明多群体演化博弈激励机制有效性的示意图。
附图11(a)是在多群体演化博弈激励机制下给定P、d、c后,y稳定在0.225的情况下,R值越大停靠车辆参与合作比例收敛速度越快的示意图。
附图11(b)是在多群体演化博弈激励机制下给定P、d、R后,y稳定在0.225的情况下,c越大停靠车辆参与合作比例收敛速度越慢的示意图。
附图12(a)是在多群体演化博弈激励机制下给定R、c、d后,x稳定在0.6的情况下,P越大即走车辆参与合作比例收敛速度越大的示意图。
附图12(b)的是在多群体演化博弈激励机制下给定R、c、P后,x稳定在0.6情况下,d越大即走车辆参与合作比例收敛速度越慢的示意图。
具体实施方式
以下结合技术方案和附图详细说明本发明的实施例。
通过实例说明在本发明的方法下,设置合适的收益和成本就可以保证所有车辆都会积极的合作转发。在系统模型描述部分可知P>R,d>c。
第一:单群体演化博弈激励机制
对于路边停靠车辆,在SMEGT激励机制分析结果下给出不同参数。当路边停靠车辆起初只有x等于10%的比例提供多媒体服务,成本与收益的差值p-d等于3固定不变时,随着时间的推移,所以停靠车辆都会选择策略0,如图7所示,图7说明本发明中单群体演化博弈激励机制是有效的。
当停靠车辆起初参与提供多媒体服务的比例x分别为10%,20%,30%,40%,50%,60%,70%,80%,90%,收益和成本的差值p-d等于3固定不变的情况下,停靠车辆选择策略0的收敛速度逐渐加快,如图8所示,说明选择策略0的起始比例越大,所有停靠车辆全部选择策略0所需的时间越短。
当停靠车辆起初参与提供多媒体服务的比例x为10%保持不变,而改变收益和成本的差值,即p-d分别等于2,3,4,5,6,7,8,9,10的时候,通过图9可以看出,差值越大,参与提供多媒体服务的停靠车辆比例越容易稳定到100%。
第二:多群体演化博弈激励机制
对于路边停靠和即走车辆,据车辆即走场景下MCEGT激励机制分析,设置不同参数得出结果说明本发明中多群体演化博弈激励机制也是有效的。首先以下值固定,即时间τ取值为1;相应的结果α=0.8009λ=3,γ=3.3。x和y初始值固定为10%保持不变。
(1)当P=10,d=3.R=5,c=2时,代入公式(26),得到图10所示结果,说明对于路边停靠和即走车辆的多群体演化博弈激励机制是有效的。
(2)当P=10和d=3的值不改变的时候,y的稳定态是0.225。X=0.1的初值保持不变,在这种情况下
(a)当R=3.4.5.6.7.8.9,c=2,得出的结果如图11a所示,说明在pop2中y稳定,pop1中c一定的情况下,收益R值越大,收敛速度越快,多群体演化博弈中停靠车辆全部选择策略0的收敛速度越快。
(b)当R=8,c=1.2.3.4.5.6.7.8得出的结果如图11b所示,说明在pop2中y稳定,pop1中R一定的情况下,消耗c值越大,收敛速度越慢,越不稳定,当达到8时,pop1中,无人选择策略0。
(3)当R=5,c=2的值不改变的时候,x的稳定态是0.6。Y=0.1的初值保持不变,在这种情况下。
(a)d=3P=10.12.14.16.18.20.22时,得出的结果如图12a所示,说明在pop1中x稳定,pop2中d一定的情况下,收益P值越大,收敛速度越快,说明在多群体演化博弈中即走车辆全部选择策略0的收敛速度越快。
(b)P=22,d=2.3.4.5.6.7.8时,得出的结果如图12b所示,说明在pop1中x稳定,pop2中P一定的情况下,成本d值越大越不稳定,当达到8时,在pop2中无人选择策略0。

Claims (2)

1.一种VANET中利用演化博弈来激励停靠车辆合作转发进行分析建模的方法,其特征在于以下步骤,
一、分成两种情况
第一种是停靠的车辆在一定时间内是静止的;对第一种情况用的是单群体的演化博弈SCEGT激励机制,来激励停靠车辆的合作;
第二种是有些停靠车辆是在一定时间内静止不动的,但是还有一部分车辆是即走的;对第二种情况用的是多种群的演化博弈,其中停靠的车辆为一个种群,即走的车辆为另外一个种群,提出一种多群体的演化博弈MCEGT激励机制;
二、模型的建立
A、V2V的通信模型
第一种:路边停靠车辆是在一定时间内一直停靠;当车辆Vs要传递大的多媒体文件给车辆Vd;Vd不在Vs的传输范围内,并且道路上也没有移动的车辆作为中间节点传输,则利用道路旁边停靠的车辆协助多媒体服务,车辆Vs将多媒体资源分发给停靠的车辆;然后当车辆Vd通过这些拥有资源的停靠车辆时,就会从这些车辆上下载自己满意的多媒体资源;
第二种:路边停靠的车辆有的是长时间停靠的,有的是即走的;当车辆Vs要传递大的多媒体文件给车辆Vd;Vd不在Vs的传输范围内,并且道路上也没有移动的车辆以作为中间节点传输;那么就利用道路旁边停靠的车辆协助多媒体服务;车辆Vs将多媒体资源分发给停靠的车辆;当车辆Vd正在下载车辆上的资源时,停靠车辆要离开停靠车辆团体,它就会把Vs传递给自己的多媒体服务,移交给停靠车辆的邻居车辆,然后离开;当车辆Vd往前行驶,在从车辆2上下载所有的多媒体资源;
B、演化博弈模型
定义G={I,S,π}是基本的演化博弈模型,其中I表示参与者集合,S表示参与者策略集合,π表示参与者效用函数集合;如果y≠x∈S,存在满足等式:u[x,εy+(1-ε)x]>u[y,εy+(1-ε)x],x就是模型的ESS;
演化博弈论的核心有两个:即演化稳定策略、复制者动态方程;演化稳定策略x*需要满足如下两个条件:第一,x'=Ω(x*)=0;第二,Ω'(x*)<06;复制者动态方程描述采取变异的频数关于时间t的一个动态微分方程;用xi'=[φ(xi,x)-φ(x,x)]xi来表示复制者动态方程,其中xi(t)采取纯策略的人占总人数的比例,φ(xi,x)为策略i的适应度,φ(x,x)为平均适应度;
演化博弈论的标准设置是:
(1)有一个用户的种群;种群中的用户数量很大;
(2)假设有有限的纯策略或行为;种群的每个成员从同一个策略集合
Α={1,2,...,I}中选择策略;
(3)设为纯策略集合I上的概率分布集合;M可以解释为混合策略集合;事实上,假设从种群中随机选择出的用户:使用标记策略的参与者遇到使用策略j的参与者的概率是yj;几个博弈过程以后,对于使用j的参与者等价于面对使用混合策略(y1,...,yI)的参与者。
2.根据权利要求1所述的方法,其特征在于,
(一)单群体的演化博弈(SCEGT)激励机制如下:
A.SCEGT模型
第一种情况,停靠的车辆是长时间不移动的;在每个固定的slot中,随机选择配对,策略空间是{0,1},策略0表示停靠车辆会给需要资源的路过移动车辆或者停靠车辆提供服务,同时从他们那下载自己感兴趣的资源;策略1表示停靠车辆只从其他车辆上下载自己喜欢的资源,不服务路过车辆或者停靠车辆;
设每个节点提供一个单元的多媒体服务得到的车辆收益是P,成本是d;而每个节点接收其他车辆的每个单元多媒体资源的收益是R,需要的成本是c;其中,P>R,d>c;单团体中,路边停靠的车辆没有迁移发生,每个车辆都是接收一个单元资源,也是提供一个单元的多媒体服务;根据演化博弈规则,参与者j的收益矩阵如下:
定义γ0(t)表示团体中选择策略0的节点数目;γ1(t)表示团体中选择策略1的节点数目;如公式(1)所示,
γ(t)=γ0(t)+γ1(t)   (1)
定义表示团体中选择策略0的比例,团体中选择策略1的比例就是1-x(t);
根据博弈矩阵,选择策略0的期望收益如公式(2)所示:
U0(t)=x(t)*(R+P-c-d)+[1-x(t)]*(P-d)   (2)
=x(t)*(R-c)+P-d
选择策略1的期望收益如公式(3)所示:
U1(t)=x(t)*(R-c)+[1-x(t)]*0   (3)
=x(t)*(R-c)
整个团体的平均收益如公式(4)所示:
U &OverBar; ( t ) = x ( t ) * U 0 + [ 1 - x ( t ) ] * U 1 = x ( t ) * ( R + P - c - d ) - - - ( 4 )
B.动态复制分析
每个阶段博弈是从kt,k∈N开始,在(k+1)t,k∈N结束;节点的平均收益是与博弈对手有关的;设在一个很小的时间间隔ε中,只有ε部分参与博弈;在时间t+ε时的复制动态方程如公式(9)所示:
dx ( t ) dt = x ( t ) [ U 0 ( t ) - U &OverBar; ( t ) ] - - - ( 9 )
复制动态方程,如公式(10)所示:
dx ( t ) dt = x ( t ) [ U 0 ( t ) - U &OverBar; ( t ) ] = x ( t ) * [ 1 - x ( t ) ] ( P - d ) - - - ( 10 )
在SMEGT激励机制作用下,ESS是存在的,并且只有一个进化稳定的策略;
本模型中存在ESS,x*(t)=1,并且是唯一的ESS;
(二)多群体的演化博弈(MCEGT)激励机制如下
A、MCEGT模型
系统模型中的第二种情况,有些停靠车辆是在一定时间内静止不动的,但是还有一部分车辆是随时开走的;
因为车辆是移动的,那么两个车辆之间的连接时间服从指数分布,其参数λ>0,那么在时间τ内,两个车辆连接的概率为1-Qτ,其中Qτ如公式(11)所示:
Qτ=(1+λτ)e-λτ   (11)
假设团体Pop1和团体Pop2的节点数量分别是m和n;考虑各个团体的车辆在平面的分布都服从泊松分布,参数是γ>0;那么在一次演化博弈过程中,存在n个车辆的概率如公式(12)所示:
P ( K = n ) = &gamma; n - 1 ( n - 1 ) ! e - &gamma; , n &GreaterEqual; 1 - - - ( 12 )
团体1(用pop1表示)中都是停靠的车辆,pop1的策略空间是p1∈{0,1};因为考虑两个团体的博弈,那么演化博弈是在车辆离开时开始的;在这里pop1要与单团体的时候策略有变化;策略0表示接受离开车辆移交的资源;策略1,不接受离开车辆的移交资源;团体2(用pop2表示)包含的是即走的车辆,pop2的策略空间是p2∈{0,1};策略0代表离开时移交资源给相邻车辆;策略1代表车辆离开,车辆自私,不把资源移交给相邻的车辆;每个节点下载和提供服务都是需要成本的;因为车辆在停靠的时候,无线设备等开放是靠电量支持的;假设每个离开节点移交一个单元的多媒体服务得到的收益是P,需要成本是d;而每个节点接收其他车辆的每个单元多媒体资源的收益是R,需要成本c;假设每个车辆上携带一个单元的资源;
因为在两个团体之间不存在竞争;在pop1中,如果其中的节点采取策略0,那么它得到收益的概率如公式(13)所示:
P 1 ( x , y ) = ( 1 - ( 1 - x&alpha; ) m ) mx - - - ( 13 )
同理,在pop2中,节点采取策略0的收益概率如公式(14)所示:
P 2 ( x , y ) = ( 1 - ( 1 - y&alpha; ) n ) ny - - - ( 14 )
其中α=1-Qτ
在pop1中每个博弈参与者选择策略0的概率是x,在pop2中博弈参与者选择策略0的概率是y;表示团体n在选择策略s时的期望收益;那么在pop1中选择策略0的个体的收益可以用公式(15)计算:
U 1 0 ( x , y ) = y [ R &Sigma; m = 1 &infin; P ( K = m ) P 1 ( x , y ) - c ] - - - ( 15 )
同理,在pop2中选择策略0的个体期望收益计算如公式(16)所示:
U 2 0 ( x , y ) = x [ P &Sigma; n = 1 &infin; P ( K = n ) P 2 ( x , y ) - d ] - - - ( 16 )
在两个团体中,个体选择策略1的收益定义为:
在pop1中,采用策略0的节点比例是x,采取策略1的节点比例是1-x,那么团体的平均效用函数如公式(17)所示:
U &OverBar; 1 = x U 1 0 ( x , y ) + ( 1 - x ) U 1 1 ( x , y ) = xy [ R &Sigma; m = 1 &infin; P ( K = m ) P 1 ( x , y ) - c ] - - - ( 17 )
同理,团体Pop2的平均效用函数如公式(18)所示:
U &OverBar; 2 = y U 2 0 ( x , y ) + ( 1 - y ) U 2 1 ( x , y ) = xy [ P &Sigma; m = 1 &infin; P ( K = n ) P 2 ( x , y ) - d ] - - - ( 18 )
B.复制动态分析
演化博弈的复制动态方程用公式(19)表示:
dx ( t ) dt = x ( t ) [ U 0 ( t ) - U &OverBar; ( t ) ] - - - ( 19 )
【把代入】那么两个团体的复制动态方程为公式(20):
dx dt = x ( U 1 0 ( x , y ) - U &OverBar; 1 ) = x ( 1 - x ) U 1 0 ( x , y ) dy dt = y ( U 2 0 ( x , y ) - U &OverBar; 2 ) = y ( 1 - y ) U 2 0 ( x , y ) - - - ( 20 )
把公式(15)(16)带入公式(20)整理得公式(21):
dx dt = xy ( 1 - x ) [ R x&gamma; ( 1 - e - x&gamma;&alpha; ) - c ] dy dt = xy ( 1 - y ) [ P y&gamma; ( 1 - e - y&gamma;&alpha; ) - d ] - - - ( 21 )
用一个表示pop1的稳定演化策略ESS;
在pop2中,用来表示pop2的稳定演化策略ESS;
在MCEGT激励机制中,两个团体都有一个稳定的ESS,如公式(26)所示:
x * = - LambertW ( - c &alpha;R ) &gamma;&alpha; y * = - LambertW ( - d &alpha;P ) &gamma;&alpha; - - - ( 26 ) .
CN201410683430.8A 2014-11-24 2014-11-24 Vanet中利用演化博弈来激励停靠车辆合作转发进行分析建模的方法 Active CN104408306B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410683430.8A CN104408306B (zh) 2014-11-24 2014-11-24 Vanet中利用演化博弈来激励停靠车辆合作转发进行分析建模的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410683430.8A CN104408306B (zh) 2014-11-24 2014-11-24 Vanet中利用演化博弈来激励停靠车辆合作转发进行分析建模的方法

Publications (2)

Publication Number Publication Date
CN104408306A true CN104408306A (zh) 2015-03-11
CN104408306B CN104408306B (zh) 2017-05-24

Family

ID=52645937

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410683430.8A Active CN104408306B (zh) 2014-11-24 2014-11-24 Vanet中利用演化博弈来激励停靠车辆合作转发进行分析建模的方法

Country Status (1)

Country Link
CN (1) CN104408306B (zh)

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106130924A (zh) * 2016-06-06 2016-11-16 武汉理工大学 多媒体云环境下基于演化博弈论的带宽分配优化方法
CN106960246A (zh) * 2017-03-17 2017-07-18 重庆邮电大学 一种基于演化博弈的车辆诱导方法
CN107181640A (zh) * 2017-05-03 2017-09-19 同济大学 一种城市道路场景下车联网连通性指标的获取方法
CN107439036A (zh) * 2015-04-01 2017-12-05 Lg电子株式会社 V2x终端在无线通信系统中发送和接收信号的方法和装置
CN107479380A (zh) * 2017-08-25 2017-12-15 东北大学 基于演化博弈理论的多智能体协调控制方法
CN107516439A (zh) * 2017-07-28 2017-12-26 北京航空航天大学 一种基于满意博弈论的飞行器冲突解脱方法及装置
CN109565404A (zh) * 2016-08-11 2019-04-02 高通股份有限公司 用于交通工具到交通工具通信的自主资源选择
CN109658742A (zh) * 2018-12-28 2019-04-19 北京信息科技大学 基于前序飞行信息的密集飞行自主冲突解脱方法
CN110111605A (zh) * 2019-06-12 2019-08-09 吉林大学 基于动态博弈的自动驾驶车辆出入口匝道行驶决策方法
CN111294242A (zh) * 2020-02-16 2020-06-16 湖南大学 一种提高多智能体系统合作水平的多跳学习方法
CN114218332A (zh) * 2022-02-22 2022-03-22 国网新源控股有限公司 一种基于区块链技术的智能电网电能计量数据共享方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103249062A (zh) * 2013-01-24 2013-08-14 无锡南理工科技发展有限公司 一种基于重复博弈的融合泛在网多终端协同信任机制
CN103458482A (zh) * 2013-05-28 2013-12-18 大连理工大学 Vanet中解决rsu接入问题的演化博弈方法
EP2743726A1 (en) * 2012-12-14 2014-06-18 Koninklijke KPN N.V. Methods and systems for assessing trust in a mobile ad hoc network

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2743726A1 (en) * 2012-12-14 2014-06-18 Koninklijke KPN N.V. Methods and systems for assessing trust in a mobile ad hoc network
CN103249062A (zh) * 2013-01-24 2013-08-14 无锡南理工科技发展有限公司 一种基于重复博弈的融合泛在网多终端协同信任机制
CN103458482A (zh) * 2013-05-28 2013-12-18 大连理工大学 Vanet中解决rsu接入问题的演化博弈方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
DI WU 等: "Evolutionary Game Theoretic Modeling and Repetition of Media Distributed Shared in P2P-Based VANET", 《INTERNATIONAL JOURNAL OF DISTRIBUTED SENSOR NETWORKS》 *
NIANBO LIU: "The Sharing at Roadside: Vehicular Content Distribution Using Parked Vehicles", 《THE 31ST ANNUAL IEEE INTERNATIONAL CONFERENCE ON COMPUTER COMMUNICATIONS: MINI-CONFERENCE》 *
凌艳: "VANET中基于博弈论的RSU接入问题", 《中国优秀硕士学位论文全文数据库 信息科技辑》 *
曹静: "基于演化博弈理论的车辆网络路由研究", 《中国优秀硕士学位论文全文数据库 信息科技辑 》 *

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107439036A (zh) * 2015-04-01 2017-12-05 Lg电子株式会社 V2x终端在无线通信系统中发送和接收信号的方法和装置
CN106130924A (zh) * 2016-06-06 2016-11-16 武汉理工大学 多媒体云环境下基于演化博弈论的带宽分配优化方法
CN109565404A (zh) * 2016-08-11 2019-04-02 高通股份有限公司 用于交通工具到交通工具通信的自主资源选择
CN109565404B (zh) * 2016-08-11 2021-11-02 高通股份有限公司 用于交通工具到交通工具通信的自主资源选择方法和设备
CN106960246A (zh) * 2017-03-17 2017-07-18 重庆邮电大学 一种基于演化博弈的车辆诱导方法
CN107181640A (zh) * 2017-05-03 2017-09-19 同济大学 一种城市道路场景下车联网连通性指标的获取方法
CN107181640B (zh) * 2017-05-03 2019-11-29 同济大学 一种城市道路场景下车联网连通性指标的获取方法
CN107516439A (zh) * 2017-07-28 2017-12-26 北京航空航天大学 一种基于满意博弈论的飞行器冲突解脱方法及装置
CN107479380A (zh) * 2017-08-25 2017-12-15 东北大学 基于演化博弈理论的多智能体协调控制方法
CN109658742A (zh) * 2018-12-28 2019-04-19 北京信息科技大学 基于前序飞行信息的密集飞行自主冲突解脱方法
CN110111605A (zh) * 2019-06-12 2019-08-09 吉林大学 基于动态博弈的自动驾驶车辆出入口匝道行驶决策方法
CN110111605B (zh) * 2019-06-12 2021-08-31 吉林大学 基于动态博弈的自动驾驶车辆出入口匝道行驶决策方法
CN111294242A (zh) * 2020-02-16 2020-06-16 湖南大学 一种提高多智能体系统合作水平的多跳学习方法
CN114218332A (zh) * 2022-02-22 2022-03-22 国网新源控股有限公司 一种基于区块链技术的智能电网电能计量数据共享方法
CN114218332B (zh) * 2022-02-22 2022-05-17 国网新源控股有限公司 一种基于区块链技术的智能电网电能计量数据共享方法

Also Published As

Publication number Publication date
CN104408306B (zh) 2017-05-24

Similar Documents

Publication Publication Date Title
CN104408306A (zh) Vanet中利用演化博弈来激励停靠车辆合作转发进行分析建模的方法
Ning et al. Self-interest-driven incentives for ad dissemination in autonomous mobile social networks
Wang et al. Dynamic popular content distribution in vehicular networks using coalition formation games
Li et al. The impact of node selfishness on multicasting in delay tolerant networks
Zhao et al. Social-aware data dissemination via device-to-device communications: Fusing social and mobile networks with incentive constraints
Zhou et al. ConSub: Incentive-based content subscribing in selfish opportunistic mobile networks
Wang et al. Coalitional graph games for popular content distribution in cognitive radio VANETs
CN103647714B (zh) 一种基于社交能量的移动社交容迟网络路由方法
Qiu et al. A survey of mobile social networks: Applications, social characteristics, and challenges
Zhan et al. Incentive mechanism design in mobile opportunistic data collection with time sensitivity
Kaur et al. Simulation and Analysis of AODV routing protocol in VANETs
Zhu et al. Data routing strategies in opportunistic mobile social networks: Taxonomy and open challenges
CN101188535A (zh) 基于二叉树的无线传感器网络分簇能量均衡路由确定方法
CN105871641A (zh) 一种基于云的数据获取方法
Wang et al. The value strength aided information diffusion in socially-aware mobile networks
Wu et al. Routing algorithm based on multi-community evolutionary game for VANET
CN106657261B (zh) 车联网中基于联盟博弈和距离预测的车辆间数据传输方法
CN107181793B (zh) 基于动态博弈论的交通服务信息转发方法
Han et al. Competition-based participant recruitment for delay-sensitive crowdsourcing applications in D2D networks
Ding et al. A public goods game theory-based approach to cooperation in VANETs under a high vehicle density condition
Zhao et al. Survey on social-aware data dissemination over mobile wireless networks
Wei et al. SUCCESS: A Secure User-centric and Social-aware Reputation Based Incentive Scheme for DTNs.
Huang et al. Social-aware resource allocation for content dissemination networks: An evolutionary game approach
Zhang et al. Cellular traffic offloading via link prediction in opportunistic networks
Tao et al. A resource allocation game with restriction mechanism in VANET cloud

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant