CN104408306A

CN104408306A - Vanet中利用演化博弈来激励停靠车辆合作转发进行分析建模的方法

Info

Publication number: CN104408306A
Application number: CN201410683430.8A
Authority: CN
Inventors: 吴迪; 赵鑫
Original assignee: Dalian University of Technology
Current assignee: Dalian University of Technology
Priority date: 2014-11-24
Filing date: 2014-11-24
Publication date: 2015-03-11
Anticipated expiration: 2034-11-24
Also published as: CN104408306B

Abstract

本发明属于移动通信技术领域，实现了一种在VANET中利用路边停靠车辆进行庞大的多媒体服务的方法。其特征是利用了演化博弈理论构建解决了停靠车辆不合作的情况。首先本发明将系统模型分为两种。第一种是将停靠车辆看做单群体，即单群体演化博弈模型。第二种是将停靠车辆和即走车辆看做两个群体，即多群体演化博弈模型。然后通过演化博弈理论得出本发明的复制动态方程。最后通过改变相关参数证明本发明所提出的基于演化博弈的激励机制是成功的。本发明的效果和益处是证明了对路边停靠车辆基于演化博弈的激励机制是有效的，通过分析论证都可以得到复制动态方程，解得进化稳定策略，并且分析了影响ESS的因素。

Description

VANET中利用演化博弈来激励停靠车辆合作转发进行分析建模的方法

技术领域

本发明属于移动通信技术领域，涉及到在VANET(vehicle Ad Hoc Network，车联网)中利用演化博弈理论的激励机制对路边停靠车辆的合作转发进行分析建模的方法。给出了两种不同场景下构建演化博弈模型的方法，能够通过对成本和收益的分析论证，保证路边停靠车辆都积极合作转发，为其余车辆提供多媒体服务。

背景技术

在VANET中，通过RSU(Road Side Units,路侧单元)的设置来进行多媒体服务是一种流行的方式，但是RSU设置花费较大，还有在RSU稀疏的情况下，延迟也是不容忽视的。为此，研究人员通过基于V2V(Vehicle To Vehicle,车到车)的通信来进行多媒体服务，但是VANET的这种高度移动性，间断性连接等独有的特点，使得这种方式也不稳定。因此利用路边停靠车辆进行庞大的多媒体服务倍加引起重视，场景如图1所示。

现阶段在VANET中对停靠车辆的研究主要存在的问题是着重研究怎么利用停靠车辆或者是怎么管理停靠车辆进行多媒体的服务，假设停靠车辆都是积极合作的。而没有考虑停靠车辆提供服务和接受消息都是要花费能量，正是这种花费可能导致车辆不合作。也就是忽略了停靠车辆的自私性。例如：(1)在城市场景的VANET中，把停靠车辆看成是静止的节点接入VANET(Nianbo liu，Ming liu，“PVA in VANETs Stopped Cars Are Not Silent”，2011，INFOCOM.)。(2)一种管理停靠车辆的集群方法(Nianbo liu，Ming liu，“The sharing at roadsideVehicular content distribution using parked vehicles”，2012，INFOCOM.)。(3)路边停靠车辆的一个应用，利用路边停靠车辆及时发现在拐角处，被障碍物挡住的车辆，有效的防止交通事故的发生(Huibin Feng,Shunyi Zhang,Chao Liu,Junrong Yan,Ming Zhang,“P2P Incentive Model On Evolutionary GameTheory”,2008,WiCOM.)。

发明内容

本发明要解决的问题是在城市允许停靠车辆的道路中，在服务不对称的情况下，通过演化博弈的方法，提出激励机制，激励停靠车辆合作转发，从而实现所有停靠车辆都提供多媒体服务。

本发明的技术方案如下：

通过对路边停靠车辆的场景分析，得出此场景符合演化博弈的基本特征：第一停靠车辆并不固定，它是随着时间变化的一个群体。第二影响停靠车辆选择合作的因素并不唯一，同时通过演化过程可以达到一定的规律性。第三是停靠车辆的选择过程，具有一定的惯性，也就是说通过博弈，当多次选择合作的时候，以后都会合作。所以这里我们采用演化博弈的方法，来分析影响合作因素的激励机制。本专利将影响合作因素归为两大类，一为成本，包括电量消耗、电瓶损耗等。二为收益，包括个人声誉值、出行满意度等。通过对成本收益的演化分析来激励停靠车辆积极合作。

本发明的具体步骤如下：

分为两种情况：第一种是停靠的车辆在一定时间内是静止的，也就是把停靠车辆看成是密集、廉价、少资源的类似RSU。第二种是有些停靠车辆是在一定时间内静止不动的，但是还有一部分车辆是即走的。

在这两种情况下，对第一种情况我们利用单群体的演化博弈(SCEGT)激励机制，来激励停靠车辆的合作；对第二种情况我们利用多种群的演化博弈，其中停靠的车辆为一个种群，即走的车辆为另外一个种群，提出一种多群体的演化博弈(MCEGT)激励机制，激励其合作。

模型描述:

A系统模型

在VANET中，常常研究的是V2V以及V2R(Vehicle To Rode Side Unit)这两种通信方式。常把VANET看作是车辆集合的网络，每辆车辆配备有通信设备，允许不同车辆间的基于802.11p协议的通信。本发明中主要考虑的是V2V的通信。特别地，是在城市中，允许停车的道路的场景下，移动车辆和停靠在路边的车辆之间的通信。有两种通信模型：

第一种情况：路边停靠车辆是在一定时间内一直停靠。当车辆Vs要传递大的多媒体文件给车辆Vd。Vd不在Vs的传输范围内，并且道路上也没有移动的车辆可以作为中间节点传输。那么就利用道路旁边停靠的车辆协助多媒体服务。车辆Vs将多媒体资源分发给停靠的车辆3,4,5,6,7，如图2所示。然后当车辆Vd通过这些拥有资源的停靠车辆时，就会从这些车辆上下载自己满意的多媒体资源，如图3所示。

第二种情况：路边停靠的车辆有的是长时间停靠的，有的是即走的。如图2所示，当车辆Vs要传递大的多媒体文件给车辆Vd。Vd不在Vs的传输范围内，并且道路上也没有移动的车辆可以作为中间节点传输。那么就利用道路旁边停靠的车辆协助多媒体服务。车辆Vs将多媒体资源分发给停靠的车辆3,4,5,6,7。当车辆Vd正在下载车辆6上的资源时，有停靠的车辆3要离开停靠车辆团体，那么它就会把Vs传递给自己的多媒体服务，移交给停靠的邻居车辆2，然后离开，如图4所示。当车辆Vd往前行驶，在从车辆2上下载所有的多媒体资源，如图5所示。

停靠的车辆，虽然速度为0，但是内置的无线设备是开放的，可以允许所有路过车辆接入。并且有充足的电源，使得停靠的车辆能够跟所有经过他的车辆进行通信。在城市场景的VANET中，大量的停靠车辆，使得车与车之间资源传输的有效性和传输成功率大大提高。

B、演化博弈模型

Smith结合了博弈理论中分析的动态演化过程来研究复杂系统，并首次提出了演化博弈，同时他提供了一个工具来解释个体的组织关系。定义G＝{I,S,π}是基本的演化博弈模型，其中I表示参与者集合，S表示参与者策略集合，π表示参与者效用函数集合。演化博弈理论关键的概念是ESS。如果y≠x∈S，存在满足等式：

u[x,εy+(1-ε)x]＞u[y,εy+(1-ε)x]

这里x就是这个模型的ESS。

演化博弈论的核心理论有两个：即演化稳定策略、复制者动态方程。演化稳定策略强调一个动态演化系统达到稳定状态的过程，演化稳定策略x*需要满足如下两个条件：第一，x'＝Ω(x*)＝0；第二，Ω'(x*)＜0⁶ _。复制者动态方程描述采取变异的频数关于时间t的一个动态微分方程。用x_i'＝[φ(x_i,x)-φ(x,x)]x_i来表示复制者动态方程，其中x_i(t)采取纯策略的人占总人数的比例，φ(x_i,x)为策略i的适应度，φ(x,x)为平均适应度(JW Weibull,“Evolutionary game theory,”MITpress,1995.)。

下面介绍演化博弈理论的标准设置(Sandholm,W.H.Population Games andEvolutionary Dynamics[M].Forthcoming,MIT Press,Cambridge,2008.)：

(1)有一个用户的种群。种群中的用户数量很大。

(2)假设有有限的纯策略或行为。种群的每个成员从同一个策略集合Α＝{1,2,...,I}中选择策略。

(3)设为纯策略集合I上的概率分布集合。M可以解释为混合策略集合。事实上，假设从种群中随机选择出的用户：使用标记策略的参与者遇到使用策略j的参与者的概率是y_j。几个博弈过程以后，对于使用j的参与者等价于面对使用混合策略(y₁,...,y_I)的参与者。

为了使演化博弈更好的适应我们提出的模型，除了以上的基本假设以外，本发明模型假设：

(1)考虑随机选择的用户的数量是随机变量K，K∈{0,1,...}。

(2)每个参与者不知道会有多少参与者与之竞争。

(3)路边停靠车辆和即走车辆电量是充足的，但是也是消耗的。

(4)每辆车辆都装有无线接入设备，并且是开放的。

下面是单群体的演化博弈(SCEGT)激励机制分析

A.SCEGT模型

我们考虑在第一种情况下，酒店路边停靠的车辆是长时间不移动的。那所有的停靠车辆是一个团体。在这个团体中，因为两个博弈参与者的演化分析，最终就代表整个团体的稳定状态。所以在单团体中，我们不考虑博弈参与者的数量。又因为车辆都是静止的，所以车辆之间的连接概率都是1。

假设该团体，在每个固定的slot中，他们随机选择配对，策略空间是{0，1}，策略0表示停靠车辆会给需要资源的路过移动车辆或者停靠车辆提供服务，同时从他们那下载自己感兴趣的资源；策略1表示停靠车辆只从其他车辆上下载自己喜欢的资源，不服务路过车辆或者停靠车辆。每个节点下载和提供服务都是需要消耗一定能量的。因为车辆在停靠的时候，无线设备等开放是靠电量支持的。

假设每个节点提供一个单元的多媒体服务得到的车辆收益是P，成本是d；而每个节点接收其他车辆的每个单元多媒体资源的收益是R，需要的成本是c。其中，P>R，d>c。因为接收到其他车辆的资源可能是对自己有用的，但也可能没有任何价值，只是做了一个载体，那么收益R也就是很微小的。在单团体中，路边停靠的车辆没有迁移发生，那么我们就假设每个车辆都是接收一个单元资源，也是提供一个单元的多媒体服务。根据演化博弈规则，参与者j的收益矩阵如下：

	选择0	选择1
			选择0	R+P-c-d,R+P-c-d	P-d,R-c
选择1	R-c,P-d	0,0

我们定义γ₀(t)表示团体中选择策略0的节点数目。γ₁(t)表示团体中选择策略1的节点数目。那么得到公式(1)。

γ(t)＝γ₀(t)+γ₁(t) (1)

定义表示团体中选择策略0的比例，那么团体中选择策略1的比例就是1-x(t)。

根据博弈矩阵，选择策略0的期望收益如公式(2)所示：

U₀(t)＝x(t)*(R+P-c-d)+[1-x(t)]*(P-d) (2)

＝x(t)*(R-c)+P-d

选择策略1的期望收益如公式(3)所示：

U₁(t)＝x(t)*(R-c)+[1-x(t)]*0 (3)

＝x(t)*(R-c)

整个团体的平均收益如公式(4)所示：

\begin{matrix} \overset{&OverBar;}{U} (t) = x (t) * U_{0} + [1 - x (t)] * U_{1} \\ = x (t) * (R + P - c - d) \end{matrix} - - - (4)

B.动态复制分析

下面的复制动态指出了演化是如何发生动态变化的，特别是可以使用复制子动态来动态收敛到均衡解。复制子动态描述了一个具有多种策略的种群的演化过程，在种群中每个个体遵从以下模仿规则：即每次学习后，个体选择以正比于收益之差的概率选择任意能够获得比自身更多的收益的策略。最终的动态是，策略的分组在种群中增长的速率与该策略的收益与种群的平均收益之差成比例。在动态演化博弈中，种群中的单个个体，能够通过变异和选择过程复制自己的个体称作复制子。这种情况下，有较高收益的复制子能够快速复制它本身。重复此博弈，并且在博弈演化的每代中，参与者观察同一种群中其他参与者的收益，那么在下一次演化中，参与者就会选择具有较高收益当然策略。

我们假设每个阶段博弈是从kt,k∈N开始，在(k+1)t,k∈N结束。节点的平均收益是与博弈对手有关的。假设在一个很小的时间间隔ε中，只有ε部分参与博弈。那么由(Huibin Feng,Shunyi Zhang,Chao Liu,Junrong Yan,Ming Zhang,“P2PIncentive Model On Evolutionary Game Theory”,2008,WiCOM.)我们可得，在时间t+ε时的复制动态方程如公式(9)所示：

\frac{dx (t)}{dt} = x (t) [U_{0} (t) - \overset{&OverBar;}{U} (t)] - - - (9)

也就是得到复制动态方程，如公式(10)所示：

\begin{matrix} \frac{dx (t)}{dt} = x (t) [U_{0} (t) - \overset{&OverBar;}{U} (t)] \\ = x (t) * [1 - x (t)] (P - d) \end{matrix} - - - (10)

由以上分析得到定理1：在SMEGT激励机制作用下，ESS是存在的，并且只有一个进化稳定策略。

证明如下：

根据上面提到的ESS满足的第一个条件，我们令dx/dt＝0，即：

x(t)*[1-x(t)](P-d)＝0。由于P-d在上面定义是大于0的，那么解得的稳定状态、不动点仅有两个，也就是x(t)₁＝0,x(t)₂＝1。动态微分方程的相位图如图6所示。

令根据ESS满足的第二个条件，我们知道，在ESS处F(x)满足的条件是：

\{\begin{matrix} F (x *) = 0 \\ F^{'} (x *) < 0 \end{matrix}

那么，有以下分析：

假设有η比例的博弈方偏离了策略0而选择了策略1，那么有：

U₀(t)＝(1-η)*(R+P-c-d)+η*(P-d)＝(1-η)*(R-c)+P-d

U₁(t)＝(1-η)*(R-c)+η*0＝(1-η)*(R-c)

\overset{&OverBar;}{U} (t) = (1 - η) * U_{0} + η * U_{1} = (1 - η) * (R + P - c - d)

U₀(t)＝(1-η)*(R-c)+P-d＞0

所以x(t)₂＝1是演化稳定策略ESS。

假设有η比例的博弈方选择策略0而偏离策略1，那么有：

U₀(t)＝η*(R+P-c-d)+(1-η)*(P-d)＝η*(R-c)+P-d

U₁(t)＝η*(R-c)+(1-η)*0＝η*(R-c)

\overset{&OverBar;}{U} (t) = η * U_{0} + (1 - η) * U_{1} = η * (R + P - c - d)

U₀(t)＝η*(R-c)+P-d＞U₁(t)

所以x(t)₁＝0不是演化稳定策略。

综上，本模型中存在ESS，x*(t)＝1，并且是唯一的ESS。

证毕。

下面是多群体的演化博弈(MCEGT)激励机制

A.MCEGT模型

在多群体演化博弈激励机制中，也就是系统模型中的第二种情况，有些停靠车辆是在一定时间内静止不动的，但是还有一部分车辆是随时开走的。我们考虑利用两个种群的演弈，长时间停靠的车辆为一个种群，即走的车辆为一个种群，都作为激励对象，提出MCEGT激励机制，激励他们合作。

因为车辆是移动的，那么两个车辆之间的连接时间服从指数分布，其参数λ＞0，那么在时间τ内，两个车辆连接的概率为1-Q_τ，其中Q_τ如公式(11)所示(Rachid El-Azouzi,F.D.Pellegini and V.Kamble,“Evolutionary forwardinggames in Delay Tolerant Networks,”in the Proceeding of WiOpt,pp.76-84,29May-5June,Avignon,2010.)。

Q_τ＝(1+λτ)e^-λτ (11)

这个博弈中的种群就是两个团体。每个团体的节点数量是未知的，两个团体中的个体可能在某一时刻成为对方团体中的成员。为了建立方程式，我们假设团体Pop1和团体Pop2的节点数量分别是m和n。考虑各个团体的车辆在平面的分布都服从泊松分布，参数是γ＞0(Rachid El-Azouzi,F.D.Pellegini and V.Kamble,“Evolutionary forwarding games in Delay Tolerant Networks,”in theProceeding of WiOpt,pp.76-84,29May-5June,Avignon,2010.)。那么在一次演化博弈过程中，存在n个车辆的概率如公式(12)所示：

P (K = n) = \frac{γ^{n - 1}}{(n - 1)!} e^{- γ}, n &GreaterEqual; 1 - - - (12)

团体1(用pop₁表示)中都是停靠的车辆，pop₁的策略空间是p₁∈{0,1}。因为我们要考虑两个团体的博弈，那么演化博弈是在车辆离开时开始的。所以在这里pop₁要与单团体的时候策略有变化。策略0表示接受离开车辆移交的资源。策略1，不接受离开车辆的移交资源。团体2(用pop₂表示)包含的是即走的车辆，pop₂的策略空间是p₂∈{0,1}。策略0代表离开时移交资源给相邻车辆。策略1代表车辆离开，车辆自私，不把资源移交给相邻的车辆。每个节点下载和提供服务都是需要成本的。因为车辆在停靠的时候，无线设备等开放是靠电量支持的。假设每个离开节点移交一个单元的多媒体服务得到的收益是P，需要成本是d；而每个节点接收其他车辆的每个单元多媒体资源的收益是R，需要成本c。本发明假设每个车辆上携带一个单元的资源。

因为在两个团体中，两个团体之间不存在竞争。所以在pop1中，如果其中的节点采取策略0，那么它得到收益的概率是如公式(13)所示(Rachid El-Azouzi,F.D.Pellegini and V.Kamble,“Evolutionary forwarding games in Delay TolerantNetworks,”in the Proceeding of WiOpt,pp.76-84,29May-5June,Avignon,2010)：

P_{1} (x, y) = \frac{(1 - {(1 - xα)}^{m})}{mx} - - - (13)

同理，在pop2中，节点采取策略0的收益概率如公式(14)所示:

P_{2} (x, y) = \frac{(1 - {(1 - yα)}^{n})}{ny} - - - (14)

其中α＝1-Q_τ。

在pop1中每个博弈参与者选择策略0的概率是x，在pop2中博弈参与者选择策略0的概率是y。表示团体n在选择策略s时的期望收益。那么在pop1中选择策略0的个体的收益可以用公式(15)计算：

U_{1}^{0} (x, y) = y [R Σ_{m = 1}^{\infty} P (K = m) P_{1} (x, y) - c] - - - (15)

同理，在pop2中选择策略0的个体期望收益计算如公式(16)所示：

U_{2}^{0} (x, y) = x [P Σ_{n = 1}^{\infty} P (K = n) P_{2} (x, y) - d] - - - (16)

在两个团体中，个体选择策略1的收益定义为：

在pop1中，采用策略0的节点比例是x，采取策略1的节点比例是1-x，那么团体的平均效用函数如公式(17)所示：

\begin{matrix} {\overset{&OverBar;}{U}}_{1} = x U_{1}^{0} (x, y) + (1 - x) U_{1}^{1} (x, y) \\ = xy [R Σ_{m = 1}^{\infty} P (K = m) P_{1} (x, y) - c] \end{matrix} - - - (17)

同理，团体Pop2的平均效用函数如公式(18)所示：

\begin{matrix} {\overset{&OverBar;}{U}}_{2} = y U_{2}^{0} (x, y) + (1 - y) U_{2}^{1} (x, y) \\ = xy [P Σ_{n = 1}^{\infty} P (K = n) P_{2} (x, y) - d] \end{matrix} - - - (18)

B.复制动态分析

根据Simple SCEGT Incentive Mechanism中关于复制动态方程的分析可知，演化博弈的复制动态方程可以用公式(19)表示：

\frac{dx (t)}{dt} = x (t) [U_{0} (t) - \overset{&OverBar;}{U} (t)] - - - (19)

【把代入】那么两个团体的复制动态方程为为公式(20)：

\{\begin{matrix} \frac{dx}{dt} = x (U_{1}^{0} (x, y) - {\overset{&OverBar;}{U}}_{1}) = x (1 - x) U_{1}^{0} (x, y) \\ \frac{dy}{dt} = y (U_{2}^{0} (x, y) - {\overset{&OverBar;}{U}}_{2}) = y (1 - y) U_{2}^{0} (x, y) \end{matrix} - - - (20)

把公式(15)(16)带入公式(20)整理可得公式(21)：

\{\begin{matrix} \frac{dx}{dt} = xy (1 - x) [\frac{R}{xγ} (1 - e^{- xγα}) - c] \\ \frac{dy}{dt} = xy (1 - y) [\frac{P}{yγ} (1 - e^{- yγα}) - d] \end{matrix} - - - (21)

定理2：在MCEGT激励机制作用下，并且经过一定时间演化两个团体稳定到各自的ESS。

证明如下：

根据动态复制方程满足条件得公式(22)：

\{\begin{matrix} \frac{dx}{dt} = 0 \\ \frac{dy}{dt} = 0 \end{matrix} - - - (22)

也就是如公式(23)所示：

\{\begin{matrix} \frac{dx}{dt} = xy (1 - x) [\frac{R}{xγ} (1 - e^{- xγα}) - c] = 0 \\ \frac{dy}{dt} = xy (1 - y) [\frac{P}{yγ} (1 - e^{- yγα}) - d] = 0 \end{matrix} - - - (23)

根据上式，我们可以得到pop1和pop2的不动点如公式(24)(25)所示：

\{\begin{matrix} x_{1} = 0 \\ x_{2} = 1 \\ x_{3} = - \frac{LambertW (- \frac{c}{αR})}{γα} \end{matrix} - - - (24)

\{\begin{matrix} y_{1} = 0 \\ y_{2} = 1 \\ y_{3} = - \frac{LambertW (- \frac{d}{αP})}{γα} \end{matrix} - - - (25)

其中LambertW是超越函数的反函数。

根据公式(21)的基本成立条件可知，x，y不能为0。那么x₂＝1和

x_{3} = - \frac{LambertW (- \frac{c}{αR})}{γα}

是在一定条件下的稳定的ESS。因为

x_{3} = - \frac{LambertW (- \frac{c}{αR})}{γα}

是受参数影响的，那么调整参数变化，是可以得到x₂＝1的结果，也就是说包含了x₂＝1稳定ESS。所以我们可以用一个表示pop1的稳定演化策略ESS。

同理，在pop2中，我们用来表示pop2的稳定演化策略ESS。

综上，在MCEGT激励机制中，两个团体都有一个稳定的ESS，如公式(26)所示：

\{\begin{matrix} x^{*} = - \frac{LambertW (- \frac{c}{αR})}{γα} \\ y^{*} = - \frac{LambertW (- \frac{d}{αP})}{γα} \end{matrix} - - - (26)

证毕。

本发明的效果和益处是证明了对路边停靠车辆基于演化博弈的激励机制是有效的，通过分析论证都可以得到复制动态方程，解得进化稳定策略，并且分析了影响ESS的因素。通过设置合适范围的参数在就会激励所有节点都合作。

附图说明

附图1是路边停靠车辆的示意图。

附图2是路过车辆Vs向路边停靠车辆3,4,5,6,7下传多媒体资源示意图。

附图3是路过车辆Vd接受路边停靠车辆3,4,5,6,7上多媒体资源示意图。

附图4是即走车辆3将得到的多媒体资源移交给邻居车辆2的示意图。

附图5是路过车辆Vd从车辆2上下载所有的多媒体资源的示意图。

附图6是单群体演化博弈中复制动态微分方程的相位示意图。

附图7是单群体演化博弈激励机制有效性的示意图。

附图8是在单群体演化博弈激励机制下改变停靠车辆起始参与比例x后,收益和成本差值p-d保持不变，收敛速度逐渐加快的示意图。

附图9是在单群体演化博弈激励机制下停靠车辆起始参与比例x不变，改变收益和成本的差值p-d后，差值越大收敛速度越快的示意图。

附图10是多群体演化博弈激励机制下给定所有参数后说明多群体演化博弈激励机制有效性的示意图。

附图11(a)是在多群体演化博弈激励机制下给定P、d、c后，y稳定在0.225的情况下，R值越大停靠车辆参与合作比例收敛速度越快的示意图。

附图11(b)是在多群体演化博弈激励机制下给定P、d、R后，y稳定在0.225的情况下，c越大停靠车辆参与合作比例收敛速度越慢的示意图。

附图12(a)是在多群体演化博弈激励机制下给定R、c、d后，x稳定在0.6的情况下，P越大即走车辆参与合作比例收敛速度越大的示意图。

附图12(b)的是在多群体演化博弈激励机制下给定R、c、P后，x稳定在0.6情况下，d越大即走车辆参与合作比例收敛速度越慢的示意图。

具体实施方式

以下结合技术方案和附图详细说明本发明的实施例。

通过实例说明在本发明的方法下，设置合适的收益和成本就可以保证所有车辆都会积极的合作转发。在系统模型描述部分可知P>R，d>c。

第一：单群体演化博弈激励机制

对于路边停靠车辆，在SMEGT激励机制分析结果下给出不同参数。当路边停靠车辆起初只有x等于10％的比例提供多媒体服务，成本与收益的差值p-d等于3固定不变时，随着时间的推移，所以停靠车辆都会选择策略0，如图7所示，图7说明本发明中单群体演化博弈激励机制是有效的。

当停靠车辆起初参与提供多媒体服务的比例x分别为10％，20％，30％，40％，50％，60％，70％，80％，90％，收益和成本的差值p-d等于3固定不变的情况下，停靠车辆选择策略0的收敛速度逐渐加快，如图8所示，说明选择策略0的起始比例越大，所有停靠车辆全部选择策略0所需的时间越短。

当停靠车辆起初参与提供多媒体服务的比例x为10％保持不变，而改变收益和成本的差值，即p-d分别等于2,3,4,5,6,7,8,9,10的时候，通过图9可以看出，差值越大，参与提供多媒体服务的停靠车辆比例越容易稳定到100％。

第二：多群体演化博弈激励机制

对于路边停靠和即走车辆，据车辆即走场景下MCEGT激励机制分析，设置不同参数得出结果说明本发明中多群体演化博弈激励机制也是有效的。首先以下值固定，即时间τ取值为1；相应的结果α＝0.8009λ＝3,γ＝3.3。x和y初始值固定为10％保持不变。

(1)当P＝10，d＝3.R＝5，c＝2时，代入公式(26)，得到图10所示结果，说明对于路边停靠和即走车辆的多群体演化博弈激励机制是有效的。

(2)当P＝10和d＝3的值不改变的时候，y的稳定态是0.225。X＝0.1的初值保持不变，在这种情况下

(a)当R＝3.4.5.6.7.8.9，c＝2，得出的结果如图11a所示，说明在pop2中y稳定，pop1中c一定的情况下，收益R值越大，收敛速度越快，多群体演化博弈中停靠车辆全部选择策略0的收敛速度越快。

(b)当R＝8,c＝1.2.3.4.5.6.7.8得出的结果如图11b所示，说明在pop2中y稳定，pop1中R一定的情况下，消耗c值越大，收敛速度越慢，越不稳定，当达到8时，pop1中，无人选择策略0。

(3)当R＝5，c＝2的值不改变的时候，x的稳定态是0.6。Y＝0.1的初值保持不变，在这种情况下。

(a)d＝3P＝10.12.14.16.18.20.22时，得出的结果如图12a所示，说明在pop1中x稳定，pop2中d一定的情况下，收益P值越大，收敛速度越快，说明在多群体演化博弈中即走车辆全部选择策略0的收敛速度越快。

(b)P＝22，d＝2.3.4.5.6.7.8时，得出的结果如图12b所示，说明在pop1中x稳定，pop2中P一定的情况下，成本d值越大越不稳定，当达到8时，在pop2中无人选择策略0。

Claims

1.一种VANET中利用演化博弈来激励停靠车辆合作转发进行分析建模的方法，其特征在于以下步骤，

一、分成两种情况

第一种是停靠的车辆在一定时间内是静止的；对第一种情况用的是单群体的演化博弈SCEGT激励机制，来激励停靠车辆的合作；

第二种是有些停靠车辆是在一定时间内静止不动的，但是还有一部分车辆是即走的；对第二种情况用的是多种群的演化博弈，其中停靠的车辆为一个种群，即走的车辆为另外一个种群，提出一种多群体的演化博弈MCEGT激励机制；

二、模型的建立

A、V2V的通信模型

第一种：路边停靠车辆是在一定时间内一直停靠；当车辆Vs要传递大的多媒体文件给车辆Vd；Vd不在Vs的传输范围内，并且道路上也没有移动的车辆作为中间节点传输，则利用道路旁边停靠的车辆协助多媒体服务，车辆Vs将多媒体资源分发给停靠的车辆；然后当车辆Vd通过这些拥有资源的停靠车辆时，就会从这些车辆上下载自己满意的多媒体资源；

第二种：路边停靠的车辆有的是长时间停靠的，有的是即走的；当车辆Vs要传递大的多媒体文件给车辆Vd；Vd不在Vs的传输范围内，并且道路上也没有移动的车辆以作为中间节点传输；那么就利用道路旁边停靠的车辆协助多媒体服务；车辆Vs将多媒体资源分发给停靠的车辆；当车辆Vd正在下载车辆上的资源时，停靠车辆要离开停靠车辆团体，它就会把Vs传递给自己的多媒体服务，移交给停靠车辆的邻居车辆，然后离开；当车辆Vd往前行驶，在从车辆2上下载所有的多媒体资源；

B、演化博弈模型

定义G＝{I,S,π}是基本的演化博弈模型，其中I表示参与者集合，S表示参与者策略集合，π表示参与者效用函数集合；如果y≠x∈S，存在满足等式：u[x,εy+(1-ε)x]＞u[y,εy+(1-ε)x]，x就是模型的ESS；

演化博弈论的核心有两个：即演化稳定策略、复制者动态方程；演化稳定策略x*需要满足如下两个条件：第一，x'＝Ω(x*)＝0；第二，Ω'(x*)＜0⁶；复制者动态方程描述采取变异的频数关于时间t的一个动态微分方程；用x_i'＝[φ(x_i,x)-φ(x,x)]x_i来表示复制者动态方程，其中x_i(t)采取纯策略的人占总人数的比例，φ(x_i,x)为策略i的适应度，φ(x,x)为平均适应度；

演化博弈论的标准设置是：

(1)有一个用户的种群；种群中的用户数量很大；

(2)假设有有限的纯策略或行为；种群的每个成员从同一个策略集合

Α＝{1,2,...,I}中选择策略；

(3)设为纯策略集合I上的概率分布集合；M可以解释为混合策略集合；事实上，假设从种群中随机选择出的用户：使用标记策略的参与者遇到使用策略j的参与者的概率是y_j；几个博弈过程以后，对于使用j的参与者等价于面对使用混合策略(y₁,...,y_I)的参与者。

2.根据权利要求1所述的方法，其特征在于，

(一)单群体的演化博弈(SCEGT)激励机制如下：

A.SCEGT模型

第一种情况，停靠的车辆是长时间不移动的；在每个固定的slot中，随机选择配对，策略空间是{0，1}，策略0表示停靠车辆会给需要资源的路过移动车辆或者停靠车辆提供服务，同时从他们那下载自己感兴趣的资源；策略1表示停靠车辆只从其他车辆上下载自己喜欢的资源，不服务路过车辆或者停靠车辆；

设每个节点提供一个单元的多媒体服务得到的车辆收益是P，成本是d；而每个节点接收其他车辆的每个单元多媒体资源的收益是R，需要的成本是c；其中，P>R，d>c；单团体中，路边停靠的车辆没有迁移发生，每个车辆都是接收一个单元资源，也是提供一个单元的多媒体服务；根据演化博弈规则，参与者j的收益矩阵如下：

定义γ₀(t)表示团体中选择策略0的节点数目；γ₁(t)表示团体中选择策略1的节点数目；如公式(1)所示，

γ(t)＝γ₀(t)+γ₁(t) (1)

定义表示团体中选择策略0的比例，团体中选择策略1的比例就是1-x(t)；

根据博弈矩阵，选择策略0的期望收益如公式(2)所示：

U₀(t)＝x(t)*(R+P-c-d)+[1-x(t)]*(P-d) (2)

＝x(t)*(R-c)+P-d

选择策略1的期望收益如公式(3)所示：

U₁(t)＝x(t)*(R-c)+[1-x(t)]*0 (3)

＝x(t)*(R-c)

整个团体的平均收益如公式(4)所示：

\begin{matrix} \overset{&OverBar;}{U} (t) = x (t) * U_{0} + [1 - x (t)] * U_{1} \\ = x (t) * (R + P - c - d) \end{matrix} - - - (4)

B.动态复制分析

每个阶段博弈是从kt,k∈N开始，在(k+1)t,k∈N结束；节点的平均收益是与博弈对手有关的；设在一个很小的时间间隔ε中，只有ε部分参与博弈；在时间t+ε时的复制动态方程如公式(9)所示：

\frac{dx (t)}{dt} = x (t) [U_{0} (t) - \overset{&OverBar;}{U} (t)] - - - (9)

复制动态方程，如公式(10)所示：

\begin{matrix} \frac{dx (t)}{dt} = x (t) [U_{0} (t) - \overset{&OverBar;}{U} (t)] \\ = x (t) * [1 - x (t)] (P - d) \end{matrix} - - - (10)

在SMEGT激励机制作用下，ESS是存在的，并且只有一个进化稳定的策略；

本模型中存在ESS，x*(t)＝1，并且是唯一的ESS；

(二)多群体的演化博弈(MCEGT)激励机制如下

A、MCEGT模型

系统模型中的第二种情况，有些停靠车辆是在一定时间内静止不动的，但是还有一部分车辆是随时开走的；

因为车辆是移动的，那么两个车辆之间的连接时间服从指数分布，其参数λ＞0，那么在时间τ内，两个车辆连接的概率为1-Q_τ，其中Q_τ如公式(11)所示：

Q_τ＝(1+λτ)e^-λτ (11)

假设团体Pop1和团体Pop2的节点数量分别是m和n；考虑各个团体的车辆在平面的分布都服从泊松分布，参数是γ＞0；那么在一次演化博弈过程中，存在n个车辆的概率如公式(12)所示：

P (K = n) = \frac{γ^{n - 1}}{(n - 1)!} e^{- γ}, n &GreaterEqual; 1 - - - (12)

团体1(用pop₁表示)中都是停靠的车辆，pop₁的策略空间是p₁∈{0,1}；因为考虑两个团体的博弈，那么演化博弈是在车辆离开时开始的；在这里pop₁要与单团体的时候策略有变化；策略0表示接受离开车辆移交的资源；策略1，不接受离开车辆的移交资源；团体2(用pop₂表示)包含的是即走的车辆，pop₂的策略空间是p₂∈{0,1}；策略0代表离开时移交资源给相邻车辆；策略1代表车辆离开，车辆自私，不把资源移交给相邻的车辆；每个节点下载和提供服务都是需要成本的；因为车辆在停靠的时候，无线设备等开放是靠电量支持的；假设每个离开节点移交一个单元的多媒体服务得到的收益是P，需要成本是d；而每个节点接收其他车辆的每个单元多媒体资源的收益是R，需要成本c；假设每个车辆上携带一个单元的资源；

因为在两个团体之间不存在竞争；在pop1中，如果其中的节点采取策略0，那么它得到收益的概率如公式(13)所示：

P_{1} (x, y) = \frac{(1 - {(1 - xα)}^{m})}{mx} - - - (13)

同理，在pop2中，节点采取策略0的收益概率如公式(14)所示:

P_{2} (x, y) = \frac{(1 - {(1 - yα)}^{n})}{ny} - - - (14)

其中α＝1-Q_τ；

在pop1中每个博弈参与者选择策略0的概率是x，在pop2中博弈参与者选择策略0的概率是y；表示团体n在选择策略s时的期望收益；那么在pop1中选择策略0的个体的收益可以用公式(15)计算：

U_{1}^{0} (x, y) = y [R Σ_{m = 1}^{\infty} P (K = m) P_{1} (x, y) - c] - - - (15)

U_{2}^{0} (x, y) = x [P Σ_{n = 1}^{\infty} P (K = n) P_{2} (x, y) - d] - - - (16)

在两个团体中，个体选择策略1的收益定义为：

\begin{matrix} {\overset{&OverBar;}{U}}_{1} = x U_{1}^{0} (x, y) + (1 - x) U_{1}^{1} (x, y) \\ = xy [R Σ_{m = 1}^{\infty} P (K = m) P_{1} (x, y) - c] \end{matrix} - - - (17)

同理，团体Pop2的平均效用函数如公式(18)所示：

\begin{matrix} {\overset{&OverBar;}{U}}_{2} = y U_{2}^{0} (x, y) + (1 - y) U_{2}^{1} (x, y) \\ = xy [P Σ_{m = 1}^{\infty} P (K = n) P_{2} (x, y) - d] \end{matrix} - - - (18)

B.复制动态分析

演化博弈的复制动态方程用公式(19)表示：

\frac{dx (t)}{dt} = x (t) [U_{0} (t) - \overset{&OverBar;}{U} (t)] - - - (19)

【把代入】那么两个团体的复制动态方程为公式(20)：

\{\begin{matrix} \frac{dx}{dt} = x (U_{1}^{0} (x, y) - {\overset{&OverBar;}{U}}_{1}) = x (1 - x) U_{1}^{0} (x, y) \\ \frac{dy}{dt} = y (U_{2}^{0} (x, y) - {\overset{&OverBar;}{U}}_{2}) = y (1 - y) U_{2}^{0} (x, y) \end{matrix} - - - (20)

把公式(15)(16)带入公式(20)整理得公式(21)：

\{\begin{matrix} \frac{dx}{dt} = xy (1 - x) [\frac{R}{xγ} (1 - e^{- xγα}) - c] \\ \frac{dy}{dt} = xy (1 - y) [\frac{P}{yγ} (1 - e^{- yγα}) - d] \end{matrix} - - - (21)

用一个表示pop1的稳定演化策略ESS；

在pop2中，用来表示pop2的稳定演化策略ESS；

在MCEGT激励机制中，两个团体都有一个稳定的ESS，如公式(26)所示：

\{\begin{matrix} x^{*} = - \frac{LambertW (- \frac{c}{αR})}{γα} \\ y^{*} = - \frac{LambertW (- \frac{d}{αP})}{γα} \end{matrix} - - - (26) .