CN102076025B - 基于Stackelberg博弈认知网络资源分配方法 - Google Patents

基于Stackelberg博弈认知网络资源分配方法 Download PDF

Info

Publication number
CN102076025B
CN102076025B CN 201110000306 CN201110000306A CN102076025B CN 102076025 B CN102076025 B CN 102076025B CN 201110000306 CN201110000306 CN 201110000306 CN 201110000306 A CN201110000306 A CN 201110000306A CN 102076025 B CN102076025 B CN 102076025B
Authority
CN
China
Prior art keywords
network
territory
cognitive
information
server
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN 201110000306
Other languages
English (en)
Other versions
CN102076025A (zh
Inventor
孙雁飞
张顺颐
亓晋
顾成杰
朱磊
王攀
吴继宝
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing Post and Telecommunication University
Original Assignee
Nanjing Post and Telecommunication University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing Post and Telecommunication University filed Critical Nanjing Post and Telecommunication University
Priority to CN 201110000306 priority Critical patent/CN102076025B/zh
Publication of CN102076025A publication Critical patent/CN102076025A/zh
Application granted granted Critical
Publication of CN102076025B publication Critical patent/CN102076025B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Mobile Radio Communication Systems (AREA)

Abstract

本发明公布了一种基于Stackeberg博弈的网络资源分配方法,所述方法包括域认知服务器的参数采集;域认知服务器的信息汇聚和处理;向中心服务器汇报网络当前状态及QOS参数;中心服务器汇总全网信息;中心服务器向各个域服务器下放策略信息;域认知服务器生成策略空间;闭环信息反馈:本发明主要研究如何将博弈论中的主从激励思想引入认知网络中,通过自我感知网络的动态信息,引入网络诱导策略,采用动态博弈的方法,提出了一种网络由一般状态到最优运行状态的动态调节算法,从而实现了认知网络的自我控制。该方法涉及到业务识别、网络QoS、博弈论、认知网络等技术领域。

Description

基于Stackelberg博弈认知网络资源分配方法
技术领域
本发明以认知网络为基础,提出一种基于Stackelberg博弈的网络资源分配方法。主要研究如何将博弈论中的主从激励思想引入认知网络中,通过自我感知网络的动态信息,引入网络诱导策略,采用动态博弈的方法,提出了一种网络由一般状态到最优运行状态的动态调节算法,从而实现了认知网络的自我控制。该方法涉及到业务识别、网络QoS、博弈论、认知网络等技术领域。
背景技术
近年来,随着网络流量以指数形式急剧增长,各种应用对网络资源的需求随之增加,特别是需要严格QoS保证的实时网络多媒体应用要求更多的网络资源。资源分配是QoS分配的最终实现,QoS分配最终目的是为了进行合理的资源分配,因而有效的资源分配十分重要。
传统的非经济的资源分配方法,如RSVP资源预约、优先级调度等,都是从资源提供方(网络)的角度,使用最优化理论集中地求解资源分配问题,决定端系统所能分配到的资源数量,没有考虑用户愿付代价与用户满意度等因素对资源分配的影响,不能充分利用资源,做到物尽其用,为了解决这些问题,近年来研究者提出基于微观经济学方法的网络资源分配思路。在互连网应用中,网络服务同用户之间的行为与市场中的商品与消费者之间的消费行为有很多相似之处,结合微观经济学的理论,可以把市场机制引入网络资源管理。事实上,计费本身也体现了一种资源分配机制,虽然它不是显式地为特定用户的数据流分配网络的缓冲和带宽资源,但是价格杠杆限制了那些对当前网络资源价格不能接受的用户的网络使用行为,从而将网络资源分配给那些急需网络服务而接受较高价格的用户。因此,价格杠杆可以被看作一种用来调整用户传输行为的激励机制。更进一步,竞争使用有限的网络资源过程中,端系统不合理的背离行为使得资源分配问题的研究更为复杂,因此可以使用博弈理论来研究和解决上述问题,目标是让理性的参与者依据私利永远不会出现背离行为。同时,采用博弈的方法可以考虑分散资源分配这个集中式的求解过程,使得用户贪婪的最优化过程服从于相同的最优资源分配,即可以使用分布式算法来实现最优化、公平的资源分配。
认知网络(Cognitive Network)是在认知无线电的基础上提出的,将认知的概念从无线单跳连接扩展至整个网络,是一种具有认知功能的网络。它能够感知当前的网络状况。为了更好地管理和控制网络的复杂性,改善网络的QoS和用户的业务体验,引入了采用动态博弈的方法,将离散的反馈式诱导策略应用于认知网络的流量控制中,设计了一种诱导策略的网络动态调节算法,使得网络能够由一般态向最佳态收敛。使网络具有自管理、自学习、自优化的能力,真正实现网络的可控制、可管理、可信任。因此,认知网络的研究将会对今后大规模的复杂异质网络管理技术的发展和网络服务质量的提高起到巨大的推动作用。
发明内容
本发明目的是针对现有技术存在的缺陷提供一种基于Stackelberg博弈认知网络资源分配方法。
本发明为实现上述目的,采用如下技术方案:
本发明基于Stackelberg博弈的认知网络资源分配方法,包括如下步骤:
1)域认知服务器的参数采集:参数采集过程是计算网络的QoS参数即时延、抖动、吞吐量,以及网络状态信息,采取抽样的方式采集:
a)业务类型信息采集:采用业务识别技术,识别出各个流属于哪种类型,并记录该信息,在边缘路由器上实现;
b)数据包入队列,出队列以及丢包信息采集,在域认知服务器上实现;
2)域认知服务器的信息汇聚和处理:域认知服务器根据采集到的数据参数,计算本域的网络QoS参数及业务类型;
3)向中心服务器汇报网络当前状态及QoS参数:域认知服务器把本域的状态信息即时延、抖动、吞吐量等QoS参数发送给中心服务器;
4)中心服务器汇总全网信息,根据全网的目标收益生成策略空间:中心服务器综合全网信息,分析并产生定价策略,调节全网使其收益趋于最大化;
5)中心服务器向各个域服务器下放策略信息:中心服务器把产生的策略发送给各个域服务器,对各个域控制和引导,从而实现各个域间的动态调节;
6)域认知服务器生成策略空间。域认知服务器在分析中心服务器下发策略的基础上,分析本域的网络QoS参数,生成域内定价策略,诱导终端用户产生行为,使本域的目标收益趋于最大化;
7)闭环信息反馈:各域认知服务器定时向中心认知服务器反馈本次调节的本域网络QoS参数及收益情况,直到达到双方达到某种协调状态,这时网络整体趋于稳定;
8)转步骤1),继续采集网络QoS参数,生成策略,动态调节使得全网收益最大。
本发明通过基于Stackelberg博弈的网络资源分配方法,我们能够实现:
1、与业务识别结合,实现对业务的区分,可以对单业务进行QoS参数跟踪及资源的分配;
2、通过域服务器定时向中心服务器动态反馈网络状态信息,实现闭环反馈、自适应动态调节;
3、与区分服务相结合,将复杂度尽量限制在域认知服务器,无需对现有网络和协议进行大规模更改即可实现认知,因此具备良好的可扩展性;
4、资源定价(pricing),规范用户的行为,使得资源分配后,网络和用户收益最大。
5、价格机制影响供需变化,根据供需关系进行价格调节,使用户在价格和性能上寻求最佳结合点,最终达到合理使用资源,优化资源分配;
6、市场机制固有的分布性与网络资源的分布性相适应,可以实现有效的、松耦合的分布式资源控制和管理,符合网络资源管理的发展方向。
附图说明
图1是该发明实现过程流程图;
图2是认知网络模型的三级拓扑结构。
具体实施方式
下面结合附图对发明的技术方案进行详细说明:
如图1、2所示,本发明提出了一种基于Stackelberg博弈的网络资源分配方法。该方法融合了认知网络、区分服务以及日趋成熟的业务识别技术,引入了采用动态博弈的方法,将离散的反馈式诱导策略应用于认知网络的流量控制中。设计了一种诱导策略的网络动态调节算法,使得网络能够由一般态向最佳态收敛,为网络QoS提供保障。
其具体的实现过程可以分为四个步骤。
1.认知域模型建立
功能:网络结构和功能并非相互独立,研究发现,系统的演化行为与网络的拓扑结构参数存在非常明显的关联:在典型小世界区域,在某些情况下依赖于收益矩阵参数,网络的小世界属性对于欺骗策略有着显著的促进作用。按如何方法建立一个基于某种特定拓扑结构的Stackelberg博弈模型。
1)初始状态,网络有m个认知域,每个认知域有m0个节点和e0条边;
2)每一个时间步进行以下5个操作:
2.1)以概率p,引入一个新的有m0个节点和e0条边的认知域;
2.2)以概率q,在已经存在的认知域中加入一个新的节点j,与这个认知域中其他m1个节点建立m1条边的连接。首先随机选择一个认知域Ω;然后,以下列优先连接法则连接新节点j和认知域中已经存在的节点i。该过程重复m1次。
Π ( k i ) = k i + α Σ j ∈ Ω k j + α - - - ( 1 - 1 )
这里α表示节点i的吸引度,ki表示节点的度;
2.3)以概率r,在已经随机选取的认知域Ω中加入m2条边的连接。这m2条边一端是随机选择的,另一端以概率(1-1)式选取。该过程重复m2次;
2.4)以概率s,在已经随机选取的认知域Ω中删除m2条边的连接。这m3条边的一端是随机选择的,另一端以下列法则进行选取。该过程重复m3次;
Π ( k i ) = 1 N n ( t ) - 1 ( 1 - Π ( k i ) ) - - - ( 1 - 2 )
其中NΩ(t)表示第Ω个认知域中的节点;
2.5)以概率u,在其他已经存在的认知域之间加入具有m4条边连接。首先随机选择一个认知域,在该域中以式(1-1)选择一个节点,作为新加入边的一端,另一端在其它认知域中,仍以式(1-1)选择,该过程重复m4次。
上面模型中变量满足的条件:
0<q<1;0<p、r、s、u<1;p+q+r+s+u=1    (1-3)
2.目标收益函数
功能:Stackelberg Game模型一个基于主从方管理的博弈模型,对于主方管理者而言,其目的是制定合理的流量价格使其在用户的Nash均衡点时收益达到最大,对于从方用户而言是一个非合作的流量控制策略。
中心认知服务器节点(L)和域认知服务器节点
Figure GSB00001005203900042
之间的KL条链路。定义链路i的第j个用户的效用函数为:
F ij ( x ij ) = ω i log ( 1 + x ij ) - p i x ij - 1 C i - x ‾ i - 1 C L - x ‾ - - - ( 2 - 1 )
在上式中:Ci为链路i的带宽,CL为L链路带宽,KL为L的入度,xij>=0为链路i的第j个用户的速率,pi为链路i的单位流量费用,
Figure GSB00001005203900044
为链路i的延迟,
Figure GSB00001005203900045
为总链路延迟。
当L确定了每条链路的价格pi,则L的效用函数为:
L ( p i , X ‾ i ) = Σ i = 1 K L p i X ‾ i - - - ( 2 - 2 )
3.网络最佳运行状态
功能:网络的最佳运行状态就是域中心服务器L制定一定的价格策略,使得网络所有用户处于Nash均衡时,L获得的利益最大。
求Nash均衡:
首先对(2-1)式求导得:
∂ F ij ( x ij ) ∂ x ij = ω i 1 + x ij - p ‾ i - 1 ( C i - x ‾ i ) 2 - 1 ( C L - x ‾ ) 2 - - - ( 3 - 1 )
当达到均衡时(3-1)式等于0,得到:
p i = K F i ω i K F i + X 1 ‾ - ( K F i / Σ j = 1 K L K F j ) 2 + 1 ( K F i c - X 1 ‾ ) 2 - - - ( 3 - 2 )
结合(3-2)式(2-2)式得到网络的最佳状态为:
X i ‾ * = K F i ( K F i ω i ‾ ) 1 s - a 1 s a 1 s + ( K F i ω i ‾ ) 1 s - - - ( 3 - 3 )
p 1 ‾ * = ω i 2 [ 1 + a 1 s ( K F i 2 ω i ) - 1 s ] - a 4 K F i 2 [ 1 + a - 1 s ( K F i 2 ω i ) 1 s ] 2 - - - ( 3 - 4 )
4.动态诱导策略算法
功能:将离散的反馈式诱导策略应用于认知网络的流量控制中,通过中心认知服务器下发策略,使得;认知网络能够由一般态向最佳态收敛;保证了网络最佳态的稳定性。
动态诱导策略的算法如下:
1)初始阶段时步n=0,网络处于一般态。L制定初始的价格策略pα,Fi根据L制定的价格策略按照式(3-2)得到速率
2)n=n+1,L根据收到上一步Fi的信息
Figure GSB00001005203900055
按照诱导策略得到pi(n+1),同时按Fi得到速率
Figure GSB00001005203900056
3)若此时
Figure GSB00001005203900057
可得
Figure GSB00001005203900058
价格与速率同时达到均衡点,网络进入最佳状态,结束。
4)否则,重复步骤2)。

Claims (1)

1.一种基于Stackelberg博弈的认知网络资源分配方法,其特征在于包括如下步骤:
1)域认知服务器的参数采集:参数采集过程是计算网络的QoS参数即时延、抖动、吞吐量,以及网络状态信息,采取抽样的方式采集:
a)业务类型信息采集:采用业务识别技术,识别出各个流属于哪种类型,并记录该信息,在边缘路由器上实现;
b)数据包入队列,出队列以及丢包信息采集,在域认知服务器上实现;
2)域认知服务器的信息汇聚和处理:域认知服务器根据采集到的数据参数,计算本域的网络QoS参数及业务类型;
3)向中心服务器汇报网络当前状态及QoS参数:域认知服务器把本域的状态信息发送给中心服务器,所述状态信息即QoS参数,包括时延、抖动、吞吐量信息;
4)中心服务器汇总全网信息,根据全网的目标收益生成策略空间:中心服务器综合全网信息,分析并产生定价策略,调节全网使其收益趋于最大化;
5)中心服务器向各个域服务器下放策略信息:中心服务器把产生的策略发送给各个域服务器,对各个域控制和引导,从而实现各个域间的动态调节;
6)域认知服务器生成策略空间:域认知服务器在分析中心服务器下发策略的基础上,分析本域的网络QoS参数,生成域内定价策略,诱导终端用户产生行为,使本域的目标收益趋于最大化;
7)闭环信息反馈:各域认知服务器定时向中心认知服务器反馈本次调节的本域网络QoS参数及收益情况,直到达到双方达到某种协调状态,这时网络整体趋于稳定;
8)转步骤1),继续采集网络QoS参数,生成策略,动态调节使得全网收益最大。
CN 201110000306 2011-01-04 2011-01-04 基于Stackelberg博弈认知网络资源分配方法 Expired - Fee Related CN102076025B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN 201110000306 CN102076025B (zh) 2011-01-04 2011-01-04 基于Stackelberg博弈认知网络资源分配方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN 201110000306 CN102076025B (zh) 2011-01-04 2011-01-04 基于Stackelberg博弈认知网络资源分配方法

Publications (2)

Publication Number Publication Date
CN102076025A CN102076025A (zh) 2011-05-25
CN102076025B true CN102076025B (zh) 2013-06-05

Family

ID=44034332

Family Applications (1)

Application Number Title Priority Date Filing Date
CN 201110000306 Expired - Fee Related CN102076025B (zh) 2011-01-04 2011-01-04 基于Stackelberg博弈认知网络资源分配方法

Country Status (1)

Country Link
CN (1) CN102076025B (zh)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013107054A1 (en) * 2012-01-21 2013-07-25 Nec (China) Co., Ltd. Method and apparatus for determining feedback transmission resource for mobile stations and method and apparatus for providing information therefor
CN102665217B (zh) * 2012-04-25 2015-01-21 梁宏斌 基于无线多媒体网络的无线通信信道资源优化方法
CN102984249A (zh) * 2012-11-22 2013-03-20 北京邮电大学 一种水平动态云联盟中的分布式资源配置方法
CN104506288A (zh) * 2015-01-23 2015-04-08 重庆邮电大学 基于斯塔克伯格博弈的概率网络编码重传方法
CN108092791B (zh) * 2016-11-23 2020-06-16 华为技术有限公司 网络控制方法、装置及系统
CN109861997B (zh) * 2019-01-20 2021-06-04 北京工业大学 一种动态博弈访问控制奖惩激励约束方法
CN111757354B (zh) 2020-06-15 2021-07-20 武汉理工大学 一种基于竞争博弈的多用户切片资源分配方法
CN114826917B (zh) * 2022-04-25 2023-12-08 中国农业银行股份有限公司 一种基于博弈的网络资源分配方法及装置

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6055571A (en) * 1997-11-20 2000-04-25 Nec Usa, Inc. Computer network with microeconomic flow control
CN1863063A (zh) * 2005-05-15 2006-11-15 华为技术有限公司 基于软交换设备感知业务的wimax动态qos实现方法
CN101286807A (zh) * 2008-05-19 2008-10-15 华中科技大学 一种基于接收机干扰的认知无线电网络ofdm频谱分配方法
CN101359941A (zh) * 2008-09-12 2009-02-04 南京邮电大学 认知无线电技术中基于归一化博弈模型的功率控制方法
CN101478352A (zh) * 2009-01-19 2009-07-08 北京邮电大学 一种认知无线网络系统和认知网元设备

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8320948B2 (en) * 2009-03-25 2012-11-27 Futurewei Technologies, Inc. System and method for probability-based resource allocation in a wireless communications system

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6055571A (en) * 1997-11-20 2000-04-25 Nec Usa, Inc. Computer network with microeconomic flow control
CN1863063A (zh) * 2005-05-15 2006-11-15 华为技术有限公司 基于软交换设备感知业务的wimax动态qos实现方法
CN101286807A (zh) * 2008-05-19 2008-10-15 华中科技大学 一种基于接收机干扰的认知无线电网络ofdm频谱分配方法
CN101359941A (zh) * 2008-09-12 2009-02-04 南京邮电大学 认知无线电技术中基于归一化博弈模型的功率控制方法
CN101478352A (zh) * 2009-01-19 2009-07-08 北京邮电大学 一种认知无线网络系统和认知网元设备

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
认知无线电网络中基于需求的频谱资源分配算法研究;陈劼;《计算机应用》;20080930;第28卷(第9期);全文 *
陈劼.认知无线电网络中基于需求的频谱资源分配算法研究.《计算机应用》.2008,第28卷(第9期),全文.
韩涛.《基于博弈论的认知无线电网络资源优化分配技术》.《基于博弈论的认知无线电网络资源优化分配技术》.2009,全文. *

Also Published As

Publication number Publication date
CN102076025A (zh) 2011-05-25

Similar Documents

Publication Publication Date Title
CN102076025B (zh) 基于Stackelberg博弈认知网络资源分配方法
Wu et al. Social-aware rate based content sharing mode selection for D2D content sharing scenarios
CN103475719B (zh) 一种cdn-p2p融合网络中跨域流量最小化的内容分发方法
CN108605032A (zh) 用于针对无线通信网络进行客户服务管理的方法和设备
Ozdaglar et al. Incentives and pricing in communication networks
CN105101302B (zh) 基于用户使用习惯的流量管理方法及系统
CN102316465A (zh) 认知无线网络中频谱博弈分配方法
Wang et al. A hierarchical game with strategy evolution for mobile sponsored content and service markets
CN106385641B (zh) 一种基于sdn的直播视频流媒体分发方法
Eghbali et al. Bandwidth allocation and pricing for SDN-enabled home networks
CN101860798B (zh) 认知无线电网络中基于重复博弈的组播路由算法
CN104822150B (zh) 中心多跳认知蜂窝网络中的信息主动缓存的频谱管理方法
Tao et al. A resource allocation game with restriction mechanism in VANET cloud
Vamvakas et al. A user-centric economic-driven paradigm for rate allocation in non-orthogonal multiple access wireless systems
Bhattacharyya et al. QFlow: A learning approach to high QoE video streaming at the wireless edge
CN107819741A (zh) 基于优先级的云视频内容分发方法及系统
Ma et al. A multi-service train-to-ground bandwidth allocation strategy based on game theory and particle swarm optimization
Lu et al. Contract-based content delivery in 5G converged networks
Adiwal et al. Rat selection for a low battery mobile device for future 5g networks
Wei et al. Research on subjective trust routing algorithm for mobile ad hoc networks
Bhattacharyya et al. Flowbazaar: A market-mediated software defined communications ecosystem at the wireless edge
He et al. A leader–follower controlled Markov stopping game for delay tolerant and opportunistic resource sharing networks
Choi et al. User-centric resource allocation with two-dimensional reverse pricing in mobile communication services
Radonjic et al. Quality of experience and users elasticity considerations for modelling competition between service providers in NGN
Lodhi et al. GENESIS-CBA: an agent-based model of peer evaluation and selection in the internet interdomain network

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20130605