CN102291722B - 基于拍卖理论和补偿激励的频谱共享方法 - Google Patents

基于拍卖理论和补偿激励的频谱共享方法 Download PDF

Info

Publication number
CN102291722B
CN102291722B CN 201110106062 CN201110106062A CN102291722B CN 102291722 B CN102291722 B CN 102291722B CN 201110106062 CN201110106062 CN 201110106062 CN 201110106062 A CN201110106062 A CN 201110106062A CN 102291722 B CN102291722 B CN 102291722B
Authority
CN
China
Prior art keywords
user
frequency spectrum
auction
inferior
time
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN 201110106062
Other languages
English (en)
Other versions
CN102291722A (zh
Inventor
朱琦
周惟风
朱洪波
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing University of Posts and Telecommunications
Original Assignee
Nanjing University of Posts and Telecommunications
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing University of Posts and Telecommunications filed Critical Nanjing University of Posts and Telecommunications
Priority to CN 201110106062 priority Critical patent/CN102291722B/zh
Publication of CN102291722A publication Critical patent/CN102291722A/zh
Application granted granted Critical
Publication of CN102291722B publication Critical patent/CN102291722B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明的目的在于提供一种认知无线电系统中基于拍卖理论和补偿激励的频谱共享方法,该方法针对主次用户共享频谱问题,基于简化的VCG拍卖模型,引入次用户间的合作关系,并运用货币补偿激励原则,建立了一个包含有谈判和协商环节在内的扩展式非合作博弈模型。该博弈模型在非合作博弈的框架内讨论次用户间的合作关系,通过特定的协调策略进行博弈,不仅具有非合作博弈模型的可自动实施性的决策模式特点,还具有寡头联合模型的公平性的特点。此外,由于采用的通信系统模型为拍卖模型,所以主用户可采用“预留带宽”措施来保证自身性能不受次用户共享频谱的影响,更好的保证了主次用户间的频谱共享环境。

Description

基于拍卖理论和补偿激励的频谱共享方法
技术领域
本发明涉及一种特别用于认知无线电系统中主用户和次用户共享频谱的实现方案,属于通信技术领域。
背景技术
随着无线通信不断向着宽带化,无缝化,智能化方向发展,无线频谱已成为现代社会不可或缺的宝贵资源。事实上,在许多频段,频谱接入是比频谱物理稀缺更重要的问题,由于现有的频谱授权机制使得频谱利用率低,造成大量频谱资源浪费,而近年提出的认知无线电(CR,cognitive radio)技术具有在不影响其他授权用户即主用户(PU,primary user)的前提下智能地利用大量空闲频谱并且随时随地,高可靠性通信的潜能。因此打破传统频谱授权机制,通过认知无线电技术实现频谱共享成为了未来无线通信的发展趋势。
基于博弈论的模型将反映实时认知用户交互过程的认知周期映射为一个博弈模型,对分布式动态频谱共享算法进行分析。该模型中博弈论是研究决策主体的行为发生直接相互作用时候的决策以及这种决策的均衡问题的理论,它使用严谨的数学模型解决现实中利害冲突,在决策选择问题上能够起到关键指导作用。
针对认知无线电中频谱资源共享问题,许多研究人员开展了基于博弈论的频谱灵活利用方法的研究:基于博弈论的模型将反映实时用户交互过程的认知周期映射为一个博弈模型,对分布式动态频谱共享算法进行了分析,并研究了次用户间的合作和竞争关系;给出了认知无线电网络中的博弈模型,并利用该模型分别分析了认知无线电的功率控制,呼叫准入控制和干扰避免;通过定价拍卖的方法来实现资源分配,根据不同的网络效用需要来确定自身的目标函数,即确定赢家胜出的规则;在有多个主用户同时出租频谱的场景下,建立了主用户间竞价的伯川德模型,并基于最大化自身效用的前提下分析了主用户之间的频谱价格博弈;在多个认知无线电用户都需要租借频谱的情况下,建立了它们之间的古诺非合作博弈模型,多个次用户通过竞争共享主用户的频谱,实现提高频谱利用率的目的。
虽然这些方法在实现频谱共享的一些方面取得了一定的进步,但往往都是将各个次用户的需求度视作一个定值,因为不能实时反映用户对频谱实际的需求,无法很好的达到频谱共享公平这一目的。或者都是基于次用户间没有约束力协议的非合作博弈模型,并且通常忽略了次用户的行为对主用户的负面影响,因此还有很多不完善的地方有待提高。
所以本发明结合经济学中的拍卖模型和补偿激励机制,建立了一个包含有谈判和协商环节在内的扩展式非合作博弈模型,在非合作博弈的框架内讨论次用户间的合作关系,通过特定的协调策略,使得最后的博弈结果,相比较于单一的非合作博弈所得到的结果又更具公平性,此外,由于通信系统模型采用的是拍卖模型,所以主用户可以采用“预留”措施来避免自己性能的下降。
发明内容
技术问题:本发明的目的是提供一种基于博弈理论的认知无线电主用户和次用户频谱共享的方法,该方法基于简化的VCG(Vickrey-Clarke-Groves)拍卖模型,引入次用户间的合作关系,并运用货币补偿激励原则,建立了相应的合作型竞争的频谱博弈模型。此外,由于本发明采用的通信系统模型为拍卖模型,所以主用户可采用“预留带宽”措施来保证自身性能不受次用户共享频谱的影响,更好的保证了主次用户间的频谱共享环境。
技术方案:本方法的设计紧密结合国内外最新的研究动态与成果,通过博弈论(Game Theory)方法建立模型,应用于认知无线电系统的频谱共享中。采用了理论分析、可行性论证和计算机仿真相结合的方法,从理论和仿真两个方面验证了所提出的方案。
基于博弈论的模型将反映实时认知用户交互过程的认知周期映射为一个博弈模型,对分布式动态频谱共享算法进行分析。该模型中博弈论是研究决策主体的行为发生直接相互作用时候的决策以及这种决策的均衡问题的理论,它使用严谨的数学模型解决现实中利害冲突,在决策选择问题上能够起到关键指导作用。
该方法结合经济学中的拍卖模型和补偿激励机制,建立了一个包含有谈判和协商环节在内的扩展式非合作博弈模型,在非合作博弈的框架内讨论次用户间的合作关系,通过特定的协调策略进行博弈,此外,由于本方法采用的是拍卖模型,所以主用户可以采用预留措施来避免自己性能的下降,具体的方法为:
a、明确研究对象是主用户和次用户共享的频谱数:参与者为主用户与次用户,行为为选择频谱,效用为各次用户收益,纳什均衡为效用最大时的频谱分配;
b、频谱拍卖规则:将主次用户频谱共享问题看作是一个主用户拍卖频谱,次用户投标问题,每个次用户都知道自己所投标后获得的单位传输速率的回报率fi,同时每个次用户也可计算得到自身的频谱利用率k=log2(1+Kγ)其中γ为信噪比,K=1.5/(ln2/BERtar),BERtar为目标误比特率;在拍卖开始之前,主用户将公开其保留标底δ以及对单位频谱的定价p,为了保证自身性能不受到频谱共享的影响而恶化,主用户将根据次用户所提供的竞投拍卖标和自己的保留标底拍给次用户相应的频谱
Figure BSA00000482753500031
其中I为次用户数目,Btot为主用户总的的频谱,bi为次用户i提供的竞购拍卖标,这个竞购拍卖标反应了次用户用于信息传输所需最大频谱数。次用户将支付主用户相应的报酬Qi(bi,p)=psibi,其中si是各个次用户独立的优先级参数,这种支付差异类似于经济学中的价格歧视;此外,由于这种拍卖模型的特殊性,对次用户采取预付机制,即它所支付给主用户的报酬为它投标的总频谱数价格,而并非主用户拍卖给它的总频谱数价格;定义所有次用户的投标集合为b=(bi,...,bj),次用户i的竞争对手的投标集合定义为b-i=(b1,..,bi-1,bi+1,...,bj),故而b=(bi;b-i);由于拍卖规则的限定,投标集合必须满足条件
Figure BSA00000482753500032
c、建立博弈模型:博弈分为两个阶段,第一是合作协调阶段,第二是市场竞争阶段;合作协调阶段的第1步,次用户间按照补偿激励原则建立起合作关系,次用户约定互相从对方的产出中获取补偿利润,用ti表示第i个次用户向对方索取的利润补偿率,这里的ti为博弈第一阶段双方合作协调的策略变量,次用户i的效用函数可表示为:
R i ( b i ; b - i , p ) = f i k i B i - Q i ( b i , p ) + t i Σ j ≠ i b j + 1 2 Σ j ≠ i t j 2 - Σ j ≠ i t j b i - 1 2 t i 2
其中第一项为次用户在主用户拍得的频谱上传输时得到的效益,第二项为次用户竞拍频谱所付出的代价,第三项为次用户i从其它次用户竞拍得到的频谱中获取的补偿利润,第四项为次用户i根据其它次用户所选择的补偿率获得的罚金,对应的,第五第六项表示次用户i向其它次用户支付的补偿利润和罚金;在市场竞争阶段的第2步,次用户独立的进行竞投,策略变量为bi,i∈I;从上述的博弈模型看出,次用户间的合作关系是通过双方补偿策略的选择来体现的,有别于次用户间简单的串谋行为;
d、计算价格取值范围:当Ri(bi *;b-i ,p)≥Ri(bi;b-i ,p),b即为投标者的最优策略,定义次用户i的最佳反应函数为
Figure BSA00000482753500041
根据效用最大化条件,得到Ri是bi和∑j≠ibj的下降函数,所以主用户对次用户收取的频谱单价存在两个极端价格,即对应于次用户频谱策略取到最小和最大时的两个价格值,可以推导得到两个极端价格如下:
p i ‾ = Δ min b ∈ b R ∂ R i ∂ b i s i = f i k i B tot ( ( I - 1 ) B tot + δ ) ( IB tot + δ ) 2 s i - Σ j ≠ i t j s i , ( b i = B tot )
p ‾ i = Δ max b ∈ b R ∂ R i ∂ b i s i = f i k i B tot δ s i - Σ j ≠ i t j s i , ( b i = 0 )
因此一个合理的价格必须是介于这两个极端价格之间,所以在价格设定程序中,主用户通过收集次用户的有效信息(fi,ki,si,I)来计算这两个极端价格;
e、计算次用户共享的频谱数:定义B-i={bj|j=1,...,N;j≠i}表示除次用户i外的其它次用户的策略集合,这样对于某个次用户来说,分配的频谱数与其它次用户的决策有关,B=B-i∪{bi}表示所有用户的策略集合;在给定其他参与者的行为时,没有任何参与者会选择不同的行为来提高自身收益,此时的状态就是纳什均衡,最佳响应函数定义为
Figure BSA00000482753500045
集合
Figure BSA00000482753500046
在满足
Figure BSA00000482753500047
时为纳什均衡解的集合,
Figure BSA00000482753500048
表示次用户j的最佳策略,j≠i;为了得到效用的最大值,求解方程
∂ R i ∂ b i = f i k i B tot ( Σ j ≠ i b j + δ ) ( Σ j ∈ I b j + δ ) 2 s i - ps i - Σ j ≠ i t j θ i = 0 ,
b i = f i k i B tot ( Σ j ≠ i b j + δ ) ps i + Σ j ≠ i t j - ( Σ j ≠ i b j + δ )
对于次用户i,给定了次用户j的策略,B-i={bj|j=1,...,N;j≠i},根据上式就可得到次用户i的最佳共享频谱,以同样的方法可以求出每个次用户的最佳共享频谱。
本发明采用的频谱共享的系统模型如图1所示,假设存在一个主用户,以及I个次用户欲共享指配给主用户的频谱Btot
在这个系统里,我们假设主用户可以通过与次用户i共享一部分频谱Bi(Bi≤Btot)以提高频谱利用率。但是,主用户必须预先保留一些固定的带宽Brent以保证自身某些性能不致受频谱共享而受到影响。
在拍卖开始前,竞拍者(次用户)之间根据补偿激励原则,建立起用户间的合作关系,竞拍者们约定互相从彼此所拍得频谱中获取补偿利润。拍卖者(主用户)也将公开其预留带宽Brem以及对单位频谱的定价p,在拍卖中,竞拍者提供各自的竞拍标bi,主用户根据自己预留带宽折算后的预留标底和竞拍者提供的竞拍标,决定最终拍给用户的频谱数。此外,为了防止竞拍者反悔,拍卖者对竞拍者采取预付机制以留住次用户。
本发明建立的次用户博弈模型的基本要素如下:参与者为次用户,行为为选择频谱,效用为各次用户收益,纳什均衡为效用最大时的频谱分配。
本方法建立的博弈模型是一个基于拍卖的系统模型,并包含有次用户谈判,协商环节在内的扩展式非合作博弈,并且是在非合作博弈的框架内讨论次用户间合作关系的。模型中之所以要引入次用户间的合作关系,是为了通过特定的协调策略,提高博弈结果的效率性,而总体上仍旧以非合作博弈的框架来把握合作关系,是为了保证合作协调的关系能够自动的实施。
有益效果:本发明利用了博弈论方法来实现认识无线电系统中主用户和次用户的频谱共享,建立了一个包含有谈判和协商环节在内的扩展式非合作博弈模型,该博弈模型不仅具有非合作博弈模型的可自动实施性的决策模式特点,还具有寡头联合模型的公平性的特点。此外,由于本方法通信系统模型采用的是拍卖模型,所以主用户可以采用“预留”措施来避免自己性能的下降。
附图说明
图1是频谱共享系统模型图。
具体实施方式
本发明的具体实施方式如下。
(1)频谱拍卖规则
我们将此主次用户频谱共享问题看作是一个主用户拍卖频谱,次用户投标问题。拍卖是经济学中的一种市场状态,历时久远,特别是其简明的拍卖程序规则在解决多边议价交易问题上行之有效,享有持久的声誉。著名经济学家维克里认为,应该按照管理拍卖的不同制度规则来划分拍卖业,因为拍卖规则能影响交易人报盘的动机,从而影响交易的条件与效率。
实质上,拍卖市场是一种具有明确交易规则的特殊市场,该交易规则精确地描述了市场出清价格是如何实现的。维克里假定每个经济行为人(拍卖商与竞买者)都是自利与理性的,其在拍卖中的估价与常值密度独立分布,任何估价与递价均可认为是最大可能估价的一部分。然后维克里建立了一个双边拍卖式契约模型。在存在多个竞买者,以及每个竞买者准确地知道自己的估价区间时,如果所有行为人都属于风险中性,则在第一价格拍卖中的非合作(或纳什)均衡递价函数仅仅取决于其估价值,而非取决于有着任何估价值的经济行为者。因而只要给定其一估价顺序,就可以得到同样的递价顺序。如果所有的行为人都属于风险厌恶,那么最高估价竞买者只能是潜在的最高竞买者,因为假如他的风险厌恶程度小于第二或第三高价竞买者,则他的出价可能比他们低。
由此可见,拍卖市场状态在市场参入者标价基础上具有决定资源配置和资源价格的明确规则。Vickrey-Clarke-Groves(VCG)拍卖是拍卖理论中一著名模型,但是它需要收集网络全局信息并且进行集中计算,由于它沉重的通信负荷和计算复杂度,因而并不适合本文的通信场景。为了更好的描述主次用户各自的行为和交互作用,我们将在下文给出简化的VCG相应规则。
公共信息:每个次用户都知道自己所投标后获得的单位传输速率的回报率fi,同时通过信道估计,每个次用户也可计算得到自身的频谱利用率ki
k=log2(1+Kγ)                                            (1)
其中K=1.5/(ln2/BERtot)                                   (2)
在拍卖开始之前,主用户将公开其保留标底δ以及对单位频谱的定价p。
频谱分配:为了保证自身性能不受到频谱共享的影响而恶化,主用户将根据次用户所提供的竞投拍卖标和自己的保留标底拍给次用户相应的频谱:
B i = b i Σ j ∈ I b j + δ B tot - - - ( 3 )
其中bi为次用户i提供的竞购拍卖标,这个竞购拍卖标反应了次用户用于信息传输所需最大频谱数。
成交价:次用户将支付主用户相应的报酬
Qi=psibi                                            (4)
其中,si是各个次用户独立的优先级参数(这种支付差异类似于经济学中的价格歧视),之所以采用这种价格差异措施,主要考虑到在本文的交易市场中,存在信息的不完善性,而次用户之间的关系也并不是完全竞争的,而是存在一定合作性,同时次用户的需求弹性也不同。此外,由于这种拍卖模型的特殊性,我们对次用户采取预付机制,即它所支付给主用户的报酬为它投标的总频谱数价格,而并非主用户拍卖给它的总频谱数价格。
预付机制:本文采取的这种预付机制主要是出于以下考虑,即在竞投中,每个次用户会不时调节自身对拍卖标的支付价格,而在主用户方面必须要禁止次用户报谎价,在这种情况下,次用户必须冒险竞投满足自身需要的最大频谱数以获得最大效用,由于主用户可用于拍卖的频谱数的限制,因此其他次用户就可能退出竞投活动。在这种机制下,风险反映了次用户:通信环境改变的不确定性,所以主用户必须对次用户采取预付机制以留住竞投者。
我们定义所有次用户的投标集合为b=(bi,...,bj),次用户i的竞争对手的投标集合定义为b-i=(b1,...,bi-1,bi+1,...,bj),故而b=(bi;b-i)。由于拍卖规则的限定,投标集合必须满足以下条件:
b ∈ b R = Δ { b | 0 ≤ b i ≤ B tot , ∀ i ∈ I } - - - ( 5 )
在本文采用的拍卖模型中,所提到预留标底δ必须满足
Figure BSA00000482753500072
其中,Breq是保证主用户传输控制信息所需的最小基本带宽。即保证主用户在拍卖后的最小带宽满足以下条件:
min b ∈ b R B rem = δ B tot IB tot + δ > 0 - - - ( 6 )
假设主用户可以在拍卖开始前知道次用户的数目,而对于主用户设定预留底的最安全策略就是设定
Figure BSA00000482753500074
结合公式(6),我们可以得到最安全的预留标底如下所示:
δ * = IB req B tot B tot - B req - - - ( 7 )
如果主用户设定预留标底δ=δ*,那么在给定的服务质量指标,它就可以保证主用户总是拥有足够的频谱供自身使用。但如果δ>δ*,那么主用户的一些频谱仍将被闲置,无法得到最好的利用。
(2)补偿激励策略下次用户的效用函数
本方法借用了经济学中货币补偿款和房屋调换差价款的概念,将这种补偿激励机制应用于该通信场景,使得博弈分为两个阶段,第一阶段是合作协调阶段,第二阶段是市场竞争阶段。在合作协调的阶段1,次用户间按照补偿激励原则建立起合作关系,次用户约定互相从对方的产出中获取补偿利润,我们用ti表示第i个次用户向对方索取的利润补偿率,这里的ti为博弈第一阶段双方合作协调的策略变量。
次用户i的效用函数可表示为:
R i ( b i ; b - i , p ) = f i k i B i - Q i ( b i , p ) + t i Σ j ≠ i b j + 1 2 Σ j ≠ i t j 2 - Σ j ≠ i t j b i - 1 2 t i 2 - - - ( 8 )
其中第一项为次用户在主用户拍得的频谱上传输时得到的效益,第二项为次用户竞拍频谱所付出的代价,第三项为次用户i从其它次用户竞拍得到的频谱中获取的补偿利润,第四项为次用户i根据其它次用户所选择的补偿率获得的罚金,对称的,第五第六项表示次用户i向其它次用户支付的补偿利润和罚金。
在市场竞争的阶段2,次用户独立的进行竞投,策略变量为bi,i∈I,这跟传统的古诺模型相似。从上述的博弈模型看出,次用户间的合作关系是通过双方补偿策略的选择来体现的,有别于次用户间简单的串谋行为,下面将求解本博弈的子博弈的纳什均衡。
根据博弈论的定义,当Ri(bi *;b-i ,p)≥Ri(bi;b-i ,p),b即为投标者的最优策略,本文定义次用户i的最佳反应函数为:
V ( b - i , p ) = { b i | b i = arg max b ∈ b R i ( b i ; b - i , p ) } - - - ( 9 )
根据效用最大化条件,得出以下公式:
∂ R i ∂ b i = f i k i B tot ( Σ j ≠ i b j + δ ) ( Σ j ∈ I b j + δ ) 2 s i - ps i - Σ j ≠ i t j θ i - - - ( 10 )
我们观察到Ri是bi和∑j≠ibj的下降函数,所以主用户对次用户收取的频谱单价存在两个极端价格,即对应于次用户频谱策略取到最小和最大时的两个价格值,本发明推导得到的两个极端价格如下:
p i ‾ = Δ min b ∈ b R ∂ R i ∂ b i s i = f i k i B tot ( ( I - 1 ) B tot + δ ) ( IB tot + δ ) 2 s i - Σ j ≠ i t j s i , ( b i = B tot ) - - - ( 11 )
p ‾ i = Δ max b ∈ b R ∂ R i ∂ b i s i = f i k i B tot δ s i - Σ j ≠ i t j s i , ( b i = 0 ) - - - ( 12 )
从上述公式我们可以得到,当主用户设定p<pi
Figure BSA00000482753500093
因而bi *=Btot;如果设定p>pi
Figure BSA00000482753500094
则bi *=0。因为一个合理的价格必须是介于这两个极端价格之间,所以在价格设定程序中,主用户通过收集次用户的有效信息(fi,ki,si,I)来计算这两个极端价格。
(3)纳什均衡存在证明
如果设定p∈(pi,pi),那么对于次用户的竞拍博弈存在唯一的纳什均衡。先给出次用户i的最佳反应方程为:
V ( b - i , p ) = [ f i k i B tot ( Σ j ≠ i b j + δ ps i + Σ j ≠ i t j - ( Σ j ≠ i b j + δ ) ] 0 B tot - - - ( 12 )
证明:我们首先考虑纳什均衡的存在性。因为对于每一个凹的n人博弈总是存在均衡点。考察策略式博弈,如果次用户的收益函数是连续的且对自己策略是凹的,那么存在纯策略纳什均衡。这种凹性体现为:
&PartialD; 2 R i ( b i ; b - i , p ) &PartialD; b i 2 < 0 - - - ( 13 )
我们可以将这种拍卖看作是一个在正交约束下的凹的n人博弈,首先可以看出每个次用户的效用函数相对于其他次用户的策略是凸的:
&PartialD; 2 R i ( b i ; b - i , p ) &PartialD; b i 2 | j &NotEqual; i &GreaterEqual; 0 - - - ( 14 )
其次,给出所有次用户效用函数的非负的加权和:
&zeta; ( b , x ) = &Sigma; i = 1 l x i R i ( b i ; b - i , p ) - - - ( 15 )
其Pseudo梯度如下所示:
&psi; ( b , x ) = [ x 1 &dtri; 1 R 1 ( b 1 ; b - i , p ) ; . . . . . x l &dtri; l R l ( b l ; b - l , p ) ] l - - - ( 16 )
利用(10)和(12),我们可以得到
&PartialD; 2 &zeta; ( b , x ) &PartialD; b i 2 < 0 - - - ( 17 )
令ψ(b,x)的梯度的雅克比行列式为J,根据(14)和(17),可以得到(J+JT)为负定的,由此看出,ζ(b,x)是严格凹的,所以此纳什均衡是唯一的。
(4)博弈算法设计
纳什均衡是静态的概念,定义B-i={bj|j=1,...,N;j≠i}表示除次用户i外的其它次用户的策略集合,这样对于某个次用户来说,分配的频谱数与其它次用户的决策有关,B=B-i∪{bi}表示所有用户的策略集合。根据定义,在给定其他参与者的行为时,没有任何参与者会选择不同的行为来提高自身收益,此时的状态就是纳什均衡。这里给出最佳响应函数的定义:
BR i ( B - i ) = arg max b i &pi; i ( B - i &cup; { b i } ) - - - ( 18 )
集合
Figure BSA00000482753500104
在满足(19)式时为纳什均衡解的集合:
b i * = BR i ( B - i * ) &ForAll; i - - - ( 19 )
表示次用户j的最佳策略(j≠i)。分析式(8)可知,效用函数是连续函数,从数学角度出发,为了得到效用的最大值,必须求解方程:
&PartialD; R i &PartialD; b i = f i k i B tot ( &Sigma; j &NotEqual; i b j + &delta; ) ( &Sigma; j &Element; I b j + &delta; ) 2 s i - ps i - &Sigma; j &NotEqual; i t j &theta; i = 0 - - - ( 20 )
即: b i = f i k i B tot ( &Sigma; j &NotEqual; i b j + &delta; ) ps i + &Sigma; j &NotEqual; i t j - ( &Sigma; j &NotEqual; i b j + &delta; ) - - - ( 21 )
对于次用户i,给定了次用户j的策略(j≠i)B-i={bj|j=1,...,N;j≠i},根据式(21)就可得到次用户i的最佳响应函数,以同样的方法求出每个次用户的最佳响应函数,根据式(19)就可得到纳什均衡解的集合。
本发明从静态博弈和动态博弈两个角度去设计频谱分配算法。
1)静态博弈算法
静态博弈是参与者同时进行策略的选择,在每次进行策略选择的时候每个参与者选择的策略是可被其他参与者得知的。
根据式(13),频谱博弈模型是:
b i = f i k i B tot ( &Sigma; j &NotEqual; i b j ( t ) + &delta; ) ps i + &Sigma; j &NotEqual; i t j - ( &Sigma; j &NotEqual; i b j ( t ) + &delta; ) , &ForAll; i = 1 , . . . , N , t &GreaterEqual; 0 - - - ( 22 )
由式(22)可分别求出每个次用户的频谱最佳响应函数,可以画出这些函数的轨迹,所有轨迹的交点就是博弈的纳什均衡点。
假设N=2,以次用户1为例,其频谱最佳响应函数具体求解过程如下:
(1)当t=0时,为次用户i设定初始频谱bi(t),并设定授权给主用户的频谱大小为total;
(2)当t=t+1时,令b2(t+1)=b2(t)+Δ(Δ为迭代精度),代入式(22)求出b1(t+1);
(3)判断b2(t+1)与total的关系,若b2(t+1)=total则算法结束,否则返回步骤(2)继续执行。
2)动态博弈算法
在实际的认知无线电环境中,次用户可能只会从主用户那得到价格信息,其它次用户的决策和收益无法得知。因此,只能依靠与主用户的交互来得到次用户的纳什均衡解,所有次用户在最大化收益的过程中都是理性的,能根据边际效用函数即
Figure BSA00000482753500112
调整共享的频谱bi,此时频谱博弈模型如下:
b i ( t + 1 ) = b i ( t ) + &alpha; i b i ( t ) &PartialD; R i &PartialD; b i ( t ) - - - ( 23 )
bi(t)表示t时刻的次用户i分配的频谱大小,αi是次用户i的收敛速度调整参数(也就是学习因子)。从模型中可以看出频谱是动态分配的,某一时刻次用户只能与主用户通信并知晓前一时刻其他次用户的部分信息,对当前时刻其他次用户的信息无法得知。因为该博弈是随时间不断迭代且每次迭代的博弈方法相同,因此又称为重复博弈。
将公式(20)代入式(23),博弈模型可以表示成:
b i ( t + 1 ) = b i ( t ) + v i b i ( t ) ( f i k i B tot ( &Sigma; j &NotEqual; i b j + &delta; &Sigma; j &Element; I b j ) 2 ) - ps i - &Sigma; j &NotEqual; i t j ) - - - ( 24 )
频谱分配的具体实现过程如下:
(1)当t=0时,为次用户i设定初始频谱bi(t),并设定授权给主用户的频谱大小为total;
(2)当t=t+1时,根据式(24)求出bi(t+1);
(3)若
Figure BSA00000482753500121
则算法结束,所得的频谱bi(t)即为求得的最佳频谱组合;
Figure BSA00000482753500122
判断bi(t+1)与bi(t):若bi(t+1)=bi(t),则算法结束,所得的频谱bi(t)即为求得的最佳频谱组合;否则返回步骤(2)继续执行。

Claims (1)

1.一种认知无线电系统中基于拍卖理论和补偿激励的频谱共享方法,其特征在于该方法结合经济学中的拍卖模型和补偿激励机制,建立了一个包含有谈判和协商环节在内的扩展式非合作博弈模型,在非合作博弈的框架内讨论次用户间的合作关系,通过特定的协调策略进行博弈,此外,由于本方法采用的是拍卖模型,所以主用户可以采用预留措施来避免自己性能的下降,具体的方法为:
a、明确研究对象是主用户和次用户共享的频谱数:参与者为主用户与次用户,行为为选择频谱,效用为各次用户收益,纳什均衡为效用最大时的频谱分配;
b、频谱拍卖规则:将主次用户频谱共享问题看作是一个主用户拍卖频谱,次用户投标问题,每个次用户都知道自己所投标后获得的单位传输速率的回报率fi,同时每个次用户也可计算得到自身的频谱利用率k=log2(1+Kγ),其中γ为信噪比,
Figure FDA00003447380000011
BERtar为目标误比特率;在拍卖开始之前,主用户将公开其保留标底δ以及对单位频谱的定价p,为了保证自身性能不受到频谱共享的影响而恶化,主用户将根据次用户所提供的竞投拍卖标和自己的保留标底拍给次用户相应的频谱其中I为次用户数目,Btot为主用户总的的频谱,bi为次用户i提供的竞购拍卖标,这个竞购拍卖标反应了次用户用于信息传输所需最大频谱数;次用户将支付主用户相应的报酬Qi(bi,p)=psibi,其中si是各个次用户独立的优先级参数,这种支付差异类似于经济学中的价格歧视;此外,由于这种拍卖模型的特殊性,对次用户采取预付机制,即它所支付给主用户的报酬为它投标的总频谱数价格,而并非主用户拍卖给它的总频谱数价格;定义所有次用户的投标集合为b=(b1,...,bI),次用户i的竞争对手的投标集合定义为b-i=(b1,...,bi-1,bi+1,...,bI),故而b=(bi;b-i);由于拍卖规则的限定,投标集合必须满足条件 b &Element; b R = &Delta; { b | 0 &le; b i &le; B tot , &ForAll; i &Element; I } ;
c、建立博弈模型:博弈分为两个阶段,第一是合作协调阶段,第二是市场竞争阶段;合作协调阶段的第1步,次用户间按照补偿激励原则建立起合作关系,次用户约定互相从对方
的产出中获取补偿利润,用ti表示第i个次用户向对方索取的利润补偿率,这里的ti为博弈第一阶段双方合作协调的策略变量,次用户i的效用函数可表示为:
R i ( b i ; b - i , p ) = f i k i B i - Q i ( b i , p ) + t i &Sigma; j &NotEqual; i b i + 1 2 &Sigma; j &NotEqual; i t j 2 - &Sigma; j &NotEqual; i t j b i - 1 2 t i 2
其中第一项为次用户在主用户拍得的频谱上传输时得到的效益,第二项为次用户竞拍频谱所付出的代价,第三项为次用户i从其它次用户竞拍得到的频谱中获取的补偿利润,第四项为次用户i根据其它次用户所选择的补偿率获得的罚金,对应的,第五第六项表示次用户i向其它次用户支付的补偿利润和罚金;在市场竞争阶段的第2步,次用户独立的进行竞投,策略变量为bi,i∈I;从上述的博弈模型看出,次用户间的合作关系是通过双方补偿策略的选择来体现的,有别于次用户间简单的串谋行为;
d、计算价格取值范围:当
Figure FDA00003447380000021
b*即为投标者的最优策略,定义次用户i的最佳反应函数为 V ( b - i , p ) = { b i | b i = arg max b &Element; b R R i ( b i ; b - i , p ) } , 根据效用最大化条件,得到 &PartialD; R i &PartialD; b i = 0 = f i k i B tot ( &Sigma; j &NotEqual; i b j + &delta; ) ( &Sigma; j &Element; I b j + &delta; ) 2 s i - ps i - &Sigma; j &NotEqual; i t j s i , Ri是bi和∑j≠ibj的下降函数,所以主用户对次用户收取的频谱单价存在两个极端价格,即对应于次用户频谱策略取到最小和最大时的两个价格值,可以推导得到两个极端价格如下:
p i &OverBar; = &Delta; min b &Element; b R &PartialD; R i &PartialD; b i s i = f i k i B tot ( ( I - 1 ) B tot + &delta; ) ( IB tot + &delta; ) 2 s i - &Sigma; j &NotEqual; i t j s i ( b i = B tot )
p &OverBar; i = &Delta; max b &Element; b R &PartialD; R i &PartialD; b i s i = f i k i B tot &delta;s i - &Sigma; j &NotEqual; i t j s i ( b i = 0 )
因此一个合理的价格必须是介于这两个极端价格之间,所以在价格设定程序中,主用户通过收集次用户的有效信息(fi,ki,si,I)来计算这两个极端价格;
e、计算次用户共享的频谱数:定义B-i={bj|j=1,...,I;j≠i}表示除次用户i外的其它次用户的策略集合,这样对于某个次用户来说,分配的频谱数与其它次用户的决策有关,B=B-i∪{bi}表示所有用户的策略集合;在给定其他参与者的行为时,没有任何参与者会选择不同的行为来提高自身收益,此时的状态就是纳什均衡,最佳响应函数定义为 BR i ( B - i ) = arg max b i R i ( B - i &cup; { b i } ) , 集合 B * = { b 1 * , . . . , b I * } 在满足
Figure FDA00003447380000028
Figure FDA000034473800000213
时为纳什均衡解的集合,表示次用户j的最佳策略,j≠i;为了得到效用的最大值,求解方程
&PartialD; R i &PartialD; b i = f i k i B tot ( &Sigma; j &NotEqual; i b i + &delta; ) ( &Sigma; j &Element; I b i + &delta; ) 2 s i - ps i - &Sigma; j &NotEqual; i t j s i = 0 ,
b i = f i k i B tot ( &Sigma; j &NotEqual; i b j + &delta; ) ps i + &Sigma; j &NotEqual; i t j - ( &Sigma; j &NotEqual; i b j + &delta; )
对于次用户i,给定了次用户j的策略,B-i={bj|j=1,...,I;j≠i},根据上式就可得到次用户i的最佳共享频谱,以同样的方法可以求出每个次用户的最佳共享频谱。
CN 201110106062 2011-04-22 2011-04-22 基于拍卖理论和补偿激励的频谱共享方法 Expired - Fee Related CN102291722B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN 201110106062 CN102291722B (zh) 2011-04-22 2011-04-22 基于拍卖理论和补偿激励的频谱共享方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN 201110106062 CN102291722B (zh) 2011-04-22 2011-04-22 基于拍卖理论和补偿激励的频谱共享方法

Publications (2)

Publication Number Publication Date
CN102291722A CN102291722A (zh) 2011-12-21
CN102291722B true CN102291722B (zh) 2013-10-30

Family

ID=45337776

Family Applications (1)

Application Number Title Priority Date Filing Date
CN 201110106062 Expired - Fee Related CN102291722B (zh) 2011-04-22 2011-04-22 基于拍卖理论和补偿激励的频谱共享方法

Country Status (1)

Country Link
CN (1) CN102291722B (zh)

Families Citing this family (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102547726A (zh) * 2012-01-16 2012-07-04 哈尔滨工业大学 认知无线电系统中基于竞价拍卖具有抑制共谋效果的频谱分配方法
CN102833761B (zh) * 2012-08-15 2015-08-19 上海交通大学 多信道多主用户认知网络中次用户协助主用户中继的方法
US9629020B2 (en) * 2013-05-28 2017-04-18 Rivada Networks, Llc Methods and systems for data context and management via dynamic spectrum controller and dynamic spectrum policy controller
CN104113882B (zh) * 2014-07-10 2017-11-24 广州市香港科大霍英东研究院 一种针对异质频谱的真实性双重拍卖方法
CN104735677B (zh) * 2015-04-15 2018-01-09 电子科技大学 一种基于不完全网络环境信息的分布式频谱共享方法
CN105916154B (zh) * 2016-04-19 2019-01-25 东南大学 一种基于非协作博弈的认知无线网络动态频谱共享方法
CN105979526A (zh) * 2016-06-29 2016-09-28 桂林电子科技大学 一种认知分布式天线系统的频谱拍卖的出价方法
CN107103408A (zh) * 2017-03-24 2017-08-29 扬州大学 一种众包环境下复杂任务分配方法
CN107949007A (zh) * 2017-04-27 2018-04-20 南京理工大学 无线缓存系统中基于拍卖理论的一种资源分配算法
CN107484174A (zh) * 2017-07-10 2017-12-15 广东工业大学 协作认知无线电网络资源双层拍卖研究
CN107517479B (zh) * 2017-08-17 2020-11-06 湖北工业大学 一种基于契约理论的无线中继网络动态激励机制设计方法
CN107509205B (zh) * 2017-08-17 2020-11-06 湖北工业大学 一种基于契约理论的协作频谱共享动态激励机制设计方法
CN107911823B (zh) * 2017-10-12 2021-08-06 西安电子科技大学 多信道防策略操纵频谱的分配方法
CN107846690B (zh) * 2017-10-19 2020-11-06 湖北工业大学 一种独立非对称信息下协作通信动态契约激励方法
CN107787001B (zh) * 2017-10-19 2020-11-06 湖北工业大学 一种相关非对称信息下协作通信动态契约激励方法
CN109166036B (zh) * 2018-07-19 2021-05-11 华北电力大学 一种基于区块链和契约理论的v2g能源交易方法
CN109818693B (zh) * 2019-02-03 2021-10-22 湖北工业大学 一种动态非对称信息条件下多阶段协作频谱共享契约方法
CN110048789B (zh) * 2019-04-10 2021-02-26 南京邮电大学 一种基于纳什讨价还价模型的协作频谱感知方法
CN110798273B (zh) * 2019-10-21 2021-07-09 南京邮电大学 一种基于次用户效用最优的协作频谱感知方法
CN112235838B (zh) * 2020-08-25 2022-10-18 国网浙江省电力有限公司绍兴供电公司 一种电力无线异构网络中多模终端自适应切换方法
CN116542400B (zh) * 2023-07-05 2023-09-19 北京航空航天大学 一种武器目标分配方法、系统、设备及介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0545533A2 (en) * 1991-11-01 1993-06-09 AT&T Corp. Communications resource assignment in a wireless telecommunications system
CN101945369A (zh) * 2010-09-08 2011-01-12 北京航空航天大学 一种基于拍卖和满意度模型的动态频谱分配方法
CN101964982A (zh) * 2010-10-22 2011-02-02 哈尔滨工业大学深圳研究生院 一种认知无线电的频谱共享方法及系统
CN102026201A (zh) * 2010-12-15 2011-04-20 西安交通大学 基于博弈类型选择的动态频谱分配的实现方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0545533A2 (en) * 1991-11-01 1993-06-09 AT&T Corp. Communications resource assignment in a wireless telecommunications system
CN101945369A (zh) * 2010-09-08 2011-01-12 北京航空航天大学 一种基于拍卖和满意度模型的动态频谱分配方法
CN101964982A (zh) * 2010-10-22 2011-02-02 哈尔滨工业大学深圳研究生院 一种认知无线电的频谱共享方法及系统
CN102026201A (zh) * 2010-12-15 2011-04-20 西安交通大学 基于博弈类型选择的动态频谱分配的实现方法

Also Published As

Publication number Publication date
CN102291722A (zh) 2011-12-21

Similar Documents

Publication Publication Date Title
CN102291722B (zh) 基于拍卖理论和补偿激励的频谱共享方法
Roughgarden et al. The price of anarchy in auctions
Ji et al. Multi-stage pricing game for collusion-resistant dynamic spectrum allocation
Zhang et al. Auction-based resource allocation in cognitive radio systems
Milgrom Putting auction theory to work: The simultaneous ascending auction
Chun et al. Secondary spectrum trading—auction-based framework for spectrum allocation and profit sharing
CN108182112A (zh) 基于组合拍卖的以人为中心的感知网络的资源分配机制
Ni et al. Spectrum Allocation Based on Game Theory in Cognitive Radio Networks.
Iosifidis et al. Challenges in auction theory driven spectrum management
Beckman et al. Implications of dynamic spectrum access on the efficiency of primary wireless market
Wang et al. DOTA: A double truthful auction for spectrum allocation in dynamic spectrum access
Khairullah et al. PreDA: Preference-based double auction for spectrum allocation in heterogeneous DSA networks
Chiesa et al. Trading with a common agent under complete information: A characterization of Nash equilibria
Salant Auctions and regulation: Reengineering of regulatory mechanisms
Rathinakumar et al. GAVEL: Strategy-proof ascending bid auction for dynamic licensed shared access
CN107911823A (zh) 多信道防策略操纵频谱的分配方法、计算机程序、计算机
Huang et al. Truthful multi-unit double auction for spectrum allocation in wireless communications
Milgrom et al. Deferred-acceptance heuristic auctions
Bahn et al. A class of games with coupled constraints to model international GHG emission agreements
CN115907988A (zh) 一种基于无线环境图协助的频谱区块链交易机制及交易方法
Karaca On the theory and applications of mechanism design and coalitional games in electricity markets
Le et al. On a new incentive and market based framework for multi-tier shared spectrum access systems
Zhang et al. Constrained VCG auction with multi-level channel valuations for spatial spectrum reuse in non-symmetric networks
Hao et al. VCG-QCP: a reverse pricing mechanism based on VCG and quality all-pay for collaborative crowdsourcing
Basutli et al. Network capacity enhancement in HetNets using incentivized offloading mechanism

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
EE01 Entry into force of recordation of patent licensing contract

Application publication date: 20111221

Assignee: Jiangsu Nanyou IOT Technology Park Ltd.

Assignor: NANJING University OF POSTS AND TELECOMMUNICATIONS

Contract record no.: 2016320000221

Denomination of invention: Spectrum sharing method based on auction theory and compensation stimulation

Granted publication date: 20131030

License type: Common License

Record date: 20161129

LICC Enforcement, change and cancellation of record of contracts on the licence for exploitation of a patent or utility model
EC01 Cancellation of recordation of patent licensing contract
EC01 Cancellation of recordation of patent licensing contract

Assignee: Jiangsu Nanyou IOT Technology Park Ltd.

Assignor: NANJING University OF POSTS AND TELECOMMUNICATIONS

Contract record no.: 2016320000221

Date of cancellation: 20180116

CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20131030