CN102291722B

CN102291722B - 基于拍卖理论和补偿激励的频谱共享方法

Info

Publication number: CN102291722B
Application number: CN 201110106062
Authority: CN
Inventors: 朱琦; 周惟风; 朱洪波
Original assignee: Nanjing University of Posts and Telecommunications
Current assignee: Nanjing University of Posts and Telecommunications
Priority date: 2011-04-22
Filing date: 2011-04-22
Publication date: 2013-10-30
Anticipated expiration: 2031-04-22
Also published as: CN102291722A

Abstract

本发明的目的在于提供一种认知无线电系统中基于拍卖理论和补偿激励的频谱共享方法，该方法针对主次用户共享频谱问题，基于简化的VCG拍卖模型，引入次用户间的合作关系，并运用货币补偿激励原则，建立了一个包含有谈判和协商环节在内的扩展式非合作博弈模型。该博弈模型在非合作博弈的框架内讨论次用户间的合作关系，通过特定的协调策略进行博弈，不仅具有非合作博弈模型的可自动实施性的决策模式特点，还具有寡头联合模型的公平性的特点。此外，由于采用的通信系统模型为拍卖模型，所以主用户可采用“预留带宽”措施来保证自身性能不受次用户共享频谱的影响，更好的保证了主次用户间的频谱共享环境。

Description

基于拍卖理论和补偿激励的频谱共享方法

技术领域

本发明涉及一种特别用于认知无线电系统中主用户和次用户共享频谱的实现方案，属于通信技术领域。

背景技术

随着无线通信不断向着宽带化，无缝化，智能化方向发展，无线频谱已成为现代社会不可或缺的宝贵资源。事实上，在许多频段，频谱接入是比频谱物理稀缺更重要的问题，由于现有的频谱授权机制使得频谱利用率低，造成大量频谱资源浪费，而近年提出的认知无线电(CR，cognitive radio)技术具有在不影响其他授权用户即主用户(PU，primary user)的前提下智能地利用大量空闲频谱并且随时随地，高可靠性通信的潜能。因此打破传统频谱授权机制，通过认知无线电技术实现频谱共享成为了未来无线通信的发展趋势。

基于博弈论的模型将反映实时认知用户交互过程的认知周期映射为一个博弈模型，对分布式动态频谱共享算法进行分析。该模型中博弈论是研究决策主体的行为发生直接相互作用时候的决策以及这种决策的均衡问题的理论，它使用严谨的数学模型解决现实中利害冲突，在决策选择问题上能够起到关键指导作用。

针对认知无线电中频谱资源共享问题，许多研究人员开展了基于博弈论的频谱灵活利用方法的研究：基于博弈论的模型将反映实时用户交互过程的认知周期映射为一个博弈模型，对分布式动态频谱共享算法进行了分析，并研究了次用户间的合作和竞争关系；给出了认知无线电网络中的博弈模型，并利用该模型分别分析了认知无线电的功率控制，呼叫准入控制和干扰避免；通过定价拍卖的方法来实现资源分配，根据不同的网络效用需要来确定自身的目标函数，即确定赢家胜出的规则；在有多个主用户同时出租频谱的场景下，建立了主用户间竞价的伯川德模型，并基于最大化自身效用的前提下分析了主用户之间的频谱价格博弈；在多个认知无线电用户都需要租借频谱的情况下，建立了它们之间的古诺非合作博弈模型，多个次用户通过竞争共享主用户的频谱，实现提高频谱利用率的目的。

虽然这些方法在实现频谱共享的一些方面取得了一定的进步，但往往都是将各个次用户的需求度视作一个定值，因为不能实时反映用户对频谱实际的需求，无法很好的达到频谱共享公平这一目的。或者都是基于次用户间没有约束力协议的非合作博弈模型，并且通常忽略了次用户的行为对主用户的负面影响，因此还有很多不完善的地方有待提高。

所以本发明结合经济学中的拍卖模型和补偿激励机制，建立了一个包含有谈判和协商环节在内的扩展式非合作博弈模型，在非合作博弈的框架内讨论次用户间的合作关系，通过特定的协调策略，使得最后的博弈结果，相比较于单一的非合作博弈所得到的结果又更具公平性，此外，由于通信系统模型采用的是拍卖模型，所以主用户可以采用“预留”措施来避免自己性能的下降。

发明内容

技术问题：本发明的目的是提供一种基于博弈理论的认知无线电主用户和次用户频谱共享的方法，该方法基于简化的VCG(Vickrey-Clarke-Groves)拍卖模型，引入次用户间的合作关系，并运用货币补偿激励原则，建立了相应的合作型竞争的频谱博弈模型。此外，由于本发明采用的通信系统模型为拍卖模型，所以主用户可采用“预留带宽”措施来保证自身性能不受次用户共享频谱的影响，更好的保证了主次用户间的频谱共享环境。

技术方案：本方法的设计紧密结合国内外最新的研究动态与成果，通过博弈论(Game Theory)方法建立模型，应用于认知无线电系统的频谱共享中。采用了理论分析、可行性论证和计算机仿真相结合的方法，从理论和仿真两个方面验证了所提出的方案。

该方法结合经济学中的拍卖模型和补偿激励机制，建立了一个包含有谈判和协商环节在内的扩展式非合作博弈模型，在非合作博弈的框架内讨论次用户间的合作关系，通过特定的协调策略进行博弈，此外，由于本方法采用的是拍卖模型，所以主用户可以采用预留措施来避免自己性能的下降，具体的方法为：

a、明确研究对象是主用户和次用户共享的频谱数：参与者为主用户与次用户，行为为选择频谱，效用为各次用户收益，纳什均衡为效用最大时的频谱分配；

b、频谱拍卖规则：将主次用户频谱共享问题看作是一个主用户拍卖频谱，次用户投标问题，每个次用户都知道自己所投标后获得的单位传输速率的回报率f_i，同时每个次用户也可计算得到自身的频谱利用率k＝log₂(1+Kγ)其中γ为信噪比，K＝1.5/(ln₂/BER^tar)，BER^tar为目标误比特率；在拍卖开始之前，主用户将公开其保留标底δ以及对单位频谱的定价p，为了保证自身性能不受到频谱共享的影响而恶化，主用户将根据次用户所提供的竞投拍卖标和自己的保留标底拍给次用户相应的频谱

其中I为次用户数目，B_tot为主用户总的的频谱，b_i为次用户i提供的竞购拍卖标，这个竞购拍卖标反应了次用户用于信息传输所需最大频谱数。次用户将支付主用户相应的报酬Q_i(b_i，p)＝ps_ib_i，其中s_i是各个次用户独立的优先级参数，这种支付差异类似于经济学中的价格歧视；此外，由于这种拍卖模型的特殊性，对次用户采取预付机制，即它所支付给主用户的报酬为它投标的总频谱数价格，而并非主用户拍卖给它的总频谱数价格；定义所有次用户的投标集合为b＝(b_i，...，b_j)，次用户i的竞争对手的投标集合定义为b_-i＝(b₁，..，b_i-1，b_i+1，...，b_j)，故而b＝(b_i；b_-i)；由于拍卖规则的限定，投标集合必须满足条件

c、建立博弈模型：博弈分为两个阶段，第一是合作协调阶段，第二是市场竞争阶段；合作协调阶段的第1步，次用户间按照补偿激励原则建立起合作关系，次用户约定互相从对方的产出中获取补偿利润，用t_i表示第i个次用户向对方索取的利润补偿率，这里的t_i为博弈第一阶段双方合作协调的策略变量，次用户i的效用函数可表示为：

R_{i} (b_{i}; b_{- i}, p) = f_{i} k_{i} B_{i} - Q_{i} (b_{i}, p) + t_{i} Σ_{j &NotEqual; i} b_{j} + \frac{1}{2} Σ_{j &NotEqual; i} {t_{j}}^{2} - Σ_{j &NotEqual; i} t_{j} b_{i} - \frac{1}{2} {t_{i}}^{2}

其中第一项为次用户在主用户拍得的频谱上传输时得到的效益，第二项为次用户竞拍频谱所付出的代价，第三项为次用户i从其它次用户竞拍得到的频谱中获取的补偿利润，第四项为次用户i根据其它次用户所选择的补偿率获得的罚金，对应的，第五第六项表示次用户i向其它次用户支付的补偿利润和罚金；在市场竞争阶段的第2步，次用户独立的进行竞投，策略变量为b_i，i∈I；从上述的博弈模型看出，次用户间的合作关系是通过双方补偿策略的选择来体现的，有别于次用户间简单的串谋行为；

d、计算价格取值范围：当R_i(b_i ^*；b_-i ^＊，p)≥R_i(b_i；b_-i ^＊，p)，b^＊即为投标者的最优策略，定义次用户i的最佳反应函数为

根据效用最大化条件，得到R_i是b_i和∑_j≠ib_j的下降函数，所以主用户对次用户收取的频谱单价存在两个极端价格，即对应于次用户频谱策略取到最小和最大时的两个价格值，可以推导得到两个极端价格如下：

\underset{&OverBar;}{p_{i}} \overset{Δ}{=} \frac{\min_{b &Element; b_{R}} \frac{&PartialD; R_{i}}{&PartialD; b_{i}}}{s_{i}} = \frac{f_{i} k_{i} B_{tot} ((I - 1) B_{tot} + δ)}{{({IB}_{tot} + δ)}^{2} s_{i}} - \frac{Σ_{j &NotEqual; i} t_{j}}{s_{i}}, (b_{i} = B_{tot})

{\overset{&OverBar;}{p}}_{i} \overset{Δ}{=} \frac{\max_{b &Element; b_{R}} \frac{{&PartialD; R}_{i}}{{&PartialD; b}_{i}}}{s_{i}} = \frac{f_{i} k_{i} B_{tot}}{δ s_{i}} - \frac{Σ_{j &NotEqual; i} t_{j}}{s_{i}}, (b_{i} = 0)

因此一个合理的价格必须是介于这两个极端价格之间，所以在价格设定程序中，主用户通过收集次用户的有效信息(f_i，k_i，s_i，I)来计算这两个极端价格；

e、计算次用户共享的频谱数：定义B_-i＝{b_j|j＝1，...，N；j≠i}表示除次用户i外的其它次用户的策略集合，这样对于某个次用户来说，分配的频谱数与其它次用户的决策有关，B＝B_-i∪{b_i}表示所有用户的策略集合；在给定其他参与者的行为时，没有任何参与者会选择不同的行为来提高自身收益，此时的状态就是纳什均衡，最佳响应函数定义为

集合

在满足

时为纳什均衡解的集合，

表示次用户j的最佳策略，j≠i；为了得到效用的最大值，求解方程

\frac{&PartialD; R_{i}}{&PartialD; b_{i}} = \frac{f_{i} k_{i} B_{tot} (Σ_{j &NotEqual; i} b_{j} + δ)}{{(Σ_{j &Element; I} b_{j} + δ)}^{2} s_{i}} - {ps}_{i} - \frac{Σ_{j &NotEqual; i} t_{j}}{θ_{i}} = 0,

即

b_{i} = \sqrt{\frac{f_{i} k_{i} B_{tot} (Σ_{j &NotEqual; i} b_{j} + δ)}{{ps}_{i} + Σ_{j &NotEqual; i} t_{j}}} - (Σ_{j &NotEqual; i} b_{j} + δ)

对于次用户i，给定了次用户j的策略，B_-i＝{b_j|j＝1，...，N；j≠i}，根据上式就可得到次用户i的最佳共享频谱，以同样的方法可以求出每个次用户的最佳共享频谱。

本发明采用的频谱共享的系统模型如图1所示，假设存在一个主用户，以及I个次用户欲共享指配给主用户的频谱B_tot。

在这个系统里，我们假设主用户可以通过与次用户i共享一部分频谱B_i(B_i≤B_tot)以提高频谱利用率。但是，主用户必须预先保留一些固定的带宽B_rent以保证自身某些性能不致受频谱共享而受到影响。

在拍卖开始前，竞拍者(次用户)之间根据补偿激励原则，建立起用户间的合作关系，竞拍者们约定互相从彼此所拍得频谱中获取补偿利润。拍卖者(主用户)也将公开其预留带宽B_rem以及对单位频谱的定价p，在拍卖中，竞拍者提供各自的竞拍标b_i，主用户根据自己预留带宽折算后的预留标底和竞拍者提供的竞拍标，决定最终拍给用户的频谱数。此外，为了防止竞拍者反悔，拍卖者对竞拍者采取预付机制以留住次用户。

本发明建立的次用户博弈模型的基本要素如下：参与者为次用户，行为为选择频谱，效用为各次用户收益，纳什均衡为效用最大时的频谱分配。

本方法建立的博弈模型是一个基于拍卖的系统模型，并包含有次用户谈判，协商环节在内的扩展式非合作博弈，并且是在非合作博弈的框架内讨论次用户间合作关系的。模型中之所以要引入次用户间的合作关系，是为了通过特定的协调策略，提高博弈结果的效率性，而总体上仍旧以非合作博弈的框架来把握合作关系，是为了保证合作协调的关系能够自动的实施。

有益效果：本发明利用了博弈论方法来实现认识无线电系统中主用户和次用户的频谱共享，建立了一个包含有谈判和协商环节在内的扩展式非合作博弈模型，该博弈模型不仅具有非合作博弈模型的可自动实施性的决策模式特点，还具有寡头联合模型的公平性的特点。此外，由于本方法通信系统模型采用的是拍卖模型，所以主用户可以采用“预留”措施来避免自己性能的下降。

附图说明

图1是频谱共享系统模型图。

具体实施方式

本发明的具体实施方式如下。

(1)频谱拍卖规则

我们将此主次用户频谱共享问题看作是一个主用户拍卖频谱，次用户投标问题。拍卖是经济学中的一种市场状态，历时久远，特别是其简明的拍卖程序规则在解决多边议价交易问题上行之有效，享有持久的声誉。著名经济学家维克里认为，应该按照管理拍卖的不同制度规则来划分拍卖业，因为拍卖规则能影响交易人报盘的动机，从而影响交易的条件与效率。

实质上，拍卖市场是一种具有明确交易规则的特殊市场，该交易规则精确地描述了市场出清价格是如何实现的。维克里假定每个经济行为人(拍卖商与竞买者)都是自利与理性的，其在拍卖中的估价与常值密度独立分布，任何估价与递价均可认为是最大可能估价的一部分。然后维克里建立了一个双边拍卖式契约模型。在存在多个竞买者，以及每个竞买者准确地知道自己的估价区间时，如果所有行为人都属于风险中性，则在第一价格拍卖中的非合作(或纳什)均衡递价函数仅仅取决于其估价值，而非取决于有着任何估价值的经济行为者。因而只要给定其一估价顺序，就可以得到同样的递价顺序。如果所有的行为人都属于风险厌恶，那么最高估价竞买者只能是潜在的最高竞买者，因为假如他的风险厌恶程度小于第二或第三高价竞买者，则他的出价可能比他们低。

由此可见，拍卖市场状态在市场参入者标价基础上具有决定资源配置和资源价格的明确规则。Vickrey-Clarke-Groves(VCG)拍卖是拍卖理论中一著名模型，但是它需要收集网络全局信息并且进行集中计算，由于它沉重的通信负荷和计算复杂度，因而并不适合本文的通信场景。为了更好的描述主次用户各自的行为和交互作用，我们将在下文给出简化的VCG相应规则。

公共信息：每个次用户都知道自己所投标后获得的单位传输速率的回报率f_i，同时通过信道估计，每个次用户也可计算得到自身的频谱利用率k_i：

k＝log₂(1+Kγ) (1)

其中K＝1.5/(ln₂/BER^tot) (2)

在拍卖开始之前，主用户将公开其保留标底δ以及对单位频谱的定价p。

频谱分配：为了保证自身性能不受到频谱共享的影响而恶化，主用户将根据次用户所提供的竞投拍卖标和自己的保留标底拍给次用户相应的频谱：

B_{i} = \frac{b_{i}}{Σ_{j &Element; I} b_{j} + δ} B_{tot} - - - (3)

其中b_i为次用户i提供的竞购拍卖标，这个竞购拍卖标反应了次用户用于信息传输所需最大频谱数。

成交价：次用户将支付主用户相应的报酬

Q_i＝ps_ib_i (4)

其中，s_i是各个次用户独立的优先级参数(这种支付差异类似于经济学中的价格歧视)，之所以采用这种价格差异措施，主要考虑到在本文的交易市场中，存在信息的不完善性，而次用户之间的关系也并不是完全竞争的，而是存在一定合作性，同时次用户的需求弹性也不同。此外，由于这种拍卖模型的特殊性，我们对次用户采取预付机制，即它所支付给主用户的报酬为它投标的总频谱数价格，而并非主用户拍卖给它的总频谱数价格。

预付机制：本文采取的这种预付机制主要是出于以下考虑，即在竞投中，每个次用户会不时调节自身对拍卖标的支付价格，而在主用户方面必须要禁止次用户报谎价，在这种情况下，次用户必须冒险竞投满足自身需要的最大频谱数以获得最大效用，由于主用户可用于拍卖的频谱数的限制，因此其他次用户就可能退出竞投活动。在这种机制下，风险反映了次用户：通信环境改变的不确定性，所以主用户必须对次用户采取预付机制以留住竞投者。

我们定义所有次用户的投标集合为b＝(b_i，...，b_j)，次用户i的竞争对手的投标集合定义为b_-i＝(b₁，...，b_i-1，b_i+1，...，b_j)，故而b＝(b_i；b_-i)。由于拍卖规则的限定，投标集合必须满足以下条件：

b &Element; b_{R} \overset{Δ}{=} {b | 0 \leq b_{i} \leq B_{tot}, &ForAll; i &Element; I} - - - (5)

在本文采用的拍卖模型中，所提到预留标底δ必须满足

其中，B_req是保证主用户传输控制信息所需的最小基本带宽。即保证主用户在拍卖后的最小带宽满足以下条件：

\min_{b &Element; b_{R}} B_{rem} = \frac{δ B_{tot}}{{IB}_{tot} + δ} > 0 - - - (6)

假设主用户可以在拍卖开始前知道次用户的数目，而对于主用户设定预留底的最安全策略就是设定

结合公式(6)，我们可以得到最安全的预留标底如下所示：

δ^{*} = \frac{{IB}_{req} B_{tot}}{B_{tot} - B_{req}} - - - (7)

如果主用户设定预留标底δ＝δ^*，那么在给定的服务质量指标，它就可以保证主用户总是拥有足够的频谱供自身使用。但如果δ＞δ^*，那么主用户的一些频谱仍将被闲置，无法得到最好的利用。

(2)补偿激励策略下次用户的效用函数

本方法借用了经济学中货币补偿款和房屋调换差价款的概念，将这种补偿激励机制应用于该通信场景，使得博弈分为两个阶段，第一阶段是合作协调阶段，第二阶段是市场竞争阶段。在合作协调的阶段1，次用户间按照补偿激励原则建立起合作关系，次用户约定互相从对方的产出中获取补偿利润，我们用t_i表示第i个次用户向对方索取的利润补偿率，这里的t_i为博弈第一阶段双方合作协调的策略变量。

次用户i的效用函数可表示为：

R_{i} (b_{i}; b_{- i}, p) = f_{i} k_{i} B_{i} - Q_{i} (b_{i}, p) + t_{i} Σ_{j &NotEqual; i} b_{j} + \frac{1}{2} Σ_{j &NotEqual; i} {t_{j}}^{2} - Σ_{j &NotEqual; i} t_{j} b_{i} - \frac{1}{2} {t_{i}}^{2} - - - (8)

其中第一项为次用户在主用户拍得的频谱上传输时得到的效益，第二项为次用户竞拍频谱所付出的代价，第三项为次用户i从其它次用户竞拍得到的频谱中获取的补偿利润，第四项为次用户i根据其它次用户所选择的补偿率获得的罚金，对称的，第五第六项表示次用户i向其它次用户支付的补偿利润和罚金。

在市场竞争的阶段2，次用户独立的进行竞投，策略变量为b_i，i∈I，这跟传统的古诺模型相似。从上述的博弈模型看出，次用户间的合作关系是通过双方补偿策略的选择来体现的，有别于次用户间简单的串谋行为，下面将求解本博弈的子博弈的纳什均衡。

根据博弈论的定义，当R_i(b_i ^*；b_-i ^＊，p)≥R_i(b_i；b_-i ^＊，p)，b^＊即为投标者的最优策略，本文定义次用户i的最佳反应函数为：

V (b_{- i}, p) = {b_{i} | b_{i} = \arg \max_{b &Element; b} R_{i} (b_{i}; b_{- i}, p)} - - - (9)

根据效用最大化条件，得出以下公式：

\frac{&PartialD; R_{i}}{&PartialD; b_{i}} = \frac{f_{i} k_{i} B_{tot} (Σ_{j &NotEqual; i} b_{j} + δ)}{{(Σ_{j &Element; I} b_{j} + δ)}^{2} s_{i}} - {ps}_{i} - \frac{Σ_{j &NotEqual; i} t_{j}}{θ_{i}} - - - (10)

我们观察到R_i是b_i和∑_j≠ib_j的下降函数，所以主用户对次用户收取的频谱单价存在两个极端价格，即对应于次用户频谱策略取到最小和最大时的两个价格值，本发明推导得到的两个极端价格如下：

\underset{&OverBar;}{p_{i}} \overset{Δ}{=} \frac{\min_{b &Element; b_{R}} \frac{&PartialD; R_{i}}{&PartialD; b_{i}}}{s_{i}} = \frac{f_{i} k_{i} B_{tot} ((I - 1) B_{tot} + δ)}{{({IB}_{tot} + δ)}^{2} s_{i}} - \frac{Σ_{j &NotEqual; i} t_{j}}{s_{i}}, (b_{i} = B_{tot}) - - - (11)

{\overset{&OverBar;}{p}}_{i} \overset{Δ}{=} \frac{\max_{b &Element; b_{R}} \frac{{&PartialD; R}_{i}}{{&PartialD; b}_{i}}}{s_{i}} = \frac{f_{i} k_{i} B_{tot}}{δ s_{i}} - \frac{Σ_{j &NotEqual; i} t_{j}}{s_{i}}, (b_{i} = 0) - - - (12)

从上述公式我们可以得到，当主用户设定p＜p_i，

因而b_i ^*＝B_tot；如果设定p＞p_i，

则b_i ^*＝0。因为一个合理的价格必须是介于这两个极端价格之间，所以在价格设定程序中，主用户通过收集次用户的有效信息(f_i，k_i，s_i，I)来计算这两个极端价格。

(3)纳什均衡存在证明

如果设定p∈(p_i，p_i)，那么对于次用户的竞拍博弈存在唯一的纳什均衡。先给出次用户i的最佳反应方程为：

V (b_{- i}, p) = {[\sqrt{\frac{f_{i} k_{i} B_{tot} (Σ_{j &NotEqual; i} b_{j} + δ}{{ps}_{i} + Σ_{j &NotEqual; i} t_{j}}} - (Σ_{j &NotEqual; i} b_{j} + δ)]}_{0}^{B_{tot}} - - - (12)

证明：我们首先考虑纳什均衡的存在性。因为对于每一个凹的n人博弈总是存在均衡点。考察策略式博弈，如果次用户的收益函数是连续的且对自己策略是凹的，那么存在纯策略纳什均衡。这种凹性体现为：

\frac{{&PartialD;}^{2} R_{i} (b_{i}; b_{- i}, p)}{&PartialD; {b_{i}}^{2}} < 0 - - - (13)

我们可以将这种拍卖看作是一个在正交约束下的凹的n人博弈，首先可以看出每个次用户的效用函数相对于其他次用户的策略是凸的：

\frac{{&PartialD;}^{2} R_{i} (b_{i}; b_{- i}, p)}{&PartialD; {b_{i}}^{2}} |_{j &NotEqual; i} &GreaterEqual; 0 - - - (14)

其次，给出所有次用户效用函数的非负的加权和：

ζ (b, x) = Σ_{i = 1}^{l} x_{i} R_{i} (b_{i}; b_{- i}, p) - - - (15)

其Pseudo梯度如下所示：

ψ (b, x) = {[x_{1} {&dtri;}_{1} R_{1} (b_{1}; b_{- i}, p); . . . . . x_{l} {&dtri;}_{l} R_{l} (b_{l}; b_{- l}, p)]}^{l} - - - (16)

利用(10)和(12)，我们可以得到

\frac{{&PartialD;}^{2} ζ (b, x)}{{&PartialD; b}_{i}^{2}} < 0 - - - (17)

令ψ(b，x)的梯度的雅克比行列式为J，根据(14)和(17)，可以得到(J+J^T)为负定的，由此看出，ζ(b，x)是严格凹的，所以此纳什均衡是唯一的。

(4)博弈算法设计

纳什均衡是静态的概念，定义B_-i＝{b_j|j＝1，...，N；j≠i}表示除次用户i外的其它次用户的策略集合，这样对于某个次用户来说，分配的频谱数与其它次用户的决策有关，B＝B_-i∪{b_i}表示所有用户的策略集合。根据定义，在给定其他参与者的行为时，没有任何参与者会选择不同的行为来提高自身收益，此时的状态就是纳什均衡。这里给出最佳响应函数的定义：

{BR}_{i} (B_{- i}) = \arg \max_{b_{i}} π_{i} (B_{- i} \cup {b_{i}}) - - - (18)

集合

在满足(19)式时为纳什均衡解的集合：

b_{i}^{*} = {BR}_{i} (B_{- i}^{*}) &ForAll; i - - - (19)

表示次用户j的最佳策略(j≠i)。分析式(8)可知，效用函数是连续函数，从数学角度出发，为了得到效用的最大值，必须求解方程：

\frac{&PartialD; R_{i}}{&PartialD; b_{i}} = \frac{f_{i} k_{i} B_{tot} (Σ_{j &NotEqual; i} b_{j} + δ)}{{(Σ_{j &Element; I} b_{j} + δ)}^{2} s_{i}} - {ps}_{i} - \frac{Σ_{j &NotEqual; i} t_{j}}{θ_{i}} = 0 - - - (20)

即：

b_{i} = \sqrt{\frac{f_{i} k_{i} B_{tot} (Σ_{j &NotEqual; i} b_{j} + δ)}{{ps}_{i} + Σ_{j &NotEqual; i} t_{j}}} - (Σ_{j &NotEqual; i} b_{j} + δ) - - - (21)

对于次用户i，给定了次用户j的策略(j≠i)B_-i＝{b_j|j＝1，...，N；j≠i}，根据式(21)就可得到次用户i的最佳响应函数，以同样的方法求出每个次用户的最佳响应函数，根据式(19)就可得到纳什均衡解的集合。

本发明从静态博弈和动态博弈两个角度去设计频谱分配算法。

1)静态博弈算法

静态博弈是参与者同时进行策略的选择，在每次进行策略选择的时候每个参与者选择的策略是可被其他参与者得知的。

根据式(13)，频谱博弈模型是：

b_{i} = \sqrt{\frac{f_{i} k_{i} B_{tot} (Σ_{j &NotEqual; i} b_{j} (t) + δ)}{{ps}_{i} + Σ_{j &NotEqual; i} t_{j}}} - (Σ_{j &NotEqual; i} b_{j} (t) + δ), &ForAll; i = 1, . . ., N, t &GreaterEqual; 0 - - - (22)

由式(22)可分别求出每个次用户的频谱最佳响应函数，可以画出这些函数的轨迹，所有轨迹的交点就是博弈的纳什均衡点。

假设N＝2，以次用户1为例，其频谱最佳响应函数具体求解过程如下：

(1)当t＝0时，为次用户i设定初始频谱b_i(t)，并设定授权给主用户的频谱大小为total；

(2)当t＝t+1时，令b₂(t+1)＝b₂(t)+Δ(Δ为迭代精度)，代入式(22)求出b₁(t+1)；

(3)判断b₂(t+1)与total的关系，若b₂(t+1)＝total则算法结束，否则返回步骤(2)继续执行。

2)动态博弈算法

在实际的认知无线电环境中，次用户可能只会从主用户那得到价格信息，其它次用户的决策和收益无法得知。因此，只能依靠与主用户的交互来得到次用户的纳什均衡解，所有次用户在最大化收益的过程中都是理性的，能根据边际效用函数即

调整共享的频谱b_i，此时频谱博弈模型如下：

b_{i} (t + 1) = b_{i} (t) + α_{i} b_{i} (t) \frac{&PartialD; R_{i}}{&PartialD; b_{i} (t)} - - - (23)

b_i(t)表示t时刻的次用户i分配的频谱大小，α_i是次用户i的收敛速度调整参数(也就是学习因子)。从模型中可以看出频谱是动态分配的，某一时刻次用户只能与主用户通信并知晓前一时刻其他次用户的部分信息，对当前时刻其他次用户的信息无法得知。因为该博弈是随时间不断迭代且每次迭代的博弈方法相同，因此又称为重复博弈。

将公式(20)代入式(23)，博弈模型可以表示成：

b_{i} (t + 1) = b_{i} (t) + v_{i} b_{i} (t) (f_{i} k_{i} B_{tot} (\frac{Σ_{j &NotEqual; i} b_{j} + δ}{{Σ_{j &Element; I} b_{j})}^{2}}) - {ps}_{i} - Σ_{j &NotEqual; i} t_{j}) - - - (24)

频谱分配的具体实现过程如下：

(2)当t＝t+1时，根据式(24)求出b_i(t+1)；

(3)若

则算法结束，所得的频谱b_i(t)即为求得的最佳频谱组合；

若

判断b_i(t+1)与b_i(t)：若b_i(t+1)＝b_i(t)，则算法结束，所得的频谱b_i(t)即为求得的最佳频谱组合；否则返回步骤(2)继续执行。

Claims

1.一种认知无线电系统中基于拍卖理论和补偿激励的频谱共享方法，其特征在于该方法结合经济学中的拍卖模型和补偿激励机制，建立了一个包含有谈判和协商环节在内的扩展式非合作博弈模型，在非合作博弈的框架内讨论次用户间的合作关系，通过特定的协调策略进行博弈，此外，由于本方法采用的是拍卖模型，所以主用户可以采用预留措施来避免自己性能的下降，具体的方法为：

b、频谱拍卖规则：将主次用户频谱共享问题看作是一个主用户拍卖频谱，次用户投标问题，每个次用户都知道自己所投标后获得的单位传输速率的回报率f_i，同时每个次用户也可计算得到自身的频谱利用率k=log₂(1+Kγ)，其中γ为信噪比，

BER^tar为目标误比特率；在拍卖开始之前，主用户将公开其保留标底δ以及对单位频谱的定价p，为了保证自身性能不受到频谱共享的影响而恶化，主用户将根据次用户所提供的竞投拍卖标和自己的保留标底拍给次用户相应的频谱其中I为次用户数目，B_tot为主用户总的的频谱，b_i为次用户i提供的竞购拍卖标，这个竞购拍卖标反应了次用户用于信息传输所需最大频谱数；次用户将支付主用户相应的报酬Q_i(b_i,p)=ps_ib_i，其中s_i是各个次用户独立的优先级参数，这种支付差异类似于经济学中的价格歧视；此外，由于这种拍卖模型的特殊性，对次用户采取预付机制，即它所支付给主用户的报酬为它投标的总频谱数价格，而并非主用户拍卖给它的总频谱数价格；定义所有次用户的投标集合为b=(b₁,...,b_I)，次用户i的竞争对手的投标集合定义为b_-i=(b₁,...,b_i-1,b_i+1,...,b_I)，故而b=(b_i;b_-i)；由于拍卖规则的限定，投标集合必须满足条件

b &Element; b_{R} \overset{Δ}{=} {b | 0 \leq b_{i} \leq B_{tot}, &ForAll; i &Element; I};

c、建立博弈模型：博弈分为两个阶段，第一是合作协调阶段，第二是市场竞争阶段；合作协调阶段的第1步，次用户间按照补偿激励原则建立起合作关系，次用户约定互相从对方

的产出中获取补偿利润，用t_i表示第i个次用户向对方索取的利润补偿率，这里的t_i为博弈第一阶段双方合作协调的策略变量，次用户i的效用函数可表示为：

R_{i} (b_{i}; b_{- i}, p) = f_{i} k_{i} B_{i} - Q_{i} (b_{i}, p) + t_{i} Σ_{j &NotEqual; i} b_{i} + \frac{1}{2} Σ_{j &NotEqual; i} t_{j}^{2} - Σ_{j &NotEqual; i} t_{j} b_{i} - \frac{1}{2} t_{i}^{2}

d、计算价格取值范围：当

b^*即为投标者的最优策略，定义次用户i的最佳反应函数为

V (b_{- i}, p) = {b_{i} | b_{i} = \arg \max_{b &Element; b_{R}} R_{i} (b_{i}; b_{- i}, p)},

根据效用最大化条件，得到

\frac{{&PartialD; R}_{i}}{{&PartialD; b}_{i}} = 0 = \frac{f_{i} k_{i} B_{tot} (Σ_{j &NotEqual; i} b_{j} + δ)}{{(Σ_{j &Element; I} b_{j} + δ)}^{2} s_{i}} - {ps}_{i} - \frac{Σ_{j &NotEqual; i} t_{j}}{s_{i}},

R_i是b_i和∑_j≠ib_j的下降函数，所以主用户对次用户收取的频谱单价存在两个极端价格，即对应于次用户频谱策略取到最小和最大时的两个价格值，可以推导得到两个极端价格如下：

\underset{&OverBar;}{p_{i}} \overset{Δ}{=} \frac{\min_{b &Element; b_{R}} \frac{{&PartialD; R}_{i}}{{&PartialD; b}_{i}}}{s_{i}} = \frac{f_{i} k_{i} B_{tot} ((I - 1) B_{tot} + δ)}{{({IB}_{tot} + δ)}^{2} s_{i}} - \frac{Σ_{j &NotEqual; i} t_{j}}{s_{i}} (b_{i} = B_{tot})

{\overset{&OverBar;}{p}}_{i} \overset{Δ}{=} \frac{\max_{b &Element; b_{R}} \frac{{&PartialD; R}_{i}}{{&PartialD; b}_{i}}}{s_{i}} = \frac{f_{i} k_{i} B_{tot}}{{δs}_{i}} - \frac{Σ_{j &NotEqual; i} t_{j}}{s_{i}} (b_{i} = 0)

因此一个合理的价格必须是介于这两个极端价格之间，所以在价格设定程序中，主用户通过收集次用户的有效信息（f_i,k_i,s_i,I）来计算这两个极端价格；

e、计算次用户共享的频谱数：定义B_-i={b_j|j=1,...,I;j≠i}表示除次用户i外的其它次用户的策略集合，这样对于某个次用户来说，分配的频谱数与其它次用户的决策有关，B＝B_-i∪{b_i}表示所有用户的策略集合；在给定其他参与者的行为时，没有任何参与者会选择不同的行为来提高自身收益，此时的状态就是纳什均衡，最佳响应函数定义为

{BR}_{i} (B_{- i}) = \arg \max_{b_{i}} R_{i} (B_{- i} \cup {b_{i}}),

集合

B^{*} = {b_{1}^{*}, . . ., b_{I}^{*}}

在满足

时为纳什均衡解的集合，表示次用户j的最佳策略，j≠i；为了得到效用的最大值，求解方程

\frac{{&PartialD; R}_{i}}{{&PartialD; b}_{i}} = \frac{f_{i} k_{i} B_{tot} (Σ_{j &NotEqual; i} b_{i} + δ)}{{(Σ_{j &Element; I} b_{i} + δ)}^{2} s_{i}} - {ps}_{i} - \frac{Σ_{j &NotEqual; i} t_{j}}{s_{i}} = 0,

即

b_{i} = \sqrt{\frac{f_{i} k_{i} B_{tot} (Σ_{j &NotEqual; i} b_{j} + δ)}{{ps}_{i} + Σ_{j &NotEqual; i} t_{j}}} - (Σ_{j &NotEqual; i} b_{j} + δ)

对于次用户i，给定了次用户j的策略，B_-i={b_j|j=1,...,I;j≠i}，根据上式就可得到次用户i的最佳共享频谱，以同样的方法可以求出每个次用户的最佳共享频谱。