1.基于非合作博弈的分布式超密集异构网络干扰协调方法,其特征在于,包括如下步骤:
步骤一,采集网络信息,初始化参数
采集网络中的宏站数目M、小站数目N和用户数目U,宏站分布在中心位置,感知小区随机分布在宏站周围,感知小区具有感知和发现周围环境的能力,能够根据过去的信息作出相应的决策,能够调整接入的信道,发射功率,小区处于动态开关状态中,能够根据服务的用户数目调整开关状态,能够服务多个用户,同时会由于小区内用户业务类型的变化调整自身的速率请求;假设小区i的可选RB集合为Si,初始选择的RB集合为si(0),在第0时隙,各个小区在其可选RB集合中随机选择RB集合;
步骤二,采集信道信息
小区用户采用最大参考信号接收功率准则接入小区,小区基站j到小区基站i服务的用户ei之间的信道增益近似为两小区基站i,j之间的信道增益,即由此将网络中小区基站间即用户间的信道增益对称化,即
步骤三,小区干扰信息初始化
根据步骤二采集的信道信息,通过下式计算小区n在RBi上受到的网络干扰:
<mrow>
<msubsup>
<mi>I</mi>
<mi>n</mi>
<mi>i</mi>
</msubsup>
<mo>=</mo>
<munder>
<mo>&Sigma;</mo>
<mrow>
<mo>&ForAll;</mo>
<mi>m</mi>
<mo>&Element;</mo>
<mi>N</mi>
<mo>/</mo>
<mo>{</mo>
<mi>n</mi>
<mo>}</mo>
</mrow>
</munder>
<msubsup>
<mi>p</mi>
<mi>m</mi>
<mi>i</mi>
</msubsup>
<msubsup>
<mi>h</mi>
<mrow>
<mi>n</mi>
<mi>m</mi>
</mrow>
<mi>i</mi>
</msubsup>
<msubsup>
<mi>&delta;</mi>
<mrow>
<mi>m</mi>
<mi>n</mi>
</mrow>
<mi>i</mi>
</msubsup>
<mo>+</mo>
<msup>
<mi>&sigma;</mi>
<mn>2</mn>
</msup>
<mo>-</mo>
<mo>-</mo>
<mo>-</mo>
<mrow>
<mo>(</mo>
<mn>1</mn>
<mo>)</mo>
</mrow>
</mrow>
其中,表示小区m在RBi上的发射功率,σ2表示白噪声功率,N/{n}表示小区集合N中除了小区n以外的所有小区,为干扰系数,其表示如下:
<mrow>
<msubsup>
<mi>&delta;</mi>
<mrow>
<mi>n</mi>
<mi>m</mi>
</mrow>
<mi>i</mi>
</msubsup>
<mo>=</mo>
<mfenced open = "{" close = "">
<mtable>
<mtr>
<mtd>
<mrow>
<mn>1</mn>
<mo>,</mo>
</mrow>
</mtd>
<mtd>
<mrow>
<msubsup>
<mi>s</mi>
<mi>n</mi>
<mi>i</mi>
</msubsup>
<mo>=</mo>
<msubsup>
<mi>s</mi>
<mi>m</mi>
<mi>i</mi>
</msubsup>
</mrow>
</mtd>
</mtr>
<mtr>
<mtd>
<mrow>
<mn>0</mn>
<mo>,</mo>
</mrow>
</mtd>
<mtd>
<mrow>
<mi>o</mi>
<mi>t</mi>
<mi>h</mi>
<mi>e</mi>
<mi>r</mi>
<mi>w</mi>
<mi>i</mi>
<mi>s</mi>
<mi>e</mi>
</mrow>
</mtd>
</mtr>
</mtable>
</mfenced>
<mo>-</mo>
<mo>-</mo>
<mo>-</mo>
<mrow>
<mo>(</mo>
<mn>2</mn>
<mo>)</mo>
</mrow>
</mrow>
其中,sn表示小区n最终使用的RB集合,表示小区n使用的RB集合sn中的第i个RB,当小区n与小区m使用相同的RBi时,为1,否则为0;
步骤四,小区总速率计算
假设RB带宽为B,则小区n在RBi上的速率由香农公式计算,表示如下:
<mrow>
<msubsup>
<mi>r</mi>
<mi>n</mi>
<mi>i</mi>
</msubsup>
<mo>=</mo>
<mi>B</mi>
<mi> </mi>
<msub>
<mi>log</mi>
<mn>2</mn>
</msub>
<mrow>
<mo>(</mo>
<mn>1</mn>
<mo>+</mo>
<mfrac>
<mrow>
<msubsup>
<mi>ph</mi>
<mi>n</mi>
<mi>i</mi>
</msubsup>
</mrow>
<mrow>
<munder>
<mo>&Sigma;</mo>
<mrow>
<mo>&ForAll;</mo>
<mi>m</mi>
<mo>&Element;</mo>
<mi>N</mi>
<mo>/</mo>
<mo>{</mo>
<mi>n</mi>
<mo>}</mo>
</mrow>
</munder>
<msubsup>
<mi>ph</mi>
<mrow>
<mi>n</mi>
<mi>m</mi>
</mrow>
<mi>i</mi>
</msubsup>
<msubsup>
<mi>&delta;</mi>
<mrow>
<mi>n</mi>
<mi>m</mi>
</mrow>
<mi>i</mi>
</msubsup>
<mo>+</mo>
<msup>
<mi>&sigma;</mi>
<mn>2</mn>
</msup>
</mrow>
</mfrac>
<mo>)</mo>
</mrow>
<mo>-</mo>
<mo>-</mo>
<mo>-</mo>
<mrow>
<mo>(</mo>
<mn>3</mn>
<mo>)</mo>
</mrow>
</mrow>
网络中所有的小区RB选择表示为(sn,s-n),其中s-n表示除了小区n外其他小区的RB选择,则小区n的总速率利用其表示为:
<mrow>
<msub>
<mi>r</mi>
<mi>n</mi>
</msub>
<mrow>
<mo>(</mo>
<msub>
<mi>s</mi>
<mi>n</mi>
</msub>
<mo>,</mo>
<msub>
<mi>s</mi>
<mrow>
<mo>-</mo>
<mi>n</mi>
</mrow>
</msub>
<mo>)</mo>
</mrow>
<mo>=</mo>
<munder>
<mo>&Sigma;</mo>
<mrow>
<mo>&ForAll;</mo>
<mi>i</mi>
<mo>&Element;</mo>
<msub>
<mi>s</mi>
<mi>n</mi>
</msub>
</mrow>
</munder>
<msubsup>
<mi>r</mi>
<mi>n</mi>
<mi>i</mi>
</msubsup>
<mrow>
<mo>(</mo>
<msub>
<mi>s</mi>
<mi>n</mi>
</msub>
<mo>,</mo>
<msub>
<mi>s</mi>
<mrow>
<mo>-</mo>
<mi>n</mi>
</mrow>
</msub>
<mo>)</mo>
</mrow>
<mo>-</mo>
<mo>-</mo>
<mo>-</mo>
<mrow>
<mo>(</mo>
<mn>4</mn>
<mo>)</mo>
</mrow>
</mrow>
步骤五,问题建模
基于在超密集感知网中,每个小区选择RB的原则:选择使自身受到的干扰最小的RB集合,达到最大化自身速率;将小区n受到的干扰表示为:
<mrow>
<msub>
<mi>I</mi>
<mi>n</mi>
</msub>
<mrow>
<mo>(</mo>
<msub>
<mi>s</mi>
<mi>n</mi>
</msub>
<mo>,</mo>
<msub>
<mi>s</mi>
<mrow>
<mo>-</mo>
<mi>n</mi>
</mrow>
</msub>
<mo>)</mo>
</mrow>
<mo>=</mo>
<munder>
<mo>&Sigma;</mo>
<mrow>
<mo>&ForAll;</mo>
<mi>m</mi>
<mo>&Element;</mo>
<mi>N</mi>
<mo>/</mo>
<mo>{</mo>
<mi>n</mi>
<mo>}</mo>
</mrow>
</munder>
<munder>
<mo>&Sigma;</mo>
<mrow>
<mo>&ForAll;</mo>
<mi>i</mi>
<mo>&Element;</mo>
<msub>
<mi>s</mi>
<mi>n</mi>
</msub>
</mrow>
</munder>
<msub>
<mi>p</mi>
<mi>m</mi>
</msub>
<msubsup>
<mi>h</mi>
<mrow>
<mi>m</mi>
<mi>n</mi>
</mrow>
<mi>i</mi>
</msubsup>
<msubsup>
<mi>&delta;</mi>
<mrow>
<mi>m</mi>
<mi>n</mi>
</mrow>
<mi>i</mi>
</msubsup>
<mo>-</mo>
<mo>-</mo>
<mo>-</mo>
<mrow>
<mo>(</mo>
<mn>5</mn>
<mo>)</mo>
</mrow>
</mrow>
1
整个网络的干扰表示为:
<mrow>
<mi>I</mi>
<mo>=</mo>
<munder>
<mo>&Sigma;</mo>
<mrow>
<mo>&ForAll;</mo>
<mi>n</mi>
<mo>&Element;</mo>
<mi>N</mi>
</mrow>
</munder>
<msub>
<mi>I</mi>
<mi>n</mi>
</msub>
<mrow>
<mo>(</mo>
<msub>
<mi>s</mi>
<mi>n</mi>
</msub>
<mo>,</mo>
<msub>
<mi>s</mi>
<mrow>
<mo>-</mo>
<mi>n</mi>
</mrow>
</msub>
<mo>)</mo>
</mrow>
<mo>-</mo>
<mo>-</mo>
<mo>-</mo>
<mrow>
<mo>(</mo>
<mn>6</mn>
<mo>)</mo>
</mrow>
</mrow>
定义本方法的效用函数为:
<mrow>
<mtable>
<mtr>
<mtd>
<mrow>
<msub>
<mi>u</mi>
<mi>n</mi>
</msub>
<mrow>
<mo>(</mo>
<msub>
<mi>s</mi>
<mi>n</mi>
</msub>
<mo>,</mo>
<msub>
<mi>s</mi>
<mrow>
<mo>-</mo>
<mi>n</mi>
</mrow>
</msub>
<mo>)</mo>
</mrow>
<mo>=</mo>
<mo>-</mo>
<msub>
<mi>p</mi>
<mi>n</mi>
</msub>
<msub>
<mi>I</mi>
<mi>n</mi>
</msub>
<mrow>
<mo>(</mo>
<msub>
<mi>s</mi>
<mi>n</mi>
</msub>
<mo>,</mo>
<msub>
<mi>s</mi>
<mrow>
<mo>-</mo>
<mi>n</mi>
</mrow>
</msub>
<mo>)</mo>
</mrow>
</mrow>
</mtd>
</mtr>
<mtr>
<mtd>
<mrow>
<mo>=</mo>
<mo>-</mo>
<msub>
<mi>p</mi>
<mi>n</mi>
</msub>
<munder>
<mo>&Sigma;</mo>
<mrow>
<mo>&ForAll;</mo>
<mi>m</mi>
<mo>&Element;</mo>
<mi>N</mi>
<mo>/</mo>
<mo>{</mo>
<mi>n</mi>
<mo>}</mo>
</mrow>
</munder>
<munder>
<mo>&Sigma;</mo>
<mrow>
<mo>&ForAll;</mo>
<mi>i</mi>
<mo>&Element;</mo>
<msub>
<mi>s</mi>
<mi>n</mi>
</msub>
</mrow>
</munder>
<msub>
<mi>p</mi>
<mi>m</mi>
</msub>
<msubsup>
<mi>h</mi>
<mrow>
<mi>m</mi>
<mi>n</mi>
</mrow>
<mi>i</mi>
</msubsup>
<msubsup>
<mi>&delta;</mi>
<mrow>
<mi>m</mi>
<mi>n</mi>
</mrow>
<mi>i</mi>
</msubsup>
</mrow>
</mtd>
</mtr>
</mtable>
<mo>-</mo>
<mo>-</mo>
<mo>-</mo>
<mrow>
<mo>(</mo>
<mn>7</mn>
<mo>)</mo>
</mrow>
</mrow>
根据非合作博弈模型定义,本方法的问题建模为参与者为N个小区,Sn为小区n的策略集合,un(sn,s-n)为小区n的效用函数,非合作博弈问题建模具体表示如下:
Subject to:
C1:
C2:
C3:
其中,限制条件C1表示小区m和小区n只能同时使用相同的RB或者不使用相同的RB,限制条件C2表示RB上的功率必须大于0,限制条件C3表示每个小区有速率请求,rre,n为小区n请求速率;
步骤六,在第t时隙,小区i根据式(7)计算当前选择策略的效用函数ui(si(t),s-i(t)),其中si(t)为第t时隙小区i选择的RB集合;
步骤七,更新t时隙的置信矩阵的大小为|si(t)|×|si(t)|,其中:
<mrow>
<msubsup>
<mi>Q</mi>
<mi>i</mi>
<mi>t</mi>
</msubsup>
<mrow>
<mo>(</mo>
<msub>
<mi>a</mi>
<mi>i</mi>
</msub>
<mo>(</mo>
<mi>t</mi>
<mo>)</mo>
<mo>,</mo>
<msubsup>
<mi>a</mi>
<mi>i</mi>
<mo>&prime;</mo>
</msubsup>
<mo>(</mo>
<mi>t</mi>
<mo>)</mo>
<mo>)</mo>
</mrow>
<mo>=</mo>
<mi>&delta;</mi>
<mrow>
<mo>(</mo>
<msub>
<mi>a</mi>
<mi>i</mi>
</msub>
<mo>(</mo>
<mi>t</mi>
<mo>)</mo>
<mo>&Element;</mo>
<msub>
<mi>s</mi>
<mi>i</mi>
</msub>
<mo>(</mo>
<mi>t</mi>
<mo>)</mo>
<mo>)</mo>
</mrow>
<mrow>
<mo>(</mo>
<msub>
<mover>
<mi>u</mi>
<mo>^</mo>
</mover>
<mi>i</mi>
</msub>
<mo>(</mo>
<mrow>
<msubsup>
<mi>a</mi>
<mi>i</mi>
<mo>&prime;</mo>
</msubsup>
<mrow>
<mo>(</mo>
<mi>t</mi>
<mo>)</mo>
</mrow>
<mo>,</mo>
<msub>
<mi>s</mi>
<mrow>
<mo>-</mo>
<mi>i</mi>
</mrow>
</msub>
<mrow>
<mo>(</mo>
<mi>t</mi>
<mo>)</mo>
</mrow>
</mrow>
<mo>)</mo>
<mo>-</mo>
<msub>
<mover>
<mi>u</mi>
<mo>^</mo>
</mover>
<mi>i</mi>
</msub>
<mo>(</mo>
<mrow>
<msub>
<mi>a</mi>
<mi>i</mi>
</msub>
<mrow>
<mo>(</mo>
<mi>t</mi>
<mo>)</mo>
</mrow>
<mo>,</mo>
<msub>
<mi>s</mi>
<mrow>
<mo>-</mo>
<mi>i</mi>
</mrow>
</msub>
<mrow>
<mo>(</mo>
<mi>t</mi>
<mo>)</mo>
</mrow>
</mrow>
<mo>)</mo>
<mo>)</mo>
</mrow>
<mo>-</mo>
<mo>-</mo>
<mo>-</mo>
<mrow>
<mo>(</mo>
<mn>12</mn>
<mo>)</mo>
</mrow>
</mrow>
其中,ai(t)表示在t时隙小区i选择的RB集合si(t)中的一个RB,而a'i(t)表示不在si(t)中的一个RB,置信矩阵反映的是选择其它RB所带来的效用函数的变化,即收益的改变,置信矩阵中非零元素的个数完全由t时隙的RB选择策略si(t)决定;
步骤八,更新矩阵及矩阵:
<mrow>
<msubsup>
<mi>D</mi>
<mi>i</mi>
<mi>t</mi>
</msubsup>
<mrow>
<mo>(</mo>
<msub>
<mi>a</mi>
<mi>i</mi>
</msub>
<mo>(</mo>
<mi>t</mi>
<mo>)</mo>
<mo>,</mo>
<msubsup>
<mi>a</mi>
<mi>i</mi>
<mo>&prime;</mo>
</msubsup>
<mo>(</mo>
<mi>t</mi>
<mo>)</mo>
<mo>)</mo>
</mrow>
<mo>=</mo>
<msubsup>
<mi>D</mi>
<mi>i</mi>
<mrow>
<mi>t</mi>
<mo>-</mo>
<mn>1</mn>
</mrow>
</msubsup>
<mrow>
<mo>(</mo>
<msub>
<mi>a</mi>
<mi>i</mi>
</msub>
<mo>(</mo>
<mi>t</mi>
<mo>)</mo>
<mo>,</mo>
<msubsup>
<mi>a</mi>
<mi>i</mi>
<mo>&prime;</mo>
</msubsup>
<mo>(</mo>
<mi>t</mi>
<mo>)</mo>
<mo>)</mo>
</mrow>
<mo>+</mo>
<msup>
<mi>&epsiv;</mi>
<mi>t</mi>
</msup>
<mrow>
<mo>(</mo>
<msubsup>
<mi>Q</mi>
<mi>i</mi>
<mi>t</mi>
</msubsup>
<mo>(</mo>
<mrow>
<msub>
<mi>a</mi>
<mi>i</mi>
</msub>
<mrow>
<mo>(</mo>
<mi>t</mi>
<mo>)</mo>
</mrow>
<mo>,</mo>
<msubsup>
<mi>a</mi>
<mi>i</mi>
<mo>&prime;</mo>
</msubsup>
<mrow>
<mo>(</mo>
<mi>t</mi>
<mo>)</mo>
</mrow>
</mrow>
<mo>)</mo>
<mo>-</mo>
<msubsup>
<mi>D</mi>
<mi>i</mi>
<mrow>
<mi>t</mi>
<mo>-</mo>
<mn>1</mn>
</mrow>
</msubsup>
<mo>(</mo>
<mrow>
<msub>
<mi>a</mi>
<mi>i</mi>
</msub>
<mrow>
<mo>(</mo>
<mi>t</mi>
<mo>)</mo>
</mrow>
<mo>,</mo>
<msubsup>
<mi>a</mi>
<mi>i</mi>
<mo>&prime;</mo>
</msubsup>
<mrow>
<mo>(</mo>
<mi>t</mi>
<mo>)</mo>
</mrow>
</mrow>
<mo>)</mo>
<mo>)</mo>
</mrow>
<mo>-</mo>
<mo>-</mo>
<mo>-</mo>
<mrow>
<mo>(</mo>
<mn>13</mn>
<mo>)</mo>
</mrow>
</mrow>
<mrow>
<msubsup>
<mi>R</mi>
<mi>i</mi>
<mi>t</mi>
</msubsup>
<mrow>
<mo>(</mo>
<msub>
<mi>a</mi>
<mi>i</mi>
</msub>
<mo>(</mo>
<mi>t</mi>
<mo>)</mo>
<mo>,</mo>
<msubsup>
<mi>a</mi>
<mi>i</mi>
<mo>&prime;</mo>
</msubsup>
<mo>(</mo>
<mi>t</mi>
<mo>)</mo>
<mo>)</mo>
</mrow>
<mo>=</mo>
<msup>
<mrow>
<mo>&lsqb;</mo>
<msubsup>
<mi>D</mi>
<mi>i</mi>
<mi>t</mi>
</msubsup>
<mrow>
<mo>(</mo>
<msub>
<mi>a</mi>
<mi>i</mi>
</msub>
<mo>(</mo>
<mi>t</mi>
<mo>)</mo>
<mo>,</mo>
<msubsup>
<mi>a</mi>
<mi>i</mi>
<mo>&prime;</mo>
</msubsup>
<mo>(</mo>
<mi>t</mi>
<mo>)</mo>
<mo>)</mo>
</mrow>
<mo>&rsqb;</mo>
</mrow>
<mo>+</mo>
</msup>
<mo>=</mo>
<mi>max</mi>
<mo>{</mo>
<msubsup>
<mi>D</mi>
<mi>i</mi>
<mi>t</mi>
</msubsup>
<mrow>
<mo>(</mo>
<msub>
<mi>a</mi>
<mi>i</mi>
</msub>
<mo>(</mo>
<mi>t</mi>
<mo>)</mo>
<mo>,</mo>
<msubsup>
<mi>a</mi>
<mi>i</mi>
<mo>&prime;</mo>
</msubsup>
<mo>(</mo>
<mi>t</mi>
<mo>)</mo>
<mo>)</mo>
</mrow>
<mo>,</mo>
<mn>0</mn>
<mo>}</mo>
<mo>-</mo>
<mo>-</mo>
<mo>-</mo>
<mrow>
<mo>(</mo>
<mn>14</mn>
<mo>)</mo>
</mrow>
</mrow>
其中,为辅助矩阵,为平均置信矩阵,εt=1/(t+1)表示每一次迭代步长;
步骤九,更新选择概率矩阵同时决定t+1时隙的选择策略;
<mrow>
<msubsup>
<mi>P</mi>
<mi>i</mi>
<mrow>
<mi>t</mi>
<mo>+</mo>
<mn>1</mn>
</mrow>
</msubsup>
<mrow>
<mo>(</mo>
<msubsup>
<mi>a</mi>
<mi>i</mi>
<mo>&prime;</mo>
</msubsup>
<mo>(</mo>
<mi>t</mi>
<mo>)</mo>
<mo>)</mo>
</mrow>
<mo>=</mo>
<mfrac>
<mn>1</mn>
<mi>&mu;</mi>
</mfrac>
<msubsup>
<mi>R</mi>
<mi>i</mi>
<mi>t</mi>
</msubsup>
<mrow>
<mo>(</mo>
<msub>
<mi>a</mi>
<mi>i</mi>
</msub>
<mo>(</mo>
<mi>t</mi>
<mo>)</mo>
<mo>,</mo>
<msubsup>
<mi>a</mi>
<mi>i</mi>
<mo>&prime;</mo>
</msubsup>
<mo>(</mo>
<mi>t</mi>
<mo>)</mo>
<mo>)</mo>
</mrow>
<mo>,</mo>
<mo>&ForAll;</mo>
<msubsup>
<mi>a</mi>
<mi>i</mi>
<mo>&prime;</mo>
</msubsup>
<mrow>
<mo>(</mo>
<mi>t</mi>
<mo>)</mo>
</mrow>
<mo>&NotElement;</mo>
<msub>
<mi>s</mi>
<mi>i</mi>
</msub>
<mrow>
<mo>(</mo>
<mi>t</mi>
<mo>)</mo>
</mrow>
<mo>-</mo>
<mo>-</mo>
<mo>-</mo>
<mrow>
<mo>(</mo>
<mn>15</mn>
<mo>)</mo>
</mrow>
</mrow>
<mrow>
<msubsup>
<mi>P</mi>
<mi>i</mi>
<mrow>
<mi>t</mi>
<mo>+</mo>
<mn>1</mn>
</mrow>
</msubsup>
<mrow>
<mo>(</mo>
<msub>
<mi>a</mi>
<mi>i</mi>
</msub>
<mo>(</mo>
<mi>t</mi>
<mo>)</mo>
<mo>)</mo>
</mrow>
<mo>=</mo>
<mn>1</mn>
<mo>-</mo>
<munder>
<mo>&Sigma;</mo>
<mrow>
<mo>&ForAll;</mo>
<msubsup>
<mi>a</mi>
<mi>i</mi>
<mo>&prime;</mo>
</msubsup>
<mrow>
<mo>(</mo>
<mi>t</mi>
<mo>)</mo>
</mrow>
<mo>&NotElement;</mo>
<msub>
<mi>s</mi>
<mi>i</mi>
</msub>
<mrow>
<mo>(</mo>
<mi>t</mi>
<mo>)</mo>
</mrow>
</mrow>
</munder>
<msubsup>
<mi>P</mi>
<mi>i</mi>
<mrow>
<mi>t</mi>
<mo>+</mo>
<mn>1</mn>
</mrow>
</msubsup>
<mrow>
<mo>(</mo>
<msubsup>
<mi>a</mi>
<mi>i</mi>
<mo>&prime;</mo>
</msubsup>
<mo>(</mo>
<mi>t</mi>
<mo>)</mo>
<mo>)</mo>
</mrow>
<mo>-</mo>
<mo>-</mo>
<mo>-</mo>
<mrow>
<mo>(</mo>
<mn>16</mn>
<mo>)</mo>
</mrow>
</mrow>
其中,μ为归一化系数,选择概率矩阵描述的是在下一时刻t+1选择各个RB的概率大小,小区i选择中概率最大的那个RB,根据式(3)计算当前的速率若不满足小区速率请求rre,i,即则继续选择中概率次大的那个RB,直到此时选出来的RB集合即为时刻RB选择策略集合;
步骤十,循环步骤第六步至第八步,直到所有小区的RB选择集合不再变化,或达到预设的迭代次数门限。