CN102833812B - 一种面向混合业务的无线传感器网络能量有效接入方法 - Google Patents

一种面向混合业务的无线传感器网络能量有效接入方法 Download PDF

Info

Publication number
CN102833812B
CN102833812B CN201210318942.5A CN201210318942A CN102833812B CN 102833812 B CN102833812 B CN 102833812B CN 201210318942 A CN201210318942 A CN 201210318942A CN 102833812 B CN102833812 B CN 102833812B
Authority
CN
China
Prior art keywords
state
node
sleep
nrt
time
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201210318942.5A
Other languages
English (en)
Other versions
CN102833812A (zh
Inventor
张钦宇
王亚松
李云鹤
林威
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Graduate School Harbin Institute of Technology
Original Assignee
Shenzhen Graduate School Harbin Institute of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Graduate School Harbin Institute of Technology filed Critical Shenzhen Graduate School Harbin Institute of Technology
Priority to CN201210318942.5A priority Critical patent/CN102833812B/zh
Publication of CN102833812A publication Critical patent/CN102833812A/zh
Application granted granted Critical
Publication of CN102833812B publication Critical patent/CN102833812B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D30/00Reducing energy consumption in communication networks
    • Y02D30/70Reducing energy consumption in communication networks in wireless communication networks

Landscapes

  • Mobile Radio Communication Systems (AREA)

Abstract

本发明提供了一种面向混合业务的无线传感器网络能量有效接入方法,在一个有限区域内,无线传感器网络中共有N个可用信道,网络中有实时业务节点RT和非实时业务节点NRT,其中RT节点对信道的使用具有绝对的优先级,即可以随机接入没有被其他RT节点占用的信道,当NRT被RT数据抢占时,退出当前传输的信道,进入睡眠状态,等待下一次接入。本申请在实时业务和非实时业务共同存在的混合网络下,获得非实时业务的最优睡眠时间,使得网络节点的能量效率最大化。

Description

一种面向混合业务的无线传感器网络能量有效接入方法
技术领域
本发明涉及无线传感器网络,无线Internet网络以及无线局域网等相关技术领域。
背景技术
近年来,无线传感器网络发展迅速,受到了学术界和工业界的广泛关注。一个典型的无线传感器网络由部署在一定地理区域范围内的传感器节点构成,主要用于监测物理现象如温度、湿度、火灾以及地震。一个无线传感器网络节点通常由三个部分组成:一个感知子系统,用于捕获外界环境的变化信息;一个信息处理子系统,用于对本地数据的处理与存储;以及一个通信子系统,主要用于数据的传输与接收。除此之外,传感器节点还需要一个功率源来提供设备运行所需要的能量。该功率源通常是一个有限供电能力的电池。由于无线传感常常部署在恶劣的地理位置或者敌对环境中,对其进行重新充电非常困难。但是,大部分的应用都要求无线传感器网络具有一个足够长的生命周期(天,月等)。因此,在能量有限的条件下,如何尽可能的延长网络的生命周期成为设计无线传感器网络的关键问题。
根据网络结构和应用需求的不同,无线传感器网络可以分为周期监测网络和事件驱动网络两种。其中,周期监测网络主要用于完成一些非实时的环境监测任务,如气象监测、地理位置信息采集等;事件驱动网络主要用于完成一些实时性的环境监测任务,反恐安全和入侵防御、灾害监测、设备监控等。由于应用需求不同,其能量有效性的研究方法也不相同。对于周期监测网络,最有效的能量效率提升方式是当没有通信需求时,将传感器节点置于低功率的睡眠状态。理想情况下,传感器节点能够在没有数据发送时,即时切换到睡眠模式,而当有数据发送时,即时切换到通信模式。但是,在实际系统设计中,节点处于睡眠状态,通常假定为不能进行数据接收,并且节点在工作模式转换的过程中,也要产生一定的延迟和能量消耗。因此,如何有效的调度节点睡眠/通信模式之间的转换,成为周期监测网路节能问题的主要研究方向。其中典型的协议有SMAC,该协议通过以虚拟簇为单位周期同步睡眠,延长了节点睡眠时间,减少了节点能耗。随后众多工作在此协议基础上展开,如TMAC同样采用了睡眠机制,不同的是,虽然TMAC中保持了固定的周期长度,但节点监听时间会根据信道情况进行调整,从而改变睡眠时间的长度;PMAC通过网络流量信息自适应地调整睡眠时间;DMAC针对SMAC中存在的睡眠延迟,提出了数据成树形汇聚的通信方式,根据树状结构调整节点睡眠时间。此类方法需要节点周期的进行簇内同步,由同步所带来的额外节点能耗不能忽略,因此在节能方面具有一定局限性。考虑到周期同步开销,第二类方法为异步接入机制,在这种方法中节点只需要监听较短时间来判断是否有数据需要接收。有文献通过延长数据帧中导言的方式,异步接入信道来减少空闲监听。此类接入方式优点在于当有数据传输时,仅仅收发节点需要通过同步通信,其他节点则避免了周期同步开销;缺点在于发送节点需要保持监听状态直到接收节点苏醒才能传输数据,因此增加了发送节点的监听开销和等待时延。
相比较而言,事件驱动网络对数据传输的实时性要求较高,节点需要一直处于环境感知状态,以确保有紧急情况发生时,无线传感器节点能够及时将数据传回sink节点。因此,通常情况下,事件驱动网络具有更高的优先级。已有研究中,提高事件驱动网络能量效率的一种方法是通过能量有效的数据捕获,降低采样数据的样本数。
尽管已有的研究中,对于周期监测网络和事件驱动网络的节能问题都进行了充分的研究。但是仍然很少有工作对于混合业务模式下的网络进行研究。将周期监测网络和事件驱动网络共同部署,可以使无线传感器网络具有更强的环境适应能力并满足更加广泛的应用需求。在本文中,将对混合网络模式下的无线传感器网络进行建模研究,并重点针对的周期监测网络的睡眠机制进行研究。在本文中,无线传感器网络中存在两种不同的网络节点。其中,基于周期监测网络节点主要用于进行环境的常规检测等对传输延迟要求较低的非实时业务,网络节点可以在传输状态、睡眠状态和监听状态之间进行切换;基于事件驱动网络节点主要用于进行突发性的环境事件等对数据传输的延迟敏感的实时性数据业务,且节点始终处于监听状态或者传输状态,同时,实时性业务具有更高的信道使用权限。本申请主要考虑在实时业务和非实时业务共同存在的混合网络下,获得非实时业务的最优睡眠时间,使得网络节点的能量效率最大化。
发明内容
为了解决现有技术中问题,本发明提供了一种面向混合业务的无线传感器网络能量有效接入方法,在一个有限区域内,无线传感器网络中共有N个可用信道,网络中有实时业务节点RT和非实时业务节点NRT,其中RT节点对信道的使用具有绝对的优先级,即可以随机接入没有被其他RT节点占用的信道,当NRT被RT数据抢占时,退出当前传输的信道,进入睡眠状态,等待下一次接入。
作为本发明的进一步改进,实时业务节点和非实时业务节点状态由睡眠、监听和通信状态组成。
作为本发明的进一步改进,所述NRT使用未被RT业务占用的信道。
作为本发明的进一步改进,当节点A有非实时数据需要传输至Sink节点时,首先经过路由协议确定传输路径,然后节点A沿此路径发送数据,在此过程中,数据传输路径上的各个节点在苏醒后进入收发状态,与此同时在收发节点的信号覆盖范围内的节点在获知信道被占用后即刻进入睡眠状态,其余节点保持自身的睡眠或侦听时间。
作为本发明的进一步改进,当NRT被RT数据抢占时,退出当前传输的信道,进入睡眠状态,最优睡眠时间求解如下:
将混合业务的无线传感器网络建模为一个连续时间Markov链模型,其状态转移速率矩阵为Q,状态空间为Ω,稳态概率向量为π,根据连续时间Markov性质可知:
πe=1,Qe=0,πQ=0
根据式 P collision = Σ a = 1 A π a ( j N - i ) / ( 1 - P block ) = Σ a ∈ Ω π a ( j N - i ) / ( 1 - Σ k = 0 M Σ l = 0 M - k π N , 0 , k , l ) 可知,处于状态s时,碰撞概率为:
f p a = P collision = ( j N - i ) / ( 1 - Σ k = 0 M Σ l = 0 M - k π N , 0 , k , l ) , a = ( i , j , k , l ) ∈ Ω
根据式可知,处于状态a时,能量效率的作用
f c a = j j × E t + k × E l + l × E s , a = ( i , j , k , l ) ∈ Ω
记RT业务和NRT业务的碰撞概率向量能量效率向量为因此,系统的碰撞概率测度和能量效率测度分别为:
η p = lim T → ∞ 1 T E [ ∫ 0 T f p ( X t ) dt ] = π f p
η c = lim T → ∞ 1 T E [ ∫ 0 T f c ( X t ) dt ] = π f c
其中,E表示期望运算,期望能够在碰撞概率受限的情况下,得到使系统能量效率最大化的最优节点睡眠时间,该问题可转化为一个最优化问题:
ts∈arg maxηc
s.t.ηp≤Pcollision-threhold
定义碰撞概率和能量效率的性能势函数
g p s = E { Σ l = 0 ∞ [ f p ( X l ) - η p ] | X 0 = s }
g c s = E { Σ l = 0 ∞ [ f c ( X l ) - η c ] | X 0 = s }
其物理含义为当前状态s对系统性能的贡献与未来状态的长期潜在作用的期望之和,性能势与性能测度满足泊松方程:
(I-Q)gppe=fp
(I-Q)gcce=fc
其中,I为单位矩阵,将泊松方程两边对ts求偏导,可以得到ηp和ηc对睡眠时间的梯度信息:
▿ η p ( t s ) = Σ i ∈ Ω π i ( t s ) Σ j ∈ Ω ▿ Q ij ( t s ) g p j ( t s )
▿ η c ( t s ) = Σ i ∈ Ω π i ( t s ) Σ j ∈ Ω ▿ Q ij ( t s ) g c j ( t s )
获得梯度信息后,设计一个双层循环的梯度迭代方法,求解最优的睡眠时间,
步骤1,初始化系统参数RT业务和NRT业务的到达率λRT和λNRT,及其平均服务时间tRT和tNRT,节点的平均侦听时间tl,平均睡眠时间ts,信道数量N,网络节点总数M,迭代次数k=0;
步骤2,建立状态转移速率矩阵:根据初始化参数,建立状态转移速率矩阵Q,
步骤3,将睡眠时间带入式求得碰撞概率测度和能量效率测度并根据式 ▿ η p ( t s k ) = Σ i ∈ Ω π i ( t s k ) Σ j ∈ Ω ▿ Q ij ( t s k ) g p j ( t s k ) ▿ η c ( t s k ) = Σ i ∈ Ω π i ( t s k ) Σ j ∈ Ω ▿ Q ij ( t s k ) g c j ( t s k ) 求得对应的梯度信息
步骤4,更新睡眠时间:
如果orηp≥Pcollision-threhold
根据公式
t s k + 1 = ( t s k + κ k ▿ η c ( t s k ) ) + ( P collision - threhold - η p ) ▿ η p ( t s k )
更新睡眠时间,其中,κk为步长调整因子,其中,
0<a1,a2<1,b>0是任意正数,转到步骤3,
否则
赋值给ts,输出最优睡眠时间。
本发明的有益效果是:本申请在实时业务和非实时业务共同存在的混合网络下,获得非实时业务的最优睡眠时间,使得网络节点的能量效率最大化。
附图说明
图1是本发明非实时业务传输示意图;
图2是本发明实时业务传输示意图;
图3是本发明混合业务无线传感器网络接入模型;
图4是信道未占满时系统速率转移图;
图5是第二类状态转换模型;
图6是第三类状态转换模型;
图7是基于摄动技巧的梯度算法;
图8是传输时间随睡眠速率的变化;
图9是侦听时间随睡眠速率的变化;
图10是能量效率随睡眠速率的变化;
图11是基于梯度算法的睡眠时间与常数睡眠时间的能量效率的比较。
具体实施方式
下面结合附图对本发明做进一步说明
系统模型:
图1是实时业务和非实时业务共存的混合无线传感器网络的示意图。传感器节点状态由睡眠(Sleep)、监听(Sense)和通信(Communications)状态组成。图1给出了某一时刻网络中各个节点所处的状态。当节点A有非实时数据需要传输至Sink节点时,首先经过路由协议确定传输路径,然后节点A沿此路径发送数据。在此过程中,数据传输路径上的各个节点在苏醒后进入收发状态,与此同时在收发节点的信号覆盖范围内的节点在获知信道被占用后即刻进入睡眠状态,其余节点保持自身的睡眠/监听时间。当有网络中有实时业务需要传输至Sink节点时,由于实时业务具有更高的优先级,非实时业务在会对实时业务传输产生影响的信道上,进行退避。如图2所示,当节点B有实时业务要发送时,要将数据发送至Sink节点,需要节点C作为中继,因此在这种情况下,节点A暂停发送非实时数据并进入睡眠状态,由节点B使用信道传输。
如图3所示,基于Markov的节点状态转移模型:
在一个有限区域内,无线传感器网络中共有N个可用信道,网络中有实时业务节点(real-time node,RT Node)和非实时业务节点(non-real-timenode,NRT Node)。图3给出了信道接入的示意图,其中RT节点对信道的使用具有绝对的优先级,即可以随机接入没有被其他RT节点占用的信道。只有当信道全部被RT节点占用时,新到达的RT业务才会被阻塞。为保证网络中实时数据的优先传输,NRT使用未被RT业务占用的信道。当被RT数据抢占时,退出当前传输的信道,等待下一次的接入。
根据以上的过程描述,建立4维连续时间Markov模型。假设处于三种状态下的网络节点总数为M;RT数据业务的到达时间间隔服从参数为λRT的泊松分布;RT和NRT在信道中的传输时间服从均值为tRT和tNRT的负指数分布。NRT数据的网络节点在状态监听状态的时间和处于睡眠状态的时间服从均值为tl和ts的负指数分布。
定义4维参数a:=(i,j,k,l)来表示无线传感器网络在每个时刻的状态。其中i,j分别表示系统中正在传输的RT和NRT业务的节点个数,k,l分别表示处于监听状态和睡眠状的NRT节点个数。状态空间为:
Ω={a:=(i,j,k,l)|0≤i+j≤N,j+k+l=M},
定义状态空间中状态数为|Ω|=A。不失一般性,假设系统的当前状态为(i,j,k,l),根据上一节中的系统描述,状态可能发生的转移有:
当信道未满时,i+j<N,此时NRT节点可能处于两种状态,在信道中传输状态或者睡眠状态。此时各个参数的关系是i+j<N,k=0,j+k+l=M。系统的状态转移有以下5种可能:
1)节点有RT数据需要发送并通过竞争获得信道使用权,那么下一时刻的状态转换为(i+1,j,0,l),转移速率为(N-i-j/N-i)λRT
2)RT业务先到达系统并抢占了NRT业务所在信道,被抢占的节点转为睡眠状态,下一时刻的状态转换为(i+1,j-1,0,l+1),转移速率为(j/N-i)λRT
3)若RT业务服务完成,退出信道,则下一时刻的状态转换为(i-1,j,0,l),转移速率为i/tRT
4)若NRT业务服务完成,退出信道,转换为睡眠状态,下一时刻的状态转换为(i,j-1,0,l+1),转移速率为j/tNRT
5)若某节点睡眠结束,且此时的信道有空闲,该节点首先转换为监听状态而后马上接入信道,此时状态转换为(i,j+1,0,l-1),转移速率为l/ts
转换模型如图4所示。
当信道满时,且初始状态监听的NRT节点个数不为0,即i+j=N,k≠0时,对应的参数关系为i+j=N,k≠0,j+k+l=M。转换过程有5种可能:
1)RT业务先到达,只能抢占NRT所在信道,被抢占的网络节点转为睡眠状态,系统的状态转移为(i+1,j-1,k,l+1),转移速率为λRT
2)RT业务完成,退出信道,信道变为空闲。处于监听状态的节点立即接入信道,其接入按照先进先出(First Come First Service)原则,此时状态转换为(i-1,j+1,k-1,l),转移速率为i/tRT
3)NRT业务完成,退出信道。该节点转换为睡眠状态,处于监听状态的网络节点立即接入信道,系统的信道转移为(i,j,k-1,l+1),转移速率为j/tNRT
4)处于监听状态的网络节点监听超时。此时信道没有空闲,节点转换为睡眠状态,系统的状态转移为(i,j,k-1,l+1),转移速率为kμse。由于第3种和第4种状态转移结果相同,归结为一个过程,其转移速率为k/tl+j/tNRT
5)处于睡眠状态的节点睡眠超时。由于信道没有空闲,节点转换为监听状态并监听空闲信道,此时状态转移为(i,j,k+1,l-1),转移速率为l/ts
转换模型如图5所示。
当信道满时,且初始状态监听的节点个数为零,即i+j=N,k=0时,对应的参数关系为i+j=N,k=0,j+k+l=M。转换过程有5种可能:
1)RT业务到达并抢占NRT道,被抢占的节点转为睡眠状态。系统的状态转移为(i+1,j-1,0,l+1),转移速率为λRT
2)RT业务完成,退出信道,信道变为空闲。系统中没有处于监听状态的节点,系统的状态转移为(i-1,j,0,l),转移速率为i/tRT
3)NRT业务完成,退出信道。节点转换为睡眠状态,系统的状态转移为(i,j-1,0,l+1),转移速率为j/tNRT
4)处于睡眠状态的节点睡眠超时。由于此时的信道没有空闲,节点转换为监听状态并监听空闲信道,此时状态转换为(i,j,1,l-1),转移速率为lμde
转换模型如图6所示。
性能评估:
稳态概率求解
系统中各个状态的稳态概率采用连续时间Markov链的稳态性质来求解。根据以上建模过程,对应的在状态空间Ω中状态的稳态概率为π={πi,j,k,l|0≤i+j≤N,j+k+l=M}。Markov过程状态转移速率矩阵Q。假设a为当前时刻的状态,a'为下一时刻的状态,矩阵Q可以表示成如下形式:
Q a , a &prime; | s = ( i , j , k , l ) , s &prime; = &Omega; = N - i - j N - i &lambda; RT a &prime; = ( i + 1 , j , k , l ) j N - i &lambda; RT a &prime; = ( i + 1 , j - 1 , k , l + 1 ) l / t s a &prime; = ( i , j + 1 , k , l - 1 ) i / t RT a &prime; = ( i - 1 , j , k , l ) j / t NRT + k / t l a &prime; = ( i , j , k - 1 , l + 1 ) j / t NRT a &prime; = ( i , j - 1 , k , l + 1 ) Q s , s = - &Sigma; s &NotEqual; s &prime; Q s , s &prime; 0 others
把矩阵Q的第一列用e代替,e为单位列矩阵,并有πe=1,此时Q变为Q1,由于πQ=0,令b=[1 0 0 …],则πQ1=b,从而得到也就是说π的解为的第一行。
QoS指标分析
系统中节点所处的三种状态都需要能量消耗,假设传输状态,监听状态和睡眠状态下,单位时间需要耗能分别为Et,El,Es,其中处于传输状态时消耗能量Et最大,处于监听状态消耗的能量Es次之,处于睡眠状态的节点需要消耗能量Ed最少,Et>El>Es。另外考虑到降低NRT业务对RT业务的干扰,还需要将两种业务的碰撞概率进行约束。本文的几个参数指标如下:
1.传输时间(Tt):定义为NRT业务在信道中总传输的时间。NRT业务只能在没有RT业务的信道上进行传输,假设仿真时间为Tsimu,根据以上对过程的描述,取状态空间中任一个状态a=(i,j,k,l)∈Ω进行分析,假设节点传输单位数据时间为τ,那么该状态下NRT业务在信道中总的传输时间为
T t a = j &times; &tau; ,
单位时间平均传输的数量记为根据稳态概率的物理意义,当前状态的稳态概率πa=τ/Tsimu,可得nt=j×πa。所以在状态空间中传输时间总和
T t = &Sigma; a = 1 A j &times; &pi; a - - - ( 4.1 )
2.监听时间(Tl):定义为节点处于监听状态的时间。由以上推导方法,有效状态a=(i,j,k,l)∈Ω,监听时间为系统中节点的监听时间总和
T s = &Sigma; a = 1 A k a * &pi; a - - - ( 4.2 )
3.睡眠时间(Ts):定义为节点处于睡眠状态的总时间。由以上推导方法,有效状态a=(i,j,k,l)∈Ω,时间为系统中节点的睡眠时间总和
T s = &Sigma; a = 1 A l &times; &pi; a - - - ( 4.3 )
4.传输效率(ηt):文中将传输效率定义为单位时间比特传输量,节点在状态空间里的传输时间为
T t a = j &times; &pi; a
系统中总传输效率为
&eta; t = T t a / T simu = j &times; &pi; a / T simu . - - - ( 4.4 )
5.能量效率(η):文中将无线传感器网络中NRT业务的能量效率定义为NRT业务每消耗单位能量可以传输数据的比特数。所以能量效率为单位比特平均传输比特个数与单位比特平均消耗能量的比值:
总消耗的能量为E=nt×Et+nl×El+ns×Es,能量效率
&eta; c a = j &times; &pi; a E = j &times; &pi; j &times; &pi; a &times; E t + k &times; &pi; a &times; E l + l &times; &pi; a &times; E s = j j &times; E t + k &times; E l + l &times; E s ,
系统中总能量效率为
&eta; c = &Sigma; a = 1 A &eta; c a = &Sigma; a = 1 A j j &times; E t + k &times; E l + l &times; E s . - - - ( 4.5 )
6.RT业务和NRT业务的碰撞概率(Pcollision):
当信道被RT业务占满时,下一时刻到达的RT业务会被阻塞;用Pblock表示RT业务阻塞率,可表示为
P block = &Sigma; k = 0 M &Sigma; l = 0 M - k &pi; N , 0 , k , l .
RT业务和NRT业务的碰撞概率为在信道中的RT业务未被阻塞的前提下,新到达的RT业务占用NRT业务当前传输的信道,用Pcollision表示碰撞率,其表达式为
P collision a = &Sigma; a = 1 A &pi; a ( j N - i ) / ( 1 - P block ) = &Sigma; a &Element; &Omega; &pi; a ( j N - i ) / ( 1 - &Sigma; k = 0 M &Sigma; l = 0 M - k &pi; N , 0 , k , l ) - - - ( 4.6 )
本文假设碰撞概率上限为Pcollision-threhold,目标是在保证碰撞概率不超过其上限的前提下,即Pcollision≤Pcollision-threhold时,使无线传感器网络NRT业务的能量效率ηc最大化的节点最优睡眠时间。下面采用摄动分析的技巧来对系统进行性能分析,并提出求解最优睡眠时间的方法。
基于摄动分析的最优睡眠时间求解:
随机动态系统
随机动态系统是指系统状态随着时间的演变而的演变的系统,系统的优化问题即由观测和输入(行动)的历史得到输出的历史,在每个样本空间内采取怎样的行动才能使系统的总报酬达到最优,并找到对应的最优策略。当策略数目有限时,最优策略总是存在并且可能不唯一。假定在任一时刻l=0,1,2...,系统的状态记为sl,l=0,1,...,状态空间内的样本路径是状态历史的记录,记为s={s0,s1,s2,...},sl是随机变量,样本路径表达了系统的动态行为。对于每条样本路径Hl,l=0,1,...,L均有一个报酬,记为ηl(Hl),当样本路径的长度有限为L时,ηL(HL)代表系统遍历样本路径获得的所有报酬,并将系统的性能度量定义为报酬的平均值η=E[ηL(HL)];当样本路径的为无限长时,性能度量定义为平均报酬的极限其中假定期望和极限均存在。
在Markov模型的优化问题中,存在报酬函数,本文将其记为f(i,α),i∈S,α∈Α,表示在时刻l,如果系统处在状态i,并采取行动α,则系统获得报酬为f(i,α)。对于长度为L的有限样本路径,系统的总报酬是性能度量是对于遍历的Markov链,长期平均报酬为可以看出,它不依赖于初始状态。
随机动态系统的建模分析与优化策略,现已形成了很多方法。其中研究不确定系统性能与优化问题的建模和分析,主要有排队网络方法,Markov决策过程(MDPS),摄动分析(PA)等等。排队网络方法是一种传统的基于排队论的方法,应用上具有一定的局限性,只适合用于分析网络系统的稳态统计平均性能。Markov决策过程适用于实际系统的建模分析。随着系统模型和所处环境的复杂性,比如状态空间的维数问题和系统参数未知等问题,MDPS方法显然没有达到需求。在这个问题上,摄动分析方法较MDPS方法有一定的优势。PA是基于梯度(或策略梯度)的学习和优化方法的核心,通过分析随机动态系统的单条样本路径来估计性能关于系统参数的导数。摄动分析早期工作集中在排队系统,后来被扩展到Markov系统中。它可以基于Markov的一条样本路径估计所有方向上的性能导数,导数可以作为一个整体来估计,而不必考虑每个状态的性能势。本文将采用基于摄动技巧的算法来来对系统性能进行评估,对文中所提的系统模型,在系统参数确定的情况下,通过改变可变参数μde(策略),运用梯度算法找到使系统能量效率达到最优的策略。
基于摄动技巧的梯度算法
如果只分析一个策略下的系统,很难知道系统在其他策略下的行为。如果两个策略很“接近”,这两个策略下的系统性能表现也会很相似,据此当分析了一个策略下的系统性能后,可以“预测”在“接近”策略下的行为并计算它的系统性能。假设一个策略空间可以用连续参数表示,如果两个策略对应的接近,我们称这样的策略空间为连续策略空间。本文中的策略是指平均睡眠时间,所以是连续时间策略,平均睡眠时间的微小变化对应于DCN平均睡眠速率的变化,转移概率矩阵也会随之变化。所以如果DCN的平均睡眠时间接近,两个策略就可以视为接近,然后通过摄动技巧预测平均睡眠时间的微小变化对系统性能产生的影响,得到系统的性能导数,获得策略空间中各个策略下的性能梯度。并利用梯度的优化算法,确定局部最优点。基于摄动技巧的梯度算法结构如图7所示。
性能函数求解
本文所建立的连续时间Markov模型,设定μde为变量,其他参数为定值,μde的变化会导致状态矩阵Q变化,假设Qd为对应于变量的一个转移矩阵,Qd的一个小变化会在Qd的样本路径上引起一系列摄动,Qh是与Qd十分接近,睡眠速率为的另一个策略,显然Qd和Qh的性能函数相同,设ΔQ=Qh-Qd,定义Qδ=Qd+δΔQ=(1-δ)Qd+δQh,0≤δ<<1,Qδ是随机策略,性能导数可以通过预测系统在转移速率矩阵从Qd到Qδ轻微摄动的行为获得。假设在某时刻l,具有Qd的Markov链的状态为i,Xl=i,然而,当转移概率轻微变化为Qδ后,系统变成状态Xl=j,i,j∈S,从一个状态i到另一个状态j的跳跃,对系统性能ηd的平均影响可通过摄动实现因子来测量,γd(i,j)表示摄动实现因子,可以证明,对于所有的i,j∈S,γd(i,j)=gd(j)-gd(i),其中gd(i)称为状态i的性能势(或简称势)。直观看来,某一策略Qd下状态i的性能势gd(i)测量了状态i对长期平均报酬η的潜在贡献,它在Qd上的样本路径下定义为 g ( i ) = E { &Sigma; l = 0 &infin; [ f ( X l ) - &eta; ] | X 0 = i } , 因此容易得到,
用矩阵形式表示,即为泊松方程:
(I-Q)g+ηe=f,
        (5.1)
其中g=(g(1),...,g(S))T是性能势向量,而e=(1,1,...,1)T是每个分量都为1的列向量。由(5.1)可知性能势满足Qgp=-fp+ce,由于πQ=0,所以c=πf,Markov过程的长期平均性能度量为对于遍历的Markov过程它是存在的,这里E表示期望。
定义RT业务和NRT业务的碰撞概率为性能函数fp,系统的传输效率为能量效率分为两个功耗函数,分别记成向量形式: f p = ( f p 1 , f p 2 , . . . . f p s ) T , f c 1 = ( f c 11 , f c 12 , . . . . f c 1 s ) T , f c 2 = ( f c 21 , f c 22 , . . . . f c 2 s ) T , 由(4.4)(4.5)(4.6),将性能函数和功耗函数表示成,
f p = P collision = ( j s N - i s ) / ( 1 - &Sigma; k = 0 M &Sigma; l = 0 M - k &pi; N , 0 , k , l )
f c 1 s = &eta; t = j s * &pi; s / T simu
f c 2 s = &eta; s = j s j s * E t + k s * E s + l s * E l
性能势满足下面的泊松方程:
Qgp=-fppe,(5.2)
Qg c 1 = - f c 1 + &eta; c 1 e , - - - ( 5.3 )
Qg c 2 = - f c 2 + &eta; c 2 e , - - - ( 5.4 )
这里 &eta; p = lim T &RightArrow; &infin; 1 T E [ &Integral; 0 T f p ( X t ) dt ] , &eta; c 1 = lim T &RightArrow; &infin; 1 T E [ &Integral; 0 T f c 1 ( X t ) dt ] , &eta; c 2 = lim T &RightArrow; &infin; 1 T E [ &Integral; 0 T f c 2 ( X t ) dt ] , 分别为性能测度和功耗测度。RT业务和NRT业务碰撞概率的最大上限为δ,所以ηp≤δ。由于πQ=0,对其两边在μde=0处取导数,可得对(5.2),(5.3),(5.4)式两侧左右乘以π,可知在μde=0处, d&eta; d &mu; de | &mu; de = 0 = d&pi; d &mu; de | &mu; de = 0 f = - &pi; ( &Delta;Q ) Q # f = &pi; ( &Delta;Q ) g , 故性能测度与功耗测度的梯度分别为
&dtri; &eta; p ( &mu; de ) = &Sigma; i &Element; S &pi; i ( &mu; de ) &Sigma; j &Element; S &dtri; Q ij ( &mu; de ) g pj ( &mu; de )
&dtri; &eta; c 1 ( &mu; de ) = &Sigma; i &Element; S &pi; i ( &mu; de ) &Sigma; j &Element; S &dtri; Q ij ( &mu; de ) g cj 1 ( &mu; de )
&dtri; &eta; c 2 ( &mu; de ) = &Sigma; i &Element; S &pi; i ( &mu; de ) &Sigma; j &Element; S &dtri; Q ij ( &mu; de ) g cj 2 ( &mu; de )
综合以上结果,下面通过基于梯度的迭代算法来计算最优策略。即在ηp≤δ的前提下,寻找一个最优策略μde *,使得系统的能量效率达到最优。
梯度算法
由以上对性能函数的推导,可以精确地估计得到能量效率的性能梯度结合拉格朗日梯度算法,在ηp≤δ的约束条件下,得到
&mu; de k + 1 = ( &mu; de k + &kappa; k &PartialD; &eta; c 2 &PartialD; &mu; de ) + ( &delta; - &eta; p ) * &PartialD; &eta; p &PartialD; &mu; de - - - ( 5.5 )
式(5.5)中κk表示步长。我们取步长其中,1>{a1,a2}>0,b>0都是任意正数。从初始点开始开始,在第k次迭代,用参数计算,k=0,1,...,随着k逐渐变大,参数μde根据(5.5)式更新,估计在处的性能梯度当k越来越大并趋近于某一个值k*时,μde的大小变化非常缓慢,此时趋近于0,ηp趋近于δ,μde收敛到局部最优点,此时最优点
&mu; de * = &mu; de k * + 1 &ap; &mu; de k * . - - - ( 5.6 )
仿真结果分析:
本文运用Matlab仿真算法对上文建立的模型进行仿真模拟。具体设置参数如下:N=8,M=10,λRT=[0.1,1],μRT=0.5,μNRT=0.2,Pcollision_threhold=0.3,μse=0.1,Et=1,Es=0.5,Ed=0.05。考虑不同睡眠时间μde下,各性能指标的变化规律。假设μde从0.07变化到0.7。
传输时间,监听时间,睡眠时间的变化
图8和图9分别给出了上述参数下NRT业务的传输时间和监听时间随ts的变化情况。根据图8和图9的结果可以看出,理论结果和实际仿真结果几乎吻合,证明了基于Markov的分析方法的正确性。
如图8所示,传输时间随着ts的增大而增大。当睡眠时间较小时,在RT业务到达速率一定的情况下,网络节点发现空闲信道的机会增多,从而传输时间变大。但是,当ts减小到一定程度时,相当于网络节点连续监听寻找空闲信道,传输时间才会趋向于一个定值。图8还描述了传输时间随RT业务到达率λRT的变化的趋势。随着λRT的增加,RT业务对信道的占用也随之增加,因此在相同的睡眠时间水平上,其平均传输时间越来越小。
图9显示了节点总的监听时间随着ts的变大而变小,且变化速度也呈现增大趋势。这是由于ts较小时,节点经过很小的一段睡眠时间后即开始监听信道,在RT业务到达速率一定的前提下,总监听时间将会增大。同时,当平均睡眠时间较大时,节点捕获的传输机会较少,如图8所示。随着平均睡眠时间的减少,网络节点接入信道的机会增多,传输时间增多,因此监听时间虽然增加,但是速度较慢。当网络节点捕获传输机会越来越多,由于信道容量有限,所以其传输时间的增加会变得缓慢,节点将大部分时间处于监听状态。
5.2能量效率的变化
图10显示随着ts变大,能量效率先变大后变小,在睡眠速率等于某个特定值时,出现一个峰值。这是由于ts较大时,系统的能量消耗较少。当ts大于一定范围内时,虽然随着平均睡眠时间的减小,系统能量消耗增多,但是传输效率也增大,且增大的幅度较快,此时能量效率逐渐增大。但当睡眠时间继续增大时,系统的信道容量趋于饱和,传输时间增长的趋势变缓,系统的监听时间增加速度加快,因此系统的能量效率开始下降。
梯度算法
根据图11的结果,可以看出,无线传感器网络节点的能量效率随平均睡眠时间变化,是一个凹函数(convex function),或者ts的变化,是一个凸函数(concave function)。因此,利用摄动分析理论,给出了一个基于梯度的算法,寻找使无线传感器网络能量效率最大化的最佳节点睡眠时间。图11给出了梯度算算法与理论最优解以及常数平均睡眠时间的比较结果。从图11中可以看出,梯度算法非常接近理论的最优解,但是要比基于穷举法的最优解求解方法更有效率。同时,我们可以看出,在不同的系统参数下,经过优化的平均睡眠时间,能够使得无线传感器网络的能量效率提升近10%。
以上内容是结合具体的优选实施方式对本发明所作的进一步详细说明,不能认定本发明的具体实施只局限于这些说明。对于本发明所属技术领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干简单推演或替换,都应当视为属于本发明的保护范围。

Claims (4)

1.一种面向混合业务的无线传感器网络能量有效接入方法,其特征在于:在一个有限区域内,无线传感器网络中共有N个可用信道,网络中有实时业务节点RT和非实时业务节点NRT,其中RT节点对信道的使用具有绝对的优先级,即可以随机接入没有被其他RT节点占用的信道,当NRT被RT数据抢占时,退出当前传输的信道,进入睡眠状态,等待下一次接入;
当NRT被RT数据抢占时,退出当前传输的信道,进入睡眠状态,最优睡眠时间求解如下: 
将混合业务的无线传感器网络建模为一个连续时间Markov链模型,其状态转移速率矩阵为Q,状态空间为Ω,稳态概率向量为π,根据连续时间Markov性质可知: 
πe=1,Qe=0,πQ=0 
根据式可知,处于状态s时,碰撞概率为: 
根据式可知,处于状态a时,能量效率的作用为 
记RT业务和NRT业务的碰撞概率向量能量效率向量为 因此,系统的碰撞概率测度和能量效率测度分别为: 
其中,E表示期望运算,期望能够在碰撞概率受限的情况下,得到使系统能量效率最大化的最优节点睡眠时间,该问题可转化为一个最优化问题: 
ts∈argmaxηc
s.t. ηp≤Pcollision-threhold
定义碰撞概率和能量效率的性能势函数 
其物理含义为当前状态s对系统性能的贡献与未来状态的长期潜在作用的期望之和,性能势与性能测度满足泊松方程: 
(I-Q)gppe=fp
(I-Q)gcce=fc
其中,I为单位矩阵,将泊松方程两边对ts求偏导,可以得到ηp和ηc对睡眠时间的梯度信息: 
获得梯度信息后,设计一个双层循环的梯度迭代方法,求解最优的睡眠时间, 
步骤1,初始化系统参数RT业务和NRT业务的到达率λRT和λNRT,及其平均服务时间tRT和tNRT,节点的平均侦听时间tl,平均睡眠时间ts,信道数量N,网络节点总数M,迭代次数k=0; 
步骤2,建立状态转移速率矩阵:根据初始化参数,建立状态转移速率矩阵Q, 
步骤3,将睡眠时间带入式求得碰撞概率测度和能量效率测度并根据式 求得对应的梯度信息
步骤4,更新睡眠时间: 
如果
根据公式 
更新睡眠时间,其中,κk为步长调整因子,其中, 
0<a1,a2<1,b>0是任意正数,转到步骤3, 
否则 
赋值给ts,输出最优睡眠时间; 
字母含义解释如下: 
Pcollision:RT业务和NRT业务的碰撞概率; 
Pblock:表示RT业务阻塞率; 
Pcollision-threhold:碰撞概率上限; 
ηc:系统的能量效率测度; 
分别表示系统处于状态s和状态a时,RT业务和NRT业务的碰撞概率; 
传输状态、监听状态和睡眠状态下,单位时间需要耗能分别为Et,El,Es; 
Xt是通配的变量,表示系统在t时刻的状态,在Markov理论中,是常见的表示方法; 
NRT数据的网络节点在睡眠状态的平均时间为ts; 
ηp:系统的碰撞概率测度; 
状态转移速率矩阵为Q,则Qij为第i行、第j列的元素; 
i,j分别表示系统中正在传输的RT和NRT业务的节点个数; 
N:信道数量; 
M:网络节点总数; 
定义4维参数a:=(i,j,k,l)来表示无线传感器网络在每个时刻的状态,其中,k,l分别表示处于监听状态和睡眠状的NRT节点个数; 
状态空间内的样本路径是状态历史的记录,记为s={s0,s1,s2,...}; 
κk表示步长; 
c:c=πf,表示系统在遍历所有状态后的平均收益,其中π为系统处于各个状态的稳态概率,f表示在对应状态下的收益; 
g:为性能势向量,是随机优化理论中的核心概念,其取值为一个与状态空间大小相同的向量,物理含义为系统在各个状态中的相对收益期望值,由于各个状态的收益差为常数,与物理学中的势能概念相似,顾定义为性能势。 
2.根据权利要求1所述的一种面向混合业务的无线传感器网络能量有效接入方法,其特征在于:实时业务节点和非实时业务节点状态由睡眠、监听和通信状态组成。 
3.根据权利要求1或2所述的一种面向混合业务的无线传感器网络能量有效接入方法,其特征在于:所述NRT使用未被RT业务占用的信道。 
4.根据权利要求1或2所述的一种面向混合业务的无线传感器网络能量有效接入方法,其特征在于:当节点A有非实时数据需要传输至Sink节点时,首先经过路由协议确定传输路径,然后节点A沿此路径发送数据,在此过程中,数据传输路径上的各个节点在苏醒后进入收发状态,与此同时在收发节点的信号覆盖范围内的节点在获知信道被占用后即刻进入睡眠状态,其余节点保持自身的睡眠或侦听时间。 
CN201210318942.5A 2012-08-31 2012-08-31 一种面向混合业务的无线传感器网络能量有效接入方法 Active CN102833812B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201210318942.5A CN102833812B (zh) 2012-08-31 2012-08-31 一种面向混合业务的无线传感器网络能量有效接入方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210318942.5A CN102833812B (zh) 2012-08-31 2012-08-31 一种面向混合业务的无线传感器网络能量有效接入方法

Publications (2)

Publication Number Publication Date
CN102833812A CN102833812A (zh) 2012-12-19
CN102833812B true CN102833812B (zh) 2015-02-25

Family

ID=47336716

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210318942.5A Active CN102833812B (zh) 2012-08-31 2012-08-31 一种面向混合业务的无线传感器网络能量有效接入方法

Country Status (1)

Country Link
CN (1) CN102833812B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104918339A (zh) * 2014-03-12 2015-09-16 国家电网公司 一种无线传感器网络的通信控制方法和装置
US9280389B1 (en) * 2014-12-30 2016-03-08 Tyco Fire & Security Gmbh Preemptive operating system without context switching
CN106455026B (zh) * 2016-11-01 2019-09-24 北京邮电大学 基于能量状态调整工作周期的mac协议实现方法及装置
CN112202637A (zh) * 2020-09-30 2021-01-08 西安热工研究院有限公司 一种profibus-pa总线网段设备数量的计算方法
CN113056029B (zh) * 2021-03-10 2022-05-17 浙江大学 一种适用于低轨卫星网络的能量受限终端随机接入方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101102143A (zh) * 2007-07-13 2008-01-09 北京航空航天大学 保证服务质量的多址接入方法
CN101848542A (zh) * 2010-04-06 2010-09-29 广州海格通信集团股份有限公司 Ad Hoc网络电台传输实时数据和非实时数据的方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102005030031B4 (de) * 2005-06-27 2007-08-02 Nec Europe Ltd. Verfahren zum Datenmanagement in einem Sensornetzwerk

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101102143A (zh) * 2007-07-13 2008-01-09 北京航空航天大学 保证服务质量的多址接入方法
CN101848542A (zh) * 2010-04-06 2010-09-29 广州海格通信集团股份有限公司 Ad Hoc网络电台传输实时数据和非实时数据的方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
无线传感器网络中DiffServ 的性能分析;高敏等;《计算机工程》;20110131;第37卷(第1期);第93-95页 *

Also Published As

Publication number Publication date
CN102833812A (zh) 2012-12-19

Similar Documents

Publication Publication Date Title
Park et al. Learning how to communicate in the Internet of Things: Finite resources and heterogeneity
Alsheikh et al. Markov decision processes with applications in wireless sensor networks: A survey
CN102833812B (zh) 一种面向混合业务的无线传感器网络能量有效接入方法
Yang et al. Performance analysis and prediction of asymmetric two-level priority polling system based on BP neural network
Wang et al. Dual-attention assisted deep reinforcement learning algorithm for energy-efficient resource allocation in Industrial Internet of Things
Zhang et al. Analysis and design of energy harvesting wireless sensor networks with linear topology
CN103702384B (zh) 无线传感器网络面向应用的分簇式路由方法
binti Zubir et al. Optimization of wireless sensor networks mac protocols using machine learning; a survey
Wang et al. Energy-efficient and delay-guaranteed routing algorithm for software-defined wireless sensor networks: A cooperative deep reinforcement learning approach
Kalnoor et al. A review on applications of Markov decision process model and energy efficiency in wireless sensor networks
CN105792287B (zh) 无线体域网的保护时隙自适应分配及性能评价方法
Zhang et al. Maximum throughput under admission control with unknown queue-length in wireless sensor networks
Zheng et al. Modeling and performance analysis of DMAC for wireless sensor networks
CN103581048B (zh) 一种电力通信网络的分布式资源过载控制方法
Bargavi et al. The dynamic window-based scheduling framework for complex wireless sensor networks
Gupta et al. Energy-efficient model for deployment of sensor nodes in IoT based system
CN104812036B (zh) 一种能量获取传感器网络的休眠调度方法和系统
Ayoub et al. Energy consumption analysis to predict the lifetime of IEEE 802.15. 4 wireless sensor networks
Jain et al. ST-DAM: exploiting spatial and temporal correlation for energy-efficient data aggregation method in heterogeneous WSN
Li et al. An Intelligent SDWN Routing Algorithm Based on Network Situational Awareness and Deep Reinforcement Learning.
Jaiswal et al. An efficient protocol for reducing energy consumption in wireless sensor networks
Kumar et al. Energy efficient scheduling algorithm with interference reduction for wireless sensor networks
Qihua et al. Scheduling strategy for Hidden Markov Model in wireless sensor network
Zhao et al. Energy efficient packet transmission strategies for wireless body area networks with rechargeable sensors
Virk et al. System-level modeling of wireless integrated sensor networks

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant