CN105897585A - 一种自组织网络基于时延约束的q学习分组传输方法 - Google Patents

一种自组织网络基于时延约束的q学习分组传输方法 Download PDF

Info

Publication number
CN105897585A
CN105897585A CN201610221659.9A CN201610221659A CN105897585A CN 105897585 A CN105897585 A CN 105897585A CN 201610221659 A CN201610221659 A CN 201610221659A CN 105897585 A CN105897585 A CN 105897585A
Authority
CN
China
Prior art keywords
node
hop
destination node
message
delay
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201610221659.9A
Other languages
English (en)
Other versions
CN105897585B (zh
Inventor
刘军
高洋
唐伟
赵聪
刘伟
郭伟
余敬东
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of Electronic Science and Technology of China
Original Assignee
University of Electronic Science and Technology of China
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of Electronic Science and Technology of China filed Critical University of Electronic Science and Technology of China
Priority to CN201610221659.9A priority Critical patent/CN105897585B/zh
Publication of CN105897585A publication Critical patent/CN105897585A/zh
Application granted granted Critical
Publication of CN105897585B publication Critical patent/CN105897585B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L45/00Routing or path finding of packets in data switching networks
    • H04L45/12Shortest path evaluation
    • H04L45/121Shortest path evaluation by minimising delays
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W40/00Communication routing or communication path finding
    • H04W40/02Communication route or path selection, e.g. power-based or shortest path routing
    • H04W40/22Communication route or path selection, e.g. power-based or shortest path routing using selective relaying for reaching a BTS [Base Transceiver Station] or an access point
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W84/00Network topologies
    • H04W84/18Self-organising networks, e.g. ad-hoc networks or sensor networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Mobile Radio Communication Systems (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明公开了一种自组织网络基于时延约束的Q学习分组传输方法,所述自组织网络基于时延约束的Q学习分组传输方法旨在解决当无线自组织网络中的节点面临多个通往目的节点的下一跳且端到端时延参数时变情况下,满足时延约束指标的中继路径的自主学习和中继节点的动态选择问题。网络节点自主学习通往目的节点的不同路径的端到端时延参数;网络节点在面临多个通往目的节点且满足时延约束指标的下一跳时,将不同下一跳节点的端到端传输时延归一化处理后作为每一次传输时的选择概率,动态选择下一跳节点进行传输,从而降低网络的端到端传输时延。本发明采用的将时延约束与Q学习相结合的分组传输方法提升了无线自组织网络的传输性能。

Description

一种自组织网络基于时延约束的Q学习分组传输方法
技术领域
本发明属于通信技术领域,尤其涉及一种自组织网络基于时延约束的Q学习分组传输方法。
背景技术
Q学习是一种模型无关的强化学习算法,Q学习要解决的是这样的问题:一个能感知环境的自治代理如何通过学习选择能达到其目标的最优动作。主要应用于学习控制机器人的移动,在工厂中学习最优操作工序以及学习棋类对弈等。当代理在其环境中做出一个动作时,施教者会提供奖励或惩罚信息,以表示结果状态的正确与否。例如,在训练代理进行棋类对弈时,施教者可在游戏胜利时给出正回报,而在游戏失败时给出负回报,其他时候为零回报。代理的任务就是从这个非直接的,有延迟的回报中学习,以便后续的动作产生最大的累积效应。Q学习在人工智能领域已得到大范围应用并且性能优良。
在无线自组织网络中,一个节点到目的节点往往具有多个下一跳节点,因此如何选择通往目的节点的下一跳节点来降低端到端的时延、提升网络传输性能就变得尤为重要。
发明内容
本发明的目的在于提供一种自组织网络基于时延约束的Q学习分组传输方法,旨在解决当无线自组织网络中的节点面临多个通往目的节点的下一跳且端到端时延参数时变情况下,满足时延约束指标的中继路径的自主学习和中继节点的动态选择问题。
本发明是这样实现的,一种自组织网络基于时延约束的Q学习分组传输方法,所述自组织网络基于时延约束的Q学习分组传输方法通过网络节点自主学习通往目的节点的不同路径的端到端时延参数;网络节点在面临多个通往目的节点且满足时延约束指标的下一跳时,将不同中继节点的端到端传输时延归一化处理后作为每一次传输时的选择概率,动态选择下一跳节点,从而提升网络端到端传输性能。
进一步,所述自组织网络基于时延约束的Q学习分组传输方法包括以下步骤:
步骤一:对去往目的节点的Q表进行初始化,设置时延奖励值,设定端到端时延约束指标;
步骤二:根据Q表选择去往目的节点的下一跳节点,发送前向控制报文;
步骤三:收到前向控制报文的下一跳节点向发送节点回复反向控制报文;
步骤四:收到前向控制报文的下一跳节点若非目的节点则转发前向控制报文;
步骤五:发送节点收到反向控制报文,对Q表进行更新;
步骤六:间隔一段时间,重复步骤二至步骤五。
进一步,所述步骤一中,任意节点u的Q表初始化方法如下:
Q表至少包括目的节点IP地址、下一跳节点IP地址和Q值字段;其中下一跳节点IP地址字段存放由本节点去往目的节点的下一跳节点的IP地址,Q值字段存放下一跳节点IP地址对应的Q值,初始化为0。
进一步,所述步骤一中,任意节点u设置奖励值au→d的方法如下:
当目的节点不是本节点时,au→d=0,当目的节点是本节点时,au→d=Ad,Ad为一正常量。
进一步,所述步骤二中,任意节点u选择去往目的节点d的下一跳节点的方法如下:
根据Q表中的值去往目的节点的下一跳节点的选择概率
p v u → d = q v u → d / Σ v ∈ N u → d q v u → d ;
其中为节点u选择节点v作为下一跳传输至目的节点d的Q值,Nu→d为节点u去往目的节点d的所有满足时延约束指标的可选下一跳节点构成的集合;
任意节点u按概率选择下一跳节点,发送前向控制报文,前向控制报文至少包含控制报文类型、发送节点IP地址、下一跳节点IP地址、目的节点IP地址、报文发送时间字段。
进一步,所述步骤三中,节点v收到来至节点u的前向控制报文后的处理方法如下:
节点v从收到的报文中获得前向控制报文的发送时间,根据报文的接收时间计算报文的传输时延du→v
节点v获得关于目的节点d的奖励值av→d,计算去往目的节点d的Q表的期望值
q ‾ v → d = Σ w ∈ N v → d p w v → d · q w v → d ;
其中Nv→d为节点v去往目的节点d的所有满足时延约束指标的可选下一跳节点构成的集合;
节点v向节点u发送反向控制报文;反向控制报文至少包含控制报文类型、本节点的奖励值av→d、发送节点到本节点的传输时延du→v、本节点去往目的节点Q表的期望值
进一步,所述步骤五中,发送节点u收到来至下一跳节点v的反向控制报文后的处理方法如下:
节点u计算本次所选择去往目的节点d的下一跳节点v所获得的回报值,计算公式如下:
r v u → d = a v → d + γ * q ‾ v → d - q v u → d - d u → v , γ ∈ ( 0 , 1 ] ;
更新Q表中节点u通过选择下一跳节点v传输至目的节点d对应的Q值:
间隔一段时间,重复步骤二至步骤四。
进一步,所述数据报文的传输方法具体包括如下步骤:
步骤一:任意需要传输数据报文的节点u查询去往目的节点d的Q表,计算去往目的节点的下一跳节点的选择概率;
步骤二:依概率选择去往目的节点的下一跳节点v;
步骤三:将数据转发至下一跳v;
步骤四:收到数据报文的节点v重复步骤一至步骤三,直到数据报文送达目的节点d。
进一步,所述步骤二中,任意节点u选择去往目的节点d的下一跳节点的方法如下:
根据Q表中的值设定去往目的节点的下一跳节点的选择概率
其中为节点u选择节点v作为下一跳传输至目的节点d的Q值,Nu→d为节点u去往目的节点d的所有满足时延约束指标的可选下一跳节点构成的集合。
本发明提供的自组织网络基于时延约束的Q学习分组传输方法,主要用于当无线自组织网络中的节点面临多个通往目的节点的下一跳且端到端时延参数时变情况下,如何进行满足时延约束指标的中继路径的自主学习和中继节点的动态选择。本发明网络节点自主学习通往目的节点的不同路径的端到端时延参数;网络节点在面临多个通往目的节点且满足时延约束指标的下一跳时,将不同中继节点的端到端传输时延归一化处理后作为每一次传输时的选择概率,动态选择下一跳节点。本发明通过节点自身对网络环境的学习,可以不断适应网络环境的变化,做出满足时延约束的传输方法;通过将时延约束与Q学习算法相结合的无线网络分组传输机制提升了无线自组织网络的端到端传输性能。
附图说明
图1是本发明实施例提供的网络拓扑示例示意图。
图2是本发明实施例提供的Q学习算法框图。
图3是本发明实施例提供的初始化时各节点Q表值。
图4是本发明实施例提供的首次Q学习过程演示。
图5是本发明实施例提供的再次Q学习过程演示。
图6是本发明实施例提供的Q学习算法收敛之后Q表值。
图7是本发明实施例提供的数据报文传输框图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
下面结合附图对本发明的应用原理作详细的描述。
网络拓扑示例如图1所示,共9个节点形成自组织网络。考虑源节点为1号节点,目的节点为9号节点,其余节点为中间节点。
网络拓扑对应的时延矩阵D为(单位:毫秒):
D = 0 10 inf 4 inf inf inf inf inf 10 0 20 inf 15 inf inf inf inf inf 20 0 inf inf 20 inf inf inf 4 inf inf 0 5 inf 5 inf inf inf 15 inf 5 0 7 inf 5 inf inf inf 20 inf 7 0 inf inf 8 inf inf inf 5 inf inf 0 6 inf inf inf inf inf 5 inf 6 0 5 inf inf inf inf inf 8 inf 5 0 ;
(1)无线自组织网络基于时延约束的Q学习分组传输方法
由于无线自组织网络的性能随着路由跳数的增加而急剧下降。本实例主要考虑5跳以内的无线自组织网络。
不同的应用通常时延约束也不一样。例如,IP双向通话时延约束通常为100-600毫秒,而单向视频传输的时延约束更加宽松。因此,本实例主要考虑支持IP双向通话业务,时延约束指标为100毫秒。
节点1至节点9的时延奖励值(单位:毫秒)分别设定为:0,0,0,0,0,0,0,0,100。
节点u选择去往目的节点d的下一跳节点v所获得的回报值采用以下函数计算:
r v u → d = a v → d + γ * q ‾ v → d - q v u → d - d u → v ;
其中av→d表示节点v关于目的节点d的时延奖励值,为节点v去往目的节点d的Q表的期望值,为当前节点u选择节点v作为下一跳传输至目的节点d的Q值,du→v表示节点u到节点v的传输时延,本示例中γ取值为0.95。
更新规则:
q v ′ u → d = q v u → d + α · r v u → d ;
其中表示更新后的节点u选择节点v作为下一跳传输至目的节点d的Q值,为当前节点u选择节点v作为下一跳传输至目的节点d的Q值,本示例中α取值为0.95。
图2为Q学习算法框图。
图3表示的是网络初始化时各节点Q表中的值,初始化后各节点Q表中的值均为0。
图4展示了源节点1到目的节点9的首次Q学习过程。
由图4(a)可知,源节点1有数据需要发送至节点9时,启动Q学习算法;节点1首先根据Q表发现对应的下一跳节点2和节点4的Q值相等(初始化都为0),于是等概率选择了节点2作为下一跳节点,向节点2发送前向控制报文,节点2收到前向控制报文之后,计算报文的传输时延为10毫秒;获得关于目的节点9的时延奖励值0,计算去往目的节点9的Q表期望值为0,节点2向节点1发送包含本节点的时延奖励值、传输时延、去往目的节点的Q表期望值的反向控制报文。节点1收到节点2发送的反向控制报文之后,计算选择节点2作为下一跳的回报为-10毫秒,进而得到新的Q值为-9.5毫秒。
由图4(b)可知,节点2收到节点1发送的前向控制报文之后,发现自己并非目的节点9,节点2根据Q表发现对应的下一跳节点3和节点5的Q值相等(初始化都为0),于是等概率选择了节点5作为下一跳节点,向节点5发送前向控制报文,节点5收到节点2转发的前向控制报文之后,计算报文的传输时延为15毫秒;获得关于目的节点9的时延奖励值0,计算去往目的节点9的Q表期望值为0,节点5向节点2发送反向控制报文。节点2收到节点5发送的反向控制报文之后,计算选择节点5作为下一跳的新的Q值为-14.3毫秒。
由图4(c)可知,节点5选择节点6作为下一跳,并获得选择节点6作为下一跳的新的Q值为-6.65毫秒。
由图4(d)可知,节点6选择节点9作为下一跳,与之前的节点不同的是,节点9为目的节点,关于目的节点9的时延奖励值为100毫秒,因而节点6选择节点9作为下一跳的新的Q值为87.4毫秒。
图5展示了源节点1到目的节点9的再次Q学习过程。
由图5(a)可知,节点1根据Q表发现对应的下一跳节点2和节点4的Q并不相同,于是按照概率选择了节点4作为下一跳节点,向节点4发送前向控制报文;节点4收到前向控制报文之后,计算报文的传输时延为4毫秒;获得关于目的节点9的时延奖励值0,计算去往目的节点9的Q表期望值为0,节点4向节点1发送反向控制报文。节点1收到节点4发送的反向控制报文之后,计算选择节点4作为下一跳的回报为-4毫秒,进而得到新的Q值为-3.8毫秒。
由图5(b)可知,节点4收到节点1发送的前向控制报文之后,发现自己并非目的节点9,节点4根据Q表按照概率选择向节点5发送前向控制报文,节点5收到节点4转发的前向控制报文之后,计算报文的传输时延为5毫秒;获得关于目的节点9的时延奖励值0,计算去往目的节点9的Q表期望值为0,节点5向节点4发送反向控制报文。节点4收到节点5发送的反向控制报文之后,计算选择节点5作为下一跳的新的Q值为-4.75毫秒。
由图5(c)可知,节点5选择节点6作为下一跳,并获得选择节点6作为下一跳的新的Q值为71.9毫秒。
由图5(d)可知,节点6选择节点9作为下一跳,并获得选择节点9作为下一跳的Q值为91.77毫秒。
图6为重复以上Q学习步骤,直到Q学习算法收敛之后各节点的Q表中的Q值。
(2)数据报文的传输方法
任意需要传输数据报文的节点查询去往目的节点的Q表,计算去往目的节点的下一跳节点的选择概率;依概率选择去往目的节点的下一跳节点;将数据转发至下一跳;收到数据报文的节点重复以上步骤,直到数据报文送达目的节点。图7为数据报文传输框图。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

Claims (9)

1.一种自组织网络基于时延约束的Q学习分组传输方法,其特征在于,所述自组织网络基于时延约束的Q学习分组传输方法通过Q学习算法优化网络分组的传输;网络节点通过进行Q学习,在面临多个通往目的节点的下一跳时做出合理选择。
2.如权利要求1所述的自组织网络基于时延约束的Q学习分组传输方法,其特征在于,所述自组织网络基于时延约束的Q学习分组传输方法包括以下步骤:
步骤一:对去往目的节点的Q表进行初始化,设置时延奖励值,设置端到端时延约束指标;
步骤二:根据Q表选择去往目的节点的下一跳节点,发送前向控制报文;
步骤三:收到前向控制报文的下一跳节点向发送节点回复反向控制报文;
步骤四:收到前向控制报文的下一跳节点若非目的节点则转发前向控制报文;
步骤五:发送节点收到反向控制报文,对Q表进行更新;
步骤六:间隔一段时间,重复步骤二至步骤五。
3.如权利要求2所述的自组织网络基于时延约束的Q学习分组传输方法,其特征在于,所述步骤一中,任意节点u的Q表初始化方法如下:
Q表至少包括目的节点IP地址、下一跳节点IP地址和Q值字段;其中下一跳节点IP地址字段存放由本节点去往目的节点的下一跳节点的IP地址,Q值字段存放下一跳节点IP地址对应的Q值,初始化为0。
4.如权利要求2所述的自组织网络基于时延约束的Q学习分组传输方法,其特征在于,所述步骤一中,任意节点u设置奖励值au→d的方法如下:
当目的节点不是本节点时,au→d=0,当目的节点是本节点时,au→d=Ad,Ad为一正常量。
5.如权利要求2所述的自组织网络基于时延约束的Q学习分组传输方法,其特征在于,所述步骤二中,任意节点u选择去往目的节点d的下一跳节点的方法如下:
根据Q表中的值去往目的节点的下一跳节点的选择概率
p v u → d = q v u → d / Σ v ∈ N u → d q v u → d ;
其中为节点u选择节点v作为下一跳传输至目的节点d的Q值,Nu→d为节点u去往目的节点d的所有满足时延约束指标的可选下一跳节点构成的集合;
任意节点u按概率选择下一跳节点,发送前向控制报文,前向控制报文至少包含控制报文类型、发送节点IP地址、下一跳节点IP地址、目的节点IP地址、报文发送时间字段。
6.如权利要求2所述的自组织网络基于时延约束的Q学习分组传输方法,其特征在于,所述步骤三中,节点v收到来至节点u的前向控制报文后的处理方法如下:
节点v从收到的报文中获得前向控制报文的发送时间,根据报文的接收时间计算报文的传输时延du→v
节点v获得关于目的节点d的奖励值av→d,计算去往目的节点d的Q表的期望值
q ‾ v → d = Σ w ∈ N v → d p w v → d · q w v → d ;
其中w∈Nv→d,Nv→d为节点v去往目的节点d的所有可选下一跳节点构成的集合;
节点v向节点u发送反向控制报文;反向控制报文至少包含控制报文类型、本节点的奖励值av→d、发送节点到本节点的传输时延du→v、本节点去往目的节点Q表的期望值
7.如权利要求2所述的自组织网络基于时延约束的Q学习分组传输方法,其特征在于,所述步骤五中,发送节点u收到来至下一跳节点v的反向控制报文后的处理方法如下:
节点u计算本次所选择去往目的节点d的下一跳节点v所获得的回报值,计算公式如下:
r v u → d = a v → d + γ * q ‾ v → d - q v u → d - d u → v , γ ∈ ( 0 , 1 ] ;
更新Q表中节点u通过选择下一跳节点v传输至目的节点d对应的Q值:
间隔一段时间,重复步骤二至步骤四。
8.如权利要求2所述的自组织网络基于时延约束的Q学习分组传输方法,其特征在于,所述数据报文的传输方法具体包括如下步骤:
步骤一:任意需要传输数据报文的节点u查询去往目的节点d的Q表,计算去往目的节点的下一跳节点的选择概率;
步骤二:依概率选择去往目的节点的下一跳节点v;
步骤三:将数据转发至下一跳v;
步骤四:收到数据报文的节点v重复步骤一至步骤三,直到数据报文送达目的节点d。
9.如权利要求8所述的自组织网络基于时延约束的Q学习分组传输方法,其特征在于,所述步骤二中,任意节点u选择去往目的节点d的下一跳节点的方法如下:
根据Q表中的值设定去往目的节点的下一跳节点的选择概率
其中为节点u选择节点v作为下一跳传输至目的节点d的Q值,Nu→d为节点u去往目的节点d的所有满足时延约束指标的可选下一跳节点构成的集合。
CN201610221659.9A 2016-04-11 2016-04-11 一种自组织网络基于时延约束的q学习分组传输方法 Expired - Fee Related CN105897585B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610221659.9A CN105897585B (zh) 2016-04-11 2016-04-11 一种自组织网络基于时延约束的q学习分组传输方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610221659.9A CN105897585B (zh) 2016-04-11 2016-04-11 一种自组织网络基于时延约束的q学习分组传输方法

Publications (2)

Publication Number Publication Date
CN105897585A true CN105897585A (zh) 2016-08-24
CN105897585B CN105897585B (zh) 2019-07-23

Family

ID=57012515

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610221659.9A Expired - Fee Related CN105897585B (zh) 2016-04-11 2016-04-11 一种自组织网络基于时延约束的q学习分组传输方法

Country Status (1)

Country Link
CN (1) CN105897585B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106358203A (zh) * 2016-08-30 2017-01-25 湖南大学 一种分布式认知无线传感器网络中基于q学习的频谱分配方法

Citations (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1843283A1 (en) * 2006-04-03 2007-10-10 BRITISH TELECOMMUNICATIONS public limited company Autonomous systems for routing data via a communications network
CN101715225A (zh) * 2009-11-20 2010-05-26 西安电子科技大学 认知网络中的自适应自组网络路由方法
CN101835239A (zh) * 2010-03-09 2010-09-15 西安电子科技大学 认知网络多路径时延感知最佳路由选择方法
CN102427596A (zh) * 2011-11-30 2012-04-25 清华大学 基于定位信息辅助的节点移动网络的路由方法及调度方法
CN102711285A (zh) * 2012-04-28 2012-10-03 西南科技大学 一种无线自组织网络表驱动跨层路由学习方法
CN102723112A (zh) * 2012-06-08 2012-10-10 西南大学 一种基于忆阻交叉阵列的q学习系统
CN102868972A (zh) * 2012-09-05 2013-01-09 河海大学常州校区 基于改进q学习算法的物联网错误传感器节点定位方法
CN103702387A (zh) * 2014-01-08 2014-04-02 重庆邮电大学 一种基于社会网络的车载自组织网络路由方法
CN103974366A (zh) * 2014-04-28 2014-08-06 南京邮电大学 一种基于增强学习的无线体域网路由方法
US20140223562A1 (en) * 2008-09-26 2014-08-07 Oracle International Corporation System and Method for Distributed Denial of Service Identification and Prevention
CN104035889A (zh) * 2014-06-18 2014-09-10 中国人民解放军信息工程大学 一种多态路由派生方法及系统
CN104640168A (zh) * 2014-12-04 2015-05-20 北京理工大学 基于q学习的车载自组织网络路由方法
CN104684040A (zh) * 2015-03-09 2015-06-03 西安电子科技大学 基于模糊推理的q学习车载网建立路由路径的方法
CN105208616A (zh) * 2015-06-17 2015-12-30 重庆邮电大学 车载自组织网络中基于道路拓扑的自适应多副本路由方法

Patent Citations (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1843283A1 (en) * 2006-04-03 2007-10-10 BRITISH TELECOMMUNICATIONS public limited company Autonomous systems for routing data via a communications network
US20140223562A1 (en) * 2008-09-26 2014-08-07 Oracle International Corporation System and Method for Distributed Denial of Service Identification and Prevention
CN101715225A (zh) * 2009-11-20 2010-05-26 西安电子科技大学 认知网络中的自适应自组网络路由方法
CN101835239A (zh) * 2010-03-09 2010-09-15 西安电子科技大学 认知网络多路径时延感知最佳路由选择方法
CN102427596A (zh) * 2011-11-30 2012-04-25 清华大学 基于定位信息辅助的节点移动网络的路由方法及调度方法
CN102711285A (zh) * 2012-04-28 2012-10-03 西南科技大学 一种无线自组织网络表驱动跨层路由学习方法
CN102723112A (zh) * 2012-06-08 2012-10-10 西南大学 一种基于忆阻交叉阵列的q学习系统
CN102868972A (zh) * 2012-09-05 2013-01-09 河海大学常州校区 基于改进q学习算法的物联网错误传感器节点定位方法
CN103702387A (zh) * 2014-01-08 2014-04-02 重庆邮电大学 一种基于社会网络的车载自组织网络路由方法
CN103974366A (zh) * 2014-04-28 2014-08-06 南京邮电大学 一种基于增强学习的无线体域网路由方法
CN104035889A (zh) * 2014-06-18 2014-09-10 中国人民解放军信息工程大学 一种多态路由派生方法及系统
CN104640168A (zh) * 2014-12-04 2015-05-20 北京理工大学 基于q学习的车载自组织网络路由方法
CN104684040A (zh) * 2015-03-09 2015-06-03 西安电子科技大学 基于模糊推理的q学习车载网建立路由路径的方法
CN105208616A (zh) * 2015-06-17 2015-12-30 重庆邮电大学 车载自组织网络中基于道路拓扑的自适应多副本路由方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
高洋: "MANETs网络基于Q学习和网络编码的传输技术研究", 《万方学位论文库》 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106358203A (zh) * 2016-08-30 2017-01-25 湖南大学 一种分布式认知无线传感器网络中基于q学习的频谱分配方法

Also Published As

Publication number Publication date
CN105897585B (zh) 2019-07-23

Similar Documents

Publication Publication Date Title
US8199677B1 (en) Distance vector routing via multi-point relays
Singh et al. Antalg: An innovative aco based routing algorithm for manets
Halford et al. Barrage relay networks
JP5334386B2 (ja) 協調型リレーネットワークにおける最適経路を選択する方法およびシステム
Razzaque et al. QoS-aware distributed adaptive cooperative routing in wireless sensor networks
JP5293744B2 (ja) ネットワーク通信システム、ノード装置、ルーティング方法、および、ルーティングプログラム
Rajeshkumar et al. Comparative study of AODV, DSDV and DSR routing protocols in MANET using network simulator-2
WO2004114690B1 (en) Optimal routing in ad hac wireless communication network
WO2004110082B1 (en) System and method for determining location of a device in a wireless communication network
Yi et al. Scalable team multicast in wireless ad hoc networks exploiting coordinated motion
Wen et al. Delay‐Constrained Routing Based on Stochastic Model for Flying Ad Hoc Networks
CN107690170B (zh) 基于位置和任务规划的动态路由计算方法
CN105307231A (zh) 基于相遇概率与社会分析的容忍延迟网络路由实现方法
CN105897585A (zh) 一种自组织网络基于时延约束的q学习分组传输方法
Gálvez et al. Multipath routing with spatial separation in wireless multi-hop networks without location information
Ghosh et al. Empirical evaluation of the heat-diffusion collection protocol for wireless sensor networks
Groba Synchronising service compositions in dynamic ad hoc environments
Ouferhat et al. QoS dynamic routing for wireless sensor networks
CN109922466A (zh) 一种在多节点无线传输系统中实现定向数据访问的方法
Alnajjar et al. Social-stratification probabilistic routing algorithm in delay-tolerant network
Newton et al. Geographic routing in large-scale highly-dynamic mobile ad-hoc networks
Sagduyu et al. Analytical framework for MANET learning and routing
Sharma et al. Termite colony optimization based routing in wireless mesh networks
Jaffar et al. SIBCast: Swarm Intelligence based broadcasting for Mobile Ad hoc Networks
Sandeep et al. Energy efficient neighbor coverage-based probabilistic rebroadcasting in MANET

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20190723

Termination date: 20210411

CF01 Termination of patent right due to non-payment of annual fee