CN113490239A - 基于自适应网络编码的异构无线链路并发传输控制方法 - Google Patents

基于自适应网络编码的异构无线链路并发传输控制方法 Download PDF

Info

Publication number
CN113490239A
CN113490239A CN202110784463.1A CN202110784463A CN113490239A CN 113490239 A CN113490239 A CN 113490239A CN 202110784463 A CN202110784463 A CN 202110784463A CN 113490239 A CN113490239 A CN 113490239A
Authority
CN
China
Prior art keywords
coding
path
data packet
packet
size
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110784463.1A
Other languages
English (en)
Other versions
CN113490239B (zh
Inventor
朱晓荣
王伟
赵夙
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing University of Posts and Telecommunications
Original Assignee
Nanjing University of Posts and Telecommunications
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing University of Posts and Telecommunications filed Critical Nanjing University of Posts and Telecommunications
Priority to CN202110784463.1A priority Critical patent/CN113490239B/zh
Publication of CN113490239A publication Critical patent/CN113490239A/zh
Application granted granted Critical
Publication of CN113490239B publication Critical patent/CN113490239B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W28/00Network traffic management; Network resource management
    • H04W28/16Central resource management; Negotiation of resources or communication parameters, e.g. negotiating bandwidth or QoS [Quality of Service]
    • H04W28/18Negotiating wireless communication parameters
    • H04W28/22Negotiating communication rate
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D30/00Reducing energy consumption in communication networks
    • Y02D30/70Reducing energy consumption in communication networks in wireless communication networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明公开了一种基于自适应网络编码的异构无线链路并发传输控制方法,包括:基于A3C构建自适应编码决策模型;确定编码分组大小N和编码分组内数据包冗余大小R;定义两个编码矩阵:原始数据包的编码矩阵和冗余编码矩阵,根据编码分组大小和编码分组内冗余数据包大小,从相应的编码矩阵选择编码系数,编码生成N+R个编码数据包;针对编码生成N+R个编码数据包,基于路径质量对数据包进行分发:在每一次调度分发时,衡量每条路径的质量,选取质量最优的路径将编码的数据包调度到该路径的缓存中。本发明解决了异构无线链路多路径传输存在的乱序问题,有效提升系统吞吐量。

Description

基于自适应网络编码的异构无线链路并发传输控制方法
技术领域
本发明涉及无线通信技术领域,具体而言涉及一种基于自适应网络编码的异构无线链路并发传输控制方法。
背景技术
随着超高清视频直播、无人驾驶、虚拟现实、远程医疗等业务的不断兴起,人们对带宽、时延的要求不断提高。随着5G网络的不断部署与普及,这些需求不断得到满足,但5G网络很难满足人们对高带宽、低时延的需求。未来的网络将是多种网络共存的异构网络,任何单一的网络将无法满足人们个性化的需求。与此同时,随着智能硬件的普及,越来越多的终端设备装备有多种类型的网络接口,例如WiFi,4G LTE和5G NR等等,使得一个用户终端同时具有访问目标通信节点的多条链路,实现多路径并行传输,将可以利用的网络信道同时利用,以达到提高传输效率的目的。多路径并行传输在有线网络中的应用已经相对成熟。然而,在无线网络环境中,由于无线网络环境中的链路具有动态性和不可靠性,物理链路属性本身具有的差异,加上移动终端的移动性导致的异构无线网络发生动态性变化,会严重影响传输效率,降低了传输性能。由于链路之间的差异性,多路径传输不可避免的产生队头阻塞,缓冲区拥塞,不必要的快速重传,接收乱序等现象。
发明内容
本发明针对现有技术中的不足,提供一种基于自适应网络编码的异构无线链路并发传输控制方法,将强化学习和网络编码相结合,采用网络编码技术打破数据包序列号和交付顺序之间的强约束关系,基于强化学习通过与环境进行交互,学习出最优的网络编码策略,从而解决了异构无线链路多路径传输存在的乱序问题,有效提升系统吞吐量。
为实现上述目的,本发明采用以下技术方案:
第一方面,本发明实施例提出了一种基于自适应网络编码的异构无线链路并发传输控制方法,所述控制方法包括以下步骤:
S1,基于A3C构建自适应编码决策模型,定义A3C强化学习参数,强化学习参数至少包括路径状态集、编码动作集和用于衡量动作执行好坏的奖励函数;
S2,对全局代理的神经网络参数θc和θa进行迭代优化,采用优化参数后的自适应编码决策模型获取最优编码策略,确定编码分组大小N和编码分组内数据包冗余大小R,N和R均是大于1的整数值;
S3,定义两个编码矩阵:原始数据包的编码矩阵Cp和冗余编码矩阵Cr,根据编码分组大小和编码分组内冗余数据包大小,从相应的编码矩阵选择编码系数,编码生成N+R个编码数据包;
S4,针对编码生成N+R个编码数据包,基于路径质量对数据包进行分发:在每一次调度分发时,衡量每条路径的质量,选取质量最优的路径将编码的数据包调度到该路径的缓存中。
可选地,所述控制方法还包括:
S5,接收方根据接收到的数据包,确定解码矩阵,解码出原始数据包,递交上层应用。
可选地,步骤S1中,所述定义模型参数的过程包括以下步骤:
S11,设定路径状态集St为:
St={Bwt,Buffert,(N,R),T,Tt,Plt}
式中,Bwt={Bwt,1,Bwt,2,...,Bwt,I},Bwt,i表示t时刻路径i的带宽大小,I表示链路总数;Buffert表示t时刻视频缓存,(N,R)表示过去时刻选择的编码分组大小N和R;T表示当前分组传输时延;Tt={Tt,1,Tt,2…,Tt,I},Tt,i表示t时刻路径i的下载时延;Plt={Plt,1,Plt,2,...,Plt,I},Plt,i表示t时刻路径i的丢包率,1≤i≤I;
S12,设定动作集at为:
at={N,R}
式中,N表示编码分组大小,R表示分组内冗余数据包大小,N和R都是整数值;
S13,定义状态转移概率
Figure BDA0003158605880000021
Figure BDA0003158605880000022
S14,定义奖励函数rt:
Figure BDA0003158605880000023
式中,
Figure BDA0003158605880000024
表示最大化吞吐量,其中Bwt,i表示t时刻路径i的带宽大小;α是重新缓冲的惩罚因子,rebuf表示重新缓冲的时间;β表示时延惩罚因子,T=MAX(Tt,i)(1≤i≤I)表示总的下载时延;γ表示缓冲区惩罚因子,
Figure BDA0003158605880000025
B1,B2是缓冲区上下限阈值,θ为缓冲区调节因子,0≤θ≤1。
可选地,步骤S2中,对全局代理的神经网络参数θc和θa进行迭代优化的过程包括:
S201,输入全局代理的神经网络参数θc和θa、全局最大的迭代次数M,令全局迭代次数m=1;
S202,初始化时间t=0;
S203,初始化起始状态st=s0;初始化神经网络参数增量dθc=0,dθa=0;将全局代理的神经网络参数赋值给局部代理θc=θc,θa=θa;s0表示t=0时的网络状态;
S204,设t=1;
S205,基于策略π(at|st;0′a),执行动作at,从视频播放环境中获得奖励值rt和新的状态st+1
S206,令t=t+1,m=m+1;重第步骤S205,直至t=N+1;
S207,计算状态sN的值函数
Figure BDA0003158605880000031
S208,令i=N-1;
S209,更新θa的增量
Figure BDA0003158605880000032
Figure BDA0003158605880000033
更新θc的增量
Figure BDA0003158605880000034
Figure BDA0003158605880000035
式中,
Figure BDA0003158605880000036
表示优势函数,即运用策略π(θa)所获奖励与预期奖励的差值。H(·)表示正则化熵值,以保证决策代理充分地探索环境空间,γ(0<γ≤1)表示折扣因子;
S210,令i=i-1,重复步骤S209,直至i=0;
S211,更新全局代理的网络参数θa←θa+wdθa,θc←θc-αdθc;其中,w表示Actor网络的更新步长,a表示Critic网络的更新步长;
S212,令m=m+1,重复步骤S23至S211,直至m>M,输出迭代后的网络参数θc和θa
可选地,步骤S3中,编码生成N+R个编码数据包的过程包括以下步骤:
S31,定义两个编码矩阵:原始数据包的编码矩阵Cp和冗余编码矩阵Cr
Figure BDA0003158605880000037
Figure BDA0003158605880000041
其中,cij表示高斯域GF(28)中的数,矩阵Cp和Cr中的每一行都是线性无关的;i和j表示第i行第j列的编码系数;
S32,取原始数据包的编码矩阵Cp的前N行作为原始数据包的编码系数矩阵,取冗余编码矩阵Cr的前R行作为冗余数据包的编码系数矩阵,编码生成N+R个编码数据包。
可选地,步骤S4中,针对编码生成N+R个编码数据包,基于路径质量对数据包进行分发的过程包括以下步骤:
根据下述公式计算每条路径的路径质量:
Qi=(effwndi-unAcki)*(1-Pli)
其中,effwndi表示路径i的有效窗口,unAcki表示已经发送但还未确认的数据包个数,Pli表示路径i的丢包率;
选取所有路径中Qi值最大的路径,将数据包调度到该路径的发送缓存上。
第二方面,本发明实施例提出了一种基于自适应网络编码的异构无线链路并发传输控制系统,所述控制系统包括:
基于A3C构建自适应编码决策模型,其模型参数至少包括路径状态集、编码动作集和用于衡量动作执行好坏的奖励函数;
强化学习模块,用于对全局代理的神经网络参数θc和θa进行迭代优化,采用优化参数后的自适应编码决策模型获取最优编码策略,确定编码分组大小N和编码分组内数据包冗余大小R;
网络编码模块,用于定义两个编码矩阵:原始数据包的编码矩阵Cp和冗余编码矩阵Cr,根据编码分组大小和编码分组内冗余数据包大小,从相应的编码矩阵选择编码系数,编码生成N+R个编码数据包;
数据包分组模块,用于基于强化学习模块获得的编码分组大小对数据包进行分组;
基于路径质量的数据分发模块,用于针对编码生成N+R个编码数据包,基于路径质量对数据包进行分发:在每一次调度分发时,衡量每条路径的质量,选取质量最优的路径将编码的数据包调度到该路径的缓存中;
网络解码模块,用于根据接收到的数据包,确定解码矩阵,解码出原始数据包,递交上层应用。
本发明的有益效果是:
本发明针对异构无线链路并发传输存在的数据包乱序问题,将强化学习和网络编码相结合,采用网络编码技术打破数据包序列号和交付顺序之间的强约束关系,基于强化学习通过与环境进行交互,学习出最优的网络编码策略,从而解决了异构无线链路多路径传输存在的乱序问题,有效提升系统吞吐量。
附图说明
图1是本发明实施例的基于自适应网络编码的异构无线链路并发传输控制方法流程图。
图2为本发明实施例的基于自适应网络编码的异构无线链路并发传输控制系统结构图。
图3为本发明实施例的自适应网络编码原理示意图。
具体实施方式
现在结合附图对本发明作进一步详细的说明。
需要注意的是,发明中所引用的如“上”、“下”、“左”、“右”、“前”、“后”等的用语,亦仅为便于叙述的明了,而非用以限定本发明可实施的范围,其相对关系的改变或调整,在无实质变更技术内容下,当亦视为本发明可实施的范畴。
实施例一
图1是本发明实施例的基于自适应网络编码的异构无线链路并发传输控制方法流程图。该控制方法包括以下步骤:
S1,基于A3C构建自适应编码决策模型,定义模型参数,模型参数至少包括路径状态集、编码动作集和用于衡量动作执行好坏的奖励函数。
步骤S1.1、状态集的定义:网络环境的状态是决策的依据。为了决策出编码分组大小N和编码分组内冗余数据包大小R,需要获取当前每条路径的状态信息。设定状态集为:S={Bwt,Buffert,(N,R),T,Tt,Plt},其中,Bwt={Bwt,1,Bt,2…,Bt,I},Bwt,i表示t时刻路径i的平均带宽大小,I表示链路总数,Buffert表示t时刻视频缓存,(N,R)表示过去时刻选择的编码分组大小N和R,T表示当前组传输时延(包括编码包和冗余数据包),Tt={Tt,1,Tt,2…,Tt,I},Tt,i表示t时刻路径i的下载时延。Plt={Plt,1,Plt,2,...,Plt,I},Plt,i表示t时刻路径i的丢包率。以上定义中,i的取值范围是(1≤i≤I)。
步骤S1.2、动作集的定义:at={N,R},其中N表示编码分组大小,R表示分组内冗余数据包大小。其中N和R都是整数值。
步骤S1.3、状态转移概率的定义:状态转移概率是指,在执行动作at后,环境状态由st转移到st+1的概率。由于强化学习任务具有马尔可夫特性,即下一时刻的状态只由当前时刻的状态决定,因此,状态转移概率
Figure BDA0003158605880000051
可表示为:
Figure BDA0003158605880000052
步骤S1.4、奖励函数的定义:执行动作后,强化学习环境会反馈一个奖励值,以衡量动作执行的好坏。目标是使得视频传输的吞吐量最大,因此,奖励函数定义为:
Figure BDA0003158605880000061
Figure BDA0003158605880000062
其中,第一项
Figure BDA0003158605880000063
表示最大化吞吐量,其中i(1≤i≤I)表示路径i,I表示总的路径数;第二项中α是重新缓冲的惩罚因子,rebuf表示重新缓冲的时间;第三项中β表示时延惩罚因子,其中T=MAX(Tt,i)(1≤i≤I)表示总的下载时延;第四项中γ表示缓冲区惩罚因子,其中
Figure BDA0003158605880000064
其中B1,B2是缓冲区上下限阈值,θ(0≤θ≤1)为缓冲区调节因子。
S2,对全局代理的神经网络参数θc和θa进行迭代优化,采用优化参数后的自适应编码决策模型获取最优编码策略,确定编码分组大小N和编码分组内数据包冗余大小R。
该步骤的输入为全局代理的神经网络参数θc和θa,全局迭代次数m,全局最大的迭代次数M,输出为迭代后的神经网络参数θc和θa。S3,定义两个编码矩阵:原始数据包的编码矩阵Cp和冗余编码矩阵Cr,根据编码分组大小和编码分组内冗余数据包大小,从相应的编码矩阵选择编码系数,编码生成N+R个编码数据包。
步骤S3.1、编码分组大小和编码分组内数据包冗余大小的确定:基于步骤S2,获得自适应编码决策结果。
步骤S3.2、编码矩阵的确定:网络编码可以打破数据包序列号和交付顺序之间的强约束关系。对于编码矩阵的使用,定义两个编码矩阵,一个为原始数据包的编码矩阵Cp,另一个为冗余编码矩阵Cr
Figure BDA0003158605880000065
Figure BDA0003158605880000066
其中,cij表示高斯域GF(28)中的数,矩阵Cp和Cr中的每一行都是线性无关的,从而保证在接收端的可解性。
步骤S3.4、编码数据包和冗余数据包的生成:根据编码分组大小和编码分组内冗余数据包大小,从相应的编码矩阵选择编码系数。首先,对于分组大小N,取原始数据包的编码矩阵Cp的前N行作为原始数据包的编码系数矩阵,其次,对于编码分组内冗余数据包大小R,取冗余编码矩阵Cr的前R行作为冗余数据包的编码系数矩阵。编码生成N+R个编码数据包。
自适应网络编码原理示意图如图3所示,Gi表示第i个分组,Pi表示第i个原始数据包,Ci表示编码完成的数据包。例如:对于第一个编码分组G1,编码分组大小N=3,冗余大小R=1。表示将三个数据包作为一组进行编码,同时还需要一个冗余的编码包C3。在无线网络传输过程中,由于网络原因造成丢包,如图中所示,数据包C3在传输过程中丢失了,因为在发送端增加了冗余包C3,所以接收端仍然可以解出原始数据包,这样,可以有效的避免数据包的重传。同时,对于接收方来说,及时数据包乱序到达,只要接收方收到足够数量的数据包,就可以解出原始的数据包,而不关心数据包的序列号。因此,网络编码可以打破数据包序列号和交付顺序之间的强约束关系。
S4,针对编码生成N+R个编码数据包,基于路径质量对数据包进行分发:在每一次调度分发时,衡量每条路径的质量,选取质量最优的路径将编码的数据包调度到该路径的缓存中。
具体地,针对步骤S3.4生成的编码数据包,分发到多条链路进行传输。由于采用网络编码,打破了打破数据包序列号和交付顺序之间的强约束关系。接收方并不关心接收的数据包的顺序,只需要接收足够的数据包就可以求解出原始的数据包,所以在发送方进行调度时,希望将编码完成的数据包尽快发送出去。基于路径质量的数据包分发算法在每一次调度分发时将根据每条路径的质量,选取最优的路径将编码的数据包调度到该路径的缓存中。路径i的质量定义为:Qi=(effwndi-unAcki)*(1-Pli),其中effwndi表示路径i的有效窗口,unAcki表示已经发送但还未确认的数据包个数,Pli表示路径i的丢包率。选取所有路径中Qi值最大的路径i,将数据包调度到该路径的发送缓存上。
S5,接收方根据接收到的数据包,确定解码矩阵,解码出原始数据包,递交上层应用。
实施例二
图2为本发明实施例的基于自适应网络编码的异构无线链路并发传输控制系统结构图。该控制系统包括基于A3C构建自适应编码决策模型、强化学习模块、网络编码模块、数据包分组模块、基于路径质量的数据分发模块和网络解码模块。
基于A3C构建自适应编码决策模型,其强化学习参数至少包括路径状态集、编码动作集和用于衡量动作执行好坏的奖励函数。
强化学习模块,用于对全局代理的神经网络参数θc和θa进行迭代优化,采用优化参数后的自适应编码决策模型获取最优编码策略,确定编码分组大小N和编码分组内数据包冗余大小R。
表1是其中一种强化学习模块的代码。
表1其中一种强化学习模块的代码
Figure BDA0003158605880000081
Figure BDA0003158605880000091
网络编码模块,用于定义两个编码矩阵:原始数据包的编码矩阵Cp和冗余编码矩阵Cr,根据编码分组大小和编码分组内冗余数据包大小,从相应的编码矩阵选择编码系数,编码生成N+R个编码数据包。表2是其中一种网络编码模块的代码例子。
表2其中一种网络编码模块的代码例子
Figure BDA0003158605880000092
Figure BDA0003158605880000101
数据包分组模块,用于基于强化学习模块获得的编码分组大小对数据包进行分组。
基于路径质量的数据分发模块,用于针对编码生成N+R个编码数据包,基于路径质量对数据包进行分发:在每一次调度分发时,衡量每条路径的质量,选取质量最优的路径将编码的数据包调度到该路径的缓存中。
表3是其中一种数据分发模块的代码例子。
Figure BDA0003158605880000102
Figure BDA0003158605880000111
网络解码模块,用于根据接收到的数据包,确定解码矩阵,解码出原始数据包,递交上层应用。
以上仅是本发明的优选实施方式,本发明的保护范围并不仅局限于上述实施例,凡属于本发明思路下的技术方案均属于本发明的保护范围。应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理前提下的若干改进和润饰,应视为本发明的保护范围。

Claims (7)

1.一种基于自适应网络编码的异构无线链路并发传输控制方法,其特征在于,所述控制方法包括以下步骤:
S1,基于A3C构建自适应编码决策模型,定义A3C强化学习参数,强化学习参数至少包括路径状态集、编码动作集和用于衡量动作执行好坏的奖励函数;
S2,对全局代理的神经网络参数θc和θa进行迭代优化,采用优化参数后的自适应编码决策模型获取最优编码策略,确定编码分组大小N和编码分组内数据包冗余大小R,N和R均是大于1的整数值;
S3,定义两个编码矩阵:原始数据包的编码矩阵Cp和冗余编码矩阵Cr,根据编码分组大小和编码分组内冗余数据包大小,从相应的编码矩阵选择编码系数,编码生成N+R个编码数据包;
S4,针对编码生成N+R个编码数据包,基于路径质量对数据包进行分发:在每一次调度分发时,衡量每条路径的质量,选取质量最优的路径将编码的数据包调度到该路径的缓存中。
2.根据权利要求1所述的基于自适应网络编码的异构无线链路并发传输控制方法,其特征在于,所述控制方法还包括:
S5,接收方根据接收到的数据包,确定解码矩阵,解码出原始数据包,递交上层应用。
3.根据权利要求1所述的基于自适应网络编码的异构无线链路并发传输控制方法,其特征在于,步骤S1中,所述定义模型参数的过程包括以下步骤:
S11,设定路径状态集St为:
St={Bwt,Buffert,(N,R),T,Tt,Plt}
式中,Bwt={Bwt,1,Bwt,2,…,Bwt,I},Bwt,i表示t时刻路径i的带宽大小,I表示链路总数;Buffert表示t时刻视频缓存,(N,R)表示过去时刻选择的编码分组大小N和R;T表示当前分组传输时延;Tt={Tt,1,Tt,2...,Tt,I},Tt,i表示t时刻路径i的下载时延;Plt={Plt,1,Plt,2,...,Plt,I},Plt,i表示t时刻路径i的丢包率,1≤i≤I;
S12,设定动作集at为:
at={N,R}
式中,N表示编码分组大小,R表示分组内冗余数据包大小,N和R都是整数值;
S13,定义状态转移概率
Figure FDA0003158605870000011
Figure FDA0003158605870000012
S14,定义奖励函数rt
Figure FDA0003158605870000013
式中,
Figure FDA0003158605870000021
表示最大化吞吐量,其中Bwt,i表示t时刻路径i的带宽大小;α是重新缓冲的惩罚因子,rebuf表示重新缓冲的时间;β表示时延惩罚因子,T=MAX(Tt,i)(1≤i≤I)表示总的下载时延;γ表示缓冲区惩罚因子,
Figure FDA0003158605870000022
B1,B2是缓冲区上下限阈值,θ为缓冲区调节因子,0≤θ≤1。
4.根据权利要求3所述的基于自适应网络编码的异构无线链路并发传输控制方法,其特征在于,步骤S2中,对全局代理的神经网络参数θc和θa进行迭代优化的过程包括:
S201,输入全局代理的神经网络参数θc和θa、全局最大的迭代次数M,令全局迭代次数m=1;
S202,初始化时间t=0;
S203,初始化起始状态st=s0;初始化神经网络参数增量dθc=0,dθa=0;将全局代理的神经网络参数赋值给局部代理θ′c=θc,θ′a=θa;s0表示t=0时的网络状态;
S204,设t=1;
S205,基于策略π(at|st;θ′a),执行动作at,从视频播放环境中获得奖励值rt和新的状态st+1
S206,令t=t+1,m=m+1;重复步骤S205,直至t=N+1;
S207,计算状态sN的值函数
Figure FDA0003158605870000023
S208,令i=N-1;
S209,更新θa的增量
Figure FDA0003158605870000024
Figure FDA0003158605870000025
更新θc的增量
Figure FDA0003158605870000026
Figure FDA0003158605870000027
式中,
Figure FDA0003158605870000028
表示优势函数,即运用策略π(θa)所获奖励与预期奖励的差值;H(·)表示正则化熵值,以保证决策代理充分地探索环境空间,γ表示折扣因子,0<γ<1;
S210,令i=i-1,重复步骤S209,直至i=0;
S211,更新全局代理的网络参数θa←θa+wdθac←θc-αdθc;其中,w表示Actor网络的更新步长,a表示Critic网络的更新步长;
S212,令m=m+1,重复步骤S23至S211,直至m>M,输出迭代后的网络参数θc和θa
5.根据权利要求1所述的基于自适应网络编码的异构无线链路并发传输控制方法,其特征在于,步骤S3中,编码生成N+R个编码数据包的过程包括以下步骤:
S31,定义两个编码矩阵:原始数据包的编码矩阵Cp和冗余编码矩阵Cr
Figure FDA0003158605870000031
Figure FDA0003158605870000032
其中,cij表示高斯域GF(28)中的数,矩阵Cp和Cr中的每一行都是线性无关的;i和j表示第i行第j列的编码系数;
S32,取原始数据包的编码矩阵Cp的前N行作为原始数据包的编码系数矩阵,取冗余编码矩阵Cr的前R行作为冗余数据包的编码系数矩阵,编码生成N+R个编码数据包。
6.根据权利要求1所述的基于自适应网络编码的异构无线链路并发传输控制方法,其特征在于,步骤S4中,针对编码生成N+R个编码数据包,基于路径质量对数据包进行分发的过程包括以下步骤:
根据下述公式计算每条路径的路径质量:
Qi=(effwndi-unAcki)*(1-Pli)
其中,effwndi表示路径i的有效窗口,unAcki表示已经发送但还未确认的数据包个数,Pli表示路径i的丢包率;
选取所有路径中Qi值最大的路径,将数据包调度到该路径的发送缓存上。
7.一种基于自适应网络编码的异构无线链路并发传输控制系统,其特征在于,所述控制系统包括:
基于A3C构建自适应编码决策模型,其强化学习参数至少包括路径状态集、编码动作集和用于衡量动作执行好坏的奖励函数;
强化学习模块,用于对全局代理的神经网络参数θc和θa进行迭代优化,采用优化参数后的自适应编码决策模型获取最优编码策略,确定编码分组大小N和编码分组内数据包冗余大小R;
网络编码模块,用于定义两个编码矩阵:原始数据包的编码矩阵Cp和冗余编码矩阵Cr,根据编码分组大小和编码分组内冗余数据包大小,从相应的编码矩阵选择编码系数,编码生成N+R个编码数据包;
数据包分组模块,用于基于强化学习模块获得的编码分组大小对数据包进行分组;
基于路径质量的数据分发模块,用于针对编码生成N+R个编码数据包,基于路径质量对数据包进行分发:在每一次调度分发时,衡量每条路径的质量,选取质量最优的路径将编码的数据包调度到该路径的缓存中;
网络解码模块,用于根据接收到的数据包,确定解码矩阵,解码出原始数据包,递交上层应用。
CN202110784463.1A 2021-07-12 2021-07-12 基于自适应网络编码的异构无线链路并发传输控制方法 Active CN113490239B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110784463.1A CN113490239B (zh) 2021-07-12 2021-07-12 基于自适应网络编码的异构无线链路并发传输控制方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110784463.1A CN113490239B (zh) 2021-07-12 2021-07-12 基于自适应网络编码的异构无线链路并发传输控制方法

Publications (2)

Publication Number Publication Date
CN113490239A true CN113490239A (zh) 2021-10-08
CN113490239B CN113490239B (zh) 2023-07-25

Family

ID=77938134

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110784463.1A Active CN113490239B (zh) 2021-07-12 2021-07-12 基于自适应网络编码的异构无线链路并发传输控制方法

Country Status (1)

Country Link
CN (1) CN113490239B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114389999A (zh) * 2021-12-27 2022-04-22 鹏城实验室 一种基于数据包的网络传输方法、装置、设备及存储介质
CN114422082A (zh) * 2021-12-30 2022-04-29 广东中兴新支点技术有限公司 基于线性网络编码的传输控制方法、系统、装置及介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103840917A (zh) * 2014-03-28 2014-06-04 北京邮电大学 一种基于网络编码的多路并行传输方案
US20150109933A1 (en) * 2013-10-18 2015-04-23 Samsung Electronics Co., Ltd. Apparatus and method for transmitting and receiving multimedia data in mobile communication system
CN108075861A (zh) * 2017-09-28 2018-05-25 河北工程大学 软件定义FiWi网络中基于多路径的网络编码传输方法
CN109587519A (zh) * 2018-12-28 2019-04-05 南京邮电大学 基于q学习的异构网络多径视频传输控制系统及方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150109933A1 (en) * 2013-10-18 2015-04-23 Samsung Electronics Co., Ltd. Apparatus and method for transmitting and receiving multimedia data in mobile communication system
CN103840917A (zh) * 2014-03-28 2014-06-04 北京邮电大学 一种基于网络编码的多路并行传输方案
CN108075861A (zh) * 2017-09-28 2018-05-25 河北工程大学 软件定义FiWi网络中基于多路径的网络编码传输方法
CN109587519A (zh) * 2018-12-28 2019-04-05 南京邮电大学 基于q学习的异构网络多径视频传输控制系统及方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
梁智怡;覃团发;罗建中;: "一种移动Ad Hoc网络的冗余网络编码方法", 电讯技术, no. 01 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114389999A (zh) * 2021-12-27 2022-04-22 鹏城实验室 一种基于数据包的网络传输方法、装置、设备及存储介质
CN114389999B (zh) * 2021-12-27 2023-08-18 鹏城实验室 一种基于数据包的网络传输方法、装置、设备及存储介质
CN114422082A (zh) * 2021-12-30 2022-04-29 广东中兴新支点技术有限公司 基于线性网络编码的传输控制方法、系统、装置及介质
CN114422082B (zh) * 2021-12-30 2023-07-28 广东中兴新支点技术有限公司 基于线性网络编码的传输控制方法、系统、装置及介质

Also Published As

Publication number Publication date
CN113490239B (zh) 2023-07-25

Similar Documents

Publication Publication Date Title
Hu et al. Dynamic beam hopping method based on multi-objective deep reinforcement learning for next generation satellite broadband systems
CN109104373B (zh) 网络拥塞的处理方法、装置及系统
JP4473733B2 (ja) パケットカプセル化方法及びシステム
EP1900134B1 (en) Method and system for optimizing forward error correction of multimedia streaming over wireless networks
CN109587519B (zh) 基于q学习的异构网络多径视频传输控制系统及方法
CN113490239B (zh) 基于自适应网络编码的异构无线链路并发传输控制方法
US20030033425A1 (en) Transmission rate selection for a network of receivers having heterogenous reception bandwidth
CN113271256B (zh) 一种信息年龄多路径传输方法及系统
CN112511448A (zh) 处理网络拥塞的方法、更新模型的方法和相关装置
KR20150045346A (ko) 이동 통신 시스템에서 멀티미디어 데이터 송수신 방법 및 장치
CN114390565B (zh) 基于稀疏网络编码的密度优化的解码方法
CN111770546A (zh) 一种基于q学习的容迟网络随机网络编码策略
CN103339912A (zh) 用于多媒体流的视频包调度方法
More et al. Optimization driven Multipath Routing for the video transmission in the VANET
CN116455894A (zh) 基于链路质量预测和网络编码的文件传输方法
CN113298247A (zh) 智能体决策的方法和装置
CN109495213A (zh) 一种基于汉明重量编码的广播重传方法及系统
Ghoreishi et al. Cyrus: a DRL-based puncturing solution to URLLC/eMBB multiplexing in O-RAN
Yu et al. DRL-based fountain codes for concurrent multipath transfer in 6G networks
WO2010085212A1 (en) Method and system for linear network coding in broadcast systems
CN109245850B (zh) 基于媒体内容的自适应系统码fec编译码方法
Bai et al. Two dimensional cross-layer optimization for packet transmission over fading channel
CN118042018B (zh) 一种基于stsgcn的智能多路径数据调度方法
Mao et al. Adaptive batch coding: A balanced congestion control strategy for multi-beam antenna networks
Faridi et al. Distortion control for delay-sensitive sources

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant