CN109587519A - 基于q学习的异构网络多径视频传输控制系统及方法 - Google Patents
基于q学习的异构网络多径视频传输控制系统及方法 Download PDFInfo
- Publication number
- CN109587519A CN109587519A CN201811624677.7A CN201811624677A CN109587519A CN 109587519 A CN109587519 A CN 109587519A CN 201811624677 A CN201811624677 A CN 201811624677A CN 109587519 A CN109587519 A CN 109587519A
- Authority
- CN
- China
- Prior art keywords
- value
- video
- data packet
- state
- heterogeneous network
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 33
- 230000005540 biological transmission Effects 0.000 claims abstract description 34
- 230000003139 buffering effect Effects 0.000 claims abstract description 8
- 230000033001 locomotion Effects 0.000 claims description 30
- 230000003044 adaptive effect Effects 0.000 claims description 24
- 230000006870 function Effects 0.000 claims description 16
- 238000012163 sequencing technique Methods 0.000 claims description 6
- 230000008569 process Effects 0.000 claims description 5
- 230000009471 action Effects 0.000 claims description 4
- 230000008859 change Effects 0.000 claims description 4
- 230000007774 longterm Effects 0.000 claims description 4
- 230000003247 decreasing effect Effects 0.000 claims description 2
- 238000004088 simulation Methods 0.000 claims 1
- 230000008707 rearrangement Effects 0.000 abstract description 2
- 238000010586 diagram Methods 0.000 description 5
- 230000002708 enhancing effect Effects 0.000 description 5
- 230000008901 benefit Effects 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 241000208340 Araliaceae Species 0.000 description 1
- 235000005035 Panax pseudoginseng ssp. pseudoginseng Nutrition 0.000 description 1
- 235000003140 Panax quinquefolius Nutrition 0.000 description 1
- 230000003190 augmentative effect Effects 0.000 description 1
- 239000003795 chemical substances by application Substances 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 238000000151 deposition Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 235000008434 ginseng Nutrition 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/238—Interfacing the downstream path of the transmission network, e.g. adapting the transmission rate of a video stream to network bandwidth; Processing of multiplex streams
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/14—Network analysis or design
- H04L41/145—Network analysis or design involving simulating, designing, planning or modelling of a network
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/231—Content storage operation, e.g. caching movies for short term storage, replicating data over plural servers, prioritizing data for deletion
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/234—Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs
- H04N21/23406—Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving management of server-side video buffer
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/25—Management operations performed by the server for facilitating the content distribution or administrating data related to end-users or client devices, e.g. end-user or client device authentication, learning user preferences for recommending movies
- H04N21/266—Channel or content management, e.g. generation and management of keys and entitlement messages in a conditional access system, merging a VOD unicast channel into a multicast channel
- H04N21/2662—Controlling the complexity of the video stream, e.g. by scaling the resolution or bitrate of the video stream based on the client capabilities
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Multimedia (AREA)
- Databases & Information Systems (AREA)
- Computer Networks & Wireless Communication (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
Abstract
本发明公开了一种基于Q学习的异构网络多径视频传输控制系统及方法,针对高清视频传输无法充分利用当前异构网络多径带宽,以及接收端缓冲区不稳定的情况,通过分析各路径的实时网络状态信息及接收端缓冲区信息,对各路径网络信息及缓冲区信息进行模型训练,对视频编码及发送做出决策,同时对接收端缓冲区乱序数据包进行重排序,最终对视频解码播放。该方法联合考虑了路径实时带宽、丢包率、端到端时延以及接收端的实时缓冲长度,并且加入了对接收端缓冲区乱序数据包的重排序算法,建立了基于马尔可夫决策的多径视频传输控制模型,形成了一个缓冲区长度驱动的视频传输反馈控制系统,采用Q学习在该模型的求解过程中得到最佳的视频编码及发送策略。
Description
技术领域
本发明属于异构无线网络流媒体传输技术领域,具体涉及一种基于Q学习的异构网络多径视频传输控制系统及方法。
背景技术
随着5G的到来,未来网络社会对高清视频的需求不断增加,移动端高清流媒体服务的兴起是消费者选择5G网络的主要原因之一。具有高清或者超高清分辨率(4K/8K)的视频、具备AR(增强现实)和VR(虚拟现实)技术的视频等都属于高清流媒体服务,其数据吞吐量较传统视频呈现出指数级增长。由于4G网络的带宽有限,超高清视频等内容无法得到有效普及,5G成为高清流媒体服务未来发展的必然选择。
而面对多种网络并存的场景,传统的通过单连接传输的技术不能充分利用异构网络资源,因此,为了充分利用多种网络同时传输,本发明提出了异构网络多径视频传输系统,以满足未来网络中超高清视频的传输。随着机器学习技术的不断深入和发展,在多径视频传输的场景下,采用Q学习算法为传输路径选择提供了可能。
发明内容
发明目的:为了克服现有技术中存在的不足,本发明主要针对多径传输对各路径网络状态不能提前获取的问题,提供了一种基于Q学习的异构网络多径视频传输控制系统及方法,通过获取异构网络中各传输路径的网络状态信息,包括实时带宽、丢包率、端到端时延,以及播放器实时缓冲长度信息,利用Q学习算法训练得到自适应模型,来选择下一个数据包发送的路径,提升网络的吞吐量即稳定性,保证视频传输的QoS。
技术方案:为实现上述目的,本发明采用的技术方案为:
一种基于Q学习的异构网络多径视频传输控制系统,包括以下模块:
视频服务器端:
1)视频源:监听视频编码服务器发出的新数据包请求,提供原始视频数据包,同时对数据包加上时间戳序列号,供给视频编码服务器用于编码;
2)视频编码服务器:接受来自视频源提供的原始视频数据包,进行H.265编码后,等待视频发送控制模块的决策准备传输,将数据包传输给视频发送控制模块中的异构网络中各传输路径;
视频发送控制模块:
3)自适应模型训练模块:接收来自异构网络中各传输路径的网络状态信息,包括实时带宽、丢包率、端到端时延,以及播放器实时缓冲长度信息,利用Q学习算法得到视频传输自适应模型,并将训练结果发送至视频发送决策模块;
4)视频发送决策模块:接收来自自适应模型训练模块的训练结果,得到最佳的发送策略,并将发送决策信息发送给视频编码服务器;
视频播放客户端:
5)接收缓冲区:接收从异构网络中获得的乱序数据包,将实时缓存长度信息反馈给视频发送控制模块中的自适应模型训练模块,另外将乱序数据包的时间戳序列号数组发送给视频接收控制模块中的数据包重排序模块,同时接收来自数据包重排序模块的数据包排序信息,根据排序信息将重排序的数据包发送至视频解码器;
6)视频解码器:接受来自接收缓冲区的数据包,对数据包进行解码播放;
视频接收控制模块:
7)数据包重排序模块:接收来自接收缓冲区的数据包序号信息,根据数据包时间戳序列进行重排序,并将重排序后的数据包排序信息反馈给接收缓冲区。
上述的一种基于Q学习的异构网络多径视频传输控制系统的工作方法,具体步骤为:
步骤a)根据异构网络多径视频传输的具体场景建立基于马尔可夫决策的视频传输控制模型,将决策时刻、状态空间、动作空间和效用函数映射到系统的参数中,建立MDP模型;
步骤b)使用Q学习算法对模型进行求解,根据各网络链路实时的网络状态参数及接收端缓存长度,构建系统状态参数;
构建Q值表,根据Q值迭代公式和回报函数对Q值表进行更新,直至得到最优的发送策略。
进一步的,所述的步骤b)的具体内容为:
31)初始化数据,分别设定学习速率初始值α0,折扣因子γ,探索概率初始值ε0,初始的数据包发送路径n;
32)获取当前状态,当数据包送达接收端缓冲区时,通过网络适配器搜集各路径带宽、丢包率、端到端时延以及缓冲区长度信息,并计算的到动作前的服务质量QoS值,得到系统状态(i,j);
33)获得Q值:计算当前状态下所有可能发生的动作a1,a2,...,an所对应的Q值Q(s,a1),Q(s,a2),...Q(s,an),得到当前网络状态下对应不同发送路径的Q值;
34)动作选择:以Boltzmann搜索算法中定义的概率来选择发送路径,本次决策得到的体验质量QoS值和上次决策的体验质量QoS值计算可得回报值r;
35)更新Q值函数Qn(s,a),学习速率α按照反比例函数规律逐渐减小为0;
36)重复步骤32)-35),直至Q值收敛,即更新前后的Q值差值小于门限值;
37)返回步骤34)选择动作,选择最佳路径。
进一步的,步骤33)中,采用Q学习算法获得Q值,具体方法如下:
假设在第n步,自适应模型训练模块纪录当前环境的状态sn∈S,并根据此时的状态选择动作an∈A,在该动作完成后会产生一个即时回报函数rn(an),将回报函数r作为MDP模型的效用函数:
ρ(st,st+1,at)=r(τ(t),b(t),p(t),l(t)),τ(t),b(t),p(t),l(t)是状态空间参数,分别为端到端时延、实时带宽、丢包率和接收端缓冲区的长度;
在搜索策略π:s→a下,状态s的值定义为
其中,π(s)为在状态s下根据策略选择的动作;γ∈[0,1]为折扣因子,反映延时奖赏的相对比例;为在第n步操作中在环境状态sn和选择动作an下,环境状态转移到yn的概率;y为所有状态yn的集合;由该式可得,状态s的值实际含义就是自适应模型训练模块在执行策略π选择的动作后立即得到回报rn,并以概率Psy转移一个状态值为Vπ(y)的有效状态;
根据DP定理,至少存在一个最佳策略π*使得状态s的值取到最大值,记为
其中,a和rs(a)分别表示选择的动作与在状态s下该动作产生的回报值;
对于一个策略π,定义Q值函数为
Q值是对采取设定动作后的回报值的预测估计;
由式(2)(3)可知,
假设此时使Q值最大的动作为a*,则最佳策略表示为
π*(s)=a* (5)
自适应模型训练模块通过Q值函数,选择最佳策略,即执行使得Q值最大的动作;
Q值表的更新通过迭代来完成,为了更新所有Q值,自适应模型训练模块不断与环境交互;当Q值经过多次迭代后不再发生大的改变时,认为Q值收敛,训练过程结束;Q值按照式(6)更新
Qn(s,a)=(1-αn)Qn-1(s,a)+αn(rn+γmaxQn(s',a')) (6)
其中,α∈[0,1)为学习速率;s'和a'为采取选择动作后得到的状态,即与其对应的可选择的动作。
学习的最终目标是最大化长期累积回报,即使得回报函数的值最大,使得Q值与长期回报函数相匹配,形成最优策略π*(s);所述最优策略π*(s)为使得回报函数r值最大的发送路径。
有益效果:本发明提供的一种基于Q学习的异构网络多径视频传输控制系统及方法,与现有技术相比,具有以下优势:本发明联合考虑了接收端缓冲区长度和各路径网络状态信息两个因素,建立了基于马尔科夫决策的视频传输控制模型,形成一个服务质量QoS驱动的的视频传输自适应控制系统,可以根据QoS自适应的调整视频的发送路径;对于马尔科夫决策模型的求解使用的是增强学习的Q学习方法,最终可以得到一系列的最优发送策略,使得长期回报值达到最大。
附图说明
图1为本发明的系统架构图;
图2为强化学习原理图;
图3为本发明基于Q学习的异构网络多径视频传输控制系统及方法流程图。
具体实施方式
本发明公开了一种基于Q学习的异构网络多径视频传输控制系统及方法,针对高清视频传输无法充分利用当前异构网络多径带宽,以及接收端缓冲区不稳定的情况,通过分析各路径的实时网络状态信息及接收端缓冲区信息,对各路径网络信息及缓冲区信息进行模型训练,对视频编码及发送做出决策,同时对接收端缓冲区乱序数据包进行重排序,最终对视频解码播放。该方法联合考虑了路径实时带宽、丢包率、端到端时延以及接收端的实时缓冲长度,并且加入了对接收端缓冲区乱序数据包的重排序算法,建立了基于马尔可夫决策的多径视频传输控制模型,形成了一个缓冲区长度驱动的视频传输反馈控制系统,采用Q学习在该模型的求解过程中得到最佳的视频编码及发送策略。
下面结合附图和实施例对本发明作更进一步的说明。
实施例
图1是本发明的系统架构图:视频源为视频编码服务器提供原始数据包,传输控制模块具有收集网络状态信息及接收端缓存信息的能力,该模块利用Q学习根据网络状态和缓冲区长度的动态变化,自适应的调整视频编码服务器的发送路径。
首先根据异构网络多径视频传输的具体场景建立基于马尔可夫决策的视频传输控制模型,然后利用Q学习的方法对其进行求解,得到该视频传输场景下最优的路径选择策略。该方法的实现过程主要分为两个步骤:第一步,建立基于马尔可夫决策的视频传输自适应模型;第二步,利用Q学习算法对上述模型进行求解。
图2是增强学习原理图:增强学习是关于智能体通过外部环境的简单标量信号来不断演进,同时分析其动作后果的一系列问题集合。一般而言,基本的增强学习模型由反映当前环境的状态集合S={s1,s2,…,sM},智能体可以选择的动作集合A={a1,a2,…,aN},回报函数r以及搜索策略π:S→A构成。
图3是本发明基于Q学习的异构网络多径视频传输控制系统及方法流程图:本发明使用的Q学习算法是一种无模型增强学习算法,假设在第n步,Agent记录当前环境的状态sn∈S,并根据此时的状态选择动作an∈A,在该动作完成后会产生一个即时回报函数rn(an),该回报由当前状态sn和选择动作an唯一确定。
在搜索策略π:s→a下,状态s的值定义为
其中,π(s)为在状态s下根据策略选择的动作;γ∈[0,1]为折扣因子,反映延时奖赏的相对比例;为在第n步操作中在环境状态sn和选择动作an下,环境状态转移到yn的概率;y为所有状态yn的集合;由该式可得,状态s的值实际含义就是自适应模型训练模块在执行策略π选择的动作后立即得到回报rn,并以概率Psy转移一个状态值为Vπ(y)的有效状态;
根据DP定理,至少存在一个最佳策略π*使得状态s的值取到最大值,记为
其中,a和rs(a)分别表示选择的动作与在状态s下该动作产生的回报值;
对于一个策略π,定义Q值函数为
Q值是对采取设定动作后的回报值的预测估计;
由式(2)(3)可知,
假设此时使Q值最大的动作为a*,则最佳策略表示为
π*(s)=a* (5)
自适应模型训练模块通过Q值函数,选择最佳策略,即执行使得Q值最大的动作;
Q值表的更新通过迭代来完成,为了更新所有Q值,自适应模型训练模块不断与环境交互;当Q值经过多次迭代后不再发生大的改变时,认为Q值收敛,训练过程结束;Q值按照式(6)更新
Qn(s,a)=(1-αn)Qn-1(s,a)+αn(rn+γmaxQn(s',a')) (6)
其中,α∈[0,1)为学习速率;s'和a'为采取选择动作后得到的状态,即与其对应的可选择的动作。
本技术领域技术人员可以理解的是,除非另外定义,这里使用的所有术语(包括技术术语和科学术语)具有与本发明所属领域中的普通技术人员的一般理解相同的意义。还应该理解的是,诸如通用字典中定义的那些术语应该被理解为具有与现有技术的上下文中的意义一致的意义,并且除非像这里一样定义,不会用理想化或过于正式的含义来解释。
以上所述仅是本发明的优选实施方式,应当指出:对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。
Claims (6)
1.一种基于Q学习的异构网络多径视频传输控制系统,其特征在于,包括以下模块:
视频服务器端:
1)视频源:监听视频编码服务器发出的新数据包请求,提供原始视频数据包,同时对数据包加上时间戳序列号,供给视频编码服务器用于编码;
2)视频编码服务器:接受来自视频源提供的原始视频数据包,进行H.265编码后,等待视频发送控制模块的决策准备传输,将数据包传输给视频发送控制模块中的异构网络中各传输路径;
视频发送控制模块:
3)自适应模型训练模块:接收来自异构网络中各传输路径的网络状态信息,包括实时带宽、丢包率、端到端时延,以及播放器实时缓冲长度信息,利用Q学习算法得到视频传输自适应模型,并将训练结果发送至视频发送决策模块;
4)视频发送决策模块:接收来自自适应模型训练模块的训练结果,得到最佳的发送策略,并将发送决策信息发送给视频编码服务器;
视频播放客户端:
5)接收缓冲区:接收从异构网络中获得的乱序数据包,将实时缓存长度信息反馈给视频发送控制模块中的自适应模型训练模块,另外将乱序数据包的时间戳序列号数组发送给视频接收控制模块中的数据包重排序模块,同时接收来自数据包重排序模块的数据包排序信息,根据排序信息将重排序的数据包发送至视频解码器;
6)视频解码器:接受来自接收缓冲区的数据包,对数据包进行解码播放;
视频接收控制模块:
7)数据包重排序模块:接收来自接收缓冲区的数据包序号信息,根据数据包时间戳序列进行重排序,并将重排序后的数据包排序信息反馈给接收缓冲区。
2.根据权利要求1所述的基于Q学习的异构网络多径视频传输控制系统的工作方法,其特征在于,具体流程为:
步骤a)根据异构网络多径视频传输的具体场景建立基于马尔可夫决策的视频传输控制模型,将决策时刻、状态空间、动作空间和效用函数映射到系统的参数中,建立MDP模型;
步骤b)使用Q学习算法对模型进行求解,根据各网络链路实时的网络状态参数及接收端缓存长度,构建系统状态参数;
构建Q值表,根据Q值迭代公式和回报函数对Q值表进行更新,直至得到最优的发送策略。
3.根据权利要求2所述的一种基于Q学习的异构网络多径视频传输控制系统的工作方法,其特征在于:所述步骤b)的具体方法包括以下步骤:
31)初始化数据,分别设定学习速率初始值α0,折扣因子γ,探索概率初始值ε0,
初始的数据包发送路径n;
32)获取当前状态,当数据包送达接收缓冲区时,通过网络适配器搜集各路径带宽、丢包率、端到端时延以及缓冲区长度信息,并计算得到动作前的服务质量QoS值,得到系统状态;
33)获得Q值:计算当前状态下所有可能发生的动作a1,a2,...,an所对应的Q值Q(s,a1),Q(s,a2),...Q(s,an),得到当前网络状态下对应不同发送路径的Q值;
34)动作选择:以Boltzmann搜索算法中定义的概率来选择发送路径,本次决策得到的体验质量QoS值和上次决策的体验质量QoS值计算可得回报值r;
35)更新Q值函数Qn(s,a),学习速率α按照反比例函数规律逐渐减小为0;
36)重复步骤32)-35),直至Q值收敛,即更新前后的Q值差值小于门限值;
37)返回步骤34)选择动作,选择最佳路径。
4.根据权利要求3所述的基于Q学习的异构网络多径视频传输控制系统的工作方法,其特征在于,所述步骤32)中,系统状态(i,j),i、j代指状态空间参数,包括τ(t)、b(t)、p(t)、l(t),分别为端到端时延、实时带宽、丢包率和接收端缓冲区的长度。
5.根据权利要求3所述的基于Q学习的异构网络多径视频传输控制系统的工作方法,其特征在于,所述步骤36)中,门限值为0.01。
6.根据权利要求3所述的基于Q学习的异构网络多径视频传输控制系统的工作方法,其特征在于,所述步骤33)中,采用Q学习算法获得Q值,具体方法如下:
假设在第n步,自适应模型训练模块纪录当前环境的状态sn∈S,并根据此时的状态选择动作an∈A,在该动作完成后会产生一个即时回报函数rn(an),将回报函数r作为MDP模型的效用函数:
ρ(st,st+1,at)=r(τ(t),b(t),p(t),l(t)),
τ(t)、b(t)、p(t)、l(t)是状态空间参数,分别为端到端时延、实时带宽、丢包率和接收端缓冲区的长度;
在搜索策略π:s→a下,状态s的值定义为
其中,π(s)为在状态s下根据策略选择的动作;γ∈[0,1]为折扣因子,反应延时奖赏的相对比例;为在第n步操作中在环境状态sn和选择动作an下,环境状态转移到yn的概率;y为所有状态yn的集合;由该式可得,状态s的值实际含义就是自适应模型训练模块在执行策略π选择的动作后立即得到回报rn,并以概率Psy转移一个状态值为Vπ(y)的有效状态;
根据DP定理,至少存在一个最佳策略π*使得状态s的值取到最大值,记为
其中,a和rs(a)分别表示选择的动作与在状态s下该动作产生的回报值;
对于一个策略π,定义Q值函数为
Q值是对采取设定动作后的回报值的预测估计;
由式(2)(3)可知,
假设此时使Q值最大的动作为a*,则最佳策略表示为
π*(s)=a* (5)
自适应模型训练模块通过Q值函数,选择最佳策略,即执行使得Q值最大的动作;
Q值表的更新通过迭代来完成,为了更新所有Q值,自适应模型训练模块不断与环境交互;当Q值经过多次迭代后不再发生大的改变时,认为Q值收敛,训练过程结束;Q值按照式(6)更新
Qn(s,a)=(1-αn)Qn-1(s,a)+αn(rn+γmaxQn(s',a')) (6)
其中,α∈[0,1)为学习速率;s'和a'为采取选择动作后得到的状态,即与其对应的可选择的动作;
学习的最终目标是最大化长期累积回报,即使得回报函数的值最大,使得Q值与长期回报函数相匹配,形成最优策略π*(s);所述最优策略π*(s)为使得回报函数r值最大的发送路径。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811624677.7A CN109587519B (zh) | 2018-12-28 | 2018-12-28 | 基于q学习的异构网络多径视频传输控制系统及方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811624677.7A CN109587519B (zh) | 2018-12-28 | 2018-12-28 | 基于q学习的异构网络多径视频传输控制系统及方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109587519A true CN109587519A (zh) | 2019-04-05 |
CN109587519B CN109587519B (zh) | 2021-11-23 |
Family
ID=65932252
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811624677.7A Active CN109587519B (zh) | 2018-12-28 | 2018-12-28 | 基于q学习的异构网络多径视频传输控制系统及方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109587519B (zh) |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112954385A (zh) * | 2021-01-18 | 2021-06-11 | 南京邮电大学 | 一种基于控制论和数据驱动的自适应分流决策方法 |
CN113055489A (zh) * | 2021-03-23 | 2021-06-29 | 北京计算机技术及应用研究所 | 基于q学习的星地融合网络资源分配策略的实现方法 |
CN113271338A (zh) * | 2021-04-25 | 2021-08-17 | 复旦大学 | 一种移动增强现实场景的智能预加载算法 |
CN113490239A (zh) * | 2021-07-12 | 2021-10-08 | 南京邮电大学 | 基于自适应网络编码的异构无线链路并发传输控制方法 |
CN113746855A (zh) * | 2021-09-09 | 2021-12-03 | 国网电子商务有限公司 | 一种能源工业云网的数据接入方法及相关设备 |
CN114630175A (zh) * | 2022-03-14 | 2022-06-14 | 网络通信与安全紫金山实验室 | 一种缓存管理方法、装置、设备和存储介质 |
CN114785757A (zh) * | 2022-03-31 | 2022-07-22 | 东北大学 | 一种面向实时会话类业务的多径传输控制方法 |
CN114866461A (zh) * | 2022-04-28 | 2022-08-05 | 抖动科技(深圳)有限公司 | Rtc流媒体自适应传输方法、装置、设备及存储介质 |
TWI818347B (zh) * | 2021-11-04 | 2023-10-11 | 台北富邦商業銀行股份有限公司 | 資料傳輸路徑選擇系統 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101416466A (zh) * | 2006-03-29 | 2009-04-22 | 英特尔公司 | 通过增强学习和传播来优化网络协议选项 |
CN103338410A (zh) * | 2013-07-19 | 2013-10-02 | 西安电子科技大学 | 多路径并行传输下基于svc的实时流媒体重组算法 |
CN107690176A (zh) * | 2017-09-30 | 2018-02-13 | 南京南瑞集团公司 | 一种基于q学习算法的网络选择方法 |
CN107809784A (zh) * | 2017-10-10 | 2018-03-16 | 上海交通大学 | 多跳无线网络中传输实时视频流的机会路由方法 |
CN108076467A (zh) * | 2017-12-29 | 2018-05-25 | 中国人民解放军陆军工程大学 | 频谱资源受限下的广义感知模型及分布式q学习接入方法 |
CN108391143A (zh) * | 2018-04-24 | 2018-08-10 | 南京邮电大学 | 一种基于q学习的无线网络视频传输自适应控制方法 |
CN108521375A (zh) * | 2018-04-17 | 2018-09-11 | 中国矿业大学 | 一种基于SDN的网络多业务流量QoS的传输及调度方法 |
US20180284735A1 (en) * | 2016-05-09 | 2018-10-04 | StrongForce IoT Portfolio 2016, LLC | Methods and systems for industrial internet of things data collection in a network sensitive upstream oil and gas environment |
-
2018
- 2018-12-28 CN CN201811624677.7A patent/CN109587519B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101416466A (zh) * | 2006-03-29 | 2009-04-22 | 英特尔公司 | 通过增强学习和传播来优化网络协议选项 |
CN103338410A (zh) * | 2013-07-19 | 2013-10-02 | 西安电子科技大学 | 多路径并行传输下基于svc的实时流媒体重组算法 |
US20180284735A1 (en) * | 2016-05-09 | 2018-10-04 | StrongForce IoT Portfolio 2016, LLC | Methods and systems for industrial internet of things data collection in a network sensitive upstream oil and gas environment |
CN107690176A (zh) * | 2017-09-30 | 2018-02-13 | 南京南瑞集团公司 | 一种基于q学习算法的网络选择方法 |
CN107809784A (zh) * | 2017-10-10 | 2018-03-16 | 上海交通大学 | 多跳无线网络中传输实时视频流的机会路由方法 |
CN108076467A (zh) * | 2017-12-29 | 2018-05-25 | 中国人民解放军陆军工程大学 | 频谱资源受限下的广义感知模型及分布式q学习接入方法 |
CN108521375A (zh) * | 2018-04-17 | 2018-09-11 | 中国矿业大学 | 一种基于SDN的网络多业务流量QoS的传输及调度方法 |
CN108391143A (zh) * | 2018-04-24 | 2018-08-10 | 南京邮电大学 | 一种基于q学习的无线网络视频传输自适应控制方法 |
Non-Patent Citations (3)
Title |
---|
YUBIN XU 等: "Q-learning Based Network Selection for WCDMA/WLAN Heterogeneous Wireless Networks", 《IEEE》 * |
冯陈伟,袁江南: "基于强化学习的异构无线网络资源管理算法", 《电信科学》 * |
高溢之: "基于AI的自适应视频传输控制系统的研发", 《2018年全国物联网技术与应用大会论文集》 * |
Cited By (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112954385B (zh) * | 2021-01-18 | 2022-07-29 | 南京邮电大学 | 一种基于控制论和数据驱动的自适应分流决策方法 |
CN112954385A (zh) * | 2021-01-18 | 2021-06-11 | 南京邮电大学 | 一种基于控制论和数据驱动的自适应分流决策方法 |
CN113055489A (zh) * | 2021-03-23 | 2021-06-29 | 北京计算机技术及应用研究所 | 基于q学习的星地融合网络资源分配策略的实现方法 |
CN113055489B (zh) * | 2021-03-23 | 2022-09-06 | 北京计算机技术及应用研究所 | 基于q学习的星地融合网络资源分配策略的实现方法 |
CN113271338A (zh) * | 2021-04-25 | 2021-08-17 | 复旦大学 | 一种移动增强现实场景的智能预加载算法 |
CN113490239A (zh) * | 2021-07-12 | 2021-10-08 | 南京邮电大学 | 基于自适应网络编码的异构无线链路并发传输控制方法 |
CN113490239B (zh) * | 2021-07-12 | 2023-07-25 | 南京邮电大学 | 基于自适应网络编码的异构无线链路并发传输控制方法 |
CN113746855A (zh) * | 2021-09-09 | 2021-12-03 | 国网电子商务有限公司 | 一种能源工业云网的数据接入方法及相关设备 |
TWI818347B (zh) * | 2021-11-04 | 2023-10-11 | 台北富邦商業銀行股份有限公司 | 資料傳輸路徑選擇系統 |
CN114630175A (zh) * | 2022-03-14 | 2022-06-14 | 网络通信与安全紫金山实验室 | 一种缓存管理方法、装置、设备和存储介质 |
CN114630175B (zh) * | 2022-03-14 | 2023-08-22 | 网络通信与安全紫金山实验室 | 一种缓存管理方法、装置、设备和存储介质 |
CN114785757A (zh) * | 2022-03-31 | 2022-07-22 | 东北大学 | 一种面向实时会话类业务的多径传输控制方法 |
CN114785757B (zh) * | 2022-03-31 | 2023-10-20 | 东北大学 | 一种面向实时会话类业务的多径传输控制方法 |
CN114866461A (zh) * | 2022-04-28 | 2022-08-05 | 抖动科技(深圳)有限公司 | Rtc流媒体自适应传输方法、装置、设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN109587519B (zh) | 2021-11-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109587519A (zh) | 基于q学习的异构网络多径视频传输控制系统及方法 | |
CN112954385B (zh) | 一种基于控制论和数据驱动的自适应分流决策方法 | |
CN108391143B (zh) | 一种基于q学习的无线网络视频传输自适应控制方法 | |
CN109922485A (zh) | 基于双通信设备的智能网桥加速方法及系统 | |
CN101345756A (zh) | 一种基于带宽预测的无线Ad Hoc网络实时视频传输方法 | |
CN113014968B (zh) | 一种基于强化学习的多用户动态码率视频传输方法及系统 | |
Feng et al. | Vabis: Video adaptation bitrate system for time-critical live streaming | |
CN108777809A (zh) | 一种全景视频分片移动网络缓存方法及系统、全景视频下载方法 | |
CN113904948A (zh) | 基于跨层的多维参数的5g网络带宽预测系统及方法 | |
CN109698925A (zh) | 基于数据驱动的实时视频拥塞控制方法及装置 | |
CN109408211A (zh) | 一种多目标优化的对等网络流媒体系统数据调度算法 | |
CN110535770B (zh) | 一种SDN环境下基于QoS感知的视频流智能路由方法 | |
Tian et al. | Deeplive: QoE optimization for live video streaming through deep reinforcement learning | |
CN116249162A (zh) | 车载边缘网络中基于深度强化学习的协作缓存方法 | |
CN108769729A (zh) | 基于遗传算法的缓存布置系统及缓存方法 | |
CN113490239B (zh) | 基于自适应网络编码的异构无线链路并发传输控制方法 | |
CN113395333B (zh) | 基于智能体深度增强学习的多边缘基站联合缓存替换方法 | |
CN104822084A (zh) | 基于并发流的p2p实时播放系统快速频道切换方法 | |
CN103503462B (zh) | 实时转码方法及设备 | |
CN111901833B (zh) | 一种面向不可靠信道传输的联合服务调度以及内容缓存方法 | |
CN108322773A (zh) | 一种基于多卡绑定的自适应网络带宽实时数据流传输方法 | |
CN108390936A (zh) | 一种基于缓存分布感知的概率缓存算法 | |
CN116506918A (zh) | 一种基于缓存区预测的中继选择方法 | |
Dai et al. | An mec-enabled wireless vr transmission system with view synthesis-based caching | |
CN104683832B (zh) | 一种dtn网络中视频分块的随机集中调度方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |