CN101808244A - 一种视频传输控制方法及系统 - Google Patents

一种视频传输控制方法及系统 Download PDF

Info

Publication number
CN101808244A
CN101808244A CN 201010131630 CN201010131630A CN101808244A CN 101808244 A CN101808244 A CN 101808244A CN 201010131630 CN201010131630 CN 201010131630 CN 201010131630 A CN201010131630 A CN 201010131630A CN 101808244 A CN101808244 A CN 101808244A
Authority
CN
China
Prior art keywords
video
network
value
state information
actor
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN 201010131630
Other languages
English (en)
Other versions
CN101808244B (zh
Inventor
程渤
刘传昌
章洋
陈俊亮
杨加林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing University of Posts and Telecommunications
Original Assignee
Beijing University of Posts and Telecommunications
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing University of Posts and Telecommunications filed Critical Beijing University of Posts and Telecommunications
Priority to CN 201010131630 priority Critical patent/CN101808244B/zh
Publication of CN101808244A publication Critical patent/CN101808244A/zh
Application granted granted Critical
Publication of CN101808244B publication Critical patent/CN101808244B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

本发明公开了一种视频传输控制方法,包括:在视频传输过程中,收集网络实时状况及视频状态信息,并将收集到的信息进行规格化处理;根据规格化后的网络及视频状态信息估计视频质量,计算视频编码率;根据计算得到的视频编码率对视频进行编码压缩处理,并将压缩处理后的视频进行传输。本发明在不需要改造现有网络的条件下,尤其是不需改造现有网络上的核心设备的条件下,就可以很好的改善实时视频质量,因此本发明规避了改造现有网络的风险,能够快速部署和实施,实现面向普通用户的广泛的视频质量保障。

Description

一种视频传输控制方法及系统
技术领域
本发明涉及视频传输技术领域,具体地说,是一种视频传输控制方法及系统。
背景技术
在当前的因特网上,传输实时视频信息仍然面临巨大的挑战。传统的因特网提供的是一种尽力而为(Best-effort)的通信服务,网络将尽力传输所有的通信数据,但不提供任何服务质量(QoS,Quality of Service)的保证。为保障实时视频数据传输,学术界在视频传输的QoS领域已经开展了大量的研究工作,并且IETF(Internet Engineering Task Force,互联网任务组)提出了综合服务、差别服务、多协议标记交换、流量工程等QoS技术解决方案。但由于QoS是端到端的问题,涉及到全网,单靠一个或几个环节不能从根本上解决问题。于是,人们也开始考虑如何在应用层加入重传等机制来提供一定的视频质量保证,但并没有取得很好的效果。到目前为止,视频传输的QoS问题也还没有得到很好的解决。
除了为网络增加更好的QoS保障机制之外,人们也在不断的深入研究视频压缩的方法,以希望能够找到对网络友好的新的视频编码方法,H.264/AVC便是在这种背景下诞生的。它是由ISO/IEC(International Organization forStandardization/International Electrotechnical Commission,国际标准化组织/国际电工委员会)和ITU-T(International Telecommunication Union-Telecommunication Standardization,国际电信联盟-电信标准部)联手制定的,具有很高的编码效率,而且码流结构网络适应性强,增加了差错恢复能力,能够很好地适应因特网和无线网络的应用。H.264/AVC标准只规定了编码器的标准输出码流,并没有说明具体实现。如何高效的实现H.264/AVC的编码器已经成为目前的研究热点,不过目前的方法主要集中在如何根据视频流的特点更好地压缩视频上,并没有把实时的网络信息考虑进去。
综上可见,目前视频的传输机制与视频编码过程的研究是相对独立的,并没能有机的结合起来。
发明内容
本发明要解决的技术问题是提供一种视频传输控制方法及系统,不需要改造现有的网络条件,就可以很好地改善实时视频质量,提高视频传输中的服务质量,实现面向普通用户的广泛的视频质量保障。
为了解决上述技术问题,本发明提供了一种视频传输控制方法,包括:
在视频传输过程中,收集网络实时状况及视频状态信息,并将收集到的信息进行规格化处理;
根据规格化后的网络及视频状态信息估计视频质量,计算视频编码率;
根据计算得到的视频编码率对视频进行编码压缩处理,并将压缩处理后的视频进行传输。
进一步地,所述网络实时状况包括时延、抖动和丢包率;所述收集网络实时状况通过获取RTCP流中的反馈信息来实现。
进一步地,在等待RTCP流中的反馈信息的过程中,将视频的每个关键帧与下一个关键帧之间的所有帧组成一组,计算并保存每组视频的视频质量值SSIM;获取RTCP流中的反馈信息后,根据反馈中的网络状态信息计算每组视频的估计视频质量,所述估计视频质量由以下公式计算:
Figure GSA00000064548100021
其中,εd=1/100,εj=1/20,εl=256,每组视频的视频质量值SSIM为该组内所有帧视频质量值的平均值,delay、jitter、lost分别对应时延、抖动、丢包率三个网络状况参数。
进一步地,将收集到的信息进行规格化处理包括:
将每一个输入的实数值x分割为N个取值位于0~1之间的输出,计算第n个输出的值使用的公式如下:
Figure GSA00000064548100031
其中,丢包率不需要规格化,N与bn根据输入数据的分布特征指定,对于时延,N取为4,bn依次为0.7、3.6、7.3、100;对于抖动,N取为4,bn依次为1.38、4.6、13.9、20;对于帧复杂度,N取为8,bn依次为15000、25000、35000、45000、55000、70000、90000、120000;r为输入数据可能的取值范围。
进一步地,所述根据规格化后的网络及视频状态信息估计视频质量,计算视频编码率的方法为:
将规格化后的网络及视频状态信息输入到增强学习中的Actor-Critic模型,Actor-Critic模型中的Critic根据所输入的规格化后的网络及视频状态信息采用预测函数Value(x)预测视频质量,Critic将预测的视频质量与环境反馈的视频质量的误差反馈给Actor-Critic模型中的Actor,并根据环境反馈的视频质量更新预测函数;
Actor根据所输入的规格化后的网络及视频状态信息计算得到视频编码率,根据C ritic输出的预测误差更新选取动作的策略。
进一步地,所述Actor根据所输入的规格化后的网络及视频状态信息计算得到视频编码率、根据C ritic输出的预测误差更新选取动作的策略具体包括:
系统运行过程中,首先在时刻t-1时Actor根据所输入的规格化后的网络及视频状态信息通过μ(x)函数和σ(x)函数分别估计视频编码率的均值与标准差,然后使用服从均值为μ(x)、标准差为σ(x)的高斯分布随机数生成器来产生视频编码率;
所述Actor根据Critic输出的预测误差修正均值μ(x)和标准差σ(x),修正公式为:
Δμ=(at-1t-1
                              ;
Δσ=[(at-1t-1)2t-1 2
其中,at-1是时刻t-1时Actor的输出的动作值,μt-1与σt-1分别为时刻t-1时的输出值均值与标准差的预测值,δ为Critic给Actor的反馈。
进一步地,所述Critic给Actor的反馈δ通过以下公式获得:
δ=rt-1+γValuet-Valuet-1
其中rt-1是时刻t-1的动作所收到的环境反馈的视频质量,γ是一个学习参数。
进一步地,采用三个神经网络分别用来拟合Critic中的Value(x)、Actor中的μ(x)和σ(x),三个网络的输入均为规格化之后的网络及视频状态信息;每个网络有一个隐层,隐层由三个神经元组成;输出层有一个输出神经元,网络中的每个神经元的门限函数使用的是可微的sigmoid函数,公式如下:
1 1 + e - x x = Σ i w i x i ,
其中wi与xi分别为神经元的第i个输入的权值与输入值,三个网络的所有权值都初始化为[-0.1,0.1]之间的随机值。
进一步地,所述网络里的每一个权值w采用的更新规则公式如下:
wt=wt-1+Δw
Δw=αet-1Δo,
e t = λγ e t - 1 + ∂ o ∂ w
其中Δo为神经网络的输出与实际值的误差,
Figure GSA00000064548100043
为输出对该权值的偏导数,α为学习速率,et为w在时刻t时的eligibility trace值,λ为TD(λ)中的值。
本发明还提供了一种视频传输控制系统,包括:
状态收集模块,用于收集网络以及视频状态信息;
规格化模块,用于对所述状态收集模块收集到的网络以及视频状态信息进行规格化处理;
参数学习模块,用于根据所述规格化模块处理后的网络以及视频状态信息以及视频环境反馈的视频质量的结果动态的调整智能控制核心的参数并输出,从而使得智能控制核心能更好的适应目前的环境状态;
视频控制模块,用于根据所述规格化模块处理后的网络以及视频状态信息和所述参数学习模块输出的参数产生符合当前环境状态的最优的视频编码码率;
视频编码模块,用于根据视频控制模块产生的视频编码码率对原始的视频图像进行编码处理。
本发明在不需要改造现有网络的条件下,尤其是不需改造现有网络上的核心设备的条件下,就可以很好的改善实时视频质量,因此本发明规避了改造现有网络的风险,能够快速部署和实施,实现面向普通用户的广泛的视频质量保障。
附图说明
图1是本发明的视频传输控制方法的流程图;
图2是本发明的实现视频传输控制方法的智能控制核心的原理图;
图3是本发明的视频传输控制系统的系统架构图。
具体实施方式
下面结合附图和具体实施例对本发明作进一步说明,以使本领域的技术人员可以更好的理解本发明并能予以实施,但所举实施例不作为对本发明的限定。
如图1所示,本发明的视频传输控制方法包括以下步骤:
步骤101:在视频传输过程中,收集网络实时状况及视频状态信息,并将收集到的信息进行规格化处理;
步骤102:根据规格化后的网络及视频状态信息估计视频质量,计算视频编码率;
步骤103:根据计算得到的视频编码率对视频进行编码压缩处理,并将压缩处理后的视频进行传输。
具体地说明如下:
本发明将视频处理过程中实际视频场景的复杂度、传输网络中的实时时延、时延抖动以及丢包情况综合起来考虑,充分发掘蕴涵于这些状态信息之间的因果联系,以便找到每种状态下最优的视频编码方法,从而能够有的放矢地去调整控制视频编码器的编码过程,以保障在有限的条件下能够提供给用户最好的视觉体验。
本发明从增强学习的角度来刻画分析视频通信过程,可以描述为:视频终端系统处于一个动态的网络与视频环境下,可以通过调整视频编码过程来获得一定质量的用户侧视频质量。这样可以发现,视频终端系统即为增强学习中的Agent,网络与视频的实时状况可以作为环境的状态(State),调整视频编码过程是本系统可能的动作(Action),而用户侧的视频质量则是本系统所得到的奖励(Reward)。视频终端系统的任务就是通过不断的尝试来学习最优的视频调整策略,使得用户侧视频质量的期望值最大化。
本发明由三个依次相继的过程组成,它们依次是:网络以及视频状态收集过程、智能控制核心的学习过程和视频编码的调整过程。
(1)网络以及视频状态收集。本发明的目的是根据实时的网络以及视频状况来动态的调整视频的编码过程,从而使得接收侧用户能够收看到质量最好的实时视频图像。网络的实时状况可以通过其时延、抖动以及丢包率等参数来刻画;视频的实时状况则包含视频源本身的状态与接收到视频的质量两个方面。在实际应用中,实时视频流是通过RTP(Real-time Transport Protocol)传输的,与RTP数据通道对应有一个控制通道RTCP(Real-time Transport ControlProtocol)流,它用来控制RTP的传输以及反馈RTP流的统计信息,如RTP包的时延、抖动等。本发明使用RTCP中的反馈信息作为网络情况的评估,这样无需额外的探测包,对网络造成的负担更小。视频源本身的实时状态通过帧复杂度来描述,这个指标刻画了每个帧相对的复杂度,比如相对于上一帧变化的多少、位移的大小等,复杂度高的帧可以得到更多的比特位,而复杂度低的则只能获得较少的比特位。由于视频发送端与接收端都没有足够的信息来评估接收到视频的质量,因此视频质量的评估采用了在发送端估计的方式。综合考虑实时性要求以及评估可靠性两个方面,视频质量的估计公式如下:
Figure GSA00000064548100061
其中SSIM(Structural Similarity)是基于结构失真的视频质量评价方法计算出的编码后的视频质量值;delay、jitter、lost分别对应时延、抖动、丢包率三个网络状况参数,εd、εj与εl则反映了三个参数对视频质量的相对影响大小。经过对视频传输过程的分析可以发现,视频质量随着上述三个参数的增大而变坏,而且时延、抖动、丢包的影响依次增大;另外通过对现实各种网络中视频传输质量的统计分析,本发明发现三个参数的常数部分取值如上述公式所示时可以最好的预估实际的视频质量。
本发明采用以下的策略来收集上述的网络和视频状态信息。在等待RTCP信息反馈的时间内,将这段时间内的视频帧分组,每个关键帧与下一个关键帧之间的所有帧组成一组,该组的帧复杂度定义为组内所有帧复杂度的平均值,而SSIM值定义为所有帧SSIM值的平均值;每组视频的帧复杂度与SSIM值都将保存下来以备后续操作使用。当RTCP反馈到达的时候,根据反馈中的网络状态信息以及保存的每组视频帧的SSIM值,通过上述公式计算每组视频的奖励值(即接收到的视频质量)。以上策略综合考虑了学习速度与正确性的问题。首先将视频分组,每组数据都会用于更新学习过程,可以为智能控制核心的学习过程提供更多的数据;另外,在H.264编码的过程中,两个关键帧之间的每个帧会引用之前的关键帧及它之前的帧,从而实现更高的视频压缩率,因此以关键帧为边界来分隔视频组是合理的,其中帧的平均复杂度与SSIM值也是有一定物理意义的。
(2)智能控制核心学习。网络自适应智能控制系统的核心实现架构如图2所示。该控制核心接受时延、抖动、丢包率三个网络信息以及帧复杂度这个视频信息作为当前环境的状态输入,输出在这些输入状态下应该使用的视频编码码率。其主要框架使用了增强学习中的AHC(Adaptive Heuristic Critic)模型(或称为Actor-Critic模型),其中Actor负责产生当前状态条件下的一个动作,Critic则负责学习预测当前状态条件下可能得到的奖励,图中的Value(x)即为Critic对环境奖励进行预测的函数。学习过程中,Critic接受环境的奖励反馈,更新Value(x),并将奖励预测误差以外界反馈的形式交给Actor模块,用于指导Actor纠正选取动作的策略。本发明中,Value(x)依据Q-learning更新规则进行学习,Actor则采用Gaussian ASLA(all solid-state laser annealing)动作函数来实现,Actor与Critic都使用BP(Back-Propagation)神经网络来进行泛化的工作。另外,由于状态数据各自的取值范围差异性很大,在使用之前需要进行规格化处理。下面将分别介绍各个环节的实现细节。
本发明使用如下的方法来进行规格化操作,每一个输入的实数值x都被分割为N个取值位于0~1之间的输出,计算第n个输出的值使用的公式如下:
Figure GSA00000064548100081
其中N与bn根据输入数据的分布特征指定,r为输入数据可能的取值范围。考虑到以上提到的四个状态变量,因为丢包率的取值范围位于0~1之间,不需要规格化。其他三个状态变量使用上式进行规格化,对于时延,N取为4,bn依次为0.7、3.6、7.3、100;对于抖动,N取为4,bn依次为1.38、4.6、13.9、20;对于帧复杂度,N取为8,bn依次为15000、25000、35000、45000、55000、70000、90000、120000。时延与抖动的取值情况与实际网络中的四个典型网络的特征值相对应,帧复杂度则是考察了实际视频复杂度分布后的结果。这样经过规格化后共得到16个输出数据,加上丢包率,共有17个,分别对应于图2中的out1~out17。这17个数据用来描述系统所在环境的状态,作为Actor与Critic中拟合过程所使用的神经网络的输入,分别与图2中的Input1~Input17一一对应。
本发明使用如下的方法来进行学习更新Critic的过程。系统运行过程中,首先在时刻t-1时Actor选择一个码率,而后会收到环境的反馈奖励信息,此处即是校正后的视频质量信息。此时,Critic需要更新自己的奖励预测函数,本发明使用了Q-learning的规则。所谓Q-learning也就是说预测函数在时刻t-1时预则的偏差描述公式如下:
δ=rt-1+γValuet-Valuet-1,其中rt-1是时刻t-1的动作所收到的奖励,是一个学习参数。上式的核心思想是使用预测函数当前的预测值来代替将来可以获得奖励的实际值,然后加上由时刻t-1到时刻t之间所得的奖励,就是时刻t-1时应该得到的奖励。随着学习过程的进行,Value(x)函数将逐步逼进于实际的奖励函数。
本发明使用如下的方法来进行学习更新Actor的过程。Actor的实现使用了Gaussian ASLA动作函数,在该实现方式中,需要一个μ(x)函数与σ(x)函数分别来估计输出值的均值与标准差,然后会使用服从均值为μ(x)、标准差为σ(x)的高斯分布随机数生成器来产生输出值,本文中的输出即为当前状态下的视频编码码率值,图2中显示了这种组织结构。μ(x)与σ(x)都是当前环境状态的函数,Actor的学习过程即是根据反馈值来不断更新纠正μ(x)与σ(x)的过程,其反馈值来至于Critic。由于Actor产生输出值(动作)的时候使用了高斯随机数发生器,因此μ(x)与σ(x)的更新规则与Critic中的Value(x)不同,使用了一种基于高斯分布的对数值的更新规则,具体规则公式如下:
Δμ=(at-1t-1
                               ,其中at-1是时刻t-1时Actor的输出的动作值,μt-1
Δσ=[(αt-1t-1)2t-1 2]δ与σt-1为时刻t-1时的输出值均值与标准差的预测值,δ为Critic给Actor的反馈。采用这种更新规则,Actor将倾向于提高那些获得正反馈的动作被选择的概率,而降低那些获得负反馈的动作被选择的概率;随着学习过程的进行,μ(x)将趋近于最优的动作值,而σ(x)也将逐步减小,从而缩小可选的动作的范围。
本发明使用如下的方法来进行学习更新神经网络的过程。增强学习中面临的一个普遍问题就是泛化问题,即当Agent遇到一个以前没有遇到过的状态时如何处理。为了使Agent可以处理这些未遇到过的状态,Agent就需要有一定的泛化能力,函数拟合是一种流行的实现方式,其中神经网络应用的比较广泛。本发明中共使用了三个神经网络,如图2中所示,分别用来拟合Critic中的Value(x)、Actor中的μ(x)和σ(x)。三个网络的输入相同,都是规格化之后的环境的状态值,输入层共有17个输入单元,即图2中的Input1~Input17;每个网络有一个隐层(Hidden Layer),隐层有三个神经元组成,即图2中的Hide1~Hide3;输出层有一个输出神经元,即图2中的Out。网络中的每个神经元的门限函数使用的是可微的sigmoid函数,公式如下:
Figure GSA00000064548100091
其中wi与xi分别为神经元的第i个输入的权值与输入值。本发明采用了使用三个神经网络来分别拟合三个函数的做法,在更新权值的时候三个函数不会互相干扰,更加有利于结果的拟合。三个网络的所有权值都初始化为[-0.1,0.1]之间的随机值。为了加快学习效率,并减少权值的误更新操作,本发明采用了带eligibility trace的更新方法,即只更新那些在计算过程中实际发生过作用的权值。这是增强学习领域应用比较广的有效方法,并且可以与TD(λ)配合使用。对于网络里的每一个权值w采用的更新规则公式如下:
Figure GSA00000064548100101
其中 为神经网络的输出与实际值的误差,
Figure GSA00000064548100102
为输出对该权值的偏导数,α为学习速率,et为w在时刻t时的eligibility trace值,λ为TD(λ)中的值,反映了奖励分配策略。
在Value(x)的神经网络中,Δo即为上述中的δ;在μ(x)与σ(x)的神经网络中,Δo为上述中的Δμ与Δσ。在学习过程中,每一次更新时,网络的权值都采用上式的方法进行更新,这是一种比较流行的基于梯度下降的更新方式,有良好的理论背景支持,可以收敛至均方误差最小的解。
(3)视频编码调整。如上所述,本发明将每个关键帧与下一个关键帧之间的所有帧组成一组。当开始编码一个新的视频组的时候,使用上一视频组的帧复杂度来计算新的视频组所应该使用的视频码率,并调整视频编码器的目标输出码率为相应值。每组视频使用的视频编码码率都将保存下来以备更新操作使用。当RTCP反馈到达的时候,使用保存的信息以及网络状态信息更新图表1中的三个神经网络。网络更新结束后,修改三个神经网络当前网络状态,并计算新的视频编码码率,调整视频编码器的目标输出码率为相应值。
本发明的视频传输控制系统的系统架构如图3所示,本发明工作于应用层,通过在应用层调整参数来适应动态变化的网络与视频环境。本发明在不需要改造现有网络的条件下,尤其是不需改造现有网络上的核心设备的条件下,就可以很好的改善实时视频质量,因此本发明规避了改造现有网络的风险,能够快速部署和实施,实现面向普通用户的广泛的视频质量保障。因此,本系统的边界如图3中的A所示。
状态收集模块用于收集网络以及视频流的状态信息。网络状态信息可以通过监听RTCP流实现(如图3中的③所示),而视频状态信息则可以在视频编码过程中获得(如图3中的①所示),不过这里存在着两种状态信息不同步的问题。网络状态信息以RTCP反馈的形式收到,频率比较低;而与此同时,视频编码的频率很快。经过仔细的研究,本发明采用以下的策略来实现状态搜集模块。在等待RTCP信息反馈的时间内,将这段时间内的视频帧分组,每个关键帧与下一个关键帧之间的所有帧组成一组,该组的帧复杂度定义为组内所有帧复杂度的平均值,而SSIM值定义为所有帧SSIM值的平均值。每组视频的帧复杂度与SSIM值都将放到状态信息缓存中以备更新操作使用,如图3中②所示。当RTCP反馈到达的时候,根据反馈中的网络状态信息以及保存的每组的SSIM值,计算每组视频的奖励值。收集到的网络状态信息(如图3中的④)以及状态信息缓存中的视频状态信息(如图3中的⑤)都将传给规格化模块作进一步的加工处理。
规格化模块的作用是将取值及分布差异很大的各个状态值进行规格化处理,使它们的取值都处于比较一致的范围内,从而为其他模块提供一个一致的规格化的状态描述。本发明使用如下的方法来进行规格化操作,每一个输入的实数值x都被分割为N个取值位于0~1之间的输出,其中N根据输入数据的取值范围以及分布特征指定。考虑到时延、时延抖动和丢包率三个网络状态变量以及帧复杂度这个视频状态变量,因为丢包率的取值范围位于0~1之间,不需要规格化;时延与抖动进行规格化时的取值情况与实际网路中的四个典型网络的特征值相对应;帧复杂度规格化时则考察了实际视频帧复杂度分布后的结果。规格化结束后共得到17个取值位于0~1之间的规格化数据,它们一起描述了某一时刻的网络和视频的实时状态,将作为参数学习模块与视频控制模块的输入(如图3中的⑥与⑧)。
参数学习模块主要负责根据网络以及视频环境反馈的视频质量的结果动态的调整智能控制核心的参数,从而使得智能控制核心能更好的适应目前的环境状态,这是本发明中的系统具有在线学习与环境自适应能力的关键模块。该模块接受规格化模块输出的时延、抖动、丢包率三个网络信息以及帧复杂度这个视频信息作为当前环境的状态输入(如图3中的⑥),接受网络状态偏置后的SSIM值作为当前环境的奖励,从而调整相应的参数。其主要框架使用了增强学习中的AHC模型(或称为Actor-Critic模型),其中Actor负责产生当前状态条件下的一个动作,Critic则负责学习预测当前状态条件下可能得到的奖励。学习过程中,Critic接受环境的奖励反馈,使用Q-learning更新规则来调整对环境奖励的预测函数,并将奖励预测误差以外界反馈的形式交给Actor模块;Actor模块根据Critic提供的奖励反馈来更新动作的选取策略。若从Critic获得的奖励反馈为正时,即上一次选取的视频编码码率收到了比以往更好的视频质量,Actor就调整其内部参数提高该视频编码码率选中的概率;若奖励反馈为负,即上一次选取的视频编码码率取得了比以往要差的视频质量,Actor就调整其内部参数降低该视频编码码率选中的概率。参数学习模块更新后的内部参数会被视频控制模块用于视频编码码率的选择过程中(如图3中的⑦所示)。
视频控制模块负责产生符合当前环境状态的最优的视频编码码率。视频控制模块接受规格化模块输出的规格化后的状态数据以及参数学习模块更新后的内部参数(如图3中的⑦与⑧所示),参照当前状态,依据内部参数指定的策略选取适合于当前环境的合适的视频编码码率。视频控制模块在选择视频编码码率的时候需要考虑探索问题,即是去尝试新的视频编码码率,还是从过去的视频编码码率中选择,如果要尝试新的,采用怎样的策略。本发明使用的是随机选择的策略,选择过去视频编码码率的概率与该码率已知奖励成正比;而且有一定概率选择新的视频编码码率,选择某一新视频编码码率的概率与其附近码率值的已知奖励成正比。该随机选择策略的输入即为当前环境的各个状态值,使用的内部参数是由参数学习模块负责调整更新的。视频控制模块的输出值是当前状态下应使用的视频编码码率,将用于视频编码模块的编码过程中(如图3中的⑨所示)。
视频编码模块负责对原始的视频图像进行编码处理。视频编码模块接受视频控制模块输出的视频编码码率作为输入(如图3中的⑨所示),将该值作为视频编码器的目标编码码率,编码后的视频流将以RTP流的形式输出到网络中(如图3中的⑩所示)。
本发明的优点在于:
一、本发明将实时视频通信中的各个因素综合起来考虑,即将视频处理过程中,实际视频场景的复杂度、传输网络中的实时时延、时延抖动以及丢包情况综合起来考虑,保障了实时处理的视频质量。而传统方法通常只考虑视频流的特点或网络状况中的一个,没有将两者有机的结合起来。
二、本发明提供了一种对视频通信中的各个因素进行规格化处理的方法,以便将这些取值范围差异很大的状态值以及奖励值映射到一致的范围内,从而更加有利于核心控制模块的学习与控制过程。
三、本发明分析出视频通信中的各因素与视频质量的关系,并使用机器学习领域著名的并已有较为成熟应用的增强学习算法来定量的学习刻画这一潜在的关系,并实现了实时的网络自适应的视频传输控制系统。使用本发明的系统和方法,可以根据所处的网络环境在线的学习改进,做到真正意义上的网络自适应,这是传统方法所不具备的优点。
四、本发明工作于应用层,它是一种动态适应环境来保证视频传输质量的系统和方法,过程简洁,适用面广,适用于所有实时视频传输的情况,使用本发明,可以根据所处的网络环境在线的学习改进,做到真正意义上的网络自适应,这是本发明特有的优点。
以上所述实施例仅是为充分说明本发明而所举的较佳的实施例,本发明的保护范围不限于此。本技术领域的技术人员在本发明基础上所作的等同替代或变换,均在本发明的保护范围之内。本发明的保护范围以权利要求书为准。

Claims (10)

1.一种视频传输控制方法,其特征在于,包括:
在视频传输过程中,收集网络实时状况及视频状态信息,并将收集到的信息进行规格化处理;
根据规格化后的网络及视频状态信息估计视频质量,计算视频编码率;
根据计算得到的视频编码率对视频进行编码压缩处理,并将压缩处理后的视频进行传输。
2.根据权利要求1所述的视频传输控制方法,其特征在于,所述网络实时状况包括时延、抖动和丢包率;所述收集网络实时状况通过获取RTCP流中的反馈信息来实现。
3.根据权利要求2所述的视频传输控制方法,其特征在于,在等待RTCP流中的反馈信息的过程中,将视频的每个关键帧与下一个关键帧之间的所有帧组成一组,计算并保存每组视频的视频质量值SSIM;获取RTCP流中的反馈信息后,根据反馈中的网络状态信息计算每组视频的估计视频质量,所述估计视频质量由以下公式计算:
Figure FSA00000064548000011
其中,εd=1/100,εj=1/20,εl=256,每组视频的视频质量值SSIM为该组内所有帧视频质量值的平均值,delay、jitter、lost分别对应时延、抖动、丢包率三个网络状况参数。
4.根据权利要求3所述的视频传输控制方法,其特征在于,将收集到的信息进行规格化处理包括:
将每一个输入的实数值x分割为N个取值位于0~1之间的输出,计算第n个输出的值使用的公式如下:
i n = 1 1 + e w n ( b n - x )
Figure FSA00000064548000013
其中,丢包率不需要规格化,N与bn根据输入数据的分布特征指定,对于时延,N取为4,bn依次为0.7、3.6、7.3、100;对于抖动,N取为4,bn依次为1.38、4.6、13.9、20;对于帧复杂度,N取为8,bn依次为15000、25000、35000、45000、55000、70000、90000、120000;r为输入数据可能的取值范围。
5.根据权利要求4所述的视频传输控制方法,其特征在于,所述根据规格化后的网络及视频状态信息估计视频质量,计算视频编码率的方法为:
将规格化后的网络及视频状态信息输入到增强学习中的Actor-Critic模型,Actor-Critic模型中的Critic根据所输入的规格化后的网络及视频状态信息采用预测函数Value(x)预测视频质量,Critic将预测的视频质量与环境反馈的视频质量的误差反馈给Actor-Critic模型中的Actor,并根据环境反馈的视频质量更新预测函数;
Actor根据所输入的规格化后的网络及视频状态信息计算得到视频编码率,根据Critic输出的预测误差更新选取动作的策略。
6.根据权利要求5所述的视频传输控制方法,其特征在于,所述Actor根据所输入的规格化后的网络及视频状态信息计算得到视频编码率、根据Critic输出的预测误差更新选取动作的策略具体包括:
系统运行过程中,首先在时刻t-1时Actor根据所输入的规格化后的网络及视频状态信息通过μ(x)函数和σ(x)函数分别估计视频编码率的均值与标准差,然后使用服从均值为μ(x)、标准差为σ(x)的高斯分布随机数生成器来产生视频编码率;
所述Actor根据Critic输出的预测误差修正均值μ(x)和标准差σ(x),修正公式为:
Δμ=(at-1t-1
                              ;
Δσ=[(at-1t-1)2t-1 2
其中,at-1是时刻t-1时Actor的输出的动作值,μt-1与σt-1分别为时刻t-1时的输出值均值与标准差的预测值,δ为Critic给Actor的反馈。
7.根据权利要求6所述的视频传输控制方法,其特征在于,所述Critic给Actor的反馈δ通过以下公式获得:
δ=rt-1+γValuet-Valuet-1
其中rt-1是时刻t-1的动作所收到的环境反馈的视频质量,γ是一个学习参数。
8.根据权利要求7所述的视频传输控制方法,其特征在于,采用三个神经网络分别用来拟合Critic中的Value(x)、Actor中的μ(x)和σ(x),三个网络的输入均为规格化之后的网络及视频状态信息;每个网络有一个隐层,隐层由三个神经元组成;输出层有一个输出神经元,网络中的每个神经元的门限函数使用的是可微的sigmoid函数,公式如下:
1 1 + e - x ,
x = Σ i w i x i
其中wi与xi分别为神经元的第i个输入的权值与输入值,三个网络的所有权值都初始化为[-0.1,0.1]之间的随机值。
9.根据权利要求7所述的视频传输控制方法,其特征在于,所述网络里的每一个权值w采用的更新规则公式如下:
wt=wt-1+Δw
Δw=αet-1Δo,
e t = λ γe t - 1 + ∂ o ∂ w
其中Δo为神经网络的输出与实际值的误差,
Figure FSA00000064548000034
为输出对该权值的偏导数,α为学习速率,et为w在时刻t时的eligibility trace值,λ为TD(λ)中的值。
10.一种视频传输控制系统,其特征在于,包括:
状态收集模块,用于收集网络以及视频状态信息;
规格化模块,用于对所述状态收集模块收集到的网络以及视频状态信息进行规格化处理;
参数学习模块,用于根据所述规格化模块处理后的网络以及视频状态信息以及视频环境反馈的视频质量的结果动态的调整智能控制核心的参数并输出,从而使得智能控制核心能更好的适应目前的环境状态;
视频控制模块,用于根据所述规格化模块处理后的网络以及视频状态信息和所述参数学习模块输出的参数产生符合当前环境状态的最优的视频编码码率;
视频编码模块,用于根据视频控制模块产生的视频编码码率对原始的视频图像进行编码处理。
CN 201010131630 2010-03-24 2010-03-24 一种视频传输控制方法及系统 Expired - Fee Related CN101808244B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN 201010131630 CN101808244B (zh) 2010-03-24 2010-03-24 一种视频传输控制方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN 201010131630 CN101808244B (zh) 2010-03-24 2010-03-24 一种视频传输控制方法及系统

Publications (2)

Publication Number Publication Date
CN101808244A true CN101808244A (zh) 2010-08-18
CN101808244B CN101808244B (zh) 2012-03-14

Family

ID=42609831

Family Applications (1)

Application Number Title Priority Date Filing Date
CN 201010131630 Expired - Fee Related CN101808244B (zh) 2010-03-24 2010-03-24 一种视频传输控制方法及系统

Country Status (1)

Country Link
CN (1) CN101808244B (zh)

Cited By (29)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101968928A (zh) * 2010-10-19 2011-02-09 北方工业大学 远程交通信号控制方法
CN102333214A (zh) * 2011-07-22 2012-01-25 华为技术有限公司 用于异构网络的码流传输方法、装置及系统
CN102413378A (zh) * 2011-11-02 2012-04-11 杭州电子科技大学 一种基于自适应神经网络的视频传输丢包恢复方法
CN102457726A (zh) * 2010-10-18 2012-05-16 曜鹏科技股份有限公司 影像编码集成电路及其影像编码资料传输方法
CN102724543A (zh) * 2012-07-06 2012-10-10 赛特斯网络科技(南京)有限责任公司 Ip网络中基于hmm实现媒体质量分析评估控制的方法
CN103248884A (zh) * 2012-02-14 2013-08-14 华为技术有限公司 一种控制视频速率的系统、基站及方法
WO2013143396A1 (zh) * 2012-03-28 2013-10-03 中国移动通信集团公司 一种数字视频质量控制方法及其装置
CN103621015A (zh) * 2011-06-01 2014-03-05 锐迪讯有限公司 用于识别劣化视频通话链路的系统、方法和介质
CN103945281A (zh) * 2014-04-29 2014-07-23 中国联合网络通信集团有限公司 视频传输处理方法、装置和系统
CN104243102A (zh) * 2014-09-30 2014-12-24 深圳市云之讯网络技术有限公司 一种基于网络状态评估的码率控制方法及其装置
WO2017032254A1 (zh) * 2015-08-24 2017-03-02 华为技术有限公司 网络控制策略的生成方法、装置及网络控制器
CN107105226A (zh) * 2017-06-22 2017-08-29 上海迪爱斯通信设备有限公司 一种视频质量评价装置
WO2017148260A1 (zh) * 2016-02-29 2017-09-08 腾讯科技(深圳)有限公司 语音编码发送方法和装置
CN107431492A (zh) * 2015-03-03 2017-12-01 索尼公司 压缩编码设备、压缩编码方法、解码设备、解码方法和程序
CN107547914A (zh) * 2017-08-15 2018-01-05 浙江工业大学 Dash标准下的基于knn‑q学习的视频片段获取优化方法
CN107734282A (zh) * 2017-08-25 2018-02-23 北京元心科技有限公司 视频通讯方法及装置
CN107992939A (zh) * 2017-12-06 2018-05-04 湖北工业大学 基于深度增强学习的等切削力齿轮加工方法
CN108063961A (zh) * 2017-12-22 2018-05-22 北京联合网视文化传播有限公司 一种基于强化学习的自适应码率视频传输方法以及系统
CN108259808A (zh) * 2018-01-31 2018-07-06 维沃移动通信有限公司 一种视频帧压缩方法和移动终端
CN108418757A (zh) * 2018-02-12 2018-08-17 北京容联易通信息技术有限公司 媒体平台的智能路由方法及系统
CN110099280A (zh) * 2019-05-24 2019-08-06 浙江大学 一种无线自组织网络带宽受限下的视频业务质量增强方法
CN110324621A (zh) * 2019-07-04 2019-10-11 北京达佳互联信息技术有限公司 视频编码方法、装置、电子设备和存储介质
CN110971784A (zh) * 2019-11-14 2020-04-07 北京达佳互联信息技术有限公司 一种视频处理方法、装置、电子设备及存储介质
CN111083483A (zh) * 2019-12-31 2020-04-28 北京奇艺世纪科技有限公司 一种视频编码码率确定方法、装置、电子设备及存储介质
CN111083535A (zh) * 2019-12-26 2020-04-28 天翼物联科技有限公司 视频数据传输码率自适应方法、系统、装置和存储介质
CN112291824A (zh) * 2020-11-23 2021-01-29 武汉长江通信智联技术有限公司 一种5g网络下无线视频低延时传输方法
CN112511482A (zh) * 2019-09-16 2021-03-16 华为技术有限公司 媒体数据传输方法、装置及系统
CN113259657A (zh) * 2021-05-18 2021-08-13 上海大学 基于视频质量分数的dppo码率自适应控制系统和方法
CN114448588A (zh) * 2022-01-14 2022-05-06 杭州网易智企科技有限公司 音频传输方法、装置、电子设备及计算机可读存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1468001A (zh) * 2002-06-27 2004-01-14 上海汉唐科技有限公司 基于因特网的媒体流自适应传输方法
WO2005050945A1 (en) * 2003-11-24 2005-06-02 Matsushita Electric Industrial Co., Ltd. Feedback provision using general nack report blocks and loss rle report blocks
CN101183917A (zh) * 2007-12-24 2008-05-21 腾讯科技(深圳)有限公司 一种多媒体数据编码速率调节方法和装置
CN101198042A (zh) * 2007-12-26 2008-06-11 广东威创视讯科技股份有限公司 视频编码的码率控制方法及视频数据的发射设备
CN101511010A (zh) * 2009-03-27 2009-08-19 北京中星微电子有限公司 一种媒体流发送方法及装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1468001A (zh) * 2002-06-27 2004-01-14 上海汉唐科技有限公司 基于因特网的媒体流自适应传输方法
WO2005050945A1 (en) * 2003-11-24 2005-06-02 Matsushita Electric Industrial Co., Ltd. Feedback provision using general nack report blocks and loss rle report blocks
CN101183917A (zh) * 2007-12-24 2008-05-21 腾讯科技(深圳)有限公司 一种多媒体数据编码速率调节方法和装置
CN101198042A (zh) * 2007-12-26 2008-06-11 广东威创视讯科技股份有限公司 视频编码的码率控制方法及视频数据的发射设备
CN101511010A (zh) * 2009-03-27 2009-08-19 北京中星微电子有限公司 一种媒体流发送方法及装置

Cited By (44)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102457726A (zh) * 2010-10-18 2012-05-16 曜鹏科技股份有限公司 影像编码集成电路及其影像编码资料传输方法
CN101968928A (zh) * 2010-10-19 2011-02-09 北方工业大学 远程交通信号控制方法
CN103621015B (zh) * 2011-06-01 2017-03-22 阿瓦亚公司 用于识别劣化视频通话链路的系统、方法和设备
CN103621015A (zh) * 2011-06-01 2014-03-05 锐迪讯有限公司 用于识别劣化视频通话链路的系统、方法和介质
CN102333214A (zh) * 2011-07-22 2012-01-25 华为技术有限公司 用于异构网络的码流传输方法、装置及系统
CN102413378A (zh) * 2011-11-02 2012-04-11 杭州电子科技大学 一种基于自适应神经网络的视频传输丢包恢复方法
CN103248884A (zh) * 2012-02-14 2013-08-14 华为技术有限公司 一种控制视频速率的系统、基站及方法
WO2013143396A1 (zh) * 2012-03-28 2013-10-03 中国移动通信集团公司 一种数字视频质量控制方法及其装置
CN102724543A (zh) * 2012-07-06 2012-10-10 赛特斯网络科技(南京)有限责任公司 Ip网络中基于hmm实现媒体质量分析评估控制的方法
CN102724543B (zh) * 2012-07-06 2014-07-30 赛特斯信息科技股份有限公司 Ip网络中基于hmm实现媒体质量分析评估控制的方法
CN103945281A (zh) * 2014-04-29 2014-07-23 中国联合网络通信集团有限公司 视频传输处理方法、装置和系统
CN104243102A (zh) * 2014-09-30 2014-12-24 深圳市云之讯网络技术有限公司 一种基于网络状态评估的码率控制方法及其装置
CN107431492B (zh) * 2015-03-03 2021-05-04 索尼公司 压缩编码设备、压缩编码方法、解码设备、解码方法和程序
CN107431492A (zh) * 2015-03-03 2017-12-01 索尼公司 压缩编码设备、压缩编码方法、解码设备、解码方法和程序
WO2017032254A1 (zh) * 2015-08-24 2017-03-02 华为技术有限公司 网络控制策略的生成方法、装置及网络控制器
US10749757B2 (en) 2015-08-24 2020-08-18 Huawei Technologies Co., Ltd. Method and apparatus for generating network control policy, and network controller
WO2017148260A1 (zh) * 2016-02-29 2017-09-08 腾讯科技(深圳)有限公司 语音编码发送方法和装置
US11349900B2 (en) 2016-02-29 2022-05-31 Tencent Technology (Shenzhen) Company Limited Voice encoding and sending method and apparatus
US10819766B2 (en) 2016-02-29 2020-10-27 Tencent Technology (Shenzhen) Company Limited Voice encoding and sending method and apparatus
CN107105226A (zh) * 2017-06-22 2017-08-29 上海迪爱斯通信设备有限公司 一种视频质量评价装置
CN107547914A (zh) * 2017-08-15 2018-01-05 浙江工业大学 Dash标准下的基于knn‑q学习的视频片段获取优化方法
CN107734282A (zh) * 2017-08-25 2018-02-23 北京元心科技有限公司 视频通讯方法及装置
CN107992939A (zh) * 2017-12-06 2018-05-04 湖北工业大学 基于深度增强学习的等切削力齿轮加工方法
CN108063961A (zh) * 2017-12-22 2018-05-22 北京联合网视文化传播有限公司 一种基于强化学习的自适应码率视频传输方法以及系统
CN108063961B (zh) * 2017-12-22 2020-07-31 深圳市云网拜特科技有限公司 一种基于强化学习的自适应码率视频传输方法以及系统
CN108259808A (zh) * 2018-01-31 2018-07-06 维沃移动通信有限公司 一种视频帧压缩方法和移动终端
CN108259808B (zh) * 2018-01-31 2021-01-08 维沃移动通信有限公司 一种视频帧压缩方法和移动终端
CN108418757A (zh) * 2018-02-12 2018-08-17 北京容联易通信息技术有限公司 媒体平台的智能路由方法及系统
CN108418757B (zh) * 2018-02-12 2020-10-20 北京容联易通信息技术有限公司 媒体平台的智能路由方法及系统
CN110099280A (zh) * 2019-05-24 2019-08-06 浙江大学 一种无线自组织网络带宽受限下的视频业务质量增强方法
CN110099280B (zh) * 2019-05-24 2020-05-08 浙江大学 一种无线自组织网络带宽受限下的视频业务质量增强方法
CN110324621A (zh) * 2019-07-04 2019-10-11 北京达佳互联信息技术有限公司 视频编码方法、装置、电子设备和存储介质
CN110324621B (zh) * 2019-07-04 2021-05-18 北京达佳互联信息技术有限公司 视频编码方法、装置、电子设备和存储介质
CN112511482A (zh) * 2019-09-16 2021-03-16 华为技术有限公司 媒体数据传输方法、装置及系统
CN110971784B (zh) * 2019-11-14 2022-03-25 北京达佳互联信息技术有限公司 一种视频处理方法、装置、电子设备及存储介质
CN110971784A (zh) * 2019-11-14 2020-04-07 北京达佳互联信息技术有限公司 一种视频处理方法、装置、电子设备及存储介质
CN111083535B (zh) * 2019-12-26 2021-08-03 天翼物联科技有限公司 视频数据传输码率自适应方法、系统、装置和存储介质
CN111083535A (zh) * 2019-12-26 2020-04-28 天翼物联科技有限公司 视频数据传输码率自适应方法、系统、装置和存储介质
CN111083483A (zh) * 2019-12-31 2020-04-28 北京奇艺世纪科技有限公司 一种视频编码码率确定方法、装置、电子设备及存储介质
CN112291824A (zh) * 2020-11-23 2021-01-29 武汉长江通信智联技术有限公司 一种5g网络下无线视频低延时传输方法
CN112291824B (zh) * 2020-11-23 2022-10-04 武汉长江通信智联技术有限公司 一种5g网络下无线视频低延时传输方法
CN113259657A (zh) * 2021-05-18 2021-08-13 上海大学 基于视频质量分数的dppo码率自适应控制系统和方法
CN114448588A (zh) * 2022-01-14 2022-05-06 杭州网易智企科技有限公司 音频传输方法、装置、电子设备及计算机可读存储介质
CN114448588B (zh) * 2022-01-14 2024-01-23 杭州网易智企科技有限公司 音频传输方法、装置、电子设备及计算机可读存储介质

Also Published As

Publication number Publication date
CN101808244B (zh) 2012-03-14

Similar Documents

Publication Publication Date Title
CN101808244B (zh) 一种视频传输控制方法及系统
CN102802089B (zh) 一种基于体验质量预测的移动视频码率调整方法
CN107634911B (zh) 一种信息中心网络中基于深度学习的自适应拥塞控制方法
CN103888846B (zh) 基于QoE的无线视频流业务自适应速率控制方法
CN109905696B (zh) 一种基于加密流量数据的视频服务体验质量的识别方法
CN108235001B (zh) 一种基于时空特征的深海视频质量客观评价方法
CN113242469A (zh) 一种自适应视频传输配置方法和系统
CN104683804A (zh) 基于视频内容特征的参数自适应多维码率控制方法
CN102413378A (zh) 一种基于自适应神经网络的视频传输丢包恢复方法
CN107135041A (zh) 一种基于相空间重构的rbf神经网络信道预测方法
CN112616131A (zh) 一种基于视频内容优先级的车联网资源分配方法
CN113132765A (zh) 码率决策模型训练方法、装置、电子设备及存储介质
CN113259657A (zh) 基于视频质量分数的dppo码率自适应控制系统和方法
CN108964672A (zh) 一种基于深度神经网络的极化码译码方法
Kazemian et al. Neuro-Fuzzy approach to video transmission over ZigBee
CN113660488B (zh) 对多媒体数据进行流控及流控模型训练方法、以及装置
CN116842440A (zh) 基于情境感知的自适应链路切换方法及系统、设备、介质
CN104702974B (zh) 基于模糊逻辑的码率控制方法及视频编码方法
CN113872873B (zh) 一种适合5g新应用的多场景跨层拥塞控制方法
Khan et al. An ANFIS-based hybrid video quality prediction model for video streaming over wireless networks
Gong et al. Adaptive bitrate video semantic communication over wireless networks
CN116847120A (zh) 基于深度强化学习的传输编码联合码率自适应控制方法
Smirnov et al. Real-time data transmission optimization on 5G remote-controlled units using deep reinforcement learning
Li et al. Improving Adaptive Real-Time Video Communication Via Cross-layer Optimization
CN115022684A (zh) 一种quic协议下基于深度强化学习的视频流自适应传输方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20120314

Termination date: 20150324

EXPY Termination of patent right or utility model