CN103634602B - 基于QoE控制的计算量可感知的运动估计算法 - Google Patents
基于QoE控制的计算量可感知的运动估计算法 Download PDFInfo
- Publication number
- CN103634602B CN103634602B CN201310562939.2A CN201310562939A CN103634602B CN 103634602 B CN103634602 B CN 103634602B CN 201310562939 A CN201310562939 A CN 201310562939A CN 103634602 B CN103634602 B CN 103634602B
- Authority
- CN
- China
- Prior art keywords
- block
- calculation
- gain
- frame
- amount
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000004364 calculation method Methods 0.000 title claims abstract description 79
- 238000000034 method Methods 0.000 claims abstract description 13
- 230000008859 change Effects 0.000 claims description 4
- 230000009467 reduction Effects 0.000 claims description 2
- 230000008569 process Effects 0.000 abstract description 7
- 238000012360 testing method Methods 0.000 abstract description 6
- 238000001514 detection method Methods 0.000 abstract description 2
- 101100409308 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) adv-1 gene Proteins 0.000 description 6
- 238000002474 experimental method Methods 0.000 description 5
- 238000012545 processing Methods 0.000 description 5
- 238000010845 search algorithm Methods 0.000 description 5
- 101100108191 Vibrio parahaemolyticus serotype O3:K6 (strain RIMD 2210633) add gene Proteins 0.000 description 4
- 101150060298 add2 gene Proteins 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 101150004094 PRO2 gene Proteins 0.000 description 3
- 229910003460 diamond Inorganic materials 0.000 description 2
- 239000010432 diamond Substances 0.000 description 2
- 230000001788 irregular Effects 0.000 description 2
- 238000013507 mapping Methods 0.000 description 2
- 108091026890 Coding region Proteins 0.000 description 1
- 230000001133 acceleration Effects 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008094 contradictory effect Effects 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000009472 formulation Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000013139 quantization Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
Landscapes
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
本发明涉及基于QoE控制的计算量可感知的运动估计算法,对移动设备上的实时视频编码,设计了一个带有两个体验维度的QoE计算模型,让用户可以在视频的质量和时长之间进行选择和调节,并应用在了所提出来的一种新型的计算量可感知的运动估计算法里面。该算法采用的是单遍扫描处理流程,利用块的初始匹配误差信息和对应的失真增益信息将块分为四类,将一帧的计算量分成了基本层和增益层两个部分,分别对四类块进行分配,同时采用了提前终止检测和计算量分配调整策略。实验结果表明,该算法能够更加精确地对计算量进行分配,以及所构造的QoE计算模型具有实用性。
Description
技术领域
本发明涉及IT行业,具体的说是一种基于QoE控制的计算量可感知的运动估计算法。
背景技术
运动估计是视频编码过程中消耗时间最多的一个功能模块,也一直被作为视频编码研究的重点部分。在移动应用环境中,当手机等移动设备的电能消耗以及处理能力发生改变时,编码器复杂性所控制的重点就在于如何控制运动估计的复杂性。随着新一代视频编码标准HEVC的推出,这一问题显得更为突出。传统的运动估计算法有全搜索算法(FS)、三步搜索算法(TSS)、四步搜索算法(FSS)、菱形搜索算法(DS)等。它们有这样一个特点:如果没有足够的计算量将会导致无法完成一帧的运动估计,使得一帧后面的块无法被处理。这导致它们无法适应计算资源有限和变化的移动应用环境。Tai等人最早提出了计算量可感知的概念,通过对所有块同时进行处理,每次把计算量分配给匹配误差最大的块来进行运动估计。但每次把计算量分配给匹配误差最大的块并不总是有效的。Yang等人为块的每次搜索建立了一个优先级,根据优先级的大小进行计算量的分配。这两种方法采用的都是多遍扫描处理流程,不能够利用相邻块的信息。Huang等人提出了一种单遍扫描处理流程方案,从而可以利用相邻块的信息,并采用了自适应搜索策略。Lin等人采用的也是单遍扫描处理流程,结合前一帧对应块的运动矢量信息把块分为三类,根据前一帧块的分类信息将计算量分配到三类块中。这种大粒度的信息参考很容易导致参考信息的非有效性造成大范围的影响。在移动设备上,用户追求的体验维度有视频的质量和时长,但上面这些算法仅仅只是考虑了视频质量。为了提供更佳的用户体验,即让用户可以在视频的质量和时长之间进行选择和调节,本发明设计了一个QoE计算模型用于指导这个过程 的进行,并将此模型应用在了所提出来的一种采用单遍扫描处理流程的新型的计算量可感知的运动估计算法里面。
发明内容
本发明所要解决的技术问题是克服现有技术的不足,提供一种监控视频系统的关键帧提取方法,本发明解决其技术问题所采用的技术方案是:本发明包括两个部分:帧级别计算量分配和块级别计算量分配,其特征在于帧级别计算量分配有两个限制,一个是视频质量的平滑性,另一个是计算资源的节省性,视频质量的平滑性限制用来保证不同视频帧之间的补偿质量的变化尽可能要小,计算资源的节省性限制则是用来在搜索候选匹配块时,终止那些不必要的计算量使用,由于采用的块级别计算量分配算法会严格控制计算量不会被超额使用,为了方便与其他方法进行比较,采用的是为每一帧分配固定的计算量,其中块级别计算量分配,首先是把块分成四类,把一帧可使用的计算量划分成基本层和增益层两个部分,然后根据块的类别分别进行基本层和增益层计算量的分配;对块进行分类的方法:利用到前一帧的失真增益,当前帧的每个块都有一个预测运动矢量指向前一帧的某个块,而被指向的每个块都对应着一个失真增益,该失真增益是它的初始匹配误差与最终匹配误差之间的差值,如果当前块的预测运动矢量所指向的块覆盖了前一帧中多个块,则该块对应的失真增益是所覆盖块的失真增益的加权和,用Beblock表示当前块所对应的失真增益:
其中,Beb_pre_i表示所覆盖块i的失真增益,权重因子ωi则对应所覆盖块i的面积占的比例,用Difb_initial表示块的初始匹配误差,则四类块是按如下方式进行定义的:
其中,Classblock表示当前块的所属分类,dths表示一个块的初始匹配误差过 小的阈值,dthl表示一个块的初始匹配误差过大的阈值,bth表示一个块的失真增益是大还是小的分隔点;块级别计算量分配算法:块级别计算量分配首先是将一帧可使用的计算量分成基本层和增益层两个部分,基本层计算量所占的比例是α(0<α<1),基本层计算量被分配给所有的四类块,而每块所分得的基本层计算量是根据其初始匹配误差进行分配的,用Cb_base表示一个块所分得的基本层计算量:
其中,Cbase_available表示一帧中基本层可用的计算量,Numb_nopro表示一帧中未被处理的块的数量,AvgDif表示一帧中已经被处理过的块的平均初始匹配误差,增益层计算量也被分配给所有的四类块,而每块所分得的增益层计算量是根据其失真增益进行分配的,用Cb_benefit表示一个块所分得的增益层计算量:
其中,Cbenefit_total表示一帧中增益层总的计算量,Betotal_pre表示一帧中总的失真增益,另外,为了减少所采用的失真增益信息的非有效性所带来的影响,当第1类块和第2类块的某一步搜索得到的最佳运动矢量是预测运动矢量,该块很有可能已经达到了全局最优,为了减少计算量的不必要使用,便停止对该块的搜索,当第2类块和第3类块的最后一步搜索的失真增益比大于β(0<β<1),该步的失真增益比表示失真减少量所占的比例,则增加计算量以进行更多一步的搜索,当第4类块的连续两步搜索的失真增益比都小于γ(0<γ<1),则立即停止对该块的搜索,为了使搜索策略更具一般性,实验中采用的运动估计算法是菱形搜索算法,并将预测运动矢量作为初始搜索点,为了加快搜索速度,也采用了其他一些传统的加速策略,比如说当一个块的部分匹配误差大于最小匹配误差的时候,便停止对该块匹配误差的计算。
本发明QoE计算模型是对于在手机等移动设备上的视频应用,用户通常有视频的质量和时长两个体验维度追求,并且这两个体验维度是相互矛盾 的,需要在它们之间制定一个平衡点。为了提供更佳的用户体验,这就需要用户来参与这个平衡点的制定,因此就需要一种QoE计算模型来指导整个过程的进行。构造QoE计算模型通常的做法是:首先找到影响用户体验的参数,然后统计用户的体验评价,最后在QoE和这些参数之间建立一种映射关系。建立映射关系可以采用随机神经网络,也可以采用指数关系或者对数关系。而所构造的QoE计算模型的最大价值就在于它的实施应用,若只是进行一些简单的体验报告,还不如直接对用户做份问卷调查更有效。本发明所构造的QoE计算模型主要用于指导所提出来的一种新型的计算量可感知的运动估计算法,让用户可以在视频的质量和时长之间进行选择和调节。为了在视频的质量和时长之间制定一个基准,本发明选择了手机等移动设备上的计算资源利用率和电量状态两个参数,并将它们的值相等时作为基准。用Dexperience表示用户所追求的体验维度:
Dexperience=Ucomputation-Scharge (5)
其中,Ucomputation表示手机等移动设备的计算资源利用率,Scharge表示手机等移动设备的电量状态。在具体实施操作中,Ucomputation采用的是CPU当前时钟频率和最高时钟频率的比值,而通过DVFS技术可以很容易地对CPU时钟频率进行调整控制。当Dexperience大于0时,表明用户追求的体验维度是视频质量;当Dexperience小于0时,表明用户追求的体验维度是视频时长。为了定量地描述两个体验维度,本发明所构造的QoE计算模型为两个体验维度分别提供了100个数字值让用户进行选择,用SQoE来表示。当用户体验维度追求的是视频质量时,通过DVFS技术将Ucomputation调整到当前值与1之间所选SQoE的百分比;当用户体验维度追求的是视频时长时,通过DVFS技术将Ucomputation调整到当前值与0之间所选SQoE的百分比。具体的计算过程如下:
本发明的有益效果是,本发明能够更加精确地对计算量进行分配,以及所构造的QoE计算模型具有实用性。如果结合其他更有效的搜索策略或者计算量分配方案能够进一步提升用户体验。
附图说明
图1:本发明实施例算法处理框架结构示意图。
图2:本发明实施例mobile序列实验结果结构示意图。
图3:本发明实施例bus序列实验结果结构示意图。
图4:本发明实施例highway序列实验结果结构示意图。
具体实施方式
参照附图说明对本发明作以下具体的详细说明。本发明实验中选取的测试视频序列有CIF分辨率大小的mobile、bus和highway,它们分别具有复杂不规则的运动属性、复杂相对规则的运动属性以及简单平缓的运动属性。编码序列格式第一帧是I帧,其余全部是P帧,参考帧为一帧。帧率为每秒15帧,块大小选择的都是8*8,量化参数为28,搜索范围是[-16,16],控制参数α取0.4,β和γ都取0.1。块初始匹配误差过大过小阈值参数dths和dthl值的设定是根据前一帧的初始匹配误差信息来进行的:如果位于前一帧相关信息的前30%,则算大;如果位于前一帧相关信息的后30%,则算小。块的失真增益是大还是小的分隔点bth值的设定是取前一帧相关信息的中值。第一个P帧所有计算量的分配都只是根据块的初始匹配误差来进行。为了验证本算法的有效性,设计了以下几个对比方案:pro1表示提出的算法不带有QoE控制,pro2表示提出的算法带有QoE控制,add1表示只是根据块的初始匹配误差进行计算量分配,add2表示利用前一帧对应块的运动矢量信息进行计算量分配。为了更好地模拟实验效果,QoE控制中电量的递减是以帧为单位进行的,电量初始状态为100%,并以每帧1%的电量递减,一帧可以使用的最大计算量是30000个搜索点。采用的QoE控制方案是:始终保持Dexperience的值为1,即保持计算资源利用率的大小始终为电量状态的大小。每个测试视频序列都编码了60帧,从第二帧进行统计,图2、图3和图4给出了实验结果。
通过对比pro1、add1和add2在三个测试视频序列上的实验结果,可以发现pro1能够更加精确地对计算量进行分配,从而得到更高的视频质量。通过对比pro1、add1和add2在测试视频序列mobile和bus上的实验结果,可以发现pro1对前者视频质量的提高并没有后者的高,但要好于add1和add2。这说明对于那些具有复杂不规则运动属性的视频序列,利用块的初始匹配误差信息和前一帧的失真增益信息将块分为4类来进行计算量的分配并不是那么有效,但针对各类块所采取的提前终止检测和计算量分配调整策略有效地对此进行了弥补。对于具有简单运动属性的视频序列highway来讲,不同的算法差别不大。对比pro1和pro2在三个测试视频序列上的实验结果,可以发现尽管pro2所能利用的计算量少了,但视频质量并没有很明显地减少,某些视频帧的质量甚至没有变化。这从另外一个角度说明了本算法对计算量分配的有效性和QoE计算模型的实用性。
上面所述的实施例仅仅是对本发明的优选实施方式进行描述,并非对本发明的构思和范围进行限定,在不脱离本发明设计构思的前提下,本领域中普通工程技术人员对本发明的技术方案作出的各种变型和改进,均应落入本发明的保护范围,本发明请求保护的技术内容,已经全部记载在权利要求书中。
Claims (1)
1.基于QoE控制的计算量可感知的运动估计算法,包括两个部分:帧级别计算量分配和块级别计算量分配,其特征在于帧级别计算量分配有两个限制,一个是视频质量的平滑性,另一个是计算资源的节省性,视频质量的平滑性限制用来保证不同视频帧之间的补偿质量的变化尽可能要小,计算资源的节省性限制则是用来在搜索候选匹配块时,终止那些不必要的计算量使用,块级别计算量分配算法严格控制计算量不会被超额使用,帧级别计算量分配算法为每一帧分配固定的计算量,把一帧可使用的计算量划分成基本层和增益层两个部分,当进行块级别计算量分配时,把块分成四类,根据块的类别分别进行基本层和增益层计算量的分配;对块进行分类的方法:利用到前一帧的失真增益,当前帧的每个块都有一个预测运动矢量指向前一帧的某个块,而被指向的每个块都对应着一个失真增益,该失真增益是它的初始匹配误差与最终匹配误差之间的差值,如果当前块的预测运动矢量所指向的块覆盖了前一帧中多个块,则该块对应的失真增益是所覆盖块的失真增益的加权和,用Beblock表示当前块所对应的失真增益:
其中,Beb_pre_i表示所覆盖块i的失真增益,i>0,权重因子ωi则对应所覆盖块i的面积占的比例,用Difb_initial表示块的初始匹配误差,则四类块是按如下方式进行定义的:
其中,Classblock表示当前块的所属分类,dths表示一个块的初始匹配误差过小的阈值,dthl表示一个块的初始匹配误差过大的阈值,bth表示一个块的失真增益是大还是小的分隔点;块级别计算量分配算法:块级别计算量分配首先是将一帧可使用的计算量分成基本层和增益层两个部分,基本层计算量所占的比例是α,0<α<1,基本层计算量被分配给所有的四类块,而每块所分得的基本层计算量是根据其初始匹配误差进行分配的,用Cb_base表示一个块所分得的基本层计算量:
其中,Cbase_available表示一帧中基本层可用的计算量,Numb_nopro表示一帧中未被处理的块的数量,AvgDif表示一帧中已经被处理过的块的平均初始匹配误差,增益层计算量也被分配给所有的四类块,而每块所分得的增益层计算量是根据其失真增益进行分配的,用Cb_benefit表示一个块所分得的增益层计算量:
其中,Cbenefit_total表示一帧中增益层总的计算量,Betotal_pre表示一帧中总的失真增益,另外,为了减少所采用的失真增益信息的非有效性所带来的影响,当第1类块和第2类块的某一步搜索得到的最佳运动矢量是预测运动矢量,该块很有可能已经达到了全局最优,为了减少计算量的不必要使用,便停止对该块的搜索,当第2类块和第3类块的最后一步搜索的失真增益比大于β,0<β<1,该步的失真增益比表示失真减少量所占的比例,则增加计算量以进行更多一步的搜索,当第4类块的连续两步搜索的失真增益比都小于γ,0<γ<1,则立即停止对该块的搜索,当一个块的部分匹配误差大于最小匹配误差的时候,便停止对该块匹配误差的计算。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310562939.2A CN103634602B (zh) | 2013-11-09 | 2013-11-09 | 基于QoE控制的计算量可感知的运动估计算法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310562939.2A CN103634602B (zh) | 2013-11-09 | 2013-11-09 | 基于QoE控制的计算量可感知的运动估计算法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN103634602A CN103634602A (zh) | 2014-03-12 |
CN103634602B true CN103634602B (zh) | 2017-03-15 |
Family
ID=50215176
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201310562939.2A Expired - Fee Related CN103634602B (zh) | 2013-11-09 | 2013-11-09 | 基于QoE控制的计算量可感知的运动估计算法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN103634602B (zh) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102148975A (zh) * | 2010-02-04 | 2011-08-10 | 成都市世嘉电子实业有限公司 | 低比特率视频预测帧码率控制算法 |
CN102917227A (zh) * | 2012-10-29 | 2013-02-06 | 山东省计算中心 | 基于压缩感知的自适应视频信息隐藏方法 |
CN103024387A (zh) * | 2012-12-17 | 2013-04-03 | 宁波大学 | 一种基于感知的多视点视频码率控制方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2009012302A1 (en) * | 2007-07-16 | 2009-01-22 | Telchemy, Incorporated | Method and system for viewer quality estimation of packet video streams |
-
2013
- 2013-11-09 CN CN201310562939.2A patent/CN103634602B/zh not_active Expired - Fee Related
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102148975A (zh) * | 2010-02-04 | 2011-08-10 | 成都市世嘉电子实业有限公司 | 低比特率视频预测帧码率控制算法 |
CN102917227A (zh) * | 2012-10-29 | 2013-02-06 | 山东省计算中心 | 基于压缩感知的自适应视频信息隐藏方法 |
CN103024387A (zh) * | 2012-12-17 | 2013-04-03 | 宁波大学 | 一种基于感知的多视点视频码率控制方法 |
Non-Patent Citations (1)
Title |
---|
基于QoE控制的复杂度可分级的运动估计算法;吴飞;《基于QoE控制的复杂度可分级的运动估计算法》;20131008;全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN103634602A (zh) | 2014-03-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111611947B (zh) | 一种车牌检测方法、装置、设备及介质 | |
Dai et al. | A low-latency object detection algorithm for the edge devices of IoV systems | |
TW202141363A (zh) | 用於機器學習模型的執行的自我調整量化 | |
CN111402126B (zh) | 一种基于分块的视频超分辨率方法和系统 | |
CN110782021B (zh) | 一种图像分类方法、装置、设备及计算机可读存储介质 | |
CN107483292B (zh) | 用于云平台的动态监控方法 | |
CN103313047A (zh) | 一种视频编码方法及装置 | |
CN104077412B (zh) | 一种基于多Markov链的微博用户兴趣预测方法 | |
CN115774605A (zh) | Kubernetes的预测式弹性伸缩方法及系统 | |
CN108989122A (zh) | 虚拟网络请求映射方法、装置及实现装置 | |
CN103793873B (zh) | 图像像素中值的获取方法和装置 | |
CN113807330A (zh) | 面向资源受限场景的三维视线估计方法及装置 | |
CN117237867A (zh) | 基于特征融合的自适应场面监视视频目标检测方法和系统 | |
Jiang et al. | Layer-wise deep neural network pruning via iteratively reweighted optimization | |
CN112561050A (zh) | 一种神经网络模型训练方法及装置 | |
Wang et al. | Object-based resolution selection for efficient edge-assisted multi-task video analytics | |
Lin et al. | Learning-based query scheduling and resource allocation for low-latency mobile-edge video analytics | |
CN114969656A (zh) | 一种差分隐私下加权滑动窗口的流式直方图发布方法及系统 | |
WO2023059584A1 (en) | Dynamic self-optimization of application quality-of-service requests to mobile networks | |
Zhang et al. | Computation cost-driven offloading strategy based on reinforcement learning for consumer devices | |
CN103634602B (zh) | 基于QoE控制的计算量可感知的运动估计算法 | |
CN118070926B (zh) | 一种基于客户端资源自适应的多任务联邦学习方法 | |
CN102143364B (zh) | 一种基于遗传搜索和模板匹配的运动估计方法 | |
CN108347744A (zh) | 一种设备接入方法、装置及接入控制设备 | |
CN109089115B (zh) | 在hevc用于对360度视频进行编码的方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20170315 Termination date: 20171109 |
|
CF01 | Termination of patent right due to non-payment of annual fee |