CN102685497B - 一种avs编码器快速帧间模式选择方法及装置 - Google Patents

一种avs编码器快速帧间模式选择方法及装置 Download PDF

Info

Publication number
CN102685497B
CN102685497B CN201210115398.4A CN201210115398A CN102685497B CN 102685497 B CN102685497 B CN 102685497B CN 201210115398 A CN201210115398 A CN 201210115398A CN 102685497 B CN102685497 B CN 102685497B
Authority
CN
China
Prior art keywords
pixel
jnd
gradient value
point
inter mode
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201210115398.4A
Other languages
English (en)
Other versions
CN102685497A (zh
Inventor
贾惠柱
李帅
祝闯
解晓东
高文
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Peking University
Original Assignee
Peking University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Peking University filed Critical Peking University
Priority to CN201210115398.4A priority Critical patent/CN102685497B/zh
Publication of CN102685497A publication Critical patent/CN102685497A/zh
Application granted granted Critical
Publication of CN102685497B publication Critical patent/CN102685497B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

本发明公布了一种AVS编码器快速帧间模式选择方法,包括:采用视觉感知判决模型和像素点边缘信息从16x16模式、16x8模式、8x16模式和8x8模式中预先选择出最优模式;便于硬件实现的快速帧间模式选择算法,突破帧间模式选择数据依赖,使帧间模式选择无需等待相关的重构数据,成为高效无中断模式选择流水线实现的前提;设计面向硬件可实现的高效率计算率失真代价的5级流水算法,使基于率失真代价的帧间模式选择实际硬件应用推广成为可能;最后,根据预选最优模式、direct模式和intra模式这三种候选模式的带价值确定最优模式。本发明还公布一种AVS帧间模式选择装置,显著提高了硬件编码器的编码性能。

Description

一种AVS编码器快速帧间模式选择方法及装置
技术领域
本发明涉及数字视频编解码技术领域,尤其涉及一种AVS编码器快速帧间模式选择方法及装置。
背景技术
视频压缩技术在多媒体及其传输系统中占有重要的地位,随着多媒体技术的不断发展,高效的压缩技术成为大家研究的热点。AVS(Advanced Audio Video Coding Standard)标准是由中国数字音视频编解码技术标准工作组(简称AVS工作组)提出,具有自主知识产权的数字音视频编解码技术标准。AVS与H.264在编码性能上相当,而算法复杂度明显低于H.264,因此成为数字媒体领域里的一支极具竞争力的力量。无论对于AVS还是H.264,率失真优化(RDO)都占有举足轻重的作用。RDO是一个综合考量编码水平的指标,它对编码质量和码流大小给出了一个综合评价。一般来讲,采用RDO判据能够平均带来0.5dB左右的增益,尽管全RDO判据对编码器性能有显著的提高,但是高复杂度阻碍了其应用。通常而言,需要经过运动估计(ME)、离散余弦变换(DCT)、量化、反量化、反变换和熵编码等环路才能得到重构像素和真实的码流大小,因此RDO具有较高的运算复杂度。所以,率失真优化对编码器来说是一个不小的挑战。
对于上述问题,现有技术中一般有两类解决方法。其一是减少候选模式数;其二是简化率失真计算模型,通过近似计算D和R的方法来简化计算复杂度。然而现有的方法往往单纯从算法的角度来看待这个问题,并没有针对硬件的可实现性对算法进行改造,导致上述两类解决方案仅仅停留在理论阶段,没有太大的实际应用价值。
发明内容
本发明解决的技术问题在于如何在能够保证高率失真性能的前提下,显著降低硬件实现复杂度。
为了解决以上问题,本发明公开了一种AVS编码器快速帧间模式选择方法,包括:
步骤一、提取每个像素点的最小可分辨视觉亮度差JND,根据视觉感知判决模型提取出每个像素点的最小可分辨亮度差,此亮度差用于步骤三中计算边缘点的个数;
步骤二、计算每个像素点的梯度值,根据Sobel算子提取出每个像素点的水平和垂直梯度值,此梯度值用于步骤三中计算边缘点的个数,Sobel算子在图像处理中用于提取像素边缘信息值;
步骤三、计算边缘点个数,通过比较步骤一中得到的每个像素点的JND和步骤二中得到的每个像素点的梯度值,可以获取边缘点的个数,边缘点分为三类,分别是:宏块边缘点MLEP,水平边缘点HEP和垂直边缘点VEP;
步骤四、帧间模式选择,根据步骤三计算得到的三类边缘点的个数,可以从16x16、16x8、8x16和8x8这四种宏块划分模式中选取出最佳模式;
步骤五、确定流水线调度策略,基于快速帧间模式选择算法,采用5级流水算法,前级模式决策MD模块优先从16x16,16x8,8x16和8x8这4种模式中计算并预选出最优模式,将最优模式传递给运动估计ME模块,ME模块将计算出的direct模式和最优模式的原始像素值和预测值绝对差之和SAD和运动向量MV传递给后级MD模块,同时,后级MD模块从帧内预测IP模块获取intra模式的预测值,根据计算得到3个候选模式的率失真代价,比较各种模式的率失真代价,选取率失真最小的模式为最终的最优模式。
进一步,作为一种优选,所述提取每个像素点的最小可分辨视觉亮度差JND包括:判决当前编码帧类型,如果当前编码帧为I帧,则跳过不处理;如果当前编码帧为P、B帧,则根据视觉感知判决模型提取出像素点的JND。
进一步,作为一种优选,所述计算每个像素点的梯度值包括:通过Sobel算子分别提取出每个像素点的水平梯度值和垂直梯度值。
进一步,作为一种优选,所述计算边缘点个数包括:根据已求出的每个像素点的JND及其水平梯度值和垂直梯度值,分别统计宏块边缘点个数,水平边缘点HEP个数和垂直边缘点VEP个数,所述的统计宏块边缘个数,具体步骤为:比较计算出的每个像素点的JND和水平梯度值的大小,以及JND和垂直梯度值的大小,如果像素点的水平梯度值大于JND,或者垂直梯度值大于JND,则此像素点为一个宏块边缘点MLEP。所述的统计水平边缘点个数,具体步骤为:比较计算出的每个像素点的JND和水平梯度值的大小以及JND和垂直梯度值的大小,如果像素点的水平梯度值大于JND,并且垂直梯度值小于等于JND,则此像素点为一个水平边缘点HEP,所述的统计垂直边缘点个数,具体步骤为:比较计算出的每个像素点的JND和水平梯度值的大小以及JND和垂直梯度值的大小,如果像素点的垂直梯度值大于JND,并且水平梯度值小于等于JND,则此像素点为一个垂直边缘点VEP。
进一步,作为一种优选,所述帧间模式选择步骤为:首先,判断统计出的MLEP是否小于等于10,如果MLEP小于10,选择16x16模式为最佳帧间模式;其次,判断统计出的MLEP是否大于10并且小于等于128,如果MLEP大于10并且小于等于128,则最佳模式从16x8和8x16这两种模式之间选择;最后,判断统计出的MLEP是否大于128,如果MLEP大于128,则最佳模式为8x8;对于MLEP介于10和128之间的情况,此时需要判断HEP和VEP的大小;如果HEP大于VEP,则最佳模式为16x8;如果VEP大于HEP,则最佳模式为8x16。
进一步,作为一种优选,所述确定流水线调度策略步骤为:基于快速帧间模式选择算法,采用5级流水算法,前级模式决策MD预判模块优先从16x16,16x8,8x16和8x8这4种模式中计算出最优模式,并将最优模式传递给ME模块,ME模块将计算出的direct模式和最优模式的RDO传递给后级MD模块,同时,后级MD模块从帧内预测IP模块获取intra模式的预测值。根据计算得到的3个候选模式的率失真代价,比较各种模式的率失真代价,选取率失真最小的模式为最终的最优模式。
同时本发明还公开了一种AVS编码器快速帧间模式选择装置,所述快速帧间模式选择装置包括前级模式选择预判模块,利用快速算法优先从16x16、16x8、8x16和8x8模式中选出最优模式,减少了PB帧中的宏块级候选模式,降低后级模式选择的复杂度;ME模块,用于计算预选出的最优模式和direct模式的原始像素值和预测值绝对差之和SAD和运动向量MV;帧内预测模块,用于产生帧内模式的预测值,此模块用重构值进行预测;率失真代价计算及后级模式选择模块,用于计算各个模式的率失真代价,并同时进行模式选择;模式选择输出模块,本模块用于输出最优模式的模式信息以及重构值,熵编码信息。
进一步,作为一种优选,所述前级模式选择预判模块结构,包括JND提取运算电路、梯度值提取运算电路、基于比较的边缘点提取电路和最优模式选择电路。
相对于现有技术而言,本发明具有如下优势:(a)、通过算法级优化,将算法改造成易硬件实现的算法,在不显著降低性能的前提下,大幅降低编码器的硬件实现复杂度,很好地把算法和结构融合起来(b)、巧妙安排流水线调度策略,合理划分处理单元,提高电路的并行度,最终实现了一种基于率失真的高性能模式决策装置。(c)、在计算率失真代价的过程中把熵编码的信息存储下来,在输出阶段进行输出,避免编码阶段又进行熵编码处理,提高了硬件的共享,降低了硬件资源。(d)、本发明的装置能够使编码器在极端环境中保持很强的鲁棒性,在低带宽环境中维持较高的编码质量,并同时能满足实时性要求;而在带宽充足的环境中能够保证视频图像的高质量。
附图说明
当结合附图考虑时,通过参照下面的详细描述,能够更完整更好地理解本发明以及容易得知其中许多伴随的优点,但此处所说明的附图用来提供对本发明的进一步理解,构成本发明的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定,其中:
图1是本发明AVS快速帧间模式选择算法流程图;
图2是基于视觉感知韦伯曲线建立的数学模型函数图;
图3是像素点背景亮度提取示意图;
图4是模式选择装置的模块结构示意图;
图5是前级模式选择的模块结构图;
图6A是FME两路并行前向处理结构示意图;
图6B是FME两路并行后向处理结构示意图。
具体实施方式
以下参照图1-6对本发明的实施例进行说明。
为使上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
参照图1,为本发明的快速帧间模式选择算法流程图。具体包含如下步骤:
模式选择初始化步骤S100,在初始化的过程中,给模式选择配置需要的参数,如图1所示,需要配置的参数有:编码帧类型、量化步长;执行流程S101,根据提取到的原始像素值,可以统计出每个宏块中的MLEP、HEP和VEP的大小;根据判决条件S102,确定模式选择的分支,如果MLEP不大于10,则执行流程S103,选择16x16为最佳模式,否则,进入判决条件S104,继续确定模式选择的分支,如果MLEP大于10且不大于128,则进入判决条件S105,继续确定模式选择的分支,否则,执行流程S106,选择8x8为最佳模式;一旦进入判决条件S105,如果HEP大于VEP,则执行流程S107,选择16x8为最佳模式,否则执行流程S108,选择8x16为最佳模式;然后进入基于率失真的代价计算S109,计算最佳模式、Direct模式和帧内模式的率失真代价,最后,基于率失真代价进行模式选择S110,并把相关结果输出。
为了清楚地说明本发明的方法和装置,下面以AVS为例进行说明。在前面所述的模式选择方法中,对于AVS来说,候选模式生成具体为:从16x16模式、16x8模式,8x16模式,8x8模式中基于快速算法选出一种最佳预测模式Candidate,进而从ME获得Direct模式和Candidate的SAD和MV,从IP获得Intra模式的预测值,则候选模式为Intra模式,Direct模式和Candidate。最后选择三种候选模式中率失真最小者为最佳模式。
参照图2,为基于视觉感知韦伯曲线建立的数学模型函数图。其中I是一个像素点的背景亮度值,ΔI是最小可分辨视觉亮度差(JND),ΔI/I是韦伯比。根据图2所建立的数学模型,可以得到如下表达式:
&Delta;I = - 0.016 I 2 + I I &le; 50 ( a ) 0.2 I 50 < I &le; 200 ( b ) 0.016 I 2 - 3 I I > 200 ( c ) - - - ( 1 )
为降低硬件计算复杂度,本发明将方程组(1)中的二次曲线进行线性拟合,得到方程组(2):
&Delta;I = &beta; 1 I + &gamma; 1 I &le; a &beta; 2 I + &gamma; 2 a < I &le; b &alpha;I b < I &le; c &beta; 3 I + &gamma; 3 I > c - - - ( 2 )
方程组(2)中,I是原始像素亮度值,其大小介于0和255之间。a取值31,b取值50,c取值200。其中α取值1/5,β1取值0.5,γ1取值2.5;β2取值-0.3,γ2取值26;β3取值4.25,γ3取值-815。
参照图3,为本发明的像素点背景亮度提取示意图,具体的提取过程说明如下:(a)是一个3x3大小的背景亮度提取矩阵Gsurround,其表示如下:
G surround = 1 1 1 1 0 1 1 1 1 - - - ( 3 )
(b)是一个3x3大小的原始像素矩阵A。通过对着两个矩阵进行卷积操作可提取出像素点(x,y)的背景亮度值,即:
I(x,y)=Gsurround*A/8    (4)
将(4)式带入(2)式即可求出一个像素点的JND。
利用Sobel算子提取像素点水平梯度向量Gx和垂直梯度向量Gy的过程如下:
G x _ grad = - 1 0 1 - 2 0 1 - 1 0 1 * A - - - ( 5 )
G y _ grad = - 1 - 2 - 1 0 0 0 1 2 1 * A - - - ( 6 )
Gx=|Gx_grad|/4    (7)
Gy=|Gy_grad|/4    (8)
其中 - 1 0 1 - 2 0 2 - 1 0 1 - 1 - 2 - 1 0 0 0 1 2 1 分别为Sobel水平梯度算子和垂直梯度算子。
A为3x3大小的原始像素矩阵,运算符*为卷积运算。
参照图4,为本发明的模式决策装置的结构图,该装置包含快速预选MD1模块400、整像素运动估计(IME)模块401、分像素运动估计(FME)模块402、帧内预测模块403、基于率失真代价计算及模式选择模块404、bit流生成(BG)模块405、去块效应模块(DBK)模块406。其中:
快速预选MD1模块400,基于本发明的快速帧间模式选择算法,根据原始像素值直接从16x16模式、16x8模式、8x16模式和8x8模式中选择一个最佳模式;IME模块401与快速预选MD1模块400相连,并同时与FME模块402相连,用于计算当前宏块的最佳模式运动向量(MV)传递给后级FME模块,减少帧间候选模式的数目,降低了模式选择的复杂度;FME模块402的输入连接于FME模块401的输出,同时该模块的输出连接到帧内预测(IP)模块403和率失真代价计算及模式选择模块404,用于计算最优模式和direct模式的SAD;帧内预测模块403,一边连接于FME模块402,另一边连接于率失真代价计算及模式选择模块404,用于对帧内模式进行预测,把预测的像素值输出给率失真代价计算及模式选择模块404;率失真代价计算及模式选择模块404的输入与FME模块402及帧内预测模块403分别相连,输出与BG模块405和DBK模块406相连,用于计算最佳模式、direct模式和intra模式这三种候选模式的率失真代价,同时基于率失真代价进行模式选择,并把最优模式的相关信息传输给BG模块405和DBK模块406;DBK模块406与率失真代价计算及模式选择模块404相连,从404获取最优模式信息以及重构值用于去块效应滤波。BG模块405与率失真代价计算及模式选择模块404相连,从404获取最优模式信息以及熵编码信息用于生成bit流。
参照图5,为模式决策装置子模块模式选择预判模块400的内部结构图,包括JND提取运算电路502、梯度值提取运算电路503、基于比较的边缘点提取电路504和最优模式选择电路505。其中:
JND提取运算电路502连接于与模块501之间的ping-pong缓存,用于计算当前像素值的最小可分辨视觉亮度差JND,把计算的结果存储到后面的ping-pong缓存中;梯度值提取运算电路503连接于与模块501之间的ping-pong缓存,用于对模块501的原始像素值进行水平梯度计算和垂直梯度计算,并把计算得到的结果存储到后面的ping-pong缓存中;边缘点提取电路504,分别连接于与模块502之间的ping-pong缓存和与模块503之间的ping-ping缓存,模块504用于比较从502得到的最小可分辨视觉亮度差(JND)和从503得到的梯度值大小,从而得到边缘点的统计值;模块505连接于与模块504之间的ping-ping缓存,根据模式选择策略进行模式决策,并把结果输出。
参照图6A和图6B,为本发明装置的FME两路并行处理结构前向和后向示意图,在所提出的FME结构中采用三级流水:二分之一差值搜索,四分之一插值搜索,方向决策及色度差值。本发明只用两路并行的结构,一路前向(图6A),一路后向(图6B)。前向模式在前向电路中运算,后向模式在后向电路中运算,双向模式和Direct中前向和后向分别也在对应的方向上运算。这样FME的结构可总结为:有两路并行电路组成,在一个处理周期每一路处理三个宏块(前向或者后向的已预选的最优模式,双向的已预选最有模式和Direct模式),三个宏块在每一路进行三级流水处理。这种高效重用结构与一般的FME算法结构相比,节省了60%面积,并且可减少200cycle的处理时间。
如上所述,对本发明的实施例进行了详细地说明,但是只要实质上没有脱离本发明的发明点及效果可以有很多的变形,这对本领域的技术人员来说是显而易见的。因此,这样的变形例也全部包含在本发明的保护范围之内。

Claims (3)

1.一种AVS编码器快速帧间模式选择方法,其特征在于,包括:步骤一、提取每个像素点的最小可分辨视觉亮度差JND,根据视觉感知判决模型提取出每个像素点的最小可分辨亮度差,此亮度差用于步骤三中计算边缘点的个数;所述提取每个像素点的最小可分辨视觉亮度差JND包括:判决当前编码帧类型,如果当前编码帧为I帧,则跳过不处理;如果当前编码帧为P/B帧,则根据视觉感知判决模型提取出像素点的JND;所述的视觉感知判决模型是指基于视觉感知韦伯曲线建立的一次线性拟合过的分段数学模型函数;根据视觉感知判决模型提取出像素点的JND方法包括:计算当前像素点在3x3邻域的背景亮度值,将所得的背景亮度值代入到上述一次线性拟合过的分段数学模型函数即可得到当前像素点的JND; 
步骤二、计算每个像素点的梯度值,根据Sobel算子提取出每个像素点的水平和垂直梯度值,此梯度值用于步骤三中计算边缘点的个数,Sobel算子在图像处理中用于提取像素边缘信息值; 
步骤三、计算边缘点个数,通过比较步骤一中得到的每个像素点的JND和步骤二中得到的每个像素点的梯度值,可以获取边缘点的个数,边缘点分为三类,分别是:宏块边缘点MLEP、 水平边缘点HEP和垂直边缘点VEP; 
所述计算边缘点个数包括:根据已求出的每个像素点的JND及其水平梯度值和垂直梯度值,分别统计宏块边缘点个数 、水平边缘点HEP个数和垂直边缘点VEP个数; 
所述的统计宏块边缘点个数,具体步骤为:比较计算出的每个像素点的JND和水平梯度值的大小,以及JND和垂直梯度值的大小,如果像素点的水平梯度值大于JND,或者垂直梯度值大于JND,则此像素点为一个宏块边缘点MLEP;所述的统计水平边缘点个数,具体步骤为:比较计算出的每个像素点的JND和水平 梯度值的大小以及JND和垂直梯度值的大小,如果像素点的水平梯度值大于JND,并且垂直梯度值小于等于JND,则此像素点为一个水平边缘点HEP;所述的统计垂直边缘点个数,具体步骤为:比较计算出的每个像素点的JND和水平梯度值的大小以及JND和垂直梯度值的大小,如果像素点的垂直梯度值大于JND,并且水平梯度值小于等于JND, 则此像素点为一个垂直边缘点VEP; 
步骤四、帧间模式选择,根据步骤三计算得到的三类边缘点的个数,可以从16x16、16x8、8x16和8x8这四种宏块划分模式中选取出最优帧间模式; 
所述帧间模式选择步骤为:首先,判断统计出的MLEP是否小于等于10,如果MLEP小于10,选择16x16模式为最优帧间模式;其次,判断统计出的MLEP是否大于10并且小于等于128,如果MLEP大于10并且小于等于128,则最优帧间模式从16x8和8x16这两种模式之间选择;最后,判断统计出的MLEP是否大于128,如果MLEP大于128,则最优帧间模式为8x8; 对于MLEP介于10和128之间的情况,此时需要判断HEP和VEP的大小; 如果HEP大于VEP,则最优帧间模式为16x8;如果VEP大于HEP,则最优帧间模式为8x16; 
步骤五、确定流水线调度策略,基于快速帧间模式选择算法,采用5级流水算法,前级模式决策MD模块优先从16x16、 16x8、 8x16和8x8这4种模式中计算并预选出最优帧间模式,将最优帧间模式传递给运动估计ME模块,ME模块将计算出的direct模式和最优帧间模式的原始像素值和预测值绝对差之和SAD和运动向量MV传递给后级MD模块,同时,后级MD模块从帧内预测IP模块获取intra模式的预测值,根据计算得到最优帧间模式、direct模式以及intra模式这3个候选模式的率失真代价,选取率失真最小的模式为最终的最优模式。 
2.一种AVS编码器快速帧间模式选择装置,其特征在于,所述快速帧间模式选择装置包括前级模式选择预判模块,利用快速算法优先从16x16、16x8、8x16和8x8模式中选出最优帧间模式,减少了P/B帧中的宏块级候选模式,降低后级模式选择的复杂度;ME模块,用于计算预选出的最优帧间模式和direct模式的原始像素值和预测值绝对差之和SAD和运动向量MV;帧内预测模块,用于产生intra模式的预测值,此模块用重构值进行预测;率失真代价计算及后级模式选择模块,用于计算ME模块传递过来的最优帧间模式、direct模式和帧内预测模块传递过来的intra模式这三种模式的率失真代价,并基于计算出来的率失真代价选择最优模式;模式选择输出模块,本模块用于输出基于率失真代价选择的最优模式的模式信息以及重构值,熵编码信息; 
其中,快速算法为: 
步骤一、提取每个像素点的最小可分辨视觉亮度差JND,根据视觉感知判决模型提取出每个像素点的最小可分辨亮度差,此亮度差用于步骤三中计算边缘点的个数;所述提取每个像素点的最小可分辨视觉亮度差JND包括:判决当前编码帧类型,如果当前编码帧为I帧,则跳过不处理;如果当前编码帧为P/B帧,则根据视觉感知判决模型提取出像素点的JND;所述的视觉感知判决模型是指基于视觉感知韦伯曲线建立的一次线性拟合过的分段数学模型函数;根据视觉感知判决模型提取出像素点的JND方法包括:计算当前像素点在3x3邻域的背景亮度值,将所得的背景亮度值代入到上述一次线性拟合过的分段数学模型函数即可得到当前像素点的JND; 
步骤二、计算每个像素点的梯度值,根据Sobel算子提取出每个像素点的水平和垂直梯度值,此梯度值用于步骤三中计算边缘点的个数,Sobel算子在图像处理中用于提取像素边缘信息值; 
步骤三、计算边缘点个数,通过比较步骤一中得到的每个像素点的JND和步骤二中得到的每个像素点的梯度值,可以获取边缘点 的个数,边缘点分为三类,分别是:宏块边缘点MLEP,水平边缘点HEP和垂直边缘点VEP; 
所述计算边缘点个数包括:根据已求出的每个像素点的JND及其水平梯度值和垂直梯度值,分别统计宏块边缘点个数,水平边缘点HEP个数和垂直边缘点VEP个数; 
所述的统计宏块边缘点个数,具体步骤为:比较计算出的每个像素点的JND和水平梯度值的大小,以及JND和垂直梯度值的大小,如果像素点的水平梯度值大于JND,或者垂直梯度值大于JND,则此像素点为一个宏块边缘点MLEP;所述的统计水平边缘点个数,具体步骤为:比较计算出的每个像素点的JND和水平梯度值的大小以及JND和垂直梯度值的大小,如果像素点的水平梯度值大于JND,并且垂直梯度值小于等于JND,则此像素点为一个水平边缘点HEP;所述的统计垂直边缘点个数,具体步骤为:比较计算出的每个像素点的JND和水平梯度值的大小以及JND和垂直梯度值的大小,如果像素点的垂直梯度值大于JND,并且水平梯度值小于等于JND,则此像素点为一个垂直边缘点VEP; 
步骤四、帧间模式选择,根据步骤三计算得到的三类边缘点的个数,可以从16x16、16x8、8x16和8x8这四种宏块划分模式中选取出最优帧间模式; 
所述帧间模式选择步骤为:首先,判断统计出的MLEP是否小于等于10,如果MLEP小于10,选择16x16模式为最优帧间模式;其次,判断统计出的MLEP是否大于10并且小于等于128,如果MLEP大于10并且小于等于128,则最优帧间模式从16x8和8x16这两种模式之间选择;最后,判断统计出的MLEP是否大于128,如果MLEP大于128,则最优帧间模式为8x8; 对于MLEP介于10和128之间的情况,此时需要判断HEP和VEP的大小; 如果HEP大于VEP,则最优帧间模式为16x8;如果VEP大于HEP, 则最优帧间模式为8x16。 
3.根据权利要求2所述的一种AVS编码器快速帧间模式选择装置,其特征在于,所述前级模式选择预判模块结构,包括JND提取运算电路、梯度值提取运算电路、基于比较的边缘点提取电路和最优模式选择电路;所述的JND提取运算电路以原始像素作为输入,根据视觉感知判决模型提取出每个像素点的最小可分辨亮度差,所提取的亮度差用于后续计算边缘点的个数;所述的梯度值提取运算电路也以原始像素作为输入,根据Sobel算子提取出每个原始像素点的水平和垂直梯度值,所提取的梯度值也用于后续计算边缘点的个数;JND提取运算电路和梯度值提取运算电路的输出缓冲区连接到边缘点提取电路,所述的边缘点提取电路根据传递过来的每个像素点的JND及其水平梯度值和垂直梯度值,分别统计宏块边缘点个数,水平边缘点HEP个数和垂直边缘点VEP个数,并将这三类边缘点的个数输出给最优模式选择电路;最优模式选择电路则根据边缘点提取电路传递过来的三类边缘点的个数决定最优帧间模式。 
CN201210115398.4A 2012-05-29 2012-05-29 一种avs编码器快速帧间模式选择方法及装置 Active CN102685497B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201210115398.4A CN102685497B (zh) 2012-05-29 2012-05-29 一种avs编码器快速帧间模式选择方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210115398.4A CN102685497B (zh) 2012-05-29 2012-05-29 一种avs编码器快速帧间模式选择方法及装置

Publications (2)

Publication Number Publication Date
CN102685497A CN102685497A (zh) 2012-09-19
CN102685497B true CN102685497B (zh) 2014-07-02

Family

ID=46816781

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210115398.4A Active CN102685497B (zh) 2012-05-29 2012-05-29 一种avs编码器快速帧间模式选择方法及装置

Country Status (1)

Country Link
CN (1) CN102685497B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103686183B (zh) * 2013-12-27 2017-01-11 南京讯思雅信息科技有限公司 一种功耗可控的帧内视频编码方法
CN111200735B (zh) * 2018-11-19 2023-03-17 华为技术有限公司 一种帧间预测的方法及装置
CN111885378B (zh) * 2020-07-27 2021-04-30 腾讯科技(深圳)有限公司 多媒体数据编码方法、装置、设备以及介质
CN112911309B (zh) * 2021-01-22 2023-11-17 北京博雅慧视智能技术研究院有限公司 avs2编码器运动矢量处理系统、方法、装置、设备及介质
CN112969066B (zh) * 2021-01-29 2023-09-01 北京博雅慧视智能技术研究院有限公司 预测单元的选择方法、装置、电子设备及介质

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101710995A (zh) * 2009-12-10 2010-05-19 武汉大学 基于视觉特性的视频编码系统

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100086063A1 (en) * 2008-10-02 2010-04-08 Apple Inc. Quality metrics for coded video using just noticeable difference models

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101710995A (zh) * 2009-12-10 2010-05-19 武汉大学 基于视觉特性的视频编码系统

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
Motion-Compensated Residue Preprocessing in Video Coding Based on Just-Noticeale-Distortion Profile;Xiaokang Yang等;《IEEE Transaction on Circuits and Systems for Video Technology》;20050630;第742-752页 *
Xiaokang Yang等.Motion-Compensated Residue Preprocessing in Video Coding Based on Just-Noticeale-Distortion Profile.《IEEE Transaction on Circuits and Systems for Video Technology》.2005,第742-752页.
刘静,王永芳,武翠芳,张兆洋.改进的JND模型及其在图像编码中的应用.《电视技术》.2011,第15-18页. *

Also Published As

Publication number Publication date
CN102685497A (zh) 2012-09-19

Similar Documents

Publication Publication Date Title
CN103873861B (zh) 一种用于hevc的编码模式选择方法
CN101529916B (zh) 利用帧内编码选择的视频编码
CN103297781B (zh) 一种基于纹理方向的hevc帧内编码方法、装置和系统
CN102687511B (zh) 运动信息的自适应编解码的方法和装置
CN103546749B (zh) 利用残差系数分布特征和贝叶斯定理优化hevc残差编码的方法
CN102685497B (zh) 一种avs编码器快速帧间模式选择方法及装置
CN101267556B (zh) 快速运动估计方法及视频编解码方法
CN101729892B (zh) 一种非对称立体视频编码方法
CN108989802B (zh) 一种利用帧间关系的hevc视频流的质量估计方法及系统
WO2010078759A1 (zh) 基于码率控制的图像时间域和空间域分辨率处理方法
CN103118262B (zh) 率失真优化方法及装置、视频编码方法及系统
CN101710993A (zh) 基于块的自适应超分辨率视频处理方法及系统
CN102647593B (zh) 一种avs帧内模式决策方法和装置
CN103327327B (zh) 用于高性能视频编码hevc的帧间预测编码单元选择方法
CN101621696A (zh) 允许分数视频运动估计和双向视频运动估计的选择性使用
CN105704498A (zh) 逆离散余弦变换的方法及装置、视频编/解码方法及框架
CN105791865A (zh) 帧内预测及去块滤波方法
CN110351552B (zh) 视频编码中一种快速编码方法
CN102595137B (zh) 基于图像像素块行/列流水线的快速模式判决装置和方法
CN109151467A (zh) 基于图像块活动性的屏幕内容编码帧间模式快速选择方法
CN101841722A (zh) 滤波边界强度的检测装置及其检测方法
CN101895766B (zh) 一种mpeg-2/h.264标准下视频流插入台标字幕的压缩域局部处理算法
CN106878754A (zh) 一种3d视频深度图像帧内预测模式选择方法
CN1263309C (zh) 用于视频编码的运动矢量预测方法
CN102143362B (zh) 从mpeg2或h.263格式到h.264格式的视频转换编码的处理方法及装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
EE01 Entry into force of recordation of patent licensing contract
EE01 Entry into force of recordation of patent licensing contract

Application publication date: 20120919

Assignee: Boya cloud (Beijing) Technology Co., Ltd.

Assignor: Peking University

Contract record no.: 2017990000366

Denomination of invention: Rapid interframe mode selection method and device for AVS (Advanced Audio Video Coding Standard) coder

Granted publication date: 20140702

License type: Exclusive License

Record date: 20170908