CN104811728B - 一种视频内容自适应的运动搜索方法 - Google Patents
一种视频内容自适应的运动搜索方法 Download PDFInfo
- Publication number
- CN104811728B CN104811728B CN201510196486.5A CN201510196486A CN104811728B CN 104811728 B CN104811728 B CN 104811728B CN 201510196486 A CN201510196486 A CN 201510196486A CN 104811728 B CN104811728 B CN 104811728B
- Authority
- CN
- China
- Prior art keywords
- point
- current
- motion
- searching
- search
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Landscapes
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
本发明公开了视频内容自适应的运动搜索方法,包括:计算当前图像内所有像素点的梯度的平均值,并根据平均值设定两个阈值;根据阈值确定当前CU的区域类型;为当前PU建立候选预测MV列表,选择率失真代价最小的MV作为预测MV,并用预测MV所指向的位置作为搜索起点;在给定的搜索范围内进行搜索,选出率失真代价最小的点作为整数像素运动搜索下的最佳匹配点;根据CU类型确定最终结果。本发明的运动搜索自适应选择算法不改变码流结构,生成的码流可兼容任意标准解码,应用方便。
Description
技术领域
本发明涉及一种视频内容自适应的运动搜索方法。
背景技术
视频编码标准H.264以其高效的压缩效率、良好的网络亲和性以及优越的稳健性等优点得到了广泛的应用。然而,随着终端处理能力以及人们对多媒体体验要求的不断提高,高清、超高清、无线移动已经成为目前视频应用的主流趋势。而H.264编码标准的压缩效率不能满足高清、超高清视频应用,需要更高效的编码压缩方案。因此,由ISO/IEC MovingPicture Experts Group(MPEG)和ITU-T Video Coding Experts Group(VCEG)联合成立的Joint Collaborative Team on Video Coding(JCT-VC)制定了高效率的下一代视频编码标准HEVC(High Efficiency Video Coding),HEVC不仅提升了图像质量,同时也能达到H.264/MPEG-4AVC压缩效率的两倍,等同于同样画面质量下比特率减少了50%,可支持4K甚至到8k视频。
HEVC依然沿用以往视频编码标准所采用的预测、变换、量化、熵编码的混合编码框架。
为了提高视频的编码效率,HEVC采用了更加灵活的大尺寸四叉树编码结构来提高压缩效率,如图1所示,其定义了3种不同的结构单元,包括编码单元CU(Coding Unit)、预测单元PU(Prediction Unit)、变换单元TU(Transform Unit)来描述整个编码过程。其中最大的CU称为CTB,每个CU可以继续分为4个更小的CU。PU、TU都是基于CU进行划分的,其中TU可以跨越不同PU。采用较大的CU可以更好地压缩平坦区域,而采用较小的CU可以更好压缩细节较多的区域。
HEVC中引进运动估计融合和高精度运动补偿等技术来提高帧间运动估计的准确性。运动估计的目的是为了在参考帧图像中寻找当前预测单元的最佳匹配块,即在指定的搜索范围内寻找最匹配的运动矢量。HEVC中除了整像素搜索外,还有采用插值方法的亚像素运动搜索,这是由于自然界物体运动具有连续性,因此相邻两帧图像之间物体的运动不一定是以整像素为基本单位的,而有可能是半个像素、四分之一个像素甚至是八分之一个像素为单位的,如图2所示HEVC中运动搜索流程图。若仅使用整像素运动估计会出现匹配不准确的问题,导致运动补偿残差幅度过大,影响编码效率。此时,应将运动估计的精度提升到亚像素级别,这可以通过对参考图像的像素进行插值来实现。
在运动补偿和亚像素搜索中,插值滤波器起着关键的作用。目前,HEVC编码标准中,为像素每个位置的插值都设计了单独的插值滤波器,直接对所需位置的像素进行插值,而非像H.264/AVC中先进行维纳滤波,而后再做双向滤波。由于只需进行一次滤波计算,插值过程简单高效。HEVC在进行图像的亮度插值滤波时,其DCT的插值滤波器采用8个抽头的滤波器,如表1所示。
表1亮度1/4和色度1/8插值滤波系数
亮度插值分为两个步骤:
1.位于整像素之间的亚像素的插值,如图3中点a0,0,b0,0,c0,0,d0,0,h0,0和n0,0′。插值过程中,相邻8个像素选用空间位置相邻的8个整数像素,不同位置的点采用表1中不同的插值滤波参数做插值。计算方式如下:
a0,0=-A-3,0+4×A-2,0-10×A-1,0+58×A0,0+17×A1,0-5×A2,0+A3,0
其余位置像素可用相应的滤波器计算得出。
2.位于亚像素之间的亚像素点的插值,如图3中点e0,0,i0,0,p0,0,f0,0,j0,0,q0,0,g0,0,k0,0和r0,0′。插值过程中,相邻8个像素选用整像素插值得出和8个空间相邻的亚像素点,不同位置的点采用表1中不同的插值滤波参数做插值。计算方式如下:
r0,0=(c0,-2-5×c0,-1+17×c0,0+58×c0,1-10×c0,2+4×c0,3-c0,4)>>6
其余位置像素可用相应的滤波器计算得出。
实际的编码时,运动搜索过程分为运动矢量预测、整像素运动搜索以及亚像素运动搜索三部分。运动矢量预测耗时很少,整像素运动搜索如果采用快速算法,如钻石搜索,耗时也不大,但是,亚像素搜索由于对每个点的搜索都要做插值,复杂度比较高。经过测试,发现获取最佳预测块的模块中,亚像素搜索耗时50%以上,所以只有减少亚像素搜索的复杂度才能大幅度地提升运动搜索模块的计算速度。
发明内容
本发明所要解决的技术问题是,针对现有技术不足,提供一种视频内容自适应的运动搜索方法。
为解决上述技术问题,本发明所采用的技术方案是:一种视频内容自适应的运动搜索方法,包括以下步骤:
1)计算当前图像内所有像素点的梯度的平均值,并根据所述平均值设定两个阈值;
2)根据上述阈值确定当前CU的区域类型;
3)利用空域、时域上运动向量的相关性,为当前PU建立候选预测MV列表,从所述MV列表中选择率失真代价最小的MV作为预测MV,并用所述预测MV所指向的位置作为搜索起点;
4)根据HEVC选定的运动搜索方法,在编码预设的搜索范围内进行搜索,选出率失真代价最小的点作为整数像素运动搜索下的最佳匹配点;
5)如果当前CU为平坦区域,则将步骤4)得到的最佳匹配点作为最终结果;如果当前CU为纹理区域,以步骤4)得到的最佳匹配点作为1/2像素运动搜索的起始点,在编码预设的搜索范围内进行搜索,选择率失真代价最小的点作为1/2像素运动搜索的最佳搜索点,并且将该最佳搜索点作为最终结果;如果当前CU为边缘区域,以步骤4)得到的最佳匹配点作为1/4像素运动搜索的起始点,在一定的范围内进行搜索,选择率失真代价最小的点作为1/4像素运动搜索的最佳搜索点,并且将该点作为最终结果;
6)结束。
两个阈值的设定过程如下:
1)将当前帧图像中位置为(x,y)的像素点的梯度标记为Gx,y,Gx,y计算公式如下:
|Gx,y|=|Gx|+|Gy|;
其中,Gx,Gy′分别代表水平、垂直方向边缘检测得到的梯度值:
其中,A表示原始图像,为卷积符号;
2)计算当前图像内所有像素点的梯度的平均值Ga:
其中,w、h分别为当前图像的宽和高;
3)根据Ga设定两个阈值T1、T2,计算公式如下:
T1=α×Ga
T2=β×Ga
其中,α、β分别取值为0.1、0.05。
确定当前CU的区域类型方法步骤如下:
1)计算当前CU单元内所有像素点的梯度值的平均值,记为Gcu,Gcu计算公式如下:
其中,”N”表示当前CU大小为N×N,Gi,j为当前CU中位置为(i,j)像素点的梯度;
2)判断是否满足条件Gcu<T2,若满足,当前CU被划分为平坦区域;否则,判断是否满足条件Gcu<T1,若满足,当前CU被划分为纹理区域;否则,当前CU被划分为边缘区域。
与现有技术相比,本发明所具有的有益效果为:本发明在帧间预测过程中的运动搜索时充分利用了图像编码块自身的纹理特性,通过对编码单元分类,对纹理细节不同的单元,自适应地选择不同的亚像素搜索算法。该算法有效地降低运动搜索的计算复杂度,提高了编码速度,同时又保证了编码效率损失在可接受的范围内;本发明的运动搜索自适应选择算法可以通过调节参数、判断条件,控制算法复杂度和编码效率损失,适应不同计算复杂度的应用需求;本发明的运动搜索自适应选择算法不改变码流结构,生成的码流可兼容任意标准解码,因此不需要对解码视频的播放客户端做修改,应用方便。
附图说明
图1(a)为HEVC编码单元四叉树结构示意图;图1(b)为变换单元四叉树结构;
图2为HEVC中运动搜索流程图;
图3为亮度插值示意图;
图4为本发明控制框图;
图5为本发明方法流程图。
具体实施方式
本发明的控制框图如图4所示,在HEVC视频编解码器的帧间预测的运动搜索阶段加入一个控制模块,该模块按照一定的方法对当前的编码单元CU进行分类,并自适应地选择每个PU亚像素运动搜索算法,并记录最优搜索点和相应的编码后数据,再经码流组织模块写入码流数据并输出。
本发明的方法流程图如图5所示,在HEVC视频编解码标准的运动搜索过程中,加入一个加入运动搜索控制算法。以下将详细描述本文提出的HEVC亚像素搜索自适应选择算法的实现流程。
(1)计算当前图像的梯度,按照以下步骤进行:
a.可选用Sobel边缘检测方法,当前帧图像中位置为(x,y)的像素点的梯度标记为Gxy,其计算公式如下:
|Gx,y|=|Gx|+|Gy|
其中,Gx、Gy分别代表水平、垂直方向边缘检测得到的梯度值,其公式如下:
其中,”A”表示原始图像,为卷积符号。
b.计算当前图像内所有像素点的梯度的平均值Ga,其计算公式如下:
其中,w、h分别为当前图像的宽、高。
c.根据得到的图像梯度均值Ga设定两个阈值T1、T2,计算公式如下:
T1=α×Ga
T2=β×Ga
其中,α、β是由大量统计实验得到的常量值,T1>T2。
(2)确定当前CU的区域类型,按照以下步骤进行:
a.计算当前CU单元内所有像素点的梯度值的平均值,记为Gcu,其计算公式如下:
其中,“N”表示当前CU大小为N×N,Gi,j为当前CU中位置为(i,j)像素点的梯度。
b.判断是否满足条件Gcu<T2,若满足,当前CU被划分为平坦区域;否则,判断是否满足条件Gcu<T2,若满足,当前CU被划分为纹理区域;否则,当前CU被划分为边缘区域;
(3)利用空域、时域上运动向量的相关性,为当前PU建立候选预测MV列表,编码器从中选择率失真代价最小的作为预测MV,并用其所指向的位置作为起始搜索点;
(4)以步骤(3)中预测到的点为搜索起点,根据HEVC选定的运动搜索算法,在给定的搜索范围内进行搜索,选出率失真代价最小的点作为整数像素运动搜索下的最佳匹配点;
(5)如果当前CU为平坦区域,则将步骤(4)得到的最佳搜索点作为最终结果,跳至步骤(8);否则,继续执行步骤(6);
(6)如果当前CU为纹理区域,以步骤(4)中得到的最佳匹配点作为1/2像素运动搜索的起始点,在一定的范围内进行搜索,选择率失真代价最小的点作为1/2像素运动搜索的最佳搜索点,并且将该点作为最终结果,跳至步骤(8);
(7)如果当前CU为边缘区域,以步骤(4)中得到的最佳匹配点作为1/4像素运动搜索的起始点,在一定的范围内进行搜索,选择率失真代价最小的点作为1/4像素运动搜索的最佳搜索点,并且将该点作为最终结果,跳至步骤(8);
(8)结束。
在HEVC参考软件HM上测试结果表明,对HEVC标准测试序列采用本发明的运动搜索方法自适应选择算法可使编码时间平均减少30%左右,编码效率损失控制在1%以内。
Claims (3)
1.一种视频内容自适应的运动搜索方法,其特征在于,包括以下步骤:
1)计算当前图像内所有像素点的梯度的平均值,并根据所述平均值设定两个阈值;
2)根据上述阈值确定当前CU的区域类型;
3)利用空域、时域上运动向量的相关性,为当前PU建立候选预测MV列表,从所述MV列表中选择率失真代价最小的MV作为预测MV,并用所述预测MV所指向的位置作为搜索起点;
4)根据HEVC选定的运动搜索方法,在编码预设的搜索范围内进行搜索,选出率失真代价最小的点作为整数像素运动搜索下的最佳匹配点;
5)如果当前CU为平坦区域,则将步骤4)得到的最佳匹配点作为最终结果;如果当前CU为纹理区域,以步骤4)得到的最佳匹配点作为1/2像素运动搜索的起始点,在编码预设的搜索范围进行搜索,选择率失真代价最小的点作为1/2像素运动搜索的最佳搜索点,并且将该最佳搜索点作为最终结果;如果当前CU为边缘区域,以步骤4)得到的最佳匹配点作为1/4像素运动搜索的起始点,在一定的范围内进行搜索,选择率失真代价最小的点作为1/4像素运动搜索的最佳搜索点,并且将该点作为最终结果;
6)结束。
2.根据权利要求1所述的视频内容自适应的运动搜索方法,其特征在于,两个阈值的设定过程如下:
1)将当前帧图像中位置为(x,y)的像素点的梯度标记为Gx,y,Gx,y计算公式如下:
|Gx,y|=|Gx|+|Gy|
其中,Gx、Gy分别代表水平、垂直方向边缘检测得到的梯度值:
其中,A表示原始图像,为卷积符号;
2)计算当前图像内所有像素点的梯度的平均值Ga:
其中,w、h分别为当前图像的宽和高;
3)根据Ga设定两个阈值T1、T2,计算公式如下:
T1=α×Ga
T2=β×Ga
其中,α、β取值分别为0.1、0.05。
3.根据权利要求2所述的视频内容自适应的运动搜索方法,其特征在于,确定当前CU的区域类型方法步骤如下:
1)计算当前CU单元内所有像素点的梯度值的平均值,记为Gcu,Gcu计算公式如下:
其中,”N”表示当前CU大小为N×N,Gi,j为当前CU中位置为(i,j)像素点的梯度;
2)判断是否满足条件Gcu<T2,若满足,当前CU被划分为平坦区域;否则,判断是否满足条件Gcu<T1,若满足,当前CU被划分为纹理区域;否则,当前CU被划分为边缘区域。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510196486.5A CN104811728B (zh) | 2015-04-23 | 2015-04-23 | 一种视频内容自适应的运动搜索方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510196486.5A CN104811728B (zh) | 2015-04-23 | 2015-04-23 | 一种视频内容自适应的运动搜索方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN104811728A CN104811728A (zh) | 2015-07-29 |
CN104811728B true CN104811728B (zh) | 2018-03-02 |
Family
ID=53696154
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201510196486.5A Active CN104811728B (zh) | 2015-04-23 | 2015-04-23 | 一种视频内容自适应的运动搜索方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN104811728B (zh) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105611299B (zh) * | 2015-12-25 | 2018-11-23 | 北京工业大学 | 一种基于hevc的运动估计方法 |
CN105847838B (zh) * | 2016-05-13 | 2018-09-14 | 南京信息工程大学 | 一种hevc帧内预测方法 |
CN107592547B (zh) * | 2017-08-31 | 2019-05-31 | 浙江工业大学 | 一种基于hevc压缩域的运动感知图提取方法 |
CN109587501B (zh) * | 2017-09-28 | 2022-07-12 | 腾讯科技(深圳)有限公司 | 进行运动估计的方法、装置及存储介质 |
CN109660799A (zh) * | 2017-10-12 | 2019-04-19 | 北京金山云网络技术有限公司 | 视频编码中的运动估计方法、装置、电子设备及存储介质 |
CN113496504B (zh) * | 2020-03-20 | 2022-11-29 | 展讯通信(上海)有限公司 | 图像对齐方法及装置、存储介质、终端 |
CN113555117B (zh) * | 2021-07-19 | 2022-04-01 | 江苏金海星导航科技有限公司 | 一种基于穿戴设备的驾驶员健康管理系统 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101795409A (zh) * | 2010-03-03 | 2010-08-04 | 北京航空航天大学 | 内容自适应分数像素运动估计方法 |
CN102387360A (zh) * | 2010-09-02 | 2012-03-21 | 乐金电子(中国)研究开发中心有限公司 | 视频编解码帧间图像预测方法及视频编解码器 |
CN103313058A (zh) * | 2013-06-08 | 2013-09-18 | 中国计量学院 | 针对芯片实现的hevc视频编码多模块优化方法和系统 |
CN103384332A (zh) * | 2013-06-29 | 2013-11-06 | 张新安 | 一种avs视频编码hfps算法的改进算法 |
-
2015
- 2015-04-23 CN CN201510196486.5A patent/CN104811728B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101795409A (zh) * | 2010-03-03 | 2010-08-04 | 北京航空航天大学 | 内容自适应分数像素运动估计方法 |
CN102387360A (zh) * | 2010-09-02 | 2012-03-21 | 乐金电子(中国)研究开发中心有限公司 | 视频编解码帧间图像预测方法及视频编解码器 |
CN103313058A (zh) * | 2013-06-08 | 2013-09-18 | 中国计量学院 | 针对芯片实现的hevc视频编码多模块优化方法和系统 |
CN103384332A (zh) * | 2013-06-29 | 2013-11-06 | 张新安 | 一种avs视频编码hfps算法的改进算法 |
Also Published As
Publication number | Publication date |
---|---|
CN104811728A (zh) | 2015-07-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN104811728B (zh) | 一种视频内容自适应的运动搜索方法 | |
JP6605063B2 (ja) | 動画像復号装置、動画像復号方法、動画像符号化装置、および、動画像符号化方法 | |
US9641860B2 (en) | Method of decoding video data | |
US7764738B2 (en) | Adaptive motion estimation and mode decision apparatus and method for H.264 video codec | |
KR101037816B1 (ko) | 인터레이스된 비디오의 코딩 및 디코딩을 위한 방법 및장치 | |
JP5840286B2 (ja) | 画像復号装置および画像復号方法 | |
US20030156646A1 (en) | Multi-resolution motion estimation and compensation | |
US11290709B2 (en) | Image data encoding and decoding | |
TW202034694A (zh) | 用於視訊寫碼中之區塊內複製模式之運動向量預測器清單產生 | |
US8379985B2 (en) | Dominant gradient method for finding focused objects | |
TW202114426A (zh) | 視訊編碼中的bdof和dmvr的協調提前終止 | |
WO2011125314A1 (ja) | 動画像符号化装置および動画像復号装置 | |
CN109151467B (zh) | 基于图像块活动性的屏幕内容编码帧间模式快速选择方法 | |
JP2011223319A (ja) | 動画像符号化装置および動画像復号装置 | |
US20220201315A1 (en) | Multi-pass decoder-side motion vector refinement | |
KR101038822B1 (ko) | 인터레이스형 비디오의 코딩 및 디코딩 | |
US20130170565A1 (en) | Motion Estimation Complexity Reduction | |
KR20200061309A (ko) | 영상 성분 간 예측 방법과 그를 이용한 영상 부호화 및 복호화 방법 및 장치 | |
Lee et al. | Depth-based adaptive search range algorithm for motion estimation in HEVC | |
Hsia et al. | Fast intra prediction mode decision algorithm for H. 264/AVC video coding standard | |
US20230011286A1 (en) | Spatial neighbor based affine motion derivation | |
US20240121399A1 (en) | Decoder-side control point motion vector refinement for affine inter-prediction in video coding | |
EP4381736A1 (en) | Mode dependent intra smoothing | |
WO2023287966A1 (en) | Position dependent reference sample smoothing | |
CN118200576A (zh) | 视频编码方法、视频解码方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
EXSB | Decision made by sipo to initiate substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
TR01 | Transfer of patent right | ||
TR01 | Transfer of patent right |
Effective date of registration: 20180522 Address after: 412000 407 D, R & D center of China Power Valley, No. 899, Xianyue Ring Road, Tianyuan District, Zhuzhou, Hunan. Patentee after: HUNAN YUANJIAN VISUAL TECHNOLOGY CO., LTD. Address before: 410000 Hunan Changsha high tech Zone, No. 409, lujiaxhu West Road, 4 yuan 808 Patentee before: Hunan great Mu Information technology Co., Ltd |