CN104219531A - 基于线状帧内块拷贝的hevc屏幕内容编码 - Google Patents

基于线状帧内块拷贝的hevc屏幕内容编码 Download PDF

Info

Publication number
CN104219531A
CN104219531A CN201410510123.XA CN201410510123A CN104219531A CN 104219531 A CN104219531 A CN 104219531A CN 201410510123 A CN201410510123 A CN 201410510123A CN 104219531 A CN104219531 A CN 104219531A
Authority
CN
China
Prior art keywords
vector
vertical bar
horizontal line
current
optimum
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201410510123.XA
Other languages
English (en)
Other versions
CN104219531B (zh
Inventor
张萌萌
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Changzhou Hengtang Technology Industry Co ltd
Original Assignee
North China University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by North China University of Technology filed Critical North China University of Technology
Priority to CN201410510123.XA priority Critical patent/CN104219531B/zh
Publication of CN104219531A publication Critical patent/CN104219531A/zh
Application granted granted Critical
Publication of CN104219531B publication Critical patent/CN104219531B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Abstract

本发明提出了两种编码方案。第一种是针对CU分别进行水平和垂直分割,并针对水平线条和垂直线条分别进行搜索以找到最优替换矢量。同时,针对水平线条左侧的预测区域和垂直线条上方的预测区域以类似的方式查找最优预测线条,得到预测替换矢量。如果二者相同,则设置标志并无需传送替换矢量,如果不同则传送最优替换矢量。第二种是针对水平线条和垂直线条进行翻转,再进行最优替换矢量搜索,此时不进行预测替换矢量的搜索。这两种编码方案可同时使用,或分开使用。

Description

基于线状帧内块拷贝的HEVC屏幕内容编码
联合研究
本申请由北方工业大学与北京交通大学信息所联合研究,并得到以下基金资助:国家自然科学基金(No.60903066,No.60972085),北京市自然科学基金(No.4102049),教育部新教师基金(No.20090009120006),北京市属高等学校人才强教深化计划(PHR201008187)。
技术领域
本发明涉及图像处理领域,更具体而言,涉及在高效视频编码(HEVC)中用于处理屏幕内容的基于线状帧内块拷贝的HEVC屏幕内容编码。
背景技术
高效率视频编码(High Efficient Video Coding,HEVC)标准由联合视频编码组(Joint Collaborative on Video Coding,JCT-VC)推出,是最新的视频编码标准[1]。跟已有的视频编码标准相比,HEVC能极大提高编码效果,尤其是对高分辨率的视频。2013年1月份HEVC视频编码标准尘埃落定,关于HEVC研究工作转到扩大HEVC应用范围的领域中,其中就包括屏幕内容编码。
屏幕内容编码广泛应用在很多应用领域,比如远程桌面、视频会议、远程教育等。屏幕内容视频与自然序列不同,它们由计算机手机等电子设备生成。它们往往包含文字和图表等内容,这些内容含有大量的尖锐的边缘不容易被普通的视频压缩技术处理[2][3]。目前有许多研究工作从变换量化或者预测等方面提出了很多新技术来提高屏幕内容编码质量[4]-[8]。
屏幕内容有一个特点是在一幅图中它经常包含一些重复出现的内容,比如文字、图标、线条等。为了处理这些重复的内容,HEVC范围扩展标准引入了帧内块拷贝(intra block copy,IntraBC)技术[5]。像IntraBC从已经编码过的区域里找当前编码单元(coding unit,CU)的最优预测(如图1所示)。预测最好的替换矢量(displacement vectors,DV)将被编码传输到解码端。
为了更好的改进IntraBC的编码效果,JCT-VC的15次会议上提出了一种线状(line-based)IntraBC[8]。它的主要想法是在比2Nx2N更小的分块上实行IntraBC。每一个2Nx2N的块均匀的分成2NxM或者Mx2N(N<=32,M>=1)大小被称为线条(line)。每一个线条可以找到自己最优预测并传输各种不同的DV。
然而,线状IntraBC每条line的DV都需要编码从而引入了很大的开销。另外屏幕内容在重构区域的相关性还可以进一步消除。
本发明将采用一种改进的线状IntraBC方案来进一步提升HEVC屏幕内容编码的效果。方案采用当前line临近重构区域的像素来进行DV预测。另外,由于文字存在许多对称内容,本方案还采用一种翻转拷贝的预测方式来增加预测精度。
在本发明的说明书中,引用了如下文献,在此将其并入本发明作为本发明的公开内容的一部分。
[1]G.J.Sullivan,J.R.Ohm,W.J.Han and T.Wiegand,“Overview of the High EfficiencyVideo Coding(HEVC)Standard,”IEEE Transactions on Circuits and Systems for VideoTechnology,Vol.22,No.12,pp.1649-1668,Dec.2012.
[2]K.Lengwehasatit,and A.Ortega,“Scalable variable complexity approximate forwardDCT,”IEEE Transactions on Circuits and Systems for Video Technolog,Vol.14,No.11,pp.1236-1248,Nov.2004.
[3]H.H.Bai,C.Zhu and Y.Zhao,“Optimized Multiple Description Lattice VectorQuantization for Wavelet Image Coding”IEEE Transactions on Circuits and Systems forVideo Technolog,Vol.17,No.7,pp.912-917,July.2007.
[4]M.Mark,and J.Z.Xu,“Improving screen content coding in HEVC by transformskipping,”the 20th European Signal Processing Conference(EUSIPCO),Bucharest,pp.1209-1213,Aug.2012.
[5]H.Meuel,J.Schmidt,M.Munderloh and J.Ostermann,“Analysis of coding toolsand improvement of text readability for screen content,”2012Picture Coding Symposium(PCS),Krakow,pp.469-472,May 2013.
[6]H.Zhang,O.C.Au,Y.F.Shi,X.Y.Zhang K.T.Tang and Y.F.Guo,“HEVC-basedadaptive quantization for screen content by detecting low contrast edge regions,”2013IEEEInternational Symposium on Circuits and Systems(ISCAS),,Beijing,pp.49-52,May 2012.
[7]C.Pang,J.Sole,L.Guo,M.Karczewicz,R.Joshi,“Non-RCE3:Intra motioncompensation with 2-D MVs,”JCTVC-N0256,Vienna,Aug.2013.
[8]C.C.Chen,T.S.Chang,R.L.Liao,W.H.Peng,H.M.Hang,C.L.Lin and F.D.Jou,“AHG8:Line-based Intra Block Copy,”JCTVC-O0205,Geneva,Nov.2013.
[9]D Flynn,K.Sharman,C.Rosewame,“Common test conditions and softwarereference configurations for HEVC range extensions,”JCTVC-O1006,Geneva,Nov.2013.
发明内容
为了解决上述技术问题,本专利提出了两种编码方案。第一种是针对CU分别进行水平和垂直分割,并针对水平线条和垂直线条分别进行搜索以找到最优替换矢量。同时,针对水平线条左侧的预测区域和垂直线条上方的预测区域以类似的方式查找最优预测线条,得到预测替换矢量。如果二者相同,则设置标志并无需传送替换矢量,如果不同则传送最优替换矢量。第二种是针对水平线条和垂直线条进行翻转,再进行最优替换矢量搜索,此时不进行预测替换矢量的搜索。这两种编码方案可同时使用,或分开使用。
根据一个方面,提出了一种基于HEVC的视频编码方法,包括:
输入视频,其中,所述视频包括多个帧;
将一个帧划分为多个编码树单元(CTU),每个编码树单元进一步被划分为多个编码单元(CU),每个CU的尺寸为2Nx2N,其中N<=32;并且
针对每个CU,进行帧内编码,其中,将当前CU分别在垂直方向和水平方向上划分为多个水平线条和多个垂直线条,水平线条尺寸为2NxM,垂直线条尺寸为Mx2N,其中M>=1,所述帧内编码进一步包括:
针对每个水平线条:
在当前CTU的已重构的区域中,在垂直方向上进行搜索以找到针对该水平线条的最优替换矢量,
针对该水平线条左侧的4xM个像素构成的块,在当前CTU的已重构的区域中,在垂直方向上进行搜索以找到针对该块的预测矢量,
判断针对该水平线条的所述最优替换矢量和所述预测矢量是否相同,如果相同,则设置第一标志以表示该水平线条采用所述预测矢量作为最终替换矢量,如果不同,则采用所述最优替换矢量作为所述最终替换矢量;
针对每个垂直线条:
在当前CTU和当前CTU左侧CTU的已重构的区域中,在水平方向上进行搜索以找到针对该垂直线条的最优替换矢量,
针对该垂直线条上方的4xM个像素构成的块,在当前CTU和当前CTU左侧CTU的已重构的区域中,在水平方向上进行搜索以找到针对该块的预测矢量,
判断针对该垂直线条的所述最优替换矢量和所述预测矢量是否相同,如果相同,则设置第二标志以表示该垂直线条采用所述预测矢量作为最终替换矢量,如果不同,则采用所述最优替换矢量作为所述最终替换矢量。
根据进一步的方面,上述方法进一步包括:
针对每个水平线条进行垂直翻转,针对每个垂直线条进行水平翻转;
针对每个水平线条,如果在当前CTU的已重构的区域中,在垂直方向上进行搜索找到完全相同的水平线条,则设置第三标志,并使用与该完全相同的水平线条相对应的最优替换矢量作为针对该水平线条的所述最终替换矢量;
针对每个垂直线条,如果在当前CTU和当前CTU左侧CTU的已重构的区域中,在水平方向上进行搜索找到完全相同的垂直线条,则设置第四标志,并使用与该完全相同的垂直线条相对应的最优替换矢量作为针对该垂直线条的所述最终替换矢量。
根据进一步的方面,其中,如果所述第一标志被设置,则不编码针对该水平线条的所述最终替换矢量,并且,如果所述第二标志被设置,则不编码针对该垂直线条的所述最终替换矢量。
根据进一步的方面,其中,如果所述第三标志被设置,则不进行该水平线条的所述预测矢量的查找,并且,如果所述第四标志被设置,则不进行该垂直线条的所述预测矢量的查找。
根据进一步的方面,其中,使用代价函数来搜索所述最优替换矢量。
根据进一步的方面,其中,使用最小加权和来搜索所述预测矢量,其中,像素距离被预测线条越近,则所权重的越大。
根据另一方面,本发明提出了一种基于HEVC的视频编码装置,包括:
用于输入视频的模块,其中,所述视频包括多个帧;
用于将一个帧划分为多个编码树单元(CTU),将每个编码树单元进一步划分为多个编码单元(CU)的模块,每个CU的尺寸为2Nx2N,其中N<=32;并且
用于针对每个CU,进行帧内编码的模块,其中,将当前CU分别在垂直方向和水平方向上划分为多个水平线条和多个垂直线条,水平线条尺寸为2NxM,垂直线条尺寸为Mx2N,其中M>=1,所述用于进行帧内编码的模块进一步包括:
用于针对每个水平线条进行如下操作的模块:
在当前CTU的已重构的区域中,在垂直方向上进行搜索以找到针对该水平线条的最优替换矢量,
针对该水平线条左侧的4xM个像素构成的块,在当前CTU的已重构的区域中,在垂直方向上进行搜索以找到针对该块的预测矢量,
判断针对该水平线条的所述最优替换矢量和所述预测矢量是否相同,如果相同,则设置第一标志以表示该水平线条采用所述预测矢量作为最终替换矢量,如果不同,则采用所述最优替换矢量作为所述最终替换矢量;
用于针对每个垂直线条进行如下操作的模块:
在当前CTU和当前CTU左侧CTU的已重构的区域中,在水平方向上进行搜索以找到针对该垂直线条的最优替换矢量,
针对该垂直线条上方的4xM个像素构成的块,在当前CTU和当前CTU左侧CTU的已重构的区域中,在水平方向上进行搜索以找到针对该块的预测矢量,
判断针对该垂直线条的所述最优替换矢量和所述预测矢量是否相同,如果相同,则设置第二标志以表示该垂直线条采用所述预测矢量作为最终替换矢量,如果不同,则采用所述最优替换矢量作为所述最终替换矢量。
根据进一步的方面,上述方法进一步包括:
用于针对每个水平线条进行垂直翻转,针对每个垂直线条进行水平翻转的模块;
用于针对每个水平线条,如果在当前CTU的已重构的区域中,在垂直方向上进行搜索找到完全相同的水平线条,则设置第三标志,并使用与该完全相同的水平线条相对应的最优替换矢量作为针对该水平线条的所述最终替换矢量的模块;
用于针对每个垂直线条,如果在当前CTU和当前CTU左侧CTU的已重构的区域中,在水平方向上进行搜索找到完全相同的垂直线条,则设置第四标志,并使用与该完全相同的垂直线条相对应的最优替换矢量作为针对该垂直线条的所述最终替换矢量的的模块。
根据另一方面,本发明提出了一种计算机程序产品,其包含计算机可读介质,所述计算机可读介质包含程序代码,所述程序代码当由处理器执行时,执行如上所述的方法。
根据另一方面,本发明提出了一种基于HEVC的编解码器,其用于执行如上所述的视频编码方法。
附图说明
图1示出了一个IntraBS实例。
图2是本发明所提出的编码方案的高级流程图。
图3(a)和3(b)是示出本发明所提出的水平线条和垂直线条的帧内DV搜索和DV预测的示意图。
图4示出了在屏幕内容编码中的对称内容的实例。
图5示出了根据本发明的一个实施例的翻转拷贝的实例。
图6示出了根据本发明的一个实例的编码方案流程图。
图7示出了图6所示流程图的更为详细的解释。
图8(a)示出了根据本发明的一个实例的方法流程图。
图8(b)示出了根据本发明的一个实例的装置流程图。
图9示出了HEVC的编码器框图的一个实施例。
具体实施方式
现在参考附图来描述各种方案。在以下描述中,为了进行解释,阐述了多个具体细节以便提供对一个或多个方案的透彻理解。然而,显然,在没有这些具体细节的情况下也能够实现这些方案。
如在本申请中所使用的,术语“组件”、“模块”、“系统”等等旨在指代与计算机相关的实体,例如但不限于,硬件、固件、硬件和软件的组合、软件,或者是执行中的软件。例如,组件可以是但不限于:在处理器上运行的进程、处理器、对象、可执行体(executable)、执行线程、程序、和/或计算机。举例而言,运行在计算设备上的应用程序和该计算设备都可以是组件。一个或多个组件可以位于执行进程和/或者执行线程内,并且组件可以位于一台计算机上和/或者分布在两台或更多台计算机上。另外,这些组件可以从具有存储在其上的各种数据结构的各种计算机可读介质执行。组件可以借助于本地和/或远程进程进行通信,例如根据具有一个或多个数据分组的信号,例如,来自于借助于信号与本地系统、分布式系统中的另一组件交互和/或者与在诸如因特网之类的网络上借助于信号与其他系统交互的一个组件的数据。
图9示出了高效视频编码(HEVC)所实现的视频编码器的大致结构图。HEVC的编码器架构与H.264所使用的编码器架构大致相同,主要是针对各个模块中所使用的算法进行了进一步的研究、改进,尤其是针对高分辨率视频序列,其改进的目标是在相同视频质量(PSNR)下码率降为H.264标准的50%。
由于HEVC的编码器架构与H.264所使用的编码器架构大致相同,因此不混淆本发明,本申请中不对图9中的整体架构进行描述。
在HEVC中,输入的视频首先被分割成一些小块叫做编码树单元(coding tree units,CTU)。本领域技术人员可以理解,CTU相当于之前标准的宏块(macroblock)的概念。编码单元(CU)是一个拥有一个预测模式(帧内、帧间或者跳过)的正方形的(像素)单元。基于CTU和CU的预测单元分割方式如图1所示。
本发明的高级流程可以如图2所示。与[8]中提到的line-based IntraBC一样,当前的2Nx2N尺寸的CU被均匀的分成Mx2N或者2NxM大小的线条(line)。用一个标志标志(flag)来区分两种尺寸的分割方式。每一线条(line)通过估计DV指向的重构区域的预测准确度和传输DV的开销得到的最优DV。由于在一个CU中会有2N/M个线条(line),所以我们需要消耗很多比特去编码2N/M个DV。另一方面,为了降低复杂度,最优DV的只能在特定的区域搜索,有可能找不到最优匹配的线条(line)。为了处理这些问题,我们分别引入了DV预测和翻转块拷贝预测来减少DV的开销并提高预测准确度。这两部分将在下节介绍。
帧内DV搜索和DV预测
为了减少复杂度,跟[8]里的方案一样我们方案里也只用一维搜索来寻找最优DV。对于Mx2N和2NxM的线条(line),它们的搜索范围是不一样的,分别如图3(a)和(b)所示。
Mx2N尺寸的线条(line)只进行水平的帧内DV搜索,所以DV可以用一维向量来表示。搜索范围被限定在当前和左侧CTU的已经重构的区域(图中3(a)中阴影部分)。类似的,每个2NxM尺寸的线条(line)只通过垂直一维搜索,搜索范围被限定在当前CTU的重构区域(图中3(b)中阴影部分)。通过计算每个DV的COSTDV可以选出最优的DV。
COSTDV=Dline+λRDV,(1)
这里Dline是当前线条(line)和预测的线条(line)的绝对误差(absolutedifference,SAD)和。RDV是用于编码DV所需要的bit数。λ是一个调节RDV权重的参数。COSTDV最小的DV将成为最优DV。
每个线条(line)的最优DV需要被传送到解码端。为了减少DV的开销,每一个线条(line)都用一个预测DV。由于临近区域有相关性,如果两个线条(line)的临近区域是相似的,两个线条(line)很有可能是相似的。我们就通过当前线条(line)临近的已经重构像素来得到一个预测DV(如图.3)。对于每一个尺寸为Mx2N的线条(line),其上方包含Mx4个像素的一块区域被称作当前预测块。参考预测块指在搜索范围上方的一组Mx4的像素。每一个当前预测块可以找到一个最匹配的参考预测块,最优参考预测块和当前预测块之间的DV被称作预测DV。
搜索预测DV需要计算当前预测块和参考预测块绝对差的加权和。预存块最下方的像素有更高的权重,因为它们比上方的像素更靠近当前线条(line)。如果当前预测块的亮度矩阵是
C M × 4 = c 11 c 12 c 13 . . . c 1 M c 21 c 22 c 23 . . . c 2 M c 31 c 32 c 33 . . . c 3 M c 41 c 42 c 43 . . . c 4 M , - - - ( 2 )
参考预测块的亮度矩阵是
R M × 4 = r 11 r 12 r 13 . . . r 1 M r 21 r 22 r 23 . . . r 2 M r 31 r 32 r 33 . . . r 3 M r 41 r 42 r 43 . . . r 4 M , - - - ( 3 )
加权和就是
SUM = Σ j = 1 4 Σ i = 1 M ( | c ji - r ji | × 2 j - 1 ) - - - ( 4 )
最小SUM的参考预测块就是最匹配的块。
2NxM的线条(line)可以用左侧的预测块采用类似的方法得到一个预测DV。如果当前线条(line)用预测DV来编,预测DV也可以在在解码端用相同的流程得到。
每一个线条(line),用一个flag来区分这个线条(line)的DV是否就是预测DV。如果最优DV跟预测DV是一样的(如图3的中间2个箭头所示),最优DV就不用编码了,因为解码端可以通过预测DV来得到最优DV。反过来,如果预测DV与最优DV不等(如图3的最上和最下箭头所示),编码端还是要最优DV传输给解码端,解码端也就不用再去寻找每个线条(line)的预测DV了。在这种情况下每个CU第一个线条(line)的最优DV用无符号一维向量来表示因为DV是不可能大于0的。其他的线条(line)用有符号的一维向量来传输当前线条(line)最优DV和前一个线条(line)最优DV的差值。DV差值用下面的公式表示。
DVD=DVcurrent-DVlast,(5)
这里DVcurrent是当前线条(line)的最优DV DVlast是上一个线条(line)的最优DV。如同IntraBC中采用的二维矢量,这里用的一维矢量用更多的bit来表示绝对值较大的矢量。
翻转块拷贝预测
文字图表等常常存在对称。比如,在图4(a)中,上下翻转线框里的内容,会得到跟其上方线框里相同的内容。图4(b)中通过水平翻转也能得到类似的关系。也就是说对已经重构的区域翻转作为预测也是可以的。
图5是翻转块拷贝的一个例子。对于2NxM尺寸的线条(line),我们只进行垂直方向的翻转预测。Mx2N的线条(line)则采用水平方向的翻转预测。
这里用一个flag来告诉解码端当前线条(line)采用的是普通拷贝预测还是翻转拷贝预测。采用翻转拷贝的线条(line)将不采用预测DV,因为在翻转块拷贝中参考预测块和参考线条(line)之间的相关性没有普通拷贝那么强。
加入DV预测和翻转块拷贝的线状IntraBC的流程如图6所示。这里用了三个flag来区分线条(line)的类型、是否用DV预测、和块拷贝方式。编码端通过计算所有可能的COSTDV来估计一个最优编码方式。为了减少编码复杂度,线状IntraBC跳过大于16x16的CU。
图8(a)示出了根据本发明的一个实施例的基于HEVC的视频编码方法的流程图。
在步骤801中,输入视频,其中,所述视频包括多个帧。在HEVC中可以对每个帧进行帧内预测和帧间预测。在帧内预测中,可以使用本发明的改进的线状帧内块拷贝的HEVC视频内容编码方法。具体如下所述。
在步骤802中,将一个帧划分为多个编码树单元(CTU),每个编码树单元进一步被划分为多个编码单元(CU),每个CU的尺寸为2Nx2N,其中N<=32。
在步骤803中,针对每个CU,进行帧内编码,其中,将当前CU分别在垂直方向和水平方向上划分为多个水平线条和多个垂直线条,水平线条尺寸为2NxM,垂直线条尺寸为Mx2N,其中M>=1。
对于每一个水平线条,所述帧内编码进一步包括:在当前CTU的已重构的区域中,在垂直方向上进行搜索以找到针对该水平线条的最优替换矢量;针对该水平线条左侧的4xM个像素构成的块,在当前CTU的已重构的区域中,在垂直方向上进行搜索以找到针对该块的预测矢量;判断针对该水平线条的所述最优替换矢量和所述预测矢量是否相同,如果相同,则设置第一标志以表示该水平线条采用所述预测矢量作为最终替换矢量,如果不同,则采用所述最优替换矢量作为所述最终替换矢量。
对于每一个水平线条,所述帧内编码进一步包括:在当前CTU和当前CTU左侧CTU的已重构的区域中,在水平方向上进行搜索以找到针对该垂直线条的最优替换矢量;针对该垂直线条上方的4xM个像素构成的块,在当前CTU和当前CTU左侧CTU的已重构的区域中,在水平方向上进行搜索以找到针对该块的预测矢量;判断针对该垂直线条的所述最优替换矢量和所述预测矢量是否相同,如果相同,则设置第二标志以表示该垂直线条采用所述预测矢量作为最终替换矢量,如果不同,则采用所述最优替换矢量作为所述最终替换矢量。
在本发明的一个实施例中,如果所述第一标志被设置,则不编码针对该水平线条的所述最终替换矢量,并且,如果所述第二标志被设置,则不编码针对该垂直线条的所述最终替换矢量。
在一个实施例中,在进行最优DV搜索时,可以使用代价函数,例如公式(1)所示。在一个实施例中,在进行预测矢量搜索时可以使用最小加权和,例如公式(2)-(4)的方法。当前,本领域技术人员完全可以设想其他方法来实现最优DV搜索和预测矢量搜索,而不局限于上述公式(1)-(5)。
根据一个附加和/或替换实施例,可以采用翻转块拷贝预测。例如,针对每个水平线条进行垂直翻转,针对每个垂直线条进行水平翻转。针对每个水平线条,如果在当前CTU的已重构的区域中,在垂直方向上进行搜索找到完全相同的水平线条,则设置第三标志,并使用与该完全相同的水平线条相对应的最优替换矢量作为针对该水平线条的所述最终替换矢量。针对每个垂直线条,如果在当前CTU和当前CTU左侧CTU的已重构的区域中,在水平方向上进行搜索找到完全相同的垂直线条,则设置第四标志,并使用与该完全相同的垂直线条相对应的最优替换矢量作为针对该垂直线条的所述最终替换矢量。
其中,这种“完全相同”的情况是屏幕内容编码中所特有的,因为屏幕内容的画面通常是由计算机产生的图像,例如Office界面等等,如图4所示,这种由计算机产生的图像中的对称物体的对称部分之间不存在误差。
在本发明的一个实施例中,如果所述第三标志被设置,则不进行该水平线条的所述预测矢量的查找,并且,如果所述第四标志被设置,则不进行该垂直线条的所述预测矢量的查找。
图8(b)示出了根据本发明的一个实施例的基于HEVC的视频编码装置,该装置的各个部分与图8(a)所示方法一一对应,因此不再赘述。
实验表明,当M=1时,DV预测平均节省了2.9%的比特,同时编码时间几乎没有变化。尽管上述方法选择DV预测时需要在解码器端搜索预测DV,这会在解码端引来一些复杂度,但是解码时间并没有显著增加。这是由于在解码端IntraBC的复杂度要小于HEVC的方向预测。另外,更精确的预测使得残差变小,在有损编码时极小的残差将不会进行编码,所以编码端的就无需做反量化、反变换等操作。
实验表明,如果同时使用翻转块拷贝,当M=4时,本发明的方法能够进一步节约1.8%。对于JCT-VC推荐的all-intra lossy屏幕内容编码环境[7]中的序列“sc_cad_waveform”通过更好的处理对称内容,节省的比特更是高达6.7%。
本发明所公开的方法可以用软件、硬件、固件等来实现。
当用硬件实现时,视频编码器可以用通用处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)或其它可编程逻辑器件、分立门或晶体管逻辑器件、分立硬件组件或者设计为执行本文所述功能的其任意组合,来实现或执行。通用处理器可以是微处理器,但是可替换地,该处理器也可以是任何常规的处理器、控制器、微控制器或者状态机。处理器也可以实现为计算设备的组合,例如,DSP和微处理器的组合、多个微处理器的组合、一个或多个微处理器与DSP内核的组合或者任何其它此种结构。另外,至少一个处理器可以包括可操作以执行上述的一个或多个步骤和/或操作的一个或多个模块。
当用ASIC、FPGA等硬件电路来实现视频编码器时,其可以包括被配置为执行各种功能的各种电路块。本领域技术人员可以根据施加在整个系统上的各种约束条件来以各种方式设计和实现这些电路,来实现本发明所公开的各种功能。
尽管前述公开文件论述了示例性方案和/或实施例,但应注意,在不背离由权利要求书定义的描述的方案和/或实施例的范围的情况下,可以在此做出许多变化和修改。而且,尽管以单数形式描述或要求的所述方案和/或实施例的要素,但也可以设想复数的情况,除非明确表示了限于单数。另外,任意方案和/或实施例的全部或部分都可以与任意其它方案和/或实施例的全部或部分结合使用,除非表明了有所不同。

Claims (10)

1.一种基于HEVC的视频编码方法,包括:
输入视频,其中,所述视频包括多个帧;
将一个帧划分为多个编码树单元(CTU),每个编码树单元进一步被划分为多个编码单元(CU),每个CU的尺寸为2Nx2N,其中N<=32;并且
针对每个CU,进行帧内编码,其中,将当前CU分别在垂直方向和水平方向上划分为多个水平线条和多个垂直线条,水平线条尺寸为2NxM,垂直线条尺寸为Mx2N,其中M>=1,所述帧内编码进一步包括:
针对每个水平线条:
在当前CTU的已重构的区域中,在垂直方向上进行搜索以找到针对该水平线条的最优替换矢量,
针对该水平线条左侧的4xM个像素构成的块,在当前CTU的已重构的区域中,在垂直方向上进行搜索以找到针对该块的预测矢量,
判断针对该水平线条的所述最优替换矢量和所述预测矢量是否相同,如果相同,则设置第一标志以表示该水平线条采用所述预测矢量作为最终替换矢量,如果不同,则采用所述最优替换矢量作为所述最终替换矢量;
针对每个垂直线条:
在当前CTU和当前CTU左侧CTU的已重构的区域中,在水平方向上进行搜索以找到针对该垂直线条的最优替换矢量,
针对该垂直线条上方的4xM个像素构成的块,在当前CTU和当前CTU左侧CTU的已重构的区域中,在水平方向上进行搜索以找到针对该块的预测矢量,
判断针对该垂直线条的所述最优替换矢量和所述预测矢量是否相同,如果相同,则设置第二标志以表示该垂直线条采用所述预测矢量作为最终替换矢量,如果不同,则采用所述最优替换矢量作为所述最终替换矢量。
2.如权利要求1所述的方法,进一步包括:
针对每个水平线条进行垂直翻转,针对每个垂直线条进行水平翻转;
针对每个水平线条,如果在当前CTU的已重构的区域中,在垂直方向上进行搜索找到完全相同的水平线条,则设置第三标志,并使用与该完全相同的水平线条相对应的最优替换矢量作为针对该水平线条的所述最终替换矢量;
针对每个垂直线条,如果在当前CTU和当前CTU左侧CTU的已重构的区域中,在水平方向上进行搜索找到完全相同的垂直线条,则设置第四标志,并使用与该完全相同的垂直线条相对应的最优替换矢量作为针对该垂直线条的所述最终替换矢量。
3.如权利要求1或2所述的方法,其中,如果所述第一标志被设置,则不编码针对该水平线条的所述最终替换矢量,并且,如果所述第二标志被设置,则不编码针对该垂直线条的所述最终替换矢量。
4.如权利要求1或2所述的方法,其中,如果所述第三标志被设置,则不进行该水平线条的所述预测矢量的查找,并且,如果所述第四标志被设置,则不进行该垂直线条的所述预测矢量的查找。
5.如权利要求1或2所述的方法,其中,使用代价函数来搜索所述最优替换矢量。
6.如权利要求1或2所述的方法,其中,使用最小加权和来搜索所述预测矢量,其中,像素距离被预测线条越近,则所权重的越大。
7.一种基于HEVC的视频编码装置,包括:
用于输入视频的模块,其中,所述视频包括多个帧;
用于将一个帧划分为多个编码树单元(CTU),将每个编码树单元进一步划分为多个编码单元(CU)的模块,每个CU的尺寸为2Nx2N,其中N<=32;并且
用于针对每个CU,进行帧内编码的模块,其中,将当前CU分别在垂直方向和水平方向上划分为多个水平线条和多个垂直线条,水平线条尺寸为2NxM,垂直线条尺寸为Mx2N,其中M>=1,所述用于进行帧内编码的模块进一步包括:
用于针对每个水平线条进行如下操作的模块:
在当前CTU的已重构的区域中,在垂直方向上进行搜索以找到针对该水平线条的最优替换矢量,
针对该水平线条左侧的4xM个像素构成的块,在当前CTU的已重构的区域中,在垂直方向上进行搜索以找到针对该块的预测矢量,
判断针对该水平线条的所述最优替换矢量和所述预测矢量是否相同,如果相同,则设置第一标志以表示该水平线条采用所述预测矢量作为最终替换矢量,如果不同,则采用所述最优替换矢量作为所述最终替换矢量;
用于针对每个垂直线条进行如下操作的模块:
在当前CTU和当前CTU左侧CTU的已重构的区域中,在水平方向上进行搜索以找到针对该垂直线条的最优替换矢量,
针对该垂直线条上方的4xM个像素构成的块,在当前CTU和当前CTU左侧CTU的已重构的区域中,在水平方向上进行搜索以找到针对该块的预测矢量,
判断针对该垂直线条的所述最优替换矢量和所述预测矢量是否相同,如果相同,则设置第二标志以表示该垂直线条采用所述预测矢量作为最终替换矢量,如果不同,则采用所述最优替换矢量作为所述最终替换矢量。
8.如权利要求1所述的装置,进一步包括:
用于针对每个水平线条进行垂直翻转,针对每个垂直线条进行水平翻转的模块;
用于针对每个水平线条,如果在当前CTU的已重构的区域中,在垂直方向上进行搜索找到完全相同的水平线条,则设置第三标志,并使用与该完全相同的水平线条相对应的最优替换矢量作为针对该水平线条的所述最终替换矢量的模块;
用于针对每个垂直线条,如果在当前CTU和当前CTU左侧CTU的已重构的区域中,在水平方向上进行搜索找到完全相同的垂直线条,则设置第四标志,并使用与该完全相同的垂直线条相对应的最优替换矢量作为针对该垂直线条的所述最终替换矢量的模块。
9.一种计算机程序产品,其包含计算机可读介质,所述计算机可读介质包含程序代码,所述程序代码当由处理器执行时,执行如权利要求1-6所述的方法。
10.一种基于HEVC的编解码器,其用于执行如权利要求1-6所述的视频编码方法。
CN201410510123.XA 2014-09-29 2014-09-29 基于线状帧内块拷贝的hevc屏幕内容编码 Active CN104219531B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410510123.XA CN104219531B (zh) 2014-09-29 2014-09-29 基于线状帧内块拷贝的hevc屏幕内容编码

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410510123.XA CN104219531B (zh) 2014-09-29 2014-09-29 基于线状帧内块拷贝的hevc屏幕内容编码

Publications (2)

Publication Number Publication Date
CN104219531A true CN104219531A (zh) 2014-12-17
CN104219531B CN104219531B (zh) 2018-02-06

Family

ID=52100609

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410510123.XA Active CN104219531B (zh) 2014-09-29 2014-09-29 基于线状帧内块拷贝的hevc屏幕内容编码

Country Status (1)

Country Link
CN (1) CN104219531B (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105791824A (zh) * 2016-03-09 2016-07-20 西安电子科技大学 基于边缘点密度的屏幕内容编码预测模式快速选择方法
CN105847842A (zh) * 2015-01-29 2016-08-10 同济大学 图像编码方法及装置、图像解码方法及装置
CN105898330A (zh) * 2015-02-12 2016-08-24 联发科技股份有限公司 采用受限帧内区块拷贝模式进行视频编码的方法和装置
CN107409226A (zh) * 2015-03-02 2017-11-28 寰发股份有限公司 用于视频编解码中的具有分数像素块向量分辨率的IntraBC模式的方法和装置
CN109120928A (zh) * 2018-04-18 2019-01-01 北方工业大学 基于字符分割的改进帧内块拷贝算法
WO2022037628A1 (en) * 2020-08-20 2022-02-24 Beijing Bytedance Network Technology Co., Ltd. Block vector processing in intra block copy coding

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1859573A (zh) * 2005-10-11 2006-11-08 华为技术有限公司 帧内预测编码方法及其系统
US20110292994A1 (en) * 2010-05-30 2011-12-01 Lg Electronics Inc. Enhanced intra prediction mode signaling
CN103096067A (zh) * 2011-11-04 2013-05-08 吴秀美 产生重构块的方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1859573A (zh) * 2005-10-11 2006-11-08 华为技术有限公司 帧内预测编码方法及其系统
US20110292994A1 (en) * 2010-05-30 2011-12-01 Lg Electronics Inc. Enhanced intra prediction mode signaling
CN103096067A (zh) * 2011-11-04 2013-05-08 吴秀美 产生重构块的方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
C.C.CHEN,T.S.CHANG,R.L.LIAO,W.H.PENG,H.M.HANG,C.L.LIN,F.D.JOU: "AHG8:Line-based Intra Block Copy", 《JCTVC》 *
W-J CHIEN ET AL: "Parsing friendly intra mode", 《MPEG MEETING》 *

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105847842A (zh) * 2015-01-29 2016-08-10 同济大学 图像编码方法及装置、图像解码方法及装置
CN105847842B (zh) * 2015-01-29 2021-01-22 同济大学 图像编码方法及装置、图像解码方法及装置
CN105898330A (zh) * 2015-02-12 2016-08-24 联发科技股份有限公司 采用受限帧内区块拷贝模式进行视频编码的方法和装置
US9955185B2 (en) 2015-02-12 2018-04-24 Mediatek Inc. Method and apparatus of constrained intra block copy for coding video
CN105898330B (zh) * 2015-02-12 2018-11-16 联发科技股份有限公司 采用受限帧内区块拷贝模式进行视频编码的方法和装置
CN107409226A (zh) * 2015-03-02 2017-11-28 寰发股份有限公司 用于视频编解码中的具有分数像素块向量分辨率的IntraBC模式的方法和装置
CN107409226B (zh) * 2015-03-02 2019-11-12 寰发股份有限公司 用于视频编解码中的具有分数像素块向量分辨率的IntraBC模式的方法和装置
CN105791824A (zh) * 2016-03-09 2016-07-20 西安电子科技大学 基于边缘点密度的屏幕内容编码预测模式快速选择方法
CN105791824B (zh) * 2016-03-09 2018-08-31 西安电子科技大学 基于边缘点密度的屏幕内容编码预测模式快速选择方法
CN109120928A (zh) * 2018-04-18 2019-01-01 北方工业大学 基于字符分割的改进帧内块拷贝算法
CN109120928B (zh) * 2018-04-18 2022-02-01 北方工业大学 基于字符分割的改进帧内块拷贝方法和装置
WO2022037628A1 (en) * 2020-08-20 2022-02-24 Beijing Bytedance Network Technology Co., Ltd. Block vector processing in intra block copy coding

Also Published As

Publication number Publication date
CN104219531B (zh) 2018-02-06

Similar Documents

Publication Publication Date Title
US11178421B2 (en) Method and apparatus for encoding/decoding images using adaptive motion vector resolution
JP7481538B2 (ja) 変換行列選択の係数依存コーディング
CN110024392B (zh) 用于视频译码的低复杂度符号预测
CN104219531A (zh) 基于线状帧内块拷贝的hevc屏幕内容编码
JP6404487B2 (ja) 画像予測方法および関連装置
CN111757106B (zh) 使用多级复合预测对视频流中的当前块编译的方法和设备
CN107027038B (zh) 动态参考运动矢量编码模式
US9628814B2 (en) Motion vector encoding/decoding method and device and image encoding/decoding method and device using same
US11641481B2 (en) Method and apparatus for encoding/decoding images using adaptive motion vector resolution
CN104539966A (zh) 图像预测方法及相关装置
KR20170045264A (ko) 이미지 예측 방법 및 관련 장치
CN105684441A (zh) 视频和图像编码中的基于散列的块匹配
CN101888546B (zh) 一种运动估计的方法及装置
CN107360433B (zh) 一种帧间预测编码方法和装置
CA3008890A1 (en) Motion vector reference selection through reference frame buffer tracking
CN109891894A (zh) 使用域变换递归滤波器的视频编译恢复
Zhang et al. Multiple linear regression for high efficiency video intra coding
CN104363449A (zh) 图像预测方法及相关装置
CN101779463A (zh) 用于处理图像的方法以及相应的电子设备
CN111131822A (zh) 具有从邻域导出的运动信息的重叠块运动补偿
CN104539949A (zh) Hevc屏幕编码中基于边缘方向的快速分块
CN113709458B (zh) 视频编解码中的位移矢量预测方法、装置及设备
JP7448558B2 (ja) 画像エンコーディングおよびデコーディングのための方法およびデバイス
KR20180024702A (ko) 영상에 대한 적응적 rdpcm 방법, 적응적 rdpcm에 기반한 인코딩 방법 및 적응적 rdpcm에 기반한 디코딩 방법
CN112352434B (zh) 用于帧内预测的基于宽高比滤波的方法和装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20201109

Address after: Group 3, Jianyang Town, Jiandong village, Jianhu County, Yancheng City, Jiangsu Province

Patentee after: Jianhu Wanyun Technology Co.,Ltd.

Address before: Room 1424, Floor 4, Peony Pioneer Building, No. 2 Garden Road, Haidian District, Beijing, 100191

Patentee before: Beijing Zhonglian Technology Service Co.,Ltd.

Effective date of registration: 20201109

Address after: Room 1424, Floor 4, Peony Pioneer Building, No. 2 Garden Road, Haidian District, Beijing, 100191

Patentee after: Beijing Zhonglian Technology Service Co.,Ltd.

Address before: 100144 Beijing City, Shijingshan District Jin Yuan Zhuang Road No. 5, North China University of Technology

Patentee before: North China University of Technology

TR01 Transfer of patent right

Effective date of registration: 20201201

Address after: 213000 No. 11 Qingyang North Road, Tianning District, Changzhou, Jiangsu

Patentee after: Changzhou Hong quantity Electronic Technology Co.,Ltd.

Address before: Group 3, Jianyang Town, Jiandong village, Jianhu County, Yancheng City, Jiangsu Province

Patentee before: Jianhu Wanyun Technology Co.,Ltd.

TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20220825

Address after: Tianning District Hehai road 213000 Jiangsu city of Changzhou province No. 9

Patentee after: Changzhou Tianning Communication Technology Industrial Park Co.,Ltd.

Address before: 213000 No. 11 Qingyang North Road, Tianning District, Changzhou City, Jiangsu Province

Patentee before: Changzhou Hong quantity Electronic Technology Co.,Ltd.

TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20230106

Address after: Tianning District Hehai road 213000 Jiangsu city of Changzhou province No. 9

Patentee after: Changzhou Hengtang Technology Industry Co.,Ltd.

Address before: Tianning District Hehai road 213000 Jiangsu city of Changzhou province No. 9

Patentee before: Changzhou Tianning Communication Technology Industrial Park Co.,Ltd.

TR01 Transfer of patent right