CN112532989A - 视频编码方法、视频解码方法及相关设备 - Google Patents

视频编码方法、视频解码方法及相关设备 Download PDF

Info

Publication number
CN112532989A
CN112532989A CN202010487810.XA CN202010487810A CN112532989A CN 112532989 A CN112532989 A CN 112532989A CN 202010487810 A CN202010487810 A CN 202010487810A CN 112532989 A CN112532989 A CN 112532989A
Authority
CN
China
Prior art keywords
current
block
decoding
equal
string
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010487810.XA
Other languages
English (en)
Other versions
CN112532989B (zh
Inventor
王英彬
许晓中
刘杉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN202010487810.XA priority Critical patent/CN112532989B/zh
Priority to CN202210101714.6A priority patent/CN114466186A/zh
Publication of CN112532989A publication Critical patent/CN112532989A/zh
Application granted granted Critical
Publication of CN112532989B publication Critical patent/CN112532989B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/107Selection of coding mode or of prediction mode between spatial and temporal predictive coding, e.g. picture refresh
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

本公开提供一种视频编码方法、视频解码方法及相关设备。该视频编码方法包括:获取当前图像,所述当前图像包括当前编码块;当所述当前编码块的尺寸满足第一预设条件时,对所述当前编码块采用帧内串复制模式进行编码,编码所述当前编码块的串预测标志。本公开实施例提供的技术方案,通过限制采用串预测技术进行视频编解码的块的大小,能够提高编解码效率。

Description

视频编码方法、视频解码方法及相关设备
技术领域
本公开涉及视频编解码技术领域,具体而言,涉及一种视频编码方法、视频解码方法、电子设备和计算机可读存储介质。
背景技术
一方面,互联网即将进入5G(5th generation mobile networks或5thgeneration wireless systems、5th-Generation,第五代移动通信技术)新时代,各种互联网应用中出现的图像(视频)已经成为互联网带宽的主要消耗者。特别是移动互联网图像流量与日俱增,在5G时代更将有爆发式的增长,将给图像编解码技术的加速发展注入全新的强大推动力。与此同时,也对图像编解码技术提出了诸多过去未曾遇到的严峻的新挑战。5G时代,万物互联,各类新兴应用中产生的新型互联网图像具有多样性和差异性。因此,如何针对具有多样性和差异性的新型互联网图像的特点,研究高效的图像编解码技术成为了迫切需求。
另一方面,用于描绘即使相对较短影片所需的视频数据量也可能相当大,当数据为流式或者以其它方式通过具有有限带宽容量的通信网进行传送时,这可能产生困难。因此,在通过现代电信网络进行传送之前,视频数据通常进行压缩。在传输之前,视频压缩设备通常使用在源侧的软件和/或硬件来对视频数据进行编码,从而减少了用于表示数字视频图像所需的数据量。随后由视频解压缩设备在目的地接收压缩数据,所述视频解压缩设备对视频数据进行解码。在有限的网络资源以及对较高视频质量的需求不断增加的情况下,需要提高图像质量而不会增加位速率的改进的压缩和解压缩技术。
相关技术中的串预测方案(也可称之为帧内串复制技术或者串匹配技术)存在不利于硬件实现的部分。
因此,需要一种新的视频编码方法、视频解码方法、电子设备和计算机可读存储介质。
需要说明的是,在上述背景技术部分公开的信息仅用于加强对本公开的背景的理解。
发明内容
本公开实施例提供一种视频编码方法、视频解码方法、电子设备和计算机可读存储介质,通过限制块的大小,能够提高串预测的编解码效率。
本公开的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本公开的实践而习得。
本公开实施例提供一种视频编码方法,所述方法包括:获取当前图像,所述当前图像包括当前编码块;当所述当前编码块的尺寸满足第一预设条件时,对所述当前编码块采用帧内串复制模式进行编码,编码所述当前编码块的串预测标志。
本公开实施例提供一种视频解码方法,所述方法包括:获取当前图像的码流,所述码流包括当前解码块;当所述当前解码块的尺寸满足第二预设条件时,不采用帧内串复制模式对所述当前解码块进行解码,不解码所述当前解码块的串预测标志;当所述当前解码块的尺寸不满足第二预设条件时,采用帧内串复制模式对所述当前解码块进行解码,解码所述当前解码块的串预测标志。
本公开实施例提供了一种计算机可读存储介质,其上存储有计算机程序,所述程序被处理器执行时实现如上述实施例中所述的视频编码方法或视频解码方法。
本公开实施例提供了一种电子设备,包括:至少一个处理器;存储装置,配置为存储至少一个程序,当所述至少一个程序被所述至少一个处理器执行时,使得所述至少一个处理器实现如上述实施例中所述的视频编码方法或视频解码方法。
在本公开的一些实施例所提供的技术方案中,通过限制串预测技术中的块的大小,一方面,可以减少小串的数量,有利于减少内存访问次数。另一方面,编码端可以跳过某些大小的块的串预测的分析,降低了复杂度。此外,还可以节省某些块上串预测标志的编码,有利于编码性能的提升。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。显而易见地,下面描述中的附图仅仅是本公开的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。在附图中:
图1示意性示出了相关技术中的一种视频编码基本框图;
图2示意性示出了相关技术中的帧间预测的示意图;
图3示意性示出了相关技术中的帧间预测的Merge(合并)模式的空域的候选MVP的位置示意图;
图4示意性示出了相关技术中的帧间预测的Merge模式的时域的候选MVP的位置示意图;
图5示意性示出了相关技术中的帧内串复制的示意图;
图6示意性示出了根据本公开的一实施例的视频编码方法的示意图;
图7示意性示出了本公开实施例中的ISC参考块搜索范围的示意图;
图8示意性示出了根据本公开的一实施例的视频解码方法的示意图;
图9示出了适于用来实现本公开实施例的电子设备的结构示意图。
具体实施方式
现在将参考附图更全面地描述示例实施方式。然而,示例实施方式能够以多种形式实施,且不应被理解为限于在此阐述的范例;相反,提供这些实施方式使得本公开将更加全面和完整,并将示例实施方式的构思全面地传达给本领域的技术人员。
此外,所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施例中。在下面的描述中,提供许多具体细节从而给出对本公开的实施例的充分理解。然而,本领域技术人员将意识到,可以实践本公开的技术方案而没有特定细节中的一个或更多,或者可以采用其它的方法、组元、装置、步骤等。在其它情况下,不详细示出或描述公知方法、装置、实现或者操作以避免模糊本公开的各方面。
附图中所示的方框图仅仅是功能实体,不一定必须与物理上独立的实体相对应。即,可以采用软件形式来实现这些功能实体,或在至少一个硬件模块或集成电路中实现这些功能实体,或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。
附图中所示的流程图仅是示例性说明,不是必须包括所有的内容和操作/步骤,也不是必须按所描述的顺序执行。例如,有的操作/步骤还可以分解,而有的操作/步骤可以合并或部分合并,因此实际执行的顺序有可能根据实际情况改变。
首先对本公开实施例中涉及的部分术语进行说明。
AVS:Audio Video Coding Standard,音视频编码标准。
HEVC:High Efficiency Video Coding,高效视频编码,也称之为H.265。
VVC:Versatile Video Coding,多功能视频编码,也称之为H.266。
Intra(picture)Prediction:帧内预测。
Inter(picture)Prediction:帧间预测。
SCC:screen content coding,屏幕内容/图像编码。
Loop Filtering:环路滤波。
QP:Quantization Parameter,量化参数。
LCU:Largest Coding Unit,最大编码单元。
CTU:Coding Tree Unit,编码树单元,一般由最大编码单元开始往下划分。
CU:Coding Unit,编码单元。
PU:Prediction Unit,预测单元。
MV:Motion Vector,运动矢量。
MVP:Motion Vector Prediction,运动矢量预测值。
MVD:Motion Vector Difference,MVP与MV的真正估值之间的差值。
AMVP:Advanced Motion Vector Prediction,高级运动矢量预测。
ME:Motion Estimation,运动估计,得到运动矢量MV的过程称作为运动估计,作为运动补偿(Motion Compensation,MC)中的技术。
MC:根据运动矢量和帧间预测方法,求得当前图像的估计值过程。运动补偿是一种描述相邻帧(相邻在这里表示在编码关系上相邻,在播放顺序上两帧未必相邻)差别的方法,具体来说是描述前面一帧的每个小块怎样移动到当前帧中的某个位置去。这种方法经常被视频压缩/视频编解码器用来减少视频序列中的空域冗余。相邻的帧通常很相似,也就是说,包含了很多冗余。使用运动补偿的目的是通过消除这种冗余,来提高压缩比。
I Slice:Intra Slice,帧内条带/片。可以把图像分成一帧(frame)或两场(field),而帧又可以分成一个或几个片(Slice)。
视频信号,从信号的获取方式看,可以包括摄像机拍摄到的以及计算机生成的两种方式。由于统计特性的不同,其对应的压缩编码方式也可能有所区别。
部分视频编码技术例如HEVC,VVC以及AVS,采用了混合编码框架,如图1所示,对输入的原始视频信号(input video)中的图像(pictures)按顺序编码,进行了如下一系列的操作和处理:
1)块划分结构(block partition structure):将输入图像划分成若干个不重叠的处理单元,对每个处理单元将进行类似的压缩操作。这个处理单元可以称之为CTU或者LCU。CTU或者LCU再往下,可以继续进行更加精细的划分,得到至少一个基本编码的单元,称之为CU。每个CU是一个编码环节中最基本的元素。以下描述的是对每一个CU可能采用的各种编码方式。
2)预测编码(Predictive Coding):包括了帧内预测和帧间预测等方式,原始视频信号经过选定的已重建视频信号的预测后,得到残差视频信号。编码端需要为当前CU决定在众多可能的预测编码模式中,选择最适合的一种,并告知解码端。
a.帧内预测:预测的信号来自于同一图像内已经编码重建过的区域。
其中,帧内预测的基本思想就是利用相邻像素的相关性去除空间冗余。在视频编码中,相邻像素指的就是当前CU周围的已编码CU的重建(reconstructed)像素。
b.帧间预测:预测的信号来自已经编码过的,且不同于当前图像的其他图像(称之为参考图像)。
3)变换编码及量化(Transform&Quantization):残差视频信号经过DFT(DiscreteFourier Transform,离散傅里叶变换),DCT(Discrete Cosine Transform,离散余弦变换)等变换操作,将残差视频信号转换到变换域中,称之为变换系数。在变换域中的残差视频信号,进一步的进行有损的量化操作,丢失掉一定的信息,使得量化后的信号有利于压缩表达。
在一些视频编码标准中,可能有多于一种变换方式可以选择,因此,编码端也需要为待编码的当前CU选择其中的一种变换,并告知解码端。
其中,量化的精细程度通常由量化参数(Quantization Parameters,QP)来决定,QP取值较大时,表示更大取值范围的变换系数将被量化为同一个输出,因此通常会带来更大的失真及较低的码率;相反,QP取值较小时,表示较小取值范围的变换系数将被量化为同一个输出,因此通常会带来较小的失真,同时对应较高的码率。
4)熵编码(Entropy Coding)或统计编码:量化后的变换域信号,将根据各个值出现的频率,进行统计压缩编码,最后输出二值化(0或者1)的压缩码流(bitstream)。
同时,编码产生其他信息,例如选择的编码模式(coding modes),运动矢量等,也需要进行熵编码以降低码率。
其中,统计编码是一种无损编码方式,可以有效的降低表达同样的信号所需要的码率。常见的统计编码方式有变长编码(Variable Length Coding,VLC)或者基于上下文的二值化算术编码(Content Adaptive Binary Arithmetic Coding,CABAC)。
5)环路滤波(Loop Filtering):已经编码过的图像,经过反量化,反变换及预测补偿的操作(上述步骤2)~4)的反向操作),可获得重建的解码图像(decoded picture)。重建的解码图像与原始的输入图像相比,由于存在量化的影响,部分信息与原始的输入图像有所不同,产生失真(Distortion)。对重建的解码图像进行滤波操作,例如去块效应滤波(deblocking),SAO(Sample Adaptive Offset,样点自适应补偿)或者ALF(Adaptive LoopFilter,自适应环路滤波)等滤波器,可以有效的降低量化所产生的失真程度。由于这些经过滤波后的重建的解码图像,将做为后续编码图像的参考,用于对将来的信号进行预测,所以上述的滤波操作也称为环路滤波,及在编码环路内的滤波操作。
图1展示了一个视频编码器的基本流程图。图1中以第k个CU(标记为sk[x,y])为例进行举例说明。其中,k为大于或等于1且小于或等于输入的当前图像中的CU的数量的正整数,sk[x,y]表示第k个CU中坐标为[x,y]的像素点,x表示像素点的横坐标,y表示像素点的纵坐标。sk[x,y]经过运动补偿或者帧内预测等中的一种较优处理后获得预测信号
Figure BDA0002519736450000071
sk[x,y]与
Figure BDA0002519736450000072
相减得到残差信号uk[x,y],然后对该残差信号uk[x,y]进行变换和量化,量化输出的数据有两个不同的去处:一个是送给熵编码器进行熵编码,编码后的码流输出到一个缓冲器(buffer)中保存,等待传送出去;另一个应用是进行反量化和反变换后,得到信号u'k[x,y]。将信号u'k[x,y]与
Figure BDA0002519736450000073
相加得到新的预测信号s* k[x,y],并将s* k[x,y]送至当前图像的缓冲器中保存。s* k[x,y]经过帧内-图像预测获得f(s* k[x,y])。s* k[x,y]经过环路滤波后获得s'k[x,y],并将s'k[x,y]送至解码图像缓冲器中保存,以用于生成重建视频。s'k[x,y]经过运动-补偿预测后获得s'r[x+mx,y+my],s'r[x+mx,y+my]表示参考块,mx和my分别表示运动矢量的水平和竖直分量。
一些视频编码标准,如HEVC,VVC,AVS3,均采用基于块的混合编码框架。它们将原始的视频数据分成一系列的编码块,结合预测、变换和熵编码等视频编码方法,实现视频数据的压缩。其中,运动补偿是视频编码常用的一类预测方法,运动补偿基于视频内容在时域或空域的冗余特性,从已编码的区域导出当前编码块的预测值。这类预测方法包括:帧间预测、帧内块复制预测、帧内串复制预测等。在具体的编码实现中,可能单独或组合使用这些预测方法。对于使用了这些预测方法的编码块,通常需要在码流中显式或隐式的编码至少一个二维的位移矢量,指示当前块(或当前块的同位块)相对它的至少一个参考块的位移。
其中,在不同的预测模式及不同的实现下,位移矢量可能有不同的名称,本公开实施例中统一按照以下方式进行描述:1)帧间预测中的位移矢量称为运动矢量(MV);2)帧内块复制中的位移矢量称为块矢量或者块位移矢量;3)帧内串复制中的位移矢量称为串矢量(String Vector,简称SV)。
以下先对帧间预测中相关的技术进行介绍。
图2示意性示出了相关技术中的帧间预测的示意图。
如图2所示,帧间预测利用视频时间域的相关性,使用邻近已编码图像像素预测当前图像的像素,以达到有效去除视频时域冗余的目的,能够有效节省编码残差数据的比特。其中,P为当前帧,Pr为参考帧,B为当前待编码块,Br是B的参考块。B’与B在图像中的坐标位置相同。
假设Br坐标为(xr,yr),B’坐标为(x,y)。当前待编码块B与其参考块Br之间的位移,称为运动向量(MV),即:
MV=(xr-x,yr-y) (1)
考虑到时域或空域邻近块具有较强的相关性,可以采用MV预测技术进一步减少编码MV所需要的比特。在H.265/HEVC中,帧间预测包含Merge和AMVP两种MV预测技术。
其中,Merge模式会为当前PU建立一个MV候选列表,其中存在5个候选MV(及其对应的参考图像)。遍历这5个候选MV,选取率失真代价最小的作为最优MV。若编解码器依照相同的方式建立MV候选列表,则编码器只需要传输最优MV在MV候选列表中的索引即可。
需要注意的是,HEVC的MV预测技术还有一种skip(跳过)模式,是merge模式的一种特例。在merge模式找到最优MV后,如果当前待编码块和参考块基本一样,那么不需要传输残差数据,只需要传送MV的索引和一个skip flag(指示编码是否是skip模式的标志)。
其中,Merge模式建立的MV候选列表中包含了空域和时域两种情形。
其中,空域最多提供4个候选MV,它的建立如图3所示。当前块空域上的MV候选列表按照A1->B1->B0->A0->B2的顺序建立,其中B2为替补,即当A1,B1,B0,A0中有至少一个不存在时,则需要使用B2的运动信息。即MV候选列表的大小为5,但HEVC中至多使用其中4个(即使五个都存在),并且当其中某一个不可用时,顺序用下一个。
其中,类比空域,空域用相邻块,则时域用相邻帧的同位(对应位置)PU的MV来推测当前位置的MV。时域最多只提供1个候选MV,它的建立如图4所示。帧间预测的图像都要有参考图像,像B帧参考它之前的图像。当前图像叫cur,当前图像的参考图像叫cur_ref,当前图像的同位图像叫col,同位图像的参考图像叫col_ref。假设同位图像col与其参考图像col_ref之间的距离为tb,从当前图像cur与其参考图像cur_ref之间的距离为td,具体实现中,tb可以为同位图像与其参考图像的序号(picture order count,POC)的差值,td可以为当前图像与其参考图像的序号(picture order count,POC)的差值,可以由同位PU的MV按下式伸缩得到:
curMV=td*colMV/tb (2)
其中,curMV和colMV分别表示当前PU和同位PU的MV,这样就能由col(同位)图像推导出当前图像的MV。若同位块上D0位置PU不可用,则用D1位置的同位PU进行替换。
其中,Merge模式建立的MV候选列表中包含了上述空域和时域两种情形,对于BSlice,还包含组合列表的方式。对于B帧,就是需要参考前向帧MV又需要后向帧MV的帧,它有两个MV列表,list0,list。因此,对于B Slice中的PU,由于存在两个MV,其MV候选列表也需要提供两个MVP。HEVC通过将MV候选列表中的前4个候选MV进行两两组合,产生了用于BSlice的组合列表。
上文中提到的merge模式下直接使用MVP作为MV。AMVP模式,类似merge模式,利用空域和时域邻近块的MV相关性,先为当前PU建立候选预测MV列表。AMVP可以利用空间、时间上运动向量的相关性,分别建立空域候选列表以及时域候选列表,再从候选列表中选取最终的MVP。与Merge模式不同,AMVP模式下从候选预测MV列表中选择最有的预测MV即MVP,与当前待编码块通过运动搜索得到的最优MV(即真正的MV)进行差分编码,即编码MVD=MV-MVP。解码端通过建立相同的列表,仅需要MVD与MVP在该列表中的序号,即可计算当前解码块的MV。AMVP候选预测MV列表也包含空域和时域两种情形,不同的是AMVP列表长度仅为2。
如上所述,在HEVC的AMVP模式中,需要对MVD进行编码。在HEVC中,MVD的分辨率由slice_header(片头或者条带头或者切片数据头)中的use_integer_mv_flag控制,当该标志的值为0,MVD以1/4(亮度)像素分辨率进行编码;当该标志的值为1,MVD采用整(亮度)像素分辨率进行编码。
VVC中使用了一种自适应运动矢量精度(Adaptive motion vector resolution,简称AMVR)的方法。该方法允许每个CU自适应的选择编码MVD的分辨率。在普通的AMVP模式中,可选的分辨率包括1/4,1/2,1和4像素。对于具有至少一个非零MVD分量的CU,首先编码一个标志指示是否将四分之一亮度采样MVD精度用于CU。如果该标志为0,则当前CU的MVD采用1/4像素分辨率进行编码。否则,需要编码第二个标志,以指示CU使用了1/2像素分辨率或其他MVD分辨率。否则,编码第三个标志以指示对于CU是否使用1像素分辨率或4像素分辨率。在Affine AMVP模式中,可选的分辨率包括1/16像素,1/4(亮度)像素,1像素。
屏幕图像即由电脑、手机、电视等电子设备产生的图像,主要包含两类内容:一类是计算机生成的非连续色调的内容,包含大量小而尖的线条形状,如文字、图标、按钮和网格等;另一类是摄像机拍摄的包含大量连续色调的内容,例如电影、电视片段、自然图像视频等。相关技术中的基于块的混合编码方式的视频编码标准例如AVS、HEVC,对于包含大量连续内容的自然图像和视频有很高的压缩比,但是对于包含非连续色调内容的屏幕图像压缩效果并不好。
伴随着云计算、移动通信技术和无线显示技术的快速发展,如何在低码率下使屏幕图像在各类电子终端设备上高质量显示,是SCC需要解决的问题。为提高屏幕图像编码性能,开发HEVC标准的SCC版本,并已经采用了一些有利于屏幕图像编码的工具,例如ISC(Intra String Copy,帧内串复制技术/串预测技术/串匹配技术)。
ISC较好地提高了屏幕图像编码效果,其将二维图像逐个编码单元CU一维化。ISC按照某种扫描顺序(光栅扫描、往返扫描和Zig-Zag扫描等)将一个编码块分成一系列像素串或未匹配像素。每个串在当前图像的已编码区域中寻找相同形状的参考串,导出当前串的预测值,通过编码当前串的像素值与预测值之间残差,代替直接编码像素值,能够有效节省比特。
图5给出了帧内串复制的示意图,深色的区域为已编码区域,白色的28个像素为串1,浅色的35个像素为串2,黑色的1个像素表示未匹配像素。如果一个像素在可参考的区域中没有找到对应的参考,即称之为未匹配像素,也称为孤立点,未匹配像素的像素值被直接编码,而不是通过参考串的预测值导出。
ISC技术需要编码当前编码块中各个串对应的串矢量(String Vector,SV)、串长度以及是否有匹配的参考串的标志等。其中,串矢量(SV)表示待编码串(当前串,即当前待编码串)到其参考串的位移。串长度表示该当前串所包含的像素数量。在不同的实现方式中,串长度的编码有多种方式,以下给出几种示例(部分示例可能组合使用):1)直接在码流中编码串的串长度;2)在码流中编码处理该当前串后待处理像素数量,解码端则根据当前编码块的大小P,已处理的像素数量P1,解码得到不包括该当前串后的待处理像素数量P2,计算得到当前串的串长度L,L=P-P1-P2,其中,L、P均为大于0的整数,P1和P2均为大于或等于0的整数;3)在码流中编码一个标志指示该串是否为最后一个串,如果是最后一个串,则根据当前块的大小P,已处理的像素数量P1,计算得到当前串的串长度L=P-P1。如果一个像素在可参考的区域中没有找到对应的参考,则作为未匹配像素,将直接对未匹配像素的像素值进行编码。
以下给出当前方案中ISC的解码流程:
Figure BDA0002519736450000111
Figure BDA0002519736450000121
上述解码过程中,带“_”的字段表示需要解码的语法元素,无“_”且首字母大写的字段表示变量,变量的值可由语法元素解码得到,上述流程中省略了一些本公开实施例无关的细节。
目前的ISC方案存在不利于硬件实现的部分,如存在以下情况:允许大小为4*4的小块使用串预测。由于小块中串的串长度较小,且允许小块能带来的性能较小。
下面通过本公开实施例提供的方案,来解决上述至少一个技术问题。
本公开实施例提供的方法可以应用到使用了ISC的视频编解码器或视频压缩的产品中,可以适用于有损数据压缩的编码和解码,也可以适用于无损数据压缩的编码和解码。其中,编码和解码过程中所涉及到的数据是指以下例举之一或者其组合:
1)一维数据;
2)二维数据;
3)多维数据;
4)图形;
5)图像;
6)图像的序列;
7)视频;
8)三维场景;
9)持续变化的三维场景的序列;
10)虚拟现实的场景;
11)持续变化的虚拟现实的场景的序列;
12)像素形式的图像;
13)图像的变换域数据;
14)二维或二维以上字节的集合;
15)二维或二维以上比特的集合;
16)像素的集合;
17)三分量像素(Y,U,V)的集合;
18)三分量像素(Y,Cb,Cr)的集合;
19)三分量像素(Y,Cg,Co)的集合;
20)三分量像素(R,G,B)的集合;
21)四分量像素(C,M,Y,K)的集合;
22)四分量像素(R,G,B,A)的集合;
23)四分量像素(Y,U,V,A)的集合;
24)四分量像素(Y,Cb,Cr,A)的集合;
25)四分量像素(Y,Cg,Co,A)的集合。
当数据为上述列举出的图像、或者图像的序列、或者视频时,编码块是图像的一个编码区域,应当至少包括以下一种:一组图像、预定数目的若干幅图像、一幅图像、一帧图像、一场图像、图像的子图像、条带、宏块、最大编码单元LCU、编码树单元CTU、编码单元CU。
图6示意性示出了根据本公开的一实施例的视频编码方法的示意图。需要说明的是,本公开实施例中涉及到的方法,可以单独使用,或者组合起来一起使用图6实施例以编码端为例进行介绍。其中,编码端与解码端是对应的,编码端进行一系列分析决定各语法元素的值,对于分析过程,本公开不做限定。
如图6所示,本公开实施例提供的方法可以包括以下步骤。
在步骤S610中,获取当前图像,所述当前图像包括当前编码块。
本公开实施例,编码端的编码器接收原始视频信号,按顺序对原始视频信号中的图像进行编码,这里将当前待编码的图像称之为当前图像,其可以是原始视频信号中的任意一帧图像。在编码端,可以对当前图像进行块划分,例如划分为若干个不重叠的CTU或者LCU。CTU可以继续进行更加精细的划分,得到至少一个CU,这里将当前待编码的当前CU称之为当前编码块,但本公开并不限定于此,例如还可以是PU或者TU。在下面的举例说明中,均以CU为例进行举例说明。当前CU所对应的CTU称之为当前CTU,处于所述当前图像的已编码区域且不属于所述当前CTU的CTU称之为已编码CTU。
本公开实施例中,对当前CU中的像素采用ISC进行编码,按照某种扫描顺序将当前CU中的像素分成串或者未匹配像素。在当前图像的已编码区域中为每个串寻找相同形状的参考串,当前待搜索参考串的串称之为当前串。
在步骤S620中,当所述当前解码块的尺寸满足第二预设条件时,不采用帧内串复制模式对所述当前解码块进行解码,不解码所述当前解码块的串预测标志。
在示例性实施例中,所述当前编码块的尺寸可以包括所述当前编码块的面积。其中,所述第一预设条件可以为所述当前编码块的面积大于第一面积阈值,所述第一面积阈值为大于或等于编码块最小面积且小于或等于编码块最大面积的正整数。
在示例性实施例中,所述当前编码块的尺寸可以包括所述当前编码块的宽度。其中,所述第一预设条件可以为所述当前编码块的宽度大于第一宽度阈值,所述第一宽度阈值为大于或等于编码块最小宽度且小于或等于编码块最大宽度的正整数。
在示例性实施例中,所述当前编码块的尺寸可以包括所述当前编码块的高度。其中,所述第一预设条件可以为所述当前编码块的高度大于第一高度阈值,所述第一高度阈值为大于或等于编码块最小高度且小于或等于编码块最大高度的正整数。
在示例性实施例中,所述当前编码块的尺寸可以包括所述当前编码块的面积。其中,所述第一预设条件可以为所述当前编码块的面积小于第二面积阈值,所述第二面积阈值为大于或等于编码块最小面积且小于或等于编码块最大面积的正整数。
在示例性实施例中,所述当前编码块的尺寸可以包括所述当前编码块的宽度。其中,所述第一预设条件可以为所述当前编码块的宽度小于第二宽度阈值,所述第二宽度阈值为大于或等于编码块最小宽度且小于或等于编码块最大宽度的正整数。
在示例性实施例中,所述当前编码块的尺寸可以包括所述当前编码块的高度。其中,所述第一预设条件可以为所述当前编码块的高度小于第二高度阈值,所述第二高度阈值为大于或等于编码块最小高度且小于或等于编码块最大高度的正整数。
在当前图像的已编码区域中搜索所述当前串的参考串,获得当前串及其参考串之间的SV,用SV和/或串长度表示对应参考串通过预定运算获得当前串中的像素的预测值,通过编码所述当前串的像素值及其预测值的残差,可以减少比特数,提高编码效率。对原始视频信号中的每帧图像进行类似的处理,最终可以产生码流,可以传输至解码端的解码器中。
下面通过具体的实例来举例说明如何在编码端对进行串预测的块大小进行限制:
限制在某些大小的块不使用串预测,设当前CU的宽度为W,高度为H,面积S=W*H,有以下可选的方法:
1)如果当前CU的面积S小于或等于预设的第一面积阈值T11,默认该当前CU不使用串预测,不需要编码“sp_flag”即串预测标志。T11的取值与编码器允许的块大小有关,取值范围可以为编码器允许的块大小(最小尺寸*最小尺寸,最大尺寸*最大尺寸)中的整数。其中,最小尺寸*最小尺寸为编码块最小面积,最大尺寸*最大尺寸为编码块最大面积。
例如,AVS3中,T11可取(4*4,64*64)中的整数。在编码端,可以基于编码性能和复杂度的考虑选择T11。
2)如果当前CU的宽度W小于或等于预设的第一宽度阈值T21,默认该当前CU不使用串预测,不需要编码“sp_flag”。T21的取值与编码器允许的块大小有关,取值范围可以为编码器允许的块大小(最小尺寸,最大尺寸)中的整数。其中,最小尺寸为编码块最小宽度,最大尺寸为编码块最大宽度。
例如,AVS3中,T21可取(4,64)中的整数。在编码端,可以基于编码性能和复杂度的考虑选择T21。
3)如果当前CU的高度H小于或等于预设的第一高度阈值T31,默认该当前CU不使用串预测,不需要编码“sp_flag”。T31的取值与编码器允许的块大小有关,取值范围可以为编码器允许的块大小(最小尺寸,最大尺寸)中的整数。其中,最小尺寸为编码块最小高度,最大尺寸为编码块最大高度。
例如,AVS3中,T31可取(4,64)中的整数。在编码端,可以基于编码性能和复杂度的考虑选择T31。
4)如果当前CU的面积S大于或等于预设的第二面积阈值T41,默认该当前CU不使用串预测,不需要编码“sp_flag”。T41的取值与编码器允许的块大小有关,取值范围可以为编码器允许的块大小(最小尺寸*最小尺寸,最大尺寸*最大尺寸)中的整数。其中,最小尺寸*最小尺寸为编码块最小面积,最大尺寸*最大尺寸为编码块最大面积。
例如,AVS3中,T41可取(4*4,64*64)中的整数。在编码端,可以基于编码性能和复杂度的考虑选择T41。
5)如果当前CU的宽度W大于或等于预设的第二宽度阈值T51,默认该当前CU不使用串预测,不需要编码“sp_flag”。T51的取值与编码器允许的块大小有关,取值范围可以为编码器允许的块大小(最小尺寸,最大尺寸)中的整数。其中,最小尺寸为编码块最小宽度,最大尺寸为编码块最大宽度。
例如,AVS3中,T51可取(4,64)中的整数。在编码端,可以基于编码性能和复杂度的考虑选择T51。
6)如果当前CU的高度H大于或等于预设的第二高度阈值T61,默认该当前CU不使用串预测,不需要编码“sp_flag”。T61的取值与编码器允许的块大小有关,取值范围可以为编码器允许的块大小(最小尺寸,最大尺寸)中的整数。其中,最小尺寸为编码块最小高度,最大尺寸为编码块最大高度。
例如,AVS3中,T61可取(4,64)中的整数。在编码端,可以基于编码性能和复杂度的考虑选择T61。
上述步骤4)-6)中通过限制对大块使用串预测,是考虑到大块使用串预测带来的性能提升较小,该限制一方面可节省语法元素的编码,另一方面可以跳过编码端对该大小的块进行串预测分析。
7)上述方法可组合使用。
以下给出一些具体的例子:
1)宽度等于4且高度等于4的块默认不使用串匹配,不需要编码“sp_flag”。或者
2)宽度等于4或高度等于4的块默认不使用串匹配,不需要编码“sp_flag”。或者
3)面积小于或等于32的块默认不使用串匹配,不需要编码“sp_flag”。
本公开实施例提出的方案,对ISC方案进行了一系列简化,包括块大小的限制,这些方法简化了ISC的硬件实现。对块大小的限制,一方面,可以减少小串的数量,有利于减少内存访问次数。另一方面,编码端可以跳过某些大小的块(例如4*4大小的块)的串预测的分析,降低了复杂度。此外,还可以节省某些块上串预测标志的编码,有利于编码性能的提升。
目前的ISC方案还存在其它不利于硬件实现的部分,如存在以下情况:参考串的位置与待编码的当前CU重叠,造成使串的编码存在依赖。
在一些实施例中,参考串中的像素不与所述当前编码块中的像素重叠。这样可以实现串与串之间无依赖,从而可以降低编码的复杂度,可以实现并行编码。
在一些实施例中,可以允许参考串与当前CU中的已编码像素重叠,且所述参考串中的像素与所述当前编码块中的未编码像素不重叠,这样情况称之为串间依赖,根据扫描顺序处于后面的串需要等待前面的串编码完成后,才能进行编码,但其相比于串内依赖而言,串间依赖的复杂度更小;同时,由于越邻近像素与当前CU中的待编码的当前像素相关性越大,使用邻近像素做参考能够取得更好的预测效果,因此,串间依赖的性能高于无依赖的情况。其中,串内依赖是指参考串的位置与当前CU重叠,且与当前待编码的当前串的位置重叠,这种情况下串只能按照扫描顺序逐像素编码。
在一些实施例中,允许所述参考串中的像素与所述当前编码块中的已编码像素重叠,但不允许参考串中的像素与当前编码块中包含未编码像素的一行重叠(注意是当前编码块的一行,不是当前图像的一行)。如上文所述,在硬件实现时,如果串与串之间完全无参考,则可以并行的编码。对于串间参考,由于存在参考无法完全并行,需要等待被参考的串编码完成后,当前串才能开始编码。增加了该限制条件后,参考串与当前串不在当前编码块的同一行,则编码时可以一行一行的编码,而不用等待。
下面通过具体的实例对上述实施例提供的方案,举例说明在编码端如何限制参考串的位置:
为了便于硬件实现,在编码端,ISC仅使用1个CTU大小的内存,例如假设1个CTU的大小为128*128个样本(在视频编码标准中,“样本”可以用于表述“像素”,可以包括128*128个亮度样本以及对应的色度样本),则ISC被限制为仅使用一个128*128大小的内存。该大小为128*128的内存中,1个64*64大小的空间用于存储当前待编码的64*64的当前CU(图7中标记有Curr的64*64的CU,其对应128*128的当前CTU)中的未编码像素,还有3个64*64大小的空间可用于存储当前图像的已编码区域的3个已编码CU中的已编码像素。因此,ISC仅能在这3个64*64大小的已编码CU中搜索当前CU的当前串的参考串,应满足以下条件:
1)串矢量指向的参考串的像素不应包含当前CU的像素。
例如,假设参考串中的像素的坐标为(xRef_i,yRef_i),xRef_i和yRef_i均为大于或等于0的整数,其中i=0,1,2,…,L-1,L为串长度,L为大于1的正整数,当前CU的左上角位置为(xCb,yCb),xCb和yCb均为大于或等于0的整数,则参考串的像素的坐标应满足条件(xRef_i<xCb||yRef_i<yCb)为真,其中,“||”是“逻辑或”,即在该所参考的坐标系中,如图7所示,参考串位于当前CU的左侧或者上面。
需要说明的是,上述参考串的像素的坐标应满足条件(xRef_i<xCb||yRef_i<yCb)为真,是在编码顺序为从左到右、从上到下的情况下限制的,若编码器/标准按其他顺序进行编码,则可以相应的调整该条件,本公开对此不做限定。类似的,在下文中,均是以编码顺序为从左到右、从上到下的情况下进行举例说明的,因此,左上角为最小坐标或者最小坐标对应的像素,但本公开实施例提供的方案也可以适用于其它编码顺序,对此不做限定。
2)串矢量指向的参考串限制在当前CTU和当前CTU的左边(这里假设所参考的坐标系中,目标侧为左边)的N个CTU(属于已编码CTU)的范围内,N的大小由最大编码单元的尺寸决定,例如可以根据以下公式确定N:
N=(1<<((7-(log2_lcu_size_minus2+2))<<1))-
(((log2_lcu_size_minus2+2)<7)?1:0) (3)
上述公式(3)中,记最大编码单元的宽或高为lcu_size,lcu_size为大于或等于1的正整数,则log2_lcu_size_minus2=log2(lcu_size)-2。“<<”运算符表示左移,用来将一个数的各二进制位全部左移K(K为大于或等于1的正整数)位,高位舍弃,低位补0。(((log2_lcu_size_minus2+2)<7)?1:0)是一个三目运算符,先判断((log2_lcu_size_minus2+2)<7)是否成立,若成立,则(((log2_lcu_size_minus2+2)<7)?1:0)=1;若不成立,则(((log2_lcu_size_minus2+2)<7)?1:0)=0。
例如,若LCU大小为128*128,则lcu_size=128,log2(128)=7,log2_lcu_size_minus2=5,N=(1<<(0<<1))-0=1。如图7所示,为了减少编码端内存和计算复杂度,便于硬件实现,ISC允许只在当前CTU及其左边相邻的左侧CTU中搜索当前CU中的当前串的参考串,每个小方块代表一个64*64的区域。
再例如,若LCU大小等于64*64,则lcu_size=64,log2(64)=6,log2_lcu_size_minus2=4,N=(1<<(1<<1))-1=3,N的值相当于把128*128的块分成4个部分,其中一部分存储当前LCU的像素,其他部分用于存储同一行中当前LCU左边N-1个LCU的像素。同理适用于更小的LCU。
或者,也可以根据以下公式确定N:
N=(1<<((7-log2_lcu_size)<<1))-
(((log2_lcu_size)<7)?1:0) (4)
上述公式(4)中,log2_lcu_size=log2(lcu_size)。先判断((log2_lcu_size)<7)是否成立,若成立,则(((log2_lcu_size)<7)?1:0)=1;若不成立,则(((log2_lcu_size)<7)?1:0)=0。
3)当串矢量指向的参考串中的像素落在当前CTU左边的相邻的最大编码单元(属于已编码CTU),且最大编码单元的尺寸为128*128时,应符合以下限制条件:
3.1)参考串中的像素右(预定方向)移128像素(预定像素)后的位置所在的64*64区域(目标区域)的左上角尚未编码。
3.2)参考串中的像素右移128像素后的位置所在的64*64区域的左上角坐标不应与当前CU的左上角坐标位置相同。
例如,假设参考串中的像素的亮度分量位置为(xRefTL,yRefTL),xRefTL和yRefTL均为大于或等于0的整数,且(((xRefTL+128)/64)*64,(yRefTL/64)*64)不可得,即用于存储3个64*64大小的已编码CU的已编码像素的内存中无法找到这个已编码的像素,则(((xRefTL+128)/64)*64,(yRefTL/64)*64)不应等于当前CU左上角位置(xCb,yCb)。这里的除法是向下取整的。
这里是考虑到硬件设计流水线的处理能力,相关技术中共识的主流处理单元能够处理64*64大小的图像区域,因此,标准制定中一些编码元素也是以64*64的处理能力为上限,例如变换单元的最大值,等等。
如图7所示,根据当前CU在当前CTU中的位置可以分为4种情况:
如图7左上角的图所示,如果当前CU是当前CTU左上角的64*64的块,左侧CTU的右下角64*64的块、左下角64*64的块、右上角64*64的块可以作为当前CU的参考。
如图7右上角的图所示,如果当前CU是当前CTU右上角的64*64的块,除了当前CTU已编码部分,如果相对于当前CTU的(0,64)位置还未编码,当前CU也能参考左侧CTU的右下角64*64的块、左下角64*64的块。
如图7左下角的图所示,如果当前CU是当前CTU左下角的64*64的块,除了当前CTU已编码部分,当前CU也能参考左侧CTU的右下角64*64的块。
如图7右下角的图所示,如果当前CU是当前CTU右下角的64*64的块,它只能参考当前CTU已编码部分。
4)当串矢量指向的参考串中的像素落在当前CTU左边相邻的最大编码单元(属于已编码CTU),且最大编码单元的尺寸小于或等于64*64时,应符合以下限制条件:
4.1)参考串中的像素右移N*lcu_size像素后的位置所在的CTU区域的左上角尚未编码。
4.2)参考串中的像素右移N*lcu_size像素后的位置所在的CTU区域的左上角不应与当前CU的左上角坐标相同。
例如,假设参考串中的像素的亮度分量位置为(xRefTL,yRefTL),(((xRefTL+lcu_size*N)/lcu_size)*lcu_size,(yRefTL/lcu_size)*lcu_size)不可得,则(((xRefTL+lcu_size*N)/lcu_size)*lcu_size,(yRefTL/lcu_size)*lcu_size)不应等于当前块左上角位置(xCb,yCb)。
上述步骤3)给出了最大编码单元为128*128时的限制,上述步骤4)给出最大编码单元的尺寸小于或等于64*64时的限制,使得在编码过程中能够充分利用128*128的内存。
需要说明的是,上述举例说明中均以内存大小为128*128为例的,编码时LCU的大小可以通过参数设计。但对硬件设计来说,如果已经设计了128*128的存储器,当LCU小于128*128时,应该充分利用该存储器。
5)对于128*128大小的CTU,串矢量指向的参考串中所有的像素只能来自同一个64*64对齐区域,即参考串中所有样本位置,要求局限在同一个64*64对齐的参考像素区域内。以图7右下角的图为例,左侧128*128的CTU分为了4个64*64的CU,参考串中所有的像素不能跨过64*64的CU的边界。
对于非128*128大小的CTU,参考串中所有的像素将来自同一个CTU,即参考串不能跨过CTU的边界。这种限制降低了内存访问次数,编码端进行ISC预测时,需要访问的64*64大小的内存空间的个数只需要1个。
6)串矢量指向的参考串位置不应超出图像、片、条带等独立编码区域的边界。其中,片是AVS3中的概念,片是图像中的矩形区域,包含若干最大编码单元在图像内的部分,片之间不应重叠。条带是HEVC中的概念。
7)串矢量指向的参考串位置中的任何一个参考串样本,不应与未编码区域或当前正在编码的编码块区域(即当前CU)重叠。
8)可选的,串矢量指向的参考串位置中的任何一个参考串样本的外接矩形,不应与未编码区域或当前正在编码的编码块区域重叠。这是一种简化的方式,可通过参考串的外接矩形的四个角点来判断参考串的位置是否满足限制。外接矩形与未编码区域或当前正在编码的编码块区域不重叠,则表示参考串也满足与未编码区域或当前正在编码的编码块区域不重叠的限制。
本公开实施例提出的方案,对ISC方案进行了一系列简化,包括参考串位置的限制,这些方法简化了ISC的硬件实现。一方面,限定了参考串位置后,串与串之间不存在依赖,串可以并行的编码。另一方面,还可以限制参考串仅在一个128*128大小的内存区域中使用。
目前的ISC方案还存在其它不利于硬件实现的部分,如仅在编码端限制了串的数量与孤立点(未匹配像素)的数量之和不大于CU像素数量的四分之一。这样会导致串的数量较多,由此导致需要编码的语法元素较多。
下面通过具体的实例来举例说明如何在编码端对串数量及未匹配像素的数量进行限制:
设当前CU中已编码串数量为N1,未匹配像素数量为N2,N1和N2均为大于或等于0的整数,以下的方式可以单独或以任何形式组合使用:
A)限制N1+N2小于或等于第一数量阈值T1。其中,T1的取值范围可以为[1,W*H]中的整数,W为当前CU的宽度,H为当前CU的高度,W和H均为大于或等于1的正整数。在本实施例中,为了能够避免编码块被分割得太细,导致复杂度增加,限制T1的取值范围小于或等于W*H的四分之一。而且,根据实验结果,T1优选为4。其中,编码端有以下可选的方式:
i.当N1+N2等于T1-1时,若当前CU中剩余像素数量NR(NR为大于或等于0的整数)等于1,则无需编码“sp_is_matched_flag”,即无需编码匹配标志,以用于确定下一个剩余像素的类型,可以直接确认该剩余像素为未匹配像素。
ii.当N1+N2等于T1-1时,若当前CU中剩余像素的数量NR大于1,则无需编码“sp_is_matched_flag”,即无需编码匹配标志,以用于确定下一个剩余像素的类型,可以直接确认剩余像素为一个串,且串长度为NR。
iii.上述步骤ii.的另一种方式,当N1+N2等于T1-1时,若当前CU中剩余像素数量NR大于1,则编码“sp_is_matched_flag”,如果剩余像素为一个串,则编码“sp_is_matched_flag”为第一值例如1(但本公开并不限定于此,可以根据实际情况限定),且串长度为NR。
B)限制N1小于或等于第二数量阈值T2。其中,T2的取值范围可以为[1,W*H]中的整数。有以下可选的方式:
i.如果N1等于T2-1,且确认下一个剩余像素为串的起点,则编码“sp_is_matched_flag”为第二值(这里假设为1但本公开并不限定于此,可以根据实际情况限定),指示当前CU中的剩余像素为一个串。
ii.如果N1等于T2-1,则直接确认剩余像素为一个串。
iii.如果N1等于T2,则直接确认剩余像素都为未匹配像素。
C)限制N2小于或等于第三数量阈值T3。其中,T3的取值范围可以为[1,W*H]中的整数。有以下可选的方式:
i.如果N2等于T3,不用编码“sp_is_matched_flag”和串长度,直接将当前CU的剩余像素作为一个串。
ii.如果N2等于T3,不用编码“sp_is_matched_flag”,直接确认当前CU的剩余像素的类型都为串,并编码每个串的串长度。
D)限制N1+N2大于或等于第四数量阈值T4。其中,T4的取值范围可以为[1,W*H]中的整数。本实施例中,T4优选为大于2的正整数。这里限制N1+N2大于或等于T4,考虑的是通常串预测中串数量不仅为1,该限制能够节省语法元素的编码。编码端有以下可选的方式:
i.如果N1+N2小于T4,且通过编码“sp_is_matched_flag”为第三值例如1(但本公开并不限定于此,可以根据实际情况限定),以用于确认下一个剩余像素为串的起点,则可直接判断该串不为最后一个串,因此无需编码“sp_last_len_flag”来确认是否为最后一个串,从而提升编码效率。
E)限制N1大于或等于第四数量阈值T4。这里限制N1大于或等于T4,考虑的是通常串预测中串数量不仅为1,该限制能够节省语法元素的编码。有以下可选的方式:
i.如果N1小于T4,可直接判断该串不为最后一个串,而无需编码“sp_last_len_flag”来确认是否为最后一个串。
本公开实施例中,可以根据当前编码块的大小来调整上述第一至第四数量阈值中的任意一个或者全部的阈值大小。例如,当当前编码块的大小即宽*高=4*4时,调整第一数量阈值和/或第二数量阈值等于1,则编码至所述已编码串数量与所述已编码未匹配像素数量之和等于1-1=0时,若当前编码块中的剩余像素数量大于1,则确认当前编码块中的剩余像素为一个串,即在当前编码块的大小为4*4时,限制整个当前编码块只能为一个串。
本公开实施例提出的方案,对ISC方案进行了一系列简化,包括参考串位置的限制,串数量的限制,块大小的限制,这些方法简化了ISC的硬件实现:
1)限定了参考串位置后,串与串之间不存在依赖,串可以并行的编码。除此以外,类似IBC,还可以限制参考串仅在一个128*128大小的内存区域中使用。
2)对串数量的限制,可以使串的数量更少,减少内存访问次数。另一方面可以节省一些语法元素的编码,能够提高编码性能。
3)对块大小的限制,一方面,可以减少小串的数量,有利于减少内存访问次数。另一方面,编码端可以跳过某些大小的块(例如4*4大小的块)的串预测的分析,降低了复杂度。此外,还可以节省某些块上串预测标志的编码,有利于编码性能的提升。
图8示意性示出了根据本公开的一实施例的视频解码方法的示意图。需要说明的是,本公开实施例中涉及到的方法,可以单独使用,或者组合起来一起使用图8实施例以解码端为例进行介绍。
如图8所示,本公开实施例提供的方法可以包括以下步骤。
在步骤S810中,获取当前图像的码流,所述码流包括当前解码块。
在下面的实施例中,均以当前解码块为当前CU为例进行举例说明,但本公开并不限定于此。
在步骤S820中,当所述当前解码块的尺寸满足第二预设条件时,不采用帧内串复制模式对所述当前解码块进行解码,不解码所述当前解码块的串预测标志。
在步骤S830中,当所述当前解码块的尺寸不满足第二预设条件时,采用帧内串复制模式对所述当前解码块进行解码,解码所述当前解码块的串预测标志。
在示例性实施例中,所述当前解码块的尺寸可以包括所述当前解码块的面积。其中,所述第二预设条件可以为所述当前解码块的面积小于或等于第一面积阈值,所述第一面积阈值为大于或等于解码块最小面积且小于或等于解码块最大面积的正整数。
在示例性实施例中,所述当前解码块的尺寸可以包括所述当前解码块的宽度。其中,所述第二预设条件可以为所述当前解码块的宽度小于或等于第一宽度阈值,所述第一宽度阈值为大于或等于解码块最小宽度且小于或等于解码块最大宽度的正整数。
在示例性实施例中,所述当前解码块的尺寸可以包括所述当前解码块的高度。其中,所述第二预设条件可以为所述当前解码块的高度小于或等于第一高度阈值,所述第一高度阈值为大于或等于解码块最小高度且小于或等于解码块最大高度的正整数。
在示例性实施例中,所述当前解码块的尺寸可以包括所述当前解码块的面积。其中,所述第二预设条件可以为所述当前解码块的面积大于第二面积阈值,所述第二面积阈值为大于或等于解码块最小面积且小于或等于解码块最大面积的正整数。
在示例性实施例中,所述当前解码块的尺寸可以包括所述当前解码块的宽度。其中,所述第二预设条件可以为所述当前解码块的宽度大于第二宽度阈值,所述第二宽度阈值为大于或等于解码块最小宽度且小于或等于解码块最大宽度的正整数。
在示例性实施例中,所述当前解码块的尺寸可以包括所述当前解码块的高度。其中,所述第二预设条件可以为所述当前解码块的高度大于第二高度阈值,所述第二高度阈值为大于或等于解码块最小高度且小于或等于解码块最大高度的正整数。
下面通过具体的实例来举例说明如何在解码端对进行串预测的块大小进行限制:
限制在某些大小的块不使用串预测,设当前CU的宽度为W,高度为H,面积S=W*H,有以下可选的方法:
1)如果当前CU的面积S小于或等于预设的第一面积阈值T11,默认该当前CU不使用串预测,不需要解码“sp_flag”即串预测标志。T11的取值与编码器允许的块大小有关,取值范围可以为编码器允许的块大小(最小尺寸*最小尺寸,最大尺寸*最大尺寸)中的整数。其中,最小尺寸*最小尺寸为解码块最小面积,最大尺寸*最大尺寸为解码块最大面积。
例如,AVS3中,T11可取(4*4,64*64)中的整数。可以基于编码性能和复杂度的考虑选择T11。
2)如果当前CU的宽度W小于或等于预设的第一宽度阈值T21,默认该当前CU不使用串预测,不需要解码“sp_flag”。T21的取值与编码器允许的块大小有关,取值范围可以为编码器允许的块大小(最小尺寸,最大尺寸)中的整数。其中,最小尺寸为解码块最小宽度,最大尺寸为解码块最大宽度。
3)如果当前CU的高度H小于或等于预设的第一高度阈值T31,默认该当前CU不使用串预测,不需要解码“sp_flag”。T31的取值与编码器允许的块大小有关,取值范围可以为编码器允许的块大小(最小尺寸,最大尺寸)中的整数。其中,最小尺寸为解码块最小高度,最大尺寸为解码块最大高度。
4)如果当前CU的面积S大于或等于预设的第二面积阈值T41,默认该当前CU不使用串预测,不需要解码“sp_flag”。T41的取值与编码器允许的块大小有关,取值范围可以为编码器允许的块大小(最小尺寸*最小尺寸,最大尺寸*最大尺寸)中的整数。其中,最小尺寸*最小尺寸为解码块最小面积,最大尺寸*最大尺寸为解码块最大面积。
5)如果当前CU的宽度W大于或等于预设的第二宽度阈值T51,默认该当前CU不使用串预测,不需要解码“sp_flag”。其中,最小尺寸为解码块最小宽度,最大尺寸为解码块最大宽度。
6)如果当前CU的高度H大于或等于预设的第二高度阈值T61,默认该当前CU不使用串预测,不需要解码“sp_flag”。T61的取值与编码器允许的块大小有关,取值范围可以为编码器允许的块大小(最小尺寸,最大尺寸)中的整数。其中,最小尺寸为解码块最小高度,最大尺寸为解码块最大高度。
上述步骤4)-6)中通过限制对大块使用串预测,是考虑到大块使用串预测带来的性能提升较小,该限制一方面可节省语法元素的解码,另一方面可以跳过解码端对该大小的块进行串预测分析。
7)上述方法可组合使用。
以下给出一些具体的例子:
1)宽度等于4且高度等于4的块默认不使用串匹配,不需要解码“sp_flag”。或者
2)宽度等于4或高度等于4的块默认不使用串匹配,不需要解码“sp_flag”。或者
3)面积小于或等于32的块默认不使用串匹配,不需要解码“sp_flag”。
目前的ISC方案还存在其它不利于硬件实现的部分,如存在以下情况:参考串的位置与待重建的当前CU重叠,造成使串的重建存在依赖。例如,假设将一个CU分为两个串,分别称之为串1和串2,且串2参考了串1。这种情况下,串2需要等待串1重建完成后,才能开始重建。
在一些实施例中,参考串中的像素不与所述当前解码块中的像素重叠。这样可以实现串与串之间无依赖,从而可以降低解码的复杂度,可以实现并行解码。
在一些实施例中,允许参考串与当前CU中的已重建像素重叠,且所述参考串中的像素与所述当前解码块中的未重建像素不重叠,这样情况称之为串间依赖,根据扫描顺序处于后面的串需要等待前面的串解码完成后,才能进行解码,但其相比于串内依赖而言,串间依赖的复杂度更小;同时,由于越邻近像素与当前CU中的待解码的当前像素相关性越大,使用邻近像素做参考能够取得更好的预测效果,因此,串间依赖的性能高于无依赖的情况。其中,串内依赖是指参考串的位置与当前CU重叠,且与当前待解码的当前串的位置重叠,这种情况下串只能按照扫描顺序逐像素重建。
在一些实施例中,允许所述参考串中的像素与所述当前解码块中的已重建像素重叠,但不允许参考串中的像素与当前解码块中包含未重建像素的一行重叠(注意是当前解码块的一行,不是当前图像的一行)。如上文所述,在硬件实现时,如果串与串之间完全无参考,则可以并行的重建。对于串间参考,由于存在参考无法完全并行,需要等待被参考的串重建完成后,当前串才能开始重建。增加了该限制条件后,参考串与当前串不在当前解码块的同一行,则重建时可以一行一行的重建,而不用等待。
下面通过具体的实例对上述实施例提供的方案,举例说明在解码端如何根据限制的参考串的位置进行串预测的解码:
为了便于硬件实现,在解码端,ISC仅使用1个CTU大小的内存,例如假设1个CTU的大小为128*128,则ISC被限制为仅使用一个128*128大小的内存。该大小为128*128的内存中,1个64*64大小的空间用于存储当前待重建的64*64的当前CU中的未重建像素,还有3个64*64大小的空间可用于存储当前图像的已解码区域的3个已解码CU中的已重建像素。因此,ISC仅能在这3个64*64大小的已解码CU中搜索当前CU的当前串的参考串,应满足以下条件:
1)串矢量指向的参考串的像素不应包含当前CU的像素。
例如,假设参考串中的像素的坐标为(xRef_i,yRef_i),xRef_i和yRef_i均为大于或等于0的整数,其中i=0,1,2,…,L-1,L为串长度,L为大于1的正整数,当前CU的左上角位置为(xCb,yCb),xCb和yCb均为大于或等于0的整数,则参考串的像素的坐标应满足条件(xRef_i<xCb||yRef_i<yCb)为真,其中,“||”是“逻辑或”,即在该所参考的坐标系中,参考串位于当前CU的左侧或者上面。
需要说明的是,上述参考串的像素的坐标应满足条件(xRef_i<xCb||yRef_i<yCb)为真,是在解码顺序为从左到右、从上到下的情况下限制的,若解码器/标准按其他顺序进行解码,则可以相应的调整该条件,本公开对此不做限定。类似的,在下文中,均是以解码顺序为从左到右、从上到下的情况下进行举例说明的,因此,左上角为最小坐标或者最小坐标对应的像素,但本公开实施例提供的方案也可以适用于其它解码顺序,对此不做限定。
2)串矢量指向的参考串限制在当前CTU和当前CTU的左边(这里假设所参考的坐标系中,目标侧为左边)的N个CTU(属于已编码CTU)的范围内,N的大小由最大编码单元的尺寸决定,例如可以根据上述公式(3)或(4)确定N。
3)当串矢量指向的参考串中的像素落在当前CTU左边的相邻的最大编码单元(属于已编码CTU),且最大编码单元的尺寸为128*128时,应符合以下限制条件:
3.1)参考串中的像素右移128像素后的位置所在的64*64区域的左上角尚未重建。
3.2)参考串中的像素右移128像素后的位置所在的64*64区域的左上角坐标不应与当前CU的左上角坐标位置相同。
例如,假设参考串中的像素的亮度分量位置为(xRefTL,yRefTL),且(((xRefTL+128)/64)*64,(yRefTL/64)*64)不可得,即用于存储3个64*64大小的已重建CU的已重建像素的内存中无法找到这个已重建像素,则(((xRefTL+128)/64)*64,(yRefTL/64)*64)不应等于当前CU左上角位置(xCb,yCb)。这里的除法是向下取整的。
4)当串矢量指向的参考串中的像素落在当前CTU左边相邻的最大编码单元(属于已编码CTU),且最大编码单元的尺寸小于或等于64*64时,应符合以下限制条件:
4.1)参考串中的像素右移N*lcu_size像素后的位置所在的CTU区域的左上角尚未重建。
4.2)参考串中的像素右移N*lcu_size像素后的位置所在的CTU区域的左上角不应与当前CU的左上角坐标相同。
即:假设参考串中的像素的亮度分量位置为(xRefTL,yRefTL),(((xRefTL+lcu_size*N)/lcu_size)*lcu_size,(yRefTL/lcu_size)*lcu_size)不可得;(((xRefTL+lcu_size*N)/lcu_size)*lcu_size,(yRefTL/lcu_size)*lcu_size)不应等于当前块左上角位置(xCb,yCb)。
上述步骤3)给出了最大编码单元为128*128时的限制,上述步骤4)给出最大编码单元的尺寸小于或等于64*64时的限制,使得在解码过程中能够充分利用128*128的内存。
5)对于128*128大小的CTU,串矢量指向的参考串中所有的像素只能来自同一个64*64对齐区域,即参考串中所有样本位置,要求局限在同一个64*64对齐的参考像素区域内。以图7右下角的图为例,左侧128*128的CTU分为了4个64*64的CU,参考串中所有的像素不能跨过64*64的CU的边界。
对于非128*128大小的CTU,参考串中所有的像素将来自同一个CTU,即参考串不能跨过CTU的边界。这种限制降低了内存访问次数,解码端进行ISC预测时,需要访问的64*64大小的内存空间的个数只需要1个。
6)串矢量指向的参考串位置不应超出图像、片、条带等独立解码区域的边界。
7)串矢量指向的参考串位置中的任何一个参考串样本,不应与未重建区域或当前正在重建的编码块区域重叠。
8)可选的,串矢量指向的参考串位置中的任何一个参考串样本的外接矩形,不应与未重建区域或当前正在重建的编码块区域重叠。这是一种简化的方式,可通过参考串的外接矩形的四个角点来判断参考串的位置是否满足限制。外接矩形与未重建区域或当前正在重建的编码块区域不重叠,则表示参考串也满足与未重建区域或当前正在重建的编码块区域不重叠的限制。
下面通过具体的实例来举例说明如何在解码端对串数量及未匹配像素的数量进行限制:
最大串数量限制:设当前块中已解码串数量为N1,未匹配像素数量为N2,N1和N2均为大于或等于0的整数,以下的方式可以单独或以任何形式组合使用:
A)限制N1+N2小于或等于第一数量阈值T1。其中,T1的取值范围可以为[1,W*H]中的整数,W为当前CU的宽度,H为当前CU的高度,W和H均为大于或等于1的正整数。在本实施例中,为了能够避免编码块被分割得太细,导致复杂度增加,限制T1的取值范围小于或等于W*H的四分之一。而且,根据实验结果,T1优选为4。其中,解码端有以下可选的方式:
i.当N1+N2等于T1-1时,若当前CU中剩余像素的数量NR(NR为大于或等于0的整数)等于1,则无需解码“sp_is_matched_flag”,即无需解码匹配标志,以用于确定下一个剩余像素的类型,可以直接确认该剩余像素为未匹配像素。
ii.当N1+N2等于T1-1时,若当前CU中剩余像素的数量NR大于1,则无需解码“sp_is_matched_flag”,即无需解码匹配标志,以用于确定下一个剩余像素的类型,可以直接确认剩余像素为一个串,且串长度为NR。
iii.上述步骤ii.的另一种方式,当N1+N2等于T1-1时,若当前CU中剩余像素数量NR大于1,则解码“sp_is_matched_flag”,如果解码获得“sp_is_matched_flag”为第一值例如1(但本公开并不限定于此,可以根据实际情况限定),则直接确认当前CU的剩余像素为一个串,串长度为NR。
B)限制N1小于或等于第二数量阈值T2。其中,T2的取值范围可以为[1,W*H]中的整数。有以下可选的方式:
i.如果N1等于T2-1,且解码“sp_is_matched_flag”为第二值例如1(但本公开并不限定于此,可以根据实际情况限定),则确认下一个剩余像素为串的起点,直接确认当前CU的剩余像素为一个串。
ii.如果N1等于T2-1,则不需解码“sp_is_matched_flag”,直接确认当前CU中的剩余像素为一个串。
iii.如果N1等于T2,则不需解码“sp_is_matched_flag”,直接确认当前CU中的剩余像素都为未匹配像素。
C)限制N2小于或等于第三数量阈值T3。其中,T3的取值范围可以为[1,W*H]中的整数。有以下可选的方式:
i.如果N2等于T3,不用解码“sp_is_matched_flag”和串长度,直接将当前CU的剩余像素作为一个串。
ii.如果N2等于T3,不用解码“sp_is_matched_flag”,直接确认当前CU的剩余像素的类型都为串,并解码每个串的串长度。
D)限制N1+N2大于或等于第四数量阈值T4。其中,T4的取值范围可以为[1,W*H]中的整数。本实施例中,T4优选为大于2的正整数。这里限制N1+N2大于或等于T4,考虑的是通常串预测中串数量不仅为1,该限制能够节省语法元素的解码。解码端有以下可选的方式:
i.如果N1+N2小于T4,且通过解码“sp_is_matched_flag”确认下一个剩余像素为串的起点,例如若“sp_is_matched_flag”解码为第三值例如1(但本公开并不限定于此,可以根据实际情况限定),此时,则可直接判断该串不为最后一个串,因此无需解码“sp_last_len_flag”来确认是否为最后一个串,从而提升解码效率。
E)限制N1大于或等于第四数量阈值T4。这里限制N1大于或等于T4,考虑的是通常串预测中串数量不仅为1,该限制能够节省语法元素的解码。有以下可选的方式:
i.如果N1小于T4,可直接判断该串不为最后一个串,而无需解码“sp_last_len_flag”来确认是否为最后一个串。
本公开实施例中,可以根据当前解码块的大小来调整上述第一至第四数量阈值中的任意一个或者全部的阈值大小。例如,当当前解码块的大小即宽*高=4*4时,调整第一数量阈值和/或第二数量阈值等于1,则解码至所述已解码串数量与所述已解码未匹配像素数量之和等于1-1=0时,若当前解码块中的剩余像素数量大于1,则确认当前解码块中的剩余像素为一个串,即在当前解码块的大小为4*4时,限制整个当前解码块只能为一个串。此时,不用解码sp_dir_flag、sp_is_matched_flag、sp_special_len_flag、SpLength、next_remaining_pixel_minus1和SpLength,只需要解码串矢量(即上述解码流程图中的decode_sv()),由此简化了解码流程。
本公开实施例提出的方案,对ISC方案进行了一系列简化,包括参考串位置的限制,串数量的限制,块大小的限制,这些方法简化了ISC的硬件实现:
1)限定了参考串位置后,串与串之间不存在依赖,串可以并行的重建。除此以外,类似IBC,还可以限制参考串仅在一个128*128大小的内存区域中使用。
2)对串数量的限制,可以使串的数量更少,减少内存访问次数。另一方面可以节省一些语法元素的解码,能够提高解码性能。
3)对块大小的限制,一方面,可以减少小串的数量,有利于减少内存访问次数。另一方面,编码端可以跳过某些大小的块(例如4*4大小的块)的串预测的分析,降低了复杂度。此外,还可以节省某些块上串预测标志的解码,有利于解码性能的提升。
进一步的,本公开实施例还提供一种视频编码装置,可以应用于编码端/编码器,所述装置可以包括:当前图像获取单元,可以用于获取当前图像,所述当前图像包括当前编码块;第一块大小限制单元,可以用于当所述当前编码块的尺寸满足第一预设条件时,对所述当前编码块采用帧内串复制模式进行编码,编码所述当前编码块的串预测标志。
在示例性实施例中,所述当前编码块的尺寸可以包括所述当前编码块的面积。其中,所述第一预设条件可以为所述当前编码块的面积大于第一面积阈值,所述第一面积阈值为大于或等于编码块最小面积且小于或等于编码块最大面积的正整数。
在示例性实施例中,所述当前编码块的尺寸可以包括所述当前编码块的宽度。其中,所述第一预设条件可以为所述当前编码块的宽度大于第一宽度阈值,所述第一宽度阈值为大于或等于编码块最小宽度且小于或等于编码块最大宽度的正整数。
在示例性实施例中,所述当前编码块的尺寸可以包括所述当前编码块的高度。其中,所述第一预设条件可以为所述当前编码块的高度大于第一高度阈值,所述第一高度阈值为大于或等于编码块最小高度且小于或等于编码块最大高度的正整数。
在示例性实施例中,所述当前编码块的尺寸可以包括所述当前编码块的面积。其中,所述第一预设条件可以为所述当前编码块的面积小于第二面积阈值,所述第二面积阈值为大于或等于编码块最小面积且小于或等于编码块最大面积的正整数。
在示例性实施例中,所述当前编码块的尺寸可以包括所述当前编码块的宽度。其中,所述第一预设条件可以为所述当前编码块的宽度小于第二宽度阈值,所述第二宽度阈值为大于或等于编码块最小宽度且小于或等于编码块最大宽度的正整数。
在示例性实施例中,所述当前编码块的尺寸可以包括所述当前编码块的高度。其中,所述第一预设条件可以为所述当前编码块的高度小于第二高度阈值,所述第二高度阈值为大于或等于编码块最小高度且小于或等于编码块最大高度的正整数。
本公开实施例提供的视频编码装置中的各个单元的具体实现可以参照上述视频编码方法中的内容,在此不再赘述。
进一步的,本公开实施例还提供一种视频解码装置,所述装置可应用于解码端/解码器,所述装置可以包括:码流获取单元,可以用于获取当前图像的码流,所述码流包括当前解码块;第二块大小限制单元,可以用于当所述当前解码块的尺寸满足第二预设条件时,不采用帧内串复制模式对所述当前解码块进行解码,不解码所述当前解码块的串预测标志;当所述当前解码块的尺寸不满足第二预设条件时,采用帧内串复制模式对所述当前解码块进行解码,解码所述当前解码块的串预测标志。
在示例性实施例中,所述当前解码块的尺寸可以包括所述当前解码块的面积。其中,所述第二预设条件可以为所述当前解码块的面积小于或等于第一面积阈值,所述第一面积阈值为大于或等于解码块最小面积且小于或等于解码块最大面积的正整数。
在示例性实施例中,所述当前解码块的尺寸可以包括所述当前解码块的宽度。其中,所述第二预设条件可以为所述当前解码块的宽度小于或等于第一宽度阈值,所述第一宽度阈值为大于或等于解码块最小宽度且小于或等于解码块最大宽度的正整数。
在示例性实施例中,所述当前解码块的尺寸可以包括所述当前解码块的高度。其中,所述第二预设条件可以为所述当前解码块的高度小于或等于第一高度阈值,所述第一高度阈值为大于或等于解码块最小高度且小于或等于解码块最大高度的正整数。
在示例性实施例中,所述当前解码块的尺寸可以包括所述当前解码块的面积。其中,所述第二预设条件可以为所述当前解码块的面积大于第二面积阈值,所述第二面积阈值为大于或等于解码块最小面积且小于或等于解码块最大面积的正整数。
在示例性实施例中,所述当前解码块的尺寸可以包括所述当前解码块的宽度。其中,所述第二预设条件可以为所述当前解码块的宽度大于第二宽度阈值,所述第二宽度阈值为大于或等于解码块最小宽度且小于或等于解码块最大宽度的正整数。
在示例性实施例中,所述当前解码块的尺寸可以包括所述当前解码块的高度。其中,所述第二预设条件可以为所述当前解码块的高度大于第二高度阈值,所述第二高度阈值为大于或等于解码块最小高度且小于或等于解码块最大高度的正整数。
本公开实施例提供的视频解码装置中的各个单元的具体实现可以参照上述视频编码方法和视频解码方法中的内容,在此不再赘述。
应当注意,尽管在上文详细描述中提及了用于动作执行的设备的若干单元,但是这种划分并非强制性的。实际上,根据本公开的实施方式,上文描述的两个或更多单元的特征和功能可以在一个单元中具体化。反之,上文描述的一个单元的特征和功能可以进一步划分为由多个单元来具体化。
本公开实施例提供了一种计算机可读存储介质,其上存储有计算机程序,所述程序被处理器执行时实现如上述实施例中所述的视频编码方法。
本公开实施例提供了一种计算机可读存储介质,其上存储有计算机程序,所述程序被处理器执行时实现如上述实施例中所述的视频解码方法。
本公开实施例提供了一种电子设备,包括:至少一个处理器;存储装置,配置为存储至少一个程序,当所述至少一个程序被所述至少一个处理器执行时,使得所述至少一个处理器实现如上述实施例中所述的视频编码方法。
本公开实施例提供了一种电子设备,包括:至少一个处理器;存储装置,配置为存储至少一个程序,当所述至少一个程序被所述至少一个处理器执行时,使得所述至少一个处理器实现如上述实施例中所述的视频解码方法。
图9示出了适于用来实现本公开实施例的电子设备的结构示意图。
需要说明的是,图9示出的电子设备900仅是一个示例,不应对本公开实施例的功能和使用范围带来任何限制。
如图9所示,电子设备900包括中央处理单元(CPU,Central Processing Unit)901,其可以根据存储在只读存储器(ROM,Read-Only Memory)902中的程序或者从储存部分908加载到随机访问存储器(RAM,Random Access Memory)903中的程序而执行各种适当的动作和处理。在RAM 903中,还存储有系统操作所需的各种程序和数据。CPU 901、ROM 902以及RAM 903通过总线904彼此相连。输入/输出(input/output,I/O)接口905也连接至总线904。
以下部件连接至I/O接口905:包括键盘、鼠标等的输入部分906;包括诸如阴极射线管(CRT,Cathode Ray Tube)、液晶显示器(LCD,Liquid Crystal Display)等以及扬声器等的输出部分907;包括硬盘等的储存部分908;以及包括诸如LAN(Local Area Network,局域网)卡、调制解调器等的网络接口卡的通信部分909。通信部分909经由诸如因特网的网络执行通信处理。驱动器910也根据需要连接至I/O接口905。可拆卸介质911,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器910上,以便于从其上读出的计算机程序根据需要被安装入储存部分908。
特别地,根据本公开的实施例,下文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在计算机可读存储介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分909从网络上被下载和安装,和/或从可拆卸介质911被安装。在该计算机程序被中央处理单元(CPU)901执行时,执行本申请的方法和/或装置中限定的各种功能。
需要说明的是,本公开所示的计算机可读存储介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有至少一个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM(Erasable Programmable Read Only Memory,可擦除可编程只读存储器)或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本公开中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读存储介质,该计算机可读存储介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读存储介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、RF(Radio Frequency,射频)等等,或者上述的任意合适的组合。
附图中的流程图和框图,图示了按照本公开各种实施例的方法、装置和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含至少一个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本公开实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现,所描述的单元也可以设置在处理器中。其中,这些单元的名称在某种情况下并不构成对该单元本身的限定。
作为另一方面,本申请还提供了一种计算机可读存储介质,该计算机可读存储介质可以是上述实施例中描述的电子设备中所包含的;也可以是单独存在,而未装配入该电子设备中。上述计算机可读存储介质承载有一个或者多个程序,当上述一个或者多个程序被一个该电子设备执行时,使得该电子设备实现如下述实施例中所述的方法。例如,所述的电子设备可以实现如图6或图8所示的各个步骤。
通过以上的实施方式的描述,本领域的技术人员易于理解,这里描述的示例实施方式可以通过软件实现,也可以通过软件结合必要的硬件的方式来实现。因此,根据本公开实施方式的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM,U盘,移动硬盘等)中或网络上,包括若干指令以使得一台计算设备(可以是个人计算机、服务器、触控终端、或者网络设备等)执行根据本公开实施方式的方法。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本公开的其它实施方案。本申请旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由下面的权利要求指出。
应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。

Claims (15)

1.一种视频编码方法,其特征在于,包括:
获取当前图像,所述当前图像包括当前编码块;
当所述当前编码块的尺寸满足第一预设条件时,对所述当前编码块采用帧内串复制模式进行编码,编码所述当前编码块的串预测标志。
2.根据权利要求1所述的视频编码方法,其特征在于,所述当前编码块的尺寸包括所述当前编码块的面积;其中,
所述第一预设条件为所述当前编码块的面积大于第一面积阈值,所述第一面积阈值为大于或等于编码块最小面积且小于或等于编码块最大面积的正整数。
3.根据权利要求1所述的视频编码方法,其特征在于,所述当前编码块的尺寸包括所述当前编码块的宽度;其中,
所述第一预设条件为所述当前编码块的宽度大于第一宽度阈值,所述第一宽度阈值为大于或等于编码块最小宽度且小于或等于编码块最大宽度的正整数。
4.根据权利要求1所述的视频编码方法,其特征在于,所述当前编码块的尺寸包括所述当前编码块的高度;其中,
所述第一预设条件为所述当前编码块的高度大于第一高度阈值,所述第一高度阈值为大于或等于编码块最小高度且小于或等于编码块最大高度的正整数。
5.根据权利要求1至4任一所述的视频编码方法,其特征在于,所述当前编码块的尺寸包括所述当前编码块的面积;其中,
所述第一预设条件为所述当前编码块的面积小于第二面积阈值,所述第二面积阈值为大于或等于编码块最小面积且小于或等于编码块最大面积的正整数。
6.根据权利要求1至4任一所述的视频编码方法,其特征在于,所述当前编码块的尺寸包括所述当前编码块的宽度;其中,
所述第一预设条件为所述当前编码块的宽度小于第二宽度阈值,所述第二宽度阈值为大于或等于编码块最小宽度且小于或等于编码块最大宽度的正整数。
7.根据权利要求1至4任一所述的视频编码方法,其特征在于,所述当前编码块的尺寸包括所述当前编码块的高度;其中,
所述第一预设条件为所述当前编码块的高度小于第二高度阈值,所述第二高度阈值为大于或等于编码块最小高度且小于或等于编码块最大高度的正整数。
8.一种视频解码方法,其特征在于,包括:
获取当前图像的码流,所述码流包括当前解码块;
当所述当前解码块的尺寸满足第二预设条件时,不采用帧内串复制模式对所述当前解码块进行解码,不解码所述当前解码块的串预测标志;
当所述当前解码块的尺寸不满足所述第二预设条件时,采用帧内串复制模式对所述当前解码块进行解码,解码所述当前解码块的串预测标志。
9.根据权利要求8所述的视频解码方法,其特征在于,所述当前解码块的尺寸包括所述当前解码块的面积;其中,
所述第二预设条件为所述当前解码块的面积小于或等于第一面积阈值,所述第一面积阈值为大于或等于解码块最小面积且小于或等于解码块最大面积的正整数。
10.根据权利要求8所述的视频解码方法,其特征在于,所述当前解码块的尺寸包括所述当前解码块的宽度;其中,
所述第二预设条件为所述当前解码块的宽度小于或等于第一宽度阈值,所述第一宽度阈值为大于或等于解码块最小宽度且小于或等于解码块最大宽度的正整数。
11.根据权利要求8所述的视频解码方法,其特征在于,所述当前解码块的尺寸包括所述当前解码块的高度;其中,
所述第二预设条件为所述当前解码块的高度小于或等于第一高度阈值,所述第一高度阈值为大于或等于解码块最小高度且小于或等于解码块最大高度的正整数。
12.根据权利要求8至11任一所述的视频解码方法,其特征在于,所述当前解码块的尺寸包括所述当前解码块的面积;其中,
所述第二预设条件为所述当前解码块的面积大于第二面积阈值,所述第二面积阈值为大于或等于解码块最小面积且小于或等于解码块最大面积的正整数。
13.根据权利要求8至11任一所述的视频解码方法,其特征在于,所述当前解码块的尺寸包括所述当前解码块的宽度;其中,
所述第二预设条件为所述当前解码块的宽度大于第二宽度阈值,所述第二宽度阈值为大于或等于解码块最小宽度且小于或等于解码块最大宽度的正整数。
14.根据权利要求8至11任一所述的视频解码方法,其特征在于,所述当前解码块的尺寸包括所述当前解码块的高度;其中,
所述第二预设条件为所述当前解码块的高度大于第二高度阈值,所述第二高度阈值为大于或等于解码块最小高度且小于或等于解码块最大高度的正整数。
15.一种电子设备,其特征在于,包括:
至少一个处理器;
存储装置,配置为存储至少一个程序,当所述至少一个程序被所述至少一个处理器执行时,使得所述至少一个处理器实现如权利要求1至7中任一项所述的视频编码方法或如权利要求8至14中任一项所述的视频解码方法。
CN202010487810.XA 2020-06-02 2020-06-02 视频编码方法、视频解码方法及相关设备 Active CN112532989B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN202010487810.XA CN112532989B (zh) 2020-06-02 2020-06-02 视频编码方法、视频解码方法及相关设备
CN202210101714.6A CN114466186A (zh) 2020-06-02 2020-06-02 视频编码方法、视频解码方法及相关设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010487810.XA CN112532989B (zh) 2020-06-02 2020-06-02 视频编码方法、视频解码方法及相关设备

Related Child Applications (1)

Application Number Title Priority Date Filing Date
CN202210101714.6A Division CN114466186A (zh) 2020-06-02 2020-06-02 视频编码方法、视频解码方法及相关设备

Publications (2)

Publication Number Publication Date
CN112532989A true CN112532989A (zh) 2021-03-19
CN112532989B CN112532989B (zh) 2022-02-25

Family

ID=74978642

Family Applications (2)

Application Number Title Priority Date Filing Date
CN202210101714.6A Pending CN114466186A (zh) 2020-06-02 2020-06-02 视频编码方法、视频解码方法及相关设备
CN202010487810.XA Active CN112532989B (zh) 2020-06-02 2020-06-02 视频编码方法、视频解码方法及相关设备

Family Applications Before (1)

Application Number Title Priority Date Filing Date
CN202210101714.6A Pending CN114466186A (zh) 2020-06-02 2020-06-02 视频编码方法、视频解码方法及相关设备

Country Status (1)

Country Link
CN (2) CN114466186A (zh)

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013074042A1 (en) * 2011-11-17 2013-05-23 Agency For Science, Technology And Research Method and an apparatus for coding an intra prediction mode
CN104581177A (zh) * 2013-10-12 2015-04-29 上海天荷电子信息有限公司 一种结合块匹配和串匹配的图像压缩方法和装置
CN104853211A (zh) * 2014-02-16 2015-08-19 上海天荷电子信息有限公司 使用多种形式的参考像素存储空间的图像压缩方法和装置
KR20160039549A (ko) * 2014-10-01 2016-04-11 주식회사 케이티 비디오 신호 처리 방법 및 장치
US20160255344A1 (en) * 2013-10-12 2016-09-01 Samsung Electronics Co., Ltd. Video encoding method and apparatus and video decoding method and apparatus using intra block copy prediction
WO2016197893A1 (zh) * 2015-06-08 2016-12-15 同济大学 图像编码及解码方法、图像处理设备、计算机存储介质
CN107071450A (zh) * 2016-02-10 2017-08-18 同济大学 数据压缩的编码、解码方法及装置
CN107852499A (zh) * 2015-04-13 2018-03-27 联发科技股份有限公司 用于在视频编解码中减少最坏情况下的带宽的约束帧内块复制的方法

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013074042A1 (en) * 2011-11-17 2013-05-23 Agency For Science, Technology And Research Method and an apparatus for coding an intra prediction mode
CN104581177A (zh) * 2013-10-12 2015-04-29 上海天荷电子信息有限公司 一种结合块匹配和串匹配的图像压缩方法和装置
US20160255344A1 (en) * 2013-10-12 2016-09-01 Samsung Electronics Co., Ltd. Video encoding method and apparatus and video decoding method and apparatus using intra block copy prediction
CN104853211A (zh) * 2014-02-16 2015-08-19 上海天荷电子信息有限公司 使用多种形式的参考像素存储空间的图像压缩方法和装置
KR20160039549A (ko) * 2014-10-01 2016-04-11 주식회사 케이티 비디오 신호 처리 방법 및 장치
CN107852499A (zh) * 2015-04-13 2018-03-27 联发科技股份有限公司 用于在视频编解码中减少最坏情况下的带宽的约束帧内块复制的方法
WO2016197893A1 (zh) * 2015-06-08 2016-12-15 同济大学 图像编码及解码方法、图像处理设备、计算机存储介质
CN107071450A (zh) * 2016-02-10 2017-08-18 同济大学 数据压缩的编码、解码方法及装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
KAILUN ZHOU 等: "Non-CE10: Improvement on coding of ISC parameters and comparison to Palette Coding", 《JOINT COLLABORATIVE TEAM ON VIDEO CODING (JCT-VC) OF ITU-T SG 16 WP 3 AND ISO/IEC JTC 1/SC 29/WG 11》 *

Also Published As

Publication number Publication date
CN114466186A (zh) 2022-05-10
CN112532989B (zh) 2022-02-25

Similar Documents

Publication Publication Date Title
EP3304908B1 (en) Slice level intra block copy
CN112543332B (zh) 视频解码方法、视频编码方法及相关设备
CN111277828B (zh) 视频编解码方法、视频编码器和视频解码器
US11310519B2 (en) Deblocking of subblock boundaries for affine motion compensated coding
JP7314274B2 (ja) ビデオピクチャの復号および符号化の方法ならびに装置
CN113196783B (zh) 去块效应滤波自适应的编码器、解码器及对应方法
KR102616714B1 (ko) 광학 흐름 정제를 위한 조기 종료
CN114902661A (zh) 用于跨分量线性模型预测的滤波方法和装置
KR20230150284A (ko) 효율적인 비디오 인코더 아키텍처
CN113170176B (zh) 视频编码器、视频解码器及相应方法
KR102660120B1 (ko) 이중 예측 옵티컬 플로 계산 및 이중 예측 보정에서 블록 레벨 경계 샘플 그레이디언트 계산을 위한 정수 그리드 참조 샘플의 위치를 계산하는 방법
CN112532988B (zh) 视频编码方法、视频解码方法及相关设备
CN112565767B (zh) 视频解码方法、视频编码方法及相关设备
CN112532989B (zh) 视频编码方法、视频解码方法及相关设备
CN112543333B (zh) 视频解码方法、视频编码方法及相关设备
JP2023523839A (ja) 動き精度構文のためのエントロピーコーディング
CN112135149A (zh) 语法元素的熵编码/解码方法、装置以及编解码器
CN114079782A (zh) 视频图像重建方法、装置、计算机设备及存储介质
CN116601959A (zh) 重叠块运动补偿
CN113766227A (zh) 用于图像编码和解码的量化和反量化方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 40040665

Country of ref document: HK

GR01 Patent grant
GR01 Patent grant