CN112601093A - 一种视频编解码的方法及装置 - Google Patents

一种视频编解码的方法及装置 Download PDF

Info

Publication number
CN112601093A
CN112601093A CN202110224137.5A CN202110224137A CN112601093A CN 112601093 A CN112601093 A CN 112601093A CN 202110224137 A CN202110224137 A CN 202110224137A CN 112601093 A CN112601093 A CN 112601093A
Authority
CN
China
Prior art keywords
texture
frame
block
coding
matching block
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110224137.5A
Other languages
English (en)
Inventor
罗伟节
向国庆
洪一帆
滕波
葛强
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang Smart Video Security Innovation Center Co Ltd
Original Assignee
Zhejiang Smart Video Security Innovation Center Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang Smart Video Security Innovation Center Co Ltd filed Critical Zhejiang Smart Video Security Innovation Center Co Ltd
Priority to CN202110224137.5A priority Critical patent/CN112601093A/zh
Publication of CN112601093A publication Critical patent/CN112601093A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/597Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding specially adapted for multi-view video sequence encoding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/129Scanning of coding units, e.g. zig-zag scan of transform coefficients or flexible macroblock ordering [FMO]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/42Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

本发明公开了一种视频编解码的方法及装置,涉及3D视频编码/立体视频编码领域;其中,一种视频编码的方法,包括:对当前纹理帧按深度信息分成多个区域,得到至少一个编码块;在与所述编码块具有相同或相似深度的其它纹理帧的纹理子帧中确定最佳匹配块,并根据所述编码块和所述最佳匹配块计算运动矢量值;基于所述最佳匹配块和所述运动矢量值执行帧间预测编码;该方法充分利用了视频数据在空域上的相关性,提升了帧间检索速度。

Description

一种视频编解码的方法及装置
技术领域
本公开涉及3D视频编码/立体视频编码领域,具体涉及一种视频编码的方法及装置。
背景技术
立体视频是多视点视频的一种,提供两路视频信号,分别对应人左右两只眼睛,形成三维立体效果。其中,立体视频具有多种不同的表示格式,其中基于“纹理+深度”的表示格式有广泛的应用。
在基于“纹理+深度”的表示格式中,包括两种类似的数据,一种是二维视频数据,另外一种是相应的深度图。二维视频数据可以采用现有的各种视频编解码方式进行编解码,包括MPEG2,MPEG4,H.264,H.265,H.266等各种标准化技术。
深度图也可以采用这些技术进行压缩/解压缩,还可以进一步利用深度图数据的特点以及与二维视频数据的相关性进一步提高深度图压缩效率。
一般地,视频中同一物体在时域上都具有较强的相关性。因此如果能够将同一物体从视频数据不同图像帧中识别出来,使得帧间预测尽量发生在同一物体的视频数据块之间,那么就可以更充分利用视频数据在空域上的相关性,同时也有利于提高帧间预测匹配块检索速度,但现有技术中并没有充分公开相关技术。
发明内容
针对现有技术中的上述技术问题,本公开实施例提出了一种视频编码的的方法及装置,以解决现有技术中存在的未充分利用视频数据在空域上的相关性、帧间检索速度慢等问题。
本公开实施例第一方面公开了一种视频编码的方法,所述方法包括:
对当前纹理帧按深度信息分成多个区域,得到至少一个编码块;
在与所述编码块具有相同或相似深度的其它纹理帧的纹理子帧中确定最佳匹配块,并根据所述编码块和所述最佳匹配块计算运动矢量值;
基于所述最佳匹配块和所述运动矢量值执行帧间预测编码。
在一些实施例中,所述对当前纹理帧按深度信息分成多个区域,得到至少一个编码块可替换为:对当前纹理帧按深度信息分成多个区域,得到至少一个纹理子帧;对所述纹理子帧分块,形成多个编码块。
在一些实施例中,所述方法还包括:将所述最佳匹配块所在纹理子帧作为参考纹理子帧,并将所述参考纹理子帧的标识置入视频编码流中。
在一些实施例中,所述方法还包括:将所述最佳匹配块所在纹理帧作为参考纹理帧,并将所述参考纹理帧的标识置入视频编码流中。
在一些实施例中,所述方法还包括:采用快速搜索算法在所述参考纹理子帧或者参考纹理帧中搜索。
在一些实施例中,所述方法还包括:根据深度图信息获得所述深度数据。
在一些实施例中,所述确定最佳匹配块具体包括:
比较所述编码块与所述纹理子帧中候选匹配块的像素值,计算代价函数值,选择所述代价函数值最小的候选匹配块为所述最佳匹配块。
本公开实施例第二方面公开了一种视频解码的方法,所述方法包括:
解码视频编码流获取最佳匹配块和运动矢量值;
根据所述最佳匹配块和所述运动矢量值确定对应的编码块;
将至少一个编码块按深度信息拼接,得到当前纹理帧。
本公开实施例第三方面公开了一种视频编码的装置,所述装置包括:
划分模块,用于对当前纹理帧按深度信息分成多个区域,得到至少一个编码块;
最佳匹配块确定模块,用于在与所述编码块具有相同或相似深度的其它纹理帧的纹理子帧中确定最佳匹配块,并根据所述编码块和所述最佳匹配块计算运动矢量值;
编码模块,用于基于所述最佳匹配块和所述运动矢量值执行帧间预测编码。
在一些实施例中,所述划分模块还用于:对当前纹理帧按深度信息分成多个区域,得到至少一个纹理子帧;对所述纹理子帧分块,形成多个编码块。
在一些实施例中,所述装置还包括参考纹理子帧模块,具体用于将所述最佳匹配块所在纹理子帧作为参考纹理子帧,并将所述参考纹理子帧的标识置入视频编码流中。
在一些实施例中,所述装置还包括参考纹理帧模块,具体用于将所述最佳匹配块所在纹理帧作为参考纹理帧,并将所述参考纹理帧的标识置入视频编码流中。
在一些实施例中,所述最佳匹配块确定模块具体用于:比较所述编码块与所述纹理子帧中候选匹配块的像素值,计算代价函数值,选择代价函数值最小的候选匹配块为最佳匹配块。
本公开实施例第四方面公开了一种视频解码的装置,所述装置包括:
解码模块,用于读取视频编码流获取最佳匹配块和运动矢量值;
编码块确定模块,用于根据所述最佳匹配块和所述运动矢量值确定对应的编码块;
拼接模块,用于将至少一个编码块按深度信息拼接,得到当前纹理帧。
本公开实施例的第五方面提供了一种电子设备,包括:
存储器以及一个或多个处理器;
其中,所述存储器与所述一个或多个处理器通信连接,所述存储器中存储有可被所述一个或多个处理器执行的指令,所述指令被所述一个或多个处理器执行时,所述电子设备用于实现如前述各实施例所述的方法。
本公开实施例的第六方面提供了一种计算机可读存储介质,其上存储有计算机可执行指令,当所述计算机可执行指令被计算装置执行时,可用来实现如前述各实施例所述的方法。
本公开实施例的第七方面提供了一种计算机程序产品,所述计算机程序产品包括存储在计算机可读存储介质上的计算机程序,所述计算机程序包括程序指令,当所述程序指令被计算机执行时,可用来实现如前述各实施例所述的方法。
本公开实施例公开了一种视频编解码的方法及装置,在与所述编码块具有相同或相似深度的其它纹理帧的纹理子帧中确定最佳匹配块并计算运动矢量值,不仅充分利用了视频数据在空域上的相关性,提升了帧间检索速度。
附图说明
通过参考附图会更加清楚的理解本公开的特征和优点,附图是示意性的而不应理解为对本公开进行任何限制,在附图中:
图1是根据本公开的一些实施例所示的一种视频编码的方法流程图;
图2是根据本公开的一些实施例所示的一种深度图的示例图;
图3是根据本公开的一些实施例所示的的填充示意图;
图4是根据本公开的一些实施例所示的运动估计的示意图;
图5是根据本公开的一些实施例所示的一种视频解码的方法流程图;
图6是根据本公开的一些实施例所示的一种视频编码的装置结构示意图;
图7是根据本公开的一些实施例所示的一种视频解码的装置结构示意图;
图8是根据本公开的一些实施例所示的一种电子设备的结构示意图。
具体实施方式
在下面的详细描述中,通过示例阐述了本公开的许多具体细节,以便提供对相关披露的透彻理解。然而,对于本领域的普通技术人员来讲,本公开显而易见的可以在没有这些细节的情况下实施。应当理解的是,本公开中使用“系统”、“装置”、“单元”和/或“模块”术语,是用于区分在顺序排列中不同级别的不同部件、元件、部分或组件的一种方法。然而,如果其他表达式可以实现相同的目的,这些术语可以被其他表达式替换。
应当理解的是,当设备、单元或模块被称为“在……上”、“连接到”或“耦合到”另一设备、单元或模块时,其可以直接在另一设备、单元或模块上,连接或耦合到或与其他设备、单元或模块通信,或者可以存在中间设备、单元或模块,除非上下文明确提示例外情形。例如,本公开所使用的术语“和/或”包括一个或多个相关所列条目的任何一个和所有组合。
本公开所用术语仅为了描述特定实施例,而非限制本公开范围。如本公开说明书和权利要求书中所示,除非上下文明确提示例外情形,“一”、“一个”、“一种”和/或“该”等词并非特指单数,也可包括复数。一般说来,术语“包括”与“包含”仅提示包括已明确标识的特征、整体、步骤、操作、元素和/或组件,而该类表述并不构成一个排它性的罗列,其他特征、整体、步骤、操作、元素和/或组件也可以包含在内。
参看下面的说明以及附图,本公开的这些或其他特征和特点、操作方法、结构的相关元素的功能、部分的结合以及制造的经济性可以被更好地理解,其中说明和附图形成了说明书的一部分。然而,可以清楚地理解,附图仅用作说明和描述的目的,并不意在限定本公开的保护范围。可以理解的是,附图并非按比例绘制。
本公开中使用了多种结构图用来说明根据本公开的实施例的各种变形。应当理解的是,前面或下面的结构并不是用来限定本公开。本公开的保护范围以权利要求为准。
立体视频是多视点视频的一种,提供两路视频信号,分别对应人左右两只眼睛,形成三维立体效果。其中,立体视频具有多种不同的表示格式,其中基于“纹理+深度”的表示格式有广泛的应用。
在基于“纹理+深度”的表示格式中,包括两种类似的数据,一种是二维视频数据,另外一种是相应的深度图。二维视频数据可以采用现有的各种视频编解码方式进行编解码,包括MPEG2,MPEG4,H.264,H.265,H.266等各种标准化技术。
深度图也可以采用这些技术进行压缩/解压缩,还可以进一步利用深度图数据的特点以及与二维视频数据的相关性进一步提高深度图压缩效率。
一般地,视频中同一物体在时域上都具有较强的相关性。因此如果能够将同一物体从视频数据不同图像帧中识别出来,使得帧间预测尽量发生在同一物体的视频数据块之间,那么就可以更充分利用视频数据在空域上的相关性,同时也有利于提高帧间预测匹配块检索速度,但现有技术中并没有充分公开相关技术。
如图1所示,本公开实施例公开了一种视频编码的方法,所述方法包括:
S101、对当前纹理帧按深度信息分成多个区域,得到至少一个编码块;
S102、在与所述编码块具有相同或相似深度的其它纹理帧的纹理子帧中确定最佳匹配块,并根据所述编码块和所述最佳匹配块计算运动矢量值;
S103、基于所述最佳匹配块和所述运动矢量值执行帧间预测编码。
在一些实施例中,所述对当前纹理帧按深度信息分成多个区域,得到至少一个编码块可替换为:对当前纹理帧按深度信息分成多个区域,得到至少一个纹理子帧;对所述纹理子帧分块,形成多个编码块。
在一些实施例中,所述方法还包括:将所述最佳匹配块所在纹理子帧作为参考纹理子帧,并将所述参考纹理子帧的标识置入视频编码流中。
在一些实施例中,所述方法还包括:将所述最佳匹配块所在纹理帧作为参考纹理帧,并将所述参考纹理帧的标识置入视频编码流中。
在一些实施例中,所述方法还包括:采用快速搜索算法在所述参考纹理子帧或者参考纹理帧中搜索。
在一些实施例中,所述确定最佳匹配块具体包括:
比较所述编码块与所述纹理子帧中候选匹配块的像素值,计算代价函数值,选择代价函数值最小的候选匹配块为最佳匹配块。
在一些实施例中,所述方法还包括:根据深度图信息获得所述深度数据。
视频内同一物体在深度图上呈现时通常对应于一片深度值相同或相似(变化缓慢)的区域,因此深度图可以较好地反映物体轮廓。一般地,深度图信息包括视频中各像素的位置信息,因此深度图还能较好地反映物体在视频图像出现的位置。
如图2所示,为一示例性的深度图。其中A、B、C分别代表3个具有不同深度的区域。其中,A区域的深度为2米,B区域深度为1米,C区域深度为10米。容易理解的是,某一特定区域的深度可以是该区域内平均深度,或该区域内任何一像素位置对应的深度与某一值差值在一预定的范围内,比如10厘米。
获取深度图中的深度值,并计算各个像素点的梯度。其中,所述梯度的定义可以为:各个像素点与周边临近4个像素点之间的深度值差值绝对值之和/4。
进一步地,设定一个阈值,将各像素点梯度与所述阈值比较,小于所述阈值的结果记为0,否则记为1,从而形成二值图。将连续成片的0值区域划分成多个区域。按同样方式对视频纹理图/编码块划分。
在一些实施例中,所述方法还包括:对编码块中的数据按Z行扫描并构成矩形编码块。
在一些实施例中,所述矩形编码块具有标准尺寸,比如128×128,64×64,32×32等。
在一些实施例中,所述方法还包括:使用固定数值填充矩形编码块。
具体地,由于根据深度图划分出来的区域不一定是方形这类常规视频编码标准支持的,尺寸不足之处可以用数字“0”补充,从而形成方形数据块并进行视频压缩,具体如图3所示。当然,也可以用其它数据填充,比如数字“1”或其它固定数值序列填充。在一种实施例中,还可以填充重复数据,以提高传输和解码的容错性。
在本公开实施例中,需要对同一深度的纹理帧的若干编码块数据进行基于帧间预测的编码,其中帧间编码的主要环节包括:运动估计和运动补偿。
在本公开实施例中,运动估计是寻找当前深度的纹理帧子块在已编码的、同一或近似深度的其它纹理帧的最佳匹配块,并且计算出对应块的偏移(运动矢量)。在这里运动矢量用距离和方向来表示。
如图4所示,为运动估计的示意图。其中,P为当前帧,P_ref为参考纹理帧/参考纹理子帧,B为当前码块,B_ref是P_ref中与B块相减残差最小的块,B_ref称为B的最佳匹配块(或叫参考块)。B*与B在图像中的坐标位置相同,B_ref坐标为(x_ref,y_ref),B*坐标为(x_ref,y_ref)。B_ref坐标减去B*的坐标就是运动矢量MV。在本发明中,B_ref和B具有相同或相近的深度值(未在图中示出)。该深度值可以认为是编码块中各像素位置对应深度值的平均值,或深度值的和,或是以其它方式表征的深度值。
在本发明的一些实施例中,计算运动矢量值具体包括:计算所述当前编码块与所述最佳匹配块的相对位移;所述相对位移即为所述运动矢量值。最佳匹配块是在当前编码块所在图像帧之外的其它图像帧中具有相同或相近深度的纹理子帧中分割的多个候选匹配块中以某种准则确定的最匹配的一个或若干编码块。
在一些实施例中,所述确定最匹配的编码块的准则为:比较当前编码块(即待编码块)与候选匹配块像素值,计算代价函数值,选择代价函数值最小的候选匹配块为最佳匹配块。代价函数可以是SAD(绝对误差和)、SATD(hadamard变换后再绝对值求和)、SSD(差值的平方和)、MAD(平均绝对差值)、MSD(平均平方误差)任一种。可以知道,存在其它用于计算一个图像块与另外一个图像块数值相近程度(匹配度)的其它函数,均可以作为本发明中用于确定最匹配编码块的代价函数。
在一些实施例中,可以简单地根据当前编码块的深度,确定其它若干图像帧中具有相同或相近深度的纹理子帧中分割的若干编码块(候选匹配块),然后将当前编码块与所述若干编码块进行逐一比较,计算所述代价函数值。在一些实施例中,可以将已编码的采样时间在前或在后预定数量的纹理帧的编码块作为比较对象,但其深度(平均深度或其它方式定义的深度)值与当前编码块深度(平均深度或其它方式定义的深度)的差值在一预定的范围内。
在某些实施例中,在比较编码块差值并计算代价函数值之前,还需要对每一子块更进一步施加诸如旋转、像素(或1/N像素,N=1,2,4,8,16,32等)插值等复杂的操作。为了进一步减少运算量,还可以采取某些快速搜索算法,减少编码块操作和比较次数。在一些实施例中,所述方法还包括:采用快速搜索算法(包括局部搜索算法和全局搜索算法)在纹理帧/纹理子帧中搜索最佳匹配块;常见的快速搜索算法包括三步搜索算法、新三步搜索算法、四步搜索算法、梯度下降算法等。当在所述纹理帧/纹理子帧中搜索时,比较当前编码块与候选匹配块的像素值,计算代价函数,选择代价最小的当前位置块为所述最佳匹配块,也即参考块。无论采用何种搜索算法,在选定一搜索位置时,与当前位置块与当前编码块进行比较,计算代价函数的值,直到失真度最小或小于某一阈值时为止,则将此时的搜索位置记为最佳匹配块。
基于本发明公开的技术,将最佳匹配块搜索范围限定在深度相同或相近的区域内,减少了匹配块搜索范围,使得帧间检索的速度较现有技术有所提高。以图3为例,假设当前编码块深度为1.9米,那么最佳匹配块的搜索可以限定在区域A中,而不是整个纹理帧(包括A、B、C三个区域)。将搜索区域限定在区域A内,还利用了同一物体有限时间内深度变化有限的特点,进一步利用了图像块之间空域相关性进行冗余信息的压缩。
最佳匹配块确定之后,就可以计算所述当前编码块与所述最佳匹配块的相对位移;所述相对位移即为所述运动矢量值。运动矢量可以定位最佳匹配块的位置。一般地,为帮助解码器正确解码,运动矢量信息需要直接或通过差分编码等方式写入视频码流中。
运动补偿则是根据运动矢量和帧间预测方法求得当前帧的预测值(或叫估计值)的过程。它是对当前图像的描述,旨在说明当前图像的每一块像素如何由其参考图像的像素块得到。一种简单的运动补偿方法是将参考块的值直接作为当前编码块的预测值,用当前编码块减去最佳匹配块(参考块),从而得到通常含有较少能量(或者成为信息)的残差数据,从而可以用较低的码率进行编码。更复杂一点的运动补偿算法中还可以预测参考块的运动,对参考块数据进行一定的调整后作为当前块的预测数据。这样的方法比简单的相减可以获得能量更小的残差,从而获得更好的压缩比。对参考块数据进行调整的方式,一般可以利用预测滤波器来实现。例如在H.266/VVC中提出了基于块的仿射变换运动补偿预测,考虑了缩放、旋转等非平移运动。
在现有技术中,比如MPEG2、MPEG4、H.264、H.265、H.266/VCC等视频编码标准均支持基于块的运动预测编码以及对运动预测编码技术形成的残差数据进行编码。一般地,可以先对残差数据进行扫描,将二维的图像残差数据转换为一维数据;然后进行DCT变换,将其数据转换为频域数据;接着对频域数据进行量化。由于人眼对不同频率的图像数据敏感程度不同,对不同频率数据可以采用不同的量化参数。量化后的数据还进一步利用变长编码、算术编码等熵编码技术对数据进行压缩。最后形成压缩后的视频数据。
可以沿用现有技术对残差数据的处理方法。在一些实施例中,所述帧间预测编码,进一步包括对帧间预测残差数据的编码:依次执行扫描、DCT变换、量化、熵编码等操作。
在一些实施例中,将深度信息及相应的位置信息执行压缩操作,并写入所述视频编码流。
本公开实施例还公开了一种视频解码的方法,如图5所示,所述方法包括:
S501、解码视频编码流获取最佳匹配块和运动矢量值;
S502、根据所述最佳匹配块和所述运动矢量值确定对应的编码块;
S503、将至少一个编码块按深度信息拼接,得到当前纹理帧。
具体地,帧间解码是帧间编码的逆过程。
具体地,解码装置获得运动矢量值和最佳匹配块后确定对应的编码块。
去填充数据。去掉全0或全1等填充数据或冗余数据。在一种实施例中,还可以用冗余数据恢复其它地方丢失或发生差错的数据。
原始形状恢复。获得深度图信息,结合深度图提供的位置信息,将同一深度虚拟图像帧恢复成原始形状。
多深度拼接。将不同深度的多个已恢复成原始形状的图像按各自位置恢复成一帧完整图像。
本公开实施例还公开了一种视频编码的装置600,所述装置包括:
划分模块601,用于对当前纹理帧按深度信息分成多个区域,得到至少一个编码块;
最佳匹配块确定模块602,用于在与所述编码块具有相同或相似深度的其它纹理帧的纹理子帧中确定最佳匹配块,并根据所述编码块和所述最佳匹配块计算运动矢量值;
编码模块603,用于基于所述最佳匹配块和所述运动矢量值执行帧间预测编码。
在一些实施例中,所述划分模块还用于:对当前纹理帧按深度信息分成多个区域,得到至少一个纹理子帧;对所述纹理子帧分块,形成多个编码块。
在一些实施例中,所述装置还包括参考纹理子帧模块,具体用于将所述最佳匹配块所在纹理子帧作为参考纹理子帧,并将所述参考纹理子帧的标识置入视频编码流中。
在一些实施例中,所述装置还包括参考纹理帧模块,具体用于将所述最佳匹配块所在纹理帧作为参考纹理帧,并将所述参考纹理帧的标识置入视频编码流中。
在一些实施例中,所述最佳匹配块确定模块具体用于:比较所述编码块与所述纹理子帧中候选匹配块的像素值,计算代价函数值,选择代价函数值最小的候选匹配块为最佳匹配块。
本公开实施例还公开了一种视频解码的装置700,所述装置包括:
解码模块701,用于读取视频编码流获取最佳匹配块和运动矢量值;
编码块确定模块702,用于根据所述最佳匹配块和所述运动矢量值确定对应的编码块;
拼接模块703,用于将至少一个编码块按深度信息拼接,得到当前纹理帧。
参考图8,为本公开一个实施例提供的电子设备示意图。其中,该电子设备800包括:
存储器830以及一个或多个处理器810;
其中,所述存储器830与所述一个或多个处理器810通信连接,所述存储器830中存储有可被所述一个或多个处理器执行的指令832,所述指令832被所述一个或多个处理器810执行,以使所述一个或多个处理器810执行本公开前述实施例中的方法。
具体地,处理器810和存储器830可以通过总线或者其他方式连接,图8中以通过总线840连接为例。处理器810可以为中央处理器(Central Processing Unit,CPU)。处理器810还可以为其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等芯片,或者上述各类芯片的组合。
存储器830作为一种非暂态计算机可读存储介质,可用于存储非暂态软件程序、非暂态计算机可执行程序以及模块。处理器810通过运行存储在存储器830中的非暂态软件程序、指令以及模块832,从而执行处理器的各种功能应用以及数据处理。
存储器830可以包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需要的应用程序;存储数据区可存储处理器810所创建的数据等。此外,存储器830可以包括高速随机存取存储器,还可以包括非暂态存储器,例如至少一个磁盘存储器件、闪存器件、或其他非暂态固态存储器件。在一些实施例中,存储器830可选包括相对于处理器810远程设置的存储器,这些远程存储器可以通过网络(比如通过通信接口820)连接至处理器810。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
本公开的一个实施例还提供一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机可执行指令,所述计算机可执行指令被执行后执行本公开前述实施例中的方法。
前述的计算机可读取存储介质包括以存储如计算机可读指令、数据结构、程序模块或其他数据等信息的任何方式或技术来实现的物理易失性和非易失性、可移动和不可移动介质。计算机可读取存储介质具体包括,但不限于,U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、可擦除可编程只读存储器(EPROM)、电可擦可编程只读存储器(EEPROM)、闪存或其他固态存储器技术、CD-ROM、数字多功能盘(DVD)、HD-DVD、蓝光(Blue-Ray)或其他光存储设备、磁带、磁盘存储或其他磁性存储设备、或能用于存储所需信息且可以由计算机访问的任何其他介质。
尽管此处所述的主题是在结合操作系统和应用程序在计算机系统上的执行而执行的一般上下文中提供的,但本领域技术人员可以认识到,还可结合其他类型的程序模块来执行其他实现。一般而言,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、组件、数据结构和其他类型的结构。本领域技术人员可以理解,此处所述的本主题可以使用其他计算机系统配置来实践,包括手持式设备、多处理器系统、基于微处理器或可编程消费电子产品、小型计算机、大型计算机等,也可使用在其中任务由通过通信网络连接的远程处理设备执行的分布式计算环境中。在分布式计算环境中,程序模块可位于本地和远程存储器存储设备的两者中。
本领域普通技术人员可以意识到,结合本文中所本公开的实施例描述的各示例的单元及方法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本公开的范围。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本公开的技术方案本质上或者说对原有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本公开各个实施例所述方法的全部或部分步骤。
综上所述,本公开提出了一种视频编解码的方法、装置、电子设备及其计算机可读存储介质。本公开实施例公开了一种视频编解码的方法及装置,在与所述编码块具有相同或相似深度的其它纹理帧的纹理子帧中确定最佳匹配块并计算运动矢量值,不仅充分利用了视频数据在空域上的相关性,提升了帧间检索速度。
应当理解的是,本公开的上述具体实施方式仅仅用于示例性说明或解释本公开的原理,而不构成对本公开的限制。因此,在不偏离本公开的精神和范围的情况下所做的任何修改、等同替换、改进等,均应包含在本公开的保护范围之内。此外,本公开所附权利要求旨在涵盖落入所附权利要求范围和边界、或者这种范围和边界的等同形式内的全部变化和修改例。

Claims (15)

1.一种视频编码的方法,其特征在于,所述方法包括:
对当前纹理帧按深度信息分成多个区域,得到至少一个编码块;
在与所述编码块具有相同或相似深度的其它纹理帧的纹理子帧中确定最佳匹配块,并根据所述编码块和所述最佳匹配块计算运动矢量值;
基于所述最佳匹配块和所述运动矢量值执行帧间预测编码。
2.根据权利要求1所述的方法,其特征在于,所述对当前纹理帧按深度信息分成多个区域,得到至少一个编码块可替换为:对当前纹理帧按深度信息分成多个区域,得到至少一个纹理子帧;对所述纹理子帧分块,形成多个编码块。
3.根据权利要求1或2所述的方法,其特征在于,所述编码块的形状为矩形。
4.根据权利要求1所述的方法,其特征在于,所述方法还包括:将所述最佳匹配块所在纹理子帧作为参考纹理子帧,并将所述参考纹理子帧的标识置入视频编码流中。
5.根据权利要求1所述的方法,其特征在于,所述方法还包括:将所述最佳匹配块所在纹理帧作为参考纹理帧,并将所述参考纹理帧的标识置入视频编码流中。
6.根据权利要求4或5所述的方法,其特征在于,所述方法还包括:采用快速搜索算法在所述参考纹理子帧或者参考纹理帧中搜索。
7.根据权利要求1所述的方法,其特征在于,所述方法还包括:根据深度图信息获得所述深度数据。
8.根据权利要求1所述的方法,其特征在于,所述确定最佳匹配块具体包括:
比较所述编码块与所述纹理子帧中候选匹配块的像素值,计算代价函数值,选择所述代价函数值最小的候选匹配块为所述最佳匹配块。
9.一种视频解码的方法,其特征在于,所述方法包括:
解码视频编码流获取最佳匹配块和运动矢量值;
根据所述最佳匹配块和所述运动矢量值确定对应的编码块;
将至少一个编码块按深度信息拼接,得到当前纹理帧。
10.一种视频编码的装置,其特征在于,所述装置包括:
划分模块,用于对当前纹理帧按深度信息分成多个区域,得到至少一个编码块;
最佳匹配块确定模块,用于在与所述编码块具有相同或相似深度的其它纹理帧的纹理子帧中确定最佳匹配块,并根据所述编码块和所述最佳匹配块计算运动矢量值;
编码模块,用于基于所述最佳匹配块和所述运动矢量值执行帧间预测编码。
11.根据权利要求10所述的装置,其特征在于,所述划分模块还用于:对当前纹理帧按深度信息分成多个区域,得到至少一个纹理子帧;对所述纹理子帧分块,形成多个编码块。
12.根据权利要求10所述的装置,其特征在于,所述装置还包括参考纹理子帧模块,具体用于将所述最佳匹配块所在纹理子帧作为参考纹理子帧,并将所述参考纹理子帧的标识置入视频编码流中。
13.根据权利要求10所述的装置,其特征在于,所述装置还包括参考纹理帧模块,具体用于将所述最佳匹配块所在纹理帧作为参考纹理帧,并将所述参考纹理帧的标识置入视频编码流中。
14.根据权利要求10所述的装置,其特征在于,所述最佳匹配块确定模块具体用于:比较所述编码块与所述纹理子帧中候选匹配块的像素值,计算代价函数值,选择所述代价函数值最小的候选匹配块为所述最佳匹配块。
15.一种视频解码的装置,其特征在于,所述装置包括:
解码模块,用于读取视频编码流获取最佳匹配块和运动矢量值;
编码块确定模块,用于根据所述最佳匹配块和所述运动矢量值确定对应的编码块;
拼接模块,用于将至少一个编码块按深度信息拼接,得到当前纹理帧。
CN202110224137.5A 2021-03-01 2021-03-01 一种视频编解码的方法及装置 Pending CN112601093A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110224137.5A CN112601093A (zh) 2021-03-01 2021-03-01 一种视频编解码的方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110224137.5A CN112601093A (zh) 2021-03-01 2021-03-01 一种视频编解码的方法及装置

Publications (1)

Publication Number Publication Date
CN112601093A true CN112601093A (zh) 2021-04-02

Family

ID=75207629

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110224137.5A Pending CN112601093A (zh) 2021-03-01 2021-03-01 一种视频编解码的方法及装置

Country Status (1)

Country Link
CN (1) CN112601093A (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101166271A (zh) * 2006-10-16 2008-04-23 华为技术有限公司 一种多视点视频编码中的视点差估计/补偿方法
US20130101039A1 (en) * 2011-10-19 2013-04-25 Microsoft Corporation Segmented-block coding
CN106134198A (zh) * 2014-03-28 2016-11-16 庆熙大学校产学协力团 利用深度信息的视频编码装置及其方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101166271A (zh) * 2006-10-16 2008-04-23 华为技术有限公司 一种多视点视频编码中的视点差估计/补偿方法
US20130101039A1 (en) * 2011-10-19 2013-04-25 Microsoft Corporation Segmented-block coding
CN106134198A (zh) * 2014-03-28 2016-11-16 庆熙大学校产学协力团 利用深度信息的视频编码装置及其方法

Similar Documents

Publication Publication Date Title
CN110557631B (zh) 图像预测方法和相关设备
CN110809887B (zh) 用于多参考预测的运动矢量修正的方法和装置
JP6776276B2 (ja) 画像予測方法および画像予測装置
JP5277257B2 (ja) 動画像復号化方法および動画像符号化方法
JP5833757B2 (ja) 画像符号化方法、画像復号方法、画像符号化装置、画像復号装置、画像符号化プログラム、画像復号プログラム及び記録媒体
EP3457694A1 (en) Image prediction method and related device
CN113597764B (zh) 视频解码方法、系统和存储介质
CN101496412A (zh) 具有域变换的基于网络的视频压缩
US20160316224A1 (en) Video Encoding Method, Video Decoding Method, Video Encoding Apparatus, Video Decoding Apparatus, Video Encoding Program, And Video Decoding Program
US20140321548A1 (en) Image encoding method and apparatus and image decoding method and apparatus based on motion vector normalization
CN103069802A (zh) 重构图像的当前块的方法和对应的编码方法、对应的装置以及承载在比特流中编码的图像的存储介质
US20160080745A1 (en) Intra prediction method and apparatus
CN112602326A (zh) 一种运动矢量预测方法、装置与编解码器
US10911779B2 (en) Moving image encoding and decoding method, and non-transitory computer-readable media that code moving image for each of prediction regions that are obtained by dividing coding target region while performing prediction between different views
CN112601093A (zh) 一种视频编解码的方法及装置
JP5706291B2 (ja) 映像符号化方法,映像復号方法,映像符号化装置,映像復号装置およびそれらのプログラム
CN112601092A (zh) 一种视频编解码的方法及装置
CN112601094A (zh) 一种视频编解码的方法及装置
KR20200134302A (ko) 이미지 처리 장치 및 방법
JP5759357B2 (ja) 映像符号化方法、映像復号方法、映像符号化装置、映像復号装置、映像符号化プログラム及び映像復号プログラム
US20170019683A1 (en) Video encoding apparatus and method and video decoding apparatus and method
CN112449197A (zh) 视频编解码的方法、装置、电子设备及存储介质
CN112055201A (zh) 视频编码方法及其相关装置
CN105532006B (zh) 视频编码装置及方法以及视频解码装置及方法
KR20120034033A (ko) 영상 부호화 방법과 복호화 방법 및 이를 이용한 영상 부호화 장치와 복호화 장치

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20210402

RJ01 Rejection of invention patent application after publication