CN109547795B - 视频编码方法及装置 - Google Patents

视频编码方法及装置 Download PDF

Info

Publication number
CN109547795B
CN109547795B CN201811261654.4A CN201811261654A CN109547795B CN 109547795 B CN109547795 B CN 109547795B CN 201811261654 A CN201811261654 A CN 201811261654A CN 109547795 B CN109547795 B CN 109547795B
Authority
CN
China
Prior art keywords
prediction
pixel
pixel block
residual
marked
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201811261654.4A
Other languages
English (en)
Other versions
CN109547795A (zh
Inventor
李雯
田林海
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Jiuwu Zunyi Information Technology Co.,Ltd.
Original Assignee
Shanghai Jiuwu Zunyi Information Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Jiuwu Zunyi Information Technology Co ltd filed Critical Shanghai Jiuwu Zunyi Information Technology Co ltd
Priority to CN201811261654.4A priority Critical patent/CN109547795B/zh
Publication of CN109547795A publication Critical patent/CN109547795A/zh
Application granted granted Critical
Publication of CN109547795B publication Critical patent/CN109547795B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/42Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/132Sampling, masking or truncation of coding units, e.g. adaptive resampling, frame skipping, frame interpolation or high-frequency transform coefficient masking
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/182Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a pixel
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding

Abstract

本发明涉及一种视频编码方法及装置,包括对视频图像进行采样获取图像帧;将所述图像帧分解得到多个像素块;其中,所述像素块包含多个像素;将所述图像帧中的所述多个像素块进行标记;利用第一预测算法对每个标记后的像素块进行第一预测;利用第二预测算法对每个标记后的像素块进行第二预测;根据所述第一预测和所述第二预测的预测结果判断所述每个标记后的像素块最终预测算法;将所述最终预测算法和所述最终预测算法对应的最终预测结果进行编码。本发明通过多种预测算法对视频图像帧进行编码,选取多种预测算法中的一种作为为视频图像帧中的一个像素块进行最终编码,对于复杂纹理图像帧可以提高图像编码压缩率,进一步降低压缩的理论极限熵。

Description

视频编码方法及装置
技术领域
本发明涉及一种压缩技术领域,特别涉及一种视频编码方法及装置。
背景技术
经过三十多年的不断研究发展,视频图像编码技术不断推陈出新。从第一代的H.261/H.263、MPEG-1/MPEG-2/MPEG-4标准,到后来的第二代编码标准H.264/AVC,再到目前最新的第三代视频编码标准HEVC。每一代都在上一代的基础上不断发展,编码效率不断提高。1990年,国际电信联盟远程通信标准化组织(ITU TelecommunicationStandardization Sector,ITU-T)制定了H.261标准。该标准主要用于可视电话、视频会议。其支持在信道上的传输速率为p*64kbit/s(其中p取1~30)。该传输速率有效覆盖了整个综合业务数字网(Integrated Services Digital Network,ISDN)的基群信道速率,为各种国际间视频通信业务的开展提供了有力保证。随着视频间通信业务的不断开展,ITU-T在原有标准的基础上又推出了应用于低比特率通信视频编码的H.263标准。H.263标准可以实现公用电话交换网(Public Switched Telephone Network,PSTN)内的多媒体通信。为了支持更多更为复杂的网络通信环境,ITU-T又相继制定和发布了H.263+和H.263++标准。1988年国际标准化组织(International Organization for Standardization,ISO)成立了运动图像专家组(Moving Picture Experts Group,MPEG),旨在努力制定针对于运动视频图像的编码压缩标准。并在1992年11月推出了MPEG-1标准。MPEG-1标准可以支持1.5~2Mbit/s的传输码率。1994年11月,运动图像专家组又推出了MPEG-2标准,MPEG-2标准支持4~9Mbit/s的传输码率。该标准主要应用于高清晰度电视和标准数字电视画面图像的压缩。MPEG-1和MPEG-2标准的出现,也催生了VCD、DVD等数字媒体产业的产生和发展。1999年1月运动图像专家组又相继推出了MPEG-4标准。MPEG-4压缩编码标准主要用于超低比特率编码。MPEG-4标准相比于采用传统编码技术的MPEG-1和MPEG-2率先采用了基于对象的视频图像编码技术。
视频图像编码主要由四个部分组成,包含:预测模块、量化模块、码控模块和熵编码模块。随着视频图像复杂度的越来越高,如何提高视频图像编码效率,成为亟待解决的核心问题。
发明内容
因此,为解决现有技术存在的技术缺陷和不足,本发明提出一种视频编码方法及装置。
具体地,本发明一个实施例提出的一种视频编码方法,包括:
对视频图像进行采样获取图像帧;
将所述图像帧分解得到多个像素块;其中,所述像素块包含多个像素;
将所述图像帧中的所述多个像素块进行标记;
利用第一预测算法对每个标记后的像素块进行第一预测;
利用第二预测算法对每个标记后的像素块进行第二预测;
根据所述第一预测和所述第二预测的预测结果判断所述每个标记后的像素块最终预测算法;
将所述最终预测算法和所述最终预测算法对应的最终预测结果进行编码。
在本发明的一个实施例中,将所述图像帧中的所述多个像素块进行标记,包括:
在水平方向将所述图像帧中的像素块利用多个标记符号循环标记;
在竖直方向将所述图像帧中的像素块利用多个标记符号循环标记。
在本发明的一个实施例中,利用第一预测算法依次对每个标记后的像素块进行第一预测,包括:
每次预测同一种标记符号的像素块获取所述同一种标记符号的像素块中每个像素的第一预测残差;
按照预定顺序依次进行每个标记后的像素块的预测获取每个标记后的像素块中每个像素的第一预测残差以完成第一预测。
在本发明的一个实施例中,利用第二预测算法依次对每个标记后的像素块进行第二预测,包括:
依次对每个标记后的像素块进行像素运算获取像素值拐点;
根据所述像素值拐点获取每个标记后的像素块中每个像素的第二预测残差以完成第二预测。
在本发明的一个实施例中,根据所述第一预测和所述第二预测的预测结果判断所述每个标记后的像素块最终预测算法,包括:
根据所述第一预测获取的所述每个标记后的像素块中每个像素的第一预测残差确定所述每个标记后的像素块的第一残差主观和;
根据所述第二预测获取的所述每个标记后的像素块中每个像素的第二预测残差确定所述每个标记后的像素块的第二残差主观和;
根据所述第一残差主观和以及所述第二残差主观和判断所述每个标记后的像素块最终预测算法。
在本发明的另一个实施例提出的一种视频编码装置,包括:
采样模块,用于对视频图像进行采样获取图像帧;
分解模块,连接所述采样模块,用于将所述图像帧分解得到多个像素块;其中,所述像素块包含多个像素;
标记模块,连接所述分解模块,用于将所述图像帧中的所述多个像素块进行标记;
第一预测算法模块,连接所述标记模块,用于利用第一预测算法对每个标记后的像素块进行第一预测;
第二预测算法模块,连接所述标记模块,用于利用第二预测算法对每个标记后的像素块进行第二预测;
判断模块,连接所述第一预测算法模块和所述第二预测算法模块,用于根据所述第一预测和所述第二预测的预测结果判断所述每个标记后的像素块最终预测算法;
编码模块,连接所述判断模块,用于将所述最终预测算法和所述最终预测算法对应的最终预测结果进行编码。
在本发明的一个实施例中,所述标记模块具体用于:
在水平方向将所述图像帧中的像素块利用多个标记符号循环标记;在竖直方向将所述图像帧中的像素块利用多个标记符号循环标记。
在本发明的一个实施例中,所述第一预测算法模块具体用于:
每次预测同一种标记符号的像素块获取所述同一种标记符号的像素块中每个像素的第一预测残差;
按照预定顺序依次进行每个标记后的像素块的预测获取每个标记后的像素块中每个像素的第一预测残差以完成第一预测。
在本发明的一个实施例中,所述第二预测算法模块具体用于:
依次对每个标记后的像素块进行像素运算获取像素值拐点;
根据所述像素值拐点获取每个标记后的像素块中每个像素的第二预测残差以完成第二预测。
在本发明的一个实施例中,所述判断模块具体用于:
根据所述第一预测获取的所述每个标记后的像素块中每个像素的第一预测残差确定所述每个标记后的像素块的第一残差主观和;
根据所述第二预测获取的所述每个标记后的像素块中每个像素的第二预测残差确定所述每个标记后的像素块的第二残差主观和;
根据所述第一残差主观和以及所述第二残差主观和判断所述每个标记后的像素块最终预测算法。
基于此,本发明具备如下优点:
本发明通过多种预测算法对视频图像帧进行编码,选取多种预测算法中的一种作为为视频图像帧中的一个像素块进行最终编码,对于复杂纹理图像帧可以提高图像编码压缩率,进一步降低压缩的理论极限熵。
通过以下参考附图的详细说明,本发明的其它方面和特征变得明显。但是应当知道,该附图仅仅为解释的目的设计,而不是作为本发明的范围的限定,这是因为其应当参考附加的权利要求。还应当知道,除非另外指出,不必要依比例绘制附图,它们仅仅力图概念地说明此处描述的结构和流程。
附图说明
下面将结合附图,对本发明的具体实施方式进行详细的说明。
图1为本发明实施例提供的一种视频编码方法流程示意图;
图2为本发明实施例提供的一种图像帧像素块标记示意图;
图3为本发明实施例提供的另一种图像帧像素块标记示意图;
图4为本发明实施例提供的一种当前像素块与距离最近的参考像素块的原始位置示意图;
图5为本发明实施例提供的一种当前像素块与距离最近的参考像素块的拉近位置示意图;
图6为本发明实施例提供的一种当前像素块全参考方向的示意图;
图7为本发明实施例提供的一种当前像素块无下参考方向的示意图;
图8为本发明实施例提供的一种当前像素确定第二参考像素的示意图;
图9为本发明实施例提供的一种第二预测算法预测方式示意图;
图10为本发明实施例提供的一种视频编码装置示意图。
具体实施方式
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图对本发明的具体实施方式做详细的说明。
实施例一
请参见图1,图1为本发明实施例提供的一种视频编码方法流程示意图;本实施例对本发明提供的一种视频编码方法进行详细描述,该方法包括如下步骤:
步骤1、对视频图像进行采样获取图像帧;
步骤2、将所述图像帧分解得到多个像素块;其中,所述像素块包含多个像素;
步骤3、将所述图像帧中的所述多个像素块进行标记;
步骤4、利用第一预测算法对每个标记后的像素块进行第一预测;
步骤5、利用第二预测算法对每个标记后的像素块进行第二预测;
步骤6、根据所述第一预测和所述第二预测的预测结果判断所述每个标记后的像素块最终预测算法;
步骤7、将所述最终预测算法和所述最终预测算法对应的最终预测结果进行编码。
进一步地,步骤2具体为将所述图像帧分解为多个像素块,每个像素块大小相同,因此图像帧中的像素块数量固定。每个像素块包括多个像素,可以为32*16,16*8,8*4等,本实施例以图像帧大小为128*64,像素块大小为8*4为例进行举例说明。
其中,步骤3可以包括:
步骤31、在水平方向将所述图像帧中的像素块利用多个标记符号循环标记;
步骤32、在竖直方向将所述图像帧中的像素块利用多个标记符号循环标记。
具体为:对图像帧中的每个像素块进行标记,选取P个标记符号。在水平方向,采用多个标记符号依次循环完成水平方向像素块的标记;在竖直方向,采用多个标记符号依次循环完成竖直方向像素块的标记。本实施例中图像帧的分解以及标记如图2所示,图2为本发明实施例提供的一种图像帧像素块标记示意图;将大小为128*64的图像帧分为16行16列共256个大小为8*4的像素块;以0、1、2、3标记每个像素块,将奇数行的像素块以符号0、2分别循环标记每个像素块,将偶数行的像素块以符号3、1分别循环标记每个像素块。
优选地,还可以将图像帧分解为4行4列,奇数行按照0、1分别循环标记每个像素块,偶数行按照1、0分别循环标记每个像素块,如图3所示,图3为本发明实施例提供的另一种图像帧像素块标记示意图。
其中,步骤4可以包括:
步骤41、每次预测同一种标记符号的像素块获取所述同一种标记符号的像素块中每个像素的第一预测残差;
步骤42、按照预定顺序依次进行每个标记后的像素块的预测获取每个标记后的像素块中每个像素的第一预测残差以完成第一预测。
其中,步骤5可以包括:
步骤51、依次对每个标记后的像素块进行像素运算获取像素值拐点;
步骤52、根据所述像素值拐点获取每个标记后的像素块中每个像素的第二预测残差以完成第二预测。
其中,步骤6可以包括:
步骤61、根据所述第一预测获取的所述每个标记后的像素块中每个像素的第一预测残差确定所述每个标记后的像素块的第一残差主观和;
步骤62、根据所述第二预测获取的所述每个标记后的像素块中每个像素的第二预测残差确定所述每个标记后的像素块的第二残差主观和;
步骤63、根据所述第一残差主观和以及所述第二残差主观和判断所述每个标记后的像素块最终预测算法。
具体为,设定图像帧中的像素块的大小为m*n,根据第一预测算法获取的第一预测残差以及第二预测算法获取的第二预测残差计算每种预测算法下每个标记后的像素块的残差绝对值和(sum of absolute difference,简称SAD)以及残差标准差E,如下式所述。
Figure GDA0002751374700000091
Figure GDA0002751374700000092
Figure GDA0002751374700000093
其中Res为预测残差;i为当前图像帧中像素块的像素序号;ABS为取绝对值;AVE为平均残差。
最终根据SAD和E的情况,分场景配置权重系数a1和a2,计算每个标记后的像素块的第一残差主观和以及第二残差主观和,其中,残差主观和(subjective difference,简称SUBD)的计算如下式所示。
SUBD=a1×SAD+a2×E
若为连续多帧且具有传导效应的场景,如H246参考值压缩,a2较大,a1较小;反之,a1较大,a2较小;进一步地,可以设定a1+a2=1。
选用第一残差主观和以及第二残差主观和最小值对应的预测算法为每个标记后的像素块最终预测算法,采用该最终预测算法对应的预测残差为当前像素块最终的预测残差;并在码流中传输该预测算法的附加标志位。
实施例二
本实施例在上述实施例的基础上,对本发明提出的第一预测算法进行详细描述。该算法包括如下内容:
每次预测第一标记符号至第N标记符号中的一种标记符号的像素块,N的取值为1~P,直至所有像素块预测结束,达到对像素块跳块扫描的效果。其中,第一标记符号至第N标记符号的像素块的预测顺序可以设定。对于任意一种标记符号的像素块的预测顺序为按照图像帧从左到右,从上到下的顺序对像素块进行预测。
本实施例以图2所示的图像帧为例进行说明如何进行预测,具体步骤如下:
步骤1、先对所有标记符号为0的像素块进行预测
步骤11、确定参考像素块
标记符号为0的像素块最多仅能获得间隔一个像素块的4个参考方向,其中参考方向为上方向、左方向、左上方向,右上方向,因此可以确定出上方向的参考像素块,左方向的参考像素块,左上方向的参考像素块,右上方向的参考像素块;
步骤12、纹理方向选取
步骤12A、在当前像素块的参考方向中,找到距离最近的参考像素块。若存在参考像素块与当前像素块不紧相邻,那么拉近该参考像素块为紧相邻参考像素块,若任一方向没有参考像素块,则不处理,置空。如图4、图5所示,图4为本发明实施例提供的一种当前像素块与距离最近的参考像素块的原始位置示意图;图5为本发明实施例提供的一种当前像素块与距离最近的参考像素块的拉近位置示意图。
步骤12B、通过参考像素块寻找当前像素块的第一参考像素,若某像素块的参考方向为空,则无第一参考像素。假设当前像素块有8个参考像素块,因此当前像素块可以在每个参考像素块中获取到第一参考像素,即当前像素块可以确定出全方向的第一参考像素,假设Cmn(m=1,2,3,4;n=1,2,3,4,5,6,7,8)为当前像素块的当前像素,Rxy(x=0,1,2,3,4,5;y=1,2,3,4,5,6,7,8,9)为当前像素块的第一参考像素,如图6所示,图6为本发明实施例提供的一种当前像素块全参考方向的示意图。假设Cmn(m=1,2,3,4;n=1,2,3,4,5,6,7,8)为当前像素块的当前像素,Rxy(x=0,1,2,3,4,5;y=1,2,3,4,5,6,7,8,9)为当前像素块的第一参考像素,当前像素块下参考方向为空,因此,当前像素块无下方向的第一参考像素,如图7所示,图7为本发明实施例提供的一种当前像素块无下参考方向的示意图。
步骤12C、根据第一参考像素,计算每个参考方向权重,采用如下公式计算每个参考方向权重Dir,权重采用离方向箭头最近一面的第一参考像素。
Figure GDA0002751374700000111
Figure GDA0002751374700000112
Figure GDA0002751374700000113
Figure GDA0002751374700000114
Figure GDA0002751374700000115
Figure GDA0002751374700000116
Figure GDA0002751374700000117
Figure GDA0002751374700000118
优选地,权重计算公式还可以为:
Figure GDA0002751374700000119
其中,abs为绝对值运算,Dir180为左参考方向权重,Dir0为右参考方向权重,Dir45为右上参考方向权重,Dir270为下参考方向权重,Dir90为上参考方向权重,Dir135为左上参考方向权重,Dir225为左下参考方向权重,Dir315为右下参考方向权重,x为当前像素块的列像素数量,y为当前像素块的行像素数量。
步骤12D、以图7为例,步骤12C中的公式x的取值为4,y的取值为8,如下述公式所述,在计算得出的参考方向权重中选出Dir最小的1组作为最优纹理方向,像素块中所有像素值根据该方向进行预测。
Figure GDA0002751374700000121
Figure GDA0002751374700000122
Figure GDA0002751374700000123
Figure GDA0002751374700000124
Figure GDA0002751374700000125
Figure GDA0002751374700000126
Figure GDA0002751374700000127
Figure GDA0002751374700000128
步骤13、计算第二参考像素
根据所选的最优纹理方向和对应的反方向,根据当前像素的位置,计算每个当前像素的第二参考像素,如图8所示,图8为本发明实施例提供的一种当前像素确定第二参考像素的示意图;计算公式如下,
refmid=p1*(dir2/(dir1+dir2))+p2*(dir1/(dir1+dir2))
若位置偏向1,ref=weight*refmid+(1-weight)*p1
若位置偏向2,ref=weight*refmid+(1-weight)*p2
其中refmid为两个第一参考像素的中点,p1、p2为按最优纹理方向的第一参考像素,dir1、dir2为参考方向权重,例如dir180,dir0;weight为距离权重。
首先考虑权重计算第一参考像素的中点,然后考虑位置计算第二参考像素,即第一参考像素中点靠近哪边,最终采用哪边的第一参考像素作为第二参考像素。
优选地,第二参考像素计算公式可变更,可以仅引入权重或位置。
具体举例如下:
若最优纹理方向为45度参考,则参考方向权重为dir45,dir225,对于c14,dir45=2,dir225=16,可得到第一参考像素为R05和R50,设R05=100,R50=40,
Refmid=100*(14/16)+40*(2/16)=88+5=93
由于C14偏向R05,假设weight为0.5,Ref=0.5*93+0.5*100=96,第二参考像素值为96。
步骤14、确定预测残差
采用步骤313计算得到所有点的第二参考像素,采用原始像素值减去第二参考像素值得到预测残差。
步骤2、当所有图像帧中标记为0的像素块预测处理完毕后,对所有标记符号为1的像素块进行预测;
步骤21、确定参考像素块
标记符号为1的像素块最多仅能获得间隔一个像素块的2个参考方向,其中参考方向为上方向、左方向,因此可以确定出上方向的参考像素块,左方向的参考像素块;可以获得相邻像素块的4个参考方向,其中参考方向为左上方向、右上方向、左下方向、右下方向,可以确定出左上方向的参考像素块,右上方向的参考像素块,左下方向的参考像素块,右下方向的参考像素块;
步骤22、纹理方向选取
与步骤12的方法一致,此处不再赘述。
步骤23、计算第二参考像素
与步骤13的方法一致,此处不再赘述。
步骤24、确定预测残差
与步骤14的方法一致,此处不再赘述。
步骤3、当所有图像帧中标记为0和1的像素块预测处理完毕后,对所有标记符号为2的像素块进行预测;
步骤31、确定参考像素块
所有标记符号为2的像素块最多仅能获得间隔一个像素块的2个参考方向,其中参考方向为上方向、左方向,可以确定出上方向的参考像素块,左方向的参考像素块;以及获得相邻像素块的4个参考方向,其中参考方向为上方向、下方向、左方向、右方向,可以确定出上方向的参考像素块,下方向的参考像素块,左方向的参考像素块,右方向的参考像素块;
步骤32、纹理方向选取
与步骤12的方法一致,此处不再赘述。
步骤33、计算第二参考像素
与步骤13的方法一致,此处不再赘述。
步骤34、确定预测残差
与步骤14的方法一致,此处不再赘述。
步骤4、当所有图像帧中标记为0、1、2的像素块预测处理完毕后,对所有标记符号为3的像素块进行预测;
步骤41、确定参考像素块
所有标记符号为3的像素块最多获得相邻像素块的8个参考方向,其中参考方向为上方向、下方向、左方向、右方向、左上方向、右上方向、左下方向、右下方向,可以确定出上方向的参考像素块,下方向的参考像素块,左方向的参考像素块,右方向的参考像素块,左上方向的参考像素块,右上方向的参考像素块,左下方向的参考像素块,右下方向的参考像素块。
步骤42、纹理方向选取
与步骤12的方法一致,此处不再赘述。
步骤43、计算第二参考像素
与步骤13的方法一致,此处不再赘述。
步骤44、确定预测残差
与步骤14的方法一致,此处不再赘述。
至此,可以得到每个标记后的像素块的第一预测残差以完成第一预测。
本实施例提供的算法,首先通过跳块多遍历的方法,对于图像帧中每个像素块,平均可以获得更多的参考边缘,即获得更多的参考像素;然后对于每个像素块,采用多方向预测,可以在更精确的获得该像素块的纹理方向;根据纹理方向和相应的参考像素,通过纹理方向权重和位置偏移权重,对当前预测像素块中的像素,可获得与当前像素值最相似的参考像素,并获得更小的预测残差,降低了编码的理论极限熵。
实施例三
本实施例在上述实施例的基础上,对本发明提出的第二预测算法进行详细描述。该算法包括如下步骤:
步骤1、获取像素块的大小;
本实施例以像素块的大小为16*1为例说明,其它不同大小的像素块同理。
如图9所示,图9为本发明实施例提供的一种第二预测算法预测方式示意图;像素块中的16*1个像素的像素值按照从左至右的顺序依次设定为12、14、15、18、20、23、15、10、4、0、2、2、4、5、5、6。
步骤2、定义采样方式;
步骤201、根据像素块中存在的纹理相关性,检测像素块的纹理渐变性,确定像素块的纹理渐变点,将像素块的纹理渐变点设定为像素值拐点。
具体地,将当前像素块中的当前像素的像素值减去当前像素块中相邻像素的像素值,如图9所示,将图中当前像素块中的当前像素的像素值减去当前像素块中前一像素的像素值,求解当前像素块的像素残差值。当前像素块中对应位置的像素残差值从左至右依次为12、2、1、3、2、3、-8、-5、-6、-4、2、0、2、1、0、1。
步骤202、设定像素残差值中的连续正值或连续负值的最后一个值为像素值拐点,其中像素残差值为0的值不设定为像素值拐点。
步骤203、将像素值拐点所对应的当前像素所对应的位置设定为采样点,同时将当前像素中处于首位和末位的点设定为采样点。
优选地,如图2所示,所求得的像素残差值中的像素值拐点为3和-4,将像素值拐点3和像素值拐点-4所对应的当前像素23、0以及首位和末位的像素设定为像素采样点。原始点所对应的像素12、23、0、6形成4个采样点。
步骤3、将当前像素块中的采样点与正上方像素块进行预测。预测方式为135度预测、45度预测和90度预测三种角度预测方式。即将当前像素块中的采样点与当前像素块正上方相邻像素块中采样点对应的45度的像素点、90度的像素点和135度的像素点分别进行预测,分别求解预测残差,可以将当前像素块中的采样点与当前像素块正上方相邻像素块中采样点对应的45度的像素点、90度的像素点和135度的像素点分别进行相减求解预测残差。最终选取预测残差最小的一种预测方式作为当前像素块的采样点预测方式,获取该预测方式的预测残差。
步骤4、对于当前像素块中的非采样点,利用公式求解非采样点的预测残差,公式为:
Resi=(sample1-sample0)*(i+1)/(num+1)
其中,公式中的sample0和sample1为当前像素块连续的采样点的像素重建值,i为非采样点索引,num为非采样点数量。
进一步地,像素重建值可以指的是已压缩编码MB解码端重建得到的像素值。
步骤5、最终将步骤3中获取的采样点的预测残差以及步骤4中获取的非采样点的预测残差作为像素块中每个像素的第二预测残差以完成第二预测。
本发明通过定义像素块的采样方式和像素预测的参考方式,计算当前像素块的预测残差。与现有方法相比,当待压缩图像的纹理较为复杂时,对处于当前图像的纹理边界处的像素块,根据纹理的渐变原理,不依赖于当前像素块的周围像素块,而是通过当前像素块自身的纹理特性获得预测残差,能够提高对复杂纹理区域求预测残差值的精度,进一步降低理论极限熵,增大带宽压缩率。
实施例四
本实施例在上述实施例的基础上,对本发明提出的视频编码装置进行详细介绍,如图10所示,图10为本发明实施例提供的一种视频编码装置示意图,该装置包括:
采样模块10,用于对视频图像进行采样获取图像帧;
分解模块20,连接所述采样模块10,用于将所述图像帧分解得到多个像素块;其中,所述像素块包含多个像素;
标记模块30,连接所述分解模块20,用于将所述图像帧中的所述多个像素块进行标记;
第一预测算法模块40,连接所述标记模块30,用于利用第一预测算法对每个标记后的像素块进行第一预测;
第二预测算法模块50,连接所述标记模块30,用于利用第二预测算法对每个标记后的像素块进行第二预测;
判断模块60,连接所述第一预测算法模块40和所述第二预测算法模块50,用于根据所述第一预测和所述第二预测的预测结果判断所述每个标记后的像素块最终预测算法;
编码模块70,连接所述判断模块60,用于将所述最终预测算法和所述最终预测算法对应的最终预测结果进行编码。
其中,所述标记模块具体用于:在水平方向将所述图像帧中的像素块利用多个标记符号循环标记;
在竖直方向将所述图像帧中的像素块利用多个标记符号循环标记。
其中,所述第一预测算法模块具体用于:每次预测同一种标记符号的像素块获取所述同一种标记符号的像素块中每个像素的第一预测残差;
按照预定顺序依次进行每个标记后的像素块的预测获取每个标记后的像素块中每个像素的第一预测残差以完成第一预测。
其中,所述第二预测算法模块具体用于:依次对每个标记后的像素块进行像素运算获取像素值拐点;根据所述像素值拐点获取每个标记后的像素块中每个像素的第二预测残差以完成第二预测。
其中,所述判断模块具体用于:根据所述第一预测获取的所述每个标记后的像素块中每个像素的第一预测残差确定所述每个标记后的像素块的第一残差主观和;根据所述第二预测获取的所述每个标记后的像素块中每个像素的第二预测残差确定所述每个标记后的像素块的第二残差主观和;根据所述第一残差主观和以及所述第二残差主观和判断所述每个标记后的像素块最终预测算法。。
综上所述,本文中应用了具体个例对本发明进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制,本发明的保护范围应以所附的权利要求为准。

Claims (8)

1.一种视频编码方法,其特征在于,包括:
对视频图像进行采样获取图像帧;
将所述图像帧分解得到多个像素块;其中,所述像素块包含多个像素;
将所述图像帧中的所述多个像素块进行标记;
利用第一预测算法对每个标记后的像素块进行第一预测;
利用第二预测算法对每个标记后的像素块进行第二预测,包括:获取所述像素块的大小;
定义采样方式,根据所述像素块中存在的纹理相关性,检测所述像素块的纹理渐变性,确定所述像素块的纹理渐变点,将所述像素块的纹理渐变点设定为像素值拐点,设定像素残差值中的连续正值或连续负值的最后一个值为所述像素值拐点,其中像素残差值为0的值不设定为所述像素值拐点,将像素值拐点所对应的当前像素所对应的位置设定为采样点,同时将当前像素中处于首位和末位的点设定为所述采样点;
将当前像素块中的所述采样点与所述当前像素块正上方相邻像素块中所述采样点对应的45度的像素点、90度的像素点和135度的像素点分别进行相减求解预测残差;选取所述预测残差最小的一种预测方式作为所述当前像素块的所述采样点预测方式,获取所述预测方式的所述预测残差;
对于所述当前像素块中的非采样点,利用公式求解所述非采样点的所述预测残差,公式为Resi=(sample1-sample0)*(i+1)/(num+1),其中,公式中的sample0和sample1为所述当前像素块连续的所述采样点的像素重建值,i为非采样点索引,num为非采样点数量;
将获取的所述采样点的预测残差以及获取的所述非采样点的预测残差作为所述像素块中每个像素的第二预测残差以完成所述第二预测;
根据所述第一预测和所述第二预测的预测结果判断所述每个标记后的像素块最终预测算法;
将所述最终预测算法和所述最终预测算法对应的最终预测结果进行编码。
2.根据权利要求1所述的方法,其特征在于,将所述图像帧中的所述多个像素块进行标记,包括:
在水平方向将所述图像帧中的像素块利用多个标记符号循环标记;
在竖直方向将所述图像帧中的像素块利用多个标记符号循环标记。
3.根据权利要求2所述的方法,其特征在于,利用第一预测算法依次对每个标记后的像素块进行第一预测,包括:
每次预测同一种标记符号的像素块获取所述同一种标记符号的像素块中每个像素的第一预测残差;
按照预定顺序依次进行每个标记后的像素块的预测获取每个标记后的像素块中每个像素的第一预测残差以完成第一预测。
4.根据权利要求3所述的方法,其特征在于,根据所述第一预测和所述第二预测的预测结果判断所述每个标记后的像素块最终预测算法,包括:
根据所述第一预测获取的所述每个标记后的像素块中每个像素的第一预测残差确定所述每个标记后的像素块的第一残差主观和;
根据所述第二预测获取的所述每个标记后的像素块中每个像素的第二预测残差确定所述每个标记后的像素块的第二残差主观和;
根据所述第一残差主观和以及所述第二残差主观和判断所述每个标记后的像素块最终预测算法;
其中,所述第一残差主观和以及所述第二残差主观和的计算公式为:SUBD=a1×SAD+a2×E;
根据第一预测算法获取的第一预测残差以及第二预测算法获取的第二预测残差计算每种预测算法下每个标记后的像素块的残差绝对值和SAD:
Figure FDA0002821939250000031
残差标准差E:
Figure FDA0002821939250000032
Res为预测残差;i为当前图像帧中像素块的像素序号;ABS为取绝对值;AVE为平均残差;根据SAD和E的情况,分场景配置权重系数a1和a2,计算每个标记后的像素块的第一残差主观和以及第二残差主观和。
5.一种视频编码装置,其特征在于,包括:
采样模块,用于对视频图像进行采样获取图像帧;
分解模块,连接所述采样模块,用于将所述图像帧分解得到多个像素块;其中,所述像素块包含多个像素;
标记模块,连接所述分解模块,用于将所述图像帧中的所述多个像素块进行标记;
第一预测算法模块,连接所述标记模块,用于利用第一预测算法对每个标记后的像素块进行第一预测;
第二预测算法模块,连接所述标记模块,用于利用第二预测算法对每个标记后的像素块进行第二预测,包括:获取所述像素块的大小;
定义采样方式,根据所述像素块中存在的纹理相关性,检测所述像素块的纹理渐变性,确定所述像素块的纹理渐变点,将所述像素块的纹理渐变点设定为像素值拐点,设定像素残差值中的连续正值或连续负值的最后一个值为所述像素值拐点,其中像素残差值为0的值不设定为所述像素值拐点,将像素值拐点所对应的当前像素所对应的位置设定为采样点,同时将当前像素中处于首位和末位的点设定为所述采样点;
将所述当前像素块中的所述采样点与所述当前像素块正上方相邻像素块中所述采样点对应的45度的像素点、90度的像素点和135度的像素点分别进行相减求解预测残差;选取所述预测残差最小的一种预测方式作为所述当前像素块的所述采样点预测方式,获取所述预测方式的所述预测残差;
对于所述当前像素块中的非采样点,利用公式求解所述非采样点的所述预测残差,公式为Resi=(sample1-sample0)*(i+1)/(num+1),其中,公式中的sample0和sample1为所述当前像素块连续的所述采样点的像素重建值,i为非采样点索引,num为非采样点数量;
将获取的所述采样点的预测残差以及获取的所述非采样点的预测残差作为所述像素块中每个像素的第二预测残差以完成所述第二预测;
判断模块,连接所述第一预测算法模块和所述第二预测算法模块,用于根据所述第一预测和所述第二预测的预测结果判断所述每个标记后的像素块最终预测算法;
编码模块,连接所述判断模块,用于将所述最终预测算法和所述最终预测算法对应的最终预测结果进行编码。
6.根据权利要求5所述的装置,其特征在于,所述标记模块具体用于:
在水平方向将所述图像帧中的像素块利用多个标记符号循环标记;在竖直方向将所述图像帧中的像素块利用多个标记符号循环标记。
7.根据权利要求6所述的装置,其特征在于,所述第一预测算法模块具体用于:
每次预测同一种标记符号的像素块获取所述同一种标记符号的像素块中每个像素的第一预测残差;
按照预定顺序依次进行每个标记后的像素块的预测获取每个标记后的像素块中每个像素的第一预测残差以完成第一预测。
8.根据权利要求7所述的装置,其特征在于,所述判断模块具体用于:
根据所述第一预测获取的所述每个标记后的像素块中每个像素的第一预测残差确定所述每个标记后的像素块的第一残差主观和;
根据所述第二预测获取的所述每个标记后的像素块中每个像素的第二预测残差确定所述每个标记后的像素块的第二残差主观和;
根据所述第一残差主观和以及所述第二残差主观和判断所述每个标记后的像素块最终预测算法;
其中,所述第一残差主观和以及所述第二残差主观和的计算公式为:SUBD=a1×SAD+a2×E;
根据第一预测算法获取的第一预测残差以及第二预测算法获取的第二预测残差计算每种预测算法下每个标记后的像素块的残差绝对值和SAD:
Figure FDA0002821939250000051
残差标准差E:
Figure FDA0002821939250000052
Res为预测残差;i为当前图像帧中像素块的像素序号;ABS为取绝对值;AVE为平均残差;根据SAD和E的情况,分场景配置权重系数a1和a2,计算每个标记后的像素块的第一残差主观和以及第二残差主观和。
CN201811261654.4A 2018-10-26 2018-10-26 视频编码方法及装置 Active CN109547795B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811261654.4A CN109547795B (zh) 2018-10-26 2018-10-26 视频编码方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811261654.4A CN109547795B (zh) 2018-10-26 2018-10-26 视频编码方法及装置

Publications (2)

Publication Number Publication Date
CN109547795A CN109547795A (zh) 2019-03-29
CN109547795B true CN109547795B (zh) 2021-02-12

Family

ID=65845394

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811261654.4A Active CN109547795B (zh) 2018-10-26 2018-10-26 视频编码方法及装置

Country Status (1)

Country Link
CN (1) CN109547795B (zh)

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101252686B (zh) * 2008-03-20 2010-04-14 上海交通大学 基于交织预测的视频帧内无损编解码方法及系统
JP5219089B2 (ja) * 2009-04-30 2013-06-26 株式会社メガチップス 画像データの生成方法
CN101783957B (zh) * 2010-03-12 2012-04-18 清华大学 一种视频预测编码方法和装置
US9538190B2 (en) * 2013-04-08 2017-01-03 Qualcomm Incorporated Intra rate control for video encoding based on sum of absolute transformed difference
CN105516727B (zh) * 2015-12-08 2018-09-28 浙江大华技术股份有限公司 一种图像编码方法及装置
CN107995494B (zh) * 2017-12-12 2019-11-22 珠海全志科技股份有限公司 视频图像数据的压缩方法与解压方法、计算机装置、计算机可读存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
利用参考像素相似度检测的帧内预测编码;赖昌材等;《计算机工程与应用》;20111031;全文 *

Also Published As

Publication number Publication date
CN109547795A (zh) 2019-03-29

Similar Documents

Publication Publication Date Title
JP7171770B2 (ja) 動きベクトル精密化および動き補償のためのメモリアクセスウィンドウおよびパディング
EP1797722B1 (en) Adaptive overlapped block matching for accurate motion compensation
US8681873B2 (en) Data compression for video
TWI508566B (zh) Animation coding apparatus, moving picture decoding apparatus, moving picture coding method, and moving picture decoding method
KR20050025567A (ko) 전방 예측된 인터레이스드 비디오 프레임의 필드에 대한모션 벡터의 예측
WO2006083113A1 (en) Method and apparatus for scalably encoding/decoding video signal
WO2020015433A1 (en) Method and apparatus for intra prediction using cross-component linear model
CN104811728B (zh) 一种视频内容自适应的运动搜索方法
JP4688462B2 (ja) 予測符号化を用いて画像ブロックの差分符号化を行う方法及び装置
WO2012081162A1 (ja) 動画像符号化装置、動画像復号装置、動画像符号化方法及び動画像復号方法
CN111131830A (zh) 重叠块运动补偿的改进
CN109922336A (zh) 视频数据的帧间预测方法和装置
JPH11177980A (ja) 適応的インタレース走査形状情報符号化/復号化装置および方法
CN109547795B (zh) 视频编码方法及装置
KR100926752B1 (ko) 동영상 부호화를 위한 미세 움직임 추정 방법 및 장치
CN101365133B (zh) 一种dct域插值舍入误差补偿方法
CN1713733A (zh) 一种基于mpeg-4的视频对象快速运动估值方法
CN109547780B (zh) 图像编码方法及装置
US20130170565A1 (en) Motion Estimation Complexity Reduction
CN109361924B (zh) 图像编码方法及装置
KR100186980B1 (ko) 영상데이타의 물체별 정보 계층별 부호화 방법 및 장치
CN109510985B (zh) 视频编码方法及其装置
CN107071481A (zh) 一种视频编码解码方法及装置
Lin et al. Low-overhead content-adaptive spatial scalability for scalable video coding
CN111107365A (zh) 图像带宽压缩中的后选择预测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right

Effective date of registration: 20210125

Address after: 201100 room 2208, No.2, Lane 58, Shenjian East Road, Minhang District, Shanghai

Applicant after: Shanghai Jiuwu Zunyi Information Technology Co.,Ltd.

Address before: 710065 Xi'an new hi tech Zone, Shaanxi, No. 86 Gaoxin Road, No. second, 1 units, 22 stories, 12202 rooms, 51, B block.

Applicant before: Xi'an Cresun Innovation Technology Co.,Ltd.

TA01 Transfer of patent application right
GR01 Patent grant
GR01 Patent grant