CN108174201A - 按视频内容提前终止编码块编码模式搜索的视频压缩方法 - Google Patents

按视频内容提前终止编码块编码模式搜索的视频压缩方法 Download PDF

Info

Publication number
CN108174201A
CN108174201A CN201810188736.4A CN201810188736A CN108174201A CN 108174201 A CN108174201 A CN 108174201A CN 201810188736 A CN201810188736 A CN 201810188736A CN 108174201 A CN108174201 A CN 108174201A
Authority
CN
China
Prior art keywords
coding
feature
encoding block
subpattern
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
CN201810188736.4A
Other languages
English (en)
Inventor
赵利平
林涛
彭华
沈士根
周海平
黄龙军
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of Shaoxing
Original Assignee
University of Shaoxing
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of Shaoxing filed Critical University of Shaoxing
Priority to CN201810188736.4A priority Critical patent/CN108174201A/zh
Publication of CN108174201A publication Critical patent/CN108174201A/zh
Withdrawn legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

本发明涉及一种按视频内容提前终止编码块编码模式搜索的视频压缩方法,其中包括根据视频内容的特征和预设分类条件将视频内容划分为多个类别;预先设定多个编码模式和各个编码模式下的编码子模式集合;根据视频内容的类别匹配与各个视频内容的类别相对应的编码子模式集合;采用与视频内容的类别相对应的编码子模式集合对该类别的视频内容进行编码,并终止除相对应的编码子模式集合之外的其他编码子模式集合的搜索。本发明对不同类别的编码单元可以自适应跳过部分编码模式及其子模式的编码,无需进行所有编码模式及其子模式的搜索,在几乎不影响整体编码效率的前提下,大幅降低编码复杂度。

Description

按视频内容提前终止编码块编码模式搜索的视频压缩方法
技术领域
本发明涉及视频压缩技术领域,具体是指一种按视频内容提前终止编码块编码模式搜索的视频压缩方法。
背景技术
近年来,随着人类社会进入人工智能、大数据、虚拟现实、增强现实、混合现实、云计算、移动计算、云-移动计算、4G/5G通讯的时代,超高清(4K)和特超高清(8K)图像分辨率的传统视频、监控视频、娱乐媒体、社交媒体、医学图像、消费者拍摄的图像/视频、各种新形态的数据等多媒体数据量与日剧增,已成为互联网大数据的主要数据形式。随着多媒体大数据的广泛应用,如何对多媒体数据进行超高压缩比和极高质量的数据压缩技术成为必不可少的技术。
多媒体大数据的广泛应用也产生了各种新类型的数据集。各种新类型的数据集中不同的图像区域具有不同的性质。一般而言,不同的图像区域主要分为两种类型:一种是由平滑的、具有丰富纹理的、连续色调的、相机拍摄的自然图像区域;另一种是由具有尖锐的像素边缘的、不连续色调的、文本,图形,图标、图表等计算机产生图像区域。这两种类型的图像区域表现出显著不同的特点,不仅包括其帧内特性,也包括其帧间特性。
帧内特性:一个编码块(Coding Unit,CU)中不同颜色的数目迥异;图像中存在具有各种各样的形状、大小和相对位置的匹配图样;一帧图像中匹配图样的数目很不相同等。
帧间特性:对于文本、图表等非自然图像或视频区域中,存在着大量的静止区域。这些区域的原始像素与前一帧相同位置的原始像素是完全一致的,而自然图像或视频区域中的静止区域由于自然界中光效的原因导致原始像素和前一帧相同位置的原始像素只是接近的;一般由计算机软件产生的运动是基于整像素的,而由摄像机记录下来对信号的时域采样产生的自然运动需要利用分像素插值来得到更精确的运动估计。
为了进一步提高具有不同的图像内容与性质的各种新类型数据的编码效率,最新国际视频压缩标准HEVC和我国第二代数字音视频编码技术标准AVS2中采用以下编码方法:
一方面,在沿用以前视频标准的“分块为编码单元”(对一帧图像进行编码时,把一帧图像划分成若干块MxM像素的子图像,对子图像一块一块进行编码)的方法上,采用更灵活的块分割技术。HEVC和AVS2中都定义了3种块分割单元,分别是CU(Coding Unit),PU(Prediction Unit),和TU(Transform Unit)。CU是最基本的二维对称结构编码单位,各种编码环节如帧内/帧间预测、变换、量化、以及熵编码都是以CU为单位进行的。最大的CU称为LCU(Largest Coding Unit)。一帧图像可以认为是由互相不重叠的LCU组合而成,由于CU是二维对称结构,对LCU的进一步分割是以递归四叉树方式进行的。PU是预测环节的基本编码单元,所有和预测相关的操作都是以PU为单位的,如帧内预测的方向、帧间预测的运动矢量差和参考帧索引、运动矢量预测、以及运动补偿都是基于PU进行处理的。TU作为变换和量化的基本单元。其中HEVC和AVS2中支持的PU划分子模式包括:不划分子模式(2N×2N)、水平划分子模式(2N×N)、垂直划分子模式((N×2N)、不规则划分子模式(2N×nU、2N×nD、nL×2N和nR×2N)和四等分划分子模式(N×N)、短距离划分子模式(0.5Nx2N和2Nx0.5N)。对一帧图像进行编码,就是依次对一个一个CU进行编码。编码单元也称编码块。
另一方面,在传统的混合编码框架中,采用多种编码模式进行编码:对不同图像内容与性质的图像编码块,采用不同的编码模式。HEVC、AVS2标准及其扩展版标准中,编码模式主要包括帧内模式、帧间模式、帧内块复制(Intra Block Copy,IBC)、Palette模式、串匹配(预测)模式等。这些模式根据预测的方向、预测块的大小(PU划分子模式)、预测的残差类型等分成不同的编码子模式。比如HEVC标准中帧内模式的亮度分量根据预测的方向性分成35种子模式(包括DC模式、Planar模式和33种方向模式);AVS2中帧间模式支持2N×2N和N×N划分的skip/direct子模式、不划分子模式(2N×2N)、水平划分子模式(2N×N)、垂直划分子模式(N×2N)、不规则划分子模式(2N×nU、2N×nD、nL×2N、nR×2N)和四等分划分子模式(N×N)的帧间预测子模式。
设视频压缩方法中的编码模式M的种类为n种,每种模式记为mi(1≤i≤n),用(1)表示。
M={m1,m2,......,mn} (1)
编码模式mi种编码子模式,每种子模式记为用(2)表示。
因此视频压缩方法中的总的编码子模式数目T为:
在现有数据压缩技术中,通常采用以下视频压缩方法:对具有不同内容性质的不同图像编码单元,依次采用视频压缩方法中的各种编码模式及其所述模式的各种子模式进行编码,并计算出所述子模式获得的率失真值,从中选择率失真值最小的子模式作为所述编码单元的最佳模式进行编码。这种编码方法,虽然能够达到最佳编码效率,但是随着编码模式和各种子模式数目的增加,总的编码子模式数目T也大幅增加,因此存在编码复杂度也非常大的严重问题。
发明内容
本发明提供了一种按视频内容提前终止编码块编码模式搜索的视频压缩方法,其目的在于克服现有技术中的缺陷,对不同类别的编码单元可以自适应跳过部分编码模式及其子模式的编码,无需进行所有编码模式及其子模式的搜索,在几乎不影响整体编码效率的前提下,大幅降低编码复杂度。
为了实现上述目的,本发明具有如下构成:
根据视频内容的特征和预设分类条件将视频内容划分为多个类别;
预先设定多个编码模式和各个编码模式下的编码子模式集合;
根据视频内容的类别匹配与各个视频内容的类别相对应的编码子模式集合;
采用与视频内容的类别相对应的编码子模式对该类别的视频内容进行编码,并终止除相对应的编码子模式集合之外的其他编码子模式集合的搜索。
可选地,视频压缩方法中的编码模式M的种类为n种,每种模式记为表示如下:
M={m1,m2,......,mn} (1)
编码模式mi种编码子模式集合,每种子模式记为表示如下:
因此视频压缩方法中的总的编码子模式集合数目T为:
c1、c2……cn表示视频内容的n个类别;预定的编码子模式集合分别为pm1、pm2、……、pmn;其中pm1、pm2、……、pmn中的每种子模式都属于M:
pmk∈M(1≤k≤n) (4)
则:如果当前编码单元归于类别ci,1≤i≤n,则采用pmi进行编码,提前终止除pmi之外的编码模式及其子模式的搜索;
所述根据视频内容的特征和预设分类条件将视频内容划分为多个类别,包括如下步骤:
当所述编码单元的特征满足预定的第i个条件,当前编码单元归为类别ci
可选地,视频中的数据包括如下多种数据中的一种或其组合:
一维数据;二维数据;多维数据;一维图形;分维图形;图像;图像的序列;视频;三维场景;持续变化的三维场景的序列;虚拟现实的场景;持续变化的虚拟现实的场景的序列;像素形式的图像;图像的变换域数据;二维或二维以上字节的集合;二维或二维以上比特的集合;像素的集合;
三分量像素Y,U,V的集合;三分量像素Y,Cb,Cr的集合;三分量像素Y,Cg,Co的集合;三分量像素R,G,B的集合;四分量像素C,M,Y,K的集合;四分量像素R,G,B,A的集合;四分量像素Y,U,V,A的集合;四分量像素Y,Cb,Cr,A的集合;四分量像素Y,Cg,Co,A的集合。
可选地,所述视频内容包括以下至少一种:一组图像、预定数目的若干幅图像、一幅图像、一帧图像、一场图像、图像的子图像、条带、宏块、最大编码单元、编码树单元、编码单元、编码单元的子区域、预测单元和变换单元;
所述视频内容的特征包括如下一种特征或其组合:
编码块的纹理;或编码块的像素值;或编码块的不同像素值总数目;或编码块的直方图分布;或像素值频率;或分量值的频率;或编码块的预测方向;或编码块的参考频率;或像素值的参考频率;或编码块的重要程度;或像素值的重要程度;或与编码块具有相同图像坐标位置的邻近图像编码块的编码模式;或与编码块具有邻近图像坐标位置的邻近图像编码块的编码模式;或编码块的特征的平均值;或编码块的特征的最大值;或编码块的特征的最小值;或编码块的特征的总和;或编码块的特征的差值;或编码块的特征的均方差;或编码块的特征所占总体的比例;或编码块像素值组成的二维矩阵的特征值或特征向量;或满足一种或一组预定条件的编码块的数目。
可选地,所述视频内容的特征包括如下一种特征或其组合:
当前编码图像与邻近帧图像的特征的差值;
或当前编码图像与前一帧图像的特征的差值;
或当前编码图像与邻近帧图像的特征差值为预定值的编码单元的数目;
或当前编码图像与前一帧图像的特征差值为预定值的编码单元的数目;
或当前编码树单元与前一帧图像的相同位置编码树单元特征差值为预定值的编码单元的数目;
或当前编码树单元与邻近位置编码树单元特征差值为预定值的编码单元的数目;
或当前编码树单元与左边编码树单元特征差值为预定值的编码单元的数目;
或当前编码树单元与右边编码树单元特征差值为预定值的编码单元的数目;
或当前编码树单元与上边编码树单元特征差值为预定值的编码单元的数目;
或当前编码树单元与左上边编码树单元特征差值为预定值的编码单元的数目;
或当前编码树单元与右上边编码树单元特征差值为预定值的编码单元的数目;
或当前编码块的最大特征值与最小特征值之差;
或当前编码块的特征值为预定值的数目的比例;
或当前编码块的特征值为最大n个特征值的数目或所述数目占总数目的比例;
或当前编码块的特征值为最小n个特征值的数目或所述数目占总数目的比例;
或当前编码块的特征值为数目最多n个特征值的数目或所述数目占总数目的比例;
或当前编码块的特征值为数目最少n个特征值的数目或所述数目占总数目的比例。
可选地,所述第i个条件,包括如下一种条件或其组合:
图像或编码单元的特征取值大于一个预定值;
或者图像或编码单元的特征取值小于一个预定值;
或者图像或编码单元的特征取值等于一个预定值;
或者图像或编码单元的特征取值在两个预定值的范围之间。
可选地,所述编码模式包括下列编码模式之一或其组合:帧内编码模式;或帧间编码模式;或IBC模式;或Palette模式;或串匹配(预测)模式;
所述编码子模式集合包括下列子模式之一或其组合:帧内编码子模式;或帧间编码子模式;或IBC子模式;或Palette子模式;或串匹配(预测)子模式;
所述预定的编码子模式集合为下列情形之一:若干帧内编码子模式和若干帧间编码子模式;或若干IBC子模式;或若干Palette子模式;或若干串匹配(预测)子模式。
可选地,将视频内容划分为多个类别,包括如下步骤:
S110:统计当前图像的全局特征,根据所述全局特征将编码图像分为全局内容特征第一类别、全局内容特征第二类别、……、全局内容特征类别第n类别;
S120:根据当前编码单元的局部特征将当前编码单元分为局部内容特征第一类别、局部内容特征第二类别、……、局部内容特征第n类别;
S130:根据全局内容特征类别和局部内容特征类别,将当前编码单元分成n个类别:
类别i:当前编码图像的全局内容特征的类别序号值及当前编码单元的局部内容特征的类别序号值与编码单元的类别序号值相同。
可选地,所述编码模式包括帧内模式、帧间模式和串预测模式;
将视频内容划分为多个类别,包括如下步骤:
S210:计算当前编码图像与前一帧图像的差值为零的编码单元的数目,根据特征值设定的阈值将编码图像分为全局内容特征第一类别和全局内容特征第二类别两类;
S220:根据当前编码最大编码单元和相邻可用最大编码单元与前一帧相同位置最大编码单元和相邻可用最大编码单元是否完全相同,将当前编码最大编码单元分为局部内容特征第一类别和局部内容特征第二类别两类;
S230:将当前编码LCU分成以下类别:
类别c1:当前编码图像为全局内容特征第一类别且当前编码最大编码单元为局部内容特征第一类别;
类别c2:当前编码图像为全局内容特征第一类别且当前编码最大编码单元为局部内容特征第二类别;
类别c3:其它情况的最大编码单元。
可选地,预定的编码子模式集合pm1、pm2、pm3如下:
pm1={Skip编码不划分子模式}
pm2={所有Skip编码子模式}
pm3={所有编码子模式}。
采用了该发明中的按视频内容提前终止编码块编码模式搜索的视频压缩方法,根据视频内容特性对编码单元进行分类,对不同类别的编码单元自适应采用不同的预定的编码子模式集合进行编码,提前终止除预定的编码子模式集合之外的编码子模式的搜索的数据压缩方法和装置。这样,对不同类别的编码单元可以自适应跳过部分编码模式及其子模式的编码,无需进行所有编码模式及其子模式的搜索,在几乎不影响整体编码效率的前提下,大幅降低编码复杂度。
附图说明
图1为本发明的按视频内容提前终止编码块编码模式搜索的视频压缩方法的流程图。
图2为本发明的一种实施例中根据视频内容的特征进行分类的流程图;
图3为本发明的另一种实施例中根据视频内容的特征进行分类的流程图。
具体实施方式
为了能够更清楚地描述本发明的技术内容,下面结合具体实施例来进行进一步的描述。
本发明的视频压缩方法的最基本的特有技术特征是通过对具有不同内容性质的编码单元的不同特征值与不同编码子模式的内在相关性进行统计分析,对各编码单元自身的视频内容特性进行分类,对不同类别的编码单元自适应采用不同的预定的编码子模式集合进行编码。每个所述预定的编码子模式集合中的子模式数目小于或者等于T。
如图1所示的按视频内容提前终止编码块编码模式搜索的视频压缩方法,包括如下步骤:
对视频内容的分类:根据视频内容的特征的不同,将视频内容分成不同的类别;
视频内容的类别与编码子模式集合的对应关系以及提前终止机制:对编码中的视频内容,在预编码阶段,采用与所述视频内容所属的类别相对应的预定的编码子模式集合进行编码,提前终止除预定的编码子模式集合之外的编码模式及其子模式的搜索。此处搜索指的是依次搜索各个编码子模式,以确定最佳的编码子模式。
优先地,设c1、c2……cn(n≥2)表示视频内容的n个类别;预定的编码子模式集合分别为pm1、pm2、……、pmn。其中pm1、pm2、……、pmn中的每种子模式都属于M:
pmk∈M(1≤k≤n) (4)
则:
如果当前编码单元归于类别1,则采用pm1进行编码,提前终止除pm1之外的编码模式及其子模式的搜索;
如果当前编码单元归于类别2,则采用pm2进行编码,提前终止除pm2之外的编码模式及其子模式的搜索;
以此类推,如果当前编码单元归于类别n,则采用pmn进行编码,提前终止除pmn之外的编码模式或其子模式的搜索。
本发明适用于对数据进行有损压缩的编码,本发明也同样适用于对数据进行无损压缩的编码。本发明中,数据压缩所涉及的数据包括下列类型的数据之一或其组合:
一维数据;二维数据;多维数据;一维图形;分维图形;图像;图像的序列;视频;三维场景;持续变化的三维场景的序列;虚拟现实的场景;持续变化的虚拟现实的场景的序列;像素形式的图像;图像的变换域数据;二维或二维以上字节的集合;二维或二维以上比特的集合;像素的集合;
三分量像素(Y,U,V)的集合;三分量像素(Y,Cb,Cr)的集合;三分量像素(Y,Cg,Co)的集合;三分量像素(R,G,B)的集合;四分量像素(C,M,Y,K)的集合;
四分量像素(R,G,B,A)的集合;四分量像素(Y,U,V,A)的集合;四分量像素(Y,Cb,Cr,A)的集合;四分量像素(Y,Cg,Co,A)的集合。
本发明中,在数据是图像、图像的序列、视频等的情形,编码块是图像的一个编码区域,包括以下至少一种:一组图像、预定数目的若干幅图像、一幅图像、一帧图像、一场图像、图像的子图像、条带、宏块、最大编码单元LCU、编码树单元CTU、编码单元CU、CU的子区域、预测单元PU、变换单元TU。
在该实施例中,所述编码方法或装置中,所述视频内容的特征包括下列情形之一或其组合:
编码块的纹理;
或编码块的像素值;
或编码块的不同像素值总数目;
或编码块的直方图分布;
或像素值或分量值的频率;
或编码块的预测方向;
或编码块或像素值的参考(引用)频率;
或编码块或像素值的重要程度;
或与编码块具有相同图像坐标位置的邻近图像编码块的编码模式
或与编码块具有邻近图像坐标位置的邻近图像编码块的编码模式
或编码块的特征的平均值;
或编码块的特征的最大值;
或编码块的特征的最小值;
或编码块的特征的总和;
或编码块的特征的差值;
或编码块的特征的均方差;
或编码块的特征所占总体的比例;
或编码块像素值组成的二维矩阵的特征值或特征向量;
或满足一种或一组预定条件的编码块的数目。
在该实施例中,所述编码方法或装置中,所述视频内容的特征包括下列情形之一或其组合:
当前编码图像与邻近帧图像的特征的差值;
或当前编码图像与前一帧图像的特征的差值;
或当前编码图像与邻近帧图像的特征差值为预定值的CU的数目;
或当前编码图像与前一帧图像的特征差值为预定值的CU的数目;
或当前编码CTU与前一帧图像的相同位置CTU特征差值为预定值的CU的数目;
或当前编码CTU与邻近位置CTU特征差值为预定值的CU的数目;
或当前编码CTU与左边CTU特征差值为预定值的CU的数目;
或当前编码CTU与右边CTU特征差值为预定值的CU的数目;
或当前编码CTU与上边CTU特征差值为预定值的CU的数目;
或当前编码CTU与左上边CTU特征差值为预定值的CU的数目;
或当前编码CTU与右上边CTU特征差值为预定值的CU的数目;
或当前编码块的最大特征值与最小特征值之差;
或当前编码块的特征值为预定值的数目的比例;
或当前编码块的特征值为最大n个特征值的数目或所述数目占总数目的比例;
或当前编码块的特征值为最小n个特征值的数目或所述数目占总数目的比例;
或当前编码块的特征值为数目最多n个特征值的数目或所述数目占总数目的比例;
或当前编码块的特征值为数目最少n个特征值的数目或所述数目占总数目的比例。
在该实施例中,所述编码方法或装置中,根据编码单元的特征的不同,将编码单元分成不同的类别的方式如下:
如果所述编码单元的特征满足预定的条件1,则当前CU归为类别1;
如果所述编码单元的特征满足预定的条件2,则当前CU归为类别2;
以此类推,如果所述编码单元的特征满足预定的条件n(n≥2),则当前CU归为类别n。
在该实施例中,所述编码方法或装置中,所述实施或变体例3中的预定的条件,是下列情形之一或其组合:
图像或编码单元的特征取值大于一个预定值;
或者图像或编码单元的特征取值小于一个预定值;
或者图像或编码单元的特征取值等于一个预定值;
或者图像或编码单元的特征取值在两个预定值的范围之间。
在该实施例中,所述编码方法或装置中,所述编码模式包括下列编码模式之一或其组合:
帧内编码模式;或帧间编码模式;或IBC模式;或Palette模式;或串匹配(预测)模式。
在该实施例中,所述编码方法或装置中,所述编码子模式集合包括下列子模式之一或其组合:
帧内编码子模式;或帧间编码子模式;或IBC子模式;或Palette子模式;或串匹配(预测)子模式。
在该实施例中,所述编码方法或装置中,所述预定的编码子模式集合为下列情形之一:
若干帧内编码子模式和若干帧间编码子模式;
或若干IBC子模式;
或若干Palette子模式;
或若干串匹配(预测)子模式。
在该实施例中,所述编码方法或装置中,所述若干的取值为下列情形之一:
所有;或部分;或无(表示没有任何所述编码模式的子模式,所有的若干不能全部取值为无)。
在该实施例中,所述编码方法或装置中,所述视频内容的类别与编码子模式集合的对应关系以及提前终止机制具有下列形式:
如果当前编码单元归为类别1,则采用pm1进行编码;
且提前终止除pm1之外的编码模式及其子模式的搜索;
如果当前编码单元归为类别2,则采用pm2进行编码;
且提前终止除pm2之外的编码模式及其子模式的搜索;
以此类推,如果当前编码单元归为类别n,则采用pmn进行编码;
且提前终止除pmn之外的编码模式及其子模式的搜索。
如图2所示,在一种实施例中,所述编码方法或装置中,所述对视频内容的分类的方式包括:
步骤1:统计当前图像的全局特征,根据所述特征将编码图像分为全局内容特征类别1、全局内容特征类别2、……、全局内容特征类别n1;
步骤2:根据当前编码单元的局部特征将当前编码单元分为局部内容特征类别1、全局内容特征类别2、……、全局内容特征类别n2;
步骤3:根据全局内容特征类别和局部内容特征类别,将当前编码单元分成n个类别:
类别1当前编码图像为全局内容特征类别i1(1≤i1≤n1)且当前编码LCU为局部内容特征类别j1(1≤j1≤n2);
类别2当前编码图像为全局内容特征类别i2(1≤i2≤n1)且当前编码LCU为局部内容特征类别j2(1≤j2≤n2);
以此类推;
类别n其它情况的LCU
所述预定的编码子模式集合共有n个,分别为:pm1、pm2……,pmn
所述视频内容的类别与编码子模式集合的对应关系以及提前终止机制是:
如果当前编码单元归为类别1,则采用pm1进行编码;
且提前终止除pm1之外的编码模式及其子模式的搜索;
如果当前编码单元归为类别2,则采用pm2进行编码;
且提前终止除pm2之外的编码模式及其子模式的搜索;
以此类推,如果当前编码单元归为类别n,则采用pmn进行编码;
且提前终止除pmn之外的编码模式及其子模式的搜索。
在该实施例中,所述编码方法或装置中,与所述实施方式不同的是,仅有步骤1或步骤2;步骤3中的“全局内容特征类别和局部内容特征类别”改为“全局内容特征类别”或“局部内容特征类别”,分类条件也随之改变。
如图3所示,在另一种实施例中,所述编码模式包括帧内模式、帧间模式和串预测模式;
所述对视频内容的分类的方式包括:
步骤1:计算当前编码图像与前一帧图像的差值为零的CU的数目。根据所述特征值设定的阈值将编码图像分为全局内容特征类别1和全局内容特征类别2两类;
步骤2:根据当前编码LCU和相邻可用LCU(左边、右边或上边LCU)与前一帧相同位置LCU和相邻可用LCU是否完全相同,将当前编码LCU分为局部内容特征类别1和局部内容特征类别2两类;
步骤3:将当前编码LCU分成以下类别:
类别1:当前编码图像为全局内容特征类别1且当前编码LCU为局部内容特征类别1;
类别2:当前编码图像为全局内容特征类别1且当前编码LCU为局部内容特征类别2;
类别3:其它情况的LCU。
所述预定的编码子模式集合有3个,分别为:pm1、pm2、pm3
所述视频内容的类别与编码子模式集合的对应关系以及提前终止机制是:
如果当前编码单元归为类别1,则采用pm1进行编码;
且提前终止除pm1之外的编码模式及其子模式的搜索;
如果当前编码单元归为类别2,则采用pm2进行编码;
且提前终止除pm2之外的编码模式及其子模式的搜索;
如果当前编码单元归为类别3,则采用pm3进行编码。
对应于该另一种实施例,所述预定的编码子模式集合pm1、pm2、pm3如下:
pm1={Skip编码不划分子模式}
pm2={所有Skip编码子模式}
pm3={所有编码子模式}。
对应于该另一种实施例,所述对视频内容的分类的方式是:
如果所述特征值≥阈值,则当前编码单元归为全局内容特征类别1;
否则当前编码单元归为全局内容特征类别2。
对应于该另一种实施例,所述设定的阈值是下列类型的数据之一:小数或百分比或整数。
进一步地,对应于该另一种实施例,所述设定的阈值是一个小数。阈值的一个例为0.99,但本发明不限于此。
与现有技术相比,采用了该发明中的按视频内容提前终止编码块编码模式搜索的视频压缩方法,根据视频内容特性对编码单元进行分类,对不同类别的编码单元自适应采用不同的预定的编码子模式集合进行编码,提前终止除预定的编码子模式集合之外的编码子模式的搜索的数据压缩方法和装置。这样,对不同类别的编码单元可以自适应跳过部分编码模式及其子模式的编码,无需进行所有编码模式及其子模式的搜索,在几乎不影响整体编码效率的前提下,大幅降低编码复杂度。
在此说明书中,本发明已参照其特定的实施例作了描述。但是,很显然仍可以作出各种修改和变换而不背离本发明的精神和范围。因此,说明书和附图应被认为是说明性的而非限制性的。

Claims (10)

1.一种按视频内容提前终止编码块编码模式搜索的视频压缩方法,其特征在于,包括如下步骤:
根据视频内容的特征和预设分类条件将视频内容划分为多个类别;
预先设定多个编码模式和各个编码模式下的编码子模式集合;
根据视频内容的类别匹配与各个视频内容的类别相对应的编码子模式集合;
采用与视频内容的类别相对应的编码子模式对该类别的视频内容进行编码,并终止除相对应的编码子模式集合之外的其他编码子模式集合的搜索。
2.根据权利要求1所述的按视频内容提前终止编码块编码模式搜索的视频压缩方法,其特征在于,视频压缩方法中的编码模式M的种类为n种,每种模式记为mi(1≤i≤n),表示如下:
M={m1,m2,......,mn} (1)
编码模式mi有tmi种编码子模式集合,每种子模式记为misj(1≤j≤tmi),表示如下:
因此视频压缩方法中的总的编码子模式集合数目T为:
c1、c2……cn表示视频内容的n个类别;预定的编码子模式集合分别为pm1、pm2、……、pmn;其中pm1、pm2、……、pmn中的每种子模式都属于M:
pmk∈M(1≤k≤n) (4)
则:如果当前编码单元归于类别ci,1≤i≤n,则采用pmi进行编码,提前终止除pmi之外的编码模式及其子模式的搜索;
所述根据视频内容的特征和预设分类条件将视频内容划分为多个类别,包括如下步骤:
当所述编码单元的特征满足预定的第i个条件,当前编码单元归为类别ci
3.根据权利要求1所述的按视频内容提前终止编码块编码模式搜索的视频压缩方法,其特征在于,视频中的数据包括如下多种数据中的一种或其组合:
一维数据;二维数据;多维数据;一维图形;分维图形;图像;图像的序列;视频;三维场景;持续变化的三维场景的序列;虚拟现实的场景;持续变化的虚拟现实的场景的序列;像素形式的图像;图像的变换域数据;二维或二维以上字节的集合;二维或二维以上比特的集合;像素的集合;
三分量像素Y,U,V的集合;三分量像素Y,Cb,Cr的集合;三分量像素Y,Cg,Co的集合;三分量像素R,G,B的集合;四分量像素C,M,Y,K的集合;四分量像素R,G,B,A的集合;四分量像素Y,U,V,A的集合;四分量像素Y,Cb,Cr,A的集合;四分量像素Y,Cg,Co,A的集合。
4.根据权利要求1所述的按视频内容提前终止编码块编码模式搜索的视频压缩方法,其特征在于,所述视频内容包括以下至少一种:一组图像、预定数目的若干幅图像、一幅图像、一帧图像、一场图像、图像的子图像、条带、宏块、最大编码单元、编码树单元、编码单元、编码单元的子区域、预测单元和变换单元;
所述视频内容的特征包括如下一种特征或其组合:
编码块的纹理;或编码块的像素值;或编码块的不同像素值总数目;或编码块的直方图分布;或像素值频率;或分量值的频率;或编码块的预测方向;或编码块的参考频率;或像素值的参考频率;或编码块的重要程度;或像素值的重要程度;或与编码块具有相同图像坐标位置的邻近图像编码块的编码模式;或与编码块具有邻近图像坐标位置的邻近图像编码块的编码模式;或编码块的特征的平均值;或编码块的特征的最大值;或编码块的特征的最小值;或编码块的特征的总和;或编码块的特征的差值;或编码块的特征的均方差;或编码块的特征所占总体的比例;或编码块像素值组成的二维矩阵的特征值或特征向量;或满足一种或一组预定条件的编码块的数目。
5.根据权利要求1所述的按视频内容提前终止编码块编码模式搜索的视频压缩方法,其特征在于,所述视频内容的特征包括如下一种特征或其组合:
当前编码图像与邻近帧图像的特征的差值;
或当前编码图像与前一帧图像的特征的差值;
或当前编码图像与邻近帧图像的特征差值为预定值的编码单元的数目;
或当前编码图像与前一帧图像的特征差值为预定值的编码单元的数目;
或当前编码树单元与前一帧图像的相同位置编码树单元特征差值为预定值的编码单元的数目;
或当前编码树单元与邻近位置编码树单元特征差值为预定值的编码单元的数目;
或当前编码树单元与左边编码树单元特征差值为预定值的编码单元的数目;
或当前编码树单元与右边编码树单元特征差值为预定值的编码单元的数目;
或当前编码树单元与上边编码树单元特征差值为预定值的编码单元的数目;
或当前编码树单元与左上边编码树单元特征差值为预定值的编码单元的数目;
或当前编码树单元与右上边编码树单元特征差值为预定值的编码单元的数目;
或当前编码块的最大特征值与最小特征值之差;
或当前编码块的特征值为预定值的数目的比例;
或当前编码块的特征值为最大n个特征值的数目或所述数目占总数目的比例;
或当前编码块的特征值为最小n个特征值的数目或所述数目占总数目的比例;
或当前编码块的特征值为数目最多n个特征值的数目或所述数目占总数目的比例;
或当前编码块的特征值为数目最少n个特征值的数目或所述数目占总数目的比例。
6.根据权利要求2所述的按视频内容提前终止编码块编码模式搜索的视频压缩方法,其特征在于,所述第i个条件,包括如下一种条件或其组合:
图像或编码单元的特征取值大于一个预定值;
或者图像或编码单元的特征取值小于一个预定值;
或者图像或编码单元的特征取值等于一个预定值;
或者图像或编码单元的特征取值在两个预定值的范围之间。
7.根据权利要求2所述的按视频内容提前终止编码块编码模式搜索的视频压缩方法,其特征在于,所述编码模式包括下列编码模式之一或其组合:帧内编码模式;或帧间编码模式;或IBC模式;或Palette模式;或串匹配(预测)模式;
所述编码子模式集合包括下列子模式之一或其组合:帧内编码子模式;或帧间编码子模式;或IBC子模式;或Palette子模式;或串匹配(预测)子模式;
所述预定的编码子模式集合为下列情形之一:若干帧内编码子模式和若干帧间编码子模式;或若干IBC子模式;或若干Palette子模式;或若干串匹配(预测)子模式。
8.根据权利要求2所述的按视频内容提前终止编码块编码模式搜索的视频压缩方法,其特征在于,将视频内容划分为多个类别,包括如下步骤:
S110:统计当前图像的全局特征,根据所述全局特征将编码图像分为全局内容特征第一类别、全局内容特征第二类别、……、全局内容特征类别第n类别;
S120:根据当前编码单元的局部特征将当前编码单元分为局部内容特征第一类别、局部内容特征第二类别、……、局部内容特征第n类别;
S130:根据全局内容特征类别和局部内容特征类别,将当前编码单元分成n个类别:
类别i:当前编码图像的全局内容特征的类别序号值及当前编码单元的局部内容特征的类别序号值与编码单元的类别序号值相同。
9.根据权利要求2所述的按视频内容提前终止编码块编码模式搜索的视频压缩方法,其特征在于,所述编码模式包括帧内模式、帧间模式和串预测模式;
将视频内容划分为多个类别,包括如下步骤:
S210:计算当前编码图像与前一帧图像的差值为零的编码单元的数目,根据特征值设定的阈值将编码图像分为全局内容特征第一类别和全局内容特征第二类别两类;
S220:根据当前编码最大编码单元和相邻可用最大编码单元与前一帧相同位置最大编码单元和相邻可用最大编码单元是否完全相同,将当前编码最大编码单元分为局部内容特征第一类别和局部内容特征第二类别两类;
S230:将当前编码LCU分成以下类别:
类别c1:当前编码图像为全局内容特征第一类别且当前编码最大编码单元为局部内容特征第一类别;
类别c2:当前编码图像为全局内容特征第一类别且当前编码最大编码单元为局部内容特征第二类别;
类别c3:其它情况的最大编码单元。
10.根据权利要求9所述的按视频内容提前终止编码块编码模式搜索的视频压缩方法,其特征在于,预定的编码子模式集合pm1、pm2、pm3如下:
pm1={Skip编码不划分子模式}
pm2={所有Skip编码子模式}
pm3={所有编码子模式}。
CN201810188736.4A 2018-03-07 2018-03-07 按视频内容提前终止编码块编码模式搜索的视频压缩方法 Withdrawn CN108174201A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810188736.4A CN108174201A (zh) 2018-03-07 2018-03-07 按视频内容提前终止编码块编码模式搜索的视频压缩方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810188736.4A CN108174201A (zh) 2018-03-07 2018-03-07 按视频内容提前终止编码块编码模式搜索的视频压缩方法

Publications (1)

Publication Number Publication Date
CN108174201A true CN108174201A (zh) 2018-06-15

Family

ID=62511078

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810188736.4A Withdrawn CN108174201A (zh) 2018-03-07 2018-03-07 按视频内容提前终止编码块编码模式搜索的视频压缩方法

Country Status (1)

Country Link
CN (1) CN108174201A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109769120A (zh) * 2019-02-19 2019-05-17 北京微吼时代科技有限公司 基于视频内容跳过编码模式判决方法、装置、设备及介质
CN111614960A (zh) * 2020-05-25 2020-09-01 绍兴文理学院 按图像内容特征进行帧级划分的快速编解码方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109769120A (zh) * 2019-02-19 2019-05-17 北京微吼时代科技有限公司 基于视频内容跳过编码模式判决方法、装置、设备及介质
CN111614960A (zh) * 2020-05-25 2020-09-01 绍兴文理学院 按图像内容特征进行帧级划分的快速编解码方法

Similar Documents

Publication Publication Date Title
Lei et al. Fast intra prediction based on content property analysis for low complexity HEVC-based screen content coding
CN108632625B (zh) 一种视频编码方法、视频解码方法和相关设备
CN104244007B (zh) 一种图像编码方法和装置及解码方法和装置
Pan et al. A low-complexity screen compression scheme for interactive screen sharing
EP3746944A1 (en) Use of non-linear function applied to quantization parameters in machine-learning models for video coding
CN103596008B (zh) 编码器及编码方法
CN106961606A (zh) 基于纹理划分特征的hevc帧内编码模式选择方法
CN107925763A (zh) 等级分割中的块级别变换选择和隐式信令的编码变换方法和设备
CN105325000A (zh) 图像编码装置、图像编码方法、图像解码装置和图像解码方法
CN106937116B (zh) 基于随机训练集自适应学习的低复杂度视频编码方法
CN108495135A (zh) 一种屏幕内容视频编码的快速编码方法
CN109479131A (zh) 视频信号处理方法及装置
Chen et al. A novel fast intra mode decision for versatile video coding
CN111432210A (zh) 一种基于填充的点云属性压缩方法
Zhang et al. Fast CU decision-making algorithm based on DenseNet network for VVC
CN104780379A (zh) 一种屏幕图像集合的压缩方法
CN110087090A (zh) 采用混合串匹配和帧内预测的数据编码、解码方法
TW202116070A (zh) 動畫像編碼裝置、動畫像解碼裝置及記錄媒體
CN104754362A (zh) 使用精细划分块匹配的图像压缩方法
CN108769696A (zh) 一种基于Fisher判别式的DVC-HEVC视频转码方法
Blanch et al. Chroma intra prediction with attention-based CNN architectures
CN109819260A (zh) 基于多嵌入域融合的视频隐写方法和装置
CN108174201A (zh) 按视频内容提前终止编码块编码模式搜索的视频压缩方法
CN107682699B (zh) 一种近无损图像压缩方法
Liu et al. Video coding and processing: a survey

Legal Events

Date Code Title Description
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WW01 Invention patent application withdrawn after publication
WW01 Invention patent application withdrawn after publication

Application publication date: 20180615