CN113163199B - 一种基于h265的视频快速预测方法、快速编码方法和系统 - Google Patents

一种基于h265的视频快速预测方法、快速编码方法和系统 Download PDF

Info

Publication number
CN113163199B
CN113163199B CN202110507323.XA CN202110507323A CN113163199B CN 113163199 B CN113163199 B CN 113163199B CN 202110507323 A CN202110507323 A CN 202110507323A CN 113163199 B CN113163199 B CN 113163199B
Authority
CN
China
Prior art keywords
pixel block
condition
pixel
depth
prediction mode
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110507323.XA
Other languages
English (en)
Other versions
CN113163199A (zh
Inventor
程志刚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang Yuhan Technology Co ltd
Original Assignee
Zhejiang Yuhan Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang Yuhan Technology Co ltd filed Critical Zhejiang Yuhan Technology Co ltd
Priority to CN202110507323.XA priority Critical patent/CN113163199B/zh
Publication of CN113163199A publication Critical patent/CN113163199A/zh
Application granted granted Critical
Publication of CN113163199B publication Critical patent/CN113163199B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/119Adaptive subdivision aspects, e.g. subdivision of a picture into rectangular or non-rectangular coding blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • H04N19/159Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/42Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/91Entropy coding, e.g. variable length coding [VLC] or arithmetic coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

本发明公开了一种基于H265的视频快速预测方法、快速编码方法和系统,属于视频编码技术领域,视频快速预测方法通过对帧间像素块的分类和差异度的分析,分析帧间像素块的相似度,根据相似度判断像素块的划分深度的情况,避免在对帧间相似高的像素块进行下一步划分前,对所有预测模式进行遍历;并根据相似度,从相应的列表中选出最优预测模式,避免了对所有预测模式的代价估算,即跳过一些不必要的遍历计算过程,从而加快深度划分决策的过程,减小了计算量,提高了预测的效率,提高了视频编码的效率。

Description

一种基于H265的视频快速预测方法、快速编码方法和系统
技术领域
本发明涉及视频编码技术领域,具体涉及一种基于H265的视频快速预测方法、快速编码方法和系统。
背景技术
视频文件是由是连续的图像帧组成,每一帧位一张静止图像。由于人眼的视觉暂留效应,当图像帧序列以一定的速率播放时,我们就会看到连续的视频展现。由于连相邻的帧与帧之间相似性极高,为便于储存传输,我们需要对原始的视频进行编码压缩,以去除空间、时间维度的冗余。视频编码流程主要分为预测、变换、量化、熵编码四个步骤,其中预测主要分为帧内预测和帧间预测。视频编码的帧内预测是指利用视频空间域的相关性,使用当前图像已编码的像素块预测当前像素块,以达到去除视频空域冗余的目的。帧间预测用于减少时域冗余,它是利用相邻帧之间的相关性进行预测编码,即当前待编码的图像使用其它已编码并重构的图像作为参考帧,当前待编码块在参考帧中搜索相似块作为预测值。
HEVC/H.265编码结构上使用了四叉树结构和更大的编码单元(CU),如图3所示,导致编码器的计算复杂度显著提高,编码时间难以满足实时性要求。为了提高压缩效率,H.265编码器具有更加灵活的像素块(CU)划分方式。每一帧图像首先按顺序被依次分割为64×64大小的LCU,从LCU开始,编码深度从0到3,每一CU可以被递归的分割成4种深度的(64×64,32×32,16×16和8×8)的CU,构成四叉树编码结构。即深度为0时,CU相当于LCU。在预测中,每一个像素块都有对应的预测模式,进行残差估算,残差可以是运动估计和运动补偿。
H.265的这种预测方式,增加了整个帧间编码过程的复杂度,CU划分过程中,为了确定CU的四叉树结构,需要进行深度l从0到3完全遍历,共计算40+41+42+43=85次率失真代价,计算过程较复杂。同时,像素块需要遍历所有预测模式,并选择编码代价最小的预测模式,作为最优预测模式。以64×64的LCU为例,预测模式需要遍历1662次-2216次,整个视频编码过程帧间预测模式选择的计算复杂度极高,显然这种遍历计算过程使得编码端的计算复杂度非常高,视频压缩所消耗的编码时间较长,无法满足日益增长的实时性视频压缩需求。由此可见,HEVC/H.265的帧间预测过程引入了大量运算复杂度,如何有效降低编码器的运算量成为目前亟待解决的问题。
发明内容
针对现有技术中存在的上述技术问题,本发明提供一种基于H265的视频快速预测方法、快速编码方法和系统,根据相似度判断像素块的划分深度的情况,跳过一些不必要的遍历计算过程,从而加快深度划分决策的过程,减小了计算量,提高了预测的效率。
为方便描述,本发明将HEVC/H.265简写为H265。
本发明公开了一种基于H265的视频快速预测方法,所述方法包括:
获取视频图像的像素块;
根据帧间同位置像素块的像素点之间的像素值差,获得像素点的类型,像素点的类型包括背景点或运动点;
根据背景点的比例,获取所述像素块的类型,所述像素块的类型包括:背景像素块BCU、静态像素块FCU或动态像素块XCU;
获取帧间像素块的差异度,所述差异度包括当前像素块与上一帧同位置像素块之间的像素值绝对差总和P(CU i)以及当前像素块与下一帧同位置像素块之间的像素值绝对差总和P(CUi+1);
判断当前像素块是否满足第五条件,所述第五条件包括:像素块的类型为背景像素块、P(CUi)≤T5且P(CUi+1)≤T5;
若满足第五条件,当前像素块的划分深度为最优深度,从第一列表中获取最优预测模式,所述第一列表包括:SKI P预测模式、i nter 2N×2N预测模式和上一帧同位置像素块的预测模式;
判断当前像素块是否满足第七条件,所述第七条件包括:像素块的类型为背景像素块、T5<P(CUi)≤T7且T5<P(CUi+1)≤T7;
若满足第七条件,当前像素块的划分深度为最优深度,从第二列表中获取最优预测模式,所述第二列表包括:SKIP预测模式、inter 2N×2N预测模式、对称运动分割预测模式和上一帧同位置像素块的预测模式;
判断当前像素块是否满足第六条件,所述第六条件包括:像素块的类型为静态像素块、P(CUi)≤T6且P(CUi+1)≤T6;
若满足第六条件,当前像素块的划分深度为最优深度,从第一列表中获取最优预测模式;
判断当前像素块是否满足第八条件,所述第八条件包括:像素块的类型为静态像素块、T6<P(CUi)≤T8且T6<P(CUi+1)≤T8;
若满足第八条件,当前像素块的划分深度为最优深度,从第二列表中获取最优预测模式;
其中,T5为第五阀值,T6为第六阀值,T7为第七阀值,T8为第八阀值。
优选的,获取像素点类型的方法包括:
获取当前像素点i与上一帧同位置像素点i-1的像素差Di
Di=|fi(x,y)-fi-1(x,y)|; (1)
获取当前像素点i与下一帧同位置像素点i+1的像素差Di+1
Di+1=|fi+1(x,y)-fi(x,y)|; (2)
判断是否满足第一条件,所述第一条件包括:Di不超过T1,且Di+1不超过T1;
若满足第一条件,当前像素点为背景点;
若不满足第一条件,当前像素点为运动点;
其中,fi(x,y)表示为当前像素点的像素值,T1为第一阀值。
优选的,获取像素块类型的方法包括:
获取像素块中背景点的数量NB和像素块的像素点数量NA;
若NB与NA的比值为1,当前像素块为背景像素块;
若NB与NA的比值大于或等于第二阀值T2,且小于1,当前像素块为静态像素块;
若NB与NA的比值小于第二阀值T2,当前像素块为动态像素块。
优选的,若不满足第五条件、第七条件、第六条件和第八条件,获取当前像素块的划分深度;
若所述划分深度为三,遍历出最优预测模式;
若所述划分深度小于三,将当前像素块进行下一深度的划分。
优选的,所遍历的预测模式包括:
SKI P模式、merge模式、矩形运动分割模式Square、对称运动分割模式SMP、非对称运动分割模式AMP和帧内模式i ntra modes,
所述矩形运动分割模式包括i nter 2N×2N和i nter N×N;
所述对称运动分割模式包括i nter 2N×N和i nter N×2N;
所述非对称运动分割模式包括i nter 2N×nU、i nter 2N×nD、i nter nL×2N和i nter nR×2N;
所述帧内模式包括i ntra 2N×2N和i ntra N×N。
优选的,判断当前像素块是否满足第四条件,所述第四条件包括:像素块的类型为动态像素块、P(CUi)≥T4且P(CUi+1)≥T4,
若满足第四条件,将当前像素块进行下一深度的划分;
若不满足第四条件,遍历预测模式;
判断当前像素块的划分深度是否为三;
若为三,当前划分深度为最优深度,将代价最低的模式确定为最优预测模式。
本发明还提供一种视频快速编码的方法,根据上述视频快速预测方法获得的像素块及其最优预测模式,获得像素块与上一帧相同位置像素块的预测残差;
对所述预测残差进行变换,获得变换系数;
对所述变换系数进行量化后,进行熵编码。
本发明还提供一种用于实现上述视频快速预测方法的系统,包括获取模块、像素点分型模块、像素块分型模块、差异度分析模块和预测模式筛选模块,
所述获取模块用于获取视频图像的像素块;
所述像素点分型模块用于根据帧间同位置像素块的像素点的像素值差,获得像素点的类型;
所述像素块分型模块用于根据背景点的比例,获取所述像素块的类型;
所述差异度分析模块用于获取帧间像素块的差异度;
预测模式筛选模块用于:在满足第五条件或第六条件时,当前像素块的划分深度设为最优深度,从第一列表中获取最优预测模式;在满足第七条件或第八条件时,当前像素块的划分深度设为最优深度,从第二列表中获取最优预测模式。
优选的,所述系统还包括像素块划分模块,
所述预测模式筛选模块还用于:在不满足第五条件、第七条件、第六条件和第八条件时,获取当前像素块的划分深度;
若所述划分深度为三,遍历出最优预测模式;
若所述划分深度小于三,通过像素块划分模块将当前像素块进行下一深度的划分。
优选的,所述系统还包括预测模块、变化模块、量化模块和熵编码模块,
所述预测模块用于根据像素块及其最优预测模式,获得像素块与上一帧相同位置像素块的预测残差;
所述变化模块用于对所述预测残差进行变换,获得变换系数;
所述量化模块用于对所述变换系数进行量化,获得量化数据;
所述熵编码模块用于根据所述量化数据进行熵编码。
与现有技术相比,本发明的有益效果为:通过对帧间像素块的分类和差异度的分析,分析帧间像素块的相似度,根据相似度判断像素块的划分深度的情况,避免在对帧间相似高的像素块进行下一步划分前,对所有预测模式进行遍历;并根据相似度,从相应的列表中选出最优预测模式,避免了对所有预测模式的代价估算,即跳过一些不必要的遍历计算过程,从而加快深度划分决策的过程,减小了计算量,提高了预测的效率,提高了视频编码的效率。
附图说明
图1是本发明的视频快速预测方法流程图;
图2是像素块变化剧烈的处理方法流程图;
图3是四叉树的结构示意图;
图4是本发明的视频编码流程图;
图5是本发明的系统逻辑框图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明的一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
下面结合附图对本发明做进一步的详细描述:
一种基于H265的视频快速预测方法,如图1所示,所述方法包括:
步骤101:获取视频图像的像素块(CU)。
步骤102:根据帧间同位置像素块的像素点之间的像素值差,获得像素点的类型,像素点的类型包括背景点或运动点。
步骤103:根据背景点的比例,获取所述像素块的类型,所述像素块的类型包括:背景像素块(BCU)、静态像素块(FCU)或动态像素块(XCU)。
步骤104:获取帧间像素块的差异度,所述差异度包括当前像素块与上一帧同位置像素块之间的像素值绝对差总和P(CUi)以及当前像素块与下一帧同位置像素块之间的像素值绝对差总和P(CUi+1)。
步骤105:判断所述像素块是否满足第五条件,所述第五条件包括:像素块的类型为背景像素块、P(CUi)≤T5且P(CUi+1)≤T5。
若满足第五条件,执行步骤106:当前像素块的划分深度为最优深度,从第一列表中获取最优预测模式(PU),所述第一列表包括:SKIP预测模式、inter2N×2N预测模式和上一帧同位置像素块的预测模式。T5为第五阀值,差异度不超过第五阀值时,当前像素块与上一帧同位置像素块以及与下一帧同位置像素块的差异小,即相似度非常高,一方面当前像素块的深度为最优深度,不需要进行一步划分;另一方面,第一列表中的SKIP预测模式和inter 2N×2N预测模式的残差估算计算小,可以满足估算的要求,减少了选择预测模式中的编码代价计算量。
步骤107:判断所述像素块是否满足第七条件,所述第七条件包括:像素块的类型为背景像素块、T5<P(CUi)≤T7且T5<P(CUi+1)≤T7。
若满足第七条件,执行步骤108:当前像素块的划分深度为最优深度,从第二列表中获取最优预测模式,所述第二列表包括:SKIP预测模式、inter 2N×2N预测模式、对称运动分割模式(SMP)和上一帧同位置像素块的预测模式。T7为第七阀值,帧间的差异度在第五阀值和第七阀值之间时,帧间的差异度较小,即相似度较高,第二列表的预测模式可以满足预测需求。
步骤109:判断所述像素块是否满足第六条件,所述第六条件包括:像素块的类型为静态像素块、P(CUi)≤T6且P(CUi+1)≤T6,T6为第六阀值。
若满足第六条件,执行步骤106:当前像素块的划分深度为最优深度,从第一列表中获取最优预测模式。
步骤110:判断所述像素块是否满足第八条件,所述第八条件包括:像素块的类型为静态像素块、T6<P(CUi)≤T8且T6<P(CUi+1)≤T8,T8为第八阀值。
若满足第八条件,执行步骤108:当前像素块的划分深度为最优深度,从第二列表中获取最优预测模式。
通过对帧间像素块的分类和差异度的分析,分析帧间像素块的相似度,根据相似度判断像素块的划分深度的情况,避免在对帧间相似高的像素块进行下一步划分前,对所有预测模式进行遍历;并根据相似度,从相应的列表中选出最优预测模式,避免了对所有预测模式的代价估算,即跳过一些不必要的遍历计算过程,从而加快深度划分决策的过程,减小了计算量,提高了预测的效率,提高了视频编码的效率。
步骤102中,获取像素点类型的方法包括:
步骤201:获取当前像素点i与上一帧同位置像素点i-1的像素差Di
Di=|fi(x,y)-fi-1(x,y)|; (1)
步骤202:获取当前像素点i与下一帧同位置像素点i+1的像素差Di+1
Di+1=|fi+1(x,y)-fi(x,y)|; (2)
步骤203:判断是否满足第一条件,所述第一条件包括:Di不超过T1,且Di+1不超过T1,即Di≤T1,Di+1≤T1;
若满足第一条件,执行步骤204:当前像素点为背景点;
若不满足第一条件,执行步骤204:当前像素点为运动点;
其中,fi(x,y)表示为当前像素点的像素值,fi-1(x,y)表示为上一帧同位置像素点的像素值,T1为第一阀值。
步骤103中,获取像素块类型的方法包括:
步骤301:获取像素块中背景点的数量NB和像素块的像素点数量NA。
步骤302:若NB与NA的比值为1,当前像素块为背景像素块。
步骤303:若NB与NA的比值大于或等于第二阀值T2,且小于1,当前像素块为静态像素块。
步骤304:若NB与NA的比值小于第二阀值T2,当前像素块为动态像素块。
上述像素块类型分类可以用以下公式进行表述:
Figure GDA0004256772520000081
其中,Sort(CU)表示为像素块类型,T2为第二阀值,BCU为背景像素块、FCU为静态像素块,XCU为动态像素块。
其中,本发明的视频快速预测方法还包括:
步骤120:若不满足第五条件、第七条件、第六条件和第八条件,获取当前像素块的划分深度l。
步骤121:若所述划分深度为三,当前划分深度为最优深度,遍历出最优预测模式。估算每个预测模型的代价,将代价最小的预测模型作为最优预测模型。
所遍历的预测模式包括:SKI P模式、merge模式、矩形运动分割模式(Square)、对称运动分割模式(SMP)、非对称运动分割模式(AMP)和帧内模式(i ntra modes),矩形运动分割模式包括i nter 2N×2N和i nter N×N;对称运动分割模式包括i nter 2N×N和inter N×2N;非对称运动分割模式包括inter 2N×nU、inter 2N×nD、inter nL×2N和inter nR×2N;帧内模式包括intra 2N×2N和intra N×N。
步骤122:若所述划分深度小于三,将当前像素块进行下一深度的划分。
一个具体实施例中,如图2所示,不满足第五条件、第七条件、第六条件和第八条件包括:像素块变化剧烈。像素块变化剧烈的处理方法包括:
131:判断当前像素块是否满足第四条件,所述第四条件包括:像素块的类型为动态像素块、P(CUi)≥T4且P(CUi+1)≥T4。
若满足第四条件,执行步骤132:将当前像素块进行下一深度的划分。其中,T4为第四阀值,差值度大于或等于第四阀值时,说明当前像素块处于相对剧烈的区域,跳过当前划分深度,直接进行下一层划分。应当指出的是:针对不同划分深度l,l∈[0,3],T4数值可以根据当前划分深度l而变化,以提升划分准确度。
若不满足第四条件,执行步骤133:遍历预测模式。即计算每个预测模式的代价。
步骤134:判断当前像素块的划分深度是否为三。
若为三,执行步骤135:当前划分深度为最优深度,将代价最低的模式确定为最优预测模式。
若不为三,执行步骤136:进行下一步深度的划分。
另一个具体实施例中,不满足第五条件、第七条件、第六条件和第八条件的情况还包括以下情况:
步骤141:判断当前像素块是否满足第三条件,所述第三条件包括:像素块的类型为静态像素块,P(CUi)≥T3且P(CUi+1)≥T3,其中,第三阀值T3大于第八阀值T8。
若满足第三条件,获取当前像素块的划分深度l。
若所述划分深度为三,当前划分深度为最优深度,遍历出最优预测模式。
若所述划分深度小于三,全搜索遍历预测模型,并将当前像素块进行下一深度的划分。
本发明还提供一种视频快速编码的方法,如图4所示,包括以下步骤:
步骤501:根据上述获得的像素块及其最优预测模式,获得像素块与上一帧相同位置像素块的预测残差。
步骤502:对所述预测残差进行变换,获得变换系数。
步骤503:对所述变换系数进行量化后,进行熵编码。熵编码后,输出编码后的视频。
其中,T1可以取值4-6,T2可以取值0.80-0.9,T3可以取值5-15%,T4取值30-60%,T5取值10-20%,T6取值8-12%,T7取值20-30%,T8取值15-25%,但不限于此。
本发明还提供一种用于实现上述视频快速预测方法的系统,如图5所示,包括获取模块1、像素点分型模块2、像素块分型模块3、差异度分析模块4和预测模式筛选模块5,
获取模块1用于获取视频图像的像素块;
像素点分型模块2用于根据帧间同位置像素块的像素点的像素值差,获得像素点的类型;
像素块分型模块3用于根据背景点的比例,获取所述像素块的类型;
差异度分析模块4用于获取帧间像素块的差异度;
预测模式筛选模块5用于:在满足第五条件或第六条件时,当前像素块的划分深度设为最优深度,从第一列表中获取最优预测模式;在满足第七条件或第八条件时,当前像素块的划分深度设为最优深度,从第二列表中获取最优预测模式。
本发明的系统还可以包括像素块划分模块6、预测模块11、变化模块12、量化模块13和熵编码模块14。
预测模式筛选模块5还用于:在不满足第五条件、第七条件、第六条件和第八条件时,获取当前像素块的划分深度;若所述划分深度为三,遍历出最优预测模式;若所述划分深度小于三,通过像素块划分模块6将当前像素块进行下一深度的划分。
预测模块11用于根据像素块及其最优预测模式,获得像素块与上一帧相同位置像素块的预测残差;变化模块12用于对所述预测残差进行变换,获得变换系数;量化模块13用于对所述变换系数进行量化,获得量化数据;熵编码模块14用于根据所述量化数据进行熵编码。
实施例
本实施例采用的环境是Windows Sever 2008R2,处理器为Intel E5-2620CPU@2.1GHz、单处理器,8核心,RAM为32GB。
对比多种视频进行了编码测试,根据本发明视频快速编码方法,设计了视频压缩软件Hnew,与H.265中HM12.0进行对比,算法性能通过PSNR(峰值信噪比,一种客观评价视频编码质量的参数)以及时间变化比ΔT(ΔT=(THM-Tnew)/THM×100%)两个参数进行对比,其中THM为HM12.0编码的时间;Tnew为Hnew编码的时间。
各个阀值的取值如下:T1=5,T2=0.85,T3=10%,T4=50%,T5=15%,T6=10%,T7=25%,T8=20%。测试结果如下表所示:
实施例 测试序列 视频分辨率 视频帧率 PSNR(dB) ΔT(%)
实施例1 交通监控视频 1920×1080 25FPS -0.07 27.8%
实施例2 行车记录仪视频 1920×1080 25FPS -0.09 29.4%
实施例3 足球比赛视频 1920×1080 25FPS -0.11 31.2%
实施例4 交通监控视频 1280×720 25FPS -0.05 24.8%
实施例5 行车记录仪视频 1280×720 25FPS -0.07 26.7%
实施例6 足球比赛视频 1920×720 25FPS -0.08 27.4%
平均值 -0.08 27.9%
从表中可以得出,PSNR平均仅下降0.08dB,视频编码的质量几乎保持不变的情况,大大节约了视频编码时间,平均值ΔT=27.9%,说明本发明的视频编码方法在提升CU划分速率和选择预测模型的情况下,对视频进行编码,能够在有效保证编码质量情况下减小视频编码耗时,提高编码效率。
以上仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种基于H265的视频快速预测方法,其特征在于,所述方法包括:
获取视频图像的像素块;
根据与帧间同位置像素块的像素点之间的像素值差,获得像素点的类型,像素点的类型包括背景点或运动点;
根据背景点的比例,获取所述像素块的类型,所述像素块的类型包括:背景像素块、静态像素块或动态像素块;
获取帧间像素块的差异度,所述差异度包括当前像素块与上一帧同位置像素块之间的像素值绝对差总和P(CUi)以及当前像素块与下一帧同位置像素块之间的像素值绝对差总和P(CUi+1);
判断当前像素块是否满足第五条件,所述第五条件包括:像素块的类型为背景像素块、P(CUi)≤T5且P(CUi+1)≤T5;
若满足第五条件,当前像素块的划分深度为最优深度,从第一列表中获取最优预测模式,所述第一列表包括:SKIP预测模式、inter 2N×2N预测模式和上一帧同位置像素块的预测模式;
判断当前像素块是否满足第七条件,所述第七条件包括:像素块的类型为背景像素块、T5<P(CUi)≤T7且T5<P(CUi+1)≤T7;
若满足第七条件,当前像素块的划分深度为最优深度,从第二列表中获取最优预测模式,所述第二列表包括:SKIP预测模式、inter 2N×2N预测模式、对称运动分割预测模式和上一帧同位置像素块的预测模式;
判断当前像素块是否满足第六条件,所述第六条件包括:像素块的类型为静态像素块、P(CUi)≤T6且P(CUi+1)≤T6;
若满足第六条件,当前像素块的划分深度为最优深度,从第一列表中获取最优预测模式;
判断当前像素块是否满足第八条件,所述第八条件包括:像素块的类型为静态像素块、T6<P(CUi)≤T8且T6<P(CUi+1)≤T8;
若满足第八条件,当前像素块的划分深度为最优深度,从第二列表中获取最优预测模式;
其中,T5为第五阀值,T6为第六阀值,T7为第七阀值,T8为第八阀值。
2.根据权利要求1所述的视频快速预测方法,其特征在于,获取像素点类型的方法包括:
获取当前像素点i的像素值与上一帧同位置像素点i-1的像素值的像素差Di
Di=|fi(x,y)-fi-1(x,y)|; (1)
获取当前像素点i的像素值与下一帧同位置像素点i+1的像素值的像素差Di+1
Di+1=|fi+1(x,y)-fi(x,y)|; (2)
判断是否满足第一条件,所述第一条件包括:Di不超过T1,且Di+1不超过T1;
若满足第一条件,当前像素点为背景点;
若不满足第一条件,当前像素点为运动点;
其中,fi(x,y)表示为当前像素点i的像素值,T1为第一阀值。
3.根据权利要求1所述的视频快速预测方法,其特征在于,获取像素块类型的方法包括:
获取像素块中背景点的数量NB和像素块的像素点数量NA;
若NB与NA的比值为1,当前像素块为背景像素块;
若NB与NA的比值大于或等于第二阀值T2,且小于1,当前像素块为静态像素块;
若NB与NA的比值小于第二阀值T2,当前像素块为动态像素块。
4.根据权利要求1所述的视频快速预测方法,其特征在于,
若不满足第五条件、第七条件、第六条件和第八条件,获取当前像素块的划分深度;
若所述划分深度为三,遍历出最优预测模式;
若所述划分深度小于三,将当前像素块进行下一深度的划分。
5.根据权利要求4所述的视频快速预测方法,其特征在于,所遍历的预测模式包括:
SKIP模式、merge模式、矩形运动分割模式Square、对称运动分割模式SMP、非对称运动分割模式AMP和帧内模式intra modes,
所述矩形运动分割模式包括inter 2N×2N和inter N×N;
所述对称运动分割模式包括inter 2N×N和inter N×2N;
所述非对称运动分割模式包括inter 2N×nU、inter 2N×nD、inter nL×2N和internR×2N;
所述帧内模式包括intra 2N×2N和intra N×N。
6.根据权利要求1所述的视频快速预测方法,其特征在于,
若不满足第五条件、第七条件、第六条件和第八条件,判断当前像素块是否满足第四条件,所述第四条件包括:像素块的类型为动态像素块、P(CUi)≥T4且P(CUi+1)≥T4,
若满足第四条件,将当前像素块进行下一深度的划分;
若不满足第四条件,遍历预测模式;并判断当前像素块的划分深度是否为三;
若为三,当前划分深度为最优深度,将代价最低的模式确定为最优预测模式。
7.一种基于H265的视频快速编码的方法,其特征在于,根据如权利要求1-6任一项所述视频快速预测方法获得的像素块及其最优预测模式,获得像素块与上一帧相同位置像素块的预测残差;
对所述预测残差进行变换,获得变换系数;
对所述变换系数量化后,进行熵编码。
8.一种用于实现如权利要求1-6任一项所述视频快速预测方法的系统,其特征在于,包括获取模块、像素点分型模块、像素块分型模块、差异度分析模块和预测模式筛选模块,
所述获取模块用于获取视频图像的像素块;
所述像素点分型模块用于根据与帧间同位置像素块的像素点的像素值差,获得像素点的类型;
所述像素块分型模块用于根据背景点的比例,获取所述像素块的类型;
所述差异度分析模块用于获取帧间像素块的差异度;
预测模式筛选模块用于:在满足第五条件或第六条件时,当前像素块的划分深度设为最优深度,从第一列表中获取最优预测模式;在满足第七条件或第八条件时,当前像素块的划分深度设为最优深度,从第二列表中获取最优预测模式。
9.根据权利要求8所述的系统,其特征在于,还包括像素块划分模块,
所述预测模式筛选模块还用于:在不满足第五条件、第七条件、第六条件和第八条件时,获取当前像素块的划分深度;
若所述划分深度为三,遍历出最优预测模式;
若所述划分深度小于三,通过像素块划分模块将当前像素块进行下一深度的划分。
10.根据权利要求9所述的系统,其特征在于,还包括预测模块、变化模块、量化模块和熵编码模块,
所述预测模块用于根据像素块及其最优预测模式,获得像素块与上一帧相同位置像素块的预测残差;
所述变化模块用于对所述预测残差进行变换,获得变换系数;
所述量化模块用于对所述变换系数进行量化,获得量化数据;
所述熵编码模块用于根据所述量化数据进行熵编码。
CN202110507323.XA 2021-05-10 2021-05-10 一种基于h265的视频快速预测方法、快速编码方法和系统 Active CN113163199B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110507323.XA CN113163199B (zh) 2021-05-10 2021-05-10 一种基于h265的视频快速预测方法、快速编码方法和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110507323.XA CN113163199B (zh) 2021-05-10 2021-05-10 一种基于h265的视频快速预测方法、快速编码方法和系统

Publications (2)

Publication Number Publication Date
CN113163199A CN113163199A (zh) 2021-07-23
CN113163199B true CN113163199B (zh) 2023-06-30

Family

ID=76874381

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110507323.XA Active CN113163199B (zh) 2021-05-10 2021-05-10 一种基于h265的视频快速预测方法、快速编码方法和系统

Country Status (1)

Country Link
CN (1) CN113163199B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113613006B (zh) * 2021-07-30 2023-08-18 浙江裕瀚科技有限公司 一种视频编码的方法、系统和装置

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101159873A (zh) * 2007-11-16 2008-04-09 中国科学院计算技术研究所 一种帧间模式选择方法
CN104113754A (zh) * 2014-07-17 2014-10-22 四川大学 基于时域相关性的高性能视频帧间编码方法及其转码器
CN107623850A (zh) * 2017-09-26 2018-01-23 杭州电子科技大学 一种基于时空相关性的快速屏幕内容编码方法
CN109302610A (zh) * 2018-10-26 2019-02-01 重庆邮电大学 一种基于率失真代价的屏幕内容编码帧间快速算法
CN110446040A (zh) * 2019-07-30 2019-11-12 暨南大学 一种适用于hevc标准的帧间编码方法与系统
CN110519597A (zh) * 2019-09-05 2019-11-29 北京佳讯飞鸿电气股份有限公司 一种基于hevc的编码方法、装置、计算设备和介质

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101054543B1 (ko) * 2003-08-25 2011-08-04 에이전시 포 사이언스, 테크놀로지 앤드 리서치 영상 코딩에서의 인터 예측을 위한 모드 선택
US8275046B2 (en) * 2008-09-19 2012-09-25 Texas Instruments Incorporated Fast macroblock structure decision using SAD discrepancy and its prediction mode
WO2015015436A2 (en) * 2013-07-30 2015-02-05 Riversilica Technologies Pvt Ltd System and method for performing optimal temporal predictive mode decision in h.264 video coding
WO2019174594A1 (en) * 2018-03-14 2019-09-19 Mediatek Inc. Method and apparatus of optimized splitting structure for video coding

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101159873A (zh) * 2007-11-16 2008-04-09 中国科学院计算技术研究所 一种帧间模式选择方法
CN104113754A (zh) * 2014-07-17 2014-10-22 四川大学 基于时域相关性的高性能视频帧间编码方法及其转码器
CN107623850A (zh) * 2017-09-26 2018-01-23 杭州电子科技大学 一种基于时空相关性的快速屏幕内容编码方法
CN109302610A (zh) * 2018-10-26 2019-02-01 重庆邮电大学 一种基于率失真代价的屏幕内容编码帧间快速算法
CN110446040A (zh) * 2019-07-30 2019-11-12 暨南大学 一种适用于hevc标准的帧间编码方法与系统
CN110519597A (zh) * 2019-09-05 2019-11-29 北京佳讯飞鸿电气股份有限公司 一种基于hevc的编码方法、装置、计算设备和介质

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
Fast Algorithm for CU Partitioning and Mode Selection in HEVC Intra Prediction;J. Lu等;《2019 12th International Congress on Image and Signal Processing, BioMedical Engineering and Informatics (CISP-BMEI)》;1-5 *
基于HEVC 的快速帧间预测算法;李静敏等;《电视技术》;第40卷(第7期);1-5 *
基于纹理相似性的高效视频编码帧间预测优化算法;吴宪云;高媛媛;刘凯;李云松;;电子与信息学报(03);655-660 *

Also Published As

Publication number Publication date
CN113163199A (zh) 2021-07-23

Similar Documents

Publication Publication Date Title
US7602851B2 (en) Intelligent differential quantization of video coding
CN102648627B (zh) 率失真优化量化的加速技术
US7499492B1 (en) Video compression and encoding method
US8363728B2 (en) Block based codec friendly edge detection and transform selection
KR100999091B1 (ko) 임의 크기의 가변 블록을 이용한 영상 압축 방법 및 장치
KR20050045746A (ko) 계층 구조의 가변 블록 크기를 이용한 움직임 추정 방법및 장치
EP1359770B1 (en) Signaling for fading compensation in video encoding
KR102138828B1 (ko) 영상 부호화 방법 및 장치
JP2007503776A (ja) インター符号化に使われる参照画像数を最小化するための方法および装置
KR20020077884A (ko) 블록 매칭 프로세스를 사용하는 비디오 코딩 방법
KR19990067723A (ko) 비디오 프레임 시퀀스의 인코딩 방법 및 시스템과, 제조 물품
KR20050119422A (ko) 움직임 보상에 기반한 입력 영상의 노이즈 예측 및 그장치와, 이를 사용한 노이즈 제거 및 동영상 부호화 방법,이를 수행하기 위한 프로그램이 기록된 기록 매체
Hsu et al. Fast coding unit decision algorithm for HEVC
US20110002555A1 (en) Dominant gradient method for finding focused objects
CN117136540A (zh) 残差编码方法及设备、视频编码方法及设备、存储介质
CN113163199B (zh) 一种基于h265的视频快速预测方法、快速编码方法和系统
CN112243123B (zh) 一种基于无损编码的hevc码率优化方法
CN114827616A (zh) 一种基于时空信息平衡的压缩视频质量增强方法
Chen et al. CNN-based fast HEVC quantization parameter mode decision
CN110446042B (zh) 一种提升h.264中p帧质量的编码方法
JPH11513873A (ja) ブロック・ベースのコード化システムにおいてコード化モードを選択するための装置および方法
CN113055670B (zh) 一种基于hevc/h.265的视频编码的方法及系统
An et al. Low-complexity motion estimation for H. 264/AVC through perceptual video coding.
CN104602001A (zh) 一种基于帧差图像的低码率视频编码方法
KR101337410B1 (ko) 동영상 부호기의 대블록에 대한 비트율 제어 방법

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant