CN106657999A - 一种hevc帧内预测编码单元快速选择方法 - Google Patents

一种hevc帧内预测编码单元快速选择方法 Download PDF

Info

Publication number
CN106657999A
CN106657999A CN201611027060.8A CN201611027060A CN106657999A CN 106657999 A CN106657999 A CN 106657999A CN 201611027060 A CN201611027060 A CN 201611027060A CN 106657999 A CN106657999 A CN 106657999A
Authority
CN
China
Prior art keywords
blocks
variance
means clustering
hevc
complexity
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201611027060.8A
Other languages
English (en)
Inventor
陈洁
周圆
张业达
毛爱玲
侯春萍
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tianjin University
Original Assignee
Tianjin University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tianjin University filed Critical Tianjin University
Priority to CN201611027060.8A priority Critical patent/CN106657999A/zh
Publication of CN106657999A publication Critical patent/CN106657999A/zh
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/105Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/567Motion estimation based on rate distortion criteria

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

本发明公开了一种HEVC帧内预测编码单元快速选择方法,所述方法包括以下步骤:首先从图像纹理复杂度的特点出发,获取图像纹理复杂度与CU块尺寸之间的关系;将图像纹理复杂度作为K‑means聚类算法的输入向量;将HEVC原有的帧内算法与k‑means聚类方法相结合,最终实现CU块的划分。本方法在现有的K‑means聚类算法的基础上,结合帧内预测算法,提出更好的帧内编码单元划分的方法,在视频质量几乎不降低的情况下,实现视频编码复杂度的降低,满足了实际应用中的需要。

Description

一种HEVC帧内预测编码单元快速选择方法
技术领域
本发明涉及视频编解码领域,尤其涉及一种HEVC帧内预测编码单元(CodingUnit,CU)快速选择方法,该方法用于降低视频编码的复杂度。
背景技术
近年来,人们对于视频的质量要求越来越高,因此如何有效地压缩视频成为当前研究的重点。高效率视频编码(HEVC)是一种新的编码压缩标准,作为H.264/AVC(高级视频编码)编码技术的继任者,HEVC提供了更好地性能、以及支持更高地分辨率。
然而,HEVC编码的复杂度也在急剧增加。编码复杂度增加的其中一个主要原因为不同于H.264/AVC的固定尺寸的编码单元,HEVC的编码单元是多尺寸的,因此如何快速地进行帧内预测单元的选择成为视频压缩编码领域一项重要的研究方向。
发明内容
本发明提供了一种HEVC帧内预测编码单元快速选择方法,本发明针对于帧内预测模式中编码单元的快速选择,提出了一种基于图像纹理复杂度的CU模式选择算法,有效地降低了帧内编码所需的时间,详见下文描述:
一种HEVC帧内预测编码单元快速选择方法,所述方法包括以下步骤:
首先从图像纹理复杂度的特点出发,获取图像纹理复杂度与CU块尺寸之间的关系;
将图像纹理复杂度作为K-means聚类算法的输入向量;
将HEVC原有的帧内算法与k-means聚类方法相结合,最终实现CU块的划分。
其中,所述获取图像纹理复杂度与CU块尺寸之间的关系的步骤具体为:
利用CU块的方差值代表像素间的差异,表示视频图像的纹理复杂度。
其中,所述将HEVC原有的帧内算法与k-means聚类方法相结合,最终实现CU块的划分的步骤具体为:
通过K-means聚类算法、获得不同尺寸CU块的聚类中心;
计算当前CTU块的图像纹理复杂度;根据CTU块的方差和欧氏距离对当前CU块进行划分;
利用当前CTU的方差得到其所处的尺寸的范围,在此范围内进行率失真代价计算,从而降低块划分的复杂度;完成CTU的块划分。
其中,所述通过K-means聚类算法、获得不同尺寸CU块的聚类中心的步骤具体为:
从过滤后的数据中随机选取4个方差值作为K-means聚类算法的最初聚类中心点;
遍历除4个最初聚类中心点以外的其他所有可用的方差值,根据最小距离的原则,寻找出每个方差所满足的聚类中心点,并将该方差值加入到此聚类中心所处的聚类中;
计算每个聚类中方差的平均值,将该值选作为聚类的新的中心点,直到连续两次所获得的距离中心相同为止。
本发明提供的技术方案的有益效果是:本方法在现有的K-means聚类算法的基础上,结合帧内预测算法,提出更好的帧内编码单元划分的方法,在视频质量几乎不降低的情况下,实现视频编码复杂度的降低,满足了实际应用中的需要。
附图说明
图1为一种HEVC帧内预测编码单元快速选择方法的流程图;
图2为测试序列CU块划分结果(QP=27)的示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面对本发明实施方式作进一步地详细描述。
实施例1
本发明实施例提供了一种HEVC帧内预测编码单元快速选择方法,参见图1,该选择方法包括以下步骤:
101:首先从图像纹理复杂度的特点出发,获取图像纹理复杂度与CU块尺寸之间的关系;
102:将图像纹理复杂度作为K-means聚类算法的输入向量;
103:将HEVC原有的帧内算法与k-means聚类方法相结合,最终实现CU块的划分。
综上所述,本方法在现有的K-means聚类算法的基础上,结合帧内预测算法,提出更好的帧内编码单元划分的方法,在视频质量几乎不降低的情况下,实现视频编码复杂度的降低,满足了实际应用中的需要。
实施例2
下面结合具体的计算公式、例子对实施例1中的方案进行详细介绍,详见下文描述:
201:对每一个视频测试序列进行块划分,获取CU块的划分结果;
其中,为了验证图像的纹理复杂度与CU块的尺寸之间的关系,对一个视频测试序列进行块划分,得到CU块的划分结果,如图2所示。
从图2中可以看出墙壁等区域基本采用64×64和32×32尺寸的CU块,这些区域的纹理比较平坦且像素间的差距较小;而羽毛和眼睛等区域的纹理较为复杂,基本采用了16×16和8×8尺寸的CU块。
具体实现时,本发明实施例对上述划分尺寸不做限制,可以根据实际应用中的需要进行设定。
202:利用CU块的方差值代表像素间的差异,进一步表示视频图像的纹理复杂度;
其中,CU块方差求解公式如下:
其中,M和N为视频图像区域块的长和宽,i和j为像素的位置坐标,P(i,j)指在(i,j)处的像素值,δM×N是图像块的方差,Mean是指图像块的平均像素值。
为了进一步得到图像块的方差与CU块划分之间的关系,本发明实施例选取多个视频测试序列,使用HEVC的参考代码HM对视频序列进行帧内预测模式选择,获得每个测试序列的CU最佳尺寸,并且计算得到各种尺寸CU块的方差,统计结果如表1所示。
表1 CU块方差平均范围
CU尺寸 方差的平均值 方差的平均范围
64×64 106.78 20-163.79
32×32 149.65 73.65-223.98
16×16 251.68 124.78-379.53
8×8 612.55 309.84-1000
203:根据CU块的方差和K-means聚类算法获得CU块的聚类中心;
从表1中可以看出,相同尺寸CU块的方差值比较接近,不同尺寸CU块的方差值相差较大,因此本发明实施例可以将CU各个尺寸的方差δM×N作为K-means聚类算法的输入向量。
其中,不同尺寸CU块聚类中心获取过程如下:
1)首先选取不同分辨率的视频测试序列,通过HM得到HEVC原有算法的CU块最佳尺寸,并且计算得到CU块最优尺寸对应的方差值,将获得的方差值作为K-means聚类算法的输入向量;
2)对方差值后的数据进行过滤处理;
其中,HEVC块划分的依据是RDO(视频编码率失真优化),一个图像块很有可能只有小部分区域纹理复杂而大部分区域的纹理相对平坦,但是因为CU块通过RDO计算后不会再进行划分,而当前尺寸CU块的方差与同尺寸CU块的平均方差相比有一定的偏差,所以需要计算各种尺寸CU块的方差的平均范围,如表1所示。
因为K-means聚类算法对于孤立点数据较为敏感,所以在计算CU块的方差平均范围时,需要将方差值不在20到1000范围内的数值去除。具体实现时,还可以根据实际应用中的需要,设定其他的数值范围,本发明实施例对此不做限制。
3)从过滤后的数据中随机选取4个方差值作为K-means聚类算法的最初聚类中心点;
4)遍历除4个最初聚类中心点以外的其他所有可用的方差值,根据最小距离的原则,寻找出每个方差所满足的聚类中心点,并将该方差值加入到此聚类中心所处的聚类中。
其中,最小距离原则公式如下所示:
其中,xj为输入的数据,j为聚类中输入向量的索引值,μi为聚类的中心点。假设提取到的原始数据的集合为{x1,x2,…,xi,…,xn},且每个数据xi为d维向量;Si为第i个聚类;S为聚类集合,S={S1,S2,…,Sk};k为聚类个数。
5)计算每个聚类中方差的平均值,将该值选作为聚类的新的中心点,之后重复执行步骤4),直到连续两次所获得的距离中心相同为止。
6)通过K-means聚类算法最终获得的不同尺寸CU块的聚类中心,如表2所示。
表2 CU的聚类中心
CU尺寸 K-means聚类中心
64×64 161.06
32×32 386.28
16×16 606.44
8×8 859.04
204:开始CU尺寸为64×64的CTU块划分选择过程;
205:计算当前CTU块的图像纹理复杂度;
206:根据CTU块的方差和欧氏距离对当前CU块进行划分;
根据表2所获得的不同尺寸CU块的聚类中心,可以获得当前CTU所属的聚类并且按照该聚类对应的CU尺寸进行划分。
207:利用当前CTU的方差得到其所处的尺寸的范围,在此范围内进行率失真代价计算,从而降低块划分的复杂度;
208:完成CTU的块划分。
综上所述,本方法在现有的K-means聚类算法的基础上,结合帧内预测算法,提出更好的帧内编码单元划分的方法,在视频质量几乎不降低的情况下,实现视频编码复杂度的降低,满足了实际应用中的需要。
实施例3
下面结合具体的实验数据、以及表3、表4对实施例1和2中的方案进行可行性验证,详见下文描述:
为了评估所提出方法的性能,本方法在HM9.0上进行实验,实验平台硬件配置为:3GHz的CPU和8GB的内存。开发工具是VS2010,测试的配置是HEVC编码所通用的测试条件,编码的帧数为50帧,QP={22,27,32,37}。本实验对4个不同分辨率的视频序列进行测试,测试序列的相关参数如表3所示。
表3测试序列相关信息
将本方法与HM9.0标准算法进行比较,算法的性能通过ΔBR,ΔPSNR和ΔT进行评估。其中ΔPSNR为PSNR(峰值信噪比)的变化值,其值为正时,表示改进算法的PSNR有所下降,视频质量有所降低;ΔBR为比特率(Bit Rate,BR)的变化值,其值为负时,表示改进算法与原有算法相比,BR值有所增加;ΔT为原有算法与改进算法的编码时间差值百分比,其值为正时,表示改进算法的编码时间有所减少,编码复杂度有所降低。
ΔPSNR=PSNRHM9.0-PSNR本算法
其中,按上述测试环境对四种不同分辨率的视频序列进行测试,根据评估指标将本方法与HM9.0原有方法进行了比较,结果如表4所示。
表4不同QP下,HM9.0与本方法结果对比
通过观察表4得知,本方法与HM9.0方法相比,本方法的编码时间平均减少了20.61%;与此同时,本方法的PSNR平均只有0.01dB的增长。
从这些数据中可以看出,在视频质量几乎没有改变的基础上,本方法的编码时间有所降低。本方法主要是采用K-means离线训练获得CU块的尺寸与图像方差间的关系,从而减少了RDO的次数,最终实现编码时间的降低。
本领域技术人员可以理解附图只是一个优选实施例的示意图,上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (4)

1.一种HEVC帧内预测编码单元快速选择方法,其特征在于,所述方法包括以下步骤:
首先从图像纹理复杂度的特点出发,获取图像纹理复杂度与CU块尺寸之间的关系;
将图像纹理复杂度作为K-means聚类算法的输入向量;
将HEVC原有的帧内算法与k-means聚类方法相结合,最终实现CU块的划分。
2.根据权利要求1所述的一种HEVC帧内预测编码单元快速选择方法,其特征在于,所述获取图像纹理复杂度与CU块尺寸之间的关系的步骤具体为:
利用CU块的方差值代表像素间的差异,表示视频图像的纹理复杂度。
3.根据权利要求1所述的一种HEVC帧内预测编码单元快速选择方法,其特征在于,所述将HEVC原有的帧内算法与k-means聚类方法相结合,最终实现CU块的划分的步骤具体为:
通过K-means聚类算法、获得不同尺寸CU块的聚类中心;
计算当前CTU块的图像纹理复杂度;根据CTU块的方差和欧氏距离对当前CU块进行划分;
利用当前CTU的方差得到其所处的尺寸的范围,在此范围内进行率失真代价计算,从而降低块划分的复杂度;完成CTU的块划分。
4.根据权利要求3所述的一种HEVC帧内预测编码单元快速选择方法,其特征在于,所述通过K-means聚类算法、获得不同尺寸CU块的聚类中心的步骤具体为:
从过滤后的数据中随机选取4个方差值作为K-means聚类算法的最初聚类中心点;
遍历除4个最初聚类中心点以外的其他所有可用的方差值,根据最小距离的原则,寻找出每个方差所满足的聚类中心点,并将该方差值加入到此聚类中心所处的聚类中;
计算每个聚类中方差的平均值,将该值选作为聚类的新的中心点,直到连续两次所获得的距离中心相同为止。
CN201611027060.8A 2016-11-15 2016-11-15 一种hevc帧内预测编码单元快速选择方法 Pending CN106657999A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201611027060.8A CN106657999A (zh) 2016-11-15 2016-11-15 一种hevc帧内预测编码单元快速选择方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201611027060.8A CN106657999A (zh) 2016-11-15 2016-11-15 一种hevc帧内预测编码单元快速选择方法

Publications (1)

Publication Number Publication Date
CN106657999A true CN106657999A (zh) 2017-05-10

Family

ID=58807410

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201611027060.8A Pending CN106657999A (zh) 2016-11-15 2016-11-15 一种hevc帧内预测编码单元快速选择方法

Country Status (1)

Country Link
CN (1) CN106657999A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109688414A (zh) * 2018-12-19 2019-04-26 同济大学 一种vvc帧内编码单元候选预测模式缩减及块划分提前终止方法
CN109889842A (zh) * 2019-02-21 2019-06-14 北方工业大学 基于knn分类器的虚拟现实视频cu划分算法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
周承涛: "HEVC编码快速算法关键技术研究", 《中国博士学位论文全文数据库信息科技辑》 *
黄秋情,杨秀芝,郑明魁,苏凯雄: "一种高清帧内预测单元快速选择算法", 《福州大学学报(自然科学版)》 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109688414A (zh) * 2018-12-19 2019-04-26 同济大学 一种vvc帧内编码单元候选预测模式缩减及块划分提前终止方法
CN109889842A (zh) * 2019-02-21 2019-06-14 北方工业大学 基于knn分类器的虚拟现实视频cu划分算法
CN109889842B (zh) * 2019-02-21 2022-02-08 北方工业大学 基于knn分类器的虚拟现实视频cu划分算法

Similar Documents

Publication Publication Date Title
US10848765B2 (en) Rate/distortion/RDcost modeling with machine learning
US9716891B2 (en) Quantization method and apparatus in encoding/decoding
US9813708B2 (en) Method and system of coding prediction for screen video
CN106937116B (zh) 基于随机训练集自适应学习的低复杂度视频编码方法
CN106131554B (zh) 基于主要边缘方向的hevc快速样点自适应补偿方法
CN108347612B (zh) 一种基于视觉注意机制的监控视频压缩与重构方法
EP3068134B1 (en) Method and device for image compression
CN106170093B (zh) 一种帧内预测性能提升编码方法
CN106303521B (zh) 一种基于感知敏感度的hevc率失真优化方法
CN108353175A (zh) 使用系数引起的预测处理视频信号的方法和装置
CN111556315A (zh) 数据传输方法及装置
CN106657999A (zh) 一种hevc帧内预测编码单元快速选择方法
CN107277519A (zh) 一种判断视频帧的帧类型的方法及电子设备
CN110139098B (zh) 基于决策树的高效率视频编码器帧内快速算法选择方法
CN112911298B (zh) 一种基于边界效应的hevc视频双压缩检测方法及系统
CN110493597A (zh) 一种高效感知视频编码优化方法
Zhao et al. Fast CU partition decision strategy based on human visual system perceptual quality
CN107509074B (zh) 基于压缩感知的自适应3d视频压缩编解码方法
CN115802038A (zh) 一种量化参数确定方法、装置及一种视频编码方法、装置
CN112839234B (zh) 屏幕内容编码标准帧内图像码率的估计方法
CN104902256B (zh) 一种基于运动补偿的双目立体图像编解码方法
CN114189688B (zh) 基于亮度模板匹配的色度分量预测方法
CN109982079B (zh) 一种结合纹理空间相关性的帧内预测模式选择方法
Fischer et al. Evaluation of video coding for machines without ground truth
Chao et al. Keypoint encoding and transmission for improved feature extraction from compressed images

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20170510