CN111741313A - 基于图像熵k均值聚类的3d-hevc快速cu分割方法 - Google Patents

基于图像熵k均值聚类的3d-hevc快速cu分割方法 Download PDF

Info

Publication number
CN111741313A
CN111741313A CN202010418949.9A CN202010418949A CN111741313A CN 111741313 A CN111741313 A CN 111741313A CN 202010418949 A CN202010418949 A CN 202010418949A CN 111741313 A CN111741313 A CN 111741313A
Authority
CN
China
Prior art keywords
matrix
cluster
dimensional
entropy
divided
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010418949.9A
Other languages
English (en)
Other versions
CN111741313B (zh
Inventor
张桦
姚王泽
黄鸿飞
沈菲
戴国骏
吴以凡
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou Dianzi University
Original Assignee
Hangzhou Dianzi University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou Dianzi University filed Critical Hangzhou Dianzi University
Priority to CN202010418949.9A priority Critical patent/CN111741313B/zh
Publication of CN111741313A publication Critical patent/CN111741313A/zh
Application granted granted Critical
Publication of CN111741313B publication Critical patent/CN111741313B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/597Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding specially adapted for multi-view video sequence encoding
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N13/10Processing, recording or transmission of stereoscopic or multi-view image signals
    • H04N13/106Processing image signals
    • H04N13/161Encoding, multiplexing or demultiplexing different image signal components

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Image Analysis (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

本发明公开了一种基于图像熵K均值聚类的3D‑HEVC快速CU分割方法。快速CU分割预测编码决策方法在CU划分之前,首先将CU平均划分为四块,然后对CU整体以及各小块分别进行二维熵计算,并合成一个五维向量,然后对其进行K均值聚类(K均值聚类模型需要进行离线训练得到各尺寸的聚类中心),若判断为不需要划分,则停止对CU的划分,否则进入递归进一步划分。二维熵具有能突显图像分布特征以及混乱程度的能力,以此为基础进行K均值训练从而能够得到判断是否划分的模型。本发明直接对CU进行判断,减少了递归带来的时间消耗因此具有计算复杂度低、编码时间短和视频重建效果好的特点。

Description

基于图像熵K均值聚类的3D-HEVC快速CU分割方法
技术领域
本发明涉及视频编码领域,具体是一种基于图像熵K均值聚类的3D-HEVC快速CU分割方法。
背景技术
在过去几年里,随着3D视频服务需求的增加,3D视频的展现、压缩和传输成为一个新的有挑战的研究课题。多视角加深度图(MVD)的视频格式是多种有发展前景的视频表现形式中的一种。由3D视频编码扩展开发联合协作组(JCT-3V)提出的高质量视频编码的3D扩展(3D-HEVC)是对于压缩MVD数据的一种新兴视频编码标准。
传统的CU分割是以递归划分至最小尺寸后逐渐向上比较进行判断是否划分,其时间复杂度很大,我们可以在其划分之前加入判断该CU矩阵是否需要划分,若不需要划分则不必进入递归判断,否则进入递归划分,由于深度图中平缓的较多,所以其中很多CU都不需要划分,可大大减少CU分割的时间。
图像二维熵能够反映灰度分布空间特征的特征量,可以在图像所包含信息量的前提下,突出反映图像中像素位置的灰度信息和像素邻域内灰度分布的综合特征,此外还可以通过熵的值表示信息的混乱程度。
k均值聚类算法(k-means clustering algorithm)是一种迭代求解的聚类分析算法,可以简洁高效的将每个对象进行分类,并最终计算出聚类中心来作为分类的依据。
发明内容
本发明的目的是鉴于图像二维熵在提取图像信息方面的作用,提出一种基于图像熵K均值聚类的3D-HEVC快速CU分割方法,该方法将视频中的一帧图像进行图像二维熵计算,再经过K均值模型进行分类。该方法具有计算复杂度低、编码时间短和视频重建效果好的特点。
为了实现上述目的,本发明的技术方案包括如下步骤:
步骤1:选取不同序列以及不同QP值、不同尺寸的CU矩阵进行K均值离线训练,得到离线训练模型。
对于输入的CU矩阵,将其划分为四个子块,并对每一个子块及整个CU矩阵进行二维熵计算,形成一个五维向量。将五维向量输入训练模型,得到离线训练模型,并根据离线训练模型最终得到不同尺寸、不同QP的聚类中心。
步骤2:正式进行预测时,读入CU矩阵,划分为四个子块后进行二维熵计算并形成一个五维向量,将该五维向量输入K均值离线训练模型,进行聚类;
步骤3:如果属于聚类0,直接跳转至步骤5;
步骤4:如果属于聚类1,则让该读入的CU矩阵进入递归,将该CU矩阵划分为4个大小为N/2*N/2的子块,将每个子块作为新的CU矩阵,跳转到步骤2;所述的N为CU矩阵的尺寸;
步骤5:该CU矩阵不需要划分,划分过程结束。
步骤1所述的二维熵计算如下:
首先将CU矩阵平均分成四个子块,对每个子块以及整个CU矩阵分别进行计算。对于每个子块以及整个CU矩阵,遍历其所有像素点并计算像素点周围其余8个像素点的均值;如果该像素为CU四个角落点,则计算其周围三个像素点均值;若该像素为CU四个边点,则计算其周围五个像素点均值;同时进行统计当像素点数值为i时,其周围像素均值为j的数量,由此得到特征二元组f(i,j),表示像素点数值为i,且其周围像素均值为j的数量;通过特征二元组f(i,j)计算该特征二元组f(i,j)的比例值,公式如下:
p(i,j)=f(i,j)/N2
其中N为所遍历对象的尺寸长度;
最后计算CU矩阵的二维熵,公式如下:
Figure BDA0002496115730000021
计算出每个子块以及整个CU矩阵的二维熵,并将其合为一组五维向量。
步骤1所述的K均值算法如下:
从3DHEVC的测试序列GT_fly,street,kendo,balloons,shark,hall,newspaper,dancer中,用其原始算法(计算rd cost并比较大小来判断是否需要划分)得到的QP分别为25、30、35、40,CU尺寸分别为64、32、16的矩阵各一万个(所有矩阵都已经标记是否需要划分)。即QP为25,CU尺寸为64的矩阵一万个,QP为25,CU尺寸为32的矩阵一万个,QP为25,CU尺寸为16的矩阵一万个,QP为30,CU尺寸为64的矩阵一万个等。
然后以同QP同尺寸的一万个矩阵为单位进行训练。分别将每个矩阵平均分为四个小块,计算其小块与整体的二维熵并合并成一个五维向量。
对得到的所有五维向量进行预处理,去除偏差值大于预设阈值的数据。
最后将进行预处理筛选所得到的最终数据集分别进行K均值聚类训练,最终得到不同QP不同尺寸共12个聚类模型,其中将每个模型的聚类0设为需要划分。
所述的每个模型的聚类0和聚类1的分类实现如下:
对于已经训练好的模型,输入原始训练数据进行分类,若得到的结果中,聚类0所对应的需要划分的矩阵比例多,则聚类0为需要划分,聚类1为不需要划分,反之,若聚类1所对应的需要划分的矩阵比例多,则聚类1为需要划分,聚类0为不需要划分;最后,将所有表示需要划分的聚类点都设定为聚类1,将所有表示不需要划分的聚类点都设定为聚类0,以作为统一使用。
步骤2过程如下:
进行正式预测时,首先判断该输入CU矩阵属于的QP值以及尺寸大小,然后将其划分为四个小块,分别计算其二维熵以及整体的二维熵。将得到的五维向量输入对应QP值与尺寸值的K均值聚类模型,得到预测结果。
本发明的有益效果如下:
本发明使用二维熵以及K均值算法应用于三维视频编码,利用二维熵的提取图像信息的作用以及K均值算法的分类能力,能有效的在视频码率减少的同时减少了编码时间,避免了计算冗余模式,减少计算量。
进一步的,通过计算图像及其子图像共五个二维熵所合成的五维向量来进行K均值算法训练,较大程度提升了判断准确度。同时,在进行实际递归判断时,由于只需要输入模型就能立刻得到结果从而避免了大量计算,极大的提升了编码时间。
附图说明
图1是K均值算法离线训练流程图
图2是CU分割预测方法流程图
图3是完整的分割流程图
具体实施方式
下面结合附图和实施例对本发明作进一步说明。
如图1所示,本发明具体包括如下步骤:
步骤1.进行K均值算法离线训练,分别取序列GT_fly,street,kendo,balloons,shark,hall,newspaper,dancer的QP为25,30,35,40尺寸为64×64、32×32,16×16CU矩阵一万个。
步骤2.以每一万个矩阵为单位训练。判断该矩阵集的QP值,然后判断该矩阵集的尺寸。
步骤3.将每一个矩阵平均划分为四块,并对每一块以及整体进行二维熵计算,形成一个五维向量,二维熵计算过程如下:
首先将CU矩阵平均分成四个子块,对每个子块以及整个CU矩阵分别进行计算。对于每个子块以及整个CU矩阵,遍历其所有像素点并计算像素点周围其余8个像素点的均值;如果该像素为CU四个角落点,则计算其周围三个像素点均值;若该像素为CU四个边点,则计算其周围五个像素点均值;同时进行统计当像素点数值为i时,其周围像素均值为j的数量,由此得到特征二元组f(i,j),表示像素点数值为i,且其周围像素均值为j的数量;通过特征二元组f(i,j)计算该特征二元组f(i,j)的比例值,公式如下:
p(i,j)=f(i,j)/N2
其中N为CU矩阵的尺度长,若CU未划分,则N为整个CU矩阵的尺度长,若CU已划分,则N为划分后子CU矩阵的尺度;
最后计算CU矩阵的二维熵,公式如下:
Figure BDA0002496115730000051
计算出每个子块以及整个CU矩阵的二维熵,并将其合为一组五维向量。
步骤4.对得到的所有五维向量进行预处理,去除偏差值大于预设阈值的数据。随后输入K均值模型中进行训练,聚类0设置为判断不划分。得到属于具体QP值以及CU尺寸的聚类中心12个。
如图2所示,本发明分割预测方法,具体包括如下步骤:
步骤(1).基于3D-HEVC,得到一个N*N(N=64,32,16,N>8,第一次为64)大小的CU后,将其平均划分为四块矩阵,分别对其进行二维熵计算,最后对整体进行二维熵计算,并合并成一个五维向量。
步骤2:进行K均值算法聚类判断。若属于聚类0,则跳转至步骤4,若不属于聚类0,则跳转至步骤3
步骤3:让该CU进入递归,将该CU划分为4个大小为N/2*N/2的子CU,对每个子CU,跳转到步骤1;
步骤4:该CU不需要划分,划分过程结束。
如图3所示,基于图像二维熵K均值聚类的3D-HEVC快速CU分割预测方法,完整的分割流程图具体如下:读入一个64*64的CU,经过基于图像二维熵的K均值算法判断其需不需要划分,若不需要划分,该CU划分过程结束;若需要划分,划分为4个32*32的子CU,然后分别读入32*32的CU,经过基于图像二维熵的K均值算法判断其需不需要划分,若不需要划分,该CU划分过程结束;若需要划分,划分为4个16*16的子CU,然后分别读入16*16的CU,经过基于图像二维熵的K均值算法判断其需不需要划分,若不需要划分,该CU划分过程结束;若需要划分,划分为4个8*8的子CU,划分为最小尺寸,划分过程结束。

Claims (5)

1.基于图像熵K均值聚类的3D-HEVC快速CU分割方法,其特征在于该方法将视频中的一帧图像进行图像二维熵计算,再经过K均值模型进行分类,具体包括如下步骤:
步骤1:选取不同序列以及不同QP值、不同尺寸的CU矩阵进行K均值离线训练,得到离线训练模型;
对于输入的CU矩阵,将其划分为四个子块,并对每一个子块及整个CU矩阵进行二维熵计算,形成一个五维向量;将五维向量输入训练模型,得到离线训练模型,并根据离线训练模型最终得到不同尺寸、不同QP的聚类中心;
步骤2:正式进行预测时,读入CU矩阵,划分为四个子块后进行二维熵计算并形成一个五维向量,将该五维向量输入K均值离线训练模型,进行聚类;
步骤3:如果属于聚类0,直接跳转至步骤5;
步骤4:如果属于聚类1,则让该读入的CU矩阵进入递归,将该CU矩阵划分为4个大小为N/2*N/2的子块,将每个子块作为新的CU矩阵,跳转到步骤2;所述的N为CU矩阵的尺寸;
步骤5:该CU矩阵不需要划分,划分过程结束。
2.根据权利要求1所述的基于图像熵K均值聚类的3D-HEVC快速CU分割方法,其特征在于步骤1所述的二维熵计算如下:
首先将CU矩阵平均分成四个子块,对每个子块以及整个CU矩阵分别进行计算;对于每个子块以及整个CU矩阵,遍历其所有像素点并计算像素点周围其余8个像素点的均值;如果该像素为CU四个角落点,则计算其周围三个像素点均值;若该像素为CU四个边点,则计算其周围五个像素点均值;同时进行统计当像素点数值为i时,其周围像素均值为j的数量,由此得到特征二元组f(i,j),表示像素点数值为i,且其周围像素均值为j的数量;通过特征二元组f(i,j)计算该特征二元组f(i,j)的比例值,公式如下:
p(i,j)=f(i,j)/N2
其中N为所遍历对象的尺寸长度;
最后计算CU矩阵的二维熵,公式如下:
Figure FDA0002496115720000021
计算出每个子块以及整个CU矩阵的二维熵,并将其合为一组五维向量。
3.根据权利要求1或2所述的基于图像熵K均值聚类的3D-HEVC快速CU分割方法,其特征在于步骤1所述的K均值算法如下:
从3DHEVC的测试序列GT_fly,street,kendo,balloons,shark,hall,newspaper,dancer中,用其原始算法得到的QP分别为25、30、35、40,CU尺寸分别为64、32、16的矩阵各一万个,且所有矩阵都已经标记是否需要划分;
然后以同QP同尺寸的一万个矩阵为单位进行训练;分别将每个矩阵平均分为四个小块,计算其小块与整体的二维熵并合并成一个五维向量;
对得到的所有五维向量进行预处理,去除偏差值大于预设阈值的数据;
最后将进行预处理筛选所得到的最终数据集分别进行K均值聚类训练,最终得到不同QP不同尺寸共12个聚类模型,其中将每个模型的聚类0设为需要划分。
4.根据权利要求3所述的基于图像熵K均值聚类的3D-HEVC快速CU分割方法,其特征在于每个模型的聚类0和聚类1的分类实现如下:
对于已经训练好的模型,输入原始训练数据进行分类,若得到的结果中,聚类0所对应的需要划分的矩阵比例多,则聚类0为需要划分,聚类1为不需要划分,反之,若聚类1所对应的需要划分的矩阵比例多,则聚类1为需要划分,聚类0为不需要划分;最后,将所有表示需要划分的聚类点都设定为聚类1,将所有表示不需要划分的聚类点都设定为聚类0,以作为统一使用。
5.根据权利要求1或3或4所述的基于图像熵K均值聚类的3D-HEVC快速CU分割方法,其特征在于步骤2过程如下:
进行正式预测时,首先判断该输入CU矩阵属于的QP值以及尺寸大小,然后将其划分为四个小块,分别计算其二维熵以及整体的二维熵;将得到的五维向量输入对应QP值与尺寸值的K均值聚类模型,得到预测结果。
CN202010418949.9A 2020-05-18 2020-05-18 基于图像熵k均值聚类的3d-hevc快速cu分割方法 Active CN111741313B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010418949.9A CN111741313B (zh) 2020-05-18 2020-05-18 基于图像熵k均值聚类的3d-hevc快速cu分割方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010418949.9A CN111741313B (zh) 2020-05-18 2020-05-18 基于图像熵k均值聚类的3d-hevc快速cu分割方法

Publications (2)

Publication Number Publication Date
CN111741313A true CN111741313A (zh) 2020-10-02
CN111741313B CN111741313B (zh) 2022-12-27

Family

ID=72647354

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010418949.9A Active CN111741313B (zh) 2020-05-18 2020-05-18 基于图像熵k均值聚类的3d-hevc快速cu分割方法

Country Status (1)

Country Link
CN (1) CN111741313B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112104867A (zh) * 2020-11-09 2020-12-18 腾讯科技(深圳)有限公司 一种视频处理方法、视频处理装置、智能设备及存储介质
CN115859369A (zh) * 2023-02-28 2023-03-28 聊城市洛溪信息科技有限公司 一种社交网络图片中隐私信息保护方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104883558A (zh) * 2015-06-05 2015-09-02 太原科技大学 基于k均值聚类的深度图编码方法
CN107592538A (zh) * 2017-09-06 2018-01-16 华中科技大学 一种降低立体视频深度图编码复杂度的方法
CN109714584A (zh) * 2019-01-11 2019-05-03 杭州电子科技大学 基于深度学习的3d-hevc深度图编码单元快速决策方法
CN109756719A (zh) * 2019-01-28 2019-05-14 华侨大学 基于cu划分贝叶斯决策的3d-hevc帧间快速方法
US20190230360A1 (en) * 2018-01-23 2019-07-25 Fujitsu Limited Apparatus and method for video image encoding and video image decoding
CN110460844A (zh) * 2019-08-13 2019-11-15 杭州电子科技大学 基于dwt的3d-hevc快速cu分割预测方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104883558A (zh) * 2015-06-05 2015-09-02 太原科技大学 基于k均值聚类的深度图编码方法
CN107592538A (zh) * 2017-09-06 2018-01-16 华中科技大学 一种降低立体视频深度图编码复杂度的方法
US20190230360A1 (en) * 2018-01-23 2019-07-25 Fujitsu Limited Apparatus and method for video image encoding and video image decoding
CN109714584A (zh) * 2019-01-11 2019-05-03 杭州电子科技大学 基于深度学习的3d-hevc深度图编码单元快速决策方法
CN109756719A (zh) * 2019-01-28 2019-05-14 华侨大学 基于cu划分贝叶斯决策的3d-hevc帧间快速方法
CN110460844A (zh) * 2019-08-13 2019-11-15 杭州电子科技大学 基于dwt的3d-hevc快速cu分割预测方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
王驰等: "3D-HEVC深度图帧内CU尺寸快速决策算法", 《通信技术》 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112104867A (zh) * 2020-11-09 2020-12-18 腾讯科技(深圳)有限公司 一种视频处理方法、视频处理装置、智能设备及存储介质
WO2022095871A1 (zh) * 2020-11-09 2022-05-12 腾讯科技(深圳)有限公司 一种视频处理方法、视频处理装置、智能设备及存储介质
CN115859369A (zh) * 2023-02-28 2023-03-28 聊城市洛溪信息科技有限公司 一种社交网络图片中隐私信息保护方法

Also Published As

Publication number Publication date
CN111741313B (zh) 2022-12-27

Similar Documents

Publication Publication Date Title
CN111462261B (zh) 针对h.266/vvc的快速cu分区和帧内决策方法
CN110689599B (zh) 基于非局部增强的生成对抗网络的3d视觉显著性预测方法
CN107371022B (zh) 应用于hevc医学影像无损编码的帧间编码单元快速划分方法
CN111741313B (zh) 基于图像熵k均值聚类的3d-hevc快速cu分割方法
CN110062234A (zh) 一种基于区域恰可察觉失真的感知视频编码方法
CN108337515A (zh) 一种视频编码方法及装置
CN108712648A (zh) 一种深度视频快速帧内编码方法
CN106937116A (zh) 基于随机训练集自适应学习的低复杂度视频编码方法
CN114972752B (zh) 一种基于轻量级交叉注意网络的实时语义分割的方法
CN106803962B (zh) 基于贝叶斯准则的3d视频深度图帧内预测模式选择方法
CN115695802A (zh) 一种用于加快视频编码的编码单元划分方法及装置
US11212518B2 (en) Method for accelerating coding and decoding of an HEVC video sequence
CN111385585B (zh) 一种基于机器学习的3d-hevc深度图编码单元划分方法
CN103002282B (zh) 一种颜色数目自适应决策方法和图像压缩方法
Liu et al. Fast intra coding algorithm for depth map with end-to-end edge detection network
CN116600107A (zh) 基于ipms-cnn和空域相邻cu编码模式的hevc-scc快速编码方法及装置
CN116091862A (zh) 一种画质识别方法、装置、设备、存储介质及产品
CN116033153A (zh) Vvc标准下的编码单元快速划分方法及系统
CN115661166A (zh) 一种用于增强压缩点云重建质量的装置及方法
CN105007494A (zh) 一种3d视频深度图像模型模式的帧内楔形分割模式选择方法
CN113784147A (zh) 一种基于卷积神经网络的高效视频编码方法及系统
Bakkouri et al. Effective CU size decision algorithm based on depth map homogeneity for 3D-HEVC inter-coding
CN116634147B (zh) 基于多尺度特征融合的hevc-scc帧内cu快速划分编码方法及装置
CN106375768B (zh) 基于帧内预测模式校准的视频隐写分析方法
CN109389546A (zh) 多分块可逆水印嵌入方法及装置、水印提取方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant