CN111741313A - 基于图像熵k均值聚类的3d-hevc快速cu分割方法 - Google Patents
基于图像熵k均值聚类的3d-hevc快速cu分割方法 Download PDFInfo
- Publication number
- CN111741313A CN111741313A CN202010418949.9A CN202010418949A CN111741313A CN 111741313 A CN111741313 A CN 111741313A CN 202010418949 A CN202010418949 A CN 202010418949A CN 111741313 A CN111741313 A CN 111741313A
- Authority
- CN
- China
- Prior art keywords
- matrix
- cluster
- dimensional
- entropy
- divided
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/597—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding specially adapted for multi-view video sequence encoding
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
- G06F18/23213—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N13/00—Stereoscopic video systems; Multi-view video systems; Details thereof
- H04N13/10—Processing, recording or transmission of stereoscopic or multi-view image signals
- H04N13/106—Processing image signals
- H04N13/161—Encoding, multiplexing or demultiplexing different image signal components
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Probability & Statistics with Applications (AREA)
- Image Analysis (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
本发明公开了一种基于图像熵K均值聚类的3D‑HEVC快速CU分割方法。快速CU分割预测编码决策方法在CU划分之前,首先将CU平均划分为四块,然后对CU整体以及各小块分别进行二维熵计算,并合成一个五维向量,然后对其进行K均值聚类(K均值聚类模型需要进行离线训练得到各尺寸的聚类中心),若判断为不需要划分,则停止对CU的划分,否则进入递归进一步划分。二维熵具有能突显图像分布特征以及混乱程度的能力,以此为基础进行K均值训练从而能够得到判断是否划分的模型。本发明直接对CU进行判断,减少了递归带来的时间消耗因此具有计算复杂度低、编码时间短和视频重建效果好的特点。
Description
技术领域
本发明涉及视频编码领域,具体是一种基于图像熵K均值聚类的3D-HEVC快速CU分割方法。
背景技术
在过去几年里,随着3D视频服务需求的增加,3D视频的展现、压缩和传输成为一个新的有挑战的研究课题。多视角加深度图(MVD)的视频格式是多种有发展前景的视频表现形式中的一种。由3D视频编码扩展开发联合协作组(JCT-3V)提出的高质量视频编码的3D扩展(3D-HEVC)是对于压缩MVD数据的一种新兴视频编码标准。
传统的CU分割是以递归划分至最小尺寸后逐渐向上比较进行判断是否划分,其时间复杂度很大,我们可以在其划分之前加入判断该CU矩阵是否需要划分,若不需要划分则不必进入递归判断,否则进入递归划分,由于深度图中平缓的较多,所以其中很多CU都不需要划分,可大大减少CU分割的时间。
图像二维熵能够反映灰度分布空间特征的特征量,可以在图像所包含信息量的前提下,突出反映图像中像素位置的灰度信息和像素邻域内灰度分布的综合特征,此外还可以通过熵的值表示信息的混乱程度。
k均值聚类算法(k-means clustering algorithm)是一种迭代求解的聚类分析算法,可以简洁高效的将每个对象进行分类,并最终计算出聚类中心来作为分类的依据。
发明内容
本发明的目的是鉴于图像二维熵在提取图像信息方面的作用,提出一种基于图像熵K均值聚类的3D-HEVC快速CU分割方法,该方法将视频中的一帧图像进行图像二维熵计算,再经过K均值模型进行分类。该方法具有计算复杂度低、编码时间短和视频重建效果好的特点。
为了实现上述目的,本发明的技术方案包括如下步骤:
步骤1:选取不同序列以及不同QP值、不同尺寸的CU矩阵进行K均值离线训练,得到离线训练模型。
对于输入的CU矩阵,将其划分为四个子块,并对每一个子块及整个CU矩阵进行二维熵计算,形成一个五维向量。将五维向量输入训练模型,得到离线训练模型,并根据离线训练模型最终得到不同尺寸、不同QP的聚类中心。
步骤2:正式进行预测时,读入CU矩阵,划分为四个子块后进行二维熵计算并形成一个五维向量,将该五维向量输入K均值离线训练模型,进行聚类;
步骤3:如果属于聚类0,直接跳转至步骤5;
步骤4:如果属于聚类1,则让该读入的CU矩阵进入递归,将该CU矩阵划分为4个大小为N/2*N/2的子块,将每个子块作为新的CU矩阵,跳转到步骤2;所述的N为CU矩阵的尺寸;
步骤5:该CU矩阵不需要划分,划分过程结束。
步骤1所述的二维熵计算如下:
首先将CU矩阵平均分成四个子块,对每个子块以及整个CU矩阵分别进行计算。对于每个子块以及整个CU矩阵,遍历其所有像素点并计算像素点周围其余8个像素点的均值;如果该像素为CU四个角落点,则计算其周围三个像素点均值;若该像素为CU四个边点,则计算其周围五个像素点均值;同时进行统计当像素点数值为i时,其周围像素均值为j的数量,由此得到特征二元组f(i,j),表示像素点数值为i,且其周围像素均值为j的数量;通过特征二元组f(i,j)计算该特征二元组f(i,j)的比例值,公式如下:
p(i,j)=f(i,j)/N2
其中N为所遍历对象的尺寸长度;
最后计算CU矩阵的二维熵,公式如下:
计算出每个子块以及整个CU矩阵的二维熵,并将其合为一组五维向量。
步骤1所述的K均值算法如下:
从3DHEVC的测试序列GT_fly,street,kendo,balloons,shark,hall,newspaper,dancer中,用其原始算法(计算rd cost并比较大小来判断是否需要划分)得到的QP分别为25、30、35、40,CU尺寸分别为64、32、16的矩阵各一万个(所有矩阵都已经标记是否需要划分)。即QP为25,CU尺寸为64的矩阵一万个,QP为25,CU尺寸为32的矩阵一万个,QP为25,CU尺寸为16的矩阵一万个,QP为30,CU尺寸为64的矩阵一万个等。
然后以同QP同尺寸的一万个矩阵为单位进行训练。分别将每个矩阵平均分为四个小块,计算其小块与整体的二维熵并合并成一个五维向量。
对得到的所有五维向量进行预处理,去除偏差值大于预设阈值的数据。
最后将进行预处理筛选所得到的最终数据集分别进行K均值聚类训练,最终得到不同QP不同尺寸共12个聚类模型,其中将每个模型的聚类0设为需要划分。
所述的每个模型的聚类0和聚类1的分类实现如下:
对于已经训练好的模型,输入原始训练数据进行分类,若得到的结果中,聚类0所对应的需要划分的矩阵比例多,则聚类0为需要划分,聚类1为不需要划分,反之,若聚类1所对应的需要划分的矩阵比例多,则聚类1为需要划分,聚类0为不需要划分;最后,将所有表示需要划分的聚类点都设定为聚类1,将所有表示不需要划分的聚类点都设定为聚类0,以作为统一使用。
步骤2过程如下:
进行正式预测时,首先判断该输入CU矩阵属于的QP值以及尺寸大小,然后将其划分为四个小块,分别计算其二维熵以及整体的二维熵。将得到的五维向量输入对应QP值与尺寸值的K均值聚类模型,得到预测结果。
本发明的有益效果如下:
本发明使用二维熵以及K均值算法应用于三维视频编码,利用二维熵的提取图像信息的作用以及K均值算法的分类能力,能有效的在视频码率减少的同时减少了编码时间,避免了计算冗余模式,减少计算量。
进一步的,通过计算图像及其子图像共五个二维熵所合成的五维向量来进行K均值算法训练,较大程度提升了判断准确度。同时,在进行实际递归判断时,由于只需要输入模型就能立刻得到结果从而避免了大量计算,极大的提升了编码时间。
附图说明
图1是K均值算法离线训练流程图
图2是CU分割预测方法流程图
图3是完整的分割流程图
具体实施方式
下面结合附图和实施例对本发明作进一步说明。
如图1所示,本发明具体包括如下步骤:
步骤1.进行K均值算法离线训练,分别取序列GT_fly,street,kendo,balloons,shark,hall,newspaper,dancer的QP为25,30,35,40尺寸为64×64、32×32,16×16CU矩阵一万个。
步骤2.以每一万个矩阵为单位训练。判断该矩阵集的QP值,然后判断该矩阵集的尺寸。
步骤3.将每一个矩阵平均划分为四块,并对每一块以及整体进行二维熵计算,形成一个五维向量,二维熵计算过程如下:
首先将CU矩阵平均分成四个子块,对每个子块以及整个CU矩阵分别进行计算。对于每个子块以及整个CU矩阵,遍历其所有像素点并计算像素点周围其余8个像素点的均值;如果该像素为CU四个角落点,则计算其周围三个像素点均值;若该像素为CU四个边点,则计算其周围五个像素点均值;同时进行统计当像素点数值为i时,其周围像素均值为j的数量,由此得到特征二元组f(i,j),表示像素点数值为i,且其周围像素均值为j的数量;通过特征二元组f(i,j)计算该特征二元组f(i,j)的比例值,公式如下:
p(i,j)=f(i,j)/N2
其中N为CU矩阵的尺度长,若CU未划分,则N为整个CU矩阵的尺度长,若CU已划分,则N为划分后子CU矩阵的尺度;
最后计算CU矩阵的二维熵,公式如下:
计算出每个子块以及整个CU矩阵的二维熵,并将其合为一组五维向量。
步骤4.对得到的所有五维向量进行预处理,去除偏差值大于预设阈值的数据。随后输入K均值模型中进行训练,聚类0设置为判断不划分。得到属于具体QP值以及CU尺寸的聚类中心12个。
如图2所示,本发明分割预测方法,具体包括如下步骤:
步骤(1).基于3D-HEVC,得到一个N*N(N=64,32,16,N>8,第一次为64)大小的CU后,将其平均划分为四块矩阵,分别对其进行二维熵计算,最后对整体进行二维熵计算,并合并成一个五维向量。
步骤2:进行K均值算法聚类判断。若属于聚类0,则跳转至步骤4,若不属于聚类0,则跳转至步骤3
步骤3:让该CU进入递归,将该CU划分为4个大小为N/2*N/2的子CU,对每个子CU,跳转到步骤1;
步骤4:该CU不需要划分,划分过程结束。
如图3所示,基于图像二维熵K均值聚类的3D-HEVC快速CU分割预测方法,完整的分割流程图具体如下:读入一个64*64的CU,经过基于图像二维熵的K均值算法判断其需不需要划分,若不需要划分,该CU划分过程结束;若需要划分,划分为4个32*32的子CU,然后分别读入32*32的CU,经过基于图像二维熵的K均值算法判断其需不需要划分,若不需要划分,该CU划分过程结束;若需要划分,划分为4个16*16的子CU,然后分别读入16*16的CU,经过基于图像二维熵的K均值算法判断其需不需要划分,若不需要划分,该CU划分过程结束;若需要划分,划分为4个8*8的子CU,划分为最小尺寸,划分过程结束。
Claims (5)
1.基于图像熵K均值聚类的3D-HEVC快速CU分割方法,其特征在于该方法将视频中的一帧图像进行图像二维熵计算,再经过K均值模型进行分类,具体包括如下步骤:
步骤1:选取不同序列以及不同QP值、不同尺寸的CU矩阵进行K均值离线训练,得到离线训练模型;
对于输入的CU矩阵,将其划分为四个子块,并对每一个子块及整个CU矩阵进行二维熵计算,形成一个五维向量;将五维向量输入训练模型,得到离线训练模型,并根据离线训练模型最终得到不同尺寸、不同QP的聚类中心;
步骤2:正式进行预测时,读入CU矩阵,划分为四个子块后进行二维熵计算并形成一个五维向量,将该五维向量输入K均值离线训练模型,进行聚类;
步骤3:如果属于聚类0,直接跳转至步骤5;
步骤4:如果属于聚类1,则让该读入的CU矩阵进入递归,将该CU矩阵划分为4个大小为N/2*N/2的子块,将每个子块作为新的CU矩阵,跳转到步骤2;所述的N为CU矩阵的尺寸;
步骤5:该CU矩阵不需要划分,划分过程结束。
2.根据权利要求1所述的基于图像熵K均值聚类的3D-HEVC快速CU分割方法,其特征在于步骤1所述的二维熵计算如下:
首先将CU矩阵平均分成四个子块,对每个子块以及整个CU矩阵分别进行计算;对于每个子块以及整个CU矩阵,遍历其所有像素点并计算像素点周围其余8个像素点的均值;如果该像素为CU四个角落点,则计算其周围三个像素点均值;若该像素为CU四个边点,则计算其周围五个像素点均值;同时进行统计当像素点数值为i时,其周围像素均值为j的数量,由此得到特征二元组f(i,j),表示像素点数值为i,且其周围像素均值为j的数量;通过特征二元组f(i,j)计算该特征二元组f(i,j)的比例值,公式如下:
p(i,j)=f(i,j)/N2
其中N为所遍历对象的尺寸长度;
最后计算CU矩阵的二维熵,公式如下:
计算出每个子块以及整个CU矩阵的二维熵,并将其合为一组五维向量。
3.根据权利要求1或2所述的基于图像熵K均值聚类的3D-HEVC快速CU分割方法,其特征在于步骤1所述的K均值算法如下:
从3DHEVC的测试序列GT_fly,street,kendo,balloons,shark,hall,newspaper,dancer中,用其原始算法得到的QP分别为25、30、35、40,CU尺寸分别为64、32、16的矩阵各一万个,且所有矩阵都已经标记是否需要划分;
然后以同QP同尺寸的一万个矩阵为单位进行训练;分别将每个矩阵平均分为四个小块,计算其小块与整体的二维熵并合并成一个五维向量;
对得到的所有五维向量进行预处理,去除偏差值大于预设阈值的数据;
最后将进行预处理筛选所得到的最终数据集分别进行K均值聚类训练,最终得到不同QP不同尺寸共12个聚类模型,其中将每个模型的聚类0设为需要划分。
4.根据权利要求3所述的基于图像熵K均值聚类的3D-HEVC快速CU分割方法,其特征在于每个模型的聚类0和聚类1的分类实现如下:
对于已经训练好的模型,输入原始训练数据进行分类,若得到的结果中,聚类0所对应的需要划分的矩阵比例多,则聚类0为需要划分,聚类1为不需要划分,反之,若聚类1所对应的需要划分的矩阵比例多,则聚类1为需要划分,聚类0为不需要划分;最后,将所有表示需要划分的聚类点都设定为聚类1,将所有表示不需要划分的聚类点都设定为聚类0,以作为统一使用。
5.根据权利要求1或3或4所述的基于图像熵K均值聚类的3D-HEVC快速CU分割方法,其特征在于步骤2过程如下:
进行正式预测时,首先判断该输入CU矩阵属于的QP值以及尺寸大小,然后将其划分为四个小块,分别计算其二维熵以及整体的二维熵;将得到的五维向量输入对应QP值与尺寸值的K均值聚类模型,得到预测结果。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010418949.9A CN111741313B (zh) | 2020-05-18 | 2020-05-18 | 基于图像熵k均值聚类的3d-hevc快速cu分割方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010418949.9A CN111741313B (zh) | 2020-05-18 | 2020-05-18 | 基于图像熵k均值聚类的3d-hevc快速cu分割方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111741313A true CN111741313A (zh) | 2020-10-02 |
CN111741313B CN111741313B (zh) | 2022-12-27 |
Family
ID=72647354
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010418949.9A Active CN111741313B (zh) | 2020-05-18 | 2020-05-18 | 基于图像熵k均值聚类的3d-hevc快速cu分割方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111741313B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112104867A (zh) * | 2020-11-09 | 2020-12-18 | 腾讯科技(深圳)有限公司 | 一种视频处理方法、视频处理装置、智能设备及存储介质 |
CN115859369A (zh) * | 2023-02-28 | 2023-03-28 | 聊城市洛溪信息科技有限公司 | 一种社交网络图片中隐私信息保护方法 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104883558A (zh) * | 2015-06-05 | 2015-09-02 | 太原科技大学 | 基于k均值聚类的深度图编码方法 |
CN107592538A (zh) * | 2017-09-06 | 2018-01-16 | 华中科技大学 | 一种降低立体视频深度图编码复杂度的方法 |
CN109714584A (zh) * | 2019-01-11 | 2019-05-03 | 杭州电子科技大学 | 基于深度学习的3d-hevc深度图编码单元快速决策方法 |
CN109756719A (zh) * | 2019-01-28 | 2019-05-14 | 华侨大学 | 基于cu划分贝叶斯决策的3d-hevc帧间快速方法 |
US20190230360A1 (en) * | 2018-01-23 | 2019-07-25 | Fujitsu Limited | Apparatus and method for video image encoding and video image decoding |
CN110460844A (zh) * | 2019-08-13 | 2019-11-15 | 杭州电子科技大学 | 基于dwt的3d-hevc快速cu分割预测方法 |
-
2020
- 2020-05-18 CN CN202010418949.9A patent/CN111741313B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104883558A (zh) * | 2015-06-05 | 2015-09-02 | 太原科技大学 | 基于k均值聚类的深度图编码方法 |
CN107592538A (zh) * | 2017-09-06 | 2018-01-16 | 华中科技大学 | 一种降低立体视频深度图编码复杂度的方法 |
US20190230360A1 (en) * | 2018-01-23 | 2019-07-25 | Fujitsu Limited | Apparatus and method for video image encoding and video image decoding |
CN109714584A (zh) * | 2019-01-11 | 2019-05-03 | 杭州电子科技大学 | 基于深度学习的3d-hevc深度图编码单元快速决策方法 |
CN109756719A (zh) * | 2019-01-28 | 2019-05-14 | 华侨大学 | 基于cu划分贝叶斯决策的3d-hevc帧间快速方法 |
CN110460844A (zh) * | 2019-08-13 | 2019-11-15 | 杭州电子科技大学 | 基于dwt的3d-hevc快速cu分割预测方法 |
Non-Patent Citations (1)
Title |
---|
王驰等: "3D-HEVC深度图帧内CU尺寸快速决策算法", 《通信技术》 * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112104867A (zh) * | 2020-11-09 | 2020-12-18 | 腾讯科技(深圳)有限公司 | 一种视频处理方法、视频处理装置、智能设备及存储介质 |
WO2022095871A1 (zh) * | 2020-11-09 | 2022-05-12 | 腾讯科技(深圳)有限公司 | 一种视频处理方法、视频处理装置、智能设备及存储介质 |
CN115859369A (zh) * | 2023-02-28 | 2023-03-28 | 聊城市洛溪信息科技有限公司 | 一种社交网络图片中隐私信息保护方法 |
Also Published As
Publication number | Publication date |
---|---|
CN111741313B (zh) | 2022-12-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111462261B (zh) | 针对h.266/vvc的快速cu分区和帧内决策方法 | |
CN110689599B (zh) | 基于非局部增强的生成对抗网络的3d视觉显著性预测方法 | |
CN107371022B (zh) | 应用于hevc医学影像无损编码的帧间编码单元快速划分方法 | |
CN111741313B (zh) | 基于图像熵k均值聚类的3d-hevc快速cu分割方法 | |
CN110062234A (zh) | 一种基于区域恰可察觉失真的感知视频编码方法 | |
CN108337515A (zh) | 一种视频编码方法及装置 | |
CN108712648A (zh) | 一种深度视频快速帧内编码方法 | |
CN106937116A (zh) | 基于随机训练集自适应学习的低复杂度视频编码方法 | |
CN114972752B (zh) | 一种基于轻量级交叉注意网络的实时语义分割的方法 | |
CN106803962B (zh) | 基于贝叶斯准则的3d视频深度图帧内预测模式选择方法 | |
CN115695802A (zh) | 一种用于加快视频编码的编码单元划分方法及装置 | |
US11212518B2 (en) | Method for accelerating coding and decoding of an HEVC video sequence | |
CN111385585B (zh) | 一种基于机器学习的3d-hevc深度图编码单元划分方法 | |
CN103002282B (zh) | 一种颜色数目自适应决策方法和图像压缩方法 | |
Liu et al. | Fast intra coding algorithm for depth map with end-to-end edge detection network | |
CN116600107A (zh) | 基于ipms-cnn和空域相邻cu编码模式的hevc-scc快速编码方法及装置 | |
CN116091862A (zh) | 一种画质识别方法、装置、设备、存储介质及产品 | |
CN116033153A (zh) | Vvc标准下的编码单元快速划分方法及系统 | |
CN115661166A (zh) | 一种用于增强压缩点云重建质量的装置及方法 | |
CN105007494A (zh) | 一种3d视频深度图像模型模式的帧内楔形分割模式选择方法 | |
CN113784147A (zh) | 一种基于卷积神经网络的高效视频编码方法及系统 | |
Bakkouri et al. | Effective CU size decision algorithm based on depth map homogeneity for 3D-HEVC inter-coding | |
CN116634147B (zh) | 基于多尺度特征融合的hevc-scc帧内cu快速划分编码方法及装置 | |
CN106375768B (zh) | 基于帧内预测模式校准的视频隐写分析方法 | |
CN109389546A (zh) | 多分块可逆水印嵌入方法及装置、水印提取方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |