CN112437310B - 一种基于随机森林的vvc帧内编码快速cu划分决策方法 - Google Patents

一种基于随机森林的vvc帧内编码快速cu划分决策方法 Download PDF

Info

Publication number
CN112437310B
CN112437310B CN202011510836.8A CN202011510836A CN112437310B CN 112437310 B CN112437310 B CN 112437310B CN 202011510836 A CN202011510836 A CN 202011510836A CN 112437310 B CN112437310 B CN 112437310B
Authority
CN
China
Prior art keywords
cus
current
random forest
value
division
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202011510836.8A
Other languages
English (en)
Other versions
CN112437310A (zh
Inventor
罗雷
何全
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chongqing University of Post and Telecommunications
Original Assignee
Chongqing University of Post and Telecommunications
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chongqing University of Post and Telecommunications filed Critical Chongqing University of Post and Telecommunications
Priority to CN202011510836.8A priority Critical patent/CN112437310B/zh
Publication of CN112437310A publication Critical patent/CN112437310A/zh
Application granted granted Critical
Publication of CN112437310B publication Critical patent/CN112437310B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/182Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a pixel
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/24323Tree-organised classifiers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/11Selection of coding mode or of prediction mode among a plurality of spatial predictive coding modes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/593Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial prediction techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

本发明涉及一种基于随机森林的VVC帧内编码快速CU划分决策方法,属于视频编码领域,包括以下步骤:S1:根据纹理信息与上下文信息将CU分为三类,并为各类CU选取一系列具有代表性的特征;S2:选取一系列具有不同分辨率与内容的视频序列进行编码,提取编码过程中各类CU的五类特征构建数据集;S3:为不同种类的CU分别构建随机森林分类器,通过数据集对随机森林分类器进行训练;S4:将训练好的随机森林分类器嵌入VVC原始编码流程中,预测各类CU的划分模式,替换原始递归的CU划分过程。本发明将随机森林分类器引入到VVC帧内编码中,在保证RD性能的同时有效地减小了编码复杂度。

Description

一种基于随机森林的VVC帧内编码快速CU划分决策方法
技术领域
本发明属于视频编码领域,涉及一种基于随机森林的VVC帧内编码快速CU划分决策方法。
背景技术
多功能视频编码(VVC)是最新的视频编码标准,由ITU-T视频编码组(VCEC)和ISO/IEC运动图像专家组(MPEG)的联合视频探索小组(JVET)开发。VVC标准的目标是提供比高效率视频编码(HEVC)标准更高的编码效率,以使其能够满足未来视频市场的需求,例如4K/8K超高清(UHD),高动态范围(HDR),虚拟现实(VR)和360度视频内容。据报道,与普通测试条件下的HEVC参考软件(HM)相比,VVC参考软件(VTM)的总体比特率降低了45%。但是,为了实现这种极大的编码效率改进,采用了一系列高级视频编码技术(例如基于四叉树嵌套多类型树(QTMT)的块划分结构,67种帧内预测模式和仿射运动补偿预测等),从而导致极高的编码复杂度增加。根据AHG报告,在全帧内测试配置下,VTM的帧内编码复杂度是HM的10倍以上。较高的复杂度使得难以将VVC实施在多媒体应用中,因此有必要在保障RD性能条件下显著降低编码复杂度。
很多文献都对帧内编码快速算法行了研究。对于快速CU划分决策方法,大致可分为三种策略,包括提前终止、多分类和联合分类。提前终止策略尝试确定递归的CU划分过程在当前深度级别的划分之后是否终止。不难理解,提前终止主要发生在平滑纹理区域,它可以很好地保持RD性能,但是降低的计算复杂度也是有限的。多分类策略设计了一个复杂的预测模型,可以直接获得最佳的划分模式。多分类策略大大降低了计算复杂度,但由于VVC的块划分结构更复杂,因此预测精度受到限制,从而导致RD性能损失要高得多。为了在显著降低复杂度的同时提高预测精度,有研究者设计了联合分类策略来预测每种划分模式的概率,并且选择具有最高概率的一个或多个划分模式作为最终划分模式的候选。
对于以上三种策略,都有三类通用方法实现,包括启发式方法,传统机器学习方法和端到端深度学习方法。启发式方法首先在编码过程中手动提取一些特征(例如,图像纹理复杂度,RD Cost,上下文信息),并且根据预设的阈值进行决策。启发式方法的最大优点是非常简单,但是准确性通常是有限的。传统的机器学习方法采用高级分类器(例如,支持向量机,决策树)来自动学习决策函数。端到端深度学习方法尝试使用深度神经网络自动完成特征提取和决策工作。
发明内容
有鉴于此,本发明的目的在于降低视频帧内编码的复杂度同时保持RD性能,提供一种基于随机森林的VVC帧内编码快速CU划分决策方法。
为达到上述目的,本发明提供如下技术方案:
一种基于随机森林的VVC帧内编码快速CU划分决策方法,包括以下步骤:
S1:根据纹理信息与上下文信息将CU分为三类,并为各类CU选取一系列具有代表性的特征;
S2:选取一系列具有不同分辨率与内容的视频序列进行编码,提取编码过程中各类CU的五类特征构建数据集;
S3:为不同种类的CU分别构建随机森林分类器,通过数据集对随机森林分类器进行训练;
S4:将训练好的随机森林分类器嵌入VVC原始编码流程中,预测各类CU的划分模式,替换原始递归的CU划分过程。
进一步,步骤S1具体包括:
S11:对于CU分类,使用方差定义CU的全局纹理复杂度,计算当前CU与周围CU的全局纹理复杂度;如果当前CU的纹理复杂度小于其相邻CU的最小纹理复杂度,则将其分类为简单CU;如果当前CU的纹理复杂度大于其相邻CU的最大纹理复杂度,则将其分类为复杂CU;如果当前CU的纹理复杂度介于其相邻CU的最小、最大纹理复杂度之间,则将其分类为模糊CU;
S12:对于特征选取,对JVET26条标准视频序列在不同QP下进行编码,统计CU深度分布,分析划分模式与视频内容关系,据此选取五类特征,包括纹理复杂度、梯度信息、上下文信息、局部复杂度差异、块信息。
进一步,步骤S2具体包括:
S21:提取纹理复杂度,包括全局纹理复杂度Var与局部纹理复杂度NMSE;
Figure BDA0002846357080000021
Figure BDA0002846357080000022
其中,W与H分别为当前CU的宽和高,P(i,j)为当前CU位置(i,j)处的像素值,Mean为当前CU像素的均值;
Figure BDA0002846357080000031
Figure BDA0002846357080000032
其中,MADP(i,j)为当前CU位置(i,j)处的像素值与其相邻像素值的平均差,从局部像素角度反映纹理变化趋势,MeanMADP为MADP矩阵的均值;
S22:提取梯度信息,包括水平、垂直、45°、135°四个方向上对应的梯度值GH、GV、G45、G135,CU的平均梯度值GAVG以及CU的最大梯度值GMAX
Figure BDA0002846357080000033
Figure BDA0002846357080000034
Figure BDA0002846357080000035
Figure BDA0002846357080000036
Figure BDA0002846357080000037
GMAX=max(Gmatrix)
其中,P表示当前CU的像素矩阵,Gmatrix表示由CU每个像素的梯度值构成的矩阵;
S23:提取上下文信息,包括相邻CU的纹理复杂度信息及深度信息相,所述相邻CU包括左下、左、左上、上、右上方的CU;相邻CU的纹理复杂度信息包括相邻CU全局纹理复杂度的最大值ACCmax、最小值ACCmin、平均值ACCavg;相邻CU的深度信息包括相邻CU四叉树深度的最大值ACDQT_max、最小值ACDQT_min、平均值ACDQT_avg;相邻CU多类型树深度的最大值ACDMT_max、最小值ACDMT_min、平均值ACDMT_avg
S24:提取局部复杂度差异,包括五种划分类型对应子CU之间的全局纹理复杂度差异:SCCDQT、SCCDBH、SCCDBV、SCCDTH、SCCDTV,其定义为:
Figure BDA0002846357080000041
Figure BDA0002846357080000042
Figure BDA0002846357080000043
Figure BDA0002846357080000044
Figure BDA0002846357080000045
其中vari为第i个子CU的方差,
Figure BDA0002846357080000046
为各子CU方差的平均值;
S25:提取块信息,包括当前CU的宽W,高H,四叉树深度DQT,多类型树深度DMT
进一步,步骤S3具体包括:
复杂类型CU与简单类型CU对应的随机森林RFPM直接预测最优的划分模式,即分类数为6(四叉树划分、水平二叉树划分、垂直二叉树划分、水平三叉树划分、垂直三叉树划分、不划分);模糊类型CU对应的随机森林RFET预测当前CU是否划分,即分类数为2(划分、不划分);两种随机森林均由10棵CART分类树构成,最大深度为15;CART分类树使用基尼系数为每个节点选择最优的特征与对应的值进行分割,基尼系数定义为:
Figure BDA0002846357080000047
其中pk是当前样本属于类别k的概率,对于所提取的数据集D,其基尼系数定义为:
Figure BDA0002846357080000048
其中,Ck表示数据集D中属于第k类的样本子集;数据集D根据特征A在某一取值i上进行分割,分割后样本集合的基尼系数定义为:
Figure BDA0002846357080000049
其中,D1、D2表示数据集D经过分割后的两个子集;对于特征A,分别计算任意特征值将数据集划分为两部分之后的基尼系数,选取其中的最小值,作为特征A得到的最优划分方案;然后对于数据集D,计算所有特征的最优划分方案,选取其中的最小值,作为数据集D的最优划分方案,定义为:
Figure BDA0002846357080000051
Figure BDA0002846357080000052
其中F表示所有的特征,i表示特征A所取的值。
进一步,步骤S4具体包括:
将训练好的随机森林分类器嵌入VVC参考软件VTM7.0中;输入CU时,计算当前CU的五类特征,并根据纹理信息与上下文信息对当前CU进行分类;对于复杂和简单类型CU,将其特征输入随机森林RFPM直接获取最优的划分模式;对于模糊类型CU,将其特征输入随机森林RFET,判断其是否需要继续划分。
本发明的有益效果在于:本发明能够快速地进行CU划分决策,能够在降低视频帧内编码的复杂度同时保持RD性能。
本发明的其他优点、目标和特征在某种程度上将在随后的说明书中进行阐述,并且在某种程度上,基于对下文的考察研究对本领域技术人员而言将是显而易见的,或者可以从本发明的实践中得到教导。本发明的目标和其他优点可以通过下面的说明书来实现和获得。
附图说明
为了使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明作优选的详细描述,其中:
图1为本发明的求解流程图;
图2为本发明的随机森林结构示意图;
图3为本发明加速CU划分决策流程图;
图4为本发明的效果图。
具体实施方式
以下通过特定的具体实例说明本发明的实施方式,本领域技术人员可由本说明书所揭露的内容轻易地了解本发明的其他优点与功效。本发明还可以通过另外不同的具体实施方式加以实施或应用,本说明书中的各项细节也可以基于不同观点与应用,在没有背离本发明的精神下进行各种修饰或改变。需要说明的是,以下实施例中所提供的图示仅以示意方式说明本发明的基本构想,在不冲突的情况下,以下实施例及实施例中的特征可以相互组合。
其中,附图仅用于示例性说明,表示的仅是示意图,而非实物图,不能理解为对本发明的限制;为了更好地说明本发明的实施例,附图某些部件会有省略、放大或缩小,并不代表实际产品的尺寸;对本领域技术人员来说,附图中某些公知结构及其说明可能省略是可以理解的。
本发明实施例的附图中相同或相似的标号对应相同或相似的部件;在本发明的描述中,需要理解的是,若有术语“上”、“下”、“左”、“右”、“前”、“后”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此附图中描述位置关系的用语仅用于示例性说明,不能理解为对本发明的限制,对于本领域的普通技术人员而言,可以根据具体情况理解上述术语的具体含义。
下面将结合本发明实施例中的附图,对本发明实施例中的具体实施方式进行清楚、完整地描述。显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明的求解流程如图1所示。选取JVET标准测试视频序列:Tango2、CatRobot、Cactus、PartyScene、BlowingBubbles、FourPeople、SlideEditing,配置文件为:encoder_intra_vtm.cfg,QP设置为:22、27、32、37,编码帧数为40帧,使用VTM7.0进行编码,提取CU的特征构建数据集。
随机森林中树的数量设置为10,最大深度设置为15,使用CART作为随机森林分类器的基础树,基于基尼系数确定每棵树各个节点的最优划分特征及对应最优取值。随机森林结构如图2所示。将数据集按4:1分为训练集与测试集,对随机森林进行训练与测试,得到直接预测划分模式的随机森林RFPM与预测是否提前终止的随机森林RFET
使用VTM7.0对JVET A1-F类别中26个标准测试视频序列进行编码,配置文件为:encoder_intra_vtm.cfg,QP设置为:22、27、32、37,编码帧数为10帧。记录编码时间、PSNR、比特率。
将本发明中训练的两个随机森林嵌入VTM7.0中,替换原始的CU划分决策过程,流程如图3所示。对JVET中A1-F类别中26个标准测试视频序列进行编码,配置文件为:encoder_intra_vtm.cfg,QP设置为:22、27、32、37,编码帧数为10帧。记录编码时间、PSNR、比特率。
对结果进行对比,如图4所示。从图4可以看出本方法能节省57%的编码时间,这表明我们的方法能够快速地进行CU划分决策。同时,BDBR仅上升1.21%,BDPSNR仅下降0.12dB,这表明我们的方法引起的压缩效果降低与图像失真是几乎可以忽略的。
尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。
最后说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或者等同替换,而不脱离本技术方案的宗旨和范围,其均应涵盖在本发明的权利要求范围当中。

Claims (2)

1.一种基于随机森林的VVC帧内编码快速CU划分决策方法,其特征在于:包括以下步骤:
S1:根据纹理信息与上下文信息将CU分为三类,并为各类CU选取一系列具有代表性的特征;步骤S1具体包括:
S11:对于CU分类,使用方差定义CU的全局纹理复杂度,计算当前CU与周围CU的全局纹理复杂度;如果当前CU的纹理复杂度小于其相邻CU的最小纹理复杂度,则将其分类为简单CU;如果当前CU的纹理复杂度大于其相邻CU的最大纹理复杂度,则将其分类为复杂CU;如果当前CU的纹理复杂度介于其相邻CU的最小、最大纹理复杂度之间,则将其分类为模糊CU;
S12:对于特征选取,对JVET26条标准视频序列在不同QP下进行编码,统计CU深度分布,分析划分模式与视频内容关系,据此选取五类特征,包括纹理复杂度、梯度信息、上下文信息、局部复杂度差异、块信息;
S2:选取一系列具有不同分辨率与内容的视频序列进行编码,提取编码过程中各类CU的五类特征构建数据集;步骤S2具体包括:
S21:提取纹理复杂度,包括全局纹理复杂度Var与局部纹理复杂度NMSE;
Figure FDA0003624232260000011
Figure FDA0003624232260000012
其中,W与H分别为当前CU的宽和高,P(i,j)为当前CU位置(i,j)处的像素值,Mean为当前CU像素的均值;
Figure FDA0003624232260000013
Figure FDA0003624232260000014
其中,MADP(i,j)为当前CU位置(i,j)处的像素值与其相邻像素值的平均差,从局部像素角度反映纹理变化趋势,MeanMADP为MADP矩阵的均值;
S22:提取梯度信息,包括水平、垂直、45°、135°四个方向上对应的梯度值GH、GV、G45、G135,CU的平均梯度值GAVG以及CU的最大梯度值GMAX
Figure FDA0003624232260000021
Figure FDA0003624232260000022
Figure FDA0003624232260000023
Figure FDA0003624232260000024
Figure FDA0003624232260000025
GMAX=max(Gmatrix)
其中,P表示当前CU的像素矩阵,Gmatrix表示由CU每个像素的梯度值构成的矩阵;
S23:提取上下文信息,包括相邻CU的纹理复杂度信息及深度信息,所述相邻CU为左下、左、左上、上、右上方的CU;相邻CU的纹理复杂度信息包括相邻CU全局纹理复杂度的最大值ACCmax、最小值ACCmin、平均值ACCavg;相邻CU的深度信息包括相邻CU四叉树深度的最大值ACDQT_max、最小值ACDQT_min、平均值ACDQT_avg;相邻CU多类型树深度的最大值ACDMT_max、最小值ACDMT_min、平均值ACDMT_avg
S24:提取局部复杂度差异,包括五种划分类型对应子CU之间的全局纹理复杂度差异:SCCDQT、SCCDBH、SCCDBV、SCCDTH、SCCDTV,其定义为:
Figure FDA0003624232260000026
Figure FDA0003624232260000027
Figure FDA0003624232260000028
Figure FDA0003624232260000029
Figure FDA00036242322600000210
其中vari为第i个子CU的方差,
Figure FDA0003624232260000031
为各子CU方差的平均值;
S25:提取块信息,包括当前CU的宽W,高H,四叉树深度DQT,多类型树深度DMT
S3:为不同种类的CU分别构建随机森林分类器,通过数据集对随机森林分类器进行训练;步骤S3具体包括:
复杂类型CU与简单类型CU对应的随机森林RFPM直接预测最优的划分模式,即分类数为6,包括四叉树划分、水平二叉树划分、垂直二叉树划分、水平三叉树划分、垂直三叉树划分、不划分;模糊类型CU对应的随机森林RFET预测当前CU是否划分,即分类数为2,包括划分、不划分;两种随机森林均由10棵CART分类树构成,最大深度为15;CART分类树使用基尼系数为每个节点选择最优的特征与对应的值进行分割,基尼系数定义为:
Figure FDA0003624232260000032
其中pk是当前样本属于类别k的概率,对于所提取的数据集D,其基尼系数定义为:
Figure FDA0003624232260000033
其中,Ck表示数据集D中属于第k类的样本子集;数据集D根据特征A在某一取值i上进行分割,分割后样本集合的基尼系数定义为:
Figure FDA0003624232260000034
其中,D1、D2表示数据集D经过分割后的两个子集;对于特征A,分别计算任意特征值将数据集划分为两部分之后的基尼系数,选取其中的最小值,作为特征A得到的最优划分方案;然后对于数据集D,计算所有特征的最优划分方案,选取其中的最小值,作为数据集D的最优划分方案,定义为:
Figure FDA0003624232260000035
Figure FDA0003624232260000036
其中F表示所有的特征,i表示特征A所取的值;
S4:将训练好的随机森林分类器嵌入VVC原始编码流程中,预测各类CU的划分模式,替换原始递归的CU划分过程。
2.根据权利要求1所述的基于随机森林的VVC帧内编码快速CU划分决策方法,其特征在于:步骤S4具体包括:
将训练好的随机森林分类器嵌入VVC参考软件中;输入CU时,计算当前CU的五类特征,并根据纹理信息与上下文信息对当前CU进行分类;对于复杂和简单类型CU,将其特征输入随机森林RFPM直接获取最优的划分模式;对于模糊类型CU,将其特征输入随机森林RFET,判断其是否需要继续划分。
CN202011510836.8A 2020-12-18 2020-12-18 一种基于随机森林的vvc帧内编码快速cu划分决策方法 Active CN112437310B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011510836.8A CN112437310B (zh) 2020-12-18 2020-12-18 一种基于随机森林的vvc帧内编码快速cu划分决策方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011510836.8A CN112437310B (zh) 2020-12-18 2020-12-18 一种基于随机森林的vvc帧内编码快速cu划分决策方法

Publications (2)

Publication Number Publication Date
CN112437310A CN112437310A (zh) 2021-03-02
CN112437310B true CN112437310B (zh) 2022-07-08

Family

ID=74696774

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011510836.8A Active CN112437310B (zh) 2020-12-18 2020-12-18 一种基于随机森林的vvc帧内编码快速cu划分决策方法

Country Status (1)

Country Link
CN (1) CN112437310B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114666590A (zh) * 2022-05-25 2022-06-24 宁波康达凯能医疗科技有限公司 一种基于负载均衡的全视场视频编码方法与系统
CN116033172B (zh) * 2022-12-18 2024-01-05 北京盛大博通文化发展有限公司 一种vvc帧内快速编码方法
CN116233420B (zh) * 2023-03-24 2024-05-14 深圳市博锐高科科技有限公司 一种基于vvc的帧内快速编码方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016033209A1 (en) * 2014-08-26 2016-03-03 Lyrical Labs Video Compression Technology, LLC Learning-based partitioning for video encoding
WO2019192309A1 (zh) * 2018-04-02 2019-10-10 腾讯科技(深圳)有限公司 确定编码单元的编码代价的方法、装置及计算机可读存储介质

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105791826B (zh) * 2016-05-11 2019-03-08 南京大学 一种基于数据挖掘的hevc帧间快速模式选择方法
CN106937116B (zh) * 2017-03-15 2019-08-27 杭州电子科技大学 基于随机训练集自适应学习的低复杂度视频编码方法
CN107071418B (zh) * 2017-05-05 2020-03-17 上海应用技术大学 一种基于决策树的hevc帧内编码单元快速划分方法
CN107371022B (zh) * 2017-08-26 2020-02-14 同济大学 应用于hevc医学影像无损编码的帧间编码单元快速划分方法
US20190045195A1 (en) * 2018-03-30 2019-02-07 Intel Corporation Reduced Partitioning and Mode Decisions Based on Content Analysis and Learning
CN109361920B (zh) * 2018-10-31 2021-09-28 南京大学 一种面向多场景的自适应决策树选择的帧间快速预测算法
CN110049338B (zh) * 2019-04-26 2023-04-18 杭州电子科技大学 基于多层次分类的hevc快速帧间编码方法
CN110581993A (zh) * 2019-08-16 2019-12-17 中南大学 一种基于多用途编码中帧内编码的编码单元快速划分方法
CN110650342A (zh) * 2019-08-31 2020-01-03 电子科技大学 基于编码单元多特征分析的快速编码方法
CN111462261B (zh) * 2020-04-06 2023-05-05 郑州轻工业大学 针对h.266/vvc的快速cu分区和帧内决策方法
CN111654698B (zh) * 2020-06-12 2022-03-22 郑州轻工业大学 一种针对h.266/vvc的快速cu分区决策方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016033209A1 (en) * 2014-08-26 2016-03-03 Lyrical Labs Video Compression Technology, LLC Learning-based partitioning for video encoding
WO2019192309A1 (zh) * 2018-04-02 2019-10-10 腾讯科技(深圳)有限公司 确定编码单元的编码代价的方法、装置及计算机可读存储介质

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
"Fast CU Partition and Intra Mode Decision Method for H.266/VVC";Q. Zhang et al.;《IEEE Access》;20200624;第8卷;全文 *
"基于随机森林分类的HEVC帧内CU快速划分算法";毋笑蓉等;《计算机工程与应用》;20171201;第53卷(第2期);全文 *

Also Published As

Publication number Publication date
CN112437310A (zh) 2021-03-02

Similar Documents

Publication Publication Date Title
CN112437310B (zh) 一种基于随机森林的vvc帧内编码快速cu划分决策方法
US11172209B2 (en) Analytics-modulated coding of surveillance video
CN106961606B (zh) 基于纹理划分特征的hevc帧内编码模式选择方法
CN110087087B (zh) Vvc帧间编码单元预测模式提前决策及块划分提前终止方法
JP5555221B2 (ja) 着目物の適応的な色モデル・パラメータ推定に係る方法および装置
CN111462261B (zh) 针对h.266/vvc的快速cu分区和帧内决策方法
CN113112519B (zh) 基于感兴趣目标分布的关键帧筛选方法
Chao et al. A novel rate control framework for SIFT/SURF feature preservation in H. 264/AVC video compression
Chen et al. Moving region segmentation from compressed video using global motion estimation and Markov random fields
KR20120118465A (ko) 예시-기반의 초 해상도를 이용하여 비디오 압축을 위한 데이터 프루닝
CN111429497B (zh) 基于深度学习和多特征融合的自适应cu拆分决策方法
CN114286093A (zh) 一种基于深度神经网络的快速视频编码方法
CN112291562B (zh) 针对h.266/vvc的快速cu分区和帧内模式决策方法
CN106157330B (zh) 一种基于目标联合外观模型的视觉跟踪方法
CN111583279A (zh) 一种基于pcba的超像素图像分割方法
CN108833928B (zh) 交通监控视频编码方法
Li et al. Self-learning residual model for fast intra CU size decision in 3D-HEVC
Zhang et al. Low-complexity intra coding scheme based on Bayesian and L-BFGS for VVC
CN110677624A (zh) 基于深度学习的面向监控视频的前景和背景并行压缩方法
Zhang et al. A GCN-based fast CU partition method of intra-mode VVC
Li et al. Fast depth intra coding based on spatial correlation and rate distortion cost in 3D-HEVC
WO2013163197A1 (en) Macroblock partitioning and motion estimation using object analysis for video compression
US7356182B1 (en) Method and apparatus for measuring image complexity
CN102592130B (zh) 一种针对水下显微视频的目标识别系统及其视频编码方法
US20100239019A1 (en) Post processing of motion vectors using sad for low bit rate video compression

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant