CN109361920A - 一种面向多场景的自适应决策树选择的帧间快速预测算法 - Google Patents
一种面向多场景的自适应决策树选择的帧间快速预测算法 Download PDFInfo
- Publication number
- CN109361920A CN109361920A CN201811287030.XA CN201811287030A CN109361920A CN 109361920 A CN109361920 A CN 109361920A CN 201811287030 A CN201811287030 A CN 201811287030A CN 109361920 A CN109361920 A CN 109361920A
- Authority
- CN
- China
- Prior art keywords
- mode
- 2nx2n
- decision tree
- scene
- video
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000003044 adaptive effect Effects 0.000 title claims abstract description 11
- 238000003066 decision tree Methods 0.000 claims abstract description 93
- 238000005457 optimization Methods 0.000 claims abstract description 17
- 238000012360 testing method Methods 0.000 claims abstract description 16
- 238000012549 training Methods 0.000 claims abstract description 12
- 230000002596 correlated effect Effects 0.000 claims abstract description 9
- 230000011218 segmentation Effects 0.000 claims abstract description 9
- 230000009466 transformation Effects 0.000 claims abstract description 6
- 238000000034 method Methods 0.000 claims description 19
- 238000010606 normalization Methods 0.000 claims description 16
- 238000005192 partition Methods 0.000 claims description 10
- 238000010801 machine learning Methods 0.000 claims description 7
- 238000002360 preparation method Methods 0.000 claims description 5
- 238000004364 calculation method Methods 0.000 claims description 3
- 230000010354 integration Effects 0.000 claims description 3
- 238000012216 screening Methods 0.000 claims description 3
- 239000012141 concentrate Substances 0.000 claims description 2
- 238000013480 data collection Methods 0.000 claims description 2
- 239000000284 extract Substances 0.000 claims description 2
- 238000005070 sampling Methods 0.000 claims description 2
- 238000000605 extraction Methods 0.000 claims 1
- 230000000875 corresponding effect Effects 0.000 description 7
- 241000288113 Gallirallus australis Species 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 241000777300 Congiopodidae Species 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 238000013139 quantization Methods 0.000 description 1
- 230000000630 rising effect Effects 0.000 description 1
- 238000010187 selection method Methods 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/103—Selection of coding mode or of prediction mode
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/157—Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
- H04N19/159—Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/70—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/90—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
- H04N19/96—Tree coding, e.g. quad-tree coding
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
一种面向多场景的自适应决策树选择的帧间快速预测算法,包括以下步骤:1)预备部分:输入一个视频测试序列,对该视频序列中CU帧间预测的各个PU模式进行概率统计,得到帧间预测各个PU模式的概率情况;2)训练部分:分若干个场景类别输入视频测试序列,针对各个场景类别的视频序列收集其CU块的相关特征,将收集到的特征进一步进行筛选和优化,再针对各个场景类别基于优化后的特征生成8×8、16×16、32×32、64×64的决策树;3)执行部分:输入一段由各个场景所组成的视频序列,对输入视频根据视频内场景的变换进行分割,收集各个分割后视频序列CU块的相关特征并进行优化;确定是否继续遍历之后的PU预测模式,帧间预测结束。
Description
技术领域
本发明属于HEVC视频编码领域,具体涉及一种面向多场景HEVC编码单元间利用自适应选择决策树的帧间预测优化编码方法。
背景技术
随着多媒体服务的多元化,如高清视频的普及,超高清分辨率(如4k x 2k,8k x4k等)的出现,对编码性能的要求已经越来越超出H.264的能力范围,渐渐无法满足一些技术或者性能上的需求。为了解决上述问题,动态图像专家组(Moving Picture ExpertsGroup,MPEG)和视频编码专家组(Video Coding Experts Group,VCEG)成立了视频编码联合组(Joint Collaborative Team on Video Coding,JCT-VC)于2013年2月份正式发布了高性能视频编码标准(High Efficiency Video Coding,HEVC)。
HEVC编码器框架采用与H.264/AVC标准类似的预测加变换的混合编码框架,具有帧内预测、帧间运动估计、帧间运动补偿、变换、量化、环路滤波、熵编码等模块。
HEVC标准采用了更为灵活有效的块划分结构,引入了编码树单元(Coding TreeUnit,CTU),编码单元(Coding Unit,CU),预测单元(Prediction Unit,PU)和变换单元(Transform Unit,TU)的概念。此外,编码树块(Coding Tree Block,CTB),编码块(CodingBlock,CB),预测块(Prediction Block,PB)和变换块(Transform Block,TB)为与CTU,CU,PU和TU相对应的存储颜色分量的二维矩阵。即一个CTU包含了一个亮度的CTB以及两个色度的CTB。CU,PU和TU也有类似的关系。
一个典型的编码过程如下所述:对于输入编码器的每一帧图像,将被分割成为若干个块状的CTU,一个CTU会被分成若干个CU,以此来适应本地不同的内容特性。我们可以将CU、CTU他们两者之间的关系用四叉树来表示,CTU是这棵四叉树的根节点,四叉树结构也称为编码树,被用来将CTU划分成多个CU。假设CTU的大小为2N×2N,其中N的取值可以为8,16或32,则一个CTU可以单独作为一个CU,或者分成4个大小为N×N的单元,它们都是四叉树的结点。帧间模式可以使用八种划分模式,包括两种正方形形状(PART_2N×2N,PART_N×N),两种长方形形状(PART_2N×N,PART_N×2N),四种非对称形状(PART_2N×nU,PART_2N×nD,PART_nL×2N,PART_nR×2N)。
帧间图像的模式判决与率失真代价RDcost有关,模式选择会遍历并计算所有模式的RDcost,最后选取使得RDcost最小的模式为最终模式,这导致极大程度复杂度的上升。因为即使最佳PU预测模式在最前面的几个模式之中,编码器还得继续测完剩余全部的PU预测模式,这就增加了一些不必要的计算。由于帧间模式判断占用了大量的时间,我们需要选择合适的快速模式选择方法来降低编码的计算复杂度。在CN105791826A李康等人所写的专利中是通过决策树的算法来对帧间预测的模式选择进行判断,而本发明采用自适应选择决策树的方法对帧间预测进行优化,针对多个场景混合的视频序列可以自适应地根据各个场景选用合适的决策树。
发明内容
本发明的目的在于,提供一种针对不同类别视频场景的HEVC帧间预测快速算法,实现了自适应地根据视频序列场景去选择最佳决策树,在保证编码率失真基本没有损失的同时,针对视频序列中各个场景自适应地降低HEVC的计算复杂度。
本发明的技术方案是:基于场景类别自适应选择决策树的帧间预测快速算法,根据视频序列场景类别自适应地选择最佳决策树来降低HEVC的编码复杂度,本快速算法基于预备、训练和执行三个模块:
预备模块:输入一个视频序列,统计该视频序列帧间预测过程中CU块的各个PU预测模式的概率,得到概率统计情况;
训练模块:分场景类别输入视频序列,针对各个场景类别视频序列收集其CU块的相关特征,将收集到的特征根据PU预测模式划分情况的相关性进一步进行筛选和优化,再针对各个场景类别基于优化后的特征生成8×8、16×16、32×32、64×64的决策树;
执行模块:将由各个场景组成的视频序列输入,对输入视频序列进行场景分割,收集分割之后的视频序列的特征并优化,使用收集后的特征数据判断场景类别并选择该场景类别所对应的决策树,将统计完的特征传入决策树进行判决,输出最终划分结果;
包括以下步骤:
(1)预备部分:输入一个视频测试序列,对该视频序列中CU帧间预测的各个PU模式进行概率统计,得到帧间预测各个PU模式(MSM、2N×2N、N×2N、2N×N、N×N、nL×2N、nR×2N、2N×nU、2N×nD)的概率情况;
(2)训练部分:分若干个场景类别输入视频测试序列,针对各个场景类别的视频序列收集其CU块的相关特征,将收集到的特征进一步进行筛选和优化,再针对各个场景类别基于优化后的特征生成8×8、16×16、32×32、64×64的决策树;
(3)执行部分:输入一段由各个场景所组成的视频序列,对输入视频根据视频内场景的变换进行分割,收集各个分割后视频序列CU块的相关特征并进行优化;利用优化后的特征对分割后的视频序列进行场景类别判断并选择合适的决策树,若无合适的决策树则转入训练部分更新决策树;将优化后的特征数据传入针对该场景的决策树进行判断;判断完成,确定是否继续遍历之后的PU预测模式,帧间预测结束;
所述步骤(2)包括以下步骤:
(2-1)选取一个标准视频测试序列输入,对帧间预测的各个模式进行概率统计;
(2-2)有着不同场景类别的标准视频序列,需依次输入,先选取一个场景类别的视频输入,记录视频序列中以CU为单位MSM、2Nx2N模式的一系列相关属性;
(2-3)测试(2)中MSM、2Nx2N模式的一系列相关属性与CU最佳划分模式的相关情况,筛选出相关性高的属性;由于大部分属性和视频序列自身纹理等因素相关,需要对属性进行优化,为了避免每个属性的特征值受视频序列本身的影响,对其进行归一化;
(2-4)根据筛选优化好的特征能够对当前CU的划分模式进行预测,选取机器学习中C4.5的算法使用机器学习软件WEKA来建立决策树,针对不同场景类别建立8×8、16×16、32×32、64×64的决策树;
其中步骤(3)执行模块包括以下步骤:
(3-1)输入一个由多种场景组成的视频序列;
(3-2)根据场景变化,将该视频序列分割为针对各个场景的若干小视频序列;
(3-3)帧间预测开始,若判断CU为8×8、16×16、32×32大小,则收集上层CU的划分模式,若判断CU为64×64大小,则跳过该步骤,最终8×8、16×16、32×32、64×64大小的CU都进入MSM以及2Nx2N模式收集率失真值、运动矢量值等数据,从而获得本发明列出的选取的特征;
(3-4)针对每个分割好的小视频序列,确定该小视频序列场景最适合的决策树,如没有则转入训练部分,更新这一场景的决策树种类;
(3-5)将该小视频序列的特征传入决策树进行判断;若判断结果为不划分,则跳过之后的所有预测模式,将最佳预测模式判定为MSM和2Nx2N模式中率失真值较小的模式;若判断结果为继续划分,则按照HM原始计算顺序正常进行遍历帧间预测中剩余所有模式的步骤,遍历结束后得到率失真值最小的那个模式为最佳预测模式;
(3-6)输出结果,帧间预测结束。
其中步骤(3-4)确定该小视频序列场景最适合的决策树,进行视频场景类别判断包括以下步骤:
(3-4-1)将由若干场景组成未分割的视频序列输入,进行数据收集;假设已有针对三种场景的决策树A、B、C,将该视频序列分别传入决策树A、B、C,输出针对三类决策树的时间节省率T1、T2、T3;
(3-4-2)对该视频序列分割为针对各个场景的若干小视频序列;分割完的小视频序列先传入决策树A,输出时间节省率T11,若小于T1则直接舍去A决策树,否则留下决策树A的T11;
(3-4-3)依次再传入决策树B、C,进行(2)的步骤;
(3-4-4)每个小视频序列都执行(2)、(3)步骤,从而各小视频序列获得最佳决策树,将所有小视频序列整合,即完整的视频序列获得最佳优化方式。
有益效果:本发明通过利用机器学习的决策树模型来降低帧间预测模式的计算复杂度,简单易行。本发明的主要优点为:
1、本发明使用机器学习中的决策树模型将视频序列中CU块自身的特征和CU块最终的模式划分情况相联系,得到通过决策树来进行判决从而省去一些不必要的PU预测模式检测步骤的方法,大大降低了编码的计算复杂度。
2、本发明在决策树判断的基础上针对各个场景,提出了一种自适应检测判断场景并选择决策树的优化算法,这使得不是由单一场景组成的视频序列获得最佳的优化,对于混合场景的视频序列可以自适应地选择针对各个场景地决策树,具有较强的适应性。
3、在WEKA中输入PartyScene场景类型视频序列判断PartyScene场景决策树,准确率为78.5%。输入混合场景视频序列特征使用PartyScene场景决策树判决,准确率为71.2%。由此可见使用场景自适应选择合适决策树可以有效提高判断准确率。
附图说明
图1所示为HEVC帧间预测的快速算法流程。
图2所示为帧间预测快速算法的决策树生成框图。
图3所示为PartyScene场景下CU为32×32大小的决策树。
图4所示为快速算法中帧间预测的具体过程。
图5所示为视频场景类别的判断框图。
具体实施方式
本发明提出了一种基于场景类别自适应选择决策树的帧间预测快速算法,主要包括预备、训练和执行三个模块,从而降低HEVC的计算复杂度。
图1给出了HEVC帧间预测快速算法预备、训练和执行三个模块的总流程:
(1)预备部分:输入一个视频测试序列,对该视频序列中CU帧间预测的各个PU模式进行概率统计,得到帧间预测各个PU模式(MSM、2N×2N、N×2N、2N×N、N×N、nL×2N、nR×2N、2N×nU、2N×nD)的概率情况。
(2)训练部分:分若干个场景类别输入视频测试序列,针对各个场景类别的视频序列收集其CU块的相关特征,将收集到的特征进一步进行筛选和优化,再针对各个场景类别基于优化后的特征生成8×8、16×16、32×32、64×64的决策树。
(3)执行部分:输入一段由各个场景所组成的视频序列。对输入视频根据视频内场景的变换进行分割,收集各个分割后视频序列CU块的相关特征并进行优化。利用优化后的特征对分割后的视频序列进行场景类别判断并选择合适的决策树,若无合适的决策树则转入训练部分更新决策树。将优化后的特征数据传入针对该场景的决策树进行判断。判断完成,确定是否继续遍历之后的PU预测模式,帧间预测结束。
如图2所示,HEVC帧间预测快速算法的决策树生成方法步骤如下:
(1)选取一个标准视频测试序列输入,尽管HM编码器会把所有可能的划分、预测模式(MSM、2N×2N、N×2N、2N×N、N×N、nL×2N、nR×2N、2N×nU、2N×nD)测试一遍,但是最终确定下来的的最佳帧间预测模式并不是等概率的,即有些预测模式出现的概率很大而有些又很小,故而我们在HM中测试该序列并输出所有CU对应的PU预测模式,最终得到各个尺寸CU对应的概率情况为:尺寸为8*8的CU块,PU预测模式不进行划分的概率达到了95%。
(2)有着不同场景类别的标准视频序列,需依次输入,先选取一个场景类别的视频输入(HEVC指定了24个不同分辨率、帧率、场景的标准视频序列如RaceHorses、BQMall、SlideShow、BasketballDrive等,设定此次场景类别为PartyScene),记录对应场景视频序列中以CU为单位MSM、2Nx2N模式的一系列相关属性。
(3)根据(2)中所记录下来的MSM、2Nx2N模式的一系列相关属性,测试其与CU最佳划分模式的相关情况得到CU没有被划分成多个PU的率失真值和运动矢量数值比被划分成多个PU的率失真值要小得多,而上一层CU的划分模式与当前CU的最佳划分模式有高度的相关性,记录下以下特征:
abs_2Nx2N(2Nx2N的率失真值),abs_MSM(MSM的率失真值),abs_Ratio(2Nx2N的率失真值/MSM的率失真值),abs_2Nx2N_var(2Nx2N的残差),abs_mv_MSM(MSM的运动矢量),abs_mv_2Nx2N(2Nx2N的运动矢量),mv_ratio(2Nx2N的运动矢量/MSM的运动矢量),Nei_Depth(CU的深度)和Usplit(上层CU的划分决定)。
由于大部分属性和视频序列自身纹理等因素相关,我们需要对属性进行优化,为了避免每个属性的特征值受视频序列本身的影响,本发明对其进行归一化,例如归一化后2Nx2N模式的率失真值为当前帧2Nx2N模式的率失真值除以前一帧2Nx2N模式的率失真值,进行一系列优化得到以下归一化后特征:
nor_2Nx2N(归一化2Nx2N的率失真值),nor_MSM(归一化MSM的率失真值),nor_Ratio(归一化2Nx2N的率失真值/MSM的率失真值),nor_2Nx2N_var(归一化2Nx2N的残差),nor_mv_MSM(归一化MSM的运动矢量),nor_mv_2Nx2N(归一化2Nx2N的运动矢量),nor_mv_ratio(归一化2Nx2N的运动矢量/MSM的运动矢量)。
(4)根据(3)中筛选优化好的特征能够对当前CU的划分模式进行预测,本文选取机器学习中C4.5的算法建立决策树,这是一个递归的过程,初始时所有的数据都集中在树的根部,根据最佳分类属性对数据进行分割,得到根的左右子树,接着对左右子树递归地进行分割,当所有的当前节点中的数据都属于同一类,或者其它的停止标准满足时,递归终止,从而得到一棵决策树。本发明使用机器学习软件WEKA来建立决策树,我们将以上所述特征的值以随机采样的方式从属于不划分分类的记录中抽取一部分数据,再从属于划分分类的记录中抽取另外一部分数据,合并成为CU尺寸对应的最终训练样本集,并且保证两者样本数各占50%,将特征数据整理成ARFF格式输入到WEKA中生成对应CU尺寸的决策树,重复此步骤而获得针对不同场景类别的8×8、16×16、32×32、64×64CU尺寸的决策树,本发明列出根据(2)中所列特征在PartyScene场景下生成的32×32CU大小的决策树,如图3所示。
如图4所示,快速算法中执行模块的具体过程如下:
(1)输入一个由多种场景组成的视频序列。
(2)根据场景变化,将该视频序列分割为针对各个场景的若干小视频序列。本发明使用ColorDirector软件对多场景组成的视频序列进行场景分割,最终分割为若干不同场景的小视频序列。关于场景分割还有其他许多方法及软件可以选择使用。
(3)帧间预测开始,若判断CU为8×8、16×16、32×32大小,则收集上层CU的划分模式,若判断CU为64×64大小,则跳过该步骤,最终8×8、16×16、32×32、64×64大小的CU都进入MSM以及2Nx2N模式收集率失真值、运动矢量值等数据,从而获得本发明列出的选取的特征。
(4)针对每个分割好的小视频序列,确定该小视频序列场景最适合的决策树,如没有则转入训练部分,更新这一场景的决策树种类。
(5)将该小视频序列的特征传入决策树进行判断。若判断结果为不划分,则跳过之后的所有预测模式,直接将最佳预测模式判定为MSM和2Nx2N模式中率失真值较小的模式。若判断结果为继续划分,则按照HM原始计算顺序正常进行遍历帧间预测中剩余所有模式的步骤,遍历结束后得到率失真值最小的那个模式为最佳预测模式。
(6)输出结果,帧间预测结束。
如图5所示,视频场景类别判断的具体步骤如下:
(1)将由若干场景组成未分割的视频序列输入,进行执行模块中步骤(3)的数据收集部分,若为64×64大小,则直接进入MSM以及2Nx2N模式收集率失真值、运动矢量值等,若为8×8、16×16、32×32大小的CU,除此以外收集上层CU的划分模式。假设已有针对三种场景的决策树A、B、C,将该视频序列分别传入决策树A、B、C,输出针对三类决策树的时间节省率T1、T2、T3。
(2)按照执行模块的步骤(2)对该视频序列分割为针对各个场景的若干小视频序列。分割完的小视频序列先传入决策树A,输出时间节省率T11,若小于T1则直接舍去A决策树,否则留下决策树A的T11。
(3)依次再传入决策树B、C,进行(2)的步骤。即继续传入决策树B,输出时间节省率T21,若小于T2则直接舍去B决策树,否则留下决策树B的T21。然后传入决策树C,输出时间节省率T31,若小于T3则直接舍去C决策树,否则留下决策树C的T31。比较所留下的Ti1之间的大小关系,留下时间节省率最低的决策树即获得针对该小视频序列的最佳决策树。
(4)每个小视频序列都执行(2)、(3)步骤,从而各小视频序列获得最佳决策树,将所有小视频序列整合,即完整的视频序列获得最佳优化方式。
Claims (5)
1.一种面向多场景的自适应决策树选择的帧间快速预测算法,其特征在于,包括以下步骤:
(1)预备部分:输入一个视频测试序列,对该视频序列中CU帧间预测的各个PU模式进行概率统计,得到帧间预测各个PU模式MSM、2N×2N、N×2N、2N×N、N×N、nL×2N、nR×2N、2N×nU、2N×nD的概率情况;
(2)训练部分:分若干个场景类别输入视频测试序列,针对各个场景类别的视频序列收集其CU块的相关特征,将收集到的特征进一步进行筛选和优化,再针对各个场景类别基于优化后的特征生成8×8、16×16、32×32、64×64的决策树;
(3)执行部分:输入一段由各个场景所组成的视频序列,对输入视频根据视频内场景的变换进行分割,收集各个分割后视频序列CU块的相关特征并进行优化;利用优化后的特征对分割后的视频序列进行场景类别判断并选择合适的决策树,若无合适的决策树则转入训练部分更新决策树;将优化后的特征数据传入针对该场景的决策树进行判断;判断完成,确定是否继续遍历之后的PU预测模式,帧间预测结束。
2.根据权利要求1所述的一种面向多场景的自适应决策树选择的帧间快速预测算法,其特征在于,所述步骤(2)包括以下步骤:
(2-1)选取一个标准视频测试序列输入,对帧间预测的各个模式进行概率统计;
(2-2)有着不同场景类别的标准视频序列,需依次输入,先选取一个场景类别的视频输入,记录视频序列中以CU为单位MSM、2Nx2N模式的一系列相关属性;
(2-3)测试(2)中MSM、2Nx2N模式的一系列相关属性与CU最佳划分模式的相关情况,筛选出相关性高的属性;由于大部分属性和视频序列自身纹理等因素相关,我们需要对属性进行优化,为了避免每个属性的特征值受视频序列本身的影响,对其进行归一化;
(2-4)根据筛选优化好的特征能够对当前CU的划分模式进行预测,选取机器学习中C4.5的算法使用机器学习软件WEKA来建立决策树,针对不同场景类别建立8×8、16×16、32×32、64×64的决策树。
3.根据权利要求1所述的一种面向多场景的自适应决策树选择的帧间快速预测算法,其特征在于,其中步骤(3)执行模块包括以下步骤:
(3-1)输入一个由多种场景组成的视频序列;
(3-2)根据场景变化,将该视频序列分割为针对各个场景的若干小视频序列;
(3-3)帧间预测开始,若判断CU为8×8、16×16、32×32大小,则收集上层CU的划分模式,若判断CU为64×64大小,则跳过该步骤,最终8×8、16×16、32×32、64×64大小的CU都进入MSM以及2Nx2N模式收集率失真值、运动矢量值等数据,从而获得本发明列出的选取的特征;
(3-4)针对每个分割好的小视频序列,确定该小视频序列场景最适合的决策树,如没有则转入训练部分,更新这一场景的决策树种类;
(3-5)将该小视频序列的特征传入决策树进行判断;若判断结果为不划分,则跳过之后的所有预测模式,将最佳预测模式判定为MSM和2Nx2N模式中率失真值较小的模式;若判断结果为继续划分,则按照HM原始计算顺序正常进行遍历帧间预测中剩余所有模式的步骤,遍历结束后得到率失真值最小的那个模式为最佳预测模式;
(3-6)输出结果,帧间预测结束。
4.根据权利要求3所述的一种面向多场景的自适应决策树选择的帧间快速预测算法执行模块,其特征在于,其中步骤(3-4)视频场景类别判断模块包括以下步骤:
(3-4-1)将由若干场景组成未分割的视频序列输入,进行数据收集;假设已有针对三种场景的决策树A、B、C,将该视频序列分别传入决策树A、B、C,输出针对三类决策树的时间节省率T1、T2、T3;
(3-4-2)对该视频序列分割为针对各个场景的若干小视频序列;分割完的小视频序列先传入决策树A,输出时间节省率T11,若小于T1则直接舍去A决策树,否则留下决策树A的T11;
(3-4-3)依次再传入决策树B、C,进行(3-4-2)的步骤;
(3-4-4)每个小视频序列都执行(3-4-2)、(3-4-3)步骤,从而各小视频序列获得最佳决策树,将所有小视频序列整合,即完整的视频序列获得最佳优化方式。
5.根据权利要求2所述的一种面向多场景的自适应决策树选择的帧间快速预测算法执行模块,其特征在于,
步骤(2)中得到决策树的具体过程如下:不同场景类别的标准视频序列,需依次输入,先选取一个场景类别的视频输入;partyscene场景的视频序列输入,记录视频序列中以CU为单位MSM、2Nx2N模式的一系列相关属性;
测试MSM、2Nx2N模式的一系列相关属性与CU最佳划分模式的相关情况得到CU没有被划分成多个PU的率失真值和运动矢量数值比被划分成多个PU的率失真值要小得多,而上一层CU的划分模式与当前CU的最佳划分模式有高度的相关性;
对属性进行归一化,归一化后2Nx2N模式的率失真值为当前帧2Nx2N模式的率失真值除以前一帧2Nx2N模式的率失真值,得到以下最终特征:
abs_2Nx2N(2Nx2N的率失真值),nor_2Nx2N(归一化2Nx2N的率失真值),abs_MSM(MSM的率失真值),nor_MSM(归一化MSM的率失真值),abs_Ratio(2Nx2N的率失真值/MSM的率失真值),nor_Ratio(归一化2Nx2N的率失真值/MSM的率失真值),abs_2Nx2N_var(2Nx2N的残差),nor_2Nx2N_var(归一化2Nx2N的残差),abs_mv_MSM(MSM的运动矢量),nor_mv_MSM(归一化MSM的运动矢量),abs_mv_2Nx2N(2Nx2N的运动矢量),nor_mv_2Nx2N(归一化2Nx2N的运动矢量),mv_ratio(2Nx2N的运动矢量/MSM的运动矢量),nor_mv_ratio(归一化2Nx2N的运动矢量/MSM的运动矢量),Nei_Depth(CU的深度)和Usplit(上层CU的划分决定);
根据上述特征能够对当前CU的划分模式进行预测,选取机器学习中C4.5的算法建立决策树,这是一个递归的过程,初始时所有的数据都集中在树的根部,根据最佳分类属性对数据进行分割,得到根的左右子树,接着对左右子树递归地进行分割,当所有的当前节点中的数据都属于同一类,或者其它的停止标准满足时,递归终止,从而得到一棵决策树;
选取机器学习中C4.5的算法即使用机器学习的软件WEKA中的C4.5算法来建立决策树,以随机采样的方式从属于不划分分类的记录中抽取一部分数据,再从属于划分分类的记录中抽取另外一部分数据,合并成为最终的训练样本集,并且保证两者样本数各占50%,将特征数据整理成ARFF格式,针对不同场景类别建立8×8、16×16、32×32、64×64的决策树。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811287030.XA CN109361920B (zh) | 2018-10-31 | 2018-10-31 | 一种面向多场景的自适应决策树选择的帧间快速预测算法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811287030.XA CN109361920B (zh) | 2018-10-31 | 2018-10-31 | 一种面向多场景的自适应决策树选择的帧间快速预测算法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109361920A true CN109361920A (zh) | 2019-02-19 |
CN109361920B CN109361920B (zh) | 2021-09-28 |
Family
ID=65347624
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811287030.XA Active CN109361920B (zh) | 2018-10-31 | 2018-10-31 | 一种面向多场景的自适应决策树选择的帧间快速预测算法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109361920B (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111385585A (zh) * | 2020-03-18 | 2020-07-07 | 北京工业大学 | 一种基于机器学习的3d-hevc深度图编码单元划分快速决策方法 |
CN112383776A (zh) * | 2020-12-08 | 2021-02-19 | 重庆邮电大学 | 一种shvc视频编码模式快速选择的方法及装置 |
CN112437310A (zh) * | 2020-12-18 | 2021-03-02 | 重庆邮电大学 | 一种基于随机森林的vvc帧内编码快速cu划分决策方法 |
CN113810629A (zh) * | 2021-11-19 | 2021-12-17 | 南京好先生智慧科技有限公司 | 一种融合平台多媒体信号的视频帧处理方法及装置 |
CN114257810A (zh) * | 2020-09-23 | 2022-03-29 | 腾讯科技(深圳)有限公司 | 上下文模型的选择方法、装置、设备及存储介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101448159A (zh) * | 2009-01-08 | 2009-06-03 | 北京航空航天大学 | 一种基于率失真代价和模式频率的快速帧间模式选择方法 |
CN105791826A (zh) * | 2016-05-11 | 2016-07-20 | 南京大学 | 一种基于数据挖掘的hevc帧间快速模式选择方法 |
CN107371022A (zh) * | 2017-08-26 | 2017-11-21 | 同济大学 | 应用于hevc医学影像无损编码的帧间编码单元快速划分方法 |
CN108174204A (zh) * | 2018-03-06 | 2018-06-15 | 中南大学 | 一种基于决策树的帧间快速模式选择方法 |
-
2018
- 2018-10-31 CN CN201811287030.XA patent/CN109361920B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101448159A (zh) * | 2009-01-08 | 2009-06-03 | 北京航空航天大学 | 一种基于率失真代价和模式频率的快速帧间模式选择方法 |
CN105791826A (zh) * | 2016-05-11 | 2016-07-20 | 南京大学 | 一种基于数据挖掘的hevc帧间快速模式选择方法 |
CN107371022A (zh) * | 2017-08-26 | 2017-11-21 | 同济大学 | 应用于hevc医学影像无损编码的帧间编码单元快速划分方法 |
CN108174204A (zh) * | 2018-03-06 | 2018-06-15 | 中南大学 | 一种基于决策树的帧间快速模式选择方法 |
Non-Patent Citations (2)
Title |
---|
KANG LI 等: "Fast CU-Splitting Decisions Based On Data Mining", 《2016 IEEE INTERNATIONAL CONFERENCE ON CONSUMER ELECTRONICS-CHINA (ICCE-CHINA)》 * |
岑跃峰: "基于HEVC的视频编码与视频无线传输机制研究", 《中国博士学位论文全文数据库(电子期刊)》 * |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111385585A (zh) * | 2020-03-18 | 2020-07-07 | 北京工业大学 | 一种基于机器学习的3d-hevc深度图编码单元划分快速决策方法 |
CN114257810A (zh) * | 2020-09-23 | 2022-03-29 | 腾讯科技(深圳)有限公司 | 上下文模型的选择方法、装置、设备及存储介质 |
WO2022063035A1 (zh) * | 2020-09-23 | 2022-03-31 | 腾讯科技(深圳)有限公司 | 上下文模型的选择方法、装置、设备及存储介质 |
CN114257810B (zh) * | 2020-09-23 | 2023-01-06 | 腾讯科技(深圳)有限公司 | 上下文模型的选择方法、装置、设备及存储介质 |
CN112383776A (zh) * | 2020-12-08 | 2021-02-19 | 重庆邮电大学 | 一种shvc视频编码模式快速选择的方法及装置 |
CN112437310A (zh) * | 2020-12-18 | 2021-03-02 | 重庆邮电大学 | 一种基于随机森林的vvc帧内编码快速cu划分决策方法 |
CN113810629A (zh) * | 2021-11-19 | 2021-12-17 | 南京好先生智慧科技有限公司 | 一种融合平台多媒体信号的视频帧处理方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN109361920B (zh) | 2021-09-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109361920A (zh) | 一种面向多场景的自适应决策树选择的帧间快速预测算法 | |
TWI664607B (zh) | 解碼器、編碼器、及相關聯方法與資料串流 | |
CN109314785A (zh) | 用于导出运动预测信息的方法和装置 | |
CN109691099A (zh) | 视频编码/解码方法和装置以及在其中存储比特流的记录介质 | |
CN105306947B (zh) | 基于机器学习的视频转码方法 | |
CN105791826B (zh) | 一种基于数据挖掘的hevc帧间快速模式选择方法 | |
CN109792521A (zh) | 用于对图像进行编码/解码的方法和设备以及存储比特流的记录介质 | |
CN108605122A (zh) | 用于编码/解码屏幕内预测模式的方法和装置 | |
CN112738511B (zh) | 一种结合视频分析的快速模式决策方法及装置 | |
CN107277506B (zh) | 基于自适应运动矢量精度的运动矢量精度选择方法及装置 | |
CN107071469A (zh) | 基于帧间预测对视频信号进行解码的方法 | |
CN110086957A (zh) | 清除解块人为噪声的方法 | |
CN109040764B (zh) | 一种基于决策树的hevc屏幕内容帧内快速编码算法 | |
CN110024385A (zh) | 影像编码/解码方法、装置以及对比特流进行存储的记录介质 | |
CN111988628B (zh) | 基于强化学习的vvc的快速帧内编码方法 | |
CN103533355B (zh) | 一种hevc快速编码方法 | |
CN110049338A (zh) | 基于多层次分类的hevc快速帧间编码方法 | |
CN110213584A (zh) | 基于纹理复杂度的编码单元分类方法和编码单元分类设备 | |
Chen et al. | A novel fast intra mode decision for versatile video coding | |
CN107318016A (zh) | 一种基于零块分布的hevc帧间预测模式快速判定方法 | |
CN116489386A (zh) | 一种基于参考块的vvc帧间快速编码方法 | |
CN103888763B (zh) | 一种基于hevc的帧内编码方法 | |
CN108769696A (zh) | 一种基于Fisher判别式的DVC-HEVC视频转码方法 | |
Zhang et al. | Efficient CTU-based intra frame coding for HEVC based on deep learning | |
CN104601992A (zh) | 基于贝叶斯最小风险决策的skip模式快速选择方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |