CN112383776B - 一种shvc视频编码模式快速选择的方法及装置 - Google Patents

一种shvc视频编码模式快速选择的方法及装置 Download PDF

Info

Publication number
CN112383776B
CN112383776B CN202011421368.7A CN202011421368A CN112383776B CN 112383776 B CN112383776 B CN 112383776B CN 202011421368 A CN202011421368 A CN 202011421368A CN 112383776 B CN112383776 B CN 112383776B
Authority
CN
China
Prior art keywords
mode
coding unit
inter2nx2n
decision tree
coding
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202011421368.7A
Other languages
English (en)
Other versions
CN112383776A (zh
Inventor
汪大勇
赵奕婷
徐太杰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangzhou Dayu Chuangfu Technology Co ltd
Original Assignee
Chongqing University of Post and Telecommunications
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chongqing University of Post and Telecommunications filed Critical Chongqing University of Post and Telecommunications
Priority to CN202011421368.7A priority Critical patent/CN112383776B/zh
Publication of CN112383776A publication Critical patent/CN112383776A/zh
Application granted granted Critical
Publication of CN112383776B publication Critical patent/CN112383776B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/147Data rate or code amount at the encoder output according to rate distortion criteria
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/24323Tree-organised classifiers
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • H04N19/159Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Medical Informatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

本发明涉及视频编码相关技术领域,特别涉及一种SHVC视频编码模式快速选择的方法及装置,所述方法包括根据当前编码单元的深度,将亮度分量在视频编码中产生的中间数据利用weka训练的决策树模型预测当前编码单元编码单元是否采用merge模式,若不采用merge模式则将亮度分量在视频编码中产生的中间数据利用weka训练的决策树模型预测当前编码单元是否采用Inter2Nx2N模式,若不采用Inter2Nx2N模式则进行下一深度的预测,将对于深度为3的编码单元选择merge模式作为编码模式进行编码;本发明能够减少编码步骤并减少视频质量的损失,从而减少压缩时间如果和其他的帧间预测优化方法结合可以达到更优的效果。

Description

一种SHVC视频编码模式快速选择的方法及装置
技术领域
本发明涉及视频编码相关技术领域,特别涉及一种SHVC视频编码模式快速选择的方法及装置。
背景技术
HEVC(高效视频编码标准)是现在研究最广的视频编码标准,最新的编码标准VVC(通用视频编码标准)对硬件要求太高,无法满足工业视频的需求,因此我们现在主要研究的还是HEVC,但是HEVC的编码标准缺乏灵活性,当不同终端对视频的分辨率、帧率等有不同要求时就必须对输入的视频流进行多次编码。为了解决这个问题,在HEVC的基础上扩展出SHVC(可伸缩视频编码标准)。
SHVC支持的可伸缩特性、兼容性和压缩率具有重大的研究和应用价值,它不仅可以解决单层视频结构仅支持单一视频尺寸、比特率和帧率的问题,还可以根据不同的网络特性、终端设备和用户需求进行动态结构调整,因此在视频会议中的应用更加广泛。SHVC由基础层和增强层两层组成,两层的图像内容相同但是增强层图像的分辨率比基本层高,空间分辨率越高视频更加清晰,原始输入视频经过下采样之后利用HEVC编码成基本层比特码流,利用层间预测编码增强层图像可以提高增强层的编码质量。
SHVC中增强层中所有编码单元都需要遍历4个深度,每个深度要遍历12种编码模式得到率失真值最低的编码模式。LCU(最大编码单元)的划分过程,如图1,包括:
第一步:对图1中a大小为64x64深度为0的编码单元LCU遍历所有帧间和帧内预测模式,完成遍历后将率失真值最小的编码模式作为LCU的最优预测模式:
第二步:对LCU进行划分得到四个子CU,即图1中b,此时编码深度为1,并对划分后的子CU遍历所有帧间和帧内预测模式,完成遍历后将率失真值最小的模式作为其最优预测模式:
第三步:对第二步划分后的子CU进行进一步的CU划分得到四个子CU,即图1中c,此时编码深度为2,并对划分后的子CU遍历所有帧间和帧内预测模式,完成遍历后将率失真值最小的模式作为其最优预测模式;
第四步:对第三步划分后的子CU进行进一步的CU划分得到四个子CU,即图1中d,此时编码深度为3,并对划分后的子CU遍历所有帧间和帧内预测模式,完成遍历后将率失真值最小的模式作为其最优预测模式。
在LCU的划分过程中每一个编码深度的CU都需要做PU(预测单元)预测模式选择,一个大小为2Nx2N的CU,PU需要遍历的编码模式如图2所示,包括merge、Inter2Nx2N、Inter2NxN、InterNx2N、InterNxN、Inter2NxnU、Inter2NxnD、InternLx2N、InternRx2N、Intra2Nx2N、IntraNxN和层间预测模式ILR,这个过程会大大提高计算复杂度从而降低编码效率,因此通过预测加快编码模式选择是很有必要的。
发明内容
针对上述问题,本发明提出一种SHVC视频编码模式快速选择的方法,具体包括以下步骤:
判断当前编码单元的深度,在编码模式快速选择算法的流程中,对深度为0的编码单元将亮度分量在视频编码中产生的中间数据利用weka训练的决策树模型预测当前编码单元是否采用merge模式,若不采用merge模式,则用RJ检验对残差进行检验,判断是否采用merge模式,若不采用则继续对深度为0的编码单元进行Inter2Nx2N编码模式的预测:
对深度为0的编码单元进行Inter2Nx2N编码模式的预测时,将亮度分量在视频编码中产生的中间数据利用weka训练的决策树模型预测当前编码单元是否采用Inter2Nx2N模式,若不采用Inter2Nx2N模式,则用RJ检验对残差进行检验,判断是否采用Inter2Nx2N模式,若不采用则进入标准编码算法的流程;
在编码模式快速选择算法的流程中,对深度为1或2的编码单元,判断当前深度编码单元的父块模式是否为merge模式,若为merge模式则将当前深度编码单元的视频亮度分量产生的中间数据信息依次利用weka训练的四棵通过设置训练决策树的叶子结点最小实例数导致复杂度由低到高的决策树预测,每次用决策树预测后再结合RJ检验对残差进行检测,若在其中一次的预测中判断采用merge模式或者RJ检验对残差进行检测判断采用merge模式,则采用merge模式并跳过其他决策树的预测,否则继续进行Inter2Nx2N模式预测;
在进行Inter2Nx2N模式预测时,判断当前深度编码单元的父块模式是否为Inter2Nx2N模式,若为Inter2Nx2N模式则将当前深度编码单元的视频亮度分量产生的中间数据信息利用weka分别训练的三棵决策树进行预测,这三棵决策树是利用当前编码单元的残差、纹理信息、运动矢量训练的,若三棵决策树中存在不采用Inter2Nx2N模式编码的预测结果,再用第四棵由率失真值训练的决策树进行预测,若第四棵决策树预测采用Inter2Nx2N模式,则采用Inter2Nx2N模式,否则进入标准编码算法的流程;
在编码模式快速选择算法的流程中,对于深度为3的编码单元,选择merge模式作为编码模式进行编码。
进一步的,用RJ检验对残差进行检验时,若R统计量小于R统计量的临界值cv(n)时,则判断RJ检验通过,R统计量表示为:
Figure GDA0003526401250000041
其中,bi为编码单元中在编码过程中产生的预测块和原始块之间的第i个残差满足正态分布的分位数;
Figure GDA0003526401250000042
是为了判断是否服从高斯分布拟合设置的参数,其值为0;yi为原始块和预测块第i个像素点产生的残差值;
Figure GDA0003526401250000043
为当前深度编码单元产生的残差的均值;n为编码单元中预测块和原始块的残差数据个数。
计算R统计量的临界值cv(n)时,将RJ检验根据置信水平和编码单元中预测块和原始块的残差个数n代入临界值公式求得的临界值,将在三种置信水平下临界值的最小值作为临界值cv(n),三种置信水平下临界值包括:
Figure GDA0003526401250000051
Figure GDA0003526401250000052
Figure GDA0003526401250000053
其中,α表示残差总体落在某一区间内可能错误的概率。
进一步的,编码单元中在编码过程中产生的预测块和原始块之间的第i个残差满足正态分布的分位数bi的获取过程包括:
将残差数据按从小到大排序,计算残差分布的累积概率pi
计算残差的秩,即如果有k个相同的数,则其秩为k个秩之和除以k;
计算残差分布的累积概率pi后分别计算单个残差数据服从高斯分布的分位数bi,bi=Φ-1(pi),Φ-1()表示计算函数的反函数值。
本发明还提出一种SHVC视频编码模式快速选择的装置,所述装置包括编码单元深度判断模块、深度0的merge模式编码单元、深度0的merge模式RJ检验单元、深度0的Inter2Nx2N模式编码单元、深度0的Inter2Nx2N模式RJ检验单元、第一多merge模式决策树预测模块、第一RJ检验单元、第二多merge模式决策树预测模块、第二RJ检验单元、第三多merge模式决策树预测模块、第三RJ检验单元、第四多merge模式决策树预测模块、第四RJ检验单元、第一Inter2Nx2N模式决策树预测模块、第二Inter2Nx2N模式决策树预测模块、第三Inter2Nx2N模式决策树预测模块、第四Inter2Nx2N模式决策树预测模块、Inter2Nx2N模式投票模块、merge模式编码单元和Inter2Nx2N模式编码单元;其中:
编码单元深度判断模块,用于判断编码单元的深度,将深度为0的编码单元输入深度0的merge模式编码单元,将深度为1或2的编码单元输入第一多决策树模型预测模块,将深度为3的编码单元输入merge模式编码单元进行编码;
深度0的merge模式编码单元,用于根据将亮度分量在视频编码中产生的中间数据利用weka训练的决策树模型预测深度为0编码单元是否采用merge模式,若采用则进入merge模式编码单元,否则输入深度0的merge模式RJ检验单元;
深度0的merge模式RJ检验单元,用于对输入的数据进行RJ检验,若通过该检验,则进入merge模式编码单元,否则输入深度O的Inter2Nx2N模式编码单元;
深度0的Inter2Nx2N模式编码单元,用于根据将亮度分量在视频编码中产生的中间数据利用weka训练的决策树模型预测深度为0编码单元是否采用Inter2Nx2N模式,若采用则进入Inter2Nx2N模式编码单元,否则输入深度0的Inter2Nx2N模式RJ检验单元;
深度0的Inter2Nx2N模式RJ检验单元,用于对输入的数据进行RJ检验,若通过该检验,则进入Inter2Nx2N模式编码单元,否则进入标准算法编码流程;第一多merge模式决策树预测模块,用于根据将亮度分量在视频编码中产生的中间数据利用weka训练的决策树模型预测当前深度编码单元是否采用merge模式,若采用则进入merge模式编码单元,否则输入第一RJ检验单元;
第一RJ检验单元,用于对输入的数据进行RJ检验,若通过该检验则判断采用merge模式编码,否则将编码单元输入第二多决策树预测单元中;
第二多merge模式决策树预测模块,用于根据将亮度分量在视频编码中产生的中间数据利用weka训练的决策树模型预测当前深度编码单元是否采用merge模式,若采用则进入merge模式编码单元,否则输入第二RJ检验单元;
第二RJ检验单元,用于对输入的数据进行RJ检验,若通过该检验则判断采用merge模式编码,否则将编码单元输入第三多决策树预测单元中;
第三多merge模式决策树预测模块,用于根据将亮度分量在视频编码中产生的中间数据利用weka训练的决策树模型预测当前深度编码单元是否采用merge模式,若采用则进入merge模式编码单元,否则输入第三RJ检验单元;
第三RJ检验单元,用于对输入的数据进行RJ检验,若通过该检验则判断采用merge模式编码,否则将编码单元输入第四多merge模式决策树预测模块中;
第四多merge模式决策树预测模块,用于根据将亮度分量在视频编码中产生的中间数据利用weka训练的决策树模型预测当前深度编码单元是否采用merge模式,若采用则进入merge模式编码单元,否则输入第四RJ检验单元;
第四RJ检验单元,用于对输入的数据进行RJ检验,若通过该检验则判断采用merge模式编码,否则进入标准算法流程;
第一Inter2Nx2N模式决策树预测模块,用于根据将亮度分量在视频编码中产生的中间数据利用weka训练的决策树模型预测当前深度编码单元是否采用merge模式,若采用则进入Inter2Nx2N模式投票模块,否则进入第四Inter2Nx2N模式决策树预测模块;第二Inter2Nx2N模式决策树预测模块,用于根据将亮度分量在视频编码中产生的中间数据利用weka训练的决策树模型预测当前深度编码单元是否采用merge模式,若采用则进入Inter2Nx2N模式投票模块,否则进入第四Inter2Nx2N模式决策树预测模块;
第二Inter2Nx2N模式决策树预测模块,用于根据将亮度分量在视频编码中产生的中间数据利用weka训练的决策树模型预测当前深度编码单元是否采用Inter2Nx2N模式,若采用则进入Inter2Nx2N模式投票模块,否则进入第四Inter2Nx2N模式决策树预测模块;
第三Inter2Nx2N模式决策树预测模块,用于根据将亮度分量在视频编码中产生的中间数据利用weka训练的决策树模型预测当前深度编码单元是否采用merge模式,若采用则进入Inter2Nx2N模式投票模块,否则进入第四Inter2Nx2N模式决策树预测模块;
第四Inter2Nx2N模式决策树预测模块,用于根据将亮度分量在视频编码中产生的中间数据利用weka训练的决策树模型预测当前深度编码单元是否采用merge模式,若采用则进入Inter2Nx2N模式编码单元,否则进入标准算法流程;
Inter2Nx2N模式投票模块,用于处理深度为1或2、父块模式为Inter2Nx2N模式且经过第一Inter2Nx2N模式决策树预测模块的编码单元、第二Inter2Nx2N模式决策树预测模块、第三Inter2Nx2N模式决策树预测模块并不都判断为Inter2Nx2N编码模式的编码单元,并将该判断结果输入Inter2Nx2N模式编码单元,若采用则进入Inter2Nx2N模式编码单元,否则进入标准算法编码模块;
merge模式编码单元,用于对编码单元根据merge模式进行编码;
Inter2Nx2N模式编码单元,用于对编码单元根据Inter2Nx2N模式进行编码。
本发明采用按照分布情况和深度相关性对编码模式分类预测,并通过数理统计和机器学习相结合的方法对当前块的编码模式进行预测,引入了RJ检验对视频编码过程中产生的中间数据进行检验;本发明能够减少编码步骤并减少视频质量的损失,从而减少压缩时间如果和其他的帧间预测优化方法结合可以达到更优的效果。
附图说明
图1为HEVC的LCU划分示意图;
图2为HEVC帧间编码模式示意图;
图3为本发明一种SHVC视频编码模式快速选择的方法流程图;
图4为当CU深度1和2时结合父块模式预测子块编码模式的算法流程图;
图5为本发明装置中处理CU深度为0时的流程图;
图6为本发明装置中处理CU深度为1或2且父块模式为merge模式的流程图;
图7为本发明装置中处理CU深度为1或2且父块模式为Inter2Nx2N模式的流程图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例1
本实施例中,用四个量化参数(22,26,30,34)对官方提供的七个视频序列(Traffic、PeopleOnStreet、Kimono、ParkScene、Cactus、Basketba11Drive、BQTerrace)进行测试,基本可准确实现编码的单元的编码模式选择。该算法主要针对父块模式为merge模式和2Nx2N模式的子块进行编码优化,其主体流程包括以下几步:
对官方提供的八个视频序列(Sunflower、Tractor、Town、Park、Flowervase、PartyScene、BlowingBubbles、RaceHorses)设置好相应物理参数进行编码。
2.对于深度为0的编码单元,将其merge模式的标签初始化为0,计算视频序列中深度为0的编码单元的残差、纹理信息和率失真值,将这些特征利用weka训练的决策树模型进行预测,若标签为1则表示当前编码单元采用merge模式进行编码,跳过其他编码模式的遍历,若标签为0则将残差进行Ryan-Joiner检验判断是否采用merge模式进行编码,若残差符合高斯分布则采用merge模式,跳过后续步骤,若不符合则继续对深度为0的编码单元进行Inter2Nx2N编码模式的预测;
3.对于深度为0的编码单元,将其Inter2Nx2N模式的标签初始化为0,计算视频序列中深度为0的编码单元的残差、纹理信息和率失真值,将这些特征利用weka训练的决策树模型进行预测,若标签为0则表示当前编码单元采用Inter2Nx2N模式进行编码,跳过其他编码模式的遍历,若标签为0则将残差进行Ryan-Joiner检验判断是否采用Inter2Nx2N模式进行编码,若残差符合高斯分布则采用Inter2Nx2N模式,若不符合则则进入标准编码算法的流程:
对于深度为1或2的编码单元,判断当前深度编码单元的父块模式是否为merge模式,若为merge模式则将当前深度编码单元的merge模式标签设置为0,计算当前深度编码单元的残差、纹理信息和率失真值,利用weka训练的复杂度最低的决策树模型进行预测,若标签为1则表示当前编码单元采用merge模式进行编码,若标签为0则将残差进行Ryan-Joiner检验判断是否采用merge模式进行编码,若残差符合高斯分布则采用merge模式,若不符合则再利用weka训练的复杂度次低的决策树模型进行预测,若标签为1则表示当前编码单元采用merge模式进行编码,若标签为0则将残差进行Ryan-Joiner检验判断是否采用用merge模式进行编码,若残差符合高斯分布则采用merge模式,若不符合则再利用weka训练的复杂度次高的决策树模型进行预测,若标签为1则表示当前编码单元采用merge模式进行编码,若标签为0则将残差进行Ryan-Joiner检验判断是否采用用merge模式进行编码,若残差符合高斯分布则采用merge模式,若不符合则再利用weka训练的复杂度最高的决策树模型进行预测,若标签为1则表示当前编码单元采用merge模式进行编码,若标签为0则将残差进行Ryan-Joiner检验判断是否采用merge模式进行编码,若残差符合高斯分布则采用merge模式,若不符合则继续进行Inter2Nx2N模式预测,决策树预测与Ryan-Joiner检验残差结合判断编码模式的步骤一共需要进行四次,使用的决策树复杂度由低到高,在本实施例中四棵复杂度从低到高的决策树分别由当前编码单元的残差、纹理信息、率失真值共同训练,依照复杂度从低到高的顺序依次对当前编码单元进行预测;
对于深度为1或2的编码单元,判断当前深度编码单元的父块模式是否为Inter2Nx2N模式,若为2Nx2N模式则将当前深度编码单元的2Nx2N模式标签设置为0,计算当前深度编码单元的残差、纹理信息、率失真值和运动矢量,将当前编码单元上半部分、下半部分、左半部分和右半部分的残差信息利用weka训练成决策树,将当前编码单元空域候选列表和时域候选列表中的候选运动矢量利用weka训练成决策树,将当前编码单元的纹理信息和父块merge模式标签利用weka训练成决策树,将当前编码单元的残差、父块merge模式标签、纹理信息、运动矢量和率失真值利用weka训练成决策树,残差决策树、运动矢量决策树和纹理信息决策树共同预测当前深度编码单元的2Nx2N模式标签,若标签为0则表示当前编码单元采用2Nx2N模式编码,若标签为1则用第四棵结合率失真值预测的决策树再次预测当前深度编码单元的2Nx2N模式标签,若标签为0则表示当前编码单元采用2Nx2N模式编码,若标签为1则正常进行下面的编码流程:
4.对于深度为3的编码单元,计算它的编码模式分布情况,根据其分布情况让深度为3的编码单元均采用merge模式进行编码。算法流程中采用的RJ检验统计量如下:
Figure GDA0003526401250000131
其中,bi为编码单元中在编码过程中产生的预测块和原始块之间的第i个残差满足正态分布的分位数;
Figure GDA0003526401250000132
是为了判断是否服从高斯分布拟合设置的参数,其值为0;yi为原始块和预测块第i个像素点产生的残差值;
Figure GDA0003526401250000133
为当前深度编码单元产生的残差的均值;n为编码单元中预测块和原始块的残差数据个数。
因为bi服从N(0,1),所以
Figure GDA0003526401250000134
常规p值计算方法是
Figure GDA0003526401250000135
但是根据这个公式算出的累积概率为1,用1是无法算出标准正态分布的分位数bi的,所以在RJ检验中pi被重新定义为
Figure GDA0003526401250000136
这样可以确保分位数都能计算。
首先将残差数据按从小到大排序,计算累积p值,n为残差数据个数。当残差数据数值相同时,利用平均秩计算pi,两个相同的数在所有从小到大排列的残差数据中排在第3、4位,即秩为3和4,对这两个数的秩取平均值,即3.5。以此类推,如果有k个相同的数,则其秩为k个秩之和除以k。计算pi后计算分位数bi,bi=Φ-1(pi)将计算出的值代入R统计量中与临界值公式的相应结果进行对比。计算R统计量的临界值cv(n)时,将RJ检验根据置信水平a和编码单元中预测块和原始块的残差个数n代入临界值公式求得的临界值,临界值cv(n)表示为:
Figure GDA0003526401250000141
Figure GDA0003526401250000142
Figure GDA0003526401250000143
其中,a为残差总体落在某一区间内可能错误的概率,具体值的选取需要进行测试决定。如果R统计量小于cv(n)则判定其符合高斯分布,如果R统计量大于cv(n)则判定其不符合高斯分布。
本实施例中采用的决策树,在训练前先把数据集进行调整,生成特定的arff格式的数据并加入特征说明,选择J48(基于C4.5算法实现的决策树算法)进行训练。决策树是一种树结构,每一个内部节点表示在一个属性上的测试,每一个树叶节点存放一个类标号。决策树建立以后,每个未预测的元组都能从根结点追踪到叶节点,该叶节点就存放着该元组的预测。决策树的优势在于不须要不论什么领域知识或参数设置,适合于探测性的知识发现。weka中的决策树采用的是信息增益率的概念对其进行构建,对随机变量X可能取值为x1,x2,......xn,对每个可能的取值x其概率为pi,因此随机变量X的信息熵为:
Figure GDA0003526401250000151
对样本集合D来说,随机变量X是样本的类别,若样本有j个类别,每个类别的概率是|Dj|/|D|,其中|Dj|表示类别j的样本个数,|D|表示样本总数,对样本集合D来说熵为:
Figure GDA0003526401250000152
熵可以表示样本集合的不确定性,熵越大样本的不确定性就越大,因此划分前后集合熵的差值可以用来衡量集合划分的效果,这就引入了信息增益的概念,使用某个特征A划分数据集D,计算划分后的信息熵为:
Gain(A)=Info(D)-InfoA(D);
其中Info(D)表示划分前的信息熵,InfoA(D)表示划分后的信息熵。但是信息增益往往会偏向取值较多的特征,因此引入了惩罚参数的概念。惩罚参数是让数据集以特征A作为随机变量的熵的倒数,即将特征A取值相同的样本划分到同一个自己中。
Figure GDA0003526401250000153
信息增益比就是在信息增益的基础上乘惩罚参数,惩罚参数定义为数据集D以特征A作为随机变量的熵的倒数。
Figure GDA0003526401250000154
当特征个数多时惩罚参数较小,特征个数少时惩罚参数较大。Weka中的J48算法会取具有信息增益率最大的属性作为分裂属性。
实施例2
本实施例提出一种SHVC视频编码模式快速选择的装置,所述装置包括编码单元深度判断模块、深度0的merge模式编码单元、深度0的merge模式RJ检验单元、深度0的Inter2Nx2N模式编码单元、深度0的Inter2Nx2N模式RJ检验单元、第一多merge模式决策树预测模块、第一RJ检验单元、第二多merge模式决策树预测模块、第二RJ检验单元、第三多merge模式决策树预测模块、第三RJ检验单元、第四多merge模式决策树预测模块、第四RJ检验单元、第一Inter2Nx2N模式决策树预测模块、第二Inter2Nx2N模式决策树预测模块、第三Inter2Nx2N模式决策树预测模块、第四Inter2Nx2N模式决策树预测模块、Inter2Nx2N模式投票模块、merge模式编码单元和Inter2Nx2N模式编码单元,如图5~7,其中:
编码单元深度判断模块,用于判断编码单元的深度,将深度为0的编码单元输入深度0的merge模式编码单元,将深度为1或2的编码单元输入第一多决策树模型预测模块,将深度为3的编码单元输入merge模式编码单元进行编码;
深度0的merge模式编码单元,用于根据将亮度分量在视频编码中产生的中间数据利用weka训练的决策树模型预测深度为0编码单元是否采用merge模式,若采用则进入merge模式编码单元,否则输入深度0的merge模式RJ检验单元;
深度0的merge模式RJ检验单元,用于对输入的数据进行RJ检验,若通过该检验,则进入merge模式编码单元,否则输入深度O的Inter2Nx2N模式编码单元;
深度0的Inter2Nx2N模式编码单元,用于根据将亮度分量在视频编码中产生的中间数据利用weka训练的决策树模型预测深度为0编码单元是否采用Inter2Nx2N模式,若采用则进入Inter2Nx2N模式编码单元,否则输入深度0的Inter2Nx2N模式RJ检验单元;
深度0的Inter2Nx2N模式RJ检验单元,用于对输入的数据进行RJ检验,若通过该检验,则进入Inter2Nx2N模式编码单元,否则进入标准算法编码流程;第一多merge模式决策树预测模块,用于根据将亮度分量在视频编码中产生的中间数据利用weka训练的决策树模型预测当前深度编码单元是否采用merge模式,若采用则进入merge模式编码单元,否则输入第一RJ检验单元;
第一RJ检验单元,用于对输入的数据进行RJ检验,若通过该检验则判断采用merge模式编码,否则将编码单元输入第二多决策树预测单元中;
第二多merge模式决策树预测模块,用于根据将亮度分量在视频编码中产生的中间数据利用weka训练的决策树模型预测当前深度编码单元是否采用merge模式,若采用则进入merge模式编码单元,否则输入第二RJ检验单元;
第二RJ检验单元,用于对输入的数据进行RJ检验,若通过该检验则判断采用merge模式编码,否则将编码单元输入第三多决策树预测单元中;
第三多merge模式决策树预测模块,用于根据将亮度分量在视频编码中产生的中间数据利用weka训练的决策树模型预测当前深度编码单元是否采用merge模式,若采用则进入merge模式编码单元,否则输入第三RJ检验单元;
第三RJ检验单元,用于对输入的数据进行RJ检验,若通过该检验则判断采用merge模式编码,否则将编码单元输入第四多merge模式决策树预测模块中;
第四多merge模式决策树预测模块,用于根据将亮度分量在视频编码中产生的中间数据利用weka训练的决策树模型预测当前深度编码单元是否采用merge模式,若采用则进入merge模式编码单元,否则输入第四RJ检验单元;
第四RJ检验单元,用于对输入的数据进行RJ检验,若通过该检验则判断采用merge模式编码,否则进入标准算法流程;
第一Inter2Nx2N模式决策树预测模块,用于根据将亮度分量在视频编码中产生的中间数据利用weka训练的决策树模型预测当前深度编码单元是否采用Inter2Nx2N模式,若采用则进入Inter2Nx2N模式投票模块,否则进入第四Inter2Nx2N模式决策树预测模块;第二Inter2Nx2N模式决策树预测模块,用于根据将亮度分量在视频编码中产生的中间数据利用weka训练的决策树模型预测当前深度编码单元是否采用merge模式,若采用则进入Inter2Nx2N模式投票模块,否则进入第四Inter2Nx2N模式决策树预测模块;
第三Inter2Nx2N模式决策树预测模块,用于根据将亮度分量在视频编码中产生的中间数据利用weka训练的决策树模型预测当前深度编码单元是否采用Inter2Nx2N模式,若采用则进入Inter2Nx2N模式投票模块,否则进入第四Inter2Nx2N模式决策树预测模块;
第四Inter2Nx2N模式决策树预测模块,用于根据将亮度分量在视频编码中产生的中间数据利用weka训练的决策树模型预测当前深度编码单元是否采用Inter2Nx2N模式,若采用则进入Inter2Nx2N模式编码单元,否则进入标准算法流程;
Inter2Nx2N模式投票模块,用于处理深度为1或2、父块模式为Inter2Nx2N模式且经过第一Inter2Nx2N模式决策树预测模块的编码单元、第二Inter2Nx2N模式决策树预测模块、第三Inter2Nx2N模式决策树预测模块都判断为Inter2Nx2N编码模式的编码单元,此模块中的编码单元都进入Inter2Nx2N模式编码单元;
merge模式编码单元,用于对编码单元根据merge模式进行编码;
Inter2Nx2N模式编码单元,用于对编码单元根据Inter2Nx2N模式进行编码。
进一步的,第一多merge模式决策树预测模块、第二多merge模式决策树预测模块、第三多merge模式决策树预测模块和第四多merge模式决策树预测模块是四棵复杂度从低到高的决策树,这四棵复杂度从低到高的决策树由当前编码单元的残差、纹理信息、率失真值这些特征数据共同训练,依照复杂度从低到高的顺序依次对当前编码单元进行预测,当预测当前编码单元不采用merge模式则调用RJ检验单元对编码模块的残差进行检测,当通过检测则跳过其他决策树,并将该编码单元输入merge模式编码单元。
进一步的,第一Inter2Nx2N模式决策树预测模块、第二Inter2Nx2N模式决策树预测模块、第三Inter2Nx2N模式决策树预测模块、第四Inter2Nx2N模式决策树预测模块包括四棵决策树,这四棵决策树的前三棵由当前编码单元的残差、纹理信息、运动矢量这三个部分的数据分别进行训练,第四棵由当前编码单元的残差信息、纹理信息和父块merge模式标签、运动矢量、率失真值这四个部分的数据综合进行训练,先用前3棵依次对当前编码单元进行预测,若均预测采用Inter2Nx2N模式编码则输入,否则再用第四棵由残差信息、运动矢量、纹理信息和父块merge模式标签、率失真值训练的决策树进行预测Inter2Nx2N模式编码单元,若第四棵决策树预测采用Inter2Nx2N模式,则输入Inter2Nx2N模式编码单元,否则进入标准算法流程。
实施例3
本实施例在对本发明方法和现有技术进行对比,对比的各个参数如表1所示。
表1
Figure GDA0003526401250000201
从上表可以看出率失真值方面,本发明的BDBR值优于Shen算法,平均编码时间(即TS值)提高了67.86%,比Shen算法提高了1.43%。因此可以得出结论,本发明的算法在编码效率损失很小的情况下显著提高编码速度。
本发明中所述的标准算法编码模块或者标准编码算法,是指现在广为使用的可伸缩高效视频编码标准算法,是高效视频编码标准(HEVC)算法的可伸缩扩展。当不适用本快速选择方法进行编码模式选择时,使用标准编码算法进行编码模式选择。
尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。

Claims (8)

1.一种SHVC视频编码模式快速选择的方法,其特征在于,包括以下步骤:
判断当前编码单元的深度,在编码模式快速选择算法的流程中,对深度为0的编码单元将亮度分量在视频编码中产生的中间数据利用weka训练的决策树模型预测当前编码单元是否采用merge模式,若不采用merge模式,则用RJ检验对残差进行检验,判断是否采用merge模式,若不采用则继续对深度为0的编码单元进行Inter2Nx2N编码模式的预测;
对深度为0的编码单元进行Inter2Nx2N编码模式的预测时,将亮度分量在视频编码中产生的中间数据利用weka训练的决策树模型预测当前编码单元是否采用Inter2Nx2N模式,若不采用Inter2Nx2N模式,则用RJ检验对残差进行检验,判断是否采用Inter2Nx2N模式,若不采用则进入标准编码算法的流程;
在编码模式快速选择算法的流程中,对深度为1或2的编码单元,判断当前深度编码单元的父块模式是否为merge模式,若为merge模式则将当前深度编码单元的视频亮度分量产生的中间数据信息依次利用weka训练的四棵通过设置训练决策树的叶子结点最小实例数导致复杂度由低到高的决策树预测,每次用决策树预测后再结合RJ检验对残差进行检测,若在其中一次的预测中判断采用merge模式或者RJ检验对残差进行检测判断采用merge模式,则采用merge模式并跳过其他决策树的预测,否则继续进行Inter2Nx2N模式预测;
在进行Inter2Nx2N模式预测时,判断当前深度编码单元的父块模式是否为Inter2Nx2N模式,若为Inter2Nx2N模式则将当前深度编码单元的视频亮度分量产生的中间数据信息利用weka分别训练的三棵决策树进行预测,这三棵决策树是利用当前编码单元的残差、纹理信息、运动矢量训练得到,若三棵决策树的预测结果都判定不采用Inter2Nx2N模式编码,再用第四棵利用当前编码单元的残差信息、运动矢量、纹理信息和父块merge模式标签、率失真值综合进行训练的决策树进行预测,若第四棵决策树预测采用Inter2Nx2N模式,则采用Inter2Nx2N模式,否则进入标准编码算法的流程;
在编码模式快速选择算法的流程中,对于深度为3的编码单元,选择merge模式作为编码模式进行编码。
2.根据权利要求1所述的一种SHVC视频编码模式快速选择的方法,其特征在于,用RJ检验对残差进行检验时,若R统计量小于R统计量的临界值cv(n)时,则判断RJ检验通过,R统计量表示为:
Figure FDA0003526401240000021
其中,bi为编码单元中在编码过程中产生的预测块和原始块之间的第i个残差满足正态分布的分位数;
Figure FDA0003526401240000022
是为了判断是否服从高斯分布拟合设置的参数,其值为0;yi为原始块和预测块第i个像素点产生的残差值;
Figure FDA0003526401240000023
为当前深度编码单元产生的残差的均值;n为编码单元中预测块和原始块的残差数据个数。
3.根据权利要求2所述的一种SHVC视频编码模式快速选择的方法,其特征在于,计算R统计量的临界值cv(n)时,将RJ检验根据置信水平和编码单元中预测块和原始块的残差个数n代入临界值公式求得的临界值,将在三种置信水平下临界值的最小值作为临界值cv(n),三种置信水平下临界值包括:
Figure FDA0003526401240000031
Figure FDA0003526401240000032
Figure FDA0003526401240000033
其中,α表示残差总体落在某一区间内可能错误的概率。
4.根据权利要求2所述的一种SHVC视频编码模式快速选择的方法,其特征在于,编码单元中在编码过程中产生的预测块和原始块之间的第i个残差满足正态分布的分位数bi的获取过程包括:
将残差数据按从小到大排序,计算残差分布的累积概率pi
计算残差的秩,即如果有k个相同的数,则其秩为k个秩之和除以k;
计算残差分布的累积概率pi后分别计算单个残差数据服从高斯分布的分位数bi,bi=Φ-1(pi),Φ-1()表示计算函数的反函数值。
5.一种SHVC视频编码模式快速选择装置,其特征在于,所述装置包括编码单元深度判断模块、深度0的merge模式编码单元、深度0的merge模式RJ检验单元、深度0的Inter2Nx2N模式编码单元、深度0的Inter2Nx2N模式RJ检验单元、第一多merge模式决策树预测模块、第一RJ检验单元、第二多merge模式决策树预测模块、第二RJ检验单元、第三多merge模式决策树预测模块、第三RJ检验单元、第四多merge模式决策树预测模块、第四RJ检验单元、第一Inter2Nx2N模式决策树预测模块、第二Inter2Nx2N模式决策树预测模块、第三Inter2Nx2N模式决策树预测模块、第四Inter2Nx2N模式决策树预测模块、Inter2Nx2N模式投票模块、merge模式编码单元和Inter2Nx2N模式编码单元;其中:
编码单元深度判断模块,用于判断编码单元的深度,将深度为0的编码单元输入深度0的merge模式编码单元,将深度为1或2的编码单元输入第一多决策树模型预测模块,将深度为3的编码单元输入merge模式编码单元进行编码;
深度0的merge模式编码单元,用于根据将亮度分量在视频编码中产生的中间数据利用weka训练的决策树模型预测深度为0编码单元是否采用merge模式,若采用则进入merge模式编码单元,否则输入深度0的merge模式RJ检验单元;
深度0的merge模式RJ检验单元,用于对输入的数据进行RJ检验,若通过该检验,则进入merge模式编码单元,否则输入深度0的Inter2Nx2N模式编码单元;
深度0的Inter2Nx2N模式编码单元,用于根据将亮度分量在视频编码中产生的中间数据利用weka训练的决策树模型预测深度为0编码单元是否采用Inter2Nx2N模式,若采用则进入Inter2Nx2N模式编码单元,否则输入深度0的Inter2Nx2N模式RJ检验单元;
深度0的Inter2Nx2N模式RJ检验单元,用于对输入的数据进行RJ检验,若通过该检验,则进入Inter2Nx2N模式编码单元,否则进入标准算法编码模块;
第一多merge模式决策树预测模块,用于根据将亮度分量在视频编码中产生的中间数据利用weka训练的决策树模型预测当前深度编码单元是否采用merge模式,若采用则进入merge模式编码单元,否则输入第一RJ检验单元;
第一RJ检验单元,用于对输入的数据进行RJ检验,若通过该检验则判断采用merge模式编码,否则将编码单元输入第二多merge模式决策树预测单元中;
第二多merge模式决策树预测模块,用于根据将亮度分量在视频编码中产生的中间数据利用weka训练的决策树模型预测当前深度编码单元是否采用merge模式,若采用则进入merge模式编码单元,否则输入第二RJ检验单元;
第二RJ检验单元,用于对输入的数据进行RJ检验,若通过该检验则判断采用merge模式编码,否则将编码单元输入第三多merge模式决策树预测单元中;
第三多merge模式决策树预测模块,用于根据将亮度分量在视频编码中产生的中间数据利用weka训练的决策树模型预测当前深度编码单元是否采用merge模式,若采用则进入merge模式编码单元,否则输入第三RJ检验单元;
第三RJ检验单元,用于对输入的数据进行RJ检验,若通过该检验则判断采用merge模式编码,否则将编码单元输入第四多merge模式决策树预测模块中;
第四多merge模式决策树预测模块,用于根据将亮度分量在视频编码中产生的中间数据利用weka训练的决策树模型预测当前深度编码单元是否采用merge模式,若采用则进入merge模式编码单元,否则输入第四RJ检验单元;
第四RJ检验单元,用于对输入的数据进行RJ检验,若通过该检验则判断采用merge模式编码,否则进入标准算法流程;
第一多merge模式决策树预测模块、第二多merge模式决策树预测模块、第三多merge模式决策树预测模块和第四多merge模式决策树预测模块包括四个复杂度从低到高的决策树,这四棵复杂度从低到高的决策树分别由当前编码单元的残差、纹理信息、率失真值共同训练,依照复杂度从低到高的顺序依次对当前编码单元进行预测,当预测当前编码单元不采用merge模式则调用RJ检验单元对编码模块的残差进行检测,当通过检测则跳过其他决策树,并将该编码单元输入merge模式编码单元;
第一Inter2Nx2N模式决策树预测模块,用于根据将亮度分量在视频编码中产生的中间数据利用weka训练的决策树模型预测当前深度编码单元是否采用Inter2Nx2N模式,若采用则进入Inter2Nx2N模式投票模块,否则进入第四Inter2Nx2N模式决策树预测模块;
第二Inter2Nx2N模式决策树预测模块,用于根据将亮度分量在视频编码中产生的中间数据利用weka训练的决策树模型预测当前深度编码单元是否采用Inter2Nx2N模式,若采用则进入Inter2Nx2N模式投票模块,否则进入第四Inter2Nx2N模式决策树预测模块;
第三Inter2Nx2N模式决策树预测模块,用于根据将亮度分量在视频编码中产生的中间数据利用weka训练的决策树模型预测当前深度编码单元是否采用Inter2Nx2N模式,若采用则进入Inter2Nx2N模式投票模块,否则进入第四Inter2Nx2N模式决策树预测模块;
第四Inter2Nx2N模式决策树预测模块,用于根据将亮度分量在视频编码中产生的中间数据利用weka训练的决策树模型预测当前深度编码单元是否采用Inter2Nx2N模式,若采用则进入Inter2Nx2N模式编码单元,否则进入标准算法编码模块;
Inter2Nx2N模式投票模块,用于处理深度为1或2、父块模式为Inter2Nx2N模式且经过第一Inter2Nx2N模式决策树预测模块的编码单元、第二Inter2Nx2N模式决策树预测模块、第三Inter2Nx2N模式决策树预测模块并不都判断为Inter2Nx2N编码模式的编码单元,并将该判断结果输入Inter2Nx2N模式编码单元,若采用则进入Inter2Nx2N模式编码单元,否则进入标准算法编码模块;
第一Inter2Nx2N模式决策树预测模块、第二Inter2Nx2N模式决策树预测模块、第三Inter2Nx2N模式决策树预测模块、第四Inter2Nx2N模式决策树预测模块包括四棵决策树,这四棵决策树的前三棵由当前编码单元的残差、纹理信息、运动矢量这三个部分的数据分别进行训练,第四棵由当前编码单元的残差、纹理信息、运动矢量、率失真值这四个部分的数据综合进行训练,先用前3棵依次对当前编码单元进行预测,若均预测采用Inter2Nx2N模式编码则输入Inter2Nx2N模式编码单元,否则再用第四棵由当前编码单元的残差、纹理信息、运动矢量、率失真值这四个部分的数据综合进行训练的决策树进行预测Inter2Nx2N模式编码单元,若第四棵决策树预测采用Inter2Nx2N模式,则输入Inter2Nx2N模式编码单元,否则进入标准算法流程;
merge模式编码单元,用于对编码单元根据merge模式进行编码;Inter2Nx2N模式编码单元,用于对编码单元根据Inter2Nx2N模式进行编码。
6.根据权利要求5所述的一种SHVC视频编码模式快速选择装置,其特征在于,RJ检验单元用RJ检验对残差进行检验时,若R统计量小于R统计量的临界值cv(n)时,则判断RJ检验通过,R统计量表示为:
Figure FDA0003526401240000081
其中,bi为编码单元中在编码过程中产生的预测块和原始块之间的第i个残差满足正态分布的分位数;
Figure FDA0003526401240000082
是为了判断是否服从高斯分布拟合设置的参数,其值为0;yi为原始块和预测块第i个像素点产生的残差值;
Figure FDA0003526401240000083
为当前深度编码单元产生的残差的均值;n为编码单元中预测块和原始块的残差数据个数。
7.根据权利要求6所述的一种SHVC视频编码模式快速选择装置,其特征在于,计算R统计量的临界值cv(n)时,将RJ检验根据置信水平α和编码单元中预测块和原始块的残差个数n代入临界值公式求得的临界值,临界值cv(n)表示为:
Figure FDA0003526401240000091
Figure FDA0003526401240000092
Figure FDA0003526401240000093
其中,α为残差总体落在某一区间内可能错误的概率,具体值的选取需要进行测试决定。
8.根据权利要求6所述的一种SHVC视频编码模式快速选择装置,其特征在于,编码单元中在编码过程中产生的预测块和原始块之间的第i个残差满足正态分布的分位数bi的获取过程包括:
将残差数据按从小到大排序,计算残差分布的累积概率pi
计算残差的秩,即如果有k个相同的数,则其秩为k个秩之和除以k;
计算残差分布的累积概率pi后分别计算单个残差数据服从高斯分布的分位数bi,bi=Φ-1(pi),Φ-1()表示计算函数的反函数值。
CN202011421368.7A 2020-12-08 2020-12-08 一种shvc视频编码模式快速选择的方法及装置 Active CN112383776B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011421368.7A CN112383776B (zh) 2020-12-08 2020-12-08 一种shvc视频编码模式快速选择的方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011421368.7A CN112383776B (zh) 2020-12-08 2020-12-08 一种shvc视频编码模式快速选择的方法及装置

Publications (2)

Publication Number Publication Date
CN112383776A CN112383776A (zh) 2021-02-19
CN112383776B true CN112383776B (zh) 2022-05-03

Family

ID=74589316

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011421368.7A Active CN112383776B (zh) 2020-12-08 2020-12-08 一种shvc视频编码模式快速选择的方法及装置

Country Status (1)

Country Link
CN (1) CN112383776B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113709492B (zh) * 2021-08-25 2023-03-24 重庆邮电大学 一种基于分布特征的shvc空间可伸缩视频编码方法
CN114520914B (zh) * 2022-02-25 2023-02-07 重庆邮电大学 一种基于shvc质量可伸缩帧间视频编码方法
CN116489386A (zh) * 2023-03-24 2023-07-25 重庆邮电大学 一种基于参考块的vvc帧间快速编码方法
CN116320436B (zh) * 2023-03-31 2023-11-07 重庆邮电大学 一种基于决策树的vvc快速编码方法

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2006096612A2 (en) * 2005-03-04 2006-09-14 The Trustees Of Columbia University In The City Of New York System and method for motion estimation and mode decision for low-complexity h.264 decoder
KR20130085088A (ko) * 2012-01-19 2013-07-29 한국전자통신연구원 스케일러블 비디오 코딩에서의 고속 모드 결정 방법 및 그 장치
US10142626B2 (en) * 2014-10-31 2018-11-27 Ecole De Technologie Superieure Method and system for fast mode decision for high efficiency video coding
CN107071418B (zh) * 2017-05-05 2020-03-17 上海应用技术大学 一种基于决策树的hevc帧内编码单元快速划分方法
CN108174204B (zh) * 2018-03-06 2020-01-03 中南大学 一种基于决策树的帧间快速模式选择方法
CN109361920B (zh) * 2018-10-31 2021-09-28 南京大学 一种面向多场景的自适应决策树选择的帧间快速预测算法
CN109729351B (zh) * 2018-12-18 2020-09-29 中南大学 一种低复杂度配置下的hevc快速模式选择方法
CN111355956B (zh) * 2020-03-09 2023-05-09 蔡晓刚 一种hevc帧内编码中基于深度学习的率失真优化快速决策系统及其方法

Also Published As

Publication number Publication date
CN112383776A (zh) 2021-02-19

Similar Documents

Publication Publication Date Title
CN112383776B (zh) 一种shvc视频编码模式快速选择的方法及装置
Choi et al. High efficiency compression for object detection
Barman et al. No-reference video quality estimation based on machine learning for passive gaming video streaming applications
KR102283725B1 (ko) 이미지 인코딩 방법 및 장치, 그리고 이미지 디코딩 방법 및 장치
CN107046639B (zh) 基于内容的hevc码流质量预测模型
CN112738511B (zh) 一种结合视频分析的快速模式决策方法及装置
CN109063574B (zh) 一种基于深度神经网络检测的包络框的预测方法、系统及设备
CN110248189B (zh) 一种视频质量预测方法、装置、介质和电子设备
CN113709492B (zh) 一种基于分布特征的shvc空间可伸缩视频编码方法
Shahid et al. Predicting full-reference video quality measures using HEVC bitstream-based no-reference features
CN108989799A (zh) 一种编码单元参考帧的选择方法、装置及电子设备
CN111263157A (zh) 一种基于运动矢量一致性的视频多域隐写分析方法
Zhang et al. Perceptual video coding with block-level staircase just noticeable distortion
Wang et al. Segmentation based video steganalysis to detect motion vector modification
CN105959685B (zh) 一种基于视频内容及聚类分析的压缩码率预测方法
Lu et al. Fast algorithm for CU partitioning and mode selection in HEVC intra prediction
Akoa et al. Video decoder monitoring using non-linear regression
Zheng et al. Effective H. 264/AVC to HEVC transcoder based on prediction homogeneity
CN116827921A (zh) 一种流媒体的音视频处理方法、装置及设备
EP3985983A1 (en) Interpolation filtering method and apparatus for intra-frame prediction, medium, and electronic device
Gao et al. A fast HEVC inter CU size decision algorithm based on multi-class learning
Huangyuan et al. Learning based fast H. 264 to H. 265 transcoding
Anegekuh et al. Encoded bitstream based video content type definition for HEVC video quality prediction
Nami et al. Lightweight Multitask Learning for Robust JND Prediction using Latent Space and Reconstructed Frames
Lin et al. CU partition prediction scheme for X265 intra coding using neural networks

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20240118

Address after: Room 801, 85 Kefeng Road, Huangpu District, Guangzhou City, Guangdong Province

Patentee after: Guangzhou Dayu Chuangfu Technology Co.,Ltd.

Address before: 400065 Chongwen Road, Nanshan Street, Nanan District, Chongqing

Patentee before: CHONGQING University OF POSTS AND TELECOMMUNICATIONS

TR01 Transfer of patent right