CN108012151B - 一种基于贝叶斯分类的自适应运动矢量精度快速选择方法与装置 - Google Patents

一种基于贝叶斯分类的自适应运动矢量精度快速选择方法与装置 Download PDF

Info

Publication number
CN108012151B
CN108012151B CN201711431808.5A CN201711431808A CN108012151B CN 108012151 B CN108012151 B CN 108012151B CN 201711431808 A CN201711431808 A CN 201711431808A CN 108012151 B CN108012151 B CN 108012151B
Authority
CN
China
Prior art keywords
block
imv
prediction unit
value
current prediction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201711431808.5A
Other languages
English (en)
Other versions
CN108012151A (zh
Inventor
张昊
马学睿
王剑光
牟凡
李明娟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Central South University
Original Assignee
Central South University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Central South University filed Critical Central South University
Priority to CN201711431808.5A priority Critical patent/CN108012151B/zh
Publication of CN108012151A publication Critical patent/CN108012151A/zh
Application granted granted Critical
Publication of CN108012151B publication Critical patent/CN108012151B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/109Selection of coding mode or of prediction mode among a plurality of temporal predictive coding modes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/56Motion estimation with initialisation of the vector search, e.g. estimating a good candidate to initiate a search
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/567Motion estimation based on rate distortion criteria

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

本发明公开了一种基于贝叶斯分类的自适应运动矢量精度快速选择方法及装置,通过贝叶斯分类算法,提前预测IMV的可能性,以跳过其不必要的帧间预测过程,在保证视频主观质量下降可忽略不计的情况下,从而进一步降低了新一代视频编码的计算复杂度,大幅度地缩短了帧间预测的时间,从而节省了编码时间;本方法简单易行,有利于新一代视频编码标准的产业化推广。

Description

一种基于贝叶斯分类的自适应运动矢量精度快速选择方法与 装置
技术领域
本发明属于视频编码领域,特别涉及一种基于贝叶斯分类的自适应运动矢量精度快速选择方法与装置。
背景技术
自适应运动矢量精度(AMVR,Advanced Motion Vector Resolution)是在运动估计中,完成1/4像素精度运动估计之后,由于1/4像素精度运动估计会带来比特数的增加,虽然可能失真减小了,但总体的RDcost(率失真代价)并没有减小,因此需要重新执行一次整像素运动估计并与之前获得的最优MV(运动矢量)进行比较,取RDcost最小者作为最终的最优MV。重新执行的整像素运动估计,被称之为IMV(Integer Motion Vector,整数运动矢量)。最近,新一代视频编码标准的制定引入了大量的新型编码工具,IMV技术则是其中之一。
新一代的视频编码标准依旧采用混合编码框架,包括变换、量化、熵编码、帧内预测、帧间预测以及环路滤波等模块,但是,为了提高视频压缩率,该标准采用QTBT(Quadtreeplus binary tree,四叉树加二叉树)的划分结构,取代了HEVC的四叉树划分。在QTBT结构下,去掉了多种划分类型如CU(编码单元)、PU(预测单元)和TU(变换单元)分离观念,支持更弹性的CU划分类型来更好的匹配视频数据的局部特征,同时在各个模块引入了一系列相当耗时的新型编码工具,例如基于Affine(仿射)的merge(合并)技术以及IMV(IntegerMotion Vector)技术等,这些技术在提高压缩率的同时却大幅度地提高了编码器的计算复杂度,这不利于新一代视频编码标准的产业化推广。因此,在保证视频主观质量下降可忽略不计的情况下,优化编码器并减少编码时间成为了视频编解码领域亟待研究和解决的新问题之一。
在新一代视频编码标准中引入的IMV属于运动估计(Motion Estimation,简称ME)的一部分。在新标准中,运动估计主要分为三个步骤,具体过程如下:
步骤一:执行整像素精度的运动估计,如果是B类型的slice,或者没有使用快速搜索模式,那么进行整像素精度的全搜索,如果是P类型的slice或者使用了快速搜索模式,那么进行整像素精度的快速搜索,通过比较各个MV的SAD选出最优的MV并保存相应的MV以及SAD信息;
步骤二:执行分像素精度的运动估计,即1/2和1/4像素精度运动估计。先执行1/2像素精度运动估计,再执行1/4像素精度运动估计,通过比较各个MV的SATD选出最优MV并保存相应的MV以及SATD信息;
步骤三:执行整像素精度运动估计,即IMV,若该整像素精度最优MV的率失真代价小于当前最佳MV的率失真代价,则将最优MV替换为整像素精度的MV,并保存其率失真代价以及相关信息。
通过对新一代视频编码标准的参考软件JEM的测试分析发现,在Lowdelay(低延迟)配置下,整个帧间预测的编码时间占总编码时间的40%~45%,因此,如果能通过提前预测出是否进行IMV,从而避免不必要的判断选择过程将大大提高新一代视频编码标准的编码效率。
发明内容
本发明针对新一代视频编码效率过低的缺陷,提出的一种基于贝叶斯分类的自适应运动矢量精度快速选择方法与装置,通过提前预测IMV的可能性,以跳过其不必要的帧间预测过程,在保证视频主观质量下降可忽略不计的情况下,降低编码器的计算复杂度,减少编码时间,提高编码效率。
一种基于贝叶斯分类的自适应运动矢量精度快速选择方法,包括以下步骤:
步骤1:在对视频帧图像的预测单元PU块执行帧间2Nx2N预测的运动估计时,获取当前预测单元PU块依次经过整像素精度运动估计和分像素精度运动估计后,每个像素点的最优MV的值和对应的预测MV值之差的二维正交变换;
所述当前预测单元PU块中每个像素点对应的预测MV值在编码过程中利用高级运动向量预测技术AMVP获得;
步骤2:基于步骤1获得的当前预测单元PU块各像素点所述的二维正交变换,分别计算当前预测单元PU块中所有像素点对应的二维正交变换绝对值之和,SATDint和SATDqter,并计算SATDint和SATDqter的比值SATDqter/SATDint
其中,SATDint表示整像素MV的SATD值,SATDqter表示分像素MV的SATD值;
所述SATD值表示经过哈达曼变换后的绝对误差和;
步骤3:获取当前预测单元PU块的QP值,以及统计当前预测单元PU块的相邻已编码的PU块中已执行IMV操作的数量占所有相邻已编码的PU块数量的比例S1,当前预测单元PU块中最优MV的比特数占编码的总比特数的比例S2;
步骤4:将步骤2获得的SATDqter/SATDint,步骤3获得的QP值、S1以及S2输入基于贝叶斯的IMV执行分类器,获得当前预测单元PU块是否需要执行IMV的分类标志;
所述基于贝叶斯的IMV执行分类器是将已执行过IMV模式的PU块的IMV标志位作为输出数据,对应的PU块按照步骤1-步骤3获得对应的SATDqter/SATDint、QP值、S1以及S2作为输入数据进行训练获得;
所述PU块的IMV标志位是指在执行过IMV模式后,IMV标志位为0表示PU块无需进行IMV模式,IMV标志位为1表示PU块需要进行IMV模式;
步骤5:依据步骤4得到的分类标志,对当前预测单元PU执行相应模式;
若当前预测单元PU需要执行IMV,则对当前预测单元PU执行IMV_2N×2N模式后,继续后续模式;
若当前预测单元PU不需要执行IMV,则当前预测单元PU跳过IMV_2N×2N模式,并根据率失真代价决策出最优MV以及当前预测单元PU块后续执行的最佳模式。
每个像素点的最优MV的值和对应的预测MV值之差的二维正交变换包括在两种运动估计下的对应的二维正交变换,即分别在整像素运动估计和分像素运动估计下的对应的二维正交变换;
利用贝叶斯算法结合已知是否需要执行IMV的PU块特征,自动算出当前预测单元PU块不执行IMV的概率和执行IMV的概率,比较两个概率值,输出当前预测单元PU块是否需要执行IMV的分类标志;
进一步地,所述当前预测单元PU块的相邻已编码的PU块包括当前预测单元PU块的左方的PU块、上方的PU块、左上方的PU块、右上的PU块以及同位PU块。
一种基于贝叶斯分类的自适应运动矢量精度快速选择装置,包括:
整像素精度运动估计模块,对视频帧图像的预测单元PU块执行帧间2Nx2N预测的运动估计时,在当前预测单元PU块经过整像素精度运动估计后,获得当前预测单元PU块的最优MV的值;
分像素精度运动估计模块,对视频帧图像的预测单元PU块执行帧间2Nx2N预测的运动估计时,在当前预测单元PU块经过分像素精度运动估计后,获得当前预测单元PU块的最优MV的值;
SATDint和SATDqter计算模块,首先利用当前预测单元PU块分别经过整像素精度运动估计和分像素精度运动估计后,获得每个像素点的最优MV的值和对应的预测MV值之差的二维正交变换,然后计算当前预测单元PU块中所有像素点对应的二维正交变换绝对值之和;
SATDint表示整像素MV的SATD值,SATDqter表示分像素MV的SATD值;
所述SATD表示经过哈达曼变换后的绝对误差和;
统计模块,获取当前预测单元PU块的QP值,以及统计当前预测单元PU块的相邻已编码的PU块中已执行IMV操作的数量占所有相邻已编码的PU块数量的比例S1,当前预测单元PU块中最优MV的比特数占编码的总比特数的比例S2;
基于贝叶斯的IMV执行分类器,利用当前预测单元PU块的SATDqter/SATDint、QP值、S1以及S2,获得当前预测单元PU块是否需要执行IMV的分类标志;
选择模块,依据基于贝叶斯的IMV执行分类器输出的当前预测单元PU块是否需要执行IMV的分类标志,选择当前预测单元PU块的执行模式:
若当前预测单元PU需要执行IMV,则对当前预测单元PU执行IMV_2N×2N模式后,继续后续模式;
若当前预测单元PU不需要执行IMV,则当前预测单元PU跳过IMV_2N×2N模式,并根据率失真代价决策出最优MV以及当前预测单元PU块后续执行的最佳模式。
进一步地,所述基于贝叶斯的IMV执行分类器是将已执行过IMV模式的PU块的IMV标志位作为输出数据,PU块按照SATDint和SATDqter计算模块和统计模块获得对应PU块的SATDqter/SATDint、QP值、S1以及S2作为输入数据进行训练获得;
所述PU块的IMV标志位是指在执行过IMV模式后,IMV标志位为0表示PU块无需进行IMV模式,IMV标志位为1表示PU块需要进行IMV模式。
进一步地,所述当前预测单元PU块的相邻已编码的PU块包括当前预测单元PU块的左方的PU块、上方的PU块、左上方的PU块、右上的PU块以及同位PU块。
有益效果
本发明提供了一种基于贝叶斯分类的自适应运动矢量精度快速选择方法及装置,通过贝叶斯分类算法,提前预测IMV的可能性,以跳过其不必要的帧间预测过程,在保证视频主观质量下降可忽略不计的情况下,从而进一步降低了新一代视频编码的计算复杂度,大幅度地缩短了帧间预测的时间,从而节省了编码时间;本方法简单易行,有利于新一代视频编码标准的产业化推广。
附图说明
图1为本发明所述方法的流程图。
具体实施方式
下面将结合附图和实施例对本发明做进一步的说明。
为减少编码时间,提高工作效率,本发明具体采用的技术方案为:首先确定特征属性,并提取一个测试序列的特征属性的值作为训练样本。然后,通过贝叶斯分类算法对训练数据进行训练,输出贝叶斯分类器。最后在编码器编码时,提取特征属性的值,即待分类项,并通过贝叶斯分类器对待分类项进行分类,共分为两类,一类是执行IMV,另一类是不执行IMV,即跳过IMV。
如图1所示,一种基于贝叶斯分类的自适应运动矢量精度快速选择方法,具体步骤如下:
步骤1:整像素精度运动估计模块,在对视频帧图像的预测单元PU(PredictionUnit)块执行帧间2Nx2N预测的运动估计时,在当前预测单元PU块经过整像素精度运动估计后,获取整像素最优MV的值,并计算其SATD值,公式如下:
步骤2:分像素精度运动估计模块,对视频帧图像的预测单元PU块执行帧间2Nx2N预测的分像素精度运动估计后,获取最优MV的值,计算SATDqter,并计算SATDqter/SATDint
步骤3:获取当前预测单元QP值;获取相邻已编码的PU块是否使用了IMV,相邻PU块包括左方的PU块、上方的PU块、左上方的PU块、右上的PU块以及同位PU块,最终统计得到使用IMV的块占所有相邻块的比例;获取当前预测单元的最优MV的比特数,以及编码总的比特数,从而计算最优MV的比特数占总比特数的比例。
步骤4:通过测试一个视频序列,获得上述所有步骤中的值,作为训练样本,通过贝叶斯分类算法进行训练,获得训练数据,生成基于贝叶斯的IMV执行分类器。
其中贝叶斯训练过程如下:
首先获取先验概率,即将所有的数据归结为两类,一类是不使用IMV,另一类是使用IMV,在获取的训练数据中,分别计算两个种类的概率,此概率即为先验概率,在此分别用P(C0)和P(C1)表示。最终计算出在每个类别下每个特征属性值的概率,即P(X1i|C0)~P(X4i|C0)和P(X1i|C1)~P(X4i|C1),i的取值根据每个特征属性值的个数而定,X1i~X4i分别表示SATDqter/SATDint的值、当前预测单元的QP值、最优MV的比特数占总比特数的比例以及相邻PU块中使用IMV的块占所有相邻块的比例这四个特征属性的值。
步骤5:获取前三个步骤中的数据,即SATDqter/SATDint的值、当前预测单元的QP值、最优MV的比特数占总比特数的比例以及相邻PU块中使用IMV的块占所有相邻块的比例。将数据输入贝叶斯分类器,输出该四种待分类项与是否执行IMV之间的映射关系。
其中贝叶斯分类过程如下:
首先,获得四个特征属性的值,然后在训练之后获得的训练数据中查找该特征值所对应的概率,即P(X1i|C0)~P(X4i|C0)和P(X1i|C1)~P(X4i|C1)。之后,计算P(X|C0)和P(X|C1),其中P(X|C0)=P(X1a|C0)x P(X2b|C0)x P(X3c|C0)x P(X4d|C0),a、b、c、d在i的取值范围内根据所对应的数据取值,同理可得P(X|C1)。最终,分别求得在该特征值下两种类别的概率,即该特征值下不使用IMV的概率P(C0|X)和该特征值下使用IMV的概率P(C1|X)。这两个的概率由贝叶斯公式可得,贝叶斯公式如下:
因此可得:
由于P(X)为常量,所以可以忽略。由此可得:
P(C0|X)=P(X|C0)P(C0)
P(C1|X)=P(X|C1)P(C1)
若满足如下公式:
P(C0|X)>P(C1|X)
则跳过步骤6,执行步骤7,否则继续执行。
所述PU块的IMV标志位是指在执行过IMV模式后,IMV标志位为0表示PU块无需进行IMV模式,IMV标志位为1表示PU块需要进行IMV模式;
步骤6:编码器进行IMV_2N×2N模式,并根据率失真代价决策出最优MV以及最佳模式。
步骤7:进行后续其他模式的判断。
一种基于贝叶斯分类的自适应运动矢量精度快速选择装置,包括:
整像素精度运动估计模块,对视频帧图像的预测单元PU块执行帧间2Nx2N预测的运动估计时,在当前预测单元PU块经过整像素精度运动估计后,获得当前预测单元PU块的最优MV的值;
分像素精度运动估计模块,对视频帧图像的预测单元PU块执行帧间2Nx2N预测的运动估计时,在当前预测单元PU块经过分像素精度运动估计后,获得当前预测单元PU块的最优MV的值;
SATDint和SATDqter计算模块,首先利用当前预测单元PU块分别经过整像素精度运动估计和分像素精度运动估计后,获得每个像素点的最优MV的值和对应的预测MV值之差的二维正交变换,然后计算当前预测单元PU块中所有像素点对应的二维正交变换绝对值之和;
SATDint表示整像素MV的SATD值,SATDqter表示分像素MV的SATD值;
所述SATD表示经过哈达曼变换后的绝对误差和;
统计模块,获取当前预测单元PU块的QP值,以及统计当前预测单元PU块的相邻已编码的PU块中已执行IMV操作的数量占所有相邻已编码的PU块数量的比例S1,当前预测单元PU块中最优MV的比特数占编码的总比特数的比例S2;
基于贝叶斯的IMV执行分类器,利用当前预测单元PU块的SATDqter/SATDint、QP值、S1以及S2,获得当前预测单元PU块是否需要执行IMV的分类标志;
选择模块,依据基于贝叶斯的IMV执行分类器输出的当前预测单元PU块是否需要执行IMV的分类标志,选择当前预测单元PU块的执行模式:
若当前预测单元PU需要执行IMV,则对当前预测单元PU执行IMV_2N×2N模式后,继续后续模式;
若当前预测单元PU不需要执行IMV,则当前预测单元PU跳过IMV_2N×2N模式,并根据率失真代价决策出最优MV以及当前预测单元PU块后续执行的最佳模式。
为了验证上述方法的正确性以及有效性,本发明基于参考软件JEM7.0在VisualStudio 2013软件上实现该方法。在测试最终实验结果时,考虑到在自己电脑上实验结果(主要指时间)的不稳定性,因此为了保证实验结果的稳定性,本发明的所有实验均在学校的高性能计算平台上进行,该平台硬件为曙光5000,其体系结构为混合式的集群(Cluster)架构,计算节点和八路、四核SMP胖节点组成,计算网络采用Infinband高速交换机,双精度浮点运算次数理论峰值达到10TFlops(十万亿次)、存储能力为20TB。所有实验的具体编码参数的配置选用JEM标准配置文件:encoder_lowdelay_jvet10.cfg以及对应测试序列的标准配置文件。
实验结果
为了验证方法性能的好坏,本实例采用BDBR(Bjotegaard Delta Bit rate)以及ΔT两个指标来进行评估。其中,BDBR是用来评估方法对视频质量的影响,BDBR越大说明方法对视频质量的影响越大,即方法的性能越差,其主要是通过设置四组不同的量化参数QP以获取四组不同Bits以及PSNR来进行计算。ΔT则是反映当前方法对编码器效率的提升,其计算公式如下所示:
其中,TJEM代表使用不加任何快速方法的原始编码器编码所使用的时间,Tprop代表加快速方法后编码所需时间,TR则代表加快速方法后编码器在效率上提升的百分比。
通过在高性能平台上进行实验仿真,本发明的实验结果如表1所示,ΔBits%为与传统的编码器相比比特率变化百分比,ΔPSNR/dB为与传统的编码器相比峰值信噪比变化。
由表1可知,加入快速方法的编码取得了良好的效果:在总体编码时间上降低了16.336%,而BDBR上升仅为0.864。由此实验结果可以看出,本发明在保证视频主观质量的前提下,提高了编码效率,达到了本发明的目的。
表1
本文中所描述的具体实施例仅仅是对本发明精神作举例说明。本发明所属技术领域的技术人员可以对所描述的具体实施例做各种各样的修改或补充或采用类似的方式替代,但并不会偏离本发明的精神或者超越所附权利要求书所定义的范围。

Claims (5)

1.一种基于贝叶斯分类的自适应运动矢量精度快速选择方法,其特征在于,包括以下步骤:
步骤1:在对视频帧图像的预测单元PU块执行帧间2Nx2N预测的运动估计时,获取当前预测单元PU块依次经过整像素精度运动估计和分像素精度运动估计后,每个像素点的最优MV的值和对应的预测MV值之差的二维正交变换;
所述当前预测单元PU块中每个像素点对应的预测MV值在编码过程中利用高级运动向量预测技术AMVP获得;
步骤2:基于步骤1获得的当前预测单元PU块各像素点所述的二维正交变换,分别计算当前预测单元PU块中所有像素点对应的二维正交变换绝对值之和,SATDint和SATDqter,并计算SATDint和SATDqter的比值SATDqter/SATDint
其中,SATDint表示整像素MV的SATD值,SATDqter表示分像素MV的SATD值;
所述SATD值表示经过哈达曼变换后的绝对误差和;
步骤3:获取当前预测单元PU块的QP值,以及统计当前预测单元PU块的相邻已编码的PU块中已执行IMV操作的数量占所有相邻已编码的PU块数量的比例S1,当前预测单元PU块中最优MV的比特数占编码的总比特数的比例S2;
步骤4:将步骤2获得的SATDqter/SATDint,步骤3获得的QP值、S1以及S2输入基于贝叶斯的IMV执行分类器,获得当前预测单元PU块是否需要执行IMV的分类标志;
所述基于贝叶斯的IMV执行分类器是将已执行过IMV模式的PU块的IMV标志位作为输出数据,对应的PU块按照步骤1-步骤3获得对应的SATDqter/SATDint、QP值、S1以及S2作为输入数据进行训练获得;
所述PU块的IMV标志位是指在执行过IMV模式后,IMV标志位为0表示PU块无需进行IMV模式,IMV标志位为1表示PU块需要进行IMV模式;
步骤5:依据步骤4得到的分类标志,对当前预测单元PU执行相应模式;
若当前预测单元PU需要执行IMV,则对当前预测单元PU执行IMV_2N×2N模式后,继续后续模式;
若当前预测单元PU不需要执行IMV,则当前预测单元PU跳过IMV_2N×2N模式,并根据率失真代价决策出最优MV以及当前预测单元PU块后续执行的最佳模式;
其中贝叶斯训练过程如下:
首先获取先验概率,即将所有的数据归结为两类,一类是不使用IMV,另一类是使用IMV,在获取的训练数据中,分别计算两个种类的概率,此概率即为先验概率,分别用P(C0)和P(C1)表示;最终计算出在每个类别下每个特征属性值的概率,即P(X1i|C0)~P(X4i|C0)和P(X1i|C1)~P(X4i|C1),i的取值根据每个特征属性值的个数而定,X1i~X4i分别为四个特征属性的值,依次表示SATDqter/SATDint的值、当前预测单元的QP值、最优MV的比特数占总比特数的比例以及相邻PU块中使用IMV的块占所有相邻块的比例;
其中贝叶斯分类过程如下:
首先,获得四个特征属性的值,然后在训练之后获得的训练数据中查找该特征值所对应的概率,即P(X1i|C0)~P(X4i|C0)和P(X1i|C1)~P(X4i|C1);之后,计算P(X|C0)和P(X|C1),其中P(X|C0)=P(X1a|C0)xP(X2b|C0)xP(X3c|C0)xP(X4d|C0),a、b、c、d在i的取值范围内根据所对应的数据取值,同理可得P(X|C1);最终,分别求得在该特征值下两种类别的概率,即该特征值下不使用IMV的概率P(C0|X)和该特征值下使用IMV的概率P(C1|X);这两个的概率由贝叶斯公式可得,贝叶斯公式如下:
可得:
由于P(X)为常量,由此可得:
P(C0|X)=P(X|C0)P(C0)
P(C1|X)=P(X|C1)P(C1)
若满足如下公式:
P(C0|X)>P(C1|X)
则表示当前预测单元PU需要执行IMV,否则,当前预测单元PU不需要执行IMV。
2.根据权利要求1所述的方法,其特征在于,所述当前预测单元PU块的相邻已编码的PU块包括当前预测单元PU块的左方的PU块、上方的PU块、左上方的PU块、右上的PU块以及同位PU块。
3.一种基于贝叶斯分类的自适应运动矢量精度快速选择装置,其特征在于,包括:
整像素精度运动估计模块,对视频帧图像的预测单元PU块执行帧间2Nx2N预测的运动估计时,在当前预测单元PU块经过整像素精度运动估计后,获得当前预测单元PU块的最优MV的值;
分像素精度运动估计模块,对视频帧图像的预测单元PU块执行帧间2Nx2N预测的运动估计时,在当前预测单元PU块经过分像素精度运动估计后,获得当前预测单元PU块的最优MV的值;
SATDint和SATDqter计算模块,首先利用当前预测单元PU块分别经过整像素精度运动估计和分像素精度运动估计后,获得每个像素点的最优MV的值和对应的预测MV值之差的二维正交变换,然后计算当前预测单元PU块中所有像素点对应的二维正交变换绝对值之和;
SATDint表示整像素MV的SATD值,SATDqter表示分像素MV的SATD值;
所述SATD表示经过哈达曼变换后的绝对误差和;
统计模块,获取当前预测单元PU块的QP值,以及统计当前预测单元PU块的相邻已编码的PU块中已执行IMV操作的数量占所有相邻已编码的PU块数量的比例S1,当前预测单元PU块中最优MV的比特数占编码的总比特数的比例S2;
基于贝叶斯的IMV执行分类器,利用当前预测单元PU块的SATDqter/SATDint、QP值、S1以及S2,获得当前预测单元PU块是否需要执行IMV的分类标志;
选择模块,依据基于贝叶斯的IMV执行分类器输出的当前预测单元PU块是否需要执行IMV的分类标志,选择当前预测单元PU块的执行模式:
若当前预测单元PU需要执行IMV,则对当前预测单元PU执行IMV_2N×2N模式后,继续后续模式;
若当前预测单元PU不需要执行IMV,则当前预测单元PU跳过IMV_2N×2N模式,并根据率失真代价决策出最优MV以及当前预测单元PU块后续执行的最佳模式;
其中贝叶斯训练过程如下:
首先获取先验概率,即将所有的数据归结为两类,一类是不使用IMV,另一类是使用IMV,在获取的训练数据中,分别计算两个种类的概率,此概率即为先验概率,分别用P(C0)和P(C1)表示;最终计算出在每个类别下每个特征属性值的概率,即P(X1i|C0)~P(X4i|C0)和P(X1i|C1)~P(X4i|C1),i的取值根据每个特征属性值的个数而定,X1i~X4i分别为四个特征属性的值,依次表示SATDqter/SATDint的值、当前预测单元的QP值、最优MV的比特数占总比特数的比例以及相邻PU块中使用IMV的块占所有相邻块的比例;
其中贝叶斯分类过程如下:
首先,获得四个特征属性的值,然后在训练之后获得的训练数据中查找该特征值所对应的概率,即P(X1i|C0)~P(X4i|C0)和P(X1i|C1)~P(X4i|C1);之后,计算P(X|C0)和P(X|C1),其中P(X|C0)=P(X1a|C0)xP(X2b|C0)xP(X3c|C0)xP(X4d|C0),a、b、c、d在i的取值范围内根据所对应的数据取值,同理可得P(X|C1);最终,分别求得在该特征值下两种类别的概率,即该特征值下不使用IMV的概率P(C0|X)和该特征值下使用IMV的概率P(C1|X);这两个的概率由贝叶斯公式可得,贝叶斯公式如下:
可得:
由于P(X)为常量,由此可得:
P(C0|X)=P(X|C0)P(C0)
P(C1|X)=P(X|C1)P(C1)
若满足如下公式:
P(C0|X)>P(C1|X)
则表示当前预测单元PU需要执行IMV,否则,当前预测单元PU不需要执行IMV。
4.根据权利要求3所述的装置,其特征在于,所述基于贝叶斯的IMV执行分类器是将已执行过IMV模式的PU块的IMV标志位作为输出数据,PU块按照SATDint和SATDqter计算模块和统计模块获得对应PU块的SATDqter/SATDint、QP值、S1以及S2作为输入数据进行训练获得;
所述PU块的IMV标志位是指在执行过IMV模式后,IMV标志位为0表示PU块无需进行IMV模式,IMV标志位为1表示PU块需要进行IMV模式。
5.根据权利要求4所述的装置,其特征在于,所述当前预测单元PU块的相邻已编码的PU块包括当前预测单元PU块的左方的PU块、上方的PU块、左上方的PU块、右上的PU块以及同位PU块。
CN201711431808.5A 2017-12-26 2017-12-26 一种基于贝叶斯分类的自适应运动矢量精度快速选择方法与装置 Active CN108012151B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711431808.5A CN108012151B (zh) 2017-12-26 2017-12-26 一种基于贝叶斯分类的自适应运动矢量精度快速选择方法与装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711431808.5A CN108012151B (zh) 2017-12-26 2017-12-26 一种基于贝叶斯分类的自适应运动矢量精度快速选择方法与装置

Publications (2)

Publication Number Publication Date
CN108012151A CN108012151A (zh) 2018-05-08
CN108012151B true CN108012151B (zh) 2019-06-25

Family

ID=62061470

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711431808.5A Active CN108012151B (zh) 2017-12-26 2017-12-26 一种基于贝叶斯分类的自适应运动矢量精度快速选择方法与装置

Country Status (1)

Country Link
CN (1) CN108012151B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113433893A (zh) * 2021-07-12 2021-09-24 东北大学 一种基于回溯贝叶斯的机器人伺服系统性能指标标定方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000512474A (ja) * 1997-07-28 2000-09-19 ファースト サーチ アンド トランスファー エイエスエイ 圧縮コーディングにおける方法
CN101790092A (zh) * 2010-03-15 2010-07-28 河海大学常州校区 基于图像块编码信息的智能滤波器设计方法
CN102377995A (zh) * 2010-08-05 2012-03-14 富士通株式会社 分数像素运动估计方法和系统
CN106803962A (zh) * 2017-02-16 2017-06-06 南京理工大学 基于贝叶斯准则的3d视频深度图帧内预测模式选择方法
CN107277506A (zh) * 2017-08-15 2017-10-20 中南大学 一种基于自适应运动矢量精度的运动矢量精度快速选择方法及装置

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090003452A1 (en) * 2007-06-29 2009-01-01 The Hong Kong University Of Science And Technology Wyner-ziv successive refinement video compression

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000512474A (ja) * 1997-07-28 2000-09-19 ファースト サーチ アンド トランスファー エイエスエイ 圧縮コーディングにおける方法
CN101790092A (zh) * 2010-03-15 2010-07-28 河海大学常州校区 基于图像块编码信息的智能滤波器设计方法
CN102377995A (zh) * 2010-08-05 2012-03-14 富士通株式会社 分数像素运动估计方法和系统
CN106803962A (zh) * 2017-02-16 2017-06-06 南京理工大学 基于贝叶斯准则的3d视频深度图帧内预测模式选择方法
CN107277506A (zh) * 2017-08-15 2017-10-20 中南大学 一种基于自适应运动矢量精度的运动矢量精度快速选择方法及装置

Also Published As

Publication number Publication date
CN108012151A (zh) 2018-05-08

Similar Documents

Publication Publication Date Title
CN107147911B (zh) 基于局部亮度补偿lic的快速帧间编码模式选择方法及装置
CN107277506B (zh) 基于自适应运动矢量精度的运动矢量精度选择方法及装置
CN102893604B (zh) 用于视频的数据压缩
CN103260031B (zh) 用于对运动矢量进行编码/解码的方法和设备
CN101610413B (zh) 一种视频的编码/解码方法及装置
CN106131546B (zh) 一种提前确定hevc合并和跳过编码模式的方法
CN104796694B (zh) 基于视频纹理信息的优化帧内视频编码方法
CN101420617B (zh) 一种十字六边形运动估计搜索方法
CN106713929B (zh) 一种基于深度神经网络的视频帧间预测增强方法
CN104333756B (zh) 基于时域相关性的hevc预测模式快速选择方法
CN101394566B (zh) 一种十字菱形运动估计搜索方法
CN106713933A (zh) 图像解码方法
CN103797803A (zh) 用于熵编码/解码的方法和设备
CN111654698B (zh) 一种针对h.266/vvc的快速cu分区决策方法
CN105791826A (zh) 一种基于数据挖掘的hevc帧间快速模式选择方法
CN108769696A (zh) 一种基于Fisher判别式的DVC-HEVC视频转码方法
CN109729351A (zh) 一种低复杂度配置下的hevc快速模式选择方法
CN111263157A (zh) 一种基于运动矢量一致性的视频多域隐写分析方法
CN103096064B (zh) 编码和重构像素块的方法以及相应设备
CN103702131B (zh) 一种基于模式预处理的帧内编码优化方法和系统
CN108012151B (zh) 一种基于贝叶斯分类的自适应运动矢量精度快速选择方法与装置
CN109874012A (zh) 一种视频编码方法、编码器、电子设备及介质
CN103873862B (zh) 一种帧内快速编码方法及系统
CN101600111A (zh) 一种实现自适应插值滤波二次编码的搜索方法
CN109688411B (zh) 一种视频编码率失真代价估计方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant