CN104601991B - 一种时域预测参数的搜索方法和装置 - Google Patents

一种时域预测参数的搜索方法和装置 Download PDF

Info

Publication number
CN104601991B
CN104601991B CN201410851138.2A CN201410851138A CN104601991B CN 104601991 B CN104601991 B CN 104601991B CN 201410851138 A CN201410851138 A CN 201410851138A CN 104601991 B CN104601991 B CN 104601991B
Authority
CN
China
Prior art keywords
merging patterns
adama
always
best merging
parameter
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201410851138.2A
Other languages
English (en)
Other versions
CN104601991A (zh
Inventor
朱洪波
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing QIYI Century Science and Technology Co Ltd
Original Assignee
Beijing QIYI Century Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing QIYI Century Science and Technology Co Ltd filed Critical Beijing QIYI Century Science and Technology Co Ltd
Priority to CN201410851138.2A priority Critical patent/CN104601991B/zh
Publication of CN104601991A publication Critical patent/CN104601991A/zh
Application granted granted Critical
Publication of CN104601991B publication Critical patent/CN104601991B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

本发明实施例提供了一种时域预测参数的搜索方法和装置,其中,所述时域预测参数的搜索方法,具体包括:对编码单元进行合并模式最佳运动参数决定,确定所述编码单元的最佳合并模式;确定所述编码单元最佳合并模式的阿达玛总花费;所述最佳合并模式的阿达玛总花费为所述最佳合并模式的阿达玛花费与所述最佳合并模式的索引花费的和,其中,索引花费为拉格朗日参数和所述最佳合并模式索引对应的比特数的乘积;在所述最佳合并模式的阿达玛总花费满足第一终止条件时,确定所述最佳合并模式的预测参数为当前编码单元的最佳时域预测参数。本发明可以降低帧间编码的复杂度,提高编码效率。

Description

一种时域预测参数的搜索方法和装置
技术领域
本发明涉及视频编码技术领域,特别是涉及一种时域预测参数的搜索方法和装置。
背景技术
HEVC(High Efficiency Video Coding,高效视频编码标准)是新一代视频编码标准,其产生的目的是解决人们对视觉和听觉质量日益增加的需求。
HEVC有两种帧间编码模式,一种是合并(Merge)模式,合并模式利用时空相邻的已编码单元的运动参数得到当前编码单元的运动参数(包括参考索引和运动向量),并把Merge索引编入码流;另一种是运动估计模式,运动估计模式对于当前编码单元,一般有2个参考列,前向参考列(List0)和后向参考列(List1),每个参考列可以有一个或多个参考图像,对所有参考图像中的每一个,执行单向运动估计,得到最佳前向和后向运动参数,然后执行双向运动估计得到最佳双向运动参数,最后从三者中选择最优的一种作为最佳运动估计模式。
现有一种时域预测参数的搜索方法具体可以包括如下流程步骤:首先生成最多5个Merge模式的预测参数,然后计算每个预测参数的率失真花费或阿达玛花费,从中选择花费最小的一个作为最佳Merge模式;然后对当前编码单元的所有参考图像中的每一个,执行单向运动估计,得到最佳前向和后向运动参数,然后执行双向运动估计得到最佳双向运动参数,从最佳前向、后向和双向运动参数三者中选择最优的一种计算率失真花费或阿达玛花费,并将选择结果和最佳Merge模式的率失真花费或阿达玛花费做对比,确定率失真花费或阿达玛花费最小的优先帧间编码模式,并将该最优帧间编码模式对应时域预测参数作为当前编码单元的最佳时域预测参数。然而,运动估计过程以及率失真花费或阿达玛花费的计算过程都比较复杂,因此,穷举所有的运动估计过程以及对两种帧间编码模式中的每一种情况进行率失真花费或阿达玛花费的计算,都需要复杂的计算且会耗费大量的计算量,因此增加了编码的复杂度和编码时间。
发明内容
本发明实施例所要解决的技术问题是提供一种时域预测参数的搜索方法和装置,能够降低帧间编码的复杂度,提高编码效率。
为了解决上述问题,本发明公开了一种时域预测参数的搜索方法,包括:
对编码单元进行合并模式最佳运动参数决定,确定所述编码单元的最佳合并模式;
确定所述编码单元最佳合并模式的阿达玛总花费;所述最佳合并模式的阿达玛总花费为所述最佳合并模式的阿达玛花费与所述最佳合并模式的索引花费的和,其中,索引花费为拉格朗日参数和所述最佳合并模式索引对应的比特数的乘积;
在所述最佳合并模式的阿达玛总花费满足第一终止条件时,确定所述最佳合并模式的预测参数为当前编码单元的最佳时域预测参数。
优选地,所述最佳合并模式的阿达玛总花费满足第一终止条件,包括:所述最佳合并模式的阿达玛总花费小于第一阈值。
优选地,通过如下步骤确定所述第一阈值:
依据当前编码单元相邻像素的梯度绝对值之和计算当前编码单元的复杂度;
依据当前编码单元的复杂度、以及所述编码单元的面积与量化参数的乘积确定所述第一阈值。
优选地,所述方法还包括:
在所述最佳合并模式的阿达玛总花费不满足第一终止条件时,计算所述编码单元针对第一个参考图像的单向运动估计的总花费;
在所述总花费与所述最佳合并模式的阿达玛总花费满足第二终止条件时,确定所述最佳合并模式的预测参数为当前编码单元的最佳时域预测参数。
优选地,所述总花费与所述最佳合并模式的阿达玛总花费满足第二终止条件包括:
所述总花费大于第二阈值;以及
所述总花费大于所述最佳合并模式的阿达玛总花费。
优选地,所述方法还包括:
在所述总花费与所述最佳合并模式的阿达玛总花费不满足第二终止条件时,执行后续运动估计过程。
优选地,所述第二阈值为依据所述编码单元的复杂度、所述编码单元的面积与量化参数的乘积、以及所述最佳合并模式的阿达玛花费确定的值。
依据本发明的另一个方面,提供了一种时域预测参数的搜索装置,包括:
合并模式确定模块,用于对编码单元进行合并模式最佳运动参数决定,确定所述编码单元的最佳合并模式;
第一计算模块,用于确定所述编码单元最佳合并模式的阿达玛总花费;所述最佳合并模式的阿达玛总花费为所述最佳合并模式的阿达玛花费与所述最佳合并模式的索引花费的和,其中,索引花费为拉格朗日参数和所述最佳合并模式索引对应的比特数的乘积;以及
第一确定模块,用于在所述最佳合并模式的阿达玛总花费满足第一终止条件时,确定所述最佳合并模式的预测参数为当前编码单元的最佳时域预测参数。
优选地,所述最佳合并模式的阿达玛总花费满足第一终止条件,包括:所述最佳合并模式的阿达玛总花费小于第一阈值。
优选地,所述装置还包括:用于确定第一阈值的第一阈值确定模块;
其中,所述第一阈值确定模块,包括:
复杂度计算单元,用于依据当前编码单元相邻像素的梯度绝对值之和计算当前编码单元的复杂度;以及
第一阈值计算单元,用于依据当前编码单元的复杂度、以及所述编码单元的面积与量化参数的乘积确定所述第一阈值。
优选地,所述装置还包括:
第二计算模块,用于在所述最佳合并模式的阿达玛总花费不满足第一终止条件时,计算所述编码单元针对第一个参考图像的单向运动估计的总花费;
第二确定模块,用于在所述总花费与所述最佳合并模式的阿达玛总花费满足第二终止条件时,确定所述最佳合并模式的预测参数为当前编码单元的最佳时域预测参数。
优选地,所述总花费与所述最佳合并模式的阿达玛总花费满足第二终止条件包括:
所述总花费大于第二阈值;以及
所述总花费大于所述最佳合并模式的阿达玛总花费。
优选地,所述装置还包括:
运动估计模块,用于在所述总花费与所述最佳合并模式的阿达玛总花费不满足第二终止条件时,执行后续运动估计过程。
优选地,所述第二阈值为依据所述编码单元的复杂度、所述编码单元的面积与量化参数的乘积、以及所述最佳合并模式的阿达玛花费确定的值。
与现有技术相比,本发明实施例包括以下优点:
本发明实施例在最佳合并模式的阿达玛花费满足第一终止条件时,确定最佳合并模式的预测参数为当前编码单元的最佳时域预测参数;因此,避免了穷举合并模式和运动估计模式所有模式的运动估计过程以及对模式对应的阿达玛花费计算过程,也即可以节省运动估计模式对应运动估计过程的计算量,减小了计算复杂度,从而能够降低帧间编码的复杂度,提高编码效率。
附图说明
图1示出了本发明的一种时域预测参数的搜索方法实施例一的步骤流程图;
图2示出了本发明的一种合并模式下的空域预测示意图;
图3示出了本发明的一种合并模式下的时域预测示意图;
图4示出了本发明的一种时域预测参数的搜索方法实施例二的步骤流程图;
图5示出了本发明的一种时域预测参数的搜索方法实施例三的步骤流程图;
图6示出了本发明的一种时域预测参数的搜索方法示例的步骤流程图;以及
图7示出了本发明的一种时域预测参数的搜索装置实施例的结构框图。
具体实施方式
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
本发明改进了编码单元的时域预测参数的搜索方法,在对当前编码单元进行合并模式估计完成后,获得最佳合并模式的阿达玛花费,当最佳合并模式的阿达玛花费满足第一终止条件时,可以确定最佳合并模式的预测参数为当前编码单元的最佳时域预测参数。因此,避免了穷举所有模式的运动估计过程以及对所有模式对应的阿达玛花费计算,可以节省运动估计模式对应运动估计过程的计算量,减小了计算复杂度,从而能够降低帧间编码的复杂度,提高编码效率。
实施例一
参照图1,示出了本发明的一种时域预测参数的搜索方法实施例一的步骤流程图,具体可以包括:
步骤101、对编码单元进行合并模式最佳运动参数决定,确定所述编码单元的最佳合并模式;
在具体实现中,所述对编码单元进行合并模式最佳运动参数决定,确定所述编码单元的最佳合并模式的步骤,具体可以包括以下子步骤:
子步骤A1、对当前编码单元进行合并模式运动参数估计,生成5个合并模式预测参数;
在本发明的一种应用示例中,对当前编码单元进行合并模式运动参数估计,可以生成最多5种运动参数(如参考索引和运动向量等)集,对于运动参数集的具体数目本发明不加以限制。
生成合并模式时域预测参数集可以包括空域预测和时域预测,如果不够可以再添加组合预测和0运动向量预测,组合预测就是根据已生成的时域运动预测参数组合生成新的预测参数,如第一组的前向预测参数和第二组的后向预测参数组成一个新的预测,0运动向量预测就是选择一个参考索引和0运动向量组合作为一个预测。参照图2,示出了本发明的一种合并模式下的空域预测示意图,其中,大的长方形是当前块,A0,A1、B0、B1、B2是已编码重构块,当前块的空域合并模式的运动参数就是直接拷贝这些参考块的运动参数,其顺序是A1->B1->B0->A0->B2。
参照图3,示出了本发明的一种合并模式下的时域预测示意图,其在当前块的参考图像中找到和当前块时域位置接近的块,然后将其运动参数作为当前块的运动参数。例如,首先,从参考队列中找出与当前帧(记为curr-pic)的POC(显示序号)最接近的帧(记为col-pic)以及当前预测单元的参考帧(记为curr-ref)。其次,从col-pic中找两个预测单元作为候选位置,择其一为时域参考预测单元(记为col-PU)。最后,利用curr-pic的和curr-ref的POC距离tb,col-pic和col-ref的POC距离td,对时域参考预测单元col-PU的运动矢量进行缩放,计算出当前预测单元的运动矢量。
子步骤A2、对所述5个合并模式预测参数中的每一个计算对应的阿达玛花费;
其中,阿达玛花费的计算过程具体可以包括:对于任意大小的一个像素块,如果它的宽和高都是8的倍数,那么把它分成若干8×8子块,否则分成若干4×4子块。然后对每个8×8子块或4×4子块执行阿达玛变换,再将所有的变换系数的绝对值累加起来得到Ap,如果当前块是4×4,那么(Ap+1)/2就是4×4块的阿达玛花费,如果是8×8块,那么(Ap+2)/4就是当前8×8块的阿达玛花费,一个块的阿达玛花费是其所有分割出的4×4或8×8子块的阿达玛花费的和。
子步骤A3、确定最小的阿达玛总花费对应的合并模式为当前编码单元的最佳合并模式。
具体地,最佳合并(Merge)模式可以通过最小化HADm+bitmrgidx×λmotion来决定,其中,HADm为最佳合并模式对应的阿达玛花费,bitmrgidx为最佳合并模式索引的码率花费,对于5个Merge索引,它们的码率花费并不相同,λmotion为拉格朗日参数。在本发明实施例中,将bitmrgidx×λmotion记为最佳合并模式对应的索引花费,即最佳合并模式的阿达玛总花费具体可以为所述最佳合并模式的阿达玛花费HADm与对应的索引花费bitmrgidx×λmotion的和。
步骤102、确定所述编码单元最佳合并模式的阿达玛总花费;所述最佳合并模式的阿达玛总花费为所述最佳合并模式的阿达玛花费与所述最佳合并模式的索引花费的和,其中,索引花费为拉格朗日参数和所述最佳合并模式索引对应的比特数的乘积;
依据前述步骤101中的计算结果,可以确定最小的阿达玛总花费为当前编码单元最佳合并模式的阿达玛总花费。
步骤103、在所述最佳合并模式的阿达玛总花费满足第一终止条件时,确定所述最佳合并模式的预测参数为当前编码单元的最佳时域预测参数。
本发明实施例中,第一终止条件可以用于表示所述最佳合并模式的阿达玛总花费足够小的各种条件,在所述最佳合并模式的阿达玛总花费满足第一终止条件时,可以认为所述最佳合并模式的花费是可以承受的,因此无需再进行运动估计模式对应的后续运动估计过程。
具体地,所述最佳合并模式的阿达玛总花费满足第一终止条件,具体可以包括:所述最佳合并模式的阿达玛总花费小于第一阈值。
例如,可以通过如下不等式确定最佳合并模式的阿达玛总花费是否满足第一终止条件:
thfst>HADm+bitmrgidx×λmotion (1)
即当所述最佳合并模式的阿达玛总花费满足上述不等式(1)时,确定所述最佳合并模式的预测参数为当前编码单元的最佳时域预测参数,可以终止后续的运动估计过程。其中,第一阈值thfst可以为一个较小的值,因此上述不等式说明最佳合并模式的花费已经非常小了,所以可以认为最佳合并模式为最佳帧间编码模式,也即最佳合并模式的预测参数为当前编码单元的最佳时域预测参数,因此无需再进行其它模式的运动估计。其中,第一阈值thfst可以通过编码器实验统计得到,λmotion为拉格朗日参数,bitmrgidx为合并模式索引需要的比特数。
在满足第一终止条件时,即可终止后续的运动估计过程,因此可以排除一部分的运动估计的计算量,从而减小了计算复杂度。
在本发明的一种可选实施例中,第一阈值thfst可以通过如下子步骤确定:
子步骤B1、依据当前编码单元相邻像素的梯度绝对值之和计算当前编码单元的复杂度;
具体可以通过以下公式计算当前编码单元的复杂度grad:
其中,Ii,j表示坐标为(i,j)处像素强度,abs为绝对值操作,Ω为当前编码单元中所有容许的坐标值的集合。
子步骤B2、依据当前编码单元的复杂度、以及所述编码单元的面积与量化参数的乘积确定第一阈值thfst
thfst=(((grad×5>>2)+(M×N×qp×9>>7))×3)>>4 (3)
通过上式(3)计算出的第一阈值thfst可以为一个较小的值,其中,qp为当前编码单元的量化参数,grad×5>>2表示相邻像素的梯度越大,第一阈值thfst也就越大。M×N×qp是面积与量化参数的乘积,表示量化参数越大,第一阈值thfst越大。
需要说明的是,上述所述最佳合并模式的阿达玛总花费小于第一阈值只是作为第一终止条件的一个示例,本领域技术人员可以根据实际需要采用其它的第一终止条件,本发明实施例对具体的第一终止条件不加以限制。
综上,本发明实施例在对当前编码单元进行合并模式运动参数估计完成后,获得最佳合并模式对应的阿达玛总花费,当该最佳合并模式对应的阿达玛总花费满足第一终止条件时,即可以确定该最佳合并模式的预测参数为当前编码单元的最佳时域预测参数。因此,避免了穷举所有模式的运动估计过程以及对所有模式对应的阿达玛花费计算,可以节省运动估计模式对应运动估计过程的计算量,减小了计算复杂度,从而能够降低帧间编码的复杂度,提高编码效率。
实施例二
参照图4,示出了本发明的一种时域预测参数的搜索方法实施例二的步骤流程图,具体可以包括:
步骤401、对编码单元进行合并模式最佳运动参数决定,确定所述编码单元的最佳合并模式;
步骤402、确定所述编码单元最佳合并模式的阿达玛总花费;所述最佳合并模式的阿达玛总花费为所述最佳合并模式的阿达玛花费与所述最佳合并模式的索引花费的和,其中,索引花费为拉格朗日参数和所述最佳合并模式索引对应的比特数的乘积;
步骤403、在所述最佳合并模式的阿达玛总花费满足第一终止条件时,确定所述最佳合并模式的预测参数为当前编码单元的最佳时域预测参数;
本实施例的时域预测参数的搜索方法在上述实施例一的基础上,进一步还可以包括如下步骤:
步骤404、在所述最佳合并模式的阿达玛总花费不满足第一终止条件时,计算所述编码单元针对第一个参考图像的单向运动估计的总花费;
步骤405、在所述总花费与所述最佳合并模式的阿达玛总花费满足第二终止条件时,确定所述最佳合并模式的预测参数为当前编码单元的最佳时域预测参数。
在所述最佳合并模式的阿达玛总花费不满足第一终止条件时,需要继续执行后续的单向运动估计来确定当前编码单元的最佳时域预测参数。
其中,所述单向运动估计过程具体可以包括:
对当前编码单元在第一个参考图像中进行匹配,并找到与当前编码单元最匹配的那个块,这个块可能指向分数位置,这种情况下,可以通过插值滤波器计算所述单向运动估计对应的预测块。
计算所述编码单元针对第一个参考图像的单向运动估计的总花费,具体可以包括以下子步骤:
子步骤C1、对第一个参考图像进行运动估计,获得运动向量,确定所述单向运动估计对应的码率花费bitsmv0(具体可以包括运动向量和参考索引);
其中,运动向量为偏移量,参考索引用于标识具体指向哪副参考图像。
子步骤C2、确定所述单向估计匹配误差的阿达玛花费HADmv0
其中,匹配误差为待编码单元和对应的预测单元相减得到的差,然后对这个差进行阿达玛变换,得到匹配误差的阿达玛花费HADmv0
子步骤C3、依据所述码率花费bitsmv0和匹配误差的阿达玛花费HADmv0计算所述单向估计对应的总花费costmv0
具体地,总花费costmv0可以通过以下公式进行计算:
costmv0=HADmv0motion×bitsmv0 (4)
在所述总花费costmv0与所述最佳合并模式的阿达玛总花费满足第二终止条件时,确定所述最佳合并模式的预测参数为当前编码单元的最佳时域预测参数。同时,可以终止后续的运动估计过程。
在本发明的一种可选实施例中,所述总花费与所述最佳合并模式的阿达玛总花费满足第二终止条件可以包括:
所述总花费大于第二阈值;以及
所述总花费大于所述最佳合并模式的阿达玛总花费。
具体地,当以下两个不等式同时成立时,可以确定所述总花费与所述最佳合并模式的阿达玛总花费满足第二终止条件:
costmv0>thscd (5)
costmv0>HADm+bitmrgidx×λmotion (6)
其中,costmv0为当前编码单元针对第一个参考图像的单向运动估计的总花费,thscd为第二阈值,HADm为当前编码单元最佳合并模式的阿达玛花费,λmotion为拉格朗日参数,bitmrgidx为合并模式索引需要的比特数,HADm+bitmrgidx×λmotion为当前编码单元最佳合并模式的阿达玛总花费。若上述两个不等式(5)和(6)同时成立,即满足第二终止条件,则确定所述最佳合并模式的预测参数为当前编码单元的最佳时域预测参数,并且可以终止后续运动估计过程。
在满足第二终止条件时,即可终止后续的运动估计过程,可以排除一部分的运动估计的计算量,从而减小了计算复杂度。
其中,第二阈值可以为依据所述编码单元的复杂度、所述编码单元的面积与量化参数的乘积、以及所述阿达玛花费确定的值。
具体地,可以通过以下公式计算第二阈值thscd
thscd=(((grad×53>>7)-(29×M×N×qp>>9)+(37×HADm>>5))×19)>>4 (7)
其中,grad×53>>7表示相邻像素的梯度越大,第二阈值thscd也就越大;29×M×N×qp>>9表示量化参数越大,那么编码器越倾向于选择Merge模式,所以量化参数越大,thscd越小;37×HADm>>5是对最佳Merge模式的HADm项做加权,表示最佳Merge模式的HADm越大,那么thscd越大。
第二阈值thscd可以用于对后续运动估计过程的判定,可以表示如果当前编码单元的第一个参考图像至少应该得出比当前花费更小的花费,才有继续执行后续运动估计的意义。即当满足第二终止条件时,第一参考图像的花费costmv0大于最佳Merge模式的阿达玛总花费,而且costmv0比一个阈值thscd还大,这个阈值thscd和最佳Merge模式有线性关系,参见上述thscd的计算方法,thscd把最佳Merge模式的阿达玛花费HADm还放大了,也就是说,第一参考图像的花费不但没有降低花费总额,反而比最佳Merge模式的花费还大得多,所以也不认为其他参考图像能减少花费,因此,即可终止后续的运动估计过程,确定最佳Merge模式的预测参数为当前编码单元的最佳时域预测参数。上述公式具体可以是通过编码器产生的数据统计得出的最优的比例,目的是尽可能的减少计算时间。
综上,本实施例在最佳合并模式的阿达玛总花费不满足第一终止条件时,若当前编码单元针对第一个参考图像的单向运动估计的总花费与最佳合并模式的阿达玛总花费满足第二终止条件,则确定该最佳合并模式的预测参数为当前编码单元的最佳时域预测参数。可以避免后续更多的单向和双向运动估计过程,因此可以进一步地减小计算复杂度,从而能够降低预帧间编码的复杂度,提高编码效率。
实施例三
参照图5、示出了本发明的一种时域预测参数的搜索方法实施例三的步骤流程图,具体可以包括:
步骤501、对编码单元进行合并模式最佳运动参数决定,确定所述编码单元的最佳合并模式;
步骤502、确定所述编码单元最佳合并模式的阿达玛总花费;所述最佳合并模式的阿达玛总花费为所述最佳合并模式的阿达玛花费与所述最佳合并模式的索引花费的和,其中,索引花费为拉格朗日参数和所述最佳合并模式索引对应的比特数的乘积;
步骤503、在所述最佳合并模式的阿达玛总花费满足第一终止条件时,确定所述最佳合并模式的预测参数为当前编码单元的最佳时域预测参数;
步骤504、在所述最佳合并模式的阿达玛总花费不满足第一终止条件时,计算所述编码单元针对第一个参考图像的单向运动估计的总花费;
步骤505、在所述总花费与所述最佳合并模式的阿达玛总花费满足第二终止条件时,确定所述最佳合并模式的预测参数为当前编码单元的最佳时域预测参数;
本实施例的时域预测参数的搜索方法在上述实施例二的基础上,进一步还可以包括如下步骤:
步骤506、在所述总花费与所述最佳合并模式的阿达玛总花费不满足第二终止条件时,执行后续运动估计过程。
具体地,在所述总花费与所述最佳合并模式的阿达玛总花费不满足第二终止条件时,继续执行后续运动估计过程,得到最佳前向和后向运动参数,然后执行双向运动估计得到最佳双向运动参数,从最佳前向、后向和双向运动参数三者中选择最优的一种计算阿达玛总花费,将计算结果和最佳合并模式的阿达玛总花费做对比,确定阿达玛总花费最小的对应模式的预测参数为最佳时域预测参数。
实施例四
参照图6,示出了本发明的一种时域预测参数的搜索方法示例的步骤流程图,具体可以包括:
步骤601、对当前编码单元进行Merge模式最佳运动参数决定,确定当前编码单元的最佳Merge模式;
步骤602、确定当前编码单元最佳Merge模式的阿达玛总花费;所述最佳合并模式的阿达玛总花费为所述最佳合并模式的阿达玛花费与所述最佳合并模式的索引花费的和,其中,索引花费为拉格朗日参数和所述最佳合并模式索引对应的比特数的乘积;
步骤603、在最佳Merge模式的阿达玛总花费满足第一终止条件时,确定最佳Merge模式的预测参数为当前编码单元的最佳时域预测参数;
步骤604、在最佳Merge模式的阿达玛总花费不满足第一终止条件时,计算当前编码单元针对第一个参考图像的单向运动估计的总花费costmv0
步骤605、在costmv0与所述最佳Merge模式的阿达玛总花费满足第二终止条件时,确定所述最佳Merge模式的预测参数为当前编码单元的最佳时域预测参数;
步骤606、在costmv0与所述最佳Merge模式的阿达玛总花费不满足第二终止条件时,执行后续运动估计过程。
其中,第一终止条件、第二终止条件、阿达玛总花费以及costmv0的计算过程可以参见实施例一,此处不再进行赘述。
装置实施例
参照图7,示出了本发明的一种时域预测参数的搜索装置实施例的结构框图,具体可以包括:
合并模式确定模块710,用于对编码单元进行合并模式最佳运动参数决定,确定所述编码单元的最佳合并模式;
第一计算模块720,用于确定所述编码单元最佳合并模式的阿达玛总花费;所述最佳合并模式的阿达玛总花费为所述最佳合并模式的阿达玛花费与所述最佳合并模式的索引花费的和,其中,索引花费为拉格朗日参数和所述最佳合并模式索引对应的比特数的乘积;以及
第一确定模块730,用于在所述最佳合并模式的阿达玛总花费满足第一终止条件时,确定所述最佳合并模式的预测参数为当前编码单元的最佳时域预测参数。
在本发明的一种优选实施例中,所述最佳合并模式的阿达玛总花费满足第一终止条件,可以包括:所述最佳合并模式的阿达玛总花费小于第一阈值。
在本发明的另一种优选实施例中,所述装置还可以包括:用于确定第一阈值的第一阈值确定模块;
其中,所述第一阈值确定模块,可以包括:
复杂度计算单元,用于依据当前编码单元相邻像素的梯度绝对值之和计算当前编码单元的复杂度;以及
第一阈值计算单元,用于依据当前编码单元的复杂度、以及所述编码单元的面积与量化参数的乘积确定所述第一阈值。
在本发明的又一种优选实施例中,所述装置还可以包括:
第二计算模块,用于在所述最佳合并模式的阿达玛总花费不满足第一终止条件时,计算所述编码单元针对第一个参考图像的单向运动估计的总花费;
第二确定模块,用于在所述总花费与所述最佳合并模式的阿达玛总花费满足第二终止条件时,确定所述最佳合并模式的预测参数为当前编码单元的最佳时域预测参数。
在本发明的再一种优选实施例中,所述总花费与所述最佳合并模式的阿达玛总花费满足第二终止条件可以包括:
所述总花费大于第二阈值;以及
所述总花费大于所述最佳合并模式的阿达玛总花费。
在本发明的再一种优选实施例中,所述装置还可以包括:
运动估计模块,用于在所述总花费与所述最佳合并模式的阿达玛总花费不满足第二终止条件时,可以执行后续运动估计过程。
在本发明的再一种优选实施例中,所述第二阈值可以为依据所述编码单元的复杂度、所述编码单元的面积与量化参数的乘积、以及所述最佳合并模式的阿达玛花费确定的值。
对于装置实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。
本领域内的技术人员应明白,本发明实施例的实施例可提供为方法、装置、或计算机程序产品。因此,本发明实施例可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明实施例是参照根据本发明实施例的方法、终端设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理终端设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理终端设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理终端设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理终端设备上,使得在计算机或其他可编程终端设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程终端设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本发明实施例的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例做出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明实施例范围的所有变更和修改。
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者终端设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者终端设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者终端设备中还存在另外的相同要素。
以上对本发明所提供的一种时域预测参数的搜索方法和装置,进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

Claims (10)

1.一种时域预测参数的搜索方法,其特征在于,所述方法包括:
对编码单元进行合并模式最佳运动参数决定,确定所述编码单元的最佳合并模式;
确定所述编码单元最佳合并模式的阿达玛总花费;所述最佳合并模式的阿达玛总花费为所述最佳合并模式的阿达玛花费与所述最佳合并模式的索引花费的和,其中,索引花费为拉格朗日参数和所述最佳合并模式索引对应的比特数的乘积;
在所述最佳合并模式的阿达玛总花费满足第一终止条件时,确定所述最佳合并模式的预测参数为当前编码单元的最佳时域预测参数;所述最佳合并模式的阿达玛总花费满足第一终止条件,包括:所述最佳合并模式的阿达玛总花费小于第一阈值;通过如下步骤确定所述第一阈值:依据当前编码单元相邻像素的梯度绝对值之和计算当前编码单元的复杂度;依据当前编码单元的复杂度、以及所述编码单元的面积与量化参数的乘积确定所述第一阈值。
2.如权利要求1所述的方法,其特征在于,所述方法还包括:
在所述最佳合并模式的阿达玛总花费不满足第一终止条件时,计算所述编码单元针对第一个参考图像的单向运动估计的总花费;
在所述总花费与所述最佳合并模式的阿达玛总花费满足第二终止条件时,确定所述最佳合并模式的预测参数为当前编码单元的最佳时域预测参数。
3.如权利要求2所述的方法,其特征在于,所述总花费与所述最佳合并模式的阿达玛总花费满足第二终止条件包括:
所述总花费大于第二阈值;以及
所述总花费大于所述最佳合并模式的阿达玛总花费。
4.如权利要求2或3所述的方法,其特征在于,所述方法还包括:
在所述总花费与所述最佳合并模式的阿达玛总花费不满足第二终止条件时,执行后续运动估计过程。
5.如权利要求3所述的方法,其特征在于,所述第二阈值为依据所述编码单元的复杂度、所述编码单元的面积与量化参数的乘积、以及所述最佳合并模式的阿达玛花费确定的值。
6.一种时域预测参数的搜索装置,其特征在于,所述装置包括:
合并模式确定模块,用于对编码单元进行合并模式最佳运动参数决定,确定所述编码单元的最佳合并模式;
第一计算模块,用于确定所述编码单元最佳合并模式的阿达玛总花费;所述最佳合并模式的阿达玛总花费为所述最佳合并模式的阿达玛花费与所述最佳合并模式的索引花费的和,其中,索引花费为拉格朗日参数和所述最佳合并模式索引对应的比特数的乘积;以及
第一确定模块,用于在所述最佳合并模式的阿达玛总花费满足第一终止条件时,确定所述最佳合并模式的预测参数为当前编码单元的最佳时域预测参数;所述最佳合并模式的阿达玛总花费满足第一终止条件,包括:所述最佳合并模式的阿达玛总花费小于第一阈值;
第一阈值确定模块,用于确定第一阈值,包括:复杂度计算单元,用于依据当前编码单元相邻像素的梯度绝对值之和计算当前编码单元的复杂度;以及第一阈值计算单元,用于依据当前编码单元的复杂度、以及所述编码单元的面积与量化参数的乘积确定所述第一阈值。
7.如权利要求6所述的装置,其特征在于,所述装置还包括:
第二计算模块,用于在所述最佳合并模式的阿达玛总花费不满足第一终止条件时,计算所述编码单元针对第一个参考图像的单向运动估计的总花费;
第二确定模块,用于在所述总花费与所述最佳合并模式的阿达玛总花费满足第二终止条件时,确定所述最佳合并模式的预测参数为当前编码单元的最佳时域预测参数。
8.如权利要求7所述的装置,其特征在于,所述总花费与所述最佳合并模式的阿达玛总花费满足第二终止条件包括:
所述总花费大于第二阈值;以及
所述总花费大于所述最佳合并模式的阿达玛总花费。
9.如权利要求7或8所述的装置,其特征在于,所述装置还包括:
运动估计模块,用于在所述总花费与所述最佳合并模式的阿达玛总花费不满足第二终止条件时,执行后续运动估计过程。
10.如权利要求8所述的装置,其特征在于,所述第二阈值为依据所述编码单元的复杂度、所述编码单元的面积与量化参数的乘积、以及所述最佳合并模式的阿达玛花费确定的值。
CN201410851138.2A 2014-12-30 2014-12-30 一种时域预测参数的搜索方法和装置 Active CN104601991B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410851138.2A CN104601991B (zh) 2014-12-30 2014-12-30 一种时域预测参数的搜索方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410851138.2A CN104601991B (zh) 2014-12-30 2014-12-30 一种时域预测参数的搜索方法和装置

Publications (2)

Publication Number Publication Date
CN104601991A CN104601991A (zh) 2015-05-06
CN104601991B true CN104601991B (zh) 2018-12-18

Family

ID=53127446

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410851138.2A Active CN104601991B (zh) 2014-12-30 2014-12-30 一种时域预测参数的搜索方法和装置

Country Status (1)

Country Link
CN (1) CN104601991B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104918047B (zh) * 2015-05-29 2018-08-03 北京奇艺世纪科技有限公司 一种双向运动估计的排除方法和装置
CN107135396B (zh) * 2017-06-16 2020-08-28 北京奇艺世纪科技有限公司 一种运动估计方法和装置
CN108156458B (zh) * 2017-12-28 2020-04-10 北京奇艺世纪科技有限公司 一种确定编码模式方法及装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014106327A1 (en) * 2013-01-04 2014-07-10 Mediatek Singapore Pte. Ltd. Method and apparatus for inter-view residual prediction in multiview video coding
CN104023234A (zh) * 2014-06-24 2014-09-03 华侨大学 一种适用于hevc的快速帧间预测方法
CN104113754A (zh) * 2014-07-17 2014-10-22 四川大学 基于时域相关性的高性能视频帧间编码方法及其转码器

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014106327A1 (en) * 2013-01-04 2014-07-10 Mediatek Singapore Pte. Ltd. Method and apparatus for inter-view residual prediction in multiview video coding
CN104023234A (zh) * 2014-06-24 2014-09-03 华侨大学 一种适用于hevc的快速帧间预测方法
CN104113754A (zh) * 2014-07-17 2014-10-22 四川大学 基于时域相关性的高性能视频帧间编码方法及其转码器

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
《Adaptive Inter-Mode Decision for HEVC Jointly Utilizing Inter-Level and Spatiotemporal Correlations》;liquan Shen,Zhaoyang Zhang,Zhi Liu;《IEEE TRANSACTIONS ON CIRCUITS AND SYSTEMS FOR VIDEO TECHN0LOGY》;20141031;第7、8页 *
《Early MERGE Mode Decision Based on Motion Estimation and Hierarchical Depth Correlation for HEVC》;Zhaoqing Pan,Sam Kwong,Ming-Ting Sun,Jianjun Lei;《IEEE TRANSACTIONS ON BROADCASTING》;20140630;全文 *
《fast mode decision for diamond search in high efficiency video coding》;Miok kim,Hyuk-Jae Lee,Nam Ling;《Visual Communications and Image Processing(VICP),2013》;20131130;全文 *
《HEVC快速CU大小选择与SKIP模式早期判断算法》;罗霁;《中国优秀硕士学位论文全文数据库》;20141115;正文第14、24页 *

Also Published As

Publication number Publication date
CN104601991A (zh) 2015-05-06

Similar Documents

Publication Publication Date Title
JP7004782B2 (ja) 画像予測方法および関連装置
CN104754355B (zh) 一种图像解码设备
JP6490203B2 (ja) 画像予測方法および関連装置
JP5606625B2 (ja) ビデオ符号化のための高度な動きモデルを使った参照処理
CN102598670B (zh) 参考多个帧对图像进行编码/解码的方法和设备
US20160044329A1 (en) Image Predictive Coding Method and Image Encoder
CN105933717B (zh) 一种编码单元的模式决策方法和装置
CN100473168C (zh) 视频编码的运动矢量空间预测方法
JP2013523010A5 (ja) ビデオ符号化およびビデオ復号化のための暗示的適応型動きベクトル予測子選択の方法および装置
KR20140021952A (ko) 멀티뷰 비디오 시퀀스 코딩을 위한 적응형 프레임 예측 방법
JP2013509063A (ja) 画像シーケンスのブロックを符号化する方法およびこのブロックを再構成する方法
CN105812797B (zh) 一种编码单元选择方法及装置
CN104378643A (zh) 一种3d视频深度图像帧内预测模式选择方法及系统
CN103327327B (zh) 用于高性能视频编码hevc的帧间预测编码单元选择方法
KR20220162786A (ko) 비디오 코딩에서 심층 신경 네트워크 기반 인터프레임 예측을 위한 방법 및 장치
CN104601991B (zh) 一种时域预测参数的搜索方法和装置
TW201309029A (zh) 影像編碼方法、裝置、影像解碼方法、裝置及電腦程式
CN104918047B (zh) 一种双向运动估计的排除方法和装置
CN109565600A (zh) 用于在预测参数中进行数据隐藏的方法和装置
KR20090122633A (ko) 다시점 동영상 부호화에서 고속 모드 결정 방법 및 장치
CN105933718B (zh) 一种编码单元的分割方法和装置
CN103139563B (zh) 编码和重构像素块的方法以及相应设备
US20150036751A1 (en) Method for storing movement prediction-related information in an interscreen prediction method, and method for calculating the movement prediction-related information in the inter-screen prediction method
CN103002279B (zh) 编码并重构像素块的方法及其对应设备
CN103079068A (zh) 基于运动剧烈程度和空域相关性的帧间模式判决方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant