CN113489996B - 一种基于快速帧间编码单元尺寸决策模型的编码方法 - Google Patents
一种基于快速帧间编码单元尺寸决策模型的编码方法 Download PDFInfo
- Publication number
- CN113489996B CN113489996B CN202110753462.0A CN202110753462A CN113489996B CN 113489996 B CN113489996 B CN 113489996B CN 202110753462 A CN202110753462 A CN 202110753462A CN 113489996 B CN113489996 B CN 113489996B
- Authority
- CN
- China
- Prior art keywords
- loss value
- comprehensive loss
- mode
- comprehensive
- division mode
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 43
- 238000005192 partition Methods 0.000 claims description 30
- 239000013598 vector Substances 0.000 claims description 25
- 238000004364 calculation method Methods 0.000 claims description 11
- 239000000758 substrate Substances 0.000 claims 1
- 238000004422 calculation algorithm Methods 0.000 abstract description 6
- 238000010586 diagram Methods 0.000 description 4
- 238000004590 computer program Methods 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 2
- 238000007796 conventional method Methods 0.000 description 2
- 238000000638 solvent extraction Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000001502 supplementing effect Effects 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/103—Selection of coding mode or of prediction mode
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02T—CLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
- Y02T10/00—Road transport of goods or passengers
- Y02T10/10—Internal combustion engine [ICE] based vehicles
- Y02T10/40—Engine management systems
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
本发明公开了一种基于快速帧间编码单元尺寸决策模型的编码方法。所述编码方法包括:根据预设方式和各个第一综合损耗值,对对应的各个第二综合损耗值进行微调,得到各个微调后的第二综合损耗值;以及根据当前块的长、当前块的宽和预设第一阈值,从各个综合损耗值中确定综合损耗值最小的n种划分模式,并以确定的n种划分模式进行视频编码,输出编码后的视频。因此,采用本申请实施例,在帧间编码时,能够从6种划分方式中选择出最优的n种,其中,n为大于1且小于6的正整数;这样,能够根据性能要求,进行灵活配置;此外,该编码方式算法简单,编码效率提升显著,性能损耗较小。
Description
技术领域
本发明涉及视频编码技术领域,特别涉及一种基于快速帧间编码单元尺寸决策模型的编码方法。
背景技术
现有的视频编码所采用的编码方法,通常需要先将图像分成不同大小的块,在图像细节较少的区域使用较大的块,而在细节丰富的区域使用较小的块,再以块为单位进行编码。通过比较所有划分方式的编码性能,找到最优的划分方式。
AVS3相比于其他标准,具有更多的块划分种类;这使得AVS3能够更好地匹配图像细节,得到更优的图像质量,但是,同时也显著地增加了计算复杂度。
例如,一个64x64的块,如果按照HEVC进行划分,最大只划分两次,则总共有9种划分路径,而AVS3则有97种划分路径。实际使用中,最大划分次数往往大于两次,在纹理复杂的区域,会划分到很小的块,AVS3的复杂度远高于HEVC;因此,现有的AVS3帧间编码分块方式较多,计算复杂度较高,视频编码效率低,性能损耗大。
如何减少现有的AVS3帧间编码计算方法的复杂度,提升视频编码效率,减少性能损耗,是待解决的技术问题。
发明内容
基于此,有必要针对的AVS3帧间编码分块方式较多,计算复杂度较高,视频编码效率低,性能损耗大的问题,提供一种基于快速帧间编码单元尺寸决策模型的编码方法、装置、计算机设备和存储介质。
第一方面,本申请实施例提供了一种基于快速帧间编码单元尺寸决策模型的编码方法,所述方法包括:
根据帧间预测的跳过模式下预测出的运动矢量,分别计算多种划分模式对应的第一综合损耗值,所述第一综合损耗值包括第一编码数损耗值和第一图像质量损耗值;
根据整像素估计预测的运动矢量,分别计算多种划分模式对应的第二综合损耗值,所述第二综合损耗值包括第二编码数损耗值和第二图像质量损耗值;
根据预设方式和各个第一综合损耗值,对对应的各个第二综合损耗值进行微调,得到各个微调后的第二综合损耗值;
根据当前块的长、当前块的宽和预设第一阈值,从各个综合损耗值中确定综合损耗值最小的n种划分模式,并以确定的n种划分模式进行视频编码,输出编码后的视频;所述各个综合损耗值包括各个第一综合损耗值、各个第二综合损耗值和各个微调后的第二综合损耗值,n为设定的最大划分模式数,n为大于1且小于6的正整数。
在一种实施方式中,多种划分模式包括不划分模式、水平二划分模式、竖直二划分模式、工字型水分划分模式、工字型竖直划分模式和四划分模式中的任意一种或多种划分模式。
在一种实施方式中,在划分模式包括所述水平二划分模式和所述竖直二划分模式时,所述根据预设方式和各个第一综合损耗值,对对应的各个第二综合损耗值进行微调包括:
所述水平二划分模式下对应的第二综合损耗值与所述竖直二划分模式下对应的第二综合损耗值相等、且所述水平二划分模式下对应的第一综合损耗值大于所述竖直二划分模式下对应的第一综合损耗值时,则将所述水平二划分模式下对应的第二综合损耗值加第一预设值进行微调;
所述水平二划分模式下对应的第二综合损耗值与所述竖直二划分模式下对应的第二综合损耗值相等、且所述竖直二划分模式下对应的第一综合损耗值大于所述水平二划分模式下对应的第一综合损耗值时,则将所述竖直二划分模式下对应的第二综合损耗值加所述第一预设值进行微调。
在一种实施方式中,在划分模式包括所述工字型水分划分模式和所述工字型竖直划分模式时,所述根据预设方式和各个第一综合损耗值,对对应的各个第二综合损耗值进行微调包括:
所述工字型水平划分模式下对应的第二综合损耗值与所述工字型竖直划分模式下对应的第二综合损耗值相等、且所述工字型水平划分模式下对应的第一综合损耗值大于所述工字型竖直划分模式下对应的第一综合损耗值时,则将所述工字型水平划分模式下对应的第二综合损耗值加第二预设值进行微调;
所述工字型水平划分模式下对应的第二综合损耗值与所述工字型竖直划分模式下对应的第二综合损耗值相等、且所述工字型竖直划分模式下对应的第一综合损耗值大于所述工字型水平划分模式下对应的第一综合损耗值时,则将所述工字型竖直划分模式下对应的第二综合损耗值加所述第二预设值进行微调。
在一种实施方式中,所述根据当前块的长、当前块的宽和预设第一阈值,从各个综合损耗值中确定综合损耗值最小的n种划分模式包括:
若所述当前块的长大于所述预设第一阈值,则选择第一综合损耗值最小的划分模式为确定的n种划分模式;或者,
若所述当前块的宽大于所述预设第一阈值,则选择第一综合损耗值最小的划分模式为确定的n种划分模式。
在一种实施方式中,所述根据当前块的长、当前块的宽和预设第一阈值,从各个综合损耗值中确定综合损耗值最小的n种划分模式包括:
若所述当前块的长小于所述预设第一阈值,则选择第二综合损耗值最小的划分模式为确定的n种划分模式;或者,
若所述当前块的宽小于所述预设第一阈值,则选择第二综合损耗值最小的划分模式为确定的n种划分模式。
在一种实施方式中,所述方法还包括:
若在各种划分模式下,多个子块间的运动向量差异小于预设第二阈值、且时,则所述确定的n种划分模式没有所述不划分模式时,则将所述不划分模式加入所述确定的n种划分模式中作为补充划分模式。
第二方面,本申请实施例提供了一种基于快速帧间编码单元尺寸决策模型的编码装置,所述装置包括:
计算模块,用于根据帧间预测的跳过模式下预测出的运动矢量,分别计算多种划分模式对应的第一综合损耗值,所述第一综合损耗值包括第一编码数损耗值和第一图像质量损耗值;以及
根据整像素估计预测的运动矢量,分别计算多种划分模式对应的第二综合损耗值,所述第二综合损耗值包括第二编码数损耗值和第二图像质量损耗值;
微调模块,用于根据预设方式和所述计算模块计算的各个第一综合损耗值,对对应的各个第二综合损耗值进行微调,得到各个微调后的第二综合损耗值;
划分模式确定模块,用于根据当前块的长、当前块的宽和预设第一阈值,从各个综合损耗值中确定综合损耗值最小的n种划分模式,所述各个综合损耗值包括各个第一综合损耗值、各个第二综合损耗值和所述微调模块得到的各个微调后的第二综合损耗值,n为设定的最大划分模式数,n为大于1且小于6的正整数;
编码模块,用于以所述划分模式确定模块确定的n种划分模式进行视频编码,输出编码后的视频。
第三方面,本申请实施例提供一种计算机设备,包括存储器和处理器,所述存储器中存储有计算机可读指令,所述计算机可读指令被所述处理器执行时,使得所述处理器执行上述的方法步骤。
第四方面,本申请实施例提供一种存储有计算机可读指令的存储介质,所述计算机可读指令被一个或多个处理器执行时,使得一个或多个处理器执行上述的方法步骤。
本申请实施例提供的技术方案可以包括以下有益效果:
在本申请实施例中,根据预设方式和各个第一综合损耗值,对对应的各个第二综合损耗值进行微调,得到各个微调后的第二综合损耗值;以及根据当前块的长、当前块的宽和预设第一阈值,从各个综合损耗值中确定综合损耗值最小的n种划分模式,并以确定的n种划分模式进行视频编码,输出编码后的视频;各个综合损耗值包括各个第一综合损耗值、各个第二综合损耗值和各个微调后的第二综合损耗值,n为设定的最大划分模式数,n为大于1且小于6的正整数。因此,采用本申请实施例,在帧间编码时,能够从6种划分方式中选择出最优的n种,其中,n为大于1且小于6的正整数;这样,能够根据性能要求,进行灵活配置;此外,该编码方式算法简单,编码效率提升显著,性能损耗较小。应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本发明。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施例,并与说明书一起用于解释本发明的原理。
图1是本公开实施例提供的一种基于快速帧间编码单元尺寸决策模型的编码方法的流程示意图;
图2是本公开实施例提供的AVS3编码单元划分种类示意图;
图3是本公开实施例提供的一种基于快速帧间编码单元尺寸决策模型的编码装置的结构示意图。
具体实施方式
以下描述和附图充分地示出本发明的具体实施方案,以使本领域的技术人员能够实践它们。
应当明确,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
下面结合附图详细说明本公开的可选实施例。
如图1所示,本公开实施例提供一种基于快速帧间编码单元尺寸决策模型的编码方法,该编码方法具体包括以下方法步骤:
S102:根据帧间预测的跳过模式下预测出的运动矢量,分别计算多种划分模式对应的第一综合损耗值,第一综合损耗值包括第一编码数损耗值和第一图像质量损耗值。
如图2所示,是本公开实施例提供的AVS3编码单元划分种类示意图;如图2所示,AVS3编码单元划分种类包括6大类,具体为:不划分、水平二划分、竖直二划分、工字型水分划分、工字型竖直划分和四划分。
在本申请实施例中,多种划分模式包括不划分模式、水平二划分模式、竖直二划分模式、工字型水分划分模式、工字型竖直划分模式和四划分模式中的任意一种或多种划分模式。本申请实施例所采用的多种划分模式是如图2所示的六种划分模式。
跳过模式是指当前块对于已经编码过的信息直接跳过的模式。
根据帧间预测的跳过模式下预测出的运动矢量,分别计算多种划分模式对应的第一编码数损耗值和第一图像质量损耗值的方法均为常规方法,在此不再赘述。
在选定某一划分模式时(例如,水平二划分模式),根据帧间预测的跳过模式下预测出的运动矢量,分别计算该划分模式下的第一编码数损耗值、该划分模式下的第一图像质量损耗值,并将上述两个损耗值相加,得到该模式下的第一综合损耗值。
S104:根据整像素估计预测的运动矢量,分别计算多种划分模式对应的第二综合损耗值,第二综合损耗值包括第二编码数损耗值和第二图像质量损耗值。
在本申请实施例中,多种划分模式包括不划分模式、水平二划分模式、竖直二划分模式、工字型水分划分模式、工字型竖直划分模式和四划分模式中的任意一种或多种划分模式。
根据整像素估计预测的运动矢量,分别计算多种划分模式对应的第二编码数损耗值和第二图像质量损耗值的方法均为常规方法,在此不再赘述。
在选定某一划分模式时(例如,水平二划分模式),根据帧间预测的跳过模式下预测出的运动矢量,分别计算该划分模式下的第二编码数损耗值、该划分模式下的第二图像质量损耗值,并将上述两个损耗值相加,得到该模式下的第二综合损耗值。
S106:根据预设方式和各个第一综合损耗值,对对应的各个第二综合损耗值进行微调,得到各个微调后的第二综合损耗值。
在本申请实施例中,预设方式包括以下情况:
1)若水平二划分模式下对应的第二综合损耗值与竖直二划分模式下对应的第二综合损耗值相等、且水平二划分模式下对应的第一综合损耗值大于竖直二划分模式下对应的第一综合损耗值时,则将水平二划分模式下对应的第二综合损耗值加第一预设值进行微调,得到对应的微调后的第二综合损耗值;
2)若水平二划分模式下对应的第二综合损耗值与竖直二划分模式下对应的第二综合损耗值相等、且竖直二划分模式下对应的第一综合损耗值大于水平二划分模式下对应的第一综合损耗值时,则将竖直二划分模式下对应的第二综合损耗值加第一预设值进行微调,得到对应的微调后的第二综合损耗值。
在一种可能的实现方式中,在划分模式包括水平二划分模式和竖直二划分模式时,根据预设方式和各个第一综合损耗值,对对应的各个第二综合损耗值进行微调包括以下步骤:
水平二划分模式下对应的第二综合损耗值与竖直二划分模式下对应的第二综合损耗值相等、且水平二划分模式下对应的第一综合损耗值大于竖直二划分模式下对应的第一综合损耗值时,则将水平二划分模式下对应的第二综合损耗值加第一预设值进行微调;
水平二划分模式下对应的第二综合损耗值与竖直二划分模式下对应的第二综合损耗值相等、且竖直二划分模式下对应的第一综合损耗值大于水平二划分模式下对应的第一综合损耗值时,则将竖直二划分模式下对应的第二综合损耗值加第一预设值进行微调。
在另一种可能的实现方式中,在划分模式包括工字型水分划分模式和工字型竖直划分模式时,根据预设方式和各个第一综合损耗值,对对应的各个第二综合损耗值进行微调包括以下步骤:
工字型水平划分模式下对应的第二综合损耗值与工字型竖直划分模式下对应的第二综合损耗值相等、且工字型水平划分模式下对应的第一综合损耗值大于工字型竖直划分模式下对应的第一综合损耗值时,则将工字型水平划分模式下对应的第二综合损耗值加第二预设值进行微调;
工字型水平划分模式下对应的第二综合损耗值与工字型竖直划分模式下对应的第二综合损耗值相等、且工字型竖直划分模式下对应的第一综合损耗值大于工字型水平划分模式下对应的第一综合损耗值时,则将工字型竖直划分模式下对应的第二综合损耗值加第二预设值进行微调。
S108:根据当前块的长、当前块的宽和预设第一阈值,从各个综合损耗值中确定综合损耗值最小的n种划分模式,并以确定的n种划分模式进行视频编码,输出编码后的视频;各个综合损耗值包括各个第一综合损耗值、各个第二综合损耗值和各个微调后的第二综合损耗值,n为设定的最大划分模式数,n为大于1且小于6的正整数。
在本申请实施例中,对预设第一阈值的数值不做具体限制,可以根据不同应用场景的需求进行调整。
在一种可能的实现方式中,根据当前块的长、当前块的宽和预设第一阈值,从各个综合损耗值中确定综合损耗值最小的n种划分模式包括以下步骤:
若当前块的长大于预设第一阈值,则选择第一综合损耗值最小的划分模式为确定的n种划分模式;或者,
若当前块的宽大于预设第一阈值,则选择第一综合损耗值最小的划分模式为确定的n种划分模式。
在另一种可能的实现方式中,根据当前块的长、当前块的宽和预设第一阈值,从各个综合损耗值中确定综合损耗值最小的n种划分模式包括以下步骤:
若当前块的长小于预设第一阈值,则选择第二综合损耗值最小的划分模式为确定的n种划分模式;或者,
若当前块的宽小于预设第一阈值,则选择第二综合损耗值最小的划分模式为确定的n种划分模式。
在一种可能的实现方式中,本申请实施例提供的编码方法还包括以下步骤:
若在各种划分模式下,多个子块间的运动向量差异小于预设第二阈值、且时,则确定的n种划分模式没有不划分模式时,则将不划分模式加入确定的n种划分模式中。
在本申请实施例中,对预设第二阈值的数值不做具体限制,可以根据不同应用场景的需求进行调整。
本申请实施例提供的编码方法,仅使用计算量较小的帧间预测的跳过模式和整像素运动估计的结果,进行模式优选;这样,编码方法所采用的编码算法额外的计算复杂度低,且不依赖其它块的编码信息,利于硬件实现。
此外,本申请实施例提供的编码方法,对于较大尺寸的块,优先使用跳过模式的信息,而较小的块使用整像素运动估计的信息,这样,可以对编码方法所采用的编码算法进行进一步地优化,大大地降低了计算复杂度。
再者,本申请实施例提供的编码方法,对于所有子块得到的运动矢量差异较小的情况,优先选择不划分模式。
需要说明的是,本申请实施例提供的编码方法,单独使用跳过模式的信息或者整像素运动估计的信息,也可以实现分块模式的优选,但是其性能损耗会较高。
在本公开实施例中,根据预设方式和各个第一综合损耗值,对对应的各个第二综合损耗值进行微调,得到各个微调后的第二综合损耗值;以及根据当前块的长、当前块的宽和预设第一阈值,从各个综合损耗值中确定综合损耗值最小的n种划分模式,并以确定的n种划分模式进行视频编码,输出编码后的视频;各个综合损耗值包括各个第一综合损耗值、各个第二综合损耗值和各个微调后的第二综合损耗值,n为设定的最大划分模式数,n为大于1且小于6的正整数。因此,采用本申请实施例,在帧间编码时,能够从6种划分方式中选择出最优的n种,其中,n为大于1且小于6的正整数;这样,能够根据性能要求,进行灵活配置;此外,该编码方式算法简单,编码效率提升显著,性能损耗较小。
下述为本发明基于快速帧间编码单元尺寸决策模型的编码装置实施例,可以用于执行本发明基于快速帧间编码单元尺寸决策模型的编码方法实施例。对于本发明基于快速帧间编码单元尺寸决策模型的编码装置实施例中未披露的细节,请参照本发明基于快速帧间编码单元尺寸决策模型的编码方法实施例。
请参见图3,其示出了本发明一个示例性实施例提供的基于快速帧间编码单元尺寸决策模型的编码装置的结构示意图。该编码装置可以通过软件、硬件或者两者的结合实现成为终端的全部或一部分。该编码装置包括计算模块302、微调模块304、划分模式确定模块306和编码模块308。
具体而言,计算模块302,用于根据帧间预测的跳过模式下预测出的运动矢量,分别计算多种划分模式对应的第一综合损耗值,第一综合损耗值包括第一编码数损耗值和第一图像质量损耗值;以及
根据整像素估计预测的运动矢量,分别计算多种划分模式对应的第二综合损耗值,第二综合损耗值包括第二编码数损耗值和第二图像质量损耗值;
微调模块304,用于根据预设方式和计算模块302计算的各个第一综合损耗值,对对应的各个第二综合损耗值进行微调,得到各个微调后的第二综合损耗值;
划分模式确定模块306,用于根据当前块的长、当前块的宽和预设第一阈值,从各个综合损耗值中确定综合损耗值最小的n种划分模式,各个综合损耗值包括各个第一综合损耗值、各个第二综合损耗值和微调模块304得到的各个微调后的第二综合损耗值,n为设定的最大划分模式数,n为大于1且小于6的正整数;
编码模块308,用于以划分模式确定模块306确定的n种划分模式进行视频编码,输出编码后的视频。
可选的,多种划分模式包括不划分模式、水平二划分模式、竖直二划分模式、工字型水分划分模式、工字型竖直划分模式和四划分模式中的任意一种或多种划分模式。
可选的,在划分模式包括水平二划分模式和竖直二划分模式时,微调模块304具体用于:
水平二划分模式下对应的第二综合损耗值与竖直二划分模式下对应的第二综合损耗值相等、且水平二划分模式下对应的第一综合损耗值大于竖直二划分模式下对应的第一综合损耗值时,则将水平二划分模式下对应的第二综合损耗值加第一预设值进行微调;
水平二划分模式下对应的第二综合损耗值与竖直二划分模式下对应的第二综合损耗值相等、且竖直二划分模式下对应的第一综合损耗值大于水平二划分模式下对应的第一综合损耗值时,则将竖直二划分模式下对应的第二综合损耗值加第一预设值进行微调。
可选的,在划分模式包括工字型水分划分模式和工字型竖直划分模式时,微调模块304具体用于:
工字型水平划分模式下对应的第二综合损耗值与工字型竖直划分模式下对应的第二综合损耗值相等、且工字型水平划分模式下对应的第一综合损耗值大于工字型竖直划分模式下对应的第一综合损耗值时,则将工字型水平划分模式下对应的第二综合损耗值加第二预设值进行微调;
工字型水平划分模式下对应的第二综合损耗值与工字型竖直划分模式下对应的第二综合损耗值相等、且工字型竖直划分模式下对应的第一综合损耗值大于工字型水平划分模式下对应的第一综合损耗值时,则将工字型竖直划分模式下对应的第二综合损耗值加第二预设值进行微调。
可选的,划分模式确定模块306具体用于:
若当前块的长大于预设第一阈值,则选择第一综合损耗值最小的划分模式为确定的n种划分模式;或者,
若当前块的宽大于预设第一阈值,则选择第一综合损耗值最小的划分模式为确定的n种划分模式。
可选的,划分模式确定模块306具体用于:
若当前块的长小于预设第一阈值,则选择第二综合损耗值最小的划分模式为确定的n种划分模式;或者,
若当前块的宽小于预设第一阈值,则选择第二综合损耗值最小的划分模式为确定的n种划分模式。
可选的,所述装置还包括:
划分模式补充模块(在图3中未示出),具体用于:
若在各种划分模式下,多个子块间的运动向量差异小于预设第二阈值、且时,则确定的n种划分模式没有不划分模式时,则将不划分模式加入确定的n种划分模式中作为补充划分模式。
需要说明的是,上述实施例提供的基于快速帧间编码单元尺寸决策模型的编码装置在执行基于快速帧间编码单元尺寸决策模型的编码方法时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将设备的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的基于快速帧间编码单元尺寸决策模型的编码装置与基于快速帧间编码单元尺寸决策模型的编码方法实施例属于同一构思,其体现实现过程详见基于快速帧间编码单元尺寸决策模型的编码方法实施例,这里不再赘述。
在本公开实施例中,划分模式确定模块用于根据当前块的长、当前块的宽和预设第一阈值,从各个综合损耗值中确定综合损耗值最小的n种划分模式,各个综合损耗值包括各个第一综合损耗值、各个第二综合损耗值和微调模块得到的各个微调后的第二综合损耗值,n为设定的最大划分模式数,n为大于1且小于6的正整数;以及编码模块用于以划分模式确定模块确定的n种划分模式进行视频编码,输出编码后的视频。因此,采用本申请实施例,在帧间编码时,能够从6种划分方式中选择出最优的n种,其中,n为大于1且小于6的正整数;这样,能够根据性能要求,进行灵活配置;此外,该编码方式算法简单,编码效率提升显著,性能损耗较小。
在一个实施例中,提出了一种计算机设备,计算机设备包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时实现以下步骤:根据帧间预测的跳过模式下预测出的运动矢量,分别计算多种划分模式对应的第一综合损耗值,第一综合损耗值包括第一编码数损耗值和第一图像质量损耗值;根据整像素估计预测的运动矢量,分别计算多种划分模式对应的第二综合损耗值,第二综合损耗值包括第二编码数损耗值和第二图像质量损耗值;根据预设方式和各个第一综合损耗值,对对应的各个第二综合损耗值进行微调,得到各个微调后的第二综合损耗值;根据当前块的长、当前块的宽和预设第一阈值,从各个综合损耗值中确定综合损耗值最小的n种划分模式,并以确定的n种划分模式进行视频编码,输出编码后的视频;各个综合损耗值包括各个第一综合损耗值、各个第二综合损耗值和各个微调后的第二综合损耗值,n为设定的最大划分模式数,n为大于1且小于6的正整数。
在一个实施例中,提出了一种存储有计算机可读指令的存储介质,该计算机可读指令被一个或多个处理器执行时,使得一个或多个处理器执行以下步骤:根据帧间预测的跳过模式下预测出的运动矢量,分别计算多种划分模式对应的第一综合损耗值,第一综合损耗值包括第一编码数损耗值和第一图像质量损耗值;根据整像素估计预测的运动矢量,分别计算多种划分模式对应的第二综合损耗值,第二综合损耗值包括第二编码数损耗值和第二图像质量损耗值;根据预设方式和各个第一综合损耗值,对对应的各个第二综合损耗值进行微调,得到各个微调后的第二综合损耗值;根据当前块的长、当前块的宽和预设第一阈值,从各个综合损耗值中确定综合损耗值最小的n种划分模式,并以确定的n种划分模式进行视频编码,输出编码后的视频;各个综合损耗值包括各个第一综合损耗值、各个第二综合损耗值和各个微调后的第二综合损耗值,n为设定的最大划分模式数,n为大于1且小于6的正整数。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,该计算机程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,前述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)等非易失性存储介质,或随机存储记忆体(Random Access Memory,RAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。
Claims (10)
1.一种基于快速帧间编码单元尺寸决策模型的编码方法,其特征在于,所述方法包括:
根据帧间预测的跳过模式下预测出的运动矢量,分别计算多种划分模式对应的第一综合损耗值,所述第一综合损耗值包括第一编码数损耗值和第一图像质量损耗值;
根据整像素估计预测的运动矢量,分别计算多种划分模式对应的第二综合损耗值,所述第二综合损耗值包括第二编码数损耗值和第二图像质量损耗值;
根据预设方式和各个第一综合损耗值,对对应的各个第二综合损耗值进行微调,得到各个微调后的第二综合损耗值;
根据当前块的长、当前块的宽和预设第一阈值,从各个综合损耗值中确定综合损耗值最小的n种划分模式,并以确定的n种划分模式进行视频编码,输出编码后的视频;所述各个综合损耗值包括各个第一综合损耗值、各个第二综合损耗值和各个微调后的第二综合损耗值,n为设定的最大划分模式数,n为大于1且小于6的正整数。
2.根据权利要求1所述的方法,其特征在于,
多种划分模式包括不划分模式、水平二划分模式、竖直二划分模式、工字型水平划分模式、工字型竖直划分模式和四划分模式中的任意一种或多种划分模式。
3.根据权利要求2所述的方法,其特征在于,在划分模式包括所述水平二划分模式和所述竖直二划分模式时,所述根据预设方式和各个第一综合损耗值,对对应的各个第二综合损耗值进行微调包括:
所述水平二划分模式下对应的第二综合损耗值与所述竖直二划分模式下对应的第二综合损耗值相等、且所述水平二划分模式下对应的第一综合损耗值大于所述竖直二划分模式下对应的第一综合损耗值时,则将所述水平二划分模式下对应的第二综合损耗值加第一预设值进行微调;
所述水平二划分模式下对应的第二综合损耗值与所述竖直二划分模式下对应的第二综合损耗值相等、且所述竖直二划分模式下对应的第一综合损耗值大于所述水平二划分模式下对应的第一综合损耗值时,则将所述竖直二划分模式下对应的第二综合损耗值加所述第一预设值进行微调。
4.根据权利要求2所述的方法,其特征在于,在划分模式包括所述工字型水分划分模式和所述工字型竖直划分模式时,所述根据预设方式和各个第一综合损耗值,对对应的各个第二综合损耗值进行微调包括:
所述工字型水平划分模式下对应的第二综合损耗值与所述工字型竖直划分模式下对应的第二综合损耗值相等、且所述工字型水平划分模式下对应的第一综合损耗值大于所述工字型竖直划分模式下对应的第一综合损耗值时,则将所述工字型水平划分模式下对应的第二综合损耗值加第二预设值进行微调;
所述工字型水平划分模式下对应的第二综合损耗值与所述工字型竖直划分模式下对应的第二综合损耗值相等、且所述工字型竖直划分模式下对应的第一综合损耗值大于所述工字型水平划分模式下对应的第一综合损耗值时,则将所述工字型竖直划分模式下对应的第二综合损耗值加所述第二预设值进行微调。
5.根据权利要求1所述的方法,其特征在于,所述根据当前块的长、当前块的宽和预设第一阈值,从各个综合损耗值中确定综合损耗值最小的n种划分模式包括:
若所述当前块的长大于所述预设第一阈值,则选择第一综合损耗值最小的划分模式为确定的n种划分模式;或者,
若所述当前块的宽大于所述预设第一阈值,则选择第一综合损耗值最小的划分模式为确定的n种划分模式。
6.根据权利要求1所述的方法,其特征在于,所述根据当前块的长、当前块的宽和预设第一阈值,从各个综合损耗值中确定综合损耗值最小的n种划分模式包括:
若所述当前块的长小于所述预设第一阈值,则选择第二综合损耗值最小的划分模式为确定的n种划分模式;或者,
若所述当前块的宽小于所述预设第一阈值,则选择第二综合损耗值最小的划分模式为确定的n种划分模式。
7.根据权利要求2所述的方法,其特征在于,所述方法还包括:
若在各种划分模式下,多个子块间的运动向量差异小于预设第二阈值时,则所述确定的n种划分模式没有所述不划分模式时,则将所述不划分模式加入所述确定的n种划分模式中作为补充划分模式。
8.一种基于快速帧间编码单元尺寸决策模型的编码装置,其特征在于,所述装置包括:
计算模块,用于根据帧间预测的跳过模式下预测出的运动矢量,分别计算多种划分模式对应的第一综合损耗值,所述第一综合损耗值包括第一编码数损耗值和第一图像质量损耗值;以及
根据整像素估计预测的运动矢量,分别计算多种划分模式对应的第二综合损耗值,所述第二综合损耗值包括第二编码数损耗值和第二图像质量损耗值;
微调模块,用于根据预设方式和所述计算模块计算的各个第一综合损耗值,对对应的各个第二综合损耗值进行微调,得到各个微调后的第二综合损耗值;
划分模式确定模块,用于根据当前块的长、当前块的宽和预设第一阈值,从各个综合损耗值中确定综合损耗值最小的n种划分模式,所述各个综合损耗值包括各个第一综合损耗值、各个第二综合损耗值和所述微调模块得到的各个微调后的第二综合损耗值,n为设定的最大划分模式数,n为大于1且小于6的正整数;
编码模块,用于以所述划分模式确定模块确定的n种划分模式进行视频编码,输出编码后的视频。
9.一种计算机设备,包括存储器和处理器,所述存储器中存储有计算机可读指令,所述计算机可读指令被所述处理器执行时,使得所述处理器执行如权利要求1至7中任一项权利要求所述编码方法的步骤。
10.一种存储有计算机可读指令的存储介质,所述计算机可读指令被一个或多个处理器执行时,使得一个或多个处理器执行如权利要求1至7中任一项权利要求所述编码方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110753462.0A CN113489996B (zh) | 2021-07-02 | 2021-07-02 | 一种基于快速帧间编码单元尺寸决策模型的编码方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110753462.0A CN113489996B (zh) | 2021-07-02 | 2021-07-02 | 一种基于快速帧间编码单元尺寸决策模型的编码方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113489996A CN113489996A (zh) | 2021-10-08 |
CN113489996B true CN113489996B (zh) | 2023-09-01 |
Family
ID=77940631
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110753462.0A Active CN113489996B (zh) | 2021-07-02 | 2021-07-02 | 一种基于快速帧间编码单元尺寸决策模型的编码方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113489996B (zh) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104202602A (zh) * | 2014-08-18 | 2014-12-10 | 三星电子(中国)研发中心 | 执行视频编码的装置及方法 |
CN104581170A (zh) * | 2015-01-23 | 2015-04-29 | 四川大学 | 基于hevc降视频分辨率的快速帧间转码的方法 |
CN106888379A (zh) * | 2017-01-13 | 2017-06-23 | 同济大学 | 应用于h.264到hevc的帧间快速视频转码方法 |
-
2021
- 2021-07-02 CN CN202110753462.0A patent/CN113489996B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104202602A (zh) * | 2014-08-18 | 2014-12-10 | 三星电子(中国)研发中心 | 执行视频编码的装置及方法 |
CN104581170A (zh) * | 2015-01-23 | 2015-04-29 | 四川大学 | 基于hevc降视频分辨率的快速帧间转码的方法 |
CN106888379A (zh) * | 2017-01-13 | 2017-06-23 | 同济大学 | 应用于h.264到hevc的帧间快速视频转码方法 |
Non-Patent Citations (1)
Title |
---|
H.265/HEVC中编码单元尺寸快速决策算法的研究;张聪聪;中国计量大学;第2017年卷(第05期);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN113489996A (zh) | 2021-10-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10110899B2 (en) | Image coding apparatus, image coding method, and program, and image decoding apparatus, image decoding method, and program | |
US8787461B2 (en) | High-performance block-matching VLSI architecture with low memory bandwidth for power-efficient multimedia devices | |
US9066099B2 (en) | Methods for efficient implementation of skip/direct modes in digital video compression algorithms | |
KR20210134034A (ko) | 서브블록 기반 로컬 조명 보상을 이용한 비디오 인코딩 및 디코딩 방법 및 장치 | |
EP4262203A1 (en) | Method and apparatus for video predictive coding | |
US20150208094A1 (en) | Apparatus and method for determining dct size based on transform depth | |
US11102504B2 (en) | Computer-readable recording medium storing video encoding program and video encoding apparatus | |
EP3706421A1 (en) | Method and apparatus for video encoding and decoding based on affine motion compensation | |
CN104519362A (zh) | 一种邻帧预测深度相似性的视频编码方法 | |
CN113347417B (zh) | 提高率失真优化计算效率的方法、装置、设备及存储介质 | |
US10595038B2 (en) | Moving image coding apparatus, moving image coding method and recording medium | |
CN113489996B (zh) | 一种基于快速帧间编码单元尺寸决策模型的编码方法 | |
CN103491371B (zh) | 基于分层的编码方法、装置和设备 | |
CN112673628B (zh) | 影像编码装置及方法、影像解码装置及方法、记录介质 | |
US20190124343A1 (en) | Image decoding apparatus and method | |
CN113242427B (zh) | 一种基于vvc中自适应运动矢量精度的快速方法及装置 | |
CN113612992B (zh) | 一种针对avs3硬件编码器的快速帧内编码单元的编码方法 | |
CN111246218B (zh) | 基于jnd模型的cu分割预测和模式决策纹理编码方法 | |
CN110267047B (zh) | 视频帧间运动估计方法、装置、设备及可读存储介质 | |
CN109561315B (zh) | 一种运动估计方法、装置、电子设备及存储介质 | |
CN115190305A (zh) | 在视频编码装置中进行图像处理的方法、装置、介质及系统 | |
CN112954350A (zh) | 一种基于帧分类的视频后处理优化方法及装置 | |
CN117063467A (zh) | 块划分方法、编码器、解码器以及计算机存储介质 | |
US9165380B2 (en) | Image encoding method using binary partition tree | |
CN113676737B (zh) | 一种基于gpu的高效视频编码器及编码方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |