CN113347417A - 提高率失真优化计算效率的方法、装置、设备及存储介质 - Google Patents

提高率失真优化计算效率的方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN113347417A
CN113347417A CN202110817141.2A CN202110817141A CN113347417A CN 113347417 A CN113347417 A CN 113347417A CN 202110817141 A CN202110817141 A CN 202110817141A CN 113347417 A CN113347417 A CN 113347417A
Authority
CN
China
Prior art keywords
prediction mode
block
rate
frame prediction
false
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110817141.2A
Other languages
English (en)
Other versions
CN113347417B (zh
Inventor
黄晓峰
吴飞红
杨浩运
宋磊
贾惠柱
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou Boya Hongtu Video Technology Co ltd
Original Assignee
Hangzhou Boya Hongtu Video Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou Boya Hongtu Video Technology Co ltd filed Critical Hangzhou Boya Hongtu Video Technology Co ltd
Priority to CN202110817141.2A priority Critical patent/CN113347417B/zh
Publication of CN113347417A publication Critical patent/CN113347417A/zh
Application granted granted Critical
Publication of CN113347417B publication Critical patent/CN113347417B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/11Selection of coding mode or of prediction mode among a plurality of spatial predictive coding modes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/147Data rate or code amount at the encoder output according to rate distortion criteria
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

本发明公开了一种提高率失真优化计算效率的方法、装置、设备及存储介质,方法包括:通过预设的三步模式搜索算法对帧内预测模式进行搜索,得到候选帧内预测模式;在每个候选帧内预测模式中,对编码树单元进行像素假重构,得到所述编码树单元的假重构像素值;根据所述假重构像素值得到重构块,根据所述重构块和原始块计算平方误差和;根据所述平方误差和以及预先计算出来的码率计算每个候选帧内预测模式的率失真优化值。根据本公开实施例提供的率失真优化计算效率的方法,具有更低的计算复杂度,而且块和块之间的数据依赖性完全去除,可以达到更好的硬件时序,以及更好的布局布线。

Description

提高率失真优化计算效率的方法、装置、设备及存储介质
技术领域
本发明涉及视频编码技术领域,特别涉及一种提高率失真优化计算效率的方法、装置、设备及存储介质。
背景技术
近年来, 随着通信技术, 网络媒体的迅速发展, 视频数据呈爆炸式增长。 尽管多媒体处理器计算能力不断增强,存储容量不断增大, 网络带宽不断提高, 依然满足不了不断增长的用户需要。如何利用有限的带宽资源,最大限度的满足用户对视频质量的要求成为一个很有意义的研究课题。
视频信号具有庞大的数据量,在实际应用中必须经过压缩之后才能进行传输与存储。因此人们看到的通常是解压之后的重建视频信号。码率控制算法的作用就是使视频压缩码率符合目标码率的同时, 能够获得尽可能好的重建视频质量。率失真优化(RDO)技术决定了最终的编码质量,在码率控制算法中占据重要位置。
现有技术中,RDO计算过程非常复杂,主要来源于两个方面,一是需要进行RDO的预测模式非常多,比如各种帧内预测模式中的各个方向,以及帧间预测模式中的各种组合;二是相邻重构块之间的依赖关系,比如帧内重构像素的依赖,右边的编码单元的RDO计算需要等到左边块的重构像素出来以后才能开始,这种依赖关系影响了RDO计算的并行性。
因此,如何有效提高率失真优化计算的效率是本领域技术人员亟待解决的技术问题。
发明内容
本公开实施例提供了一种提高率失真优化计算效率的方法、装置、设备及存储介质。为了对披露的实施例的一些方面有一个基本的理解,下面给出了简单的概括。该概括部分不是泛泛评述,也不是要确定关键/重要组成元素或描绘这些实施例的保护范围。其唯一目的是用简单的形式呈现一些概念,以此作为后面的详细说明的序言。
第一方面,本公开实施例提供了一种提高率失真优化计算效率的方法,包括:
通过预设的三步模式搜索算法对帧内预测模式进行搜索,得到候选帧内预测模式;
在每个候选帧内预测模式中,对编码树单元进行像素假重构,得到编码树单元的假重构像素值;
根据假重构像素值得到重构块,根据重构块和原始块计算平方误差和;
根据平方误差和以及预先计算出来的码率计算每个候选帧内预测模式的率失真优化值。
在一个可选地实施例中,通过预设的三步模式搜索算法对帧内预测模式进行搜索,得到候选帧内预测模式,包括:
对水平方向和垂直方向对应的帧内预测模式进行搜索,得到候选帧内预测模式对应的第一主方向;
对第一主方向周边的帧内预测模式进行搜索,得到候选帧内预测模式对应的第二主方向;
对第二主方向周边的帧内预测模式进行搜索,得到候选帧内预测模式。
在一个可选地实施例中,对编码树单元进行像素假重构,得到编码树单元的假重构像素值,包括:
根据预设的快速IDCT变换方法对编码树单元左部分的帧间块进行快速IDCT变换,得到左部分假重构像素值;
对编码树单元右部分的帧间块采用Planar帧内预测模式进行预测,得到右部分假重构像素值。
在一个可选地实施例中,根据预设的快速IDCT变换方法对编码树单元左部分的帧间块进行快速IDCT变换,得到左部分假重构像素值,包括:
对与编码树单元左部分的帧间块左相邻的帧间块进行DCT变换以及量化,得到量化后的系数;
将量化后的系数乘以视频标准中的常系数矩阵的最右一列,得到Temp矩阵;
将Temp矩阵的最右一列乘以视频标准中的常系数矩阵的转置,得到RIDCT矩阵,将RIDCT矩阵的最右一列作为左部分假重构像素值。
在一个可选地实施例中,根据假重构像素值得到重构块,包括:
根据假重构像素值得到预测块;
计算原始块以及预测块的残差,并对残差进行DCT变换、量化、反变换以及反量化操作,将反量化后的残差数据和预测块相加得到重构块。
在一个可选地实施例中,根据重构块和原始块计算平方误差和,包括:
D =|orig-rec|^2
其中,D表示平方误差和,orig表示原始块,rec表示重构块。
在一个可选地实施例中,根据平方误差和以及预先计算出来的码率计算每个候选帧内预测模式的率失真优化值,包括:根据如下公式计算率失真优化值:
Figure 174550DEST_PATH_IMAGE001
其中,C表示率失真优化值,D表示平方误差和,R表示预先计算出来的码率,
Figure 835339DEST_PATH_IMAGE002
表示拉格朗日因子。
第二方面,本公开实施例提供了一种提高率失真优化计算效率的装置,包括:
预测模式搜索模块,用于通过预设的三步模式搜索算法对帧内预测模式进行搜索,得到候选帧内预测模式;
像素假重构模块,用于在每个候选帧内预测模式中,对编码树单元进行像素假重构,得到编码树单元的假重构像素值;
第一计算模块,用于根据假重构像素值得到重构块,根据重构块和原始块计算平方误差和;
第二计算模块,用于根据平方误差和以及预先计算出来的码率计算每个候选帧内预测模式的率失真优化值。
第三方面,本公开实施例提供了一种提高率失真优化计算效率的设备,包括处理器和存储有程序指令的存储器,处理器被配置为在执行程序指令时,执行上述实施例提供的提高率失真优化计算效率的方法。
第四方面,本公开实施例提供了一种计算机可读介质,其上存储有计算机可读指令,计算机可读指令可被处理器执行以实现上述实施例提供的一种提高率失真优化计算效率的方法。
本公开实施例提供的技术方案可以包括以下有益效果:
本公开实施例提供的提高率失真优化计算效率的方法,首先通过预设的三步模式搜索算法从大量预测模式中搜索出最优的预测模式,大大节省了后续平方误差和计算过程的复杂度,再者,利用假重构的思想解决了帧内重构像素的依赖问题,可以达到更好的硬件时序,以及更好的布局布线。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本发明。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施例,并与说明书一起用于解释本发明的原理。
图1是根据一示例性实施例示出的一种提高率失真优化计算效率的方法流程示意图;
图2是根据一示例性实施例示出的一种三步模式搜索方法的流程示意图;
图3是根据一示例性实施例示出的一种预测模式的方向示意图;
图4是根据一示例性实施例示出的一种编码树单元的结构示意图;
图5是根据一示例性实施例示出的一种快速IDCT变换方法的示意图;
图6是根据一示例性实施例示出的一种平方误差和计算方法的示意图;
图7是根据一示例性实施例示出的一种提高率失真优化计算效率的方法的流程示意图;
图8是根据一示例性实施例示出的一种提高率失真优化计算效率的装置结构示意图;
图9是根据一示例性实施例示出的一种提高率失真优化计算效率的设备结构示意图;
图10是根据一示例性实施例示出的一种计算机存储介质的示意图。
具体实施方式
以下描述和附图充分地示出本发明的具体实施方案,以使本领域的技术人员能够实践它们。
应当明确,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本发明相一致的所有实施方式。相反,它们仅是如所附权利要求书中所详述的、本发明的一些方面相一致的系统和方法的例子。
在本发明的描述中,需要理解的是,术语“第一”、“第二”等仅用于描述目的,而不能理解为指示或暗示相对重要性。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本发明中的具体含义。此外,在本发明的描述中,除非另有说明,“多个”是指两个或两个以上。“和/或”,描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。
图1是根据一示例性实施例示出的一种提高率失真优化计算效率的方法流程示意图,如图1所示,该方法具体包括以下步骤。
S101通过预设的三步模式搜索算法对帧内预测模式进行搜索,得到候选帧内预测模式。
在HEVC中,预测模式包含2-34的33种角度预测模式以及Planar模式和直流(Direct-Current,DC)模式共35种预测模式,这35种预测模式都需要进行RDO计算,可见,计算的复杂度相当巨大。
因此,为了缓解编码器的计算复杂度,HEVC首先进行粗略模式选择(Rough ModeDecision,RMD)处理,即对35种预测模式分别求出对应的Hadamand代价,从中选出3个代价最小的模式,并考虑了当前编码单元的最有可能模式,接着对选出的3个可能的候选模式进行RDO计算,从中选出最优的预测模式。
可见,现有技术中的RMD算法需对35种预测模式分别计算Hadamand代价,再从中选择3个候选模式,计算过程复杂。本公开实施例提出了一种快速的RMD算法,也就是三步模式搜索算法,通过三步搜索法从35个模式中选择3个候选模式,降低RDO过程中的计算复杂度。
具体地,首先对水平方向和垂直方向对应的帧内预测模式进行搜索,得到候选预测模式对应的第一主方向。然后,对第一主方向周边的帧内预测模式进行搜索,得到候选预测模式对应的第二主方向。最后,对第二主方向周边的帧内预测模式进行搜索,得到3个候选预测模式。
图2是根据一示例性实施例示出的一种三步模式搜索方法的流程示意图,如图2所示,第一步,首先对(0、90、180、270)这种水平和垂直方向上对应的预测模式进行搜索,根据搜索结果得到候选模式对应的第一主方向。第二步,确定出候选模式对应的第一主方向后,对确定出来的第一主方向周边+-2个模式进行搜索,如图3所示,是根据一示例性实施例示出的一种预测模式的方向示意图,最外围的数字表示35个预测模式,最里层的数字表示不同的方向,根据该图可知方向与模式的对应关系。例如,V0是确定出来的第一主方向,再在V0周围+-2个模式进行搜索,即搜索模式24、模式25、模式27以及模式28。得到候选模式最有可能的第二主方向。第三步,对最有可能的第二主方向周边+-1个模式进行搜索,例如,第二主方向为V-2,对V-2周边+-1个模式进行搜索,即搜索模式24、模式26。得到三个候选模式模式24、模式25、模式26。
根据本公开实施例提供的三步模式搜索方法,无需计算35种模式的Hadamand代价,只需搜索17个模式,复杂度能降低50%,且性能良好。
S102在每个候选帧内预测模式中,对编码树单元进行像素假重构,得到编码树单元的假重构像素值。
进一步地,在每个候选模式中计算RDO,现有技术中,右边的编码单元的RDO计算需要等到左边编码单元的重构像素出来以后才能开始,这种依赖关系影响了RDO计算的并行性。为了解决这个问题,本公开实施例提出假重构的思想来解决。
在一个可选地实施例中,对编码树单元进行像素假重构,得到编码树单元的假重构像素值,包括:
根据预设的快速IDCT变换方法对编码树单元左部分的帧间块进行快速IDCT变换,得到左部分假重构像素值;对编码树单元右部分的帧间块采用Planar帧内预测模式进行预测,得到右部分假重构像素值。编码树单元上边界帧间块是真实的重构像素值,其真实的重构像素可以得到。
图4是根据一示例性实施例示出的一种CTU32*32(CodingTreeUnit,编码树单元)的结构示意图,包括左部分、右部分以及上边界。如图4所示,左部分的帧间块采用预设的快速IDCT变换计算假重构像素值,右部分采用Planar帧内预测模式计算假重构像素值。上边界采用真实的重构像素值。一个CTU可以划分成多个CU(Coding Unit,编码单元),例如,如图4所示,将一个CTU32*32划分成3个CU16以及4个CU8。
图5是根据一示例性实施例示出的一种快速IDCT变换方法的示意图,如图5所示,对编码块的帧间模式进行快速IDCT变换,包括:
对与该编码树单元左部分的帧间块左相邻的帧间块进行DCT变换以及量化,得到量化后的系数
Figure 649711DEST_PATH_IMAGE003
;将量化后的系数乘以视频标准中的常系数矩阵A的最右一列,得到Temp矩阵;将Temp矩阵的最右一列乘以视频标准中的常系数矩阵A的转置
Figure 737753DEST_PATH_IMAGE004
,得到
Figure 4786DEST_PATH_IMAGE005
矩阵,将
Figure 469265DEST_PATH_IMAGE005
矩阵的最右一列作为该编码树单元左部分的假重构像素值。
根据本公开实施例提供的快速IDCT变换方法,只需要求出IDCT变换矩阵的最右一列,而不需要将内部的像素计算出来,极大的减少了IDCT的计算量。
针对该编码树单元右部分的帧间块,可以采用Planar帧内预测模式进行预测,得到预测块,然后将原始块和预测块做残差,进行DCT变换,量化,反量化,反变换得到右部分的重构像素值。针对上边界的帧间块,真实的重构像素可以得到。
根据该步骤,可以采用假重构的方法得到编码树单元的假重构像素值。且该编码单元不用再等左相邻的编码单元的重构像素计算出来才能进行重构,解决了数据依赖的问题,提高了计算效率。
S103根据假重构像素值得到重构块,根据重构块和原始块计算平方误差和。
进一步地,得到假重构出来的像素后,根据假重构像素值得到预测块,计算原始块以及预测块的残差,并对残差进行DCT变换、量化、反变换以及反量化操作,将反量化后的残差数据和预测块相加得到重构块。
进一步地,根据重构块和原始块计算平方误差和,D是原始块和重构块的SSE(Sumof Square Error,平方误差和),D =|orig-rec|^2,其中,D表示平方误差和,orig表示原始块,rec表示重构块。
图6是根据一示例性实施例示出的一种平方误差和计算方法的示意图,如图6所示,现有技术中的平方误差和的计算需要执行DCT->Q->IQ->IDCT的计算流程,计算方法复杂。本公开实施例提供了一种快速平方误差和的计算方法,可以降低计算复杂度。
具体地,本公开实施例中的平方误差和的计算方法,在量化域这个范围内进行,在HEVC中前向量化过程如下:
Figure 403723DEST_PATH_IMAGE006
其中
Figure 397087DEST_PATH_IMAGE007
为坐标
Figure 416996DEST_PATH_IMAGE008
处的量化系数,
Figure 154008DEST_PATH_IMAGE009
为变换系数,
Figure 942972DEST_PATH_IMAGE010
是与量化步长有关的缩放系数,其值为
Figure 372816DEST_PATH_IMAGE011
,在变换域中,失真可以如下:
Figure 880021DEST_PATH_IMAGE012
(1)
其中
Figure 155145DEST_PATH_IMAGE013
为变换系数,
Figure 64195DEST_PATH_IMAGE014
为重构后的变换系数。为了简化重构过程,本文定义了原始缩放系数
Figure 664940DEST_PATH_IMAGE015
和近似重构变换系数
Figure 393862DEST_PATH_IMAGE016
,并统计其两者差异,定义如下:
Figure 738256DEST_PATH_IMAGE017
因此被缩放后的近似失真为:
Figure 236233DEST_PATH_IMAGE018
将上述公式代入(1)可得:
Figure 273459DEST_PATH_IMAGE019
根据该步骤,通过量化域失真来优化D计算的复杂度,只需执行DCT->Q两个流程即可得到计算出来的平方误差和,大大提高了计算效率。
S104根据平方误差和以及预先计算出来的码率计算每个候选帧内预测模式的率失真优化值。
在一个可选地实施例中,根据平方误差和以及预先计算出来的码率计算每个较优的帧内预测模式的率失真优化值,包括:根据如下公式计算率失真优化值:
Figure 224098DEST_PATH_IMAGE020
其中,C表示率失真优化值,D表示平方误差和,R表示预先计算出来的码率,
Figure 372182DEST_PATH_IMAGE021
表示拉格朗日因子。
根据该步骤,可以得到计算出来的率失真优化值。
本公开实施例提供的方法,可以解决计算复杂度问题,针对RDO计算过程中的帧内RMD (35个模式决策出3个候选模式)过程,提出3步搜索算法节省计算复杂度,提出量化域的D计算优化传统DCT->Q->IQ->IDCT流程得到D的过程,减少D计算的复杂度。
可以解决数据依赖性问题,右边的编码单元的RD计算需要等到左边编码单元的重构像素出来以后才能开始,这种依赖关系影响了RDO计算的并行性。为了解决这个问题,提出假重构的思想来解决。具有更低的计算复杂度,块和块之间的数据依赖性完全去除,更方便布局布线。相比传统设计方案,面积可以节省30%,然而性能只下降0.2%,硬件设计人员开销可以节省15%。
为了便于理解本申请实施例提供的提高率失真优化计算效率的方法,下面结合附图7进行说明。如图7所示,
对编码单元CU进行重构,首先通过预设的三步模式搜索算法也就是快速的3步RMD算法得到候选预测模式,然后在这3个候选预测模式中分别进行计算,如图7所示,intrapred帧内预测和inter帧间的RDO的计算通道是分开的两条通道,帧内通道做帧内,帧间通道做帧间,这个非常有利于并行度的提高,SATD表示哈达玛变换,RMD模式的计算在帧内通道之前,RMD模式的计算都是使用的原始像素,可以去除RMD和帧内RDO通道的依赖性。8x8的假重构的生成也在帧内通道这条小路里面运行完成。最后通过帧内预测和帧间预测生成重构,REC表示生成重构。
本公开实施例还提供一种提高率失真优化计算效率的装置,该装置用于执行上述实施例的提高率失真优化计算效率的方法,如图8所示,该装置包括:
预测模式搜索模块801,用于通过预设的三步模式搜索算法对帧内预测模式进行搜索,得到候选帧内预测模式;
像素假重构模块802,用于在每个候选帧内预测模式中,对编码树单元进行像素假重构,得到编码树单元的假重构像素值;
第一计算模块803,用于根据假重构像素值得到重构块,根据重构块和原始块计算平方误差和;
第二计算模块804,用于根据平方误差和以及预先计算出来的码率计算每个候选帧内预测模式的率失真优化值。
需要说明的是,上述实施例提供的提高率失真优化计算效率的装置在执行提高率失真优化计算效率的方法时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将设备的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的提高率失真优化计算效率的装置与提高率失真优化计算效率的方法实施例属于同一构思,其体现实现过程详见方法实施例,这里不再赘述。
本公开实施例还提供一种与前述实施例所提供的提高率失真优化计算效率的方法对应的电子设备,以执行上述提高率失真优化计算效率的方法。
请参考图9,其示出了本申请的一些实施例所提供的一种电子设备的示意图。如图9所示,电子设备包括:处理器900,存储器901,总线902和通信接口903,处理器900、通信接口903和存储器901通过总线902连接;存储器901中存储有可在处理器900上运行的计算机程序,处理器900运行计算机程序时执行本申请前述任一实施例所提供的提高率失真优化计算效率的方法。
其中,存储器901可能包含高速随机存取存储器(RAM:Random Access Memory),也可能还包括非不稳定的存储器(non-volatile memory),例如至少一个磁盘存储器。通过至少一个通信接口903(可以是有线或者无线)实现该系统网元与至少一个其他网元之间的通信连接,可以使用互联网、广域网、本地网、城域网等。
总线902可以是ISA总线、PCI总线或EISA总线等。总线可以分为地址总线、数据总线、控制总线等。其中,存储器901用于存储程序,处理器900在接收到执行指令后,执行程序,前述本申请实施例任一实施方式揭示的提高率失真优化计算效率的方法可以应用于处理器900中,或者由处理器900实现。
处理器900可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器900中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器900可以是通用处理器,包括中央处理器(Central Processing Unit,简称CPU)、网络处理器(Network Processor,简称NP)等;还可以是数字信号处理器(DSP)、专用集成电路(ASIC)、现成可编程门阵列(FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本申请实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本申请实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器901,处理器900读取存储器901中的信息,结合其硬件完成上述方法的步骤。
本申请实施例提供的电子设备与本申请实施例提供的提高率失真优化计算效率的方法出于相同的发明构思,具有与其采用、运行或实现的方法相同的有益效果。
本申请实施例还提供一种与前述实施例所提供的提高率失真优化计算效率的方法对应的计算机可读存储介质,请参考图10,其示出的计算机可读存储介质为光盘1000,其上存储有计算机程序(即程序产品),计算机程序在被处理器运行时,会执行前述任意实施例所提供的提高率失真优化计算效率的方法。
需要说明的是,计算机可读存储介质的例子还可以包括,但不限于相变内存(PRAM)、静态随机存取存储器 (SRAM)、动态随机存取存储器 (DRAM)、其他类型的随机存取存储器 (RAM)、只读存储器 (ROM)、电可擦除可编程只读存储器 (EEPROM)、快闪记忆体或其他光学、磁性存储介质,在此不再一一赘述。
本申请的上述实施例提供的计算机可读存储介质与本申请实施例提供的提高率失真优化计算效率的方法出于相同的发明构思,具有与其存储的应用程序所采用、运行或实现的方法相同的有益效果。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。

Claims (10)

1.一种提高率失真优化计算效率的方法,其特征在于,包括:
通过预设的三步模式搜索算法对帧内预测模式进行搜索,得到候选帧内预测模式;
在每个候选帧内预测模式中,对编码树单元进行像素假重构,得到所述编码树单元的假重构像素值;
根据所述假重构像素值得到重构块,根据所述重构块和原始块计算平方误差和;
根据所述平方误差和以及预先计算出来的码率计算每个候选帧内预测模式的率失真优化值。
2.根据权利要求1所述的方法,其特征在于,通过预设的三步模式搜索算法对帧内预测模式进行搜索,得到候选帧内预测模式,包括:
对水平方向和垂直方向对应的帧内预测模式进行搜索,得到候选帧内预测模式对应的第一主方向;
对所述第一主方向周边的帧内预测模式进行搜索,得到候选帧内预测模式对应的第二主方向;
对所述第二主方向周边的帧内预测模式进行搜索,得到候选帧内预测模式。
3.根据权利要求1所述的方法,其特征在于,对编码树单元进行像素假重构,得到所述编码树单元的假重构像素值,包括:
根据预设的快速IDCT变换方法对所述编码树单元左部分的帧间块进行快速IDCT变换,得到左部分假重构像素值;
对所述编码树单元右部分的帧间块采用Planar帧内预测模式进行预测,得到右部分假重构像素值。
4.根据权利要求3所述的方法,其特征在于,根据预设的快速IDCT变换方法对所述编码树单元左部分的帧间块进行快速IDCT变换,得到左部分假重构像素值,包括:
对与编码树单元左部分的帧间块左相邻的帧间块进行DCT变换以及量化,得到量化后的系数;
将所述量化后的系数乘以视频标准中的常系数矩阵的最右一列,得到Temp矩阵;
将所述Temp矩阵的最右一列乘以视频标准中的常系数矩阵的转置,得到RIDCT矩阵,将所述RIDCT矩阵的最右一列作为左部分假重构像素值。
5.根据权利要求1所述的方法,其特征在于,根据所述假重构像素值得到重构块,包括:
根据所述假重构像素值得到预测块;
计算原始块以及所述预测块的残差,并对所述残差进行DCT变换、量化、反变换以及反量化操作,将反量化后的残差数据和预测块相加得到重构块。
6.根据权利要求5所述的方法,其特征在于,根据所述重构块和原始块计算平方误差和,包括:
D =|orig-rec|^2
其中,D表示所述平方误差和,orig表示原始块,rec表示重构块。
7.根据权利要求1所述的方法,其特征在于,根据所述平方误差和以及预先计算出来的码率计算每个候选帧内预测模式的率失真优化值,包括:根据如下公式计算所述率失真优化值:
Figure 225949DEST_PATH_IMAGE001
其中,C表示率失真优化值,D表示所述平方误差和,R表示预先计算出来的码率,
Figure 408668DEST_PATH_IMAGE002
表示拉格朗日因子。
8.一种提高率失真优化计算效率的装置,其特征在于,包括:
预测模式搜索模块,用于通过预设的三步模式搜索算法对帧内预测模式进行搜索,得到候选帧内预测模式;
像素假重构模块,用于在每个候选帧内预测模式中,对编码树单元进行像素假重构,得到所述编码树单元的假重构像素值;
第一计算模块,用于根据所述假重构像素值得到重构块,根据所述重构块和原始块计算平方误差和;
第二计算模块,用于根据所述平方误差和以及预先计算出来的码率计算每个候选帧内预测模式的率失真优化值。
9.一种提高率失真优化计算效率的设备,其特征在于,包括处理器和存储有程序指令的存储器,所述处理器被配置为在执行所述程序指令时,执行如权利要求1至7任一项所述的提高率失真优化计算效率的方法。
10.一种计算机可读介质,其特征在于,其上存储有计算机可读指令,所述计算机可读指令可被处理器执行以实现如权利要求1至7任一项所述的一种提高率失真优化计算效率的方法。
CN202110817141.2A 2021-07-20 2021-07-20 提高率失真优化计算效率的方法、装置、设备及存储介质 Active CN113347417B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110817141.2A CN113347417B (zh) 2021-07-20 2021-07-20 提高率失真优化计算效率的方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110817141.2A CN113347417B (zh) 2021-07-20 2021-07-20 提高率失真优化计算效率的方法、装置、设备及存储介质

Publications (2)

Publication Number Publication Date
CN113347417A true CN113347417A (zh) 2021-09-03
CN113347417B CN113347417B (zh) 2022-01-04

Family

ID=77480123

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110817141.2A Active CN113347417B (zh) 2021-07-20 2021-07-20 提高率失真优化计算效率的方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN113347417B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116095316A (zh) * 2023-03-17 2023-05-09 北京中星微人工智能芯片技术有限公司 视频图像处理方法及装置、电子设备及存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103024392A (zh) * 2012-12-26 2013-04-03 清华大学 基于二维哈达玛变换的帧内模式预测方法及装置
US20130108182A1 (en) * 2010-07-02 2013-05-02 Humax Co., Ltd. Apparatus and method for encoding/decoding images for intra-prediction coding
CN109587491A (zh) * 2017-09-28 2019-04-05 腾讯科技(深圳)有限公司 一种帧内预测方法、装置及存储介质

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130108182A1 (en) * 2010-07-02 2013-05-02 Humax Co., Ltd. Apparatus and method for encoding/decoding images for intra-prediction coding
CN103024392A (zh) * 2012-12-26 2013-04-03 清华大学 基于二维哈达玛变换的帧内模式预测方法及装置
CN109587491A (zh) * 2017-09-28 2019-04-05 腾讯科技(深圳)有限公司 一种帧内预测方法、装置及存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
程蕾: "《基于三步快速选择的HEVC帧内预测优化算法》", 《中国优秀硕士学位论文全文数据库 信息科技辑》 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116095316A (zh) * 2023-03-17 2023-05-09 北京中星微人工智能芯片技术有限公司 视频图像处理方法及装置、电子设备及存储介质
CN116095316B (zh) * 2023-03-17 2023-06-23 北京中星微人工智能芯片技术有限公司 视频图像处理方法及装置、电子设备及存储介质

Also Published As

Publication number Publication date
CN113347417B (zh) 2022-01-04

Similar Documents

Publication Publication Date Title
US8705611B2 (en) Image prediction encoding device, image prediction encoding method, image prediction encoding program, image prediction decoding device, image prediction decoding method, and image prediction decoding program
CN103004210B (zh) 用于视频编码的低复杂度帧内预测
TW202315408A (zh) 以區塊為基礎之預測技術
CN109068142B (zh) 360度视频帧内预测快速决策方法、装置、编解码器和介质
US20150063452A1 (en) High efficiency video coding (hevc) intra prediction encoding apparatus and method
CN110870316B (zh) 视频编码和解码中低复杂度双向帧内预测的方法和装置
KR102495550B1 (ko) 디블로킹 필터 방법 및 장치
TWI727826B (zh) 使用內預測之寫碼技術
US11381809B2 (en) Intra prediction encoding/decoding method and apparatus for chrominance components
KR20110050480A (ko) 움직임 보상 비디오 코딩에 있어서, 이미지 블록들을 비교하기 위한 메트릭을 결정하는 방법 및 시스템
EP3706421A1 (en) Method and apparatus for video encoding and decoding based on affine motion compensation
CN113347417B (zh) 提高率失真优化计算效率的方法、装置、设备及存储介质
US11245905B2 (en) Method and apparatus for blended intra prediction
CN108924551B (zh) 视频图像编码模式的预测方法及相关设备
JP2009509415A (ja) 適応的影響エリアフィルタ
US8792549B2 (en) Decoder-derived geometric transformations for motion compensated inter prediction
KR20140085300A (ko) 프레임간 인터 예측에서 로컬 조도 불일치의 적응적 보상을 기초로 다시점 비디오 시퀀스를 인코딩/디코딩하는 방법
CN111654696B (zh) 一种帧内的多参考行预测方法、装置、存储介质及终端
WO2021168817A1 (zh) 视频处理的方法及装置
CN111988605A (zh) 模式选择方法、装置、计算机可读存储介质及电子设备
CN114071138A (zh) 帧内预测编码方法、帧内预测编码装置和计算机可读介质
KR100801974B1 (ko) 저비용 움직임 추정 장치 및 움직임 추정 방법
TW201501511A (zh) 框內預測方法及系統
JP5913911B2 (ja) 画像符号化装置
KR20070092481A (ko) H.264 동영상 부호화기의 적응적 고속 움직임 추정 방법

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant