CN114915789B - 一种帧间的拉格朗日乘子优化方法、系统、设备及介质 - Google Patents

一种帧间的拉格朗日乘子优化方法、系统、设备及介质 Download PDF

Info

Publication number
CN114915789B
CN114915789B CN202210385961.3A CN202210385961A CN114915789B CN 114915789 B CN114915789 B CN 114915789B CN 202210385961 A CN202210385961 A CN 202210385961A CN 114915789 B CN114915789 B CN 114915789B
Authority
CN
China
Prior art keywords
position vector
target
video
coding
frame
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202210385961.3A
Other languages
English (en)
Other versions
CN114915789A (zh
Inventor
张昊
黄兴军
彭春华
王照
孙意翔
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Central South University
Original Assignee
Central South University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Central South University filed Critical Central South University
Priority to CN202210385961.3A priority Critical patent/CN114915789B/zh
Publication of CN114915789A publication Critical patent/CN114915789A/zh
Application granted granted Critical
Publication of CN114915789B publication Critical patent/CN114915789B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/189Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
    • H04N19/19Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding using optimisation based on Lagrange multipliers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/147Data rate or code amount at the encoder output according to rate distortion criteria
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02TCLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
    • Y02T10/00Road transport of goods or passengers
    • Y02T10/10Internal combustion engine [ICE] based vehicles
    • Y02T10/40Engine management systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

本发明公开了一种帧间的拉格朗日乘子优化方法、系统、设备及介质,包括以下步骤:获取目标编码视频当前时刻的位置向量,位置向量的值对应每帧λ的放缩系数,根据当前时刻的位置向量计算当前时刻的适应值,根据当前的适应值利用灰狼优化算法计算目标编码视频的下一时刻的位置向量,根据下一时刻的位置向量计算下一时刻的适应值,依次迭代,直至当下一时刻的适应值达到预设值或者达到最大迭代次数,得到最优放缩系数,根据最优放缩系数计算得到最优λ。本方法中灰狼优化算法可优化非线性不可导问题,算法中每只狼的位置对应每一次的帧级λ搜索值,实现了在有效计算次数内搜索出帧级最优λ,使得编码器具有更高的压缩效率。

Description

一种帧间的拉格朗日乘子优化方法、系统、设备及介质
技术领域
本发明涉及视频编码技术领域,特别涉及一种帧间的拉格朗日乘子优化方法、系统、设备及介质。
背景技术
视频编码是指通过特定的压缩技术,将原始大数据量的数字信号压缩成低数据量的二进制码流,以大幅降低视频在存储和传输过程中的成本。数字视频信号通常是由时域连续的二维图像(帧)排列而成,这被称为视频序列(Sequence)。每帧图像之间存在极强的相关性,也就是存在大量的冗余信息。冗余信息可分为空域冗余、时域冗余和频域冗余等。
视频编码的过程就是不断去除这些数据之间冗余信息的过程。为了去除时域冗余,视频编码大量采用图像之间的运动矢量预测技术,这被称为帧间参考。现代的编码器一般将视频序列逻辑上分割成若干个图像组(GOP),再以一个GOP为单位来制定帧间参考规则。自H.264/AVC面世以来,由于时域分层参考结构(Hierarchical Reference Structure,HRS)的高效性,因此它被广泛的应用到后续的各代标准中且被验证为性能显著。HRS已经成为典型且主流的参考结构,它在随机访问(Random-Access,RA)和低延迟(Low-Delay,LD)两种最常见应用情景下都有相应的配置结构。RA通常以8或16个播放顺序号(Picture OrderCount,POC)连续的图像组成一个GOP;LD通常以4个POC连续的图像组成一个GOP。一般认为RA在GOP为16时的性能略优于为8时。
为了契合HRS参考规则,不同的编码器都分别为HRS不同层的图像配置量化参数(QP)和偏移常量(QP-Offset)。进一步地,也配置有显式或隐式地进行率失真优化(Rate-Distortion Optimation,RDO)拉格朗日乘子(Lambda,λ)的修正乘子。
在视频编码过程中,对编码顺序中的某一帧图像的λ进行调整时,不仅会对当前帧的编码质量带来影响,也会给整个视频序列最终的带来影响。但是其对于当前帧的影响和对整个视频序列的影响却不是呈正相关,即可能对当前帧带来正向影响,但最终却给整个视频序列带来消极影响,而对于视频编码而言,在意的是整个视频质量而不是单帧质量,因此搜索帧级最优λ需要同时对所有编码帧进行搜索,计算量十分庞大,目前有一些研究考虑了视频内容对于λ取值的影响,对λ的优化操作是对编码器中原始的λ前乘上一个放缩系数k,通过k对λ进行调整。即λnew=k·λori,提出了对于每个视频片段的最优λ搜索方法,但没有一种在有效计算次数内搜索出每帧最优λ的搜索方法。
发明内容
本发明旨在至少解决现有技术中存在的技术问题。为此,本发明提出一种帧间的拉格朗日乘子优化方法,通过灰狼优化算法对视频编码技术中的拉格朗日乘子(λ)进行帧级优化搜索,在有效计算次数内搜索出帧级最优λ,实现了编码器更高的压缩效率。
本发明的第一方面,提供了一种帧间的拉格朗日乘子优化方法,包括以下步骤:
获取目标编码视频当前时刻的位置向量,其中,所述位置向量的长度为所述目标编码视频的帧数,所述位置向量的值对应每帧λ的放缩系数,所述λ为所述拉格朗日乘子;
根据所述当前时刻的位置向量计算当前时刻的适应值;
根据所述当前的适应值利用灰狼优化算法计算所述目标编码视频的下一时刻的位置向量;
根据所述下一时刻的位置向量计算下一时刻的适应值;依次迭代,直至当所述下一时刻的适应值达到预设值或者达到最大迭代次数,得到最优放缩系数;
根据所述最优放缩系数计算得到所述目标编码视频的最优λ。
根据本发明的实施例,至少具有如下技术效果:
本方法通过获取目标编码视频当前时刻的位置向量,其中,位置向量的长度为目标编码视频的帧数,位置向量的值对应每帧λ的放缩系数,λ为拉格朗日乘子,根据当前时刻的位置向量计算当前时刻的适应值,根据当前的适应值利用灰狼优化算法计算目标编码视频的下一时刻的位置向量,根据下一时刻的位置向量计算下一时刻的适应值;依次迭代,直至当下一时刻的适应值达到预设值或者达到最大迭代次数,得到最优放缩系数,根据最优放缩系数计算得到目标编码视频的最优λ。本方法中灰狼优化算法可优化非线性不可导问题,算法中每只狼的位置对应每一次的帧级λ搜索值,实现了在有效计算次数内搜索出帧级最优λ,使得编码器具有更高的压缩效率。
根据本发明的一些实施例,所述根据所述当前时刻的位置向量计算当前时刻的适应值,包括:
根据第一编码器对所述目标编码视频进行第一编码,得到第一编码结果;
根据第二编码器对所述目标编码视频进行第二编码,得到第二编码结果;其中,所述第二编码器在所述第一编码器的基础上利用所述放缩系数对每帧λ进行调整;
根据所述第一编码结果和所述第二编码结果,得到适应值。
根据本发明的一些实施例,在根据所述当前的适应值利用灰狼优化算法计算所述目标编码视频的下一时刻的位置向量之前,包括:
预先设置种群大小,所述种群大小为所述目标编码视频的位置向量的数量;
随机初始化所述目标编码视频的位置向量,其中,位置向量P={k1,k2,k3,…,kN},k1…kN∈[0.5,2.5]。
根据本发明的一些实施例,所述根据所述当前的适应值利用灰狼优化算法计算所述目标编码视频的下一时刻的位置向量的计算公式包括:
所述目标编码视频的位置更新公式为:
Figure BDA0003594988510000041
X1=Pα-a*r1*|2*rand*Pα-Pi,t|
X2=Pβ-a*r1*|2*rand*Pβ-Pi,t|
X3=Pδ-a*r1*|2*rand*Pδ-Pi,t|
其中,所述Pα、所述Pβ和所述Pδ分别表示在t时刻个体适应值排名前三的个体的位置向量,所述Pα最优,所述Pβ次之,所述a为随着迭代次数从1线性递减到0的常数,所述r1为-1到1的随机小数,所述Pi,t+1为目标编码视频的第i帧在t+1时刻的位置,所述Pi,t目标编码视频的第i帧在t时刻的位置,所述rand为0到1的随机小数。
本发明的第二方面,本发明提供了一种帧间的拉格朗日乘子优化系统,包括以下模块:
数据获取模块,用于获取目标编码视频当前时刻的位置向量,其中,所述位置向量的长度为所述目标编码视频的帧数,所述位置向量的值对应每帧λ的放缩系数,所述λ为所述拉格朗日乘子;
数据计算模块,用于根据所述当前时刻的位置向量计算当前时刻的适应值;
位置更新模块,用于根据所述当前的适应值利用灰狼优化算法计算所述目标编码视频的下一时刻的位置向量;
数据迭代模块,用于根据所述下一时刻的位置向量计算下一时刻的适应值;依次迭代,直至当所述下一时刻的适应值达到预设值或者达到最大迭代次数,得到最优放缩系数;
数据输出模块,用于根据所述最优放缩系数计算得到所述目标编码视频的最优λ。
根据本发明的一些实施例,所述根据所述当前时刻的位置向量计算当前时刻的适应值,包括:
根据第一编码器对所述目标编码视频进行第一编码,得到第一编码结果;
根据第二编码器对所述目标编码视频进行第二编码,得到第二编码结果;其中,所述第二编码器在所述第一编码器的基础上利用所述放缩系数对每帧λ进行调整;
根据所述第一编码结果和所述第二编码结果,得到适应值。
根据本发明的一些实施例,在根据所述当前的适应值利用灰狼优化算法计算所述目标编码视频的下一时刻的位置向量之前,包括:
预先设置种群大小,所述种群大小为所述目标编码视频的位置向量的数量;
随机初始化所述目标编码视频的位置向量,其中,位置向量P={k1,k2,k3,…,kN},k1…kN∈[0.5,2.5]。
根据本发明的一些实施例,所述根据所述当前的适应值利用灰狼优化算法计算所述目标编码视频的下一时刻的位置向量的计算公式包括:
所述目标编码视频的位置更新公式为:
Figure BDA0003594988510000061
X1=Pα-a*r1*|2*rand*Pα-Pi,t|
X2=Pβ-a*r1*|2*rand*Pβ-Pi,t|
X3=Pδ-a*r1*|2*rand*Pδ-Pi,t|
其中,所述Pα、所述Pβ和所述Pδ分别表示在t时刻个体适应值排名前三的个体的位置向量,所述Pα最优,所述Pβ次之,所述a为随着迭代次数从1线性递减到0的常数,所述r1为-1到1的随机小数,所述Pi,t+1为目标编码视频的第i帧在t+1时刻的位置,所述Pi,t目标编码视频的第i帧在t时刻的位置,所述rand为0到1的随机小数。
本系统通过获取目标编码视频当前时刻的位置向量,其中,位置向量的长度为目标编码视频的帧数,位置向量的值对应每帧λ的放缩系数,λ为拉格朗日乘子,根据当前时刻的位置向量计算当前时刻的适应值,根据当前的适应值利用灰狼优化算法计算目标编码视频的下一时刻的位置向量,根据下一时刻的位置向量计算下一时刻的适应值;依次迭代,直至当下一时刻的适应值达到预设值或者达到最大迭代次数,得到最优放缩系数,根据最优放缩系数计算得到目标编码视频的最优λ。本系统中灰狼优化算法可优化非线性不可导问题,算法中每只狼的位置对应每一次的帧级λ搜索值,实现了在有效计算次数内搜索出帧级最优λ,使得编码器具有更高的压缩效率。
第三方面,本发明提供了一种帧间的拉格朗日乘子优化设备,包括至少一个控制处理器和用于与所述至少一个控制处理器通信连接的存储器;所述存储器存储有可被所述至少一个控制处理器执行的指令,所述指令被所述至少一个控制处理器执行,以使所述至少一个控制处理器能够执行如上述的一种帧间的拉格朗日乘子优化方法。
第四方面,本发明提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机可执行指令,所述计算机可执行指令用于使计算机执行如上述的帧间的拉格朗日乘子优化。
本发明的附加方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
本发明的上述和/或附加的方面和优点从结合下面附图对实施例的描述中将变得明显和容易理解,其中:
图1为本发明实施例提供的一种帧间的拉格朗日乘子优化方法的流程示意图;
图2为本发明另一个实施例提供的一种帧间的拉格朗日乘子优化方法的实验结果图。
具体实施方式
下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本发明,而不能理解为对本发明的限制。
在本发明的描述中,需要说明的是,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本发明中的具体含义。
在介绍本发明实施例之前,先对率失真优化过程进行简要说明:
视频编码器在编码过程中会通过最小化码率R和失真D的拉格朗日代价函数来选择最佳编码参数,即率失真优化(RDO)过程:
min{J},J=D(p)+λ·R(p)
其中,p为预测模式、块划分等编码参数组成的向量,λ为拉格朗日乘子,在编码过程中,编码器会对不同类型的帧(I/P/B帧)在不同的块级别上迭代率失真优化过程,D(p)和R(p)为对应p下的失真和码率,J为代价函数。
当代价函数J是p的凸函数,且R和D处处连续可微时,拉格朗日乘子λ可以通过将J的导数设为0来得到:
Figure BDA0003594988510000081
需要事先得到RD曲线,才能得到λ。
现代混合视频编码器中最常用的RD模型是Sullivan和Wiegand,其中R被表示为D的对数函数:
Figure BDA0003594988510000082
其中,a和b是表征码率R和失真D之间关系的两个常数,根据高码率近似,失真D可以用量化步长表示为:
Figure BDA0003594988510000083
其中,Q可以通过视频编码器中的量化参数(QP)来获得,公式如下:
Figure BDA0003594988510000084
根据以上公式,可以得到:
Figure BDA0003594988510000085
最终λ的确定任务转化为了c的确定任务,H.264和HEVC参考编码器(分别为JM和HM)中采用的拉格朗日乘法器确定方法考虑了帧间的双向性:
Figure BDA0003594988510000091
Figure BDA0003594988510000092
其中,f在HEVC参考编码器中HM被称为”QPfactor”,其默认值为0.5。QPfactor可以为GOP中不同时间层的帧进行不同的配置,NB是GOP中连续B帧的个数,λJM,I和λJM,P分别表示在视频编码器JM中第I帧和第P帧的λ的取值。
因此,λ的确定主要与常数c有关,本专利对λ的优化操作是对编码器中原始的λ前乘上一个放缩系数k,通过k对λ进行调整。即λnew=k·λori,其中,λori为当前帧对应的未优化的拉格朗日乘子,因此,帧级最优λ搜索问题转化为对于一个视频序列搜索一组系数k,使得该视频在同等配置下达到最佳压缩效果。
在视频编码过程中,对编码顺序中的某一帧图像的λ进行调整时,不仅会对当前帧的编码质量带来影响,也会给整个视频序列最终的带来影响。但是其对于当前帧的影响和对整个视频序列的影响却不是呈正相关,即可能对当前帧带来正向影响,但最终却给整个视频序列带来消极影响,而对于视频编码而言,在意的是整个视频质量而不是单帧质量,因此搜索帧级最优λ需要同时对所有编码帧进行搜索,计算量十分庞大,目前有一些研究考虑了视频内容对于λ取值的影响,提出了对于每个视频片段的最优λ搜索方法,但没有一种在有效计算次数内搜索出每帧最优λ的搜索方法。
参照图1,本发明提供了一种帧间的拉格朗日乘子优化方法,本方法包括以下步骤:
步骤S101、获取目标编码视频当前时刻的位置向量,其中,位置向量的长度为目标编码视频的帧数,位置向量的值对应每帧λ的放缩系数,λ为拉格朗日乘子。
步骤S103、根据当前时刻的位置向量计算当前时刻的适应值。
步骤S105、根据当前的适应值利用灰狼优化算法计算目标编码视频的下一时刻的位置向量。
步骤S107、根据下一时刻的位置向量计算下一时刻的适应值;依次迭代,直至当下一时刻的适应值达到预设值或者达到最大迭代次数,得到最优放缩系数。
步骤S109、根据最优放缩系数计算得到目标编码视频的最优λ。
在一些实施例中,在步骤S103中,根据当前时刻的位置向量计算当前时刻的适应值,包括:
根据第一编码器对目标编码视频进行第一编码,得到第一编码结果。
根据第二编码器对目标编码视频进行第二编码,得到第二编码结果;其中,第二编码器在第一编码器的基础上利用放缩系数对每帧λ进行调整。
根据第一编码结果和第二编码结果,得到适应值。
在一些实施例中,在步骤S105中的在根据当前的适应值利用灰狼优化算法计算目标编码视频的下一时刻的位置向量之前,还包括步骤:
步骤S104、预先设置种群大小,种群大小为目标编码视频的位置向量的数量。
随机初始化目标编码视频的位置向量,其中,位置向量P={k1,k2,k3,…,kN},k1…kN∈[0.5,2.5]。
在一些实施例中,在步骤S105中根据当前的适应值利用灰狼优化算法计算目标编码视频的下一时刻的位置向量的计算公式包括:
目标编码视频的位置更新公式为:
Figure BDA0003594988510000111
X1=Pα-a*r1*|2*rand*Pα-Pi,t|
X2=Pβ-a*r1*|2*rand*Pβ-Pi,t|
X3=Pδ-a*r1*|2*rand*Pδ-Pi,t|
其中,Pα、Pβ和Pδ分别表示在t时刻个体适应值排名前三的个体的位置向量,Pα最优,Pβ次之,a为随着迭代次数从1线性递减到0的常数,r1为-1到1的随机小数,Pi,t+1为目标编码视频的第i帧在t+1时刻的位置,Pi,t目标编码视频的第i帧在t时刻的位置,rand为0到1的随机小数。
为了便于本领域人员的理解,以下提供一组最佳实施例:
测试平台的软硬件具体配置如下表1所示:
Figure BDA0003594988510000112
表1
灰狼优化算法是通过python代码实现的,考虑到编码速度的影响,本发明是基于符合HEVC编码标准的工业编码器x265实现的,支持多线程,其编码速度远大于HEVC的标准编码器HM。
预先设置种群大小,种群大小为目标编码视频的位置向量的数量。
随机初始化目标编码视频的位置向量,其中,位置向量P={k1,k2,k3,…,kN},k1…kN∈[0.5,2.5]。
灰狼优化算法和x265编码器的参数配置分别如表2、表3所示。
Figure BDA0003594988510000121
表2 灰狼优化算法参数配置信息
Figure BDA0003594988510000122
表3 x265编码器参数配置信息
对于测试的序列,选取3个视频编码联合组(Joint Collaborative Team onVideo Coding)给出的未压缩的H.265标准测试序列,这些测试序列包括了416x240、832×480、1280×720三种分辨率,如下表4所示。
Figure BDA0003594988510000123
Figure BDA0003594988510000131
表4 测试序列
获取目标编码视频当前时刻的位置向量,其中,位置向量的长度为目标编码视频的帧数,位置向量的值对应每帧λ的放缩系数,λ为拉格朗日乘子。
根据当前时刻的位置向量计算当前时刻的适应值,包括:
根据第一编码器对目标编码视频进行第一编码,得到第一编码结果。
根据第二编码器对目标编码视频进行第二编码,得到第二编码结果;其中,第二编码器在第一编码器的基础上利用放缩系数对每帧λ进行调整。
根据第一编码结果和第二编码结果,得到适应值。
根据当前的适应值利用灰狼优化算法计算目标编码视频的下一时刻的位置向量的计算公式包括:
目标编码视频的位置更新公式为:
Figure BDA0003594988510000132
X1=Pα-a*r1*|2*rand*Pα-Pi,t|
X2=Pβ-a*r1*|2*rand*Pβ-Pi,t|
X3=Pδ-a*r1*|2*rand*Pδ-Pi,t|
其中,Pα、Pβ和Pδ分别表示在t时刻个体适应值排名前三的个体的位置向量,Pα最优,Pβ次之,a为随着迭代次数从1线性递减到0的常数,r1为-1到1的随机小数,Pi,t+1为目标编码视频的第i帧在t+1时刻的位置,Pi,t目标编码视频的第i帧在t时刻的位置,rand为0到1的随机小数。
根据下一时刻的位置向量计算下一时刻的适应值;依次迭代,直至当下一时刻的适应值达到预设值或者达到最大迭代次数,得到最优放缩系数。
根据最优放缩系数计算得到目标编码视频的最优λ,计算公式为:
λnew=k·λori
其中,λori为当前帧对应的未优化的拉格朗日乘子。
使用灰狼优化算法(GWO)对上述三个测试序列进行优化搜索的实验过程如图2所示。其中横轴为迭代次数,纵轴为适应值。从图中可以看出,灰狼优化算法对于视频编码中的帧级最优λ的搜索具有很好的收敛效果,都可以在30个周期以内完成搜索,达到在有限计算次数内搜索出帧级最优λ的目的。对于序列RaceHorses、BasketballPass和FourPeople使用GWO优化算法在50个周期内搜索到的帧级最优λ得到的适应值(BDBR)增益分别为-3.04%、-3.53%和-9.43%,使得在保持相同视频质量的前提下平均降低了5.33%的码率。
本方法通过获取目标编码视频当前时刻的位置向量,其中,位置向量的长度为目标编码视频的帧数,位置向量的值对应每帧λ的放缩系数,λ为拉格朗日乘子,根据当前时刻的位置向量计算当前时刻的适应值,根据当前的适应值利用灰狼优化算法计算目标编码视频的下一时刻的位置向量,根据下一时刻的位置向量计算下一时刻的适应值;依次迭代,直至当下一时刻的适应值达到预设值或者达到最大迭代次数,得到最优放缩系数,根据最优放缩系数计算得到目标编码视频的最优λ。本方法中灰狼优化算法可优化非线性不可导问题,算法中每只狼的位置对应每一次的帧级λ搜索值,实现了在有效计算次数内搜索出帧级最优λ,使得编码器具有更高的压缩效率。
基于上述实施例,本实施例还提供了一种帧间的拉格朗日乘子优化系统,包括数据获取模块1001、数据计算模块1002、位置更新模块1003、数据迭代模块1004以及数据输出模块1005:
数据获取模块1001用于获取目标编码视频当前时刻的位置向量,其中,位置向量的长度为目标编码视频的帧数,位置向量的值对应每帧λ的放缩系数,λ为拉格朗日乘子。
数据计算模块1002用于根据当前时刻的位置向量计算当前时刻的适应值。
位置更新模块1003用于根据当前的适应值利用灰狼优化算法计算目标编码视频的下一时刻的位置向量。
数据迭代模块1004用于根据下一时刻的位置向量计算下一时刻的适应值;依次迭代,直至当下一时刻的适应值达到预设值或者达到最大迭代次数,得到最优放缩系数。
数据输出模块1005用于根据最优放缩系数计算得到目标编码视频的最优λ。
在一些实施例中,根据当前时刻的位置向量计算当前时刻的适应值,包括:
根据第一编码器对目标编码视频进行第一编码,得到第一编码结果。
根据第二编码器对目标编码视频进行第二编码,得到第二编码结果;其中,第二编码器在第一编码器的基础上利用放缩系数对每帧λ进行调整。
根据第一编码结果和第二编码结果,得到适应值。
在一些实施例中,在根据当前的适应值利用灰狼优化算法计算目标编码视频的下一时刻的位置向量之前,包括:
预先设置种群大小,种群大小为目标编码视频的位置向量的数量。
随机初始化目标编码视频的位置向量,其中,位置向量P={k1,k2,k3,…,kN},k1…kN∈[0.5,2.5]。
在一些实施例中,根据当前的适应值利用灰狼优化算法计算目标编码视频的下一时刻的位置向量的计算公式包括:
目标编码视频的位置更新公式为:
Figure BDA0003594988510000161
X1=Pα-a*r1*|2*rand*Pα-Pi,t|
X2=Pβ-a*r1*|2*rand*Pβ-Pi,t|
X3=Pδ-a*r1*|2*rand*Pδ-Pi,t|
其中,Pα、Pβ和Pδ分别表示在t时刻个体适应值排名前三的个体的位置向量,Pα最优,Pβ次之,a为随着迭代次数从1线性递减到0的常数,r1为-1到1的随机小数,Pi,t+1为目标编码视频的第i帧在t+1时刻的位置,Pi,t目标编码视频的第i帧在t时刻的位置,rand为0到1的随机小数。
本系统通过获取目标编码视频当前时刻的位置向量,其中,位置向量的长度为目标编码视频的帧数,位置向量的值对应每帧λ的放缩系数,λ为拉格朗日乘子,根据当前时刻的位置向量计算当前时刻的适应值,根据当前的适应值利用灰狼优化算法计算目标编码视频的下一时刻的位置向量,根据下一时刻的位置向量计算下一时刻的适应值;依次迭代,直至当下一时刻的适应值达到预设值或者达到最大迭代次数,得到最优放缩系数,根据最优放缩系数计算得到目标编码视频的最优λ。本系统中灰狼优化算法可优化非线性不可导问题,算法中每只狼的位置对应每一次的帧级λ搜索值,实现了在有效计算次数内搜索出帧级最优λ,使得编码器具有更高的压缩效率。
需要注意的是,本实施提供的系统实施例与上述的方法实施例是基于同一个发明构思,因此上述方法实施例的相关内容同样适用于本系统实施例,此处不再赘述。
本申请一个实施例,提供了一种帧间的拉格朗日乘子优化设备;该设备可以是任意类型的智能终端,例如手机、平板电脑、个人计算机等。具体地,该设备包括:一个或多个控制处理器和存储器,本实例以一个控制处理器为例。控制处理器和存储器可以通过总线或者其他方式连接,本实例以通过总线连接为例。
存储器作为一种非暂态计算机可读存储介质,可用于存储非暂态软件程序、非暂态性计算机可执行程序以及模块,如本发明实施例中的电子设备对应的程序指令/模块;控制处理器通过运行存储在存储器中的非暂态软件程序、指令以及模块,从而实现上述方法实施例的一种帧间的拉格朗日乘子优化方法。存储器可以包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需要的应用程序;此外,存储器可以包括高速随机存取存储器,还可以包括非暂态存储器,例如至少一个磁盘存储器件、闪存器件、或其他非暂态固态存储器件。在一些实施方式中,存储器可选包括相对于控制处理器远程设置的存储器,这些远程存储器可以通过网络连接至该电子设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。一个或者多个模块存储在存储器中,当被一个或者多个控制处理器执行时,执行上述方法实施例中的一种帧间的拉格朗日乘子优化方法。
本发明实施例还提供了一种计算机可读存储介质,计算机可读存储介质存储有计算机可执行指令,该计算机可执行指令被一个或多个控制处理器执行,例如,可使得上述一个或多个控制处理器执行上述方法实施例中的一种帧间的拉格朗日乘子优化方法。
通过以上的实施方式的描述,本领域技术人员可以清楚地了解到各实施方式可借助软件加通用硬件平台的方式来实现。本领域技术人员可以理解实现上述实施例方法中的全部或部分流程是可以通过计算机程序来指令相关的硬件来完成,的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述方法的实施例的流程。其中,的存储介质可为磁碟、光盘、只读存储记忆体(ReadOnly Memory,ROM)或随机存储记忆体(RandomAccess Memory,RAM)等。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示意性实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
尽管已经示出和描述了本发明的实施例,本领域的普通技术人员可以理解:在不脱离本发明的原理和宗旨的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由权利要求及其等同物限定。

Claims (6)

1.一种帧间的拉格朗日乘子优化方法,其特征在于,包括以下步骤:
获取目标编码视频当前时刻的位置向量,其中,所述位置向量的长度为所述目标编码视频的帧数,所述位置向量的值对应每帧λ的放缩系数,所述λ为所述拉格朗日乘子;
根据所述当前时刻的位置向量计算当前时刻的适应值,具体为:
根据第一编码器对所述目标编码视频进行第一编码,得到第一编码结果;
根据第二编码器对所述目标编码视频进行第二编码,得到第二编码结果;其中,所述第二编码器在所述第一编码器的基础上利用所述放缩系数对每帧λ进行调整;
根据所述第一编码结果和所述第二编码结果,得到适应值;
根据所述当前的适应值利用灰狼优化算法计算所述目标编码视频的下一时刻的位置向量,其中,所述目标编码视频的位置更新公式为:
Figure FDA0003912334640000011
X1=Pα-a*r1*|2*rand*Pα-Pi,t|
X2=Pβ-a*r1*|2*rand*Pβ-Pi,t|
X3=Pδ-a*r1*|2*rand*Pδ-Pi,t|
其中,所述Pα、所述Pβ和所述Pδ分别表示在t时刻个体适应值排名前三的个体的位置向量,所述Pα最优,所述Pβ次之,所述a为随着迭代次数从1线性递减到0的常数,所述r1为-1到1的随机小数,所述Pi,t+1为目标编码视频的第i帧在t+1时刻的位置,所述Pi,t目标编码视频的第i帧在t时刻的位置,所述rand为0到1的随机小数;
根据所述下一时刻的位置向量计算下一时刻的适应值;依次迭代,直至当所述下一时刻的适应值达到预设值或者达到最大迭代次数,得到最优放缩系数;
根据所述最优放缩系数计算得到所述目标编码视频的最优λ。
2.根据权利要求1所述的一种帧间的拉格朗日乘子优化方法,其特征在于,在根据所述当前的适应值利用灰狼优化算法计算所述目标编码视频的下一时刻的位置向量之前,包括:
预先设置种群大小,所述种群大小为所述目标编码视频的位置向量的数量;
随机初始化所述目标编码视频的位置向量,其中,位置向量P={k1,k2,k3,…,kN},k1…kN∈[0.5,2.5]。
3.一种帧间的拉格朗日乘子优化系统,其特征在于,包括:
数据获取模块,用于获取目标编码视频当前时刻的位置向量,其中,所述位置向量的长度为所述目标编码视频的帧数,所述位置向量的值对应每帧λ的放缩系数,所述λ为所述拉格朗日乘子;
数据计算模块,用于根据所述当前时刻的位置向量计算当前时刻的适应值,具体为:
根据第一编码器对所述目标编码视频进行第一编码,得到第一编码结果;
根据第二编码器对所述目标编码视频进行第二编码,得到第二编码结果;其中,所述第二编码器在所述第一编码器的基础上利用所述放缩系数对每帧λ进行调整;
根据所述第一编码结果和所述第二编码结果,得到适应值;
位置更新模块,用于根据所述当前的适应值利用灰狼优化算法计算所述目标编码视频的下一时刻的位置向量,其中,所述目标编码视频的位置更新公式为:
Figure FDA0003912334640000031
X1=Pα-a*r1*|2*rand*Pα-Pi,t|
X2=Pβ-a*r1*|2*rand*Pβ-Pi,t|
X3=Pδ-a*r1*|2*rand*Pδ-Pi,t|
其中,所述Pα、所述Pβ和所述Pδ分别表示在t时刻个体适应值排名前三的个体的位置向量,所述Pα最优,所述Pβ次之,所述a为随着迭代次数从1线性递减到0的常数,所述r1为-1到1的随机小数,所述Pi,t+1为目标编码视频的第i帧在t+1时刻的位置,所述Pi,t目标编码视频的第i帧在t时刻的位置,所述rand为0到1的随机小数;
数据迭代模块,用于根据所述下一时刻的位置向量计算下一时刻的适应值;依次迭代,直至当所述下一时刻的适应值达到预设值或者达到最大迭代次数,得到最优放缩系数;
数据输出模块,用于根据所述最优放缩系数计算得到所述目标编码视频的最优λ。
4.根据权利要求3所述的一种帧间的拉格朗日乘子优化系统,其特征在于,在根据所述当前的适应值利用灰狼优化算法计算所述目标编码视频的下一时刻的位置向量之前,包括:
预先设置种群大小,所述种群大小为所述目标编码视频的位置向量的数量;
随机初始化所述目标编码视频的位置向量,其中,位置向量P={k1,k2,k3,…,kN},k1…kN∈[0.5,2.5]。
5.一种帧间的拉格朗日乘子优化设备,其特征在于,包括至少一个控制处理器和用于与所述至少一个控制处理器通信连接的存储器;所述存储器存储有可被所述至少一个控制处理器执行的指令,所述指令被所述至少一个控制处理器执行,以使所述至少一个控制处理器能够执行如权利要求1至2任一项所述的一种帧间的拉格朗日乘子优化方法。
6.一种计算机可读存储介质,其特征在于:所述计算机可读存储介质存储有计算机可执行指令,所述计算机可执行指令用于使计算机执行如权利要求1至2任一项所述的一种帧间的拉格朗日乘子优化方法。
CN202210385961.3A 2022-04-13 2022-04-13 一种帧间的拉格朗日乘子优化方法、系统、设备及介质 Active CN114915789B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210385961.3A CN114915789B (zh) 2022-04-13 2022-04-13 一种帧间的拉格朗日乘子优化方法、系统、设备及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210385961.3A CN114915789B (zh) 2022-04-13 2022-04-13 一种帧间的拉格朗日乘子优化方法、系统、设备及介质

Publications (2)

Publication Number Publication Date
CN114915789A CN114915789A (zh) 2022-08-16
CN114915789B true CN114915789B (zh) 2023-03-14

Family

ID=82765279

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210385961.3A Active CN114915789B (zh) 2022-04-13 2022-04-13 一种帧间的拉格朗日乘子优化方法、系统、设备及介质

Country Status (1)

Country Link
CN (1) CN114915789B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2024124835A1 (zh) * 2022-12-13 2024-06-20 海信视像科技股份有限公司 视频编码方法及装置
CN116405690B (zh) * 2023-06-01 2023-09-01 中南大学 一种快速帧级自适应拉格朗日乘子优化方法、系统及设备

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102780885A (zh) * 2012-07-23 2012-11-14 深圳广晟信源技术有限公司 一种率失真优化方法
CN109889837A (zh) * 2019-03-12 2019-06-14 电子科技大学 最优拉格朗日乘子基准定点标定方法
CN111193931A (zh) * 2018-11-14 2020-05-22 深圳市中兴微电子技术有限公司 一种视频数据的编码处理方法和计算机存储介质
EP3720128A1 (en) * 2019-04-05 2020-10-07 Comcast Cable Communications LLC Methods, systems, and apparatuses for processing video by adaptive rate distortion optimization
CN111918068A (zh) * 2020-08-05 2020-11-10 电子科技大学 基于视频序列特征和QP-λ修正的时域率失真优化方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8094716B1 (en) * 2005-08-25 2012-01-10 Maxim Integrated Products, Inc. Method and apparatus of adaptive lambda estimation in Lagrangian rate-distortion optimization for video coding
KR101271512B1 (ko) * 2008-09-16 2013-06-05 돌비 레버러토리즈 라이쎈싱 코오포레이션 적응형 비디오 인코더 제어 방법

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102780885A (zh) * 2012-07-23 2012-11-14 深圳广晟信源技术有限公司 一种率失真优化方法
CN111193931A (zh) * 2018-11-14 2020-05-22 深圳市中兴微电子技术有限公司 一种视频数据的编码处理方法和计算机存储介质
CN109889837A (zh) * 2019-03-12 2019-06-14 电子科技大学 最优拉格朗日乘子基准定点标定方法
EP3720128A1 (en) * 2019-04-05 2020-10-07 Comcast Cable Communications LLC Methods, systems, and apparatuses for processing video by adaptive rate distortion optimization
CN111918068A (zh) * 2020-08-05 2020-11-10 电子科技大学 基于视频序列特征和QP-λ修正的时域率失真优化方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
基于SATD的H.265/HEVC拉格朗日因子选择算法;李维等;《通信学报》;20170625(第06期);全文 *

Also Published As

Publication number Publication date
CN114915789A (zh) 2022-08-16

Similar Documents

Publication Publication Date Title
CN111711824B (zh) 视频编解码中的环路滤波方法、装置、设备及存储介质
CN108886621B (zh) 非本地自适应环路滤波方法
CN114915789B (zh) 一种帧间的拉格朗日乘子优化方法、系统、设备及介质
JP5301277B2 (ja) マルチメディア符号化のためのモード選択技術
US8144770B2 (en) Apparatus and method for encoding moving picture
US9118918B2 (en) Method for rate-distortion optimized transform and quantization through a closed-form operation
CN115514978A (zh) 用于在视频压缩中的熵代码化的概率的混合
US8781004B1 (en) System and method for encoding video using variable loop filter
US20120008686A1 (en) Motion compensation using vector quantized interpolation filters
US9872032B2 (en) Autogressive pixel prediction in the neighborhood of image borders
TWI468018B (zh) 使用向量量化解區塊過濾器之視訊編碼
CN101523915B (zh) 使用min-max方法的用于视频编码的两遍速率控制技术
CN113784126A (zh) 图像编码方法、装置、设备及存储介质
CN114793282B (zh) 带有比特分配的基于神经网络的视频压缩
Lin et al. A deeply modulated scheme for variable-rate video compression
CN115118976A (zh) 一种图像编码方法、可读介质及其电子设备
Liu et al. Video coding and processing: a survey
Huang et al. Acceleration of rate-distortion optimized quantization for H. 264/AVC
CN115428451A (zh) 视频编码方法、编码器、系统以及计算机存储介质
CN116193118A (zh) 基于lcevc的增强层编码方法、装置、设备及介质
KR20130006578A (ko) 비표준 벡터 양자화 코더를 이용한 비디오 표준을 따르는 레지듀얼 코딩
Jenab et al. Content-adaptive resolution control to improve video coding efficiency
WO2022178686A1 (zh) 编解码方法、编解码设备、编解码系统以及计算机可读存储介质
CN110800298A (zh) 码率分配方法、码率控制方法、编码器和记录介质
CN113709459B (zh) 帧内预测方法、装置及计算机存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB03 Change of inventor or designer information
CB03 Change of inventor or designer information

Inventor after: Zhang Hao

Inventor after: Huang Xingjun

Inventor after: Peng Chunhua

Inventor after: Wang Zhao

Inventor after: Sun Yixiang

Inventor before: Zhang Hao

Inventor before: Wang Zhao

Inventor before: Peng Chunhua

Inventor before: Huang Xingjun

Inventor before: Sun Yixiang

GR01 Patent grant
GR01 Patent grant