CN110324622B - 一种视频编码码率控制方法、装置、设备及存储介质 - Google Patents

一种视频编码码率控制方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN110324622B
CN110324622B CN201810265922.3A CN201810265922A CN110324622B CN 110324622 B CN110324622 B CN 110324622B CN 201810265922 A CN201810265922 A CN 201810265922A CN 110324622 B CN110324622 B CN 110324622B
Authority
CN
China
Prior art keywords
image frame
quantization parameter
complexity
initial quantization
target bit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810265922.3A
Other languages
English (en)
Other versions
CN110324622A (zh
Inventor
郭耀耀
毛煦楠
谷沉沉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN201810265922.3A priority Critical patent/CN110324622B/zh
Priority to EP19775531.7A priority patent/EP3780610A4/en
Priority to PCT/CN2019/076310 priority patent/WO2019184643A1/zh
Priority to JP2020544623A priority patent/JP7229261B2/ja
Publication of CN110324622A publication Critical patent/CN110324622A/zh
Priority to US16/884,330 priority patent/US11240511B2/en
Priority to US17/493,688 priority patent/US11606564B2/en
Application granted granted Critical
Publication of CN110324622B publication Critical patent/CN110324622B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/137Motion inside a coding unit, e.g. average field, frame or block difference
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/14Coding unit complexity, e.g. amount of activity or edge presence estimation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/147Data rate or code amount at the encoder output according to rate distortion criteria
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • H04N19/159Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/172Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/593Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial prediction techniques
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/85Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
    • H04N19/86Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression involving reduction of coding artifacts, e.g. of blockiness
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/184Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being bits, e.g. of the compressed video stream

Abstract

本发明公开了一种视频编码码率控制方法、装置、设备及存储介质,所述方法包括:获取视频流中第一图像帧的空域复杂度,并获取所述第一图像帧的时域复杂度;根据所述空域复杂度和时域复杂度将所述第一图像帧的第一目标比特更新为第二目标比特;且根据所述空域复杂度和时域复杂度将所述第一图像帧的第一初始量化参数更新为第二初始量化参数;依据所述第二目标比特和第二初始量化参数生成所述第一图像帧的压缩码流。本发明调整得到的第二目标比特和第二初始量化参数,能够保证每秒峰值码率的平稳,充分利用信道带宽,给用户提供更好的视频质量。

Description

一种视频编码码率控制方法、装置、设备及存储介质
技术领域
本发明涉及视频图像处理技术领域,尤其涉及一种视频编码码率控制方法、装置、设备及存储介质。
背景技术
码率控制是视频编码的重要组成部分,它能够根据信道的状态对当前剩余的目标比特做优化分配,根据编码器目前的情况动态调整量化参数,从而在带宽受限的条件下提供最优的视频质量。
码率控制技术方案主要分为比特分配和比特控制:比特分配分为三个阶段:GOP(Group ofPicture)图像组级别的比特分配,帧级别的比特分配和宏块级别的比特分配。具体是:在终端侧的编码器开始编码一个GOP时,是根据当前信道的带宽,当前视频的帧率和GOP的长度分配当前GOP的目标比特数目:GOP比特分配完成之后,在编码当前图像帧时,根据当前GOP中剩余的帧数目和比特数目,分配当前图像帧的目标比特。编码当前图像帧中的宏块时,根据当前图像帧中剩余比特数据和当前未编码的宏块数目,为当前编码单元分配目标比特。
现有技术在帧级别进行比特分配时,针对当前GOP剩余的比特数目,主要采用两种方式:平均分配和按照事先定好的权重进行比特分配。这种分配方式在连续的自然场景中能够取得非常好的效果。但是用户在实时视频通话过程中,可能会出现手机抖动、光线变化、转移场景或者切换摄像头等一系列的复杂操作,因此会出现视频通话多样化的场景;而在图像场景发生变化时,这种比特分配和量化参数计算方案不能够根据视频内容的变化做出自适应的调整,导致当前图像帧消耗大量比特,进而带来较大延时或者使视频出现卡顿现象,影响用户体验。
发明内容
为了解决上述技术问题,本发明提供了一种视频编码码率控制方法、装置、设备及存储介质,具体地:
第一方面提供了一种视频编码码率控制方法,所述方法包括:
获取视频流中第一图像帧的空域复杂度,并获取所述第一图像帧的时域复杂度;
根据所述空域复杂度和时域复杂度将所述第一图像帧的第一目标比特更新为第二目标比特;且根据所述空域复杂度和时域复杂度将所述第一图像帧的第一初始量化参数更新为第二初始量化参数;
依据所述第二目标比特和第二初始量化参数生成所述第一图像帧的压缩码流。
第二方面提供了一种视频编码码率控制方法,所述方法包括:
第一终端获取视频流中的第一图像帧;
所述第一终端对所述第一图像帧进行处理,以获取所述第一图像帧的空域复杂度,以及所述第一图像帧的时域复杂度,
所述第一终端根据所述空域复杂度和时域复杂度将所述第一图像帧的第一目标比特更新为第二目标比特;且将所述第一图像帧的第一初始量化参数更新为第二初始量化参数;
所述第一终端依据所述第二目标比特和初始量化参数生成所述第一图像帧的压缩码流;
所述第一终端将所述压缩码流传输给服务器;
第二移动终端从所述服务器获取所述压缩码流;
所述第二移动终端对所述压缩码流进行解码,并将解码得到的目标图像帧呈现在第二移动终端上。
第三方面提供了一种视频编码码率控制装置,所述装置包括:
时空域复杂度获取模块,用于获取视频流中第一图像帧的空域复杂度,并获取所述第一图像帧的时域复杂度,
参数调整模块,用于根据所述空域复杂度和时域复杂度将所述第一图像帧的第一目标比特更新为第二目标比特;且根据所述空域复杂度和时域复杂度将所述第一图像帧的第一初始量化参数更新为第二初始量化参数;
压缩码流获取模块,用于依据所述第二目标比特和第二初始量化参数生成所述第一图像帧的压缩码流。
第四方面提供了一种视频编码码率控制设备,所述设备包括处理器和存储器,所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由所述处理器加载并执行以实现如第一方面所述的视频编码码率控制方法。
第五方面提供了一种计算机可读存储介质,所述存储介质中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由所述处理器加载并执行以实现如第一方面所述的视频编码码率控制方法。
本发明提供的视频编码码率控制方法、装置、设备及存储介质,具有如下的技术效果:
本发明能够根据第一图像帧(当前图像帧)的空域复杂度,以及第一图像帧(当前图像帧)的时域复杂度,自适应地调整第一图像帧(当前图像帧)的第一目标比特(已有目标比特)和第二初始量化参数(已有初始量化参数),调整得到的第二目标比特(新的目标比特)和第二初始量化参数(新的初始量化参数),进而生成待发送的压缩码流;本发明能够保证每秒峰值码率的平稳输出,使得在视频通话等低延时复杂场景下能够充分利用信道带宽,给用户提供更好的视频质量。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案和优点,下面将对实施例或现有技术描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它附图。
图1是本发明实施例提供的一种视频编码码率控制方法流程图;
图2是本发明实施例提供的IPPP参考帧的结构时序图;
图3是本发明实施例提供的对第一目标比特和初始量化参数调整的流程图;
图4是本发明实施例提供的另一种视频编码码率控制方法流程图;
图5是本发明实施例提供的获取所述第一图像帧的空域复杂度的流程图;
图6是本发明实施例提供的获取所述第一图像帧的时域复杂度的流程图;
图7是本发明实施例提供的得到第一图像帧的第二目标比特的流程图;
图8是本发明实施例提供的得到第一图像帧的第二初始量化参数的流程图;
图9是本发明实施例提供的另一种视频编码码率控制方法流程图;
图10是本发明实施例提供的一种视频编码码率控制装置框图;
图11是本发明实施例提供的另一种视频编码码率控制装置框图;
图12是本发明实施例提供的空域复杂度获取单元的组成框图;
图13是本发明实施例提供的时域复杂度获取单元的组成框图;
图14是本发明实施例提供的参数调整模块的组成框图;
图15是本发明实施例提供的第二目标比特获取单元的组成框图;
图16是本发明实施例提供的第二量化参数获取单元的组成框图;
图17是本发明实施例提供的一种视频编码码率控制终端示意图;
图18是本发明实施例提供的一种视频编码码率控制系统框图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、装置、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、装置、产品或设备固有的其它步骤或单元。
本发明实施例提供了一种视频编码码率控制方法,如图1所示,所述方法包括:
S101.获取视频流中第一图像帧的空域复杂度,并获取所述第一图像帧的时域复杂度;
在步骤S101中,通过当前移动终端对应的图像采集装置(比如摄像头)进行视频信息的采集,具体是获取到待传输视频中的图像帧,将待传输的图像帧作为第一图像帧(当前图像帧),作为后续处理对象。
其中,帧是视频中最小单位的单幅影像画面,单帧就是一副静止的画面,连续的帧就形成动画或视频等。我们通常说帧数,简单地说,就是在1秒钟时间里传输的图片的帧数,也可以理解为图形处理器每秒钟能够刷新几次,通常用FPS(Frames Per Second)表示。每一帧都是静止的图像,快速连续地显示帧便形成了运动的假象。高的帧率可以得到更流畅、更逼真的动画。每秒钟帧数(fps)愈多,所显示的动作就会愈流畅。
进一步地,对所述第一图像帧进行处理,以获取所述第一图像帧的空域复杂度,以及所述第一图像帧的时域复杂度;
需要说明的是,本方案应用于实时通信过程中,在该编码过程中的参考帧主要采用IPPP格式结构;其中,IPPP为一种编码结构,只存在P帧,且当前帧只能参考前向帧,如图2所示。
其中,空域复杂度对应的是帧内预测,帧内预测是基于同一帧内已编码块预测,构造预测块,计算与当前块的残差,进而对残差、预测模式等信息进行编码;其主要去除的是空域冗余。时域复杂度对应的是帧间预测,帧间预测是基于一个或多个已编码帧预测,构造预测块,计算与当前块的残差,进而对残差、预测模式、运动矢量残差、参考图像索引等信息进行编码,其主要去除的是时域冗余。
S102.根据所述空域复杂度和时域复杂度将所述第一图像帧的第一目标比特更新为第二目标比特;且根据所述空域复杂度和时域复杂度将所述第一图像帧的第一初始量化参数更新为第二初始量化参数;
其中,所述第一目标比特为已有目标比特,所述第一初始量化参数为已有初始量化参数;所述第二目标比特为新的目标比特,所述第二初始量化参数为新的初始量化参数。
具体地,步骤S102中根据所述空域复杂度和时域复杂度将所述第一图像帧的第一目标比特更新为第二目标比特,包括:如图3所示,
S102a.获取第一图像帧的运动估计和第二图像帧的运动估计;所述第一图像帧的运动估计为第一图像帧的时域复杂度和空域复杂度的比值,所述第二图像帧的运动估计为第二图像帧的时域复杂度和空域复杂度的比值;所述第二图像帧为所述第一图像帧的前一个图像帧;
S102b.获取第一限定条件,依据所述第一限定条件将所述第一图像帧的第一目标比特调整为第二目标比特;所述第一限定条件包括所述第一图像帧的运动估计和第二图像帧的运动估计的比值。
具体地,步骤S102中根据所述空域复杂度和时域复杂度将所述第一图像帧的第一初始量化参数更新为第二初始量化参数,包括:
获取第二限定条件,依据所述第二限定条件将所述第一图像帧的第一初始量化参数更新为第二初始量化参数;所述第二限定条件包括第一图像帧的空域复杂度和第二图像帧的空域复杂度的比值,以及,第一图像帧的空域复杂度和第二图像帧的前一个图像帧的空域复杂度的比值。
需要给与说明的是,在将述第一图像帧的第一目标比特调整为第二目标比特之后,也就是比特分配完成后需要进行比特控制的阶段;详细地,采用二次率失真模型进行比特控制。其中,二次率失真模型对应的公式如式(1)所示:
Figure BDA0001611398160000071
式(1)中RHead为该宏块的头信息所消耗的比特数,M是第一图像帧(当前图像帧)的残差信号的MAD(Mean Absolute Difference)绝对平均差值,a、b为相应的限定参数。其中,绝对平均差值MAD由式(2)进行更新得到:
MAD(j)=p1×MAD(j-1)+p2 (2)
式(2)中,MAD(j-1)表示当前图像帧的前一帧的实际MAD值,p1、p2为对应的限定参数。
S103.依据所述第二目标比特和第二初始量化参数生成所述第一图像帧的压缩码流。
其中,码流是指视频文件在单位时间内使用的数据流量,是视频编码中画面质量控制中最重要的部分。本实施例中对已有的目标比特和初始量化参数进行调整,使其适应场景切换,得到适宜传输的视频流,也就是压缩码流。
本实施例中根据第一图像帧(当前图像帧)和第二图像帧(前一图像帧)的时域相关性,以及第一图像帧的空域相关性,调整第一图像帧的目标比特数目和编码的量化参数,有效地降低了场景切换或者场景移动时的每秒峰值码率,避免了码率失控,使得视频流可以平稳传输。
本发明实施例提供了另一种视频编码码率控制方法,如图4所示,所述方法包括:
S201.获取视频流中第一图像帧的空域复杂度,并获取所述第一图像帧的时域复杂度;
通过对视频图像进行下采样,之后针对下采样的图像,以8*8大小的像素块为例作为基本单元进行空域复杂度Icost和时域复杂度Pcost的计算,其中每个像素块可以看做一个基本单元。
其中,在步骤S201中,所述获取视频流中第一图像帧的空域复杂度,包括:获取所述第一图像帧中第一基本单元的最优的帧内预测代价;由所述第一基本单元的最优的帧内预测代价得到第一图像帧的空域复杂度。
如图5所示,具体包括:
S2A.从所述第一图像帧具有的帧内预测方向中,以第一预设数量的帧内预测方向为间隔选取多个目标方向;并获取每个所述目标方向的帧内代价;
S2B.以最小数值的帧内代价对应的目标方向作为最优方向;
S2C.以所述最优方向为中心,第二预设数量为半径,获取最优的帧内预测方向;
其中,在步骤S2C中,优选地,所述第二预设数量为第一预设数量的二分之一。
S2D.基于最优的帧内预测方向,获得所述第一基本单元和第二基本单元的残差的SATD值,得到第一基本单元的最优的帧内预测代价;由第一基本单元的最优的帧内预测代价计算得到第一图像帧的空域复杂度。
其中,SATD为一种视频残差信号大小的衡量,其值为对应的残差经过Hadamard变换后再绝对值求和得到的值。在视频编码标准中,Hadamard哈达马变换多被用来计算SATD。
举例而言:
本实施例以具有35个帧内预测方向的图像帧为例,先得到第一基本单元的最优帧内预测方向。其中获取最优帧内预测方向分为两个阶段:首先在35个帧内预测方向中每隔Δ个方向取一个方向计算帧内的代价,经过该种方式的初筛之后,得到最优的方向;第二个阶段就是以这个最优的方向为中心,以Δ/2为半径搜寻最优的帧内预测方向。其中,Δ以取值为8为例。
基于最优的预测方向,计算出第一基本单元和第二基本单元之间残差的SATD值,即得到第一基本单元的最优的帧内预测代价。进一步由第一基本单元的最优的帧内预测代价计算得到第一图像帧的最优的帧内预测代价,即第一图像帧的空域复杂度。其中,第一图像帧的空域复杂度Icost用ψI_cur表示,第二图像帧的空域复杂度Icost采用ψI_pre表示。
其中,所述步骤S202中,所述获取所述第一图像帧的时域复杂度,包括:获取所述第一图像帧中第一基本单元的最优的帧间预测代价;由所述第一基本单元的最优的帧间预测代价得到第一图像帧的时域复杂度。
如图6所示,具体包括:
S2a.采用正像素菱形搜索算法得到第一图像帧中第一基本单元的最佳匹配块,并将其作为参考单元。
S2b.获得所述参考单元和第一基本单元之间残差的SATD值,所述SATD值为第一基本单元的最优的代价。
所述获取所述第一图像帧的时域复杂度,还包括:
S2c.将第一基本单元的最优的代价和第一基本单元的最优的帧内预测代价相比,将最小数值作为第一基本单元的最优的帧间预测代价;由第一基本单元的最优的帧间预测代价得到第一图像帧的时域复杂度。
举例而言:
本实施例采用正像素菱形搜索算法得到第一基本单元的最佳匹配块,将其作为参考单元。确定参考单元之后,进一步计算出残差的SATD值作为第一基本单元的最优的代价。最后将得到的最优代价和第一基本单元的Icost相比,取数值最小者作为第一基本单元的Pcost;并进一步得到第一图像帧的Pcost。其中,第一图像帧的Pcost用ψP_cur表示,第一图像帧的前一帧的Pcost用ψP_pre表示。
进一步地,本实施例中采用ψIP_cur表示第一图像帧的运动情况,具体计算如下:
Figure BDA0001611398160000091
从式(3)中可知,在前后帧纹理变化不大,第一图像帧运动越静止,此时ψP_cur趋向于0,则ψIP_cur越大;相应地,第一图像帧运动越剧烈,ψP_cur越大,则直接导致ψIP_cur越小。因此ψIP_cur直接反映了第一图像帧的运动剧烈程度。
S202a.根据所述空域复杂度和时域复杂度将所述第一图像帧的第一目标比特更新为第二目标比特;如图7所示,包括:
S3A.当第一图像帧的运动估计小于第一分段参数时,采用第一比特调整函数对第一图像帧的第一目标比特进行调整,得到第一图像帧的第二目标比特;
或者;
S3B.当第一图像帧的运动估计小于第二分段参数时,采用第二比特函数对第一图像帧的第一目标比特进行调整,得到第一图像帧的第二目标比特;
或者;
S3C.当第一图像帧的运动估计小于第三分段参数时,采用第三比特函数对第一图像帧的第一目标比特进行调整,得到第一图像帧的第二目标比特。
其中,所述第一分段参数、第二分段参数和第三分段参数的数值属于同一趋势,本实施例中是依次增大。
举例而言:
第一图像帧为当前图像帧,第二图像帧为前一图像帧,也就是当前图像帧的前一个图像帧。
将第一图像帧对应的时域复杂度ψI_cur和空域复杂度ψP_cur的比值,作为第一图像帧的运动估计ψIP_cur;将第二图像帧对应的时域复杂度ψI_pre和空域复杂度ψP_pre的比值,作为第二图像帧的运动估计ψIP_pre
将第一图像帧的运动估计ψIP_cur和第二图像帧的运动估计ψIP_pre的比值作为限定条件,对第一图像帧的第一目标比特RTar进行调整,得到第一图像帧的第二目标比特RTar'。
详细地,对第一图像帧的第一目标比特RTar进行调整,得到第一图像帧的第二目标比特RTar',包括:
其中,依照现有的目标比特的计算方式得到目标比特RTar之后,根据第一图像的时空域复杂度设置分段函数,根据ψIP_cur的大小,设置α1,α2和α3三个档次,对RTar做出调整。实施例中取α1,α2和α3分别设置为2.5,3,3.5。
(1)当ψIP_cur<α1时,对第一图像帧的第一目标比特RTar做出调整得到第一图像帧的第二目标比特RTar',采用的公式(第一比特调整函数)是
Figure BDA0001611398160000111
其中,σ1、σ2和σ3为根据图像时空域的复杂度调整RTar的权重;β1、β2和β3分别为第一条件参数、第二条件参数和第三条件参数;本实施例中取σ1、σ2和σ3分别设置为:3.2、2.6和1.6;取β1、β2和β3分别设置为3、2.5和2。
并且,同时,由于ψIP_cur<α1时,图像波动剧烈,很可能出现图像本身纹理也波动特别大的情况,此时通过追加额外的限制条件来调整目标比特:所以,在所述当ψIP_cur<α1时,对第一图像帧的第一目标比特RTar做出调整,还包括:采用公式(第四比特调整函数)
RTar'=σ4×RTar ψP_curP_pre>β4 (5)
对第一图像帧的第一目标比特RTar做出调整,得到第一图像帧的第二目标比特RTar';其中,σ4为对RTar进行调整的第四权重,β4为第四条件参数;本实施例中取σ4设置为2,取β4设置为5。
(2)当ψIP_cur<α2时,对第一图像帧的第一目标比特RTar做出调整得到第一图像帧的第二目标比特RTar',采用的公式(第二比特调整函数)是
Figure BDA0001611398160000112
其中,σ5和σ6为对RTar进行调整的第五权重和第六权重;β5和β6分别为第五条件参数和第六条件参数;本实施例中取σ5和σ6设置为2.6和2,取β5和β6设置为2和1.5。
(3)当ψIP_cur<α3时,对第一图像帧的第一目标比特RTar做出调整得到第一图像帧的第二目标比特RTar',采用的公式(第三比特调整函数)是
RTar'=σ7×RTar ψIP_preIP_cur≥β7 (7)
其中,σ7为对RTar进行调整的第七权重;β7为第七条件参数;本实施例中取σ7设置为2,取β7设置为1.2。
给与说明的是,对应的分段函数还可以根据场景需求进行调整,比如对于ψIP_cur<α1对应的第一比特调整函数可以设置为四段分段函数,对于四段分段函数调整得到的数据,并最后在接收端呈现出来的效果需要进一步测试调整,并选取合适的参数为满足场景需求。
进一步地,S202b.根据所述空域复杂度和时域复杂度将所述第一图像帧的第一初始量化参数更新为第二初始量化参数;如图8所示,包括:
S3a.根据第一量化调整函数将第一图像帧的第一初始量化参数更新为第二初始量化参数;
之后还包括:
S3b.根据第二量化调整函数将第一图像帧的第一最大量化参数更新为第二最大量化参数;
和/或,
S3c.根据第三量化调整函数将第一图像帧的第一最小量化参数更新为第二最小量化参数。
所述根据第一量化调整函数将第一图像帧的第一初始量化参数更新为第二初始量化参数,之后还包括:
S3d.当得到的第二初始量化参数大于量化参数临界阈值时,则采用第四量化调整函数对所述第二初始量化参数进行调整,得到目标初始量化参数。
举例而言:
第一图像帧为当前图像帧,第二图像帧为前一图像帧,也就是当前图像帧的前一个图像帧。
将第一图像帧的空域复杂度ψP_cur和第二图像帧的空域复杂度ψP_pre的比值,以及,第一图像帧的空域复杂度ψP_cur和所述第二图像帧的前一个图像帧的空域复杂度ψP_prepre的比值,作为限定条件;对第一图像帧的第一初始量化参数QPframe进行调整,得到第一图像帧的第二初始量化参数QPframe'。
详细地,对第一图像帧的第一初始量化参数QPframe进行调整,得到QPframe',包括:
(1)采用公式(第一量化调整函数)
Figure BDA0001611398160000131
对第一图像帧的第一初始量化参数QPframe进行调整,得到第一图像帧的第二初始量化参数QP'frame
(2)对第一图像帧的第一初始量化参数QPframe进行调整,得到QPframe',之后还包括对初始量化参数对应的范围进行调整,具体地是调整初始量化参数对应的最大量化参数和最小量化参数;详细地:
采用公式(第二量化调整函数)
Figure BDA0001611398160000132
对第一图像帧的第一最大量化参数QPmax进行调整,得到第一图像帧的第二最大量化参数QPmax';
采用公式(第三量化调整函数)
Figure BDA0001611398160000133
对第一图像帧的第一最小量化参数QPmin进行调整,得到第一图像帧的第二最小量化参数QPmin'。
其中,上式中根据第一图像帧与第二图像帧,以及第一图像帧(当前图像帧)与前前图像帧(第二图像帧(前一图像帧)的前一个图像帧)的Pcost关系,来判断第一图像帧是否处于大幅度的运动场景中;如果处于大幅度运动场景中,则需要将第一图像帧的初始量化参数上调,避免出现编码过程中消耗比特过多的现象。
上式中,ψP_pre和ψP_prepre分别表示第二图像帧和前前图像帧(第二图像帧(前一图像帧)的前一个图像帧)的Pcost。ω1和ω3均为第一图像帧和第二图像帧(前一图像帧)Pcost比值的阈值,本实施例中取ω1和ω3设置为:6和3。ω2和ω4均为第一图像帧和第二图像帧的前一个图像帧的Pcost的比值的阈值,本实施例中取ω2和ω4设置为8和4。λ1和λ2分别为当前初始QP,最大QP,最小QP对应的第一偏移值和第二偏移值,本实施例中取λ1和λ2设置为6和3。
由于在编码过程中,QP值过大之后,容易出现块效应;因此在公式(8)-(10)的基础上,需要对第一图像帧的量化参数QP做出调整,所以:
(3)在得到第一图像帧的第二初始量化参数QPf'rame之后还包括:
采用公式(第四量化调整函数)
Figure BDA0001611398160000141
对第一图像帧的第一初始量化参数进行调整,得到最终编码的目标初始量化参数QPinital;其中,QPThr为第一图像帧的临界阈值,本实施例中取QPThr设置为35;QPinital则为根据第一图像帧的时空域相关性调整之后得到的最终编码的初始量化参数QP,也就是目标初始量化参数。
S203.依据所述第二目标比特和第二初始量化参数生成所述第一图像帧的压缩码流。
本实施例中根据不同场景下的第一图像帧波动程度的不同,对已有的目标比特进行调整,以及根据不同场景下第一图像帧和第二图像帧的时域相关性的不同,对已有的量化参数(初始量化参数、最大量化参数和最小量化参数)进行合理调整;也就是说能够根据当前图像的内容特性适应性的进行图像参数的调整,从而使得第一图像帧传输过程中消耗较少的比特,避免了时时视频过程中出现的较大延时或者卡顿现象,提升用户体验。
本实施例提供了一种视频编码码率控制方法,如图9所示,所述方法包括:
S301.第一终端获取视频流中的第一图像帧;
S302.所述第一终端对所述第一图像帧进行处理,以获取所述第一图像帧的空域复杂度,以及所述第一图像帧的时域复杂度;
S303.所述第一终端根据所述空域复杂度和时域复杂度将所述第一图像帧的第一目标比特更新为第二目标比特;且将所述第一图像帧的第一初始量化参数更新为第二初始量化参数;
S304.所述第一终端依据所述第二目标比特和初始量化参数生成所述第一图像帧的压缩码流;
S305.所述第一终端将所述压缩码流传输给服务器;
S306.第二移动终端从所述服务器获取到所述压缩码流,并对所述压缩码流解码,并将解码得到的目标图像帧呈现在第二移动终端上。
本实施例的第一终端在传输视频数据之前,对待传输图像帧进行参数调整,从而使得到适应场景的需求的压缩码流,进而使得视频数据的传输消耗较小的比特且能够平稳传输,从而提升了对应应用的用户粘度性。
本实施例提供了一种视频编码码率控制装置,如图10所示,所述装置包括:
时空域复杂度获取模块110,用于获取视频流中第一图像帧的空域复杂度,并获取所述第一图像帧的时域复杂度,
参数调整模块120,用于根据所述空域复杂度和时域复杂度将所述第一图像帧的第一目标比特更新为第二目标比特;且根据所述空域复杂度和时域复杂度将所述第一图像帧的第一初始量化参数更新为第二初始量化参数;
压缩码流获取模块130,用于依据所述第二目标比特和第二初始量化参数生成所述第一图像帧的压缩码流。
所述的装置实施例中的装置与方法实施例基于同样地发明构思。
本实施例提供了一种视频编码码率控制装置,如图11所示,所述装置包括:
时空域复杂度获取模块210,用于获取视频流中第一图像帧的空域复杂度,并获取所述第一图像帧的时域复杂度。
具体地,所述时空域复杂度获取模块210包括空域复杂度获取单元211,所述空域复杂度获取单元211,包括:如图12所示,
最优帧内预测代价获取子单元2111,用于获取所述第一图像帧中第一基本单元的最优的帧内预测代价;
空域复杂度获取子单元2112,用于由所述第一基本单元的最优的帧内预测代价得到第一图像帧的空域复杂度。
其中,更详细地,所述空域复杂度获取单元可以包括:
目标方向帧内代价获取子单元,用于从所述第一图像帧具有的帧内预测方向中,以第一预设数量的帧内预测方向为间隔选取多个目标方向;并获取每个所述目标方向的帧内代价;
最优帧内预测方向获取子单元,用于将最小数值的帧内代价对应的目标方向作为最优方向;以所述最优方向为中心,第二预设数量为半径,获取最优的帧内预测方向;
空域复杂度获取子单元,基于最优的帧内预测方向,获得所述第一基本单元和第二基本单元的残差的SATD值,得到第一基本单元的最优的帧内预测代价;由第一基本单元的最优的帧内预测代价计算得到当前图像帧的空域复杂度。
进一步地,所述时空域复杂度获取模块210包括时域复杂度获取单元212,所述时域复杂度获取单元212,包括:如图13所示,
最优帧间预测代价获取子单元2121,用于获取所述第一图像帧中第一基本单元的最优的帧间预测代价;
时域复杂度获取子单元2122,用于由所述第一基本单元的最优的帧间预测代价得到第一图像帧的时域复杂度。
其中,更详细地,所述时域复杂度获取单元可以包括:
参考单元获取子单元,用于获取第一图像帧中第一基本单元的最佳匹配块,并将其作为参考单元;
第一基本单元最优代价获取子单元,用于获得所述参考单元和第一基本单元之间残差的SATD值,所述SATD值为第一基本单元的最优的代价;
时域复杂度获取子单元,用于将第一基本单元的最优的代价和第一图像帧的空域复杂度相比,将比较结果中的最小数值作为第一基本单元的第一图像帧与第二图像帧的空域复杂度。
参数调整模块220,用于根据所述空域复杂度和时域复杂度调整第一图像帧的第一目标比特,得到第一图像帧的第二目标比特;根据所述空域复杂度和时域复杂度调整第一图像帧的第一初始量化参数,得到第一图像帧的第二初始量化参数;
具体地,所述参数调整模块220,如图14所示,包括:
运动估计获取单元221,用于获取第一图像帧的运动估计和第二图像帧的运动估计;所述第一图像帧的运动估计为第一图像帧的时域复杂度和空域复杂度的比值,所述第二图像帧的运动估计为第二图像帧的时域复杂度和空域复杂度的比值;所述第二图像帧为所述第一图像帧的前一个图像帧;
第二目标比特获取单元222,用于获取第一限定条件,并依据所述第一限定条件将所述第一图像帧的第一目标比特调整为第二目标比特;所述第一限定条件包括所述第一图像帧的运动估计和第二图像帧的运动估计的比值。
详细地,所述第二目标比特获取单元222包括:如图15所示,
第一比特调整子单元2221,用于在第一图像帧的运动估计小于第一分段参数时,根据第一比特调整函数将所述第一图像帧的第一目标比特调整为第二目标比特;
或者;
第二比特调整子单元2222,用于在第一图像帧的运动估计小于第二分段参数时,根据第二比特调整函数将所述第一图像帧的第一目标比特调整为第二目标比特;
或者;
第三比特调整子单元2223,用于在第一图像帧的运动估计小于第三分段参数时,根据第三比特调整函数将所述第一图像帧的第一目标比特调整为第二目标比特;
其中,所述第一分段参数、第二分段参数和第三分段参数依次增大。
进一步地,所述参数调整模块220包括:
第二量化参数获取单元223,用于获取第二限定条件,依据所述第二限定条件将所述第一图像帧的第一初始量化参数更新为第二初始量化参数;所述第二限定条件包括第一图像帧的空域复杂度和第二图像帧的空域复杂度的比值,以及,第一图像帧的空域复杂度和第二图像帧的前一个图像帧的空域复杂度的比值。
所述第二量化参数获取单元223,包括,如图16所示:
初始量化调整子单元2231,用于根据第一量化调整函数将第一图像帧的第一初始量化参数更新为第二初始量化参数。
所述第二量化参数获取单元232还包括:如图16所示,
最大量化调整子单元2232,用于根据第二量化调整函数将第一图像帧的第一最大量化参数更新为第二最大量化参数;
和/或,
最小量化调整子单元2233,用于根据第三量化调整函数将第一图像帧的第一最小量化参数更新为第二最小量化参数。
所述量化参数获取单元还包括:
最终量化调整单元2234,用于在所述第二初始量化参数大于量化参数临界阈值时,根据第四量化调整函数将所述第二初始量化参数更新为目标初始量化参数。
压缩码流获取模块230,用于依据所述第二目标比特和第二初始量化参数生成所述第一图像帧的压缩码流。
所述的装置实施例中的装置与方法实施例基于同样地发明构思。
本发明实施例提供了一种视频编码码率控制设备,所述设备包括处理器和存储器,所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由所述处理器加载并执行以实现如方法实施例提供的视频编码码率控制方法。
本发明实施例一种计算机可读存储介质,所述存储介质中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由所述处理器加载并执行以实现如方法实施例所述的视频编码码率控制方法;所述至少一条指令、该至少一段程序、该代码集或指令集包含用于进行以下操作的指令:
获取视频流中第一图像帧的空域复杂度,并获取所述第一图像帧的时域复杂度;
根据所述空域复杂度和时域复杂度将所述第一图像帧的第一目标比特更新为第二目标比特;且根据所述空域复杂度和时域复杂度将所述第一图像帧的第一初始量化参数更新为第二初始量化参数;
依据所述第二目标比特和第二初始量化参数生成所述第一图像帧的压缩码流。
本发明实施例还提供了一种视频编码码率控制设备,该设备可以用于实施上述实施例中提供的视频编码码率控制方法。如图17所示,具体来讲:
所述设备可以包括RF(Radio Frequency,射频)电路810、包括有一个或一个以上计算机可读存储介质的存储器820、输入单元830、显示单元840、传感器850、音频电路860、WiFi(wireless fidelity,无线保真)模块870、包括有一个或者一个以上处理核心的处理器880、以及电源890等部件。本领域技术人员可以理解,图17中示出的设备结构并不构成对设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。其中:
RF电路810可用于收发信息或通话过程中,信号的接收和发送,特别地,将基站的下行信息接收后,交由一个或者一个以上处理器880处理;另外,将涉及上行的数据发送给基站。通常,RF电路810包括但不限于天线、至少一个放大器、调谐器、一个或多个振荡器、用户身份模块(SIM)卡、收发信机、耦合器、LNA(LowNoiseAmplifier,低噪声放大器)、双工器等。此外,RF电路810还可以通过无线通信与网络和其他设备通信。所述无线通信可以使用任一通信标准或协议,包括但不限于GSM(Global System ofMobile communication,全球移动通讯系统)、GPRS(General Packet Radio Service,通用分组无线服务)、CDMA(CodeDivision Multiple Access,码分多址)、WCDMA(Wideband CodeDivisionMultipleAccess,宽带码分多址)、LTE(Long Term Evolution,长期演进)、电子邮件、SMS(ShortMessaging Service,短消息服务)等。
存储器820可用于存储软件程序以及模块,处理器880通过运行存储在存储器820的软件程序以及模块,从而执行各种功能应用以及数据处理。存储器820可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、功能所需的应用程序等;存储数据区可存储根据所述设备的使用所创建的数据等。此外,存储器820可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。相应地,存储器820还可以包括存储器控制器,以提供处理器880和输入单元830对存储器820的访问。
输入单元830可用于接收输入的数字或字符信息,以及产生与用户设置以及功能控制有关的键盘、鼠标、操作杆、光学或者轨迹球信号输入。具体地,输入单元830可包括触敏表面831以及其他输入设备832。触敏表面831,也称为触摸显示屏或者触控板,可收集用户在其上或附近的触摸操作(比如用户使用手指、触笔等任何适合的物体或附件在触敏表面831上或在触敏表面831附近的操作),并根据预先设定的程式驱动相应的连接装置。可选的,触敏表面831可包括触摸检测装置和触摸控制器两个部分。其中,触摸检测装置检测用户的触摸方位,并检测触摸操作带来的信号,将信号传送给触摸控制器;触摸控制器从触摸检测装置上接收触摸信息,并将它转换成触点坐标,再送给处理器880,并能接收处理器880发来的命令并加以执行。此外,可以采用电阻式、电容式、红外线以及表面声波等多种类型实现触敏表面831。除了触敏表面831,输入单元830还可以包括其他输入设备832。具体地,其他输入设备832可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆等中的一种或多种。
显示单元840可用于显示由用户输入的信息或提供给用户的信息以及所述设备的各种图形用户接口,这些图形用户接口可以由图形、文本、图标、视频和其任意组合来构成。显示单元840可包括显示面板841,可选的,可以采用LCD(Liquid Crystal Display,液晶显示器)、OLED(Organic Light-Emitting Diode,有机发光二极管)等形式来配置显示面板841。进一步的,触敏表面831可覆盖显示面板841,当触敏表面831检测到在其上或附近的触摸操作后,传送给处理器880以确定触摸事件的类型,随后处理器880根据触摸事件的类型在显示面板841上提供相应的视觉输出。其中,触敏表面831与显示面板841可以两个独立的部件来实现输入和输入功能,但是在某些实施例中,也可以将触敏表面831与显示面板841集成而实现输入和输出功能。
所述设备还可包括至少一种传感器850,比如光传感器、运动传感器以及其他传感器。具体地,光传感器可包括环境光传感器及接近传感器,其中,环境光传感器可根据环境光线的明暗来调节显示面板841的亮度,接近传感器可在所述设备移动到耳边时,关闭显示面板841和/或背光。作为运动传感器的一种,重力加速度传感器可检测各个方向上(一般为三轴)加速度的大小,静止时可检测出重力的大小及方向,可用于识别设备姿态的应用(比如横竖屏切换、相关游戏、磁力计姿态校准)、振动识别相关功能(比如计步器、敲击)等;至于所述设备还可配置的陀螺仪、气压计、湿度计、温度计、红外线传感器等其他传感器,在此不再赘述。
音频电路860、扬声器861,传声器862可提供用户与所述设备之间的音频接口。音频电路860可将接收到的音频数据转换后的电信号,传输到扬声器861,由扬声器861转换为声音信号输出;另一方面,传声器862将收集的声音信号转换为电信号,由音频电路860接收后转换为音频数据,再将音频数据输出处理器880处理后,经RF电路810以发送给比如另一设备,或者将音频数据输出至存储器820以便进一步处理。音频电路860还可能包括耳塞插孔,以提供外设耳机与所述设备的通信。
WiFi属于短距离无线传输技术,所述设备通过WiFi模块870可以帮助用户收发电子邮件、浏览网页和访问流式媒体等,它为用户提供了无线的宽带互联网访问。虽然图17示出了WiFi模块870,但是可以理解的是,其并不属于所述设备的必须构成,完全可以根据需要在不改变发明的本质的范围内而省略。
处理器880是所述设备的控制中心,利用各种接口和线路连接整个设备的各个部分,通过运行或执行存储在存储器820内的软件程序和/或模块,以及调用存储在存储器820内的数据,执行所述设备的各种功能和处理数据,从而对设备进行整体监控。可选的,处理器880可包括一个或多个处理核心;优选的,处理器880可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作系统、用户界面和应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器880中。
所述设备还包括给各个部件供电的电源890(比如电池),优选的,电源可以通过电源管理系统与处理器880逻辑相连,从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。电源890还可以包括一个或一个以上的直流或交流电源、再充电系统、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。
尽管未示出,所述设备还可以包括摄像头、蓝牙模块等,在此不再赘述。具体在本实施例中,设备的显示单元是触摸屏显示器,设备还包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行本发明中装置实施例中的指令;具体地,所述处理器用于执行包括:
获取视频流中第一图像帧的空域复杂度,并获取所述第一图像帧的时域复杂度;
根据所述空域复杂度和时域复杂度将所述第一图像帧的第一目标比特更新为第二目标比特;且根据所述空域复杂度和时域复杂度将所述第一图像帧的第一初始量化参数更新为第二初始量化参数;
依据所述第二目标比特和第二初始量化参数生成所述第一图像帧的压缩码流。
本实施例提供了一种视频编码码率控制系统,如图18所示,所述系统包括:第一终端300、服务器400和第二终端500;
所述第一终端包括300:
第一图像帧获取模块310,用于获取目标视频流中的第一图像帧;
时空域复杂度获取模块320,用于对所述第一图像帧进行处理,以获取所述第一图像帧的空域复杂度,以及所述第一图像帧的时域复杂度,
参数调整模块330,用于根据所述空域复杂度和时域复杂度调整第一图像帧的第一目标比特,得到第一图像帧的第二目标比特;根据所述空域复杂度和时域复杂度调整第一图像帧的第一初始量化参数,得到第一图像帧的第二初始量化参数;
压缩码流获取模块340,用于依据调整得到的第二目标比特和初始量化参数得到所述第一图像帧的压缩码流;
所述第一终端300还包括:
压缩码流发送模块350,用于将所述压缩码流信息发送给服务器;
所述第二终端包括500:
压缩码流获取模块510,用于从服务器获取所述压缩码流;
压缩码流解码模块520,用于对接收到的压缩码流进行解码。
所述的系统实施例中的系统与方法实施例基于同样地发明构思。
需要说明的是:上述本发明实施例先后顺序仅仅为了描述,不代表实施例的优劣。
本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (13)

1.一种视频编码码率控制方法,其特征在于,所述方法包括:
获取视频流中第一图像帧的空域复杂度,并获取所述第一图像帧的时域复杂度;
获取第一图像帧的运动估计和第二图像帧的运动估计;所述第一图像帧的运动估计为第一图像帧的时域复杂度和空域复杂度的比值,所述第二图像帧的运动估计为第二图像帧的时域复杂度和空域复杂度的比值;所述第二图像帧为所述第一图像帧的前一个图像帧;
获取第一限定条件,依据所述第一限定条件将所述第一图像帧的第一目标比特更新为第二目标比特;所述第一限定条件包括所述第一图像帧的运动估计和第二图像帧的运动估计的比值;
根据所述空域复杂度和时域复杂度将所述第一图像帧的第一初始量化参数更新为第二初始量化参数;
依据所述第二目标比特和第二初始量化参数生成所述第一图像帧的压缩码流。
2.根据权利要求1所述的视频编码码率控制方法,其特征在于,所述根据所述空域复杂度和时域复杂度将所述第一图像帧的第一初始量化参数更新为第二初始量化参数,包括:
获取第二限定条件,依据所述第二限定条件将所述第一图像帧的第一初始量化参数更新为第二初始量化参数;所述第二限定条件包括第一图像帧的空域复杂度和第二图像帧的空域复杂度的比值,以及,第一图像帧的空域复杂度和第二图像帧的前一个图像帧的空域复杂度的比值。
3.根据权利要求1所述的视频编码码率控制方法,其特征在于,所述依据所述第一限定条件将所述第一图像帧的第一目标比特更新为第二目标比特;包括:
在第一图像帧的运动估计小于第一分段参数时,根据第一比特调整函数将所述第一图像帧的第一目标比特调整为第二目标比特;
或者;
在第一图像帧的运动估计小于第二分段参数时,根据第二比特调整函数将所述第一图像帧的第一目标比特调整为第二目标比特;
或者;
在第一图像帧的运动估计小于第三分段参数时,根据第三比特调整函数将所述第一图像帧的第一目标比特调整为第二目标比特。
4.根据权利要求2所述的视频编码码率控制方法,其特征在于,所述依据所述第二限定条件将所述第一图像帧的第一初始量化参数更新为第二初始量化参数,包括:
根据第一量化调整函数将第一图像帧的第一初始量化参数更新为第二初始量化参数。
5.根据权利要求2所述的视频编码码率控制方法,其特征在于,所述依据所述第二限定条件将所述第一图像帧的第一初始量化参数更新为第二初始量化参数,之后还包括:
根据第二量化调整函数将第一图像帧的第一最大量化参数更新为第二最大量化参数;
和/或,
根据第三量化调整函数将第一图像帧的第一最小量化参数更新为第二最小量化参数。
6.根据权利要求4所述的视频编码码率控制方法,其特征在于,所述依据所述第二限定条件将所述第一图像帧的第一初始量化参数更新为第二初始量化参数,之后还包括:
在所述第二初始量化参数大于量化参数临界阈值时,根据第四量化调整函数将所述第二初始量化参数更新为目标初始量化参数。
7.根据权利要求1所述的视频编码码率控制方法,其特征在于,所述获取视频流中第一图像帧的空域复杂度,包括:
获取所述第一图像帧中第一基本单元的最优的帧内预测代价;
由所述第一基本单元的最优的帧内预测代价得到第一图像帧的空域复杂度。
8.根据权利要求1所述的视频编码码率控制方法,其特征在于,所述获取所述第一图像帧的时域复杂度,包括:
获取所述第一图像帧中第一基本单元的最优的帧间预测代价;
由所述第一基本单元的最优的帧间预测代价得到第一图像帧的时域复杂度。
9.一种视频编码码率控制方法,其特征在于,所述方法包括:
第一终端获取视频流中的第一图像帧;
所述第一终端对所述第一图像帧进行处理,以获取所述第一图像帧的空域复杂度,以及所述第一图像帧的时域复杂度,
所述第一终端根据获取第一图像帧的运动估计和第二图像帧的运动估计;所述第一图像帧的运动估计为第一图像帧的时域复杂度和空域复杂度的比值,所述第二图像帧的运动估计为第二图像帧的时域复杂度和空域复杂度的比值;所述第二图像帧为所述第一图像帧的前一个图像帧;
所述第一终端获取第一限定条件,依据所述第一限定条件将所述第一图像帧的第一目标比特更新为第二目标比特;所述第一限定条件包括所述第一图像帧的运动估计和第二图像帧的运动估计的比值;
所述第一终端将所述第一图像帧的第一初始量化参数更新为第二初始量化参数;
所述第一终端依据所述第二目标比特和初始量化参数生成所述第一图像帧的压缩码流;
所述第一终端将所述压缩码流传输给服务器;
第二移动终端从所述服务器获取所述压缩码流;
所述第二移动终端对所述压缩码流进行解码,并将解码得到的目标图像帧呈现在第二移动终端上。
10.一种视频编码码率控制装置,其特征在于,所述装置包括:
时空域复杂度获取模块,用于获取视频流中第一图像帧的空域复杂度,并获取所述第一图像帧的时域复杂度,
参数调整模块,所述参数调整模块包括:
运动估计获取单元,用于获取第一图像帧的运动估计和第二图像帧的运动估计;所述第一图像帧的运动估计为第一图像帧的时域复杂度和空域复杂度的比值,所述第二图像帧的运动估计为第二图像帧的时域复杂度和空域复杂度的比值;所述第二图像帧为所述第一图像帧的前一个图像帧;
第二目标比特获取单元,用于获取第一限定条件,并依据所述第一限定条件将所述第一图像帧的第一目标比特调整为第二目标比特;所述第一限定条件包括所述第一图像帧的运动估计和第二图像帧的运动估计的比值;
所述参数调整模块还用于根据所述空域复杂度和时域复杂度将所述第一图像帧的第一初始量化参数更新为第二初始量化参数;
压缩码流获取模块,用于依据所述第二目标比特和第二初始量化参数生成所述第一图像帧的压缩码流。
11.根据权利要求10所述的视频编码码率控制装置,其特征在于,所述参数调整模块还包括:
第二量化参数获取单元,用于获取第二限定条件,依据所述第二限定条件将所述第一图像帧的第一初始量化参数更新为第二初始量化参数;所述第二限定条件包括第一图像帧的空域复杂度和第二图像帧的空域复杂度的比值,以及,第一图像帧的空域复杂度和第二图像帧的前一个图像帧的空域复杂度的比值。
12.一种视频编码码率控制设备,其特征在于,所述设备包括处理器和存储器,所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由所述处理器加载并执行以实现如权利要求1至8任一所述的视频编码码率控制方法,或权利要求9所述的视频编码码率控制方法。
13.一种计算机可读存储介质,其特征在于,所述存储介质中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由处理器加载并执行以实现如权利要求1至8任一所述的视频编码码率控制方法,或权利要求9所述的视频编码码率控制方法。
CN201810265922.3A 2018-03-28 2018-03-28 一种视频编码码率控制方法、装置、设备及存储介质 Active CN110324622B (zh)

Priority Applications (6)

Application Number Priority Date Filing Date Title
CN201810265922.3A CN110324622B (zh) 2018-03-28 2018-03-28 一种视频编码码率控制方法、装置、设备及存储介质
EP19775531.7A EP3780610A4 (en) 2018-03-28 2019-02-27 METHOD, DEVICE AND DEVICE FOR CODE RATE CONTROL IN VIDEO ENCODING AND STORAGE MEDIUM
PCT/CN2019/076310 WO2019184643A1 (zh) 2018-03-28 2019-02-27 一种视频编码码率控制方法、装置、设备及存储介质
JP2020544623A JP7229261B2 (ja) 2018-03-28 2019-02-27 ビデオ符号化のビットレート制御方法、装置、機器、記憶媒体及びプログラム
US16/884,330 US11240511B2 (en) 2018-03-28 2020-05-27 Video encoding code rate control method, apparatus, and device, and storage medium
US17/493,688 US11606564B2 (en) 2018-03-28 2021-10-04 Video encoding code rate control method, apparatus, and device, and storage medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810265922.3A CN110324622B (zh) 2018-03-28 2018-03-28 一种视频编码码率控制方法、装置、设备及存储介质

Publications (2)

Publication Number Publication Date
CN110324622A CN110324622A (zh) 2019-10-11
CN110324622B true CN110324622B (zh) 2022-09-23

Family

ID=68058556

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810265922.3A Active CN110324622B (zh) 2018-03-28 2018-03-28 一种视频编码码率控制方法、装置、设备及存储介质

Country Status (5)

Country Link
US (2) US11240511B2 (zh)
EP (1) EP3780610A4 (zh)
JP (1) JP7229261B2 (zh)
CN (1) CN110324622B (zh)
WO (1) WO2019184643A1 (zh)

Families Citing this family (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111083536B (zh) * 2019-12-31 2022-02-22 广州酷狗计算机科技有限公司 调节视频码率的方法和装置
CN113132728B (zh) * 2019-12-31 2023-06-27 上海海思技术有限公司 编码方法及编码器
CN113365061B (zh) * 2020-03-03 2024-02-09 炬芯科技股份有限公司 H264宏块级码率控制方法、装置及可读存储介质
CN111479113B (zh) * 2020-04-15 2021-04-09 腾讯科技(深圳)有限公司 码率控制方法和装置、存储介质和电子设备
CN111447446B (zh) * 2020-05-15 2022-08-23 西北民族大学 一种基于人眼视觉区域重要性分析的hevc码率控制方法
CN111787318A (zh) * 2020-06-24 2020-10-16 浙江大华技术股份有限公司 一种视频码率控制方法、装置、设备以及存储装置
CN112165620A (zh) * 2020-09-24 2021-01-01 北京金山云网络技术有限公司 视频的编码方法及装置、存储介质、电子设备
CN112218083B (zh) * 2020-10-16 2021-09-17 西安邮电大学 高效视频编码标准帧内图像码率估计方法
CN112073723B (zh) * 2020-11-16 2021-02-02 北京世纪好未来教育科技有限公司 视频信息处理方法、装置、电子设备及存储介质
CN113132757B (zh) * 2021-04-21 2022-07-05 北京汇钧科技有限公司 数据处理方法和装置
CN113973205A (zh) * 2021-10-21 2022-01-25 重庆邮电大学 基于视频内容特征的码率控制比特分配方法及存储介质
CN115022719B (zh) * 2022-05-12 2023-05-26 东风汽车集团股份有限公司 一种远程驾驶自适应视频码率控制传输方法与系统
CN115225911B (zh) * 2022-08-19 2022-12-06 腾讯科技(深圳)有限公司 一种码率自适应方法、装置、计算机设备和存储介质
CN115412758B (zh) * 2022-09-01 2023-11-14 北京奇艺世纪科技有限公司 一种视频处理方法及相关装置
CN116094969B (zh) * 2022-12-23 2024-03-29 中国联合网络通信集团有限公司 带宽调整方法、装置、设备及存储介质
CN116208586B (zh) * 2023-05-04 2023-06-30 广东珠江智联信息科技股份有限公司 一种低延时医疗影像数据传输方法及系统
CN117014659B (zh) * 2023-10-07 2024-02-06 腾讯科技(深圳)有限公司 一种视频转码方法、装置、电子设备和存储介质
CN117478881A (zh) * 2023-11-06 2024-01-30 淘宝(中国)软件有限公司 视频信息处理方法、系统、设备和存储介质

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106170979A (zh) * 2014-04-30 2016-11-30 英特尔公司 恒定质量视频编码

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8005139B2 (en) * 2004-06-27 2011-08-23 Apple Inc. Encoding with visual masking
US7474701B2 (en) * 2004-09-23 2009-01-06 International Business Machines Corporation Single pass variable bit rate control strategy and encoder for processing a video frame of a sequence of video frames
US9686557B2 (en) 2004-12-02 2017-06-20 Thomson Licensing S.A. Quantizer parameter determination for video encoder rate control
US8208536B2 (en) 2005-04-28 2012-06-26 Apple Inc. Method and apparatus for encoding using single pass rate controller
KR100790148B1 (ko) * 2006-07-27 2008-01-02 삼성전자주식회사 실시간 영상 복잡도 측정 방법
US8331438B2 (en) * 2007-06-05 2012-12-11 Microsoft Corporation Adaptive selection of picture-level quantization parameters for predicted video pictures
WO2010005691A1 (en) * 2008-06-16 2010-01-14 Dolby Laboratories Licensing Corporation Rate control model adaptation based on slice dependencies for video coding
CN101325711A (zh) * 2008-07-16 2008-12-17 上海大学 基于时空掩盖效应的自适应码率控制方法
WO2010057170A1 (en) * 2008-11-17 2010-05-20 Cernium Corporation Analytics-modulated coding of surveillance video
US20100166060A1 (en) * 2008-12-31 2010-07-01 Texas Instruments Incorporated Video transcoder rate control
CN101827267B (zh) * 2010-04-20 2012-07-04 上海大学 基于视频图像分割技术的码率控制方法
US9565440B2 (en) * 2013-06-25 2017-02-07 Vixs Systems Inc. Quantization parameter adjustment based on sum of variance and estimated picture encoding cost
US20150071343A1 (en) * 2013-09-12 2015-03-12 Magnum Semiconductor, Inc. Methods and apparatuses including an encoding system with temporally adaptive quantization
US20150215621A1 (en) * 2014-01-30 2015-07-30 Qualcomm Incorporated Rate control using complexity in video coding
EP2919232A1 (en) * 2014-03-14 2015-09-16 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Encoder, decoder and method for encoding and decoding
US10397574B2 (en) * 2014-05-12 2019-08-27 Intel Corporation Video coding quantization parameter determination suitable for video conferencing
CN104683804B (zh) * 2015-02-14 2017-12-29 北京航空航天大学 基于视频内容特征的参数自适应多维码率控制方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106170979A (zh) * 2014-04-30 2016-11-30 英特尔公司 恒定质量视频编码

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
一种基于H.264/AVC的宏块级码率控制优化算法;龙昭华等;《重庆邮电大学学报(自然科学版)》;20091215(第06期);全文 *

Also Published As

Publication number Publication date
JP7229261B2 (ja) 2023-02-27
US11240511B2 (en) 2022-02-01
JP2021517388A (ja) 2021-07-15
WO2019184643A1 (zh) 2019-10-03
EP3780610A1 (en) 2021-02-17
US20220030245A1 (en) 2022-01-27
CN110324622A (zh) 2019-10-11
US11606564B2 (en) 2023-03-14
US20200288143A1 (en) 2020-09-10
EP3780610A4 (en) 2021-04-28

Similar Documents

Publication Publication Date Title
CN110324622B (zh) 一种视频编码码率控制方法、装置、设备及存储介质
CN109168013B (zh) 一种抽帧的方法、装置、设备及计算机可读存储介质
US10986332B2 (en) Prediction mode selection method, video encoding device, and storage medium
CN108900856B (zh) 一种视频帧率预测方法、装置及设备
CN106412702B (zh) 一种视频片段的截取方法和装置
CN111010576B (zh) 一种数据处理方法及相关设备
WO2015058656A1 (zh) 直播控制方法,及主播设备
KR102225235B1 (ko) 비디오 인코딩 방법, 장치, 및 디바이스, 및 저장 매체
CN108337533B (zh) 视频压缩方法和装置
WO2019169997A1 (zh) 视频运动估计方法、装置、终端及存储介质
US10827198B2 (en) Motion estimation method, apparatus, and storage medium
JPWO2009090967A1 (ja) 通信端末、表示画像制御方法、プログラムおよび記録媒体
CN113630621B (zh) 一种视频处理的方法、相关装置及存储介质
CN112866710B (zh) 一种编码单元处理方法和相关装置
CN110213593B (zh) 一种运动矢量的确定方法、编码压缩方法和相关装置
CN109003313B (zh) 一种传输网页图片的方法、装置和系统
KR20100126079A (ko) 휴대단말기의 전압 스케일링 방법

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant