CN106572351B - 视频编码中的码率控制方法和装置、电子设备以及计算机可读存储介质 - Google Patents

视频编码中的码率控制方法和装置、电子设备以及计算机可读存储介质 Download PDF

Info

Publication number
CN106572351B
CN106572351B CN201510657604.8A CN201510657604A CN106572351B CN 106572351 B CN106572351 B CN 106572351B CN 201510657604 A CN201510657604 A CN 201510657604A CN 106572351 B CN106572351 B CN 106572351B
Authority
CN
China
Prior art keywords
image
video
sectional image
code rate
face
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201510657604.8A
Other languages
English (en)
Other versions
CN106572351A (zh
Inventor
王星星
简伟华
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Beijing Co Ltd
Original Assignee
Tencent Technology Beijing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Beijing Co Ltd filed Critical Tencent Technology Beijing Co Ltd
Priority to CN201510657604.8A priority Critical patent/CN106572351B/zh
Publication of CN106572351A publication Critical patent/CN106572351A/zh
Application granted granted Critical
Publication of CN106572351B publication Critical patent/CN106572351B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Image Processing (AREA)

Abstract

本发明公开了一种视频编码中的码率控制方法,属于视频编码技术领域。所述方法包括:获取视频的码率信息;从视频中提取目标单位时间内的图像,目标单位时间是指码率大于预设值的单位时间;对上述图像进行滤波处理;对滤波处理后的图像进行编码,封装为视频文件。本发明解决了相关技术提供的码率控制方法存在的编码耗时过多,且增加视频播放失败的概率的问题。一方面,仅对码率较大部分的图像进行降码率处理,编码耗时很少;另一方面,避免了因切片丢失而导致视频播放失败的问题,视频播放失败的概率显著降低;此外,通过对码率较大部分的图像进行降码率处理,使得视频的峰值码率显著降低,达到减少视频播放卡顿、提高视频播放流畅度的目的。

Description

视频编码中的码率控制方法和装置、电子设备以及计算机可 读存储介质
技术领域
本发明涉及视频编码技术领域,特别涉及一种视频编码中的码率控制方法及装置。
背景技术
对于用户来说,视频的流畅度会直接影响到用户的视频观看体验。
在相关技术中,提供了一种码率控制方法以提高视频流畅度,该码率控制方法的具体方案如下:在编码端,将图像序列中的I帧(即关键帧)分割为多个切片后进行编码,在传输P帧(即单向预测帧)或者B帧(即双向预测帧)时,根据P帧或者B帧的数据大小选择一定量的I帧切片一并传输,从而控制每次传输的数据量基本相同或者接近;在解码端,将接收到的I帧切片进行合并和解码,最终得到完整的I帧进行显示。通过上述方式,可以有效平缓码流波动,为视频编码数据的平稳传播提供可能。
然而,上述相关技术至少存在以下问题:一方面,在编码过程中,由于需要对I帧进行分割,增加了编码耗时;另一方面,如果某一个I帧切片在传输过程中丢失,解码端便会解码失败,这无疑增加了视频播放失败的概率。
发明内容
为了解决上述相关技术提供的码率控制方法存在的编码耗时过多,且增加视频播放失败的概率的问题,本发明实施例提供了一种视频编码中的码率控制方法及装置。所述技术方案如下:
第一方面,提供了一种视频编码中的码率控制方法,所述方法包括:
获取视频的码率信息,所述码率信息包括所述视频在各个单位时间的码率;
从所述视频中提取目标单位时间内的图像,所述目标单位时间是指码率大于预设值的单位时间;
对所述图像进行滤波处理;
对滤波处理后的图像进行编码,封装为视频文件。
第二方面,提供了一种视频编码中的码率控制装置,所述装置包括:
获取模块,用于获取视频的码率信息,所述码率信息包括所述视频在各个单位时间的码率;
提取模块,用于从所述视频中提取目标单位时间内的图像,所述目标单位时间是指码率大于预设值的单位时间;
滤波模块,用于对所述图像进行滤波处理;
编码模块,用于对滤波处理后的图像进行编码,封装为视频文件。
本发明实施例提供的技术方案带来的有益效果包括:
通过对视频中码率大于预设值的单位时间内的图像进行滤波处理,而后对滤波处理后的图像进行编码,封装为视频文件;解决了上述相关技术提供的码率控制方法存在的编码耗时过多,且增加视频播放失败的概率的问题。一方面,由于仅对码率较大部分的图像进行降码率处理,所以编码耗时很少;另一方面,避免了因切片丢失而导致视频播放失败的问题,视频播放失败的概率显著降低;此外,通过对码率较大部分的图像进行降码率处理,使得视频的峰值码率显著降低,从而达到减少视频播放卡顿、提高视频播放流畅度的目的。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明一个实施例提供的视频编码中的码率控制方法的流程图;
图2A是本发明另一实施例提供的视频编码中的码率控制方法的流程图;
图2B是基于图2A所示实施例提供的一种人脸识别方法的流程图;
图2C是本发明实施例涉及的分区图像的示意图;
图2D是本发明实施例涉及的分类校准模型的示意图;
图2E是本发明实施例涉及的人脸特征点向量的图形化表示的示意图;
图3是本发明一个实施例提供的视频编码中的码率控制装置的框图;
图4是本发明另一实施例提供的视频编码中的码率控制装置的框图;
图5是本发明一个实施例提供的电子设备的结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明实施方式作进一步地详细描述。
请参考图1,其示出了本发明一个实施例提供的视频编码中的码率控制方法的流程图,该码率控制方法可以包括如下步骤:
步骤102,获取视频的码率信息,该码率信息包括视频在各个单位时间的码率。
步骤104,从视频中提取目标单位时间内的图像,该目标单位时间是指码率大于预设值的单位时间。
步骤106,对上述图像进行滤波处理。
步骤108,对滤波处理后的图像进行编码,封装为视频文件。
综上所述,本实施例提供的码率控制方法,通过对视频中码率大于预设值的单位时间内的图像进行滤波处理,而后对滤波处理后的图像进行编码,封装为视频文件;解决了上述相关技术提供的码率控制方法存在的编码耗时过多,且增加视频播放失败的概率的问题。一方面,由于仅对码率较大部分的图像进行降码率处理,所以编码耗时很少;另一方面,避免了因切片丢失而导致视频播放失败的问题,视频播放失败的概率显著降低;此外,通过对码率较大部分的图像进行降码率处理,使得视频的峰值码率显著降低,从而达到减少视频播放卡顿、提高视频播放流畅度的目的。
请参考图2A,其示出了本发明另一实施例提供的视频编码中的码率控制方法的流程图,该码率控制方法可以包括如下步骤:
步骤201,获取视频的码率信息。
其中,码率信息包括视频在各个单位时间的码率。在通常情况下,单位时间为一秒,码率的单位为kbps(即千位每秒)。
在一种可能的实施方式中,采用two pass编码方式,在对视频进行第一遍编码后,获取第一遍编码的码率信息文件,据此得到视频的码率信息。其中,码率信息文件中记录有视频的每一帧图像的数据大小,根据每一帧图像的数据大小和帧率即可计算得到视频在各个单位时间的码率。此外,在本实施例中,所采用的视频编码标准可以是H.264编码标准、H.265编码标准或者其它编码标准。
步骤202,从视频中提取目标单位时间内的图像。
在获取视频的码率信息后,根据视频在各个单位时间的码率,从视频中提取目标单位时间内的图像。其中,目标单位时间是指码率大于预设值的单位时间。预设值可以是预先设定的经验值,也可以是根据码率信息实时确定的值。
在本实施例中,通过从视频中提取码率较大部分的图像,对此部分图像进行滤波处理,从而达到降低视频峰值码率的目的。在本实施例中,滤波处理过程包括如下步骤203和步骤204。
步骤203,识别上述图像的重要区域和非重要区域。
对于从视频中提取的每一帧图像,从图像中识别区分出重要区域和非重要区域。其中,重要区域是指用于反映图像的重要内容和/或用户关注内容的像素所形成的区域,非重要区域是指图像中除重要区域之外的其它像素所形成的区域。
在一种可能的实施方式中,本步骤包括:从图像中提取目标元素;将目标元素确定为重要区域,并将图像中除目标元素之外的其它像素确定为非重要区域。其中,目标元素包括但不限于人脸、字幕、物体轮廓中的至少一种。诸如人脸、字幕、物体轮廓之类的目标元素通常是图像的重要内容和/或用户关注内容,因此将这部分目标元素确定为图像的重要区域。此外,在本实施例中,对识别人脸、字幕和物体轮廓所采用的算法不作具体限定。例如,人脸识别算法包括但不限于基于模板匹配的识别算法、基于奇异值特征的识别算法、子空间分析的识别算法、基于神经网络的识别算法、基于图像特征的识别算法或者基于模型可变参数的识别算法,等等。
在另一种可能的实施方式中,本步骤包括:识别图像中的前景像素和背景像素;其中,前景像素为重要区域,背景像素为非重要区域。图像中的前景像素通常反映了图像的重要内容和/或用户关注内容,因此也可将前景像素确定为图像的重要区域。此外,在本实施例中,对识别前景像素和背景像素所采用的算法也不作具体限定。例如,前背景检测算法包括但不限于帧差法、平均背景法、光流法、前景建模法、背景建模法或者背景非参数估计,等等。
步骤204,对非重要区域进行滤波处理。
在从图像中识别区分出重要区域和非重要区域之后,仅对非重要区域进行滤波处理,而对重要区域不做滤波处理,从而确保重要区域的最佳显示效果。
在一种可能的实施方式中,采用BEEPS(Bi-Exponential Edge-PreservingSmoother,双指数边缘保留平滑)滤波算法对非重要区域进行滤波处理。
BEEPS滤波算法包括像素正向迭代计算过程和像素反向迭代计算过程。其中,像素正向迭代计算过程所对应的计算公式如下:
φ[k]=(1-δ[k]λ)x[k]+δ[k]λφ[k-1];其中,δ[k]=r(x[k],φ[k-1]);
像素反向迭代计算过程所对应的计算公式如下:
其中,
合并正向迭代计算结果φ[k]和反向迭代计算结果得到滤波结果y[k]:
其中,x[k]为输入数据,表示像素在滤波前的灰度值;λ为预设常数,λ用于控制空域滤波的程度,其取值范围通常为λ∈[0,1),例如λ=0.02;r为一个双变量的函数,用于控制值域滤波系数,对于双边滤波,该函数可取经典的高斯分布函数。
由于上述过程仅是一维运算过程,对于二维的图像数据,处理流程如下:首先,按照上述公式对图像数据进行一次水平方向上的正反向迭代计算,然后对该计算结果进行一次垂直方向上的正反向迭代计算得到第一滤波结果;之后,按照上述公式对图像数据进行一次垂直方向上的正反向迭代计算,然后对该计算结果进行一次水平方向上的正反向迭代计算得到第二滤波结果;最后,计算第一滤波结果与第二滤波结果的平均值,作为最终的滤波结果。
通过采用BEEPS滤波算法对图像中的非重要区域进行滤波处理,其优点在于对边缘轮廓的保护效果较好,而变化平坦的像素区域会更加平滑,从而达到保边去噪的滤波效果。
步骤205,对滤波处理后的图像进行编码,封装为视频文件。
在对提取的图像进行滤波处理后,对滤波处理后的图像和视频中其它未做滤波处理的图像进行编码,封装为视频文件。
在一种可能的实施方式中,由于上述步骤201中采用了two pass编码方式中的第一遍编码得到了视频的码率信息,此处便采用two pass编码方式中的第二遍编码对视频图像进行编码,得到最终的视频文件。
需要说明的一点是,在本实施例中,通过对提取的码率较大部分的图像进行识别,区分出重要区域和非重要区域,仅对非重要区域进行滤波处理,而对重要区域不做滤波处理,既达到了降低峰值码率的目的,也确保了重要区域的最佳显示效果。当然,在其它可能的实施方式中,若仅为了达到降低峰值码率的目的,也可直接对提取的码率较大部分的图像的全部区域进行滤波处理,本实施例对此不作限定。
可选地,采用SIMD(Single Instruction Multiple Data,单指令多数据流)对用于实现上述步骤流程的算法进行汇编优化,进一步提高处理速度。
综上所述,本实施例提供的码率控制方法,通过对视频中码率大于预设值的单位时间内的图像进行滤波处理,而后对滤波处理后的图像进行编码,封装为视频文件;解决了上述相关技术提供的码率控制方法存在的编码耗时过多,且增加视频播放失败的概率的问题。一方面,由于仅对码率较大部分的图像进行降码率处理,所以编码耗时很少;另一方面,避免了因切片丢失而导致视频播放失败的问题,视频播放失败的概率显著降低;此外,通过对码率较大部分的图像进行降码率处理,使得视频的峰值码率显著降低,从而达到减少视频播放卡顿、提高视频播放流畅度的目的。
此外,在本实施例中,还通过对提取的码率较大部分的图像进行识别,区分出重要区域和非重要区域,仅对非重要区域进行滤波处理,而对重要区域不做滤波处理,既达到了降低峰值码率的目的,也确保了重要区域的最佳显示效果。
此外,在本实施例中,还通过采用BEEPS滤波算法,达到了保边去噪的滤波效果。
在本发明实施例中,考虑到人眼视觉系统对图像的认知是非均匀和非线性的,也即人眼视觉系统并不能够察觉到图像中的所有变化,利用人眼视觉系统的上述特性,对视频中码率较大部分的图像进行滤波处理,在尽可能保证图像质量的前提下提升视频的压缩比。
在基于图2A所示实施例提供的另一可选实施例中,还提供了一种人脸识别方法,如图2B所示,该人脸识别方法包括如下步骤:
步骤21,对图像进行分区处理得到分区图像。
对于从视频中提取的每一帧图像,对图像进行分区处理得到分区图像。鉴于人脸位于图像的中间位置的情况居多,如图2C所示,可以将图像100的中间区域划分出一分区图像150,并将图像100的剩余区域划分为分区图像110、120、 130、140、160、170、180和190,分区图像的划分数量可根据图像100的尺寸以及分辨率确定。当然,分区图像的划分方式不仅限于上述方式。
步骤22,对每个分区图像进行迭代处理。
对于划分得到的每个分区图像,利用多个分类校准模型对图像进行T次迭代处理,T为大于1的整数。其中,分类校准模型是一种包括多个节点的弱分类器,分类校准模型的一个示例如图2D所示,每个节点都可具有分类属性信息(使用F1至F6标识)和校准属性信息(使用J1至J6标识),节点的分类属性信息彼此不同,节点的校准属性信息也不相同。
迭代处理包括利用分类校准模型的第一分支的节点的分类属性信息对分区图像进行至少一次分类处理,以及在分类处理判定分区图像具有人脸时,利用分类校准模型的第二分支的节点的校准属性信息对分区图像的人脸特征点向量进行至少一次校准处理。
分类校准模型既可以对分区图像进行分类处理,也可以用于对分区图像的人脸特征向量进行校准,每次迭代处理使用分类校准模型一个分支的节点。每个分支的节点以Stage1的根节点为起始节点,经过Stage2的一个叶节点并以 Stage3对应的叶节点结束。第一分支节点的一个示例为根节点F1|J1→叶节点F2 |J2→叶节点F4|J4,第二分支节点的另一个示例为根节点F1|J1→叶节点F3|J3→叶节点F6|J6。可以看出,在一个分类校准模型中,不同的分支节点均以根节点为开始,以不同的叶节点结束。
下面,分别对分区图像进行分类处理以及对分区图像进的人脸特征点向量进行校准处理进行说明。
第一,对分区图像进行分类处理。
对分区图像进行分类处理的最终结果是判定分区图像具有人脸或分区图像不具有人脸。
在一次迭代处理中,图2D的某一分支节点仅用于进行分类处理或校准处理。也就是说,在一次迭代处理中仅使用分支节点的分类属性信息或校准属性信息(而不是在一次迭代处理中同时使用分支节点的分类属性信息和校准属性信息)。例如,如果使用图2D中第一分支节点对分区图像(第一分支节点和第二分支节点并非预先确定,关于第一分支节点和第二分支节点的确定将在后续说明)进行分类处理,那么将使用第一分支节点的分类属性信息F1→F2→F4对分区图像依次进行分类处理,最终使用第一分支节点的叶节点的分类属性信息 F4对分区图像是否具有人脸进行判定。
第二,对分区图像的人脸特征点向量进行校准处理。
人脸特征点向量是指人脸中诸如鼻子、眼睛和嘴之类的特征点的坐标表示。对于划分得到的每个分区图像,都对应有一个初始的人脸特征点向量。初始的人脸特征点向量基于以下假设条件:如图2E所示,人脸恰好占据分区图像的分布区域,并且人脸以正面和垂直的方式分布于分区图像的分布区域,那么对应的人脸特征点向量的图形化表示如图2E中的特征点所示。图2E中仅示出对应人脸五官的八个特征点,实际应用中特征点的数量不仅限于八个。但是,实际获取的分区图像中不全部包括人脸,即使分区图像包括人脸,人脸在分区图像中分布也难以满足上述的假设条件,因此需要利用分类校准模型的校准属性信息对分区图像的特征点向量进行校准处理,以确定出对应分区图像的人脸特征点向量的校准偏移量,使用校准偏移量对人脸特征点向量进行校准,从而使校准后的人脸特征点向量能够准确反映人脸的特征点(如五官)在分区图像中的分布位置。其中,校准偏移量包括在节点的校准属性信息中,各个不同节点的校准属性信息中包括的校准偏移量不同。
如果使用图2D中第二分支节点对分区图像的人脸特征点向量进行校准处理,那么将使用第二分支节点的校准属性信息J1→J3→J6对分区图像的人脸特征点向量依次进行校准处理,最终使用第二分支节点的叶节点的校准属性信息 J6中包括的校准偏移量对分区图像的人脸特征向量进行校准处理。
在T次迭代处理的起始几次(如前T/2次)的迭代处理中,由于分区图像中不具有人脸的数量较多,因此以对分区图像进行分类处理为主,从而能够有效筛除不具备人脸的分区图像;而在后续几次(如后T/2次)的迭代处理中,以对分区图像的人脸特征点向量进行校准处理为主。由于经过前T/2次的迭代处理后得到的分区图像多数具有人脸,因此在后T/2次迭代过程中对分区图像的人脸特征点向量进行校准处理的效率较高。
步骤23,从分区图像提取特征向量。
具体地,对分区进行至少一次尺度的调整得到调整后分区图像,从分区图像中提取与人脸特征点向量中的每个人脸特征点的相邻的两个像素点,基于所提取的两个像素点在分区图像和调整后分区图像的像素偏移的差值,确定特征向量的一个维度。
以缩小调整为例,可以从以下缩小尺度(1/2、1/4、1/8)随机选择一个尺度对分区图像进行调整,对人脸特征点向量S(S为2维向量表示的L个人脸特征点)中的每一个特征点依次进行下面的操作:对于每个一个特征点,随机选择特征点相邻(或一定距离)的两个像素点,使用原始分区图像(未缩放)相同比例位置的像素点减去选择出来的两个像素点,得到两个像素偏移,最后将两个像素偏移的差值作为该特征点的一个特征值。
对于每个特征点进行N次上面的操作,可以得到特征点的N个特征值,即可构成一个SRFern向量特征,L个特征点的L个SRFern向量构成分区图像的人脸特征点向量SRFerns。SRFerns是一种简化的特征,能够加快T次迭代处理的执行效率,便于迅速进行人脸识别和五官定位,同时,SRFerns对噪声的鲁棒性更好,使对人脸的检测更加准确。
步骤24,根据上述特征向量以及迭代处理后得到的分区图像的人脸特征点向量,确定分区图像的得分。
分区图像的得分实质是每次迭代处理后计算的分区图像的得分的累加。在每次迭代处理中,利用分区图像遍历多个分类校准模型的某一分支的节点,在每次迭代处理完成后,利用分区图像的特征向量以及上一次迭代处理完成后分区图像的人脸特征点向量确定分区图像的得分。
在第t次迭代处理中,利用第k个分类校准模型进行处理(分类处理或校准处理)后分区图像的得分为:
其中,St-1表示第t-1次迭代处理完成后分区图像的人脸特征点向量,表示第t次迭代处理中利用的第k分类校准模型。
第t次迭代处理完成后分区图像的得分ft为利用K个分类校准模型对分区图像进行处理后的得分的累加,即:
相应地,T次迭代处理完成后分区图像的得分f为T次迭代处理中每次迭代处理完成后分区图像的得分的累加,即:
相较于单一使用分区图像的特征向量确定分区图像的得分,结合分区图像的特征点校准后对应的人脸特征点向量来确定分区图像的得分,使得分区图像的得分能够更为准确地描述分区图像具有人脸的概率,分区图像的得分越高则具有人脸的概率越高。
步骤25,根据分区图像的得分,判定分区图像是否具有人脸。
步骤26,在分区图像中具有人脸的情况下,获取人脸的位置。
使用分区图像的得分与得分阈值进行比较,若分区图像的得分高于得分阈值则表征分区图像具有人脸,若分区图像的得分小于或等于得分阈值则表征分区图像不具有人脸。
对于构成图像的所有分区图像进行上述是否具有人脸的判定之后,可以确定图像中具有人脸的分区图像,以及人脸特征点(如五官)在分区图像中的位置。之后,在对图像进行滤波处理时,对于具有人脸的分区图像,根据人脸特征点的位置,对分区图像中除人脸特征点以外的像素区域进行滤波处理;而对于不具有人脸的分区图像,对该分区图像的全部像素区域进行滤波处理。
此外,分类校准模型可采用查找表(英文:look-up table;缩写:LUT)与经典AdaBoost分类器相结合的lutAdaboost分类器,对图形库中的图像进行训练得到。包括得到分类校准模型中每个节点的分类属性信息和校准属性信息。
综上,上述提供的人脸识别方法,在利用分类校准模型对分区图像进行分类的同时也对分区图像的人脸特征点(如五官)进行了定位,对于分区图像中的人脸的识别和对分区图像中五官的定位可以通过对分类校准模型的迭代处理一并完成。例如,在分类处理判定不具备人脸时则退出对当前分区图像的处理并继续对下一分区图像进行迭代处理,如果在迭代处理(可以多次迭代)中总是判定分区图像具有人脸,则可以继续在对分区图像进行校准的迭代处理。通过利用分类校准模型实现了对分区图像的人脸识别和五官定位的一次性处理,这较相关技术首先基于特定模型进行人脸的识别,然后基于另一特定模型进行五官定位的方式,显著提升了人脸识别和五官定位的处理效率,能够高效地判定图像中是否具有人脸。
需要说明的一点是,由于BEEPS滤波算法本身具有保边去噪的滤波效果,其能够区分视频图像中的字幕和物体轮廓,并在滤波处理时不对这些信息做滤波处理,从而保护这些信息。而图像中的人脸区域可通过上述方式进行识别,从而在BEEPS滤波处理时对人脸区域不做滤波处理。
下述为本发明装置实施例,可以用于执行本发明方法实施例。对于本发明装置实施例中未披露的细节,请参照本发明方法实施例。
请参考图3,其示出了本发明一个实施例提供的视频编码中的码率控制装置的框图,该码率控制装置可以包括:获取模块310、提取模块320、滤波模块330 和编码模块340。
获取模块310,用于获取视频的码率信息,该码率信息包括视频在各个单位时间的码率。
提取模块320,用于根据获取模块310获取的码率信息,从视频中提取目标单位时间内的图像,该目标单位时间是指码率大于预设值的单位时间。
滤波模块330,用于对提取模块320提取的图像进行滤波处理。
编码模块340,用于对滤波模块330滤波处理后的图像进行编码,封装为视频文件。
综上所述,本实施例提供的码率控制装置,通过对视频中码率大于预设值的单位时间内的图像进行滤波处理,而后对滤波处理后的图像进行编码,封装为视频文件;解决了上述相关技术提供的码率控制方法存在的编码耗时过多,且增加视频播放失败的概率的问题。一方面,由于仅对码率较大部分的图像进行降码率处理,所以编码耗时很少;另一方面,避免了因切片丢失而导致视频播放失败的问题,视频播放失败的概率显著降低;此外,通过对码率较大部分的图像进行降码率处理,使得视频的峰值码率显著降低,从而达到减少视频播放卡顿、提高视频播放流畅度的目的。
请参考图4,其示出了本发明另一实施例提供的视频编码中的码率控制装置的框图,该码率控制装置可以包括:获取模块310、提取模块320、滤波模块330 和编码模块340。
获取模块310,用于获取视频的码率信息,该码率信息包括视频在各个单位时间的码率。
提取模块320,用于根据获取模块310获取的码率信息,从视频中提取目标单位时间内的图像,该目标单位时间是指码率大于预设值的单位时间。
滤波模块330,用于对提取模块320提取的图像进行滤波处理。
编码模块340,用于对滤波模块330滤波处理后的图像进行编码,封装为视频文件。
可选地,滤波模块330,包括:识别单元330a和滤波单元330b。
识别单元330a,用于识别提取模块320提取的图像的重要区域和非重要区域。
滤波单元330b,用于对识别单元330a识别出的非重要区域进行滤波处理。
在一种可能的实施方式中,识别单元330a,具体用于:从提取模块320提取的图像中提取目标元素,该目标元素包括人脸、字幕、物体轮廓中的至少一种;将目标元素确定为重要区域,并将图像中除目标元素之外的其它像素确定为非重要区域。
在另一种可能的实施方式中,识别单元330a,具体用于:识别提取模块320 提取的图像中的前景像素和背景像素;其中,前景像素为重要区域,背景像素为非重要区域。
可选地,滤波单元330b,具体用于:采用BEEPS滤波算法对识别单元330a 识别出的非重要区域进行滤波处理。
可选地,在所述目标元素包括人脸的情况下,所述从所述图像中提取目标元素,包括:
对所述图像进行分区处理得到分区图像;
对每个分区图像进行迭代处理;其中,所述迭代处理包括利用分类校准模型的第一分支的节点的分类属性信息对所述分区图像进行至少一次分类处理,以及在所述分类处理判定所述分区图像具有人脸时,利用所述分类校准模型的第二分支的节点的校准属性信息对所述分区图像的人脸特征点向量进行至少一次校准处理;
从所述分区图像提取特征向量;
根据所述特征向量以及所述迭代处理后得到的所述人脸特征点向量,确定所述分区图像的得分;
根据所述分区图像的得分,判定所述分区图像是否具有人脸;
在所述分区图像中具有所述人脸的情况下,获取所述人脸的位置。
综上所述,本实施例提供的码率控制装置,通过对视频中码率大于预设值的单位时间内的图像进行滤波处理,而后对滤波处理后的图像进行编码,封装为视频文件;解决了上述相关技术提供的码率控制方法存在的编码耗时过多,且增加视频播放失败的概率的问题。一方面,由于仅对码率较大部分的图像进行降码率处理,所以编码耗时很少;另一方面,避免了因切片丢失而导致视频播放失败的问题,视频播放失败的概率显著降低;此外,通过对码率较大部分的图像进行降码率处理,使得视频的峰值码率显著降低,从而达到减少视频播放卡顿、提高视频播放流畅度的目的。
此外,在本实施例中,还通过对提取的码率较大部分的图像进行识别,区分出重要区域和非重要区域,仅对非重要区域进行滤波处理,而对重要区域不做滤波处理,既达到了降低峰值码率的目的,也确保了重要区域的最佳显示效果。
此外,在本实施例中,还通过采用BEEPS滤波算法,达到了保边去噪的滤波效果。
需要说明的是,上述实施例提供的码率控制装置,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将设备的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的码率控制装置与码率控制方法的方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。
请参考图5,其示出了本发明一个实施例提供的电子设备的结构示意图。该电子设备用于实施上述实施例中提供的码率控制方法。具体来讲:
电子设备500包括:总线510,以及通过总线510通信的处理器520和存储器530。存储器530用于存储一个或者一个以上的指令,该指令被配置成由处理器520执行。上述一个或者一个以上的指令包括用于进行以下操作的指令:
获取视频的码率信息,该码率信息包括视频在各个单位时间的码率;
从视频中提取目标单位时间内的图像,该目标单位时间是指码率大于预设值的单位时间;
对上述图像进行滤波处理;
对滤波处理后的图像进行编码,封装为视频文件。
假设上述为第一种可能的实施方式,则在第一种可能的实施方式作为基础而提供的第二种可能的实施方式中,电子设备500的存储器中,还包含用于执行以下操作的指令:
识别图像的重要区域和非重要区域;
对非重要区域进行滤波处理。
在第二种可能的实施方式作为基础而提供的第三种可能的实施方式中,电子设备500的存储器中,还包含用于执行以下操作的指令:
从图像中提取目标元素,该目标元素包括人脸、字幕、物体轮廓中的至少一种;
将目标元素确定为重要区域,并将图像中除目标元素之外的其它像素确定为非重要区域。
在第三种可能的实施方式作为基础而提供的第四种可能的实施方式中,在目标元素包括人脸的情况下,电子设备500的存储器中,还包含用于执行以下操作的指令:
对图像进行分区处理得到分区图像;
对每个分区图像进行迭代处理;其中,迭代处理包括利用分类校准模型的第一分支的节点的分类属性信息对分区图像进行至少一次分类处理,以及在分类处理判定分区图像具有人脸时,利用分类校准模型的第二分支的节点的校准属性信息对分区图像的人脸特征点向量进行至少一次校准处理;
从分区图像提取特征向量;
根据特征向量以及迭代处理后得到的人脸特征点向量,确定分区图像的得分;
根据分区图像的得分,判定分区图像是否具有人脸;
在分区图像中具有人脸的情况下,获取人脸的位置。
在第二种可能的实施方式作为基础而提供的第四种可能的实施方式中,电子设备500的存储器中,还包含用于执行以下操作的指令:
识别图像中的前景像素和背景像素;
其中,前景像素为重要区域,背景像素为非重要区域。
在第二至第四任意一种可能的实施方式作为基础而提供的第五种可能的实施方式中,电子设备500的存储器中,还包含用于执行以下操作的指令:
采用BEEPS滤波算法对非重要区域进行滤波处理。
应当理解的是,在本文中使用的,除非上下文清楚地支持例外情况,单数形式“一个”(“a”、“an”、“the”)旨在也包括复数形式。还应当理解的是,在本文中使用的“和/或”是指包括一个或者一个以上相关联地列出的项目的任意和所有可能组合。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (8)

1.一种视频编码中的码率控制方法,其特征在于,所述方法包括:
获取视频的码率信息,所述码率信息包括所述视频在各个单位时间的码率;
从所述视频中提取目标单位时间内的图像,所述目标单位时间是指码率大于预设值的单位时间;
识别所述图像的重要区域和非重要区域;
对所述非重要区域进行滤波处理;
对滤波处理后的图像进行编码,封装为视频文件;
所述识别所述图像的重要区域和非重要区域,包括:
从所述图像中提取目标元素,所述目标元素包括人脸、字幕、物体轮廓中的至少一种;
将所述目标元素确定为所述重要区域,并将所述图像中除所述目标元素之外的其它像素确定为所述非重要区域;
在所述目标元素包括人脸的情况下,所述从所述图像中提取目标元素,包括:
对所述图像进行分区处理得到分区图像;
对每个分区图像进行迭代处理;其中,所述迭代处理包括利用分类校准模型的第一分支的节点的分类属性信息对所述分区图像进行至少一次分类处理,以及在所述分类处理判定所述分区图像具有人脸时,利用所述分类校准模型的第二分支的节点的校准属性信息对所述分区图像的人脸特征点向量进行至少一次校准处理;
从所述分区图像提取特征向量;
根据所述特征向量以及所述迭代处理后得到的所述人脸特征点向量,确定所述分区图像的得分;
根据所述分区图像的得分,判定所述分区图像是否具有人脸;
在所述分区图像中具有所述人脸的情况下,获取所述人脸的位置。
2.根据权利要求1所述的方法,其特征在于,所述识别所述图像的重要区域和非重要区域,包括:
识别所述图像中的前景像素和背景像素;
其中,所述前景像素为所述重要区域,所述背景像素为所述非重要区域。
3.根据权利要求1至2任一所述的方法,其特征在于,所述对所述非重要区域进行滤波处理,包括:
采用双指数边缘保留平滑BEEPS滤波算法对所述非重要区域进行滤波处理。
4.一种视频编码中的码率控制装置,其特征在于,所述装置包括:
获取模块,用于获取视频的码率信息,所述码率信息包括所述视频在各个单位时间的码率;
提取模块,用于从所述视频中提取目标单位时间内的图像,所述目标单位时间是指码率大于预设值的单位时间;
滤波模块,包括:识别单元和滤波单元;
所述识别单元,用于识别所述图像的重要区域和非重要区域;
所述滤波单元,用于对所述非重要区域进行滤波处理;
编码模块,用于对滤波处理后的图像进行编码,封装为视频文件;
所述识别单元,具体用于:从所述图像中提取目标元素,所述目标元素包括人脸、字幕、物体轮廓中的至少一种;将所述目标元素确定为所述重要区域,并将所述图像中除所述目标元素之外的其它像素确定为所述非重要区域;
在所述目标元素包括人脸的情况下,所述识别单元,还具体用于:对所述图像进行分区处理得到分区图像;对每个分区图像进行迭代处理;其中,所述迭代处理包括利用分类校准模型的第一分支的节点的分类属性信息对所述分区图像进行至少一次分类处理,以及在所述分类处理判定所述分区图像具有人脸时,利用所述分类校准模型的第二分支的节点的校准属性信息对所述分区图像的人脸特征点向量进行至少一次校准处理;从所述分区图像提取特征向量;根据所述特征向量以及所述迭代处理后得到的所述人脸特征点向量,确定所述分区图像的得分;根据所述分区图像的得分,判定所述分区图像是否具有人脸;在所述分区图像中具有所述人脸的情况下,获取所述人脸的位置。
5.根据权利要求4所述的装置,其特征在于,所述识别单元,具体用于:
识别所述图像中的前景像素和背景像素;
其中,所述前景像素为所述重要区域,所述背景像素为所述非重要区域。
6.根据权利要求4至5任一所述的装置,其特征在于,所述滤波单元,具体用于:
采用双指数边缘保留平滑BEEPS滤波算法对所述非重要区域进行滤波处理。
7.一种电子设备,其特征在于,所述电子设备包括处理器和存储器,所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由所述处理器加载并执行以实现如权利要求1至3任一所述的视频编码中的码率控制方法。
8.一种计算机可读存储介质,其特征在于,所述存储介质中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由处理器加载并执行以实现如权利要求1至3任一所述的视频编码中的码率控制方法。
CN201510657604.8A 2015-10-13 2015-10-13 视频编码中的码率控制方法和装置、电子设备以及计算机可读存储介质 Active CN106572351B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510657604.8A CN106572351B (zh) 2015-10-13 2015-10-13 视频编码中的码率控制方法和装置、电子设备以及计算机可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510657604.8A CN106572351B (zh) 2015-10-13 2015-10-13 视频编码中的码率控制方法和装置、电子设备以及计算机可读存储介质

Publications (2)

Publication Number Publication Date
CN106572351A CN106572351A (zh) 2017-04-19
CN106572351B true CN106572351B (zh) 2019-11-15

Family

ID=58508885

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510657604.8A Active CN106572351B (zh) 2015-10-13 2015-10-13 视频编码中的码率控制方法和装置、电子设备以及计算机可读存储介质

Country Status (1)

Country Link
CN (1) CN106572351B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107277520B (zh) * 2017-07-11 2020-05-12 中国科学技术大学 帧内预测的码率控制方法
WO2021062624A1 (zh) * 2019-09-30 2021-04-08 深圳市大疆创新科技有限公司 可移动平台的图像处理方法、装置、可移动平台及介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002247576A (ja) * 2001-02-15 2002-08-30 Sharp Corp 動画像符号化方法
CN101945281A (zh) * 2010-09-10 2011-01-12 中兴通讯股份有限公司 视频编码的滤波方法及装置
CN102281439A (zh) * 2011-06-16 2011-12-14 杭州米加科技有限公司 流媒体视频图像预处理方法
CN102724502A (zh) * 2012-06-11 2012-10-10 华为技术有限公司 一种视频编码中码率的控制方法及装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002247576A (ja) * 2001-02-15 2002-08-30 Sharp Corp 動画像符号化方法
CN101945281A (zh) * 2010-09-10 2011-01-12 中兴通讯股份有限公司 视频编码的滤波方法及装置
CN102281439A (zh) * 2011-06-16 2011-12-14 杭州米加科技有限公司 流媒体视频图像预处理方法
CN102724502A (zh) * 2012-06-11 2012-10-10 华为技术有限公司 一种视频编码中码率的控制方法及装置

Also Published As

Publication number Publication date
CN106572351A (zh) 2017-04-19

Similar Documents

Publication Publication Date Title
US11776131B2 (en) Neural network for eye image segmentation and image quality estimation
US11830230B2 (en) Living body detection method based on facial recognition, and electronic device and storage medium
CN105518710B (zh) 视频检测方法、视频检测系统以及计算机程序产品
CN112906545A (zh) 一种针对多人场景的实时动作识别方法及系统
WO2010043771A1 (en) Detecting and tracking objects in digital images
CN115082966B (zh) 行人重识别模型训练方法、行人重识别方法、装置和设备
CN111539272B (zh) 基于联合特征被动检测ai换脸视频的方法及系统
CN103366390A (zh) 终端及图像处理方法和装置
CN109934112A (zh) 一种人脸对齐方法和相机
CN106572351B (zh) 视频编码中的码率控制方法和装置、电子设备以及计算机可读存储介质
Oh et al. Intrinsic two-dimensional local structures for micro-expression recognition
Kratzwald et al. Improving video generation for multi-functional applications
CN106548114B (zh) 图像处理方法、装置及计算机可读介质
Kumar et al. SVM based adaptive Median filter design for face detection in noisy images
CN113516592A (zh) 图像处理方法、模型训练方法、装置及设备
Ivasic-Kos et al. Person de-identification in activity videos
CN113610736B (zh) 基于循环生成对抗残差网络及qtp损失项的黑夜图像增强方法及系统
CN109886186A (zh) 一种人脸识别方法及装置
CN109451318A (zh) 便于vr视频编码的方法、装置、电子设备及存储介质
CN109559290A (zh) 一种深度非对称跳跃连接的图像降噪方法
CN111539263B (zh) 一种基于聚合对抗网络的视频人脸识别方法
CN108986156A (zh) 深度图处理方法及装置
Huang et al. Creating depth map from 2D scene classification
CN109040747B (zh) 基于卷积自编码器的立体图像舒适度质量评价方法及系统
CN116711301A (zh) 虚拟视点生成、渲染、解码方法及装置、设备、存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant