WO2020103384A1

WO2020103384A1 - 视频编码方法、装置、电子设备及计算机可读存储介质

Info

Publication number: WO2020103384A1
Application number: PCT/CN2019/082431
Authority: WO
Inventors: 吴辉; 詹国松
Original assignee: 浙江宇视科技有限公司
Priority date: 2018-11-19
Filing date: 2019-04-12
Publication date: 2020-05-28
Also published as: US11838507B2; US20210409713A1; CN111200734A; EP3886436A4; EP3886436A1; CN111200734B

Abstract

本文提供一种视频编码方法、装置、电子设备和计算机可读存储介质，所述方法包括：获取待编码图像中每个宏块的状态信息；依据每个宏块的状态信息，将所述待编码图像划分为多个状态区域；按照预设量化参数值表，确定出所述待编码图像中每个状态区域的量化参数调整值；获取所述待编码图像的参考帧图像内每个宏块的量化参数编码值；确定出所述待编码图像内每个宏块的量化参数编码值；对所述待编码图像进行压缩编码。

Description

视频编码方法、装置、电子设备及计算机可读存储介质

本公开要求在2018年11月19日提交中国专利局、申请号为201811376866.7的中国专利申请的优先权，该申请的全部内容通过引用结合在本公开中。

技术领域

本文涉及视频处理技术领域，例如涉及一种视频编码方法、装置、电子设备及计算机可读存储介质。

背景技术

随着视频处理技术的发展，基于网络通信技术的视频应用，例如视频监控、视频会议、视频教育培训、视频直播等，已经成为人们学习、工作、生活等中的一部分。

视频图像格式的数字化和高清化，使得图像的清晰度得到全面的提升，视频图像格式已经从主流的1080P分辨率开始向5M、8M、甚至12M分辨率的超高清发展，这就对网络传输带宽有了更高的要求。但是，目前网络基础设施的带宽升级速度远低于视频图像格式的发展速度，如何在有限的网络传输带宽条件下实现更高分辨率的视频流传输，是研究人员亟待解决的技术问题。

发明内容

本文提供了一种视频编码方法、装置、电子设备及计算机可读存储介质，能够降低视频流编码码率的同时保证图像质量。

本文提供了一种视频编码方法，所述方法包括：获取待编码图像，并获取所述待编码图像中每个宏块的状态信息；依据每个宏块的状态信息，将所述待编码图像划分为多个状态区域；按照预设量化参数值表，确定出所述待编码图像中每个状态区域的量化参数调整值；获取所述待编码图像的参考帧图像内每个宏块的量化参数编码值；依据所述参考帧图像内每个宏块的量化参数编码值、以及所述待编码图像中每个状态区域的量化参数调整值，确定出所述待编码图像内每个宏块的量化参数编码值；利用所述待编码图像内每个宏块的量化参数编码值，对所述待编码图像进行压缩编码。

本文还提供了一种视频编码装置，所述装置包括状态信息统计模块、状态区域划分模块、量化参数调整值确定模块、量化参数编码值获取模块、量化参数编码值确定模块及压缩编码模块。其中，状态信息统计模块配置为获取待编码图像，并获取所述待编码图像中每个宏块的状态信息；状态区域划分模块配置为依据每个宏块的状态信息，将所述待编码图像划分为多个状态区域；量化参数调整值确定模块配置为按照预设量化参数值表，确定出所述待编码图像中每个状态区域的量化参数调整值；量化参数编码值获取模块配置为获取所述待编码图像的参考帧图像内每个宏块的量化参数编码值；量化参数编码值确定模块配置为依据所述参考帧图像内每个宏块的量化参数编码值、以及所述待编码图像中每个状态区域的量化参数调整值，确定出所述待编码图像内每个宏块的量化参数编码值；压缩编码模块配置为利用所述待编码图像内每个宏块的量化参数编码值，对所述待编码图像进行压缩编码。

本文还提供了一种电子设备，包括：

至少一个处理器；

存储器，设置为存储至少一个程序，

当所述至少一个程序被所述至少一个处理器执行，使得所述至少一个处理器实现如上所述的方法。

本文还提供了一种计算机可读存储介质，所述计算机可读存储介质上存储有计算机程序，所述计算机程序被处理器执行时实现如上所述的方法。

附图说明

图1示出了本文实施例提供的视频编码设备的方框示意图。

图2示出了本文实施例提供的视频编码方法流程图。

图3示出了本文实施例提供的GOP第一编码方式示例图。

图4示出了本文实施例提供的GOP第二编码方式示例图。

图5示出了本文实施例提供的视频编码装置的方框示意图。

图标：100-视频编码设备；101-处理器；102-存储器；103-总线；104-通信接口；105-视频编码器；200-视频编码装置；201-状态信息统计模块；202-状态区域划分模块；203-QP调整值确定模块；204-QP编码值获取模块；205-QP编码值确定模块；206-压缩编码模块；207-GOP长度计算模块；208-GOP调整模块；209-第一执行模块；210-第二执行模块；211-第三执行模块。

具体实施方式

相对于相关技术，本文实施例提供的一种视频编码方法及装置，通过待编码图像中每个宏块的状态信息将待编码图像划分为多个状态区域，并按照预设量化参数值表，确定出待编码图像中每个状态区域的量化参数调整值；依据待编码图像中每个状态区域的量化参数调整值和参考帧图像内每个宏块的量化参数编码值，确定出待编码图像内每个宏块的量化参数编码值；利用待编码图像内每个宏块的量化参数编码值对待编码图像进行压缩编码。本文实施例在压缩编码之前，根据每个宏块的状态设置每个宏块的量化参数编码值，这样在后续压缩编码的时候，能够对每个宏块进行与其状态相适应的压缩编码处理，例如可以将变化不大的宏块的质量降低，这样可以最大程度降低数据量，在保证图像质量的同时有效降低了视频流编码码率。

在进行视频编码时，针对视频关键信息重构和传输带宽限制问题，可以采用ROI(Region Of Interest，感兴趣区域)视频编码来实现数据压缩和关键信息高质量保存之间的折衷，具体来说，ROI视频编码通过选择画面中感兴趣的区域，对选择的感兴趣区域进行高质量无损编码，对未被选择的其他区域降低码率和图像质量进行标准清晰度视频压缩，从而利于节省网络带宽占用和视频存储空间。与相关的固定码率编码方法相比，ROI视频编码可以在降低视频码流的同时提升同码率下的画质。

但是，由于ROI是一个矩形区域，无法做过于强烈的控制，否则会造成解码后的视频图像中感兴趣区域与其他区域画面有严重的层次感，具体来说，ROI视频编码是基于矩形分界对待编码图像中的感兴趣区域进行细分并进行量化参数控制，而这通常造成码流中的残差系数呈块状分布，解码出来的视频图像中感兴趣区域与其他区域画面也就通常存在严重的层次感。另外，单纯的ROI控制并不能在大幅度减低码率的同时保证高质量的整体效果，特别是当运动物体多的情况下，ROI视频编码不能在保证质量的同时，很好的降低码率。

本文提出了一种视频编码方法及装置，在压缩编码之前，根据每个宏块的状态设置每个宏块的量化参数(Quantizer Parameter，QP)编码值(也即QP编码值，以此类推，在下文中，QP值即为量化参数值，QP值表即为量化参数值表，QP调整值即为量化参数调整值，对此不作赘述)，这样在后续压缩编码的时候，能够对每个宏块进行与其状态相适应的压缩编码处理，例如可以将变化不大的宏块的质量降低，这样可以最大程度降低数据量，在保证图像质量的同时有效降低了视频流编码码率，下面进行详细描述。

请参照图1，图1示出了本文实施例提供的视频编码设备100的方框示意图。视频编码设备100包括处理器101、存储器102、总线103、通信接口104和视频编码器105，所述处理器101、存储器102和通信接口104通过总线103连接，视频编码器105和处理器101相配合。

作为一种实施方式，视频编码设备100可以用于对现场视频录像获得的视频帧序列进行压缩编码处理，视频编码设备100可以是前端摄像装置，如监控摄像机、网络摄像头、民用级摄像机、专业级摄像机等，也可以是嵌入式硬盘录像机(Digital Video Recorder，DVR)，还可以是前端摄像装置或者嵌入式硬盘录像机中涉及视频编码的硬件电路结构。

作为另一种实施方式，视频编码设备100还可以用于对视频模拟信号进行采样和压缩编码处理，视频编码设备100可以是PC式硬盘录像机、具有视频采集卡的计算机设备、PC式硬盘录像机或具有视频采集卡的计算机设备中涉及视频编码的硬件部分与软件模块的结合体等。

作为又一种实施方式，视频编码设备100还可以用于对编码后的视频数据文件先解码再编码成新的码流的视频流数据或者视频数据文件，所述视频编码设备100可以是视频服务器、网络视频录像机(Network Video Record，NVR)、图形工作站、PC机、笔记本电脑等。

存储器102可能包括高速随机存取存储器(RAM：Random Access Memory)，也可能还包括非不稳定的存储器(non-volatile memory)，例如至少一个磁盘存储器。通过至少一个通信接口104(可以是有线或者无线)实现该视频编码设备100与至少一个其它网元之间的通信连接。

总线103可以是ISA总线、PCI总线或EISA总线等。图1中仅用一个双向箭头表示，但并不表示仅有一根总线或一种类型的总线。

其中，存储器102用于存储程序，例如图5所示的视频编码装置200。视频编码装置200包括至少一个可以软件或固件(firmware)的形式存储于所述存储器102中或固化在所述视频编码设备100的操作系统(operating system，OS)中的软件功能模块。所述处理器101在接收到执行指令后，执行所述程序以实现下述实施例揭示的视频编码方法。

处理器101可能是一种集成电路芯片，具有信号的处理能力。在实现过程中，上述方法的每步骤可以通过处理器101中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器101可以是通用处理器，包括中央处理器(Central Processing Unit，简称CPU)、网络处理器(Network Processor，简称NP)等；还可以是数字信号处理器(DSP)、专用集成电路(ASIC)、现成可编程门阵列(FPGA)或者其它可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。

视频编码器105用于对视频帧序列进行压缩编码形成视频流数据，视频编码器105可以是，但不限于视频编码芯片、视频编码硬件装置、视频编码软件模块等。就实现形式而言，视频编码器105既可以是单独的芯片、装置、软件模块，也可以是和视频解码器集成在一起的芯片、装置、软件模块。

本文实施例还提供了一种电子设备，所述电子设备为上述视频编码设备100。

本文实施例还提供了一种计算机可读存储介质，所述计算机可读存储介质上存储有计算机程序，计算机程序被处理器101执行时实现下述实施例揭示的视频编码方法。

第一实施例

本实施例以视频编码设备100对准监控典型场景捕获的视频帧序列为例，对本文实施例提供的视频编码方法进行说明。

监控典型场景是摄像过程中目标场景相对固定的场景，在监控典型场景下获得的视频帧画面中，保持不动的背景区域占据较大的画面区域，可通过运动检测将运动区域和背景区域分离。同时，一个时间周期内，监控典型场景中的运动物体的种类保持相对的稳定，例如当监控典型场景为楼宇监控时，监控典型场景中的运动物体主要是行人和进出车辆；当监控典型场景为交通道路时，监控典型场景中的运动物体主要是车辆。在日常工作和生活中，视频监控、视频会议、视频直播、视频教育培训、视频交互通信均属于监控典型场景。

在实施本实施例提供的视频编码方法之前，需要在实验室环境下对视频编码设备100进行不同曝光增益测试，来得到该视频编码设备100在不同曝光增益下的QP值表。具体的测试方法为：

使视频编码设备100对准监控典型场景，并给予不同程度的光照，在光照充足的情况下，调整画面中每个宏块的QP值，并对画面中的场景进行主观评价，在画面的运动低频区域、运动高频区域、静止低频区域及静止高频区域中选取出较好、一般、较差的区域，并记录每个区域对应的QP值、以及视频编码设备100的曝光值和增益值，假设QP _较好＝25～51、QP _一般＝30～51、QP _较差＝35～51，主观评价画面中运动低频区域较好、运动高频区域和静止低频区域一般，静止高频区域较差，则取运动低频区域QP _较好＝25、运动高频区域和静止低频区域QP _一般＝35、静止高频区域QP _较差＝45；

然后反复执行上述过程，直到画面亮度降至最低，得到该视频编码设备100在不同测试曝光增益值下的QP取值表，另外，在测试过程中记录无噪声区间、低噪声区间、高噪声区间下的增益快门信息及噪声方差。这样得到的QP取值表包括多个测试曝光增益值、以及与每个测试曝光增益值对应的运动高频区域QP值、运动低频区域QP值、静止高频区域QP值、静止低频区域QP值，每个测试曝光增益值均包括曝光值和增益值。

请参照图2，图2示出了本文实施例提供的视频编码方法流程图。该视频编码方法以图像组(Group of Pictures，GOP)为编码结构单位对视频帧序列进行顺次压缩，GOP包括起始位置的关键帧和关键帧后面的预测帧(以此类推，在下文中，GOP编码结构即为图像组编码结构，GOP长度即为图像组长度，GOP调整模块即为图像组调整模块，对此不作赘述)，该视频编码方法包括以下步骤：

步骤S101，获取待编码图像，并获取待编码图像中每个宏块的状态信息。

在本实施例中，待编码图像为压缩编码之前的数据，待编码图像可以是I帧、P帧或B帧，其中，I帧为GOP编码结构中的关键帧，关键帧采用全帧压缩编码；P帧为前向预测编码帧，前向预测编码帧采用本帧的前一I帧或P帧作为参考帧，编码时只记录本帧与参考帧之间的差值数据，解码时在参考帧的基础上叠加本帧与参考帧之间的差值数据获得完整的P帧视频图像；B帧为双向预测编码帧，双向预测编码帧采用本帧的前一帧和后一帧作为参考帧，编码时只记录本帧与参考帧之间的差值数据，解码时在前一帧和后一帧的基础上叠加本帧与前一帧和后一帧的差值数据获得完整的B帧视频图像。

在本文实施例中，宏块为视频编码的基本单位，一个宏块由一个亮度像素块和附加的两个色度像素块组成，一个视频帧序列中每帧图像分割的宏块数量相同，且每个宏块的行、列分别包含的像素个数均是4的倍数，例如宏块大小可以为32×32、16×16、4×4等。

在本文实施例中，获取到待编码图像之后，需要获取待编码图像中每个宏块的状态信息，状态信息包括运动检测信息、亮度信息及噪声方差信息，宏块的大小可以是16×16，同时记录待编码图像的当前曝光增益值。运动检测信息可以通过将待编码图像与参考帧图像进行对比来确定，如果待编码图像为I帧，则参考帧图像可以是前一个I帧；如果待编码图像为P帧，则参考帧图像可以是本帧的前一I帧或P帧；如果待编码图像为B帧，则参考图像可以是本帧的前一帧和后一帧。

步骤S102，依据每个宏块的状态信息，将待编码图像划分为多个状态区域。

在本实施例中，获取待编码图像中每个宏块的状态信息之后，按照每个宏块的状态信息，将待编码图像划分为多个状态区域，多个状态区域包括运动高频明区、运动低频明区、运动高频暗区、运动低频暗区、运动高频过暗区、运动低频过暗区、静止高频明区、静止低频明区、静止高频暗区、静止低频暗区、静止高频过暗区及静止低频过暗区。

将待编码图像划分为多个状态区域的方法可以包括：

依据运动检测信息，将待编码图像划分为运动区域与静止区域。由于噪声会对运动检测信息产生影响，因此划分运动区域与静止区域所用的区分阈值可以根据待编码图像的当前曝光增益值进行灵活调整，也就是说，待编码图像的当前曝光增益值在对应无噪声区间、低噪声区间和高噪声区间时，划分运动区域与静止区域所用的阈值都不相同，需要灵活调整，以此来抵消噪声对运动检测信息的影响，提升了每个监控场景下运动区域检测的精度；

依据亮度信息，将运动区域划分为运动明区、运动暗区及运动过暗区，并将静止区域划分为静止明区、静止暗区及静止过暗区。由于画面亮度的区分阈值不依赖于增益快门，故依据亮度信息进行区域划分时，不需要调整区分阈值；

依据噪声方差信息，将运动明区、运动暗区、运动过暗区、静止明区、静止暗区及静止过暗区分别划分为运动高频明区、运动低频明区、运动高频暗区、运动低频暗区、运动高频过暗区、运动低频过暗区、静止高频明区、静止低频明区、静止高频暗区、静止低频暗区、静止高频过暗区及静止低频过暗区。由于噪声同样会对噪声方差信息产生影响，故依据噪声方差信息进行区域划分时，同样需要根据增益快门对区分阈值进行灵活调整，以此来抵消噪声对噪声方差信息的影响，提升了每个监控场景下画面高低频区域检测的精度。

具体地，可以依据噪声方差信息，将运动明区划分为运动高频明区和运动低频明区，将运动暗区划分为运动高频暗区和运动低频暗区，将运动过暗区划分为运动高频过暗区和运动低频过暗区，将静止明区划分为静止高频明区和静止低频明区，将静止暗区划分为静止高频暗区和静止低频暗区，并将静止过暗区划分为静止高频过暗区和静止低频过暗区。

步骤S103，按照预设QP值表，确定出待编码图像中每个状态区域的QP调整值。

在本实施例中，将待编码图像划分为多个状态区域之后，需要根据在实验室环境下对视频编码设备100进行不同曝光增益测试得到的预设QP值表，确定出待编码图像中每个状态区域的QP调整值，具体的确定过程可以包括：获取待编码图像的当前曝光增益值；将当前曝光增益值与多个测试曝光增益值进行一一对比，从多个测试曝光增益值中确定出与当前曝光增益值一致的目标曝光增益值；依据目标曝光增益值对应的运动高频区域QP值、运动低频区域QP值、静止高频区域QP值和静止低频区域QP值，确定出待编码图像中每个状态区域的QP调整值。

在本实施例中，当待编码图像为关键帧即I帧时，需要对I帧的最小QP编码值进行限制，最小QP编码值取预设QP值表中目标曝光增益值对应的QP _较好，这样限制可以降低码率同时满足用户需求。

当待编码图像为预测帧即P帧或B帧时，依据预设QP值表中目标曝光增益值对应的运动高频区域QP值、运动低频区域QP值、静止高频区域QP值和静止低频区域QP值，确定每个状态区域QP调整值的方法可以是：由于预设QP值表中的每个测试曝光增益值均对应一个噪声区间，噪声区间可以是低噪声区间、中噪声区间或高噪声区间，中噪声区间可以是低噪声区间和高噪声区间的过渡区间，故先确定目标曝光增益值对应的噪声区间，再按照噪声区间确定每个状态区域QP调整值，具体包括：

当目标曝光增益值对应低噪声区间时，依据目标曝光增益值对应的运动高频区域QP值、运动低频区域QP值、静止高频区域QP值和静止低频区域QP值，按照第一预设公式确定出待编码图像中每个状态区域的QP调整值。第一预设公式可以是：

QP＝QP1+QP2+QP3+QP4

当目标曝光增益值对应中噪声区间时，依据所述目标曝光增益值对应的运动高频区域QP值、运动低频区域QP值、静止高频区域QP值和静止低频区域QP值，按照第二预设公式确定出待编码图像中每个状态区域的QP调整值。第二预设公式可以是：

QP＝QP1+QP2+QP3+QP4

当目标曝光增益值对应高噪声区间时，依据目标曝光增益值对应的运动高频区域QP值、运动低频区域QP值、静止高频区域QP值和静止低频区域QP值，按照第三预设公式确定出待编码图像中每个状态区域的QP调整值。第三预设公式可以是：

QP＝QP1+QP2+QP3+QP4

其中，在第一预设公式、第二预设公式和第三预设公式中，QP1中的QP _较好、QP _一般和QP _较差可以是预设QP值表中目标曝光增益值对应的运动高频区域QP值、运动低频区域QP值、静止高频区域QP值和静止低频区域QP值中较好、一般和较差的QP取值；QP2中的静止中频区域为静止高频区域和静止低频区域之间的过渡区，a、b均可以为目标曝光增益值对应的静止高频区域QP值和静止低频区域QP值之间的差值，用户也可以根据实际需要灵活调整，在此不再赘述；QP3中的运动、特征及ROI中频区域为运动、特征及ROI高频区域与运动、特征及ROI低频区域之间的过渡区，a为目标曝光增益值对应的运动高频区域QP值和运动低频区域QP值之间的差值；QP4中的

每个状态区域QP调整值根据QP＝QP1+QP2+QP3+QP4确定出来。

需要说明的是，a、b可以不取静止高频区域QP值和静止低频区域QP值之间的差值，而预设为其他的取值。所述特征区域可根据实际需要进行设置，举例而言，可以将具有被识别出有人脸等特征的区域作为所述特征区域。所述理论码率为所述待编码图像的码率的理论值，所述理论码率可以在所述步骤S102之后(即在将待编码图像划分为多个状态区域之后)按照预设的计算方法计算得到，所述实际码率可以为，由所述视频编码器105对所述待编码图像进行预先的实际编码而得到的码率。在第一预设公式中，静止过暗区的QP1的取值可以根据实际需要设置，静止过暗区的QP1的取值需要使不等式QP＞QP _较差成立；在第二预设公式中，静止过暗区的QP1的取值可以根据实际需要设置，静止过暗区的QP1的取值需要使不等式QP＞2*QP _较差－QP _一般成立。

在第一预设公式、第二预设公式和第三预设公式中，SKIP宏块编码，是指编码时不将该宏块的像素残差和运动矢量残差写入码流，只对该宏块进行SKIP宏块标识，解码时采用近似替代的恢复办法通过参考帧恢复本帧本宏块的像素点。对于P帧，SKIP宏块为P-SKIP宏块，对于B帧，SKIP宏块为B-SKIP宏块。在视频编码过程中，可以通过调整帧间SKIP策略来降低编码码率。

具体来说，一般情况下静止区域的P帧宏块一般会使用P_SKIP宏块编码，但是在不同的曝光增益值下，由于噪声的影响可能会使用P块或者I块编码，这样就会使码率增大。为了利于解决这一问题，可以对静止过暗区强制大比例使用P_SKIP宏块编码来主动降低码率。

也就是说，在确定待编码图像中每个状态区域的QP调整值的过程中，将暗区的QP调整值提升为预设QP值表中目标曝光增益值对应的静止高频区域QP值和静止低频区域QP值中较差的QP取值；对过暗区的QP调整值继续提升，或者直接采用P_SKIP宏块编码进行提升，以此来降低码率，以得到的视频编码码率达到预期标准为宜。

另外，如果待编码图像的参考帧图像为P帧，该参考帧图像静止区域的单位宏块平均码率高于预设阈值，且待编码图像的对应区域也为静止区域，则增加待编码图像中静止区域每个宏块的QP值并增加P_SKIP宏块编码比例。具体来说，待编码图像静止区域中每个宏块的QP编码值，可以在参考帧图像中对应的宏块QP编码值的基础上增加c得到，c的计算公式为

B帧的帧间SKIP策略与P帧类似，在此不再赘述。

步骤S104，获取待编码图像的参考帧图像内每个宏块的QP编码值。

在本实施例中，为了确定待编码图像内每个宏块的宏块信息QP编码值，还需要获取待编码图像的参考帧图像内每个宏块的宏块信息，每个宏块的大小均可以是16×16，宏块信息可以包括，但不限于码率、宏块类型、QP编码值等，并记录参考帧图像对应的曝光增益值。需要说明的是，步骤S104的执行不限于在步骤S103之后，也可以在步骤S101之前执行，在此不做限定。

步骤S105，依据参考帧图像内每个宏块的QP编码值、以及待编码图像中每个状态区域的QP调整值，确定出待编码图像内每个宏块的QP编码值。

在本实施例中，当待编码图像为关键帧，即I帧时，用户可以自行确定待编码图像中每个宏块的QP编码值，只需确保待编码图像中最小QP编码值取预设 QP值表中目标曝光增益值对应的QP _较好即可。

当待编码图像为预测帧，即P帧或B帧时，将参考帧图像内每个宏块的QP编码值与待编码图像中每个状态区域的QP调整值进行叠加，就能得到待编码图像内每个宏块的QP编码值。

在具体实现中，本文实施例提供的视频编码方法可以包括步骤：对以图像组为编码结构单位对视频帧序列进行顺次压缩，所述图像组包括起始位置的关键帧和所述关键帧后面的预测帧。其中，对单个视频帧的压缩，可以通过所述步骤S101至S105实现。

步骤S106，利用待编码图像内每个宏块的QP编码值，对待编码图像进行压缩编码。

在本文实施例中，确定出待编码图像内每个宏块的QP编码值之后，依据每个宏块的QP编码值，对待编码图像进行压缩编码。待编码图像压缩编码的过程可以是：基于待编码图像与参考帧图像的差值生成残差系数，通过待编码图像内每个宏块的QP编码值控制残差系数的大小，以此来降低编码码率。

本实施例以GOP为编码结构单位对视频帧序列进行顺次压缩，GOP包括起始位置的关键帧和关键帧后面的预测帧，GOP编码结构可以是视频编码技术领域中的任意一种GOP编码结构，本实施例中以IPPP编码结构为例对技术方案进行详细介绍。IPPP编码结构中，I帧为全帧压缩帧，视频帧序列中的I帧间隔越小，GOP长度越小，视频编码的码率越大。因此，为了从编码结构上有效降低视频编码码率，本文实施例还包括步骤S107～S108。

步骤S107，获取待编码图像的运动矢量，并依据运动矢量计算待编码图像的GOP长度。

在本实施例中，不同的曝光增益值下，根据待编码图像的运动矢量对GOP及待编码图像的GOP长度进行调整。通常，清晰的I帧占总码率的50％左右，这是比较大的损耗，同时，目前监控领域通常设置为2秒左右一个I帧，主要是为了提升抗网络丢包的能力，但是这种设置严重制约了视频编码压缩率的提升。因此，需要将GOP增大，具体来说，GOP需要依据待编码图像的运动矢量及对应的曝光增益值进行增大，这样可以利于有效地提升视频编码的压缩率。

在本实施例中，依据待编码图像的运动矢量，利用GOP长度公式

计算出待编码图像的GOP长度，其中，GOPSIZE为待编码图像的GOP长度，GOPSIZE _max为GOP长度的最大值，GOPSIZE _min为GOP长度的最小值，MV _cur为待编码图像的运动矢量，MV _min为运动矢量最小值，MV _max为运动矢量最大值。GOPSIZE _max和GOPSIZE _min由用户根据待编码图像的曝光增益值进行调整，待编码图像的GOP长度调整之后，GOP编码结构中I帧的间隔可能会是原本的多倍，所以还可以进一步优化抗网络丢包能力，具体请参照步骤S108。

步骤S108，依据待编码图像的GOP长度对GOP进行调整，调整后的GOP包括一帧关键帧及至少一个预测帧编码段，其中，预测帧编码段包括一帧参考预测帧及多帧普通预测帧，参考预测帧参考关键帧进行编码，普通预测帧在预测帧编码段内进行逐帧参考编码。

在具体实现中，在同一预测帧编码段内，每个普通预测帧均为参考该普通预测帧的前一帧进行编码，其中，该普通预测帧的前一帧可能为参考预测帧，也可能为其他普通预测帧。

请参照图3，调整后的GOP包括一帧关键帧(即I帧)及至少一个预测帧编码段，预测帧编码段包括一帧参考预测帧(例如，P1帧等)及多帧普通预测帧(例如，P11帧、P12帧、P1n帧等)，参考预测帧参考关键帧(即I帧)进行编码，普通预测帧在预测帧编码段内进行逐帧参考编码。参考预测帧每2秒出现一次，以保证在某个P帧丢失的情况下能在2秒之内恢复图像。

GOP编码时，参考预测帧参考关键帧(即I帧)编码，参考预测帧后的普通预测帧逐帧参考编码，关键帧(即I帧)用于保证参考预测帧丢失后的视频图像恢复，参考预测帧用于保证普通预测帧丢失后的视频图像恢复，从而利于在保证解码后的视频图像质量的情况下，将GOP增大多倍，有效降低视频编码的码率。

同时，如果出现I帧数据丢包，则可以通过强制I帧来解决，这样可以在一定程度上减少GOP增大带来的影响。

步骤S109，获取调整后的GOP的控制信息，并将控制信息填充于关键帧的补充增强信息(Supplemental Enhancement Information，SEI)中，以在解码回放时依据控制信息对调整后的GOP进行解码。

在本实施例中，由于图3所示的GOP编码结构进行了调整，因此需要对解码端也进行控制优化，当回放点击时间对应一个普通预测帧时，需要控制该普通预测帧之间的其它视频帧进行解码但不显示，例如，回放点击时间为P22帧，则需要控制P22帧前的I帧、P2帧及P21帧进行解码但不显示，其中，P2为P21前面且与P21相邻的一帧，P21为P22前面且与P22相邻的一帧。因此，视频编码过程中可以通过SEI(Supplemental Enhancement Information，补充增强信息)携带设置好的控制信息，这样利于确保回放的时候不会出现播放画面跳跃的问题。

步骤S110，获取调整后的GOP中关键帧的运动信息，并在运动信息大于预设运动阈值时，重新申请关键帧。在本文实施例中，由于高运动量的帧作为参考帧会使得后续所有参考I帧的P帧变大，当I帧的运动检测信息大于预设运动阈值(例如，50％)时，也就是I帧中50％以上的画面是运动区域时，需要重新申请I帧。

步骤S111，当待编码图像中无运动信息时，待编码图像的GOP包括一帧关键帧及至少一个预测帧，每个预测帧均参考所述关键帧进行编码。

在本实施例中，图3所示的GOP编码结构是满帧情况下的优化，在满帧情况下，视频编码设备100可以达到最大帧率，一般一秒钟25帧～30帧。但是，实际监控应用中很多情况下是没有运动物体的，此时可以根据运动检测信息对编码帧率进行调整。具体的调整方法可以是：有运动信息时采用图3所示的GOP编码结构进行满帧率编码，无运动信息时采用图4所述的编码结构进行编码，此时帧率可以低至16秒1帧，同时需要携带帧率信息以用于解码回放时间窗。

第二实施例

请参照图5，图5示出了本文实施例提供的视频编码装置200的方框示意图。视频编码装置200包括状态信息统计模块201、状态区域划分模块202、QP调整值确定模块203、QP编码值获取模块204、QP编码值确定模块205、压缩编码模块206、GOP长度计算模块207、GOP调整模块208、第一执行模块209、第二执行模块210及第三执行模块211。

状态信息统计模块201，配置为获取待编码图像，并获取待编码图像中每个宏块的状态信息。

状态区域划分模块202，配置为依据每个宏块的状态信息，将待编码图像划分为多个状态区域。

在本文实施例中，状态区域划分模块202，具体配置为依据运动检测信息，将待编码图像划分为运动区域与静止区域；依据亮度信息，将运动区域划分为运动明区、运动暗区及运动过暗区，并将静止区域划分为静止明区、静止暗区及静止过暗区；依据噪声方差信息，将运动明区、运动暗区、运动过暗区、静止明区、静止暗区及静止过暗区分别划分为运动高频明区、运动低频明区、运动高频暗区、运动低频暗区、运动高频过暗区、运动低频过暗区、静止高频明区、静止低频明区、静止高频暗区、静止低频暗区、静止高频过暗区及静止低频过暗区。

具体地，状态区域划分模块202可以配置为依据噪声方差信息，将运动明区划分为运动高频明区和运动低频明区，将运动暗区划分为运动高频暗区和运动低频暗区，将运动过暗区划分为运动高频过暗区和运动低频过暗区，将静止明区划分为静止高频明区和静止低频明区，将静止暗区划分为静止高频暗区和静止低频暗区，并将静止过暗区划分为静止高频过暗区和静止低频过暗区。

QP调整值确定模块203，配置为按照预设QP值表，确定出待编码图像中每个状态区域的QP调整值。

在本文实施例中，QP调整值确定模块203，具体配置为获取待编码图像的当前曝光增益值；将当前曝光增益值与多个测试曝光增益值进行一一对比，从多个测试曝光增益值中确定出与当前曝光增益值一致的目标曝光增益值；依据目标曝光增益值对应的运动高频区域QP值、运动低频区域QP值、静止高频区域QP值和静止低频区域QP值，确定出待编码图像中每个状态区域的QP调整值。

QP编码值获取模块204，配置为获取待编码图像的参考帧图像内每个宏块的QP编码值。

QP编码值确定模块205，配置为依据参考帧图像内每个宏块的QP编码值、以及待编码图像中每个状态区域的QP调整值，确定出待编码图像内每个宏块的QP编码值。

压缩编码模块206，配置为利用待编码图像内每个宏块的QP编码值，对待编码图像进行压缩编码。

GOP长度计算模块207，配置为获取待编码图像的运动矢量，并依据运动矢量计算待编码图像的GOP长度。

在本文实施例中，GOP长度计算模块207，具体配置为依据待编码图像的运动矢量，利用GOP长度公式

计算出待编码图像的GOP长度，其中，GOPSIZE为待编码图像的GOP长度，GOPSIZE _max为GOP长度的最大值，GOPSIZE _min为GOP长度的最小值，MV _cur为待编码图像的运动矢量，MV _min为运动矢量最小值，MV _max为运动矢量最大值。

GOP调整模块208，配置为依据待编码图像的GOP长度对GOP进行调整，调整后的GOP包括一帧关键帧及至少一个预测帧编码段，其中，预测帧编码段包括一帧参考预测帧及多帧普通预测帧，参考预测帧参考关键帧进行编码，普通预测帧在预测帧编码段内进行逐帧参考编码。

第一执行模块209，配置为获取调整后的GOP的控制信息，并将控制信息填充于关键帧的SEI中，以在解码回放时依据控制信息对调整后的GOP进行解码。

第二执行模块210，配置为获取调整后的GOP中关键帧的运动信息，并在运动信息大于预设运动阈值时，重新申请关键帧。

第三执行模块211，配置为当待编码图像中无运动信息时，待编码图像的GOP包括一帧关键帧及至少一个预测帧，每个预测帧均参考所述关键帧进行编码。

所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的视频编码装置200的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

综上所述，本文实施例提供的一种视频编码方法及装置，所述方法包括：获取待编码图像，并获取待编码图像中每个宏块的状态信息；依据每个宏块的状态信息，将待编码图像划分为多个状态区域；按照预设QP值表，确定出待编码图像中每个状态区域的QP调整值；获取待编码图像的参考帧图像内每个宏块的QP编码值；依据参考帧图像内每个宏块的QP编码值、以及待编码图像中每个状态区域的QP调整值，确定出待编码图像内每个宏块的QP编码值；利用待编码图像内每个宏块的QP编码值，对待编码图像进行压缩编码。本文实施例在压缩编码之前，根据每个宏块的状态设置每个宏块的QP编码值，这样在后续压缩编码的时候，能够对每个宏块进行与每个宏块的状态相适应的压缩编码处理，例如可以将变化不大的宏块的质量降低，这样可以最大程度降低数据量，在保证图像质量的同时有效降低了视频流编码码率。

所述功能如果以软件功能模块的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本文的技术方案本质上或者说对相关技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本文每个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(ROM，Read-Only Memory)、随机存取存储器(RAM，Random Access Memory)、磁碟或者光盘等每种可以存储程序代码的介质。

Claims

一种视频编码方法，所述方法包括：

获取待编码图像，并获取所述待编码图像中每个宏块的状态信息；

依据每个宏块的状态信息，将所述待编码图像划分为多个状态区域；

按照预设量化参数值表，确定出所述待编码图像中每个状态区域的量化参数调整值；

获取所述待编码图像的参考帧图像内每个宏块的量化参数编码值；

依据所述参考帧图像内每个宏块的量化参数编码值、以及所述待编码图像中每个状态区域的量化参数调整值，确定出所述待编码图像内每个宏块的量化参数编码值；

利用所述待编码图像内每个宏块的量化参数编码值，对所述待编码图像进行压缩编码。
如权利要求1所述的方法，其中，所述状态信息包括运动检测信息、亮度信息及噪声方差信息，所述多个状态区域包括运动高频明区、运动低频明区、运动高频暗区、运动低频暗区、运动高频过暗区、运动低频过暗区、静止高频明区、静止低频明区、静止高频暗区、静止低频暗区、静止高频过暗区及静止低频过暗区；

所述依据每个宏块的状态信息，将所述待编码图像划分为多个状态区域的步骤，包括：

依据所述运动检测信息，将所述待编码图像划分为运动区域与静止区域；

依据所述亮度信息，将所述运动区域划分为运动明区、运动暗区及运动过暗区，并将所述静止区域划分为静止明区、静止暗区及静止过暗区；

依据所述噪声方差信息，将所述运动明区、运动暗区、运动过暗区、静止明区、静止暗区及静止过暗区分别划分为运动高频明区、运动低频明区、运动高频暗区、运动低频暗区、运动高频过暗区、运动低频过暗区、静止高频明区、静止低频明区、静止高频暗区、静止低频暗区、静止高频过暗区及静止低频过暗区。
如权利要求2所述的方法，其中，所述预设量化参数值表包括多个测试曝光增益值、以及与每个测试曝光增益值对应的运动高频区域量化参数值、运动低频区域量化参数值、静止高频区域量化参数值和静止低频区域量化参数值；

所述按照预设量化参数值表，确定出所述待编码图像中每个状态区域的量化参数调整值的步骤，包括：

获取所述待编码图像的当前曝光增益值；将所述当前曝光增益值与所述多个测试曝光增益值进行一一对比，从所述多个测试曝光增益值中确定出与所述当前曝光增益值一致的目标曝光增益值；

依据所述目标曝光增益值对应的运动高频区域量化参数值、运动低频区域量化参数值、静止高频区域量化参数值和静止低频区域量化参数值，确定出所述待编码图像中每个状态区域的量化参数调整值。
如权利要求3所述的方法，其中，每个所述测试曝光增益值均与一个噪声区间对应，噪声区间为低噪声区间、中噪声区间或高噪声区间；当所述待编码图像为预测帧时，所述依据所述目标曝光增益值对应的运动高频区域量化参数值、运动低频区域量化参数值、静止高频区域量化参数值和静止低频区域量化参数值，确定出所述待编码图像中每个状态区域的量化参数调整值的步骤，包括：

确定所述目标曝光增益值对应的噪声区间；

当所述目标曝光增益值对应低噪声区间时，依据所述目标曝光增益值对应的运动高频区域量化参数值、运动低频区域量化参数值、静止高频区域量化参数值和静止低频区域量化参数值，按照第一预设公式确定出所述待编码图像中每个状态区域的量化参数调整值；

当所述目标曝光增益值对应中噪声区间时，依据所述目标曝光增益值对应的运动高频区域量化参数值、运动低频区域量化参数值、静止高频区域量化参数值和静止低频区域量化参数值，按照第二预设公式确定出所述待编码图像中每个状态区域的量化参数调整值；

当所述目标曝光增益值对应高噪声区间时，依据所述目标曝光增益值对应的运动高频区域量化参数值、运动低频区域量化参数值、静止高频区域量化参数值和静止低频区域量化参数值，按照第三预设公式确定出所述待编码图像中每个状态区域的量化参数调整值。
如权利要求1所述的方法，所述方法包括：以图像组为编码结构单位对视频帧序列进行顺次压缩，所述图像组包括起始位置的关键帧和所述关键帧后面的预测帧，所述方法还包括：

获取所述待编码图像的运动矢量，并依据所述运动矢量计算所述待编码图像的图像组长度；

依据所述待编码图像的图像组长度对图像组进行调整，调整后的图像组包括一帧关键帧及至少一个预测帧编码段，其中，所述预测帧编码段包括一帧参考预测帧及多帧普通预测帧，所述参考预测帧参考所述关键帧进行编码，所述普通预测帧在所述预测帧编码段内进行逐帧参考编码。
如权利要求5所述的方法，其中，所述方法还包括：

获取所述调整后的图像组的控制信息，并将所述控制信息填充于关键帧的补充增强信息中，以在解码回放时依据所述控制信息对调整后的图像组进行解码。
如权利要求5所述的方法，其中，所述依据所述运动矢量计算所述待编码图像的图像组长度的步骤，包括：

依据所述待编码图像的运动矢量，利用图像组长度公式
计算出所述待编码图像的图像组长度，其中，GOPSIZE为待编码图像的图像组长度，GOPSIZE _max为图像组长度的最大值，GOPSIZE _min为图像组长度的最小值，MV _cur为待编码图像的运动矢量，MV _min为运动矢量最小值，MV _max为运动矢量最大值。
如权利要求5所述的方法，所述方法还包括：

获取所述调整后的图像组中关键帧的运动信息，并在所述运动信息大于预设运动阈值时，重新申请关键帧。
如权利要求5所述的方法，所述方法还包括：

当所述待编码图像中无运动信息时，所述待编码图像的图像组包括一帧关键帧及至少一个预测帧，每个预测帧均参考所述关键帧进行编码。
如权利要求4所述的方法，其中，所述依据所述目标曝光增益值对应的运动高频区域量化参数值、运动低频区域量化参数值、静止高频区域量化参数值和静止低频区域量化参数值，确定出所述待编码图像中每个状态区域的量化参数调整值的步骤，包括：

依据所述目标曝光增益值对应的运动高频区域量化参数值、运动低频区域量化参数值、静止高频区域量化参数值和静止低频区域量化参数值，并对静止静止过暗区采用SKIP宏块编码，确定出所述待编码图像中每个状态区域的量化参数调整值；

所述第一预设公式为：

QP＝QP1+QP2+QP3+QP4；

所述第二预设公式为：

QP＝QP1+QP2+QP3+QP4；

所述第三预设公式为：

QP＝QP1+QP2+QP3+QP4；

其中，在第一预设公式、第二预设公式和第三预设公式中，QP为量化参数值，QP1中的QP _较好、QP _一般和QP _较差是预设量化参数值表中目标曝光增益值对应的运动高频区域量化参数值、运动低频区域量化参数值、静止高频区域量化参数值和静止低频区域量化参数值中较好、一般和较差的量化参数取值；QP2中的静止中频区域为静止高频区域和静止低频区域之间的过渡区，a、b均为预设值；QP3中的运动、特征及感兴趣中频区域为运动、特征区域及感兴趣高频区域与运动、特征及感兴趣低频区域之间的过渡区；QP4中的
一种视频编码装置，所述装置包括：

状态信息统计模块，配置为获取待编码图像，并获取所述待编码图像中每个宏块的状态信息；

状态区域划分模块，配置为依据每个宏块的状态信息，将所述待编码图像划分为多个状态区域；

量化参数调整值确定模块，配置为按照预设量化参数值表，确定出所述待编码图像中每个状态区域的量化参数调整值；

量化参数编码值获取模块，配置为获取所述待编码图像的参考帧图像内每个宏块的量化参数编码值；

量化参数编码值确定模块，配置为依据所述参考帧图像内每个宏块的量化参数编码值、以及所述待编码图像中每个状态区域的量化参数调整值，确定出所述待编码图像内每个宏块的量化参数编码值；

压缩编码模块，配置为利用所述待编码图像内每个宏块的量化参数编码值，对所述待编码图像进行压缩编码。
如权利要求11所述的装置，其中，所述装置以图像组为编码结构单位对视频帧序列进行顺次压缩，所述图像组包括起始位置的关键帧和所述关键帧后面的预测帧，所述装置还包括：

图像组长度计算模块，配置为获取所述待编码图像的运动矢量，并依据所述运动矢量计算所述待编码图像的图像组长度；

图像组调整模块，配置为依据所述待编码图像的图像组长度对图像组进行调整，调整后的图像组包括一帧关键帧及至少一个预测帧编码段，其中，所述预测帧编码段包括一帧参考预测帧及多帧普通预测帧，所述参考预测帧参考所述关键帧进行编码，所述普通预测帧在所述预测帧编码段内进行逐帧参考编码。
如权利要求12所述的装置，其中，所述装置还包括：

第一执行模块，配置为获取所述调整后的图像组的控制信息，并将所述控制信息填充于关键帧的补充增强信息中，以在解码回放时依据所述控制信息对调整后的图像组进行解码。
如权利要求12所述的装置，其中，所述装置还包括：

第二执行模块，配置为获取所述调整后的图像组中关键帧的运动信息，并在所述运动信息大于预设运动阈值时，重新申请关键帧。
如权利要求12所述的装置，其中，所述装置还包括：

第三执行模块，配置为当所述待编码图像中无运动信息时，所述待编码图像的图像组包括一帧关键帧及至少一个预测帧，每个预测帧均参考所述关键帧进行编码。
一种电子设备，包括：

至少一个处理器；

存储器，设置为存储至少一个程序，

当所述至少一个程序被所述至少一个处理器执行，使得所述至少一个处理器实现如权利要求1-10中任一所述的方法。
一种计算机可读存储介质，所述计算机可读存储介质上存储有计算机程序，所述计算机程序被处理器执行时实现如权利要求1-10任一所述的方法。