WO2020207030A1

WO2020207030A1 - 视频编码方法、系统、设备及计算机可读存储介质

Info

Publication number: WO2020207030A1
Application number: PCT/CN2019/120899
Authority: WO
Inventors: 齐燕
Original assignee: 深圳壹账通智能科技有限公司
Priority date: 2019-04-12
Filing date: 2019-11-26
Publication date: 2020-10-15
Also published as: CN110049324B; CN110049324A

Abstract

本申请提供一种基于人脸检测技术的视频编码方法、系统、设备及计算机可读存储介质，该方法包括：获取待编码视频帧；基于预设规则对所述待编码视频帧进行人脸检测，获得人脸检测结果，并根据所述预设规则和所述人脸检测结果确定所述待编码视频帧的兴趣区域，并将所述待编码视频帧中兴趣区域以外的区域作为非兴趣区域；获取所述兴趣区域和非兴趣区域各自对应的编码码率，并基于所述各自对应的编码码率分别对所述兴趣区域和非兴趣区域进行编码。

Description

视频编码方法、系统、设备及计算机可读存储介质

本申请要求于2019年04月12日提交中国专利局、申请号为201910297964.X、发明名称为“视频编码方法、系统、设备及计算机可读存储介质”的中国专利申请的优先权，其全部内容通过引用结合在申请中。

技术领域

本申请涉及视频编码技术领域，尤其涉及一种视频编码方法、系统、设备及计算机可读存储介质。

背景技术

视频业务的发展无可避免地受到有限带宽资源的制约，而在用低码率进行视频压缩时，往往会造成视频质量的下降，进而降低用户体验，用户体验的降低限制了视频业务的发展。因而急需一种兼顾用户体验与视频传输码率的视频编码方法。

发明内容

本申请的主要目的在于提供一种视频编码方法、系统、设备及计算机可读存储介质，旨在解决现有视频编码方法无法兼顾用户体验与视频传输码率的技术问题。

为实现上述目的，本申请提供一种视频编码方法，所述视频编码方法包括以下步骤：

获取待编码视频帧；

基于预设规则对所述待编码视频帧进行人脸检测，获得人脸检测结果，并根据所述预设规则和所述人脸检测结果确定所述待编码视频帧的兴趣区域，并将所述待编码视频帧中兴趣区域以外的区域作为非兴趣区域；

获取所述兴趣区域和非兴趣区域各自对应的编码码率，并基于所述各自对应的编码码率分别对所述兴趣区域和非兴趣区域进行编码。

可选地，所述根据所述预设规则和所述人脸检测结果确定所述待编码视频帧的兴趣区域的步骤包括：

根据所述人脸检测结果确定所述待编码视频帧中是否存在人脸；

若所述待编码视频帧中不存在人脸，则获取预设的中心区域，将所述中心区域作为所述待编码视频帧的兴趣区域。

可选地，所述获取待编码视频帧的步骤之前包括：

获取待编码视频及所述待编码视频的视频信息，从所述视频信息中获得所述待编码视频的视频类型；

在所述待编码视频为影视类视频时，从所述视频信息中获得主要人物的面部特征；

所述根据所述人脸检测结果确定所述待编码视频帧中是否存在人脸的步骤之后包括：

若所述待编码视频帧中存在人脸，则根据所述主要人物的面部特征和所述人脸检测结果判断所述待编码视频帧中是否存在与所述主要人物面部特征匹配的目标人脸；

若所述待编码视频帧中存在与所述主要人物面部特征匹配的目标人脸，则将所述目标人脸对应区域作为所述待编码视频帧的兴趣区域。

可选地，所述根据所述主要人物的面部特征和所述人脸检测结果判断所述待编码视频帧中是否存在与所述主要人物面部特征匹配的目标人脸的步骤之后包括：

若所述待编码视频帧中不存在与所述主要人物面部特征匹配的目标人脸，则将所述待编码视频帧中人脸所在区域作为所述待编码视频帧的兴趣区域。

可选地，所述获取所述兴趣区域和非兴趣区域各自对应的编码码率，并基于所述各自对应的编码码率分别对所述兴趣区域和非兴趣区域进行编码的步骤包括：

确定所述兴趣区域和非兴趣区域各自所属的宏块；

获取所述非兴趣区域所属的各宏块与所述兴趣区域的宏块距离，并基于所述宏块距离确定所述非兴趣区域所属的各宏块各自对应的第一码率，其中，所述宏块距离与第一码率为负相关关系；

获取所述兴趣区域对应的第二码率，根据所述第一码率和所述第二码率分别对所述非兴趣区域和兴趣区域进行编码。

可选地，所述基于所述宏块距离确定所述非兴趣区域所属的各宏块各自对应的第一码率，其中，所述宏块距离与第一码率为负相关关系的步骤包括：

将所述非兴趣区域所属的各宏块对应的宏块距离与预置的距离区间进行比对，确定各宏块对应的宏块距离所处的距离区间；

获取预置的距离区间与码率的对应关系，获得各宏块对应的宏块距离所处的距离区间对应的目标码率，将所述目标码率作为各宏块对应的第一码率。

可选地，所述视频编码方法还包括：

接收到用户终端发送的无观众提示信息，其中，所述无观众提示信息由用户终端检测到没有视线在用户终端屏幕上时所发；

降低当前待编码视频帧的编码码率。

此外，为实现上述目的，本申请还提供一种视频编码系统，所述视频编码系统包括：

视频帧获取模块，用于获取待编码视频帧；

兴趣确定模块，用于基于预设规则对所述待编码视频帧进行人脸检测，获得人脸检测结果，并根据所述预设规则和所述人脸检测结果确定所述待编码视频帧的兴趣区域，并将所述待编码视频帧中兴趣区域以外的区域作为非兴趣区域；

编码执行模块，用于获取所述兴趣区域和非兴趣区域各自对应的编码码率，并基于所述各自对应的编码码率分别对所述兴趣区域和非兴趣区域进行编码。

此外，为实现上述目的，本申请还提供一种视频编码设备，所述视频编码设备包括处理器、存储器、以及存储在所述存储器上并可被所述处理器执行的计算机可读指令，其中所述计算机可读指令被所述处理器执行时，实现如上述的视频编码方法的步骤。

此外，为实现上述目的，本申请还提供一种计算机可读存储介质，所述计算机可读存储介质上存储有计算机可读指令，其中所述计算机可读指令被处理器执行时，实现如上述的视频编码方法的步骤。

本申请实施例通过获取待编码视频帧，基于预设规则对待编码视频帧进行人脸检测，获得人脸检测结果，并根据预设规则和人脸检测结果确定待编码视频帧的兴趣区域，并将待编码视频帧中兴趣区域以外的区域作为非兴趣区域；获取兴趣区域和非兴趣区域各自对应的编码码率，并基于各自对应的编码码率分别对所述兴趣区域和非兴趣区域进行编码，即：基于人脸检测结果和预设规则对待编码视频帧进行用户兴趣区域的识别，并将识别出的兴趣区域以及非兴趣区域进行区分编码，进而在降低视频大小的同时，确保用户兴趣区域的视频质量。

附图说明

图1是本申请实施例方案涉及的硬件运行环境的视频编码设备结构示意图；

图2为本申请视频编码方法一实施例的流程示意图；

图3为本申请视频编码系统一实施例的功能模块示意图。

本申请目的的实现、功能特点及优点将结合实施例，参照附图做进一步说明。

具体实施方式

应当理解，此处所描述的具体实施例仅仅用以解释本申请，并不用于限定本申请。

请参见图1，图1为本申请所提供的视频编码设备的硬件结构示意图。

视频编码设备可以是PC，也可以是智能手机、平板电脑、便携计算机、台式计算机等具有显示功能的设备，可选地，视频编码设备还可以是服务器设备，例如与用户终端进行视频数据交互的远端视频服务器。

视频编码设备可以包括：处理器101以及存储器201等部件。在视频编码设备中，处理器101与存储器201连接，存储器201上存储有计算机可读指令，处理器101可以调用存储器201中存储的计算机可读指令，并实现如下述视频编码方法各实施例的步骤。

存储器201，可用于存储软件程序以及各种数据，存储器201可主要包括存储程序区和存储数据区，其中，存储程序区可存储操作系统、至少一个功能所需的应用程序（比如用于进行视频编码的计算机可读指令）等；存储数据区可包括数据库等。处理器101，是视频编码设备的控制中心，利用各种接口和线路连接整个视频编码设备的各个部分，通过运行或执行存储在存储器201内的软件程序和/或模块，以及调用存储在存储器201内的数据，执行视频编码设备的各种功能和处理数据，从而对视频编码设备进行整体监控。

本领域技术人员可以理解，图1中示出的视频编码设备结构并不构成对视频编码设备的限定，可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件布置。

基于上述硬件结构，提出本申请方法各个实施例。

本申请提供一种视频编码方法。

参照图2，图2为本申请视频编码方法第一实施例的流程示意图。

本实施例中，视频编码方法包括以下步骤：

步骤S10，获取待编码视频帧；

视频编码设备可以从本地或远程服务器预置的视频数据库中获取待编码视频，其中，待编码视频可为实时采集的视频，例如通过终端摄像头实时采集的视频，如会议系统中实时采集的会议视频，也可以是预先存储的视频，例如影视视频。其中，视频帧是构成视频的基本单元且为视频编码的基本对象，因而，本实施例中，在实际执行编码操作之前，获取待编码视频帧作为编码对象。

本申请视频编码方法可应用于多个场景，如视频会议场景或影视娱乐场景。在视频会议场景下，视频编码设备通过终端摄像头采集各会议成员所在的会议现场视频，并将各会议成员对应的会议现场视频编码传输到其他会议成员终端，此时，会议现场视频为待编码视频。在影视娱乐场景下，视频编码设备在接收到用户终端发送的目标视频获取请求时，根据该获取请求确定待编码视频，并将待编码视频编码传输到用户终端。

一个视频由多个视频帧组成，通常一次视频编码无法将视频的所有视频帧编码完成，需要多次视频编码才能将一个视频全部编码完成，因此，在对待编码视频进行编码时，需多次获得单次编码所需的预设数目的待编码视频帧，执行对应的视频编码操作，即本申请实施例中的各步骤。

可选地，在首次获得待编码视频的视频帧（即待编码视频帧）之时或之前，获得视频编码设置信息，并从中获得编码规则，编码规则可包括兴趣区域的确定规则、兴趣区域与非兴趣区域的码率确定规则等，在获得编码规则后，即可依据编码规则对待编码视频帧进行编码操作。可选地，可实时对编码规则进行更新监控，在检测到编码规则发生改变时，获得最新的编码规则，并根据最新编码规则对待编码视频剩余的未编码视频帧进行编码。

步骤S20，基于预设规则对所述待编码视频帧进行人脸检测，获得人脸检测结果，并根据所述预设规则和所述人脸检测结果确定所述待编码视频帧的兴趣区域，并将所述待编码视频帧中兴趣区域以外的区域作为非兴趣区域；

不管是会议视频，还是影视视频等其他视频，人脸所在区域都是用户注意力集中的区域，为兼顾质量和压缩效率，本申请实施例根据待编码视频帧的人脸相关属性（如面积属性、（像素/坐标）位置属性等）进行区分编码。鉴于不同待编码视频帧中是否存在人脸以及人脸位置等人脸相关属性的不确定，需要对待编码视频帧进行人脸检测以确定人脸相关属性，以便后续编码步骤中基于人脸相关属性确定编码码率的具体分配。

此处的预设规则，即兴趣区域的确定规则，在进行人脸检测时，具体检测内容需根据预设规则确定，预设规则可在首次获得待编码视频帧之时或之前获取，也可以在进行人脸检测之前获取。

预设规则可以为将待编码视频帧中人脸所在区域作为兴趣区域；也可以为：将待编码视频帧中面积大于预设值的人脸所在区域作为兴趣区域；还可以为：将待编码视频帧中面积大于预设值的人脸所在区域及周边区域作为兴趣区域；在上述预设规则的基础上，预设规则还可包括：在待编码视频帧中无人脸时，将待编码视频帧中预设区域（如中心区域）作为兴趣区域。前述预设规则仅为兴趣区域确定规则的几个可选示例，还可为其他基于人脸的兴趣区域确定规则。此外，视频编码设备中还可同时设置多个预设规则，可由视频编码设备用户自主切换兴趣区域确定规则。

根据预设规则确定前述人脸检测中的具体检测内容，进而确定与具体检测内容对应的人脸检测结果。根据预设规则的不同，可确定对应不同的具体检测内容以及人脸检测结果，包括但不限于如下示例：在预设规则为将待编码视频帧中人脸所在区域作为兴趣区域时，具体检测内容仅为检测是否存在人脸，以及检测到的人脸位置，对应的人脸检测结果为待编码视频帧中存在人脸以及人脸位置，或待编码视频帧中不存在人脸；在预设规则为将待编码视频帧中面积大于预设值的人脸所在区域作为兴趣区域时，具体检测内容为检测是否存在人脸以及人脸面积，对应的人脸检测结果为待编码视频帧中存在人脸以及存在的人脸位置以及面积大于预设值的人脸，或待编码视频帧中不存在人脸；在预设规则还包括：若待编码视频帧中无人脸，则将待编码视频帧中预设区域（如中心区域）作为兴趣区域时，具体检测内容还包括预设区域的位置。

基于上述说明可知，在确定预设规则和人脸检测结果后，即可确定待编码视频帧的兴趣区域。可将兴趣区域以像素形式表示，并将待编码视频帧中兴趣区域对应像素之外的像素作为非兴趣区域。

步骤S30，获取所述兴趣区域和非兴趣区域各自对应的编码码率，并基于所述各自对应的编码码率分别对所述兴趣区域和非兴趣区域进行编码。

预设兴趣区域和非兴趣区域各自对应的编码码率，兴趣区域对应编码码率高于非兴趣区域对应的编码码率。在确定兴趣区域和非兴趣区域后，直接获得对应的编码码率。其中，非兴趣区域可采用统一的码率编码，也可进一步根据图像复杂度或与兴趣区域的距离采用不同的码率。

可选地，对任意一个视频，在进行了上述兴趣区域识别、对兴趣区域与非兴趣区域采用不同码率进行编码等步骤后，可将每个视频帧的不同区域对应码率进行存储，在后续再次对同一视频进行视频编码时，可直接查询获得该视频各区域的编码码率分布，并根据该编码码率分布直接对该视频进行编码。

本实施例通过获取待编码视频帧，基于预设规则对待编码视频帧进行人脸检测，获得人脸检测结果，并根据预设规则和人脸检测结果确定待编码视频帧的兴趣区域，并将待编码视频帧中兴趣区域以外的区域作为非兴趣区域；获取兴趣区域和非兴趣区域各自对应的编码码率，并基于各自对应的编码码率分别对所述兴趣区域和非兴趣区域进行编码，即：基于人脸检测结果和预设规则对待编码视频帧进行用户兴趣区域的识别，并将识别出的兴趣区域以及非兴趣区域进行区分编码，进而在降低视频大小的同时，确保用户兴趣区域的视频质量。

进一步地，基于上述实施例提出本申请视频编码方法的第二实施例。

在本申请视频编码方法第二实施例中，步骤S10之前包括：

步骤S01，获取待编码视频及所述待编码视频的视频信息，从所述视频信息中获得所述待编码视频的视频类型；

配置本申请视频编码方法对应计算机可读指令的视频编码设备，可应用于多种不同的视频编码场景，典型的如影视类视频、会议视频。待编码视频，可以为实时采集的视频，如数字会议系统中实时传输的会议视频，也可以为预存在数据库中的视频，如视频网站服务器中的影视类视频。

待编码视频的视频信息中包含了视频类型，还可包含主要人物信息，其包括主要人物面部特征。其中，在视频类型为影视类视频时，因每个影视作品都固定有一个或多个出镜的主要人物，包括主角、配角以及龙套等，这些都是用户感兴趣的区域，因而视频信息中包括前述主要人物。

步骤S02，在所述待编码视频为影视类视频时，从所述视频信息中获得主要人物的面部特征；

可从视频信息中直接获取主要人物的面部特征，在视频信息中没有主要人物的面部特征时，可通过对待编码视频中预设数目的视频帧进行分析以确定主要人物（如通过出场率/出场时间作为主要人物的分析判断依据），例如，若是在预设数目的视频帧中都出现了某人的人脸，则将该人作为主要人物之一；确定主要人物后，对待编码视频中主要人物进行面部特征提取，并将主要人物面部特征存储在视频信息中，实现视频编码时，直接从视频信息中获取主要人物的面部特征。

步骤S20中根据所述预设规则和所述人脸检测结果确定所述待编码视频帧的兴趣区域的步骤包括：

步骤S21，根据所述人脸检测结果确定所述待编码视频帧中是否存在人脸；

在本实施例中，人脸检测结果中包含待编码视频帧中存在人脸或不存在人脸，可直接根据人脸检测结果确定。

步骤S22，若所述待编码视频帧中不存在人脸，则获取预设的中心区域，将所述中心区域作为所述待编码视频帧的兴趣区域。

根据人脸检测结果确定待编码视频帧中不存在人脸，因为在没有人脸时，用户的视线焦点一般在视频中心位置，所以将预设的中心区域作为待编码视频帧的兴趣区域。

预设的中心区域可以为固定的中心区域，中心区域指待编码视频帧几何意义上的中心区域，可以为处于待编码视频帧中心的矩形区域或圆形（包括椭圆形）区域，具体可根据预期的中心区域面积和待编码视频帧的面积计算好中心区域在待编码视频帧上的位置（像素位置/坐标位置）。

步骤S23，若所述待编码视频帧中存在人脸，则根据所述主要人物的面部特征和所述人脸检测结果判断所述待编码视频帧中是否存在与所述主要人物面部特征匹配的目标人脸；

若待编码视频帧中存在人脸，则继续判断待编码视频帧中是否存在与主要人物面部特征匹配的目标人脸。在本实施例中，人脸检测的具体检测内容还包括：在检测到人脸时，继续检测获得人脸特征，则对应的人脸检测结果中还包括检测到的人脸特征。可通过将检测到的人脸特征与主要人物面部特征进行对比匹配，判断是否存在与主要人物面部特征匹配的目标人脸。

步骤S24，若所述待编码视频帧中存在与所述主要人物面部特征匹配的目标人脸，则将所述目标人脸对应区域作为所述待编码视频帧的兴趣区域。

目标人脸对应区域，可包括目标人脸所在区域，还可同时包括目标人脸对应人物所在区域。

其中，目标人脸所在区域，可直接从人脸检测结果中获得目标人脸所在的位置（像素位置或坐标位置）作为目标人脸所在区域。目标人脸对应人物所在区域，指人脸关联的身体部分像素区域，可对待编码视频帧中目标人脸周边区域进行人体轮廓识别，将识别的人体轮廓界定的区域作为人脸关联的身体部分像素区域。

主要人物指包括主角、配角以及龙套等用户感兴趣的人物，与主要人物面部特征匹配的目标人脸，即主要人物的人脸，以主要人物为男女主角为例，在检测到待编码视频帧中出现男女主角的人脸时，男女主角的人脸为待编码视频帧的兴趣区域，此时，若是待编码视频帧中还出现了其他非男女主角的脸，该其他非男女主角的脸为非兴趣区域。

可选地，步骤S23之后还包括：

若待编码视频帧中无目标人脸，则直接将检测到的人脸所在区域作为待编码视频帧的兴趣区域。

接上述示例，以主要人物为男女主角为例，若待编码视频帧中无目标人脸，即待编码视频帧中无男女主角的脸，但有其他非男女主角（如路人）的脸，则将路人的脸作为待编码视频帧的兴趣区域。

本实施例通过从视频信息中获得待编码视频的视频类型，在待编码视频为影视类视频时，从视频信息中获得主要人物的面部特征，在待编码视频帧中存在人脸时，根据主要人物的面部特征和人脸检测结果判断待编码视频帧中是否存在与主要人物面部特征匹配的目标人脸；若待编码视频帧中存在与主要人物面部特征匹配的目标人脸，则将目标人脸对应区域作为所述待编码视频帧的兴趣区域，鉴于影视类视频中，观众（用户）的注意力一般集中在主要人物上，通过对影视类视频中主要人物的识别，并将主要人物对应区域作为兴趣区域，以便后续对兴趣区域以较高码率编码，将兴趣区域以外的区域以较低码率编码，即对用户注意的地方以较高码率编码，可为用户提供良好的视频效果，同时将用户注意力分散的地方以较低码率编码，则可降低视频传输码率。

进一步地，在本申请视频编码方法第三实施例中，步骤S30包括：

步骤S31，确定所述兴趣区域和非兴趣区域各自所属的宏块；

本申请视频编码方法中的视频编码操作以宏块为单位，逐个宏块进行编码，将其组织成连续的视频码流，其中，宏块由一个亮度像素块和附加的两个色度像素块组成。

兴趣区域与非兴趣区域均所属一个或多个宏块，在确定好兴趣区域和非兴趣区域后，即可根据兴趣区域和非兴趣区域的像素位置确定兴趣区域和非兴趣区域各自所属的一个或多个宏块。

步骤S32，获取所述非兴趣区域所属的各宏块与所述兴趣区域的宏块距离，并基于所述宏块距离确定所述非兴趣区域所属的各宏块各自对应的第一码率，其中，所述宏块距离与第一码率为负相关关系；

与人眼焦距中心越远的区域，人眼越容易忽视，基于这一人眼视觉特征可对非兴趣区域采用不同码率编码。计算非兴趣区域所在宏块与兴趣区域的宏块距离，宏块距离越小，码率越大，即随着与兴趣区域距离的增大而降低码率，使得用户很难察觉一个视频帧的质量差异，实现在用户无感的前提下，降低编码视频流，降低带宽要求。

这里的宏块距离，可以指与兴趣区域的边界所属宏块相隔的宏块数目，宏块距离与第一码率呈负相关关系，即：与兴趣区域边界所属宏块相邻的宏块对应的宏块距离越小，该相邻的宏块对应的第一码率越大；与兴趣区域边界所属宏块相隔的宏块数最多的宏块，对应的第一码率最小。这里的第一码率并非特指某一数值，而是指代所有非兴趣区域所属的一个或多个宏块对应的编码码率。

可选地，可通过下述公式计算宏块距离与第一码率间的负相关关系：

y=-kx+b，k为正数，y为第一码率，x为宏块距离。

可选地，步骤S32中所述基于所述宏块距离确定所述非兴趣区域所属的各宏块各自对应的第一码率，其中，所述宏块距离与第一码率为负相关关系的步骤包括：

将所述非兴趣区域所属的各宏块对应的宏块距离与预置的距离区间进行比对，确定各宏块对应的宏块距离所处的距离区间；获取预置的距离区间与码率的对应关系，获得各宏块对应的宏块距离所处的距离区间对应的目标码率，将所述目标码率作为各宏块对应的第一码率。

可预设宏块距离与第一码率之间的对应关系，并将二者之间的对应关系存储，在需确定某宏块的第一码率时，直接获取该宏块对应的第一宏块距离，并获取宏块距离与第一码率的对应关系，根据该对应关系确定第一宏块距离对应的第一码率的大小。

步骤S33，获取所述兴趣区域对应的第二码率，根据所述第一码率和所述第二码率分别对所述非兴趣区域和兴趣区域进行编码。

本实施例中，将兴趣区域的编码码率，即第二码率，预存在数据库中，在确定兴趣区域后，可直接从数据库中获取兴趣区域对应的第二码率。用非兴趣区域所属的各宏块对应的第一码率编码非兴趣区域所属的各宏块，用第二码率对兴趣区域进行编码。

本实施例中，宏块距离与第一码率的对应关系，即距离区间与码率的对应关系，处于某一距离区间的的宏块距离对应着同一码率。

本实施例可实现在用户无感的前提下，降低编码视频流，降低带宽要求。

可选地，在本申请视频编码方法第四实施例中，所述视频编码方法还包括：接收到用户终端发送的无观众提示信息，其中，所述无观众提示信息由用户终端检测到没有视线在用户终端屏幕上时所发；降低当前待编码视频帧的编码码率。

对于待编码视频帧码率的设置，还可以根据用户终端对用户状态的检测结果确定。具体可通过用户终端摄像头检测预设时段内是否有视线停留在用户终端屏幕上，若检测到预设时段内无视线，则发送无观众提示信息到视频编码设备，视频编码设备在接收到无观众提示信息后，降低当前待编码视频帧的编码码率，在检测到重新有视线停留在用户终端屏幕上时，发送有观众提示信息到视频编码设备，视频编码设备在接收到有观众提示信息时，将当前待编码视频帧的编码码率恢复至正常水平。

因为对待编码视频帧的不同区域进行区分编码，所以，在降低当前待编码视频帧的编码码率时，对当前待编码视频帧的所有区域统一降低相同码率，或将当前待编码视频帧的所有区域的编码码率降低到同一码率值。

可选地，无观众提示信息还可通过用户终端确定当前正在运行的程序，若检测到用户在进行其他程序的操作，如暂时退出当前视频界面去到其他页面执行操作，或者检测到视频窗口最小化时，可发送无观众提示信息给视频编码设备。

本实施例通过接收到用户终端发送的无观众提示信息，其中，所述无观众提示信息由用户终端检测到没有视线在用户终端屏幕上时所发；降低当前待编码视频帧的编码码率，可由用户终端检测用户实际是否花费注意力在视频上，并根据用户终端的检测结果对视频的当前待编码视频帧的编码码率进行调整，可以降低传输带宽，节约传输资源。

此外，本申请还提供一种与上述视频编码方法各步骤对应的视频编码系统。

参照图3，图3为本申请视频编码系统第一实施例的功能模块示意图。

在本实施例中，本申请视频编码系统包括：

视频帧获取模块10，用于获取待编码视频帧；

兴趣确定模块20，用于基于预设规则对所述待编码视频帧进行人脸检测，获得人脸检测结果，并根据所述预设规则和所述人脸检测结果确定所述待编码视频帧的兴趣区域，并将所述待编码视频帧中兴趣区域以外的区域作为非兴趣区域；

编码执行模块30，用于获取所述兴趣区域和非兴趣区域各自对应的编码码率，并基于所述各自对应的编码码率分别对所述兴趣区域和非兴趣区域进行编码。

进一步地，兴趣确定模块20，还用于根据所述人脸检测结果确定所述待编码视频帧中是否存在人脸；若所述待编码视频帧中不存在人脸，则获取预设的中心区域，将所述中心区域作为所述待编码视频帧的兴趣区域。

进一步地，本申请视频编码系统还包括：

视频信息获取模块，用于获取待编码视频及所述待编码视频的视频信息，从所述视频信息中获得所述待编码视频的视频类型；在所述待编码视频为影视类视频时，从所述视频信息中获得主要人物的面部特征；

兴趣确定模块20，还用于若所述待编码视频帧中存在人脸，则根据所述主要人物的面部特征和所述人脸检测结果判断所述待编码视频帧中是否存在与所述主要人物面部特征匹配的目标人脸；若所述待编码视频帧中存在与所述主要人物面部特征匹配的目标人脸，则将所述目标人脸对应区域作为所述待编码视频帧的兴趣区域。

进一步地，兴趣确定模块20，还用于若所述待编码视频帧中不存在与所述主要人物面部特征匹配的目标人脸，则将所述待编码视频帧中人脸所在区域作为所述待编码视频帧的兴趣区域。

进一步地，编码执行模块30，还用于确定所述兴趣区域和非兴趣区域各自所属的宏块；获取所述非兴趣区域所属的各宏块与所述兴趣区域的宏块距离，并基于所述宏块距离确定所述非兴趣区域所属的各宏块各自对应的第一码率，其中，所述宏块距离与第一码率为负相关关系；获取所述兴趣区域对应的第二码率，根据所述第一码率和所述第二码率分别对所述非兴趣区域和兴趣区域进行编码。

进一步地，编码执行模块30，还用于将所述非兴趣区域所属的各宏块对应的宏块距离与预置的距离区间进行比对，确定各宏块对应的宏块距离所处的距离区间；获取预置的距离区间与码率的对应关系，获得各宏块对应的宏块距离所处的距离区间对应的目标码率，将所述目标码率作为各宏块对应的第一码率。

进一步地，本申请视频编码系统还包括：

码率调整模块，用于接收到用户终端发送的无观众提示信息，其中，所述无观众提示信息由用户终端检测到没有视线在用户终端屏幕上时所发；降低当前待编码视频帧的编码码率。

本申请还提出一种计算机可读存储介质，计算机可读存储介质可以为非易失性可读存储介质，其上存储有计算机程序。所述计算机可读存储介质可以是图1的视频编码设备中的存储器201，也可以是如ROM（Read-Only Memory，只读存储器）/RAM（Random Access Memory，随机存取存储器）、磁碟、光盘中的至少一种，所述计算机可读存储介质包括若干指令用以使得一台具有处理器的设备(可以是手机，计算机，服务器，网络设备或本申请实施例中的视频编码设备等)执行本申请各个实施例所述的方法。

需要说明的是，在本文中，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者服务端不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者服务端所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括该要素的过程、方法、物品或者服务端中还存在另外的相同要素。

上述本申请实施例序号仅仅为了描述，不代表实施例的优劣。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。

以上仅为本申请的优选实施例，并非因此限制本申请的专利范围，凡是利用本申请说明书及附图内容所作的等效结构或等效流程变换，或直接或间接运用在其他相关的技术领域，均同理包括在本申请的专利保护范围内。

Claims

一种视频编码方法，其中，所述视频编码方法包括以下步骤：

获取待编码视频及所述待编码视频的视频信息，从所述视频信息中获得所述待编码视频的视频类型；

在所述待编码视频为影视类视频时，从所述视频信息中获得主要人物的面部特征；

获取待编码视频帧；

基于预设规则对所述待编码视频帧进行人脸检测，获得人脸检测结果，并根据所述人脸检测结果确定所述待编码视频帧中是否存在人脸；

若所述待编码视频帧中不存在人脸，则获取预设的中心区域，将所述中心区域作为所述待编码视频帧的兴趣区域；

若所述待编码视频帧中存在人脸，则根据所述主要人物的面部特征和所述人脸检测结果判断所述待编码视频帧中是否存在与所述主要人物面部特征匹配的目标人脸；

若所述待编码视频帧中存在与所述主要人物面部特征匹配的目标人脸，则将所述目标人脸对应区域作为所述待编码视频帧的兴趣区域；

将所述待编码视频帧中兴趣区域以外的区域作为非兴趣区域；

获取所述兴趣区域和非兴趣区域各自对应的编码码率，并基于所述各自对应的编码码率分别对所述兴趣区域和非兴趣区域进行编码。
如权利要求1所述的视频编码方法，其中，所述根据所述主要人物的面部特征和所述人脸检测结果判断所述待编码视频帧中是否存在与所述主要人物面部特征匹配的目标人脸的步骤之后包括：

若所述待编码视频帧中不存在与所述主要人物面部特征匹配的目标人脸，则将所述待编码视频帧中人脸所在区域作为所述待编码视频帧的兴趣区域。
如权利要求1所述的视频编码方法，其中，所述获取所述兴趣区域和非兴趣区域各自对应的编码码率，并基于所述各自对应的编码码率分别对所述兴趣区域和非兴趣区域进行编码的步骤包括：

确定所述兴趣区域和非兴趣区域各自所属的宏块；

获取所述非兴趣区域所属的各宏块与所述兴趣区域的宏块距离，并基于所述宏块距离确定所述非兴趣区域所属的各宏块各自对应的第一码率，其中，所述宏块距离与第一码率为负相关关系；

获取所述兴趣区域对应的第二码率，根据所述第一码率和所述第二码率分别对所述非兴趣区域和兴趣区域进行编码。
如权利要求3所述的视频编码方法，其中，所述基于所述宏块距离确定所述非兴趣区域所属的各宏块各自对应的第一码率，其中，所述宏块距离与第一码率为负相关关系的步骤包括：

将所述非兴趣区域所属的各宏块对应的宏块距离与预置的距离区间进行比对，确定各宏块对应的宏块距离所处的距离区间；

获取预置的距离区间与码率的对应关系，获得各宏块对应的宏块距离所处的距离区间对应的目标码率，将所述目标码率作为各宏块对应的第一码率。
如权利要求1所述的视频编码方法，其中，所述视频编码方法还包括：

接收到用户终端发送的无观众提示信息，其中，所述无观众提示信息由用户终端检测到没有视线在用户终端屏幕上时所发；

降低当前待编码视频帧的编码码率。
一种视频编码系统，其中，所述视频编码系统包括：

视频信息获取模块，用于获取待编码视频及所述待编码视频的视频信息，从所述视频信息中获得所述待编码视频的视频类型；在所述待编码视频为影视类视频时，从所述视频信息中获得主要人物的面部特征；

视频帧获取模块，用于获取待编码视频帧；

兴趣确定模块，用于基于预设规则对所述待编码视频帧进行人脸检测，获得人脸检测结果，并根据所述人脸检测结果确定所述待编码视频帧中是否存在人脸；若所述待编码视频帧中不存在人脸，则获取预设的中心区域，将所述中心区域作为所述待编码视频帧的兴趣区域；若所述待编码视频帧中存在人脸，则根据所述主要人物的面部特征和所述人脸检测结果判断所述待编码视频帧中是否存在与所述主要人物面部特征匹配的目标人脸；若所述待编码视频帧中存在与所述主要人物面部特征匹配的目标人脸，则将所述目标人脸对应区域作为所述待编码视频帧的兴趣区域；将所述待编码视频帧中兴趣区域以外的区域作为非兴趣区域；

编码执行模块，用于获取所述兴趣区域和非兴趣区域各自对应的编码码率，并基于所述各自对应的编码码率分别对所述兴趣区域和非兴趣区域进行编码。
如权利要求6所述的视频编码系统，其中，所述兴趣确定模块，还用于若所述待编码视频帧中不存在与所述主要人物面部特征匹配的目标人脸，则将所述待编码视频帧中人脸所在区域作为所述待编码视频帧的兴趣区域。
如权利要求6所述的视频编码系统，其中，所述编码执行模块，还用于确定所述兴趣区域和非兴趣区域各自所属的宏块；获取所述非兴趣区域所属的各宏块与所述兴趣区域的宏块距离，并基于所述宏块距离确定所述非兴趣区域所属的各宏块各自对应的第一码率，其中，所述宏块距离与第一码率为负相关关系；获取所述兴趣区域对应的第二码率，根据所述第一码率和所述第二码率分别对所述非兴趣区域和兴趣区域进行编码。
如权利要求8所述的视频编码系统，其中，所述编码执行模块，还用于将所述非兴趣区域所属的各宏块对应的宏块距离与预置的距离区间进行比对，确定各宏块对应的宏块距离所处的距离区间；获取预置的距离区间与码率的对应关系，获得各宏块对应的宏块距离所处的距离区间对应的目标码率，将所述目标码率作为各宏块对应的第一码率。
如权利要求6所述的视频编码系统，其中，所述视频编码系统，还包括：

码率调整模块，用于接收到用户终端发送的无观众提示信息，其中，所述无观众提示信息由用户终端检测到没有视线在用户终端屏幕上时所发；降低当前待编码视频帧的编码码率。
一种视频编码设备，其中，所述视频编码设备包括处理器、存储器、以及存储在所述存储器上并可被所述处理器执行的计算机可读指令，其中所述计算机可读指令被所述处理器执行时，实现如下步骤：

获取待编码视频及所述待编码视频的视频信息，从所述视频信息中获得所述待编码视频的视频类型；

在所述待编码视频为影视类视频时，从所述视频信息中获得主要人物的面部特征；

获取待编码视频帧；

基于预设规则对所述待编码视频帧进行人脸检测，获得人脸检测结果，并根据所述人脸检测结果确定所述待编码视频帧中是否存在人脸；

若所述待编码视频帧中不存在人脸，则获取预设的中心区域，将所述中心区域作为所述待编码视频帧的兴趣区域；

若所述待编码视频帧中存在人脸，则根据所述主要人物的面部特征和所述人脸检测结果判断所述待编码视频帧中是否存在与所述主要人物面部特征匹配的目标人脸；

若所述待编码视频帧中存在与所述主要人物面部特征匹配的目标人脸，则将所述目标人脸对应区域作为所述待编码视频帧的兴趣区域；

将所述待编码视频帧中兴趣区域以外的区域作为非兴趣区域；

获取所述兴趣区域和非兴趣区域各自对应的编码码率，并基于所述各自对应的编码码率分别对所述兴趣区域和非兴趣区域进行编码。
如权利要求11所述的视频编码设备，其中，所述根据所述主要人物的面部特征和所述人脸检测结果判断所述待编码视频帧中是否存在与所述主要人物面部特征匹配的目标人脸的步骤之后包括：

若所述待编码视频帧中不存在与所述主要人物面部特征匹配的目标人脸，则将所述待编码视频帧中人脸所在区域作为所述待编码视频帧的兴趣区域。
如权利要求11所述的视频编码设备，其中，所述获取所述兴趣区域和非兴趣区域各自对应的编码码率，并基于所述各自对应的编码码率分别对所述兴趣区域和非兴趣区域进行编码的步骤包括：

确定所述兴趣区域和非兴趣区域各自所属的宏块；

获取所述非兴趣区域所属的各宏块与所述兴趣区域的宏块距离，并基于所述宏块距离确定所述非兴趣区域所属的各宏块各自对应的第一码率，其中，所述宏块距离与第一码率为负相关关系；

获取所述兴趣区域对应的第二码率，根据所述第一码率和所述第二码率分别对所述非兴趣区域和兴趣区域进行编码。
如权利要求13所述的视频编码设备，其中，所述基于所述宏块距离确定所述非兴趣区域所属的各宏块各自对应的第一码率，其中，所述宏块距离与第一码率为负相关关系的步骤包括：

将所述非兴趣区域所属的各宏块对应的宏块距离与预置的距离区间进行比对，确定各宏块对应的宏块距离所处的距离区间；

获取预置的距离区间与码率的对应关系，获得各宏块对应的宏块距离所处的距离区间对应的目标码率，将所述目标码率作为各宏块对应的第一码率。
如权利要求11所述的视频编码设备，其中，所述计算机可读指令被所述处理器执行时，还实现如下步骤：

接收到用户终端发送的无观众提示信息，其中，所述无观众提示信息由用户终端检测到没有视线在用户终端屏幕上时所发；

降低当前待编码视频帧的编码码率。
一种计算机可读存储介质，其中，所述计算机可读存储介质上存储有计算机可读指令，其中所述计算机可读指令被处理器执行时，实现如下步骤：

获取待编码视频及所述待编码视频的视频信息，从所述视频信息中获得所述待编码视频的视频类型；

在所述待编码视频为影视类视频时，从所述视频信息中获得主要人物的面部特征；

获取待编码视频帧；

基于预设规则对所述待编码视频帧进行人脸检测，获得人脸检测结果，并根据所述人脸检测结果确定所述待编码视频帧中是否存在人脸；

若所述待编码视频帧中不存在人脸，则获取预设的中心区域，将所述中心区域作为所述待编码视频帧的兴趣区域；

若所述待编码视频帧中存在人脸，则根据所述主要人物的面部特征和所述人脸检测结果判断所述待编码视频帧中是否存在与所述主要人物面部特征匹配的目标人脸；

若所述待编码视频帧中存在与所述主要人物面部特征匹配的目标人脸，则将所述目标人脸对应区域作为所述待编码视频帧的兴趣区域；

将所述待编码视频帧中兴趣区域以外的区域作为非兴趣区域；

获取所述兴趣区域和非兴趣区域各自对应的编码码率，并基于所述各自对应的编码码率分别对所述兴趣区域和非兴趣区域进行编码。
如权利要求16所述的计算机可读存储介质，其中，所述根据所述主要人物的面部特征和所述人脸检测结果判断所述待编码视频帧中是否存在与所述主要人物面部特征匹配的目标人脸的步骤之后包括：

若所述待编码视频帧中不存在与所述主要人物面部特征匹配的目标人脸，则将所述待编码视频帧中人脸所在区域作为所述待编码视频帧的兴趣区域。
如权利要求16所述的计算机可读存储介质，其中，所述获取所述兴趣区域和非兴趣区域各自对应的编码码率，并基于所述各自对应的编码码率分别对所述兴趣区域和非兴趣区域进行编码的步骤包括：

确定所述兴趣区域和非兴趣区域各自所属的宏块；

获取所述非兴趣区域所属的各宏块与所述兴趣区域的宏块距离，并基于所述宏块距离确定所述非兴趣区域所属的各宏块各自对应的第一码率，其中，所述宏块距离与第一码率为负相关关系；

获取所述兴趣区域对应的第二码率，根据所述第一码率和所述第二码率分别对所述非兴趣区域和兴趣区域进行编码。
如权利要求18所述的计算机可读存储介质，其中，所述基于所述宏块距离确定所述非兴趣区域所属的各宏块各自对应的第一码率，其中，所述宏块距离与第一码率为负相关关系的步骤包括：

将所述非兴趣区域所属的各宏块对应的宏块距离与预置的距离区间进行比对，确定各宏块对应的宏块距离所处的距离区间；

获取预置的距离区间与码率的对应关系，获得各宏块对应的宏块距离所处的距离区间对应的目标码率，将所述目标码率作为各宏块对应的第一码率。
如权利要求16所述的计算机可读存储介质，其中，所述计算机可读指令被处理器执行时，还实现如下步骤：

接收到用户终端发送的无观众提示信息，其中，所述无观众提示信息由用户终端检测到没有视线在用户终端屏幕上时所发；

降低当前待编码视频帧的编码码率。