CN106303565B

CN106303565B - 视频直播的画质优化方法和装置

Info

Publication number: CN106303565B
Application number: CN201610664393.5A
Authority: CN
Inventors: 肖鸿亮
Original assignee: Guangzhou Huaduo Network Technology Co Ltd
Current assignee: Guangzhou Cubesili Information Technology Co Ltd
Priority date: 2016-08-12
Filing date: 2016-08-12
Publication date: 2019-06-18
Anticipated expiration: 2036-08-12
Also published as: CN106303565A

Abstract

本发明提供了一种视频直播的画质优化方法和装置。其中，该方法包括以下步骤：获取摄像头实时拍摄的视频帧；识别所述视频帧中的人脸图像，计算所述人脸图像所指示的人脸对象距所述摄像头的距离；调用与所述距离相对应的优化方案优化所述视频帧的画质，将优化后的视频帧转化为视频流数据并发送至预设服务器。基于本发明，可以随主播距摄像头距离的变化而实时调用对应于该距离的优化方案，从而对视频直播画质进行优化，提升了视频直播的画质，改善了用户的观看体验。

Description

视频直播的画质优化方法和装置

技术领域

本申请涉及网络直播技术领域，尤其是一种视频直播的画质优化方法和装置。

背景技术

随着互联网技术的发展，网络直播间的互动性媒体广播形式得到了不断的发展和广泛的普及。一般而言，网络直播间设有一个主播成员和若干直播间成员。主播成员可以进行跳舞或唱歌等多种形式的表演，通过摄像头实时录制视频并发布到网络直播间，参与成员进入网络直播间后即可观看到主播成员的表演，并可以通过聊天、发送表情等多种方式与主播互动。

现有技术中，为了提升视频直播的画质，已有多种画质优化方法，但是这些方法多是针对相对静态的画面或者主播位置相对固定的视频画面。当主播进行动作幅度较大的表演时，主播的活动范围增加，其距离摄像头的距离随主播的运动而变化，但摄像头的相关参数并不能随这种距离变化而实时调整，从而导致视频直播的画质不佳，降低了用户的观看体验。

发明内容

本申请提供一种视频直播的画质优化方法和装置，解决主播距摄像头距离变化时视频直播画质不佳的问题。

根据本申请的第一方面，本申请提供一种视频直播的画质优化方法，包括如下步骤：获取摄像头实时拍摄的视频帧；识别所述视频帧中的人脸图像，计算所述人脸图像所指示的人脸对象距所述摄像头的距离；调用与所述距离相对应的优化方案优化所述视频帧的画质，将优化后的视频帧转化为视频流数据并发送至预设服务器。

优选的，所述计算所述人脸图像所指示的人脸对象距所述摄像头的距离的步骤，包括如下步骤：计算所述人脸图像在所述视频帧中的图像面积与所述视频帧的图像面积的比值，依据所述比值和预设参数计算所述人脸图像所指示的人脸对象距所述摄像头的距离。

优选的，所述识别所述视频帧中的人脸图像，计算所述人脸图像所指示的人脸对象距所述摄像头的距离的步骤，具体为：识别所述视频帧中的人脸图像，计算所述人脸图像所指示的人脸对象距所述摄像头的距离以及所述人脸图像在视频帧中的位置；所述调用与所述距离相对应的优化方案优化所述视频帧的画质的步骤，具体为：调用与所述距离相对应的优化方案优化所述视频帧中人脸图像所在位置的预设范围内的图像的画质。

优选的，所述计算所述人脸图像在视频帧中的位置的步骤，具体为：计算所述人脸图像距所述视频帧边缘的距离，依据所述人脸图像距所述视频帧边缘的距离确定所述人脸图像在视频帧中的位置。

根据本申请的第二方面，本申请提供一种视频直播的画质优化装置，包括：第一获取模块，用于获取摄像头实时拍摄的视频帧；第一识别模块，用于识别所述视频帧中的人脸图像，计算所述人脸图像所指示的人脸对象距所述摄像头的距离；第一优化模块，用于调用与所述距离相对应的优化方案优化所述视频帧的画质，将优化后的视频帧转化为视频流数据并发送至预设服务器。

根据本申请的第三方面，本申请提供一种视频直播的画质优化方法，包括如下步骤：获取终端设备实时上传的视频流数据；从所述视频流数据中解析出视频帧，识别所述视频帧中的人脸图像，计算所述人脸图像所指示的人脸对象距所述摄像头的距离；调用与所述距离相对应的优化方案优化所述视频帧的画质，将优化后的视频帧转化为视频流数据并发送至预设终端设备。

根据本申请的第四方面，本申请提供一种视频直播的画质优化装置，包括：第二获取模块，用于获取终端设备实时上传的视频流数据；第二识别模块，用于从所述视频流数据中解析出视频帧，识别所述视频帧中的人脸图像，计算所述人脸图像所指示的人脸对象距所述摄像头的距离；第二优化模块，用于调用与所述距离相对应的优化方案优化所述视频帧的画质，将优化后的视频帧转化为视频流数据并发送至预设终端设备。

相对于现有技术，本发明获取摄像头实时拍摄的视频帧,识别所述视频帧中的人脸图像，并计算所述人脸图像所指示的人脸对象距所述摄像头的距离，从而可以调用与所述距离相对应的优化方案来优化视频帧的画质，将优化后的视频帧转化为视频流数据并发送至预设服务器。因此，本发明可以随主播距摄像头距离的变化而实时调用对应于该距离的优化方案，从而对视频直播画质进行优化，提升了视频直播的画质，改善了用户的观看体验。

本发明附加的方面和优点将在下面的描述中部分给出，这些将从下面的描述中变得明显，或通过本发明的实践了解到。

附图说明

本发明上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解，其中：

图1为本发明一种实施例的视频直播的画质优化方法的流程图；

图2为本发明一种实施例的视频直播的画质优化装置的结构示意图；

图3为本发明一种实施例的视频直播的画质优化方法的流程图；

图4为本发明一种实施例的视频直播的画质优化装置的结构示意图。

具体实施方式

下面详细描述本发明的实施例，所述实施例的示例在附图中示出，其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的，仅用于解释本发明，而不能解释为对本发明的限制。

本技术领域技术人员可以理解，除非特意声明，这里使用的单数形式“一”、“一个”、“所述”和“该”也可包括复数形式。应该进一步理解的是，本发明的说明书中使用的措辞“包括”是指存在所述特征、整数、步骤、操作、元件和/或组件，但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作、元件、组件和/或它们的组。应该理解，当我们称元件被“连接”或“耦接”到另一元件时，它可以直接连接或耦接到其他元件，或者也可以存在中间元件。此外，这里使用的“连接”或“耦接”可以包括无线连接或无线耦接。这里使用的措辞“和/或”包括一个或更多个相关联的列出项的全部或任一单元和全部组合。

本技术领域技术人员可以理解，除非另外定义，这里使用的所有术语(包括技术术语和科学术语)，具有与本发明所属领域中的普通技术人员的一般理解相同的意义。还应该理解的是，诸如通用字典中定义的那些术语，应该被理解为具有与现有技术的上下文中的意义一致的意义，并且除非像这里一样被特定定义，否则不会用理想化或过于正式的含义来解释。

本技术领域技术人员可以理解，这里所使用的“终端”、“终端设备”既包括无线信号接收器的设备，其仅具备无发射能力的无线信号接收器的设备，又包括接收和发射硬件的设备，其具有能够在双向通信链路上，进行双向通信的接收和发射硬件的设备。这种设备可以包括：蜂窝或其他通信设备，其具有单线路显示器或多线路显示器或没有多线路显示器的蜂窝或其他通信设备；PCS(Personal Communications Service，个人通信系统)，其可以组合语音、数据处理、传真和/或数据通信能力；PDA(Personal Digital Assistant，个人数字助理)，其可以包括射频接收器、寻呼机、互联网/内联网访问、网络浏览器、记事本、日历和/或GPS(Global Positioning System，全球定位系统)接收器；常规膝上型和/或掌上型计算机或其他设备，其具有和/或包括射频接收器的常规膝上型和/或掌上型计算机或其他设备。这里所使用的“终端”、“终端设备”可以是便携式、可运输、安装在交通工具(航空、海运和/或陆地)中的，或者适合于和/或配置为在本地运行，和/或以分布形式，运行在地球和/或空间的任何其他位置运行。这里所使用的“终端”、“终端设备”还可以是通信终端、上网终端、音乐/视频播放终端，例如可以是PDA、MID(Mobile Internet Device，移动互联网设备)和/或具有音乐/视频播放功能的移动电话，也可以是智能电视、机顶盒等设备。

在对本发明的实施例做出具体阐述之前，有必要先对本发明的应用场景及其原理进行如下的先导性说明。

互联网中，一般包括用户端(用户终端设备)、网络和服务器(如网站的Web服务器等)。其中用户端可以是用户的互联网终端设备，如台式机(PC)、膝上型计算机(Laptop),带有网页浏览功能的智能型设备，如个人数字助理(Personal DigitalAssisstant,PDA)，以及移动互联网设备(Mobile Internet Device,MID)和智能手机(Phone)等。这些终端设备都可以在互联网环境中，典型的如英特网环境中，请求由另一进程(如服务器提供的进程)提供某项服务。

服务器通常是可通过互联网等通信媒介，典型的如英特网访问的远程计算机系统。而且，服务器通常可以为来自互联网的多个用户端提供服务。提供服务过程包括接收用户端发来的请求，收集用户端情报和反馈信息等。实质上，服务器充当计算机网络的信息提供者这一角色。服务器通常位于提供服务的一方，或由服务提供方配置以服务内容，这样的服务提供方可以如互联网服务公司的网站等。

在网络直播过程中，用户通过终端设备上的网络直播应用程序进入网络直播间。在网络直播间内具有两种成员，分别是主播成员和参与成员。主播成员进行直播表演，通过终端设备将录制的视频或音频文件发送至对应的服务器，服务器再将该视频或音频文件发布至网络直播间，以供参与成员观看。

一种视频直播的画质优化方法，该方法从终端设备侧进行描述，其包括如下步骤：

S101：获取摄像头实时拍摄的视频帧。

在进行视频直播时，终端设备提供相应的直播界面。直播界面提供视频显示区域和/或控制区域等，视频显示区域显示主播成员的直播表演，控制区域提供相应的按键，以在用户点击该按键时，实施相应控制或设置。当然，鉴于主播成员和参与成员的身份不同，该直播界面在主播成员的客户端与参与成员的客户端具有一定区别。

主播成员通过点击该控制区域的相应按钮以启动摄像头，开启直播表演，摄像头对主播成员的表演行为进行实时拍摄，终端设备即获取到所拍摄的视频帧。该视频帧中应包含主播成员图像，具体而言，应包含主播成员的人脸图像。当然，主播成员也可通过点击该控制区域的相应按钮以关闭摄像头，从而终止视频直播。

其中，摄像头可以是终端设备自带的摄像头，也可以是终端设备外接的摄像头，例如手机摄像头或笔记本摄像头等。

S102：识别所述视频帧中的人脸图像，计算所述人脸图像所指示的人脸对象距所述摄像头的距离。

通过相应的人脸识别算法以识别视频帧中主播的人脸图像，同时可以计算该人脸图像在视频帧中的图像面积。在不对摄像头进行调整的情况下，同一摄像头具有固定的视角，若忽略相距，则人脸的图像面积与视频帧图像面积的比值同实际人脸距摄像头的距离呈正比关系。若设定人脸的图像面积为S1,视频帧图像面积为S2，人脸实际距摄像头的距离为d，则d＝a*S1/S2,其中a为预定参数。对于一般摄像头而言，当人脸实际距摄像头的距离是50厘米时，人脸图像将完全占据视频帧图像，因此可以设定预定参数a＝0.5m。通过以上算法即可计算出人脸图像所指示的人脸对象距所述摄像头的距离，即人脸实际距摄像头的距离。

S103：调用与所述距离相对应的优化方案优化所述视频帧的画质，将优化后的视频帧转化为视频流数据并发送至预设服务器。

终端设备预存有对应于人脸距摄像头距离的优化方案以及该优化方案与上述距离的映射关系，通过计算出的距离确定映射于该距离的优化方案，从而依据所确定的优化方案对视频帧的画质进行优化。其中，该优化方案包含对应于所述距离的优化参数以及所需实施的优化操作。

在一种示例中，优化参数为对应于所述距离的锐化值。物体距摄像头的距离越远，焦距变长，锐化度下降，导致物体的成像边缘会变模糊，可依据人脸距摄像头的距离确定锐化值，从而依据该锐化值对视频帧进行锐化。在另一种示例中，优化参数为对应于所述距离的为亮度值。物体距摄像头的距离越远，成像的亮度会下降，可依据人脸距摄像头的距离确定亮度值，从而将视频帧图像的亮度调整至该亮度，以对视频帧进行优化。本领域技术人员应理解，上述优化方案的列举仅为几种示例，优化方案不限于上述的锐化值调整和亮度值调整，本领域技术人员可以依据人脸距摄像头的距离确定合理的优化方案以对视频帧画质进行优化。

在对视频帧的画质进行优化后，对视频帧进行编码和压缩等操作，以将视频帧转化为视频流数据，再发送至预设服务器。服务器对视频流数据进行存储，并根据终端设备的请求，例如参与成员的直播间进入请求，从而将视频流数据发送至请求方的终端设备。其中，终端设备可通过客户端或网页访问服务器，服务器将视频流数据发送至请求方的终端设备后，终端设备通过相应的客户端播放器或网页视频播放器观看视频直播。

在一种实施例中，步骤S102识别所述视频帧中的人脸图像，计算所述人脸图像所指示的人脸对象距所述摄像头的距离，具体为：识别所述视频帧中的人脸图像，计算所述人脸图像所指示的人脸对象距所述摄像头的距离以及所述人脸图像在视频帧中的位置；步骤S103调用与所述距离相对应的优化方案优化所述视频帧的画质的步骤，具体为：调用与所述距离相对应的优化方案优化所述视频帧中人脸图像所在位置的预设范围内的图像的画质。

本实施例在识别出视频帧中的人脸图像后，进一步计算人脸图像在视频帧中的位置。具体而言，计算所述人脸图像距所述视频帧四边的距离，从而确定所述人脸图像在视频帧中的位置。由于人脸位置的变动，视频帧中的人脸图像会形成不规则的椭圆形，可通过预定的算法，确定人脸图像的几何中心，以该几何中心所在的位置为人脸图像所在位置。或者，围绕人脸图像的外围设定一个几何区域，且该几何区域为规则的几何形状，以该几何区域的几何中心所在的位置为人脸图像所在位置。

确定人脸图像所在位置后，以人脸图像所在位置为中心，划定预设范围，该预设范围的形状可以呈圆形、方形或其他形状，且该预设范围应包含人脸图像。再调用与人脸对象距所述摄像头的距离相对应的优化方案，优化该预设范围内的图像的画质。鉴于在观看视频直播时，参与成员主要是观看主播成员的脸部，因此可主要对视频帧的人脸图像进行优化，而对视频帧中某一区域实施优化所需的时间远小于对整个视频帧实施优化所需的时间，故通过本实施例可减少终端设备实施优化所需的时间，从而提升视频流数据的上传速度，加快网络传输。

本发明实施例还提供一种视频直播的画质优化装置，如图2所示，其包括：第一获取模块201，用于获取摄像头实时拍摄的视频帧；第一识别模块202，用于识别所述视频帧中的人脸图像，计算所述人脸图像所指示的人脸对象距所述摄像头的距离；第一优化模块203，用于调用与所述距离相对应的优化方案优化所述视频帧的画质，将优化后的视频帧转化为视频流数据并发送至预设服务器。

在一种实施例中，所述第一识别模块202用于计算所述人脸图像在所述视频帧中的图像面积与所述视频帧的图像面积的比值，依据所述比值和预设参数计算所述人脸图像所指示的人脸对象距所述摄像头的距离。

在一种实施例中，所述第一识别模块202用于识别所述视频帧中的人脸图像，计算所述人脸图像所指示的人脸对象距所述摄像头的距离以及所述人脸图像在视频帧中的位置；所述第一优化模块203用于调用与所述距离相对应的优化方案优化所述视频帧中人脸图像所在位置的预设范围内的图像的画质。

在一种实施例中，所述第一识别模块202用于计算所述人脸图像距所述视频帧边缘的距离，依据所述人脸图像距所述视频帧边缘的距离确定所述人脸图像在视频帧中的位置。

上述视频直播的画质优化装置的实施例所包含的功能模块的具体说明，可参见上述视频直播的画质优化方法部分的实施例，在此不做赘述。

本发明实施例还提供一种视频直播的画质优化方法，如图3所示，其包括如下步骤：

S301：获取终端设备实时上传的视频流数据；

S302：从所述视频流数据中解析出视频帧，识别所述视频帧中的人脸图像，计算所述人脸图像所指示的人脸对象距所述摄像头的距离；

S303：调用与所述距离相对应的优化方案优化所述视频帧的画质，将优化后的视频帧转化为视频流数据并发送至预设终端设备。

终端设备通过摄像头实时获取关于主播成员表演的视频帧，将视频帧转化为视频流数据后上传至服务器，服务器即获取到终端设备实时上传的视频流数据。服务器再对视频流数据进行解码，从中解析出原有的视频帧，通过相应的人脸识别算法以识别视频帧中主播的人脸图像，同时可以计算该人脸图像在视频帧中的图像面积。在不对摄像头进行调整的情况下，同一摄像头具有固定的视角，若忽略相距，则人脸的图像面积与视频帧图像面积的比值同实际人脸距摄像头的距离呈正比关系。若设定人脸的图像面积为S1,视频帧图像面积为S2，人脸实际距摄像头的距离为d，则d＝a*S1/S2,其中a为预定参数。对于一般摄像头而言，当人脸实际距摄像头的距离是50厘米时，人脸图像将完全占据视频帧图像，因此可以设定预定参数a＝0.5m。通过以上算法即可计算出人脸图像所指示的人脸对象距所述摄像头的距离，即人脸实际距摄像头的距离。

服务器预存有对应于人脸距摄像头距离的优化方案以及该优化方案与上述距离的映射关系，通过计算出的距离确定映射于该距离的优化方案，从而依据所确定的优化方案对视频帧的画质进行优化。其中，该优化方案包含对应于所述距离的优化参数以及所需实施的优化操作。

在对视频帧的画质进行优化后，服务器再将视频帧转化为视频流数据并进行存储。在终端设备发送播放请求，例如参与成员发送的直播间进入请求时，将视频流数据发送至请求方的终端设备。其中，终端设备可通过客户端或网页访问服务器，服务器将视频流数据发送至请求方的终端设备后，终端设备通过相应的客户端播放器或网页视频播放器观看视频直播。

在一种实施例中，步骤S302中识别所述视频帧中的人脸图像，计算所述人脸图像所指示的人脸对象距所述摄像头的距离的步骤，具体为：识别所述视频帧中的人脸图像，计算所述人脸图像所指示的人脸对象距所述摄像头的距离以及所述人脸图像在视频帧中的位置；步骤S303中调用与所述距离相对应的优化方案优化所述视频帧的画质的步骤，具体为：调用与所述距离相对应的优化方案优化所述视频帧中人脸图像所在位置的预设范围内的图像的画质。

进一步的，步骤S302计算所述人脸图像在视频帧中的位置的步骤，具体为：计算所述人脸图像距所述视频帧边缘的距离，依据所述人脸图像距所述视频帧边缘的距离确定所述人脸图像在视频帧中的位置。

确定人脸图像所在位置后，以人脸图像所在位置为中心，划定预设范围，该预设范围的形状可以呈圆形、方形或其他形状，且该预设范围应包含人脸图像。再调用与人脸对象距所述摄像头的距离相对应的优化方案，优化该预设范围内的图像的画质。对视频帧中某一区域实施优化所需的时间远小于对整个视频帧实施优化所需的时间，故通过本实施例可减少服务器实施优化所需的时间，从而提升视频流数据的下行传输速度。

本发明实施例还提供一种视频直播的画质优化装置，如图4所示，其包括：第二获取模块401，用于获取终端设备实时上传的视频流数据；第二识别模块402，用于从所述视频流数据中解析出视频帧，识别所述视频帧中的人脸图像，计算所述人脸图像所指示的人脸对象距所述摄像头的距离；第二优化模块403，用于调用与所述距离相对应的优化方案优化所述视频帧的画质，将优化后的视频帧转化为视频流数据并发送至预设终端设备。

在一种实施例中，第二识别模块402用于计算所述人脸图像在所述视频帧中的图像面积与所述视频帧的图像面积的比值，依据所述比值和预设参数计算所述人脸图像所指示的人脸对象距所述摄像头的距离。

在一种实施例中，第二识别模块402用于识别所述视频帧中的人脸图像，计算所述人脸图像所指示的人脸对象距所述摄像头的距离以及所述人脸图像在视频帧中的位置；第二优化模块403用于调用与所述距离相对应的优化方案优化所述视频帧中人脸图像所在位置的预设范围内的图像的画质。

进一步的，第二识别模块402用于计算所述人脸图像距所述视频帧边缘的距离，依据所述人脸图像距所述视频帧边缘的距离确定所述人脸图像在视频帧中的位置。

本技术领域技术人员可以理解，本发明包括涉及用于执行本申请中所述操作中的一项或多项的设备。这些设备可以为所需的目的而专门设计和制造，或者也可以包括通用计算机中的已知设备。这些设备具有存储在其内的计算机程序，这些计算机程序选择性地激活或重构。这样的计算机程序可以被存储在设备(例如，计算机)可读介质中或者存储在适于存储电子指令并分别耦联到总线的任何类型的介质中，所述计算机可读介质包括但不限于任何类型的盘(包括软盘、硬盘、光盘、CD-ROM、和磁光盘)、ROM(Read-Only Memory，只读存储器)、RAM(Random Access Memory，随即存储器)、EPROM(Erasable ProgrammableRead-Only Memory，可擦写可编程只读存储器)、EEPROM(Electrically ErasableProgrammable Read-Only Memory，电可擦可编程只读存储器)、闪存、磁性卡片或光线卡片。也就是，可读介质包括由设备(例如，计算机)以能够读的形式存储或传输信息的任何介质。

本技术领域技术人员可以理解，可以用计算机程序指令来实现这些结构图和/或框图和/或流图中的每个框以及这些结构图和/或框图和/或流图中的框的组合。本技术领域技术人员可以理解，可以将这些计算机程序指令提供给通用计算机、专业计算机或其他可编程数据处理方法的处理器来实现，从而通过计算机或其他可编程数据处理方法的处理器来执行本发明公开的结构图和/或框图和/或流图的框或多个框中指定的方案。

本技术领域技术人员可以理解，本发明中已经讨论过的各种操作、方法、流程中的步骤、措施、方案可以被交替、更改、组合或删除。进一步地，具有本发明中已经讨论过的各种操作、方法、流程中的其他步骤、措施、方案也可以被交替、更改、重排、分解、组合或删除。进一步地，现有技术中的具有与本发明中公开的各种操作、方法、流程中的步骤、措施、方案也可以被交替、更改、重排、分解、组合或删除。

以上所述仅是本发明的部分实施方式，应当指出，对于本技术领域的普通技术人员来说，在不脱离本发明原理的前提下，还可以做出若干改进和润饰，这些改进和润饰也应视为本发明的保护范围。

Claims

1.一种视频直播的画质优化方法，其特征在于：包括如下步骤：

获取摄像头实时拍摄的视频帧；

识别所述视频帧中的人脸图像，计算所述人脸图像所指示的人脸对象距所述摄像头的距离以及所述人脸图像在视频帧中的位置；其中，通过预定的算法，确定所述人脸图像的几何中心，以该几何中心所在的位置为所述人脸图像在视频帧中的位置；调用与所述距离相对应的优化方案优化所述视频帧中人脸图像所在位置的预设范围内的图像的画质，将优化后的视频帧转化为视频流数据并发送至预设服务器。

2.根据权利要求1所述的方法，其特征在于：所述计算所述人脸图像所指示的人脸对象距所述摄像头的距离的步骤，包括如下步骤：

计算所述人脸图像在所述视频帧中的图像面积与所述视频帧的图像面积的比值，依据所述比值和预设参数计算所述人脸图像所指示的人脸对象距所述摄像头的距离。

3.根据权利要求1所述的方法，其特征在于：所述计算所述人脸图像在视频帧中的位置的步骤，具体为：

计算所述人脸图像距所述视频帧边缘的距离，依据所述人脸图像距所述视频帧边缘的距离确定所述人脸图像在视频帧中的位置。

4.一种视频直播的画质优化装置，其特征在于：包括：

第一获取模块，用于获取摄像头实时拍摄的视频帧；

第一识别模块，用于识别所述视频帧中的人脸图像，计算所述人脸图像所指示的人脸对象距所述摄像头的距离以及所述人脸图像在视频帧中的位置；其中，通过预定的算法，确定所述人脸图像的几何中心，以该几何中心所在的位置为所述人脸图像在视频帧中的位置；

第一优化模块，用于调用与所述距离相对应的优化方案优化所述视频帧中人脸图像所在位置的预设范围内的图像的画质，将优化后的视频帧转化为视频流数据并发送至预设服务器。

5.一种视频直播的画质优化方法，其特征在于：包括如下步骤：

获取终端设备实时上传的视频流数据；

从所述视频流数据中解析出视频帧，识别所述视频帧中的人脸图像，计算所述人脸图像所指示的人脸对象距摄像头的距离以及所述人脸图像在视频帧中的位置；其中，通过预定的算法，确定所述人脸图像的几何中心，以该几何中心所在的位置为所述人脸图像在视频帧中的位置；

调用与所述距离相对应的优化方案优化所述视频帧中人脸图像所在位置的预设范围内的图像的画质，将优化后的视频帧转化为视频流数据并发送至预设终端设备。

6.根据权利要求5所述的方法，其特征在于：所述计算所述人脸图像所指示的人脸对象距所述摄像头的距离的步骤，包括如下步骤：

7.根据权利要求5所述的方法，其特征在于：所述计算所述人脸图像在视频帧中的位置的步骤，具体为：

8.一种视频直播的画质优化装置，其特征在于：包括：

第二获取模块，用于获取终端设备实时上传的视频流数据；

第二识别模块，用于从所述视频流数据中解析出视频帧，识别所述视频帧中的人脸图像，计算所述人脸图像所指示的人脸对象距摄像头的距离以及所述人脸图像在视频帧中的位置；其中，通过预定的算法，确定所述人脸图像的几何中心，以该几何中心所在的位置为所述人脸图像在视频帧中的位置；

第二优化模块，用于调用与所述距离相对应的优化方案优化所述视频帧中人脸图像所在位置的预设范围内的图像的画质，将优化后的视频帧转化为视频流数据并发送至预设终端设备。