CN111031272B

CN111031272B - 一种基于视频通讯辅助头像校正的方法

Info

Publication number: CN111031272B
Application number: CN201911359424.6A
Authority: CN
Inventors: 沈梦超; 文志平; 裘昊
Original assignee: Hangzhou Arcvideo Technology Co ltd
Current assignee: Hangzhou Arcvideo Technology Co ltd
Priority date: 2019-12-25
Filing date: 2019-12-25
Publication date: 2021-08-31
Anticipated expiration: 2039-12-25
Also published as: CN111031272A

Abstract

本发明公开了一种基于视频通讯辅助头像校正的方法。它具体包括如下步骤：(1)预览画面及人像示阔图层显示：在自己预览画面上绘制一层带人像轮廓的图层即人像示廓图层；(2)人脸识别：通过人脸识别技术提取到人脸面部特征点获取预览画面的人像轮廓；(3)画面比对：将获取的预览画面的人像轮廓与人像示廓图层进行进行叠加处理，计算出重叠部分与人像示廓图层的百分比是否符合要求；(4)提醒判定：如果符合要求，返回到步骤(2)中；如果不符合要求，则回调上层需要触发提醒。本发明的有益效果是：不会因为一些手机转动而导致长时间的视频画面质量降低，可以更好的提升视频通讯双方的画面体验。

Description

一种基于视频通讯辅助头像校正的方法

技术领域

本发明涉及视频通讯相关技术领域，尤其是指一种基于视频通讯辅助头像校正的方法。

背景技术

随着移动互联网的发展与普及，网速与带宽的逐步增大，视频聊天也已经走进了千家万户。而且使用的视频聊天的年龄跨度也越来越大，从一开始20-30岁的年轻人开始玩起，到现在上至六七十岁的老年人，下至四五岁的儿童都可以使用视频聊天。在使用人群逐渐广泛的情况下，一些问题也逐渐显现。比如，四岁儿童在家里与远方父母进行视频聊天的时候，由于使用手机不熟练等情况，父母经常看不全宝宝的全貌。需要经常进行提醒，也是比较花费精力的，其实效果也不是很好。还有一些情况，在室外使用手机进行一些比较正式的视频会议。这个时候，自己的画面一般展示的会比较小，会将对方的画面放大。但是如果这个时候，手机稍微一点偏移，就有可能长时间以这个角度进行通话，将会给对方一种不好的体验。

发明内容

本发明是为了克服现有技术中存在上述的不足，提供了一种提高视频画面质量的基于视频通讯辅助头像校正的方法。

为了实现上述目的，本发明采用以下技术方案：

一种基于视频通讯辅助头像校正的方法，具体包括如下步骤：

(1)预览画面及人像示阔图层显示：在进入视频通讯接听会话前，有一小段只有自己预览画面的时间，在自己预览画面上绘制一层带人像轮廓的图层即人像示廓图层；

(2)人脸识别：获取预览画面的数据，通过人脸识别技术提取到人脸面部特征点，根据面部特征点获取预览画面的人像轮廓；

(3)画面比对：将步骤(2)中获取的预览画面的人像轮廓与步骤(1)中的人像示廓图层进行进行叠加处理，计算出重叠部分与人像示廓图层的百分比是否符合要求；

(4)提醒判定：如果符合要求，返回到步骤(2)中；如果不符合要求，则回调上层需要触发提醒。

在使用视频通讯的过程中，如果长时间没有很好的预览画面，将会进行提醒。这样可以更好的提升视频通讯双方的画面体验。在一些正式场合中使用，也可以给对方留下更好的印象。使用本方法，在视频会议过程中，头像长时间偏移的时候，会进行一些提醒，用来校正预览方的画面。这样可以用来保证视频通讯过程中，双方收到的画面质量都会比较高，不会因为一些手机转动而导致长时间的视频画面质量降低。

作为优选，在步骤(1)中，人像轮廓图层表示视频效果最佳的区域，即视频通讯的预览方把自己预览画面以这个位置展现出来，视频通讯的接收方将会得到最佳的视听体验；人像轮廓图层可以在本人预览时显示，也可以在视频通讯中全程显示人像轮廓图层；一段只有自己预览画面的时间的长度取决于对方接听的快慢，至少会有3秒以上的时间。

作为优选，在步骤(2)中，获取预览画面的人像轮廓的方法如下：根据人脸面部特征点，计算出人脸所在切线矩形的四个位置坐标，从n个视频帧中抽取1帧进行人脸识别，把抽中的预览画面中识别到的人脸位置坐标实时传输到上层。

作为优选，切线矩形指的是：将人脸以竖直正向的位置放置到一个矩形中，并且这个矩形的四条边紧贴人脸的边缘位置，即把人脸装下的最小矩形。

作为优选，在步骤(3)中，获取到了抽中预览画面的人像轮廓位置的矩形坐标，记作矩形A；获取到的人像示阔图层的矩形坐标，记作矩形B，面积记为S；把矩形A与矩形B进行叠加处理，计算出重叠部分的面积C，然后以矩形B为基准，计算出重叠部分面积占矩形B面积的百分比为C/S×100％；根据需要定义出一个基准值p％，经过计算得到的重叠部分百分比与基准值进行对比，可以知道当前视频帧是否符合要求。

作为优选，在步骤(4)中，定义连续s秒不符合要求，就回调上层需要触发提醒；在触发提醒的时候，可以采用语音提醒，也可以在屏幕上显示字幕提示，也可以同步把人像示阔图层再次打开，供预览画面的预览方进行调整。

本发明的有益效果是：可以用来保证视频通讯过程中，双方收到的画面质量都会比较高，不会因为一些手机转动而导致长时间的视频画面质量降低，可以更好的提升视频通讯双方的画面体验。

附图说明

图1是本发明的方法流程图。

具体实施方式

下面结合附图和具体实施方式对本发明做进一步的描述。

如图1所述的实施例中，一种基于视频通讯辅助头像校正的方法，具体包括如下步骤：

(1)预览画面及人像示阔图层显示：在进入视频通讯接听会话前，有一小段只有自己预览画面的时间，在自己预览画面上绘制一层带人像轮廓的图层即人像示廓图层；人像轮廓图层表示视频效果最佳的区域，即视频通讯的预览方把自己预览画面以这个位置展现出来，视频通讯的接收方将会得到最佳的视听体验；人像轮廓图层可以在本人预览时显示，也可以在视频通讯中全程显示人像轮廓图层；人像轮廓图层只展现人脸的外部线条，线条的颜色采用浅蓝略带透明，所以展示的时候，也不会影响到预览画面的显示；一段只有自己预览画面的时间的长度取决于对方接听的快慢，一般来说至少会有3秒以上的时间，而呼叫一般也会有超时时间，一般在15秒左右，所以正常来说会有3秒至15秒时间。当然如果觉得这个时间不够久的话，也可以在调整完毕后再开始呼叫。

(2)人脸识别：获取预览画面的数据，通过人脸识别技术提取到人脸面部特征点，根据面部特征点获取预览画面的人像轮廓；通过人脸识别技术可以提取到几十个人脸面部特征点，所以根据这些面部特征点，知道整个脸部位于屏幕画面的哪个位置，当然五官的位置也可以对应确定下来；但是，对于当前来说，我们仅需要人脸的外部轮廓。获取预览画面的人像轮廓的方法如下：根据人脸面部特征点，计算出人脸所在切线矩形的四个位置坐标，切线矩形指的是：将人脸以竖直正向的位置放置到一个矩形中，并且这个矩形的四条边紧贴人脸的边缘位置，即把人脸装下的最小矩形；现在的视频通讯系统中camera采集的视频数据一般在25-30帧之间，但是人脸相对来说是比较固定的，不需要每一帧都进行人脸识别，这样会加大整个系统的运行负荷；所以在这里，我们从n个视频帧中抽取1帧进行人脸识别，把抽中的预览画面中识别到的人脸位置坐标实时传输到上层，然后让上层根据人像示阔图层进行具体分析；

(3)画面比对：将步骤(2)中获取的预览画面的人像轮廓与步骤(1)中的人像示廓图层进行进行叠加处理，计算出重叠部分与人像示廓图层的百分比是否符合要求；获取到了抽中预览画面的人像轮廓位置的矩形坐标，记作矩形A；获取到的人像示阔图层的矩形坐标，记作矩形B，面积记为S；把矩形A与矩形B进行叠加处理，计算出重叠部分的面积C，然后以矩形B为基准，计算出重叠部分面积占矩形B面积的百分比为C/S×100％；到了这里，其实我们已经大致知道预览画面在整个屏幕中的准确程度，根据需要定义出一个基准值p％，这个值的意义在于，低于p％时，当前的预览画面是需要干预校正的；当然基准值p％是可以根据实际情况实时调整的，对重叠部分百分比要求相对较高的情况下，可以适当调高基准值p％，反之可以适当降低；经过计算得到的重叠部分百分比与基准值进行对比，可以知道当前视频帧是否符合要求；

(4)提醒判定：如果符合要求，返回到步骤(2)中；如果不符合要求，则回调上层需要触发提醒；定义连续s秒不符合要求，就回调上层需要触发提醒；举例：假设视频源采用25帧，每5个视频帧中抽取一个进行人脸识别，连续6s不合格就需要触发提醒；这种情况下，连续收到30个不符合要求的抽取帧时，即可触发提醒；在触发提醒的时候，可以采用语音提醒，比如语音播报“对方看到你的画面可能不完整哦，请调整一下”，也可以在屏幕上显示字幕提示，也可以同步把人像示阔图层再次打开，供预览画面的预览方进行调整。

Claims

1.一种基于视频通讯辅助头像校正的方法，其特征是，具体包括如下步骤：

（1）预览画面及人像示阔图层显示：在进入视频通讯接听会话前，有一段只有自己预览画面的时间，在自己预览画面上绘制一层带人像轮廓的图层即人像示廓图层；人像示廓图层表示视频效果最佳的区域，即视频通讯的预览方把自己预览画面以这个位置展现出来，视频通讯的接收方将会得到最佳的视听体验；人像示廓图层在视频通讯中全程显示人像示廓图层；一段只有自己预览画面的时间的长度取决于对方接听的快慢，至少会有3秒以上的时间；

（2）人脸识别：获取预览画面的数据，通过人脸识别技术提取到人脸面部特征点，根据面部特征点获取预览画面的人像轮廓；获取预览画面的人像轮廓的方法如下：根据人脸面部特征点，计算出人脸所在切线矩形的四个位置坐标，从n个视频帧中抽取1帧进行人脸识别，把抽中的预览画面中识别到的人脸位置坐标实时传输到上层；

（3）画面比对：将步骤（2）中获取的预览画面的人像轮廓与步骤（1）中的人像示廓图层进行叠加处理，计算出重叠部分与人像示廓图层的百分比是否符合要求；

（4）提醒判定：如果符合要求，返回到步骤（2）中；如果不符合要求，则回调上层触发提醒；定义连续s秒不符合要求，就回调上层触发提醒；在触发提醒的时候，把人像示阔图层再次打开，供预览画面的预览方进行调整。

2.根据权利要求1所述的一种基于视频通讯辅助头像校正的方法，其特征是，切线矩形指的是：将人脸以竖直正向的位置放置到一个矩形中，并且这个矩形的四条边紧贴人脸的边缘位置，即把人脸装下的最小矩形。

3.根据权利要求1所述的一种基于视频通讯辅助头像校正的方法，其特征是，在步骤（3）中，获取到了抽中预览画面的人像轮廓位置的矩形坐标，记作矩形A；获取到的人像示阔图层的矩形坐标，记作矩形B，面积记为S；把矩形A与矩形B进行叠加处理，计算出重叠部分的面积C，然后以矩形B为基准，计算出重叠部分面积占矩形B面积的百分比为C/S×100%；根据需要定义出一个基准值p%，经过计算得到的重叠部分百分比与基准值进行对比，可以知道当前视频帧是否符合要求。