CN111654660B

CN111654660B - 一种基于图像分割的视频会议系统编码传输方法

Info

Publication number: CN111654660B
Application number: CN202010514000.9A
Authority: CN
Inventors: 张吾进; 洪雪荣; 翟青林; 张燕威
Original assignee: Shanghai Newfish Information Technology Co ltd
Current assignee: Shanghai Newfish Information Technology Co ltd
Priority date: 2020-06-08
Filing date: 2020-06-08
Publication date: 2021-03-23
Anticipated expiration: 2040-06-08
Also published as: CN111654660A

Abstract

本发明提供一种基于图像分割的视频会议系统编码传输方法，包括：编码流程开始时，根据实时检测到的网络条件，对预先设定的变化域值进行实时调节，从而得到与当前网络条件相适配的图像单元变化域值；编码端对图像帧进行人脸识别和分割，分割成人脸图像和背景图像，同时得到人脸图像在背景图像上面的位置信息；对人脸图像进行编码，并和位置信息打包发送给解码端；对于背景图像，如果前后背景图像的变化程度不超过图像单元变化域值，则不编码和发送；否则进行编码和发送；解码端进行解码。本发明达到在网络带宽有限的情况下，自动调节编码，减少视频通讯需要的码率，同时保证视频通讯中的重要信息即：人脸图像的流畅性，避免卡顿现象。

Description

一种基于图像分割的视频会议系统编码传输方法

技术领域

本发明属于视频编码传输技术领域，具体涉及一种基于图像分割的视频会议系统编码传输方法。

背景技术

视频会议系统是一种基于网络的多媒体通信系统，其核心功能是多人视频通讯，目前，主要采用以下方式实现：对于每个会议人，实时采集视频图像，其中，每帧视频图像同时包含人脸图像以及背景图像；然后，对采集到的每帧视频图像进行编码，再将编码后的视频图像发送给其他会议人。

上述视频会议系统具有以下问题：传输的每帧编码后的视频图像会占用较多的码率，因此，在带宽一定的条件下，多人同时在线时常常发生带宽不够的情况，从而导致图像模糊以及视频卡顿，影响会议体验。

发明内容

针对现有技术存在的缺陷，本发明提供一种基于图像分割的视频会议系统编码传输方法，可有效解决上述问题。

本发明采用的技术方案如下：

本发明提供一种基于图像分割的视频会议系统编码传输方法，包括以下步骤：

步骤1，编码端对摄像头采集的图像序列进行实时编码并传输给解码端，具体包括：

步骤1.1，当编码流程开始时，变化域值调节模块根据实时检测到的网络条件，对预先设定的变化域值进行实时调节，从而得到与当前网络条件相适配的图像单元变化域值d；

编码端实时接收摄像头采集的原视频图像序列；所述原视频图像序列由多个图像帧按次序组成；其中，每个图像帧均具有唯一的图像帧序列号；图像帧序列号从1开始逐渐增加；

步骤1.2，每当编码端接收到图像帧i时，其中，i为图像帧序列号，编码端对图像帧i进行人脸识别，检测出图像帧i的人脸区域，然后，根据人脸区域，将图像帧i分割成人脸图像A_i和背景图像B_i，同时得到人脸图像A_i在背景图像B_i上面的位置信息P_i；

步骤1.3，对于人脸图像A_i，编码端对人脸图像A_i进行视频压缩编码，得到人脸图像码流M_ai；然后将人脸图像码流M_ai和位置信息P_i打包，得到人脸图像码流数据包E_i，并将人脸图像码流数据包E_i传输给解码端；

对于背景图像B_i，编码端判断当前的背景图像B_i对应的图像帧序列号i是否为1，如果等于1，则编码端对背景图像B_i进行视频压缩编码，得到背景图像码流M_bi；然后将背景图像码流M_bi和位置信息P_i打包，得到背景图像码流数据包F_i，并将背景图像码流数据包F_i传输给解码端；

如果不等于1，则编码端比较背景图像B_i与前一帧的背景图像B_i-1，得到背景图像变化程度，并判断背景图像变化程度是否超过步骤1.1实时得到的图像单元变化域值d，如果不超过，则背景图像B_i不满足编码条件，对背景图像B_i不进行编码处理，也不发送给解码端；如果超过，则对背景图像B_i进行视频压缩编码，得到背景图像码流M_bi；然后将背景图像码流M_bi和位置信息P_i打包，得到背景图像码流数据包F_i，并将背景图像码流数据包F_i传输给解码端；

步骤2，解码端对接收到的来自于编码端的人脸图像码流数据包E_i和背景图像码流数据包F_i进行解码操作，具体包括：

步骤2.1，当解码端接收到来自于编码端的第1个背景图像码流数据包F_j时，其中，j为第1个背景图像码流数据包对应的图像帧序列号，解码端对背景图像码流数据包F_j进行视频解码操作，得到解码背景图像G_j以及对应的位置信息P_j；并在本地存储单元中保存解码背景图像G_j以及对应的位置信息P_j；

后续过程中，只要解码端接收到来自于编码端的其他图像帧序列号的背景图像码流数据包F_v，其中，v为其他的图像帧序列号，v≠j，解码端即对背景图像码流数据包F_v进行视频解码操作，得到解码背景图像G_v以及对应的位置信息P_v；并用新解码得到的解码背景图像G_v以及对应的位置信息P_j更新本地存储单元中已存储的解码背景图像以及对应的位置信息；

步骤2.2，当解码端接收到来自于编码端的人脸图像码流数据包E_i时，解码端对人脸图像码流数据包E_i进行视频解码操作，得到解码人脸图像H_i以及对应的位置信息P_i；

然后，解码端从本地存储单元读取到最新的解码背景图像以及对应的位置信息，假设最新的解码背景图像为G_w，对应的位置信息为P_w，其中，w为最新的解码背景图像对应的图像帧序列号；

然后，将解码人脸图像H_i按照位置信息P_i叠加到解码背景图像G_w的相应位置，得到初始的图像帧S'_i；

步骤2.3，比较位置信息P_i与位置信息P_w的差异，得到解码背景图像G_w中未被解码人脸图像H_i覆盖的空白人脸区域；然后，采用相邻像素图像处理方法，对空白人脸区域进行相邻像素填充，从而得到最终的完整图像帧S_i；

步骤2.4，显示完整图像帧S_i。

优选的，步骤1.1中，对预先设定的变化域值进行实时调节是指：根据网络条件动态反馈调节变化域值，即：当检测到网络条件变差时，增加图像单元变化域值d值，当网络条件变好时，减少图像单元变化域值d值。

优选的，步骤1.3中，采用以下方法比较背景图像B_i与前一帧的背景图像B_i-1，得到背景图像变化程度，进而确定背景图像B_i是否满足编码条件：

按背景图像B_i划分为R个单元区域；以同样的划分方式，将背景图像B_i-1也分为R个单元区域；

将背景图像B_i中的每个位置的单元区域，与背景图像B_i-1同样位置的单元区域进行比较，判断单元区域是否相同，由此得到单元区域不相同的数量，即为变化单元域的数量；假设得到的变化单元域的数量为D；

比较变化单元域的数量D与图像单元变化域值d，若D>d，背景图像B_i满足编码条件；否则，背景图像B_i不满足编码条件。

本发明提供的一种基于图像分割的视频会议系统编码传输方法具有以下优点：

本发明达到在网络带宽有限的情况下，自动调节编码，减少视频通讯需要的码率，同时保证视频通讯中的重要信息即：人脸图像的流畅性，避免卡顿现象。

附图说明

图1为本发明提供的一种基于图像分割的视频会议系统编码传输方法中视频编码方法流程示意图；

图2为本发明提供的背景图像编码控制模块的运行流程图；

图3为本发明提供的一种基于图像分割的视频会议系统编码传输方法中视频解码方法流程示意图。

具体实施方式

为了使本发明所解决的技术问题、技术方案及有益效果更加清楚明白，以下结合附图及实施例，对本发明进行进一步详细说明。应当理解，此处所描述的具体实施例仅用以解释本发明，并不用于限定本发明。

发明人经研究发现，视频会议的画面中，最重要的是人脸信息，背景图像信息可以认为是次要的信息、同时大部分时候背景图像是变化很小的信息。也就是说，视频会议中，对视频中人脸图像最为关注，需要保证人脸图像的清晰度及流畅性，视频中的背景图像相对次要，而背景图像的编码会占用大量的码流，因此，可采用共享背景图像的方式，采取降低背景图像更新帧率的方法，从而有效减少视频码率。

具体的，本发明针对网络视频会议系统设计出的一种视频编码传输方法，在网络条件有限的情况下，可自动调节减少视频传输码率，同时保证视频通讯中人脸图像的流畅性。

具体的，本发明提供一种基于图像分割的视频会议系统编码传输方法，包括以下步骤：

步骤1，编码端对摄像头采集的图像序列进行实时编码并传输给解码端，参考图1，具体包括：

其中，对预先设定的变化域值进行实时调节是指：根据网络条件动态反馈调节变化域值，即：当检测到网络条件变差时，增加图像单元变化域值d值，当网络条件变好时，减少图像单元变化域值d值。

步骤1.2，图像分割过程：每当编码端接收到图像帧i时，其中，i为图像帧序列号，编码端对图像帧i进行人脸识别，检测出图像帧i的人脸区域，然后，根据人脸区域，将图像帧i分割成人脸图像A_i和背景图像B_i，同时得到人脸图像A_i在背景图像B_i上面的位置信息P_i；位置信息P_i可以为坐标信息，例如为人脸图像A_i的中心点，在背景图像B_i上面的坐标信息。

如果不等于1，则编码端比较背景图像B_i与前一帧的背景图像B_i-1，得到背景图像变化程度，并判断背景图像变化程度是否超过步骤1.1实时得到的图像单元变化域值d，如果不超过，则背景图像B_i不满足编码条件，对背景图像B_i不进行编码处理，也不发送给解码端，即：忽略当前背景图像B_i；如果超过，则对背景图像B_i进行视频压缩编码，得到背景图像码流M_bi；然后将背景图像码流M_bi和位置信息P_i打包，得到背景图像码流数据包F_i，并将背景图像码流数据包F_i传输给解码端；

在具体实现上，参考图2，可以采用以下方法比较背景图像B_i与前一帧的背景图像B_i-1，得到背景图像变化程度，进而确定背景图像B_i是否满足编码条件：

其中，图像单元变化域值d是根据实时检测到的网络条件动态反馈调节形成的值；目的在于：当网络条件差时，减少背景图片的发送帧率，以减少码率。

步骤2，解码端对接收到的来自于编码端的人脸图像码流数据包E_i和背景图像码流数据包F_i进行解码操作，参考图3，具体包括：

步骤2.4，显示完整图像帧S_i。

具体的，本发明是应用于视频会议领域的视频编码传输方法，首先根据当前网络条件实时决定一个合适的背景图像变化阈值；即：背景图像变化阈值根据网络条件动态调节；

然后，编码端在需要传输的图像帧中实时检测出人脸图像，将人脸图像与背景图像分割，并记录人脸图像在背景图像的位置信息；

对于检测到的每个人脸图像，对人脸图像进行实时视频压缩编码，再和人脸图像在背景图像的位置信息打包，再发送到解码端；

对于背景图像，得到前后帧背景图像的变化域，再将变化域与背景图像变化阈值进行比较，如果不超过背景图像变化阈值，表明当前背景图像与前一帧背景图像非常相似，因此，不再发送该背景图像；只有当变化域超过背景图像变化阈值时，表明当前背景图像与前一帧背景图像变化较大，才会对该背景图像进行实时视频压缩编码，再和人脸图像在背景图像的位置信息打包，再发送到解码端；

对于解码端，接收到打包后的背景图像后；对打包后的背景图像解码，得到背景图像和人脸图像在背景图像的位置信息；并存储在本地存储单元；后续过程中，只要接收到打包后的背景图像，就对打包后的背景图像解码，并实时更新本地存储单元，使本地存储单元存储最新的背景图像B1和人脸图像在背景图像的位置信息P1；

而对于接收到的打包后的人脸图像，进行解码操作，得到人脸图像A1和人脸图像在背景图像的位置信息P2；然后，根据人脸图像在背景图像的位置信息P2，将人脸图像A1叠加到背景图像B1的相应位置；再根据位置信息P1和位置信息P2的差，得到背景图像B1中未被覆盖的空白人脸区域；再对空白人脸区域进行相邻像素补充，得到完整的视频图像后进行显示。

也就是说，对于编码端，每个人脸图像均需要进行编码并发送给解码端，从而保证人脸图像的流畅性；而对于背景图像，对于连续相似的若干个背景图像，本发明只对第1个背景图像进行编码并发送给解码端，其他背景图像不再编码和发送，从而有效减少背景图像视频传输码率。实现在网络条件有限的情况下，自动调节减少视频传输码率，同时保证视频通讯中人脸图像的流畅性。

对于解码端，只要其没有接收到新的背景图像编码数据，则其连续接收到的多个人脸图像共用同一个背景图像进行图像帧的复原操作。在具体操作时，将人脸图像叠加到背景图像后，由于该人脸图像和背景图像有可能并不是从同一个图像帧中分割得到的，因此，背景图像中会存在一小部分没有被人脸图像覆盖的空白区域，对此部分空白区域采用相邻像素补充即可，由此得到完整的视频图像并显示。

因此，本发明达到在网络带宽有限的情况下，自动调节编码，减少视频通讯需要的码率，同时保证视频通讯中的重要信息即：人脸图像的流畅性，避免卡顿现象。

以上所述仅是本发明的优选实施方式，应当指出，对于本技术领域的普通技术人员来说，在不脱离本发明原理的前提下，还可以做出若干改进和润饰，这些改进和润饰也应视本发明的保护范围。

Claims

1.一种基于图像分割的视频会议系统编码传输方法，其特征在于，包括以下步骤：

后续过程中，只要解码端接收到来自于编码端的其他图像帧序列号的背景图像码流数据包F_v，其中，v为其他的图像帧序列号，v≠j，解码端即对背景图像码流数据包F_v进行视频解码操作，得到解码背景图像G_v以及对应的位置信息P_v；并用新解码得到的解码背景图像G_v以及对应的位置信息P_v更新本地存储单元中已存储的解码背景图像以及对应的位置信息；

步骤2.4，显示完整图像帧S_i。

2.根据权利要求1所述的一种基于图像分割的视频会议系统编码传输方法，其特征在于，步骤1.1中，对预先设定的变化域值进行实时调节是指：根据网络条件动态反馈调节变化域值，即：当检测到网络条件变差时，增加图像单元变化域值d值，当网络条件变好时，减少图像单元变化域值d值。

3.根据权利要求1所述的一种基于图像分割的视频会议系统编码传输方法，其特征在于，步骤1.3中，采用以下方法比较背景图像B_i与前一帧的背景图像B_i-1，得到背景图像变化程度，进而确定背景图像B_i是否满足编码条件：