WO2020220546A1

WO2020220546A1 - 一种基于人脸识别的会议管理方法、系统和可读存储介质

Info

Publication number: WO2020220546A1
Application number: PCT/CN2019/103597
Authority: WO
Inventors: 朱胜强
Original assignee: 平安科技（深圳）有限公司
Priority date: 2019-04-30
Filing date: 2019-08-30
Publication date: 2020-11-05
Also published as: CN110072075A; CN110072075B

Abstract

本申请涉及人脸识别技术，具体提供了一种基于人脸识别的会议管理方法、系统和可读存储介质，通过人脸识别技术，对参会者进行面部特征提取，与预设的数据库中的面部特征进行比对，获取人物身份信息，可以自动识别每个参会者的语言信息，自动进行翻译，避免繁琐的人工后台翻译过程，可以满足多语种人员同时进行交流，并最终自动生成会议纪要。通过本申请的技术方案，还可以对会议进行签到；并且还通过面部比对，确定是否为对应参会者，保证了会议的安全性。将参会者的身份信息呈现在视频页面中参会者所在的分屏界面，使得用户能够及时获知每一参会者的身份信息，提高了视频会议的效率，同时提升了用户体验。

Description

一种基于人脸识别的会议管理方法、系统和可读存储介质

本申请要求于2019年4月30日提交中国专利局，申请号为201910359326.6、发明名称为“一种基于人脸识别的会议管理方法、系统和可读存储介质”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本申请涉及人脸识别技术领域，尤其涉及一种基于人脸识别的会议管理方法、系统和可读存储介质。

背景技术

视频会议系统，包括软件视频会议系统和硬件视频会议系统，是指两个或两个以上不同地方的个人或群体，通过现有的各种电信通讯传输媒体，将人物的静、动态图像、语音、文字、图片等多种资料分送到各个用户的计算机上，使得在地理上分散的用户可以共聚一处，通过图形、声音等多种方式交流信息，增加双方对内容的理解能力。

现在一些国际或者大型公司会议中，由于存在不同国家和地区的参会者，所以同传系统都需要人工手动选择收听语言，在参会者发言时，后台对发言人进行人工翻译，需要大量的人力。现有的人工智能翻译产品只能满足单人交流，手动切换语种，不能够自动切换语种，并满足多人多语种交流的目的。

另外，在多方视频会议过程中，接入视频会议的用户可能来自同一公司不同地区的分部，或者来自不同的公司，参加视频会议的多方之间可能彼此并不熟悉，若逐一的进行介绍，必然浪费视频会议的时间，降低视频会议的效率，而在视频会议过程中，若用户不能识别出所有的与会者身份，也不便于沟通交流。

发明内容

为了解决上述至少一个技术问题，本申请提出了一种基于人脸识别的会议管理方法、系统和可读存储介质。

为了实现上述目的，本申请提供了一种基于人脸识别的会议管理方法，包括：

在建立视频连接之后，确定发言者；

对所述发言者进行人脸识别，提取发言者的面部特征数据；

将所述发言者的面部特征数据与预先建立的面部特征数据库中的面部特征数据进行匹配；

当确定所述发言者的面部特征数据与所述面部特征数据库中的任一面部特征数据匹配成功时，获取所述面部特征数据库中该面部特征数据对应的人物身份信息；

通过所述人物身份信息获取语言种类，将所述发言者的发言信息转化为预设的语言文字；

将所述预设的语言文字转换为不同语音信息，发送至其他参会者端进行播放。

本申请第二部分还提供了一种基于人脸识别的会议管理系统，该系统包括：存储器、处理器及摄像装置，所述存储器中包括基于人脸识别的会议管理方法程序，所述基于人脸识别的会议管理方法程序被所述处理器执行时实现如下步骤：

在建立视频连接之后，确定发言者；

对所述发言者进行人脸识别，提取发言者的面部特征数据；

本申请第三方面还提供一种计算机可读存储介质，所述计算机可读存储介质中包括基于人脸识别的会议管理方法程序，所述基于人脸识别的会议管理方法程序被处理器执行时，实现如上述的一种基于人脸识别的会议管理方法的步骤。

本申请通过人脸识别技术，对参会者进行面部特征提取，与预设的数据库中的面部特征进行比对，获取人物身份信息，可以自动识别每个参会者的语言信息，自动进行翻译，避免繁琐的人工后台翻译过程，可以满足多语种人员同时进行交流，并最终自动生成会议纪要。通过本申请的技术方案，还可以对会议进行签到；并且还通过面部比对，确定是否为对应参会者，保证了会议的安全性。将参会者的身份信息呈现在视频页面中参会者所在的分屏界面，使得用户能够及时获知每一参会者的身份信息，提高了视频会议的效率，同时提升了用户体验。

本申请的附加方面和优点将在下面的描述部分中给出，部分将从下面的描述中变得明显，或通过本申请的实践了解到。

附图说明

为了更清楚地说明本申请实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1示出了本申请一种基于人脸识别的会议管理方法的流程图；

图2示出了本申请会议管理中显示方法流程图；

图3示出了本申请会议管理中警告方法的流程图；

图4示出了本申请一种基于人脸识别的会议管理系统的框图。

具体实施方式

为了能够更清楚地理解本申请的上述目的、特征和优点，下面结合附图和具体实施方式对本申请进行进一步的详细描述。需要说明的是，在不冲突的情况下，本申请的实施例及实施例中的特征可以相互组合。

在下面的描述中阐述了很多具体细节以便于充分理解本申请，但是，本申请还可以采用其他不同于在此描述的其他方式来实施，因此，本申请的保护范围并不受下面公开的具体实施例的限制。

图1为本申请一种基于人脸识别的会议管理方法的流程图。

如图1所示，本申请提供了一种基于人脸识别的会议管理方法，包括：

S102，在建立视频连接之后，确定发言者；

S104，对所述发言者进行人脸识别，提取发言者的面部特征数据；

S106，将所述发言者的面部特征数据与预先建立的面部特征数据库中的面部特征数据进行匹配；

S108，当确定所述发言者的面部特征数据与所述面部特征数据库中的任一面部特征数据匹配成功时，获取所述面部特征数据库中该面部特征数据对应的人物身份信息；

S110，通过所述人物身份信息获取语言种类，将所述发言者的发言信息转化为预设的语言文字；

S112，将所述预设的语言文字转换为不同语音信息，发送至其他参会者端进行播放。

需要说明的是，会议管理系统的后台预设有面部特征数据库，其中存储有不同的人物特征信息。面部特征数据库可以与公司内部的HR管理连接，直接获取HR管理系统中存储的职员面部特征数据和人物特征信息。

需要说明的是，人物特征信息包含有工作语言、工作职位、工作职能、工作地点、性别、年龄、入职年限、个人简历、兴趣爱好中的一种或几种。

优选的，所述确定发言者具体为：获取发言者发出的发言信号；所述发言信号为语言信号和/或按键信号。例如，发言者发言前需要点击会议视频设备中的发言按键，在获取了按键信号后，会议系统会切换至发言者的发言状态。又例如，发言者直接进行发言，会议视频设备获取发言者的语音信号，则判定为发言者正在发言。

在确定了人物身份信息后，将发言者的语言信息转换为预设的语言文字。所述预设的语言文字可以是后台技术人员自动设置的，例如，预设的语言文字为汉语，则将发言者的语音信息转换为汉语，然后再由汉语翻译成其他语言进行播放。

图2示出了本申请会议管理中显示方法流程图。

如图2所示，在所述获取所述面部特征数据库中该面部特征数据对应的人物身份信息之后；S202，将所述人物身份信息转换为不同语言文字；S204，将所述不同语言文字发送至对应的参会者所在的分屏界面进行显示。

需要说明的是，每个参会者都对应有自己的工作语言，在发言者进行发言时，会议系统把发言者的人物身份信息翻译成其他参会者自己对应的工作语言，并显示在参会者的分屏界面中。采用此步骤，可以对让参会者了解发言者的基本信息，例如，参会者有美国人、西班牙人、韩国人，其分别对应的工作语言为英语、西班牙语、韩语；则在中国发言人进行发言的时候，在参会者的分屏显示器中会用其对应的语言显示发言人的人物身份信息，包括发言人的职位、入职期限、工作地点等信息。

根据本申请实施例，对参会者进行人脸识别，提取参会者的面部特征数据；将所述参会者的面部特征数据与预先建立的面部特征数据库中的面部特征数据进行匹配；当匹配成功时，形成签到信息。

在匹配成功后，形成签到信息，用以记录参会者是否参会和缺席，并且还可以实时的记录参会者的参会时间，提高了会议的管理，增加了工作效率。

图3示出了本申请会议管理中警告方法的流程图。

如图3所示，根据本申请实施例，在建立视频连接之前还包括：

S302，对参会者进行人脸识别，提取参会者的面部特征数据；

S304，将所述参会者的面部特征数据与预先建立的面部特征数据库中的面部特征数据进行匹配；

S306，若匹配不成功，则屏蔽所述参会者对应的分屏界面，并发送警告信息至服务器端和/或其他参会者端。

需要说明的是，若匹配不成功，则代表此参会者并不是预定的参会人员，为了会议的安全考虑则会屏蔽此参会者的分屏界面，并且切断语言通话，还可以发送警告信息至服务器端进行记录，也可以发送给其他参会者进行提醒。采用此步骤可以做到会议的安全，保证了商业秘密不被窃听和泄露。

根据本申请实施例，所述对所述发言者进行人脸识别，提取发言者的面部特征数据，包括：

根据所述参会者的面部特征，计算所述面部特征的局部特征和全局特征，并将所述局部特征和全局特征组成一个特征向量，将该特征向量作为所述参会者的面部特征数据。

需要说明的是，在进行局部特征和全局特征计算时，可采用如下方法：将参会者的头像和人脸信息与伽柏Gabor函数相卷积，得到参会者头像和人脸信息不同空间位置的多个Gabor特征；将多个Gabor特征按照空间位置进行分块，并将每块内的Gabor特征串接成一个Gabor特征向量，得到多个Gabor特征向量，将多个Gabor特征向量中预设数量的Gabor特征向量作为头像和人脸信息的局部特征。通过二维离散傅里叶变换获取与会者的头像信息中的低频部分作为头像信息的全局特征。局部特征的提取采用Gabor特征提取方法，全局特征的提取采用二维离散傅里叶变换的方式。为了更好地提取正面照片的局部特征，将得到的正面照片的Gabor特征按照空间位置进行分块，例如：采用四宫格或九宫格的分块方式，每一个块内的Gabor特征被串接成一个特征向量，则可以得到多个Gabor特征向量，称为局部Gabor特征向量(Local Gabor Feature Vector，LGFV)。将多个局部Gabor特征向量中预设数量个的局部Gabor特征向量作为正面照片的局部特征，预设数量个的局部Gabor特征向量可以以一定的规则顺序排列，其中，预设数量可以根据人脸中重要的位置进行设置，例如，提取眼睛、鼻子、嘴巴三个部位的局部Gabor特征向量作为局部特征。提取正面照片的全局特征时，通过二维离散傅里叶变换(Discrete Fourier Transform，DFT)提取正面照片的低频部分作为全局特征。将正面照片的局部特征和全局特征组合成一个特征向量，即为员工甲正面照片的面部特征数据，以此方法，计算员工甲的侧面照片的面部特征数据，然后将员工甲的面部特征数据与身份信息的对应关系存储在面部特征数据库中。

根据本申请实施例，还包括：

将所述预设的语言文字转换为会议记录日志。例如，将发言人的发言记录为汉语进行保存，形成会议记录日志，方便在会议后查阅会议记录内容。

图4示出了本申请一种基于人脸识别的会议管理系统的框图。

如图4，本申请第二部分还提供了一种基于人脸识别的会议管理系统，该系统包括：存储41、处理器42及摄像装置43，所述存储器中包括基于人脸识别的会议管理方法程序，所述基于人脸识别的会议管理方法程序被所述处理器执行时实现如下步骤：

在建立视频连接之后，确定发言者；

对所述发言者进行人脸识别，提取发言者的面部特征数据；

需要说明的是，会议管理系统的后台预设有面部特征数据库，其中存储有不同的人物特征信息。面部特征数据库可以与公司内部的HR管理连接，直接获取HR管理系统中存储的职员面部特征数据和人物特征信息。摄像装置43为视频会议设备的摄像头或拍摄装置等用于实现图像采集的装置。

根据本申请实施例，在所述获取所述面部特征数据库中该面部特征数据对应的人物身份信息之后，将所述人物身份信息转换为不同语言文字，将所述不同语言文字发送至对应的参会者所在的分屏界面进行显示。

根据本申请实施例，在建立视频连接之前还包括：

对参会者进行人脸识别，提取参会者的面部特征数据；

将所述参会者的面部特征数据与预先建立的面部特征数据库中的面部特征数据进行匹配；

若匹配不成功，则屏蔽所述参会者对应的分屏界面，并发送警告信息至服务器端和/或其他参会者端。

根据本申请实施例，还包括：

本申请通过人脸识别技术，对参会者进行面部特征提取，与预设的数据库中的面部特征进行比对，获取人物身份信息，可以自动识别每个参会者的语言信息，自动进行翻译，避免繁琐的人工后台翻译过程，可以满足多语种人员同时进行交流，并最终自动生成会议纪要。通过本申请的技术方案，还可以对会议进行签到；并且还通过面部比对，确定是否为对应参会者，保证了会议的安全性。在现有视频会议中，用户可能不能识别出所有的参会者身份，不便于沟通交流，相比现有技术的方案，本申请将参会者的身份信息呈现在视频页面中参会者所在的分屏界面，使得用户能够及时获知每一参会者的身份信息，提高了视频会议的效率，同时提升了用户体验。

在本申请所提供的几个实施例中，应该理解到，所揭露的设备和方法，可以通过其它的方式实现。以上所描述的设备实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，如：多个单元或组件可以结合，或可以集成到另一个系统，或一些特征可以忽略，或不执行。另外，所显示或讨论的各组成部分相互之间的耦合、或直接耦合、或通信连接可以是通过一些接口，设备或单元的间接耦合或通信连接，可以是电性的、机械的或其它形式的。

上述作为分离部件说明的单元可以是、或也可以不是物理上分开的，作为单元显示的部件可以是、或也可以不是物理单元；既可以位于一个地方，也可以分布到多个网络单元上；可以根据实际的需要选择其中的部分或全部单元来实现本实施例方案的目的。

另外，在本申请各实施例中的各功能单元可以全部集成在一个处理单元中，也可以是各单元分别单独作为一个单元，也可以两个或两个以上单元集成在一个单元中；上述集成的单元既可以采用硬件的形式实现，也可以采用硬件加软件功能单元的形式实现。

本领域普通技术人员可以理解：实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成，前述的程序可以存储于计算机可读取存储介质中，该程序在执行时，执行包括上述方法实施例的步骤；而前述的存储介质包括：移动存储设备、只读存储器(ROM，Read-Only Memory)、随机存取存储器(RAM，Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

或者，本申请上述集成的单元如果以软件功能模块的形式实现并作为独立的产品销售或使用时，也可以存储在一个计算机可读取存储介质中。基于这样的理解，本申请实施例的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机、服务器、或者网络设备等)执行本申请各个实施例所述方法的全部或部分。而前述的存储介质包括：移动存储设备、ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述，仅为本申请的具体实施方式，但本申请的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本申请揭露的技术范围内，可轻易想到变化或替换，都应涵盖在本申请的保护范围之内。因此，本申请的保护范围应以所述权利要求的保护范围为准。

Claims

一种基于人脸识别的会议管理方法，其特征在于，包括：

在建立视频连接之后，确定发言者；

对所述发言者进行人脸识别，提取发言者的面部特征数据；

将所述发言者的面部特征数据与预先建立的面部特征数据库中的面部特征数据进行匹配；

当确定所述发言者的面部特征数据与所述面部特征数据库中的任一面部特征数据匹配成功时，获取所述面部特征数据库中该面部特征数据对应的人物身份信息；

通过所述人物身份信息获取语言种类，将所述发言者的发言信息转化为预设的语言文字；

将所述预设的语言文字转换为不同语音信息，发送至其他参会者端进行播放。
根据权利要求1所述的一种基于人脸识别的会议管理方法，其特征在于，还包括：

在所述获取所述面部特征数据库中该面部特征数据对应的人物身份信息之后，将所述人物身份信息转换为不同语言文字；将所述不同语言文字发送至对应的参会者所在的分屏界面进行显示。
根据权利要求1所述的一种基于人脸识别的会议管理方法，其特征在于，还包括：

对参会者进行人脸识别，提取参会者的面部特征数据；将所述参会者的面部特征数据与预先建立的面部特征数据库中的面部特征数据进行匹配；当匹配成功时，形成签到信息。
根据权利要求1所述的一种基于人脸识别的会议管理方法，其特征在于，在建立视频连接之前还包括：

对参会者进行人脸识别，提取参会者的面部特征数据；

将所述参会者的面部特征数据与预先建立的面部特征数据库中的面部特征数据进行匹配；

若匹配不成功，则屏蔽所述参会者对应的分屏界面，并发送警告信息至服务器端和/或其他参会者端。
根据权利要求1所述的一种基于人脸识别的会议管理方法，其特征在于，所述对所述发言者进行人脸识别，提取发言者的面部特征数据，包括：

根据所述参会者的面部特征，计算所述面部特征的局部特征和全局特征，并将所述局部特征和全局特征组成一个特征向量，将该特征向量作为所述参会者的面部特征数据。
根据权利要求1所述的一种基于人脸识别的会议管理方法，其特征在于，还包括：

将所述预设的语言文字转换为会议记录日志。
根据权利要求4所述的一种基于人脸识别的会议管理方法，其特征在于，还包括：

将所述预设的语言文字转换为会议记录日志。
一种基于人脸识别的会议管理系统，其特征在于，该系统包括：存储器、处理器及摄像装置，所述存储器中包括基于人脸识别的会议管理方法程序，所述基于人脸识别的会议管理方法程序被所述处理器执行时实现如下步骤：

在建立视频连接之后，确定发言者；

对所述发言者进行人脸识别，提取发言者的面部特征数据；

将所述发言者的面部特征数据与预先建立的面部特征数据库中的面部特征数据进行匹配；

当确定所述发言者的面部特征数据与所述面部特征数据库中的任一面部特征数据匹配成功时，获取所述面部特征数据库中该面部特征数据对应的人物身份信息；

通过所述人物身份信息获取语言种类，将所述发言者的发言信息转化为预设的语言文字；

将所述预设的语言文字转换为不同语音信息，发送至其他参会者端进行播放。
根据权利要求8所述的一种基于人脸识别的会议管理系统，其特征在于，还包括：

在所述获取所述面部特征数据库中该面部特征数据对应的人物身份信息之后，将所述人物身份信息转换为不同语言文字；将所述不同语言文字发送至对应的参会者所在的分屏界面进行显示。
根据权利要求8所述的一种基于人脸识别的会议管理系统，其特征在于，还包括：

对参会者进行人脸识别，提取参会者的面部特征数据；将所述参会者的面部特征数据与预先建立的面部特征数据库中的面部特征数据进行匹配；当匹配成功时，形成签到信息。
根据权利要求8所述的一种基于人脸识别的会议管理系统，其特征在于，在建立视频连接之前还包括：

对参会者进行人脸识别，提取参会者的面部特征数据；

将所述参会者的面部特征数据与预先建立的面部特征数据库中的面部特征数据进行匹配；

若匹配不成功，则屏蔽所述参会者对应的分屏界面，并发送警告信息至服务器端和/或其他参会者端。
根据权利要求8所述的一种基于人脸识别的会议管理系统，其特征在于，所述对所述发言者进行人脸识别，提取发言者的面部特征数据，包括：

根据所述参会者的面部特征，计算所述面部特征的局部特征和全局特征，并将所述局部特征和全局特征组成一个特征向量，将该特征向量作为所述参会者的面部特征数据。
根据权利要求8所述的一种基于人脸识别的会议管理方法，其特征在于，还包括：

将所述预设的语言文字转换为会议记录日志。
根据权利要求11所述的一种基于人脸识别的会议管理方法，其特征在于，还包括：

将所述预设的语言文字转换为会议记录日志。
一种计算机可读存储介质，其特征在于，所述计算机可读存储介质中包括基于人脸识别的会议管理方法程序，所述基于人脸识别的会议管理方法程序被处理器执行时，实现如下步骤：

在建立视频连接之后，确定发言者；

对所述发言者进行人脸识别，提取发言者的面部特征数据；

将所述发言者的面部特征数据与预先建立的面部特征数据库中的面部特征数据进行匹配；

当确定所述发言者的面部特征数据与所述面部特征数据库中的任一面部特征数据匹配成功时，获取所述面部特征数据库中该面部特征数据对应的人物身份信息；

通过所述人物身份信息获取语言种类，将所述发言者的发言信息转化为预设的语言文字；

将所述预设的语言文字转换为不同语音信息，发送至其他参会者端进行播放。
根据权利要求15所述的一种计算机可读存储介质，其特征在于，还包括：

在所述获取所述面部特征数据库中该面部特征数据对应的人物身份信息之后，将所述人物身份信息转换为不同语言文字；将所述不同语言文字发送至对应的参会者所在的分屏界面进行显示。
根据权利要求15所述的一种计算机可读存储介质，其特征在于，还包括：

对参会者进行人脸识别，提取参会者的面部特征数据；将所述参会者的面部特征数据与预先建立的面部特征数据库中的面部特征数据进行匹配；当匹配成功时，形成签到信息。
根据权利要求15所述的一种计算机可读存储介质，其特征在于，

在建立视频连接之前还包括：

对参会者进行人脸识别，提取参会者的面部特征数据；

将所述参会者的面部特征数据与预先建立的面部特征数据库中的面部特征数据进行匹配；

若匹配不成功，则屏蔽所述参会者对应的分屏界面，并发送警告信息至服务器端和/或其他参会者端。
根据权利要求15所述的一种计算机可读存储介质，其特征在于，所述对所述发言者进行人脸识别，提取发言者的面部特征数据，包括：

根据所述参会者的面部特征，计算所述面部特征的局部特征和全局特征，并将所述局部特征和全局特征组成一个特征向量，将该特征向量作为所述参会者的面部特征数据。
根据权利要求15所述的一种计算机可读存储介质，其特征在于，还包括：

将所述预设的语言文字转换为会议记录日志。