CN111222117A

CN111222117A - 身份信息的识别方法及装置

Info

Publication number: CN111222117A
Application number: CN201911398642.0A
Authority: CN
Inventors: 李旭滨
Original assignee: Unisound Intelligent Technology Co Ltd; Xiamen Yunzhixin Intelligent Technology Co Ltd
Current assignee: Unisound Intelligent Technology Co Ltd; Xiamen Yunzhixin Intelligent Technology Co Ltd
Priority date: 2019-12-30
Filing date: 2019-12-30
Publication date: 2020-06-02

Abstract

本发明是关于身份信息的识别方法及装置。该方法包括：在接收到声源时，确定所述声源的声源方向；根据所述声源方向，拍摄人脸图像；根据所述人脸图像，判断声源的身份信息。通过本发明的技术方案，可准确确定会议场景下发出该声源的发言人身份信息，避免通过麦克风与用户座位之间的匹配关系确定用户身份信息，而这种通过人脸图像确定身份信息的方式也比较灵活，且不再受限于基于会议座位以及该会议座位与麦克风之间的匹配关系来确定用户身份。

Description

身份信息的识别方法及装置

技术领域

本发明涉及终端技术领域，尤其涉及身份信息的识别方法及装置。

背景技术

目前，智能会议室会预先分配麦克风和用户座位之间的匹配关系，然后在麦克风发音时，通过发音的麦克风以及上述匹配关系，确定会议室发言人的身份，而这种确定发言者身份的方式不够灵活，麦克风只能随着开会人员和座位配置，同时会议参加人员的不确定性很可能会导致发言人身份确定不准确。

发明内容

本发明实施例提供了身份信息的识别方法及装置。所述技术方案如下：

根据本发明实施例的第一方面，提供一种身份信息的识别方法，包括：

在接收到声源时，确定所述声源的声源方向；

根据所述声源方向，拍摄人脸图像；

根据所述人脸图像，判断声源的身份信息。

在一个实施例中，所述方法还包括：

在拍摄所述人脸图像之后，启动唇动识别，以判断所述声源是否来自真实发言者；

所述根据所述人脸图像，判断声源的身份信息，包括：

当所述声源来自所述真实发言者时，根据所述真实发言者的人脸图像，判断所述真实发言者的身份信息。

在一个实施例中，所述根据所述人脸图像，判断声源的身份信息，包括：

确定所述声源的声纹信息；

根据所述人脸图像和所述声纹信息，判定所述身份信息。

在一个实施例中，所述声源来自目标区域，所述目标区域四周布置有环形麦克风阵列；

所述方法还包括：

通过所述环形麦克风阵列接收所述声源；

在接收到声源时，确定所述声源的声源方向，包括：

在接收到所述声源时，通过所述环形麦克风阵列确定所述声源方向。

根据本发明实施例的第二方面，提供一种身份信息的识别装置，包括：

确定模块，用于在接收到声源时，确定所述声源的声源方向；

拍摄模块，用于根据所述声源方向，拍摄人脸图像；

判断模块，用于根据所述人脸图像，判断声源的身份信息。

在一个实施例中，所述装置还包括：

启动模块，用于在拍摄所述人脸图像之后，启动唇动识别，以判断所述声源是否来自真实发言者；

所述判断模块包括：

判断子模块，用于当所述声源来自所述真实发言者时，根据所述真实发言者的人脸图像，判断所述真实发言者的身份信息。

在一个实施例中，所述判断模块包括：

第一确定子模块，用于确定所述声源的声纹信息；

判定子模块，用于根据所述人脸图像和所述声纹信息，判定所述身份信息。

所述装置还包括：

接收模块，用于通过所述环形麦克风阵列接收所述声源；

所述确定模块包括：

第二确定子模块，用于在接收到所述声源时，通过所述环形麦克风阵列确定所述声源方向。

本发明的实施例提供的技术方案可以包括以下有益效果：

在接收到声源时，可确定声源的声源方向，进而拍摄该声源方向的人脸图像，以便根据人脸图像自动判断声源的具体身份信息，进而便于根据人脸图像准确确定会议场景下发出该声源的发言人身份信息，避免通过麦克风与用户座位之间的匹配关系确定用户身份信息，而这种通过人脸图像确定身份信息的方式也比较灵活，且不再受限于基于会议座位以及该会议座位与麦克风之间的匹配关系来确定用户身份。

应当理解的是，以上的一般描述和后文的细节描述仅是示例性和解释性的，并不能限制本发明。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分，示出了符合本发明的实施例，并与说明书一起用于解释本发明的原理。

图1是根据一示例性实施例示出的一种身份信息的识别方法的流程图。

图2是根据一示例性实施例示出的另一种身份信息的识别方法的流程图。

图3是根据一示例性实施例示出的一种身份信息的识别装置的框图。

具体实施方式

这里将详细地对示例性实施例进行说明，其示例表示在附图中。下面的描述涉及附图时，除非另有表示，不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本发明相一致的所有实施方式。相反，它们仅是与如所附权利要求书中所详述的、本发明的一些方面相一致的装置和装置的例子。

为了解决上述技术问题，本发明实施例提供了一种身份信息的识别方法，该方法可用于身份信息的识别程序、系统或装置中，且该装置对应的执行主体可以是终端或服务器，如图1所示，该装置包括步骤S101至步骤S103：

在步骤S101中，在会议场景下接收到声源时，确定所述声源的声源方向；

在步骤S102中，根据所述声源方向，拍摄人脸图像；

在步骤S103中，根据所述人脸图像，判断声源的身份信息。

在接收到声源时，可确定声源的声源方向，进而拍摄该声源方向的人脸图像，以便根据人脸图像自动判断声源的具体身份信息，进而便于根据人脸图像准确确定会议场景下发出该声源的发言人身份信息，避免通过麦克风与用户座位之间的匹配关系确定用户身份信息，而这种通过人脸图像确定身份信息的方式也比较灵活，且不再受限于基于会议座位以及该会议座位与麦克风之间的匹配关系来确定用户身份。在判断出身份信息之后，同声传译显示时可同时记录发言人身份信息，也可以结合智能电话机器人通知未到会人员及时参加会议等。

在一个实施例中，所述方法还包括：

所述根据所述人脸图像，判断声源的身份信息，包括：

在拍摄出人脸图像之后，可启动唇动识别，从而判断声源是否来自真实发言者，而非来自播放的录像或音频，若来自真实发言者，则结合真实发言者的人脸图像，自动判断真实发言者的身份信息，以提高真实发言者的判断准确率。

确定所述声源的声纹信息；

根据所述人脸图像和所述声纹信息，判定所述身份信息。

在确定声源的声纹信息之后，可根据人脸图像和声纹信息，自动判断身份信息，这相比于仅仅根据人脸图像确定身份信息而言，显然可提高真实发言者的判断准确率。

在一个实施例中，所述声源来自目标区域，所述目标区域四周(如目标区域的四个角落)布置有环形麦克风阵列；

所述方法还包括：

通过所述环形麦克风阵列接收所述声源；

在接收到声源时，确定所述声源的声源方向，包括：

在通过环形麦克风阵列接收到声源时，可通过该环形麦克风阵列自动确定具体的声源方向，即环形麦克风阵列可实现声源定位，声纹用于辨认辅助四维全方位立体判定发言人身份。

下面将结合图2进一步详细说明本发明的技术方案：

会议室场景下，用户开始发言；

根据会议室提前布置的四角落环形麦克风阵列，来实现分布式拾音和声源定位；

会议室抓拍机根据声源定位方向实现人脸追踪并实时把抓拍到的人脸上传仲裁服务比对结果；

根据抓拍机上传人脸，启用唇动识别，判定声音是否用户真人说的话，并不是播放的录像或音频；

确认真实用户发言后，声纹引擎实时辨认用户身份并上传至仲裁服务；

最终，仲裁服务根据人脸，声纹辨认辅助，输出最终发言人身份。

而本发明通过抓拍机实现人脸定位追踪，唇动识别，环形麦克风阵列实现声源定位，声纹辨认辅助四维全方位立体判定发言人身份。即可以实现ASR同声传译显示的同时记录发言人身份信息，也可以结合智能电话机器人通知未到会人员及时参加会议等。

最后，需要明确的是：本领域技术人员可根据实际需求，将上述多个实施例进行自由组合。

对应本发明实施例提供的上述身份信息的识别方法，本发明实施例还提供一种身份信息的识别装置，如图3所示，该装置包括：

确定模块301，用于在接收到声源时，确定所述声源的声源方向；

拍摄模块302，用于根据所述声源方向，拍摄人脸图像；

判断模块303，用于根据所述人脸图像，判断声源的身份信息。

在一个实施例中，所述装置还包括：

所述判断模块包括：

在一个实施例中，所述判断模块包括：

第一确定子模块，用于确定所述声源的声纹信息；

所述装置还包括：

接收模块，用于通过所述环形麦克风阵列接收所述声源；

所述确定模块包括：

本领域技术人员在考虑说明书及实践这里发明的发明后，将容易想到本发明的其它实施方案。本申请旨在涵盖本发明的任何变型、用途或者适应性变化，这些变型、用途或者适应性变化遵循本发明的一般性原理并包括本发明未发明的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的，本发明的真正范围和精神由下面的权利要求指出。

应当理解的是，本发明并不局限于上面已经描述并在附图中示出的精确结构，并且可以在不脱离其范围进行各种修改和改变。本发明的范围仅由所附的权利要求来限制。

Claims

1.一种身份信息的识别方法，其特征在于，包括：

在接收到声源时，确定所述声源的声源方向；

根据所述声源方向，拍摄人脸图像；

根据所述人脸图像，判断声源的身份信息。

2.根据权利要求1所述的方法，其特征在于，所述方法还包括：

所述根据所述人脸图像，判断声源的身份信息，包括：

3.根据权利要求1所述的方法，其特征在于，

所述根据所述人脸图像，判断声源的身份信息，包括：

确定所述声源的声纹信息；

根据所述人脸图像和所述声纹信息，判定所述身份信息。

4.根据权利要求1至3中任一项所述的方法，其特征在于，

所述声源来自目标区域，所述目标区域四周布置有环形麦克风阵列；

所述方法还包括：

通过所述环形麦克风阵列接收所述声源；

在接收到声源时，确定所述声源的声源方向，包括：

5.一种身份信息的识别装置，其特征在于，包括：

拍摄模块，用于根据所述声源方向，拍摄人脸图像；

判断模块，用于根据所述人脸图像，判断声源的身份信息。

6.根据权利要求5所述的装置，其特征在于，所述装置还包括：

所述判断模块包括：

7.根据权利要求5所述的装置，其特征在于，

所述判断模块包括：

第一确定子模块，用于确定所述声源的声纹信息；

8.根据权利要求5至7中任一项所述的装置，其特征在于，

所述装置还包括：

接收模块，用于通过所述环形麦克风阵列接收所述声源；

所述确定模块包括：