CN105590104A

CN105590104A - 识别方法、装置及电子设备

Info

Publication number: CN105590104A
Application number: CN201511032295.1A
Authority: CN
Inventors: 张守鹏
Original assignee: Lenovo Beijing Ltd
Current assignee: Lenovo Beijing Ltd
Priority date: 2015-12-31
Filing date: 2015-12-31
Publication date: 2016-05-18

Abstract

本发明实施例公开了一种识别方法、装置及电子设备，获取在待识别对象进行语音发声时采集的待识别对象的图像；从所获取的图像中提取待识别对象语音发声时的生物特征信息；将所提取的生物特征信息与预存储的若干生物特征模板进行匹配，进而实现对待识别对象的身份识别，而由于待识别对象进行语音发声时的生物特征受化妆等外部因素影响较小，因而通过待识别对象进行语音发声时的生物特征进行身份识别提高了身份识别的可靠性。

Description

识别方法、装置及电子设备

技术领域

本发明涉及识别技术领域，更具体地说，涉及一种识别方法、装置及电子设备。

背景技术

目前的身份识别方法大多基于照片实现，例如，将采集的待识别对象的人脸照片与预存储的人脸照片进行比对，从而确定所采集照片中人脸的身份。然而，受到化妆、年龄等因素的影响，传统的身份识别方法容易出错，可靠性较低。

因此，如何提高身份识别的可靠性成为亟待解决的问题。

发明内容

本发明的目的是提供一种识别方法、装置及电子设备，以提高身份识别的可靠性。

为实现上述目的，本发明提供了如下技术方案：

一种识别方法，包括：

获取在待识别对象进行语音发声时采集的所述待识别对象的图像；

从所获取的图像中提取所述待识别对象语音发声时的生物特征信息；

将所提取的生物特征信息与预存储的若干生物特征模板进行匹配，确定与所提取的生物特征匹配的第一生物特征模板；

将与所述第一生物特征模板对应的身份信息确定为所述待识别对象的身份信息。

上述方法，优选的，所述获取在待识别对象进行语音发声时采集的所述待识别对象的图像包括：

同时采集所述待识别对象的语音和所述待识别对象的图像；

对所采集的语音进行语音识别；

当语音识别结果为第一预设信息时，获取在语音识别结果为所述第一预设信息的语音的采集时刻采集的所述待识别对象的图像。

上述方法，优选的，所述将所提取的生物特征信息与预存储的若干生物特征模板进行匹配包括：

依据预置的预设信息与生物特征模板的对应关系，在所述预存储的若干生物特征模板中确定与所述第一预设信息对应的生物特征模板；

将所提取的生物特征信息与所确定的生物特征模板进行匹配。

上述方法，优选的，所述待识别对象语音发声时的生物特征信息包括：所述待识别对象在语音发声时所述待识别对象的预定部位的运动轨迹；所述从所获取的图像中提取所述待识别对象的生物特征信息包括：

对所获取的图像进行第一处理，得到第一处理结果，所述第一处理结果表征所述预定部位在各帧图像中的位置；

基于所述预定部分在各帧图像中的位置，确定所述待识别对象在语音发声时所述待识别对象的预定部位的运动轨迹。

上述方法，优选的，所述待识别对象语音发声时的生物特征信息包括：所述待识别对象的预定部位在预定发声时刻的形态；所述从所获取的图像中提取所述待识别对象的生物特征信息包括：

获取在所述待识别对象的预定发声时刻采集的图像；

对所获取的图像进行第二处理，得到第二处理结果，所述第二处理结果表征所述预定部位的边界特征；

基于所述预定部位的边界特征，确定所述待识别对象的预定部位在所述预定发声时刻的形态。

一种识别装置，包括：

获取模块，用于获取在待识别对象进行语音发声时采集的所述待识别对象的图像；

提取模块，用于从所获取的图像中提取所述待识别对象语音发声时的生物特征信息；

匹配模块，用于将所提取的生物特征信息与预存储的若干生物特征模板进行匹配，确定与所提取的生物特征匹配的第一生物特征模板；

确定模块，用于将与所述第一生物特征模板对应的身份信息确定为所述待识别对象的身份信息。

上述装置，优选的，所述获取模块包括：

采集单元，用于同时采集所述待识别对象的语音和所述待识别对象的图像；

语音识别单元，用于对所采集的语音进行语音识别；

第一获取单元，用于当语音识别结果为第一预设信息时，获取在语音识别结果为所述第一预设信息的语音的采集时刻采集的所述待识别对象的图像。

上述装置，优选的，所述匹配模块包括：

第一确定单元，用于依据预置的预设信息与生物特征模板的对应关系，在所述预存储的若干生物特征模板中确定与所述第一预设信息对应的生物特征模板；

匹配单元，用于将所提取的生物特征信息与所确定的生物特征模板进行匹配。

上述装置，优选的，所述待识别对象语音发声时的生物特征信息包括：所述待识别对象在语音发声时所述待识别对象的预定部位的运动轨迹；所述提取模块包括：

第一处理单元，用于对所获取的图像进行第一处理，得到第一处理结果，所述第一处理结果表征所述预定部位在各帧图像中的位置；

第二确定单元，用于基于所述预定部分在各帧图像中的位置，确定所述待识别对象在语音发声时所述待识别对象的预定部位的运动轨迹。

上述装置，优选的，所述待识别对象语音发声时的生物特征信息包括：所述待识别对象的预定部位在预定发声时刻的形态；所述提取模块包括：

第二获取单元，用于获取在所述待识别对象的预定发声时刻采集的图像；

第二处理单元，用于对所获取的图像进行第二处理，得到第二处理结果，所述第二处理结果表征所述预定部位的边界特征；

第三确定单元，用于基于所述预定部位的边界特征，确定所述待识别对象的预定部位在所述预定发声时刻的形态。

一种电子设备，包括如上任意一项所述的识别装置。

通过以上方案可知，本申请提供的一种识别方法、装置及电子设备，获取在待识别对象进行语音发声时采集的待识别对象的图像；从所获取的图像中提取待识别对象语音发声时的生物特征信息；将所提取的生物特征信息与预存储的若干生物特征模板进行匹配，进而实现对待识别对象的身份识别，而由于待识别对象进行语音发声时的生物特征受化妆等外部因素影响较小，因而通过待识别对象进行语音发声时的生物特征进行身份识别提高了身份识别的可靠性。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本发明实施例提供的识别方法的一种实现流程图；

图2为本发明实施例提供的获取在待识别对象进行语音发声时采集的所述待识别对象的图像的一种实现流程图；

图3为本发明实施例提供的将所提取的生物特征信息与预存储的若干生物特征模板进行匹配的一种实现流程图；

图4为本发明实施例提供的从所获取的图像中提取待识别对象语音发声时的生物特征信息的一种实现流程图；

图5为本发明实施例提供的从所获取的图像中提取待识别对象语音发声时的生物特征信息的另一种实现流程图；

图6为本发明实施例提供的识别装置的一种结构示意图；

图7为本发明实施例提供的获取模块的一种结构示意图；

图8为本发明实施例提供的匹配模块的一种结构示意图；

图9为本发明实施例提供的提取模块的一种结构示意图；

图10为本发明实施例提供的提取模块的另一种结构示意图。

说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”“第四”等(如果存在)是用于区别类似的部分，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的本申请的实施例能够以除了在这里图示的以外的顺序实施。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有付出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

请参阅图1，图1为本发明实施例提供的识别方法的一种实现流程图，可以包括：

步骤S11：获取在待识别对象进行语音发声时采集的待识别对象的图像；

本发明实施例中，在待识别对象说话的过程中采集待识别对象的图像。例如，可以在向待识别对象提问的过程中采集待识别对象的图像。该提问过程可以由电子设备发起，也可以由真人发起。

步骤S12：从所获取的图像中提取待识别对象语音发声时的生物特征信息；

由于所获取的图像是在待识别对象说话过程中采集的，因此，所图像中提取的待识别对象的生物特征信息表征待识别对象的动态特征。

步骤S13：将所提取的生物特征信息与预存储的若干生物特征模板进行匹配，确定与所提取的生物特征匹配的第一生物特征模板；

预存储的生物特征模板也是待识别对象处于动态时的生物特征信息，可以预先在待识别对象进行语音发声时采集待识别对象的图像，对所采集的待识别对象的图像进行生物特征提取建立该待识别对象处于动态时的生物特征模板。并建立该待识别对象的身份信息与生物特征模板的关联关系。

可选的，可以将与所提取的生物特征的匹配度高于预设阈值，且匹配度最高的生物特征模板确定为第一生物特征模板。

步骤S14：将与第一生物特征模板对应的身份信息确定为待识别对象的身份信息。

本发明实施例提供的识别方法，获取在待识别对象进行语音发声时采集的待识别对象的图像；从所获取的图像中提取待识别对象语音发声时的生物特征信息；将所提取的生物特征信息与预存储的若干生物特征模板进行匹配，进而实现对待识别对象的身份识别，而由于待识别对象进行语音发声时的生物特征受化妆等外部因素影响较小，因而通过待识别对象进行语音发声时的生物特征进行身份识别提高了身份识别的可靠性。

可选的，本发明实施例提供的获取在待识别对象进行语音发声时采集的所述待识别对象的图像的一种实现流程图如图2所示，可以包括：

步骤S21：同时采集待识别对象的语音和该待识别对象的图像；

也就是说，在采集待识别对象的语音的同时，采集该待识别对象的图像。

步骤S22：对所采集的语音进行语音识别；

步骤S23：当语音识别结果为第一预设信息时，获取在语音识别结果为所述第一预设信息的语音的采集时刻采集的所述待识别对象的图像。

本发明实施例中，可以预置若干个预设信息，第一预设信息可以是该若干个预设信息中的至少一个。

本发明实施例中，不是获取所采集的待识别对象的图像的所有图像，而是只获取待识别对象的图像中的一部分。该部分图像根据语音识别结果确定，若语音识别结果为第一预设信息，则确定语音识别结果为第一预设信息的语音的采集时间，然后只获取在该语音采集时间内采集的待识别对象的图像。也就是说，若语音识别结果为第一预设信息的语音的采集时间为t1～t2时间段内，则获取在t1～t2时间段内采集的待识别对象的图像。

可选的，本发明实施例提供的将所提取的生物特征信息与预存储的若干生物特征模板进行匹配的一种实现流程图如图3所示，可以包括：

步骤S31：依据预置的预设信息与生物特征模板的对应关系，在预存储的若干生物特征模板中确定与第一预设信息对应的生物特征模板；

对于同一个待识别对象，不同的预设信息，生物特征可能不同，因此，本发明实施例中，针对不同的预设信息，分别建立生物特征模板，并建立预设信息与生物特征模板的关联关系。

举例来说，预设信息可以是某个特定的词，如星期三、周三等等；也可以是音素信息，如元音发声、辅音发声等。

步骤S32：将所提取的生物特征信息与所确定的生物特征模板进行匹配，确定与所提取的生物特征匹配的第一生物特征模板。

本发明实施例中，只将所提取的生物特征信息与部分生物特征模板(即与第一预设信息对应的生物特征模板)进行匹配，减少了匹配过程的计算量，提高了匹配效率。

可选的，本发明实施例中，待识别对象语音发声时的生物特征信息可以包括：待识别对象在语音发声时所述待识别对象的预定部位的运动轨迹；相应的，本发明实施例提供的从所获取的图像中提取待识别对象语音发声时的生物特征信息的一种实现流程图如图4所示，可以包括：

步骤S41：对所获取的图像进行第一处理，得到第一处理结果，第一处理结果表征预定部位在各帧图像中的位置；

本发明实施例中，特定部位可以是待识别对象的口部的、眼部等。具体的，可以在特定部位选取若干特定点，确定该若干个特征点在各帧图像中的位置。由于各帧图像的采集时间不同，因此，预定部位在各帧图像中的位置即为预定部分在不同时刻的位置。根据预定部位在各帧图像中的位置，可以确定该预定部位的运动轨迹。

步骤S42：基于预定部分在各帧图像中的位置，确定待识别对象在语音发声时所述待识别对象的预定部位的运动轨迹。

可选的，本发明实施例中，待识别对象语音发声时的生物特征信息可以包括：待识别对象的预定部位在预定发声时刻的形态；相应的，本发明实施例提供的从所获取的图像中提取待识别对象语音发声时的生物特征信息的另一种实现流程图如图5所示，可以包括：

步骤S51：获取在所述待识别对象的预定发声时刻采集的图像；

预定发声时刻可以是预定的元音的发声时刻，和/或，预定的辅音发声时刻。

步骤S52：对所获取的图像进行第二处理，得到第二处理结果，第二处理结果表征预定部位的边界特征；

本发明实施例中，特定部位可以是待识别对象的口部的、眼部等。

步骤S53：基于预定部位的边界特征，确定待识别对象的预定部位在预定发声时刻的形态。

预定部分的形态即为预定部位的形状或姿态。

可选的，若未找到与所提取的生物特征信息相匹配的生物特征模板，说明数据库中未存储该识别对象的身份信息，则可以保存该待识别对象的生物特征信息，并建立该识别对象的身份信息与该待识别对象的生物特征信息的关联关系。

与方法实施例相对应，本发明实施例还提供一种识别装置，本发明实施例提供的识别装置的一种结构示意图如图6所示，可以包括：

获取模块61，提取模块62，匹配模块63和确定模块64；其中，

获取模块61用于获取在待识别对象进行语音发声时采集的所述待识别对象的图像；

提取模块62用于从所获取的图像中提取所述待识别对象语音发声时的生物特征信息；

由于所获取的图像是在待识别对象说话过程中采集的，因此，所图像中提取的待识别对象的生物特征表征待识别对象的动态特征。

匹配模块63用于将所提取的生物特征信息与预存储的若干生物特征模板进行匹配，确定与所提取的生物特征匹配的第一生物特征模板；

确定模块64用于将与所述第一生物特征模板对应的身份信息确定为所述待识别对象的身份信息。

本发明实施例提供的识别装置，获取在待识别对象进行语音发声时采集的待识别对象的图像；从所获取的图像中提取待识别对象语音发声时的生物特征信息；将所提取的生物特征信息与预存储的若干生物特征模板进行匹配，进而实现对待识别对象的身份识别，而由于待识别对象进行语音发声时的生物特征受化妆等外部因素影响较小，因而通过待识别对象进行语音发声时的生物特征进行身份识别提高了身份识别的可靠性。

可选的，本发明实施例提供的获取模块61的一种结构示意图如图7所示，可以包括：

采集单元71，语音识别单元72和第一获取单元73；其中，

采集单元71用于同时采集待识别对象的语音和待识别对象的图像；

也就是说，采集单元71在采集待识别对象的语音的同时，采集该待识别对象的图像。

语音识别单元72用于对所采集的语音进行语音识别；

第一获取单元73用于当语音识别结果为第一预设信息时，获取在语音识别结果为第一预设信息的语音的采集时刻采集的待识别对象的图像。

可选的，本发明实施例提供的匹配模块63的一种结构示意图如图8所示，可以包括：

第一确定单元81和匹配单元82；其中，

第一确定单元81用于依据预置的预设信息与生物特征模板的对应关系，在预存储的若干生物特征模板中确定与第一预设信息对应的生物特征模板；

对于同一个待识别对象，不同的预设信息，生物特可能不同，因此，本发明实施例中，针对不同的预设信息，分别建立生物特征模板，并建立预设信息与生物特征模板的关联关系。

匹配单元82用于将所提取的生物特征信息与所确定的生物特征模板进行匹配，确定与所提取的生物特征匹配的第一生物特征模板。

可选的，本发明实施例中，待识别对象语音发声时的生物特征信息可以包括：待识别对象在语音发声时所述待识别对象的预定部位的运动轨迹；相应的，本发明实施例提供的提取模块62的一种结构示意图如图9所示，可以包括：

第一处理单元91和第二确定单元92；其中，

第一处理单元91用于对所获取的图像进行第一处理，得到第一处理结果，第一处理结果表征预定部位在各帧图像中的位置；

第二确定单元92用于基于预定部分在各帧图像中的位置，确定待识别对象的预定部位的运动轨迹。

可选的，本发明实施例中，待识别对象语音发声时的生物特征信息可以包括：待识别对象的预定部位在预定发声时刻的形态；相应的，本发明实施例提供的提取模块62的另一种结构示意图如图10所示，可以包括：

第二获取单元101，第二处理单元102和第三确定单元103；其中，

第二获取单元101用于获取在所述待识别对象的预定发声时刻采集的图像；

第二处理单元102用于对所获取的图像进行第二处理，得到第二处理结果，第二处理结果表征预定部位的边界特征；

第三确定单元103用于基于预定部位的边界特征，确定待识别对象的预定部位在所述预定发声时刻的形态。

预定部分的形态即为预定部位的形状或姿态。

可选的，本发明实施例提供的识别装置还可以包括：

保存模块，用于若匹配模块63未找到与所提取的生物特征信息相匹配的生物特征模板，说明数据库中未存储该识别对象的身份信息，则可以保存该待识别对象的生物特征信息，并建立该识别对象的身份信息与该待识别对象的生物特征信息的关联关系。

本发明实施例还提供一种电子设备，该电子设备具有图6-图10任意一图所示实施例公开的识别装置。

基于本发明实施例提供的识别方法、装置及电子设备，可以随机对待识别对象进行提问，同时采集待识别对象的语音及图像，对于同一时间采集的第一语音和和第一图像(第一图像可能只是一帧图像，也可能是若干帧图像)，对第一语音进行识别得到识别结果，从识别结果中提取预设信息，从第一图像中提取待识别对象的预定部位的生物特征，将提取的生物特征与预设信息对应的生物特征模板进行匹配，确定与所提取的生物特征匹配的生物特征模板，该生物特征模板对应的身份信息即为待识别对象的身份信息。

为了使得待识别对象说出预设信息，可以向待识别对象提问有针对性的问题。为了进一步提高识别准确率，可以随机对待识别对象进行提问。

本领域普通技术人员可以意识到，结合本文中所公开的实施例描述的各示例的单元及算法步骤，能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行，取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本发明的范围。

所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的系统(若存在)、装置和单元的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

在本申请所提供的几个实施例中，应该理解到，所揭露的系统(若存在)、装置和方法，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，装置或单元的间接耦合或通信连接，可以是电性，机械或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本发明各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。

所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(ROM，Read-OnlyMemory)、随机存取存储器(RAM，RandomAccessMemory)、磁碟或者光盘等各种可以存储程序代码的介质。

对所公开的实施例的上述说明，使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的，本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下，在其它实施例中实现。因此，本发明将不会被限制于本文所示的这些实施例，而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims

1.一种识别方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，所述获取在待识别对象进行语音发声时采集的所述待识别对象的图像包括：

同时采集所述待识别对象的语音和所述待识别对象的图像；

对所采集的语音进行语音识别；

3.根据权利要求2所述的方法，其特征在于，所述将所提取的生物特征信息与预存储的若干生物特征模板进行匹配包括：

4.根据权利要求1所述的方法，其特征在于，所述待识别对象语音发声时的生物特征信息包括：所述待识别对象在语音发声时所述待识别对象的预定部位的运动轨迹；所述从所获取的图像中提取所述待识别对象语音发声时的生物特征信息包括：

5.根据权利要求1所述的方法，其特征在于，所述待识别对象语音发声时的生物特征信息包括：所述待识别对象的预定部位在预定发声时刻的形态；所述从所获取的图像中提取所述待识别对象语音发声时的生物特征信息包括：

获取在所述待识别对象的预定发声时刻采集的图像；

6.一种识别装置，其特征在于，包括：

7.根据权利要求6所述的装置，其特征在于，所述获取模块包括：

语音识别单元，用于对所采集的语音进行语音识别；

8.根据权利要求7所述的装置，其特征在于，所述匹配模块包括：

9.根据权利要求6所述的装置，其特征在于，所述待识别对象语音发声时的生物特征信息包括：所述待识别对象在语音发声时所述待识别对象的预定部位的运动轨迹；所述提取模块包括：

10.根据权利要求6所述的装置，其特征在于，所述待识别对象语音发声时的生物特征信息包括：所述待识别对象的预定部位在预定发声时刻的形态；所述提取模块包括：

11.一种电子设备，其特征在于，包括如权利要求6-10任意一项所述的识别装置。