CN116311413A

CN116311413A - 人脸识别方法、装置、设备及存储介质

Info

Publication number: CN116311413A
Application number: CN202211530022.XA
Authority: CN
Inventors: 申庆胜
Original assignee: Beijing Wutong Chelian Technology Co Ltd
Current assignee: Beijing Wutong Chelian Technology Co Ltd
Priority date: 2022-11-30
Filing date: 2022-11-30
Publication date: 2023-06-23

Abstract

本申请公开了人脸识别方法、装置、设备及存储介质，属于计算机技术领域。该方法包括：获取车辆内部区域的图像信息，图像信息由安装于车辆内部的摄像设备采集得到；若图像信息中的人脸个数大于阈值，获取需要进行人脸识别的对象发出的语音指令，语音指令由安装于车辆内部的声音采集设备采集得到；根据声音采集设备对发出语音指令的对象进行定位，得到对象在车辆内的第一位置信息；根据第一位置信息确定对象在图像信息中的人脸信息；根据对象在图像信息中的人脸信息对对象进行人脸识别。该方法在图像信息中的人脸个数大于阈值时，通过对发出语音指令的对象进行定位，可以确定对象在图像信息中的人脸信息，提升了人脸识别的效率和准确率。

Description

人脸识别方法、装置、设备及存储介质

技术领域

本申请实施例涉及计算机技术领域，特别涉及一种人脸识别方法、装置、设备及存储介质。

背景技术

随着计算机技术的不断发展，人脸识别技术越来越广泛地应用在人们的生活中。例如，在车辆驾驶场景中，用户可以通过人脸识别技术登录车载系统或者进行支付操作，方便又快捷。

在相关技术中，通过安装于车辆内部的摄像设备采集到车辆内部区域的图像信息之后，终端对该图像信息中的人脸信息进行识别，识别通过后，便可以利用识别通过的人脸信息进行登录、支付等操作。

该方法中，当图像信息中具有多个人脸信息时，终端会误用错误的人脸信息进行登录、支付等操作，降低了人脸识别的效率和准确率。

发明内容

本申请实施例提供了一种人脸识别方法、装置、设备及存储介质，可用于解决相关技术中存在的问题。所述技术方案如下：

一方面，本申请实施例提供了一种人脸识别方法，所述方法包括：

获取车辆内部区域的图像信息，所述图像信息由安装于所述车辆内部的摄像设备采集得到；

若所述图像信息中的人脸个数大于阈值，获取需要进行人脸识别的对象发出的语音指令，所述语音指令由安装于所述车辆内部的声音采集设备采集得到；

根据所述声音采集设备对发出所述语音指令的对象进行定位，得到所述对象在所述车辆内的第一位置信息；

根据所述第一位置信息确定所述对象在所述图像信息中的人脸信息；

根据所述对象在所述图像信息中的人脸信息对所述对象进行人脸识别。

在一种可能的实现方式中，所述根据所述声音采集设备对发出所述语音指令的对象进行定位，得到所述对象在所述车辆内的第一位置信息之前，还包括：

将所述语音指令与语音提示信息进行匹配，所述语音提示信息由所述车辆的语音系统播报，且用于提示所述语音指令的内容。

在一种可能的实现方式中，所述将所述语音指令与语音提示信息进行匹配之前，还包括：

若所述人脸个数大于所述阈值，获取所述车辆的所述语音系统播报的语音提示信息。

在一种可能的实现方式中，所述根据所述第一位置信息确定所述对象在所述图像信息中的人脸信息，包括：

根据所述第一位置信息，确定所述对象在所述图像信息中的第二位置信息；

将所述第二位置信息对应的人脸信息作为所述对象在所述图像信息中的人脸信息。

在一种可能的实现方式中，所述根据所述第一位置信息，确定所述对象在所述图像信息中的第二位置信息，包括：

将所述第一位置信息映射到所述图像信息中，得到映射结果；

基于所述映射结果指示所述图像信息中存在与所述第一位置信息对应的位置信息，将所述位置信息作为所述对象在所述图像信息中的第二位置信息。

在一种可能的实现方式中，所述语音提示信息包括登录提示信息、支付提示信息中的任一种。

在一种可能的实现方式中，所述语音指令包括登录指令、支付指令中的任一种，所述支付指令用于指示通过对所述对象进行人脸识别，实现对手机端支付账单进行支付的功能。

另一方面，提供了一种人脸识别装置，所述装置包括：

获取模块，用于获取车辆内部区域的图像信息，所述图像信息由安装于所述车辆内部的摄像设备采集得到；

所述获取模块，还用于若所述图像信息中的人脸个数大于阈值，获取需要进行人脸识别的对象发出的语音指令，所述语音指令由安装于所述车辆内部的声音采集设备采集得到；

确定模块，用于根据所述声音采集设备对发出所述语音指令的对象进行定位，得到所述对象在所述车辆内的第一位置信息；

所述确定模块，还用于根据所述第一位置信息确定所述对象在所述图像信息中的人脸信息；

识别模块，用于根据所述对象在所述图像信息中的人脸信息对所述对象进行人脸识别。

在一种可能的实现方式中，所述装置还包括：

匹配模块，用于将所述语音指令与语音提示信息进行匹配，所述语音提示信息由所述车辆的语音系统播报，且用于提示所述语音指令的内容。

在一种可能的实现方式中，所述获取模块，还用于若所述人脸个数大于所述阈值，获取所述车辆的所述语音系统播报的语音提示信息。

在一种可能的实现方式中，所述确定模块，用于根据所述第一位置信息，确定所述对象在所述图像信息中的第二位置信息；

在一种可能的实现方式中，所述确定模块，用于将所述第一位置信息映射到所述图像信息中，得到映射结果；

另一方面，提供了一种计算机设备，所述计算机设备包括处理器和存储器，所述存储器中存储有至少一条计算机程序，所述至少一条计算机程序由所述处理器加载并执行，以使所述计算机设备实现上述任一所述的人脸识别方法。

另一方面，还提供了一种计算机可读存储介质，所述计算机可读存储介质中存储有至少一条计算机程序，所述至少一条计算机程序由处理器加载并执行，以使计算机实现上述任一所述的人脸识别方法。

另一方面，还提供了一种计算机程序产品或计算机程序，所述计算机程序产品或计算机程序包括计算机指令，所述计算机指令存储在计算机可读存储介质中。计算机设备的处理器从所述计算机可读存储介质读取所述计算机指令，处理器执行所述计算机指令，使得所述计算机设备执行上述任一所述的人脸识别方法。

本申请实施例提供的技术方案至少带来如下有益效果：

在本申请实施例中，当图像信息中的人脸个数大于阈值时，通过对发出语音指令的对象进行定位得到该对象的第一位置信息，进而确定对象在图像信息中的人脸信息，根据该人脸信息进行人脸识别。相比于仅能对图像信息中唯一的人脸信息进行识别的方法，该方法在图像信息中具有多个人脸信息时，通过对发出语音指令的对象定位可以得到对象在图像信息中的人脸信息，提升了人脸识别的效率和准确率。

附图说明

为了更清楚地说明本申请实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本申请实施例提供的一种实施环境的示意图；

图2是本申请实施例提供的一种人脸识别方法的流程图；

图3是本申请实施例提供的一种人脸识别方法的后台控制的示意图；

图4是本申请实施例提供的一种人脸识别方法的逻辑判断图；

图5是本申请实施例提供的一种人脸识别装置的结构示意图；

图6是本申请实施例提供的一种服务器的结构示意图；

图7是本申请实施例提供的一种终端的结构示意图。

具体实施方式

为使本申请的目的、技术方案和优点更加清楚，下面将结合附图对本申请实施方式作进一步地详细描述。

本申请实施例提供了一种人脸识别方法，请参考图1，其示出了本申请实施例提供的方法实施环境的示意图。以该方法应用于车辆驾驶场景为例，该实施环境可以包括：终端11和服务器12。

其中，终端11安装有能够进行人脸识别的应用程序或者网页，当该应用程序或者网页需要进行人脸识别时，可应用本申请实施例提供的方法进行识别。服务器12可以对需要进行人脸识别的人脸信息进行存储，终端11可以从服务器12上获取需要进行人脸识别的人脸信息。当然，终端11也可以对获取的人脸信息进行存储。

可选地，终端11可以是诸如车载终端、智能车机等的智能设备。服务器12可以是一台服务器，也可以是由多台服务器组成的服务器集群，或者是一个云计算服务中心。终端11与服务器12通过有线或无线网络建立通信连接。

本领域技术人员应能理解上述终端11和服务器12仅为举例，其他现有的或今后可能出现的终端或服务器如可适用于本申请，也应包含在本申请保护范围以内，并在此以引用方式包含于此。

本申请实施例提供了一种人脸识别方法，该方法可应用于上述图1所示的实施环境。如图2所示，以该方法应用于终端为例，该方法包括步骤201-步骤205。

在步骤201中，获取车辆内部区域的图像信息，图像信息由安装于车辆内部的摄像设备采集得到。

本申请实施例不对摄像设备的类型加以限定，只要能够采集车内座位上的人员的图像即可。示例性地，摄像设备可以是具有车内人员监控系统(Occupant MonitoringSystem，OMS)的摄像头。车载终端对车辆内部的摄像设备下发拍摄指令，摄像设备接收到拍摄指令之后对车辆内部的区域进行图像采集工作，得到车辆内部区域的图像信息，然后将该图像信息上传至终端，终端便可以获得车辆内部区域的图像信息。

在步骤202中，若图像信息中的人脸个数大于阈值，获取需要进行人脸识别的对象发出的语音指令，语音指令由安装于车辆内部的声音采集设备采集得到。

终端获取到车辆内部的图像信息之后，对该图像信息进行检测，以确定图像信息中的人脸个数。若终端检测到图像信息中的人脸个数大于阈值，对车辆内部的声音采集设备下发语音采集指令，该指令用于指示采集需要进行人脸识别的对象发出的语音指令。声音采集设备接收到语音采集指令之后，采集语音指令，然后将采集到的语音指令上传至终端。其中，本申请实施例不对阈值的大小加以限定，示例性地，该阈值可以为1，即表示当图像信息中的人脸个数大于1时，终端获取需要进行人脸识别的对象发出的语音指令。本申请实施例也不对声音采集设备的类型加以限定，只要能采集车辆内部的语音即可，示例性地，声音采集设备可以是麦克风阵列。本申请不对麦克风阵列的类型加以限定，例如，可以采用线性阵列、平面阵列以及立体阵列等。

此外，本申请实施例可应用于登录场景以及支付场景等，因此，在一种可能的实现方式中，语音指令包括登录指令、支付指令中的任一种。本申请不对登录指令的作用加以限定，示例性地，登录指令可以用于指示通过对需要进行人脸识别的对象进行人脸识别，以登录车机系统，或者通过人脸识别实现对手机端应用软件等的登录；同理，支付指令可以用于指示通过对需要进行人脸识别的对象进行人脸识别，实现对手机端支付账单进行支付的功能。

在本申请实施例中，终端确定所图像信息中的人脸个数大于阈值之后，需先获取车辆的语音系统播报的语音提示信息。示例性地，语音提示信息用于提示语音指令的内容。本申请实施例不对语音提示信息的内容加以限定，只要能提示车内人员说出对应的语音指令即可。因此，在一种可能的实现方式中，语音提示信息包括登录提示信息和支付提示信息。以本申请实施例应用于登录场景为例，语音提示信息的内容可以为“检测到多位车内人员，请需要登录人员说登录”。

在一种可能的实现方式中，终端获取到车辆的语音系统播报的语音提示信息之后，需将语音指令和语音提示信息进行匹配。

示例性地，若语音提示信息为“检测到多位车内人员，请需要登录的人员说登录”，那么，终端获取的语音指令为“登录”时，通过语音转文本，将语音指令转换的文本与语音提示信息进行比对，如果二者内容一致，可以确定语音指令和语音提示信息匹配成功。

在步骤203中，根据声音采集设备对发出语音指令的对象进行定位，得到对象在车辆内的第一位置信息。

根据步骤202中的内容，声音采集设备不仅可以采集需要进行人脸识别的对象发出的语音指令，还可以对发出语音指令的对象进行定位。本申请实施例不对定位的方式加以限定，示例性地，可以采用时间到达差、波束形成以及声全息等方式确定对象在车辆内的位置，并将该位置作为发出语音指令的对象在车辆内的第一位置信息。示例性地，第一位置信息可以是副驾驶位置以及主驾驶位置等等。

在步骤204中，根据第一位置信息确定对象在图像信息中的人脸信息。

终端获得发出语音指令的对象在车辆内的第一位置信息之后，若想确定对象在图像信息中的人脸信息，需先根据第一位置信息确定对象在图像信息中的第二位置信息。在一种可能的实现方式中，根据第一位置信息，确定对象在图像信息中的第二位置信息，包括：将第一位置信息映射到图像信息中，得到映射结果；基于映射结果指示图像信息中存在与第一位置信息对应的位置信息，将位置信息作为对象在图像信息中的第二位置信息。

本申请实施例不对映射方式加以限定，以对象在车辆内的第一位置信息为副驾驶位置为例，终端获取到对象在车辆内的位置为副驾驶之后，对图像信息进行检测，检测图像信息中符合副驾驶位置特征的区域。本申请实施例也不对终端的检测方法加以限定，示例性地，终端可以通过机器学习训练检测车内各区域的的能力。若终端在图像信息中检测到副驾驶对应的位置信息，则可以将该位置信息作为对象在图像信息中的第二位置信息。在一种可能的实现方式中，将第二位置信息对应的人脸信息作为对象在图像信息中的人脸信息。

终端得到需要进行人脸识别的对象在图像信息中的第二位置信息之后，将该信息对应的人脸信息作为对象在图像信息中的人脸信息，也即为终端需要进行人脸识别，以进行登录或支付等操作的人脸信息。

在步骤205中，根据对象在图像信息中的人脸信息对对象进行人脸识别。

在本申请实施例中，若终端检测到图像信息中的人脸个数为1时，也即代表图像信息中只有一个人脸信息，则终端直接对该一个人脸信息进行识别即可。若终端检测到图像信息中具有多个人脸信息，则需按照上述步骤202至步骤204的方法确定需要进行人脸识别的对象在图像信息中的人脸信息。终端确定对象在图像信心中的人脸信息之后，对该人脸信息进行人脸识别即可，以便进行进一步的登录或支付等操作。

图3为人脸识别方法的后台控制的示意图。硬件设备包括摄像设备和声音采集设备，图3中，摄像设备为摄像头，声音采集设备为麦克风阵列。摄像头采集的车内的图像信息可用于进行多人脸检测，麦克风阵列采集的车内的语音指令可以用于对发出语音指令的对象进行定位。其中，图像信息对应图3中的图像数据，语音指令对应图3中的声音数据。通过多人脸检测和语音定位，可以确定最终要进行人脸识别的人脸信息。且多人脸检测、语音定位以及人脸确定过程均在人脸安全认证系统内完成。

图4为人脸识别方法的逻辑判断图。图4中，401为进入人脸登录或支付页面，进入人脸登录或支付页面之后，终端需控制位于车内的摄像设备采集车内的图像信息，其中，图像信息也可以称作图像数据，采集图像数据的过程即为步骤402。终端获取到图像信息之后，执行步骤403，即检测图像信息中是否有多个人脸信息。若图像信息中不具有多个人脸信息，也即为图像信息中只有一个人脸信息时，执行步骤404，终端直接对该一个人脸信息进行人脸认证。若图像信息中具有多个人脸信息，则执行步骤405，终端控制车辆的语音系统播报语音提示信息，图4中的语音提示信息即为“检测到多位车内人员，请需要登录人员说登录或支付”。车内需要进行人脸识别的对象接收到语音提示信息之后，会发出语音指令，该语音指令可以是“登录”，也可以是“支付”，该过程即对应图4中的步骤406。随后，终端控制安装于车内的声音采集设备接收车内需要进行人脸识别的对象发出的语音指令，并进行关键字匹配，该步骤对应图4中的步骤407，其中，麦克风阵列即为声音采集设备，声音数据即为语音指令，关键字的匹配即为将语音指令和语音提示信息进行匹配。关键字匹配成功后，执行步骤408，终端控制声音采集设备对提供声音数据的对象进行定位，得到对象在车辆内的位置信息，进而确定对象在图像信息中的人脸信息，其中，声音采集设备对提供声音数据的对象进行定位即为对发出语音指令的需要进行人脸识别的对象进行定位。

参见图5，本申请实施例提供了一种人脸识别装置，该装置包括：

获取模块501，用于获取车辆内部区域的图像信息，图像信息由安装于车辆内部的摄像设备采集得到；

获取模块501，还用于若图像信息中的人脸个数大于阈值，获取需要进行人脸识别的对象发出的语音指令，语音指令由安装于车辆内部的声音采集设备采集得到；

确定模块502，用于根据声音采集设备对发出语音指令的对象进行定位，得到对象在车辆内的第一位置信息；

确定模块502，还用于根据第一位置信息确定对象在图像信息中的人脸信息；

识别模块503，用于根据对象在图像信息中的人脸信息对对象进行人脸识别。

在一种可能的实现方式中，装置还包括：

匹配模块，用于将语音指令与语音提示信息进行匹配，语音提示信息由车辆的语音系统播报，且用于提示语音指令的内容。

在一种可能的实现方式中，获取模块501，还用于若人脸个数大于阈值，获取车辆的语音系统播报的语音提示信息。

在一种可能的实现方式中，确定模块502，用于根据第一位置信息，确定对象在图像信息中的第二位置信息；

将第二位置信息对应的人脸信息作为对象在图像信息中的人脸信息。

在一种可能的实现方式中，确定模块502，用于将第一位置信息映射到图像信息中，得到映射结果；

基于映射结果指示图像信息中存在与第一位置信息对应的位置信息，将位置信息作为对象在图像信息中的第二位置信息。

在一种可能的实现方式中，语音提示信息包括登录提示信息、支付提示信息中的任一种。

在一种可能的实现方式中，语音指令包括登录指令、支付指令中的任一种，支付指令用于指示通过对对象进行人脸识别，实现对手机端支付账单进行支付的功能。

在本申请实施例中，当图像信息中的人脸个数大于阈值时，通过对发出语音指令的对象进行定位得到该对象的第一位置信息，进而确定对象在图像信息中的人脸信息，根据该人脸信息进行人脸识别。相比于仅能对图像信息中唯一的人脸信息进行识别的装置，该装置在图像信息中具有多个人脸信息时，通过对发出语音指令的对象定位可以得到对象在图像信息中的人脸信息，提升了人脸识别的效率和准确率。

需要说明的是，上述实施例提供的装置在实现其功能时，仅以上述各功能模块的划分进行举例说明，实际应用中，可以根据需要而将上述功能分配由不同的功能模块完成，即将设备的内部结构划分成不同的功能模块，以完成以上描述的全部或者部分功能。另外，上述实施例提供的装置与方法实施例属于同一构思，其具体实现过程详见方法实施例，这里不再赘述。

图6是本申请实施例提供的一种服务器的结构示意图，该服务器可因配置或性能不同而产生比较大的差异，可以包括一个或多个处理器601和一个或多个存储器602，其中，处理器601可以是中央处理器(Central Processing Units，CPU)，该一个或多个存储器602中存储有至少一条计算机程序，该至少一条计算机程序由该一个或多个处理器601加载并执行，以使该服务器实现上述各个方法实施例提供的人脸识别方法。其中，当然，该服务器还可以具有有线或无线网络接口、键盘以及输入输出接口等部件，以便进行输入输出，该服务器还可以包括其他用于实现设备功能的部件，在此不做赘述。

图7是本申请实施例提供的一种终端的结构示意图。该终端可以是：智能手机、平板电脑、笔记本电脑或台式电脑。终端还可能被称为用户设备、便携式终端、膝上型终端、台式终端等其他名称。

通常，终端包括有：处理器1501和存储器1502。

处理器1501可以包括一个或多个处理核心，比如4核心处理器、8核心处理器等。处理器1501可以采用DSP(Digital Signal Processing，数字信号处理)、FPGA(Field-Programmable Gate Array，现场可编程门阵列)、PLA(Programmable Logic Array，可编程逻辑阵列)中的至少一种硬件形式来实现。处理器1501也可以包括主处理器和协处理器，主处理器是用于对在唤醒状态下的数据进行处理的处理器，也称CPU(Central ProcessingUnit，中央处理器)；协处理器是用于对在待机状态下的数据进行处理的低功耗处理器。在一些实施例中，处理器1501可以集成有GPU(Graphics Processing Unit，图像处理器)，GPU用于负责显示屏所需要显示的内容的渲染和绘制。一些实施例中，处理器1501还可以包括AI(Artificial Intelligence，人工智能)处理器，该AI处理器用于处理有关机器学习的计算操作。

存储器1502可以包括一个或多个计算机可读存储介质，该计算机可读存储介质可以是非暂态的。存储器1502还可包括高速随机存取存储器，以及非易失性存储器，比如一个或多个磁盘存储设备、闪存存储设备。在一些实施例中，存储器1502中的非暂态的计算机可读存储介质用于存储至少一个指令，该至少一个指令用于被处理器1501所执行，以使该终端实现本申请中方法实施例提供的人脸识别方法。

在一些实施例中，终端还可选包括有：外围设备接口1503和至少一个外围设备。处理器1501、存储器1502和外围设备接口1503之间可以通过总线或信号线相连。各个外围设备可以通过总线、信号线或电路板与外围设备接口1503相连。具体地，外围设备包括：射频电路1504、显示屏1505、摄像头组件1506、音频电路1507、定位组件1508和电源1509中的至少一种。

外围设备接口1503可被用于将I/O(Input/Output，输入/输出)相关的至少一个外围设备连接到处理器1501和存储器1502。在一些实施例中，处理器1501、存储器1502和外围设备接口1503被集成在同一芯片或电路板上；在一些其他实施例中，处理器1501、存储器1502和外围设备接口1503中的任意一个或两个可以在单独的芯片或电路板上实现，本实施例对此不加以限定。

射频电路1504用于接收和发射RF(Radio Frequency，射频)信号，也称电磁信号。射频电路1504通过电磁信号与通信网络以及其他通信设备进行通信。射频电路1504将电信号转换为电磁信号进行发送，或者，将接收到的电磁信号转换为电信号。可选地，射频电路1504包括：天线系统、RF收发器、一个或多个放大器、调谐器、振荡器、数字信号处理器、编解码芯片组、用户身份模块卡等等。射频电路1504可以通过至少一种无线通信协议来与其它终端进行通信。该无线通信协议包括但不限于：城域网、各代移动通信网络(2G、3G、4G及5G)、无线局域网和/或WiFi(Wireless Fidelity，无线保真)网络。在一些实施例中，射频电路1504还可以包括NFC(Near Field Communication，近距离无线通信)有关的电路，本申请对此不加以限定。

显示屏1505用于显示UI(User Interface，用户界面)。该UI可以包括图形、文本、图标、视频及其它们的任意组合。当显示屏1505是触摸显示屏时，显示屏1505还具有采集在显示屏1505的表面或表面上方的触摸信号的能力。该触摸信号可以作为控制信号输入至处理器1501进行处理。此时，显示屏1505还可以用于提供虚拟按钮和/或虚拟键盘，也称软按钮和/或软键盘。在一些实施例中，显示屏1505可以为一个，设置在终端的前面板；在另一些实施例中，显示屏1505可以为至少两个，分别设置在终端的不同表面或呈折叠设计；在另一些实施例中，显示屏1505可以是柔性显示屏，设置在终端的弯曲表面上或折叠面上。甚至，显示屏1505还可以设置成非矩形的不规则图形，也即异形屏。显示屏1505可以采用LCD(Liquid Crystal Display，液晶显示屏)、OLED(Organic Light-Emitting Diode，有机发光二极管)等材质制备。

摄像头组件1506用于采集图像或视频。可选地，摄像头组件1506包括前置摄像头和后置摄像头。通常，前置摄像头设置在终端的前面板，后置摄像头设置在终端的背面。在一些实施例中，后置摄像头为至少两个，分别为主摄像头、景深摄像头、广角摄像头、长焦摄像头中的任意一种，以实现主摄像头和景深摄像头融合实现背景虚化功能、主摄像头和广角摄像头融合实现全景拍摄以及VR(Virtual Reality，虚拟现实)拍摄功能或者其它融合拍摄功能。在一些实施例中，摄像头组件1506还可以包括闪光灯。闪光灯可以是单色温闪光灯，也可以是双色温闪光灯。双色温闪光灯是指暖光闪光灯和冷光闪光灯的组合，可以用于不同色温下的光线补偿。

音频电路1507可以包括麦克风和扬声器。麦克风用于采集用户及环境的声波，并将声波转换为电信号输入至处理器1501进行处理，或者输入至射频电路1504以实现语音通信。出于立体声采集或降噪的目的，麦克风可以为多个，分别设置在终端的不同部位。麦克风还可以是阵列麦克风或全向采集型麦克风。扬声器则用于将来自处理器1501或射频电路1504的电信号转换为声波。扬声器可以是传统的薄膜扬声器，也可以是压电陶瓷扬声器。当扬声器是压电陶瓷扬声器时，不仅可以将电信号转换为人类可听见的声波，也可以将电信号转换为人类听不见的声波以进行测距等用途。在一些实施例中，音频电路1507还可以包括耳机插孔。

定位组件1508用于定位终端的当前地理位置，以实现导航或LBS(Location BasedService，基于位置的服务)。

电源1509用于为终端中的各个组件进行供电。电源1509可以是交流电、直流电、一次性电池或可充电电池。当电源1509包括可充电电池时，该可充电电池可以支持有线充电或无线充电。该可充电电池还可以用于支持快充技术。

在一些实施例中，终端还包括有一个或多个传感器1510。该一个或多个传感器1510包括但不限于：加速度传感器1511、陀螺仪传感器1512、压力传感器1513、指纹传感器1514、光学传感器1515以及接近传感器1516。

加速度传感器1511可以检测以终端建立的坐标系的三个坐标轴上的加速度大小。比如，加速度传感器1511可以用于检测重力加速度在三个坐标轴上的分量。处理器1501可以根据加速度传感器1511采集的重力加速度信号，控制显示屏1505以横向视图或纵向视图进行用户界面的显示。加速度传感器1511还可以用于游戏或者用户的运动数据的采集。

陀螺仪传感器1512可以检测终端的机体方向及转动角度，陀螺仪传感器1512可以与加速度传感器1511协同采集用户对终端的3D动作。处理器1501根据陀螺仪传感器1512采集的数据，可以实现如下功能：动作感应(比如根据用户的倾斜操作来改变UI)、拍摄时的图像稳定、游戏控制以及惯性导航。

压力传感器1513可以设置在终端的侧边框和/或显示屏1505的下层。当压力传感器1513设置在终端的侧边框时，可以检测用户对终端的握持信号，由处理器1501根据压力传感器1513采集的握持信号进行左右手识别或快捷操作。当压力传感器1513设置在显示屏1505的下层时，由处理器1501根据用户对显示屏1505的压力操作，实现对UI界面上的可操作性控件进行控制。可操作性控件包括按钮控件、滚动条控件、图标控件、菜单控件中的至少一种。

指纹传感器1514用于采集用户的指纹，由处理器1501根据指纹传感器1514采集到的指纹识别用户的身份，或者，由指纹传感器1514根据采集到的指纹识别用户的身份。在识别出用户的身份为可信身份时，由处理器1501授权该用户执行相关的敏感操作，该敏感操作包括解锁屏幕、查看加密信息、下载软件、支付及更改设置等。指纹传感器1514可以被设置在终端的正面、背面或侧面。当终端上设置有物理按键或厂商Logo(商标)时，指纹传感器1514可以与物理按键或厂商Logo集成在一起。

光学传感器1515用于采集环境光强度。在一个实施例中，处理器1501可以根据光学传感器1515采集的环境光强度，控制显示屏1505的显示亮度。具体地，当环境光强度较高时，调高显示屏1505的显示亮度；当环境光强度较低时，调低显示屏1505的显示亮度。在另一个实施例中，处理器1501还可以根据光学传感器1515采集的环境光强度，动态调整摄像头组件1506的拍摄参数。

接近传感器1516，也称距离传感器，通常设置在终端的前面板。接近传感器1516用于采集用户与终端的正面之间的距离。在一个实施例中，当接近传感器1516检测到用户与终端的正面之间的距离逐渐变小时，由处理器1501控制显示屏1505从亮屏状态切换为息屏状态；当接近传感器1516检测到用户与终端的正面之间的距离逐渐变大时，由处理器1501控制显示屏1505从息屏状态切换为亮屏状态。

本领域技术人员可以理解，图7中示出的结构并不构成对终端的限定，可以包括比图示更多或更少的组件，或者组合某些组件，或者采用不同的组件布置。

在示例性实施例中，还提供了一种计算机设备，该计算机设备包括处理器和存储器，该存储器中存储有至少一条计算机程序。该至少一条计算机程序由一个或者一个以上处理器加载并执行，以使该计算机设备实现上述任一种人脸识别方法。

在示例性实施例中，还提供了一种计算机可读存储介质，该计算机可读存储介质中存储有至少一条计算机程序，该至少一条计算机程序由计算机设备的处理器加载并执行，以使计算机实现上述任一种人脸识别方法。

在一种可能实现方式中，上述计算机可读存储介质可以是只读存储器(Read-OnlyMemory，ROM)、随机存取存储器(Random Access Memory，RAM)、只读光盘(Compact DiscRead-Only Memory，CD-ROM)、磁带、软盘和光数据存储设备等。

在示例性实施例中，还提供了一种计算机程序产品或计算机程序，该计算机程序产品或计算机程序包括计算机指令，该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令，处理器执行该计算机指令，使得该计算机设备执行上述任一种人脸识别方法。

需要说明的是，本申请所涉及的信息(包括但不限于用户设备信息、用户个人信息等)、数据(包括但不限于用于分析的数据、存储的数据、展示的数据等)以及信号，均为经用户授权或者经过各方充分授权的，且相关数据的收集、使用和处理需要遵守相关国家和地区的相关法律法规和标准。例如，本申请中涉及到的车辆内部区域的图像信息等都是在充分授权的情况下获取的。

应当理解的是，在本文中提及的“多个”是指两个或两个以上。“和/或”，描述关联对象的关联关系，表示可以存在三种关系，例如，A和/或B，可以表示：单独存在A，同时存在A和B，单独存在B这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。

需要说明的是，本申请的说明书和权利要求书中的术语“第一”、“第二”等(如果存在)是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施。以上示例性实施例中所描述的实施方式并不代表与本申请相一致的所有实施方式。相反，它们仅是与如所附权利要求书中所详述的、本申请的一些方面相一致的装置和方法的例子。

以上所述仅为本申请的示例性实施例，并不用以限制本申请，凡在本申请的原则之内，所作的任何修改、等同替换、改进等，均应包含在本申请的保护范围之内。

Claims

1.一种人脸识别方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，所述根据所述声音采集设备对发出所述语音指令的对象进行定位，得到所述对象在所述车辆内的第一位置信息之前，还包括：

3.根据权利要求2所述的方法，其特征在于，所述将所述语音指令与语音提示信息进行匹配之前，还包括：

4.根据权利要求1所述的方法，其特征在于，所述根据所述第一位置信息确定所述对象在所述图像信息中的人脸信息，包括：

5.根据权利要求4所述的方法，其特征在于，所述根据所述第一位置信息，确定所述对象在所述图像信息中的第二位置信息，包括：

6.根据权利要求2所述的方法，其特征在于，所述语音提示信息包括登录提示信息、支付提示信息中的任一种。

7.根据权利要求1-6任一所述的方法，其特征在于，所述语音指令包括登录指令、支付指令中的任一种，所述支付指令用于指示通过对所述对象进行人脸识别，实现对手机端支付账单进行支付的功能。

8.一种人脸识别装置，其特征在于，所述装置包括：

9.一种计算机设备，其特征在于，所述计算机设备包括处理器和存储器，所述存储器中存储有至少一条计算机程序，所述至少一条计算机程序由所述处理器加载并执行，以使所述计算机设备实现如权利要求1至7任一所述的人脸识别方法。

10.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质中存储有至少一条计算机程序，所述至少一条计算机程序由处理器加载并执行，以使计算机实现如权利要求1至7任一所述的人脸识别方法。