CN116097619A

CN116097619A - 使用生物识别数据验证身份的系统和方法

Info

Publication number: CN116097619A
Application number: CN202180058751.7A
Authority: CN
Inventors: 马克·伯克兰; 安吉尔·埃斯特班·加西亚
Original assignee: Wernag Commercial Co
Current assignee: Wernag Commercial Co
Priority date: 2020-06-11
Filing date: 2021-06-11
Publication date: 2023-05-09
Also published as: EP4165852A1; WO2021252914A1; US20210390962A1; BR112022025286A2; MX2022015833A

Abstract

一种用于注册个人生物识别数据并随后使用先前注册的生物识别数据来验证个人身份的系统利用音频通信信道或消息传送信道，两者都通过应用编程接口(API)访问。在一些情况下，从个人接收口头音频输入，并且口头音频输入用于为个人生成声纹。在其他情况下，生物识别数据可以是基于图像的，例如面部图像或个人虹膜的图像。

Description

使用生物识别数据验证身份的系统和方法

本申请要求美国临时专利申请第63/037,648号的权益，该申请于2020年6月11日提交，其内容通过引用并入本文中。

背景技术

本申请涉及身份验证服务。具体地，本发明涉及能够使用音频通信信道或消息传送信道来验证个人身份的验证服务。

现有的身份验证系统通常使用双因子认证方案。在最常用的方案中，身份验证系统向用户的电话设备发送验证码。用户必须事先在身份验证系统或寻求身份验证的一方注册了与电话设备关联的电话号码。这使得身份验证系统可以将验证码作为文本消息的一部分或通过自动音频电话发送给用户。然后用户必须将接收到的验证码提供回身份验证系统或者提供给寻求身份验证的一方以完成身份验证过程。本方案中用到的双因子是用户电话设备先前注册的电话号码和身份验证系统发送给用户电话设备的验证码。

然而，这种双因子认证方案容易受到欺诈。因此，希望与用户交换特别敏感数据的各方一直在寻求使用三因子来完成身份验证的身份验证方案。特别是，最好使用某种形式的生物识别信息作为认证方案的一部分，这进一步确保参与身份验证过程的一方是正确的一方。然而，在与用户通信的唯一方式是通过用户的电话设备的情况下，使用三因子来完成身份验证是困难的。此外，当与用户通信的唯一方式是经由用户的电话设备时，难以利用生物识别信息项完成身份验证。

附图说明

图1是示出在其中执行体现本发明的系统和方法的通信环境的各因子的框图；

图2是示出体现本发明或能够执行体现本发明的方法的通信服务提供商的各因子的框图；

图3是示出使用音频通信信道注册个人语音生物识别数据的第一方法的步骤的流程图；

图4是示出图3所示方法执行过程中发生的消息和音频交换的序列的信号图；

图5是示出使用消息传送信道注册个人语音生物识别数据的第二方法的步骤的流程图；

图6是示出在图5所示方法执行过程中出现的消息的序列的信号图；

图7是示出通过音频通信信道使用语音生物识别数据验证个人身份的第一方法的步骤的流程图；

图8是示出图7所示方法执行过程中发生的消息和音频交换的序列的信号图；

图9是示出了通过消息传送信道使用语音生物识别数据验证个人身份的第二方法的步骤的流程图；

图10是示出了图9所示方法执行过程中出现的消息的序列的信号图；以及

图11是计算机系统的示意图，该计算机系统可以被配置为体现本发明的设备或者可以被配置成执行体现本发明的方法。

具体实施方式

在以下描述中，对呼叫、电话呼叫、媒体会话或电话通信的引用旨在涵盖音频和视频呼叫，而不考虑用于进行呼叫的系统。此外，对消息传送服务的引用旨在涵盖允许基于因特网协议(IP)的消息的发送和接收的消息传送服务，包括但不限于通过电话服务提供商递送的SMS或“文本”消息和MMS消息、来自独立于电话服务提供商的消息平台(例如WhatsApp、Facebook Messenger等)的消息，以及音频或视频文件的传输和接收。

图1示出了通信环境100，在该通信环境中可以存在体现本发明的通信服务提供商150，并且在该通信环境中，通信服务提供商150可以执行提现本发明的方法。如图1所示，通信服务提供商150连接到因特网110、公共交换电话网(PSTN)144和蜂窝服务提供商140。因此，通信服务提供商150可以接收来自客户的呼叫，这些呼叫源自蜂窝服务提供商140、PSTN144或可经由因特网110访问的替代IP电话服务提供商(未示出)。然后，通信服务提供商150经由因特网110将这些呼叫连接到一个或多个企业或个人的电话设备。如下面将更详细地解释，通信服务提供商150还可以操作以发送和接收消息，例如SMS、MMS和其他文本消息。

图1示出了通信环境100可以包括也连接到互联网110的第一企业120。第一企业120包括第一电话设备122、第二电话设备124和第三电话设备126。电话设备122、124、126连接到内部数据网络121，该内部数据网络121本身连接到因特网110。通信环境还包括多个其他企业，例如第二企业129和第三企业130。第二企业129和第三企业130还可以包括一个或多个电话设备，这些电话设备最终可以经由因特网110或经由PSTN 144或蜂窝服务提供商140连接到通信服务提供商150。

图1还示出了通信环境100还包括短信服务(SMS)消息传送提供商132和IP消息传送服务商(也称为过顶(OTT)消息传送提供商)134。SMS消息传送提供商132和OTT消息传送提供商134负责协调诸如智能手机的单个电话设备之间以及运行在计算设备上的IP电话软件应用程序之间的消息传输。一些消息传送提供商132/134可以通过他们操作的消息传送通道传递文件，如音频和视频文件。

如图1所示，客户可以利用各种不同的电话设备与通信服务提供商150进行通信。图1示出了连接到PSTN 144的模拟电话146。客户可以使用该模拟电话146来进行最终路由到通信服务提供商150的传统音频呼叫。同样，通信服务提供商可以经由PSTN 144将音频呼叫路由到模拟电话146。

图1还示出了客户可以使用连接到蜂窝服务提供商140的蜂窝电话148与通信服务提供商150进行通信。另一个客户可使用同样连接到蜂窝服务提供商140和连接到互联网110的智能手机160与通信服务提供商150通信。

一些客户可能使用连接到互联网110的互联网协议(IP)电话164与通信服务提供商150通信。同样，客户可以使用运行基于IP的电话软件应用程序162的计算机与通信服务提供商150建立通信。

图2示出了能够体现本发明的通信服务提供商150的因子，并且可以配置为执行体现本发明的方法。通信服务提供商150包含因特网协议语音(VoIP)单元202，其被配置为设置VoIP电话呼叫。如前所述，这些呼叫可以是音频呼叫，也可以是视频呼叫。这种音频、视频呼叫可以由VoIP单元202建立到图1所示的几乎任何电话设备，也可以建立到运行在计算设备上的IP软件应用程序。

通信服务提供商150还包括语音应用编程接口(API)单元204。语音API单元204允许第三方计算机系统使用通信服务提供商的VoIP单元202通过通信服务提供商150建立和进行语音或视频电话呼叫。换句话说，语音API单元204允许单独的计算机服务器或计算设备与通信服务提供商150配合，以建立和进行语音和/或视频电话呼叫。

通信服务提供商150还包括消息传送API单元206，其可用于建立和执行消息传送会话。消息传送会话可以包括简单的文本消息传送会话以及用于传输音频和视频的会话。此外，消息传送API单元206可用于经由消息传送通信信道传送包含文本、音频或视频的文件。

第三方计算机系统或服务器可以访问消息传送API单元206，以与各种不同的用户计算设备或电话设备建立消息传送会话。在这样做的过程中，消息传送API单元206可以通过通信服务提供商150自身的内部消息传送资源进行操作，或者使用单独消息传送提供商的能力和资源，例如图1中所示的SMS消息传送提供商132和OTT消息传送提供商134。

通信服务提供商150还包括BOT服务单元208。BOT服务单元208是基于计算机的系统，其用于经由音频通信信道或消息传送信道与用户通信。BOT服务单元208被设计成模拟可以帮助客户获得信息或服务的客户服务代理。这样，BOT服务单元208被设计为与客户交互以回答客户问题，并响应于这些问题向客户提供答案和信息。在一些情况下，如果BOT服务单元208不能以自动方式满足客户的请求，则BOT服务单元208将被设计为将客户转接给现场客户服务代理。

通信服务提供商150还包括生物识别单元210，其设计用于记录个人的生物识别数据，然后基于先前记录的生物识别数据验证这些个人的身份。该生物识别数据可以包括语音生物识别数据，以及诸如个人面部图像或个人虹膜图像的成像数据。

生物识别单元210包括注册单元212，其被设计用于在生物识别数据库中注册或记录个人的生物识别数据。生物识别单元210还包括生物识别数据库216，其可以包括语音生物识别数据库218、面部识别生物识别数据库220和虹膜生物识别数据库222。生物识别数据库216还可以包括附加数据库，例如指纹图像数据库和/或包含替代成像数据的其他数据库。

注册单元212被配置为从个体接收生物识别信息，然后将该生物识别信息记录到适当的生物识别数据库中，以供以后识别个体时使用。在某些情况下，从个人接收的生物识别数据在被记录到生物识别数据库之前以某种方式进行处理。例如，个人可以以语音音频输入的形式提供语音生物识别数据，并且注册单元212可以处理接收到的语音音频输入以创建个人的声纹。下面将更详细地描述如何实现这一点。

生物识别单元210还包括验证单元214，其被设计为基于个人先前记录的生物识别数据来验证个人的身份。典型地，这涉及验证单元214从个人接收新的生物识别信息，然后尝试将新接收的生物识别数据与先前存储的个人生物识别数据相匹配，该个人生物识别信息已存储在一个或多个生物识别数据库216中。下面将更详细地讨论如何实现这一点。

体现本发明的通信服务提供商150除了图2中所示的因子之外，还可以包括大量因子。同样，体现本发明的通信服务提供商150可能不包括图2所示的所有因子。因此，图2不应被视为对体现本发明的通信服务提供商的限制。

图3是示出使用音频通信信道注册个人的生物识别数据的第一方法的步骤的流程图。图4是示出如何在通信环境的各因子之间交换信号和音频以执行图3所示的方法的相应的信号图。图3和图4将一起讨论，以描述使用音频通信信道注册个人生物识别数据的第一方法。

方法300开始并进行到步骤302，其中生物识别单元210的注册单元212将接收注册个人生物识别信息的请求。在图4所示的信号图中，这将对应于在通信服务提供商150的服务器处接收注册请求402。注册请求可能存在各种来源。在一些情况下，注册请求可以来自用户的移动通信设备上的移动应用。在其他情况下，用户可以浏览网站，并且用户可以选择网站上的项目以向通信服务提供商150的生物识别单元210发送注册请求。在其他情况下，注册个人的生物识别信息的请求可以经由诸如SMS消息传送提供商132、OTT消息传送提供商134或通信服务提供商150自身的消息传送API单元206之类的消息传送信道来接收。

现在返回图3，该方法将进行到步骤304，其中生物识别单元210的注册单元212将导致与个人建立音频通信信道。如图4所示，这可能涉及通信服务提供商150的服务器向语音API单元204发送请求，请求语音API单元202与个人电话设备建立音频电话呼叫。这可能要求个人已经向通信服务提供商150注册了个人电话设备的电话号码。或者，个人电话设备的电话号码可以包括在步骤302中接收的注册请求402中。在任何情况下，语音API单元204将向个人电话设备发送呼叫建立请求406，并且个人电话设备将向语音API单元202发送响应408，从而在个人和注册单元212之间建立音频通信信道。语音API单元204将向服务器发送指示音频通信信道已经建立的信号410。

现在返回图3，在步骤306中，注册单元212将获得或生成用于注册个人生物识别数据的指令。注册指令基本上是要经由已经建立的音频通信信道发送给个人、向个人显示和/或向个人播放的指令。在一些实施例中，注册指令将采取可以通过音频通信信道向个人播放的口头指令的形式。音频指令可以包括个人要讲话的脚本，以便以口头音频输入的形式提供语音生物识别数据。

参考图4，步骤306可以通过注册单元212向BOT服务单元208发送请求411以通过音频通信信道向个人播放一组音频指令来完成。BOT服务单元208然后将带有音频注册指令的消息412发送回注册单元212。

在步骤308中，注册单元212通过已建立的音频通信信道向个人播放生成的或获得的音频注册指令。如图4所示，这可以通过注册单元212向语音API单元204发送带有音频注册指令的消息413来实现。语音API单元204然后将包含音频注册指令的数据414发送到个人电话设备。

现在回到图3，该方法将继续进行到步骤310，其中生物识别单元210将通过音频通信信道从个人接收音频输入。

如图4所示，这可能涉及通信服务提供商150的服务器发送消息416、418，指示注册单元212为个人设置新的生物识别注册。然后，个人将根据个人接收的音频注册指令说出脚本，并且所说出的音频将作为数据420发送到语音API单元204。音频API单元204然后将接收到的音频数据422发送到服务器，并且服务器将接收到音频数据424发送到注册单元212。

返回图3，该方法随后将进行到步骤312，在步骤312中，注册单元212处理从个人接收的口头音频输入，以生成个人声纹。转到图4，这可以包括注册单元212或验证单元214向服务器发送进度报告426，然后稍后向服务器发送完成报告428。

转到图3，一旦生成了个人的声纹，就会将其记录在语音生物识别数据库中，如图2所示的语音生物识别库218。

虽然图3中没有描述，但一旦创建了个人的声纹，服务器可以通知BOT服务单元208注册已经完成。在图4中，这对应于服务器向BOT服务单元208发送注册完成信号430，而BOT服务单元208发回确认信号432。此外，服务器可以向个人发送音频通知，指示个人的语音生物识别数据的注册完成。这对应于服务器向语音API单元204发送注册完成报告434，并且语音API单元204向个人发送音频通知436，指示语音生物识别数据的注册完成。最后，服务器可以向语音API 204发送指令438，指示应该终止到个人的音频通信信道。

总之，在上述过程中，用户请求记录他们的语音生物识别数据，以便以后可以使用该数据来识别个人。在生物识别注册单元212和个人使用的电话设备之间建立音频通信信道。向个人提供注册指令，指示该个人要讲特定的脚本，以便提供他们的语音生物识别数据。然后，个人通过音频通信信道说出该脚本。注册单元212接收个人的语音音频输入，处理语音音频输入并为个人生成声纹。然后将个人的声纹记录在语音生物识别数据库218中。

图5示出了注册个人语音生物识别数据的第二方法的步骤。然而，在这种方法中，个人的语音生物识别数据是通过消息传送信道而不是音频通信信道接收的。图6示出了在执行图5所示方法期间，信号将如何在通信环境的因子之间传递的信号流程图。

方法500开始并进行到步骤502，其中通信服务提供商150的服务器接收注册个人生物识别信息的请求。服务器可以是或可以不是通信服务提供商150的生物识别单元210的一部分。如图6所示，可以通过消息传送信道接收注册个人生物识别数据的请求602a。注册请求602a可以通过通信服务提供商150的消息传送API单元206接收。或者，注册请求消息602a可以通过单独的SMS消息传送提供商132或OTT消息传送提供商134发送，如图1所示。

在替代实施例中，注册请求消息602b可以通过不涉及消息传送服务的不同信号路径接收。例如，注册请求602b可以来自用户的移动计算设备上的应用或者来自个人通过浏览器导航到的网站。在其他情况下，个人可以与客户服务代理进行语音对话，并且可以从客户服务代理接收注册请求602b。

返回图5，该方法随后将进行到步骤504，在步骤504中，注册单元212生成注册指令，并通过消息传送通道发送给个人。发送给个人的注册指令可以包括个人要讲话以提供语音生物识别数据的脚本。该脚本可以包括识别号或一系列术语，当个人提供音频输入时，这些识别号或一系列术语是个人按照指定的顺序说出的。指令可以是音频指令的形式，或者指令可以是文本的形式。如图6所示，该方法的步骤504可以包括通信服务提供商150的服务器生成注册指令，然后通过消息传送信道向个人发送指令。例如，服务器可以向通信服务提供商的消息传送API单元206发送带有注册指令的消息604。消息传送API单元206随后向用户发送带有注册指令的消息606。消息传送API单元206可以经由单独的消息传送服务将注册指令发送给个人，该单独的消息传送服务最终将注册指令传递给个人。

在一些实施例中，注册指令将以文本消息的形式发送，该文本消息指向先前为个人注册的电话号码。结果，消息传送API单元206可以简单地向个人的电话号码发送带有注册指令的文本消息，这可能导致在个人的移动计算设备(例如智能手机)上接收文本消息。在其他情况下，注册指令可以是音频指令。在这种情况下，音频指令可以包含在音频文件中，并且音频文件可以通过消息传送通道传递到个人的电话设备。

如图5所示，该方法随后将进行到步骤506，其中注册单元212通过消息传送信道接收包含个人提供的音频输入的文件。这意味着个人将遵循个人收到的指令，并且个人将实际说出注册指令中提供的脚本以创建音频文件。然后，个人将经由用于向个人发送注册指令的消息传送信道将音频文件发送回注册单元212。如图6所示，这可以包括使音频文件作为消息608的一部分发送的个人，该消息608被发送到消息传送API单元206。消息传送API单元206随后将带有音频文件的消息610发送到通信服务提供商150的服务器。

接下来，在步骤508中，注册单元212处理接收到的口头音频输入，以为个人生成声纹。如图6所示，这可能涉及接收音频文件的服务器首先向注册单元212发送消息612，以建立个人的新注册。此后，服务器可以向注册单元212发送带有音频文件的消息614。注册单元212然后将处理包含在音频文件中的接收到的音频输入，以便为个人生成声纹。一旦完成，注册单元212向服务器发送注册完成消息616，指示已经成功创建了声纹。

如果在步骤504中提供给个人的脚本包括识别号或一系列术语，当个人提供音频输入时，这些识别号或一系列术语是个人按照指定的顺序说出的，则该方法可以包括将个人的口头音频输入发送到转录单元的可选步骤。转录单元可以是通信服务提供商150的一部分，或者转录单元可以与通信服务提供商150完全分离。转录单元将返回该个人所说内容的文本版本。然后，注册单元212可以将该个人所说的内容的转录与提供给该个人的脚本进行比较，以确保该个人以正确的顺序说出识别号或一系列术语。如果个人未能按照正确的顺序说出识别号或一系列术语，则个人生物识别数据的注册可能会失败。

如图5所示，该方法随后进行到步骤510，其中生成的声纹存储在语音生物识别数据库216中。

虽然图5中没有描述，但该方法还可以包括向个人发送通知，以指示语音生物识别数据已成功注册。如图6所示，这可以包括服务器向消息传送API 206发送注册完成消息618，消息传送API 206通过消息传送通道向个人发送注册完成信息620。在可选步骤中，可以从注册单元212向第三方服务器发送附加通信622，以指示个人的声纹注册已经完成。此外，如果从个人以外的一方接收到注册个人的语音生物识别数据的请求，则可以向最初请求注册语音生物识别的一方发送指示注册已经成功完成的消息622。

图7示出了用于使用语音生物识别数据验证个人身份的第一方法的步骤。在该方法中，使用音频通信信道完成验证。图8是示出通信系统的元件如何交换信号和音频以实现图7所示的方法的相应信号图。

方法700开始并进行到步骤702，其中通信服务提供商150的服务器接收使用语音生物识别数据验证个人身份的请求。该请求可以经由用户的移动计算设备上的应用程序、从用户经由网络浏览器访问的网站或者可能作为包含在经由消息传送信道接收的消息中的身份验证请求来接收。服务器可以是通信服务提供商150的生物识别单元210的验证单元214的一部分。如图8所示，步骤702可以由通信服务提供商150的服务器从某些源接收标识请求802来完成。

然后，该方法进行到步骤704，其中与个人建立音频通信信道。通常，这将涉及建立到个人拥有或使用的电话设备的音频通信信道。例如，电话设备可以是个人拥有的移动通信设备。音频通信信道可以通过建立到与个人相关联的电话号码的音频或视频呼叫来建立。在某些情况下，个人需要事先注册用于建立音频通信信道的电话号码。在其他情况下，可以在身份验证请求中提供电话号码。此外，音频通信信道可以经由个人使用的某种替代类型的电话设备(例如移动计算设备或台式或膝上型计算机上的电话软件应用)与个人建立。

如图8所示，步骤704可以通过验证单元214的服务器向通信服务器提供商150的语音API单元204发送请求804来完成，请求建立到个人拥有的电话设备的音频电话呼叫。语音API单元204然后向个人的电话设备发送呼叫建立请求806。个人的电话设备然后将确认消息808发送回语音API单元204，并且将建立到个人的音频通信信道。此时，语音API单元204还可以将确认消息810发送回服务器，以指示音频通信信道已经建立。

返回图7，该方法进行到步骤706，其中验证单元214从BOT服务单元208获得用于验证个人身份的指令。如图8所示，这可以包括验证单元214的服务器向BOT服务单元208发送请求812，请求身份验证指令。BOT服务单元208然后将用于验证个人身份的验证指令814发送回验证单元214。

返回图7，该方法然后进行到步骤708，在步骤708中，用于验证个人身份的指令通过音频通信信道发送给个人。如图8所示，这可能涉及验证单元214的服务器向语音API单元204发送带有从BOT服务单元208获得的验证指令的消息816。语音API单元204然后将经由通过音频通信信道的数据通信818向个人发送音频指令。通常，这将涉及简单地通过音频通信信道向个人播放音频验证指令。在替代实施例中，验证指令的文本版本可以通过音频通信信道发送到个人的电话设备，并且文本验证指令可以显示在用户的电话设备上。

此时，验证单元214的服务器可以向生物识别单元210发送消息820、822，以通知生物识别单元，其将很快从个人接收作为身份验证请求的一部分的音频输入。消息820、822可以包括关于个人的信息以及关于个人将如何联系生物识别单元210以提供作为验证请求的一部分的口头音频输入的信息。该信息还可以包括关于作为从BOT服务单元208接收的验证指令的结果的、期望个人说什么的信息。

返回图7，该方法然后进行到步骤710，在步骤710中接收个人提供的音频输入。如图8所示，这可以通过音频通信信道向语音API单元204发送音频流824来实现。语音API单元204然后将该音频826发送回服务器。然后，服务器向生物识别单元210的验证单元214发送带有音频流的信号828。由个人提供的口头音频输入通常是在步骤708中发送给个人的验证指令中包括的个人说出的脚本。

如图7所示，该方法随后进行到步骤712，在步骤712中处理用户提供的音频输入，以便为个人生成新的声纹。在步骤714中，将新创建的声纹与存储在语音生物识别数据库218中的个人先前生成的声纹进行比较，以确定新的声纹是否与先前记录的声纹基本匹配。如果是，则验证单元214将验证个人的身份。当验证单元正在生成和比较声纹时，生物识别单元可以将进度消息830发送回服务器。当过程完成时，生物识别单元向服务器发送验证报告消息832，指示个人的身份是否已被验证。

当服务器接收到验证报告消息832时，服务器可以向BOT服务单元208发送验证报告消息834，然后BOT服务单元向服务器发回确认消息836。

然后，该方法进行到步骤716，在步骤716中，将通过音频通信信道向个人发送指示个人身份是否已被验证的验证消息。如图8所示，这可以包括服务器向语音API单元204发送音频消息838，指示验证已经完成。语音API单元204然后通过音频通信信道向个人发送音频消息840。此时，服务器将向语音API单元204发送呼叫终止消息842，指示不再需要音频通信信道，并且语音API单元202将关闭音频通信信道。

在一些实施例中，一旦个人的身份被验证，消息也可以被发送给第三方，以指示个人的身份已经被验证。

图9示出了使用语音生物识别数据验证个人身份的第二方法的步骤。在该第二方法中，使用消息传送通信信道代替上述音频通信信道。

方法900将开始并进行到步骤902，在步骤902中接收到认证个人身份的请求。参考图10，这可以包括用户向通信服务提供商150的消息传送API单元206发送带有验证请求1002的文本消息。消息传送API单元206随后向通信服务提供商150的服务器发送类似的验证请求1004。或者，可以从希望认证个人身份的第三方(即，银行、呼叫中心等)接收验证请求。在这种情况下，验证请求1002将源自所述第三方，并如上所述被中继到服务器。服务器可以是或可以不是验证单元214的一部分。

然后，该方法进行到步骤904，其中服务器生成用于验证个人身份的指令。指令可以包括一系列随机数字或其他术语，这些数字或术语形成了一个脚本，为了验证个人的身份，个人必须按照正确的顺序说出该脚本。然后，该方法进行到步骤906，在步骤906中，服务器通过消息传送信道向个人发送生成的脚本和用于验证的指令。如图10所示，这可以通过服务器生成验证脚本并将带有该验证脚本的消息1006作为文本消息发送给个人来实现。或者，脚本可以是描述必须以特定顺序说出的术语的音频记录，并且音频可以被编码在音频文件中。无论如何，文本消息或音频文件形式的验证脚本1006从服务器发送到消息传送API单元206。消息传送API单元206然后经由消息传送信道向个人发送文本消息或音频文件形式的验证脚本1008。

返回图9，该方法然后进行到步骤908，其中服务器通过消息传送信道从个人接收音频文件，其中音频文件包含个人的口头音频输入。这意味着个人将创建说出已提供的验证脚本的个人的音频记录，然后个人将带有该音频文件的消息1010发送回消息传送API单元206。消息传送API单元206随后向服务器发送消息1012，转发从个人接收的音频文件。

返回图9，该方法进行到步骤910，其中验证单元214处理接收到的音频文件中的口头音频输入，以便为个人生成新的声纹。接下来，在步骤912中，验证单元214确定新的声纹是否与先前为个人生成的声纹基本匹配，该声纹已存储在语音生物识别数据库218中。参考图10，服务器向生物识别单元210的验证单元214发送验证请求消息1016。验证请求消息1016包括由个人提供的音频。验证请求消息还可以包括最初发送给个人的验证脚本。验证单元214然后为个人生成新的声纹，将其与先前为个人生成的声纹进行比较，然后将验证报告消息1020发送回服务器，以指示个人的身份是否已被验证。

在可选步骤中，服务器可以向转录单元发送转录请求消息1014，该转录单元可以是通信服务提供商150的一部分，或者可以是完全独立的。转录请求消息1014将包括由个人提供的音频。转录单元将转录由个人提供的口头音频输入，并将转录报告消息1018发送回服务器。然后，服务器可以确定用户是否以正确的顺序说出了验证脚本中的术语。这提供了额外的检查，以确保个人提供的口头音频输入响应于该特定身份验证请求。

返回图9，该方法然后进行到步骤914，如果新生成的声纹与先前记录的个人声纹匹配，则向个人发送消息，表明个人身份已被验证。验证还可能取决于用户是否以正确的顺序说出验证脚本中的术语或数字。参考图10，这可以包括服务器向消息传送API单元206发送验证报告消息1022，消息传送API模块206通过消息传送通道向个人发送类似的验证报告消息1024。

在一些实施例中，如果用户的身份被成功验证，则验证单元214可以向第三方服务器或其他实体发送消息，指示个人的身份已经被成功确认。

上述方法涉及记录个人的语音生物识别信息，然后使用记录的语音生物识别数据验证个人身份。在体现本发明的替代方法中，可以为个人记录图像生物识别数据，并且图像生物识别信息随后可以用于验证个人的身份。

例如，可以使用与上面结合图3-6讨论的方法类似的方法将个人的面部或虹膜图像记录在生物识别数据库中。个人可以使用用户的电话设备的相机获得个人的面部或眼睛的图像，并且可以使用消息传送信道将包含该图像的文件发送到生物识别单元210的注册单元212。随后，当需要验证个人的身份时，个人可以提供个人的面部或虹膜的新拍摄图像，并且新提供的图像可以经由消息传送信道发送到验证单元214。然后，验证单元可以将新生成的图像与先前记录的图像进行比较，以验证个人的身份。可以实施额外的安全措施，以确保在提交身份验证请求时生成新提供的图像。

本发明可以体现在方法、设备、电子设备和/或计算机程序产品中。因此，本发明可以体现在硬件和/或软件(包括固件、驻留软件、微代码等)中，这里通常称为“电路”或“模块”。此外，本发明可以采取计算机可用或计算机可读存储介质上的计算机程序产品的形式，该计算机程序产品具有体现在该介质中的用于由指令执行系统使用或与指令执行系统结合使用的计算机可用或计算机可读程序代码。在本文档的上下文中，计算机可用或计算机可读介质可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备使用或与之相关联的介质。这些计算机程序指令还可以存储在计算机可用或计算机可读存储器中，其可以指导计算机或其他可编程数据处理设备以特定方式运行，使得存储在计算机可用或计算机可读存储器中的指令产生包括实现流程图和/或框图块中指定的功能的指令的制品。

计算机可用或计算机可读介质可以是，例如但不限于，电子、磁性、光学、电磁、红外或半导体系统、设备或装置。计算机可读介质的更具体示例(非详尽列表)包括以下内容：硬盘、光存储设备、磁存储设备、具有一根或多根电线的电连接、便携式计算机磁盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或闪存)、光纤和光盘只读存储器(CD-ROM)。

用于执行本发明操作的计算机程序代码可以用面向对象的编程语言编写，例如JavaScript、

Swift或C++等。然而，用于执行本发明的操作的计算机程序代码也可以用传统的程序编程语言编写，例如“C”编程语言和/或任何其他低级汇编语言。还将认识到，任何或所有程序模块的功能也可以使用分立硬件组件、一个或多个专用集成电路(ASIC)或编程数字信号处理器或微控制器来实现。

为了解释的目的，已经参考具体实施例描述了上述说明。然而，上述说明性讨论并非旨在穷尽或将本发明限制于所公开的精确形式。鉴于上述教导，许多修改和变化是可能的。选择和描述实施例是为了最好地解释本公开的原理及其实际应用，从而使本领域的其他技术人员能够最好地利用本发明和具有各种修改的各种实施例，这些修改可能适合于预期的特定用途。

图11示出了根据一个或多个实施例的计算机系统1100，其可用于本发明的各个实施例中以实现本发明。这里描述的各种实施例可以在一个或多个计算机系统上执行，该计算机系统可以与各种其他设备交互。一个这样的计算机系统是图11中所示的计算机系统1100。计算机系统1100可以被配置为实现上述方法。计算机系统1100可用于实现上述实施例的任何其他系统、设备、元件、功能或方法。在所示的实施例中，计算机系统1100可以被配置为在各种实施例中将所公开的方法实现为处理器可执行的可执行程序指令1122(例如，可由处理器1110执行的程序指令)。

在所示实施例中，计算机系统1100包括一个或多个处理器1110a-110n，其通过输入/输出(I/O)接口1130耦合到系统存储器1120。计算机系统1100还包括耦合到I/O接口1130的网络接口1140，以及一个或多个输入/输出设备1150，例如光标控制设备1160、键盘1170、显示器1180、麦克风1182和扬声器1184。在各种实施例中，系统可以利用任何组件来接收上述用户输入。在各种实施例中，用户界面可以被生成并显示在显示器1180上。在一些情况下，可以设想，实施例可以使用计算机系统1100的单个实例来实现，而在其他实施例中，多个这样的系统或组成计算机系统1100中的多个节点可以被配置为主办各种实施例的不同部分或实例。例如，在一个实施例中，可以经由计算机系统1100的一个或多个节点来实现一些因子，这些节点不同于实现其他因子的那些节点。在另一示例中，多个节点可以以分布式方式实现计算机系统1100。

在不同的实施例中，计算机系统1100可以是各种类型的设备中的任何一种，包括但不限于个人计算机系统、台式计算机、膝上计算机、笔记本或上网本计算机、便携式计算设备、大型机计算机系统、手持计算机、工作站、网络计算机、智能手机、照相机、机顶盒、移动设备、消费者设备、视频游戏控制台、手持视频游戏设备、应用服务器、存储设备、诸如交换机、调制解调器、路由器之类的外围设备，或通常任何类型的计算或电子设备。

在各种实施例中，计算机系统1100可以是包括一个处理器1110的单处理器系统，或者是包括多个处理器1110(例如，两个、四个、八个或另一个合适的数量)的多处理器系统。处理器1110可以是能够执行指令的任何合适的处理器。例如，在各种实施例中，处理器1110可以是实现各种指令集架构(ISA)中的任何一种的通用或嵌入式处理器。在多处理器系统中，处理器1110中的每一个可以共同但不是必要实现相同的ISA。

系统存储器1120可被配置为存储处理器1110可访问的程序指令1122和/或数据1132。在各种实施例中，系统存储器1120可以使用任何合适的存储器技术来实现，例如静态随机存取存储器(SRAM)、同步动态RAM(SDRAM)、非易失性/闪存型存储器或任何其他类型的存储器。在所示实施例中，实现上述实施例的任何因子的程序指令和数据可以存储在系统存储器1120内。在其他实施例中，程序指令和/或数据可以被接收、发送或存储在不同类型的计算机可访问介质上或与系统存储器1120或计算机系统1100分离的类似介质上。

在一个实施例中，I/O接口1130可以被配置为协调处理器1110、系统存储器1120和设备中的任何外围设备(包括网络接口1140或其他外围接口，例如输入/输出设备1150)之间的I/O流量。在一些实施例中，I/O接口1130可以执行任何必要的协议、定时或其他数据转换，以将来自一个组件(例如，系统存储器1120)的数据信号转换成适合由另一组件(例如处理器1110)使用的格式。在一些实施例中，I/O接口1130可以包括对通过各种类型的外围总线连接的设备的支持，例如，外围组件互连(PCI)总线标准或通用串行总线(USB)标准的变体。在一些实施例中，I/O接口1130的功能可以被分成两个或更多个单独的组件，例如北桥和南桥。此外，在一些实施例中，I/O接口1130(例如到系统存储器1120的接口)的一些或全部功能可以直接结合到处理器1110中。

网络接口1140可以被配置为允许在计算机系统1100和连接到网络(例如，网络1190)的其他设备之间交换数据，例如一个或多个外部系统或计算机系统1100的节点之间。在各种实施例中，网络1190可以包括一个或多个网络，包括但不限于局域网(LAN)(例如，以太网或公司网络)、广域网(WAN)(例如互联网)、无线数据网络、一些其他电子数据网络或其一些组合。在各种实施例中，网络接口1140可以支持经由有线或无线通用数据网络的通信，例如任何合适类型的以太网；支持经由电信/电话网络的通信，例如模拟语音网络或数字光纤通信网络；支持经由诸如光纤通道SAN的存储区域网络或经由任何其他合适类型的网络和/或协议的通信。

在一些实施例中，输入/输出设备1150可以包括一个或多个显示终端、键盘、小键盘、触摸板、扫描设备、语音或光学识别设备，或者适合于由一个或更多个计算机系统1100输入或访问数据的任何其他设备。多个输入/输出设备1150可以存在于计算机系统1100中，或者可以分布在计算机系统1100的各个节点上。在一些实施例中，类似的输入/输出设备可以与计算机系统1100分离，并且可以通过有线或无线连接(例如通过网络接口1140)与计算机系统100的一个或多个节点交互。

在一些实施例中，所示的计算机系统可以实现上述任何操作和方法，例如图3、5、7和9的流程图所示的方法，以及图4、6、8和10的信号流程图中更详细描述的方法。在其他实施例中，可以包括不同的因子和数据。

本领域技术人员将理解，计算机系统1100仅是说明性的，并不旨在限制实施例的范围。具体地，计算机系统和设备可以包括可以执行各种实施例的所指示功能的硬件或软件的任何组合，包括计算机、网络设备、互联网设备、PDA、无线电话、寻呼机等。计算机系统1100还可以连接到未示出的其他设备，或者替代地可以作为独立系统操作。此外，在一些实施例中，由所示组件提供的功能可以组合在更少的组件中或者分布在额外的组件中。类似地，在一些实施例中，可以不提供一些所示组件的功能和/或可以提供其他附加功能。

本领域技术人员还将认识到，尽管各种项目被示为在使用时存储在存储器中或存储在存储器上，但出于存储器管理和数据完整性的目的，这些项目或其部分可以在存储器和其他存储设备之间传输。可替换地，在其他实施例中，一些或所有软件组件可以在另一设备上的存储器中执行，并通过计算机间通信与所示的计算机系统通信。一些或所有系统组件或数据结构也可以存储(例如，作为指令或结构化数据)在计算机可访问介质或便携式物品上，以由适当的驱动器读取，上面描述了其各种示例。在一些实施例中，存储在与计算机系统1100分离的计算机可访问介质上的指令可以通过经由诸如网络和/或无线链路之类的通信介质传送的传输介质或诸如电、电磁或数字信号之类的信号传送到计算机系统1100。各种实施例还可以包括在计算机可访问介质上或经由通信介质接收、发送或存储根据前述描述实现的指令和/或数据。通常，计算机可访问介质可以包括存储介质或记忆介质，诸如磁或光介质，例如磁盘或DVD/CD-ROM，易失性或非易失性介质，诸如RAM(例如SDRAM、DDR、RDRAM、SRAM等)、ROM等。

本文中使用的术语仅用于描述特定实施例，并不旨在限制本发明。如本文所用，单数形式“一”、“该”也包括复数形式，除非上下文另有明确规定。将进一步理解，当在本说明书中使用时，术语“包括”和/或“包含”指定了所述特征、整数、步骤、操作、元件和/或组件的存在，但不排除一个或多个其他特征、整数、步骤、操作、元件、组件和/或其组的存在或添加。

虽然已经结合当前被认为是最实用和优选的实施例描述了本发明，但应当理解，本发明不限于所公开的实施例，相反，本发明旨在涵盖包括在所附权利要求的精神和范围内的各种修改和等效布置。

Claims

1.一种由生物识别单元执行的用于基于语音生物识别信息验证个人身份的方法，包括：

在所述生物识别单元处接收使用生物识别信息验证个人身份的请求；

使得在所述生物识别单元和所述个人使用的电话设备之间建立通信信道；

获得使用语音生物识别信息来验证所述个人的身份的验证指令，其中所述验证指令包括所述个人要说出的脚本；

将所获得的验证指令通过所述通信信道传送给所述个人；

接收由所述个人提供的口头音频输入，其中所述口头音频输入是通过所述通信信道接收的，并且其中所述口头音频输入预期包括所述个人说出在所述验证指令中的所述脚本；

处理所接收的口头音频输入，以为所述个人生成新的声纹；

确定所生成的新的声纹是否与存储在语音生物识别数据库中的所述个人的先前生成的声纹基本匹配；和

经由所述通信信道向所述个人发送确认消息，指示当所生成的新的声纹与先前生成的声纹基本匹配时，所述个人身份已得到验证。

2.根据权利要求1所述的方法，其中接收验证所述个人身份的请求的步骤包括：接收将被通知身份验证过程的结果的远程服务器的身份，并且其中所述方法还包括：向所述远程服务器发送身份验证消息，指示当所生成的新的声纹与先前生成的声纹基本匹配时，所述个人身份已得到验证。

3.根据权利要求1所述的方法，其中所述验证指令中的所述脚本包括以特定顺序排列的多个术语，并且其中所述方法还包括：

检查所接收的口头音频输入，以确定所述个人是否以所述特定顺序说出所述多个术语；并且

其中，仅当所述检查步骤确定所述个人以所述特定顺序说出所述多个术语时，才向所述个人发送所述确认消息。

4.根据权利要求3所述的方法，其中检查所接收的口头音频输入的步骤包括：

使用所接收的口头音频输入来准备所述个人在所接收的音频输入中所说的内容的副本；和

将所述副本与所述验证指令中的脚本进行比较，以确定所述个人是否以所述特定顺序说出所述多个术语。

5.根据权利要求1所述的方法，其中使得在所述生物识别单元和所述个人使用的电话设备之间建立通信信道的步骤包括：在所述生物识别单元和所述个人使用的电话设备之间建立音频通信信道。

6.根据权利要求5所述的方法，其中将所获得的验证指令通过所述通信信道传送给所述个人的步骤包括：通过所述音频通信信道向所述个人播放音频验证指令。

7.根据权利要求1所述的方法，其中使得在所述生物识别单元和所述个人使用的电话设备之间建立通信信道的步骤包括：在所述生物识别单元和所述个人使用的电话设备之间建立消息传送信道。

8.根据权利要求7所述的方法，其中将所获得的验证指令传送给所述个人的步骤包括：将所述验证指令作为经由所述消息传送信道发送到所述个人的电话设备的消息的一部分发送给所述个人。

9.根据权利要求8所述的方法，其中从所述个人接收口头音频输入的步骤包括：通过所述消息传送信道接收包含所述口头音频输入的文件。

10.根据权利要求8所述的方法，其中获得验证指令包括：接收基于文本的指令，并且其中将所获得的验证指令发送到所述个人包括：发送基于文本的消息，所述基于文本的消息包括将经由所述消息传送信道发送到所述个人的所述验证指令。

11.根据权利要求8所述的方法，其中获得验证指令包括：接收音频验证指令，并且其中使所述验证指令被发送到所述个人包括：经由所述消息传送信道向所述个人发送包含所述音频验证指令的文件。

12.一种用于基于语音生物识别信息验证个人身份的系统，包括：

用于在生物识别单元处接收使用生物识别信息验证个人身份的请求的装置；

用于使得在所述生物识别单元和所述个人使用的电话设备之间建立通信信道的装置；

用于获得使用语音生物识别信息来验证所述个人的身份的验证指令的装置，其中所述验证指令包括所述个人要说出的脚本；

用于将所获得的验证指令通过所述通信信道传送给所述个人的装置；

用于接收由所述个人提供的口头音频输入的装置，其中所述口头音频输入是通过所述通信信道接收的，并且其中所述口头音频输入预期包括所述个人说出在所述验证指令中的所述脚本；

用于处理所接收的口头音频输入以为所述个人生成新的声纹的装置；

用于确定所生成的新的声纹是否与存储在语音生物识别数据库中的所述个人的先前生成的声纹基本匹配的装置；和

用于经由所述通信信道向所述个人发送确认消息的装置，所述确认消息指示当所生成的新声纹与先前生成的声纹基本匹配时，所述个人身份已得到验证。

13.一种用于基于语音生物识别信息验证个人身份的系统，包括：

存储器；和

至少一个处理器，其中所述至少一个处理器被配置为执行包括以下步骤的方法：

在生物识别单元处接收使用生物识别信息验证个人身份的请求；

将所获得的验证指令通过所述通信信道传送给所述个人；

处理所接收的口头音频输入，以为所述个人生成新的声纹；

经由所述通信信道向所述个人发送确认消息，指示当所生成的新声纹与先前生成的声纹基本匹配时，所述个人身份已得到验证。

14.根据权利要求13所述的系统，其中接收验证所述个人身份的请求的步骤包括：接收将被通知身份验证过程的结果的远程服务器的身份，并且其中由所述至少一个处理器执行的所述方法还包括：向所述远程服务器发送身份验证消息，指示当所生成的新的声纹与先前生成的声纹基本匹配时，所述个人身份已得到验证。

15.根据权利要求13所述的系统，其中所述验证指令中的所述脚本包括以特定顺序排列的多个术语，并且其中由所述至少一个处理器执行的所述方法还包括：

16.根据权利要求15所述的系统，其中检查所接收的口头音频输入的步骤包括：

17.根据权利要求13所述的系统，其中使得在所述生物识别单元和所述个人使用的电话设备之间建立通信信道的步骤包括：在所述生物识别单元和所述个人使用的电话设备之间建立音频通信信道；并且其中将所获得的验证指令通过所述通信信道传送给所述个人的步骤包括：通过所述音频通信信道向所述个人播放音频验证指令。

18.根据权利要求13所述的系统，其中使得在所述生物识别单元和所述个人使用的电话设备之间建立通信信道的步骤包括：在所述生物识别单元和所述个人使用的电话设备之间建立消息传送信道。

19.根据权利要求18所述的系统，其中将所获得的验证指令传送给所述个人的步骤包括：将所述验证指令作为经由所述消息传送信道发送到所述个人的电话设备的消息的一部分发送给所述个人。

20.根据权利要求18所述的系统，其中从所述个人接收口头音频输入的步骤包括：通过所述消息传送信道接收包含所述口头音频输入的文件。