CN101467204A - 用于生物计量声纹认证的方法和系统 - Google Patents

用于生物计量声纹认证的方法和系统 Download PDF

Info

Publication number
CN101467204A
CN101467204A CNA2006800273727A CN200680027372A CN101467204A CN 101467204 A CN101467204 A CN 101467204A CN A2006800273727 A CNA2006800273727 A CN A2006800273727A CN 200680027372 A CN200680027372 A CN 200680027372A CN 101467204 A CN101467204 A CN 101467204A
Authority
CN
China
Prior art keywords
voice
user
utterance
vocal tract
bio
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA2006800273727A
Other languages
English (en)
Other versions
CN101467204B (zh
Inventor
G·迪玛伯欧
B·萨尔纳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Porticus Tech Inc
Original Assignee
Porticus Tech Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Porticus Tech Inc filed Critical Porticus Tech Inc
Publication of CN101467204A publication Critical patent/CN101467204A/zh
Application granted granted Critical
Publication of CN101467204B publication Critical patent/CN101467204B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/30Authentication, i.e. establishing the identity or authorisation of security principals
    • G06F21/31User authentication
    • G06F21/32User authentication using biometric data, e.g. fingerprints, iris scans or voiceprints
    • GPHYSICS
    • G07CHECKING-DEVICES
    • G07CTIME OR ATTENDANCE REGISTERS; REGISTERING OR INDICATING THE WORKING OF MACHINES; GENERATING RANDOM NUMBERS; VOTING OR LOTTERY APPARATUS; ARRANGEMENTS, SYSTEMS OR APPARATUS FOR CHECKING NOT PROVIDED FOR ELSEWHERE
    • G07C9/00Individual registration on entry or exit
    • G07C9/30Individual registration on entry or exit not involving the use of a pass
    • G07C9/32Individual registration on entry or exit not involving the use of a pass in combination with an identity check
    • G07C9/37Individual registration on entry or exit not involving the use of a pass in combination with an identity check using biometric data, e.g. fingerprints, iris scans or voice recognition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification
    • G10L17/06Decision making techniques; Pattern matching strategies
    • G10L17/10Multimodal systems, i.e. based on the integration of multiple recognition engines or fusion of expert systems

Abstract

提供了一种用于认证用户的方法(700)和系统(900)。该方法可包括:从用户接收一个或多个口头话语(702);识别与该一个或多个口头话语相对应的短语(704);从该短语的一个或多个口头话语标识用户的生物计量声纹(706);确定与该设备相关联的设备标识符(708);以及基于该短语、生物计量声纹和设备标识符来认证该用户(710)。手持式设备或用户的位置可用作用于准许访问一个或多个资源的标准(712)。

Description

用于生物计量声纹认证的方法和系统
发明领域
本发明一般涉及话音识别,尤其涉及语音标识。
背景
电子技术和软件的进步使得系统能够更有效地识别和标识个人。例如,诸如相机的图像处理系统可捕捉个人的图像并根据图像来标识个人。指纹扫描系统可通过触摸来捕捉用于标识个人的指纹。语音处理系统可通过它们的语音来标识个人。这些技术提供在使用之前对用户的标识,以便确保系统安全和对该系统的代理访问。
语音标识(ID)系统已用于各种安全相关的应用中。有时称为语音认证的语音ID是使用声纹和模式识别软件来验证说话人的一类用户认证。生物计量(biometric)、语音ID的自适应依赖于以下前提:如同指纹和人眼虹膜的模式一样,对于每个个人而言声音特性是唯一的。
更多的人可通过移动设备和计算机的耦合在因特网上在线地彼此交互。移动设备能够在线进行并建立与其它通信系统的连接。标识移动设备的用户是提供安全访问的重要方面。然而,移动设备用户的标识通常是不实用的。因此,存在对用户进行认证的需求。
概述
本发明的实施例涉及一种设备上的语音认证的方法。该方法可包括:从用户接收一个或多个口头话语、识别与一个或多个口头话语相对应的短语、根据该短语的一个或多个口头话语来标识生物计量声纹(biometric voice print)、确定与该设备相关联的设备标识符、以及基于该短语、该生物计量声纹和设备标识符来认证用户。可确定一个或多个口头话语的变化性来创建生物计量声纹。生物计量声纹是一种声道结构,该结构在物理上对用户的声道是唯一的。在对用户进行认证时,可准许对与设备通信的一个或多个资源的访问。可确定设备或用户的位置以便准予访问。
附图的简要描述
在所附权利要求中具体阐述了被认为是新颖的系统的特征。本文的实施例可通过参照以下描述、结合附图来理解,在这些附图中,类似附图标记表示类似要素,并且其中:
图1是根据本发明的配置的实施例的移动通信环境;
图2是部署在图1中根据本发明配置的的实施例的移动通信系统环境内的语音认证系统的示例性图示;
图3是图2中根据本发明的配置的实施例的语音认证系统的示例性实现;
图4是根据本发明的配置的实施例的语音认证系统;
图5是适用于根据本发明的配置的实施例的语音认证系统中的用户配置文件创建的流程图;
图5是适用于根据本发明的配置的实施例的语音认证系统的用户验证的流程图;
图6是适用于根据本发明的配置的实施例的语音认证系统的用户配置文件创建的流程图;
图7是根据本发明的配置的实施例的设备上的语音认证的方法700;
图8是根据本发明的配置的实施例的语音认证算法;以及
图9是根据本发明的配置的实施例的语音认证系统。
详细描述
本文公开了本方法和系统的详细实施例。然而,应当理解,所公开的实施例仅是示例性的,而且本发明可以不同形式来具体化。因此,本文所公开的特定结构和功能细节不应当解释为限制,而是仅作为权利要求的基础,以及作为示教本领域技术人员的典型依据以便以实际上任何适当的细节结构来多样地使用本发明的实施例。此外,本文所用的术语和措辞并非旨在限制,而是旨在提供对本文的实施例的可理解描述。
本文所用的术语“一”被定义为一个或多个。本文所用的术语“多个”被定义为两个或更多。本文所用的术语“另一”被定义为至少第二个或更多。本文所用的术语“包括”和/或“具有”被定义为包括(即,开放式语言)。本文所用术语“耦合”被定义为连接,但是无需是直接连接,也无需是机械地连接。术语“抑制”可被定义为部分或完全减小或移除。术语“处理”可被定义为可执行预编程或已编程的指令集的大量合适的处理器、控制器、单元等。
本文所用的术语“程序”、“软件应用”等被定义为设计成在计算机系统上执行的指令序列。程序、计算机程序或软件应用可包括子例程、函数、过程、对象方法、对象实现、可执行应用、源代码、对象代码、共享库/动态加载库和/或设计成在计算机系统上执行的其它指令序列。
本发明的实施例涉及一种用于认证用户的系统和方法。该方法可包括从用户接收一个或多个口头话语、识别与一个或多个口头话语相对应的短语、根据该短语的一个或多个口头话语的变化性标识生物计量声纹、确定与该设备相关联的设备标识符、以及基于该短语、该生物计量声纹和设备标识符来认证用户。
本发明的实施例还包括可基于用户的唯一声纹、用于在生成声纹期间的说出的短语、以及用户的例如IMEI号的手持式设备的标识符的认证系统。在一个实现中,手持式设备或用户的位置可用作批准接入一个或多个资源的附加标准。例如,该系统可通过使用生物计量特征—即,用户的语音—的更加稳定的方法来替代当前用户标识的“社会保障号码/母亲姓名(mother′s maiden name)”模型。
参看图1,示出了用于语音认证的移动通信环境100。移动通信环境100可包括语音认证服务器130、数据库130和一个或多个移动设备102。可用于标识移动设备102的用户的用户配置文件可被存储在数据库130上。用户配置文件可包括密码短语、生物计量声纹和设备标识符。服务器130可将用户配置文件与存储在数据库140上的其它用户配置文件作对比,以便认证用户的语音。例如,移动设备102的用户可向移动设备说话,以便访问该移动设备可用的一个或多个资源。在认证用户的语音时,可授予对一个或多个资源的访问。例如,资源可以是服务器、PBX或任何其它适合的通信系统。资源可提供设备可用的特征或服务,诸如音乐下载、在线博弈、订阅、游戏等。资源可提供对诸如个人信息、远程服务器或主存财务数据或商业数据的数据存储的安全或非安全web站点的访问,但本文并不限于此。
服务器130可确认由用户讲出的密码短语是否为正确的密码短语,以及与该短语的发音相关联的生物计量声纹是否正确地匹配于数据库中的用户配置文件。具体地,生物计量声纹通过在密码短语的一个或多个发音期间分析用户的说话风格中的一个或多个变化性来捕捉。例如,语音认证服务器130可确定在密码短语的发音期间捕捉到的用户语音的特性是否与数据库140中的一个或多个生物计量声纹相匹配以便认证对一个或多个资源的访问。服务器130还可验证移动设备102是被授权用于访问资源的设备以及是与用户的生物计量声纹相关联的设备。具体地,服务器130可证实对移动设备102说话的用户与移动设备相关联。在一个实施例中,服务器130可确定设备通过与捕捉到的生物计量声纹相关联的IMEI号来对用户进行注册。IMEI号是设备标识符,它对于该移动设备是唯一的。在另一配置中,服务器130可确定设备102的位置以授权对一个或多个资源的访问。例如,移动设备102可包括用于标识该设备的位置的全球定位系统(GPS)。或者,服务器可基于由用户所声明的位置来授权对资源的访问。例如,用户可说出其位置,而服务器130可确定所讲的位置是否对应于所授权或接受的设备或用户的位置。可在移动设备102或服务器130上处理用户语音以证实用户的身份。
移动通信环境100可在射频(RF)通信网络或链路上提供与系统上的一个或多个语音认证服务器130的无线连通性。服务器130可以是网关、PBX或能够支持语音和数据传送的任何其它电信网络设备。网络100中的通信可使用采用任何合适协议(例如TCP/IP、HTTP、HTTPS、SIP等)的无线、铜线和/或光纤连接来建立。在一个实施例中,移动设备102可使用诸如CDMA、TDMA、OFDM、GSM等的标准通信协议与基地接收机110通信。基站接收机110进而可经由分组交换链路将移动设备102连接到因特网120。因特网120可支持用于向移动设备102提供媒体或内容的应用服务和服务层。应用服务层可包括基于财务或商业的应用的数据库访问。移动设备160还可使用无线通信通道来通过因特网120连接到其它通信设备。移动设备160可在网络上与服务器130建立连接,以及与其它移动设备建立连接以交换语音、数据和媒体。服务器可直接或经由因特网120主存可通过移动设备102访问的应用服务。
移动设备102可向移动通信环境100上的服务器130或其它远程服务器发送和接收数据。例如,移动设备160还可经由WLAN连接到因特网120。无线局域接入网络(WLAN)提供对局域地理区域内的移动通信环境的无线接入。WLAN通常由也称为基站的接入点104的群集构成。移动通信设备102可与基站区域内的诸如膝上型设备103的其它WLAN站通信以交换语音、数据和媒体。在典型的WLAN实现中,物理层使用诸如802.11b或802.11g WLAN技术的各种技术。物理层可使用红外线、2.4GHz频带上的跳频扩频、或2.4GHz频带上的直接序列扩频。
移动设备102可经由电路交换射频连接110或基于分组的WLAN AP 104来向服务器130发送或从其接收数据,但本发明并不限于此。值得注意的是,数据可包括可在一个或多个语音认证服务器之间共享以准许用户访问一个或多个资源的用户配置文件。可理解,语音可表示成可被发送到移动设备160或从其发送的语音分组以提供语音通信。例如,移动设备160的用户可启动对服务器或膝上型设备103的呼叫以访问该移动设备可用的一个或多个特征。语音数据可在移动通信环境100上传送,由此提供语音通信。移动设备160可以是蜂窝电话、个人数字助理、便携式音乐播放器或任何其它类型的通信设备。
参看图2,示出了部署在移动通信环境100内的语音认证系统200的示例性图示。语音认证系统200可包括语音认证服务器130、接口150和数据库140。服务器130可通过接口150来访问数据库140以检索用户配置文件。接口可包括web层152、业务层154和数据访问层156。应当注意,接口150仅是涉及网络上的数据处理的传输层的示例。接口150所具有的组件可比所示的数量更多或更少,并且并不限于所示那些。
数据库140可包括用于语音认证的多个用户配置文件142。用户配置文件142可能对于用户是唯一的,以及可能对于设备是唯一的。用户配置文件142可包括生物计量声纹144、密码短语146和移动设备标识符148。密码短语146可以是由用户特别选定的、要在语音认证期间回答的一个或多个单词。当用户将密码短语讲入移动设备102时,用户语音的声纹可被捕捉并存储在用户配置文件142中。生物计量声纹142标识用户说话风格的特征,这些特征对于用户而言是唯一的。具体地,生物计量声纹142表示声道结构差异,该结构在物理上对用户的声道是唯一的。即,用户的声道能够进行物理上的变化,这些变化取决于用户声道的物理形态。在对于个人而言是唯一的密码短语的发音期间,生物计量声纹捕捉与声道的这些特性变化相关联的物理特征。用户的声道结构包括食道、咽、喉、嘴、舌和嘴唇。这些物理属性可在表达密码短语时的话音产生期间进行特定的物理变化,该变化是用户的发声和说话风格的特征。具体地,可测量这些物理属性在口头话语的一个或多发音期间的变化量以证实用户的身份。
参照图3,示出了语音认证系统200的示例性实现300。示例性实现300包括诸如移动电话或其它移动计算设备的手持式设备102、以及与该手持式设备在移动通信环境100下通信的语音认证服务器130。服务器130可以是任何合适的计算或网络服务器。在服务器130上运行的软件可包括用于与手持式设备通信的web层152(参见图2)、业务层(154)以及用于存储和检索数据的数据访问层(154),但并不限于这些。服务器130还可包括监视页面,该页面允许管理员访问服务器。例如,用户可通过监视页面更新其配置文件。语音认证服务器130提供用户配置文件创建、用户配置文件维护和用户认证。例如,用户配置文件可根据生物计量声纹、密码短语和设备标识符来生成,并存储在声纹数据库140中,如图2中所述。用户配置文件的维护允许用户更新或改变其配置文件细节,诸如他们的生物计量声纹、以及口令和关联信息。用户认证允许参照先前所创建的声纹来认证用户。认证可使用用户的记录语音、以及提供给用户的手持式设备IMEI或PIN来执行。例如,取代IMEI,可将PIN分配给移动设备以使该设备与用户配置文件相关联。
除先前图2中所示的系统组件之外,示例性实现300可包括插入在语音认证服务器130与图1的现有呼叫处理移动通信环境100之间的网关145。在一种配置中,服务器130可支持订户顺应性、LDAP和审计索引。在一种配置中,网关145可使用由移动设备120提供的GPS定位数据中的信息以验证呼叫者的位置。生物计量声纹识别与位置验证能力的组合形成针对诸如博弈(可以是例如仅在某些州或地区允许)、或者贸易(可以是例如在某些管辖区域内不允许的某些物品的销售)之类应用的特别便利的解决方案。网关145可从GPS数据识别设备的位置以确定呼叫者的位置。
网关145还可在移动通信环境100中执行呼叫匹配和路由。例如,如本领域中所公知的,网关可支持用于与用户相关联地标识呼叫号码和被叫号码的ANI和DNIS。用户可通过该用户呼叫所使用的号码来标识,或者通过该用户所呼叫的号码来标识。在一个预期配置中,呼叫信息可作为用户配置文件的一部分被包括,并用于验证用户的身份。在实践中,语音认证服务器130可通过向网关145查询呼叫者标识信息和位置信息来参照存储在数据库130上的用户配置文件认证对移动设备160说话的用户。
参照图4,示出了示例性语音认证系统200。语音认证系统200可包括连接到语音认证服务器130的移动设备102。认证服务器130可包括认证servlet(小服务程序)420、配置文件管理模块420、验证模块420和声纹数据库140。这些模块可驻留在服务器130上或移动通信环境100内的其它服务器上的远程位置处。图4涉及基于客户机-服务器架构,但本发明的诸方面并不限于此配置。语音认证的原理可等效地应用于分布式网络以及对等网络。
应当注意:某些组件转自图1,并且提供这些组件仅为示出用于将语音认证系统200集成到移动通信环境100(参见图1)内的一个实施例。在实践中,语音认证系统200可基于对用户语音的认证准许移动设备的用户访问该设备可用的一个或多个资源以便访问这些资源或服务。语音认证系统200并不限于所示程序模块或该程序模块的架构。程序模块仅呈现为用于部署本文所述的本发明的语音认证诸方面的一个实施例。
语音认证系统200可包括在移动设备(102)上运行的应用410。该应用可以是以诸如C、C++、Java、Voic(语音)XML、Visual Basic等程序设计语言编写的软件。例如,应用410可以是用于向安全web站点发送或从其发送机密或安全信息的财务或商业应用。机密信息可以是语音、音频、视频或数据的形式。应用410可获得对由该移动设备支持的底层通信协议的访问。例如,应用410可以是Java2微型版(J2ME)applet(小应用程序),它具有支持HTTP的、到一个或多个通信地连接到移动设备410的服务器的套接字(socket)连接。通信协议可通过本地C接口来支持。例如,J2ME可访问移动设备上410上的本地C代码以便连接到服务器(130)。
应用410可与在语音认证服务器130(参见图1)上的认证servlet 420通信。认证servlet可用作移动设备客户端102的前端,并基于请求类型将请求引导到语音认证服务器130。例如,请求类型可以是如前所述的用户配置文件创建、用户配置文件更新或用户配置认证。基于请求类型,认证servlet 420可调用适当的配置文件管理功能。即,在确定请求类型时,配置文件管理模块420可与应用410通信以执行相关联的请求。
在一种配置中,认证servlet 420和应用420可经由安全HTTP连接412通信。认证servlet 420可通信地耦合到用于认证用户的验证模块430。在一种配置中,认证servlet 420可经由Java本地接口(JNI)414与验证模块430通信。JNI 414在程序组件之间提供程序设计语言翻译。例如,认证servlet 420可以Java编写,而验证模块430可以C编写。JNI 414提供了从一种格式向另一格式传输数据同时保留代码和数据的结构方面的接口。验证模块430可向应用410传送信息或从其接收信息。值得注意的是,移动设备102、HTTPS 412、认证servlet 420和JNI414在语音认证服务器(130)上的验证模块420与移动设备102上的应用(410)之间建立通信通道。
在实践中,移动设备102可将用户配置文件142(参见图2)发送到验证模块420。例如,当用户期望访问供给移动设备的一个或多个资源或服务时,移动设备102可引入应用410。当用户创建用户配置文件时,移动设备也可引入该应用。例如,应用410可以是要求用户说出密码短语的J2ME应用。应用410还可访问移动设备102上的诸如IMEI号的设备标识符。该信息可用于创建用户配置文件。在特定设备中,IMEI号提取机制可不通过J2ME来支持。因此,这些设备可包括供用户键入该用户易于记住并用于认证的短PIN的装置。如果不支持IMEI号,则可要求用户键入PIN,然后该PIN可用于批准发送所存储的IMEI号。
在一种配置中,移动设备102可包括用于证实密码短语的话音识别引擎。可理解地,语音识别引擎仅评估短语被识别但并非用户的身份。因此,可在移动手持式设备上执行语音认证的第一方面;即,验证密码短语。可在服务器上评估生物计量声纹认证和设备标识符。因而,可在服务器上执行语音认证的第二方面。
或者,可在服务器130上执行包括话音识别的整个语音认证。在这种情况中,应用410可创建包括密码短语(144)、生物计量声纹(146)和IDEI(148)的用户配置文件142(参见图2)。在说出口令短语时,J2ME应用410可将用户配置文件发送到验证服务器。在一种配置中,J2ME应用410可对口头话语(即,密码短语)执行语音处理,并在创建用户配置文件并将其发送到验证模块430之前对生物计量语音的一个或多个特性进行编码。编码可压缩语音数据以减小发送口头话语所需的语音分组的大小。例如,语音数据可使用本领域中众所周知的声码器(vocoder)来压缩。在第二配置中,口头话语可以非压缩格式发送到验证模块430。例如,可以脉冲编码调制(PCM)格式或微软波形格式(Microsoft Wave Format)(WAV)来发送。
配置文件管理模块420可与servlet420通信以评估存储在声纹数据库140中的一个或多个用户配置文件。配置管理模块420可创建、更新和删除用户配置文件。配置文件管理模块420还可与其它配置文件管理系统同步。例如,配置文件管理模块420可曝露API以便在成功认证用户之后与外部系统集成。在一种配置中,应用程序设计接口(API)允许应用开发者快速地根据本文所讨论的语音认证系统的诸方面来集成其应用。例如,参看图2,API可包括用于创建生物计量声纹的模块(144)、用于创建密码短语的模块(142)和用于标识设备的模块(146)。API向认证servlet 420提供接口以访问声纹创建和认证服务。
配置文件管理模块420可经由Java数据库连接(JDBC)416接口来与声纹数据库140通信。JDBC 416可提供用于从声纹数据140检索和向其存储数据的数据访问。例如,声纹数据库140可以是由如本领域中所公知可被索引成行列格式化的关系数据库。JDBC 140提供了在声纹数据库140内定位报头和字段的结构化查询语言。配置文件管理模块420可针对生物计量声纹解析用户配置文件并将该生物计量声纹与声纹数据库140中的其它声纹作比较。在一种配置中,生物计量声纹可使用供以索引的移动手持式设备的IMEI号来存储。值得注意的是,声纹数据库140包括来自具有经注册声纹的多个用户的一个或多个参考声纹。在确定与声纹的匹配时,配置文件管理模块420可准许用户对一个或多个资源的访问。例如,配置文件管理模块420可允许到一个或多个安全站点、商业数据库、财务中心等的套接字连接。
参照图5,示出了用户配置文件创建的流程图。用户配置文件创建可包含比所示步骤更多或更少的步骤。将参照图4描述这些步骤。在步骤501,用户启动该应用。例如,参照图4,用户激活J2ME应用410。或者,用户可访问web站点、语音邮件、或者请求要求诸如登录屏幕的认证的服务。在这种情况中,设备可自动地启动用于对用户授权的J2ME应用410。在步骤502,提示用户记录其用于声纹创建的语音。用户可提交用户将在语音认证期间陈述的特定短语。在步骤503,用户使用所提供的应用(410)来记录他们的语音。在步骤504,用户可输入PIN号。再次地,如果应用不从设备检索IMEI号,则可能需要PIN号。如果应用410可访问IMEI,则可不需要PIN号。在步骤505,提示用户注册其配置文件。例如,用户可选择在声纹数据库上存储最新创建的用户配置文件以备将来的检索。在步骤506,注册细节连同所记录的语音被发送到认证服务器。在507,认证服务器(130)创建用户声纹。在步骤508,认证服务器(130)使用用户声纹和IMEI(或PIN)来创建用户配置文件。例如,用户配置文件可被存储在声纹数据库(140)中。在509,认证服务器(130)使用肯定确认来向用户作出响应。
参照图6,示出了通过语音认证600来验证用户的流程图。认证600可包含比所示步骤的数量更多或更少的步骤。还将参照图4以便描述与实践这些步骤相关联的组件。在步骤601,用户启动应用。应用还可基于用户动作—诸如访问需要认证的特征或服务—来自动启动。在步骤602,提示用户记录其语音用以声纹验证。这是与在用户配置文件创建500期间被记录的相同的短语。在步骤603,用户使用所提供的应用(140)来记录其语音。在步骤604,用户键入用于在用户配置文件创建500期间向认证服务器注册的PIN。在步骤605,认证细节连同所记录的语音被发送到认证服务器(130)。在步骤606,认证服务器使用用户PIN检索用户的声纹。在步骤607,认证服务器(130)使用验证模块来对照一个或多个所存储的声纹来验证用户所记录的语音。在步骤608,认证服务器向用户作出响应。在步骤609,如果认证成功,则用户可进一步进行服务或应用。在步骤610,如果认证不成功,则提示用户认证失败,并且应用退出。
参照图7,示出了用于设备上的语音认证的方法700。该方法可包括从用户接收一个或多个口头话语(702)、识别与一个或多个口头话语相对应的短语(704)、根据该短语的一个或多个口头话语的变化性来标识用户的生物计量声纹(706)、确定与设备相关联的设备标识符(708)、以及基于该短语、生物计量声纹和设备标识符来认证用户(710)。具体地,在一种配置中,用户多次说出口头话语(例如密码短语)。可评估用户语音的变化以确定用户声道构造中的变化。在一种配置中,可确定设备或用户的位置(712)以便如先前图3中所述地准许访问。
可在生物计量声纹中捕捉声道结构的变化,并与声纹数据库上的多个参考声纹作比较以标识匹配。即,响应于说话人的语音可生成第一声纹和至少第二声纹,第一声纹与第二声纹之间的差异可被标识,以及可判定该差异是否对应于说话人的声道的自然变化。值得注意的是,生物计量声纹是一种声道结构,该结构在物理上对用户的声道是唯一的。因此,如果差异表示说话人声道中的自然变化,则可认证说话人。
例如,再次参看图3,实现语音认证方法700的设备102可建立到至少一个认证服务器的连接、向至少一个认证服务器发送用户配置文件、将用户配置文件与存储在至少一个认证服务器上的多个参考配置文件作比较、以及判定用户配置文件是否与用于认证用户的多个参考配置文件之一匹配。在识别到短语时,语音认证服务器或设备可评估口头话语之间的一个或多个声道结构差异。来自多个参考配置文件的一个或多个声道形状可基于声道结构差异来匹配。
在前述中,提供了用于实践方法步骤700的语音认证系统的详细描述。具体地,参照图8,示出了语音认证系统的语音认证方面的算法800。该算法800是用于基于生物计量声纹分析证实用户的身份的底层语音处理方法的上层描述。这样,应当注意,算法800可包含比所示步骤数量更多或更少的步骤。实际上,每个步骤还可包含附图中未示出但在本说明书中阐述的步骤。在描述方法800时,将参照图4。
在步骤802,言语话语可被分段成发声帧。例如,参照图4,用户讲入移动设备102的密码短语(例如,口头话语)可被分割成浊音段和清音段。即,对应于诸如元音的周期部分的部分可被归类为浊音,而对应于诸如辅音的非周期部分可归类为清音。在步骤804,可根据浊音部分来计算线性预测编码(LPC)系数,并且在步骤806,将其转换成线谱对(LSP)。LSP系数适用于压缩和编码。在步骤808,可根据LSP系数来计算共振峰。共振峰是话音频谱中对应于通过发声过程“形成”的共振和静音的那些部分。具体地,人体话音生成系统的诸如喉、舌、嘴和嘴唇的物理结构形成空腔,该空腔在从肺发射的压力波中形成共振。频域中的共振峰表示在发声帧的发音过程中的用户声道形态的特征。在步骤810,在LPC/LSP分析期间所提取的关于共振峰结构和特性的信息可被包括在特征矩阵中。在步骤812,特征矩阵可被归一化。归一化的一个方面可包括移除背景噪声。归一化的第二方面可包括说明声道结构的长度和面积。在步骤814,可从特征矩阵计算声纹和阈值。生物计量声纹可包括表1中所示的特征。
Figure A200680027372D00191
表1
在实践中,用户可递交与在语音登记期间使用的密码短语相对应的口头话语;即,在用户向语音认证服务器注册他们的生物计量声纹时。例如,在登记期间,用户说出同一密码短语三次。针对密码短语的每一记录计算特征矢量矩阵。特征矩阵是表示说话人的语音的特征的数值矩阵。在该情况中,三个特征矩阵用于形成生物计量声纹。例如,参照表1中列出的所枚举的声纹,包括均值和范围的各个特征被用在声纹中。表1的特征与三个矩阵结合使用,以定义声纹。例如,特征矩阵定义了语音的特征,而表1的属性描述声道结构的变化。例如,表1的属性表示声道形状。值得注意的是,通过标识表1的生物计量声纹中定义的每个语音帧的特征矢量的范围来捕捉密码短语的发音中的变化。例如,表1中的生物计量声纹的索引3对一个或多个特征矢量的每个元素标识最大值和最小值。例如,范围可在密码短语的发音期间标识自然发生的共振峰的振幅变化、共振峰的带宽变化、共振峰位置变化,这对说出密码短语的用户是特殊的。
在验证期间,用户说出对应于密码短语的同一口头话语,并且生成生物计量声纹。对照先前存储的声纹来比较生物计量声纹以标识匹配。在验证过程中,还使用在注册中所用的语音认证算法800来从所说短语计算特征矩阵。对照存储在声纹数据库中的一个或多个参考矩阵来比较此特征矩阵。可针对生物计量声纹的每个特征矩阵计算对数距离。如果对数距离小于预定阈值水平,则匹配可被确定,并且说话人可被标识。验证过程的一个独特方面包括设置比较阈值水平,该水平取决于来自声纹的阈值。该阈值取决于说话人自身的变化性,并可基于用户的语音来调节。或者,阈值可设置被设置成阈值无关,并且不基于用户的语音来调节。
在一个实现中,生成声纹的方法800可由手持式设备执行,而对用户授权一用户的方法700可由与该手持式设备通信的服务器执行。参看图9,它示出了用于实践生成该声纹的方法800的语音认证系统900的各种组件的图示。语音认证系统900可包括语音处理器144和生物计量声纹分析器148。语音处理器144可从用户接收口头话语和该口头话语的至少一次重复。生物计量语音分析器146可根据口头话语及其至少一次重复来计算一个或多个声道形状,并基于口头话语及其至少一次重复的不同发音来计算一个或多个声道形状之间的声道结构差异。声道结构差异对应于与一个或多个口头话语相关联的用户声道的有限物理变化。例如,声道结构差异可基于说明话音频谱随时间动态变化的动量谱。动量谱可包括话音的一个或多个语音片断的下限和上限,使得上限与下限之间的话音频谱中的变化对应于唯一的声道结构。
在一个配置中,尽管并非必需,但是语音处理器144可包括话音识别器146。话音识别器146可证实由用户在语音认证期间所说的短语。在一个方面中,话音识别器146还可标识口头话语中的浊音和清音区段、从浊音区段识别一个或多个音素(phoneme)、以及标识一个或多个音素在发声帧(例如,浊音段)中的位置。语音处理器可将口头话语分段成一个或多个发声帧、从一个或多个发声帧生成一个或多个特征矢量、从一个或多个特征矢量计算特征矩阵、以及在一个或多个发声帧上对特征矩阵进行归一化。例如,可针对每个所说短语计算特征矩阵。口头话语可被分割成具有5与20ms之间的时间长度的一个或多个话音帧。
语音处理器可标识话音帧中的绝对最小值和最大值。可将这些值与预定阈值比较。如果最大值和最小值小于振幅水平,则帧可被分类成不具有语音分量,而算法800进行到下一帧。如果最大值和最小值大于振幅水平,则可对话音帧信号计算自相关函数。如果一个或多个预指定自相关项小于预定阈值,则帧被认为缺少浊音信号,而算法800进行到下一帧。
快速傅立叶变换(FFT)可应用到浊音加窗话音帧。该话音帧可与加权窗口相乘以说明频率分析之前的非连续性。FFT将N个样本的每个帧从时域变换到频域。在此步骤之后获得的结果是振幅谱或频谱。
人体对话音信号的声音的频率成分的感知并不遵循线性标度。因此,Bark(巴克)标度可应用到振幅谱,以便从线性频率标度转换到接近人体听觉灵敏度的标度。即,可对一个或多个发声帧执行感知滤波器组分析(perceptual filterbank analysis)。一种用于模拟Bark频率的方法是使用滤波器组,每个期望Mel(美)频率分量一个滤波器。滤波器组可具有三角形带通频率响应。间距以及带宽由Bark频率间隔来确定。Bark频谱系数的个数IBR取决于频率范围。电话信道频率范围3400Hz与17个Bark匹配。因此,0-3400Hz频率范围与17个一Bark带宽滤波器匹配。每个滤波器带可具有三角形带通频率响应,并且间距以及带宽可由常数Bark频率间隔来确定。根据Bark标度来移位的频谱频率可称为Bark频谱。
在Bark标度频率组上,Bark频谱XF(n,k)可乘以加权因子,而且对所有加权因子的乘积可被求和以获得每个频带的能量。可对口头话语的每个话音帧计算能量矩阵。例如,所说密码短语可被表示成矩阵E(m,i)。为了移除某些非期望脉冲噪声,可使用三点中值滤波器(three-point median filter)来进行平滑。经平滑的能量ES(m,i)可通过移除背景噪声的频率能量来归一化以获得与话音信号EV(m,i)相关联的原始能量。在一种配置中,背景噪声能量En(m,i)可通过对最初的8个话音帧的能量求平均值来估算。
EV(m,i)=ES(m,i)-En(i)
E n ( i ) = Σ m = 1 8 E S ( m , i ) 8
通过使用第m个帧EV(m,i)的第i个频带的经平滑和归一化的能量,可计算在第i个频带的话音信号的总能量:
E B ( i ) = Σ m = 1 M | E V ( m , i ) |
阈值可按如下计算:
T ( i ) = ln E B ( i ) E n ( i )
如果T(i)>1.5,则频带可维持完好,因为可认为存在比噪声更多的话音。相反,如果阈值较小,则频带可被认为存在过多噪声,并且不被用于进一步的计算。因此,当更多的频带超过1.5阈值时,反映了更高的话音内容。超过阈值的频带可作为新的频带计数来计数。即,感知滤波器组分析包括估算沿Bark频率标度的一个或多个频带中的话音能量和噪声能量。在感知滤波器组分析期间,可通过丢弃话音能量与噪声能量之比不超过发声阈值的滤波器组来抑制背景噪声。可使用新的频带计数来计算总信号能量:
E a ( m ) = Σ i = 1 IJQ | E V ( m , i ) |
可对每个Ea(m)确定最小值和最大值。自适应发声分段阈值也可基于所确定的最小值和均方根项来计算:
TV=EaMin+0.3*RMS
RMS-Ea(m)的标准偏差
Ea(m)>TV的帧被分类为发声,并且可仅使用发声帧来计算新的矩阵。值得注意的是,前述语音处理技术用于标识话音的语音片段,并基于话音的浊音部分来计算特征矩阵。话音的浊音部分可包括可在口头话语中标识和定位的音素。例如,参照图9,话音识别器146可标识音素。
接着是浊音活度分析,可从感知滤波器组分析计算线性预测系数(LPC)。预加重(pre-emphasis)可被应用到EV(m,i)以减小频谱的动态范围。这改进了LPC分析算法的数值属性。找到振幅频谱的最大值,并且可将该最大值之后的所有点乘以加权系数。然后,可将LPC转换成线谱对系数(LSP’s)。可从LSP’s计算共振峰和反共振峰,并且可从共振峰和反共振峰计算特征矢量。在确定共振峰和反共振峰时,可计算每个话音帧的特征矢量。可针对表示口头话语的浊音片段的特征矢量创建特征矩阵。特征矩阵可包括共振峰位置、共振峰振幅、共振峰带宽、反共振峰位置、反共振峰振幅、反共振峰带宽、相位信息、平均振幅信息、差分信息和动态特征。具体地,沿Bark标度表示出共振峰和反共振峰信息。可估算共振峰和反共振峰信息中的差异,以便表征声道结构中自然变化的一个方面。即,可对一个或多个特征矢量来估算失真,以标识由类似声道结构生成的声纹匹配。
可从特征矩阵计算声道频谱。具体地,使用在口头话语的一次或多次重复之间具有类似特性的共振峰来创建声道频谱。即,使用实质上有助于发声结构的一致表示的共振峰来创建声道频谱。声道频谱可从LPC或从自相关函数来计算。对应于声道结构的声道形状中的变化可根据声道频谱中的变化来标识。具体地,声道结构可被表示成具有相应长度和面积的一个或多个部分,该长度和面积表征用户声道的一个或多个部分。声道结构差异对应于与一个或多个口头话语相关联的用户声道的有限物理变化。例如,声道结构差异可基于说明话音频谱随时间动态变化的动量谱。频谱振幅和频谱相位可发生动态变化。动量谱可包括话音的一个或多个片断的下限和上限,从而话音频谱在下限与上限之间的变化对应于唯一的声道结构。表1中呈现了特征矩阵的上限和下限。
例如,参照图9,语音处理器944从与一个或多个发声帧相对应的口头话语的多个部分的特征矢量来计算特征矩阵,其中特征矩阵是一个或多个发声帧的特征矢量的级联。语音处理器944还通过移除比预定长度短的发声帧以及移除与超出平均声道结构的声道结构相对应的发声帧来对特征矩阵进行归一化。声道频谱可通过特征矩阵中的大量特征来表征或表示。从语音数据库的统计研究选择这些特征的属性,以最小化说话人自身的变化性,而最大化说话人之间的变化性。
可理解地,在语音认证期间,生物计量语音分析器(参见图9)对照所存储的说话人语音的特征矢量的标识参数来比较特征矢量的标识参数。这些参数包括在表1的生物计量声纹中所捕捉的共振峰信息和反共振峰信息。值得注意的是,生物计量声纹包括三个特征矩阵(与短语的三次重复相关联)以及表1中表征用户声道形状的属性。即,声道形状通过特征矩阵来表征并可根据其来计算。
在计算特征矩阵以确定声道形状的过程中,将从该特征矩阵中所指定的最初三个共振峰生成第一声道形状。声道形状曲线可从共振峰开始按0.2cm的增量来计算。还可对发声帧计算声道长度。例如,生物计量语音分析器从第一生物计量声纹的较低共振峰计算第一声道形状、基于该第一声道形状确定声道结构的差异、标识提供最小声道结构差异的类似声道形状、以及从该第一生物计量声纹的较高共振峰形成类似声道形状。着重较大共振峰频率来表征说话人的发音风格的一个方面。
再次参看图9,生物计量语音分析器944根据特征矢量来确定一个或多个声道横截面面积,并且对一个或多个声道横截面面积确定一个或多个声道长度。而且,当确定声道形状时,可考虑通信带宽。例如,可针对通常在140Hz到4.6KHz之间的电话带宽来调节共振峰频率:F1=640、F2=1730、F3=2860和F4=3340。声道的横截面可基于经补偿的共振峰频率位置来更新。可基于话音的一个或多个发声帧对声道形状确定声道横截面的平均值。例如,可为浊音话音中声道形状的变化相对恒定的音素区域确定断面。
可基于声道形状的变化性来创建变化范围以便为特征矩阵中的特征矢量产生变化矢量。例如,生物计量语音分析器944计算变化矢量的对数距离,并基于该对数距离确定阈值。该阈值用于确定对用户进行认证的声道结构差异是否落在变化范围内。变化范围可被表示成诸如表1中所示的特征矢量的平均值和标准偏差。生物计量语音分析器944还对变化范围计算直方图,基于最大值计算导矢,并且基于矢量导矢计算个人直方图和第二变化范围。
在验证期间,生物计量语音分析器944估算个人直方图以判定生物计量生物是否与用于验证用户的身份的所述多个生物计量声纹之一相匹配。当个人直方图的第一多个面元(bin)被填满,则身份有效,而其中当个人直方图的第二多个面元被填满,则身份无效。值得注意的是,表1生物计量声纹中的特征信息用于生成个人直方图,以确定用户声道形状何时与个人直方图相匹配。直方图统计地标识生物计量声纹的特征是否为人们说话的特征。即,说话人声道形状的变化可被估算并统计地与关联于特定用户声道结构的变化作比较。再次地,可提供口头话语的多次递交以确定声道结构差异;即,声道形状的变化。个人直方图提供了一种用于对用户分类和认证的实用检测方法。例如,在验证期间,生物计量语音分析器计算对数距离,并估算用于确定个人直方图的第一多个面元何时被填满的阈值。该阈值还可基于用户语音来调节。
以上已参照具体实施例描述了益处、其它优点和问题的解决方案。然而,益处、优点、问题的解决方案以及可使任何益处、优点或方案出现或变得显著的任何元素不应当解释为任何或所有权利要求的关键、必需或本质特征或元素。如本文所用的术语“包括”、“包含”或其任何变体旨在涵盖非排除性包括,从而包括一系列元素的进程、方法、物品或装置并非仅包括那些元素,而是可包括未明确列出或这些进程、方法、物品或装置所固有的其它元素。还应当理解,诸如第一和第二、顶部和底部等的关系术语如果有也仅用于区分不同实体或动作,而并非一定要求或暗示这些实体或动作之间的任何实际的这种关系或次序。
可适当地在硬件、软件或硬件和软件的组合中实现本发明的实施例。适于执行本文所述方法的任何类型的计算机系统或其它装置都是合适的。硬件和软件的典型组合可以是具有计算机程序的通信设备,当加载和执行该程序时,可控制该移动通信设备使其执行本文所述方法。本发明和系统的部分还可嵌入到计算机程序产品中,该部分包括使得能够实现本文所述的方法的所有特征,而且其被加载到计算机系统中时,能够执行这些方法。
虽然已经示出并描述了本发明的优选实施例,但是应当明白,本发明的实施例并不限于此。对于本领域技术人员而言,可进行许多更改、改变、变化、替代或等效方案而不背离如由所附权利要求所定义的本发明的实施例的精神和范围。

Claims (54)

1.一种在设备上用于语音认证的方法,包括:
从用户接收一个或多个口头话语;
识别与所述一个或多个口头话语相对应的短语;
根据所述短语的所述一个或多个口头话语标识生物计量声纹;
确定与所述设备相关联的标识符;以及
基于所述短语、所述生物计量声纹和所述设备标识符来认证所述用户。
2.如权利要求1所述的方法,其特征在于,所述标识还包括:
确定一个或多个口头话语的变化性来创建所述生物计量声纹,其中所述生物计量声纹是一种声道结构,所述结构对于所述用户的声道而言在物理上是唯一的。
3.如权利要求1所述的方法,其特征在于,还包括:
在对所述用户进行认证时,准许对与所述设备通信的一个或多个资源的访问。
4.如权利要求1所述的方法,其特征在于,还包括验证所述设备的位置。
5.如权利要求4所述的方法,其特征在于,所述设备包括用于标识所述设备的所述位置的全球定位系统(GPS)。
6.如权利要求1所述的方法,其特征在于,还包括:
接收所述用户的、标识所述用户的位置的第二口头话语;以及
确认所述用户的所述位置与所接受位置相对应。
7.如权利要求1所述的方法,其特征在于,所述移动设备标识符是IMEI号。
8.如权利要求7所述的方法,其特征在于,所述IMEI号与数据库中的所述生物计量声纹相关联,所述数据库使用所述IMEI号来对所述生物计量声纹进行索引。
9.如权利要求1所述的方法,其特征在于,所述移动设备标识符是分配给所述设备的PIN。
10.如权利要求1所述的方法,其特征在于,所述设备是移动手持式设备、蜂窝电话、个人数字助理、膝上型设备、笔记本计算机、便携式音乐播放器和通信设备之一。
11.如权利要求1所述的方法,其特征在于,还包括:
建立与至少一个认证服务器的连接;
将用户配置文件发送到所述至少一个认证服务器;
将所述用户配置文件与存储在所述至少一个认证服务器中的多个参考配置文件进行比较;以及
确定所述用户配置文件是否与所述多个参考配置文件之一相匹配以便认证所述用户,
其中用户配置文件包括短语、生物计量声纹和设备标识符中的至少之一。
12.如权利要求11所述的方法,其特征在于,所述认证的第一部分在所述设备上发生,而所述认证的第二部分在所述认证服务器上发生。
13.如权利要求11所述的方法,其特征在于,所述认证服务器包括诸如web层、业务层和数据库访问层的软件应用。
14.如权利要求11所述的方法,其特征在于,所述比较包括:
在识别所述短语时,估算所述口头话语之间的一个或多个声道结构差异,以及
基于所述声道结构差异来匹配多个参考配置文件的一个或多个声道形状。
15.如权利要求14所述的方法,其特征在于,在所述口头话语的一个或多个浊音片段处估算所述声道结构差异。
16.如权利要求14所述的方法,其特征在于,声道结构差异对应于用户声道与多个口头话语相关联的有限物理变化。
17.如权利要求14所述的方法,其特征在于,所述声道结构差异是基于说明话音频谱随时间动态变化的动量谱。
18.如权利要求17所述的方法,其特征在于,所述动量谱包括话音的一个或多个语音片段段的上限和下限,使得所述上限和所述上限之间的所述话音频谱的变化对应于唯一的声道结构。
19.如权利要求14所述的方法,其特征在于,所述声道结构被表示成具有作为所述用户声道的一个或多个部分的特性的相应长度和面积的一个或多个部分。
20.如权利要求14所述的方法,其特征在于,还包括:
确定所重复的口头话语之间的差异是否落在失真范围内;以及
如果所述差异落在所述失真范围内,则判定声纹匹配。
21.如权利要求14所述的方法,其特征在于,所述比较还包括:
确定至少一个共振峰频率;
确定至少一个反共振峰频率;以及
估算所述共振峰频率与所述反共振峰频率之间的差异,以便表征声道结构中的自然变化的一个方面。
22.如权利要求21所述的方法,其特征在于,所述估算所述共振峰频率与所述反共振峰频率之间的差异补偿电话带宽。
23.如权利要求21所述的方法,其特征在于,较高的共振峰频率被着重以表征说话人的发音风格的一个方面。
24.一种用于说话人证实的方法,包括:
响应于说话人的语音生成第一声纹;
响应于所述说话人的语音生成至少第二声纹;
标识所述第一声纹与所述第二声纹之间的差异;
确定所述差异是否对应于所述说话人声道的自然变化;以及
如果所述差异表示所述说话人声道中的自然变化,则认证所述说话人。
25.如权利要求24所述的方法,其特征在于,自然变化是在口头话语的发音期间与所述说话人的发声姿态的变化相关的声道的物理变化,并且所述变化对于所述说话人是唯一的。
26.一种用于生成生物计量声纹的系统,包括:
语音处理器,用于从用户接收口头话语和所述口头话语的至少一次重复;
生物计量语音分析器,用于:
从所述口头话语和所述至少一次重复来计算一个或多个声道形状,以及
基于所述口头话语和所述至少一次重复之间的不同发音来计算所述一个或多个声道形状之间的声道结构差异。
27.如权利要求26所述的系统,其特征在于,所述语音处理器:
将口头话语分段成一个或多个发声帧;
从所述一个或多个发声帧生成一个或多个特征矢量;
从所述一个或多个特征矢量计算特征矩阵;以及
在所述一个或多个发声帧上对所述特征矩阵进行归一化。
28.如权利要求27所述的系统,其特征在于,所述语音处理器包括话音分析器,用于:
标识所述口头话语中的浊音和清音区段;
从所述浊音区段识别一个或多个音素;以及
标识所述发声帧中的所述一个或多个音素的位置。
29.如权利要求27所述的系统,其特征在于,所述语音处理器通过以下步骤生成所述一个或多个特征矢量:
将口头话语分段成一个或多个发声帧;
对所述一个或多个发声帧执行感知滤波器组分析;
从所述感知滤波器组分析计算线性预测系数(LPC);
将所述LPC变换成线谱对系数(LSP’S);
从所述LSP’S计算共振峰和反共振峰;以及
从所述共振峰和反共振峰创建特征矢量。
30.如权利要求29所述的系统,其特征在于,所述语音处理器:
从所述口头话语对应于所述一个或多个发声帧的多个部分的所述特征矢量计算特征矩阵,其中所述特征矩阵是所述一个或多个发声帧的级联;以及
通过移除比预定长度短的发声帧以及移除对应于超出平均声道结构的声道结构的发声帧来对所述特征矩阵归一化。
31.如权利要求29所述的系统,其特征在于,所述执行感知滤波器组分析包括来估算沿Bark频率标度的一个或多个频带中的话音能量和噪声能量。
32.如权利要求31所述的系统,其特征在于,还包括在所述感知滤波器组分析期间,通过丢弃具有不超出发声阈值的话音能量与噪声能量之比的滤波器组来抑制背景噪声。
33.如权利要求29所述的系统,其特征在于,所述计算线性预测系数包括将预着重应用到所述话音信号。
34.如权利要求29所述的系统,其特征在于,所述特征矢量包括最小化说话人自身的变化性以及最大化说话人之间的变化性的标识参数。
35.如权利要求30所述的系统,其特征在于,所述生物计量声纹分析器:
从所述特征矩阵计算一个或多个声道形状;
从所述一个或多个声道形状计算声道结构差异;
估算一个或多个音素的频谱中的变化性;以及
基于所述变化性来对声道结构差异建立变化范围。
36.如权利要求35所述的系统,其特征在于,所述生物计量语音分析器对照所存储的所述说话人语音的特征矢量的标识参数来比较所述特征矢量的标识参数。
37.如权利要求35所述的系统,其特征在于,所述生物计量语音分析器:
根据所述特征矢量来确定一个或多个声道横截面面积;以及
对所述一个或多个声道横截面面积确定一个或多个声道长度。
38.如权利要求37所述的系统,其特征在于,所述生物计量语音分析器:
计算变化范围以便对所述特征矩阵中的所述特征矢量生成变化矢量;
确定所述变化矢量的对数距离;以及
基于所述对数距离建立阈值,其中所述阈值用于确定用以认证用户的声道结构差异是否落在变化范围内。
39.如权利要求38所述的系统,其特征在于,所述变化范围被表示成所述特征矢量的均值和标准偏差。
40.如权利要求38所述的系统,其特征在于,所述声纹语音分析器:
对所述个人声道形状确定变化范围;
对所述变化范围计算直方图;
确定所述直方图的最大值;
基于所述最大值计算导矢;
基于所述导矢计算个人直方图和第二变化范围;
41.如权利要求40所述的系统,其特征在于,所述生物计量语音分析器:
估算个人直方图来确定生物计量声纹是否匹配于所述多个生物计量声纹之一,以验证所述用户的身份生物计量,
其中当所述个人直方图的第一多个图元被填满时,所述身份有效,以及其中当所述个人直方图的第二多个图元被填满时,所述身份无效。
42.如权利要求41所述的系统,其特征在于,所述生物语音分析器:
计算对数距离;以及
估算用于确定所述个人直方图的第一多个图元何时被填满的阈值。
43.如权利要求42所述的系统,其特征在于,所述阈值基于用户语音来调节。
44.如权利要求42所述的系统,其特征在于,还包括应用程序设计接口(API),它具有:
生物计量声纹创建模块,
密码短语创建模块;以及
设备标识符模块,
用于创建包括从所述生物计量声纹创建模块、所述密码短语创建模块和所述设备标识符模块生成的生物计量声纹、密码短语和设备标识符的用户配置文件。
45.一种语音认证方法,包括:
根据从用户接收到的一个或多个口头话语来确定一个或多个声道形状;
估算所述一个或多个声道形状之间的的声道差异;
对照所存储的所述用户语音的参考声道形状的表示来比较所述声道差异;以及
确定所述声道结构差异是否表示所述参考声道形状的自然变化,其中自然变化是所述声道结构中可由所述用户在物理上发音的变化。
46.如权利要求45所述的方法,其特征在于,确定一个或多个声道形状还包括:
从所述第一生物计量声纹的较低的共振峰来计算第一声道形状;
基于所述第一生物计量声道形状来确定声道结构差异;
标识提供最小声道结构差异的类似声道形状;以及
从所述第一生物计量声纹的较高共振峰形成所述类似声道形状。
47.如权利要求45所述的方法,其特征在于,还包括:
确定所述口头话语的源,其中所述源是对麦克风说出所述口头话语的所述用户、或回放对麦克风所说的口头话语的记录的设备之一;以及
如果所述源是所述用户,则准许访问,而如果所述源是所述设备,则不准许访问。
48.如权利要求47所述的方法,其特征在于,所述确定源还包括:
标识表示所述口头话语的声学信号是否是由数字记录设备生成的波形的特性,
其中所述标识包括识别由所述数字记录设备给予的频谱倾斜。
49.一种语音认证方法,包括:
在呼叫期间,在交互式语音应答(IVR)系统上接收口头话语;
响应于对所述口头话语的识别调用程序性动作,
分析所述口头话语以标识提交所述口头话语的用户的声纹;以及
基于对所述声纹的认证,准许所述用户访问所述程序性动作。
50.如权利要求49所述的方法,其特征在于,还包括:
识别所述口头话语中的一个或多个号码;以及
自动地输入所述一个或多个号码以访问所述IVR的特征,
由此所述程序性动作对在所述口头话语中识别到的所述一个或多个号码进行拨号以访问所述特征。
51.如权利要求49所述的方法,其特征在于,还包括:
从用于提交所述口头话语的设备接收设备标识符;以及
在准许访问之前,证实所述设备对用户的注册。
52.如权利要求49所述的方法,其特征在于,还所述程序性动作是安全交易,并且所述口头话语标识诸如帐号、银行电汇号码、电话号码、社会保障号码和pin号的安全信息。
53.如权利要求52所述的方法,其特征在于,还包括:
在所述准许访问中,根据所述程序性动作将所述呼叫转发到呼叫中心;以及
在与所述呼叫中心连接时,调用所述呼叫中心的屏幕弹出以显示用户帐户信息。
54.如权利要求53所述的方法,其特征在于,所述交互式语音应答(IVR)系统驻留在PBX、网关、语音服务器和因特网语音服务器之一上。
CN2006800273727A 2005-05-27 2006-05-26 用于生物计量声纹认证的方法和系统 Active CN101467204B (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US68542705P 2005-05-27 2005-05-27
US60/685,427 2005-05-27
US11/420,190 2006-05-24
US11/420,190 US7536304B2 (en) 2005-05-27 2006-05-24 Method and system for bio-metric voice print authentication
PCT/US2006/020907 WO2006128171A2 (en) 2005-05-27 2006-05-26 Method and system for bio-metric voice print authentication

Publications (2)

Publication Number Publication Date
CN101467204A true CN101467204A (zh) 2009-06-24
CN101467204B CN101467204B (zh) 2013-08-14

Family

ID=37452992

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2006800273727A Active CN101467204B (zh) 2005-05-27 2006-05-26 用于生物计量声纹认证的方法和系统

Country Status (5)

Country Link
US (3) US7536304B2 (zh)
EP (1) EP1915294A4 (zh)
JP (1) JP2009508144A (zh)
CN (1) CN101467204B (zh)
WO (1) WO2006128171A2 (zh)

Cited By (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2011041977A1 (zh) * 2009-10-10 2011-04-14 Xiong Dianyuan 一种基于声纹识别和定位跟踪的交叉监控方法和系统
CN103237030A (zh) * 2013-04-25 2013-08-07 深圳市中兴移动通信有限公司 基于生物识别的用户认证方法及系统
CN103390123A (zh) * 2012-05-08 2013-11-13 腾讯科技(深圳)有限公司 用户认证方法、用户认证装置及智能终端
CN104094132A (zh) * 2012-01-30 2014-10-08 国际商业机器公司 经由声波纹位置感知的基于区域的存在确定
CN104184587A (zh) * 2014-08-08 2014-12-03 腾讯科技(深圳)有限公司 声纹生成方法、服务器、客户端及系统
CN104217149A (zh) * 2013-05-31 2014-12-17 国际商业机器公司 基于语音的生物认证方法及设备
CN104541493A (zh) * 2012-08-31 2015-04-22 苹果公司 使用生物计量数据在设备之间进行无线配对和通信
CN105096121A (zh) * 2015-06-25 2015-11-25 百度在线网络技术(北京)有限公司 声纹认证方法和装置
CN105873050A (zh) * 2010-10-14 2016-08-17 阿里巴巴集团控股有限公司 无线业务身份认证方法、服务器及系统
CN105940407A (zh) * 2014-02-04 2016-09-14 高通股份有限公司 用于评估音频口令的强度的系统和方法
CN106448685A (zh) * 2016-10-09 2017-02-22 北京远鉴科技有限公司 一种基于音素信息的声纹认证系统及方法
CN108154588A (zh) * 2017-12-29 2018-06-12 深圳市艾特智能科技有限公司 解锁方法、系统、可读存储介质及智能设备
CN108604449A (zh) * 2015-09-30 2018-09-28 苹果公司 说话者识别
CN108648760A (zh) * 2018-04-17 2018-10-12 四川长虹电器股份有限公司 实时声纹辨识系统与方法
US10171458B2 (en) 2012-08-31 2019-01-01 Apple Inc. Wireless pairing and communication between devices using biometric data
CN109979466A (zh) * 2019-03-21 2019-07-05 广州国音智能科技有限公司 一种声纹身份同一性鉴定方法、装置及计算机可读存储介质
CN109997185A (zh) * 2016-11-07 2019-07-09 思睿逻辑国际半导体有限公司 用于电子设备中的生物测定认证的方法和装置
CN110263523A (zh) * 2014-02-19 2019-09-20 三星电子株式会社 用于在电子装置中处理生物计量信息的方法和设备
CN110930159A (zh) * 2013-03-11 2020-03-27 Cfph 有限责任公司 用于博弈的设备
CN111385624A (zh) * 2018-12-29 2020-07-07 深圳Tcl新技术有限公司 一种基于语音的数据传输控制方法、智能电视及存储介质
US11012438B2 (en) 2014-09-30 2021-05-18 Apple Inc. Biometric device pairing
CN108711428B (zh) * 2018-05-30 2021-05-25 Oppo广东移动通信有限公司 指令执行方法、装置、存储介质及电子设备
CN113190508A (zh) * 2021-04-26 2021-07-30 重庆市规划和自然资源信息中心 一种面向管理的自然语言识别方法

Families Citing this family (215)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7130800B1 (en) * 2001-09-20 2006-10-31 West Corporation Third party verification system
US9031880B2 (en) 2001-07-10 2015-05-12 Iii Holdings 1, Llc Systems and methods for non-traditional payment using biometric data
US8412566B2 (en) 2003-07-08 2013-04-02 Yt Acquisition Corporation High-precision customer-based targeting by individual usage statistics
US7698566B1 (en) * 2004-07-12 2010-04-13 Sprint Spectrum L.P. Location-based voice-print authentication method and system
US7536304B2 (en) 2005-05-27 2009-05-19 Porticus, Inc. Method and system for bio-metric voice print authentication
US20060287863A1 (en) * 2005-06-16 2006-12-21 International Business Machines Corporation Speaker identification and voice verification for voice applications
JP4931927B2 (ja) * 2005-09-07 2012-05-16 バイループ テクノロジック,エス.エル. マイクロコントローラーを利用した信号認識法
US8234494B1 (en) * 2005-12-21 2012-07-31 At&T Intellectual Property Ii, L.P. Speaker-verification digital signatures
CN101051464A (zh) * 2006-04-06 2007-10-10 株式会社东芝 说话人认证的注册和验证方法及装置
US20070244700A1 (en) * 2006-04-12 2007-10-18 Jonathan Kahn Session File Modification with Selective Replacement of Session File Components
US7512567B2 (en) 2006-06-29 2009-03-31 Yt Acquisition Corporation Method and system for providing biometric authentication at a point-of-sale via a mobile device
US7570167B2 (en) * 2006-06-30 2009-08-04 Gene Fein RFID ionosphere
GB0616070D0 (en) * 2006-08-12 2006-09-20 Ibm Speech Recognition Feedback
WO2008048948A2 (en) 2006-10-17 2008-04-24 Solidus Networks, Inc. A method of distributing information via mobile devices and enabling its use at a point of transaction
US7992196B2 (en) * 2006-11-06 2011-08-02 Voice Identity, Inc. Apparatus and method for performing hosted and secure identity authentication using biometric voice verification over a digital network medium
US20080147389A1 (en) * 2006-12-15 2008-06-19 Motorola, Inc. Method and Apparatus for Robust Speech Activity Detection
US8384516B2 (en) * 2007-01-12 2013-02-26 Voorhuis Plc, Limited Liability Company System and method for radio frequency identifier voice signature
DE102007003094A1 (de) * 2007-01-16 2008-07-31 Vodafone Holding Gmbh Betrieb von in Mobilfunknetzen nutzbaren mobilen Endgeräten, mobiles Endgerät und Mobilfunkteilnehmer-Identifikations-Modul zur Nutzung mit einem mobilen Endgerät
AU2008209307B2 (en) * 2007-01-22 2010-12-02 Auraya Pty Ltd Voice recognition system and methods
US20110047605A1 (en) * 2007-02-06 2011-02-24 Vidoop, Llc System And Method For Authenticating A User To A Computer System
US8140331B2 (en) * 2007-07-06 2012-03-20 Xia Lou Feature extraction for identification and classification of audio signals
JP2009020291A (ja) * 2007-07-11 2009-01-29 Yamaha Corp 音声処理装置および通信端末装置
US8660519B2 (en) * 2007-09-26 2014-02-25 Verizon Patent And Licensing Inc. Apparatus, method, and computer program product for locating a mobile device
AU2008316289B2 (en) * 2007-10-22 2012-03-22 Cpc Patent Technologies Pty Ltd A transmitter for transmitting a secure access signal
US8031981B2 (en) * 2007-12-21 2011-10-04 Daon Holdings Limited Method and systems for generating a subset of biometric representations
US9098838B2 (en) * 2008-01-30 2015-08-04 Kyocera Corporation Portable terminal device and method of determining communication permission thereof
WO2009124563A1 (en) * 2008-04-08 2009-10-15 Agnitio, S.L. Method of informing a person of an event and method of receiving information about an event, a related computing system and computer readable medium
GB2462800A (en) * 2008-06-20 2010-02-24 New Voice Media Ltd Monitoring a conversation between an agent and a customer and performing real time analytics on the audio signal for determining future handling of the call
JP2010033193A (ja) * 2008-07-25 2010-02-12 Fujitsu Ltd 認証システム及び認証用サーバ装置
JP5464313B2 (ja) * 2008-08-01 2014-04-09 株式会社ユニバーサルエンターテインメント 内部統制制御システム
US8266249B2 (en) 2008-08-22 2012-09-11 At&T Mobility Ii Llc Providing remote access to multimedia content
US20100069148A1 (en) * 2008-09-15 2010-03-18 Katherine Cargill Online Games Integrated with Offline Fitness, Environmental, and Other Activities
US8345829B2 (en) * 2008-10-13 2013-01-01 International Business Machines Corporation Authentication of a user to a telephonic communication device
US8332223B2 (en) * 2008-10-24 2012-12-11 Nuance Communications, Inc. Speaker verification methods and apparatus
TWI412941B (zh) * 2008-11-25 2013-10-21 Inst Information Industry 產生及驗證一訊息之一語音簽章之裝置、方法及其電腦程式產品
US8442824B2 (en) 2008-11-26 2013-05-14 Nuance Communications, Inc. Device, system, and method of liveness detection utilizing voice biometrics
DE102008058883B4 (de) * 2008-11-26 2023-07-27 Lumenvox Corporation Verfahren und Anordnung zur Steuerung eines Nutzerzugriffs
GB2465782B (en) 2008-11-28 2016-04-13 Univ Nottingham Trent Biometric identity verification
US10257191B2 (en) 2008-11-28 2019-04-09 Nottingham Trent University Biometric identity verification
US8989704B2 (en) * 2008-12-10 2015-03-24 Symbol Technologies, Inc. Invisible mode for mobile phones to facilitate privacy without breaching trust
CA2748695C (en) * 2008-12-31 2017-11-07 Bce Inc. System and method for unlocking a device
US20100192183A1 (en) * 2009-01-29 2010-07-29 At&T Intellectual Property I, L.P. Mobile Device Access to Multimedia Content Recorded at Customer Premises
US10853816B1 (en) * 2009-02-02 2020-12-01 United Services Automobile Association (Usaa) Systems and methods for authentication of an individual on a communications device
JP5178607B2 (ja) * 2009-03-31 2013-04-10 株式会社バンダイナムコゲームス プログラム、情報記憶媒体、口形状制御方法及び口形状制御装置
CN101923853B (zh) * 2009-06-12 2013-01-23 华为技术有限公司 说话人识别方法、设备和系统
CN101923856B (zh) * 2009-06-12 2012-06-06 华为技术有限公司 语音识别训练处理、控制方法及装置
US9277021B2 (en) 2009-08-21 2016-03-01 Avaya Inc. Sending a user associated telecommunication address
US20110086712A1 (en) * 2009-09-15 2011-04-14 Katherine Cargill Online games integrated with an online green mall
US8326625B2 (en) * 2009-11-10 2012-12-04 Research In Motion Limited System and method for low overhead time domain voice authentication
US8321209B2 (en) 2009-11-10 2012-11-27 Research In Motion Limited System and method for low overhead frequency domain voice authentication
EP2362600B1 (en) * 2009-11-22 2016-07-27 Avaya Inc. Sending a user associated telecommunication address
US8718246B2 (en) 2009-11-22 2014-05-06 Avaya Inc. Providing a roster and other information before joining a participant into an existing call
US9292731B2 (en) 2009-12-30 2016-03-22 Intel Corporation Gesture-based signature authentication
US9553727B2 (en) * 2010-01-21 2017-01-24 Omid Ebrahimi Kia Secure and mobile biometric authentication for electronic health record management
FR2956941A1 (fr) * 2010-02-19 2011-09-02 Ingenico Sa Procede d'authentification biometrique, systeme d'authentification, programme et terminal correspondants.
US8463705B2 (en) 2010-02-28 2013-06-11 International Business Machines Corporation Systems and methods for transactions on the telecom web
US9652802B1 (en) 2010-03-24 2017-05-16 Consumerinfo.Com, Inc. Indirect monitoring and reporting of a user's credit data
US9412381B2 (en) * 2010-03-30 2016-08-09 Ack3 Bionetics Private Ltd. Integrated voice biometrics cloud security gateway
US20110260832A1 (en) * 2010-04-27 2011-10-27 Joe Ross Secure voice biometric enrollment and voice alert delivery system
US8428227B2 (en) 2010-05-18 2013-04-23 Certicall, Llc Certified communications system and method
US8457601B2 (en) 2011-02-09 2013-06-04 Certicall, Llc Key responsive record, navigation and marking controls for communications system
EP2572498A4 (en) * 2010-05-18 2013-10-02 Certicall Llc SYSTEM AND METHOD FOR CERTIFIED COMMUNICATIONS
US8358745B2 (en) 2011-02-09 2013-01-22 Certicall, Llc Recording identity data to enable on demand services in a communications system
US20110320201A1 (en) * 2010-06-24 2011-12-29 Kaufman John D Sound verification system using templates
ES2377682B1 (es) * 2010-09-02 2013-02-13 Controlaboral-Sistemas Telematicos De Organizacion Y Control, S.L. Procedimiento para validar de forma remota una acción de usuario a partir de una comunicación por voz.
EP2622832B1 (en) * 2010-09-30 2019-03-13 British Telecommunications public limited company Speech comparison
US9118669B2 (en) * 2010-09-30 2015-08-25 Alcatel Lucent Method and apparatus for voice signature authentication
US10339519B2 (en) * 2010-11-29 2019-07-02 Ncr Corporation Visual access token
WO2012083347A1 (en) * 2010-12-20 2012-06-28 Auraya Pty Ltd Voice authentication system and methods
US20120200391A1 (en) * 2011-02-03 2012-08-09 Sony Corporation, A Japanese Corporation Method to identify user with security
CA2827478C (en) 2011-02-18 2020-07-28 Csidentity Corporation System and methods for identifying compromised personally identifiable information on the internet
US9767807B2 (en) 2011-03-30 2017-09-19 Ack3 Bionetics Pte Limited Digital voice signature of transactions
GB2489527B (en) * 2011-04-01 2014-01-01 Voicevault Ltd Voice verification system
TWI466527B (zh) * 2011-04-20 2014-12-21 Gamania Digital Entertainment Co Ltd 根據裝置識別碼產生通行碼的系統、方法及該系統中的伺服端裝置
US8719019B2 (en) * 2011-04-25 2014-05-06 Microsoft Corporation Speaker identification
JP5752324B2 (ja) * 2011-07-07 2015-07-22 ニュアンス コミュニケーションズ, インコーポレイテッド 雑音の入った音声信号中のインパルス性干渉の単一チャネル抑制
US8706499B2 (en) * 2011-08-16 2014-04-22 Facebook, Inc. Periodic ambient waveform analysis for enhanced social functions
WO2013034192A1 (en) * 2011-09-09 2013-03-14 Naxos Finance Sa Method for validating an electronic transaction, and system thereof
US8819793B2 (en) 2011-09-20 2014-08-26 Csidentity Corporation Systems and methods for secure and efficient enrollment into a federation which utilizes a biometric repository
US9164648B2 (en) 2011-09-21 2015-10-20 Sony Corporation Method and apparatus for establishing user-specific windows on a multi-user interactive table
US9021565B2 (en) 2011-10-13 2015-04-28 At&T Intellectual Property I, L.P. Authentication techniques utilizing a computing device
US11030562B1 (en) 2011-10-31 2021-06-08 Consumerinfo.Com, Inc. Pre-data breach monitoring
US9583108B2 (en) * 2011-12-08 2017-02-28 Forrest S. Baker III Trust Voice detection for automated communication system
US10008206B2 (en) * 2011-12-23 2018-06-26 National Ict Australia Limited Verifying a user
US9042867B2 (en) 2012-02-24 2015-05-26 Agnitio S.L. System and method for speaker recognition on mobile devices
US9471919B2 (en) 2012-04-10 2016-10-18 Hoyos Labs Ip Ltd. Systems and methods for biometric authentication of transactions
US8903360B2 (en) * 2012-05-17 2014-12-02 International Business Machines Corporation Mobile device validation
US10089625B2 (en) * 2012-06-13 2018-10-02 First Data Corporation Systems and methods for tokenizing financial information
WO2013190169A1 (en) * 2012-06-18 2013-12-27 Aplcomp Oy Arrangement and method for accessing a network service
US9996628B2 (en) * 2012-06-29 2018-06-12 Verisign, Inc. Providing audio-activated resource access for user devices based on speaker voiceprint
US8744995B1 (en) 2012-07-30 2014-06-03 Google Inc. Alias disambiguation
US8520807B1 (en) 2012-08-10 2013-08-27 Google Inc. Phonetically unique communication identifiers
US8571865B1 (en) * 2012-08-10 2013-10-29 Google Inc. Inference-aided speaker recognition
US8583750B1 (en) 2012-08-10 2013-11-12 Google Inc. Inferring identity of intended communication recipient
US9286899B1 (en) * 2012-09-21 2016-03-15 Amazon Technologies, Inc. User authentication for devices using voice input or audio signatures
US9837078B2 (en) 2012-11-09 2017-12-05 Mattersight Corporation Methods and apparatus for identifying fraudulent callers
US8832813B1 (en) * 2012-12-19 2014-09-09 Emc Corporation Voice authentication via trusted device
WO2014186019A1 (en) * 2013-02-19 2014-11-20 Max Sound Corporation Biometric audio security
US9025364B2 (en) * 2013-03-14 2015-05-05 Micron Technology, Inc. Selective self-reference read
US8812387B1 (en) 2013-03-14 2014-08-19 Csidentity Corporation System and method for identifying related credit inquiries
US9904579B2 (en) 2013-03-15 2018-02-27 Advanced Elemental Technologies, Inc. Methods and systems for purposeful computing
US10075384B2 (en) 2013-03-15 2018-09-11 Advanced Elemental Technologies, Inc. Purposeful computing
WO2014152542A2 (en) * 2013-03-15 2014-09-25 Forrest S. Baker Iii Trust, U/A/D 12/30/1992 Voice detection for automated communication system
US9721086B2 (en) 2013-03-15 2017-08-01 Advanced Elemental Technologies, Inc. Methods and systems for secure and reliable identity-based computing
US9378065B2 (en) 2013-03-15 2016-06-28 Advanced Elemental Technologies, Inc. Purposeful computing
US9299350B1 (en) * 2013-03-15 2016-03-29 Amazon Technologies, Inc. Systems and methods for identifying users of devices and customizing devices to users
US9313200B2 (en) 2013-05-13 2016-04-12 Hoyos Labs Ip, Ltd. System and method for determining liveness
US11210380B2 (en) 2013-05-13 2021-12-28 Veridium Ip Limited System and method for authorizing access to access-controlled environments
US9003196B2 (en) 2013-05-13 2015-04-07 Hoyos Labs Corp. System and method for authorizing access to access-controlled environments
US20140343943A1 (en) * 2013-05-14 2014-11-20 Saudi Arabian Oil Company Systems, Computer Medium and Computer-Implemented Methods for Authenticating Users Using Voice Streams
EP2997721B1 (en) * 2013-05-14 2020-03-18 Thomson Licensing Mobile device synchronization to a gateway
NO341316B1 (no) * 2013-05-31 2017-10-09 Pexip AS Fremgangsmåte og system for å assosiere en ekstern enhet til en videokonferansesesjon.
US9236052B2 (en) 2013-06-20 2016-01-12 Bank Of America Corporation Utilizing voice biometrics
US9978065B2 (en) 2013-06-25 2018-05-22 Visa International Service Association Voice filter system
US10235509B2 (en) 2013-08-22 2019-03-19 Staton Techiya, Llc Methods and systems for a voice ID verification database and service in social networking and commercial business transactions
US20150056952A1 (en) * 2013-08-22 2015-02-26 Vonage Network Llc Method and apparatus for determining intent of an end-user in a communication session
EP2849448A1 (fr) * 2013-09-13 2015-03-18 Nagravision S.A. Méthode pour contrôler l'accès à du contenu diffusé
US9437195B2 (en) * 2013-09-18 2016-09-06 Lenovo (Singapore) Pte. Ltd. Biometric password security
US9767266B2 (en) * 2013-12-20 2017-09-19 The Mitre Corporation Methods and systems for biometric-based user authentication by voice
KR102217916B1 (ko) 2013-12-31 2021-02-22 베리디움 아이피 리미티드 생체측정 프로토콜 표준들을 위한 시스템 및 방법
US9838388B2 (en) 2014-08-26 2017-12-05 Veridium Ip Limited System and method for biometric protocol standards
US9552684B2 (en) 2014-02-04 2017-01-24 Secure Gravity Inc. Methods and systems configured to detect and guarantee identity for the purpose of data protection and access control
NL2012300C2 (en) * 2014-02-21 2015-08-25 Novolanguage B V Automated audio optical system for identity authentication.
CN105321514A (zh) * 2014-05-28 2016-02-10 西安中兴新软件有限责任公司 一种告警方法和终端
WO2015196063A1 (en) * 2014-06-19 2015-12-23 Robert Bosch Gmbh System and method for speech-enabled personalized operation of devices and services in multiple operating environments
US9620106B2 (en) * 2014-07-30 2017-04-11 At&T Intellectual Property I, L.P. System and method for personalization in speech recogniton
US20160055847A1 (en) * 2014-08-19 2016-02-25 Nuance Communications, Inc. System and method for speech validation
CN105357006A (zh) * 2014-08-20 2016-02-24 中兴通讯股份有限公司 一种基于声纹特征进行安全认证的方法及设备
US9456070B2 (en) 2014-09-11 2016-09-27 Ebay Inc. Methods and systems for recalling second party interactions with mobile devices
EP3191998B1 (en) 2014-09-13 2020-12-23 Advanced Elemental Technologies, Inc. Methods and systems for secure and reliable identity-based computing
US10008208B2 (en) 2014-09-18 2018-06-26 Nuance Communications, Inc. Method and apparatus for performing speaker recognition
CN105575391B (zh) 2014-10-10 2020-04-03 阿里巴巴集团控股有限公司 声纹信息管理方法、装置以及身份认证方法、系统
US9659564B2 (en) * 2014-10-24 2017-05-23 Sestek Ses Ve Iletisim Bilgisayar Teknolojileri Sanayi Ticaret Anonim Sirketi Speaker verification based on acoustic behavioral characteristics of the speaker
US10339527B1 (en) 2014-10-31 2019-07-02 Experian Information Solutions, Inc. System and architecture for electronic fraud detection
CN104317668A (zh) * 2014-11-18 2015-01-28 深圳市汇顶科技股份有限公司 移动终端中恶意操作的识别方法和装置
US9817956B2 (en) * 2014-12-12 2017-11-14 Excalibur Ip, Llc User authentication and data encryption
CN104574048B (zh) * 2014-12-27 2018-04-06 小米科技有限责任公司 资源转移方法及装置
FR3037692B1 (fr) * 2015-06-16 2017-06-02 Morpho Procede d'identification biometrique
US20220329589A1 (en) * 2015-06-26 2022-10-13 Gbl Systems Corporation Methods and apparatus for providing biometric authentication and authorization services
CN104967622B (zh) * 2015-06-30 2017-04-05 百度在线网络技术(北京)有限公司 基于声纹的通讯方法、装置和系统
US11151468B1 (en) 2015-07-02 2021-10-19 Experian Information Solutions, Inc. Behavior analysis using distributed representations of event data
US11329980B2 (en) 2015-08-21 2022-05-10 Veridium Ip Limited System and method for biometric protocol standards
US10269372B1 (en) * 2015-09-24 2019-04-23 United Services Automobile Association (Usaa) System for sound analysis and recognition
CN105224849B (zh) * 2015-10-20 2019-01-01 广州广电运通金融电子股份有限公司 一种多生物特征融合身份鉴别方法以及装置
US10062388B2 (en) * 2015-10-22 2018-08-28 Motorola Mobility Llc Acoustic and surface vibration authentication
CN106710593B (zh) * 2015-11-17 2020-07-14 腾讯科技(深圳)有限公司 一种添加账号的方法、终端、服务器
US10372889B2 (en) 2016-02-19 2019-08-06 At&T Mobility Ii Llc Event characteristic analysis for event input discrimination
TWI574255B (zh) * 2016-02-22 2017-03-11 華碩電腦股份有限公司 語音辨識方法、電子裝置及語音辨識系統
US10044710B2 (en) 2016-02-22 2018-08-07 Bpip Limited Liability Company Device and method for validating a user using an intelligent voice print
US9959885B2 (en) * 2016-03-08 2018-05-01 Samsung Eletrônica Da Amazônia Ltda Method for user context recognition using sound signatures
WO2017199486A1 (ja) * 2016-05-16 2017-11-23 ソニー株式会社 情報処理装置
US10127926B2 (en) * 2016-06-10 2018-11-13 Google Llc Securely executing voice actions with speaker identification and authentication input types
GB2552722A (en) * 2016-08-03 2018-02-07 Cirrus Logic Int Semiconductor Ltd Speaker recognition
US10559312B2 (en) * 2016-08-25 2020-02-11 International Business Machines Corporation User authentication using audiovisual synchrony detection
US10614813B2 (en) 2016-11-04 2020-04-07 Intellisist, Inc. System and method for performing caller identity verification using multi-step voice analysis
US10049673B2 (en) * 2016-12-19 2018-08-14 Bank Of America Corporation Synthesized voice authentication engine
US10446157B2 (en) 2016-12-19 2019-10-15 Bank Of America Corporation Synthesized voice authentication engine
US11115403B2 (en) * 2017-02-21 2021-09-07 Baldev Krishan Multi-level user device authentication system for internet of things (IOT)
CN107068154A (zh) * 2017-03-13 2017-08-18 平安科技(深圳)有限公司 基于声纹识别的身份验证的方法及系统
CN109146450A (zh) 2017-06-16 2019-01-04 阿里巴巴集团控股有限公司 支付方法、客户端、电子设备、存储介质和服务器
CN109147770B (zh) * 2017-06-16 2023-07-28 阿里巴巴集团控股有限公司 声音识别特征的优化、动态注册方法、客户端和服务器
WO2019002831A1 (en) * 2017-06-27 2019-01-03 Cirrus Logic International Semiconductor Limited REPRODUCTIVE ATTACK DETECTION
GB201713697D0 (en) 2017-06-28 2017-10-11 Cirrus Logic Int Semiconductor Ltd Magnetic detection of replay attack
GB2563953A (en) 2017-06-28 2019-01-02 Cirrus Logic Int Semiconductor Ltd Detection of replay attack
CN109218269A (zh) * 2017-07-05 2019-01-15 阿里巴巴集团控股有限公司 身份认证的方法、装置、设备及数据处理方法
GB201801532D0 (en) 2017-07-07 2018-03-14 Cirrus Logic Int Semiconductor Ltd Methods, apparatus and systems for audio playback
GB201801528D0 (en) 2017-07-07 2018-03-14 Cirrus Logic Int Semiconductor Ltd Method, apparatus and systems for biometric processes
GB201801526D0 (en) 2017-07-07 2018-03-14 Cirrus Logic Int Semiconductor Ltd Methods, apparatus and systems for authentication
GB201801530D0 (en) 2017-07-07 2018-03-14 Cirrus Logic Int Semiconductor Ltd Methods, apparatus and systems for authentication
GB201801527D0 (en) 2017-07-07 2018-03-14 Cirrus Logic Int Semiconductor Ltd Method, apparatus and systems for biometric processes
US11475113B2 (en) 2017-07-11 2022-10-18 Hewlett-Packard Development Company, L.P. Voice modulation based voice authentication
US20190043509A1 (en) * 2017-08-04 2019-02-07 Cirrus Logic International Semiconductor Ltd. Audio privacy based on user identification
CN111033501B (zh) * 2017-08-23 2023-09-08 维萨国际服务协会 虚拟现实中对访问私有数据的安全授权
US10699028B1 (en) 2017-09-28 2020-06-30 Csidentity Corporation Identity security architecture systems and methods
CN109583285B (zh) 2017-09-29 2023-03-07 阿里巴巴集团控股有限公司 对象识别方法
CN109583287B (zh) 2017-09-29 2024-04-12 浙江莲荷科技有限公司 实物识别方法及验证方法
GB2567503A (en) 2017-10-13 2019-04-17 Cirrus Logic Int Semiconductor Ltd Analysing speech signals
GB201803570D0 (en) 2017-10-13 2018-04-18 Cirrus Logic Int Semiconductor Ltd Detection of replay attack
GB201801661D0 (en) 2017-10-13 2018-03-21 Cirrus Logic International Uk Ltd Detection of liveness
GB201804843D0 (en) 2017-11-14 2018-05-09 Cirrus Logic Int Semiconductor Ltd Detection of replay attack
GB201801874D0 (en) 2017-10-13 2018-03-21 Cirrus Logic Int Semiconductor Ltd Improving robustness of speech processing system against ultrasound and dolphin attacks
GB201801664D0 (en) 2017-10-13 2018-03-21 Cirrus Logic Int Semiconductor Ltd Detection of liveness
GB201801663D0 (en) 2017-10-13 2018-03-21 Cirrus Logic Int Semiconductor Ltd Detection of liveness
US10805301B2 (en) * 2017-10-30 2020-10-13 Vmware, Inc. Securely managing digital assistants that access third-party applications
US10749855B2 (en) 2017-10-30 2020-08-18 Vmware, Inc. Securely managing digital assistants that access third-party applications
GB201801659D0 (en) 2017-11-14 2018-03-21 Cirrus Logic Int Semiconductor Ltd Detection of loudspeaker playback
US10896472B1 (en) 2017-11-14 2021-01-19 Csidentity Corporation Security and identity verification system and architecture
CN108268619B (zh) 2018-01-08 2020-06-30 阿里巴巴集团控股有限公司 内容推荐方法及装置
US11475899B2 (en) 2018-01-23 2022-10-18 Cirrus Logic, Inc. Speaker identification
US11264037B2 (en) 2018-01-23 2022-03-01 Cirrus Logic, Inc. Speaker identification
US11735189B2 (en) 2018-01-23 2023-08-22 Cirrus Logic, Inc. Speaker identification
EP3818519A4 (en) * 2018-07-03 2022-03-30 3M Innovative Properties Company CORRELATION OF AUDIO SIGNALS FOR AUTHENTICATION
US10692490B2 (en) 2018-07-31 2020-06-23 Cirrus Logic, Inc. Detection of replay attack
CN110569856B (zh) 2018-08-24 2020-07-21 阿里巴巴集团控股有限公司 样本标注方法及装置、损伤类别的识别方法及装置
US20200077190A1 (en) * 2018-08-29 2020-03-05 Soniphi Llc Earbuds With Vocal Frequency-Based Equalization
CN110569695B (zh) 2018-08-31 2021-07-09 创新先进技术有限公司 基于定损图像判定模型的图像处理方法和装置
CN110570316A (zh) 2018-08-31 2019-12-13 阿里巴巴集团控股有限公司 训练损伤识别模型的方法及装置
CN110569697A (zh) 2018-08-31 2019-12-13 阿里巴巴集团控股有限公司 车辆的部件检测方法、装置及设备
US10915614B2 (en) 2018-08-31 2021-02-09 Cirrus Logic, Inc. Biometric authentication
CN110569696A (zh) 2018-08-31 2019-12-13 阿里巴巴集团控股有限公司 用于车辆部件识别的神经网络系统、方法和装置
CN110569837B (zh) 2018-08-31 2021-06-04 创新先进技术有限公司 优化损伤检测结果的方法及装置
US11037574B2 (en) 2018-09-05 2021-06-15 Cirrus Logic, Inc. Speaker recognition and speaker change detection
CN110569699B (zh) 2018-09-07 2020-12-29 创新先进技术有限公司 对图片进行目标采样的方法及装置
US11474801B1 (en) * 2018-09-26 2022-10-18 Amazon Technologies, Inc. Automatic application installation based on proximity detection
US20200220869A1 (en) * 2019-01-08 2020-07-09 Fidelity Information Services, Llc Systems and methods for contactless authentication using voice recognition
KR102306640B1 (ko) * 2019-07-17 2021-09-28 주식회사 케이티 고객센터 목소리 인증 시스템 및 목소리 인증 방법
US11374976B2 (en) * 2019-10-15 2022-06-28 Bank Of America Corporation System for authentication of resource actions based on multi-channel input
JP7332518B2 (ja) * 2020-03-30 2023-08-23 本田技研工業株式会社 会話支援装置、会話支援システム、会話支援方法およびプログラム
CN111680173B (zh) * 2020-05-31 2024-02-23 西南电子技术研究所(中国电子科技集团公司第十研究所) 统一检索跨媒体信息的cmr模型
US11664033B2 (en) * 2020-06-15 2023-05-30 Samsung Electronics Co., Ltd. Electronic apparatus and controlling method thereof
US11436309B2 (en) 2020-07-09 2022-09-06 Bank Of America Corporation Dynamic knowledge-based voice authentication
US11720704B1 (en) 2020-09-01 2023-08-08 Cigna Intellectual Property, Inc. System and method for authenticating access to private health information
US11626104B2 (en) * 2020-12-08 2023-04-11 Qualcomm Incorporated User speech profile management
CN112818316B (zh) * 2021-03-08 2023-06-20 南京大正智能科技有限公司 基于声纹的身份识别及应用方法、装置与设备
US20230122420A1 (en) * 2021-10-15 2023-04-20 Gulfstream Aerospace Corporation Directional array intercom for internal communication on aircraft

Family Cites Families (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH031200A (ja) * 1989-05-29 1991-01-07 Nec Corp 規則型音声合成装置
US6594628B1 (en) * 1995-09-21 2003-07-15 Qualcomm, Incorporated Distributed voice recognition system
US6397198B1 (en) * 1994-11-28 2002-05-28 Indivos Corporation Tokenless biometric electronic transactions using an audio signature to identify the transaction processor
US6950810B2 (en) 1994-11-28 2005-09-27 Indivos Corporation Tokenless biometric electronic financial transactions via a third party identicator
US5794205A (en) * 1995-10-19 1998-08-11 Voice It Worldwide, Inc. Voice recognition interface apparatus and method for interacting with a programmable timekeeping device
US6038528A (en) * 1996-07-17 2000-03-14 T-Netix, Inc. Robust speech processing with affine transform replicated data
US6266640B1 (en) 1996-08-06 2001-07-24 Dialogic Corporation Data network with voice verification means
US6016476A (en) 1997-08-11 2000-01-18 International Business Machines Corporation Portable information and transaction processing system and method utilizing biometric authorization and digital certificate security
US6213391B1 (en) 1997-09-10 2001-04-10 William H. Lewis Portable system for personal identification based upon distinctive characteristics of the user
US6084967A (en) 1997-10-29 2000-07-04 Motorola, Inc. Radio telecommunication device and method of authenticating a user with a voice authentication token
US6016479A (en) * 1998-02-10 2000-01-18 Interstate Solutions, Llc Computer-based system, computer program product and method for recovering tax revenue
IL129451A (en) 1999-04-15 2004-05-12 Eli Talmor System and method for authentication of a speaker
ATE323919T1 (de) 2000-07-14 2006-05-15 Voice Trust Ag Verfahren und system zur autorisierung einer kommerziellen transaktion
US7013273B2 (en) * 2001-03-29 2006-03-14 Matsushita Electric Industrial Co., Ltd. Speech recognition based captioning system
US6601762B2 (en) 2001-06-15 2003-08-05 Koninklijke Philips Electronics N.V. Point-of-sale (POS) voice authentication transaction system
US7158776B1 (en) * 2001-09-18 2007-01-02 Cisco Technology, Inc. Techniques for voice-based user authentication for mobile access to network services
US7469206B2 (en) * 2001-11-29 2008-12-23 Coding Technologies Ab Methods for improving high frequency reconstruction
CN1172260C (zh) * 2001-12-29 2004-10-20 浙江大学 基于指纹和声纹的交叉认证方法
EP2375690B1 (en) * 2002-03-01 2019-08-07 Extreme Networks, Inc. Locating devices in a data network
CN1547191A (zh) * 2003-12-12 2004-11-17 北京大学 结合语义和声纹信息的说话人身份确认系统
US7490043B2 (en) * 2005-02-07 2009-02-10 Hitachi, Ltd. System and method for speaker verification using short utterance enrollments
US7536304B2 (en) 2005-05-27 2009-05-19 Porticus, Inc. Method and system for bio-metric voice print authentication

Cited By (35)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2011041977A1 (zh) * 2009-10-10 2011-04-14 Xiong Dianyuan 一种基于声纹识别和定位跟踪的交叉监控方法和系统
CN105873050A (zh) * 2010-10-14 2016-08-17 阿里巴巴集团控股有限公司 无线业务身份认证方法、服务器及系统
CN104094132A (zh) * 2012-01-30 2014-10-08 国际商业机器公司 经由声波纹位置感知的基于区域的存在确定
CN104094132B (zh) * 2012-01-30 2017-04-19 国际商业机器公司 经由声波纹位置感知的基于区域的存在确定
CN103390123A (zh) * 2012-05-08 2013-11-13 腾讯科技(深圳)有限公司 用户认证方法、用户认证装置及智能终端
US10171458B2 (en) 2012-08-31 2019-01-01 Apple Inc. Wireless pairing and communication between devices using biometric data
CN104541493B (zh) * 2012-08-31 2016-08-24 苹果公司 使用生物计量数据在设备之间进行无线配对和通信
CN104541493A (zh) * 2012-08-31 2015-04-22 苹果公司 使用生物计量数据在设备之间进行无线配对和通信
CN110930159A (zh) * 2013-03-11 2020-03-27 Cfph 有限责任公司 用于博弈的设备
CN103237030A (zh) * 2013-04-25 2013-08-07 深圳市中兴移动通信有限公司 基于生物识别的用户认证方法及系统
CN104217149A (zh) * 2013-05-31 2014-12-17 国际商业机器公司 基于语音的生物认证方法及设备
CN104217149B (zh) * 2013-05-31 2017-05-24 国际商业机器公司 基于语音的生物认证方法及设备
CN105940407A (zh) * 2014-02-04 2016-09-14 高通股份有限公司 用于评估音频口令的强度的系统和方法
CN105940407B (zh) * 2014-02-04 2019-02-15 高通股份有限公司 用于评估音频口令的强度的系统和方法
US10157272B2 (en) 2014-02-04 2018-12-18 Qualcomm Incorporated Systems and methods for evaluating strength of an audio password
CN110263523A (zh) * 2014-02-19 2019-09-20 三星电子株式会社 用于在电子装置中处理生物计量信息的方法和设备
CN104184587B (zh) * 2014-08-08 2016-04-20 腾讯科技(深圳)有限公司 声纹生成方法、服务器、客户端及系统
CN104184587A (zh) * 2014-08-08 2014-12-03 腾讯科技(深圳)有限公司 声纹生成方法、服务器、客户端及系统
US11012438B2 (en) 2014-09-30 2021-05-18 Apple Inc. Biometric device pairing
CN105096121A (zh) * 2015-06-25 2015-11-25 百度在线网络技术(北京)有限公司 声纹认证方法和装置
US9792913B2 (en) 2015-06-25 2017-10-17 Baidu Online Network Technology (Beijing) Co., Ltd. Voiceprint authentication method and apparatus
CN108604449B (zh) * 2015-09-30 2023-11-14 苹果公司 说话者识别
CN108604449A (zh) * 2015-09-30 2018-09-28 苹果公司 说话者识别
CN106448685B (zh) * 2016-10-09 2019-11-22 北京远鉴科技有限公司 一种基于音素信息的声纹认证系统及方法
CN106448685A (zh) * 2016-10-09 2017-02-22 北京远鉴科技有限公司 一种基于音素信息的声纹认证系统及方法
CN109997185A (zh) * 2016-11-07 2019-07-09 思睿逻辑国际半导体有限公司 用于电子设备中的生物测定认证的方法和装置
CN108154588B (zh) * 2017-12-29 2020-11-27 深圳市艾特智能科技有限公司 解锁方法、系统、可读存储介质及智能设备
CN108154588A (zh) * 2017-12-29 2018-06-12 深圳市艾特智能科技有限公司 解锁方法、系统、可读存储介质及智能设备
CN108648760B (zh) * 2018-04-17 2020-04-28 四川长虹电器股份有限公司 实时声纹辨识系统与方法
CN108648760A (zh) * 2018-04-17 2018-10-12 四川长虹电器股份有限公司 实时声纹辨识系统与方法
CN108711428B (zh) * 2018-05-30 2021-05-25 Oppo广东移动通信有限公司 指令执行方法、装置、存储介质及电子设备
CN111385624A (zh) * 2018-12-29 2020-07-07 深圳Tcl新技术有限公司 一种基于语音的数据传输控制方法、智能电视及存储介质
CN111385624B (zh) * 2018-12-29 2021-10-01 深圳Tcl新技术有限公司 一种基于语音的数据传输控制方法、智能电视及存储介质
CN109979466A (zh) * 2019-03-21 2019-07-05 广州国音智能科技有限公司 一种声纹身份同一性鉴定方法、装置及计算机可读存储介质
CN113190508A (zh) * 2021-04-26 2021-07-30 重庆市规划和自然资源信息中心 一种面向管理的自然语言识别方法

Also Published As

Publication number Publication date
EP1915294A4 (en) 2009-10-21
US20130018657A1 (en) 2013-01-17
US20090206993A1 (en) 2009-08-20
US8571867B2 (en) 2013-10-29
EP1915294A2 (en) 2008-04-30
WO2006128171A3 (en) 2009-01-08
US7536304B2 (en) 2009-05-19
CN101467204B (zh) 2013-08-14
US8280740B2 (en) 2012-10-02
WO2006128171A2 (en) 2006-11-30
JP2009508144A (ja) 2009-02-26
US20070185718A1 (en) 2007-08-09

Similar Documents

Publication Publication Date Title
CN101467204B (zh) 用于生物计量声纹认证的方法和系统
US10832686B2 (en) Method and apparatus for pushing information
US8812319B2 (en) Dynamic pass phrase security system (DPSS)
US6804647B1 (en) Method and system for on-line unsupervised adaptation in speaker verification
US7533023B2 (en) Intermediary speech processor in network environments transforming customized speech parameters
AU2013203139B2 (en) Voice authentication and speech recognition system and method
US5897616A (en) Apparatus and methods for speaker verification/identification/classification employing non-acoustic and/or acoustic models and databases
US20030149881A1 (en) Apparatus and method for securing information transmitted on computer networks
US20090259470A1 (en) Bio-Phonetic Multi-Phrase Speaker Identity Verification
US20110320201A1 (en) Sound verification system using templates
AU2013203139A1 (en) Voice authentication and speech recognition system and method
CN111858892B (zh) 基于知识图谱的语音交互方法、装置、设备及介质
CN104104664A (zh) 对验证码进行验证的方法、服务器、客户端和系统
Saquib et al. A survey on automatic speaker recognition systems
US20060085189A1 (en) Method and apparatus for server centric speaker authentication
CN109729067A (zh) 语音打卡方法、装置、设备和计算机存储介质
US10957318B2 (en) Dynamic voice authentication
Kounoudes et al. Voice biometric authentication for enhancing Internet service security
CN106850539A (zh) 一种验证信息获取方法和装置
CN112102808A (zh) 用于伪造语音的深度神经网络的构建方法及系统
JP5436951B2 (ja) 本人認証装置および本人認証方法
US20230153815A1 (en) Methods and systems for training a machine learning model and authenticating a user with the model
Muraskin The Portal Pushers: Speech Vendors Poised To Grow The Voice Web
JPH09218697A (ja) 話者検証システム
Kounoudes et al. Intelligent Speaker Verification based Biometric System for Electronic Commerce Applications

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant