CN105264538B - 用于识别系统的认证 - Google Patents

用于识别系统的认证 Download PDF

Info

Publication number
CN105264538B
CN105264538B CN201480031518.XA CN201480031518A CN105264538B CN 105264538 B CN105264538 B CN 105264538B CN 201480031518 A CN201480031518 A CN 201480031518A CN 105264538 B CN105264538 B CN 105264538B
Authority
CN
China
Prior art keywords
voice commands
target device
decodings
speech recognition
authenticating
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201480031518.XA
Other languages
English (en)
Other versions
CN105264538A (zh
Inventor
奥加斯·巴帕特
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Spansion LLC
Original Assignee
Spansion LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Spansion LLC filed Critical Spansion LLC
Publication of CN105264538A publication Critical patent/CN105264538A/zh
Application granted granted Critical
Publication of CN105264538B publication Critical patent/CN105264538B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/30Authentication, i.e. establishing the identity or authorisation of security principals
    • G06F21/44Program or device authentication
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60RVEHICLES, VEHICLE FITTINGS, OR VEHICLE PARTS, NOT OTHERWISE PROVIDED FOR
    • B60R16/00Electric or fluid circuits specially adapted for vehicles and not otherwise provided for; Arrangement of elements of electric or fluid circuits specially adapted for vehicles and not otherwise provided for
    • B60R16/02Electric or fluid circuits specially adapted for vehicles and not otherwise provided for; Arrangement of elements of electric or fluid circuits specially adapted for vehicles and not otherwise provided for electric constitutive elements
    • B60R16/037Electric or fluid circuits specially adapted for vehicles and not otherwise provided for; Arrangement of elements of electric or fluid circuits specially adapted for vehicles and not otherwise provided for electric constitutive elements for occupant comfort, e.g. for automatic adjustment of appliances according to personal settings, e.g. seats, mirrors, steering wheel
    • B60R16/0373Voice control
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60RVEHICLES, VEHICLE FITTINGS, OR VEHICLE PARTS, NOT OTHERWISE PROVIDED FOR
    • B60R25/00Fittings or systems for preventing or indicating unauthorised use or theft of vehicles
    • B60R25/20Means to switch the anti-theft system on or off
    • B60R25/25Means to switch the anti-theft system on or off using biometry
    • B60R25/257Voice recognition
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B19/00Programme-control systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/20Speech recognition techniques specially adapted for robustness in adverse environments, e.g. in noise, of stress induced speech
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04KSECRET COMMUNICATION; JAMMING OF COMMUNICATION
    • H04K1/00Secret communication
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification
    • G10L17/22Interactive procedures; Man-machine interfaces

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Security & Cryptography (AREA)
  • General Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Multimedia (AREA)
  • Acoustics & Sound (AREA)
  • Mechanical Engineering (AREA)
  • Computational Linguistics (AREA)
  • General Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Computer Hardware Design (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Automation & Control Theory (AREA)
  • Lock And Its Accessories (AREA)
  • General Health & Medical Sciences (AREA)

Abstract

实施方案包括用于语音识别的认证的方法、装置和计算机程序产品。该方法可包括用目标设备感测认证设备。在通过目标设备确认认证设备之后,处理一个或多个解码的话音命令。此外,通过目标设备可执行一个或多个解码的话音命令。

Description

用于识别系统的认证
技术领域
本文包含的实施方案通常涉及用于识别系统的认证。更具体地说,实施方案涉及数据模式识别系统,其基于与目标设备配对的认证设备验证目标设备的用户。
背景
实时数据模式识别越来越多地用于分析在电子系统中的数据流。在超过成千上万个字的词汇中,语音识别系统已经实现改进的精度,使其成为对电子系统有吸引力的特征。例如,语音识别系统在针对数据模式识别应用的消费者市场,例如移动设备、服务器、PC和汽车市场中日益普遍。
在语音识别系统中的一个挑战是预期目标设备的用户的认证。例如,基于该用户的语音特征,生物识别技术可以用来验证该用户的预期的目标设备。但是,经过一段时间的和在不同环境(例如,噪声与安静的环境中)中的用户语音的波动可能导致在基于生物特征识别的认证系统中的错误。
概述
因此,需要对预期的目标设备的用户的认证,其用生物识别技术和其他认证技术处理上述问题。
实施方案包括用于语音识别的认证的方法。该方法包括用目标设备感测认证设备。在通过目标设备确认认证设备之后,处理一个或多个解码的话音命令。此外,通过目标设备可执行一个或多个解码的话音命令。
在一些实施方案中,所述感测包括在通过所述目标设备确认所述认证设备之后,激活一个或多个语音识别引擎。
在一些实施方案中,所述处理包括基于所述认证设备相对于所述目标设备的位置,选择来自所述认证设备的第一话音命令或来自所述目标设备的第二话音命令。
在一些实施方案中,所述处理包括在所述目标设备处接收所述一个或多个解码的话音命令。
在一些实施方案中,所述处理包括从所述一个或多个解码的话音命令中移除一个或多个环境条件。其中,所述移除包括从所述一个或多个解码的话音命令中消除噪声、消除回声、移除混响或其组合。
在一些实施方案中,所述处理包括基于并入一个或多个过去的解码的话语的学习算法,处理所述一个或多个解码的话音命令。其中,基于所述学习算法处理所述一个或多个解码的话音命令包括:当多个结果与所述一个或多个解码的话音命令相关联时,请求用户澄清。
另一个实施方案包括用于语音识别的认证设备。该认证设备包括语音识别引擎、认证模块和命令模块。该认证模块配置为感测认证设备。命令模块配置为在确认认证设备之后,处理一个或多个解码的话音命令。
在一些实施方案中,所述认证设备包括智能卡、射频识别设备、移动设备,或智能钥匙设备中的至少一个。
在一些实施方案中,所述认证设备包括发射机,其配置为发送一个或多个话音命令到所述命令模块。
在一些实施方案中,所述认证模块被配置为接收认证信号以及所述语音识别引擎被配置为接收一个或多个话音命令。
在一些实施方案中,所述认证模块被配置为基于认证信号验证所述认证设备并被配置为输出激活信号到所述语音识别引擎。
在一些实施方案中,所述认证设备包括配置为发送第一话音命令到所述语音识别引擎的发射机,并且其中所述语音识别引擎配置为接收第二话音命令,所述语音识别引擎配置为处理所述第一话音命令或所述第二话音命令。其中,所述语音识别引擎配置为基于所述认证设备的位置处理所述第一话音命令或所述第二话音命令。
在一些实施方案中,所述命令模块被配置为基于并入过去的解码的话语的学习算法处理所述一个或多个解码的话音命令。
在一些实施方案中,当多个结果与所述一个或多个解码的话音命令相关联时,所述命令模块配置为请求用户澄清。
进一步的另一实施方案包括用于为语音识别的认证的计算机程序产品。该计算机程序产品包括一种有形的计算机可读介质,其具有存储其中的用于由一个或多个处理器执行一个或多个指令的一个或多个序列以执行用于语音识别的认证的方法。该方法包括以下步骤:用目标设备感测认证设备;在通过所述目标设备确认所述认证设备之后,处理一个或多个解码的话音命令;和在所述目标设备处执行所述一个或多个解码的话音命令。
在一些实施方案中,所述处理包括基于所述认证设备相对于所述目标设备的位置,选择来自所述认证设备的第一话音命令或来自所述目标设备的第二话音命令。
在一些实施方案中,所述处理包括基于并入一个或多个过去的解码的话语的学习算法处理所述一个或多个解码的话音命令。
本文公开的实施方案的另外的特征和优点,以及实施方案的结构和操作参照附图在下面进行详细说明。应该注意的是,本发明并不限于本文所描述的具体实施方案。这些实施方案在本文中呈现仅用于说明性目的。其他的实施方案基于本文所包含的教导对相关领域技术人员将是明显的。
附图说明
附图并入本文并形成说明书的一部分,阐明实施方案,并且与该描述一起,进一步用于解释本发明的原理和使得相关领域的技术人员可以制造和使用本发明。
图1是可实现实施方案或其部分的示例性认证环境的图示。
图2是用于语音识别的认证设备的实施方案的图示。
图3是可实现实施方案或其部分的示例性汽车环境的图示。
图4是可实现实施方案或其部分的另一示例性汽车环境的图示。
图5是用于语音识别的认证的方法的实施方案的图示。
图6是示例性计算机系统的图示,其中,实施方案或其部分可作为计算机可读代码实现。
现将参照附图描述实施方案。在附图中,通常,相似的参考数字表示相同的或功能相似的元件。此外,通常,参考数字最左边的数位标记该参考数字首次出现在其中的附图。
具体实施方式
下面的详细描述参照说明与本发明一致的示例性实施方案的附图。其他实施方案是可能的,并且可以在本发明的精神和范围内对实施方案进行修改。因此,详细描述并不意味着限制本发明的范围。相反,本发明的范围由所附的权利要求限定。
如下所述的实施方案可以在许多不同形式的软件、硬件、固件和/或在附图中所示的实体中实现,这对本领域技术人员将是明显的。因此,给定本文中所呈现的细节的水平,本文所公开的实施方案的可操作的行为将用对实施方案的修改和变化是可能的理解来描述。
本说明书公开了并入本发明的特征的一个或多个实施方案。所公开的实施方案仅仅举例说明本发明。本发明的范围不限于所公开的实施方案。本发明由所附的权利要求限定。
所述的实施方案和在本说明书中对“一个实施方案”、“实施方案”、“示例性实施方案”等的参考指示所描述的实施方案可包括特定特征、结构或特性,但是每个实施方案可以不必包括该特定特征、结构或特性。此外,这种短语不一定指的是同一实施方案。此外,当特定特征、结构或特性与实施方案结合进行描述时,可以理解的是,无论是否明确描述,与其他实施方案结合实现这些特征、结构或特性落入相关领域技术人员的知识范围内。
1.示例性的认证环境
图1是可实现实施方案或其部分的示例性认证环境100的图示。认证环境100包括认证设备110和目标设备120。认证设备110可以与目标设备120经由无线通信链路130进行通信。除了别的之外,认证环境100的目的是确保来自认证设备110的命令和/或控制信号是针对目标设备120或对目标设备120的验证。
认证设备110可以是,例如但不限于,智能卡、射频识别(RFID)设备、移动设备、智能钥匙设备、其他类似类型的电子设备,或其组合。智能卡是具有设计为,除其他事项外,识别和认证应用的嵌入式集成电路的袖珍卡。智能卡可以与接触和非接触读取器操作。RFID设备使用无线电频率电磁场以通过无线通信平台(例如,图1的无线通信链路130)传输数据到读取器中。例如,移动设备,诸如移动电话或个人数字助理(PDA)可用于通过短距离无线技术平台来传输数据。这些短距离无线技术平台包括,除其他外,红外、蓝牙和Wi-Fi,其可以使用无线通信链路130来实现。此外,智能钥匙设备是通常在汽车中使用的电子准入和验证系统。例如,当开锁、锁定和/或启动汽车时,智能钥匙允许司机将遥控钥匙(其装有智能钥匙)保留在他/她的口袋里。智能钥匙可以包括产生由装在汽车中的一个或多个天线接收的信号的无线电脉冲发生器。例如,由一个或多个天线接收的信号可通过无线通信链路,诸如图1中的无线通信链路130传递。
目标设备120是用于认证设备110的预期的目标设备,并且可以是,例如但不限于,可以通过认证设备110控制的汽车、家庭、办公室、其他类似类型的环境,或其组合。这些环境可包括读取器和/或接收或感测由认证设备110发送的信号的天线。接收和感测由认证设备110(例如,智能卡、RFID和智能钥匙)发送的信号的方法对相关领域的技术人员是已知的。
图2-4的以下描述是基于汽车环境的,其中该汽车是目标设备(例如,图1的目标设备120)以及与汽车相关联的遥控钥匙是认证设备(例如,图1的认证设备110)。基于本文的描述,相关领域的技术人员将认识到的是,本文公开的实施方案可以应用到其它类型的环境中,例如但不限于,诸如其它类型的车辆、家庭和办公室。这些其他类型的环境落入本文所公开的实施方案的精神和范围。
2.用于语音识别的认证的实施方案
图2是用于语音识别的认证装置200的实施方案的图示。认证装置200包括语音识别引擎210、认证模块220和命令模块230。语音识别引擎210接收话音命令205,并且输出解码的话音命令217到命令模块230中。认证模块220接收验证信号215并输出激活信号212和认证信号225。在实施方案中,当认证设备(例如,图1的认证设备110)用目标设备(例如,目标设备120)验证或与目标设备配对时,激活信号212激活语音识别引擎210。认证信号225是命令模块230的输入,并表示认证设备是否已用目标设备正确地验证或与目标设备正确地配对。基于解码的话音命令217和认证信号225,命令模块230输出命令信号235到目标设备。
认证装置200可以在图1的认证环境100中实现。在实施方案中,认证装置200可以在图1的认证设备110中实现,其中认证装置200通过图1的无线通信链路130发送命令信号235到目标设备120。在另一实施方案中,认证装置200可以在目标设备120中实现,其中认证装置200通过无线通信链路130接收验证信号215并接收话音命令205。在又一个实施例中,认证装置200可以在认证设备110和目标设备120中实现。例如,语音识别引擎210可以在认证设备110中实现,其中语音识别引擎210通过无线通信链路130发送解码的话音命令217到目标设备120中。另外,认证模块220和命令模块230可以在目标设备120中实现。在这个实施例中,激活信号212可以是可选的。
如上所述,图2-4的描述基于汽车环境,其中该汽车是目标设备(例如,图1的目标设备120)且与汽车相关联的遥控钥匙(装有智能钥匙)是认证设备(例如,图1的认证设备110)。图3是可实现实施方案或其部分的示例性汽车环境300的图示。图2的语音识别引擎210、认证模块220和命令模块230在汽车310中实现,并且语音识别引擎325在遥控钥匙320中实现。遥控钥匙320可以与汽车310经由收发器329通过无线通信链路130通信。
汽车310包括配置为从遥控钥匙320(经由收发信器329)接收解码的话音命令327并接收验证信号215的一个或多个天线。此外,每个汽车310和遥控钥匙320包括一个或多个麦克风(图3中未显示)以通过语音识别引擎210和语音识别引擎325接收用于进一步处理的话音命令205。
图4是可实现实施方案或其部分的另一示例性汽车环境400的图示。类似于汽车环境300,图2的语音识别引擎210、认证模块220和命令模块230在汽车310中实现,并且收发器329在遥控钥匙320中实现。遥控钥匙320可以与汽车310经由收发器329通过无线通信链路130通信。
汽车310包括配置为从遥控钥匙320(经由收发器329)接收话音命令205并接收验证信号215的一个或多个天线。此外,每个汽车310和遥控钥匙320包括一个或多个麦克风(图4中未显示)以通过语音识别引擎210接收用于进一步处理的话音命令205。基于本文的描述,相关领域的技术人员将认识到的是,汽车310和遥控钥匙320可包括语音识别引擎、认证模块、命令模块和麦克风的不同配置。
图5是用于语音识别的认证的方法500的实施方案的图示。方法500可使用例如图3的汽车环境300和图4的汽车环境400来执行。
在步骤510中,认证设备由目标设备感测。参考图3和图4,当它在检测范围(例如,2至3米)内时,遥控钥匙320可以通过汽车310感测。例如,遥控钥匙320可以经由收发器329通过无线通信链路130发送验证信号215。验证信号215可以通过嵌入在遥控钥匙320中的无线电脉冲发生器(在图3和图4中未显示)产生,并包含通过汽车310用于验证遥控钥匙320的识别码或验证码。在实施方案中,认证模块220接收验证信号215并验证遥控钥匙320-例如检验遥控钥匙320与汽车310的正确配对。
在实施方案中,认证模块220接收验证信号215并验证遥控钥匙320之后,认证模块220将激活信号212发送到语音识别引擎210中。根据实施方案,认证模块220还可以经由无线通信链路130发送激活信号212到语音识别引擎325中。在实施方案中,激活信号212激活或接合语音识别引擎210和语音识别引擎325。此外,认证模块220发送认证信号225到命令模块230中,以表明遥控钥匙320已被汽车310正确地验证或与汽车310正确地配对。
在步骤520中,在认证设备已通过目标设备检验之后,处理一个或多个解码的话音命令。参考图3,一旦被激活,语音识别引擎210处理话音命令205、语音识别引擎325处理话音命令205或都处理话音命令205。话音命令205可通过遥控钥匙320的用户(例如,汽车310的司机或乘客)发出。语音识别引擎210和语音识别引擎325分别生成解码的话音命令217和解码的话音命令327。解码的话音命令327可以使用无线通信链路130从遥控钥匙320(经由收发器329)传输到命令模块230中。参考图4,一旦被激活,语音识别引擎210处理话音命令205。在这里,语音识别引擎210产生解码的话音命令217。
在实施方案中,在接收到话音命令205时,语音识别引擎210和语音识别引擎325分别从解码的话音命令217和解码的话音命令327中移除的一个或多个环境条件。这些环境条件的移除包括,除其他外,消除噪声、消除回声、移除混响或与话音命令205相关联的其组合。尤其在室外环境(例如停车场、停车库、交通繁忙的道路附近)中,移除一个或多个环境条件是有益的,使得语音识别引擎210和语音识别引擎325能够准确地解码话音命令205。
语音识别引擎210和语音识别引擎325上的示例性的细节可以在2012年6月6日(代理人案号3186.0050000)提交的标题为“声学处理单元(Acoustic Processing Unit)”的美国专利申请号13/489,799和2012年12月21日(代理人案号3185.0150000)提交的标题为“音素分数加速器(Phoneme Score Accelerator)”的美国专利申请号13/725,260中找到,其都通过引用整体并入本文。
参照图3的实施例,根据实施方案,命令模块230接收指示遥控钥匙320已正确地被汽车310验证或与汽车310配对的认证信号225之后,命令模块230确定解码的话音命令217或解码的话音命令327是否将用于进一步处理。根据实施方案,命令模块230可以基于遥控钥匙320是否在汽车310的预定的距离内做出该判定。例如,遥控钥匙320可以在汽车310的检测范围(例如,2至3米)内。然而,由于环境条件(例如,来自停车场或附近的高速公路的噪声),与汽车310相关的一个或更多个麦克风可能不能够准确地感测话音命令205。另一方面,如果用户发出话音命令205,同时保持遥控钥匙320在附近,则与遥控钥匙320相关联的一个或多个麦克风可能比与汽车310相关联的一个或多个麦克风更准确地感测话音命令205。在实施方案中,如果遥控钥匙320在汽车310(例如0.5至3.0米)的预定距离内,则命令模块230选择解码的话音命令327以用于进一步处理。根据实施方案,对于小于汽车310预定距离的距离(例如<0.5米),命令模块230选择解码的话音命令217用于进一步处理。
参考图4,根据实施方案,命令模块230接收指示遥控钥匙320已正确地被汽车310验证或与汽车310配对的认证信号225之后,语音识别引擎210确定话音命令205是通过遥控钥匙320接收(并经由收发器329和通信链路130传送到汽车310中)的话音命令205还是通过汽车310接收的话音命令205将被用于进一步的处理。类似于上述,根据实施方案,语音识别引擎210可以基于遥控钥匙320是否在汽车310的预定距离内做出该判定。例如,遥控钥匙可以在汽车310的检测范围(例如2至3米)内。但是,由于环境条件(例如,来自停车场或附近高速公路的噪声),与汽车310相关联的一个或更多个麦克风可能不能够准确地感测话音命令205。另一方面,如果用户发出话音命令205,同时保持遥控钥匙320在附近,则与遥控钥匙320相关联的一个或多个麦克风比与汽车310相关联的一个或多个麦克风可能更准确地感测话音命令205。在这里,来自遥控钥匙320的话音命令205由语音识别引擎210处理到解码的话音命令217中。
参考图3,在另一个实施方案中,命令模块230确定是解码的话音命令217还是解码的话音命令327将基于遥控钥匙320是位于汽车310的内部还是外部而被用于进一步处理。例如,汽车310可以具有一个或多个传感器以协助命令模块230确定遥控钥匙320是否在汽车310的内部。例如,如果已经启动汽车的点火、一个或多个门已被解锁或停车制动器已被脱开,则命令模块230可确定遥控钥匙320(和遥控钥匙320的用户)在汽车310内。在实施方案中,如果遥控钥匙320在汽车310的内部,则命令模块230选择解码的话音命令217而不是解码的话音命令327用于进一步处理。
参考图4,在另一个实施方案中,语音识别引擎210确定是通过遥控钥匙320接收的(并且经由收发器329和通信链路130传输到汽车310中)话音命令205还是通过汽车310接收的话音命令205将被用于进一步的处理。类似于上述,语音识别引擎210可以基于遥控钥匙320是位于汽车310内部还是外部做出该判定。在实施方案中,如果遥控钥匙320在汽车310的内部,则语音识别引擎210选择由汽车310接收的话音命令205进行进一步处理。
根据实施方案,命令模块230还可以过滤来自未经授权的用户的话音命令。命令模块230可以采用学习算法,以识别一个或多个授权用户。例如,在设置图3的汽车环境300和图4的汽车环境400中的语音识别系统时,命令模块230可以学习一个或多个授权用户的不同语音特性。基于这些语音特性,命令模块230能够从未经授权的用户的话音命令中辨别授权用户的话音命令。
此外,在实施方案中,命令模块230可以基于遥控钥匙320的位置调节匹配话音命令205与授权用户的概率阈值。例如,当遥控钥匙320在汽车310的内部时与当遥控钥匙320在汽车310的外部时相比,命令模块230降低话音命令205来自授权用户的概率阈值。这是因为,例如当在汽车310的内部发出时与在汽车310外面发出时相比,话音命令205不太可能受到噪音和其他环境条件的影响。此外,授权用户更可能在汽车310的内部,而不是汽车310的外部。
在实施方案中,命令模块230可以采用学习算法,以基于过去的事件帮助辨别解码的话音命令-例如图3和图4中的解码的话音命令217和解码的话音命令327。根据实施方案,该学习算法可合并来自用户的一个或多个过去的解码的话语。例如,在过去,用户可能已经说过“打开灯”,其中汽车310具有多于一个灯。在实施方案中,命令模块230可能已经请求用户澄清打开哪个灯--例如前大灯、室内灯或仪表板控制台灯。在这里,该用户可能已经通过发出“室内灯”作出反应。基于该用户的过去的澄清,下次用户说出“打开灯”时,命令模块230学习打开用户的首选灯源-例如内部灯。
参考图5,在步骤530中,来自步骤520的一个或一个解码的话音命令在目标设备处执行。参考图3和4,将解码的话音命令作为命令信号235从命令模块230输出。这些解码的话音命令可以包括,除其他外,打开汽车的行李舱、打开灯以及调整驾驶员和乘客的座椅(例如,躺下、移动靠背以用于额外的腿部空间和向下折叠座椅以便更容易出入)。
本文所公开的实施方案的益处,除其他外,是通过图2的认证装置200以及图5的方法500提供的免提控制和认证过程。例如,参考上述汽车实施例,遥控钥匙提供用于验证汽车的遥控钥匙的用户的方法。此外,一旦遥控钥匙被验证,用户可以发出由汽车执行的话音命令(例如,启动发动机、开灯、解锁或锁定车门、摇下窗户和打开行李舱。)
3.示例性的计算机系统
本文所公开的实施方案的各个方面可以在软件、固件、硬件或其组合中实现。图6是示例性计算机系统600的图示,其中,实施方案或其部分可作为计算机可读代码实现。例如,通过图5的流程图500说明的方法可以在系统600中实现。各种实施方案按照这个示例性计算机系统600描述。阅读该描述后,如何使用其它计算机系统和/或计算机架构实施本文所公开的实施方案对相关领域技术人员来说将变得明显。
应当指出的是,本文所公开的各种实施方案的仿真、合成和/或制造可部分地通过计算机可读代码的使用完成,所述计算机可读代码包括通用编程语言(例如C或C++)、硬件描述语言(HDL),例如Verilog HDL、VHDL、Altera HDL(AHDL)或其他可用的编程和/或原理图捕获工具(如电路捕获工具)。这种计算机可读代码可设置于任意已知的计算机可用介质中,包括半导体、磁盘、光盘(如CD-ROM、DVD-ROM)。同样地,代码可通过通信网络包括因特网传递。可以理解的是,所完成的功能和/或由上述的系统和技术提供的结构可以表示为在程序代码中体现的核心并且可被转换成硬件作为集成电路生产的一部分。
计算机系统600包括一个或多个处理器,如处理器604。例如,处理器604可以是专用或通用处理器,诸如图2中的语音识别引擎210、认证模块220和命令模块230。处理器604被连接到通信基础设施606(例如总线或网络)。
计算机系统600还包括主存储器608,优选地随机存取存储器(RAM),并且还可包括辅助存储器610。辅助存储器610可包括例如硬盘驱动器612、可移动存储驱动器614和/或记忆棒。移动存储驱动器614可包括软盘驱动器、磁带驱动器、光盘驱动器、闪速存储器等。可移动存储驱动器614以公知的方式读取和/或写入可移动存储单元618。可移动存储单元618可包括软盘、磁带、光盘等,它们是由可移动存储驱动器614读取和写入。如对相关领域技术人员可以理解的是,可移动存储单元618包括计算机可用存储介质,其具有存储其中的计算机软件和/或数据。
计算机系统600(可选地)包括显示接口602(其可包括输入和输出设备,如键盘、鼠标等),其转发来自通信基础设施606(或来自未显示的帧缓冲器)的图形、文本和其他数据,用于在显示单元630上显示。
在替换的实施方案中,辅助存储器610可包括用于允许计算机程序或其它指令装载到计算机系统600的其他类似设备。这种设备可包括例如可移动存储单元622和接口620。这种设备的示例可包括程序盒和盒式接口(诸如在视频游戏设备中发现的那些)、可移动存储器芯片(例如EPROM或PROM)和相关的插座,以及其他可移动存储单元622和接口620,其允许软件和数据从可移动存储单元622传递到计算机系统600中。
计算机系统600还可包括通信接口624。通信接口624允许软件和数据在计算机系统600和外部设备之间传递。通信接口624可包括调制解调器、网络接口(诸如英特网卡)、通信端口、PCMCIA槽和卡等。经由通信接口624传递的软件和数据是以电子、电磁、光或能够通过通信接口624接收的其它信号的形式。这些信号经由通信路径626提供至通信接口624。通信路径626承载信号,并可以使用电线或电缆、光纤、电话线、蜂窝电话链路、RF链路或其他通信信道来实现。
在这个文件中,术语“计算机程序介质”和“计算机可用介质”用来一般指代有形介质,如可移动存储单元618、可移动存储单元622和安装在硬盘驱动器612中的硬盘。计算机程序介质和计算机可用介质还可指有形存储器,如主存储器608和辅助存储器610,其可以是半导体存储器(例如DRAM等)。这些计算机程序产品提供软件到计算机系统600。
计算机程序(也称为计算机控制逻辑)存储在主存储器608和/或辅助存储器610中。计算机程序也可以通过通信接口624接收。当执行这种计算机程序时,使计算机系统600能够实现本文所公开的实施方案。尤其是,当执行计算机程序时,使处理器604能够实现本文所公开的实施方案的过程,如在由图5的流程图500所说明的方法中的步骤可以在上面所讨论的系统600中实现。相应地,这种计算机程序代表计算机系统600的控制器。其中,实施方案使用软件来实现时,该软件可存储在计算机程序产品中,并使用可移动存储驱动器614、接口620、硬盘驱动器612或者通信接口624装载到计算机系统600中。
实施方案还涉及计算机程序产品,包括存储在任何计算机可用介质上的软件。当在一个或多个数据处理设备中执行时,这种软件使得数据处理设备如本文所述进行操作。本文所公开的实施方案使用现在或将来已知的任何计算机可用或可读介质。计算机可用介质的实例包括但不限于主存储设备(例如任何类型的随机存取存储器)、辅助存储设备(例如硬盘、软盘、CD ROM、ZIP盘、磁带、磁存储设备、光存储设备、MEMS、纳米技术存储设备等)以及通信介质(例如有线和无线通信网络、局域网、广域网、内联网等)。
4.结论
应该理解的是,详细说明部分而不是概述和摘要部分旨在用来解释权利要求。概述和摘要部分可以阐明一个或多个但不是所有的本发明者所预期的示例性实施方案,并且因此,并不以任何方式限制本发明和所附权利要求。
在说明特定功能及其关系的实现的功能组成模块的帮助下,已经在上面描述了实施方案。为描述方便,这些功能组成模块的边界已经在本文中反复地限定。只要适当地执行指定功能及其关系,可以限定备用边界。
具体实施方案的前述描述将如此充分地揭示本发明的一般性质,在不脱离本发明的一般概念的情况下,其他人可以通过应用在相关领域的技术范围内的知识无需过度实验而容易地修改和/或调节这些具体实施方案的各种应用。因此,基于本文所呈现的教导和指导,这种调整和修改旨在落入所公开的实施方案的等同物的含义和范围内。应该理解的是,本文的短语或术语用于描述而不是限制的目的,使得技术人员根据教导和指导来解释本说明书的术语或短语。
本发明的广度和范围不应由任何上述示例性实施方案来限制,但应该只能按照下面的权利要求和它们的等同物来限定。

Claims (19)

1.一种用于语音识别的认证的方法,所述方法包括:
用目标设备感测认证设备;
在通过所述目标设备确认所述认证设备之后,用所述认证设备和所述目标设备处理一个或多个解码的话音命令;
当所述认证设备和所述目标设备之间的距离大于距离所述目标设备的预定距离时,用所述认证设备或所述目标设备执行来自所述认证设备的所述一个或多个解码的话音命令;以及
当所述认证设备和所述目标设备之间的距离小于距离所述目标设备的所述预定距离时,用所述认证设备或所述目标设备执行来自所述目标设备的所述一个或多个解码的话音命令。
2.根据权利要求1所述的方法,其中,所述感测包括在通过所述目标设备确认所述认证设备之后,激活一个或多个语音识别引擎。
3.根据权利要求1所述的方法,其中,所述处理包括在所述目标设备处接收所述一个或多个解码的话音命令。
4.根据权利要求1所述的方法,其中,所述处理包括从所述一个或多个解码的话音命令中移除一个或多个环境条件。
5.根据权利要求4所述的方法,其中,所述移除包括从所述一个或多个解码的话音命令中消除噪声、消除回声、移除混响或其组合。
6.根据权利要求1所述的方法,其中,所述处理包括基于并入一个或多个过去的解码的话语的学习算法,处理所述一个或多个解码的话音命令。
7.根据权利要求6所述的方法,其中,基于所述学习算法处理所述一个或多个解码的话音命令包括:当多个结果与所述一个或多个解码的话音命令相关联时,请求用户澄清。
8.一种用于语音识别的认证装置,所述认证装置包括:
语音识别引擎;
认证模块,其配置为感测认证设备;以及
命令模块,其配置为:
在所述认证设备的确认之后处理来自所述认证设备和所述语音识别引擎的一个或多个解码的话音命令;
当所述认证设备和与所述语音识别引擎相关联的目标设备之间的距离大于距离所述目标设备的预定距离时,执行来自所述认证设备的所述一个或多个解码的话音命令;以及
当所述认证设备和所述目标设备之间的距离小于距离所述目标设备的所述预定距离时,执行来自所述目标设备的所述一个或多个解码的话音命令。
9.根据权利要求8所述的认证装置,其中,所述认证设备包括智能卡、射频识别设备、移动设备或智能钥匙设备中的至少一个。
10.根据权利要求9所述的认证装置,其中,所述认证设备包括:
发射机,其配置为发送一个或多个话音命令到所述命令模块。
11.根据权利要求9所述的认证装置,其中,所述认证模块被配置为接收通过无线通信链路发送的认证信号以及所述语音识别引擎被配置为接收一个或多个话音命令。
12.根据权利要求9所述的认证装置,其中,所述认证模块被配置为基于通过无线通信链路发送的认证信号验证所述认证设备并被配置为输出激活信号到所述语音识别引擎。
13.根据权利要求9所述的认证装置,其中,所述认证设备包括配置为发送第一话音命令到所述语音识别引擎的发射机,并且其中所述语音识别引擎配置为接收第二话音命令,所述语音识别引擎配置为处理所述第一话音命令或所述第二话音命令。
14.根据权利要求13所述的认证装置,其中,所述语音识别引擎配置为基于所述认证设备的位置处理所述第一话音命令或所述第二话音命令。
15.根据权利要求9所述的认证装置,其中,所述命令模块被配置为基于并入过去的解码的话语的学习算法处理所述一个或多个解码的话音命令。
16.根据权利要求9所述的认证装置,其中,当多个结果与所述一个或多个解码的话音命令相关联时,所述命令模块配置为请求用户澄清。
17.一种用于语音识别的认证的系统,所述系统包括:
用于用目标设备感测认证设备的模块;
用于在通过所述目标设备确认所述认证设备之后由所述认证设备和所述目标设备处理一个或多个解码的话音命令的模块;
用于当所述认证设备和所述目标设备之间的距离大于距离所述目标设备的预定距离时执行来自所述认证设备的所述一个或多个解码的话音命令的模块;以及
用于当所述认证设备和所述目标设备之间的距离小于距离所述目标设备的所述预定距离时执行来自所述目标设备的所述一个或多个解码的话音命令的模块。
18.根据权利要求17所述的系统,其中,所述处理包括基于所述认证设备相对于所述目标设备的位置,选择来自所述认证设备的第一话音命令或来自所述目标设备的第二话音命令。
19.根据权利要求18所述的系统,其中,所述处理包括基于并入一个或多个过去的解码的话语的学习算法处理所述一个或多个解码的话音命令。
CN201480031518.XA 2013-04-04 2014-04-02 用于识别系统的认证 Active CN105264538B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US13/856,671 US9619645B2 (en) 2013-04-04 2013-04-04 Authentication for recognition systems
US13/856,671 2013-04-04
PCT/US2014/032674 WO2014165588A1 (en) 2013-04-04 2014-04-02 Authentication for recognition systems

Publications (2)

Publication Number Publication Date
CN105264538A CN105264538A (zh) 2016-01-20
CN105264538B true CN105264538B (zh) 2018-01-02

Family

ID=51655095

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201480031518.XA Active CN105264538B (zh) 2013-04-04 2014-04-02 用于识别系统的认证

Country Status (5)

Country Link
US (1) US9619645B2 (zh)
JP (1) JP6364474B2 (zh)
CN (1) CN105264538B (zh)
DE (1) DE112014001845T8 (zh)
WO (1) WO2014165588A1 (zh)

Families Citing this family (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9338761B2 (en) * 2014-02-26 2016-05-10 Empire Technology Development Llc Presence-based device mode modification
US9844981B2 (en) * 2015-06-02 2017-12-19 Karma Automotive Llc Systems and methods for use in a vehicle for detecting external events
CN106529251A (zh) * 2016-10-25 2017-03-22 北京光年无限科技有限公司 一种针对智能机器人的认证方法及系统
KR20200002871A (ko) * 2017-03-30 2020-01-08 애큐웨더 아이엔씨. 강설 확률 분포들을 예보하기 위한 시스템 및 방법
KR102352560B1 (ko) 2017-06-09 2022-01-19 현대자동차주식회사 차량용 키, 차량, 및 그 제어방법
DE102017218542A1 (de) 2017-10-17 2018-08-16 Audi Ag Verfahren zur Sprachsteuerung von Fahrzeugfunktionen eines Kraftfahrzeugs von außerhalb des Kraftfahrzeugs, Dachantennenelement für ein Kraftfahrzeug sowie Kraftfahrzeug mit einem Dachantennenelement
US11355126B2 (en) 2018-01-24 2022-06-07 Comcast Cable Communications, Llc Verification of user identity for voice enabled devices
CN108725385A (zh) * 2018-05-31 2018-11-02 浙江吉利控股集团有限公司 一种面部识别车辆启动系统、启动方法及车辆
CN108922523B (zh) * 2018-06-19 2021-06-15 Oppo广东移动通信有限公司 位置提示方法、装置、存储介质及电子设备
DE102018006480A1 (de) * 2018-08-16 2020-02-20 Daimler Ag Schlüsselvorrichtung zum Einstellen eines Fahrzeugparameters
US11102203B1 (en) * 2018-10-02 2021-08-24 Silego Technology Inc. Method of authenticating a device
US10957317B2 (en) * 2018-10-18 2021-03-23 Ford Global Technologies, Llc Vehicle language processing
CN109360559A (zh) * 2018-10-23 2019-02-19 三星电子(中国)研发中心 多智能设备同时存在时处理语音指令的方法和系统
KR102266070B1 (ko) * 2019-11-19 2021-06-17 주식회사 한글과컴퓨터 초음파 대역의 교란 신호를 발생시켜 음성 녹음을 방지하는 녹음 방지 장치와의 연동을 통해 인증된 사용자만이 음성 명령을 인가할 수 있도록 지원하는 음성 명령 인식 장치 및 그 동작 방법
CN111845629B (zh) * 2019-12-30 2022-06-07 杭州青奇科技有限公司 一种车辆控制方法及装置
US20230029467A1 (en) * 2021-07-30 2023-02-02 Nissan North America, Inc. Systems and methods of adjusting vehicle components from outside of a vehicle
CN113734096A (zh) * 2021-09-09 2021-12-03 上海电机学院 基于声纹识别的汽车锁具
DE102022206594A1 (de) * 2022-06-29 2024-01-04 Psa Automobiles Sa Sprachsteuerung für ein Fahrzeug

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2011163538A1 (en) * 2010-06-24 2011-12-29 Honda Motor Co., Ltd. Communication system and method between an on-vehicle voice recognition system and an off-vehicle voice recognition system
CN102917004A (zh) * 2011-08-04 2013-02-06 通用汽车环球科技运作有限责任公司 车辆运动时限制驾驶员使用移动设备特征的系统及方法
CN103444216A (zh) * 2011-03-30 2013-12-11 高通股份有限公司 主机设备和受限输入无线设备之间的配对和认证过程

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3921956B2 (ja) 2001-04-03 2007-05-30 日産自動車株式会社 キーレスエントリーシステム
JP2003114694A (ja) 2001-10-05 2003-04-18 Yamaha Corp 携帯型リモートコントロール装置
US7548491B2 (en) * 2002-06-13 2009-06-16 General Motors Corporation Personalized key system for a mobile vehicle
JP2004325688A (ja) 2003-04-23 2004-11-18 Toyota Motor Corp 音声認識システム
DE602004020247D1 (de) 2003-10-21 2009-05-07 Johnson Controls Tech Co System und verfahren zur auswahl eines benutzersprachprofils für eine vorrichtung in einem fahrzeug
US20050273626A1 (en) * 2004-06-02 2005-12-08 Steven Pearson System and method for portable authentication
WO2006025106A1 (ja) 2004-09-01 2006-03-09 Hitachi, Ltd. 音声認識システム、音声認識方法およびそのプログラム
US7826945B2 (en) * 2005-07-01 2010-11-02 You Zhang Automobile speech-recognition interface
DE602007004620D1 (de) * 2007-10-01 2010-03-18 Harman Becker Automotive Sys Sprachgesteuerte Einstellung von Fahrzeugteilen
KR101532932B1 (ko) * 2009-03-02 2015-07-01 엘지전자 주식회사 이동 단말기 및 이를 이용한 스케쥴 관리 방법 및 위치 정보 관리 방법
US8370157B2 (en) * 2010-07-08 2013-02-05 Honeywell International Inc. Aircraft speech recognition and voice training data storage and retrieval methods and apparatus
US8762852B2 (en) * 2010-11-04 2014-06-24 Digimarc Corporation Smartphone-based methods and systems
US9934780B2 (en) * 2012-01-17 2018-04-03 GM Global Technology Operations LLC Method and system for using sound related vehicle information to enhance spoken dialogue by modifying dialogue's prompt pitch
US9809185B2 (en) * 2012-09-04 2017-11-07 Ford Global Technologies, Llc Method and apparatus for subjective command control of vehicle systems

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2011163538A1 (en) * 2010-06-24 2011-12-29 Honda Motor Co., Ltd. Communication system and method between an on-vehicle voice recognition system and an off-vehicle voice recognition system
CN103444216A (zh) * 2011-03-30 2013-12-11 高通股份有限公司 主机设备和受限输入无线设备之间的配对和认证过程
CN102917004A (zh) * 2011-08-04 2013-02-06 通用汽车环球科技运作有限责任公司 车辆运动时限制驾驶员使用移动设备特征的系统及方法

Also Published As

Publication number Publication date
WO2014165588A1 (en) 2014-10-09
DE112014001845T5 (de) 2015-12-24
US9619645B2 (en) 2017-04-11
JP2016521379A (ja) 2016-07-21
DE112014001845T8 (de) 2016-03-03
JP6364474B2 (ja) 2018-07-25
CN105264538A (zh) 2016-01-20
US20140303983A1 (en) 2014-10-09

Similar Documents

Publication Publication Date Title
CN105264538B (zh) 用于识别系统的认证
US9176482B2 (en) Systems and methods for configuring and operating a wireless control system in a vehicle for activation of a remote device
US9580028B2 (en) Adjusting or setting vehicle elements through speech control
CN105501158B (zh) 一种驾驶员识别融合的系统及方法
EP2405422B1 (en) Speech recognition and voice training data storage and access method and apparatus
CN109785828A (zh) 基于用户语音风格的自然语言生成
CN109632080A (zh) 用于语音命令识别的车窗振动监测
US20100097178A1 (en) Vehicle biometric systems and methods
JP2015505284A (ja) 車両の乗員を識別するシステム、方法、及び装置
CN105073514B (zh) 用于确定什么时候智能手机在车辆中的系统以及方法
CN106164398A (zh) 移动设备、车辆远程操作系统、车辆远程操作方法以及程序
CN104024078A (zh) 用于学习运载工具乘员的身份的系统、方法和设备
CN106600762A (zh) 车门的控制方法及系统
CN103419790A (zh) 车辆驾驶员的分级识别和基于该识别的车辆设置激活选择
CN107284409A (zh) 远程无钥匙系统表征的系统和方法
US9367977B2 (en) Apparatus, method and system for controlling smart key
WO2015157977A1 (zh) 一种无人驾驶车辆的载客系统
US9978399B2 (en) Method and apparatus for tuning speech recognition systems to accommodate ambient noise
JP3977714B2 (ja) 個人認証システムおよび個人認証方法
KR20180133048A (ko) 차량용 키, 차량, 차량용 키를 이용한 인증 시스템 및 인증 방법
JP7287269B2 (ja) 車両用通信システム
US11202205B2 (en) Computer-implemented identification method
JP7310594B2 (ja) 車両用通信システム
CN116215445A (zh) 增强的生物特征授权

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant