CN107004079A - 共享声学空间中的识别和验证 - Google Patents

共享声学空间中的识别和验证 Download PDF

Info

Publication number
CN107004079A
CN107004079A CN201580067042.XA CN201580067042A CN107004079A CN 107004079 A CN107004079 A CN 107004079A CN 201580067042 A CN201580067042 A CN 201580067042A CN 107004079 A CN107004079 A CN 107004079A
Authority
CN
China
Prior art keywords
data
processor
people
service
identity
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201580067042.XA
Other languages
English (en)
Other versions
CN107004079B (zh
Inventor
肖恩·威廉·范戴肯
埃里克·维瑟
阿西夫·伊克巴勒·穆罕默德
萨米尔·库马尔·古普塔
金莱轩
斯里康德·纳拉亚纳斯瓦米
蓬·托恩
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qualcomm Inc
Original Assignee
Qualcomm Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qualcomm Inc filed Critical Qualcomm Inc
Publication of CN107004079A publication Critical patent/CN107004079A/zh
Application granted granted Critical
Publication of CN107004079B publication Critical patent/CN107004079B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G07CHECKING-DEVICES
    • G07CTIME OR ATTENDANCE REGISTERS; REGISTERING OR INDICATING THE WORKING OF MACHINES; GENERATING RANDOM NUMBERS; VOTING OR LOTTERY APPARATUS; ARRANGEMENTS, SYSTEMS OR APPARATUS FOR CHECKING NOT PROVIDED FOR ELSEWHERE
    • G07C9/00Individual registration on entry or exit
    • G07C9/30Individual registration on entry or exit not involving the use of a pass
    • G07C9/32Individual registration on entry or exit not involving the use of a pass in combination with an identity check
    • G07C9/37Individual registration on entry or exit not involving the use of a pass in combination with an identity check using biometric data, e.g. fingerprints, iris scans or voice recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/30Authentication, i.e. establishing the identity or authorisation of security principals
    • G06F21/31User authentication
    • G06F21/32User authentication using biometric data, e.g. fingerprints, iris scans or voiceprints
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/172Classification, e.g. identification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/20Movements or behaviour, e.g. gesture recognition
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/005Circuits for transducers, loudspeakers or microphones for combining the signals of two or more microphones

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computer Security & Cryptography (AREA)
  • General Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Computer Hardware Design (AREA)
  • Software Systems (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Otolaryngology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Psychiatry (AREA)
  • Social Psychology (AREA)
  • Oral & Maxillofacial Surgery (AREA)
  • User Interface Of Digital Computer (AREA)
  • Fittings On The Vehicle Exterior For Carrying Loads, And Devices For Holding Or Mounting Articles (AREA)
  • Collating Specific Patterns (AREA)

Abstract

一种系统包含存储器,其经配置以存储与可用的服务相关联的数据。所述系统还包含麦克风,其与声学空间相关联,且经配置以接收人所产生的音频输入。所述系统进一步包含传感器,其位于所述声学空间内,且经配置以检测所述人所产生的振动。所述系统包含处理器,其耦合到所述存储器、耦合到所述麦克风,且耦合到所述传感器。所述处理器经配置以有条件地授权所述人所请求的服务的执行,所述服务是基于所述音频输入和所述振动来而条件地被授权。

Description

共享声学空间中的识别和验证
相关申请案的交叉参考
本申请案主张共同拥有的2014年12月12日申请的第62/091,386号美国临时专利申请案以及2015年12月11日申请的第14/966,815号美国非临时专利申请案的优先权,所述专利申请案的内容明确地以全文引用的方式并入本文中。
技术领域
本发明大体上涉及共享声学空间中的识别和验证。
背景技术
基于话音的辨识和识别可在其中多个人可能极为接近的共享声学空间中形成挑战。另外,可记录和复制人的口头口令或音频,来规避基于话音的识别或验证。限制基于话音的识别和验证的规避的一种方法是将服务限制为非重要服务。限制规避的另一方法是将基于话音的识别和验证与其它类型的识别或验证组合。
发明内容
根据本发明的一方面,一种系统包含存储器,其经配置以存储与可用的服务相关联的数据。所述系统还包含麦克风,其与声学空间相关联,且经配置以接收人所产生的音频输入。所述系统进一步包含传感器,其位于所述声学空间内,且经配置以检测所述人所产生的振动。所述系统包含处理器,耦合到所述存储器、耦合到所述麦克风,且耦合到所述传感器。所述处理器经配置以有条件地授权所述人所请求的服务的执行,所述服务是基于所述音频输入和所述振动而有条件地被授权。
在另一方面,一种方法包含在处理器处从与声学空间相关联的麦克风接收。所述音频数据由所述麦克风基于人所产生的音频输入而产生。所述方法还包含在处理器处从位于所述声学空间内的传感器接收。所述振动数据是所述传感器基于所述人所产生的振动而产生。所述方法进一步包含通过所述处理器来有条件地授权所述人所请求的服务的执行。所述服务是基于所述音频数据和所述振动数据而有条件地被授权。
在另一特定方面,一种系统包含用于存储与可用的服务相关联的数据的装置。所述系统进一步包含用于接收人所产生的音频输入并基于所述音频输入产生音频数据的装置。所述用于接收的装置与声学空间相关联。所述系统还包含用于检测所述人所产生的振动并基于所述振动产生振动数据的装置。所述用于检测的装置位于所述声学空间内。所述系统包含用于有条件地授权所述人所请求的服务的执行的装置。所述服务是基于所述音频数据和所述振动数据而有条件地被授权。所述用于有条件地授权的装置耦合到所述用于存储数据的装置、所述用于接收的装置;以及所述用于检测的装置。
在另一方面,一种非暂时性计算机可读媒体包含计算机可执行指令,其在被执行时在由处理器执行时,致使所述处理器验证由人产生且在与声学空间相关联的麦克风处接收到的音频输入。基于所述人所产生的振动来验证所述音频输入。在位于所述声学空间内的传感器处接收所述振动。所述指令进一步致使所述处理器有条件地授权所述人所请求的服务的执行。所述服务是基于所述音频输入和所述振动据而有条件地被授权。
提供此概述是为了以简化形式介绍下文在具体实施方式中进一步描述的概念的选择。此概述无意识别所主张的标的物的关键特征或基本特征,也无意用于限制所主张的标的物的范围。本发明的其它方面、优点和特征将在审阅整个申请案之后变得显而易见,整个申请案包含以下章节:附图说明、具体实施方式和权利要求书。
附图说明
当结合附图阅读时,更好地理解前面的概述以及说明性实施例的以下详细描述。出于说明实施方案的目的,图中示出所述实施方案的实例构造;然而,实施方案不限于所揭示的特定方法和手段。在图中:
图1是说明用于有条件地授权共享声学空间中的服务的系统的图;
图2是说明用于有条件地授权共享声学空间中的服务的系统的特定实例的图;
图3是说明用于有条件地授权共享声学空间中的服务的系统的另一实例的图;
图4是说明有条件地批准服务的方法的第一实例的流程图;
图5是说明有条件地批准服务的方法的第二实例的流程图;
图6是可操作以支持本文所揭示的一或多个方法、系统、设备和计算机可读媒体的各种实施方案的无线装置的图;以及
图7是可操作以支持本文所揭示的一或多个方法、系统、设备和计算机可读媒体的各种实施方案的另一无线装置的图。
具体实施方式
下文参考图式描述本发明的特定方面。在描述中,贯穿图式由常用参考数字指示常用特征元件。如本文所使用,“示范性”可指示实例、实施方案、方面或其组合,且不应解释为限制性或解释为指示偏好或优选实施方案。如本文所使用,用以修改元件(例如结构、组件、操作等)的序数术语(例如“第一”、“第二”、“第三”等)本身并不指示所述元件相对于另一元件的任何优先权或次序,而是实际上仅将所述元件从具有相同名称(但使用序数术语)的另一元件区别开。如本文中所提到,“传感器”可为可检测或结合处理器确定属性的传感器。所述属性可包含或对应于振动、质量、电容、重量、压力、加速度、重量分布、压力分布或其组合,作为说明性非限制性实例。
图1说明使人能够被有条件地授权服务(例如话音激活服务)的系统100的特定实例。系统100可基于在多个麦克风112a到112g处接收到的音频输入来确定身份。系统100可基于在多个传感器114a到114c处检测到的振动来证实所述音频输入来源于人而不是所述人的录音。当人讲话时,可产生所述振动,且所述振动可与所述音频输入相关(例如匹配)来证实所述音频输入是来自所述人。从所述录音产生的振动可能不够强,或可能不与所述音频输入相关(例如匹配)。系统100可能够通过防止使用人的录音欺骗基于话音的识别和验证,来提供增加的安全性。举例来说,系统100可基于所述振动来证实所述音频输入。系统100可能够提供额外的重要服务,且可能够使用话音识别和验证来提供安全性的增加。
系统100可包含于共享声学空间102中。共享声学空间102可经配置以容纳一或多个人。举例来说,多个人可在共享声学空间102中极为接近。举例来说,共享声学空间102可包含或对应于交通工具(例如汽车、飞机、轮船或火车)的内部隔室。另外或替代地,共享声学空间102可包含或对应于非运输共享声学空间。举例来说,所述共享声学空间可包含或对应于音乐厅、剧院、会议室、办公室,作为说明性非限制性实例。
如本文参看图1所述,共享声学空间102(例如声学空间)对应于具有布置在三个区域106a到106c(例如排)中的七个座椅104a到104g的汽车的内部隔室。交通工具的内部隔室可分成(或可包含)多个区域106a到106c。如参考系统100所描述,多个区域106a到106c的每一区域对应于不同排的座椅。在其它实施方案中,多个区域中的每一区域可对应于多个座椅104a到104g中的一不同座椅。
座椅104a到104g可经配置以每座椅容纳一个人。举例来说,在图1中说明的配置中,四个人108a到108d位于共享声学空间102中,且占用座椅104a(例如驾驶员座椅)、104b(给前排座椅乘客)、104d(给中间排中心座椅乘客)以及104g(给交通工具右侧的第三排座椅乘客)。尽管已在三个区域(排)106a到106c中的具有七个座椅104a到104g方面描述了共享声学空间,但在其它实施例中,共享声学空间102可包含不同数目的座椅、不同数目的区域(或排),或其组合。举例来说,共享声学空间102可包含超过七个座椅或少于七个座椅。
系统100可包含处理器110、存储器111、多个麦克风112a到112g,以及多个传感器114a到114c。多个麦克风112a到112g中的每一者可以通信方式耦合到处理器110。所述多个麦克风112a到112g可位于共享声学空间102中,且可分布遍及共享声学空间102。举例来说,所述多个麦克风112a到112g可分布遍及共享声学空间102;相对于交通工具的座椅104a到104g。
所述多个麦克风112a到112g可经配置以接收音频输入。举例来说,第一麦克风112a可经配置以接收第一音频输入,且第二麦克风112b可经配置以接收第二音频输入。在一些实施方案中,音频输入可与相同来源(例如相同的人)相关联。举例来说,第一麦克风112a可在第一时间接收与第一人108a相关联的第一音频输入,且第二麦克风112b可在第二时间接收与第一人108a相关联的第二音频输入。在一些实施方案中,第一音频输入(例如来自第一人108a的语音)可具有与第二音频输入(例如来自第一人108a的语音)不同的振幅。在其它实施方案中,音频输入可与不同来源相关联。举例来说,第一麦克风112a可接收与第一人108a相关联的第一音频输入,且第三麦克风112c可接收与第三人108c相关联的第三音频输入。
在一些实施方案中,可为驾驶员提供多于一个麦克风,例如麦克风112a和112g。对于一些实施方案,可不为座椅104d(中间排中心座椅)中的第三人108c特别提供麦克风,其可改为利用麦克风112c和112d两者,其中处理器110能够使用来自这两个麦克风的数据来服务第二区域106b中的所有三个座椅位置(且同样地对于其它排,如果它们将具有第三中间座椅)。
多个传感器114a到114c中的每一者可以通信方式耦合到处理器110。所述多个传感器114a到114c可位于共享声学空间102内,且分布遍及共享声学空间102。举例来说,所述多个传感器114a到114c可相对于交通工具的座椅104a到104g分布遍及共享声学空间102。另外或替代地,所述多个传感器114a到114c可位于座椅中、座椅上、头枕中、方向盘中、变速杆中、仪表板中或其组合,作为说明性非限制性实例。在一些实施方案中,每一座椅104a到104g可包含对应传感器。在其它实施方案中,至少一个座椅,例如第一座椅104a(例如驾驶员座椅)可包含多个传感器。
所述多个传感器114a到114c可经配置以检测振动。所述多个传感器114a到114c所检测到的振动可由共享声学空间102中或周围的多种来源引起(例如产生)。举例来说,所述振动可包含来自交通工具的发动机的发动机振动、由运动中的交通工具导致的道路振动、音乐振动、由共享声学空间102外部的外部来源导致的振动,或其组合,作为说明性非限制性实例。另外或替代地,所述振动可为人说话所导致的音频振动(例如语音振动)。举例来说,当人讲话时,人的喉头产生音频振动。所述音频振动可通过空气且经由所述人传播。所述音频振动还可例如从人传送到人所接触的物体(例如座椅或传感器)。作为另一实例,通过空气传播的音频振动可传送到音频传感器,例如多个麦克风112a到112g中的一者。因此,在一些情形中,在特定传感器处检测到的振动(例如音频振动)可对应于在共享声学空间102的多个麦克风112a到112g中的一者处检测到的音频输入(例如音频振动)。
在一些实施方案中,所述多个传感器114a到114c可经配置以检测振动、质量、重量、压力、加速度、电容、重量分布、压力分布或其组合,作为说明性非限制性实例。所述多个传感器114a到114c可包含或对应于地震传感器、振动传感器、压力传感器、测力计、加速计、压电传感器、触摸垫或其组合,作为说明性非限制性实例。
存储器111可耦合到处理器110,且可经配置以存储数据150,例如处理器可执行指令、身份简档、命令数据库或其组合,作为说明性非限制性实例。所述身份简档中的每一身份简档可包含对应于特定人的生物计量信息。身份简档可包含用以识别所述人的身份数据,以及用以验证所述人的验证数据。
识别数据可包含语音特性信息(例如声纹、语音频率范围或两者)、面部特性信息、虹膜特性信息、重量信息、重量分布模式信息、示意动作信息、指纹信息或其组合。验证数据可包含语音特性信息(例如声纹、语音频率范围或两者)、面部特性信息、虹膜特性信息、重量信息、重量分布模式信息、示意动作信息、指纹信息或其组合。验证数据可进一步包含驾驶模式特性信息、特定特权信息或其组合。
命令数据库可包含系统100的可用服务(例如多个服务)。命令数据库可使可用服务与某些口头命令或关键短语相关联。举例来说,解锁交通工具的门的服务可与“解锁门”的口头命令相关联。在一些实施方案中,所述命令数据库还可包含服务位置信息。服务位置信息可指示系统可从其向请求所述服务的人授权的位置。在一些实施方案中,系统100可基于所述位置在所述多个区域中的特定区域内的确定来提供所述服务。举例来说,系统100可响应于来自第一区域106a中的第一人108a的命令而提供解锁交通工具的门的服务,且可响应于来自第二区域106b中的第三人108c的命令而不提供所述服务。另外或替代地,命令数据库可包含服务的等级(例如服务等级),例如舒适服务、受限服务等,且存储器111可经配置以存储服务等级信息。每一服务等级可需要不同类型的验证。举例来说,可基于生物计量验证(例如基于重量的验证)来授权特定服务(例如舒适服务),且可基于多模态生物识别验证(例如基于重量和面部的验证)来授权受限服务。
处理器110可经配置以接收与共享声学空间102相关联的输入数据。举例来说,处理器110可经配置以接收来自多个麦克风112a到112g(例如由其产生)的音频数据,且经配置以接收来自多个传感器114a到114c(例如由其产生)的振动数据,作为说明性非限制性实例。处理器110可经由有线连接、无线连接或其组合耦合到所述多个麦克风112a到112g以及所述多个传感器114a到114c。举例来说,处理器110可无线耦合到所述多个麦克风112a到112g以及所述多个传感器114a到114c。为了说明,处理器110可使用射频通信、蓝牙通信、Wi-Fi通信和其它无线通信技术无线耦合到多个麦克风112a到112g中的一或多者,作为说明性非限制性实例。
所述处理器可经配置以检测对服务的请求。举例来说,所述处理器可对第一人说出的命令执行语音辨识,来识别与所述命令相关联的服务。处理器110可经配置以基于一或多个输入来授权所述服务。在提供所述服务之前,处理器110可授权所述服务,以确保乘客、共享声学空间102中的位置或其组合获得对所述服务的授权。举例来说,处理器110可经配置以基于所述多个麦克风112a到112g接收到的音频输入(例如音频数据)以及所述多个传感器114a到114c接收到的振动(例如振动数据),来有条件地授权所述服务。如本文所述,处理器110可确定并识别一人,且证实人的身份,以确保音频输入是人所提供的实际语音而不是录音。
处理器110可经配置以基于输入数据,例如从多个麦克风112a到112g中的一者接收到的音频数据,来有条件地确定人的身份。举例来说,处理器110可基于从第一麦克风112a接收到的第一音频数据来确定第一人108a的第一身份。处理器110可使用基于话音的识别,例如声纹识别,来确定身份,作为说明性非限制性实例。为了说明,处理器110可确定第一音频数据(对应于来自第一人108a的语音)的语音特性。处理器110可存取存储器111以检索所存储的语音特性信息。处理器110可基于语音特性与所存储的语音特性信息的比较,来识别对应于第一音频数据的身份。
处理器110可经配置以基于从所述多个传感器114a到114c接收到的振动数据来证实所述身份。处理器110可使用来自与同一座椅相关联的一个或多个传感器(例如第一麦克风112a和第一传感器114a)的振动数据来证实所述身份。举例来说,响应于处理器110使用来自与座椅104a相关联的第一麦克风112a的第一音频输入确定所述身份,处理器110可基于第一振动数据来证实所述身份。举例来说,处理器110可基于从第一传感器114a接收到的第一振动数据来证实所述身份(基于第一音频数据来确定)。为了说明,处理器110可将第一音频数据与第一振动数据进行比较,且确定第一振动数据是否与第一音频数据相关或匹配。作为一个说明性实例,处理器110可将音频数据与振动数据进行比较,以产生相关值。所述相关值可包含或对应于音频数据与振动数据之间的差异。处理器110可基于相关值大于或等于阈值而有条件地授权交通工具的发动机的点火。响应于相关值小于或等于阈值,处理器110可经配置以提供所述服务的拒绝的指示。如果第一振动数据与第一音频数据相关(例如匹配),处理器110可确定身份得以证实。如果否,或经由用户接口(例如显示器)提供所述服务的拒绝的指示。举例来说,处理器可实现声音的重放,或经由用户接口(例如显示器)提供所述服务的拒绝的指示。
在一些实施方案中,处理器可使用其它输入(例如重量输入)来证实所述身份,所述其它输入包含示意动作、图像,用于识别的输入中的任一者,或其组合。举例来说,处理器110可接收来自第一重量传感器的重量数据,如参看图2所描述。处理器110可存取与身份相关联的身份简档,所述身份简档包含重量信息、重量分布模式信息或其组合。处理器110可将重量数据与重量信息、重量分布模式信息或其组合行比较,以产生相关值。处理器110可基于相关值大于或等于阈值而有条件地授权服务。作为另一实例,处理器110可执行面部辨识,以基于图像(例如图像数据)来证实所述人的身份,如参看图3所描述。作为另一实例,处理器110可执行示意动作辨识,以基于所述人的示意动作的图像(例如图像数据)来证实所述人的身份,如参看图3所描述。
处理器110可经配置以在授权所述服务之后,提供(或起始)所述服务。举例来说,处理器110可经配置以响应于服务的批准而启动交通工具的发动机。作为另一说明性实例,处理器110可经配置以响应于用户输入而启动交通工具的发动机。所述用户输入可包含开关的激活、基于话音的命令或示意动作。处理器110可有条件地授权交通工具的发动机的点火。在一些实施方案中,处理器110可基于说出命令的人的位置来提供所述服务。举例来说,处理器110可响应于坐在第一座椅104a中的第一人108a发出命令而为整个交通工具(例如,区域106a到106c)调整气候控制设定,且可响应于坐在第五座椅104e中的第三人108c发出所述命令而为第二区域106b调整气候控制设定。在各种实施方案中,处理器110可基于服务等级来授权服务。举例来说,可基于生物计量验证(例如基于重量的验证)来授权第一服务等级(例如舒适服务),且可基于多模态生物计量验证(例如基于重量和面部的验证)来授权第二服务等级(例如受限服务)。
在一些实施方案中,处理器110可位于共享声学空间102中。举例来说,处理器110可居中位于共享声学空间102中。作为另一实例,处理器110可包含多个处理器,且所述多个处理器可分布遍及共享声学空间102。在其它实施方案中,处理器110可位于共享声学空间102之外或远离共享声学空间102。不管位置如何,处理器110可以操作方式耦合到(例如,其经配置以接收)各种不同输入,例如声音数据、振动数据、重量数据、图像捕获数据、用户接口数据、无线通信数据等,作为说明性非限制性实例。
在系统100的操作期间,坐在第一座椅104a(例如驾驶员座椅)中的第一人108a可说出命令,例如“启动汽车”。所述多个麦克风112a到112g中的多个麦克风可接收所述命令作为音频输入,并将所述音频输入(或对应音频数据)提供到处理器110。举例来说,所述多个麦克风112a到112g中的第一麦克风112a可接收第一音频输入,且所述多个麦克风112a到112g中的第二麦克风112b可接收第二音频输入。第一麦克风112a可将第一音频输入提供到处理器110作为第一音频数据,且第二麦克风112b可将第二音频输入作为第二音频数据提供到处理器110。在一些实施方案中,第一音频数据和第二音频数据中的每一者可包含对应时戳。举例来说,第一音频数据可包含指示何时接收到第一音频输入的第一时戳。作为另一实例,第二音频数据可包含指示何时接收到第二音频输入的第二时戳。
处理器110可检测音频数据中的命令。举例来说,处理器110可对第一人108a说出的命令执行语音辨识(例如声学建模或语言建模),以识别与所述命令相关联的服务。作为一个实例说明,处理器110可分析所述命令,以产生所述命令的声学模型。处理器110可将声学模型与命令数据库进行比较,以检测所述音频数据中的命令。
处理器110可基于第一音频数据、第二音频数据或两者来确定人的身份。为了说明,处理器110可使用来自存储在存储器111中的多个身份的声纹识别,基于第一音频数据来确定第一身份。在一些实施方案中,处理器110可基于在第一音频数据中检测到的特定字词(例如口令或通行短语)来确定第一身份。举例来说,存储器111可存储口令(或通行短语)以及对应身份和/或用户简档的表。为了说明,可使用所述口令(或通行短语)来为所述表编索引。处理器110可将特定字词与经编索引的口令(或通行短语)进行比较。响应于特定字词与经编索引的口令(或通行短语)中的一者之间的匹配,处理器110可检索对应身份和/或用户简档。
处理器110可经配置以基于所接收的音频数据来确定与音频源(例如第一人108a)相关联的位置(例如多个座位104a到104g中的座椅)。举例来说,处理器110可将第一时戳与第二时戳进行比较。处理器110可基于比第二时间(对应于第二麦克风112b所产生的第二音频数据)早的第一时间(对应于第一麦克风112a所产生的第一音频数据)来确定音频源(例如第一人108a)处于第一区域106a中的第一座椅104a中。另外或替代地,处理器110可基于第一音频数据和第二音频数据的振幅(例如量值)的比较来确定所述位置。举例来说,处理器110可基于第一音频数据的第一振幅(例如峰值振幅或平均振幅)大于第二音频数据的第二振幅(例如峰值振幅或平均振幅),确定音频源(例如第一人108a)处于第一区域106a中的第一座椅104a中。
处理器110可使用所识别的位置来选择从对应于所述位置(例如第一座椅104a)的特定传感器接收到的振动数据。举例来说,基于所述位置与第一座椅104a相关联,处理器110可选择从第一传感器114a接收到的第一振动数据。处理器110可使用第一振动数据来证实基于第一音频数据、第二音频数据或其组合确定的身份。
为了说明,第一振动数据可包含对应于音频源(例如第一人108a)所产生的语音振动的第一分量(例如语音分量)。另外或替代地,第一振动数据可包含对应于非语音振动的第二分量(例如非语音分量)。处理器110可基于第一音频输入和第一振动数据(例如第一振动数据的第一分量(例如语音分量))来证实所述身份。为了说明,处理器110可将第一音频数据与第一振动数据进行比较,以产生第一相关值。所述相关值可包含第一振动数据与第一音频数据之间的差异或偏差。处理器110可将相关值与阈值进行比较来证实所述身份。处理器110可基于相关值大于或等于阈值而证实所述身份且有条件地授权服务。
在一些实施方案中,处理器110可经配置以对来自第一振动数据的第二分量(例如非语音分量)进行滤波,以产生主要包含第一分量(例如语音分量)的经修改的振动数据。举例来说,处理器110可对第一振动数据进行滤波(例如去除),以去除与对应于非语音内容的频率范围相关联的数据,例如不同于对应于人类语音的一组频率的频率范围。为了说明,处理器110可去除(或滤除)具有高于第一滤波阈值的频率且具有低于第二滤波阈值的频率的噪声振动。另外或替代地,处理器110可基于对应于另一传感器(例如第三传感器114c)的第二振动数据产生经修改的振动数据。举例来说,第三传感器114c可位于共享声学空间102中,使得第三传感器114c检测非语音振动。为了说明,第三传感器114c可位于交通工具的发动机附近以检测发动机振动,位于交通工具的车轮附近以检测道路振动,或两者。处理器110可接收来自第三传感器114c的第三振动数据,且可将第三振动数据从第二振动数据减去,以产生经修改的振动数据。尽管将处理器110描述为产生经修改的振动数据,但在一些实施方案中,第一传感器114a可经配置以产生经修改的振动数据,并将经修改的振动数据提供到处理器110。处理器110可基于经修改的振动数据和第一输入数据来确定相关值。
处理器110可在授权所述服务之后提供所述服务。举例来说,处理器110可经配置以响应于为第一人108a批准所述服务而启动交通工具的发动机。作为另一说明性实例,处理器110可经配置以响应于经由用户接口来自第一人108的输入而启动交通工具的发动机。
在一些实施方案中,处理器110可经配置以进一步基于服务位置数据来授权所述服务。举例来说,处理器110可从存储器111存取与所述服务相关联的服务位置数据。服务位置数据可指示从中人可请求服务且处理器可授权所述服务的共享声学空间的有效位置(例如第一区域106a)。举例来说,处理器110可基于服务位置数据来确定可从所述位置(例如驾驶员位置)授权的服务(例如发动机的点火)。
在一些实施方案中,在说出所述命令之前,可将所述身份提供给处理器110,且处理器110可经配置以基于音频输入来验证所述身份,并基于振动来证实音频。举例来说,处理器110可经配置以检测与第一人108a相关联的密钥卡。所述密钥卡可包含可包含与人(例如第一人108a)相关联的身份代码。处理器110可能够接收所述身份代码,例如通过射频识别(RFID)。处理器可将身份代码与身份简档进行比较,以确定第一人108a的身份。处理器110接着可基于音频数据、振动数据或两者来证实所述身份。
作为系统100的操作的另一实例,坐在第一区域106a中的座椅104b中的第二人108b可独自在共享声学空间102中,且交通工具的发动机可关闭。第二人108b可播放第一人108a说出命令“启动汽车”的录音。多个麦克风112a到112g中的第二麦克风112b可接收对应于第一人108a的录音(“启动汽车”)的第二音频输入。可将第二音频输入提供到处理器110作为第三音频数据。在一些实施方案中,第二传感器114b可经配置以产生第二振动数据。第二振动数据可不包含对应于第二音频输入的第二音频振动分量。第二传感器114b可将第二振动数据提供到处理器110。在第二麦克风112b产生第三音频数据的同时,第二振动数据可能已由第二传感器114b产生。在其它实施方案中,第一传感器114a、第二传感器114或两者可不接收第二振动数据(或第二音频振动分量),因为第一人108a的录音所产生的振动可能太弱而无法被第一传感器114a或第二传感器114检测到。
处理器110可基于第三音频数据来确定第二身份(对应于第一人108a)和第二位置(例如第二座椅104b)。处理器110可基于从第二传感器114b接收到的第二振动数据来证实第二身份。举例来说,处理器110可尝试通过将第三音频数据与第二振动数据(或第二振动数据的缺乏)的比较来证实,以产生第二相关值。处理器110可将第二相关值与阈值进行比较。处理器110可基于第二相关值小于阈值而提供所述服务的拒绝的指示。
在一些实施方案中,系统100可包含触摸垫,其耦合到所述多个传感器114a到114c中的一或多者。所述触摸垫可经配置以激活所述多个传感器114a到114c中的一或多个传感器以接收振动。举例来说,响应于触摸垫检测到接触(例如检测到大于或等于检测阈值的测得电容值),激活所述多个传感器114a到114c中的一或多个传感器。触摸垫可定位成极为接近所述多个传感器114a到114c中的一或多者,或可远离所述多个传感器114a到114c中的一或多者。在一些实施方案中,特定传感器可经配置以经由触摸垫接收振动,例如在人接触(例如触摸)触摸垫中。为了说明,触摸垫可位于交通工具的方向盘上,且特定传感器可位于方向盘中且耦合到触摸垫。
在各种实施方案中,传感器可检测或确定属性(例如,振动和质量)的组合。这可用特定区域(例如,座椅104a)中的单个传感器、多个单一类型的传感器、多个多种类型的传感器、单一类型的传感器的阵列来实现。举例来说,当第一传感器114a位于第一座椅104a中时,第一传感器114a可检测第一振动和第一质量。
在一些实施方案中,处理器110可基于所述命令或命令类型来进一步授权所述服务。处理器110可基于存储在身份简档中的命令特权来授权所述服务。举例来说,第三人108c可为交通工具的拥有者,且第三人108c的身份简档的命令特权可独立于第三人108c的位置而授权第三人108c进行服务。举例来说,处理器110可授权第三人108c进行否则可能对所述位置(例如第二区域106b或座椅104e)不可用的服务。为了说明,当所述服务否则可限于特定位置(例如第一区域106a)时,处理器110可为第三人108c授权服务(例如解锁门)。
在其它实施方案中,共享声学空间102可包含或对应于非运输共享声学空间,例如会议室。办公室可在第一区域中包含第一人108a,且在第二区域中包含第二人108b。第一人可具有锁门、开关灯、关遮光帘等的权利。举例来说,第一麦克风可接收第一人108a的音频输入,且对应于第一区域的第一传感器可检测振动。处理器110可从第一麦克风接收音频数据,且识别第一人108a。处理器110可从第一传感器接收振动数据,且证实身份。处理器110可基于第一人108a的音频输入来授权锁闭到办公室的门。
在一些实施方案中,系统100可经配置以从远程数据库检索身份简档。另外或替代地,系统100可经配置以响应于经由用户接口接收到请求而创建身份简档。举例来说,处理器110可经配置以经由用户接口接收用户输入,且可经配置以经由系统100的一或多个传感器来接收身份数据。所述身份数据可包含或对应于声纹模型、音频输入、振动、图像输入、重量输入、重量分布模式、压力分布模式或其组合。另外,处理器110可经配置以响应于用户输入,经由系统100的一或多个传感器来接收验证数据。
所述验证数据可包含或对应于振动、图像输入、重量输入、人的重量分布模式,或其组合。处理器110可经配置以将所述身份数据和所述验证数据存储在存储器111处。为了说明,处理器110可接收来自第一人108a的请求,例如第一人说出“创建简档”。处理器110可经由用户接口来提示第一人说出各种短语。处理器110可接收第一人108a的多个音频输入(例如各种短语),以作为身份数据存储在存储器111处。处理器110也可从多个重量传感器(例如多个第二重量传感器)接收第一人108a的重量分布模式数据。处理器110可基于重量分布模式数据来产生重量分布信息,并存储所述重量分布信息。处理器110可创建身份简档,并将身份数据和验证数据存储在存储器111处。在其它实施方案中,处理器110可经由无线通信将身份简档发送到远程数据库以供存储。在一些实施方案中,所述身份数据可包含振动简档信息。举例来说,处理器110可接收对应于音频输入(例如各种短语)的振动。处理器110可基于所述振动而确定一或多个振动特性,且处理器110可将一或多个振动特性作为振动简档信息存储在存储器111处。
所揭示的方面中的至少一者所提供的一个优点是当使用基于话音的识别和验证来在共享声学空间中提供重要和受限服务时,安全性和安全的增加。举例来说,基于语音辨识来确定身份以及基于振动来证实所述身份可仅提供优于单独的基于话音的辨识的安全性和安全的增加。另外,进一步基于身份简档、位置或这两者来授权所述服务可进一步增加在共享声学空间中提供重要和受限服务时的安全性和安全。
图2说明包含图1的共享声学空间102的系统200的特定实例。系统200包含多个重量传感器214a到214c,以及多个扩音器218a到218g。系统200还可包含多个传感器114a到114c(未图示)。系统200可经配置以基于所述多个重量传感器214a到214c中的一或多者来有条件地授权服务。在一些实施方案中,所述系统可在基于多个传感器114a到114c中的一者所产生的数据的身份的第一次证实(如参考图1的系统100所描述)以及基于重量传感器214a到214c中的至少一者所产生的重量数据的所述身份的第二次证实之后,有条件地授权所述服务,如本文所描述。系统200可经由遍及共享声学空间102定位的所述多个扩音器218a到218h来提供所述服务。
所述多个重量传感器214a到214c可耦合到处理器110。每一重量传感器可经配置以检测重量值(例如接收重量输入)。每一重量传感器还可经配置以将对应于所述重量值的重量数据提供到处理器110。所述多个重量传感器214a到214c可分布遍及共享声学空间102。举例来说,重量传感器可位于座椅中、座椅靠背中、头枕中、扶手中、底板中。在一些实施方案中,多个重量传感器214a到214c中的一或多者可配置成阵列,例如第一重量传感器214a和第二重量传感器214b。在其它实施方案中,共享声学空间102的每一座椅可具有一或多个重量传感器,其经配置以捕获重量输入和重量分布模式。
重量传感器阵列或群组所检测到的重量值可指示重量分布。举例来说,第一座椅104a可与位于座椅中的第一重量传感器214a和位于椅背中的第二重量传感器214b相关联。第一重量传感器可检测第一重量值,且第二214a传感器可检测第二重量值,其可指示就座重量分布。作为另一实例,第一座椅104a可与位于底板中的第一重量传感器214a和位于底板中的第二重量传感器214b相关联。第一重量传感器可检测第一重量值,且第二重量传感器214b可检测第二重量值,其可指示鞋码。
在一些实施方案中,多个重量传感器214a到214c中的一或多者可包含或对应于经配置以检测压力输入的压力传感器。举例来说,第二重量传感器214b可为压力传感器。压力传感器可将压力数据(例如压力输入)提供到处理器110。作为另一实例,第一重量传感器214a的第一重量值和第二重量传感器214b的第二重量值可用于确定压力值或压力分布。
处理器110可经配置以基于第一重量值和第二重量值(例如重量分布数据)来确定重量分布模式。在其它实施方案中,处理器110可经配置以从所述多个重量传感器214a到214c接收重量分布模式。在一些实施方案中,处理器110可经配置以基于重量数据或压力数据来确定压力值。另外或替代地,处理器110可经配置以基于重量数据或压力数据来确定压力分布模式。在其它实施方案中,当所述多个重量传感器214a到214c对应于压力传感器时,处理器110可经配置以从所述多个重量传感器214a到214c接收压力分布模式。
处理器110可经配置以将重量值和与人的身份相关联的所存储的重量信息进行比较来产生相关值。处理器110可经配置以响应于所述相关值大于或等于阈值来证实人的身份。处理器110可经配置以响应于相关值小于所述阈值而不证实所述人。在一些实施方案中,处理器110可能够最佳基于来自多个重量传感器214a到214c的重量输入而计算鞋码。
另外或替代地,处理器110可经配置以将重量分布模式和与人的身份相关联的所存储的重量分布模式信息进行比较以产生相关值。处理器110可经配置以响应于所述相关值大于或等于阈值来证实所述人。处理器110可经配置以响应于相关值小于所述阈值而不证实所述人。
在系统200的操作期间,坐在驾驶员座椅(例如第一区域106a的最左边座椅)中的人可说出命令,例如“启动汽车”。所述多个麦克风112a到112g中的多个麦克风可接收所述命令作为音频输入,并将所述音频输入(或对应音频数据)提供到处理器110。举例来说,所述多个麦克风112a到112g中的第一麦克风112a可接收第一音频输入,且所述多个麦克风112a到112g中的第二麦克风112b可接收第二音频输入。第一麦克风112a可将第一音频输入提供到处理器110作为第一音频数据,且第二麦克风112b可将第二音频输入作为第二音频数据提供到处理器110。
处理器110可检测音频数据中的命令。举例来说,处理器110可对第一人108a说出的命令执行语音辨识(例如声学建模或语言建模),以识别与所述命令相关联的服务。另外,处理器110可基于第一音频数据、第二音频数据或这两者来确定人的身份和位置,如参考图1的系统100所描述。
处理器110可使用所识别的位置来选择从对应于所述位置(例如驾驶员座椅)的特定重量传感器接收到的重量数据。举例来说,基于所述位置与驾驶员座椅相关联,处理器110可选择从第一重量传感器214a接收到的第一重量数据。处理器110可使用第一重量数据来证实基于第一音频数据、第二音频数据或其组合确定的身份。
处理器110可基于第一音频输入和第一重量数据来证实所述身份。如果第一重量传感器214a是第一重量传感器,且第一重量输入数据是重量数据,那么处理器110可存取与身份相关联的身份简档。所述身份简档可包含重量信息、重量分布模式信息或其组合。处理器110可将重量数据与重量信息、重量分布模式信息或其组合行比较,以产生相关值。处理器110可基于相关值大于或等于阈值而有条件地授权交通工具的发动机的点火。
在一些实施方案中,处理器110可基于重量输入来确定重量分布模式。重量分布模式可包含或对应于个别重量值、总重量、平均重量,作为非限制性实例。在一些实施方案中,重量分布模式可定义区域。举例来说,位于底板中的一组重量传感器可指示鞋码。处理器110可存取与身份相关联的身份简档,所述身份简档包含重量分布模式信息。处理器110可将重量分布模式与重量分布模式信息进行比较,以产生相关值。所述相关值可为差、均值、偏差,作为非限制性实例。处理器110可基于相关值大于或等于阈值而有条件地授权交通工具的发动机的点火。
处理器110可在授权所述服务之后提供所述服务。举例来说,处理器110可经配置以响应于为第一人108a批准所述服务而启动交通工具的发动机。在一些实施方案中,多个扩音器218a到218h可布置成若干不同配置中的任一者,例如图2中所说明的7.1环绕声系统布置。多个扩音器218a到218h可以通信方式耦合到处理器110。在其中处理器远离共享声学空间102的一些实施方案中,所述多个扩音器218a到218h可通过无线通信耦合,如上文所描述。所述多个扩音器218a到218h可经配置以提供服务的拒绝的指示。
另外或替代地,所述多个扩音器218a到218h可经配置以提供一或多个服务,例如个人化音频服务。举例来说,处理器110可经配置以产生音频输出,以供所述多个扩音器218a到218g中的一或多者再现。为了说明,处理器可经由扩音器218e和218f为坐在第二区域106b中的人输出音乐。在其它实施方案中,所述服务可包含或对应于驾驶员通知。为了说明,处理器110可经由所述多个扩音器218a到218d来输出驾驶员通知,例如指示危害源检测系统(例如盲点检测系统)检测到的危害源的性质和方向的语音或声音。
在一些实施方案中,位于每一排中的扩音器对(例如第一区域106a(例如第一排)中的扩音器218a和218b可为音乐播放器提供多声道(即,立体声)输出。在其它实施方案中,所述多个扩音器218a到218h可操作以为音乐、电影声轨或其它环绕声媒体提供环绕声。在一些实施方案中,处理器110可平衡在电话会议期间从另一方接收到的音频输入,来指示所述音频输入的性质和方向。举例来说,处理器110可经由扩音器218c和218e提供音频输出,以指示音频输入的性质(例如来源于左后放的音频)和方向(例如指向右后方的音频)。不管共享声学空间102内的麦克风112a到112g的特定位置或配置如何,处理器110可用以通过获取从交通工具的任何一部分产生的声音(在麦克风112a到112g中的一或多者处作为输入接收),并在交通工具的其它部分中的扩音器218a到2184h中的一者、集合或子集上再现这些声音来平衡跨越交通工具的声音,类似于多输入/多输出公用地址系统。举例来说,麦克风112e和112f可接收来自第三区域106c中的第四人108d的音频输入。处理器110可经由第一区域106a中的扩音器(例如扩音器218a、218b和218g)再现音频输入作为音频输出。
在一些实施方案中,处理器110可在授权服务之前,使用多种证实方法来证实所述身份。举例来说,处理器110可基于基于数据的第一证实(如参考图1的系统100所描述)、基于重量数据的第二证实、基于音频数据的第三证实或另一证实方法中的两个或更多个的组合来证实所述身份,作为说明性非限制性实例。使用多种证实方法可提供所述所确定的身份为正确的较多置信度和安全性。
所揭示的方面中的至少一者所提供的一个优点是当使用基于话音的识别和验证来在共享声学空间中提供重要和受限服务时,安全性和安全的增加。举例来说,基于语音辨识确定身份以及使用基于重量的生物计量信息来证实所述身份可提供优于单独的基于话音的辨识的安全性和安全的增加。另外,进一步基于身份简档、位置或这两者来授权所述服务可进一步增加在共享声学空间中提供重要和受限服务时的安全性和安全。
图3说明图1和2的共享声学空间102中的系统300的特定实例。明确地说,系统300可使用来自多个力传感器314a到314d结合各种其它传感器中的至少一者的输入来实现服务的有条件批准,如本文所述。所述多个力传感器314a到314d可包含或对应于图1的多个传感器114a到114c、图2的多个重量传感器214a到214c,或其组合。系统300还可包含图1的多个麦克风112a到112g、图2的多个扩音器218a到218h,或其组合,为了清楚起见,图3中未图示其所有。
系统300可包含多个图像捕获装置322a到322d,例如多个相机。多个图像捕获装置322a到322d可耦合到处理器110。所述多个图像捕获装置322a到322d中的每一图像捕获装置可经配置以捕获一图像、多个图像(例如视频流)或其组合。在一些实施方案中,特定图像捕获装置(例如第一图像捕获装置322a)可经配置以捕获共享声学空间102内的特定位置(例如特定座椅)处的人的面部的至少一个图像。
处理器110可经配置以根据如参考图1的系统100所描述的数据来验证(例如证实)人的身份。处理器110可进一步经配置以基于从多个图像捕获装置322a到322中的特定图像捕获装置接收到的图像数据来验证(例如证实)所述身份。所述身份可包含或对应于所述人的简档图像数据。举例来说,处理器110可经配置以产生简档图像数据与从特定图像捕获装置接收到的图像数据之间的图像相关值。处理器110可经配置以基于所述图像相关值满足阈值而验证(核实)所述身份。举例来说,如果所述图像相关值大于或等于所述阈值,那么所述图像相关值可满足所述阈值。
另外或替代地,处理器110可经配置以识别示意动作。举例来说,图像捕获裝置322a到322d可经配置以捕获所述位置处的人的示意动作的图像。处理器110可经配置以执行图像分段、运动检测、视频跟踪或其组合来识别示意动作。处理器110可经配置以使所述示意动作和与所述身份相关联的所存储的示意动作数据(例如存储于存储器111中(或远程数据库处)的示意动作数据)匹配或相关。如果处理器110检测到的示意动作对应于(例如匹配)示意动作数据,那么处理器110可确定所述身份得以核实。
在系统300的操作期间,坐在驾驶员座椅(例如第一区域106a的最左边座椅)中的人可说出命令,例如“启动汽车”。所述多个麦克风112a到112g中的多个麦克风可接收所述命令作为音频输入,并将所述音频输入(或对应音频数据)提供到处理器110。举例来说,所述多个麦克风112a到112g中的第一麦克风112a可接收第一音频输入,且所述多个麦克风112a到112g中的第二麦克风112b可接收第二音频输入。第一麦克风112a可将第一音频输入提供到处理器110作为第一音频数据,且第二麦克风112b可将第二音频输入作为第二音频数据提供到处理器110。
处理器110可检测音频数据中的命令。举例来说,处理器110可对第一人108a说出的命令执行语音辨识(例如声学建模或语言建模),以识别与所述命令相关联的服务。另外,处理器110可基于第一音频数据、第二音频数据或这两者来确定人的身份和位置,如参考图1的系统100所描述。
处理器110可使用所识别的位置来选择从对应于所述位置(例如驾驶员座椅)的特定图像捕获装置接收到的图像数据。举例来说,基于所述位置与驾驶员座椅相关联,处理器110可选择从第一图像捕获装置322a接收到的第一图像捕获数据。处理器110可使用所述第一图像捕获数据来证实所述身份。响应于基于所述第一图像捕获数据来证实所述身份,处理器110可授权所请求的服务。
在一些实施方案中,处理器110可在授权服务之前,使用多种证实方法来证实所述身份。举例来说,处理器110可基于基于数据的第一证实、基于重量数据的第二证实、基于音频数据的第三证实、基于图像数据的第四证实或另一证实方法中的两个或更多个的组合来证实身份,作为说明性非限制性实例。在一些实施方案中,其它证实方法的证实可包含输入序列(例如动作序列)。使用多种证实方法可提供所述所确定的身份为正确的较多置信度和安全性。
在一些实施方案中,身份的确定和所述身份的证实可并入到输入序列(例如动作序列)中。在此些实施方案中,用户(例如人)的身份的证实可不发生,除非处理器110以正确次序接收到每一输入。举例来说,所述输入序列,处理器110在第一时间响应于制动踏板被压下而接收来自制动传感器的制动数据。在接收到指示制动踏板被压下的制动数据之后,所述输入序列可包含处理器110可包含处理器110从多个麦克风112a到112g中的一者接收指示特定字词或声音的音频数据。处理器110接着可基于所述音频数据来确定用户的位置,如参考图1的系统100所描述。举例来说,处理器110可确定相对于共享声学空间102的三维空间中的音频输入的来源(例如人)的位置。在确定位置之后,处理器110可从对应于所述位置的特定图像捕获装置接收图像捕获数据。所述人可执行所述特定图像捕获装置所捕获的示意动作。处理器110可基于所述图像捕获数据来识别示意动作(例如用户眨他或她的右眼)。处理器110可对所述命令或短语执行声纹识别,以确定与用户相关联的身份简档。处理器110可确定所捕获的示意动作是否和与对应于所述身份的用户简档相关联的所存储的示意动作匹配。如果处理器110确定所述示意动作与所存储的示意动作匹配,那么完成所述输入序列且身份得以证实。
在一些实施方案中,一或多个视频显示器(未图示)也可集成到共享声学空间102中。举例来说,一或多个显示器可并入到仪表板(为了第一区域106a中的人)、可并入到第一和第二排座椅的头枕的背侧(为了第二和第三排的人)、可从天花板垂下(特别为了中心排的中间的人),或其组合。另外或替代地,包含于共享声学空间102中的一或多个座位可配备有触觉输入装置(未图示)。举例来说,触觉输入装置可包含键盘、小键盘、游戏垫、跟踪球或触摸垫,作为说明性非限制性实例。触觉输入装置可使处理器110能够向每个人提供与跨越各种媒体和感觉的特征和能力的增强型交互。
所揭示的方面中的至少一者所提供的一个优点是当使用基于话音的识别和验证来在共享声学空间中提供重要和受限服务时,安全性和安全的增加。举例来说,基于语音辨识确定身份以及使用面部辨识、输入序列或这两者来证实所述身份可提供优于单独的基于话音的辨识的安全性和安全的增加。另外,进一步基于身份简档、位置或这两者来授权所述服务可进一步增加在共享声学空间中提供重要和受限服务时的安全性和安全。
图4说明有条件地授权服务以供执行的方法400的特定实例。方法400可由上文所述的处理器中的一或多者(例如图1到3的处理器110)执行。在特定实施方案中,方法400可由上文所述的系统中的一或多者(例如图1的系统100、图3的系统200、图3的系统300或其组合)执行。
方法400包含在402处,在处理器处从与声学空间相关联的麦克风接收由所述麦克风基于人所产生的音频输入而产生的音频数据。举例来说,图1到3的处理器110可从所述多个麦克风112a到112g中的第一麦克风112a接收音频数据,如参看图1所描述。
方法400还包含在404处,在处理器处从位于声学空间内的传感器接收由传感器基于人所产生的振动而产生的振动数据。举例来说,处理器110可从如参看图1所描述的多个传感器114a到114c中的第一传感器114a或从如参看图3所描述的多个力传感器314a到314d中的第一力传感器314a接收振动数据。
方法400进一步包含在406处,通过所述处理器有条件地授权所述人所请求的服务的执行,基于音频数据和振动数据来有条件地授权所述服务。举例来说,处理器110可基于第一音频数据和振动数据来有条件地授权交通工具的发动机的点火,例如参看图1所描述。作为另一实例,所述服务可包含解锁交通工具、经由与人相关联的通信装置联系应急服务提供商,提供个人化服务。
在一些实施方案中,方法400可包含基于音频数据来确定人的身份。举例来说,处理器110可基于音频数据来确定第一人108a的身份,如参看图1所描述。方法400还可包含基于振动数据来验证所述身份。举例来说,处理器110可基于振动数据来验证第一音频输入,如参看图1所描述。在一些实施方案中,可响应于所述身份的验证来授权服务的执行。举例来说,可响应于所述身份的验证来授权服务的执行,例如发动机的点火。在批准所述服务的执行之后,可响应于另一输入(例如用户输入)来提供(例如执行)所述服务,如参看图1所描述。
在各种实施方案中,振动数据可包含噪声分量和至少对应于人所产生的音频输入的音频振动分量。举例来说,振动数据可包含噪声分量(例如发动机振动、道路振动等),以及对应于音频输入的音频振动分量,如参看图1所描述。方法400可包含对来自振动数据的噪声分量进行滤波,以隔离音频振动分量。举例来说,处理器110可对从第一传感器114a接收到的振动数据进行滤波,以衰减或去除在对应于人类语音的频率范围之外的噪声振动(例如噪声分量)。对振动数据进行滤波以去除噪声分量可产生(例如隔离)音频振动分量,如参看图1所描述。方法400还可包含将音频数据与音频振动分量进行比较以产生相关值。举例来说,处理器110可将音频数据与音频振动分量进行比较以创建相关值,如参看图1所描述。方法400可进一步包含将所述相关值与阈值进行比较。可响应于所述相关值大于或等于阈值而有条件地授权所述服务。举例来说,处理器110可将相关值与阈值进行比较,如参看图1所描述。
在一些实施方案中,方法400可包含从第二传感器接收第二振动数据。第二振动数据可与噪声分量相关联。举例来说,处理器110可接收与噪声分量相关联的第二振动数据,如参看图1所描述。方法400还包含将第二振动数据从振动数据减去,以产生(例如隔离)音频振动分量。举例来说,处理器110可将第二振动数据从振动数据减去,以产生音频振动分量。
在一些实施方案中,方法400可包含从重量传感器接收重量数据。举例来说,处理器110可从所述多个重量传感器214a到214c中的第一重量传感器214a接收重量数据,如参看图2所描述。方法400可包含基于重量数据来确定重量值。举例来说,处理器110可基于重量输入产生重量值,如参看图2所描述。方法400可包含将重量值和与人的身份相关联的所存储的重量信息进行比较,以产生相关值。举例来说,处理器110可将重量值和与第一人108a的身份相关联的所存储的重量信息进行比较,如参看图2所描述。在一些实施方案中,可基于所述音频数据来确定所述身份。方法400进一步还可包含响应于所述相关值大于或等于阈值来验证所述人。为了说明,处理器110可响应于所述相关值满足阈值(例如响应于相关值大于或等于阈值)而验证第一人108a。
在一些实施方案中,方法400可包含从重量传感器阵列接收重量数据。举例来说,处理器110可从配置成阵列的图2的多个重量传感器214a到214c接收多个重量输入。方法400可包含基于重量数据产生重量分布模式数据。方法400可包含将重量分布模式数据和与人的身份相关联的所存储的重量分布模式信息进行比较,以产生相关值。举例来说,处理器110可将重量分布模式数据和与存储于存储器111中的第一人108a的身份简档相关联的所存储的重量分布模式信息进行比较,如参看图2所描述。在一些实施方案中,可基于所述音频数据来确定所述身份。举例来说,处理器110可确定音频输入的来源的身份是第一人108a的身份,如参看图2所描述。方法400可进一步包含响应于所述相关值大于或等于阈值来验证所述人。
在一些实施方案中,方法400可包含从一或多个传感器接收数据输入序列。举例来说,处理器110可从一或多个传感器接收所述数据输入序列。在各种实施方案中,所述数据输入序列包含音频数据、振动数据、图像数据、制动传感器数据、加速器传感器数据、无线电传感器数据或其组合,作为说明性非限制性实例。有条件地授权服务的执行可进一步基于所述数据输入序列。举例来说,处理器110可进一步基于处理器110以特定次序接收到所述数据输入序列而有条件地授权所述服务。
在一些实施方案中,方法400可包含在第一时间从所述一或多个传感器中的第一传感器接收(特定数据输入序列中的)第一数据输入。在一些实施方案中,第一传感器可包含制动传感器。方法400可包含在第二时间,在所述一或多个传感器中的第二传感器处接收(特定数据输入序列中的)第二数据输入。所述第二时间可在所述第一时间之后发生。在一些实施方案中,第二传感器可包含第一麦克风112a。方法400可包含在第三时间,在所述一或多个传感器中的第三传感器处接收第三数据输入。所述第三时间可在所述第二时间之后发生。在一些实施方案中,第三传感器可包含第一图像捕获装置324a。
在一些实施方案中,方法400包含在有条件地授权所述服务的执行之后,存取与所述人的身份相关联的驾驶模式信息。在一些实施方案中,可基于所述音频数据来确定所述身份。如参看图2所描述,处理器110可从存储器111或从远程数据库存取所述驾驶模式信息,例如加速度的平均速率。为了说明,处理器110可从加速计接收加速度数据,且可基于所述加速度数据来确定驾驶模式特性。在一些实施方案中,可基于加速度数据来确定加速度的平均速率。
方法400可包含将驾驶模式特性与驾驶模式信息进行比较,以产生相关值。举例来说,处理器110可将来自加速度数据的加速度的平均速率与来自驾驶模式信息的加速度的平均速率进行比较。为了说明,处理器110可产生来自加速度数据的加速度的平均速率与来自驾驶模式信息的加速度的平均速率之间的差。方法400可包含响应于相关值大于或等于阈值,有条件地授权第二服务的执行。举例来说,处理器110可经由用户接口提供异常或不安全驾驶的指示,例如参看图2所描述。
作为另一实例,驾驶模式特性可包含制动的平均速率或加速的平均速率,例如参看图3所描述。第二服务可包含经由用户接口提供异常驾驶的指示。
在一些实施方案中,方法400可包含经由用户接口接收来自所述人的创建身份简档的请求。举例来说,处理器110可经由用户接口接收来自第一人108a的创建身份简档的请求,例如参看图3所描述。方法400可包含在接收到所述请求之后,接收与所述人的声纹模型相关联的身份数据,以及与所述人的重量分布模式数据相关联的验证数据。方法400可包含联合所述人的身份简档存储身份数据和验证数据。为了说明,身份简档可存储在远程服务器(或远程数据库)处的存储器111处,例如参看图3所描述。
通过基于音频数据和振动数据有条件地授权服务的执行(例如发动机的点火),方法400实现重要或受限服务的基于话音的识别和验证的利用。因此,减少例如通过播放记录的话音而实现的错误检测和欺骗的问题。因此,方法400实现为基于话音的识别和验证提供增加的安全性和安全。
图5说明有条件地授权服务的执行的方法500的特定实例。方法500可由上文所述的处理器中的一或多者(例如图1到3的处理器110)执行。在特定实施方案中,方法500可由上文所述的系统中的一或多者(例如图1的系统100、图3的系统200、图3的系统300或其组合)执行。
方法500可包含在502处在处理器处接收激活输入。举例来说,图1到3的处理器110可接收来自耦合到图1的第一传感器114a的触摸垫的激活输入。
方法500还可包含在504处,在处理器处接收来自麦克风的音频数据。举例来说,参看图1,处理器110可从所述多个麦克风112a到112g中的第一麦克风112a接收第一音频数据。
方法500可进一步包含在506处,在处理器处接收来自传感器的力数据。举例来说,处理器110可接收来自所述多个传感器114a到114c中的第一传感器114a的力数据(例如振动数据),如参看图1所描述。作为另一实例,处理器110可接收来自图2的第一重量传感器214a的重量数据。
方法500还可包含在508处,通过处理器来基于音频数据、力数据(例如输入、重量输入或这两者),或其组合有条件地授权服务的执行。举例来说,处理器110可基于第一音频数据和振动数据来有条件地授权交通工具的发动机的点火,例如参看图1到3所描述。为了说明,处理器110可使用基于话音的识别和第一音频数据来确定第一人108a的身份。处理器110可基于将音频数据与振动数据进行比较,通过将重量数据与为第一人108a存储的重量信息进行比较,或其组合,来验证(或证实)第一人108a的身份作为音频输入的说出者,作为说明性非限制性实例。
方法500可进一步包含在510处提供所述服务。举例来说,处理器110可在所述服务的执行的有条件授权之后,自动提供所述服务(例如发动机的点火、解锁所述门、使无线电静音等)。作为另一实例,有时在所述批准之后,处理器110可响应于用户输入而提供所述服务。
通过基于确定身份和证实所述身份有条件地授权所述服务,方法500实现重要或受限服务的基于话音的识别和验证的利用。因此,减少例如通过播放记录的话音而实现的错误检测和欺骗的问题。因此,方法500实现为基于话音的识别和验证提供增加的安全性和安全。
图6是说明其中本文所揭示的各种实施方案的方面可利用或实施(至少部分地)的无线通信装置602的一个配置的框图。图6中说明的无线通信装置602可为本文所述的电子装置中的一或多者的实例。无线通信装置602可包含应用程序处理器621。应用程序处理器621通常处理指令(例如,运行程序)以执行无线通信装置602上的功能。应用程序处理器621可耦合到音频译码器/解码器(编解码器)619。
音频编解码器619可用于译码音频信号、解码音频信号,或其组合。音频编解码器619可耦合到至少一个扬声器611、耳机613、输出插孔615、至少一个麦克风617,或其组合。扬声器611可包含一或多个将电或电子信号转换为声学信号的电声转换器。举例来说,扬声器611可用于播放音乐或输出免提电话交谈等。耳机613可为另一扬声器或电声换能器,其可用于向用户输出声信号(例如语音信号)。举例来说,可使用耳机613使得仅用户可确实地听到声学信号。输出插孔615可用于将其它装置(例如头戴式耳机)耦合到无线通信装置602以用于输出音频。扬声器611、耳机613、输出插孔615或其组合可通常用于输出来自音频编解码器619的音频信号。至少一个麦克风617可为将声学信号(例如用户的话音)转换为提供到音频编解码器619的电或电子信号的声电转换器。
应用程序处理器621还可耦合到电力管理电路694。电力管理电路694的一个实例为电力管理集成电路(PMIC),其可用于管理无线通信装置602的电力消耗。电力管理电路694可耦合到电池696。电池696可通常将电能提供到无线通信装置602。举例来说,电池696、电力管理电路694或其组合可耦合到包含于无线通信装置602中的元件中的至少一者。
应用程序处理器621可耦合到至少一个输入装置698以用于接收输入。输入装置698的实例包含红外传感器、图像传感器、加速计、触摸传感器、小键盘等。输入装置698可允许用户与无线通信装置602交互。应用程序处理器621还可耦合到一或多个输出装置601。输出装置601的实例包含打印机、投影仪、屏幕、触觉裝置等。输出装置601可允许无线通信装置602产生可由用户体验的输出。
应用程序处理器621可耦合到应用程序存储器603。应用程序存储器603可为能够存储电子信息的任何电子装置。应用程序存储器603的实例包含双数据速率同步动态随机存取存储器(DDRAM)、同步动态随机存取存储器(SDRAM)、快闪存储器等。应用程序存储器603可为应用程序处理器621提供存储。举例来说,应用程序存储器603可存储用于在应用程序处理器621上运行的程序或其组合的作用的数据、指令或其组合。
应用程序处理器621可耦合到显示器控制器605,所述显示器控制器又可耦合到显示器607。显示器控制器605可为用于在显示器607上产生图像的硬件块。举例来说,显示器控制器605可将来自应用程序处理器621的指令、数据或其组合转变为可在显示器607上呈现的图像。显示器607的实例包含液晶显示器(LCD)面板、发光二极管(LED)面板、阴极射线管(CRT)显示器、等离子显示器等。
应用程序处理器621可耦合到基带处理器623。基带处理器623通常处理通信信号。举例来说,基带处理器623可对接收到的信号进行解调、解码或其组合。另外或替代地,基带处理器623可对信号进行编码、调制或其组合,以准备好发射。
基带处理器623可耦合到基带存储器609。基带存储器609可为能够存储电子信息的任何电子装置,例如SDRAM、DDRAM、快闪存储器等。基带处理器623可从基带存储器609读取信息(例如指令、数据或其组合),将信息写入到基带存储器609,或其组合。另外或替代地,基带处理器623可使用存储在基带存储器609中的指令、数据或其组合来执行通信操作。
基带处理器623可耦合到射频(RF)收发器625。RF收发器625可耦合到功率放大器627以及一或多个天线629。RF收发器625可发射、接收或其组合射频信号。举例来说,RF收发器625可使用功率放大器627和至少一个天线629发射RF信号。RF收发器625还可使用一或多个天线629接收RF信号。
另外,本文所揭示的各种实施方案可包括电子装置或“计算机”及其相关联组件的组件;本身可为较大、较全面电子装置的组件;或可经扩展以包含电子装置的关于存储器、处理、存储、通信等的特征。同样地,各种此类实施方案还可包括具有计算机可读指令的计算机可读媒体。
参看图7,描绘无线通信装置的特定说明性实施方案,且大体表示为700。装置700包含处理器710,例如,耦合到存储器732的数位信号处理器。装置700或其组件可包含或对应于图1的系统100、图2的装置200、图3的装置300、图1到3的处理器110,或其组件。
存储器732,例如非暂时性计算机可读媒体(例如计算机可读存储装置),可包含身份简档760和指令768。指令768可由处理器710执行。举例来说,存储器732可包含或对应于图1到3的存储器111。身份简档760可包含身份数据762。举例来说,身份数据762可包含或对应于参考图1到3所描述的身份数据。身份简档760可包含验证数据764。举例来说,验证数据764可包含或对应于参考图1到3描述的验证数据。
处理器710可经配置以执行存储于存储器732中的软件(例如一或多个指令768的程序)。举例来说,处理器710可经配置以根据图4的方法400、图5的方法500或其组合来操作。为了说明,处理器710可经配置以执行指令768,其致使处理器710验证由人产生且在与声学空间相关联的麦克风处接收到的音频输入,基于所述人所产生的振动来验证所述音频输入,在位于声学空间内的传感器处接收所述振动。处理器710可经配置以执行指令768,其致使处理器710有条件地授权所述人所请求的服务的执行,其中基于音频输入和振动来有条件地授权所述服务。
作为另一实例,指令768可进一步致使所述处理器在所述服务的执行之后,将第二振动与第二音频输入进行比较,以产生相关值。指令768可进一步致使所述处理器响应于确定所述相关值小于阈值而提供第二服务的拒绝的指示。
图7还展示耦合到处理器710且耦合到显示器728的显示控制器726。译码器/解码器(编解码器)734也可耦合到处理器710。扬声器736和麦克风738可耦合到编码解码器734。扬声器736可包含或对应于图2和3的多个扩音器218a到218h中的一或多者。麦克风738可包含或对应于图1到3的多个麦克风112a到112g中的一或多者。
图7还指示无线接口740可耦合到处理器710且耦合到天线742。举例来说,无线接口740可经由收发器741耦合到天线742。收发器741可包含发射器、接收器或这两者。
在一些实施方案中,处理器710、显示器控制器726、存储器732、编解码器734、无线接口740和收发器741包含于封装内系统或芯片上系统装置722中。在特定实施方案中,输入装置730和电力供应器744耦合到芯片上系统装置722。此外,在另一特定实施方案中,如图7中所示,显示器728、输入装置730、扬声器736、麦克风738、天线742和电力供应器744在芯片上系统装置722外部。然而,显示器728、输入装置730、扬声器736、麦克风738、天线742和电力供应器744中的每一者可耦合到芯片上系统装置722的组件,例如接口或控制器。
电子装置700的各种组件可通过一或多个总线耦合在一起,所述总线可包含电力总线、控制信号总线、状态信号总线、数据总线等。举例来说,所述各种总线可将处理器710和存储器732耦合在一起。
结合图1到7的所描述的方面中的一或多者,揭示一种可包含用于存储与可用的服务相关联的数据的装置的系统。举例来说,所述用于存储数据的装置可包含或对应于图1的存储器111、图6的应用程序存储器603、图6的基带存储器609、图7的存储器732,经配置以检测振动的一或多个其它结构、裝置或电路,或其任何组合。
所述系统还可包含用于接收人所产生的音频输入且基于所述音频输入来产生音频数据的装置,所述用于接收的装置与声学空间相关联。举例来说,所述用于接收音频输入的装置可包含或对应于图1到3的多个麦克风112a到112g中的一或多者、经配置以将接收到的来自模拟波形的音频信号转换为包含数字音频样本的数字信号(例如ADC)的其它设备,一或多个经配置以接收音频输入的其它麦克风、换能器、结构、裝置或电路,或其任何组合。
所述系统可包含用于检测人所产生的振动且基于所述振动而产生振动数据的装置,所述用于检测的装置位于声学空间内。举例来说,所述用于检测振动的装置可包含或对应于图1的多个传感器114a到114c中的一或多者、图2的多个重量传感器214a到214c中的一或多者、图3的多个力传感器314a到314d中的一或多者、经配置以检测振动的一或多个其它结构、裝置或电路,或其任何组合。
所述系统可进一步包含用于有条件地授权所述人所请求的服务的执行的装置,基于音频数据和振动数据来有条件地授权所述服务,其中所述用于有条件地授权的装置耦合到所述用于存储数据的装置、所述用于接收的装置和所述用于检测的装置。举例来说,所述用于有条件地授权的装置可包含或对应于图1到3的处理器110;图6的应用程序处理器621;图6的基带处理器;经编程以执行图7的指令768的处理器710;经配置以基于音频输入和振动有条件地授权服务的一或多个其它结构、裝置或电路,或其任何组合。
另外或替代地,在一些实施方案中,所述系统可包含用于接收力输入(例如输入)的装置。举例来说,所述用于接收力输入的装置可包含或对应于图1的多个传感器114a到114c中的一或多者、图2的多个重量传感器214a到214c中的一或多者、图3的多个力传感器314a到314d中的一或多者、经配置以接收力输入(例如输入)的一或多个其它结构、裝置或电路,或其任何组合。
所揭示的实施方案中的一或多者可在系统或设备(例如电子装置700)中实施,所述系统或设备可包含通信装置、固定位置数据单元、移动位置数据单元、移动电话、蜂窝式电话、卫星电话、计算机、平板、便携式计算机、显示装置、媒体播放器或桌上型计算机。或者或另外,电子装置700可包含:机顶盒、娱乐单元、导航装置、个人数字助理(PDA)、监视器、计算机监视器、电视机、调谐器、无线电、卫星无线电、音乐播放器、数字音乐播放器、便携式音乐播放器、视频播放器、数字视频播放器、数字视频光盘(DVD)播放器、便携式数字视频播放器、卫星、交通工具或集成在交通工具内的装置、包含处理器或存储或检索数据或计算机指令的任何其它装置,或其组合。作为另一说明性非限制性实例,所述系统或所述设备可包含远程单元,例如手持式个人通信系统(PCS)单元、便携式数据单元(例如具有全球定位系统(GPS)能力的裝置)、仪表读取设备,或包含处理器或存储或检索数据或计算机指令的任何其它装置,或其任何组合。
尽管图1到5中的一或多者可说明根据本发明的教示的系统、设备、方法或其组合,本发明不限于这些所说明的系统、设备、方法或其组合。如本文中所说明或所描述的图1到7中的任一者的一或多个功能或组件可与图1到7的另一功能或组件的一或多个其它部分组合。因此,本文中所描述的单个实施例不应被解释为限制性的,且在不脱离本发明的教示的情况下,本发明的实施方案可适当组合。
所属领域的技术人员将进一步理解结合本文所公开的实施例所描述的各种说明性的逻辑块、配置、模块、电路以及算法步骤可以实施为电子硬件、通过处理器执行的计算机软件、或两者的组合。上文已大体在其功能性方面描述各种说明性组件、块、配置、模块、电路和步骤。此功能性是实施为硬件还是处理器可执行指令取决于特定应用和强加于整个系统的设计约束。熟练的技术人员可针对每一特定应用以不同方式实施所描述的功能性,但此类实施决策不应被解释为引起偏离本发明的范围。
结合本文中所揭示的实施方案而描述的方法或算法的步骤可直接体现于硬件、由处理器执行的软件模块或两者的组合中。软件模块可以驻留在随机存取存储器(RAM)、快闪存储器、只读存储器(ROM)、可编程只读存储器(PROM)、可擦除可编程只读存储器(EPROM)、电可擦除可编程只读存储器(EEPROM)、寄存器、硬盘、可移动的磁盘、只读光盘(CD-ROM)、或本领域中已知的任何其它形式的非暂时性(例如,非瞬时性)存储媒体中。示范性存储媒体耦合到处理器,使得处理器可从存储媒体读取信息并且将信息写入到存储媒体。在替代方案中,存储媒体可集成到处理器。处理器和存储媒体可驻存在专用集成电路(ASIC)中。ASIC可驻存在计算装置或用户终端中。在替代方案中,处理器和存储媒体可作为离散组件驻存在计算装置或用户终端中。提供所揭示实施方案的先前描述以使本领域的技术人员能够制作或使用所揭示的实施方案。所属领域的技术人员将易于了解对这些实施方案的各种修改,且本文中定义的一般原理可在不脱离本发明的精神或范围的情况下应用于其它实施方案。因此,本发明并不希望限于本文展示的实施方案,而应被赋予与如所附权利要求书所定义的原理和新颖特征一致的可能的最广范围。

Claims (30)

1.一种系统,其包括:
存储器,其经配置以存储与可用的服务相关联的数据;
麦克风,其与声学空间相关联,且经配置以接收人所产生的音频输入;
传感器,其位于所述声学空间内,且经配置以检测所述人所产生的振动;以及
处理器,其耦合到所述存储器、耦合到所述麦克风且耦合到所述传感器,所述处理器经配置以有条件地授权所述人所请求的所述服务的执行,所述服务是基于所述音频输入和所述振动而有条件地被授权。
2.根据权利要求1所述的系统,其中所述处理器进一步经配置以:
基于所述音频输入来确定所述人的身份,所述人的所述身份与存储于所述存储器中的身份简档相关联,其中所述身份简档指示可供所述人请求的多个服务;以及
基于所述振动来验证所述身份。
3.根据权利要求2所述的系统,其中所述处理器进一步经配置以响应于所述身份的验证来有条件地授权所述服务的执行。
4.根据权利要求1所述的系统,其中所述声学空间对应于交通工具的内部,其中所述处理器进一步经配置以在有条件地授权所述服务的所述执行之后起始所述服务,且其中所述服务对应于交通工具的发动机的点火、解锁所述交通工具、经由与人相关联的通信装置联系应急服务提供商、提供个人化服务,或其组合。
5.根据权利要求4所述的系统,其中所述交通工具包括汽车、飞机、轮船或火车,且其中所述交通工具包含多个区域,且与所述声学空间相关联。
6.根据权利要求4所述的系统,其中所述传感器位于座椅中、头枕中、方向盘中、变速杆中、仪表板中或其组合。
7.根据权利要求1所述的系统,其中所述处理器无线耦合到所述麦克风、所述传感器或这两者。
8.根据权利要求1所述的系统,其进一步包括触摸垫,其耦合到所述传感器,且经配置以响应于所述触摸垫的激活而激活所述传感器以接收所述振动。
9.根据权利要求1所述的系统,其进一步包括位于所述声学空间内的第一重量传感器、多个第二重量传感器或这两者,所述第一重量传感器经配置以检测重量值或压力值,所述多个第二重量传感器配置成阵列以检测重量分布模式或压力分布模式。
10.根据权利要求1所述的系统,其进一步包括耦合到所述处理器的多个麦克风,所述多个麦克风包含所述麦克风和第二麦克风,所述第二麦克风经配置以接收所述人所产生的第二音频输入,其中所述处理器经配置以至少部分地基于所述麦克风所接收到的所述音频输入以及所述第二麦克风所接收到的所述第二音频输入,确定相对于交通工具内的所述声学空间的三维空间中的人的位置。
11.根据权利要求10所述的系统,其中存储在所述存储器处的所述数据指示所述服务与所述声学空间的多个区域中的一区域相关联,且其中所述处理器进一步经配置以基于所述位置在所述区域内的确定来授权所述服务。
12.根据权利要求10所述的系统,其进一步包括图像捕获装置,其经配置以捕获所述位置处的所述人的面部的至少一个图像,其中所述处理器经配置以:
基于所述音频输入来确定所述人的身份;
基于所述至少一个图像来确定所述人的所述面部的面部特性;以及
基于所述面部特性和与所述人的所述身份相关联的身份简档的所存储的面部特性信息的比较来验证所述人的所述身份。
13.根据权利要求10所述的系统,其进一步包括图像捕获装置,其经配置以捕获所述位置处的所述人的面部的至少一个图像,其中所述处理器进一步经配置以:
基于所述音频输入、所述至少一个图像或其组合来确定所述人的身份;以及
基于所述至少一个图像、所述振动或其组合来验证所述身份。
14.根据权利要求10所述的系统,其进一步包括图像捕获装置,其经配置以捕获所述位置处的所述人所执行的示意动作的图像,其中所述处理器经配置以识别所述示意动作,且其中所述处理器经配置以进一步基于所述示意动作来验证所述人的所述身份。
15.一种方法,其包括:
在处理器处,从与声学空间相关联的麦克风接收所述麦克风基于人所产生的音频输入而产生的音频数据;
在处理器处,从位于所述声学空间内的传感器接收所述传感器基于所述人所产生的振动而产生的振动数据;以及
通过所述处理器有条件地授权所述人所请求的服务的执行,所述服务是基于所述音频数据和所述振动数据而有条件地被授权。
16.根据权利要求15所述的方法,其进一步包括:
基于所述音频数据来确定人的身份;以及
基于所述振动数据来验证所述身份,其中响应于所述身份的验证来授权所述服务。
17.根据权利要求15所述的方法,其中所述振动数据包含噪声分量和至少对应于所述音频输入的音频振动分量,且所述方法进一步包括:
对来自所述振动数据的所述噪声分量进行滤波以隔离所述音频振动分量;
将所述音频数据与所述音频振动分量进行比较,以产生相关值;以及
将所述相关值与阈值进行比较,其中响应于所述相关值大于或等于所述阈值而有条件地授权所述服务的执行。
18.根据权利要求17所述的方法,其中对来自所述振动数据的所述噪声分量进行滤波包括:
接收来自第二传感器的第二振动数据,所述第二振动数据与所述噪声分量相关联;以及
将所述第二振动数据从振动数据减去,以产生所述音频振动分量。
19.根据权利要求15所述的方法,其进一步包括:
在处理器处,接收来自重量传感器的重量数据;
基于所述重量数据确定重量值;
将所述重量值和与所述人的身份相关联的所存储的重量信息进行比较以产生相关值,其中基于所述音频数据来确定所述身份;以及
响应于所述相关值大于或等于阈值来验证所述人。
20.根据权利要求15所述的方法,其进一步包括:
接收来自重量传感器阵列的重量数据;
基于所述重量数据产生重量分布模式数据;
将所述重量分布模式数据和与所述人的身份相关联的所存储的重量分布模式信息进行比较以产生相关值,其中基于所述音频输入来确定所述身份;以及
响应于所述相关值大于或等于阈值来验证所述人。
21.根据权利要求15所述的方法,其进一步包括在处理器处接收来自一或多个传感器的数据输入序列,且其中有条件地授权所述服务是进一步基于所述数据输入序列。
22.根据权利要求21所述的方法,其中所述数据输入序列包含所述音频数据、所述振动数据、图像数据、制动传感器数据、加速器传感器数据、无线电传感器数据,或其组合。
23.根据权利要求21所述的方法,其中接收所述数据输入序列包括:
在第一时间从所述一或多个传感器中的第一传感器接收第一数据输入,所述第一传感器包括制动传感器;
在第二时间从所述一或多个传感器中的第二传感器接收第二数据输入,其中所述第二输入对应于所述音频数据,且所述第二传感器对应于所述麦克风;以及
在第三时间从所述一或多个传感器中的第三传感器接收第三数据输入,所述第三传感器包括图像捕获装置。
24.根据权利要求15所述的方法,其进一步包括:
在有条件地授权所述服务的所述执行之后,存取与所述人的身份相关联的驾驶模式信息,其中基于所述音频数据来确定所述身份;
在处理器处,接收来自加速计的加速度数据;
基于所述加速度数据来确定驾驶模式特性;
将所述驾驶模式特性与所述驾驶模式信息进行比较,以产生相关值;以及
响应于所述相关值大于或等于阈值来有条件地授权第二服务的执行。
25.根据权利要求24所述的方法,其中所述驾驶模式特性包括制动的平均速率或加速的平均速率,且其中所述第二服务包含经由用户接口提供异常驾驶的指示。
26.根据权利要求15所述的方法,其进一步包括:
经由用户接口接收来自所述人的创建身份简档的请求;
在接收到所述请求之后,接收与所述人的声纹模型相关联的身份数据以及与所述人的重量分布模式数据相关联的验证数据;以及
联合所述人的所述身份简档,存储所述身份数据和所述验证数据。
27.一种系统,其包括:
用于存储与可用的服务相关联的数据的装置;
用于接收人所产生的音频输入且基于所述音频输入产生音频数据的装置,所述用于接收的装置与声学空间相关联;
用于检测所述人所产生的振动且基于所述振动产生振动数据的装置,所述用于检测的装置位于所述声学空间内;以及
用于有条件地授权所述人所请求的服务的执行的装置,所述服务是基于所述音频数据和所述振动数据而有条件地被授权,其中所述用于有条件地授权的装置耦合到所述用于存储数据的装置、所述用于接收的装置和所述用于检测的装置。
28.根据权利要求27所述的系统,其中所述用于接收的装置位于所述声学空间中,其中所述声学空间包括音乐厅、剧院、会议室、办公室或其组合。
29.一种包括计算机可执行指令的非暂时性计算机可读媒体,所述指令在由处理器执行时,致使所述处理器:
验证由人产生且在与声学空间相关联的麦克风处接收到的音频输入,基于所述人所产生的振动来验证所述音频输入,在位于所述声学空间内的传感器处接收所述振动;以及
有条件地授权所述人所请求的服务的执行,其中所述服务是基于所述音频输入和所述振动而有条件地被授权。
30.根据权利要求29所述的计算机可读媒体,其中所述计算机可执行指令进一步使所述处理器:
将第二振动与第二音频输入进行比较,以在所述服务的执行之后产生相关值;以及
响应于确定所述相关值小于阈值,提供第二服务的拒绝的指示。
CN201580067042.XA 2014-12-12 2015-12-12 共享声学空间中的识别和验证 Active CN107004079B (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201462091386P 2014-12-12 2014-12-12
US62/091,386 2014-12-12
US14/966,815 2015-12-11
US14/966,815 US10002478B2 (en) 2014-12-12 2015-12-11 Identification and authentication in a shared acoustic space
PCT/US2015/065411 WO2016094884A1 (en) 2014-12-12 2015-12-12 Identification and authentication in a shared acoustic space

Publications (2)

Publication Number Publication Date
CN107004079A true CN107004079A (zh) 2017-08-01
CN107004079B CN107004079B (zh) 2020-03-24

Family

ID=55077627

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201580067042.XA Active CN107004079B (zh) 2014-12-12 2015-12-12 共享声学空间中的识别和验证

Country Status (4)

Country Link
US (1) US10002478B2 (zh)
EP (1) EP3230915B1 (zh)
CN (1) CN107004079B (zh)
WO (1) WO2016094884A1 (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109920436A (zh) * 2019-01-28 2019-06-21 武汉恩特拉信息技术有限公司 一种提供辅助服务的装置及方法
CN110555295A (zh) * 2018-06-01 2019-12-10 通用电气航空系统有限公司 用于运载工具中的可靠命令的系统和方法
CN110865788A (zh) * 2018-08-27 2020-03-06 黑莓有限公司 交通工具通信系统和操作交通工具通信系统的方法
CN111310136A (zh) * 2020-02-26 2020-06-19 支付宝(杭州)信息技术有限公司 一种图像数据的真实性验证方法、装置及设备

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017153332A1 (en) * 2016-03-11 2017-09-14 Limbic Life Ag Occupant support device and system for controlling objects
CN107437013A (zh) * 2016-05-27 2017-12-05 阿里巴巴集团控股有限公司 身份验证方法和装置
US10764281B1 (en) * 2017-01-09 2020-09-01 United Services Automobile Association (Usaa) Systems and methods for authenticating a user using an image capture device
GB2558670B (en) * 2017-01-17 2020-04-15 Jaguar Land Rover Ltd Interface Apparatus and Method for a Vehicle
US10708277B2 (en) 2018-03-02 2020-07-07 Bosch Automotive Service Solutions Inc. Artificial intelligence for a vehicle service ecosystem
US10063542B1 (en) * 2018-03-16 2018-08-28 Fmr Llc Systems and methods for simultaneous voice and sound multifactor authentication
US10733996B2 (en) 2018-03-30 2020-08-04 Qualcomm Incorporated User authentication
KR102638989B1 (ko) * 2018-12-18 2024-02-22 현대자동차주식회사 차량 및 그 제어방법
US11170752B1 (en) * 2020-04-29 2021-11-09 Gulfstream Aerospace Corporation Phased array speaker and microphone system for cockpit communication
CN112800071A (zh) * 2020-08-24 2021-05-14 支付宝(杭州)信息技术有限公司 基于区块链的业务处理方法、装置、设备及存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7602947B1 (en) * 1996-05-15 2009-10-13 Lemelson Jerome H Facial-recognition vehicle security system
CN102508569A (zh) * 2011-09-30 2012-06-20 深圳市合智创盈电子有限公司 一种利用振动定位的方法、系统及振动感测装置
US20130043977A1 (en) * 2011-08-19 2013-02-21 George A. Velius Methods and systems for speaker identity verification
CN104054118A (zh) * 2012-01-13 2014-09-17 脉冲函数F6有限公司 带有三维惯性传感器的远程信息处理系统
US20140310031A1 (en) * 2013-04-15 2014-10-16 Flextronics Ap, Llc Transfer of user profile data via vehicle agency control

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6593956B1 (en) 1998-05-15 2003-07-15 Polycom, Inc. Locating an audio source
US7898385B2 (en) 2002-06-26 2011-03-01 Robert William Kocher Personnel and vehicle identification system using three factors of authentication
JP2007145200A (ja) 2005-11-28 2007-06-14 Fujitsu Ten Ltd 車両用認証装置及び車両用認証方法
US20090055180A1 (en) 2007-08-23 2009-02-26 Coon Bradley S System and method for optimizing speech recognition in a vehicle
KR101829865B1 (ko) 2008-11-10 2018-02-20 구글 엘엘씨 멀티센서 음성 검출
JP4636171B2 (ja) 2008-12-17 2011-02-23 トヨタ自動車株式会社 車両用生体認証システム
US20130028443A1 (en) * 2011-07-28 2013-01-31 Apple Inc. Devices with enhanced audio
WO2013022135A1 (en) 2011-08-11 2013-02-14 Lg Electronics Inc. Electronic device and method of controlling the same
US9497544B2 (en) 2012-07-02 2016-11-15 Qualcomm Incorporated Systems and methods for surround sound echo reduction
DE102012106522A1 (de) 2012-07-18 2014-01-23 Huf Hülsbeck & Fürst Gmbh & Co. Kg Verfahren zur Authentifizierung eines Fahrers in einem Kraftfahrzeug
US20140112496A1 (en) 2012-10-19 2014-04-24 Carlo Murgia Microphone placement for noise cancellation in vehicles
US9947334B2 (en) 2014-12-12 2018-04-17 Qualcomm Incorporated Enhanced conversational communications in shared acoustic space
US9626950B2 (en) * 2015-02-13 2017-04-18 Dennis McNutt Audio system and method for reduction and/or elimination of distortion

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7602947B1 (en) * 1996-05-15 2009-10-13 Lemelson Jerome H Facial-recognition vehicle security system
US20130043977A1 (en) * 2011-08-19 2013-02-21 George A. Velius Methods and systems for speaker identity verification
CN102508569A (zh) * 2011-09-30 2012-06-20 深圳市合智创盈电子有限公司 一种利用振动定位的方法、系统及振动感测装置
CN104054118A (zh) * 2012-01-13 2014-09-17 脉冲函数F6有限公司 带有三维惯性传感器的远程信息处理系统
US20140310031A1 (en) * 2013-04-15 2014-10-16 Flextronics Ap, Llc Transfer of user profile data via vehicle agency control

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110555295A (zh) * 2018-06-01 2019-12-10 通用电气航空系统有限公司 用于运载工具中的可靠命令的系统和方法
CN110555295B (zh) * 2018-06-01 2022-06-07 通用电气航空系统有限公司 用于运载工具中的可靠命令的系统和方法
CN110865788A (zh) * 2018-08-27 2020-03-06 黑莓有限公司 交通工具通信系统和操作交通工具通信系统的方法
CN110865788B (zh) * 2018-08-27 2024-04-30 黑莓有限公司 交通工具通信系统和操作交通工具通信系统的方法
CN109920436A (zh) * 2019-01-28 2019-06-21 武汉恩特拉信息技术有限公司 一种提供辅助服务的装置及方法
CN111310136A (zh) * 2020-02-26 2020-06-19 支付宝(杭州)信息技术有限公司 一种图像数据的真实性验证方法、装置及设备

Also Published As

Publication number Publication date
EP3230915A1 (en) 2017-10-18
US20160171806A1 (en) 2016-06-16
US10002478B2 (en) 2018-06-19
CN107004079B (zh) 2020-03-24
WO2016094884A1 (en) 2016-06-16
EP3230915B1 (en) 2018-10-03

Similar Documents

Publication Publication Date Title
CN107004079A (zh) 共享声学空间中的识别和验证
CN111699528B (zh) 电子装置及执行电子装置的功能的方法
US9743213B2 (en) Enhanced auditory experience in shared acoustic space
EP3272101B1 (en) Audiovisual associative authentication method, related system and device
CN108702354B (zh) 基于传感器信号的活跃度确定
CN108327667A (zh) 车辆语音控制方法及装置
EP4127988B1 (en) In-ear liveness detection for voice user interfaces
CN106471462A (zh) 写回到多个用户账户的车内共享屏幕系统
CN107111705A (zh) 基于情境的访问验证
US20180288519A1 (en) Haptic feedback for head-wearable speaker mount such as headphones or earbuds to indicate ambient sound
KR20220031610A (ko) 멀티-모달 사용자 인터페이스
CN107004425A (zh) 共享声学空间中的增强型对话通信
CN109564602A (zh) 用于电子设备中的认证方法和装置
CN110023934A (zh) 用于电子设备中的认证的方法和装置
US20230377602A1 (en) Health-related information generation and storage
WO2020045204A1 (ja) 生体認証装置、生体認証方法および記録媒体
CN114067782A (zh) 音频识别方法及其装置、介质和芯片系统
JP7056398B2 (ja) 車両用認証装置、認証方法、認証プログラム、及び車両用制御システム
CN111462763B (zh) 由计算机实施的语音命令验证方法及电子装置
US10963548B2 (en) Information acquisition device, information acquisition system, and information acquisition method
CN115428067A (zh) 用于提供个性化虚拟个人助理的系统和方法
TWI840587B (zh) 多模態使用者介面
KR20180133048A (ko) 차량용 키, 차량, 차량용 키를 이용한 인증 시스템 및 인증 방법
JP7287269B2 (ja) 車両用通信システム
WO2023129663A1 (en) Interactive karaoke application for vehicles

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant