CN110097879A - 用于车辆环境的多信道语音识别 - Google Patents

用于车辆环境的多信道语音识别 Download PDF

Info

Publication number
CN110097879A
CN110097879A CN201910094397.8A CN201910094397A CN110097879A CN 110097879 A CN110097879 A CN 110097879A CN 201910094397 A CN201910094397 A CN 201910094397A CN 110097879 A CN110097879 A CN 110097879A
Authority
CN
China
Prior art keywords
microphone
data
vehicle
voice command
vehicle cabin
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910094397.8A
Other languages
English (en)
Inventor
S·A·弗里德曼
P·R·雷梅吉奥
T·U·法尔肯迈尔
R·A·凯尔
R·卡金米
L·D·海蒂
N·N·普拉尼克
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toyota Motor Engineering and Manufacturing North America Inc
Original Assignee
Toyota Engineering and Manufacturing North America Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toyota Engineering and Manufacturing North America Inc filed Critical Toyota Engineering and Manufacturing North America Inc
Publication of CN110097879A publication Critical patent/CN110097879A/zh
Pending legal-status Critical Current

Links

Classifications

    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60RVEHICLES, VEHICLE FITTINGS, OR VEHICLE PARTS, NOT OTHERWISE PROVIDED FOR
    • B60R16/00Electric or fluid circuits specially adapted for vehicles and not otherwise provided for; Arrangement of elements of electric or fluid circuits specially adapted for vehicles and not otherwise provided for
    • B60R16/02Electric or fluid circuits specially adapted for vehicles and not otherwise provided for; Arrangement of elements of electric or fluid circuits specially adapted for vehicles and not otherwise provided for electric constitutive elements
    • B60R16/037Electric or fluid circuits specially adapted for vehicles and not otherwise provided for; Arrangement of elements of electric or fluid circuits specially adapted for vehicles and not otherwise provided for electric constitutive elements for occupant comfort, e.g. for automatic adjustment of appliances according to personal settings, e.g. seats, mirrors, steering wheel
    • B60R16/0373Voice control
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/20Speech recognition techniques specially adapted for robustness in adverse environments, e.g. in noise, of stress induced speech
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R1/00Details of transducers, loudspeakers or microphones
    • H04R1/20Arrangements for obtaining desired frequency or directional characteristics
    • H04R1/32Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only
    • H04R1/40Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers
    • H04R1/406Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers microphones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/005Circuits for transducers, loudspeakers or microphones for combining the signals of two or more microphones
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L2015/086Recognition of spelled words
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L2015/088Word spotting
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2430/00Signal processing covered by H04R, not provided for in its groups
    • H04R2430/20Processing of the output signals of the acoustic transducers of an array for obtaining a desired directivity characteristic
    • H04R2430/23Direction finding using a sum-delay beam-former
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2499/00Aspects covered by H04R or H04S not otherwise provided for in their subgroups
    • H04R2499/10General applications
    • H04R2499/13Acoustic transducers and sound field adaptation in vehicles

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Computational Linguistics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Otolaryngology (AREA)
  • Signal Processing (AREA)
  • General Health & Medical Sciences (AREA)
  • Quality & Reliability (AREA)
  • Mechanical Engineering (AREA)
  • Fittings On The Vehicle Exterior For Carrying Loads, And Devices For Holding Or Mounting Articles (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Navigation (AREA)

Abstract

本公开涉及用于车辆环境的多信道语音识别。公开了用于提供具有多个乘员的载客车辆舱室中的语音命令操作的方法和设备。该方法和该设备进行操作以监测与车辆舱室内的语音命令相关的麦克风数据,并确定麦克风数据是否包括唤醒词数据。当唤醒词数据涉及多个车辆舱室区中的多于一个车辆舱室区并且多于一个唤醒词同时发生时,该方法和该设备进行操作以监测相应的麦克风数据,以获得来自该多个车辆舱室区中的相应车辆舱室区中的多于一个车辆舱室区中的每一个车辆舱室区的语音命令数据。在检测到后,可以处理语音命令数据以产生相应的车辆设备命令,并且能够发送(一个或多个)车辆设备命令以实现语音命令数据。

Description

用于车辆环境的多信道语音识别
技术领域
本文描述的主题一般而言涉及用于混合型车辆的环境舱室舒适设备,并且更具体而言,涉及用于在低功率操作模式期间减轻这种系统的电负载的混合型车辆气候控制系统。
背景技术
一般而言,语音命令已经在车辆中用于控制车辆电子设备(诸如导航、娱乐系统、气候控制系统等)。当单个个人已经在车辆中时,对各种车辆设备的控制还不是问题。但是,当多个个人乘坐在车辆中时,语音命令可能彼此重叠并且与会话混杂,从而造成语音命令迷失或丢失在混合物中。即使在语音命令可以被检测到时,它们也会按照系统指示的次序进行缓冲和处理。因而,当个人将延迟误认为他们的命令没有被拾取时混乱会增加,从而对提供所执行的期望语音命令造成车辆系统内的更多重复和混淆。
发明内容
本文描述的是用于车辆舱室的提供具有多个同时发生的唤醒词的语音命令功能的设备和方法的各种实施例。
在一个实现方式中,提供了一种方法,包括监测与车辆舱室内的语音命令相关的麦克风数据以及确定麦克风数据是否包括唤醒词数据。当唤醒词数据涉及多个车辆舱室区中的多于一个车辆舱室区并且多于一个唤醒词同时发生时,该方法包括监测相应的麦克风数据,以获得来自多个车辆舱室区的相应车辆舱室区中的多于一个车辆舱室区中的每一个车辆舱室区的语音命令数据。在检测到后,可以处理语音命令数据以产生相应的车辆设备命令。(一个或多个)车辆设备命令可以被发送以实现语音命令数据。
在另一个实现方式中,提供了一种语音命令控制单元,该语音命令控制单元包括通信接口、处理器和存储器。通信接口可以操作以服务于与车辆网络的通信。处理器可以可通信地耦合到通信接口。存储器可通信地耦合到处理器并存储语音命令激活模块和语音命令模块。语音命令激活模块包括当由处理器执行时使得处理器进行以下操作的指令:监测由位于车辆舱室中的多个麦克风中的相应麦克风中的每一个麦克风产生的麦克风数据,并确定多个麦克风中的相应麦克风中的每一个麦克风的麦克风数据是否包括唤醒词数据。当多个麦克风中的相应麦克风中的多于一个麦克风包括唤醒词数据时,使得处理器接收多个麦克风中的相应麦克风的唤醒词数据,确定多个麦克风中的相应麦克风中的多于一个麦克风的唤醒词数据是否在时间上彼此同时发生。当多个麦克风中的相应麦克风中的多于一个麦克风的唤醒词数据在时间上彼此同时发生时,语音命令激活模块包括使得处理器产生多唤醒词信号的指令。语音命令模块还包括当由处理器执行时使得处理器进行以下操作的指令:基于多唤醒词信号,监测麦克风数据,以获得来自多个麦克风中的相应麦克风中的多于一个麦克风中的每一个麦克风的语音命令数据。在检测到来自多个麦克风中的相应麦克风的多于一个麦克风的语音命令数据后,语音命令激活模块包括使得处理器进行以下操作的指令:处理语音命令数据以产生相应的车辆设备命令,并且经由车辆网络发送相应的车辆设备命令以用于实现来自多个麦克风中的相应麦克风中的多于一个麦克风的语音命令数据。
附图说明
本描述参考附图,其中相同的附图标记贯穿若干视图指代相同的部分,并且其中:
图1图示了具有用于提供多区语音命令能力的语音命令控制单元的车辆的示例框图;
图2图示了具有用于提供多区语音命令能力的语音命令控制单元的车辆的另一个示例框图;
图3图示了图1和图2的车辆舱室区与语音命令控制单元之间的语音命令通信流量的示例;
图4图示了图1和图2的语音命令控制单元的框图;
图5图示了用于从具有经由麦克风数据提供的同时发生的唤醒词的语音命令生成车辆设备命令的语音命令控制单元的功能框图;以及图6是用于基于同时发生的唤醒词在车辆舱室环境中进行语音命令识别的示例处理。
具体实施方式
本文描述的是用于区分车辆环境内部的重叠语音命令与一般会话的设备和方法的实施例。在这方面,实施例可以操作以大致并行地处理重叠命令,从而对语音命令提供便利性和响应性。
例如,该设备和该方法可以操作以监测与车辆舱室内的语音命令相关的麦克风数据,并确定麦克风数据是否包括唤醒词数据。当唤醒词数据涉及多个车辆舱室区中的多于一个车辆舱室区时,并且当多个车辆舱室区中的相应车辆舱室区中的多于一个车辆舱室区的唤醒词数据在时间上彼此同时发生时,该设备和该方法监测相应的麦克风数据,以获得来自多个车辆舱室区中的相应车辆舱室区中的多于一个车辆舱室区中的每一个车辆舱室区的语音命令数据。在检测到后,语音命令数据被处理以产生可以经由车辆网络发送的相应车辆设备命令。相应车辆设备命令用于实现来自多个车辆舱室区中的相应车辆舱室区中的多于一个车辆舱室区的语音命令数据。
图1图示了具有与多个麦克风120-01、120-02、120-3和120-04耦合用于提供多区语音命令能力的语音命令控制单元110的车辆100的框图。车辆100可以是载客车辆、商用车辆、陆基车辆、水基车辆和/或空基车辆。
车辆100可以包括定位在车辆舱室102内的麦克风120-01至120-04。麦克风120-01至120-04各自具有可以限定相应区(诸如乘客前区122-01、乘客后区122-02、驾驶员后区122-03和驾驶员前区122-4)的灵敏度。区表示车辆舱室102的可以涉及车辆乘客和/或车辆操作者的近侧区域和/或体积。
区的数量可以基于车辆100的可能乘客的数量而增加或减少。例如,车辆100可以具有可以发出用于操作车辆电子设备(诸如娱乐系统、HVAC设置(诸如升高/降低车辆舱室102的温度)、车辆巡航控制设置、内部照明等)的语音命令的四个乘客。
麦克风120-01至120-04可以操作以接收模拟输入(诸如唤醒词和语音命令),并且经由模拟数字转换产生数字数据输出(诸如分别为麦克风数据124-01、124-02、124-03和124-04)。可以相对于唤醒词的源来识别区。例如,从乘客后区122-02发出唤醒词的乘客可以靠近麦克风120-02。虽然唤醒词可能被车辆舱室102内的其它麦克风感测,但是可以经由可以操作相应区122的麦克风来感测接近度。
对于语音命令,唤醒词可以操作以激活语音命令功能。例如,默认唤醒词可以是“立即唤醒”。可以基于用户偏好创建定制的唤醒词,诸如“丰田你好”。唤醒词可以在车辆舱室102内使用,以允许任何乘客激活车辆100的语音命令功能。
在当前系统中,当存在多个乘客时,车辆内的噪声水平可能过度和/或多个乘客(包括驾驶员)可能说出唤醒词。在这种实例中,语音命令单元可能会对哪个区可能是唤醒词的源感到混淆,可能将后续语音命令与不正确的区混杂(例如,唤醒词可能在驾驶员前区122-04中发出,但是语音命令可能由另一个车辆乘客从乘客后区122-02错误地接收)。另一方面,如本文描述的实施例中所阐述的,由麦克风120-01至120-04进行的接近度感测操作以避免这种混淆。而且,当麦克风120-01至120-04可能没有主动收听跟随相应唤醒词的语音命令时,剩余的麦克风输入可以操作来为主动“收听”麦克风提供噪声消除效果。
另外,在当前系统中,当唤醒词的多个实例在时间上彼此同时发生(诸如唤醒词经由麦克风120-02在乘客后区122-02中被检测到并且还经由麦克风120-01在乘客前区122-01中被检测到)时,处理可以连续发生。在这个示例中,“第一接收的”唤醒词可以是“先出”,因此,在一些情况下,这些乘客中的一个乘客可能需要在意识到他们的命令未被正确接收后重复其语音命令。在其它实例中,对由乘客说出的语音命令的处理可能被延迟,并且没有被以有利的方式作用。在这方面,这些乘客中的一个乘客可能由于不便而感到沮丧并且重复语音命令,这会进一步增加车辆舱室102中的噪声状况。
另一方面,如本文描述的实施例中所阐述的,语音命令控制单元110可以操作以通过监测麦克风数据124-01至124-04来提供对来自多个区的语音命令的基本上并行和/或同时的处理。当车辆舱室区中的相应车辆舱室区中的多于一个车辆舱室区的唤醒词数据在时间上彼此同时发生时,语音命令控制单元110可以操作以监测相应的麦克风数据124-01至124-04,以获得来自车辆舱室区122-01至122-04中的相应车辆舱室区中的多于一个车辆舱室区中的每一个车辆舱室区的语音命令。在检测到语音命令数据后,语音命令控制单元110可以操作以处理语音命令数据来产生相应的车辆设备命令,并且经由车辆网络发送相应的车辆设备命令,以用于实现来自多个车辆舱室区中的相应车辆舱室区中的多于一个车辆舱室区的语音命令数据。
作为示例,语音命令控制单元110可以确定与乘客前区122-01相关的麦克风数据124-01和与驾驶员后区122-03相关的麦克风数据124-03包括唤醒词数据(诸如“唤醒”、“丰田你好”等)。语音命令控制单元110可以操作以确定乘客前区122-01和驾驶员后区122-03中的每一个的唤醒词数据是否在时间上彼此同时发生。然后,语音命令控制单元110可以操作以监测相应区122-01和122-03以获得语音命令。即,语音命令控制单元110可以操作以指引用于基本上并行地处理来自这些区的同时发生的语音命令的资源。
关于示例,语音命令控制单元110可以操作以将用于乘客前区122-01和驾驶员后区122-03的数据信道指定为活数据信道,而剩余车辆舱室区的数据信道被指定为死数据信道或非活动数据信道。另外,语音命令控制单元110可以操作以丢弃车辆舱室区中的剩余的车辆舱室区的麦克风数据。例如,麦克风数据124-02和124-04可以被丢弃,因为它们不是由语音命令控制单元110监测以获得语音命令的活动信道。
如上所述,可以处理与唤醒词相关联的语音命令以产生相应的车辆设备命令。处理的示例可以包括主/从操作、对称多处理操作、大规模并行处理操作等。
图2图示了具有与波束成形麦克风200耦合用于提供多区语音命令能力的语音命令控制单元110的车辆100的框图。在这方面,可以使用各种麦克风技术来提供本文描述的方法和设备。
波束成形麦克风200可以部署多个接收波瓣(lobe)222-01、222-02、222-03和222-04,或定向音频波束,以用于覆盖车辆舱室102。DSP处理器可以可操作以处理接收波瓣222-01至222-04中的每一个接收波瓣,并且可以包括用于过度噪声的回声和噪声消除功能。基于车辆舱室102的占用容量,区的数量可以更少或更多。
图3图示了区122-01、122-02、122-03和122-04与语音命令控制单元110之间的语音命令通信流量的示例。一般而言,当车辆舱室载有乘客时,除了唤醒词和语音命令之外还存在其它声音。其它声音可以包括会话、反射的声音(来自内部表面)、来自车辆外部的道路噪声、娱乐系统噪声(诸如音乐、音频和/或视频回放)等。其它声音还可以具有不同的幅值水平,诸如以大声水平回放的音乐,由于除了可能正试图向车辆部件发出语音命令的乘客之外还有音乐的大声水平而可能大声的会话。
图3的示例图示了用于传达信息数据的各种信道,这些信道可以是物理信道和/或虚拟信道。语音命令控制单元110可以操作以监测麦克风数据124-01、124-02、124-03、124-04,并确定麦克风数据是否包括唤醒词数据310。当唤醒词数据310与多个车辆舱室区122中的多于一个车辆舱室区同时发生时,诸如与驾驶员前区122-04的唤醒词数据320和乘客前区122-01的唤醒词数据310同时发生。
确定一个区122-01的唤醒词数据是否与其它区122-02、122-03和122-04的其它唤醒词同时发生可以基于时间戳数据(诸如针对唤醒词310的ts1和针对唤醒词320的ts2)。唤醒词数据310和320中的每一个唤醒词数据可以包括持续时间(考虑到车辆乘客说该词的速率)。在图3的示例中,唤醒词310和唤醒词320被指示为彼此重叠或同时发生,从而指示车辆舱室区122-01至122-04中的多于一个车辆舱室区包括参与语音命令序列的乘客。
在图3中,唤醒词310之后可以是包括语音命令数据312的麦克风数据124-01,并且唤醒词320之后可以是包括语音命令数据322的麦克风数据124-04。在检测到后,语音命令控制单元110可以处理语音命令数据312和322以产生相应的车辆设备命令。即,语音命令控制单元110可以减少由语音命令数据312包含的语音数据,以使车辆设备命令能够被相应的车辆设备执行。
例如,车辆设备命令可以针对车辆环境控制或车辆娱乐控制(诸如无线电台、卫星站、回放标题选择、信道选择、音量控制等)。
为了减小其它区122-02和122-03的噪声水平,可以将这些信道声明为“死数据信道”,如虚线所指示的。语音命令控制单元110主动监测与乘客前区122-01和驾驶员前区122-04相关联的活信道的语音命令数据312和322。而且,虽然可以将信道声明为“死数据信道”,但是语音命令控制单元110可以将麦克风数据124-02和124-03用于噪声消除和/或减轻目的,以监测语音命令数据312和322。在替代方案中,语音命令控制单元110可以丢弃和/或忽略与乘客后区122-02和驾驶员后区122-03相关的麦克风数据124-02和124-03。
在接收和处理活信道122-01和122-04之后,语音命令控制单元110可以移除乘客后区122-02和驾驶员后区122-03的“死数据信道”指定,以继续监测麦克风数据124-01至124-04以获得唤醒词数据。
图4图示了图1和图2的语音命令控制单元110的框图。语音命令控制单元110可以包括通信接口402、处理器404和存储器406,它们经由总线408可通信地耦合。语音命令控制单元110可以提供用于参考图1-图6详细描述的设备和方法的示例平台。
处理器404可以是常规的中央处理单元或者能够操纵或处理信息的任何其它类型的设备(或多个设备)。如可以认识到的,处理器404可以是单个处理设备或多个处理设备。这种处理设备可以是微处理器、微控制器、数字信号处理器、微计算机、中央处理单元、现场可编程门阵列、可编程逻辑设备、状态机、逻辑电路系统、模拟电路系统、数字电路系统和/或基于操作指令和/或电路系统的硬编码来操纵信号(模拟和/或数字)的任何设备。
存储器(和/或存储器元件)406可以可通信地耦合到处理器404,并且可以操作以存储本文描述的一个或多个模块。这些模块可以包括当被执行时使得处理器404实现本文描述的各种处理和/或操作中的一个或多个处理和/或操作的指令。
存储器和/或存储器元件406可以是单个存储器设备、多个存储器设备和/或处理器404的嵌入式电路系统。这种存储器设备可以是只读存储器、随机存取存储器、易失性存储器、非易失性存储器、静态存储器、动态存储器、闪速存储器、高速缓存存储器,和/或存储数字信息的任何设备。此外,本文描述的布置可以采取在其上体现(例如,存储)有计算机可读程序代码的一个或多个计算机可读存储介质中体现的计算机程序产品的形式。可以使用一个或多个计算机可读介质的任意组合。计算机可读介质可以是计算机可读信号介质或计算机可读存储介质。
短语“计算机可读存储介质”是指非瞬态存储介质。计算机可读存储介质可以是例如但不限于电子、磁、光、电磁、红外或半导体的系统、装置或设备,或者是前述的任意合适组合。计算机可读存储介质的更具体示例(非详尽列表)将包括以下内容:便携式计算机盘、硬盘驱动器(HDD)、固态驱动器(SSD)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或闪速存储器)、便携式致密盘只读存储器(CD-ROM)、数字通用盘(DVD)、光存储设备、磁存储设备,或者前述的任意合适组合。在本文档的上下文中,计算机可读存储介质可以是可以包含或存储由指令执行系统、装置或设备使用或与其结合使用的程序的任何有形介质。体现在计算机可读介质上的程序代码可以使用任何适当的介质(包括但不限于无线、有线、光纤、电缆、RF等,或者前述的任意合适组合)传输。
存储器406能够存储机器可读指令(或指令),使得机器可读指令可以由处理器404访问和/或执行。机器可读指令可以包括用编程语言及其代(例如,1GL、2GL、3GL、4GL或5GL)编写的逻辑或(一个或多个)算法,其中编程语言诸如例如可以由处理器404直接执行的机器语言或者可以被编译或汇编成机器可读指令并存储在存储器406上的汇编语言、面向对象编程(OOP)(诸如JAVA、Smalltalk、C++等)、常规的过程式编程语言、脚本语言、微代码等。可替代地,机器可读指令可以用硬件描述语言(HDL)编写,诸如经由现场可编程门阵列(FPGA)配置或者专用集成电路(ASIC)或其等同物实现的逻辑。因而,本文描述的方法和设备可以以任何常规的计算机编程语言实现,可以被实现为预编程的硬件元件或被实现为硬件和软件部件的组合。
要注意的是,当处理器404包括多于一个处理设备时,处理设备可以集中定位(例如,经由有线和/或无线总线结构直接耦合在一起)或者可以分布式定位(例如,经由通过局域网和/或广域网间接耦合的云计算)。还要注意的是,当处理器404经由状态机、模拟电路系统、数字电路系统和/或逻辑电路系统实现其功能中的一个或多个功能时,存储对应操作指令的存储器和/或存储器元件可以嵌入在包括状态机、模拟电路系统、数字电路系统和/或逻辑电路系统的电路系统内,或在其外部。
还要注意的是,存储器406存储并且处理器404执行与图1-图6中所示的步骤和/或功能中的至少一些步骤和/或功能对应的模块的硬编码和/或操作指令。
语音命令控制单元110可以包括一个或多个模块,该一个或多个模块中的至少一些模块在本文中描述。这些模块可以被认为是可以用执行一个或多个功能的硬件、软件、固件和/或计算机可读程序代码实现的功能块。
模块在被处理器404执行时实现本文描述的各种处理中的一个或多个处理。这些模块中的一个或多个模块可以是(一个或多个)处理器404的部件,或者这些模块中的一个或多个模块可以在(一个或多个)处理器404可操作地连接到的其它处理系统上执行和/或分布在其间。这些模块可以包括可由(一个或多个)处理器404执行的指令(例如,程序逻辑)。
通信接口402一般支配和管理经由车辆网络412接收的数据,诸如经由数据总线128提供给车辆网络212的环境控制数据麦克风数据124。对本公开在任何特定的硬件布置上操作不存在限制,并由于改进的硬件和/或固件布置可能会发展,因此本文的基本特征可以针对它们而进行替换、移除、添加或以其它方式修改。
当相应区中的多于一个区的唤醒词数据(经由麦克风数据124传达)彼此同时发生时,语音命令控制单元110可以操作以监测相应的麦克风数据124,以获得来自车辆舱室区中的相应车辆舱室区中的多于一个车辆舱室区中的每一个车辆舱室区的语音命令数据。在检测到后,语音命令控制单元110可以处理语音命令数据,以产生车辆设备命令420。可以使用通信接口402经由车辆网络412发送车辆设备命令420,以实现语音命令数据420。
图5图示了用于从经由麦克风数据124提供的语音命令生成车辆设备命令420的语音命令控制单元110的功能框图。语音命令控制单元110可以包括语音命令激活模块502和语音命令模块510。
语音命令激活模块502可以包括当由处理器404执行时使得处理器404监测麦克风数据124的指令。麦克风数据124可以由可以从车辆舱室区接收音频并产生数字输出数据(诸如麦克风数据124)的多个麦克风(诸如可以接收模拟输入(诸如唤醒词、语音命令等)的数字麦克风、波束成形麦克风等)产生。
语音命令激活模块502可以包括当由处理器404执行时使得处理器404进行以下操作的指令:确定用于车辆舱室区中的相应车辆舱室区中的每一个车辆舱室区的麦克风数据124是否包括唤醒词数据,并且当车辆舱室区中的相应车辆舱室区中的多于一个车辆舱室区包括唤醒词数据时接收相应车辆舱室区的唤醒词数据,并确定唤醒词数据是否在时间上彼此同时发生。在这方面,语音命令控制单元110可以检测车辆内的多个重叠和/或同时发生的唤醒词,诸如“唤醒”、“计算机”、“你在那里吗?”等等。
当多于一个唤醒词数据彼此重叠和/或同时发生时,语音命令激活模块502可以生成指示重叠和/或同时发生状况的多唤醒词信号,该多唤醒词信号也可以操作以识别车辆舱室区(诸如相应麦克风的地址、经由波束成形麦克风的定向标识符等)。
语音命令模块510可以包括当由处理器404执行时使得处理器404进行以下操作的指令:监测麦克风数据124以获得来自多个麦克风中的相应麦克风中的多于一个麦克风中的每一个麦克风的语音命令数据。这种监测可以基于多唤醒词信号504,该多唤醒词信号504可以识别车辆舱室区122-01至122-04(图1和图2)和相应的麦克风设备(地址和/或波束成形接收方向)。
在从相应车辆舱室区中的多于一个车辆舱室区检测到语音命令数据后,语音命令模块510可以包括当由处理器404执行时使得处理器404处理语音命令数据以产生相应的车辆设备命令320的进一步指令,该车辆设备命令320可以经由车辆网络412发送以用于实现来自车辆舱室区中的相应车辆舱室区中的多于一个车辆舱室区的语音命令数据。
图6是用于基于同时发生的唤醒词在车辆舱室环境中进行语音命令识别的示例处理600。在这方面,车辆舱室的多个乘员和/或乘客可以用唤醒词发起语音命令,而在语音命令控制单元110中没有延迟和/或混淆地执行语音命令的处理。
在操作602处,可以监测与车辆舱室内的语音命令相关的麦克风数据。语音命令可以包括基于乘员的口头词的唤醒词数据(诸如“计算机”、“唤醒”、“你在那里吗?”等等)。如可以认识到的,用户可以提供单个唤醒词或若干唤醒词以供和语音命令控制单元110使用。
在操作604处,可以确定麦克风数据是否包括唤醒词数据,并且在操作606处,当存在多于一个唤醒词数据发生(诸如“计算机”、“唤醒”、“你在那里吗”和/或其组合)时,可以在操作608处确定唤醒词数据是否彼此同时发生。换句话说,当车辆的多个乘客说出他们相应的唤醒词以调用后续的语音命令时,车辆的多个乘客实际上争着说话。
当多于一个唤醒词同时发生时,操作在操作610处提供可以监测相应的麦克风数据(诸如被识别为包括同时发生的唤醒词)以获得来自相应车辆舱室区的语音命令数据。在这方面,语音命令控制单元可以操作以基本上并行地处理唤醒词的多个实例,这与“先进先出”的基础形成对比。非并行处理增加了对乘员的语音命令的延迟响应,这可能被误解为语音命令控制单元未接收到或“听到”。因而,在操作612中,在检测到后,语音命令数据可以被处理以产生相应的车辆设备命令,诸如环境控制命令、娱乐设备命令、导航命令等。
在操作614中,可以经由车辆网络发送相应的车辆设备命令,用于实现来自多个车辆舱室区中的相应车辆舱室区中的多于一个车辆舱室区的语音命令数据。即,唤醒词尽管同时发生,但是仍通过执行车辆设备命令促进足够的响应,从而消除了车辆乘客的沮丧和不必要的命令重复。
本文公开了详细的实施例。但是,要理解的是,所公开的实施例仅旨在作为示例。因此,本文公开的具体结构和功能细节不应当被解释为限制,而仅仅是作为权利要求的基础和作为用于教导本领域技术人员在几乎任何适当的详细结构中以各种方式采用本文的各方面的代表性基础。另外,本文使用的术语和短语不意在限制,而是提供对可能的实现方式的可理解描述。
图1-图6中示出了各种实施例,但是实施例不限于所示出的结构或应用。如本领域普通技术人员可以认识到的,如本文可以使用的术语“基本上”或“近似”提供了对其对应项和/或项之间的相对性的行业可接受的容差。这种行业可接受的容差的范围从小于百分之一到百分之二十,并且对应于但不限于部件值、集成电路工艺变化、温度变化、上升和下降时间和/或热噪声。项之间的这种相对性的范围从几个百分点的差异到量级差异。
如本领域普通技术人员还可以认识到的,如本文可以使用的术语“耦合”包括直接耦合和经由另一个部件、元件、电路或模块的间接耦合,其中,对于间接耦合,中间部件、元件、电路或模块不修改信号的信息,但是可以调整其电流水平、电压水平和/或功率水平。如本领域普通技术人员还将认识到的,推断的耦合(即,其中一个元件通过推断耦合到另一个元件)以与“耦合”相同的方式包括两个元件之间的直接和间接耦合。本领域普通技术人员还将认识到的是,如本文可以使用的术语“有利地比较”指示两个或更多个元件、项、信号等之间的比较提供了期望的关系。例如,当期望的关系是第一信号具有比第二信号更大的量值时,可以在第一信号的量值大于第二信号的量值时或者在第二信号的量值小于第一信号的量值时实现有利的比较。
当在对附图的描述中使用术语“模块”时,模块包括以硬件、软件和/或固件实现的功能块,其执行一个或多个功能,诸如处理输入信号以产生输出信号。如本文所使用的,模块可以包含本身是模块的子模块。
附图中的流程图和框图图示了根据各种实施例的系统、方法和计算机程序产品的可能实现方式的体系架构、功能和操作。在这方面,流程图或框图中的每个方框可以表示模块、程序段、或代码的一部分,所述模块、程序段、或代码的一部分包括用于实现(一个或多个)指定的逻辑功能的一个或多个可执行指令。还应当注意的是,在一些替代实现方式中,方框中所标注的功能也可以以不同于附图中所标注的次序发生。例如,被示为连续的两个方框实际上可以基本并发地执行,或者它们有时也可以按相反的次序执行,这取决于所涉及的功能。
上述系统、部件和/或处理可以用硬件或硬件和软件的组合实现,并且可以以集中方式在一个处理系统中或者以其中不同元件跨若干个互连的处理系统分布的分布式方式实现。任何种类的处理系统或适于执行本文所述方法的另一装置都适合。硬件和软件的典型组合可以是具有计算机可用程序代码的处理系统,该计算机可用程序代码在被加载和执行时控制处理系统使得它执行本文描述的方法。该系统、部件和/或处理也可以被嵌入在诸如计算机程序产品或其它数据程序存储设备的计算机可读存储介质中,可被机器读取,有形地体现可被机器执行以实现本文描述方法和处理的指令的程序。这些元件也可以被嵌入在应用产品中,该应用产品包括使本文所述的方法能够实现的所有特征,并且,当在处理系统中被加载时能够执行这些方法。
体现在计算机可读介质上的程序代码可以使用任何适当的介质(包括但不限于,无线、有线、光纤、电缆、RF等,或者前述的任意合适组合)来发送。用于执行本布置的各方面的操作的计算机程序代码可以用一种或多种编程语言(包括面向对象的编程语言(诸如JavaTM、Smalltalk、C++等)和常规的过程式编程语言(诸如“C”编程语言或类似的编程语言))的任意组合来编写。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为独立的软件包执行、部分地在用户计算机上并且部分地在远程计算机上执行、或者完全地在远程计算机或服务器上执行。在后者的情形中,远程计算机可以通过任何类型的网络(包括局域网(LAN)或广域网(WAN))连接到用户计算机,或者可以(例如,使用互联网服务提供商通过互联网)连接到外部计算机。
如本文所使用的,术语“一”和“一个”被限定为一个或多于一个。如本文所使用的,术语“多个”被限定为两个或多于两个。如本文所使用的,术语“另一个”被限定为至少第二个或更多。如本文所使用的,术语“包括”和/或“具有”被限定为包含(即,开放性语言)。如本文所使用的,短语“......和......中的至少一个”指代并且涵盖相关联的列出项中的一个或多个的任何和所有可能组合。作为示例,短语“A、B和C中的至少一个”包括只有A、只有B、只有C、或其任何组合(例如AB、AC、BC或ABC)。
在不脱离其精神或基本属性的情况下,本文的各方面可以以其它形式来体现。因而,应当参考以下权利要求而不是以上说明书作为对其范围的指示。

Claims (20)

1.一种方法,包括:
监测与车辆舱室内的语音命令相关的麦克风数据;
确定麦克风数据是否包括唤醒词数据;
当唤醒词数据涉及多个车辆舱室区中的多于一个车辆舱室区时:
当所述多个车辆舱室区中的相应车辆舱室区中的所述多于一个车辆舱室区的唤醒词数据彼此同时发生时:
监测相应的麦克风数据,以获得来自所述多个车辆舱室区的相应车辆舱室区中的所述多于一个车辆舱室区中的每一个车辆舱室区的语音命令数据;
在检测到后,处理语音命令数据,以产生相应的车辆设备命令;以及
经由车辆网络发送相应的车辆设备命令,用于实现来自所述多个车辆舱室区中的相应车辆舱室区中的所述多于一个车辆舱室区的语音命令数据。
2.如权利要求1所述的方法,其中:
所述多个车辆舱室区中的相应车辆舱室区中的所述多于一个车辆舱室区的数据信道被指定为活数据信道;以及
所述多个车辆舱室区中的剩余的车辆舱室区的数据信道被指定为死数据信道。
3.如权利要求1所述的方法,还包括:
减小所述多个车辆舱室区中的剩余的车辆舱室区的拾取灵敏度。
4.如权利要求3所述的方法,其中减小所述多个车辆舱室区中的剩余的车辆舱室区的拾取灵敏度包括以下当中的至少一个:
丢弃所述多个车辆舱室区中的剩余的车辆舱室区的麦克风数据;以及
增加所述多个车辆舱室区中的所述多于一个车辆舱室区中的相应车辆舱室区的拾取灵敏度参数。
5.如权利要求1所述的方法,其中多个麦克风生成麦克风数据。
6.如权利要求1所述的方法,其中所述多个车辆舱室区中的每一个车辆舱室区包括多个麦克风中的相应麦克风,并且其中所述多个麦克风中的相应麦克风中的每一个麦克风靠近车辆舱室内的车辆乘员位置。
7.如权利要求1所述的方法,其中波束成形麦克风生成麦克风数据。
8.一种方法,包括:
监测由车辆舱室中的相应多个麦克风产生的麦克风数据;
确定所述多个麦克风中的相应麦克风中的每一个麦克风的麦克风数据是否包括唤醒词数据;
当所述多个麦克风中的相应麦克风的至少第一麦克风数据和第二麦克风数据包括唤醒词数据时:
确定所述至少第一麦克风数据和第二麦克风数据中的每一个的唤醒词数据是否在时间上彼此同时发生;
当所述至少第一麦克风数据和第二麦克风数据中的每一个的唤醒词数据在时间上彼此同时发生时:
监测包括唤醒词数据的麦克风数据,以获得来自所述多个麦克风中的相应麦克风中的每一个麦克风的语音命令数据;
以及
在检测到来自所述多个麦克风中的相应麦克风中的每一个麦克风的语音命令数据后,处理第一语音命令数据和第二语音命令数据,以产生第一车辆设备命令和第二车辆设备命令;以及
发送第一车辆设备命令和第二车辆设备命令,用于实现来自所述多个麦克风中的相应麦克风中的每一个麦克风的语音命令数据。
9.如权利要求8所述的方法,其中:
所述多个麦克风中的相应麦克风中的多于一个麦克风的数据信道被指定为活数据信道;以及
所述多个麦克风中的剩余的麦克风的数据信道被指定为死数据信道。
10.如权利要求8所述的方法,还包括:
减小所述多个麦克风中的剩余的麦克风的拾取灵敏度。
11.如权利要求10所述的方法,其中减小所述多个麦克风中的剩余的麦克风的拾取灵敏度包括以下当中的至少一个:
丢弃所述多个麦克风中的剩余的麦克风的麦克风数据;以及
增加所述多个麦克风中的多于一个麦克风中的相应麦克风的拾取灵敏度参数。
12.如权利要求8所述的方法,其中处理语音命令数据以产生相应的车辆设备命令包括多处理操作。
13.如权利要求12所述的方法,其中所述多处理操作包括以下当中的至少一个:
主/从操作;
对称多处理操作;以及
大规模并行处理操作。
14.如权利要求8所述的方法,其中所述多个麦克风中的相应麦克风中的每一个麦克风靠近车辆舱室内的车辆乘员位置。
15.一种语音命令控制单元,包括:
通信接口,服务于与车辆网络的通信;
处理器,可通信地耦合到通信接口;以及
存储器,可通信地耦合到处理器并存储:
语音命令激活模块,包括当由所述处理器执行时使得所述处理器进行以下操作的指令:
监测由位于车辆舱室中的多个麦克风中的相应麦克风中的每一个麦克风产生的麦克风数据;以及
确定所述多个麦克风中的相应麦克风中的每一个麦克风的麦克风数据是否包括唤醒词数据;
当所述多个麦克风中的相应麦克风中的多于一个麦克风包括唤醒词数据时:
接收所述多个麦克风中的相应麦克风的唤醒词数据;
确定所述多个麦克风中的相应麦克风中的所述多于一个麦克风的唤醒词数据是否在时间上彼此同时发生;
以及
当所述多个麦克风中的相应麦克风中的所述多于一个麦克风的唤醒词数据在时间上彼此同时发生时,产生多唤醒词信号;以及
语音命令模块,包括当由所述处理器执行时使得所述处理器进行以下操作的指令:
监测麦克风数据,以获得来自所述多个麦克风中的相应麦克风中的所述多于一个麦克风中的每一个麦克风的语音命令数据;
在检测到来自所述多个麦克风中的相应麦克风中的所述多于一个麦克风的语音命令数据后,处理所述语音命令数据,以产生相应的车辆设备命令;以及
经由车辆网络发送相应的车辆设备命令,用于实现来自所述多个麦克风中的相应麦克风中的所述多于一个麦克风的语音命令数据。
16.如权利要求15所述的语音命令控制单元,其中:
所述多个麦克风中的相应麦克风中的所述多于一个麦克风的数据信道被指定为活数据信道;以及
所述多个麦克风中的剩余的麦克风的数据信道被指定为死数据信道。
17.如权利要求15所述的语音命令控制单元,还包括当由所述处理器执行时使得所述处理器进行以下操作的指令:
减小所述多个麦克风中的剩余的麦克风的拾取灵敏度。
18.如权利要求17所述的语音命令控制单元,其中使得所述处理器减小所述多个麦克风中的剩余的麦克风的拾取灵敏度的指令包括执行以下当中的至少一个的指令:
丢弃所述多个麦克风中的剩余的麦克风的麦克风数据;以及
增加所述多个麦克风中的所述多于一个麦克风中的相应麦克风的拾取灵敏度参数。
19.如权利要求15所述的语音命令控制单元,其中使得所述处理器处理所述语音命令数据以产生相应的车辆设备命令的指令包括多处理操作。
20.如权利要求15所述的语音命令控制单元,其中所述多个麦克风中的相应麦克风中的每一个麦克风靠近车辆舱室内的车辆乘员位置。
CN201910094397.8A 2018-01-31 2019-01-31 用于车辆环境的多信道语音识别 Pending CN110097879A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US15/884,437 US20190237067A1 (en) 2018-01-31 2018-01-31 Multi-channel voice recognition for a vehicle environment
US15/884,437 2018-01-31

Publications (1)

Publication Number Publication Date
CN110097879A true CN110097879A (zh) 2019-08-06

Family

ID=67392260

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910094397.8A Pending CN110097879A (zh) 2018-01-31 2019-01-31 用于车辆环境的多信道语音识别

Country Status (3)

Country Link
US (1) US20190237067A1 (zh)
JP (1) JP2019133156A (zh)
CN (1) CN110097879A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111739552A (zh) * 2020-08-28 2020-10-02 南京芯驰半导体科技有限公司 一种麦克风阵列波束成形的方法及系统
CN111968642A (zh) * 2020-08-27 2020-11-20 北京百度网讯科技有限公司 语音数据处理方法、装置及智能车辆

Families Citing this family (81)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10095470B2 (en) 2016-02-22 2018-10-09 Sonos, Inc. Audio response playback
US10264030B2 (en) 2016-02-22 2019-04-16 Sonos, Inc. Networked microphone device control
US10509626B2 (en) 2016-02-22 2019-12-17 Sonos, Inc Handling of loss of pairing between networked devices
US9947316B2 (en) 2016-02-22 2018-04-17 Sonos, Inc. Voice control of a media playback system
US9826306B2 (en) 2016-02-22 2017-11-21 Sonos, Inc. Default playback device designation
US9965247B2 (en) 2016-02-22 2018-05-08 Sonos, Inc. Voice controlled media playback system based on user profile
US9978390B2 (en) 2016-06-09 2018-05-22 Sonos, Inc. Dynamic player selection for audio signal processing
US10134399B2 (en) 2016-07-15 2018-11-20 Sonos, Inc. Contextualization of voice inputs
US10152969B2 (en) 2016-07-15 2018-12-11 Sonos, Inc. Voice detection by multiple devices
US10115400B2 (en) 2016-08-05 2018-10-30 Sonos, Inc. Multiple voice services
US9942678B1 (en) 2016-09-27 2018-04-10 Sonos, Inc. Audio playback settings for voice interaction
US9743204B1 (en) 2016-09-30 2017-08-22 Sonos, Inc. Multi-orientation playback device microphones
US10181323B2 (en) 2016-10-19 2019-01-15 Sonos, Inc. Arbitration-based voice recognition
US11183181B2 (en) 2017-03-27 2021-11-23 Sonos, Inc. Systems and methods of multiple voice services
US10475449B2 (en) 2017-08-07 2019-11-12 Sonos, Inc. Wake-word detection suppression
US10048930B1 (en) 2017-09-08 2018-08-14 Sonos, Inc. Dynamic computation of system response volume
US10531157B1 (en) * 2017-09-21 2020-01-07 Amazon Technologies, Inc. Presentation and management of audio and visual content across devices
US10446165B2 (en) 2017-09-27 2019-10-15 Sonos, Inc. Robust short-time fourier transform acoustic echo cancellation during audio playback
US10621981B2 (en) 2017-09-28 2020-04-14 Sonos, Inc. Tone interference cancellation
US10051366B1 (en) 2017-09-28 2018-08-14 Sonos, Inc. Three-dimensional beam forming with a microphone array
US10482868B2 (en) 2017-09-28 2019-11-19 Sonos, Inc. Multi-channel acoustic echo cancellation
US10466962B2 (en) 2017-09-29 2019-11-05 Sonos, Inc. Media playback system with voice assistance
US10880650B2 (en) 2017-12-10 2020-12-29 Sonos, Inc. Network microphone devices with automatic do not disturb actuation capabilities
US10818290B2 (en) 2017-12-11 2020-10-27 Sonos, Inc. Home graph
WO2019152722A1 (en) 2018-01-31 2019-08-08 Sonos, Inc. Device designation of playback and network microphone device arrangements
US10600408B1 (en) * 2018-03-23 2020-03-24 Amazon Technologies, Inc. Content output management based on speech quality
JP7186375B2 (ja) * 2018-03-29 2022-12-09 パナソニックIpマネジメント株式会社 音声処理装置、音声処理方法および音声処理システム
KR102506361B1 (ko) * 2018-05-03 2023-03-06 구글 엘엘씨 오디오 쿼리들의 오버랩핑 프로세싱의 조정
US11175880B2 (en) 2018-05-10 2021-11-16 Sonos, Inc. Systems and methods for voice-assisted media content selection
US10847178B2 (en) 2018-05-18 2020-11-24 Sonos, Inc. Linear filtering for noise-suppressed speech detection
US11704533B2 (en) * 2018-05-23 2023-07-18 Ford Global Technologies, Llc Always listening and active voice assistant and vehicle operation
US10959029B2 (en) 2018-05-25 2021-03-23 Sonos, Inc. Determining and adapting to changes in microphone performance of playback devices
US10681460B2 (en) 2018-06-28 2020-06-09 Sonos, Inc. Systems and methods for associating playback devices with voice assistant services
DE102018212902A1 (de) * 2018-08-02 2020-02-06 Bayerische Motoren Werke Aktiengesellschaft Verfahren zum Bestimmen eines digitalen Assistenten zum Ausführen einer Fahrzeugfunktion aus einer Vielzahl von digitalen Assistenten in einem Fahrzeug, computerlesbares Medium, System, und Fahrzeug
US11076035B2 (en) 2018-08-28 2021-07-27 Sonos, Inc. Do not disturb feature for audio notifications
US10461710B1 (en) 2018-08-28 2019-10-29 Sonos, Inc. Media playback system with maximum volume setting
US10878811B2 (en) 2018-09-14 2020-12-29 Sonos, Inc. Networked devices, systems, and methods for intelligently deactivating wake-word engines
US10587430B1 (en) 2018-09-14 2020-03-10 Sonos, Inc. Networked devices, systems, and methods for associating playback devices based on sound codes
US11024331B2 (en) 2018-09-21 2021-06-01 Sonos, Inc. Voice detection optimization using sound metadata
US10811015B2 (en) 2018-09-25 2020-10-20 Sonos, Inc. Voice detection optimization based on selected voice assistant service
US11100923B2 (en) 2018-09-28 2021-08-24 Sonos, Inc. Systems and methods for selective wake word detection using neural network models
US10692518B2 (en) 2018-09-29 2020-06-23 Sonos, Inc. Linear filtering for noise-suppressed speech detection via multiple network microphone devices
US11899519B2 (en) 2018-10-23 2024-02-13 Sonos, Inc. Multiple stage network microphone device with reduced power consumption and processing load
EP3654249A1 (en) 2018-11-15 2020-05-20 Snips Dilated convolutions and gating for efficient keyword spotting
US11183183B2 (en) 2018-12-07 2021-11-23 Sonos, Inc. Systems and methods of operating media playback systems having multiple voice assistant services
US11132989B2 (en) 2018-12-13 2021-09-28 Sonos, Inc. Networked microphone devices, systems, and methods of localized arbitration
US10602268B1 (en) 2018-12-20 2020-03-24 Sonos, Inc. Optimization of network microphone devices using noise classification
CN109841214B (zh) * 2018-12-25 2021-06-01 百度在线网络技术(北京)有限公司 语音唤醒处理方法、装置和存储介质
US11315556B2 (en) 2019-02-08 2022-04-26 Sonos, Inc. Devices, systems, and methods for distributed voice processing by transmitting sound data associated with a wake word to an appropriate device for identification
US10867604B2 (en) 2019-02-08 2020-12-15 Sonos, Inc. Devices, systems, and methods for distributed voice processing
JP7266432B2 (ja) * 2019-03-14 2023-04-28 本田技研工業株式会社 エージェント装置、エージェント装置の制御方法、およびプログラム
EP3709194A1 (en) 2019-03-15 2020-09-16 Spotify AB Ensemble-based data comparison
US11120794B2 (en) 2019-05-03 2021-09-14 Sonos, Inc. Voice assistant persistence across multiple network microphone devices
US11361756B2 (en) 2019-06-12 2022-06-14 Sonos, Inc. Conditional wake word eventing based on environment
US11200894B2 (en) 2019-06-12 2021-12-14 Sonos, Inc. Network microphone device with command keyword eventing
US10586540B1 (en) 2019-06-12 2020-03-10 Sonos, Inc. Network microphone device with command keyword conditioning
US11138975B2 (en) 2019-07-31 2021-10-05 Sonos, Inc. Locally distributed keyword detection
US10871943B1 (en) 2019-07-31 2020-12-22 Sonos, Inc. Noise classification for event detection
US11138969B2 (en) 2019-07-31 2021-10-05 Sonos, Inc. Locally distributed keyword detection
US11094319B2 (en) 2019-08-30 2021-08-17 Spotify Ab Systems and methods for generating a cleaned version of ambient sound
US11189286B2 (en) 2019-10-22 2021-11-30 Sonos, Inc. VAS toggle based on device orientation
US11238853B2 (en) 2019-10-30 2022-02-01 Comcast Cable Communications, Llc Keyword-based audio source localization
US11200900B2 (en) 2019-12-20 2021-12-14 Sonos, Inc. Offline voice control
US11562740B2 (en) 2020-01-07 2023-01-24 Sonos, Inc. Voice verification for media playback
JP7345667B2 (ja) * 2020-01-15 2023-09-15 グーグル エルエルシー 小さいフットプリントのマルチチャネルキーワードスポッティング
US11556307B2 (en) 2020-01-31 2023-01-17 Sonos, Inc. Local voice data processing
US11308958B2 (en) 2020-02-07 2022-04-19 Sonos, Inc. Localized wakeword verification
US11308959B2 (en) 2020-02-11 2022-04-19 Spotify Ab Dynamic adjustment of wake word acceptance tolerance thresholds in voice-controlled devices
US11328722B2 (en) * 2020-02-11 2022-05-10 Spotify Ab Systems and methods for generating a singular voice audio stream
CN111402877B (zh) * 2020-03-17 2023-08-11 阿波罗智联(北京)科技有限公司 基于车载多音区的降噪方法、装置、设备和介质
US11482224B2 (en) 2020-05-20 2022-10-25 Sonos, Inc. Command keywords with input detection windowing
US11727919B2 (en) 2020-05-20 2023-08-15 Sonos, Inc. Memory allocation for keyword spotting engines
US11308962B2 (en) * 2020-05-20 2022-04-19 Sonos, Inc. Input detection windowing
US11698771B2 (en) 2020-08-25 2023-07-11 Sonos, Inc. Vocal guidance engines for playback devices
KR20220059629A (ko) * 2020-11-03 2022-05-10 현대자동차주식회사 차량 및 그의 제어방법
US11984123B2 (en) 2020-11-12 2024-05-14 Sonos, Inc. Network device interaction by range
WO2022125351A2 (en) * 2020-12-09 2022-06-16 Cerence Operating Company Automotive infotainment system with spatially-cognizant applications that interact with a speech interface
US11551700B2 (en) 2021-01-25 2023-01-10 Sonos, Inc. Systems and methods for power-efficient keyword detection
CN113327608B (zh) * 2021-06-03 2022-12-09 阿波罗智联(北京)科技有限公司 针对车辆的语音处理方法、装置、电子设备和介质
CN113380247A (zh) * 2021-06-08 2021-09-10 阿波罗智联(北京)科技有限公司 多音区语音唤醒、识别方法和装置、设备、存储介质
CN113335205B (zh) * 2021-06-09 2022-06-03 东风柳州汽车有限公司 语音唤醒方法、装置、设备及存储介质

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9922646B1 (en) * 2012-09-21 2018-03-20 Amazon Technologies, Inc. Identifying a location of a voice-input device
US11437020B2 (en) * 2016-02-10 2022-09-06 Cerence Operating Company Techniques for spatially selective wake-up word recognition and related systems and methods
US10152969B2 (en) * 2016-07-15 2018-12-11 Sonos, Inc. Voice detection by multiple devices
US10403279B2 (en) * 2016-12-21 2019-09-03 Avnera Corporation Low-power, always-listening, voice command detection and capture
US20180190282A1 (en) * 2016-12-30 2018-07-05 Qualcomm Incorporated In-vehicle voice command control
WO2018147687A1 (en) * 2017-02-10 2018-08-16 Samsung Electronics Co., Ltd. Method and apparatus for managing voice-based interaction in internet of things network system
US10374816B1 (en) * 2017-12-13 2019-08-06 Amazon Technologies, Inc. Network conference management and arbitration via voice-capturing devices

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111968642A (zh) * 2020-08-27 2020-11-20 北京百度网讯科技有限公司 语音数据处理方法、装置及智能车辆
CN111739552A (zh) * 2020-08-28 2020-10-02 南京芯驰半导体科技有限公司 一种麦克风阵列波束成形的方法及系统

Also Published As

Publication number Publication date
US20190237067A1 (en) 2019-08-01
JP2019133156A (ja) 2019-08-08

Similar Documents

Publication Publication Date Title
CN110097879A (zh) 用于车辆环境的多信道语音识别
US10481858B2 (en) Generating personalized audio content based on mood
JP6439687B2 (ja) 音声処理システム、音声処理方法、音声処理プログラム、音声処理システムを搭載した車両、および、マイク設置方法
US20220277744A1 (en) In-vehicle voice command control
CN102030008B (zh) 情绪咨询系统
CN110070868A (zh) 车载系统的语音交互方法、装置、汽车和机器可读介质
EP2987312B1 (en) System and method for acoustic echo cancellation
US9953634B1 (en) Passive training for automatic speech recognition
US20180090138A1 (en) System and method for localization and acoustic voice interface
CN109545219A (zh) 车载语音交互方法、系统、设备及计算机可读存储介质
JP7186375B2 (ja) 音声処理装置、音声処理方法および音声処理システム
US20160127827A1 (en) Systems and methods for selecting audio filtering schemes
CN109720281A (zh) 用于递送离散的自主车载通知的系统和方法
CN103220594A (zh) 用于车辆的音效调控系统
US20160284333A1 (en) Control System for Noise Generated by Functional Hardware Components
CN110992946A (zh) 一种语音控制方法、终端及计算机可读存储介质
JP2016126022A (ja) 音声処理装置
JP2016167645A (ja) 音声処理装置及び制御装置
WO2018061956A1 (ja) 会話アシスト装置および会話アシスト方法
KR20180058995A (ko) 전자 장치 및 전자 장치 제어 방법
CN102906811B (zh) 用于调节包括扬声器和麦克风的语音识别系统的方法及语音识别系统
CN107920152A (zh) 响应hvac引起的车辆麦克风抖振
CN105427881A (zh) 汽车用语音记录本系统
JP2020144204A (ja) 信号処理装置及び信号処理方法
US20140059549A1 (en) Application recognition system and method

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20190806