CN1920946A - 汽车接口 - Google Patents

汽车接口 Download PDF

Info

Publication number
CN1920946A
CN1920946A CNA2006101031106A CN200610103110A CN1920946A CN 1920946 A CN1920946 A CN 1920946A CN A2006101031106 A CNA2006101031106 A CN A2006101031106A CN 200610103110 A CN200610103110 A CN 200610103110A CN 1920946 A CN1920946 A CN 1920946A
Authority
CN
China
Prior art keywords
user
equipment
information
interface
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CNA2006101031106A
Other languages
English (en)
Inventor
张宥
杰弗里·J·法纳夫
威廉·希登
詹姆斯·T·霍塔里
李正持
瓦休·艾延加
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Bose Corp
Original Assignee
Bose Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Bose Corp filed Critical Bose Corp
Publication of CN1920946A publication Critical patent/CN1920946A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • GPHYSICS
    • G08SIGNALLING
    • G08GTRAFFIC CONTROL SYSTEMS
    • G08G1/00Traffic control systems for road vehicles
    • G08G1/09Arrangements for giving variable traffic instructions
    • G08G1/0962Arrangements for giving variable traffic instructions having an indicator mounted inside the vehicle, e.g. giving voice messages
    • G08G1/0967Systems involving transmission of highway information, e.g. weather, speed limits
    • G08G1/096733Systems involving transmission of highway information, e.g. weather, speed limits where a selection of the information might take place
    • G08G1/09675Systems involving transmission of highway information, e.g. weather, speed limits where a selection of the information might take place where a selection from the received information takes place in the vehicle
    • GPHYSICS
    • G08SIGNALLING
    • G08GTRAFFIC CONTROL SYSTEMS
    • G08G1/00Traffic control systems for road vehicles
    • G08G1/09Arrangements for giving variable traffic instructions
    • G08G1/0962Arrangements for giving variable traffic instructions having an indicator mounted inside the vehicle, e.g. giving voice messages
    • G08G1/0967Systems involving transmission of highway information, e.g. weather, speed limits
    • G08G1/096766Systems involving transmission of highway information, e.g. weather, speed limits where the system is characterised by the origin of the information transmission
    • G08G1/096775Systems involving transmission of highway information, e.g. weather, speed limits where the system is characterised by the origin of the information transmission where the origin of the information is a central station
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/26Devices for calling a subscriber
    • H04M1/27Devices whereby a plurality of signals may be stored simultaneously
    • H04M1/274Devices whereby a plurality of signals may be stored simultaneously with provision for storing more than one subscriber number at a time, e.g. using toothed disc
    • H04M1/2745Devices whereby a plurality of signals may be stored simultaneously with provision for storing more than one subscriber number at a time, e.g. using toothed disc using static electronic memories, e.g. chips
    • H04M1/2753Devices whereby a plurality of signals may be stored simultaneously with provision for storing more than one subscriber number at a time, e.g. using toothed disc using static electronic memories, e.g. chips providing data content
    • H04M1/2757Devices whereby a plurality of signals may be stored simultaneously with provision for storing more than one subscriber number at a time, e.g. using toothed disc using static electronic memories, e.g. chips providing data content by data transmission, e.g. downloading
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/60Substation equipment, e.g. for use by subscribers including speech amplifiers
    • H04M1/6033Substation equipment, e.g. for use by subscribers including speech amplifiers for providing handsfree use or a loudspeaker mode in telephone sets
    • H04M1/6041Portable telephones adapted for handsfree use
    • H04M1/6075Portable telephones adapted for handsfree use adapted for handsfree use in a vehicle
    • H04M1/6083Portable telephones adapted for handsfree use adapted for handsfree use in a vehicle by interfacing with the vehicle audio system
    • H04M1/6091Portable telephones adapted for handsfree use adapted for handsfree use in a vehicle by interfacing with the vehicle audio system including a wireless interface
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/06Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
    • G10L15/063Training

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Atmospheric Sciences (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Signal Processing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Theoretical Computer Science (AREA)
  • Computational Linguistics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Acoustics & Sound (AREA)
  • Navigation (AREA)
  • User Interface Of Digital Computer (AREA)
  • Fittings On The Vehicle Exterior For Carrying Loads, And Devices For Holding Or Mounting Articles (AREA)
  • Steering Controls (AREA)
  • Telephonic Communication Services (AREA)

Abstract

一种汽车系统提供用于汽车或其它类型的车辆中的控制和通信功能的集成用户接口。该用户接口支持语音使能的交互以及其它交互模式,例如使用诸如仪表盘或方向盘上安装的控制器的控制器的手动交互。该系统还包括到车辆中的设备的接口,例如到被带入车辆中的移动设备的无线接口。该系统还提供例如用于访问信息的、到诸如远程服务器的信息源的接口。

Description

汽车接口
技术领域
本发明涉及一种汽车接口。
背景技术
现在,汽车支持用于用户交互的各种接口。这些接口向用户提供对信息的访问(例如,导航、车辆状态)、通信(例如,蜂窝电话通话)、或控制(例如,诸如气候控制的车辆系统控制)。这种系统可以被安装在汽车中、或者远离汽车进行安装并经由通信系统来访问。已经将语音识别用于汽车中,以便允许汽车中的人和这种系统之间的口头交互(spoken interaction)。
现在,汽车提供了一些用于集成诸如蜂窝电话的外部设备的接口。例如,这种与外部设备的接口可以在外部设备和汽车系统之间使用诸如蓝牙的无线链路。
发明内容
总的来说,在一个方面,语音使能(voice-enabled)的用户接口为存储接口的一般配置信息以及存储接口的用户特有的配置信息做准备。使用所述一般配置信息和用户特有的配置信息来允许对来自用户的语音输入的处理。基于处理该语音输入的结果来有选择地更新用户特有的配置信息。
这一方面可包括以下特征中的一个或多个。
当与输入相关联的分数表明不正确的识别假设具有处于预定阈值内的分数时,对正确的输入识别进行更新。
在不需要来自用户的进一步的语音输入的情况下进行所述更新。
用户特有的配置信息包括词条的用户特有发音信息,所述词条的一般发音信息被包括在一般配置信息中。
在使用所述接口期间进行更新用户特有的配置信息。
该更新基于对来自用户的语音输入的错误识别。
更新用户特有的配置信息基于对来自用户的语音输入的识别的结果。
总的来说,在另一方面,语音使能的用户接口被配置来结合与标识符相关联的冗余或消除歧义的信息来处理该标识符的话语(utterance)。该接口可以从将标识符与所述信息相关联的数据库中检索附加或消除歧义的信息。例如,该数据库包括联系数据库。冗余或消除歧义的信息可以直接与标识符级联。作为示例,标识符包括姓名,而冗余或消除歧义的信息包括姓名的首字母。
总的来说,在另一方面,一种用于提供语音使能的用户接口的方法包括:提供接口的一组用户中的每一个的配置信息。确定该接口的用户,并且使用用于所确定的用户的配置信息来适配接口。确定用户可以包括向来自用户的口头输入施加说话者识别处理。
总的来说,在另一方面,一种经由通信介质将第一设备和第二设备相关联的方法包括:在第一设备处产生数据,将在第一设备处产生的数据呈现给用户,并且将关联请求传送到第二设备。在第二设备上,接受所述数据作为来自允许第一和第二设备的关联的用户的输入。
这一方面可以包括以下特征中的一个或多个。
第一设备是基于车辆的设备,并且第二设备是移动设备。例如,该移动设备是移动电话和PDA之一。
所述方法还包括通过按下第一设备上的按钮来启动的步骤。
将第一设备和第二设备相关联是根据蓝牙通信方案进行的。
总的来说,在另一方面,一种用于配置语音使能的用户接口的方法包括:在第一设备处,接收来自第二设备的联系数据,并且向数据源请求附加数据以扩充该联系数据。使用来自第二设备的所接收的联系数据和来自数据源的附加数据来配置用户接口。
这一方面可包括以下特征中的一个或多个。
第一设备是基于车辆的设备,并且第二设备是移动设备。
数据源驻留在远程服务器上。
向远程服务器请求的附加数据包括与联系数据中的条目(entry)有关的信息。例如,联系数据中的条目包括姓名和相关联的电话号码,并且所请求的附加数据包括与该条目相关联的地址信息。
总的来说,在另一方面,一种用于提供车辆中的语音使能的用户接口的方法包括接受来自用户的通信命令。然后,根据该通信命令确定目的地信息。然后,基于所确定的目的地信息来命令导航系统。
这一方面可以包括以下特征中的一个或多个。
所述通信命令包括电话拨号命令。
根据该通信命令确定到目的地的路线。
该通信命令包括口头命令。
所述确定基于通信命令和联系数据库中的目的地信息之间的关联。
总的来说,在另一方面,一种用于提供车辆中的语音使能的用户接口的方法包括从导航系统获得文本街道信息,并且将该文本街道信息转换为其口头等同物(equivalent)。然后,将该口头等同物呈现给用户。
总的来说,在另一方面,一种用于提供车辆中的语音使能的接口的方法包括在图形显示器上向用户呈现可视提示。该可视提示适合于由用户以该用户的周边视觉(peripheral vision)进行检测,而不需要用户直接观看显示器。
这一方面可以包括以下特征中的一个或多个。
所述可视提示与口头接口的状态有关。
呈现可视提示包括提供口头接口处于接受口头命令的状态下的指示,例如,提供口头接口已经接受了来自用户的口头命令的指示。
总的来说,在另一方面,一种用于提供车辆中的语音使能的接口的方法包括:在口头交互的开始调整与声音环境有关的一个或多个控制设置,包括在调整之前记录所述控制设置,并且,在口头交互之后恢复所述控制设置。
所述控制设置可以包括例如包含语音音量设置的音量设置、或者噪声产生设备的设置。噪声产生设备可以包括风扇。
总的来说,在另一方面,一种用于提供多模式的车辆中的用户接口的方法包括:在第一交互模式下接受命令的第一部分,检测与用户接口相关联的状况,基于所检测的状况确定第二交互模式,并且在第二交互模式下接受所述命令的第二部分。第一交互模式和第二交互模式每一个都是口头交互模式和手动交互模式之一。
这一方面可以包括以下特征中的一个或多个。
所述方法还包括向用户呈现基本上仅与第一交互模式和第二交互模式中的单个有关的用户信息。
检测与用户接口相关联的状况包括检测在用户接口的环境中的噪声水平。
进行接受所述命令的第一部分和接受所述命令的第二部分,以便提供所述命令的连续输入,而无需重复该命令的第一部分。
总的来说,在另一方面,一种用于提供语音使能的用户接口的方法包括接受词汇项的文本说明(specification),确定词汇项的发音,接受来自用户的口头输入,并且使用所确定的发音自动识别口头输入中的词汇项。如果与所识别的词汇项相关联的分数落入预定范围内,则根据所接受的口头输入确定词汇项中的一个或多个的发音。
总的来说,在另一方面,一种用于建立设备之间的关联的方法包括:在第一设备处启动关联过程,在第一设备处检测一个或多个候选设备,接受来自用户的、对候选设备的第二设备的选择,从第一设备向用户提供关联信息,将请求从第一设备传送到第二设备,以及在第二设备处接受来自用户的关联信息。
根据以下描述和权利要求,其它特征和优点是清楚的。
附图说明
图1是用于汽车或其它类型的车辆中的控制和通信功能的集成用户接口的方框图;
图2是头单元和相关设备的方框图;
图3是登记过程的流程图;
图4是更新用户特有的字典的流程图;和
图5是简化的配对过程的时序图。
具体实施方式
参考图1,汽车(automotive)系统提供用于汽车或其它类型的车辆中的控制和通信功能的集成用户接口。该用户接口支持语音使能的交互、以及其它交互模式,例如使用诸如仪表盘或方向盘上安装的控制器(例如按钮、旋钮)的控制器的手动交互。该系统还包括到车辆中的设备的接口,例如到被带入车辆中的移动设备的无线接口。该系统还提供例如用于访问信息的、到诸如远程服务器的信息源(即,没有安装在汽车中或者不与汽车一起移动的系统)的接口。
系统的头单元100链接到允许与汽车中的用户(驾驶员或另一个人)交互的其它元件。在图1所示的系统的示例型式(version)中,图形显示器110向用户提供图形输出(或其它可视提示)。用户可以使用输入112来提供手动输入,所述输入112可以包括按钮(例如,在中心控制台、方向盘上)、显示器上的可配置(“软”)按钮等。麦克风或麦克风阵列114和扬声器116分别允许对于系统的音频输入和输出。头单元100包括与诸如移动(例如蜂窝)电话120、个人数字助理(PDA)122、嵌入式电话123和便携式个人计算机124的外部设备的通信接口。在系统的这一型式中,通信链路使用采用蓝牙标准的无线方案。可替换地,可以将其它有线或无线方案用于这种通信链路。外部设备可以包括单独的用户接口,用户可以通过所述用户接口与那些设备交互。诸如移动电话120的一些外部设备提供到外部通信系统(例如到无线网络)的通信链路。所述系统还包括提供到远程服务器140的通信链路的远程数据接口118,例如无线数据收发器。
参考图2,头单元100包括一个或多个用户的简档(profile)数据240。该简档数据允许针对单独的用户适配或定制所述系统。头单元100还包括语音使能的子系统210,其允许例如使用自动语音识别(ASR)和文本-到-语音合成(TTS)进行的、系统和用户之间的基于语音的交互。语音使能的子系统210使用与说话者无关的(SI)语音配置数据212和通常不是专用于任何特定用户的其它组件,所述SI语音配置数据212包括与可由用户发出的口头命令有关的信息、以及与那些命令有关的、诸如词(word)发音的特性。在下面更详细地描述语音使能的子系统210和SI语音配置数据212。头单元还包括文本-到-语音子系统220,用于使用语言规则和字典将语言的传统文本表示变换为其口头等同物,以便实现自然发声语音输出。可以用各种方式(例如经由键盘或者仪表盘或方向盘上的控制器(按钮、旋钮等))输入所输入的文本,或者可以从来自字处理器文件、网页、数据库记录、电子邮件消息等的各种类型的文件中读取所输入的文本。头单元还包括用于基于用户口头输入来对用户进行认证的说话者验证子系统222。
应当注意,尽管在示例系统中,简档数据240、语音使能的子系统210、SI语音配置数据212均被示出为位于头单元100中,但是可替换地,以上子系统和数据(例如简档、语音配置数据)可以位于各种不同的物理组件中。
在一个示例中,语音使能的子系统210使用来自总部在Burlington,MA01803的ScanSoft公司的ASR和TTS软件。ScanSoft ASR引擎支持连续输入语音(与需要单个词的不连续话语相比)、命令和控制语法的使用(与不受约束的口头文本的口授相比)、与说话者无关的配置、以及例如使用附加话语训练特定词的配置信息来使所述配置适应于用户的能力。建立在ScanSoft ASR引擎上的示例语音使能的子系统210包括以下组件:
·特征提取器,其将语音输入转换为一系列声学特征,每个声学特征被表示为代表有限时间区域中的语音输入的特性的数值矢量。
·声学模型,其例如基于特定声音的声学特征的统计分布来提供语言中的各种语音声音的数学表示。声学模型可以通用于一类人,或者专用于一个人或一小组人。例如,与说话者无关的(SI)模型基于从很多人的语音样本中收集的数据,而与说话者有关的模型基于从一个人的语音样本中收集的数据。SI模型可以代表例如与性别或年龄相关的一类人(例如男模特、女模特、或儿童模特等)。以声学模型表示的声音可以与基于音节的、基于音素的、或者基于与上下文有关的音素的特定词(例如,不一定基于词的语言结构)相关联。
·语法,其描述可以说的有效短语、或者确定可以说哪些句子的规则。例如,可以使用文本表示(例如BNF、Backus-Naur形式)来表示语法。
·字典,其根据以声学模型表示的声音来提供词和那些词或整个短语的表示之间的映射。例如,在基于音素的声学模型中,字典列出词或短语的音标,所述词或短语的每一个被表示为音素序列、可替换序列的列表、或者其中每条路径(例如通过利用音素标记网络中的弧)表示一特定序列的网络。与声学模型一样,字典可以是通用或专用的。例如,在系统的一个型式中,使用SI字典、以及用于在字典中最初没有被发现或被适当地表示的词的SD例外字典。
·字素-到-音素(G2P)模块,其是将书面文本串转换为类似于字典的标音(transcription)的自动系统。
·运行时间配置引擎,其将语法和一个或多个字典(例如,SI字典和例外字典)相结合,以便计算运行时间配置数据。
·识别引擎,其根据运行时间配置数据而将语音输入特征与声学模型进行比较,以便提供最佳匹配作为结果。
在上述示例语音使能的子系统中,SI语音配置数据212包括字典和语法。根据语音使能的子系统210的特定实现,SI语音配置数据212可以包括更多或更少的组件。
用户的简档数据240包括联系数据242,例如,所述联系数据242包括人的姓名(或者等同地,地点、企业实体等)和其它相关联的条目,例如电话号码、地址、兴趣点(POI)、日历或日程表、以及用于提供关于人或POI的信息的任何条目(例如描述POI事件或过去的访问经历的备忘录)。简档数据240还包括该用户特有的、与说话者有关的(SD)语音配置数据244。如下面更充分地描述的那样,SD语音配置数据244包括可提高准确性的信息,利用该信息,语音使能的子系统210能够例如通过包括用户所说的姓名的用户特有的发音来识别用户的话语。通常,SD语音配置数据244包括由于训练而产生的、来自ASR引擎的配置数据的修改或更新的部分,例如示例语音使能的子系统中的字典中的用户特有的词标音条目和重新编辑的语法。
头单元100还包括无线子系统230,其提供用于建立和维持与诸如移动电话120的外部设备的通信的通信服务。无线子系统230和移动电话120分别包括配对模块232和252,当外部设备(例如,电话120、PDA 122或计算机124)在头单元100附近时,所述配对模块232和252执行用于建立通信的过程。稍后在此描述中讨论该配对过程的细节。
可耦接到头单元100的外部设备任选地包括由头单元100使用的数据。例如,如图2所示,移动电话120包括可包含姓名和对应的电话号码的联系数据250,并且任选地包括附加信息,例如联系人(例如人、地点或用户知道的实体)的街道地址。在一种操作模式中,当移动电话与头单元100通信并且被用来更新或增加用户的简档数据240的联系数据242时,将这种联系数据250通过无线子系统230传递给头单元100。
以各种方式(例如从CD/DVD、硬驱动器、远程服务器、PDA、蜂窝电话等)将头单元100中的联系数据242提供给所述单元,并且将所述联系数据242用于诸如免提姓名拨号的任务。头单元可以例如基于从外部设备提供的数据,接受联系数据的语音登记和基于文本的登记。在语音登记中,用户可以在汽车中说出姓名和号码,并且头单元记录那些姓名和对应的号码(例如处理那些姓名和对应的号码并且存储其处理后的表示)并将其注册。然后,头单元的语音使能的子系统210将这些记录的姓名用于诸如语音使能的拨号的任务,在所述语音使能的拨号中,用户稍后说出先前注册的姓名,并且系统通过耦接到头单元的蜂窝电话来拨号对应的号码。
参考图3,在基于文本的登记中,将姓名(例如人、地点、实体或其它项目(例如歌曲或音频盘的标题)作为输入310(即,以文本的形式)提供给头单元,并且系统扩充SI语音配置数据212,以便接受和识别包括那些姓名的口头话语。然后,语音使能的子系统210使用SI语音配置数据212来处理口头用户输入330。语音使能的子系统也可以使用口头用户输入330来确定SD语音配置数据244。其一个示例是语音登记模式,其中,用户说出要由系统识别的命令或姓名,而不是提供文本输入310。在其它示例中(其中一些将在下面进一步讨论),使用口头用户输入330来更新与SI语音配置数据212一起使用的SD语音配置数据244。在一种情况下,当仅使用SI语音配置数据212的识别不成功时,启动语音登记,以便更新SD语音配置数据244。以这一方式,仅仅所述配置数据的所选部分需要具有SD组件,从而提供由文本登记提供的便利、以及由使用语音登记而获得的SD配置数据所提供的准确性。
作为可由系统识别的姓名或命令的基于文本的说明的一个示例,当头单元100与外部设备通信时,例如从移动电话120中的联系数据250将基于文本的信息(例如,拼写出的姓名或其它词的表示)下载到头单元。然后,头单元的语音使能的子系统使用确定该文本信息的发音(“表音的拼写”)的自动方法、例如字典查阅320或自动字素-到-音素过程322,并且使系统能够接受和处理包括来自文本登记的姓名或其它词的口头命令。例如,将传统的SI语音识别技术用于处理文本信息,并且用于基于该文本信息来识别包括词(词汇)的用户话语。
除了基于语音和基于文本的登记方案以外,头单元100还使用另外的方案来登记用户可能在口头命令中使用的词汇。这些另外的方案中的一些旨在解决与语音子系统对于被系统接受的词所使用的发音的准确性有关的问题。例如,这些问题可能涉及难以预测的标准发音,或者涉及例如由于外国口音而导致的、或者更一般地基于用户的国家、地区、文化或语言背景的用户特有的发音。
语音使能的子系统210用来根据文本表示确定词的发音的一个方案包括访问SI字典。对于SI字典中的词,语音识别引擎在处理来自用户的音频输入以确定是否说出了包括这些词的话语时使用所述发音。包括大到足以涵盖例如作为从外部设备下载的结果而动态添加到系统中的所有姓名或新词的字典可能是不切实际的。语音使能的子系统210所使用的第二方案包括执行自动字素-到-音素(G2P)过程,以接受词的文本表示并且输出在字典中使用的类型的表示。用于G2P过程的字典和语音配置数据被包括在通常不专用于任何特定用户的SI语音配置数据212中。
由于不能总是准确地预先预测姓名的发音的事实,姓名识别可能是具有挑战性的。类似地,G2P过程通常不专用于用户的特性,例如他或她的母语和本国文化。
语音使能的子系统210可以使用不一定专用于任何特定用户的SI语音配置数据212、以及来自特定用户的简档数据240的SD语音配置数据244的组合。例如,同时使用这两种类型的配置数据来识别口头用户输入。可替换地,可以先使用SI配置数据212,然后,根据在该使用中确定的匹配或分数,使用SD数据244,或者比较基于SI语音配置数据212和SD配置数据244的识别分数,并且将基于比较而选择一个。
用于语音识别的一个方案使用两个步骤来确定用户特有的发音。首先,从包括变体的字典、或者从产生例如网络表示中的多个变体的G2P过程来确定词的多个发音的集合。在第二步骤中,例如,基于来自用户的口头输入,选择单个最佳匹配发音(或者更一般地说,多个匹配发音的最佳匹配子集)。
当系统使用用于特定用户的SD语音配置数据244时,在系统的一些型式中,它还保持对SI配置数据212的支持。以这一方式,如果系统正在使用一用户的简档数据,但是另一用户说出命令,那么即使与所述简档数据相关联的用户具有非常特殊的配置,也可以识别其他用户的话语。
用来产生SD语音配置数据244的另一方案取决于用户的口头输入。例如,语音使能的子系统210提供这样的能力,其用来校正通过仅使用与说话者无关的字典而可能出现的一些不准确的、与说话者无关的音标(phonetictranscription)。这一能力在确定要在自动语音识别中使用的发音时使用用户的话语。一种这样的方案是要求用户说出所有新姓名,以便确定要在识别中使用的发音。优选地,系统自动训练用户的姓名发音,并且对是否使用SI字典/规则来确定用户的用户特有发音做出判定,而不一定需要用户介入或知晓该过程。
在系统的一个型式中,使用SI字典和G2P过程来在诸如用于特定语音任务的语法的识别语法中形成所有词的语音表示。这种任务的示例是语音拨号,其中,用户可以在较长命令的情况下说出姓名(例如,“请呼叫JohnSmith”)。此外,系统支持使用专用于特定用户的例外字典。例外字典的一个用途是包括特定词的附加表示。例如,如果用户具有发出“Smith”的音的特殊方式,则系统可以将例外字典配置为包括该词的例外条目。当运行时间配置引擎计算由该引擎使用的运行时间配置数据时,在识别语法中表示词“Smith”时,运行时间配置引擎包括SI发音和例外发音二者。可替换地,仅使用例外发音来产生运行时间配置数据。可替换地,为了容纳姓名的用户特有发音,系统将新词引入例外字典,例如Smith-1,并且修改语法,以便允许原始的Smith和词Smith-1二者。因此,即使例外字典比SI字典优先,识别引擎在处理输入话语时也将接受该词的两种形式。在下面的讨论中,更新字典可对应于如上所述的添加或更新例外字典中的条目。
参考图4,由语音使能的子系统210(参见图2)执行的过程包括:在操作中(即,不一定在训练模式下)接受口头用户输入330(参见图3);以及根据这一输入,有可能更新包括所述话语中的一个或多个词的用户特有发音的用户特有字典。在这一过程中,语音使能的子系统识别这样的话语,所述话语包括诸如来自用户语音命令的姓名的词或短语(步骤410)。引擎以与所识别的假设相关联的置信度C1的形式(或其它分数形式)提供指示该假设与所述话语匹配的程度的分数。如果置信度超过了预设的阈值T1(步骤412),则系统继续进行,而不更新字典(到步骤440的分支)。如果置信度低于第二低的阈值T2(步骤414),则系统拒绝该话语(步骤430),而不更新字典。然而,当置信度C1在这两个阈值所限定的范围内时,系统进入“不确定”状态420。
在“不确定状态”下,系统例如使用进一步的提示和来自用户的口头或其它模式的输入确认所述假设,来验证来自用户的正确回答(步骤422),或者由于用户基于所识别的回答接受而不是取消动作而隐含地验证来自用户的正确回答(步骤422)。当来自用户的响应验证了系统没有正确地识别词/短语时,将不会采取动作来更新用户的个人发音。当来自用户的响应验证系统正确地识别出正确的词/短语、但是其不具有高置信度时(步骤424),系统进入更新SD配置数据的训练模式(步骤426)。在此训练模式下,系统处理话语,并且基于该话语来更新用户特有的字典。对于建立在ScanSoft ASR引擎上的示例系统,训练包括以下步骤:
·收集用户话语或使用先前保存的话语
·产生用户词标音
·将用户词标音添加到(例外)字典中
·重新编辑使用所述词的语法
·所述引擎将使用新语法来识别语音输入。
在一些实施例中,当用户稍后说出相同的词或短语时,如果使用更新的SD字典的置信度C2和使用SI字典的置信度C1之间的差大于预定阈值(T3),则将使用更新的SD字典,否则,将继续使用SI字典。
语音使能的子系统210提供可提高姓名的口头输入的准确性的另一能力。总的来说,该方案包括:如同在“John Smith J.S.”中那样,用户例如通过在姓名的话语之后附加诸如首字母的附加信息,来在说出姓名时添加附加信息。例如在从姓名中直接导出的首字母或从姓名中唯一确定的其它信息的情况中,所述附加信息可以是冗余的,或者所述附加信息可以是消除歧义的信息,例如,所述消除歧义的信息在具有与该姓名相关联的多个条目的联系数据库中识别“John Smith”的特定示例。在用户从联系数据中选择联系人的输入任务中,使用联系数据来构造接受具有这种附加信息的话语的识别语法。用户通过呼叫姓名(例如“呼叫John Smith”)来呼叫联系人。然而,对于不常见和/或易混淆的姓名,所述引擎可能不会准确地识别它。语音识别子系统使用例如由两个字母组成的额外信息来将正确的识别假设与不正确的错误识别的假设区分开。
基于这一方案的另一示例如下:
系统:请说出姓名和号码。
用户:在家的Bob Smith。
系统:对不起,请再说一遍。
用户:在家的Bob Smith的电话。
系统:非常抱歉,让我们用另一种方式来试一试,请说出跟随有名和姓的首字母的人名。
用户:在家的Bob Smith B S。
系统:呼叫在家的Bob Smith。
在由外部设备提供联系数据的上述方案中,数据可能是不完整的。例如,地址信息(导航组件可能需要该地址信息)可能从用户的联系数据中丢失,而电话号码存在。该系统的特征是:可以在头单元中将丢失信息自动或手动地添加到所述数据中。这通过访问例如远程服务器140(参见图1)处的外部信息源来实现。例如,经由无线网络系统而通过因特网访问“白页”号码簿。例如,如在“首先呼叫居住在Maple街上的John Smith”或者“呼叫其工作电话号码是508-555-1212的John Smith”中那样,可以在语音命令中使用所添加的丢失信息。这种更加复杂的口头输入可以在自动识别中获得更高的准确性。对于困难的识别问题(例如,两个John Smith),由于使用这些额外信息,系统仍然可以提供与说话者无关的模式,而不必切换到冗长乏味的与说话者有关的模式。例如,呼叫“Oak街上的John Smith”相对于呼叫“Water drive上的John Smith”。
丢失信息也可以由诸如导航系统的其它子系统使用。例如,用户可以大声说出POI(例如饭馆)的名称,系统将自动地从联系数据中提取地址信息,并且使用所提取的地址信息来命令导航子系统。可以将每个联系数据记录的多个条目(蜂窝电话号码、家庭号码、工作电话号码、优选的联系列表等)全部呈现给用户,以供用户选择或者供系统使用。在一些方面,当用户例如通过语音(例如口头姓名或数字序列)或通过手动输入来提供电话拨号命令(或关于与特定目的地的通信的其它类型的命令)时,导航系统可以自动确定到与电话拨号命令相关联的地点的路线、或者示出与电话拨号命令相关联的地点的地图。
在系统的另一方面,使用说话者识别能力来确定所存储的一组用户中的哪一个正在与系统交互。此说话者识别设置用于系统的用户特有偏好。该偏好可包括用户特有的联系数据、用户特有的发音、或其它偏好。可以使用各种技术来确定哪个用户正在与系统交互。例如,可以使用与头单元配对的特定外部设备(例如移动电话)来识别用户。说话者验证子系统222也可以用于用户识别。可替换地,使用其它合适的技术,例如密码、指纹、面部识别等。
说话者识别可以使系统更加用户友好,并且能够提供个性化服务。此外,语音接口可以使用与正被控制的系统相关联的信息。以这一方式,可以使用户接口更加“智能”。作为另一示例,当语音识别子系统没有识别出用户所说的词或短语时,该子系统可以基于用户偏好和历史来提供可能的替换物的列表:“您是指John Smith还是John Steve”,来代替重复“请再说一遍”。还可以使用来自用户的正确回答来训练所述引擎,以便如上所述产生与说话者有关的语法和字典。
在口头用户接口系统中,期望向用户提供系统状态的反馈。例如,提供系统处于“倾听”状态的反馈可能是有用的。在汽车应用中,驾驶员还期望不必从道路转移视线来进行用户交互。一个方案是例如以音调和蜂鸣声的形式或者以所记录或合成的提示的形式提供音频反馈。另一方案是提供不需要驾驶员从道路转移视线的可视反馈。更具体地说,头单元产生可由驾驶员使用他或她的周边视觉感知的可视指示符。这种可视指示符的一个示例使用图形显示器的比较大的区域,例如基本上整个区域。使用在所述区域上的可视颜色或亮度的改变来指示系统的状态。例如,使用特定的颜色来指示系统麦克风准备倾听用户的语音输入。例如,使用用户的周边视觉,所述区域和颜色对于他或她来说足够明显的,而用户不必直接观看显示器。
在系统的另一方面中,当头单元检测到语音识别引擎可能遇到困难的噪声状况时,它警告用户。系统测量噪声水平(level),并且当不推荐进行语音识别时警告用户。当用户试图使用语音识别输入时,系统测量驾驶室里的声学噪声水平,并且如果驾驶室中变得太嘈杂,则通知用户。如前面讨论的那样,该警告可以采用音频、视频或可视指示符的形式。系统还可以通过自动切换或者向用户推荐以进行选择来转变为另一命令模式。通常,当在车辆内检测到过量噪声时,可以通过事件触发例如从语音接口到经由显示器上的触摸屏的手动输入的模式转变。在本发明的再一方面,可以使所述转变平滑和连续,使得系统可以跟踪用户与系统的交互的状态,并且继续进行用户命令经历。例如,用户正通过使用语音接口说出电话号码,但是由于噪声触发的模式转变而尚未将其完成,当从语音接口模式转变为手动输入模式时,系统可以持有(port)不完整的、所说出的电话号码,并且将它们显示在显示器上,以供用户继续和完成该呼叫。
通常,用于用户交互的接口包含诸如语音、触摸、显示器和其它传感器的多个输入模式,系统通过显示或示出来仅呈现与所使用的模式有关的信息,以避免像现有技术中那样将用户埋在大量信息中,甚至这些信息对于当前使用模式下的命令不是必需的。例如,当在语音接口模式下时,将不会示出诸如显示器上的软键的触摸输入,当选择了诸如硬驱动器的音频源时,在显示器上既不示出FM,也不示出AM。提供这种多模式用户接口的一个示例包括在语音输入模式下接受命令的第一部分。检测与用户接口相关联的状况。例如,检测到高噪声水平。系统基于该噪声水平确定应当使用手动模式。然后,在手动模式下接受命令的第二部分。例如,所述命令的第一和第二部分可以形成平滑和连续的转变,而不需要使用手动输入重复所说出的所述命令的第一部分。
在系统的另一方面,头单元恢复在“语音命令”序列期间改变的环境设置。这种环境设置可以包括风扇速度或音乐音量。例如,头单元可以在语音输入期间旋小音乐的音量、或者减小风扇的速度,并且在口头交互结束时将它们恢复。
头单元100的另一方面涉及特别是使用蓝牙无线通信标准来提供到外部设备的接口。根据该标准所详细说明的协议,当将两个蓝牙设备“配对”时,它们可以共享数据,并且互相发送控制信号。例如,车辆中的语音接口单元可以通过蓝牙来与PDA或蜂窝电话通信,以便下载存储在该设备中的联系列表。用于该配对过程的典型方案需要以安全的方式将两个设备相互介绍给对方。一个设备“发现”另一个设备,并且在这两个设备之间传递公共代码。
通常,头单元通过将智能加入所述设备之一以简化所述步骤并且减轻用户的负担,来执行可提高配对效率的简化的配对过程。参考图5,这种简化的配对过程的示例包括如下交互序列。在此示例中,“设备A”是头单元,并且“设备B”是例如移动电话。
1)用户通过按下启动与蓝牙设备的交互的按钮来在设备A上启动配对(步骤510)。例如,在将头单元与便携式移动电话配对的免提电话应用中,用户按下耦接到头单元的讲话按钮。用户不需要知道任何专门的配对序列。
2)设备A自动检测到配对是必要的(步骤520),在所述区域中搜索可用设备,并且向用户呈现选项。例如,头单元显示车辆中的设备(例如移动电话和PDA)的列表。
3)用户在设备A的用户接口上选择设备B(步骤530)。
4)设备A自动产生随机代码,例如经由显示器向用户呈现该代码,并且向设备B发送连接请求(步骤540),所述显示器可以是设备A的显示器或诸如头单元显示器的单独显示器。
5)设备B从设备A接收连接请求。用户具有接受带有所述随机代码的请求的选择权(步骤550)。
6)用户在设备B上接受所述请求(步骤560)。
这一方案可以避免对于将两个设备设置为配对/发现模式的需要。
头单元为汽车内的很多系统提供接口。两个这样的系统包括导航系统和移动电话系统。所述系统的一个方面在于:在配置用户接口和相关联的系统时,可以使用所下载的联系信息。这一配置可以包括提供基于联系信息来输入导航目的地信息的能力。例如,可以使用人的姓名作为对导航目的地的说明。在一些情况下,在从外部设备下载的信息中不能获得对应的地址信息,而是从诸如电话“白页”系统的远程信息提供者下载所述对应的地址信息。与联系信息的可用性有关的另一能力涉及一方的说明以便基于姓名和其它有关信息的组合(例如“Main街上的John Smith”或“在办公室里的John Smith”)来进行呼叫。该附加的有关信息可用来消除号码的歧义以便进行呼叫,并且即使在仅基于姓名也不存在歧义时也可以提高识别准确性。
所述系统的另一方面是:可以通过文本-到-语音转换而用语音向驾驶员提供信息,例如在显示器上示出的来自导航数据库的文本:街道名称、方向(右、左、直行等)。例如,代替在导航地图上示出街道名称和与其的距离,或者除了在导航地图上示出街道名称和与其的距离之外,语音使能的子系统可以说出“请在下一个四分之一英里处左转到 Main街上”。在一个实现中,可以经由TTS获得突出的“Main街”,而其它内容可被预先记录。
可以在头单元的各种型式中实现上述方面中的一个或多个。也就是说,可以在不同的实施例中组合所述能力的组合。该系统可应用于各种类型的车辆以及其它非车辆用户环境。可以使用硬件、软件或硬件和软件的组合来实现头单元。所述软件包括存储在介质上(例如存储在只读存储器中或盘驱动器上)、并且可在嵌入在头单元中的处理器上执行的指令。
应当理解,前面的描述意欲说明而不是限制由所附权利要求的范围限定的本发明的范围。其它实施例处于下述权利要求的范围内。

Claims (46)

1.一种用于提供语音使能的用户接口的方法,包括:
配置所述接口来处理语音输入的话语。
2.如权利要求1所述的方法,其中,处理语音输入的话语包括:结合与标识符相关联的冗余或消除歧义的信息处理该标识符。
3.如权利要求1所述的方法,还包括:从将标识符与所述信息相关联的数据库中检索所述附加或消除歧义的信息。
4.如权利要求3所述的方法,其中,所述数据库包括联系数据库。
5.如权利要求2所述的方法,其中,冗余或消除歧义的信息直接与标识符级联。
6.如权利要求2所述的方法,其中,标识符包括姓名,而冗余或消除歧义的信息包括姓名的首字母。
7.如权利要求1所述的方法,还包括:
存储接口的一般配置信息;
存储接口的用户特有的配置信息;
允许使用所述一般配置信息和用户特有的配置信息来处理来自用户的语音输入;以及
基于处理语音输入的结果来有选择地更新所述用户特有的配置信息。
8.如权利要求7所述的方法,其中,当与输入相关联的分数表明不正确的识别假设具有处于预定阈值内的分数时,对正确的输入识别进行更新。
9.如权利要求8所述的方法,其中,在不需要来自用户的进一步语音输入的情况下进行更新。
10.如权利要求7所述的方法,其中,用户特有的配置信息包括词条的用户特有的发音信息,所述词条的一般发音信息被包括在一般配置信息中。
11.如权利要求7所述的方法,其中,在使用所述接口期间进行更新用户特有的配置信息。
12.如权利要求11所述的方法,其中,所述更新基于来自用户的语音输入的错误识别。
13.如权利要求11所述的方法,其中,更新用户特有的配置信息基于来自用户的语音输入的识别的结果。
14.如权利要求1所述的方法,还包括:
提供该接口的多个用户的每一个的配置信息;
确定该接口的用户;以及
使用所确定的用户的配置信息来适配该接口。
15.如权利要求14所述的方法,其中,确定所述用户包括向来自用户的口头输入施加说话者识别处理。
16.如权利要求1所述的方法,在配置所述接口来处理语音输入的话语之前,该方法包括:
接受词汇项的文本说明;
确定该词汇项的发音;
在配置所述接口来处理语音输入的话语之后,使用所确定的发音来自动识别口头输入中的词汇项;以及
如果与所识别的词汇项相关联的分数落在预定范围内,则根据所接受的口头输入确定所述词汇项中的一个或多个的发音。
17.如权利要求1所述的方法,其中,语音输入包括来自用户的通信命令,所述方法还包括:
根据该通信命令确定目的地信息,以及
基于所确定的目的地信息命令导航系统。
18.如权利要求17所述的方法,其中,该通信命令包括电话拨号命令。
19.如权利要求17所述的方法,还包括:确定到根据该通信命令确定的目的地的路线。
20.如权利要求17所述的方法,其中,该通信命令包括口头命令。
21.如权利要求17所述的方法,其中,所述确定步骤基于通信命令和联系数据库中的目的地信息之间的关联。
22.如权利要求1所述的方法,还包括:
在第一设备处,接收来自第二设备的联系数据;
在第一设备处,向数据源请求附加数据以扩充联系数据;以及
使用来自第二设备的所接收的联系数据和来自数据源的附加数据来配置用户接口。
23.如权利要求22所述的方法,其中,第一设备包括基于车辆的设备,而第二设备包括移动设备。
24.如权利要求22所述的方法,其中,数据源驻留在远程服务器处。
25.如权利要求22所述的方法,其中,向远程服务器请求的附加数据包括与联系数据中的条目有关的信息。
26.如权利要求25所述的方法,其中,联系数据中的条目包括姓名和相关联的电话号码,并且所请求的附加数据包括与该条目相关联的地址信息。
27.如权利要求1所述的方法,还包括:
从导航系统获得文本街道信息;
将文本街道信息转换为其口头等同物;以及
将该口头等同物呈现给用户。
28.如权利要求1所述的方法,还包括:
在图形显示器上向用户呈现可视提示,其中,该可视提示适合于由用户以该用户的周边视觉进行检测,而不需要用户直接观看显示器。
29.如权利要求28所述的方法,其中,可视提示与口头接口的状态有关。
30.如权利要求29所述的方法,其中,呈现可视提示包括:提供口头接口处于接受口头命令的状态下的指示。
31.如权利要求29所述的方法,其中,呈现可视提示包括:提供口头接口已经接受来自用户的口头命令的指示。
32.如权利要求1所述的方法,还包括:
在语音输入交互开始时,调整与声音环境有关的一个或多个控制设置,包括在调整之前记录该控制设置;以及
在口头交互之后恢复所述控制设置。
33.如权利要求32所述的方法,其中,控制设置包括音量设置。
34.如权利要求33所述的方法,其中,音量设置包括语音音量设置。
35.如权利要求32所述的方法,其中,控制设置包括噪声产生设备的设置。
36.如权利要求35所述的方法,其中,该噪声产生设备的设置包括风扇设置。
37.一种用于提供多模式的车辆中的用户接口的方法,包括:
在第一交互模式下接受命令的第一部分;
检测与用户接口相关联的状况;
基于所检测的状况确定第二交互模式;以及
在第二交互模式下接受命令的第二部分;
其中,第一交互模式和第二交互模式每一个都是口头交互模式和手动交互模式之一。
38.如权利要求37所述的方法,还包括:向用户呈现基本上仅与第一交互模式和第二交互模式中的单个有关的信息。
39.如权利要求37所述的方法,其中,检测与用户接口相关联的状况包括检测用户接口的环境中的噪声水平。
40.如权利要求37所述的方法,其中,进行接受所述命令的第一部分和接受所述命令的第二部分,以便提供命令的连续输入,而无需重复所述命令的第一部分。
41.一种经由通信介质将第一设备和第二设备相关联的方法,包括:
在第一设备处产生数据;
将在第一设备处产生的数据呈现给用户;
将关联请求传送给第二设备;
在第二设备上,接受所述数据作为允许第一和第二设备的关联的、来自用户的输入。
42.如权利要求41所述的方法,其中,第一设备包括基于车辆的设备,而第二设备包括移动设备。
43.如权利要求42所述的方法,其中,移动设备包括移动电话和PDA之一。
44.如权利要求41所述的方法,还包括通过按下第一设备上的按钮来启动的步骤。
45.如权利要求41所述的方法,还包括:根据蓝牙通信方案将第一设备和第二设备相关联。
46.如权利要求41所述的方法,还包括:
在第一设备处启动关联过程;
在第一设备处检测一个或多个候选设备;
接受来自用户的、对候选设备的第二设备的选择;
将关联信息从第一设备提供给用户;
将请求从第一设备传送到第二设备;以及
在第二设备处接受来自用户的关联信息。
CNA2006101031106A 2005-07-01 2006-07-03 汽车接口 Pending CN1920946A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US11/173,736 US7826945B2 (en) 2005-07-01 2005-07-01 Automobile speech-recognition interface
US11/173,736 2005-07-01

Publications (1)

Publication Number Publication Date
CN1920946A true CN1920946A (zh) 2007-02-28

Family

ID=37074976

Family Applications (1)

Application Number Title Priority Date Filing Date
CNA2006101031106A Pending CN1920946A (zh) 2005-07-01 2006-07-03 汽车接口

Country Status (4)

Country Link
US (1) US7826945B2 (zh)
EP (1) EP1739546A3 (zh)
JP (1) JP2007011380A (zh)
CN (1) CN1920946A (zh)

Cited By (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102439661A (zh) * 2009-03-24 2012-05-02 Atx集团股份有限公司 用于车辆内自动交互的面向服务语音识别
CN102576348A (zh) * 2009-10-15 2012-07-11 爱尔比奎特公司 机动车辆软件应用和服务的集中化管理
CN102959359A (zh) * 2010-05-04 2013-03-06 大众汽车有限公司 用于运行用户接口的方法和设备
CN103187053A (zh) * 2011-12-31 2013-07-03 联想(北京)有限公司 输入方法和电子设备
CN104078045A (zh) * 2013-03-26 2014-10-01 联想(北京)有限公司 一种识别的方法及电子设备
CN104813142A (zh) * 2012-12-06 2015-07-29 高通股份有限公司 通过装置上和交通工具上信息的同时使用来确定位置、速度和/或航向
CN104865866A (zh) * 2014-02-20 2015-08-26 福特全球技术公司 乘员通信系统和控制方法
CN105006229A (zh) * 2014-04-24 2015-10-28 福特全球技术公司 用于包括车辆更新的额外车辆语音识别训练的方法和设备
CN105957522A (zh) * 2015-03-09 2016-09-21 福特全球技术公司 基于语音配置文件的车载信息娱乐身份识别
CN106104672A (zh) * 2014-02-28 2016-11-09 博士有限公司 音频源的直接选择
CN102959359B (zh) * 2010-05-04 2016-12-14 大众汽车有限公司 用于运行用户接口的方法和设备
CN103782570B (zh) * 2011-09-06 2016-12-21 戴姆勒股份公司 移动通信终端设备与机动车中央计算单元的自动耦合方法
CN106663428A (zh) * 2014-07-16 2017-05-10 索尼公司 装置、方法、非暂态计算机可读介质及系统
CN107396074A (zh) * 2016-05-17 2017-11-24 谷歌公司 用于车辆的无线用户接口投影
CN108153507A (zh) * 2016-12-02 2018-06-12 上海博泰悦臻电子设备制造有限公司 一种语音交互方法、系统及一种车机
CN108352167A (zh) * 2015-10-28 2018-07-31 福特全球技术公司 包括可佩戴设备的车辆语音识别
CN108604447A (zh) * 2016-02-03 2018-09-28 索尼公司 信息处理装置、信息处理方法和程序
WO2019119771A1 (zh) * 2017-12-20 2019-06-27 深圳Tcl新技术有限公司 语音交互方法、装置及计算机可读存储介质
CN111095400A (zh) * 2017-07-28 2020-05-01 赛伦斯运营公司 选择系统和方法
CN111492641A (zh) * 2017-12-27 2020-08-04 斯堪尼亚商用车有限公司 用于与车辆通信的方法和控制单元

Families Citing this family (393)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2001013255A2 (en) 1999-08-13 2001-02-22 Pixo, Inc. Displaying and traversing links in character array
US8645137B2 (en) 2000-03-16 2014-02-04 Apple Inc. Fast, language-independent method for user authentication by voice
ITFI20010199A1 (it) 2001-10-22 2003-04-22 Riccardo Vieri Sistema e metodo per trasformare in voce comunicazioni testuali ed inviarle con una connessione internet a qualsiasi apparato telefonico
DE102005030965B4 (de) * 2005-06-30 2007-07-19 Daimlerchrysler Ag Erweiterung des dynamischen Vokabulars eines Spracherkennungssystems um weitere Voiceenrollments
US7826945B2 (en) * 2005-07-01 2010-11-02 You Zhang Automobile speech-recognition interface
WO2007008248A2 (en) * 2005-07-11 2007-01-18 Voicedemand, Inc. Voice control of a media player
JP4899685B2 (ja) * 2005-09-02 2012-03-21 株式会社デンソー 手動操作システム
US8677377B2 (en) 2005-09-08 2014-03-18 Apple Inc. Method and apparatus for building an intelligent automated assistant
US7633076B2 (en) 2005-09-30 2009-12-15 Apple Inc. Automated response to and sensing of user activity in portable devices
TWI302691B (en) * 2005-10-21 2008-11-01 Delta Electronics Inc Portable electronic device with speech synthesize and music prelude functions
US20070124147A1 (en) * 2005-11-30 2007-05-31 International Business Machines Corporation Methods and apparatus for use in speech recognition systems for identifying unknown words and for adding previously unknown words to vocabularies and grammars of speech recognition systems
US8060821B2 (en) * 2005-12-09 2011-11-15 Apple Inc. Enhanced visual feedback of interactions with user interface
CN101331036B (zh) * 2005-12-16 2011-04-06 松下电器产业株式会社 移动体用输入装置及方法
US9976865B2 (en) * 2006-07-28 2018-05-22 Ridetones, Inc. Vehicle communication system with navigation
GB2440766B (en) * 2006-08-10 2011-02-16 Denso Corp Control system
US9318108B2 (en) 2010-01-18 2016-04-19 Apple Inc. Intelligent automated assistant
US8214219B2 (en) * 2006-09-15 2012-07-03 Volkswagen Of America, Inc. Speech communications system for a vehicle and method of operating a speech communications system for a vehicle
US7831431B2 (en) * 2006-10-31 2010-11-09 Honda Motor Co., Ltd. Voice recognition updates via remote broadcast signal
US7873517B2 (en) * 2006-11-09 2011-01-18 Volkswagen Of America, Inc. Motor vehicle with a speech interface
US8386125B2 (en) * 2006-11-22 2013-02-26 General Motors Llc Adaptive communication between a vehicle telematics unit and a call center based on acoustic conditions
US8391775B2 (en) * 2007-03-09 2013-03-05 Airbiquity Inc. Mobile digital radio playlist system
US8977255B2 (en) 2007-04-03 2015-03-10 Apple Inc. Method and system for operating a multi-function portable electronic device using voice-activation
JP4225356B2 (ja) * 2007-04-09 2009-02-18 トヨタ自動車株式会社 車両用ナビゲーション装置
DE102007016887B3 (de) * 2007-04-10 2008-07-31 Siemens Ag Verfahren und Vorrichtung zum Betreiben eines Navigationssystems
JP2008275987A (ja) * 2007-05-01 2008-11-13 Yamaha Corp 音声認識装置および会議システム
US9423996B2 (en) * 2007-05-03 2016-08-23 Ian Cummings Vehicle navigation user interface customization methods
DE102007021772B4 (de) * 2007-05-09 2013-01-24 Voicecash Ip Gmbh Digitales Verfahren und Anordnung zur Authentifizierung eines Nutzers einer Datenbasis
WO2008149482A1 (ja) * 2007-06-05 2008-12-11 Mitsubishi Electric Corporation 車両用操作装置
US20090055180A1 (en) * 2007-08-23 2009-02-26 Coon Bradley S System and method for optimizing speech recognition in a vehicle
US20090055178A1 (en) * 2007-08-23 2009-02-26 Coon Bradley S System and method of controlling personalized settings in a vehicle
DE102007043935A1 (de) * 2007-09-12 2009-03-19 Volkswagen Ag Fahrzeugsystem mit Hilfefunktionalität
US20090083035A1 (en) * 2007-09-25 2009-03-26 Ritchie Winson Huang Text pre-processing for text-to-speech generation
ATE456490T1 (de) * 2007-10-01 2010-02-15 Harman Becker Automotive Sys Sprachgesteuerte einstellung von fahrzeugteilen
US9053089B2 (en) 2007-10-02 2015-06-09 Apple Inc. Part-of-speech tagging using latent analogy
US8315412B2 (en) * 2007-10-17 2012-11-20 The Chamberlain Group, Inc. Method and apparatus to facilitate use of background noise when providing secure access to equipment
US8620662B2 (en) 2007-11-20 2013-12-31 Apple Inc. Context-aware unit selection
US10002189B2 (en) 2007-12-20 2018-06-19 Apple Inc. Method and apparatus for searching using an active ontology
US9330720B2 (en) 2008-01-03 2016-05-03 Apple Inc. Methods and apparatus for altering audio output signals
US8117242B1 (en) 2008-01-18 2012-02-14 Boadin Technology, LLC System, method, and computer program product for performing a search in conjunction with use of an online application
US8117225B1 (en) 2008-01-18 2012-02-14 Boadin Technology, LLC Drill-down system, method, and computer program product for focusing a search
US8065143B2 (en) 2008-02-22 2011-11-22 Apple Inc. Providing text input using speech data and non-speech data
JP5189858B2 (ja) * 2008-03-03 2013-04-24 アルパイン株式会社 音声認識装置
JP4524763B2 (ja) * 2008-03-25 2010-08-18 株式会社デンソー 自動車用情報提供システム
US8996376B2 (en) 2008-04-05 2015-03-31 Apple Inc. Intelligent text-to-speech conversion
US8386510B2 (en) 2008-04-15 2013-02-26 International Business Machines Corporation Flexible connector framework for data feed generation
US20090271200A1 (en) 2008-04-23 2009-10-29 Volkswagen Group Of America, Inc. Speech recognition assembly for acoustically controlling a function of a motor vehicle
JP2011143732A (ja) * 2008-04-23 2011-07-28 Mitsubishi Electric Corp 車載情報システム
US10496753B2 (en) 2010-01-18 2019-12-03 Apple Inc. Automatically adapting user interfaces for hands-free interaction
JP4547721B2 (ja) * 2008-05-21 2010-09-22 株式会社デンソー 自動車用情報提供システム
US8464150B2 (en) 2008-06-07 2013-06-11 Apple Inc. Automatic language identification for dynamic text processing
US20100030549A1 (en) 2008-07-31 2010-02-04 Lee Michael M Mobile device having human language translation capability with positional feedback
US20100036666A1 (en) * 2008-08-08 2010-02-11 Gm Global Technology Operations, Inc. Method and system for providing meta data for a work
CN102119412B (zh) * 2008-08-11 2013-01-02 旭化成株式会社 例外语辞典制作装置、例外语辞典制作方法、和声音识别装置和声音识别方法
CN102216731B (zh) * 2008-08-11 2014-10-01 Tti发明D有限公司 在车辆中使用联网移动设备的系统和方法
US8073590B1 (en) 2008-08-22 2011-12-06 Boadin Technology, LLC System, method, and computer program product for utilizing a communication channel of a mobile device by a vehicular assembly
US8190692B1 (en) 2008-08-22 2012-05-29 Boadin Technology, LLC Location-based messaging system, method, and computer program product
US8265862B1 (en) * 2008-08-22 2012-09-11 Boadin Technology, LLC System, method, and computer program product for communicating location-related information
US8078397B1 (en) * 2008-08-22 2011-12-13 Boadin Technology, LLC System, method, and computer program product for social networking utilizing a vehicular assembly
US8131458B1 (en) 2008-08-22 2012-03-06 Boadin Technology, LLC System, method, and computer program product for instant messaging utilizing a vehicular assembly
US8165881B2 (en) * 2008-08-29 2012-04-24 Honda Motor Co., Ltd. System and method for variable text-to-speech with minimized distraction to operator of an automotive vehicle
US20100057465A1 (en) * 2008-09-03 2010-03-04 David Michael Kirsch Variable text-to-speech for automotive application
US8768702B2 (en) 2008-09-05 2014-07-01 Apple Inc. Multi-tiered voice feedback in an electronic device
US8898568B2 (en) 2008-09-09 2014-11-25 Apple Inc. Audio user interface
US8583418B2 (en) 2008-09-29 2013-11-12 Apple Inc. Systems and methods of detecting language and natural language strings for text to speech synthesis
US8712776B2 (en) 2008-09-29 2014-04-29 Apple Inc. Systems and methods for selective text to speech synthesis
US8676904B2 (en) 2008-10-02 2014-03-18 Apple Inc. Electronic devices with voice command and contextual data processing capabilities
JP4414470B1 (ja) * 2008-10-10 2010-02-10 本田技研工業株式会社 車両の故障診断のための基準値の生成
BRPI0918741A2 (pt) * 2008-10-28 2015-12-01 Airbiquity Inc aquisição de uma música sendo reproduzida por um rádio em um veículo
US8392190B2 (en) * 2008-12-01 2013-03-05 Educational Testing Service Systems and methods for assessment of non-native spontaneous speech
WO2010067118A1 (en) 2008-12-11 2010-06-17 Novauris Technologies Limited Speech recognition involving a mobile device
KR101057191B1 (ko) * 2008-12-30 2011-08-16 주식회사 하이닉스반도체 반도체 소자의 미세 패턴 형성방법
US9641678B2 (en) * 2009-01-29 2017-05-02 Ford Global Technologies, Llc System and method for interrupting an instructional prompt to signal upcoming input over a wireless communication link
US8862252B2 (en) 2009-01-30 2014-10-14 Apple Inc. Audio user interface for displayless electronic device
US8788256B2 (en) * 2009-02-17 2014-07-22 Sony Computer Entertainment Inc. Multiple language voice recognition
US20100217482A1 (en) * 2009-02-20 2010-08-26 Ford Global Technologies, Llc Vehicle-based system interface for personal navigation device
US8825222B2 (en) * 2009-02-27 2014-09-02 Toyota Motor Engineering & Manufacturing North America, Inc. Remote management of vehicle settings
US9871916B2 (en) * 2009-03-05 2018-01-16 International Business Machines Corporation System and methods for providing voice transcription
US8254993B2 (en) * 2009-03-06 2012-08-28 Apple Inc. Remote messaging for mobile communication device and accessory
US8380507B2 (en) 2009-03-09 2013-02-19 Apple Inc. Systems and methods for determining the language to use for speech generated by a text to speech engine
US8380513B2 (en) * 2009-05-19 2013-02-19 International Business Machines Corporation Improving speech capabilities of a multimodal application
US8554831B2 (en) * 2009-06-02 2013-10-08 Ford Global Technologies, Llc System and method for executing hands-free operation of an electronic calendar application within a vehicle
US10540976B2 (en) 2009-06-05 2020-01-21 Apple Inc. Contextual voice commands
US10241752B2 (en) 2011-09-30 2019-03-26 Apple Inc. Interface for a virtual digital assistant
US10241644B2 (en) 2011-06-03 2019-03-26 Apple Inc. Actionable reminder entries
US20120309363A1 (en) 2011-06-03 2012-12-06 Apple Inc. Triggering notifications associated with tasks items that represent tasks to perform
US9858925B2 (en) 2009-06-05 2018-01-02 Apple Inc. Using context information to facilitate processing of commands in a virtual assistant
US9431006B2 (en) 2009-07-02 2016-08-30 Apple Inc. Methods and apparatuses for automatic speech recognition
US9183834B2 (en) * 2009-07-22 2015-11-10 Cisco Technology, Inc. Speech recognition tuning tool
US9250097B2 (en) * 2009-07-23 2016-02-02 Broadcom Corporation Coupled GPS phone and navigation system
US20110034128A1 (en) * 2009-08-05 2011-02-10 Kirsch David M Mobile Communication Device Linked to In-Vehicle System
US9002574B2 (en) 2009-10-15 2015-04-07 Airbiquity Inc. Mobile integration platform (MIP) integrated handset application proxy (HAP)
US8942888B2 (en) 2009-10-15 2015-01-27 Airbiquity Inc. Extensible scheme for operating vehicle head unit as extended interface for mobile device
US8831823B2 (en) * 2009-10-15 2014-09-09 Airbiquity Inc. Centralized management of motor vehicle software applications and services
US20110099507A1 (en) 2009-10-28 2011-04-28 Google Inc. Displaying a collection of interactive elements that trigger actions directed to an item
US8682649B2 (en) 2009-11-12 2014-03-25 Apple Inc. Sentiment prediction from textual data
US9045098B2 (en) * 2009-12-01 2015-06-02 Honda Motor Co., Ltd. Vocabulary dictionary recompile for in-vehicle audio system
US20110166862A1 (en) * 2010-01-04 2011-07-07 Eyal Eshed System and method for variable automated response to remote verbal input at a mobile device
US8600743B2 (en) 2010-01-06 2013-12-03 Apple Inc. Noise profile determination for voice-related feature
US8457839B2 (en) * 2010-01-07 2013-06-04 Ford Global Technologies, Llc Multi-display vehicle information system and method
US8381107B2 (en) 2010-01-13 2013-02-19 Apple Inc. Adaptive audio feedback system and method
US8311838B2 (en) 2010-01-13 2012-11-13 Apple Inc. Devices and methods for identifying a prompt corresponding to a voice input in a sequence of prompts
US10705794B2 (en) 2010-01-18 2020-07-07 Apple Inc. Automatically adapting user interfaces for hands-free interaction
US10679605B2 (en) 2010-01-18 2020-06-09 Apple Inc. Hands-free list-reading by intelligent automated assistant
US10553209B2 (en) 2010-01-18 2020-02-04 Apple Inc. Systems and methods for hands-free notification summaries
US10276170B2 (en) 2010-01-18 2019-04-30 Apple Inc. Intelligent automated assistant
US8977584B2 (en) 2010-01-25 2015-03-10 Newvaluexchange Global Ai Llp Apparatuses, methods and systems for a digital conversation management platform
US8682667B2 (en) 2010-02-25 2014-03-25 Apple Inc. User profiling for selecting user specific voice input processing information
US8868679B2 (en) 2010-05-24 2014-10-21 Nuance Communications, Inc. Systems, methods and articles for providing communications and services via a peer-to-peer network over a data transport link
US9639688B2 (en) 2010-05-27 2017-05-02 Ford Global Technologies, Llc Methods and systems for implementing and enforcing security and resource policies for a vehicle
US8639516B2 (en) 2010-06-04 2014-01-28 Apple Inc. User-specific noise suppression for voice quality improvements
WO2011163538A1 (en) 2010-06-24 2011-12-29 Honda Motor Co., Ltd. Communication system and method between an on-vehicle voice recognition system and an off-vehicle voice recognition system
US8731814B2 (en) 2010-07-02 2014-05-20 Ford Global Technologies, Llc Multi-modal navigation system and method
US8713021B2 (en) 2010-07-07 2014-04-29 Apple Inc. Unsupervised document clustering using latent semantic density analysis
US9846046B2 (en) 2010-07-30 2017-12-19 Ford Global Technologies, Llc Vehicle navigation method and system
US8732697B2 (en) 2010-08-04 2014-05-20 Premkumar Jonnala System, method and apparatus for managing applications on a device
US8335643B2 (en) 2010-08-10 2012-12-18 Ford Global Technologies, Llc Point of interest search, identification, and navigation
US20120041633A1 (en) 2010-08-16 2012-02-16 Ford Global Technologies, Llc Systems and methods for regulating control of a vehicle infotainment system
US8719006B2 (en) 2010-08-27 2014-05-06 Apple Inc. Combined statistical and rule-based part-of-speech tagging for text-to-speech synthesis
US8719014B2 (en) 2010-09-27 2014-05-06 Apple Inc. Electronic device with text error correction based on voice recognition data
US8521424B2 (en) 2010-09-29 2013-08-27 Ford Global Technologies, Llc Advanced map information delivery, processing and updating
US8849552B2 (en) 2010-09-29 2014-09-30 Ford Global Technologies, Llc Advanced map information delivery, processing and updating
US20120089392A1 (en) * 2010-10-07 2012-04-12 Microsoft Corporation Speech recognition user interface
US20120271640A1 (en) * 2010-10-15 2012-10-25 Basir Otman A Implicit Association and Polymorphism Driven Human Machine Interaction
US8483958B2 (en) 2010-12-20 2013-07-09 Ford Global Technologies, Llc User configurable onboard navigation system crossroad presentation
US8559932B2 (en) 2010-12-20 2013-10-15 Ford Global Technologies, Llc Selective alert processing
US10762293B2 (en) 2010-12-22 2020-09-01 Apple Inc. Using parts-of-speech tagging and named entity recognition for spelling correction
US10515147B2 (en) 2010-12-22 2019-12-24 Apple Inc. Using statistical language models for contextual lookup
US9452735B2 (en) 2011-02-10 2016-09-27 Ford Global Technologies, Llc System and method for controlling a restricted mode in a vehicle
US8781836B2 (en) 2011-02-22 2014-07-15 Apple Inc. Hearing assistance system for providing consistent human speech
US9262612B2 (en) 2011-03-21 2016-02-16 Apple Inc. Device access using voice authentication
US10057736B2 (en) 2011-06-03 2018-08-21 Apple Inc. Active transport based notifications
US10672399B2 (en) 2011-06-03 2020-06-02 Apple Inc. Switching between text data and audio data based on a mapping
US8788113B2 (en) 2011-06-13 2014-07-22 Ford Global Technologies, Llc Vehicle driver advisory system and method
US8812294B2 (en) 2011-06-21 2014-08-19 Apple Inc. Translating phrases from one language into another using an order-based set of declarative rules
KR101933450B1 (ko) * 2011-07-05 2018-12-31 삼성전자주식회사 차량용 헤드 유닛에 표시되는 컨텐츠를 동적으로 변경하는 방법 및 이를 위한 이동 단말기
US8688321B2 (en) 2011-07-11 2014-04-01 Ford Global Technologies, Llc Traffic density estimation
US8849519B2 (en) 2011-08-09 2014-09-30 Ford Global Technologies, Llc Method and apparatus for vehicle hardware theft prevention
US8706472B2 (en) 2011-08-11 2014-04-22 Apple Inc. Method for disambiguating multiple readings in language conversion
US8994660B2 (en) 2011-08-29 2015-03-31 Apple Inc. Text correction processing
US8948698B2 (en) 2011-09-02 2015-02-03 Toyota Motor Engineering & Manufacturing North America, Inc. Vehicle multimedia head unit with two bluetooth antennas and two receivers
US8762156B2 (en) 2011-09-28 2014-06-24 Apple Inc. Speech recognition repair using contextual information
DE102012019178A1 (de) * 2011-09-30 2013-04-04 Apple Inc. Verwendung von Kontextinformationen zum Erleichtern der Verarbeitung von Befehlen bei einem virtuellen Assistenten
US8438023B1 (en) * 2011-09-30 2013-05-07 Google Inc. Warning a user when voice input to a device is likely to fail because of background or other noise
WO2013069060A1 (ja) * 2011-11-10 2013-05-16 三菱電機株式会社 ナビゲーション装置および方法
US8838385B2 (en) 2011-12-20 2014-09-16 Ford Global Technologies, Llc Method and apparatus for vehicle routing
CN104011735B (zh) * 2011-12-26 2018-03-30 英特尔公司 基于车辆的对乘员音频和可视输入的确定
DE102012202391A1 (de) * 2012-02-16 2013-08-22 Continental Automotive Gmbh Verfahren und Einrichtung zur Phonetisierung von textenthaltenden Datensätzen
DE102012202407B4 (de) * 2012-02-16 2018-10-11 Continental Automotive Gmbh Verfahren zum Phonetisieren einer Datenliste und sprachgesteuerte Benutzerschnittstelle
US10134385B2 (en) 2012-03-02 2018-11-20 Apple Inc. Systems and methods for name pronunciation
US9483461B2 (en) 2012-03-06 2016-11-01 Apple Inc. Handling speech synthesis of content for multiple languages
US9569403B2 (en) 2012-05-03 2017-02-14 Ford Global Technologies, Llc Methods and systems for authenticating one or more users of a vehicle communications and information system
US9280610B2 (en) 2012-05-14 2016-03-08 Apple Inc. Crowd sourcing information to fulfill user requests
US10417037B2 (en) 2012-05-15 2019-09-17 Apple Inc. Systems and methods for integrating third party services with a digital assistant
US8775442B2 (en) 2012-05-15 2014-07-08 Apple Inc. Semantic search using a single-source semantic model
EP2859464B1 (en) 2012-06-08 2020-09-16 Airbiquity, Inc. Assessment of electronic sensor data to remotely identify a motor vehicle and monitor driver behavior
US9721563B2 (en) 2012-06-08 2017-08-01 Apple Inc. Name recognition system
US10019994B2 (en) 2012-06-08 2018-07-10 Apple Inc. Systems and methods for recognizing textual identifiers within a plurality of words
US9495129B2 (en) 2012-06-29 2016-11-15 Apple Inc. Device, method, and user interface for voice-activated navigation and browsing of a document
KR101972955B1 (ko) 2012-07-03 2019-04-26 삼성전자 주식회사 음성을 이용한 사용자 디바이스들 간 서비스 연결 방법 및 장치
US8799360B2 (en) * 2012-08-31 2014-08-05 Tweedle Group, Inc. Systems, methods and articles for a server providing communications and services involving automobile head units
US8831585B2 (en) 2012-08-31 2014-09-09 Nuance Communications, Inc. Systems, methods and articles for a communications device providing communications and services involving automobile head units
US20140068713A1 (en) * 2012-08-31 2014-03-06 Tweddle Group, Inc. Systems, methods and articles for providing communications and services involving automobile head units and user preferences
US8909153B2 (en) * 2012-09-05 2014-12-09 GM Global Technology Operations LLC Vehicle communications using a mobile device
US9576574B2 (en) 2012-09-10 2017-02-21 Apple Inc. Context-sensitive handling of interruptions by intelligent digital assistant
US9547647B2 (en) 2012-09-19 2017-01-17 Apple Inc. Voice-based media searching
US8935167B2 (en) 2012-09-25 2015-01-13 Apple Inc. Exemplar-based latent perceptual modeling for automatic speech recognition
DE102012019063A1 (de) * 2012-09-28 2014-04-03 Audi Ag Verfahren und System zum Bereitstellen von Daten in einem Kraftwagen
US9691377B2 (en) * 2013-07-23 2017-06-27 Google Technology Holdings LLC Method and device for voice recognition training
US10373615B2 (en) 2012-10-30 2019-08-06 Google Technology Holdings LLC Voice control user interface during low power mode
US10304465B2 (en) 2012-10-30 2019-05-28 Google Technology Holdings LLC Voice control user interface for low power mode
US9584642B2 (en) 2013-03-12 2017-02-28 Google Technology Holdings LLC Apparatus with adaptive acoustic echo control for speakerphone mode
US10381002B2 (en) 2012-10-30 2019-08-13 Google Technology Holdings LLC Voice control user interface during low-power mode
US9601111B2 (en) * 2012-11-13 2017-03-21 GM Global Technology Operations LLC Methods and systems for adapting speech systems
DE102012223314A1 (de) * 2012-12-17 2014-06-18 Robert Bosch Gmbh Einrichtung und Verfahren zur automatischen Anpassung der Lautstärke von Geräuschen in einem Fahrzeuginnenraum
DE102012223320A1 (de) * 2012-12-17 2014-06-18 Robert Bosch Gmbh Einrichtung und Verfahren zur automatischen Anpassung der Lautstärke von Geräuschen in einem Fahrzeuginnenraum
EP2936861B1 (en) * 2012-12-20 2021-07-21 Airbiquity, Inc. Efficient headunit communication integration
KR102112742B1 (ko) * 2013-01-22 2020-05-19 삼성전자주식회사 전자장치 및 그 음성 처리 방법
CN104969289B (zh) 2013-02-07 2021-05-28 苹果公司 数字助理的语音触发器
US9713963B2 (en) 2013-02-18 2017-07-25 Ford Global Technologies, Llc Method and apparatus for route completion likelihood display
US9688246B2 (en) 2013-02-25 2017-06-27 Ford Global Technologies, Llc Method and apparatus for in-vehicle alarm activation and response handling
US9863777B2 (en) 2013-02-25 2018-01-09 Ford Global Technologies, Llc Method and apparatus for automatic estimated time of arrival calculation and provision
US8947221B2 (en) 2013-02-26 2015-02-03 Ford Global Technologies, Llc Method and apparatus for tracking device connection and state change
US9047774B2 (en) 2013-03-12 2015-06-02 Ford Global Technologies, Llc Method and apparatus for crowd-sourced traffic reporting
US8977479B2 (en) 2013-03-12 2015-03-10 Ford Global Technologies, Llc Method and apparatus for determining traffic conditions
US9141583B2 (en) 2013-03-13 2015-09-22 Ford Global Technologies, Llc Method and system for supervising information communication based on occupant and vehicle environment
US8862320B2 (en) 2013-03-14 2014-10-14 Ford Global Technologies, Llc Method and apparatus for ambient lighting incoming message alert
US9733821B2 (en) 2013-03-14 2017-08-15 Apple Inc. Voice control to diagnose inadvertent activation of accessibility features
US9977779B2 (en) 2013-03-14 2018-05-22 Apple Inc. Automatic supplementation of word correction dictionaries
US10572476B2 (en) 2013-03-14 2020-02-25 Apple Inc. Refining a search based on schedule items
US8909212B2 (en) 2013-03-14 2014-12-09 Ford Global Technologies, Llc Method and apparatus for disclaimer presentation and confirmation
US9368114B2 (en) 2013-03-14 2016-06-14 Apple Inc. Context-sensitive handling of interruptions
US10652394B2 (en) 2013-03-14 2020-05-12 Apple Inc. System and method for processing voicemail
US9874452B2 (en) 2013-03-14 2018-01-23 Ford Global Technologies, Llc Method and apparatus for enhanced driving experience including dynamic POI identification
US10642574B2 (en) 2013-03-14 2020-05-05 Apple Inc. Device, method, and graphical user interface for outputting captions
US10424292B1 (en) 2013-03-14 2019-09-24 Amazon Technologies, Inc. System for recognizing and responding to environmental noises
US9002536B2 (en) 2013-03-14 2015-04-07 Ford Global Technologies, Llc Key fob security copy to a mobile phone
EP2973002B1 (en) 2013-03-15 2019-06-26 Apple Inc. User training by intelligent digital assistant
US9922642B2 (en) 2013-03-15 2018-03-20 Apple Inc. Training an at least partial voice command system
WO2014144579A1 (en) 2013-03-15 2014-09-18 Apple Inc. System and method for updating an adaptive speech recognition model
WO2014168730A2 (en) 2013-03-15 2014-10-16 Apple Inc. Context-sensitive handling of interruptions
US10748529B1 (en) 2013-03-15 2020-08-18 Apple Inc. Voice activated device for use with a voice-based digital assistant
US20140289624A1 (en) * 2013-03-22 2014-09-25 Hyundai Mobis Co.,Ltd. Multimedia system and method for interfacing between multimedia unit and audio head unit
US9619645B2 (en) * 2013-04-04 2017-04-11 Cypress Semiconductor Corporation Authentication for recognition systems
US20140358538A1 (en) * 2013-05-28 2014-12-04 GM Global Technology Operations LLC Methods and systems for shaping dialog of speech systems
US9582608B2 (en) 2013-06-07 2017-02-28 Apple Inc. Unified ranking with entropy-weighted information for phrase-based semantic auto-completion
WO2014197336A1 (en) 2013-06-07 2014-12-11 Apple Inc. System and method for detecting errors in interactions with a voice-based digital assistant
WO2014197334A2 (en) 2013-06-07 2014-12-11 Apple Inc. System and method for user-specified pronunciation of words for speech synthesis and recognition
WO2014197335A1 (en) 2013-06-08 2014-12-11 Apple Inc. Interpreting and acting upon commands that involve sharing information with remote devices
EP3937002A1 (en) 2013-06-09 2022-01-12 Apple Inc. Device, method, and graphical user interface for enabling conversation persistence across two or more instances of a digital assistant
US10176167B2 (en) 2013-06-09 2019-01-08 Apple Inc. System and method for inferring user intent from speech inputs
CN105265005B (zh) 2013-06-13 2019-09-17 苹果公司 用于由语音命令发起的紧急呼叫的系统和方法
US9548047B2 (en) 2013-07-31 2017-01-17 Google Technology Holdings LLC Method and apparatus for evaluating trigger phrase enrollment
WO2015020942A1 (en) 2013-08-06 2015-02-12 Apple Inc. Auto-activating smart responses based on activities from remote devices
DE102013216427B4 (de) * 2013-08-20 2023-02-02 Bayerische Motoren Werke Aktiengesellschaft Vorrichtung und Verfahren zur fortbewegungsmittelbasierten Sprachverarbeitung
US8976009B2 (en) * 2013-09-24 2015-03-10 Peter McGie Voice recognizing digital messageboard system and method
US20140149216A1 (en) * 2013-09-24 2014-05-29 Peter McGie Voice Recognizing Digital Messageboard System and Method
US9524717B2 (en) * 2013-10-15 2016-12-20 Trevo Solutions Group LLC System, method, and computer program for integrating voice-to-text capability into call systems
US8768712B1 (en) 2013-12-04 2014-07-01 Google Inc. Initiating actions based on partial hotwords
US10296160B2 (en) 2013-12-06 2019-05-21 Apple Inc. Method for extracting salient dialog usage from live data
US10373611B2 (en) 2014-01-03 2019-08-06 Gracenote, Inc. Modification of electronic system operation based on acoustic ambience classification
US9911408B2 (en) * 2014-03-03 2018-03-06 General Motors Llc Dynamic speech system tuning
DE112014006542B4 (de) * 2014-03-31 2024-02-08 Mitsubishi Electric Corporation Einrichtung und Verfahren zum Verständnis von einer Benutzerintention
US9633657B2 (en) * 2014-04-02 2017-04-25 Speakread A/S Systems and methods for supporting hearing impaired users
US20150294639A1 (en) * 2014-04-14 2015-10-15 Sony Corporation Method and system for switching a mode of an electronic device
US9620105B2 (en) 2014-05-15 2017-04-11 Apple Inc. Analyzing audio input for efficient speech and music recognition
US10592095B2 (en) 2014-05-23 2020-03-17 Apple Inc. Instantaneous speaking of content on touch devices
US9502031B2 (en) 2014-05-27 2016-11-22 Apple Inc. Method for supporting dynamic grammars in WFST-based ASR
US10289433B2 (en) 2014-05-30 2019-05-14 Apple Inc. Domain specific language for encoding assistant dialog
US9734193B2 (en) 2014-05-30 2017-08-15 Apple Inc. Determining domain salience ranking from ambiguous words in natural speech
US9760559B2 (en) 2014-05-30 2017-09-12 Apple Inc. Predictive text input
WO2015184186A1 (en) 2014-05-30 2015-12-03 Apple Inc. Multi-command single utterance input method
US9785630B2 (en) 2014-05-30 2017-10-10 Apple Inc. Text prediction using combined word N-gram and unigram language models
US9842101B2 (en) 2014-05-30 2017-12-12 Apple Inc. Predictive conversion of language input
US10078631B2 (en) 2014-05-30 2018-09-18 Apple Inc. Entropy-guided text prediction using combined word and character n-gram language models
US9430463B2 (en) 2014-05-30 2016-08-30 Apple Inc. Exemplar-based natural language processing
US9633004B2 (en) 2014-05-30 2017-04-25 Apple Inc. Better resolution when referencing to concepts
US9715875B2 (en) 2014-05-30 2017-07-25 Apple Inc. Reducing the need for manual start/end-pointing and trigger phrases
US10170123B2 (en) 2014-05-30 2019-01-01 Apple Inc. Intelligent assistant for home automation
US10236016B1 (en) * 2014-06-16 2019-03-19 Amazon Technologies, Inc. Peripheral-based selection of audio sources
US10659851B2 (en) 2014-06-30 2020-05-19 Apple Inc. Real-time digital assistant knowledge updates
US9338493B2 (en) 2014-06-30 2016-05-10 Apple Inc. Intelligent automated assistant for TV user interactions
US10446141B2 (en) 2014-08-28 2019-10-15 Apple Inc. Automatic speech recognition based on user feedback
US9818400B2 (en) 2014-09-11 2017-11-14 Apple Inc. Method and apparatus for discovering trending terms in speech requests
US10789041B2 (en) 2014-09-12 2020-09-29 Apple Inc. Dynamic thresholds for always listening speech trigger
US9646609B2 (en) 2014-09-30 2017-05-09 Apple Inc. Caching apparatus for serving phonetic pronunciations
US9668121B2 (en) 2014-09-30 2017-05-30 Apple Inc. Social reminders
US9886432B2 (en) 2014-09-30 2018-02-06 Apple Inc. Parsimonious handling of word inflection via categorical stem + suffix N-gram language models
US10074360B2 (en) 2014-09-30 2018-09-11 Apple Inc. Providing an indication of the suitability of speech recognition
US10127911B2 (en) 2014-09-30 2018-11-13 Apple Inc. Speaker identification and unsupervised speaker adaptation techniques
KR102272080B1 (ko) * 2014-11-18 2021-07-02 현대모비스 주식회사 차량용 avn 시스템의 모바일 단말 등록 제어 장치 및 방법
US10552013B2 (en) 2014-12-02 2020-02-04 Apple Inc. Data detection
US9711141B2 (en) 2014-12-09 2017-07-18 Apple Inc. Disambiguating heteronyms in speech synthesis
US20160171635A1 (en) * 2014-12-15 2016-06-16 Thomas A. Senzee Automated Contract Terms Negotiating System and Method
KR101638612B1 (ko) 2014-12-24 2016-07-11 현대자동차주식회사 외부 기기와 연결되는 차량의 멀티미디어 시스템 및 그 제어방법
US9992317B2 (en) * 2015-02-16 2018-06-05 Ford Global Technologies, Llc System and method of facilitating communication between a mobile device and vehicle computer system
JP6501217B2 (ja) * 2015-02-16 2019-04-17 アルパイン株式会社 情報端末システム
US9865280B2 (en) 2015-03-06 2018-01-09 Apple Inc. Structured dictation using intelligent automated assistants
US10152299B2 (en) 2015-03-06 2018-12-11 Apple Inc. Reducing response latency of intelligent automated assistants
US9886953B2 (en) 2015-03-08 2018-02-06 Apple Inc. Virtual assistant activation
US10567477B2 (en) 2015-03-08 2020-02-18 Apple Inc. Virtual assistant continuity
US9721566B2 (en) 2015-03-08 2017-08-01 Apple Inc. Competing devices responding to voice triggers
US9899019B2 (en) 2015-03-18 2018-02-20 Apple Inc. Systems and methods for structured stem and suffix language models
US10249123B2 (en) 2015-04-09 2019-04-02 Ford Global Technologies, Llc Systems and methods for mobile phone key fob management
US9842105B2 (en) 2015-04-16 2017-12-12 Apple Inc. Parsimonious continuous-space phrase representations for natural language processing
US10460227B2 (en) 2015-05-15 2019-10-29 Apple Inc. Virtual assistant in a communication session
US10083688B2 (en) 2015-05-27 2018-09-25 Apple Inc. Device voice control for selecting a displayed affordance
US10127220B2 (en) 2015-06-04 2018-11-13 Apple Inc. Language identification from short strings
US10101822B2 (en) 2015-06-05 2018-10-16 Apple Inc. Language input correction
US9578173B2 (en) 2015-06-05 2017-02-21 Apple Inc. Virtual assistant aided communication with 3rd party service in a communication session
US11025565B2 (en) 2015-06-07 2021-06-01 Apple Inc. Personalized prediction of responses for instant messaging
US10186254B2 (en) 2015-06-07 2019-01-22 Apple Inc. Context-based endpoint detection
US10255907B2 (en) 2015-06-07 2019-04-09 Apple Inc. Automatic accent detection using acoustic models
US20160379640A1 (en) * 2015-06-24 2016-12-29 Honeywell International Inc. System and method for aircraft voice-to-text communication with message validation
US20160378747A1 (en) 2015-06-29 2016-12-29 Apple Inc. Virtual assistant for media playback
US10747498B2 (en) 2015-09-08 2020-08-18 Apple Inc. Zero latency digital assistant
US10671428B2 (en) 2015-09-08 2020-06-02 Apple Inc. Distributed personal assistant
KR20170033722A (ko) * 2015-09-17 2017-03-27 삼성전자주식회사 사용자의 발화 처리 장치 및 방법과, 음성 대화 관리 장치
US9697820B2 (en) 2015-09-24 2017-07-04 Apple Inc. Unit-selection text-to-speech synthesis using concatenation-sensitive neural networks
US10008201B2 (en) * 2015-09-28 2018-06-26 GM Global Technology Operations LLC Streamlined navigational speech recognition
US10366158B2 (en) 2015-09-29 2019-07-30 Apple Inc. Efficient word encoding for recurrent neural network language models
US11010550B2 (en) 2015-09-29 2021-05-18 Apple Inc. Unified language modeling framework for word prediction, auto-completion and auto-correction
US11587559B2 (en) 2015-09-30 2023-02-21 Apple Inc. Intelligent device identification
US10006777B2 (en) * 2015-10-02 2018-06-26 GM Global Technology Operations LLC Recognizing address and point of interest speech received at a vehicle
US10691473B2 (en) 2015-11-06 2020-06-23 Apple Inc. Intelligent automated assistant in a messaging environment
US10049668B2 (en) 2015-12-02 2018-08-14 Apple Inc. Applying neural network language models to weighted finite state transducers for automatic speech recognition
US10140976B2 (en) * 2015-12-14 2018-11-27 International Business Machines Corporation Discriminative training of automatic speech recognition models with natural language processing dictionary for spoken language processing
US10223066B2 (en) 2015-12-23 2019-03-05 Apple Inc. Proactive assistance based on dialog communication between devices
US10229672B1 (en) * 2015-12-31 2019-03-12 Google Llc Training acoustic models using connectionist temporal classification
US10446143B2 (en) 2016-03-14 2019-10-15 Apple Inc. Identification of voice inputs providing credentials
EP3232413B1 (en) 2016-04-15 2021-11-24 Volvo Car Corporation Method and system for enabling a vehicle occupant to report a hazard associated with the surroundings of the vehicle
US9734744B1 (en) * 2016-04-27 2017-08-15 Joan Mercior Self-reacting message board
US9934775B2 (en) 2016-05-26 2018-04-03 Apple Inc. Unit-selection text-to-speech synthesis based on predicted concatenation parameters
US10163437B1 (en) * 2016-06-02 2018-12-25 Amazon Technologies, Inc. Training models using voice tags
US9972304B2 (en) 2016-06-03 2018-05-15 Apple Inc. Privacy preserving distributed evaluation framework for embedded personalized systems
US10249300B2 (en) 2016-06-06 2019-04-02 Apple Inc. Intelligent list reading
US11227589B2 (en) 2016-06-06 2022-01-18 Apple Inc. Intelligent list reading
US10049663B2 (en) 2016-06-08 2018-08-14 Apple, Inc. Intelligent automated assistant for media exploration
DK179309B1 (en) 2016-06-09 2018-04-23 Apple Inc Intelligent automated assistant in a home environment
US10509862B2 (en) 2016-06-10 2019-12-17 Apple Inc. Dynamic phrase expansion of language input
US10490187B2 (en) 2016-06-10 2019-11-26 Apple Inc. Digital assistant providing automated status report
US10586535B2 (en) 2016-06-10 2020-03-10 Apple Inc. Intelligent digital assistant in a multi-tasking environment
US10192552B2 (en) 2016-06-10 2019-01-29 Apple Inc. Digital assistant providing whispered speech
US10067938B2 (en) 2016-06-10 2018-09-04 Apple Inc. Multilingual word prediction
DK201670540A1 (en) 2016-06-11 2018-01-08 Apple Inc Application integration with a digital assistant
DK179049B1 (en) 2016-06-11 2017-09-18 Apple Inc Data driven natural language event detection and classification
DK179415B1 (en) 2016-06-11 2018-06-14 Apple Inc Intelligent device arbitration and control
DK179343B1 (en) 2016-06-11 2018-05-14 Apple Inc Intelligent task discovery
US10474753B2 (en) 2016-09-07 2019-11-12 Apple Inc. Language identification using recurrent neural networks
US10043516B2 (en) 2016-09-23 2018-08-07 Apple Inc. Intelligent automated assistant
US10283138B2 (en) 2016-10-03 2019-05-07 Google Llc Noise mitigation for a voice interface device
WO2018067639A1 (en) 2016-10-05 2018-04-12 Gentex Corporation Vehicle-based remote control system and method
US10462567B2 (en) 2016-10-11 2019-10-29 Ford Global Technologies, Llc Responding to HVAC-induced vehicle microphone buffeting
US11281993B2 (en) 2016-12-05 2022-03-22 Apple Inc. Model and ensemble compression for metric learning
US10593346B2 (en) 2016-12-22 2020-03-17 Apple Inc. Rank-reduced token representation for automatic speech recognition
US11204787B2 (en) 2017-01-09 2021-12-21 Apple Inc. Application integration with a digital assistant
US20180330725A1 (en) * 2017-05-09 2018-11-15 Microsoft Technology Licensing, Llc Intent based speech recognition priming
DK201770383A1 (en) 2017-05-09 2018-12-14 Apple Inc. USER INTERFACE FOR CORRECTING RECOGNITION ERRORS
US10417266B2 (en) 2017-05-09 2019-09-17 Apple Inc. Context-aware ranking of intelligent response suggestions
US10395654B2 (en) 2017-05-11 2019-08-27 Apple Inc. Text normalization based on a data-driven learning network
DK201770439A1 (en) 2017-05-11 2018-12-13 Apple Inc. Offline personal assistant
US10726832B2 (en) 2017-05-11 2020-07-28 Apple Inc. Maintaining privacy of personal information
JP6883471B2 (ja) * 2017-05-11 2021-06-09 オリンパス株式会社 収音装置、収音方法、収音プログラム、ディクテーション方法及び情報処理装置
US11301477B2 (en) 2017-05-12 2022-04-12 Apple Inc. Feedback analysis of a digital assistant
DK179745B1 (en) 2017-05-12 2019-05-01 Apple Inc. SYNCHRONIZATION AND TASK DELEGATION OF A DIGITAL ASSISTANT
DK201770429A1 (en) 2017-05-12 2018-12-14 Apple Inc. LOW-LATENCY INTELLIGENT AUTOMATED ASSISTANT
DK179496B1 (en) 2017-05-12 2019-01-15 Apple Inc. USER-SPECIFIC Acoustic Models
DK201770431A1 (en) 2017-05-15 2018-12-20 Apple Inc. Optimizing dialogue policy decisions for digital assistants using implicit feedback
DK201770432A1 (en) 2017-05-15 2018-12-21 Apple Inc. Hierarchical belief states for digital assistants
EP3577646B1 (en) * 2017-05-16 2021-07-21 Google LLC Handling calls on a shared speech-enabled device
US10403278B2 (en) 2017-05-16 2019-09-03 Apple Inc. Methods and systems for phonetic matching in digital assistant services
US20180336892A1 (en) 2017-05-16 2018-11-22 Apple Inc. Detecting a trigger of a digital assistant
DK179560B1 (en) 2017-05-16 2019-02-18 Apple Inc. FAR-FIELD EXTENSION FOR DIGITAL ASSISTANT SERVICES
US10311144B2 (en) 2017-05-16 2019-06-04 Apple Inc. Emoji word sense disambiguation
US20180336275A1 (en) 2017-05-16 2018-11-22 Apple Inc. Intelligent automated assistant for media exploration
KR102371313B1 (ko) * 2017-05-29 2022-03-08 삼성전자주식회사 사용자 발화를 처리하는 전자 장치 및 그 전자 장치의 제어 방법
KR102332826B1 (ko) * 2017-05-30 2021-11-30 현대자동차주식회사 차량용 음성 인식 장치, 상기 차량용 음성 인식 장치를 포함하는 차량, 차량용 음성 인식 시스템 및 상기 차량용 음성 인식 장치의 제어 방법
US10186260B2 (en) * 2017-05-31 2019-01-22 Ford Global Technologies, Llc Systems and methods for vehicle automatic speech recognition error detection
US10657328B2 (en) 2017-06-02 2020-05-19 Apple Inc. Multi-task recurrent neural network architecture for efficient morphology handling in neural language modeling
KR102367053B1 (ko) * 2017-07-13 2022-02-24 삼성전자주식회사 외부 전자 장치와 통신을 수행하기 위한 전자 장치
US10525921B2 (en) 2017-08-10 2020-01-07 Ford Global Technologies, Llc Monitoring windshield vibrations for vehicle collision detection
US10706840B2 (en) 2017-08-18 2020-07-07 Google Llc Encoder-decoder models for sequence to sequence mapping
US10438594B2 (en) * 2017-09-08 2019-10-08 Amazon Technologies, Inc. Administration of privileges by speech for voice assistant system
US10445429B2 (en) 2017-09-21 2019-10-15 Apple Inc. Natural language understanding using vocabularies with compressed serialized tries
US10562449B2 (en) 2017-09-25 2020-02-18 Ford Global Technologies, Llc Accelerometer-based external sound monitoring during low speed maneuvers
US10755051B2 (en) 2017-09-29 2020-08-25 Apple Inc. Rule-based natural language processing
US10479300B2 (en) 2017-10-06 2019-11-19 Ford Global Technologies, Llc Monitoring of vehicle window vibrations for voice-command recognition
KR102552486B1 (ko) * 2017-11-02 2023-07-06 현대자동차주식회사 차량의 음성인식 장치 및 방법
US10636424B2 (en) 2017-11-30 2020-04-28 Apple Inc. Multi-turn canned dialog
US10733982B2 (en) 2018-01-08 2020-08-04 Apple Inc. Multi-directional dialog
US10733375B2 (en) 2018-01-31 2020-08-04 Apple Inc. Knowledge-based framework for improving natural language understanding
KR102066451B1 (ko) * 2018-02-02 2020-01-15 주식회사 오비고 차량용 ai 서비스를 제공하는 방법 및 이를 이용한 장치
US10789959B2 (en) 2018-03-02 2020-09-29 Apple Inc. Training speaker recognition models for digital assistants
US10592604B2 (en) 2018-03-12 2020-03-17 Apple Inc. Inverse text normalization for automatic speech recognition
US20190286414A1 (en) * 2018-03-19 2019-09-19 Geoffrey Langos Voice activated visual communication system
US10818288B2 (en) 2018-03-26 2020-10-27 Apple Inc. Natural assistant interaction
US10909331B2 (en) 2018-03-30 2021-02-02 Apple Inc. Implicit identification of translation payload with neural machine translation
US11145294B2 (en) 2018-05-07 2021-10-12 Apple Inc. Intelligent automated assistant for delivering content from user experiences
US10928918B2 (en) 2018-05-07 2021-02-23 Apple Inc. Raise to speak
US10984780B2 (en) 2018-05-21 2021-04-20 Apple Inc. Global semantic word embeddings using bi-directional recurrent neural networks
DK201870355A1 (en) 2018-06-01 2019-12-16 Apple Inc. VIRTUAL ASSISTANT OPERATION IN MULTI-DEVICE ENVIRONMENTS
DK180639B1 (en) 2018-06-01 2021-11-04 Apple Inc DISABILITY OF ATTENTION-ATTENTIVE VIRTUAL ASSISTANT
US11386266B2 (en) 2018-06-01 2022-07-12 Apple Inc. Text correction
DK179822B1 (da) 2018-06-01 2019-07-12 Apple Inc. Voice interaction at a primary device to access call functionality of a companion device
US10892996B2 (en) 2018-06-01 2021-01-12 Apple Inc. Variable latency device coordination
US10944859B2 (en) 2018-06-03 2021-03-09 Apple Inc. Accelerated task performance
JP7172176B2 (ja) * 2018-06-27 2022-11-16 富士フイルムビジネスイノベーション株式会社 画像出力システム、サーバ装置及びプログラム
US11010561B2 (en) 2018-09-27 2021-05-18 Apple Inc. Sentiment prediction from textual data
US11170166B2 (en) 2018-09-28 2021-11-09 Apple Inc. Neural typographical error modeling via generative adversarial networks
US10839159B2 (en) 2018-09-28 2020-11-17 Apple Inc. Named entity normalization in a spoken dialog system
US11462215B2 (en) 2018-09-28 2022-10-04 Apple Inc. Multi-modal inputs for voice commands
US10831442B2 (en) * 2018-10-19 2020-11-10 International Business Machines Corporation Digital assistant user interface amalgamation
US11475898B2 (en) 2018-10-26 2022-10-18 Apple Inc. Low-latency multi-speaker speech recognition
US11638059B2 (en) 2019-01-04 2023-04-25 Apple Inc. Content playback on multiple devices
US11455982B2 (en) * 2019-01-07 2022-09-27 Cerence Operating Company Contextual utterance resolution in multimodal systems
US11348573B2 (en) 2019-03-18 2022-05-31 Apple Inc. Multimodality in digital assistant systems
JP2020160144A (ja) * 2019-03-25 2020-10-01 株式会社Subaru 音声認識装置
DK201970509A1 (en) 2019-05-06 2021-01-15 Apple Inc Spoken notifications
US11423908B2 (en) 2019-05-06 2022-08-23 Apple Inc. Interpreting spoken requests
US11475884B2 (en) 2019-05-06 2022-10-18 Apple Inc. Reducing digital assistant latency when a language is incorrectly determined
US11307752B2 (en) 2019-05-06 2022-04-19 Apple Inc. User configurable task triggers
US11140099B2 (en) 2019-05-21 2021-10-05 Apple Inc. Providing message response suggestions
DK180129B1 (en) 2019-05-31 2020-06-02 Apple Inc. USER ACTIVITY SHORTCUT SUGGESTIONS
DK201970510A1 (en) 2019-05-31 2021-02-11 Apple Inc Voice identification in digital assistant systems
US11496600B2 (en) 2019-05-31 2022-11-08 Apple Inc. Remote execution of machine-learned models
US11289073B2 (en) 2019-05-31 2022-03-29 Apple Inc. Device text to speech
US11360641B2 (en) 2019-06-01 2022-06-14 Apple Inc. Increasing the relevance of new available information
US11438452B1 (en) 2019-08-09 2022-09-06 Apple Inc. Propagating context information in a privacy preserving manner
US11488406B2 (en) 2019-09-25 2022-11-01 Apple Inc. Text detection using global geometry estimators
US11170765B2 (en) * 2020-01-24 2021-11-09 Intuit Inc. Contextual multi-channel speech to text
JP7310705B2 (ja) * 2020-05-18 2023-07-19 トヨタ自動車株式会社 エージェント制御装置、エージェント制御方法、及びエージェント制御プログラム
US11984123B2 (en) * 2020-11-12 2024-05-14 Sonos, Inc. Network device interaction by range
CN112509585A (zh) * 2020-12-22 2021-03-16 北京百度网讯科技有限公司 车载设备的语音处理方法、装置、设备及存储介质
US20230306965A1 (en) * 2022-02-02 2023-09-28 Google Llc Speech Recognition Using Word or Phoneme Time Markers Based on User Input

Family Cites Families (29)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5212764A (en) * 1989-04-19 1993-05-18 Ricoh Company, Ltd. Noise eliminating apparatus and speech recognition apparatus using the same
FI97919C (fi) * 1992-06-05 1997-03-10 Nokia Mobile Phones Ltd Puheentunnistusmenetelmä ja -järjestelmä puheella ohjattavaa puhelinta varten
US5452397A (en) * 1992-12-11 1995-09-19 Texas Instruments Incorporated Method and system for preventing entry of confusingly similar phases in a voice recognition system vocabulary list
IN184794B (zh) * 1993-09-14 2000-09-30 British Telecomm
US6073101A (en) * 1996-02-02 2000-06-06 International Business Machines Corporation Text independent speaker recognition for transparent command ambiguity resolution and continuous access control
US6707421B1 (en) * 1997-08-19 2004-03-16 Siemens Vdo Automotive Corporation Driver information system
AU9501198A (en) 1997-09-15 1999-04-05 Intellivoice Communications, Inc. Simplified training of voice dialing systems
KR100277105B1 (ko) * 1998-02-27 2001-01-15 윤종용 음성 인식 데이터 결정 장치 및 방법
EP1054387A3 (en) 1999-05-21 2001-11-14 Winbond Electronics Corporation Method and apparatus for activating voice controlled devices
AU5181700A (en) * 1999-06-01 2000-12-18 Siemens Automotive Corporation Portable driver information device
JP3990075B2 (ja) * 1999-06-30 2007-10-10 株式会社東芝 音声認識支援方法及び音声認識システム
US6594629B1 (en) * 1999-08-06 2003-07-15 International Business Machines Corporation Methods and apparatus for audio-visual speech detection and recognition
US6587824B1 (en) * 2000-05-04 2003-07-01 Visteon Global Technologies, Inc. Selective speaker adaptation for an in-vehicle speech recognition system
DE60133902D1 (zh) * 2000-07-28 2008-06-19 Siemens Vdo Automotive Corp
US7203651B2 (en) * 2000-12-07 2007-04-10 Art-Advanced Recognition Technologies, Ltd. Voice control system with multiple voice recognition engines
US20020152264A1 (en) * 2001-02-07 2002-10-17 Zandiant Technologies, Inc. Personal vehicular internet appliance
US6996531B2 (en) 2001-03-30 2006-02-07 Comverse Ltd. Automated database assistance using a telephone for a speech based or text based multimedia communication mode
AU2002314933A1 (en) * 2001-05-30 2002-12-09 Cameronsound, Inc. Language independent and voice operated information management system
GB0113581D0 (en) * 2001-06-04 2001-07-25 Hewlett Packard Co Speech synthesis apparatus
GB0113587D0 (en) * 2001-06-04 2001-07-25 Hewlett Packard Co Speech synthesis apparatus
EP1271101A3 (en) * 2001-06-29 2003-11-19 Spencer Stephens Navigation system, device and method receiving a location identifier
US7324947B2 (en) 2001-10-03 2008-01-29 Promptu Systems Corporation Global speech user interface
EP1461686B1 (en) * 2001-12-06 2011-01-26 Toyota Motor Sales, U.S.A., Inc. Vehicle player system
JP3826032B2 (ja) * 2001-12-28 2006-09-27 株式会社東芝 音声認識装置、音声認識方法及び音声認識プログラム
US20040064306A1 (en) 2002-09-30 2004-04-01 Wolf Peter P. Voice activated music playback system
WO2005020093A1 (en) * 2003-08-21 2005-03-03 Idilia Inc. Internet searching using semantic disambiguation and expansion
US7801283B2 (en) * 2003-12-22 2010-09-21 Lear Corporation Method of operating vehicular, hands-free telephone system
US7373248B2 (en) * 2004-09-10 2008-05-13 Atx Group, Inc. Systems and methods for off-board voice-automated vehicle navigation
US7826945B2 (en) * 2005-07-01 2010-11-02 You Zhang Automobile speech-recognition interface

Cited By (35)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102439661A (zh) * 2009-03-24 2012-05-02 Atx集团股份有限公司 用于车辆内自动交互的面向服务语音识别
CN102576348A (zh) * 2009-10-15 2012-07-11 爱尔比奎特公司 机动车辆软件应用和服务的集中化管理
CN102576348B (zh) * 2009-10-15 2015-04-22 爱尔比奎特公司 机动车辆软件应用和服务的集中化管理
US9489435B2 (en) 2010-05-04 2016-11-08 Volkswagen Ag Method and apparatus for operating a user interface
CN102959359A (zh) * 2010-05-04 2013-03-06 大众汽车有限公司 用于运行用户接口的方法和设备
US10503747B2 (en) 2010-05-04 2019-12-10 Volkswagen Ag Method and apparatus for operating a user interface
CN102959359B (zh) * 2010-05-04 2016-12-14 大众汽车有限公司 用于运行用户接口的方法和设备
US9537563B2 (en) 2011-09-06 2017-01-03 Daimler Ag Automated method for coupling a mobile communication terminal to a central computation unit in a motor vehicle
CN103782570B (zh) * 2011-09-06 2016-12-21 戴姆勒股份公司 移动通信终端设备与机动车中央计算单元的自动耦合方法
CN103187053B (zh) * 2011-12-31 2016-03-30 联想(北京)有限公司 输入方法和电子设备
CN103187053A (zh) * 2011-12-31 2013-07-03 联想(北京)有限公司 输入方法和电子设备
US10041798B2 (en) 2012-12-06 2018-08-07 Qualcomm Incorporated Determination of position, velocity and/or heading by simultaneous use of on-device and on-vehicle information
US11441904B2 (en) 2012-12-06 2022-09-13 Qualcomm Incorporated Determination of position, velocity and/or heading by simultaneous use of on-device and on-vehicle information
CN104813142B (zh) * 2012-12-06 2018-05-18 高通股份有限公司 通过装置上和交通工具上信息的同时使用来确定位置、速度和/或航向
CN104813142A (zh) * 2012-12-06 2015-07-29 高通股份有限公司 通过装置上和交通工具上信息的同时使用来确定位置、速度和/或航向
CN104078045B (zh) * 2013-03-26 2017-05-24 联想(北京)有限公司 一种识别的方法及电子设备
CN104078045A (zh) * 2013-03-26 2014-10-01 联想(北京)有限公司 一种识别的方法及电子设备
CN104865866A (zh) * 2014-02-20 2015-08-26 福特全球技术公司 乘员通信系统和控制方法
CN106104672A (zh) * 2014-02-28 2016-11-09 博士有限公司 音频源的直接选择
CN106104672B (zh) * 2014-02-28 2019-10-01 博士有限公司 音频源的直接选择
CN105006229A (zh) * 2014-04-24 2015-10-28 福特全球技术公司 用于包括车辆更新的额外车辆语音识别训练的方法和设备
CN106663428A (zh) * 2014-07-16 2017-05-10 索尼公司 装置、方法、非暂态计算机可读介质及系统
CN106663428B (zh) * 2014-07-16 2021-02-09 索尼公司 装置、方法、非暂态计算机可读介质及系统
CN105957522A (zh) * 2015-03-09 2016-09-21 福特全球技术公司 基于语音配置文件的车载信息娱乐身份识别
CN105957522B (zh) * 2015-03-09 2021-06-22 福特全球技术公司 基于语音配置文件的车载信息娱乐身份识别
CN108352167A (zh) * 2015-10-28 2018-07-31 福特全球技术公司 包括可佩戴设备的车辆语音识别
CN108604447B (zh) * 2016-02-03 2019-09-24 索尼公司 信息处理装置、信息处理方法和程序
CN108604447A (zh) * 2016-02-03 2018-09-28 索尼公司 信息处理装置、信息处理方法和程序
CN107396074A (zh) * 2016-05-17 2017-11-24 谷歌公司 用于车辆的无线用户接口投影
CN108153507A (zh) * 2016-12-02 2018-06-12 上海博泰悦臻电子设备制造有限公司 一种语音交互方法、系统及一种车机
CN111095400A (zh) * 2017-07-28 2020-05-01 赛伦斯运营公司 选择系统和方法
WO2019119771A1 (zh) * 2017-12-20 2019-06-27 深圳Tcl新技术有限公司 语音交互方法、装置及计算机可读存储介质
CN111492641A (zh) * 2017-12-27 2020-08-04 斯堪尼亚商用车有限公司 用于与车辆通信的方法和控制单元
US11663857B2 (en) 2017-12-27 2023-05-30 Scania CVAB Method and control unit for communicating with a vehicle
CN111492641B (zh) * 2017-12-27 2023-07-21 斯堪尼亚商用车有限公司 用于与车辆通信的方法和控制单元

Also Published As

Publication number Publication date
US7826945B2 (en) 2010-11-02
EP1739546A2 (en) 2007-01-03
EP1739546A3 (en) 2008-06-25
US20070005206A1 (en) 2007-01-04
JP2007011380A (ja) 2007-01-18

Similar Documents

Publication Publication Date Title
CN1920946A (zh) 汽车接口
US9558745B2 (en) Service oriented speech recognition for in-vehicle automated interaction and in-vehicle user interfaces requiring minimal cognitive driver processing for same
CN101272416B (zh) 使用拒绝参考的语音拨号
JP5334178B2 (ja) 音声認識装置およびデータ更新方法
EP1286330B1 (en) Method and apparatus for data entry by voice under adverse conditions
US20120253823A1 (en) Hybrid Dialog Speech Recognition for In-Vehicle Automated Interaction and In-Vehicle Interfaces Requiring Minimal Driver Processing
US9202465B2 (en) Speech recognition dependent on text message content
CN1249667C (zh) 声控服务
US8438028B2 (en) Nametag confusability determination
CN107819929A (zh) 优选表情符号的识别和生成
US8374868B2 (en) Method of recognizing speech
CN1655235A (zh) 基于话音特征自动标识电话呼叫者
US20070156405A1 (en) Speech recognition system
CN105355202A (zh) 语音识别装置、具有语音识别装置的车辆及其控制方法
CN105222797B (zh) 利用口授和部分匹配搜索的导航系统的系统和方法
US20170069311A1 (en) Adapting a speech system to user pronunciation
WO2012174515A1 (en) Hybrid dialog speech recognition for in-vehicle automated interaction and in-vehicle user interfaces requiring minimal cognitive driver processing for same
EP2706528A2 (en) System and method to generate a narrator specific acoustic database without a predefined script
JP2005114964A (ja) 音声認識方法および音声認識処理装置
JP2008139438A (ja) 音声処理装置、端末装置、音声情報管理装置、および、プログラム
JP2001175279A (ja) 音声認識方法
JP2010097073A (ja) 音声認識装置、音声認識システム、盗難車検索システム及び音声認識プログラム
JP2020160108A (ja) エージェント装置、エージェント装置の制御方法、およびプログラム
JPH11125533A (ja) ナビゲーション装置及びナビゲート方法
JP2005004143A (ja) 音声認識装置及びプログラム並びに車両用ナビゲーションシステム

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Open date: 20070228