CN111095400A - 选择系统和方法 - Google Patents
选择系统和方法 Download PDFInfo
- Publication number
- CN111095400A CN111095400A CN201880049873.8A CN201880049873A CN111095400A CN 111095400 A CN111095400 A CN 111095400A CN 201880049873 A CN201880049873 A CN 201880049873A CN 111095400 A CN111095400 A CN 111095400A
- Authority
- CN
- China
- Prior art keywords
- identifying
- verbal
- verbal command
- preferred
- vehicle infotainment
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 73
- 230000001755 vocal effect Effects 0.000 claims abstract description 178
- 238000004590 computer program Methods 0.000 claims abstract description 20
- 230000004044 response Effects 0.000 claims description 18
- 230000001413 cellular effect Effects 0.000 claims description 9
- 230000006870 function Effects 0.000 description 56
- 230000008569 process Effects 0.000 description 56
- 238000010586 diagram Methods 0.000 description 12
- 238000012545 processing Methods 0.000 description 6
- 238000004891 communication Methods 0.000 description 4
- 235000020046 sherry Nutrition 0.000 description 4
- 241000238558 Eucarida Species 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 230000008901 benefit Effects 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 239000013307 optical fiber Substances 0.000 description 2
- 239000004575 stone Substances 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000005055 memory storage Effects 0.000 description 1
- 230000000644 propagated effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000008685 targeting Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
- G06F3/167—Audio in a user interface, e.g. using voice commands for navigating, audio feedback
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/02—Methods for producing synthetic speech; Speech synthesisers
- G10L13/027—Concept to speech synthesisers; Generation of natural phrases from machine-based concepts
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/02—Methods for producing synthetic speech; Speech synthesisers
- G10L13/04—Details of speech synthesis systems, e.g. synthesiser structure or memory management
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Computational Linguistics (AREA)
- Theoretical Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Navigation (AREA)
- User Interface Of Digital Computer (AREA)
Abstract
一种方法、计算机程序产品和计算系统用于在车辆信息娱乐系统上从用户接收言语命令,其中,车辆信息娱乐系统被配置为与外部系统接口。识别优选系统以用于执行言语命令。言语命令被路由至优选系统,其中,优选系统选自车辆信息娱乐系统和外部系统。
Description
相关申请
本申请要求2017年7月28日提交的美国非临时申请序列号15/663,280的权益,其完整内容通过引用并入本文。
技术领域
本公开涉及选择系统,更具体地,涉及在基于车辆的信息娱乐系统内使用的选择系统。
背景技术
如今的汽车高度计算机化。另外,调查表明,新车购买者对在路上时仍允许持续的连接的汽车电子产品非常感兴趣。因此,汽车制造商如今在其车辆内提供极为先进的语音控制信息娱乐系统,其向用户提供许多不同类型的功能。这些信息娱乐系统所提供的一个具体功能是与外部系统(例如,智能电话和平板计算机)接口的能力。
不幸的是,用于这些信息娱乐系统的语音接口常常平谈无奇,因为在外部系统所提供的功能与信息娱乐系统所提供的功能之间进行选择常常很困难。
发明内容
在一个实现方式中,一种计算机实现的方法在计算装置上执行并且包括在车辆信息娱乐系统上从用户接收言语命令,其中,车辆信息娱乐系统被配置为与外部系统接口。识别优选系统以用于执行言语命令。言语命令被路由至优选系统,其中,优选系统选自车辆信息娱乐系统和外部系统。
可包括下列特征中的一个或更多个。外部系统可包括下列中的一个或更多个:蜂窝电话;智能电话;平板计算装置;便携式计算装置;和手持娱乐装置。识别用于执行言语命令的优选系统可包括至少部分地基于与言语命令关联的定义的系统偏好和与言语命令关联的学习的系统偏好中的一个或更多个来识别优选系统。识别用于执行言语命令的优选系统可包括至少部分地基于包括在言语命令内的嵌入的系统偏好来识别优选系统。识别用于执行言语命令的优选系统可包括至少部分地基于与车辆信息娱乐系统和外部系统之一的活动会话的存在来识别优选系统。识别用于执行言语命令的优选系统可包括:向用户提供言语询问;以及至少部分地基于从用户接收的关于提供给用户的言语询问的言语响应来识别优选系统。识别用于执行言语命令的优选系统可包括:向车辆信息娱乐系统和外部系统二者提供言语命令;以及至少部分地基于从车辆信息娱乐系统和外部系统中的一个或更多个接收的响应来确定优选系统。可确定外部系统的文语转换语音的性别。可基于外部系统的文语转换语音的性别来设定车辆信息娱乐系统的文语转换语音的性别。
在另一实现方式中,一种计算机程序产品驻留在计算机可读介质上并且存储有多个指令。当由处理器执行时,所述指令使得处理器执行包括在车辆信息娱乐系统上从用户接收言语命令的操作,其中,车辆信息娱乐系统被配置为与外部系统接口。识别优选系统以用于执行言语命令。言语命令被路由至优选系统,其中,优选系统选自车辆信息娱乐系统和外部系统。
可包括下列特征中的一个或更多个。外部系统可包括下列中的一个或更多个:蜂窝电话;智能电话;平板计算装置;便携式计算装置;和手持娱乐装置。识别用于执行言语命令的优选系统可包括至少部分地基于与言语命令关联的定义的系统偏好和与言语命令关联的学习的系统偏好中的一个或更多个来识别优选系统。识别用于执行言语命令的优选系统可包括至少部分地基于包括在言语命令内的嵌入的系统偏好来识别优选系统。识别用于执行言语命令的优选系统可包括至少部分地基于与车辆信息娱乐系统和外部系统之一的活动会话的存在来识别优选系统。识别用于执行言语命令的优选系统可包括:向用户提供言语询问;以及至少部分地基于从用户接收的关于提供给用户的言语询问的言语响应来识别优选系统。识别用于执行言语命令的优选系统可包括:向车辆信息娱乐系统和外部系统二者提供言语命令;以及至少部分地基于从车辆信息娱乐系统和外部系统中的一个或更多个接收的响应来确定优选系统。可确定外部系统的文语转换语音的性别。可基于外部系统的文语转换语音的性别来设定车辆信息娱乐系统的文语转换语音的性别。
在另一实现方式中,一种计算系统包括处理器和存储器,被配置为执行包括在车辆信息娱乐系统上从用户接收言语命令的操作,其中,车辆信息娱乐系统被配置为与外部系统接口。识别优选系统以用于执行言语命令。言语命令被路由至优选系统,其中,优选系统选自车辆信息娱乐系统和外部系统。
可包括下列特征中的一个或更多个。外部系统可包括下列中的一个或更多个:蜂窝电话;智能电话;平板计算装置;便携式计算装置;和手持娱乐装置。识别用于执行言语命令的优选系统可包括至少部分地基于与言语命令关联的定义的系统偏好和与言语命令关联的学习的系统偏好中的一个或更多个来识别优选系统。识别用于执行言语命令的优选系统可包括至少部分地基于包括在言语命令内的嵌入的系统偏好来识别优选系统。识别用于执行言语命令的优选系统可包括至少部分地基于与车辆信息娱乐系统和外部系统之一的活动会话的存在来识别优选系统。识别用于执行言语命令的优选系统可包括:向用户提供言语询问;以及至少部分地基于从用户接收的关于提供给用户的言语询问的言语响应来识别优选系统。识别用于执行言语命令的优选系统可包括:向车辆信息娱乐系统和外部系统二者提供言语命令;以及至少部分地基于从车辆信息娱乐系统和外部系统中的一个或更多个接收的响应来确定优选系统。可确定外部系统的文语转换语音的性别。可基于外部系统的文语转换语音的性别来设定车辆信息娱乐系统的文语转换语音的性别。
在附图以及下面的具体实施方式中阐述一个或更多个实现方式的细节。其它特征和优点将从具体实施方式、附图和权利要求变得显而易见。
附图说明
图1是根据本公开的实施方式的执行系统选择处理的信息娱乐系统的示意图;以及
图2是根据本公开的实施方式的图1的系统选择处理的流程图。
各种附图中的相似标号指示相似的元件。
具体实施方式
系统概述
在图1中,示出了系统选择处理10。系统选择处理10可驻留在车辆信息娱乐系统12(计算装置)上并且可由其执行。车辆信息娱乐系统12的示例可包括并入车辆中的任何类型的信息娱乐系统,例如车辆导航系统、车辆音乐系统、车辆视频系统和车辆气候控制系统。
可存储在连接到车辆信息娱乐系统12的存储装置14上的系统选择处理10的指令集和子例程可由包括在车辆信息娱乐系统12内的一个或更多个处理器(未示出)和一个或更多个存储器架构(未示出)执行。存储装置14的示例可包括(但不限于):硬盘驱动器;RAID装置;随机存取存储器(RAM);只读存储器(ROM);以及所有形式的闪存存储装置。车辆信息娱乐系统12可执行操作系统,其示例可包括(但不限于)Microsoft Windowstm、Androidtm、iOStm、Linuxtm或定制操作系统。
车辆信息娱乐系统12可被配置为执行用户(例如,用户16)可能感兴趣/对用户有用的各种不同的功能。这些功能的示例可包括(但不限于):无线电功能(例如,允许播放地面无线电台和卫星无线电台);音频功能(例如,允许播放音频,其中,该音频可基于盘或本地存储在存储装置14上);视频功能(例如,允许播放视频,其中,该视频可基于盘或本地存储在存储装置14上);以及导航功能(例如,允许执行导航/指导功能)。
车辆信息娱乐系统12可包括允许选择上述功能的多个按钮(例如,物理按钮或电子按钮)。例如,可经由“无线电”按钮18选择上述无线电功能;可经由“音频”按钮20选择上述音频功能;可经由“视频”按钮22选择上述视频功能;可经由“导航”按钮24选择上述导航功能。
车辆信息娱乐系统12可被配置为与一个或更多个外部系统(例如,外部系统26)接口。外部系统26的示例可包括(但不限于):蜂窝电话;智能电话;平板计算装置;便携式计算装置;远程计算装置、手持娱乐装置(例如,诸如游戏装置)或云服务/平台。当与车辆信息娱乐系统12接口时,外部系统26可经由硬连线连接(例如,USB线缆28)可拆卸地连接到车辆信息娱乐系统12。另选地,外部系统26可经由外部系统26与车辆信息娱乐系统12的天线32之间建立的无线通信信道30来无线地连接到车辆信息娱乐系统12。无线通信信道30的示例可包括(但不限于)蓝牙通信信道。如本领域已知的,蓝牙是允许例如移动电话、计算机和个人数字助理使用短距离无线连接来互连的电信行业规范。
车辆信息娱乐系统12和/或外部系统26可被配置为无线电连接到/访问外部网络(例如,网络34)。网络34的示例可包括(但不限于)互联网、蜂窝网络、WiFi网络和/或基于云的计算平台。
如上面所讨论的,车辆信息娱乐系统12可被配置为执行用户(例如,用户16)可能感兴趣/对用户有用的各种不同的功能。这些功能中的一些可以是驻留在外部系统26上(由其提供)的功能。这种功能的示例可包括电话功能(例如,允许经由车辆信息娱乐系统12使用外部系统26来拨打电话)和系统访问功能(例如,使用户16能够访问外部系统26的内容或功能)。因此,可经由“电话”按钮36选择上述电话功能,可经由“外部”按钮38选择上述系统访问功能。车辆信息娱乐系统12还可包括显示屏幕40和一个或更多个旋钮/拨盘42、44,其实现这些功能的使用。
车辆信息娱乐系统12可包括麦克风组件46和言语至文本转换系统48(例如可得自美国马萨诸塞州伯灵顿的Nuance Communications公司的那些)。因此,车辆信息娱乐系统12可被配置为接受用户16说出和提供(在此示例中)的言语命令(例如,言语命令50)。如下面将更详细讨论的,这些言语命令(例如,言语命令50)可被配置为允许用户16以免提方式访问和控制上述功能。
不幸的是,由于(在此示例中)车辆信息娱乐系统12和外部系统26可能均能够向用户16提供功能(这些不同的功能常常重叠),所以当针对可由车辆信息娱乐系统12和外部系统26中的任一个提供和处理的功能接收到言语命令(例如,言语命令50)时,可能发生混乱。例如,如果言语命令(例如,言语命令50)请求驾驶方向,则该导航功能可由包括在车辆信息娱乐系统12内的导航系统或由安装在外部系统26上的导航应用(例如,Wazetm、AppletmMaps、Googletm Maps)提供。因此,系统选择处理10可被配置为拦截这些言语命令(例如,言语命令50)以使得它们可被路由至适当(或优选)的系统。
还参照图2,针对以下示例假设用户16正在驾驶并发出言语命令50。例如,用户16可选择安装有车辆信息娱乐系统12的车辆内的语音命令按钮(未示出),然后用户16可说出言语命令50。另选地,用户16可说唤醒词语/短语(例如,“嗨Siri”或“嗨Alexa”),然后说出言语命令50;或者用户16可简单地说出言语命令50,并且系统选择处理10可解释该请求;或者用户16可通过说出言语命令50来响应系统选择处理10所作的提示/请求。然后,系统选择处理10可在车辆信息娱乐系统12上(从用户16)接收100言语命令50。
言语命令50的示例可包括(但不限于)关于下列的命令:播放地面无线电台、播放卫星无线电台、播放音乐库内的音乐、获得到期望的目的地的驾驶方向、给配偶拨打电话、定位本地加油站、识别本地餐饮场所以及接收股市报价。
在接收100到言语命令50时,系统选择处理10可识别102用于执行言语命令50的优选系统,其中,该优选系统可选自例如车辆信息娱乐系统12和外部系统26。一旦识别102优选系统,系统选择处理10就可将言语命令50路由104至该优选系统。
识别优选系统:
系统选择处理10识别102优选系统的方式可使用各种方法来实现。例如,可预定义一些系统偏好,同时可学习其它系统偏好。另外,一些言语命令可能是系统选择处理10未知的,因此需要附加询问。
定义的偏好:
当识别102用于执行言语命令(例如,言语命令50)的优选系统(选自车辆信息娱乐系统12和外部系统26)时,系统选择处理10可至少部分地基于与言语命令关联的定义的系统偏好和与言语命令关联的学习的系统偏好中的一个或更多个来识别106优选系统。
在系统选择处理10至少部分地基于与言语命令关联的定义的系统偏好来识别106优选系统的配置中,可利用查找表(例如,查找表52)。例如,系统选择处理10可访问查找表52,其中,查找表52可将各种言语命令与例如车辆信息娱乐系统12或外部系统26的各种功能关联。查找表52可被本地存储或远程存储。例如,查找表52可被本地存储在连接到车辆信息娱乐系统12的存储装置14内(或存储在其上)。另选地,查找表52可被远程存储在网络34内。查找表52内定义的关联可由用户(例如,用户16)定义,可由车辆信息娱乐系统12的制造者定义,或者可由安装有车辆信息娱乐系统12的车辆的制造商设计。
例如,查找表52内定义的条目类型的样本可包括(但不限于):
导航言语命令→本地功能
地面无线电言语命令→本地功能
电话言语命令→远程功能
卫星无线电言语命令→远程功能
因此,在(至少部分地)基于与言语命令关联的定义的系统偏好来识别106优选系统的配置中,如果言语命令50请求开往黄石国家公园的驾驶方向,则系统选择处理10可处理查找表52并将言语命令50路由104至包括在车辆信息娱乐系统12(即,优选系统)内的导航功能。此外,如果言语命令50请求播放96.5FM(即,地面无线电台),则系统选择处理10可处理查找表52并将言语命令50路由104至包括在车辆信息娱乐系统12(即,优选系统)内的无线电功能。相反,如果言语命令50请求拨打电话号码212-555-1212,则系统选择处理10可处理查找表52并将言语命令50路由104至包括在远程系统26(即,优选系统)内的电话功能。另外,如果言语命令50请求播放“Siriustm Summer Jazz”(即,卫星无线电台),则系统选择处理10可处理查找表52并将言语命令50路由104至包括在远程系统26(即,优选系统)内的卫星无线电功能。包括在远程系统26内的卫星无线电功能可由远程系统26经由在远程系统26上执行的一个或更多个应用(例如,应用54、56、58、60)来实现。
在言语命令50请求a)可由车辆信息娱乐系统12或外部系统26处理的功能,并且b)查找表52未提及何种优选系统用于该特定类型的功能的情况下,可应用定义的系统级默认。例如,假设言语命令50是“播放一些50年代的音乐”并且查找表52没有识别用于所请求的音频功能的优选系统。此外,该请求的音频功能可由车辆信息娱乐系统12经由车辆信息娱乐系统12上可用的本地存储的音乐内容提供。另选地,该请求的音频功能可由外部系统26经由远程系统26上可用的本地存储的音乐内容或远程系统26可访问的远程可用的音乐内容来提供。因此,在这种情况下,可应用定义的系统级默认,例如将这些未定义的功能请求路由至本地系统(例如,车辆信息娱乐系统12)。
在系统选择处理10至少部分地基于与言语命令关联的学习的系统偏好来识别106优选系统的配置中,系统选择处理10可确定言语命令(例如,言语命令50)内定义的功能在过去被处理的方式,并且可使用该处理历史来决定现在如何处理言语命令50。例如,如果言语命令50请求开往波士顿洛根机场的驾驶方向,并且最近的七个导航功能请求是由包括在车辆信息娱乐系统12内的导航功能处理的,则系统选择处理10可将言语命令50路由104至包括在车辆信息娱乐系统12(即,优选系统)内的导航功能。
当系统选择处理10至少部分地基于学习的系统偏好来识别106优选系统时,系统选择处理10可利用某种形式的机器学习和/或人工智能。例如,系统选择处理10可利用概率模型来分析车辆信息娱乐系统12和外部系统26内的功能使用数据以发现这些学习的偏好。
嵌入的偏好:
当识别102用于执行言语命令(例如,言语命令50)的优选系统(选自车辆信息娱乐系统12和外部系统26)时,系统选择处理10可至少部分地基于包括在言语命令内的嵌入的系统偏好来识别108优选系统。
例如,如果言语命令50是“在Apple Music上播放一些Led Zeppelin”,则系统选择处理10可通过处理和/或解析言语命令50以确定言语命令50的一部分是否指示所请求的具体功能来识别110优选系统。假设远程系统26是Appletm产品,远程系统26可包括允许经由“Apple Music”系统播放Led Zeppelin的应用(例如,应用54、56、58、60)。因此,在识别110出言语命令50的“Apple Music”部分时,系统选择处理10可将言语命令50路由104至远程系统26(即,优选系统)内的音频功能/Apple Music应用。
活动会话:
当识别102用于执行言语命令(例如,言语命令50)的优选系统(选自车辆信息娱乐系统12和外部系统26)时,系统选择处理10可至少部分地基于与车辆信息娱乐系统和外部系统之一的活动会话的存在来识别110优选系统。
例如,假设用户16正在驾驶其汽车去往黄石国家公园并且他们意识到需要加油。因此,用户16可发出言语命令50“带我去最近的加油站”。因此,既然用户16当前正在使用车辆信息娱乐系统12的导航功能,所以系统选择处理10可将言语命令50路由104至车辆信息娱乐系统12(即,优选系统)内的导航功能。
对信息的请求:
当识别102用于执行言语命令(例如,言语命令50)的优选系统(选自车辆信息娱乐系统12和外部系统26)时,系统选择处理10可向用户提供112言语询问;并且可至少部分地基于从用户接收的关于提供给用户的言语询问的言语响应来识别114优选系统。
如上所述,可存在言语命令50请求a)可由车辆信息娱乐系统12或外部系统26处理的功能,并且b)查找表52未提及何种优选系统用于该特定类型的功能的情况。
尽管(如上所述)可应用定义的系统级默认,但其它配置也是可能的。例如,再次假设言语命令50是“播放一些50年代的音乐”并且查找表52没有识别用于所请求的音频功能的优选系统,其中,该请求的音频功能可由车辆信息娱乐系统12经由车辆信息娱乐系统12上可用的本地存储的音乐内容来提供。另选地,该请求的音频功能可由外部系统26经由远程系统26上可用的本地存储的音乐内容或远程系统26可访问的远程可用的音乐内容来提供。因此,在这种情况下,系统选择处理10可提供112言语询问62(例如,“您想如何播放这50年代的音乐?本地?远程?Pandora?”。然后,用户16可提供言语响应64(例如,“本地”),并且系统选择处理10可至少部分地基于从用户16接收的关于提供给用户16的言语询问62的言语响应64来识别114优选系统(例如,车辆信息娱乐系统12)。
唯一选择:
当识别102用于执行言语命令(例如,言语命令50)的优选系统(选自车辆信息娱乐系统12和外部系统26)时,当仅有一个系统可用于(或能够)提供言语命令50中请求的功能时,系统选择处理10可选择该可用系统。
例如,假设车辆信息娱乐系统12不包括导航功能。此外假设言语命令50请求开往佛罗里达州奥兰德的迪士尼乐园的驾驶方向。因此,系统选择处理10可将言语命令50路由104至包括在外部系统26(即,优选系统)内的导航功能,因为车辆信息娱乐系统12不包括或提供这种功能。
首先响应:
当识别102用于执行言语命令(例如,言语命令50)的优选系统(选自车辆信息娱乐系统12和外部系统26)时,系统选择处理10可向车辆信息娱乐系统12和外部系统26二者提供116言语命令50,并且可至少部分地基于从车辆信息娱乐系统12和外部系统26中的一个或更多个接收的响应来确定118优选系统。
如上所述,可存在言语命令50请求a)可由车辆信息娱乐系统12或外部系统26处理的功能,并且b)查找表52未提及何种优选系统用于该特定类型的功能的情况。
例如,再次假设言语命令50是“播放一些50年代的音乐”并且查找表52没有识别用于所请求的音频功能的优选系统。因此,系统选择处理10可向车辆信息娱乐系统12和外部系统26二者提供116言语命令50。然后,系统选择处理10可侦听来自车辆信息娱乐系统12和外部系统26中的任一个的响应,并且可至少部分地基于所接收的响应来确定118优选系统。
例如,系统选择处理10可将优选系统识别为首先响应的系统。因此,如果车辆信息娱乐系统12开始播放50年代的音乐,则系统选择处理10可例如取消外部系统26所作出的请求或将外部系统26的音频静音。
作为另一示例,假设言语命令50是“导航到Ristorante Pablo”。因此,系统选择处理10可向车辆信息娱乐系统12和外部系统26二者提供116言语命令50。然后,系统选择处理10可侦听来自车辆信息娱乐系统12和外部系统26中的任一个的响应。如果车辆信息娱乐系统12以“抱歉,未找到匹配”响应,则该响应可被系统选择处理10抑制。相反,如果外部系统26以“这是您的匹配”响应,则系统选择处理10可将外部系统26确定118为优选系统。
语音匹配:
系统选择处理10可被配置为监测包括在外部系统26内的文语转换系统,以确定120外部系统26的文语转换语音的性别。然后,系统选择处理10可基于外部系统26的文语转换语音的性别来设定122车辆信息娱乐系统12的文语转换语音的性别。例如,车辆信息娱乐系统12可设定车辆信息娱乐系统12的语音的性别,以a)使车辆信息娱乐系统12的文语转换语音与外部系统26的文语转换语音匹配(以提供均匀的用户体验);或b)使车辆信息娱乐系统12的文语转换语音与外部系统26的文语转换语音相反(以提供听觉系统区分)。
另外,如果针对特定性别在车辆信息娱乐系统12上存在不止一个可用的文语转换语音(例如,存在“Jennifer”文语转换语音和“Sherry”文语转换语音),则系统选择处理10可选择与外部系统26的文语转换语音最紧密匹配的文语转换语音(“Jennifer”或“Sherry”)。例如,如果车辆信息娱乐系统12在外部系统26上检测到Siri文语转换语音,则系统选择处理10可为车辆信息娱乐系统12设定“Sherry”文语转换语音,因为“Sherry”文语转换语音的声音类似于Siri文语转换语音。
第三方系统:
系统选择处理10可被配置为将言语命令50路由至第三方系统。如上所述,网络34的示例可包括(但不限于)互联网、蜂窝网络、WiFi网络和/或基于云的计算平台。因此,在接收到言语命令50时,系统选择处理10可被配置为将言语命令50路由至经由网络34可用的第三方系统,因此允许用户16例如布防/撤防他们家的安全系统,打开车库门,解锁他们家的前门,或调节他们房间的温度。
概述
如本领域技术人员将理解的,本公开可被具体实现为一种方法、系统或计算机程序产品。因此,本公开可采取全硬件实施方式、全软件实施方式(包括固件、常驻软件、微码等)或者将软件和硬件方面组合的实施方式的形式,其在本文中通常可全部称为“电路”、“模块”或“系统”。另外,本公开可采取计算机可用存储介质上的计算机程序产品的形式,在介质中具体实现有计算机可用程序代码。
可利用任何合适的计算机可用或计算机可读介质。例如但不限于,计算机可用或计算机可读介质可以是电、磁、光学、电磁、红外或半导体系统、设备、装置或传播介质。计算机可读介质的更具体示例(非穷尽列表)可包括下列:具有一条或更多条导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光学存储装置、传输介质(例如,支持互联网或内联网的那些)或磁存储装置。计算机可用或计算机可读介质还可以是印刷有程序的纸张或另一合适的介质,因为该程序可经由例如纸张或另一介质的光学扫描来电子捕获,然后根据需要编译、解释或以合适的方式处理,然后被存储在计算机存储器中。在本文的上下文中,计算机可用或计算机可读介质可以是可包含、存储、通信、传播或传输程序以便于指令执行系统、设备或装置使用或与其连接的任何介质。计算机可用介质可包括在基带中或作为载波的一部分具体实现有计算机可用程序代码的传播数据信号。计算机可用程序代码可使用任何适当的介质来发送,包括但不限于互联网、有线、光纤线缆、RF等。
用于实现本公开的操作的计算机程序代码可按照诸如Java、Smalltalk、C++等的面向对象的编程语言来编写。然而,用于实现本公开的操作的计算机程序代码也可按照诸如“C”编程语言或类似编程语言的传统过程编程语言来编写。程序代码可完全在用户的计算机上执行,部分地在用户的计算机上执行,作为独立软件包执行,部分地在用户的计算机上并且部分地在远程计算机上执行,或者完全在远程计算机或服务器上执行。在后一种情形中,远程计算机可通过局域网/广域网/互联网(例如,网络14)连接到用户的计算机。
参照根据本公开的实施方式的方法、设备(系统)和计算机程序产品的流程图和/或框图描述了本公开。将理解,流程图和/或框图的各个方框以及流程图和/或框图中的方框的组合可由计算机程序指令来实现。这些计算机程序指令可被提供给通用计算机/专用计算机/其它可编程数据处理设备的处理器,使得经由计算机或其它可编程数据处理设备的处理器执行的指令创建用于实现流程图和/或框图方框中所指定的功能/行为的手段。
这些计算机程序指令也可被存储在计算机可读存储器中,其可指导计算机或其它可编程数据处理设备按照特定方式起作用,使得存储在计算机可读存储器中的指令生成包括实现流程图和/或框图方框中所指定的功能/行为的指令手段的制品。
计算机程序指令也可被加载到计算机或其它可编程数据处理设备上以使得在计算机或其它可编程设备上执行一系列操作步骤以生成计算机实现的处理,使得在计算机或其它可编程设备上执行的指令提供用于实现流程图和/或框图方框中所指定的功能/行为的步骤。
附图中的流程图和框图可示出根据本公开的各种实施方式的系统、方法和计算机程序产品的可能实现方式的架构、功能和操作。在这方面,流程图或框图中的各个方框可表示模块、段或代码部分,其包括用于实现指定的逻辑功能的一个或更多个可执行指令。还应该注意的是,在一些另选实现方式中,方框中标明的功能可不按图中所标明的次序发生。例如,根据所涉及的功能,连续示出的两个方框实际上可基本上同时执行,或者方框有时可按照相反的次序执行。还将注意的是,框图和/或流程图中的各个方框以及框图和/或流程图中的方框的组合可由执行指定的功能或行为的基于专用硬件的系统或者专用硬件和计算机指令的组合来实现。
本文中所使用的术语仅是为了描述特定实施方式,而非旨在限制本公开。如本文所用,除非上下文清楚地另外指示,否则单数形式旨在也包括复数形式。还将理解,当用在本说明书中时,术语“包括”和/或“包含”指定所述特征、整体、步骤、操作、元件和/或组件的存在,但是不排除一个或更多个其它特征、整体、步骤、操作、元件、组件和/或其组的存在或添加。
如具体要求保护的,随附的权利要求书中的所有装置或步骤加功能元件的对应结构、材料、动作和等同物旨在包括用于与其它要求保护的元件组合执行功能的任何结构、材料或动作。为了例示和描述呈现了本公开的描述,但其并非旨在为穷尽性的或限于所公开的形式的本公开。在不脱离本公开的范围和精神的情况下,对于本领域普通技术人员而言许多修改和变化将是显而易见的。选择并描述实施方式以便最佳地说明本公开的原理和实际应用,并且使得本领域普通技术人员能够理解本公开的各种实施方式以及适合于可以想到的特定用途的各种修改。
已描述了若干实现方式。如此详细描述本申请的公开并且通过参考其实施方式,将显而易见的是在不脱离随附权利要求中限定的本公开的范围的情况下,可进行修改和变化。
Claims (24)
1.一种在计算装置上执行的计算机实现的方法,该方法包括以下步骤:
在车辆信息娱乐系统上从用户接收言语命令,其中,所述车辆信息娱乐系统被配置为与外部系统接口;
识别用于执行所述言语命令的优选系统;以及
将所述言语命令路由至所述优选系统,其中,所述优选系统选自所述车辆信息娱乐系统和所述外部系统。
2.根据权利要求1所述的计算机实现的方法,其中,所述外部系统包括下列中的一个或更多个:
蜂窝电话;
智能电话;
平板计算装置;
便携式计算装置;以及
手持娱乐装置。
3.根据权利要求1所述的计算机实现的方法,其中,识别用于执行所述言语命令的优选系统的步骤包括:
至少部分地基于与所述言语命令关联的定义的系统偏好和与所述言语命令关联的学习的系统偏好中的一个或更多个来识别所述优选系统。
4.根据权利要求1所述的计算机实现的方法,其中,识别用于执行所述言语命令的优选系统的步骤包括:
至少部分地基于包括在所述言语命令内的嵌入的系统偏好来识别所述优选系统。
5.根据权利要求1所述的计算机实现的方法,其中,识别用于执行所述言语命令的优选系统的步骤包括:
至少部分地基于与所述车辆信息娱乐系统和所述外部系统之一的活动会话的存在来识别所述优选系统。
6.根据权利要求1所述的计算机实现的方法,其中,识别用于执行所述言语命令的优选系统的步骤包括:
向所述用户提供言语询问;以及
至少部分地基于从所述用户接收的关于提供给所述用户的所述言语询问的言语响应来识别所述优选系统。
7.根据权利要求1所述的计算机实现的方法,其中,识别用于执行所述言语命令的优选系统的步骤包括:
向所述车辆信息娱乐系统和所述外部系统二者提供所述言语命令;以及
至少部分地基于从所述车辆信息娱乐系统和所述外部系统中的一个或更多个接收的响应来确定所述优选系统。
8.根据权利要求1所述的计算机实现的方法,其中,识别用于执行所述言语命令的优选系统的步骤包括:
确定所述外部系统的文语转换语音的性别;以及
基于所述外部系统的所述文语转换语音的所述性别来设定所述车辆信息娱乐系统的文语转换语音的性别。
9.一种驻留在存储有多个指令的计算机可读介质上的计算机程序产品,所述指令在由处理器执行时使得所述处理器执行操作,所述操作包括:
在车辆信息娱乐系统上从用户接收言语命令,其中,所述车辆信息娱乐系统被配置为与外部系统接口;
识别用于执行所述言语命令的优选系统;以及
将所述言语命令路由至所述优选系统,其中,所述优选系统选自所述车辆信息娱乐系统和所述外部系统。
10.根据权利要求9所述的计算机程序产品,其中,所述外部系统包括下列中的一个或更多个:
蜂窝电话;
智能电话;
平板计算装置;
便携式计算装置;以及
手持娱乐装置。
11.根据权利要求9所述的计算机程序产品,其中,识别用于执行所述言语命令的优选系统的步骤包括:
至少部分地基于与所述言语命令关联的定义的系统偏好和与所述言语命令关联的学习的系统偏好中的一个或更多个来识别所述优选系统。
12.根据权利要求9所述的计算机程序产品,其中,识别用于执行所述言语命令的优选系统的步骤包括:
至少部分地基于包括在所述言语命令内的嵌入的系统偏好来识别所述优选系统。
13.根据权利要求9所述的计算机程序产品,其中,识别用于执行所述言语命令的优选系统的步骤包括:
至少部分地基于与所述车辆信息娱乐系统和所述外部系统之一的活动会话的存在来识别所述优选系统。
14.根据权利要求9所述的计算机程序产品,其中,识别用于所述执行言语命令的优选系统的步骤包括:
向所述用户提供言语询问;以及
至少部分地基于从所述用户接收的关于提供给所述用户的所述言语询问的言语响应来识别所述优选系统。
15.根据权利要求9所述的计算机程序产品,其中,识别用于执行所述言语命令的优选系统的步骤包括:
向所述车辆信息娱乐系统和所述外部系统二者提供所述言语命令;以及
至少部分地基于从所述车辆信息娱乐系统和所述外部系统中的一个或更多个接收的响应来确定所述优选系统。
16.根据权利要求9所述的计算机程序产品,其中,识别用于执行所述言语命令的优选系统的步骤包括:
确定所述外部系统的文语转换语音的性别;以及
基于所述外部系统的所述文语转换语音的所述性别来设定所述车辆信息娱乐系统的文语转换语音的性别。
17.一种被配置为执行操作的包括处理器和存储器的计算系统,所述操作包括:
在车辆信息娱乐系统上从用户接收言语命令,其中,所述车辆信息娱乐系统被配置为与外部系统接口;
识别用于执行所述言语命令的优选系统;以及
将所述言语命令路由至所述优选系统,其中,所述优选系统选自所述车辆信息娱乐系统和所述外部系统。
18.根据权利要求17所述的计算系统,其中,所述外部系统包括下列中的一个或更多个:
蜂窝电话;
智能电话;
平板计算装置;
便携式计算装置;以及
手持娱乐装置。
19.根据权利要求17所述的计算系统,其中,识别用于执行所述言语命令的优选系统的步骤包括:
至少部分地基于与所述言语命令关联的定义的系统偏好和与所述言语命令关联的学习的系统偏好中的一个或更多个来识别所述优选系统。
20.根据权利要求17所述的计算系统,其中,识别用于执行所述言语命令的优选系统的步骤包括:
至少部分地基于包括在所述言语命令内的嵌入的系统偏好来识别所述优选系统。
21.根据权利要求17所述的计算系统,其中,识别用于执行所述言语命令的优选系统的步骤包括:
至少部分地基于与所述车辆信息娱乐系统和所述外部系统之一的活动会话的存在来识别所述优选系统。
22.根据权利要求17所述的计算系统,其中,识别用于执行所述言语命令的优选系统的步骤包括:
向所述用户提供言语询问;以及
至少部分地基于从所述用户接收的关于提供给所述用户的所述言语询问的言语响应来识别所述优选系统。
23.根据权利要求17所述的计算系统,其中,识别用于执行所述言语命令的优选系统的步骤包括:
向所述车辆信息娱乐系统和所述外部系统二者提供所述言语命令;以及
至少部分地基于从所述车辆信息娱乐系统和所述外部系统中的一个或更多个接收的响应来确定所述优选系统。
24.根据权利要求17所述的计算系统,其中,识别用于执行所述言语命令的优选系统的步骤包括:
确定所述外部系统的文语转换语音的性别;以及
基于所述外部系统的所述文语转换语音的所述性别来设定所述车辆信息娱乐系统的文语转换语音的性别。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US15/663,280 | 2017-07-28 | ||
US15/663,280 US11205421B2 (en) | 2017-07-28 | 2017-07-28 | Selection system and method |
PCT/US2018/043664 WO2019023330A1 (en) | 2017-07-28 | 2018-07-25 | SYSTEM AND METHOD OF SELECTION |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111095400A true CN111095400A (zh) | 2020-05-01 |
Family
ID=65041404
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201880049873.8A Pending CN111095400A (zh) | 2017-07-28 | 2018-07-25 | 选择系统和方法 |
Country Status (6)
Country | Link |
---|---|
US (1) | US11205421B2 (zh) |
EP (1) | EP3659138A4 (zh) |
JP (1) | JP7254763B2 (zh) |
KR (1) | KR20200035413A (zh) |
CN (1) | CN111095400A (zh) |
WO (1) | WO2019023330A1 (zh) |
Families Citing this family (62)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9826306B2 (en) | 2016-02-22 | 2017-11-21 | Sonos, Inc. | Default playback device designation |
US10509626B2 (en) | 2016-02-22 | 2019-12-17 | Sonos, Inc | Handling of loss of pairing between networked devices |
US10095470B2 (en) | 2016-02-22 | 2018-10-09 | Sonos, Inc. | Audio response playback |
US9947316B2 (en) | 2016-02-22 | 2018-04-17 | Sonos, Inc. | Voice control of a media playback system |
US9965247B2 (en) | 2016-02-22 | 2018-05-08 | Sonos, Inc. | Voice controlled media playback system based on user profile |
US10264030B2 (en) | 2016-02-22 | 2019-04-16 | Sonos, Inc. | Networked microphone device control |
US9978390B2 (en) | 2016-06-09 | 2018-05-22 | Sonos, Inc. | Dynamic player selection for audio signal processing |
US10134399B2 (en) | 2016-07-15 | 2018-11-20 | Sonos, Inc. | Contextualization of voice inputs |
US10152969B2 (en) | 2016-07-15 | 2018-12-11 | Sonos, Inc. | Voice detection by multiple devices |
US10115400B2 (en) | 2016-08-05 | 2018-10-30 | Sonos, Inc. | Multiple voice services |
US9942678B1 (en) | 2016-09-27 | 2018-04-10 | Sonos, Inc. | Audio playback settings for voice interaction |
US9743204B1 (en) | 2016-09-30 | 2017-08-22 | Sonos, Inc. | Multi-orientation playback device microphones |
US10181323B2 (en) | 2016-10-19 | 2019-01-15 | Sonos, Inc. | Arbitration-based voice recognition |
US10475449B2 (en) | 2017-08-07 | 2019-11-12 | Sonos, Inc. | Wake-word detection suppression |
US10048930B1 (en) | 2017-09-08 | 2018-08-14 | Sonos, Inc. | Dynamic computation of system response volume |
US10446165B2 (en) | 2017-09-27 | 2019-10-15 | Sonos, Inc. | Robust short-time fourier transform acoustic echo cancellation during audio playback |
US10482868B2 (en) | 2017-09-28 | 2019-11-19 | Sonos, Inc. | Multi-channel acoustic echo cancellation |
US10621981B2 (en) | 2017-09-28 | 2020-04-14 | Sonos, Inc. | Tone interference cancellation |
US10466962B2 (en) | 2017-09-29 | 2019-11-05 | Sonos, Inc. | Media playback system with voice assistance |
US11360736B1 (en) * | 2017-11-03 | 2022-06-14 | Amazon Technologies, Inc. | System command processing |
US10880650B2 (en) | 2017-12-10 | 2020-12-29 | Sonos, Inc. | Network microphone devices with automatic do not disturb actuation capabilities |
US10818290B2 (en) | 2017-12-11 | 2020-10-27 | Sonos, Inc. | Home graph |
US11343614B2 (en) | 2018-01-31 | 2022-05-24 | Sonos, Inc. | Device designation of playback and network microphone device arrangements |
US11175880B2 (en) | 2018-05-10 | 2021-11-16 | Sonos, Inc. | Systems and methods for voice-assisted media content selection |
US10847178B2 (en) | 2018-05-18 | 2020-11-24 | Sonos, Inc. | Linear filtering for noise-suppressed speech detection |
US10959029B2 (en) | 2018-05-25 | 2021-03-23 | Sonos, Inc. | Determining and adapting to changes in microphone performance of playback devices |
US10681460B2 (en) | 2018-06-28 | 2020-06-09 | Sonos, Inc. | Systems and methods for associating playback devices with voice assistant services |
US10461710B1 (en) | 2018-08-28 | 2019-10-29 | Sonos, Inc. | Media playback system with maximum volume setting |
US11076035B2 (en) | 2018-08-28 | 2021-07-27 | Sonos, Inc. | Do not disturb feature for audio notifications |
US10587430B1 (en) | 2018-09-14 | 2020-03-10 | Sonos, Inc. | Networked devices, systems, and methods for associating playback devices based on sound codes |
US10878811B2 (en) | 2018-09-14 | 2020-12-29 | Sonos, Inc. | Networked devices, systems, and methods for intelligently deactivating wake-word engines |
US11024331B2 (en) | 2018-09-21 | 2021-06-01 | Sonos, Inc. | Voice detection optimization using sound metadata |
US10811015B2 (en) | 2018-09-25 | 2020-10-20 | Sonos, Inc. | Voice detection optimization based on selected voice assistant service |
US11100923B2 (en) | 2018-09-28 | 2021-08-24 | Sonos, Inc. | Systems and methods for selective wake word detection using neural network models |
US10692518B2 (en) | 2018-09-29 | 2020-06-23 | Sonos, Inc. | Linear filtering for noise-suppressed speech detection via multiple network microphone devices |
US11899519B2 (en) | 2018-10-23 | 2024-02-13 | Sonos, Inc. | Multiple stage network microphone device with reduced power consumption and processing load |
EP3654249A1 (en) | 2018-11-15 | 2020-05-20 | Snips | Dilated convolutions and gating for efficient keyword spotting |
US11183183B2 (en) | 2018-12-07 | 2021-11-23 | Sonos, Inc. | Systems and methods of operating media playback systems having multiple voice assistant services |
US11132989B2 (en) | 2018-12-13 | 2021-09-28 | Sonos, Inc. | Networked microphone devices, systems, and methods of localized arbitration |
US10602268B1 (en) | 2018-12-20 | 2020-03-24 | Sonos, Inc. | Optimization of network microphone devices using noise classification |
US10867604B2 (en) | 2019-02-08 | 2020-12-15 | Sonos, Inc. | Devices, systems, and methods for distributed voice processing |
US11315556B2 (en) | 2019-02-08 | 2022-04-26 | Sonos, Inc. | Devices, systems, and methods for distributed voice processing by transmitting sound data associated with a wake word to an appropriate device for identification |
US11120794B2 (en) | 2019-05-03 | 2021-09-14 | Sonos, Inc. | Voice assistant persistence across multiple network microphone devices |
US11361756B2 (en) | 2019-06-12 | 2022-06-14 | Sonos, Inc. | Conditional wake word eventing based on environment |
US10586540B1 (en) | 2019-06-12 | 2020-03-10 | Sonos, Inc. | Network microphone device with command keyword conditioning |
US11200894B2 (en) | 2019-06-12 | 2021-12-14 | Sonos, Inc. | Network microphone device with command keyword eventing |
US11138975B2 (en) | 2019-07-31 | 2021-10-05 | Sonos, Inc. | Locally distributed keyword detection |
US10871943B1 (en) | 2019-07-31 | 2020-12-22 | Sonos, Inc. | Noise classification for event detection |
US11138969B2 (en) | 2019-07-31 | 2021-10-05 | Sonos, Inc. | Locally distributed keyword detection |
US11189286B2 (en) | 2019-10-22 | 2021-11-30 | Sonos, Inc. | VAS toggle based on device orientation |
US11200900B2 (en) | 2019-12-20 | 2021-12-14 | Sonos, Inc. | Offline voice control |
US11562740B2 (en) | 2020-01-07 | 2023-01-24 | Sonos, Inc. | Voice verification for media playback |
US11556307B2 (en) | 2020-01-31 | 2023-01-17 | Sonos, Inc. | Local voice data processing |
US11308958B2 (en) | 2020-02-07 | 2022-04-19 | Sonos, Inc. | Localized wakeword verification |
US11482224B2 (en) | 2020-05-20 | 2022-10-25 | Sonos, Inc. | Command keywords with input detection windowing |
US11308962B2 (en) | 2020-05-20 | 2022-04-19 | Sonos, Inc. | Input detection windowing |
US11727919B2 (en) | 2020-05-20 | 2023-08-15 | Sonos, Inc. | Memory allocation for keyword spotting engines |
US11698771B2 (en) | 2020-08-25 | 2023-07-11 | Sonos, Inc. | Vocal guidance engines for playback devices |
US11984123B2 (en) | 2020-11-12 | 2024-05-14 | Sonos, Inc. | Network device interaction by range |
US11915691B2 (en) * | 2021-01-19 | 2024-02-27 | Samsung Electronics Co., Ltd. | Electronic apparatus and controlling method thereof |
US11551700B2 (en) | 2021-01-25 | 2023-01-10 | Sonos, Inc. | Systems and methods for power-efficient keyword detection |
CN114274894B (zh) * | 2021-11-22 | 2023-05-30 | 岚图汽车科技有限公司 | 车辆的控制方法和相关设备 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20040044516A1 (en) * | 2002-06-03 | 2004-03-04 | Kennewick Robert A. | Systems and methods for responding to natural language speech utterance |
CN1920946A (zh) * | 2005-07-01 | 2007-02-28 | 伯斯有限公司 | 汽车接口 |
CN101292282A (zh) * | 2005-08-29 | 2008-10-22 | 沃伊斯博克斯科技公司 | 支持自然语言人机交互的移动系统和方法 |
CN104731854A (zh) * | 2013-12-18 | 2015-06-24 | 哈曼国际工业有限公司 | 语音识别查询响应系统 |
CN104951272A (zh) * | 2014-03-25 | 2015-09-30 | 通用汽车环球科技运作有限责任公司 | 用于应用控制的将所接收的图形命令和文本命令转换为语音命令的方法和装置 |
Family Cites Families (28)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3827058B2 (ja) | 2000-03-03 | 2006-09-27 | アルパイン株式会社 | 音声対話装置 |
US7197331B2 (en) * | 2002-12-30 | 2007-03-27 | Motorola, Inc. | Method and apparatus for selective distributed speech recognition |
US8000452B2 (en) * | 2004-07-26 | 2011-08-16 | General Motors Llc | Method and system for predictive interactive voice recognition |
US20090190735A1 (en) * | 2008-01-24 | 2009-07-30 | General Motors Corporation | Method and system for enhancing telematics services |
US8099289B2 (en) * | 2008-02-13 | 2012-01-17 | Sensory, Inc. | Voice interface and search for electronic devices including bluetooth headsets and remote systems |
JP5464078B2 (ja) | 2010-06-30 | 2014-04-09 | 株式会社デンソー | 音声認識端末 |
US20130080932A1 (en) * | 2011-09-27 | 2013-03-28 | Sanjiv Sirpal | Secondary single screen mode activation through user interface toggle |
US20130238326A1 (en) * | 2012-03-08 | 2013-09-12 | Lg Electronics Inc. | Apparatus and method for multiple device voice control |
US9401140B1 (en) * | 2012-08-22 | 2016-07-26 | Amazon Technologies, Inc. | Unsupervised acoustic model training |
US9271111B2 (en) * | 2012-12-14 | 2016-02-23 | Amazon Technologies, Inc. | Response endpoint selection |
CN105340011B (zh) | 2013-06-28 | 2020-08-18 | 哈曼国际工业有限公司 | 链接设备的无线控制 |
US9357361B2 (en) * | 2013-08-25 | 2016-05-31 | Tara Chand Singhal | Apparatus and method for vehicle safety for hands free SMS capability in a moving vehicle |
JP2015141226A (ja) | 2014-01-27 | 2015-08-03 | パイオニア株式会社 | 情報処理装置 |
US10008216B2 (en) * | 2014-04-15 | 2018-06-26 | Speech Morphing Systems, Inc. | Method and apparatus for exemplary morphing computer system background |
JP6482911B2 (ja) * | 2014-07-01 | 2019-03-13 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America | 機器制御方法および電気機器 |
US9412379B2 (en) * | 2014-09-16 | 2016-08-09 | Toyota Motor Engineering & Manufacturing North America, Inc. | Method for initiating a wireless communication link using voice recognition |
US9812128B2 (en) * | 2014-10-09 | 2017-11-07 | Google Inc. | Device leadership negotiation among voice interface devices |
US9812126B2 (en) * | 2014-11-28 | 2017-11-07 | Microsoft Technology Licensing, Llc | Device arbitration for listening devices |
JP6348831B2 (ja) | 2014-12-12 | 2018-06-27 | クラリオン株式会社 | 音声入力補助装置、音声入力補助システムおよび音声入力方法 |
US9984686B1 (en) * | 2015-03-17 | 2018-05-29 | Amazon Technologies, Inc. | Mapping device capabilities to a predefined set |
US9546005B2 (en) * | 2015-04-07 | 2017-01-17 | Honeywell International Inc. | Voice router |
US10235129B1 (en) * | 2015-06-29 | 2019-03-19 | Amazon Technologies, Inc. | Joining users to communications via voice commands |
US10026399B2 (en) * | 2015-09-11 | 2018-07-17 | Amazon Technologies, Inc. | Arbitration between voice-enabled devices |
US11400997B2 (en) * | 2016-05-23 | 2022-08-02 | Indian Motorcycle International, LLC | Display systems and methods for a recreational vehicle |
KR20170132622A (ko) * | 2016-05-24 | 2017-12-04 | 삼성전자주식회사 | 음성 인식 기능을 갖는 전자 장치 및 전자 장치의 동작 방법 |
US10831440B2 (en) * | 2016-09-26 | 2020-11-10 | Lenovo (Singapore) Pte. Ltd. | Coordinating input on multiple local devices |
KR20180083587A (ko) * | 2017-01-13 | 2018-07-23 | 삼성전자주식회사 | 전자 장치 및 그의 동작 방법 |
US10255917B2 (en) * | 2017-03-31 | 2019-04-09 | International Business Machines Corporation | Coordinating the execution of a voice command across multiple connected devices |
-
2017
- 2017-07-28 US US15/663,280 patent/US11205421B2/en active Active
-
2018
- 2018-07-25 WO PCT/US2018/043664 patent/WO2019023330A1/en active Application Filing
- 2018-07-25 EP EP18837462.3A patent/EP3659138A4/en active Pending
- 2018-07-25 KR KR1020207004449A patent/KR20200035413A/ko not_active IP Right Cessation
- 2018-07-25 CN CN201880049873.8A patent/CN111095400A/zh active Pending
- 2018-07-25 JP JP2020504154A patent/JP7254763B2/ja active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20040044516A1 (en) * | 2002-06-03 | 2004-03-04 | Kennewick Robert A. | Systems and methods for responding to natural language speech utterance |
CN1920946A (zh) * | 2005-07-01 | 2007-02-28 | 伯斯有限公司 | 汽车接口 |
CN101292282A (zh) * | 2005-08-29 | 2008-10-22 | 沃伊斯博克斯科技公司 | 支持自然语言人机交互的移动系统和方法 |
CN104731854A (zh) * | 2013-12-18 | 2015-06-24 | 哈曼国际工业有限公司 | 语音识别查询响应系统 |
CN104951272A (zh) * | 2014-03-25 | 2015-09-30 | 通用汽车环球科技运作有限责任公司 | 用于应用控制的将所接收的图形命令和文本命令转换为语音命令的方法和装置 |
Also Published As
Publication number | Publication date |
---|---|
EP3659138A1 (en) | 2020-06-03 |
EP3659138A4 (en) | 2021-02-24 |
WO2019023330A1 (en) | 2019-01-31 |
JP2020529044A (ja) | 2020-10-01 |
US11205421B2 (en) | 2021-12-21 |
US20190311712A1 (en) | 2019-10-10 |
KR20200035413A (ko) | 2020-04-03 |
JP7254763B2 (ja) | 2023-04-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11205421B2 (en) | Selection system and method | |
US20220013122A1 (en) | Voice assistant tracking and activation | |
EP3195310B1 (en) | Keyword detection using speaker-independent keyword models for user-designated keywords | |
JP6571118B2 (ja) | 音声認識処理のための方法、車載システム及び不揮発性記憶媒体 | |
US8706505B1 (en) | Voice application finding and user invoking applications related to a single entity | |
CN107004411B (zh) | 话音应用架构 | |
KR101703911B1 (ko) | 인식된 음성 개시 액션에 대한 시각적 확인 | |
US9809185B2 (en) | Method and apparatus for subjective command control of vehicle systems | |
JP5754368B2 (ja) | 車両の統合操作装置による携帯端末の遠隔的な操作方法、および車両の統合操作装置 | |
US9188456B2 (en) | System and method of fixing mistakes by going back in an electronic device | |
US9679562B2 (en) | Managing in vehicle speech interfaces to computer-based cloud services due recognized speech, based on context | |
US9997160B2 (en) | Systems and methods for dynamic download of embedded voice components | |
US9368107B2 (en) | Permitting automated speech command discovery via manual event to command mapping | |
US11176934B1 (en) | Language switching on a speech interface device | |
US11004447B2 (en) | Speech processing apparatus, vehicle having the speech processing apparatus, and speech processing method | |
US20160098994A1 (en) | Cross-platform dialog system | |
JP2015028566A (ja) | 応答制御システム、車載器、およびセンター | |
US20180261217A1 (en) | Vehicle voice recognition including a wearable device | |
WO2014108981A1 (ja) | 車載情報システムおよび音声認識適応方法 | |
US20180190287A1 (en) | Selection system and method | |
WO2023082649A1 (zh) | 语音对话提示方法、装置、设备及计算机可读存储介质 | |
KR20240072281A (ko) | 선택 시스템 및 방법 | |
JP5500647B2 (ja) | 動的音声認識辞書の生成方法及びその生成装置 | |
JP2008233009A (ja) | カーナビゲーション装置及びカーナビゲーション装置用プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
CB02 | Change of applicant information |
Address after: Massachusetts, USA Applicant after: Serenes operations Address before: The American state of Massachusetts Applicant before: Serenes operations |
|
CB02 | Change of applicant information |