CN107016991A - 处理语音命令 - Google Patents

处理语音命令 Download PDF

Info

Publication number
CN107016991A
CN107016991A CN201610921288.5A CN201610921288A CN107016991A CN 107016991 A CN107016991 A CN 107016991A CN 201610921288 A CN201610921288 A CN 201610921288A CN 107016991 A CN107016991 A CN 107016991A
Authority
CN
China
Prior art keywords
language
voice
voice command
onboard system
institute
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201610921288.5A
Other languages
English (en)
Inventor
穆思库马尔·纳卡拉占
赛乐士·欧嘉哈
吉纳纳·普拉卡什·巴斯克阿然
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ford Global Technologies LLC
Original Assignee
Ford Global Technologies LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ford Global Technologies LLC filed Critical Ford Global Technologies LLC
Publication of CN107016991A publication Critical patent/CN107016991A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/005Language recognition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems
    • G10L15/30Distributed recognition, e.g. in client-server systems, for mobile phones or network applications

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Telephonic Communication Services (AREA)

Abstract

描述了用于处理语音命令的方法。系统包括与无线设备交互的车辆中的车载系统。连接到处理器的语音处理模块是用于接收来自用户的第一语言的语音命令,其中语音命令是用于执行预定义功能。语音处理模块是用于通过网络将语音命令传送至中央服务系统并且通过网络接收来自中央服务系统的语音命令的第二语言的翻译版本。语音命令的翻译版本被提供至车载系统用于执行预定义功能。一旦完成预定义功能,就向用户提供第一语言的语音确认。

Description

处理语音命令
技术领域
本发明主题总体上涉及安装在车辆中的车载计算系统,并且更具体地涉及一种用于处理针对车载计算系统的语音命令的系统。
背景技术
安装在车辆中的车载计算系统(被称为车载系统)除其他方面以外可以包括集成在机动车辆中的通信和娱乐系统以提供娱乐和信息内容。车载系统可以通过无线接口与用户的一个或多个手持型计算设备连接以帮助驾驶员使用语音命令、触摸屏输入或设置到这样的手持型计算设备上的物理按钮控制器来与车载系统进行交互。可以通过车载系统执行的常见任务包括管理和播放音频内容、驾驶导航、提供后座娱乐(例如电影、游戏、社交网络)、打电话、接听传入的文本消息并发送传出的文本消息、通过互联网或智能手机访问内容(例如交通条件、体育成绩和天气预报)等。
一般而言,车载系统被安装在车辆的仪表板上,并且可以使用包括应用程序、用户界面、应用程序编程接口(API)、窗体小部件(widget)以及用于车载系统与其他电子设备通信的操作的诸如此类来实现。车载系统可以经由无线网络与便携式电子设备——例如笔记本电脑、智能电话、个人数字助理(PDA)等——连接,以从这些设备获取信息,或者使用这些设备来访问远程网络。例如,在另一个示例中,车载系统可以与GPS导航设备进行通信,并且接收来自GPS导航设备的车辆的导航信息。
车载系统的用户——例如,车辆的驾驶员——可以使用方向盘上的键盘、小键盘、按钮的某种组合、点击技术以及触摸屏显示器来提供输入至车载系统。然而,由于分散驾驶员的注意力的固有危险,这些常见的交互技术可能不适合用于车辆的环境。因此,对于与车载系统进行用户交互,通常采用语音交互。在通常使用的语音交互中,用户可以提供语音或声音输入至内置于车辆中连接到车载系统的麦克风。麦克风捕获语音输入并且将语音输入传送到车载系统。车载系统一旦接收到语音输入,就利用语音识别技术来对语音输入进行解码以确定要由车载系统执行的动作。车载系统一旦解码语音输入,就执行语音输入的所需功能。
这样的语音交互在申请号为10/569,340('340专利)的美国专利中进行了公开。该'340专利描述了一种车辆中的语音识别系统,该语音识别系统包括麦克风、处理电路、以及无线收发器。麦克风被配置为接收来自车辆乘员的口头命令。它包括被配置为确定语音识别系统是否具有被配置为执行该口头命令的应用程序的处理电路。该处理电路还被配置为基于口头命令来生成口头命令数据。该处理电路基于口头命令数据来执行功能。
发明内容
本文描述的主题涉及一种用于处理针对安装在车辆中的车载计算系统(被称为车载系统)的语音命令的系统和方法。在一个示例实施方式中,该系统包括安装在车辆中的车载系统和通信地连接到车载计算系统的无线设备。该无线设备包括处理器和连接至处理器的语音处理模块。在操作中,该系统接收来自用户的第一语言的语音命令。该语音命令是由用户提供并且是针对用于执行预定义功能的车载系统。该系统通过网络将语音命令传送到中央服务系统并且接收来自中央服务系统的语音命令的第二语言的翻译版本。该语音命令的翻译版本被提供至车载系统用于执行预定义功能。一旦完成预定义功能,就向用户提供第二语言的对用户的语音确认。
参照以下说明书和所附的权利要求书,本发明主题的不同的特征、方面以及优点将可以被更好地理解。提供发明内容是为了以简化的形式介绍构思的选择,并且既不旨在确定所要求保护的主题的关键特征或必要特征,也不旨在用于限制所要求保护的主题的范围。
附图说明
具体实施方式参照以下附图进行了描述。应当指出的是,说明书和附图仅仅是本发明主题的示例并不意味着表示主题本身。
图1示出了根据本发明主题的示例实施方式包括用于处理语音命令的系统的车辆的示意性图示;
图2示出了根据本发明主题的示例实施方式安装在车辆中用于处理语音命令的系统的示意性图示;
图3示出了根据本发明主题的示例实施方式用于处理针对安装在车辆中的车载系统的语音命令的方法。
具体实施方式
如前所述,在安装在车辆的仪表板上的车载系统内可以使用某些语音处理系统。然而,与这样的车载系统交互的常规语音处理系统能够处理来自用户的某一有限组的特定语言的语音输入/命令。常规车载系统——例如安装在车辆中的“福特同步”——当前支持一组19种语言。这样的系统被编程以处理和执行那些特定语言而不是任何其他语言的语音命令。因此,车载系统可能无法处理和执行由用户提供的车载系统不被配置为处理和执行的用户的母语的命令。其结果是,每当用户用被配置到车载系统中的语音以外的任何语音提供语音命令至车载系统时,车载系统可能无法以期望的方式发挥作用。
此外,将车载系统配置为处理和执行附加语言的命令可以包含附加编程并且因此在技术上可能具有挑战性。此外,将车载系统修改为处理以多种语言提供的语音命令也可以是成本密集型的。例如,将车载系统配置为处理以多种语言提供的语音命令可能致使车载系统对于与安装在车辆中的由原始设备制造商(OEM)生产的其他车载设备和车辆部件集成不兼容。
为此,在一个示例实施方式中,本发明主题描述了用于处理针对安装在车辆中的车载系统的语音命令的系统和方法。本方法可以包含与无线设备交互的车载系统。该车载系统可以通过有线或无线接口与无线设备进行交互。在操作中,无线设备可以被用于接收来自用户的第一语言的语音命令。在示例实施方式中,车载系统可以不被配置为处理第一语言的语音命令。
语音命令可以涉及可以由车载系统执行的任何一个或多个功能。在操作中,一旦接收到第一语言的语音命令,无线设备就将语音命令传送至中央服务系统,该中央服务系统通过远程实施联网的计算机系统执行。在操作中,中央服务系统可以将语音命令从第一语言翻译为第二语言。翻译后的第二语言的语音命令然后可以通过中央服务系统被传送到无线设备。
一旦接收到语音命令的翻译版本,无线设备就可以将第二语言的语音命令传达至车载计算设备。在一个实施方式中,翻译后的话音命令可以符合特定的语法使得翻译后的语音命令可由车载系统来处理。在另一个实施方式中,一旦响应于翻译后的话音命令完成预定义功能,就可以由车载系统生成确认并且将其提供至无线设备。此后,无线设备向用户提供作为语音的第一语言的确认。可以理解的是,本方法允许使用任何语音——例如,用户的母语——与由用户操作的配置有基于有限语言的功能的车载系统交互。由于可以使用网络资源,所以从一种语言翻译到另一种可以有效地获得而无需加载到车载系统,或重新编程现有的车载系统。因此,本发明主题的系统提高了车载系统处理多种语言的语音命令的灵活性,而无需对车载系统本身进行进一步修改。
上面提到的实施方式在此参照附图进行进一步描述。应当指出的是,说明书和附图涉及示例性实施方式,并且不应该被认为是对本发明主题的限制。也可以理解的是,虽然在此没有明确地描述或示出,但体现本发明主题的原理的各种布置可以被设计。此外,本文叙述本发明主题的原理、方面和实施例以及特定示例的所有陈述旨在包括它们的等同物。
图1示出了根据本发明主题的示例实施方式用于处理语音命令的车辆102的示意性图示。如图1所示,车辆102包括车载系统104(以下被称为车载系统104)。在一个示例中,车载系统104可以被集成到车辆102的仪表板中。在车辆102内,用户可以具有无线通信设备106(也被称为无线设备)。无线通信设备106可以存在于车辆102的环境中,并且可以经由网络——例如无线保真(WiFi)、蓝牙、和无线局域网(WLAN)——被通信地连接到车载系统104。无线通信设备106可以进一步是使得其能够通过通信网络——例如远程通信网络——与远程定位的系统通信和交换数据。在一个示例中,无线通信设备106可以是任何手持型通信设备,例如智能电话、笔记本电脑、平板电脑、或诸如此类。
在一个示例实施方式中,用户可以进一步具有可佩戴设备108。可佩戴设备108可以通过有线或无线机制被连接到无线通信设备106。可佩戴设备108使得允许用户提供输入至无线通信设备106而无需直接交互。此外,可佩戴设备108也可以被用来将无线通信设备106的任何输出视觉地(例如,以文本消息的形式)或通过音频输出的方式提供至用户。在一个示例实施方式中,可佩戴设备108可以是智能手表或可以是蓝牙耳机。在操作中,用户可以通过提供语音命令来尝试与车载系统104进行交互。
在本实施方式中,语音命令可以是以第一语言。第一语言是使得其不可被车载系统104处理。第一语言的输入语音命令被可佩戴设备108接收,可佩戴设备108进而可以将语音命令传送到无线通信设备106以进行进一步处理。这使得能够准确捕获来自佩戴连接到无线通信设备106和车载系统104的可佩戴设备108的任何车辆乘员(不一定是驾驶员)的语音命令。之后,无线通信设备106可以将第一语言的语音命令传达至中央服务系统(图1中未示出)。中央服务系统可以将第一语言的语音命令翻译成第二语言。翻译后的话音命令随后被无线通信设备106接收,无线通信设备106进而可以将翻译后的话音命令提供至车载系统104以实现进一步功能。这些和其它方面结合图2进行更详细地进一步讨论。
图2示出了根据本发明主题的示例实施方式安装在车辆102中用于处理语音命令的系统的示意性图示。车辆102包括无线通信设备106和车载系统104。
在一个示例实施方式中,无线通信设备106包括处理器202和存储器204。处理器202可以是单个处理单元或多个单元,所有这些都可以包括多个计算单元。处理器202可以被实施为一个或多个微处理器、微型计算机、数字信号处理器、中央处理单元、状态机、逻辑电路、和/或基于操作指令来操纵信号的任何设备。除其他功能之外,处理器202适于读取并执行存储在存储器204中的计算机可读指令。
附图中所示的各种元件的功能,包括标记为“处理器”的任何功能框,可以通过使用专用硬件以及与适当的软件相关能够执行软件的硬件来提供。当由处理器提供时,功能可以通过单个专用处理器、通过单个共享处理器、或通过多个单独的处理器——其中一些可以是共享的——来提供。此外,术语“处理器”的明确使用不应当被认为是专指能够执行软件的硬件,并且可以隐含地包括,但不限于,数字信号处理器(DSP)硬件、网络处理器、专用集成电路(ASIC)、现场可编程门阵列(FPGA)、用于存储软件的只读存储器(ROM)、随机存取存储器(RAM)、非易失性存储器。常规和/或定制的其他硬件也可以被包括在内。
无线通信设备106还可以包括模块206和数据208。模块206和208可以被连接到处理器202。模块206除其他方面以外包括执行特定任务或实施特定抽象数据类型的例程、程序、部件、数据结构等。模块206也可以被实施为信号处理器、状态机、逻辑电路、和/或基于操作指令来操纵信号的任何其它设备或部件。
在本发明主题的示例实施方式中,模块206可以是计算机可读指令,当计算机可读指令被处理器/处理单元执行时,执行所描述的功能中的任何一个。计算机可读指令可以被存储在电子存储设备、硬盘、光盘或其它计算机可读存储介质或非易失性介质中。在一个示例中,计算机可读指令还可以经由网络连接被下载到存储介质。
模块206包括例如语音处理模块210以及其他模块212。其他模块212包括补充由无线通信设备106执行的应用程序或功能的程序。语音处理模块212可以进一步包括收发器,例如可以与一个或多个广域无线网络通信的广域射频(RF)收发器,其连接到数据网络,包括互联网和公共交换电话网(PSTN)。广域无线网络可以是任何适当的基于地面或卫星的类型。
数据208除其他方面以外用作用于存储被模块206获得和处理的数据的资源库。数据208包括例如语音命令数据214、生成的数据216和其它数据218。其它数据218包括由于其他模块212中一个或多个模块的执行而生成的数据。虽然数据208被示为在无线通信设备106内部,但是可以理解的是,数据208可以驻留在外部资料库(附图中未示出)中,外部资料库可以被连接到无线通信设备106。
如图2所示,网络220可以将无线通信设备106连接到一个或多个服务器,该一个或多个服务器可以提供一种或多种服务。在一个示例实施方式中,从用户接收到的语音命令通过网络220被传送到中央服务系统222,中央服务系统222可以包括例如翻译数据库、在线翻译服务系统、可通过网络220访问的语言资料库。网络220可以包括,例如,广域无线网络(例如互联网)和PSTN。在一个示例实施方式中,语音处理模块210可以提供用于语音命令的交互式自然语言语音用户界面。几乎任何服务,包括数据的传送或语音命令的传输,可以通过自然语言语音界面来支持。对于以数据为中心的应用程序,通常使用标准化的数据传送格式,包括例如,用于传送数据至中央服务系统222和传送来自中央服务系统222的数据的通过超文本传输协议(HTTP)的超文本标记语言、通过HTTP或者其它传输协议可能采用多种数据格式或模式的可扩展标记语言(XML)、通过多种传输协议的电子数据交换格式等。
语音处理模块210可以通过一个或多个接口224被连接到处理器202。其他用户接口外围设备也可以通过接口224被连接到处理器202并且可以包括用于文本、图形和视频的包括触摸屏显示器的显示器、用于数据输入的键盘、用于多媒体通信或会议的视频摄像机和定位设备或触笔(未示出)。此外,语音处理模块210可以通过无线本地网络(附图中未示出)——例如蓝牙、WiFi或其它本地数据连接——与车载系统104连接。
为了初始化车辆102,在一个示例实施方式中,可佩戴设备108可以接收来自用户的语音输入。在一个示例实施方式中,语音输入可以是用于初始化车辆102的预先确定的命令。可替代地,用户可以通过方向盘上的按钮或安装在车辆的仪表盘上的触敏显示器来提供初始化车辆102的输入。在一个示例实施方式中,预定的输入命令可以是可以初始化车辆102的流行语(catchword)/热门词语(hotword),例如“您好”。
一旦接收到预定的输入命令,系统就可以激活操作。在操作中,车辆102的用户——例如车辆的驾驶员或车辆中的任何其他乘员——可以将第一语言的语音命令提供至车辆102以执行预定义功能。车辆102的车载系统104一旦执行语音命令,就执行预定义功能。预定义功能可以是,例如,访问互联网、经由无线通信设备106启动远程应用程序、访问连接到车载系统104的其它设备的数据资源、打电话、发送和读取文本消息、以及通过车辆102的GPS检索信息。
在一个示例中,第一语言可以是用户更喜欢说但车辆102的车载计算设备可能未被配置为处理的一种语言。因此,例如,第一语言可以是用户的母语并且第二语言可以是车载系统104被配置为处理的广泛使用的语言。由用户提供的第一语言的语音命令可以被存在于可佩戴设备108中的麦克风或包括在无线通信设备106的接口224中的麦克风捕获。
在一个示例实施方式中,可佩戴设备108可以通过无线或有线接口(图2中未示出)被连接到车载系统104和无线通信设备106。由可佩戴设备108接收到的语音命令可以通过无线本地网络被传送到无线通信设备106。一旦接收到第一语言的语音命令,语音处理模块210就可以处理该语音命令。处理语音命令包括通过语音处理模块210解析语音命令以获得解析后的第一语言的语音命令。在一个实施方式中,一部分语音命令可以被存储在语音命令数据214中。
语音处理模块210通过网络220将解析后的语音命令传送到中央服务系统222。以解析后的形式的第一语言的语音命令可以是以较小部分的形式。在一个实例中,较小部分的语音命令可以通过网络220被传送到中央服务系统222。中央服务系统222可以包括用于将语音命令的一部分从第一语言翻译成第二语言的一个或多个模块。在不脱离本发明主题的范围的前提下,基于本领域技术人员通常理解的机制,从第一语言翻译成第二语言的方式可能会受到影响。
在一个示例实施方式中,当中央服务系统222对于处理语音命令不可访问或网络220上存在可能阻止车辆102和中央服务系统222之间的数据传输的大量潜在因素时,语音命令的一部分可以被存储在语音命令数据214中。因此,语音处理模块210可以在稍后的时间当中央服务系统222可访问时访问语音命令数据214并且将其传送到中央服务系统222。
中央服务系统222将第一语言的语音命令的一部分翻译成第二语言以提供生成的命令。生成的命令可以是,例如,以文本形式的语音命令的翻译版本。用户可以将用户首选与车辆102交互的语言指定为第一语言和将车载系统104被配置为处理的语言指定为第二语言。正常情况下,车载系统104可以被配置为处理一组语言,该组语言中的任何一种都可以被用户选择作为第二语言,而用户可以选择他所选择的任何语言作为第一语言。
在一个示例实施方式中,连接到处理器202的语音处理模块210接收来自中央服务系统222的语音命令的第二语言的翻译版本。在生成的命令是文本的情况下,语音处理模块210可以处理生成的命令以将生成的命令的文本形式转换成相应的语音。在一个示例中,基于文本的生成的命令的处理可以是基于可以被用于解码的字典和短语资料库(图2中未示出)。在一个示例实施方式中,在解码后获得的第二语言的语音命令可以通过语音处理模块210来解析以获得第二语言的语音命令的解析短语。这些第二语言的语音命令的解析短语可以包括映射到预定义功能的第二语言的关键词。
在一个示例实施方式中,第二语言的关键词表示一旦执行语音命令就要由车载系统104执行的预定义功能。因此,例如,如果车辆102的用户想要给朋友打电话,则用户可以说出第一语言——例如,用户的母语——的语音命令。语音命令的第二语言——例如英语——的翻译版本可以包括提供要执行的预定义功能的指示的某些关键词,例如“呼叫”、“连接”、“电话”,等等。如果语音命令的第二语言的翻译版本包含,例如,上面提到的关键词中的任何一个,则该语音命令可以被映射到要由车载系统104执行的预定义功能。
在一个示例实施方式中,映射包括基于关键词将语音命令的第二语言的翻译版本与相应的可由车载系统104执行的机器语音命令相关联。因此,语音处理模块210将机器语音命令提供至车载系统104。机器语音命令然后可以由车载系统104执行以执行一个或多个预定义功能。
在一个示例中,在数据传输和交换期间,车载系统104可以将就绪信号发送到无线通信设备106,向无线通信设备106表明语音命令可以被传送到车载系统104。在车载系统104没有准备好接收语音命令的情况下,车载系统104发送保持请求至语音处理模块210。在一个示例实施方式中,一旦接收到保持请求,无线通信设备106就可以将语音命令的第二语言的翻译版本存储在例如生成的数据216中。无线通信设备106可以在预定的间隔——例如1分钟——后将另一个传输请求发送至车载系统104以检查车载系统104是否准备好接收第二语言的语音命令。
一旦接收到来自车载系统104的就绪信号,无线通信设备106就可以将语音命令的翻译版本提供至车载系统104,以执行通过语音命令所请求的预定义功能。车载系统104可以基于如前所述的预定义功能和关键词之间的映射来执行语音命令。
一旦完成预定义功能的执行,车载系统104就可以返回针对用户的响应。该响应可以通过无线本地网络由车载系统104作为第二语言的文本字符串被传送到无线通信设备106以给予预定义功能的成功完成的指示。以文本字符串的形式的确认可以被无线通信设备106的语音处理模块210接收。语音处理模块210可以将以文本字符串的形式的确认转换为第一语言的语音形式,并且通过安装在车辆中的扬声器或通过无线通信设备106的内置扬声器将其作为输出提供给用户。可替代地,响应可以由车载系统104作为车载系统被配置为处理的第二语言的语音确认来提供。
车载系统104可以通过车辆的扬声器来提供第二语言的语音确认。然而,用户可能无法理解第二语言。因此,在一个示例实施方式中,由车载系统104提供的语音确认可以被无线通信设备106中的麦克风捕获并且无线通信设备106可以提供第一语言的语音确认,第一语言是用户的首选语言。为此,第二语言的语音确认可以通过语音处理模块210被转换成文本形式并且连接到语音处理模块210的收发器可以将文本形式的语音确认传送到中央服务系统222。第一语言的语音确认的翻译版本可以从中央服务系统222被语音处理模块210接收。因此,无线通信设备106可以生成语音确认的翻译版本并且向用户提供第一语言的语音确认的翻译版本,第一语言是用户与车辆102交互的首选语言。
此外,在车辆102无法解码和处理语音命令的情况下,语音处理模块210可以生成对用户的第一语言的查询。在一个实例中,如果存在于语音命令的第二语言的翻译版本中的关键词被映射到一个以上预定义功能,则语音处理模块210将生成对用户的查询。该查询可以包括针对用户的问题以获得来自用户的响应以识别用户期望的预定义功能。
在另一个示例实施方式中,在预定义功能成功完成的情况下由语音处理模块210生成的第一语言的语音确认以及由语音处理模块210生成的查询可以被存储在生成的数据216内。在一个实例中,用户可以提供暂停命令指示语音处理模块210将来自车辆102的任何语音输出存储在生成的数据216中,生成的数据216可以在稍后的时间点被用户检索。暂停命令可以由用户作为语音命令或作为通过其他接口——例如物理按钮和触摸面板——至车辆102的输入来提供。这允许避免给用户——通常是车辆102的驾驶员——造成不希望的分心。
图3示出了根据本发明主题的示例实施方式用于处理针对安装在车辆102中的车载系统104的语音命令的方法300。方法300可以在计算机可执行指令的总体背景下进行描述。通常,计算机可执行指令可以包括执行特定功能或实施特定抽象数据类型的例程、程序、对象、部件、数据结构、过程、模块、功能等。方法300也可以在分布式计算环境中实施,在分布式计算环境中,功能由通过通信网络连接的远程处理设备来执行。在分布式计算环境中,计算机可执行指令可以位于本地和远程计算机存储介质中,包括存储器存储设备。
描述方法的顺序并不旨在被认为为限制,并且所述方法的任何数量的框都可以按任何顺序进行组合以实施方法300或替代方法。此外,各个框可以从方法中删除而不脱离在此所描述的主题的精神和范围。此外,方法300可以在任何合适的硬件、软件、固件或其组合中来实施。
在一个实施方式中,本文描述的一种或多种可以至少部分作为体现在可由一个或多个计算设备执行的非临时性计算机可读介质中的指令来实施。一般情况下,处理器(例如微处理器)从非易失性计算机可读介质(例如,存储器)接收指令,并且执行那些指令,由此执行一种或多种方法,包括本文所述的一种或多种方法。这样的指令可以使用各种已知的计算机可读介质中的任何一种来存储和/或传输。
在一个示例实施方式中,方法300是用于处理针对安装在车辆中的车载系统104的语音命令。在一个示例实施方式中,方法300可以通过车辆102来执行。车辆102包括通信地连接到无线设备106的车载系统104。
参照图3,在框302,方法300包括接收来自用户的第一语言的语音命令,第一语言是用户与车辆102交互的首选语言。语音命令是用于通过车载系统104执行预定义功能。
在框304,通过网络220将语音命令传送到中央服务系统222。网络220可以是广域网,例如互联网或PSTN。中央服务系统222翻译第一语言的语音命令以提供生成的命令,该生成的命令是语音命令的第二语言的翻译版本。车载系统104被配置为执行第二语言的命令。
在框306,生成的命令被无线通信设备106接收。例如,无线通信设备106可以接收生成的命令,该生成的命令包括来自中央服务系统222的语音命令的第二语言的翻译版本。
在框308,生成的命令——即,语音命令的翻译版本——被提供至车载系统104用于执行预定义功能。例如,无线通信设备106可以将生成的命令传送至车载系统104。在一个示例中,生成的命令可以包括机器语音命令。一旦接收,车载系统104就执行这样的机器语音命令以执行用户期望的预定义功能。
在框310,对一个或多个预定义功能的完成的确认被提供至用户。例如,语音处理模块生成用于用户的确认。该确认可以基于由车载系统104提供的语音输出作为文本或作为音频生成。
虽然描述了用于处理语音命令的方法和系统的实施方式,但是可以理解的是,本发明主题不必限于所描述的具体特征或方法。而是,具体特征和方法被公开作为用于处理语音命令的示例实施方式。

Claims (17)

1.一种系统,所述系统包含:
安装在车辆中的车载系统;以及
无线设备,所述无线设备被通信地连接到所述车载系统,其中所述无线设备包含:
处理器;以及
语音处理模块,所述语音处理器模块被连接到所述处理器以:
接收来自用户的第一语言的语音命令,其中所述语音命令是用于执行预定义功能;
通过网络将所述语音命令传送至中央服务系统;
通过所述网络接收来自所述中央服务系统的所述语音命令的第二语言的翻译版本;
将所述语音命令的所述翻译版本提供至所述车载系统用于执行所述预定义功能;
一旦完成所述预定义功能,就向所述用户提供所述第一语音的语音确认。
2.根据权利要求1所述的系统,其中所述语音命令的所述翻译版本包含表示要由所述车载系统执行的所述预定义功能的关键词。
3.根据权利要求1所述的系统,进一步包含通过无线网络连接到所述车载系统和所述无线设备的可佩戴设备,其中所述可佩戴设备是用于接收来自所述用户的语音输入以初始化所述无线设备中的所述语音处理模块。
4.根据权利要求3所述的系统,其中所述可佩戴设备是智能手表。
5.根据权利要求1所述的系统,其中所述无线设备是用于一旦由所述车载系统完成所述预定义功能就接收来自所述车载系统的确认。
6.根据权利要求1所述的系统,进一步包含连接到所述处理器的所述语音处理模块用于将从所述用户接收到的所述第一语音的所述语音命令转换成文本形式。
7.根据权利要求1所述的系统,其中所述无线设备是智能电话、笔记本电脑、以及PDA之一。
8.根据权利要求1所述的系统,其中所述预定义功能是下列功能之一:访问互联网、经由所述无线设备启动远程应用程序、访问连接到所述车载系统的其他设备的数据资源、打电话、发送和读取文本消息以及通过所述车辆的GPS检索信息。
9.根据权利要求1所述的系统,其中所述无线设备经由蓝牙、WiFi、和WLAN之一被通信地连接到所述车载系统。
10.根据权利要求1所述的系统,其中所述无线设备通过所述网络与所述中央服务系统通信。
11.一种用于处理针对安装在车辆中的车载系统的语音命令的方法,所述车载系统被通信地连接到无线设备,所述方法包含:
接收来自用户的第一语言的语音命令,其中所述语音命令是用于执行预定义功能;
通过网络将所述语音命令传送至中央服务系统;
通过所述网络接收来自所述中央服务系统的所述语音命令的第二语言的翻译版本;
将所述语音命令的所述翻译版本提供至所述车载系统用于执行所述预定义功能;以及
一旦完成所述预定义功能,就向所述用户提供所述第一语音的语音确认。
12.根据权利要求11所述的方法,其中提供所述语音命令的所述翻译版本包含下列之一:经由无线网络将来自所述无线设备的所述语音命令的所述翻译版本传送至所述车载系统和将作为语音输入的所述语音命令的所述翻译版本提供至所述车载系统。
13.根据权利要求11所述的方法,其中所述中央服务系统包含翻译数据库和可通过互联网访问的在线翻译服务系统之一。
14.根据权利要求11所述的方法,其中所述方法包含基于存在于所述语音命令的所述翻译版本中的关键词将所述语音命令的所述翻译版本与可由所述车载系统执行的相应的机器语音命令相关联。
15.根据权利要求11所述的方法,其中所述方法包含:
在将所述语音命令的所述翻译版本提供至所述车载系统之前将传输请求发送至所述车载系统;以及
当所述车载系统已准备好接收来自所述无线设备的所述语音命令的所述翻译版本时,接收来自所述车载系统的就绪信号。
16.根据权利要求11所述的方法,其中向所述用户提供所述语音确认包含:
一旦完成所述预定义功能,就接收来自所述车载系统的所述第二语言的语音确认;
通过所述网络将所述第二语言的所述语音确认传送至中央服务系统;
通过所述网络接收来自所述中央服务系统的所述语音确认的所述第一语言的翻译版本;以及
通过安装在所述车辆中的扬声器生成作为音频输出的所述语音确认的所述第一语言的所述翻译版本。
17.一种非易失性机器可读存储介质,所述非易失性机器可读存储介质编码有指令,所述指令可由处理资源执行以进行下列操作:
接收来自用户的第一语言的语音命令,其中所述语音命令是用于执行预定义功能;
通过网络将所述语音命令传送至中央服务系统;
通过所述网络接收来自所述中央服务系统的所述语音命令的第二语言的翻译版本;
将所述语音命令的所述翻译版本提供至车载系统用于执行所述预定义功能;以及
一旦完成所述预定义功能,就向所述用户提供所述第一语音的语音确认。
CN201610921288.5A 2015-10-27 2016-10-21 处理语音命令 Pending CN107016991A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
IN5772/CHE/2015 2015-10-27
IN5772CH2015 2015-10-27

Publications (1)

Publication Number Publication Date
CN107016991A true CN107016991A (zh) 2017-08-04

Family

ID=59439062

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610921288.5A Pending CN107016991A (zh) 2015-10-27 2016-10-21 处理语音命令

Country Status (1)

Country Link
CN (1) CN107016991A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108231076A (zh) * 2018-01-04 2018-06-29 广州视源电子科技股份有限公司 一种语音控制方法、装置、设备及存储介质
WO2019051805A1 (en) * 2017-09-15 2019-03-21 Bayerische Motoren Werke Aktiengesellschaft DATA PROCESSING DEVICE AND METHOD FOR REALIZING SPEECH-BASED MAN-MACHINE INTERACTION
CN111344664A (zh) * 2017-11-24 2020-06-26 三星电子株式会社 电子设备及其控制方法
CN113424255A (zh) * 2019-02-12 2021-09-21 谷歌有限责任公司 引导车辆客户端设备使用设备上的功能

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070005368A1 (en) * 2003-08-29 2007-01-04 Chutorash Richard J System and method of operating a speech recognition system in a vehicle
EP1902906A1 (en) * 2006-09-22 2008-03-26 Harman Becker Automotive Systems GmbH Add-on module for externally controlling a speech dialog system
CN102811284A (zh) * 2012-06-26 2012-12-05 深圳市金立通信设备有限公司 一种语音输入自动翻译为目标语言的方法
JP2014182049A (ja) * 2013-03-21 2014-09-29 Panasonic Corp 車載機器と、それを搭載した自動車
CN104916285A (zh) * 2014-10-13 2015-09-16 江苏华音信息科技有限公司 全自动外语语音现场控制汽车驾驶的控制器装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070005368A1 (en) * 2003-08-29 2007-01-04 Chutorash Richard J System and method of operating a speech recognition system in a vehicle
EP1902906A1 (en) * 2006-09-22 2008-03-26 Harman Becker Automotive Systems GmbH Add-on module for externally controlling a speech dialog system
CN102811284A (zh) * 2012-06-26 2012-12-05 深圳市金立通信设备有限公司 一种语音输入自动翻译为目标语言的方法
JP2014182049A (ja) * 2013-03-21 2014-09-29 Panasonic Corp 車載機器と、それを搭載した自動車
CN104916285A (zh) * 2014-10-13 2015-09-16 江苏华音信息科技有限公司 全自动外语语音现场控制汽车驾驶的控制器装置

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019051805A1 (en) * 2017-09-15 2019-03-21 Bayerische Motoren Werke Aktiengesellschaft DATA PROCESSING DEVICE AND METHOD FOR REALIZING SPEECH-BASED MAN-MACHINE INTERACTION
CN111344664A (zh) * 2017-11-24 2020-06-26 三星电子株式会社 电子设备及其控制方法
CN111344664B (zh) * 2017-11-24 2024-02-13 三星电子株式会社 电子设备及其控制方法
CN108231076A (zh) * 2018-01-04 2018-06-29 广州视源电子科技股份有限公司 一种语音控制方法、装置、设备及存储介质
CN113424255A (zh) * 2019-02-12 2021-09-21 谷歌有限责任公司 引导车辆客户端设备使用设备上的功能

Similar Documents

Publication Publication Date Title
CN100397340C (zh) 以对话为目的的应用抽象
CN100578614C (zh) 用语音应用语言标记执行的语义对象同步理解
CN102137085B (zh) 用于语音命令的多维消歧的系统和方法
US20180232203A1 (en) Method for user training of information dialogue system
CN105264485B (zh) 在多个设备上提供内容
US20200225839A1 (en) Natural language task completion platform authoring for third party experiences
CN102792294B (zh) 自然语言语音服务环境中的混合处理的系统及方法
CN101241537B (zh) Nfc应用的话音接口
US11217244B2 (en) System for processing user voice utterance and method for operating same
CN114424185A (zh) 用于自然语言处理的停用词数据扩充
US20160027440A1 (en) Selective speech recognition for chat and digital personal assistant systems
CN107016991A (zh) 处理语音命令
CN104541325A (zh) 混合模型语音识别
CN101536084A (zh) 对话分析
CN111090728A (zh) 一种对话状态跟踪方法、装置及计算设备
US10560576B1 (en) Electronic device for performing task including call in response to user utterance and operation method thereof
CN108428450A (zh) 一种操作指令处理方法及装置
US20220020358A1 (en) Electronic device for processing user utterance and operation method therefor
CN114154459A (zh) 语音识别文本处理方法、装置、电子设备及存储介质
CN111258529B (zh) 电子设备及其控制方法
US11862178B2 (en) Electronic device for supporting artificial intelligence agent services to talk to users
CN110308886B (zh) 提供与个性化任务相关联的声音命令服务的系统和方法
CN110444200A (zh) 信息处理方法、电子设备、服务器、计算机系统及介质
CN108595141A (zh) 语音输入方法及装置、计算机装置和计算机可读存储介质
CN111726284A (zh) 用于车载智能音箱的微信发送方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20170804