CN109671424B - 车辆特征的响应激活 - Google Patents

车辆特征的响应激活 Download PDF

Info

Publication number
CN109671424B
CN109671424B CN201811177179.2A CN201811177179A CN109671424B CN 109671424 B CN109671424 B CN 109671424B CN 201811177179 A CN201811177179 A CN 201811177179A CN 109671424 B CN109671424 B CN 109671424B
Authority
CN
China
Prior art keywords
vehicle
feature
information
controller
audio
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201811177179.2A
Other languages
English (en)
Other versions
CN109671424A (zh
Inventor
C·R·汉森
D·H·史密斯
X·F·赵
G·塔瓦尔
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
GM Global Technology Operations LLC
Original Assignee
GM Global Technology Operations LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by GM Global Technology Operations LLC filed Critical GM Global Technology Operations LLC
Publication of CN109671424A publication Critical patent/CN109671424A/zh
Application granted granted Critical
Publication of CN109671424B publication Critical patent/CN109671424B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/02Feature extraction for speech recognition; Selection of recognition unit
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/167Audio in a user interface, e.g. using voice commands for navigating, audio feedback
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/165Management of the audio stream, e.g. setting of volume, audio stream path
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems
    • G10L15/30Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W4/00Services specially adapted for wireless communication networks; Facilities therefor
    • H04W4/30Services specially adapted for particular environments, situations or purposes
    • H04W4/40Services specially adapted for particular environments, situations or purposes for vehicles, e.g. vehicle-to-pedestrians [V2P]
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/12Protocols specially adapted for proprietary or special-purpose networking environments, e.g. medical networks, sensor networks, networks in vehicles or remote metering networks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/50Network services
    • H04L67/52Network services specially adapted for the location of the user terminal
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2203/00Aspects of automatic or semi-automatic exchanges
    • H04M2203/05Aspects of automatic or semi-automatic exchanges related to OAM&P
    • H04M2203/053Aspects of automatic or semi-automatic exchanges related to OAM&P remote terminal provisioning, e.g. of applets
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2203/00Aspects of automatic or semi-automatic exchanges
    • H04M2203/10Aspects of automatic or semi-automatic exchanges related to the purpose or context of the telephonic communication
    • H04M2203/1016Telecontrol
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/487Arrangements for providing information services, e.g. recorded voice services or time announcements
    • H04M3/493Interactive information services, e.g. directory enquiries ; Arrangements therefor, e.g. interactive voice response [IVR] systems or voice portals

Abstract

一个总体方面包括一种用于车辆的车辆特征的响应激活的系统,该系统包括:音频系统,其被配置为声明信息和车辆特征;存储器,其被配置为包括一个或多个可执行指令;控制器,其被配置为执行该可执行指令,并且其中该可执行指令使得该控制器能够:从位于车辆中的车辆乘员接收一个或多个语音输入,该语音输入关于车辆特征;响应于接收到的语音输入而从车辆特征信息数据库中检索车辆特征信息;提供车辆特征信息的音频描述信息;确定至少一个接收到的语音输入是否包括特征激活请求;响应于至少一个接收到的语音输入包括特征激活请求的肯定确定而向车辆特征提供车辆特征激活信息。

Description

车辆特征的响应激活
引言
如今的车辆变得越来越复杂并且包括需要某种形式的教育的先进技术特征。结果,已经开发了后端功能以响应地教导车辆操作者和乘客如何查找、操作以及控制这些特定功能。例如,车辆乘员可以请求更多地了解如何改变他们的座椅定向。因此,这些能力充分地教导乘员如何自己激活和控制某些车辆特征。然而,这些特征不能通过远程激活车辆特征来进一步帮助乘员。这些能力也不能结合调用过去的乘员行为或广泛的乘员群体行为的能力来建议乘员可能期望的激活配置。因此,期望提供一种可以响应于乘员请求而描述车辆特征以及激活该特征的方法和系统。还期望为该方法和系统提供基于流行配置激活特征的能力。
发明内容
一个或多个计算机的系统可以被配置为通过在系统上安装软件、固件、硬件或者它们的组合来执行特定操作或动作,该软件、固件、硬件或者它们的组合在操作中使该系统执行该动作。一个或多个计算机程序可以被配置为通过包括指令来执行特定操作或动作,该指令在由数据处理设备执行时使该设备执行该动作。一个总体方面包括一种用于车辆的车辆特征的响应激活的方法,该方法包括:(在控制器处)从车辆乘员接收关于车辆特征的一个或多个语音输入。该方法还包括响应于一个或多个接收的语音输入而(经由控制器)从一个或多个车辆特征信息数据库中检索车辆特征信息。该方法还包括(经由控制器)提供用于车辆特征信息的音频描述信息,该音频描述信息被配置为通过位于车辆中的音频系统来声明。该方法还包括(经由控制器)确定至少一个接收的语音输入是否包括特征激活请求。该方法还包括(经由控制器)响应于至少一个接收到的语音输入包括特征激活请求的肯定确定而激活车辆特征。该方面的其它实施例包括记录在一个或多个计算机存储装置上的相应计算机系统、设备以及计算机程序,它们各自被配置为执行该方法的动作。
实施方案可以包括以下一个或多个特征。该方法包括进一步(经由控制器)提供用于车辆特征信息的视觉描述信息,该视觉描述信息被配置为展示在位于车辆中的可视显示器上。在该方法中,可视显示器是平视显示器(HUD)。该方法进一步包括:响应于至少一个接收到的语音输入包括特征激活请求的肯定确定而(经由控制器)确定车辆特征是否将允许远程激活;并且其中(经由控制器)激活车辆特征的步骤进一步包括当已经作出至少一个接收到的语音输入包括特征激活请求的肯定确定并且已经作出车辆特征允许远程激活的肯定确定时远程地激活车辆特征,否则:(经由控制器)提供关于车辆特征不允许远程激活的一个或多个原因的音频解释信息,该音频解释信息被配置为通过音频系统进行声明。在该方法中,激活车辆特征包括流行的特征配置信息以使激活的车辆特征以预先配置的方式操作。在该方法中,将一个或多个车辆特征信息数据库上传到位于远离数据中心的第三方计算装置中的存储器。在该方法中,该控制器实施自动语音响应系统(VRS)以识别来自车辆乘员的语音输入并且通过音频系统提供车辆特征信息音频描述。在该方法中,该车辆特征信息包括关于一个或多个无线电预设、车辆座椅定向设置、HUD设置、HVAC设置或者它们的某个组合的信息。所描述的技术的实施方案可以包括计算机可访问介质上的硬件、方法或过程或计算机软件。
一个总体方面包括一种用于车辆的车辆特征的响应激活的系统,该系统包括:音频系统,其被配置为声明信息;和车辆特征。该系统还包括存储器,其被配置为包括一个或多个可执行指令;控制器,其被配置为执行可执行指令,并且其中该可执行指令使得控制器能够:从位于车辆中的车辆乘员接收一个或多个语音输入,该一个或多个语音输入关于车辆特征;响应于一个或多个接收到的语音输入而从一个或多个车辆特征信息数据库中检索车辆特征信息;向音频系统提供车辆特征信息的音频描述信息;确定至少一个接收到的语音输入是否包括特征激活请求;响应于至少一个接收到的语音输入包括特征激活请求的肯定确定而向车辆特征提供车辆特征激活信息。该方面的其它实施例包括记录在一个或多个计算机存储装置上的相应计算机系统、设备以及计算机程序,它们各自被配置为执行该方法的动作。
实施方案可以包括以下一个或多个特征。在该系统中,该可执行指令进一步使得控制器能够向位于车辆中的可视显示器提供用于车辆特征信息的视觉描述信息。在该系统中,可视显示器是平视显示器(HUD)。该系统中,该可执行指令进一步使得控制器能够:响应于至少一个接收到的语音输入包括特征激活请求的肯定确定而确定车辆特征是否将允许远程激活;并且当已经作出至少一个接收到的语音输入包括特征激活请求的肯定确定并且已经作出车辆特征允许远程激活的肯定确定时远程地激活车辆特征,否则:向音频系统提供关于车辆特征不允许远程激活的一个或多个原因的音频解释信息。在该系统中,远程车辆特征激活结合流行的特征配置信息以使激活的车辆特征以预先配置的方式操作。在该系统中,将一个或多个车辆特征信息数据库上传到位于远离数据中心的第三方计算装置中的存储器。在该系统中,该控制器实施自动语音响应系统(VRS)以识别来自车辆乘员的语音输入并且通过音频系统提供车辆特征信息音频描述。所描述的技术的实施方案可以包括计算机可访问介质上的硬件、方法或过程或计算机软件。
一个总体方面包括非暂时性和机器可读介质,其上存储有适于产生用于车辆的车辆特征的响应激活的可执行指令,该可执行指令在被提供给控制器并由控制器执行时使控制器:从位于车辆中的车辆乘员接收一个或多个语音输入,该一个或多个语音输入关于车辆特征;响应于一个或多个接收到的语音输入而从一个或多个车辆特征信息数据库中检索车辆特征信息;向位于车辆中的音频系统提供车辆特征信息的音频描述信息;确定一个或多个接收到的语音输入是否包括特征激活请求;响应于至少一个接收到的语音输入包括特征激活请求的肯定确定而向车辆特征提供车辆特征激活信息。该方面的其它实施例包括记录在一个或多个计算机存储装置上的相应计算机系统、设备以及计算机程序,它们各自被配置为执行该方法的动作。
实施方案可以包括以下一个或多个特征。非暂时性和机器可读介质进一步使得控制器能够向位于车辆中的可视显示器提供用于车辆特征信息的视觉描述信息。在该非暂时性和机器可读介质中,可视显示器是平视显示器(HUD)。该非暂时性和机器可读介质进一步使得控制器能够:响应于至少一个接收到的语音输入包括特征激活请求的肯定确定而确定车辆特征是否将允许远程激活;并且当已经作出至少一个接收到的语音输入包括特征激活请求的肯定确定并且已经作出车辆特征允许远程激活的肯定确定时远程地激活车辆特征,否则:向音频系统提供关于车辆特征不允许远程激活的一个或多个原因的音频解释信息。在该非暂时性和机器可读介质中,将一个或多个车辆特征信息数据库上传到位于远离数据中心的第三方计算装置中的存储器。所描述的技术的实施方案可以包括计算机可访问介质上的硬件、方法或过程或计算机软件。
本教导的以上特征和优点以及其它特征和优点从结合附图进行的用于执行教导的具体实施方式中是容易显而易见的。
附图说明
以下将结合以下附图来描述所公开的示例,其中相同的附图标记表示相同的元件,并且其中:
图1是描绘能够利用本文公开的系统和方法的通信系统的示例性实施例的框图;
图2是描绘由本文公开的系统和方法实施的自动语音识别(ASR)系统的实施例的框图;以及
图3是描绘车辆特征的响应激活的方法的实施例的流程图。
具体实施方式
本文描述了本公开的实施例。然而,应当理解,所公开实施例仅仅是示例并且其它实施例可以呈现各种和替代性形式。图式不一定按比例绘制;一些特征可以被放大或最小化以示出特定部件的细节。因此,本文公开的具体结构和功能细节并不解释为限制,而仅仅是用于教导本领域技术人员不同地采用本系统和/或方法的代表性基础。如本领域一般技术人员将理解,参考任何一个图式说明并描述的各个特征可结合一个或多个其它图式中说明的特征以产生未明确说明或描述的实施例。所说明的特征组合提供用于典型应用的代表性实施例。然而,特定应用或实施方案可期望与本公开的教导一致的特征的各个组合和修改。
下面描述的系统和方法提供实时车辆特征/属性描述以及激活。因而,当车辆乘员询问车辆特征(例如,无线电预设、车辆座椅定向设置、HUD设置、HVAC设置等)时,系统将提供对车辆特征的描述。此外,该系统将确定是否激活特征,这通常在提供该描述之后发生。例如,当自动语音响应系统(VRS)接收语音时,内置的自动语音识别系统检查并分析语音以检测语音中的单词。例如,当用户或车辆乘员提供关于车辆特征的语音时,他或她可以说“嘿OnStar,谈谈我的加热座椅”。术语“加热座椅”可以通过VRS识别为车辆特征。随后,该系统将定位车辆特征信息数据库并识别与“加热座椅”对应的描述信息。一旦被识别,然后该系统将检索该描述信息并以可听形式将其提供给乘员。例如,该系统可以激活车辆的立体声系统以解释“您的座椅侧面有一个开关,该开关在激活时将使得您的座椅中的加热线圈能够升温到预选定温度。”在某些情况下,该系统还可以通过显示器以视觉形式提供描述(即,提供座椅加热开关的一个或多个图片)。该系统还将确定乘员是否希望激活车辆特征。该系统可以如下使用立体声系统提示乘员作出激活决定。例如,该系统可能会问“我现在可以为您激活最流行的设置。您需要吗?“在给出肯定答案之后,该系统然后可以定位流行的配置信息数据库并从中识别激活配置信息。一旦被识别,该系统然后将检索流行的配置信息并使用它来以符合车辆乘员自身或车辆特征的类似用户的最流行设置的方式激活车辆特征。
通信系统
参考图1,示出了操作环境,其除了其它特征外还包括移动车辆通信系统10并且可以用于实施本文公开的方法。通信系统10通常包括车辆12、一个或多个无线载波系统14、陆地通信网络16、远程计算机18以及数据中心20。应当理解,所公开的方法可结合任何数量的不同系统使用并且不具体限于这里所示的操作环境。而且,系统10和其单独部件的架构、构造、设置以及操作在本领域中是通常已知的。因此,以下段落仅仅提供了针对一个这样的通信系统10的简要概述;然而,这里未示出的其它系统也可采用所公开的方法。
在所说明的实施例中,车辆12被描绘为乘用车,但是应当明白,也可以包括但不限于摩托车、卡车、公共汽车、运动型多功能车(SUV)、休闲车(RV)、建筑车辆(例如,推土机)、火车、手推车、船舶(例如,船)、飞机、直升机、游乐园车辆、农用设备、高尔夫球车、电车等任何其它车辆。一些车辆特征总体上在图1中示出并且包括被配置为包括一个或多个预设的无线电13、车辆座椅15以及车辆HVAC系统17。一些车辆电子装置28总体上在图1中示出并且包括远程信息处理单元30、麦克风32、一个或多个按钮或其它控制输入34、音频系统36、可视显示器38和GPS模块40以及多个车辆系统模块(VSM)42。一些这样的装置可以直接连接到远程信息处理单元30(诸如,例如麦克风32和按钮34),而其它装置使用一个或多个网络连接(诸如通信总线44或娱乐总线46)间接地连接。合适的网络连接的示例包括控制器局域网(CAN)、WIFI、蓝牙和低功耗蓝牙、媒体导向系统传输(MOST)、本地互连网络(LIN)、局域网(LAN)以及其它适当的连接(诸如以太网或符合已知的ISO、SAE和IEEE标准和规范的其它网络),仅举几例。
远程信息处理单元30可以是OEM安装(嵌入式)或售后收发器装置,其安装在车辆中并且能够通过无线载波系统14和经由无线联网进行无线语音和/或数据通信。这使得车辆能够与数据中心20、其它支持远程信息处理的车辆或一些其它实体或装置进行通信。远程信息处理单元30优选地使用无线电传输来与无线载波系统14建立通信信道(语音信道和/或数据信道)使得可以通过信道发送和接收语音和/或数据传输。通过提供语音和数据通信这两者,远程信息处理单元30使得车辆能够提供许多不同的服务,包括与导航、电话、紧急援助、诊断、信息娱乐等相关的服务。数据可以使用本领域已知的技术经由数据连接(诸如经由通过数据信道的分组数据传输)或经由语音信道来发送。对于涉及语音通信(例如,与数据中心20处的现场顾问86或语音响应单元进行的语音通信)和数据通信(例如,向数据中心20提供GPS位置数据或车辆诊断数据)的组合服务来说,该系统可以利用通过语音信道的单个呼叫并且根据需要通过语音信道在语音和数据传输之间加以切换,并且这可以使用本领域技术人员已知的技术完成。
根据一个实施例,远程信息处理单元30利用根据诸如LTE或5G等标准的蜂窝通信,并且因此包括用于语音通信(如免提呼叫)的标准蜂窝芯片集50、用于数据传输的无线调制解调器(收发器)、电子处理装置52、一个或多个数字存储器装置54以及天线系统56。应当明白,调制解调器可以通过存储在远程信息处理单元中并且由处理器52执行的软件来实施,或者其可为位于远程信息处理单元30内部或外部的单独硬件部件。调制解调器可以使用诸如但不限于WCDMA、LTE以及5G等任何数量的不同标准或协议来操作。还可以使用远程信息处理单元30执行车辆12与其它联网装置之间的无线联网。为此,远程信息处理单元30可以被配置为根据一个或多个无线协议(诸如IEEE802.11协议、WiMAX或蓝牙中的任一种)进行无线通信。当用于诸如TCP/IP等分组交换数据通信时,远程信息处理单元可以被配置有静态IP地址或者可以被设置成从网络上的另一个装置(诸如路由器)或从网络地址服务器自动地接收所分配的IP地址。
远程信息处理控制器52(处理器)可以是能够处理电子指令的任何类型的装置,包括微处理器、微控制器、主处理器、控制器、车辆通信处理器以及专用集成电路(ASIC)。其可以为仅用于远程信息处理单元30的专用处理器,或者可以与其它车辆系统共享。远程信息处理控制器52执行各种类型的数字存储指令,诸如存储在存储器54中的软件或固件程序,该指令使得远程信息处理单元能够提供多种服务。例如,控制器52可以执行程序或过程数据以执行本文所讨论的方法的至少一部分。
远程信息处理单元30可以用于提供涉及去往车辆和/或来自车辆的无线通信的各种各样的车辆服务。这样的服务包括:与基于GPS的车辆导航模块40结合地提供的逐向导航和其它导航相关的服务;与一个或多个车辆系统模块42(VSM)结合地提供的安全气囊展开通知和其它与紧急援助或路边援助有关的服务;使用一个或多个诊断模块的诊断报告;以及信息娱乐相关服务,其中音乐、网页、电影、电视节目、视频游戏和/或其它信息是由信息娱乐模块(未示出)下载并且存储以供当前或后续回放。上文列举的服务决不是远程信息处理单元30的全部能力的详尽列举,而仅仅是远程信息处理单元30能够提供的一些服务的枚举。另外,应当理解,至少一些前述提及的模块可以按照保存在远程信息处理单元30内部或外部的软件指令的形式来实施,它们可以为位于远程信息处理单元30内部或外部的硬件部件,或它们可以与彼此或与位于整辆车中的其它系统集成和/或共享,这里仅列举几种可能性。如果模块被实施为位于远程信息处理单元30外部的VSM42,则它们可以利用车辆总线44来与远程信息处理单元交换数据和命令。
GPS模块40从GPS卫星群60接收无线电信号。根据这些信号,模块40可以确定用于向车辆驾驶员提供导航和其它位置相关服务的车辆位置。导航信息可以呈现在显示器38(或车辆内的其它显示器)上或可用语言呈现,诸如在提供逐向导航时这样做。可以使用专用车内导航模块(其可以为GPS模块40的一部分)提供导航服务,或可以经由远程信息处理单元30完成一些或全部导航服务,其中将位置信息发送到远程位置用于给车辆提供导航地图、地图注释(兴趣点、餐厅等)、路线计算等。可以向数据中心20或其它远程计算系统(诸如计算机18)供应位置信息以便用于其它目的,诸如车队管理。而且,可以经由远程信息处理单元30将新的或更新的地图数据从数据中心20下载到GPS模块40。
除音频系统36和GPS模块40之外,车辆12可以包括呈电子硬件部件形式的其它VSM42,该电子硬件部件位于整辆车中并且通常从一个或多个传感器接收输入并使用所感测的输入来执行诊断、监测、控制、报告和/或其它功能。每个VSM42都优选地由通信总线44连接到其它VSM以及远程信息处理单元30,并且可以被编程为运行车辆系统和子系统诊断测试。
作为示例,一个VSM42可以为控制诸如燃料点火和火花正时等发动机操作的各个方面的发动机控制模块(ECM),另一个VSM42可以为调节车辆动力系的一个或多个部件的操作的动力系控制模块,并且另一个VSM42可以为以控制位于整辆车中的各种电部件(如车辆的电动门锁和车头灯)的车身控制模块。根据一个实施例,发动机控制模块被配备有车载诊断(OBD)特征,其提供诸如从包括车辆排放传感器等各种传感器接收的数据的多种实时数据,并且提供允许技术人员快速地识别并修复车辆内故障的一系列标准化诊断故障代码(DTC)。如本领域技术人员所明白,上述提及的VSM仅仅是可以在车辆12中使用的某些模块的示例,因为许多其它模块也是可能的。
车辆电子装置28还包括多个车辆用户界面,其向车辆乘员提供用于提供和/或接收信息的装置,包括麦克风32、按钮34、音频系统36以及可视显示器38。如本文所使用,术语′车辆用户界面′广泛地包括任何合适形式的电子装置,包括硬件和软件部件两者,该电子装置位于车辆上并且使得车辆用户能够与车辆的部件通信或通过车辆的部件进行通信。麦克风32向远程信息处理单元提供音频输入以使得驾驶员或其它乘员能够经由无线载波系统14提供语音命令并执行免提呼叫。为此,其可以利用本领域中已知的人机界面(HMI)技术连接到车载自动语音处理单元。
按钮34允许手动用户输入进入远程信息处理单元30以发起无线电话呼叫并且提供其它数据、响应或控制输入。单独的按钮可以用于发起紧急呼叫与对数据中心20进行的常规服务救援呼叫。音频系统36向车辆乘员提供音频输出,并且可以是专用的独立系统或主要车辆音频系统的一部分。根据这里所示的特定实施例,音频系统36操作地耦合到车辆总线44和娱乐总线46这两者,并且可以提供AM、FM、媒体流服务(例如,PANDORARADIOTM、SPOTIFYTM等)、卫星无线电、CD、DVD以及其它多媒体功能。该功能可以与上述信息娱乐模块结合或独立提供。可视显示器38优选地是诸如仪表板上的触摸屏或从挡风玻璃反射的平视显示器(HUD)等图形显示器,并且可以用于提供多种输入和输出功能(即,能够进行GUI实施)。音频系统36还可以生成至少一个音频声明以声明这样的第三方联系信息正在显示器38上展示和/或可以生成独立地声明第三方联系信息的音频声明。也可利用各种其它车辆用户界面,因为图1的界面仅仅是一个特定实施方案的示例。
无线载波系统14优选地是蜂窝电话系统,其包括多个蜂窝塔70(仅示出一个)、一个或多个蜂窝网络基础设施(CNI)72以及将无线载波系统14与陆地网络16连接所需要的任何其它联网部件。每个蜂窝塔70都包括发送和接收天线以及基站,其中来自不同蜂窝塔的基站直接或经由诸如基站控制器等中间设备连接到CNI72。蜂窝系统14可以实施任何合适的通信技术,包括(例如)诸如AMPS等模拟技术或诸如但不限于4G LTE和5G等较新数字技术。如本领域技术人员应当明白,各种蜂窝塔/基站/CNI布置是可能的并且可以结合无线系统14使用。例如,基站和蜂窝塔可以共同位于相同站点处或它们可以远离彼此,每个基站可以负责单个蜂窝塔或单个基站可以服务于各个蜂窝塔,且各个基站可以耦合到单个MSC,这里仅列举几种可能布置。
除使用无线载波系统14之外,可以使用呈卫星通信的形式的不同无线载波系统来提供与车辆的单向或双向通信。这可以使用一个或多个通信卫星62和上行链路传输站64来进行。单向通信可以为(例如)卫星无线电服务,其中节目内容(新闻、音乐等)是由传输站64接收、封装上传并且然后发送到卫星62,从而向用户广播该节目。双向通信可以为(例如)使用卫星62以在车辆12与传输站64之间中继电话通信的卫星电话服务。如果使用,那么除了或代替无线载波系统14,可以利用该卫星电话。
陆地网络16可以为连接到一个或多个陆线电话并且将无线载波系统14连接到数据中心20的常规陆基电信网络。例如,陆地网络16可以包括诸如用于提供硬接线电话、分组交换数据通信和因特网基础设施(即,互连计算装置节点的网络)的公共交换电话网(PSTN)。一段或多段陆地网络16可以通过使用标准有线网络、光纤或其它光学网络、电缆网络、电力线、其它无线网络(诸如无线局域网(WLAN))或提供宽带无线接入(BWA)的网络或者它们的任何组合来实施。另外,数据中心20不需要经由陆地网络16连接,反而可以包括无线电话设备使得其可以直接与无线网络(诸如无线载波系统14)通信。
远程计算机18可以为可经由诸如因特网等专用或公共网络接入的许多计算机中的一种。每个这样的计算机18都可以用于一个或多个目的,诸如可由车辆经由远程信息处理单元30和无线载波14接入网络服务器。其它这样的可接入计算机18可以为例如:服务中心计算机(例如,SIP存在服务器),其中可以经由远程信息处理单元30从车辆上传诊断信息和其它车辆数据;由车主或其它用户使用的客户端计算机,其用于诸如接入或接收车辆数据(诸如,例如车辆特征数据和流行的配置数据)或设置或配置用户偏好或控制车辆功能等目的;或者第三方数据仓库,从或向该第三方数据仓库提供车辆数据或其它信息,而无关于是否与车辆12或数据中心20或两者进行通信。计算机18还可以用于提供诸如DNS服务器或网络地址服务器等因特网连接性,该网络地址服务器使用DHCP或其它合适协议来将IP地址分配到车辆12。计算机18还可以存储一个或多个数据库,该数据库包括诸如但不限于车辆特征信息数据库92和流行的特征配置信息数据库94等信息-下面将讨论这两者。
数据中心20被设计为对车辆电子装置28提供许多不同的系统后端功能,并且根据这里所示的示例性实施例,通常包括一个或多个交换机80、服务器82、存储器84、现场顾问86以及自动语音响应系统(VRS)88(即,对语音命令作出响应的计算机界面),其全部是本领域中所已知的。这些不同的数据中心部件优选地经由有线或无线局域网90彼此耦合。交换机80(其可以为专用交换分机(PBX)交换机)路由传入信号使得语音传输通常由常规的电话、后端计算机87发送到现场顾问86或者使用VoIP发送到自动语音响应系统88。服务器82可以结合数据控制器81,其基本上控制服务器82的操作。服务器82可以控制数据信息以及充当收发器以从存储器84、远程信息处理单元30以及移动计算装置57发送和/或接收数据信息(即,数据传输)。
控制器81能够读取存储在非暂时性机器可读介质中的可执行指令,并且可以包括处理器、微处理器、中央处理单元(CPU)、图形处理器、专用集成电路(ASIC)、现场可编程门阵列(FPGA)、状态机中的一个或多个以及硬件、软件与固件部件的组合。现场顾问电话还可以使用VoIP,如图1中的虚线所指示。通过交换机80进行的VoIP和其它数据通信经由连接在陆地通信网络16与局域网90之间的调制解调器(即,收发器)来实施。
数据传输经由调制解调器传递到服务器82和/或存储器84。存储器84可以存储账户信息,诸如车辆动态信息和其它相关用户信息。存储器84还可以存储一个或多个数据库,该数据库包括诸如但不限于车辆特征信息数据库92和流行的特征配置信息数据库94等信息。
关于车辆特征信息,数据库92可以是车辆所有者关于车辆内某些特征的位置、如何激活这些特征以及激活将会导致如何的手动信息的储存库。此外,可以格式化这种信息的各方面以通过音频系统36进行声明,和/或此外可以格式化信息的支持方面以在显示器38上展示。例如,关于一个或多个无线电预设的车辆特征信息可以被配置为通过车辆的立体声扬声器进行声明,并且可以解释在车辆内部可以找到这样的预设的位置(例如,在远程信息处理显示器上)、如何将无线电台改变为预设/改变预设(例如,经由远程信息处理显示器物理地按下虚拟按钮),以及改变无线电台预设将允许车辆乘员更容易地找到期望的无线电台。诸如图片信息和文本等支持信息可以通过显示器38展示,并且可以提供与预设位置、它们的外观、变化以及改变这些预设的结果对应的视觉信息。在另一个示例中,关于车辆座椅定向设置的车辆特征信息可以解释可以通过位于座椅上/附近(例如,在座椅侧面)的开关/按钮重新配置定向设置、如何使用开关/按钮来改变座椅方向,以及每个按钮将如何修改座椅定向。支持信息可以通过显示器38展示,并且可以提供与开关/按钮位置、如何操作开关/按钮以及使用每个按钮将对座椅定向做什么对应的视觉信息。在另一个示例中,关于平视显示器的车辆特征信息可以解释在挡风玻璃上的什么位置显示HUD、HUD可以展示的内容,以及如何改变挡风玻璃上的HUD的位置/定向。支持信息可以通过显示器38展示,并且可以提供与HUD可以展示的内容和如何改变挡风玻璃上的HUD的位置/定向对应的视觉信息。在另一个示例中,关于HVAC设置的车辆特征信息可以解释HVAC控件在车辆内部所处的位置、如何改变HVAC系统设置、HVAC系统的参数以及如何使用HVAC控件。支持信息可以通过显示器38展示,并且可以提供与HVAC控制位置、如何使用HVAC控件以及如何改变系统设置对应的视觉信息。
关于流行的特征配置信息,数据库94可以包括关于历史上已知由车辆乘员实施的车辆特征配置的信息。例如,如果车辆乘员主要以某种方式定向他们所就坐的车辆座椅,则可以收集该信息并将其记录到数据库94中。在另一个示例中,可以收集HUD在挡风玻璃上的一个特定位置处的主要位置并将其记录到数据库94中。应当理解,还可以收集与无线电预设、车辆座椅定向、HUD设置或HVAC设置有关的其它流行配置信息并将其记录到数据库94中。
数据库94可以其它方式或另外包括关于历史上已知由选定的车辆乘员群体实施的车辆特征配置的信息。该信息可以特定于车辆乘员群体的某个子集。例如,可以收集来自车辆群体的信息并将其记录到数据库94中以确定在某个年龄范围(例如,24到30岁)中的车辆乘员群体喜欢某些无线电台预设(例如,摇滚频道、嘻哈频道、乡村频道等)。该信息也可以对于所有车辆乘员是普遍的。例如,可以收集来自车辆群体的信息并将其记录到数据库94中以确定大多数车辆乘员更喜欢将他们的车辆座椅定向在115度的角度。技术人员将得知可以通过一种或多种通常已知的技术来收集、组织和建立该信息。还应当理解,还可以针对车辆乘员群体收集与无线电预设、车辆座椅定向、HUD设置或HVAC设置有关的其它流行配置信息。
数据传输也可以由诸如802.11x、GPRS等无线系统进行。虽然所说明的实施例已经被描述为其将结合使用现场顾问86的人工数据中心20使用,但是应当明白,数据中心反而可以利用VRS88作为自动顾问,或者可以使用VRS88与现场顾问86的组合。
自动语音识别系统
现在转向图2,示出了可以用于实现当前公开的方法的ASR系统210的说明性架构。通常,车辆乘员与自动语音识别系统(ASR)进行声音交互以用于以下一个或多个基本目的:训练系统以理解车辆乘员的特定语音;存储离散语音,诸如口头名称标签或口头控制字,如数字或关键字;或者识别车辆乘员的语音以用于任何合适的目的,诸如语音拨号、菜单导航、转录、服务请求、车辆装置或装置功能控制等。通常,ASR从人类语音中提取声学数据,将声学数据与存储的子单词数据进行比较和对比,选择可以与其它选定的子单词拼接的适当子单词,并且输出拼接的子单词或单词以用于后处理,诸如听写或转录、地址簿拨号、存储到存储器、训练ASR模型或适配参数等。
ASR系统通常是本领域技术人员已知的,并且图2仅说明了一个特定说明性ASR系统210。系统210包括用于接收语音的装置,诸如远程信息处理麦克风32和声学接口33(诸如具有模数转换器以将语音数字转换为声学数据的远程信息处理单元30的声卡)。系统210还包括用于存储声学数据并且存储语音识别软件和数据库的存储器(诸如远程信息处理存储器54)以及用于处理声学数据的处理器(诸如远程信息处理处理器52)。处理器与存储器一起并结合以下模块工作:一个或多个前端处理器或预处理器软件模块212,其用于将语音的声学数据流解析为诸如声学特征等参数表示;一个或多个解码器软件模块214,其用于对声学特征进行解码以产生与输入语音话语对应的数字子单词或单词输出数据:以及一个或多个后处理器软件模块216,其用于使用来自解码器模块214的输出数据以用于任何合适的目的。
系统210还可以从任何其它合适的音频源31接收语音,该音频源可以如实线所示直接与预处理器软件模块212进行通信,或者经由声学接口33与该预处理器软件模块间接通信。音频源31可以包括例如电话音频源,诸如语音邮件系统,或任何类型的其它电话服务。
一个或多个模块或模型可以用作解码器模块214的输入。首先,语法和/或词典模型218可以提供管理哪些单词可以在逻辑上跟随其它单词以形成有效句子的规则。从广义上讲,语法可以定义系统210在任何给定时间在任何给定ASR模式中所期望的全体词汇。例如,如果系统210处于用于训练命令的训练模式,则语法模型218可以包括系统210已知和使用的所有命令。在另一个示例中,如果系统210处于主菜单模式,则活动语法模型218可以包括系统210期望的所有主菜单命令,诸如呼叫、拨号、退出、删除、目录等。其次,声学模型220帮助选择与来自预处理器模块212的输入对应的最可能的子单词或单词。第三,单词模型222和句子/语言模型224在将选定的子单词或单词放入单词或句子语境中时提供规则、语法和/或语义。而且,句子/语言模型224可以定义系统210在任何给定时间在任何给定ASR模式中期望的全体句子,和/或可以提供管理哪些句子可以在逻辑上跟随其它句子以形成有效的扩展语音的规则等。
根据替代的说明性实施例,ASR系统210中的一些或全部可以常驻在远离车辆12的位置中的计算设备(诸如呼叫中心20(例如,VSR88))上并且使用该计算设备进行处理。例如,语法模型、声学模型等可以存储在呼叫中心20中的服务器82和/或数据库84之一的存储器中,并且传送到车辆远程信息处理单元30以进行车内语音处理。类似地,可以使用呼叫中心20中的服务器82之一的处理器来处理语音识别软件。换句话说,ASR系统210可以常驻在远程信息处理单元30中,以任何期望的方式分布在呼叫中心20和车辆12上,和/或常驻在呼叫中心20处。
首先,从人类语音中提取声学数据,其中车辆乘员对着麦克风32说话,该麦克风将话语转换为电信号并且将这样的信号传送到声学接口33。麦克风32中的声音响应元件将乘员的语音话语捕获为气压变化,并且将话语转换为模拟电信号(诸如直流或电压)的相应变化。声学接口33接收模拟电信号,其首先被采样使得模拟信号的值在离散时刻被捕获,然后被量化使得模拟信号的振幅在每个采样时刻被转换为连续的数字语音数据流。换句话说,声学接口33将模拟电信号转换为数字电子信号。数字数据是二进制位,其在远程信息处理存储器54中缓冲,然后由远程信息处理处理器52处理,或者可以在它们最初由处理器52实时接收时进行处理。
其次,预处理器模块212将连续的数字语音数据流变换为离散的声学参数序列。更具体地,处理器52执行预处理器模块212以将数字语音数据分段为例如持续时间为10-30的重叠的语音学或声学帧。这些帧对应于声学子单词,诸如音节、半音节、音素、双音素、音位等。预处理器模块212还执行音素分析以从乘员的语音(诸如每个帧内的时变特征向量)中提取声学参数。乘员语音内的话语可以表示为这些特征向量的序列。例如,并且如本领域技术人员所知,可以提取特征向量,并且该特征向量可以包括例如可以通过对帧执行傅里叶变换和使用余弦变换对声谱进行去相关而获取的声音音调、能量分布、频谱属性和/或倒谱系数。将覆盖特定语音持续时间的声学帧和相应参数拼接成要解码的未知语音测试模式。
第三,处理器执行解码器模块214以处理每个测试模式的输入特征向量。解码器模块214也称为识别引擎或分类器,并且使用存储的已知语音参考模式。与测试模式一样,参考模式被定义为相关声学帧和相应参数的拼接。解码器模块214将要识别的子单词测试模式的声学特征向量与存储的子单词参考模式进行比较和对比,评估其间的差异或相似性的大小,并且最终使用决策逻辑来选择最佳匹配的子单词作为识别的子单词。通常,最佳匹配子单词是对应于存储的已知参考模式的子单词,该存储的已知参考模式与通过本领域技术人员已知用于分析并识别子单词的各种技术中的任何技术确定的测试模式具有最小不相似性或有最高概率是该测试模式。这样的技术可以包括动态时间扭曲分类器、人工智能技术、神经网络、自由音位识别器和/或概率模式匹配器,诸如隐马尔可夫模型(HMM)引擎。
本领域技术人员已知HMM引擎用于产生声学输入的多个语音识别模型假设。在最终识别和选择识别输出时考虑假设,该识别输出表示经由语音的特征分析对声学输入的最可能的正确解码。更具体地,HMM引擎以“N最佳”子单词模型假设列表的形式生成统计模型,该子单词模型假设列表根据HMM计算的置信度值或或在给定一个或另一个子单词的情况下通过诸如应用贝叶斯定理观察到的声学数据序列的概率来进行排名。
贝叶斯HMM过程针对给定的声学特征向量的观察序列识别与最可能的话语或子单词序列对应的最佳假设,并且该序列的置信度值可以取决于包括与传入声学数据相关联的声学信噪比的各种因素。HMM还可以包括称为对角高斯混合的统计分布,其产生每个子单词的每个观察到的特征向量的似然分数,该分数可以用于对假设的N最佳列表重新排序。HMM引擎还可以识别和选择模型似然得分最高的子单词。
以类似方式,可以拼接用于子单词序列的单独HMM以建立单个或多个单词HMM。此后,可以生成并进一步评估单个或多个单词参考模式和相关参数值的N最佳列表。
在一个示例中,语音识别解码器214使用适当的声学模型、语法以及算法来处理特征向量以生成参考模式的N最佳列表。如本文所使用,术语参考模式可与模型、波形、模板、富信号模型、范例、假设或其它类型的参考互换。参考模式可以包括表示一个或多个单词或子单词的一系列特征向量,并且可以基于特定的发言者、说话风格以及可听的环境条件。本领域技术人员将认识到,参考模式可以通过对ASR系统的适当参考模式训练生成并且存储在存储器中。本领域技术人员还将认识到,可以操纵存储的参考模式,其中参考模式的参数值基于参考模式训练与ASR系统的实际使用之间的语音输入信号的差异进行调整。例如,基于来自不同车辆乘员或不同的声学条件的有限量的训练数据,可以调整针对一个车辆乘员或某些声学条件训练的一组参考模式并将其保存为用于不同车辆乘员或不同声学条件的另一组参考模式。换句话说,参考模式不一定是固定的,而是可以在语音识别期间进行调整。
使用词汇内语法和任何合适的解码器算法和声学模型,处理器从存储器访问解译测试模式的若干参考模式。例如,处理器可以生成N最佳词汇结果或参考模式的列表以及相应的参数值,并且将它们存储到存储器。说明性参数值可以包括词汇的N最佳列表和相关片段持续时间、似然分数、信噪比(SNR)值等中的每个参考模式的置信度分数。可以通过参数值的大小的降序来对词汇的N最佳列表进行排序。例如,具有最高置信度分数的词汇参考模式是第一最佳参考模式,依此类推。一旦建立了一串识别的子单词,就可以将它们用于构建具有来自单词模型222的输入的单词并且用于构建具有来自语言模型224的输入的句子。
最后,出于任何合适的目的,后处理器软件模块216从解码器模块214接收输出数据。在一个示例中,后处理器软件模块216可以从单个或多个单词参考模式的N最佳列表中识别或选择参考模式之一作为识别的语音。在另一个示例中,后处理器模块216可以用于将声学数据转换为文本或数字以与ASR系统或其它车辆系统的其它方面一起使用。在另外的示例中,后处理器模块216可以用于向解码器214或预处理器212提供训练反馈。更具体地,后处理器216可以用于训练解码器模块214的声学模型,或者训练预处理器模块212的调整参数。
该方法或其部分可以在计算机程序产品中实施,该计算机程序产品在计算机可读介质中实施并且包括可由一个或多个系统的一个或多个计算机的一个或多个处理器使用以使系统实施一个或多个方法步骤的指令。该计算机程序产品可以包括:一个或多个软件程序,该软件程序包括源代码、目标代码、可执行代码或其它格式的程序指令;一个或多个固件程序;或硬件描述语言(HDL)文件;以及任何程序相关数据。数据可以包括数据结构、查找表或任何其它合适格式的数据。程序指令可以包括程序模块、例程、程序、对象、部件等。计算机程序可以在一个计算机上或在彼此通信的多个计算机上执行。
程序可以在计算机可读介质上实施,该计算机可读介质可以是非暂时性的并且可以包括一个或多个存储装置、制品等。示例性计算机可读介质包括计算机系统存,例如RAM(随机存取存储器)、ROM(只读存储器);半导体存储器,例如EPROM(可擦除、可编程ROM)、EEPROM(电可擦除、可编程ROM)、闪存;磁盘或光盘或磁带;等。例如当通过网络或另一个通信连接(有线、无线或其组合)传输或提供数据时,计算机可读介质还可以包括计算机到计算机的连接。上述示例的任何组合也包括在计算机可读介质的范围内。因此,应当理解,该方法可以至少部分地由能够执行与所公开方法的一个或多个步骤对应的指令的任何电子物品和/或装置来执行。
方法
现在转向图3,示出了用于车辆的车辆特征的响应激活的方法300的示例性实施例。此外方法300可以基于流行的特征配置信息激活车辆特征以便使激活的车辆特征以预先配置的方式操作。该方法的各方面可以通过后端数据控制器81(和服务器82)执行,例如,实施存储在存储器84处的VRS88的功能(包括ASR系统210的结合)。在某些实施例中,外围方面通过远程计算机18执行,例如以从车辆特征信息数据库92和/或流行的特征配置信息数据库94中检索某些信息。在某些实施例中,外围方面通过远程信息处理单元30执行,例如以与音频系统36协调以声明车辆特征信息和/或与显示器38协调以展示车辆特征信息以及辅助车辆特征激活。
在该方法中,VRS88被预先配置为实施ASR系统210以将来自一个或多个车辆乘员的某些语音输入识别为与位于他们的相应车辆上的一个或多个车辆特征相关。远程信息处理单元30被预先配置有后端订购服务,该后端订购服务使得一个或多个车辆乘员能够与VRS88进行实时通信。方法300以301开始,其中麦克风32被配置为收听车辆12内部的语音。此外,在301处,远程信息处理单元30例如经由无线载波系统14与数据中心20持续通信以用于订购服务。因此,由麦克风32拾取的任何识别的语音输入将通过远程信息处理单元30和载波系统14中继/传输到数据中心20(即,VSR88)。
在310处,方法300开始于控制器52接收关于车辆特征的中继/传输的语音输入。如下,例如,车辆乘员可以通过远程信息处理单元30用声音执行他们的后端订阅,并且请求关于选定的车辆特征(例如,无线电预设)的信息。因此,当ASR系统210代表VRS88接收到车辆特征请求的语音输入信息时,服务器52将分析该信息以识别具体询问哪个车辆特征。
一旦识别特定车辆特征,在320处,服务器52就将会与车辆特征信息数据库92对应以检索选定的车辆特征的车辆特征信息。在一个示例中,如上面所讨论,数据库92位于存储器84中。因而,服务器52需要经由局域网90与存储器84进行通信以检索车辆特征信息。在另替代示例中,同样如上面所讨论,数据库92位于一个或多个计算机18中。因而,服务器52需要经由无线载波系统14和/或陆地通信网络16与计算机18进行通信。此外,这种信息可以被格式化以经由音频系统播放和/或可以被格式化以经由显示器展示。随后,服务器52将例如通过远程信息处理单元30将检索到的车辆特征信息传输到车辆12。
在320处,远程信息处理单元30将例如通过无线载波系统14从服务器82接收车辆特征信息。在接收到车辆特征信息时,远程信息处理单元30将激活音频系统36。然后,远程信息处理单元30将向音频系统36产生车辆特征信息,使得可以向车辆乘员声明对车辆特征的描述。如上所例示的,在车辆特征信息属于一个或多个无线电预设的那些情况下,音频系统36可以声明对无线电预设的描述,该描述解释诸如车辆内部在何处可以找到这样的预设、如何将无线电台改变为预设/修改预设等事物,并且解释修改无线电台预设将会允许车辆乘员更容易找到期望的无线电台。
在车辆特征信息还包括可以通过显示器展示的支持信息的那些实施例中,远程信息处理单元30还将激活显示器38。然后,远程信息处理单元30将向显示器38产生车辆特征信息,使得车辆特征的各方面的视觉图像显示可以在车辆内部展示。如上所例示的,当车辆特征信息属于一个或多个无线电预设时,显示器38可以展示图片信息和文本,其公开一个或多个预设位置、预设的外观、如何改变预设,以及改变这样的预设的结果。远程信息处理单元30还可以对应于一个或多个车辆系统/部件和/或GPS模块40以确定要实施哪个显示器-仪表板上的触摸屏或从挡风玻璃反射的HUD。例如,远程信息处理单元30可以从服务器82收集信息,并且可以在车辆移动超过某个速度(例如,高于10mph)时随后将图像路由到HUD38,并且当车辆静止时(至少某个时间量)时可以随后将图像路由到仪表板触摸屏。
在步骤340处,服务器52将确定是否已经进行了特征激活请求。该请求可能是在关于选定的车辆特征的信息的初始请求期间进行的。例如,车辆乘员可以在请求关于该特征的解释信息的同时请求特征激活。替代地,可以在充分声明和/或显示车辆特征信息之后进行该激活请求(步骤320)。例如,可以在车辆特征描述声明完成时被提示之后由车辆乘员进行激活请求。如果服务器52确定车辆乘员已经进行特征激活请求,则方法300将转到步骤350。否则,如果确定没有进行特征激活请求或者使得乘员实际上不想要特征激活,则方法300将转到完成371。在该步骤中,远程信息处理单元30还可以激活显示器38以展示视觉提示以帮助车辆乘员请求特征激活。
在步骤350中,服务器52将响应于在步骤340中作出的肯定确定来激活车辆特征。因而,服务器52可以向远程信息处理单元30传输命令,并且远程信息处理单元30可以激活车辆12处的特征。为了说明,服务器52可以使一个或多个无线电预设远程地并且根据车辆乘员表达的期望进行更新/修改。在方法300的一个或多个实施例中,服务器52可以与流行的特征配置信息数据库94进行通信以预先配置可以激活特征的方式。类似于上面讨论的车辆特征信息数据库92,流行的特征配置信息数据库94可以位于存储器84中和/或数据库94可以位于一个或多个计算机18中。服务器54可以进一步提供车辆乘员用户历史以支持流行特征配置信息数据库94的发现并支持激活特征的配置。通过用户历史提供支持可以实施可以随时间调整的更广泛的分析和统计模型。这种数据库通信可以在车辆乘员被提示查看他们是否希望以符合他们自己过去对该特征的个人使用的预先配置的方式激活他们选定的特征之后发生,或者在他们被提示查看他们是否希望以符合流行的配置(即,来自选定的人群或一般人群)的预先配置的方式激活选定的特征之后发生。实质上,数据库94提供使得服务器52能够以与上下文提示一致的容量激活特征的信息。
步骤350可以进一步包括服务器52与远程信息处理单元30、车辆特征本身或一些其它车辆系统进行通信以确定车辆特征本身是否将允许远程激活。例如,当车辆特征是无线电预设时,服务器52将与远程信息处理单元30进行通信,或者在某些实施例中-直接与车辆的无线电进行通信,以询问预设是否可以由远程实体激活(例如,重新配置、设置无线电台、改变当前的无线电台等)。在进行这样的询问时,如果确定服务器52可以远程激活,则方法300将转到步骤370。否则,方法300将转到步骤360。
在步骤360中,因为服务器52已经确定远程激活选项不可以用于选定的车辆特征,所以服务器54将向远程信息处理单元30或在某些实施例中直接向音频系统36提供音频解释信息。该音频解释信息通常关于车辆特征不允许远程激活的原因并且可以通过音频系统36向车辆乘员进行声明。例如,当车辆特征是车辆座椅定向时,服务器52可以提供当提供给音频系统36时向车辆乘员声明座椅开关/按钮的实施例需要手动调节以重新定向座椅的音频解释。在随后完成步骤360时,方法300将转到完成371。在该步骤中,服务器54还可以提供可以通过显示器展示的支持信息。
在步骤370中,因为服务器52已经确定针对选定的车辆特征实现远程激活,所以服务器54将向远程信息处理单元30(或在某些实施例中直接向车辆特征)提供远程激活命令。该命令将以符合车辆乘员意愿的方式激活该特征。例如,当车辆特征是车辆座椅定向时,服务器52可以提供当直接或间接地(例如,经由车身控制模块42)提供给远程信息处理单元30时将使座椅以符合车辆乘员期望的方式重新定向其自身。实质上,当服务器52肯定地确定车辆乘员期望激活选定的车辆特征并且车辆特征本身允许远程激活时,完成步骤370。在随后完成步骤370时,方法300将转到完成371。
本文所公开的过程、方法或算法可以交付给处理装置、控制器或计算机(可以包括任何现有的可编程电子控制单元或专用电子控制单元)/由其实施。类似地,该过程、方法或算法可以存储为可由控制器或计算机以许多形式执行的数据和指令,该形式包括(但不限于)永久地存储在诸如ROM装置的不可写存储介质上的信息以及可变地存储在诸如软盘、磁带、CD、RAM装置以及其它磁性和光学介质的可写存储介质上的信息。该过程、方法或算法还可以在软件可执行对象中实施。替代地,该过程、方法或算法可以全部或部分使用合适的硬件部件(诸如专用集成电路(ASIC)、现场可编程门阵列(FPGA)、状态机、控制器或其它硬件部件或装置)或硬件、软件和固件部件的组合来实施。
虽然上文描述了示例性实施例,但是并不希望这些实施例描述由权利要求书涵盖的所有可能形式。用在说明书中的词汇是描述性词汇,而不是限制性的词汇,且应当理解,可以进行各种变化而并不脱离本发明的精神和范围。如先前所述,各个实施例的特征可组合成形成可以不明确描述或说明的本发明的进一步实施例。虽然各个实施例就一个或多个所需特性而言可能已经描述为提供优点或优于其它实施例或现有技术实施方案,但是本领域一般技术人员认识到,可牺牲一个或多个特征或特性以实现取决于具体应用和实施方案的所需整体系统属性。这些属性可包括(但不限于)成本、强度、耐用性、生命周期成本、市场适销性、外观、包装、大小、服务能力、重量、可制造性、便于组装等。因而,就一个或多个特性而言,描述为所需性不及其它实施例或现有技术实施方案的实施例不在本公开的范围之外并且对于特定应用可为所需的。
为了便于描述可以在本文使用诸如“内部”、“外部”、“下面”、“下方”、“下部”、“上方”、“上面”等空间相对术语来如图中说明般描述一个元件或特征与另一个元件或特征的关系。空间相对术语可旨在除图中描绘的定向外还涵盖使用或操作中的装置的不同定向。例如,如果图中的装置翻转,则被描述为在其它元件或特征“下方”或“下面”的元件将被定向在其它元件或特征“上方”。因此,示例性术语“下方”可以涵盖上方和下方的定向这两者。装置可以其它方式定向(旋转90度或其它定向),且因此解译本文所使用的空间相对描述符。
在35U.S.C.§112(f)的含义内,权利要求书中叙述的元件均不旨在是装置加功能元件,除非使用短语“用于......的装置”明确叙述元件。

Claims (10)

1.一种用于车辆的车辆特征的响应激活的方法,所述方法包括:
在控制器处从车辆乘员接收关于车辆特征的一个或多个语音输入;
响应于所述一个或多个接收的语音输入而经由所述控制器从一个或多个车辆特征信息数据库中检索车辆特征信息;
经由所述控制器提供用于所述车辆特征信息的音频描述信息,所述音频描述信息被配置为通过位于车辆中的音频系统进行声明;
经由所述控制器确定至少一个接收到的语音输入是否包括特征激活请求;
经由所述控制器响应于所述至少一个接收到的语音输入包括所述特征激活请求的肯定确定而激活所述车辆特征;
经由所述控制器响应于所述至少一个接收到的语音输入包括所述特征激活请求的肯定确定而确定所述车辆特征将是否允许远程激活;以及
其中经由所述控制器激活所述车辆特征的所述步骤进一步包括当已经作出所述至少一个接收到的语音输入包括所述特征激活请求的肯定确定并且已经作出所述车辆特征允许远程激活的肯定确定时,远程地激活所述车辆特征,否则:
经由所述控制器提供关于所述车辆特征不允许远程激活的一个或多个原因的音频解释信息,所述音频解释信息被配置为通过所述音频系统进行声明。
2.根据权利要求1所述的方法,进一步包括经由所述控制器提供用于所述车辆特征信息的视觉描述信息,所述视觉描述信息被配置为展示在位于所述车辆中的可视显示器上。
3.根据权利要求2所述的方法,其中:
可视显示器是平视显示器。
4.根据权利要求1所述的方法,其中激活所述车辆特征结合流行的特征配置信息以使激活的车辆特征以预先配置的方式操作。
5.根据权利要求1所述的方法,其中所述控制器实施自动语音响应系统VRS以识别来自所述车辆乘员的所述语音输入并且通过所述音频系统提供所述车辆特征信息音频描述。
6.一种用于车辆的车辆特征的响应激活的系统,所述系统包括:
所述车辆,其包括:
音频系统,其被配置为声明信息;以及
所述车辆特征;
存储器,其被配置为包括一个或多个可执行指令;
控制器,其被配置为执行所述可执行指令;并且
其中所述可执行指令使得所述控制器能够:
从位于所述车辆中的车辆乘员接收一个或多个语音输入,所述一个或多个语音输入关于所述车辆特征;
响应于所述一个或多个接收到的语音输入而从一个或多个车辆特征信息数据库中检索车辆特征信息;
向所述音频系统提供所述车辆特征信息的音频描述信息;
确定所述一个或多个接收到的语音输入是否包括特征激活请求;
响应于所述至少一个接收到的语音输入包括所述特征激活请求的肯定确定而向所述车辆特征提供特征激活请求;
响应于所述至少一个接收到的语音输入包括所述特征激活请求的肯定确定而确定所述车辆特征将是否允许远程激活;并且
当已经作出所述至少一个接收到的语音输入包括所述特征激活请求的肯定确定并且已经作出所述车辆特征允许远程激活的肯定确定时,远程地激活所述车辆特征,否则:
向所述音频系统提供关于所述车辆特征不允许远程激活的一个或多个原因的音频解释信息。
7.一种非暂时性和机器可读介质,其上存储有适于产生用于车辆的车辆特征的响应激活的可执行指令,所述可执行指令在被提供给控制器并由所述控制器执行时使所述控制器:
从位于所述车辆中的车辆乘员接收一个或多个语音输入,所述一个或多个语音输入关于所述车辆特征;
响应于所述一个或多个接收到的语音输入而从一个或多个车辆特征信息数据库中检索车辆特征信息;
向位于车辆中的音频系统提供车辆特征信息的音频描述信息;
确定所述一个或多个接收到的语音输入是否包括特征激活请求;
响应于所述至少一个接收到的语音输入包括所述特征激活请求的肯定确定而向所述车辆特征提供特征激活请求;
响应于所述至少一个接收到的语音输入包括所述特征激活请求的肯定确定而确定所述车辆特征将是否允许远程激活;并且
当已经作出所述至少一个接收到的语音输入包括所述特征激活请求的肯定确定并且已经作出所述车辆特征允许远程激活的肯定确定时,远程地激活所述车辆特征,否则:
向所述音频系统提供关于所述车辆特征不允许远程激活的一个或多个原因的音频解释信息。
8.根据权利要求7所述的非暂时性和机器可读介质,进一步使得所述控制器能够向位于所述车辆中的可视显示器提供用于所述车辆特征信息的视觉描述信息。
9.根据权利要求8所述的非暂时性和机器可读介质,其中:
可视显示器是平视显示器。
10.根据权利要求7所述的非暂时性和机器可读介质,其中将所述一个或多个车辆特征信息数据库上传到位于远离数据中心的第三方计算装置中的存储器。
CN201811177179.2A 2017-10-16 2018-10-09 车辆特征的响应激活 Active CN109671424B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US15/784,377 US10269350B1 (en) 2017-10-16 2017-10-16 Responsive activation of a vehicle feature
US15/784377 2017-10-16

Publications (2)

Publication Number Publication Date
CN109671424A CN109671424A (zh) 2019-04-23
CN109671424B true CN109671424B (zh) 2023-10-20

Family

ID=65910428

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811177179.2A Active CN109671424B (zh) 2017-10-16 2018-10-09 车辆特征的响应激活

Country Status (3)

Country Link
US (1) US10269350B1 (zh)
CN (1) CN109671424B (zh)
DE (1) DE102018125564A1 (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7266432B2 (ja) * 2019-03-14 2023-04-28 本田技研工業株式会社 エージェント装置、エージェント装置の制御方法、およびプログラム
US10609148B1 (en) * 2019-09-17 2020-03-31 Ha Q Tran Smart vehicle
US20210158810A1 (en) * 2019-11-25 2021-05-27 GM Global Technology Operations LLC Voice interface for selection of vehicle operational modes
US11818538B2 (en) 2019-12-27 2023-11-14 Harman International Industries, Incorporated System and method for managing content of in vehicle infotainment systems
CN111698188A (zh) * 2020-05-22 2020-09-22 广西华南通信股份有限公司 基于级联人工神经网络的多载波单无线转发站分配方法
CN113129891A (zh) * 2021-04-29 2021-07-16 平顶山聚新网络科技有限公司 一种汽车使用指导系统及方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103794213A (zh) * 2012-10-31 2014-05-14 通用汽车环球科技运作有限责任公司 车辆中的通过外在装置的语音识别功能
CN103905520A (zh) * 2012-12-30 2014-07-02 比亚迪股份有限公司 车载终端的控制方法与系统以及云端服务器
CN105609109A (zh) * 2014-10-16 2016-05-25 通用汽车有限责任公司 混合式自动语音识别
CN107204185A (zh) * 2017-05-03 2017-09-26 深圳车盒子科技有限公司 车载语音交互方法、系统及计算机可读存储介质

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5926086A (en) * 1996-05-03 1999-07-20 Escareno; Joe System and method for vehicle theft prevention and recovery
US20030212480A1 (en) * 2002-05-10 2003-11-13 Medius, Inc. Method and apparatus for controlling operations in a vehicle
JP2004037998A (ja) * 2002-07-05 2004-02-05 Denso Corp 音声制御装置
US7026918B2 (en) * 2002-08-26 2006-04-11 David Douglas Briick Motor vehicle verification and control system
US20110307394A1 (en) * 2009-06-12 2011-12-15 Rzepecki S Ryan Municipal bicycle sharing system
US20140143839A1 (en) * 2011-11-16 2014-05-22 Flextronics Ap, Llc. On board vehicle remote control module
US20150255063A1 (en) 2014-03-10 2015-09-10 General Motors Llc Detecting vanity numbers using speech recognition
US20170018273A1 (en) * 2015-07-16 2017-01-19 GM Global Technology Operations LLC Real-time adaptation of in-vehicle speech recognition systems

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103794213A (zh) * 2012-10-31 2014-05-14 通用汽车环球科技运作有限责任公司 车辆中的通过外在装置的语音识别功能
CN103905520A (zh) * 2012-12-30 2014-07-02 比亚迪股份有限公司 车载终端的控制方法与系统以及云端服务器
CN105609109A (zh) * 2014-10-16 2016-05-25 通用汽车有限责任公司 混合式自动语音识别
CN107204185A (zh) * 2017-05-03 2017-09-26 深圳车盒子科技有限公司 车载语音交互方法、系统及计算机可读存储介质

Also Published As

Publication number Publication date
CN109671424A (zh) 2019-04-23
US10269350B1 (en) 2019-04-23
DE102018125564A1 (de) 2019-04-18
US20190115014A1 (en) 2019-04-18

Similar Documents

Publication Publication Date Title
CN109785828B (zh) 基于用户语音风格的自然语言生成
CN109671424B (zh) 车辆特征的响应激活
US10083685B2 (en) Dynamically adding or removing functionality to speech recognition systems
CN106816149B (zh) 车辆自动语音识别系统的优先化内容加载
CN110232912B (zh) 语音识别仲裁逻辑
US8738368B2 (en) Speech processing responsive to a determined active communication zone in a vehicle
US10255913B2 (en) Automatic speech recognition for disfluent speech
US20160039356A1 (en) Establishing microphone zones in a vehicle
CN108447488B (zh) 增强语音识别任务完成
US20120109649A1 (en) Speech dialect classification for automatic speech recognition
US8762151B2 (en) Speech recognition for premature enunciation
US20190122661A1 (en) System and method to detect cues in conversational speech
US8744421B2 (en) Method of initiating a hands-free conference call
US9997155B2 (en) Adapting a speech system to user pronunciation
US9530414B2 (en) Speech recognition using a database and dynamic gate commands
US20160111090A1 (en) Hybridized automatic speech recognition
US20130211828A1 (en) Speech processing responsive to active noise control microphones
US10008205B2 (en) In-vehicle nametag choice using speech recognition
US20180075842A1 (en) Remote speech recognition at a vehicle
US9473094B2 (en) Automatically controlling the loudness of voice prompts
US20130211832A1 (en) Speech signal processing responsive to low noise levels
US20190147855A1 (en) Neural network for use in speech recognition arbitration
US20200156537A1 (en) Voice activated vehicle alarm
US10008201B2 (en) Streamlined navigational speech recognition
US10006777B2 (en) Recognizing address and point of interest speech received at a vehicle

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant