CN105006229A

CN105006229A - 用于包括车辆更新的额外车辆语音识别训练的方法和设备

Info

Publication number: CN105006229A
Application number: CN201510198370.5A
Authority: CN
Inventors: 布雷特·斯托特勒迈尔
Original assignee: Ford Global Technologies LLC
Current assignee: Ford Global Technologies LLC
Priority date: 2014-04-24
Filing date: 2015-04-24
Publication date: 2015-10-28
Also published as: US20150310851A1; DE102015207177A1

Abstract

提供了一种用于包括车辆更新的额外车辆语音识别训练的方法和设备。一种系统包括处理器，其中，处理器被配置为与在额外车辆装置上运行的应用进行通信。处理器还被配置为确定额外车辆装置上是否存在新的语音识别改进数据。此外，处理器被配置为下载任何被确定为存在于额外车辆装置上的新的改进数据。另外，处理器被配置为：在与驾驶员相关联的语音识别配置文件中存储下载的数据，并在驾驶员尝试语音输入时在语音识别的过程中利用下载的数据。

Description

用于包括车辆更新的额外车辆语音识别训练的方法和设备

技术领域

示意性实施例总体上涉及一种用于包括车辆更新的额外车辆语音识别训练的方法和设备。

背景技术

车辆计算系统通常开始配备有实现了驾驶员语音识别的界面。这样的界面使驾驶员能够在驾驶时与车辆计算系统进行免持(hands-free)交互，从而使驾驶员最大程度地专注于道路。然而，如果系统无法识别驾驶员的语音，则驾驶员会试图通过车辆界面手动纠正输入到系统的输入，从而导致驾驶员分心且无法专注于道路。

语音识别一般是通过其将输入语音与语法进行比较的概率工作量(probabilistic effort)。高质量匹配成功地引起请求的服务，低质量匹配会被否决或曲解。通常，难以定制具有为特定用户定制的识别系统的新车辆，因此识别算法会被调整为平均而言提供好结果，其结果是为最大数量的初始用户提供积极体验。然而，如果用户有口音，则该处理会失败或花费大量时间来通过有限的车辆输入学习用户的语音模式。

2010/0185445号美国专利申请总体上涉及一种将由会话学习系统执行的用于用户指导的对语音命令和动作的教导和修改的机器、系统和方法。机器包括系统总线、车辆数据和控制总线、桥接模块、机器子系统、存储器和处理单元，其中，系统总线用于将从会话学习系统接收到的数据和控制信号通信到计算机系统，车辆数据和控制总线用于在机器中连接装置和传感器，桥接模块用于将车辆数据和控制总线连接到系统总线，机器子系统连接到车辆数据和控制总线且具有用于从用户接收语音命令或输入信号的各个用户界面，存储器连接到系统总线且用于存储针对新的语音命令学习到的动作命令序列，处理单元连接到系统总线且用于自动执行当新的语音命令是口语时学习到的动作命令序列。

发明内容

在第一示意性实施例中，一种系统包括处理器，其中，处理器被配置为与在额外车辆装置上运行的应用进行通信。处理器还被配置为确定额外车辆装置上是否存在新的语音识别改进数据。此外，处理器被配置为下载任何被确定为存在于额外车辆装置上的新的改进数据。另外，处理器被配置为：在与驾驶员相关联的语音识别配置文件中存储下载的数据，并在驾驶员尝试语音输入时在语音识别的过程中利用下载的数据。

在第二示意性实施例中，一种计算机实现的方法包括与在额外车辆装置上运行的应用进行通信。所述方法还包括确定额外车辆装置上是否存在新的语音识别改进数据。此外，所述方法包括下载任何被确定为存在于额外车辆装置上的新的改进数据。另外，所述方法包括：在与驾驶员相关联的语音识别配置文件中存储下载的数据，并在驾驶员尝试语音输入时在语音识别的过程中利用下载的数据。

根据本发明的一个实施例，所述方法还可包括基于额外车辆装置来识别驾驶员，其中，语音识别配置文件可与识别出的驾驶员相关联。

根据本发明的一个实施例，所述方法还可包括：接收与软件更新相关联的新的词表数据，并将所述新的词表数据上传到额外车辆装置。

根据本发明的一个实施例，所述方法还可包括：接收与新的应用相关联的新的词表数据，并将所述新的词表数据上传到额外车辆装置。

根据本发明的一个实施例，所述方法还可包括：关于通常使用的车辆输入尝试来指示额外车辆装置，并指示额外车辆装置训练与通常使用的车辆输入尝试相关的识别。

根据本发明的一个实施例，所述方法还可包括：当存储下载的数据时，更新已经存在的存储有识别数据的识别配置文件，其中，所述更新可基于下载的数据。

根据本发明的一个实施例，额外车辆装置可包括移动装置。

在第三示意性实施例中，一种非暂时性存储介质存储当由处理器执行时使处理器执行计算机实现的方法的指令，其中，所述方法包括与在额外车辆装置上运行的应用进行通信。所述方法还包括确定额外车辆装置上是否存在新的语音识别改进数据。此外，所述方法包括下载任何被确定为存在于额外车辆装置上的新的改进数据。另外，所述方法包括：在与驾驶员相关联的语音识别配置文件中存储下载的数据，并在驾驶员尝试语音输入时在语音识别的过程中利用下载的数据。

附图说明

图1示出示意性车辆计算系统；

图2示出用于连接到远程词表学习应用的示意性处理；

图3示出用于更新应用词表的示意性处理；

图4示出用于从应用加载词表的示意性处理；

图5示出用于从远程系统更新应用词表的示意性处理；

图6示出用于在额外车辆装置上训练词表的示意性处理。

具体实施方式

根据需要，在此公开本发明的详细实施例。然而，应该理解的是，所公开的实施例仅仅是本发明的示例，其中，本发明的示例可以各种可替代形式来实现。附图无需按比例绘制；可夸大或最小化一些特征以示出特定组件的细节。因此，在此公开的具体结构和功能细节将不被解释为具有限制性，而仅仅是作为用于教导本领域技术人员以多种形式实施本发明的代表性基础。

图1示出用于车辆31的基于车辆的计算系统(VCS)1的示例框式拓扑图。这种基于车辆的计算系统1的示例为由福特汽车公司制造的SYNC系统。启用基于车辆的计算系统的车辆可包含位于车辆中的可视前端界面4。如果所述界面设置有例如触敏屏幕，则用户可还能够与所述界面进行交互。在另一示意性实施例中，通过按钮按压、可听语音和语音合成来进行交互。

在图1中所示的示意性实施例1中，处理器3控制基于车辆的计算系统的至少某些部分的操作。设置在车辆内的处理器允许对命令和例程进行车载(onboard)处理。另外，处理器被连接到非永久性存储器5和永久性存储器7两者。在此示意性实施例中，非永久性存储器是随机存取存储器(RAM)，永久性存储器是硬盘驱动器(HDD)或闪存。

处理器还设置有允许用户与处理器接口互联的多个不同的输入。在此示意性实施例中，麦克风29、辅助输入25(用于输入33)、通用串行总线(USB)输入23、全球定位系统(GPS)输入24和蓝牙输入15均被提供。还提供了输入选择器51，以允许用户在各种输入之间进行切换。在对麦克风和辅助连接器两者的输入被传送到处理器之前，由转换器27对所述输入进行从模拟到数字的转换。尽管未示出，但是与VCS进行通信的众多车辆组件和辅助组件可使用车辆网络(诸如但不限于控制器局域网络(CAN)总线)向VCS(或其组件)传送数据并传送来自VCS(或其组件)的数据。

系统的输出可包括但不限于可视显示器4以及扬声器13或立体声系统输出。扬声器被连接到放大器11并通过数模转换器9从处理器3接收其信号。还可分别沿19和21所示的双向数据流进行到远程蓝牙装置(诸如个人导航装置(PND)54)或USB装置(诸如车辆导航装置60)的输出。

在一示意性实施例中，系统1使用蓝牙收发器15与用户的移动装置53(例如，蜂窝电话、智能电话、个人数字助理(PDA)或具有无线远程网络连接能力的任何其他装置)进行通信(17)。移动装置随后可用于通过例如与蜂窝塔57的通信(55)来与车辆31外部的网络61进行通信(59)。在一些实施例中，蜂窝塔57可以是WiFi接入点。

移动装置与蓝牙收发器之间的示例性通信由信号14表示。

可通过按钮52或类似的输入来指示将移动装置53与蓝牙收发器15进行配对。相应地，向中央处理器(CPU)指示：车载蓝牙收发器将与移动装置中的蓝牙收发器进行配对。

可利用例如与移动装置53关联的数据计划(data-plan)、话上数据(dataover voice)或双音多频(DTMF)音在CPU 3与网络61之间传送数据。可选地，可期望包括具有天线18的车载调制解调器63以便在CPU 3与网络61之间通过语音频带传送数据(16)。移动装置53随后可用于通过例如与蜂窝塔57的通信(55)来与车辆31外部的网络61进行通信(59)。在一些实施例中，调制解调器63可与蜂窝塔57建立通信(20)，以与网络61进行通信。作为非限制性示例，调制解调器63可以是USB蜂窝调制解调器，并且通信20可以是蜂窝通信。

在一示意性实施例中，处理器设置有包括用于与调制解调器应用软件进行通信的API的操作系统。调制解调器应用软件可访问蓝牙收发器上的嵌入式模块或固件，以完成与(诸如设置在移动装置中的)远程蓝牙收发器的无线通信。蓝牙是IEEE 802 PAN(个域网)协议的子集。IEEE 802 LAN(局域网)协议包括WiFi并与IEEE 802 PAN具有相当多的交叉功能。两者都适合于车辆内的无线通信。可在这一范围使用的另一通信方式是自由空间光通信(诸如红外数据协会(IrDA))和非标准化消费者红外(IR)协议。

在另一实施例中，移动装置53包括用于语音频带或宽带数据通信的调制解调器。在话上数据的实施例中，当移动装置的所有者可在数据正被传送的同时通过装置说话时，可实施已知为频分复用的技术。在其他时间，当所有者没有在使用装置时，数据传送可使用整个带宽(在一示例中是300Hz至3.4kHz)。尽管频分复用对于车辆与互联网之间的模拟蜂窝通信而言会是常见的并仍在被使用，但其已经很大程度上被用于数字蜂窝通信的码域多址(CDMA)、时域多址(TDMA)、空域多址(SDMA)的混合体所替代。这些都是ITU IMT-2000(3G)兼容的标准，为静止或行走的用户提供高达2mbs的数据速率，并为在移动的车辆中的用户提供高达385kbs的数据速率。3G标准现在正被IMT-Advanced(4G)所替代，其中，所述IMT-Advanced(4G)为在车辆中的用户提供100mbs并为静止的用户提供1gbs。如果用户具有与移动装置关联的数据计划，则所述数据计划可允许宽带传输并且系统可使用宽得多的带宽(加速数据传送)。在另一实施例中，移动装置53被安装至车辆31的蜂窝通信装置(未示出)所替代。在又一实施例中，ND 53可以是能够通过例如(而非限制)802.11g网络(即WiFi)或WiMax网络进行通信的无线局域网(LAN)装置。

在一实施例中，传入数据可经由话上数据或数据计划而经过移动装置，进而经过车载蓝牙收发器，并进入车辆的内部处理器3。例如，在某些临时数据的情况下，数据可被存储在HDD或其他存储介质7上，直至不再需要所述数据时为止。

可与车辆接口互联的另外的源包括：具有例如USB连接56和/或天线58的个人导航装置54、具有USB 62或其他连接的车辆导航装置60、车载GPS装置24、或具有与网络61的连接能力的远程导航系统(未示出)。USB是一类串行联网协议中的一种。IEEE 1394(火线)、EIA(电子工业协会)串行协议、IEEE 1284(Centronics端口)、S/PDIF(索尼/飞利浦数字互连格式)和USB-IF(USB开发者论坛)形成了装置-装置串行标准的骨干。多数协议可针对电通信或光通信来实施。

此外，CPU可与各种其他的辅助装置65进行通信。这些装置可通过无线连接67或有线连接69来连接。辅助装置65可包括但不限于个人媒体播放器、无线保健装置、便携式计算机等。

此外或可选地，可使用例如WiFi收发器71将CPU连接到基于车辆的无线路由器73。这可允许CPU在本地路由器73的范围中连接到远程网络。

除了由位于车辆中的车辆计算系统执行示例性处理之外，在某些实施例中，还可由与车辆计算系统通信的计算系统来执行示例性处理。这样的系统可包括但不限于：无线装置(例如但不限于移动电话)或通过无线装置连接的远程计算系统(例如但不限于服务器)。总体上，这样的系统可被称为与车辆关联的计算系统(VACS)。在某些实施例中，VACS的特定组件可根据系统的特定实施方式而执行处理的特定部分。通过示例而并非限制的方式，如果处理具有与配对的无线装置发送或者接收信息的步骤，则很可能无线装置没有在执行该处理，这是因为无线装置不会与自身进行信息的“发送和接收”。本领域的普通技术人员将理解何时不适合对给定解决方案应用特定的VACS。在所有解决方案中，预期至少位于车辆自身内的车辆计算系统(VCS)能够执行示例性处理。

在这里讨论的每个示意性实施例中，示出可由计算系统执行的处理的示例性、非限制性示例。针对每个处理，执行该处理的计算系统可能专门为了执行该处理而变得被配置为用于执行该处理的专用处理器。所有处理无需完整地执行，而应被理解为可被执行以实现本发明的元件的各种类型的处理的示例。可按照期望添加另外的步骤或从示例性处理去除步骤。

语音识别率可随时间而提高，但这一般需要收集一些训练和/或调整数据。可在信息娱乐系统中随时间收集这些数据，但输入到信息娱乐系统的典型输入是有限的。用户可能在行程期间仅与系统进行一次或两次的口头交互，或者根本不进行交互，这为更新词表提供非常有限的样本集。

用户还可在车辆中进行词表加强练习，但这不太可能是用户希望在驾驶时做的事情。在示意性实施例中，用户通过对额外车辆装置说话来进行识别改进练习，更新后的识别数据可随后从额外车辆装置下载到车辆。这种新的解决方式还使租借的车能够在用户进入车辆时利用该应用来检索更新后的识别数据，从而允许利用临时车辆来实现更令人满意的语音交互体验。

图2示出用于连接到远程词表学习应用的示意性处理。关于在该图中描述的示意性实施例，应注意的是通用处理器可为了执行一些或所有在这里示出的示例性方法而被临时实现为专用处理器。当执行提供指令的代码来执行方法的一些或全部步骤时，处理器可临时被重新定位为专用处理器，直到该方法被完成的时刻为止。在另一个示例中，在适当范围内，与预配置的处理器一致地执行的固件可使处理器充当为了执行该方法或该方法的一些合理变种而提供的专用处理器。

在示意性示例中，为了学习与一个或更多个潜在的车辆驾驶员相关联的定制的识别而提供额外车辆应用。这可以是移动装置应用，或者甚至是个人计算机应用。在示意性实施例中，描述到用于获取应用数据的移动装置的连接，但是还可从例如连接到个人计算机的网络连接获取数据。还可从个人计算机发送数据以上传到车辆。

由于多数人在他们的车辆外消耗的时间比在车辆内消耗的时间多，因此应用提供在对于驾驶员而言方便的任何时间学习识别模式的机会。学习可基于一般语音识别理论，或者，在另一示例中，学习可基于首先学习控制车辆系统和安装在车辆系统上的任何应用的特定命令的列表。随后，用户可在一般性的词表学习上花费额外时间，以在识别例如导航或免持呼叫输入方面使用。

在图2中示出的示意性实施例中，车辆连接到电话或其他移动装置(201)。当连接或用户请求时，处理可查看移动词表应用是否安装在装置上(203)。

如果应用未安装，则处理可将应用推荐给用户(205)。在至少一个示例中，在推荐应用之前，系统可等待直到用户在使用系统的过程中遇到困难为止，以免用户的语音模式与预定义的词表匹配。

如果应用被加载在装置上，则处理可查看装置上是否存在任何新的数据(207)。数据可表示例如自识别信息的下载最后一次发生以来已改变的信息(例如，用户自最后一次使用车辆以来已使用应用)。当然，如果数据下载从未发生，则所有信息都可以是新的信息。如果新的数据存在(209)，则处理可下载数据(211)并保存数据(213)，以供语音识别系统使用。

除了下载任何新的数据以外，车辆计算系统上可能存在新的词表。如果存在新的词表(215)，则处理可上传新的词表(217)。这可涉及软件模块更新或例如识别推荐的词表的安装在车辆计算系统上的新的应用。如果针对词表的训练被实现，则这种词表可以是有用的。即使一般性识别训练被利用，处理也可周期性地将样本输入与必要词表进行核对，以查看识别是否已发展到合适的水平。

图3示出用于更新应用词表的示意性处理。关于在该图中描述的示意性实施例，应注意的是通用处理器可为了执行一些或所有在这里示出的示例性方法而被临时实现为专用处理器。当执行提供指令的代码来执行方法的一些或全部步骤时，处理器可临时被重新定位为专用处理器，直到该方法被完成的时刻为止。在另一个示例中，在适当范围内，与预配置的处理器一致地执行的固件可使处理器充当为了执行该方法或该方法的一些合理变种而提供的专用处理器。

在该示意性示例中，处理接收软件更新，或者新的应用被安装在上面(301)。随着新安装/应用，处理可查看安装的更新是否包括新的词表(诸如，新的命令集)(303)。如果有任何新的词表(305)，则处理可提取词表数据(307)，并存储数据且使数据排队以在合适的时间上传(309)。

图4示出用于从应用加载词表的示意性处理。关于在该图中描述的示意性实施例，应注意的是通用处理器可为了执行一些或所有在这里示出的示例性方法而被临时实现为专用处理器。当执行提供指令的代码来执行方法的一些或全部步骤时，处理器可临时被重新定位为专用处理器，直到该方法被完成的时刻为止。在另一个示例中，在适当范围内，与预配置的处理器一致地执行的固件可使处理器充当为了执行该方法或该方法的一些合理变种而提供的专用处理器。

在该示意性示例中，车辆再次连接到移动装置(401)。使装置与驾驶员相关的信息可用于识别驾驶员，这在加载先前保存的针对该驾驶员的识别信息的过程中会是有用的。驾驶员被识别(403)，并且任何先前存储的识别数据可针对该驾驶员被加载。

如果词表/识别数据被加载(405)，则处理可在装置中查看新的数据(409)。如果不存在新的数据(411)，则处理可使用先前存储的数据(413)。然而，如果新的数据存在，则处理可从装置下载新的数据，并利用新的数据来更新存储的数据。更新后的识别数据随后可由处理使用(417)。

即使没有词表被加载，处理也可查看装置上是否存在该应用。如果存在该应用(407)，则处理加载与该应用相关联的存在于装置上的任何数据(415)。所述数据随后可被用于语音识别并被存储以供之后使用。如果装置上没有数据，或者如果应用没有被加载，则处理可指示车辆计算机使用车辆所包括的标准数据。

图5示出用于从远程系统更新应用词表的示意性处理。关于在该图中描述的示意性实施例，应注意的是通用处理器可为了执行一些或所有在这里示出的示例性方法而被临时实现为专用处理器。当执行提供指令的代码来执行方法的一些或全部步骤时，处理器可临时被重新定位为专用处理器，直到该方法被完成的时刻为止。在另一个示例中，在适当范围内，与预配置的处理器一致地执行的固件可使处理器充当为了执行该方法或该方法的一些合理变种而提供的专用处理器。

在图5中示出的示意性示例中，在额外车辆装置上运行的处理连接到远程系统(501)。远程系统可以是车辆计算机，或者该系统可以是识别对车辆的更新的远程服务器。例如，在一个示例中，对车辆进行更新或增加新应用可引起在追踪车辆的软件系统的状态的远程服务器上更新车辆配置文件。即使装置并未直接连接到车辆，所述数据也可被用于更新装置。对配置文件的更新可包括上传与软件更新相关联的任何词表。

一旦处理已连接到远程系统，则处理将查看电话上是否存在任何新的识别数据以上传到车辆/远程系统(503)。在一个实施例中，数据可被直接上传到车辆。在另一示例性示例中，即使包含应用的移动装置不存在于车辆中，数据也可被上传到可由多个不同的车辆访问的远程计算系统。例如，在用户更换移动装置，并且新的移动装置不包含该应用或者任何由于使用该应用而产生的数据的情况下，这会是有用的。

如果存在用于上传的新数据(例如，应用已被用于训练识别)，则处理可将新数据上传到远程装置(505)。如果没有新数据，则处理可接收与应用的更新相关的任何信息(507)。这可包括但不限于对词表的更新。

如果连接的远程系统上存在可用的更新(509)，则处理可从远程系统下载更新后的词表(如果存在的话)(511)，并利用新的词表来更新应用。

图6示出用于在额外车辆装置上训练词表的示意性处理。关于在该图中描述的示意性实施例，应注意的是通用处理器可为了执行一些或所有在这里示出的示例性方法而被临时实现为专用处理器。当执行提供指令的代码来执行方法的一些或全部步骤时，处理器可临时被重新定位为专用处理器，直到该方法被完成的时刻为止。在另一个示例中，在适当的范围内，与预配置的处理器一致地执行的固件可使处理器充当为了执行该方法或该方法的一些合理变种而提供的专用处理器。

在该示意性示例中，在额外车辆装置上运行的处理启动，并且训练开始(601)。用户能够指定特定训练，或者训练可基于通常使用的车辆特征而针对用户被指定。如果存在指定的训练(603)，则处理可提供与可用的训练选项或推荐相应的菜单(607)。

例如，如果用户通常使用电话服务和导航服务，则处理可推荐针对这些功能的训练。或者，用户可请求所有选项的列表，并且菜单可示出用于训练的可用选项。

一旦菜单被提供(607)，则处理可接收对训练选项的选择(609)。指定的训练随后可开始(611)。在车辆系统确定哪个训练合适的示例中，处理可跳过菜单和选择步骤，并基于通常使用的特征来呈现最合适的用户训练。在另一示例中，处理可训练“需要的”词表(即，固定的命令)直到识别率合适为止，并可随后允许一般训练。在该示例中，如果没有训练被指定，则可使用已知的识别训练技术来开始一般的识别训练(605)。

在至少一个实施例中，车辆计算机可保持对特定驾驶员已尝试的通常使用的输入尝试的记录。成功和失败可被识别并与该记录相关联，也可不被识别并不与该记录相关联。当从额外车辆装置接收到更新请求时，处理器可上传与通常使用的输入尝试相关的数据，并可指示应用训练与这些事件相关的识别，使得与通常请求的事件相关的识别被更快速地改进。

虽然以上描述了示例性实施例，但这些示例性实施例并不意在描述本发明的所有可能形式。相反地，说明书中所使用的词语是描述性词语而非限制，并且应理解的是，可在不脱离本发明的精神和范围的情况下做出各种改变。此外，可将各种实现实施例的特征进行组合以形成本发明的另外的实施例。

Claims

1.一种系统，包括：

处理器，被配置为：

与在额外车辆装置上运行的应用进行通信；

确定额外车辆装置上是否存在新的语音识别改进数据；

下载任何被确定为存在于额外车辆装置上的新的改进数据；

在与驾驶员相关联的语音识别配置文件中存储下载的数据；

当驾驶员尝试语音输入时，利用下载的数据来改进语音识别。

2.如权利要求1所述的系统，其中，处理器被配置为基于额外车辆装置来识别驾驶员，其中，语音识别配置文件与识别出的驾驶员相关联。

3.如权利要求1所述的系统，其中，处理器还被配置为：接收与软件更新相关联的新的词表数据，并将所述新的词表数据上传到额外车辆装置。

4.如权利要求1所述的系统，其中，处理器还被配置为：接收与新的应用相关联的新的词表数据，并将所述新的词表数据上传到额外车辆装置。

5.如权利要求1所述的系统，其中，处理器还被配置为：关于通常使用的车辆输入尝试来指示额外车辆装置，并指示额外车辆装置训练与通常使用的车辆输入尝试相关的识别。

6.如权利要求1所述的系统，其中，处理器被配置为：当存储下载的数据时，更新已经存在的存储有识别数据的识别配置文件，其中，所述更新基于下载的数据。

7.如权利要求1所述的系统，其中，额外车辆装置包括移动装置。