CN110525363A - 始终监听和主动语音辅助及车辆操作 - Google Patents

始终监听和主动语音辅助及车辆操作 Download PDF

Info

Publication number
CN110525363A
CN110525363A CN201910428175.5A CN201910428175A CN110525363A CN 110525363 A CN110525363 A CN 110525363A CN 201910428175 A CN201910428175 A CN 201910428175A CN 110525363 A CN110525363 A CN 110525363A
Authority
CN
China
Prior art keywords
vehicle
theme
situation
answer
operating parameter
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910428175.5A
Other languages
English (en)
Inventor
桑迪普·拉杰·甘地加
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ford Global Technologies LLC
Original Assignee
Ford Global Technologies LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ford Global Technologies LLC filed Critical Ford Global Technologies LLC
Publication of CN110525363A publication Critical patent/CN110525363A/zh
Pending legal-status Critical Current

Links

Classifications

    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60RVEHICLES, VEHICLE FITTINGS, OR VEHICLE PARTS, NOT OTHERWISE PROVIDED FOR
    • B60R16/00Electric or fluid circuits specially adapted for vehicles and not otherwise provided for; Arrangement of elements of electric or fluid circuits specially adapted for vehicles and not otherwise provided for
    • B60R16/02Electric or fluid circuits specially adapted for vehicles and not otherwise provided for; Arrangement of elements of electric or fluid circuits specially adapted for vehicles and not otherwise provided for electric constitutive elements
    • B60R16/037Electric or fluid circuits specially adapted for vehicles and not otherwise provided for; Arrangement of elements of electric or fluid circuits specially adapted for vehicles and not otherwise provided for electric constitutive elements for occupant comfort, e.g. for automatic adjustment of appliances according to personal settings, e.g. seats, mirrors, steering wheel
    • B60R16/0373Voice control
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/004Artificial life, i.e. computing arrangements simulating life
    • G06N3/006Artificial life, i.e. computing arrangements simulating life based on simulated virtual individual or collective life forms, e.g. social simulations or particle swarm optimisation [PSO]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/211Syntactic parsing, e.g. based on context-free grammar [CFG] or unification grammars
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/18Speech classification or search using natural language modelling
    • G10L15/1815Semantic context, e.g. disambiguation of the recognition hypotheses based on word meaning
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/04Inference or reasoning models
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems
    • G10L15/30Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/226Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/226Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics
    • G10L2015/228Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics of application context

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Human Computer Interaction (AREA)
  • Software Systems (AREA)
  • Acoustics & Sound (AREA)
  • General Health & Medical Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Computing Systems (AREA)
  • Evolutionary Computation (AREA)
  • Mathematical Physics (AREA)
  • Biophysics (AREA)
  • Molecular Biology (AREA)
  • Biomedical Technology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Medical Informatics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Mechanical Engineering (AREA)
  • User Interface Of Digital Computer (AREA)
  • Navigation (AREA)
  • Machine Translation (AREA)

Abstract

本公开提供了“始终监听和主动语音辅助及车辆操作”。一种车辆,其包括控制器,所述控制器被配置为基于所述车辆的操作参数和短语的句法选择一组主题中的一者,用于生成对嵌入在所述组内的问题的回答。所述选择响应于源自包括在前主题和后续主题的话语的输入,所述在前主题和后续主题之间具有通过所述句法仅与所述主题中的一者相关联的绰号。所述车辆可以操作界面以输出所述回答。

Description

始终监听和主动语音辅助及车辆操作
技术领域
本公开涉及通过主动且始终监听语音辅助来操作车辆。
背景技术
查询系统为调用后提出的问题提供回答。例如,“嘿,今天天气怎么样?”在调用“嘿,”之后,自然语言处理和人工方法被用来寻找问题的回答。这种节奏—其中在问题之前需要调用—可能与所需要的相比需要更多的陈述来提供回答,因为调用之前的对话会被忽略。此外,提供反向节奏支持的查询系统可能不具备区分正向节奏和反向节奏的能力。
发明内容
一种车辆,其包括控制器,所述控制器被配置为基于车辆的操作参数和短语的句法选择一组主题中的一者,用于生成对嵌入在所述组内的问题的回答。所述选择响应于源自包括在前主题和后续主题的话语的输入,所述在前主题和后续主题之间具有通过句法仅与主题中的一者相关联的绰号(moniker)。车辆可以操作界面以输出回答。
一种车辆,其包括控制器,所述控制器被配置为基于车辆的操作参数和短语的句法选择一组主题中的一者,用于生成对嵌入在所述组内的问题的回答。所述选择响应于源自包括在前主题和后续主题的话语的输入,所述在前主题和后续主题之间具有通过句法仅与主题中的一者相关联的绰号。车辆可以根据回答来操作。
一种方法包括,通过控制器,基于对主题中的一者的选择和车辆的操作参数以及句法,生成对嵌入在一组主题中的问题的回答,以及根据所述回答操作车辆。所述生成响应于源自定义一组短语的话语的输入,所述一组短语包括在前主题和后续主题,所述在前主题和后续主题之间具有通过句法仅与主题中的一者相关联的绰号。
附图说明
图1是具有信息娱乐系统和相关通信能力的车辆的示意图;
图2是车辆控制系统和外围装置的示意图;
图3A是始终监听语音系统的算法;和
图3B是用于选择情境的算法。
具体实施方式
这里描述了本公开的实施例。然而,应当理解,所公开的实施例仅仅是示例,并且其他实施例可以采用各种替代形式。附图不一定按比例绘制;一些特征可以被放大或最小化以示出特定部件的细节。因此,本文所公开的具体结构细节和功能细节不应被解释为是限制性的,而是仅仅作为教导本领域技术人员以不同方式采用本发明的代表性基础。如本领域的普通技术人员将理解,参考附图中的任一个而示出和描述的各种特征可以与一个或多个其他附图中示出的特征组合以产生未明确地示出或描述的实施例。所示的特征的组合提供用于典型应用的代表性实施例。然而,对于特定应用或实现方式,可能需要根据本公开的教导对这些特征做出各种组合和修改。
车辆乘员进行对话,讨论过去、现在和将来的事件、情况或问题。代替需要类似于“嘿,外面的温度是多少”的正向偏置调用,可以实现算法来区分正向和反向节奏。实际上,车辆查询系统可以基于正向节奏、反向节奏、车辆操作参数和/或始终监听算法的组合来提供与车辆相关的回答和解决方案。使用反向节奏的问题可能包括标签问题或标签问题短语。标签问题短语可以被隔离以识别反向节奏。标签问题短语通常将跟随需要回答服务的主题(即,反向节奏),而其他询问通常将在需要回答服务的主题之前(即,正向节奏)。口头话语可以被不断地记录和分析,以隔离主题并提供情境。当潜在问题的主题被组织起来时,所述算法等待调用,诸如,“你认为怎么样。”标签问题是与在陈述之前相反的在陈述之后的任何问题。标签问题短语可以包括被提问者的绰号。始终监听和标签问题回答服务提供了反向节奏,其中做出陈述,调用服务,然后提供回答。始终监听和标签问题回答服务提供了服务被调用的正向节奏,其中做出陈述,然后提供回答。始终监听服务还可以始终搜索每个主题的回答,使得回答可容易地用于呈现给乘员。
提供正向和反向回答服务的固有问题是对话可能包括多个可回答的主题,并且乘员期望的回答主题不是特别清楚。下面提供了一个示例对话:
Suzy说,“底特律交响乐团今晚将在底特律演出。”“你觉得怎么样?”“我敢打赌,我们有足够的燃料可以到达底特律,但它会非常冷。”(反向节奏)
Suzy说,“底特律交响乐团今晚将在底特律演出。”“嘿,我打赌我们有足够的燃料可以到达底特律,但它会非常冷。”(正向节奏)
先前的对话包括至少三个主题1)底特律交响乐团今晚在底特律演出;2)我打赌我们有足够的燃料去底特律;3)它会非常冷。可以基于句法、分类或其他方法来隔离主题。随着时间的推移,主题可能会被提炼出来,并被隔离到特定的情境中。情境可以是可能需要回答的宽泛主题类别。情境也可以呈现给车辆乘员以供选择。还可以经由机器学习来提供选择,使得根据先前选择的主题来选择主题。意味着,乘员可以选择做出的主题选择,并且然后机器学习算法将自动地更新优选情境。在基于情境选择主题之后,车辆可以通过车辆的操作或回答的显示向乘员提供回答或指示。实际上,可以使用始终监听算法来识别需要回答服务的主题,并且在通过标签问题短语进行调用之后自动地提供对主题的回答。
图1示出了包括实现始终监听回答检索算法的车辆102的示例系统100。车辆102可以包括车辆计算系统(VCS)106,车辆计算系统(VCS)106被配置为使用远程信息处理控制单元(TCU)120A通过广域网进行通信。TCU 120A可以具有被配置为通过相应的通信路径和协议进行通信的各种调制解调器122。虽然图1中示出了示例性系统100,但是如图所示的示例性部件不意在限制。实际上,系统100可以具有更多或更少的部件,并且可以使用另外的或替代的部件和/或实现方式。
车辆102可以包括各种类型的汽车、跨界多功能车(CUV)、运动型多功能车(SUV)、卡车、休闲车(RV)、船、飞机或用于运输人或货物的其他移动机械。在许多情况下,车辆102可以由内燃发动机提供动力。作为另一种可能性,车辆102可以是由内燃发动机和一个或多个电动马达两者提供动力的混合动力电动车辆(HEV),诸如串联式混合动力电动车辆(SHEV)、并联式混合动力电动车辆(PHEV)、或并联/串联式混合动力电动车辆(PSHEV)。由于车辆102的类型和配置可以变化,因此车辆102的能力可以对应地变化。作为一些其他可能性,车辆102可具有关于乘客容量、牵引能力和容量以及存储容量的不同能力。
VCS 106可以被配置成支持驾驶员的语音命令和与驾驶员携带的装置的蓝牙接口,经由各种按钮或其他控件接收用户输入,以及向驾驶员或其他车辆102乘员提供车辆状态信息。示例性VCS 106可以是由密歇根州迪尔伯恩市的福特汽车公司(FORD MOTORCOMPANY)提供的系统。
VCS 106可以进一步包括各种类型的计算设备,以支持执行本文中描述的VCS 106的功能。在示例中,VCS 106可包括被配置为执行计算机指令的一个或多个处理器以及可保存计算机可执行指令和/或数据的存储介质。计算机可读存储介质(也称为处理器可读介质或存储装置)包括参与提供可由计算机(例如,由处理器)读取的数据(例如,指令)的任何非暂时性(例如,有形)介质。大体来说,处理器将例如来自存储装置等的指令和/或数据接收到存储器中,并使用所述数据执行所述指令,从而执行包括本文所述过程中的一个或多个的一个或多个过程。计算机可执行指令可以从使用各种编程语言和/或技术创建的计算机程序编译或解译,所述编程语言和/或技术包括但不限于(单独地或组合地):Java、C、C++、C#、Fortran、Pascal、Visual Basic、Python、Java Script、Perl、PL/SQL等。
VCS 106可以被配置为与TCU 120A通信。TCU 120A可以包括能够进行分组交换或电路交换信令的多个调制解调器122。TCU 120A可以控制调制解调器122的操作,从而使用合适的通信路径。调制解调器可以被配置为通过各种通信路径进行通信。路径可以配置有电路交换130、分组交换132、134信令或其组合。分组交换通信132、134路径可以是基于互联网协议(IP)的或者使用基于分组的交换来传输信息。例如,分组交换通信可以是长期演进(LTE)通信。在某些情况下,电路交换130的通信路径可以是SIGTRAN或另一实现方式,通过IP承载电路交换信令信息。然而,基础信令信息仍然在电路交换协议下被格式化。
VCS 106还可以从人机界面(HMI)控件108接收输入,所述人机界面(HMI)控件108被配置成提供乘员与车辆102的交互。例如,VCS 106可以与一个或多个按钮或其他HMI控件108交互,所述一个或多个按钮或其他HMI控件108被配置为调用VCS 106上的功能(例如,方向盘音频按钮、按键通话按钮、仪表板控件等)。VCS 106还可驱动一个或多个显示器110或以其他方式与之进行通信,所述一个或多个显示器110被配置为例如通过视频控制器向车辆乘员提供视觉输出。在一些情况下,显示器110可以是还被配置为经由视频控制器接收用户触摸输入的触摸屏,而在其他情况下,显示器110可以仅是显示器,而没有触摸输入能力。在示例中,显示器110可以是包括在车辆102舱室的中控台区域中的主机单元显示器。在另一示例中,显示器110可以是车辆102的仪表组的屏幕。
VCS 106还可被配置为经由一个或多个车辆中网络112或车辆总线112与车辆102的其他部件进行通信。作为一些示例,车辆中网络112可包括车辆控制器局域网(CAN)、以太网网络以及面向媒体的系统传输(MOST)中的一个或多个。车辆中网络112可允许VCS 106与其他车辆102系统进行通信,所述其他车辆102系统诸如TCU 120A(其可能在某些配置中不存在)的车辆调制解调器、被配置为提供当前车辆102位置和航向信息的全球定位系统(GPS)模块120B以及被配置为与VCS 106进行协作的各种其他车辆ECU。作为一些非限制性可能性,车辆ECU可包括:动力传动系统控制模块(PCM)120C,其被配置为提供对发动机操作部件(例如,怠速控制部件、燃料递送部件、排放控制部件等)的控制和对发动机操作部件(例如,发动机诊断代码的状态)的监测;车身控制模块(BCM)120D,其被配置为管理各种功率控制功能,诸如外部照明、内部照明、无钥匙进入、远程起动和接入点状态验证(例如,车辆102的发动机盖、门和/或行李厢的关闭状态);无线电收发器模块(RCM)120E,其被配置为与密钥卡或其他本地车辆102装置进行通信;气候控制管理(CCM)120F模块,其被配置为提供对加热和冷却系统部件(例如,压缩机离合器和鼓风机风扇控制、温度传感器信息等)的控制和监测;电池控制模块(BACM)120G,其被配置为监测车辆102的电池104的荷电状态或其他参数。
在示例中,VCS 106可被配置为通过车辆总线112与TCU 120A进行通信来访问TCU120A的通信特征。作为一些示例,车辆总线112可以包括控制器局域网(CAN)总线、以太网总线或MOST总线。在其他示例中,VCS 106可以使用调制解调器122的通信服务经由服务器调制解调器152与服务器150通信。
参考图2,车辆102可以包括发动机113、起动发电机114、电池116和电负载118。控制器网络112可以通过传感器(例如,燃料水平传感器115、机油传感器117)或车辆系统控制器(例如,120A、120B、120C、120D、120E、120F、120G)连接到所有这些车辆系统。例如,控制器网络112可以控制车辆系统以提供自主控制。发动机113可以具有到起动发电机114的直接机械联动装置。起动发电机114可以电连接到电池116和电负载118。电池116可以连接到电负载118。响应于无意中听到上述对话,VCS 106可以认识到,如果车辆乘员有足够的汽油,他们希望前往底特律。VCS 106可以从车辆传感器(即,燃料水平传感器115)获取数据,以确定燃料箱中的剩余燃料。然后,VCS 106可以向交响乐团请求车辆102的当前位置的预期燃料消耗。实际上,车辆102可以监听乘员的对话,并且在请求时提供响应,而无需进一步要求重新提问问题或提供附加信息。
参考图3A至图3B,示出了算法300。算法300开始于步骤302。算法300的实现可以包括额外的或更少的步骤,并且可以以不同的顺序执行这些步骤。这些步骤也可以同时、在类似的时间或顺序地执行。在步骤304中,VCS 106或其他处理器收集口头话语。口头话语可以是可用于由车辆中或附近的乘员通过传声器或传声器阵列124捕获的话语、陈述、话语词或对话。在步骤306中,在口头话语中识别主题。可以基于任何自然语言处理算法来识别主题。可以使用语音的任何部分或其组合(例如,名词、动词)来确定主题。主题被识别为稍后与所提问的问题相关联。主题可以是句子的一部分或整个句子。主题可以由动词-名词关联或其他语法、句法或语义关联形成。
在步骤308中,VCS 106等待对绰号的识别。绰号可以是与车辆相关联的任何词语或说法(例如,制造商、型号、软件提供商、信息娱乐系统提供商、与车辆或车辆制造商相关联的品牌)。绰号可以是标签问题短语或标签问题的一部分。
在步骤324中,将情境得分与句法得分进行比较。在步骤306中,情境得分可以基于所识别主题的主题得分。意味着,可以基于各种自然语言和机器学习方法来确定给定陈述、短语或单词与特定主题和情境相关联的置信度。例如,“底特律交响乐团今晚将在底特律演出”的陈述包括两个主题。陈述中的一个主题可能是底特律交响乐团。第二个主题可能是底特律。陈述的情境可能是音乐表演活动。因为陈述与情境直接相关,所以情境置信度得分可以定性地标记为高,或者定量地标记为75以上。同样,“底特律美术馆今晚将在底特律举办一场展览”的陈述也包括两个类似的主题,这两个主题可能与音乐表演活动的情境有些关系。在这种情况下的情境得分可能明显较低,因为所述主题不是特定的音乐表演,而是与艺术表演有关。因此,情境置信度得分可以定性地标记为中等,或者定量地标记为50以上。最高情境得分可以与句法得分进行比较。
句法得分可以在句法上确定标签问题短语是否存在,以及绰号是否是标签问题短语的一部分。例如,标签问题短语可能只是尽管在陈述的最后作为标签问题短语出现-表示反向节奏-但是它也可以是正向节奏的开始。所述算法可以使用已知和未知的方法来确定绰号在句法上是在问题的开头还是结尾。如上所述,可以定性或定量地标记正在使用正向节奏还是反向节奏的置信度得分。具有最高句法得分的短语可以是“_(主题)_。你觉得怎么样,”然而得分较低的短语可能是“嘿,_(主题)_。”这是因为反向节奏几乎永远不会与主题前面的“嘿,”联系在一起,而像“你认为怎么样,”这样的短语对于主题是在短语前面还是后面留下歧义。因此,句法得分表示节奏是正向还是反向。
在步骤326和步骤328中,过滤非询问绰号话语以防止无意的请求。如果绰号不是标签问题短语(例如,反向节奏)或主动请求(例如,正向节奏)的一部分,则算法返回到步骤306。如果根据句法置信度得分高于预定阈值--或者高于相对于情境得分设置的阈值,绰号是标签问题短语的一部分,则算法前进到步骤338。如果根据句法置信度得分高于预定阈值--或者高于相对于情境得分设置的阈值,所述绰号不是标签问题短语的一部分,则算法前进到步骤328。
在步骤326中检测到标签问题短语之后,算法将基于情境从口头话语中选择已经捕获的主题,如在子算法A 310中所定义的。子算法A 310收集信息以定义情境。情境可以是主题的类别或被配置为表示车辆操作参数的类别的其他逻辑表示。如步骤312所示,子算法A 310识别口头话语中的情境。情境标识通常可以包括营养信息,而主题识别被缩窄地调整到关于糖果棒中的营养的问题。在步骤314中,情境列表(例如,营养、到目的地的距离、兴趣点、天气)可以针对车辆缩窄地调整,使得通用信息请求不可用(例如,算术回答、单词发音)。意味着,在假设存在车辆或旅行相关问题的情况下,制造商或乘员可以任选地缩窄宽泛的问题检索能力。
类似地,在步骤316中,分析车辆操作参数以提供情境。例如,车辆可以被配置为使得车辆特定的参数情境可用于问答服务。意味着,与机油寿命、燃料水平、荷电状态、气候状态、发动机温度或其他车辆参数相关联的情境可以通过步骤316中的情境可用。在步骤318中,机器算法或制造商可以选择可用于回答检索的操作参数。例如,油温可以是可用的车辆参数,但是机器学习算法可以确定不应使情境可用,因为很少提问关于发动机油温的问题。车辆参数情境可以被赋予比口头话语情境更大的权重。
在步骤320中,情境被呈现给用户。意味着,用户可以进一步选择其可能期望由回答服务回答哪些情境。可以使用HMI控件108或显示屏110呈现情境。情境可以由系统读取到乘员,并且乘员可以提供对适当的情境选择的确认。例如,车辆可以陈述“第一行:天气”。然后,乘员可以通过说“一”来口头确认第一行是正确的选择。可以呈现情境,使得首先呈现最常用的情境。情境也可以基于已经接收到的口头话语和正在讨论的情境的频率按顺序呈现。例如,如果底特律的天气是沿着道路行程讨论的主题,则天气情境可以作为主要选项呈现给用户。在步骤322中,接收用户情境选择以供在步骤338中使用。可以为情境分配权重,以改善回答服务。例如,与稀疏讨论的油温相比,频繁讨论的天气情境可能被赋予更大的权重。在所有其他条件相同的情况下,在步骤338的主题选择过程中,较重加权的情境将优先于未加权或较低加权的情境来进行主题选择。
在步骤338中,所选择的情境连同所识别的主题是已知的。然后,所述算法可以基于情境来识别要确定的主题。主题选择可以考虑应用于每个主题所驻留的情境的权重。例如,天气情境中的主题可能优先于油温情境中的主题。此外,主题的句法和语义强度可以被加权。例如,可以基于口头话语的条件来确定主题的置信度值。意味着,具有语法连贯性的短语可能属于更大加权的情境,但由于句法或语义得分而被打折扣。此外,接近标签问题短语可以用于进一步加权主题。例如,直接落在标签问题短语之前的主题可以使其得分加倍或乘以因子。意味着,如果主题紧接在标签问题短语之前并且句法和语义得分对于天气主题是低的,则可以在具有高权重的情境之上选择具有低权重的情境。
在步骤340中,将具有最高置信度得分的所选主题发送到服务器150以进行回答。服务器150通过其中的统计和机器学习算法提供最高可能的回答。任何回答服务都可以提供回答,并且回答不需要相对于车辆。在步骤342中,回答可以被发送回车辆并且被呈现给乘员。然后,在步骤344中,车辆102可以基于回答自动操作车辆或提示用户选择动作过程。例如,如果选择的主题是“我打赌我们有足够的燃料到达底特律”,车辆可以为交响乐团准备一条去底特律的路线,并自主地将汽车导航到目的地。
在步骤328中,VCS 106确定绰号是否是正向节奏的一部分。正向节奏确定可以基于情境和句法得分的比较。例如,当绰号附有称呼时(例如,“嘿,”),句法得分可能很高。如果在步骤328中绰号与正向节奏相关联,则在步骤330中,VCS 106将丢弃调用之前的所有话语,并存储调用之后的任何话语。在步骤332中,VCS 106将从所存储的口头话语确定的查询请求发送到服务器150。服务器150通过其中的统计和机器学习算法提供最高可能的回答。任何回答服务都可以提供回答,并且回答不需要相对于车辆。在步骤334中,回答可以被发送回车辆并且被呈现给乘员。然后,在步骤336中,车辆102可以基于回答自动操作车辆或提示用户选择动作过程。例如,陈述是,“嘿,我们有足够的燃料到达底特律吗”,车辆可以为交响乐团准备一条去底特律的路线,并在得到肯定的回答后自主地将汽车导航到目的地。
说明书中所使用的措词是用于描述而非限制的措词,并且应理解,可在不脱离本发明的精神和范围的情况下做出各种改变。如先前所述,各种实施例的特征可以组合以形成本发明的可能未明确描述或示出的另外的实施例。例如,可以使用始终监听算法来识别需要回答服务的主题,并自动提供对所述主题的回答,所述回答可以不基于车辆的操作参数。虽然各种实施例可能已经被描述为就一个或多个所期望特性而言相较其他实施例或现有技术实现方式来说提供优点或是优选的,但是本领域的普通技术人员将认识到,一个或多个特征或特性可以折衷以实现期望的总体系统属性,这取决于特定应用和实现方式。这些属性可以包括但不限于:成本、强度、耐久性、生命周期成本、适销性、外观、包装、尺寸、可服务性、重量、可制造性、易组装性等。因此,相对于一个或多个特性描述为不如其他实施例或现有技术实现方式理想的实施例处在本公开的范围内并且对于特定应用来说可能是希望的。
根据本发明,提供了一种车辆,其具有控制器,所述控制器被配置为响应于源自定义一组短语的口头话语的输入,所述一组短语包括在前主题和后续主题,所述在前主题和后续主题之间具有通过句法仅与所述主题中的一者相关联的绰号;基于所述车辆的操作参数和句法选择所述主题中的一者以生成对嵌入在所述组中的问题的回答;以及操作界面以输出回答。
根据一个实施例,基于在未调用回答算法时做出的陈述来生成情境。
根据一个实施例,基于情境来确定在前主题和后续主题。
根据一个实施例,比较情境中至少一个的情境得分和句法得分,以确定绰号与哪个主题相关联。
根据一个实施例,操作参数的情境和口头话语的情境是相同的。
根据一个实施例,操作参数是车辆的位置。
根据一个实施例,操作参数是剩余的机油寿命。
根据一个实施例,操作参数是车辆的燃料水平。
根据一个实施例,回答基于燃料水平的直到空的估计的距离。
根据一个实施例,控制器还被配置为基于回答操作车辆控制系统,使得燃料水平高于零,直到到达目的地。
根据一个实施例,所述绰号是车辆的制造商。
根据一个实施例,控制器还被配置为基于回答操作车辆控制系统。
根据一个实施例,车辆控制系统被操作以确保基于操作参数满足回答。
根据一个实施例,基于在未调用回答算法以确定主题时做出的陈述来生成情境。
根据一个实施例,情境由用户选择。
根据一个实施例,当识别出主题时,检索回答。
根据本发明,提供了一种车辆,其具有控制器,所述控制器被配置为响应于源自定义一组短语的口头话语的输入,所述一组短语包括在前主题和后续主题,所述在前主题和后续主题之间具有通过句法仅与所述主题中的一者相关联的绰号;基于所述车辆的操作参数和句法选择所述主题中的一者以生成对嵌入在所述组中的问题的回答;以及根据回答操作车辆。
根据一个实施例,基于在未调用回答算法时做出的陈述来生成情境。
根据一个实施例,基于情境来确定在前主题和后续主题。
根据本发明,一种方法,包括通过控制器,响应于源自定义一组短语的口头话语的输入,所述一组短语包括在前主题和后续主题,所述在前主题和后续主题之间具有通过句法仅与所述主题中的一者相关联的绰号;基于主题中的一者的选择和车辆的操作参数和句法生成对嵌入在一组主题内的问题的回答;以及根据回答操作车辆。

Claims (15)

1.一种车辆,其包括:
控制器,所述控制器被配置为响应于源自定义一组短语的口头话语的输入,所述一组短语包括在前主题和后续主题,所述在前主题和所述后续主题之间具有通过句法仅与所述主题中的一者相关联的绰号;基于所述车辆的操作参数和所述句法选择所述主题中的一者以生成对嵌入在所述组中的问题的回答;以及操作界面以输出所述回答。
2.如权利要求1所述的车辆,其中基于在未调用回答算法时做出的陈述来生成情境。
3.如权利要求2所述的车辆,其中基于所述情境来确定所述在前主题和所述后续主题。
4.如权利要求3所述的车辆,其中将所述情境中的至少一者的情境得分和句法得分进行比较,以确定所述绰号与哪个主题相关联。
5.如权利要求1所述的车辆,其中所述操作参数的情境和所述口头话语的情境是相同的。
6.如权利要求1所述的车辆,其中所述操作参数是所述车辆的位置。
7.如权利要求1所述的车辆,其中所述操作参数是剩余的机油寿命。
8.如权利要求1所述的车辆,其中所述操作参数是所述车辆的燃料水平。
9.如权利要求8所述的车辆,其中所述回答基于所述燃料水平的直到空的估计的距离。
10.如权利要求5所述的车辆,其中所述控制器还被配置为基于所述回答来操作车辆控制系统,使得所述燃料水平高于零,直到到达目的地。
11.如权利要求1所述的车辆,其中所述绰号是所述车辆的制造商。
12.如权利要求1所述的车辆,其中所述控制器还被配置为基于所述回答来操作车辆控制系统。
13.如权利要求8所述的车辆,其中所述车辆控制系统被操作以确保基于所述操作参数满足所述回答。
14.如权利要求1所述的车辆,其中基于在未调用回答算法以确定所述主题时做出的陈述来生成情境。
15.如权利要求10所述的车辆,其中所述情境由用户选择。
CN201910428175.5A 2018-05-23 2019-05-22 始终监听和主动语音辅助及车辆操作 Pending CN110525363A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US15/987,175 US11704533B2 (en) 2018-05-23 2018-05-23 Always listening and active voice assistant and vehicle operation
US15/987,175 2018-05-23

Publications (1)

Publication Number Publication Date
CN110525363A true CN110525363A (zh) 2019-12-03

Family

ID=68499564

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910428175.5A Pending CN110525363A (zh) 2018-05-23 2019-05-22 始终监听和主动语音辅助及车辆操作

Country Status (3)

Country Link
US (1) US11704533B2 (zh)
CN (1) CN110525363A (zh)
DE (1) DE102019113681A1 (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20200072020A (ko) * 2018-12-12 2020-06-22 현대자동차주식회사 음성인식시스템의 대화 안내 방법
KR20220055213A (ko) * 2020-10-26 2022-05-03 현대자동차주식회사 차량 및 그 제어 방법

Family Cites Families (43)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8583427B2 (en) * 1999-11-18 2013-11-12 Broadcom Corporation Voice and data exchange over a packet based network with voice detection
US20020010604A1 (en) * 2000-06-09 2002-01-24 David Block Automated internet based interactive travel planning and reservation system
SE0303122D0 (sv) * 2003-11-20 2003-11-20 Volvo Technology Corp Method and system for communication and/or interaction between a vehicle driver and a plurality of applications
TWI377478B (en) * 2008-10-07 2012-11-21 Mitac Int Corp Self-learning method for keyword based human machine interaction and portable navigation device using the method
US9104537B1 (en) * 2011-04-22 2015-08-11 Angel A. Penilla Methods and systems for generating setting recommendation to user accounts for registered vehicles via cloud systems and remotely applying settings
US9493130B2 (en) * 2011-04-22 2016-11-15 Angel A. Penilla Methods and systems for communicating content to connected vehicle users based detected tone/mood in voice input
US9418674B2 (en) * 2012-01-17 2016-08-16 GM Global Technology Operations LLC Method and system for using vehicle sound information to enhance audio prompting
US9798799B2 (en) * 2012-11-15 2017-10-24 Sri International Vehicle personal assistant that interprets spoken natural language input based upon vehicle context
US20140195663A1 (en) 2013-01-07 2014-07-10 Sirius Xm Connected Vehicle Services Inc. Method and System for Providing Cloud-Based Common Distribution Applications
US9396727B2 (en) * 2013-07-10 2016-07-19 GM Global Technology Operations LLC Systems and methods for spoken dialog service arbitration
CN104349291A (zh) 2013-08-09 2015-02-11 富泰华工业(深圳)有限公司 电子装置、上网系统及方法
US20150046418A1 (en) * 2013-08-09 2015-02-12 Microsoft Corporation Personalized content tagging
DE102013114763A1 (de) * 2013-10-16 2015-04-16 Semvox Gmbh Sprachsteuerungsverfahren sowie Computerprogrammprodukt und Vorrichtung zur Durchführung des Verfahrens
DE112014006542B4 (de) * 2014-03-31 2024-02-08 Mitsubishi Electric Corporation Einrichtung und Verfahren zum Verständnis von einer Benutzerintention
US9250856B2 (en) * 2014-04-21 2016-02-02 Myine Electronics, Inc. In-vehicle web presentation
WO2015184186A1 (en) * 2014-05-30 2015-12-03 Apple Inc. Multi-command single utterance input method
CN104363331A (zh) 2014-10-13 2015-02-18 惠州市德赛西威汽车电子有限公司 一种手机互联启动手机app的方法及车载多媒体设备
KR101624191B1 (ko) * 2014-12-08 2016-05-25 현대자동차주식회사 차량 및 그 제어 방법
US10366107B2 (en) * 2015-02-06 2019-07-30 International Business Machines Corporation Categorizing questions in a question answering system
US10331312B2 (en) * 2015-09-08 2019-06-25 Apple Inc. Intelligent automated assistant in a media environment
US9875583B2 (en) * 2015-10-19 2018-01-23 Toyota Motor Engineering & Manufacturing North America, Inc. Vehicle operational data acquisition responsive to vehicle occupant voice inputs
US10089989B2 (en) * 2015-12-07 2018-10-02 Semiconductor Components Industries, Llc Method and apparatus for a low power voice trigger device
US20170262537A1 (en) 2016-03-14 2017-09-14 Amazon Technologies, Inc. Audio scripts for various content
US10102844B1 (en) * 2016-03-29 2018-10-16 Amazon Technologies, Inc. Systems and methods for providing natural responses to commands
US10489393B1 (en) * 2016-03-30 2019-11-26 Amazon Technologies, Inc. Quasi-semantic question answering
US10332513B1 (en) * 2016-06-27 2019-06-25 Amazon Technologies, Inc. Voice enablement and disablement of speech processing functionality
US9728188B1 (en) * 2016-06-28 2017-08-08 Amazon Technologies, Inc. Methods and devices for ignoring similar audio being received by a system
US10360910B2 (en) * 2016-08-29 2019-07-23 Garmin Switzerland Gmbh Automatic speech recognition (ASR) utilizing GPS and sensor data
US10297254B2 (en) * 2016-10-03 2019-05-21 Google Llc Task initiation using long-tail voice commands by weighting strength of association of the tasks and their respective commands based on user feedback
US10319375B2 (en) * 2016-12-28 2019-06-11 Amazon Technologies, Inc. Audio message extraction
US10467509B2 (en) * 2017-02-14 2019-11-05 Microsoft Technology Licensing, Llc Computationally-efficient human-identifying smart assistant computer
US10789948B1 (en) * 2017-03-29 2020-09-29 Amazon Technologies, Inc. Accessory for a voice controlled device for output of supplementary content
KR102332826B1 (ko) * 2017-05-30 2021-11-30 현대자동차주식회사 차량용 음성 인식 장치, 상기 차량용 음성 인식 장치를 포함하는 차량, 차량용 음성 인식 시스템 및 상기 차량용 음성 인식 장치의 제어 방법
US10515625B1 (en) * 2017-08-31 2019-12-24 Amazon Technologies, Inc. Multi-modal natural language processing
US10847149B1 (en) * 2017-09-01 2020-11-24 Amazon Technologies, Inc. Speech-based attention span for voice user interface
US10733987B1 (en) * 2017-09-26 2020-08-04 Amazon Technologies, Inc. System and methods for providing unplayed content
US10762903B1 (en) * 2017-11-07 2020-09-01 Amazon Technologies, Inc. Conversational recovery for voice user interface
US20190146491A1 (en) * 2017-11-10 2019-05-16 GM Global Technology Operations LLC In-vehicle system to communicate with passengers
US10540970B2 (en) * 2017-12-12 2020-01-21 Amazon Technologies, Inc. Architectures and topologies for vehicle-based, voice-controlled devices
US10706846B1 (en) * 2018-01-12 2020-07-07 Amazon Technologies, Inc. Question answering for a voice user interface
US20190237067A1 (en) * 2018-01-31 2019-08-01 Toyota Motor Engineering & Manufacturing North America, Inc. Multi-channel voice recognition for a vehicle environment
US10819667B2 (en) * 2018-03-09 2020-10-27 Cisco Technology, Inc. Identification and logging of conversations using machine learning
US10978061B2 (en) * 2018-03-09 2021-04-13 International Business Machines Corporation Voice command processing without a wake word

Also Published As

Publication number Publication date
DE102019113681A1 (de) 2019-11-28
US20190362217A1 (en) 2019-11-28
US11704533B2 (en) 2023-07-18

Similar Documents

Publication Publication Date Title
CN1967188B (zh) 车辆诊断测试与报告方法
US11120650B2 (en) Method and system for sending vehicle health report
CN105365708A (zh) 驾驶人状态指示符
CN108734336A (zh) 基于云的连接能量预算管理器
CN108734980A (zh) 车辆路线控制
CN106394247A (zh) 电动车辆显示系统
CN110033380A (zh) 基于使用的保险指南系统
US11358603B2 (en) Automated vehicle profile differentiation and learning
CN110525363A (zh) 始终监听和主动语音辅助及车辆操作
US10486689B2 (en) Systems and methods for reducing exterior noise during electrified vehicle operation
US20190141756A1 (en) Multiple event-based vehicle communications
CN107781086A (zh) Sked启动
CN107872831A (zh) 优化具有多个热点的车辆的用户体验
US20200151661A1 (en) Decentralized cargo marketplace and delivery
CN108462739A (zh) 车辆电池的报告和自动充电
CN110497820A (zh) 云管理高压电池配置文件恢复
CN105025075A (zh) 采用来自移动设备的内容更新交通工具音响单元
US20190362218A1 (en) Always listening and active voice assistant and vehicle operation
CN108340880A (zh) 全球被盗车辆追踪
JP6897615B2 (ja) 車両制御装置
CN109572595A (zh) 数据采集方法、装置、设备和存储介质
CN112534499B (zh) 声音对话装置、声音对话系统以及声音对话装置的控制方法
US20190213022A1 (en) Vehicle infotainment system
US11010992B2 (en) In-vehicle surveys for diagnostic code interpretation
JP4196838B2 (ja) 車載システム

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination