CN105957522A - 基于语音配置文件的车载信息娱乐身份识别 - Google Patents
基于语音配置文件的车载信息娱乐身份识别 Download PDFInfo
- Publication number
- CN105957522A CN105957522A CN201610133140.5A CN201610133140A CN105957522A CN 105957522 A CN105957522 A CN 105957522A CN 201610133140 A CN201610133140 A CN 201610133140A CN 105957522 A CN105957522 A CN 105957522A
- Authority
- CN
- China
- Prior art keywords
- configuration file
- mobile device
- vehicle
- voice
- voice configuration
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 claims abstract description 36
- 230000008878 coupling Effects 0.000 claims description 8
- 238000010168 coupling process Methods 0.000 claims description 8
- 238000005859 coupling reaction Methods 0.000 claims description 8
- 230000008569 process Effects 0.000 abstract description 27
- 238000004891 communication Methods 0.000 description 17
- 238000012549 training Methods 0.000 description 13
- 230000006870 function Effects 0.000 description 12
- 230000006855 networking Effects 0.000 description 9
- 238000005516 engineering process Methods 0.000 description 5
- 230000010365 information processing Effects 0.000 description 5
- 238000012545 processing Methods 0.000 description 5
- 230000009471 action Effects 0.000 description 3
- 230000036961 partial effect Effects 0.000 description 3
- 230000000712 assembly Effects 0.000 description 2
- 238000000429 assembly Methods 0.000 description 2
- 238000012544 monitoring process Methods 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 230000001360 synchronised effect Effects 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 206010042008 Stereotypy Diseases 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 230000003321 amplification Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000005352 clarification Methods 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 239000012141 concentrate Substances 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000005611 electricity Effects 0.000 description 1
- 238000005868 electrolysis reaction Methods 0.000 description 1
- 230000003203 everyday effect Effects 0.000 description 1
- 239000000446 fuel Substances 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 238000009434 installation Methods 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 238000004321 preservation Methods 0.000 description 1
- 238000005057 refrigeration Methods 0.000 description 1
- 230000005236 sound signal Effects 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
- 230000003442 weekly effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M1/00—Substation equipment, e.g. for use by subscribers
- H04M1/60—Substation equipment, e.g. for use by subscribers including speech amplifiers
- H04M1/6033—Substation equipment, e.g. for use by subscribers including speech amplifiers for providing handsfree use or a loudspeaker mode in telephone sets
- H04M1/6041—Portable telephones adapted for handsfree use
- H04M1/6075—Portable telephones adapted for handsfree use adapted for handsfree use in a vehicle
- H04M1/6083—Portable telephones adapted for handsfree use adapted for handsfree use in a vehicle by interfacing with the vehicle audio system
- H04M1/6091—Portable telephones adapted for handsfree use adapted for handsfree use in a vehicle by interfacing with the vehicle audio system including a wireless interface
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/06—Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
- G10L15/063—Training
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04B—TRANSMISSION
- H04B1/00—Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
- H04B1/38—Transceivers, i.e. devices in which transmitter and receiver form a structural unit and in which at least one part is used for functions of transmitting and receiving
- H04B1/3822—Transceivers, i.e. devices in which transmitter and receiver form a structural unit and in which at least one part is used for functions of transmitting and receiving specially adapted for use in vehicles
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M1/00—Substation equipment, e.g. for use by subscribers
- H04M1/60—Substation equipment, e.g. for use by subscribers including speech amplifiers
- H04M1/6033—Substation equipment, e.g. for use by subscribers including speech amplifiers for providing handsfree use or a loudspeaker mode in telephone sets
- H04M1/6041—Portable telephones adapted for handsfree use
- H04M1/6075—Portable telephones adapted for handsfree use adapted for handsfree use in a vehicle
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/06—Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
- G10L15/063—Training
- G10L2015/0635—Training updating or merging of old and new templates; Mean values; Weighting
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Computer Networks & Wireless Communication (AREA)
- Multimedia (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Artificial Intelligence (AREA)
- Navigation (AREA)
- Telephonic Communication Services (AREA)
Abstract
本公开涉及一种基于语音配置文件的车载信息娱乐身份识别。一种车辆的计算平台可与多个移动装置进行通信。所述计算平台可执行以下处理:识别与从用户接收到的语音输入匹配的语音配置文件,所述语音配置文件与车辆内的多个移动装置中的一个关联;使用所述语音配置文件对所述语音输入执行语音识别,以确定语音命令;在与所述语音配置文件关联的移动装置的环境中处理所述语音命令。可基于从连接到所述计算平台的移动装置中或者从连接到所述计算平台的移动装置的存储器中检索到的唯一装置标识符,从远程信息处理服务器中检索所述语音配置文件。
Description
技术领域
本公开的多个方面涉及用于在车辆内针对信息娱乐命令处理和其他功能识别语音命令的发言者的用户语音配置文件的使用。
背景技术
车辆计算平台通常配备有语音识别接口。这种接口允许驾驶员执行与车辆的免提交互,这使得驾驶员不受束缚以集中最大的注意力在道路上。如果系统不能够识别驾驶员的命令,则驾驶员可手动地通过按钮或触摸屏界面来更正对系统的输入,这可能使得驾驶员分心且不能集中注意力在道路上。
语音识别通常是概率性成果,通过该概率性成果,将输入的语音与用于匹配的语法进行比较。高质量的匹配可导致系统识别出所请求的服务,而低质量的匹配可能导致语音命令被拒绝或误解。一般而言,车辆可使用至少最初被调整(tune)为提供总体上良好的结果的识别系统,从而产生针对最大数量的新用户的积极体验。然而,如果用户有口音或不寻常的特殊习惯,则匹配质量可能会被降低。此外,由于输入到车辆的语音命令可能相对不频繁,因此对于车辆而言学习用户的语音模式可能需要大量的时间。
第2010/0185445号美国专利申请总体上涉及一种用于语音命令的用户引导式教学和修改以及将由会话式学习系统执行的动作的机器、系统和方法。所述机器包括:用于向计算系统传送从会话式学习系统接收到的数据和控制信号的系统总线、用于连接所述机器中的装置和传感器的车辆数据和控制总线、用于将车辆数据和控制总线连接到系统总线的桥接模块、具有用于从用户接收语音命令或输入信号的单独的用户界面的连接到车辆数据和控制总线的机器子系统、用于存储针对新的语音命令而学习的动作命令序列的连接到系统总线的存储器,以及用于自动执行在新语音命令被说出时学习的动作命令序列的连接到系统总线的处理单元。
发明内容
在第一说明性实施例中,一种车辆包括:计算平台,被配置为:识别与从用户接收到的语音输入匹配的语音配置文件,所述语音配置文件与车辆内的多个移动装置中的一个关联;使用所述语音配置文件对所述语音输入执行语音识别,以确定语音命令;在与所述语音配置文件关联的移动装置的环境中处理所述语音命令。
在第二说明性实施例中,一种计算机实现的方法包括:使用由车辆的计算平台识别为与车辆内的多个移动装置中的一个关联的语音配置文件来对从用户接收到的语音输入执行语音识别,以确定语音命令;在与所述语音配置文件关联的移动装置的环境中处理所述语音命令。
在第三说明性实施例中,一种包含指令的非暂时性计算机可读介质,其中,所述指令在被处理器执行时被配置为使得所述处理器:将语音输入的声音生物特征与多个语音配置文件中的每一个配置文件的语音特征进行匹配,其中,所述多个语音配置文件与连接到车辆的移动装置关联;识别哪个语音配置文件与所述语音输入的声音生物特征最匹配;使用识别的语音配置文件对所述语音输入执行语音识别,以确定语音命令;在与识别的语音配置文件关联的移动装置的环境中处理所述语音命令。
根据本发明,提供一种包含指令的非暂时性计算机可读介质,其中,所述指令在被车辆的处理器执行时被配置为使得所述处理器:将语音输入的声音生物特征与多个语音配置文件中的每一个配置文件的语音特征进行匹配,其中,所述多个语音配置文件与连接到车辆的移动装置关联;识别哪个语音配置文件与所述语音输入的声音生物特征最匹配;使用识别的语音配置文件对所述语音输入执行语音识别,以确定语音命令;在与识别的语音配置文件关联的移动装置的环境中处理所述语音命令。
根据本发明的一个实施例,所述非暂时性计算机可读介质还包含以下指令,所述指令被配置为:使得处理器基于从连接到车辆的移动装置中检索到的唯一装置标识符,从远程信息处理服务器中检索多个语音配置文件中的至少一个子集。
根据本发明的一个实施例,所述非暂时性计算机可读介质还包含以下指令,所述指令被配置为:使得处理器从连接到车辆的移动装置的存储器中检索多个语音配置文件中的至少一个子集。
根据本发明的一个实施例,所述语音配置文件包括:(i)关于用户的语音识别的音调信息;(ii)指示用户的语音特征的声音生物特征。
根据本发明的一个实施例,所述语音配置文件包括与所述语音配置文件关联的移动装置的唯一标识符。
根据本发明的一个实施例,所述移动装置的环境包括移动装置的通讯簿,所述语音命令包括对移动装置的通讯簿的条目的指引。
根据本发明的一个实施例,所述非暂时性计算机可读介质还包含以下指令,所述指令被配置为:使得处理器自动地连接到在由车辆的处理器保存的配对的装置数据中所涉及到的移动装置。
附图说明
图1示出了被配置为向车辆提供远程信息处理服务的系统的示例性示意图;
图2A示出了具有多个配对的移动装置的车辆的示例性部分;
图2B示出了被存储到远程信息处理服务器的语音配置文件的示例;
图2C示出了利用语音配置文件来识别在语音输入中的语音命令的语音接口的示例;
图3示出了用于连接和同步车辆与移动装置的示例性处理;
图4示出了用于连接和同步移动装置与远程信息处理服务器的示例性处理;
图5示出了用于使用用户的移动装置来执行语音训练的示例性处理;
图6示出了用于在识别的移动装置的环境中使用语音配置文件来执行语音命令的示例性处理。
具体实施方式
根据需要,在此公开本发明的详细实施例;然而,将要理解的是,所公开的实施例仅为本发明的示例,其中,本发明可以以各种替代形式来实现。附图无需按比例绘制;一些特征可被夸大或最小化以示出特定组件的细节。因此,在此公开的具体结构和功能细节不应被解释为具有限制性,而仅作为用于教导本领域技术人员以多种方式利用本发明的代表性基础。
一些车辆允许多个电话到车辆的配对和连接。当多个电话被连接且与电话功能相关的命令被说出时,车辆可尝试在多个电话之一的情境下处理该命令。例如,车辆可利用最近配对的电话或者根据预先建立的电话的优先级顺序识别的最高优先级电话。然而,由于命令可根据哪个电话情境被使用而被不同地解释,所以如果不正确的电话被使用,则这样的方法可能会有不期望的结果。例如,车辆内的发言者可能说出“给妈妈打电话”,但是如果该命令在另一用户装置的环境中被处理,则车辆可能会给错误的“妈妈”打电话。这一问题的不完善的解决方案可能是在多个装置被配对时针对车辆请求车辆乘员提供澄清。
在改进的语音命令系统中,车辆可被连接到多个连接的电话,其中,每个电话与语音配置文件关联。当口述命令被车辆接收到时,车辆可使用语音配置文件来识别哪个连接的电话与发言者关联。当发言者的电话被识别时,车辆可使用发言者的电话以在适当的电话的环境中处理该命令。继续进行给被命名为“妈妈”的联系人打电话的示例,已经识别发言者和相应的移动装置之后,车辆可在正确的电话的环境中处理该命令“给妈妈打电话”,并给正确的“妈妈”打电话。在此讨论了语音命令系统的进一步的多个方面。
图1示出了被配置为向车辆102提供远程信息处理服务的系统100的示例性示意图。车辆102可包括各种类型的乘员车辆,诸如,混合型多用途车辆(CUV)、运动型多用途车辆(SUV)、卡车、休旅车(RV)、船、飞机或用于运输人或货物的其他移动机器。作为一些非限制性可行方式,远程信息处理服务可包括导航、逐向导航(turn-by-turn direction)、车辆健康报告、本地商业搜索、事故报告以及免提呼叫。在示例中,系统100可包括由密歇根州的迪尔伯恩市的福特汽车公司制造的SYNC系统。应当注意的是,示出的系统100仅为示例,并且可使用更多、更少和/或不同位置的元件。
计算平台104可包括一个或更多个处理器106,所述一个或更多个处理器106连接到存储器108和计算机可读存储介质112两者并被配置为执行指令、命令或其他例程,以支持在此描述的处理。例如,计算平台104可被配置为执行车辆应用110的指令,以提供诸如导航、事故报告、卫星无线电解码和免提呼叫的功能。可使用各种类型的计算机可读存储介质112以非易失性的方式来保存这种指令和其他数据。计算机可读介质112(也被称作处理器可读介质或存储器)包括参与提供可由计算平台104的处理器106读取的指令或其他数据的任何非暂时性介质(例如,有形介质)。可从使用各种编程语言和/或技术创建的计算机程序编译或解释计算机可执行指令,所述各种编程语言和/或技术包括但不限于以下项中单独一个或它们的组合:Java、C、C++、C#、Objective C、Fortran、Pascal、Java Script、Python、Perl和PL/SQL。
计算平台104可被设置有允许车辆乘员与计算平台104进行交互的各种功能。例如,计算平台104可包括音频输入114和辅助音频输入118,音频输入114被配置为通过连接的麦克风116从车辆乘员接收说出的命令,辅助音频输入118被配置为从连接的装置接收音频信号。辅助音频输入118可以是物理连接(诸如,电线或光纤线缆的物理连接)或者无线输入(诸如,蓝牙音频连接的无线输入)。在一些示例中,音频输入114可被配置为提供音频处理能力(诸如,低电平信号的前置放大的处理能力)并将模拟输入转换成数字数据以由处理器106进行处理。
计算平台104还可向具有音频播放功能的音频模块122的输入提供一个或更多个音频输出120。在其它示例中,计算平台104可通过使用一个或更多个专用扬声器(未示出)向乘员提供音频输出。音频模块122可包括输入选择器124,输入选择器124被配置为将音频内容从所选择的音频源126提供至音频放大器128,以通过车辆扬声器130或耳机(未示出)进行播放。作为一些示例,音频源126可包括解码的调幅(AM)无线电信号或调频(FM)无线电信号、以及来自致密盘(CD)或数字多功能盘(DVD)音频播放的音频信号。音频源126还可包括从计算平台104接收的音频(诸如,由计算平台104产生的音频内容、从连接到计算平台104的通用串行总线(USB)子系统132的闪存驱动器解码的音频内容以及通过计算平台104从辅助音频输入118传送的音频内容)。
计算平台104可利用语音接口134来向计算平台104提供免提接口。语音接口134可支持根据与可用命令关联的语法对经由麦克风116接收的音频进行语音识别以及用于经由音频模块122输出的语音提示生成。语音接口134可利用使用语法的概率语音识别技术,以与输入的语音进行比对。在很多情况下,语音接口134可包括用于供语音识别功能使用的标准用户配置文件音调(tuning),以允许语音识别可被调整为提供总体上良好的结果,从而针对最大数量的初始用户产生积极的体验。在一些情况下,当音频提示已经准备好由计算平台104进行呈现并且另一音频源126被选择用于播放时,系统可被配置为暂时静音或以其他方式超驰由输入选择器124指定的音频源。
计算平台104还可从被配置为提供乘员与车辆102的交互的人机界面(HMI)控制件136接收输入。例如,计算平台104可与被配置为调用计算平台104上的功能的一个或更多个按钮或者其他HMI控制件(例如,方向盘的音频按钮、一键通按钮、仪表板控制等)进行接口连接。计算平台104还可驱动或以其他方式与一个或更多个显示器138进行通信,一个或更多个显示器138被配置为通过视频控制器140向车辆乘员提供视觉输出。在一些情况下,显示器138可以是触摸屏,触摸屏被进一步配置为经由视频控制器140接收用户触摸输入,而在其他情况下,显示器138可仅为不具备触摸输入能力的显示器。
计算平台104还可被配置为经由一个或更多个车载网络142与车辆102的其他组件进行通信。作为一些示例,车载网络142可包括车辆控制器局域网(CAN)、以太网以及面向媒体的系统传输(MOST)中的一个或更多个。车载网络142可允许计算平台104与其他车辆102系统(诸如,车载调制解调器144(其在一些配置中可能不存在)、被配置为提供当前车辆102位置和航向信息的全球定位系统(GPS)模块146以及被配置为与计算平台104协作的各种车辆电子控制单元(ECU)148)进行通信。作为一些非限制性的可行方式,车辆ECU 148可包括:动力传动系统控制模块,被配置为提供发动机运行组件(例如,怠速控制组件、燃料传送组件、排放控制组件等)的控制以及发动机运行组件的监测(例如,发动机诊断代码的状态);车身控制模块,被配置为管理各种电力控制功能,诸如,外部照明、内部照明、无钥匙进入、远程启动以及接入点状态验证(例如,车辆102的引擎盖、车门和/或行李厢的关闭状态);无线电收发器模块,被配置为与遥控钥匙或其他本地车辆102装置进行通信;气候控制管理模块,被配置为提供制热和制冷系统组件(例如,压缩机离合器和鼓风机风扇控制、温度传感器信息等)的控制和监测。
如示出的,音频模块122和HMI控制件136可通过第一车载网络142A与计算平台104进行通信,并且车载调制解调器144、GPS模块146和车辆ECU 148可通过第二车载网络142B与计算平台104进行通信。在其他示例中,计算平台104可被连接到更多或更少的车载网络142。另外或可选地,一个或更多个HMI控制件136或其他组件可经由与示出的不同的车载网络142连接到计算平台104,或者直接地连接到计算平台104而不连接到车载网络142。
计算平台104还可被配置为与车辆乘员的移动装置152进行通信。移动装置152可为任何不同类型的便携式计算装置,诸如,蜂窝电话、平板计算机、智能手表、膝上型计算机、便携式音乐播放器或能够与计算平台104进行通信的其他装置。在很多示例中,计算平台104可包括无线收发器150(例如,蓝牙模块、ZIGBEE收发器、Wi-Fi收发器、IrDA收发器、RFID收发器等),无线收发器150被配置为与移动装置152的兼容的无线收发器154进行通信。另外或可选地,计算平台104可通过有线连接与移动装置152进行通信,诸如,经由移动装置152与USB子系统132之间的USB连接与移动装置152进行通信。在一些示例中,移动装置152可以是电池供电的,而在其他情况下,移动装置152可经由有线连接从车辆102接收其电力的至少一部分。
通信网络156可向连接到通信网络156的装置提供诸如分组交换的网络服务(例如,互联网接入、VoIP通信服务)的通信服务。通信网络156的示例可包括蜂窝式电话网络。移动装置152可经由移动装置152的装置调制解调器158提供到通信网络156的网络连接能力。为了便于通过通信网络156进行通信,移动装置152可与唯一装置标识符(例如,移动装置号码(MDN)、互联网协议(IP)地址等)进行关联,以识别移动装置152通过通信网络156进行的通信。在一些情况下,计算平台104可根据保存在存储器介质112中的配对的装置数据160来识别车辆102的乘员或具有连接到计算平台104的许可的装置。例如,配对的装置数据160可指示先前与车辆102的计算平台104配对的移动装置152的唯一装置标识符,使得计算平台104可在没有用户干预的情况下自动地重新连接到在配对的装置数据160中所涉及到的移动装置152。
当支持网络连接能力的移动装置152与计算平台104配对时,移动装置152可允许计算平台104使用装置调制解调器158的网络连接能力,以通过通信网络156与远程信息处理服务器162或其他远程计算装置进行通信。在一个示例中,计算平台104可利用移动装置152的话上数据计划或数据计划在计算平台104与通信网络156之间传送信息。另外或可选地,计算平台104可利用车载调制解调器144在计算平台104与通信网络156之间传送信息,而不使用移动装置152的通信设施。
与计算平台104类似,移动装置152可包括一个或更多个处理器164,一个或更多个处理器164被配置为执行从移动装置152的存储器介质168加载到移动装置152的存储器166的移动应用的指令。在一些示例中,移动应用可被配置为经由无线收发器154与计算平台104进行通信,并且经由装置调制解调器158与远程信息处理服务器162或其他网络服务进行通信。计算平台104还可包括装置链路接口172,以便于将移动应用的功能通过语音接口134集成到可用命令的语法中。装置链路接口172还可向移动应用提供对车辆信息的访问,计算平台104经由车载网络142可获得所述车辆信息。装置链路接口172的示例可以是由密歇根州的迪尔伯恩市的福特汽车公司提供的SYNC系统的SYNC APPLINK组件。语音学习应用170可以是安装到移动装置152的移动应用的示例,并且被配置为利用装置链路接口172与计算平台104进行接口连接。
针对特定用户改进语音识别率可能需要使用指示用户的特定口音和其他声音特性的语音配置文件174。语音学习应用170可被配置为提示用户说话的词汇表176(例如,词或短语),并使用接收到的语音输入来对该用户的数据进行调整,以创建解释用户的口音和语音模式的语音配置文件174。语音配置文件174还可捕获包括有关发言者的额外信息,其中,所述有关发言者的额外信息可被用于识别发言者,诸如,关于用户的语音的音高、谐音、第一共振峰的平均频率或其他可测量的声音生物特征。语音配置文件174还可包括一个或更多个用户标识符(例如,移动装置152的唯一装置标识符等)或以其他方式与一个或更多个用户标识符进行关联。在很多情况下,语音学习应用170可被配置为可离开车辆102离线执行(即,当用户当前不在车辆内或当前没有在驾驶车辆102时执行),并且收集并保存语音配置文件174,以便当用户在车辆102中时进行使用。作为一些其他可行方式,一些实施方式可允许用户使用车辆102本身、使用车辆102内的移动装置152或者使用能够将语音配置文件174传输到移动装置152或其他车辆可访问存储器的另一计算装置(例如,台式计算机)来训练语音配置文件174。
当移动装置152连接到车辆102时,语音配置文件174的信息可经由装置链路接口172与计算平台104的语音接口134进行共享。作为一个可行方式,语音配置文件174可从移动装置152被传输到计算平台104。作为另一可行方式,用户的标识符可从移动装置152被传输到计算平台104,并且语音配置文件174可通过车辆102从远程信息处理服务器162中被检索到。语音配置文件174的共享可允许车辆102的语音接口134通过解释用户说话时的特殊性(其中,所述用户的装置与计算平台104配对),来改进车辆102的语音接口134的语音识别结果。如果语音配置文件174对于用户是不可用的,则语音接口134可默认使用标准的、通用的用户配置文件。
图2A示出了具有多个配对的移动装置152的车辆102的示例性部分200A。如示出的,车辆102包括:移动装置152-A,经由语音学习应用170-A与语音接口134共享语音配置文件174-A;移动装置152-B,经由语音学习应用170-B与语音接口134共享语音配置文件174-B;移动装置152-C,经由语音学习应用170-C与语音接口134共享语音配置文件174-C;移动装置152-D,经由语音学习应用170-D与语音接口134共享语音配置文件174-D。在示出的示例中,多个移动装置152-A至152-D(统称为152)同时与计算平台104配对。作为一个示例,这可能在共享车辆102的多个家庭成员进入行程时(同时携带着他们各自的移动装置152)发生。
每个移动装置152-A至152-D还被示出为保存各自的词汇表176-A至176-D,词汇表176-A至176-D可被各自的语音学习应用170-A至170-D用于训练各自的语音配置文件174-A至174-D。
作为语音配置文件174的存储的另一示例,图2B示出了被存储到远程信息处理服务器162的语音配置文件174的示例200B。在这样的示例中,用户的标识符(例如,MDN、IP地址、MAC地址、用户账户名等)可从移动装置152被传输到计算平台104,并且语音配置文件174可通过车辆102使用该标识符从远程信息处理服务器162中被检索到。然而,应当注意的是,在很多示例中,语音配置文件174的存储可通过移动装置152来被执行,而无需存储到远程信息处理服务器162。
在不考虑从何处检索语音配置文件174的情况下,车辆102可利用与连接的移动装置152关联的语音配置文件174来识别语音输入202的发言者。例如,语音接口134可识别语音输入202的语音特征,诸如,音高、谐音、第一共振峰的平均频率或其他可测量的声音生物特征。使用语音配置文件174的信息,语音接口134可将这些特征与语音配置文件174中的每一个的语音特征进行匹配,其中,语音配置文件174与连接到计算平台104的移动装置相关联。基于该匹配,语音接口134可识别哪个语音配置文件174与语音输入202的语音特征最匹配。如在图2C中示出的,已识别语音配置文件174之后,语音接口134可相应地识别移动装置152以用作用于执行在语音输入202中识别的语音命令204的环境。此外,已识别语音命令204之后,语音接口134可在与所识别的语音配置文件174关联的移动装置152的环境中处理语音命令204。
作为更为具体的示例,移动装置152-D的用户可说出包括语音命令204“给妈妈打电话”的语音输入202。语音接口134可相应地接收该语音输入202,并试图使用语音配置文件174-A至174-D来识别该发言者。这些语音配置文件174-A至174-D可能先前已被指示为表示当前在车辆102内的用户(例如,当移动装置152连接到计算平台104时当前在车辆102内的用户)。语音接口134可将该语音特征与由语音配置文件174指定的语音特征进行比较,并可确定发言者的语音与语音配置文件174-D最匹配。相应地,车辆102可利用由语音配置文件174-D指定的音调对语音输入202执行语音识别,识别语音命令204“给妈妈打电话”,并在与语音配置文件174-D关联的装置(即,移动装置152-D)的通讯簿的环境中处理语音命令204“给妈妈打电话”。相应地,系统100可给正确的“妈妈”的联系人打电话。因此,语音配置文件174可被用于改进语音识别质量,并且还用于消除多个候选发言者两者,以识别语音输入202的发言者。
图3示出了用于连接和同步车辆102与移动装置152的示例性处理300。在示例中,处理300可由与一个或更多个移动装置152进行通信的车辆102来执行。例如,该通信可经由无线收发器150和154或者经由计算平台104与移动装置152之间的有线连接来执行。
在操作302,车辆102连接到移动装置152。例如,这可响应于用户携带移动装置152进入车辆102而发生。计算平台104可利用配对的装置数据160来识别移动装置152是否与先前与车辆102的计算平台104配对的唯一装置标识符相关联,使得计算平台104应在无需用户干预的情况下自动地重新连接到在配对的装置数据160中所涉及到的移动装置152。
在操作304,车辆102确定语音学习应用170是否被安装到移动装置152。在示例中,当配对时,移动装置152可向车辆102提供指示移动装置152当前安装的可供车辆102使用的移动应用的信息。在另一示例中,车辆102可查询移动装置152,以确定语音学习应用170是否被安装。如果语音学习应用170被安装,则控制转到操作308。否则,控制转到操作306。
在操作306,车辆102向移动装置152推荐语音学习应用170以进行安装。该推荐还可包括向移动装置152的用户指示语音学习应用170可帮助允许车辆102更好地理解来自用户的语音输入的信息。在一些示例中,车辆可在推荐语音学习应用170之前等待直到用户遇到由语音接口134使用标准用户配置文件而引起的至少阈值数量的识别错误为止,以防用户的语音模式可接受地与标准配置文件匹配。在操作306之后,处理300结束。
在操作308,车辆102确定语音学习应用170是否具有针对所连接的移动装置152的用户的更新的语音配置文件174。在示例中,计算平台104可向移动装置152查询由移动装置152保存的语音配置文件174的唯一标识符和最新修改日期。当移动装置152包括未被缓存到车辆102(例如,未被缓存到存储器112)的新的或更新的语音配置文件174时,控制转到操作310。否则,控制转到操作312。
在操作310,车辆102从移动装置152中检索到指示的语音配置文件174。在示例中,计算平台104可请求语音配置文件174被传输到计算平台104(例如,被保存在存储器112中)。应注意的是,在其他示例中,计算平台104可检索任何可用的语音配置文件174,而不考虑日期或用户。在另一示例中,车辆102可从远程信息处理服务器162中检索语音配置文件174(例如,基于从连接的移动装置152检索到的唯一的装置标识符,从远程信息处理服务器162中检索语音配置文件174)。
在操作312,车辆102确定更新的车辆配置文件的词汇表176信息在车辆102上是否可用于上传到移动装置152。例如,可能存在驻留在计算平台104上(例如,在存储器112中)的新的词汇表176,其中,所述新的词汇表176还不在移动装置152上(例如,在存储器168中)。在示例中,该新的词汇表176可包括:与安装到计算平台104的新的或更新的软件模块或应用相关的词汇表176的词条,其中,所述新的或更新的软件模块或应用识别了推荐的词汇表176。当词汇表176特定训练通过用户与语音学习应用170进行交互来被执行时,该词汇表176对于更新用户的语音配置文件174可能是有用的。如果新的词汇表176可用于上传,则控制转到操作314,在操作314,车辆102将新的词汇表176信息上传到移动装置152。在操作314之后,或者,在操作312之后,如果没有词汇表176将要被更新,则处理300结束。
图4示出了用于连接和同步移动装置152与远程信息处理服务器162的示例性处理400。在示例中,处理400可由执行语音学习应用170的移动装置152来执行。
在操作402,移动装置152连接到语音词汇表176数据的源。在示例中,移动装置152可通过通信网络156连接到远程信息处理服务器162。例如,对车辆102的软件配置的更新可导致在追踪车辆的软件状态的远程信息处理服务器162上的车辆配置文件的更新。因此,移动装置152即使不在车辆102的连接范围内时也可利用远程信息处理服务器162进行连接。
在操作404,移动装置152确定新的应用词汇表176是否可用。例如,移动装置152可识别(或者可从连接的远程信息处理服务器162或车辆102接收识别)对车辆102的配置文件的任何更新是否可包括可能需要训练的指示的其它的词汇表176。如果新的词汇表176是可用的,则控制转到操作406以检索新的词汇表176。在操作406之后,或者,在操作404之后,如果没有新的词汇表176将要被更新,则控制转到操作408。
在操作408,移动装置152确定语音配置文件174是否应该被提供以更新远程信息处理服务器162。例如,移动装置152可向远程信息处理服务器162请求最新修改的语音配置文件174的时间戳,并且如果移动装置152正在存储多个更新的语音配置文件174,则移动装置152可确定更新远程信息处理服务器162。在其他情况下,移动装置152可一直更新远程信息处理服务器162,或者可周期性地(例如,每天、每周等)更新远程信息处理服务器162。如果移动装置152确定更新语音配置文件174,则控制转到操作410以向远程信息处理服务器162发送语音配置文件174。在操作410之后,或者,在操作408之后,如果没有语音配置文件174将要被更新,则处理400结束。
图5示出了用于使用用户的移动装置152来执行语音训练的示例性处理500。在示例中,处理500可由执行语音学习应用170的移动装置152来执行。
在操作502,移动装置152启动语音学习应用170。例如,用户可从移动装置152的显示器或其他HMI来选择语音学习应用170。
在操作504,移动装置152确定语音训练是否应该被执行。在示例中,用户可选择执行词汇表176的训练,或者该训练可基于在移动装置152上的尚未被用户用来进行训练的词汇表176来针对用户指定训练。在另一示例中,可使用针对最近使用的车辆功能(例如,电话服务、导航服务等)的词汇表176来针对用户指定训练,或者,可使用针对具有由语音接口134而引起的至少阈值数量的识别错误的车辆102的功能(例如,这种错误由车辆102来识别,并且这种错误的指示被传送到移动装置152)的词汇表176来针对用户指定训练。在又一示例中,移动装置152可选择训练所需要的、基础的或者通用的词汇表176,并且一旦基础训练被执行,则随后可允许其他的训练。
在操作506,移动装置152使用词汇表176来训练用户的语音配置文件174。例如,移动装置152可针对用户指定说出由词汇表176所指示的特定的词或短语,并且移动装置152可接收用户响应并相应地更新语音配置文件174。
在操作508,移动装置152存储语音配置文件174。在示例中,移动装置152可将语音配置文件174存储到移动装置152的存储器168。另外或可选地,移动装置152可将语音配置文件174发送到远程信息处理服务器162进行存储。在操作508之后,处理500结束。
图6示出了用于在识别的移动装置152的环境中使用语音配置文件174来执行被包括在语音输入202中的语音命令204的示例性处理。在示例中,处理600可由与被检测为存在于车辆102内的移动装置152进行通信的车辆102来执行。
在操作602,车辆102连接到车辆102内的移动装置152。在示例中,计算平台104可在无需用户干预的情况下自动地连接到在配对的装置数据106中所涉及到的移动装置152。
在操作604,车辆102识别连接的移动装置152的语音配置文件174。当移动装置152被连接到车辆102时,语音配置文件174的信息可经由装置链路接口172与计算平台104的语音接口134进行共享。作为一个可行方式,语音配置文件174可从移动装置152被传输到计算平台104。作为另一可行方式,用户的标识符可从移动装置152被传输到计算平台104,并且语音配置文件174可通过车辆102从远程信息处理服务器162中被检索到。作为另一可行方式,连接的移动装置152的一个或更多个语音配置文件174可能先前已经通过计算平台104被缓存,并且可通过依据移动装置152的标识符在计算平台104的存储器112中查询语音配置文件174而被识别为可用于基于移动装置152的出现的使用。
在操作606,车辆102接收语音输入202。在示例中,移动装置152的用户可说出语音输入202,并且计算平台104的语音接口134可接收经由麦克风116接收的口语音频的电信号。
在操作608,车辆102识别语音输入202的发言者。在示例中,语音接口134可识别语音输入202的语音特征,诸如,音高、谐音、第一共振峰的平均频率或其他可测量的声音生物特征。使用语音配置文件174的信息,语音接口134可将这些特性与语音配置文件174中的每一个的语音特征进行匹配,其中,所述语音配置文件174与连接到计算平台104的移动装置152关联。基于该匹配,语音接口134可识别哪个语音配置文件174与语音输入202的语音特征最匹配。
在操作610,车辆102识别所识别的发言者的移动装置152。例如,移动装置152可被识别为与匹配的语音配置文件174具有的相同的唯一标识符关联的装置。已经识别语音配置文件174之后,语音接口134可相应地识别移动装置152以用作用于执行语音输入202中的语音命令204的环境。
在操作612,车辆102使用识别的语音配置文件174对语音输入202执行语音识别。在示例中,语音接口134可使用根据识别的语音配置文件174的语音特征和其他信息而改变的语音识别技术来识别包括在语音输入202中的语音命令204。
在操作614,车辆102在识别的移动装置152的环境中处理语音命令204。例如,语音接口134可在识别的移动装置152的通讯簿或其他数据或设置的环境中处理语音命令204。在操作614之后,处理600结束。
虽然以上描述了示例性实施例,但这些实施例并不意在描述本发明的所有可能形式。更确切地说,说明书中所使用的词语是描述性词语而非限制性词语,并且应理解的是,可在不脱离本发明的精神和范围的情况下做出各种改变。此外,可将各种实现的实施例的特征进行组合以形成本发明的进一步的实施例。
Claims (13)
1.一种车辆,包括:
计算平台,被配置为:
识别与从用户接收到的语音输入匹配的语音配置文件,所述语音配置文件与车辆内的多个移动装置中的一个关联;
使用所述语音配置文件对所述语音输入执行语音识别,以确定语音命令;
在与所述语音配置文件关联的移动装置的环境中处理所述语音命令。
2.如权利要求1所述的车辆,其中,所述语音配置文件包括:(i)关于用户的语音识别的音调信息;(ii)指示用户的语音特征的声音生物特征。
3.如权利要求1所述的车辆,其中,所述语音配置文件包括与所述语音配置文件关联的移动装置的唯一标识符。
4.如权利要求1所述的车辆,其中,所述移动装置的环境包括移动装置的通讯簿,所述语音命令包括对移动装置的通讯簿的条目的指引。
5.如权利要求1所述的车辆,其中,所述计算平台还被配置为:
将所述语音输入的声音生物特征与语音配置文件中的每一个的语音特征进行匹配,其中,所述多个语音配置文件与连接到所述计算平台的移动装置关联;
识别哪个语音配置文件与所述语音输入的声音生物特征最匹配。
6.如权利要求5所述的车辆,其中,所述计算平台还被配置为以下操作中的至少一个:
基于从连接到所述计算平台的移动装置中检索到的唯一装置标识符,从远程信息处理服务器中检索所述语音配置文件中的至少一个子集;
从连接到所述计算平台的移动装置的存储器中检索所述语音配置文件的至少一个子集。
7.如权利要求1所述的车辆,其中,所述计算平台还被配置为:自动地连接到在由所述计算平台保存的配对的装置数据中所涉及到的移动装置。
8.一种计算机实现的方法,包括:
使用由车辆的计算平台识别为与车辆内的多个移动装置中的一个关联的语音配置文件来对从用户接收到的语音输入执行语音识别,以确定语音命令;
在与所述语音配置文件关联的移动装置的环境中处理所述语音命令。
9.如权利要求8所述的方法,其中,所述语音配置文件包括:(i)关于用户的语音识别的音调信息;(ii)指示用户的语音特征的声音生物特征。
10.如权利要求8所述的方法,其中,所述语音配置文件包括与所述语音配置文件关联的移动装置的唯一标识符。
11.如权利要求8所述的方法,其中,所述移动装置的环境包括移动装置的通讯簿,所述语音命令包括对移动装置的通讯簿的条目的指引。
12.如权利要求8所述的方法,还包括:
将语音输入的声音生物特征与语音配置文件中的每一个的语音特征进行匹配,其中,所述语音配置文件与连接到所述计算平台的移动装置关联;
识别哪个语音配置文件与所述语音输入的声音生物特征最匹配。
13.如权利要求8所述的方法,还包括:自动地连接到在由所述计算平台保存的配对的装置数据中所涉及到的移动装置。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US14/642,271 | 2015-03-09 | ||
US14/642,271 US9544412B2 (en) | 2015-03-09 | 2015-03-09 | Voice profile-based in-vehicle infotainment identity identification |
Publications (2)
Publication Number | Publication Date |
---|---|
CN105957522A true CN105957522A (zh) | 2016-09-21 |
CN105957522B CN105957522B (zh) | 2021-06-22 |
Family
ID=56801293
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610133140.5A Active CN105957522B (zh) | 2015-03-09 | 2016-03-09 | 基于语音配置文件的车载信息娱乐身份识别 |
Country Status (3)
Country | Link |
---|---|
US (1) | US9544412B2 (zh) |
CN (1) | CN105957522B (zh) |
DE (1) | DE102016104060A1 (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109166571A (zh) * | 2018-08-06 | 2019-01-08 | 广东美的厨房电器制造有限公司 | 家电设备的唤醒词训练方法、装置及家电设备 |
CN109256119A (zh) * | 2017-07-14 | 2019-01-22 | 福特全球技术公司 | 用于改进车辆语法的语音识别用户宏 |
CN110033763A (zh) * | 2017-12-21 | 2019-07-19 | 迪尔公司 | 具有语音服务的建筑机械 |
CN110211584A (zh) * | 2019-06-04 | 2019-09-06 | 广州小鹏汽车科技有限公司 | 车辆控制方法、装置、存储介质及控制终端 |
CN114128239A (zh) * | 2019-05-31 | 2022-03-01 | 苹果公司 | 互联家庭环境中的多用户设备 |
Families Citing this family (22)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6432233B2 (ja) * | 2014-09-15 | 2018-12-05 | 株式会社デンソー | 車両用機器制御装置、制御内容検索方法 |
US10453461B1 (en) * | 2015-03-17 | 2019-10-22 | Amazon Technologies, Inc. | Remote execution of secondary-device drivers |
US10655951B1 (en) | 2015-06-25 | 2020-05-19 | Amazon Technologies, Inc. | Determining relative positions of user devices |
US10365620B1 (en) | 2015-06-30 | 2019-07-30 | Amazon Technologies, Inc. | Interoperability of secondary-device hubs |
US10311862B2 (en) * | 2015-12-23 | 2019-06-04 | Rovi Guides, Inc. | Systems and methods for conversations with devices about media using interruptions and changes of subjects |
KR101858698B1 (ko) * | 2016-01-04 | 2018-05-16 | 엘지전자 주식회사 | 차량용 디스플레이 장치 및 차량 |
US11244687B2 (en) * | 2016-07-06 | 2022-02-08 | Pcms Holdings, Inc. | System and method for customizing smart home speech interfaces using personalized speech profiles |
US10547729B2 (en) | 2017-03-27 | 2020-01-28 | Samsung Electronics Co., Ltd. | Electronic device and method of executing function of electronic device |
US10911594B2 (en) | 2017-05-16 | 2021-02-02 | Google Llc | Handling calls on a shared speech-enabled device |
KR102389041B1 (ko) * | 2017-08-11 | 2022-04-21 | 엘지전자 주식회사 | 이동단말기 및 머신 러닝을 이용한 이동 단말기의 제어방법 |
US10438594B2 (en) * | 2017-09-08 | 2019-10-08 | Amazon Technologies, Inc. | Administration of privileges by speech for voice assistant system |
US20190179416A1 (en) | 2017-12-12 | 2019-06-13 | Ford Global Technologies, Llc | Interactive vehicle speech recognition and correction system |
US11170762B2 (en) | 2018-01-04 | 2021-11-09 | Google Llc | Learning offline voice commands based on usage of online voice commands |
CN111868711A (zh) * | 2018-02-06 | 2020-10-30 | 日产自动车株式会社 | 信息处理方法以及信息处理装置 |
KR20190138915A (ko) * | 2018-06-07 | 2019-12-17 | 현대자동차주식회사 | 음성 인식 장치, 이를 포함하는 차량 및 그 제어방법 |
KR102582332B1 (ko) | 2018-06-27 | 2023-09-25 | 삼성전자주식회사 | 전자 장치, 이의 모바일 장치 제어 방법 및 컴퓨터 판독가능 기록 매체 |
JP7070169B2 (ja) * | 2018-07-06 | 2022-05-18 | トヨタ自動車株式会社 | 音響システム |
DE102019122108A1 (de) * | 2019-08-16 | 2021-02-18 | Brose Fahrzeugteile Se & Co. Kommanditgesellschaft, Bamberg | Dezentrale Steuereinheit eines Kraftfahrzeugs |
FR3102287A1 (fr) * | 2019-10-17 | 2021-04-23 | Psa Automobiles Sa | Procédé et dispositif de mise en œuvre d’un assistant personnel virtuel dans un véhicule automobile avec utilisation d’un dispositif connecté |
US11908480B1 (en) * | 2020-03-23 | 2024-02-20 | Amazon Technologies, Inc. | Natural language processing using context |
US11518342B2 (en) * | 2021-01-11 | 2022-12-06 | Ford Global Technologies, Llc | Identification of vehicle operators |
US11875798B2 (en) | 2021-05-03 | 2024-01-16 | International Business Machines Corporation | Profiles for enhanced speech recognition training |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1920946A (zh) * | 2005-07-01 | 2007-02-28 | 伯斯有限公司 | 汽车接口 |
CN103118176A (zh) * | 2013-01-16 | 2013-05-22 | 广东好帮手电子科技股份有限公司 | 一种通过车载主机实现手机语音控制功能的方法及系统 |
CN103137127A (zh) * | 2011-11-30 | 2013-06-05 | 北京德信互动网络技术有限公司 | 基于声控的智能电子设备和声控方法 |
CN103458105A (zh) * | 2013-08-07 | 2013-12-18 | 广东明创软件科技有限公司 | 车载设备拨号的方法 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7107010B2 (en) * | 2003-04-16 | 2006-09-12 | Nokia Corporation | Short-range radio terminal adapted for data streaming and real time services |
DE102010028449A1 (de) | 2010-04-30 | 2011-11-03 | Bayerische Motoren Werke Aktiengesellschaft | Kraftfahrzeugfreisprecheinrichtung |
CN103038818B (zh) | 2010-06-24 | 2016-10-12 | 本田技研工业株式会社 | 在车载语音识别系统与车外语音识别系统之间的通信系统和方法 |
US8744995B1 (en) | 2012-07-30 | 2014-06-03 | Google Inc. | Alias disambiguation |
US20150277114A1 (en) * | 2014-03-27 | 2015-10-01 | Ford Global Technologies, Llc | System and method for a vehicle system using a high speed network |
-
2015
- 2015-03-09 US US14/642,271 patent/US9544412B2/en active Active
-
2016
- 2016-03-07 DE DE102016104060.6A patent/DE102016104060A1/de active Pending
- 2016-03-09 CN CN201610133140.5A patent/CN105957522B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1920946A (zh) * | 2005-07-01 | 2007-02-28 | 伯斯有限公司 | 汽车接口 |
CN103137127A (zh) * | 2011-11-30 | 2013-06-05 | 北京德信互动网络技术有限公司 | 基于声控的智能电子设备和声控方法 |
CN103118176A (zh) * | 2013-01-16 | 2013-05-22 | 广东好帮手电子科技股份有限公司 | 一种通过车载主机实现手机语音控制功能的方法及系统 |
CN103458105A (zh) * | 2013-08-07 | 2013-12-18 | 广东明创软件科技有限公司 | 车载设备拨号的方法 |
Non-Patent Citations (1)
Title |
---|
杨阳等: "声纹识别技术及其应用", 《电声技术》 * |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109256119A (zh) * | 2017-07-14 | 2019-01-22 | 福特全球技术公司 | 用于改进车辆语法的语音识别用户宏 |
CN110033763A (zh) * | 2017-12-21 | 2019-07-19 | 迪尔公司 | 具有语音服务的建筑机械 |
CN110033763B (zh) * | 2017-12-21 | 2024-05-28 | 迪尔公司 | 具有语音服务的建筑机械 |
CN109166571A (zh) * | 2018-08-06 | 2019-01-08 | 广东美的厨房电器制造有限公司 | 家电设备的唤醒词训练方法、装置及家电设备 |
CN114128239A (zh) * | 2019-05-31 | 2022-03-01 | 苹果公司 | 互联家庭环境中的多用户设备 |
CN114128239B (zh) * | 2019-05-31 | 2024-01-19 | 苹果公司 | 互联家庭环境中的多用户设备 |
CN110211584A (zh) * | 2019-06-04 | 2019-09-06 | 广州小鹏汽车科技有限公司 | 车辆控制方法、装置、存储介质及控制终端 |
Also Published As
Publication number | Publication date |
---|---|
US9544412B2 (en) | 2017-01-10 |
CN105957522B (zh) | 2021-06-22 |
DE102016104060A1 (de) | 2016-09-15 |
US20160269524A1 (en) | 2016-09-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105957522A (zh) | 基于语音配置文件的车载信息娱乐身份识别 | |
US10380992B2 (en) | Natural language generation based on user speech style | |
US10290300B2 (en) | Text rule multi-accent speech recognition with single acoustic model and automatic accent detection | |
CN103677799B (zh) | 用于车辆系统的主观命令控制的方法和设备 | |
CN101462522B (zh) | 交通工具内根据状况的语音识别 | |
US9420431B2 (en) | Vehicle telematics communication for providing hands-free wireless communication | |
CN106816149A (zh) | 车辆自动语音识别系统的优先化内容加载 | |
CN102572052B (zh) | 车辆通信模块的配置 | |
US10679620B2 (en) | Speech recognition arbitration logic | |
CN105812449A (zh) | 车辆和移动装置之间的音频同步 | |
CN102097096B (zh) | 在语音识别后处理过程中使用音调来改进识别精度 | |
CN105938338A (zh) | 车载组件用户界面 | |
CN109256119A (zh) | 用于改进车辆语法的语音识别用户宏 | |
CN107093427A (zh) | 不流畅语言的自动语音识别 | |
CN107819929A (zh) | 优选表情符号的识别和生成 | |
CN107018176A (zh) | 来自次级连接装置的对主连接装置的应用控制 | |
CN102543077A (zh) | 基于语言独立女性语音数据的男性声学模型适应 | |
CN102243870A (zh) | 语音合成中的语音调节 | |
US10269350B1 (en) | Responsive activation of a vehicle feature | |
CN109080567A (zh) | 基于声纹识别的车辆控制方法与云端服务器 | |
US8452533B2 (en) | System and method for extracting a destination from voice data originating over a communication network | |
US20190147855A1 (en) | Neural network for use in speech recognition arbitration | |
CN107071696A (zh) | 主连接装置的次级连接装置同伴应用控制 | |
US20200156537A1 (en) | Voice activated vehicle alarm | |
CN109284905A (zh) | 基于人脸识别的司机签到与认证方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |