CN109658929A - 一种车载语音识别方法、装置及车机端 - Google Patents

一种车载语音识别方法、装置及车机端 Download PDF

Info

Publication number
CN109658929A
CN109658929A CN201811541382.3A CN201811541382A CN109658929A CN 109658929 A CN109658929 A CN 109658929A CN 201811541382 A CN201811541382 A CN 201811541382A CN 109658929 A CN109658929 A CN 109658929A
Authority
CN
China
Prior art keywords
engine
engine end
vehicle
phonetic order
sent
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201811541382.3A
Other languages
English (en)
Inventor
马东辉
谢智斌
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing CHJ Automotive Information Technology Co Ltd
Original Assignee
Beijing CHJ Automotive Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing CHJ Automotive Information Technology Co Ltd filed Critical Beijing CHJ Automotive Information Technology Co Ltd
Priority to CN201811541382.3A priority Critical patent/CN109658929A/zh
Publication of CN109658929A publication Critical patent/CN109658929A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems
    • G10L15/30Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command

Abstract

本发明公开了一种车载语音识别方法、装置及车机端,涉及语音识别技术领域,能够解决解决现有车载语音识别方法消耗资源多的问题。本发明的方法主要包括:接收语音指令;获取车机端当前联网状态;根据所述车机端当前联网状态,将所述语音指令发送给相匹配的一语音引擎进行识别。本发明实施例采用与车机端的联网状态相匹配的一语音引擎进行识别,降低了语音识别的资源消耗,缩短了语音识别的时延。

Description

一种车载语音识别方法、装置及车机端
技术领域
本发明涉及语音识别技术领域,尤其涉及一种车载语音识别方法、装置及车机端。
背景技术
随着语音识别技术快速的发展,人们在日常生活中越来越多的开始使用语音识别技术相关的产品或应用,例如智能家居、手机语音助手、车载语音助手等。
现有的车载语音助手通常包含本地和在线两类语音引擎。现有的车载语音交互方案是将语音信号同时发给本地引擎和在线引擎,若在线引擎在预设时延内返回结果,则使用在线引擎的语音识别结果;若在线引擎在预设时延内因种种原因未返回结果,则使用本地引擎的结果。
由于现有车机端的语音识别方法需要等待预设时延才能获得识别结果,且需要将语音信号同时发送给本地引擎和在线引擎,消耗资源多。
发明内容
本发明涉及一种车载语音识别方法、装置及车机端,以解决现有车载语音识别方法消耗资源多的问题。
第一方面,本发明提供了一种车载语音识别方法,包括:
接收语音指令;
获取车机端当前联网状态;
根据所述车机端当前联网状态,将所述语音指令发送给相匹配的一语音引擎进行识别。
第二方面,本发明提供了一种所述车载语音识别装置,所述车载语音识别装置包括:
接收模块,用于接收语音指令;
获取模块,用于获取车机端当前联网状态;
识别模块,用于根据所述车机端当前联网状态,将所述语音指令发送给相匹配的一语音引擎进行识别。
第三方面,本发明提供了一种车机端,包括:存储器、处理器及存储在所述存储器上并在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如第一方面所述的车载语音识别方法中的步骤。
第四方面,本发明提供了一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如第一方面所述的车载语音识别方法中的步骤。
本发明实施例,接收语音指令;获取车机端当前联网状态;根据所述车机端当前联网状态,将所述语音指令发送给相匹配的一语音引擎进行识别。由此可知,本发明实施例采用与车机端的联网状态相匹配的一语音引擎进行识别,降低了语音识别的资源消耗,缩短了语音识别的时延。
附图说明
为了更清楚地说明本申请的实施例的技术方案,下面将对本申请的实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获取其他的附图。
图1表示本发明实施例提供的一种车载语音识别方法的流程图;
图2表示本发明实施例提供的另一种车载语音识别方法的流程图;
图3表示本发明实施例提供的一种车载语音识别装置的结构图;
图4表示本发明实施例提供的另一种车载语音识别装置的结构图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参见图1,图1是本发明实施例提供的一种车载语音识别方法的流程图,如图1所示,包括以下步骤:
步骤101,接收语音指令;
具体的,用户在使用车载语音交互功能之前,可以先唤醒车载语音交互功能。用户可以通过汽车的方向盘的盘控操作唤醒车载语音交互功能,也可以通过车机端的触控屏上的触控手势例如滑动、单击或双击等唤醒车载语音交互,还可以通过特定的唤醒词例如“开启语音交互”等唤醒车载语音交互。在唤醒车载语音交互之后,用户可以进行正式的车载语音交互。采用麦克风装置接收用户的语音指令,该语音指令可以是“开启空凋”、“播放音乐”等。以上语音指令仅是示例性说明,本发明实施例对此不作具体限定。
步骤102,获取车机端当前联网状态;
可选的,所述获取车机端当前联网状态包括:
使用车载调制解调器获取所述车机端当前的联网状态。
具体的,在接收到用户的语音指令后,可以通过车载调制解调器获取所述车机端当前的联网状态。联网状态可以包括联网和未联网。除了采用车载调制解调器获取当前的联网状态外,还可以采用车载网关来获取所述车机端当前的联网状态。以上仅是示例性说明,本发明实施例对此不作具体限定。
步骤103,根据所述车机端当前联网状态,将所述语音指令发送给相匹配的一语音引擎进行识别。
具体的,在获取到车机端当前的联网状态后,根据车机端当前的联网状态,将所述语音指令发送到本地语音引擎或者在线语音引擎进行识别,进而根据识别结果执行语音指令对应的操作,例如开启车内空调、播放音乐等。
本发明实施例,接收语音指令;获取车机端当前联网状态;根据所述车机端当前联网状态,将所述语音指令发送给相匹配的一语音引擎进行识别。由此可知,本发明实施例采用与车机端的联网状态相匹配的一语音引擎进行识别,降低了语音识别的资源消耗,缩短了语音识别的时延。
请参见图2,图2是本发明实施例提供的一种车载语音识别方法的流程图,如图2所示,包括以下步骤:
步骤201,接收语音指令。
本实施例中步骤201与本发明第一实施例中的步骤101相同,在此不做赘述。
步骤202,获取车机端当前联网状态。
本实施例中步骤202与本发明第一实施例中的步骤102相同,在此不做赘述。
步骤203,若所述车机端当前处于联网状态,将所述语音指令发送至在线语音引擎进行识别。
可选的,若所述车机端当前的联网速率大于预设阈值,则所述车机端当前处于联网状态,将所述语音指令发送至在线语音引擎进行识别。
具体的,可以使用车载调制解调器获取车机端当前的联网速率。若车载调制解调器获取的车机端当前的联网速率大于预设阈值,则表明此时车机端当前处于联网状态,此时可以将所述语音指令发送至在线语音引擎进行识别,从而获得较高的语音识别率。除了使用车载调制解调器获取车机端当前的联网速率,还可以是用车载网关获取车机端当前的联网速率,进而判断车机端当前的联网状态。以上仅是示例性说明,本发明实施例对此不作具体限定。
步骤204,若所述车机端当前处于未联网状态,将所述语音指令发送至本地语音引擎进行识别。
可选的,若所述车机端当前的联网速率小于或等于预设阈值,则所述车机端当前处于未联网状态,将所述语音指令发送至本地语音引擎进行识别。
具体的,可以使用车载调制解调器获取车机端当前的联网速率。若车载调制解调器获取的车机端当前的联网速率小于等于预设阈值,则表明此时车机端当前处于未联网状态或网络状态不好,此时可以将所述语音指令发送至本地语音引擎进行识别,从而减小语音识别的时延。除了使用车载调制解调器获取车机端当前的联网速率,还可以是用车载网关获取车机端当前的联网速率,进而判断车机端当前的联网状态。以上仅是示例性说明,本发明实施例对此不作具体限定。
可选的,在所述接收语音指令的步骤之前,所述方法还包括:
设置所述车机端的联网速率的预设阈值。
具体的,在接收语音指令的步骤之前,用户可以通过车机端的显示设置车机端的联网速率的预设阈值,用于度量车机端的联网状态。,所述联网速率的预设阈值可以大于0,例如5kb/s。所述预设阈值具体数值可以由用户自行设置,本发明实施例对此不作具体限定。
本发明实施例,接收语音指令;获取车机端当前联网状态;根据所述车机端当前联网状态;若所述车机端当前处于联网状态,将所述语音指令发送至在线语音引擎进行识别;若所述车机端当前处于未联网状态,将所述语音指令发送至本地语音引擎进行识别。由此可知,本发明实施例采用与车机端的联网状态相匹配的本地语音引擎或在线语音引擎进行识别,降低了语音识别的资源消耗,缩短了语音识别的时延,并提高语音识别的准确率吧。
请参见图3,图3是本发明实施例提供的一种车载语音识别装置的结构图,如图3所示,所述车载语音识别装置300包括:
接收模块301,用于接收语音指令;
获取模块302,用于获取车机端当前联网状态;
识别模块303,用于根据所述车机端当前联网状态,将所述语音指令发送给相匹配的一语音引擎进行识别。
可选的,所述获取模块301还用于:
使用车载调制解调器获取所述车机端当前的联网状态。
可选的,所述识别模块还用于:
若所述车机端当前处于联网状态,将所述语音指令发送至在线语音引擎进行识别;
若所述车机端当前处于未联网状态,将所述语音指令发送至本地语音引擎进行识别。
可选的,所述若所述车机端当前处于联网状态,将所述语音指令发送至在线语音引擎进行识别,包括:
若所述车机端当前的联网速率大于预设阈值,则所述车机端当前处于联网状态,将所述语音指令发送至在线语音引擎进行识别;
可选的,所述若所述车机端当前处于未联网状态,将所述语音指令发送至本地语音引擎进行识别,包括:
若所述车机端当前的联网速率小于或等于预设阈值,则所述车机端当前处于未联网状态,将所述语音指令发送至本地语音引擎进行识别。
图4是本发明实施例提供的另一种车载语音识别装置的结构图,如图4所示,所述车载语音识别装置300还包括:
设置模块304,用于设置所述车机端的联网速率的预设阈值。
本发明实施例,接收语音指令;获取车机端当前联网状态;根据所述车机端当前联网状态,将所述语音指令发送给相匹配的一语音引擎进行识别。由此可知,本发明实施例采用与车机端的联网状态相匹配的一语音引擎进行识别,降低了语音识别的资源消耗,缩短了语音识别的时延。
进一步的,本发明还提供了一种车机端,其特征在于,包括:存储器、处理器及存储在所述存储器上并在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上述的车载语音识别方法实施例中的步骤。
进一步的,本发明还提供了一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如车载语音识别方法实施例中的步骤。
本发明实施例还提供一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,该计算机程序被处理器执行时实现车载语音识别方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。其中,所述的计算机可读存储介质,如只读存储器(Read-Only Memory,简称ROM)、随机存取存储器(Random Access Memory,简称RAM)、磁碟或者光盘等。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法。
上面结合附图对本发明的实施例进行了描述,但是本发明并不局限于上述的具体实施方式,上述的具体实施方式仅仅是示意性的,而不是限制性的,本领域的普通技术人员在本发明的启示下,在不脱离本发明宗旨和权利要求所保护的范围情况下,还可做出很多形式,均属于本发明的保护之内。

Claims (12)

1.一种车载语音识别方法,其特征在于,所述方法包括:
接收语音指令;
获取车机端当前联网状态;
根据所述车机端当前联网状态,将所述语音指令发送给相匹配的一语音引擎进行识别。
2.根据权利要求1所述的车载语音识别方法,其特征在于,所述获取车机端当前联网状态包括:
使用车载调制解调器获取所述车机端当前的联网状态。
3.根据权利要求1所述的车载语音识别方法,其特征在于,所述根据所述车机端当前联网状态,将所述语音指令发送给相匹配的一语音引擎进行识别,包括:
若所述车机端当前处于联网状态,将所述语音指令发送至在线语音引擎进行识别;
若所述车机端当前处于未联网状态,将所述语音指令发送至本地语音引擎进行识别。
4.根据权利要求3所述的车载语音识别方法,其特征在于,所述若所述车机端当前处于联网状态,将所述语音指令发送至在线语音引擎进行识别,包括:
若所述车机端当前的联网速率大于预设阈值,则所述车机端当前处于联网状态,将所述语音指令发送至在线语音引擎进行识别;
所述若所述车机端当前处于未联网状态,将所述语音指令发送至本地语音引擎进行识别,包括:
若所述车机端当前的联网速率小于或等于预设阈值,则所述车机端当前处于未联网状态,将所述语音指令发送至本地语音引擎进行识别。
5.根据权利要求1所述的车载语音识别方法,其特征在于,在所述接收语音指令的步骤之前,所述方法还包括:
设置所述车机端的联网速率的预设阈值。
6.一种车载语音识别装置,其特征在于,所述车载语音识别装置包括:
接收模块,用于接收语音指令;
获取模块,用于获取车机端当前联网状态;
识别模块,用于根据所述车机端当前联网状态,将所述语音指令发送给相匹配的一语音引擎进行识别。
7.根据权利要求6所述的车载语音识别装置,其特征在于,所述获取模块还用于:
使用车载调制解调器获取所述车机端当前的联网状态。
8.根据权利要求6所述的车载语音识别装置,其特征在于,所述识别模块还用于:
若所述车机端当前处于联网状态,将所述语音指令发送至在线语音引擎进行识别;
若所述车机端当前处于未联网状态,将所述语音指令发送至本地语音引擎进行识别。
9.根据权利要求8所述的车载语音识别装置,其特征在于,所述若所述车机端当前处于联网状态,将所述语音指令发送至在线语音引擎进行识别,包括:
若所述车机端当前的联网速率大于预设阈值,则所述车机端当前处于联网状态,将所述语音指令发送至在线语音引擎进行识别;
所述若所述车机端当前处于未联网状态,将所述语音指令发送至本地语音引擎进行识别,包括:
若所述车机端当前的联网速率小于或等于预设阈值,则所述车机端当前处于未联网状态,将所述语音指令发送至本地语音引擎进行识别。
10.根据权利要求6所述的车载语音识别装置,其特征在于,所述车载语音识别装置还包括:
设置模块,用于设置所述车机端的联网速率的预设阈值。
11.一种车机端,其特征在于,包括:存储器、处理器及存储在所述存储器上并在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如权利要求1-5中任一项所述的车载语音识别方法中的步骤。
12.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要1-5中任一项所述的车载语音识别方法中的步骤。
CN201811541382.3A 2018-12-17 2018-12-17 一种车载语音识别方法、装置及车机端 Pending CN109658929A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811541382.3A CN109658929A (zh) 2018-12-17 2018-12-17 一种车载语音识别方法、装置及车机端

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811541382.3A CN109658929A (zh) 2018-12-17 2018-12-17 一种车载语音识别方法、装置及车机端

Publications (1)

Publication Number Publication Date
CN109658929A true CN109658929A (zh) 2019-04-19

Family

ID=66114729

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811541382.3A Pending CN109658929A (zh) 2018-12-17 2018-12-17 一种车载语音识别方法、装置及车机端

Country Status (1)

Country Link
CN (1) CN109658929A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111627435A (zh) * 2020-04-30 2020-09-04 长城汽车股份有限公司 语音识别方法与系统及基于语音指令的控制方法与系统

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103730119A (zh) * 2013-12-18 2014-04-16 惠州市车仆电子科技有限公司 车载人机语音交互系统
CN203607093U (zh) * 2013-10-24 2014-05-21 惠州市凯越电子有限公司 一种基于云加端的车载人机语音交互系统
CN104469838A (zh) * 2014-11-21 2015-03-25 黄荣丰 一种移动终端的网络检测系统及方法
CN105118508A (zh) * 2015-09-14 2015-12-02 百度在线网络技术(北京)有限公司 语音识别方法和装置
CN105261366A (zh) * 2015-08-31 2016-01-20 努比亚技术有限公司 语音识别方法、语音引擎及终端
CN107170450A (zh) * 2017-06-14 2017-09-15 上海木爷机器人技术有限公司 语音识别方法及装置
CN107785019A (zh) * 2017-10-26 2018-03-09 西安Tcl软件开发有限公司 车载设备及其语音识别方法、可读存储介质
US20180354461A1 (en) * 2017-06-09 2018-12-13 Hyundai Motor Company Vehicle key, vehicle, and method for controlling key and vehicle

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN203607093U (zh) * 2013-10-24 2014-05-21 惠州市凯越电子有限公司 一种基于云加端的车载人机语音交互系统
CN103730119A (zh) * 2013-12-18 2014-04-16 惠州市车仆电子科技有限公司 车载人机语音交互系统
CN104469838A (zh) * 2014-11-21 2015-03-25 黄荣丰 一种移动终端的网络检测系统及方法
CN105261366A (zh) * 2015-08-31 2016-01-20 努比亚技术有限公司 语音识别方法、语音引擎及终端
CN105118508A (zh) * 2015-09-14 2015-12-02 百度在线网络技术(北京)有限公司 语音识别方法和装置
US20180354461A1 (en) * 2017-06-09 2018-12-13 Hyundai Motor Company Vehicle key, vehicle, and method for controlling key and vehicle
CN107170450A (zh) * 2017-06-14 2017-09-15 上海木爷机器人技术有限公司 语音识别方法及装置
CN107785019A (zh) * 2017-10-26 2018-03-09 西安Tcl软件开发有限公司 车载设备及其语音识别方法、可读存储介质

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111627435A (zh) * 2020-04-30 2020-09-04 长城汽车股份有限公司 语音识别方法与系统及基于语音指令的控制方法与系统

Similar Documents

Publication Publication Date Title
US9542938B2 (en) Scene recognition method, device and mobile terminal based on ambient sound
CN110288978B (zh) 一种语音识别模型训练方法及装置
CN103971680B (zh) 一种语音识别的方法、装置
CN109087669B (zh) 音频相似度检测方法、装置、存储介质及计算机设备
CN103065631B (zh) 一种语音识别的方法、装置
CN109637548A (zh) 基于声纹识别的语音交互方法及装置
CN107204185A (zh) 车载语音交互方法、系统及计算机可读存储介质
CN103888604A (zh) 一种终端应用模式的切换方法及终端
CN109087660A (zh) 用于回声消除的方法、装置、设备以及计算机可读存储介质
CN103489451A (zh) 移动终端的语音处理方法及移动终端
CN110232924A (zh) 车载语音管理方法、装置、车辆及存储介质
CN104144192A (zh) 语音交互方法、装置及车载通讯终端
EP4033483A2 (en) Method and apparatus for testing vehicle-mounted voice device, electronic device and storage medium
CN110428835A (zh) 一种语音设备的调节方法、装置、存储介质及语音设备
CN111081254B (zh) 一种语音识别方法和装置
DE102018128003A1 (de) Neuronales netzwerk zum anwenden bei der spracherkennungsarbitrierung
CN109545203A (zh) 语音识别方法、装置、设备和存储介质
CN108922522A (zh) 设备的控制方法、装置、存储介质及电子装置
CN111833870A (zh) 车载语音系统的唤醒方法、装置、车辆和介质
CN111722696A (zh) 用于低功耗设备的语音数据处理方法和装置
CN109979467B (zh) 人声过滤方法、装置、设备及存储介质
CN109658929A (zh) 一种车载语音识别方法、装置及车机端
CN111243604A (zh) 支持多唤醒词的说话人识别神经网络模型的训练方法、说话人识别方法及系统
CN106571133A (zh) 基于语音识别的刹车指令生成方法、装置及车载系统
CN105991825A (zh) 一种语音控制方法、装置及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20190419

RJ01 Rejection of invention patent application after publication