CN107785019A - 车载设备及其语音识别方法、可读存储介质 - Google Patents
车载设备及其语音识别方法、可读存储介质 Download PDFInfo
- Publication number
- CN107785019A CN107785019A CN201711018613.8A CN201711018613A CN107785019A CN 107785019 A CN107785019 A CN 107785019A CN 201711018613 A CN201711018613 A CN 201711018613A CN 107785019 A CN107785019 A CN 107785019A
- Authority
- CN
- China
- Prior art keywords
- voice
- module
- identification
- voice signal
- controlled module
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 81
- 230000006870 function Effects 0.000 claims description 28
- 238000001514 detection method Methods 0.000 claims description 13
- 238000004590 computer program Methods 0.000 claims description 11
- 238000007781 pre-processing Methods 0.000 claims description 5
- 230000005236 sound signal Effects 0.000 claims description 3
- 238000004378 air conditioning Methods 0.000 description 14
- 238000013461 design Methods 0.000 description 6
- 238000004891 communication Methods 0.000 description 5
- 230000007246 mechanism Effects 0.000 description 5
- 230000000694 effects Effects 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 230000008901 benefit Effects 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 239000000463 material Substances 0.000 description 2
- 230000006855 networking Effects 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 230000004913 activation Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 239000000306 component Substances 0.000 description 1
- 239000008358 core component Substances 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000009977 dual effect Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000003032 molecular docking Methods 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000005192 partition Methods 0.000 description 1
- 238000011946 reduction process Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
- G10L15/30—Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Telephonic Communication Services (AREA)
Abstract
本发明公开了一种车载设备的语音识别方法,所述车载设备包括语音采集模块,所述车载设备上还存储有本地命令识别词库;所述语音识别方法包括如下步骤:获取所述语音采集模块采集到的语音信号;根据所述本地命令识别词库识别所述语音信号对应的受控模块;检测所述受控模块的当前网络连接状况;当所述受控模块的当前网络连接状况符合预设条件时,通过云端语音识别方式识别所述语音信号,并根据反馈的语音识别结果控制所述受控模块运行。本发明还公开了一种车载设备以及一种计算机可读存储介质。本发明的技术方案旨在解决语音识别效率低的弊端。
Description
技术领域
本发明涉及语音识别技术领域,尤其涉及一种车载设备的语音识别方法、应用所述车载设备的语音识别方法的车载设备,以及计算机可读存储介质。
背景技术
汽车已经成为人们生活中重要的代步工具。随着社会的快速发展,人们对汽车功能的多样化、智能化、网络化、人性化的追求也越来越强烈,车载设备无疑是实现以上功能的核心部件。车载多媒体集成了娱乐软件(收音机、电视及DVD等)、互联网、导航、蓝牙连接、接打电话、空调控制等多种功能,现有技术中,用户可以对车载设备发出语音指令,车载设备通过语音识别方式来识别该语音指令,以实现对车载设备的语音控制。
上述技术方案存在的弊端是,语音识别效率低。
发明内容
本发明的主要目的在于提供一种车载设备的语音识别方法,旨在解决语音识别效率低的弊端。
为实现上述目的,本发明提供的车载设备的语音识别方法中,所述车载设备包括语音采集模块,所述车载设备上还存储有本地命令识别词库;所述语音识别方法包括如下步骤:
获取所述语音采集模块采集到的语音信号;
根据所述本地命令识别词库识别所述语音信号对应的受控模块;
检测所述受控模块的当前网络连接状况;
当所述受控模块的当前网络连接状况符合预设条件时,通过云端语音识别方式识别所述语音信号,并根据反馈的语音识别结果控制所述受控模块运行。
优选地,所述检测所述受控模块的当前网络连接状况的步骤之前,还包括:
判断所述受控模块是否具有网络连接功能;
当所述受控模块具有网络连接功能时,执行所述检测所述受控模块的当前网络连接状况的步骤;
当所述受控模块不具有网络连接功能时,根据所述本地命令识别词库识别所述语音信号,并根据所述本地命令识别词库识别出的语音识别结果控制所述受控模块运行。
优选地,所述当所述受控模块的当前网络连接状况符合预设条件时,通过云端语音识别方式识别所述语音信号,并根据反馈的语音识别结果控制所述受控模块运行的步骤,具体包括:
当所述受控模块的当前网络连接状况符合预设条件时,根据所述本地命令识别词库识别所述语音信号,以及通过云端语音识别方式识别所述语音信号;
根据最先反馈的语音识别结果控制所述受控模块运行。
优选地,所述本地命令识别词库包括通用命令词识别库;所述通用命令词识别库存储有模块名称命令词;所述根据所述本地命令识别词库识别所述语音信号对应的受控模块的步骤,具体包括:
将所述语音信号与所述通用命令词识别库比对,以识别出所述语音信号中包含的模块名称命令词;
根据所述语音信号中包含的所述模块名称命令词确定所述语音信号对应的受控模块;
将所述受控模块切换至前台运行。
优选地,所述本地命令识别词库还包括专用命令词识别库;所述专用命令词识别库存储有指令命令词和模块名称命令词;
所述根据所述本地命令识别词库识别所述语音信号的步骤,具体包括:
将所述语音信号与所述专用命令词识别库比对,以识别所述语音信号中包含的指令命令词;
根据所述指令命令词确定所述语音识别结果。
优选地,所述语音识别方法,还包括:
判断是否获取到所述语音识别结果;
当获取到所述语音识别结果时,播报所述语音识别结果;
当未获取到所述语音识别结果时,提示语音识别失败。
优选地,所述语音识别方法,还包括:
检测语音识别功能是否启动;
当所述语音识别功能启动时,执行所述获取所述语音采集模块采集到的语音信号的步骤。
优选地,所述根据所述本地命令识别词库识别所述语音信号对应的受控模块的步骤之前,还包括:
将所述语音信号进行语音信号预处理,以消除所述语音信号中的干扰信号。
此外,为实现上述目的,本发明还提供一种车载设备,包括:存储器、处理器、以及存储在所述存储器上并可在所述处理器上运行的计算机程序;所述车载设备还包括语音采集模块,所述车载设备上还存储有本地命令识别词库;所述计算机程序被所述处理器执行时实现如上述任一项所述的语音识别方法的步骤。
此外,为实现上述目的,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如上述任一项所述的语音识别方法的步骤。
在本发明的技术方案中,所述语音识别方法通过获取所述语音采集模块采集到的语音信号,再根据所述本地命令识别词库识别所述语音信号对应的受控模块,然后检测所述受控模块的当前网络连接状况,并在所述受控模块的当前网络连接状况符合预设条件时,通过云端语音识别方式识别所述语音信号,并根据反馈的语音识别结果控制所述受控模块运行。语音识别方法在受控模块的网络连接状况符合预设条件时,能够采用云端识别方式快速地识别语音信号,因此,所述语音识别方法有利于提高语音识别的效率。
附图说明
图1为本发明车载设备的语音识别方法第一实施例的流程示意图;
图2为本发明车载设备的语音识别方法第二实施例的流程示意图;
图3为本发明车载设备的语音识别方法第三实施例的流程示意图;
图4为本发明车载设备的语音识别方法第四实施例的流程示意图;
图5为本发明车载设备的语音识别方法第五实施例的流程示意图;
图6为本发明车载设备的语音识别方法第六实施例的流程示意图;
图7为本发明车载设备的语音识别方法第七实施例的流程示意图;
图8为本发明车载设备一实施例的模块结构示意图。
本发明目的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
在后续的描述中,使用用于表示元件的诸如“模块”、“部件”或“单元”的后缀仅为了有利于本发明的说明,其本身没有特定的意义。因此,“模块”、“部件”或“单元”可以混合地使用。
请参阅图1,为实现上述目的,本发明的第一实施例中提供一种车载设备的语音识别方法,所述车载设备包括语音采集模块,所述车载设备上还存储有本地命令识别词库;所述语音识别方法包括如下步骤:
步骤S10,获取所述语音采集模块采集到的语音信号;
步骤S20,根据所述本地命令识别词库识别所述语音信号对应的受控模块;
步骤S30,检测所述受控模块的当前网络连接状况;
当所述受控模块的当前网络连接状况符合预设条件时,执行步骤S40:通过云端语音识别方式识别所述语音信号,并根据反馈的语音识别结果控制所述受控模块运行。
在本发明的技术方案中,所述语音识别方法通过获取所述语音采集模块采集到的语音信号,再根据所述本地命令识别词库识别所述语音信号对应的受控模块,然后检测所述受控模块的当前网络连接状况,并在所述受控模块的当前网络连接状况符合预设条件时,通过云端语音识别方式识别所述语音信号,并根据反馈的语音识别结果控制所述受控模块运行。语音识别方法在受控模块的网络连接状况符合预设条件时,能够采用云端识别方式快速地识别语音信号,因此,所述语音识别方法有利于提高语音识别的效率。
具体的,车载设备还可以包括主控调度模块,该主控调度模块与若干个受控模块通讯连接。主控调度模块主要用于对接外部接口,并获取当前的网络连接状况,以判断是否采用云端语音识别方式识别语音信号,以及通过语音识别结果控制对应模块。该受控模块为车载设备集成的各个功能模块,其种类在本发明中不作限制,例如,空调、蓝牙模块、收音机、导航模块、多媒体播放器、Web浏览器等。
在语音识别方法的具体应用中,用户首次发出的语音信号中一般包含受控模块名称,因此,采用本地命令识别词库可以根据语音信号识别并打开受控模块。例如,语音信号可以为“打开空调”或者“打开导航模块”,则根据该语音信号可以识别出用户当前想要控制的模块为空调或导航模块,并将空调或导航模块确定为受控模块。
步骤S30中的检测受控模块的当前网络连接状况可以为检测受控模块是否连接网络,也可以是检测受控模块的网络信号强度是否达到预设强度。本实施例中,检测受控模块的当前网络连接状况为检测受控模块是否连接网络。各个受控模块当前可能连接网络,或者未连接网络。例如,当受控模块连接网络时,可以认为车载设备当前所处环境具备网络信号,此时,可以采用云端识别方式对语音信号进行识别。
各个受控模块可能具备或者不具备网络连接功能,对于具备网络连接功能的模块,语音识别模块需要识别的控制指令词汇可能非常多,并且对具备网络功能的模块进行控制可能依赖于网络。例如,对于导航模块而言,用户可能发出“去A地”的指令,为了满足用户的导航模块需求,车载设备中可能需要存储数千个地址名称,采用本地命令识别词库从数千个地址中比对识别出A地地址,会导致识别速度缓慢,而如果采用云端语音识别方式比对识别A地的地址,则可能会有更快的比对识别速度;同时,系统还需要依靠网络查询导航模块路线。因此,当前连接网络的受控模块当前连接网络时,采用云端语音识别方式识别语音信号,有利于提高识别速度。
在网络信号正常时,通常云端识别的反馈速度快于本地识别的反馈速度,因此可以采用反馈速度更快的云端识别结果作为语音识别模块的语音识别结果。
请参阅图2,基于本发明的车载设备的语音识别方法的第一实施例,本发明的车载设备的语音识别方法的第二实施例中,所述步骤S30之前,还包括:
步骤S50,判断所述受控模块是否具有网络连接功能;
当所述受控模块具有网络连接功能时,执行所述步骤S30:检测所述受控模块的当前网络连接状况;
当所述受控模块不具有网络连接功能时,执行步骤S60:根据所述本地命令识别词库识别所述语音信号,并根据所述本地命令识别词库识别出的语音识别结果控制所述受控模块运行。
对于不具备网络连接功能的模块,语音识别模块需要识别的控制指令数量有限,因此采用本地端语音识别处理也能获得较快的识别速度。例如,用户对空调的操作比较简单,通常而言,可能只有打开/关闭空调、内循环/外循环模式、空调档位大小、空调出风口方向等基本操作,并且这些操作不受网络影响,因此可以设计成本地端语音识别控制。
对于像导航模块和媒体播放器等模块,由于其内容可能存在更新,本地端存在存储空间有限或更新不及时的弊端,同时云端服务器具有存储功能强大和更新及时等各方面优势,因此,可以对这些具有网络连接功能的模块采用云端语音识别方式。同时,可以考虑通过云端服务器下载最新或优化后的本地命令词识别库版本到本地命令识别词库,以对本地语音识别单元的本地命令词识别库进行更新。
请参阅图3,基于本发明的车载设备的语音识别方法的第一实施例或第二实施例,本发明的车载设备的语音识别方法的第三实施例中,当所述受控模块的当前网络连接状况符合预设条件时,执行步骤S40具体包括:
步骤S41:根据所述本地命令识别词库识别所述语音信号,以及通过云端语音识别方式识别所述语音信号;
步骤S42,根据最先反馈的语音识别结果控制所述受控模块运行。
当网络信号强度较好时,云端识别方式的语音识别速度可能快于本地命令识别词库的识别速度,因此可以采用反馈速度更快的云端识别方式的结果作为该语音识别模块的识别结果;当网络信号不佳时,本地命令识别词库的识别速度可能快于云端识别方式的识别速度,因此可以采用反馈速度更快的本地识别的结果作为该语音识别模块的识别结果。本实施例中,采用本地命令识别词库识别和云端语音识别方式识别这两种并行的识别方式,并且根据最先反馈的正确识别结果控制所述受控模块运行,这样能够有效提高识别效率,提升用户体验。
请参阅图4,基于本发明的车载设备的语音识别方法的第二实施例或第三实施例,本发明的车载设备的语音识别方法的第四实施例中,所述本地命令识别词库包括通用命令词识别库;所述通用命令词识别库存储有模块名称命令词;所述步骤S20,具体包括:
步骤S21,将所述语音信号与所述通用命令词识别库比对,以识别所述语音信号中包含的模块名称命令词;
步骤S22,根据所述语音信号中包含的所述模块名称命令词确定所述语音信号对应的受控模块;
步骤S23,将所述受控模块切换至前台运行。
通用命令词识别库针对所有的受控模块,其至少包括模块名称命令词,以在首次识别语音指令时能够识别出语音信号中包含的受控模块名称,从而确定受控模块,并将所述受控模块切换至前台运行。
为了进一步优化操作,提高识别效率,本地命令词识别库不仅可以包括通用命令词识别库,还可以进一步包括专用命令词识别库。专用命令词识别库仅用于在前台运行的受控模块,专用命令词识别库存储有指令命令词和模块名称命令词。指令命令词指的是包含控制指令的命令词,例如,“打开”和“关闭”等针对所有受控模块的通用指令命令词,或“播放”、“联网”等针对特殊受控模块的专用指令命令词。
进一步的,本实施例中,对于“打开”和“关闭”等通用指令命令词,既要设计在通用命令词识别库中,也要设计在专用命令词识别库中,因此,受控模块无论是在前台或者后台运行都能够有效地进行控制或切换。这样设计的目的是可以实现任意模块的切换,比如:当前是空调操控界面,我们可以随意切换到收音机、导航或其它界面。也就是说,通用命令词识别库不仅可以包含模块名称命令词,还可以包含通用指令命令词,其中,通用指令命令词至少包括用于启动功能命令词(例如,打开)和关闭功能命令词(例如,关闭)。
专用命令词识别库用于对前台正在运行的模块进行语音识别处理,比如,通过命令词“打开空调”切换到空调控制模式时,对空调的操作命令“打开”的识别是通过从对应的空调专用命令词识别库进行处理;同样,对于导航模块,只需要对地图离线数据进行训练得到命令词识别库,当导航模块在前台运行时,只需从专用命令词识别库进行处理。专用命令词识别库的设计针对性强,识别效率高,版本更新灵活。
由于通用命令词识别库中仅包含模块名称命令词,或仅包含模块名称命令词和通用指令命令词,因此,其词汇量大大小于专用命令词识别库的词库量,通过通用命令词识别库识别出受控模块,有利于提高识别效率并提高首次识别打开受控模块的效率。
请参阅图5,基于本发明的车载设备的语音识别方法的第四实施例,所述车载设备的语音识别方法的第五实施例中,所述本地命令识别词库还包括专用命令词识别库;所述专用命令词识别库存储有指令命令词和模块名称命令词;
所述根据所述本地命令识别词库识别所述语音信号的步骤,具体包括:
步骤S61,将所述语音信号与所述专用命令词识别库比对,以识别所述语音信号中包含的指令命令词;
步骤S62,根据所述指令命令词确定所述语音识别结果。
进一步地,为了提高专用命令词识别库的识别效率,可以将专用命令词识别库设计成包括各个受控模块的专用命令词的子识别库。例如,专用命令词识别库可以包括空调专用命令词子识别库、蓝牙模块专用命令词子识别库、收音机专用命令词子识别库、导航模块专用命令词子识别库、多媒体播放器专用命令词子识别库、Web浏览器专用命令词子识别库等。当通过步骤S20首次识别到受控模块并将受控模块切换至前台运行后,可以根据该受控模块确定用于识别语音信号的子识别库,将语音信号和子识别库比对以识别出控制指令,以减少词汇比对数量。
设置专用命令词识别库,是针对当前前台正在操作的模块,比如:当前是空调操作界面,其命令词识别库除了包含所有模块的打开/关闭等通用命令词外,只能包含自己专用命令词。这样设计的好处是,词库识别效率高,本地识别库可以根据需要,单独对通用命令词识别库或专用命令词识别库或者单个专用命令词子识别库进行升级。
请参阅图6,基于本发明的车载设备的语音识别方法的第一实施例至第五实施例中的任一项,所述车载设备的语音识别方法的第六实施例中,所述语音识别方法,还包括:
步骤S70,判断是否获取到所述语音识别结果;
当获取到所述语音识别结果时,执行步骤S80:播报所述语音识别结果;
当未获取到所述语音识别结果时,执行步骤S90:提示语音识别失败。
采用本地命令识别词库,云端语音识别方式,和采用本地命令识别词库和云端语音识别方式并行识别方式中的一种进行语音识别后,可以根据语音识别结果发出语音提示。该语音提示可以用于提示语音识别是否成功,也可以用于提示用户进行下一步操作。例如,当用户的语音指令为“打开多媒体播放器”,当识别出受控模块为多媒体播放器,并将“打开”指令发送到多媒体播放器以控制多媒体播放器打开后,发出的语音提示可以为,“多媒体播放器已打开,请点歌”,以提示用户进行后续的语音点歌操作。
由于用户的口音、音量以及外界环境噪音等影响,并不一定能成功识别语音信号,不能成功识别语音信号指的是识别错误(获得了错误的识别结果)或者未识别(未获得识别结果),因此,系统可以判断是否获取到所述语音识别结果。
在获取到了语音识别结果时,播报语音识别结果,可以使用户根据播报内容判断识别结果是否正确,以及是否需要重新发出语音指令。例如,用户发出的语音指令为“打开导航”,而播报的语音识别结果为“打开收音机”时,用户能察觉语音识别失败,此时,用户重新发出语音信号即可。
当未获取到所述语音识别结果时,提示语音识别失败。进一步的,还可以提示用户采用何种方式能提高语音识别成功率。
语音提示可以通过语音提示模块实现,语音提示模块与该主控调度模块通讯连接。
请参阅图7,基于本发明的车载设备的语音识别方法的第一实施例至第六实施例中的任一项,所述车载设备的语音识别方法的第七实施例中,所述语音识别方法,还包括:
步骤S100,检测语音识别功能是否启动;
当所述语音识别功能启动时,执行所述步骤S10:获取所述语音采集模块采集到的语音信号。
语音识别功能可以采用多种方式启动,例如设置手动开关或设置唤醒控制机制。设置手动开关,以通过开关控制是否进入语音识别功能,在不需要进行语音识别操作时可以关闭开关,以消除误识别隐患。本实施例中,为了突出车载设备的人性化设计及实用性,可以在车内每个座位配置麦克风阵列模组并配置独立的手动触发开关,并且,驾驶员位置设置的手动触发开关可以分别控制各个座位麦克风阵列开关状态。进一步的,驾驶员位置的手动触发开关可以设置在方向盘位置,以便于驾驶员控制。
可以默认汽车每次发动时,驾驶员位置的语音采集模块为激活状态,其它位置的语音采集模块为关闭状态。这样的设计兼顾了驾驶员和乘客的考虑,用户体验价值更高。
同时,可以考虑在软件上实现唤醒控制机制,唤醒控制机制的类型不限,例如,可以是语音唤醒或手势唤醒。本实施例中采用唤醒命令词来唤醒语音识别功能,当需要语音控制车载设备时,通过设定的唤醒命令词唤醒设备才能进行语音识别控制,否则不进行语音识别控制,这样也消除了外界噪声或说话声误识别控制安全隐患。手动开关和设置唤醒控制机制可以结合使用,以构成双保险机制。
基于本发明的车载设备的语音识别方法的第一实施例至第七实施例中的任一项,所述车载设备的语音识别方法的第八实施例中,所述步骤S20之前,还包括:
步骤S110,将所述语音信号进行语音信号预处理,以消除所述语音信号中的干扰信号。
考虑到基于语音识别的车载设备所处的环境可能受到胎噪、气流噪声、发动机噪声、多媒体播放声、乘客聊天声等各种因素对语音识别造成的影响,从软件角度可以考虑通过VAD检测、降噪处理、回声消除等方法对带有噪声的语音信号进行预处理,把相对纯净的语音信号送个语音识别模块,提高语音识别的准确率。
语音信号预处理可以通过语音预处理模块实现,语音预处理模块包括VAD检测单元、降噪处理单元和回声消除单元,其中,降噪处理单元为NS噪声处理单元,回声消除单元为AEC回声消除单元。
此外,为实现上述目的,本发明还提供一种车载设备,包括:存储器、处理器、以及存储在所述存储器上并可在所述处理器上运行的计算机程序;所述车载设备还包括语音采集模块,所述车载设备上还存储有本地命令识别词库;所述计算机程序被所述处理器执行时实现如上述任一项所述的语音识别方法的步骤。
由于本实施例车载设备的技术方案至少包括上述语音识别方法实施例的全部技术方案,因此至少具有以上实施例的全部技术效果,此处不再一一赘述。
请参阅图8,在某些具体实施方式中,该车载设备可以包括:处理器1001,例如CPU,网络接口1004,用户接口1003,存储器1005、通信总线1002、语音采集模块和语音识别模块。其中,通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(Display)、输入单元比如键盘(Keyboard),可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如WI-FI接口)。存储器1005可以是高速RAM存储器,也可以是稳定的存储器(non-volatile memory),例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。
本领域技术人员可以理解,图8中示出的车载设备结构并不构成对车载设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
此外,为实现上述目的,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如上述任一项所述的语音识别方法的步骤。
由于本实施例计算机可读存储介质的技术方案至少包括上述语音识别方法实施例的全部技术方案,因此至少具有以上实施例的全部技术效果,此处不再一一赘述。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在如上所述的一个计算机可读存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备进入本发明各个实施例所述的方法。
在本说明书的描述中,参考术语“一实施例”、“另一实施例”、“其他实施例”、或“第一实施例~第X实施例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料、方法步骤或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。
Claims (10)
1.一种车载设备的语音识别方法,所述车载设备包括语音采集模块,其特征在于,所述车载设备上还存储有本地命令识别词库;所述语音识别方法包括如下步骤:
获取所述语音采集模块采集到的语音信号;
根据所述本地命令识别词库识别所述语音信号对应的受控模块;
检测所述受控模块的当前网络连接状况;
当所述受控模块的当前网络连接状况符合预设条件时,通过云端语音识别方式识别所述语音信号,并根据反馈的语音识别结果控制所述受控模块运行。
2.根据权利要求1所述的语音识别方法,其特征在于,所述检测所述受控模块的当前网络连接状况的步骤之前,还包括:
判断所述受控模块是否具有网络连接功能;
当所述受控模块具有网络连接功能时,执行所述检测所述受控模块的当前网络连接状况的步骤;
当所述受控模块不具有网络连接功能时,根据所述本地命令识别词库识别所述语音信号,并根据所述本地命令识别词库识别出的语音识别结果控制所述受控模块运行。
3.根据权利要求1所述的语音识别方法,其特征在于,所述当所述受控模块的当前网络连接状况符合预设条件时,通过云端语音识别方式识别所述语音信号,并根据反馈的语音识别结果控制所述受控模块运行的步骤,具体包括:
当所述受控模块的当前网络连接状况符合预设条件时,根据所述本地命令识别词库识别所述语音信号,以及通过云端语音识别方式识别所述语音信号;
根据最先反馈的语音识别结果控制所述受控模块运行。
4.根据权利要求2或3所述的语音识别方法,其特征在于,所述本地命令识别词库包括通用命令词识别库;所述通用命令词识别库存储有模块名称命令词;所述根据所述本地命令识别词库识别所述语音信号对应的受控模块的步骤,具体包括:
将所述语音信号与所述通用命令词识别库比对,以识别出所述语音信号中包含的模块名称命令词;
根据所述语音信号中包含的所述模块名称命令词确定所述语音信号对应的受控模块;
将所述受控模块切换至前台运行。
5.根据权利要求4所述的语音识别方法,其特征在于,所述本地命令识别词库还包括专用命令词识别库;所述专用命令词识别库存储有指令命令词和模块名称命令词;
所述根据所述本地命令识别词库识别所述语音信号的步骤,具体包括:
将所述语音信号与所述专用命令词识别库比对,以识别所述语音信号中包含的指令命令词;
根据所述指令命令词确定所述语音识别结果。
6.根据权利要求1所述的语音识别方法,其特征在于,所述语音识别方法,还包括:
判断是否获取到所述语音识别结果;
当获取到所述语音识别结果时,播报所述语音识别结果;
当未获取到所述语音识别结果时,提示语音识别失败。
7.根据权利要求1至3中任一项所述的语音识别方法,其特征在于,所述语音识别方法,还包括:
检测语音识别功能是否启动;
当所述语音识别功能启动时,执行所述获取所述语音采集模块采集到的语音信号的步骤。
8.根据权利要求1至3中任一项所述的语音识别方法,其特征在于,所述根据所述本地命令识别词库识别所述语音信号对应的受控模块的步骤之前,还包括:
将所述语音信号进行语音信号预处理,以消除所述语音信号中的干扰信号。
9.一种车载设备,其特征在于,包括:存储器、处理器、以及存储在所述存储器上并可在所述处理器上运行的计算机程序;所述车载设备还包括语音采集模块,所述车载设备上还存储有本地命令识别词库;所述计算机程序被所述处理器执行时实现如权利要求1至8中任一项所述的语音识别方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至8中任一项所述的语音识别方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711018613.8A CN107785019A (zh) | 2017-10-26 | 2017-10-26 | 车载设备及其语音识别方法、可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711018613.8A CN107785019A (zh) | 2017-10-26 | 2017-10-26 | 车载设备及其语音识别方法、可读存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN107785019A true CN107785019A (zh) | 2018-03-09 |
Family
ID=61435356
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201711018613.8A Pending CN107785019A (zh) | 2017-10-26 | 2017-10-26 | 车载设备及其语音识别方法、可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107785019A (zh) |
Cited By (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109087650A (zh) * | 2018-10-24 | 2018-12-25 | 北京小米移动软件有限公司 | 语音唤醒方法及装置 |
CN109102808A (zh) * | 2018-10-25 | 2018-12-28 | 珠海格力电器股份有限公司 | 一种基于显示交互的本地语音识别系统及其方法 |
CN109545219A (zh) * | 2019-01-09 | 2019-03-29 | 北京新能源汽车股份有限公司 | 车载语音交互方法、系统、设备及计算机可读存储介质 |
CN109658929A (zh) * | 2018-12-17 | 2019-04-19 | 北京车和家信息技术有限公司 | 一种车载语音识别方法、装置及车机端 |
CN109830235A (zh) * | 2019-03-19 | 2019-05-31 | 东软睿驰汽车技术(沈阳)有限公司 | 语音控制方法、装置、车载控制设备和车辆 |
CN109887490A (zh) * | 2019-03-06 | 2019-06-14 | 百度国际科技(深圳)有限公司 | 用于识别语音的方法和装置 |
CN109979452A (zh) * | 2019-03-21 | 2019-07-05 | 中山安信通机器人制造有限公司 | 车载机器人自然语言处理方法、计算机装置及计算机可读存储介质 |
CN110148407A (zh) * | 2019-05-23 | 2019-08-20 | 深圳尚一互联技术有限公司 | 用于智能手环的语音控制方法 |
CN110246501A (zh) * | 2019-07-02 | 2019-09-17 | 苏州思必驰信息科技有限公司 | 用于会议记录的语音识别方法及系统 |
CN110444206A (zh) * | 2019-07-31 | 2019-11-12 | 北京百度网讯科技有限公司 | 语音交互方法及装置、计算机设备与可读介质 |
CN111405105A (zh) * | 2020-03-20 | 2020-07-10 | 深圳市未艾智能有限公司 | 用于控制蓝牙耳机的方法和装置、蓝牙耳机及存储介质 |
CN112037790A (zh) * | 2020-08-10 | 2020-12-04 | 上汽大众汽车有限公司 | 基于车载语音识别系统控制第三方应用的方法、系统和车辆 |
CN113129896A (zh) * | 2019-12-30 | 2021-07-16 | 北京猎户星空科技有限公司 | 一种语音交互方法、装置、电子设备及存储介质 |
CN113160812A (zh) * | 2021-02-23 | 2021-07-23 | 青岛歌尔智能传感器有限公司 | 语音识别装置、语音识别方法及可读存储介质 |
CN113851150A (zh) * | 2021-10-20 | 2021-12-28 | 镁佳(北京)科技有限公司 | 一种使用信心分在多套语音识别结果中进行选择的方法 |
CN114023324A (zh) * | 2022-01-06 | 2022-02-08 | 广州小鹏汽车科技有限公司 | 语音交互方法、装置、车辆及存储介质 |
CN114610727A (zh) * | 2020-12-09 | 2022-06-10 | 博泰车联网科技(上海)股份有限公司 | 离线语音识别库的更新方法及装置、语音识别方法及系统 |
CN115148204A (zh) * | 2022-06-20 | 2022-10-04 | 青岛海尔科技有限公司 | 语音唤醒的处理方法及装置、存储介质及电子装置 |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102708865A (zh) * | 2012-04-25 | 2012-10-03 | 北京车音网科技有限公司 | 语音识别方法、装置及系统 |
CN102779509A (zh) * | 2011-05-11 | 2012-11-14 | 联想(北京)有限公司 | 语音处理设备和语音处理方法 |
CN103440867A (zh) * | 2013-08-02 | 2013-12-11 | 安徽科大讯飞信息科技股份有限公司 | 语音识别方法及系统 |
CN103730119A (zh) * | 2013-12-18 | 2014-04-16 | 惠州市车仆电子科技有限公司 | 车载人机语音交互系统 |
US20140278436A1 (en) * | 2013-03-14 | 2014-09-18 | Honda Motor Co., Ltd. | Voice interface systems and methods |
CN105118508A (zh) * | 2015-09-14 | 2015-12-02 | 百度在线网络技术(北京)有限公司 | 语音识别方法和装置 |
CN105206275A (zh) * | 2015-08-31 | 2015-12-30 | 小米科技有限责任公司 | 一种设备控制方法、装置及终端 |
CN105913847A (zh) * | 2016-06-01 | 2016-08-31 | 北京灵隆科技有限公司 | 语音控制系统、用户端设备、服务器和中央控制单元 |
CN105931639A (zh) * | 2016-05-31 | 2016-09-07 | 杨若冲 | 一种支持多级命令词的语音交互方法 |
CN106126714A (zh) * | 2016-06-30 | 2016-11-16 | 联想(北京)有限公司 | 信息处理方法及信息处理装置 |
-
2017
- 2017-10-26 CN CN201711018613.8A patent/CN107785019A/zh active Pending
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102779509A (zh) * | 2011-05-11 | 2012-11-14 | 联想(北京)有限公司 | 语音处理设备和语音处理方法 |
CN102708865A (zh) * | 2012-04-25 | 2012-10-03 | 北京车音网科技有限公司 | 语音识别方法、装置及系统 |
US20140278436A1 (en) * | 2013-03-14 | 2014-09-18 | Honda Motor Co., Ltd. | Voice interface systems and methods |
CN103440867A (zh) * | 2013-08-02 | 2013-12-11 | 安徽科大讯飞信息科技股份有限公司 | 语音识别方法及系统 |
CN103730119A (zh) * | 2013-12-18 | 2014-04-16 | 惠州市车仆电子科技有限公司 | 车载人机语音交互系统 |
CN105206275A (zh) * | 2015-08-31 | 2015-12-30 | 小米科技有限责任公司 | 一种设备控制方法、装置及终端 |
CN105118508A (zh) * | 2015-09-14 | 2015-12-02 | 百度在线网络技术(北京)有限公司 | 语音识别方法和装置 |
CN105931639A (zh) * | 2016-05-31 | 2016-09-07 | 杨若冲 | 一种支持多级命令词的语音交互方法 |
CN105913847A (zh) * | 2016-06-01 | 2016-08-31 | 北京灵隆科技有限公司 | 语音控制系统、用户端设备、服务器和中央控制单元 |
CN106126714A (zh) * | 2016-06-30 | 2016-11-16 | 联想(北京)有限公司 | 信息处理方法及信息处理装置 |
Cited By (22)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109087650A (zh) * | 2018-10-24 | 2018-12-25 | 北京小米移动软件有限公司 | 语音唤醒方法及装置 |
CN109102808A (zh) * | 2018-10-25 | 2018-12-28 | 珠海格力电器股份有限公司 | 一种基于显示交互的本地语音识别系统及其方法 |
CN109658929A (zh) * | 2018-12-17 | 2019-04-19 | 北京车和家信息技术有限公司 | 一种车载语音识别方法、装置及车机端 |
CN109545219A (zh) * | 2019-01-09 | 2019-03-29 | 北京新能源汽车股份有限公司 | 车载语音交互方法、系统、设备及计算机可读存储介质 |
CN109887490A (zh) * | 2019-03-06 | 2019-06-14 | 百度国际科技(深圳)有限公司 | 用于识别语音的方法和装置 |
CN109830235A (zh) * | 2019-03-19 | 2019-05-31 | 东软睿驰汽车技术(沈阳)有限公司 | 语音控制方法、装置、车载控制设备和车辆 |
CN109979452A (zh) * | 2019-03-21 | 2019-07-05 | 中山安信通机器人制造有限公司 | 车载机器人自然语言处理方法、计算机装置及计算机可读存储介质 |
CN110148407A (zh) * | 2019-05-23 | 2019-08-20 | 深圳尚一互联技术有限公司 | 用于智能手环的语音控制方法 |
CN110246501A (zh) * | 2019-07-02 | 2019-09-17 | 苏州思必驰信息科技有限公司 | 用于会议记录的语音识别方法及系统 |
CN110444206A (zh) * | 2019-07-31 | 2019-11-12 | 北京百度网讯科技有限公司 | 语音交互方法及装置、计算机设备与可读介质 |
CN113129896A (zh) * | 2019-12-30 | 2021-07-16 | 北京猎户星空科技有限公司 | 一种语音交互方法、装置、电子设备及存储介质 |
CN113129896B (zh) * | 2019-12-30 | 2023-12-12 | 北京猎户星空科技有限公司 | 一种语音交互方法、装置、电子设备及存储介质 |
CN111405105A (zh) * | 2020-03-20 | 2020-07-10 | 深圳市未艾智能有限公司 | 用于控制蓝牙耳机的方法和装置、蓝牙耳机及存储介质 |
CN112037790A (zh) * | 2020-08-10 | 2020-12-04 | 上汽大众汽车有限公司 | 基于车载语音识别系统控制第三方应用的方法、系统和车辆 |
CN112037790B (zh) * | 2020-08-10 | 2024-02-23 | 上汽大众汽车有限公司 | 基于车载语音识别系统控制第三方应用的方法、系统和车辆 |
CN114610727A (zh) * | 2020-12-09 | 2022-06-10 | 博泰车联网科技(上海)股份有限公司 | 离线语音识别库的更新方法及装置、语音识别方法及系统 |
CN113160812A (zh) * | 2021-02-23 | 2021-07-23 | 青岛歌尔智能传感器有限公司 | 语音识别装置、语音识别方法及可读存储介质 |
CN113851150A (zh) * | 2021-10-20 | 2021-12-28 | 镁佳(北京)科技有限公司 | 一种使用信心分在多套语音识别结果中进行选择的方法 |
CN114023324A (zh) * | 2022-01-06 | 2022-02-08 | 广州小鹏汽车科技有限公司 | 语音交互方法、装置、车辆及存储介质 |
CN114023324B (zh) * | 2022-01-06 | 2022-05-13 | 广州小鹏汽车科技有限公司 | 语音交互方法、装置、车辆及存储介质 |
CN115148204A (zh) * | 2022-06-20 | 2022-10-04 | 青岛海尔科技有限公司 | 语音唤醒的处理方法及装置、存储介质及电子装置 |
CN115148204B (zh) * | 2022-06-20 | 2024-05-24 | 青岛海尔科技有限公司 | 语音唤醒的处理方法及装置、存储介质及电子装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107785019A (zh) | 车载设备及其语音识别方法、可读存储介质 | |
DE102013221631B4 (de) | System, Verfahren und Computerprogrammprodukt zur Implementierung einer Spracherkennungsfunktionalität in einem Fahrzeug durch eine von außen wirkende Vorrichtung | |
KR102388992B1 (ko) | 단일 음향 모델 및 자동 악센트 검출로 텍스트 규칙 기반 멀티-악센트 음성 인식 | |
CN104332159B (zh) | 一种车载语音操作系统人机互动方法及装置 | |
CN104240700B (zh) | 一种面向车载终端设备的全局语音交互方法及系统 | |
CN207009077U (zh) | 一种汽车空调语音控制系统及汽车 | |
JP2011059659A (ja) | 第1の機能及び第2の機能を含む複数の機能を有効にするためのシステムおよび方法 | |
CN206595039U (zh) | 一种车载语音交互系统 | |
US9704487B2 (en) | Speech recognition solution based on comparison of multiple different speech inputs | |
WO1997010583A1 (de) | Verfahren zur automatischen steuerung eines oder mehrerer geräte durch sprachkommandos oder per sprachdialog im echtzeitbetrieb und vorrichtung zum ausführen des verfahrens | |
CN100422916C (zh) | 选择列表项的方法和特别是用于机动车的信息系统或娱乐系统 | |
WO2009140884A1 (zh) | 一种车载语音交互系统 | |
CN109493865A (zh) | 信号处理方法、终端及车辆 | |
CN112309380A (zh) | 一种语音控制方法、系统、设备及汽车 | |
US11455982B2 (en) | Contextual utterance resolution in multimodal systems | |
JP2011059676A (ja) | 発話入力に基づいて複数の機能を有効にするためのシステム及び方法 | |
CN109584883A (zh) | 移动终端、远程声纹控制车机的方法及系统 | |
US11508370B2 (en) | On-board agent system, on-board agent system control method, and storage medium | |
KR20130063091A (ko) | 차량용 음성인식 장치 | |
US9715878B2 (en) | Systems and methods for result arbitration in spoken dialog systems | |
WO2024078460A1 (zh) | 语音处理方法、语音交互方法、服务器及存储介质 | |
Loh et al. | Speech recognition interactive system for vehicle | |
JP5986468B2 (ja) | 表示制御装置、表示システム及び表示制御方法 | |
CN112017659A (zh) | 多音区语音信号的处理方法、装置、设备以及存储介质 | |
US20220355664A1 (en) | Vehicle having voice recognition system and method of controlling the same |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20180309 |
|
RJ01 | Rejection of invention patent application after publication |