CN113571042A - 一种用于车载式语音识别系统 - Google Patents

一种用于车载式语音识别系统 Download PDF

Info

Publication number
CN113571042A
CN113571042A CN202110833042.3A CN202110833042A CN113571042A CN 113571042 A CN113571042 A CN 113571042A CN 202110833042 A CN202110833042 A CN 202110833042A CN 113571042 A CN113571042 A CN 113571042A
Authority
CN
China
Prior art keywords
module
voice
vehicle
information
grammar
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110833042.3A
Other languages
English (en)
Other versions
CN113571042B (zh
Inventor
黄俊明
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chengdu Hangsheng Zhixing Technology Co ltd
Original Assignee
Chengdu Hangsheng Zhixing Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chengdu Hangsheng Zhixing Technology Co ltd filed Critical Chengdu Hangsheng Zhixing Technology Co ltd
Priority to CN202110833042.3A priority Critical patent/CN113571042B/zh
Publication of CN113571042A publication Critical patent/CN113571042A/zh
Application granted granted Critical
Publication of CN113571042B publication Critical patent/CN113571042B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/005Language recognition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Fittings On The Vehicle Exterior For Carrying Loads, And Devices For Holding Or Mounting Articles (AREA)
  • Telephone Function (AREA)

Abstract

本发明公开了一种用于车载式语音识别系统,涉及车载电子技术领域,包括语音输入模块,用于输入用户的语音信息;语音识别模块,用于识别输入的语音信息;语音输出模块,用于输出汽车的音频信息;车机互联模块,用于接收用户移动终端的指令;车载仪表模块,用于显示仪表数据;车载主机模块,采用Android系统,所述语音输入模块、语音识别模块、语音输出模块、车机互联模块、车载仪表模块分别与所述车载主机模块连接。通过该系统可以匹配不同车型,不同需求,在程序上实现了语法的适配调整,在收集到响应系统状态信息变化是,可以自动触发相应的语法解析流程,具有显著的意义。

Description

一种用于车载式语音识别系统
技术领域
本发明涉及车载电子技术领域,具体是一种用于车载式语音识别系统。
背景技术
语音识别系统的应用可以分为两个发展方向:一个方向是大词汇量连续语音识别系统,主要应用于计算机的听写机,以及与电话网或者互联网相结合的语音信息查询服务系统;另外一个重要的发展方向是小型化、便携式语音产品的应用,如无线手机上的拨号、汽车设备的语音控制、智能玩具、家电遥控等方面的应用。
现有的车载语音识别系统仅根据具体的程序指令对应用程序执行相应动作,而对于其中没有涉及的具体软件的配置调整,将语法文件进行快速切换的过程正是本发明需要解决的问题。
发明内容
鉴于上述技术缺点,本发明提供了一种用于车载式语音识别系统。
为实现上述发明目的,本发明的技术方案如下:
一种用于车载式语音识别系统,包括:
语音输入模块,用于输入用户的语音信息;
语音识别模块,用于识别输入的语音信息;
语音输出模块,用于输出汽车的音频信息;
车机互联模块,用于接收用户移动终端的指令;
车载仪表模块,用于显示仪表数据;
车载主机模块,采用Android 系统, 所述语音输入模块、语音识别模块、语音输出模块、车机互联模块、车载仪表模块分别与所述车载主机模块连接。
作为优选的,所述语音识别模块包括服务主体模块、状态暂存模块、状态收集模块、语法配置模块、语法解析模块、语音输出执行模块、功能执行模块;
所述服务主体模块用于系统初始化、引擎初始化、对外服务初始化、对外接口初始化、语法处理逻辑初始化;
所述状态暂存模块用于暂存广播、仪表信息;
所述语法配置模块用于不同引擎、不同项目、不同需求的差异化处理,支持快速工程化;
所述状态收集模块用于遍历语法文件,并根据语法文件的内容注册系统状态信息,在收集到响应状态变化时,触发语法解析流程;
所述语法解析模块用于解析语法配置模块处理后的语法文件;
所述语音输出执行模块用于执行语音输出;
所述功能执行模块用于执行完成解析后的语法文件的对应功能。
作为优选的,所述语音识别模块采用的引擎分别为科大讯飞引擎、百度引擎。
作为优选的,所述语法配置模块的工作过程为:
S41,将json格式设定为语法配置文件格式;
S42,输入引擎识别到的语音信息,并将其转换为json文件,并标识关键字;
S43,将标识关键字的json文件进行匹配,获得关联的语法块序列。
作为优选的,所述语音输出执行模块具体为:封装不同引擎的TTS合成输出为统一接口,并且对外支持重复逻辑。
作为优选的,所述功能执行模块具体为:
下发CAN消息到车载主机模块,其中包括的信息有:发送广播信息,发送系统状态信息,更改系统数据库,更改系统属性,非标准通用功能通过功能的独立接口实现。
作为优选的,所述系统状态信息包括广播信息、CAN数据信息、ContentProvider信息、Framework状态机信息等。
作为优选的,所述车机互联模块内预设有语音设置,所述语音设置包括唤醒设置、语言设置、教学设置;
所述唤醒设置用于识别到用户语音与自定义唤醒词或系统默认唤醒词相同时,完成语音唤醒;
所述语言设置内预设有普通话、粤语,用于方便用户设定自己的语言偏好;
所述教学设置内预设有导航出行、音频播放、车辆控制、天气查询输入语音的文字教学,用于方便在用户语音唤醒后的执行用户命令的对应功能。
作为优选的,所述唤醒设置内还预设有快捷功能,所述快捷功能可以设置仅主驾可以进行语音唤醒,或通过连续的唤醒语音进行语音唤醒。
本发明的有益效果是:本发明提出了一种用于车载式语音识别系统,通过该系统可以匹配不同车型,不同需求,在程序上实现了语法的适配调整,在收集到响应系统状态信息变化是,可以自动触发相应的语法解析流程,具有显著的意义。
附图说明
图1为本发明提供的:系统示意图;
图2为本发明提供的:语法解析流程示意图;
图3为本发明提供的:软件部署框架图。
具体实施方式
下面结合本发明的附图,对本发明实施例中的技术方案进行清楚、完整地描述,本领域技术人员可由本说明书所揭露的内容轻易地了解本发明的其他优点与功效。本发明还可以通过另外不同的具体实施方式加以实施或应用,本说明书中的各项细节也可以基于不同观点与应用,在没有背离本发明的精神下进行各种修饰或改变。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例
如图1、3所示,一种用于车载式语音识别系统,包括:
语音输入模块,用于输入用户的语音信息;
语音识别模块,用于识别输入的语音信息;
语音输出模块,用于输出汽车的音频信息;
车机互联模块,用于接收用户移动终端的指令,其中用户移动终端包括手机、平板电脑等电子设备;
车载仪表模块,用于显示仪表数据;
车载主机模块,采用Android 系统, 所述语音输入模块、语音识别模块、语音输出模块、车机互联模块、车载仪表模块分别与所述车载主机模块连接。
作为优选的,所述语音识别模块包括服务主体模块、状态暂存模块、状态收集模块、语法配置模块、语法解析模块、语音输出执行模块、功能执行模块;
所述服务主体模块用于系统初始化、引擎初始化、对外服务初始化、对外接口初始化、语法处理逻辑初始化;
所述状态暂存模块用于暂存广播、仪表等信息;
状态暂存模块具体为:
Android广播类型数据,不具备后续查询能力,在本模块内部进行暂存。
仪表数据,具备查询能力,但基于性能考虑,也在本模块内部进行暂存。
所述语法配置模块用于不同引擎、不同项目、不同需求的差异化处理,支持快速工程化;
所述状态收集模块用于遍历语法文件,并根据语法文件的内容注册系统状态信息,在收集到响应状态变化时,触发语法解析流程;
如图2所示,所述语法解析模块用于解析语法配置模块处理后的语法文件;
所述语音输出执行模块用于执行语音输出;
所述功能执行模块用于执行完成解析后的语法文件的对应功能。
作为优选的,所述语音识别模块采用的引擎分别为科大讯飞引擎、百度引擎。
作为优选的,所述语法配置模块的工作过程为:
使用json格式作为配置文件格式,将VR的需求以特定的语法逻辑呈现。
编译时将json文件直接转换为预制内容的java文件,以加快软件启动速度。
程序内部将引擎识别到的语义转换为特定的json文件标识关键字,以匹配对应的需求,获得关联的语法块列表,但对具体业务逻辑内容不关心。
每一项具体需求,在json文件内部实现,遵循统一的语法,程序只关心语法结构。
所有的需求定制,都尽量体现在语法文件内,不体现在程序代码上。
作为优选的,所述语音输出执行模块具体为:封装不同引擎的TTS合成输出为统一接口,并且对外支持重复逻辑。
作为优选的,所述功能执行模块具体为:
下发CAN消息到车载主机模块,其中包括的信息有:发送广播信息,发送系统状态信息,更改系统数据库,更改系统属性,非标准通用功能通过功能的独立接口实现。
作为优选的,所述系统状态信息包括广播信息、CAN数据信息、ContentProvider信息、Framework状态机信息等。
作为优选的,所述车机互联模块内预设有语音设置,所述语音设置包括唤醒设置、语言设置、教学设置;
所述唤醒设置用于识别到用户语音与自定义唤醒词或系统默认唤醒词相同时,完成语音唤醒;
所述语言设置内预设有普通话、粤语,用于方便用户设定自己的语言偏好;
所述教学设置内预设有导航出行、音频播放、车辆控制、天气查询等输入语音的文字教学,用于方便在用户语音唤醒后的执行用户命令的对应功能。
作为优选的,所述唤醒设置内还预设有快捷功能,所述快捷功能可以设置仅主驾可以进行语音唤醒,或通过连续的唤醒语音进行语音唤醒。
所示语音识别的步骤如下:
S1,输入语音信息;
S2,通过语音识别模块将语音信息转换为设定配置的语法文件,并标识关键字,获得与之相关联的语法块序列;
S3,根据语法块序列依次解析每一个语法块,通过解析后的语法块执行对应的功能,完成车载语音识别。
以上所述仅是本发明的优选实施方式,应当理解本发明并非局限于本文所披露的形式,不应看作是对其他实施例的排除,而可用于各种其他组合、修改和环境,并能够在本文所述构想范围内,通过上述教导或相关领域的技术或知识进行改动。而本领域人员所进行的改动和变化不脱离本发明的精神和范围,则都应在本发明所附权利要求的保护范围内。

Claims (9)

1.一种用于车载式语音识别系统,其特征在于,包括:
语音输入模块,用于输入用户的语音信息;
语音识别模块,用于识别输入的语音信息;
语音输出模块,用于输出汽车的音频信息;
车机互联模块,用于接收用户移动终端的指令;
车载仪表模块,用于显示仪表数据;
车载主机模块,采用Android 系统, 所述语音输入模块、语音识别模块、语音输出模块、车机互联模块、车载仪表模块分别与所述车载主机模块连接。
2.根据权利要求1所述的一种用于车载式语音识别系统,其特征在于,所述语音识别模块包括服务主体模块、状态暂存模块、状态收集模块、语法配置模块、语法解析模块、语音输出执行模块、功能执行模块;
所述服务主体模块用于系统初始化、引擎初始化、对外服务初始化、对外接口初始化、语法处理逻辑初始化;
所述状态暂存模块用于暂存广播、仪表信息;
所述语法配置模块用于不同引擎、不同项目、不同需求的差异化处理,支持快速工程化;
所述状态收集模块用于遍历语法文件,并根据语法文件的内容注册系统状态信息,在收集到响应状态变化时,触发语法解析流程;
所述语法解析模块用于解析语法配置模块处理后的语法文件;
所述语音输出执行模块用于执行语音输出;
所述功能执行模块用于执行完成解析后的语法文件的对应功能。
3.根据权利要求2所述的一种用于车载式语音识别系统,其特征在于,所述语音识别模块采用的引擎分别为科大讯飞引擎、百度引擎。
4.根据权利要求2-3任意一项所述的一种用于车载式语音识别系统,其特征在于,所述语法配置模块的工作过程为:
S41,将json格式设定为语法配置文件格式;
S42,输入引擎识别到的语音信息,并将其转换为json文件,并标识关键字;
S43,将标识关键字的json文件进行匹配,获得关联的语法块序列。
5.根据权利要求2任意一项所述的一种用于车载式语音识别系统,其特征在于,所述语音输出执行模块具体为:封装不同引擎的TTS合成输出为统一接口,并且对外支持重复逻辑。
6.根据权利要求2所述的一种用于车载式语音识别系统,其特征在于,所述功能执行模块具体为:
下发CAN消息到车载主机模块,其中包括的信息有:发送广播信息,发送系统状态信息,更改系统数据库,更改系统属性,非标准通用功能通过功能的独立接口实现。
7.根据权利要求2所述的一种用于车载式语音识别系统,其特征在于,所述系统状态信息包括广播信息、CAN数据信息、ContentProvider信息、Framework状态机信息。
8.根据权利要求1所述的一种用于车载式语音识别系统,其特征在于,所述车机互联模块内预设有语音设置,所述语音设置包括唤醒设置、语言设置、教学设置;
所述唤醒设置用于识别到用户语音与自定义唤醒词或系统默认唤醒词相同时,完成语音唤醒;
所述语言设置内预设有普通话、粤语,用于方便用户设定自己的语言偏好;
所述教学设置内预设有导航出行、音频播放、车辆控制、天气查询输入语音的文字教学,用于方便在用户语音唤醒后的执行用户命令的对应功能。
9.根据权利要求8所述的一种用于车载式语音识别系统,其特征在于,所述唤醒设置内还预设有快捷功能,所述快捷功能可以设置仅主驾可以进行语音唤醒,或通过连续的唤醒语音进行语音唤醒。
CN202110833042.3A 2021-07-22 2021-07-22 一种用于车载式语音识别系统 Active CN113571042B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110833042.3A CN113571042B (zh) 2021-07-22 2021-07-22 一种用于车载式语音识别系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110833042.3A CN113571042B (zh) 2021-07-22 2021-07-22 一种用于车载式语音识别系统

Publications (2)

Publication Number Publication Date
CN113571042A true CN113571042A (zh) 2021-10-29
CN113571042B CN113571042B (zh) 2023-12-01

Family

ID=78166452

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110833042.3A Active CN113571042B (zh) 2021-07-22 2021-07-22 一种用于车载式语音识别系统

Country Status (1)

Country Link
CN (1) CN113571042B (zh)

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070271103A1 (en) * 2006-05-22 2007-11-22 Accenture Global Services Gmbh Interactive Voice Response System
CN103714140A (zh) * 2013-12-23 2014-04-09 北京锐安科技有限公司 一种基于主题网络爬虫的搜索方法及装置
CN103810292A (zh) * 2014-02-28 2014-05-21 北京理工大学 一种图形界面的配置方法及装置
CN106601232A (zh) * 2017-01-04 2017-04-26 江西沃可视发展有限公司 一种基于语音识别的车载终端人机交互系统
CN108008885A (zh) * 2017-11-15 2018-05-08 中国航空无线电电子研究所 指令式语音控制语法文件辅助生成系统
CN109522083A (zh) * 2018-11-27 2019-03-26 四川长虹电器股份有限公司 一种页面智能化响应交互系统及方法
CN111128171A (zh) * 2019-12-31 2020-05-08 云知声智能科技股份有限公司 一种基于语音识别的设置方法及装置
CN111627435A (zh) * 2020-04-30 2020-09-04 长城汽车股份有限公司 语音识别方法与系统及基于语音指令的控制方法与系统
CN111918213A (zh) * 2020-07-13 2020-11-10 江苏开沃汽车有限公司 一种智能车载互联系统
CN112017646A (zh) * 2020-08-21 2020-12-01 博泰车联网(南京)有限公司 一种语音处理方法、装置及计算机存储介质

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070271103A1 (en) * 2006-05-22 2007-11-22 Accenture Global Services Gmbh Interactive Voice Response System
CN103714140A (zh) * 2013-12-23 2014-04-09 北京锐安科技有限公司 一种基于主题网络爬虫的搜索方法及装置
CN103810292A (zh) * 2014-02-28 2014-05-21 北京理工大学 一种图形界面的配置方法及装置
CN106601232A (zh) * 2017-01-04 2017-04-26 江西沃可视发展有限公司 一种基于语音识别的车载终端人机交互系统
CN108008885A (zh) * 2017-11-15 2018-05-08 中国航空无线电电子研究所 指令式语音控制语法文件辅助生成系统
CN109522083A (zh) * 2018-11-27 2019-03-26 四川长虹电器股份有限公司 一种页面智能化响应交互系统及方法
CN111128171A (zh) * 2019-12-31 2020-05-08 云知声智能科技股份有限公司 一种基于语音识别的设置方法及装置
CN111627435A (zh) * 2020-04-30 2020-09-04 长城汽车股份有限公司 语音识别方法与系统及基于语音指令的控制方法与系统
CN111918213A (zh) * 2020-07-13 2020-11-10 江苏开沃汽车有限公司 一种智能车载互联系统
CN112017646A (zh) * 2020-08-21 2020-12-01 博泰车联网(南京)有限公司 一种语音处理方法、装置及计算机存储介质

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
夏峰;陆珂伟;陈启军;: "语音控制的多功能车载终端系统的设计与实现", 机电一体化, no. 08 *
秦楠;高军伟;刘新;于侃;: "出行者信息服务系统中后台语音识别系统的研究", 交通标准化, no. 1 *

Also Published As

Publication number Publication date
CN113571042B (zh) 2023-12-01

Similar Documents

Publication Publication Date Title
CN108520743B (zh) 智能设备的语音控制方法、智能设备及计算机可读介质
US7010490B2 (en) Method, system, and apparatus for limiting available selections in a speech recognition system
EP1844464B1 (en) Methods and apparatus for automatically extending the voice-recognizer vocabulary of mobile communications devices
CN113327609B (zh) 用于语音识别的方法和装置
CN107657950B (zh) 基于云端和多命令词的汽车语音控制方法、系统及装置
US20140310004A1 (en) Voice control method, mobile terminal device, and voice control system
US20140379338A1 (en) Conditional multipass automatic speech recognition
WO2009140884A1 (zh) 一种车载语音交互系统
CN201919034U (zh) 基于网络的语音提醒的系统
KR20170035905A (ko) 단일 음향 모델 및 자동 악센트 검출로 텍스트 규칙 기반 멀티-악센트 음성 인식
JP2003295893A (ja) 音声認識システム、装置、音声認識方法、音声認識プログラム及び音声認識プログラムを記録したコンピュータ読み取り可能な記録媒体
US20110144987A1 (en) Using pitch during speech recognition post-processing to improve recognition accuracy
GB2423403A (en) Distributed language processing system and method of outputting an intermediary signal
CN102566961A (zh) 基于车载设备的应用程序的语音执行方法及装置
CN110992955A (zh) 一种智能设备的语音操作方法、装置、设备及存储介质
EP2816552B1 (en) Conditional multipass automatic speech recognition
CN111933149A (zh) 语音交互方法、穿戴式设备、终端及语音交互系统
US20040054532A1 (en) Method and processor system for processing of an audio signal
CN102571882A (zh) 基于网络的语音提醒的方法和系统
CN114360510A (zh) 一种语音识别方法和相关装置
CN201054644Y (zh) 具有语音识别及翻译功能的移动终端
KR20210001082A (ko) 사용자 발화를 처리하는 전자 장치와 그 동작 방법
CN113571042B (zh) 一种用于车载式语音识别系统
CN112259076A (zh) 语音交互方法、装置、电子设备及计算机可读存储介质
CN116129942A (zh) 语音交互设备和语音交互方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant