CN113571042B - 一种用于车载式语音识别系统 - Google Patents
一种用于车载式语音识别系统 Download PDFInfo
- Publication number
- CN113571042B CN113571042B CN202110833042.3A CN202110833042A CN113571042B CN 113571042 B CN113571042 B CN 113571042B CN 202110833042 A CN202110833042 A CN 202110833042A CN 113571042 B CN113571042 B CN 113571042B
- Authority
- CN
- China
- Prior art keywords
- module
- voice
- vehicle
- grammar
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000008859 change Effects 0.000 claims abstract description 5
- 230000004044 response Effects 0.000 claims abstract description 5
- 230000006870 function Effects 0.000 claims description 25
- 238000000034 method Methods 0.000 claims description 4
- 230000008569 process Effects 0.000 claims description 4
- 241001672694 Citrus reticulata Species 0.000 claims description 3
- 230000008571 general function Effects 0.000 claims description 3
- 230000006978 adaptation Effects 0.000 abstract description 2
- 230000000875 corresponding effect Effects 0.000 description 8
- 238000010586 diagram Methods 0.000 description 4
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/005—Language recognition
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Fittings On The Vehicle Exterior For Carrying Loads, And Devices For Holding Or Mounting Articles (AREA)
- Telephone Function (AREA)
Abstract
本发明公开了一种用于车载式语音识别系统,涉及车载电子技术领域,包括语音输入模块,用于输入用户的语音信息;语音识别模块,用于识别输入的语音信息;语音输出模块,用于输出汽车的音频信息;车机互联模块,用于接收用户移动终端的指令;车载仪表模块,用于显示仪表数据;车载主机模块,采用Android系统,所述语音输入模块、语音识别模块、语音输出模块、车机互联模块、车载仪表模块分别与所述车载主机模块连接。通过该系统可以匹配不同车型,不同需求,在程序上实现了语法的适配调整,在收集到响应系统状态信息变化是,可以自动触发相应的语法解析流程,具有显著的意义。
Description
技术领域
本发明涉及车载电子技术领域,具体是一种用于车载式语音识别系统。
背景技术
语音识别系统的应用可以分为两个发展方向:一个方向是大词汇量连续语音识别系统,主要应用于计算机的听写机,以及与电话网或者互联网相结合的语音信息查询服务系统;另外一个重要的发展方向是小型化、便携式语音产品的应用,如无线手机上的拨号、汽车设备的语音控制、智能玩具、家电遥控等方面的应用。
现有的车载语音识别系统仅根据具体的程序指令对应用程序执行相应动作,而对于其中没有涉及的具体软件的配置调整,将语法文件进行快速切换的过程正是本发明需要解决的问题。
发明内容
鉴于上述技术缺点,本发明提供了一种用于车载式语音识别系统。
为实现上述发明目的,本发明的技术方案如下:
一种用于车载式语音识别系统,包括:
语音输入模块,用于输入用户的语音信息;
语音识别模块,用于识别输入的语音信息;
语音输出模块,用于输出汽车的音频信息;
车机互联模块,用于接收用户移动终端的指令;
车载仪表模块,用于显示仪表数据;
车载主机模块,采用Android 系统, 所述语音输入模块、语音识别模块、语音输出模块、车机互联模块、车载仪表模块分别与所述车载主机模块连接。
作为优选的,所述语音识别模块包括服务主体模块、状态暂存模块、状态收集模块、语法配置模块、语法解析模块、语音输出执行模块、功能执行模块;
所述服务主体模块用于系统初始化、引擎初始化、对外服务初始化、对外接口初始化、语法处理逻辑初始化;
所述状态暂存模块用于暂存广播、仪表信息;
所述语法配置模块用于不同引擎、不同项目、不同需求的差异化处理,支持快速工程化;
所述状态收集模块用于遍历语法文件,并根据语法文件的内容注册系统状态信息,在收集到响应状态变化时,触发语法解析流程;
所述语法解析模块用于解析语法配置模块处理后的语法文件;
所述语音输出执行模块用于执行语音输出;
所述功能执行模块用于执行完成解析后的语法文件的对应功能。
作为优选的,所述语音识别模块采用的引擎分别为科大讯飞引擎、百度引擎。
作为优选的,所述语法配置模块的工作过程为:
S41,将json格式设定为语法配置文件格式;
S42,输入引擎识别到的语音信息,并将其转换为json文件,并标识关键字;
S43,将标识关键字的json文件进行匹配,获得关联的语法块序列。
作为优选的,所述语音输出执行模块具体为:封装不同引擎的TTS合成输出为统一接口,并且对外支持重复逻辑。
作为优选的,所述功能执行模块具体为:
下发CAN消息到车载主机模块,其中包括的信息有:发送广播信息,发送系统状态信息,更改系统数据库,更改系统属性,非标准通用功能通过功能的独立接口实现。
作为优选的,所述系统状态信息包括广播信息、CAN数据信息、ContentProvider信息、Framework状态机信息等。
作为优选的,所述车机互联模块内预设有语音设置,所述语音设置包括唤醒设置、语言设置、教学设置;
所述唤醒设置用于识别到用户语音与自定义唤醒词或系统默认唤醒词相同时,完成语音唤醒;
所述语言设置内预设有普通话、粤语,用于方便用户设定自己的语言偏好;
所述教学设置内预设有导航出行、音频播放、车辆控制、天气查询输入语音的文字教学,用于方便在用户语音唤醒后的执行用户命令的对应功能。
作为优选的,所述唤醒设置内还预设有快捷功能,所述快捷功能可以设置仅主驾可以进行语音唤醒,或通过连续的唤醒语音进行语音唤醒。
本发明的有益效果是:本发明提出了一种用于车载式语音识别系统,通过该系统可以匹配不同车型,不同需求,在程序上实现了语法的适配调整,在收集到响应系统状态信息变化是,可以自动触发相应的语法解析流程,具有显著的意义。
附图说明
图1为本发明提供的:系统示意图;
图2为本发明提供的:语法解析流程示意图;
图3为本发明提供的:软件部署框架图。
具体实施方式
下面结合本发明的附图,对本发明实施例中的技术方案进行清楚、完整地描述,本领域技术人员可由本说明书所揭露的内容轻易地了解本发明的其他优点与功效。本发明还可以通过另外不同的具体实施方式加以实施或应用,本说明书中的各项细节也可以基于不同观点与应用,在没有背离本发明的精神下进行各种修饰或改变。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例
如图1、3所示,一种用于车载式语音识别系统,包括:
语音输入模块,用于输入用户的语音信息;
语音识别模块,用于识别输入的语音信息;
语音输出模块,用于输出汽车的音频信息;
车机互联模块,用于接收用户移动终端的指令,其中用户移动终端包括手机、平板电脑等电子设备;
车载仪表模块,用于显示仪表数据;
车载主机模块,采用Android 系统, 所述语音输入模块、语音识别模块、语音输出模块、车机互联模块、车载仪表模块分别与所述车载主机模块连接。
作为优选的,所述语音识别模块包括服务主体模块、状态暂存模块、状态收集模块、语法配置模块、语法解析模块、语音输出执行模块、功能执行模块;
所述服务主体模块用于系统初始化、引擎初始化、对外服务初始化、对外接口初始化、语法处理逻辑初始化;
所述状态暂存模块用于暂存广播、仪表等信息;
状态暂存模块具体为:
Android广播类型数据,不具备后续查询能力,在本模块内部进行暂存。
仪表数据,具备查询能力,但基于性能考虑,也在本模块内部进行暂存。
所述语法配置模块用于不同引擎、不同项目、不同需求的差异化处理,支持快速工程化;
所述状态收集模块用于遍历语法文件,并根据语法文件的内容注册系统状态信息,在收集到响应状态变化时,触发语法解析流程;
如图2所示,所述语法解析模块用于解析语法配置模块处理后的语法文件;
所述语音输出执行模块用于执行语音输出;
所述功能执行模块用于执行完成解析后的语法文件的对应功能。
作为优选的,所述语音识别模块采用的引擎分别为科大讯飞引擎、百度引擎。
作为优选的,所述语法配置模块的工作过程为:
使用json格式作为配置文件格式,将VR的需求以特定的语法逻辑呈现。
编译时将json文件直接转换为预制内容的java文件,以加快软件启动速度。
程序内部将引擎识别到的语义转换为特定的json文件标识关键字,以匹配对应的需求,获得关联的语法块列表,但对具体业务逻辑内容不关心。
每一项具体需求,在json文件内部实现,遵循统一的语法,程序只关心语法结构。
所有的需求定制,都尽量体现在语法文件内,不体现在程序代码上。
作为优选的,所述语音输出执行模块具体为:封装不同引擎的TTS合成输出为统一接口,并且对外支持重复逻辑。
作为优选的,所述功能执行模块具体为:
下发CAN消息到车载主机模块,其中包括的信息有:发送广播信息,发送系统状态信息,更改系统数据库,更改系统属性,非标准通用功能通过功能的独立接口实现。
作为优选的,所述系统状态信息包括广播信息、CAN数据信息、ContentProvider信息、Framework状态机信息等。
作为优选的,所述车机互联模块内预设有语音设置,所述语音设置包括唤醒设置、语言设置、教学设置;
所述唤醒设置用于识别到用户语音与自定义唤醒词或系统默认唤醒词相同时,完成语音唤醒;
所述语言设置内预设有普通话、粤语,用于方便用户设定自己的语言偏好;
所述教学设置内预设有导航出行、音频播放、车辆控制、天气查询等输入语音的文字教学,用于方便在用户语音唤醒后的执行用户命令的对应功能。
作为优选的,所述唤醒设置内还预设有快捷功能,所述快捷功能可以设置仅主驾可以进行语音唤醒,或通过连续的唤醒语音进行语音唤醒。
所示语音识别的步骤如下:
S1,输入语音信息;
S2,通过语音识别模块将语音信息转换为设定配置的语法文件,并标识关键字,获得与之相关联的语法块序列;
S3,根据语法块序列依次解析每一个语法块,通过解析后的语法块执行对应的功能,完成车载语音识别。
以上所述仅是本发明的优选实施方式,应当理解本发明并非局限于本文所披露的形式,不应看作是对其他实施例的排除,而可用于各种其他组合、修改和环境,并能够在本文所述构想范围内,通过上述教导或相关领域的技术或知识进行改动。而本领域人员所进行的改动和变化不脱离本发明的精神和范围,则都应在本发明所附权利要求的保护范围内。
Claims (6)
1.一种用于车载式语音识别系统,其特征在于,包括:
语音输入模块,用于输入用户的语音信息;
语音识别模块,用于识别输入的语音信息;
语音输出模块,用于输出汽车的音频信息;
车机互联模块,用于接收用户移动终端的指令;
车载仪表模块,用于显示仪表数据;
车载主机模块,采用Android 系统, 所述语音输入模块、语音识别模块、语音输出模块、车机互联模块、车载仪表模块分别与所述车载主机模块连接;
所述语音识别模块包括服务主体模块、状态暂存模块、状态收集模块、语法配置模块、语法解析模块、语音输出执行模块、功能执行模块;
所述服务主体模块用于系统初始化、引擎初始化、对外服务初始化、对外接口初始化、语法处理逻辑初始化;
所述状态暂存模块用于暂存广播、仪表信息;
所述语法配置模块用于不同引擎、不同项目、不同需求的差异化处理,支持快速工程化;
所述状态收集模块用于遍历语法文件,并根据语法文件的内容注册系统状态信息,在收集到响应状态变化时,触发语法解析流程;
所述语法解析模块用于解析语法配置模块处理后的语法文件;
所述语音输出执行模块用于执行语音输出;
所述功能执行模块用于执行完成解析后的语法文件的对应功能;
所述语音识别模块采用的引擎分别为科大讯飞引擎、百度引擎;
所述语法配置模块的工作过程为:
S41,将json格式设定为语法配置文件格式;
S42,输入引擎识别到的语音信息,并将其转换为json文件,并标识关键字;
S43,将标识关键字的json文件进行匹配,获得关联的语法块序列。
2.根据权利要求1所述的一种用于车载式语音识别系统,其特征在于,所述语音输出执行模块具体为:封装不同引擎的TTS合成输出为统一接口,并且对外支持重复逻辑。
3.根据权利要求1所述的一种用于车载式语音识别系统,其特征在于,所述功能执行模块具体为:
下发CAN消息到车载主机模块,其中包括的信息有:发送广播信息,发送系统状态信息,更改系统数据库,更改系统属性,非标准通用功能通过功能的独立接口实现。
4.根据权利要求1所述的一种用于车载式语音识别系统,其特征在于,所述系统状态信息包括广播信息、CAN数据信息、ContentProvider信息、Framework状态机信息。
5.根据权利要求1所述的一种用于车载式语音识别系统,其特征在于,所述车机互联模块内预设有语音设置,所述语音设置包括唤醒设置、语言设置、教学设置;
所述唤醒设置用于识别到用户语音与自定义唤醒词或系统默认唤醒词相同时,完成语音唤醒;
所述语言设置内预设有普通话、粤语,用于方便用户设定自己的语言偏好;
所述教学设置内预设有导航出行、音频播放、车辆控制、天气查询输入语音的文字教学,用于方便在用户语音唤醒后的执行用户命令的对应功能。
6.根据权利要求5所述的一种用于车载式语音识别系统,其特征在于,所述唤醒设置内还预设有快捷功能,所述快捷功能可以设置仅主驾可以进行语音唤醒,或通过连续的唤醒语音进行语音唤醒。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110833042.3A CN113571042B (zh) | 2021-07-22 | 2021-07-22 | 一种用于车载式语音识别系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110833042.3A CN113571042B (zh) | 2021-07-22 | 2021-07-22 | 一种用于车载式语音识别系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113571042A CN113571042A (zh) | 2021-10-29 |
CN113571042B true CN113571042B (zh) | 2023-12-01 |
Family
ID=78166452
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110833042.3A Active CN113571042B (zh) | 2021-07-22 | 2021-07-22 | 一种用于车载式语音识别系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113571042B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114999481A (zh) * | 2022-05-30 | 2022-09-02 | 北斗星通智联科技有限责任公司 | 适配多种语音识别引擎的适配器系统和适配方法 |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103714140A (zh) * | 2013-12-23 | 2014-04-09 | 北京锐安科技有限公司 | 一种基于主题网络爬虫的搜索方法及装置 |
CN103810292A (zh) * | 2014-02-28 | 2014-05-21 | 北京理工大学 | 一种图形界面的配置方法及装置 |
CN106601232A (zh) * | 2017-01-04 | 2017-04-26 | 江西沃可视发展有限公司 | 一种基于语音识别的车载终端人机交互系统 |
CN108008885A (zh) * | 2017-11-15 | 2018-05-08 | 中国航空无线电电子研究所 | 指令式语音控制语法文件辅助生成系统 |
CN109522083A (zh) * | 2018-11-27 | 2019-03-26 | 四川长虹电器股份有限公司 | 一种页面智能化响应交互系统及方法 |
CN111128171A (zh) * | 2019-12-31 | 2020-05-08 | 云知声智能科技股份有限公司 | 一种基于语音识别的设置方法及装置 |
CN111627435A (zh) * | 2020-04-30 | 2020-09-04 | 长城汽车股份有限公司 | 语音识别方法与系统及基于语音指令的控制方法与系统 |
CN111918213A (zh) * | 2020-07-13 | 2020-11-10 | 江苏开沃汽车有限公司 | 一种智能车载互联系统 |
CN112017646A (zh) * | 2020-08-21 | 2020-12-01 | 博泰车联网(南京)有限公司 | 一种语音处理方法、装置及计算机存储介质 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7734470B2 (en) * | 2006-05-22 | 2010-06-08 | Accenture Global Services Gmbh | Interactive voice response system |
-
2021
- 2021-07-22 CN CN202110833042.3A patent/CN113571042B/zh active Active
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103714140A (zh) * | 2013-12-23 | 2014-04-09 | 北京锐安科技有限公司 | 一种基于主题网络爬虫的搜索方法及装置 |
CN103810292A (zh) * | 2014-02-28 | 2014-05-21 | 北京理工大学 | 一种图形界面的配置方法及装置 |
CN106601232A (zh) * | 2017-01-04 | 2017-04-26 | 江西沃可视发展有限公司 | 一种基于语音识别的车载终端人机交互系统 |
CN108008885A (zh) * | 2017-11-15 | 2018-05-08 | 中国航空无线电电子研究所 | 指令式语音控制语法文件辅助生成系统 |
CN109522083A (zh) * | 2018-11-27 | 2019-03-26 | 四川长虹电器股份有限公司 | 一种页面智能化响应交互系统及方法 |
CN111128171A (zh) * | 2019-12-31 | 2020-05-08 | 云知声智能科技股份有限公司 | 一种基于语音识别的设置方法及装置 |
CN111627435A (zh) * | 2020-04-30 | 2020-09-04 | 长城汽车股份有限公司 | 语音识别方法与系统及基于语音指令的控制方法与系统 |
CN111918213A (zh) * | 2020-07-13 | 2020-11-10 | 江苏开沃汽车有限公司 | 一种智能车载互联系统 |
CN112017646A (zh) * | 2020-08-21 | 2020-12-01 | 博泰车联网(南京)有限公司 | 一种语音处理方法、装置及计算机存储介质 |
Non-Patent Citations (2)
Title |
---|
出行者信息服务系统中后台语音识别系统的研究;秦楠;高军伟;刘新;于侃;;交通标准化(Z1);全文 * |
语音控制的多功能车载终端系统的设计与实现;夏峰;陆珂伟;陈启军;;机电一体化(08);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN113571042A (zh) | 2021-10-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111261144B (zh) | 一种语音识别的方法、装置、终端以及存储介质 | |
CN106878566B (zh) | 语音操控方法、移动终端装置及语音操控系统 | |
CA2756140C (en) | Service oriented speech recognition for in-vehicle automated interaction | |
CN113327609B (zh) | 用于语音识别的方法和装置 | |
US20200118545A1 (en) | Method and system for building speech recognizer, and speech recognition method and system | |
WO2009140884A1 (zh) | 一种车载语音交互系统 | |
CN1959628A (zh) | 一种人机交互导航系统 | |
CN112735418B (zh) | 一种语音交互的处理方法、装置、终端及存储介质 | |
CN201919034U (zh) | 基于网络的语音提醒的系统 | |
CN110992955A (zh) | 一种智能设备的语音操作方法、装置、设备及存储介质 | |
GB2423403A (en) | Distributed language processing system and method of outputting an intermediary signal | |
EP3550449A1 (en) | Search method and electronic device using the method | |
CN113571042B (zh) | 一种用于车载式语音识别系统 | |
KR20210001082A (ko) | 사용자 발화를 처리하는 전자 장치와 그 동작 방법 | |
CN116955568A (zh) | 基于使用手册的问答方法、装置、电子设备及存储介质 | |
CN101645716B (zh) | 一种具有语音识别功能的车载通讯系统及其识别方法 | |
CN102571882A (zh) | 基于网络的语音提醒的方法和系统 | |
CN201054644Y (zh) | 具有语音识别及翻译功能的移动终端 | |
CN114360510A (zh) | 一种语音识别方法和相关装置 | |
CN113076397A (zh) | 意图识别方法、装置、电子设备及存储介质 | |
US20200321006A1 (en) | Agent apparatus, agent apparatus control method, and storage medium | |
US20040143436A1 (en) | Apparatus and method of processing natural language speech data | |
CN102542705A (zh) | 语音提醒的方法和系统 | |
CN114999496A (zh) | 音频传输方法、控制设备及终端设备 | |
US20020077814A1 (en) | Voice recognition system method and apparatus |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |