CN112511589A - 建立在云计算语音识别基础上的汽车电子说明书系统 - Google Patents
建立在云计算语音识别基础上的汽车电子说明书系统 Download PDFInfo
- Publication number
- CN112511589A CN112511589A CN202011150937.9A CN202011150937A CN112511589A CN 112511589 A CN112511589 A CN 112511589A CN 202011150937 A CN202011150937 A CN 202011150937A CN 112511589 A CN112511589 A CN 112511589A
- Authority
- CN
- China
- Prior art keywords
- manual
- data
- cloud
- processing unit
- central processing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000012545 processing Methods 0.000 claims abstract description 50
- 230000008676 import Effects 0.000 claims abstract description 8
- 238000013461 design Methods 0.000 claims description 4
- 238000013459 approach Methods 0.000 claims description 3
- 238000007405 data analysis Methods 0.000 claims description 3
- 230000009977 dual effect Effects 0.000 claims description 3
- 238000000605 extraction Methods 0.000 claims description 3
- 230000005055 memory storage Effects 0.000 claims description 3
- 230000011218 segmentation Effects 0.000 claims description 3
- 238000012163 sequencing technique Methods 0.000 claims description 3
- 238000012549 training Methods 0.000 claims description 3
- 238000000034 method Methods 0.000 abstract description 6
- 230000008569 process Effects 0.000 abstract description 5
- 230000008859 change Effects 0.000 abstract description 3
- 238000009434 installation Methods 0.000 abstract description 3
- 238000010586 diagram Methods 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 4
- 230000003321 amplification Effects 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000003199 nucleic acid amplification method Methods 0.000 description 2
- 238000004378 air conditioning Methods 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000013480 data collection Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000002265 prevention Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000005236 sound signal Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/01—Protocols
- H04L67/10—Protocols in which an application is distributed across nodes in the network
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
- G10L15/34—Adaptation of a single recogniser for parallel processing, e.g. by use of multiple processors or cloud computing
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Signal Processing (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Computer Networks & Wireless Communication (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Navigation (AREA)
Abstract
本发明涉及语音识别技术领域,具体为包括硬件载体设备、和手册云端中央处理器,手册云端中央处理器输入端信号连接用户端数据采集模块的输出端,且手册云端中央处理器输出端电路连接车机端数据输出模块的输入端,手册云端中央处理器包括数据处理、模型建立和内容呈现,数据处理包括手册说明书、数据处理流程、建立数据库和数据导入,本发明提供的这款汽车电子说明书,将迎合人们的习惯,本产品主要以软件形式供给车辆使用者安装后使用,最恰当的形式,是以主机厂为主导,直接在前装过程植入到车载导航中,产品安装以后,通过设置方向盘快捷按键,或者是设置唤醒热词即可以唤醒使用,使用中,允许用户根据自己的喜好对唤醒词进行更改。
Description
技术领域
本发明涉及语音识别技术领域,具体为建立在云计算语音识别基础上的汽车电子说明书系统。
背景技术
近年来,汽车行业里,“智能座舱”这个词出现的频率越来越高,很多新的车辆配件,都在往智能方向发展,比如:汽车仪表、汽车多媒体、防疲劳驾驶设备等产品都大量应用了人工智能技术成果,近年来随着我国汽车行业的迅速发展,汽车电子市场迅速扩大,整个市场以超过40%的比例快速增长,其车身电子产品占到整个汽车电子产品的35%~40%。在目前,车身电子的热点应用排名前三的是车载空调、车窗控制和车灯控制。在车身电子中,对半导体需求量排列前三位的应用领域分别是:车载空调,约占44%;车窗控制,约占22%;车灯控制,约占10%,第四位是电动车门控制。
如今,随着AI技术的不断应用,语音识别技术得到了长足的发展,各种场景不断涌现,百度AI音箱、华为AI音箱都是很优秀的体现!而如果我们将语音识别技术应用到汽车使用说明书上来,在汽车多媒体中叠加AI汽车语音说明书,那么人们在驾驶过程中,不管遇到什么问题,张口就问,且能得到专家级别的回复,立马可以解决问题,车辆的使用将会变得更加的方便,现有技术中专利文件申请号202010168218.3,公布的一种实现AI互动的汽车智能交互系统,和申请号201910429311.2公布的基于生物识别技术的汽车防盗与安全驾驶系统及方法,均存在技术上的改进创新需求,为此我们提供了建立在云计算语音识别基础上的汽车电子说明书系统。
发明内容
本发明的目的在于提供建立在云计算语音识别基础上的汽车电子说明书系统,以解决上述背景技术中提出的问题。
为实现上述目的,本发明提供如下技术方案:包括硬件载体设备、和手册云端中央处理器,所述手册云端中央处理器输入端信号连接用户端数据采集模块的输出端,且手册云端中央处理器输出端电路连接车机端数据输出模块的输入端,所述手册云端中央处理器包括数据处理、模型建立和内容呈现,所述数据处理包括手册说明书、数据处理流程、建立数据库和数据导入,所述手册说明书输出端信号连接数据处理流程的输入端,数据处理流程的输出端分别信号连接建立数据库的输入端和数据导入的输入端。
优选的,所述用户端数据采集模块包括音频输入、音频处理、文本识别和意图识别。
优选的,所述数据处理流程包括数据整理、数据分析、句式提炼、图片处理、用语设计和场景划分。
优选的,所述模型建立包括手册数据库、搜索、分词、模型训练、NLP语意建立、场景理解和智能排序。
优选的,硬件载体设备包括Android 4.0以上操作系统、运行内存:DDR要求≥1GB、存贮内存:EMMC要求≥16GB和语音输入:双MIC差分输入方式。
优选的,用户端数据采集模块设置在声音收集载体上,声音收集载体包括驾驶室内仪表盘声音采集装置、车内顶棚均匀布设的声音采集装置和座椅靠背上声音采集装置。
与现有技术相比,本发明的有益效果是:
1.本发明提供的这款汽车电子说明书,将迎合人们的习惯,当人们发现某项汽车功能不会,或者汽车出现某种故障时,张口就问,该AI则能随时解答问题,满足人们的实际需求,提升生活的品质质量;
2.本产品主要以软件形式供给车辆使用者安装后使用,最恰当的形式,是以主机厂为主导,直接在前装过程植入到车载导航中,产品安装以后,通过设置方向盘快捷按键,或者是设置唤醒热词即可以唤醒使用,使用中,允许用户根据自己的喜好对唤醒词进行更改。
附图说明
图1为本发明流程示意图;
图2为本发明结构示意图;
图3为数据处理模块结构示意图;
图4为用户端数据采集模块示意图;
图5为数据处理流程结构示意图;
图6为模型建立结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的技术方案,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参阅图1至图6,本发明提供一种技术方案:建立在云计算语音识别基础上的汽车电子说明书系统,包括硬件载体设备、和手册云端中央处理器,手册云端中央处理器输入端信号连接用户端数据采集模块的输出端,且手册云端中央处理器输出端电路连接车机端数据输出模块的输入端,手册云端中央处理器包括数据处理、模型建立和内容呈现,数据处理包括手册说明书、数据处理流程、建立数据库和数据导入,手册说明书输出端信号连接数据处理流程的输入端,数据处理流程的输出端分别信号连接建立数据库的输入端和数据导入的输入端。
用户端数据采集模块包括音频输入、音频处理、文本识别和意图识别。
数据处理流程包括数据整理、数据分析、句式提炼、图片处理、用语设计和场景划分。
模型建立包括手册数据库、搜索、分词、模型训练、NLP语意建立、场景理解和智能排序。
硬件载体设备包括Android 4.0以上操作系统、运行内存:DDR要求≥1GB、存贮内存:EMMC要求≥16GB和语音输入:双MIC差分输入方式。
用户端数据采集模块设置在声音收集载体上,声音收集载体包括驾驶室内仪表盘声音采集装置、车内顶棚均匀布设的声音采集装置和座椅靠背上声音采集装置。
考虑到现在多数车辆都配置有安卓车载导航系统,或者用户已有智能手机系统,因此从节约成本出发,本产品主要以软件形式供给车辆使用者安装后使用,最恰当的形式,是以主机厂为主导,直接在前装过程植入到车载导航中,产品安装以后,通过设置方向盘快捷按键,或者是设置唤醒热词即可以唤醒使用,使用中,允许用户根据自己的喜好对唤醒词进行更改。
该产品是一个庞大的系统工程,从语音侦听到语音识别,再从数据库中找到对应的项目,再到使用TTS(text to speak)进行语音播报,将耗费很多硬件资源,考虑到硬件资源的局限性,我们设计的产品将部分功能转移到云端。
在车机端只有图形用户接口(GUI——Graphical User Interface)以及语音用户接口(VUI——Voice User Interface)只给用户呈现图形及语音播报,而工作量最大的语音识别以及数据库运算,都放到云服务器上,这样即保证的产品的性能,又节省了硬件资源。当然,在这种模式下,用户必须保证车载设备要随时与网络进行连接,随着5G网络时代的到来,流量成本已不再是问题。
车内设置声音采集装置,采集所录制声音的模拟信号,麦克风的麦克头将用声音衰减材料进行隔离,把通过机壳传导的声音进行有效衰减;音频放大模块:将由麦克风采集的模拟信号进行放大处理;模/数转换模块:将经放大处理的模拟信号转换为数字信号传送至数字音频处理模块;音频处理模块:将数字信号通过软件将车辆震动及怠速时产生的低频抖动声音进行过滤处理;存储模块:对经过音频处理模块处理的数字信号进行存储。
工作原理:在车载端,由于车内环境噪声很大,因此系统里布置了双MIC话筒,通过差分电路进行音频放大,从而向语音识别系统提供清晰的讲话声音,这样的设计可以保证,即使车内在播放强劲的音乐,也可以将驾驶员的讲话声有效地进行提取。根据声音的波长进行计算,两个MIC的间距布置在12——16cm之间,这样可以保证差分的效果为最佳,清晰的音频信号提取后,程序通过网络上传到云服务器,云服务器上的应用程序进行分析,提取语意,并从中得到关键词,再从数据库中的模型里得到对应的场景,转换成对应的逻辑关系下发到车载端,车载端再从数据库中比对出正确的数据,调出已设计好的图形进行显示,同时把数据库中的文字转化成语音进行播报,从而完成整个对话过程。
尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。
Claims (6)
1.建立在云计算语音识别基础上的汽车电子说明书系统,包括硬件载体设备、和手册云端中央处理器,其特征在于:所述手册云端中央处理器输入端信号连接用户端数据采集模块的输出端,且手册云端中央处理器输出端电路连接车机端数据输出模块的输入端,所述手册云端中央处理器包括数据处理、模型建立和内容呈现,所述数据处理包括手册说明书、数据处理流程、建立数据库和数据导入,所述手册说明书输出端信号连接数据处理流程的输入端,数据处理流程的输出端分别信号连接建立数据库的输入端和数据导入的输入端。
2.根据权利要求1所述的建立在云计算语音识别基础上的汽车电子说明书系统,其特征在于:所述用户端数据采集模块包括音频输入、音频处理、文本识别和意图识别。
3.根据权利要求1所述的建立在云计算语音识别基础上的汽车电子说明书系统,其特征在于:所述数据处理流程包括数据整理、数据分析、句式提炼、图片处理、用语设计和场景划分。
4.根据权利要求1所述的建立在云计算语音识别基础上的汽车电子说明书系统,其特征在于:所述模型建立包括手册数据库、搜索、分词、模型训练、NLP语意建立、场景理解和智能排序。
5.根据权利要求1所述的建立在云计算语音识别基础上的汽车电子说明书系统,其特征在于:硬件载体设备包括Android 4.0以上操作系统、运行内存:DDR要求≥1GB、存贮内存:EMMC要求≥16GB和语音输入:双MIC差分输入方式。
6.根据权利要求1所述的建立在云计算语音识别基础上的汽车电子说明书系统,其特征在于:用户端数据采集模块设置在声音收集载体上,声音收集载体包括驾驶室内仪表盘声音采集装置、车内顶棚均匀布设的声音采集装置和座椅靠背上声音采集装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011150937.9A CN112511589A (zh) | 2020-10-24 | 2020-10-24 | 建立在云计算语音识别基础上的汽车电子说明书系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011150937.9A CN112511589A (zh) | 2020-10-24 | 2020-10-24 | 建立在云计算语音识别基础上的汽车电子说明书系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112511589A true CN112511589A (zh) | 2021-03-16 |
Family
ID=74954669
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011150937.9A Pending CN112511589A (zh) | 2020-10-24 | 2020-10-24 | 建立在云计算语音识别基础上的汽车电子说明书系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112511589A (zh) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109584873A (zh) * | 2018-12-13 | 2019-04-05 | 北京极智感科技有限公司 | 一种车载语音系统的唤醒方法、装置、可读介质及设备 |
CN110488978A (zh) * | 2019-08-22 | 2019-11-22 | 大陆投资(中国)有限公司 | 车辆驾驶舱系统和使用说明交互设备与方法 |
CN111488427A (zh) * | 2019-01-25 | 2020-08-04 | 阿里巴巴集团控股有限公司 | 车辆交互方法、车辆交互系统、计算设备及存储介质 |
-
2020
- 2020-10-24 CN CN202011150937.9A patent/CN112511589A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109584873A (zh) * | 2018-12-13 | 2019-04-05 | 北京极智感科技有限公司 | 一种车载语音系统的唤醒方法、装置、可读介质及设备 |
CN111488427A (zh) * | 2019-01-25 | 2020-08-04 | 阿里巴巴集团控股有限公司 | 车辆交互方法、车辆交互系统、计算设备及存储介质 |
CN110488978A (zh) * | 2019-08-22 | 2019-11-22 | 大陆投资(中国)有限公司 | 车辆驾驶舱系统和使用说明交互设备与方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10290300B2 (en) | Text rule multi-accent speech recognition with single acoustic model and automatic accent detection | |
CN106790938B (zh) | 一种基于人工智能的人机交互车载系统 | |
CN111161714B (zh) | 一种语音信息处理方法、电子设备及存储介质 | |
WO2009140884A1 (zh) | 一种车载语音交互系统 | |
CN113345433A (zh) | 一种车外语音交互系统 | |
CN110544478A (zh) | 驾驶舱智能远场语音交互的系统及方法 | |
CN108556986A (zh) | 一种中控系统及车辆 | |
CN105632521A (zh) | 一种基于汽车的随机音源自动声音控制装置 | |
CN114148254B (zh) | 一种汽车低速提示音实现系统 | |
CN112309395A (zh) | 人机对话方法、装置、机器人、计算机设备和存储介质 | |
CN110460921A (zh) | 一种拾音控制方法、装置、车辆和存储介质 | |
CN111696539A (zh) | 对内部通话主动降噪的语音交互系统及车辆 | |
CN110696756A (zh) | 一种车辆的音量控制方法及装置、汽车、存储介质 | |
CN111833875A (zh) | 一种嵌入式语音交互系统 | |
CN114312558A (zh) | 一种用于在汽车上实现低速提示音avas和主动声增强ase的系统 | |
CN114724566A (zh) | 语音处理方法、装置、存储介质及电子设备 | |
CN114103850B (zh) | 一种实现汽车主动声增强的系统 | |
CN111833870A (zh) | 车载语音系统的唤醒方法、装置、车辆和介质 | |
CN114523900A (zh) | 一种集成行人警示音与引擎声浪功能的控制系统及方法 | |
CN112511589A (zh) | 建立在云计算语音识别基础上的汽车电子说明书系统 | |
CN110111791A (zh) | 一种基于车载智能网联的语音识别系统 | |
CN110525450A (zh) | 一种调节车载语音灵敏度的方法及系统 | |
CN113571042A (zh) | 一种用于车载式语音识别系统 | |
CN205376126U (zh) | 汽车用语音记录本系统 | |
CN206441536U (zh) | 一种基于人脸识别的主动语音助手 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20210316 |