CN111933139A - 一种离在线语音识别方法及系统 - Google Patents
一种离在线语音识别方法及系统 Download PDFInfo
- Publication number
- CN111933139A CN111933139A CN202010841883.4A CN202010841883A CN111933139A CN 111933139 A CN111933139 A CN 111933139A CN 202010841883 A CN202010841883 A CN 202010841883A CN 111933139 A CN111933139 A CN 111933139A
- Authority
- CN
- China
- Prior art keywords
- voice
- local
- chip
- transmission module
- network
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 14
- 230000005540 biological transmission Effects 0.000 claims abstract description 21
- 230000007547 defect Effects 0.000 abstract description 7
- 230000003993 interaction Effects 0.000 abstract description 7
- 238000010586 diagram Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000008094 contradictory effect Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000005055 memory storage Effects 0.000 description 1
- 230000005236 sound signal Effects 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
Abstract
一种离在线语音识别方法,包括如下步骤:与语音控制设备连接的语音本地识别芯片识别语音信号,并解析为数字信号;本地识别芯片对数字信号与离线命令词库进行比对,如果识别出离线命令词,则执行命令;如果未识别出离线命令词,则将解析的数字信号通过传输模块发送到网络,由与网络连接的网络服务器进行识别。本发明还公开了一种离在线语音识别系统。本发明克服了以往两种语音识别各自的缺陷,将离线语音识别和在线语音识别结合,解决了离线和在线语音识别的缺点,使语音识别快速流畅、交互自然。
Description
技术领域
本发明属于人工智能技术领域,涉及语音识别,具体涉及一种离在线语音识别方法及系统。
背景技术
目前语音识别作为一种常用的人机交互技术,已广泛应用于各类电子产品中,以其自然方便的交互方式收到了消费者的喜爱,逐渐成为了智能产品时代的主流交互控制方式。
语音识别目前主要有两类方式,一类是在线的自由对讲方式,用户使用时可以随意讲话,由产品设备采集到用户讲话内容,通过网络上传到云端服务器进行语义分析理解,解析出用户的用意,再通过网络传到产品设备中进行相应的操作控制,这种方式优点在于用户可自由讲话,比较接近人们的日常生活习惯,但缺点在于需要网络才能使用,且因涉及到需要上传语音数据,安全性较差,另外网络具有延时,网络识别的产品需要等待网络识别的结果需要花费的时间就较多,另一类语音识别的方式,即通过离线的语音控制命令词的识别,进行产品设备的功能控制,该类方式无需使用网络,具有响应速度快,控制简单等优点,但需要事先设定好语音控制命令词,产品设备需识别到完整的语音控制命令词后才会响应,两种方式各有优缺点。
发明内容
为克服现有技术存在的缺陷,本发明公开了一种离在线语音识别方法及系统。
本发明所述离在线语音识别方法,包括如下步骤:
S1.与语音控制设备连接的语音本地识别芯片识别语音信号,并解析为数字信号;
S2.本地识别芯片对数字信号与离线命令词库进行比对,如果识别出离线命令词,则执行命令;
S3.如果未识别出离线命令词,则将解析的数字信号通过传输模块发送到网络,由与网络连接的网络服务器进行识别;
S4.如果网络服务器识别出属于在线命令词,则通过传输模块将识别出的在线命令词反馈到本地识别芯片,本地识别芯片控制设备执行命令;
S5.如果网络服务器识别出不属于在线命令词,则反馈未识别出的结果到本地识别芯片,本地识别芯片做出提示。
优选的:执行命令的同时作出语音播报提示。
优选的:所述传输模块为WIFI模块。
优选的:步骤S4中,将通过传输模块反馈的在线命令词存储到在线命令词库。
本发明还公开了一种离在线语音识别系统,包括与语音控制设备连接的语音本地识别芯片及与语音本地识别芯片连接的传输模块和麦克风,所述传输模块可连接网络,所述语音本地识别芯片连接有存储器,所述存储器包括离线命令词库。
优选的:所述传输模块为WIFI模块。
优选的:还包括与语音本地识别芯片连接的喇叭。
优选的:所述语音本地识别芯片为CI1103。
本发明克服了以往两种语音识别各自的缺陷,将离线语音识别和在线语音识别结合,解决了离线和在线语音识别的缺点,使语音识别快速流畅、交互自然。
附图说明
图1是本发明所述识别方法的一个具体实施方式示意图;
图2是本发明所述离在线语音识别系统的一个具体实施方式示意图。
具体实施方式
下面对本发明的具体实施方式作进一步的详细说明。
本发明所述离在线语音识别方法,包括如下步骤:与语音控制设备连接的语音本地识别芯片识别语音信号,并解析为数字信号;
本发明所述语音本地识别芯片,具备语音信号的本地识别功能,例如 CI1103芯片,CI1103是成都启英泰伦公司量产的语音本地识别芯片,可以进行本地识别,无需将音频信号传输到其他服务器或云端进行,从而可以在网络不好的环境实现本地语音识别,将语音信号解析为数字信号。CI1103还具备数据处理能力,可以输出多个模拟或数字信号控制其他语音控制设备或器件,麦克风信号直接通过对应的音频输入接口输入到CI1103芯片。CI1102利用自身集成的处理器、音频编码解码器、I/O接口和多路ADC通道,可以直接对常规电路元件如按键,喇叭,LED显示灯,等进行信号转换、交互和控制。
语音信号根据语音解析要求解析得到的数字信号可以通过比对进行快速识别,解析的数字信号数据量相对原始语音信号数据量大幅减小,可以通过无线传输网络如WIFI等快速收发。
语音本地识别芯片连接的存储器存储器包括离线命令词库和在线命令词库,本地识别芯片解析成数字信号后,与离线命令词库中预存的离线命令词进行比对,如果识别出离线命令词,则发出该离线命令词对应的指令到语音控制设备,驱动语音控制设备执行命令;并可以通过喇叭播报执行命令词,例如通过喇叭播放“打开空调”。
如果未识别出离线命令词,则将解析的数字信号通过传输模块发送到网络,由与网络连接的网络服务器进行识别;例如可以通过WIFI模块发送到无线通信网络。
如果网络服务器识别出属于在线命令词,则通过传输模块将识别出的在线命令词反馈到本地识别芯片,本地识别芯片发出该在线命令词对应的指令到语音控制设备,驱动语音控制设备执行命令,并同步播报提示,例如通过喇叭播放“定时1小时”。
可以将网络反馈回的在线命令词存储到在线命令词库,并利用在线命令词库对离线命令词库进行更新,使识别后的在线命令词被存储到离线命令词库中,提高离线命令词数量,减少对网络的调用和依赖。
如果网络服务器识别出不属于在线命令词,则反馈未识别出的结果到本地识别芯片,本地识别芯片做出提示,例如可以播报“未识别出命令”。
本发明所述的离在线语音识别方法,可以基于一种离在线语音识别系统,如图2所示,包括与语音控制设备连接的语音本地识别芯片及与语音本地识别芯片连接的传输模块和麦克风,所述传输模块可连接网络,所述语音本地识别芯片连接有存储器,所述存储器包括离线命令词库和在线命令词库。
优选的:所述传输模块为WIFI模块。还包括与语音本地识别芯片连接的喇叭,可以利用喇叭播报提示音。。
本发明克服了以往两种语音识别各自的缺陷,将离线语音识别和在线语音识别结合,解决了离线和在线语音识别的缺点,使语音识别快速流畅、交互自然。
前文所述的为本发明的各个优选实施例,各个优选实施例中的优选实施方式如果不是明显自相矛盾或以某一优选实施方式为前提,各个优选实施方式都可以任意叠加组合使用,所述实施例以及实施例中的具体参数仅是为了清楚表述发明人的发明验证过程,并非用以限制本发明的专利保护范围,本发明的专利保护范围仍然以其权利要求书为准,凡是运用本发明的说明书内容所作的等同结构变化,同理均应包含在本发明的保护范围内。
Claims (8)
1.一种离在线语音识别方法,其特征在于,包括如下步骤:
S1.与语音控制设备连接的语音本地识别芯片识别语音信号,并解析为数字信号;
S2.本地识别芯片对数字信号与离线命令词库进行比对,如果识别出离线命令词,则执行命令;
S3.如果未识别出离线命令词,则将解析的数字信号通过传输模块发送到网络,由与网络连接的网络服务器进行识别;
S4.如果网络服务器识别出属于在线命令词,则通过传输模块将识别出的在线命令词反馈到本地识别芯片,本地识别芯片控制设备执行命令;
S5.如果网络服务器识别出不属于在线命令词,则反馈未识别出的结果到本地识别芯片,本地识别芯片做出提示。
2.根据权利要求1所述的离在线语音识别方法,其特征在于:执行命令的同时作出语音播报提示。
3.根据权利要求1所述的离在线语音识别方法,其特征在于:所述传输模块为WIFI模块。
4.根据权利要求1所述的离在线语音识别方法,其特征在于:步骤S4中,将通过传输模块反馈的在线命令词存储到在线命令词库。
5.一种离在线语音识别系统,其特征在于:包括与语音控制设备连接的语音本地识别芯片及与语音本地识别芯片连接的传输模块和麦克风,所述传输模块可连接网络,所述语音本地识别芯片连接有存储器,所述存储器包括离线命令词库。
6.根据权利要求5所述的离在线语音识别系统,其特征在于:所述传输模块为WIFI模块。
7.根据权利要求5所述的离在线语音识别系统,其特征在于:还包括与语音本地识别芯片连接的喇叭。
8.根据权利要求5所述的离在线语音识别系统,其特征在于:所述语音本地识别芯片为CI1103。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010841883.4A CN111933139A (zh) | 2020-08-20 | 2020-08-20 | 一种离在线语音识别方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010841883.4A CN111933139A (zh) | 2020-08-20 | 2020-08-20 | 一种离在线语音识别方法及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111933139A true CN111933139A (zh) | 2020-11-13 |
Family
ID=73305915
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010841883.4A Pending CN111933139A (zh) | 2020-08-20 | 2020-08-20 | 一种离在线语音识别方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111933139A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113658601A (zh) * | 2021-08-18 | 2021-11-16 | 开放智能机器(上海)有限公司 | 语音交互方法、装置、终端设备、存储介质及程序产品 |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN204695292U (zh) * | 2015-05-29 | 2015-10-07 | 深圳市锐曼智能装备有限公司 | 机器人基于对话预测的在线与离线的识别切换装置 |
CN106851927A (zh) * | 2017-04-19 | 2017-06-13 | 慈溪锐恩电子科技有限公司 | 一种语音识别的多路调光调色led驱动电路 |
CN107146617A (zh) * | 2017-06-15 | 2017-09-08 | 成都启英泰伦科技有限公司 | 一种新型语音识别设备及方法 |
CN107274902A (zh) * | 2017-08-15 | 2017-10-20 | 深圳诺欧博智能科技有限公司 | 用于家电的语音控制装置和方法 |
CN107371295A (zh) * | 2017-06-29 | 2017-11-21 | 中山烨美电子有限公司 | 一种 led 照明语音控制系统及其语音控制方法 |
CN109147788A (zh) * | 2018-10-19 | 2019-01-04 | 珠海格力电器股份有限公司 | 本地语音库的更新方法及装置 |
CN109410950A (zh) * | 2018-10-17 | 2019-03-01 | 百度在线网络技术(北京)有限公司 | 一种烹饪设备的语音控制方法及系统 |
CN109859758A (zh) * | 2019-03-26 | 2019-06-07 | 成都启英泰伦科技有限公司 | 一种语音识别控制电路 |
CN110099295A (zh) * | 2019-05-30 | 2019-08-06 | 深圳创维-Rgb电子有限公司 | 电视机语音控制方法、装置、设备及存储介质 |
CN111292750A (zh) * | 2020-03-09 | 2020-06-16 | 成都启英泰伦科技有限公司 | 一种基于云端改善的本地语音识别方法 |
-
2020
- 2020-08-20 CN CN202010841883.4A patent/CN111933139A/zh active Pending
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN204695292U (zh) * | 2015-05-29 | 2015-10-07 | 深圳市锐曼智能装备有限公司 | 机器人基于对话预测的在线与离线的识别切换装置 |
CN106851927A (zh) * | 2017-04-19 | 2017-06-13 | 慈溪锐恩电子科技有限公司 | 一种语音识别的多路调光调色led驱动电路 |
CN107146617A (zh) * | 2017-06-15 | 2017-09-08 | 成都启英泰伦科技有限公司 | 一种新型语音识别设备及方法 |
CN107371295A (zh) * | 2017-06-29 | 2017-11-21 | 中山烨美电子有限公司 | 一种 led 照明语音控制系统及其语音控制方法 |
CN107274902A (zh) * | 2017-08-15 | 2017-10-20 | 深圳诺欧博智能科技有限公司 | 用于家电的语音控制装置和方法 |
CN109410950A (zh) * | 2018-10-17 | 2019-03-01 | 百度在线网络技术(北京)有限公司 | 一种烹饪设备的语音控制方法及系统 |
CN109147788A (zh) * | 2018-10-19 | 2019-01-04 | 珠海格力电器股份有限公司 | 本地语音库的更新方法及装置 |
CN109859758A (zh) * | 2019-03-26 | 2019-06-07 | 成都启英泰伦科技有限公司 | 一种语音识别控制电路 |
CN110099295A (zh) * | 2019-05-30 | 2019-08-06 | 深圳创维-Rgb电子有限公司 | 电视机语音控制方法、装置、设备及存储介质 |
CN111292750A (zh) * | 2020-03-09 | 2020-06-16 | 成都启英泰伦科技有限公司 | 一种基于云端改善的本地语音识别方法 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113658601A (zh) * | 2021-08-18 | 2021-11-16 | 开放智能机器(上海)有限公司 | 语音交互方法、装置、终端设备、存储介质及程序产品 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111223497A (zh) | 一种终端的就近唤醒方法、装置、计算设备及存储介质 | |
CN106409283B (zh) | 基于音频的人机混合交互系统及方法 | |
EP0653701B1 (en) | Method and system for location dependent verbal command execution in a computer based control system | |
US20140309996A1 (en) | Voice control method and mobile terminal apparatus | |
US20060074658A1 (en) | Systems and methods for hands-free voice-activated devices | |
CN111161714B (zh) | 一种语音信息处理方法、电子设备及存储介质 | |
CN112201246B (zh) | 基于语音的智能控制方法、装置、电子设备及存储介质 | |
WO2017128775A1 (zh) | 一种语音控制系统、语音处理方法及终端设备 | |
CN103491411A (zh) | 基于语言推荐频道的方法及其装置 | |
CN106847291A (zh) | 一种本地和云端相结合的语音识别系统及方法 | |
CN110875045A (zh) | 一种语音识别方法、智能设备和智能电视 | |
WO2020057624A1 (zh) | 语音识别的方法和装置 | |
CN111429897B (zh) | 智能家居系统控制实现方法 | |
CN109712623A (zh) | 语音控制方法、装置及计算机可读存储介质 | |
CN110992955A (zh) | 一种智能设备的语音操作方法、装置、设备及存储介质 | |
CN114172757A (zh) | 服务器、智能家居系统及多设备语音唤醒方法 | |
CN111833875B (zh) | 一种嵌入式语音交互系统 | |
CN110782897B (zh) | 一种基于自然语义编码的语音终端通信方法及系统 | |
CN101266791A (zh) | 协同识别语音命令的方法及其相关系统 | |
CN113611306A (zh) | 基于用户习惯的智能家居语音控制方法、系统及存储介质 | |
CN111933139A (zh) | 一种离在线语音识别方法及系统 | |
KR20200045851A (ko) | 음성 인식 서비스를 제공하는 전자 장치 및 시스템 | |
CN111581919B (zh) | 一种任务处理方法及装置 | |
CN114999496A (zh) | 音频传输方法、控制设备及终端设备 | |
US20040143436A1 (en) | Apparatus and method of processing natural language speech data |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20201113 |
|
RJ01 | Rejection of invention patent application after publication |