CN111081248A - 一种人工智能语音识别装置 - Google Patents
一种人工智能语音识别装置 Download PDFInfo
- Publication number
- CN111081248A CN111081248A CN201911380685.6A CN201911380685A CN111081248A CN 111081248 A CN111081248 A CN 111081248A CN 201911380685 A CN201911380685 A CN 201911380685A CN 111081248 A CN111081248 A CN 111081248A
- Authority
- CN
- China
- Prior art keywords
- module
- voice
- response
- output
- instruction
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000013473 artificial intelligence Methods 0.000 title claims abstract description 13
- 230000004044 response Effects 0.000 claims abstract description 67
- 238000000034 method Methods 0.000 claims abstract description 25
- 238000005516 engineering process Methods 0.000 description 9
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/225—Feedback of the input speech
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Telephonic Communication Services (AREA)
Abstract
本发明涉及智能语音识别技术领域,尤其是一种人工智能语音识别装置,包括依次相连的语音输入模块、语音接收模块、判断模块和响应模块,输入模块的输出端与语音接收模块的输入端相连,用于接收使用者的语音指令并输送至语音接收模块,判断模块用于对语音接收模块接收并转化完成的指令进行判断、分析,然后将正确的指令输出至响应模块中,由响应模块对语音指令作出响应。在人工智能语音识别系统运行时,通过对语音指令的输入过程进行间隔判断,有效的保证了语音输入指令与接收到的语音指令对应、无误,同时通过应答模块的反馈,进一步保证了该系统运行后输出信息的准确性。
Description
技术领域
本发明涉及智能语音识别技术领域,尤其涉及一种人工智能语音识别装置。
背景技术
人工智能英文缩写为AI,它是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学,而智能语音技术,是实现人机语言的通信,包括语音识别技术和语音合成技术,随着信息技术的发展,智能语音技术已经成为人们信息获取和沟通最便捷、最有效的手段。
在人工智能语音识别技术应用在机器设备上时,虽然利用识别技术可以将使用者发送的语音指令转化为对应的机器语言并转化、输出进行应答,但是在识别和转化过程中,极容易因语音指令的歧义导致指令错误,影响人工智能语音识别装置的正常工作。
发明内容
本发明的目的是为了解决现有技术中的人工智能语音识别技术应用在机器设备上时,虽然利用识别技术可以将使用者发送的语音指令转化为对应的机器语言并转化、输出进行应答,但是在识别和转化过程中,极容易因语音指令的歧义导致指令错误,影响人工智能语音识别装置的正常工作的缺点,而提出的一种人工智能语音识别装置。
为了实现上述目的,本发明采用了如下技术方案:
设计一种人工智能语音识别装置,包括依次相连的语音输入模块、语音接收模块、判断模块和响应模块;
输入模块的输出端与语音接收模块的输入端相连,用于接收使用者的语音指令并输送至语音接收模块;
判断模块用于对语音接收模块接收并转化完成的指令进行判断、分析,然后将正确的指令输出至响应模块中,由响应模块对语音指令作出响应。
响应模块的响应数据经输出模块以声或形的形式输出。
优选的,所述响应模块中的过程、结果数据同步输出并储放在记忆模块中,且记忆模块中的数据输出至响应模块和判断模块。
优选的,所述判断模块主要包括计时模块,先进行时间值的预设,在语音输入的过程中,当间隔时间小于或等于预设值,则判定为间歇停顿,当间隔时间大于预设值,则判定为语音指令输入完毕,将接收到的语音指令输出至响应模块中。
优选的,判断模块至少作用于语音输入模块和语音接收模块之一。
优选的,所述响应模块包括回应模块和应答模块,且二者的输出数据均经输出模块输出;
回应模块用于对来自语音接收模块的语音指令再输出和翻译;
应答模块用于对回应模块的指令应答。
本发明提出的一种人工智能语音识别装置,有益效果在于:
在人工智能语音识别系统运行时,通过对语音指令的输入过程进行间隔判断,有效的保证了语音输入指令与接收到的语音指令对应、无误,同时通过应答模块的反馈,进一步保证了该系统运行后输出信息的准确性。
附图说明
图1为本发明的识别系统结构示意图;
图2为本发明的响应模块具体结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。
参照图1-2:
实施例一:
一种人工智能语音识别装置,包括依次相连的语音输入模块、语音接收模块、判断模块和响应模块,输入模块的输出端与语音接收模块的输入端相连,用于接收使用者的语音指令并输送至语音接收模块,判断模块用于对语音接收模块接收并转化完成的指令进行判断、分析,然后将正确的指令输出至响应模块中,由响应模块对语音指令作出响应。
在语音指令经语音输入模块输出至语音接收模块的过程中,判断模块根据语音指令的输入过程进行判断,进一步保证语音指令输出和响应的准确性。
响应模块的响应数据经输出模块以声或形的形式输出,响应模块中的响应结果数据可以语音方式或字幕显示等方式输出,只要保证正常、准确输出即可。
响应模块中的过程、结果数据同步输出并储放在记忆模块中,且记忆模块中的数据输出至响应模块和判断模块,通过将相关数据储放在记忆模块中,便于在后续语音指令输入、输出后进行判断的过程中即时对过往数据进行调用,使记忆模块形成知识库,进一步提高了后续判断模块和响应模块工作的高效性、准确性。
判断模块主要包括计时模块,先进行时间值的预设,在语音输入的过程中,当间隔时间小于或等于预设值,则判定为间歇停顿,当间隔时间大于预设值,则判定为语音指令输入完毕,将接收到的语音指令输出至响应模块中。
通过先进行预设时间的输入,假设预设时间为N,在语音指令输入的过程中,输入间隙小于或等于N继续输入时,判断为同一个语音指令且前后指令之间分隔,当输入间隙大于N时,判断为此语音指令输入完成,直接将数据输出,有效的防止在语音指令输入的过程中连词连句产生歧义,影响系统分析判断的准确性。
判断模块至少作用于语音输入模块和语音接收模块之一,在语音指令输入至运营输入模块的过程中或在语音指令经语音输入模块注入至语音接收模块的过程中,判断模块都可工作,独立工作过程可以保证判断模块的正常进行,同步工作过程近一半保证判断模块判断的准确性。
实施例二,本实施例与实施例一的区别在于:
响应模块包括回应模块和应答模块,且二者的输出数据均经输出模块输出,回应模块用于对来自语音接收模块的语音指令再输出和翻译,应答模块用于对回应模块的指令应答。
在语音指令数据输出至响应模块,响应模块响应的过程中,响应模块中的回应模块首先对接收到的指令翻译后输出,同样的输出形式可以声或形的形式,让使用者对此数据进行再判断,然后将判断无误后数据输出至应答模块,应答模块对接收到的数据进行应答,当使用者判定数据错误时,可直接终止后续应答传输并重新输入更改后的语音指令,从而进一步保证了人工智能语音识别过程的准确性。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,根据本发明的技术方案及其发明构思加以等同替换或改变,都应涵盖在本发明的保护范围之内。
Claims (5)
1.一种人工智能语音识别装置,其特征在于,包括依次相连的语音输入模块、语音接收模块、判断模块和响应模块;
输入模块的输出端与语音接收模块的输入端相连,用于接收使用者的语音指令并输送至语音接收模块;
判断模块用于对语音接收模块接收并转化完成的指令进行判断、分析,然后将正确的指令输出至响应模块中,由响应模块对语音指令作出响应。
响应模块的响应数据经输出模块以声或形的形式输出。
2.根据权利要求1所述的一种人工智能语音识别装置,其特征在于:所述响应模块中的过程、结果数据同步输出并储放在记忆模块中,且记忆模块中的数据输出至响应模块和判断模块。
3.根据权利要求1所述的一种人工智能语音识别装置,其特征在于:所述判断模块主要包括计时模块,先进行时间值的预设,在语音输入的过程中,当间隔时间小于或等于预设值,则判定为间歇停顿,当间隔时间大于预设值,则判定为语音指令输入完毕,将接收到的语音指令输出至响应模块中。
4.根据权利要求1至3任一所述的一种人工智能语音识别装置,其特征在于:判断模块至少作用于语音输入模块和语音接收模块之一。
5.根据权利要求1所述的一种人工智能语音识别装置,其特征在于:所述响应模块包括回应模块和应答模块,且二者的输出数据均经输出模块输出;
回应模块用于对来自语音接收模块的语音指令再输出和翻译;
应答模块用于对回应模块的指令应答。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911380685.6A CN111081248A (zh) | 2019-12-27 | 2019-12-27 | 一种人工智能语音识别装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911380685.6A CN111081248A (zh) | 2019-12-27 | 2019-12-27 | 一种人工智能语音识别装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111081248A true CN111081248A (zh) | 2020-04-28 |
Family
ID=70318862
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911380685.6A Pending CN111081248A (zh) | 2019-12-27 | 2019-12-27 | 一种人工智能语音识别装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111081248A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11676593B2 (en) | 2020-12-01 | 2023-06-13 | International Business Machines Corporation | Training an artificial intelligence of a voice response system based on non_verbal feedback |
Citations (23)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104412219A (zh) * | 2012-06-25 | 2015-03-11 | 谷歌公司 | 语音识别的文本输入的视觉确认 |
CN104536978A (zh) * | 2014-12-05 | 2015-04-22 | 奇瑞汽车股份有限公司 | 识别语音数据的方法和装置 |
CN105702255A (zh) * | 2016-03-28 | 2016-06-22 | 华智水稻生物技术有限公司 | 农业数据采集方法、装置及移动终端 |
CN105791931A (zh) * | 2016-02-26 | 2016-07-20 | 深圳Tcl数字技术有限公司 | 智能电视及其语音控制方法 |
CN105895079A (zh) * | 2015-12-14 | 2016-08-24 | 乐视网信息技术(北京)股份有限公司 | 语音数据的处理方法和装置 |
CN106027485A (zh) * | 2016-04-28 | 2016-10-12 | 乐视控股(北京)有限公司 | 基于语音交互的富媒体展示方法及系统 |
CN106251869A (zh) * | 2016-09-22 | 2016-12-21 | 浙江吉利控股集团有限公司 | 语音处理方法及装置 |
CN106792048A (zh) * | 2016-12-20 | 2017-05-31 | Tcl集团股份有限公司 | 一种识别智能电视用户语音命令的方法和装置 |
CN106782522A (zh) * | 2015-11-23 | 2017-05-31 | 宏碁股份有限公司 | 语音控制方法及语音控制系统 |
CN107342084A (zh) * | 2017-07-10 | 2017-11-10 | 绵阳美菱软件技术有限公司 | 一种智能冰箱及基于智能冰箱的通信方法和系统 |
CN107477793A (zh) * | 2017-08-23 | 2017-12-15 | 绵阳美菱软件技术有限公司 | 一种空气净化器、空气净化器控制系统及方法 |
CN107919130A (zh) * | 2017-11-06 | 2018-04-17 | 百度在线网络技术(北京)有限公司 | 基于云端的语音处理方法和装置 |
CN108231073A (zh) * | 2016-12-16 | 2018-06-29 | 深圳富泰宏精密工业有限公司 | 语音控制装置、系统及控制方法 |
CN108346429A (zh) * | 2017-01-22 | 2018-07-31 | 腾讯科技(深圳)有限公司 | 基于语音识别的数据传输方法和装置 |
CN108366319A (zh) * | 2018-03-30 | 2018-08-03 | 京东方科技集团股份有限公司 | 智能音箱及其语音控制方法 |
CN108922276A (zh) * | 2018-08-03 | 2018-11-30 | 上海爱护网信息科技发展股份有限公司 | 一种智能展示屏及其使用方法 |
CN109147776A (zh) * | 2017-06-19 | 2019-01-04 | 丽宝大数据股份有限公司 | 具有声控功能的显示装置及声控时机指示方法 |
CN109471687A (zh) * | 2018-09-07 | 2019-03-15 | 深圳壹账通智能科技有限公司 | 贷款业务信息处理方法、装置、存储介质及计算机设备 |
CN109545216A (zh) * | 2018-12-28 | 2019-03-29 | 合肥凯捷技术有限公司 | 一种语音识别方法和语音识别系统 |
CN109599130A (zh) * | 2018-12-10 | 2019-04-09 | 百度在线网络技术(北京)有限公司 | 收音方法、装置及存储介质 |
CN110288987A (zh) * | 2018-03-19 | 2019-09-27 | 三星电子株式会社 | 用于处理声音数据的系统和控制该系统的方法 |
CN110334242A (zh) * | 2019-07-10 | 2019-10-15 | 北京奇艺世纪科技有限公司 | 一种语音指令建议信息的生成方法、装置及电子设备 |
CN110472134A (zh) * | 2018-05-10 | 2019-11-19 | 刘新宇 | 酒店客房服务机器人及本地化服务数据信息处理系统 |
-
2019
- 2019-12-27 CN CN201911380685.6A patent/CN111081248A/zh active Pending
Patent Citations (23)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104412219A (zh) * | 2012-06-25 | 2015-03-11 | 谷歌公司 | 语音识别的文本输入的视觉确认 |
CN104536978A (zh) * | 2014-12-05 | 2015-04-22 | 奇瑞汽车股份有限公司 | 识别语音数据的方法和装置 |
CN106782522A (zh) * | 2015-11-23 | 2017-05-31 | 宏碁股份有限公司 | 语音控制方法及语音控制系统 |
CN105895079A (zh) * | 2015-12-14 | 2016-08-24 | 乐视网信息技术(北京)股份有限公司 | 语音数据的处理方法和装置 |
CN105791931A (zh) * | 2016-02-26 | 2016-07-20 | 深圳Tcl数字技术有限公司 | 智能电视及其语音控制方法 |
CN105702255A (zh) * | 2016-03-28 | 2016-06-22 | 华智水稻生物技术有限公司 | 农业数据采集方法、装置及移动终端 |
CN106027485A (zh) * | 2016-04-28 | 2016-10-12 | 乐视控股(北京)有限公司 | 基于语音交互的富媒体展示方法及系统 |
CN106251869A (zh) * | 2016-09-22 | 2016-12-21 | 浙江吉利控股集团有限公司 | 语音处理方法及装置 |
CN108231073A (zh) * | 2016-12-16 | 2018-06-29 | 深圳富泰宏精密工业有限公司 | 语音控制装置、系统及控制方法 |
CN106792048A (zh) * | 2016-12-20 | 2017-05-31 | Tcl集团股份有限公司 | 一种识别智能电视用户语音命令的方法和装置 |
CN108346429A (zh) * | 2017-01-22 | 2018-07-31 | 腾讯科技(深圳)有限公司 | 基于语音识别的数据传输方法和装置 |
CN109147776A (zh) * | 2017-06-19 | 2019-01-04 | 丽宝大数据股份有限公司 | 具有声控功能的显示装置及声控时机指示方法 |
CN107342084A (zh) * | 2017-07-10 | 2017-11-10 | 绵阳美菱软件技术有限公司 | 一种智能冰箱及基于智能冰箱的通信方法和系统 |
CN107477793A (zh) * | 2017-08-23 | 2017-12-15 | 绵阳美菱软件技术有限公司 | 一种空气净化器、空气净化器控制系统及方法 |
CN107919130A (zh) * | 2017-11-06 | 2018-04-17 | 百度在线网络技术(北京)有限公司 | 基于云端的语音处理方法和装置 |
CN110288987A (zh) * | 2018-03-19 | 2019-09-27 | 三星电子株式会社 | 用于处理声音数据的系统和控制该系统的方法 |
CN108366319A (zh) * | 2018-03-30 | 2018-08-03 | 京东方科技集团股份有限公司 | 智能音箱及其语音控制方法 |
CN110472134A (zh) * | 2018-05-10 | 2019-11-19 | 刘新宇 | 酒店客房服务机器人及本地化服务数据信息处理系统 |
CN108922276A (zh) * | 2018-08-03 | 2018-11-30 | 上海爱护网信息科技发展股份有限公司 | 一种智能展示屏及其使用方法 |
CN109471687A (zh) * | 2018-09-07 | 2019-03-15 | 深圳壹账通智能科技有限公司 | 贷款业务信息处理方法、装置、存储介质及计算机设备 |
CN109599130A (zh) * | 2018-12-10 | 2019-04-09 | 百度在线网络技术(北京)有限公司 | 收音方法、装置及存储介质 |
CN109545216A (zh) * | 2018-12-28 | 2019-03-29 | 合肥凯捷技术有限公司 | 一种语音识别方法和语音识别系统 |
CN110334242A (zh) * | 2019-07-10 | 2019-10-15 | 北京奇艺世纪科技有限公司 | 一种语音指令建议信息的生成方法、装置及电子设备 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11676593B2 (en) | 2020-12-01 | 2023-06-13 | International Business Machines Corporation | Training an artificial intelligence of a voice response system based on non_verbal feedback |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
IL161383A0 (en) | A method and apparatus for decoding handwritten characters | |
CN103760984A (zh) | 人机对话系统 | |
KR20010054622A (ko) | 음성 인식 시스템의 음성 인식률 향상 방법 | |
CN107767861A (zh) | 语音唤醒方法、系统及智能终端 | |
TW200515369A (en) | Semantic object synchronous understanding implemented with speech application language tags | |
CN103578463A (zh) | 自动化测试方法及测试装置 | |
DE60134395D1 (de) | Diskriminatives Trainieren von Hidden Markov Modellen für die Erkennung fliessender Sprache | |
CN103839211A (zh) | 一种基于语音识别的病历转写系统 | |
CN110176228A (zh) | 一种小语料语音识别方法及系统 | |
CN103514882A (zh) | 一种语音识别方法及系统 | |
CN106653020A (zh) | 一种基于深度学习的智慧视听设备多业务控制方法及系统 | |
TWI267024B (en) | Method and apparatus for connecting LPC bus and serial flash memory | |
CN111081248A (zh) | 一种人工智能语音识别装置 | |
CN115587598A (zh) | 多轮对话改写方法、设备及介质 | |
ZA202402937B (en) | Power control method and system based on large-scale power flow | |
CN111081254A (zh) | 一种语音识别方法和装置 | |
CN106683668A (zh) | 一种智能设备的唤醒控制的方法以及系统 | |
CN112863485A (zh) | 口音语音识别方法、装置、设备及存储介质 | |
CN112420053A (zh) | 智能交互式人机对话系统 | |
CN102196100A (zh) | 通话即时翻译系统及方法 | |
CN210516214U (zh) | 一种基于视频及语音交互服务设备 | |
CN116665674A (zh) | 基于语音和预训练模型的互联网智能化招聘发布方法 | |
CN110728980A (zh) | 一种基于语音及对话机器人的智能服务总线系统 | |
DE50206758D1 (de) | Verfahren zum betrieb eines endteilnehmers eines isochronen, zyklischen kommunikationssystems | |
CN109545220A (zh) | 一种人工智能语音识别系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20200428 |
|
RJ01 | Rejection of invention patent application after publication |