CN111292746A - 一种基于人机交互的语音输入转换系统 - Google Patents
一种基于人机交互的语音输入转换系统 Download PDFInfo
- Publication number
- CN111292746A CN111292746A CN202010082662.3A CN202010082662A CN111292746A CN 111292746 A CN111292746 A CN 111292746A CN 202010082662 A CN202010082662 A CN 202010082662A CN 111292746 A CN111292746 A CN 111292746A
- Authority
- CN
- China
- Prior art keywords
- voice
- module
- conversion system
- equipment
- human
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000006243 chemical reaction Methods 0.000 title claims abstract description 52
- 230000003993 interaction Effects 0.000 title claims abstract description 24
- 238000001514 detection method Methods 0.000 claims description 7
- 230000002708 enhancing effect Effects 0.000 claims description 4
- 230000000452 restraining effect Effects 0.000 claims description 2
- 238000012795 verification Methods 0.000 abstract description 4
- 238000000034 method Methods 0.000 description 4
- 230000008569 process Effects 0.000 description 3
- 230000006978 adaptation Effects 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000000052 comparative effect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000002401 inhibitory effect Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/18—Speech classification or search using natural language modelling
- G10L15/1822—Parsing for meaning understanding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
- G10L15/30—Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Quality & Reliability (AREA)
- Signal Processing (AREA)
- Artificial Intelligence (AREA)
- Telephonic Communication Services (AREA)
Abstract
本发明涉及语音输入转换系统技术领域,且公开了一种基于人机交互的语音输入转换系统,包括语音采集设备、网络服务器、执行设备和终端设备,所述语音采集设备与网络服务器连接,所述网络服务器与执行设备连接。该基于人机交互的语音输入转换系统,通过网络服务器中的语音识别转换单元对语音采集设备采集的语音信息进行识别和转换后,利用判断模块对识别后的语音信息进行判断,若存在歧义等逻辑性错误时通过反馈模块将数据信息反馈到语音采集设备上并通过语音输出,再根据使用者反馈的语音进行二次验证,从而提高该语音输入转换系统所识别和转换数据的准确性,再用于智能设备控制的情况下,提高智能设备语音控制的准确性。
Description
技术领域
本发明涉及语音输入转换系统技术领域,具体为一种基于人机交互的语音输入转换系统。
背景技术
语音识别技术,也称为自动语音识别,其目的是将人类的语音中的词汇内容转换为计算机可读的输入,语音识别技术涉及信号处理、模式识别、概率论和信息论、发声机理和听觉机理、人工智能等领域,作为人机交互的关键技术,语音识别技术在呼叫中心、电信增值、企业信息化系统、智能机器人智能外呼、智能车载等应用系统中有了广泛的应用。
然而,现有技术中的人机交互语音输入转换系统,在对语音进行识别和转换后通常都是转化为指令,在语音识别不准确的情况容易导致误操作,影响客户的体验。
发明内容
本发明提供了一种基于人机交互的语音输入转换系统,具备避免在语音识别不准确的情况下导致误操作的优点,解决了现有技术中的人机交互语音输入转换系统,在对语音进行识别和转换后通常都是转化为指令,在语音识别不准确的情况容易导致误操作,影响客户体验的问题。
本发明提供如下技术方案:一种基于人机交互的语音输入转换系统,包括语音采集设备、网络服务器、执行设备和终端设备,所述语音采集设备与网络服务器连接,所述网络服务器与执行设备连接,所述执行设备与终端设备连接。
精选的,所述语音采集设备包括语音输入模块、语音信号处理模块、网络连接模块和语音输出模块,所述语音输入模块用于输入用户的语音信息,所述语音信号处理模块主要用于对语音信号进行增强、去除语音噪声、抑制非语音信号、自动分割语音,所述网络连接模块用于连接语音采集设备和网络服务器之间的连接,所述语音输出模块用于输出网络服务器和终端设备的反馈信息和执行信息。
精选的,所述网络服务器包括语音识别转换单元、判断模块和反馈模块,所述语音识别转换单元包括语音识别模块和语音转换模块,所述判断模块用于对语音识别转换单元识别和转换后的语音信息进行判断,所述反馈模块用于对判断模块判断的信息进行反馈。
精选的,所述执行设备包括语音识别转换单元、网络连接模块和判断及处理模块,所述网络连接模块用于执行设备和网络服务器之间的连接,所述判断及处理模块用于判断和处理终端设备所反馈的数据。
精选的,所述语音识别转换单元中的语音识别模块包括语义理解,所述语音识别模块中的语义理解包含规则引擎、匹配引擎和分类引擎。
精选的,所述终端设备包括智能家电或任意智能设备,所述终端设备上设有可采集设备运行参数的检测单元,该检测单元可为温度传感器、湿度传感器、电流传感器、电压传感器。
本发明具备以下有益效果:
该基于人机交互的语音输入转换系统,通过网络服务器中的语音识别转换单元对语音采集设备采集的语音信息进行识别和转换后,利用判断模块对识别后的语音信息进行判断,若存在歧义等逻辑性错误时通过反馈模块将数据信息反馈到语音采集设备上并通过语音输出,再根据使用者反馈的语音进行二次验证,从而提高该语音输入转换系统所识别和转换数据的准确性,再用于智能设备控制的情况下,提高智能设备语音控制的准确性;且该语音输入转换系统通过执行设备上的判断及处理模块,可对终端设备主动或被动反馈的运行数据进行判断和处理,从而通过语音采集设备语音输出,便于使用者根据语音采集设备所输出的设备运行参数数据进行合理的调整,使得终端设备的控制更为方便和智能。
附图说明
图1为本发明流程图;
图2为本发明结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参阅图1-2,一种基于人机交互的语音输入转换系统,包括语音采集设备、网络服务器、执行设备和终端设备,语音采集设备与网络服务器连接,网络服务器与执行设备连接,执行设备与终端设备连接。
其中,语音采集设备包括语音输入模块、语音信号处理模块、网络连接模块和语音输出模块,语音输入模块用于输入用户的语音信息,语音信号处理模块主要用于对语音信号进行增强、去除语音噪声、抑制非语音信号、自动分割语音,网络连接模块用于连接语音采集设备和网络服务器之间的连接,语音输出模块用于输出网络服务器和终端设备的反馈信息和执行信息。
其中,网络服务器包括语音识别转换单元、判断模块和反馈模块,语音识别转换单元包括语音识别模块和语音转换模块,判断模块用于对语音识别转换单元识别和转换后的语音信息进行判断,反馈模块用于对判断模块判断的信息进行反馈,通过网络服务器中的语音识别转换单元对语音采集设备采集的语音信息进行识别和转换后,利用判断模块对识别后的语音信息进行判断,若存在歧义等逻辑性错误时通过反馈模块将数据信息反馈到语音采集设备上并通过语音输出,再根据使用者反馈的语音进行二次验证,从而提高该语音输入转换系统所识别和转换数据的准确性,再用于智能设备控制的情况下,提高智能设备语音控制的准确性。
其中,执行设备包括语音识别转换单元、网络连接模块和判断及处理模块,网络连接模块用于执行设备和网络服务器之间的连接,判断及处理模块用于判断和处理终端设备所反馈的数据。
其中,语音识别转换单元中的语音识别模块包括语义理解,语音识别模块中的语义理解包含规则引擎、匹配引擎和分类引擎,在语音信息识别转换后,准备将结果发送给执行设备之前,对识别过程进行分析,获取更多对用户有用的信息,以及将最适合的结果返回给用户,主要有以下方面:1、输出置信度,置信度可以综合的反映识别结果的可信程序,就是识别的语音信息与用户实际的控制指令的匹配程度,该人机交互语音输入转换系统在返回给用户的识别结果中,都会包含该识别结果的置信度信息,用户或者应用程序可以通过置信度的值来分析当前的结果,井区分性的进行后续处理;2、多识别结果:多识别结果的产生是因为在该人机交互语音输入转换系统的识别过程中,会产生大量的识别结果,很多识别结果和用户的语音信息都“比较匹配”,该人机交互语音输入转换系统可以通过置信度的判断将多个结果返回给用户或者应用程序,而不是只返回唯一的结果,这样的话,用户可以从结果中选择一个更相近的结果;3、说话人的自适应:当用户与该人机交互语音输入转换系统进行多次会话过程中,该人机交互语音输入转换系统能够在线自动分析用户的通话语音特征,自动优化解码参数,使识别的效果能够得到持续的优化。
其中,终端设备包括智能家电或其他智能设备,终端设备上设有可采集设备运行参数的检测单元,该检测单元可为温度传感器、湿度传感器、电流传感器、电压传感器,利用终端设备上的温度传感器、湿度传感器、电流传感器、电压传感器等任意检测设备对终端设备运行操作进行检测,并通过终端设备的主动或使用者发送语音查询指令的被动反馈,将终端设备的运行数据上传给执行设备,通过执行设备上的判断及处理模块对终端设备所反馈的数据信息进行判断和处理,再最终通过语音采集设备上的语音输出模块输出语音,从而便于使用者根据语音采集设备所输出的设备运行参数数据进行合理的调整,使得终端设备的控制更为方便和智能。
该基于人机交互的语音输入转换系统用于控制智能家电或其他智能设备的方法是:
S1、通过语音采集设备中的语音输入模块输入语音信息,利用语音信号处理模块对输入的语音信号进行增强、并去除语音噪声、抑制非语音信号和自动分割语音,再将处理后的语音信息上传至网络服务器中;
S2、利用网络服务器中的语音识别转换单元对上传的语音信息进行识别和转换,并利用判断模块对对语音识别转换单元识别和转换后的语音信息进行判断,若无歧义等逻辑性错误时,将数据信息反馈给执行设备,利用执行设备发生执行指令给终端设备即可;
S3、在判断模块对语音识别转换单元识别和转换后的语音信息进行判断并出现歧义等逻辑性错误时,通过反馈模块将数据信息通过语音采集设备上的语音输出模块语音输出,再根据使用者反馈的语音进行二次验证即可。
尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。
Claims (6)
1.一种基于人机交互的语音输入转换系统,包括语音采集设备、网络服务器、执行设备和终端设备,其特征在于:所述语音采集设备与网络服务器连接,所述网络服务器与执行设备连接,所述执行设备与终端设备连接。
2.根据权利要求1所述的一种基于人机交互的语音输入转换系统,其特征在于:所述语音采集设备包括语音输入模块、语音信号处理模块、网络连接模块和语音输出模块,所述语音输入模块用于输入用户的语音信息,所述语音信号处理模块主要用于对语音信号进行增强、去除语音噪声、抑制非语音信号、自动分割语音,所述网络连接模块用于连接语音采集设备和网络服务器之间的连接,所述语音输出模块用于输出网络服务器和终端设备的反馈信息和执行信息。
3.根据权利要求1所述的一种基于人机交互的语音输入转换系统,其特征在于:所述网络服务器包括语音识别转换单元、判断模块和反馈模块,所述语音识别转换单元包括语音识别模块和语音转换模块,所述判断模块用于对语音识别转换单元识别和转换后的语音信息进行判断,所述反馈模块用于对判断模块判断的信息进行反馈。
4.根据权利要求1所述的一种基于人机交互的语音输入转换系统,其特征在于:所述执行设备包括语音识别转换单元、网络连接模块和判断及处理模块,所述网络连接模块用于执行设备和网络服务器之间的连接,所述判断及处理模块用于判断和处理终端设备所反馈的数据。
5.根据权利要求3至4任一项所述的一种基于人机交互的语音输入转换系统,其特征在于:所述语音识别转换单元中的语音识别模块包括语义理解,所述语音识别模块中的语义理解包含规则引擎、匹配引擎和分类引擎。
6.根据权利要求1所述的一种基于人机交互的语音输入转换系统,其特征在于:所述终端设备包括智能家电或其他智能设备,所述终端设备上设有可采集设备运行参数的检测单元,该检测单元可为温度传感器、湿度传感器、电流传感器、电压传感器。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010082662.3A CN111292746A (zh) | 2020-02-07 | 2020-02-07 | 一种基于人机交互的语音输入转换系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010082662.3A CN111292746A (zh) | 2020-02-07 | 2020-02-07 | 一种基于人机交互的语音输入转换系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111292746A true CN111292746A (zh) | 2020-06-16 |
Family
ID=71029985
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010082662.3A Pending CN111292746A (zh) | 2020-02-07 | 2020-02-07 | 一种基于人机交互的语音输入转换系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111292746A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113724708A (zh) * | 2021-07-23 | 2021-11-30 | 山东环维通讯科技有限公司 | 一种语音转化成文本智能核单的质检系统 |
Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101923854A (zh) * | 2010-08-31 | 2010-12-22 | 中国科学院计算技术研究所 | 一种交互式语音识别系统和方法 |
CN102855872A (zh) * | 2012-09-07 | 2013-01-02 | 深圳市信利康电子有限公司 | 基于终端及互联网语音交互的家电控制方法及系统 |
CN103491406A (zh) * | 2013-09-02 | 2014-01-01 | 中山大学 | 一种基于语音识别的android智能电视系统 |
CN105096941A (zh) * | 2015-09-02 | 2015-11-25 | 百度在线网络技术(北京)有限公司 | 语音识别方法以及装置 |
CN105529030A (zh) * | 2015-12-29 | 2016-04-27 | 百度在线网络技术(北京)有限公司 | 语音识别处理方法和装置 |
US20160330322A1 (en) * | 2015-05-04 | 2016-11-10 | Shanghai Xiaoi Robot Technology Co., Ltd. | Method and Device for Providing Voice Feedback Information to User On Call |
CN106537493A (zh) * | 2015-09-29 | 2017-03-22 | 深圳市全圣时代科技有限公司 | 语音识别系统及方法、客户端设备及云端服务器 |
US20180068657A1 (en) * | 2016-09-07 | 2018-03-08 | Microsoft Technology Licensing, Llc. | Ambiguity Resolving Conversational Understanding System |
CN108337139A (zh) * | 2018-01-29 | 2018-07-27 | 广州索答信息科技有限公司 | 家电语音控制方法、电子设备、存储介质及系统 |
CN109286861A (zh) * | 2017-07-19 | 2019-01-29 | 美的智慧家居科技有限公司 | 智能设备的信息查询方法、装置及其设备 |
CN110085219A (zh) * | 2018-01-26 | 2019-08-02 | 博西华电器(江苏)有限公司 | 家用电器及通过语音控制该家用电器的方法和系统 |
-
2020
- 2020-02-07 CN CN202010082662.3A patent/CN111292746A/zh active Pending
Patent Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101923854A (zh) * | 2010-08-31 | 2010-12-22 | 中国科学院计算技术研究所 | 一种交互式语音识别系统和方法 |
CN102855872A (zh) * | 2012-09-07 | 2013-01-02 | 深圳市信利康电子有限公司 | 基于终端及互联网语音交互的家电控制方法及系统 |
CN103491406A (zh) * | 2013-09-02 | 2014-01-01 | 中山大学 | 一种基于语音识别的android智能电视系统 |
US20160330322A1 (en) * | 2015-05-04 | 2016-11-10 | Shanghai Xiaoi Robot Technology Co., Ltd. | Method and Device for Providing Voice Feedback Information to User On Call |
CN105096941A (zh) * | 2015-09-02 | 2015-11-25 | 百度在线网络技术(北京)有限公司 | 语音识别方法以及装置 |
CN106537493A (zh) * | 2015-09-29 | 2017-03-22 | 深圳市全圣时代科技有限公司 | 语音识别系统及方法、客户端设备及云端服务器 |
CN105529030A (zh) * | 2015-12-29 | 2016-04-27 | 百度在线网络技术(北京)有限公司 | 语音识别处理方法和装置 |
US20180068657A1 (en) * | 2016-09-07 | 2018-03-08 | Microsoft Technology Licensing, Llc. | Ambiguity Resolving Conversational Understanding System |
CN109286861A (zh) * | 2017-07-19 | 2019-01-29 | 美的智慧家居科技有限公司 | 智能设备的信息查询方法、装置及其设备 |
CN110085219A (zh) * | 2018-01-26 | 2019-08-02 | 博西华电器(江苏)有限公司 | 家用电器及通过语音控制该家用电器的方法和系统 |
CN108337139A (zh) * | 2018-01-29 | 2018-07-27 | 广州索答信息科技有限公司 | 家电语音控制方法、电子设备、存储介质及系统 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113724708A (zh) * | 2021-07-23 | 2021-11-30 | 山东环维通讯科技有限公司 | 一种语音转化成文本智能核单的质检系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11830479B2 (en) | Voice recognition method and apparatus, and air conditioner | |
CN105261356A (zh) | 一种语音识别系统及方法 | |
CN111737987B (zh) | 意图识别方法、装置、设备及存储介质 | |
CN102324241A (zh) | 具有语音控制功能的电子装置及语音控制方法 | |
CN105374357B (zh) | 一种语音识别方法、装置及语音控制系统 | |
CN104301522A (zh) | 通讯中的信息输入方法及通讯终端 | |
CN112331213A (zh) | 智能家居设备控制方法、装置、电子设备及存储介质 | |
CN105529038A (zh) | 对用户语音信号进行处理的方法及其系统 | |
CN102890931A (zh) | 提高语音识别率的方法 | |
CN108538290A (zh) | 一种基于音频信号检测的智能家居控制方法 | |
CN111292746A (zh) | 一种基于人机交互的语音输入转换系统 | |
CN113593565B (zh) | 一种智能家庭设备管控方法和系统 | |
CN208284230U (zh) | 一种语音识别装置、语音识别系统及智能设备 | |
CN115567336A (zh) | 一种基于智慧家居的无唤醒语音控制系统及方法 | |
US20200202851A1 (en) | Speech recognition device and system | |
CN113611304B (zh) | 一种基于大屏语音唤醒识别降噪混合系统及方法 | |
CN113936655A (zh) | 语音播报处理方法、装置、计算机设备和存储介质 | |
CN114627859A (zh) | 一种脱机语义识别电子相框的方法及系统 | |
CN111785277B (zh) | 语音识别方法、装置、计算机可读存储介质以及处理器 | |
CN114155845A (zh) | 服务确定方法、装置、电子设备及存储介质 | |
CN113241071A (zh) | 一种语音处理方法、电子设备及存储介质 | |
CN112966110A (zh) | 文本类别识别方法及相关设备 | |
CN113129902A (zh) | 一种语音处理方法、装置、电子设备及存储介质 | |
CN112735400A (zh) | 一种语音识别智能传感器 | |
CN113870879A (zh) | 智能家电麦克风的共享方法、智能家电和可读存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20200616 |