CN111292746A - 一种基于人机交互的语音输入转换系统 - Google Patents

一种基于人机交互的语音输入转换系统 Download PDF

Info

Publication number
CN111292746A
CN111292746A CN202010082662.3A CN202010082662A CN111292746A CN 111292746 A CN111292746 A CN 111292746A CN 202010082662 A CN202010082662 A CN 202010082662A CN 111292746 A CN111292746 A CN 111292746A
Authority
CN
China
Prior art keywords
voice
module
conversion system
equipment
human
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010082662.3A
Other languages
English (en)
Inventor
李全忠
蒲瑶
赵茂祥
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Puqiang Times Zhuhai Hengqin Information Technology Co ltd
Original Assignee
Puqiang Times Zhuhai Hengqin Information Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Puqiang Times Zhuhai Hengqin Information Technology Co ltd filed Critical Puqiang Times Zhuhai Hengqin Information Technology Co ltd
Priority to CN202010082662.3A priority Critical patent/CN111292746A/zh
Publication of CN111292746A publication Critical patent/CN111292746A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/18Speech classification or search using natural language modelling
    • G10L15/1822Parsing for meaning understanding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems
    • G10L15/30Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command

Abstract

本发明涉及语音输入转换系统技术领域,且公开了一种基于人机交互的语音输入转换系统,包括语音采集设备、网络服务器、执行设备和终端设备,所述语音采集设备与网络服务器连接,所述网络服务器与执行设备连接。该基于人机交互的语音输入转换系统,通过网络服务器中的语音识别转换单元对语音采集设备采集的语音信息进行识别和转换后,利用判断模块对识别后的语音信息进行判断,若存在歧义等逻辑性错误时通过反馈模块将数据信息反馈到语音采集设备上并通过语音输出,再根据使用者反馈的语音进行二次验证,从而提高该语音输入转换系统所识别和转换数据的准确性,再用于智能设备控制的情况下,提高智能设备语音控制的准确性。

Description

一种基于人机交互的语音输入转换系统
技术领域
本发明涉及语音输入转换系统技术领域,具体为一种基于人机交互的语音输入转换系统。
背景技术
语音识别技术,也称为自动语音识别,其目的是将人类的语音中的词汇内容转换为计算机可读的输入,语音识别技术涉及信号处理、模式识别、概率论和信息论、发声机理和听觉机理、人工智能等领域,作为人机交互的关键技术,语音识别技术在呼叫中心、电信增值、企业信息化系统、智能机器人智能外呼、智能车载等应用系统中有了广泛的应用。
然而,现有技术中的人机交互语音输入转换系统,在对语音进行识别和转换后通常都是转化为指令,在语音识别不准确的情况容易导致误操作,影响客户的体验。
发明内容
本发明提供了一种基于人机交互的语音输入转换系统,具备避免在语音识别不准确的情况下导致误操作的优点,解决了现有技术中的人机交互语音输入转换系统,在对语音进行识别和转换后通常都是转化为指令,在语音识别不准确的情况容易导致误操作,影响客户体验的问题。
本发明提供如下技术方案:一种基于人机交互的语音输入转换系统,包括语音采集设备、网络服务器、执行设备和终端设备,所述语音采集设备与网络服务器连接,所述网络服务器与执行设备连接,所述执行设备与终端设备连接。
精选的,所述语音采集设备包括语音输入模块、语音信号处理模块、网络连接模块和语音输出模块,所述语音输入模块用于输入用户的语音信息,所述语音信号处理模块主要用于对语音信号进行增强、去除语音噪声、抑制非语音信号、自动分割语音,所述网络连接模块用于连接语音采集设备和网络服务器之间的连接,所述语音输出模块用于输出网络服务器和终端设备的反馈信息和执行信息。
精选的,所述网络服务器包括语音识别转换单元、判断模块和反馈模块,所述语音识别转换单元包括语音识别模块和语音转换模块,所述判断模块用于对语音识别转换单元识别和转换后的语音信息进行判断,所述反馈模块用于对判断模块判断的信息进行反馈。
精选的,所述执行设备包括语音识别转换单元、网络连接模块和判断及处理模块,所述网络连接模块用于执行设备和网络服务器之间的连接,所述判断及处理模块用于判断和处理终端设备所反馈的数据。
精选的,所述语音识别转换单元中的语音识别模块包括语义理解,所述语音识别模块中的语义理解包含规则引擎、匹配引擎和分类引擎。
精选的,所述终端设备包括智能家电或任意智能设备,所述终端设备上设有可采集设备运行参数的检测单元,该检测单元可为温度传感器、湿度传感器、电流传感器、电压传感器。
本发明具备以下有益效果:
该基于人机交互的语音输入转换系统,通过网络服务器中的语音识别转换单元对语音采集设备采集的语音信息进行识别和转换后,利用判断模块对识别后的语音信息进行判断,若存在歧义等逻辑性错误时通过反馈模块将数据信息反馈到语音采集设备上并通过语音输出,再根据使用者反馈的语音进行二次验证,从而提高该语音输入转换系统所识别和转换数据的准确性,再用于智能设备控制的情况下,提高智能设备语音控制的准确性;且该语音输入转换系统通过执行设备上的判断及处理模块,可对终端设备主动或被动反馈的运行数据进行判断和处理,从而通过语音采集设备语音输出,便于使用者根据语音采集设备所输出的设备运行参数数据进行合理的调整,使得终端设备的控制更为方便和智能。
附图说明
图1为本发明流程图;
图2为本发明结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参阅图1-2,一种基于人机交互的语音输入转换系统,包括语音采集设备、网络服务器、执行设备和终端设备,语音采集设备与网络服务器连接,网络服务器与执行设备连接,执行设备与终端设备连接。
其中,语音采集设备包括语音输入模块、语音信号处理模块、网络连接模块和语音输出模块,语音输入模块用于输入用户的语音信息,语音信号处理模块主要用于对语音信号进行增强、去除语音噪声、抑制非语音信号、自动分割语音,网络连接模块用于连接语音采集设备和网络服务器之间的连接,语音输出模块用于输出网络服务器和终端设备的反馈信息和执行信息。
其中,网络服务器包括语音识别转换单元、判断模块和反馈模块,语音识别转换单元包括语音识别模块和语音转换模块,判断模块用于对语音识别转换单元识别和转换后的语音信息进行判断,反馈模块用于对判断模块判断的信息进行反馈,通过网络服务器中的语音识别转换单元对语音采集设备采集的语音信息进行识别和转换后,利用判断模块对识别后的语音信息进行判断,若存在歧义等逻辑性错误时通过反馈模块将数据信息反馈到语音采集设备上并通过语音输出,再根据使用者反馈的语音进行二次验证,从而提高该语音输入转换系统所识别和转换数据的准确性,再用于智能设备控制的情况下,提高智能设备语音控制的准确性。
其中,执行设备包括语音识别转换单元、网络连接模块和判断及处理模块,网络连接模块用于执行设备和网络服务器之间的连接,判断及处理模块用于判断和处理终端设备所反馈的数据。
其中,语音识别转换单元中的语音识别模块包括语义理解,语音识别模块中的语义理解包含规则引擎、匹配引擎和分类引擎,在语音信息识别转换后,准备将结果发送给执行设备之前,对识别过程进行分析,获取更多对用户有用的信息,以及将最适合的结果返回给用户,主要有以下方面:1、输出置信度,置信度可以综合的反映识别结果的可信程序,就是识别的语音信息与用户实际的控制指令的匹配程度,该人机交互语音输入转换系统在返回给用户的识别结果中,都会包含该识别结果的置信度信息,用户或者应用程序可以通过置信度的值来分析当前的结果,井区分性的进行后续处理;2、多识别结果:多识别结果的产生是因为在该人机交互语音输入转换系统的识别过程中,会产生大量的识别结果,很多识别结果和用户的语音信息都“比较匹配”,该人机交互语音输入转换系统可以通过置信度的判断将多个结果返回给用户或者应用程序,而不是只返回唯一的结果,这样的话,用户可以从结果中选择一个更相近的结果;3、说话人的自适应:当用户与该人机交互语音输入转换系统进行多次会话过程中,该人机交互语音输入转换系统能够在线自动分析用户的通话语音特征,自动优化解码参数,使识别的效果能够得到持续的优化。
其中,终端设备包括智能家电或其他智能设备,终端设备上设有可采集设备运行参数的检测单元,该检测单元可为温度传感器、湿度传感器、电流传感器、电压传感器,利用终端设备上的温度传感器、湿度传感器、电流传感器、电压传感器等任意检测设备对终端设备运行操作进行检测,并通过终端设备的主动或使用者发送语音查询指令的被动反馈,将终端设备的运行数据上传给执行设备,通过执行设备上的判断及处理模块对终端设备所反馈的数据信息进行判断和处理,再最终通过语音采集设备上的语音输出模块输出语音,从而便于使用者根据语音采集设备所输出的设备运行参数数据进行合理的调整,使得终端设备的控制更为方便和智能。
该基于人机交互的语音输入转换系统用于控制智能家电或其他智能设备的方法是:
S1、通过语音采集设备中的语音输入模块输入语音信息,利用语音信号处理模块对输入的语音信号进行增强、并去除语音噪声、抑制非语音信号和自动分割语音,再将处理后的语音信息上传至网络服务器中;
S2、利用网络服务器中的语音识别转换单元对上传的语音信息进行识别和转换,并利用判断模块对对语音识别转换单元识别和转换后的语音信息进行判断,若无歧义等逻辑性错误时,将数据信息反馈给执行设备,利用执行设备发生执行指令给终端设备即可;
S3、在判断模块对语音识别转换单元识别和转换后的语音信息进行判断并出现歧义等逻辑性错误时,通过反馈模块将数据信息通过语音采集设备上的语音输出模块语音输出,再根据使用者反馈的语音进行二次验证即可。
尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。

Claims (6)

1.一种基于人机交互的语音输入转换系统,包括语音采集设备、网络服务器、执行设备和终端设备,其特征在于:所述语音采集设备与网络服务器连接,所述网络服务器与执行设备连接,所述执行设备与终端设备连接。
2.根据权利要求1所述的一种基于人机交互的语音输入转换系统,其特征在于:所述语音采集设备包括语音输入模块、语音信号处理模块、网络连接模块和语音输出模块,所述语音输入模块用于输入用户的语音信息,所述语音信号处理模块主要用于对语音信号进行增强、去除语音噪声、抑制非语音信号、自动分割语音,所述网络连接模块用于连接语音采集设备和网络服务器之间的连接,所述语音输出模块用于输出网络服务器和终端设备的反馈信息和执行信息。
3.根据权利要求1所述的一种基于人机交互的语音输入转换系统,其特征在于:所述网络服务器包括语音识别转换单元、判断模块和反馈模块,所述语音识别转换单元包括语音识别模块和语音转换模块,所述判断模块用于对语音识别转换单元识别和转换后的语音信息进行判断,所述反馈模块用于对判断模块判断的信息进行反馈。
4.根据权利要求1所述的一种基于人机交互的语音输入转换系统,其特征在于:所述执行设备包括语音识别转换单元、网络连接模块和判断及处理模块,所述网络连接模块用于执行设备和网络服务器之间的连接,所述判断及处理模块用于判断和处理终端设备所反馈的数据。
5.根据权利要求3至4任一项所述的一种基于人机交互的语音输入转换系统,其特征在于:所述语音识别转换单元中的语音识别模块包括语义理解,所述语音识别模块中的语义理解包含规则引擎、匹配引擎和分类引擎。
6.根据权利要求1所述的一种基于人机交互的语音输入转换系统,其特征在于:所述终端设备包括智能家电或其他智能设备,所述终端设备上设有可采集设备运行参数的检测单元,该检测单元可为温度传感器、湿度传感器、电流传感器、电压传感器。
CN202010082662.3A 2020-02-07 2020-02-07 一种基于人机交互的语音输入转换系统 Pending CN111292746A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010082662.3A CN111292746A (zh) 2020-02-07 2020-02-07 一种基于人机交互的语音输入转换系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010082662.3A CN111292746A (zh) 2020-02-07 2020-02-07 一种基于人机交互的语音输入转换系统

Publications (1)

Publication Number Publication Date
CN111292746A true CN111292746A (zh) 2020-06-16

Family

ID=71029985

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010082662.3A Pending CN111292746A (zh) 2020-02-07 2020-02-07 一种基于人机交互的语音输入转换系统

Country Status (1)

Country Link
CN (1) CN111292746A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113724708A (zh) * 2021-07-23 2021-11-30 山东环维通讯科技有限公司 一种语音转化成文本智能核单的质检系统

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101923854A (zh) * 2010-08-31 2010-12-22 中国科学院计算技术研究所 一种交互式语音识别系统和方法
CN102855872A (zh) * 2012-09-07 2013-01-02 深圳市信利康电子有限公司 基于终端及互联网语音交互的家电控制方法及系统
CN103491406A (zh) * 2013-09-02 2014-01-01 中山大学 一种基于语音识别的android智能电视系统
CN105096941A (zh) * 2015-09-02 2015-11-25 百度在线网络技术(北京)有限公司 语音识别方法以及装置
CN105529030A (zh) * 2015-12-29 2016-04-27 百度在线网络技术(北京)有限公司 语音识别处理方法和装置
US20160330322A1 (en) * 2015-05-04 2016-11-10 Shanghai Xiaoi Robot Technology Co., Ltd. Method and Device for Providing Voice Feedback Information to User On Call
CN106537493A (zh) * 2015-09-29 2017-03-22 深圳市全圣时代科技有限公司 语音识别系统及方法、客户端设备及云端服务器
US20180068657A1 (en) * 2016-09-07 2018-03-08 Microsoft Technology Licensing, Llc. Ambiguity Resolving Conversational Understanding System
CN108337139A (zh) * 2018-01-29 2018-07-27 广州索答信息科技有限公司 家电语音控制方法、电子设备、存储介质及系统
CN109286861A (zh) * 2017-07-19 2019-01-29 美的智慧家居科技有限公司 智能设备的信息查询方法、装置及其设备
CN110085219A (zh) * 2018-01-26 2019-08-02 博西华电器(江苏)有限公司 家用电器及通过语音控制该家用电器的方法和系统

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101923854A (zh) * 2010-08-31 2010-12-22 中国科学院计算技术研究所 一种交互式语音识别系统和方法
CN102855872A (zh) * 2012-09-07 2013-01-02 深圳市信利康电子有限公司 基于终端及互联网语音交互的家电控制方法及系统
CN103491406A (zh) * 2013-09-02 2014-01-01 中山大学 一种基于语音识别的android智能电视系统
US20160330322A1 (en) * 2015-05-04 2016-11-10 Shanghai Xiaoi Robot Technology Co., Ltd. Method and Device for Providing Voice Feedback Information to User On Call
CN105096941A (zh) * 2015-09-02 2015-11-25 百度在线网络技术(北京)有限公司 语音识别方法以及装置
CN106537493A (zh) * 2015-09-29 2017-03-22 深圳市全圣时代科技有限公司 语音识别系统及方法、客户端设备及云端服务器
CN105529030A (zh) * 2015-12-29 2016-04-27 百度在线网络技术(北京)有限公司 语音识别处理方法和装置
US20180068657A1 (en) * 2016-09-07 2018-03-08 Microsoft Technology Licensing, Llc. Ambiguity Resolving Conversational Understanding System
CN109286861A (zh) * 2017-07-19 2019-01-29 美的智慧家居科技有限公司 智能设备的信息查询方法、装置及其设备
CN110085219A (zh) * 2018-01-26 2019-08-02 博西华电器(江苏)有限公司 家用电器及通过语音控制该家用电器的方法和系统
CN108337139A (zh) * 2018-01-29 2018-07-27 广州索答信息科技有限公司 家电语音控制方法、电子设备、存储介质及系统

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113724708A (zh) * 2021-07-23 2021-11-30 山东环维通讯科技有限公司 一种语音转化成文本智能核单的质检系统

Similar Documents

Publication Publication Date Title
US11830479B2 (en) Voice recognition method and apparatus, and air conditioner
CN105261356A (zh) 一种语音识别系统及方法
CN111737987B (zh) 意图识别方法、装置、设备及存储介质
CN100524459C (zh) 用于语音识别的方法和系统
CN102324241A (zh) 具有语音控制功能的电子装置及语音控制方法
CN107195305A (zh) 一种信息处理方法及电子设备
CN105374357B (zh) 一种语音识别方法、装置及语音控制系统
CN112331213A (zh) 智能家居设备控制方法、装置、电子设备及存储介质
CN105529038A (zh) 对用户语音信号进行处理的方法及其系统
CN105550361B (zh) 日志处理方法及装置和问答信息处理方法及装置
CN111292746A (zh) 一种基于人机交互的语音输入转换系统
CN208284230U (zh) 一种语音识别装置、语音识别系统及智能设备
CN113053369A (zh) 智能家电的语音控制方法及装置、智能家电
CN101950564A (zh) 一种远程数字化语音采集分析识别系统
US20200202851A1 (en) Speech recognition device and system
CN113129902B (zh) 一种语音处理方法、装置、电子设备及存储介质
CN113936655A (zh) 语音播报处理方法、装置、计算机设备和存储介质
CN114187915A (zh) 一种互动方法
CN114420103A (zh) 语音处理方法、装置、电子设备及存储介质
CN114155845A (zh) 服务确定方法、装置、电子设备及存储介质
CN113593565A (zh) 一种智能家庭设备管控方法和系统
CN114399992A (zh) 语音指令响应方法、装置及存储介质
CN113241071A (zh) 一种语音处理方法、电子设备及存储介质
CN113380242A (zh) 一种语音控制多媒体播放内容的方法及系统
CN112735400A (zh) 一种语音识别智能传感器

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20200616