CN111292746A

CN111292746A - 一种基于人机交互的语音输入转换系统

Info

Publication number: CN111292746A
Application number: CN202010082662.3A
Authority: CN
Inventors: 李全忠; 蒲瑶; 赵茂祥
Original assignee: Puqiang Times Zhuhai Hengqin Information Technology Co ltd
Current assignee: Puqiang Times Zhuhai Hengqin Information Technology Co ltd
Priority date: 2020-02-07
Filing date: 2020-02-07
Publication date: 2020-06-16

Abstract

本发明涉及语音输入转换系统技术领域，且公开了一种基于人机交互的语音输入转换系统，包括语音采集设备、网络服务器、执行设备和终端设备，所述语音采集设备与网络服务器连接，所述网络服务器与执行设备连接。该基于人机交互的语音输入转换系统，通过网络服务器中的语音识别转换单元对语音采集设备采集的语音信息进行识别和转换后，利用判断模块对识别后的语音信息进行判断，若存在歧义等逻辑性错误时通过反馈模块将数据信息反馈到语音采集设备上并通过语音输出，再根据使用者反馈的语音进行二次验证，从而提高该语音输入转换系统所识别和转换数据的准确性，再用于智能设备控制的情况下，提高智能设备语音控制的准确性。

Description

一种基于人机交互的语音输入转换系统

技术领域

本发明涉及语音输入转换系统技术领域，具体为一种基于人机交互的语音输入转换系统。

背景技术

语音识别技术，也称为自动语音识别，其目的是将人类的语音中的词汇内容转换为计算机可读的输入，语音识别技术涉及信号处理、模式识别、概率论和信息论、发声机理和听觉机理、人工智能等领域，作为人机交互的关键技术，语音识别技术在呼叫中心、电信增值、企业信息化系统、智能机器人智能外呼、智能车载等应用系统中有了广泛的应用。

然而，现有技术中的人机交互语音输入转换系统，在对语音进行识别和转换后通常都是转化为指令，在语音识别不准确的情况容易导致误操作，影响客户的体验。

发明内容

本发明提供了一种基于人机交互的语音输入转换系统，具备避免在语音识别不准确的情况下导致误操作的优点，解决了现有技术中的人机交互语音输入转换系统，在对语音进行识别和转换后通常都是转化为指令，在语音识别不准确的情况容易导致误操作，影响客户体验的问题。

本发明提供如下技术方案：一种基于人机交互的语音输入转换系统，包括语音采集设备、网络服务器、执行设备和终端设备，所述语音采集设备与网络服务器连接，所述网络服务器与执行设备连接，所述执行设备与终端设备连接。

精选的，所述语音采集设备包括语音输入模块、语音信号处理模块、网络连接模块和语音输出模块，所述语音输入模块用于输入用户的语音信息，所述语音信号处理模块主要用于对语音信号进行增强、去除语音噪声、抑制非语音信号、自动分割语音，所述网络连接模块用于连接语音采集设备和网络服务器之间的连接，所述语音输出模块用于输出网络服务器和终端设备的反馈信息和执行信息。

精选的，所述网络服务器包括语音识别转换单元、判断模块和反馈模块，所述语音识别转换单元包括语音识别模块和语音转换模块，所述判断模块用于对语音识别转换单元识别和转换后的语音信息进行判断，所述反馈模块用于对判断模块判断的信息进行反馈。

精选的，所述执行设备包括语音识别转换单元、网络连接模块和判断及处理模块，所述网络连接模块用于执行设备和网络服务器之间的连接，所述判断及处理模块用于判断和处理终端设备所反馈的数据。

精选的，所述语音识别转换单元中的语音识别模块包括语义理解，所述语音识别模块中的语义理解包含规则引擎、匹配引擎和分类引擎。

精选的，所述终端设备包括智能家电或任意智能设备，所述终端设备上设有可采集设备运行参数的检测单元，该检测单元可为温度传感器、湿度传感器、电流传感器、电压传感器。

本发明具备以下有益效果：

该基于人机交互的语音输入转换系统，通过网络服务器中的语音识别转换单元对语音采集设备采集的语音信息进行识别和转换后，利用判断模块对识别后的语音信息进行判断，若存在歧义等逻辑性错误时通过反馈模块将数据信息反馈到语音采集设备上并通过语音输出，再根据使用者反馈的语音进行二次验证，从而提高该语音输入转换系统所识别和转换数据的准确性，再用于智能设备控制的情况下，提高智能设备语音控制的准确性；且该语音输入转换系统通过执行设备上的判断及处理模块，可对终端设备主动或被动反馈的运行数据进行判断和处理，从而通过语音采集设备语音输出，便于使用者根据语音采集设备所输出的设备运行参数数据进行合理的调整，使得终端设备的控制更为方便和智能。

附图说明

图1为本发明流程图；

图2为本发明结构示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

请参阅图1-2，一种基于人机交互的语音输入转换系统，包括语音采集设备、网络服务器、执行设备和终端设备，语音采集设备与网络服务器连接，网络服务器与执行设备连接，执行设备与终端设备连接。

其中，语音采集设备包括语音输入模块、语音信号处理模块、网络连接模块和语音输出模块，语音输入模块用于输入用户的语音信息，语音信号处理模块主要用于对语音信号进行增强、去除语音噪声、抑制非语音信号、自动分割语音，网络连接模块用于连接语音采集设备和网络服务器之间的连接，语音输出模块用于输出网络服务器和终端设备的反馈信息和执行信息。

其中，网络服务器包括语音识别转换单元、判断模块和反馈模块，语音识别转换单元包括语音识别模块和语音转换模块，判断模块用于对语音识别转换单元识别和转换后的语音信息进行判断，反馈模块用于对判断模块判断的信息进行反馈，通过网络服务器中的语音识别转换单元对语音采集设备采集的语音信息进行识别和转换后，利用判断模块对识别后的语音信息进行判断，若存在歧义等逻辑性错误时通过反馈模块将数据信息反馈到语音采集设备上并通过语音输出，再根据使用者反馈的语音进行二次验证，从而提高该语音输入转换系统所识别和转换数据的准确性，再用于智能设备控制的情况下，提高智能设备语音控制的准确性。

其中，执行设备包括语音识别转换单元、网络连接模块和判断及处理模块，网络连接模块用于执行设备和网络服务器之间的连接，判断及处理模块用于判断和处理终端设备所反馈的数据。

其中，语音识别转换单元中的语音识别模块包括语义理解，语音识别模块中的语义理解包含规则引擎、匹配引擎和分类引擎，在语音信息识别转换后，准备将结果发送给执行设备之前，对识别过程进行分析，获取更多对用户有用的信息，以及将最适合的结果返回给用户，主要有以下方面：1、输出置信度，置信度可以综合的反映识别结果的可信程序，就是识别的语音信息与用户实际的控制指令的匹配程度，该人机交互语音输入转换系统在返回给用户的识别结果中，都会包含该识别结果的置信度信息，用户或者应用程序可以通过置信度的值来分析当前的结果，井区分性的进行后续处理；2、多识别结果：多识别结果的产生是因为在该人机交互语音输入转换系统的识别过程中，会产生大量的识别结果，很多识别结果和用户的语音信息都“比较匹配”，该人机交互语音输入转换系统可以通过置信度的判断将多个结果返回给用户或者应用程序，而不是只返回唯一的结果，这样的话，用户可以从结果中选择一个更相近的结果；3、说话人的自适应：当用户与该人机交互语音输入转换系统进行多次会话过程中，该人机交互语音输入转换系统能够在线自动分析用户的通话语音特征，自动优化解码参数，使识别的效果能够得到持续的优化。

其中，终端设备包括智能家电或其他智能设备，终端设备上设有可采集设备运行参数的检测单元，该检测单元可为温度传感器、湿度传感器、电流传感器、电压传感器，利用终端设备上的温度传感器、湿度传感器、电流传感器、电压传感器等任意检测设备对终端设备运行操作进行检测，并通过终端设备的主动或使用者发送语音查询指令的被动反馈，将终端设备的运行数据上传给执行设备，通过执行设备上的判断及处理模块对终端设备所反馈的数据信息进行判断和处理，再最终通过语音采集设备上的语音输出模块输出语音，从而便于使用者根据语音采集设备所输出的设备运行参数数据进行合理的调整，使得终端设备的控制更为方便和智能。

该基于人机交互的语音输入转换系统用于控制智能家电或其他智能设备的方法是：

S1、通过语音采集设备中的语音输入模块输入语音信息，利用语音信号处理模块对输入的语音信号进行增强、并去除语音噪声、抑制非语音信号和自动分割语音，再将处理后的语音信息上传至网络服务器中；

S2、利用网络服务器中的语音识别转换单元对上传的语音信息进行识别和转换，并利用判断模块对对语音识别转换单元识别和转换后的语音信息进行判断，若无歧义等逻辑性错误时，将数据信息反馈给执行设备，利用执行设备发生执行指令给终端设备即可；

S3、在判断模块对语音识别转换单元识别和转换后的语音信息进行判断并出现歧义等逻辑性错误时，通过反馈模块将数据信息通过语音采集设备上的语音输出模块语音输出，再根据使用者反馈的语音进行二次验证即可。

尽管已经示出和描述了本发明的实施例，对于本领域的普通技术人员而言，可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型，本发明的范围由所附权利要求及其等同物限定。

Claims

1.一种基于人机交互的语音输入转换系统，包括语音采集设备、网络服务器、执行设备和终端设备，其特征在于：所述语音采集设备与网络服务器连接，所述网络服务器与执行设备连接，所述执行设备与终端设备连接。

2.根据权利要求1所述的一种基于人机交互的语音输入转换系统，其特征在于：所述语音采集设备包括语音输入模块、语音信号处理模块、网络连接模块和语音输出模块，所述语音输入模块用于输入用户的语音信息，所述语音信号处理模块主要用于对语音信号进行增强、去除语音噪声、抑制非语音信号、自动分割语音，所述网络连接模块用于连接语音采集设备和网络服务器之间的连接，所述语音输出模块用于输出网络服务器和终端设备的反馈信息和执行信息。

3.根据权利要求1所述的一种基于人机交互的语音输入转换系统，其特征在于：所述网络服务器包括语音识别转换单元、判断模块和反馈模块，所述语音识别转换单元包括语音识别模块和语音转换模块，所述判断模块用于对语音识别转换单元识别和转换后的语音信息进行判断，所述反馈模块用于对判断模块判断的信息进行反馈。

4.根据权利要求1所述的一种基于人机交互的语音输入转换系统，其特征在于：所述执行设备包括语音识别转换单元、网络连接模块和判断及处理模块，所述网络连接模块用于执行设备和网络服务器之间的连接，所述判断及处理模块用于判断和处理终端设备所反馈的数据。

5.根据权利要求3至4任一项所述的一种基于人机交互的语音输入转换系统，其特征在于：所述语音识别转换单元中的语音识别模块包括语义理解，所述语音识别模块中的语义理解包含规则引擎、匹配引擎和分类引擎。

6.根据权利要求1所述的一种基于人机交互的语音输入转换系统，其特征在于：所述终端设备包括智能家电或其他智能设备，所述终端设备上设有可采集设备运行参数的检测单元，该检测单元可为温度传感器、湿度传感器、电流传感器、电压传感器。