CN108172229A

CN108172229A - 一种基于语音识别的身份验证及可靠操控的方法

Info

Publication number: CN108172229A
Application number: CN201711313817.4A
Authority: CN
Inventors: 李耀曾; 胡亮; 陈玉涵; 张秀秀
Original assignee: Tianjin Jinhang Computing Technology Research Institute
Current assignee: Tianjin Jinhang Computing Technology Research Institute
Priority date: 2017-12-12
Filing date: 2017-12-12
Publication date: 2018-06-15

Abstract

本发明公开了一种基于语音识别的身份验证及可靠操控的方法，其中，包括：语音信号预处理、特征提取建模、训练模板库以及模式匹配；语音信号预处理包括：对采集到的音频信号进行加窗处理，并进行语音信号的端点检测，使得计算机从包好一段语音的信号中找出字和词的起始点及结束点；进行短时平均过零率计算，区分清音量和浊音量，并在信噪比高的情况下，区分有声和无声；特征提取建模包括：对采集的语音进行能量、幅度、频谱、过零率以及功率谱的提取，作为特征参数，滤除掉冗余信息。本发明的一种基于语音识别的身份验证及可靠操控的方法，可以大大改善由于船身过度摇摆造成的操作上的不便，能够有效的降低操作难度，提升工作效率。

Description

一种基于语音识别的身份验证及可靠操控的方法

技术领域

本发明涉及一种语音识别技术，特别是一种基于语音识别的身份验证及可靠操控的方法。

背景技术

新型船用操控台是为了满足新时期船用新型操控系统和综合电子信息系统的要求而设计，在信息收集、处理、显示和操控手段等方面具备更高效的处理能力。船舱环境相比于实验室环境具备噪音大、湿度大、信号稳定度差、船身摆浮大人员不便操控等特点。现有的操控台对于指令操控上采用传统的键盘鼠标控制方式，在某些海清恶劣的特定环境中，由于船身过度摇摆造成的操作上的不便，提高了操作难度，降低了工作效率。

发明内容

本发明的目的在于提供一种一种基于语音识别的身份验证及可靠操控的方法，用于解决上述现有技术的问题。

本发明一种基于语音识别的身份验证及可靠操控的方法，其中，包括：语音信号预处理、特征提取建模、训练模板库以及模式匹配；语音信号预处理包括：对采集到的音频信号进行加窗处理，并进行语音信号的端点检测，使得计算机从包好一段语音的信号中找出字和词的起始点及结束点；进行短时平均过零率计算，区分清音量和浊音量，并在信噪比高的情况下，区分有声和无声；特征提取建模包括：对采集的语音进行能量、幅度、频谱、过零率以及功率谱的提取，作为特征参数，滤除掉冗余信息。

根据本发明的基于指静脉生物特征的身份识别方法的一实施例，其中，训练模板库利用小波神经网络对采集以及提取的语音信号进行训练，结合隐马尔科夫经典声学模型将采集到的人体语音信号进行模式匹配。

本发明首次将语音识别技术引入到船用电子操控台。船舱环境相比于实验室环境具备噪音大、湿度大、信号稳定度差、船身摆浮大人员不便操控等特点。引入语音识别技术进行操控人员的身份验证以及相关常用功能的操作，相比于以往的操控台对于指令操控上采用传统的键盘鼠标控制方式，在某些海清恶劣的特定环境中，可以大大改善由于船身过度摇摆造成的操作上的不便，能够有效的降低操作难度，提升工作效率。

附图说明

图1所示为语音输入设备模块外形示意图；

图2所示为语音识别系统原理框图；

图3所示为基于隐马尔科夫(HMM)建模和小波神经网络语音识别抗噪原理框图。

具体实施方式

为使本发明的目的、内容、和优点更加清楚，下面结合附图和实施例，对本发明的具体实施方式作进一步详细描述。

图1所示为语音输入设备模块外形示意图，如图1所示，该设备采用模块化设计，采用新型的符合材料，吸声静音，内嵌于操控台面，考虑到人体工程学的设计理念，语音输入设备模块位于操控台面左前端，方便操作人员进行语音输入。

图2所示为语音识别方法的原理框图，如图2所示，语音识别的身份验证的方法主要分为语音信号预处理、特征提取建模、训练模板库、模式匹配几个过程。

语音信号预处理包括：考虑到船上工作环境噪音大以及海况海情不稳定等环境因素，为了保证语音信号在短时间内频谱保持平稳，需要对采集到的音频信号进行加窗处理，并进行语音信号的端点检测，使得计算机从包好一段语音的信号中找出字、词的起始点及结束点，保证计算机只存储和处理有效的语音信号。

其次，进行短时平均过零率计算，有效的区分清音量和浊音量，并在信噪比高的情况下，区分有声和无声。

然后对采集的语音进行能量、幅度、频谱、过零率、功率谱的提取，作为特征参数。滤除掉无关紧要的冗余信息，保留影响语音识别的重要信息作为匹配依据。

由于神经网络具备很强的非线性映射能力，同时又具有小波多分辨率的分析特性，因而能对信号的细节分量加以提取，这样得到的特征量可以更好的反映出信号的原始信息。因此，利用小波神经网络对采集、提取的语音信号进行训练，结合隐马尔科夫(HMM)经典声学模型将采集到的人体语音信号进行模式匹配，从而可以很好的达到语音模式识别的效果。

图3所示为基于隐马尔科夫(HMM)建模和小波神经网络语音识别抗噪原理框图，如图3所示，操作人员可以根据使用习惯和需要添加修改常用指令代码，方便通过语音方式对操控台进行操作，控制计算机与船上其他设备进行数据交互。

本发明在语音输入设备外形的设计上，考虑到船用设备使用环境的特殊性，在设计过程中尽量采取吸声静音符合材料，设备本身采取模块化设计，为一独立的方便拆卸更换的组件，模块内嵌于操作台面内，与操控台之间连接牢固，在最大限度上避免了连接不牢固产生的激励震动，起到消声减噪的效果。在整体布局上语音输入模块位于整个操控台操作台面的左前方，靠近USB调试接口，远离电源、显示器、机箱等大功率高频设备，以防止该模块工作时噪声源的干扰。

在软件实现上，本发明针对船上专用设备的操控(如对导航仪、定位系统、测速系统等接口数据的交互)，结合语音识别技术将别授权操作人的语音中的词汇内容转换为计算机可读的输入(例如按键、二进制编码或字符序列)作为指令控制计算机自动完成与船舱内其他相关设备的数据交互。

在软件设计上本发明主要由信号预处理、特征提取、训练模板库、模式匹配4个阶段组成。针对船上工作环境，机械噪音强，风浪背景噪音大的特点，本发明的技术重点是抑制各频率的信号干扰。本发明采用基于隐马尔科夫(HMM)建模和小波神经网络语音识别抗噪设计，对采集的语音信号进行处理、分析、匹配识别。隐马尔科夫模型配合小波神经网络可以很好的提取的人体声音中的特征信息，较好的完成被授权人语音识别的功能。

另外，为了操作人员对常用设备的操作，本发明开发了常用指令语音库，使用者在熟悉船上操作规范及流程的情况下可以直接对所需要的功能进行语音输入操作，同时在被授权的条件下也可以根据自己的操作习惯对常用指令库进行指令添加及修改。

本发明为一种基于语音识别的身份验证及可靠操控的方法，属于计算机人机交互领域。运用于新型船用操控台的人机交互，通过专用语音采集模块进行音频采集输入，与计算机完成相关指令的人机交互，提高了船用操控台在操作上的便捷性，可以满足新型船用操控台更加智能更加简便的发展趋势。

本发明的效果在于：将人体语音转化为计算机可以识别的指令、二进制码，从而可以大大的节省了由鼠标键盘操作带来的操作繁琐、误操作频繁等弊端，并且针对于船上工作的特点，对于一些复杂的操作步骤，在环境恶劣的情况下可以保证操作人员快速、准确地完成操控，因此在很大程度上可以节省操作人员的精力，也是船用新型操控台技术的发展趋势。

以上所述仅是本发明的优选实施方式，应当指出，对于本技术领域的普通技术人员来说，在不脱离本发明技术原理的前提下，还可以做出若干改进和变形，这些改进和变形也应视为本发明的保护范围。

Claims

1.一种基于语音识别的身份验证及可靠操控的方法，其特征在于，包括：

语音信号预处理、特征提取建模、训练模板库以及模式匹配；

语音信号预处理包括：对采集到的音频信号进行加窗处理，并进行语音信号的端点检测，使得计算机从包好一段语音的信号中找出字和词的起始点及结束点；

进行短时平均过零率计算，区分清音量和浊音量，并在信噪比高的情况下，区分有声和无声；

特征提取建模包括：对采集的语音进行能量、幅度、频谱、过零率以及功率谱的提取，作为特征参数，滤除掉冗余信息。

2.如权利要求1所述的基于指静脉生物特征的身份识别方法，其特征在于，训练模板库利用小波神经网络对采集以及提取的语音信号进行训练，结合隐马尔科夫经典声学模型将采集到的人体语音信号进行模式匹配。