CN107945787A

CN107945787A - 一种基于虚拟仪器技术的声控登陆管理系统及方法

Info

Publication number: CN107945787A
Application number: CN201711165479.4A
Authority: CN
Inventors: 田雪阳; 杨宇; 刘子寒; 李渊
Original assignee: Shanghai Dianji University
Current assignee: Shanghai Dianji University
Priority date: 2017-11-21
Filing date: 2017-11-21
Publication date: 2018-04-20

Abstract

一种基于虚拟仪器技术的声控登陆管理系统，包括语音信号采集系统、特征参数提取及保存系统和语音识别系统，所述语音信号采集系统中包含密码验证系统、样本录音系统和测试录音系统；所述特征参数提取及保存系统包含提取MFCC和训练VQ码本；在虚拟仪器技术平台上对语音进行识别，采用MFCC和VQ算法相结合的方式提高了整个系统的语音识别效果，提高了识别速度；由于本发明的系统以软件为重，所以可移植性较强，能够使用在各个不同的领域；使用该系统能够更好的解放人类的双手，通过语音来认证主人身份或者控制仪器操作，在保证识别精度条件下，能够减小系统体积，降低系统成本。

Description

一种基于虚拟仪器技术的声控登陆管理系统及方法

技术领域

本发明涉及语音识别领域，特别是设计一种带有语音身份认证的基于虚拟仪器技术的声控登陆管理系统及方法。

背景技术

语音识别技术经过多年的发展日渐从青涩走向了理论成熟，与语音识别相关的技术也走向了大众的生活当中，甚至小到语音开锁。目前鉴于科学技术的飞速发展，语音识别技术也逐渐变为热点话题，可以看出这项技术未来能够带给人们非常大的生活便利，直接优化人们的日常生活。现有技术大都是基于硬件上的语音信号的分析处理，无法通过软件直截了当的对其进行设置或查看，因而语音识别算法精度不够高，在噪声环境下鲁棒性较低，系统实现较为繁琐，同时对硬件的依赖性较强，导致系统成本高，适配性弱等等。

本发明就是为了解决以上问题而进行的改进。

发明内容

本发明的目的是提供一种可移植性较强、能够减小系统体积、降低系统成本及提高识别速度的一种基于虚拟仪器技术的声控登陆管理系统及方法。

本发明为解决其技术问题所采用的技术方案是：

一种基于虚拟仪器技术的声控登陆管理系统，包括语音信号采集系统、特征参数提取及保存系统和语音识别系统，所述语音信号采集系统中包含密码验证系统、样本录音系统和测试录音系统；

所述特征参数提取及保存系统包含提取MFCC和训练VQ码本；

所述语音识别系统包含失真测度系统；

所述语音信号采集系统获取语音信号并分别发送给密码验证系统和测试录音系统，密码验证系统通过后存为样本录音；

所述特征参数提取及保存系统通过样本录音提取MFCC并采用矢量量化VQ的语音识别算法生成训练VQ码本，特征参数提取及保存系统还从测试录音系统中提取MFCC；

所述特征参数提取及保存系统将生成的训练VQ码本和从测试录音系统中提取的MFCC发送给语音识别系统中的失真测度系统，所述失真测度系统通过与阈值对比得出判决结果；

进一步的，所述特征参数提取及保存系统中提取MFCC的过程包含预加重、分帧、加窗、FFT、Mel滤波器组、取对数和DCT；

更进一步的，所述语音识别系统中判决结果是对训练语音和测试语音的判决产生的；

所述训练语音和测试语音均通过特征参数提取MFCC，其中训练语音通过特征参数提取MFCC形成VQ码本建立，所述该VQ码本分别与测试语音流程中的待识别说话人和预先设置的阈值进行对比，通过判决识别出结果；

所述VQ码本建立包含说话人模型的建立；

具体的，开发带有语音身份认证的基于虚拟仪器技术的声控登陆管理系统的方法，所述该方法包含采取LabVIEW与MATLAB相结合的方法、采用梅尔倒谱频率(MFCC)参数作为声学特征进行提取并保存的方法、采用矢量量化VQ的语音识别算法的方法和采用LabVIEW与Arduino UNO相结合的方法。

所述采取LabVIEW与MATLAB相结合的方法，是通过脚本节点的调用使虚拟仪器来完成功能；

所述采用LabVIEW与Arduino UNO相结合的方法是通过数据传输，同时通过Arduino的拓展使用语音指令完成任务。

工作原理为：在识别准确度上，采用了MFCC语音特征和VQ识别算法相结合来达到识别要求，以及提高识别速度的问题。在降低成本方面本系统是基于虚拟仪器LabVIEW上的，采用其多线程技术，把声音作为声卡采集对象，所以信号识别的运算都在PC上完成，以节省硬件成本。

本发明的有益效果在于：在虚拟仪器技术平台上对语音进行识别，采用MFCC和VQ算法相结合的方式提高了整个系统的语音识别效果，提高了识别速度；由于本发明的系统以软件为重，所以可移植性较强，能够使用在各个不同的领域；使用该系统能够更好的解放人类的双手，通过语音来认证主人身份或者控制仪器操作，在保证识别精度条件下，能够减小系统体积，降低系统成本。

附图说明

图1是本发明提出的一种基于虚拟仪器技术的声控登陆管理系统的结构流程图。

图2是本发明提出的一种基于虚拟仪器技术的声控登陆管理系统中为特征参数MFCC的提取过程的流程图。

图3是本发明提出的一种基于虚拟仪器技术的声控登陆管理系统中语音识别矢量量化VQ算法流程图。

具体实施方式

为了使本发明实现的技术手段、创作特征、达成目的与功效易于明白了解，下面结合图示与具体实施例，进一步阐述本发明。

参照图1、图2、图3所示，该一种基于虚拟仪器技术的声控登陆管理系统，包括语音信号采集系统、特征参数提取及保存系统和语音识别系统，所述语音信号采集系统中包含密码验证系统、样本录音系统和测试录音系统，如图1；

所述语音信号采集系统采用PC自带的声卡，外面声音信号输入声卡，会先完成A/D转换，然后传到PC主板。在PC上通过LabVIEW编写的程序，设置好声卡采集参数，将采集的声音数据保存在系统中。

所述语音采集系统分为两部分：一是样本库语音采集，获取语音信号并分别发送给密码验证系统，密码验证系统通过后存为样本录音；一是实时语音采集，入测试录音系统；

所述特征参数提取及保存系统包含提取MFCC和训练VQ码本；

所述语音识别系统包含失真测度系统，该系统将样本语音的文本提取出特征参数训练成码本，待识别时将测试语音信号的文本按照生成的训练码本按欧式距离测度进行压缩编码，通过对其量化进而产生的失真测度；

进一步的，所述特征参数提取及保存系统中提取MFCC的过程包含预加重、分帧、加窗、FFT、Mel滤波器组、取对数和DCT，如图2；

所述语音识别系统中判决结果是对训练语音和测试语音的判决产生的，进一步的，所述语音识别系统中样本语音与测试语音的对比涉及的搜索采用全搜索，将之前训练好的所有码字都与输入的矢量相比较，计算它们之间所有的距离，若为识别出说话人，则距离最小者为目标，若为登陆确认，则距离小于阈值则登陆成功；

所述训练语音和测试语音均通过特征参数提取MFCC，其中训练语音通过特征参数提取MFCC形成VQ码本建立，所述该VQ码本分别与测试语音流程中的待识别说话人和预先设置的阈值进行对比，通过判决识别出结果，如图3；

所述VQ码本建立包含说话人模型的建立；

所述采用LabVIEW与Arduino UNO相结合的方法是通过数据传输，同时通过Arduino的拓展使用语音指令完成任务；

具体过程为声控登陆管理系统，是通过PC机的声卡采集登陆者的语音信号，在PC中分析该语音信号的特征信息，将该信息与样本库里的语音信号对比，一致后PC显示屏上给出登陆成功显示，同时向外输出登陆放行控制信号，不一致不放行。系统的软件由PC上的Labview平台开发，PC输出的控制信号通过Arduino UNO开发板展示出来；

所述系统的软件部分完成对样本语音信号中提取到的特征参数保存在电脑的语音库中，测试语音信号采用和样本语音信号一样的处理方式，得到的特征参数与之前形成的语音库中的特征参数一一进行比较，同时根据算法计算出其失真测度，与设定的阈值相比较进行判决，小于阈值则识别结果为成功，大于阈值为失败。

在识别准确度上，采用了MFCC语音特征和VQ识别算法相结合来达到识别要求，以及提高识别速度的问题。在降低成本方面本系统是基于虚拟仪器LabVIEW上的，采用其多线程技术，把声音作为声卡采集对象，所以信号识别的运算都在PC上完成，以节省硬件成本。

在虚拟仪器技术平台上对语音进行识别，采用MFCC和VQ算法相结合的方式提高了整个系统的语音识别效果，提高了识别速度；由于本发明的系统以软件为重，所以可移植性较强，能够使用在各个不同的领域；使用该系统能够更好的解放人类的双手，通过语音来认证主人身份或者控制仪器操作，在保证识别精度条件下，能够减小系统体积，降低系统成本。

以上显示和描述了本发明的基本原理、主要特征和本发明的优点。本行业的技术人员应该了解，本发明不受上述实施例的限制，上述实施例和说明书中描述的只是说明本发明的原理，在不脱离本发明精神和范围的前提下本发明还会有各种变化和改进，这些变化和改进都落入要求保护的本发明范围内。本发明要求保护范围由所附的权利要求书及其等同物界定。

Claims

1.一种基于虚拟仪器技术的声控登陆管理系统，包括语音信号采集系统、特征参数提取及保存系统和语音识别系统，其特征在于：

所述语音信号采集系统中包含密码验证系统、样本录音系统和测试录音系统；

所述特征参数提取及保存系统包含提取MFCC和训练VQ码本；

所述语音识别系统包含失真测度系统；

所述特征参数提取及保存系统将生成的训练VQ码本和从测试录音系统中提取的MFCC发送给语音识别系统中的失真测度系统，所述失真测度系统通过与阈值对比得出判决结果。

2.如权利要求1所述的一种基于虚拟仪器技术的声控登陆管理系统，其特征在于，所述特征参数提取及保存系统中提取MFCC的过程包含预加重、分帧、加窗、FFT、Mel滤波器组、取对数和DCT。

3.如权利要求1或2所述的一种基于虚拟仪器技术的声控登陆管理系统，其特征在于，所述语音识别系统中判决结果是对训练语音和测试语音的判决产生的；

所述VQ码本建立包含说话人模型的建立。

4.一种开发如权利要求1所述的基于虚拟仪器技术的声控登陆管理系统的方法，其特征在于，所述该方法包含采取LabVIEW与MATLAB相结合的方法、采用梅尔倒谱频率(MFCC)参数作为声学特征进行提取并保存的方法、采用矢量量化VQ的语音识别算法的方法和采用LabVIEW与Arduino UNO相结合的方法。

5.如权利要求4所述的基于虚拟仪器技术的声控登陆管理系统的方法，其特征在于，所述采取LabVIEW与MATLAB相结合的方法，是通过脚本节点的调用使虚拟仪器来完成功能；