CN107945787A - 一种基于虚拟仪器技术的声控登陆管理系统及方法 - Google Patents

一种基于虚拟仪器技术的声控登陆管理系统及方法 Download PDF

Info

Publication number
CN107945787A
CN107945787A CN201711165479.4A CN201711165479A CN107945787A CN 107945787 A CN107945787 A CN 107945787A CN 201711165479 A CN201711165479 A CN 201711165479A CN 107945787 A CN107945787 A CN 107945787A
Authority
CN
China
Prior art keywords
mfcc
characteristic parameter
virtual instrument
speech recognition
speech
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201711165479.4A
Other languages
English (en)
Inventor
田雪阳
杨宇
刘子寒
李渊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Dianji University
Original Assignee
Shanghai Dianji University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Dianji University filed Critical Shanghai Dianji University
Priority to CN201711165479.4A priority Critical patent/CN107945787A/zh
Publication of CN107945787A publication Critical patent/CN107945787A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/02Feature extraction for speech recognition; Selection of recognition unit
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L63/00Network architectures or network communication protocols for network security
    • H04L63/08Network architectures or network communication protocols for network security for authentication of entities
    • H04L63/0815Network architectures or network communication protocols for network security for authentication of entities providing single-sign-on or federations

Abstract

一种基于虚拟仪器技术的声控登陆管理系统,包括语音信号采集系统、特征参数提取及保存系统和语音识别系统,所述语音信号采集系统中包含密码验证系统、样本录音系统和测试录音系统;所述特征参数提取及保存系统包含提取MFCC和训练VQ码本;在虚拟仪器技术平台上对语音进行识别,采用MFCC和VQ算法相结合的方式提高了整个系统的语音识别效果,提高了识别速度;由于本发明的系统以软件为重,所以可移植性较强,能够使用在各个不同的领域;使用该系统能够更好的解放人类的双手,通过语音来认证主人身份或者控制仪器操作,在保证识别精度条件下,能够减小系统体积,降低系统成本。

Description

一种基于虚拟仪器技术的声控登陆管理系统及方法
技术领域
本发明涉及语音识别领域,特别是设计一种带有语音身份认证的基于虚拟仪器技术的声控登陆管理系统及方法。
背景技术
语音识别技术经过多年的发展日渐从青涩走向了理论成熟,与语音识别相关的技术也走向了大众的生活当中,甚至小到语音开锁。目前鉴于科学技术的飞速发展,语音识别技术也逐渐变为热点话题,可以看出这项技术未来能够带给人们非常大的生活便利,直接优化人们的日常生活。现有技术大都是基于硬件上的语音信号的分析处理,无法通过软件直截了当的对其进行设置或查看,因而语音识别算法精度不够高,在噪声环境下鲁棒性较低,系统实现较为繁琐,同时对硬件的依赖性较强,导致系统成本高,适配性弱等等。
本发明就是为了解决以上问题而进行的改进。
发明内容
本发明的目的是提供一种可移植性较强、能够减小系统体积、降低系统成本及提高识别速度的一种基于虚拟仪器技术的声控登陆管理系统及方法。
本发明为解决其技术问题所采用的技术方案是:
一种基于虚拟仪器技术的声控登陆管理系统,包括语音信号采集系统、特征参数提取及保存系统和语音识别系统,所述语音信号采集系统中包含密码验证系统、样本录音系统和测试录音系统;
所述特征参数提取及保存系统包含提取MFCC和训练VQ码本;
所述语音识别系统包含失真测度系统;
所述语音信号采集系统获取语音信号并分别发送给密码验证系统和测试录音系统,密码验证系统通过后存为样本录音;
所述特征参数提取及保存系统通过样本录音提取MFCC并采用矢量量化VQ的语音识别算法生成训练VQ码本,特征参数提取及保存系统还从测试录音系统中提取MFCC;
所述特征参数提取及保存系统将生成的训练VQ码本和从测试录音系统中提取的MFCC发送给语音识别系统中的失真测度系统,所述失真测度系统通过与阈值对比得出判决结果;
进一步的,所述特征参数提取及保存系统中提取MFCC的过程包含预加重、分帧、加窗、FFT、Mel滤波器组、取对数和DCT;
更进一步的,所述语音识别系统中判决结果是对训练语音和测试语音的判决产生的;
所述训练语音和测试语音均通过特征参数提取MFCC,其中训练语音通过特征参数提取MFCC形成VQ码本建立,所述该VQ码本分别与测试语音流程中的待识别说话人和预先设置的阈值进行对比,通过判决识别出结果;
所述VQ码本建立包含说话人模型的建立;
具体的,开发带有语音身份认证的基于虚拟仪器技术的声控登陆管理系统的方法,所述该方法包含采取LabVIEW与MATLAB相结合的方法、采用梅尔倒谱频率(MFCC)参数作为声学特征进行提取并保存的方法、采用矢量量化VQ的语音识别算法的方法和采用LabVIEW与Arduino UNO相结合的方法。
所述采取LabVIEW与MATLAB相结合的方法,是通过脚本节点的调用使虚拟仪器来完成功能;
所述采用LabVIEW与Arduino UNO相结合的方法是通过数据传输,同时通过Arduino的拓展使用语音指令完成任务。
工作原理为:在识别准确度上,采用了MFCC语音特征和VQ识别算法相结合来达到识别要求,以及提高识别速度的问题。在降低成本方面本系统是基于虚拟仪器LabVIEW上的,采用其多线程技术,把声音作为声卡采集对象,所以信号识别的运算都在PC上完成,以节省硬件成本。
本发明的有益效果在于:在虚拟仪器技术平台上对语音进行识别,采用MFCC和VQ算法相结合的方式提高了整个系统的语音识别效果,提高了识别速度;由于本发明的系统以软件为重,所以可移植性较强,能够使用在各个不同的领域;使用该系统能够更好的解放人类的双手,通过语音来认证主人身份或者控制仪器操作,在保证识别精度条件下,能够减小系统体积,降低系统成本。
附图说明
图1是本发明提出的一种基于虚拟仪器技术的声控登陆管理系统的结构流程图。
图2是本发明提出的一种基于虚拟仪器技术的声控登陆管理系统中为特征参数MFCC的提取过程的流程图。
图3是本发明提出的一种基于虚拟仪器技术的声控登陆管理系统中语音识别矢量量化VQ算法流程图。
具体实施方式
为了使本发明实现的技术手段、创作特征、达成目的与功效易于明白了解,下面结合图示与具体实施例,进一步阐述本发明。
参照图1、图2、图3所示,该一种基于虚拟仪器技术的声控登陆管理系统,包括语音信号采集系统、特征参数提取及保存系统和语音识别系统,所述语音信号采集系统中包含密码验证系统、样本录音系统和测试录音系统,如图1;
所述语音信号采集系统采用PC自带的声卡,外面声音信号输入声卡,会先完成A/D转换,然后传到PC主板。在PC上通过LabVIEW编写的程序,设置好声卡采集参数,将采集的声音数据保存在系统中。
所述语音采集系统分为两部分:一是样本库语音采集,获取语音信号并分别发送给密码验证系统,密码验证系统通过后存为样本录音;一是实时语音采集,入测试录音系统;
所述特征参数提取及保存系统包含提取MFCC和训练VQ码本;
所述语音识别系统包含失真测度系统,该系统将样本语音的文本提取出特征参数训练成码本,待识别时将测试语音信号的文本按照生成的训练码本按欧式距离测度进行压缩编码,通过对其量化进而产生的失真测度;
所述语音信号采集系统获取语音信号并分别发送给密码验证系统和测试录音系统,密码验证系统通过后存为样本录音;
所述特征参数提取及保存系统通过样本录音提取MFCC并采用矢量量化VQ的语音识别算法生成训练VQ码本,特征参数提取及保存系统还从测试录音系统中提取MFCC;
所述特征参数提取及保存系统将生成的训练VQ码本和从测试录音系统中提取的MFCC发送给语音识别系统中的失真测度系统,所述失真测度系统通过与阈值对比得出判决结果;
进一步的,所述特征参数提取及保存系统中提取MFCC的过程包含预加重、分帧、加窗、FFT、Mel滤波器组、取对数和DCT,如图2;
所述语音识别系统中判决结果是对训练语音和测试语音的判决产生的,进一步的,所述语音识别系统中样本语音与测试语音的对比涉及的搜索采用全搜索,将之前训练好的所有码字都与输入的矢量相比较,计算它们之间所有的距离,若为识别出说话人,则距离最小者为目标,若为登陆确认,则距离小于阈值则登陆成功;
所述训练语音和测试语音均通过特征参数提取MFCC,其中训练语音通过特征参数提取MFCC形成VQ码本建立,所述该VQ码本分别与测试语音流程中的待识别说话人和预先设置的阈值进行对比,通过判决识别出结果,如图3;
所述VQ码本建立包含说话人模型的建立;
具体的,开发带有语音身份认证的基于虚拟仪器技术的声控登陆管理系统的方法,所述该方法包含采取LabVIEW与MATLAB相结合的方法、采用梅尔倒谱频率(MFCC)参数作为声学特征进行提取并保存的方法、采用矢量量化VQ的语音识别算法的方法和采用LabVIEW与Arduino UNO相结合的方法。
所述采取LabVIEW与MATLAB相结合的方法,是通过脚本节点的调用使虚拟仪器来完成功能;
所述采用LabVIEW与Arduino UNO相结合的方法是通过数据传输,同时通过Arduino的拓展使用语音指令完成任务;
具体过程为声控登陆管理系统,是通过PC机的声卡采集登陆者的语音信号,在PC中分析该语音信号的特征信息,将该信息与样本库里的语音信号对比,一致后PC显示屏上给出登陆成功显示,同时向外输出登陆放行控制信号,不一致不放行。系统的软件由PC上的Labview平台开发,PC输出的控制信号通过Arduino UNO开发板展示出来;
所述系统的软件部分完成对样本语音信号中提取到的特征参数保存在电脑的语音库中,测试语音信号采用和样本语音信号一样的处理方式,得到的特征参数与之前形成的语音库中的特征参数一一进行比较,同时根据算法计算出其失真测度,与设定的阈值相比较进行判决,小于阈值则识别结果为成功,大于阈值为失败。
在识别准确度上,采用了MFCC语音特征和VQ识别算法相结合来达到识别要求,以及提高识别速度的问题。在降低成本方面本系统是基于虚拟仪器LabVIEW上的,采用其多线程技术,把声音作为声卡采集对象,所以信号识别的运算都在PC上完成,以节省硬件成本。
在虚拟仪器技术平台上对语音进行识别,采用MFCC和VQ算法相结合的方式提高了整个系统的语音识别效果,提高了识别速度;由于本发明的系统以软件为重,所以可移植性较强,能够使用在各个不同的领域;使用该系统能够更好的解放人类的双手,通过语音来认证主人身份或者控制仪器操作,在保证识别精度条件下,能够减小系统体积,降低系统成本。
以上显示和描述了本发明的基本原理、主要特征和本发明的优点。本行业的技术人员应该了解,本发明不受上述实施例的限制,上述实施例和说明书中描述的只是说明本发明的原理,在不脱离本发明精神和范围的前提下本发明还会有各种变化和改进,这些变化和改进都落入要求保护的本发明范围内。本发明要求保护范围由所附的权利要求书及其等同物界定。

Claims (5)

1.一种基于虚拟仪器技术的声控登陆管理系统,包括语音信号采集系统、特征参数提取及保存系统和语音识别系统,其特征在于:
所述语音信号采集系统中包含密码验证系统、样本录音系统和测试录音系统;
所述特征参数提取及保存系统包含提取MFCC和训练VQ码本;
所述语音识别系统包含失真测度系统;
所述语音信号采集系统获取语音信号并分别发送给密码验证系统和测试录音系统,密码验证系统通过后存为样本录音;
所述特征参数提取及保存系统通过样本录音提取MFCC并采用矢量量化VQ的语音识别算法生成训练VQ码本,特征参数提取及保存系统还从测试录音系统中提取MFCC;
所述特征参数提取及保存系统将生成的训练VQ码本和从测试录音系统中提取的MFCC发送给语音识别系统中的失真测度系统,所述失真测度系统通过与阈值对比得出判决结果。
2.如权利要求1所述的一种基于虚拟仪器技术的声控登陆管理系统,其特征在于,所述特征参数提取及保存系统中提取MFCC的过程包含预加重、分帧、加窗、FFT、Mel滤波器组、取对数和DCT。
3.如权利要求1或2所述的一种基于虚拟仪器技术的声控登陆管理系统,其特征在于,所述语音识别系统中判决结果是对训练语音和测试语音的判决产生的;
所述训练语音和测试语音均通过特征参数提取MFCC,其中训练语音通过特征参数提取MFCC形成VQ码本建立,所述该VQ码本分别与测试语音流程中的待识别说话人和预先设置的阈值进行对比,通过判决识别出结果;
所述VQ码本建立包含说话人模型的建立。
4.一种开发如权利要求1所述的基于虚拟仪器技术的声控登陆管理系统的方法,其特征在于,所述该方法包含采取LabVIEW与MATLAB相结合的方法、采用梅尔倒谱频率(MFCC)参数作为声学特征进行提取并保存的方法、采用矢量量化VQ的语音识别算法的方法和采用LabVIEW与Arduino UNO相结合的方法。
5.如权利要求4所述的基于虚拟仪器技术的声控登陆管理系统的方法,其特征在于,所述采取LabVIEW与MATLAB相结合的方法,是通过脚本节点的调用使虚拟仪器来完成功能;
所述采用LabVIEW与Arduino UNO相结合的方法是通过数据传输,同时通过Arduino的拓展使用语音指令完成任务。
CN201711165479.4A 2017-11-21 2017-11-21 一种基于虚拟仪器技术的声控登陆管理系统及方法 Pending CN107945787A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711165479.4A CN107945787A (zh) 2017-11-21 2017-11-21 一种基于虚拟仪器技术的声控登陆管理系统及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711165479.4A CN107945787A (zh) 2017-11-21 2017-11-21 一种基于虚拟仪器技术的声控登陆管理系统及方法

Publications (1)

Publication Number Publication Date
CN107945787A true CN107945787A (zh) 2018-04-20

Family

ID=61929617

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711165479.4A Pending CN107945787A (zh) 2017-11-21 2017-11-21 一种基于虚拟仪器技术的声控登陆管理系统及方法

Country Status (1)

Country Link
CN (1) CN107945787A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110782896A (zh) * 2019-11-08 2020-02-11 中国电子科技集团公司第四十一研究所 一种基于语音控制的测量仪器测试系统及方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101051464A (zh) * 2006-04-06 2007-10-10 株式会社东芝 说话人认证的注册和验证方法及装置
CN101055718A (zh) * 2007-05-11 2007-10-17 华东师范大学 一种基于矢量量化的声纹识别方法
US20080221885A1 (en) * 2007-03-09 2008-09-11 Arachnoid Biometrics Identification Group Corp Speech Control Apparatus and Method
CN102543075A (zh) * 2012-01-12 2012-07-04 东北石油大学 基于虚拟仪器技术的说话人vq-svm并行识别系统
CN103207961A (zh) * 2013-04-23 2013-07-17 曙光信息产业(北京)有限公司 用户验证方法和装置
CN106875944A (zh) * 2017-01-15 2017-06-20 深圳市丰巨泰科电子有限公司 一种语音控制家庭智能终端的系统

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101051464A (zh) * 2006-04-06 2007-10-10 株式会社东芝 说话人认证的注册和验证方法及装置
US20080221885A1 (en) * 2007-03-09 2008-09-11 Arachnoid Biometrics Identification Group Corp Speech Control Apparatus and Method
CN101055718A (zh) * 2007-05-11 2007-10-17 华东师范大学 一种基于矢量量化的声纹识别方法
CN102543075A (zh) * 2012-01-12 2012-07-04 东北石油大学 基于虚拟仪器技术的说话人vq-svm并行识别系统
CN103207961A (zh) * 2013-04-23 2013-07-17 曙光信息产业(北京)有限公司 用户验证方法和装置
CN106875944A (zh) * 2017-01-15 2017-06-20 深圳市丰巨泰科电子有限公司 一种语音控制家庭智能终端的系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
田雪阳等: "声音信号特征参数的分析和提取方法", 《价值工程》 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110782896A (zh) * 2019-11-08 2020-02-11 中国电子科技集团公司第四十一研究所 一种基于语音控制的测量仪器测试系统及方法

Similar Documents

Publication Publication Date Title
US10176811B2 (en) Neural network-based voiceprint information extraction method and apparatus
US10593333B2 (en) Method and device for processing voice message, terminal and storage medium
CN110706690A (zh) 语音识别方法及其装置
CN107103903B (zh) 基于人工智能的声学模型训练方法、装置及存储介质
US9640186B2 (en) Deep scattering spectrum in acoustic modeling for speech recognition
CN108962227B (zh) 语音起点和终点检测方法、装置、计算机设备及存储介质
CN104021789A (zh) 一种利用短时时频值的自适应端点检测方法
CN110570873B (zh) 声纹唤醒方法、装置、计算机设备以及存储介质
CN108364662B (zh) 基于成对鉴别任务的语音情感识别方法与系统
CN108922541B (zh) 基于dtw和gmm模型的多维特征参数声纹识别方法
GB2552082A (en) Voice user interface
CN103971690A (zh) 一种声纹识别方法和装置
CN101923855A (zh) 文本无关的声纹识别系统
CN103794207A (zh) 一种双模语音身份识别方法
US20140195232A1 (en) Methods, systems, and circuits for text independent speaker recognition with automatic learning features
CN109887510A (zh) 一种基于经验模态分解与mfcc的声纹识别方法及装置
CN108335699A (zh) 一种基于动态时间规整和语音活动检测的声纹识别方法
CN113823293B (zh) 一种基于语音增强的说话人识别方法及系统
CN102237083A (zh) 一种基于WinCE平台的便携式口语翻译系统及其语言识别方法
WO2018095167A1 (zh) 声纹识别方法和声纹识别系统
CN110570870A (zh) 一种文本无关的声纹识别方法、装置及设备
Cao et al. An improved endpoint detection algorithm based on MFCC Cosine Value
CN104901807A (zh) 一种可用于低端芯片的声纹密码方法
CN109545226B (zh) 一种语音识别方法、设备及计算机可读存储介质
CN113129867A (zh) 语音识别模型的训练方法、语音识别方法、装置和设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20180420