CN107393539A

CN107393539A - 一种声音密码控制方法

Info

Publication number: CN107393539A
Application number: CN201710582779.6A
Authority: CN
Inventors: 傅筱萸
Original assignee: Individual
Current assignee: Individual
Priority date: 2017-07-17
Filing date: 2017-07-17
Publication date: 2017-11-24

Abstract

本发明属于声控设备技术领域，更具体地是，涉及一种声音密码控制方法。包括以下步骤，S1，采集用户的语音，转换为语音信号；S2，对语音信号进行预处理，得到语音信号中的音色谐波和关键词；S3，将该用户的音色谐波与关键词与预存储的音色谐波和关键词进行匹配对比；S4，如果匹配成功，则发送控制指令给控制模块；否则，不执行。

Description

一种声音密码控制方法

技术领域

本发明属于声控设备技术领域，更具体地是，涉及一种声音密码控制方法。

背景技术

声音(sound)是由物体振动产生的声波。是通过介质(空气或固体、液体) 传播并能被人或动物听觉器官所感知的波动现象。最初发出振动(震动)的物体叫声源。声音以波的形式振动(震动)传播。声音是声波通过任何物质传播形成的运动。

声音分为：响度，音色，音调，其中音色又称音品，波形决定了声音的音色。声音因不同物体材料的特性而具有不同特性，音色本身是一种抽象的东西，但波形是把这个抽象直观的表现。音色不同，波形则不同。典型的音色波形有方波，锯齿波，正弦波，脉冲波等。不同的音色，通过波形，完全可以分辨的。

目前市面上对于声音的研究发展到了语音识别以及智能合成语音。而这些的存在只能够满足普通的语音指令活动以及电脑合成的语音。而当某个公共场合的东西，需要被特定的人指挥时，那么指挥员只能通过特定按钮以及电脑程序进行控制，而这种控制非常麻烦，同时也存在着按钮被别人盗用和电脑别病毒入侵的风险。指纹一样，每个人都有独一无二的声音，利用这一点，想要研发出能够方便地进行远程控制，同时通过分析音色，对比信号，保证只有特定的人能够控制。

同时，许多残疾人、老年人也面临这样的问题：坐在轮椅上坐电梯，没有办法按楼层；按钮控制门没有办法打开；想要打开的锁没有办法自己打开等等，这些问题都给残疾人的生活带来了很多不便，需要其他人的帮助才能完成。因此，需要一种声音控制系统，不便群体只需要发出声音便可以达到目的，并且不需要别人的帮助。

发明内容

针对现有技术存在的不足之处，本发明提出一种声音密码控制方法，该声音密码控制方法通过采集用户的语音，不仅分析用户语音中的关键词，而且还分析该语音的音色谐波，在音色谐波和关键词均匹配成功后，才发送控制指令给控制装置，控制装置根据控制指令执行相应动作。

为实现上述目的，本发明采用如下技术方案：

一种声音密码控制方法，包括以下步骤，

S1，采集用户的语音，转换为语音信号；

S2，对语音信号进行预处理，得到语音信号中的音色谐波和关键词；

S3，将该用户的音色谐波与关键词与预存储的音色谐波和关键词进行匹配对比；

S4，如果匹配成功，则发送控制指令给控制模块；否则，不执行。

本技术方案进一步的优化，所述步骤S2中音色谐波的获取包括以下步骤，

S201，提取语音信号中特征参数，所述特征参数包括基音周期和倒谱系数；

S202，基于特征参数，建立数学模型。

本技术方案更进一步的优化，所述步骤S201中倒谱系数的提取包括以下步骤，

S2011，对语音信号进行初步处理；

S2012，离散傅里叶变换，使得信号完成从时域至频的转换；

S2013，生成Mel滤波器组；

S2014，计算经Mel滤波器组加权后的能量值；

S2015，做离散余弦DCT变换。

本技术方案更进一步的优化，所述步骤S202中建立数学模型为模板模型、概率模块或神经网络模块。

本技术方案更进一步的优化，所述步骤S202中建立数学模型为隐马尔科夫模型。

本技术方案进一步的优化，所述步骤S2中预处理包括采样和量化、预加重处理、加窗、依据短时能量谱的语音端点检测处理过程。

本技术方案进一步的优化，所述步骤S4中，如果匹配成功，则通过无线通信方式将控制指令发送给控制装置。

本技术方案更进一步的优化，所述控制装置为移动终端。

区别于现有技术，上述技术方案具有如下有益效果：

1.本发明采用语音识别技术，通过识别用户的语音实现对控制装置的控制，语音中关键词识别无法体现唯一性，本发明还识别用户的音色谐波，实现对用户唯一性的判断；

2.本发明应用范围广泛，不仅可以控制传统的保险箱密码、门密码，还可实现一些特定场所，需要特定人控制的地方。

附图说明

图1为具体实施方式所述声音密码控制方法的控制流程图。

具体实施方式

为详细说明技术方案的技术内容、构造特征、所实现目的及效果，以下结合具体实施例并配合附图详予说明。

请参阅图1所示，本发明优选一实施例说我一种声音密码控制方法，包括以下步骤，

S1，采集用户的语音，转换为语音信号。

该实施例语音采集采用高保真的麦克风作为语音采集模块，直接跟计算机相连就能传输数据。

S2，对语音信号进行预处理，得到语音信号中的音色谐波和关键词。

需要说明的是，该实施例对语音信号进行预处理包括采样和量化、预加重处理、加窗、依据短时能量谱的语音端点检测等几个处理过程。

音色谐波的获取包括以下步骤，

S201，提取语音信号中特征参数，所述特征参数包括基音周期和倒谱系数。

①基音周期：产生发时声门的开启和闭合引起带性振动，形成周期振动，形成周期性的脉冲串，用来描述这一气流周期称为基性的脉冲串，用来描述这一气流周期称为基音周期。这种参数的提取主要音周期。这种参数的提取主要是基于说话人发声器官，如门、道和是基于说话人发声器官，如门、道和是基于说话人发声器官，如门、道和鼻腔等的特殊结构而提取出说话人语音短时谱特征(即基音频率及其轮廓)。

②倒谱系数：目前主流的声纹特征参数有LPC以及基于Mel频率的倒谱系数(Mel—frequency cepstral coefficients，MFCC)。实验中证明，MFCC是目前声纹特征中识别率最高的一种，本系统便是提取Mel频率倒谱系数MFCC 用来模拟人耳听觉系统的感知能力，描述语音信号在频率域上的能量分布。 Mel倒谱系数MFCC的提取过程如下：

S2011，对语音信号进行初步处理；

S2012，离散傅里叶变换，使得信号完成从时域至频的转换；

S2013，生成Mel滤波器组；

S2014，计算经Mel滤波器组加权后的能量值；

S2015，做离散余弦DCT变换。

S202，基于特征参数，建立数学模型。

常见的识别模型有模板模型(动态时间规整方法DTW、矢量量化方法 VQ)、概率模型(隐马尔科夫模型HMM、高斯混合模型GMM)，以及目前正在发展中的人工神经网络(ANN)方法。

本实验采用的隐马尔科夫模型HMM，并将该模型确定为本系统的模式匹配方法。使用HMM模型可以用短时模型描述平稳段的信号，而且还可以解决每个短时平稳段是如何转变到下一个短时平稳段的问题。本过程目的是对所提取出来的说话人语音特征进行学习训练，建立声纹模板或语音模型库，或对系统中已有的声纹模板或语音模型库进行适应性修改。

需要说明的是，在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者终端设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者终端设备所固有的要素。在没有更多限制的情况下，由语句“包括……”或“包含……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者终端设备中还存在另外的要素。此外，在本文中，“大于”、“小于”、“超过”等理解为不包括本数；“以上”、“以下”、“以内”等理解为包括本数。

尽管已经对上述各实施例进行了描述，但本领域内的技术人员一旦得知了基本创造性概念，则可对这些实施例做出另外的变更和修改，所以以上所述仅为本发明的实施例，并非因此限制本发明的专利保护范围，凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换，或直接或间接运用在其他相关的技术领域，均同理包括在本发明的专利保护范围之内。

Claims

1.一种声音密码控制方法，其特征在于：包括以下步骤，

S1，采集用户的语音，转换为语音信号；

2.如权利要求1所述的声音密码控制方法，其特征在于：所述步骤S2中音色谐波的获取包括以下步骤，

S202，基于特征参数，建立数学模型。

3.如权利要求2所述的声音密码控制方法，其特征在于：所述步骤S201中倒谱系数的提取包括以下步骤，

S2011，对语音信号进行初步处理；

S2012，离散傅里叶变换，使得信号完成从时域至频的转换；

S2013，生成Mel滤波器组；

S2014，计算经Mel滤波器组加权后的能量值；

S2015，做离散余弦DCT变换。

4.如权利要求2所述的声音密码控制方法，其特征在于：所述步骤S202中建立数学模型为模板模型、概率模块或神经网络模块。

5.如权利要求2所述的声音密码控制方法，其特征在于：所述步骤S202中建立数学模型为隐马尔科夫模型。

6.如权利要求1所述的声音密码控制方法，其特征在于：所述步骤S2中预处理包括采样和量化、预加重处理、加窗、依据短时能量谱的语音端点检测处理过程。

7.如权利要求1所述的声音密码控制方法，其特征在于：所述步骤S4中，如果匹配成功，则通过无线通信方式将控制指令发送给控制装置。

8.如权利要求7所述的声音密码控制方法，其特征在于：所述控制装置为移动终端。