CN106228045A

CN106228045A - 一种身份识别系统

Info

Publication number: CN106228045A
Application number: CN201610544004.5A
Authority: CN
Inventors: 不公告发明人
Original assignee: Individual
Current assignee: Individual
Priority date: 2016-07-06
Filing date: 2016-07-06
Publication date: 2016-12-14

Abstract

本发明公开了一种身份识别系统，包括：特征采集模块，用于采集注册用户的语音信号的声纹特征和待识别用户的待识别语音信号的声纹特征；特征聚类模块，用于采用改进的K‑means聚类方法对所有所述注册用户的语音信号的声纹特征进行聚类分析，输出聚类结果；神经网络训练模块，用于将所述待识别语音信号的声纹特征输入训练好的神经网络中，确定其所归属的类群；身份识别模块，用于分别计算所述待识别语音信号的声纹特征所归属的类群的模板库中的声纹特征模板与所述待识别语音信号的声纹特征的相似度，确定与所述待识别语音信号的声纹特征的相似度最大的所述声纹特征模板对应的用户为所述待识别用户。本发明计算量小，识别速度快，身份识别精度相对较高。

Description

一种身份识别系统

技术领域

本发明涉及变压器故障诊断领域，具体涉及一种身份识别系统。

背景技术

现有技术中，对于身份识别的具体方法，许多利用人体本身的特征信号进行身份识别的方法开始进行实用，例如基于指纹的手机解锁技术与门禁系统、基于虹膜识别的身份认证以及基于面部识别的身份认证等等。相关技术中，常见的基于人体特征的身份识别方法为基于模板匹配的方法，其对每个需要识别的用户提取具有代表性的人体特征，通过对比人体特征与不同模板的相似度来确定人体特征合法或不合法。但是，以上身份识别方法存在一个较大的缺点，就是无法建立较大规模的身份识别系统。因为在基于模板匹配的方法中，每次身份识别时需要将待识别人体特征与总模板库中所有人体特征模板进行比较才能判断其是否为合法特征，计算量大。

发明内容

针对上述问题，本发明提供一种身份识别系统。

本发明的目的采用以下技术方案来实现：

一种身份识别系统，包括特征采集模块、特征聚类模块、神经网络训练模块、身份识别模块；

所述特征采集模块用于采集注册用户的语音信号的声纹特征和待识别用户的待识别语音信号的声纹特征；

所述特征聚类模块，用于采用改进的K-means聚类方法对所有所述注册用户的语音信号的声纹特征进行聚类分析，输出聚类结果；

所述神经网络训练模块，用于将所述聚类结果作为训练样本，采用神经网络计算出每个属性每一层的权值，并得到一个训练好的神经网络，将所述待识别语音信号的声纹特征输入训练好的神经网络中，确定所述待识别语音信号的声纹特征所归属的类群；其中，每个所述类群对应一个模板库，所述模板库包括归属于所述类群的声纹特征模板，每个所述声纹特征模板对应一个用户；

所述身份识别模块，用于分别计算所述待识别语音信号的声纹特征所归属的类群的模板库中的声纹特征模板与所述待识别语音信号的声纹特征的相似度，确定与所述待识别语音信号的声纹特征的相似度最大的所述声纹特征模板对应的用户为所述待识别用户。

其中，所述身份识别模块用于确定与所述待识别语音信号的声纹特征的相似度最大的所述声纹特征模板对应的用户为所述待识别用户，包括：所述身份识别模块具体用于比较最大的所述相似度与预设阈值的大小；当所述最大的所述相似度大于所述预设阈值时，确定所述相似度最大的声纹特征模板对应的用户为所述待识别用户；否则，提示所述待识别用户不存在的消息。

其中，所述神经网络为RBF神经网络，所述RBF神经网络由网络输入和网络输出两部分组成。

其中，所述采用改进的K-means聚类方法对所有所述注册用户的语音信号的声纹特征进行聚类分析，包括：

1)设具有n个声纹特征，对n个声纹特征进行向量化，通过夹角余弦函数计算所有声纹特征两两之间的相似度，得到相似度矩阵XS；

2)对相似度矩阵XS的每一行进行求和，计算出每一个声纹特征与所有声纹特征的相似度，设XS＝[sim(a_i,a_j)]_n×n，i,j＝1,…,n，其中sim(a_i,a_j)表示样本a_i,a_j间的相似度，求和公式为：

{XS}_{p} = Σ_{j = 1}^{n} s i m (a_{i}, a_{j}), p = 1, ..., n

3)按降序排列XS_p,p＝1,…,n，设XS_p按从大到小排列的前4个值为XS_max,XS_max-1,XS_max-2,XS_max-3，若选择与最大值XS_max相对应的声纹特征作为第一个初始的聚簇中心,否则选择与XS_max,XS_max-1,XS_max-2,XS_max-3对应的四个声纹特征的均值作为第一个初始的簇中心；

4)将最大值为XS_max对应的矩阵中行向量的元素进行升序排列，假设前k-1个最小的元素为XS_pq,q＝1,…,k-1，选择前k-1个最小的元素XS_pq相对应的声纹特征作为剩余的k-1个初始的聚簇中心，其中所述k值为隐藏层个数，根据多次试验确定；

5)计算剩余样本与各初始的聚簇中心之间的相似度，将剩余样本分发到相似度最高的聚簇中，形成变化后的k个聚簇；

6)计算变化后的聚簇中各样本的均值，将其作为更新后的聚簇中心代替更新前的聚簇中心；

7)若更新前的聚簇中心与更新后的聚簇中心相同，或者目标函数达到了最小值，停止更新，所述目标函数为：

J = Σ_{l = 1}^{k} \underset{a_{x} &Element; C_{l}}{Σ} | | a_{x} - \overset{&OverBar;}{a_{x l}} | |^{2}

其中，C_l表示k个聚簇中的第l个聚簇，a_x为第l个聚簇中的样本，为第l个聚簇的中心。

其中，所述设定的比例值T的取值范围为[1.4,1.8]。

本发明的有益效果为：

1、由于待识别声纹特征所归属的类群的模板库中的声纹特征模板只是众多类群的模板库中的声纹特征模板中的一部分，计算量小，识别速度快；

2、通过改进的K-means聚类方法对所有所述注册用户的语音信号的声纹特征进行聚类分析，有效避免单一采取随机抽样方法所带来的偶然性，提高了聚类稳定性，进一步提高了身份识别精度。

附图说明

利用附图对本发明作进一步说明，但附图中的实施例不构成对本发明的任何限制，对于本领域的普通技术人员，在不付出创造性劳动的前提下，还可以根据以下附图获得其它的附图。

图1是本发明各模块的连接示意图；

图2是本发明系统运作的原理示意图。

附图标记：

特征采集模块 1、特征聚类模块 2、神经网络训练模块 3、身份识别模块 4。

具体实施方式

结合以下实施例对本发明作进一步描述。

实施例1

参见图1、图2，本实施例的身份识别系统，包括特征采集模块1、特征聚类模块2、神经网络训练模块3、身份识别模块4；

所述特征采集模块1用于采集注册用户的语音信号的声纹特征和待识别用户的待识别语音信号的声纹特征；

所述特征聚类模块2，用于采用改进的K-means聚类方法对所有所述注册用户的语音信号的声纹特征进行聚类分析，输出聚类结果；

所述神经网络训练模块3，用于将所述聚类结果作为训练样本，采用神经网络计算出每个属性每一层的权值，并得到一个训练好的神经网络，将所述待识别语音信号的声纹特征输入训练好的神经网络中，确定所述待识别语音信号的声纹特征所归属的类群；其中，每个所述类群对应一个模板库，所述模板库包括归属于所述类群的声纹特征模板，每个所述声纹特征模板对应一个用户；

所述身份识别模块4，用于分别计算所述待识别语音信号的声纹特征所归属的类群的模板库中的声纹特征模板与所述待识别语音信号的声纹特征的相似度，确定与所述待识别语音信号的声纹特征的相似度最大的所述声纹特征模板对应的用户为所述待识别用户。

其中，所述身份识别模块4用于确定与所述待识别语音信号的声纹特征的相似度最大的所述声纹特征模板对应的用户为所述待识别用户，包括：所述身份识别模块4具体用于比较最大的所述相似度与预设阈值的大小；当所述最大的所述相似度大于所述预设阈值时，确定所述相似度最大的声纹特征模板对应的用户为所述待识别用户；否则，提示所述待识别用户不存在的消息。

{XS}_{p} = Σ_{j = 1}^{n} s i m (a_{i}, a_{j}), p = 1, ..., n

J = Σ_{l = 1}^{k} \underset{a_{x} &Element; C_{l}}{Σ} | | a_{x} - \overset{&OverBar;}{a_{x l}} | |^{2}

其中，所述设定的比例值T的取值范围为[1.4,1.8]。

本实施例由于待识别声纹特征所归属的类群的模板库中的声纹特征模板只是众多类群的模板库中的声纹特征模板中的一部分，计算量小，识别速度快；通过改进的K-means聚类方法对所有所述注册用户的语音信号的声纹特征进行聚类分析，有效避免单一采取随机抽样方法所带来的偶然性，提高了聚类稳定性，进一步提高了身份识别精度，其中设定比例值T＝1.4，识别精度相对提高了3.5％。

实施例2

{XS}_{p} = Σ_{j = 1}^{n} s i m (a_{i}, a_{j}), p = 1, ..., n

J = Σ_{l = 1}^{k} \underset{a_{x} &Element; C_{l}}{Σ} | | a_{x} - \overset{&OverBar;}{a_{x l}} | |^{2}

其中，所述设定的比例值T的取值范围为[1.4,1.8]。

本实施例由于待识别声纹特征所归属的类群的模板库中的声纹特征模板只是众多类群的模板库中的声纹特征模板中的一部分，计算量小，识别速度快；通过改进的K-means聚类方法对所有所述注册用户的语音信号的声纹特征进行聚类分析，有效避免单一采取随机抽样方法所带来的偶然性，提高了聚类稳定性，进一步提高了身份识别精度，其中设定比例值T＝1.5，识别精度相对提高了4％。

实施例3

{XS}_{p} = Σ_{j = 1}^{n} s i m (a_{i}, a_{j}), p = 1, ..., n

J = Σ_{l = 1}^{k} \underset{a_{x} &Element; C_{l}}{Σ} | | a_{x} - \overset{&OverBar;}{a_{x l}} | |^{2}

其中，所述设定的比例值T的取值范围为[1.4,1.8]。

本实施例由于待识别声纹特征所归属的类群的模板库中的声纹特征模板只是众多类群的模板库中的声纹特征模板中的一部分，计算量小，识别速度快；通过改进的K-means聚类方法对所有所述注册用户的语音信号的声纹特征进行聚类分析，有效避免单一采取随机抽样方法所带来的偶然性，提高了聚类稳定性，进一步提高了身份识别精度，其中设定比例值T＝1.6，识别精度相对提高了3.5％。

实施例4

{XS}_{p} = Σ_{j = 1}^{n} s i m (a_{i}, a_{j}), p = 1, ..., n

J = Σ_{l = 1}^{k} \underset{a_{x} &Element; C_{l}}{Σ} | | a_{x} - \overset{&OverBar;}{a_{x l}} | |^{2}

其中，所述设定的比例值T的取值范围为[1.4,1.8]。

本实施例由于待识别声纹特征所归属的类群的模板库中的声纹特征模板只是众多类群的模板库中的声纹特征模板中的一部分，计算量小，识别速度快；通过改进的K-means聚类方法对所有所述注册用户的语音信号的声纹特征进行聚类分析，有效避免单一采取随机抽样方法所带来的偶然性，提高了聚类稳定性，进一步提高了身份识别精度，其中设定比例值T＝1.7，识别精度相对提高了2.8％。

实施例5

{XS}_{p} = Σ_{j = 1}^{n} s i m (a_{i}, a_{j}), p = 1, ..., n

J = Σ_{l = 1}^{k} \underset{a_{x} &Element; C_{l}}{Σ} | | a_{x} - \overset{&OverBar;}{a_{x l}} | |^{2}

其中，所述设定的比例值T的取值范围为[1.4,1.8]。

本实施例由于待识别声纹特征所归属的类群的模板库中的声纹特征模板只是众多类群的模板库中的声纹特征模板中的一部分，计算量小，识别速度快；通过改进的K-means聚类方法对所有所述注册用户的语音信号的声纹特征进行聚类分析，有效避免单一采取随机抽样方法所带来的偶然性，提高了聚类稳定性，进一步提高了身份识别精度，其中设定比例值T＝1.8，识别精度相对提高了1.5％。

最后应当说明的是，以上实施例仅用以说明本发明的技术方案，而非对本发明保护范围的限制，尽管参照较佳实施例对本发明作了详细地说明，本领域的普通技术人员应当理解，可以对本发明的技术方案进行修改或者等同替换，而不脱离本发明技术方案的实质和范围。

Claims

1.一种身份识别系统，其特征在于，包括特征采集模块、特征聚类模块、神经网络训练模块、身份识别模块；

2.根据权利要求1所述的一种身份识别系统，其特征在于，所述身份识别模块用于确定与所述待识别语音信号的声纹特征的相似度最大的所述声纹特征模板对应的用户为所述待识别用户，包括：所述身份识别模块具体用于比较最大的所述相似度与预设阈值的大小；当所述最大的所述相似度大于所述预设阈值时，确定所述相似度最大的声纹特征模板对应的用户为所述待识别用户；否则，提示所述待识别用户不存在的消息。

3.根据权利要求1所述的一种身份识别系统，其特征在于，所述神经网络为RBF神经网络，所述RBF神经网络由网络输入和网络输出两部分组成。

4.根据权利要求1所述的一种身份识别系统，其特征在于，所述采用改进的K-means聚类方法对所有所述注册用户的语音信号的声纹特征进行聚类分析，包括：

2)对相似度矩阵XS的每一行进行求和，计算出每一个声纹特征与所有声纹特征的相似度，设XS＝[sim(a_i，a_j)]_n×n，i，j＝1，...，n，其中sim(a_i，a_j)表示样本a_i，a_j间的相似度，求和公式为：

3)按降序排列XS_p，p＝1，...，n，设XS_p按从大到小排列的前4个值为XS_max，XS_max-1，XS_max-2，XS_max-3，若选择与最大值XS_max相对应的声纹特征作为第一个初始的聚簇中心,否则选择与XS_max，XS_max-1，XS_max-2，XS_max-3对应的四个声纹特征的均值作为第一个初始的簇中心；

4)将最大值为XS_max对应的矩阵中行向量的元素进行升序排列，假设前k-1个最小的元素为XS_pq，q＝1，...，k-1，选择前k-1个最小的元素XS_pq相对应的声纹特征作为剩余的k-1个初始的聚簇中心，其中所述k值为隐藏层个数，根据多次试验确定；

5.根据权利要求1所述的一种身份识别系统，其特征在于，所述设定的比例值T的取值范围为[1.4，1.8]。