CN106228045A - 一种身份识别系统 - Google Patents
一种身份识别系统 Download PDFInfo
- Publication number
- CN106228045A CN106228045A CN201610544004.5A CN201610544004A CN106228045A CN 106228045 A CN106228045 A CN 106228045A CN 201610544004 A CN201610544004 A CN 201610544004A CN 106228045 A CN106228045 A CN 106228045A
- Authority
- CN
- China
- Prior art keywords
- vocal print
- print feature
- identified
- similarity
- voice signal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/30—Authentication, i.e. establishing the identity or authorisation of security principals
- G06F21/31—User authentication
- G06F21/32—User authentication using biometric data, e.g. fingerprints, iris scans or voiceprints
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
- G06F18/23213—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Software Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biophysics (AREA)
- Mathematical Physics (AREA)
- Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Biomedical Technology (AREA)
- Computer Security & Cryptography (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Computer Hardware Design (AREA)
- Probability & Statistics with Applications (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种身份识别系统,包括:特征采集模块,用于采集注册用户的语音信号的声纹特征和待识别用户的待识别语音信号的声纹特征;特征聚类模块,用于采用改进的K‑means聚类方法对所有所述注册用户的语音信号的声纹特征进行聚类分析,输出聚类结果;神经网络训练模块,用于将所述待识别语音信号的声纹特征输入训练好的神经网络中,确定其所归属的类群;身份识别模块,用于分别计算所述待识别语音信号的声纹特征所归属的类群的模板库中的声纹特征模板与所述待识别语音信号的声纹特征的相似度,确定与所述待识别语音信号的声纹特征的相似度最大的所述声纹特征模板对应的用户为所述待识别用户。本发明计算量小,识别速度快,身份识别精度相对较高。
Description
技术领域
本发明涉及变压器故障诊断领域,具体涉及一种身份识别系统。
背景技术
现有技术中,对于身份识别的具体方法,许多利用人体本身的特征信号进行身份识别的方法开始进行实用,例如基于指纹的手机解锁技术与门禁系统、基于虹膜识别的身份认证以及基于面部识别的身份认证等等。相关技术中,常见的基于人体特征的身份识别方法为基于模板匹配的方法,其对每个需要识别的用户提取具有代表性的人体特征,通过对比人体特征与不同模板的相似度来确定人体特征合法或不合法。但是,以上身份识别方法存在一个较大的缺点,就是无法建立较大规模的身份识别系统。因为在基于模板匹配的方法中,每次身份识别时需要将待识别人体特征与总模板库中所有人体特征模板进行比较才能判断其是否为合法特征,计算量大。
发明内容
针对上述问题,本发明提供一种身份识别系统。
本发明的目的采用以下技术方案来实现:
一种身份识别系统,包括特征采集模块、特征聚类模块、神经网络训练模块、身份识别模块;
所述特征采集模块用于采集注册用户的语音信号的声纹特征和待识别用户的待识别语音信号的声纹特征;
所述特征聚类模块,用于采用改进的K-means聚类方法对所有所述注册用户的语音信号的声纹特征进行聚类分析,输出聚类结果;
所述神经网络训练模块,用于将所述聚类结果作为训练样本,采用神经网络计算出每个属性每一层的权值,并得到一个训练好的神经网络,将所述待识别语音信号的声纹特征输入训练好的神经网络中,确定所述待识别语音信号的声纹特征所归属的类群;其中,每个所述类群对应一个模板库,所述模板库包括归属于所述类群的声纹特征模板,每个所述声纹特征模板对应一个用户;
所述身份识别模块,用于分别计算所述待识别语音信号的声纹特征所归属的类群的模板库中的声纹特征模板与所述待识别语音信号的声纹特征的相似度,确定与所述待识别语音信号的声纹特征的相似度最大的所述声纹特征模板对应的用户为所述待识别用户。
其中,所述身份识别模块用于确定与所述待识别语音信号的声纹特征的相似度最大的所述声纹特征模板对应的用户为所述待识别用户,包括:所述身份识别模块具体用于比较最大的所述相似度与预设阈值的大小;当所述最大的所述相似度大于所述预设阈值时,确定所述相似度最大的声纹特征模板对应的用户为所述待识别用户;否则,提示所述待识别用户不存在的消息。
其中,所述神经网络为RBF神经网络,所述RBF神经网络由网络输入和网络输出两部分组成。
其中,所述采用改进的K-means聚类方法对所有所述注册用户的语音信号的声纹特征进行聚类分析,包括:
1)设具有n个声纹特征,对n个声纹特征进行向量化,通过夹角余弦函数计算所有声纹特征两两之间的相似度,得到相似度矩阵XS;
2)对相似度矩阵XS的每一行进行求和,计算出每一个声纹特征与所有声纹特征的相似度,设XS=[sim(ai,aj)]n×n,i,j=1,…,n,其中sim(ai,aj)表示样本ai,aj间的相似度,求和公式为:
3)按降序排列XSp,p=1,…,n,设XSp按从大到小排列的前4个值为XSmax,XSmax-1,XSmax-2,XSmax-3,若选择与最大值XSmax相对应的声纹特征作为第一个初始的聚簇中心,否则选择与XSmax,XSmax-1,XSmax-2,XSmax-3对应的四个声纹特征的均值作为第一个初始的簇中心;
4)将最大值为XSmax对应的矩阵中行向量的元素进行升序排列,假设前k-1个最小的元素为XSpq,q=1,…,k-1,选择前k-1个最小的元素XSpq相对应的声纹特征作为剩余的k-1个初始的聚簇中心,其中所述k值为隐藏层个数,根据多次试验确定;
5)计算剩余样本与各初始的聚簇中心之间的相似度,将剩余样本分发到相似度最高的聚簇中,形成变化后的k个聚簇;
6)计算变化后的聚簇中各样本的均值,将其作为更新后的聚簇中心代替更新前的聚簇中心;
7)若更新前的聚簇中心与更新后的聚簇中心相同,或者目标函数达到了最小值,停止更新,所述目标函数为:
其中,Cl表示k个聚簇中的第l个聚簇,ax为第l个聚簇中的样本,为第l个聚簇的中心。
其中,所述设定的比例值T的取值范围为[1.4,1.8]。
本发明的有益效果为:
1、由于待识别声纹特征所归属的类群的模板库中的声纹特征模板只是众多类群的模板库中的声纹特征模板中的一部分,计算量小,识别速度快;
2、通过改进的K-means聚类方法对所有所述注册用户的语音信号的声纹特征进行聚类分析,有效避免单一采取随机抽样方法所带来的偶然性,提高了聚类稳定性,进一步提高了身份识别精度。
附图说明
利用附图对本发明作进一步说明,但附图中的实施例不构成对本发明的任何限制,对于本领域的普通技术人员,在不付出创造性劳动的前提下,还可以根据以下附图获得其它的附图。
图1是本发明各模块的连接示意图;
图2是本发明系统运作的原理示意图。
附图标记:
特征采集模块 1、特征聚类模块 2、神经网络训练模块 3、身份识别模块 4。
具体实施方式
结合以下实施例对本发明作进一步描述。
实施例1
参见图1、图2,本实施例的身份识别系统,包括特征采集模块1、特征聚类模块2、神经网络训练模块3、身份识别模块4;
所述特征采集模块1用于采集注册用户的语音信号的声纹特征和待识别用户的待识别语音信号的声纹特征;
所述特征聚类模块2,用于采用改进的K-means聚类方法对所有所述注册用户的语音信号的声纹特征进行聚类分析,输出聚类结果;
所述神经网络训练模块3,用于将所述聚类结果作为训练样本,采用神经网络计算出每个属性每一层的权值,并得到一个训练好的神经网络,将所述待识别语音信号的声纹特征输入训练好的神经网络中,确定所述待识别语音信号的声纹特征所归属的类群;其中,每个所述类群对应一个模板库,所述模板库包括归属于所述类群的声纹特征模板,每个所述声纹特征模板对应一个用户;
所述身份识别模块4,用于分别计算所述待识别语音信号的声纹特征所归属的类群的模板库中的声纹特征模板与所述待识别语音信号的声纹特征的相似度,确定与所述待识别语音信号的声纹特征的相似度最大的所述声纹特征模板对应的用户为所述待识别用户。
其中,所述身份识别模块4用于确定与所述待识别语音信号的声纹特征的相似度最大的所述声纹特征模板对应的用户为所述待识别用户,包括:所述身份识别模块4具体用于比较最大的所述相似度与预设阈值的大小;当所述最大的所述相似度大于所述预设阈值时,确定所述相似度最大的声纹特征模板对应的用户为所述待识别用户;否则,提示所述待识别用户不存在的消息。
其中,所述神经网络为RBF神经网络,所述RBF神经网络由网络输入和网络输出两部分组成。
其中,所述采用改进的K-means聚类方法对所有所述注册用户的语音信号的声纹特征进行聚类分析,包括:
1)设具有n个声纹特征,对n个声纹特征进行向量化,通过夹角余弦函数计算所有声纹特征两两之间的相似度,得到相似度矩阵XS;
2)对相似度矩阵XS的每一行进行求和,计算出每一个声纹特征与所有声纹特征的相似度,设XS=[sim(ai,aj)]n×n,i,j=1,…,n,其中sim(ai,aj)表示样本ai,aj间的相似度,求和公式为:
3)按降序排列XSp,p=1,…,n,设XSp按从大到小排列的前4个值为XSmax,XSmax-1,XSmax-2,XSmax-3,若选择与最大值XSmax相对应的声纹特征作为第一个初始的聚簇中心,否则选择与XSmax,XSmax-1,XSmax-2,XSmax-3对应的四个声纹特征的均值作为第一个初始的簇中心;
4)将最大值为XSmax对应的矩阵中行向量的元素进行升序排列,假设前k-1个最小的元素为XSpq,q=1,…,k-1,选择前k-1个最小的元素XSpq相对应的声纹特征作为剩余的k-1个初始的聚簇中心,其中所述k值为隐藏层个数,根据多次试验确定;
5)计算剩余样本与各初始的聚簇中心之间的相似度,将剩余样本分发到相似度最高的聚簇中,形成变化后的k个聚簇;
6)计算变化后的聚簇中各样本的均值,将其作为更新后的聚簇中心代替更新前的聚簇中心;
7)若更新前的聚簇中心与更新后的聚簇中心相同,或者目标函数达到了最小值,停止更新,所述目标函数为:
其中,Cl表示k个聚簇中的第l个聚簇,ax为第l个聚簇中的样本,为第l个聚簇的中心。
其中,所述设定的比例值T的取值范围为[1.4,1.8]。
本实施例由于待识别声纹特征所归属的类群的模板库中的声纹特征模板只是众多类群的模板库中的声纹特征模板中的一部分,计算量小,识别速度快;通过改进的K-means聚类方法对所有所述注册用户的语音信号的声纹特征进行聚类分析,有效避免单一采取随机抽样方法所带来的偶然性,提高了聚类稳定性,进一步提高了身份识别精度,其中设定比例值T=1.4,识别精度相对提高了3.5%。
实施例2
参见图1、图2,本实施例的身份识别系统,包括特征采集模块1、特征聚类模块2、神经网络训练模块3、身份识别模块4;
所述特征采集模块1用于采集注册用户的语音信号的声纹特征和待识别用户的待识别语音信号的声纹特征;
所述特征聚类模块2,用于采用改进的K-means聚类方法对所有所述注册用户的语音信号的声纹特征进行聚类分析,输出聚类结果;
所述神经网络训练模块3,用于将所述聚类结果作为训练样本,采用神经网络计算出每个属性每一层的权值,并得到一个训练好的神经网络,将所述待识别语音信号的声纹特征输入训练好的神经网络中,确定所述待识别语音信号的声纹特征所归属的类群;其中,每个所述类群对应一个模板库,所述模板库包括归属于所述类群的声纹特征模板,每个所述声纹特征模板对应一个用户;
所述身份识别模块4,用于分别计算所述待识别语音信号的声纹特征所归属的类群的模板库中的声纹特征模板与所述待识别语音信号的声纹特征的相似度,确定与所述待识别语音信号的声纹特征的相似度最大的所述声纹特征模板对应的用户为所述待识别用户。
其中,所述身份识别模块4用于确定与所述待识别语音信号的声纹特征的相似度最大的所述声纹特征模板对应的用户为所述待识别用户,包括:所述身份识别模块4具体用于比较最大的所述相似度与预设阈值的大小;当所述最大的所述相似度大于所述预设阈值时,确定所述相似度最大的声纹特征模板对应的用户为所述待识别用户;否则,提示所述待识别用户不存在的消息。
其中,所述神经网络为RBF神经网络,所述RBF神经网络由网络输入和网络输出两部分组成。
其中,所述采用改进的K-means聚类方法对所有所述注册用户的语音信号的声纹特征进行聚类分析,包括:
1)设具有n个声纹特征,对n个声纹特征进行向量化,通过夹角余弦函数计算所有声纹特征两两之间的相似度,得到相似度矩阵XS;
2)对相似度矩阵XS的每一行进行求和,计算出每一个声纹特征与所有声纹特征的相似度,设XS=[sim(ai,aj)]n×n,i,j=1,…,n,其中sim(ai,aj)表示样本ai,aj间的相似度,求和公式为:
3)按降序排列XSp,p=1,…,n,设XSp按从大到小排列的前4个值为XSmax,XSmax-1,XSmax-2,XSmax-3,若选择与最大值XSmax相对应的声纹特征作为第一个初始的聚簇中心,否则选择与XSmax,XSmax-1,XSmax-2,XSmax-3对应的四个声纹特征的均值作为第一个初始的簇中心;
4)将最大值为XSmax对应的矩阵中行向量的元素进行升序排列,假设前k-1个最小的元素为XSpq,q=1,…,k-1,选择前k-1个最小的元素XSpq相对应的声纹特征作为剩余的k-1个初始的聚簇中心,其中所述k值为隐藏层个数,根据多次试验确定;
5)计算剩余样本与各初始的聚簇中心之间的相似度,将剩余样本分发到相似度最高的聚簇中,形成变化后的k个聚簇;
6)计算变化后的聚簇中各样本的均值,将其作为更新后的聚簇中心代替更新前的聚簇中心;
7)若更新前的聚簇中心与更新后的聚簇中心相同,或者目标函数达到了最小值,停止更新,所述目标函数为:
其中,Cl表示k个聚簇中的第l个聚簇,ax为第l个聚簇中的样本,为第l个聚簇的中心。
其中,所述设定的比例值T的取值范围为[1.4,1.8]。
本实施例由于待识别声纹特征所归属的类群的模板库中的声纹特征模板只是众多类群的模板库中的声纹特征模板中的一部分,计算量小,识别速度快;通过改进的K-means聚类方法对所有所述注册用户的语音信号的声纹特征进行聚类分析,有效避免单一采取随机抽样方法所带来的偶然性,提高了聚类稳定性,进一步提高了身份识别精度,其中设定比例值T=1.5,识别精度相对提高了4%。
实施例3
参见图1、图2,本实施例的身份识别系统,包括特征采集模块1、特征聚类模块2、神经网络训练模块3、身份识别模块4;
所述特征采集模块1用于采集注册用户的语音信号的声纹特征和待识别用户的待识别语音信号的声纹特征;
所述特征聚类模块2,用于采用改进的K-means聚类方法对所有所述注册用户的语音信号的声纹特征进行聚类分析,输出聚类结果;
所述神经网络训练模块3,用于将所述聚类结果作为训练样本,采用神经网络计算出每个属性每一层的权值,并得到一个训练好的神经网络,将所述待识别语音信号的声纹特征输入训练好的神经网络中,确定所述待识别语音信号的声纹特征所归属的类群;其中,每个所述类群对应一个模板库,所述模板库包括归属于所述类群的声纹特征模板,每个所述声纹特征模板对应一个用户;
所述身份识别模块4,用于分别计算所述待识别语音信号的声纹特征所归属的类群的模板库中的声纹特征模板与所述待识别语音信号的声纹特征的相似度,确定与所述待识别语音信号的声纹特征的相似度最大的所述声纹特征模板对应的用户为所述待识别用户。
其中,所述身份识别模块4用于确定与所述待识别语音信号的声纹特征的相似度最大的所述声纹特征模板对应的用户为所述待识别用户,包括:所述身份识别模块4具体用于比较最大的所述相似度与预设阈值的大小;当所述最大的所述相似度大于所述预设阈值时,确定所述相似度最大的声纹特征模板对应的用户为所述待识别用户;否则,提示所述待识别用户不存在的消息。
其中,所述神经网络为RBF神经网络,所述RBF神经网络由网络输入和网络输出两部分组成。
其中,所述采用改进的K-means聚类方法对所有所述注册用户的语音信号的声纹特征进行聚类分析,包括:
1)设具有n个声纹特征,对n个声纹特征进行向量化,通过夹角余弦函数计算所有声纹特征两两之间的相似度,得到相似度矩阵XS;
2)对相似度矩阵XS的每一行进行求和,计算出每一个声纹特征与所有声纹特征的相似度,设XS=[sim(ai,aj)]n×n,i,j=1,…,n,其中sim(ai,aj)表示样本ai,aj间的相似度,求和公式为:
3)按降序排列XSp,p=1,…,n,设XSp按从大到小排列的前4个值为XSmax,XSmax-1,XSmax-2,XSmax-3,若选择与最大值XSmax相对应的声纹特征作为第一个初始的聚簇中心,否则选择与XSmax,XSmax-1,XSmax-2,XSmax-3对应的四个声纹特征的均值作为第一个初始的簇中心;
4)将最大值为XSmax对应的矩阵中行向量的元素进行升序排列,假设前k-1个最小的元素为XSpq,q=1,…,k-1,选择前k-1个最小的元素XSpq相对应的声纹特征作为剩余的k-1个初始的聚簇中心,其中所述k值为隐藏层个数,根据多次试验确定;
5)计算剩余样本与各初始的聚簇中心之间的相似度,将剩余样本分发到相似度最高的聚簇中,形成变化后的k个聚簇;
6)计算变化后的聚簇中各样本的均值,将其作为更新后的聚簇中心代替更新前的聚簇中心;
7)若更新前的聚簇中心与更新后的聚簇中心相同,或者目标函数达到了最小值,停止更新,所述目标函数为:
其中,Cl表示k个聚簇中的第l个聚簇,ax为第l个聚簇中的样本,为第l个聚簇的中心。
其中,所述设定的比例值T的取值范围为[1.4,1.8]。
本实施例由于待识别声纹特征所归属的类群的模板库中的声纹特征模板只是众多类群的模板库中的声纹特征模板中的一部分,计算量小,识别速度快;通过改进的K-means聚类方法对所有所述注册用户的语音信号的声纹特征进行聚类分析,有效避免单一采取随机抽样方法所带来的偶然性,提高了聚类稳定性,进一步提高了身份识别精度,其中设定比例值T=1.6,识别精度相对提高了3.5%。
实施例4
参见图1、图2,本实施例的身份识别系统,包括特征采集模块1、特征聚类模块2、神经网络训练模块3、身份识别模块4;
所述特征采集模块1用于采集注册用户的语音信号的声纹特征和待识别用户的待识别语音信号的声纹特征;
所述特征聚类模块2,用于采用改进的K-means聚类方法对所有所述注册用户的语音信号的声纹特征进行聚类分析,输出聚类结果;
所述神经网络训练模块3,用于将所述聚类结果作为训练样本,采用神经网络计算出每个属性每一层的权值,并得到一个训练好的神经网络,将所述待识别语音信号的声纹特征输入训练好的神经网络中,确定所述待识别语音信号的声纹特征所归属的类群;其中,每个所述类群对应一个模板库,所述模板库包括归属于所述类群的声纹特征模板,每个所述声纹特征模板对应一个用户;
所述身份识别模块4,用于分别计算所述待识别语音信号的声纹特征所归属的类群的模板库中的声纹特征模板与所述待识别语音信号的声纹特征的相似度,确定与所述待识别语音信号的声纹特征的相似度最大的所述声纹特征模板对应的用户为所述待识别用户。
其中,所述身份识别模块4用于确定与所述待识别语音信号的声纹特征的相似度最大的所述声纹特征模板对应的用户为所述待识别用户,包括:所述身份识别模块4具体用于比较最大的所述相似度与预设阈值的大小;当所述最大的所述相似度大于所述预设阈值时,确定所述相似度最大的声纹特征模板对应的用户为所述待识别用户;否则,提示所述待识别用户不存在的消息。
其中,所述神经网络为RBF神经网络,所述RBF神经网络由网络输入和网络输出两部分组成。
其中,所述采用改进的K-means聚类方法对所有所述注册用户的语音信号的声纹特征进行聚类分析,包括:
1)设具有n个声纹特征,对n个声纹特征进行向量化,通过夹角余弦函数计算所有声纹特征两两之间的相似度,得到相似度矩阵XS;
2)对相似度矩阵XS的每一行进行求和,计算出每一个声纹特征与所有声纹特征的相似度,设XS=[sim(ai,aj)]n×n,i,j=1,…,n,其中sim(ai,aj)表示样本ai,aj间的相似度,求和公式为:
3)按降序排列XSp,p=1,…,n,设XSp按从大到小排列的前4个值为XSmax,XSmax-1,XSmax-2,XSmax-3,若选择与最大值XSmax相对应的声纹特征作为第一个初始的聚簇中心,否则选择与XSmax,XSmax-1,XSmax-2,XSmax-3对应的四个声纹特征的均值作为第一个初始的簇中心;
4)将最大值为XSmax对应的矩阵中行向量的元素进行升序排列,假设前k-1个最小的元素为XSpq,q=1,…,k-1,选择前k-1个最小的元素XSpq相对应的声纹特征作为剩余的k-1个初始的聚簇中心,其中所述k值为隐藏层个数,根据多次试验确定;
5)计算剩余样本与各初始的聚簇中心之间的相似度,将剩余样本分发到相似度最高的聚簇中,形成变化后的k个聚簇;
6)计算变化后的聚簇中各样本的均值,将其作为更新后的聚簇中心代替更新前的聚簇中心;
7)若更新前的聚簇中心与更新后的聚簇中心相同,或者目标函数达到了最小值,停止更新,所述目标函数为:
其中,Cl表示k个聚簇中的第l个聚簇,ax为第l个聚簇中的样本,为第l个聚簇的中心。
其中,所述设定的比例值T的取值范围为[1.4,1.8]。
本实施例由于待识别声纹特征所归属的类群的模板库中的声纹特征模板只是众多类群的模板库中的声纹特征模板中的一部分,计算量小,识别速度快;通过改进的K-means聚类方法对所有所述注册用户的语音信号的声纹特征进行聚类分析,有效避免单一采取随机抽样方法所带来的偶然性,提高了聚类稳定性,进一步提高了身份识别精度,其中设定比例值T=1.7,识别精度相对提高了2.8%。
实施例5
参见图1、图2,本实施例的身份识别系统,包括特征采集模块1、特征聚类模块2、神经网络训练模块3、身份识别模块4;
所述特征采集模块1用于采集注册用户的语音信号的声纹特征和待识别用户的待识别语音信号的声纹特征;
所述特征聚类模块2,用于采用改进的K-means聚类方法对所有所述注册用户的语音信号的声纹特征进行聚类分析,输出聚类结果;
所述神经网络训练模块3,用于将所述聚类结果作为训练样本,采用神经网络计算出每个属性每一层的权值,并得到一个训练好的神经网络,将所述待识别语音信号的声纹特征输入训练好的神经网络中,确定所述待识别语音信号的声纹特征所归属的类群;其中,每个所述类群对应一个模板库,所述模板库包括归属于所述类群的声纹特征模板,每个所述声纹特征模板对应一个用户;
所述身份识别模块4,用于分别计算所述待识别语音信号的声纹特征所归属的类群的模板库中的声纹特征模板与所述待识别语音信号的声纹特征的相似度,确定与所述待识别语音信号的声纹特征的相似度最大的所述声纹特征模板对应的用户为所述待识别用户。
其中,所述身份识别模块4用于确定与所述待识别语音信号的声纹特征的相似度最大的所述声纹特征模板对应的用户为所述待识别用户,包括:所述身份识别模块4具体用于比较最大的所述相似度与预设阈值的大小;当所述最大的所述相似度大于所述预设阈值时,确定所述相似度最大的声纹特征模板对应的用户为所述待识别用户;否则,提示所述待识别用户不存在的消息。
其中,所述神经网络为RBF神经网络,所述RBF神经网络由网络输入和网络输出两部分组成。
其中,所述采用改进的K-means聚类方法对所有所述注册用户的语音信号的声纹特征进行聚类分析,包括:
1)设具有n个声纹特征,对n个声纹特征进行向量化,通过夹角余弦函数计算所有声纹特征两两之间的相似度,得到相似度矩阵XS;
2)对相似度矩阵XS的每一行进行求和,计算出每一个声纹特征与所有声纹特征的相似度,设XS=[sim(ai,aj)]n×n,i,j=1,…,n,其中sim(ai,aj)表示样本ai,aj间的相似度,求和公式为:
3)按降序排列XSp,p=1,…,n,设XSp按从大到小排列的前4个值为XSmax,XSmax-1,XSmax-2,XSmax-3,若选择与最大值XSmax相对应的声纹特征作为第一个初始的聚簇中心,否则选择与XSmax,XSmax-1,XSmax-2,XSmax-3对应的四个声纹特征的均值作为第一个初始的簇中心;
4)将最大值为XSmax对应的矩阵中行向量的元素进行升序排列,假设前k-1个最小的元素为XSpq,q=1,…,k-1,选择前k-1个最小的元素XSpq相对应的声纹特征作为剩余的k-1个初始的聚簇中心,其中所述k值为隐藏层个数,根据多次试验确定;
5)计算剩余样本与各初始的聚簇中心之间的相似度,将剩余样本分发到相似度最高的聚簇中,形成变化后的k个聚簇;
6)计算变化后的聚簇中各样本的均值,将其作为更新后的聚簇中心代替更新前的聚簇中心;
7)若更新前的聚簇中心与更新后的聚簇中心相同,或者目标函数达到了最小值,停止更新,所述目标函数为:
其中,Cl表示k个聚簇中的第l个聚簇,ax为第l个聚簇中的样本,为第l个聚簇的中心。
其中,所述设定的比例值T的取值范围为[1.4,1.8]。
本实施例由于待识别声纹特征所归属的类群的模板库中的声纹特征模板只是众多类群的模板库中的声纹特征模板中的一部分,计算量小,识别速度快;通过改进的K-means聚类方法对所有所述注册用户的语音信号的声纹特征进行聚类分析,有效避免单一采取随机抽样方法所带来的偶然性,提高了聚类稳定性,进一步提高了身份识别精度,其中设定比例值T=1.8,识别精度相对提高了1.5%。
最后应当说明的是,以上实施例仅用以说明本发明的技术方案,而非对本发明保护范围的限制,尽管参照较佳实施例对本发明作了详细地说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或者等同替换,而不脱离本发明技术方案的实质和范围。
Claims (5)
1.一种身份识别系统,其特征在于,包括特征采集模块、特征聚类模块、神经网络训练模块、身份识别模块;
所述特征采集模块用于采集注册用户的语音信号的声纹特征和待识别用户的待识别语音信号的声纹特征;
所述特征聚类模块,用于采用改进的K-means聚类方法对所有所述注册用户的语音信号的声纹特征进行聚类分析,输出聚类结果;
所述神经网络训练模块,用于将所述聚类结果作为训练样本,采用神经网络计算出每个属性每一层的权值,并得到一个训练好的神经网络,将所述待识别语音信号的声纹特征输入训练好的神经网络中,确定所述待识别语音信号的声纹特征所归属的类群;其中,每个所述类群对应一个模板库,所述模板库包括归属于所述类群的声纹特征模板,每个所述声纹特征模板对应一个用户;
所述身份识别模块,用于分别计算所述待识别语音信号的声纹特征所归属的类群的模板库中的声纹特征模板与所述待识别语音信号的声纹特征的相似度,确定与所述待识别语音信号的声纹特征的相似度最大的所述声纹特征模板对应的用户为所述待识别用户。
2.根据权利要求1所述的一种身份识别系统,其特征在于,所述身份识别模块用于确定与所述待识别语音信号的声纹特征的相似度最大的所述声纹特征模板对应的用户为所述待识别用户,包括:所述身份识别模块具体用于比较最大的所述相似度与预设阈值的大小;当所述最大的所述相似度大于所述预设阈值时,确定所述相似度最大的声纹特征模板对应的用户为所述待识别用户;否则,提示所述待识别用户不存在的消息。
3.根据权利要求1所述的一种身份识别系统,其特征在于,所述神经网络为RBF神经网络,所述RBF神经网络由网络输入和网络输出两部分组成。
4.根据权利要求1所述的一种身份识别系统,其特征在于,所述采用改进的K-means聚类方法对所有所述注册用户的语音信号的声纹特征进行聚类分析,包括:
1)设具有n个声纹特征,对n个声纹特征进行向量化,通过夹角余弦函数计算所有声纹特征两两之间的相似度,得到相似度矩阵XS;
2)对相似度矩阵XS的每一行进行求和,计算出每一个声纹特征与所有声纹特征的相似度,设XS=[sim(ai,aj)]n×n,i,j=1,...,n,其中sim(ai,aj)表示样本ai,aj间的相似度,求和公式为:
3)按降序排列XSp,p=1,...,n,设XSp按从大到小排列的前4个值为XSmax,XSmax-1,XSmax-2,XSmax-3,若选择与最大值XSmax相对应的声纹特征作为第一个初始的聚簇中心,否则选择与XSmax,XSmax-1,XSmax-2,XSmax-3对应的四个声纹特征的均值作为第一个初始的簇中心;
4)将最大值为XSmax对应的矩阵中行向量的元素进行升序排列,假设前k-1个最小的元素为XSpq,q=1,...,k-1,选择前k-1个最小的元素XSpq相对应的声纹特征作为剩余的k-1个初始的聚簇中心,其中所述k值为隐藏层个数,根据多次试验确定;
5)计算剩余样本与各初始的聚簇中心之间的相似度,将剩余样本分发到相似度最高的聚簇中,形成变化后的k个聚簇;
6)计算变化后的聚簇中各样本的均值,将其作为更新后的聚簇中心代替更新前的聚簇中心;
7)若更新前的聚簇中心与更新后的聚簇中心相同,或者目标函数达到了最小值,停止更新,所述目标函数为:
其中,Cl表示k个聚簇中的第l个聚簇,ax为第l个聚簇中的样本,为第l个聚簇的中心。
5.根据权利要求1所述的一种身份识别系统,其特征在于,所述设定的比例值T的取值范围为[1.4,1.8]。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610544004.5A CN106228045A (zh) | 2016-07-06 | 2016-07-06 | 一种身份识别系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610544004.5A CN106228045A (zh) | 2016-07-06 | 2016-07-06 | 一种身份识别系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN106228045A true CN106228045A (zh) | 2016-12-14 |
Family
ID=57519554
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610544004.5A Withdrawn CN106228045A (zh) | 2016-07-06 | 2016-07-06 | 一种身份识别系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106228045A (zh) |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106782507A (zh) * | 2016-12-19 | 2017-05-31 | 平安科技(深圳)有限公司 | 语音分割的方法及装置 |
CN107610707A (zh) * | 2016-12-15 | 2018-01-19 | 平安科技(深圳)有限公司 | 一种声纹识别方法及装置 |
CN108429619A (zh) * | 2018-01-18 | 2018-08-21 | 北京捷通华声科技股份有限公司 | 身份认证方法和系统 |
CN108996061A (zh) * | 2018-05-24 | 2018-12-14 | 张跃 | 一种机械制造电力系统智能移动系统 |
CN109557412A (zh) * | 2018-11-27 | 2019-04-02 | 华翔翔能电气股份有限公司 | 一种变压器故障的声纹识别方法及系统 |
CN109686377A (zh) * | 2018-12-24 | 2019-04-26 | 龙马智芯(珠海横琴)科技有限公司 | 音频识别方法及装置、计算机可读存储介质 |
CN110110790A (zh) * | 2019-05-08 | 2019-08-09 | 中国科学技术大学 | 采用无监督聚类得分规整的说话人确认方法 |
CN111429920A (zh) * | 2020-03-30 | 2020-07-17 | 北京奇艺世纪科技有限公司 | 用户区分方法、用户行为库确定方法、装置及设备 |
CN113257254A (zh) * | 2021-07-01 | 2021-08-13 | 深圳市声扬科技有限公司 | 声纹识别方法、装置、电子设备及存储介质 |
-
2016
- 2016-07-06 CN CN201610544004.5A patent/CN106228045A/zh not_active Withdrawn
Cited By (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107610707A (zh) * | 2016-12-15 | 2018-01-19 | 平安科技(深圳)有限公司 | 一种声纹识别方法及装置 |
CN106782507A (zh) * | 2016-12-19 | 2017-05-31 | 平安科技(深圳)有限公司 | 语音分割的方法及装置 |
CN106782507B (zh) * | 2016-12-19 | 2018-03-06 | 平安科技(深圳)有限公司 | 语音分割的方法及装置 |
CN108429619A (zh) * | 2018-01-18 | 2018-08-21 | 北京捷通华声科技股份有限公司 | 身份认证方法和系统 |
CN108996061B (zh) * | 2018-05-24 | 2020-04-07 | 张跃 | 一种机械制造电力系统智能移动系统 |
CN108996061A (zh) * | 2018-05-24 | 2018-12-14 | 张跃 | 一种机械制造电力系统智能移动系统 |
CN109557412A (zh) * | 2018-11-27 | 2019-04-02 | 华翔翔能电气股份有限公司 | 一种变压器故障的声纹识别方法及系统 |
CN109686377A (zh) * | 2018-12-24 | 2019-04-26 | 龙马智芯(珠海横琴)科技有限公司 | 音频识别方法及装置、计算机可读存储介质 |
CN109686377B (zh) * | 2018-12-24 | 2019-11-05 | 龙马智芯(珠海横琴)科技有限公司 | 音频识别方法及装置、计算机可读存储介质 |
CN110110790A (zh) * | 2019-05-08 | 2019-08-09 | 中国科学技术大学 | 采用无监督聚类得分规整的说话人确认方法 |
CN110110790B (zh) * | 2019-05-08 | 2021-07-06 | 中国科学技术大学 | 采用无监督聚类得分规整的说话人确认方法 |
CN111429920A (zh) * | 2020-03-30 | 2020-07-17 | 北京奇艺世纪科技有限公司 | 用户区分方法、用户行为库确定方法、装置及设备 |
CN111429920B (zh) * | 2020-03-30 | 2024-01-23 | 北京奇艺世纪科技有限公司 | 用户区分方法、用户行为库确定方法、装置及设备 |
CN113257254A (zh) * | 2021-07-01 | 2021-08-13 | 深圳市声扬科技有限公司 | 声纹识别方法、装置、电子设备及存储介质 |
CN113257254B (zh) * | 2021-07-01 | 2021-10-08 | 深圳市声扬科技有限公司 | 声纹识别方法、装置、电子设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106228045A (zh) | 一种身份识别系统 | |
CN106250858A (zh) | 一种融合多种人脸识别算法的识别方法及系统 | |
CN104463101B (zh) | 用于文字性试题的答案识别方法及系统 | |
CN105184254B (zh) | 一种身份认证方法及系统 | |
CN106448684A (zh) | 基于深度置信网络特征矢量的信道鲁棒声纹识别系统 | |
CN109497990B (zh) | 一种基于典型相关分析的心电信号身份识别方法及系统 | |
CN103971690A (zh) | 一种声纹识别方法和装置 | |
CN105261367B (zh) | 一种说话人识别方法 | |
CN108564954A (zh) | 深度神经网络模型、电子装置、身份验证方法和存储介质 | |
CN109829430A (zh) | 基于异构层次化注意机制的跨模态行人再识别方法及系统 | |
CN103258157B (zh) | 一种基于手指信息的在线笔迹认证方法及系统 | |
WO2019192253A1 (zh) | 一种基于移动设备的用户身份认证方法及系统 | |
CN108399395A (zh) | 基于端到端深度神经网络的语音和人脸复合身份认证方法 | |
CN110008674B (zh) | 一种高泛化性的心电信号身份认证方法 | |
CN102413101A (zh) | 声纹密码语音提示的声纹认证系统及其实现方法 | |
CN108875907A (zh) | 一种基于深度学习的指纹识别方法和装置 | |
CN107358209A (zh) | 人脸检测模型的训练方法、装置及人脸检测方法、装置 | |
CN106529377A (zh) | 一种基于图像的年龄估计方法、装置及系统 | |
CN109858366A (zh) | 身份认证方法及装置 | |
CN102664010A (zh) | 一种基于多因素频率位移不变特征的鲁棒说话人辨别方法 | |
CN106778498A (zh) | 一种增强指纹图像识别的方法 | |
CN106411952A (zh) | 一种隔空动态手势用户身份认证方法及装置 | |
CN108960171B (zh) | 一种基于特征迁移学习的转换手势识别到身份识别的方法 | |
CN104464738B (zh) | 一种面向智能移动设备的声纹识别方法 | |
CN102237089B (zh) | 一种减少文本无关说话人识别系统误识率的方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C04 | Withdrawal of patent application after publication (patent law 2001) | ||
WW01 | Invention patent application withdrawn after publication |
Application publication date: 20161214 |