CN102522086A

CN102522086A - 一种有序序列相似性对比方法的声纹识别应用

Info

Publication number: CN102522086A
Application number: CN2011104439226A
Authority: CN
Inventors: 吴丽丽; 王守觉
Original assignee: Suzhou Institute of Nano Tech and Nano Bionics of CAS
Current assignee: Suzhou Institute of Nano Tech and Nano Bionics of CAS
Priority date: 2011-12-27
Filing date: 2011-12-27
Publication date: 2012-06-27

Abstract

本发明涉及一种有序序列相似性对比方法的声纹识别应用，该声纹识别的过程包括语音特征空间建立，子空间划分，训练语句特征提取，测试语句特征提取及声纹序列比对识别。特别地，该声纹序列比对识别采用有序序列相似性对比方法得到，包括步骤：1）将序列转化为特征数组；2）比较两个数组的列数；3）对两数组进行标号匹配；4）计算各标号对相似性贡献大小；5）计算整体相似性。采用本发明方法计算两条有序序列的相似性，充分利用了序列的排列顺序信息，具有计算量小，节省存储资源等优点，克服了基于概率统计的建模方法存在的问题，适合于系统资源有限的嵌入式系统使用。

Description

一种有序序列相似性对比方法的声纹识别应用

技术领域

本发明涉及一种声纹识别技术，尤其涉及一种将极具运算简化性序列对比方法引入新型的声纹识别的一种应用技术。

背景技术

说话人识别和指纹，虹膜，人脸识别等一样，属于生物识别的一种，被认为是最自然的生物特征识别身份鉴定方式，又称“声纹”识别。说话人识别具有采集设备简单，系统价格低廉，容易被人们接受等优点。门禁系统、保险柜、个人设备（汽车、电脑、手机、PDA等）使用权限控制等使用场合，文本相关的说话人确认方法，可以通过说话人语音生物特征和语音内容双方面进行验证，同时短语音即可实现学习和测试过程，具有突出的应用优势。

说话人识别的基本过程为语音采集，特征提取，分类模型。常见的语音特征提取方法是利用语音的短时平稳特性，采用美倒谱变换（MFCC）方法将语音转换为语音特征点集。之后经过学习过程对说话人语音进行建模得到说话人的分类模型。隐马尔可夫模型（HMM）是目前公认的在文本相关的说话人识别中效果最好的建模方法。HMM一方面用隐含的状态对应于声学层相对稳定的发音单位，并通过状态转移和状态驻留来描述发音的变化；另一方面它引入了概率统计模型，用概率密度函数计算语音参数对HMM模型的输出概率，通过搜索最佳状态序列，以最大后验概率为准则找到识别结果。但其存在几个问题：（1）需要更多学习样本。（2）计算复杂度高。（3）得到的模型数据量大。对于资源有限的嵌入式系统，以上问题，限制了算法的使用。因此需要一种新的方法解决上述问题。

为了解决这一问题，设计了一种新的说话人特征变换方法（声纹识别方法，专利申请号为：2011106714601），这种新的特征变换方法将一段语音转换为一段有序序列，将说话人识别问题转换为有序序列的相似性比较问题。该序列具有时序性，不等长，同时相同符号间“杂质”较多（即相同符号间存在其它与相同符号无关的符号）的情况，传统的以编辑距离为基础的字符串比较方法存在未能考虑字符串序列的时序特性，同时计算复杂度高，依赖序列长度等问题。

发明内容

本发明的目的在于提出一种有序序列相似性对比方法的声纹识别应用，以解决计算复杂度高，依赖序列长度等问题。

为了解决以上技术问题，本发明一种有序序列相似性对比方法的声纹识别应用，所述声纹识别的过程包括语音特征空间建立，子空间划分，训练语句特征提取，测试语句特征提取及声纹序列比对识别，其特征在于：所述声纹序列比对识别采用有序序列相似性对比方法得到，包括步骤：Ⅰ、将两组有序序列转化为特征数组，对于任一组有序序列，所述特征数组按行分包括序列的标号、连续相同的该标号的个数和连续相同的首个标号的起始位置；Ⅱ、比较两个特征数组的列数，区分长、短数组；Ⅲ、对两个特征数组进行标号匹配，按序查找两组特征数组中具有相似位置特征的所有标号，并标记该些标号具有相似性贡献；Ⅳ、计算各具相似性贡献的标号的贡献大小，求和得到两组有序序列的整体相似性；Ⅴ、设定整体相似性相关的声纹判定阀值，得出声纹识别结果。

进一步地，所述特征数组的构成包括第一行为按出现次序记入的序列标号，连续相同的标号只记录一次，第二行为对应标号每个连续相同标号的个数，第三行为每个标号之前的所有标号个数取和与全部标号个数总和的商值。

进一步地，步骤Ⅲ中所述进行标号匹配是指顺序提取短数组中的标号，在长数组中查找该标号的位置并记录，每个短数组标号在长数组中的起始查找位置为上一个被记录的位置，遍历短数组全部标号，且当在长数组中找到匹配的标号时，对比标号在两数组中的位置相似型。

进一步地，步骤Ⅳ中所述贡献大小的计算为将判定为有贡献的两组标号的数量相除，比值小于1时取比值，比值大于1时取比值的倒数，之后乘以各组号数量分别占各自序列长度的比例。

实施本发明的有益效果为：通过将该序列相似性对比方法引入声纹识别应用，实现声纹的阀值可控判定，具有计算量小，节省存储资源等优点，克服了基于概率统计方法数据处理甚巨的问题，适合于系统资源有限的嵌入式系统使用。

附图说明

图1为有序序列相似性对比流程示意图。

图2为序列转化为特征数组的示意图。

图3为数组标号匹配示意图。

具体实施方式

鉴于背景技术中介绍的当前关于声纹识别研究中存在的问题，并且延续在先申请“一种声纹识别方法”的方法，出于节省存储资源及减少声纹识别要求的系统配置等需求，本发明创新提出了一种将有序序列相似性对比方法引入声纹识别的应用方案。

从前案可以简单认识到，所提出的声纹识别的过程大致包括语音特征空间建立，子空间划分，训练语句特征提取，测试语句特征提取及声纹序列比对识别等几个步骤。本发明的应用特征即体现在最后一步的声纹序列比对，该声纹序列比对识别采用有序序列相似性对比方法得到，包括步骤：Ⅰ、将两组有序序列转化为特征数组，对于任一组有序序列，所述特征数组按行分包括序列的标号、连续相同的该标号的个数和连续相同的首个标号的起始位置；Ⅱ、比较两个特征数组的列数，区分长、短数组；Ⅲ、对两个特征数组进行标号匹配，按序查找两组特征数组中具有相似位置特征的所有标号，并标记该些标号具有相似性贡献；Ⅳ、计算各具相似性贡献的标号的贡献大小，求和得到两组有序序列的整体相似性；Ⅴ、设定整体相似性相关的声纹判定阀值，得出声纹识别结果。

结合附图具体来看：步骤Ⅰ、将序列转化为特征数组。如图2所示，按照标号出现的次序记入特征数组第一行（连续的相同标号只记一个），对每个连续相同标号的个数进行计数，对应的记入特征数组第二行，将每个标号之前所有标号的个数取和除以全部标号个数的总和，对应的记入特征数组的第三行。

步骤Ⅱ、比较两个数组的列数，本步骤无特殊说明，只为区分长、短数组。

步骤Ⅲ、对两数组进行标号匹配。如图3所示，顺序提取短数组中的标号，在长数组中查找该标号的位置，记录该位置，如果长数组中找不到该标号，则提取下一个短数组标号继续查找，直到短数组中所有的标号都完成查找。每个短数组标号在长数组中的起始查找位置为为上一个被记录的位置，在长数组中找到标号时，对比该标号在长短数组中的位置是否相似，如果相似则认为该组标号对相似性有贡献。对该组标号进行标记。

步骤Ⅳ、计算各标号对相似性贡献大小。各标号相似性贡献大小采用以下方式计算，将判定为有贡献的两组标号的数量相除，比值小于1时取比值，比值大于1时取比值倒数，之后乘以各标号数量分别占各自序列长度的比例。结合图3所示，第一列标号对相似性的贡献大小为：（3/4）*（4/12）*（3/13）≈0.058。

步骤Ⅴ、计算整体相似性。将按上述方法获得的各个具相似贡献的标号对相似性贡献大小取和，就得到两序列的整体相似性。

经过上述步骤得到的整体相似性结果，作为说话人确认的判断依据，设定阈值，即可准确得到确认结果。

除上述实施例外，本发明有序序列相似性对比方法还可以有其它多种实施方式。凡采用等同替换或等效变换形成的技术方案，并应用于该种声纹识别技术，均落在本发明要求的保护范围。

Claims

1.一种有序序列相似性对比方法的声纹识别应用，所述声纹识别的过程包括语音特征空间建立，子空间划分，训练语句特征提取，测试语句特征提取及声纹序列比对识别，其特征在于：所述声纹序列比对识别采用有序序列相似性对比方法得到，包括步骤：

Ⅰ、将两组有序序列转化为特征数组，对于任一组有序序列，所述特征数组按行分包括序列的标号、连续相同的该标号的个数和连续相同的首个标号的起始位置；

Ⅱ、比较两个特征数组的列数，区分长、短数组；

Ⅲ、对两个特征数组进行标号匹配，按序查找两组特征数组中具有相似位置特征的所有标号，并标记该些标号具有相似性贡献；

Ⅳ、计算各具相似性贡献的标号的贡献大小，求和得到两组有序序列的整体相似性；

Ⅴ、设定整体相似性相关的声纹判定阀值，得出声纹识别结果。

2.根据权利要求1所述的一种有序序列相似性对比方法的声纹识别应用，其特征在于：所述特征数组的构成包括第一行为按出现次序记入的序列标号，连续相同的标号只记录一次，第二行为对应标号每个连续相同标号的个数，第三行为每个标号之前的所有标号个数取和与全部标号个数总和的商值。

3.根据权利要求1所述的一种有序序列相似性对比方法的声纹识别应用，其特征在于：步骤Ⅲ中所述进行标号匹配是指顺序提取短数组中的标号，在长数组中查找该标号的位置并记录，每个短数组标号在长数组中的起始查找位置为上一个被记录的位置，遍历短数组全部标号，且当在长数组中找到匹配的标号时，对比标号在两数组中的位置相似型。

4.根据权利要求1所述的一种有序序列相似性对比方法的声纹识别应用，其特征在于：步骤Ⅳ中所述贡献大小的计算为将判定为有贡献的两组标号的数量相除，比值小于1时取比值，比值大于1时取比值的倒数，之后乘以各组号数量分别占各自序列长度的比例。