CN1790482A

CN1790482A - 一种增强语音识别系统模板匹配精确度的方法

Info

Publication number: CN1790482A
Application number: CNA2005101023800A
Authority: CN
Inventors: 危然
Original assignee: Individual
Current assignee: Individual
Priority date: 2005-12-19
Filing date: 2005-12-19
Publication date: 2006-06-21

Abstract

本发明公开了一种提高语音识别系统模板匹配精确度的方法，此方法在语音识别系统进行模板匹配时，在选取适当的聚焦因子F后，为语音信号与模板的匹配程度建立相似函数，对相似度的临界部分进行非线性聚焦，即离相似与不相似的分界值越近的语音信号，其特征数据的抽取密度越大，使得原来模糊的分界被清晰化，大大提高了模板匹配的精确度。

Description

一种增强语音识别系统模板匹配精确度的方法

技术领域

本发明涉及一种语音识别系统，特别是涉及一种提高语音识别系统模板匹配精确度的方法。

背景技术

语音系统是通过对所收到的语音信号进行处理，提取相应的特征或建立相应的模型，然后据此做出语音识别的判断。具体来说，语音识别一般分为两个步骤。第一步是系统“学习”和“训练”阶段，这一阶段的任务是建立识别基本单元的声学模型以及进行文法分析的语言模型等，即建立模型库。第二步是“识别”或“测试”阶段，根据识别系统的类型选择能够满足要求的一种识别方法，采用语音分析方法分析出这种识别方法所要求的语音特征参数，按照一定的准则和测度与系统模型进行比较，通过判决得出识别结果，亦即模式匹配判别。

识别系统工作时，首先要将语音信号经放大、带通滤波、A/D变换后存入存储器(例如RAM)内，这就是该语音的模板。这种模板根据存储器的大小而达到一定数量。一个未知的语音信号，经上述各部分电路，由CPU将此信号的数据存入存储器内的某一特定区域，将此未知信号与存储器内各模板逐一比较，我们采用模板匹配法。计算测度再经识别策略，将识别测度失真最小的一个模板输出，这就是这种识别系统的工作原理。

利用模板匹配进行语音识别，首先要对语音进行训练并建立特征模板库，然后对采集的语音信号进行特征提取，与模板库的特征进行比较。模板的匹配需要一个标准，这就是失真度的概念。常用的失真测度有欧式距离、数频谱距离、倒谱距离，以及板仓—齐藤距离等。

在进行模板匹配时，匹配度为0％-100％之间，普通模板匹配的过程是均匀分割这段区间，在每个区间内的匹配度还是进行四舍五入来确定它靠近哪个分界点。在靠近40％-60％这段区间内进行匹配的判别比较模糊，很难准确归属为匹配或不匹配。一般的模板匹配方法对于相似度不太大的语音信号不容易判断准确。

发明内容

针对一般的模板匹配方法对于相似度不太大的语音信号不容易判断准确的问题，本发明所提出的方法目的在于采用一种非线性的新型匹配度取值方式，相当于将语音信号的匹配边界的特征数据的抽取密度增大，使得原来模糊的分界部分被细化而清晰，从而获得提高模板匹配精确度的效果。

为达到所述目的，在比较语音信号与模板的匹配程度过程中，为语音信号与模板的匹配程度建立相似函数，对相似度的临界部分进行非线性聚焦，即离相似与不相似的分界值越近的语音信号，其特征数据的抽取密度越大。建立语音信号与模板的匹配程度的相似函数的步骤如下：

1)根据语音信号的特点，选择一个合适的聚焦因子F，其中F∈(0，1)；

2)确定匹配度好与不好的交界数值M；

3)以匹配度好与不好的交界数值M为焦点，以匹配度低端边界值边界0为起点，以100％(即1)匹配度为终点，在匹配度的取值范围[0，1]内非线性的分为2n+1份，其分段点分别是：

M×F

M×F+M×F²

……

M×F+M×F²+M×F³+…+M×Fⁿ

N×F-N×F²-N×F³…-N×Fⁿ+M

……

N×F-N×F²+M

N×F+M

其中N＝1-M，2n个分段点将匹配度取值范围[0，1]范围分为2n+1份，离相似与不相似的分界值越接近的语音信号，其特征数据的抽取密度越大，使得原来模糊的分界被清晰化，大大提高了模板匹配的精确度。

附图说明

图1是语音识别工作原理图。

图2是建立语音信号与模板的匹配程度的相似函数方法的流程图。

具体实施方式

下面结合图1、图2说明本发明的一种实施方式。

根据图1，语音信号经预处理，即信号放大、带通滤波、A/D变换后，进行语音特征参数提取，根据训练及识别模式的不同，在训练模式下存入存储区内作为该语音的模板，模板根据存储区的大小而达到一定的数量。在识别模式下，将此信号数据存入存储器的某一特定区域，将此未知信号与存储器内各模板逐一比较，我们采用模板匹配法。在进行测度估计时，本发明的方法采用了一种非线性的新型匹配度取值方式，相当于将语音信号的匹配边界的特征数据的抽取密度增大，使得原来模糊的分界部分被细化而清晰，从而获得提高模板匹配精确度的效果。经由专家系统进行识别决策，将识别测度失真最小的一个模板输出。

在比较语音信号与模板的匹配程度过程中，本发明为语音信号与模板的匹配程度建立相似函数，对相似度的临界部分进行非线性聚焦，即离相似与不相似的分界值越近的语音信号，其特征数据的抽取密度越大。

如图2所示，建立语音信号与模板的匹配程度的相似函数的步骤如下：

1)根据语音信号的特点，选择一个合适的聚焦因子F，其中F∈(0，1)，F取值是根据经验或实验来选取，因为语音识别的对象总是在不断变化的，每一套语音识别系统是针对特定的对象而设计的，F值相应需取不同的值。所以在确定F值之前需做大量的实验，并根据以往的经验或专家知识来选取特定的F值；

2)确定匹配度好与不好的交界数值M，其过程与现有技术相同或类似；

M×F

M×F+M×F²

……

M×F+M×F²+M×F³+…+M×Fⁿ

N×F-N×F²-N×F³…-N×Fⁿ+M

……

N×F-N×F²+M

N×F+M

其中N＝1-M，2n个分段点将匹配度取值范围[0，1]范围分为2n+1份，进行非线性划分后，靠近模糊区间时，划分的密度增大，步长(区间分段的距离)减小，当匹配度落入该区间内时，可以以更小的误差靠近分界点。这样可以提取更多的特征参数，进行匹配，直到匹配度在落在明确匹配或明确不匹配的范围内为止，如60％以上或40％以下。离相似与不相似的分界值越接近的语音信号，其特征数据的抽取密度越大，使得原来模糊的分界被清晰化，这样可以提高此段区间的利用率，而不是轻易的认为不匹配或勉强匹配，大大提高了模板匹配的精确度。而原有的线性划分方法对匹配度区间进行线性划分，在不明确的匹配范围内，比如40％-60％，这段区间的处理比较粗糙，容易出现误判。因此本发明的方法相对原有的线性划分方法相比，具有更优的技术效果。

Claims

1.一种提高语音识别系统模板匹配精确度的方法，其特征在于，进行模板匹配时，为语音信号与模板的匹配程度建立相似函数，对相似度的临界部分进行非线性聚焦，即离相似与不相似的分界值越近的语音信号，其特征数据的抽取密度越大。

2.根据权利要求1所述的提高语音识别系统模板匹配精确度的方法，其特征在于，所述的相似函数，由以下步骤建立：

2)确定匹配度好与不好的交界数值M；

M×F

M×F+M×F²

......

M×F+M×F²+M×F³+...+M×Fⁿ

N×F-N×F²-N×F³...-N×Fⁿ+M

......

N×F-N×F²+M

N×F+M

其中N＝1-M，2n个分段点将匹配度取值范围[0，1]范围分为2n+1份，进行非线性的匹配度取值。