CN1790482A - 一种增强语音识别系统模板匹配精确度的方法 - Google Patents

一种增强语音识别系统模板匹配精确度的方法 Download PDF

Info

Publication number
CN1790482A
CN1790482A CNA2005101023800A CN200510102380A CN1790482A CN 1790482 A CN1790482 A CN 1790482A CN A2005101023800 A CNA2005101023800 A CN A2005101023800A CN 200510102380 A CN200510102380 A CN 200510102380A CN 1790482 A CN1790482 A CN 1790482A
Authority
CN
China
Prior art keywords
matching degree
voice signal
template
speech recognition
value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CNA2005101023800A
Other languages
English (en)
Inventor
危然
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to CNA2005101023800A priority Critical patent/CN1790482A/zh
Publication of CN1790482A publication Critical patent/CN1790482A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)

Abstract

本发明公开了一种提高语音识别系统模板匹配精确度的方法,此方法在语音识别系统进行模板匹配时,在选取适当的聚焦因子F后,为语音信号与模板的匹配程度建立相似函数,对相似度的临界部分进行非线性聚焦,即离相似与不相似的分界值越近的语音信号,其特征数据的抽取密度越大,使得原来模糊的分界被清晰化,大大提高了模板匹配的精确度。

Description

一种增强语音识别系统模板匹配精确度的方法
技术领域
本发明涉及一种语音识别系统,特别是涉及一种提高语音识别系统模板匹配精确度的方法。
背景技术
语音系统是通过对所收到的语音信号进行处理,提取相应的特征或建立相应的模型,然后据此做出语音识别的判断。具体来说,语音识别一般分为两个步骤。第一步是系统“学习”和“训练”阶段,这一阶段的任务是建立识别基本单元的声学模型以及进行文法分析的语言模型等,即建立模型库。第二步是“识别”或“测试”阶段,根据识别系统的类型选择能够满足要求的一种识别方法,采用语音分析方法分析出这种识别方法所要求的语音特征参数,按照一定的准则和测度与系统模型进行比较,通过判决得出识别结果,亦即模式匹配判别。
识别系统工作时,首先要将语音信号经放大、带通滤波、A/D变换后存入存储器(例如RAM)内,这就是该语音的模板。这种模板根据存储器的大小而达到一定数量。一个未知的语音信号,经上述各部分电路,由CPU将此信号的数据存入存储器内的某一特定区域,将此未知信号与存储器内各模板逐一比较,我们采用模板匹配法。计算测度再经识别策略,将识别测度失真最小的一个模板输出,这就是这种识别系统的工作原理。
利用模板匹配进行语音识别,首先要对语音进行训练并建立特征模板库,然后对采集的语音信号进行特征提取,与模板库的特征进行比较。模板的匹配需要一个标准,这就是失真度的概念。常用的失真测度有欧式距离、数频谱距离、倒谱距离,以及板仓—齐藤距离等。
在进行模板匹配时,匹配度为0%-100%之间,普通模板匹配的过程是均匀分割这段区间,在每个区间内的匹配度还是进行四舍五入来确定它靠近哪个分界点。在靠近40%-60%这段区间内进行匹配的判别比较模糊,很难准确归属为匹配或不匹配。一般的模板匹配方法对于相似度不太大的语音信号不容易判断准确。
发明内容
针对一般的模板匹配方法对于相似度不太大的语音信号不容易判断准确的问题,本发明所提出的方法目的在于采用一种非线性的新型匹配度取值方式,相当于将语音信号的匹配边界的特征数据的抽取密度增大,使得原来模糊的分界部分被细化而清晰,从而获得提高模板匹配精确度的效果。
为达到所述目的,在比较语音信号与模板的匹配程度过程中,为语音信号与模板的匹配程度建立相似函数,对相似度的临界部分进行非线性聚焦,即离相似与不相似的分界值越近的语音信号,其特征数据的抽取密度越大。建立语音信号与模板的匹配程度的相似函数的步骤如下:
1)根据语音信号的特点,选择一个合适的聚焦因子F,其中F∈(0,1);
2)确定匹配度好与不好的交界数值M;
3)以匹配度好与不好的交界数值M为焦点,以匹配度低端边界值边界0为起点,以100%(即1)匹配度为终点,在匹配度的取值范围[0,1]内非线性的分为2n+1份,其分段点分别是:
M×F
M×F+M×F2
……
M×F+M×F2+M×F3+…+M×Fn
N×F-N×F2-N×F3…-N×Fn+M
……
N×F-N×F2+M
N×F+M
其中N=1-M,2n个分段点将匹配度取值范围[0,1]范围分为2n+1份,离相似与不相似的分界值越接近的语音信号,其特征数据的抽取密度越大,使得原来模糊的分界被清晰化,大大提高了模板匹配的精确度。
附图说明
图1是语音识别工作原理图。
图2是建立语音信号与模板的匹配程度的相似函数方法的流程图。
具体实施方式
下面结合图1、图2说明本发明的一种实施方式。
根据图1,语音信号经预处理,即信号放大、带通滤波、A/D变换后,进行语音特征参数提取,根据训练及识别模式的不同,在训练模式下存入存储区内作为该语音的模板,模板根据存储区的大小而达到一定的数量。在识别模式下,将此信号数据存入存储器的某一特定区域,将此未知信号与存储器内各模板逐一比较,我们采用模板匹配法。在进行测度估计时,本发明的方法采用了一种非线性的新型匹配度取值方式,相当于将语音信号的匹配边界的特征数据的抽取密度增大,使得原来模糊的分界部分被细化而清晰,从而获得提高模板匹配精确度的效果。经由专家系统进行识别决策,将识别测度失真最小的一个模板输出。
在比较语音信号与模板的匹配程度过程中,本发明为语音信号与模板的匹配程度建立相似函数,对相似度的临界部分进行非线性聚焦,即离相似与不相似的分界值越近的语音信号,其特征数据的抽取密度越大。
如图2所示,建立语音信号与模板的匹配程度的相似函数的步骤如下:
1)根据语音信号的特点,选择一个合适的聚焦因子F,其中F∈(0,1),F取值是根据经验或实验来选取,因为语音识别的对象总是在不断变化的,每一套语音识别系统是针对特定的对象而设计的,F值相应需取不同的值。所以在确定F值之前需做大量的实验,并根据以往的经验或专家知识来选取特定的F值;
2)确定匹配度好与不好的交界数值M,其过程与现有技术相同或类似;
3)以匹配度好与不好的交界数值M为焦点,以匹配度低端边界值边界0为起点,以100%(即1)匹配度为终点,在匹配度的取值范围[0,1]内非线性的分为2n+1份,其分段点分别是:
M×F
M×F+M×F2
……
M×F+M×F2+M×F3+…+M×Fn
N×F-N×F2-N×F3…-N×Fn+M
……
N×F-N×F2+M
N×F+M
其中N=1-M,2n个分段点将匹配度取值范围[0,1]范围分为2n+1份,进行非线性划分后,靠近模糊区间时,划分的密度增大,步长(区间分段的距离)减小,当匹配度落入该区间内时,可以以更小的误差靠近分界点。这样可以提取更多的特征参数,进行匹配,直到匹配度在落在明确匹配或明确不匹配的范围内为止,如60%以上或40%以下。离相似与不相似的分界值越接近的语音信号,其特征数据的抽取密度越大,使得原来模糊的分界被清晰化,这样可以提高此段区间的利用率,而不是轻易的认为不匹配或勉强匹配,大大提高了模板匹配的精确度。而原有的线性划分方法对匹配度区间进行线性划分,在不明确的匹配范围内,比如40%-60%,这段区间的处理比较粗糙,容易出现误判。因此本发明的方法相对原有的线性划分方法相比,具有更优的技术效果。

Claims (2)

1.一种提高语音识别系统模板匹配精确度的方法,其特征在于,进行模板匹配时,为语音信号与模板的匹配程度建立相似函数,对相似度的临界部分进行非线性聚焦,即离相似与不相似的分界值越近的语音信号,其特征数据的抽取密度越大。
2.根据权利要求1所述的提高语音识别系统模板匹配精确度的方法,其特征在于,所述的相似函数,由以下步骤建立:
1)根据语音信号的特点,选择一个合适的聚焦因子F,其中F∈(0,1);
2)确定匹配度好与不好的交界数值M;
3)以匹配度好与不好的交界数值M为焦点,以匹配度低端边界值边界0为起点,以100%(即1)匹配度为终点,在匹配度的取值范围[0,1]内非线性的分为2n+1份,其分段点分别是:
M×F
M×F+M×F2
......
M×F+M×F2+M×F3+...+M×Fn
N×F-N×F2-N×F3...-N×Fn+M
......
N×F-N×F2+M
N×F+M
其中N=1-M,2n个分段点将匹配度取值范围[0,1]范围分为2n+1份,进行非线性的匹配度取值。
CNA2005101023800A 2005-12-19 2005-12-19 一种增强语音识别系统模板匹配精确度的方法 Pending CN1790482A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CNA2005101023800A CN1790482A (zh) 2005-12-19 2005-12-19 一种增强语音识别系统模板匹配精确度的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CNA2005101023800A CN1790482A (zh) 2005-12-19 2005-12-19 一种增强语音识别系统模板匹配精确度的方法

Publications (1)

Publication Number Publication Date
CN1790482A true CN1790482A (zh) 2006-06-21

Family

ID=36788277

Family Applications (1)

Application Number Title Priority Date Filing Date
CNA2005101023800A Pending CN1790482A (zh) 2005-12-19 2005-12-19 一种增强语音识别系统模板匹配精确度的方法

Country Status (1)

Country Link
CN (1) CN1790482A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101568957B (zh) * 2006-12-27 2012-05-02 英特尔公司 用于语音分段的方法和设备

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101568957B (zh) * 2006-12-27 2012-05-02 英特尔公司 用于语音分段的方法和设备

Similar Documents

Publication Publication Date Title
CN108447062B (zh) 一种基于多尺度混合分割模型的病理切片非常规细胞的分割方法
CN110544231B (zh) 基于背景标准化和集中补偿算法的锂电池电极表面缺陷检测方法
CN111368825B (zh) 一种基于语义分割的指针定位方法
CN108960342B (zh) 基于改进Soft-Max损失函数的图像相似度计算方法
CN108537790B (zh) 基于耦合翻译网络的异源图像变化检测方法
CN117252878B (zh) 一种纳米压印模具的图像缺陷检测方法
CN102980893A (zh) 钢锭表面缺陷分类检测系统及方法
CN110890087A (zh) 一种基于余弦相似度的语音识别方法和装置
CN117689655B (zh) 基于计算机视觉的金属钮扣表面缺陷检测方法
CN102495887A (zh) 一种基于关键区域色彩矩阵的视频镜头分割方法及其应用
CN118134923A (zh) 一种基于人工智能的高速物品视觉检测方法
CN101656070B (zh) 一种语音检测方法
CN1790482A (zh) 一种增强语音识别系统模板匹配精确度的方法
CN110490297B (zh) 一种铁路道岔动作功率曲线智能分段方法
CN107273892B (zh) 一种车牌字符分割方法及装置
CN114049569B (zh) 一种深度学习模型性能评价方法及系统
CN112581487B (zh) 自动提取检测区域及定位核的方法
CN114970630A (zh) 一种时序数据多尺度分段的模型训练方法
CN110322883B (zh) 一种语音转文字效果评价优化方法
CN113034403A (zh) 医学影像数据通过高斯滤波进行降噪的工作方法
CN111369616B (zh) 基于贝叶斯学习的汇聚束电子衍射图样对称性检测方法
CN115031644A (zh) 一种基于三维点云数据的金属厚度自动测量方法
CN110619640B (zh) 一种基于骨髓细胞图像的粒细胞检测方法及系统
CN117592424B (zh) 存储芯片的布局设计方法、装置、设备及存储介质
CN112053368B (zh) 一种用于薄板焊接的焊缝中心识别方法及系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
AD01 Patent right deemed abandoned

Effective date of abandoning: 20060621

C20 Patent right or utility model deemed to be abandoned or is abandoned