CN105632515A - 一种发音检错方法及装置 - Google Patents
一种发音检错方法及装置 Download PDFInfo
- Publication number
- CN105632515A CN105632515A CN201410609649.3A CN201410609649A CN105632515A CN 105632515 A CN105632515 A CN 105632515A CN 201410609649 A CN201410609649 A CN 201410609649A CN 105632515 A CN105632515 A CN 105632515A
- Authority
- CN
- China
- Prior art keywords
- score
- model
- voice unit
- basic voice
- unit segment
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Electrically Operated Instructional Devices (AREA)
Abstract
本发明公开了一种发音检错方法及装置,该方法包括:获取待检错语音信号;提取所述语音信号的语音特征序列;对所述语音特征序列进行切分,获取基本语音单元片断;对所述基本语音单元片断进行模型得分补偿,获得所述基本语音单元片断的发音得分;根据所述基本语音单元片断的发音得分进行发音检错。本发明能够减小发音得分出现的偏差,提高发音检错的准确率。
Description
技术领域
本申请涉及发音检错技术领域,尤其涉及一种发音检错方法及装置。
背景技术
自上世纪90年代开始,为了解除传统方法的束缚,越来越多的语音识别、语言学、教育学等方面的研究人员开展计算机辅助发音训练(ComputerAssistedPronunciationTraining,CAPT)系统的研究与开发,用于取代或者部分取代“教师”的作用,实现对学习者发音水平的自动评估,并对发音错误给予反馈与指导,提高学习效果与效率。
发音检错即检测出用户发音过程中的错误,作为CAPT系统的重要环节,受到很多研究人员的关注。现有发音检错系统中,发音得分通常计算为语音单元片断相应于其对应系统预设模型的相似度,系统预设模型由系统预先在采集的语音数据上训练得到。然而,由于训练数据的有限性,训练数据中包含的基本语音单元的词频分布往往具有一定的偏向性,如常用单词not、and等往往出现频率较高,而较生僻的单词则出现频率较低。而在真实数据测试中,由于测试数据环境和训练数据的不尽一致,数据充足的模型识别率高,而那些数据稀疏的模型识别可能出现失真。相应的,基于该模型打分的发音得分可能存在一定的偏差,从而导致发音检测的准确率不高。
发明内容
为解决上述技术问题,本申请实施例提供一种发音检错方法及装置,能够减小发音得分出现的偏差,提高发音检错的准确率。技术方案如下:
一种发音检错方法,包括:
获取待检错语音信号;
提取所述语音信号的语音特征序列;
对所述语音特征序列进行切分,获取基本语音单元片断;
对所述基本语音单元片断进行模型得分补偿,获得所述基本语音单元片断的发音得分;
根据所述基本语音单元片断的发音得分进行发音检错。
优选地,所述对所述基本语音单元片断进行模型得分补偿,获得所述基本语音单元片断的发音得分,包括:
确定所述基本语音单元片断对应的发音模型和竞争模型;
计算所述基本语音单元片断与所述发音模型的第一似然度得分,以及所述基本语音单元片断与所述竞争模型的第二似然度得分;
获得所述基本语音单元片断对应的所述竞争模型的模型补偿系数;
根据所述模型补偿系数对其对应的所述第二似然度得分进行补偿,获得第三似然度得分;
根据所述竞争模型对应的所述第三似然度得分及所述第一似然度得分获得所述基本语音单元片断的发音得分。
优选地,所述获得所述基本语音单元片断对应的所述竞争模型的模型补偿系数,包括:
获取训练数据;
获取所述训练数据中的基本语音单元片断;
确定所述基本语音单元片断对应的发音模型及竞争模型;
计算所述基本语音单元片断的第一似然度得分集合及第二似然度得分集合;其中,所述第一似然度得分集合为由所有所述训练数据中的基本语音单元片断与所述发音模型的似然度得分形成的集合;所述第二似然度得分集合为由所有所述训练数据中的基本语音单元片断与所述竞争模型的似然度得分形成的集合;
根据所述第一似然度得分集合及所述第二似然度得分集合,确定所述基本语音单元片断对应的竞争模型的模型补偿系数。
优选地,所述根据所述第一似然度得分集合及所述第二似然度得分集合,确定所述基本语音单元片断对应的竞争模型的模型补偿系数,包括:
计算所述第一似然度得分集合与所述第二似然度得分集合之间的似然度得分差集合;
对所述似然度得分差集合中的对象按照数值从小到大进行排序,得到一得分差数组SCORE′;
根据预设的所述发音模型和所述竞争模型间的虚警比例P%及所述似然度得分差集合中的对象个数N,获得得分差数组SCORE′中的对象SCORE′(N*P%);
如果所述对象SCORE′(N*P%)大于0,则将所述基本语音单元片断对应的所述竞争模型的模型补偿系数设置为0;否则,将所述对象SCORE′(N*P%)作为所述基本语音单元片断对应的所述竞争模型的模型补偿系数。
优选地,所述根据所述第一似然度得分集合及所述第二似然度得分集合,确定所述基本语音单元片断对应的竞争模型的模型补偿系数,包括:
计算所述第一似然度得分集合与所述第二似然度得分集合之间的似然度得分差集合;
从所述似然度得分差集合中选择最小的N*P%个对象,N为所述似然度得分差集合中的对象个数,P%为所述发音模型和所述竞争模型间的虚警比例;
获取所述N*P%个对象中最大的值;
如果所述最大的值大于0,则将所述基本语音单元片断对应的所述竞争模型的模型补偿系数设置为0;否则,将所述最大的值作为所述基本语音单元片断对应的所述竞争模型的模型补偿系数。
一种发音检错装置,包括:
信号获取单元,用于获取待检错语音信号;
特征提取单元,用于提取所述语音信号的语音特征序列;
片断获取单元,用于对所述语音特征序列进行切分,获取基本语音单元片断;
得分补偿单元,用于对所述基本语音单元片断进行模型得分补偿,获得所述基本语音单元片断的发音得分;
发音检错单元,用于根据各所述基本语音单元片断的发音得分进行发音检错。
优选地,所述得分补偿单元包括:
模型确定子单元,用于确定所述基本语音单元片断对应的发音模型和竞争模型;
得分计算子单元,用于计算所述基本语音单元片断与所述发音模型的第一似然度得分,以及所述基本语音单元片断与所述竞争模型的第二似然度得分;
系数获得子单元,用于获得所述基本语音单元片断对应的所述竞争模型的模型补偿系数;
补偿子单元,用于根据所述模型补偿系数对其对应的所述第二似然度得分进行补偿,获得第三似然度得分;
得分确定子单元,用于根据所述竞争模型对应的所述第三似然度得分及所述第一似然度得分获得所述基本语音单元片断的发音得分。
优选地,所述系数获得子单元包括:
数据获取子单元,用于获取训练数据;
片断获取子单元,用于获取所述训练数据中的基本语音单元片断;
确定子单元,用于确定所述基本语音单元片断对应的发音模型及竞争模型;
集合获得子单元,用于计算所述基本语音单元片断的第一似然度得分集合及第二似然度得分集合;其中,所述第一似然度得分集合为由所有所述训练数据中的基本语音单元片断与所述发音模型的似然度得分形成的集合;所述第二似然度得分集合为由所有所述训练数据中的基本语音单元片断与所述竞争模型的似然度得分形成的集合;
系数确定子单元,用于根据所述第一似然度得分集合及所述第二似然度得分集合,确定所述基本语音单元片断对应的所述竞争模型的模型补偿系数。
优选地,所述系数确定子单元包括:
集合计算子单元,用于计算所述第一似然度得分集合与所述第二似然度得分集合之间的似然度得分差集合;
排序子单元,用于对所述似然度得分差集合中的对象按照数值从小到大进行排序,得到一得分差数组SCORE′;
对象获取子单元,用于根据预设的所述发音模型和所述竞争模型间的虚警比例P%及所述似然度得分差集合中的对象个数N,获得得分差数组SCORE′中的对象SCORE′(N*P%);
第一确定子单元,用于判断所述对象SCORE′(N*P%)是否大于0;如果是,则将所述基本语音单元片断对应的所述竞争模型的模型补偿系数设置为0;否则,将所述对象SCORE′(N*P%)作为所述基本语音单元片断对应的所述竞争模型的模型补偿系数。
优选地,所述系数确定子单元包括:
集合计算子单元,用于计算所述第一似然度得分集合与所述第二似然度得分集合之间的似然度得分差集合;
第一选择子单元,用于从所述似然度得分差集合中选择最小的N*P%个对象,N为所述似然度得分差集合中的对象个数,P%为所述发音模型和所述竞争模型间的虚警比例;
第二选择子单元,用于获取所述N*P%个对象中最大的值;
第二确定子单元,用于判断所述最大的值是否大于0,如果是,则将所述基本语音单元片断对应的所述竞争模型的模型补偿系数设置为0;否则,将所述最大的值作为所述基本语音单元片断对应的所述竞争模型的模型补偿系数。
本发明实施例至少具有以下有益效果:
本发明实施例通过对各基本语音单元片断进行模型得分补偿来修正基本语音单元片断的发音得分,使得发音得分能反映实际情况,减小了发音得分出现的偏差,提高了发音检错的准确率。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例发音检错方法的流程图;
图2为本发明实施例中获得基本语音单元片断的发音得分的方法流程图;
图3为本发明实施例中获得基本语音单元片断对应的竞争模型的模型补偿系数的方法流程图;
图4A为本发明实施例中获取模型补偿系数的一种流程图;
图4B为本发明实施例中获取模型补偿系数的另一种流程图;
图5为本发明实施例发音检错装置的结构示意图;
图6为本发明实施例中得分补偿单元的结构示意图;
图7为本发明实施例中系数获得子单元的结构示意图;
图8A为本发明实施例中系数确定子单元的一种结构示意图;
图8B为本发明实施例中系数确定子单元的另一种结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本申请中的技术方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。
为使本申请的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本申请作进一步详细的说明。
参见图1,为本发明实施例一种发音检错的方法流程图。
该方法可以包括:
步骤101,获取待检错语音信号。
步骤102,提取语音信号的语音特征序列。
具体可以采用多种现有方法提取语音信号的语音特征序列,例如,首先对语音信号分帧,如获取窗长25ms帧移10ms的每帧语音数据,并对每帧语音数据依次通过短时分析提取特征矢量,如MFCC(Mel频率倒谱系数)参数,PLP(感知线性预测)参数等。进一步的还可获取所述特征矢量的一阶、二阶差分,得到扩展的特征矢量。
步骤103,对语音特征序列进行切分,获取基本语音单元片断。
具体可以采用多种现有方法对语音特征序列进行切分,获取一个或多个基本语音单元片断。例如,首先根据待检测语音信号的检测文本搭建文本切分网络,并根据预设声学模型扩展获得解码网络;随后在解码网络空间内,搜索步骤102获得的语音特征序列的最优路径,实现对语音特征序列的切分,获得基本语音单元片断。该基本语音单元片断根据用户需要,可以是音素、音节、声韵母等。
步骤104,对基本语音单元片断进行模型得分补偿,获得基本语音单元片断的发音得分。
由于训练集数据不均衡,导致不同声学模型得分不同,训练数据稀疏与训练数据充足这两种情况下模型得分之间存在差异,因此在全部阅读正确的集合上统计各模型之间得分差,即正确阅读时,认为发音模型得分最高,如果竞争模型得分高于发音模型,即将竞争模型得分加上一个负值或将发音模型加上一个正值,使得竞争模型得分小于文本得分。
所述竞争模型为预设的与当前考察模型可比的模型,通常可依据模型的发音,即选取与基本模型发音相似或相近的模型,或可能存在识别错误的模型作为竞争模型。更一般地,可以选取与基本模型发音不同的其它所有模型都作为竞争模型。
本发明实施例利用基本语音单元片断对应的各竞争模型之间的模型补偿系数对基本语音单元片断与竞争模型之间的似然度得分进行补偿,从而修正基本语音单元片断的发音得分。对获得的每一个基本语音单元片断都采取同样的方法进行模型得分补偿,其中,该模型补偿系数可以是预设的经验值,也可以是通过训练数据获得。具体请参照后续实施例的描述。
步骤105,根据基本语音单元片断的发音得分进行发音检错。
具体可以根据模型得分补偿后获得的基本语音单元片断的发音得分及预设的检错阈值来确定该语音单元片断的发音是否正确。如果该基本语音单元片断的发音得分大于检错阈值,则判定发音正确,否则判定发音错误。该检错阈值可以根据大量实验或经验预先设定。
本发明实施例通过对各基本语音单元片断进行模型得分补偿来修正基本语音单元片断的发音得分,使得发音得分能反映实际情况,模型准确的情况下,当用户按照给定文本阅读时,必然是发音模型得分最高,但由于训练数据的有限性,训练数据包含基本语音单元词频分布具有一定的偏向性,因此真实数据测试中,即使按照文本阅读,也会出现部分发音模型得分低于竞争模型,为了消除训练数据导致的模型得分失真问题,本发明实施例的方法,通过对模型进行得分补偿,减小了发音得分出现的偏差,提高了发音检错的准确率。
在本发明的另一实施例中,以其中一个基本语音单元片断T为例进行说明,对基本语音单元片断T进行模型得分补偿,获得基本语音单元片断T的发音得分的过程,如图2所示,包括:
步骤201,确定基本语音单元片断对应的发音模型和竞争模型。
假设该基本语音单元片断T对应的发音模型为Mi,竞争模型为Mj,该基本语音单元片断T的特征矢量为Ot。该发音模型Mi的竞争模型Mj有一个或多个。
步骤202,计算基本语音单元片断与发音模型的第一似然度得分,以及基本语音单元片断与竞争模型的第二似然度得分。
其中,似然度得分的计算方法与现有技术类似。第一似然度得分为P(Ot|Mi);第二似然度得分为P(Ot|Mj),竞争模型Mj与第二似然度得分P(Ot|Mj)一一对应。
步骤203,获得基本语音单元片断对应的竞争模型的模型补偿系数。
假设发音模型Mi对应的竞争模型Mj的模型补偿系数为Cij,竞争模型Mj与模型补偿系数Cij一一对应。该模型补偿系数Cij可以是预先根据经验值设定的,也可以是通过对训练数据进行模型训练获得的,具体请参照后续实施例的描述。
步骤204,根据模型补偿系数对其对应的第二似然度得分进行补偿,获得第三似然度得分。
根据模型补偿系数Cij对第二似然度得分P(Ot|Mj)进行补偿,得到更新的似然度得分P'(Ot|Mj),例如:
P'(Ot|Mj)=P(Ot|Mj)+Cij
步骤205,根据竞争模型对应的第三似然度得分及第一似然度得分获得基本语音单元片断的发音得分。
最终基于模型补偿系数修正后的基本语音单元片断T的发音得分为:
在另一实施例中,获得基本语音单元片断对应的竞争模型的模型补偿系数的方法,如图3所示,可以包括:
步骤301,获取训练数据。
获得多个语音信号作为训练数据。
步骤302,获取训练数据的基本语音单元片断。
可以按照前述步骤102~步骤103所述的方法获得训练数据的基本语音单元片断。
步骤303,确定基本语音单元片断对应的发音模型及各竞争模型。
步骤304,计算基本语音单元片断的第一似然度得分集合及第二似然度得分集合。
其中,第一似然度得分集合为由所有训练数据中的基本语音单元片断T与其发音模型Mi的似然度得分Pk(Ot|Mi)形成的集合{Sm1},其中k=1,2…N,N为训练语料中基本语音单元片断T出现的次数;
对于某一竞争模型Mj对应的第二似然度得分集合为由所有训练数据中的基本语音单元片断T与竞争模型Mj的似然度得分Pk(Ot|Mj)形成的集合{Sm2},同理k=1,2…N,N为训练语料中基本语音单元片断T出现的次数。
步骤305,根据第一似然度得分集合及第二似然度得分集合,确定基本语音单元片断对应的竞争模型的模型补偿系数。
具体地,以确定基本语音单元片断对应的其中一个竞争模型的模型补偿系数为例,其一种实现流程如图4A所示,可以包括:
步骤401,计算第一似然度得分集合与第二似然度得分集合之间的似然度得分差集合。
计算似然度得分差集合{S1,S2,...Sk,...SN},其中,Sk=Pk(Ot|Mi)-Pk(Ot|Mj),k=1,2…N,N为训练语料中基本语音单元片断T出现的次数。
步骤402,对似然度得分差集合中的对象按照数值从小到大进行排序,得到一得分差数组SCORE′。
对似然度得分差集合中的对象按照数值从小到大进行排序,得到一得分差数组SCORE′[N]={S1′,S2′,...Sk′,...SN′}。
步骤403,根据预设的发音模型和竞争模型间的虚警比例P%以及所述似然度得分差集合中的对象个数(该个数与前面提到的训练语料中基本语音单元片断T出现的次数N相同),获得基本语音单元片断对应的竞争模型之间的模型补偿系数SCORE′(N*P%)。
相应于发音模型Mi,其竞争模型Mj的补偿系数为Cij=SCORE′(N*P%),其中P%为预设的发音模型Mi和竞争模型Mj间的虚警比例。虚警比例指的是用户在正确阅读时系统却认为错误的比例,其值可根据实验及经验进行设定,比如可以选择设置虚警比例P=5。发音模型Mi与其对应的不同竞争模型Mj间的虚警比例可以不同。
若SCORE′(N*P%)>0,则Cij=0。
同样,仍以确定基本语音单元片断对应的其中一个竞争模型的模型补偿系数为例,其另一种实现流程如图4B所示,可以包括:
步骤411,计算所述第一似然度得分集合与所述第二似然度得分集合之间的似然度得分差集合;
步骤412,从所述似然度得分差集合中选择最小的N*P%个对象,N为所述似然度得分差集合中的对象个数,P%为所述发音模型和所述竞争模型间的虚警比例;
步骤413,选择所述N*P%个对象中最大的值作为所述基本语音单元片断对应的所述竞争模型的模型补偿系数。
同样,如果上述最大的值大于0,则将所述基本语音单元片断对应的所述竞争模型的模型补偿系数设置为0。
相应地,本发明实施例还提供一种发音检错装置,如图5所示,为本发明实施例发音检错装置的结构示意图。
该装置可以包括:
信号获取单元501,用于获取待检错语音信号。
特征提取单元502,用于提取所述语音信号的语音特征序列。
片断获取单元503,用于对所述语音特征序列进行切分,获取基本语音单元片断。
得分补偿单元504,用于对所述基本语音单元片断进行模型得分补偿,获得所述基本语音单元片断的发音得分。
发音检错单元505,用于根据各所述基本语音单元片断的发音得分进行发音检错。
本发明实施例通过上述单元对各基本语音单元片断进行模型得分补偿来修正基本语音单元片断的发音得分,使得发音得分能反映实际情况,减小了发音得分出现的偏差,提高了发音检错的准确率。
在本发明的另一实施例中,如图6所示,得分补偿单元504可以进一步包括:
模型确定子单元601,用于确定所述基本语音单元片断对应的发音模型和竞争模型。
得分计算子单元602,用于计算所述基本语音单元片断与所述发音模型的第一似然度得分,以及所述基本语音单元片断与所述竞争模型的第二似然度得分。
系数获得子单元603,用于获得所述基本语音单元片断对应的所述竞争模型的模型补偿系数。
补偿子单元604,用于根据所述模型补偿系数对其对应的所述第二似然度得分进行补偿,获得第三似然度得分。
得分确定子单元605,用于根据所述竞争模型对应的所述第三似然度得分及所述第一似然度得分获得所述基本语音单元片断的发音得分。
在本发明的另一实施例中,如图7所示,系数获得子单元603可以进一步包括:
数据获取子单元701,用于获取训练数据。
片断获取子单元702,用于获取所述训练数据中的基本语音单元片断。
确定子单元703,用于确定所述基本语音单元片断对应的发音模型及竞争模型。
集合获得子单元704,用于计算所述基本语音单元片断的第一似然度得分集合及第二似然度得分集合;其中,所述第一似然度得分集合为由所有所述训练数据中的基本语音单元片断与所述发音模型的似然度得分形成的集合;所述第二似然度得分集合为由所有所述训练数据中的基本语音单元片断与所述竞争模型的似然度得分形成的集合。
系数确定子单元705,用于根据所述第一似然度得分集合及所述第二似然度得分集合,确定所述基本语音单元片断对应的所述竞争模型的模型补偿系数。
在本发明的另一实施例中,如图8A所示,系数确定子单元705又进一步包括:
集合计算子单元801,用于计算所述第一似然度得分集合与所述第二似然度得分集合之间的似然度得分差集合。
排序子单元802,用于对所述似然度得分差集合中的对象按照数值从小到大进行排序,得到一得分差数组SCORE′。
对象获取子单元803,用于根根据预设的所述发音模型和所述竞争模型间的虚警比例P%及所述似然度得分差集合中的对象个数N,获得得分差数组SCORE′中的对象SCORE′(N*P%);
第一确定子单元804,用于判断所述对象SCORE′(N*P%)是否大于0;如果是,则将所述基本语音单元片断对应的所述竞争模型的模型补偿系数设置为0;否则,将所述对象SCORE′(N*P%)作为所述基本语音单元片断对应的所述竞争模型的模型补偿系数。
所述虚警比例可以为5。
系数确定子单元705的另一种具体结构如图8B所示,包括:
集合计算子单元801,用于计算所述第一似然度得分集合与所述第二似然度得分集合之间的似然度得分差集合。
第一选择子单元812,用于从所述似然度得分差集合中选择最小的N*P%个对象,N为所述似然度得分差集合中的对象个数,P%为所述发音模型和所述竞争模型间的虚警比例;
第二选择子单元813,用于选择所述N*P%个对象中最大的值;
第二确定子单元814,用于判断所述最大的值是否大于0,如果是,则将所述基本语音单元片断对应的所述竞争模型的模型补偿系数设置为0;否则,将所述最大的值作为所述基本语音单元片断对应的所述竞争模型的模型补偿系数。当然,系数确定子单元705还可以有其它实现结构,对此本发明实施例不做限定。
以上装置中各单元的具体实现过程请参见前述方法实施例的相应描述,此处不再赘述。
为了描述的方便,描述以上装置时以功能分为各种单元分别描述。当然,在实施本申请时可以把各单元的功能在同一个或多个软件和/或硬件中实现。
通过以上的实施方式的描述可知,本领域的技术人员可以清楚地了解到本申请可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例或者实施例的某些部分所述的方法。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置实施例而言,由于其基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
本申请可用于众多通用或专用的计算系统环境或配置中。例如:个人计算机、服务器计算机、手持设备或便携式设备、平板型设备、多处理器系统、基于微处理器的系统、置顶盒、可编程的消费电子设备、网络PC、小型计算机、大型计算机、包括以上任何系统或设备的分布式计算环境等等。
本申请可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本申请,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
以上所述仅是本申请的具体实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本申请原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本申请的保护范围。
Claims (10)
1.一种发音检错方法,其特征在于,包括:
获取待检错语音信号;
提取所述语音信号的语音特征序列;
对所述语音特征序列进行切分,获取基本语音单元片断;
对所述基本语音单元片断进行模型得分补偿,获得所述基本语音单元片断的发音得分;
根据所述基本语音单元片断的发音得分进行发音检错。
2.根据权利要求1所述的方法,其特征在于,所述对所述基本语音单元片断进行模型得分补偿,获得所述基本语音单元片断的发音得分,包括:
确定所述基本语音单元片断对应的发音模型和竞争模型;
计算所述基本语音单元片断与所述发音模型的第一似然度得分,以及所述基本语音单元片断与所述竞争模型的第二似然度得分;
获得所述基本语音单元片断对应的所述竞争模型的模型补偿系数;
根据所述模型补偿系数对其对应的所述第二似然度得分进行补偿,获得第三似然度得分;
根据所述竞争模型对应的所述第三似然度得分及所述第一似然度得分获得所述基本语音单元片断的发音得分。
3.根据权利要求2所述的方法,其特征在于,所述获得所述基本语音单元片断对应的所述竞争模型的模型补偿系数,包括:
获取训练数据;
获取所述训练数据中的基本语音单元片断;
确定所述基本语音单元片断对应的发音模型及竞争模型;
计算所述基本语音单元片断的第一似然度得分集合及第二似然度得分集合;其中,所述第一似然度得分集合为由所有所述训练数据中的基本语音单元片断与所述发音模型的似然度得分形成的集合;所述第二似然度得分集合为由所有所述训练数据中的基本语音单元片断与所述竞争模型的似然度得分形成的集合;
根据所述第一似然度得分集合及所述第二似然度得分集合,确定所述基本语音单元片断对应的竞争模型的模型补偿系数。
4.根据权利要求3所述的方法,其特征在于,所述根据所述第一似然度得分集合及所述第二似然度得分集合,确定所述基本语音单元片断对应的竞争模型的模型补偿系数,包括:
计算所述第一似然度得分集合与所述第二似然度得分集合之间的似然度得分差集合;
对所述似然度得分差集合中的对象按照数值从小到大进行排序,得到一得分差数组SCORE′;
根据预设的所述发音模型和所述竞争模型间的虚警比例P%及所述似然度得分差集合中的对象个数N,获得得分差数组SCORE′中的对象SCORE′(N*P%);
如果所述对象SCORE′(N*P%)大于0,则将所述基本语音单元片断对应的所述竞争模型的模型补偿系数设置为0;否则,将所述对象SCORE′(N*P%)作为所述基本语音单元片断对应的所述竞争模型的模型补偿系数。
5.根据权利要求3所述的方法,其特征在于,所述根据所述第一似然度得分集合及所述第二似然度得分集合,确定所述基本语音单元片断对应的竞争模型的模型补偿系数,包括:
计算所述第一似然度得分集合与所述第二似然度得分集合之间的似然度得分差集合;
从所述似然度得分差集合中选择最小的N*P%个对象,N为所述似然度得分差集合中的对象个数,P%为所述发音模型和所述竞争模型间的虚警比例;
获取所述N*P%个对象中最大的值;
如果所述最大的值大于0,则将所述基本语音单元片断对应的所述竞争模型的模型补偿系数设置为0;否则,将所述最大的值作为所述基本语音单元片断对应的所述竞争模型的模型补偿系数。
6.一种发音检错装置,其特征在于,包括:
信号获取单元,用于获取待检错语音信号;
特征提取单元,用于提取所述语音信号的语音特征序列;
片断获取单元,用于对所述语音特征序列进行切分,获取基本语音单元片断;
得分补偿单元,用于对所述基本语音单元片断进行模型得分补偿,获得所述基本语音单元片断的发音得分;
发音检错单元,用于根据各所述基本语音单元片断的发音得分进行发音检错。
7.根据权利要求6所述的装置,其特征在于,所述得分补偿单元包括:
模型确定子单元,用于确定所述基本语音单元片断对应的发音模型和竞争模型;
得分计算子单元,用于计算所述基本语音单元片断与所述发音模型的第一似然度得分,以及所述基本语音单元片断与所述竞争模型的第二似然度得分;
系数获得子单元,用于获得所述基本语音单元片断对应的所述竞争模型的模型补偿系数;
补偿子单元,用于根据所述模型补偿系数对其对应的所述第二似然度得分进行补偿,获得第三似然度得分;
得分确定子单元,用于根据所述竞争模型对应的所述第三似然度得分及所述第一似然度得分获得所述基本语音单元片断的发音得分。
8.根据权利要求7所述的装置,其特征在于,所述系数获得子单元包括:
数据获取子单元,用于获取训练数据;
片断获取子单元,用于获取所述训练数据中的基本语音单元片断;
确定子单元,用于确定所述基本语音单元片断对应的发音模型及竞争模型;
集合获得子单元,用于计算所述基本语音单元片断的第一似然度得分集合及第二似然度得分集合;其中,所述第一似然度得分集合为由所有所述训练数据中的基本语音单元片断与所述发音模型的似然度得分形成的集合;所述第二似然度得分集合为由所有所述训练数据中的基本语音单元片断与所述竞争模型的似然度得分形成的集合;
系数确定子单元,用于根据所述第一似然度得分集合及所述第二似然度得分集合,确定所述基本语音单元片断对应的所述竞争模型的模型补偿系数。
9.根据权利要求8所述的装置,其特征在于,所述系数确定子单元包括:
集合计算子单元,用于计算所述第一似然度得分集合与所述第二似然度得分集合之间的似然度得分差集合;
排序子单元,用于对所述似然度得分差集合中的对象按照数值从小到大进行排序,得到一得分差数组SCORE′;
对象获取子单元,用于根据预设的所述发音模型和所述竞争模型间的虚警比例P%及所述似然度得分差集合中的对象个数N,获得得分差数组SCORE′中的对象SCORE′(N*P%);
第一确定子单元,用于判断所述对象SCORE′(N*P%)是否大于0;如果是,则将所述基本语音单元片断对应的所述竞争模型的模型补偿系数设置为0;否则,将所述对象SCORE′(N*P%)作为所述基本语音单元片断对应的所述竞争模型的模型补偿系数。
10.根据权利要求8所述的装置,其特征在于,所述系数确定子单元包括:
集合计算子单元,用于计算所述第一似然度得分集合与所述第二似然度得分集合之间的似然度得分差集合;
第一选择子单元,用于从所述似然度得分差集合中选择最小的N*P%个对象,N为所述似然度得分差集合中的对象个数,P%为所述发音模型和所述竞争模型间的虚警比例;
第二选择子单元,用于获取所述N*P%个对象中最大的值;
第二确定子单元,用于判断所述最大的值是否大于0,如果是,则将所述基本语音单元片断对应的所述竞争模型的模型补偿系数设置为0;否则,将所述最大的值作为所述基本语音单元片断对应的所述竞争模型的模型补偿系数。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410609649.3A CN105632515B (zh) | 2014-10-31 | 2014-10-31 | 一种发音检错方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410609649.3A CN105632515B (zh) | 2014-10-31 | 2014-10-31 | 一种发音检错方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN105632515A true CN105632515A (zh) | 2016-06-01 |
CN105632515B CN105632515B (zh) | 2019-10-18 |
Family
ID=56047356
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201410609649.3A Active CN105632515B (zh) | 2014-10-31 | 2014-10-31 | 一种发音检错方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN105632515B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111128238A (zh) * | 2019-12-31 | 2020-05-08 | 云知声智能科技股份有限公司 | 普通话评测方法及装置 |
CN113571054A (zh) * | 2020-04-28 | 2021-10-29 | 中国移动通信集团浙江有限公司 | 语音识别信号预处理方法、装置、设备及计算机存储介质 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1592236A (zh) * | 2003-09-03 | 2005-03-09 | 华为技术有限公司 | 一种测试语音质量的方法及装置 |
CN1877697A (zh) * | 2006-07-25 | 2006-12-13 | 北京理工大学 | 一种基于分布式结构的说话人确认方法 |
CN101710490A (zh) * | 2009-11-20 | 2010-05-19 | 安徽科大讯飞信息科技股份有限公司 | 语音评测的噪声补偿方法及装置 |
CN101894548A (zh) * | 2010-06-23 | 2010-11-24 | 清华大学 | 一种用于语种识别的建模方法及装置 |
US20110119039A1 (en) * | 2008-01-14 | 2011-05-19 | Telefonaktiebolaget Lm Ericsson (Publ) | Objective Measurement of Audio Quality |
CN104064184A (zh) * | 2014-06-24 | 2014-09-24 | 科大讯飞股份有限公司 | 异构解码网络的构建方法及系统、语音识别方法及系统 |
-
2014
- 2014-10-31 CN CN201410609649.3A patent/CN105632515B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1592236A (zh) * | 2003-09-03 | 2005-03-09 | 华为技术有限公司 | 一种测试语音质量的方法及装置 |
CN1877697A (zh) * | 2006-07-25 | 2006-12-13 | 北京理工大学 | 一种基于分布式结构的说话人确认方法 |
US20110119039A1 (en) * | 2008-01-14 | 2011-05-19 | Telefonaktiebolaget Lm Ericsson (Publ) | Objective Measurement of Audio Quality |
CN101710490A (zh) * | 2009-11-20 | 2010-05-19 | 安徽科大讯飞信息科技股份有限公司 | 语音评测的噪声补偿方法及装置 |
CN101894548A (zh) * | 2010-06-23 | 2010-11-24 | 清华大学 | 一种用于语种识别的建模方法及装置 |
CN104064184A (zh) * | 2014-06-24 | 2014-09-24 | 科大讯飞股份有限公司 | 异构解码网络的构建方法及系统、语音识别方法及系统 |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111128238A (zh) * | 2019-12-31 | 2020-05-08 | 云知声智能科技股份有限公司 | 普通话评测方法及装置 |
CN111128238B (zh) * | 2019-12-31 | 2022-06-24 | 云知声智能科技股份有限公司 | 普通话评测方法及装置 |
CN113571054A (zh) * | 2020-04-28 | 2021-10-29 | 中国移动通信集团浙江有限公司 | 语音识别信号预处理方法、装置、设备及计算机存储介质 |
CN113571054B (zh) * | 2020-04-28 | 2023-08-15 | 中国移动通信集团浙江有限公司 | 语音识别信号预处理方法、装置、设备及计算机存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN105632515B (zh) | 2019-10-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9613638B2 (en) | Computer-implemented systems and methods for determining an intelligibility score for speech | |
EP2387031B1 (en) | Methods and systems for grammar fitness evaluation as speech recognition error predictor | |
CN102568475B (zh) | 用于普通话水平测评的系统和方法 | |
CN103559894B (zh) | 口语评测方法及系统 | |
CN101246685B (zh) | 计算机辅助语言学习系统中的发音质量评价方法 | |
CN103559892B (zh) | 口语评测方法及系统 | |
CN101751919B (zh) | 一种汉语口语重音自动检测方法 | |
CN106297800B (zh) | 一种自适应的语音识别的方法和设备 | |
US9837070B2 (en) | Verification of mappings between phoneme sequences and words | |
CN109256152A (zh) | 语音评分方法及装置、电子设备、存储介质 | |
KR102052031B1 (ko) | 발음평가 방법 및 상기 방법을 이용하는 발음평가 시스템 | |
CN103594087B (zh) | 提高口语评测性能的方法及系统 | |
US10019986B2 (en) | Acoustic model training using corrected terms | |
CN101105939A (zh) | 发音指导方法 | |
El Amrani et al. | Building CMU Sphinx language model for the Holy Quran using simplified Arabic phonemes | |
US9224383B2 (en) | Unsupervised language model adaptation for automated speech scoring | |
Gao et al. | A study on robust detection of pronunciation erroneous tendency based on deep neural network. | |
CN109686383A (zh) | 一种语音分析方法、装置及存储介质 | |
US20210134277A1 (en) | System and method for automatic speech analysis | |
CN105609114B (zh) | 一种发音检测方法及装置 | |
CN103559289A (zh) | 语种无关的关键词检索方法及系统 | |
CN110349567A (zh) | 语音信号的识别方法和装置、存储介质及电子装置 | |
CN107610720B (zh) | 发音偏误检测方法、装置、存储介质及设备 | |
CN105632515A (zh) | 一种发音检错方法及装置 | |
Sanchez-Cortina et al. | A prototype for interactive speech transcription balancing error and supervision effort |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |