CN105632515A

CN105632515A - 一种发音检错方法及装置

Info

Publication number: CN105632515A
Application number: CN201410609649.3A
Authority: CN
Inventors: 赵超; 高前勇; 魏思; 胡国平; 胡郁; 刘庆峰
Original assignee: iFlytek Co Ltd
Current assignee: iFlytek Co Ltd
Priority date: 2014-10-31
Filing date: 2014-10-31
Publication date: 2016-06-01
Anticipated expiration: 2034-10-31
Also published as: CN105632515B

Abstract

本发明公开了一种发音检错方法及装置，该方法包括：获取待检错语音信号；提取所述语音信号的语音特征序列；对所述语音特征序列进行切分，获取基本语音单元片断；对所述基本语音单元片断进行模型得分补偿，获得所述基本语音单元片断的发音得分；根据所述基本语音单元片断的发音得分进行发音检错。本发明能够减小发音得分出现的偏差，提高发音检错的准确率。

Description

一种发音检错方法及装置

技术领域

本申请涉及发音检错技术领域，尤其涉及一种发音检错方法及装置。

背景技术

自上世纪90年代开始，为了解除传统方法的束缚，越来越多的语音识别、语言学、教育学等方面的研究人员开展计算机辅助发音训练(ComputerAssistedPronunciationTraining，CAPT)系统的研究与开发，用于取代或者部分取代“教师”的作用，实现对学习者发音水平的自动评估，并对发音错误给予反馈与指导，提高学习效果与效率。

发音检错即检测出用户发音过程中的错误，作为CAPT系统的重要环节，受到很多研究人员的关注。现有发音检错系统中，发音得分通常计算为语音单元片断相应于其对应系统预设模型的相似度，系统预设模型由系统预先在采集的语音数据上训练得到。然而，由于训练数据的有限性，训练数据中包含的基本语音单元的词频分布往往具有一定的偏向性，如常用单词not、and等往往出现频率较高，而较生僻的单词则出现频率较低。而在真实数据测试中，由于测试数据环境和训练数据的不尽一致，数据充足的模型识别率高，而那些数据稀疏的模型识别可能出现失真。相应的，基于该模型打分的发音得分可能存在一定的偏差，从而导致发音检测的准确率不高。

发明内容

为解决上述技术问题，本申请实施例提供一种发音检错方法及装置，能够减小发音得分出现的偏差，提高发音检错的准确率。技术方案如下：

一种发音检错方法，包括：

获取待检错语音信号；

提取所述语音信号的语音特征序列；

对所述语音特征序列进行切分，获取基本语音单元片断；

对所述基本语音单元片断进行模型得分补偿，获得所述基本语音单元片断的发音得分；

根据所述基本语音单元片断的发音得分进行发音检错。

优选地，所述对所述基本语音单元片断进行模型得分补偿，获得所述基本语音单元片断的发音得分，包括：

确定所述基本语音单元片断对应的发音模型和竞争模型；

计算所述基本语音单元片断与所述发音模型的第一似然度得分，以及所述基本语音单元片断与所述竞争模型的第二似然度得分；

获得所述基本语音单元片断对应的所述竞争模型的模型补偿系数；

根据所述模型补偿系数对其对应的所述第二似然度得分进行补偿，获得第三似然度得分；

根据所述竞争模型对应的所述第三似然度得分及所述第一似然度得分获得所述基本语音单元片断的发音得分。

优选地，所述获得所述基本语音单元片断对应的所述竞争模型的模型补偿系数，包括：

获取训练数据；

获取所述训练数据中的基本语音单元片断；

确定所述基本语音单元片断对应的发音模型及竞争模型；

计算所述基本语音单元片断的第一似然度得分集合及第二似然度得分集合；其中，所述第一似然度得分集合为由所有所述训练数据中的基本语音单元片断与所述发音模型的似然度得分形成的集合；所述第二似然度得分集合为由所有所述训练数据中的基本语音单元片断与所述竞争模型的似然度得分形成的集合；

根据所述第一似然度得分集合及所述第二似然度得分集合，确定所述基本语音单元片断对应的竞争模型的模型补偿系数。

优选地，所述根据所述第一似然度得分集合及所述第二似然度得分集合，确定所述基本语音单元片断对应的竞争模型的模型补偿系数，包括：

计算所述第一似然度得分集合与所述第二似然度得分集合之间的似然度得分差集合；

对所述似然度得分差集合中的对象按照数值从小到大进行排序，得到一得分差数组SCORE′；

根据预设的所述发音模型和所述竞争模型间的虚警比例P％及所述似然度得分差集合中的对象个数N，获得得分差数组SCORE′中的对象SCORE′(N*P％)；

如果所述对象SCORE′(N*P％)大于0，则将所述基本语音单元片断对应的所述竞争模型的模型补偿系数设置为0；否则，将所述对象SCORE′(N*P％)作为所述基本语音单元片断对应的所述竞争模型的模型补偿系数。

从所述似然度得分差集合中选择最小的N*P％个对象，N为所述似然度得分差集合中的对象个数，P％为所述发音模型和所述竞争模型间的虚警比例；

获取所述N*P％个对象中最大的值；

如果所述最大的值大于0，则将所述基本语音单元片断对应的所述竞争模型的模型补偿系数设置为0；否则，将所述最大的值作为所述基本语音单元片断对应的所述竞争模型的模型补偿系数。

一种发音检错装置，包括：

信号获取单元，用于获取待检错语音信号；

特征提取单元，用于提取所述语音信号的语音特征序列；

片断获取单元，用于对所述语音特征序列进行切分，获取基本语音单元片断；

得分补偿单元，用于对所述基本语音单元片断进行模型得分补偿，获得所述基本语音单元片断的发音得分；

发音检错单元，用于根据各所述基本语音单元片断的发音得分进行发音检错。

优选地，所述得分补偿单元包括：

模型确定子单元，用于确定所述基本语音单元片断对应的发音模型和竞争模型；

得分计算子单元，用于计算所述基本语音单元片断与所述发音模型的第一似然度得分，以及所述基本语音单元片断与所述竞争模型的第二似然度得分；

系数获得子单元，用于获得所述基本语音单元片断对应的所述竞争模型的模型补偿系数；

补偿子单元，用于根据所述模型补偿系数对其对应的所述第二似然度得分进行补偿，获得第三似然度得分；

得分确定子单元，用于根据所述竞争模型对应的所述第三似然度得分及所述第一似然度得分获得所述基本语音单元片断的发音得分。

优选地，所述系数获得子单元包括：

数据获取子单元，用于获取训练数据；

片断获取子单元，用于获取所述训练数据中的基本语音单元片断；

确定子单元，用于确定所述基本语音单元片断对应的发音模型及竞争模型；

集合获得子单元，用于计算所述基本语音单元片断的第一似然度得分集合及第二似然度得分集合；其中，所述第一似然度得分集合为由所有所述训练数据中的基本语音单元片断与所述发音模型的似然度得分形成的集合；所述第二似然度得分集合为由所有所述训练数据中的基本语音单元片断与所述竞争模型的似然度得分形成的集合；

系数确定子单元，用于根据所述第一似然度得分集合及所述第二似然度得分集合，确定所述基本语音单元片断对应的所述竞争模型的模型补偿系数。

优选地，所述系数确定子单元包括：

集合计算子单元，用于计算所述第一似然度得分集合与所述第二似然度得分集合之间的似然度得分差集合；

排序子单元，用于对所述似然度得分差集合中的对象按照数值从小到大进行排序，得到一得分差数组SCORE′；

对象获取子单元，用于根据预设的所述发音模型和所述竞争模型间的虚警比例P％及所述似然度得分差集合中的对象个数N，获得得分差数组SCORE′中的对象SCORE′(N*P％)；

第一确定子单元，用于判断所述对象SCORE′(N*P％)是否大于0；如果是，则将所述基本语音单元片断对应的所述竞争模型的模型补偿系数设置为0；否则，将所述对象SCORE′(N*P％)作为所述基本语音单元片断对应的所述竞争模型的模型补偿系数。

优选地，所述系数确定子单元包括：

第一选择子单元，用于从所述似然度得分差集合中选择最小的N*P％个对象，N为所述似然度得分差集合中的对象个数，P％为所述发音模型和所述竞争模型间的虚警比例；

第二选择子单元，用于获取所述N*P％个对象中最大的值；

第二确定子单元，用于判断所述最大的值是否大于0，如果是，则将所述基本语音单元片断对应的所述竞争模型的模型补偿系数设置为0；否则，将所述最大的值作为所述基本语音单元片断对应的所述竞争模型的模型补偿系数。

本发明实施例至少具有以下有益效果：

本发明实施例通过对各基本语音单元片断进行模型得分补偿来修正基本语音单元片断的发音得分，使得发音得分能反映实际情况，减小了发音得分出现的偏差，提高了发音检错的准确率。

附图说明

为了更清楚地说明本申请实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请中记载的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本发明实施例发音检错方法的流程图；

图2为本发明实施例中获得基本语音单元片断的发音得分的方法流程图；

图3为本发明实施例中获得基本语音单元片断对应的竞争模型的模型补偿系数的方法流程图；

图4A为本发明实施例中获取模型补偿系数的一种流程图；

图4B为本发明实施例中获取模型补偿系数的另一种流程图；

图5为本发明实施例发音检错装置的结构示意图；

图6为本发明实施例中得分补偿单元的结构示意图；

图7为本发明实施例中系数获得子单元的结构示意图；

图8A为本发明实施例中系数确定子单元的一种结构示意图；

图8B为本发明实施例中系数确定子单元的另一种结构示意图。

具体实施方式

为了使本技术领域的人员更好地理解本申请中的技术方案，下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都应当属于本申请保护的范围。

为使本申请的上述目的、特征和优点能够更加明显易懂，下面结合附图和具体实施方式对本申请作进一步详细的说明。

参见图1，为本发明实施例一种发音检错的方法流程图。

该方法可以包括：

步骤101，获取待检错语音信号。

步骤102，提取语音信号的语音特征序列。

具体可以采用多种现有方法提取语音信号的语音特征序列，例如，首先对语音信号分帧，如获取窗长25ms帧移10ms的每帧语音数据，并对每帧语音数据依次通过短时分析提取特征矢量，如MFCC(Mel频率倒谱系数)参数，PLP(感知线性预测)参数等。进一步的还可获取所述特征矢量的一阶、二阶差分，得到扩展的特征矢量。

步骤103，对语音特征序列进行切分，获取基本语音单元片断。

具体可以采用多种现有方法对语音特征序列进行切分，获取一个或多个基本语音单元片断。例如，首先根据待检测语音信号的检测文本搭建文本切分网络，并根据预设声学模型扩展获得解码网络；随后在解码网络空间内，搜索步骤102获得的语音特征序列的最优路径，实现对语音特征序列的切分，获得基本语音单元片断。该基本语音单元片断根据用户需要，可以是音素、音节、声韵母等。

步骤104，对基本语音单元片断进行模型得分补偿，获得基本语音单元片断的发音得分。

由于训练集数据不均衡，导致不同声学模型得分不同，训练数据稀疏与训练数据充足这两种情况下模型得分之间存在差异，因此在全部阅读正确的集合上统计各模型之间得分差，即正确阅读时，认为发音模型得分最高，如果竞争模型得分高于发音模型，即将竞争模型得分加上一个负值或将发音模型加上一个正值，使得竞争模型得分小于文本得分。

所述竞争模型为预设的与当前考察模型可比的模型，通常可依据模型的发音，即选取与基本模型发音相似或相近的模型，或可能存在识别错误的模型作为竞争模型。更一般地，可以选取与基本模型发音不同的其它所有模型都作为竞争模型。

本发明实施例利用基本语音单元片断对应的各竞争模型之间的模型补偿系数对基本语音单元片断与竞争模型之间的似然度得分进行补偿，从而修正基本语音单元片断的发音得分。对获得的每一个基本语音单元片断都采取同样的方法进行模型得分补偿，其中，该模型补偿系数可以是预设的经验值，也可以是通过训练数据获得。具体请参照后续实施例的描述。

步骤105，根据基本语音单元片断的发音得分进行发音检错。

具体可以根据模型得分补偿后获得的基本语音单元片断的发音得分及预设的检错阈值来确定该语音单元片断的发音是否正确。如果该基本语音单元片断的发音得分大于检错阈值，则判定发音正确，否则判定发音错误。该检错阈值可以根据大量实验或经验预先设定。

本发明实施例通过对各基本语音单元片断进行模型得分补偿来修正基本语音单元片断的发音得分，使得发音得分能反映实际情况，模型准确的情况下，当用户按照给定文本阅读时，必然是发音模型得分最高，但由于训练数据的有限性，训练数据包含基本语音单元词频分布具有一定的偏向性，因此真实数据测试中，即使按照文本阅读，也会出现部分发音模型得分低于竞争模型，为了消除训练数据导致的模型得分失真问题，本发明实施例的方法，通过对模型进行得分补偿，减小了发音得分出现的偏差，提高了发音检错的准确率。

在本发明的另一实施例中，以其中一个基本语音单元片断T为例进行说明，对基本语音单元片断T进行模型得分补偿，获得基本语音单元片断T的发音得分的过程，如图2所示，包括：

步骤201，确定基本语音单元片断对应的发音模型和竞争模型。

假设该基本语音单元片断T对应的发音模型为M_i，竞争模型为M_j，该基本语音单元片断T的特征矢量为O_t。该发音模型M_i的竞争模型M_j有一个或多个。

步骤202，计算基本语音单元片断与发音模型的第一似然度得分，以及基本语音单元片断与竞争模型的第二似然度得分。

其中，似然度得分的计算方法与现有技术类似。第一似然度得分为P(O_t|M_i)；第二似然度得分为P(O_t|M_j)，竞争模型M_j与第二似然度得分P(O_t|M_j)一一对应。

步骤203，获得基本语音单元片断对应的竞争模型的模型补偿系数。

假设发音模型M_i对应的竞争模型M_j的模型补偿系数为C_ij，竞争模型M_j与模型补偿系数C_ij一一对应。该模型补偿系数C_ij可以是预先根据经验值设定的，也可以是通过对训练数据进行模型训练获得的，具体请参照后续实施例的描述。

步骤204，根据模型补偿系数对其对应的第二似然度得分进行补偿，获得第三似然度得分。

根据模型补偿系数C_ij对第二似然度得分P(O_t|M_j)进行补偿，得到更新的似然度得分P'(O_t|M_j)，例如：

P'(O_t|M_j)＝P(O_t|M_j)+C_ij

步骤205，根据竞争模型对应的第三似然度得分及第一似然度得分获得基本语音单元片断的发音得分。

最终基于模型补偿系数修正后的基本语音单元片断T的发音得分为：

{PP}^{'}_{M_{i}} = \frac{P (O_{t} | M_{i})}{\underset{j}{Σ} P^{'} (O_{t} | M_{j})}

在另一实施例中，获得基本语音单元片断对应的竞争模型的模型补偿系数的方法，如图3所示，可以包括：

步骤301，获取训练数据。

获得多个语音信号作为训练数据。

步骤302，获取训练数据的基本语音单元片断。

可以按照前述步骤102～步骤103所述的方法获得训练数据的基本语音单元片断。

步骤303，确定基本语音单元片断对应的发音模型及各竞争模型。

步骤304，计算基本语音单元片断的第一似然度得分集合及第二似然度得分集合。

其中，第一似然度得分集合为由所有训练数据中的基本语音单元片断T与其发音模型M_i的似然度得分P_k(O_t|M_i)形成的集合{Sm1}，其中k＝1,2…N，N为训练语料中基本语音单元片断T出现的次数；

对于某一竞争模型M_j对应的第二似然度得分集合为由所有训练数据中的基本语音单元片断T与竞争模型M_j的似然度得分P_k(O_t|M_j)形成的集合{Sm2}，同理k＝1,2…N，N为训练语料中基本语音单元片断T出现的次数。

步骤305，根据第一似然度得分集合及第二似然度得分集合，确定基本语音单元片断对应的竞争模型的模型补偿系数。

具体地，以确定基本语音单元片断对应的其中一个竞争模型的模型补偿系数为例，其一种实现流程如图4A所示，可以包括：

步骤401，计算第一似然度得分集合与第二似然度得分集合之间的似然度得分差集合。

计算似然度得分差集合{S₁,S₂,...S_k,...S_N}，其中，S_k＝P_k(O_t|M_i)-P_k(O_t|M_j)，k＝1,2…N，N为训练语料中基本语音单元片断T出现的次数。

步骤402，对似然度得分差集合中的对象按照数值从小到大进行排序，得到一得分差数组SCORE′。

对似然度得分差集合中的对象按照数值从小到大进行排序，得到一得分差数组SCORE′[N]＝{S₁′,S₂′,...S_k′,...S_N′}。

步骤403，根据预设的发音模型和竞争模型间的虚警比例P％以及所述似然度得分差集合中的对象个数(该个数与前面提到的训练语料中基本语音单元片断T出现的次数N相同)，获得基本语音单元片断对应的竞争模型之间的模型补偿系数SCORE′(N*P％)。

相应于发音模型M_i，其竞争模型M_j的补偿系数为C_ij＝SCORE′(N*P％)，其中P％为预设的发音模型M_i和竞争模型M_j间的虚警比例。虚警比例指的是用户在正确阅读时系统却认为错误的比例，其值可根据实验及经验进行设定，比如可以选择设置虚警比例P＝5。发音模型M_i与其对应的不同竞争模型M_j间的虚警比例可以不同。

若SCORE′(N*P％)>0，则C_ij＝0。

同样，仍以确定基本语音单元片断对应的其中一个竞争模型的模型补偿系数为例，其另一种实现流程如图4B所示，可以包括：

步骤411，计算所述第一似然度得分集合与所述第二似然度得分集合之间的似然度得分差集合；

步骤412，从所述似然度得分差集合中选择最小的N*P％个对象，N为所述似然度得分差集合中的对象个数，P％为所述发音模型和所述竞争模型间的虚警比例；

步骤413，选择所述N*P％个对象中最大的值作为所述基本语音单元片断对应的所述竞争模型的模型补偿系数。

同样，如果上述最大的值大于0，则将所述基本语音单元片断对应的所述竞争模型的模型补偿系数设置为0。

相应地，本发明实施例还提供一种发音检错装置，如图5所示，为本发明实施例发音检错装置的结构示意图。

该装置可以包括：

信号获取单元501，用于获取待检错语音信号。

特征提取单元502，用于提取所述语音信号的语音特征序列。

片断获取单元503，用于对所述语音特征序列进行切分，获取基本语音单元片断。

得分补偿单元504，用于对所述基本语音单元片断进行模型得分补偿，获得所述基本语音单元片断的发音得分。

发音检错单元505，用于根据各所述基本语音单元片断的发音得分进行发音检错。

本发明实施例通过上述单元对各基本语音单元片断进行模型得分补偿来修正基本语音单元片断的发音得分，使得发音得分能反映实际情况，减小了发音得分出现的偏差，提高了发音检错的准确率。

在本发明的另一实施例中，如图6所示，得分补偿单元504可以进一步包括：

模型确定子单元601，用于确定所述基本语音单元片断对应的发音模型和竞争模型。

得分计算子单元602，用于计算所述基本语音单元片断与所述发音模型的第一似然度得分，以及所述基本语音单元片断与所述竞争模型的第二似然度得分。

系数获得子单元603，用于获得所述基本语音单元片断对应的所述竞争模型的模型补偿系数。

补偿子单元604，用于根据所述模型补偿系数对其对应的所述第二似然度得分进行补偿，获得第三似然度得分。

得分确定子单元605，用于根据所述竞争模型对应的所述第三似然度得分及所述第一似然度得分获得所述基本语音单元片断的发音得分。

在本发明的另一实施例中，如图7所示，系数获得子单元603可以进一步包括：

数据获取子单元701，用于获取训练数据。

片断获取子单元702，用于获取所述训练数据中的基本语音单元片断。

确定子单元703，用于确定所述基本语音单元片断对应的发音模型及竞争模型。

集合获得子单元704，用于计算所述基本语音单元片断的第一似然度得分集合及第二似然度得分集合；其中，所述第一似然度得分集合为由所有所述训练数据中的基本语音单元片断与所述发音模型的似然度得分形成的集合；所述第二似然度得分集合为由所有所述训练数据中的基本语音单元片断与所述竞争模型的似然度得分形成的集合。

系数确定子单元705，用于根据所述第一似然度得分集合及所述第二似然度得分集合，确定所述基本语音单元片断对应的所述竞争模型的模型补偿系数。

在本发明的另一实施例中，如图8A所示，系数确定子单元705又进一步包括：

集合计算子单元801，用于计算所述第一似然度得分集合与所述第二似然度得分集合之间的似然度得分差集合。

排序子单元802，用于对所述似然度得分差集合中的对象按照数值从小到大进行排序，得到一得分差数组SCORE′。

对象获取子单元803，用于根根据预设的所述发音模型和所述竞争模型间的虚警比例P％及所述似然度得分差集合中的对象个数N，获得得分差数组SCORE′中的对象SCORE′(N*P％)；

第一确定子单元804，用于判断所述对象SCORE′(N*P％)是否大于0；如果是，则将所述基本语音单元片断对应的所述竞争模型的模型补偿系数设置为0；否则，将所述对象SCORE′(N*P％)作为所述基本语音单元片断对应的所述竞争模型的模型补偿系数。

所述虚警比例可以为5。

系数确定子单元705的另一种具体结构如图8B所示，包括：

第一选择子单元812，用于从所述似然度得分差集合中选择最小的N*P％个对象，N为所述似然度得分差集合中的对象个数，P％为所述发音模型和所述竞争模型间的虚警比例；

第二选择子单元813，用于选择所述N*P％个对象中最大的值；

第二确定子单元814，用于判断所述最大的值是否大于0，如果是，则将所述基本语音单元片断对应的所述竞争模型的模型补偿系数设置为0；否则，将所述最大的值作为所述基本语音单元片断对应的所述竞争模型的模型补偿系数。当然，系数确定子单元705还可以有其它实现结构，对此本发明实施例不做限定。

以上装置中各单元的具体实现过程请参见前述方法实施例的相应描述，此处不再赘述。

为了描述的方便，描述以上装置时以功能分为各种单元分别描述。当然，在实施本申请时可以把各单元的功能在同一个或多个软件和/或硬件中实现。

通过以上的实施方式的描述可知，本领域的技术人员可以清楚地了解到本申请可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品可以存储在存储介质中，如ROM/RAM、磁碟、光盘等，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本申请各个实施例或者实施例的某些部分所述的方法。

本说明书中的各个实施例均采用递进的方式描述，各个实施例之间相同相似的部分互相参见即可，每个实施例重点说明的都是与其他实施例的不同之处。尤其，对于装置实施例而言，由于其基本相似于方法实施例，所以描述得比较简单，相关之处参见方法实施例的部分说明即可。以上所描述的装置实施例仅仅是示意性的，其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性劳动的情况下，即可以理解并实施。

本申请可用于众多通用或专用的计算系统环境或配置中。例如：个人计算机、服务器计算机、手持设备或便携式设备、平板型设备、多处理器系统、基于微处理器的系统、置顶盒、可编程的消费电子设备、网络PC、小型计算机、大型计算机、包括以上任何系统或设备的分布式计算环境等等。

本申请可以在由计算机执行的计算机可执行指令的一般上下文中描述，例如程序模块。一般地，程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本申请，在这些分布式计算环境中，由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中，程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。

以上所述仅是本申请的具体实施方式，应当指出，对于本技术领域的普通技术人员来说，在不脱离本申请原理的前提下，还可以做出若干改进和润饰，这些改进和润饰也应视为本申请的保护范围。

Claims

1.一种发音检错方法，其特征在于，包括：

获取待检错语音信号；

提取所述语音信号的语音特征序列；

对所述语音特征序列进行切分，获取基本语音单元片断；

根据所述基本语音单元片断的发音得分进行发音检错。

2.根据权利要求1所述的方法，其特征在于，所述对所述基本语音单元片断进行模型得分补偿，获得所述基本语音单元片断的发音得分，包括：

确定所述基本语音单元片断对应的发音模型和竞争模型；

3.根据权利要求2所述的方法，其特征在于，所述获得所述基本语音单元片断对应的所述竞争模型的模型补偿系数，包括：

获取训练数据；

获取所述训练数据中的基本语音单元片断；

确定所述基本语音单元片断对应的发音模型及竞争模型；

4.根据权利要求3所述的方法，其特征在于，所述根据所述第一似然度得分集合及所述第二似然度得分集合，确定所述基本语音单元片断对应的竞争模型的模型补偿系数，包括：

5.根据权利要求3所述的方法，其特征在于，所述根据所述第一似然度得分集合及所述第二似然度得分集合，确定所述基本语音单元片断对应的竞争模型的模型补偿系数，包括：

获取所述N*P％个对象中最大的值；

6.一种发音检错装置，其特征在于，包括：

信号获取单元，用于获取待检错语音信号；

特征提取单元，用于提取所述语音信号的语音特征序列；

7.根据权利要求6所述的装置，其特征在于，所述得分补偿单元包括：

8.根据权利要求7所述的装置，其特征在于，所述系数获得子单元包括：

数据获取子单元，用于获取训练数据；

9.根据权利要求8所述的装置，其特征在于，所述系数确定子单元包括：

10.根据权利要求8所述的装置，其特征在于，所述系数确定子单元包括：

第二选择子单元，用于获取所述N*P％个对象中最大的值；