CN101051458A - 基于组块分析的韵律短语预测方法 - Google Patents

基于组块分析的韵律短语预测方法 Download PDF

Info

Publication number
CN101051458A
CN101051458A CNA2006100731021A CN200610073102A CN101051458A CN 101051458 A CN101051458 A CN 101051458A CN A2006100731021 A CNA2006100731021 A CN A2006100731021A CN 200610073102 A CN200610073102 A CN 200610073102A CN 101051458 A CN101051458 A CN 101051458A
Authority
CN
China
Prior art keywords
chunk
phrase
rhythm
model
prosodic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA2006100731021A
Other languages
English (en)
Other versions
CN101051458B (zh
Inventor
陶建华
董宏辉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Institute of Automation of Chinese Academy of Science
Original Assignee
Institute of Automation of Chinese Academy of Science
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Institute of Automation of Chinese Academy of Science filed Critical Institute of Automation of Chinese Academy of Science
Priority to CN2006100731021A priority Critical patent/CN101051458B/zh
Publication of CN101051458A publication Critical patent/CN101051458A/zh
Application granted granted Critical
Publication of CN101051458B publication Critical patent/CN101051458B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Machine Translation (AREA)

Abstract

本发明涉及一种基于组块分析的韵律短语预测方法,用于语音合成系统韵律短语的预测,将系统接收或输入的任意文字串转换成带有韵律短语停顿标注的文字形式,将组块作为韵律短语预测的基本单元,训练生成组块合并模型;训练生成韵律短语边界必停点的预测模型;训练生成韵律短语的节律平衡模型;基于组块合并模型、韵律短语必停点的预测模型、长度约束模型执行生成韵律短语。创建韵律短语标注语料库,用组块从文本生成组块,利用韵律短语语料库估计组块合并模型、训练支持向量机识别器,得到韵律短语的必停点的预测器,利用韵律短语语料库训练节律平衡模型。本发明提高了韵律短语边界预测的准确率和召回率,使得合成结果保持较好的自然度和可懂度。

Description

基于组块分析的韵律短语预测方法
技术领域
本发明总的来说涉及一种语音合成中韵律短语预测方法,尤指一种利用组块分析结果预测韵律短语的方法。
背景技术
准确地从文本预测韵律短语停顿的位置是语音合成中至关重要的一步,正确的短语边界会使合成出来的语音自然流畅,短语边界还会影响后面的基频曲线和时长等预测模块。虽然,在这个领域已经有很多的研究工作,短语预测还有很多问题至今没有很好的解决。
该领域中,以往的研究已经引入了很多方法。基于对语言学特征的详细分析,利用CART模型预测英语的短语边界,也有很多研究者将该方法引入中文的韵律短语预测。Paul Taylor和Alan W.Black引入HMM作为韵律短语的预测框架。Ostendorf和Veilleux提出了层级统计模型描述韵律结构。几乎所有的人都认为语法约束和韵律短语的长度约束在韵律短语的产生过程中起着最为重要的作用,句法结构制约着韵律结构,韵律单元不应破坏很多句法及语义成分;另外,韵律短语趋于在整句话的节律上达到某种平衡。实际上,很难准确的获得中文的完全句法分析。在过去的研究中,短语的长度信息多被用作一个独立的参数,短语长度之间的关系以及在整个句子中的分配都没有得到很好的描述。因此,针对这些问题,需要一个新的韵律短语预测的模型以提高韵律短语预测的准确性。
发明内容
为了解决韵律短语预测的准确低的技术问题,本发明目的是更新的韵律短语预测的模型以提高韵律短语预测的准确性,提供一种利用组块分析结果进行韵律短语预测的方法,该方法可使合成结果获得较好的自然度。
为了实现上述目的,根据本发明,在该方法中,引入浅层句法分析单元,组块,作为韵律短语预测的主要语言学特征,建立了语言学约束模型,其包括组块合并模型和韵律必停点的预测模型。同时引入n元的方法来描述韵律短语长度分布的关系,建立了节律平衡模型。为了很好的融合组块合并模型和韵律必停点的预测模型这两个模块,我们使用了k候选方法:首先基于语言学约束模型,生成k种可能的韵律短语结构;然后利用短语长度模型从中选择长度分配最优的一组短语结构。
根据本发明提出的基于组块分析的韵律短语预测方法,是将组块作为韵律短语预测的基本单元,包括步骤:
选择合适的组块规范作为韵律短语预测的基本分析单元;
生成训练组块合并模型;
训练生成韵律短语边界必停点的预测模型;
训练生成韵律短语的节律平衡模型;
基于组块合并模型、韵律短语必停点的预测模型、节律平衡约束模型执行生成韵律短语。
根据本发明所述的基于组块分析的韵律短语预测方法,该方法主要训练步骤包括,创建韵律短语标注语料库,利用组块分析器从文本生成组块信息,利用韵律短语语料库估计组块合并模型,利用韵律短语语料库训练支持向量机识别器,得到韵律短语的必停点的预测器,利用韵律短语语料库训练节律平衡模型;
优选地,所述将组块作为韵律短语预测的基本分析单元是生成组块定义信息;生成组块长度信息定义。
优选地,所述生成组块合并模型是训练生成组块在韵律短语中连接的概率;训练生成组块合并概率阈值。
优选地,所述生成韵律短语边界的必停点的预测模型是基于支持向量机识别器的预测模型,生成词性和位置信息特征。
优选地,所述生成节律的平衡模型的步骤包括:在韵律短语语料库中,将各个韵律短语的长度替代各个韵律短语的位置;以韵律短语长度为单位组成的语料,训练生成三元、二元模型。
优选地,所述将组块合并模型,韵律短语必停点的预测模型,长度约束模型执行生成韵律短语的步骤包括:
基于组块支持向量机识别器的识别结果,利用组块合并模型,合并组块,确定韵律的不停顿点及停顿点;
基于韵律停顿点,利用支持向量机识别器确定韵律必停顿的位置;
基于韵律短语的节律平衡模型寻找余下的韵律短语边界。
优选地,所述生成韵律短语是将韵律词边界确定为不停顿点、必须停顿的位置、及余下的可停可不停的位置;将可停可不停的位置置为停或者不停,生成k种可能的停顿方式;从这k种可能的停顿方式中,选出最有可能的停顿方式。
优选地,所述组块定义包括:名词组块,形容词组块,动词组块,介词组块。
优选地,组块规范是选择每个组块的适当长度,组块规范包括每种组块类型的具体定义及如何标注生成语料。选择一个组块长度定义较小的组块规范。
优选地,所述节律平衡模型描述韵律短语长度分布关系,生成k种可能的韵律短语结构;利用所述的短语长度,选择长度分配最优的一组短语结构。
附图说明
以下结合附图对所采用的优选实施例作详细描述,其中
图1是本发明基于组块分析的韵律短语预测的模型训练
图2是本发明基于组块分析的韵律短语预测执行过程示意图
具体实施方式
根据本发明,图1基于组块分析的韵律短语预测的模型训练,
具体地训练步骤包括:准备韵律短语语料库、训练生成组块合并模型、训练生成支持向量机识别器、训练生成节律平衡模型。
根据本发明,图2基于组块分析的韵律短语预测执行过程示意图,
具体地执行过程步骤包括:文本、组块分析、组块合并模型、支持向量机识别器、生成韵律短语停顿模式的K种候选、节律平衡模型、韵律短语边界。
下面结合附图来说明本发明的优选实施例。
根据本发明图1所示:训练步骤:创建韵律短语标注语料库,利用组块分析器从文本生成组块信息,利用韵律短语语料库估计组块合并模型,利用韵律短语语料库训练支持向量机识别器,得到韵律短语的必停点的预测器,利用韵律短语语料库训练节律平衡模型;
根据本发明图2所示:执行过程步骤:利用组块合并模型确定不可停顿的地方,利用支持向量机识别器确定韵律短语的必停点,利用韵律短语的节律平衡模型寻找余下的韵律短语边界。
下面根据本发明从六个方面叙述优选实施例:1.准备韵律短语标注语料库,2.训练得到组块合并模型,3.训练生成韵律短语边界必停点的预测模型,4.训练节律平衡模型,5.训练n元(N-gram)模型,6.系统实现。
1.准备韵律短语标注语料库
根据本发明,所述文本:选用一个标注有韵律词及韵律短语边界信息的文本语料库。要求,标注韵律短语边界一定是要从感知上能感觉到明显的停顿的。
例如标注实例:
|他又 走过去|在 茶壶里|放了|薄荷叶 和糖|。
其中,‘|’表示韵律短语的位置。
2.训练得到组块合并模型
包括:组块分析单元,训练生成组块在韵律短语中连接概率,训练生成组块合并概率的阈值。
根据本发明所述将组块作为韵律短语预测的基本分析单元:
生成组块定义信息,将按组块定义要求包括:基本的几个类型,名词组块NP,形容词组块ADJP,动词组块VP,介词组块PP。
具体地,所述组块:组块规范包括每种组块类型的具体定义及如何标注生成语料,是选择一个组块长度定义较小的组块规范,其中组块长度要求不能超过5个汉字。
根据本发明所述生成组块合并模型,是训练生成组块在韵律短语中连接的概率:
即将所述组块定义按类型分为:当前组块类型C0,后续组块类型C1
即将所述组块定义按长度分为:当前组块长度len0和后续组块长度len1
训练生成组块定义在韵律短语中连接当前组块C0和后续组块C1长度的概率为:
概率估计对象为:P(J0=0|C0,C1),P(J0=0|len0,len1)      (1)
公式(1)中:当前组块C0和后续组块C1的连接类型为J0;当J0等于0时,代表着当前组块C0和后续组块C1合并在一起。概率P(J0=0|len0,len1)是用来描述组块的长度对组块之间的合并的影响。
所述概率估计对象参数P(j|C0,C1)及P(j|len0,len1)采用极大似然估计法(MLE)从训练语料中估计:
P ( j | C 0 , C 1 ) = count ( j , C 0 , C 1 ) count ( C 0 , C 1 ) - - - ( 2 )
P ( j | len 0 , len 1 ) = count ( j , len 0 , len 1 ) count ( len 0 , len 1 ) - - - ( 3 )
这里公式(2)和(3)中,count(j,C0,C1)为j,C0和C1在训练语料中同时出现的频度;count(C0,C1)为C0和C1在训练语料中同时出现的频度;count(j,len0,len1)为j、len0和len1在训练语料中同时出现的频度。
根据本发明,所述训练生成组块合并概率的阈值η为公式(4):
P(J0=0|C0,C1)·P(J0=0|len0,len1)>η                (4)
基于以上执行过程的系统如图2所示及一个开发语料集如图1所示的韵律短语语料库:调整η的值,使其在0到1之间取值,取参数η使得该系统在开发语料集上的整个韵律短语边界识别的调和平均值(f-score)最高。
3.训练生成韵律短语边界必停点的预测模型
训练韵律短语必停点的预测模型,可分为以下步骤:
利用选择支持向量机识别器为该模型的预测模型;用词性和位置信息等作为主要的特征;用标注好韵律短语的语料作为训练语料该支持向量机识别器。
选择特征时,以词法特征,如词性、位置信息、词的长度信息,为主要的考察对像,这里我们没有将组块的类型作为特征;最终选择的特征向量为:
x=(p-2,l-2,t-2,p-1,l-1,t-1,p0,l0,p1,l1,p2,l2,d_s,d_e)   (5)
公式(5)中,该向量中,p表示POS(词性);l表示词长;t表示是否为韵律短语边界;下标表示在窗口中的位置,0表示当前的判别位置;待判断边界在句子中到句首和句尾的距离分别用d_s和d_e来表示。利用该方法预测的边界被假设为句子中应当成为韵律短语边界。经过组块合并和最可能的韵律短语边界预测后,剩下的就是潜在的韵律短语边界。
4.训练节律平衡模型:
根据本发明所述概率估计对象,假设一个语句包含n个韵律短语,那么该语句的韵律短语长度分配的概率可以表示为:
P ( Lp 1 , Lp 2 , · · · , Lp n )
≈ P ( L p 1 ) P ( Lp 2 | Lp 1 ) Π i = 3 n P ( Lp i | Lp i - 1 , L i - 2 ) - - - ( 6 )
公式(6)中,Lpi表示第i个韵律短语的长度。我们假设了短语之间的马尔可夫性,这样就可以用一个n元模型描述韵律短语长度之间的关系。
这样,每一个可能的韵律短语分配都可以用一个n元模型来计算其概率。
根据本发明所述生成韵律短语的节律平衡模型,可分为以下步骤,如图1所示:
在韵律短语语料库中,将各个韵律短语的长度替代该各个韵律短语的位置。这样,将生成也全部由韵律短语的长度构成的一个库。
以韵律短语长度Lpi为单位组成的语料,训练生成三元、二元模型。
5.训练n元模型:
根据本发明,基于图1所述的训练短语语料库,采用极大似然估计法(MLE)从训练短语语料库中估计:
P ( Lp i | Lp i - 1 ) = count ( Lp i , Lp i - 1 ) count ( Lp i - 1 ) - - - ( 7 )
P ( Lp i | Lp i - 1 , Lp i - 2 ) = count ( Lp i , Lp i - 1 , Lp i - 2 ) count ( Lp i - 1 , Lp i - 2 ) - - - ( 8 )
这里公式(7)和(8)中,count(Lpi,Lpi-1)为Lpi和Lpi-1在训练语料中同时出现的频度;count(Lpi-1)为Lpi-1在训练语料中同时出现的频度;count(Lpi,Lpi-1,Lpi-2)为Lpi、Lpi-1和Lpi-1在训练语料中同时出现的频度。
6.系统实现
如图2所示:基于组块合并模型、韵律短语的必停点的预测模型和节律平衡模型执行生成韵律短语边界。
具体地,基于组块支持向量机识别器的识别结果,利用组块合并模型,合并组块,确定韵律的不可停顿点及可停顿点。
具体地,基于韵律的可停顿点,利用支持向量机识别器确定韵律的必须停顿的位置。
基于以上具体的两个步骤,将韵律词边界确定为不可停顿点,必停顿点,及余下的可停也可不停的位置;将可停可不停的位置置为停或者不停,生成k种可能的停顿方式;然后,利用下式计算节律最优的韵律短语分配为:
arg max i P ( U i )
= arg max i P ( Lp 1 , Lp 2 , · · · , Lp n ) - - - ( 9 )
从这k种可能的停顿方式中,选出节律平衡最优的停顿方式如公式(9)。
本发明提出了一种新的韵律短语预测方法,基于组块分析的结果分析生成韵律短语边界,取得了准确的预测结果。本发明的方法,由于韵律停顿极少出现在组块内部及一些组块之间,本发明还设计了组块合并模型,以确定句子中不能停顿的位置。同时,句中还有一些极有可能停顿的地方,我们称为必停点。支持向量机识别器被用来判别必停点,这也是由于支持向量机的高的识别率的原因。确定了不能停顿的位置及必须停顿的位置,余下的词边界就是可停可不停的位置。这些位置的停顿与否取决于是否能使整个句子在节律上平衡。为此,我们又提出了节律平衡模型,以确定节律上最优的韵律短语分配方式。使用该方法,由于确定了不能停顿点,使停顿出错的几率大大降低,同时,由于使用了节律平衡模型,又极大地提高了韵律短语边界预测的准确率和召回率,使得合成结果保持较好的自然度和可懂度。

Claims (10)

1、一种基于组块分析的韵律短语预测方法,其特征在于:用于语音合成系统中文本分析的韵律短语预测,将系统接收到的或输入的任意文字串转换成带有韵律短语停顿标注的文字形式,将组块作为韵律短语预测的基本单元,步骤包括:
选择合适的组块规范作为韵律短语预测的基本分析单元;
训练生成组块合并模型;
训练生成韵律短语边界必停点的预测模型;
训练生成韵律短语的节律平衡模型;
基于组块合并模型、韵律短语必停点的预测模型、长度约束模型执行生成韵律短语。
2、根据权利要求1所述的基于组块分析的韵律短语预测方法,其特征在于:训练生成步骤包括,创建韵律短语标注语料库,利用组块分析器从文本生成组块信息;利用韵律短语语料库估计组块合并模型;利用韵律短语语料库训练支持向量机识别器,得到韵律短语的必停点的预测器;利用韵律短语语料库训练节律平衡模型。
3、根据权利要求1所述的基于组块分析的韵律短语预测方法,其特征在于所述组块作为韵律短语预测的基本分析单元步骤包括:生成组块定义信息;生成组块长度信息定义。
4、根据权利要求1或2所述的基于组块分析的韵律短语预测方法,其特征在于所述生成组块合并模型步骤包括:
训练生成组块在韵律短语中连接概率;训练生成组块合并概率阈值。
5、根据权利要求1所述的基于组块分析的韵律短语预测方法,其特征在于所述生成韵律短语边界的必停点的预测模型步骤包括:
基于支持向量机识别器的预测模型,生成词性和位置信息特征。
6、根据权利要求1所述的基于组块分析的韵律短语预测方法,其特征在于所述生成节律的平衡模型步骤包括:
将各个韵律短语的长度替代各个韵律短语的位置;
以韵律短语长度为单位组成的语料,训练生成三元、二元模型。
7、根据权利要求1所述的基于组块分析的韵律短语预测方法,其特征在于所述执行生成韵律短语的步骤包括:
a.利用组块合并模型,合并组块,确定韵律的不可停顿点及可停顿点;
b.基于韵律的可停顿点,利用支持向量机识别器确定韵律的必停顿的位置;
c.利用韵律短语的节律平衡模型寻找余下的韵律短语边界。
8、根据权利要求7所述的基于组块分析的韵律短语预测方法,其特征在于,所述生成韵律短语步骤包括:将韵律词边界确定为不可停顿点、必须停顿的位置、及余下的可停可不停的位置;将可停可不停的位置置为停或者不停,生成k种可能的停顿方式;从这k种可能的停顿方式中,选出最有可能的停顿方式。
9、根据权利要求3所述的基于组块分析的韵律短语预测方法,其特征在于所述组块定义步骤包括:
组块的定义要求包括:名词组块、形容词组块、动词组块、介词组块;选择一个组块长度定义较小的组块规范。
10、根据权利要求1所述的基于组块分析的韵律短语预测方法,其特征在于,所述节律平衡模型描述韵律短语长度分布关系,生成k种可能的韵律短语结构;利用所述的短语长度,选择长度分配最优的一组短语结构。
CN2006100731021A 2006-04-04 2006-04-04 基于组块分析的韵律短语预测方法 Active CN101051458B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2006100731021A CN101051458B (zh) 2006-04-04 2006-04-04 基于组块分析的韵律短语预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2006100731021A CN101051458B (zh) 2006-04-04 2006-04-04 基于组块分析的韵律短语预测方法

Publications (2)

Publication Number Publication Date
CN101051458A true CN101051458A (zh) 2007-10-10
CN101051458B CN101051458B (zh) 2011-02-09

Family

ID=38782838

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2006100731021A Active CN101051458B (zh) 2006-04-04 2006-04-04 基于组块分析的韵律短语预测方法

Country Status (1)

Country Link
CN (1) CN101051458B (zh)

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102063898A (zh) * 2010-09-27 2011-05-18 北京捷通华声语音技术有限公司 韵律短语预测方法
CN101572083B (zh) * 2008-04-30 2011-09-07 富士通株式会社 韵律词组词方法和装置
CN104021784A (zh) * 2014-06-19 2014-09-03 百度在线网络技术(北京)有限公司 基于大语料库的语音合成方法和装置
CN105185373A (zh) * 2015-08-06 2015-12-23 百度在线网络技术(北京)有限公司 韵律层级预测模型的生成及韵律层级预测方法和装置
CN105225658A (zh) * 2015-10-21 2016-01-06 百度在线网络技术(北京)有限公司 韵律停顿信息的确定方法和装置
CN105528340A (zh) * 2015-12-02 2016-04-27 北京信息科技大学 一种多动词汉语概念复合块的动词层次分类的方法
CN106293121A (zh) * 2016-08-05 2017-01-04 深圳市金立通信设备有限公司 一种文本输入方法及终端
CN107886938A (zh) * 2016-09-29 2018-04-06 中国科学院深圳先进技术研究院 虚拟现实引导催眠语音处理方法及装置
CN110176225A (zh) * 2019-05-30 2019-08-27 科大讯飞股份有限公司 一种韵律预测效果的评估方法及装置
CN110223671A (zh) * 2019-06-06 2019-09-10 标贝(深圳)科技有限公司 语言韵律边界预测方法、装置、系统和存储介质
CN111667816A (zh) * 2020-06-15 2020-09-15 北京百度网讯科技有限公司 模型训练方法、语音合成方法、装置、设备和存储介质
CN113838448A (zh) * 2021-06-16 2021-12-24 腾讯科技(深圳)有限公司 一种语音合成方法、装置、设备及计算机可读存储介质

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1168068C (zh) * 1999-03-25 2004-09-22 松下电器产业株式会社 语音合成系统与语音合成方法

Cited By (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101572083B (zh) * 2008-04-30 2011-09-07 富士通株式会社 韵律词组词方法和装置
CN102063898B (zh) * 2010-09-27 2012-09-26 北京捷通华声语音技术有限公司 韵律短语预测方法
CN102063898A (zh) * 2010-09-27 2011-05-18 北京捷通华声语音技术有限公司 韵律短语预测方法
CN104021784B (zh) * 2014-06-19 2017-06-06 百度在线网络技术(北京)有限公司 基于大语料库的语音合成方法和装置
CN104021784A (zh) * 2014-06-19 2014-09-03 百度在线网络技术(北京)有限公司 基于大语料库的语音合成方法和装置
CN105185373A (zh) * 2015-08-06 2015-12-23 百度在线网络技术(北京)有限公司 韵律层级预测模型的生成及韵律层级预测方法和装置
CN105225658B (zh) * 2015-10-21 2018-10-19 百度在线网络技术(北京)有限公司 韵律停顿信息的确定方法和装置
CN105225658A (zh) * 2015-10-21 2016-01-06 百度在线网络技术(北京)有限公司 韵律停顿信息的确定方法和装置
CN105528340A (zh) * 2015-12-02 2016-04-27 北京信息科技大学 一种多动词汉语概念复合块的动词层次分类的方法
CN105528340B (zh) * 2015-12-02 2018-12-21 北京信息科技大学 一种多动词汉语概念复合块的动词层次分类的方法
CN106293121A (zh) * 2016-08-05 2017-01-04 深圳市金立通信设备有限公司 一种文本输入方法及终端
CN107886938B (zh) * 2016-09-29 2020-11-17 中国科学院深圳先进技术研究院 虚拟现实引导催眠语音处理方法及装置
CN107886938A (zh) * 2016-09-29 2018-04-06 中国科学院深圳先进技术研究院 虚拟现实引导催眠语音处理方法及装置
CN110176225B (zh) * 2019-05-30 2021-08-13 科大讯飞股份有限公司 一种韵律预测效果的评估方法及装置
CN110176225A (zh) * 2019-05-30 2019-08-27 科大讯飞股份有限公司 一种韵律预测效果的评估方法及装置
CN110223671A (zh) * 2019-06-06 2019-09-10 标贝(深圳)科技有限公司 语言韵律边界预测方法、装置、系统和存储介质
CN111667816A (zh) * 2020-06-15 2020-09-15 北京百度网讯科技有限公司 模型训练方法、语音合成方法、装置、设备和存储介质
US11769480B2 (en) 2020-06-15 2023-09-26 Beijing Baidu Netcom Science And Technology Co., Ltd. Method and apparatus for training model, method and apparatus for synthesizing speech, device and storage medium
CN111667816B (zh) * 2020-06-15 2024-01-23 北京百度网讯科技有限公司 模型训练方法、语音合成方法、装置、设备和存储介质
CN113838448A (zh) * 2021-06-16 2021-12-24 腾讯科技(深圳)有限公司 一种语音合成方法、装置、设备及计算机可读存储介质
CN113838448B (zh) * 2021-06-16 2024-03-15 腾讯科技(深圳)有限公司 一种语音合成方法、装置、设备及计算机可读存储介质

Also Published As

Publication number Publication date
CN101051458B (zh) 2011-02-09

Similar Documents

Publication Publication Date Title
CN101051458A (zh) 基于组块分析的韵律短语预测方法
US20220165249A1 (en) Speech synthesis method, device and computer readable storage medium
Beaufort et al. A hybrid rule/model-based finite-state framework for normalizing SMS messages
CN101650942B (zh) 基于韵律短语的韵律结构生成方法
CN1815522A (zh) 运用计算机进行普通话水平测试和指导学习的方法
US20140324435A1 (en) Combined statistical and rule-based part-of-speech tagging for text-to-speech synthesis
CN1945562A (zh) 训练音译模型、切分统计模型以及自动音译的方法和装置
CN1387650A (zh) 对拼写、打字和转换错误具有容错能力的将一种文本形式转换为另一种文本形式的语言输入体系结构
CN1945693A (zh) 训练韵律统计模型、韵律切分和语音合成的方法及装置
JP2009140503A (ja) 音声翻訳方法及び装置
Kaur et al. Review of machine transliteration techniques
Said et al. A hybrid approach for Arabic diacritization
CN101493812B (zh) 一种音字转换方法
CN1831937A (zh) 语音辨识与语言理解分析的方法与装置
CN1224954C (zh) 含有固定和可变语法块的语言模型的语音识别装置
CN1223985C (zh) 语音识别置信度评价方法和系统及应用该方法的听写装置
CN1956057A (zh) 一种基于决策树的语音时长预测装置及方法
CN1282932A (zh) 汉字分段装置
CN1811912A (zh) 小音库语音合成方法
CN1032391C (zh) 基于波形编辑的汉语文字-语音转换方法及系统
Yu et al. Prosodic modeling with rich syntactic context in HMM-based Mandarin speech synthesis
Laurent et al. Improving recognition of proper nouns in ASR through generating and filtering phonetic transcriptions
Liu et al. A maximum entropy based hierarchical model for automatic prosodic boundary labeling in mandarin
CN1231888C (zh) 利用双音模型实现混合多国语言的语音辨识装置及方法
Al-Haj et al. Pronunciation modeling for dialectal Arabic speech recognition

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant