CN101202041B - 一种汉语韵律词组词方法及装置 - Google Patents

一种汉语韵律词组词方法及装置 Download PDF

Info

Publication number
CN101202041B
CN101202041B CN2006101670400A CN200610167040A CN101202041B CN 101202041 B CN101202041 B CN 101202041B CN 2006101670400 A CN2006101670400 A CN 2006101670400A CN 200610167040 A CN200610167040 A CN 200610167040A CN 101202041 B CN101202041 B CN 101202041B
Authority
CN
China
Prior art keywords
barrier
words
rhythm
speech
deletion
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN2006101670400A
Other languages
English (en)
Other versions
CN101202041A (zh
Inventor
郭庆
片江伸之
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to CN2006101670400A priority Critical patent/CN101202041B/zh
Priority to US12/000,178 priority patent/US8392191B2/en
Priority to JP2007322494A priority patent/JP4968036B2/ja
Publication of CN101202041A publication Critical patent/CN101202041A/zh
Application granted granted Critical
Publication of CN101202041B publication Critical patent/CN101202041B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/08Text analysis or generation of parameters for speech synthesis out of text, e.g. grapheme to phoneme translation, prosody generation or stress or intonation determination
    • G10L13/10Prosody rules derived from text; Stress or intonation

Abstract

本发明为一种汉语韵律词组词方法及装置,所述方法包括:输入汉语文本;对输入的汉语文本进行分词和词性标注处理,生成一初始的韵律词序列;在初始的韵律词序列中所有的词边界上插入代表韵律词边界的隔栅,生成一隔栅韵律词序列;根据韵律词组词手段标注隔栅韵律词序列中预备删除的隔栅;根据韵律词组词手段判断预备删除的隔栅中实际需要删除的隔栅;删除隔栅韵律词序列中实际需要删除的隔栅,并使剩余隔栅中的每两个隔栅之间的词进行组词,生成韵律词。通过减少韵律词边界插入型错误的数目,尽量避免韵律词组词中插入型错误而导致的语音难以理解或者不自然的缺陷,减少韵律词边界插入类型错误的数目。

Description

一种汉语韵律词组词方法及装置
技术领域
本发明涉及汉语语音合成技术,特别涉及汉语语音合成系统中对汉语输入句子进行韵律词组词的处理技术,具体的讲是一种汉语韵律词组词方法及装置。
背景技术
当汉语中多个字组成词或词组而连续发音时,它们之间将会相互影响,形成较独立、完整的韵律块,这些韵律块的韵律特征对语音的自然度起着非常重要的作用,而不同韵律块组合在一起,往往可以形成不同的语调,使人的发音具有不同的语气。一般来说,汉语语音中主要韵律单元有:韵律词、韵律短语、语调短语。汉语的韵律是具有层次结构的,这种层次性的韵律结构形成了汉语语音的节奏(韵律)。韵律单元的边界往往对应于语音中韵律边界音节的停顿、基频变化或者音长变化。韵律是影响合成语音自然度和可懂度的一个重要因素。在语音合成系统中,韵律结构为韵律参数预测模型提供最重要的信息,通过对基频、音长、停顿等参数的预测,来达到控制语音合成系统发音方式的目的,从而在合成语音中实现各级韵律单元的相应韵律效果,使之发音自然、好听。
随着言语处理的不断深入,人们不但越来越需要了解自然话语的韵律结构,而且力图寻找从文本预测韵律结构的方法,以便更加有效地提高合成语音的自然度或语音识别的准确率,同时加深自然语言理解的程度。
韵律词指语音流中连续发音的一组音节,这些音节之间发音非常紧密且其中没有听感上的停顿。韵律词是韵律层次结构中最低一级的要素,一般来说在韵律词边界有可感知的停顿。换句话说,在韵律词内部没有可感知的停顿,而停顿只能出现在韵律词边界处。在真实的语音中,不是所有的韵律词边界都有停顿。如果在韵律词边界有可感知的停顿是可接受的,但是,任何韵律词内部的可感知的停顿会导致语音难以理解或者不自然。因此,一个良好的韵律词组词模块对于增加合成语音的自然度具有极其重要的意义。
在现有技术中,关于韵律词组词模块及其增加合成语音自然度的研究存在多篇公开的论文和专利,例如:
美国专利6,996,529(Minnis;Stephen;February7,2006,Speech synthesiswith prosodic phrase boundary information);
美国专利6,173,262(Hirschberg;Julia;January9,2001,Text-to-speechsystem with automatically trained phrasing rules);
美国专利6,003,005(Hirschberg;Julia;December14,1999,Text-to-speechsystem and a method and apparatus for training the same based upon intonationalfeature annotations of input text);
美国专利5,850,629(Holm;Frode;Pearson;Steve;December15,1998,Userinterface controller for text-to-speech synthesizer);
美国专利6,978,239(Chu;Min;Peng;Hu;December20,2005,Method andapparatus for speech synthesis without prosody modification);
文献,Shih,C.L.,“The Prosodic Domain of Tone Sandhi in MandarinChinese”,PhD Dissertation,UC San Diego,1986;
文献,Chu M.and Qian Y.,“Locating boundaries for prosodic constituents inunrestricted Mandarin texts”,Journal of Computational Linguistics and ChineseLanguage Processing,6(1),61-82,2001;
文献,Dong H.,Tao J.and Xu b.,“Prosodic word prediction using the lexicalinformation”,International Conference on Natural Language Processing andKnowledge Engineering,Wuhan,2005;
文献,Shao Y.,Han,J.,Liu T.and Zhao Y.,“Prosodic word boundariesprediction for Mandarin text-to-speech”,International Symposium on TonalAspects of Languages with Emphasis on Tone Languages,159-162,Beijing,2004;
文献,Dong M.,Lua K.T.and Li H.,“A probabilistic approach to prosodicword prediction for Mandarin Chinese TTS”,9th European Conference on SpeechCommunication and Technology,Lisbon,Portugal,2005;
文献,Qin Shi and XiJun Ma,2002.“Statistic prosody structure prediction”,International Conference of the IEEE2002Workshop on Speech Synthesis,SantaMonica,Ca.,2002;
文献,Ying,Z.,and Shi,X.,“An RNN-based algorithm to detect prosodicphrase for Chinese TTS”,International Conference on Acoustic,Speech andSignal Processing,2001。
上述专利文件和文献所公开的内容特被合并于此,作为本发明申请的现有技术文件。
一般来说,汉语语音合成系统由三个模块组成,它们是:文本分析模块、韵律参数预测模块、后端合成模块。汉语文本分析模块包括分词、词性标注、注音、韵律结构预测等。其中第一步就是分词。这是因为汉语文本与英语等文本不同,在词与词之间没有空格作为分隔符来予以隔开。分词一般是基于词类分析,即或体现一定的句法结构,也与韵律结构不完全相同。韵律结构预测就是要找到一种有效的办法将文本内容映射为韵律结构,是为了建立从文本到韵律特征(如停顿和语调)的预测模型以指导后续的韵律声学参数的生成。
许多研究表明韵律词与词汇学中的词有很大的不同。原因之一就是韵律词的形成不仅是基于词义而且也是基于语音的韵律需要。一个韵律词可以包含多于一个的词汇学上的词,也可以是相对比较长的词汇学上词的其中一部分。分词和词性标注模块基于词汇学的知识对自然语言文本进行了分词和相应的词性标注。
下面针对一个例句描述了文本分析模块的两个处理步骤,分词/词性标注和韵律结构预测。如图1所示:
输入文本:“有一次,我们和外校搞联谊爬香山,我们的学生没有一个掉队的,噌噌噌就爬上了山顶”。
分词和词性标注:“有/v一/m次/q,/w我们/r和/p外/f校/Ng搞/v联谊/v爬/v香山/ns,/w我们/r的/u学生/n没有/v一个/m个/q掉队/v的/u,/w噌噌噌/o就/d爬/v上/v了/u山顶/n。/w”。
韵律结构:“有/v一/m次/q|||我们/r和/c|外/f校/Ng||搞/v联谊/v|爬/v香山/ns|||我们/r的/u|学生/n||没有/v一/m个/q|掉队/v的/u|||噌噌噌/o||就/d爬/v上/v了/u|山顶/n|||”。
其中,“|”表示韵律词边界,“||”表示韵律短语边界,“|||”表示语调短语边界。韵律短语边界和语调短语边界必然也是韵律词边界。韵律词组词模块就是要在分词和词性标注的基础上进行韵律词边界的确定。另外,韵律词组词也是更高层次韵律单元预测如韵律短语预测的基石。因此,韵律词组词的好与坏对于合成语音的自然度有着极其重要的意义。
现有技术中,在汉语韵律词边界预测上提出了许多方法,如classificationand regression tree(CART)方法、基于规则的方法,基于统计的方法和基于自回归神经网络的方法等。在这些方法中,词性(Part ofSpeech,POS)和词长信息被广泛采用。
总体来说,现有技术的韵律词边界预测的准确性不能说很高。边界预测的错误类型通常分为两种:一种是插入型错误(insertion error),另外一种是删除型错误(deletion error)。如前所说,在真实的语音中,不是所有的韵律词边界都有停顿。如果在韵律词边界有可感知的停顿是可接受的,但是,任何韵律词内部的可感知的停顿会导致语音难以理解或者不自然。因此,韵律词组词模块引起的插入型错误会给合成语音带来很大的伤害。相反,删除型错误给合成语音带来的伤害就会小许多。譬如:上面例句中的最后一部分“蹭蹭蹭就爬上了”的分词结果为“蹭蹭蹭就爬上了”(如图1所示)。其中,词汇中的词“就”、“爬”、“上”和“了”均是单字词。它们应该被组在一起成为一个完整的韵律词“就爬上了”。如果在韵律词层次,它们没有被组在一起,那么合成语音中的这一段语音听起来会非常的不自然。在合成语音中,它们在听感上像是逐字逐字地在发音并且其中有听感上的停顿。这是因为韵律预测模型(基频预测和音长预测)对于当前音节是处于韵律词边界还是韵律词内部非常敏感。相反,如果“就爬上了”作为一个韵律词,它的基频曲线听起来就很自然,因为基频预测模型将会考虑更多的协同发音。另外,音长模型也不会去拖长前三个音节“就”、“爬”和“上”的音长,因为现在这三个音节的边界类型均属于韵律词内部类型。
发明内容
本发明的目的在于,提供一种汉语韵律词组词方法及装置,用以克服上述的韵律词插入型错误会导致语音难以理解或者不自然的缺陷,减少韵律词边界插入类型错误的数目。为了实现上述发明目的,本发明提供了:一种汉语韵律词组词方法,所述方法包括以下步骤:输入汉语文本;对输入的汉语文本进行分词和词性标注处理,生成一初始的韵律词序列;在所述初始的韵律词序列中所有的词边界上插入代表韵律词边界的隔栅,生成一隔栅韵律词序列;根据韵律词组词手段标注所述隔栅韵律词序列中预备删除的隔栅;根据韵律词组词手段判断预备删除的隔栅中实际需要删除的隔栅;删除所述隔栅韵律词序列中实际需要删除的隔栅,并使剩余隔栅中的每两个隔栅之间的词进行组词,生成韵律词。
对输入的汉语文本进行分词和词性标注处理生成分词结果,根据所述的分词结果生成一初始的韵律词序列。
所述的根据韵律词组词手段标注所述隔栅韵律词序列中预备删除的隔栅是指:根据多个韵律词组词手段对同一个隔栅韵律词序列中预备删除的隔栅进行标注。
所述的根据韵律词组词手段判断预备删除的隔栅中实际需要删除的隔栅是指:根据多个韵律词组词手段综合判断预备删除的隔栅中实际需要删除的隔栅。
所述的删除所述隔栅韵律词序列中实际需要删除的隔栅包括:根据多个韵律词组词手段对当前预备删除的隔栅进行综合判断,给出当前预备删除的隔栅需要删除的置信度;根据所述的置信度判断当前预备删除的隔栅是否需要删除,如果是则删除当前预备删除的隔栅。
本发明还提供了一种汉语韵律词组词装置,所述装置包括:输入部,用于输入汉语文本;分词和词性标注部,用于对输入的汉语文本进行分词和词性标注处理,生成一初始的韵律词序列;韵律词隔栅插入部,用于在所述初始的韵律词序列中所有的词边界上插入代表韵律词边界的隔栅,生成一隔栅韵律词序列;韵律词隔栅删除部,用于根据韵律词组词手段标注所述隔栅韵律词序列中预备删除的隔栅;根据韵律词组词手段判断预备删除的隔栅中实际需要删除的隔栅,删除所述隔栅韵律词序列中实际需要删除的隔栅;韵律词生成部,用于使所述隔栅韵律词序列中剩余隔栅中的每两个隔栅之间的词进行组词,生成韵律词。
所述装置还包括:分词结果存储部,用于存储汉语文本分词和词性标注处理后的分词结果,根据所述的分词结果生成一初始的韵律词序列。
所述的韵律词隔栅删除部包括多个韵律词组词手段单元,用于根据多个韵律词组词手段对同一个隔栅韵律词序列中预备删除的隔栅进行标注。
所述的根据韵律词组词手段判断预备删除的隔栅中实际需要删除的隔栅是指:根据多个韵律词组词手段综合判断预备删除的隔栅中实际需要删除的隔栅。
所述的韵律词隔栅删除部进一步包括:隔栅删除置信度评价单元,根据多个韵律词组词手段对当前预备删除的隔栅进行综合判断,给出当前预备删除的隔栅需要删除的置信度;隔栅删除单元,根据所述的置信度判断当前预备删除的隔栅是否需要删除,如果是则删除当前预备删除的隔栅。
所述装置还包括:韵律词组词结果分析部,用于对所述韵律词生成部生成的韵律词进行分析处理,生成韵律词组词分析结果。
本发明还提供一种汉语韵律词组词程序,所述程序包括:输入汉语文本;对输入的汉语文本进行分词和词性标注处理,生成一初始的韵律词序列;在所述初始的韵律词序列中所有的词边界上插入代表韵律词边界的隔栅,生成一隔栅韵律词序列;根据韵律词组词手段标注所述隔栅韵律词序列中预备删除的隔栅;根据韵律词组词手段判断预备删除的隔栅中实际需要删除的隔栅;删除所述隔栅韵律词序列中实际需要删除的隔栅,并使剩余隔栅中的每两个隔栅之间的词进行组词,生成韵律词。
本发明还提供一种存储汉语韵律词组词程序的可读存储介质,所述可读存储介质存储有以下程序:输入汉语文本;对输入的汉语文本进行分词和词性标注处理,生成一初始的韵律词序列;在所述初始的韵律词序列中所有的词边界上插入代表韵律词边界的隔栅,生成一隔栅韵律词序列;根据韵律词组词手段标注所述隔栅韵律词序列中预备删除的隔栅;根据韵律词组词手段判断预备删除的隔栅中实际需要删除的隔栅;删除所述隔栅韵律词序列中实际需要删除的隔栅,并使剩余隔栅中的每两个隔栅之间的词进行组词,生成韵律词。
本发明的有益效果是,通过采用隔栅删除策略,从而使得多个韵律词组词手段能够一起协同工作。对输入自然语言文本的分词结果被视为一个初始的韵律词序列,这里假设在所有的词边界上插入韵律词的隔栅。在这个基础上,多个韵律词组词手段可以协同工作,因为每个韵律词组词方法均可以删除它们各自认为在韵律词层面上不需要的隔栅。换句话说,如果任意一个韵律词组词方法认为某个隔栅是不需要的,该隔栅即可被删除。本发明克服了韵律词插入型错误而导致的语音难以理解或者不自然的缺陷,减少韵律词边界插入类型错误的数目。本发明采用隔栅删除策略,从而使得多个韵律词组词手段能够一起协同工作。这种架构使得一个新的韵律词组词方法很容易被组合进来,利于系统的维护修改。
附图说明
图1、为现有技术中文本的分词和词性标注及韵律结构示意图;
图2、为本发明装置结构框图;
图3、为本发明装置实施例的流程框图;
图4、为本发明的韵律词组词处理流程框图;
图5、为本发明的一栅隔删除处理流程框图;
图6、为本发明的另一栅隔删除处理流程框图。
具体实施方式
下面结合附图说明本发明的具体实施方式。如图2所示,本发明为一种汉语韵律词组词装置,所述装置包括:输入部,用于输入汉语文本;分词和词性标注部,用于对输入的汉语文本进行分词和词性标注处理,生成一初始的韵律词序列;韵律词隔栅插入部,用于在所述初始的韵律词序列中所有的词边界上插入代表韵律词边界的隔栅,生成一隔栅韵律词序列;韵律词隔栅删除部,用于根据韵律词组词手段标注所述隔栅韵律词序列中预备删除的隔栅;根据韵律词组词手段判断预备删除的隔栅中实际需要删除的隔栅,删除所述隔栅韵律词序列中实际需要删除的隔栅;韵律词生成部,用于使所述隔栅韵律词序列中剩余隔栅中的每两个隔栅之间的词进行组词,生成韵律词。
所述装置还包括:分词结果存储部,用于存储汉语文本分词和词性标注处理后的分词结果,根据所述的分词结果生成一初始的韵律词序列。
所述的韵律词隔栅删除部进一步包括:隔栅删除置信度评价单元,根据多个韵律词组词手段对当前预备删除的隔栅进行综合判断,给出当前预备删除的隔栅需要删除的置信度;隔栅删除单元,根据所述的置信度判断当前预备删除的隔栅是否需要删除,如果是则删除当前预备删除的隔栅。
所述的韵律词隔栅删除部包括多个韵律词组词手段单元,用于根据多个韵律词组词手段对同一个隔栅韵律词序列中预备删除的隔栅进行标注。所述的根据韵律词组词手段判断预备删除的隔栅中实际需要删除的隔栅是指:根据多个韵律词组词手段综合判断预备删除的隔栅中实际需要删除的隔栅。
所述装置还包括:韵律词组词结果分析部,用于对所述韵律词生成部生成的韵律词进行分析处理,生成韵律词组词分析结果。
本发明可以在计算机、服务器或者计算机网络中实现,其中输入装置可以是键盘、鼠标、通信接口等设备。
实施例
如图3所示,模块101为输入的任意文本。
分词和词性标记部(模块102)对输入文本进行分词和词性标注处理。该模块是中文文本分析的基础,这是因为汉语文本与英语等文本不同,在词与词之间没有空格作为分隔符来予以隔开。因此,首先需要对输入的文本进行分词和词性标注处理,获得的结果写入模块103中,作为后续处理的基础。
在具体实施中,可将韵律词隔栅插入部、韵律词隔栅删除部和韵律词生成部统一为一个韵律词组词部(模块104)即为本发明的主体部分。在其中,该模块采用隔栅消除策略,从而可支持多个韵律词组词手段一起协同工作。对输入文本的分词结果被视为一个初始的韵律词序列,这里假设在所有的词边界上插入韵律词的隔栅。在这个基础上,多个韵律词组词手段协同工作,对它们认为在韵律词层面上不需要的隔栅打上可消除标记。最后,统一判断各个隔栅是否可以删除并进行实际的隔栅删除。
模块105为最终的韵律词组词分析结果。
图4详细描述了韵律词组词部(模块104)的处理流程。
模块201是韵律词初始化部,它根据模块103中存贮的分词和词性标注结果进行韵律词的初始化。具体说来,就是把分词结果视为一个初始的韵律词序列,并在所有的词边界上插入代表韵律词边界的隔栅。
模块202是根据韵律词组词手段1进行组词处理的模块。该模块202应用韵律词组词手段1,以初始分词结果中的各个词为基本单元,进行韵律词的组词。与此同时,在韵律词组词手段1中判定需要消除的隔栅将被模块203(隔栅可消除标记部)打上可消除标记。
模块204至模块206为根据韵律词组词手段2至N进行组词处理的模块。它们分别应用相应的韵律词组词手段2至N进行韵律词的组词。同时也把在该韵律词组词归则中判定需要消除的隔栅在隔栅可消除标记部打上可消除标记。该韵律词组词手段1至N可作为所述的韵律词隔栅删除部的组成部分,即:韵律词组词手段部;以根据多个韵律词组词手段对同一个隔栅韵律词序列中预备删除的隔栅进行标注。
作为上述韵律词组词手段1至N的实施例,可采用:
(1)基于二叉韵律树的韵律词组词方法作为韵律词组词手段1:该韵律词组词手段基于从一个大规模标注语料中训练得到的语言模型,对于一个输入句子,通过递归二叉搜索来寻找最可能的语音停顿插入点,从而可以构造出该句子对应的最优语音停顿二叉树。该二叉树可以称为韵律结构二叉树,因为其中涵盖了层次性的语音停顿插入点信息。这个韵律结构二叉树将被作为一个韵律词组词方法应用于基于隔栅删除策略的韵律词组词。拥有同一个父结点的任意两个叶子结点之间的韵律词隔栅将被打上可删除标记。
(2)基于统计概率的韵律词组词方法作为韵律词组词手段2,在该韵律词组词手段中,词性(Part-of-Speech,POS)和词长信息被用来预测韵律词的边界。该方法假设在预测韵律词的时候,词性信息和词长信息是独立无关的。这样,任意两个语言学词之间可以被组成一个韵律词的概率由两部分组成,即:基于这两个词的词性考虑下被组韵律词的概率和基于这两个词词长考虑下被组韵律词的概率。
(3)基于规则的韵律词组词方法作为韵律词组词手段N(此例中N=3),针对一些经常使用的韵律词附着词等设计了相应的韵律词组词规则。在汉语中,后缀词素“子、们、系、了”等,结构辅助词“的、得”、方位词“左右、以后、以前、以上、以下、以内、以外、之后、之前、之上、之下、之内、之外、之间”等以及趋向动词词组“起、到、进、上、下”频繁出现在文本中。这些词通常具有固定的韵律词组词模式,或者是在一定的条件下具有固定的韵律词组词模式。例如“家长+们”、“走向+了世界”和“捣+一下”等。如果这些词没有被正确地组词到适当的韵律词中,合成语音听起来会非常的不自然。因此,可针对这些常用韵律附着词设计了有针对性地韵律词组词规则,确保这些常用韵律附着词能够被正确地进行韵律词组词。
另外,在汉语中动词有多种重叠形式,如“V一V”,“V了V”和“V了一V”(“谈一谈”,“想了想”,“读了一读”)。在分词处理中,它们作为动词词组被切分开来,例如“谈|一|谈”。实际上,这些重叠形式的动词词组在自然韵律上应该被视为一个完整的韵律词。因此,本文对于这些动词重叠形式也设计了相应的韵律词组词规则以确保其被正确地组词为一个韵律词。上述的多个韵律词组词手段共同作用于本发明的韵律词组词中。
模块207是隔栅去除部。该模块根据前面N种韵律词组词手段标记的隔栅可消除标记进行综合判断,确定最终需要被删除的韵律词隔栅。最后,每两个隔栅之间的词将被组词在一起,成为韵律词,分析结果存入模块208韵律词组词分析结果中。
图5是隔栅去除部(模块207)的一个具体实现示例。
模块301负责遍历所有初始隔栅。
模块302负责检查有/无尚未被处理的隔栅。这里是个简单的顺序处理。如果有未被处理的隔栅,将其交给模块303处理。如果全部处理完毕,结束。
模块303负责检查当前隔栅有没有被打上可消除标记,如发现当前隔栅至少被其中一种韵律词组词方法打上可消除标记则转模块304。否则,转模块301。
模块304是隔栅删除部,进行具体的隔栅删除工作。
图6是隔栅去除部(模块207)的一个更一般化的实现示例。其中与图5的相同部分不再赘述。
模块401是隔栅删除置信度评价部。该模块根据N种韵律词组词方法对当前隔栅是否可删除的标记,综合给出当前隔栅可删除的置信度。
模块402根据模块401的置信度评价结果,判断当前隔栅是否可删除。如果可删除转模块304处理。否则,转模块301。
隔栅删除置信度评价部可以采用投票的机制来进行。一个最简单的投票机制可以是:在N种韵律词组词手段中如果有一半以上的组词手段认为应该删除当前隔栅,那么隔栅删除置信度评价部便认为当前隔栅应该被删除。
本发明通过采用隔栅删除策略,从而使得多个韵律词组词手段能够一起协同工作。对输入自然语言文本的分词结果被视为一个初始的韵律词序列,这里假设在所有的词边界上插入韵律词的隔栅。在这个基础上,多个韵律词组词手段可以协同工作,因为每个韵律词组词方法均可以删除它们各自认为在韵律词层面上不需要的隔栅。换句话说,如果任意一个韵律词组词方法认为某个隔栅是不需要的,该隔栅即可被删除。本发明通过减少韵律词边界插入型错误的数目,尽量避免韵律词组词中插入型错误而导致的语音难以理解或者不自然的缺陷,减少韵律词边界插入类型错误的数目。本发明采用隔栅删除策略,从而使得多个韵律词组词手段能够一起协同工作。这种架构使得一个新的韵律词组词方法很容易被组合进来,利于系统的维护修改。
以上具体实施方式仅用于说明本发明,而非用于限定本发明。

Claims (3)

1.一种汉语韵律词组词方法,其特征是,所述方法包括以下步骤:
输入汉语文本;
对输入的汉语文本进行分词和词性标注处理,生成一初始的韵律词序列;
在所述初始的韵律词序列中所有的词边界上插入代表韵律词边界的隔栅,生成一隔栅韵律词序列;
根据韵律词组词手段标注所述隔栅韵律词序列中预备删除的隔栅;
根据韵律词组词手段判断预备删除的隔栅中实际需要删除的隔栅;
删除所述隔栅韵律词序列中实际需要删除的隔栅,并使剩余隔栅中的每两个隔栅之间的词进行组词,生成韵律词,
其中,对输入的汉语文本进行分词和词性标注处理生成分词结果,根据所述的分词结果生成一初始的韵律词序列,
其中,所述的根据韵律词组词手段标注所述隔栅韵律词序列中预备删除的隔栅是指:根据多个韵律词组词手段对同一个隔栅韵律词序列中预备删除的隔栅进行标注,
其中,所述的根据韵律词组词手段判断预备删除的隔栅中实际需要删除的隔栅是指:根据多个韵律词组词手段综合判断预备删除的隔栅中实际需要删除的隔栅,并且
其中,所述的删除所述隔栅韵律词序列中实际需要删除的隔栅包括:
根据多个韵律词组词手段对当前预备删除的隔栅进行综合判断,给出当前预备删除的隔栅需要删除的置信度;
根据所述的置信度判断当前预备删除的隔栅是否需要删除,如果是则删除当前预备删除的隔栅。
2.一种汉语韵律词组词装置,其特征是,所述装置包括:
输入部,用于输入汉语文本;
分词和词性标注部,用于对输入的汉语文本进行分词和词性标注处理,生成一初始的韵律词序列;
韵律词隔栅插入部,用于在所述初始的韵律词序列中所有的词边界上插入代表韵律词边界的隔栅,生成一隔栅韵律词序列;
韵律词隔栅删除部,用于根据韵律词组词手段标注所述隔栅韵律词序列中预备删除的隔栅;根据韵律词组词手段判断预备删除的隔栅中实际需要删除的隔栅,删除所述隔栅韵律词序列中实际需要删除的隔栅;
韵律词生成部,用于使所述隔栅韵律词序列中剩余隔栅中的每两个隔栅之间的词进行组词,生成韵律词;
分词结果存储部,用于存储汉语文本分词和词性标注处理后的分词结果,根据所述的分词结果生成一初始的韵律词序列,
其中,所述的韵律词隔栅删除部包括多个韵律词组词手段单元,用于根据多个韵律词组词手段对同一个隔栅韵律词序列中预备删除的隔栅进行标注,
其中,所述的根据韵律词组词手段判断预备删除的隔栅中实际需要删除的隔栅是指:根据多个韵律词组词手段综合判断预备删除的隔栅中实际需要删除的隔栅,
其中,所述的韵律词隔栅删除部进一步包括:
隔栅删除置信度评价单元,根据多个韵律词组词手段对当前预备删除的隔栅进行综合判断,给出当前预备删除的隔栅需要删除的置信度;
隔栅删除单元,根据所述的置信度判断当前预备删除的隔栅是否需要删除,如果是则删除当前预备删除的隔栅。
3.根据权利要求2所述的装置,其特征是,所述装置还包括:
韵律词组词结果分析部,用于对所述韵律词生成部生成的韵律词进行分析处理,生成韵律词组词分析结果。
CN2006101670400A 2006-12-13 2006-12-13 一种汉语韵律词组词方法及装置 Active CN101202041B (zh)

Priority Applications (3)

Application Number Priority Date Filing Date Title
CN2006101670400A CN101202041B (zh) 2006-12-13 2006-12-13 一种汉语韵律词组词方法及装置
US12/000,178 US8392191B2 (en) 2006-12-13 2007-12-10 Chinese prosodic words forming method and apparatus
JP2007322494A JP4968036B2 (ja) 2006-12-13 2007-12-13 韻律語グルーピング方法及び装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2006101670400A CN101202041B (zh) 2006-12-13 2006-12-13 一种汉语韵律词组词方法及装置

Publications (2)

Publication Number Publication Date
CN101202041A CN101202041A (zh) 2008-06-18
CN101202041B true CN101202041B (zh) 2011-01-05

Family

ID=39517175

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2006101670400A Active CN101202041B (zh) 2006-12-13 2006-12-13 一种汉语韵律词组词方法及装置

Country Status (3)

Country Link
US (1) US8392191B2 (zh)
JP (1) JP4968036B2 (zh)
CN (1) CN101202041B (zh)

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101430680B (zh) 2008-12-31 2011-01-19 阿里巴巴集团控股有限公司 一种无词边界标记语言文本的分词序列选择方法及系统
US8775341B1 (en) 2010-10-26 2014-07-08 Michael Lamport Commons Intelligent control with hierarchical stacked neural networks
US9015093B1 (en) 2010-10-26 2015-04-21 Michael Lamport Commons Intelligent control with hierarchical stacked neural networks
US9484015B2 (en) * 2013-05-28 2016-11-01 International Business Machines Corporation Hybrid predictive model for enhancing prosodic expressiveness
CN104142909B (zh) * 2014-05-07 2016-04-27 腾讯科技(深圳)有限公司 一种汉字注音方法及装置
CN104021784B (zh) * 2014-06-19 2017-06-06 百度在线网络技术(北京)有限公司 基于大语料库的语音合成方法和装置
CN107038163A (zh) * 2016-02-03 2017-08-11 常州普适信息科技有限公司 一种面向海量互联网信息的文本语义建模方法
CN107039034B (zh) * 2016-02-04 2020-05-01 科大讯飞股份有限公司 一种韵律预测方法及系统
US11195513B2 (en) * 2017-09-27 2021-12-07 International Business Machines Corporation Generating phonemes of loan words using two converters
CN111354333B (zh) * 2018-12-21 2023-11-10 中国科学院声学研究所 一种基于自注意力的汉语韵律层级预测方法及系统
CN110534087B (zh) * 2019-09-04 2022-02-15 清华大学深圳研究生院 一种文本韵律层级结构预测方法、装置、设备及存储介质
CN111105780B (zh) * 2019-12-27 2023-03-31 出门问问信息科技有限公司 一种韵律纠正方法、装置以及计算机可读存储介质
CN112131878B (zh) * 2020-09-29 2022-05-31 腾讯科技(深圳)有限公司 文本处理方法、装置以及计算机设备
CN114707503B (zh) * 2022-02-14 2023-04-07 慧言科技(天津)有限公司 基于多任务学习的前端文本分析方法

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08508127A (ja) * 1993-10-15 1996-08-27 エイ・ティ・アンド・ティ・コーポレーション システムをトレーニングする方法、その結果得られる装置、およびその使用方法
JPH0962286A (ja) 1995-08-22 1997-03-07 Sony Corp 音声合成装置および音声合成方法
US5850629A (en) * 1996-09-09 1998-12-15 Matsushita Electric Industrial Co., Ltd. User interface controller for text-to-speech synthesizer
CA2366952A1 (en) * 1999-03-15 2000-09-21 British Telecommunications Public Limited Company Speech synthesis
US6978239B2 (en) * 2000-12-04 2005-12-20 Microsoft Corporation Method and apparatus for speech synthesis without prosody modification
US7263488B2 (en) * 2000-12-04 2007-08-28 Microsoft Corporation Method and apparatus for identifying prosodic word boundaries
US7136802B2 (en) * 2002-01-16 2006-11-14 Intel Corporation Method and apparatus for detecting prosodic phrase break in a text to speech (TTS) system

Also Published As

Publication number Publication date
US8392191B2 (en) 2013-03-05
CN101202041A (zh) 2008-06-18
JP4968036B2 (ja) 2012-07-04
US20080147405A1 (en) 2008-06-19
JP2008152260A (ja) 2008-07-03

Similar Documents

Publication Publication Date Title
CN101202041B (zh) 一种汉语韵律词组词方法及装置
EP1037195A2 (en) Generation and synthesis of prosody templates
CN101572083B (zh) 韵律词组词方法和装置
JP2007114507A (ja) 韻律制御規則生成方法、音声合成方法、韻律制御規則生成装置、音声合成装置、韻律制御規則生成プログラム及び音声合成プログラム
Li et al. Chinese prosody phrase break prediction based on maximum entropy model
Watts et al. Unsupervised continuous-valued word features for phrase-break prediction without a part-of-speech tagger.
Lignos et al. Recession segmentation: simpler online word segmentation using limited resources
Maia et al. Towards the development of a brazilian portuguese text-to-speech system based on HMM.
Ying et al. An RNN-based algorithm to detect prosodic phrase for Chinese TTS
Yu et al. Prosodic modeling with rich syntactic context in HMM-based Mandarin speech synthesis
Shi et al. Statistic prosody structure prediction
Obin et al. Symbolic modeling of prosody: From linguistics to statistics
Krishna et al. A new prosodic phrasing model for indian language telugu.
Sečujski et al. An overview of the AlfaNum text-to-speech synthesis system
Anto et al. Text to speech synthesis system for English to Malayalam translation
CN110569510A (zh) 一种对用户请求数据的命名实体识别的方法
Sloan et al. Incorporating prosodic events in text-to-speech synthesis
Carson-Berndsen Multilingual time maps: portable phonotactic models for speech technology
Chen et al. Training prosodic phrasing rules for Chinese TTS systems.
Alghamdi et al. Arabic language resources and tools for speech and natural language
JP2005345846A (ja) 入力テキストのポーズ位置予測装置
Ruzicka 10 KALAM: A Word Analyzer for Sabaic
Diaconescu et al. Methods for automatic generation of GRAALAN-based phonetic databases
Huang et al. Break prediction of prosody for Hakka'S TTS systems based on data mining approaches
Karamihaylova Neural Network vs. Rule-Based G2P: A Hybrid Approach to Stress Prediction and Related Vowel Reduction in Bulgarian

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant