CN102354494A - 一种实现阿拉伯文tts发音的方法 - Google Patents
一种实现阿拉伯文tts发音的方法 Download PDFInfo
- Publication number
- CN102354494A CN102354494A CN2011102353930A CN201110235393A CN102354494A CN 102354494 A CN102354494 A CN 102354494A CN 2011102353930 A CN2011102353930 A CN 2011102353930A CN 201110235393 A CN201110235393 A CN 201110235393A CN 102354494 A CN102354494 A CN 102354494A
- Authority
- CN
- China
- Prior art keywords
- phoneme
- arabic
- keyword
- stress
- pronunciation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Electrically Operated Instructional Devices (AREA)
- Machine Translation (AREA)
Abstract
本发明提出了一种实现阿拉伯文TTS发音的方法,包括以下步骤:1)建立阿拉伯文音素音档数据库;2)获取需要进行发音操作的文本字串;3)将获取的文本字串按照音素规则,将关键词分析出所组成的音素单位,拆分成音素序列;4)从音素音档数据库中获取步骤3)中音素音档;5)确定关键词重音;6)确定关键词语调;7)将步骤5)中确定的重音以及步骤6)中确定的语调合成语音数据。本发明的实现阿拉伯文TTS发音的方法,利用语言发音规则和语音合成,将音素序列按照各自音素发音和成发音,方便语言学习者学习。
Description
技术领域
本发明涉及一种阿拉伯文文本智能发音方法,尤其涉及一种实现阿拉伯文TTS发音的方法。
背景技术
阿拉伯文字起源于亚拉姆语文字,从公元四世纪开始被使用,它属阿非罗---亚西亚语系(亦称闪含语系)闪含语,是埃及、沙特阿拉伯等十几个国家的官方语言,联合国的工作语言之一,使用人口近两亿。阿拉伯文字在伊斯兰教的影响下流传很广,波斯文、乌尔都文及新疆的维吾尔文等多种文字采用阿拉伯字母。阿拉伯文由于其语言有着特殊性,其发音方式也和其他语言有比较大的区别,因此,一种适应于阿拉伯文的发音方法的可携式设备是非常现在的语言学习中所需要的。
发明内容
为了解决背景技术中所存在的技术问题,本发明提出了一种实现阿拉伯文TTS发音的方法,利用语言发音规则和语音合成,将音素序列按照各自音素发音和成发音,方便语言学习者学习。
本发明的技术解决方案是:一种实现阿拉伯文TTS发音的方法,其特殊之处在于:所述方法包括以下步骤:
1)建立阿拉伯文音素音档数据库;
2)获取需要进行发音操作的文本字串;
3)将获取的文本字串按照音素规则,将关键词分析出所组成的音素单位,拆分成音素序列;
4)从音素音档数据库中获取步骤3)中音素音档;
5)确定关键词重音;
6)确定关键词语调;
7)将步骤5)中确定的重音以及步骤6)中确定的语调合成语音数据。
上述步骤5)的具体步骤是:
5.1)若是单音节的关键词,则这个关键词确定为重音;
5.2)双音节的关键词,第一个音节确定为重音;
5.3)多音节的关键词,如果倒数第二个音节是短音节,倒数第三个音节确定为重音;如果有两个以上的长音节,最后一个长音节确定为重音;如果有一个长音节,长音节确定为重音。
上述步骤6)的具体步骤是:确定关键词在句子中的读法,确定语调是平调、升调或降调。
本发明的实现阿拉伯文TTS发音的方法,可以利用语言发音规则将关键词拆分成由唯一发音的音素组成的音素序列,然后利用语言发音规则和语音和成技术,将音素序列按照各自音素发音和成发音。本发明提出一种利用阿拉伯语言特点,以及发音规则来实现TTS发音的方法,为使用者提供了一种阿拉伯文文本智能发音方法。大大方便了使用者语言输入以及语言学习。
附图说明
图1是本发明的方法流程图;
具体实施方式
参见图1,本发明的实现阿拉伯文TTS发音的方法,包括以下步骤:
1)建立阿拉伯文音素音档数据库;
2)获取需要进行发音操作的文本字串;
3)将获取的文本字串按照音素规则,将关键词分析出所组成的音素单位,拆分成音素序列;
4)从音素音档数据库中获取步骤3)中音素音档;
5)确定关键词重音;
确定重音的具体步骤和依据是:从音节上分,阿拉伯语的组成分为单音节词,双音节词和多音节词三种。在双音节词和多音节词里,有一个音节应读的重些,这个音节叫做单词重音。
双音节词:重音在第一个音节上。如:如果双音节词中有一个长音节时,重音在长音节上。如:词尾的长音节按长音处理。如:词尾的长音节按短音节处理,如:词尾鼻音一般都按长音处理。如果两个音节都是长音节,重音在第一个音节上,如:
迭音前面的字母一般重读。
6)确定关键词语调;
阿拉伯语的基本语调有升调、降调和平调三种:
降调:即句子最后一个音节的语调要降下来,有时其尾符要读成静符音。阿拉伯语的陈述句、特殊疑问句结尾多用降调,如:
7)将步骤5)中确定的重音以及步骤6)中确定的语调合成语音数据。
阿拉伯文共有二十八个字母,这些字母都是子音字母,每个字母只代表一个子音音素,每个音素只用一个字母表示,参见表一,
表一
发音符号:
动符:动符是指阿拉伯语拼音中发音较短的最基本的三个音符,即开口符,齐齿符,合口符。发音时因其音较短,故称其为短音符。
软音符:软音有两个和第一个发音时,口型由半张转至扁平,是开口符与字母的静音的合成音,其发音介于国际音标[ai]与[ei]之间。第二个软音发音时,口型由半张转至收圆,是开口符与字母的静音的合成音,其发音近似于国际音标[au]。
迭音:在阿拉伯语中,同一个单词中两个相同的字母相连,而第一个字母读静符,第二个字母读动符时,这两个字母的发音不变,但要自然地连起来,在书写时只写一个字母,并在该字母的右上方标一个迭音符这种现象就叫迭音现象,在阿语中普遍存在。发音时,前后两个字母要自然过渡。如果该迭音是塞音字母,带静符的字母不发音,只需稍加停顿即发其后的动符。如: 如果该迭音是擦音字母或塞擦音、鼻音、边音、颤音,带静符的字母则要按规则发音。如:发迭音时,切忌与长音混淆。
根据发音规则音素发音:阿拉伯语的发音是字母加上发音符号组成的最小发音元素,其中共有二十八个字母,十二个发音符号,因此全部发音维三百三十六个.因此我们可以根据这种因素规则实现阿文TTS的发音。
Claims (3)
1.一种实现阿拉伯文TTS发音的方法,其特征在于:所述方法包括以下步骤:
1)建立阿拉伯文音素音档数据库;
2)获取需要进行发音操作的文本字串;
3)将获取的文本字串按照音素规则,将关键词分析出所组成的音素单位,拆分成音素序列;
4)从音素音档数据库中获取步骤3)中音素音档;
5)确定关键词重音;
6)确定关键词语调;
7)将步骤5)中确定的重音以及步骤6)中确定的语调合成语音数据。
2.根据权利要求1所述的实现阿拉伯文TTS发音的方法,其特征在于:所述步骤5)的具体步骤是:
5.1)若是单音节的关键词,则这个关键词确定为重音;
5.2)双音节的关键词,第一个音节确定为重音;
5.3)多音节的关键词,如果倒数第二个音节是短音节,倒数第三个音节确定为重音;如果有两个以上的长音节,最后一个长音节确定为重音;如果有一个长音节,长音节确定为重音。
3.根据权利要求2所述的实现阿拉伯文TTS发音的方法,其特征在于:所述步骤6)的具体步骤是:确定关键词在句子中的读法,确定语调是平调、升调或降调。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2011102353930A CN102354494A (zh) | 2011-08-17 | 2011-08-17 | 一种实现阿拉伯文tts发音的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2011102353930A CN102354494A (zh) | 2011-08-17 | 2011-08-17 | 一种实现阿拉伯文tts发音的方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN102354494A true CN102354494A (zh) | 2012-02-15 |
Family
ID=45578050
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2011102353930A Pending CN102354494A (zh) | 2011-08-17 | 2011-08-17 | 一种实现阿拉伯文tts发音的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN102354494A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110415680A (zh) * | 2018-09-05 | 2019-11-05 | 满金坝(深圳)科技有限公司 | 一种同声传译方法、同声传译装置以及一种电子设备 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1407482A (zh) * | 2001-08-29 | 2003-04-02 | 无敌科技股份有限公司 | 英语音标分解与合成方法 |
US20050192807A1 (en) * | 2004-02-26 | 2005-09-01 | Ossama Emam | Hierarchical approach for the statistical vowelization of Arabic text |
US20070255567A1 (en) * | 2006-04-27 | 2007-11-01 | At&T Corp. | System and method for generating a pronunciation dictionary |
US20110040774A1 (en) * | 2009-08-14 | 2011-02-17 | Raytheon Company | Searching Spoken Media According to Phonemes Derived From Expanded Concepts Expressed As Text |
-
2011
- 2011-08-17 CN CN2011102353930A patent/CN102354494A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1407482A (zh) * | 2001-08-29 | 2003-04-02 | 无敌科技股份有限公司 | 英语音标分解与合成方法 |
US20050192807A1 (en) * | 2004-02-26 | 2005-09-01 | Ossama Emam | Hierarchical approach for the statistical vowelization of Arabic text |
US20070255567A1 (en) * | 2006-04-27 | 2007-11-01 | At&T Corp. | System and method for generating a pronunciation dictionary |
US20110040774A1 (en) * | 2009-08-14 | 2011-02-17 | Raytheon Company | Searching Spoken Media According to Phonemes Derived From Expanded Concepts Expressed As Text |
Non-Patent Citations (1)
Title |
---|
《International Conference on Computer and Communication Engineering (ICCCE 2010)》 20100513 Mustafa Zeki,et al. Development of An Arabic Text-To-Speech System 1-5 1-3 , * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110415680A (zh) * | 2018-09-05 | 2019-11-05 | 满金坝(深圳)科技有限公司 | 一种同声传译方法、同声传译装置以及一种电子设备 |
CN110415680B (zh) * | 2018-09-05 | 2022-10-04 | 梁志军 | 一种同声传译方法、同声传译装置以及一种电子设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Kim-Renaud | Korean: An essential grammar | |
WO2004114253A3 (en) | Method of teaching reading | |
CN102354494A (zh) | 一种实现阿拉伯文tts发音的方法 | |
Odinye | Phonology of mandarin chinese: a comparison of Pinyin and IPA | |
Atkielski | Phonetic transcription can be a useful tool for teaching or correcting pronunciation in the ESL/EFL classroom | |
Bazarbayeva et al. | Phonological foundations of the transition Kazakh alphabet to Latin graphics | |
Dijkstra et al. | Frisian TTS, an example of bootstrapping TTS for minority languages | |
Sathe | A rule-based system for the transcription of Sanskrit from the Devanagari orthography to the International Phonetic Alphabet | |
Fiktorius | Phonetics transcription in English language teaching (elt) | |
JP7168236B2 (ja) | 日本語学習教材における促音のローマ字表記方法、及びこの表記方法を用いた日本語学習用教材並びに日本語学習用装置 | |
Inglis | Myanmar-based Khamti Shan orthography | |
Pronk et al. | Adding Japanese language synthesis support to the eSpeak system | |
Vitrano-Wilson et al. | Tone marks as vowel diacritics in two scripts: repurposing tone marks for non-tonal phenomena in Cado and other Southeast Asian languages | |
Rosenhouse | Modern Arabic Dictionaries: Phonetic Aspects and Implications | |
Upadhyay et al. | Garhwali speech database | |
Hansakunbuntheung et al. | Mongolian speech corpus for text-to-speech development | |
Primrose | How Close Is Gothic to Old English: A Comparative Overview | |
COLEMAN | The Secret History of Prosodic and Autosegmental Phonology | |
Greschner | IPA Made Easy: A Guidebook for the International Phonetic Alphabet | |
Sindran et al. | ComputerAutomatic Robust Rule-Based Phonetization of Standard Arabic | |
Ganjavi et al. | A transcription scheme for languages employing the arabic script motivated by speech processing applications | |
Elmahdy et al. | Survey on common Arabic language forms from a speech recognition | |
CN113506559A (zh) | 一种根据越南语书写文本生成发音词典的方法 | |
Vasilévski et al. | Phonologic and Syllabic Patterns of Brazilian Portuguese Extracted from a G2P Decoder-Parser | |
Wang | Discussion on the Tone of Japanese |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C02 | Deemed withdrawal of patent application after publication (patent law 2001) | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20120215 |