CN102354494A - 一种实现阿拉伯文tts发音的方法 - Google Patents

一种实现阿拉伯文tts发音的方法 Download PDF

Info

Publication number
CN102354494A
CN102354494A CN2011102353930A CN201110235393A CN102354494A CN 102354494 A CN102354494 A CN 102354494A CN 2011102353930 A CN2011102353930 A CN 2011102353930A CN 201110235393 A CN201110235393 A CN 201110235393A CN 102354494 A CN102354494 A CN 102354494A
Authority
CN
China
Prior art keywords
phoneme
arabic
keyword
stress
pronunciation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2011102353930A
Other languages
English (en)
Inventor
陈淮琰
赵党建
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Inventec Besta Xian Co Ltd
Original Assignee
Inventec Besta Xian Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Inventec Besta Xian Co Ltd filed Critical Inventec Besta Xian Co Ltd
Priority to CN2011102353930A priority Critical patent/CN102354494A/zh
Publication of CN102354494A publication Critical patent/CN102354494A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Machine Translation (AREA)
  • Electrically Operated Instructional Devices (AREA)

Abstract

本发明提出了一种实现阿拉伯文TTS发音的方法,包括以下步骤:1)建立阿拉伯文音素音档数据库;2)获取需要进行发音操作的文本字串;3)将获取的文本字串按照音素规则,将关键词分析出所组成的音素单位,拆分成音素序列;4)从音素音档数据库中获取步骤3)中音素音档;5)确定关键词重音;6)确定关键词语调;7)将步骤5)中确定的重音以及步骤6)中确定的语调合成语音数据。本发明的实现阿拉伯文TTS发音的方法,利用语言发音规则和语音合成,将音素序列按照各自音素发音和成发音,方便语言学习者学习。

Description

一种实现阿拉伯文TTS发音的方法
技术领域
本发明涉及一种阿拉伯文文本智能发音方法,尤其涉及一种实现阿拉伯文TTS发音的方法。
背景技术
阿拉伯文字起源于亚拉姆语文字,从公元四世纪开始被使用,它属阿非罗---亚西亚语系(亦称闪含语系)闪含语,是埃及、沙特阿拉伯等十几个国家的官方语言,联合国的工作语言之一,使用人口近两亿。阿拉伯文字在伊斯兰教的影响下流传很广,波斯文、乌尔都文及新疆的维吾尔文等多种文字采用阿拉伯字母。阿拉伯文由于其语言有着特殊性,其发音方式也和其他语言有比较大的区别,因此,一种适应于阿拉伯文的发音方法的可携式设备是非常现在的语言学习中所需要的。
发明内容
为了解决背景技术中所存在的技术问题,本发明提出了一种实现阿拉伯文TTS发音的方法,利用语言发音规则和语音合成,将音素序列按照各自音素发音和成发音,方便语言学习者学习。
本发明的技术解决方案是:一种实现阿拉伯文TTS发音的方法,其特殊之处在于:所述方法包括以下步骤:
1)建立阿拉伯文音素音档数据库;
2)获取需要进行发音操作的文本字串;
3)将获取的文本字串按照音素规则,将关键词分析出所组成的音素单位,拆分成音素序列;
4)从音素音档数据库中获取步骤3)中音素音档;
5)确定关键词重音;
6)确定关键词语调;
7)将步骤5)中确定的重音以及步骤6)中确定的语调合成语音数据。
上述步骤5)的具体步骤是:
5.1)若是单音节的关键词,则这个关键词确定为重音;
5.2)双音节的关键词,第一个音节确定为重音;
5.3)多音节的关键词,如果倒数第二个音节是短音节,倒数第三个音节确定为重音;如果有两个以上的长音节,最后一个长音节确定为重音;如果有一个长音节,长音节确定为重音。
上述步骤6)的具体步骤是:确定关键词在句子中的读法,确定语调是平调、升调或降调。
本发明的实现阿拉伯文TTS发音的方法,可以利用语言发音规则将关键词拆分成由唯一发音的音素组成的音素序列,然后利用语言发音规则和语音和成技术,将音素序列按照各自音素发音和成发音。本发明提出一种利用阿拉伯语言特点,以及发音规则来实现TTS发音的方法,为使用者提供了一种阿拉伯文文本智能发音方法。大大方便了使用者语言输入以及语言学习。
附图说明
图1是本发明的方法流程图;
具体实施方式
参见图1,本发明的实现阿拉伯文TTS发音的方法,包括以下步骤:
1)建立阿拉伯文音素音档数据库;
2)获取需要进行发音操作的文本字串;
3)将获取的文本字串按照音素规则,将关键词分析出所组成的音素单位,拆分成音素序列;
4)从音素音档数据库中获取步骤3)中音素音档;
5)确定关键词重音;
确定重音的具体步骤和依据是:从音节上分,阿拉伯语的组成分为单音节词,双音节词和多音节词三种。在双音节词和多音节词里,有一个音节应读的重些,这个音节叫做单词重音。
单音节词:单独念时,一律重读。如:
Figure BDA0000083959190000031
双音节词:重音在第一个音节上。如:
Figure BDA0000083959190000032
如果双音节词中有一个长音节时,重音在长音节上。如:
Figure BDA0000083959190000033
词尾的长音节按长音处理。如:
Figure BDA0000083959190000034
词尾的长音节按短音节处理,如:
Figure BDA0000083959190000035
词尾鼻音一般都按长音处理。如果两个音节都是长音节,重音在第一个音节上,如:
Figure BDA0000083959190000036
多音节词:如果倒数第二个音节是短音节,重音一般在倒数第三个音节上,如:
Figure BDA0000083959190000037
如果有一个长音节,重音就在这个长音节上,如:
Figure BDA0000083959190000038
如果有两个以上的长音节,重音一般在最后一个长音节上,如:
Figure BDA0000083959190000039
迭音前面的字母一般重读。
6)确定关键词语调;
阿拉伯语的基本语调有升调、降调和平调三种:
升调:即句子最后一个词的音调要升上去,音量也要相应的大一些。一般疑问句(即以疑问虚词
Figure BDA00000839591900000310
开始的疑问句,包括反诘句)都要用升调来表示,如:
Figure BDA00000839591900000311
降调:即句子最后一个音节的语调要降下来,有时其尾符要读成静符音。阿拉伯语的陈述句、特殊疑问句结尾多用降调,如:
平调:系指读长句子时的中间停顿处使用的语调,表明该句子并未结束,还有下文,引起读者的注意,如:
Figure BDA00000839591900000313
7)将步骤5)中确定的重音以及步骤6)中确定的语调合成语音数据。
阿拉伯文共有二十八个字母,这些字母都是子音字母,每个字母只代表一个子音音素,每个音素只用一个字母表示,参见表一,
表一
Figure BDA0000083959190000041
发音符号:
阿拉伯语共有12个发音符号(叠音符不包括在内)。分别是静符开口符齐齿符
Figure BDA0000083959190000044
合口符
Figure BDA0000083959190000045
开口长音符
Figure BDA0000083959190000046
齐齿长音符
Figure BDA0000083959190000047
合口长音符
Figure BDA0000083959190000048
两个软音符
Figure BDA0000083959190000049
Figure BDA00000839591900000410
开口鼻音符
Figure BDA00000839591900000411
齐齿鼻音符
Figure BDA00000839591900000412
和合口鼻音符
Figure BDA00000839591900000413
静音:将本符号标在字母上面,表示发该字母的本身辅音,故静音也可称之为辅音符号。例:
Figure BDA00000839591900000414
动符:动符是指阿拉伯语拼音中发音较短的最基本的三个音符,即开口符,齐齿符,合口符。发音时因其音较短,故称其为短音符。
开口符:即:将一短横放置于字母的上面,发音时口半张,近似于汉语拼音ai的音。例:
Figure BDA00000839591900000415
齐齿符:即:将一短横放置于字母的下面,发音时唇扁平,舌尖抵下齿龈。近似于汉语拼音i的音。例:
Figure BDA00000839591900000416
合口符:即:将一个类似逗号的小
Figure BDA00000839591900000417
放置于字母的上面,发音时双唇收圆,微向前突,舌尖离开下齿,近似于汉语拼音u的音。例:
Figure BDA00000839591900000418
长音符:长音符共有三个,分别由三个动符(短音符)与
Figure BDA00000839591900000419
三个字母组合而成。
开口长音符:即在标开口符的字母后面加上即可。一般是开口短音符延长一个音节的时候,就读为开口长音符。但由于某些字母的发音位置不同,其长音与它的短音也就不完全相对。例:
Figure BDA0000083959190000051
齐齿长音符:即在标齐齿符的字母后面加上一个
Figure BDA0000083959190000052
即可。齐齿长音符是齐齿短音符的自然延长,即把短音适当延长就为长音。
例:
Figure BDA0000083959190000053
合口长音符:即在表合口符的字母后面加上一个
Figure BDA0000083959190000054
即可。合口长音符是河口短音符的自然延长,即把短音适当延长就为长音
例:
Figure BDA0000083959190000055
软音符:软音有两个
Figure BDA0000083959190000057
第一个发音时,口型由半张转至扁平,是开口符与字母
Figure BDA0000083959190000058
的静音
Figure BDA0000083959190000059
的合成音,其发音介于国际音标[ai]与[ei]之间。第二个软音发音时,口型由半张转至收圆,是开口符与字母
Figure BDA00000839591900000510
的静音
Figure BDA00000839591900000511
的合成音,其发音近似于国际音标[au]。
鼻音符共有三个,开口鼻音符
Figure BDA00000839591900000512
齐齿鼻音符
Figure BDA00000839591900000513
和合口鼻音符
开口鼻音符:此音是开口符与鼻音字母
Figure BDA00000839591900000515
的静音的合成音,但
Figure BDA00000839591900000517
不写出来。发音时由开口符音自然过渡到
Figure BDA00000839591900000518
Figure BDA00000839591900000519
该符号的发音介于国际标[an]与[en]之间。
齐齿鼻音符:此音是齐齿符音和
Figure BDA00000839591900000520
的合成音,等于
Figure BDA00000839591900000521
该符号的发音近似于国际音标[in]。
合口鼻音符:此音是合口符音和
Figure BDA00000839591900000522
的合成音,等于
Figure BDA00000839591900000523
该符号的发音近似于国际音标[un]。
迭音:在阿拉伯语中,同一个单词中两个相同的字母相连,而第一个字母读静符,第二个字母读动符时,这两个字母的发音不变,但要自然地连起来,在书写时只写一个字母,并在该字母的右上方标一个迭音符
Figure BDA00000839591900000524
这种现象就叫迭音现象,在阿语中普遍存在。发音时,前后两个字母要自然过渡。如果该迭音是塞音字母,带静符的字母不发音,只需稍加停顿即发其后的动符。如:
Figure BDA00000839591900000525
Figure BDA00000839591900000526
如果该迭音是擦音字母或塞擦音、鼻音、边音、颤音,带静符的字母则要按规则发音。如:
Figure BDA00000839591900000527
发迭音时,切忌与长音混淆。
根据发音规则音素发音:阿拉伯语的发音是字母加上发音符号组成的最小发音元素,其中共有二十八个字母,十二个发音符号,因此全部发音维三百三十六个.因此我们可以根据这种因素规则实现阿文TTS的发音。

Claims (3)

1.一种实现阿拉伯文TTS发音的方法,其特征在于:所述方法包括以下步骤:
1)建立阿拉伯文音素音档数据库;
2)获取需要进行发音操作的文本字串;
3)将获取的文本字串按照音素规则,将关键词分析出所组成的音素单位,拆分成音素序列;
4)从音素音档数据库中获取步骤3)中音素音档;
5)确定关键词重音;
6)确定关键词语调;
7)将步骤5)中确定的重音以及步骤6)中确定的语调合成语音数据。
2.根据权利要求1所述的实现阿拉伯文TTS发音的方法,其特征在于:所述步骤5)的具体步骤是:
5.1)若是单音节的关键词,则这个关键词确定为重音;
5.2)双音节的关键词,第一个音节确定为重音;
5.3)多音节的关键词,如果倒数第二个音节是短音节,倒数第三个音节确定为重音;如果有两个以上的长音节,最后一个长音节确定为重音;如果有一个长音节,长音节确定为重音。
3.根据权利要求2所述的实现阿拉伯文TTS发音的方法,其特征在于:所述步骤6)的具体步骤是:确定关键词在句子中的读法,确定语调是平调、升调或降调。
CN2011102353930A 2011-08-17 2011-08-17 一种实现阿拉伯文tts发音的方法 Pending CN102354494A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2011102353930A CN102354494A (zh) 2011-08-17 2011-08-17 一种实现阿拉伯文tts发音的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2011102353930A CN102354494A (zh) 2011-08-17 2011-08-17 一种实现阿拉伯文tts发音的方法

Publications (1)

Publication Number Publication Date
CN102354494A true CN102354494A (zh) 2012-02-15

Family

ID=45578050

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2011102353930A Pending CN102354494A (zh) 2011-08-17 2011-08-17 一种实现阿拉伯文tts发音的方法

Country Status (1)

Country Link
CN (1) CN102354494A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110415680A (zh) * 2018-09-05 2019-11-05 满金坝(深圳)科技有限公司 一种同声传译方法、同声传译装置以及一种电子设备

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1407482A (zh) * 2001-08-29 2003-04-02 无敌科技股份有限公司 英语音标分解与合成方法
US20050192807A1 (en) * 2004-02-26 2005-09-01 Ossama Emam Hierarchical approach for the statistical vowelization of Arabic text
US20070255567A1 (en) * 2006-04-27 2007-11-01 At&T Corp. System and method for generating a pronunciation dictionary
US20110040774A1 (en) * 2009-08-14 2011-02-17 Raytheon Company Searching Spoken Media According to Phonemes Derived From Expanded Concepts Expressed As Text

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1407482A (zh) * 2001-08-29 2003-04-02 无敌科技股份有限公司 英语音标分解与合成方法
US20050192807A1 (en) * 2004-02-26 2005-09-01 Ossama Emam Hierarchical approach for the statistical vowelization of Arabic text
US20070255567A1 (en) * 2006-04-27 2007-11-01 At&T Corp. System and method for generating a pronunciation dictionary
US20110040774A1 (en) * 2009-08-14 2011-02-17 Raytheon Company Searching Spoken Media According to Phonemes Derived From Expanded Concepts Expressed As Text

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
《International Conference on Computer and Communication Engineering (ICCCE 2010)》 20100513 Mustafa Zeki,et al. Development of An Arabic Text-To-Speech System 1-5 1-3 , *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110415680A (zh) * 2018-09-05 2019-11-05 满金坝(深圳)科技有限公司 一种同声传译方法、同声传译装置以及一种电子设备
CN110415680B (zh) * 2018-09-05 2022-10-04 梁志军 一种同声传译方法、同声传译装置以及一种电子设备

Similar Documents

Publication Publication Date Title
Kim-Renaud Korean: An essential grammar
Li The Chinese writing system in Asia: An interdisciplinary perspective
WO2004114253A3 (en) Method of teaching reading
Masmoudi et al. Phonetic tool for the Tunisian Arabic
CN102354494A (zh) 一种实现阿拉伯文tts发音的方法
Odinye Phonology of mandarin chinese: a comparison of Pinyin and IPA
Bazarbayeva et al. Phonological foundations of the transition Kazakh alphabet to Latin graphics
Dijkstra et al. Frisian TTS, an example of bootstrapping TTS for minority languages
Atkielski Phonetic transcription can be a useful tool for teaching or correcting pronunciation in the ESL/EFL classroom
JP7168236B2 (ja) 日本語学習教材における促音のローマ字表記方法、及びこの表記方法を用いた日本語学習用教材並びに日本語学習用装置
Inglis Myanmar-based Khamti Shan orthography
Sathe A rule-based system for the transcription of Sanskrit from the Devanagari orthography to the International Phonetic Alphabet
Pronk et al. Adding Japanese language synthesis support to the eSpeak system
Fiktorius Phonetics transcription in English language teaching (elt)
Vitrano-Wilson et al. Tone marks as vowel diacritics in two scripts: repurposing tone marks for non-tonal phenomena in Cado and other Southeast Asian languages
Rosenhouse Modern Arabic Dictionaries: Phonetic Aspects and Implications
Hansakunbuntheung et al. Mongolian speech corpus for text-to-speech development
Primrose How Close Is Gothic to Old English: A Comparative Overview
COLEMAN The Secret History of Prosodic and Autosegmental Phonology
Greschner IPA Made Easy: A Guidebook for the International Phonetic Alphabet
Sindran et al. ComputerAutomatic Robust Rule-Based Phonetization of Standard Arabic
Ganjavi et al. A transcription scheme for languages employing the arabic script motivated by speech processing applications
Elmahdy et al. Survey on common Arabic language forms from a speech recognition
CN113506559A (zh) 一种根据越南语书写文本生成发音词典的方法
Vasilévski et al. Phonologic and Syllabic Patterns of Brazilian Portuguese Extracted from a G2P Decoder-Parser

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20120215