CN101539909A - 将泰文翻译为罗马拼音的方法及其装置 - Google Patents
将泰文翻译为罗马拼音的方法及其装置 Download PDFInfo
- Publication number
- CN101539909A CN101539909A CN200910021985A CN200910021985A CN101539909A CN 101539909 A CN101539909 A CN 101539909A CN 200910021985 A CN200910021985 A CN 200910021985A CN 200910021985 A CN200910021985 A CN 200910021985A CN 101539909 A CN101539909 A CN 101539909A
- Authority
- CN
- China
- Prior art keywords
- safe
- roman phonetic
- cliction
- thai
- dictionary
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Machine Translation (AREA)
Abstract
本发明涉及一种将泰文翻译为罗马拼音的方法及其装置,该方法包含下列步骤:1)提供记录泰文词与罗马拼音对应关系的辞典、泰文罗马拼音规则表及记忆单元;2)输入泰文字符串;3)对泰文字符串进行分词处理,产生多个泰文词;4)逐一将泰文词分别在辞典进行搜索,判断是否找到对应泰文词的罗马拼音;5)若找到对应该泰文词的罗马拼音,则从辞典取出泰文词罗马拼音传送至记忆单元;6)若泰文词在辞典中没有搜索到对应的罗马拼音,则通过泰文罗马拼音规则表进行比对,得到泰文词罗马拼音传送至记忆单元;7)输出记忆单元的泰文词罗马拼音的翻译结果。本发明可帮助泰文初学者以及泰文文档阅读者更有效地掌握泰文发音。
Description
技术领域
本发明涉及一种泰文翻译方法及其装置,尤其是一种使用辞典与泰文罗马拼音规则表来实现泰文翻译为罗马拼音的技术领域。
背景技术
当前,用户使用手持设备学习机已经相当普遍,丰富的学习内容和学习方法是满足用户需求之一。通过罗马拼音学习泰文是泰文学习的主要途径之一。无论对于泰文初学者还是泰文文档阅读者来说,罗马拼音都很重要。但是,传统的泰文数字学习机上泰文知识主要以纯泰文出现,没有利于人们学习泰文的罗马拼音,给使用者学习和阅读泰文内容带来不便。
有鉴于上述先前技术的问题,为了在手持设备学习机上,给用户提供一种具有泰文字符串转化为罗马拼音的方法,本发明人基于多年研究开发与诸多实务经验,提出一种将泰文翻译为罗马拼音的方法及其装置,而达到学习泰文的目的,以作为改善上述缺点的实现方式与依据。
发明内容
本发明为解决背景技术中存在的上述技术问题,而提出一种将泰文翻译为罗马拼音的方法及其装置。
本发明的技术解决方案是:本发明为一种将泰文翻译为罗马拼音的方法,其特殊之处在于:该方法包含下列步骤:
1)提供记录泰文词与罗马拼音对应关系的辞典、泰文罗马拼音规则表及记忆单元;
2)输入泰文字符串;
3)对泰文字符串进行分词处理,产生多个泰文词;
4)逐一将泰文词分别在辞典进行搜索,判断是否找到对应泰文词的罗马拼音,是则进至步骤5)否则进至步骤6);
5)若找到对应该泰文词的罗马拼音,则从辞典取出泰文词罗马拼音传送至记忆单元;
6)若泰文词在辞典中没有搜索到对应的罗马拼音,则通过泰文罗马拼音规则表进行比对,得到泰文词罗马拼音传送至记忆单元;
7)输出记忆单元的泰文词罗马拼音的翻译结果。
上述泰文罗马拼音规则表为基于RTGS(Royal Thai General System ofTranscription)的规则表。
上述步骤7)之后还包含步骤8)显示翻译结果。
上述步骤7)之后还包含步骤9)合成对应翻译结果的音讯信号,并播出音讯信号。
一种实现上述的将泰文翻译为罗马拼音的方法的装置,其特殊之处在于:该装置包含:储存单元,储存记录泰文词与罗马拼音对应关系的辞典、泰文罗马拼音规则表及一忆单元;输入单元,输入泰文字符串;处理单元,将泰文字符串进行分词,产生多个泰文词,并将泰文词分别在辞典进行搜索,判断是否找到对应泰文词的罗马拼音,若找到对应泰文词的罗马拼音,则从辞典取出泰文词的罗马拼音传送至记忆单元,若泰文词在辞典中没有搜索到对应罗马拼音,则将泰文词与泰文罗马拼音规则表进行比对,得到泰文词罗马拼音并传送至记忆单元;显示单元,显示记忆单元的泰文词罗马拼音的翻译结果,输入单元接入处理单元,储存单元和处理单元相接,处理单元和储存单元分别接入显示单元。
上述泰文罗马拼音规则表为基于RTGS(Royal Thai General System ofTranscription)的规则表。
上述装置还包含语音合成装置及喇叭,语音合成装置合成对应翻译结果的音讯信号,并由喇叭播出音讯信号。
本发明提供的将泰文翻译为罗马拼音的方法及其装置,让用户在学习泰文或阅读泰文文档的时候,遇到不知道泰文发音,可以通过对泰文字符串进行分词处理,得到泰文词,对泰文词进行解析,然后基于辞典和泰文翻译为罗马拼音的规则表,将泰文字符串翻译为罗马拼音。从而帮助泰文初学者以及泰文文档阅读者更有效地掌握泰文发音。
附图说明
图1为本发明方法的步骤流程图;
图2为本发明装置示意图;
图3.1为本发明方法及其装置的实施例的文字输入示意图;
图3.2为本发明方法及其装置的实施例的翻译结果示意图。
其中,21-储存单元,22-输入单元,23-处理单元,24-显示单元,25-记录泰文词与罗马拼音对应关系的辞典,26-泰文罗马拼音规则表,27-记忆单元;
具体实施方式
参见图1,步骤11,首先提供记录泰文词与罗马拼音对应关系的辞典、泰文罗马拼音规则表及记忆单元。步骤12,输入泰文字符串,步骤13,对泰文字符串进行分词处理,产生多个泰文词。其中,对泰文字符串进行分词技术为此技术领域工作者所熟知,在此不再赘述。
步骤14,逐一将泰文词分别在辞典进行搜索,判断是否找到对应该泰文词的罗马拼音。在辞典进行搜索时,首先对泰文词进行分析,得出泰文辅音(Consonant)或辅音组合(Consonants Combination)如:和元音组合(VowelsCombination)如:然后,判断泰文辅音是在泰文词头还是词尾后,在辞典进行搜索得到对应的罗马拼音,再根据泰文元音组合在辞典进行搜索得到元音的罗马拼音。最后,把辅音和元音合并成泰文词的罗马拼音。
若可找到对应泰文词的罗马拼音,则在步骤15从辞典取出泰文词的罗马拼音传送至记忆单元。有些泰文由于历史演变以及文化差异,存在一些特例,导致泰文翻译为罗马拼音的不确定性,不能完全利用规则来实现。因此,若此泰文词在辞典中没有搜索到对应的罗马拼音,则在步骤16通过泰文罗马拼音规则表进行比对,得到泰文词的罗马拼音传送至记忆单元。其中,此泰文罗马拼音规则是基于RTGS(Royal Thai General System of Transcription)的规则表,如表1所示。
表1
最后,步骤17,输出记忆单元的泰文词罗马拼音的翻译结果,例如,可在显示装置上显示翻译结果,或是将翻译结果输出至语音合成装置,合成出对应翻译结果的音讯信号,再通过喇叭输出。
参见图2,将泰文翻译为罗马拼音的装置20包含有储存单元21、输入单元22、处理单元23以及显示单元24。储存单元21用来储存记录泰文词与罗马拼音对应关系的辞典25、泰文罗马拼音规则表26(如表1所示)及记忆单元27。输入单元22用来输入泰文字符串。
处理单元23将所输入的泰文字符串进行分词,产生多个泰文词,并将泰文词分别在辞典25进行搜索,判断是否找到对应泰文词的罗马拼音,若找到对应泰文词的罗马拼音,则从辞典25取出泰文词的罗马拼音传送至记忆单元27,若泰文词在辞典25中没有搜索到对应的罗马拼音,表示泰文词为泰文中特例,因此将此泰文词与泰文罗马拼音规则表26进行比对,得到泰文词罗马拼音并将其传送至记忆单元27。等到处理单元23将所有泰文词与辞典25或泰文罗马拼音规则表26皆比对完成后,处理单元23从记忆单元27读取出所有翻译结果,再将翻译结果传送到显示单元24进行显示。
此外,装置20视需要可包含语音合成装置及喇叭,处理单元23可将翻译结果传送到语音合成装置,合成出对应翻译结果的音讯信号,再通过喇叭输出。
参见图3.1,进入泰泰辞典释义内容,反白泰文字符串,弹出“F4翻译”按钮,使用者点击“F4翻译”按钮,参图3.2,系统启动泰文翻译为罗马拼音的程序,把泰文翻译为罗马拼音,带入翻译界面,显示翻译结果。从而,用户达到阅读泰文的目的。
Claims (7)
1、一种将泰文翻译为罗马拼音的方法,其特征在于:该方法包含下列步骤:
1)提供记录泰文词与罗马拼音对应关系的辞典、泰文罗马拼音规则表及记忆单元;
2)输入泰文字符串;
3)对泰文字符串进行分词处理,产生多个泰文词;
4)逐一将泰文词分别在辞典进行搜索,判断是否找到对应泰文词的罗马拼音,是则进至步骤5)否则进至步骤6);
5)若找到对应该泰文词的罗马拼音,则从辞典取出泰文词罗马拼音传送至记忆单元;
6)若泰文词在辞典中没有搜索到对应的罗马拼音,则通过泰文罗马拼音规则表进行比对,得到泰文词罗马拼音传送至记忆单元;
7)输出记忆单元的泰文词罗马拼音的翻译结果。
2、根据权利要求1所述的一种将泰文翻译为罗马拼音的方法,其特征在于:所述泰文罗马拼音规则表为基于RTGS(Royal Thai General System ofTranscription)的规则表。
3、根据权利要求1所述的一种将泰文翻译为罗马拼音的方法,其特征在于:所述步骤7)之后还包含步骤8)显示翻译结果。
4、根据权利要求1所述的一种将泰文翻译为罗马拼音的方法,其特征在于:所述步骤7)之后还包含步骤9)合成对应翻译结果的音讯信号,并播出音讯信号。
5、一种实现权利要求1所述的将泰文翻译为罗马拼音的方法的装置,其特征在于:该装置包含:储存单元,储存记录泰文词与罗马拼音对应关系的辞典、泰文罗马拼音规则表及一忆单元;输入单元,输入泰文字符串;处理单元,将泰文字符串进行分词,产生多个泰文词,并将泰文词分别在辞典进行搜索,判断是否找到对应泰文词的罗马拼音,若找到对应泰文词的罗马拼音,则从辞典取出泰文词的罗马拼音传送至记忆单元,若泰文词在辞典中没有搜索到对应罗马拼音,则将泰文词与泰文罗马拼音规则表进行比对,得到泰文词罗马拼音并传送至记忆单元;显示单元,显示记忆单元的泰文词罗马拼音的翻译结果,所述输入单元接入处理单元,所述储存单元和处理单元相接,所述处理单元和储存单元分别接入显示单元。
6、根据权利要求5所述的实现将泰文翻译为罗马拼音的方法的装置,其特征在于:所述泰文罗马拼音规则表为基于RTGS(Royal Thai GeneralSystem of Transcription)的规则表。
7、根据权利要求5所述的实现将泰文翻译为罗马拼音的方法的装置,其特征在于:该装置还包含语音合成装置及喇叭,语音合成装置合成对应翻译结果的音讯信号,并由喇叭播出音讯信号。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN200910021985A CN101539909A (zh) | 2009-04-10 | 2009-04-10 | 将泰文翻译为罗马拼音的方法及其装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN200910021985A CN101539909A (zh) | 2009-04-10 | 2009-04-10 | 将泰文翻译为罗马拼音的方法及其装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN101539909A true CN101539909A (zh) | 2009-09-23 |
Family
ID=41123100
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN200910021985A Pending CN101539909A (zh) | 2009-04-10 | 2009-04-10 | 将泰文翻译为罗马拼音的方法及其装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN101539909A (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103324607A (zh) * | 2012-03-20 | 2013-09-25 | 北京百度网讯科技有限公司 | 一种泰语文本切词方法及装置 |
CN104462071A (zh) * | 2013-09-19 | 2015-03-25 | 株式会社东芝 | 语音翻译设备和语音翻译方法 |
CN106570001A (zh) * | 2016-10-24 | 2017-04-19 | 广州酷狗计算机科技有限公司 | 一种音译文字的方法及装置 |
CN106649291A (zh) * | 2016-12-23 | 2017-05-10 | 广州酷狗计算机科技有限公司 | 韩文音译方法及装置 |
-
2009
- 2009-04-10 CN CN200910021985A patent/CN101539909A/zh active Pending
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103324607A (zh) * | 2012-03-20 | 2013-09-25 | 北京百度网讯科技有限公司 | 一种泰语文本切词方法及装置 |
CN103324607B (zh) * | 2012-03-20 | 2016-11-23 | 北京百度网讯科技有限公司 | 一种泰语文本切词方法及装置 |
CN104462071A (zh) * | 2013-09-19 | 2015-03-25 | 株式会社东芝 | 语音翻译设备和语音翻译方法 |
CN106570001A (zh) * | 2016-10-24 | 2017-04-19 | 广州酷狗计算机科技有限公司 | 一种音译文字的方法及装置 |
CN106570001B (zh) * | 2016-10-24 | 2018-10-23 | 广州酷狗计算机科技有限公司 | 一种音译文字的方法及装置 |
CN106649291A (zh) * | 2016-12-23 | 2017-05-10 | 广州酷狗计算机科技有限公司 | 韩文音译方法及装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107077841B (zh) | 用于文本到语音的超结构循环神经网络 | |
CN105244022B (zh) | 音视频字幕生成方法及装置 | |
US8155958B2 (en) | Speech-to-text system, speech-to-text method, and speech-to-text program | |
CN103914996B (zh) | 一种从图片获取文字学习资料的方法和装置 | |
CN105704538A (zh) | 一种音视频字幕生成方法及系统 | |
CN105159870A (zh) | 一种精准完成连续自然语音文本化的处理系统及方法 | |
CN103578464A (zh) | 语言模型的建立方法、语音辨识方法及电子装置 | |
CN103680498A (zh) | 一种语音识别方法和设备 | |
CN104166462A (zh) | 一种文字的输入方法和系统 | |
Adiga et al. | Automatic speech recognition in Sanskrit: A new speech corpus and modelling insights | |
CN102254554B (zh) | 一种对普通话重音进行层次化建模和预测的方法 | |
CN112016320A (zh) | 基于数据增强的英文标点符号添加方法和系统及设备 | |
CN112365878A (zh) | 语音合成方法、装置、设备及计算机可读存储介质 | |
JP2019109278A (ja) | 音声合成システム、統計モデル生成装置、音声合成装置、音声合成方法 | |
CN103324607A (zh) | 一种泰语文本切词方法及装置 | |
CN101539909A (zh) | 将泰文翻译为罗马拼音的方法及其装置 | |
Masmoudi et al. | Phonetic tool for the Tunisian Arabic | |
CN116343747A (zh) | 语音合成方法、语音合成装置、电子设备及存储介质 | |
CN102970618A (zh) | 基于音节识别的视频点播方法 | |
Labied et al. | Moroccan dialect “Darija” automatic speech recognition: a survey | |
Patil¹ et al. | Multilingual speech and text recognition and translation using image | |
CN111489742B (zh) | 声学模型训练方法、语音识别方法、装置及电子设备 | |
Unnibhavi et al. | Development of Kannada speech corpus for continuous speech recognition | |
Mezzoudj et al. | Arabic Algerian Oranee dialectal language modelling oriented topic | |
Nair et al. | Indian text to speech systems: A short survey |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C12 | Rejection of a patent application after its publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20090923 |