CN108334502A - 一种传统蒙古文与西里尔蒙古文的相互转换方法 - Google Patents
一种传统蒙古文与西里尔蒙古文的相互转换方法 Download PDFInfo
- Publication number
- CN108334502A CN108334502A CN201711498245.1A CN201711498245A CN108334502A CN 108334502 A CN108334502 A CN 108334502A CN 201711498245 A CN201711498245 A CN 201711498245A CN 108334502 A CN108334502 A CN 108334502A
- Authority
- CN
- China
- Prior art keywords
- mongolian
- cyrillic
- conversion
- vocabulary
- traditional
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
- G06F40/58—Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/31—Indexing; Data structures therefor; Storage structures
- G06F16/316—Indexing structures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
Abstract
一种传统蒙古文与西里尔蒙古文的相互转换方法,其特征在于:选取需要转换的文本,分割转换文本中的词汇,存入转换集合中;第二步判断转换集合中的词汇为传统蒙古文或者是西里尔蒙古文;第三步根据判断查询传统蒙古文与西里尔蒙古文数据库,将存入转换集合的被转换词汇在传统蒙古文与西里尔蒙古文数据库中进行遍历循环操作;第四步将获得的转换后的词缀在对应的词缀表中进行检索,从而最终获得被转换词汇的词干及词缀,将词干和词缀进行合并,获得被转换词汇的转换词,并存储到转换后的集合中,完成传统蒙古文与西里尔蒙古文的相互转换。从而达到高效正确的转换率,经过测试实验,在网络条件良好的情况下,进行传统蒙古文与西里尔蒙古文的相互转换,100个词汇组合成的语句,转换成功仅需要1.2秒至3秒的等待时间,转换快速准确。
Description
技术领域
本发明涉及语言的转换方法,尤指一种少数民族语言的转换方法,具体的指一种传统蒙古文与西里尔蒙古文的相互转换的方法。
背景技术
蒙古文字是用来书写蒙古语的文字,主要包括中华人民共和国境内蒙古族通用的回鹘(古维吾尔)式蒙古文和蒙古国主要使用的西里尔蒙古文。蒙古文在蒙古族的文化发展上起着重要作用,通过它保存了丰富的文化遗产。用蒙古文写成的历史文献、文学作品、语文工具书以及译成蒙古文的汉文典籍、佛教经典,据有关方面统计近1500种。尤其在中华人民共和国建立以来,用蒙古文出版了大量政治、经济、文化、科学、教育、文学等方面的图书,其中包括中外名著的译本,并发行了多种报刊。现行蒙古文与回鹘式蒙古文相比,有如下特点:一些字母的形状有了改进,更便于连写;一些字母的写法发生分化,分别表示不同的读音;补充了拼写借词时使用的一些字母;拼写规则趋于严密,一个词不再分写成两段。到了比较晚近的阶段,有些词和附加成分的规范写法改成接近现代口语的形式,并增加了新式标点符号。
外蒙古独立后,受苏联影响,采用的以西里尔字母拼写的文字。现蒙古国使用的文字在1940年代用西里尔字母拼写,除了原来的字母以外,还加入了θθ和YY两个字母来表示俄语中所没有的元音。1946年起,蒙古人民共和国的蒙古族全部转用了新蒙古文,用来记录蒙古国通用的喀尔喀方言。传统蒙古文有几个音使用相同的字母,如7个元音只用5个字母,o和u、和ü都分别使用同一个字母表示;t和d也没有完全区别开。一些字母连写后容易混淆。部分写法必须死记,给学习、认读造成不便。西里尔字母文字能够清楚地区别这些音,基本做到了“怎么说就怎么写”,且字母形体区别较大,各个分开,不易误读。从左向右横写,方便排版和科技文献。但同时也没有了传统蒙古文书写迅速、兼顾各地方言等优势。
随着中国和蒙古国两国之间的文化、教育和经济的交流与合作不断深入,两国之间的文字转换工作也变的极其重要。传统蒙古文到西里尔蒙古文转换、西里尔蒙古文到传统蒙古文转换的工作会给两国蒙古族同胞的交流带来更多的便利,并且对蒙古族的科学、文化和教育发展具有重要的意义。随着我国“互联网+”以及人工智能的全球化的快速进行中,传统蒙古文和西里尔蒙古文的信息化需要的关键技术就是传统蒙古文和西里尔蒙古文在互联网上进行相互转换。因此本发明人在此基础上进行研究发明。传统蒙古文和西里尔蒙古文之间有不可分割的联系,但二者之间有一定的区别:(1)传统蒙古文有35个字母,其中包含8个元音字母和27个辅音字母。西里尔蒙古文也有35个字母,其中包含13个元音字母,20个辅音字母,硬化字母和软化字母各一个。(2)西里尔蒙古文字母区分大小写,而传统蒙古文字母不区分大小写。西里尔蒙古文字母的大写用法跟英语相似。传统蒙古文字母不区分大小写,并且每个字母在词中变化有很多,单词中字母在上、中、下位置不同将导致写法也不相同。(3)西里尔蒙古文和传统蒙古文的书写方向不同。西里尔蒙古文采用的是从左到右的书序,从上到下的行序,而传统蒙古文采用从上到下的书序,从左到右的行序。(4)西里尔蒙古文和传统蒙古文的书面语和口语的差别程度并不相同。西里尔蒙古文中的书面语和口语基本保持一致,口语中怎么发音就基本上怎么拼写,而传统蒙古文的书面语与口语不是一一对应的,书面语转口语时会出现元音和辅音的脱落、增加和变换等现象。
现有的传统蒙古文到西里尔蒙古文的转换、西里尔蒙古文到传统蒙古文转换技术有基于词典的转换方法和基于规则的转换方法。现有的基于词典的转换方法直接采用对照词典进行转换。现有的基于规则的转换方法首先对输入的西里尔蒙古文单词在词干对照词典中进行查找,若存在该词则转换为对应的传统蒙古文单词,转换完成,若不存在该词则通过西里尔蒙古文的词缀切分规则进行词缀切分,如果切分正确,则把切分后所得到的词干与词缀分别通过词干对照词典和词缀对照词典进行查找对应的传统蒙古文词干和词缀,然后根据传统蒙古文的词缀合成规则合成传统蒙古文单词,转换完成,如果切分失败则转换失败。
然而,传统蒙古文是通过词根接多个词缀的方式生成新词的,按照这种生成方式,可以构成大规模的蒙古文单词,词典一般很难全部包含。基于规则的方法很难归纳出所有的转换规则,而且相当一部分单词并不遵循转换规则。并且,西里尔蒙古文中的部分单词会对应多个传统蒙古文单词,基于词典和基于规则的方法无法解决对这类单词的转换。所以,基于词典和基于规则的方法有较大的局限性,从而不能够解决传统蒙古文与西里尔蒙古文相互转换工作中存在的一些关键问题,如西里尔蒙古文到传统蒙古文转换时的未登录词的转换及一对多对应单词的转换等问题。
尤其在网络化、信息化提高生产生活效率的当下,在浏览器中使得传统蒙古文与西里尔蒙古文之间的快速准确的转换方法是信息流畅交流的关键技术。本发明人在民族语言信息化的几十年的从业经验,依据计算机网络技术、民族语言的科学规律发明了解决传统蒙古文与西里尔蒙古文快速准确的相互转换方法。
发明内容
本发明一种传统蒙古文与西里尔蒙古文的相互转换方法的目的,采用本方法解决了传统蒙古文和西里尔蒙古文之间的相互转换的问题。
本发明一种传统蒙古文与西里尔蒙古文的相互转换方法的另一目的,采用本方法解决了传统蒙古文和西里尔蒙古文相互转换的准确性问题。
本发明一种传统蒙古文与西里尔蒙古文的相互转换方法为达到上述的目的,所采用的技术手段为首先选取需要转换的文本,分割转换文本中的词汇,存入转换集合中;第二步判断转换集合中的词汇为传统蒙古文或者是西里尔蒙古文;第三步根据判断查询传统蒙古文与西里尔蒙古文数据库,将存入转换集合的被转换词汇在传统蒙古文或西里尔蒙古文数据库中进行遍历循环操作;第四步将获得的转换后的词缀在对应的词缀表中进行检索,从而最终获得被转换词汇的词干及词缀,将词干和词缀进行合并,获得被转换词汇的转换词,并存储到转换后的集合中,输出显示,完成传统蒙古文与西里尔蒙古文的相互转换;
传统蒙古文及西里尔蒙古文词汇的组合方式都为词干+词缀或单一词干形式组合而成;传统蒙古文构成是由多个字节字母从上至下组合而成,区别于非汉字其他文字;
传统蒙古文与西里尔蒙古文数据库为三级数据库,分别为一级数据库目录表;二级数据表词汇表和三级数据表词缀表;
第三步判断若被转换文本为西里尔蒙古文,则循环遍历被转换集合,转换集合中的每一个词汇的首字母,查询数据库一级数据表目录表,查询结果包含词汇所属二级数据表词汇表的名称、词汇词性和属性信息;据已获得的查询结果中的二级数据表词汇表,查询词汇表中西里尔蒙古文词干是否被查询词汇所包含,若包含则与传统蒙古文转换数据库中三级数据表建立联系,列出该词干的传统蒙古文及该词干对应的三级数据表词缀表,同时将获取到的西里尔蒙古文词干和被查询转换的词汇进行文字截取,获得被转换词汇的西里尔词缀;分别为获得的西里尔词缀在对应的词缀表中进行检索,从而最终获得被转换词汇的传统蒙古文词干及传统蒙古文的词缀,将词干和词缀进行合并,获得被转换词汇的传统蒙古文转换词,并存储到传统蒙古文转换集合中。
第三步若被转换文字为传统蒙古文,程序遍历操作被转换集合,根据被转换集合中的词汇的首字节,查询数据库一级数据表目录表,在查询结果中将获得该词汇的二级数据表词汇表名称、词汇词性和属性等信息。依据传统蒙古文构成规则,传统蒙古文是由多个字节字母从上至下组合而成,区别于非汉字其他文字,在获得的二级数据表词汇表中进行查询操作,查询词汇表中所属的传统蒙古文词干字段是否被转换词汇所包含,若包含则与西里尔蒙古文转换数据库中的三级数据表建立联系,列出该词干的西里尔蒙古文及该词干对应的三级数据表词缀表,同时将获取到的传统蒙古文词干和被查询转换的词汇进行文字截取,获得被转换词的传统蒙古文词缀;将获得的传统蒙古文词缀在对应的词缀表中进行检索与对比操作,最终查询出符合转换条件的西里尔蒙古文词缀;将最终符合条件的西里尔蒙古文词干和词缀进行合并,得到被转换的传统蒙古文的西里尔蒙古文,并将得到的转换文本存储到西里尔蒙古文转换集合中。
采用上述的技术手段,本系统不同于寻常PC端转换字典,需要进行客户端安装等操作。本系统基础框架使用B/S结构,通过网络页面形式进行使用。本系统通过用户使用,在使用过程中根据用户使用情况,发现转换错误问题,系统进行处理,从而提高转换正确率。本系统具有权威的词汇基础数据,以保证转换文本输出结果的正确性。以往所见的转换系统,只是根据传统蒙古文与西里尔蒙古文词汇一一对应进行转换,没有将词干与词缀进行规范的定义,最后出现词干与错误的词缀进行组合得到错误的转换文本。本系统蒙古语词汇本身使用的特性及特点进行检索优化,从而达到高效正确的转换率,经过测试实验,在网络条件良好的情况下,进行传统蒙古文与西里尔蒙古文的相互转换, 100个词汇组合成的语句,转换成功需要1.2秒至3秒的等待时间。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1所示为一种传统蒙古文与西里尔蒙古文的互相转化的流程图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明实施方式作进一步地详细描述。
实施例
以下所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应所述以权利要求的保护范围为准。
如图1所示为一种传统蒙古文与西里尔蒙古文的互相转化的流程图。如图1所示,传统蒙古文与西里尔蒙古文的互相转换方法为:首先在计算机中载入被转换文本字段,根据文本字段首字母,在文字数据字符库中判断该段文字是传统蒙古文或西里尔蒙古文。其次将需要转换文本,按照标点、空格、段落、结束等符号进行文字词汇分割,分割后的词汇按照从句首到句尾的顺序存入被转换集合中。第三步判断,若被转换文本为西里尔蒙古文,循环遍历被转换集合中的所有词汇。依据传统蒙古文和西里尔蒙古文的规则,传统蒙古文及西里尔蒙古文词汇的组合方式相同,都为词干+词缀或单一词干形式组合而成。本发明人将传统蒙古文和西里尔蒙古文的电子词典中的每一个词汇,按照上述组合方式的共性,分别针对传统蒙古文和西里尔蒙古文建立三级数据表。即根据转换集合中的每一个词汇的首字母,查询数据库一级数据表目录表,查询结果包含词汇所属二级数据表词汇表的名称、词汇词性和属性信息。根据已获得的查询结果中的二级数据表词汇表,查询词汇表中西里尔蒙古文词干是否被查询词汇所包含,若包含则与传统蒙古文转换数据库中三级数据表建立联系,列出该词干的传统蒙古文及该词干对应的三级数据表词缀表,同时将获取到的西里尔蒙古文词干和被查询转换的词汇进行文字截取,获得被转换词汇的西里尔词缀。分别为获得的西里尔词缀在对应的词缀表中进行检索,从而最终获得被转换词汇的传统蒙古文词干及传统蒙古文的词缀,将词干和词缀进行合并,获得被转换词汇的传统蒙古文转换词,并存储到传统蒙古文转换集合中。对转换集合进行数据遍历操作,将被转换的传统蒙古文文本依据被转换集合中的词汇顺序存储到传统蒙古文转换集合中,全部遍历操作后将传统蒙古文转换集合中的词汇显示到计算机上,最终实现西里尔蒙古文到传统蒙古文转换。
如图、所示为一种传统蒙古文与西里尔蒙古文的互相转化的流程图。若被转换文字为传统蒙古文。首先在计算机中载入被转换文本字段,根据文本字段首字母,在文字数据字符库中判断该段文字是传统蒙古文或西里尔蒙古文。其次将需要转换文本,按照标点、空格、段落、结束等符号进行文字词汇分割,分割后的词汇按照从句首到句尾的顺序存入被转换集合中。第三步判断,若被转换文字为传统蒙古文,程序遍历操作被转换集合。依据传统蒙古文和西里尔蒙古文的规则,传统蒙古文及西里尔蒙古文词汇的组合方式相同,都为词干+词缀或单一词干形式组合而成。本发明人将传统蒙古文和西里尔蒙古文的电子词典中的每一个词汇,按照上述组合方式的共性,分别针对传统蒙古文和西里尔蒙古文建立三级数据表。即根据被转换集合中的词汇信息的首字节,查询数据库一级数据表目录表,在查询结果中将获得该词汇的二级数据表词汇表名称、词汇词性和属性等信息。依据传统蒙古文构成规则,传统蒙古文是由多个字节字母从上至下组合而成,区别于非汉字其他文字。在获得的二级数据表词汇表中进行查询操作,查询词汇表中所属的传统蒙古文词干字段是否被转换词汇所包含,若包含则与西里尔蒙古文转换数据库中的三级数据表建立联系,列出该词干的西里尔蒙古文及该词干对应的三级数据表词缀表,同时将获取到的传统蒙古文词干和被查询转换的词汇进行文字截取,获得被转换词的传统蒙古文词缀。将获得的传统蒙古文词缀在对应的词缀表中进行检索与对比操作,最终查询出符合转换条件的西里尔蒙古文词缀。将最终符合条件的西里尔蒙古文词干和词缀进行合并,得到被转换的传统蒙古文的西里尔蒙古文,并将得到的转换文本存储到西里尔蒙古文转换集合中。将被转换的西里尔蒙古文文本依据被转换集合中的词汇顺序存储到西里尔蒙古文转换集合中,全部遍历操作后将西里尔蒙古文转换集合中的词汇显示到计算机上,最终实现传统蒙古文到西里尔蒙古文转换。
Claims (5)
1.一种传统蒙古文与西里尔蒙古文的相互转换方法,其特征在于:选取需要转换的文本,分割转换文本中的词汇,存入转换集合中;第二步判断转换集合中的词汇为传统蒙古文或者是西里尔蒙古文;第三步根据判断查询传统蒙古文与西里尔蒙古文数据库,将存入转换集合的被转换词汇在传统蒙古文或西里尔蒙古文数据库中进行遍历循环操作;第四步将获得的转换后的词缀在对应的词缀表中进行检索,从而最终获得被转换词汇的词干及词缀,将词干和词缀进行合并,获得被转换词汇的转换词,并存储到转换后的集合中,输出显示,完成传统蒙古文与西里尔蒙古文的相互转换。
2.根据权利要求1所述的一种传统蒙古文与西里尔蒙古文的相互转换方法,其特征在于传统蒙古文及西里尔蒙古文词汇的组合方式都为词干+词缀或单一词干形式组合而成;传统蒙古文构成是由多个字节字母从上至下组合而成,区别于非汉字其他文字。
3.根据权利要求1所述的一种传统蒙古文与西里尔蒙古文的相互转换方法,其特征在于传统蒙古文与西里尔蒙古文数据库为三级数据库,分别为一级数据库目录表;二级数据表词汇表和三级数据表词缀表。
4.根据权利要求1——3任意一项所述的一种传统蒙古文与西里尔蒙古文的相互转换方法,其特征在于第三步判断若被转换文本为西里尔蒙古文,则循环遍历被转换集合,转换集合中的每一个词汇的首字母,查询数据库一级数据表目录表,查询结果包含词汇所属二级数据表词汇表的名称、词汇词性和属性信息;据已获得的查询结果中的二级数据表词汇表,查询词汇表中西里尔蒙古文词干是否被查询词汇所包含,若包含则与传统蒙古文转换数据库中三级数据表建立联系,列出该词干的传统蒙古文及该词干对应的三级数据表词缀表,同时将获取到的西里尔蒙古文词干和被查询转换的词汇进行文字截取,获得被转换词汇的西里尔词缀;分别为获得的西里尔词缀在对应的词缀表中进行检索,从而最终获得被转换词汇的传统蒙古文词干及传统蒙古文的词缀,将词干和词缀进行合并,获得被转换词汇的传统蒙古文转换词,并存储到传统蒙古文转换集合中。
5.根据权利要求1——3任意一项所述的一种传统蒙古文与西里尔蒙古文的相互转换方法,其特征在于第三步若被转换文字为传统蒙古文,程序遍历操作被转换集合,根据被转换集合中的词汇的首字节,查询数据库一级数据表目录表,在查询结果中将获得该词汇的二级数据表词汇表名称、词汇词性和属性等信息。依据传统蒙古文构成规则,传统蒙古文是由多个字节字母从上至下组合而成,区别于非汉字其他文字,在获得的二级数据表词汇表中进行查询操作,查询词汇表中所属的传统蒙古文词干字段是否被转换词汇所包含,若包含则与西里尔蒙古文转换数据库中的三级数据表建立联系,列出该词干的西里尔蒙古文及该词干对应的三级数据表词缀表,同时将获取到的传统蒙古文词干和被查询转换的词汇进行文字截取,获得被转换词的传统蒙古文词缀;将获得的传统蒙古文词缀在对应的词缀表中进行检索与对比操作,最终查询出符合转换条件的西里尔蒙古文词缀;将最终符合条件的西里尔蒙古文词干和词缀进行合并,得到被转换的传统蒙古文的西里尔蒙古文,并将得到的转换文本存储到西里尔蒙古文转换集合中。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711498245.1A CN108334502A (zh) | 2017-12-29 | 2017-12-29 | 一种传统蒙古文与西里尔蒙古文的相互转换方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711498245.1A CN108334502A (zh) | 2017-12-29 | 2017-12-29 | 一种传统蒙古文与西里尔蒙古文的相互转换方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN108334502A true CN108334502A (zh) | 2018-07-27 |
Family
ID=62924070
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201711498245.1A Pending CN108334502A (zh) | 2017-12-29 | 2017-12-29 | 一种传统蒙古文与西里尔蒙古文的相互转换方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108334502A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109271529A (zh) * | 2018-10-10 | 2019-01-25 | 内蒙古大学 | 西里尔蒙古文和传统蒙古文双文种知识图谱构建方法 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1141465A (zh) * | 1995-07-26 | 1997-01-29 | 深圳科智语言信息处理有限公司北京分公司 | 德汉翻译系统的词法分析算法 |
CN101183359A (zh) * | 2006-11-14 | 2008-05-21 | 黄家琳 | 现代英语通用词汇数字查寻编码技术 |
CN101576909A (zh) * | 2009-05-11 | 2009-11-11 | 内蒙古蒙科立软件有限责任公司 | 一种蒙古语数字化知识库系统构建方法 |
US20130197896A1 (en) * | 2012-01-31 | 2013-08-01 | Microsoft Corporation | Resolving out-of-vocabulary words during machine translation |
CN103632663A (zh) * | 2013-11-25 | 2014-03-12 | 飞龙 | 一种基于hmm的蒙古语语音合成及前端处理的方法 |
CN103810161A (zh) * | 2014-02-21 | 2014-05-21 | 飞龙 | 西里尔蒙古文到传统蒙古文转换方法 |
CN106339367A (zh) * | 2016-08-22 | 2017-01-18 | 内蒙古大学 | 一种蒙古文自动校正方法 |
-
2017
- 2017-12-29 CN CN201711498245.1A patent/CN108334502A/zh active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1141465A (zh) * | 1995-07-26 | 1997-01-29 | 深圳科智语言信息处理有限公司北京分公司 | 德汉翻译系统的词法分析算法 |
CN101183359A (zh) * | 2006-11-14 | 2008-05-21 | 黄家琳 | 现代英语通用词汇数字查寻编码技术 |
CN101576909A (zh) * | 2009-05-11 | 2009-11-11 | 内蒙古蒙科立软件有限责任公司 | 一种蒙古语数字化知识库系统构建方法 |
US20130197896A1 (en) * | 2012-01-31 | 2013-08-01 | Microsoft Corporation | Resolving out-of-vocabulary words during machine translation |
CN103632663A (zh) * | 2013-11-25 | 2014-03-12 | 飞龙 | 一种基于hmm的蒙古语语音合成及前端处理的方法 |
CN103810161A (zh) * | 2014-02-21 | 2014-05-21 | 飞龙 | 西里尔蒙古文到传统蒙古文转换方法 |
CN106339367A (zh) * | 2016-08-22 | 2017-01-18 | 内蒙古大学 | 一种蒙古文自动校正方法 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109271529A (zh) * | 2018-10-10 | 2019-01-25 | 内蒙古大学 | 西里尔蒙古文和传统蒙古文双文种知识图谱构建方法 |
CN109271529B (zh) * | 2018-10-10 | 2020-09-01 | 内蒙古大学 | 西里尔蒙古文和传统蒙古文双文种知识图谱构建方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Matthews et al. | Cantonese: A comprehensive grammar | |
US8005664B2 (en) | System, method to generate transliteration and method for generating decision tree to obtain transliteration | |
CN102298582B (zh) | 数据搜索和匹配方法和系统 | |
US20110184723A1 (en) | Phonetic suggestion engine | |
CN109241540A (zh) | 一种基于深度神经网络的汉盲自动转换方法和系统 | |
Josan et al. | A Punjabi to Hindi machine transliteration system | |
Kirmizialtin et al. | Automated transcription of non-Latin script periodicals: a case study in the ottoman Turkish print archive | |
CN102053719B (zh) | 华文汉字输入法 | |
CN103164398A (zh) | 汉维电子辞典及其自动转译汉维语的方法 | |
CN108334502A (zh) | 一种传统蒙古文与西里尔蒙古文的相互转换方法 | |
CN103164395A (zh) | 汉柯电子辞典及其自动转译汉柯语的方法 | |
CN103246354A (zh) | 以通用语文字编码表达汉字的输入法及其键盘 | |
CN103605755B (zh) | 一种谚文数据库的构建方法及谚文数据库检索系统 | |
CN100561469C (zh) | 创建和使用中文语言数据和用户自纠正数据的方法和系统 | |
CN103455164B (zh) | 一种学汉语工具拼音汉字和拼音笔画输入法 | |
Zhou | Chinese Translation of Emily Dickinson’s Poetry: Translation Features of Shi Li’s Lilacs in the Sky | |
Li et al. | The study of comparison and conversion about traditional Mongolian and Cyrillic Mongolian | |
Streeter | DOC, 1971: A Chinese dialect dictionary on computer | |
TW460825B (en) | Chinese character conversion apparatus with no need to input tone symbols | |
Korkut | Morphology and lexicon-based machine translation of Ottoman Turkish to Modern Turkish | |
Gutkin et al. | Extensions to Brahmic script processing within the Nisaba library: new scripts, languages and utilities | |
CN104866607A (zh) | 一种东巴文释读数据库建立方法 | |
Streeter | Doc, 1971: A Chinese dialect dictionary on computer | |
Amezian et al. | Training an LSTM-based Seq2Seq Model on a Moroccan Biscript Lexicon | |
Joshi et al. | Input Scheme for Hindi Using Phonetic Mapping |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20180727 |
|
WD01 | Invention patent application deemed withdrawn after publication |