CN101604308A - 蒙古文字母变体形式编码技术 - Google Patents
蒙古文字母变体形式编码技术 Download PDFInfo
- Publication number
- CN101604308A CN101604308A CNA2009101582901A CN200910158290A CN101604308A CN 101604308 A CN101604308 A CN 101604308A CN A2009101582901 A CNA2009101582901 A CN A2009101582901A CN 200910158290 A CN200910158290 A CN 200910158290A CN 101604308 A CN101604308 A CN 101604308A
- Authority
- CN
- China
- Prior art keywords
- pronunciation
- font
- variant forms
- order
- organized
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Document Processing Apparatus (AREA)
Abstract
本发明公开了一种蒙古文字母变体形式编码技术,蒙古文字母所有变体形式做计算机蒙古文编码集时,按照如下规定编码:读音不同字母按照国家规范《蒙古文字母顺序》的读音次序编码;读音相同字母的变体形式按照字词中的不同位置,依次为独立字形、词首字形、词尾字形、词中字形的顺序编码;读音相同、字词中所处位置相同字母的变体形式的编码;优点在于:使所有现有蒙古文编码完全实现读音编码,实现了蒙古文字词自然排序;完全达到蒙古文字词的拉丁文相互转写、ISO/IEC 10646相互转换的一对多和多对一关系;在蒙古文计算机用字体开发上提供了宽松的设计制作条件;为蒙古文语音输入、输出铺平了技术瓶颈。
Description
技术领域
本发明涉及一种蒙古文字母变体形式编码技术,涉及计算机蒙古文字母变体形式编码技术的方法,属于计算机文字处理技术领域。
背景技术
蒙古文由8个元音、27个辅音共35个读音组成。蒙古文字母在字词中所处的位置不同分为独立、词首、词中、词尾等四种字形,又在蒙古文字词中上下黏结不同字母时会有不同变体形式。根据ISO/IEC 10646的有关规则,只对蒙古文字母的变体形式中的一个进行编码。按照规则对于元音,采用它们的独立字形;对于辅音采用出现在元音读音为A前面的词首字形。另外,为了解决形同音不同字母,在规则里对读音U、读音UE两个字母使用了词首字形。规则中规定的字母变体形式、读音和编码次序如下:读A;读E;读I;读O;读U;读OE;读UE;读EE;读N;读ANG;读B;读P;读Q;读G;读M;读L;读S;读SH;读T;读D;读CH;读J;读Y;读R;读W;读F;读K;读KH;读TS;读Z;读HA;读ZR;读LH;读ZHI;读CHI。其中蒙文的8个元音和27个辅音分别为,元音:A、E、I、O、U、OE、UE、EE,辅音:N、ANG、B、P、Q、G、M、L、S、SH、T、D、CH、J、Y、R、W、F、K、KH、TS、Z、HA、ZR、LH、ZHI、CHI。上述读音次序既是国家规范《蒙古文字母顺序》的读音排序次序。
上述蒙古文编码技术只对35个字母的一个变体形式进行了编码,未对所有字母变体形式进行次序规定和编码,且未考虑计算机操作系统的新旧版本的兼容性。这样会产生,如果所有变体形式的次序规定和编码不合理,则无法保证蒙古文字词的完全读音分解和自然排序,必然需要二次开发蒙古文字词排序软件;则无法保证在拉丁文相互转写和与ISO/IEC 10646相互转换中的一对多和多对一的关系;则也会因编码设计的局限性造成蒙古文计算机用字体数量有限和字形效果呆板问题。
发明内容
本发明的目的在于提供一种蒙古文字母变体形式编码技术,是实现蒙古文字词的完全读音分解和自然排序,使蒙古文字词在拉丁文相互转写和与ISO/IEC 10646相互转换中达到一对多和多对一的关系,避免了多对多的二义性和复杂性技术问题,同时解决了蒙古文字母在字词中上下粘结不同字母时产生的黏结结构失真的问题,使蒙古文字词的外观上产生艺术效果,能够设计出更多、更美观的计算机用字体。
便于说明发明内容,结合蒙古文字母变体形式规范使用规则,就蒙古文字母的部分变体形式归类为常用形式字形、第二形式字形、第三形式字形、词中整形字形、词中分写字形和词中连写字形等等。详细归类如下:
词中整形字形有:等;
本发明的目的由如下技术方案实施:一种蒙古文字母变体形式编码技术,蒙古文字母所有变体形式做计算机蒙古文编码集时,按照如下规定编码:
一、读音不同字母按照国家规范《蒙古文字母顺序》的读音次序编码。即读A;读E;读I;读O;读U;读OE;读UE;读EE;读N;读ANG;读B;读P;读Q;读G;读M;读L;读S;读SH;读T;读D;读CH;读J;读Y;读R;读W;读F;读K;读KH;读TS;读Z;读HA;读ZR;读LH;读ZHI;读CHI的依次编码;
二、读音相同字母的变体形式按照字词中的不同位置,依次为独立字形、词首字形、词尾字形、词中字形的顺序编码;
三、读音相同、字词中所处位置相同字母的变体形式按照如下顺序编码:
1.读音相同字母的独立字形的编码顺序依次为读音A、读音E、读音I、读音O、读音U、读音OE、读音UE和读音EE等的独立字形的常用形式编在最前,第二形式编在最后;
2.读音相同字母的词首字形的编码顺序依次为读音A、读音E、读音I、读音O、读音U、读音OE、读音UE、读音EE、读音CH、读音W、读音TS、读音Z、读音HA、读音LH、读音ZHI和读音CHI等的词首字形的常用形式编在最前,第二形式在常用形式之后;读音N的词首字形遵循和的字形先后顺序,读音Q的词首字形遵循和和的字形先后顺序,读音G的词首字形遵循和的字形先后顺序,读音D的词首字形遵循和的字形先后顺序下,按照下粘结元音的读音次序和不粘结元音的顺序编码;读音B、读音P、读音F、读音K和读音KH等的词首字形按照下粘结读音A、读音E和读音I等的编在最前,下粘结读音O、读音U、读音OE和读音UE等的编在其次,下粘结其它读音的编在最后;读音M、读音L、读音S、读音SH、读音T和读音ZR等的词首字形按照下粘结读音A、读音E和读音I等的编在最前,下粘结读音O、读音U、读音OE和读音UE等的编在其次,下粘结其它读音的编在最后;读音J和读音R的词首字形按照下粘结读音A和读音E的编在最前,下粘结读音I的编在其次,下粘结其它读音的编在最后;读音Y的词首字形按照下粘结读音A、读音E和读音I等的词首形式编在最前,词首形式编在其次,下粘结其它读音的词首字形编在最后;
3.读音相同字母的词尾字形的编码顺序依次为所有读音的常用形式编在最前,第二形式编在其次,第三形式编在第三位,元音字母的上粘结读音B、读音P、读音Q、读音G、读音F、读音K和读音KH等词首或词中字形的编在最后;
4.读音相同字母的词中字形的编码顺序依次为读音A、读音E、读音I、读音O、读音U、读音OE、读音UE、读音EE、读音D、读音CH、读音TS、读音Z和读音HA等的词中字形的常用形式编在最前,第二形式其次,元音字母的上粘结读音B、读音P、读音Q、读音G、读音F、读音K和读音KH等词首或词中字形的编在第三位,词中整形编在最后;读音N的词中字形先遵循和和的字形先后顺序,再遵循分写字形在前、连写字形在后的顺序,再按照下粘结元音的读音次序顺序编码;读音ANG的词中字形在遵循下粘结辅音的不同变体形式时本身存在不同变体形式,先按照下粘结辅音与元音组合的读音次序编码,最后将读音N的不粘结元音的词中字形编码,且读音N遵循和的字形先后顺序;读音B、读音P、读音F、读音K和读音KH等的词中字形按照下粘结读音A、读音E和读音I等的编在最前,下粘结读音O、读音U、读音OE和读音UE等的编在其次,下粘结读音EE的编在第三,最后遵循下粘结辅音的不同变体形式时本身存在不同变体形式,按照下粘结辅音与元音组合的读音次序编码;读音Q的词中字形先遵循与和与和的字形先后顺序,再遵循分写字形在前、连写字形在后的顺序,再按照下粘结元音的读音次序和不粘结元音的顺序编码;读音G的词中字形先遵循与和与和的字形先后顺序,再遵循分写字形在前、连写字形在后的顺序,再按照下粘结元音的读音次序和不粘结读音的顺序编码,最后遵循下粘结辅音的不同变体形式时本身存在不同变体形式,按照下粘结辅音与元音组合的读音次序编码;读音M和读音L的词中字形先遵循和和的字形先后顺序,再遵循分写字形在前、连写字形在后的顺序,再按照下粘结元音的读音次序和不粘结元音的顺序编码;读音S、读音SH和读音ZR等的词中字形按照下粘结读音A、读音E和读音I等的编在最前,下粘结读音O、读音U、读音OE和读音UE等的编在其次,下粘结其它读音的编在最后;读音T的词中字形先遵循和的字形先后顺序,再按照下粘结元音的读音次序和其它读音的顺序编码;读音J、读音R和读音W等的词中字形先遵循分写字形在前、连写字形在后的顺序,再按照下粘结元音的读音次序和其它读音的顺序编码;读音Y的词中字形先遵循分写字形在前、连写字形在后的顺序,再按照下粘结读音A和读音E的编在最前,下粘结读音I的其次,下粘结读音O、读音U、读音OE、读音OU、读音EE等及不粘结元音的最后编码,其中下粘结读音I的还要遵循和的前后顺序;读音LH词中字形先遵循和的字形先后顺序,再按照下粘结元音的读音次序和不粘结元音的顺序编码;
四、读音ANG、读音B、读音P、读音Q、读音G、读音M、读音L、读音F、读音K、读音KH和读音LH等与蒙古文字母部分变体形式相互上下粘结时,按照如下规则粘结字母变体形式:
1.读音ANG和读音G的变体形式粘结规则如下:
2.读音B、读音P、读音Q、读音G、读音F、读音K和读音KH等与元音组合时变体形式粘结规则如下:
3.读音B、读音P、读音F、读音K和读音KH等在下粘结辅音时变体形式粘结规则如下:
字形为等的下粘结字形有 等及读音ANG和读音HA的词中或词尾字形;
读音相同字母的所有变体形式编码次序具体依次如下:
3.读音I的所有变体形式的编码次序为
7.读音UE的所有变体形式的编码次序为
18.读音SH的所有变体形式的编码次序为
20.读音D的所有变体形式的编码次序为
25.读音W的所有变体形式的编码次序为
29.读音TS的所有变体形式的编码次序为
30.读音Z的所有变体形式的编码次序为
本发明的优点在于:使所有现有蒙古文编码完全实现读音编码,实现了蒙古文字词自然排序;完全达到蒙古文字词的拉丁文相互转写、ISO/IEC 10646相互转换的一对多和多对一关系;在蒙古文计算机用字体开发上提供了宽松的设计制作条件;为蒙古文语音输入、输出铺平了技术瓶颈。
具体实施方式
本编码技术是将蒙古文字母的所有变体形式,首先读音不同字母按照国家规范《蒙古文字母顺序》的读音次序编码,其次读音相同字母的变体形式按照字词中所处的位置依次为独立字形、词首字形、词尾字形、词中字形的顺序编码,最后相同读音、字词中所处位置相同字母的变体形式按照字词中上下黏结字母的读音顺序进行编码的技术。解决了如下技术问题:
1.解决了蒙古文字词按照国家规范《蒙古文字母顺序》的读音顺序要求做到完全读音分解和自然排序,不需要二次开发蒙古文字词排序相关软件。例如:(是读音A、读音ANG、读音CH、读音I和读音N组合)和(是读音A、读音ANG、读音N、读音A、读音Q和读音U组合)的前后排序为,按照本编码技术,由于读音ANG的词中形式字形中下粘结读音N的排在下粘结读音CH的编码之前,则结果为词排前,排后。
2.解决了蒙古文字母在拉丁文相互转写及ISO/IEC 10646相互转换中达到一对多和多对一的关系,避免了多对多的二义性和复杂性技术难题。例如:(是读音U、读音L、读音U和读音S组合),拉丁文转写为ulus,ISO/IEC 10646转换为(读音U)(读音L)(读音U)(读音S);(是读音O、读音D和读音O组合),拉丁文转写为odo,ISO/IEC 10646转换为(读音O)(读音D)(读音O)。
Claims (2)
1、一种蒙古文字母变体形式编码技术,其特征在于,蒙古文字母所有变体形式做计算机蒙古文编码集时,按照如下规定编码:
(1)读音不同字母按照国家规范《蒙古文字母顺序》的读音次序编码;
(2)读音相同字母的变体形式按照字词中的不同位置,依次为独立字形、词首字形、词尾字形、词中字形的顺序编码;
(3)读音相同、字词中所处位置相同字母的变体形式按照如下顺序编码:
(a)读音相同字母的独立字形的编码顺序依次为读音A、读音E、读音I、读音O、读音U、读音OE、读音UE和读音EE等的独立字形的常用形式编在最前,第二形式编在最后;
(b)读音相同字母的词首字形的编码顺序依次为读音A、读音E、读音I、读音O、读音U、读音OE、读音UE、读音EE、读音CH、读音W、读音TS、读音Z、读音HA、读音LH、读音ZHI和读音CHI等的词首字形的常用形式编在最前,第二形式在常用形式之后;读音N的词首字形遵循和的字形先后顺序,读音Q的词首字形遵循和和的字形先后顺序,读音G的词首字形遵循和的字形先后顺序,读音D的词首字形遵循和的字形先后顺序下,按照下粘结元音的读音次序和不粘结元音的顺序编码;读音B、读音P、读音F、读音K和读音KH等的词首字形按照下粘结读音A、读音E和读音I等的编在最前,下粘结读音O、读音U、读音OE和读音UE等的编在其次,下粘结其它读音的编在最后;读音M、读音L、读音S、读音SH、读音T和读音ZR等的词首字形按照下粘结读音A、读音E和读音I等的编在最前,下粘结读音O、读音U、读音OE和读音UE等的编在其次,下粘结其它读音的编在最后;读音J和读音R的词首字形按照下粘结读音A和读音E的编在最前,下粘结读音I的编在其次,下粘结其它读音的编在最后;读音Y的词首字形按照下粘结读音A、读音E和读音I等的词首形式编在最前,词首形式编在其次,下粘结其它读音的词首字形编在最后;
(c)读音相同字母的词尾字形的编码顺序依次为所有读音的常用形式编在最前,第二形式编在其次,第三形式编在第三位,元音字母的上粘结读音B、读音P、读音Q、读音G、读音F、读音K和读音KH等词首或词中字形的编在最后;
(d)读音相同字母的词中字形的编码顺序依次为读音A、读音E、读音I、读音O、读音U、读音OE、读音UE、读音FE、读音D、读音CH、读音TS、读音Z和读音HA等的词中字形的常用形式编在最前,第二形式其次,元音字母的上粘结读音B、读音P、读音Q、读音G、读音F、读音K和读音KH等词首或词中字形的编在第三位,词中整形编在最后;读音N的词中字形先遵循和和的字形先后顺序,再遵循分写字形在前、连写字形在后的顺序,再按照下粘结元音的读音次序顺序编码;读音ANG的词中字形在遵循下粘结辅音的不同变体形式时本身存在不同变体形式,先按照下粘结辅音与元音组合的读音次序编码,最后将读音N的不粘结元音的词中字形编码,且读音N遵循和的字形先后顺序;读音B、读音P、读音F、读音K和读音KH等的词中字形按照下粘结读音A、读音E和读音I等的编在最前,下粘结读音O、读音U、读音OE和读音UE等的编在其次,下粘结读音EE的编在第三,最后遵循下粘结辅音的不同变体形式时本身存在不同变体形式,按照下粘结辅音与元音组合的读音次序编码;读音Q的词中字形先遵循与和与和的字形先后顺序,再遵循分写字形在前、连写字形在后的顺序,再按照下粘结元音的读音次序和不粘结元音的顺序编码;读音G的词中字形先遵循与和与和的字形先后顺序,再遵循分写字形在前、连写字形在后的顺序,再按照下粘结元音的读音次序和不粘结读音的顺序编码,最后遵循下粘结辅音的不同变体形式时本身存在不同变体形式,按照下粘结辅音与元音组合的读音次序编码;读音M和读音L的词中字形先遵循和和的字形先后顺序,再遵循分写字形在前、连写字形在后的顺序,再按照下粘结元音的读音次序和不粘结元音的顺序编码;读音S、读音SH和读音ZR等的词中字形按照下粘结读音A、读音E和读音I等的编在最前,下粘结读音O、读音U、读音OE和读音UE等的编在其次,下粘结其它读音的编在最后;读音T的词中字形先遵循和的字形先后顺序,再按照下粘结元音的读音次序和其它读音的顺序编码;读音J、读音R和读音W等的词中字形先遵循分写字形在前、连写字形在后的顺序,再按照下粘结元音的读音次序和其它读音的顺序编码;读音Y的词中字形先遵循分写字形在前、连写字形在后的顺序,再按照下粘结读音A和读音E的编在最前,下粘结读音I的其次,下粘结读音O、读音U、读音OE、读音OU、读音EE等及不粘结元音的最后编码,其中下粘结读音I的还要遵循和的前后顺序;读音LH词中字形先遵循和的字形先后顺序,再按照下粘结元音的读音次序和不粘结元音的顺序编码;
(4)读音ANG、读音B、读音P、读音Q、读音G、读音M、读音L、读音F、读音K、读音KH和读音LH等与蒙古文字母部分变体形式相互上下粘结时,按照如下规则粘结字母变体形式:
(a)读音ANG和读音G的变体形式粘结规则如下:
(b)读音B、读音P、读音Q、读音G、读音F、读音K和读音KH等与元音组合时变体形式粘结规则如下:
(c)读音B、读音P、读音F、读音K和读音KH等在下粘结辅音时变体形式粘结规则如下:
2、根据权利要求1所述的一种蒙古文字母变体形式编码技术,其特征在于,所述读音相同字母的所有变体形式编码次序具体依次如下:
(15)读音M的所有变体形式的编码次序为
(29)读音TS的所有变体形式的编码次序为
(35)读音CHI的所有变体形式的编码次序为
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CNA2009101582901A CN101604308A (zh) | 2009-07-24 | 2009-07-24 | 蒙古文字母变体形式编码技术 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CNA2009101582901A CN101604308A (zh) | 2009-07-24 | 2009-07-24 | 蒙古文字母变体形式编码技术 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN101604308A true CN101604308A (zh) | 2009-12-16 |
Family
ID=41470043
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNA2009101582901A Pending CN101604308A (zh) | 2009-07-24 | 2009-07-24 | 蒙古文字母变体形式编码技术 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN101604308A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103810161A (zh) * | 2014-02-21 | 2014-05-21 | 飞龙 | 西里尔蒙古文到传统蒙古文转换方法 |
CN103870515A (zh) * | 2012-12-18 | 2014-06-18 | 北大方正集团有限公司 | 构造蒙文字库的方法、蒙文显示方法和装置 |
CN107193787A (zh) * | 2017-04-14 | 2017-09-22 | 木仁 | 一种蒙古文字母变体形式的自适应方法 |
-
2009
- 2009-07-24 CN CNA2009101582901A patent/CN101604308A/zh active Pending
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103870515A (zh) * | 2012-12-18 | 2014-06-18 | 北大方正集团有限公司 | 构造蒙文字库的方法、蒙文显示方法和装置 |
CN103870515B (zh) * | 2012-12-18 | 2017-06-30 | 北大方正集团有限公司 | 构造蒙文字库的方法、蒙文显示方法和装置 |
CN103810161A (zh) * | 2014-02-21 | 2014-05-21 | 飞龙 | 西里尔蒙古文到传统蒙古文转换方法 |
CN103810161B (zh) * | 2014-02-21 | 2017-01-25 | 内蒙古大学 | 西里尔蒙古文到传统蒙古文转换方法 |
CN107193787A (zh) * | 2017-04-14 | 2017-09-22 | 木仁 | 一种蒙古文字母变体形式的自适应方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102023716A (zh) | 26或者27或者29或者30字母键元的数字键中文输入法 | |
US20100262418A1 (en) | Method and apparatus of computer processing of a brahmic script | |
CN101604308A (zh) | 蒙古文字母变体形式编码技术 | |
CN100432903C (zh) | 半方盲文数字编码汉字输入法 | |
CN102799282A (zh) | 笔画字根全息码汉字输入法 | |
CN106227363B (zh) | 拼音基础上的精确汉字编码和键盘输入方法 | |
CN100458668C (zh) | 首音汉字输入法 | |
CN103853705A (zh) | 计算机汉语语音与外语语音实时语音字幕翻译方法 | |
CN107451105B (zh) | 一种基于新型汉字全息编码规则的明盲文转换系统 | |
Joshi et al. | A phonemic code based scheme for effective processing of Indian Languages | |
CN102073382A (zh) | 笔画主副部首输入法 | |
CN103297709A (zh) | 汉语有声影像资料加注汉语字幕的装置 | |
CN101587381A (zh) | 音形汉字无重码输入法 | |
CN101470535A (zh) | 优化汉字码输入法 | |
CN107145478B (zh) | 一种将汉字语句转换为盲文的方法 | |
CN100428118C (zh) | 汉码系列输入法 | |
CN107193787A (zh) | 一种蒙古文字母变体形式的自适应方法 | |
CN1241742A (zh) | 汉字序码输入方案 | |
CN100430870C (zh) | 夫子码 | |
CN103616961A (zh) | 音素t形汉字码输入法 | |
CN102346565A (zh) | 8键27字母键元及五或六笔画的中文输入法 | |
CN101236460B (zh) | 一种通过计算机字母键盘输入汉字的方法 | |
CN1487395A (zh) | 三五形码 | |
CN101105723A (zh) | 新方笔画 | |
CN103970286A (zh) | T形二码输入法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C12 | Rejection of a patent application after its publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20091216 |