CN1088321A - 缅文字型四码智能编码方法及键盘 - Google Patents

缅文字型四码智能编码方法及键盘 Download PDF

Info

Publication number
CN1088321A
CN1088321A CN 92114870 CN92114870A CN1088321A CN 1088321 A CN1088321 A CN 1088321A CN 92114870 CN92114870 CN 92114870 CN 92114870 A CN92114870 A CN 92114870A CN 1088321 A CN1088321 A CN 1088321A
Authority
CN
China
Prior art keywords
consonant
word
remote
key
vowel
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN 92114870
Other languages
English (en)
Other versions
CN1034245C (zh
Inventor
赵英林
陈刚华
黄文明
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to CN92114870A priority Critical patent/CN1034245C/zh
Publication of CN1088321A publication Critical patent/CN1088321A/zh
Application granted granted Critical
Publication of CN1034245C publication Critical patent/CN1034245C/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Input From Keyboards Or The Like (AREA)

Abstract

缅文字编码方法及键盘。缅文是一种字符集庞 大的文字,为数不多的缅文编码和键盘由于用键多, 更换键盘挡位频繁而难以普及使用。本发明的目的 是采用标准英文键盘,提出按照自然书写顺序四码输 入一个缅文整字,并囊括所有缅文字的编码方法。其 特征包括对子、母音,重叠字,特殊字进行有机有序的 键位定义;在编码上以整字编码为主,子母音编码为 辅,当几个字符同处一个键位时按逻辑推理自动选定 该键字符含意。该发明重码率低,容错性好,字、词兼 容,可方便地嫁接在汉英字处理系统上。

Description

本发明属于文字编码方法及键盘。
缅甸文字是一种拼音文字,较之其它拼音文种,它具有字符集庞大,书写顺序线性差、规则复杂,非拼音字占有较大的使用频度,且大量使用巴利语等特点。它包括:
1.由33个子音和30个基本母音符号构成的拼音字结构。如:
Figure 921148704_IMG17
…等。
2.与子音和母音毫无关联的特殊字结构。如:
Figure 921148704_IMG18
…等。
3.子音重叠后构成的重叠字结构。如: …等。
本发明之前,我国内尚未研制出任何缅文编码方案,缅甸本土科技落后,也未见有高质量的缅文编码方法,国际上为数不多的缅文编码也因键盘用键太多,频繁更换键盘档位,部分文字编码失败等原因,难于普及和推广,实用性差。例如德制缅文专用打字机,沿袭拼音文字以往的编码方案,每个键位至多能安排两个字符,通过更换键盘档位来确定键位内容,用键46X2个,几乎每打一字都要变换档位,且大量的重叠字无法打出。字处理速度慢,质量差。还必需配专用键,几乎没有与其它字处理系统兼容的可能。
本发明的目的是发明具有文字编码完整、科学;用键少(只用标准键盘上的A-Y25个键位);重码率低;字、词兼容;易学、易记;击键少、输入速度快的缅文字四码编码方法及键盘。
本发明有以下内容:
(一)键盘键位定义
1.子音键位定义
将缅文33个子音使用频率在千分之一以上(百万字统计)的25个子音迭出,分别定义在标准键盘A-Y的25个键位上,剩余8个罕用子音按同音同位原则,分别与上述25个子音对应定位;
2.母音键位定义:
a.凡由子音字母加
Figure 921148704_IMG20
构成的母音均与对应子音同键位;
b.
Figure 921148704_IMG21
与低频子音
Figure 921148704_IMG22
定义在同一键位;
c.基本母音符号(
Figure 921148704_IMG23
…),与子音同位且相互排斥的字符设计在同一键位上;
3.特殊字符定义;
按读音中子音发音归类,定义在同音的子音键位上;
4.重叠字(巴利文)标志定义:
Figure 921148704_IMG24
键位上设立重叠字标志*。
5.在编码不矛盾条件下将若干组合母音(
Figure 921148704_IMG25
…)插入适当键位。
(二)编码主要方法
主要策略是同一键位上字符的确认由该键当前所处位置和前后字符含意自动选定,包括:
(1)单子音编码
33个子音单独成字时的编码为该子音所在键位标志码加短音结束码。
即(键位标志码)+(短音结束码)
(2)普通字编码
a.含 字的编码
两码字,(如
Figure 921148704_IMG27
…)
编码为:(
Figure 921148704_IMG28
所在键)+(子音)+(结束码)
三码字:(如
Figure 921148704_IMG29
…)
编码为:(
Figure 921148704_IMG30
所在键)+(子音)+(母音)+(结束码)
且只能下述母音之一:
Figure 921148704_IMG31
…。
四码字的编码( :…)
Figure 921148704_IMG33
所在键)+(子音)+(母音)+(母音)
超过四码字的编码(
Figure 921148704_IMG34
…)
所在键)+(子音)+(母音)+(最末一字符编码)
b.子音开头字编码
(子音)+(母音)+…+(母音)
除第一码必定是子音外,在第二码以后(包括第二码)根据同一键位上不同母音互相排斥性,缅文组合规律和前后码含义唯一确定当前键代表的母音符号。
(3)特殊字编码
为该特殊字所在键位的重复四码组成,
(4)重叠字编码
在相重叠的两个字音中间加一个重叠识别码“*”,“*”前的子音在上,“*”后的子音在下。
(三)其次,对缅文可以组合成任意缅文整字的单个字符进行编码,处理原则是上下结构整体编,左右结构分开编,先左后右,先上后下。
(四)再次,缅文词汇的编码仍由四码组成,即:
a.2个缅文字组成的词汇,按书写顺序取每个字的前两码;
b.3个缅文字组成的词汇,按书写顺序取每个字的子音加结束码;
c.4个缅文字组成的词汇,按书写顺序取其前3个子音加未一个字的子音。
缅文编码众口称难。这不仅给缅甸本国的信息处理系统造成极大困难,而且给与之交往的国际关系造成信息交流障碍,更使计算机技术在涉及缅文领域时步履艰难。
本发明深入分析研究了缅甸文字的结构,突破拼音文种的传统编码思路,以整字编码为主,字符拼字为辅,四码内完成所有缅文字及常用词汇的编码,使缅文输入达到一个空前的高速度。特别对于词汇编码,是以往拼音文字编码方案中所没有的。本发明键盘设计采用一键盘多码结构,编码技术充分发挥计算机智能优势,根据每键所处位置及前后码意义的不同,通过推理判断选定该键当前应表示的确切内容,从而较好的解决了标准键盘难容庞大的缅文字符集;以往的编码方法不适应缅文特点等难题。
首次做到:用键少,记忆量小,键入顺序与书写顺序吻合,重码率低,字词兼容,键入过程中不换键盘档位等。凡会缅文者,只需花极短的时间便可掌握输入方法,并很快达到熟练程度。
本发明还具有与汉字处理系统兼容性好的特点,可方便地稼接在当前最流行的汉、英字处理系统上,形成缅、英、汉混合字处理能力。
四码缅文字型智能编码方法及键盘可广泛用于各类缅文或缅、英、汉文字处理系统中。
附图一是缅文键盘的两种排列方式。
以下结合附图一中缅文键盘表(一)说明实施例:
一、键盘设计:
从实用、兼容、高效之目的出发,选择标准通用英文键盘,通过键位内容的重定义使之成为一个缅文键盘。
1.键位定义:
本发明采用了一键多码结构,既根据字符的相容和互斥性在一固定键位上安排1-2个子音和1-2个母音,每个键位容纳下多达五个字符。同一键位字符的确认不用换键档,不用加任何识别标志,全由该键当前所处位置和前后字符含意自动选定。
1)子音键位定义:
经过百万字统计,将缅文33个子音字母中使用频率较高的25个选出(
Figure 921148704_IMG37
),分别定义在标准键盘a-y的25个键位上,剩余八个罕用子音按同音同位原则,分别与上述25个子音对应定位,得子音键位定义表:
Figure 921148704_IMG38
2)母音键位定义:
先将缅文母音拆成如下基本母音符号:
根据缅文组字结构分析,以下字符两两同位互斥且形状相似:
Figure 921148704_IMG40
因此把上述字符对定义在同一键位上即利于编码,又利于记忆。
所有基本母音符号中只有
Figure 921148704_IMG41
-在且必在字头,其它字均以子音开头。所以把
Figure 921148704_IMG42
-与低频子音
Figure 921148704_IMG43
定义在同一键位。
同理类推,根据从缅文组字结构分析中所得到的规律,凡同位互斥的字符可设计在同一键位上,以此原则将所有基本母音字符,基本母音符号定位。为了进一步提高输入速度,又将若干常用组合母音(
Figure 921148704_IMG44
…等)设计在适当的键位上,这一部分在使用过程中是任选的。
3)特殊字符定义:
缅文中特殊字符是非拼音的,有: …这些字使用频率较高,由于它们独成一体,不与任何字符结合,所以将其按读音中子音发音归类,定义在同音的子音键位上,通过智能编码加以辨认。
4)重叠字标志定义:(重叠字即两个子音下下重叠构成的缅文字)
缅文中,特别是引用的巴利语中有大量的重叠字,这种字组合特殊,必需专门处理,为此在
Figure 921148704_IMG46
-
Figure 921148704_IMG47
键位上设立了重叠字标志*,在编码时使用此标志完成重叠字的识别。
5)标准英文键盘的Z键为未定义键,它为本发明在不同的字处理系统上实现时提供了机动。
2.键位排列:
本发明根据缅文子、母音使用频度提供了基本键位布局(如缅文键盘表)。若用户有特殊的技术需要,可任意调整键位排列,不影响缅文字型编码及输入(本发明同时提供了键位调整软件)。
二、智能编码。
原则:按书写笔顺编码,先左后右先上后下,最多四码一字,前三+末一,不足四码者加短字结束码。
1.单子音编码:
缅文子音共33个:
Figure 921148704_IMG48
,可以单独成字(类似英文中的A,I)。常用子音有约20个,这33个子音单独成字时的编码为该子音所在键位标志码加短字结束码(短字结束码是为编码不足四码的简单字设定的,可以是空格键或其它合适的字符键)。
单子音编码表:
Figure 921148704_IMG49
因为任何母音字符不可能单独成字,所以当单独一键后面跟短字结束码时,该键必定是子音,同键位的其它内容被排除。
2.普通字编码:
普通字指即有子音部分也有母音部分的拼音字,这种字在缅文中占绝大多数。
1)含
Figure 921148704_IMG50
-字的编码:
Figure 921148704_IMG51
是唯一个可在字头出现的母音,它后面必定接子音。(注:在键盘设计中与
Figure 921148704_IMG52
同键位有子音
Figure 921148704_IMG53
是缅文中的罕用字,使用频率很低,加上其它组字条件的制约,含
Figure 921148704_IMG54
-字与
Figure 921148704_IMG55
字编码相重的机会很少。)
两码字,如
Figure 921148704_IMG56
…等
编码第一码为A(
Figure 921148704_IMG57
-所在键)时,第二码必定是子音,同键位的其它内容被排除。第三码为结束码(定为F)。
Figure 921148704_IMG58
编码为AFF
Figure 921148704_IMG59
编码为ATF
三码字,如
编码第一码为A时第二码必为子音,第三码必为母音,且只能是下述母音之一:
Figure 921148704_IMG61
这些母音分布在不同键位上,键位内容唯一确定,,其它内容被排除,第四码为结束码F。
例:
Figure 921148704_IMG62
.编码为AEHF
Figure 921148704_IMG63
:编码为AVGF
四码和超过四码的字,如
前三码的分析依然如上,最后一码,必为母音即字尾,能够在字尾出现的母音均分布在不同键位上,因此编码中第四码键的内容也是唯一确定的。
超过四码的字,接前三+末一的原则,取该字前三个字符+最后一个字符编码。
例:
Figure 921148704_IMG65
:编码为AQOG
Figure 921148704_IMG66
:编码为AUJG 即
Figure 921148704_IMG67
(注:
Figure 921148704_IMG68
字也可用组合母音
Figure 921148704_IMG69
编码为UHCG)
2)子音开头字的编码:
(注:除了含
Figure 921148704_IMG70
-字外,绝大部分字都是子音开头的,含
Figure 921148704_IMG71
-字的编码已经讨论过)
此时,编码之第一码必定是子音,第二码以后必定全是母音。
由于每个键位上根据缅文字符的互斥性设计了两个以上的母音,故第二码后的键位有个内容选取问题。
关于同键位母音字符选取的智能分析思路:
本发明在键盘设计中已经充分考虑了安排在同一键位上的不同母音符号的互斥性,此时根据缅文组字规律和前后码和含义就可唯一确定当前键所代表的母音符号。
例:编码OXHF
第一码必定是子音,O键的子音是
第二码必定母音,X键位上母音有
Figure 921148704_IMG73
,因子音
Figure 921148704_IMG74
不与
Figure 921148704_IMG75
结合,所以此时X应代表母音
Figure 921148704_IMG76
第三码也必定是母音,H键位上有 ,因第二码母音
Figure 921148704_IMG78
不与 ,结合,以此时H应代表-.。
第四码F是结束码。
综上:编码OXHF唯一对应缅文字
编码FFBH
第一码必定是子音
Figure 921148704_IMG81
第二码F的可选内容有
Figure 921148704_IMG82
,因为F后还有BH,B的可选内容有三:
Figure 921148704_IMG83
而无论选哪一个,前面都不可能接
Figure 921148704_IMG84
,所以第二码F唯一确定代表
Figure 921148704_IMG85
第三码B的可选内容有三:
Figure 921148704_IMG86
,因前两码是
Figure 921148704_IMG87
,所以第三码应是
Figure 921148704_IMG88
第四码H的可选内容有三:
Figure 921148704_IMG89
,因
Figure 921148704_IMG91
都不能与前面的
Figure 921148704_IMG92
结合,所以第四码H唯一确定代表。
综上:编码FFBH唯一对应缅文字
Figure 921148704_IMG93
依此类推,通过这种智能分析完成的编码,重码率很低,即使有重码,其使用频率也有很大的悬殊,优先考虑高频字就不会影响输入速度。
3.特殊字编码:
特殊字与缅文子、母音符号全然无关,为独体字,所以将其全部整体安排在各键位上,其编码为所在键位码重复四次组成。
如:PPPP为
TTTT为
因为任一键位连击四次都不可能拼出其它字,所以特殊字编码绝无重码。
4.重叠字(巴利文)的编码:
编码原则及思路不变,只是在相重叠的两个子音中间加一个重叠字识别码“*”(A键位),“*”前的子音在上,“*”后的子音在下。
例如:重叠字
Figure 921148704_IMG96
编码为EAWF
5.缅文字符编码:
为适应部分用户的特殊需要及罕用字和新造字的处理,本发明对缅文单个母音字符进行了编码,用这种编码可以组合任意缅文整字,(见母音字符编码表)。
编码原则:上下结合整体编,左右结合分开编,先左后右,先上后下。
例:假如有
Figure 921148704_IMG97
字(实际没有)
则编码为:
Figure 921148704_IMG98
整体编为WDKF
Figure 921148704_IMG99
分开编为DFFF
组合起来就是
Figure 921148704_IMG100
字。
6.缅文词汇编码:
为提高缅文字的输入速度,本系统提供了一定量的常用缅文词汇,词汇中收集有国际组织名称,国家机构名称,世界各大通讯社和报社名称,涉及范围有政治、军事、地名等,词汇内容还可根据用户需要无限添加,使用词汇输入方法可大大提高缅文输入速度。
编码原则:
词汇编码仍由四码组成。
1)两个缅文字组成的词汇:按书写顺序取每个字前的两码。
例:
Figure 921148704_IMG101
编码为:YDAQ
2)三个缅文字组成的词汇,取每个字的子音加结束码。
例:
Figure 921148704_IMG102
编码为:EIWF
3)四个以上缅文字组成的词汇,取其前三个字子音加末一个字的子音。
例:
Figure 921148704_IMG103
编码为:IDYF。

Claims (5)

1、缅文字编码方法及键盘,其特征在于键盘的键位定义,包括:
(1)子音键位定义:
将缅文33个子音使用频率在千分之一以上(百万字统计)的25个子音迭出,分别定义在标准键盘A-Y的25个键位上,剩余8个罕用子音按同音同位原则,分别与上述25个子音对应定位;
(2)母音键位定义:
A.凡由子音字母加
Figure 921148704_IMG1
构成的母音均与对应子音同键位;
B. 与低频子音
Figure 921148704_IMG3
定义在同一键位;
C.基本母音符号(
Figure 921148704_IMG4
…),与子音同位且相互排斥的字符设计在同一键位上;
(3)特殊字符键位定义;
按读音中子音发音归类,定义在同音的子音键位上;
(4)重叠字(含巴利文)标志定义:
Figure 921148704_IMG5
键位上设立重叠字标志“*”。
2、据权利要求1所述的编码方法及键盘,其特征在于键盘在编码不矛盾为条件下将若干组合母音(
Figure 921148704_IMG6
…)插入适当键位上。
3、缅文字编码方法及键盘,其特征在于编码的主要策略是,同一键位字符的确认由该键当前所处位置和前后字符含意自动选定,包括:
(1)单子音编码
33个子音单独成字时的编码为该子音所在键位标志码加短音结束码。
即(键位标志码)+(短音结束码)
(2)普通字编码
a.含
Figure 921148704_IMG7
字的编码
两码字,(如
Figure 921148704_IMG8
…)
编码为:(
Figure 921148704_IMG9
所在键)+(子音)+(结束码)
三码字:(如 …)
编码为:(
Figure 921148704_IMG11
所在键)+(子音)+(母音)+(结束码)
且只能下述母音之一:
Figure 921148704_IMG12
…。
四码字(
Figure 921148704_IMG13
…)
编码为:(
Figure 921148704_IMG14
所在键)+(子音)+(母音)+(母音)
超过四码字(
Figure 921148704_IMG15
…)
编码为(
Figure 921148704_IMG16
所在键)+(子音)+(母音)+(最末1字符编码)
b.子音开头字编码
(子音)+(母音)+…+(母音)
除第一码必定是子音外,在第二码以后(包括第二码)根据同一键位上不同母音互相排斥性,缅文组合规律和前后码含义唯一确定当前键代表的母音符号;
(3)特殊字编码
为该特殊字所在键位的重复四码组成;
(4)重叠字编码
在相重叠的两个子音中间加一个重叠识别码“*”,“*”前的子音在上,“*”后的子音在下。
4、据权利要求3所述的编码方法及键盘,其特征在于对缅文可以任意组合缅文整字的单个字符进行编码,编码处理原则,上下结构整体编,左右结构分开编码,先左后右,先上后下。
5、据权利要求3所述的编码方法及键盘,其特征在于缅文词汇的编码原则是词汇编码仍由四码组成。
(1)2个缅文组成的词汇,按书写顺序取每个字的前两码
(2)3个缅文组成的词汇,取每个字的子音加结束码。
(3)4个缅文组成的词汇,取其前3个子音加末1个字的子音。
CN92114870A 1992-12-17 1992-12-17 缅文字型智能四码输入系统 Expired - Fee Related CN1034245C (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN92114870A CN1034245C (zh) 1992-12-17 1992-12-17 缅文字型智能四码输入系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN92114870A CN1034245C (zh) 1992-12-17 1992-12-17 缅文字型智能四码输入系统

Publications (2)

Publication Number Publication Date
CN1088321A true CN1088321A (zh) 1994-06-22
CN1034245C CN1034245C (zh) 1997-03-12

Family

ID=4947143

Family Applications (1)

Application Number Title Priority Date Filing Date
CN92114870A Expired - Fee Related CN1034245C (zh) 1992-12-17 1992-12-17 缅文字型智能四码输入系统

Country Status (1)

Country Link
CN (1) CN1034245C (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101216738B (zh) * 2008-01-10 2010-12-29 昆明流湄科技有限公司 一种缅甸文的计算机输入法
CN102026033A (zh) * 2010-12-07 2011-04-20 福建新大陆通信科技股份有限公司 一种机顶盒显示缅甸文的方法

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101216739B (zh) * 2008-01-10 2010-12-08 昆明流湄科技有限公司 一种老挝文的计算机输入法

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1050780A (zh) * 1989-09-06 1991-04-17 杨海平 四笔汉字编码技术
CN1055251A (zh) * 1991-03-01 1991-10-09 李伟君 汉字笔顺数码
CN1023350C (zh) * 1991-07-24 1993-12-29 周肇基 四码汉字字形输入法及其键盘
CN1066334A (zh) * 1992-03-28 1992-11-18 万孟章 汉字笔顺数字码

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101216738B (zh) * 2008-01-10 2010-12-29 昆明流湄科技有限公司 一种缅甸文的计算机输入法
CN102026033A (zh) * 2010-12-07 2011-04-20 福建新大陆通信科技股份有限公司 一种机顶盒显示缅甸文的方法
CN102026033B (zh) * 2010-12-07 2013-02-06 福建新大陆通信科技股份有限公司 一种机顶盒显示缅甸文的方法

Also Published As

Publication number Publication date
CN1034245C (zh) 1997-03-12

Similar Documents

Publication Publication Date Title
CN1154910C (zh) 压缩键盘的明义系统
CN1023916C (zh) 简繁五笔字根汉字输入系统
CN1197962A (zh) 语言识别装置、方法及存储语言识别装置程序的记录媒体
CN101038508A (zh) Gb拼音输入法
CN1737739A (zh) 基于英文键盘的藏文输入法
CN1088321A (zh) 缅文字型四码智能编码方法及键盘
CN1186711C (zh) 蒙古文输入方法
CN1103181A (zh) 多键并击式高速汉字输入方法及键盘装置
CN1102768C (zh) 一种用于电子计算机的汉字音形编码输入方法
CN1302415C (zh) 一种英汉翻译机器的实现方法
CN1042174C (zh) 全息自然码中文输入系统
CN1187677C (zh) 计算机整句汉字局部笔划输入方法
CN1023843C (zh) 双位中文电脑键盘的中文输入技术
CN1838044A (zh) 中文拼音声调笔划组合输入法
CN1118085A (zh) 可用数字键盘输入的汉字输入系统及其键盘
CN1021259C (zh) 英文快速键入的缩码法及键盘
CN1038888A (zh) 音形义兼容与汉拼字联词编码系列及键盘
CN1037043A (zh) 计算机汉字输入方法
CN1317631C (zh) 整体拼形汉字输入法
CN1056357A (zh) 中文输入法
CN1026829C (zh) 中文头尾码输入法及其键盘装置
CN86102418A (zh) 汉语音节处理机及汉语音节处理方法
CN1091215A (zh) “多对一”式汉语拼音代码输入编码法
CN1088210C (zh) 六区五位汉语音节和汉字键盘输入方法
CN1023917C (zh) 汉语文字处理之方法

Legal Events

Date Code Title Description
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C19 Lapse of patent right due to non-payment of the annual fee
CF01 Termination of patent right due to non-payment of annual fee