CN1058853A - 电脑汉字输入五韵五笔码 - Google Patents

电脑汉字输入五韵五笔码 Download PDF

Info

Publication number
CN1058853A
CN1058853A CN 90108803 CN90108803A CN1058853A CN 1058853 A CN1058853 A CN 1058853A CN 90108803 CN90108803 CN 90108803 CN 90108803 A CN90108803 A CN 90108803A CN 1058853 A CN1058853 A CN 1058853A
Authority
CN
China
Prior art keywords
chinese
code
shu
pie
dian
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN 90108803
Other languages
English (en)
Inventor
汤建民
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to CN 90108803 priority Critical patent/CN1058853A/zh
Publication of CN1058853A publication Critical patent/CN1058853A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)

Abstract

本方案汉语拼音字母对应键盘英文字母,把35 个韵母汉语拼音划分为:“a*”、“e*”、“o*”、“i*” 和“u*”五大类;采用了“五笔字型”的字母区位码; 并以《辞海》“笔画查字表说明”作为汉字五种笔画的 划分依据。
方案有三大特点:
一、浅显简洁,字词一体。
二、字、词编码的兼容性极强,能够实现中文输入 技术向“以词为主,以字为辅”方向发展。
三、字、词编码信息能用拼音头字母表单(或表音 且在一定程度上表形)。

Description

目前,我国使用的汉字编码方法常见的主要有区位码、电报码、拼音码(及多种拼音代码法)、首尾字根码、五笔字型码等。其中区位码、电报码因无规律可循,难度极大,实用价值不高,操作使用此二种编码的人极少;拼音码使用较为普遍,优点是能够确切表音,识拼音就能识操作,但因重码太多和难以实现“字词兼容”而无法达到快速输入,这是它的致命弱点;首尾码因为字根无确定性和字根排列无规律,并且重码太多,将被淘汰;五笔字型是拼型法的最高成就者,用130个字根对汉字进行拆拼和使用“末笔字型识别码”的方法解决了汉语字、词、句的拼型编码输入问题,并实现重码少,达到了高速输入的目的,同时科学地划分了键盘区位码,键盘区位码的确立,为今后的汉字数字编码的研究提供了有力的杠杆,但也并不是十全十美、毫无不足,致少要熟记130个字根和学会字型识别方法(虽然并不十分困难),需经过一个阶段的训练或实际操作使用方可熟练掌握。此外,编码信息还不能确切表型。
能不能创造一种极为简捷、使用十分方便、输入快速的编码方法呢?
“五韵五笔汉字码编码方案”就是一种尝试。
从八八年底开始,作者带着十足的好奇心和只有万分之一成功的希望,试图解决这个问题。在对现行的各种汉字编码方法作深入的研究探讨的同时,提出过数以百计的假设的猜想,于不同的角度设计过十几种方案,最后选择独立设计的《汉字音型快速码编码方案》作为主攻方向。“愚者千虑,必有一得”,经过二年的艰苦努力得以完成,定名为《五韵五笔汉字码编码方案》。
细加分析此方案不但解决了汉字的简易编码,而且解决了汉语的字、双音词、成语和三音词的编码的难题。实现了:用拼音(五韵母分类法)和汉字的五种笔划以最简单的方法去解决汉语的编码问题,使汉语的单字、双音词编码信息能在一定的程度上表音且表形,三音节和四音节的词(词组)之编码信息实现以各音节拼音头字母表音;并达到字、词兼容,重码较少,输入方便;依照此方案的编码规则,略懂汉语拼音、会写汉字的人,人人都能学会使用、学会对汉语的编码,无需半点死记硬背,使汉语编码达到了“大众化”的浅显程度。
本方案汉语拼音字母对应键盘英文字母,把35个韵母汉语拼音划分为:“a*”、“e*”、“o*”、“i*”和“u*”五大类作为韵母代码;采用了“五笔字型”的字母区位码;并以《辞海》的“笔划查字表说明”作为汉字五种笔划的划分依据,汉字首二笔笔划及笔顺的确定亦以《辞海》的“笔划查字表”作为规范,尾二笔划的确定依照一般的书写习惯,同时考虑有利于识别为原则(例如,“钱”字末二笔划取“乙丿”)。
6763个常用汉字采用的编码方法及其输入操作的实际作用过程:
用23个拼音声母(含Y、w)首先区分,次用5个韵母代码(“a*”、“e*”、“o*”“i*”和“u*”)去区分,再用25个汉字的首二笔笔划码去区分,最后用25个汉字的尾二笔笔划码去确认。(见编码规则)
这样,汉语单字的编码最大容量约为:24的3次方*5=7万多(个),给6763个单字编码的重码可能性是9%,不重码汉字的可能性占91%。
双音词的编码方法:第一音节拼音头字母+第二音节头字母+第一音节汉字的首二笔笔划码+第二音节汉字的首二笔笔划码。
这样,双音节的词编码容量为:24的四次方=33万多(个),若给3万3千个双音节的汉语词汇编码,其重码的可能性只占10%,并且达到绝大部分不与单字编码重码-因单字第二码只用(韵母代码)只有5个,而双音词的第二码是用(第二音节汉字的拼音头字母)有20多个,大大降低了单字与词汇编码重码的概率。
三音词的编码方法:第一音节汉字拼音头字母+第二音节汉字拼音头字母+第三音节汉字拼音头字母+三音词键代码。
其编码的容量为:23的三次方=1万多(个),因为使了三音词键码而绝不与其他单字、双音、四音节的词重码。
四音节的词汇编码方法:依次取四个音节的拼音头4个字母。
其编码的容量为:23的四次方=28万个。
(单字、双音词和四音节的编码容量小于33万,不含三音词的编码容量)。
四音节的词汇编码方法可扩展到语句的编码,见编码规则。
如上所述,方案把35个韵母划分为五大类,并用五个代码键代替韵母的方法,对于汉语单字的最大编码容量而言并不很大(仅有7万多个)重码的可能性占9%,汉语单字编码的重码问题还没有得到根本解决,但已经达到了为数不多的程度。事实上,汉字编码重码问题,在汉字的“定量、定型、定音”的改革工作完成之前,汉字编码重码问题是难以十全十美、白玉无瑕地得到解决的,只能做到尽量避免重码。
从另一方面来分析,采用了5个韵母代码,单字的可编码容量虽然不很大(7万个)却让出了极大的四键编码的容量给二、四音节的汉语词汇作编码空间(33万-7万个),大幅度地降低了单字与大量的二、四音节的汉语词汇重码的概率。这对大量编码存入占汉语词汇90%以上的双音节、四音节词汇供了极大的有利条件。五韵码的另一个好处是大大简化了汉字输入拼写。
此外,汉语的三音节词汇编码因为第四码采用了“三音词键”,而绝对不与其他音节的词汇重码。
由此可见,方案已在理论论上解决了汉语的字、词、句编码的问题,从理论的高度去分析验证是可行的、成功的。(同时,对字、词实行过抽样验证)
具体的字、词编码的问题:当你打开《汉语成语词典》,某成语依次取各字拼音字母的头字母,就是该成语的编码;当你打开《现代汉语小词典》,某双音词依次取2个单字拼音的头字母,再依次取2个单字首二笔笔划码,就是该双音词的编码;当你打开《新华字典》,某个单字先取拼音的头字母,次取这个字的韵母代码,再依次取这个单字的首二笔笔划码和尾二笔笔划码,就是该汉字编码。如果你是一位熟悉拼音的人,《五韵五笔汉字码编码方案表》就是你的汉语编码“小辞海”。
熟悉计算机或电子打字机键盘的人,读过一、二遍此编码方案表及其说明和“编码规则”后,就能够熟记5个韵母代码所对应的字母,并熟悉汉字的首、尾二笔笔划代码的区位,同时学会对汉语字、词编码和掌握输入操作。
综上所述,本方案有三大特点:
一、浅显简洁。除键盘的26个字母外,只有5个汉语拼音韵母代码和汉字的横(一)、竖(丨)、撇(丿)、捺(丶)、折(乙)等五个笔划有规律地组成的25个“笔划代码”。
二、字、词编码的兼容性强。单字的编码占用的编码容量适中,词汇占有编码的容量大;能够实现中文输入技术从过去的“以字为主,以词为辅”向“以词为主,以字为辅”方向发展。
三、字、词编码信息能用拼音头字母表音(或表音且在一定程度上表形),表音方式与社会习惯相同。
现行的编码方案各有其优点,亦必然会有其不足。“尺有所短,寸有所长”,《五韵五笔汉字码方案》亦然。
“这是祖国的春天,人民的春天,科学的春天”。八十年代汉字编码百花争艳,祝愿祖国能在九十年代迎来汉语编码技术的成熟。
Figure 90108803X_IMG1
三、说明
一、汉语拼音字母的编码采用“五笔字型”区位码。汉语拼音的23个声母(包括Y、W)与键盘的英文字母一一对应,zh、ch、sh分别与z、c、s合拼,排列在各个键位的左上角。“a*”、“e*”、“o*”三类韵母独立为音节时,汉字的编码定义为:“A+a*+首二笔码+尾二笔码”等。
二、韵母编码:将35个韵母区分为“a*”、“e*”、“o*”“i*”和“u*”五大类,作为韵母代码,对应排列在键盘A、E、O、I、U键的右上角。
①、“a*”代替(a、ai、ao、an、ang)等5个韵母;
②、“e*”代替(e、ei、en、eng)等4个韵母;
③、“o*”代替(o、ou、ong)等3个韵母;
④、“i*”代替i行10个韵母(i、ia、ie、iao、iou、ian、in、iang、ing、iong);
⑤、“u*”代替u行和ü行韵母(u、ua、uo、uai、uei、uan、uen、uang、ueng和ü、üe、üan、ün)等13韵母。
三、汉字五种笔划的划分:以《辞海》的“笔划查字表说明”作为汉字五种笔划的划分依据,依次分为横(一与
Figure 90108803X_IMG2
)、直(丨)、撇(丿)、点(丶与
Figure 90108803X_IMG3
)、折(乙,包括笔型带钩或曲折的)。汉字首二笔笔划及笔顺的确定亦以《辞海》的“笔划查字表”作为规范,尾二笔划的确定依照一般的书写习惯,同时考虑有利于识别为原则(例如,“钱”字末二笔划取“乙丿”)。
四、汉字的首二笔划和尾二笔划的编码:一一、一丨、一丿、一丶、一乙;丨一、丨丨、丨丿、丨丶、丨乙;丿一、丿丨、丿丿、丿丶、丿乙;丶一、丶丨、丶丿、丶丶、丶乙;乙一、乙丨、乙丿、乙丶、乙乙。依次编入11、12、13、14、15;21、22、23、24、25;31、32、33、34、35;41、42、43、44、45;51、52、53、54、55区位(对应G、F、D、S、A、;H、J、K、L、M;T、R、E、W、Q;Y、U、I、O、P、;N、B、V、C、X键)。
四、编码规则
一、单字的编码
单字编码公式:拼音头字母+韵母代码+汉字首二笔码+汉字尾二笔码。
五韵五笔码  字母码  区位码
例如,部:B  u*  丶一  乙丨  BUYB  52424152
中:Z  o*  丨乙  一丨  ZOMF  66442512
壹:Y  I*  一丨  丶一  YIFY  41431241
善:S  a*  丶丶  乙一  SAON  14154351
注:1、啊…(a)、埃…(ai)、安…(an)、肮…(ang)、凹…(ao);蛾…(e)、而…(ei);欧…(ou)等三种汉字的分别用(A+a*+汉字首二笔码+汉字尾二笔码),(E+e*+汉字首二笔码+汉字尾二笔码),(O+o*+汉字首二笔码+汉字尾二笔码)的方法编码。
2、不足四笔划的汉字笔划码作如下处理:
①一笔划的汉字只有“一”和“乙”2个,分别定义为:
“Y  i*  一一  一一”和“Y  i*  乙乙  乙乙”。
②二笔划的汉字,既是首二笔码又看作是尾二笔码。
五韵五笔码  字母码  区位码
例如,儿:E  e*  丿乙  丿乙  EEQQ  33333535
刁:D  i*  乙一  乙一  DINN  13435151
③三笔划的汉字,中间的笔划既是首二笔码的第二笔划,又是尾二笔码的第一笔划。
五韵五笔码  字母码  区位码
例如,工:G  o*  一丨  丨一  GOFH  11441221
久:j  i*  丿乙  乙丶  JIQC  22433554
二、双音词的编码
双音词编码公式:第一音节汉字拼音头字母+第二音节汉字拼音头字母+第一音节汉字首二笔划码+第二音节汉字首二笔划码。
五韵五笔码  字母码  区位码
例如,人民:R  M  丿丶  乙一  RMWN  32253451
中国:Z  G  丨乙  丨乙  ZGMM  66112525
技术:J  S  一乙  一丨  JSAF  25141512。
三、三音词的编码
第一音节汉字拼音头字母+第二音节汉字拼音头字母+第三音节汉字拼音头字母+三音词键(或空格键)。
五韵五笔码  字母码  区位码
例如,计算机:JSJ
Figure 90108803X_IMG4
22142200
新时代:XSD
Figure 90108803X_IMG5
55141300
大众化:DZH
Figure 90108803X_IMG6
13662100
四、四音词的编码
第一音节汉字拼音头字母+第二音节汉字拼音头字母+第三音节汉字拼音头字母+第四音节汉字拼音头字母。
五韵五笔码  字母码  区位码
例如,中华民族:ZHMZ  66212566
突飞猛进:TFMJ  31122521
精益求精:JYQJ  22413522
五、五音节以上词、句的编码
采用“一、二、三、尾”头字母键。
五韵五笔码  字母码  区位码
例如,
中华人民共和国:ZHRG  66213211
中国人民解放军:ZGRJ  66113222
中国科学院:ZGKY  66112341
六、简码输入(供编程使用)
1、空格键简码的输入
①单字母键+空格,简码:给26个高频字编码。
②二键(取汉字的首、尾二笔划代码)+空格,简码:给500个常用字编码。
③三键+空格,码简:
(等价于第四码为任意字符的字、词码)
2、三音词键简码的输入
①单字母键+三字词键,简码:显示与头字母对应的字、词编码。
②双头母键+三字词键,简码:给600个常用双音词编码。
3、根据以上的规则,汉语编码中的第一码中,U、V键都无机会用上,但大有用途:
例如,U+汉字拼音头字母+汉字首二笔码+汉字尾二笔码
或U+双音词第一音节头字母+第一音节汉字首二笔码
+第二音节汉字首二笔码
(等价于第二码为任意字符的字、词简码)
U、V还可以用来编写首、尾二笔划码字、词索引等。
例如,V+V+字(词)首二笔码+字尾(词首)二笔码
(等价于头二码为任意字符的字、词简码)
五、汉语的字、词编码(初稿)
一:1、6763个常用汉字的编码。
2、26个高频字的编码。
3、500个高频字的(首、尾二笔划简码)编码。
二:1、4千个常用双音词的编码。
2、1千个常用三音词的编码。
3、5千个成语的编码。(见成语词典)

Claims (2)

1、将35个汉语拼音韵母区分为:“a*”、“e*”、“o*”、“i*”和“u*”五大类,作为韵母代码,对应排列在键盘A、E、O、I、U键的右上角,与确定汉字的首二笔画和尾二笔画的编码:一一、一丨、一丿、一丶、一乙;丨一、丨丨、丨丿、丨丶、丨乙;丿一、丿丨、丿丿、丿丶、丿乙;丶一、丶丨、丶丿、丶丶、丶乙;乙一、乙丨、乙丿、乙丶、乙乙。依次编入11、12、13、14、15;21、22、23、24、25;31、32、33、34、35;41、42、43、44、45;51、52、53、54、55区位(对应G、F、D、S、A、;H、J、K、L、M;T、R、E、W、Q;Y、U、I、O、P、;N、B、V、C、X键),去区分汉字为主要技术特征。
2、五韵五笔码编码方案采用了“五笔字型”的字母区位码,但本方案为音型(形)码(只用25个二笔画代码)无字根,与王码(拼型法)130字根本质的区别。
CN 90108803 1990-10-29 1990-10-29 电脑汉字输入五韵五笔码 Pending CN1058853A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN 90108803 CN1058853A (zh) 1990-10-29 1990-10-29 电脑汉字输入五韵五笔码

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN 90108803 CN1058853A (zh) 1990-10-29 1990-10-29 电脑汉字输入五韵五笔码

Publications (1)

Publication Number Publication Date
CN1058853A true CN1058853A (zh) 1992-02-19

Family

ID=4881145

Family Applications (1)

Application Number Title Priority Date Filing Date
CN 90108803 Pending CN1058853A (zh) 1990-10-29 1990-10-29 电脑汉字输入五韵五笔码

Country Status (1)

Country Link
CN (1) CN1058853A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5360343A (en) * 1992-01-15 1994-11-01 Jianmin Tang Chinese character coding method using five stroke codes and double phonetic alphabets
CN1091530C (zh) * 1994-09-02 2002-09-25 舒从如 二代区位码汉字输入法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5360343A (en) * 1992-01-15 1994-11-01 Jianmin Tang Chinese character coding method using five stroke codes and double phonetic alphabets
CN1091530C (zh) * 1994-09-02 2002-09-25 舒从如 二代区位码汉字输入法

Similar Documents

Publication Publication Date Title
CN1024050C (zh) 对汉字进行编码和译码的方法和装置
CN1026525C (zh) 智能五笔双拼码计算机汉字输入方法
CN1141633C (zh) 计算机二十四部首汉字排序输入法
CN1136496C (zh) 简化拼音-触摸屏鼠标式汉字输入方法
CN1058853A (zh) 电脑汉字输入五韵五笔码
CN1645356A (zh) 多维汉语学习系统
CN1059281C (zh) 汉字声韵调三拼音形编码输入方法
CN1257445C (zh) 音义码汉字输入方法
CN1035083C (zh) 面向词的中文文字处理输入装置
CN1118085A (zh) 可用数字键盘输入的汉字输入系统及其键盘
CN1119743C (zh) 计算机汉字组词码输入方法
CN1025135C (zh) 汉字元音码计算机输入方法及键盘
CN1025540C (zh) 汉字拼音编码计算机输入的一种键盘方案
CN101034319A (zh) 汉字输入方法及其专用键盘
CN1087083C (zh) 一种计算机音韵调义汉字编码键盘输入方法
CN1104673C (zh) 计算机汉字字根笔画分段输入方法
CN1779624A (zh) 汉语在音节压缩平台上的编码和输入方法及键盘
CN1081773A (zh) “多声递推联想”汉语词字编码
CN1081523A (zh) 双拼汉语编码法及其键盘
CN1347024A (zh) 拼音简化字繁体字通用的自然读成码输入法
CN1088210C (zh) 六区五位汉语音节和汉字键盘输入方法
CN1171573A (zh) 汉字词综合编码及键盘输入法
CN85105556A (zh) 汉字表形符号和字素(即部件)分类编码法
CN1048613A (zh) 四维码汉字输入技术
CN1285542A (zh) 鼎立世界码及其改进兼容键盘

Legal Events

Date Code Title Description
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C06 Publication
PB01 Publication
C12 Rejection of a patent application after its publication
RJ01 Rejection of invention patent application after publication