CN101833378B - 一种改进的五笔输入法及其键盘 - Google Patents

一种改进的五笔输入法及其键盘 Download PDF

Info

Publication number
CN101833378B
CN101833378B CN201010148085XA CN201010148085A CN101833378B CN 101833378 B CN101833378 B CN 101833378B CN 201010148085X A CN201010148085X A CN 201010148085XA CN 201010148085 A CN201010148085 A CN 201010148085A CN 101833378 B CN101833378 B CN 101833378B
Authority
CN
China
Prior art keywords
word
yards
character
sign indicating
indicating number
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201010148085XA
Other languages
English (en)
Other versions
CN101833378A (zh
Inventor
林海涛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to CN201010148085XA priority Critical patent/CN101833378B/zh
Publication of CN101833378A publication Critical patent/CN101833378A/zh
Application granted granted Critical
Publication of CN101833378B publication Critical patent/CN101833378B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Document Processing Apparatus (AREA)
  • Organic Insulating Materials (AREA)
  • Controls And Circuits For Display Device (AREA)

Abstract

为了克服现有的五笔输入法字根不规范、拆字不规范的不足,本发明提供一种规范五笔输入法及其键盘,采用符合GF3001-1997《信息处理用GB13000.1字符集汉字部件规范》要求的部件作为字根,在86五笔的基础上进行改进,增加了部分规范字根,删除了一些不规范或不合理的字根,改变部分字根的编码。最大特色是:符合国家语言文字规范,达到了拆字容易、字根表易记、重码少和输入速度快的要求;其输入规则与86五笔基本相同,略有不同的是:可采用该字的首拼音作为识别码;“犭礻衤”不再拆分,增加“牛饣豸且革身舟……”等字根;可以输入GB18030-2000标准的27534个汉字,包括简体、繁体以及日本、韩国的汉字。

Description

一种改进的五笔输入法及其键盘
技术领域
本发明涉及一种汉字输入方法及其键盘。
背景技术
目前,中国大陆最流行的汉字输入法是拼音输入法(音码)和五笔字型输入法(形码),五笔字型输入法推出时间较早,重码较少,因而在形码输入法中使用人数较多。五笔字型输入法的主要缺陷是字根不规范、拆字不规范,要记一些难拆字的特殊拆字方法,不符合国家语言文字规范,损害识字教育,所以至今还未在教育系统推广。五笔字型输入法先后推出了三个版本:86五笔、98五笔和新世纪五笔,均未能解决上述的缺陷。现在使用最广泛是86五笔。
以下是本发明涉及到的字符集和字表的介绍:
GB2312-80《信息交换用汉字编码字符集 基本集》(简称“GB2312”)是简体中文字符集的中国国家标准,共收录6763个汉字,1980年发布。
大五码(Big5,简称“Big5”)是使用繁体中文社群中最常用的电脑汉字字符集标准,共收录13060个汉字,1984年发布。
《现代汉语通用字表》(简称“通用字表”)是在《印刷通用汉字字形表》的基础上增订而成的,共收录汉字7000个,1988年发布。
《汉字内码扩展规范》(GBK 1.0,简称“GBK”)是GB2312字符集的扩展集,共收录汉字21003个(加上汉字“○”为21004个),包括了GB2312、大五码、《现代汉语通用字表》中的汉字,1995年发布。
GB18030-2000《信息技术信息交换用汉字编码字符集基本集的扩充》(简称“GB18030”或“GB18030-2000”)是以GBK为基础,加入CJK扩展字符集A集中的6582个汉字,共收汉字27533个,包括了GBK中的汉字,2000年发布。
《通用规范汉字表(征求意见稿)》(简称“规范字表”)是由教育部、国家语委组织研制的汉字使用规范,2009年8月12日发表征求意见稿,共收汉字8300个,有的字在GB18030-2000字符集以外。
有关名词解释:
部件:由笔画组成的具有组配汉字功能的构字单位。(这是GF3001-1997《信息处理用GB13000.1字符集汉字部件规范》的解释)
字根:在特定的输入法中,将构成汉字的基本单位称之为字根。部件不一定是字根,例如,“扌”是部件,也是86五笔的字根,“饣”是部件,但不是86五笔的字根。
字根表:是指某一字符集或字表的字根集合。在字根表中可以进一步定义字根的编码。
对某一字符集或字表的全部汉字逐个进行拆分、归纳得出的汉字部件(或汉字字根),可称之为某一字符集或字表的汉字部件(或汉字字根)。汉字部件(或汉字字根)与字符集或字表是有对应关系的。
发明内容
为了克服现有的五笔字型输入法字根不规范、拆字不规范的不足,本发明提供一种改进的五笔输入法,是在王永民86五笔的基础上进行改进。
本发明解决其技术问题所采用的技术方案是:
采用符合GF3001-1997《信息处理用GB13000.1字符集汉字部件规范》要求的部件作为字根,在86五笔的基础上,增加了部分规范字根,删除了一些不规范或不合理的字根,改变部分字根的编码。
GB18030-2000字符集的汉字字根可以包括表1的字根,各字根的编码、还可设定的编码等如表1所示。
采用“A~Z”26个英文字母作为编码的码元。
表1编码码元与键盘上的键位一一对应。
本输入法不同字符集或字表都有其对应的字根表,表1的字根是收录汉字较多的GB18030-2000字符集的汉字字根,GB18030-2000字符集的子集:GB2312字符集、Big5字符集、GBK字符集、《现代汉语通用字表》的汉字字根只是表1的一部分字根;《通用规范汉字表(征求意见稿)》的汉字字根也只是表1的一部分字根。表1的第五列是对字根对应于哪个字符集或字表的说明。以后如出现新的字符集或字表,可根据该字符集或字表在拆字中所用到的字根,在表1的基础上增加或减少相应的字根即可。
表1第一列“序号”是指字根在《信息处理用GB13000.1字符集汉字部件规范》的《汉字基础部件表》中的序号,标识为“无”表示不在《汉字基础部件表》中。
表1第三列“编码”是本输入法的编码方案。
表1第四列“还可设定的编码”是经过电脑大量计算得出,字根还可以设在这些编码中,重码较少或易于记忆。
表1第六列“增加”是指相比86五笔字根表增加的字根,“移动”是指相比86五笔键位移动的字根。
表1
Figure GSB00000821867000031
Figure GSB00000821867000041
Figure GSB00000821867000051
Figure GSB00000821867000061
Figure GSB00000821867000071
Figure GSB00000821867000081
Figure GSB00000821867000101
Figure GSB00000821867000111
Figure GSB00000821867000121
Figure GSB00000821867000131
Figure GSB00000821867000161
相比86五笔,本输入法删去了“古”、“六”、“早”、“孑”等字根,“古”、“六”、“早”、“孑”虽然是规范部件,但是“古”、“六”、“早”如设为字根,其它字的拆字就变得不规范,如“舌”拆为“丿”、“古”,“交”拆为“六”、“乂”,拆为“十”、“早”,是不规范、不合字理的拆法,“舌”拆为“丿”、“十”、“口”,“交”拆为“亠”、“八”、“乂”,
Figure GSB00000821867000173
拆为“十”、“日”、“十”,是符合字理的拆法。86五笔中,“孓”拆为“了”、
Figure GSB00000821867000174
“孑”作为字根,而本输入法,“孓”拆为“了”、“孑”拆为“了”、“一”,相比起来,这样比较合理,也符合字理。
在设计输入法的时候,需要对汉字进行拆字,在拆字的研究中本人认为,GB13000.1字符集汉字部件除《信息处理用GB13000.1字符集汉字部件规范》中的《汉字基础部件表》的部件以外,如增加5个:冊(“狦”字用到)、
Figure GSB00000821867000176
(“澲、嶪、驜、嶫、檏、礏、曗、擈、業、鄴、鸈”字用到)、○、粛(“粛、嘨、
Figure GSB00000821867000181
、簘”字用到)、
Figure GSB00000821867000182
(“潀、眾、
Figure GSB00000821867000183
”字用到)较为适宜。在本输入法中“粛、
Figure GSB00000821867000184
”还可以再拆。
本人的研究认为,GB18030字符集汉字部件除《信息处理用GB13000.1字符集汉字部件规范》中的《汉字基础部件表》的部件和上述的5个部件以外,还要增加22个:
Figure GSB00000821867000185
(“
Figure GSB00000821867000186
Figure GSB00000821867000187
字用到)、
Figure GSB00000821867000188
(“
Figure GSB00000821867000189
”字用到)、
Figure GSB000008218670001810
Figure GSB000008218670001811
(“
Figure GSB000008218670001812
”字用到)、(
Figure GSB000008218670001814
字用到)、
Figure GSB000008218670001815
(“
Figure GSB000008218670001816
”字用到)、(“
Figure GSB000008218670001818
”字用到)、
Figure GSB000008218670001819
Figure GSB000008218670001820
(“”字用到)、
Figure GSB000008218670001822
(“
Figure GSB000008218670001823
”字用到)、(“
Figure GSB000008218670001825
”字用到)、
Figure GSB000008218670001826
Figure GSB000008218670001827
(“
Figure GSB000008218670001828
”字用到)、
Figure GSB000008218670001829
(“
Figure GSB000008218670001830
”字用到)、
Figure GSB000008218670001831
(“
Figure GSB000008218670001832
”字用到)、
Figure GSB000008218670001833
(“
Figure GSB000008218670001834
”字用到)、
Figure GSB000008218670001835
Figure GSB000008218670001837
(“
Figure GSB000008218670001838
”字用到)、
Figure GSB000008218670001839
Figure GSB000008218670001840
(“
Figure GSB000008218670001841
”字用到)。在本输入法中
Figure GSB000008218670001842
设为字根,其余部件还可以再拆。
以下部件也可以设为字根,各部件可以设定的编码如表2所示。
表2编码码元与键盘上的键位一一对应。
表2的第三列是对部件对应于哪个字符集或字表的说明。
表2
Figure GSB000008218670001843
Figure GSB00000821867000191
Figure GSB00000821867000201
Figure GSB00000821867000211
Figure GSB00000821867000221
疑难字的编码方案:
本输入法规定一些难拆字为疑难字,该字在取码过程中不用拆字,采用特殊的编码方法。
方案一:
(1)对疑难字,采用该字的拼音作为编码。如果该疑难字是多音字,那么这几种拼音都可以作为该字的编码,这几种编码都可以输入该字,在输入法中实现兼容。
(2)拆字中含有的疑难字部件,疑难字部件编码为两位编码,第一码为该疑难字部件拼音的首字母,第二码重复第一码。如果该疑难字部件是多音字,且首拼音不同,那么该疑难字部件的编码就有几种,也可以人为规定为唯一的一种。
例如:“牙”作为疑难字,其编码为ya(“牙”的拼音);“穿”字的拆字部件中含有“牙”,其编码为pwyy(yy为“牙”的编码)。
例如:“乐”作为疑难字,是多音字(lè,yuè),“乐”的编码可以是le或yue,用这两种编码都可以输入该字;“烁”字的拆字部件中含有“乐”,其编码可以是oll或oyy,也可以人为规定“乐”的编码为唯一的一种:ll,“烁”的编码就是oll。
采用本方案进行编码的疑难字,也可以称之为“拼音字根”或“双码字根”等。
方案二:疑难字和拆字中含有的疑难字部件,拆为笔画,按本输入法的规则进行编码。如:“朱”的编码可以是tggy(丿一一
Figure GSB00000821867000222
),“珠”的编码可以是gtgy(王丿一
Figure GSB00000821867000223
),“庸”的编码可以是yngh(广乙一丨)。
方案三:疑难字和拆字中含有疑难字部件的字,采用该字的拼音作为编码。如:“未”的编码可以是wei,“妹”的编码可以是mei。
可以采用以下这些字作为疑难字:
表3的第四列说明该疑难字是哪个字符集或字表的汉字部件。
表3
Figure GSB00000821867000224
Figure GSB00000821867000231
以下非字根部件的拆字可以如表4所示:
表4的第三列是对部件对应于哪个字符集或字表的说明。
表4
Figure GSB00000821867000232
Figure GSB00000821867000251
Figure GSB00000821867000261
Figure GSB00000821867000271
Figure GSB00000821867000281
Figure GSB00000821867000291
说明:上面
Figure GSB00000821867000292
拆为“业”、“冖”,
Figure GSB00000821867000293
拆为“
Figure GSB00000821867000294
”、“冖”,可以认为是“业”及“
Figure GSB00000821867000295
”的最后一笔“一”与部件“冖”共用笔画,汉字中有时有共用笔画的情况。此外,如前面技术方案所述,可将
Figure GSB00000821867000297
设为字根,如将
Figure GSB00000821867000298
设为字根,
Figure GSB00000821867000299
可拆为
Figure GSB000008218670002910
“冖”,
Figure GSB000008218670002911
也可设为字根。
表4的部件大多数是GF3001-1997《信息处理用GB13000.1字符集汉字部件规范》的《汉字基础部件表》中的部件,按照该部件规范,基础部件除可拆成笔画,是不得再行拆分的。该部件规范有一原则是“交重不拆”,本人认为交重部件符合字理的拆法是可行的,例如,“本”拆为“木”、“一”,“里”拆为“田”、“土”(五笔拆为“日”、“土”不符合字理),“央”拆为“
Figure GSB000008218670002912
”、“大”,是符合字理的拆法,是可行的。表4有些交重部件的拆法可能不符合字理,但基于汉字编码的需要,本人认为是可行的,这虽属于无理据拆分,却顺理成章,国家部件规范有些部件的拆分也是无理据拆分。例如,本输入法中,“丸”拆为“九”、“丶”。此外,该部件规范有560个字根,如全部设为字根,会造成字根太多、字根表难于记忆、重码过多的弊端,是不可行的。
除键名字、成字字根和疑难字之外的汉字,编码不足四码,可追加一个识别码,识别码可为该字拼音的首字母。如果该字是多音字,且首拼音不同,那么识别码就有多种,加上这几种识别码后都可以作为该字编码。如:“会”是多音字(huì,kuàì),首拼音有h、k,那么“会”的编码可以是wfch或wfck,用这两种编码都可以输入“会”字。
本输入法可以有两种版本:一种采用首拼音作为识别码,另一种采用原五笔的末笔识别码。
“键名字”:这里把字根表每键的第一个字定为“键名字”。输入键名字的方法是连续击该键四次。本输入法比86五笔增加了Z码元,Z码元的键名字是“鱼”,对应的繁体是“魚”,其它键名字与86五笔一致。
键名字一共有二十六个,它们所在的键位如下:
金Q,人W,月E,白R,禾T,言Y,立U,水I,火O,之P
工A,木S,大D,土F,王G,目H,日J,口K,田L
鱼(繁体:魚)Z,纟(繁体:糹)X,又C,女V,子B,已N,山M。
选定作为一级简码的汉字可以是:我、人、有、的、和、这、来、在、为、不、工、要、大、地、一、上、是、中、国、说、就、以、发、了、年、到;具体键位的设定可以是:我Q,人W,有E,的R,和T,这Y,来U,在I,为O,不P,工A,要S,大D,地F,一G,上H,是J,中K,国L,说Z,就X,以C,发V,了B,年N,到M。
简体字的最大码长可以为4码;繁体字输入法的最大码长可以为4码或5码,最大码长为5码可以有效地减少重码。
词组编码可以采用以下方案,有六种情况,分述如下:
(1)双字词
可以是:第一字未含识别码的编码的前三码(不足三码则取前两码)+第二字未含识别码的编码的前三码(不足三码则取前两码)。例如:祝福pkqpgk(礻口儿礻一口),吉祥fkpz(士口礻羊),如意vkujn(女口立日心),春节fdjab(二大日艹卩)。
或者是:第一字未含识别码的编码的前三码(不足三码则取前两码)+第二字未含识别码的编码的前两码或前三码(说明:若第一字取有三码则第二字取前两码,若第一字取有两码,则第二字取前三码,不足三码则取前两码,即双字词编码最多为五码)。例如:祝福pkqpg(礻口儿礻一),环境gpfuj(王不土立日),吉祥fkpz(士口礻羊)。
或者是:第一字未含识别码的编码的前两码+第二字未含识别码的编码的前三码(不足三码则取前两码)。例如:祝福pkpgk(礻口礻一口),吉祥fkpz(士口礻羊)。
或者是:第一字未含识别码的编码的前三码(不足三码则取前两码)+第二字未含识别码的编码的前两码。例如:祝福pkqpg(礻口儿礻一),吉祥fkpz(士口礻羊)。
或者是:第一字未含识别码的编码的前两码+第二字未含识别码的编码的前三码(不足三码则取前两码),第二字不足三码则加第二字的识别码即拼音的首字母。例如:祝福pkpgk(礻口礻一口),吉祥fkpzx(士口礻羊)。
或者是:第一字的前三码+第二字的前三码。
或者是:第一字的前两码+第二字的前三码。
或者是:第一字的前三码+第二字的前两码。
(2)三字词
可以是;第一字的前两码+第二字的前两码+第三字的前两码。
或者是:第一字的前一码+第二字的前两码+第三字的前两码。
或者是:第一字的前两码+第二字的前两码+第三字的前一码。
(3)四字词
可以是:第一字的前一码+第二字的前一码+第三字的前两码+第四字的前两码。
或者是:第一字的前两码+第二字的前两码+第三字的前一码+第四字的前一码。
或者是:第一字的前一码+第二字的前一码+第三字的前一码+第四字的前两码。
或者是:第一字的前两码+第二字的前一码+第三字的前一码+第四字的前一码。
(4)五字词
可以是:第一字的前一码+第二字的前一码+第三字的前一码+第四字的前一码+第五字的前两码。
或者是:第一字的前两码+第二字的前一码+第三字的前一码+第四字的前一码+第五字的前一码。
或者是:取每一汉字的第一码。
(5)六字词
可以是:取每一汉字的第一码。
或者是:前四字的第一码+最后一字的第一码。
(6)七字以上词
可以是:前五字的第一码+最后一字的第一码。
或者是:前四字的第一码+最后一字的第一码。
本发明的有益效果是:
本输入法通过电脑大量的计算和巧妙的设计,符合国家语言文字规范,达到了拆字容易、字根表易记、重码少和输入速度快的要求。
1.本输入法的主要进步是规范,字根规范、拆字规范,尊重汉字文化。本输入法的字根取之于国家规范——《信息处理用GB13000.1字符集汉字部件规范》。为了做到规范,查阅了《说文解字》、《汉字源流字典》、《细说汉字》等大量权威汉字字源的工具书。原五笔输入法最大缺陷在于拆字不规范。
2.拆字容易,记住字根表就可以打字,不再有难拆的字,而原五笔还要记不少难拆字的特殊拆字方法。
3.增加和移动的字根采用人性化的设计,字根表容易记忆!与86五笔字根表相差不大。
4.重码与原五笔相当!未加识别码有1339个重码,加首拼音识别码有410个重码,加末笔识别码有548个重码。能做到重码少是难点所在,需要进行大量的计算和调整。因为重码少,使本输入法实用性大大提高!
5.输入速度快!在重码相当的情况下,不少字根86五笔要输入两个键,而本输入法只要一个键!敲入的按键比原五笔少,因此输入速度快!
6.输入法的输入规则与86五笔基本相同。略有不同的是:可采用该字的首拼音作为识别码。对于不会读的字,因为输入法有逐渐提示的功能,在提示中选择,也是可以输入的。本输入法有两种版本:一种采用首拼音作为识别码,另一种采用末笔识别码。
7.GB2312简体版字根表一共有302个字根,增加95个字根,21个移动,186个不变。“犭礻衤”不再拆分,增加“牛饣豸且革身舟毛艮……”等字根。
8.可以输入GB18030-2000《信息技术信息交换用汉字编码字符集基本集的扩充》的27534个汉字,包括简体、繁体、香港字以及日本、韩国的汉字,满足各方面的需求。
附图说明
图1、图2是本发明GB2312简体版字根表;在图1至图8的全部附图中,加下划线的字根是相比86五笔字根表增加的字根,加波浪线的字根是相比86五笔键位移动的字根。右下角括号内的字是一级简码,一级简码加下划线表示相比86五笔增加的一级简码,加波浪线表示相比86五笔移动的一级简码;
图3、图4是本发明Big5繁体版字根表;图中,加方框的字根是繁体字根;
图5、图6是本发明GBK字符集字根表;图中,加方框的字根是GB2312和Big5以外的字根;
图7、图8是本发明GB18030字符集字根表;图中,加方框的字根是GB2312和Big5以外的字根。该字根表比GBK字符集字根表多了2个字根:(K)、
Figure GSB00000821867000312
(R)。
具体实施方式
附图是本发明的实施例,是不同字符集的字根表。
本输入法的输入规则和五笔输入法基本相同,说明如下:
一、单字输入。有四种情况:
(1)键名汉字输入
“键名字”:这里把字根表每键的第一个字定为“键名字”。输入键名字的方法是连续击该键四次。例如:王gggg,立uuuu。
(2)成字字根汉字输入
在每个键位上,除了一个键名字根外,还有其它一些字根本身也是汉字,称之为成字字根。
成字字根输入公式:键名码+首笔码+次笔码+末笔码。
如果该字根只有两笔画,则以空格键结束。
例如:由mhng,十ogh。
五种单笔画的编码,第一、二键是相同的,规定后面增加两个英文ll键。一ggll,丨hhll,丿ttll,丶yyll,乙nnll
(3)疑难字输入
采用该字的拼音作为编码。
(4)其它单字输入
其它单字是指除键名汉字、成字字根汉字和疑难字之外的汉字。
a.刚好四字根,依次取该四个字根的码输入。
例如:“福”字拆分成“礻”、“一”、“口”、“田”,其编码为pgkl。
b.超过四个字根,则取一、二、三、末四个字根的编码输入。
例如:“嘉”字拆分成“士”、“口”、
Figure GSB00000821867000321
“口”,其编码为fkuk。
c.不足四个字根,加上一个首拼音或末笔字型识别码,若仍不足四码,则加一空格键。
对拆字中含有疑难字的字,其中的疑难字编码为两位编码,第一码为该疑难字拼音的首字母,第二码重复第一码。
二、单字的简码输入
为了提高输入速度,将常用汉字只取前边一个、两个或三个字根构成简码。
(1)一级简码
我Q,人W,有E,的R,和T,这Y,来U,在I,为O,不P,工A,要S,大D,地F,一G,上H,是J,中K,国L,说Z,就X,以C,发V,了B,年N,到M。
(2)二级简码
二级简码只要击其前两个字根加空格键即可,例如:吧kc(口巴),给xw(纟人)。
(3)三级简码
三级简码由单字的前三个字根码组成,只要击一个字的前三个字根加空格即可。例如:华全码是wxoh(亻
Figure GSB00000821867000322
十),简码是wxo(亻
Figure GSB00000821867000323
十)。
三、词组输入
词组输入如前面技术方案所述。
这样每个汉字和词组都有对应的编码(一对一,或一对多),逻辑上是一种对应的关系,编写一个软件程序,将所有汉字、词组与对应的编码编成一个码表文件,在需要输入中文的时候,调用该程序,输入汉字或词组的编码,程序就根据编码在码表文件中找到对应的字或词组,如果出现重码,由用户选择其中的一个,然后在指定的位置输出该字或词组。

Claims (6)

1.一种改进的五笔输入法,是在王永民86五笔的基础上进行改进,其特征是采用符合GF3001-1997《信息处理用GB13000.1字符集汉字部件规范》要求的部件作为字根,在86五笔的基础上,增加了部分规范字根,删除了一些不规范或不合理的字根,改变部分字根的编码;
GB18030-2000字符集的汉字字根包括下表的字根,各字根的编码如下表所示;
本输入法不同字符集或字表都有其对应的字根表,下表的字根是收录汉字较多的GB18030-2000字符集的汉字字根,GB18030-2000字符集的子集:GB2312字符集、Big5字符集、GBK字符集、《现代汉语通用字表》的汉字字根只是下表的一部分字根;《通用规范汉字表(征求意见稿)》的汉字字根也只是下表的一部分字根;下表的第三列是对字根对应于哪个字符集或字表的说明;以后如出现新的字符集或字表,可根据该字符集或字表在拆字中所用到的字根,在下表GB18030-2000字符集汉字字根的基础上增加或减少相应的字根即可;
本输入法的编码方案:
Figure FSB00000821866900011
Figure FSB00000821866900021
Figure FSB00000821866900031
Figure FSB00000821866900051
Figure FSB00000821866900061
Figure FSB00000821866900081
Figure FSB00000821866900091
Figure FSB00000821866900101
Figure FSB00000821866900111
上表编码码元与键盘上的键位一一对应;
本输入法的输入规则和五笔输入法基本相同,说明如下:
一、单字输入,有四种情况:
(1)键名汉字输入
“键名字”:这里把字根表每键的第一个字定为“键名字”;输入键名字的方法是连续击该键四次;
(2)成字字根汉字输入
在每个键位上,除了一个键名字根外,还有其它一些字根本身也是汉字,称之为成字字根;
成字字根输入公式:键名码+首笔码+次笔码+末笔码;
如果该字根只有两笔画,则以空格键结束;
五种单笔画的编码,第一、二键是相同的,规定后面增加两个英文11键;
(3)疑难字输入
本输入法规定一些难拆字为疑难字,该字在编码过程中不用拆字,采用特殊的编码方法;
方案一:
(1)对疑难字,采用该字的拼音作为编码;如果该疑难字是多音字,那么这几种拼音都可以作为该字的编码,这几种编码都可以输入该字,在输入法中实现兼容;
(2)拆字中含有的疑难字部件,疑难字部件编码为两位编码,第一码为该疑难字部件拼音的首字母,第二码重复第一码;如果该疑难字部件是多音字,且首拼音不同,那么该疑难字部件的编码就有几种,也可以人为规定为唯一的一种;
方案二:疑难字和拆字中含有的疑难字部件,拆为笔画,按本输入法的规则进行编码;
方案三:疑难字和拆字中含有疑难字部件的字,采用该字的拼音作为编码;
采用以下这些字作为疑难字:
下表的第二列说明该疑难字是哪个字符集或字表的汉字部件;
  疑难字   是否是GB2312、Big5、GBK、GB18030、通用字表、规范字表的汉字部件   凹   GB2312、Big5、GBK、GB18030、通用字表、规范字表   垂   GB2312、Big5、GBK、GB18030、通用字表、规范字表   民   GB2312、Big5、GBK、GB18030、通用字表、规范字表   年   GB2312、Big5、GBK、GB18030、通用字表、规范字表   求   GB2312、Big5、GBK、GB18030、通用字表、规范字表   曲   GB2312、Big5、GBK、GB18030、通用字表、规范字表   凸   GB2312、Big5、GBK、GB18030、通用字表、规范字表   未   GB2312、Big5、GBK、GB18030、通用字表、规范字表   牙   GB2312、Big5、GBK、GB18030、通用字表、规范字表   禺   GB2312、Big5、GBK、GB18030、通用字表、规范字表   朱   GB2312、Big5、GBK、GB18030、通用字表、规范字表   庸   GB2312、Big5、GBK、GB18030、通用字表、规范字表
  东   GB2312、GBK、GB18030、通用字表、规范字表   乐   GB2312、GBK、GB18030、通用字表、规范字表   畢   Big5、GBK、GB18030   Big5、GBK、GB18030   飛   Big5、GBK、GB18030   龜   Big5、GBK、GB18030   ○   GBK、GB18030
(4)其它单字输入
其它单字是指除键名汉字、成字字根汉字和疑难字之外的汉字;
a.刚好四字根,依次取该四个字根的码输入;
b.超过四个字根,则取一、二、三、末四个字根的编码输入;
c.不足四个字根,加上一个首拼音或末笔字型识别码,若仍不足四码,则加一空格键;
二、单字的简码输入
为了提高输入速度,将常用汉字只取前边一个、两个或三个字根构成简码。
2.根据权利要求1所述的五笔输入法,其特征是以下非字根部件的拆字如下表所示:
下表的第三列是对部件对应于哪个字符集或字表的说明;
Figure FSB00000821866900141
Figure FSB00000821866900151
Figure FSB00000821866900161
Figure FSB00000821866900171
Figure FSB00000821866900181
Figure FSB00000821866900191
说明:上面
Figure FSB00000821866900201
拆为“业”、“冖”,拆为
Figure FSB00000821866900203
“冖”,可以认为是“业”及
Figure FSB00000821866900204
的最后一笔“一”与部件“冖”共用笔画,汉字中有时有共用笔画的情况。
3.根据权利要求1所述的五笔输入法,其特征是对于需要追加识别码的字,识别码可为该字拼音的首字母;如果该字是多音字,且首拼音不同,那么识别码就有多种,加上这几种识别码后都可以作为该字编码。
4.根据权利要求1所述的五笔输入法,其特征是选定作为一级简码的汉字是:我、人、有、的、和、这、来、在、为、不、工、要、大、地、一、上、是、中、国、说、就、以、发、了、年、到;具体键位的设定是:我Q,人W,有E,的R,和T,这Y,来U,在I,为O,不P,工A,要S,大D,地F,一G,上H,是J,中K,国L,说Z,就X,以C,发V,了B,年N,到M。
5.根据权利要求1所述的五笔输入法,其特征是繁体字输入法的最大码长为4码或5码。
6.根据权利要求1所述的五笔输入法,其特征是词组编码采用以下方案,有六种情况,分述如下:
(1)双字词
第一字未含识别码的编码的前三码,不足三码则取前两码+第二字未含识别码的编码的前三码,不足三码则取前两码;
或者是:第一字未含识别码的编码的前三码,不足三码则取前两码+第二字未含识别码的编码的前两码或前三码,说明:若第一字取有三码则第二字取前两码,若第一字取有两码,则第二字取前三码,不足三码则取前两码,即双字词编码最多为五码;
或者是:第一字未含识别码的编码的前两码+第二字未含识别码的编码的前三码,不足三码则取前两码;
或者是:第一字未含识别码的编码的前三码,不足三码则取前两码+第二字未含识别码的编码的前两码;
或者是:第一字未含识别码的编码的前两码+第二字未含识别码的编码的前三码,不足三码则取前两码,第二字不足三码则加第二字的识别码即拼音的首字母;
或者是:第一字的前三码+第二字的前三码;
或者是:第一字的前两码+第二字的前三码;
或者是:第一字的前三码+第二字的前两码;
(2)三字词
第一字的前两码+第二字的前两码+第三字的前两码;
或者是:第一字的前一码+第二字的前两码+第三字的前两码;
或者是:第一字的前两码+第二字的前两码+第三字的前一码;
(3)四字词
第一字的前一码+第二字的前一码+第三字的前两码+第四字的前两码;
或者是:第一字的前两码+第二字的前两码+第三字的前一码+第四字的前一码;
或者是:第一字的前一码+第二字的前一码+第三字的前一码+第四字的前两码;
或者是:第一字的前两码+第二字的前一码+第三字的前一码+第四字的前一码;
(4)五字词
第一字的前一码+第二字的前一码+第三字的前一码+第四字的前一码+第五字的前两码;
或者是:第一字的前两码+第二字的前一码+第三字的前一码+第四字的前一码+第五字的前一码;
或者是:取每一汉字的第一码;
(5)六字词
取每一汉字的第一码;
或者是:前四字的第一码+最后一字的第一码;
(6)七字以上词
前五字的第一码+最后一字的第一码;
或者是:前四字的第一码+最后一字的第一码。
CN201010148085XA 2010-04-12 2010-04-12 一种改进的五笔输入法及其键盘 Expired - Fee Related CN101833378B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201010148085XA CN101833378B (zh) 2010-04-12 2010-04-12 一种改进的五笔输入法及其键盘

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201010148085XA CN101833378B (zh) 2010-04-12 2010-04-12 一种改进的五笔输入法及其键盘

Publications (2)

Publication Number Publication Date
CN101833378A CN101833378A (zh) 2010-09-15
CN101833378B true CN101833378B (zh) 2012-09-19

Family

ID=42717470

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201010148085XA Expired - Fee Related CN101833378B (zh) 2010-04-12 2010-04-12 一种改进的五笔输入法及其键盘

Country Status (1)

Country Link
CN (1) CN101833378B (zh)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1154502A (zh) * 1995-06-09 1997-07-16 王永民 教育规范五笔字型汉字输入法及其装置

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1074559C (zh) * 1997-11-04 2001-11-07 北京金冠王码科技有限公司 构形识别码及其键盘
CN1204080A (zh) * 1998-02-25 1999-01-06 王永民 规范王码汉字电脑输入法及其键盘

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1154502A (zh) * 1995-06-09 1997-07-16 王永民 教育规范五笔字型汉字输入法及其装置

Also Published As

Publication number Publication date
CN101833378A (zh) 2010-09-15

Similar Documents

Publication Publication Date Title
CN101694601B (zh) 零记忆汉字编码输入法
CN101598976B (zh) 一种电脑/手机统一的汉字键盘输入方法
CN102073386A (zh) 一种象形会意分类字根的汉字计算机输入法
CN1027558C (zh) 五笔二维计算机汉字输入方法及其键盘
CN102279650A (zh) 简单规范输入法
CN101833378B (zh) 一种改进的五笔输入法及其键盘
CN100489747C (zh) 一种数字键盘汉字输入法
CN105302330A (zh) 组合式音笔类主副码汉字、词语编码输入法及其键盘
CN101086688A (zh) 和码汉字形义信息码输入法及其单手键盘
CN101145082A (zh) 大字符集顺手输入法
CN101587381B (zh) 音形汉字无重码输入法
CN101093421A (zh) 汉字的四笔层次形码及形音的数字编码输入方法
CN103176614A (zh) 多键共击速录
CN101086687A (zh) 一种首末码汉字输入方法
CN100440113C (zh) 计算机汉字输入法
CN100373307C (zh) 汉字数码的国际交流软件
CN103207685A (zh) T形汉字码输入法
CN102073382A (zh) 笔画主副部首输入法
CN100359444C (zh) 一种易学易记的汉字形码计算机输入方法
CN100568162C (zh) 一种计算机汉字输入方法
CN1331025C (zh) 拼音四角笔码(形)汉字输入法及其键盘设计
CN1125393C (zh) 利用计算机键盘汉字编码输入方法
CN106325540A (zh) 一种滇东北次方言苗文的简笔输入法及其应用
CN102929399A (zh) 一种快速拆分汉字编码输入法
CN103135788B (zh) 一种汉字四象意形输入法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20120919

Termination date: 20150412

EXPY Termination of patent right or utility model