CN1331025C - 拼音四角笔码(形)汉字输入法及其键盘设计 - Google Patents
拼音四角笔码(形)汉字输入法及其键盘设计 Download PDFInfo
- Publication number
- CN1331025C CN1331025C CNB021072078A CN02107207A CN1331025C CN 1331025 C CN1331025 C CN 1331025C CN B021072078 A CNB021072078 A CN B021072078A CN 02107207 A CN02107207 A CN 02107207A CN 1331025 C CN1331025 C CN 1331025C
- Authority
- CN
- China
- Prior art keywords
- characters
- stroke
- key
- radicals
- traditional chinese
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Document Processing Apparatus (AREA)
Abstract
本发明是中文信息处理领域里的一种汉字输入法,它成功解决了汉字输入技术中长期存在的容易学的输入速度不快,输入快的不容易学的矛盾。它采用的部首和“新华字典”全部相同,有读音有称谓的部首,几乎全都按排在和其读音声母相对应的键位上,字根“口”和汉字每二角抽取到的笔划组合,共有26种四角笔码,将汉字分成五种不同类型,采用每种类型抽取四角笔码、部首输入的顺序各不相同的技术,将重码降至极底点。它适用于各种不同层次的人,向计算机高效快速的输入汉字信息。
Description
本发明是用于中文信息领域里的一个以“新华字典”全部部首加四角笔码为基础,并和汉字声母相结合的信息处理汉字输入法以及为实施该方法必须使部首、四角笔码、声母和26个字母键建立对应关系后,四角笔码、部首、声母在键盘上形成的布局设计。
公开发表的几百种汉字输入法,基本上可以分为纯音码、形码、音形结合码三大类编码。纯音码有不需要学习,记忆量少的优点,但同时存在着单字重码多,输入慢,普通话说的不好的人和不认识的字无法输入的缺点。由王永民先生发明的“五笔字型”是一种最为典型的纯形码,五笔字型有重码少,输入快不认识的字同样能输入,特别适合于专业打字员进行汉字输入等优点,但却存在着必须拆分汉字,必须记住近二百个字根,部首和字母键的对应关系,记忆量较大,不经常进行汉字输入的人,用起来很不方便的缺点。由周志农先生发明的“自然码”是最为典型的一种音形结合码,由于引进了形码的部首、字根,单字同码现象大为改少,但必须记住一部分部首和字根同字母键的对应关系,同音码相比增加了学习难度,普通话说的不好及不认识的字,同音码一样无法输入。
本发明的目的是提出一个不但能够克服上述三大类型编码各种缺点的优秀输入法,而且再能适用于各种不同层次,不同情况,不同需要,普通话讲的差的人能使用,讲的好的更能使用,年龄大的能使用,年龄轻的更能使用,由于它记忆量极小,十分易学,所以偶尔需要输入汉字者能用,又由于其重码极少,输入简捷,专职打字员也能用它进行高速输入汉字,经过短时训练就能熟练,一旦熟练终生不忘。
我们平常使用的汉字都是有横(提)、竖、撇、捺(点)、折五大类笔划所构成的,本输入法分别用五种数码1、2、3、4、5来表示这五大类笔划,方块汉字有四个角,有可能取得4个笔码,本说明书为了便于使人了解取码过程和顺序,规定分别用①②③④为四个角所取笔码的专用符号,例“共”字①共共②本输入法优先取最高笔划,所以①②所取四角笔划组合码(即为四角笔码,下文不再特别指出)为22,③共④③④所取四角笔划组合码为34,根据附图1,22对应X键34对应于J键,“共”字属部首“八”部(B键),“共”字声母为G,所以“共”字编码为XJBG。
键盘区位划分和四角笔码在键盘上的布局。
汉字每角允许能抽取到五种笔划,二角合起来允许能得到25种笔划组合码,(四角笔码)并且字根“口”也算作一种笔划组合码其四角笔码为61,26个四角笔码分配在键盘的26个字母键上,具体分配如下:P-11,O-12,I-13,U-14,Y-15,Z-21,X-22,C-23,V-24,B-25,M-31,L-32,K-33,J-34,H-35,A-41,S-42,D-43,F-44,G-45,Q-51,W-52,E-53,R-54,T-55,N-61。26个字母键位分为6个区,1至五区每区五个键位,N单独为第6区,一区由P、O、I、U、Y五键组成,二区由Z、X、C、V、B五键组成,三区由M、L、K、J、H五键组成,四区由A、S、D、F、G五键组成,五区由Q、W、E、R、T五键组成,六个区的布局特征是一、二对顶(一、二区安置在键盘二个对顶角位置),横向平衡(最大的单数区和最小的单数区及最大的双数区和最小的双数区安排在同一横行)三、四中间(三、四区安排在键盘中间行)
汉字声母同字母键对应关系
汉语拼音中的声母CH、SH、ZH三个双字母声母,用I、U、V字母键代换,韵母YA、YAO、YE、YI……由于首字母都是y字母,所以认为这些韵母前面有个y声母,用y键表示,韵母WA、WO、WU……由于首字母都是W字母,所以认为这些韵母前都有一个W声母,用W键表示,其它只有韵母,没有声母的音节,可以认为在这些韵母前有一个零声母,用O键表示,其它声母都用和声母同样的字母键表示。
“新华字典”所采用部首在键盘上的布局
中国汉字达数万之多,各种部首字根八、九百之多。各种不同的字典所采用的部首都各不相同,各种不同的输入法,为各自编码需要,所采用的部首字根,更象万花筒似的,什么都有,广大中国人到底对哪一套部首字根最为熟悉和了解,毫无疑问,对“新华字典”所采用的那套部首最为了解,客观事实上也只有“新华字典”所采用的那套部首对汉字的划分最为规范,最为科学,最具权威。部首和字母键建立如何对应代换关系,会使记忆量降到最小极限,毫无疑问,把有读音有传统称谓的部首和其读音的声母键建立对应代换关系,例部首“木”和“木”字的声母M键,部首“亻”和“人”字的声母“R”键建立对应代换关系。少数无读音,无传统称谓的部首,按其首笔划和次笔划组成的笔划组合码,落实到相同四角笔码所对应的字母键上去,只有这样部首和字母键的对应关系的记忆量几乎降为零,本输入法采用的部首全部和“新华字典”采用的部首相同,并且大多数都是根据读音,和其对应的声母字母键建立代换关系。无读音、称谓的部首都根据其前二笔的组合码和相同四角笔码所对应键建立代换关系。部首和字母键的对应关系如下所述:
P鱼(魚)-片爿(丬)皮疋(
)髟丿,O-扌,I(CH)-虫车(車)厂臣赤齿(鹵)辰廾,U-山饣(食)礻(示)尸十水(氺)手殳矢舌豕身鼠|,Y-月(冃)衤酉又尢业用弋幺衣页(頁)羊
羽音乙聿(肀
)雨
Z-足(
)走子(孑)自攴,X-心忄
穴辛小(
)夕西(覀)血,C-艹寸采,V-竹(
)辶(
)舟止爪(
)豸隹,B-疒宀贝(貝)卜(
)冖比白鼻八(丷),N-女鸟(鳥)牛(牜
)、,M-木目麻马(馬)门(門)毛皿矛米麦(麥)黾(
L-石立力龙(龍)耒老里鹿卤(鹵),K-口囗匚冂凵彡,J-钅(金)巾己(巳)斤几
臼见(見)角,H-火禾户虍黑勹,A-日(曰)一,s-纟(糹)四厶,D-刂刀(
)大歹斗豆門,F-氵冫父风(風)方缶灬,G-讠(言)广革工弓戈瓜谷骨鬼艮(
Q-犭气犬欠青其彐(
彑),W-王亠文韦(韋)毋(母)瓦女(夂)
E-阝耳儿卩(
)二,R-亻人(入)彳廴,T-土(士)田巛,其中以下25个部首扌虫月山足艹忄竹疒女木口牛火日纟氵讠犭王阝(在左结构)石鱼亻土为正键名部首,另外下述四部部首阝(在右结构)刂心鸟为末位正键名部首,除上述28位正键名部首外,以下29部部首车、厂、饣、礻、尸、衤、酉、走、穴、辛、辶、舟、宀、贝、目、麻、马、门、立、口、禾、冫、广、革、气、亠、耳、人、牛为付键名部首,除正、付键名部首外其余全归属于普通部首。
“A”是首个英文字母,“一”是首个汉字,“日”是首个光亮庞然大物,让“A”对应于“日”、“一”,它们的自然联想关系为“三首合一”。“扌”次笔为竖钩,该笔划绝大部分为竖笔成份,钩不但在竖笔末尾,并且长度又微不足道,所以在“扌”中竖钩可以看成竖笔,因此它的前二笔笔划组合可以看作12,“氵”前二笔笔划组合为44,“讠”二笔划组合为45,分别将以上三部首和四角笔码12、44、45对应的O、F、G建立对应关系。它们的自然联想关系是和前二笔划相同的四角笔码建立代换关系。石去掉首笔前二笔的组合为32对应L键“鱼取最后二笔,笔划组合为11对应P键。它们的自然联想关系为“石鱼去首取尾”。E键对应部首首字母都是E,自然联想关系是和拼音首字母键建立对应关系。“冫”跟同“氵”同F键建立对应关系。其它部首全都根据读音和其声母对应的字母键建立代换关系。(汉字的声母、部首和四角笔码同26个字母键的对应代换关系详见说明书附图2。)
抽取四角笔码方法
(一)取角顺序
书写汉字一般讲左右结构汉字(包括左中右结构)总是先写左上角,次写左下角,再写右上角,后写右下角,非左右结构汉字一般总是先写左上角,次写右上角,再写左下角,后写右下角,本输入法为了顺手,取角顺序和书写顺序相同。
1)左右结构汉字(包括左中右结构)先取左上角,次取左下角,再取右上角,后取右下角。例:① ②数 数③ ④
2)非左右结构汉字先取左上角,次取右上角,再取左下角,后取右下角。例:①单② ③单④
3)一笔划汉字①②中的②重复取该笔划,取完①②取码工作就告结束。
二笔划汉字①②取完二笔划,取码工作就告结束。三笔划汉字,取完三笔后④可以按照取码原则重复取①②③已取过的笔划,四笔划汉字和四笔划以上汉字,凡被他角取过的笔划不再重复取了。
例:①一一②所以“一”的四角笔码为11。①十十②所以“十”的四角笔码为21。①土土② ③土土④④重复取③已经取过的横笔划,所以“土”的四角笔码为2111。
(二)1)取四角笔码时,上角优先取最高笔划,当汉字有几个笔划同属最高笔划时,左上角优先取拥有最高最左点的那一笔划,右上角优先取拥有最高最右点的那一笔划,同理下角优先取最底笔划,左下角优先取拥有最底最左点的那一笔划,右下角优先取拥有最底最右点的那一笔划。例“王”字最上面的一横一竖,同属最高笔划,但最高最左点在上面的一横上,所以①取一横,由于横笔也被它角取走②就只能取余下的一竖,因此“王”字①②所组成的四角笔码为12。
2)当最高最左点为二笔划共有时,左上角优先取不但拥有最高最左点,而且兼顾尽量优先取靠近汉字左边缘的那一笔划,例:①日②字,①取竖笔划因为此笔划不但拥有最高最左点,并且是汉字左边缘笔划,②取余下的折笔划,所以日字①②所组成的四角笔码为25。
3)当最高最左点为二笔划共有,但二笔划都是不靠近汉字左边缘的笔划,达时左上角优先取不但拥有最高最左点,而且兼顾优先取靠近汉字上边缘的笔划,例“又”字①又②二笔划虽然都拥有最高最左点,但笔划走向都是远离左边缘而去,而其中折笔划,有一部分处在汉字的上边缘位置上,所以①取折笔②取捺笔“又”字的四角笔码为54。
(三)上下结构汉字中的上角优先取上结构,只有上结构笔划取完后才能抽取中结构或下结构中的笔划,下角优先取下结构笔划,只有在下结构笔划取完后,才能到中结构或上结构中抽取笔划,同理左右结构中的左角只能取左结构中笔划,只有左结构笔划取完后,才能到中结构或右结构中抽取笔划,右角只能取右结构中笔划,只有右结构取完后才能到中结构或左结构中抽取笔划,例,“发”字,①发②①取上结构中的折②取上结构中的点③发④③取下结构“又”字中的折笔,因为“又”字旁的撇是上结构中笔划,③是下角不应取上结构中延伸下来的撇笔④取捺笔,所以“发”字四角笔码为5454,例“丝”字①丝②①取折笔②取折笔③丝④③取横笔④因为下结构笔划已取完只能到上结构中抽取笔划所以④取折笔因此“丝”字四角笔码为5515。
(四)当中起笔的撇,下角有它笔者(他笔的起笔必须底于撇)优先取他笔,例“裁”字衣中的竖钩起笔低于撇,所以③裁“裁”字③取竖钩为所取笔划,而“栽”字中的部首“木”中的竖笔因为其起笔高于撇的起笔,所以竖笔划不能认为是撇的下角笔划,所以“栽”字③栽③取撇笔划为所取笔划。
(五)笔划从最高部位起笔,到最底部位止笔,这类笔划称作通长笔划,例“中”字中居中的一竖就是通长笔划。笔划上面只有一个点笔划,下面直到汉字下边缘,或从汉字上边缘起,下面只有半个撇笔划,这类笔划称作次通长笔划,例“市”和“少”字中间的一竖为次通长笔划,笔形冫ㄑ八、丷同通长笔划或次能长笔划单独相处时,优先取通长笔划,例“小”字①小因为笔形“八”和通长笔划单独相处,所以①取居中的竖笔,例“木”字中的笔形“八”同居中的竖笔就属于不单独相处,因为竖笔的上下方向除笔形“八”外再有一横笔划,笔形“八”最多也只能讲和竖笔划的下半部分单独相处。例“米”字上部笔形丷显然同通长竖笔划不单独相处所以①米①取笔形“丷”中的点笔划。
2)笔形“冫、
、八、丷、”同非通长笔划和非次通长笔划相处优先取笔形“冫、
、八、丷、”的笔划,例“兆”字“冫”同通长笔划撇单独相处,笔形“
同通长笔划折单独相处,所以“兆”字①兆②①②抽取通长笔划撇和折四角笔码为35,而“
”字笔形“冫”和“
”相处的不是通长笔划,也不是次通长笔划,所以① ②①取“冫”中的点划②取笔形“
”中的撇因此“
”字的①②组成的四角笔码为43。
(六)①和③取到部件“口”时即以61作为“口”的四角笔码,但当②④取到“口”时,由于前一码也被他角取走,这时字元“口”只能取61后面的1个,例“韶”字,① ②韶①取点笔划,②取竖笔划,韶③ ④③取折笔④由于③已取了折笔所以④只能取61中的1,因此“韶”字四角笔码为4251。
汉字编码方法
(一)正键名部首所属汉字编码方法:
本输入法共设立了二十八部正键名部首,其中3部半为末位正键名部首(“心”“刂”“鸟”和半部“阝”)本节所讲的正键名部首实际上去掉了3部半部首后再剩二十四部半,它们都是一批最常见的部首。本输入法对正键名部首是不进行抽取四角笔码的,(正键名部首享受此项特权,本输入法称其为抽取四角笔码豁免权下文不再特别说明)当汉字属于正键名部首时,第一键首先输入和正键名部首相对应的字母键(正键名部首享受此项特权,本输入法称之为优先输入权。在左右结构汉字中只有正键名独占整个左结构,在上下结构汉字中只有正键名部首独占整个上结构时,才享受上项所说的豁免权和优先输入权,对此下文不再特别说明)正键名部首所属汉字编码具体形式是(正键名部首对应字母键)+(去掉正键名部首余下部分第1第2二角所取笔划组合码所对应字母键)+(去掉正键名部首余下部分第3第4二角所取组合笔划码所对应字母键)+(汉字声母对应的字母键)去掉正键名部首余下部分是左右结构就按左右结构顺序抽取笔划,余下部分为非左右结构时就按非左右鲒构顺序取码,去掉正键名部首,余下部分不够①②③④抽取笔划,就按照前面所述一、三笔划汉字一样,采用重复取码解决,而决不能因为笔划不够而转向享受豁免权的键名部首上去抽取笔划,例:“亿”“亻”刘应于R键,①乙②“乙”的四角笔码为55对应于T键,“亿”声母为Y对应于Y键所以“亿”的编码为RTY。
正键名部首所属汉字编码实例表
汉字 | 部首及键位 | 余下部分①②组合笔划码所对应的字母键 | 余下部分③④组合笔划码所对应的字母键 | 汉字声母对应字母键 | 汉字编码字母 |
佣 | 亻R | ①用②35H | ③用④21Z | Y | RHZY |
员 | 口K | ①贝②25B | ③贝④34J | Y | KBJY |
猢 | 犭Q | ① ②胡21Z | 胡③ ④53E | H | QZEH |
媒 | 女N | ①某②22X | ③某④34J | M | NXJM |
(二)末位正键名部首所属汉字编码方法:
本输入法设立三部半末位正键名部首,它们是“刂”、“心”、“鸟”和“阝”,末位正键名部首不是随便设立的,而是有一定道理、依据的,它们之中前三位部首,几乎全部只是在汉字书写结束前,最末书写完的一个部首,部件“阝”在左结构中,属于上述24部半中的一个正键名部首,在右结构中也是最末书写完成的一个部首,所以“阝”只能算半部末位正键名部首,末位正键名部首由于其不处在汉字最显眼部位(本输入法所说最显眼部位是指左右结构汉字的左结构,上下结构汉字中的上结构)所以不享受优先健入权,但它们必竟有着键名部首的名份,所以仍享受抽取四角笔码豁免权(在末位正键名部首独占整个下结构,或独占整个右结构的情况下,才享受抽取四角笔码豁免权)末位正键名部首所属汉字,具体编码形式是(去掉末位正键名部首,余下部分第1第2二角所取组合笔码所对应字母键)+(去掉末位正键名部首余下部分第3第4二角所取组合笔码所对应字母键)+(末位正键名部首所对应的字母键)+(汉字声母所对应的字母键)
末位正键名部首所属汉字取码实例表
汉字 | 去掉末位键名部首余下部分①②所取组合笔码对应键位 | 去掉末位键名部首余下部分③④所取笔码所对应键位 | 末位正键名部首对应字母键 | 汉字声母对应键位 | 汉字编码字母 |
刑 | ①开②12 O | ③开④31 M | 刂 D | X | OMDX |
悬 | ①县②25 B | ③县④54 R | 心 X | X | BRXX |
鸭 | ①甲②25 B | ③甲④21 Z | 鸟 N | Y | BZNY |
邻 | ①令②34 J | ③令④45 G | 阝 E | L | JGEL |
(三)付键名所属汉字编码方法
本输入法设有29部付键名部首,它们大部分有较常见的部首组成,但由于“饣”、“宀”等常见部首无法安置到正键名部中,而“走”、“麻”等不常见部首由于容易产生同码,无法安置到普通部首中去,所以在付键名部首中夹有一部分常见和不常见部首,记住这29部部首后,凡常见部首不在这29部中,必为正键名部首,不常见部首不在这29部中必为普通部首。当付键名部首独占整个上结构或左结构时,享受优先键入权和抽取四角笔码不完全豁免权(只抽取付键名部首左上角后,不再在付键名部首中抽取任何笔划,将此称作为不完全豁免权),和正键名部首所属汉字相比,余下部分①②③就变成②③④。例,“炮”字,优先键入正键名部首“火”(H键)后余下部分取码顺序为①包②,③包④例“饱”字优先键入付键名部首饣(U)键后,取码顺序①饱,②包④包③。
付键名部首所属汉字编码具体形式是(付键名部首对应字母键)+(付键名部首左上角和去掉付键名部首余下部分第2角二角所取组合笔划码所对应的字母键)+(去掉付键名部首余下部分第3第4二角所取组合笔划码所对应字母键)+(汉字声母对应字母键)
付键名部首所属汉字编码实例
汉字 | 付键名部首对应字母键 | 付键名部首①和余下部分②所取组合笔划码所对应字母键 | 余下部分第3第4二角所取组合笔划码所对应字母键 | 汉字声母对应字母键 | 汉字编码字母 |
饱 | 饣U | ①饱②包33K | ④包③55 T | B | UKTB |
店 | 广G | ①店②占42S | ④占③11 P | D | GSPD |
宝 | 宀B | ①宝②玉41A | ④玉③21 Z | B | BAZB |
睛 | 目M | ①睛②青22X | ④青③12 O | J | MXOJ |
(四)键名部首编码方法
本输入法共设置57部键名部首,由于正付键名部首都享受着抽取四角笔码豁免权和不完全豁免权,所以被抽取的笔划大部分在键名部首以外的余下部分中抽取,现在要为键名部首自身编码,由于不存在余下部分,所以豁免权也失去了存在的条件,因此键名部首编码,四角笔码势必在键名部首自身抽取,键名部首编码具体形式是(键名部首所对应的字母键)+(键名部首第1第2二角所取组合笔划码所对应的字母键)+(键名部首第3第4二角所取组合笔划码所对应的字母键)+(键名部首读音声母对应的字母键)
键名部首编码实例表
键名部首 | 键名部首对应字母键 | 键名部首第1第2二角所取组合笔划码所对应的字母键 | 键名部首第3第4二角所取组合笔划码所对应的字母键 | 键名部首读音声母对应的字母键 | 键名部首编码字母 |
王 | W | ①王②12 O | ③王④11 P | W | WOPW |
月 | Y | ①月②35 H | ③月④11 P | Y | YHPY |
亻 | R | ①亻②32 L | 根据取码原则③④取不到笔划 | R | RLR |
宀 | B | ①宀②45 G | ③宀④45 G | B | BGGB |
注:(本输入法汉字编码字母不足四键,后面追加空格键,所以部首“亻”编码字母后再须键入空格键,类似情况下文不作特别说明)。
(五)普通部首和普通部首所属汉字编码方法。
除键名部首外其余全是普通部首,它们都是不常见部首,普通部首不享受优先键入权,不享受抽取四角笔码豁免权,其输入编码具体形式是(汉字第1第2二角所取组合笔划码所对应键位)+(汉字第3第4二角所取组合笔码所对应键位)+(普通部首对应键位)+(汉字声母对应键位)
普通部首和普通部首所属汉字编码实例
汉字 | 第1角第2角二角所取组合笔划码对应字母键 | 第3角第4角二角所取组合笔划码对应字母键 | 普通部首对应字母键 | 汉字声母对应字母键 | 汉字编码字母 |
方 | ①方②41 A | ③方④35 H | 方F | F | AHFF |
八 | ①八②34 J | 根据取码规则③④取不到笔划 | 八B | B | JBB |
功 | ① ②功11 P | 功③ ④35 H | 工G | G | PHGG |
栽 | ①栽②24 V | ③栽④35 H | 木M | Z | VHMZ |
“栽”字中的“木”部首不在最显眼位置实际上已降为普通部首。以上五种汉字在输入部首、四角笔码抽取四角顺序均有所不同,从而使重码率降到极底水平。
(六)词组编码方法
1)二字词组:取每字前二位编码字母作为词组码,例“方”字前二位字母为AH,“法”字前二位字母为FZ,所以“方法”词组码为AHFZ。
2)三字词组:前二字各取单字编码字母的首字母,最后一字取其单字编码字母前二位字母,有上述四个字母构成词组码,例“电”字首字母为T,“视”字首字母为U,第三个“机”字前二个字母为MH,所以“电视机”词组码为TUMH。
3)四字词组:取每个字的首字母为编码字母,例“新”字第一码为D,“华”字第一码为K,“字”字第一码为B,“典”字第一码为X,所以“新华词典”词组码为DKBX。
4)四字以上词组,取前三个字和后一个字的首字母为词组码,例“专”字首字母为Q,“利”字首字母为L,“事”字首字母为Q,“所”字首字母为K,所以专利事务所的词组码为QLQK。
不认识的字和声母不能确定的字的输入方法
本输入法凡属国标(GB-2312)一、二级6763个常用汉字,在单字输入时,最后一位编码字母,都是和该汉字声母所对应的字母键,即使普通话水平很差的人,一般说来大部分汉字声母总能够确定的,万一有些字读不准,声母无法确定,或个别字不认识,本输入法也能克服上述困难的。例如现在要将“真”字输入计算机,我们假设操作者读不准其声母,或索性假设操作者不认识“真”这个字,根据直观判断,操作者很快能确定该字四角笔码为2134(对应字母为ZJ)归属于普通部首“十”(U键),当操作者输入ZJU后,由于不知该字声母,势必要作一短暂停顿,输入第三字母U后大约隔0.8秒,提示行显示,“真”汉拼ZHEN,“卖”汉拼MAI(该功能由软件自动完成,0.8秒大约是注意力从键盘或计算机屏幕移向提示行所需要时间)根据提示行,操作者只要键入和声母ZH对应的V键,“真”字就输入计算机,提示行显示“真”和“卖”二字说明在国标(GB-2312)6763个汉字中四角笔码属于2134,部首属于“十”部的只有“真”和“卖”二字。而大部分汉字,在输入前三个形码字母后,唯一性已被确定。
汉字部首不能确定时的输入方法
当键名部首享受优先键入权,抽取四角笔码豁免权时,不可能产生不能确定部首的麻烦事,因为这时的键名部首都独占着显眼的位置,而普通部首不但数量多,而且又不显眼,所以在输入普通部首所属汉字时,往往会遇到不能确定汉字归属于什么部首的困难,为解决此困难,本输入法特地设计了一个普通部首学习键,汉语拼音原有声母,加上本输入法定义的W、Y、O声母共计有二十四声母,因此声母位上再余下二键,当原声母位上代表声母的字母转移到原形码部首位上,而余下二键中的一键或利用其它非字母键位。(本输入法为A键)在声母位置上键入时该键即为部首学习键,使用部首学习键的具体形式(汉字第1第2二角所取组合笔划码所对应字母键)+(汉字第3第4二角所取笔划组合码所对应字母键)+(汉字声母对应字母键)+A键(部首学习键)
例在不知“共”字归何部首的情况下输入“共”字其四角笔码为2234(XJ)声母G,输入XJGA,A键出现在最后一位(声母位),其功能相当于在询问,现在输入四角笔码为2234声母为G,请提示该汉字归属何部首,键入A键后,提示行立刻显示1)共(八部)2)恭(忄部),也就是说在国标(GB-231 2)中只有共和恭二字符合四角笔码为2234,声母为G这个要求,键入序号1“共”字就输入计算机,设置部首学习键也可以换一种形式理解本输入法声母输入位上的对应关系是汉语拼音原有21个声母加上本输入法定义的Y、W、O声母,再余下二个键位没有对应声母,为了克服不常见部首难于确定的困难本输入法设计了一种不常见部首所属汉字的备用编码,原声母对应字母键安置在不能确定的部首码位置上,为了使大量的备用码和正式编码不发生混淆不产生同码,所以原声母位有余下二键中的一键代替(本输入法为A键),其表示具体形式是(汉字第1第2二角所取组合笔划码所对应字母键)+(汉字第3第4二角所取组合笔划码所对应字母键)+(汉字声母对应字母键)+A键。这样一来所有普通部首所属汉字就有了二个编码形式例“共”字正式编码为XJBG备用编码为XJGA,能够知道其正确部首,用正式编码输入当然最好,不能确认其部首就用备用编码输入,用备用编码发生同码的情况虽然多了一些,但看一看提示行总比瞪着眼干着急好的多,总比寻找字典确认部首简捷的多。
国标(GB-2312)外汉字输入方法
国标(GB-2312)装有6763个一二级常用汉字,一般来讲祖国大陆这些字已经够用了,但考虑到我国台湾省及港、澳特区流行的繁体字,以及国际上韩国、日本、新加坡也使用一部分汉字,考虑到我国进一步的开放改革和整个汉字文化圈的需要和交流可以说国标(GB-2312)内6763个汉字是无法满足上述要求的,92年汉字文化圈有关国家有关地区的学者经过协商,终于建立了国际通用的装有21003个汉字的计算机用汉字大字符集。国标(GB-2312)6763个常用汉字也全部装入这个大字符集,因此除6763个祖国大陆常用汉字外,在大字符集中还有14240个汉字,(本文说的国标外汉字就是这14240个汉字),为了输入国标外汉字,本输入法设计了一个国标外汉字寻找键,汉语拼音原有声母加上本输入法定义的Y、W、O声母和部首学习键再余下一键或利用其它非字母键位。(本输入法E键)当该键在声母位上键入时(本输入法声母位在编码最后一位)该键即为国标外汉字寻找键,国标外汉字寻找时有三个形码键,取码原则和国标内汉字全部一样,唯一不同的是国标内汉字最后一键,键入的是汉字声母所对应字母键,而14240个国标外汉字最后一键,键入的都是E键。例有一个国标外汉字,上结构为“氏”字下结构为“十”字(该字大字符集内码为9ADC)因为①氏②①②为35③十④③④为21,所以该国标外汉字四角笔码为3521(HZ)归属“十”部(U键),当键入HZU0.8秒后提示行显示
(汉拼FU)“卑”(汉拼BEI),也就是说在国标6763个汉字中四角笔码为3521(HZ)归属“十”部的只有
和“卑”二字,国标内汉字没有势必只能到国标外汉字中去寻找,在三键形码键HZU后再键入国标外汉字寻找键E后,提示行立刻显示国标外的四角笔码为3521,归属于“十”部的四个国标外汉字,其中序号为2的就是需要寻找输入的上结构为“氏”下结构为“十”的国标外汉字,E键在声母位(本输入法为最后一位)键入时,它的功能相当于经查国标内汉字中凡符合四角笔码为3521,部首归属于“十”部的汉字中,没有要查找的汉字,请将国标以外的凡四角笔码属于3521部首归属于“十”部的汉字显示到提示行。
关于国标外汉字寻找键也可以换一种角度理解:本输入法声母输入位上的对应关系是汉语拼音原有21个声母加上本输入法定义的Y、W、O声母和部首学习键后再余下一键。(本输入法为E键),为了避免国标内和国标外汉字在编码时产生同码情况,本输入法设计了一种国标外汉字编码方式,国标外汉字前几位形码取码原则和方法全部和国标内汉字相同,不同的是国标内6763个汉字声母位上键入和声母相对应的字母键,而国标外汉字全部键入上面所述的余下一键。(本输入法为E键)这样1万四千多个国标外汉字实际上只有三个形码键在分化离散同码现象,这样在国标外汉字中势必产生大量的同码现象,象上述的一个编码为HZUE的国标外汉字也发生了4字同码现象,既然有同码计算机软件就自动在提示行显示,从而达到了寻找和输入的目的。采用国标(GB-2312)外汉字寻找键的方法,为我国汉字输入技术成功地解决了,在输入6763个常用汉字时,在不增加它们的重码和码长的情况下,使1万四千多个国标外汉字也能顺利地输入计算机。本输入法将全部国标外汉字划分为下列四种情况。
(1)当汉字归属于正键名部首时,编码具体形式是:
(正键名部首对应字母键)+(去掉正键名部首余下部分第1第2二角所取组合笔划码所对应的字母键)+(去掉正键名部首余下部第3第4二角所取组合笔划码所对应的字母键)+E键。
(2)当汉字归属于末位正键名部首时,编码具体形式是:
(去掉末位正键名部首余下部分第1第2二角所取笔划组合码所对应的字母键)+(去掉末位正键名部首余下部分第3第4二角所取笔划组合码所对应的字母键)+(末位正键名部首所对应的字母键)+E键。
(3)当汉字归属于付键名部首所属汉字时编码具体形式是:
(付键名部首对应字母键)+(付键名部首左上角和去掉付键名部首余下部分第2角二角所取笔划组合码所对应的字母键)+(去掉付键名部首余下部分第3第4二角所取组合笔划码所对应的字母键)+E键。
(4)当汉字归属于普通部首所属汉字时,编码具体形式是:
(汉字第1第2二角所取笔划组合码所对应的字母键)+(汉字第3第4二角所取笔划组合码所对应的字母键)+(普通部首所对应的字母键)+E键。
Claims (3)
1一种拼音四角笔码(形)汉字输入法其特征在于:
A汉语拼音中的声母,仅三个双字母声母和其它字母键建立对应代换关系,ch对应于I键,sh对应于U键,zh对应于V键,韵母YA、YAO、YE、YI……由于首字母都是y字母,所以认为这些韵母前有一个y声母,用y键表示,韵母WA、WO、WU……由于首字母都是W字母,所以认为这些韵母前都有一个W声母,用W键表示,其它没有声母的韵母音节,其声母用O键表示,
B本输入法规定全部汉字有横、竖、撇、捺、折五种笔划构成,并用1、2、3、4、5五种数码代表,汉字每角允许能抽取到五种笔划,二角合起来允许能取得25种笔划组合码,并且字根“口”也算作一种笔划组合码其四角笔码为61,26个四角笔码分配在普通英文键盘的26个字母键上,具体分配如下:
P-11,O-12,I-13,U-14,Y-15,Z-21,X-22,C-23,V-24,B-25,M-31,L-32,K-33,J-34,H-35,A-41,S-42,D-43,F-44,G-45,O-51,W-52,E-53,R-54,T-55,N-61
C本输入法选取“新华字典”的全部部首为基本输入部首,凡有读音和传统称谓的部首,大多数都安排在和其读音所对应的声母键位上,少数不和其声母键位对应的部首,它们和自己的对应键位都保持着一种自然联想关系,没有读音和称谓的部首全都根据其前二个笔划的组合码安排在相同四角笔码所对应的键位上,全部部首分配在普通英文键盘的26个字母键上,具体分配如下:
P-鱼魚、片、爿丬、皮、疋
、 丿,O-扌,I-虫、车車、厂、臣、赤、齿
、辰、廾,U-山、饣食、礻示、尸、十、水
手、殳、矢、舌、豕、身、鼠、丨,Y-月
、衤、酉、又
、尢、业,用、弋、幺、衣、页頁、羊
羽、音、乙、聿
肀、雨
Z-足
、走、子孑、自、
X-心、忄
、穴、辛、小 、夕、西覀、血,C-艹、寸、采,V-竹、辶、
舟、止、爪爫 、豸、隹,B-疒、宀、贝貝、卜、冖、比、白、鼻、八丷,N-女、鸟鳥、牛牜
丶,M-木、目、麻、马馬、门門、毛、皿、矛、米、麦麥、黾黽,L-石、立、力、龙龍、耒、老、里、鹿、卤鹵,K-口、囗、匚、冂、凵、彡,J-钅 金、巾、己巳、斤、几
、臼、见見、角,H-火、禾、户、虍、黑、勹,A-日曰、一,S-纟糹、四、厶,D-刂、刀ク、大、歹、斗、豆、
F-氵、冫、父、风風、方、缶、灬,G-讠言、广、革、工、弓、戈、瓜、谷、骨、鬼、艮
Q-犭、气、犬、欠、青、其、彐
彑,W-王、亠、文、韦韋、毋母、瓦、攵夂、
E-阝、耳、儿、卩
二,R-亻、人入、彳、廴,T-土士、田、巛,其中以下25个部首扌、虫、月、山、足、艹、忄、竹、疒、女、木、口、钅、火、日、纟、氵、讠、犭、王、阝、石、鱼、亻、土为正键名部首,另外下述四部部首阝刂、心、鸟为末位正键名部首,除上述28位正键名部首外,以下29部部首车、厂、饣、礻、尸、衤、酉、走、穴、辛、辶、舟、宀、贝、目、麻、马、门、立、囗、禾、冫、广、革、气、亠、耳、人、牛为付键名部首,除正、付键名部首外其余全归属于普通部首,
D根据上述四角笔码,部首、声母和字母键位的对应关系,输入汉字,并将全部汉字,划分为下列五种汉字,每种类型的汉字四角笔码,抽取部首,取角顺序均有所不同,
(一)当汉字归属于正键名部首时,编码具体形式是:
正键名部首对应字母键+去掉正键名部首余下部分第1第2二角所取组合笔划码所对应的字母键+去掉正键名部首余下部分第3第4二角所取笔划组合码所对应的字母键+汉字声母所对应的字母键
(二)当汉字归属于末位正键名部首时,编码具体形式是:去掉末位正键名部首余下部分第1第2二角所取组合笔划码所对应的字母键+去掉末位正键名部首余下部分第3第4二角所取组合笔划码所对应的字母键+末位正键名部首所对应的字母键+汉字声母对应的字母键
(三)当汉字归属于付键名部首所属汉字时编码具体形式是:
付键名部首对应字母键+付键名部首左上角和去掉付键名部首余下部分第2角二角所取组合笔划码所对应的字母键+去掉付键名部首余下部分第3第4二角所取组合笔划码所对应的字母键+汉字声母所对应的字母键
(四)正付键名部首单独输入计算机时,编码具体形式是:
键名部首所对应的字母键+键名部首第1第2二角所取组合笔划码所对应的字母键+键名部首第3和第4角所取组合笔划码所对应的字母键+键名部首读音声母所对应的字母键
(五)当汉字归属于普通部首和普通部首所属汉字时,编码具体形式是:
汉字第1第2二角所取笔划组合码所对应的字母键+汉字第3第4二角所取笔划组合码所对应的字母键+普通部首所对应的字母键+汉字声母所对应的字母键
E词组的输入是建立在单个汉字输入的基础上进行的,词组输入时,按下列四种不同情况进行编码输入:
(一)当词组为二字词组时,其编码形式是,每个字的前二个编码字母为输入编码,
(二)当词组为三字词组时,其编码形式是,前二个字的第一个编码字母和后一个字的前二个编码字母为输入编码,
(三)当词组为四字词组时,其编码形式是,每个字的第一个编码字母为输入编码,
(四)当词组中的汉字数超出四个汉字时,其编码形式是词组前三个字和最后一个字,这四个字每个字的第一个编码字母,为输入编码
F抽取四角笔码的技术特征如下:
(一)取角顺序
1)左右结构汉字,先取左上角,次取左下角,再取右上角,后取右下角,
2)非左右结构汉字先取左上角,次取右上角,再取左下角,后取右下角,
3)一笔划汉字第1、第2二角中的第二角重复取该笔划,取完第1、第2二角取码工作就告结束,
二笔划汉字第1、第2二角取完二笔划,取码工作就告结束。三笔划汉字,取完三笔后,第4角可以按照取码原则重复取前三角已取过的笔划,四笔划汉字和四笔划以上汉字,凡被他角取过的笔划不再重复取了,
(二)1)取四角笔码时,上角优先取最高笔划,当汉字有几个笔划同属最高笔划时,左上角优先取拥有最高最左点的那一笔划,右上角优先取拥有最高最右点的那一笔划,同理下角优先取最底笔划,左下角优先取拥有最底最左点的那一笔划,右下角优先取拥有最底最右点的那一笔划,
2)当最高最左点为二笔划共有时,左上角优先取不但拥有最高最左点,而且兼顾尽量优先取靠近汉字左边缘的那一笔划,
3)当最高最左点为二笔划共有,但二笔划都是不靠近汉字左边缘的笔划,这时左上角优先取不但拥有最高最左点,而且兼顾优先取靠近汉字上边缘的笔划,
(三)上下结构汉字中的上角优先取上结构,只有上结构笔划取完后才能抽取中结构或下结构中的笔划,下角优先取下结构笔划,只有在下结构笔划取完后,才能到中结构或上结构中抽取笔划,同理左右结构中的左角只能取左结构中笔划,只有左结构笔划取完后,才能到中结构或右结构中抽取笔划,右角只能取右结构中笔划,只有右结构取完后才能到中结构或左结构中抽取笔划,
(四)当中起笔的撇,下角有它笔,优先取他笔,他笔的起笔必须底于撇,
(五)1)笔形“冫、
八、丷”同通长笔划或次通长笔划单独相处时优先取通长笔划,
(六)第1第3二角取到部件“口”即以61作为“口”的四角笔码,但当第2第4二角取到“口”就只能取61后面的1了。
2根据权利要求1所述的一种拼音四角笔码(形)汉字输入法,当汉字归属普通部首和普通部首所属汉字时,其特征进一步包括设计了一个部首学习键,并利用该键创造了一种在不能确定汉字部首归属时,仍能输入汉字的方法,汉语拼音中有21个声母,加上本输入法定义的Y、W、O三个声母,共计有24个声母,本输入法在输入人们最常用的国标一、二级6763个汉字时编码最后一码都是代表汉字声母的声母码,为了充分利用余下的二键,在余下二键之中的一键或利用其它非字母键位,设立为部首学习键,本输入法把A键设立为部首学习键,由于不能确定部首归属的汉字都是普通部首所属汉字,其输入方法是按照普通部首所属汉字输入时,在原输入部首位置上,改换输入汉字声母,而在编码最后一位键位上键入A键即成,其编码表示形式为:汉字第1第2二角所取笔划组合码所对应的字母键+汉字第3第4二角所取笔划组合码所对应的字母键+汉字声母所对应的字母键+A键。
3根据权利要求1所述的一种拼音四角笔码(形)汉字输入法,当汉字属于正键名部首所属汉字、当汉字属于末位正键名部首所属汉字、当汉字属于付键名部首所属汉字、当汉字属于普通部首和普通部首所属汉字时,其特征进一步包括设计了一个国标外汉字寻找键,并利用该键创造了一种能把国标一、二级6763个常用汉字以外的任何国标外汉字轻易输入计算机的方法,汉语拼音中有21个声母,加上本输入法定义的y、w、o三个声母,共计有24个声母,本输入法在输入人们最常用的国标一、二级6763个汉字时,编码最后一码都是代表汉字声母的声母码,为了充分利用余下的二键,在余下二键之中的一键或利用其它非字母键位设立国际外汉字寻找键,本输入法把E键设立为国标外汉字寻找键,输入国标外汉字时,其前三键完全和国标一、二级6763个汉字采用一样的编码原则输入,不同的是最后一键在声母码位上,国标外汉字全部输入E键,并将全部国标外汉字,划分为下列四种情况:
(一)当汉字归属于正键名部首时,编码具体形式是:
正键名部首对应字母键+去掉正键名部首余下部分第1第2角所取组合笔划码所对应的字母键+去掉正键名部首余下部分第3第4二角所取笔划组合码所对应的字母键+E键,
(二)当汉字归属于末位正键名部首时,编码具体形式是:
去掉末位正键名部首余下部分第1第2二角所取笔划组合码所对应的字母键+去掉末位正键名部首余下部分第3第4二角所取组合笔划码所对应的字母键+末位正键名部首所对应的字母键+E键,
(三)当汉字归属于付键名部首所属汉字时,编码具体形式是:
付键名部首对应字母键+付键名部首左上角和去掉付键名部首余下部分第2角二角所取笔划组合码所对应的字母键+去掉付键名部首余下部分第3第4二角所取组合笔划码所对应的字母键+E键,
(四)当汉字归属于普通部首所属汉字时,编码具体形式是:
汉字第1第2二角所取笔划组合码所对应的字母键+汉字第3第4二角所取笔划组合码所对应的字母键+普通部首所对应的字母键+E键。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CNB021072078A CN1331025C (zh) | 2002-03-07 | 2002-03-07 | 拼音四角笔码(形)汉字输入法及其键盘设计 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CNB021072078A CN1331025C (zh) | 2002-03-07 | 2002-03-07 | 拼音四角笔码(形)汉字输入法及其键盘设计 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN1480823A CN1480823A (zh) | 2004-03-10 |
CN1331025C true CN1331025C (zh) | 2007-08-08 |
Family
ID=34141806
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNB021072078A Expired - Fee Related CN1331025C (zh) | 2002-03-07 | 2002-03-07 | 拼音四角笔码(形)汉字输入法及其键盘设计 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN1331025C (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107908295A (zh) * | 2017-11-16 | 2018-04-13 | 陈俞茜 | 一种输入法 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1056007C (zh) * | 1997-08-01 | 2000-08-30 | 黄有文 | 一种以汉字音角特征为信息元的计算机汉字输入方法 |
CN1063555C (zh) * | 1996-08-31 | 2001-03-21 | 刘瑞祥 | 汉字三维三码字词兼容输入法 |
-
2002
- 2002-03-07 CN CNB021072078A patent/CN1331025C/zh not_active Expired - Fee Related
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1063555C (zh) * | 1996-08-31 | 2001-03-21 | 刘瑞祥 | 汉字三维三码字词兼容输入法 |
CN1056007C (zh) * | 1997-08-01 | 2000-08-30 | 黄有文 | 一种以汉字音角特征为信息元的计算机汉字输入方法 |
Also Published As
Publication number | Publication date |
---|---|
CN1480823A (zh) | 2004-03-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101183279B (zh) | 一种电脑/手机统一的形音码汉字键盘输入方法 | |
CN105938402A (zh) | 一种声形码汉字输入法及键盘 | |
CN103838392B (zh) | 高频词语并全部汉字快易的键盘、手写、语音输入法 | |
CN102073386A (zh) | 一种象形会意分类字根的汉字计算机输入法 | |
CN1331025C (zh) | 拼音四角笔码(形)汉字输入法及其键盘设计 | |
CN101872249A (zh) | 双拼双形输入法 | |
CN100478853C (zh) | 和码汉字形义信息码输入法 | |
CN101813978A (zh) | 音义码汉字输入法 | |
CN101593031B (zh) | 低重码繁简汉字规则副根首异末移输入法 | |
CN1746829A (zh) | 优化汉字根码输入法 | |
CN1101569C (zh) | 音形码汉字输入方法 | |
CN1020386C (zh) | 结构笔画四位数编码法及键盘 | |
CN100375947C (zh) | 30键认知码汉字输入方法 | |
CN100373307C (zh) | 汉字数码的国际交流软件 | |
CN100397310C (zh) | 标准汉字输入法 | |
CN111459296B (zh) | 形拼意汉字输入方法及电子设备 | |
CN101833378B (zh) | 一种改进的五笔输入法及其键盘 | |
CN1204487C (zh) | 根声码汉字输入法 | |
CN101241403B (zh) | 一种部件汉字编码输入方法及其相应键盘 | |
CN1025804C (zh) | 汉字全息码计算机输入系统 | |
CN100568162C (zh) | 一种计算机汉字输入方法 | |
CN101872248A (zh) | 直接输入辅助码的拼音输入法 | |
CN1066272C (zh) | 六笔十矩阵计算机汉字输入方法及其键盘 | |
CN102955576A (zh) | 计算机汉字输入半边字法 | |
CN1078717C (zh) | 全汉字定义码输入法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
C17 | Cessation of patent right | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20070808 Termination date: 20100307 |