CN1068684C - 一种计算机键盘形象码汉字输入法 - Google Patents
一种计算机键盘形象码汉字输入法 Download PDFInfo
- Publication number
- CN1068684C CN1068684C CN95104165A CN95104165A CN1068684C CN 1068684 C CN1068684 C CN 1068684C CN 95104165 A CN95104165 A CN 95104165A CN 95104165 A CN95104165 A CN 95104165A CN 1068684 C CN1068684 C CN 1068684C
- Authority
- CN
- China
- Prior art keywords
- word
- code
- chinese character
- codes
- character
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Landscapes
- Document Processing Apparatus (AREA)
- Machine Translation (AREA)
Abstract
本发明属于汉字编码,它按普通人的感觉将汉字拆分成字梁,并用分类码和识别码共同表示每一个字梁,这样分类码和识别码就构成了汉字的编码;字梁按其方向、形状、笔顺的综合特征相同或相似归为26类,并用特征相似的字母表示为分类码,字梁读音的声母(无读音的不勉强定音)为识别码;本发明汉字拆分直观无歧义、字梁与码符的对应关系直观易记、编码长度短、无重码;本发明除可用于汉字输入外,还可用于编制字典、词典或书刊目录。
Description
一种计算机键盘形象码汉字输入法是一种汉字字形编码利用计算机键盘实现输入汉字的方法。
汉字字形编码具有两个关键步骤,一是拆分汉字,二是将拆分后的部件分类定位于键盘字母上。
汉字拆分首先必须确定拆分单位,有人强调应以国家公布的部件规范为准,但现有的国家规范,并没有令人信服的依据和标准。
汉字拆分理当具有不可动摇的原则和规则,而目前的汉字编码,总是从一个极端走向另一个极端。有的主张绝对遵循书写顺序,但这样一来,一些汉字如“国:冂干丶一一”的拆分就很不直观;有的主张凡是相交的都不拆分,但有些相交结构如“束”不拆分反而感到别扭;有的则为减少记忆而精减部件,从而很多紧凑的结构不得不被“残酷”地肢解,如“春”依据感觉应拆为“
日”,但某种方案因精减部件而没有将“
”作为拆分单位,从而“春”就不得不拆为“
日”。这样,记忆的对象好象少了一个,但由此而造成的感觉障碍则如同铁轨被撬动了似的。
部件分类能否通过一种推算规则来减轻记忆,在这个问题上人们的认识十分欠缺。例如,有的编码声称,只要掌握一两条推算规则,就可以不用记忆输入所有汉字。以下通过对一个典型示例的分析来指出人们认识上的这种局限或盲点。
示例一:“未甘田失电用生戋”是一组具有五画相交的汉字部件,如果用键盘的第二行表示笔画有相交,用键盘的列表示笔画有几画的话,那么这些五画相交的部件就都是对应第二行的第五个键。没有记忆,只需推算一下!
分析之一:假设一分钟输入50个汉字,平均每个汉字需要击键2.5次,那么一分钟就要运算50×2.5=125个回合,想一想,有没有人能够算得出来?有没有人能够承受得了?这种以推算来代替记忆的方法是以加重脑力负担和降低反应速度为代价的。这就好象割掉自己身上的肉用来填充饥饿一样,不但不能解决问题,反而还会增加痛苦。五笔字型的键位有80%以上可以推算得出来,而学习五笔的人,为什么他们宁可死记硬背也不愿意进行推算呢?
分析之二:以上部件虽然都具有五画相交的特点,但因形态各异而映射到人脑中所形成的感觉各不相同。一种感觉就是一种推动力一种命令,不同的感觉就是不同的推动力不同的命令。不同的推动力不同的命令怎么能执行相同的任务呢?但是,在本发明提出之前的所有字形编码都是这样——不同的感觉打同一个键。它们根本没有意识到不同的感觉打同一个键所消耗的脑力有多大,对脑筋的折磨有多残。
分析之三:“戋戈弋
”因具有相同的气势或姿态而映射到人脑中所形成的感觉趋向一致。一种感觉就是一种推动力一种命令,相同的感觉就是相同的推动力相同的命令,相同的推动力相同的命令当然就应当执行相同的任务。因此,毫无疑问,这些部件都应当打同一个键。但是,在本发明提出之前的所有字形编码都与此相反——相同的感觉打不同的键。它们根本没有意识到相同的感觉打不同的键所消耗的脑力有多大,对脑筋的折磨有多残。
不要以为示例一只不过是个别编码,其实在本发明提出之前的所有字形编码都存在着不同程度和不同方式的推算。五笔字型将笔画与键盘位置联系起来进行推算。郑码将笔画与字母顺序联系起来进行推算。认知码把一个汉字各部分的读音首字母合并成编码也是一种推算(这种推算将人脑无法接受的没有语言关系的读音联系起来交织在一起,对输入过程的默读和写作思考干扰特别大)。而表形码和三维天然码则是借助于象形字母进行推算。
分析之二:单笔交叉是一种偏离了感觉的特征,它不可能被人脑抽象化为一种意境。一种特征与感觉偏差得越远,就越需要用思维来进行干涉,这就是记忆或推算,这就意谓着消耗脑力和时间。
分析之三:“女丈夂攵
久又
”是本发明的X键所对应的一组部件——清晰的感觉鲜明的意境。所谓感觉,它是人脑在接受字形刺激时所产生的一种生理效应。所谓意境,它是感觉的自然抽象与归纳。正因为是生理效应,所以具有能量,正因为感觉清晰如一意境鲜明突出,所以具有相同的推动力。正因为充分地利用了这种自然的力量,所以不需要记忆或推算,从而脑力负担得以减轻。
综合以上分析可知,无论是编码研究者,还是制订规范的国家机构,都没有从真正意义上看到感觉的价值意境的威力,因而也就不可能提出有价值的编码理论和编码方法来。
因此,本发明的目的就是要拿出一种与感觉协调一致的编码规则及其键盘来,从而借助于自然的力量从根本上减轻汉字检索和汉字输入的脑力负担。本发明是按照下述方法实现这个目的的。
一、字梁的确定及其分类合并
字形编码必须拆分汉字,拆分汉字必须确定拆分单位。形象码将汉字的拆分单位称为字梁。而字梁就是感觉上的一个整体。强行拆分感觉上的整体或者不拆分感觉上的分体都是对感觉的残暴。感觉是一种自发的自我维护性思维,感觉被残暴,整个思维体系和身心健康都会受影响。因此,形象码确定字梁的依据不是国家公布的部件规范等人为标准,而是感觉,即构字频度高的部件,结构紧凑的部件,具有鲜明形态意境的部件,这三种部件在感觉上是一个整体。据此,形象码确定了大约350个字梁。
原则上是将具有相同形态意境的字梁对应同一个字母,不同意境的字梁对应不同的字母。但是,由于字梁的形态意境不可能刚好是26种,而计算机键盘上用于汉字输入的理想位置则只有26个键位。因此,按照形态意境所划分的类还必须进行适当的合并,使其对应26个字母。合并方法说明如下:
“艹廾甘廿井
卅
”是一组具有羊肉串特征的字梁,主要出现在汉字的前半部分。“
几九
儿
”是一组具有手写体小n形特征的字梁,主要出现在汉字的后半部分。这两类合并为一类,一个与大N勉强相关,一个与小n相关,从而有利于记忆;一个在汉字的前半部,一个在后半部,从而互补空缺,避免了重码。
注:由于必须合并为26类,因此每一类在汉字中出现频率的平均数应为1/26。如果某一类只出现在汉字的前半部分,那么后半部分就被浪费了。浪费的位置越多,分布就越不均匀,从而重码就会越多。
以下这张字梁分类表是经过数千次反复推敲确定下来的。
形象码字梁分类表A
入火贝大天天夫
癶
亽 ………………………………………………A形对称B
弓乃
子孑ㄋ了 ………………………………………………………………B形弯曲b
夕
鱼
鸟
乌 ………………………………………象小b或含有小b头C
用甫耳且
目 ………………………………………………………………框内二横(C)D丶亠亡
立
六文亦方
广……………………………………D即空心点,看“亠”E
屮
巾
彐
正五车………………………………………四个方向的EF
歹万
厂
丆…………………………………………………横下飘如F(
)f十
………………………………………………………………将f的头纠正就是“十”字G
………………………………………………………………………………虫贵头(G)G 酉西覀
三二一
………………………………………………横的感觉,看G中的横H
非
片
卜 …………………………………………竖的感觉如HH 爿
丬
川
丨业止上
……………………………………………竖的感觉如HI
士工干
千
耂
…………………………………………………两横一竖如IJ
手
寸于
丁亅
刂 ……………………………………………………钩如JK
曰 …………………………………………………………………………………日曰(K)K
爫 ……………………………………………………………………………象倾斜的KL
饣
乚
乙己已巳
巴 …………………………………………钩如LM
穴
冖
……………………………………………………………象锅盖如MM 灬罒皿四
………………………………………………………………象封闭的MN
廾甘廿井
卅
………………………………………………象羊肉串(N)n
几九
儿
…………………………………………………………………………象小nO
囗 ………………………………………………………………………………………象OP
羽马力
卩刀
乛……………………………………看“”如PQ
生
牜牛午
……………………………………………………“”象压扁的QQ 甲由申田母
毋 ………………………………………………………………象饱满的QR
未末耒 …………………………………………………………………伸懒腰的形状(R)R戋戈弋
………………………………捺的感觉,看R中的捺S
豸身舟
白乡
斤
彡
丿 ……………………撇的感觉,把S拉直就是撇T
……………………………………………………………………单人旁的形状(T)t
匕
七
毛 ………………………………………………………………………象小tU
壬
丰
………………………………………………三横一竖(U)U 门
冂
凵 匚
………………………………………………………四个方向的UV
豕
水
巛巜
冫八酋
丷 ………………………………两点或V形标记W
心 …………………………………………………………………看W的三个顶点W 臼也乜 …………………………………………………………………………双手合抱如WX
丈夂攵
久又
………………………………………………醒目的交叉如XY
米
衤礻不
小 …………………………………………………象鸡爪(Y)Z
彑
幺
厶
之辶廴
……………………………………左钩回,走之底(Z)
以上表中大小写字母都用同一位置,不用区分和切换。表中的字母为字梁的分类码,其中“贝鱼鸟车讠饣马钅门纟”变为繁体时分类码不变。字梁的拼音首字母为识别码,没有读音的字梁识别码为a。带有黑点的字梁为高黑字梁。省略号之后的文字为特征说明。
二、汉字拆分方法
1、基本原则:指导汉字拆分的最高准则
书写原则:总体上必须按照书写顺序拆分汉字,例如“这”字应拆为“文之”,不宜拆为“之文”。
直观原则:拆分汉字时必须直观、自然,例如“国”字应拆为“囗王丶”,不宜拆为“冂干丶二”。
最少原则:必须使拆分出来的字梁数目最少,例如“束”字应拆为“木口”,不宜拆为“一口小”。
2、拆分规则:在基本原则的基础上制订如下拆分规则
①相似相随原理
十字针形的插入,如“妻”应拆为“十彐女”,不宜拆为“一彐丨女”。
②交不攀连连不攀散原理
相连结构的笔画不得拆散参与离散笔画组成字梁。如“羊”应拆为“丷
”,不宜拆为“
”(注:“”是离散结构)。
③顺序优先原理
依据书写顺序,先出现的笔画优先组合成字梁,如“矢”应拆为“大”,不宜拆为“丿天”(注:“丿”与“一”相连在先,“一”与“大”相连在后)。又如“武”应拆为“二止
”,不宜拆为“一弋止”(注:虽然“弋”是相交结构,“二”是离散结构,但“二”的书写顺序在先,并且“弋”的相交不是连续两笔的相交)。
3、拆分方式
常规拆分 识:讠口八 对称拆分 亘:二曰
嵌入拆分 巫:工人人 插入拆分 妻:十彐女
三、汉字输入步骤
1、名词解释
字梁:字梁是汉字的拆分单位。一个汉字拆分成几部分,就是由几个字梁组成的。
高黑字梁:字梁表中带有黑点的字梁为高黑字梁。其中“高”指的是构字频度高,“黑”指的是在字梁表中用黑点作为标志。如“人”就是高黑字梁。
分类码:字梁的类别代码为分类码。字梁分类表中的字母就是其对应字梁的分类码。如“人”的分类码为A,“乃”的分类码为B。
识别码:字梁的拼音首字母为识别码,如“大”的拼音为dà,即“大”的识别码为d。没有读音的字梁识别码为a,如“
”的识别码为a。
注:①“厶豕耒乜豸廴丬爿”这几个字梁,因绝大多数人不知其读音,为减轻记忆负担,视为无读音,识别码为a。
②“鱼月曰于
羽”这几个字梁,虽然汉语拼音方案将它们的拼音首字母ü写作yu,但本人认为这是一种扰乱声音感觉的无理规定,因而将这几个字梁的识别码规定为ü的近似字母u,而不是y。
③传统偏旁部首按其习惯读法的拼音首字母确定识别码,如“冖”读作“平(p)宝盖”,识别码为p。“丿”读作“撇(p)”,识别码为p。“彡”读作“三(s)撇”,识别码为s。
④为减少重码而又不增加记忆,本方案“编造”了以下读音:
“癶”读作“癸(k)字头 “
”读作“其(q)字头”
⑤与英文字母特别相象的字梁用其象形字母作为识别码恰好能有效地减少重码。以下字梁后边的()内为象形字母和识别码。
2、编码规则
由一个字梁组成的汉字,先输入分类码,再输入识别码,然后以“;”键结尾。例如“大”字的分类码为A,识别码为d,输入码为Ad。
由两个字梁组成的汉字,先依次输入分类码,再输入首字梁的识别码,如果首字梁为高黑字梁,则输入尾字梁的识别码,如果首尾字梁都是高黑字梁,则用V作为识别码,然后以“;”键结尾。例如:
分:八刀VPb; 汉:氵又WXy; 队:阝人BAv;
由三个或三个以上字梁组成的汉字,依次输入前三个字梁和最后一个字梁的分类码,不足四码的以空格键结尾。例如:
结:纟士口ZIO 能:厶月匕匕ZCTT 避:尸口立十之PODZ
由两个字组成的词组,每字取前二码,由三个字组成的词组,前一字取前二码,后二字各取前一码,由四个字组成的词组,每字取前一码,由四个以上的字组成的词组,取前三字和最后一个字的前一码。例如:
中国:OHOU 中国人民:OOAL
中国人:OHOA 中国人民解放军:OOAM
简码:对于比较常用的汉字,输入码的后半部分可以省略,省略之后,大部分以空格键结尾,少数以“;”键结尾。以下例子中的()内为简码。
人:AR;(A) 飞:LVA;(LV)
个:AHS;(AH)(A;) 说:LVON(LV;)
3、功能键设置
自动清除:当输入码符之后遇到空格键或“;”键或满四键时,如果没有检索到任何汉字,则自动清除输入码,重新输入。
选择键:当输入完成之后出现重码时,提示行显示所有重码。如果要输入的字是显示重码的提示行中最前的一个,不用管它,继续输入,重码被自动顶上屏幕,也可以用“1”键或空格键选择上屏。如果要输入的字是显示重码的提示行中的第二个,可以用“2”键或“;”键选择上屏。
查询键:可以用“/”键代替输入码的任何部分进行检索。
偏辟键:可以将平时使用不到0.01%的大量偏辟汉字设置为“.”键结尾。这样既避免了偏辟汉字干扰输入,又能不需切换随时取出偏辟汉字。
中英键:输入中文和英文混合在一起的文章,切换十分麻烦,中英键就是解决这种烦恼的。由于汉字的编码与英文的单词重码很少,因而在形象码输入状态下输入满四键,这时如果有对应的汉字,则输入的就是汉字,如果没有,继续输入,上屏的是英文单词。如果碰到重码,则默认为中文,如果输入的不是中文,则单击中英键就可以转化为英文。如果输入不满四键,则以空格键结尾的为中文,以中英键结尾的为英文。中英键用“,”键。中英键功能与自动清除功能不能同时存在。
本发明的最大收益就是基本上做到了编码规则与感觉协调一致,并且在这种情况下,实现了以下硬性指标:
码符26个字母,码长1-4码,不足4码的字占68%(相当于比五笔字形短0.7码),静态重码率为4%,设置1万条词组的重码率为5%。
参考:五笔字型码符25个字母,码长1-4码,不足4码的字占16%,静态重码率为3%,设置1万条词组的重码率为8%。
形象码的用途:
1、可以编制字典、词典或书刊目录,用于汉字检索。
2、可以编制汉字输入软件,用于汉字输入。
Claims (4)
- 一种计算机键盘形象码汉字输入法,包括:1.把感觉上的一个整体即构字频度高的部件、结构紧凑的部件、具有鲜明形态意境的部件确定为汉字的拆分单位——字梁,然后按照字梁的形态意境将其划分成类,再经综合考虑合并为26类定位于键盘字母上,列表如下:形象码字梁分类及其与键盘键位的对应关系表字梁 对应键位入火贝大天夭夫 癶 亽…………………………………………………………………A弓乃 子孑ㄋ了 …………………………………………………………………B 夕 鱼 鸟 乌 …………………………………………………………………b用甫耳且 目 …………………………………………………………………C丶亠亡 立 六文亦方 广…………………………………………………………………D屮 巾 彐 正五车……………………………………………………………E歹万 厂 丆 …………………………………………………………………F十 ……………………………………………………………………f ……………………………………………………………………G酉西覀 三二一 ……………………………………………………………………G非 片 卜 ………………………………………………………………H爿 丬 川 丨止上 ……………………………………………………………………H士工干 千 耂 ……………………………………………………………………I手 寸于 丁亅 刂 …………………………………………………………………J曰 …………………………………………………………………K 爫 …………………………………………………………………K饣 乚 乙己已巳 巴…………………………………………………………………L穴 冖 ……………………………………………………………………M灬罒皿四 ……………………………………………………………………M廾甘廿井 卅 ……………………………………………………………………N几九 儿 ……………………………………………………………………n囗 …………………………………………………………………O 马力 卩刀 乛…………………………………………………………………P 生 牜牛午 …………………………………………………………………Q甲由申田母 毋 …………………………………………………………………Q未末耒 ………………………………………………………………………………………R戋戈弋 ………………………………………………………………R 豸身舟 白乡 斤 彡 丿………………………………………………………S ……………………………………………………………………………………………T 匕 七 毛 ……………………………………………………………………………t壬 丰 …………………………………………………………………U门 冂 凵匚 ………………………………………………………………………U豕 水 巛巜 冫八酋 丷 …………………………………………………V 心 …………………………………………………………………………………………W臼也乜 ……………………………………………………………………………………………W丈夂攵 久又 ……………………………………………………………………X 米 衤礻不 小 …………………………………………………………………Y彑 幺 厶 之辶廴 ……………………………………………………………Z以上表中,大小写字母都用同一键位,不用区分和切换;对应键位的字母为对应字梁的分类码,其中“贝鱼鸟车讠饣马钅门纟”变为繁体时分类码不变;字梁的拼音首字母为识别码,没有读音的字梁识别码为a;带有黑点的字梁为高黑字梁;
- 2.单个汉字输入步骤:a 单梁字即由一个字梁组成的汉字:先输入分类码,再输入识别码,然后以“;”键结尾;b 双梁字即由两个字梁组成的汉字:先依次输入分类码,再输入首字梁的识别码,如果首字梁为高黑字梁,则输入尾字梁的识别码,如果首尾字梁都是高黑字梁,则用V作为识别码,然后以“;”键结尾;c 多梁字即由三个或三个以上字梁组成的汉字:依次输入前三个字梁和最后一个字梁的分类码,不足四码的以空格键结尾;
- 3.词组输入步骤:由两个字组成的词组,每字取前二码,由三个字组成的词组,前一字取前二码,后二字各取前一码,由四个字组成的词组,每字取前一码,由四个以上的字组成的词组,取前三字和最后一个字的前一码;
- 4.简码输入:对于比较常用的汉字,输入码的后半部分可以省略,省略之后,大部分以空格键结尾,少数以“;”键结尾。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN95104165A CN1068684C (zh) | 1995-04-28 | 1995-04-28 | 一种计算机键盘形象码汉字输入法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN95104165A CN1068684C (zh) | 1995-04-28 | 1995-04-28 | 一种计算机键盘形象码汉字输入法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN1134561A CN1134561A (zh) | 1996-10-30 |
CN1068684C true CN1068684C (zh) | 2001-07-18 |
Family
ID=5075023
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN95104165A Expired - Fee Related CN1068684C (zh) | 1995-04-28 | 1995-04-28 | 一种计算机键盘形象码汉字输入法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN1068684C (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101183279B (zh) * | 2007-11-14 | 2010-11-10 | 秦一明 | 一种电脑/手机统一的形音码汉字键盘输入方法 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1010990B (zh) * | 1988-04-08 | 1990-12-26 | 郭飞凤 | 普及型无重码汉字部首编码输入方法 |
CN1077548A (zh) * | 1993-04-22 | 1993-10-20 | 金日光 | 英文/东方文字根象形输入法 |
-
1995
- 1995-04-28 CN CN95104165A patent/CN1068684C/zh not_active Expired - Fee Related
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1010990B (zh) * | 1988-04-08 | 1990-12-26 | 郭飞凤 | 普及型无重码汉字部首编码输入方法 |
CN1077548A (zh) * | 1993-04-22 | 1993-10-20 | 金日光 | 英文/东方文字根象形输入法 |
Also Published As
Publication number | Publication date |
---|---|
CN1134561A (zh) | 1996-10-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN1068684C (zh) | 一种计算机键盘形象码汉字输入法 | |
CN1101569C (zh) | 音形码汉字输入方法 | |
CN1062361C (zh) | 音形派生键形码计算机汉字输入方法 | |
CN102043469A (zh) | 两笔型三维数码输入法及其键盘 | |
CN1045308A (zh) | 藏文输入编码法及其键盘 | |
CN1109281C (zh) | 五指键盘及其汉字笔序和英文六键位输入方法 | |
CN1020386C (zh) | 结构笔画四位数编码法及键盘 | |
CN1595340A (zh) | 通俗五笔字型法及其键盘 | |
CN1156743C (zh) | 一号码汉字输入法 | |
CN1203390A (zh) | 双音字根汉字编码方案 | |
CN1075562A (zh) | 五五码汉字编码法及其系列输入法所用键盘 | |
CN1081001A (zh) | 模拟汉字输入法及键盘 | |
CN1378126A (zh) | 六笔矩阵编码法及其键盘 | |
CN1207648C (zh) | 五三码及其键盘 | |
CN114035694A (zh) | 一种嘉码汉字输入法 | |
CN1253326A (zh) | 汉字双极融合码的计算机输入方法 | |
CN1107594A (zh) | 一种计算机汉字输入方法 | |
CN1194395A (zh) | 直观码汉字输入方法及键盘 | |
CN1267852A (zh) | 组合编码的计算机汉字输入方法 | |
CN1060277C (zh) | 以句子为输入单位的计算机汉字编码输入方法 | |
CN1178339A (zh) | 一种计算机汉字输入国文码 | |
CN1267012A (zh) | 普适码计算机汉字输入法 | |
CN1258879A (zh) | 汉字编码输入方法及键盘 | |
CN1171575A (zh) | 汉字部件笔顺编码法及其输入键盘 | |
CN1264074A (zh) | 计算机汉字输入方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
C19 | Lapse of patent right due to non-payment of the annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |