CN1086480C - 计算机汉字音形意自然编码键盘输入法 - Google Patents
计算机汉字音形意自然编码键盘输入法 Download PDFInfo
- Publication number
- CN1086480C CN1086480C CN95113034A CN95113034A CN1086480C CN 1086480 C CN1086480 C CN 1086480C CN 95113034 A CN95113034 A CN 95113034A CN 95113034 A CN95113034 A CN 95113034A CN 1086480 C CN1086480 C CN 1086480C
- Authority
- CN
- China
- Prior art keywords
- character
- code
- word
- stroke
- coding
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Landscapes
- Document Processing Apparatus (AREA)
Abstract
本发明公开了一种计算机汉字音形义自然编码键盘输入法。它将汉字分为笔画、字元、单字、词语多个层次。笔画按音取码;字元按音、形、字义、义形、谐音、笔画数、主笔画数等多种方法取码;单字编码有字形码、简码、形音码三种形式;词语编码为4码,并创立了词类分区技术;汉字输入内含两套系统,一套是供各类人员用计算机录入汉字时使用的汉字录入标准系统,另一套是供国内小学生和外国人学习汉字时使用的汉字识字教学系统。该计算机汉字输入法简单易学、录入速度极快,且全民适用,其广泛应用将促进我国汉字录入的大众高效化和实现汉字识字教学的多媒体电脑化。
Description
本发明属于中文信息处理技术领域,是一种用于汉字计算机快速输入、汉字快速检索和汉字识字电脑教学的领域的汉字编码技术。该汉字编码技术与通用的国际标准键盘相结合适应于从小学低年级到成人专业操作者的各类层次人员使用。
据申请人所知,当今汉字编码界一直存在诸多难题,其主要在于以下几点:
1.难以解决汉字编码易学与输入速度间的矛盾
自从计算机从西方传入我国以来,汉字输入便始终是计算机普及的一大障碍,虽然经过众多科技人员,二十多年的艰苦努力,汉字输入取得了很大的进步,但汉字编码输入难的问题还是没有得到根本解决。其表现在该时期编码方案层出不穷,此起彼伏,呈现出“万码奔腾”的局面。谁都想用新的方案去代替旧的方案,谁都想实现汉字编码的统一。然而,谁也无法代替谁,谁也无法实现统一。当今社会上普遍使用的汉字输入法还是“五笔字型”和“拼音输入法”两种,其它输入法几乎没有市场。所以,五笔字型发明人在总结汉字编码发展历史时说“一代人的努力和实践表明:在计算机和汉字之间不能架设独木桥。只有易普及的简单方式与经过学习才能掌握的高效率输入方式并行的‘双轨制’,才能使中华社会步入电脑文化的新时期。”(见王永民著《五笔字型》中国科学技术出版社出版第150页)。并且断言说“好学的方法快不了,而且越是好学越是快不了”。
2.难以解决汉字编码单字录入与词语录入间的矛盾
一般的汉字编码均是采用的“四码字·四码词”或“三码字·三码词”的字词兼容技术,以单字编码为主,词语编码为辅。词语的收录以不与单字发生(或少发生)重码为原则,词语的收录十分有限,若大量的收录词语则会和大量的单字发生重码从而影响录入速度。五笔字型发明人王永民在谈到当今汉字编码现状时曾说过的“那种试图‘以词代字’,‘以语代字’甚至认为‘词的时代必将代替字的时代’的想法,不仅是对汉字构词之多、构词之活、语之多变缺乏认识,而且也是对计算机的功能过于茫然。”(见王永民著《五笔字型》中国科学技术出版社出版第150页)。
3.难以解决常用字收录与偏僻字收录间的矛盾
现有的汉字编码方案对其所有的汉字进行编码在理论上是完全可以的,但在实际应用中则不行(一些汉字编码方案只能处理基本集[6763个]汉字,而不对所有的汉字进行处理)。因为这些方案对所有的汉字进行编码后会有大量的偏僻汉字和常用汉字出现重码,这样便会大大地降低汉字的输入效率,更不能使计算机实现“全汉字处理”。
4.难以解决识字教学与文字录入间的矛盾
电脑是二十世纪最伟大的发明之一,它的应用已深入到了我们的学习、工作和生活的方方面面。然而,对于汉字的学习我们却很少应用到它,或者应用得不够理想。汉字的学习还离不开教师的讲授,家长(家教)的辅导。已具智能化的电脑对于汉字的学习还显得苍白无力,汉字识字教学的现代化感到无从实现,更使“计算机从娃娃抓起、从娃娃识字教学抓起”不能成为现实。
综上所述,现有的各种汉字编码方法:要么是输入速度快,但记忆量太大(如王永明发明的五笔字形),不适合在中小学学生中推广;要么是易学,能在中小学学生中推广,但因重码较多,输入速度不够理想(如陈爱之等发明的表形码),又不适合计算机专业操作人员使用。因此,成了从小学学一套,长大从事计算机专业操作又得另学一套,故造成人力的极大浪费。
本发明的目的是为了解决上述汉字编码中存在的不足之处,申请人综合多种汉字编码方法的特点,经过多年来潜心研究,不断完善汉字编码方法,提出了一种计算机汉字音形义自然编码键盘输入法。该输入法记忆量小、重码较少、输入速度快,能在各类人员中广泛推广应用。该输入法由于成功地解决了上述的四大矛盾,使汉字输入进入了“以词语输入为主、单字输入为辅”的新阶段,将推动 “汉字计算机输入的大众高效化”、推动“汉字资料检索的易学快捷化”和“汉字识字教学的多媒体电脑化”。
本发明的目的是这样来实现:一种计算机汉字音形义自然编码键盘输入法,包括:
将构成汉字的笔画划分为单笔画和复笔画两种,所述单笔画包括点、横、竖、撇、捺和提,所述复笔画包括各种折笔画与各种带钩笔画,笔画按音取码,与计算机键盘键位的对应关系为:点-D、横-H、竖-S、撇-P、捺-N、提-T、复笔画-F。
对汉字字元以音、形、字义、义形、谐音、笔划数、主笔划数取码,其中:所述音是指汉字字元读音的拼音,代码取其拼音的首位字母,与计算机键盘键位的对应关系为:b-B,c-C,d-D,e-E,f-F,g-G,h-H,j-J,k-K,l-L,m-M,n-N,p-P,q-Q,r-R,s-S,t-T,w-W,x-X,y-Y,z-Z。
所述形是指汉字字元的字形,其字形很像某个字母和数字则按对应的字母和数字取码,取形字元与计算机键盘键位的对应关系为:ㄋ-3,ㄐ-4,与、马、鸟、乌、ㄅ-5,犭、豸、豕-6,扌、
-7,
亼-A,讠、主、言-i,J-J,片、斤、丬、爿-K,L、辶、廴-L,冂、ㄇ、门-n,口、
-0,日、曰、罒-Q,尸、
-P,
T,艹-U,关-V,ㄨ-x,
-Y。
所述字义是指数字字元本身所代表的意义,数字字元与计算机键盘键位的对应关系为:一-1、二-2、三-3、四-4、五-5、六-6、七-7、八-8、九-9、十-0。
所述义形是指字元字义之形,纟:义绞丝,形为
,与计算机键盘键位的对应关系为:纟-8;雨:义天上下雨,形为
,与计算机键盘键位的对应关系为:雨-9;目:义眼睛,形为
,与计算机键盘键位的对应关系为:目-0;山:义尖尖山,形为
,与计算机键盘键位的对应关系为:山-A;食:义吃东西,形为
,与计算机键盘键位的对应关系为:食-Q;牙、齿:义尖牙齿,形为
,与计算机键盘键位的对应关系为:牙-V,齿-V;矢:义箭,形为
,与计算机键盘键位的对应关系为:矢-V;骨:义骨头,形为
,与计算机键盘键位的对应关系为:骨-I;足:义为脚,老人的第三只脚一木棍,形为
,与计算机键盘键位的对应关系为:足-I。
所述谐音是指某字元的读音与某数字的读音相同,包括三个字元:久、酉一无“氵”之“酒”、午,它们与计算机键盘键位的对应关系分别为:久-9,酉-9,午-5。
所述笔划数是指笔划相对孤立而互不交叉的字元的笔画总数,其字元代码取其总笔画数目,它们与计算机键盘键位的对应关系分别为:、-1,冫-2,氵-3,灬-4。
对单字编码有字形码、形音码和简码三种形式,其中:
所述字形码由三码加“[”组成,前三码的取码原则为:单元字第一代码为本字元代码,第二、三码分别为本字元首、末笔划代码;双元字第一、二码分别为前后字元的代码,第三码为后一字元的末笔划代码;多元字第一、二、三码分别为第一、二字元和末字元代码。
所述形音码由字形码的前三码加上本字音首构成。
所述简码:有一级简码、二级简码、三级简码三级。
一级简码为1码:它们与计算机键盘键位的对应关系为:一-1、二-2、三-3、四-4、五-五、六-6、七-7、八-8、九-9、十-0、你-N、我-W、他-T、某-M、该-G、上-S、向-X、的-D、了-L、就-J、已-Y、和-H、其-Q、而-E、可-K、如-R、才-C、不-B、非-F、之-Z、由-U、O-o、被-P、在-A、主-I、下-V。
二级简码为2码,单元字由本字元代码加末笔画代码,双元字由首字元代码加末字元代码,多元字为首笔画代码加末笔画代码。
三级简码为3码,无重码的字形码定为三级简码。
词语输入法包括二字词语编码、三字词语编码、四字词语编码、多字词语编码、字段词语编码、双叠词语编码。所述词语编码用4码并进行分类编码,其分类和编码方法为:
所述二字词语编码:第一字的首、末码+第二字的首、末码。
所述三字词语编码:第一、二、三字的首码+“3”,该“3”为三字词语的类码。
所述四字词语编码:第一、二、三字的首码+“4”,该“4”为四字词语的类码。
所述多字词语编码:第一、二、次末字首码+“9”,该“9”为多字词语的类码。
所述字段词语编码分为二字段词语编码和多字段词语编码两类;二字段词语编码:第一、二段的首字元代码和第二字段末字的首字元代码+“V”;多字段词语编码:第一、二末段词语的首字元代码+“V”;其“V”为所述字段词语的类码。
所述双叠词语编码:为其相同字的字形码+“2”,该“2”为双叠词语的类码。
对汉字输入采用两套系统,包括汉字录入标准系统和汉字识字形音系统,其中:
所述汉字录入标准系统是采用单字输入与词语输入相结合的形式,其中单字输入有简码和字形码两种方式;
所述汉字识字形音系统采用单字输入形式,并用简码、字形码、形音码形式输入。
本发明输入法使用的键盘是利用国际标准键盘,该键盘上的A-Z二十六个字母键和0-9十字数字键实现对笔划、字元和汉字编码输入电脑;在国际标准键盘的英文字母的下方标注中文拼音小写字母。
为使搞不清汉字读音、弄不明汉字拆分及一时记不起汉字结构的用户也能学习其全码,并能输入其汉字,将国际标准键盘的“?”键设为万能学习键。
本发明采用上述的技术方案所产生的显著效果有如下几点:
1.本发明成功地解决了汉字编码易学与输入速度间的矛盾,使初学者10分钟便能学会,8岁儿童训练后打字速度可达200字/分钟,便充分证明了本发明在易学与速度方面取得了重大突破,实现了“易学又快”的理想目标。
2.本发明成功了解决了汉字编码单字录入与词语录入间的矛盾。本发明创造了“三码字·四码词”的字词分离技术和词类分区技术,使词语的收录不会与单字的收录发生重码,大量收录词语后,词语是的重码又很少,实现“见词输词”的目标。字词分离技术和词类分区技术的提出这也是汉字编码界的重大突破。
3.本发明由于创造了“简码·字形码”的“显头隐尾”重码处理技术使其在实际录入时收录再多的偏僻字也不会影响常用字的录入。因为在录入常用字时,常用字作为简码(重码头)显示在提示行上,而与之重码的偏僻字则已隐藏并未显示,所以偏僻字的收录并不影响常用字的录入。若要录入偏僻字则按其字形码 “丢尾”将其显示在批示行上,然后选择录入。这样便能实现“收录所有汉字并不影响常用汉字的输入速度”的目标,从而实现计算机的“全汉字处理”的重大突破。
4.本发明成功地解决了识字教学与文字录入间的矛盾,使“计算机从娃娃抓起、从娃娃识字教学抓起”成为现实,甚至可能使我国的汉字识字教学因此而现实了真正意义上的现代化。它的广泛应用,将彻底改变汉字的教学方式。传统的落后的整字教学笔划记忆方式将变为现代的先进的板块教学字元记忆方式,使汉字的学习更易;传统的非标准的教师口授读音方式将变成现代的标准的多媒体发音助读方式,普通话的推广更易;传统的学生被动接受的学习方式将变成现代的学生主动探索的学习方式。传统的繁琐的教师(家长或家教)辅导将变成现代的简单的多媒体电脑辅导,极大地减轻了教师和家长的辅导负担。
以下将要详述的本发明具有这些特点:由于本发明的输入法充分利用了汉字读音、部首读音、书写笔顺以及汉字的字形、表义等基本知识,学习中实码所需的记忆量极少,而且均采用了形象记忆法,故简单易学、一看便懂、一用便会;学习本发明的输入法具备的知识为能认识106个汉字,粗略掌握汉字拼音(汉字的音首——拼音的首位字母),基本熟悉汉字部首、笔划,能接正确笔顺书写汉字(这些知识在小学低年级已学),所以本发明的输入法完全可以进入普遍家庭和供小学低年级学生使用;本发明的输入法共收录了二字词语33300多条、三字词语2300多条、四字词语2500多条及多字词语、双叠词语、数量词语、字段词语400多条,共计4200余条,由此可见词语库容量巨大,完全可以实现“以词语输入为主,以单字输入为辅”的目标,从而大大地提高了汉字的输入速度;由于本发明的输入法为不同的用户提供了三套联系紧密、功能各异的编码,因此适用范围广、各类人员均可选用,完全可以适应从初级到高级的各类计算机操作人员的使用。而且,随着文化程度的不断提高和本发明的输入法使用时间的增长,自然而然地便会使操作水平从低级向高级过渡。即:
初级型属小学生或具小学文化程度的人员。由于他们识字不多,认识的语汇量小,只能大量的使用字形码和少量的简码,因而输入速度较慢。
中级型属中学生或具中学文化程度的人员。虽然他们识字较多,但也会时常遇到不认识的字,而不得不使用字形码,故输入速度不够理想。
高级型属大学生、作家、记者、秘书等人员。由于他们识字量大,认识的语汇量大,加之使用中实码的时间较长,已能记住相当数量的各级简码,因而输入速度较快。
专业型属专职操作人员。他们通过专门记忆各级简码、各类词语,基本上能做到无重码输入,加之键盘操作熟练,因而可获得理想的操作速度。
图1为本发明的使用键盘。
表1为本发明的笔划名称及代码表。
表2为本发明的汉字音形义自然编码输入法字元及代码总表。
表3为本发明的汉字音形义自然编码输入法一级简码分布表。
表4为本发明的汉字音形义自然编码输入法二级简码表。
表5为本发明的重码字分流表。
本发明是依据汉字的三个层次(1.笔划、2.字元、3.汉字)和汉字的结构方式(1.积木式、2.插入式、3.橱窗式、4.悬挂式、5.托垫式、6.复合式)来研究汉字编码的。
汉字的三个层次:1、笔划为组成汉字的基本线条,分为单笔划和复笔划两种。即:单笔划有丶(点)一(横)丨(竖)丿(撇)(捺)
(提),复笔划是由单笔划与“钩”或单笔划与单笔划间复合而成[例:亅(竖钩)由“竖”和“钩”复合而成,
(横折)由“横”与“竖”复合而成];2.字元为构成汉字的基本结构,它分为成字字元,准成字字元和笔划组合体三种。(1)成字字元即本身就中常用汉字的字元[例:大(太)木(休)目(睡)牛(件)立(章)月(明)十(古)身(射)厂(原)广(庆)],(2)准成字字元类似于常用的字元[例:“土”的类似形:
(孛)
(南)(坏),“上”的类似形:
(睿)
(贞)],(3)笔划组合体字元由各种笔划组合在一起形成的字元。[例:(肖)
(应)亠(亢)
(州) (流)(关)廾(弊)リ(师)
(肃)];3.汉字由字元构成的有固定结构、有固定意义、有声有调有组合体。按其构成的字元数可分为:单元字、双元字和多元字三种。其单元字由一个字元构成的字(例:十 四 口 木 大 工 小 人 牛 金 瓦 凹 万 王 才),双元字由两个字元构成的字(例:双 权 字 功 支 庄 什 团 公反 材 汽 洒 达 爬),多元字由三个或三个以上字元构成的字(例:集 技 校 僻 横 调 鼻 构 僧 倦 啪 晚 热 塌 瞒)。汉字的结构方式:1.积木式:由各字元相对独立地占有一定的位置空同而构成。有如下几种形式:(1)上下结构(例:里—田土、占—上口、穴—宀八、元—二儿、字—宀子、支—十又、穷—宀八力);(2)左右结构(例:坏—土不、什—亻十、化—亻匕、仨—亻三、礼—礻乚、认—讠人、树—木又寸);(3)左上右下结构(例:在—
土、庄—广土、厉—厂万、启—户口、寿—
寸、左—
工);(4)左下右上结构(例:氕—气丿、勾—勹
、乃—ㄋ丿、习—
、勿—勹
);(5)三围结构(例:区—匚乂、凶—乂凵、丑—
十、冈—冂乂、闪—门人);(6)全围结构(例:困—口木、囚—口大、因—口大、团—口才、且—
二、囡—口女);(7)复合结构为综上几个方式而构成(例:品—口口口、集—亻
木、填—
、属——尸丿中冂
)。2.插入式:由一个字元的一笔划插入另一字元而构成(例:电-“
”插入“日”中,农—“
”插入“冖”中)。3.橱窗式:由一字元作“货架”另一些字元作“货物”而构成。例:例字 货架 货 物
巫 工 人人
噩 王 口口口口
畿 戈 幺幺田
幽 山 —
—
4.悬挂式:由小字元悬挂于大字元上而构成(例:東—“口”悬挂于“木”上;柬—“
”悬挂于“木”上;吏—“口”悬挂于“丈”上)。5.托垫式:由一带“尾”字元的“尾”托起另一字元而构成(例:这“辶”托垫“文”,题—“是”托垫“匕”,虺—“
”托垫“虫”)。6.复合式:由上述几种构成方式复合而成(例:速—辶木口,淹—氵大日乚,建—廴
,馗—
自,咎—
卜口,竦—
木口)。
本发明汉字输入方法是由笔划代码、字元代码及拆字原则来完成的。
笔划代码以其读音音首(即拼音的首位字母)为代码(详见表1):
本发明对各字元的取码方法有按音首取码,按笔划取码、按主笔划数取码、按字义取码、按字形取码、按义形取码和按谐音取码七种,各取码如下:
1.按音首取码:
K:框形:(匚、
N:女,内,牛(牜);
2.按笔划数取码:
4:灬,爫
3.按主笔划数取码:
1:礻
4.按字义取码:
1:一; 6:六;
4:四(罒、
); 9:九;
5:五; 0:十
5.按字形取码:
5:与、马、
7:扌、
J:
O:口
P:尸、
Q:日、
U:艹(廾),凵(凹);
X:乂、
6.按义形取码:
7.按谐音取码:
酉(无“氵”之”酒”)编码:9久编码:9 午编码:5各字元代码详见表2。
2.大结构优先:(1)挂底优先(例:束—木口 柬—木
吏—丈口);(2)垫底优先(例:魈—鬼月 谜—讠辶米 断—
米斤 健—亻廴
);(3)货架优先(例:噩—王口口口 幽—山幺幺 巫—工人人)。3.先见优先,兼顾直观(例:卡—上卜 关—大 黄—
丨日八 尊—丷酉寸 行—彳一丁)。
本发明提供了三套联系紧密、功能各异的汉字编码供用户选用,即字形码、形音码和简码。
户—户、丿(HDP)子—子
—(ZFH)主—主丶一(IDH)]。(2)双元字第一、二、码分别为前后字元的代码,第三码为后一字元的末笔代码(侧:双—又又(YYN) 划—戈刂亅(G2F) 码—石马一(S5H)代—亻弋丶(RGD)]。(3)多元字第一、二、三码分别为第一、二字元和末位字元代码[(例:肥—月
乚(YQL)重—千田土(QTT)或—-口戈(IOG)编—纟户艹(8HU)]。
2.形音码由字形码代码后加上本音首构成(例:牛NPSN金JDPF 取EYNQ 分8DPF 磊SSSL 简ZNQJ)。
3.简码共有三级。
一级简码选取不构成词语的最常见字定为一级简码。一级简码又分为a、b两类(详见表3):a类一级简码为一码加空格而成,其编码方法有按数目取码、按音首取码、按字形取码,需特别记住的是按字形编码者:I-主 P-被(皮) V-下 U-由 0-O(零的简体);b类一级简码为一码加“[”键而成,其编码方法是按键盘排列次序取码。二级简码为二码加空格而成,选取常见的一千多(1102)个汉字定为二级简码(详见表4)。其取码原则是:单元字由本字元码加末笔划代码;双元字由首字元代码加末字元代码;多元字由首字元代码加末字元代码。三级简码由三码加空格而成。无重码的字形码均可定为三级简码,有重码的字形码则选其最常用之字为三级简码。各简码总计5843个,占国标一、二级汉字的83%,可以说绝大多数汉字特别国际一级汉字都可以采用简码输入。
本发明按词语构成的情况,将其分为六大类,各大类的编码方法为:
1.二字词语:二字词语是汉字词库中最常见且数量最多的一类词语。故安排了全码(四个代码)构成。各码分别为二字的首字元代码加末字元代码构成。其单元字则为本字元代码加末笔划代码构成;数目字则双写其代码(例:学习—
子
4Z72 国家—口丶宀豕01B6 一个—一一个11GS)。
4.多字词语:五个和五个以上的字构成的词语。其编码为三位代码加数字键“9”构成。各代码分别为一、二、末字的首字元代码(例:九牛二虎之力:九牛力—9NL 有中国特色的社会主义:ナ中丶—OZ1)。
5.语段词语:由词语段构成的词语。可分为二段词语和多段(三段或三段以上)词语二类,其编码为三位代码加字母键“V”构成。二段词语的三位代码分别为一、二字段的首字元代码和第二字段末字的首字元代码(例:千里之行,始于足下:千女下—QNX 党中央,国务院:
口阝—4OE)。多段词语的三位代码分别是一、二、末段词语的首字元代码(例:马克思列宁主义,列宁主义,毛泽东思想:马一毛—51M)。
本发明 汉字输入方法
(一)汉字输入系统:
本发明汉字输入采用两套系统,一套是“汉字录入标准系统”、另一套是“汉字识字形音系统”。
1、汉字录入标准系统:适合小学生、中学生、成人、专业打字员对一般文字的录入时使用,汉字录入采用的词语单字混合输入方式。此时,单字输入采用“简码”或“字形码”均可。
2、汉字识字形音系统:适合于中国小学生和外国人学习汉字时,在此识字软件中输入汉字时使用,汉字录入采用的是纯单字输入方式。此时,单字输入采用简码、字形码或形音码均可。
3、为了使本发明能对未学习拼音大写字母的小学低年级学生适用,应在国际标准键盘的英文字母的下方标注中文拼音小写字母。
(二)重码处理:中实码以易学,自然为宗旨,故会出一些重码,但重码较少。
1.单字重码处理:(1)高频先见。当出现单字间重码时,在屏幕提示行按使用频率先高后低排列。(2)简码处理:由于国际二级汉字属不常用汉字,故二级汉字间的重码基本不影响汉字的输入速度,而一级汉字与二级汉字间的重码,由于采用了高频先见的处理,也不会影响汉字的输入速度,对于一级汉字间重码可用简码给予分流。据统计,国标一级汉字中,共有53对重码,其中绝大多数都可采用简码分流(见表5)。
2.词语间重码:二字词语与其它类词语重码,由于二字词语最常用,故采用二字词语先见。
本发明使用的键盘采用国际标准键盘(参见图1),各字根分布于键上,用该键盘上的A--Z二十六个字键和0--9十个数字进行本发明汉字编码的输入。在其键盘上的“?”键作为万能学习键。输入时,只要将全码中的未知码用“?”代替,计算机便会将符合其编码的所有汉字及其全码显示在提示行里,使用户学习或按对应的数值键输入。表1 笔划名称及代码表
表2 汉字音形义自然编码输入法字元及代码总表表2 汉字音形义自然编码输入法字元及代码总表 续1表2 汉字音形义自然编码输入法字元及代码总表 续2
代码 | 名称 | 类型 | 例字 | 代码 | 名称 | 类型 | 例字 | |
D | 点 | 左斜点 | 主戈方内 | F | 复笔划 | 横钩 | 买写 | |
右斜点 | 心冗点办 | 横折折 | 凹 | |||||
挑形点 | 沟冰 | 横折提 | 讲计 | |||||
长点 | 区这食小 | 横折钩 | 幻切 | |||||
H | 横 | 长横 | 十丈大土 | 横折折撇 | 及极 | |||
短横 | 其段臼 | 横折折钩 | 乃 | |||||
斜横 | 斗头耳 | 横折折折 | 凸 | |||||
S | 竖 | 长竖 | 上木山中 | 竖沟 | 争事 | |||
短竖 | 贡临左倒 | 竖提 | 民以 | |||||
斜竖 | 丑 | 竖折 | 区画 | |||||
P | 撇 | 短撇 | 白身囱血 | 竖折折钩 | 与马 | |||
平撇 | 学米少 | 竖折撇 | 专 | |||||
斜撇 | 人龙大入 | 竖折折 | 鼎 | |||||
竖撇 | 月儿 | 竖弯 | 西四 | |||||
N | 捺 | 斜捺 | 孓尺又水 | 竖弯钩 | 毛乱 | |||
平捺 | 之走 | 撇钩 | 瓦 | |||||
T | 挑 | 长挑 | 习刁孑 | 撇点 | 巡 | |||
短挑 | 场将 | 撇折 | 东红 | |||||
F | 复笔划 | 横折 | 口中是马 | 卧钩 | 心必 | |||
横撇 | 又支友受 | 弯钩 | 家狂 |
表3 一级简码分布表
1 2 3 4 5 6 7 8 9 0a类 一 二 三 四 五 六 七 八 九 十b类 1 2 3 4 5 6 7 8 9 0
A S D F G H J K La类 啊 是 的 非 该 和 及 可 了b类 亿 兆 万 千 百 分 厘 毫 微
Z X C V B N Ma类 在 向 才 下 不 你 某b类 年 月 日 时 秒 前 第表4 汉字音形义自然编码输入法二级简码表
1 2 3 4 5 6 7 8 9 0 A B C D E F G H1 求 副 形 来 禅 死 蠢 祝 奉 良 秦2 就 补 点 冯 豪 冷 酋 卓 归 贤 尊 头 无 半 衣3 书 削 海 泻 泠 演 酒 泪 当 泥 涨 溪 洗 泽 汗 淡4 发 粗 置 糕 鹞 兴 料 粙 赏 辉 粉 党 罪 粮5 骄 驯 验 骋 驺 驼 骚 驮 卸 驿 缸 与6 豹 狭 猃 犰 獐 狈 独 貌 狼 獯7 刁 习 承 热 拷 豫 托 扒 掉 扫 批 矛 打 那 排 找 护8 约 终 继 缘 织 纽 岔 缩 缚 续 爷 缝 红9 丸 需 酶 醚 鸠 零 醉 雪 酎 雨 霏 震 酉0 龙 翰 直 瞧 眄 瞑 真 事 责 博 盼 克 左 灰A 龛 剑 佥 鸽 豳 令 嵋 出 贪 寻 印 群 岸 灵B 审 勿 寥 鸟 家 宅 穴 究 官 密 它 守 宁 完 窄 空 白C 压 输 蟛 蚂 螟 转 鬓 轨 蝉 蛇 辱 寸 郝 蜂 成D 太 剞 煞 象 刍 负 夺 免 鲜 夷E 隔 阻 陟 险 聘 隧 聆 除 障 陌 附 联 院 儿 限 耿F 韭 夹 毒 熬 专 彗 责 契 寿 邦 方 表G 引 刊 廖 应 巧 弹 费 张 庆 廊 弓 竹 工H 灼 利 穆 燃 烤 稼 黔 烘 科 灿 乘 烛 灯 烧 炸 焊 秘I 诉 评 训 谜 许 诼 诧 识 计 讪 论 谢 读 说 访 试 谈J 凡 剁 钏 鼠 钙 镓 铃 镇 针 铛 帕 帐 钉 镜 见 钱 金K 状 疼 疹 熙 鸥 酱 丑 癌 北 将 奖 兜 片 装 痰L 为 处 巡 迷 驾 逐 办 辨 逆 还 达 过 选 建 赶 立M 本 桥 梅 杰 朽 橡 横 相 档 杯 村 模 柳 毛 杆 焚N 闸 刚 彤 阑 闯 嫁 妗 嫌 冒 妇 妮 闭 内 闻 用 奸 女O 国 图 母 叫 呜 嚎 呤 只 叶 咄 圆 虽 因 元 咋 民 口P 尺 尽 屎 写 冢 乇 徐 尻 看 屈 赞 军 行 先 靠 农 熨Q 申 刮 影 照 鸭 瞑 兵 早 岳 贯 晕 食 即 气 旱 曲R 但 例 值 焦 鹪 像 传 供 仇 华 仙 化 付 失 耸 作 代 伙S 矾 卡 参 熊 码 礞 砖 碘 碑 虐 能 射 砌 允 手 矿 上T 献 场 畛 煮 考 壕 填 南 坏 寺 卖 都 城 田U 药 甘 荒 燕 蓦 蒙 苏 草 茁 花 茧 莫 节 芳 藏 芦V 养 煎 鸦 龄 兼 着 关 郑 羊 差W 玉 冬 珍 玛 琢 琴 琪 玖 盲 环 珲 瓦 玩 亡 琅 王X 忧 外 悔 然 鸳 怜 惧 悼 怀 蛋 尖 悦 于 弯 业 难Y 胆 飞 膨 脸 鸡 豚 幻 胁 脾 峦 对 幺 脱 于 弯 业Z 臭 些 步 签 笃 篆 簧 管 舢 此 等 舟 篼 篷 竿 自
表4 汉字音形义自然编码输入法二级简码表 续I J K L M N O P Q R S T U V W X Y Z1 视 礼 祸 祠 严 春 两 永 至 画 豆 致 义 亚 正2 准 师 动 桌 姿 高 卢 曾 决 云 坚 弃 凌 京 育 冲3 注 沉 汇 泡 温 婆 河 波 油 满 法 溜 涵 澄 汪 漂 肖 游4 耀 常 乳 棠 米 糖 糟 掌 堂 弊 收 罗 受 学5 驻 骒 骑 缺 午 骗 骏 驱 驰6 猾 狮 犯 猛 獬 狗 猎 狐 猫 猴 狂 交 猜7 推 插 拒 把 操 接 拾 披 指 提 抄 挂 摇 挨 敢 掠 报 抓8 维 斧 爸 盆 纳 给 绣 绪 欲 公 细 编 釜 纹 父 缓9 霍 配 霖 久 露 旮 醍 雷 酗 酸 霞 醇0 雄 事 鼎 盔 妻 古 颠 睡 瞄 瞪 故 惠 友 眨A 崔 凯 岂 盒 合 领 山 崖 龠 敛 岁 幽 存B 赡 宽 包 寨 安 容 匕 赠 定 勾 富 匈 穿 皇 宗 宇 字C 蛀 所 历 盛 长 后 厂 暂 软 车 辐 蟒 蚜 蚊 原 反 厚D 雏 争 色 枭 大 哥 刀 鲁 欠 瓠 奋 奔 鳆 态 鳗E 陷 隘 娶 阿 陂 阳 队 聚 耳 陆 陵 际 取 耻F 带 艳 夫 替 靛 挈 旌 击 族 放 慧 施G 跫 席 甚 床 耍 唐 广 昔 页 干 庄 攻 恐 度 鞯H 雇 秃 炬 炮 煤 火 启 户 香 烦 私 灶 扁 程 称 肩 种I 谁 讲 跳 记 课 足 话 诱 谱 认 让 误 谣 讶 讳 议 请 证J 锥 锦 铫 舅 朵 锅 钻 铲 错 锁 斤 锚 钝 镫 凰 风 凤 钟K 瘫 匠 巨 己 桨 病 痴 疲 欧 瘤 匾 医 迈 东 背 臣L 进 逃 起 亲 妾 加 力 音 以 运 童 遥 逗 这 赵 迹 道M 柱 机 桃 札 林 木 束 极 松 杜 橙 框 梦 权 李N 雕 闹 甩 闲 娲 问 奶 间 闪 牛 娃 姘 嫉 妹 闷 妖 好O 唯 听 吧 呆 喽 回 咿 唱 吹 吵 吐 异 喉 呈 吓 吃 咱P 往 币 屉 血 犀 告 彼 届 徒 属 番 升 履 系 臂 征Q 饥 电 盟 氨 舌 暗 饮 暴 饼 敌 景 明 饽R 住 凭 佻 仓 朱 人 何 伊 借 从 会 生 偏 侯 全 便 仪 企S 碓 虎 劣 躲 水 吉 少 昏 贞 泵 垒 研 矣 硭 志 虚 砭T 堆 坑 男 果 天 吞 坡 增 走 去 里 垴 埃 教 思 地 孝U 警 幕 世 茶 萎 苦 菠 著 英 摹 苗 莽 芽 敬 芯 艺 芝V 雅 矩 益 矢 知 牙 智 歉 齿 塑 并 短 瓶 慈 兹 首W 趸 现 务 条 文 各 瑟 琐 碧 弄 望 忘 瑷X 惟 希 惋 杀 要 名 必 惜 快 愧 性 凶 忙 惊 忆 怔Y 难 观 劝 桑 又 哥 胪 腊 欢 丫 圣 胸 登 腹 恋 双 肿Z 雌 航 孔 笔 之 答 笋 简 孩 中 孑 算 簇 筐 孙 笑 串
表5 重码字分流表
代码 | 重码字 | 分 流 | 代码 | 重码字 | 分 流 |
22XL | 凉凛 | 凉:三级简码 | C1GX | 咸戌 | |
2JSS | 市帅 | 市:一级简码帅:三级简码 | CBXY | 原愿 | 原:二级简码 愿:三级简码 |
70YJ | 技攫 | 技:三级简码 | CHDC | 寸赤 | 寸:二级简码 赤:三级简码 |
720D | 掉掸抖 | 掉:二级简码 掸:三级简码 | CHPC | 才厂 | 才:一级简码 厂:二,三级简码 |
720S | 掸摔 | 掸:三级简码 | EYNQ | 取娶 | 取:二级简码 |
7S3C | 承掺 | 承:二级简码 掺:三级简码 | GHSG | 干革 | 干:二级简码 革:三级简码 |
9R3M | 酶霉 | 酶:二级简码 霉:三级简码 | GMSM | 摩魔磨 | 磨:三级简码 |
ASNL | 录隶 | 录:三级简码 | HH2S | 煽剡 | 煽:三级简码 |
B8OJ | 窖窘 | 窖:三级简码 | HXJX | 稀烯 | 稀:三级简码 |
BBPB | 比皆 | 比:三级简码 | IDLG | 诡跪 | 诡:三级简码 |
BFOH | 害豁 | 害:三级简码 | IFFF | 访诽 | 访:二级简码 诽:三级简码 |
IQ2T | 蹋蹋 | 蹋:三级简码 | RPNR | 人入 | 人:二级简码 入:三级简码 |
JJ1F | 帆钒 | 帆:三级简码 | RRBL | 伦赁 | 伦:三级简码 |
JPHJ | 臼金 | 金:二级简码 臼:三级简码 | SD3S | 参叁 | 参:二级简码 叁:三级简码 |
LOOB | 辨辫辩瓣 | 辨:二级简码 辩:三级简码 | SHHS | 士石上 | 上:二级简码 石:三级简码 |
L2OZ | 站毡 | 站:三级简码 | SPFS | 手氏 | 手:二级简码 氏:三级简码 |
LJSJ | 进近 | 进:二级简码 近:三级简码 | SSPS | 少砂 | 少:二级简码 砂:三级简码 |
LQOS | 适韶 | 适:三级简码 | UFFF | 芳菲 | 芳:二级简码 菲:三级简码 |
MMNL | 婪林 | 林:二级简码 婪:三级简码 | UPCY | 蔚萤 | 蔚:三级简码 |
O0OG | 固咕 | 固:三级简码 | UQYM | 萌蔓 | 萌:三级简码 |
O0YZ | 嘲吱 | 嘲:三级简码 | UYFY | 艺芋 | 艺:二级简码 芋:三级简码 |
QCDS | 时蚀 | 时:一级简码 蚀:三级简码 | X2OD | 惮悼 | 悼:二级简码 惮:三级简码 |
QFYQ | 晴氰 | 晴:三级简码 | X2XP | 禀飘 | 禀:三级简码 |
QSEJ | 即既 | 即:二级简码 既:三级简码 | XQGH | 恨悍 | 恨:二级简码 悍:三级简码 |
R1XY | 仪悠 | 仪:三级简码 | YFFY | 乙也 | 乙:一级简码 也:二级简码 |
RDXN | 你您 | 你:一级简码 您:三级简码 |
Claims (2)
1、一种计算机汉字音形义自然编码键盘输入法,包括:
将构成汉字的笔画划分为单笔画和复笔画两种,所述单笔画包括点、横、竖、撇、捺和提,所述复笔画包括各种折笔画与各种带钩笔画,笔画按音取码,与计算机键盘键位的对应关系为:点-D、横-H、竖-S、撇-P、捺-N、提-T、复笔画-F,
对汉字字元以音、形、字义、义形、谐音、笔划数、主笔划数取码,其中:
所述音是指汉字字元读音的拼音,代码取其拼音的首位字母,与计算机键盘键位的对应关系为:b-B、c-C、d-D、e-E、f-F、g-G、h-H、j-J、k-K、l-L、m-M、n-N、p-P、q-Q、r-R、s-S、t-T、w-W、x-X、y-Y、z-Z,
所述形是指汉字字元的字形,其字形很像某个字母和数字则按对应的字母和数字取码,取形字元与计算机键盘键位的对应关系为:ㄋ-3,ㄐ-4,与、马、鸟、乌、ㄅ-5,犭、豸、
-6,扌、
-7,
亼、
A,讠、主、言-i,J-J,片、斤、丬、爿-K,L、辶、廴-L,冂、ㄇ、门-n,口、
-O,日、曰、
-Q,尸
-P,ㄒ-T,艹-U,关-V,乂-X,
-Y,
所述字义是指数字字元本身所代表的意义,数字字元与计算机键盘键位的对应关系为:一-1、二-2、三-3、四-4、五-5、六-6、七-7、八-8、九-9、十-0,
所述义形是指字元字义之形,纟:义绞丝,形为
,与计算机键盘键位的对应关系为:纟-8;雨:义天上下雨,形为
,与计算机键盘键位的对应关系为:雨-9;目:义眼睛,形
,与计算机键盘键位的对应关系为:目-0;山:义尖尖山,形为
与计算机键盘键位的对应关系为:山-A;食:义吃东西,形为
,与计算机键盘键位的对应关系为:食-Q;牙、齿:义尖牙齿,形为
,与计算机键盘键位的对应关系为:牙-V,齿-V;矢:义箭,形为
,与计算机键盘键位的对应关系为:矢-V;骨:义骨头,形为
,与计算机键盘键位的对应关系为:骨-I;足:义为脚,老人的第三只脚-木棍,形为
,与计算机键盘键位的对应关系为:足-I;
所述谐音是指某字元的读音与某数字的读音相同,包括三个字元:久、酉-无“氵”之“酒”、午,它们与计算机键盘键位的对应关系分别为:久-9,酉-9,午-5,
所述笔划数是指笔划相对孤立而互不交叉的字元的笔画总数,其字元代码取其总笔画数目,它们与计算机键盘键位的对应关系分别为:丶-1,冫-2,氵-3,灬-4,
所述主笔划数是指字元突出的孤立笔画的笔画数,其字元代码为其孤立笔画数,它们与计算机键盘键位的对应关系分别为:礻-1,衤-2,
-4,米-4,
对单字编码有字形码、形音码和简码三种形式,其中:
所述字形码由三码加“[”组成,前三码的取码原则为:单元字第一代码为本字元代码,第二、三码分别为本字元首、末笔划代码;双元字第一、二码分别为前后字元的代码,第三码为后一字元的末笔划代码;多元字第一、二、三码分别为第一、二字元和末字元代码;
所述形音码由字形码的前三码加上本字音首构成,
所述简码:有一级简码、二级简码、三级简码三级,
一级简码为1码:它们与计算机键盘键位的对应关系为:一-1、二-2、三-3、四-4、五-五、六-6、七-7、八-8、九-9、十-0、你-N、我-W、他-T、某-M、该-G、上-S、向-X、的-D、了-L、就-J、已-Y、和-H、其-Q、而-E、可-K、如-R、才-C、不-B、非-F、之-Z、由-U、O-o、被-P、在-A、主-I、下-V,
二级简码为2码,单元字由本字元代码加末笔画代码,双元字由首字元代码加末字元代码,多元字为首笔画代码加末笔画代码;
三级简码为3码,无重码的字形码定为三级简码;
词语输入法包括二字词语编码、三字词语编码、四字词语编码、多字词语编码、字段词语编码、双叠词语编码,所述词语编码用4码并进行分类编码,其分类和编码方法为:
所述二字词语编码:第一字的首、末码+第二字的首、末码;
所述三字词语编码:第一、二、三字的首码+“3”,该“3”为三字词语的类码;
所述四字词语编码:第一、二、三字的首码+“4”,该“4”为四字词语的类码;
所述多字词语编码:第一、二、次末字首码+“9”,该“9”为多字词语的类码;
所述字段词语编码分为二字段词语编码和多字段词语编码两类;二字段词语编码:第一、二段的首字元代码和第二字段末字的首字元代码+“V”;多字段词语编码:第一、二末段词语的首字元代码+“V”;其“V”为所述字段词语的类码;
所述双叠词语编码:为其相同字的字形码+“2”,该“2”为双叠词语的类码;
对汉字输入采用两套系统,包括汉字录入标准系统和汉字识字形音系统,其中:
所述汉字录入标准系统是采用单字输入与词语输入相结合的形式,其中单字输入有简码和字形码两种方式;
所述汉字识字形音系统采用单字输入形式,并用简码、字形码、形音码形式输入。
2、根据权利要求1所述的计算机汉字音形义自然编码键盘输入法,其特征在于:该输入法使用的键盘,在国际标准键盘的英文字母的下方标注中文拼音小写字母。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN95113034A CN1086480C (zh) | 1995-10-14 | 1995-10-14 | 计算机汉字音形意自然编码键盘输入法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN95113034A CN1086480C (zh) | 1995-10-14 | 1995-10-14 | 计算机汉字音形意自然编码键盘输入法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN1130771A CN1130771A (zh) | 1996-09-11 |
CN1086480C true CN1086480C (zh) | 2002-06-19 |
Family
ID=5079826
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN95113034A Expired - Fee Related CN1086480C (zh) | 1995-10-14 | 1995-10-14 | 计算机汉字音形意自然编码键盘输入法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN1086480C (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1198198C (zh) * | 2001-02-27 | 2005-04-20 | 索尼公司 | 字符输入方法及字符输入装置 |
CN102163087B (zh) * | 2011-03-29 | 2013-08-07 | 陈长俊 | 一种汉字形码输入法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN87100210A (zh) * | 1987-01-13 | 1988-07-27 | 电子工业部第二十一研究所 | 汉字起末笔编码法 |
CN1042784A (zh) * | 1988-11-22 | 1990-06-06 | 李贾达 | 超级智能联想汉字系统及其输入键盘 |
CN1080748A (zh) * | 1992-06-30 | 1994-01-12 | 吴桦 | 简繁体声形特征码汉字输入法及其键盘 |
-
1995
- 1995-10-14 CN CN95113034A patent/CN1086480C/zh not_active Expired - Fee Related
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN87100210A (zh) * | 1987-01-13 | 1988-07-27 | 电子工业部第二十一研究所 | 汉字起末笔编码法 |
CN1042784A (zh) * | 1988-11-22 | 1990-06-06 | 李贾达 | 超级智能联想汉字系统及其输入键盘 |
CN1080748A (zh) * | 1992-06-30 | 1994-01-12 | 吴桦 | 简繁体声形特征码汉字输入法及其键盘 |
Also Published As
Publication number | Publication date |
---|---|
CN1130771A (zh) | 1996-09-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN1523518A (zh) | 智能汉语文化辞典系统 | |
CN1086480C (zh) | 计算机汉字音形意自然编码键盘输入法 | |
CN1054447C (zh) | 计算机汉字输入坐标码编码方法 | |
CN1166997C (zh) | 汉字免拆分快速输入法 | |
CN1209700C (zh) | 数码识字输入法 | |
CN1108551C (zh) | 优化赋音形码计算机汉字输入方法 | |
CN1825254A (zh) | 汉字输入法及其所用的计算机键盘 | |
CN1062797A (zh) | 文字输入键盘及方法 | |
CN1268708A (zh) | 全信息计算机汉字处理系统和实现方法 | |
CN1210295A (zh) | 中西文字编码智能输入方法及键盘 | |
CN1108552C (zh) | 拼音汉字完善汉字法(phf) | |
CN1100821A (zh) | 《部首—三分—两类—音形通用码》汉字输入系统 | |
CN1182458C (zh) | 纯金码汉字输入法 | |
CN1133450A (zh) | 汉字“笔画分子”型编码输入方法——简称“分子码”又称“米字码” | |
CN1023669C (zh) | 一种字元拼形计算机中文输入法 | |
CN1150444C (zh) | 计算机字母化中文输入法 | |
CN1567151A (zh) | 部首字典码 | |
CN1374577A (zh) | 英文字母键盘和数字键盘通用汉字电脑输入法及其键盘 | |
CN1169040C (zh) | 一种电脑汉字输入法 | |
CN87106169A (zh) | 二维汉字形码 | |
CN1134561A (zh) | 九笔特征汉字编码 | |
CN1065740A (zh) | 华光汉字系统与汉字的无键盘与微型键盘输入 | |
CN1209601A (zh) | 义形音字元通用码汉字输入法及其键盘 | |
CN1734404A (zh) | 音码和识别音码、级库技术、笔码和数字笔码 | |
CN1175722A (zh) | 计算机中文通用输入法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
C19 | Lapse of patent right due to non-payment of the annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |