CN101158884B - 汉字形码计算机手机一体化输入技术 - Google Patents

汉字形码计算机手机一体化输入技术 Download PDF

Info

Publication number
CN101158884B
CN101158884B CN2007100941433A CN200710094143A CN101158884B CN 101158884 B CN101158884 B CN 101158884B CN 2007100941433 A CN2007100941433 A CN 2007100941433A CN 200710094143 A CN200710094143 A CN 200710094143A CN 101158884 B CN101158884 B CN 101158884B
Authority
CN
China
Prior art keywords
code
chinese character
input
chinese
integrated
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN2007100941433A
Other languages
English (en)
Other versions
CN101158884A (zh
Inventor
敬永权
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to CN2007100941433A priority Critical patent/CN101158884B/zh
Publication of CN101158884A publication Critical patent/CN101158884A/zh
Application granted granted Critical
Publication of CN101158884B publication Critical patent/CN101158884B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Document Processing Apparatus (AREA)
  • Controls And Circuits For Display Device (AREA)

Abstract

本输入方法包含以字母形码编码的计算机汉字输入法和以数字形码编码的手机汉字输入法,其字母与数字是顺序对应关系,用户学会计算机汉字输入法,也即会进行手机汉字输入,两种输入法都具有良好的规范性、易学性和快速性。计算机汉字输入法应用双码部件理据性表达法,不搞拆分直接编码;编码部件易学易记,不背助记口诀;编码规则最简化,不学识别码;遵守各种汉字规范,与部首检字法衔接良好,学用汉字和学用输入法相辅相成;输入单个汉字重码字键选率小于1%,常用词组复盖率高,输入效率高于现有各种形码,比智能拼音提高1-3倍。用于手机的数字形码系经过方案优选而确定,键入1-4个数字不翻页即可选定所要的汉字,输入效率比国外专利产品高2-4倍。

Description

汉字形码计算机手机一体化输入方法
本发明的名称为“汉字形码计算机手机一体化输入方法”,属于汉字信息处理技术研究领域。
用计算机、手机输入汉字,存在效率低下、难学易忘、违反汉字规范、不利于手写汉字的学用等问题,长期未能解决,影响了汉字信息处理技术的发展和计算机应用的普及。本发明包含一体化计算机汉字输入法和一体化手机汉字输入法两种输入法,具有良好的规范性、易学性和快速性,前者以一体化字母形码编码,后者以一体化数字形码编码,两种输入法的字母与数字是顺序对应关系,用户只要在计算机汉字输入中学会字母形码,也即会进行快速的手机汉字输入,以一体化方式解决当前汉字输入所存在的问题。
计算机汉字输入法的现状堪忧。由于快速性好的形码输入法难学易忘、不符合汉字规范,现在大多数人使用拼音输入法,输入效率不高,智能拼音整句输入有局限性,对一些文本返回修改过多,不适合应用,不能满足快速输入的需要。另外,使用拼音输入依靠在同音字中挑选汉字,长期使用形成依赖,造成使用者手写汉字困难,提笔忘字,错别字增多。中国社会科学院语言研究所所长沈家煊指出:“使用键盘书写将对我国语言生活发生极其深刻的影响。一方面,拼音输入的普及有利于普通话的进一步普及,汉字难写的弊端也得到克服;另一方面,手写汉字对越来越多的人来说将变得困难,……最近有报导说,一个大学生二百多字的手写求职信居然出现12个错别字。这说明我们的母语教学存在很大的问题,也跟键盘书写有关系。”(语言文字网《对语言生活、语言规范的思考》)
手机汉字输入法使用数字码输入汉语拼音效率更低;而且手机嵌入式汉字输入技术和市场90%被国外产品垄断,每年专利使用费数亿元,已经花掉几十个亿。单独开发数字形码用于手机,效果不佳。
“汉字形码计算机手机一体化输入方法”的技术特征是:
①“一体化字母形码”选择以26个字母作代码的部件式形码,供计算机汉字输入使用。为保证字母形码具有最好的规范性和易学性,本发明遵守各种汉字规范和汉字使用习惯,采取多项措施与部首检字法衔接,以求实现学用汉字和学用输入法相辅相成。例如我们现在有了先进的电子词典,但大多数人查生字时不能依据字形直接输入该字,仍然要通过查部首、数笔画,再靠目力找到要查的生字,效率极低,与现代信息技术的发展不相适应,解决的方法就是要借助于汉字形码直接输入该字。从原理上看,任何一种汉字编码都可以拿来为汉字排序编电子字典,但在事实上很多汉字输入法的编码是不适用的。音形码或形音码不适合用来输入生字;笔画式形码输入速度慢;数字码承载信息少,重码太多,使用效果不佳;只有用字母编码的部件式形码最合适。
一体化字母形码应用新的编码技术,实行双码部件理据性表达法,不搞拆分直接编码;对全部编码部件进行有理据的表达,不需要背助记口诀;编码规则最简化,不学识别码;单个汉字输入和词组与单字混合输入都具有良好的快速性;做到规范性、易学性和快速性俱佳。
②由“一体化字母形码”的字母代码与数字进行顺序对应转换所得到的“一体化数字形码”,是经过多种转换方案的优选和对两种编码的关联调整最后确定的,使用方便,保证重码少输入效率高。使用一体化数字形码有一个前提,即字母形码的输入操作不能对键位指法有所依赖,否则编码印象模糊,由字母转换为数字会有困难。本发明应用汉字免拆分直接编码,有利于一体化数字形码的使用。
依据本专利申请编制了以下编码库,本说明书从中引用了有关数据资料:
①一体化字母形码GB2312-80汉字及词组编码库,用于计算机汉字输入法常用档;
②一体化字母形码GBK汉字编码库,用于计算机汉字输入法备用档;
③一体化字母形码GB2312-80汉字编码库,用于编制电子字典;
④一体化数字形码GB2312-80汉字编码库,用于手机汉字输入法。
对于今后汉字内码标准的变化,也将以常用和备查两档处理。
一体化计算机汉字输入法的技术特征
(1)对全部编码部件进行有理据的表达,不背助记口诀
①对有读音信息的编码部件用汉语拼音第一个字母表达
i.成字部件用该字汉语拼音第一个字母表达,如:
贝-B,寸-C,大-D,方-F,口-K,立-L,木-M,女=N,人-R,王-W,又-Y。
例字:树=MYC,全=RW,如=NK。
ii.对有名称的部首取其特征字的汉语拼音第一个字母表达,如:
病字旁,疒-B;    竹字头,-Z;    犬字旁,犭-Q;    走之儿,辶-Z;
立刀旁,刂-D;    双耳旁,阝-E;    宝盖儿,宀-G;    单人旁,亻-R。
例字:符=ZRC,防=EF,位=RL,达=DZ,狂=QW。
iii.横、竖、撇、捺和点、提六种笔画用其名称的汉语拼音第一个字母表达:
横,一-H;竖,丨-O(此系代码借用,下面④介绍);撇,丿-P;
捺和点,入-N,、-N;提,刁-T。
例字:合=RHK,引=GO,血=PM,主=NW,或=GKT。(弓-G,皿-M,戈-G)
上述方法需经过选择有限使用,不是不加选择地对同音部首一律用同一个代码表达,例如艹、虫、车不能都C表达,以避免出现大量重码。
②对某些没有读音信息的部件采用“同形对应法”表达,即用与其形状相近的字母直接表达,如:凵-U,丆-T,彐-E,丩-Y。
例字:画=HTU,寻=EC,页=TB,叫-KY。
这些部件在国标汉字基本集中不是字,有的在GBK字库中是汉字,如丆、丩,但很少有人认识。同形对应法简捷直观,符合汉字学习的心理特点。
彐可以出现在字的上、下、中、右各部位,在寻、灵、当、雪、归、急、邹字中都含有彐,若用寻字头或雪字尾来命名并不切贴,用表形的方法效果最好。
③对汉字折笔规范中25种折笔笔形按形归类,用同形对应法表达:
L形折:乚ㄥㄑ-L,孔=ZL,包括折笔规范中5.4-5.8,5.11和5.19;
Z形折:乙
Figure G2007100941433D00031
-Z,亿=RZ,包括折笔规范中5.12-5.14,5.16,5.22;
半Z形折:
Figure G2007100941433D00032
乛-Z,买=ZED,包括折笔规范中5.1-5.3,以及5.15;
S形折:勹乃-S,夸=DES,包括折笔规范中5.17,5.18,5.20,5.21,5.23-5.25;
Figure G2007100941433D00033
撇钩折:乄-P,乄=PN,包括折笔规范中5.9,在GBK字库中出现。
现在流行的五笔画法将所有折笔归为一类,将提笔归于横,这样简化处理适合于计算笔画多少和表示笔顺,但不利于在汉字编码中区分字形,而25种折笔笔形在编码时难以区别和表达,应用不便,以同形对应法归类表达适合编码需要;笔画提和横不难区分,独立使用有利于区分字形。
④代码借用和零声母处理
在上面的编码部件表达方法中,字母I、O、U、V、A的用处很小,需要让这5个字母发挥作用:
i.借用O表达水、氵和丨(竖),如:泉=B0,沽=OSK,引=G0;(白-B,十-S)
ii.借用V表达手和扌,如:搿=VRHV,批=VBB;(匕-B)
iii.借用A表达艹和乂(叉),如:花=ARB,义=NA;
iv.对拼音为yi、yin、ri的编码部件和拼音为yu、yue的编码部件实行零声母处理,即亠(衣字头)、弋、尹和日等部件用I表达,羽、月等部件用U表达,如:京=IKX,代=RI,郡=IKE,时=IC,翅=SYU,明=IU。(小-X,阝-E,又-Y)
代码借用和零声母处理的方法在各种拼音输入法中多有使用,本编码使用量少,不会造成记忆困难。
(2)使用“双码部件理据性表达法”,不学拆分规则
长期以来,汉字形码的编制始终沿袭早期的“拆字输入”、建立“汉字键盘”等理念。这种编码理念要求把每个字根(编码部件)分配到键盘上,输入汉字即是把汉字拆成字根,再用“汉字键盘”把各个字根键入。
实际上,汉字输入的实质是向计算机键入汉字的编码,所谓用“汉字键盘”输入字根只是一种比拟化表述,当初因为字根表达的无理性和汉字拆分的复杂性,需要借助这种比拟化思维来构思。现在由于《汉字部件规范》已经确立了汉字拆分的基本原则,给出了“汉字基础部件表”,编制部件式形码不应再重新制订拆分规则,故本方案对用户不引入“拆分汉字”和“汉字键盘”等概念,只学习如何表达编码部件,如何对汉字编码输入,这有利于编码技术的创新,也会使学习得到简化。
新的编码技术能够解决拆分规范性、表达理据性与减少重码的矛盾,达到三者俱佳的目标,现以实例说明如下:
《汉字部件规范》规定对止、重两个独体字不准进一步拆分。若把止、重两字都选作编码部件,分配在Z键上,符合规范,易学易记,但有重码字:趾=踵,芷=董。而为了减少重码,就出现了违规拆分重字、自定拆分规则的编码,“重”、“踵”两字在各种输入法中的拆分及编码如下:
五笔字型:重=丿一日土=TGJF,    踵=口止丿土=KHTF
二笔码:重=Z 丿一丨一=ZQGZ,  踵=Z口丿一丨=ZLQG
郑    码:重=千日二=MEKB,      踵=足千日二=JIKB
(郑码用双码,千=ME,足=JI)
一体化字母形码采用的技术是:遵守汉字部件规范,不拆分“重”字,取其为双码部件,用ZT来表达,其中前码Z是重字的汉语拼音第一个字母,后码T是重字的下部结构特征土字的汉语拼音第一个字母,于是可以直接编码:踵=KZZT,趾=KZZ,(足=KZ)符合规范而不重码。这种方法称为“双码部件理据性表达法”。
由比较可知,对“重”这样的独体字,使用“双码部件理据性表达法”符合规范,不用学习拆分规则,表达有理据容易学习记忆,对踵字采用直接编码用户不会产生困难。而其它几种形码,由于拆分的复杂性和表达的无理性,要学会拆分才能进行编码。
在其它形码中需要作复杂拆分的独体字,在一体化字母形码中都不拆分,取为双码部件,其表达的方法是:前码是该字汉语拼音第一个字母,后码依据该字下部结构特征或末笔笔画名称取其汉语拼音第一个字母表达,如:
矛=MP,牙=YP(末笔为撇);    夷=IR,两=LR,内=NR(下部为人);
毛=MQ(下部为七);年=NS,    平=PS(下部为十);
里=LT,重=ZT(下部为土)。
双码部件理据性表达法又叫二维表达法,因其可以配置在由前码(竖列)和后码(横列)构成的二维平面上,具有直观性,配置情况(局部)如下:
  A……P  Q  R  S  T……Z
L            两    里
M      矛 毛
N            内 年
汉字部件规范含有汉字基础部件560个,其中属于国标汉字基本集448个,不搞违规拆分,编码部件的数量较多,按传统方法分配到键盘上(一维表达),必然会造成大量重码,所以对一部分独体字进行二维表达是很关键的技术措施。虽然编码部件数量较多,但学习有理表达的编码部件不需要从头背诵记忆,见到了能够识别即可,属于心理学中的“辨认法”,学习难度不大;只有学习无理表达的编码才需要用“记忆复现法”,死记硬背,难记易忘。
利用“双码部件理据性表达法”能够方便地把合体字部首取作双码部件如:鱼=UH,齿=CU,麻-ML,与部首检字法一致,并能避免出现“无尾鱼”——“鱼”这样的部件。
(3)编码规则最简化
一体化字母形码中合体字、单码部件字和双码部件字的编码规则最简单:
①合体字的编码规则:按照汉字编码部件之间的自然划分,用代码表达编码部件,依照笔顺取前面三码及最后一码,不足四码在输入时补空格键结束。
例如:树=MYC,理=WLT,嗓=KYYM,疆=GTHH,(弓-G,土-T)。
在合体字编码时,双码部件是取两个码,还是只取前码或后码,由前三后一的规则来确定,不增加任何特殊规定。例如含有双码部件“车”的汉字,车的取码为:
(车=CS,辶-Z,小=X,兀=W,冖-G,鱼=UH)
连=CSZ,轮=CSRB,军=GCS,挥=VGCS——车取双码CS;
鲢=UHCZ    之前有两码,第三码按顺序取车之前码C,第四码取Z。
辉=XWGS——车之前已有三码,第四码取最后一码即车之后码S。
②单码部件字的编码规则:编为三码,在单码部件的代码后按首笔和末笔笔形补加两个代码。如:木=MHN,厂=CHP,方=FNP,匕=BPL,口=KOH。
③双码部件字的代码即是其编码。
(4)补码避重简单易行
①一体化字母形码对三码字不加补码,如:但=RIH,设=YJY,也不需设三级简码。
②对两码合体字按照两个部件的末笔笔形补加两码,如:
对=YCNN,讨=YCZN,训=YCZO;(又=Y,寸=C,言=Y,川=C)
他=RYOL,信=RYOH,佣=RYOO,仅=RYON(也-Y,用-Y)。
空下的两码码位用以配置两码简码字。此例中的简码字是,对=YC,他=RY。
(5)单个汉字输入的快速性
在计算机汉字输入法研究中有人把单个汉字输入视作“初级阶段”,整句输入才是“高级阶段”,忽略了单个汉字输入的基础性和广泛适用性,对解决汉字输入问题不利。
一体化字母形码能够进行高效率的单个汉字输入,适用于各种文体、文本;而且常用汉字只有三千多个,使用单字输入可以较快达到不假思索地熟练使用,并可在单个汉字输入的层面有效实现一体化汉字输入。
汉字输入共有三个步骤:编码、键入和重码字键选,一体化字母形码针对以上三个步骤采取提高快速性的措施:
①减少编码用时
一体化字母形码保持独体字、部首等汉字基础部件完整,字形信息保留得多,故识别快编码快。若违规对独体字进一步拆分,则字形信息减少,拆分费时,编码时间加长。
②减小平均码长
i.精心配置一码字和两码字
汉字的使用频度极不平衡,根据国家语委编制《现代汉语通用字数据统计表》中的“使用度”数据计算,国标基本集汉字使用度总和为940万;排在使用度前30位的汉字,其使用度之和占总和的23%;前500位占77%。为减小输入文件的平均码长,一体化字母形码用一码和两码的码位配置高频汉字的简码字:
一码字26个,如:大=D,了=L,人=R,上=S,为=W,要=X,和=K;
两码字500多个,如:过=CZ,防=EF,安=GN,种=HZ,最=IY,新=LJ。通过计算,一体化字母形码一码字和两码字的使用度之和(覆盖率)高于其他形码:
一码字使用度总和大于20%(五笔字型19%,郑码17%);
两码字使用度总和大于48%(五笔字型35%,郑码41%);
两项之和大于68%(五笔字型54%,郑码58%)。
ii.三码字不加补码
一体化字母形码的三码字不加补码,减少了四码字,已如前述。
iii.单码部件字只补首尾两个笔画码为三码字,而多数形码补三个码为四码字。
以上三项措施使得一体化字母形码在单个汉字输入时平均码长最小。
③降低重码率,单个汉字输入时重码字键选率小于1%
在国标汉字基本集,单个汉字输入的重码字键选率,相当于重码字使用度之和,经计算小于0.6%,在各种形码中最低(五笔字型小于2%,郑码3.8%以上),使用1%的指标是留有余量的。虽然单个汉字的字库重码率为5%(五笔字型8%,郑码7%),但多数是二级汉字,影响键选率较小。
④符号等同汉字输入
在国标汉字基本集的编码库中编入各种符号,可以象汉字一样地输入,以节省插入的时间。例如,可以方便地输入:
(1)、(2)、(3);∴∠β≠∠Y;气温32℃,等等。
(6)词组输入复盖率高重码少
输入规范的现代汉语文件使用词组较多,但收入词组过多会增加重码率。只选常用词组,既保持低重码率又能达到高覆盖率,是两全选择。在国标汉字基本集字库中编有两万多条复盖率高的常用词组,以两字和四字词组为主,与一级汉字不重码,重码率低,为4%左右,故一体化字母形码具有双重的快速性。词组的编码规则如下:
两字词组:[第一字首码][第一字末码][第二字首码][第二字末码]
三字词组:[第一字首码][第二字首码][第三字首码][第三字末码]
四字词组:[第一字首码][第二字首码][第三字首码][第四字首码]
多字词组:[第一字首码][第二字首码][第三字首码][最末字首码]
两字词组中对每个字取首、末两码的方法与双码部件字取前码、后码的方法具有一致性,便于两字词组编码。
一体化字母形码的输入效率与拼音输入法相比可以提高1倍至几倍,主要取决于输入文本的情况。输入规范的现代汉语连续文本,智能拼音使用整句连续输入返回修改少,平均码长3-4;一体化字母形码用单字与词组混合输入,平均码长约为2,基本无重码,效率约提高一倍左右。如果是离散文本或古文、诗词,则效率可以提高数倍。
(7)对国标扩展字库一体化字母形码仍为四码
国标扩展字库(GBK大字库)含有汉字字符21003个,由于字数比基本集多了两倍,为了减少重码,有的输入法用于GBK字库时将码元数增加到5个,如98王码国际版中,镕=QPWWK(五笔字型:熔=OPWK)。一体化字母形码用于GBK字库仍为四码,与国标基本集字库相同,镕=JGBK(熔=HGBK),重码字不需翻页寻找,影响输入速度较小。对国标扩展字库需要增加基本集字库所没有的编码部件,如:丱、門、戸;繁体字部件:貝(贝)、車(车)、飛(飞)、堯尭(尧)、齒歯(齿),等等,对于普通用户可以有需要时再去学习。
(8)能够实现学用输入法与学用汉字相辅相成
一体化字母形码遵守汉字部件规范、笔顺规范、折笔规范等,并注重与部首检字法有较好的衔接,表现在以下三个方面:
①注重编码部件与字典部首的衔接,国家语委推荐的《汉字统一部首表(草案)》中的部首,凡列入汉字基础部件者全部被选作编码部件,重要的合体字部首,如鱼、齿、麻、髟等也被选作编码部件,占部首表的80%;
②在编码部件的归并上与部首检字法一致,如:灬归入火,归入刂,
Figure G2007100941433D00081
归入卩,兰字头归入八,反字边归入厂,肀归入聿;手扌、水氵、心忄同部,彐互录同部;
③如果用一体化字母形码编制电子字典,因部首位于左侧和上侧的同部首字靠近排列,双码部首的字更加集中,对常用部首依据其音、形特征信息来表达,故可与部首检字法比照衔接。
用于电子字典的一体化字母形码检字法的片段将具有如下形式:
(G-工弓干瓜戈巛宀冖,GP-广,革-GS,GU-骨,拼音后的数字表示声调略去解释)
|
|
|
GKC  强 qiang2
GKCN 犟 jiang4
GKK  宫 gong1
GKT  或 huo4
|
|
|
GPCS 库 ku4
GPD  庆 qing4
GPDL 庵 an1
GPDN 廨 xie4
|
|
|
GSRB 靴 xue1
GSTT 鞋 xie2
GSXU 鞘 qiao4
GSYD 鞅 yang1
|
|
|
GUSC 髑 du2
GUSK 骷 ku1
GUSN 骶 di3
GUWK 骼 ge2
|
|
|
GXE  宛 wan3
GXED 剜 wan1
GXU  宵 xiao1
|
|
|
字典的形式,一体化字母形码在前,汉字后为汉语拼音。对于非拼音文字的汉字,前有由拉丁字母组成的形码表达字形信息,后有由拉丁字母组成的汉语拼音表示读音,使汉字在形、音信息的表达方面都具备科学性,适合信息社会的需要。
在电子字典中用一体化字母形码检字法查生字,速度会比用部首检字法或笔画法快几倍,能够超过用英文字典查单字的速度;教会学生使用一体化字母形码检字法,也就教会了学生用计算机和手机输入汉字,学用汉字与学用输入法相辅相成,而且没有导致提笔忘字的弊病。
违反《汉字部件规范》的编码不能与部首检字法衔接,如从“段”字和“追”字中拆出“亻”,违反规范,与部首检字法相矛盾,若在社会上普遍应用,汉字的基础知识就会发生混乱。
一体化手机汉字输入法的技术特征
一体化数字形码GB2312-80汉字编码具有规范、易学、快速的特点:
①字母代码与数字代码是顺序对应关系,转换方案系经过优选和反复调整而确定,由于字母形码运用了汉字免拆分直接编码,输入操作不依赖键位指法,故数字形码易于学用,用户学会一体化字母形码即会使用数字形码,对应关系很有规则:
A、B、C-1,   D、E、F-2,    G、H、I-3,
J、K  -4,    L、M  -5,     N、O  -6,
P、Q、R-7,   S、T、U-8,    V、W、X-9,
Y、Z  -0。
②一体化数字形码经过对相互关联的两种编码反复调整,各组重码字少于10,输入1-4个数字后即可直接选到所需汉字,不用翻页寻找,输入效率比国外专利高2-4倍。
转换实例如下:
汉字  字母形码  输入对应数字      输入后提示               选择
观       YJ         04         1:调 2:占 3:观 4:航       3
                            (调-YK-04,航-ZJ-04,占-ZK-04)
哈      KRHK       4734        1:哈2:啥3铪                 1
                             (啥-KRGK-4734铪-JRHK-4734)
《汉字形码计算机手机一体化输入方法》专利用途如下:
①可供信息产业的厂家开发自主品牌的计算机和手机系列产品;
②可供有关院校创建具有特色的计算机应用专业;
③可供使用拼音输入有困难的方言地区解决汉字输入问题之用;
④在国家制定解决汉字输入问题的计划时,可以作为选择方案之一。

Claims (1)

1.“汉字形码计算机手机一体化输入方法”总体设计的技术特征是:该输入方法包含一体化计算机汉字输入法和一体化手机汉字输入法两种输入法,前者以一体化字母形码编码,后者以一体化数字形码编码,其字母与数字是顺序对应关系,用户只需在计算机汉字输入中学会字母形码,亦即会使用手机汉字输入的数字形码;
一体化计算机汉字输入法的技术特征是:
一体化字母形码选择以26个字母作代码的部件式形码;应用“双码部件理据性表达法”,对汉字直接编码输入不搞拆分;对全部编码部件进行有理据的表达,不需要背助记口诀;
一体化手机汉字输入法的技术特征是:
对GB2312-80国标基本集汉字,一体化数字形码的代码与字母形码的代码具有顺序对应关系,系经过多方案优选、反复调整而确定:
A、B、C-1, D、E、F-2, G、H、I-3,  J、K  -4,   L、M  -5,
N、0-6,    P、Q、R-7, S、T、U-8,  V、W、X-9,  Y、Z  -0;
用一体化手机汉字输入法输入国标基本集汉字,各组重码字少于10,操作时只需输入1-4个数字即可直接选到所要的汉字;
一体化计算机汉字输入法编码部件与字母代码的表达关系如下:
(1)用于GB2312-80国标基本集汉字的编码部件表
A-艹乂
Figure F2007100941433C00011
                    AA=凹  AW=敖
B-八白
Figure F2007100941433C00012
贝疒                BA=必  BH=本  BL=巴 卜=BN  BS=卑  BX=不
C-虫厂寸册丑臣川束中匚     CC=长  CH=垂  CI=曹  CN=斥 CO=串  CP=才髟
                           CR=尺  CS=车  CU=齿
D-大刂丁东丹歹癶典       DD=刀  DQ=电  DS=段
E-阝卩二冫儿彐             EE=耳  EX=尔
F-方丰飞缶囗风巿父       FF=甫  FM=采  FO=弗  FR=夫  FS=非
G-工弓瓜戈巛宀冖           GA=更  GE=甘  GG=艮  GM=果  GO=干  GP=广
                           GS=革  GU=骨  GV=鬼
H-火灬一回户
Figure F2007100941433C00015
惠            HH=黑  HM=禾  HO=乎  HQ=虍
I-
Figure F2007100941433C00016
亠衣尹殷日              IL=已  IR=夷  II=衣衤
J-金钅甲井几见廴臼堇具兼    JJ=斤  JA=及  JD=夹  JF=巨  JG=戋  JR=久
                            JL=己  JO=巾  JX=柬  JZ=九
K-口                        KO=开
L-立了林鹿纟糸乚            LB=龙  LL=力  LM=来  LN=耒  LP=耂  LR=两
                            LS=吏  LT=里  LX=乐
M-木母皿民马免              MF=目  ML=麻  MM=米  MP=矛眉  MQ=毛  MX=末  MZ=门
N-女廿鸟农廾丶乀冂          NN=牛  NP=乃  NR=内  NS=年
O-水氵束丨士
P-丿勿彡片爿丬勹            PP=皮  PR=彳  PS=平
Q-犬犭七千
Figure F2007100941433C00021
且                              QF=曲  QH=丘  QN=求  QO=妻  QQ=佥  QZ=气
R-人亻冉艮                  RN=入
S-石十世豕上三卅鼠ㄅ        SA=史  SE=事  SF=四  SL=巳  SN=书  SS=食饣
                            SP=尸  SQ=氏  SU=山  SX=示礻
T-土田天刁丅                TG-
Figure F2007100941433C00022
TQ-屯  TT-凸
U-月羽聿玉与凵              UG-戉   UH-鱼  UO-雨  UR-臾  UN=禺  UV-禹
V-手扌厶                    VP=身  VV=申
W-王亡夂攵瓦韦为乌兀丸      WA-文   WG-我  WN-戊  WP-万  WX-未
X-心忄辛西习夕小象乡        XH-熏   XN=下
Y-言讠尢又用也业丩          YY=羊  YD=央  YH=亚  YI=酉  YO=永  YP=牙
Figure F2007100941433C00023
YT=由  YW=尧
Z-子州之中爪止丈辶占乙  ZA=专  ZD=制  ZE=乍  ZF=自  ZO=兆  ZQ=豸
                            ZT=重  ZZ=舟
另有归类部件和编码部件表中部件等同使用;
(2)扩展至GBK汉字,编码部件有所增加,与GB2312-80汉字的编码部件等同使用;添加新的编码部件:
Figure F2007100941433C00024
-B
Figure F2007100941433C00025
-G  尹-I-L  乁-N
Figure F2007100941433C00027
-U
Figure F2007100941433C00028
-U
Figure F2007100941433C00029
-W  卍卍-WX畢-BS 鬥-DD 龜-GL 華-HS 黽-ML  爲為-W
Figure F2007100941433C000210
-QM  丱-YY  夨-ZD
繁简对应、异体对应部件:
貝-贝-B  册-册-C  長-长-CC 車-车-CS  齒歯-齿-CU 東-东-D  黒-黑-HH
見-见-J  夾-夹-JD 糹-纟-L  龍-龙-LB  馬-马-MH   門-门-MZ 僉-佥-QQ
鳥-鸟-NH-饣-SS 魚-鱼-UH 烏-乌-WH 昜-
Figure F2007100941433C000212
-YP 堯尭-尧-YW 卄-廿-N
非G列汉字编码部件:戸-户-H   亊-事-SE   曺-曹-CI;
利用上述编码部件和字母代码之间的表达关系对汉字编码,其规则和步骤如下:
单个汉字按以下规则编码:
①按照合体字各编码部件之间的自然划分,用代码表达编码部件,依照笔顺取前面三码和最后一码,不足四码者在输入时加一个空格键结束;
②单码部件字,在单码部件的代码后按照首笔和末笔笔形补加两个代码;
③双码部件字,两个代码即是其编码;
④对两码合体字按照两个编码部件的末笔笔形补加两个代码;
输入后如有重码字,按照重码字前的序号,键选所需汉字;
高频汉字另有易记的一码简码和两码简码;
在GB2312-80字库中编有两万多条词组,按以下规则编码:
①两字词组:[第一字首码][第一字末码][第二字首码][第二字末码]
②三字词组:[第一字首码][第二字首码][第三字首码][第三字末码]
③四字词组:[第一字首码][第二字首码][第三字首码][第四字首码]
④多字词组:[第一字首码][第二字首码][第三字首码][最末字首码]
输入后如有重码,按照重码词组前的序号,键选所需词组。
CN2007100941433A 2007-10-15 2007-10-15 汉字形码计算机手机一体化输入技术 Expired - Fee Related CN101158884B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2007100941433A CN101158884B (zh) 2007-10-15 2007-10-15 汉字形码计算机手机一体化输入技术

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2007100941433A CN101158884B (zh) 2007-10-15 2007-10-15 汉字形码计算机手机一体化输入技术

Publications (2)

Publication Number Publication Date
CN101158884A CN101158884A (zh) 2008-04-09
CN101158884B true CN101158884B (zh) 2010-04-21

Family

ID=39306997

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2007100941433A Expired - Fee Related CN101158884B (zh) 2007-10-15 2007-10-15 汉字形码计算机手机一体化输入技术

Country Status (1)

Country Link
CN (1) CN101158884B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106959764B (zh) * 2016-07-19 2019-10-22 敬永权 一种有助于正确书写汉字的形码输入法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1366227A (zh) * 2001-01-16 2002-08-28 敬永权 汉字免拆分快速输入法
CN1841278A (zh) * 2005-03-31 2006-10-04 敬永权 双联码免拆高效汉字输入技术

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1366227A (zh) * 2001-01-16 2002-08-28 敬永权 汉字免拆分快速输入法
CN1841278A (zh) * 2005-03-31 2006-10-04 敬永权 双联码免拆高效汉字输入技术

Also Published As

Publication number Publication date
CN101158884A (zh) 2008-04-09

Similar Documents

Publication Publication Date Title
CN103995600B (zh) 一种盲文汉字转换装置及其方法
CN102253728B (zh) 一种声韵双拼汉字输入法及其虚拟键盘
CN101158884B (zh) 汉字形码计算机手机一体化输入技术
CN102053719B (zh) 华文汉字输入法
CN102279650A (zh) 简单规范输入法
CN109473007A (zh) 一种音素结合声旁的英语自然拼读教学方法及系统
CN105045410A (zh) 一种形式化拼音和汉字对应识别的方法
CN103176614A (zh) 多键共击速录
CN106959764B (zh) 一种有助于正确书写汉字的形码输入法
CN101093421A (zh) 汉字的四笔层次形码及形音的数字编码输入方法
CN101587381B (zh) 音形汉字无重码输入法
CN102023718A (zh) 声韵笔画主副部首输入法
CN102023717A (zh) 三五首次音码及其键盘
CN100545790C (zh) 计算机汉字信息猎头码输入法
CN1028680C (zh) 汉字全息码
CN100498663C (zh) 一种利用韩文字母输入汉字的方法
TWI541664B (zh) Computer - aided selection of word - free input
CN102929403A (zh) 优拼码汉字输入法
CN101859188A (zh) 声韵智能输入法
CN101364144B (zh) 一种计算机汉字输入方法
CN1328649C (zh) 汉字“三形联想”形码输入法
US20240143089A1 (en) Digitized New Language, Input Method Therefor, and Input Tool Therefor
CN106293130B (zh) 中文字音字形笔画笔顺快捷手写输入法
CN107066080A (zh) 汉字字音汉字与符号编码输入方法
CN101271366A (zh) 首尾双拼输入法及其键盘

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CI01 Correction of invention patent gazette

Correction item: Denomination of Invention

Correct: Chinese character shape code computer mobile phone integrated input method

False: Chinese character, code, computer and mobile phone integrated input technology

Number: 16

Volume: 26

ERR Gazette correction

Free format text: CORRECT: INVENTION NAME; FROM: CHINESE CHARACTER SHAPE-CODE COMPUTER AND MOBILEPHONE INTEGRATED INPUT TECHNOLOGY TO: CHINESE CHARACTER SHAPE-CODE COMPUTER AND MOBILEPHONE INTEGRATED INPUT METHOD

C56 Change in the name or address of the patentee
CP02 Change in the address of a patent holder

Address after: 200011 room 2, No. 1433, Lane 603, Tibet South Road, Shanghai, Huangpu District

Patentee after: Jing Yongquan

Address before: 200127, room 35, No. 181, Lane 1502, East Dragon Road, Pudong New Area, Shanghai

Patentee before: Jing Yongquan

CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20100421

Termination date: 20161015