CN1146574A - 优化赋音形码中文系统 - Google Patents

优化赋音形码中文系统 Download PDF

Info

Publication number
CN1146574A
CN1146574A CN 96106495 CN96106495A CN1146574A CN 1146574 A CN1146574 A CN 1146574A CN 96106495 CN96106495 CN 96106495 CN 96106495 A CN96106495 A CN 96106495A CN 1146574 A CN1146574 A CN 1146574A
Authority
CN
China
Prior art keywords
chinese character
key
code
chinese
radical
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN 96106495
Other languages
English (en)
Other versions
CN1108551C (zh
Inventor
赵树森
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to CN96106495A priority Critical patent/CN1108551C/zh
Publication of CN1146574A publication Critical patent/CN1146574A/zh
Application granted granted Critical
Publication of CN1108551C publication Critical patent/CN1108551C/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Document Processing Apparatus (AREA)

Abstract

本发明属计算机汉字输入技术领域,是一输入汉字的中文系统。字根定义读音并按首音分布在视为汉语拼音符号的键盘上,易记易键;字根码录入规则是“余部首笔邻键(建)根,码少划多笔顺分”,不等长码制,最长码长4;每键一码都有编码及对应一汉字提示,根码键完汉字不出时再击补码,字根汉字的补码是其前3笔划,非字根汉字的补码是由末字根的末笔和首字根首笔交叉确定,有编码唯一性,平均码长2.16,无特例、无重码;并有丰富词组录入和字典功能。

Description

优化赋音形码中文系统
本发明涉及到一种优化赋音形码中文系统。目前,在此技术领域中,笔写法、语音读入法技术都不算成熟,主要还要靠键盘输入汉字。计算机键盘输入汉字的技术方案大体上又可分为声码、声形码和形码三种。声码法与声形码法要求会正确读出所要录入的汉字,且重码多,录入速度低;对根本就不认识的汉字不好录入,可是,谨就GB2312_80中所列的6763个汉字而言,一般人至少就有3000个左右不认得的字。形码就不然,它对不认得的汉字也能录入。
在当前很长一段时间里,发明专利<优化五笔字型编码法及其键盘>(申请号:85100837,以下简称‘五码’,引用号[2])的实施方案,在诸多的形码方案中,在市场上占有着统治地位。但‘五码’字根难记、无编码唯一性、规则繁杂零乱、不规范、重码较多,不好学、不好掌握。
本发明人针对‘五码’的严重缺点,曾提出了“赋音形码汉字输入系统”(以下引用时简称“赋码系统“)发明专利,1996年4月13日获得专利权,专利号:ZL93114933.9(以下做引用时用[1])。
本发明目的在于,针对[1]作进一步的改进,使《赋码系统》升级为《优化赋音形码中文系统》(以下简称‘优码系统’),使‘优码系统’对汉字的录入方法极简捷、流畅而快速,处处规范、根本没有重码和特例,易学、易键,易普及推广,彻底解决汉字录入难的问题。
一种优码系统,是用键盘向计算机输入汉字的系统,该系统给出汉字的根码和补码录入方法、词组录入方法、字典功能及能提示简码和不同码长功能的提示行技术,并以下述最低限成分构成:作为中央处理机的主机、监视器和中英文键盘。
图1是字根总表及字根在键盘上的分布图;图2是键盘区位定义图及示出的本发明确定补码的机理;图3是一张矩形扁条式样的赋音形码字根键位图。
图1表明本发明选定的所有字根及其在键盘上的分布。图中小方框并在其中写上大写的英文字母,用来标明键盘上的键位标志。例如, 就表示‘Q’键位。一个键位标志在上,含有该键位标志的较小的方框,其中列写着一些该键位中所包含的字根。英文字母分别当做在该一键位上的所有字根的代码,在键入时要在小写状态下进行;
在图1所示的字根总表中,“折”是包括被现代汉语定义的一切折笔划,如:“>
Figure A9610649500062
ㄋ乙ㄑ∠乚レ
Figure A9610649500066
”等,也含有‘(’、‘)’及‘0’。
图2是为得到非字根汉字补码的机理示意图。
在图2中,英文字母示意键盘的键位,为得到非字根汉字的补码,而将整张英文键盘分成。横区’、‘撇区’、‘棍区’、‘捺区’和‘折区’五个区;并在每个区中又在不同的键位,标上‘横、撇、棍、捺、折’字样,用以表示每个键位的键盘分位名;图2示意出用非字根汉字的‘寻区笔划的笔型’来‘寻区’,然后在所寻到的区中,用非字根汉字的‘寻位笔划的笔型’来‘寻位’而确定一般汉字补码的过程。箭头就是示意了这个过程。
图3这张矩形扁条式样的赋音形码字根键位图,是供录入者在录入汉字时使用参考的,可参考关于图1的说明。
本发明的目的是通过下述中文系统的功能和方法实现的,分几方面说明如下:
1.汉字的笔顺是‘优码系统’汉字录入的基本依据之一;对笔顺的特殊规定,不利于纯洁汉字文化,只能引起混乱。本发明没有自己杜撰的特殊规定而是依据国家有关的规范标准——《印刷通用汉字字形表》[3]、《第一批异体字整理表》[4]、《简化字总表》[5]、《关于部分计量单位名称统一用字的通知》[6],并参考《汉字属性字典》[7]认定的。
2.‘优码系统’参考到现有的文献和汉语文字学的通例,并考虑到录入的方便,也将汉字的笔划归类为‘横、撇、竖、捺、折’五种基本类型,且横与提不分而归为‘横’,‘竖’与‘竖左钩’不分而归为‘竖’,点与捺不分而归为‘捺’。
汉字笔划的基本类型称为‘笔型’。
将汉字笔划分为‘横、撇、竖、捺、折’五类。汉语言文字学和中国人久已习惯于如此的分类了。久远的不说,1980年再版的《辞海》[8]、《新华字典》[9]就是这样分类,且也是‘横、提’不分、‘点、捺’不分,只是将‘捺’归为‘点’。
优码系统纠正了[2]的‘按笔划的走向’不规范而可能引起混乱的笔划分类方法,对汉字笔划的分类,是就规范的印刷楷体而言,详细说明如下:
横:含长的与短的。横’和‘提’,即“—、-、
Figure A9610649500067
”;
撇:含长的与短的‘撇’,即“丿、'”;其特点是:走向是右上而向左下,且由粗而细或粗细基本一致;尤其是对于短‘撇’,不能由细而粗。
竖:含长的与短的‘竖’和‘竖左钩’,即“丨、ㄧ、亅”;特点是:笔划骨干部分的走向是由上而铅垂向下,且粗细基本一致;在保持由上而向下粗细基本一致的大趋势前提下,允许稍稍地有所‘个垂直’。例如:‘丑’字的一竖,为使写出来好看,就要求在保持由上而向下且轻重、粗细基本一致的前提下而略向左下斜一点。
优码将‘竖’的读音‘从古读’定义为[棍、GUN]。(参考《康熙字典》[10])
捺:含汉语文字学中长的与短的‘捺’和‘点’,即“丶
Figure A9610649500071
”;对‘短捺’而言:笔划的走向是左上而向右下;对于‘点’而言,不是看其走向而是看其笔划的骨干部分轻细在先重粗在后,且笔划不舒展,几乎紧缩成一个‘点’之势,几乎谈不上‘走向’,它不是‘走’而是‘顿’。
例如:‘灬’字的四个笔划都是‘点’。‘冖’、‘军’等字的第一笔划,虽其‘走向’是由右上而左下,但它不是‘撇’,而是一个‘由细到粗的点’。不能像‘五码’所言,因其‘走向’是‘由右上而向左下’划归到‘撇’中去。
折:它是汉语文字学上概念上的‘折’,也含有‘(’、‘)’及‘0’;
笔划的代码是其汉语拼音的第一符号,笔划的简符、读音与代码如表1所示:
笔划    简符  读音  代码
横撇棍捺折     —丿丨丶乙  HENGPIEGUNNAZHE    hpgnz
            表1
3.为了帮助录入者记忆字根在键盘上的分布和方便录入,采取下述四种措施:
措施之一是:将字根或选有代表性的字根,印制到键帽的水平表面和位于操作员侧的斜立表面上,与键盘上原有的英文字母一起而实际地将标准英文键盘改制成一个‘中英文键盘’。这样,就可以参考键帽上对字根的标志而直接“敲字根”录入根码,例如,录入‘疆’的‘根码’,直接“敲字根”:‘弓一一’,是很便当的。
措施之二是:按键盘上键位的实际位置关系,将字根按读音相同的紧靠在一起,参考着图1,绘制一张矩形扁条式样的赋音形码字根键位图,如图3所示。这张图可方便地贴在录入者眼前的某个位置——例如贴在显示器的下(或上)沿,以便于参考。
措施之三是:“优码系统”对字根定义读音;英文键盘上的字母看作是汉语拼音符号;“字根分在与其首音相同的键位上”。这样当需要键入一个汉字时,根据字根的首音便可立即找到键位,录入特别方便。如‘李’字,当键字根‘木’、‘子’时,可立即找到键位‘M’与‘Z’。
1)英文键盘上的字母看作是汉语拼音符号
中英文键盘上各键被看作是汉语拼音符号,需要用两个字母表示的声母[ZH][CH][SH],分别用AIU表示,各键代表的音素,总括的开列如下:键位:B P M F  D T N L  G K H  J Q X  A  I  U  R Z C S  E Y  W  O  V汉拼:B P M F  D T N L  G K H  J Q X  ZH CH SH R Z C S  E Y  W W(O)Y (u)注音:ㄅㄆㄇㄈ ㄉㄊㄋㄌ ㄍㄎㄏ ㄐㄑㄒ ㄓ ㄔ ㄕ ㄖㄗㄘㄙ ㄜㄧ ㄨㄨㄛㄧ(ㄩ)注音:波坡摸佛 得特讷勒 哥科喝 基欺希 知 吃 诗 日资雌思 鹅衣 乌乌窝衣(迂)
(1)汉语拼音符号‘O’的读音与[WO]的读音很相像,就用‘O’键位表示[W]音素,并将以[W]音素开头的字根——‘我、扌、、 囗’置于‘O’键位。
(2)‘V’并不是汉语拼音符号,本发明用‘V’来表示‘ü’音素。而按汉语拼音方案‘ü’音素在首位时,要拼成‘YU’。据此,我们将发音的前面含有[YU](自然,首音是[Y])的所有字根:‘于 俞肀
Figure A9610649500083
雨予月 ’置于‘V’键位上。
(3)其余的字根也都被分配到与其首音相同的键位上。如此,字根在键位上的分布,可概括为:字根被分配到与其首音相同的键位上。
2)“优码系统”用下述用户容易接受和记忆的五种方法对字根定义读音:
(1)‘从古读’法赋音(参考《康熙字典》[10])
将有古读的字根,尽量‘从古读’,这些字根是:一[横]、丿[撇]、丨[棍]、[捺]、亠[头]、ナ[有]、彡[杉]、厶[私]、冫[冰]、冖[幂]。
(2)‘参考习惯称呼取读音’,详见表2。
   字根 习惯称呼 定义读音    字根 习惯称呼 定义读音
    犭攵阝卩礻辶廴 犬右反文耳刀秃耳刀示补走之秃走之 犬 Quan文 Wen耳 Er耳 Er示 SHi之 ZHi之 ZHi     刂亻忄艹宀讠乂 立刀单立人/立人竖心草字头宝字盖言旁叉 立 Li立 Li心 Xin草 Cao宝 Bao言 Yan叉 CHa
                        表2
(3)‘视为某字的一部分而取该字的读音’的方法赋音,详见表3。
            表3
(4)“粘着”
用形或意相近似的关系而‘粘着‘的方法定义读音,用户容易接受和记忆。例如,据形意与‘犭’相近的关系,将‘ ’“粘着”到‘犭’上,其读音也定义为[犬]。‘犭、 ’按其首音都分在‘Q键上;属于“粘着”的,详见表4。
表4中,被“粘着”其上用以作为读音依据的字根或汉字,我们称作“样板”。
        表4
(5)袭用
除此之外的字根,本来就是一个汉字的,就袭用该汉字的读音。例如:犬[QUAN]、田[TIAN]、囗[WEI]、兀[WU]、弋[YI]、幺[YAO]、彳[CHI]、番爿[PAN]、圭[GUI]、戋[JIAN]、隹[CUI]、肀[YU]、辟[BI]、廿[NIAN]、皿[MIN]、……等。说明:①‘曰’与‘日’形相似,将字根‘曰’的读音,字义为‘日’,这是为提高键入速度,而采取的措施。类似地还有如:土、士;子、孑;巳、己;七、匕……等。
  ②“开口念佛不取‘匚’[七]”的口诀:是指‘凵冂门
Figure A9610649500092
Figure A9610649500094
Figure A9610649500095
Figure A9610649500096
都读[佛,FO],其特点,有开口形状——但不含‘匚’[QI];
字根“匚”本是旧汉语注音的符号,读作[FO、佛],今借用其读音和有“开口形状”的特点而有此条。又为消灭重码,借用“匚”与“七”相似的特点,又将“匚”的读音字义为“七”并从而将“匚”归到“Q”键位。
③“横”与“提”不分,都读“横”;“竖”与“竖左钓”不分,都读“棍”;“点”(
Figure A9610649500101
)与“捺”(丶)不分,都读[NA]。
④并没有“长、爪、死”字根;
4.关于优码系统汉字与词组的键盘录入方法几点一般性的说明
1)‘优码系统’是用键盘敲击编码向计算机录入汉字或词组的,汉字的优码是由在前的‘根码’和在后的‘补码’合起构成的,正式编码的码长为2、3、4,是采用不等长编码制的,最大码长为4;优码对单个汉字或词组的录入是通过在小写状态下敲击中英文键盘上的26个英文键和空格键实现的。有26个汉字有一级简码。有些码长为2的汉字同时还兼有码长为3的编码或(和)码长为4的编码;有些码长为3的汉字同时还兼有码长为4的编码——优码系统将这些本有码长较小的编码汉字,还制有码长较大的编码是将这较长的编码当成“容错码”看待,是为取得更大的灵活性。
2)用键盘向计算机录入汉字的时候,首先要依次敲入‘根码’——在敲入‘根码’的过程中,一旦提示行出现了所要的汉字时,及时地敲一下空格键,该汉字就上到了编辑位,这时,自然不必再考虑补码了;当‘根码’不足四,且将‘根码’全部敲完后,提示行还不出现所要的汉字时,就还要接着敲入‘补码’;若在敲入补码的过程中,一旦在提示行出现了所要的汉字时,及时地敲入空格键,该汉字就上到了编辑位,否则就继续敲入下面的补码。
3)用“余部首笔邻键(建)根,码少划多笔顺分”的键入(或建立)字根方法,能建立起根码中各位的字根,顺次排列形成‘根码’;——但当这些字根多于4个时,只取前三个和最末一个,其余忽略(取前三末一的字根成根码);
“余部首笔邻键(建)根,码少划多笔顺分”也是键根的方法。‘建根’是建起一个字根;‘键根’是键入一个字根。若把“取前三末一的字根成根码”当成常识性的因素,因而不必在“根码录入方法的口诀”中出现。这样,“根码的键入(和建立)方法的口诀”就可说成是:“余部首笔邻键(建)根,码少划多笔顺分”。
4)‘优码系统’监视器的提示行具有下列功能和用途:当用户向计算机输入汉字的优化赋音形码编码(以下简称‘优码’)的第一位代码时,它显示所敲入代表一级简码的一个英文字符及与之对应的一级简码汉字,当继而再输入第二位代码时,它显示所键入的两个英文字符表示编码及与之对应的码长为二的汉字,……当继而再输入第N(N=3或N=4)个代码时,它显示所键入的所有英文字符表示编码及与之对应的码长为N的汉字。当所显示的即是所要的汉字时及时地敲击空格键,所要的汉字就上到了编辑位,——若不是所要的汉字,就继续敲击余下的编码。系统以此来提醒用户及时地敲击空格键来键入所显示的即是所要的汉字,并帮助用户记忆哪些汉字有简码或汉字的码长是多大;提示行也作为编辑器的监视器,优码系统允许用敲击‘退格符Backspace)回抹掉提示行上所键入的字符,每打一下退格符回抹掉一个,还允许重新编辑键入新的字符;
        5.关于“根码录入方法”的进一步说明
根码的键入(和建立)方法:“余部首笔邻键(建)根,码少划多笔顺分”
例如,‘夹’,要键(建)的根为
Figure A9610649500111
和‘大’。
①余部:汉字键去一些字根后,余下的部分。在未键之前,整个一个汉字就是‘余部’——此例就是‘夹’;‘夹’字键去
Figure A9610649500112
后,‘余部’就是‘大’;
②余部首笔:‘余部’的第一笔划。如‘夹’的首笔是‘一,‘大’首笔是‘一’
③‘余部首笔邻键(建)根’——与‘余部首笔’相邻或依次相邻的笔划都可以用来组成字根而键入。如:与‘夹’的首笔‘一’相邻或依次相邻的笔划既可以组成 ,也可以组成‘ナ’或‘大’。
④‘余部首笔邻键(建)根,码少划多笔顺分’——在做‘余部首笔邻键(建)根’的时候,要依‘码少划多笔顺分’的原则进行:
码少(第一优先级):键入的字根数目要最少。如‘夹’可键‘
Figure A9610649500114
大’或‘大’,字根的数目都是二——数目最少;划多(第二优先级):在第一优先级的前提下,当前这次键(建)根‘划数要最多’:如‘夹’的第二(位)次键入,‘大’是三笔划,若键‘ナ,是二笔划,自然是取‘大’才是‘划多’;笔顺分(第三优先级):若满足‘码少划多’的方案不止一个,最后用‘笔顺分’选一种“最合乎笔顺”的。该方法保证了优码有编码唯一性。⑤字根的笔划序列:将一个汉字的某个字根中的各个笔划依其在该汉字中的书写序号,由小到大的排列起来而组成一个数码,定义为该汉字中该字根的‘笔划序列’。‘字根的笔划序列’是一个数码,是隶属于特定的汉字的。例如,‘宁’字中的字根‘丁’的‘笔划序列’是45;而‘可’字中的字根‘丁’的‘笔划序列’却是15。
假如有一个汉字有两种拆分方案需用‘笔顺分’的规则加以选择。我们就先比较两种拆分方案的第一个‘字根的笔划序列’,看哪个方案的‘字根的笔划序列’小,就选哪个拆分方案;如两方案的第一个‘字根的笔划序列’相等,再依法比较第二个、第三个、第四个,取最早发生‘字根的笔划序列’较小者的方案。例如‘夹’的两种拆分方案:①夹:
Figure A9610649500115
大:wd——②夹:大:dc。详见表5的分析。
‘笔顺分’的数学描述:在对一个汉字进行拆分时,假如符合‘码少划多’的方案有两个,先比较两方案的第一个字根的笔划序列,再比较第二第三第四个,当第一次出现不等式的关系时,就取笔划序列较小的方案,舍弃笔划序列较大的方案。
若只有一(或二、三)个字根,已经全部敲完,提示行还不出现所要的汉字,应继而去敲‘补码’。
这里,我们所说的‘敲字根’和“敲字根的代码”都是指敲我们的“中英文键盘”上同样的一个键。——对录入汉字来说,“敲字根”比“敲字根的代码”来得“更直接”!同样的,当需要“敲根码”时,若把“根码”理解成“实际上是一个字根的序列”,也是来得“更直接”!我们将“把字根序列形式的根码中的字根,以其代码代之,并依序排列形成的小写英文字母序列”也称之谓“根码”——这才是机器从键盘上得到的真正的信息。例如‘疆’的‘根码’是‘弓一一’,也是‘gthh’,在不同的场合所指有所不同而已。
Figure A9610649500121
                         表5
                  6.‘补码’的录入方法
当需要对一个汉字加入补码时,要据汉字是‘字根汉字’或是‘非字根汉字’两种情况分别对待:
‘字根汉字’:当该汉字就是一个字根时,这个汉字称‘字根汉字’;
‘非字根汉字’:不是字根的汉字,称为‘非字根汉字’;(也称‘一般汉字’,这是绝大多数的情况)
(1)‘字根汉字’的补码录入方法是“依次击入该汉字的前三个笔划”,实在不出再补‘l’;例如:‘石’字,它本身就是一个字根,只有一个根码‘u’,其前三笔划是‘一丿丨’,补码是‘hpg’。‘石’字的编码就是它的根码加上它的补码:‘石一丿丨’,或‘uhpg’。
以下为便于表达,这层意思我们记为:石:石一丿丨:uhpg、又如:
八:人丿丶:rpn    廿:廿一丨丨:nhgg;
犭:犭丿 :qpzp口:口丨
Figure A9610649500123
一:kgzh;
当字根汉字的笔划数目很小,且当将所有的笔划都敲完后,所要的汉字还没有出来时,就要补打‘l’:例如:对‘一‘字,要打‘hhl’。例子如下:
一:一一:hhl  丨:丨丨:ggl  乙:乙乙:zzl     :乙一:fzhl
丿:丿丿:ppl  丶:丶丶:nnl  冫:冫丶一:bnhl  リ:リ丨丿:lgpl
(2)‘非字根汉字’补码的录入是:在与末字根的末笔划的笔型同名的‘区’中,敲击与首字根的首笔划的笔型同名的键盘分位的键位。或简言之:
‘非字根汉字’补码的录入方法是:“末根末笔寻区,首根首笔寻键位”。
如‘导’字的补码。参考图2的‘键盘区位图’,由‘导’的末根‘寸’的末笔划‘捺’作为寻区的笔划,寻到了捺区,首根‘巳’的首笔划‘折’作为寻位的笔划,我们就在‘捺区’中的‘折’位上而确定出p键——‘导’的补码‘p’。
对于‘根码’只有两个的情形,当打完一个‘补码’后,在提示行没有出现所要的汉字时,需要再击一下‘补码’。
关于‘非字根汉字’补码录入的实施例如下:员:口贝。当键入‘口贝’(kb)后,提示行出的是‘员’,正是所要,再补打一个‘空格键’,‘员’字就上到了编辑位;就不必打补码了;
加:力口。当键入‘力口’(lk)后,提示行出现的是‘部’并不是‘加’,就要补打一个‘补码’‘a’;提示行出‘加’,是所要,击空格,‘加’上到编辑位;
呷:口甲。当键入‘口甲’(kj)后提示行出‘嚷’,不是‘呷’,就要补打一个‘补码’‘e’;提示行出‘哩’,不是所要,再打一个‘补码’‘e’,提示行才出现‘呷’,打入空格键,‘呷’就上到编辑位了。
注意:‘每敲一键都有字,如是所要,击空格’的规律,例如:口:口丨一:KGZH,但当敲入‘kg’后,‘口’在提示行上出现,敲空格键,‘口’就上到编辑位。
            7.关于简码汉字与不同码长汉字的确定与录入
在汉字编码最前一个字母相同的那些汉字中,选择统计频度最高的一个汉字作为以该最前的一个字母为其‘一级简码’的汉字,优码的一级简码汉字及与之对应的键位(一级简码)如下:
   汉字一级简码 之的过是动到工一行就中他机为国后生人经主上于不要在了a b c d e f g h i j k l m n o p q r s t u v w x y z
对有一级简码的汉字,只要键入其第一个字根,提示行便有所键的一个英文字母与其所代表的汉字,键一下空格键,该汉字就录入完成。
在汉字编码的前两(或三)个字母排列相同的那些汉字中,选择统计频度最高的一个汉字作为以该两(或三)个字母为其正式编码,这样的汉字的正式码长就是二(或三)。
对于码长为二的汉字,多数情况下还有码长为三和(或)码长为四的编码存在,用作‘容错码’,它们都是依据同样的录入根码和补码的方法产生的,对这样的汉字,当敲入前两个码的时候,提示行便有所敲入的两个英文字母和该汉字出现,打入空格键,该汉字就上到了编辑位;若不打入空格键且若该汉字还有码长为3的编码,还允许继续敲入第三位编码,提示行照样有所敲入的三个英文字母和该汉字提示出来,此时仍可键入空格键使该汉字上到编辑位;此时,若不打入空格键且若该汉字还有码长为4的编码,还允许继续敲入第四位编码,提示行照样有所敲入的四个英文字母和该汉字提示出来,此时仍可键入空格键使该汉字上到编辑位;
对于码长为三的汉字,多数情况下还有码长为四的编码存在,作为‘容错码’。它们都是依据同样的录入根码和补码的方法产生的,对这样的汉字,当敲入前三个码的时候,提示行便有所敲入的三个英文字母和该汉字出现,打入空格键,该汉字就上到了编辑位;若不打入空格键,还允许继续敲入第四位编码,提示行照样有所敲入的四个英文字母和该汉字提示出来,此时仍可键入空格键使该汉字上到编辑位;
综上所述,输入单个汉字的方法,亦可说是“键了根码键补码,每键一键都有字,如是所要击空格,不是所要继续键”
                   8.词组的编码与键入方法
词组的编码码长总为4;它是以汉字编码为基础的,键入方法是:
(1)二字词取每个汉字编码的前两位码敲入(简记为‘22敲入’);
如,中国:口丨囗王(kgow)、红旗:纟工方(sgfp);
(2)三字词取第一个汉字编码的前两位码和第二、第三个汉字编码的第一个字根依次敲入(简记为‘211敲入’);如:
国务院:囗王夂阝:owwe;    数理化:米女王亻:mnwl;
(3)四字及多于四字词,取第一、二、三及最末一个汉字的第一个字根依次敲入(简记为‘111末敲入’);如:
工作人员:工亻人口:glrk;中华人民共和国:口亻人囗:klro。
词组之间或词组与单个汉字之间允许有少量的重码,当出现重码时,在提示行作提示,通过键入英文大键盘上与提示行提示的数字相同的数字键作出选择;
                     9.字典功能
在ASCII状态下,用‘功能键’ALT+N可进入或退出‘字典功能’,进入‘字典功能’后,可以切换到另一种汉字录入方法输入所要的汉字,然后在提示行上提示该汉字优码的‘编码’;也可再用‘功能键’ALT+N退出‘字典功能’。
                  10.关于繁体汉字系统的字根调整
本发明的汉字的编码录入方法,完全适合繁体汉字,——但要对字根进行必要的调整和补充:
(1)对单纯的繁体汉字系统而言,将图1所示的成字字根,替换成相应的繁体的;而对繁简混合的汉字系统而言,将图1所示的成字字根的相应的繁体的形式,补充进来即可。原来赋音和键位分配的思想仍要保持下来。例如,下列几个字根:“礻
Figure A9610649500151
辶执纟门 钅艹 贝鸟马
Figure A9610649500155
Figure A9610649500156
”就可进行这种替换或补充。
(2)可在单纯的繁体汉字系统,去掉那些根本就没有用处的字根。例如,在繁体汉字中根本没有“戋”这个结构成分,应从字根表中去掉“戋”。
(3)考虑到繁体的特点,还可补充进少数的字根。例如:补充进繁体的‘长’字等。
        11.‘优码’较现有技术相比所具有的有益的效果
1)‘优码’较‘拼音法’一类和‘声形法’一类都具有有益的效果
‘拼音法’一类和‘声形法’一类重码都很严重、不能盲打、对于不认得的汉字录入困难(而国家标准规定的6763个汉字中,一般人都有三、四千字不认得。)、因而录入速度不能高;而‘优码’根本没有重码,能盲打,对于不认得的汉字‘优码’照打无误,录入速度极大的高于它们;
2)‘优码’较‘五笔字型’,具有的有益的效果,列表比较说明见表6。
3)‘优码’较‘赋码’有重大改进并会产生有益的效果如下:
(1)‘优码’对字根的分布,重又过细地研究,作了部分调整:
①取消的字根有:
Figure A9610649500157
豕五戊
Figure A9610649500158
Figure A9610649500159
已言也
Figure A96106495001511
齿片丬
Figure A96106495001513
爪主
Figure A96106495001516
竹卅
Figure A96106495001517
Figure A96106495001519
Figure A96106495001520
甫开 责少下辛
②增加的字根有:
Figure A96106495001525
欠尹衤
Figure A96106495001528
矢乂車
Figure A96106495001529
Figure A96106495001530
Figure A96106495001531
豆门
Figure A96106495001533
圭亽黑足耂
Figure A96106495001535
隹俞 辟鸟内马;
③从一键位调到另一键位的有: 巳己→S,匚→Q,→P,肀、
Figure A96106495001540
→V,亻
Figure A96106495001542
リ→l
(2)对字根分布的部分调整所产生的有益的效果是:
①字根的总数减少了9个,减轻了用户的记忆负担;
②并为最终消灭重码提供了主要的依据;
③更符合人们的习惯。如,取消了‘’,增加了‘衤’、‘礻’;
④进一步降低了码长——使单个汉字的动态平均码长降到了2.15,使高频字和次高频字的码长都小于1;考虑了词组后,对有12343个词组的优码系统,汉字的动态平均码长降到了1.646;优码系统有5万余条词组的版本,其汉字的动态平均码长更进一步降低;
⑤并因而使字根更便于记忆,寻找和录入,也加快了录入速度。
               优化赋音形码 五笔字型
规范 ①对五类基本笔划按汉语文通常的规定,用户好掌握②笔顺按标准,用户易掌握③拆分规则严谨明确科学④解决了编码唯一性的课题,有编码唯一性 不规范 ①对五类基本笔划按笔势定义②笔顺有特例③拆分规则不明确、不科学④没解决编码唯一性的课题,无编码唯一性
规律 字根按首音布置:有规律,好记易键,录入方法:简单明确规律性强、好掌握 无规律 字根分布实际没规律,难记录入方法繁杂不明确难掌握
简单方便 ①根码录入规则简单明确只16字:余部首笔邻键根,码少划多笔顺分②字根汉字的补码用末首笔交互产生,不需识别字型③对简码提示,方便记忆和录入④根本无重码,录入汉字不必选择 不方便不简单 拆分规则不方便不简单,末笔字型识别需识别四种字型,对简码不提示,不便记忆和录入,重码率较高,录入重码汉字须选择
(1)学习掌握快:因字根易记,规则简单规范,无特例,编码唯一,简码提示,有键盘基础者,半小时可学会一天可熟练,不易忘,适合推广(2)录入速度快:原因除此栏之(1)外,尚有词组容量可大,使录入速度快(3)程序反应快。因没重码,每键一汉字程序检索到所要汉字不必往下检索 学习掌握慢:因字根难记,规则繁杂,不规范有特例,编码不唯一,简码不提示,须死记,不易学15天较熟练但也太难,易忘,速度慢,程序反应慢,因有重码,键入一汉字,程序要从头至尾检索码表
重大突破 (1)解决形码“录入方法简单且编码唯一”的重大课题(2)字根赋音合理,首音布置,数量适中解决了“字根易记易键”的课题(3)用提示行逐次单独提示各级简码及不同码长的汉字,解决了不等长编码制下编码机理可实现的课题及各级简码的记忆问题(4)在世界范围首家解决了“形码无重码”的重大课题。 (1)在不简单的规则下还没解决形码“编码唯一性”的重大课题(2)字根布置不合理,没解决“字根易记易键”的课题(3)没有提示行提示各级简码及不同码长的汉字,对不等长编码和各级简码须死记(4)重码较多!
学校推广 笔顺无特例,利于语文教学;规则简单编码唯一,完全规范,简码提示,录入方便,易学难忘,码长短,没重码,录入快,适合中小学推广 在中小学推广时,笔顺有特例不利于语文教学,字根难学难记规则繁杂,太浪废学生的教学时间
表6.优化赋音形码比较五笔字型所具有的有益的效果
(3)‘赋码’是首先看一个汉字的首笔划,再看汉字的末笔划,并以此来确定一般汉字的补码:而‘优码’则是首先看一个汉字的最末一个字根的末笔划,再看汉字首字根的首笔划,并以此来确定一般汉字的补码。这样改进带来的有益的效果是:
①最末的字根是刚刚打完的,其末笔划记忆犹新,马上就可确定了‘区’,而回过头来看首字根的首笔则是很轻易而方便的,随即定了键位,——加快了键入的速度;
②便于实施专利技术时的制作——有利于‘自动编码’;
③末根末笔与首根首笔确定补码,为达到无重码的最高境界,作出了有益的贡献。
(4)与‘赋码’对比,‘优码’进一步将根码的录入方法减化到只剩一句话:“余部首笔邻键(建)根,码少划多笔顺分”,省去了‘对独体部分要能散不连、能连不交’的规则——方法更简练、更方便录入了。
(5)‘优码’去掉了‘键长字根’和‘键副字根’的规定,不但进一步减化了编码键入方法,而且大大地降低了用户的记忆负担;
(6)‘优码’进一步发挥‘提示行技术’的功能,加补码时,完全不用去看‘字型’,进一步减化了编码键入方法,使其十分灵活。降低了用户的记忆负担;
(7)‘优码’将‘赋码’的‘横,棍,撇,捺,弯,拐’的六个区,简化成‘横,撇,棍,捺,折’五个区;并将每个区中对应键盘键位名的键位排列顺序,亦由‘横,棍,撇,捺,折’调成‘横,撇,棍,捺,折’,使录入更加简化;分区分位的调整也为字根的减少和无重码作出了贡献,下列几个汉字的‘赋码’编码和‘优码’编码作为例子就可说明问题:(见表7)
从表7可以看出,赋码的字根分布与加补码的方法不如优码——赋码有重码(‘仕’与‘儡’),而优码则没有。
4)优码必将引起好多相关领域的重大技术变革,并将波及社会生活的某些领域。
汉字          赋                         码            优                          码
字根 根码 补码 赋码 重码 字根 根码 补码 优码 重码
亻士 rt  tt  rttt  重 亻士 lt  ff  ltff
亻士土 rtt  rtt 亻圭 lg  f  lgf
亻田 rt  rt 亻田 lt  f  ltf
亻田田田 rttt  rttt  重 亻田田田 tttt  tttt
                                表7
‘优码’字根按首音分布易记易键,不易忘,拆分规则简炼科学,完全规范无任何特例,编码唯一,码长小,根本无重码,键入速度快——这样的‘优码’是现今不曾见到的。近日1996年5月6日,在《光明日报》第六版,张九成的《汉字输入不该是特殊技能》一文中竟说:“汉字的特点决定了形码的繁杂规则必不可少,所以‘不好学’是形码不可克服的固有矛盾”。然而‘优码’就是形码,它的规则并不繁杂,也不是‘不好学’,小学一二年级的学生半小时左右就可以学会。‘优码’必将引起好多相关领域的重大的技术变革,并将波及社会生活的某些领域。
(1)在通讯技术领域就是如此。
我们知道,现行的明码电报,由于它要求没有重码,其编码完全是靠死记的,,且要用经过训练有素的电报员去做。——电报码要求无重码——而‘优码’就是无重码。于是,拿‘优码’完全可以当成一种‘电报码’,
(2)必将促进软件汉化工作的大力开展:
(3)可能将促使汉化微机的大量生产:
(4)‘优码系统’完全规范、没有特例,码长小,无重码,词组容量大,易学易录,录入快速,对汉字的录入变得十分容易,使得‘汉字是普及计算机的瓶颈’问题迎刃而解。这将对我国计算机的普及起到十分积极的作用。
         11.能在很多技术领域来实现本发明
1)用万能挂接的技术方法,制成‘优化赋音形码中文系统[挂接版]’
2)制成独立的中文系统
3)能应用于中文处理系统、印刷系统、照排系统、中英文打字机、中英文学习机、中英文通讯设备、电传机、中英文终端机、电子字词典等。
               1.全文引用简符一览表赋码    =赋音形码赋码系统=赋音形码汉字输入系统优码    =优化赋音形码优码系统=优化赋音形码中文系统五码    =五笔字型
                2.全文引用的著作、规范与文献一览表[1]=《赋音形码汉字输入系统》      专利号:ZL93114933.9[2]=《优化五笔字型编码法及其键盘》申请号:85100837[3]=《印刷通用汉字字形表》[4]=《第一批异体字整理表》[5]=《简化字总表》[6]=《关于部分计量单位名称统一用字的通知》[7]=《汉字属性字典》[8]=《辞海》[9]=《新华字典》[10]=《康煕字典》

Claims (2)

1、一种优化赋音形码中文系统,利用中央处理器、监视器和用标准的英文键盘改进的中英文键盘三种设备向计算机输入汉字,其特征在于:
1)将字根赋以读音,并将标准西文键盘上的英文字母视为汉语拼音的符号,用‘A’表示[ZH]、用‘I’表示[CH]、用‘U’表示[SH];并用‘O’表示[W]音素、用‘V’来表示[ü]音素,其它键位上的英文字母直接视为汉语拼音符号,并将有[W]音素的下列字根:‘我、囗、扌、、 ’置于‘O’键位上,将发音的前面含有[YU]的所有字根:‘于
Figure A9610649500022
俞肀
Figure A9610649500023
雨予月
Figure A9610649500025
’置于‘V’键位上,其它选定的字根分在与其首音相同的键位上,所有字根及字根在各键位上的分布如下:Q:七匕
Figure A9610649500027
Figure A9610649500028
Figure A9610649500029
Figure A96106495000210
  D:大豆代刀丁旦        B:白巴宀勹   P:番爿
Figure A96106495000212
丿
Figure A96106495000214
犬犭
Figure A96106495000215
Figure A96106495000216
千欠   F:方彐
Figure A96106495000218
Figure A96106495000219
Figure A96106495000220
   卜冫贝辟        氵 W:午兀丌
Figure A96106495000223
Figure A96106495000224
王      冂门几
Figure A96106495000228
Figure A96106495000230
   N:丶乃廿   H:一禾
Figure A96106495000232
火黑
Figure A96106495000233
未文夊攵            G:戈
Figure A96106495000234
亽工弓广
Figure A96106495000235
       女鸟内         合E:二几
Figure A96106495000236
耳卩阝         
Figure A96106495000237
Figure A96106495000238
圭丨亅      Y:尹衤弋
Figure A96106495000240
讠J:金钅甲戋九臼R:人八
Figure A96106495000242
Figure A96106495000243
癶      Z:“折”巛乙            又由 幺用    吉 灬日曰                  子孑自早足            U:山
Figure A96106495000248
彡水氺
Figure A96106495000249
K:口 T:土士步田亠        X:小
Figure A96106495000252
Figure A96106495000253
     十矢石尸礻上   L:力立刂
Figure A96106495000257
リA:之廴辶止
Figure A96106495000259
执       西夕习心忄          手             亻
Figure A96106495000262
疒林且爫             C:艹廾
Figure A96106495000265
隹     I:厂镸乂车車彳  M:目木
Figure A96106495000267
米S:巳己
Figure A96106495000270
Figure A96106495000271
     V:于 予俞肀
Figure A96106495000274
   川
Figure A96106495000275
虫         皿冖矛;纟
Figure A96106495000276
Figure A96106495000277
Figure A96106495000278
Figure A96106495000279
Figure A96106495000280
  月               O:我囗扌
Figure A96106495000283
2)把上述键盘划归成横、撇、棍、捺、折五个键盘分区,每区各键分别定义成横、撇、棍、捺、折五个键盘分位名称。键盘分区和定义键盘分位名称如下:
横区:ASDFG、撇区:HJKLM、棍区:QWERT、撩区:YUIOP、折区:XCVBN,
横位:GHTYN、撇位:FJRUB、棍位:DKEIV、捺位:$LWOC、折位:AMQPX,
汉字的‘横’与‘提’不分,‘提’归为‘横’,‘点’与‘捺’不分,‘点’归为‘捺’,‘竖’与‘竖左钩’不分,‘竖左钩’归为“竖’,且‘竖’定义读作‘棍’;从而将将汉字的笔划分为‘横、撇、竖、捺、折’五种笔型;
3)系统取用不等长编码制,下式码长为2、3、4,最大码K为4,还有26个汉字有1级简码,汉字与其1级简码对应如下:汉字:之的过是动到工一行就中他机为国后生人经主上于不要在了1级简码:a b c d e f g h i j k l m n o p q r s t u v w x y z;
4)用改制的中英文键盘上的26个英文字母键和空格键向计算机录入汉字的方法是:余部首笔邻键(建)根,码少划多笔顺分,取汉字前三末一的字根组成的根码输入,当根码不足4,且全部录完还没达到目的,再录入补码;
非字根汉字的补码录入方法是由末字根末笔划寻同名的键盘分区,在此区中敲击与首字根的首笔划的笔型同名的键盘分位;对根码只有两个的情形,当打完一个补码后,在提示行没有出现所要的汉字时,要再加打一个相同的补码;
字根汉字的补码录入方法是依次击入该汉字的前三个笔划,对只有一个或两个笔划的字根汉字,当所有笔划全键完,所要汉字还不在提示行出来时,要再补键‘l’;
5)在按照上述的4)所述,录入单个汉字的方法向计算机录入汉字时,当打入欲录汉字的第一位码时,监视器上提示行显示该第一位代码及其对应的一级简码汉字,如该汉字即是所要录入的汉字,接着击一下空格键,该汉字上到编辑位,若该汉字不是所要,再接着打入欲录汉字的第二、第三及第四位码,提示行会依次显示打入的前两位、三位与四位代码及其分别对应的码长为二、三或四的汉字,当在此过程输入到某个码长时,当时显示的正是所要的汉字,击一下空格键,该汉字上到编辑位,如果该汉字不是所要,码长又不到4,再接着打入欲录汉字的下一位码;
6)词组的码长总为4,输入方法是:
(1)二字词取每个汉字优化赋音形码编码的前两位码敲入;
(2)三字词取第一汉字编码的前两位码和第二、三汉字的第一个根码依次敲入;
(3)四字及多于四字词,取第一、二、三及最末汉字的第一个根码依次敲入;
(4)在词组之间或词组与单个汉字之间允许有少量的重码,当出现重码时,在提示行作提示,通过键入英文大键盘上的与提示行上提示的数字相同的数字键作出选择;
7)在ASCII状态下,压住‘功能键’ALT并同时击一下N,可进入(或退出)‘字典功能’,进入字典功能后,可以切换到另一种汉字录入方法,输入所要的汉字,然后,在提示行上,便提示该汉字的优化赋音形码的编码,再压住‘功能键’ALT并击一下N,便退出字典功能;
2.根据权利要求1所述的优化赋音形码中文系统,为了帮助录入者方便录入汉字,采用如下几个措施:
措施之一是:在原有的标准英文键盘上,保持原有键盘键位不变,将每个键位上的所有字根或有代表性的字根和原有的英文字母,印制到键帽的水平表面和位于操作员眼前的斜立的表面上,并在键帽的面向操作者一侧的斜立的表面,印制上各键的键盘分位名以及在P键的右侧的键(‘[’键)印上“捺区”、在L键的右侧的键(‘;’键)和M键右侧的键(‘,’键)印上“撇区”、在Q键的左侧的键(‘Tab’键)印上“棍区”、在A键的左侧的键(‘Caps lock’键)印上“横区”、在B键的下方的空格键面上,印上“折区”,并对键帽染色,使不同键盘分区所染的颜色不同,将同一键盘分区的键帽,染上相同的柔和的颜色,从而将原有的标准的英文键盘改制成一个中英文键盘;
措施之二是:按键盘上键位的实际位置关系,将字根按读音相同的紧靠在一起,将字根总表绘制成一张矩形窄条的,可方便地贴在录入者眼前某个位置上的赋音形码字根键位图表,其式样是:
措施之三是:根据权利要求1所述的优化赋音形码中文系统,将标准西文键盘上的英文字母视为汉语拼音的符号,字根赋以读音,并将字根分在与其首音相同的键位上。
CN96106495A 1996-08-19 1996-08-19 优化赋音形码计算机汉字输入方法 Expired - Fee Related CN1108551C (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN96106495A CN1108551C (zh) 1996-08-19 1996-08-19 优化赋音形码计算机汉字输入方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN96106495A CN1108551C (zh) 1996-08-19 1996-08-19 优化赋音形码计算机汉字输入方法

Publications (2)

Publication Number Publication Date
CN1146574A true CN1146574A (zh) 1997-04-02
CN1108551C CN1108551C (zh) 2003-05-14

Family

ID=5119212

Family Applications (1)

Application Number Title Priority Date Filing Date
CN96106495A Expired - Fee Related CN1108551C (zh) 1996-08-19 1996-08-19 优化赋音形码计算机汉字输入方法

Country Status (1)

Country Link
CN (1) CN1108551C (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101446862B (zh) * 2008-02-29 2010-06-09 欧诗淼 汉字数字编码输入法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1114062A (zh) * 1994-06-01 1995-12-27 周晓东 形义五笔字型编码法及其键盘
CN1107595A (zh) * 1994-11-01 1995-08-30 彭志春 汉字音形编码

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101446862B (zh) * 2008-02-29 2010-06-09 欧诗淼 汉字数字编码输入法

Also Published As

Publication number Publication date
CN1108551C (zh) 2003-05-14

Similar Documents

Publication Publication Date Title
CN1023916C (zh) 简繁五笔字根汉字输入系统
CN101038508A (zh) Gb拼音输入法
CN105938402A (zh) 一种声形码汉字输入法及键盘
CN1108551C (zh) 优化赋音形码计算机汉字输入方法
CN1081004A (zh) 汉字结构笔顺数字编码方法
CN1150441C (zh) 字形笔顺码汉字输入法及其键盘
CN1031812C (zh) 赋音形码汉字输入系统
CN1334503A (zh) 计算机汉字活码输入法及其键盘
CN1020052C (zh) 形元汉字信息处理方法及其键盘
CN1267807C (zh) 一种用汉字及部首读音编码的汉字输入方法
CN1101568C (zh) 计算机汉字输入方法及其键盘
CN1031426C (zh) 边角特征顺序汉字输入法及其键盘
CN1201219C (zh) 一种计算机汉字编码输入方法
CN1162766C (zh) 一种汉字音形编码输入方法
CN1086480C (zh) 计算机汉字音形意自然编码键盘输入法
CN1337616A (zh) 快易码汉字输入法及键盘
CN1089175C (zh) 规范部首笔画合成输入法
CN1093182A (zh) 声韵笔对码汉字输入方法及键盘
CN1056007C (zh) 一种以汉字音角特征为信息元的计算机汉字输入方法
CN1203388C (zh) 汉字双笔六码输入法
CN1052314C (zh) 一种汉字二维数码的计算机键盘输入方法
CN1279427C (zh) 多维汉字编码输入法
CN1120404C (zh) 一种数字小键盘15键汉字输入法
CN1175722A (zh) 计算机中文通用输入法
CN1038888A (zh) 音形义兼容与汉拼字联词编码系列及键盘

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C19 Lapse of patent right due to non-payment of the annual fee
CF01 Termination of patent right due to non-payment of annual fee