CN1028680C - 汉字全息码 - Google Patents

汉字全息码 Download PDF

Info

Publication number
CN1028680C
CN1028680C CN89109707A CN89109707A CN1028680C CN 1028680 C CN1028680 C CN 1028680C CN 89109707 A CN89109707 A CN 89109707A CN 89109707 A CN89109707 A CN 89109707A CN 1028680 C CN1028680 C CN 1028680C
Authority
CN
China
Prior art keywords
characters
radicals
traditional chinese
chinese dictionaries
stroke
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN89109707A
Other languages
English (en)
Other versions
CN1043016A (zh
Inventor
杜冰蟾
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=4858138&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=CN1028680(C) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by Individual filed Critical Individual
Priority to CN89109707A priority Critical patent/CN1028680C/zh
Publication of CN1043016A publication Critical patent/CN1043016A/zh
Priority to CA002026228A priority patent/CA2026228A1/en
Priority to GB9024054A priority patent/GB2239542B/en
Priority to JP90419294A priority patent/JPH04270448A/ja
Priority to US08/095,485 priority patent/US5475767A/en
Application granted granted Critical
Publication of CN1028680C publication Critical patent/CN1028680C/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/53Processing of non-Latin text

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Document Processing Apparatus (AREA)

Abstract

本发明涉及汉字编码,更具体地涉及汉字全息码。它是以部首、笔顺,用拼音或笔画分类集约化定汉字区位的编码。本发明顺从人人皆知的常识和习惯,不要任何口诀,优选组字能力最强、小学一年级学生都能识读的100个部首,编排成照拼音第一个字母顺序排列的和照起笔的八种笔画和笔画数排列的100部首表。并由此编出“全息I码”和“全息II码”,针对不同用户,在通用机上操作。通用性强、成本低、击键次数少,重码率低,应用广。

Description

本发明涉及汉字编码,更具体地说,涉及汉字全息码电脑通用键盘输入技术。
众所周知,输入方法及编码是汉字信息自动化技术的关键之一。然而,如何使有五千年以上历史的、在亿万人中通用的繁难的方块汉字,变成国际通行的拉丁字母或阿拉伯数字代码,用电子、有线和无线电技术进行国际性的信息交流,是当今世界上亟待解决的难题。
为此,国内外众多的专家、学者在这方面进行了研究和探索。据报道,目前公布于众的汉字编码方法已达400多种。尽管已有数百套汉字检索的输入码方案提出,但真正付诸于实用的并不多,而付诸于实用又易于为广大用户掌握使用的更为少见。究其原因,无非是它们建立了诸多人为定义的规则,而这些规则又往往与人们公认且已习惯接受的汉字笔顺规则及构字规则不同,从而增加了人们需要重新记忆的内容,加之重码率与误码率也高,故而使操作人员甚感不便,难以灵活掌握,且操作速度不快,效率不高。
例如,支秉
Figure 891097074_IMG48
博士发明的“见字识码”。其优点在于只要基本上能掌握汉语拼音知识和能依照笔顺分解“字元”,则较易上机;能通用于小键盘,重码少。其不足之处是必须熟记许多关系字,并要求能准确地掌握速记词汇的声母、韵母。而要做到这一点,必须经一、二个月的专门训练,还往往要出错。
美国王安电脑公司获专利使用权的“三角编码法”。优点是若能背出“九九表”就能单手盲打,能用于仅有数字键的小型键盘,且重 码少。缺点是三个:首先,“九九表”难背,实际上必须放在机旁,减慢了击键速度;其次,裁减部首不尽合理,如“火”与“灬”分开,既不合乎习惯又无必要;如增收“舍”部,组字能力不强;又如将“氵”作为“豸”“豕”的本体,不符汉字的音义;再次,汉字本质上是具有四只角的方块字,为减少击键次数而舍去一角,就不免要人为地定出一套规则,用户常常出错。
朱邦复先生发明的“天龙仓颉造字法”。优点是可用于小键盘,重码少。缺点是人为制定了一整套的口诀、类别、辅助字形,不胜其烦,难于记全,学了易忘。
王永明发明的“五笔笔画”、“五笔桥”、“五笔字型”输入码。优点是能用于小键盘,重码少,不需要掌握每个汉字的字音。缺点是必须背出二十五句口诀,否则不能准确击键。同时,由于没有把英文字母与汉语拼音统一起来,就无法有效地利用汉字形、音、义三要素的音这一大要素,其所利用的信息不是“全息”的。
钱伟长教授发明的“钱码”。特点是将汉字结构作宏观归纳,与英文字母形体作近似类比,如将“门、匚、凵、
Figure 891097074_IMG49
、冂、”归纳类比于“乚”,将“目、且、耳、其、页、见、自、贝”归纳类比于“I”。但是,方块汉字的形体结构,毕竞同拉丁化字母的曲线、直线、圆弧形、角形组成的非方块形有极大的区别,容易使不习惯于近似类比的用户造成种种误码。
广西民族学院李冠盛发明的“杞”码法。优点是简单、易学,缺点是:(1)将部首与笔画分别归类,部首过分简单,归类于15个拼音字母,笔画仅比五笔多了一笔,归类于数字,归类缺乏一致性;(2)左折与右折实际上常常难以区分,如“乙”字就是左、右折结合不可分的,容易造成误码;(3)由于没有充分利用26个字母键,又没有充分利用0-9的数字键,离散度低,重码率高;(4)在编码中混用拉丁字母与数码,且不等长,缺乏编码的和谐、整齐,难以分字;(5)仅 适用于检索单字,不能快速检词语。
中国政法大学郭飞凤女士的“普及型无重码汉字部首编码输入方法”是一种由英文字母和数字号码总共36个键位共用组成的一套部首“音形”及“标音”组合码,其中,音形码包含有一个汉字以每一部首对应一个部首码,这样的音码在该方法中利用了半数左右,具有形、音、义俱全的三要素的传统部首。用户在击这些键位时可利用语音条件反射自然而然地把部首字与部分英文字母键结合起来。在这方面比起其它已有技术的汉字编码来说,在考虑易学,易记方面是前进了一步。但是,郭飞凤女士在编码中片面追求“无重码”,还使用了数学上重复排列的原理增加了键数,并将同一发音的部首正体和变体也分散于各键位上,因而又采用了10个数字键,使用户不能实现盲打击键。同时,又将相当多的形,音,义俱全的部首字割裂开来,例如“犬”与“犭”割开,“刀”与“刂”割开,还把部首字“山”、“言”、“月”、“竹”、“木”等不以发音而以类似汉字的形体安排于A、I、O、U和V键位上,从而放弃了语音条件反射。此外,又人为地增加了许多自相矛盾的笔画规则,例如,横(一)1,竖(丨)2,撇(丿)3,点(丶)4,单折(乛)5,挑(
Figure 891097074_IMG50
)6,提(
Figure 891097074_IMG51
)7,捺(
Figure 891097074_IMG52
)8,复折(乙)9,以及笔顺规则,例如,从上到下,从左到右,从外到内(如向字),从内到外(凶字),先横后竖,先横后撇,后横(如长字),先里头后封口,先中间后两边(如义字),先两边后中间(如从字),使用户在编码时不仅增加记忆量,而且在拆字时需数清笔画再击键,而常产生误码,从而降低了输入速度和增加了误码率。
本发明的目的是为了提供一种部首字可以按其汉语拼音的第一个字母全部标识的公知的电脑的英文键盘上进行编码的的汉字全息码电脑通用键盘输入技术。
本发明的另一目的是为了适应于不知发音的聋哑人,而在上述编码输入技术基础上再提供一种可以按照起笔的笔画和笔画数,将 100个部首排列为01-00的两数,编排于电脑的数字键盘上的汉字全息码电脑通用键盘输入技术。
本发明的汉字息码电脑通用键盘输入技术是以部首,笔顺,用拼音或笔画分类集约化来定汉字区位的编码。
本发明的汉字全息码电脑通用键盘输入技术包括部首;笔画:横(一)、竖(丨)、点(丶)、撇(丿)提(  );笔顺:从上到下、从左到右、先横后竖、先中间后两边。所述的部首选用100个部首字,按照其拼音的第一个字母标识在相应的公知电脑通用键盘的26个英文字母键上,其结构如下:
英文键    汉语拼音的第一个字母码
Q [犬(大犭
Figure 891097074_IMG53
豕)]
Figure 891097074_IMG54
(示礻)
W [王](
Figure 891097074_IMG55
)韦( )文(攵)
E [耳(阝卩)]二(
Figure 891097074_IMG57
)儿兒
R    [人(亻)]日
T 扌(手)]
Figure 891097074_IMG59
亠(丄)土田
Y [月(曰
Figure 891097074_IMG60
)]乂又幺( )羊(
Figure 891097074_IMG62
U [巫(
Figure 891097074_IMG63
)]
I [衣(
Figure 891097074_IMG64
衤)]
O (去 码功能键)
P [爿(丬片)]丿(
Figure 891097074_IMG66
A [广]厂(
Figure 891097074_IMG67
S [水(
Figure 891097074_IMG68
氵)]丨(
Figure 891097074_IMG69
)十(
Figure 891097074_IMG70
)厶(
Figure 891097074_IMG71
D [丁(丅
Figure 891097074_IMG72
)]、(
Figure 891097074_IMG73
丶)刀(刂)歹
F
G [弓]?6?5(丨乚 工(
Figure 891097074_IMG76
)骨
H    [火(灬)]-(一)禾
J [金(钅)几(幾几)巾彐(
Figure 891097074_IMG77
Figure 891097074_IMG78
)己( )臼
K    [口]凵
L [立]了力 (角)里(
Z [竹(?6?8)]止(
Figure 891097074_IMG82
)爪(爫
Figure 891097074_IMG83
)走(
Figure 891097074_IMG84
之辶廴)足(?6?4)隹
X [心(忄
Figure 891097074_IMG85
)]夕(攵)习(習)小(
Figure 891097074_IMG86
C [艹(
Figure 891097074_IMG87
屮)]寸车(
Figure 891097074_IMG88
)虫
V(
Figure 891097074_IMG89
)[鱼(魚)]雨
B [卜(
Figure 891097074_IMG90
)]八(丷八)勹(
Figure 891097074_IMG91
?6?8
Figure 891097074_IMG92
)匕冫(
Figure 891097074_IMG93
)贝( )白髟
N [女]丶廿( )牛(
Figure 891097074_IMG96
?6?4)
M [木)冖(冂 (門)马(馬)目(目四)
*说明:[    ]内为键名部首,(    )内为变化、繁体。
从上表可见,在这些英文键盘的26个键名中,V没有相应的语音拼音改作
Figure 891097074_IMG99
,O没有相应部首字,留作功能键。所述的笔画还包括弯、捺、钩,并以横、竖、点、撇、弯、提、捺、钩的顺序编排,其中凡带钩的笔画一律作钩,所述的笔顺还包括先撇后捺,先外后里再封口,并以先横后竖,先撇后捺,先外后里,先外后里再封口先中间后两边的编码规则编排。使用上述100个部首的汉字全息编码全部采用英文键盘的四位代码输入方法。这种汉字编码输入技术,简称全息
Figure 891097074_IMG100
码。
与以往的汉字信息检索输入码相比,本发明的汉字全息码电脑通用键盘输入技术,由于优先选用了常用的100个形、音、义皆全的并具有极强的组字能力的传统部首以及简易的笔画规则,既符合人们常识和习惯,易于记忆,又可使汉字信息边界清楚,具有简单易学,操作方便,输入速度快,重码率低以及推广容易等优点。
本发明比较以往的输入码,只要掌握100个常识部首字的第一个拼音字母,用相应的外文(英、俄、德、法、意、日、拉丁、国际音标等 等)键盘配合,100个部首字第一个拼音字母、在电脑通用键盘的26个英文字母键上标识,使全世界学习、使用汉文的人共同使用;本发明的独创性还在于它的简约化,一切从简从易,抛弃了所有人为的口诀和主观地定角、定高低、定区位的死记硬背的繁文褥节;本发明还灵活、和谐地将字母码与数码结合起来,使各种用户与机件都可通用。
本发明能广泛用于通用小键盘电子计算机和各种汉语工具书,取得了电脑、辞书、资料、电信四者编码的一致性。
采用本发明,大约只要化半天或一天时间就能编码上机,并具有不需专门培训,软硬件成本低廉,适合于小键盘通用件,平均击键次数少(每字平均约1.33次),重码率低(低于千分之一)等优点。
此外,本发明至少还可以在以下十个方面应用:1,中文电脑打字、编辑、排版;2,电报码与电传码统一于拉丁化字母,可由机器自动译为中文;3,全国邮政编码;4,中外文机器助译;5,古汉语与白话文机器助译;6,速记;7,缩写;8,图书编目、辞书索引用全息码;9,速抄、缩录;10,医药自我咨询,及农林牧副渔工商财文军政各行各业管理咨询。
本发明使繁难的方块汉字变成超过任何一种西文的全息码且发掘了汉字内在的美质,使汉字变成科学、规范、精炼、整齐、优美的集约化的编码,从而成为东西方文明大交流的一座宏伟的桥梁。
以下,将结合实施例对本发明作更详细的叙述。
实施例1
按100部首字汉语拼音的第一个字母顺序排列。26个字母中,V改作
Figure 891097074_IMG101
使用,O没有相应的部首字,留作功能键使用。100个部首字都是常用字,第一个拼音字母为广大用户所熟知。基本笔画出于唐宋以来沿习一千多年的“永字八法”,念作:横、竖、撇、点、捺、挑、弯、勾。凡带钩的一律作勾。用8种笔画显然比5笔、6笔更符合 汉字实际,又大大增加了区分重码的离散度。
2,笔顺的七条规则:
五万多个汉字,其形体千变万化,但书写的笔顺只有下列七条简单的规则。(“杞”字码等编码将笔顺规则增加到10条以上,是不合理的。)初小文化程度的用户,从小到老都应遵守这些规则,千百年来已成人们的习惯。无论从习惯上说,还是从视觉上说,起笔部首、续笔部首和接尾部首收笔部首、是最容易识别的。汉字中80%以上为形声字,由形旁与声旁两个偏旁组成,取起笔部首、续笔部首和接尾部首、收笔部首,也就完全兼顾了左右或上下两个偏旁,而不至于集中在一个偏旁里,充分发挥了加大离散度和去重码的作用。
依笔顺的7条习惯规则(先横后竖、先撇后捺、先左后右、先上后下、先外后里、先外后里再封口、先中间后两边),将汉字分解为部首(包括笔画);分解部首取最多笔画者。
汉字笔顺规则并举例如下:
(1)先横后竖    “十”为“一丨”
“干”为“一一丨”
(2)先撇后捺 “人”为“丿
“大”为“一丿
(3)先上后下    “兀”为一丿乚”
“区”为“一丿丶乚”
(4)先左后右 “么”为“丿 丶”
“仆”为“丿丨丨丶”
(5)先外后里    “月”为“丿一一”
“勺”为“丿丶”
(6)先外后里再封口    “日”为“丨一一”
“四”为“丨乛丿
Figure 891097074_IMG105
一”
(7)先中间后两边    “小”为“亅′丶”
“山”为“丨
Figure 891097074_IMG106
丨”
以上是为了说明笔顺规则,将例字分解成笔画,而本发明的编码表,则是依笔顺分解部首,每一步分解以最多笔画的部首为原则。如“鞘”字分解为“廿口十小月”,而不是“一…一”等等。汉字中极个别字需倒转纸张书版写成反文,如“或”字等,仍依实际书写的笔顺分解部首。
3,编码实例:
(1)部首字:100部首表中的部首,既是最常用的部首,又基本是独立的常识字。我反对把部首割裂成支离破碎的“字根”或“字元”,因为除了专门的编码员外谁都不识。部首以音归类,分一笔部首和组字能力较强的键名部首、一般部首。这样区分目的,是为了下面给复合字编码时减少重码字,使用上述100部首的汉字全息码电脑通用键盘输入技术,其编码步骤全部采用四个代码输入方法。在检索单部首字时不必区分,都以部首拼音声母、韵母的第一字母、起笔笔画、续笔笔画、末笔笔画代码击键,正体、变体、简体、繁体都这样编码,不能再分笔画的击O键。
因为一个拼音字母之下有几个部首字,用上述三个笔画具有8×8×8=512的离散度,不会有重码。例如:
一:HHOO    二:EHHO    三:SHHH:
:MDGO    门:MDSG    金:JPNH
马:MWGH    木:MHSN    目:MSWH
在同一拼音字母下,由于离散度大,部首基本不重码。
(2)两个部首的复合字:也用4个拼音字母代码,击键4次。
本发明编码不用字型区分,与王永明发明的“五笔字型”不同。王永明将字型分为左右型、上下型、杂型,实际上汉字字型远不止3种,还有左中右、上中下、对角、交叉、半包、全包等多种,而且有时 实难区分。信息利用的价值,在于信息的确定性。对于边界模糊的、难以区分的信息,用了反而容易出错。故本发明的全息码将字型区分排除在外。
两个部首的复合字,编码如下:
××××
起起收末
笔    笔
笔部笔部
首    首
部末部末
笔    笔
首画首画
这样,在两部首代码相同的情况下,还有8×8=64种离散度,比王永明用3种字型和5种笔画区分的3×5=15种离散度大4倍以上,因此重码少得多。
如起、末两部首为键名部首,可特殊对待,不需加笔画来区分,都改为O,用移动O还可以调整重码字使之不重码。双部首复合字编例:
冰:BTSO    江:SOGH    扛:TOGO
闰:MGWO    枉:MOWO    枚:MOWN
(3)三个部首复合字:4个代码依次为:起笔部首、起笔部首末笔画、续笔部首、收笔部首。当起笔部首为键名部首时,连击O键,不再击其末笔笔画代码。例如:
种:HDKS    桂:MOTT    花:CORB
祝:QDKE    贺:LPKB    你:ROBX
合:ROHK    欢:YDBR    树:MOYC
如遇极少的重码字,可用插入O去重。0键去重码的作用很大, 因为用足26个字母比用25个字母增加离散度为264-254=66,351,大大减少重码。
(4)四个以上部首的复合字:一般取起笔部首、起笔部首末笔画、接尾部首、收笔部首。若遇起笔部首为键名部首时,第二码改为续笔部首。
本发明充分利用26个字母,总离散度为26×26×26=456,976,对区分6万个汉字已足够。例:
民:GGHG    族:TBRQ    麒:AWEB
麟:AGWS    醇:XHLH
(5)词语文献快速码:
本发明的全息码,离散度达到456,976,除可输入5万多汉字外,还可输入40万条词语。输入词语,同样是用4个拼音字母,击键4次,这就意味着可以大提高输入单字的速度。汉字词语有2、3、4、5…等单字构成,40万条词语平均约120万字,原来要击键120万×4=480万次,现在只要击键160万次,平均每个方块字输入击键为1.33次,汉字具有单字构词能力,一个方块字相当于西文一个词汇,这就大大优于任何一种西文词语。
1).二个字的词语编码:2个字都分别取起笔部首与收笔部首(部首字改为末笔画),为4个字母的等长码。如词语中有一字为键名部首字,作特殊对待,后加O码,以区别末笔画相同部首。如:
海洋:SDSY    国家:MHDB    乙炔:GGHR
人民:ROGG    幸福:TSQT    辛勤:LSNL
2)三个字的词语编码:第一个字取首尾两个部首,再取第二、三字的起始部首;如第一个字为部首字,取其起始部首、末笔笔画;如第一个字为键名部首,则取其部首编码加O。例如:地球仪:TGWR;金字塔:JODT;大世界:QNNT;不夜城:DBTT;游乐场:SHPT。
3)四个以上字的词语:取一、二、三及末字起始部首。如:统一战线:YHBY,胸有成竹:YSAZ;成竹在胸;AZSY;中华人民共和国:KRRM;诺贝尔奖金:YBBJ;马列主义:MDTD;马克思列宁主义。MSTD;鲁迅全集:VGRZ;二十四史:ESMK;达尔文学说:QBWY;高能物理:TSNW;万里长城:DLPT;万里长征;DLPE。
当然,专用名词还可划分词类编码,如“中华    人民    共和    国”为“KSRS    ROGG    NBHK    MWDH”,划分后译成方块汉字同“中华人民共和国(KRRM)”。
在上述编码输入技术的基础上,为了充分利用公知电脑通用键盘,另选用100个部首,它们以二位数字代码代替拼音字母,安排在同一电脑通用键盘英文键上部的0-9共10个数字键上,其结构如下:
数字键    部首部分    数字键    部首部分    数字键    部首部分    数字键部首部分
01 一(一) 02 丨(丿) 03 丿(
Figure 891097074_IMG107
) 04 丶(
Figure 891097074_IMG108
丶)
05
Figure 891097074_IMG109
06 丿 07 (
Figure 891097074_IMG110
) 08 ?6?5(
Figure 891097074_IMG111
09 二(
Figure 891097074_IMG112
) 10 十( ) 11 厂(
Figure 891097074_IMG114
) 12 丁(
Figure 891097074_IMG115
13 卜(卜) 14 乂 15 八(丷
Figure 891097074_IMG116
) 16 人(亻)
17 勹(
Figure 891097074_IMG117
) 18 儿(兒儿) 19 几(幾
Figure 891097074_IMG118
) 20 匕
21 冫(丄) 22 (
Figure 891097074_IMG119
) 23 24 凵
25 厶(
Figure 891097074_IMG121
) 26 又 27 了 28 刀(刂)
29 力 30 三(
Figure 891097074_IMG122
彡巛) 31 干(
Figure 891097074_IMG123
) 32 土
33 工(
Figure 891097074_IMG124
) 34 卄(
Figure 891097074_IMG125
屮) 35 寸 36 扌(
Figure 891097074_IMG126
手)
37    口    38    山    39    巾    40    夕(久)
41 广 42 门 (門) 43
Figure 891097074_IMG127
Figure 891097074_IMG128
Figure 891097074_IMG129
) 44 尸(卩已)
45 弓 46 己(
Figure 891097074_IMG130
) 47 女 48 幺(
Figure 891097074_IMG131
49 马(馬) 50 小(忄
Figure 891097074_IMG132
) 51 习(習) 52 丰(
Figure 891097074_IMG133
53 王 54 韦(
Figure 891097074_IMG134
) 55 廿(
Figure 891097074_IMG135
) 56 木
57 犬(大犭
Figure 891097074_IMG136
豕) 58 歹 59 车(
Figure 891097074_IMG137
) 60 止(
Figure 891097074_IMG138
61 日 62 贝(貝) 63 牛(
Figure 891097074_IMG139
) 64 爪(爫
Figure 891097074_IMG140
65 月(日
Figure 891097074_IMG141
) 66
Figure 891097074_IMG142
67 文(攵) 68 火(灬)
69 心(忄
Figure 891097074_IMG143
) 70 爿(丬片) 71 水 (
Figure 891097074_IMG144
氵) 72 示(示衤)
73    石    74    目(目四)    75    田    76    禾
77    白    78    立    79    穴    80    耳(阝卩)
81    西(西)    82    虫    83    竹(?6?8)    84    臼
83
Figure 891097074_IMG145
86 衣(
Figure 891097074_IMG146
衤) 87 羊( ?6?2) 88 走(
Figure 891097074_IMG148
之辶廴)
89 巫(
Figure 891097074_IMG149
) 90 里( ) 91 足(?6?4) 92 身
93    言(讠)    94    面    95    隹    96    金(钅)
97    魚(鱼)    98    骨    99    食    (食饣)    00    髟
这种输入技术简称为“全息Ⅲ码”,其编码步骤除了部首有唯一的编码,毋须用起末笔画外,其它编码顺序则似“全息Ⅰ码”。编码步骤则全部采用六个代码输入方法。
“全息Ⅱ码”与“全息Ⅰ码”在总体上是一致的,都顺应了群众对部首、笔顺、笔画的常识、习惯,少利用拼音这一信息,是完全适应不识西文和拼音字母的用户的,但它可用于只有10个数字键的更小的键盘,也适用于用数字代码的电报码。它的又一特点是离散度更大,为100×100×100=100万,是“全息Ⅰ码”离散度约46万的2.2倍,可容纳的字、词更多而重码更少。
2.编码实例:
“全息Ⅲ码”规则基本上同“全息Ⅰ码”,但考虑到Ⅲ码是两个数字码针对一个部首字,不需要在同一个拼音字中用起末笔画来选定,故用*来填空位,重码字亦可用*号并移动它来区分;括弧内的变体则加击起笔笔画、续笔笔画。
(1)单部首字:在6位数中第一、二位击其编号,后连击空格键填空;括弧内的变体则加击起笔笔画、续笔笔画。
一:01****    二:09****    三:30****
:23****    门:42****
马:49****    木:56****    目:74****
(2)双部首复合字:在6位数中第一至四位击其编号,后连击空格键填空
冰:2271**    江:7133**    扛:3633**
闰:4253**    杠:5633**    枚:5667**
(3)三个以上部首复合字:在6位数中第一至六位编号,例
种:763702    桂:56323    花:341620
祝:723718    贺:293762    你:161750
合:160137    欢:261716    树:562635
民:330108    族:211657    麒:410915
麟:410702    醇:812701
(5)词语文献快速码:
(1)双字词:取第一字起、末部首(如首字为部首字,则改为第二字起笔部首)、第二字末部首,例:
海洋:710487    国家:230122    乙炔:086816
人民:163308    幸福:321075    辛勤:781029
(2)三字以上词:取第一个起笔部首、第二字收笔部首、末字收笔部首。例:
地球仪:370414    金字塔:960137
大世界:571709    不夜城:120504
游乐场:715009
统一战线:480104    胸有成竹:656583
成竹在胸:118324    中华人民共和国:371001
诺贝尔奖金:936296    马列主义:495814
马克思列宁主义:491014
3.调整部首、去重码与功能键
(1)调整部首:
部首是可以调整的。为了统一“全息Ⅰ码”与“全息Ⅱ码”,才统一用“100部首”的名称。“Ⅰ码”与“Ⅱ码”也可不统一,“Ⅰ码”可增减部首,甚至可用《康熙字典》的214个部首,也可用王竹溪的56个新部首,或更少的部首,但用100个左右为宜。“Ⅱ码”可减少到100个以下,保持二位数,反之,亦可对部首字和数百个常用偏旁字编成三位数,取二个部首、偏旁字编成6位数码,也可取三个部首、偏旁字编成9位数码。只要查码方便,有足够的离散度就行。
如“三”为071,“刘”为271,那么“浏”为071271(六位码)或071***271(九位码)。其余类推。
(2)去重码:重码率再低,总还有个别重码字或重码词。“Ⅰ码”可用击0键并移动其位置或击1、2、3……8、9、0数字键去重码。“Ⅱ码”可用*键去重码,去重码的让码以词频为序。
(3)功能键:提示,改错,分简繁体、正字、异体、讹体,中西文夹排等,都可使用多余的键。
综上所述,本发明的优点还在于易推广、用途多。至少可以有下列几项可供开发应用:
1.中文电脑打字、编辑、排版;
2.电报码与电传码统一于拉丁字明码,并且比西文简约,可由 机器自动译码为中文,可大大节约人工、费用;
3.全国邮政编码统一,人人可自编,且使地址的字母化略写与邮政编码相一致。全国几百个省、市、几千个县基本上不重码。省、自治区、市、县、乡、镇等行政区划单位:
北京:SBTX    上海:BHSD    天津:ERSG
广州:AODS    广东:AOHX    广西:AOXH
云南:ESSS    浙江:SDSG    江西:SGXH
江苏:SGCB    福建:QTJZ    湖北:SYSB
湖南:SYSS    青海:FYSD    河南:SKSS
海南:SDSS    新疆:LDGH    西藏:XHCD
贵州:KBDS    宁夏:DDDX    台湾:SKSG
四川:MHPS    辽宁:LZDD    吉林:SKMM
河北:SGSB    山东:SSHX    山西:SSXH
安徽:DNEW    黑龙江:LHSS    内蒙古:MRCS
4.中外文机器助译。中国人学外语、外国人学汉语,主要困难不在语法,而在于记大量词汇。全息码使汉字、汉语词汇化为四个拉丁字母,这就比贮存西文容易。有了全息码,中国人与外国人只要化很少的时间学会语法、字母拼音法则、编码方法,就能借助机器的词汇对译来进行对话交流。一个人要掌握几门外语是很容易的。翻译专业工作者也可省去大量查辞典的功夫。
5.古汉语与白话文机器助译。原理同上。
6.速记。用全息码速记统一、规范、迅速,对速记整理、翻译也可借助机器,省去大量时间。
7.缩写。用全息码可用1.33个拉丁字母代替一个方块汉字,可大量节约篇幅时间。
8.图书编目、辞书索引用全息码,规范、简便,不重码,能消除难检字。
9.速抄、缩录。原理同速记、缩写。
10.医药自我咨询,及农村牧副渔工商文军政各行各业管理咨询。例如输入①感冒②年龄③性别④肪膊⑤体温⑥痰的浓与清⑦有否咳嗽等信息,即可输出名医名方。全息码可作各种咨询汉字卡。
以上10项都同本发明使繁难的方块汉字变成超过任何一种西文的全息码有关。本发明发掘了汉字内在的美质,使汉字变成科学、规范、精炼、优美的集约化的编码,从而成为东西方文明大交流的一座宏伟的桥梁。

Claims (3)

1、汉字全息码及其键盘,其特征在于包括:
(1)采用电脑通用小键盘;选用汉字100个部首字,按其拼音第一个字母将所述100个部首字分布在公知的电脑通用键盘的26个英文字母码键上,各键位重新标识如下:
部首字的拼音第      所选用的部首
一个字母对应到
原英文字母键上
Q  [犬(大犭豸豕)示(示礻)
W [王]
Figure 891097074_IMG1
韦(
Figure 891097074_IMG2
)文(攵)
E [耳(阝卩)]二(
Figure 891097074_IMG3
)儿(兒
Figure 891097074_IMG4
)
R [人(
Figure 891097074_IMG5
亻)]日
T [扌(
Figure 891097074_IMG6
)]
Figure 891097074_IMG7
土田
Y [月(曰 )]ㄨ又幺( )羊(?6?1?6?2)言(讠)
U [巫(
Figure 891097074_IMG10
)]
I [衣(
Figure 891097074_IMG11
衤)]
O (去
Figure 891097074_IMG12
码功能键)
P [爿(丬片)]丿(
Figure 891097074_IMG13
)
A [广]厂(
Figure 891097074_IMG14
)
S [水( 氵)]丨(/)十(
Figure 891097074_IMG16
)厶( )三( 彡巛)山尸(卩巳)石身食(食饣)
D [丁(
Figure 891097074_IMG19
)]丶( 丶)刀(刂)歹
F [丰(
Figure 891097074_IMG21
)]
G [弓]?6?5(亅乛乚
Figure 891097074_IMG22
)干(
Figure 891097074_IMG23
)工( )骨
H  [火(灬)]一(/)禾
J [金(钅)]几(幾几)巾彐(
Figure 891097074_IMG25
Figure 891097074_IMG26
)己(
Figure 891097074_IMG27
)臼
K  [口]凵
L [立]了力角(角)里(
Figure 891097074_IMG28
)
Z [竹(?6?8)]止(
Figure 891097074_IMG29
)爪(
Figure 891097074_IMG30
)走(
Figure 891097074_IMG31
之辶廴)足(
Figure 891097074_IMG32
X [心(忄
Figure 891097074_IMG33
)]夕(攵)习(習)小(小
Figure 891097074_IMG34
灬)穴西(
Figure 891097074_IMG35
)
C [艹(廾
Figure 891097074_IMG36
)]寸车(車
Figure 891097074_IMG37
)虫
V (ü)[鱼(
Figure 891097074_IMG38
)]雨
B [卜(卜)]八(丷八)匕勹( 冖勹)冫(
Figure 891097074_IMG40
)贝(貝)白髟
N [女] 廿(
Figure 891097074_IMG42
)牛(
Figure 891097074_IMG43
)
Figure 891097074_IMG44
M [木]冖(冂冂
Figure 891097074_IMG45
)门(
Figure 891097074_IMG46
)马(馬)目(
Figure 891097074_IMG47
罒)
*说明:[]内为键名部首,()内为变体、繁体
(2)汉字全息码的编码步骤:
i,选用横、竖、撇、点、捺、挑、弯、勾作为汉字的基本笔画,其中凡带钩的一律作勾;
ii,将汉字分解为部首的七条笔顺规则为:
先横后竖、先撇后捺、先上后下、先左后右、先外后里、先外后里再封口、先中间后两边,依笔顺分解部首,每一步分解以最多笔画的部首为原则;
iii,根据上述规则将汉字分解成包括基本笔画在内的上述部首,并依照上述部首采用四个代码组成汉字全息码;
iv,单部首字都以部首拼音声母、韵母的第一字母、起笔笔画、续笔笔画、末笔笔画代码击键,正体、变体、简体、繁体都这样编码,不能再分笔画的击O键;
两个部首的复合字:以起笔部首、起笔部首末笔画、收笔部首、末笔部首末笔画代码击键;如起、末两部首为键名部首,可特殊对待,不需加笔画来区分,都改为O;
三个部首复合字:4个代码依次为起笔部首、起笔部首末笔画、续笔部首、收笔部首;当起笔部首为键名部首时,连击O键,不再击其末笔笔画代码;
四个以上部首的复合字:一般取起笔部首、起笔部首末笔画、接尾部首、收笔部首;若遇起笔部首为键名部首时,第二码改为续笔部首。
2、根据权利要求1所述的汉字全息码及其键盘,其特征在于所述部首构成的汉字组成词语文献快速码,依部首采用四个代码组成汉字全息码;
两个字的词语编码:两个字都分别取起笔部首与收笔部首,如构词的字为单部首字,取这个部首及其末笔画为代码,如词语中有一字为键名部首字,作特殊对待,后加O码,以区别末笔画相同部首;
三个字的词语编码:第一个字取首尾两个部首,再取第二、三字的起始部首;如第一个字为部首字,取其起始部首、末笔笔画;如第一个字为键名部首,则取其部首编码加O;
四个以上字的词语:取一、二、三及末字起始部首。
3、根据权利要求1或2所述的汉字全息码及其键盘,其特征在于所述部首采用四个代码组成汉字全息码时,可用击O键并移动其位置去重码;去重码的让码以词频为序。
CN89109707A 1989-12-30 1989-12-30 汉字全息码 Expired - Fee Related CN1028680C (zh)

Priority Applications (5)

Application Number Priority Date Filing Date Title
CN89109707A CN1028680C (zh) 1989-12-30 1989-12-30 汉字全息码
CA002026228A CA2026228A1 (en) 1989-12-30 1990-09-26 Holo-information code of chinese characters
GB9024054A GB2239542B (en) 1989-12-30 1990-11-06 Holo-information code for chinese characters
JP90419294A JPH04270448A (ja) 1989-12-30 1990-12-27 漢字ホロー・インフォメーションコード
US08/095,485 US5475767A (en) 1989-12-30 1993-07-23 Method of inputting Chinese characters using the holo-information code for Chinese characters and keyboard therefor

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN89109707A CN1028680C (zh) 1989-12-30 1989-12-30 汉字全息码

Publications (2)

Publication Number Publication Date
CN1043016A CN1043016A (zh) 1990-06-13
CN1028680C true CN1028680C (zh) 1995-05-31

Family

ID=4858138

Family Applications (1)

Application Number Title Priority Date Filing Date
CN89109707A Expired - Fee Related CN1028680C (zh) 1989-12-30 1989-12-30 汉字全息码

Country Status (4)

Country Link
JP (1) JPH04270448A (zh)
CN (1) CN1028680C (zh)
CA (1) CA2026228A1 (zh)
GB (1) GB2239542B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6094666A (en) * 1998-06-18 2000-07-25 Li; Peng T. Chinese character input scheme having ten symbol groupings of chinese characters in a recumbent or upright configuration
JP4558482B2 (ja) * 2002-06-05 2010-10-06 ス、ロンビン 各国語文字情報の最適化デジタル操作的コード化及び入力の方法、そして、その情報処理システム
JP4822032B2 (ja) * 2009-01-08 2011-11-24 タイヨーエレック株式会社 組合せ式遊技機
JP4822031B2 (ja) * 2009-01-08 2011-11-24 タイヨーエレック株式会社 組合せ式遊技機

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2165677B (en) * 1984-10-13 1988-07-20 Mitac Inc Input/output method for computerized chinese characters
GB8427281D0 (en) * 1984-10-29 1984-12-05 Wong K F Materialistic system
CA1279128C (en) * 1986-08-18 1991-01-15 Andrew Chiu Means and method for electronic coding of ideographic characters
GB8629908D0 (en) * 1986-12-15 1987-01-28 Kemano Ltd Words & characters computer input device
GB2212956B (en) * 1987-11-30 1991-10-30 Jeff Wang Method of inputting chinese characters and keyboard for use with same

Also Published As

Publication number Publication date
GB2239542B (en) 1994-06-29
GB2239542A (en) 1991-07-03
CA2026228A1 (en) 1991-07-01
JPH04270448A (ja) 1992-09-25
GB9024054D0 (en) 1990-12-19
CN1043016A (zh) 1990-06-13

Similar Documents

Publication Publication Date Title
CN1023916C (zh) 简繁五笔字根汉字输入系统
CN1015218B (zh) 字根编码输入法及其设备
CN1047447C (zh) 实虚笔形编码计算输入法
CN1523518A (zh) 智能汉语文化辞典系统
CN1028680C (zh) 汉字全息码
CN1110741C (zh) 音形码汉字输入方法
CN1107896C (zh) 一种简繁体汉字自动转换的编码输入方法
CN1110743C (zh) 一种笔音意编码汉字的计算机输入方法
CN1455358A (zh) 华语拼音统一方案及单拼输入与智能转换翻译
CN1166997C (zh) 汉字免拆分快速输入法
CN1108552C (zh) 拼音汉字完善汉字法(phf)
CN1023669C (zh) 一种字元拼形计算机中文输入法
CN1825254A (zh) 汉字输入法及其所用的计算机键盘
CN1062797A (zh) 文字输入键盘及方法
CN1162766C (zh) 一种汉字音形编码输入方法
CN1056007C (zh) 一种以汉字音角特征为信息元的计算机汉字输入方法
CN1069766C (zh) 电脑、字典共用新部首汉字输入法
CN1209700C (zh) 数码识字输入法
CN1108551C (zh) 优化赋音形码计算机汉字输入方法
CN1054694C (zh) 计算机汉字三码输入法
CN1102256C (zh) 一种中文信息处理用汉字键盘输入方法
CN1055434A (zh) 字符的图元输入方法及其键盘
CN1374577A (zh) 英文字母键盘和数字键盘通用汉字电脑输入法及其键盘
CN1269010C (zh) 汉字位码键盘输入法
CN1093182A (zh) 声韵笔对码汉字输入方法及键盘

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C57 Notification of unclear or unknown address
DD01 Delivery of document by public notice

Addressee: Zhongshan XIAOBAWANG Electronic Industrial Company Shanghai branch

Document name: Oral notice

C15 Extension of patent right duration from 15 to 20 years for appl. with date before 31.12.1992 and still valid on 11.12.2001 (patent law change 1993)
OR01 Other related matters
C19 Lapse of patent right due to non-payment of the annual fee
CF01 Termination of patent right due to non-payment of annual fee