CN1088211C - 汉字正负单数部首数码输入法 - Google Patents

汉字正负单数部首数码输入法 Download PDF

Info

Publication number
CN1088211C
CN1088211C CN 98119348 CN98119348A CN1088211C CN 1088211 C CN1088211 C CN 1088211C CN 98119348 CN98119348 CN 98119348 CN 98119348 A CN98119348 A CN 98119348A CN 1088211 C CN1088211 C CN 1088211C
Authority
CN
China
Prior art keywords
radicals
characters
traditional chinese
chinese dictionaries
word
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN 98119348
Other languages
English (en)
Other versions
CN1220420A (zh
Inventor
何志东
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to CN 98119348 priority Critical patent/CN1088211C/zh
Publication of CN1220420A publication Critical patent/CN1220420A/zh
Application granted granted Critical
Publication of CN1088211C publication Critical patent/CN1088211C/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)
  • Controls And Circuits For Display Device (AREA)

Abstract

本发明是一种汉字周期部首数码输入法。在一种新的数学概念:正负杂合数理论指导下,将85个常用部首编成汉字正负单数部首周期表,周期表所用的20个正负数字(0-9;0-9)来源于人们熟悉的表示数字的五种方式,周期表中的每个部首与其数字代码为同形或近形或变形,所以部首代码是有理据的;由部首代码组成的汉字数码和词组数码也是有理据的,这就容易做到见字知码、见词知码。用周期部首数码字序法编成汉字字典和编制成电脑汉字字库,广泛应用于键盘输入、手写输入、扫描输入;同时也做到了工具书检索与电脑输入的统一,做到了查字、认字、记字、写字、打字的统一。

Description

汉字正负单数部首数码输入法
本发明涉及汉字输入领域。
汉字是中华民族的宝贵财富,是人类文字的奇峰。汉字的方块形式是平面的,又因为汉字有音,有形,有义,互相相辅相成,所以从思维的角度来讲,汉字又是立体的。平面的或立体的文字储存的信息量多,大大优于线形文字(拼音文字)。汉字具有表义部分,造成了汉字的个性突出,这就充分适应了汉语单音孤立的特点,从而使汉语和汉字在世界上同享“简短明确”的荣誉。联合国决议五种文本,数汉文本最薄,这是举世公认的。
汉字的优点是突出的,其缺点也是突出的,由于汉字的字数多,笔画多,字体结构繁杂,造成了汉字难学,难读,难写,难记;也就造成了汉字输入电脑的较大困难。当然庞杂无羁的汉字也是有规律可循的,不管多繁杂的汉字都是由部首构造,部首又是由基本笔画构成。如果将一些常用部首编成数字,再由部首数字组成汉字的数码,使每个与众不同的汉字都有一个与众不同的数码,使汉字走向规范化、科学化,也就是说,汉字输入要走数字化之道路。
给汉字编数码并不难,难的是要人们记得住,又没有重码。电报码,国标区位码都是人为编的流水码,没有理据,只靠死记硬背,不便普及使用。如果使每个汉字的数码与其字形结构特点有相关联系,利用有理数码对汉字进行分门别类,给汉字编数码字序,使每个汉字在字序中都有固定、唯一的位置,做到见字识码,又没有重码,又简单易记,好查,好用。这是一项十分艰巨的科学研究,要下苦功夫去探索,要想尽一切办法扩大数字与汉字之间的信息交流面,要在数学理论上,在数字排列组合的领域中,在数的表示方式上做到有新的发明创造。
一、汉字正负单数部首周期表的产生
为了扩大数字与汉字之间的信息交流面,首先要扩大数字的来源。现在我们先将中外表示数字0-9的几种方式收集整理出来,然后再从中寻找各种形式的数字与某些汉字部首在形态结构上的相关联系。
表示数字0-9的五种方式:
1.阿拉伯数字: 0、1、2、 345、6、 7、8、9
2.中国数字小写:
3.中国数字大写:零、壹、贰、叁、肆、伍、 、柒、捌、
4.中国的一种记数法:一、、
5.罗马数字: III、III、IV、V。
以上这五种表示数字的方式都是人们熟悉的,从中可以看到:0-9的十个数字中每个数字都有几种不同表示方式,例如数字5的表示方式有:5、五、伍、正、V。
现在我们来寻找各个数字与汉字某些部首在形状结构上的相关联系。在上面的数字中,下方打有线条者,有的本身就是汉字部首,有的是汉字部首的同形或近形或变形。
数字0与汉字部首“口”是近形,与缺口框部首(
Figure C9811934800062
冂、凵、匚)是变形。部首横“一”和部首“工”本身就是数字1的一种表示方式,部首“冖”是一的变形,部首“衣”与数字1是同音。
部首“二”和部首“II”是数字2的一种表示方式,我们把部首撇(丿)归为数字2的范围,可以理解为撇(丿)是阿拉伯数字2的腰部。
人们常说梅花三点,我们将部部首点(丶)取其代码为数字3,以数字3为代码的部首还有:了、三、下、山(山与数字3近音)。
两直笔相交成叉的部首(十、
Figure C9811934800071
乂)取代码为数字4,可以理解为,叉(十)是数字4去撇后所得。代码为4的部首还有:四、止、4
把部首插(一笔贯穿二笔或两笔以上的部首:扌、丰)取代码为数字5。可以理解为插是叉(十)加一画为5(4+1=5)。代码为5的部首还有:5、五、正。
把小“六”头“亠”和大“陆”旁“阝”两个部首取代码为数字6。
把与数字7(七)同形或近形的部首折(
Figure C9811934800073
厶、乙);角(几、厂)取代码为数字7。
把八字形和其变形的部首(人、入、亻、、丷)取代码为数字8。
把穿心旁部首(忄)取代码为数字9,可以理解穿心旁(忄)是八字加一竖为9(8+1=9)。代码为9的部首还有:小、久,久的变形(久、ク、勹、)。久的变形部首都是由撇和折构成,撇是2,折是7,2+7=9。部首“尸”是反9近形,把它归入数字9的范围。
从上面所述,可以看到各种方式表示的数字与某些汉字部首是同形或近形或变形,个别是同音,也就是说数字与部首之间有着一种对应的相关联系,将它们之间的这种相关联系编成汉字部首与数字联网表。见表I。
表I:汉字常用部首与数字联网表
Figure C9811934800081
在上面的联网表中,可以看到,从0到9这十个数字中,每个数字都是代表着一部分汉字部首,我们将这十个数字编成十个周期,将与各数字有关联的部首分别列入各周期内。由于汉字数量庞大,字体结构繁杂,如果只用0-9十个数字编码,势必有部分重码字。本发明人在中学时曾发明了正负杂合数运算法,并研制出了多功能正负算盘。正负杂合数变化多端,又能与自然数互换,可以应用到电脑上。如果把 0- 9这十个负数引进汉字编码,加上0-9十个正数,一共20个正负数参加排列组合,就会使数码的离散度大增,使重码率大幅度下降,为此我们将同一周期的部首划分成正负两个区域。划分原则是:与数字同形或近形的部首列入正数区;属于数字变形的部首、与数字同音的部首列入负数区。例如“口”字部首列入0周期正数区,用0表示;缺口框(冂、凵、匚)列入0周期负数区,用 0表示。部首“一”和“I”列入1周期正数区,用1表示;部首“冖”、“衣”“衤”、“礻”列入1周期负数区,用 1表示。
另外一些组字极强的部首,它的代码包含着两个或两个以上数字,这些数字又是相同的,例如“氵”其数码是333。我们只取其首码,其余码省去,并取负数,根据这个原则,将下列部首:氵、纟、竹()分别取码 3、 7、 9。还有部首“贝”、“禾”、“木”它们的字形结构中有横与坚,撇与捺之对称,可看成互消,我们也只取首码,其余码省去,将“贝”、“禾”、“木”分别取码为:0、 2、 4。
经过正负划分后,同周期同区域的部首仍有2至4个,为了使它们相互区别开来,我们根据每个部首形状结构特点分别配给一个与其同形或近形的英文字母,这些英文字母称为形码,一共使用9个英文字母,下面是9个形码的使用范围及其相关的汉字部首:
Q:部首中有封口的框。如、
Figure C9811934800101
四、目、阝、
Figure C9811934800102
耳、又、女、尸、攵。
A:部首缺口向下,如:冂、巾、几、人、入、(止)。
V:部首缺口向上,如:凵、山、(4)
C:部首缺口向右或有勾向右。如:匚、七、儿、九。
D:部首缺口向左或有勾向左。如:彐、
Figure C9811934800103
勹。
I:组成部首主笔为竖或笔顺,部首顺是从上至下。如:工、讠、丰。
H:组成部首主笔为横,或笔顺、部首顺是从左至右。如:冖、二、三、卅。
X:组成部首的笔画类型有两种或两种以上,其中有的有叉。如:
Figure C9811934800104
礻十、x、五、正、立、厂、亻、、小( )。
y:是正负特区的符号,英文字母y与“特”字部首“牛”是近形。每周期挑选两个使用频率高的字分别划入正特区和负特区,这两个字互相是近形或近义或有一定关联,容易记忆。从0到9十个周期的十对正负特区的字分别是:日与月;雨、衣;白,的;上、下;土、地;虫、草;广、疒;力、刀;火、(金);久(ク)、夕。
为了便于检索和记忆,我们将与数字有关联的85个常用汉字部首按顺序编成周期区域表,一共分为0至9十个周期,每个周期又分为三个区:正数区,负数区,正负特区。由于这些部首都是只含有一个单正数或一个单负数,所以把这个周期区域表统称为汉字正负单数部首周期表。见表II。
表II:汉字正负单数部首周期表
二、汉字正负单数部首数码输入法
(一)采用通用电脑,将本发明编制的周期表中使用的十个正数码和十个负数码,以及9个形码分布在通用键盘的26个英文字母键上。各英文字母键重新标识如下:(在每一个英文字母键上刻上一个数字或形码)。原英文   新刻上    与数字相关               原英文  新刻上    与数字相关字母     的数字    的部首                   字母    的数字    的部首A        0         口,日,
Figure C9811934800121
,             Q         0        贝,冂,凵,匚,月、S        1         一,工,雨,              W         1        衤,礻,冖,衣、D        2         丿,二,
Figure C9811934800122
白,        E         2        禾,丨,的、F        3         丶,三,了,讠,上,      R         3        氵,山,彐,巾,下、G        4         十,
Figure C9811934800123
四,
Figure C9811934800124
土,  T        4        木,乂,目,止,地、H        5         扌,丰,五, 虫,     Y         5        艹,卅,正,草,J        6         亠, 阝,广,        U         6        宀,耳,疒,K        7         フ,七,女,力,          I         7        纟,又,几,厂,刀、L        8         八,人,亻,儿,火,      O         8        丷,,入,钅,M        9         忄,九,勹,夂,久,      P         9        竹,小,尸,夕、原英文字母       新刻上的形码
N            A,H
B            D,Q
V            V
C            C,I
X            X
Z            Y
(二)汉字数码的编码方法。
1.单个汉字的编码方法
本发明编制的周期表中一共有85个单数部首,每个部首都有一个单数字代码。每个汉字都是由若干个单数部首组成的,按笔顺将组成某汉字的若干个单数部首分别转换成单数字,由若干个单数字便组成了某汉字的数码。例:华:874;京:60 9。
编码时按下列笔顺原则:
(1)先上后下。例:享:6031;(2)先左后右。例:村: 443;(3)先外后内。例:固:040;(4)先中间后两边。例:办:78;(5)先里头后旁边。例:过:43 37;建:5 33。
注:从直观来看部首“之”和“廴”都是在左上方,而按笔顺是在后面我们分别取负数码:“之”为 37;“廴”为 33。与这种类似的还有部首“戈”和“”,“戈”取码为5 3;“弋”取码为7 3。
本发明编制的周期表中的85个部首包含信息量大、组字力强,使用频率高,所以由它们组成的大量汉字其数码都在一至四码之间,例如“盟”字一共13画只有三码:0 04;“蟑”字一共17画,只有四码:5604;“戆”字一共25画也只有七码:60491 09。为了提高专业人员的输入速度,我们规定每个汉字最多取四码。对一些特别繁杂的汉字如果只按笔顺取四码,就会出现少量的重码字,为了将重码降到最低,我们采取“三顺”取码法,即按层次顺,部首顺,笔顺取码。
为了弄清“三顺”,先将汉字的组合分析一下。首先由笔画按一定顺序组成单数部首,再由两个或两以上的单数部首组成双数部首由一些笔画通过相交、相接或包围形成的部首称为独体部首;由两个或两个以上独体部首组成的部首叫合体部首。例如,在“警”字中,“敬”是合体积部首,“苟”和“攵”是独体部首。
一些繁杂汉字包含的部首常常是多层次的,一个字包含着大部首,这是一个层次,一个大部首又包含着小部首这是两个层次,小部首又包含着更小的部首,这是三个层次,依次类推。对于汉字的层次由大到小进行逐层分解,每次分解都是一分为二,一直分解到单数部首为止。第一次分解出来的两个部首叫一级部首;第二次分解出来的两个部首叫二级部首,依次类推。下面我们来分解“挚”字:
Figure C9811934800141
“挚”字是三个层次,“执”和“手”是一级部首;“扌”、“丸”“丿”、“扌”是二级部首;“九”和“丶”是三级部首。
再相似的两个汉字也有差异部分,这些差异部分大多集中在一级部首和二级部首的头部,这些部位是取码重点部位,为此我们要准确地找到每个字的两个一级部首,也就是要找到两个一级部首之间的分界线(一级分界线)。要找到一级分界线首先要从整个入手,注意各部首间的间隔。例如“时”字的一级分界线在“日”与“寸”之间;“章”字的一级分界线在“立”与“早”之间。一些多层次汉字的一级分界线难找一些,可根据下列两点去找:(1)一级分界线线段最长,它的延长线不会碰到任何部首;(2)一个字的独体部首排列方面相同,后面的独体部首突然改变排列方向,这个方向改变的转折线就是一级分界线。例如“警”字一级分界线在“敬”与“言”之间。
根据两个一级部首排列方式不同将汉字分成六大类:
(1)上下纯向型:组成字的所有部首都是从上而下排列。例:李、享、曼、章。
(2)上下杂向型:一级部首是上下排列,而有的二级中首是左右排列。例:想、警、茄、赢。
(3)左右纯向型:各部首都是自左至右排列。例:江、明、班、谢。
(4)左右杂向型:一级部首是左右排列,而有的二级部首是上下排列。例:保隔、鄂、躺。
(5)右(上)左型:由部首:戈、弋、辶、廴组成的字。例:栽、式、过、延。
(6)全包围型或部分包围型。例:回、国、同、画、医、句。
了解上述汉字的六种分类,对寻找一级部首,二级部首有利。现在来总结一下单个汉字的取码原则和方法:
取码原则:每个字最多取四码,一级部首最多取三码,二级部首最多取两码。
取码方法:先将一个字分成前后两个一级部首,如果前一级部首是纯向型,取前两码,再取后一级部首前两码共四码。例:“鼾”取2 414。“赣”取6091。如果前一级部首是杂向型,取三码,前二级部首取前两码,后二级部首取首码,再取后一级部首首码共四码。例,“戆”取6099。取三码的常用部首只有几个,例如:“敬”部首取码 59 8;“辟”部首取码 906。
如果前一级部首只有一码,后一级部首取前三码。例:“倒”取8174。
如果一个字如数码不足三码,补加第一部首的相关形码,第一部首无形码加空格键E或加部首排列方式码I、H。例:罗:4 9Q;千:24E;只:08I;叭:08H。
每个汉字的编码数字不用死记硬背,只要记住周期表中的85个单数部首代码即可,而每个单数部首的代码是有理据的(单数部首与其代码数字是同形或近形或变形)容易记忆。由单数部首组成的复合部首只取第一、第二码,这些复合部首称为双数部首。为了专业人员提高输入速度,减少双数部首的重码,我们将少量的双数部首取第一、第三码。属于下列情况的部首取第一、第三码:
(1)汉字中常将部首“十”作为两个部首之间的联系符号,没有形、音、义方面的理据,所以如果“十”出现在第一、第三码之间,我们把它舍去,部首取一、三码。此类常用部首一共四个:“王”取11;“舌”取20;“缶”取 80,“米”取 88。
(2)一个部首在三码以上,部首的头两码是折7,将第二码舍去取一、三码,此类常用部首共两个:“马”取71;“予”(矛)取7 2。
(3)部首“一”在汉字中出现频率极高,它处于部首第一或第二码取其代码1,例邢:1 56;鸽:8127。如果部首“一”处在两个独立部首之间,它常常是画蛇添足的笔画,把它舍去,例:“微”取28 37。为了避开重码部首“一”在三个部首中作负数符号用;部首“西”取18,“酉”取1 8;“半”取 85,“羊”取 85;“乞”取 87,“气”取 87。
(4)部首方框(口)和缺口框(冂、凵、匚)在汉字中使用频率极高,为了减少重码,我们规定,如果这样部首出现在独立部首的首码取其数码0或0。例,“思”取049;“同”取 010。如果这些部首不是处在独立部首的首码,则这些部首不取码,直接取框内的部首码。例,部首“鬼”取24;部首“舟”取26。
现在我们将常用的双数部首按周期顺序编成常用双数部首数码表,见表III。表中大部分部首是取第一、第二码。凡是取第一、第三码的部首,上面打有三角符号△。
表III:双数部首数码表
2.重码字的处理。
由于本发明使用的单数部首代码是来自数字0-9的五种表示方式,所以它们包含的信息量大;加上独创了正负数码,十个正数字和十个负数字同时参加排列组合,使数码的离散度大增;在取码数目上不是一刀切,而是取1至4码不等;在取码顺序上不是单条腿走路(只按笔顺取码),而是采用层次顺、部首顺、笔顺的三顺取码法。所以重码率非常低,即使出现重码也只有两个字。出现重码时,电脑鸣笛,并在提示行里将两个重码字列出,在字前依次编有符号1、2。1号字是系统自选,继续输入下一字时,它会自动上屏;2号字按空格键E即可上屏。因为重码字极少,一有只有两个字,所以经过打字训练后,记住了哪两个字是重码字并记住了哪个是1号哪个是2号,那么打字时不用听鸣笛声,也不用看提示行,凡是输入重码1号字,什么都不用管,继续往下打即可;若输入重码2号字,多按一下空格键,如果忘了按空格键,也无关大局,到了核对时再进行修改。
3.词组的取码方法。
(1)2-4字的词组取四码,不足四码的加空格键E。
两字词:每个字只取前两码。例如:计划:345 2;木架: 470E
三字词:第一个字取前两码,后两个字各取首码。例:语文科:356 2;土地局:44 9E
四字词:每字取首码。例:国家计委:0 63 2;一心一意:1916。
(2)五个字以上的词组取四码或五码:
(a)由两个独立词组成的复合词组取四码:第一独立词取前两个字的首码,第二独立词取第一个字和最后一字的首码。例:国务院办公室:097 6;中国专利局:505 9。
(6)由两个以上的独立词组成的复合词组取五码:第一独立词取前两个的首码,第二、第三独立词各取首码,最后一个字取首码,共五码。例:中国社会科学院:50 126;中国石油化工总公司:50187。
三、周期单数部首直接输入法(85个键的动态键盘输入法)。
将周期表中的85个单数部首,按周期、区域顺序排列起来,制成85个键的动态键盘,可以在屏幕下方显示出来,每一个键上有一个单数部首和一个相关的代码数字,操作者可用鼠标笔点取键盘按扭,实现汉字输入,这是一种部首直接输入法,不用编码,不用记正负数码和形码,各键中的数字只起了排列顺序的作用,为操作者快速准确找到各部首起补助作用。例如要输入“口”字,用电脑笔点取一个部首键: 要输入“明”字、用电脑笔点取下列两个部首键:
Figure C9811934800192
要输入词组:“推陈出新”,用电脑笔点取下列四个部首键:
也可制造一个85键的手按新键盘,用手指按部首键盘,实现汉字输入。
四、手写输入法
用电脑笔在写字板上书写要输入的字或词组的数码,也可以书写相关的部首,电脑通过单数部首识别系统,将书写的数码或部首转换成标准汉字。例如要输入“衙”字,可以书数码2850,也可以书写四个单数部首:要输入词组“品德高尚”可以书写数码0269,也可以书写四个单数部首:“口,丿,亠,小。当然也可以将每个字写完整,关键是要将每一个字的第一部首写准确,其余部首没有严格要求,因为词组的编码由每个字的第一单数部首组成,其余部首的书写与否,书写好坏不影响词组输入。这样一来,本发明的新手写输入法比目前现有的其他手写输入法要快,准确率要高。因为其他手写输入法要求书写的字与电脑里存的标准字进行整个字形比较。每个字都要写完整,每个部首都要写准确,时间就要长,如果其中任何一个部首写得不清楚,就会影响准确率。
五、扫描输入法
把纸上的文字经过扫描后送入电脑,电脑通过单数部首识别系统将纸上的字和词组转换成标准汉字。由于词组的编码由每一个字的第一单数部首组成,所以电脑的识别系统只对字的第一单数部首图像进行识别即可,其余部首图像不参加识别,也不影响输入。
目前现有的其他扫描输入是将纸上的汉字图形扫描入电脑,使每个汉字的整个图形与电脑里的标准字形进行比较,整个字形一致的才能输入,对规范的印刷体汉字输入效果尚好;而对手写体汉字识别率很低,识别手写稿常常是错误百出,反复修改也无济于事。而本发明的扫描输入法对印刷体汉字输入快而好;对手写体汉字识别率也相当高,即使有些差错,一经修改即可。原因是本发明的扫描输入,只需对每一个字的第一单数部首图形进行识别,其余部首图形的有无与好坏不影响输入。而一般人在书写时,常常是把每个字的第一部首写得清楚、准确,而其余部首写得潦草,这正好满足了本发明的要求。如果书写者有意识地将词组的每个字的第一单数部首写准确,将少量无法组成词组的单个汉字参加编码的部首写准确、那么手写汉字扫描输入百分之百可以实现。
六、语音与手写配合输入法。
要将某人的讲话变成文字,可以将其语音输入的同时,操作者进行手写输入(手写数码或手写相关部首)。要输入大量文件,可以一人读文件,进行语音输入,另一人同时进行手写输入。
七、把电脑输入和工具书(字典)检索统一起来,让电脑汉化。
字序就是汉字的排列顺序。字序的应用极为广泛,工具书的编排,人名、地名的排列,图书档案等各种目录编制,汉字在电脑字库中的存储都要用到字序。我们在前面已经讲过利用周期表中的85个单数部首给每个汉字编数码的方法。如果把数码由小到大排成系列,于是和数码相应的汉字也就排成了序列。我们把这种新的字序法叫做周期单数部首数码法。用这种新的字序法编写汉字字典和制作汉字电脑字库,把工具书的检索和电脑输入统一起来,把查字、认字、记字、写字、打字有机的结合起来。
单数部首数码法是按照一定规则,由字的单数部首代码一次就可以转换成字的数码,按照数码就可以查到要查的字。它不需要像音序法那样事先弄清字的读音,也不需要像传统的部首法那样先找出部首,也不需要像笔画法那样先数清笔画数,也不需要像电报码,国标区位码那样要死记硬背。我们在前面已分析过,周期表中的单数部首是有理据的,容易做到见部首而知其代码,而汉字的数码是由若干个单数部首代码组成的,所以也容易做到见字而知其数码。例如要查“哼”字,根据组成它的单数部首就知它的数码是0603,由这个数码就知道它是排在新编字典的0周期正数区中部偏后。如果在新编字典的右侧面从上至下用不同颜色标出0-9十个部分(十个周期)。那么要查“哼”字时,在字典右侧面先找到0周期部分,然后在0周期部分的中部打开,将很快找到“哼”字。例如要找“蔓”字,它的数码是 5047,它是在第五周期负数区靠前部位上,先在字典右侧找到第五周期部分,然后打开第五周期部分后半部找到第五周期负数区,将很快找到“蔓”字。
人们通过周期单数部首数码新字典能很快查到要查的字,电脑同样通过周期单数部首识别系统能快速准确识别汉字,在这基础上制作汉字操作系统,做到输入汉字命令,电脑给出汉字提示信息,只要认识汉字的人都能容易操作电脑,实现电脑汉化。
八、以正负单数部首周期表和双数部首数码表为依据,对汉字进行整理、修改,使汉字更规范化、更数字化、更科学化。
从单数部首周期和双数部首数码表中,可以看到一些汉字部首数码相同,也就是说,它们过于集中在同一周期同一区域里,而许多周期、区域的编号是空白,没有相应的部首。如果我们对某些过于集中的部首的一些笔画进行合理的修改或增减,改变它们的数码,使汉字部首在单数部首周期表中,在双数部数码表中分布均匀,从而使汉字的重码率为零,使汉字的检索和电脑输入更规范,更简便。到时候就完全可以以新型汉字为基础创造出一种世界通用文字。

Claims (3)

1.一种周期单数部首数码输入法,包括:
(1)利用数码0-9, 0- 9代表85个单数部首;用字母Q、A、V、C、D、I、H、X、Y作为表示汉字部首的结构形态的九个形码;
所述85个单数部首与0-9, 0- 9的对应关系分别为:0:口,日,
Figure C9811934800021
其中字母K表示“口”里面的不同部首,1:一,工,雨,2:丿,二,
Figure C9811934800022
白,3:丶,三,了,讠,上,4:十, 四,
Figure C9811934800024
土,5:扌,丰,五,
Figure C9811934800025
虫,6:亠,
Figure C9811934800026
阝,广,7:フ,七,女,力,8:八,人,亻,儿,火,9:忄,九,勹,攵,久,0:贝,冂,凵,匚,月,1:衤,礻,冖,衣,2:禾,丨,的,3:氵,山,彐,巾,下,4:木,乂,目,止,地,5:艹,卅,正,草,6:宀,耳,疒,7:纟,又,几,厂,刀,8:丷,,入,钅,9:竹,小,尸,夕,   九个形码的使用范围:Q:部首中有封口框;A:部首缺口向下;V:部首缺口向上;C:部首缺口向右或有勾向右;D:部首缺口向左或有勾向左;I:组成部首主笔为竖或笔顺、部首顺是从上至下;H:组成部首主笔为横或笔顺、部首顺是从左至右;X:组成部首的笔画类型有两种或两种以上,其中有的有叉;Y:是正负特区符号,对20个使用频率高的汉字作如下规定:日:0Y,月: 0Y;雨:1Y,衣: 1Y;白:2Y,的: 2Y;上:3Y,下: 3Y;土:4Y,地: 4Y;虫:5Y,草: 5Y;广:6Y,疒: 6Y;力:7Y,刀: 7Y;火:8Y,金: 8Y;久:9Y,夕: 9Y;
(2)采用通用电脑,将周期表中使用的20个正负数码和九个形码,分布在通用键盘的26个英文字母键上,从上至下,各键重新标识如下: 0、 1、 2、 3、 4、 5、 6、 7、 8、 9分别分布在Q、W、E、R、T、Y、U、I、O、P上;0、1、2、3、4、5、6、7、8、9分别分布在A、S、D、F、G、H、J、K、L、M上;形码A、H,D、Q,V,C、I,X,Y分别分布在N、BV、C、X、Z上;其中形码A、H使用同一键位N;形码D、Q使用同一键位B;形码C、I使用同一键位C;
(3)汉字数码的输入方法
a.单个汉字的输入方法:按层次顺、部首顺、笔顺将组成某汉字的若干个单数部首分别转换成代码数字,若干个数字便组成了某汉字的数码,取码原则:每个字最多取四码,一级部首最多取三码,二级部首最多取两码;取码方法:先将一个字分成两个一级部首,如果前一级部首是纯向型,先取前两码,再取后一级部首的前两码,共四码;如果前一级是杂向型,取三码:将前一级杂向型部首,分成前后两个二级部首,前二级部首取前两码,后二级部首取首码,再取后一级部首首码,共四码;如果前一级部首只有一码,后一级部首取前三码;如果一个字,其数码不足三码时,补加第一部首的相关形码,第一部首无形码,加空格键或加部首排列方式码I、H;当出现重码字时,电脑低声鸣笛,并在提示行里将重码字列出,字前依次标有符号:1、2、3......1号字是系统自选,当继续输入下一个汉字时,它会自动上屏;2号字按空格键即可上屏;各个数字后面的重码字也可以按相应的数字键来选取;
b.词组的输入方法,两字词:各字只取前两码;三字词:第一个字取前两码,后两个字各取首码;四字词:每个字取首码;五个字以上的复合词组:第一个独立词的前两个字各取首码,第二、第三独立词各取首码,最后一个字取首码,共五码,如果五个字以上的复合词只包含两个独立词,取四码:第一独立词取前两个字的首码,第二独立词取第一个字和最后一个字的首码。
2.根据权利要求1所述的周期表单数部首数码输入法其特征在于这些单数部首可以直接输入电脑:将周期表中的85个单数部首,按周期、区域顺序排列起来,制成85个键的动态键盘,每个键上有一个单数部首和一个与其相关的代码数字,操作者可用鼠标笔点取部首键盘按钮,实现汉字输入。
3.根据权利要求1或2所述的周期单数部首数码输入法,其特征在于这两种输入法可以应用于手写输入和扫描输入,手写输入是用电脑笔在写字板上书写要输入的字和词组的数码,也可以书写与数码相关的部首,然后电脑通过单数部首识别系统将书写的数码或部首转换成标准汉字;扫描输入法是把纸上的文字经过扫描后送入电脑,电脑通过单数部首识别系统将纸上文字转换成标准汉字。
CN 98119348 1998-09-21 1998-09-21 汉字正负单数部首数码输入法 Expired - Fee Related CN1088211C (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN 98119348 CN1088211C (zh) 1998-09-21 1998-09-21 汉字正负单数部首数码输入法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN 98119348 CN1088211C (zh) 1998-09-21 1998-09-21 汉字正负单数部首数码输入法

Publications (2)

Publication Number Publication Date
CN1220420A CN1220420A (zh) 1999-06-23
CN1088211C true CN1088211C (zh) 2002-07-24

Family

ID=5226343

Family Applications (1)

Application Number Title Priority Date Filing Date
CN 98119348 Expired - Fee Related CN1088211C (zh) 1998-09-21 1998-09-21 汉字正负单数部首数码输入法

Country Status (1)

Country Link
CN (1) CN1088211C (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100424619C (zh) * 2003-12-24 2008-10-08 闫铁 “三键行”计算机汉字输入法
CN102226882A (zh) * 2011-05-25 2011-10-26 何志东 汉字简易正负数码输入法

Also Published As

Publication number Publication date
CN1220420A (zh) 1999-06-23

Similar Documents

Publication Publication Date Title
CN1043210A (zh) 字根编码输入法及其设备
CN1030985A (zh) 表意文字的处理方法及装置
CN1072029A (zh) 五笔二维编码法及键盘
CN1088211C (zh) 汉字正负单数部首数码输入法
CN1141633C (zh) 计算机二十四部首汉字排序输入法
CN1136496C (zh) 简化拼音-触摸屏鼠标式汉字输入方法
CN102511021A (zh) 一种数序码元键盘及其信息输入方法
CN1059281C (zh) 汉字声韵调三拼音形编码输入方法
CN1089176C (zh) 汉字正负数码输入法
CN100339808C (zh) U码汉字输入法
CN1150441C (zh) 字形笔顺码汉字输入法及其键盘
CN1028457C (zh) 一种笔画数码加声码的汉字计算机输入系统
CN1272693C (zh) 仿真拼音数字输入法
CN1269007C (zh) 笔删式触控键盘中文音象全功能输入装置
CN1326125A (zh) 全息万能拼音笔顺码及其使用方法
CN1420422A (zh) 码元用笔划集合数表示法及用途
CN1485716A (zh) 普通话拼音汉文输入法及其设备
CN1108552C (zh) 拼音汉字完善汉字法(phf)
CN1379307A (zh) 全息万能规范汉字编码及高速输入法
CN102637077A (zh) 用于计算机汉字输入的音、形、调混合编码方法
Siromoney Contributions of Professor Gift Siromoney in the area of pattern recognition
CN1100214A (zh) 两键字音四声计算机键盘汉字输入方法
CN1139774A (zh) 汉字部件按表形的五种笔画分类的编码法
CN1570832A (zh) 英文字母总图标两码输入汉字的方法及键盘
CN1008012B (zh) 平面文字的选择处理系统

Legal Events

Date Code Title Description
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C06 Publication
PB01 Publication
C14 Grant of patent or utility model
GR01 Patent grant
C19 Lapse of patent right due to non-payment of the annual fee
CF01 Termination of patent right due to non-payment of annual fee
C57 Notification of unclear or unknown address
DD01 Delivery of document by public notice

Addressee: He Zhidong

Document name: Notification of Termination of Patent Right