CN1220420A - 汉字正负单数部首周期表及部首数码输入法 - Google Patents

汉字正负单数部首周期表及部首数码输入法 Download PDF

Info

Publication number
CN1220420A
CN1220420A CN 98119348 CN98119348A CN1220420A CN 1220420 A CN1220420 A CN 1220420A CN 98119348 CN98119348 CN 98119348 CN 98119348 A CN98119348 A CN 98119348A CN 1220420 A CN1220420 A CN 1220420A
Authority
CN
China
Prior art keywords
radicals
characters
word
code
singular
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN 98119348
Other languages
English (en)
Other versions
CN1088211C (zh
Inventor
何志东
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to CN 98119348 priority Critical patent/CN1088211C/zh
Publication of CN1220420A publication Critical patent/CN1220420A/zh
Application granted granted Critical
Publication of CN1088211C publication Critical patent/CN1088211C/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)
  • Controls And Circuits For Display Device (AREA)

Abstract

本发明是一种汉字周期部首数码输入法。在一种新的数学概念:正负杂合数理论指导下,将85个常用部首编成汉字正负单数部首周期表,周期表所用的20个正负数字(0-9;0-9)来源于人们熟悉的表示数字的五种方式,周期表中的每个部首与其数字代码为同形或近形或变形,所以部首代码是有理据的;由部首代码组成的汉字数据和词组数码也是有理据的,这就容易做到见字知码、见词知码。用周期部首数码字序法编成汉字字典和编制成电脑汉字字库,广泛应用于键盘输入、手写输入、扫描输入;同时也做到了工具书检索与电脑输入的统一,做到了查字、认字、记字、写字、打字的统一。

Description

汉字正负单数部首周期表及部首数码输入法
本发明涉及汉字输入领域。
汉字是中华民族的宝贵财富,是人类文字的奇峰。汉字的方块形式是平面的,又因为汉字有音,有形,有义,互相相辅相成,所以从思维的角度来讲,汉字又是立体的。平面的或立体的文字储存的信息量多,大大优于线形文字(拼音文字)。汉字具有表义部分,造成了汉字的个性突出,这就充分适应了汉语单音孤立的特点,从而使汉语和汉字在世界上同享“简短明确”的荣誉。联合国决议五种文本,数汉文本最薄,这是举世公认的。
汉字的优点是突出的,其缺点也是突出的,由于汉字的字数多,笔画多,字体结构繁杂,造成了汉字难学,难读,难写,难记;也就造成了汉字输入电脑的较大困难。当然庞杂无羁的汉字也是有规律可循的,不管多繁杂的汉字都是由部首构造,部首又是由基本笔画构成。如果将一些常用部首编成数字,再由部首数字组成汉字的数码,使每个与众不同的汉字都有一个与众不同的数码,使汉字走向规范化、科学化,也就是说,汉字输入要走数字化之道路。
给汉字编数码并不难,难的是要人们记得住,又没有重码。电报码,国标区位码都是人为编的流水码,没有理据,只靠死记硬背,不便普及使用。如果使每个汉字的数码与其字形结构特点有相关联系,利用有理数码对汉字进行分门别类,给汉字编数码字序,使每个汉字在字序中都有固定、唯一的位置,做到见字识码,又没有重码,又简单易记,好查,好用。这是一项十分艰巨的科学研究,要下苦功夫去探索,要想尽一切办法扩大数字与汉字之间的信息交流面,要在数学理论上,在数字排列组合的领域中,在数的表示方式上做到有新的发明创造。
一、汉字正负单数部首周期表的产生
为了扩大数字与汉字之间的信息交流面,首先要扩大数字的来源。现在我们先将中外表示数字0-9的几种方式收集整理出来,然后再从中寻找各种形式的数字与某些汉字部首在形态结构上的相关联系。
表示数字0-9的五种方式:
1.阿拉伯数字:0、1、2、3、4、5、6、7、8、9
2.中国数字小写:一、二、三、四、五、六、七、八、九
3.中国数字大写:零、壹、贰、叁、肆、伍、陆、柒、捌、玖
4.中国的一种记数法:-、、
Figure A9811934800061
、正
5.罗马数字:Ⅰ、Ⅱ、Ⅲ、Ⅳ、Ⅴ
以上这五种表示数字的方式都是人们熟悉的,从中可以看到:0-9的十个数字中每个数字都有几种不同表示方式,例如数字5的表示方式有:5、五、伍、正、Ⅴ。
现在我们来寻找各个数字与汉字某些部首在形状结构上的相关联系。在上面的数字中,下方打有线条者,有的本身就是汉字部首,有的是汉字部首的同形或近形或变形。
数字0与汉字部首“口”是近形,与缺口框部首(冂、冂、、匚)是变形。
部首横“一”和部首“工”本身就是数字1的一种表示方式,部首“冖”是一的变形,部首“衣”与数字1是同音。
部首“二”和部首“Ⅱ”是数字2的一种表示方式,我们把部首撇(/)归为数字2的范围,可以理解为撇(/)是阿拉伯数字2的腰部。
人们常说梅花三点,我们将部部首点(丶)取其代码为数字3,以数字3为代码的部首还有:了、三、下、山(山与数字3近音)。两直笔相交成叉的部首(十、
Figure A9811934800071
、乂)取代码为数字4,可以理解为,叉(十)是数字4去撇后所得。代码为4的部首还有:四、止、4
Figure A9811934800072
把部首插(一笔贯穿二笔或两笔以上的部首:扌、丰)取代码为数字5。可以理解为插是叉(十)加一画为5(4+1=5)。代码为5的部首还有:5、五、正。
把小“六”头“亠”和大“陆”旁“阝”两个部首取代码为数字6。
把与数字7(七)同形或近形的部首折(
Figure A9811934800073
厶、乙);角(几、厂)取代码为数字7。
把八字形和其变形的部首(人、入、亻、、丷)取代码为数字8。
把穿心旁部首(忄)取代码为数字9,可以理解穿心旁(忄)是八字加一竖为9(8+1=9)。代码为9的部首还有:小、久,久的变形(久、ク、勹、
Figure A9811934800074
)。久的变形部首都是由撇和折构成,撇是2,折是7,2+7=9。部首“尸”是反9近形,把它归入数字9的范围。
从上面所述,可以看到各种方式表示的数字与某些汉字部首是同形或近形或变形,个别是同音,也就是说数字与部首之间有着一种对应的相关联系,将它们之间的这种相关联系编成汉字部首与数字联网表。见表Ⅰ。表Ⅰ:汉字常用部首与数字联网表
Figure A9811934800081
在上面的联网表中,可以看到,从0到9这十个数字中,每个数字都是代表着一部分汉字部首,我们将这十个数字编成十个周期,将与各数字有关联的部首分别列入各周期内。由于汉字数量庞大,字体结构繁杂,如果只用0-9十个数字编码,势必有部分重码字。本发明人在中学时曾发明了正负杂合数运算法,并研制出了多功能正负算盘。正负杂合数变化多端,又能与自然数互换,可以应用到电脑上。如果把0-9这十个负数引进汉字编码,加上0-9十个正数,一共20个正负数参加排列组合,就会使数码的离散度大增,使重码率大幅度下降,为此我们将同一周期的部首划分成正负两个区域。划分原则是:与数字同形或近形的部首列入正数区;属于数字变形的部首、与数字同音的部首列入负数区。例如“口”字部首列入0周期正数区,用0表示;缺口框(冂、凵、匚)列入0周期负数区,用0表示。部首“一”和“Ⅰ”列入1周期正数区,用1表示;部首“冖”、“衣”“衤”、“礻”列入1周期负数区,用1表示。
另外一些组字极强的部首,它的代码包含着两个或两个以上数字,这些数字又是相同的,例如“氵”其数码是333。我们只取其首码,其余码省去,并取负数,根据这个原则,将下列部首:氵、纟、竹()分别取码3、7、9。还有部首“贝”、“禾”、“木”它们的字形结构中有横与坚,撇与捺之对称,可看成互消,我们也只取首码,其余码省去,将“贝”、“禾”、“木”分别取码为:0、2、4。
经过正负划分后,同周期同区域的部首仍有2至4个,为了使它们相互区别开来,我们根据每个部首形状结构特点分别配给一个与其同形或近形的英文字母,这些英文字母称为形码,一共使用9个英文字母,下面是9个形码的使用范围及其相关的汉字部首:
Q:部首中有封口的框。如、Ⅱ、四、目、阝、
Figure A9811934800101
、耳、又、女、尸、攵。
A:部首缺口向下,如:冂、巾、几、人、入、(止)。
V:部首缺口向上,如:凵、山、(4)
C:部首缺口向右或有勾向右。如: 匚、七、儿、九。
D:部首缺口向左或有勾向左。如:、彐、
Figure A9811934800102
勹。
I:组成部首主笔为竖或笔顺,部首顺是从上至下。如:工、讠、丰。
H:组成部首主笔为横,或笔顺、部首顺是从左至右。如:冖、二、三、
Figure A9811934800103
X:组成部首的笔画类型有两种或两种以上,其中有的有叉。如: 礻十、X、五、正、立、厂、亻、、小
Figure A9811934800105
y:是正负特区的符号,英文字母y与“特”字部首“牛”是近形。每周期挑选两个使用频率高的字分别划入正特区和负特区,这两个字互相是近形或近义或有一定关联,容易记忆。从0到9十个周期的十对正负特区的字分别是:日与月;雨、衣;白,的;上、下;土、地;虫、草;广、疒;力、刀;火、(金);久(ク)、夕。
为了便于检索和记忆,我们将与数字有关联的85个常用汉字部首按顺序编成周期区域表,一共分为0至9十个周期,每个周期又分为三个区:正数区,负数区,正负特区。由于这些部首都是只含有一个单正数或一个单负数,所以把这个周期区域表统称为汉字正负单数部首周期表。见表Ⅱ。表Ⅱ:汉字正负单数部首周期表
Figure A9811934800111
二、汉字正负单数部首数码输入法
(一)采用通用电脑,将本发明编制的周期中使用的十个正数码和十个负数码和9个形码分布在通用键盘的26个英文字母键上。各英文字母键重新标识如下:(在每一个英文字母键上刻上一个数字或形码)。原英文  新刻上  与数字相关           原英文字  新刻上  与数字相字母    的数字  的部首                 母      的数字  的部首。A       C       口、 日             Q         C       灭、冂、、、月S       1       一、工、雨             W         T       衤、礻、宀、衣D       2      丿、Ⅱ、二、日          E         2       木、丨(刂)、的F       3      丶、三、了、讠、上      R         3       氵、 彐、巾、下、G       4      十、
Figure A9811934800123
四、
Figure A9811934800124
土、    T         4       木、乂、目、上、地H       5      扌、丰、五、
Figure A9811934800125
虫      Y         5       艹
Figure A9811934800126
J       6      冫、 立、阝、广      U         6       宀、耳、疒、K       7      
Figure A9811934800128
乙、七、女、力   I         7       纟、乂、几、厂、刀L       8      八、人、亻、儿、火      O         8       丷、、入、钅(金)M       9      忄、九、勹、攵、久      P         9        竹、小、尸、夕原英文字母 新刻上的形码N          A.HB          D.RV          VC          C.IX          XZ          g
(二)汉字数码的编码方法。
1.单个汉字的编码方法
本发明编制的周期表中一共有85个单数部首,每个部首都有一个单数字代码。每个汉字都是由若干个单数部首组成的,按笔顺将组成某汉字的若干个单数部首分别转换成单数字,由若干个单数字便组成了某汉字的数码。例:华:874;京:609。
编码时按下列笔顺原则:
(1)先上后下。例:享:6031;(2)先左后右。例:村:443;(3)先外后内。例:固:040;(4)先中间后两边。例:办:78;(5)先里头后旁边。例:过:4337;建:533。
注:从直观来看部首“之”和“廴”都是在左上方,而按笔顺是在后面我们分别取负数码:“之”为37;“廴”为33。与这种类似的还有部首“戈”和“”,“戈”取码为53;“弋”取码为73。
本发明编制的周期表中的85个部首包含信息量大、组字力强,使用频率高,所以由它们组成的大量汉字其数码都在一至四码之间,例如“盟”字一共13面只有三码:004;“蟑”字一共17画,只有四码:5604;“戆”字一共25画也只有七码:6049109。为了提高专业人员的输入速度,我们规定每个汉字最多取四码。对一些特别繁杂的汉字如果只按笔顺取四码,就会出现少量的重码字,为了将重码降到最低,我们采取“三顺”取码法,即按层次顺,部首顺,笔顺取码。
为了弄清“三顺”,先将汉字的组合分析一下。首先由笔画按一定顺序组成单数部首,再由两个或两以上的单数部首组成双数部首由一些笔画通过相交、相接或包围形成的部首称为独体部首;由两个或两个以上独体部首组成的部首叫合体部首。例如,在“警”字中,“敬”是合体积部首,“苟”和“攵”是独体部首。
一些繁杂汉字包含的部首常常是多层次的,一个字包含着大部首,这是一个层次,一个大部首又包含着小部首这是两个层次,小部首又包含着更小的部首,这是三个层次,依次类推。对于汉字的层次由大到小进行逐层分解,每次分解都是一分为二,一直分解到单数部首为止。第一次分解出来的两个部首叫一级部首;第二次分解出来的两个部首叫二级部首,依次类推。下面我们来分解“挚”字:
Figure A9811934800141
“挚”字是三个层次,“执”和“手”是一级部首;“扌”、“丸”“/”、“扌”是二级部首;“九”和“丶”是三级部首。
再相似的两个汉字也有差异部分,这些差异部分大多集中在一级部首和二级部首的头部,这些部位是取码重点部位,为此我们要准确地找到每个字的两个一级部首,也就是要找到两个一级部首之间的分界线(一级分界线)。要找到一级分界线首先要从整个入手,注意各部首间的间隔。例如“时”字的一级分界线在“日”与“寸”之间;“章”字的一级分界线在“立”与“早”之间。一些多层次汉字的一级分界线难找一些,可根据下列两点去找:(1)一级分界线线段最长,它的延长线不会碰到任何部首;(2)一个字的独体部首排列方面相同,后面的独体部首突然改变排列方向,这个方向改变的转折线就是一级分界线。例如“警”字一级分界线在“敬”与“言”之间。
根据两个一级部首排列方式不同将汉字分成六大类:
(1)上下纯向型:组成字的所有部首都是从上而下排列。例:李、享、曼、章。
(2)上下杂向型:一级部首是上下排列,而有的二级中首是左右排列。例:想、警、茄、赢。
(3)左右纯向型:各部首都是自左至右排列。例:江、明、班、谢。
(4)左右杂向型:一级部首是左右排列,而有的二级部首是上下排列。例:保隔、鄂、躺。
(5)右(上)左型:由部首:戈、弋、辶、廴组成的字。例:栽、式、过、延。
(6)全包围型或部分包围型。例:回、国、同、画、医、句。
了解上述汉字的六种分类,对寻找一级部首,二级部首有利。现在来总结一下单个汉字的取码原则和方法:
取码原则:每个字最多取四码,一级部首最多取三码,二级部首最多取两码。
取码方法:先将一个字分成前后两个一级部首,如果前一级部首是纯向型,取前两码,再取后一级部首前两码共四码。例:“鼾”取2414。“赣”取6091。如果前一级部首是杂向型,取三码,前二级部首取前两码,后二级部首取首码,再取后一级部首首码共四码。例,“戆”取6099。取三码的常用部首只有几个,例如:“敬”部首取码598;“辟”部首取码906。
如果前一级部首只有一码,后一级部首取前三码。例:“倒”取8174。
如果一个数如数码不足三码,补加第一部首的相关形码,第一部首无形码加空格键E或加部首排列方式码I、H。例:罗:49Q;千:24E;只:08I;叭:08H。
每个汉字的编码数字不用死记硬背,只要记住周期表中的85个单数部首代码即可,而每个单数部首的代码是有理据的(单数部首与其代码数字是同形或近形或变形)容易记忆。由单数部首组成的复合部首只取第一、第二码,这些复合部首称为双数部首。为了专业人员提高输入速度,减少双数部首的重码,我们将少量的双数部首取第一、第三码。属于下列情况的部首取第一、第三码:
(1)汉字中常将部首“十”作为两个部首之间的联系符号,没有形、音、义方面的理据,所以如果“十”出现在第一、第三码之间,我们把它舍去,部首取一、三码。此类常用部首一共四个:“王”取11;“舌”取20;“缶”取80,“米”取88。
(2)一个部首在三码以上,部首的头两码是折7,将第二码舍去取一、三码,此类常用部首共两个:“马”取71;“予”(矛)取72。
(3)部首“一”在汉字中出现频率极高,它处于部首第一或第二码取其代码1,例邢:156;鸽:8127。如果部首“一”处在两个独立部首之间,它常常是画蛇添足的笔画,把它舍去,例:“微”取2837。为了避开重码部首“一”在三个部首中作负数符号用;部首“西”取18,“酉”取18;“半”取85,“羊”取85;“乞”取87,“气”取87。
(4)部首方框(口)和缺口框(冂、凵、匚)在汉字中使用频率极高,为了减少重码,我们规定,如果这样部首出现在独立部首的首码取其数码0或0。例,“思”取049;“同”取010。如果这些部首不是处在独立部首的首码,则这些部首不取码,直接取框内的部首码。例,部首“鬼”取24;部首“舟”取26。
现在我们将常用的双数部首按周期顺序编成常用双数部首数码表,见表Ⅲ。表中大部分部首是取第一、第二码。凡是取第一、第三码的部首,上面打有三角符号△。表Ⅲ:双数部首数码表
Figure A9811934800171
2.重码字的处理。
由于本发明使用的单数部首代码是来自数字0-9的五种表示方式,所以它们包含的信息量大;加上独创了正负数码,十个正数字和十个负数字同时参加排列组合,使数码的离散度大增;在取码数目上不是一刀切,而是取1至4码不等;在取码顺序上不是单条腿走路(只按笔顺取码),而是采用层次顺、部首顺、笔顺的三顺取码法。所以重码率非常低,即使出现重码也只有两个字。出现重码时,电脑鸣笛,并在提示行里将两个重码字列出,在字前依次编有符号1、2。1号字是系统自选,继续输入下一字时,它会自动上屏;2号字按空格键E即可上屏。因为重码字极少,一有只有两个字,所以经过打字训练后,记住了哪两个字是重码字并记住了哪个是1号哪个是2号,那么打字时不用听鸣笛声,也不用看提示行,凡是输入重码1号字,什么都不用管,继续往下打即可;若输入重码2号字,多按一下空格键,如果忘了按空格键,也无关大局,到了核对时再进行修改。
3.词组的取码方法。
(1)2-4字的词组取四码,不足四码的加空格键E。
两字词:每个字只取前两码。例如:计划:3452;木架:470E
三字词:第一个字取前两码,后两个字各取首码。例:语文科:3562;土地局:449E
四字词:每字取首码。例:国家计委:0632;一心一意:1916。
(2)五个字以上的词组取四码或五码:
(a)由两个独立词组成的复合词组取四码:第一独立词取前两个字的首码,第二独立词取第一个字和最后一字的首码。例:国务院办公室:0976;中国专利局:5059。
(6)由两个以上的独立词组成的复合词组取五码:第一独立词取前两个的首码,第二、第三独立词各取首码,最后一个字取首码,共五码。例:中国社会科学院:50126;中国石油化工总公司:50187。
三、周期单数部首直接输入法(85个键的动态键盘输入法)。
将周期表中的85个单数部首,按周期、区域顺序排列起来,制成85个键的动态键盘,可以在屏幕下方显示出来,每一个键上有一个单数部首和一个相关的代码数字,操作者可用鼠标笔点取键盘按扭,实现汉字输入,这是一种部首直接输入法,不用编码,不用记正负数码和形码,各键中的数字只起了排列顺序的作用,为操作者快速准确找到各部首起补助作用。例如要输入“口”字,用电脑笔点取一个部首键:
Figure A9811934800191
;要输入“明”字、用电脑笔点取下列两个部首键: 要输入词组:“推陈出新”,用电脑笔点取下列四个部首键:
Figure A9811934800193
也可制造一个85键的手按新键盘,用手指按部首键盘,实现汉字输入。
四、手写输入法
用电脑笔在写字板上书写要输入的字或词组的数码,也可以书写相关的部首,电脑通过单数部首识别系统,将书写的数码或部首转换成标准汉字。例如要输入“衙”字,可以书数码2850,也可以书写四个单数部首:
Figure A9811934800194
要输入词组“品德高尚”可以书写数码0269,也可以书写四个单数部首:“口,丿,,小。当然也可以将每个字写完整,关键是要将每一个字的第一部首写准确,其余部首没有严格要求,因为词组的编码由每个字的第一单数部首组成,其余部首的书写与否,书写好坏不影响词组输入。这样一来,本发明的新手写输入法比目前现有的其他手写输入法要快,准确率要高。因为其他手写输入法要求书写的字与电脑里存的标准字进行整个字形比较。每个字都要写完整,每个部首都要写准确,时间就要长,如果其中任何一个部首写得不清楚,就会影响准确率。
五、扫描输入法
把纸上的文字经过扫描后送入电脑,电脑通过单数部首识别系统将纸上的字和词组转换成标准汉字。由于词组的编码由每一个字的第一单数部首组成,所以电脑的识别系统只对字的第一单数部首图像进行识别即可,其余部首图像不参加识别,也不影响输入。
目前现有的其他扫描输入是将纸上的汉字图形扫描入电脑,使每个汉字的整个图形与电脑里的标准字形进行比较,整个字形一致的才能输入,对规范的印刷体汉字输入效果尚好;而对手写体汉字识别率很低,识别手写稿常常是错误百出,反复修改也无济于事。而本发明的扫描输入法对印刷体汉字输入快而好;对手写体汉字识别率也相当高,即使有些差错,一经修改即可。原因是本发明的扫描输入,只需对每一个字的第一单数部首图形进行识别,其余部首图形的有无与好坏不影响输入。而一般人在书写时,常常是把每个字的第一部首写得清楚、准确,而其余部首写得潦草,这正好满足了本发明的要求。如果书写者有意识地将词组的每个字的第一单数部首写准确,将少量无法组成词组的单个汉字参加编码的部首写准确、那么手写汉字扫描输入百分之百可以实现。
六、语音与手写配合输入法。
要将某人的讲话变成文字,可以将其语音输入的同时,操作者进行手写输入(手写数码或手写相关部首)。要输入大量文件,可以一人读文件,进行语音输入,另一人同时进行手写输入。
七、把电脑输入和工具书(字典)检索统一起来,让电脑汉化。
字序就是汉字的排列顺序。字序的应用极为广泛,工具书的编排,人名、地名的排列,图书档案等各种目录编制,汉字在电脑字库中的存储都要用到字序。我们在前面已经讲过利用周期表中的85个单数部首给每个汉字编数码的方法。如果把数码由小到大排成系列,于是和数码相应的汉字也就排成了序列。我们把这种新的字序法叫做周期单数部首数码法。用这种新的字序法编写汉字字典和制作汉字电脑字库,把工具书的检索和电脑输入统一起来,把查字、认字、记字、写字、打字有机的结合起来。
单数部首数码法是按照一定规则,由字的单数部首代码一次就可以转换成字的数码,按照数码就可以查到要查的字。它不需要像音序法那样事先弄清字的读音,也不需要像传统的部首法那样先找出部首,也不需要像笔画法那样先数清笔画数,也不需要像电报码,国标区位码那样要死记硬背。我们在前面已分析过,周期表中的单数部首是有理据的,容易做到见部首而知其代码,而汉字的数码是由若干个单数部首代码组成的,所以也容易做到见字而知其数码。例如要查“哼”字,根据组成它的单数部首就知它的数码是0603,由这个数码就知道它是排在新编字典的0周期正数区中部偏后。如果在新编字典的右侧面从上至下用不同颜色标出0-9十个部分(十个周期)。那么要查“哼”字时,在字典右侧面先找到0周期部分,然后在0周期部分的中部打开,将很快找到“哼”字。例如要找“蔓”字,它的数码是5047,它是在第五周期负数区靠前部位上,先在字典右侧找到第五周期部分,然后打开第五周期部分后半部找到第五周期负数区,将很快找到“蔓”字。
人们通过周期单数部首数码新字典能很快查到要查的字,电脑同样通过周期单数部首识别系统能快速准确识别汉字,在这基础上制作汉字操作系统,做到输入汉字命令,电脑给出汉字提示信息,只要认识汉字的人都能容易操作电脑,实现电脑汉化。
八、以正负单数部首周期表和双数部首数码表为依据,对汉字进行整理、修改,使汉字更规范化、更数字化、更科学化。
从单数部首周期和双数部首数码表中,可以看到一些汉字部首数码相同,也就是说,它们过于集中在同一周期同一区域里,而许多周期、区域的编号是空白,没有相应的部首。如果我们对某些过于集中的部首的一些笔画进行合理的修改或增减,改变它们的数码,使汉字部首在单数部首周期表中,在双数部数码表中分布均匀,从而使汉字的重码率为零,使汉字的检索和电脑输入更规范,更简便。到时候就完全可以以新型汉字为基础创造出一种世界通用文字。

Claims (4)

1.一种周期单数部首数码输入法,其特征在于:
(1)本发明编制的汉字正负单数部首周期表中的85个单数部首代码来自人们喜闻乐见的表示数字0-9的五种方式,每个单数部首与其代码数字为同形或近形或变形,个别为同音,使得每个单数部首代码有理据,容易记忆,容易做到见部首而知其代码;
(2)采用通用电脑,将周期表中使用的20个正负数字和9个形码分布在通用键盘的26个英文字母键上,从上至下,各键重新标识如下:0、1、2、3、4、5、6、7、8、9分别分布的Q、W、E、R、T、Y、U、I、O、P上;0、1、2、3、4、5、6、7、8、9分别分布在A、S、D、F、G、H、J、K、L、M上;形码A(H)、D(Q)、V、C(I)、X、Y分别分布在N、B、Y、C、X、X上,由于重新标识的26个字母键安排得很有规律;上排为 0- 9;中排为0-8,下列排为9和形码,所以对数码和形码的位置不用死记硬背,极有利于盲打、快打;
(3)汉字数码的编码方法
a.单个汉字的编码方法:按层次顺、部首顺,笔顺将组成,某汉字的若干个单数部首分别转换成代码数字,若干个数字便组成了某汉字的数码。每字最多取四码,不足三码的加第一单数部首的形码;
b.词组的编码方法,两字词:各字只取前两码,三字词:第一个字取前两码,后两个字各取首码,四字词:每个字取首码;五个字以上的复合词组:第一个独立词的前两个字各取首码,第二,第三独立词各取首码,最后一个字取首码,共五码;如果复合词组只包含两个名词则其数码为四码;
由于单数部首代码是有理据的,能做到见部首而知码,而单字和词组的数码都是单数部首代码组成的,所以单字和词组的数码也是有理据的,也容易做到见字识码,见词识码;由于单数部首代码是来自数字0-9的五种表示方式,它们包含的信息量大,加上正负数码的独创,20个正负数字(0-9, 0- 9)参加排列组合,使数码的离散度大增;在取码数目上,不是一刀切,而是取1至4码不等;在取码顺序上,不是单条腿走路(只按笔顺),而是采用层次顺,部首顺、笔顺的三顺取码法,所以重码率极低,即使出现重码字,也只有两个,处理方法极简便:1号重码字系统自选;2号重码字多按一下空格键。
2.根据权利要求1所述的周期单数部首数码输入法其特征在于这些单数部首可以直接输入电脑:将周期表中的85个单数部首,按周期,区域顺序排列起来,制成85个键的动态键盘,每个键上有一个单数部首和一个与其相关的代码数字;操作者可用鼠标笔点取部首键盘按扭,实现汉字输入,这是一种部首直接输入法,不用编码,不用记正负数码和形码,也可以制造出85个键的手按新键盘,用手指按部首键,实现汉字输入。
3.根据权利要求1、2所述的周期单数部首数码输入法,其特征在于这两种输入法可以应用于手写输入和扫描输入,手写输入是用电脑笔在写字板上书写要输入的字和词组的数码,也可以书写与数码相关的部首,然后电脑通过单数部识别系统将书写的数码或部首转换标准汉字;扫描输入法是把纸上的文字经过扫描后送入电脑,电脑通过单数部首识别系统将纸上文字转换标准汉字,由于单数部首识别系统只需对扫描入的词组中每个字的第一单数部首进行识别,所以只要书写者有意识地将词组中每个字的第一单数部首写规范,将无法组成词组的少量单字写规范,那么手写汉字文稿的扫描输入百分之百能实现。
4.根据权利要求1所述的周期单数部首数码输入法,其特征是:它可以应用于汉字字序法,运用周期表中的85个单数部首给每个汉字编数码,把这些数码由小到大排成系列,于是和这些数码相应的汉字就排成了序列,用这种全新的单数部首数码字序法编写汉字字典和制作汉字电脑字库,把工具书检索和电脑输入统一起来,把查字、认字、记字、写字、打字有机的结合起来,由于单数部首数码字序法是按一定规则由字的单数部首代码一次就可转换成字的数码,按照数码就可以查到要查的字,它不需要像音序法那样事先弄清字的读音;也不需要像传统的部首法那样先找出部首;也不需要像笔画法那样先数清笔画数;也不需要像电报码和国标区位码那样要死记硬背;同样,电脑通过周期单数部首识别系统就能快速准确识别字和词组,在这基础上制作出汉字操作系统,做到输入汉字命令,电脑给出汉字提示信息,只要认识汉字的人都能容易操作电脑,实现电脑汉化。
CN 98119348 1998-09-21 1998-09-21 汉字正负单数部首数码输入法 Expired - Fee Related CN1088211C (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN 98119348 CN1088211C (zh) 1998-09-21 1998-09-21 汉字正负单数部首数码输入法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN 98119348 CN1088211C (zh) 1998-09-21 1998-09-21 汉字正负单数部首数码输入法

Publications (2)

Publication Number Publication Date
CN1220420A true CN1220420A (zh) 1999-06-23
CN1088211C CN1088211C (zh) 2002-07-24

Family

ID=5226343

Family Applications (1)

Application Number Title Priority Date Filing Date
CN 98119348 Expired - Fee Related CN1088211C (zh) 1998-09-21 1998-09-21 汉字正负单数部首数码输入法

Country Status (1)

Country Link
CN (1) CN1088211C (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100424619C (zh) * 2003-12-24 2008-10-08 闫铁 “三键行”计算机汉字输入法
CN102226882A (zh) * 2011-05-25 2011-10-26 何志东 汉字简易正负数码输入法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100424619C (zh) * 2003-12-24 2008-10-08 闫铁 “三键行”计算机汉字输入法
CN102226882A (zh) * 2011-05-25 2011-10-26 何志东 汉字简易正负数码输入法

Also Published As

Publication number Publication date
CN1088211C (zh) 2002-07-24

Similar Documents

Publication Publication Date Title
CN1043210A (zh) 字根编码输入法及其设备
CN1030985A (zh) 表意文字的处理方法及装置
CN1072029A (zh) 五笔二维编码法及键盘
CN1088211C (zh) 汉字正负单数部首数码输入法
CN1262474A (zh) 二十四部首汉字排序编码法及其键盘
CN1089176C (zh) 汉字正负数码输入法
CN1073722C (zh) 一种拼音输入方法
CN1059281C (zh) 汉字声韵调三拼音形编码输入方法
CN1150441C (zh) 字形笔顺码汉字输入法及其键盘
CN1028457C (zh) 一种笔画数码加声码的汉字计算机输入系统
CN1256644C (zh) 一种偏旁部首汉字输入方法
CN1773432A (zh) U码汉字输入法
CN1207648C (zh) 五三码及其键盘
CN1115619C (zh) 一种字元拼形计算机汉字输入法
CN1326125A (zh) 全息万能拼音笔顺码及其使用方法
CN1269007C (zh) 笔删式触控键盘中文音象全功能输入装置
Siromoney Contributions of Professor Gift Siromoney in the area of pattern recognition
CN102637077A (zh) 用于计算机汉字输入的音、形、调混合编码方法
CN1204083A (zh) 一套汉字编码输入法及其键盘和检字法
CN1360246A (zh) 汉字编码数字化及其使用方法
CN1776574A (zh) 外围字素汉字编码输入法及其键盘
CN1101140A (zh) 字形笔顺码汉字输入系统及其键盘
CN1178339A (zh) 一种计算机汉字输入国文码
CN1285542A (zh) 鼎立世界码及其改进兼容键盘
CN1160243A (zh) 字形笔顺码汉字输入系统及其键盘

Legal Events

Date Code Title Description
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C06 Publication
PB01 Publication
C14 Grant of patent or utility model
GR01 Patent grant
C19 Lapse of patent right due to non-payment of the annual fee
CF01 Termination of patent right due to non-payment of annual fee
C57 Notification of unclear or unknown address
DD01 Delivery of document by public notice

Addressee: He Zhidong

Document name: Notification of Termination of Patent Right