CN1700157A - 模块汉字编码方法 - Google Patents
模块汉字编码方法 Download PDFInfo
- Publication number
- CN1700157A CN1700157A CN 200510085012 CN200510085012A CN1700157A CN 1700157 A CN1700157 A CN 1700157A CN 200510085012 CN200510085012 CN 200510085012 CN 200510085012 A CN200510085012 A CN 200510085012A CN 1700157 A CN1700157 A CN 1700157A
- Authority
- CN
- China
- Prior art keywords
- module
- code
- chinese character
- modules
- rule
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Document Processing Apparatus (AREA)
Abstract
本发明涉及模块汉字编码方法,更具体地说涉及计算机汉字输入方法。该方法有以下步骤:利用编码规则及模块表将汉字按笔顺拆分成几个模块;取其第1、2、3及最后一个模块;对照模块表替换成与之对应的英文字母作代码;四个代码再组合就是该汉字的编码;从键盘上键入编码。从汉字拆分的模块中取其四,依汉字结构有五种取法:按笔顺选取第1、2、3、4(尾)模块;边角优先选取;首尾优先、尾优于首选取;上下或左右结构,平均选取;左中右结构,按1∶2∶1的比例选取。助记词共180字分四类:复合拆分字、代码移位字、笔划字、一码字,都遵守编码规则。其中,复合拆分字编码时要用复合拆分规则,代码移位字要用代码移位规则。
Description
技术领域
本发明涉及计算机汉字编码方法或汉字输入方法,更具体地说,模块汉字编码方法实际上是将汉字输入到计算机的一种方法。
背景技术
汉字编码当前技术水平:从上个世纪七十年代末起,很多人参与汉字输入计算机的工作,不仅解决了从无到有的问题、而且有很大的进展;也曾出现过好多汉字编码,推行开的也有几种,例如:五笔字型法,双拼音法,智能ABC法等方法。五笔字型法虽然可以实现盲打,但由于记忆难,仅适用于专业打字人员;双拼音法和智能ABC法等方法虽然使用简便,但由于重码太多,不能盲打,影响速度;对于以高速、大量信息处理为特点的计算机而言,汉字输入仍然是信息处理的瓶颈。因此社会上迫切需要一种既能盲打、没有重码,又易记易行的汉字编码方法或汉字输入方法。
发明内容
本发明所要解决的技术问题是克服现有技术的缺点,提供一种没有重码,能够盲打;编码规则简单,不需要添加设备的,容易记忆的汉字编码方法或计算机汉字输入方法。即“模块汉字编码方法”。
使用本发明的“模块汉字编码方法”,有以下步骤:
按编码规则先将某汉字拆分并选取四个模块,对照‘模块表,转换成代码,四个代码再组合即组成该汉字的编码,从键盘键入编码。计算机就会从‘汉字与模块汉字编码转换表’找出该汉字显示在屏幕上。
其特征在于:
1)、编码规则;2)、怎样选取四个模块;3)、设置助记词;
1)、编码规则:有三个输入规则:(1)汉字拆分规则;(2)解决重码问题的复合拆分规则;(3)解决重码问题的代码移位规则;(1)上述汉字拆分规则有以下三个内容:a)模块,b)反偏首模块以及c)模块变形;a)其中模块是指将每个汉字按字形拆分为若干模块,所有模块都被写入模块表中,模块表中共有70个模块,分别均有对应的英文26个字母作代码或字符,按笔顺取其第1、2、3及最后一个模块所对应的英文代码或字符,就组成该汉字的英文编码,上述26个英文字母就是分配在计算机键盘上的26个英文字母;不足四个模块者用空模块补齐,空模块代码为D;模块与英文代码的对照见模块表;b)反偏首模块:将上述70个模块中的13个偏旁部首定义为反偏首模块或反常模块,它们是:日、月、钅、木、氵、火、亻、扌、口、疒、艹、又、石;要给反偏首汉字编码,只需将第一个(即反偏首)模块的代码移到第4位,将第2、3、最后一个模块的代码分别左移到首位、第2位、第3位;在计算机术语中,这称为:循环左移一位规则;c)模块变形:模块表中用方括号括起的模块可看成模块的变形:‘已,或‘己,是模块“巳”的变形;‘氺’是模块“氵”的变形,‘心’是“忄”的变形,模块变形的英文代码与其模块英文代码一样;当该汉字少于四个模块时,下列模块变形需加前缀或后缀:上述前缀加代码D或U,上述后缀加代码D或U或C;
模块变形需加前缀或后缀的是指:讠(D)L,方(D)G,衤Y(U),牜(U)F,禾(U)R,辶(D)V,宀(D)B,广(D)W,户(D)P(U),廿H(C);
关于模块说明:‘模块’与‘字根’或‘字元’大同小异,“模块汉字编码方法”只采用‘模块’,名副其实,更具个性。
(2)解决重码问题的复合拆分规则:复合拆分规则是对一个汉字进行二次拆分:将“异”拆分为“巳”、“艹”两个模块,对后一个模块“艹”再进行二次拆分为“一”、“丨”,“异”的英文编码为ZHCI;
(3)解决重码问题的代码移位规则:代码移位规则是对某个汉字拆分后模块对应的四个英文代码循环左移一位;
2)、怎样选取四个模块是指在拆分汉字时为了避免出现二义性,根据各种汉字结构有五种选取考虑:按笔顺选取第1(首)、2、3、4(尾)模块;边角优先选取;首尾优先、尾优于首选取;上下或左右结构者,平均选取;左中右结构者,按1∶2∶1比例选取;
3)、助记词的设置:设置反偏首模块、复合拆分和代码移位三项技术,目的都是为了消除重码。其实,汉字编码要解决的核心问题就是消除重码。汉字中笔划完全相同的重码字就有112个,如已己巳、未末、贝内冈、人入八义、晾景、吧邑等。助记词共需记住180字,以设置助记词的代价换得用三项技术简便解决了重码的难题;助记词有四类字:
(1)、复合拆分字:共有56字;
(2)、代码移位字:共有97个;
(3)、笔划字:这里指需要记住的18个笔划字,这18个字尽管也能拆分为模块,但只按笔划拆分,笔划也是模块,所以笔划字完全遵守第一条编码规则;
(4)、一码字:共有10字,一码字指汉字就是模块,它的代码是唯一的有效代码,其它3个为空模块的代码D。
各类助记字都遵守编码规则。
本发明的“模块汉字编码方法”方法与现有技术相比较有以下有益效果:
1、没有重码,能够盲打;
2、编码规则简单,容易记忆;
3、本编码通过键盘输入计算机来实现,不需要添加专用设备。
具体实施方法字例
实施例1:(模块)
“给”由纟、人、一、口4个模块构成,纟的代码为E,人代码为G,一代码为C,口代码为O,于是汉字“给”的编码为EGCO;
“峰”由5个模块山、丿、又、二、十构成,取其4个模块山、丿、又、十,“峰”的编码为AUKI;
“粉”由三个模块米、八、刀构成,补一个空模块,“粉”的编码为NKBD;
“间”由两个模块门、日构成,补两个空模块,“间”的编码为NQDD;
实施例2:(反偏首模块)
“曙”拆分为日、四、土、丿、日,取日、四、土、目,编码为FTQQ;
“膜”拆分为月、艹、日、大,编码为HQYA;
“铭”拆分为钅、夕、口,编码为NODG;
“村”拆分为木、寸,编码为HDDR;
“照”拆分为日、刀、口、灬,编码为QBOX;
值得注意的是:
(1)反偏首指纯粹的偏旁部首,如“昭BODQ中的“日”,而“照”QBOX中的“日”则不是反偏首。同样,楚RRJS,嗣OHJO,渠ZPPR,哲FUIO,勤HTJU,甲QIDD,畅QIJU,忠OIXD,男QJUD,恁MUTX,颡KRXG等,起笔模块都不是反偏首。不言而喻,不在起笔位置的这些模块,就更不是反偏首了。如普HXCQ,朝IQIA,淦GDDZ,桀NFRD,衍KZTJ,灾DBXD,苻MHDH,皙RUUQ,鼻UBKH,围OTJI,峪AKGO,亵XFSY,磬TUSE,蠹CESS,淑RZKZ。
(2)广而知之,模块表中所列70个模块,它们的检字功能适用于汉字的各个位置;而字典中的近二百个偏旁部首,其检字功能只限于起笔,还不严格。
实施例3:(模块变形)
让DLRC,记DLZD,谱LHXQ,袄YUUY,褥YWTH,利URIJ,穆RUQU,牲UFMT,物FUJU,逞OMDV,退JTYV,廻OOVD,延USVD,宴DBQW,密BXUA,应DWZC,启DPUO,扁DPSH,编EPSH,洪HCKZ,黄HSTK,潢HSKZ,放GMUV,防PDGD;
[注]:下列常遇见的偏旁部首没定成模块,因为它们可以用其首尾模块的两个代码表示:虍RL,斤UI,鸟UC,隹MT,耳CU,骨SA,身UU,皮JK,鼠NL,雨CZ,革HI;但也可以不限。因而这些偏旁部首不需要记忆。其例字见实施例4。
实施例4:(未定成模块的偏旁部首实例)
虎RLUS,虢GHRS,虑RJLX,雄WEMT,雕SOMT,难MXTK,骸SAXG,滑SJAZ,颇JKXG,波JIKZ,皮JIUK,鞭HIMV,新XRUI,沂UUIZ,饵KCIU,聋WLCU,聪CUKX,耳CIIU,聊UUPC,射UIUH,躺UUZO,身UIJU,雪CZJT,雹CZUZ;
实施例5:(复合拆分)
复合拆分是对一个汉字进行二次拆分。
如“异”拆分为“巳”、“艹”两个模块,对后一个模块“艹”二次拆分为“一”、“丨”,于是“异”的编码为ZHCI;
同样,“仁”TCCM,“权”KJVR,“岂”AZPL,“肯”SAST,“休”RCZM。
从这些例字可知,复合拆分都出现在第一次拆分为两个模块的汉字上。
实施例6(代码移位)
代码移位就是对某个汉字拆分后模块对应的四个代码循环左移一位。左移方法与反偏首字一样,可见左移字中的反偏首字要经过二次循环左移。
具体例子:凡SDDU,著UQHT,叙CRKG,跋SWKO(注:多于四个模块的汉字,模块,通常忽略),及JJVU,标ZDRT,引SIDP。
实施例7(怎样选取四个模块)
实施例7(1):
按笔顺选取第一(首)、二、三、四(尾)模块。
窨BKXQ,烹XOJX,跑OSUZ,膀XKGA,礴HZHE,旮USQD,旯USDQ,蔬JSLH
实施例7(2):
边角优先选取。静TABJ,萍ZCIH,鞣HIER,戳JJMB,戮JGUB,氄EOUL,劐HMKJ,倒CTJM,熬TBMX,巅AIKG,箫GJUI
实施例7(3):
首尾优先、尾优于首选取。例:籴UVKR,悍XQCI,邗TIPD,末CRDD
实施例7(4):
上下或左右结构者,平均选取。例:甓PXLS,瓴GECS,罄TSMA,誓FUXO,瓢FZUV
实施例7(5)
左中右结构者,按1∶2∶1比例选取。例:弼PXQS,掰UKBJ,嘏IPTK,衢KBTJ,蹾OXVV,懒XCZG,辨XUDI,锻UTKG。
实施例8(助记词:复合拆分字,代码移位字,笔划字和一码字)
需要助记的字:
(个)1个不进行代码移位的反偏首字:呗OSGD。
3个需二次左移的正常模块字:九DDUS紖SIEP动JUTE。
(十)10个一码字。
(百)97个代码移位字,(含二次左移的正常模块字三个:九纼动)
(二)18个笔划字
(五)56个复合拆分字
总共180字,只占全部汉字的0.027%。
实施例8(1)复合拆分字
复合拆分字总共56字,全部在例中。
例:刁JUUD仁权岂肯休闲,侜RUIM立XHKC异,厉申示云:七CLLD弁,万CBJU名NOSC好汉,闯NQJC入生林内,觅扒砗芷,未果。几虿GSOE蚬现MYSL,叭KUVO叹,失MYCG足SRGO,血USSH洒FCCZ沐渔RBCZ汩圯下,由STIC钿KSTG粟FNKR忌ZXUD址TSRC右WOSC走TSRG出PAII来CNKR。
实施例8(2):代码移位字
代码移位字总共97个,全部在例中。
例:皈QUKU钠GDGS轱IODF架UORJ(皈钠轱架谐音归纳估价),眷YBDH洗ULZF漱ZGZC抻践SQUO棉恤,田TDDS张SUVP旌MMTG纼SIEP*符MHDG,劳JUHB动JUTE*。猷OYDK聊UUPC吧ILOJ酤IODO旰IDQC。荤FDHB味RDOC:炸ITXM蚺蝤鲷羔TXDH,胗椎胛IDAQ,爪蹄虱骼。唯靳饭菜毫嫌奢杂,荞糗蒲善茴茹莉柑,渐粮荒,炱屑,另信:矶庇飓霆,濠江九DDUS*浬涡泓,旭暮坳吠,禽窠鸹啼,籁渲呻吟,刀呐救命,景貌荫凉。*代码移位字中含三个需要二次左移的正常模块字:纼SIEP动JUTE九DDUS
实施例8(3):笔划字(18字)
例子:川井太冈夫曰IJCC:己友干艺亏CCSD,化三弔仅刄尺牛UCCI。
实施例8(4):一码字(10字)
一码字指汉字就是模块,它的代码是唯一的有效代码,其它三个为空模块的代码D。
例子:日DDDQ,月DDDA,土TDDD,木DDDR,人GDDD,心XDDD,匕ADDD,巳ZDDD,八KDDD,夕NDDD。
上述‘模块表’,如下所示:
Q 日 马
A 月 山 匕
G 钅 人 爫 万 [方]
R 木 鱼 舟 [禾]
Z 氵 犭 巳 小 [已 己 ツ 氺]
X 火 忄 灬 亠
[心 ]
M 亻 王 []
O 口 酉 [囗]
H 艹 寸 冫 [廾
]
F 扌 车 西 罒 [牜
]
E 石 纟 [厶 ]
K 又 饣 田 彳 八 [丷]
T 土 二
B 冖 刀 戈 目 [ク
宀]
W 女 厂 [ナ 广]
P 阝 匚 [ㄩ
卩 尸 户]
S 虫 止 皿 冂 乁
V 子 [辶 廴]
U 丿
C 一[ ]
I 丨十
J [乛]
L [讠]
D 丶空模块
以上模块共70个,模块变形42个。上述‘汉字与模块汉字编码转换表,的说明:它是全部汉字与其“模块汉字编码方法”编码一一对应的字库,是本发明不可分的一部分。此转换表可利用WORD字处理文件实现。如欲将此转换表置入计算机,还需经早已公开的技术进行汉字与计算机内码的转换。无需赘述。
以上实施例只是对本发明作较为详细的描述,不是用来限定本发明的保护范围的,在不脱离本发明的精神和构思的范围内,本领域普通技术人员可以进行各种改进或变化,仍然属于本发明的保护范围。
Claims (1)
1、模块汉字编码方法是一种汉字编码方法或计算机汉字输入方法,该方法使用编码规则、模块表和汉字与模块汉字编码转换表,有以下步骤:
按编码规则先将某汉字拆分并选取四个模块,对照模块表转换成代码,四个代码再组合即该汉字的编码,从键盘键入编码,计算机就会从汉字与模块汉字编码转换表中找出该汉字显示在屏幕上;
其特征在于:
1)、编码规则;2)、怎样选取四个模块;3)、设置助记词;
1)、编码规则:有3个输入规则:
(1)拆分规则;(2)解决重码问题的复合拆分规则;(3)解决重码问题的代码移位规则;
(1)上述拆分规则有以下三个内容:a)模块,b)反偏首模块以及c)模块变形;a)其中模块是指将每个汉字按字形拆分为若干模块,所有模块都被写入模块表中,模块表中共有70个模块,分别均有对应的英文2 6个字母作代码或字符,按笔顺取其第1、2、3及最后一个模块所对应的英文代码或字符,就组成该汉字的英文编码,上述26个英文字母就是分配在计算机键盘上的26个英文字母;不足四个模块者用空模块补齐,空模块代码为D;模块与英文代码的对照见模块表;b)反偏首模块:将上述70个模块中的13个偏旁部首定义为反偏首模块或反常模块,它们是:日、月、钅、木、氵、火、亻、扌、口、疒、艹、又、石;要给反偏首汉字编码,只需将第一个反偏首模块的代码移到第4位,将第2、3、最后一个模块的代码分别左移到首位、第2位、第3位;在计算机术语中,这称为:循环左移一位规则;c)模块变形:模块表中用方括号括起的模块可看成模块的变形:已或己是模块巳的变形;氺是模块氵的变形,心是忄的变形,模块变形的英文代码与其模块英文代码一样;当该汉字少于四个模块时,下列模块变形需加前缀或后缀:上述前缀加代码D或U,上述后缀加代码D或U或C;
模块变形需加前缀或后缀的是指:讠(D)L,方(D)G,衤Y(U),牜(U)F,禾(U)R,辶(D)V,宀(D)B,广(D)W,户(D)P(U),
H(C);
(2)解决重码问题的复合拆分规则:复合拆分规则是对一个汉字进行二次拆分:将异拆分为巳、艹两个模块,对后一个模块艹再进行二次拆分为一、丨,异的英文编码为ZHCI;
(3)解决重码问题的代码移位规则:代码移位规则是对某个汉字拆分后选取模块对应的四个英文代码循环左移一位;
2)、上述怎样选取四个模块:是指从汉字拆分出的若干模块中怎样选取其四,按笔顺选取第1(首)、2、3、4(尾)模块;边角优先选取;首尾优先、尾优于首选取;上下或左右结构者,平均选取;左中右结构者,按1∶2∶1的比例选取;
3)、助记词的设置:助记词有四类字:(1)、复合拆分字56个,(2)、代码移位字97个,(3)、笔划字18个和(4)、一码字10个;各类助记字都遵守上述的编码规则;
上述模块表如下所示:
Q 日 马;
A 月 山 匕;
G 钅 人 爫 万 [方];
R 木 鱼 舟 [禾];
Z 氵 犭 巳 小 [已 己 ツ 氺];
M 亻王 [];
N 疒 门 夕 米 臼 [
];
O 口 酉 [囗];
F 扌车 西 罒 [牜
];
E 石 纟 [ム ];
K 又 饣 田 彳 八 [丷];
T 土 二 [
];
B 冖 刀 戈 目 [ク
宀];
W 女 厂 [ナ 广];
P 阝 匚 [凵 コ卩 尸 户];
S 虫 止 皿 冂 乁[
];
U 丿;
I 丨 十;
J [亅 乛];
L
[讠];
D 丶 空模块;
模块70个,模块变形42个;
上述汉字与模块汉字编码转换表是全部汉字与其模块汉字编码一一对应的字库。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 200510085012 CN1700157A (zh) | 2005-07-19 | 2005-07-19 | 模块汉字编码方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 200510085012 CN1700157A (zh) | 2005-07-19 | 2005-07-19 | 模块汉字编码方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN1700157A true CN1700157A (zh) | 2005-11-23 |
Family
ID=35476240
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN 200510085012 Pending CN1700157A (zh) | 2005-07-19 | 2005-07-19 | 模块汉字编码方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN1700157A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104346375A (zh) * | 2013-07-31 | 2015-02-11 | 北大方正集团有限公司 | 一种制作中间字库的方法以及装置 |
CN105912139A (zh) * | 2016-01-11 | 2016-08-31 | 金云中 | 一种模块化笔画编码汉字对应识别的方法 |
CN112083813A (zh) * | 2019-10-25 | 2020-12-15 | 钱文威 | 一种汉字输入法 |
-
2005
- 2005-07-19 CN CN 200510085012 patent/CN1700157A/zh active Pending
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104346375A (zh) * | 2013-07-31 | 2015-02-11 | 北大方正集团有限公司 | 一种制作中间字库的方法以及装置 |
CN104346375B (zh) * | 2013-07-31 | 2017-10-13 | 北大方正集团有限公司 | 一种制作中间字库的方法以及装置 |
CN105912139A (zh) * | 2016-01-11 | 2016-08-31 | 金云中 | 一种模块化笔画编码汉字对应识别的方法 |
CN105912139B (zh) * | 2016-01-11 | 2022-08-30 | 金云中 | 一种模块化笔画编码汉字对应识别的方法 |
CN112083813A (zh) * | 2019-10-25 | 2020-12-15 | 钱文威 | 一种汉字输入法 |
CN112083813B (zh) * | 2019-10-25 | 2024-06-14 | 钱文威 | 一种汉字输入法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
FRANSEN et al. | Evolution and radiation of shrimp-like decapods: an overview | |
CN105938402B (zh) | 一种声形码汉字输入法及键盘 | |
CN1700157A (zh) | 模块汉字编码方法 | |
CN102306058B (zh) | 音义及声义码汉字输入法 | |
CN1116632C (zh) | 一种电脑汉字输入法 | |
CN1873592A (zh) | 汉字位码笔画输入法 | |
CN1159892C (zh) | 汉字象形数字编码方法及输入键盘 | |
CN1029432C (zh) | 汉字二部数码计算机汉字输入方法 | |
CN1101569C (zh) | 音形码汉字输入方法 | |
CN1139867C (zh) | 新音形简易速录码汉字输入法 | |
CN1249566C (zh) | 新华码汉字输入法 | |
CN1127682C (zh) | 零笔易码输入法 | |
CN1152295C (zh) | 一种计算机汉字部首规范码输入方法 | |
CN1337615A (zh) | 一种可快速检索汉字的电脑输入方法 | |
CN1152294C (zh) | 汉字结构对称输入法 | |
CN1159638C (zh) | 一种计算机六画十二形的汉字输入方法 | |
CN1151426C (zh) | 数码汉字电脑输入法 | |
CN108932065A (zh) | 简化汉字数字部首输入法 | |
CN1101958C (zh) | 八卦码(笔画群)汉字输入方法 | |
CN1042018A (zh) | 拼音文字型汉字编码及键盘 | |
CN1063857C (zh) | 数字式汉字心角编码的计算机汉字输入方法 | |
CN2591671Y (zh) | 信息技术用符底码汉字键盘 | |
CN1056006C (zh) | 汉字编码输入方法 | |
CN1109955C (zh) | 汉字部件笔顺编码输入法及其输入键盘 | |
CN1109289C (zh) | 汉字形声偏旁泛字根结构的码元编码输入方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
AD01 | Patent right deemed abandoned |
Effective date of abandoning: 20051123 |
|
C20 | Patent right or utility model deemed to be abandoned or is abandoned |