CN1134563A - 一种汉字编码方案及其键盘 - Google Patents

一种汉字编码方案及其键盘 Download PDF

Info

Publication number
CN1134563A
CN1134563A CN 96101658 CN96101658A CN1134563A CN 1134563 A CN1134563 A CN 1134563A CN 96101658 CN96101658 CN 96101658 CN 96101658 A CN96101658 A CN 96101658A CN 1134563 A CN1134563 A CN 1134563A
Authority
CN
China
Prior art keywords
chinese
code
word
sign indicating
indicating number
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN 96101658
Other languages
English (en)
Inventor
傅景中
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to CN 96101658 priority Critical patent/CN1134563A/zh
Publication of CN1134563A publication Critical patent/CN1134563A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)

Abstract

一种汉字编码方案及其键盘,是用计算机键盘输入汉字的形音编码方案。在26个英文字母标准键盘上对应有:人手足口耳目文言武歹金木水火土日月儿女衣食住行鸟兽杂。编码按外形相似、属性相同、意思相近等进行分类。如:牛、马、羊、龙、虎、鹿、犬、鼠归为兽;衣、巾、毛、皮、革、归为衣。单字为四码,成语、词组为五、六码。可将单字、词组、成语联合输入,是重码最少的编码方案之一,且有易学、易记、易操作以及输入快等特点。

Description

一种汉字编码方案及其键盘
本发明涉及一种汉字编码方案及其键盘,属于汉字信息处理,主要是汉字的计算机输入形音编码方案设计,将本发明的编码方案置于电脑英文标准键盘上,它按自然界的组成规律以及人类的活动编排,构成一幅天人合一的画面,使操作者井然有序地打字,迅速地输入。
现有汉字编码技术中,区位码:是一种流水码,一组数字对应于一个汉字,虽无一重码,但无法实现联想记忆;音码:不管是全拼、简拼、双拼均存在重码率高的弊病;形码:①、王码在汉字拆分上不够规范,笔顺上也不够规范,偏旁部首的归并上无联系,不易学习;②、表形码:以中文字根形托于某个英文字符上,比较适合外国人的思维习惯,且英文字母本身编排很乱。其它一些音形码均存在上述缺点。现有的编排方法多以单个汉字编码为主,词汇量很少,无法以词组输入为主。现有编码方法,仅适用于中文汉字,不适用于汉文化圈内的大汉字字符集,如日语等。
本发明的目的是以词组输入为主,提高输入速度;合理归并偏旁部首,使其易学,易记,便于普通工人、农民、小学生使用,并可推广于海外华人和以汉字字根为语言的国家;增加码长、增加词汇量,降低重码率;使其符合汉语拼音标准,不简拼,不拆大众习惯上固定的偏旁,符合大众书写顺序。
本发明是这样实现的:在26个英文字母标准键盘上对应有:人手足口耳目文言武歹金木水火土日月儿女衣食住行鸟兽杂,①、汉字编码按外形相似、属性相同、意近、形不同意同等联想方法编排如:牛、
Figure A9610165800051
、马、羊、、龙、虎、虍、鹿、犬、犭、鼠归于一码;衣、巾、毛、皮、革、归于一码;日、甲、电、由、田、申、臼、日归于一码;米、谷、豆、瓜、归于一码。②、词组、成语、单个汉字编码规则统一。③、接汉字或词组的构成的主块顺序取码;④、多音汉字,按多音取码。⑤、多音节字的音码,取多个声母。⑥、单笔划次要信息不取码,而取主要信息。⑦、单字取四码,二字词组取六码,三字及三字以上词语取五码,以词组成语输入为主;⑧、取音码不固定为取声母或韵母,而是按拼音书写顺序,取够所需位数为止或位数不足时,将拼音取完为止。⑨、取不出特征码的归为杂码。⑩、词组的编码为形码加音码。本发明的汉字编码方法,在英文字母标准键盘上,对应设计的汉字如下:人手足口耳目文言武歹Q W E R T Y U I O P金木水火土日月儿女A S D F G H J K L衣食住行鸟兽杂Z X C V B N M键盘汉字分布歌诀为人手足、口耳目、文言武歹;金木水火土、日月儿女;衣食住行、鸟兽杂码。本发明的汉字偏旁部首归并设计方案如下:人:人,入,亻,彳,工,亚,正,五,互。此为“工”字型,歌诀:工人手:手,扌,,
Figure A9610165800061
,丰,立。歌诀:手倒立足:足,,止,爪,爫,走,辶,廴,山,石    歌诀:足爪走山石口:口耳:耳,卩,阝,
Figure A9610165800071
,巳,己,已,巴,乙目:目,自,四,皿,血,
Figure A9610165800072
,且,
Figure A9610165800073
,曲,
Figure A9610165800074
Figure A9610165800075
文:文,攵,夊,心,忄,,    歌诀:文心言:言,讠,二,卜,上,下, ,川,三,亠,歌诀:三言两语武:刀,弓,矢,力,
Figure A9610165800077
,戈,弋,戋
Figure A9610165800078
Figure A9610165800079
刂,歹:疒,尸,户,歹,夕,七,匕,九,屯,
Figure A96101658000710
歌诀:七病九尸金:金,钅,丁,寸,穴,宀,冖    歌诀:金丁是一寸宝木:木,未,末,耒,朱,本,柬,来,束,朿水:水 氵,冫,
Figure A96101658000713
火:火,灬,丷,
Figure A96101658000714
,八,小,不,丕,    歌诀:小八火土:土,士,干,午,于,千日:日,日,臼,申,由,甲,电,白,田月:月,用,王,生,壬,,
Figure A96101658000715
歌诀:月亮王儿:儿 子,孑,了,贝,页,禾    歌诀:儿子宝贝象禾苗女:女,毋,母,雨,酉,
Figure A96101658000717
,缶歌诀:母女求雨衣:衣,衤,巾,毛,皮,革,纟,幺食:豆,谷,米,瓜,食,饣,大,天,夫
Figure A96101658000718
央,夬,失。此为大字型,歌诀:大米住:广,厂,戊,成,几,门,匚,
Figure A96101658000719
冂、凵、行:车,舟,羽,又,竹 歌诀:车舟载竹又向前鸟:鸟
Figure A96101658000721
艹,甘,开,井,世    歌诀:花鸟兽:牛
Figure A96101658000722
马,羊,,龙,虎,,鹿,犬,犭,鼠,虫,鱼,ナ,乂
Figure A96101658000723
Figure A96101658000724
Figure A96101658000725
Figure A96101658000726
,豕,豸杂:黑,鬼,瓦,才,气,凸,凹,乌,丑,丐,片,久,长,书,牙,身艮,万,韦,之,骨,业,也,勹,厶,爿,,吕,
Figure A96101658000727
,彡,巛,
Figure A96101658000728
新华字典中,发明者认为不宜做为基本偏旁处理而作为可拆字的,共有以下几例:斤→
Figure A9610165800081
,丁;比→ ,匕;攴→,ヌ;见→ 儿;父→ハ,乂;欠→冖,人;风→几, ;殳→,又;斗→ ,十;矛→ (杂),
Figure A9610165800087
(杂);老→土,匕;麦→,攵;赤→土, ,ハ;卤→,
Figure A9610165800089
;里→田,土;青→,月;其→ ,八;黾→口,电;音→立,日;麻→广,木,木;鼻→自,田
Figure A96101658000812
方→
Figure A96101658000813
杂;舌→千,口;糸→幺,小;角→刀,用;辛→立,十;佳→,亻
Figure A96101658000814
;示→二,小;疋→卜,人;辰→,厂二,
Figure A96101658000815
臣→匚,杂;共30个,其明显由多个规则块组成,极易拆分,在汉字中以其为偏旁的字又很少,因此不作为基本码,如国家汉字权威部门做出了新规定,本发明可作少量修改。本发明还按下面方案设计,①单笔划不取码。②组成词组的每个字作为一个块,每个字按组成分块。③码长分为:4位码为一、二级汉字共按6763个汉字设计,其中特例为三位码;5位码为三字词组、四字成语,以及超长词语按4万词汇设计;6位码为两字词组,按20万个词汇设计,增加码长,扩展了空间。④多音字为多码。偏旁部首归并设计方案按下述思路进行。(1)外形相似的归为一类如:目、自、四、皿、血、 且、
Figure A96101658000817
、曲、。(2)属性相同的归为一类如:A、武器类,刀、弓、矢、力、刂、戈、戋
Figure A96101658000818
、弋、
Figure A96101658000819
;B、食品类,豆、谷、米、食、瓜;C、衣物类,毛、皮、革、衤、衣、巾;D、兽类,牛,马,羊,龙,虎,鹿,犬,鼠,虫,鱼,豕,豸,
Figure A96101658000820
,犭;E、杂七杂八的归一类,才、气、长、久、牙、黑、齿、彡、巛、等。(3)单笔划次要信息不取码,取主要信息。如:旦,其中“一”不取码。(4)按构成主块顺序取码。(5)词组,单个汉字编码规则统一。(6)多音字的音码按多个拼音选取。(7)码长四、五、六特别规则,以词组成语输入为主。(8)多音节的汉字,拼音也分块取码如:冖,取码为,tu、bao、gai,er(取每个音节的第一个字母)。(9)取音码不固定为取声或韵母,而是按拼音书写顺序,补充所需位数为止或位数不足时将拼音取完为止,如:虎,取码为虎,Hu(三位码)不足四码,拼音取完;羊,取码为羊Yan(g),(g不取码,因为已足4位)。(10)形码大于三码时,取码最多取三位,第四位为拼音的第一个字母如:啊,取码为口,阝,口,a。(11)大众习惯的块,作为基本码不再拆分。如:鹿、黑。(12)日语假名码如:お,码为:杂,ο;め,码为:杂a;运算(うんざ
Figure A9610165800091
ん)码为:=辶艹wz;景色(ㄧナレき)码为曰,小,刀,巴,K,S;日本(っ
Figure A9610165800092
Figure A9610165800093
ん)码为日日、本本、n、p。本发明的规则如下:①、每个单字,原则定为四位码;②、单字中只有一个形码的字,原则上第一位取形码,后面为其汉语拼音的前三位拼音字母,汉语拼音只有两位的,取两位拼音字母;③、单字中只有两个形码的字,原则上第一、二位取形码,后面的两位为其汉语拼音的前两个字母;④、单字中,只有三个形码的字,原则上第一、二、三位取形码,第四位码取其汉语拼音的第一个字母;⑤、单字中,有多于三个形码的字,原则上分块取码,取第一、二末尾块形码作为前三位形码,第四位音码取其汉字拼音的第一个字母;⑥、两字词组,第一个字取首尾两码,第二个字取首尾两码,再加上每个字的第一个汉语拼音的声母(单码字首尾码相同);⑦、三字词组,取每个字的首码,另加最后一个字的拼音的前两位;⑧、四字词组,取每个字的首码,外加最后一个字的第一个拼音字母;⑨、四字以上词组,取一、二、三、末字的首码,外加最后一个字的第一个拼音。
本发明有如下优点和积极效果:易学、易记、符合汉语拼音标准,不用简拼,基本偏旁不无理拆开,符合大众书写顺序;单笔划不取码,提高了汉字信息的重要性,分块取码,音形合一提高了汉字信息的全面性,降低了重码率;基本偏旁合理归并便于普及;词组输入、成语输入为主比单字输入提高了效率。利用甘算机归并加上发明者科学引导得出此最佳归并结果,本发明的积极效果主要表现在按形不同意同、外形相似、属性相同联系自然的组成与人类活动的科学归类方法。①如自然界的基本要素,金、木、水、火、土、日、月、山、石、田、花、鸟、虫、鱼以及动物,②认识自然的基本要素为人、手、足、口耳、目,③生活的基本要素衣、食、住、行;战斗的工具矢、弓、戈、力、刀;文化交流通过文、言记录;悲伤通过疒、尸、歹来记录。联想记忆如武不外乎是刀、弓、矢、戈、刂、弋;足则联想为走、山石、、辶、廴;衣的种类是衣、巾、毛、皮、革、。相似记忆如木类似的有木、未、末、来、朱、本;目类似的有目、四、皿、自、血、且、
Figure A9610165800101
;水形态上变为
Figure A9610165800102
、氵、冫;人形态上变为人、入、亻、彳。由于采用了上述方法,方便记忆,便于操作,普通工人、农民以及小学生都可以使用,做到一看就懂,一学就会,熟练后可实现盲打,真正使电脑成为中国普通人的操作工具。重码率低,据统计:在3755个汉字中,重50对。在6763个汉字中重250对,根据概率密度进行推理预测,增加词组后,词组的重码率应低于基本汉字的重码率。
下面结合图1详细说明本发明的操作次序,例如:
口:(口很重要)     取码为:口,补拼音Kou
句:(勹为杂码)     取码为:杂,口、补拼音Ju
苟:(共三码)取码为:艹,杂,口、补拼音G(ou)中的第一位G
敬:(口不取码)    取码为:艹,杂,文,补拼音J(ing)中的第一位J
警:(分块取码)    取码为:艹,文,言,补拼音J(ing)中的第一位J
欣欣向荣:成语共四个字,每个块取首位偏旁,
Figure A9610165800111
、冂、艹,外加一个音码,取后一字荣R(ong)中的R
美人计:各取首位码,丷、人、讠,然后补加“讨”的拼音Ji两位组成五位。
材料:材首码为木,末码为才,料首码为米,末码为十,音码分别为c(ai)、L(iao),取C、L取码为:木、杂、米、十、C、L
警察:(警:首码为艹,末码为言)
      (察:首码为宀,尾码为小)
      (音码为J(ing),C(ha)) 取码为:艹、言、宀、小、J、C
山水:(每个字只有一个形码,首尾码相同,音码为S(han),S(hui))
    取码为:山、山、水、水、S、S
辩:共三块
    第一块为复合块“辛”取首码立
    第二块为言,取言字
    第三块为复合块“辛”取末码十
    取码为:立、言、十、b
幻:(
Figure A9610165800112
不取码) 码为幺、Hua(n)
行:(两个音)码为:亻,杂,Xi(ng)或亻,杂ha(ng)
本发明由以下实施例参照附图给出
长鼻子,长个大黑痣,既气派,又别具一格。1、先按单个汉字输入,结果如下:注:长为双音字,有双码,Mcha YHIb Kzi Mzha Qge Xda Mhei PGUz长    鼻  子   长  个  大  黑    痣MMKj Mqi DCDp Vyou ROOb YFju Myi SURg既    气  派   又  别   具    一   格
2、按词组输入,结果如下:
注:长鼻子按三字词组,黑痣、气派为两字词组,别具一格为四字成语。MYKzi  Mzha   Qge   Xda  MMPUhz长鼻子  长    个    大    黑痣MMKJ   MMDDqp Vyou    RYMSg既     气派    又    别具一格

Claims (4)

1、本发明涉及一种汉字编码方案,其特征在于:在26个英文字母标准键盘上对应有:人手足口耳目文言武歹金木水火土日月儿女衣食住行鸟兽杂;①、汉字编码按外形相似、属性相同、意近、形不同意同等联想方法编排;②、词组、成语、单个汉字编码规则统一;③、按汉字或词组构成的主块顺序取码;④、多音汉字,拼音也按多音取码;⑤、多音节字的音码,取多个声母;⑥、单笔划次要信息不取码,而取主要信息;⑦、单字取四码,二字词组取六码,三字及三字以上词语取五码,以词组成语输入为主;⑧、取音码不固定为取声母或韵母,而是按拼音书写顺序,取至所需位数为止或位数不足时,将拼音取完为止;⑨、取不出特征码的归为杂码;⑩、词组的编码为形码加音码。
2、根据权利要求1所述的汉字编码方案,其特征在于:汉字偏旁部首归并方案如下:
人:人,入,亻,彳,工,亚,正,五,互手:手,扌,
Figure A9610165800021
,丰,立足:足,,止,爪,爫,走,辶,廴,山,石口:口耳:耳,卩,阝,
Figure A9610165800022
,巳,己,已,巴,乙目:目,自,四,皿,血,
Figure A9610165800023
,且, 曲, 文:文,攵,夊,心,忄,,言:言,讠,二,卜,上,下,
Figure A9610165800026
,川,三,亠武:刀,弓,矢,力, ,戈,弋,戋
Figure A9610165800032
Figure A9610165800033
,刂,歹:疒,尸,户,歹,夕,七,匕,九,屯金:金,钅,丁,寸,穴,宀,冖木:木,未,末,本,朱,耒,本,柬,来,束,朿水:水,
Figure A9610165800034
,氵,冫,
Figure A9610165800035
火:火,灬,丷,八,小,不,丕,
Figure A9610165800037
土:土,士,干,午,于,千日:日,曰,臼,申,由,甲,电,白,田月:月,用,王,生,壬,,
Figure A9610165800038
儿:儿
Figure A9610165800039
,子,孑,了,贝,页,禾女:女,毋,母,雨,酉,缶,西衣:衣,衤,巾,毛,皮,革,幺,纟食:豆,谷,米,饣,瓜,食,大,天,夫,央,失,夬, 住:广,厂,戊,成,几,门,匚, 冂,凵,行:车,舟,羽,又,竹
Figure A96101658000312
鸟:鸟, 艹,甘,开,井,世兽:牛 马,羊,,龙,虎,,鹿,犬,犭,鼠,虫,鱼, 豕,豸杂:黑,鬼,瓦,才,气,凸,凹,乌,丑,丐,片,久,长,书,牙,身,艮,万,韦,之,骨,业,也,勹,厶,爿,, ,彡,巛,
Figure A96101658000319
3、根据权利要求1所述的汉字编码方案,其特征在于:①、单笔划不取码;②、组成词组的每个字作为一个块,每个字按组成分块;③、码长分为:4位码为一、二级汉字,按6763个汉字设计,5位码为三字词组、四字成语,以及超长词语按4万词汇设计,6位码为两字词组,按20万个词汇设计,增加码长,扩展了空间;④、多音字按字读音取码,形成多音字为多码,⑤、词组及成语编码也是由形码加音码组成。
4、一种按照权利要求1所述的汉字编码方案的键盘,其特征在于:英文字母标准键盘上对应汉字如下:人手足口耳目文言武歹Q W E R T Y U I O P金木水火土日月儿女A S D F G H J K L衣食住行鸟兽杂Z X C V B N M
CN 96101658 1996-02-29 1996-02-29 一种汉字编码方案及其键盘 Pending CN1134563A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN 96101658 CN1134563A (zh) 1996-02-29 1996-02-29 一种汉字编码方案及其键盘

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN 96101658 CN1134563A (zh) 1996-02-29 1996-02-29 一种汉字编码方案及其键盘

Publications (1)

Publication Number Publication Date
CN1134563A true CN1134563A (zh) 1996-10-30

Family

ID=5117176

Family Applications (1)

Application Number Title Priority Date Filing Date
CN 96101658 Pending CN1134563A (zh) 1996-02-29 1996-02-29 一种汉字编码方案及其键盘

Country Status (1)

Country Link
CN (1) CN1134563A (zh)

Similar Documents

Publication Publication Date Title
Sproat Language, technology, and society
CN105938402B (zh) 一种声形码汉字输入法及键盘
d'Huy Polyphemus: a Palaeolithic Tale?
CN1523518A (zh) 智能汉语文化辞典系统
CN101872249A (zh) 双拼双形输入法
CN101382845B (zh) 一种汉字表义码输入方法
CN1134563A (zh) 一种汉字编码方案及其键盘
CN1420425A (zh) 音形拼音汉字输入法
CN1330305A (zh) 改进的hlv汉字拼音输入方法
Boutw A grammar of Nchane
CN1687876B (zh) 一种计算机汉字输入法及其键盘
CN100365554C (zh) 数字式三击形音汉字输入法
CN101872250A (zh) 部首输入法
CN1101569C (zh) 音形码汉字输入方法
CN1067777C (zh) 意形码汉字输入法
CN103135788B (zh) 一种汉字四象意形输入法
CN1036620C (zh) 一种综合码计算机汉字输入方法
CN111459296B (zh) 形拼意汉字输入方法及电子设备
CN102750001B (zh) 汉字输入法
CN1051621C (zh) 拼音文字型汉字编码输入法及键盘
CN1054693C (zh) 一种动态部件二三拆分的计算机汉字输入方法
CN1089176C (zh) 汉字正负数码输入法
CN101364146A (zh) 汉语三字母拼音
CN1154508A (zh) 汉字三维三码字词兼容输入法
CN1139867C (zh) 新音形简易速录码汉字输入法

Legal Events

Date Code Title Description
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C06 Publication
PB01 Publication
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication