CN1134563A - 一种汉字编码方案及其键盘 - Google Patents
一种汉字编码方案及其键盘 Download PDFInfo
- Publication number
- CN1134563A CN1134563A CN 96101658 CN96101658A CN1134563A CN 1134563 A CN1134563 A CN 1134563A CN 96101658 CN96101658 CN 96101658 CN 96101658 A CN96101658 A CN 96101658A CN 1134563 A CN1134563 A CN 1134563A
- Authority
- CN
- China
- Prior art keywords
- chinese
- code
- word
- sign indicating
- indicating number
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Machine Translation (AREA)
Abstract
一种汉字编码方案及其键盘,是用计算机键盘输入汉字的形音编码方案。在26个英文字母标准键盘上对应有:人手足口耳目文言武歹金木水火土日月儿女衣食住行鸟兽杂。编码按外形相似、属性相同、意思相近等进行分类。如:牛、马、羊、龙、虎、鹿、犬、鼠归为兽;衣、巾、毛、皮、革、归为衣。单字为四码,成语、词组为五、六码。可将单字、词组、成语联合输入,是重码最少的编码方案之一,且有易学、易记、易操作以及输入快等特点。
Description
本发明涉及一种汉字编码方案及其键盘,属于汉字信息处理,主要是汉字的计算机输入形音编码方案设计,将本发明的编码方案置于电脑英文标准键盘上,它按自然界的组成规律以及人类的活动编排,构成一幅天人合一的画面,使操作者井然有序地打字,迅速地输入。
现有汉字编码技术中,区位码:是一种流水码,一组数字对应于一个汉字,虽无一重码,但无法实现联想记忆;音码:不管是全拼、简拼、双拼均存在重码率高的弊病;形码:①、王码在汉字拆分上不够规范,笔顺上也不够规范,偏旁部首的归并上无联系,不易学习;②、表形码:以中文字根形托于某个英文字符上,比较适合外国人的思维习惯,且英文字母本身编排很乱。其它一些音形码均存在上述缺点。现有的编排方法多以单个汉字编码为主,词汇量很少,无法以词组输入为主。现有编码方法,仅适用于中文汉字,不适用于汉文化圈内的大汉字字符集,如日语等。
本发明的目的是以词组输入为主,提高输入速度;合理归并偏旁部首,使其易学,易记,便于普通工人、农民、小学生使用,并可推广于海外华人和以汉字字根为语言的国家;增加码长、增加词汇量,降低重码率;使其符合汉语拼音标准,不简拼,不拆大众习惯上固定的偏旁,符合大众书写顺序。
本发明是这样实现的:在26个英文字母标准键盘上对应有:人手足口耳目文言武歹金木水火土日月儿女衣食住行鸟兽杂,①、汉字编码按外形相似、属性相同、意近、形不同意同等联想方法编排如:牛、
、马、羊、、龙、虎、虍、鹿、犬、犭、鼠归于一码;衣、巾、毛、皮、革、归于一码;日、甲、电、由、田、申、臼、日归于一码;米、谷、豆、瓜、归于一码。②、词组、成语、单个汉字编码规则统一。③、接汉字或词组的构成的主块顺序取码;④、多音汉字,按多音取码。⑤、多音节字的音码,取多个声母。⑥、单笔划次要信息不取码,而取主要信息。⑦、单字取四码,二字词组取六码,三字及三字以上词语取五码,以词组成语输入为主;⑧、取音码不固定为取声母或韵母,而是按拼音书写顺序,取够所需位数为止或位数不足时,将拼音取完为止。⑨、取不出特征码的归为杂码。⑩、词组的编码为形码加音码。本发明的汉字编码方法,在英文字母标准键盘上,对应设计的汉字如下:人手足口耳目文言武歹Q W E R T Y U I O P金木水火土日月儿女A S D F G H J K L衣食住行鸟兽杂Z X C V B N M键盘汉字分布歌诀为人手足、口耳目、文言武歹;金木水火土、日月儿女;衣食住行、鸟兽杂码。本发明的汉字偏旁部首归并设计方案如下:人:人,入,亻,彳,工,亚,正,五,互。此为“工”字型,歌诀:工人手:手,扌,,
,丰,立。歌诀:手倒立足:足,,止,爪,爫,走,辶,廴,山,石 歌诀:足爪走山石口:口耳:耳,卩,阝,
,巳,己,已,巴,乙目:目,自,四,皿,血,
,且,
,曲,
文:文,攵,夊,心,忄,, 歌诀:文心言:言,讠,二,卜,上,下,
,川,三,亠,歌诀:三言两语武:刀,弓,矢,力,
,戈,弋,戋
刂,歹:疒,尸,户,歹,夕,七,匕,九,屯,
歌诀:七病九尸金:金,钅,丁,寸,穴,宀,冖 歌诀:金丁是一寸宝木:木,未,末,耒,朱,本,柬,来,束,朿水:水
氵,冫,
火:火,灬,丷,
,八,小,不,丕, 歌诀:小八火土:土,士,干,午,于,千日:日,日,臼,申,由,甲,电,白,田月:月,用,王,生,壬,,
歌诀:月亮王儿:儿
子,孑,了,贝,页,禾 歌诀:儿子宝贝象禾苗女:女,毋,母,雨,酉,
,缶歌诀:母女求雨衣:衣,衤,巾,毛,皮,革,纟,幺食:豆,谷,米,瓜,食,饣,大,天,夫
央,夬,失。此为大字型,歌诀:大米住:广,厂,戊,成,几,门,匚,
冂、凵、行:车,舟,羽,又,竹
歌诀:车舟载竹又向前鸟:鸟
艹,甘,开,井,世 歌诀:花鸟兽:牛
马,羊,,龙,虎,,鹿,犬,犭,鼠,虫,鱼,ナ,乂
,豕,豸杂:黑,鬼,瓦,才,气,凸,凹,乌,丑,丐,片,久,长,书,牙,身艮,万,韦,之,骨,业,也,勹,厶,爿,,吕,
,彡,巛,
新华字典中,发明者认为不宜做为基本偏旁处理而作为可拆字的,共有以下几例:斤→
,丁;比→
,匕;攴→,ヌ;见→
儿;父→ハ,乂;欠→冖,人;风→几,
;殳→,又;斗→
,十;矛→
(杂),
(杂);老→土,匕;麦→,攵;赤→土,
,ハ;卤→, ;里→田,土;青→,月;其→
,八;黾→口,电;音→立,日;麻→广,木,木;鼻→自,田
方→
杂;舌→千,口;糸→幺,小;角→刀,用;辛→立,十;佳→,亻
;示→二,小;疋→卜,人;辰→,厂二,
臣→匚,杂;共30个,其明显由多个规则块组成,极易拆分,在汉字中以其为偏旁的字又很少,因此不作为基本码,如国家汉字权威部门做出了新规定,本发明可作少量修改。本发明还按下面方案设计,①单笔划不取码。②组成词组的每个字作为一个块,每个字按组成分块。③码长分为:4位码为一、二级汉字共按6763个汉字设计,其中特例为三位码;5位码为三字词组、四字成语,以及超长词语按4万词汇设计;6位码为两字词组,按20万个词汇设计,增加码长,扩展了空间。④多音字为多码。偏旁部首归并设计方案按下述思路进行。(1)外形相似的归为一类如:目、自、四、皿、血、
且、
、曲、。(2)属性相同的归为一类如:A、武器类,刀、弓、矢、力、刂、戈、戋
、弋、
;B、食品类,豆、谷、米、食、瓜;C、衣物类,毛、皮、革、衤、衣、巾;D、兽类,牛,马,羊,龙,虎,鹿,犬,鼠,虫,鱼,豕,豸,
,犭;E、杂七杂八的归一类,才、气、长、久、牙、黑、齿、彡、巛、等。(3)单笔划次要信息不取码,取主要信息。如:旦,其中“一”不取码。(4)按构成主块顺序取码。(5)词组,单个汉字编码规则统一。(6)多音字的音码按多个拼音选取。(7)码长四、五、六特别规则,以词组成语输入为主。(8)多音节的汉字,拼音也分块取码如:冖,取码为,tu、bao、gai,er(取每个音节的第一个字母)。(9)取音码不固定为取声或韵母,而是按拼音书写顺序,补充所需位数为止或位数不足时将拼音取完为止,如:虎,取码为虎,Hu(三位码)不足四码,拼音取完;羊,取码为羊Yan(g),(g不取码,因为已足4位)。(10)形码大于三码时,取码最多取三位,第四位为拼音的第一个字母如:啊,取码为口,阝,口,a。(11)大众习惯的块,作为基本码不再拆分。如:鹿、黑。(12)日语假名码如:お,码为:杂,ο;め,码为:杂a;运算(うんざ
ん)码为:=辶艹wz;景色(ㄧナレき)码为曰,小,刀,巴,K,S;日本(っ
ん)码为日日、本本、n、p。本发明的规则如下:①、每个单字,原则定为四位码;②、单字中只有一个形码的字,原则上第一位取形码,后面为其汉语拼音的前三位拼音字母,汉语拼音只有两位的,取两位拼音字母;③、单字中只有两个形码的字,原则上第一、二位取形码,后面的两位为其汉语拼音的前两个字母;④、单字中,只有三个形码的字,原则上第一、二、三位取形码,第四位码取其汉语拼音的第一个字母;⑤、单字中,有多于三个形码的字,原则上分块取码,取第一、二末尾块形码作为前三位形码,第四位音码取其汉字拼音的第一个字母;⑥、两字词组,第一个字取首尾两码,第二个字取首尾两码,再加上每个字的第一个汉语拼音的声母(单码字首尾码相同);⑦、三字词组,取每个字的首码,另加最后一个字的拼音的前两位;⑧、四字词组,取每个字的首码,外加最后一个字的第一个拼音字母;⑨、四字以上词组,取一、二、三、末字的首码,外加最后一个字的第一个拼音。
本发明有如下优点和积极效果:易学、易记、符合汉语拼音标准,不用简拼,基本偏旁不无理拆开,符合大众书写顺序;单笔划不取码,提高了汉字信息的重要性,分块取码,音形合一提高了汉字信息的全面性,降低了重码率;基本偏旁合理归并便于普及;词组输入、成语输入为主比单字输入提高了效率。利用甘算机归并加上发明者科学引导得出此最佳归并结果,本发明的积极效果主要表现在按形不同意同、外形相似、属性相同联系自然的组成与人类活动的科学归类方法。①如自然界的基本要素,金、木、水、火、土、日、月、山、石、田、花、鸟、虫、鱼以及动物,②认识自然的基本要素为人、手、足、口耳、目,③生活的基本要素衣、食、住、行;战斗的工具矢、弓、戈、力、刀;文化交流通过文、言记录;悲伤通过疒、尸、歹来记录。联想记忆如武不外乎是刀、弓、矢、戈、刂、弋;足则联想为走、山石、、辶、廴;衣的种类是衣、巾、毛、皮、革、。相似记忆如木类似的有木、未、末、来、朱、本;目类似的有目、四、皿、自、血、且、
;水形态上变为
、氵、冫;人形态上变为人、入、亻、彳。由于采用了上述方法,方便记忆,便于操作,普通工人、农民以及小学生都可以使用,做到一看就懂,一学就会,熟练后可实现盲打,真正使电脑成为中国普通人的操作工具。重码率低,据统计:在3755个汉字中,重50对。在6763个汉字中重250对,根据概率密度进行推理预测,增加词组后,词组的重码率应低于基本汉字的重码率。
下面结合图1详细说明本发明的操作次序,例如:
口:(口很重要) 取码为:口,补拼音Kou
句:(勹为杂码) 取码为:杂,口、补拼音Ju
苟:(共三码)取码为:艹,杂,口、补拼音G(ou)中的第一位G
敬:(口不取码) 取码为:艹,杂,文,补拼音J(ing)中的第一位J
警:(分块取码) 取码为:艹,文,言,补拼音J(ing)中的第一位J
美人计:各取首位码,丷、人、讠,然后补加“讨”的拼音Ji两位组成五位。
材料:材首码为木,末码为才,料首码为米,末码为十,音码分别为c(ai)、L(iao),取C、L取码为:木、杂、米、十、C、L
警察:(警:首码为艹,末码为言)
(察:首码为宀,尾码为小)
(音码为J(ing),C(ha)) 取码为:艹、言、宀、小、J、C
山水:(每个字只有一个形码,首尾码相同,音码为S(han),S(hui))
取码为:山、山、水、水、S、S
辩:共三块
第一块为复合块“辛”取首码立
第二块为言,取言字
第三块为复合块“辛”取末码十
取码为:立、言、十、b
行:(两个音)码为:亻,杂,Xi(ng)或亻,杂ha(ng)
本发明由以下实施例参照附图给出
长鼻子,长个大黑痣,既气派,又别具一格。1、先按单个汉字输入,结果如下:注:长为双音字,有双码,Mcha YHIb Kzi Mzha Qge Xda Mhei PGUz长 鼻 子 长 个 大 黑 痣MMKj Mqi DCDp Vyou ROOb YFju Myi SURg既 气 派 又 别 具 一 格
2、按词组输入,结果如下:
注:长鼻子按三字词组,黑痣、气派为两字词组,别具一格为四字成语。MYKzi Mzha Qge Xda MMPUhz长鼻子 长 个 大 黑痣MMKJ MMDDqp Vyou RYMSg既 气派 又 别具一格
Claims (4)
1、本发明涉及一种汉字编码方案,其特征在于:在26个英文字母标准键盘上对应有:人手足口耳目文言武歹金木水火土日月儿女衣食住行鸟兽杂;①、汉字编码按外形相似、属性相同、意近、形不同意同等联想方法编排;②、词组、成语、单个汉字编码规则统一;③、按汉字或词组构成的主块顺序取码;④、多音汉字,拼音也按多音取码;⑤、多音节字的音码,取多个声母;⑥、单笔划次要信息不取码,而取主要信息;⑦、单字取四码,二字词组取六码,三字及三字以上词语取五码,以词组成语输入为主;⑧、取音码不固定为取声母或韵母,而是按拼音书写顺序,取至所需位数为止或位数不足时,将拼音取完为止;⑨、取不出特征码的归为杂码;⑩、词组的编码为形码加音码。
2、根据权利要求1所述的汉字编码方案,其特征在于:汉字偏旁部首归并方案如下:
人:人,入,亻,彳,工,亚,正,五,互手:手,扌,
,丰,立足:足,,止,爪,爫,走,辶,廴,山,石口:口耳:耳,卩,阝,
,巳,己,已,巴,乙目:目,自,四,皿,血,
,且,
曲,
文:文,攵,夊,心,忄,,言:言,讠,二,卜,上,下,
,川,三,亠武:刀,弓,矢,力,
,戈,弋,戋
,
,刂,歹:疒,尸,户,歹,夕,七,匕,九,屯金:金,钅,丁,寸,穴,宀,冖木:木,未,末,本,朱,耒,本,柬,来,束,朿水:水,
,氵,冫,
火:火,灬,丷,八,小,不,丕,
土:土,士,干,午,于,千日:日,曰,臼,申,由,甲,电,白,田月:月,用,王,生,壬,,
儿:儿
,子,孑,了,贝,页,禾女:女,毋,母,雨,酉,缶,西衣:衣,衤,巾,毛,皮,革,幺,纟食:豆,谷,米,饣,瓜,食,大,天,夫,央,失,夬,
住:广,厂,戊,成,几,门,匚,
冂,凵,行:车,舟,羽,又,竹
鸟:鸟,
艹,甘,开,井,世兽:牛
马,羊,,龙,虎,,鹿,犬,犭,鼠,虫,鱼,
豕,豸杂:黑,鬼,瓦,才,气,凸,凹,乌,丑,丐,片,久,长,书,牙,身,艮,万,韦,之,骨,业,也,勹,厶,爿,,
,彡,巛,
3、根据权利要求1所述的汉字编码方案,其特征在于:①、单笔划不取码;②、组成词组的每个字作为一个块,每个字按组成分块;③、码长分为:4位码为一、二级汉字,按6763个汉字设计,5位码为三字词组、四字成语,以及超长词语按4万词汇设计,6位码为两字词组,按20万个词汇设计,增加码长,扩展了空间;④、多音字按字读音取码,形成多音字为多码,⑤、词组及成语编码也是由形码加音码组成。
4、一种按照权利要求1所述的汉字编码方案的键盘,其特征在于:英文字母标准键盘上对应汉字如下:人手足口耳目文言武歹Q W E R T Y U I O P金木水火土日月儿女A S D F G H J K L衣食住行鸟兽杂Z X C V B N M
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 96101658 CN1134563A (zh) | 1996-02-29 | 1996-02-29 | 一种汉字编码方案及其键盘 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 96101658 CN1134563A (zh) | 1996-02-29 | 1996-02-29 | 一种汉字编码方案及其键盘 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN1134563A true CN1134563A (zh) | 1996-10-30 |
Family
ID=5117176
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN 96101658 Pending CN1134563A (zh) | 1996-02-29 | 1996-02-29 | 一种汉字编码方案及其键盘 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN1134563A (zh) |
-
1996
- 1996-02-29 CN CN 96101658 patent/CN1134563A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Sproat | Language, technology, and society | |
CN105938402B (zh) | 一种声形码汉字输入法及键盘 | |
d'Huy | Polyphemus: a Palaeolithic Tale? | |
CN1523518A (zh) | 智能汉语文化辞典系统 | |
CN101872249A (zh) | 双拼双形输入法 | |
CN101382845B (zh) | 一种汉字表义码输入方法 | |
CN1134563A (zh) | 一种汉字编码方案及其键盘 | |
CN1420425A (zh) | 音形拼音汉字输入法 | |
CN1330305A (zh) | 改进的hlv汉字拼音输入方法 | |
Boutw | A grammar of Nchane | |
CN1687876B (zh) | 一种计算机汉字输入法及其键盘 | |
CN100365554C (zh) | 数字式三击形音汉字输入法 | |
CN101872250A (zh) | 部首输入法 | |
CN1101569C (zh) | 音形码汉字输入方法 | |
CN1067777C (zh) | 意形码汉字输入法 | |
CN103135788B (zh) | 一种汉字四象意形输入法 | |
CN1036620C (zh) | 一种综合码计算机汉字输入方法 | |
CN111459296B (zh) | 形拼意汉字输入方法及电子设备 | |
CN102750001B (zh) | 汉字输入法 | |
CN1051621C (zh) | 拼音文字型汉字编码输入法及键盘 | |
CN1054693C (zh) | 一种动态部件二三拆分的计算机汉字输入方法 | |
CN1089176C (zh) | 汉字正负数码输入法 | |
CN101364146A (zh) | 汉语三字母拼音 | |
CN1154508A (zh) | 汉字三维三码字词兼容输入法 | |
CN1139867C (zh) | 新音形简易速录码汉字输入法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C06 | Publication | ||
PB01 | Publication | ||
C02 | Deemed withdrawal of patent application after publication (patent law 2001) | ||
WD01 | Invention patent application deemed withdrawn after publication |