汉字结构对称输入法
形形色色、种类繁多的计算机汉字输入法大体上可以分为自然输入法和键盘输入法两类,目前,较为流行和被人们所接受的是键盘输入法。键盘输入法又可细分成四小类:1.流水码输入法;2.音码输入法;3.形码输入法;4.音形码输入法。这四种键盘输入法中,尤其以形码和音形码输入法受到人们的青睐。然而,目前人们习惯上使用的无论是形码还是音形码输入法都存在着以下一些不尽人意的弊端,那就是需要操作者大量地记忆数十个或上百个字根、部首,从而令众多的操作者望而却步:
1.形码或音形码输入法操作者在进行汉字输入前,必须先背熟分配在键盘上数十个或上百个字根、部首,否则操作者就无法进行操作。背熟这些字根或部首在键盘上的位置谈何容易,尤其是对广大的中老年人和不常使用汉字输入功能的操作者来说,更不是件易事。
2.即使形码或音形码输入法操作者已经背熟了键盘上的字根或部首的位置,一旦放下一段时间不用,就会逐渐忘记键盘上字根或部首的位置,下次如果再使用此法进行汉字输入,仍需要再重新背一遍键盘上所有的字根或部首的位置。
3.背熟了键盘上字根或部首的位置,下一步就要依据所提供的方法对各个汉字进行"拆字"。这又是一道关口,如果拆不好字,你所需要的汉字仍然输入不进去。
音码输入法是利用汉语拼音对汉字进行输入的一种方法,该输入法的不足之处是不认识的汉字输入不进去,一旦输入进去,其重码率极高,操作者常常为了找一个字需要连续翻几页,在每一页中又是从1-0的十个字中进行寻找。为此该输入法是汉字输入法中速度较慢的一种汉字输入法。
多年来,我们通过对7000多个汉字反复地研究和探索,发现以方框型结构为主体的汉字,绝大多数都存在着一个共同的规律和特点-汉字或汉字部件形状结构的对称性。
鉴于上述,本发明的目的就是根据汉字形状结构的对称性,提出一种记忆量小、简单易学的汉字结构对称输入法。
本发明的目的通过以下技术方案实现:
一种使用计算机和键盘进行的汉字结构对称输入法,其步骤是:
根据汉字结构对称性特征,将其分类,每类汉字用键盘上一个表示其类别的字符编码,对汉字的每种笔画用键盘上的字符编码;
每个汉字按其笔顺,用类别编码+前两笔画编码+最后两笔画编码输入。
在本发明的实施措施中:
将汉字分成中心型结构中心对称类、左右型结构左右部件自身对称类、左右型结构左部件自身对称类、左右型结构右部件自身对称类、左右型结构左右部件非自身对称类、上下型结构上部件自身对称类、上下型结构下部件自身对称类、上下型结构上下部件自身非对称类、杂合型结构包围类、杂合型结构独体字类共10类;
对汉字的横、竖、撇、点、折5种笔画,每种笔画用键盘上三个字符编码,分别表示该种笔画在组成部件时与其它笔画之间存在的交叉、相切或模糊、相离关系;
每个汉字按其笔顺,用其类别编码+前两笔画编码+最后两笔画编码共5码输入;对于三部件及三部件以上的多部件汉字,先按前述输入方法输入5码,再输入其中间部件的前两笔画编码。
输入双字词组和三字词组时,依序输入各字的类别编码+前两笔画的编码;输入四字及四字以上多字词组时,先输入前两字中各字的类别编码+前两笔画的编码,再输入多字词组标识编码,最后输入末字的前两笔画的编码。
本发明输入法的优点是:
1.不需要记忆汉字大量的偏旁、部首和字根;
2.不需要记忆汉字的各种拼音;
3.不认识的汉字只要会写,就可以输入;
4.只需要理解本输入法的一些规则和要求;
5.必须要严格遵照“国家语言文字工作委员会”和“新闻出版署”联合发布的《现代汉语通用字笔顺规范》进行汉字笔顺的输入。因此,本汉字输入法又可以纠正人们平时由于不规范书写的“倒插笔”不良习惯。尤其可以使我国数以千万计的学生们以及从事中文文字工作者们在理解、认识、学习汉字诸多方面受益匪浅;
6.本输入法对汉字的对称分类,符合人们平时对汉字的认识习惯和理解习惯,所以操作者只要稍微理解和记忆一些本输入法的规则和要求,就可以很快地、轻松自如地掌握和运用本汉字输入法;
7.本输入法不但简单易学,而且具有重码率极低等特点。
本发明是一种使用计算机和普通键盘进行的汉字结构对称输入法,下面对本发明作详细说明。
一.汉字结构的分析
总体来讲汉字是方框型结构,而各种方框型结构的大部分汉字或汉字部件是以其形状对称形式出现的,只有少量的汉字或汉字部件属于非形状对称形式。根据汉字的方框型结构和汉字或汉字部件形状的对称性特点,我们将汉字大略划分成中心型、左右型、上下型、杂合型几种结构。其中:
中心型结构(或称C-B型结构):此类汉字由独体型汉字或偏旁、部首与各种部件组成。
左右型结构(或称L-R型结构,左中右型结构属左右型结构):此类汉字由偏旁、部首和部件左右两部分或左中右三部分组成。
上下型结构(或称U-D型结构,上中下型结构属上下型结构):此类汉字由偏旁、部首和部件上下两部分或上中下三部分组成。
杂合型结构(或称M型结构):此类汉字结构由四面包围型、三面包围型、两面包围型偏旁、部首与各种部件组成,还包括各种独体型字及其它不符合上述几种形式的特殊汉字结构。
二.汉字结构对称输入法中的汉字分类
根据上述汉字的结构形式以及汉字或部件形状的对称性特点,本发明将汉字划分成如下10类:
1.中心型结构,且中心对称类(或称C-B类):该类汉字结构特点是以假设汉字中心线为竖轴,左右部分、上下部分互为对称或相同。以下划分的各类汉字,无论是左右型、上下型、杂合型等,如果其汉字特点首先符合中心对称类,一律归为中心对称类。如:古、且、合、啬、革、谷、共、果、暴、旱、金、晋、介、其、甲、苯、韭、蒿、罕、晃、吉、普、荠、击、中、只、申、赍、黑、豆、苗、固、木、害、盥、昊、旱、喜、音、典、章、暮、春、雷、山、羽、凹、丝、弱、崇、祟、意、采、霁、乔、鬲、千、丁、丰、宁、干、冈、手、拿、磊、垒、焱、淼、品、晶、鑫、毳等。
2.左右型结构,且左右部件自身对称类(或称LRSB类):该类汉字的结构以L-R型为基础,左右两部件各自以各部件假设中心线为竖轴互为对称。如:酣、峤、酊、鼓、辞、醋、胡、林、幅、豁、粕、醉等。
3.左右型结构,且左部件自身对称类(或称LSB类):该类汉字的结构以L-R型为基础,左部件以其部件假设中心线为竖轴互为对称。如:财、畸、酵、封、戟、靳、鸭、融、就、羚等。
4.左右型结构,且右部件自身对称类(或称RSB类):该类汉字的结构以L-R型为基础,右部件以其部件假设中心线为竖轴互为对称。如:陪、群、蝻、蚌、鲑、貘、僚、殚、鲴、鲒、趴、牡、陌等。
5.左右型结构,且左右部件非自身对称类(或称LRNB类):该类汉字的结构以L-R型为基础,左右部件以其各自部件假设中心线为竖轴互为不对称。如:跪、刿、件、催、饯、练、鹛、距、鸥、郄、郡、驹、轮、转、倦、郭、馆、幻、化、跌、碟等。
6.上下型结构,且上部件自身对称类(或称USB类):该类汉字的结构以U-D型为基础,上部件以其部件假设中心线为竖轴互为对称或相同。如:爸、毫、表、奇、龛、亨、夯、斧、綦、楚、羡、慕、蛮、岑、巷、恭、季、夺、裳、辇、琶、牵、瞿、紊、砉、罗、哀、恭、蚩、豪、辈、衷、衰等。
7.上下型结构,且下部件自身对称类(或称DSB类):该类汉字的结构以U-D型为基础,下部件以其部件假设中心线为竖轴互为对称或相同。如:货、架、酱、灸、胥、昼、龚、警、齿、岔、桀、黛、督、泵、壁、费、鉴、譬、盏、监、贸、盗、暨、贷、祭等。
8.上下型结构,且上下部件非自身对称类(或称UDNB类):该类汉字的结构以U-D型为基础,上下部件以其部件假设中心线为竖轴互为不对称或不相同。如:璧、碧、骜、聱、螯、瓷、袅、驾、袈、鹫、鬏、蹩、鳖、鸷、髦、跫、蛩等。
9.杂合型结构,二、三、四面包围类(或称M-E类):
四面包围类汉字均以大口为偏旁,口内为各汉字部件,且各部件以假设中心线为竖轴互不对称或不相同,如:国、团、围、圈、囝、囫、囵、囿、囹、圄、圃等。
三面包围类汉字均以冂、凵、匚、等为偏旁,偏旁内为各汉字部件,且各汉字以假设中心线为竖轴互不对称,如:闯、阔、阀、阚、夙、甩、罔、函、区、匹、巨、叵、匝、匡、匠、匣、医、匦、匿、匪、匮、匾等。
两面包围类汉字均以厂、广、疒、户、尸、辶、戈、弋、尺、毛、气等为偏旁,偏旁与各种部件组合成各个汉字,且各汉字以假设中心线为竖轴互不对称。如:历、厅、仄、厄、厕、原、压、厨、厦、厚、雁、庄、庆、床、庐、店、府、库、应、疗、病、痘、瘢、疚、痰、痢、疾、痛、癌、尼、层、局、尿、居、届、屏、属、孱、户、启、肩、房、扇、扉、雇、氖、氧、气、氡、氢、氮、氟、氦、戎、武、或、我、战、戢、载、划、戛、建、延、廷、边、远、道、过、递、送、还、迁、迄、毯、毡、毪、毽等。
10.杂合型结构,独体字类(或称M-S类):该类汉字以单一部件为一个汉字,或由单一部件与部件相交或相接组合成汉字。如:乙、夷、之、为、久、巳、已、孑、孓、丐、互、丑、勿、毋、万、世、囱等。
三.两个笔画之间的关系
组成汉字的基本笔画分为横、竖、撇、点、折5种,书写汉字部件时,一个笔画与其它笔画之间的关系可分成交叉、相离、相切或模糊关系。如:部件“爻”的前两笔画为交叉关系,“彡”的各笔画之间为相离关系,“厂”的笔画之间为相切关系。
四.定义编码
本发明将以上每类汉字分别用键盘上一个表示其类别的字符编码。对汉字的横、竖、撇、点、折5种笔画,每种笔画用键盘上三个字符编码,分别表示组部件时,该笔画与其它笔画之间存在的交叉、相切或模糊、相离关系,如笔画在组部件时与其它笔画既有相切又有相交关系,则以相交为先。
编码如下所示:字母W、Q、I、O、A、S、K、L、Z、X分别为汉字的各对称类别编码。字母P为多字词组标识编码。横、竖、撇、点、折5种笔画,在组成汉字部件时,与其它笔画之间存在着交叉关系的,分别用键盘上的第一行字母E、R、T、Y、U编码;存在相切或模糊关系的分别用键盘上的第二行字母D、F、G、H、J编码;存在相离关系的分别用键盘上的第三行字母C、V、B、N、M编码。
USB C-B 一 丨 丿 、 LSB RSB WS上自对 中心对 ( 交叉 ) 左自对 右自对 多字词
DSB UDNB 一 丨 丿 丶 LRSB LRNB下自对 上下非对 ( 相切或模糊 ) 左右自对 左右非对
M-S M-E 一 丨 丿 丶 杂独 杂包围 ( 相离 )
五.其它规则
为了汉字输入的方便、科学和进一步地降低重码率,根据汉字的组字规律和人们的常规习惯,本发明将少量的部件作了一些适合本输入法的规则。
1.部件“讠”是根据繁体言字简化而成的,所以部件“讠”作为中心对称部件或对称部件。如:译、议、计、谋、认、识、谈、话、说等汉字均为左右型结构、左右部件自身对称类(LRSB);记、让、证、词、语、该、诈、讹、诣、诱、讯等汉字均为左右型结构、左部件自身对称类(LSB)。
2.部件“门”由繁体门字简化而成,所以部件“门”作为中心对称部件。如:阅、闪、问、闰、闵、闲、间、闹、闺、阐、闸、闾、等汉字均为中心型结构、中心对称类(C-B)。
3.下面的汉字、部件或部首均为中心对称类,如:禾、千、手、白、百、风、儿、人、贝、见、殳、月、同、文、火、乎、心、用、穴、水、母、四、皿、页、舌、周、舟、自、羊、金、曰、西、酉、采、雨、谷、山、巾、肖、来、内、南、直、完、卯、卵、秦、泰、首、昆、拿、重、叟、耒、凡、血、竟、竞、党、赏、尚、常、堂、棠、尖、觉、枣、帘、空、箜、甾、畀、舀、囚、冫、钅、礻、灬、宀、氵、丬、忄、冂、讠、艹、彡、、爫、
等部件和部首。
六.汉字输入步骤:
每个汉字按其规范笔顺,用其类别编码+前两笔画(以完整偏旁、部首或部件为准)的编码+后两笔画(以完整偏旁、部首或部件为准)的编码共5码输入。如:“古”属中心对称类,编码为W,前两笔画分别为横、竖,且两个笔画交叉,编码分别为E、R,最后两笔画为折、横且相切,编码为J、D,则“古”的编码为WERJD。又如:
1.中心对称类“果”字,前两笔和后两笔与其它笔画之间均为相切关系,故编码为WFJGH;
2.左右部件自身对称类“幅”字,前两笔和后两笔与其它笔画之间分别为相切、交叉、交叉、相切关系,故编码为KFURD;
3.左部件自身对称类“财”字,编码为IFJRG;
4.右部件自身对称类“牡”字,编码为OGERD;
5.左右部件非自身对称类“转”字,编码为LEUUH;
6.上部件自身对称类“奇”字,编码为QETDF;
7.下部件自身对称类“贷”字,编码为AGFGH;
8.上下部件非自身对称类“瓷”字,编码为SNCJH;
9.杂合型二包围类“压”字,编码为XDGDH;
10.杂合型三包围类“匣”字,编码为XDFRU;
11.杂合型四包围类“围”字,编码为XFJRD;
12.杂合型独体字类“丐”字,编码为ZDFDJ。
对于部分由三个或三个以上部件组成的汉字,本发明称其为多部件汉字。这些汉字应该划分为左中右或上中下型,但是为了汉字输入的简捷,我们将左中右型划分在左右型,上中下型划分在上下型。例如:“湖”字为左中右型结构,其左部件“氵”属自身对称类,其右部件“月”也是自身对称类部件。本发明输入法的原则是,凡是左中右型汉字中,左右部件都自身对称的汉字,以左对称为先。因此,“湖”字属于左右型左部件自身对称类。又如:“篮”字为上中下型结构,上部件“竹”为自身对称类部件,但其下部件“皿”也是自身对称类部件,对于凡是上中下型汉字中的上下部件都自身对称的汉字,本发明以上对称为先。
本发明输入多部件汉字时,根据其所属类别,先按前述输入方法输入5码,最后再输入其中间部件的前两笔画编码。如:
汉字“湖”的输入过程如下:
1.击L-R,LSB(I)键;
2.击“、”(N)键;
3.击"、"(N)键(左部件的前两笔画为“丶”,该两笔画属于相离类);
4.击“一”(D)键,
5.击"一"(D)键(右部件的最后两笔画为“一”,该两笔画属于相切类);
6.击“一”(E)键;
7.击“丨”(R)键(中部件的前两笔画,该两笔画属于交叉类)。
汉字“篮”的输入过程如下:
1.击USB(Q)键;
2.击“丿”(G)键;
3.击“一”(D)键(上部件的前两笔画,该两笔画属于相切类);
4.击“丨”(F)键;
5.击“一”(D)键(下部件的最后两笔画,该两笔画属于相切类);
6.击“丨”(V)键;
7.击“丨”(V)键(中部件的前两笔画,该两笔画属于分离类)。
七.词组输入步骤:
输入双字词组和三字词组时,依序输入各字的类别编码+前两笔画的编码。如:
输入双字词组“理想”的步骤为:
1.击“理”字的分类键“K”键(左右部件自身对称);
2.击"一"(D)键(理字的第一笔画);
3.击"一"(E)键(理字的第二笔画);
4.击“想”字的分类键“A”键(下部件自身对称);
5.击"一"(E)键(想字的第一笔画);
6.击"丨"(R)键(想字的第二笔画)。
输入三字词组“研究生”的步骤为:
1.击“研”字的分类键“O”键(右部件自身对称);
2.击"一"(D)键(研字的第一笔画);
3.击"丿"(G)键(研字的第二笔画);
4.击“究”字的分类键“Q”键(上部件自身对称);
5.击"丶"(H)键(究字的第一笔画);
6.击"丶"(H)键(究字的第二笔画);
7.击“生”字的分类键“Z”键(杂合型独体结构);
8.击"丿"(G)键(生字的第一笔画);
9.击"一"(E)键(生字的第二笔画)。
输入四字及四字以上多字词组时,先输入前两字中各字的类别编码+前两笔画的编码,再输入多字词组标识编码,最后输入末字的类别编码+前两笔画的编码。如:输入多字同组“中华人民共和国”的步骤为:
1.击“中”字的分类键“W”键(中心对称);
2.击"丨"(F)键(中字的第一笔画);
3.击""(U)键(中字的第二笔画);
4.击“华”字的分类键“A”键(下部件自身对称);
5.击"丿"(G)键(华字的第一笔画);
6.击"丨"(F)键(华字的第二笔画);
7.击多字词组标识键“P”键;
8.击“国”字的分类键“X”键(杂合型包围类);
9.击"丨"(F)键(国字的第一笔画);
10.击""(J)键(国字的第二笔画)。
最后需要说明的是,以上描述的仅是本发明的较佳实施例,并不是用来限制本发明。本发明的精髓是:根据汉字结构对称性特征将其分类,每类汉字用一个字符编码,对汉字的每种笔画用字符编码,每个汉字按其笔顺,用类别编码+前两笔画编码+最后两笔画编码输入。因此,任何基于本发明而作出的非实质性变化,如:将汉字进行更多或更少的分类、定义不同种类的笔画、改变汉字和词组的取码数量等,仍应属于本发明权利要求之内。