CN108008834B - 一种汉字输入法 - Google Patents
一种汉字输入法 Download PDFInfo
- Publication number
- CN108008834B CN108008834B CN201711186922.6A CN201711186922A CN108008834B CN 108008834 B CN108008834 B CN 108008834B CN 201711186922 A CN201711186922 A CN 201711186922A CN 108008834 B CN108008834 B CN 108008834B
- Authority
- CN
- China
- Prior art keywords
- stroke
- code
- chinese
- strokes
- coding
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
- G06F3/02—Input arrangements using manually operated switches, e.g. using keyboards or dials
- G06F3/023—Arrangements for converting discrete items of information into a coded form, e.g. arrangements for interpreting keyboard generated codes as alphanumeric codes, operand codes or instruction codes
- G06F3/0233—Character input methods
Landscapes
- Engineering & Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Document Processing Apparatus (AREA)
Abstract
本发明提供一种汉字输入法,其包括以下步骤:(1)将汉字的笔画归纳为横、竖、撇、捺、点、提、钩、拐八类;并将这八类笔画分别编码为1、2、3、4、5、6、7、8;(2)对汉字进行一级编码:按汉字书写的笔顺,将最前三笔和最后两笔笔画进行编码;(3)对汉字进行二级编码:(4)对汉字进行三级编码。本发明由于对汉字输入分为一级编码、二级编码和三级编码,并对部分汉字设置了尾设码或对其第一笔或第二笔人为设置了设置码,从而大大降低了重码率;且一个汉字最多5码,直接与电脑键盘上的数字键一一对应,简单易学且节省键盘资源。
Description
技术领域
本发明属于中文信息处理技术领域,具体涉及一种汉字输入法。
背景技术
目前,将汉字输入电脑的方法有很多。从二十世纪八十年代发展以来,汉字输入法经历了单字输入、词语输入、整句输入几个阶段。汉字编码输入法可分为以下五类:音码、形码、音形码、形音码、综合码等。但音码对发音不准的人来说输入汉字有一定的难度,另外重码率高,输入汉字时需频繁翻页,输入效率低;形码输入虽不受汉字读音限制,但工看着字打,且学习和使用难度较大,容易遗忘;音形码重码率高,不能大幅度提高汉字输入的总体效率;形音码拆字难,且不会写或一时读不出的字也是打不出来的;综合码是为了进一步降低学习难度而编的输入法,典型的如万能码,既可以拼音输入又可以五笔输入,还可以英文输入等等。但是这种不以某一种规则为主的输入法是以牺牲速度换来方便的,除非输入者对纯音码和纯形码均相当熟悉,且能切换自如,才能较大的提高汉字输入效率。
针对上述各种输入法中存在的问题,在信息化和数字化越来越普及的网络时代,需发明了一种操作方便、简单易学、拆字规范、重码率低的汉字输入法仍具有十分重要的意义。
发明内容
本发明的目的是提供一种简便的汉字输入法,在国家规范的汉字书写笔顺规则的基础上,采用笔顺和笔画对汉字编码,降低了重码率,并避免了口语发音不标准的困扰。
本发明的技术方案如下:
一种汉字输入法,其包括以下步骤:
(1)将汉字的笔画归纳为横、竖、撇、捺、点、提、钩、拐八类;并将这八类笔画分别编码为1、2、3、4、5、6、7、8,具体为:
1代表的笔画为横,2代表的笔画为竖,3代表的笔画为撇,4代表的笔画为捺,5代表的笔画为点,6代表的笔画为提,7代表的笔画为钩,8代表的笔画为拐;
(2)对汉字进行一级编码:按汉字书写的笔顺,将最前三笔和最后两笔笔画进行编码;当汉字的最后部件为以下五类时,则将该汉字的最后一笔编码依据下面规则进行尾设码设置:
当汉字书写到最后的部件是“人”时,其最后一笔“捺”的编码设置为8;
当汉字书写到最后的部件分别是“木、土、工、又”时,其最后一笔编码设置为3;
当汉字书写到最后的部件分别是“小、鳥”时,其最后一笔的编码设置为7;
当汉字书写到最后的部件分别是“八、日、月、心”时,其最后一笔编码设置为6;
当汉字书写到最后的部件是“、”,且是在该字的右上角时,其最后一笔编码设置为2;
(3)对汉字进行二级编码:对具有以下偏旁部首的汉字,按书写笔顺先对偏旁部首的前两笔进行编码,然后再对偏旁部首后面的第一笔进行编码,最后对汉字的最后两笔进行编码;
部首 | 氵 | 钅 | 火 | 女 | 王 | 石 | 纟 | 糸 | 酉 | 马、馬 | 衤、礻 | 鱼 | 歹 | 扌 | 月 | 犭 | 米 | 彳 | 广 |
编码 | 55 | 31 | 53 | 83 | 11 | 13 | 87 | 88 | 12 | 87 | 58 | 38 | 13 | 17 | 37 | 37 | 53 | 33 | 51 |
(4)对汉字进行三级编码:
A、对具有以下偏旁部首的第一笔正常编码、第二笔按下面规律设为设置码;后三笔的编法与汉字二级编码的后三笔的编法相同;
汉字偏旁部首 | 木 | 土 | | 疒 | 忄 | 目 | 足 | 山 | 口 | 禾 | 虫 | 贝 | 貝 |
第一笔编码 | 1 | 1 | 3 | 5 | 5 | 2 | 2 | 2 | 2 | 3 | 2 | 2 | 2 |
第二笔设置码 | 4 | 5 | 5 | 2 | 4 | 2 | 5 | 2 | 3 | 4 | 4 | 5 | 5 |
合计 | 14 | 15 | 35 | 52 | 54 | 22 | 25 | 22 | 23 | 34 | 24 | 25 | 25 |
B、对以下偏旁部首的第一笔编码按以下规则设为设置码、第二笔正常编码,后三笔的编法与汉字二级编码后三笔的编法相同:
以“釒、魚、車、革、士”为偏旁部首的汉字,第一笔的设置码为4,第二笔的编码为该偏旁部首的第二笔编码;以“言、艹、日、飠、走”为偏旁部首的汉字,第一笔的设置码为6,第二笔的编码为该偏旁部首的第二笔编码。
进一步方案,步骤(1)中的所述横的行笔方向是从左到右,包括长横、短横、斜横;
所述竖的行笔方向是从上到下,包括长竖、短竖;
所述撇的行笔方向是从上方或右上方向左下方,包括长撇、短撇。
所述捺的行笔方向是从左方或左上方向右下方,包括长捺、短捺、平捺。
所述点是汉字笔画中最短的笔画,包括左点和右点。
所述提的行笔方向是从左下方向右上方,其末端不与任何笔画相连或交叉,并且是单独起笔,不与任何的笔画一起连写;
所述钩在行笔的过程中改变了原行笔方向,在笔画的末端有钩,且;其包括横钩、竖钩、竖弯钩、横折钩、横折弯钩、斜钩、竖提、横折提;
所述拐在行笔的过程中改变了原行笔方向,在笔画的末端不带钩,且其末端与其它笔画相连或相交;其包括横折、横撇、竖弯、撇折、横折弯、撇点、横折折撇、竖折撇、竖折折、横折折、横折折折。
进一步方案,步骤(2)中对汉字的最后一笔编码进行尾设码设置的条件是:
(1)当汉字最后部件中出现“人、木、土、工、又、小、八、日、月、心、鳥或、”部件时,这些部件的前面必须还有其他的笔画,而且它们的后面绝不能再有其他的笔画,才能用尾设码规则进行编码;
(2)部件“木、人、又”的末笔画只有写成捺时,才能用尾设码规则编码;
(3)部件“小、八”的末笔画只有写成点时,才能用尾设码规则编码;
(4)部件“人、八”的撇和捺的笔画中间,不能有任何笔画;
(5)部件“木、土、工、又、小、八、日、月、心、鳥”与前面的笔画不能交叉。
进一步方案,步骤(3)、(4)中的偏旁部首指在上下结构的汉字中占据整个汉字的上方,或在两面半包围结构的汉字中占整个汉字的左上角、左上方或左下方,或在左右结构的汉字中占整个汉字的左边或左上角。
进一步方案,还包括非汉字类输入,所述非汉字类的编码是以9开始进行编码,具体为:标点类编码为91、符号类编码为92、英文大写字母编码为93、英文小写字母编码为94、数字类编码为95。
进一步方案,所述汉字的编码口诀表如下:
本编码口诀表分12行5列,该表的最上边1行和最左边1列是设置的行号和列号,偏旁部首后面括号中的字为其读音,偏旁部首下面的数字即表示其编码。
进一步方案,所述编码口诀表中第1行至第4行是“尾设码”的口诀;表中第5行至第10行中的黑体字,是指汉字三级编码中的第二笔为设置码的偏旁部首,且黑体字偏旁部首所在的列号,就是该偏旁部首的第二笔编码的设置码;不是黑体的偏旁部首,不论在哪一行哪一列,都按汉字二级编码规则进行编码;表中第11行和第12行,是汉字三级编码第一笔编码为设置码;除第5行至第12行中偏旁部首所组成的汉字或整体字外,都按汉字一级编码进行编码。
本发明是根据国家规定的汉字书写笔顺规则,编制出的一种汉字输入方法,在本发明中称为《华顺汉字输入法》。该方法是先对汉字的笔画进行编码,并对部分汉字的部分笔画的编码进行人为设置,然后将这些笔画的编码按一定规则组合到一起,就组成了某个汉字的编码。不论多么复杂的汉字,一个汉字最多是5位码。
本发明的优点:
(1)编码方法简单易学。
(2)单字重码率低。通过对CJK统一汉字大约21000个汉字编码进行统计,单字重码数在1-10之间的占75%,单字重码数在11-20之间的占24%,单字重码数在21-25之间的仅占1%,单字重码数最大的是25。而本发明由于对汉字输入分为一级编码、二级编码和三级编码,并对部分汉字设置了尾设码或对其第一笔或第二笔人为设置了设置码,从而大大降低了重码率。
(3)比较节省键盘资源。本发明的编码直接与电脑键盘上的数字键一一对应,在输入汉字时,只需输入该汉字所对应的编码,即最多5位数字即可。所以本发明的输入法在电脑键盘上只用到1~9共9个数字键,比较节省键盘空间。
(4)本发明还支持对汉字的模糊记忆,无论多么复杂的汉字,只要记住这个汉字的前三笔和最后两笔就可以编码输入。
(5)容易接受。因为本发明的输入法是完全根据国家规定的汉字笔顺规则,编制出的一种汉字输入编码方法。小学生学汉字,只要一学书写笔画、笔顺,就可以学习编码。
(6)避免了口语发音不标准的困扰。
(7)应用方便。用银行柜员机的数字键盘就可以输入汉字。如果在银行密码中方便地插入汉字,密码将安全得多。
具体实施方式:
一种汉字输入法,其包括以下步骤:
一、将汉字的笔画归纳为横、竖、撇、捺、点、提、钩、拐八类;并将这八类笔画分别编码为1、2、3、4、5、6、7、8,具体为:
1代表的笔画为横,横的行笔方向是从左到右,其包括长横、短横、斜横;
2代表的笔画为竖,竖的行笔方向是从上到下,其包括长竖、短竖;
3代表的笔画为撇,撇的行笔方向是从上方或右上方向左下方,其包括长撇、短撇;
4代表的笔画为捺,捺的行笔方向是从左方或左上方向右下方,其包括长捺、短捺、平捺;
5代表的笔画为点,点是汉字笔画中最短的笔画,,其包括左点和右点;
6代表的笔画为提,提的行笔方向是从左下方向右上方。“提”最明显的标志是“提“的末端不与任何笔画相连或交叉,并且是单独起笔,不与任何的笔画一起连写;
7代表的笔画为钩,在行笔的过程中,笔画要改变原行笔方向并且笔画的末端有钩。钩分横钩、竖钩、竖弯钩、横折钩、横折弯钩、斜钩、竖提、横折提等等。如果用楷体书写,钩最明显的特点是笔画的末端有象针尖一样的尖锋;
8代表的笔画为拐:在行笔的过程中,笔画要改变原行笔方向并且笔画的末端不带钩。在汉字笔画中的横折、横撇、竖弯、撇折、横折弯、撇点、横折折撇、竖折撇、竖折折、横折折、横折折折等等这些皆称为“拐”。
注意:横钩、竖钩,有时与拐容易混绕,如“了”字,第一笔是横钩,第二笔是竖钩,但在《华顺汉字输入法》编码时,第一笔称拐,第二笔称钩。如何区别“钩”和“拐”呢?区别二者唯一的原则是:不论横钩还是竖钩,只要钩的末端有与其他相连或相交的笔画存在,就把他看成拐;如果钩的末端再没有其他笔画,那这个钩就是毫无疑问的钩。“了”字横钩的末端与第二笔竖钩相连,所以“了”字的第一笔应看做拐。
上述汉字笔画的编码编为口诀即为:
横一竖二,
撇三捺四,
点五提六,
钩七拐八。
二、汉字一级编码
在本发明的《华顺汉字输入法》中,“头三尾二尾设码”是汉字一级编码规则,“头三”是指某一个汉字按书写笔顺将最初的三笔进行编码。“尾二”是指某一个汉字按书写笔顺将最后两笔进行编码。将这两部分编码合在一起,就是一个汉字的完整编码。例如:“华顺”二字,“华”字最前三笔分别为:撇、竖、撇,最后两分别笔为:横、竖,将这两部分组合到一起为:撇、竖、撇、横、竖共5笔,用笔画代码表示为:32312;“顺”字最前三笔分别为:撇、竖、竖,最后两笔分别为:撇、点,将这两部分组合到一起为:撇、竖、竖、撇、点共5笔,用笔画代码表示为:32235。
对笔画不足5笔的汉字编码时,按书写笔顺一笔挨一笔顺着往后编即可,有几笔就编几笔。例如“一”字,笔画顺序是:横,共1笔,该字编码应为:1;例如“土”字,笔画顺序是:横、竖、横,共3笔,该字编码应为:121;例如“木”字,笔画顺序是:横、竖、撇、捺,共4笔,该字编码应为:1234。
有很多汉字的最后一笔是一样的,这就致使部分汉字编码的重码数较多。为了缩减部分汉字编码的重码数,我们对某些汉字的最后一笔编码进行人为设置。对最后一笔进行人为设置编的那一码称尾设码。不是所有的汉字编码都有尾设码,只有当汉字的最后部件为以下五类时,则将该汉字的最后一笔编码依据下面规则进行尾设码设置:
当汉字书写到最后的部件是“人”时,其最后一笔“捺”的编码设置为8;
当汉字书写到最后的部件分别是“木、土、工、又”时,其最后一笔编码设置为3;
当汉字书写到最后的部件分别是“小、鳥”时,其最后一笔的编码设置为7;
当汉字书写到最后的部件分别是“八、日、月、心”时,其最后一笔编码设置为6;
当汉字书写到最后的部件是“、”,且是在该字的右上角时,其最后一笔编码设置为2;
为了记忆方便,我们把这些编为顺口溜:即“人木土工又,小八日月心,右上点飞鳥,末笔是根本”。例如“炎、桑、尘、差、皮”这五个字,按书写笔顺它们的最后部分分别是“人、木、土、工、又”,所以它们最后一笔编码分别为“8、3、3、3、3”,这五个字的编码分别为:53338、85833、23523、53123、73283。例如“祭、共、春、有、思”这五个字,按书写笔顺它们的最后部分分别是“小、八、日、月、心”,所以它们最后一笔编码分别为“7、6、6、6、6”,这五个字的编码分别为,38537、12236、11116、13216、28156。例如“战、贰、伏”这三个字,按书写笔顺它们的最后部分都是“、”,并且都出现在该字的右上方,所以它们的最后一笔编码都是“2”,这三个字的编码分别为,21232、11172、32142。例如“鳯、鴿、鴛”这三个字,按书写笔顺它们的最后部分都是“鳥”,所以它们最后一笔编码都是“7”,这三个字的编码分别为,37357、35157、38557。
尾设码规则的应用,只有当该汉字按笔顺书写至最后部件分别是:人、木、土、工、又、小、八、日、月、心、鳥及“、”这十二种情况时,该汉字的最后一笔才可以采用尾设码规则编码。这是应用尾设码规则编码的大前提。应用尾设码规则编码时,应注意以下事项:
(1)当一个汉字中出现:人、木、土、工、又、小、八、日、月、心、鳥及“、”这十二种情况其中的一种时,他们的前面必须还有其他的笔画,而且它们的后面绝不能再有其他的笔画,才应用尾设码规则编码。
(2)“木”、“人”、“又”的末笔在汉字中,有时候写成捺,有时候写成点,只有当末笔写成捺时,才应用尾设码规则编码。
(3)“小”和“八”的末笔,在汉字中有时候写成捺,有时候写成点,只有当末笔写成点时,才应用尾设码规则编码。
特别注意,“人、八”字的撇和捺的笔画中间,不能有任何笔画。
(4)在末尾部分有“月”的组合汉字中,“月”的第一笔,有时写成撇,有时写成竖。无论写成撇还是写成竖,都应用尾设码规则编码。
(5)当出现“木、土、工、又、小、八、日、月、心、鳥”这十种情况之一时,它们与前面的笔画可以相连,也可以不相连,但不能交叉。例如“来”字,按照书写笔顺,“来”字最后部分书写的是“木”字,但这个“木”字与它前面的笔画是交叉的,所以“来”字尾笔编码不能采用尾设码规则编码,“来”字的编码应是15334。再例如“呆”字,按照书写笔顺,“呆”字最后部分写的是“木”字,这个“木”字与它前面的笔画只是相连,不是交叉,所以“呆”字尾笔编码必须按尾设码规则编码,“呆”字的编码应是28133。
(6)“人”比较特殊。这一撇一捺只要是最后书写的,不论它与前面的笔画是相连还是交叉,最后一笔都要按尾设码规则编码。例如“众、大、天、夫、夷、爽”,这些字最后书写的都是“人”,最后一笔都要按尾设码规则编码,他们的编码分别是34338、138、1138、1138、18138、13538。
(7)当末笔出现“、”时,并且必须出现在某个字的右上角,最后一笔才按尾设码规则编码。
三、汉字二级编码
汉字二级编码就是对某些具有偏旁部首的汉字,按书写笔顺先对偏旁部首的前两笔进行编码,即“偏旁部首取二”的原则;然后再对偏旁部首后面的第一笔进行编码;将这两部分编码合并到一起,共3码,就组成了汉字一级编码规则中的“头三”,后面的编法与汉字一级编码“尾二”编法相同。这就是汉字二级编码规则。例如“理、胆、继、法”这四个字,它们偏旁的前两笔编码分别为“11、37、87、55”;按书写笔顺,偏旁后面的第一笔编码分别为“2、2、5、1”;按书写笔顺,最后两笔编码(尾二)分别为“11、11、58、85”。将这三部分合并到一起就组成了“理、胆、继、法”这四个字的完整编码,它们分别为“11211、37211、87558、55185”。
汉字的偏旁部首日常用的大约有180多个,在汉字二级编码中,只用到21个偏旁部首。它们分别是“氵(55)、钅(31)、火(53)、女(83)、王(11)、石(13)、纟(87)、糸(88)、酉(12)、马和馬(87)、衤和礻(58)、鱼(38)、歹(13)、扌(17)、月(37)、犭(37)、米(53)、彳(33)、广(51)”。
四、汉字三级编码
汉字三级编码是对某些具有偏旁部首的汉字,其偏旁部首的第一笔或第二笔编码采用人为设置的设置码,后三笔的编法与汉字二级编码的后三笔的编法相同。
1、偏旁部首的第二笔为人为设置的设置码。对某些具有偏旁部首的汉字,偏旁部首的第一笔画的编码为第一码、第二笔要人为设置进行编码。后三笔的编法与汉字二级编码后三笔的编法相同。这样的偏旁部首共有13个,他们分别是“木、土、、疒、忄、目、足、山、口、禾、虫、贝、貝”,它们第二笔编码的设置码为:
(1)“木”第一笔编码为“1”,第二笔编码设置码为“4”,两部分合到一起为“14”;
(2)“土”第一笔编码为“1”,第二笔编码设置码为“5”,两部分合到一起为“15”;
(3)“”第一笔编码为“3”,第二笔编码设置码为“5”,两部分合到一起为“35”;
(4)“疒”第一笔编码为“5”,第二笔编码设置码为“2”,两部分合到一起为“52”;
(5)“忄”第一笔编码为“5”,第二笔编码设置码为“4”,两部分合到一起为“54”;
(6)“目”第一笔编码为“2”,第二笔编码设置码为“2”,两部分合到一起为“22”;
(7)“足”第一笔编码为“2”,第二笔编码设置码为“5”两部分合到一起为“25”,;
(8)“山”第一笔编码为“2”,第二笔编码设置码为“2”,两部分合到一起为“22”;
(9)“口”第一笔编码为“2”,第二笔编码设置码为“3”,两部分合到一起为“23”;
(10)“禾”第一笔编码为“3”,第二笔编码设置码为“4”,两部分合到一起为“34”;
(11)“虫”第一笔编码为“2”,第二笔编码设置码为“4”,两部分合到一起为“24”;
(12)“贝”第一笔编码为“2”,第二笔编码设置码为“5”,两部分合到一起为“25”。
(13)“貝”第一笔编码为“2”,第二笔编码设置码为“5”,两部分合到一起为“25”。
例如“木”字旁汉字的第一笔是横,编码是“1”,第二笔是竖,自然编码应该是“2”,但我们对木字旁汉字编码时,木字旁的第二笔不编成“2”,而是人为设置成“4”。例如“林、棵、柯、树”这四个字都是“木”字旁,第一笔是横,编码是“1”,第二笔是竖,编码不取“2”,而是设置成“4”。那么,“林、棵、柯、树”这四个字的完整编码分别是“14133、14234、14117、14875”。例如:提土旁的汉字,第一笔是横,编码是“1”,第二笔是竖,自然编码应该是“2”,但我们对提土旁的汉字编码时,第二笔不编成“2”,而是人为设置成“5”。例如“坏、埋、垮、城”这四个字都是提土旁,第一笔是横,编码是“1”,第二笔是竖,编码不取“2”,而是设置成“5”。那么,“坏、埋、垮、城”这四个字的完整编码分别是:15125、15211、15117、15132。
2、偏旁部首的第一笔为人为设置的设置码。对某些具有偏旁部首的汉字,偏旁部首的第一笔编码要人为设置,编为第一码,偏旁部首的第二笔编码是自然笔画(原笔画)的编码,编为第二码。后三笔的编法与汉字二级编码后三笔的编法相同。
旁部首的第一笔编码要人为设置编码的有两类,共10个偏旁部首,他们分别是“釒、魚、車、革、士、訁、艹、日、飠、走”。
(1)以“釒、魚、車、革、士”为偏旁的汉字,第一笔的编码设置为“4”,第二笔的编码为该偏旁第二笔(自然笔画)的编码。“釒、魚、車、革、士”这5个偏旁部首的第一笔都是:“4”,第二笔分别编为:5、8、2、2、2。将这两部分合并到一起分别为:45、48、42、42、42,这就组成了该汉字的前两位编码,后三位的编法与汉字二级编码规则的后三位编法相同。例如:“鉄、鯉、輛、鞋、壹”这几个字,它们的编码分别是:45338、48211、42135、42123、42531。
(2)以“言、艹、日、飠、走”为偏旁部首的汉字,第一笔的设置码为“6”,第二笔的编码为自然笔画的编码,它们分别为:1、2、8、5、2。将这两部分合并到一起分别为:61、62、68、65、62,这就组成了该偏旁汉字的前两位编码,后三位的编码与汉字二级编码后三位编法相同。例如:“語、药、量、饒、趋”这几个字,它们的编码分别是:61181、62875、68111、65137、62311。
在《华顺汉字输入法》中,“釒、魚、車、革、言、飠、走”是指以“釒、魚、車、革、言、飠、走”为偏旁的汉字,是用在汉字的左边。“艹”是指草字头的汉字,用在汉字的上方。“士”是用在汉字的左上角或正上方。“日”是用在汉字的左面或汉字的上方或汉字的左上角。
五、汉字的编码口诀
在《华顺汉字输入法》中,汉字编码分三个级别,涉及的偏旁部首有44个,涉及的尾设码有12个,记忆起来比较麻烦。现把这些偏旁部首编成《华顺汉字编码口诀表》,记忆起来就比较方便。
所述汉字的编码口诀表如下:
1.《华顺汉字编码口诀表》分12行5列。为了说明方便,该表的最上边1行和最左边1列是设置的行号和列号。只要熟记这个表,特别是要记清楚每个偏旁部首所在的列,就可以熟练编码。
2.在《华顺汉字编码口诀表》中,有些偏旁部首没有准确的读音,为了口读方便,将没有读音的偏旁部首用一些形态上有些相近的汉字来注音(括号里的汉字就是注音汉字),例如“氵”注音为“水”;“钅”注音为“金”等等。
3.《华顺汉字编码口诀表》第1行至第4行是“尾设码”的口诀。
4.《华顺汉字编码口诀表》第5行至第10行中的黑体字,是指汉字三级编码第二笔为设置码的偏旁部首,共13个。该表分5列,黑体字偏旁部首所在的列号,就是该偏旁部首第二笔编码的设置码。例如“木”,是黑体字,在第4列,那么“木”字旁汉字的第二笔编码的设置码就为“4”。再如“贝”,是黑体字,是在第5列,那么“贝”字旁汉字的第二笔编码的设置码就为“5”等等。
5.《华顺汉字编码口诀表》5至10行中,不是黑体的偏旁部首,不论在哪一行哪一列,都按汉字二级编码规则进行编码,这类偏旁部首共21个。
6.《华顺汉字编码口诀表》的第11行和第12行,是汉字三级编码第一笔编码要人为设置编码的偏旁部首。这类偏旁部首共10个。
7.除《华顺汉字编码口诀表》的第5行至第12行中列举的偏旁部首所组成的汉字或体字之外,都按汉字一级编码规则进行编码。
8.《华顺汉字编码口诀表》的第5行至第12行中,偏旁部首共44个。这44个偏旁部首的用法可分四类:
(1)用在整个汉字的上方。这样的偏旁部首有四个,即“艹”、“”、“日”、“士”。如:“花”、“茂”、“著”等字都是草字头的字,“简”、“第”、“笋”等字都是竹字头的字。它们的部首都占据整个汉字的上方。注意:“描”、“潇”、“敬”等字就不是草字头的字,因为草字头只占据该汉字上方的一部分。
(2)用在整个汉字的上方或是用在某个汉字的左上角。这样的偏旁部首有两个,即“士”、“日”。如“壹”、“壶”、“声”“款”、“馨”、“懿”、“早”、“旱”、“昱”、“题”、“匙”等字。
(3)两面包围结构的偏旁部首。这样的偏旁部首有三个,是“疒、广、走”。“疒、广”是属左上包围结构的偏旁部首。如“病”、“疾”、“度”、“床”等字。另一个是“走”,是属左下包围结构的偏旁部首。如“赵”、“超”、“趁”等字
(4)用在整个汉字的左边。在44个偏旁部首中,除“艹”、“”、“士”三个偏旁部首外,其余的41个偏旁部首都能用在某个汉字的整个左边。例如“拼搏”二字,都是“扌”旁的汉字,提手旁“扌”占据了“拼搏”二字的整个左边。“拼搏”二字的编码,是按汉字的二级编码规则进行编码,其编码为:17532、17175。再例如“垫”字,它就不是“扌”旁的汉字,因为“垫”字的“扌”只占据了“垫”字的左上边,没有占据“垫”字的整个左边。“垫”字编码只能按汉字一级编码规则进行编码,其编码为“17623”,而不能编成“17323”。
六、非汉字类编码
非汉字类是指标点、符合、字母及数字等。非汉字类的编码是以“9”开头。在《华顺汉字输入法》中,非汉字类的编码的前两位分别是:91是标点类,92是符号类;93英文大写字母,94是英文小写字母;95是数字类。
本发明不限于这里的实施例,本领域技术人员根据本发明的揭示,不脱离本发明范畴所做出的改进和修改都应该在本发明的保护范围之内。
Claims (6)
1.一种汉字输入法,其特征在于:包括以下步骤:
(1)将汉字的笔画归纳为横、竖、撇、捺、点、提、钩、拐八类;并将这八类笔画分别编码为1、2、3、4、5、6、7、8,具体为:
1代表的笔画为横,2代表的笔画为竖,3代表的笔画为撇,4代表的笔画为捺,5代表的笔画为点,6代表的笔画为提,7代表的笔画为钩,8代表的笔画为拐;
(2)对汉字进行一级编码:按汉字书写的笔顺,将最前三笔和最后两笔笔画进行编码;当汉字的最后部件为以下五类时,则将该汉字的最后一笔编码依据下面规则进行尾设码设置:
当汉字书写到最后的部件是“人”时,其最后一笔“捺”的编码设置为8;
当汉字书写到最后的部件分别是“木、土、工、又”时,其最后一笔编码设置为3;
当汉字书写到最后的部件分别是“小、鳥”时,其最后一笔的编码设置为7;
当汉字书写到最后的部件分别是“八、日、月、心”时,其最后一笔编码设置为6;
当汉字书写到最后的部件是“、”,且是在该字的右上角时,其最后一笔编码设置为2;
(3)对汉字进行二级编码:对具有以下偏旁部首的汉字,按书写笔顺先对偏旁部首的前两笔进行编码,然后再对偏旁部首后面的第一笔进行编码,最后对汉字的最后两笔进行编码;
(4)对汉字进行三级编码:
A、对具有以下偏旁部首的第一笔正常编码、第二笔按下面规律设为设置码;后三笔的编法与汉字二级编码的后三笔的编法相同;
B、对以下偏旁部首的第一笔编码按以下规则设为设置码、第二笔正常编码,后三笔的编法与汉字二级编码后三笔的编法相同:
以“釒、魚、車、革、士”为偏旁部首的汉字,第一笔的设置码为4,第二笔的编码为该偏旁部首的第二笔编码;以“言、艹、日、飠、走”为偏旁部首的汉字,第一笔的设置码为6,第二笔的编码为该偏旁部首的第二笔编码;
步骤(3)、(4)中的偏旁部首指在上下结构的汉字中占据整个汉字的上方,或在两面半包围结构的汉字中占整个汉字的左上角、左上方或左下方,或在左右结构的汉字中占整个汉字的左边或左上角。
2.根据权利要求1所述的一种汉字输入法,其特征在于:步骤(1)中的所述横的行笔方向是从左到右,包括长横、短横、斜横;
所述竖的行笔方向是从上到下,包括长竖、短竖;
所述撇的行笔方向是从上方或右上方向左下方,包括长撇、短撇;
所述捺的行笔方向是从左方或左上方向右下方,包括长捺、短捺、平捺;
所述点是汉字笔画中最短的笔画,包括左点和右点;
所述提的行笔方向是从左下方向右上方,其末端不与任何笔画相连或交叉,并且是单独起笔,不与任何的笔画一起连写;
所述钩在行笔的过程中改变了原行笔方向,在笔画的末端有钩,且其包括横钩、竖钩、竖弯钩、横折钩、横折弯钩、斜钩、竖提、横折提;
所述拐在行笔的过程中改变了原行笔方向,在笔画的末端不带钩,且其末端与其它笔画相连或相交;其包括横折、横撇、竖弯、撇折、横折弯、撇点、横折折撇、竖折撇、竖折折、横折折、横折折折。
3.根据权利要求1所述的一种汉字输入法,其特征在于:步骤(2)中对汉字的最后一笔编码进行尾设码设置的条件是:
(1)当汉字最后部件中出现“人、木、土、工、又、小、八、日、月、心、鳥或、”部件时,这些部件的前面必须还有其他的笔画,而且它们的后面绝不能再有其他的笔画,才能用尾设码规则进行编码;
(2)部件“木、人、又”的末笔画只有写成捺时,才能用尾设码规则编码;
(3)部件“小、八”的末笔画只有写成点时,才能用尾设码规则编码;
(4)部件“人、八”的撇和捺的笔画中间,不能有任何笔画;
(5)部件“木、土、工、又、小、八、日、月、心、鳥”与前面的笔画不能交叉;
(6)部件“、”必须出现在某个汉字的右上角,才能用尾设码规则编码。
4.根据权利要求1所述的一种汉字输入法,其特征在于:还包括非汉字类输入,所述非汉字类的编码是以9开始进行编码,具体为:标点类编码为91、符号类编码为92、英文大写字母编码为93、英文小写字母编码为94、数字类编码为95。
6.根据权利要求5所述的一种汉字输入法,其特征在于:所述编码口诀表中第1行至第4行是“尾设码”的口诀;表中第5行至第10行中的黑体字,是指汉字三级编码中的第二笔为设置码的偏旁部首,且黑体字偏旁部首所在的列号,就是该偏旁部首的第二笔编码的设置码;不是黑体的偏旁部首,不论在哪一行哪一列,都按汉字二级编码规则进行编码;表中第11行和第12行,是汉字三级编码第一笔编码为设置码的偏旁部首;除第5行至第12行中偏旁部首所组成的汉字或整体字外,都按汉字一级编码进行编码。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711186922.6A CN108008834B (zh) | 2017-11-23 | 2017-11-23 | 一种汉字输入法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711186922.6A CN108008834B (zh) | 2017-11-23 | 2017-11-23 | 一种汉字输入法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108008834A CN108008834A (zh) | 2018-05-08 |
CN108008834B true CN108008834B (zh) | 2021-02-05 |
Family
ID=62053318
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201711186922.6A Expired - Fee Related CN108008834B (zh) | 2017-11-23 | 2017-11-23 | 一种汉字输入法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108008834B (zh) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1523477A (zh) * | 2003-02-18 | 2004-08-25 | 王治阳 | 三五数码 |
US6922811B1 (en) * | 1999-07-28 | 2005-07-26 | Qcode Information Technology Limited | Chinese character encoding input method and its input apparatus |
CN101059729A (zh) * | 2007-05-17 | 2007-10-24 | 刘金远 | 十笔首部尾部笔画数码输入法 |
CN104267824A (zh) * | 2014-04-29 | 2015-01-07 | 赵源 | 汉字五笔号码数字编码输入法 |
CN104571578A (zh) * | 2014-12-02 | 2015-04-29 | 詹宗弘 | 简化汉字数字部首输入法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10203872B2 (en) * | 2005-04-22 | 2019-02-12 | Neopad Inc. | Creation method for characters/words and the information and communication service method thereby |
-
2017
- 2017-11-23 CN CN201711186922.6A patent/CN108008834B/zh not_active Expired - Fee Related
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6922811B1 (en) * | 1999-07-28 | 2005-07-26 | Qcode Information Technology Limited | Chinese character encoding input method and its input apparatus |
CN1523477A (zh) * | 2003-02-18 | 2004-08-25 | 王治阳 | 三五数码 |
CN101059729A (zh) * | 2007-05-17 | 2007-10-24 | 刘金远 | 十笔首部尾部笔画数码输入法 |
CN104267824A (zh) * | 2014-04-29 | 2015-01-07 | 赵源 | 汉字五笔号码数字编码输入法 |
CN104571578A (zh) * | 2014-12-02 | 2015-04-29 | 詹宗弘 | 简化汉字数字部首输入法 |
Non-Patent Citations (1)
Title |
---|
汉字笔画编码输入法研究;陈钦梧 等;《汕头大学学报 (自然科学版)》;20070531;第22卷(第2期);第71-75页 * |
Also Published As
Publication number | Publication date |
---|---|
CN108008834A (zh) | 2018-05-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN1023038C (zh) | 汉字音形序码计算机汉字输入方法 | |
CN101694601B (zh) | 零记忆汉字编码输入法 | |
CN108008834B (zh) | 一种汉字输入法 | |
CN105912139B (zh) | 一种模块化笔画编码汉字对应识别的方法 | |
CN101086687A (zh) | 一种首末码汉字输入方法 | |
CN1595340A (zh) | 通俗五笔字型法及其键盘 | |
CN1530805A (zh) | 中华形码汉字输入系统 | |
CN102043471A (zh) | 二十五偏旁部首字根中华形码输入法 | |
CN1055167C (zh) | 汉字部首笔顺码的输入方法 | |
CN1159638C (zh) | 一种计算机六画十二形的汉字输入方法 | |
CN1204487C (zh) | 根声码汉字输入法 | |
CN106959764A (zh) | 一种有助于正确书写汉字的形码输入法 | |
CN100428121C (zh) | 五加加汉字输入法 | |
CN1277171C (zh) | 和码汉字数字输入法 | |
CN1051161C (zh) | 一种汉字数码输入法 | |
CN114461084A (zh) | 计算机汉字输入法 | |
CN100373307C (zh) | 汉字数码的国际交流软件 | |
CN1167994C (zh) | 一二三四输入法 | |
CN101833378B (zh) | 一种改进的五笔输入法及其键盘 | |
CN102929399A (zh) | 一种快速拆分汉字编码输入法 | |
CN101644957A (zh) | 一种电脑汉字音位码输入法及其键盘 | |
CN112083816A (zh) | 音义及音型码汉字输入法 | |
CN1892539A (zh) | 一种首尾笔形加双拼编码的汉字输入法 | |
CN100368966C (zh) | 楚雄彝文笔画输入法 | |
CN1069766C (zh) | 电脑、字典共用新部首汉字输入法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20210205 Termination date: 20211123 |
|
CF01 | Termination of patent right due to non-payment of annual fee |