CN1237436C - 汉字明码输入法 - Google Patents
汉字明码输入法 Download PDFInfo
- Publication number
- CN1237436C CN1237436C CN 02113741 CN02113741A CN1237436C CN 1237436 C CN1237436 C CN 1237436C CN 02113741 CN02113741 CN 02113741 CN 02113741 A CN02113741 A CN 02113741A CN 1237436 C CN1237436 C CN 1237436C
- Authority
- CN
- China
- Prior art keywords
- code
- chinese character
- chinese
- character
- word
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Document Processing Apparatus (AREA)
Abstract
本发明为针对GBK大汉字库的汉字《明码》输入法,是按汉字字型来取笔画进行编码的形码输入法。其规则如下:(1)把笔画分为五类,任意两笔共可构成25种组合,按笔画的类号分为五排五位,安排在键盘的25个英文键上,并以该字母为代码。(2)汉字的编码为“一字三码”。按汉字拼合的层次结构,将其分为“排列型”、“包含型”和“单一型”。前两种字型应“自然地”划分为两部分,然后取第一部分的头两笔和第二部分的头两笔及尾两笔,即可得该字的三个编码。而单一型字则取头两笔和尾两笔,得到一、二码,第三码同第二码。除一级汉字外,每个字后都带有双拼注音。(3)词组的编码规则:顺序取每个字的第一码,一词四码,不足时用末字的二码、三码补足。
Description
一、技术领域:
本发明与计算机的汉字输入方法有关,是采用汉字的笔画进行编码的方法来输入汉字,是一种形码输入法。
二、背景技术:
现有的汉字输入法,绝大多数都是针对国标GB2312-80中的6763个汉字进行编码的,对于GBK大汉字库的输入法则很少,而且,多因输入规则复杂或生僻汉字读音难,实际使用很困难。
本发明的目的是提供一种编码信息少而易取的、编码规则简单而易于掌握的形码输入法,用来既能解决GBK大汉字库的汉字输入,又不影响GB2312-80中的汉字及其词汇的正常输入。
三、发明内容:
1、汉字的特点:
第一个特点:汉字是由若干笔画组合而成的。我们把笔画归纳为五类,并用它的“类号”来代表:
第一类(1):从左向右的“横”;
从左下向右上的“挑”;
第二类(2):从上向下的“竖”;
第三类(3):从右上向左下的“撇(点)”;
第四类(4):从左上向右下的“捺(点)”;
第五类(5):所有带“折”的笔画。
这样,任意两个笔画可构成11、12、13......53、54、55共二十五种组合。我们用这些笔画组合的第一笔的类号作为排号,第二笔的类号作为位号,将这些组合分为五排、每排五位,安排在键盘的25个英文字母键上(见附图),并用该字母作为相应组合的代码;剩余的一个英文字母“N”则作为单笔画的代码。
第二个特点是:大多数汉字都是由一些汉字部件(包括成字部件)“拼合”而成的,形成某种“层次”结构。按照它们拼合的相对位置关系,我们把左右或上下拼合的称为“排列型”,内外拼合的称为“包含型”。而不是按上述方式拼合的或非拼合的,则称为“单一型”。
2、汉字明码输入法的编码规则如下:
(1)汉字的编码由三个代码组成。
对拼合而成的汉字,我们按层次把它划分为两部分:排列型汉字用“有字取大字,无字取首层”的规则来定出第一部分。例如,“京”字,从上至下共分为三层,一、二层不构成一个字,因此第一部分就取第一层“亠”;“熹”字则应取“喜”为第一部分,不能取“吉”或“士”。对包含型汉字则从构成“包含”的笔画处,划分为“包”和“被包”两部分,含首笔的为第一部分。在拼合而成的汉字中,若遇到与前一层无关的独立单笔画,则划入下一层。例如,“旧”字,首笔为“|”,应与“日”一起算作一层;而“旦”字的末笔“一”划入下一层后,则单独作为第二部分。
把字分成两部分后,取第一部分的头两笔和第二部分的头两笔及尾两笔(当第二部分的笔画少于四笔时,头两笔及尾两笔可重复取用同一笔画),共得三个“两笔”,其对应的三个代码即是该字的编码。但在包含型的字中,有首、末笔同在第一部分的,如“国、栽、式、区”等字,为保证按笔顺取码,我们将该字的头两笔和尾两笔作为一码和三码,而第二个代码则规定为“N”。
单一型的汉字取头两笔和尾两笔,得到第一个和第二个代码。我们规定:第三个代码同第二个代码。
这样,输入三个码后就可在“提示窗口”中查找所需汉字,并“按号”输入该字(同码字超过十个时需翻页)。汉字的排列顺序是,国标GB2312-80的一级汉字在先、二级汉字在后,而GBK中的其他字则排在最后。
除一级汉字外,每个字后都带有按双拼(代码见附图)标注的读音。
(3)词组的编码是依次取每个字的首码,每词四码。不足四码时,再用最后一字的二码、三码顺序补足。
(4)简码:每个代码都可安排十个以该码为首码的“常用字”,作为简码字;任意两个代码的组合也可安排十个以该组合为前两码的“常用词组”,作为简码词。这样就有大约250多个简码字和2500多个简码词。
(5)用“?”作为查找单字或词组的查询键。
本发明有如下优点:
1,编码用的汉字信息只用了笔画和字型,代码种类少,而且提取规则简单;采用的“两笔组合”按五排、五位规则地分布在键盘上,一目了然,所以易学、易用,较好地解决了大汉字库的汉字输入问题。
2,本输入法的编码方案,若用来作为汉字字典的排序方案,就不会再有读不出音或分不清部首而出现的“难检字”问题,加之非常用字均带有读音,更增加了实用性。这样,可将汉字的输入方法与查字方法合二为一,更有利于这种方法的推广应用。
3,由于采用了“窗口显字,按号输入”的方法,不但安排了250多个简码字和2500多个简码词,而且,因整个编码容量扩大了10倍,能够安排更多的词组,保证各种词组都“应有尽有”,还为用户自己增添需要的专用词组创造了条件,使“以词组输入为主”成为可能。这些都大大地提高了汉字的输入速度。另外,一级汉字基本上都排在首页,对一般文章的输入不会因字库加大而感到不便。
本发明的《代码表》如下:
代码 | A | B | C | D | E | F | G | H | I | J | K | L | M |
笔画 | 45 | 51 | 53 | 43 | 33 | 42 | 41 | 11 | 23 | 12 | 13 | 14 | 15 |
拼音 | a | ian | ao | ang | e | ianguang | in | en | (Zh)i | unün | iu | ou | uanüan |
代码 | N | O | P | Q | R | S | T | U | V | W | X | Y | Z |
笔画 | 单 | 24 | 25 | 35 | 32 | 44 | 31 | 22 | 52 | 34 | 54 | 21 | 55 |
拼音 | an | ouo | ongiong | ei | erie | iaua | eng | (Ch)u | (Sh)u | uiüe | uaiiao | ing | ai |
四、附图说明:明码代码图(附后)
五、具体实施方式:
1,单字:“中”--P J J;
“国”--P N G;
“一”--N N N;
“行”--E H M。
2,词组:“中国”--P P N G;
“计算机”--A T J Q;
“编码规则”--Z K H P;
“刘码输入法”--G K M W。
3,简码:A--被,之,该,证,请,让,谁,评,祝,论;
K J--需要,成功,不要,大概,破坏,区域,
成本,有机,大事,成都。
Claims (5)
1,汉字明码输入法,其特征在于:
(1)根据汉字笔画的书写运笔方向,将笔画分为五类,并用类号表示:
第一类(1):从左向右的“横”,
从左下向右上的“挑”,
第二类(2):从上向下的“竖”,
第三类(3):从右上向左下的“撇和撇点”,
第四类(4):从左上向右下的“捺和捺点”,
第五类(5):所有带“折”的笔画,
这样,任意两笔可构成11、12、13……53、54、55共二十五种组合,再以第一笔的类号为“排号”,第二笔的类号为“位号”,分五排五位有规律地安排在键盘的25个英文字母键上,并以相应字母为代码,剩余一个字母“N”则作为单笔画的代码,其笔画代码表如下:
代码 A B C D E F G H I J K L M
笔画 45 51 53 43 33 42 41 11 23 12 13 14 15
代码 N O P Q R S T U V W X Y Z
笔画 单 24 25 35 32 44 31 22 52 34 54 21 55
汉字分为按左右或上下进行拼合的“排列型”和内外拼合的“包含型”,不是按上述方式拼合或非拼合的汉字则称为“单一型”,
(2)单字的编码规则是:一字三码,对拼合而成的汉字则按层次分成两部分,排列型汉字按“有字取大字,无字取首层”的规则定出第一部分,而包含型汉字则从构成包含结构的笔画处将字分成“包”和“被包”两部分,其中含首笔的为第一部分,在拼合而成的汉字中若遇到与前一层无关的独立单笔画,则划入下一层,然后取第一部分的头两笔和第二部分的头两笔及尾两笔,当第二部分的笔画少于四笔时,头两笔及尾两笔可重复取用同一笔画,这样,相应的三个代码即是该字的编码,但包含型字中首、尾笔同在第一部分的,为保持正确的笔顺,我们取头两笔及尾两笔分别作为第一码和第三码,而第二码规定为“N”,对单一型汉字则取头两笔及尾两笔,得到第一、第二码,而第三码规定同第二码,这样,输入单字三个码后就可在“提示窗口”中查找所需汉字,并“按号”输入该字,
(3)词组的编码规则是:先依次取每个字的第一码,每词四码,不足时,用最后一个字的二码、三码补足。
2,根据权利要求1所述的方法,其特征在于将汉字按国标GB2312-80的一级汉字、二级汉字和GBK中其他汉字的顺序在提示窗口中排列,当同码字超过十个时,则用翻页的方法查找后面的汉字。
3,根据权利要求1所述的方法,其特征在于除国标GB2312-80中的一级汉字外,每个字后都带有双拼注音,其方案是将汉语拼音的韵母经过优化组合后,按分区、分组的方式有序地安排在键盘的26个英文字母键上,得到韵母的双拼代码,除zh、ch、sh分别用i、u、v作代码外,其余声母则与英文字母键一一对应,其双拼代码表如下:
代码 A B C D E F G H I J K L M
拼音 a ian ao ang e
ianguang in en
Zhi
unün iu ou
uanüan
代码 N O P Q R S T U V W X Y Z
拼音 an ouo ongiong ei erie iaua eng Chu Shu uiüe uaiiao ing ai
4,根据权利要求1所述的方法,其特征在于用“?”键作为查询键,可查找单字或词组。
5,根据权利要求1所述的方法,其特征在于每个代码都安排了十个以它为首码的“简码字”,每两个代码组合都安排了十个以该组合为前两码的“简码词”。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 02113741 CN1237436C (zh) | 2002-05-16 | 2002-05-16 | 汉字明码输入法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 02113741 CN1237436C (zh) | 2002-05-16 | 2002-05-16 | 汉字明码输入法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN1458566A CN1458566A (zh) | 2003-11-26 |
CN1237436C true CN1237436C (zh) | 2006-01-18 |
Family
ID=29426434
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN 02113741 Expired - Fee Related CN1237436C (zh) | 2002-05-16 | 2002-05-16 | 汉字明码输入法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN1237436C (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN100430870C (zh) * | 2005-11-20 | 2008-11-05 | 陈清钰 | 夫子码 |
CN104267828A (zh) * | 2014-09-14 | 2015-01-07 | 葛伟刚 | 四位码输入法及键盘 |
CN106776499B9 (zh) * | 2016-12-09 | 2021-02-12 | 哈尔滨工业大学 | 一种数字化汉字拼字实现方法和装置 |
-
2002
- 2002-05-16 CN CN 02113741 patent/CN1237436C/zh not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
CN1458566A (zh) | 2003-11-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN1102714A (zh) | 基于两笔形与两笔符的汉字输入方法及键盘 | |
CN85100837A (zh) | 优化五笔字型编码法及其键盘 | |
CN1237436C (zh) | 汉字明码输入法 | |
CN102750000A (zh) | 双拼王输入法 | |
CN1601451A (zh) | 表意符号的拼写及编码方法 | |
CN1164982C (zh) | 汉字易码输入方法 | |
CN1162767C (zh) | 方圆归类象形码汉字输入法 | |
CN1022350C (zh) | 汉字字母编码输入法 | |
CN1032986C (zh) | 笔顺码计算机汉字输入方法 | |
CN1328282A (zh) | 汉字《天然码》输入方法 | |
CN1069420C (zh) | 文字式音形汉字输入方法 | |
CN1062667C (zh) | 全拼形导码计算机汉字输入方法 | |
CN1142474C (zh) | 字典码汉字输入法 | |
CN1243300C (zh) | 计算机汉字三笔数码输入法 | |
CN1009499B (zh) | 数字拼音式简便汉字编码方法和中型键盘 | |
CN1160243A (zh) | 字形笔顺码汉字输入系统及其键盘 | |
CN1070493A (zh) | 音形字词组合编码 | |
CN1153334A (zh) | 计算机汉字“字块编码”方案 | |
CN1306241A (zh) | 字形笔顺码汉字输入系统及其键盘 | |
CN1049418A (zh) | 统一码计算机汉字键盘输入方法 | |
CN1854999A (zh) | 多用编码 | |
CN1567155A (zh) | 基于软键盘的常用字符和常用词输入方法 | |
CN1416044A (zh) | 计算机汉字三笔码输入法及其键盘 | |
CN1365038A (zh) | 十笔音形码输入方法 | |
CN1114061A (zh) | 韩语世界通 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
C19 | Lapse of patent right due to non-payment of the annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |