CN1237436C - 汉字明码输入法 - Google Patents

汉字明码输入法 Download PDF

Info

Publication number
CN1237436C
CN1237436C CN 02113741 CN02113741A CN1237436C CN 1237436 C CN1237436 C CN 1237436C CN 02113741 CN02113741 CN 02113741 CN 02113741 A CN02113741 A CN 02113741A CN 1237436 C CN1237436 C CN 1237436C
Authority
CN
China
Prior art keywords
code
chinese character
chinese
character
word
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN 02113741
Other languages
English (en)
Other versions
CN1458566A (zh
Inventor
刘永安
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to CN 02113741 priority Critical patent/CN1237436C/zh
Publication of CN1458566A publication Critical patent/CN1458566A/zh
Application granted granted Critical
Publication of CN1237436C publication Critical patent/CN1237436C/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Document Processing Apparatus (AREA)

Abstract

本发明为针对GBK大汉字库的汉字《明码》输入法,是按汉字字型来取笔画进行编码的形码输入法。其规则如下:(1)把笔画分为五类,任意两笔共可构成25种组合,按笔画的类号分为五排五位,安排在键盘的25个英文键上,并以该字母为代码。(2)汉字的编码为“一字三码”。按汉字拼合的层次结构,将其分为“排列型”、“包含型”和“单一型”。前两种字型应“自然地”划分为两部分,然后取第一部分的头两笔和第二部分的头两笔及尾两笔,即可得该字的三个编码。而单一型字则取头两笔和尾两笔,得到一、二码,第三码同第二码。除一级汉字外,每个字后都带有双拼注音。(3)词组的编码规则:顺序取每个字的第一码,一词四码,不足时用末字的二码、三码补足。

Description

汉字明码输入法
一、技术领域:
本发明与计算机的汉字输入方法有关,是采用汉字的笔画进行编码的方法来输入汉字,是一种形码输入法。
二、背景技术:
现有的汉字输入法,绝大多数都是针对国标GB2312-80中的6763个汉字进行编码的,对于GBK大汉字库的输入法则很少,而且,多因输入规则复杂或生僻汉字读音难,实际使用很困难。
本发明的目的是提供一种编码信息少而易取的、编码规则简单而易于掌握的形码输入法,用来既能解决GBK大汉字库的汉字输入,又不影响GB2312-80中的汉字及其词汇的正常输入。
三、发明内容:
1、汉字的特点:
第一个特点:汉字是由若干笔画组合而成的。我们把笔画归纳为五类,并用它的“类号”来代表:
第一类(1):从左向右的“横”;
           从左下向右上的“挑”;
第二类(2):从上向下的“竖”;
第三类(3):从右上向左下的“撇(点)”;
第四类(4):从左上向右下的“捺(点)”;
第五类(5):所有带“折”的笔画。
这样,任意两个笔画可构成11、12、13......53、54、55共二十五种组合。我们用这些笔画组合的第一笔的类号作为排号,第二笔的类号作为位号,将这些组合分为五排、每排五位,安排在键盘的25个英文字母键上(见附图),并用该字母作为相应组合的代码;剩余的一个英文字母“N”则作为单笔画的代码。
第二个特点是:大多数汉字都是由一些汉字部件(包括成字部件)“拼合”而成的,形成某种“层次”结构。按照它们拼合的相对位置关系,我们把左右或上下拼合的称为“排列型”,内外拼合的称为“包含型”。而不是按上述方式拼合的或非拼合的,则称为“单一型”。
2、汉字明码输入法的编码规则如下:
(1)汉字的编码由三个代码组成。
对拼合而成的汉字,我们按层次把它划分为两部分:排列型汉字用“有字取大字,无字取首层”的规则来定出第一部分。例如,“京”字,从上至下共分为三层,一、二层不构成一个字,因此第一部分就取第一层“亠”;“熹”字则应取“喜”为第一部分,不能取“吉”或“士”。对包含型汉字则从构成“包含”的笔画处,划分为“包”和“被包”两部分,含首笔的为第一部分。在拼合而成的汉字中,若遇到与前一层无关的独立单笔画,则划入下一层。例如,“旧”字,首笔为“|”,应与“日”一起算作一层;而“旦”字的末笔“一”划入下一层后,则单独作为第二部分。
把字分成两部分后,取第一部分的头两笔和第二部分的头两笔及尾两笔(当第二部分的笔画少于四笔时,头两笔及尾两笔可重复取用同一笔画),共得三个“两笔”,其对应的三个代码即是该字的编码。但在包含型的字中,有首、末笔同在第一部分的,如“国、栽、式、区”等字,为保证按笔顺取码,我们将该字的头两笔和尾两笔作为一码和三码,而第二个代码则规定为“N”。
单一型的汉字取头两笔和尾两笔,得到第一个和第二个代码。我们规定:第三个代码同第二个代码。
这样,输入三个码后就可在“提示窗口”中查找所需汉字,并“按号”输入该字(同码字超过十个时需翻页)。汉字的排列顺序是,国标GB2312-80的一级汉字在先、二级汉字在后,而GBK中的其他字则排在最后。
除一级汉字外,每个字后都带有按双拼(代码见附图)标注的读音。
(3)词组的编码是依次取每个字的首码,每词四码。不足四码时,再用最后一字的二码、三码顺序补足。
(4)简码:每个代码都可安排十个以该码为首码的“常用字”,作为简码字;任意两个代码的组合也可安排十个以该组合为前两码的“常用词组”,作为简码词。这样就有大约250多个简码字和2500多个简码词。
(5)用“?”作为查找单字或词组的查询键。
本发明有如下优点:
1,编码用的汉字信息只用了笔画和字型,代码种类少,而且提取规则简单;采用的“两笔组合”按五排、五位规则地分布在键盘上,一目了然,所以易学、易用,较好地解决了大汉字库的汉字输入问题。
2,本输入法的编码方案,若用来作为汉字字典的排序方案,就不会再有读不出音或分不清部首而出现的“难检字”问题,加之非常用字均带有读音,更增加了实用性。这样,可将汉字的输入方法与查字方法合二为一,更有利于这种方法的推广应用。
3,由于采用了“窗口显字,按号输入”的方法,不但安排了250多个简码字和2500多个简码词,而且,因整个编码容量扩大了10倍,能够安排更多的词组,保证各种词组都“应有尽有”,还为用户自己增添需要的专用词组创造了条件,使“以词组输入为主”成为可能。这些都大大地提高了汉字的输入速度。另外,一级汉字基本上都排在首页,对一般文章的输入不会因字库加大而感到不便。
本发明的《代码表》如下:
  代码   A   B   C   D   E   F   G   H   I   J   K   L   M
  笔画   45   51   53   43   33   42   41   11   23   12   13   14   15
拼音 a ian ao ang e   ianguang in en   (Zh)i   unün iu ou   uanüan
  代码   N   O   P   Q   R   S   T   U   V   W   X   Y   Z
  笔画   单   24   25   35   32   44   31   22   52   34   54   21   55
拼音 an   ouo   ongiong ei   erie   iaua eng   (Ch)u   (Sh)u   uiüe   uaiiao ing ai
四、附图说明:明码代码图(附后)
五、具体实施方式:
1,单字:“中”--P J J;
         “国”--P N G;
         “一”--N N N;
         “行”--E H M。
2,词组:“中国”--P P N G;
         “计算机”--A T J Q;
         “编码规则”--Z K H P;
         “刘码输入法”--G K M W。
3,简码:A--被,之,该,证,请,让,谁,评,祝,论;
         K J--需要,成功,不要,大概,破坏,区域,
             成本,有机,大事,成都。

Claims (5)

1,汉字明码输入法,其特征在于:
(1)根据汉字笔画的书写运笔方向,将笔画分为五类,并用类号表示:
第一类(1):从左向右的“横”,
           从左下向右上的“挑”,
第二类(2):从上向下的“竖”,
第三类(3):从右上向左下的“撇和撇点”,
第四类(4):从左上向右下的“捺和捺点”,
第五类(5):所有带“折”的笔画,
这样,任意两笔可构成11、12、13……53、54、55共二十五种组合,再以第一笔的类号为“排号”,第二笔的类号为“位号”,分五排五位有规律地安排在键盘的25个英文字母键上,并以相应字母为代码,剩余一个字母“N”则作为单笔画的代码,其笔画代码表如下:   代码 A B C D E F G H I J K L M   笔画 45 51 53 43 33 42 41 11 23 12 13 14 15   代码 N O P Q R S T U V W X Y Z   笔画 24 25 35 32 44 31 22 52 34 54 21 55
汉字分为按左右或上下进行拼合的“排列型”和内外拼合的“包含型”,不是按上述方式拼合或非拼合的汉字则称为“单一型”,
(2)单字的编码规则是:一字三码,对拼合而成的汉字则按层次分成两部分,排列型汉字按“有字取大字,无字取首层”的规则定出第一部分,而包含型汉字则从构成包含结构的笔画处将字分成“包”和“被包”两部分,其中含首笔的为第一部分,在拼合而成的汉字中若遇到与前一层无关的独立单笔画,则划入下一层,然后取第一部分的头两笔和第二部分的头两笔及尾两笔,当第二部分的笔画少于四笔时,头两笔及尾两笔可重复取用同一笔画,这样,相应的三个代码即是该字的编码,但包含型字中首、尾笔同在第一部分的,为保持正确的笔顺,我们取头两笔及尾两笔分别作为第一码和第三码,而第二码规定为“N”,对单一型汉字则取头两笔及尾两笔,得到第一、第二码,而第三码规定同第二码,这样,输入单字三个码后就可在“提示窗口”中查找所需汉字,并“按号”输入该字,
(3)词组的编码规则是:先依次取每个字的第一码,每词四码,不足时,用最后一个字的二码、三码补足。
2,根据权利要求1所述的方法,其特征在于将汉字按国标GB2312-80的一级汉字、二级汉字和GBK中其他汉字的顺序在提示窗口中排列,当同码字超过十个时,则用翻页的方法查找后面的汉字。
3,根据权利要求1所述的方法,其特征在于除国标GB2312-80中的一级汉字外,每个字后都带有双拼注音,其方案是将汉语拼音的韵母经过优化组合后,按分区、分组的方式有序地安排在键盘的26个英文字母键上,得到韵母的双拼代码,除zh、ch、sh分别用i、u、v作代码外,其余声母则与英文字母键一一对应,其双拼代码表如下:   代码 A B C D E F G H I J K L M   拼音 a ian ao ang e   ianguang in en   Zhi   unün iu ou   uanüan   代码 N O P Q R S T U V W X Y Z 拼音 an ouo ongiong ei erie iaua eng Chu Shu uiüe uaiiao ing ai
4,根据权利要求1所述的方法,其特征在于用“?”键作为查询键,可查找单字或词组。
5,根据权利要求1所述的方法,其特征在于每个代码都安排了十个以它为首码的“简码字”,每两个代码组合都安排了十个以该组合为前两码的“简码词”。
CN 02113741 2002-05-16 2002-05-16 汉字明码输入法 Expired - Fee Related CN1237436C (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN 02113741 CN1237436C (zh) 2002-05-16 2002-05-16 汉字明码输入法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN 02113741 CN1237436C (zh) 2002-05-16 2002-05-16 汉字明码输入法

Publications (2)

Publication Number Publication Date
CN1458566A CN1458566A (zh) 2003-11-26
CN1237436C true CN1237436C (zh) 2006-01-18

Family

ID=29426434

Family Applications (1)

Application Number Title Priority Date Filing Date
CN 02113741 Expired - Fee Related CN1237436C (zh) 2002-05-16 2002-05-16 汉字明码输入法

Country Status (1)

Country Link
CN (1) CN1237436C (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100430870C (zh) * 2005-11-20 2008-11-05 陈清钰 夫子码
CN104267828A (zh) * 2014-09-14 2015-01-07 葛伟刚 四位码输入法及键盘
CN106776499B9 (zh) * 2016-12-09 2021-02-12 哈尔滨工业大学 一种数字化汉字拼字实现方法和装置

Also Published As

Publication number Publication date
CN1458566A (zh) 2003-11-26

Similar Documents

Publication Publication Date Title
CN1102714A (zh) 基于两笔形与两笔符的汉字输入方法及键盘
CN85100837A (zh) 优化五笔字型编码法及其键盘
CN1237436C (zh) 汉字明码输入法
CN102750000A (zh) 双拼王输入法
CN1601451A (zh) 表意符号的拼写及编码方法
CN1164982C (zh) 汉字易码输入方法
CN1162767C (zh) 方圆归类象形码汉字输入法
CN1022350C (zh) 汉字字母编码输入法
CN1032986C (zh) 笔顺码计算机汉字输入方法
CN1328282A (zh) 汉字《天然码》输入方法
CN1069420C (zh) 文字式音形汉字输入方法
CN1062667C (zh) 全拼形导码计算机汉字输入方法
CN1142474C (zh) 字典码汉字输入法
CN1243300C (zh) 计算机汉字三笔数码输入法
CN1009499B (zh) 数字拼音式简便汉字编码方法和中型键盘
CN1160243A (zh) 字形笔顺码汉字输入系统及其键盘
CN1070493A (zh) 音形字词组合编码
CN1153334A (zh) 计算机汉字“字块编码”方案
CN1306241A (zh) 字形笔顺码汉字输入系统及其键盘
CN1049418A (zh) 统一码计算机汉字键盘输入方法
CN1854999A (zh) 多用编码
CN1567155A (zh) 基于软键盘的常用字符和常用词输入方法
CN1416044A (zh) 计算机汉字三笔码输入法及其键盘
CN1365038A (zh) 十笔音形码输入方法
CN1114061A (zh) 韩语世界通

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C19 Lapse of patent right due to non-payment of the annual fee
CF01 Termination of patent right due to non-payment of annual fee