CN1945503A - 汉字(结构码)输入法及其装置 - Google Patents

汉字(结构码)输入法及其装置 Download PDF

Info

Publication number
CN1945503A
CN1945503A CN 200610122287 CN200610122287A CN1945503A CN 1945503 A CN1945503 A CN 1945503A CN 200610122287 CN200610122287 CN 200610122287 CN 200610122287 A CN200610122287 A CN 200610122287A CN 1945503 A CN1945503 A CN 1945503A
Authority
CN
China
Prior art keywords
coding
key
chinese character
yards
chinese
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN 200610122287
Other languages
English (en)
Other versions
CN100381985C (zh
Inventor
梁泽民
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to CNB2006101222870A priority Critical patent/CN100381985C/zh
Publication of CN1945503A publication Critical patent/CN1945503A/zh
Application granted granted Critical
Publication of CN100381985C publication Critical patent/CN100381985C/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Document Processing Apparatus (AREA)

Abstract

汉字(结构码)输入法及其装置是一种依据书写顺序和字体分拆的规则,将汉字分解成若干个不同的结构,并根据这些结构的外形特征与通性进行有系统的组合,以此来达到编码及输入汉字目的的中文输入法及装置。本输入法一共选用218个结构并以点(一点、两点、三点、四点)、横(一横、两横、三横)、竖(一竖、两竖、三竖)、折(点折、横折、竖折、撇折、双折)、框(小框、外延框、含横框、含竖框)、连(相连、叉连、双连)、交(横交、竖交、撇捺交、右折交)划分为7部26组,与26个字母键——对应依次排列在键盘上。同时又根据每组结构的外形特征设计一个汉字标识化的符号,使本输入法具有规则简单、编码易记、形象直观、输入快捷等特点。

Description

汉字(结构码)输入法及其装置
技术领域
这是一种依据书写顺序和字体分拆的规则,将汉字分解成若干个不同的笔画结构,并根据这些笔画结构的外形特征与通性进行有系统的组合,以此来达到编码及输入汉字目的的中文输入法。本输入法一共选用218个笔画结构并划分为7部26组,与26个字母键一一对应依次排列在键盘上。同时又根据每组笔画结构的外形特征设计一个汉字标识化的符号,使本输入法具有规则简单、编码易记、形象直观、输入快捷等特点。
背景技术
中文输入的方法大致分为音码、形码和形音码三种,各有各的优点和不足之处。音码以拼音输入法为代表,其特点是编码规则较为简单,但重码多,输入速度慢。形码以五笔王码为代表,其特点是重码少,输入速度较快,但编码规则繁复,除了基本的编码规则外,还有识别码规则以及自相予盾的三级简码系统,而且一个字又允许存在多种编码方式,更为严重的是独树一帜的字根组合方式严重背离了人们长久以来认识和掌握汉字时所形成的习惯,即使编制了助记词,仍然是难学难记。而形音码则结合上述两种方法的长处加以运用,但实际上使得使用者必须同时掌握上述两种编码的方法。不过,尽管如上所述,各种输入法存在着这样或那样的缺陷,它们还不是中文输入方法存在问题的关键所在,中文输入方法存在的关键问题是:每一个使用者必须经过二次学习或者重新温习的过程才能进行中文处理!中文输入的方法能否做到如外文字母输入一样简单、形象、方便和快捷,使每一个已经掌握中文的人不再需要经过二次学习或者只需经过简短的熟悉过程,就能进行中文处理呢?答案是肯定的。
一般来说,汉字是由“横、竖、撇、捺(点)、折”五种笔画组合而成的。不过,从另一个角度来看,汉字其实是由若干个笔画结构以连、交和组合等方式组合而成的。因此,不用笔画而将结构定为构成汉字的最小单位是可行的。虽然这些构成汉字的结构多达几百个,笔画与字形也多种多样、千变万化,但是它们当中存在着多种不同的特征与通性。选用一些合适的、通俗易懂的特征与通性作为标准,对结构进行组合并编码,就是编制输入法的关键所在。本输入法以点(一点、两点、三点、四点)、横(一横、两横、三横)、竖(一竖、两竖、三竖)、折(点折、横折、竖折、撇折、双折)、框(小框、外延框、含横框、含竖框)、连(相连、叉连、双连)、交(横交、竖交、撇捺交、右折交)共7部26组作为区分结构并进行组合编码的标准,是完全依据汉字结构原本固有的特征与通性以及人们长久以来认识和掌握汉字时所形成的习惯总结出来的,通俗易懂,根本不需要进行强迫记忆。除此之外,本输入法的编码规则也十分简单,除了笔顺规范和部件规范之外,没有采用其它辅助编码措施,再加上为每组结构设计了汉字标识化的编码符号,使得本输入法的汉字输入能够做到如外文字母输入一样简单、形象、方便和快捷。
发明内容以及具体实施方式
一、结构编码表的编撰
依据国家现代汉语通用字笔顺规范和国标部件规范的要求,在GB18030字符集中(外文、符号、繁体字和死字除外)选取了7130个汉字进行分拆,确定当中218个笔画结构作为编码结构,一共划分为7部26组,与26个英文字母一一对应,编撰成结构编码表(图1)。具体说明如下:
Figure A20061012228700041
二、编码结构在键盘上的排列顺序
编码结构在键盘上的排列顺序依据易记、就位的原则进行排序,从上到下,从左到右,与26个字母键一一对应(图2)。排列顺序如下:
上行    一点  两点  三点  四点  一横  两横  三横  一竖  两竖  三竖
         Q     W     E     R      T     Y     U     I     O     P
中行    点折  横折  竖折  撇折  双折  小框  外延框  含横框  含竖框
         A     S     D     F      G     H      J       K       L
下行    相连  叉连  双连  横交  竖交  撇捺交  右折交
         Z     X     C     V      B      N      M
三、编码符号的设计
依据每一组结构的外形特征或通性,为每一组的结构设置一个具备汉字特色、简单清晰的编码符号,这些汉字标识化的编码符号使每一组编码结构显得更加形象直观、通俗易记(图3)。具体如下:
一点  两点  三点  四点  一横  两横  三横  一竖  两竖  三竖
丶    冫    氵    灬    一    二    三    丨 
Figure A20061012228700051
     
点折  横折  竖折  撇折  双折  小框  外延框  含横框  含竖框
宀               
Figure A20061012228700054
   口   
Figure A20061012228700055
       日      
Figure A20061012228700056
相连  叉连  双连  横交  竖交  撇捺交  右折交
    乂    
Figure A20061012228700057
  艹   
Figure A20061012228700058
   大      
四、字体分拆的原则
依据国家现代汉语通用字笔顺规范和国标部件规范的要求对字体进行分拆(个别字形、结构例外),具体规定如下:
1、独体的字或结构按笔画顺序进行分拆,以先取的笔画最多、分拆后结构最少为优先;
例:[再]拆作[一 冂 土]
    [四]拆作[冂 儿 一]
    [予]拆作[マ 乛 ]不拆作[乛 丶 乛 ]
    [束]拆作[一 口 小]不拆作[一 口 丨 人]
2、相连或者既相连又相交的字或结构在连接处分拆,或者先拆相连后拆相交;
例:[男]拆作[田 力]
    [关]拆作[ 大]
    [夫]拆作[
Figure A200610122287000510
]           不拆作[二人]
    [无]拆作[一
Figure A200610122287000512
乚]         不拆作[二儿]
    [制]拆作[丿 二 冂 丨 刂]    不拆作[ 一 冂 丨 刂]
3、组合的字或结构按各自的组合进行分拆;
例:[照]拆作[日 刀 口 灬]       [新]拆作[立 ホ 斤]
    [美]拆作[丷 王 大]          [构]拆作[木 勹 厶]
4、个别特殊字体的分拆以保持其结构完整性为优先,即是要兼顾分拆后结构的整体直观。这样的字体有下面几种:
[必]拆作[心 丿]        [兆]拆作[儿 ]
[酉]拆作[西 一]        [酋]拆作[丷 西 一]
[脊]拆作[人
Figure A200610122287000514
月]    [巫]拆作[工 人 人]
[非]拆作[ 三三]     [式]拆作[ 工丶]
[载]拆作[十 车丶]   [噩]拆作[王 口 口 口 口]
[成]拆作[厂  匕 丶]  [方]拆作[亠 勹]
五、字体的编码规则
字体的编码最多取4码,即是“第一码、第二码、第三码、末尾码”,不足4码的补空格键输入,有重码的按其序号用数字键输入。
1、结构编码表内所列结构的编码方法
键位码:每组结构中排第一位的汉字结构,用一位其所在的键位字母进行编码。具体如下:
文 人 心 火 一 工 王 (我) 儿 小 之 了 (的) 月 几 口 西 日 由 夕 又 乡 也 手 大 金
Q  W  E  R  T  Y  U  I    O  P  A  S  D    F  G  H  J  K  L  Z  X  C  V  B  N  M
注:键位码汉字一共24个,“我”和“的”只是高频字,不是键位码汉字。因为它们分拆后有4码,会影响输入速度,所以就用“我”的首笔和“的”的声母分别放在“I”和“D”的键位上。它们可用作词组的编码,但不能用作字的编码。
汉字结构码:每组结构中除去第一位汉字之外余下的汉字结构,根据拆字原则进行编码,除已满足4码的之外,一律补一位其所在的键位码,以显示其与所在键位的关系。
例:[米]拆作[丷木]+键位码      [贝]拆作[冂人]+键位码
        编码[w n]+r=wnr           编码[d w]+d=dwd
    [雨]拆作[一冂丨丶]         [虫]拆作[口丨一丶]
        编码[t d i q]=tdiq        编码[h i t q]=hitq
非汉字结构码:每组结构中非汉字的结构,用4位其所在的键位字母进行编码。
例:[亠]编码qqqq    [ナ]编码tttt    [彳]编码pppp
    [辶]编码aaaa    [廴]编码gggg    [钅]编码mmmm
2、结构编码表外其余字体的编码方法
汉字:根据拆字原则和编码规则进行编码。
例:[回]拆作[冂口一]      [方]拆作[亠勹]
        编码dht               编码qf
    [巨]拆作[一コ乚]      [产]拆作[ 厂]
        编码tsd               编码et
    [幽]拆作[丨幺幺凵]    [假]拆作[亻
Figure A20061012228700062
二又]
        编码iccd              编码ojyx
非汉字:未纳入结构编码表内的非汉字结构,根据拆字原则进行编码后,不足4码的用其末尾码补足4码。
例:[]拆作[丿 ]+两位末尾码    [爫]拆作[丿 ]+两位末尾码编码[i b]+bb=ibbb             编码[i e]+ee=ieee[]拆作[小丶]+两位末尾码      [丩]拆作[ 丨]+两位末尾码
        编码[p q]+qq=pqqq             编码[i i]+ii=iiii
六、词组的编码规则
词组的编码最多取4码,不足4码的补空格键输入,有重码的按其序号用数字键输入。方法如下:
二字词组:取每个字的前两码进行编码。
例:[中国]
[hi duqt]=hidu
三字词组:取前两个字的第一码和第三个字的前两码进行编码;
例:[记 事 簿]
[qsd thsi zetb]=qtze
四字或以上词组:取前三个字的第一码和最后一个字的第一码进行编码。
例:[汉语词组]            [更上一层楼]
[ex quh qsth ck]=eqqc    [tkx iti t jyc nrx]=titn
注:当词组中全部或部分的字是属于键位码字时,它的组词编码就是其本身的键位码。
例:[人口]            [家人]
    [w h]=wh         [ap w]=apw
    [大日子]          [火山口]
    [n k st]=nkst    [r idd h]=rih
七、其它需要说明的事项
1、关于笔顺规范与部件规范的矛盾:一些字在这两个规范里的规定是互相矛盾的,只能在尽量减少重码的情况下选择其一运用。
例:[束]笔顺规范=[一口丨人]
        部件规范=[木口]
        采    用=[一口小](如按部件规范就和“杏”重码)
    [回]笔顺规范=[冂口一]
        部件规范=[口口]
        采    用=[冂口一](如按部件规范就和“吕”重码)
2、关于笔顺规范与形象直观的矛盾:一些字或结构如果严格按照笔顺规范的要求,就会被拆得很散。为了兼顾它们的完整性,只好牺牲一下笔顺规范的要求。
例:[必]笔顺规范=[丶乚丶丿丶]    [式]笔顺规范=[一工乚丶]
        采    用=[心丿]              采    用=[
Figure A20061012228700071
工丶]
3、关于单一的编码规则与重码的矛盾:编码规则的繁简与重码的多少是一对矛盾对立体,编码规则越繁复,重码就会相对减少;编码规则越单一,重码就会相对增加。本输入法较成功地平衡了这两者的关系,做到编码规则单一,重码相对较少。对7130个字体编码后进行的统计,二字重码有450个左右,三字重码有70个,四字重码有14个,五字重码有1个。但是,在剔除了生僻字与生僻字、生僻字与常用字的重码之后,常用字与常用字的重码在200个左右,对输入的速度影响不大。
附图说明
图1:结构编码表;
图2:结构编码键位图;
图3:编码符号键位图。

Claims (6)

1、这是一种以汉字笔画结构进行编码的中文输入法,其特点是依据书写顺序和字体分拆的规则,将汉字分解成若干个不同的结构,并根据这些结构的外形特征进行有系统的组合,以此来达到编码及输入汉字的目的。
按照上述原理,这些结构组合一共划分为7部26组,与26个英文字母一一对应。具体划分如下:
(1)、点部(一点、两点、三点、四点);      (2)、横部(一横、两横、三横);
(3)、竖部(一竖、两竖、三竖);            (4)、折部(点折、横折、竖折、撇折、双折);
(5)、框部(小框、外延框、含横框、含竖框);(6)、连部(相连、叉连、双连);
(7)、交部(横交、竖交、撇捺交、右折交)。
依照键盘三行字母键的位置,将点部、横部、竖部共10组从左到右依次排列在上面一行的字母键上;将折部、框部共9组从左到右依次排列在中间一行的字母键上;将连部、交部共7组从左到右依次排列在下面一行的字母键上。
依据每一组结构的外形特征或通性,为每一组的结构设置一个具备汉字特色、简单清晰的编码符号。
2、根据权利要求第1项,编成结构编码表(图1)、结构编码键位图(图2)和编码符号键位图(图3)。
3、根据权利要求第1项,字体分拆的原则是依据国家现代汉语通用字笔顺规范和国标部件规范的要求进行分拆(个别字形、结构例外)。具体规定如下:
(1)、独体的字或结构按笔画顺序进行分拆,以先取的笔画最多、分拆后结构最少为优先;
(2)、相连或者既相连又相交的字或结构在连接处分拆,或者先拆相连后拆相交;
(3)、组合的字或结构按各自的组合进行分拆;
(4)、个别特殊字体的分拆以保持其结构完整性为优先。
4、根据权利要求第1、2、3项,本输入法的汉字编码最多取4码,即是“第一码、第二码、第三码、末尾码”,不足4码的补空格键输入,有重码的按其序号用数字键输入。
(1)、结构编码表内所列结构的编码方法
1)、键位码:就是每组结构中排第一位的汉字结构,用一位其所在的键位字母进行编码;
2)、汉字结构编码:就是每组结构中除去第一位汉字之外余下的汉字结构,根据拆字原则进行编码,除已满足4码的之外,一律补一位其所在的键位码;
3)、非汉字结构编码:就是每组结构中非汉字的结构,用4位其所在的键位字母进行编码。
(2)、结构编码表外其余字体的编码方法
1)、汉字:根据拆字原则和编码规则进行编码;
2)、非汉字:就是未纳入结构编码表内的非汉字结构,根据拆字原则进行编码后,不足4码的用其末尾码补足4码。
5、根据权利要求第1、3、4项,本输入法词组的编码最多取4码,不足4码的补空格键输入,有重码的按其序号用数字键输入。方法如下:
(1)、二字词组:取每个字的前两码进行编码;
(2)、三字词组:取前两个字的第一码和第三个字的前两码进行编码;
(3)、四字或以上词组:取前三个字的第一码和最后一个字的第一码进行编码。
(4)、词组当中全部或部分的字是属于键位码字时,它的组词编码就是其本身的键位码。
6、基于利用上述之全部或部分的方法,对汉字和汉字词组进行编撰的编码,适用于一切中文信息处理装置,同时也适用于编纂字典和教材出版物。
CNB2006101222870A 2006-09-20 2006-09-20 一种新的以汉字笔画结构进行编码的中文输入法 Expired - Fee Related CN100381985C (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CNB2006101222870A CN100381985C (zh) 2006-09-20 2006-09-20 一种新的以汉字笔画结构进行编码的中文输入法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CNB2006101222870A CN100381985C (zh) 2006-09-20 2006-09-20 一种新的以汉字笔画结构进行编码的中文输入法

Publications (2)

Publication Number Publication Date
CN1945503A true CN1945503A (zh) 2007-04-11
CN100381985C CN100381985C (zh) 2008-04-16

Family

ID=38044931

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB2006101222870A Expired - Fee Related CN100381985C (zh) 2006-09-20 2006-09-20 一种新的以汉字笔画结构进行编码的中文输入法

Country Status (1)

Country Link
CN (1) CN100381985C (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102122209A (zh) * 2010-12-17 2011-07-13 北京中易中标电子信息技术有限公司 汉字小键盘笔画字编码方法
CN102508559A (zh) * 2011-11-13 2012-06-20 陈海华 数字化汉字计算机输入系统
CN103425261A (zh) * 2013-06-13 2013-12-04 吴礼明 复合码元数字键盘形码中文输入法
CN112083813A (zh) * 2019-10-25 2020-12-15 钱文威 一种汉字输入法

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1144931A (zh) * 1995-09-07 1997-03-12 左全安 一种计算机汉字输入方法及键盘
CN1584812A (zh) * 2004-06-15 2005-02-23 高永贤 北极星汉字输入法
CN1687876B (zh) * 2005-05-12 2010-04-28 陈子勇 一种计算机汉字输入法及其键盘

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102122209A (zh) * 2010-12-17 2011-07-13 北京中易中标电子信息技术有限公司 汉字小键盘笔画字编码方法
CN102508559A (zh) * 2011-11-13 2012-06-20 陈海华 数字化汉字计算机输入系统
CN103425261A (zh) * 2013-06-13 2013-12-04 吴礼明 复合码元数字键盘形码中文输入法
CN103425261B (zh) * 2013-06-13 2016-09-07 吴礼明 复合码元数字键盘形码中文输入法
CN112083813A (zh) * 2019-10-25 2020-12-15 钱文威 一种汉字输入法
CN112083813B (zh) * 2019-10-25 2024-06-14 钱文威 一种汉字输入法

Also Published As

Publication number Publication date
CN100381985C (zh) 2008-04-16

Similar Documents

Publication Publication Date Title
CN1945503A (zh) 汉字(结构码)输入法及其装置
CN1141633C (zh) 计算机二十四部首汉字排序输入法
CN1147777C (zh) 计算机汉字输入方法
CN101055502A (zh) 一种汉字快笔输入法
CN1435749A (zh) 汉字笔音码输入法及键盘
CN1081004A (zh) 汉字结构笔顺数字编码方法
CN1293452C (zh) 一种见字即识形码也可使用音码的汉字键盘输入方法
CN1137432C (zh) 快易码汉字输入法
CN1138197C (zh) 十笔字型形音码输入方法
CN1277171C (zh) 和码汉字数字输入法
CN101034319A (zh) 汉字输入方法及其专用键盘
CN1584804A (zh) 数字键盘汉字输入法
CN1598743A (zh) 按规范笔顺输入汉字的输入法及其键盘
CN1395160A (zh) 十笔字型输入方法
CN1167994C (zh) 一二三四输入法
CN1932740A (zh) 五加加汉字输入法
CN101620470A (zh) 双码三笔汉字输入法
CN1201220C (zh) 核心码计算机输入法
CN1195263C (zh) 一种快易通汉字输入方法
CN1866173A (zh) 一种简明易学的中、英、韩文十码键输入法
CN1710523A (zh) 一种汉字关系部件码键盘输入系统
CN1150271A (zh) 通用字元汉字排检、输入法及键盘
CN1538278A (zh) 一种数码汉字输入法及其键盘
CN1945505A (zh) 一种计算机笔形字根编码汉字输入方法
CN1165334A (zh) 大字符集简笔汉字输入法及其键盘

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C17 Cessation of patent right
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20080416

Termination date: 20120920