CN1123819C - 计算机汉字键位码输入方法 - Google Patents

计算机汉字键位码输入方法 Download PDF

Info

Publication number
CN1123819C
CN1123819C CN 98122871 CN98122871A CN1123819C CN 1123819 C CN1123819 C CN 1123819C CN 98122871 CN98122871 CN 98122871 CN 98122871 A CN98122871 A CN 98122871A CN 1123819 C CN1123819 C CN 1123819C
Authority
CN
China
Prior art keywords
stroke
strokes
combination
characters
radicals
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN 98122871
Other languages
English (en)
Other versions
CN1223398A (zh
Inventor
张耀峰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to CN 98122871 priority Critical patent/CN1123819C/zh
Publication of CN1223398A publication Critical patent/CN1223398A/zh
Application granted granted Critical
Publication of CN1123819C publication Critical patent/CN1123819C/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Abstract

本发明公开了一种计算机汉字键位码输入方法,该方法将键盘设计成六个区,每个区包含有横、竖、撇、点、折五个键位,将汉字用取部首的方法拆分成部首和非部首部分,根据每部分的头部和尾部要素并按排列顺序拆分成起笔码、部首码、结构码、补位码四个码,该方法能对汉字要素定性定量,并使汉字具有序性。非专业人员均能轻易掌握,初学者经短时间的学习,便能基本掌握这一输入方法。

Description

计算机汉字键位码输入方法
本发明涉及用于将要处理的数据转变成为计算机能够处理的形式的输入装置,更具体地涉及一种计算机汉字键位码输入方法。
现有汉字编码方案按类别可主要分为音码类、形码类、音形混合类。
音码类归范易学,与汉字识字教育保持一致,其键符安排借用英文键位、序性好、能与汉字检索保持一致,能直接翻页检索,对读得准音的字输入较方便。由于声母与韵母组合实际使用号码数只有几百种,故重码字较多,但能通过翻页的方式逐字查找、码长最多可达六位,虽能用缩位方式解决,实际输入速度较慢,但初学者易上手。
形码类一般按字根块组合归类、采用不等长码,码长取全为四位,无汉字键位系统,故字根组合形式多变,且多为专门设计,不能对所选取的汉字要素进行严格的定性定量故规范性差,但重码率较低,对专业人员或熟练掌握者输入速度较快。对一般学习者而言,学习难度较大,且学后易忘。不易与汉字识字教育保持一致,属难学易用型。
音形混合类是一类集音码和形码于一体的混合式的汉字编码方法。此类编码将音码及形码要素进行提炼归类并加以压缩,其用意既考虑音码的规范,又顾及形码的难学,码长一般取三至四位,重码率较低。采用此类方案的目的是为了降低重码率和减轻学习难度。这类编码与形码相比,学习难度有所降低,与音码相比其规范性则受到了破坏,而对于普通学习者来说,学习难度仍然较大。
本发明的目的是针对上述诸种计算机输入方法存在的缺点,提出一种计算机汉字键位码输入方法。
为了实现上述目的,本发明采用如下技术方案,该输入方法包括以下步骤:
a,
将计算机通用键盘分成六个区,即上横区、右竖区、左撇区、下点区、交折区、独单区,每个区包含有横、竖、撇、点、折五个笔形位,上横区与下点区、左撇区与右竖区、交折区与独单区均为相互对应区,键盘上每个键位上包含英文字母或符号、笔形区间、位置区间、笔形位四个要素,
其中,上横区包括键位Q、W、E、R、T,键位Q、W、E、R、T与笔形位“折、点、撇、竖、横相对应,
右竖区包括键位Y、U、I、O、P,键位Y、U、I、O、P与笔形位“横、竖、撇、点、折”相对应,
左撇区包括键位A、S、D、F、G,键位A、S、D、F、G与笔形位“折、点、撇、竖、横”相对应,
下点区包括键位H、J、K、L、:,键位H、J、K、L、:与笔形位”横、竖、撇、点、折相对应,
交折区包括键位Z、X、C、V、B,键位Z、X、C、V、B与笔形位“折、点、撇、竖、横”相对应,
独单区包括键位N、M、<、>、?;独单区键位N、M、<、>、?与笔形位“横、竖、撇、点、折”相对应;
b,
将汉字用取部首的方法拆分成部首和非部首部分,根据每部分的头部和尾部要素并按排列顺序拆分成起笔码、部首码、结构码、补位码四个码,
起笔码由笔形区间和笔形位决定,起笔码的笔形区间由部首或非部首部分先写第一笔决定区,笔形位是先写部分连续笔形的第二笔,当起笔码无法取连续笔形时,则为单区间和先写部分的第一笔笔形,
部首码由部首位置区间和笔形位决定,部首码的区间由部首和非部首所在位置决定区,笔形位由部首的末笔笔形决定,
其中,部首码位置区间确定的顺序为取大为先,依次以如下顺序,
部首字——全包围——半包围——占边——被包围——占角——整部件——部件局部——起笔,当汉字均为部首且相等时,非成字部件为先、多部件的留字为先;均为成字部件或均为非成字部件的,先写为先,每个汉字只能确定一个部首;
在一码中,笔形只能分别取自部首与非部首的单一部分,无法取全连续两笔笔形时,则取单笔笔形,从单区中取笔形位,如已无笔形时则该码不取,
在取连续两笔笔形时,第一笔为笔形区,第二笔为笔形位,
当字的起笔部分为部首时,非部首部分的起笔部分为补位码,起笔部分为非部首部分时,则部首部分的起笔部分为补位码;
在取码时,已经用过的笔形不能再次取用,若取不出笔形时,则该码不取;
部首字的结构码关系为按整字的结构关系分,含部首字的结构码关系为去掉字的部首部分的全部笔形后,汉字的剩余部分所存在的结构关系;
结构码由结构位置区间和笔形位决定,结构码的结构位置区间由去除部首部分后的末笔笔形部分的结构决定区,笔形位由该结构部分的末笔笔形决定,所说的结构码的末笔笔形与其它笔划产生相交时,则该码应在其相对应区取笔形位;
补位码由笔形区间和笔形位决定,所说补位码笔形区间由部首或非部首部分后写第一笔决定区,笔形位由该后写部分的连续第二笔笔形决定,当补位码无法取连续笔形时,则为单区间和后写部分的第一笔笔形,补位码的末笔笔形与其它笔划产生相交时,则该码应在其相对应区取笔形位;
在一码中,笔形只能分别取自部首与非部首的单一部分,无法取全连续两笔笔形时,则取单笔笔形,从单区中取笔形位,如已无笔形时则该码不取;
在取连续两笔笔形时,第一笔为笔形区,第二笔为笔形位;
当字的起笔部分为部首部分时,非部首部分的起笔部分为补位码,起笔部分为非部首部分时,则部首部分的起笔部分为补位码;
在取码时,已经用过的笔形不能再次取用,若取不出笔形时,则该码不取;
部首字的结构码关系为按整字的结构关系分,含部首字的结构码关系为去掉字的部首部分的全部笔形后,汉字的剩余部分所存在的结构关系;
每个码相对应于通用键盘上的一个键位,不足四码的则可取起笔码、部首码、结构码、补位码四码中的任何一至三个码;
c,
当所要输入的汉字为两个字的词组时,则分别取第一个字的起笔码、结构码和第二个字的起笔码和结构码,
当所要输入的汉字为三个字的词组时,则分别取第一个字的起笔码、结构码、第二个字的起笔码、第三个字的起笔码,
当所要输入的汉字为四个字或四个以上字的词组时,则分别取第一个字的起笔码、第二个字的起笔码、第三个字的起笔码、末尾字的起笔码;
e,
在计算机通用键盘上输入与所要输入汉字或词组的相对应的码。
显然,由于本发明采用了上述的技术方案,将计算机通用键盘设计成六个区,每个区包含有横、竖、撇、点、折五个键位,将汉字用取部首的方法拆分成部首和非部首部分,根据每部分的头部和尾部要素并按排列顺序拆分成起笔码、部首码、结构码、补位码四个码,每一个码由笔形区间或位置区间与笔形位两个要素组成,能对汉字要素定性定量,并使汉字具有序性。不仅能对全部简体字、词编码,用同样方法,还能对全部繁体字或大字符集进行编码,使汉字在编码、资料检索,字、词典编纂,教学等诸领域实现应用一体化,既能按键位的方式进行操作,也能用序性的方式直接翻页进行检索。此外,所采用的汉字信息要素、汉字的拆分均以拆部首的方式处理的,对笔形、笔顺的处理国家已作了规范。所以非专业人员均能轻易掌握,一般具备小学三年级文化程度者经短时间的学习,便能基本掌握这一输入方法。
下面结合附图和实施例,对本发明作一较为详细地说明:
图1为本发明键盘A至?共30个键位对照示意图。
图2为本发明简码键位对照示意图。
图3为利用本发明的方法进行单字汉字编码示例表。
图4为利用本发明的方法进行词组汉字编码示例表。
图5为本发明数字键盘键位对照示意图。
图6为利用本发明的方法进行汉字检索序性图。
请参阅图1所示,本发明首先将计算机通用键盘分成六个区,即上横区、右竖区、左撇区、下点区、交折区、独单区,每个区包含有横、竖、撇、点、折五个笔形位,键盘上每个键位上包含英文字母或符号、笔形区间、位置区间、笔形位四个要素,左上角为英文字母或符号,右上角为笔形区间,左下角为位置区间,右下角为笔形位。所说的通用键盘的上横区包括键位Q、W、E、R、T,下点区包括键位H、J、K、L、:,左撇区包括键位A、S、D、F、G,右竖区包括键位Y、U、I、O、P,交折区包括键位Z、X、C、V、B,独单区包括键位N、M、<、>、?。
所说的上横区键位Q、W、E、R、T与笔形位“折、点、撇、竖、横相对应,下点区键位H、J、K、L、:与笔形位”横、竖、撇、点、折相对应,左撇区键位A、S、D、F、G与笔形位“折、点、撇、竖、横”相对应,右竖区键位Y、U、I、O、P与笔形位“横、竖、撇、点、折”相对应,交折区键位Z、X、C、V、B与笔形位“折、点、撇、竖、横”相对应,独单区键位N、M、<、>、?与笔形位“横、竖、撇、点、折”相对应。
也就是说,每个区均由五个笔形位组成。五个笔形位分别由横、竖、撇、点、折五种笔形。
笔形位排列的规律按横、竖、撇、点、折顺序从键位对照图的中间向两边排列。位置区间按汉字的结构特性和所在方位排列。分上区、下区、左区、右区、交围区、独区。六个位置区间用符号表示为:左区 右区 上区 下区
Figure C9812287100094
交(围〕区“◎”、独区“●”。
笔形区间按笔形顺序从左到右,从上到下排列,分横区、竖区、撇区、点区、折区、单区(取单笔笔形时用)。六个笔形区间用符号表示为:横区(一)竖区(丨)、撇区(丿)、点区(丶)、折区(フ)、单区(●)。
位置区间与笔形区间互为并列关系、即横与上、竖与右、撇与左、点与下、折与交(围)、单与独。
当结构区间或笔形区间在取码时被确定为笔形相交取对应位时,其区间上横与下点,左撇与右竖、交折与独单便为互为对应区,其码位应从其对应区间取笔形位(笔形区间按其所在位置区间的结构关系分)。
关于汉字的拆分依如下原则:有国家标准的,按国家标准执行,尚无国家标准的,按国家推行的规范化要求执行,尚无归范化要求的,按共识执行,并使之与汉字识字教育保持一致。等将来国家对笔形、笔顺、部首、结构这些具有确定性的要素都有了国家标准,则汉字键位码可以完全按照国家标准规定的要求操作执行。
笔形、笔顺采用的依据是1988年3月25日国家语言文字工作委员会和国家新闻署发布的《现代汉语通用字表》。
部首采用的依据中国文字改革委员会、国家出版局(1983年)汉字统一部首表(草案)201部。
笔划是由一个不断连续写成的线条构成的。在本发明中,将笔划分横、竖、撇、点、折五种类型。其中,提作横。捺作点、凡带转折的均作折。
汉字的结构是基于对汉字整体轮廓的认识,指汉字中部件与部件之间排列的相互位置关系。一个字的结构可以是由单个部件组成即为独体结构,也可以由数个部件组成即为合体结构。
把由单个部件构成的结构或字称为独体结构或独体字、其位置区间均归入独区。把由两个或两个以上部件构成的结构关系或字称为合体结构或合体字。我们将合体分为左右类、上下类、相交类。
我们将左右类分别归入位置区间的左区和右区,将上、下类分别归入位置区间的上区和下区。将相交类归入位置区间的交(围)区。其中左中右结构或能分出结构的左右对称均归入左右类。上中下结构或能分出结构的上下对称均归入上下类。将包围类结构(全包围、半包围)及多部件构成的特殊结构或不能分出上下或左右结构的对称类均归入相交类。
按传统取部首的方法将汉字拆分成两部分,按取先顺序,将取先部分定为部首部分、剩余部分定为非部首部分,每一编码的信息均取自字的部首部分的首部与尾部及非部首部分的首部与尾部。我们规定无论是单字还是词语,根据取码需要,均可能成为不等长码,但一个字或词语的一组码长取全为四位,词语中每字的码长取全为两码。
由于汉字是由部首字和含部首字两种类型组成,而部首字只有一个首部与一个尾部,故部首字每字取全为两码。所以在汉字键位码中、汉字的拆分共分三种:①部首字的拆分;②含部首字的拆分;③词语字的拆分。
①部首字的拆分
a.其起笔码只要根据其笔形与笔顺多少取单笔或双笔笔形即可,所以取第一码时可不需拆分。
b.取结构码时,按其轮廓和其部件之间排列的位置关系确定其结构属性,以供结构码确定其所在区间。
②含部首字的拆分
a.拆出部首部分,以分清部首及非部首部分的首部与尾部,供起笔码及补位码如何取笔形及取单笔还是双笔笔形用,同时供部首码确定位置区间用。
b.将部首以外剩余部分进行结构属性拆分,供结构码确定所在区间。
③.词语字的拆分
a.拆出字的部首部分,以确定起笔码取单笔还是双笔笔形。
b.对该字进行结构属性拆分,以确定结构码所在位置区间。
单字的取码规则
每字取全为四码,部首字每字取全两码。每码均包含两个信息要素即一个笔形区间或一个位置区间+一个笔形位。
其四码的取码排列顺序依次为起笔码、部首码、结构码、补位码。
上述的四码构成的基本原则如下:
①起笔码——笔形区间(部首或非部首部分先写第一笔)+笔形位(先写部分连续第二笔)起笔码取单笔笔形时为单区间+笔形位(先写部分第一笔)。
②部首码——部首所在位置区间+笔形位(部首未笔笔形)
③结构码——结构位置区间(去掉部首部分后的)+笔形位(非部首部分末笔笔形)
④补位码——笔形区间(部首或非部首部分后写第一笔)+笔形位(后写部分连续第二笔)。
补位码取单笔笔形时,单区间+笔形位(后写部分第一笔)。
在取码时,当结构码或补位码的末笔笔形被确定为产生相交时,则该码应从其对应区取笔形位。
多部件字.部首作为部件局部时,部首码的位置区间取交区。
单一部件含部首字,部首码位置区间取独区。
当部首部分被非部首分隔开呈两部分时,则部首码位置区间取交区。
当部首为部件局部或无法占据结构部分全部(占角)时,则该字的结构码仍按整字的结构属性关系取。
当补位码第一、二笔笔形为竖、横折“ㄇ”时,则该两笔笔形不取,依次取补位部分的第三、四笔或第三笔笔形,如已无笔形可取时,则该码不取。
为了提高取码的准确性,应注意如下事项:
①在一码中,笔形不能同时取得部首与非部首的两部分,无法取全连续两笔笔形时,则取单笔笔形,从单区中取笔形位,如已无笔形时则该码不取。
②在取连续两笔笔形时,第一笔为笔形区,第二笔为笔形位。
③字的起笔部分为部首部分时,非部首部分起笔部分为补位码,起笔部分为非部首部分时,则部首部分的起笔部分为补位码。
④在取码时,已经用过的笔形不能再次取用,若取不出笔形时,则该码不取。
⑤部首字的结构关系为按整字的结构关系分,含部首字的结构关系为去掉字的部首部分的全部笔形后,字的剩余部分所存在的结构关系。
本发明的汉字拆分方法可作如下归纳:将汉字用取部首的方法拆分成部首和非部首部分,根据每部分的头部和尾部要素并按排列顺序拆分成起笔码、部首码、结构码、补位码四个码,每一个码由笔形区间或位置区间与笔形位两个要素决定,每个码相对应于通用键盘上的一个键位,不足四码的则可取起笔码、部首码、结构码、补位码四码中的任何一至三个码。
所说的起笔码由笔形区间和笔形位决定、所述的部首码由部首位置区间和笔形位决定、结构码由结构位置区间和笔形位决定、补位码由笔形区间和笔形位决定。
所说起笔码的笔形区间由部首或非部首部分先写第一笔决定区,笔形位是先写部分连续笔形的第二笔,当起笔码无法取连续笔形时,则为单区间和先写部分的第一笔笔形;
所说部首码的区间由部首在该字中所在位置决定区,笔形位由部首的末笔笔形决定;
所说结构码的结构位置区间由去除部首部分后的末笔笔形部分的结构决定区,笔形位由该结构部分的末笔笔形决定;
所说补位码笔形区间由部首或非部首部分后写第一笔决定区,笔形位由该后写部分的连续第二笔笔形决定,当补位码无法取连续笔形时,则为单区间和后写部分的第一笔笔形。
所说的部首码位置区间确定的顺序为取大为先,依次以如下顺序,
部首字——全包围——半包围——占边——被包围——占角——部件——部件局部——起笔,当汉字均为部首且相等时,非成字部件为先、多部件的留字为先;均为成字部件或均为非成字部件的,先写为先,每个汉字只能确定一个部首。
所说的结构码或补位码的末笔笔形与其它笔形被判定产生相交时,则该码应在其相对应区取笔形位。
在一码中,笔形只能分别取自部首与非部首的单一部分,无法取全连续两笔笔形时,则取单笔笔形,从单区中取笔形位,如已无笔形时则该码不取;
在取连续两笔笔形时,第一笔为笔形区,第二笔为笔形位;
当字的起笔部分为部首部分时,非部首部分的起笔部分为补位码,起笔部分为非部首部分时,则部首部分的起笔部分为补位码;
在取码时,已经用过的笔形不能再次取用,若取不出笔形时,则该码不取;
部首字的结构码关系为按整字的结构关系分,含部首字的结构码关系为去掉字的部首部分的全部笔形后,汉字的剩余部分所存在的结构关系。
当所要输入的汉字为两个字的词组时,则分别取第一个字的起笔码、结构码和第二个字的起笔码和结构码;
当所要输入的汉字为三个字的词组时,则分别取第一个字的起笔码、结构码、第二个字的起笔码、第三个字的起笔码;
当所要输入的汉字为四个字或四个以上字的词组时,则分别取第一个字的起笔码、第二个字的起笔码、第三个字的起笔码、末尾字的起笔码。
以以下汉字和词组为例进行如何拆分和编码,
汉字“成”:
部首部分为戈,横笔与折笔在写时不连续,起笔码取单区横位,即键位“N”,
部首部分末笔为点,部首码取独区点位,即键位“>”,
非部首部分为撇折,末笔为折,其结构为独,结构码取独区折位,即键位”?。
非部首部分为撇折,因折笔在结构码中已用过,用过的笔形不能再次取用,故只能取单笔撇,区为单,即键位“<”,
该字的相应键位或编码为“N>?<”。
汉字“器”:
部首部分为口,起笔码为竖折,取竖区折位,即键位“P”,
部首码笔形位为横,因左上角部首口既不能代表上,也不能代表左,只在位置与非部首部分产生相交作用,故部首码区间为交,交区横位,即键位“B”,
结构码末笔笔形为横,且在下部,为下区横位,即键位“H”,
补位码开始二笔笔形为“ㄇ”,根据规则补位码第一、二笔笔形为“ㄇ”,该二笔笔形不取,取其接下去的连续笔形,为横横,因第二笔横有笔形相交,故其横区横位改取点区横位,即键位“H”,
该字的相应键位或编码为“PBHH”。
词组“十分”:
第一字起笔码为横区竖位,键位“R”,
第一字结构码,因该码已无笔形,故第一字无结构码,
第二字起笔码为撇区点位,键位为“S”,
第二字结构码为下区撇位,键位为“K”,
“十分”的相应键位或编码为“RSK”。
词组“拖拉机”:
将该三字分别拆成部首和非部首部分,第一字起笔码取横区折位,键位“Q”,第一字结构码取字的末笔折,右区,因折笔相交,所以取左区折位,键位“A”,第二字起笔码横区折位,键位“Q”,第三字起笔码取横区竖位,键位R,该词组的相应键位或编码为“QAQR”。
词组“中华人民共和国”:
第一字的起笔码取单区竖位,键位“M”,
第二字的起笔码取撇区竖位,键位“F”,
第三字的起笔码取撇区点位,键位“S”,
最后一字的起笔码取竖区折位,键位“P”,
该词组的相应键位或编码为“MFSP”。
部首取先例:
a.非成字部件为先:刘——取“刂”部。
b.留字为先:案——取“木”部。
c.先写为先:相——取“木”部,祁——取“礻”部。
d.多部件为先:章——取“音”部,衷——取“衣”部(因部首被隔开成两部分,我们称其为相交,部首码取交区)。
e.整部件为先:武——取“止”部(弋为弋部件局部,在“弋”为部首,取码时,笔顺及位置关系易混淆,而取“止”部时,则取码时笔顺及位置关系较明了,当然可将取“弋”部作容错码处理)。
请参阅图3和图4,在图3和图4中,分别列举一些单字和词组的相应的键位和编码。
以上,只要在计算机通用键盘上输入与所要输入汉字的相对应的键位或编码,就输入了相应的汉字。
图2列出了本发明的汉字简码对照,只要按下相应的键位,就输入了相应的汉字,如键位“Q”与“过”相对应,键位“I”与“少”相对应。
在结构码相交的判断中,要注意字的结构码相交的判断和词语字结构码相交的判断的区别。
在字的结构码相交的判断中,为去掉部首部分的全部笔形后,该字的剩余部分的末笔笔形和其它任一笔笔形,只要笔形产生相交叉(不包括相连笔形),我们便判定其为产生相交。
在词语字结构码相交的判断中,该词语字的末笔笔形只要与该字中任一笔笔形产生相交叉(不包括相连笔形)、我们便判定其为产生相交。
部首字的结构码相交判断归入词语字类。
在补位码相交的判断中,
在补位码的连续两笔笔形或单笔笔形中,只要其中任一笔笔形与该部分(部首部分归部首部分、非部首部分归非部首部分)任一笔笔形产生笔形相交叉(不包括相连笔形)或该两笔笔形自身产生相交叉,我们便判定其为产生相交。
字和词语字的结构码的区别。
词语字的结构码是指字的部件或部件之间形成的位置关系。
字的结构码是指去掉部首部分后,字的剩余部分的部件或部件与部件之间形成的位置关系。因部首字结构码不具备单字结构码特性,而符合词语结构码的特性,故部首字结构的取法与词语字结构码取法相同。
请参阅图6,用这种汉字键位码编码的方式用于对汉字的字、词编码,然后汉字键位检字序性图将编码要素转化成数字排列形式,接着按数字大小排列顺序,直接翻页查找所要的字、词或资料。
在图6中,键位中左上角的英文字母或符号用序性检索位替代,
笔形区间“一”用一、“丨”用二、“丿”用三、“丶”用四、“フ”用五、“●”用六表示。位置区间
Figure C9812287100161
用一、
Figure C9812287100162
用二、 用三、 用四、“◎”用五、“●”用六表示。
笔形位“一”用1、“丨”用2、“丿”用3、“丶”用4、“フ”用5表示。
本发明的方法也可在数字键盘中应用,请参阅图5所示,
我们将数字键盘分为基本键和辅助键,基本键由1、2、3、4、5、6六个键组成,每键分别代表一个笔形区间一个位置区间和一个笔形位。
其笔形区间按1(一)、2(丨)、3(丿)、4(丶)、5(フ)、6(●)顺序排列。其位置区间与笔形区间配对排列则与大键(英文键或符号键)相同。
笔形位按1(一)、2(丨)、3(丿)、4(丶)、5(フ)顺序排列。
辅助键的设置主要是为了减少小键盘汉字输入击键次数。由7、8、9、0四键组成,每键由一个成字部件和一个非成字部件组成。
数字键字、词编码规则:
a.基本键输入法
其字、词的取码方法均与上述所描述的大键(英文键、符号键)相同、输入时,先按大键的方式将字、词编码,然后将大键键位的每一键,按区与位分二键进行数字键输入。
在基本键输入中,每二键代表一码,第一键为区、第二键为位。故基本键输入中,码位分别为二、四、六、八键。
b.辅助键输入法。
在基本键操作基础上,凡遇上起笔部分或末笔正好与该部件相符时,即可用辅助键位的形式,代替其在基本键中相关的码位。
在输入中,击一次键即代表了该成字部件的全部笔形,连击二次代表了该非成字部件的全部笔形。或者为二个与其相对应的成字部件。
被辅助码用过的部件,其笔形不得再用于其它码中。
上述的几种输入方法及检索序性的对应关系,以“坤”字为例:
起笔码为“横竖”,
部首码为“左横”,
结构码为“独竖”,因其竖笔为笔形相交,故取其对应区“交竖”,
补位码第一、二笔笔形为“竖、横折”“ㄇ”根据取码规则该两笔笔形不取,取第三、四笔形为“横、横”因其有笔形相交,故取其对应区“点、横”。
该字相对应的编码为“RGVH”。
用键位符号形式表示为:R、G、V、H。
用检索序性形式表示为:一2、三1、五2、四1。
用小键盘形式表示为:12、31、52、41。
用小键盘辅助键形式表示为:7、52、41。
根据编码规则,汉字键位码为不等长码,字或词语取全均为四码。在编码覆盖示例(单字效果图和词语效果图)中,每一码均有概率覆盖任一键位,根据排列组合公式得:
码元m=30     码位n分别为1、2、3、4
号码总数 &Sigma; f = 1 k Si = m 1 n 1 + m 2 n 2 + m 3 n 3 + m 4 n 4 = 30 &prime; + 30 2 + 30 3 + 30 4
        =30+900+27000+810000=837930(组)
从对可容纳号码总数来讲,我们对国标二级字库(GB2312-80,6763字),国标汉字键盘输入用通用词语集(GB/T 15732-1995 43540条,其中,一级最常用集12355条,二级常用级17930条、三级次常用级13255条)字词总数相加为50303组,或单字用GB13000.1-93大字符20902字及再扩容,其总量也只占汉字键位码号码总容纳数的十分之一左右,仍有一个较理想的编码容纳空间,从而使其重码概率在不增加烦琐附加规则的前提下,仍处于较低的水平。

Claims (1)

1、一种计算机汉字键位码输入方法,其特征在于,
该方法包括以下步骤:
a,
将计算机通用键盘分成六个区,即上横区、右竖区、左撇区、下点区、交折区、独单区,每个区包含有横、竖、撇、点、折五个笔形位,上横区与下点区、左撇区与右竖区、交折区与独单区均为相互对应区,键盘上每个键位上包含英文字母或符号、笔形区间、位置区间、笔形位四个要素,
其中,上横区包括键位Q、W、E、R、T,键位Q、W、E、R、T与笔形位“折、点、撇、竖、横相对应,
右竖区包括键位Y、U、I、O、P,键位Y、U、I、O、P与笔形位“横、竖、撇、点、折”相对应,
左撇区包括键位A、S、D、F、G,键位A、S、D、F、G与笔形位“折、点、撇、竖、横”相对应,
下点区包括键位H、J、K、L、:,键位H、J、K、L、:与笔形位”横、竖、撇、点、折相对应,
交折区包括键位Z、X、C、V、B,键位Z、X、C、V、B与笔形位“折、点、撇、竖、横”相对应,
独单区包括键位N、M、<、>、?;独单区键位N、M、<、>、?与笔形位“横、竖、撇、点、折”相对应;
b,
将汉字用取部首的方法拆分成部首和非部首部分,根据每部分的头部和尾部要素并按排列顺序拆分成起笔码、部首码、结构码、补位码四个码,
起笔码由笔形区间和笔形位决定,起笔码的笔形区间由部首或非部首部分先写第一笔决定区,笔形位是先写部分连续笔形的第二笔,当起笔码无法取连续笔形时,则为单区间和先写部分的第一笔笔形,
部首码由部首位置区间和笔形位决定,部首码的区间由部首和非部首所在位置决定区,笔形位由部首的末笔笔形决定,
其中,部首码位置区间确定的顺序为取大为先,依次以如下顺序,
部首字——全包围——半包围——占边——包围——占角——部件——部件局部——起笔,当汉字均为部首且相等时,非成字部件为先、多部件的留字为先;均为成字部件或均为非成字部件的,先写为先,每个汉字只能确定一个部首;
在一码中,笔形只能分别取自部首与非部首的单一部分,无法取全连续两笔笔形时,则取单笔笔形,从单区中取笔形位,如已无笔形时则该码不取,
在取连续两笔笔形时,第一笔为笔形区,第二笔为笔形位,
当字的起笔部分为部首时,非部首部分的起笔部分为补位码,起笔部分为非部首部分时,则部首部分的起笔部分为补位码;
在取码时,已经用过的笔形不能再次取用,若取不出笔形时,则该码不取;
部首字的结构码关系为按整字的结构关系分,含部首字的结构码关系为去掉字的部首部分的全部笔形后,汉字的剩余部分所存在的结构关系;
结构码由结构位置区间和笔形位决定,结构码的结构位置区间由去除部首部分后的末笔笔形部分的结构决定区,笔形位由该结构部分的末笔笔形决定,所说的结构码的末笔笔形与其它笔划产生相交时,则该码应在其相对应区取笔形位;
补位码由笔形区间和笔形位决定,所说补位码笔形区间由部首或非部首部分后写第一笔决定区,笔形位由该后写部分的连续第二笔笔形决定,当补位码无法取连续笔形时,则为单区间和后写部分的第一笔笔形,补位码的末笔笔形与其它笔划产生相交时,则该码应在其相对应区取笔形位;
在一码中,笔形只能分别取自部首与非部首的单一部分,无法取全连续两笔笔形时,则取单笔笔形,从单区中取笔形位,如已无笔形时则该码不取;
在取连续两笔笔形时,第一笔为笔形区,第二笔为笔形位;
当字的起笔部分为部首部分时,非部首部分的起笔部分为补位码,起笔部分为非部首部分时,则部首部分的起笔部分为补位码;
在取码时,已经用过的笔形不能再次取用,若取不出笔形时,则该码不取;
部首字的结构码关系为按整字的结构关系分,含部首字的结构码关系为去掉字的部首部分的全部笔形后,汉字的剩余部分所存在的结构关系;
每个码相对应于通用键盘上的一个键位,不足四码的则可取起笔码、部首码、结构码、补位码四码中的任何一至三个码;
c,
当所要输入的汉字为两个字的词组时,则分别取第一个字的起笔码、结构码和第二个字的起笔码和结构码,
当所要输入的汉字为三个字的词组时,则分别取第一个字的起笔码、结构码、第二个字的起笔码、第三个字的起笔码,
当所要输入的汉字为四个字或四个以上字的词组时,则分别取第一个字的起笔码、第二个字的起笔码、第三个字的起笔码、末尾字的起笔码;
e,
在计算机通用键盘上输入与所要输入汉字或词组的相对应的码。
CN 98122871 1998-12-24 1998-12-24 计算机汉字键位码输入方法 Expired - Fee Related CN1123819C (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN 98122871 CN1123819C (zh) 1998-12-24 1998-12-24 计算机汉字键位码输入方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN 98122871 CN1123819C (zh) 1998-12-24 1998-12-24 计算机汉字键位码输入方法

Publications (2)

Publication Number Publication Date
CN1223398A CN1223398A (zh) 1999-07-21
CN1123819C true CN1123819C (zh) 2003-10-08

Family

ID=5227920

Family Applications (1)

Application Number Title Priority Date Filing Date
CN 98122871 Expired - Fee Related CN1123819C (zh) 1998-12-24 1998-12-24 计算机汉字键位码输入方法

Country Status (1)

Country Link
CN (1) CN1123819C (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101063904B (zh) * 2006-04-24 2010-09-08 李铁 中文规范输入法及其键盘
CN102147664A (zh) * 2010-02-10 2011-08-10 柯南楠 计算机汉字输入法

Also Published As

Publication number Publication date
CN1223398A (zh) 1999-07-21

Similar Documents

Publication Publication Date Title
CN1023916C (zh) 简繁五笔字根汉字输入系统
CN1648828A (zh) 去多义性语音输入系统和方法
CN1123819C (zh) 计算机汉字键位码输入方法
CN1121645C (zh) 音形字理码汉字输入方法
CN1166997C (zh) 汉字免拆分快速输入法
CN1258037A (zh) 中文键盘及汉字语音码输入方法
CN1374577A (zh) 英文字母键盘和数字键盘通用汉字电脑输入法及其键盘
CN1309342A (zh) 计算机汉字音形模糊输入法
CN1317906A (zh) 移动通信与计算机信息处理中英文数字化输入集成系统
CN1081810C (zh) 计算机音形汉字输入法
CN1108552C (zh) 拼音汉字完善汉字法(phf)
CN1062797A (zh) 文字输入键盘及方法
CN1073539A (zh) 汉字拼音编码及输入方法
CN1815418A (zh) 基于中文字母方式描述汉字轮廓特征的多元编码方法
CN1275732A (zh) 汉语键盘输入系统及其应用技术
CN1845053A (zh) 手写拼式移动虚拟键盘认别拼音汉字英文输入技术
CN1453692A (zh) 一种汉字拼形输入法的智能输入处理方法
CN1591293A (zh) 汉字拼形输入法
CN1547093A (zh) 计算机汉字形素键位码输入方法
CN1196989C (zh) 汉字形体示意输入法及其键盘
CN1120408C (zh) 一种计算机结构声读汉字输入方法
CN1303504C (zh) 计算机汉字字母文字化输入法
CN1223503A (zh) 中英文输入方法及相关键盘
CN1050913C (zh) 中文部首代码编码输入的文书处理装置
CN86107235A (zh) 词字二元编码输入汉字系统及键盘

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C19 Lapse of patent right due to non-payment of the annual fee
CF01 Termination of patent right due to non-payment of annual fee