CN1752899A - 汉语编码及其汉字输入法和汉字检索法 - Google Patents

汉语编码及其汉字输入法和汉字检索法 Download PDF

Info

Publication number
CN1752899A
CN1752899A CN 200410064731 CN200410064731A CN1752899A CN 1752899 A CN1752899 A CN 1752899A CN 200410064731 CN200410064731 CN 200410064731 CN 200410064731 A CN200410064731 A CN 200410064731A CN 1752899 A CN1752899 A CN 1752899A
Authority
CN
China
Prior art keywords
chinese
group
character
poplar
code
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN 200410064731
Other languages
English (en)
Other versions
CN1752899B (zh
Inventor
杨锋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to CN 200410064731 priority Critical patent/CN1752899B/zh
Publication of CN1752899A publication Critical patent/CN1752899A/zh
Application granted granted Critical
Publication of CN1752899B publication Critical patent/CN1752899B/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)

Abstract

汉语编码及其汉字输入法和汉字检索法属于一种新颖的汉语编码技术、汉字输入技术和汉字检索技术,其主要特征在于:首先从一般汉字字典部首中选取一部分部首作为本发明中的字元;然后将所有字元进行分组,并且分别给每组字元赋予同一个单字符或同一个双字符串作为本组内每一个字元的同一代码;再用字元的代码按照规则,分别给汉字单字、词、词组、短语和语句进行编码和取码,所取得的码被简称为汉语杨码;用汉语杨码能够输入中文信息,排序中文信息和处理非汉字字符或图形。本发明保持了汉字传统部首的精华,并且按照汉字的常规笔顺规则对汉语信息进行编码,能够达到思维连通、遇字知码、易学易记、简单快捷和方便各类人员使用的目的。

Description

汉语编码及其汉字输入法和汉字检索法
技术领域  本发明涉及汉语编码技术、汉字输入技术和汉字检索技术,尤其涉及一种新的汉语形码编码技术及其汉字输入法和汉字检索法。本发明属于汉语编码及其汉字输入和汉字检索技术领域。
背景技术  自从电子计算机问世以来,汉语编码技术一直深受到人们重视。这些年来,不少研究人员根据汉字的字形、发音等特性,从各个角度采用不同的方法对汉字进行了编码。目前已申请专利的编码方案超过千种,形成了万“码”奔腾的局面,同时也促进了汉语编码及其汉字输入法和汉字检索法朝着易学、易记、快速、好用的方向发展。
现有的汉语编码方案可分为四类:流水码类、纯音码类、纯形码类、音形结合码类。它们分别具有以下的特点:
1.流水码类,如电报码等,其特点是:以流水方式编码。
此类编码方案中,因为其专业性强,难于记忆,所以,对于非专业人员来说,不易掌握和直接应用它。
2.纯音码类,如全拼、双拼等,其特点是:直接用汉语拼音方案中的拼音字母进行编码。
此类编码方案中,目前流行最广的是全拼汉字输入法和全拼汉字检索法。此法具有如下优点:(1)现代人从小学就开始就学习汉语拼音,且具有一定的普通话基础,不必花更多额外的精力,就能学会使用这种方法;(2)以词组输入效率较高;(3)编码直观,思维连贯;(4)与已有的中文知识和习惯兼容性好。但是,这种汉字输入法和汉字检索法还存在有如下难以克服的缺点:(1)中国目前正在使用着的汉字超过15000余个,对于大多数人来说,他们对其中很多汉字不认识,这就给他们用拼音来输入这些汉字和检索这些汉字带来了困难;(2)中国方言多且复杂,普通话基础差的人也不在少数,这就给推广和应用全拼汉字输入法和全拼汉字检索法带来了障碍;(3)因为汉字同音字多,所以单字重码率很高;(4)有些汉字发音相近,不容易分辩和区分;(5)用键多,使用不方便;(6)击键次数较多,输入汉字速度不易提高。
3.纯形码类,如五笔字型、郑码、五笔画等;其特点是:它们是按汉字的笔形、部件、结构特征进行编码。
此类编码方案中,目前流行最广的是五笔字型汉字输入法,它具有以下优点:(1)避免了汉字语音的影响;(2)重码率低;(3)对于经过特殊训练的专业人员来说,输字效率较高。但是,此方法还存在着不少的缺点:(1)编码不直观,不连贯,编码思维与人们习惯思维严重脱离;(2)对汉字拆分过细,字根多且杂,不易记,容易忘;(3)规则复杂;(4)与已有的中文知识和习惯兼容性差;(5)用键多;(6)操作此输入法人员要经过特殊训练,否则输字效率较低。
4.音形组合码类,如表形码、万码、属性分类码、笔顺区位码、模糊元码、笔韵码、音形码、快易码等,其特点是:这类编码同时兼有纯音码类和纯形码类中的一些特点。
此类编码方案中,一般汉字重码率都较低,但是,它们都要求其使用者同时要掌握汉字语音和字形两种因素,因此,在输入汉字时,操作者不但要具有很高的普通话水平和中文水平,而且,人脑还要多经过一道分辨和综合程序,所以,此类汉字输入法方案虽然很多,但都较难掌握,使用也不方便。
以上四类汉语编码方案及其汉字输入法和汉字检索法,之所以目前形成万“码”奔腾的局面,其主要的原因是,在易学、易记、快速、好用这几方面,它们各自有自己的优点,同时,也都存在着顾此失彼,不能兼顾的缺陷。
发明内容  本发明的目的是要提供一种新颖的汉语编码方案,而且,要利用这种方案来创造出一种易学、易记、快速、好用的汉字输入法和汉字检索法。
本发明是这样实现的:
一、字元及其代码
1.定义字元
一般常用汉语字典或汉语词典中的传统部首可分为两大类:一类是由单笔画构成的部首,被称为单笔画部首;另一类是由两笔或两笔以上笔画构成的部首,被称为多笔画部首。
本发明从一般常用汉语字典或汉语词典的传统部首中,选取其中全部单笔画部首作为本发明中构成汉字的单笔画型标准部件,再从一般常用汉语字典或汉语词典的传统部首中选取其中部分多笔画部首作为本发明中构成汉字的多笔画型标准部件,这些构成汉字的单笔画型标准部件和多笔画型标准部件在本发明中被统称为汉字的字元,并且,其中所有单笔画型标准部件又被称为单笔画字元,所有多笔画型标准部件又被称为多笔画字元。
2.字元分组
目前汉字信息以简体汉字系统、繁体汉字(含异体汉字,以下同)系统、简繁体汉字(含异体汉字,以下同)共存系统这三类系统形式存在着,因此,它们的字元及其字元组也分为三类,现分述如下:
(1)简体汉字系统字元共分成50组,其中5组是单笔画字元组,它们分别是:“一、
Figure A20041006473100151
组、“丨、亅”组、“丿”组、“丶、”组和“乙、*(*代表除前面已提到的单笔画部首以外的其它所有的汉字单笔画部首,以下同)”组,另45组是多笔画字元组,它们分别是:“扌”组、“口”组、“人、八、亻”组、“氵”组、“
Figure A20041006473100152
”组、“王”组、“酉”组、“石”组、“车”组、“止”组、“田”组、“山”组、“贝”组、“罒”组、“爫”组、“月”组、“鱼”组、“犭”组、“饣”组、“门”组、“立”组、“羊、”组、“米”组、“衤、礻”组、“马”组、“尸”组、“弓”组、“女”组、“纟”组、“耳”组、“土、士”组、“艹”组、“木”组、“日、曰”组、“目”组、“虫”组、“”组、“夕、夂”组、“钅”组、“舟”组、“”组、“广、疒”组、“忄”组、“火”组和“宀”组;
(2)繁体汉字系统字元共分成51组,其中5组是单笔画字元组,它们分别是:“一、
Figure A20041006473100153
组、“丨、亅”组、“丿”组、“丶、”组和“乙、*”组,另46组是多笔画字元组,它们分别是:“扌”组、“口”组、“人、八、亻”组、“氵”组、“ ”组、“王”组、“酉”组、“石”组、“車”组、“止”组、“田”组、“山”组、“貝”组、“罒”组、“爫”组、“月”组、“魚”组、“犭”组、“飠”组、“門”组、“言”组、“立”组、“羊、”组、“米”组、“衤、礻”组、“馬”组、“尸”组、“弓”组、“女”组、“糹”组、“耳”组、“土、士”组、“艹”组、“木”组、“日、曰”组、“目”组、“虫”组、“”组、“夕、夂”组、“金”组、“舟”组、“”组、“广、疒”组、“忄”组、“火”组和“宀”组;
(3)简繁体汉字共存系统字元共分成51组,其中5组是单笔画字元组,它们分别是:“一、
Figure A20041006473100161
组、“丨、亅”组、“丿”组、“丶、”组和“乙、*”组,另46组是多笔画字元组,它们分别是:“扌”组、“口”组、“人、八、亻”组、“氵”组、“ ”组、“王”组、“酉”组、“石”组、“车、車”组、“止”组、“田”组、“山”组、“贝、貝”组、“罒”组、“爫”组、“月”组、“鱼、魚”组、“犭”组、“饣、飠”组、“门、門”组、“言”组、“立”组、“羊、”组、“米”组、“衤、礻”组、“马、馬”组、“尸”组、“弓”组、“女”组、“纟、糹”组、“耳”组、“土、士”组、“艹”组、“木”组、“日、曰”组、“目”组、“虫”组、“”组、“夕、夂”组、“钅、金”组、“舟”组、“”组、“广、疒”组、“忄”组、“火”组和“宀”组。
从上面三类汉字系统的字元组中可以看出,它们都具有5组相同的单笔画字元组:“一、
Figure A20041006473100163
组、“丨、亅”组、“丿”组、“丶、”组、“乙、*”组,和37组相同的多笔画字元组:“扌”组、“口”组、“人、八、亻”组、“氵”组、“ ”组、“王”组、“酉”组、“石”组、“止”组、“田”组、“山”组、“罒”组、“爫”组、“月”组、“犭”组、“立”组、“羊、”组、“米”组、“衤、礻”组、“尸”、“弓”组、“女”组、“耳”组、“土、士”组、“艹”组、“木”组、“日、曰”组、“目”组、“虫”组、“”组、“夕、夂”组、“舟”组、“”组、“广、疒”组、“忄”组、“火”组和“宀”组;它们之间有所不同的字元组分别是:(1)简体汉字系统中有8组多笔画字元组,它们分别是:“车”组、“贝”组、“鱼”组、“饣”组、“门”组、“马”组、“纟”组和“钅”组;(2)繁体汉字系统中有9组多笔画字元组,它们分别是:“車”组、“貝”组、“魚”组、“飠”组、“門”组、“言”组、“馬”组、“糹”组和“金”组;(3)简繁体汉字共存系统中有9组多笔画字元组,它们分别是:“车、車”组、“贝、貝”组、“鱼、魚”组、“饣、飠”组、“门、門”组、“言”组、“马、馬”组、“纟、糹”组和“钅、金”组。
3.字元代码
本发明用9个不同的单字符分别依次给上述各类汉字系统中的前9组相同的字元组“一、
Figure A20041006473100165
组、“丨、亅”组、“丿”组、“丶、”组、“乙、*”组、“扌”组、“口”组、“人、八、亻”纽和“氵”组中的每组字元赋予同一个单字符作为本组内每一个字元的同一代码,再用上述的9个不同的单字符进行排列组合成的41个(简体汉字系统)或42个(繁体汉字系统、简繁体汉字共存系统)不同的双字符串,分别给上述其后41组(简体汉字系统)或42组(繁体汉字系统、简繁体汉字共存系统)中的每组字元赋予同一个双字符串作为本组内每一个字元的同一代码。如果上述的9个不同的单字符分别被9个不同的阿拉伯数字所代替,则这些字元的代码就被定义为数字型字元代码;如果上述的9个不同的单字符分别被9个不同的英文字母所代替,则这些字元的代码就被定义为字母型字元代码;如果上述的9个不同的单字符分别被9个不同的其它字符或其它字符与英文字母字符、阿拉伯数字字符的混合所代替,则这些字元的代码就被定义为其它型字元代码。下面就这三类字元代码在各类汉字系统中的具体内容分述如下:
(1)数字型字元代码
用1、2、3、4、5、6、7、8、9这9个不同的阿拉伯数字字符代替上述的9个不同的单字符,分别给三类汉字系统中具有相同的字元组“一、
Figure A20041006473100166
组、“丨、亅”组、“丿”组、“丶、”组、“乙、*”组、“扌”组、“口”组、“人、八、亻”组和“氵”组这9个组中的字元按序按组赋予同一个阿拉伯数字字符来作为该组内每一个字元的代码,用1、2、3、4、5、6、7、8、9这9个不同的阿拉伯数字字符代替上述的9个不同的单字符进行排列组合后,①取出其中双字符串14、16、17、18、22、26、27、29、34、36、38、46、47、48、49、56、57、58、66、67、68、69、76、77、78、79、86、88、89、96、97、98、99这33个不同的阿拉伯数字双字符串代替上述的41个(简体汉字系统)或42个(繁体汉字系统、简繁体汉字共存系统)不同的双字符串中的其中33个双字符串,分别给三类汉字系统中具有相同的多笔画字元组“ ”组、“王”组、“酉”组、“石”组、“止”组、“田”组、“山”组、“罒”组、“爫”组、“月”组、“犭”组、“立”组、“羊、”组、“米”组、“衤、礻”组、“尸”组、“弓”组、“女”组、“耳”组、“土、士”组、“艹”组、“木”组、“日、曰”组、“目”组、“虫“组、“”组、“夕、夂”组、“舟”组、“”组、“广、疒”组、“忄”组、“火”组和“宀”组这33个组中的字元按序按组赋予同一个双字符串作为该组内的每一个字元的代码;②取出其中双字符串19、28、37、39、42、55、59、87这8个不同的阿拉伯数字双字符串代替上述简体汉字系统中的41个不同的双字符串中的其余8个双字符串,分别给简体汉字系统中的字元组“车”组、“贝”组、“鱼”组、“饣”组、“门”组、“马”组、“纟”组和“钅”组这8个组中的字元按序按组分别赋予一个双字符串作为该组字元的同一代码;同样,用其中双字符串19、28、37、39、42、55、59、87这8个不同的阿拉伯数字双字符串代替上述繁体汉字系统中42个不同的双字符串中的另外8个不同的双字符串分别给繁体汉字系统中的“車”组、“貝”组、“魚”组、“飠”组、“門”组、“馬”组、“糹”组和“金”组这8个组中的字元按序按组分别赋予一个双字符串作为该组字元的同一代码;也同样用其中双字符串19、28、37、39、42、55、59、87这8个不同的阿拉伯数字双字符串代替上述简繁体汉字共存系统中42个不同的双字符串中的另外8个不同的双字符串分别给简繁体汉字共存系统中的“车、車”组、“贝、貝”组、“鱼、魚”组、“饣、食”组、“门、門”组、“马、馬”组、“纟、糹”组和“钅、金”组这8个组中的字元按序按组分别赋予同一个双字符串作为该组内每一个字元的同一代码;③取出其中双字符串45这最后一个阿拉伯数字双字符串代替上述繁体汉字系统和简繁体汉字共存系统各42个不同的双字符串中的最后一个双字符串,分别给繁体汉字系统和简繁体汉字共存系统中的相同的字元组“言”组赋予同一个双字符串作为该组内字元的同一代码。为了进一步说清楚各类汉字系统中的数字型字元代码,现将本发明中各类汉字系统的数字型字元代码分别列表如下:
表1  简体汉字系统数字型字元代码表
Figure A20041006473100172
Figure A20041006473100181
表2  繁体汉字系统数字型字元代码表
Figure A20041006473100182
表3  简繁体汉字共存系统数字型字元代码表
Figure A20041006473100183
Figure A20041006473100191
(2)字母型字元代码
本发明中当用9个不同的英文字母字符分别依次替代上述9个不同的阿拉伯数字字符1、2、3、4、5、6、7、8、9后,则三类汉字系统中的所有字元代码就变成了字母型字元代码。
例如,当用h、n、m、j、k、l、u、i、o这9个不同的英文字母字符分别依次替代上述9个不同的阿拉伯数字字符1、2、3、4、5、6、7、8、9后,则三类汉字系统中的所有字元代码就变成了如表4、表5、表6中所列字母型(HO型)字元代码:
表4  简体汉字系统字母型(HO型)字元代码表
Figure A20041006473100192
  hihonnnlnu   石车止田山   kkklkukiko   马尸弓女纟   olouoioo   广疒忄火宀
表5  繁体汉字系统字母型(HO型)字元代码表
Figure A20041006473100201
表6  简繁体汉字共存系统字母型(HO型)字元代码表
Figure A20041006473100202
Figure A20041006473100211
(3)其它型字元代码
本发明中当用9个不同的其它字符或其它字符与英文字母字符、阿拉伯数字字符的混合,分别依次替代上述9个不同的阿拉伯数字字符1、2、3、4、5、6、7、8、9后,则三类汉字系统中的所有字元代码就成为了其它型字元代码。
二、汉语杨码编码规则
1.笔顺规则
(1)本发明采用1997年4月7日国家语言文字工作委员会和国家新闻出版署联合发布的《现代汉语通用字笔顺规范》来作为本发明汉字的笔顺基础,即本发明汉字标准笔顺是按照1997年4月7日国家语言文字工作委员会和国家新闻出版署联合发布的《现代汉语通用字笔顺规范》中的规定所定。
(2)为了兼顾部分人的习惯,本发明同时还采用了人们习惯上与1997年4月7日国家语言文字工作委员会和国家新闻出版署联合发布的《现代汉语通用字笔顺规范》规定中不同的其它汉字笔顺作为本发明中的汉字非标准笔顺而存在。为了区别于汉字的标准笔顺,本发明将汉字的非标准笔顺又称之为汉字的异笔顺。
例如,汉字“非”字标准笔顺的前四笔画顺序是“丨、一、一、一”,为了兼顾部分人的习惯,本发明中也存在该汉字前四笔画顺序为“一、一、一、丨”的异笔顺,即在本发明中,两种笔顺编码后所取得的杨码可以同时存在同一版本中。按照标准笔顺编码后所取得的杨码被称之为标准码,按照异笔顺编码后所取得的杨码被称之为容错码。本发明中在汉字标准码存在的同时,也容许该汉字的容错码(包括下面所介绍的其它三种容错码在内)存在。
2.优先取大规则
在构成单个汉字的所有字元中,笔画多的字元视为大,它被优先作为构成该汉字的字元拆分出,即不可将笔画多的字元再次拆分成两个或两个以上的笔画比它少的字元来作为构成该汉字的字元。
例如,汉字“木”字是由一个字元“木”构成,我们不可将字元“木”再次拆分成三个笔画比它少的字元“一、丨、八”来作为构成“木”字的字元,或再次拆分成四个单笔画字元“一、丨、丿、丶”来作为构成“木”字的字元。
3.单个汉字的编码规则
(1)按照汉字的笔顺规则和优先取大规则,视单个汉字是由一个或多个字元(是指两个或两个以上的字元,以下同)构成;
(2)按照汉字的笔顺规则和优先取大规则,视拆单个汉字:首先从该汉字的首笔(书写该汉字时起始笔画称之为该汉字的首笔)开始,按照常规的笔顺规则连续地书写下去,直到构成该汉字首显的第一个最大字元而又不破坏下一个最大字元为止,此字元即为构成该汉字的第一个字元;然后再将其余部(除去该汉字第一个字元后所余下的部分)视为单个汉字,按照单个汉字的拆分规则进行视拆,直到得到该余部的第一个最大字元显现而又不破坏下一个最大字元为止,此字元即为构成该汉字的第二个字元……照此方法,不断地将其后的余部视拆下去,直到没有余部为止;
(3)视拆完一个汉字后,将所得到的该汉字所有字元的代码字符,按照视拆该汉字时的先后顺序排列在一起,形成一个字符或一个新字符串,这个字符或这个新字符串即为该汉字的编码。
4.两个或两个以上汉字的词、词组、短语、语句的编码规则
先取出组成该词、词组、短语或语句的第一个汉字杨码(关于汉字杨码概念,见下面所述)中的全部字符,再分别依次取出其后各个汉字的每一个汉字杨码中的第一个字符,然后将取出的所有字符按其被取出时的先后顺序排列在一起,组合成一个新字符串,这个新字符串就是该两个或两个以上汉字的词、词组、短语或语句的编码。
5.非汉字字符或图形的编码规则
(1)当非汉字字符或图形是由本发明中所定义的字元构成时,那么,这个非汉字字符或图形的编码规则均同汉字单字、词、词组、短语、语句的编码规则;
(2)当非汉字字符或图形不是由本发明中所定义的字元构成时,那么,这个非汉字字符或图形的编码规则由用户自行定义,但必须保证用户自行定义中的所有非汉字字符或图形的编码字符类型均要与同版本中的汉字编码所使用的字符类型保持一致。
三、汉语杨码
本发明中所指的汉语杨码是单个汉字的杨码、两个或两个以上汉字的词、词组、短语、语句的杨码、非汉字字符和图形的杨码和汉字容错码的统称。
1.单个汉字的杨码
(1)当单个汉字的编码只有一个字符时,那么,这个字符就作为该汉字的杨码;
(2)当单个汉字的编码是一个不足5个字符的字符串时,那么,这个字符串就作为该汉字的杨码;
(3)当单个汉字的编码是一个超过4个字符的字符串时,那么,按照该汉字编码字符的先后顺序取出该汉字编码字符串的前4个字符,这前4个字符按照原来的先后顺序排列后所构成的新字符串就作为该汉字的杨码。
2.两个或两个以上汉字的词、词组、短语或语句的杨码
(1)当构成汉字的词、词组、短语或语句的汉字总数不足7个汉字时,那么,该汉字的词、词组、短语或语句的编码就作为该汉字的词、词组、短语或语句的杨码;
(2)当构成汉字的词、词组、短语或语句的汉字总数超过6个汉字时,那么,取该汉字的词、词组、短语或语句的前6个汉字的编码作为该汉字的词、词组、短语或语句的杨码。
3.非汉字字符或图形的杨码
(1)当非汉字字符或图形是由本发明中所定义的字元构成时,那么,这个非汉字字符或图形的取码规则均同汉字单字、词、词组、短语、语句的取码规则,即将此类非汉字字符或图形均视同汉字单字、词、词组、短语、语句来处理;
(2)当非汉字字符或图形不是由本发明中所定义的字元构成时,那么,这个非汉字字符或图形的取码规则由用户自行定义,但必须要使用户自行定义中的所有非汉字字符和图形的杨码字符类型均要与同版本中的汉字杨码字符类型保持一致。
4.容错码
为了兼顾部分人的习惯,本发明容许部分汉字以下列“不规范”方式编码后所取得的“杨码”作为该汉字的容错码。本发明支持下列容错码的存在:
(1)支持笔顺容错
笔顺容错是指:每个汉字除了按1997年4月7日国家语言文字工作委员会和国家新闻出版署联合发布的《现代汉语通用字笔顺规范》规定的标准笔顺外,其中部分汉字还具有另外一个或多个人们习惯上采用的其它笔顺,本发明中称该笔顺为该汉字的异笔顺;本发明容许汉字异笔顺存在的现象被称为笔顺容错;汉字以异笔顺编码后所取得的杨码,称之为笔顺容错码;本发明支持笔顺容错码的存在,即支持笔顺容错。
(2)支持笔画笔形容错
笔画笔形容错是指:部分汉字中的部分笔画笔形易使人误解,在本发明中容许这种误解存在的现象被称为笔画笔形容错;汉字以误解的笔画笔形编码后所取得的杨码,称之为笔画笔形容错码;本发明支持笔画笔形容错码的存在,即支持笔画笔形容错。
(3)支持视拆容错
视拆容错是指:人们在视拆汉字过程中,常常将部分汉字的字元拆错;在本发明中容许这种拆错汉字字元存在的现象被称之为视拆容错;汉字以拆错的字元编码后所取得的杨码,称之为视拆容错码;本发明支持视拆容错码的存在,即支持视拆容错。
(4)支持自定义容错
自定义容错是指:人们为了某种目的,有意识地将某些汉字的单字、词、词组、短语、语句、非汉字字符或图形的杨码自行定义成一种缩写形式或密码形式出现;以这种形式所取得的杨码,称之为自定义容错码;本发明支持自定义容错码的存在,即支持自定义容错。
四、杨码汉字输入法
1.定义中文信息处理设备
本发明中所指的中文信息处理设备,除了至少要配备有运算器、控制器、存贮器、输入设备或输入装置、输出设备或输出装置外,至少还要配备有与其硬件相适应的中文操作系统和杨码汉字输入法系统。
2.定义杨码汉字输入法
将汉语中的字、词、词组、短语和语句、非汉字字符和图形用其杨码形式输入到中文信息处理设备中,以达到用杨码输入中文信息的目的,此种输入法被称之为杨码汉字输入法。
3.杨码汉字输入法分类
(1)按照杨码字符类型分类
①数字型杨码汉字输入法
由数字型字元代码编码后所取得的杨码即为数字型杨码,用数字型杨码输入中文信息的方法,称之为数字型杨码汉字输入法。
②字母型杨码汉字输入法
由字母型字元代码编码后所取得的杨码即为字母型杨码,用字母型杨码输入中文信息的方法,称之为字母型杨码汉字输入法。
③其它型杨码汉字输入法
由其它型字元代码编码后所取得的杨码即为其它型杨码,用其它型杨码输入中文信息的方法,称之为其它型杨码汉字输入法。
(2)按照所用的输入设备或装置分类
①键盘式杨码汉字输入法
a 键盘式数字型杨码汉字输入法
本法采用通用的数字键盘或通用英文键盘或其它键盘上所配置的数字键盘,人工敲击其上所配置的数字键,按序输入与想要输入的中文信息杨码及其选择码字符所对应的数字型字符,就会将中文信息的杨码及其选择码输入到中文信息处理设备中,以达到利用数字型杨码输入中文信息的目的。本发明中用此法输入中文信息的方法被称为键盘式数字型杨码汉字输入法。
b 键盘式字母型杨码汉字输入法
本法采用通用的英文键盘或其它键盘,人工敲击其上所配置的英文字母键、数字键和翻页键,按序输入与想要输入的中文信息杨码字符所对应的字母型字符和与其选择码字符所对应的数字型字符,就会将中文信息杨码及其选择码输入到中文信息处理设备中,以达到利用字母型杨码输入中文信息的目的。本发明中用此法输入中文信息的方法被称为键盘式字母型杨码汉字输入法。
c 键盘式其它型杨码汉字输入法
本法采用通用英文键盘或通用数字键盘或其它键盘,人工敲击其上所配置的其它字符键、英文字母键、数字键和翻页键,按序输入与想要输入的中文信息杨码及其选择码字符所对应的字符,就会将中文信息杨码及其选择码输入到中文信息处理设备中,以达到利用其它型杨码输入中文信息的目的。本发明中用此法输入中文信息的方法被称为键盘式其它型杨码汉字输入法。
②鼠标式杨码汉字输入法
本法采用通用中文信息处理设备中所配置的鼠标输入设备或装置,人工用鼠标按序点击该中文信息处理设备上的显示屏中所显示出来的虚拟键盘上与想要输入的中文信息杨码及其选择码字符所对应的字符虚拟键,就会将要输入的中文信息杨码及其选择码输入到中文信息处理设备中,以达到利用杨码输入中文信息的目的,或者,人工用鼠标点击在该中文信息处理设备上显示屏中所显示出来的杨码输入法窗口界面中的与想要输入的中文信息所对应的中文信息提示处,就会将要输入的中文信息输入到中文信息处理设备中,以达到利用鼠标输入中文信息的目的。本发明中用此法输入中文信息的方法被称为鼠标式杨码汉字输入法。
③触摸式杨码汉字输入法
本法采用通用中文信息处理设备中所配置的触摸输入设备或装置,人工用触笔或手指或其它器物触摸该中文信息处理设备上显示屏中所显示出来的杨码输入法窗口界面中的与想要输入中文信息杨码及其选择码字符所对应的信息提示处,就会将要输入的中文信息输入到中文信息处理设备中,以达到利用触摸方式输入中文信息的目的。本发明中用此法输入中文信息的方法被称为触摸式杨码汉字输入法。
④书写式杨码汉字输入法
本法采用通用中文信息处理设备中所配置的书写输入设备或装置,在其书写板上,用书写笔按顺序书写与想要输入的中文信息杨码及其选择码字符相对应的字符,就会将要输入的中文信息杨码及其选择码输入到中文信息处理设备中,以达到利用杨码输入中文信息的目的。本发明中用此法输入中文信息的方法被称为书写式杨码汉字输入法。
⑤语音式杨码汉字输入法
本法采用通用中文信息处理设备中所配置的语音输入设备或装置,用其按顺序输入与想要输入的中文信息杨码及其选择码字符相对应的语音,就会将要输入的中文信息杨码及其选择码输入到中文信息处理设备中,以达到利用杨码输入中文信息的目的。本发明中用此法输入中文信息的方法被称为语音式杨码汉字输入法。
4.输入中文信息的步骤
本发明中,对于不同的中文信息处理设备和不同的中文操作系统,所配置的杨码汉字输入系统也不同,同时,输入中文信息的步骤也有区别,现分述如下:
(1)用键盘输入中文信息
①键盘式数字型杨码汉字输入法
采用此法的中文信息处理设备中,其输入设备或装置至少要配备有能够用于输入各个阿拉伯数字字符的数字键、退格键、确定键,其输出设备或装置至少要配备有显示屏设备或装置,其系统软件中至少要配备有与其硬件相适应的中文操作系统和键盘式数字型杨码汉字输入系统。
用此法输入中文信息的步骤是:首先打开要输入中文信息的文本,在其上定位好输入中文信息的位置后,再进入键盘式数字型杨码汉字输入系统,此时,屏幕上显示出杨码汉字输入法窗口开始状态时的界面;然后按照要输入的中文信息杨码字符的前后顺序逐一地用手指敲击键盘上与之相对应的数字键,这时,显示屏上的杨码汉字输入法窗口界面内也随之逐屏显示出与输入字符或字符串相对应的具有同杨码和联想关系的中文信息及其选择码;当敲击完要输入的中文信息的全部杨码及其选择码字符后,此时,如果显示屏上的杨码汉字输入法窗口界面内不再显示出其它中文信息,则系统就会自动地将要输入的中文信息输入到中文信息处理设备中,并且在要输入中文信息文本中所确定好的位置上显示出来,同时屏幕上又重新显示出杨码汉字输入法窗口开始状态时的界面,等待操作者输入下一条中文信息或进行其它操作;如果显示屏上的杨码汉字输入法窗口界面内还在继续显示出其它中文信息及其选择码,这时只要敲击一下键盘上的确定键,系统就会自动地将要输入的中文信息输入到中文信息处理设备中,并且在要输入中文信息文本中所确定好的位置上显示出来,同时屏幕上又重新显示出杨码汉字输入法窗口开始状态时的界面,等待操作者输入下一条中文信息或进行其它操作。
②键盘式字母型杨码汉字输入法
采用此法的中文信息处理设备中,其输入设备或装置至少要配备有用于输入字母型杨码各个英文字母字符的字母键、用于输入各个阿拉伯数字字符的数字键、翻页键、退格键和确定键,其输出设备或装置至少要配备有显示屏设备或装置,其系统软件中至少要配备有与其硬件相适应的中文操作系统和键盘式字母型杨码汉字输入系统。
用此法输入中文信息的步骤是:首先打开要输入中文信息的文本,在其上定位好输入中文信息的位置后,再进入键盘式字母型杨码汉字输入系统,此时,屏幕上显示出杨码汉字输入法窗口开始状态时的界面;然后按照要输入的中文信息杨码字符的前后顺序逐一地用手指敲击键盘上相对应的字母键,这时,显示屏上的杨码汉字输入法窗口界面内也随之逐屏显示出与输入字符或字符串相对应的具有同杨码和联想关系的中文信息及其选择码;当敲击完与要输入的中文信息相对应的的全部杨码字符字母键及其选择码字符键后,此时,系统就会自动地将要输入的中文信息输入到中文信息处理设备中,并且在要输入中文信息文本中所确定好的位置上显示出来,同时屏幕上又重新显示出杨码汉字输入法窗口开始状态时的界面,等待操作者输入下一条中文信息或进行其它操作。
③键盘式其它型杨码汉字输入法
采用此法的中文信息处理设备中,其输入设备或装置至少要配备有用于输入其它型杨码字符的各个字符键、用于选择中文信息的各个阿拉伯数字字符的数字键、翻页键、退格键和确定键,其输出设备或装置至少要配备有显示屏设备或装置,其系统软件中至少要配备有与其硬件相适应的中文操作系统和键盘式其它型杨码汉字输入系统。
用此法输入中文信息的步骤是:首先打开要输入中文信息的文本,在其上定位好输入中文信息的位置后,再进入键盘式其它型杨码汉字输入系统,此时,屏幕上显示出杨码汉字输入法窗口开始状态时的界面;然后按照要输入的中文信息杨码字符的前后顺序逐一地用手指敲击键盘上相对应的字符键,这时,显示屏上的杨码汉字输入法窗口界面内也随之逐屏显示出与输入字符或字符串相对应的具有同杨码和联想关系的中文信息及其选择码;当敲击完要输入的中文信息相对应的的全部杨码及其选择码字符键后,此时,系统就会自动地将要输入的中文信息输入到中文信息处理设备中,并且在要输入中文信息文本中所确定好的位置上显示出来,同时屏幕上又重新显示出杨码汉字输入法窗口开始状态时的界面,等待操作者输入下一条中文信息或进行其它操作。
(2)用鼠标输入中文信息
采用此法的中文信息处理设备中,其输入设备或装置至少要配备有通用的鼠标设备或装置,其输出设备或装置至少要配备有显示屏设备或装置,其系统软件中至少要配备有与其硬件相适应的中文操作系统和鼠标式杨码汉字输入系统。
用此法输入中文信息的步骤是:首先打开要输入中文信息的文本,在其上定位好要输入中文信息的位置后,再进入鼠标式杨码汉字输入系统,此时,屏幕上显示出杨码汉字输入法窗口开始状态时的界面;然后用手操作鼠标设备或装置,按照要输入的中文信息杨码字符的前后顺序逐一地去点击杨码汉字输入法窗口界面内的与之相对应的信息提示处,或按照要输入的中文信息杨码字符的前后顺序逐一地去点击与要输入的中文信息杨码字符相对应的字符按钮,这时,显示屏上的杨码汉字输入法窗口界面内也随之逐屏显示与点击过信息具有同杨码和联想关系的信息;当点击到与要输入的中文信息相符的信息后,或当点击完与要输入的中文信息的杨码及其选择码相对应的全部字符后,系统就会自动地将要输入的中文信息输入到中文信息处理设备中,并且在要输入中文信息文本中所确定好的位置上显示出来,同时屏幕上又重新显示出杨码汉字输入法窗口开始状态时的界面,等待操作者输入下条中文信息或进行其它操作;或者,当点击到与要输入的中文信息相符的信息后,如果显示屏上不再显示出其它中文信息及其选择码,则系统就会自动地将要输入的中文信息输入到中文信息处理设备中,并且在要输入中文信息文本中所确定好的位置上显示出来,同时屏幕上又重新显示出杨码汉字输入法窗口开始状态时的界面,等待操作者输入下条中文信息或进行其它操作;如果显示屏上杨码汉字输入法窗口界面内还在继续显示出其它中文信息及其选择码,则点击一下杨码汉字输入法窗口界面内的确定处后,系统就会自动地将要输入的中文信息输入到中文信息处理设备中,并且在要输入中文信息文本中所确定好的位置上显示出来,同时屏幕上又重新显示出杨码汉字输入法窗口开始状态时的界面,等待操作者输入下条中文信息或进行其它操作。
(3)用触摸法输入中文信息
采用此法的中文信息处理设备中,其输入和输出设备或装置至少要配备有通用的触摸屏设备或装置,其系统软件中至少要配备有与其硬件相适应的中文操作系统和触摸式杨码汉字输入系统。
用此法输入中文信息的步骤是:首先打开要输入中文信息的文本,在其上定位好要输入中文信息的位置后,再进入触摸式杨码汉字输入系统,此时,屏幕上显示出杨码汉字输入法窗口开始状态时的界面;然后用手或笔或其它器物按照要输入的中文信息字符的前后顺序逐一地触摸杨码汉字输入法窗口界面内的与之相对应的信息提示处,这时,显示屏上的杨码汉字输入法窗口界面内也随之逐屏显示与触摸过的信息具有同杨码和联想关系的信息;当触摸到与要输入的中文信息相符的信息后,如果显示屏上不再显示出其它中文信息及其选择码,则系统就会自动地将要输入的中文信息输入到中文信息处理设备中,并且在要输入中文信息文本中所确定好的位置上显示出来,同时屏幕上又重新显示出杨码汉字输入法窗口开始状态时的界面,等待操作者输入下条中文信息或进行其它操作;如果显示屏上杨码汉字输入法窗口界面内还在继续显示出其它中文信息及其选择码,则触摸一下杨码汉字输入法窗口界面内的确定处后,系统就会自动地将要输入的中文信息输入到中文信息处理设备中,并且在要输入中文信息文本中所确定好的位置上显示出来,同时屏幕上又重新显示出杨码汉字输入法窗口开始状态时的界面,等待操作者输入下条中文信息或进行其它操作。
(4)用书写法输入中文信息
采用此法的中文信息处理设备中,其输入设备或装置至少要配备有通用的书写笔和书写板设备或装置,其输出设备或装置至少要配备有显示屏设备或装置,其系统软件中至少要配备有与其硬件相适应的中文操作系统和书写式杨码汉字输入系统。
用此法输入中文信息的步骤是:首先打开要输入中文信息的文本,在其上定位好要输入中文信息的位置后,再进入书写式杨码汉字输入系统,此时,屏幕上显示出杨码汉字输入法窗口开始状态时的界面;然后用书写笔将要输入的中文信息杨码字符按照前后顺序逐一地书写到书写板上,这时,显示屏上的杨码汉字输入法窗口界面内也随之逐屏显示出与输入过的字符或字符串相对应的具有同杨码和联想关系的信息;当书写完要输入中文信息杨码及其选择码的全部字符后,此时,如果显示屏上不再显示出其它中文信息及其选择码,则系统就会自动地将要输入的中文信息输入到中文信息处理设备中,并且在要输入中文信息的文本中所确定好的位置上显示出来,同时屏幕上又重新显示出杨码汉字输入法窗口开始状态时的界面,等待操作者输入下条中文信息或进行其它操作;如果显示屏上杨码汉字输入法窗口界面内还在继续显示出其它中文信息及其选择码,则在书写板上写上确定符后,系统就会自动地将要输入的中文信息输入到中文信息处理设备中,并且在要输入中文信息的文本中所确定好的位置上显示出来,同时屏幕上又重新显示出杨码汉字输入法窗口开始状态时的界面,等待操作者输入下条中文信息或进行其它操作。
(5)用语音输入中文信息
采用此法的中文信息处理设备中,其输入设备或装置至少要配备有通用的语音输入设备或装置,其输出设备或装置至少要配备有显示屏设备或装置,其系统软件中至少要配备有与其硬件相适应的中文操作系统和语音式杨码汉字输入系统。
用此法输入中文信息的步骤是:首先打开要输入中文信息的文本,在其上定位好要输入中文信息的位置后,再进入语音式杨码汉字输入系统,此时,屏幕上显示出杨码汉字输入法窗口开始状态时的界面;然后用语音输入设备或装置将要输入的中文信息杨码字符以其语音的形式按照前后顺序逐一地通过语音输入设备或装置送入到中文信息处理设备中,这时,显示屏上的杨码汉字输入法窗口界面内也随之逐屏地显示出与输入过的字符或字符串相对应的具有同杨码和联想关系的信息;当输入完要输入中文信息杨码及其选择码的全部字符后,此时,如果显示屏上杨码汉字输入法窗口界面内不再显示出其它中文信息及其选择码,则系统就会自动地将要输入的中文信息输入到中文信息处理设备中,并且在要输入中文信息文本中所确定好的位置上显示出来,同时屏幕上又重新显示出杨码汉字输入法窗口开始状态时的界面,等待操作者输入下条中文信息或进行其它操作;如果显示屏上的杨码汉字输入法窗口界面内还在继续显示出其它中文信息及其选择码,则输入确定符的读音后,系统就会自动地将要输入的中文信息输入到中文信息处理设备中,并且在要输入中文信息文本中所确定好的位置上显示出来,同时屏幕上又重新显示出杨码汉字输入法窗口开始状态时的界面,等待操作者输入下条中文信息或进行其它操作。
5.容许各类输入法共存
在上述各类杨码汉字输入法的各个版本的实际应用中,本发明能够让它们分别在各个中文信息处理设备中单独存在和应用,也能够让它们之中的几类或全部同时共存于同一个中文信息处理设备中进行分别提取或同时提取和应用,还能够让它们之中的之一或几种或全部与其它非杨码汉字输入法中的一种或几种同时共存于同一个中文信息处理设备中进行分别提取或同时提取和应用。
6.杨码汉字输入法窗口界面
本发明中的杨码汉字输入法窗口界面的形式分两类:一类是各种Windows中文信息操作系统中所提供的输入法生成器所生成的杨码汉字输入法窗口界面形式;另一类是本发明中自创的一类杨码汉字输入法窗口界面形式,这类杨码汉字输入法窗口界面形式至少具有如下设置:
(1)该窗口界面内设置一个编辑框,用来显示和编辑已输入的中文信息杨码和选择码(含输入法窗口界面内的中文信息提示栏翻页码)的字符或字符串;
(2)该窗口界面内设置一个中文信息提示栏,用来显示与编辑框中的字符或字符串相对应的具有同杨码或联想关系的中文信息;
(3)该窗口界面内,在中文信息提示栏内的每条中文信息的前端都设置一个用来选择该中文信息的选择码提示符;
(4)该窗口界面内,在中文信息提示栏内的每条中文信息上面都设置一个用来选择该中文信息或选择该中文信息选择码提示符的不可见按钮;
(5)该窗口界面内设置有翻页符,并且,在翻页符上面设置有不可见按钮,用来翻页中文信息提示栏;
(6)该窗口界面内设置一个确定处,并且,在此确定处具有一个不可见按钮,用来确定已选定的中文信息;
(7)该窗口界面内设置一个窗口界面的关闭按钮,用以关闭该窗口界面。
五、杨码汉字检索法
1.定义杨码序排列
本发明所指的杨码序排列,是指汉字的单字、词、词组、短语和语句以及非汉字字符和图形等信息的条目是按照其杨码字符和字符串的自然序列排列。
2.定义杨码字典
本发明所指的杨码字典,是指字典中的目录、索引、检字表、正文等其全部或其部分条目是依照杨码序排列的字典。
3.定义杨码词典
本发明所指的杨码词典,是指词(辞)典中的目录、索引、检字表、正文等其全部或其部分条目是依照杨码序排列的词(辞)典。
4.定义杨码信息记录
本发明所指的杨码信息记录,是指信息记录中的目录、索引、检字表、正文等其全部或其部分条目是依照杨码序排列的信息记录。
5.定义信息条目字头
本发明所指信息条目字头,是指本发明中的杨码字典、杨码词典或其它杨码信息记录中的目录、索引、检字表、正文等信息记录条目中的每条信息条目的第一个汉字。
6.定义杨码汉字检索法
本发明所指的杨码汉字检索法,是指按照要检索的信息条目字头的杨码去检索杨码字典或杨码词典或杨码信息记录中的与该信息条目字头杨码相关的信息的方法。
7.检索杨码信息条目的方法及其步骤
用杨码去检索杨码字典或杨码词典或杨码信息记录中的依据杨码序排列的信息条目的方法和步骤很简单:按照要检索的信息条目字头的杨码,直接从杨码字典或杨码词典或杨码信息记录中按照杨码序查找该信息条目字头的杨码,找到了该信息条目字头的杨码后,在相同信息条目字头杨码的信息中再找该信息条目;或者,按照要检索信息条目字头的杨码或要检索信息条目的杨码,先从杨码与信息正文页码的对照表中查到该杨码所处的信息正文中的页码,再按照信息正文中的页码查找该信息条目。
六、中文信息排序规则
1.定义重码
在同一汉字系统的同版本汉字输入法或汉字检索法中,当中文信息条目之间具有完全相同的杨码时,本发明就称这些中文信息条目具有重码。
2.定义选择码
当中文信息条目具有重码时,为了使它们各自具有一个唯一只代表自己而又能用来区别其它同杨码中文信息条目的代码,本发明采用给它们各自的杨码字符之后增加一个互不相同的字符或字符串,用来区分它们。这个用来区分它们的字符或字符串,就称为它们各自的选择码。将它们各自的杨码字符与其选择码字符按序排列后所构成的新字符串,就是唯一只代表它们各自的代码。
3.在杨码汉字输入法和杨码汉字检索法中,其信息条目的排序规则有所不同,现分述如下:
(1)杨码汉字输入法中的信息条目排序规则
①单个汉字的排序规则:
a在简体汉字系统或繁体汉字系统中的同版本杨码汉字输入法中,对于不同杨码的单个汉字是按照各个汉字杨码字符的自然序列升序排序,对于同杨码的单个汉字是按照汉字的使用频度(指该汉字与其同杨码汉字比较,在日常使用中所出现的频率,以下同)排序,使用频度高者排在前面,使用频度低者排在后面;
b在简繁体汉字共存系统中的同版本杨码汉字输入法的中,对于不同杨码的单个汉字是按照各个汉字杨码字符的自然序列升序排序,对于同杨码的单个汉字是先按照汉字的使用频度排序好简体汉字后,再接着按照汉字的使用频度分别排序好未排到的同杨码的繁体汉字和异体汉字,而且,在同杨码的简体汉字中,使用频度高者排在前面,使用频度低者排在后面,同样,在同杨码的繁体汉字和异体汉字中,分别将使用频度高者排在前面,使用频度低者排在后面。
②两个或两个以上汉字的词、词组、短语和语句的排序规则:
a同杨码的两个或两字以上汉字的词、词组、短语和语句在同版本杨码汉字输入法中均排在同杨码的单个汉字(除容错码单个汉字外)之后;
b同杨码的两个或两个以上汉字的词、词组、短语和语句之间的排序是按照其汉字个数的多少进行排序,即字数少的词、词组、短语和语句排在前面,字数多的词、词组、短语和语句排在后面。
c不同杨码的两个或两个以上汉字的词、词组、短语和语句的排序是按照其杨码字符的自然序列升序排序。
③非汉字字符和图形的排序规则:
非汉字字符和图形在各个版本中的排序规则,均与同杨码汉字的排序规则相同,即非汉字字符和图形在各个版本中均视同汉字的单字、词、词组、短语或语句来处理。
④容错码汉字的排序规则:
a在同版本中,依据容错码规则编码和取码的汉字,均排在依据标准码规则编码和取码的同杨码汉字的单字、词、词组、短语和语句之后;
b在同版本中,依据容错码规则编码和取码的同杨码汉字之间,使用频度高者排在前面,使用频度低者排在后面;
c在同版本中,依据容错码规则编码和取码的同杨码两个或两个以上汉字的词、词组、短语和语句均排在其同容错码单个汉字之后,而它们之间则是按照其汉字个数的多少进行排序,即字数少的词、词组、短语和语句排在前面,字数多的词、词组、短语和语句排在后面。
(2)杨码汉字检索法中的中文信息排序规则
杨码汉字检索法中的中文信息排序是指中文信息在依据杨码序排列的字典、词(辞)典或其它信息记录中的排序,其排序规则如下:
①字头及其信息的排序规则:
在以杨码序排列的同版本中文信息中,对于不同杨码的字头及其信息是按照各个字头杨码字符的自然序列升序排序,对于同杨码的字头及其信息先是分别按照字头的简体汉字,繁体汉字,异体汉字的先后顺序排序后,再将简体汉字字头之间的同杨码字头及其信息或繁体汉字字头之间的同杨码字头及其信息或异体汉字字头之间的同杨码字头及其信息分别按照字头编码自然序列升序排序,同编码的单个汉字字头及其信息按照字头的使用频度排序,使用频度高者排在前面,使用频度低者排在后面。
②两个或两个以上汉字的词、词组、短语和语句及其信息排序规则:
a两个或两个以上汉字的词、词组、短语和语句及其信息在同版本中均排在其字头信息之后;
b字头相同的同杨码两个或两个以上汉字的词、词组、短语和语句及其信息之间的排序是按照同杨码两个或两个以上汉字的词、词组、短语和语句汉字个数的多少进行排序,即字数少的词、词组、短语和语句及其信息排在前面,字数多的词、词组、短语和语句及其信息排在后面,字数相同时,按其最后一个汉字编码字符串的自然序列升序排序;
c字头相同的不同杨码两个或两个以上汉字的词、词组、短语和语句及其信息之间的排序是按照不同杨码两个或两个以上汉字的词、词组、短语和语句杨码字符串的自然序列升序排序。
③非汉字字符和图形的排序规则:
非汉字字符和图形在各个版本中的排序规则,均与同杨码汉字的排序规则相同,即非汉字字符和图形在各个版本中均视同汉字的单字、词、词组、短语或语句来处理。
④容错码汉字的排序规则:
a 在同版本中,依据容错码规则编码和取码的字头,均排在与其同杨码且依据标准码规则编码和取码的字头汉字的单字、词、词组、短语和语句及其信息之后,并在该容错码汉字字头旁边标注上其标准码;
b 在同版本中,依据容错码规则编码和取码的同杨码汉字字头及其信息之间的排序是按照它们字头编码字符的自然序列升序排序;同编码的容错码汉字字头是按照其使用频度排序,使用频度高者及其信息排在前面,使用频度低者及其信息排在后面。
七、非汉字字符和图形
1.定义非汉字字符和图形
除汉字字符以外的其它字符和图形在本发明中均被称之为非汉字字符和图形。
2.对非汉字字符和图形的处理
(1)如果非汉字字符或图形的字节是以单字节或双字节形式存在的,则本发明就把它们分别视同单个英文字母或单个汉字来处理;
(2)如果它们是以两个以上(不含两个)的多字节形式存在的,则本发明就把它们分别视同两个或两个以上的汉字词、词组、短语或语句来处理。
八、造词功能
本发明为了方便用户和提高中文信息的输入速度,在各个版本的杨码汉字输入法中均设置有用户造词功能系统。为了使杨码汉字输入法中具有造词功能,本发明在该输入法系统中设置有:
1.用户词库
用户词库是用以贮存用户和管理者自造的词、词组、短语、语句、非汉字字符和图形信息的词库,这样,用户在输入中文信息的过程中,就可以随时从用户词库中提取有关的信息输入到要输入的信息文本中,也便于管理者用来管理和维护词库中的的信息。
在本发明中,用户词库以下列两种形式之一或两种形式的混合存在于杨码汉字输入法系统中:
(1)用户自造的信息是单独贮存在用户专用的词库中;
(2)用户自造的信息是与本发明中已有的中文信息库共存在同一个或同一组词库中。
2.造词功能软件
本发明的用户造词功能软件以下列三种形式之一或其混合存在:
(1)利用已配备的中文信息处理系统中的造词功能软件;
(2)杨码汉字输入法系统中自带的用户手工造词功能软件;
(3)杨码汉字输入法系统中自带的自动造词功能软件。
九、本发明具有以下优缺点:
1.优点:
(1)规范
本发明使用的汉字部件(字元)和笔顺规则均符合国家语言文字规范。
(2)规则简单
本发明按照笔顺和优先取大的规则视拆汉字,按照字元代码及其视拆顺序进行编码和取码。
(3)字元分布规律强
本发明根据字形的宏观结构,对字元进行归类,使字元有规律地分布在五类基本笔画共九大区域的50(或51)组内,之间互为独立性强,易区分,不混淆,不模糊。
(4)编码连续,思维连贯
本发明按照书写习惯顺序对单字、词、词组、短语、语句连续编码,完全符合常人书写汉字的习惯,遇字知码,思维连贯,能够连续输入汉字和直接检索汉字。
(5)适应性强
①不受语言影响
本发明除语音式杨码汉字输入法使用十多个字符语音外,其余的杨码汉字输入法和汉字检索法均不受使用者的语音影响,即使使用语音式杨码汉字输入法,因为只用十多个字符语音就可以输入中文信息,所以,对于语音水平差的人来说,也容易实现;
②不受设备影响
本发明中使用的中文信息处理设备均是目前通用的常规设备,对使用的设备和装置无特殊要求;
③.不受汉字系统影响
本发明在简体汉字系统、繁体汉字系统、简繁体汉字共存系统中,中文信息编码规则一致,而且,本发明中的汉字输入法和汉字检索法均能在各个汉字系统中实现;
④不受中文操作系统影响
本发明能够适应各个中文操作系统,能够中西文兼容输入,能够与目前已广泛应用的各种汉字输入法共存,并可以随时切换,使用非常方便。只要在各个中文信息处理设备中配备好与其相适应的中文操作系统和杨码汉字输入法系统,均能实现用本发明中的一种或几种杨码汉字输入法来输入中文信息;
⑤不受汉字字符集影响
本发明适应各种汉字字符集,在各种汉字字符集下,中文信息编码规则一致;
⑥不受专业水平影响
不论是专业操作人员还是非专业操作人员,不论操作人员的语文水平和普通话水平是高还是低,均能自由地应用本发明中的杨码汉字输入法来输入汉字和应用本发明中的杨码汉字检索法来检索汉字;
⑦具有可扩张性
a本发明根据用户的需要,可以“定做”杨码汉字输入法,即采用变换杨码汉字输入法中的编码字符的方法,以满足用户个性化的用键习惯和要求,用自己想用的输入键来输入中文信息;
b对一些专用词语,用户可以按其缩写形式编码输入;
c对一些保密用词语,用户可以用其密码形式编码输入;
d对一些用户自己的常用词语,用户可以采用自造词语的方式将其编码再取码后贮存在用户词库中,以便以后随时可以提取和输入。
(6)用键少
①在键盘式数字型杨码汉字输入法中输入键加翻页键加选择键只用十个数字键;
②在键盘式字母型杨码汉字输入法中,比通用的拼音汉字输入法和通用的五笔字型汉字输入法均至少要少用16个键。
(7)击键次数少
本发明中,单字,词,词组,短语,语句可连续输入;单个汉字一般只要击2至5次键即可输入;按汉字的单字、词、词组、短语、语句联想输入统计,一般平均每个字只要击2次键即可输入。
(8)易数码化
因本发明中数字型杨码汉字输入法中能用阿拉伯数字直接对中文信息进行编码,所以,本发明能用阿拉伯数字键来输入中文信息,能用书写阿拉伯数字的形式来输入中文信息,能用输入阿拉伯数字的语音形式来输入中文信息,能直接用数码形式传输中文信息;因本发明中能用阿拉伯数字对字典、词(辞)典和其它信息记录中的条目进行排序,所以,本发明能直接用阿拉伯数字来检索杨码序排列的字典、词(辞)典和其它信息记录中的条目。
(9)容错性强
本发明支持笔顺容错,支持笔画笔形容错,支持视拆容错,支持自定义容错,从而为用户提供了汉字冗余的输入路径。
(10)合理的重码
本发明中中文信息重码率比目前广泛使用的拼音汉字输入法重码率低。如果在本发明中是采用国标GB2312-80汉字字符集中的6763个汉字作为杨码汉字输入法中的用字,则其中绝大部分重码汉字不超过10个,即重码的汉字不用翻页就能选择到。
(11)易实现书写输入
本发明在书写式杨码汉字输入法中,只要书写10个阿拉伯数字字符和用于代表退格键、确定键等几个简单的字符,就可以输入信息、选择信息和确定其输入的信息。
(12)易实现语音输入
本发明在语音式杨码汉字输入法中,只要输入10个阿拉伯数字字符和用于代表退格键、确定键等几个简单的字符的语音,就可以输入信息、选择信息和确定其输入的信息;
(13)易实现非汉字字符和图形输入
本发明能将非汉字字符和图形以汉字杨码形式输入到要输入的文本中,这样极大地方便了非汉字字符和图形输入,也极大地有利于文本的编辑。
(14)易实现用户自造词输入
本发明中具有用户自造词功能系统和用户自造词库,可以实现用户自造词输入,极大地提高了用户的输入中文信息的速度。
(15)兼容性好
①本发明保持了汉字传统部首的精华,并且按照汉字的常规笔顺规则对汉语信息进行编码,所以,本发明与已有的中文知识和习惯兼容性好;
②本发明输入法窗口界面保持或类似于传统的Windows中文输入法窗口界面,其输入信息的方式和步骤也类似于传统的中文输入法,所以,本发明与已有的中文输入法兼容性好,这样,既有利于操作者学习,也利于操作者掌握和应用它。
综上所述,本发明具有易学、易记、简单、快捷和方便各类人员使用的特点。
2.缺点:
本发明虽然具有以上的优点,但还存在有以下不足之处:
(1)存在有重码
在本发明中,有些汉字的单字、词、词组、短语或语句还存在有重码,而且,其中的单个汉字和双汉字词的重码率还较高,在输入中文信息的过程中,要输入具有重码的汉字的单字、词、词组、短语或语句,必须要经过一次选择过程才能输入该汉字的单字、词、词组、短语或语句,这样,既降低了输入速度,也增加了劳动强度。
(2)字元较多
在本发明中,字元还较多,为了记住字元和字元的代码,还存在有一定的记忆量。
(3)词库量大
在本发明中,为了提高输入中文信息的速度,减少击键次数,降低劳动强度,在词库容量许可的情况下,本发明采用了增加词语量的方法来解决,特别是要增加三个汉字和三个汉字以上的常用词语库存量,因为,随着词语条目字数的增加,词语出现的重码率就会大大地降低,这就有利于对词语的选择和输入。但是,在采用增加词语量的同时,又会遇到下列两个难题:
①本发明的汉字输入法如果是用目前广泛使用的Windows输入法生成器生成的,则词库容量会受到已存在的Windows词库容量大小的约束;
②本发明的汉字输入法如果不是用目前广泛使用的Windows输入法生成器生成的,而是由本发明中的软件系统所生成,则词库容量可以增加到千倍以上,但是,如果还是采用一个词库或两个词库来贮存数千万条词语,则随着这词语量的增大,反之又会影响到输入中文信息的速度,因此,这是一对矛盾。
十、克服缺点的措施
为了减小以上各种缺点对杨码汉字输入法的影响,本发明采取以下措施:
1.减小重码影响的措施
(1)本发明中对重码的汉字的单字、词、词组、短语或词句之间是按照其使用频度排序的,使用频度高者排在前面,使用频度低者排在后面,以达到频度高的汉字的单字、词、词组、短语或词句先见易选目的;
(2)本发明中采用尽量扩大常用词语库存量,特别是增加三字和三字以上的词、词组、短语和语句的库存量的方法,以达到更多地使用多字词来输入中文信息目的,以至减少汉字单字及其两字词重码多的影响;
(3)本发明中采用造词功能软件和用户词库系统,以及尽量扩大用户自用词贮存量的方法,以达到减少操作者对重码字词的选择,减少操作者击键次数和降低操作者劳动强度的目的。
2.减小字元影响的措施
本发明中字元的排序虽具有很强的规律性,但对于初学者来说,要找到此规律和记住字元及其代码,还需要学习。为了帮助用户学习和记住本发明中的字元及其代码,本发明中创造了以下的字元代码表和字元代码歌,分别列于以下:
(1)字元代码表
表7  简体汉字系统中的字元代码表
Figure A20041006473100351
表8  繁体汉字系统中的字元代码表
Figure A20041006473100352
 56789   乙*扌口人八亻氵   馬   尸耳日曰夕夂广疒   弓土士目金忄   女艹虫舟火   糹木宀
表9  简繁体汉字共存系统中的字元代码表
(2)字元代码歌
简体汉字系统中的字元代码歌
一王酉石车,扌耳土艹木;
二田山贝罒,口日目虫;
三月鱼犭饣,人夕钅舟:
四立羊米衤,氵广忄火宀;
五尸弓女纟,编码笔顺找;
Figure A20041006473100362
止爫门马,杨码检字妙。
繁体汉字系统中的字元代码歌
一王酉石車,扌耳土艹木;
二田山貝罒,口日目虫;
三月魚犭飠,人夕金舟;
四立羊米衤,氵广忄火宀;
五尸弓女糹,言码另外找;
Figure A20041006473100363
止爫門馬,杨码检字妙。
3.减小词库量影响的措施
在本发明中,为了提高输入中文信息的速度,减少击键次数,降低劳动强度,必须增加词库量。而单个词库的词库量过大反过来又会降低输入词语速度。为了解决单个词库的词库量过大反过来又会降低输入词语速度这一对矛盾,本发明中采取增加词库数量的方法,即将一个特大的词库分成若干个小词库,例如,将一个特大的数字型杨码信息词库按照其中文信息条目数字型杨码的第一个字符,分成9个数字型杨码信息小词库,然后,再通过计算机软件由计算机按照要输入的中文信息数字型杨码的第一个字符,选择其中与中文信息数字型杨码的第一个字符相对应的数字型杨码信息小词库,这就将一个特大的数字型杨码信息词库转换成一个数字型杨码信息小词库来为操作者提供有关的中文信息,这样做,既增加了信息的词库容量,又不会因词库容量的增加而影响到操作者输入中文信息的速度。
具体实施方式    实施例之一
本例是用Windows95中文版提供的输入法生成器生成本发明中一种键盘式字母型杨码输入法(版本HO54),其步骤如下:
1.确定汉字系统
目前国内外使用最广泛的是简体汉字系统,所以,本实施例中选用简体汉字系统作为本杨码汉字输入法版本HO54的汉字系统。
2.确定输入键
本杨码汉字输入法决定使用通用英文键盘字母键来输入其杨码字符,因此,在创建输入法前,先要确定好使用哪几个字母键来输入杨码字符,从而才能确定本输入法杨码所使用的字符。根据人体工程学原理,按照人们的动手习惯,绝大多数人使用右手的食指、中指和无名指这三只手指操作键盘键最方便和最灵活,而且,再根据通用英文键盘上键的分布规律和右手操作英文字母键的习惯,所以,决定在本输入法中采用英文字母键h、n、m、j、k、l、u、i、o作为杨码字符输入键。
3.字元代码
根据本输入法中所采用的杨码字符输入键是英文字母键h、n、m、j、k、l、u、i、o这九个键,这也就确定了本输入法中的字元代码所用的字符是h、n、m、j、k、l、u、i、o这九个字符,按照右手击键习惯,本实施例确定本输入法中的字元与其代码对照表如表4所示。
4.创建输入法
(1)编辑中文信息库
按照本发明的编码和取码规则,用已经确定了的字元代码对汉字的单字、词、词组、短语和语句进行编码和取码,编辑中文信息库,确定本输入法中所用的中文信息。
(2)编辑码表源文件
按照Windows95中文版所提供的输入法生成器中的方法,编辑本输入法码表源文件如下:
[Description]
Name=杨码
MaxCodes=9
MaxElement=2
UsedCodes=hijklmnou
WildChar=y
NumRules=5
[Rule]
ca6=p11+p12+p13+p14+p21+p31+p41+p51+p61
ce2=p11+p12+p13+p14+p21
ce3=p11+p12+p13+p14+p21+p31
ce4=p11+p12+p13+p14+p21+p31+p41
ce5=p11+p12+p13+p14+p21+p31+p41+p51
[Text]
一h
二hh
一直hh
中un
口岸un
口齿un
口内un
中专unh
中式unh
中医unh
中班unh
中毒unh
中转unh
中型unh
中亚unh
中雨unh
中下unh
中欧unh
中原unh
员uni
呗uni
中华uni
中途uni
中介uni
中外uni
中盘uni
中等uni
员工unih
中介人unii
中外合作uniii
中外合资uniij
中外合资企业uniijin
中华人民共和国uniiklm
中华全国工商联合会uniinhj
中华全国总工会uniinjh
中华全国妇女联合会uniinkk
噪音uuuuj
噪声uuuul
目瞪口呆uuuuu
(3)创建杨码输入法版本HO54
按照Windows95中文版所提供的输入法生成器中所规定的程序创建杨码输入法版本HO54。
5.用杨码输入法版本HO54输入中文信息
(1)打开要输入中文信息的文本编辑窗口(如写字板),使之处于活动状态,并且在其中定位好要输入中文信息光标所在位置;
(2)进入杨码输入法版本HO54
进入杨码输入法版本HO54有下列两种途径:
①使用键盘时,按Ctrl+Shift键在英文或各种中文输入法之间进行切换,直到切换到杨码输入法版本HO54,就进入了杨码输入法版本HO54;
②使用鼠标器时,只需单击任务栏上的键盘语言指示器,在显示出可选的输入法名称中,单击杨码输入法版本HO54,就进入了杨码输入法版本HO54。
(3)输入中文信息的三个例子
例一、输入汉字“中”字
①视拆汉字“中”字,得到汉字“中”字的两个字元“口”和“丨”及其代码分别是u和n;
②按照汉字的编码和取码规则,用汉字“中”字的字元“口”的代码u和字元“丨”的代码n对汉字“中”字进行编码和取码,得到汉字“中”字的编码和杨码均为un;
③按照汉字“中”字的杨码字符un分别按序敲击键盘上u键和n键各一下,汉字“中”的杨码所有字符un就被输入中文信息处理设备中,此时,屏幕上的外码输入窗口内也随之显示出其输入的所有字符un,同时屏幕上的候选窗口内也随之显示出与输入字符串un所构成杨码的所有同杨码和具有联想关系的所有中文信息及其选择码,等待操作者选择:
1:中
2:口岸
3:口齿
4:口内
5:中专h
6:中式h
7:中医h
8:中班h
9:中毒h
0:中转h
④敲击键盘上的数字键1或敲击键盘上的空格键一下,此时,汉字“中”字就被选中,并且被输入到要输入中文信息的文本编辑窗口(如写字板)中的光标处,同时,光标后移一格,屏幕上的候选窗口内也随之显示出与输入汉字具有联想关系的所有中文信息及其选择码,等待操作者选择:
1:中专
2:中式
3:中医
4:中班
5:中毒
6:中转
7:中型
8:中亚
9:中雨
0:中下
⑤因为操作者对屏幕上候选窗口内显示出来的及其经翻页后所显示出来的所有提示中文信息都不需要,所以操作者可以接着输入下一条想要输入的中文信息杨码字符或者进行其它的操作。
例二、输入词语“中华”
①按照汉字的单字、词、词组、短语和语句的编码和取码规则,得到词语“中华”的杨码uni;
②按照词语“中华”杨码字符uni,按序分别敲击键盘上u键、n键和i键各一下,词语“中华”的杨码所有字符uni就被输入中文信息处理设备中,此时,屏幕上的外码输入窗口内也随之显示出其输入的所有字符uni,同时屏幕上的候选窗口内也随之显示出与输入字符串uni所构成杨码的所有同杨码和具有联想关系的中文信息及其选择码,等待操作者选择:
1:员
2:呗
3:中华
4:中途
5:中介
6:中外
7:中盘
8:中等
9:员工h
0:中介人i
③敲击键盘上的数字键3一下,此时,词语“中华”就被选中,并且输入到要输入中文信息的文本编辑窗口(如写字板)中的光标处,同时,光标也后移到词语“中华”之后,屏幕上的候选窗口内也随之显示出与输入汉字具有联想关系的所有中文信息及其选择码,等待操作者选择:
1:中华人民共和国
2:中华全国工商联合会
3:中华全国总工会
4:中华全国妇女联合会
5:中华民族
6:中华儿女
④因为操作者对屏幕上候选窗口内显示出来的所有中文提示信息都不需要,所以操作者可以接着输入下一条想要输入的中文信息杨码字符或者进行其它的操作。
例三、输入词语“中华人民共和国”
①按照汉字的单字、词、词组、短语和语句的编码和取码规则,得到词语“中华人民共和国”的杨码uniiklm;
②按照词语“中华人民共和国”杨码字符uniiklm按序分别敲击键盘上相对应的英文字母键,当按序分别敲击键盘上u键、n键、i键、i键、k键各一下时,屏幕上的外码输入窗口内随之显示出其输入的所有字符uniik,同时,屏幕上的候选窗口内也随之显示出与输入字符串uniik有关的中文信息及其选择码,等待操作者选择:
1:中华人民共和国lm
③因为候选窗口内显示出来中文信息只有一条,所以操作者不必再输入词语“中华人民共和国”的杨码uniiklm其后的字符lm,可以直接敲击键盘上的数字键1或敲击键盘上的空格键一下,就会将词语“中华人民共和国”输入到要输入中文信息的文本编辑窗口(如写字板)中的光标处,同时,光标后移到词语“中华人民共和国”之后,屏幕上的候选窗口内随之消失,屏幕上的外码输入窗口内也随之显示出空白来,等待操作者输入下一条中文信息或者进行其它的操作。
实施例之二
本例是用自创软件生成本发明中一种键盘式数字型杨码输入法(版本54),其步骤如下:
1.确定汉字系统
目前国内外使用最广泛的是简体汉字系统,所以,本实施例中选用简体汉字系统作为本杨码汉字输入法版本54的汉字系统。
2.确定输入键
因本杨码汉字输入法是键盘式数字型杨码输入法,所以用通用的数字键盘上的数字键1、2、3、4、5、6、7、8、9来作为杨码字符的输入键,用通用的数字键盘上数字键1、2、3、4、5、6、7、8、9、0来作为中文信息提示符即选择码字符的输入键,同时也用通用的数字键盘上数字键0来作为翻页符和空格符的输入键。
3.字元代码
本实施例确定本输入法中的字元与其代码对照表如表1所示。
4.创建输入法
(1)创建中文信息库
先确定本输入法中所用的中文信息,再按照本发明的编码和取码规则,用字元代码对汉字的单字、词、词组、短语和语句进行编码和取码,然后编辑中文信息,并将本法中所用的中文信息按其杨码第一字符进行分类,分别创建9个以杨码为主索引的中文信息库,同时,再创建一个以杨码为主索引的用户中文信息库。
(2)创建本输入法窗口界面,编辑其子系统软件,使此窗口界面中具有如下设置和功能:
创建一个窗口,该窗口有一个边框,在边框上边线的下方设置一个标题栏,标题栏内的标题是“请输入杨码”,在标题栏的左端设置一个位图和类似于Windows汉字输入法窗口内下拉式菜单功能的下拉式菜,在标题栏的右端分别设置类似于Windows汉字输入法窗口内最小化窗口按钮、最大化/恢复窗口按钮、关闭窗口按钮功能的三个按钮,在标题栏下方的右边设置一个编辑框,用来显示和编辑已输入的杨码字符和选择码字符,在标题栏的下方左边设置一个显示框,用来显示与编辑框中杨码字符所对应的首条中文信息,并且,在显示框的上面设置一个不可见按钮,功能同确定键,在编辑框和显示框的下方设置一个类似于Windows汉字输入法窗口内提示栏功能的提示栏,在提示栏的左侧,自上而下地纵向设置有1、2、3、4、5、6、7、8、9、0阿拉伯数字作为信息提示符,在提示符的右边分别设置有信息提示处,在信息提示处的上面设置有不可见按钮,操作这些不可见按钮就能够操作按钮下的中文信息或操作中文信息左边的提示符。
(3)创建中文信息库维护窗口界面,编辑其子系统软件,使之具有造词功能,查询功能和维护中文信息数据库功能。
(4)创建帮助窗口界面,编辑其子系统软件,使之具有本输入法的帮助功能。
5.用杨码输入法版本54输入中文信息
(1)打开要输入中文信息的文本编辑窗口(如写字板),使之处于活动状态,并且在其中定位好要输入中文信息光标所在位置;
(2)打开杨码输入法版本54窗口,进入杨码输入法版本54;
(3)输入中文信息“中国共产党”
①视拆词语“中国共产党”中的各个汉字,得到词语“中国共产党”中的各个汉字的字元及其代码;
②按照汉字词语的编码和取码规则,用词语“中国共产党”中的各个汉字的字元的代码对词语“中国共产党”进行编码和取码,得到词语“中国共产党”的杨码是722642;
③按照词语“中国共产党”杨码字符722642分别按序敲击数字键盘上7键、2键、2键、6键、4键、2键、各一下,这时,词语“中国共产党”杨码所有字符722642就被输入到窗口界面内的编辑框内,同时,在显示框内显示出词语“中国共产党”的中文信息,屏幕上的信息提示栏内也随之显示出与词语“中国共产党”具有联想关系的部分中文信息及其选择码,等待操作者选择或进行其它操作:
1:中国共产党要
2:中国共产党党员
3:中国共产党的
4:中国共产党总书记
5:中国共产党能够
6:中国共产党把
7:中国共产党是
8:中国共产党领导
9:
0:
④因为我们只想输入词语“中国共产党”,所以,不再选择提示栏内的其它中文信息,此时,只要敲击一下确定键,就将词语“中国共产党”输入到要输入中文信息文本的光标所在位置处,同时光标下移到词语“中国共产党”所在的位置之后,输入法窗口界面也恢复到初始状态,等待操作者输入下一条中文信息或者进行其它操作。
实施例之三
本例是依据杨码序排列的杨码字典。在此字典中,字典字头的编码和杨码均是数字型的,并且,字典中的正文字头、杨码与正文页码对照表(杨码索引)均是按照数字型杨码升序排列,要检索此字典中的信息条目,直接按照信息条目字头的杨码,翻到正文的同杨码字头处,再按要查找的信息条目字头找到该信息条目;或者,按照要检索的信息条目字头的杨码,先从杨码与正文页码对照表(杨码索引)中查找到该杨码所处的正文中的页码,再按照正文中的页码查找该信息条目。
以上的三个实施例只是说明了本发明中各种具体实施方案中的三个具体实施方案。必须指出,本发明不仅仅限于上面已给出的实施方案,在实际应用中,发明人已经根据本发明的构思,开发出了不脱离本发明实质的多种变型实施方案,可供用户选择和使用。

Claims (10)

1.汉语杨码及其汉字输入法和汉字检索法,其特征在于:首先从一般汉字字典的传统部首中选取其中一部分部首作为本发明中构成汉字单字的标准部件,这些标准部件在本发明中被简称为字元;然后将所有的字元按其同名或者按其结构相似或相近进行分组:
(1)简体汉字系统中的字元共分成50组,其中5组是单笔画字元组,它们分别是:“一、
Figure A2004100647310002C1
组、“丨、亅”组、“丿”组、“丶、”组和“乙、*(*是代表除前面已经提到的汉字单笔画部首以外的其它所有的汉字单笔画部首,以下同)”组,另45组是多笔画字元(是指具有两笔画和两笔画以上的字元,以下同)组,它们分别是:“扌”组、“口”组、“人、八、亻”组、“氵”组、 组、“王”组、“酉”组、“石”组、“车”组、“止”组、“田”组、“山”组、“贝”组、“罒”组、“爫”组、“月”组、“鱼”组、“犭”组、“饣”组、“门”组、“立”组、“羊、”组、“米”组、“衤、礻”组、“马”组、“尸”组、“弓”组、“女”组、“纟”组、“耳”组、“土、士”组、“艹”组、“木”组、“日、曰”组、“目”组、“虫”组、“”组、“夕、夂”组、“钅”组、“舟”组、“”组、“广、疒”组、“忄”组、“火”组和“宀”组;
(2)繁体汉字(含异体汉字,以下同)系统中的字元共分成51组,其中5组是单笔画字元组,它们分别是:“一、
Figure A2004100647310002C4
组、“丨、亅”组、“丿”组、“丶、”组和“乙、*”组,另46组是多笔画字元组,它们分别是:“扌”组、“口”组、“人、八、亻”组、“氵”组、 组、“王”组、“酉”组、“石”组、“車”组、“止”组、“田”组、“山”组、“貝”组、“罒”组、“爫”组、“月”组、“魚”组、“犭”组、“飠”组、“門”组、“言”组、“立”组、“羊、”组、“米”组、“衤、礻”组、“馬”组、“尸”组、“弓”组、“女”组、“糹”组、“耳”组、“土、士”组、“艹”组、“木”组、“日、曰”组、“目”组、“虫”组、“”组、“夕、夂”组、“金”组、“舟”组、“”组、“广、疒”组、“忄”组、“火”组和“宀”组;
(3)简繁体汉字(含异体汉字,以下同)共存系统中的字元共分成51组,其中5组是单笔画字元组,它们分别是:“一、
Figure A2004100647310002C7
组、“丨、亅”组、“丿”组、“丶、”组和“乙、*”组,另46组是多笔画字元组,它们分别是:“扌”组、“口”组、“人、八、亻”组、“氵”组、 组、“王”组、“酉”组、“石”组、“车、車”组、“止”组、“田”组、“山”组、“贝、貝”组、“罒”组、“爫”组、“月”组、“鱼、魚”组、“犭”组、“饣、飠”组、“门、門”组、“言”组、“立”组、“羊、”组、“米”组、“衤、礻”组、“马、馬”组、“尸”组、“弓”组、“女”组、“纟、糹”组、“耳”组、“土、士”组、“艹”组、“木”组、“日、曰”组、“目”组、“虫”组、“”组、“夕、夂”组、“钅、金”组、“舟”组、“”组、“广、疒”组、“忄”组、“火”组和“宀”组;并且,用9个不同的单字符分别按序给上述各汉字系统中的相同的5组单笔画字元组确“一、
Figure A2004100647310002C10
组、“丨、亅”组、“丿”组、“丶、”组、“乙、*”组和相同的4组多笔画字元组“扌”组、“口”组、“人、八、亻”组、“氵”组中的每组字元按组赋予同一个单字符作为该组内每一个字元的同一代码,再用这9个不同的单字符进行排列组合后,取出其中42个不同的双字符串,先用这42个不同双字符串中的33个不同双字符串,分别给上述各个汉字系统中的另外33个相同的多笔画字元组 组、“王”组、“酉”组、“石”组、“止”组、“田”组、“山”组、“罒”组、“爫”组、“月”组、“犭”组、“立”组、“羊、”组、“米”组、“衤、礻”组、“尸”组、“弓”组、“女”组、“耳”组、“土、士”组、“艹”组、“木”组、“日、曰”组、“目”组、“虫”组、“”组、“夕、夂”组、“舟”组、“”组、“广、疒”组、“忄”组、“火”组和“宀”组中的每组字元按组赋予同一个双字符串作为该组内每一个字元的同一代码,再用这42个不同双字符串中的另外的8个不同的双字符串分别给上述简体汉字系统中的多笔画字元组“车”组、“贝”组、“鱼”组、“饣”、“门”组、“马”组、“纟”组、“钅”组中的每组字元按组赋予同一个双字符串作为该组内每一个字元的同一代码,同样,用这8个不同的双字符串分别给上述繁体汉字系统中的多笔画字元组“車”组、“貝”组、“魚”组、“飠”组、“門”组、“馬”组、“糹”组、“金”组中的每组字元按组赋予同一个双字符串作为该组内每一个字元的同一代码,也同样用这8个不同的双字符串分别给上述简繁体汉字共存系统中的多笔画字元组“车、車”组、“贝、貝”组、“鱼、魚”组、“饣、飠”、“门、門”组、“马、馬”组、“纟、糹”组、“钅、金”组中的每组字元按组赋予同一个双字符串作为该组内每一个字元的同一代码,之后,再用这42个不同双字符串中的最后一个双字符串分别给繁体汉字系统中的最后一个多笔画字元组“言”组和简繁体汉字共存系统中的最后一个多笔画字元组“言”组中的字元赋予这个双字符串作为该组内字元的同一代码;最后,再用各个字元的代码按照本发明中的编码和取码规则,分别给各个汉字系统中的汉字单字、词、词组、短语和语句进行编码和取码,所取得的码在本发明中被简称为汉语杨码;将汉语杨码输入到中文信息处理设备中,就能够达到利用汉语杨码输入中文信息的目的;将字典、词(辞)典或其它汉语信息中的条目依照汉语杨码序排列,就能够达到利用汉语杨码检索字典、词(辞)典或其它汉语信息中条目的目的;将非汉字字符或图形依照汉语杨码的形式分别赋予汉语杨码,就能够达到利用汉语杨码处理非汉字字符或图形信息的目的。
2.如权利要求1所述的汉语杨码及其汉字输入法和汉字检索法,其特征在于:用1、2、3、4、5、6、7、8、9这9个阿拉伯数字字符分别代替权利要求1中所述的9个不同的单字符,再分别按序给权利要求1中所述的各汉字系统中的相同的5组单笔画字元组“一
Figure A2004100647310003C3
组、“丨、亅”组、“丿”组、“丶、”组、“乙、*”组和相同的4组多笔画字元组“扌”组、“口”组、“人、八、亻”组、“氵”组中的每组字元按组赋予同一个阿拉伯数字字符作为该组内每一个字元的同一代码,再用这9个不同的阿拉伯数字字符进行排列组合,取出其中双字符串14、16、17、18、22、26、27、29、34、36、38、46、47、48、49、56、57、58、66、67、68、69、76、77、78、79、86、88、89、96、97、98、99分别代替权利要求1中所述的42个不同的双字符串中的其中33个不同的双字符串,分别按序给权利要求1中所述的各汉字系统中的另外33个相同的多笔画字元组
Figure A2004100647310003C4
组、“王”组、“酉”组、“石”组、“止”组、“田”组、“山”组、“罒”组、“爫”组、“月”组、“犭”组、“立”组、“羊、”组、“米”组、“衤、礻”组、“尸”组、“弓”组、“女”组、“耳”组、“土、士”组、“艹”组、“木”组、“日、曰”组、“目”组、“虫”组、“”组、“夕、夂”组、“舟”组、“”组、“广、疒”组、“忄”组、“火”组、“宀”组中的每组字元按组赋予同一个双字符串作为该组内每一个字元的同一代码,取出其中双字符串19、28、37、39、42、55、59、87代替权利要求1中所述的42个不同的双字符串中的另外8个不同的双字符串分别按序给权利要求1中所述的简体汉字系统中的“车”组、“贝”组、“鱼”组、“饣”组、“门”组、“马”组、“纟”组、“钅”组中的每组字元按组赋予一个双字符串作为该组内每一个字元的同一代码,同样用19、28、37、39、42、55、59、87这8个不同的双字符串分别按序给权利要求1中所述的繁体汉字系统中的多笔画字元组“車”组、“貝”组、“魚”组、“飠”组、“門”组、“馬”组、“糹”组、“金”组中的每组字元按组赋予同一个双字符串作为该组内每一个字元的同一代码,也同样用19、28、37、39、42、55、59、87这8个不同的双字符串分别按序给权利要求1中所述的简繁体汉字共存系统中的多笔画字元组“车、車”组、“贝、貝”组、“鱼、魚”组、“饣、飠”组、“门、門”组、“马、馬”组、“纟、糹”组、“钅、金”组中的每组字元按组赋予同一个双字符串作为该组内每一个字元的同一代码;除上述已取用的41个双字符串外,再取出其中最后一个双字符串45代替权利要求1中所述的42个不同的双字符串中最后一个双字符串,给繁体汉字系统中的最后一个多笔画字元组“言”组和简繁体汉字共存系统中的最后一个多笔画字元组“言”组中的字元分别赋予这个双字符串作为该组内字元的同一代码;最后,再用各个字元的代码按照本发明中的编码和取码规则,分别给各个汉字系统中的汉字单字、词、词组、短语和语句进行编码和取码,所取得的码在本发明中被简称为数字型汉语杨码;将数字型汉语杨码输入到中文信息处理设备中,就能够达到利用数字型汉语杨码输入中文信息的目的;将字典、词(辞)典或其它汉语信息中的条目依照数字型汉语杨码序排列,就能够达到利用数字型汉语杨码检索该字典、词(辞)典或其它汉语信息中条目的目的;将非汉字字符或图形依照数字型汉语杨码的形式分别赋予数字型汉语杨码,就能够达到利用数字型汉语杨码处理非汉字字符或图形信息的目的。
3.如权利要求1所述的汉语杨码及其汉字输入法和汉字检索法,其特征在于:用9个不同的英文字母单字符分别替代权利要求2中所述的9个不同的阿拉伯数字字符1、2、3、4、5、6、7、8、9,和用这9个不同的英文字母的单字符及其排列组合后取出其中42个不同的英文字母双字符串,分别替代权利要求2中所述的9个不同的阿拉伯数字单字符和42个不同的阿拉伯数字双字符串后,再按照权利要求2中所述的用9个不同的阿拉伯数字字符1、2、3、4、5、6、7、8、9及其排列组合后所取出的42个不同的阿拉伯数字双字符串来构成各汉字系统中的每一个字元代码的方法来构成各汉字系统中的每一个字元的字母型代码,然后,用此代码按照本发明中的编码和取码规则,分别给各汉字系统中的汉字单字、词、词组、短语和语句进行编码和取码,所取得的码在本发明中被称为字母型汉语杨码;将字母型汉语杨码输入到中文信息处理设备中,就能够达到利用字母型汉语杨码输入中文信息的目的;将字典、词(辞)典或其它汉语信息中的条目依照字母型汉语杨码序排列,就能够达到利用字母型汉语杨码检索该字典、词(辞)典或其它汉语信息中条目的目的;将非汉字字符或图形依照字母型杨码方式分别赋予字母型汉语杨码,就能够达到利用字母型汉语杨码处理非汉字字符或图形信息的目的。
4.如权利要求1所述的汉语杨码及其汉字输入法和汉字检索法,其特征在于:用9个不同的其它单字符(指除英文字母和阿拉伯数字以外的单字符,以下同)或由其它单字符与英文字母字符、网拉伯数字字符混合后所组成的9个不同的单字符,分别替代权利要求2中所述的9个不同的阿拉伯数字单字符1、2、3、4、5、6、7、8、9,和用这9个不同的单字符及其排列组合后所取出的其中42个不同的双字符串,分别替代权利要求2中所述的9个不同的阿拉伯数字单字符和42个不同的阿拉伯数字双字符串后,再按照权利要求2中所述的用9个不同的阿拉伯数字单字符1、2、3、4、5、6、7、8、9及其排列组合后所取出的42个不同的阿拉伯数字双字符串来构成各汉字系统中的每一个字元代码的方法来构成各汉字系统中的每一个字元的其它型代码;然后,用此代码按照本发明中的编码和取码规则,分别给各汉字系统中的汉字单字、词、词组、短语和语句进行编码和取码,所取得的码在本发明中被称为其它型汉语杨码;将其它型汉语杨码输入到中文信息处理设备中,就能够达到利用其它型汉语杨码输入中文信息的目的;将字典、词(辞)典或其它汉语信息中条目依照其它型汉语杨码序排列,就能够达到利用其它型汉语杨码检索该字典、词(辞)典或其它汉语信息中条目的目的;将非汉字字符或图形依照其它型汉语杨码方式分别赋予其它型汉语杨码,就能够达到利用其它型汉语杨码处理非汉字字符或图形信息的目的。
5.如权利要求1、2、3和4所述的汉语杨码及其汉字输入法和汉字检索法,其特征在于:汉语杨码编码和取码规则:
(1)单个汉字的杨码编码和取码规则:
①按照1997年4月7日国家语言文字工作委员会和国家新闻出版署联合发布的《现代汉语通用字笔顺规范》中规定的汉字笔顺和优先取大的规则,视单个汉字是由一个或多个字元(是指两个或两个以上的字元,以下同)构成;
②按照汉字的笔顺和优先取大的规则,视拆该汉字,并且将构成该汉字的所有字元代码字符按照拆分时的先后顺序排列在一起,就构成了一个新字符串(含单个字符),这个新字符串(含单个字符)就是该汉字的编码;
③当该汉字的编码字符不足5个时,取该汉字编码作为该汉字的杨码;
④当该汉字的编码字符超过4个时,取出该汉字编码的前4个字符,这前4个字符按原顺序所构成的字符串即为该汉字的杨码;
(2)两个汉字或两个汉字以上的词、词组、短语或语句的杨码编码和取码规则:
①先取出该词、词组、短语或语句的第一个汉字杨码中的全部字符,再分别依次取出其后各个汉字中的每一个汉字杨码中的第一个字符,然后将它们按取出时的先后顺序排列成一个新字符串,这个新字符串就是该词、词组、短语或语句的编码;
②当组成该词、词组、短语或语句的汉字不足7个时,就取该词、词组、短语或语句的编码作为该词、词组、短语或语句的杨码;
③当组成该词、词组、短语或语句的汉字超过6个时,就取出该词、词组、短语或语句前6个汉字的编码作为该词、词组、短语或语句的杨码。
(3)非汉字字符和图形的编码和取码规则:
①当非汉字字符或图形是由本发明中所定义的字元构成时,那么,这个非汉字字符或图形的编码和取码规则均同上述的汉字单字、词、词组、短语、语句的编码和取码规则;
②当非汉字字符或图形不是由本发明中所定义的字元构成时,其编码和取码规则均由用户自行定义,但是,用户在自行定义该非汉字字符或图形的编码和取码规则时,必须要使用户自行定义中的所有非汉字字符或图形的编码字符类型与同版本中的汉字编码字符类型保持一致。
(4)容错码
为了兼顾部分人的习惯,本发明容许部分汉字以下列“不规范”方式编码和取码,这样所取得的杨码可作为“容错码”存在。本发明支持下列容错:
①支持笔顺容错
笔顺容错是指:每个汉字除了按1997年4月7日国家语言文字工作委员会和国家新闻出版署联合发布的《现代汉语通用字笔顺规范》中所规定的标准笔顺外,其中部分汉字还具有另外一种或多种人们习惯上所采用的其它笔顺,本发明中称该笔顺为该汉字的异笔顺;本发明容许异笔顺存在的现象被称为笔顺容错;汉字以异笔顺编码后所取得的杨码,称之为笔顺容错码;本发明支持笔顺容错码的存在,即支持笔顺容错。
②支持笔画笔形容错
笔画笔形容错是指:部分汉字中的部分笔画笔形易使人们误解,在本发明中容许这种误解存在的现象被称为笔画笔形容错;汉字以误解的笔画笔形编码后所取得的杨码,称之为笔画笔形容错码;本发明支持笔画笔形容错码的存在,即支持笔画笔形容错。
③支持视拆容错
视拆容错是指:人们在视拆汉字过程中,常常将部分汉字的字元拆错;在本发明中容许这种拆错汉字字元存在的现象被称之为视拆容错;汉字以拆错的字元编码后所取得的杨码,称之为视拆容错码;本发明支持视拆容错码的存在,即支持视拆容错。
④支持自定义容错
自定义容错是指:人们为了某种目的,有意识地将某些汉字的单字、词、词组、短语、语句或非汉字字符、图形,按其缩写形式或密码形式自行定义成一种杨码;以这种形式所取得的杨码,称之为自定义容错码;本发明支持自定义容错码的存在,即支持自定义容错。
6.如权利要求1、2、3和4所述的汉语杨码及其汉字输入法和汉字检索法,其特征在于:优先取大的规则,是指在构成同一个汉字的所有字元中,笔画多的字元视为大,视拆汉字时,该汉字中的笔画多的字元必须优先作为字元拆分出,即笔画多的字元应作为一个整体字元存在,不可再将其拆分成两个或两个以上的笔画比它还要少的字元来作为构成该汉字的字元。
7.如权利要求1、2、3和4所述的汉语杨码及其汉字输入法和汉字检索法,其特征在于:中文信息处理设备,是指除了在硬件上至少要配备有与其软件相适应的运算器、控制器、存贮器、输入设备或装置、输出设备或装置外,在软件上至少还要配备有与其硬件相适应的中文操作系统和杨码汉字输入法系统。
8.如权利要求1、2、3和4所述的汉语杨码及其汉字输入法和汉字检索法,其特征在于:汉字输入方法及其步骤。根据中文信息处理设备的不同,与其相对应的杨码汉字输入方法及其输入步骤也不同,现分述如下:
(1)键盘式杨码汉字输入法:采用键盘,用手击键,逐一按序输入中文信息杨码及其选择码字符,以达到利用键盘输入中文信息的目的。按照所配备的杨码输入法系统软件分类,键盘式杨码汉字输入法分为以下三类:
①键盘式数字型杨码汉字输入法
a采用此法的中文信息处理设备中,其输入设备或装置至少要配备有用于输入汉语杨码及其选择码字符的10个阿拉伯数字键和退格键、确定键,其输出设备或装置至少要配备有显示屏设备或装置,其系统软件中至少要配备有与其硬件相适应的中文操作系统和键盘式数字型杨码汉字输入系统。
b用此法输入中文信息的步骤:首先打开要输入中文信息的文本,并且在其上定位好要输入中文信息的位置后,再进入键盘式数字型杨码汉字输入系统,此时,屏幕上显示出杨码汉字输入法窗口开始状态时的界面;然后按照要输入的中文信息杨码字符的前后顺序,用手指逐一地敲击键盘上相对应的数字键,这时,显示屏上的杨码汉字输入法窗口界面内也随之逐屏显示出与敲击过的字符或字符串相对应的同杨码中文信息及其选择码和具有联想关系的中文信息及其选择码,当敲击完要输入的中文信息的全部杨码字符及其选择码字符后,此时,如果显示屏上的杨码汉字输入法窗口界面内不再显示出其它中文信息及其选择码,则系统就会自动地将要输入的中文信息输入到中文信息处理设备中,并且在要输入中文信息文本中所确定好的位置上显示出来,同时屏幕上又重新显示出杨码汉字输入法窗口开始状态时的界面,等待操作者输入下条中文信息或进行其它操作;如果显示屏上的杨码汉字输入法窗口界面内还在继续显示出下一屏的其它中文信息及其选择码,这时只要敲击一下键盘上的确定键,系统就会自动地将要输入的中文信息输入到中文信息处理设备中,并且在要输入中文信息文本中所确定好的位置上显示出来,同时屏幕上又显示出杨码汉字输入法窗口开始状态时的界面,等待操作者输入下条中文信息或进行其它操作。
②键盘式字母型杨码汉字输入法
a采用此法的中文信息处理设备中,其输入设备或装置至少要配备有用于输入中文信息字母型杨码各个字符的字母键、输入中文信息各个选择码字符的10个阿拉伯数字的数字键、翻页键、退格键、确定键,其输出设备或装置至少要配备有显示屏设备或装置,其系统软件中至少要配备有与其硬件相适应的中文操作系统和键盘式字母型杨码汉字输入系统。
b用此法输入中文信息的步骤:首先打开要输入中文信息的文本,并且在其上定位好要输入中文信息的位置后,再进入键盘式字母型杨码汉字输入系统,此时,屏幕上显示出杨码汉字输入法窗口开始状态时的界面;然后按照要输入的中文信息杨码字符的前后顺序逐一地用手指敲击键盘上相对应的字母键,这时,显示屏上的杨码汉字输入法窗口界面内也随之逐屏显示出与敲击过的字符或字符串相对应的同杨码中文信息及其选择码和具有联想关系的中文信息及其选择码,当敲击完要输入的中文信息的全部杨码字符后,显示屏上的杨码汉字输入法窗口界面内就显示出与要输入的中文信息同杨码的全部中文信息及其选择码和具有联想关系的中文信息及其选择码;最后根据显示屏上的杨码汉字输入法窗口界面内的提示,输入与要输入的中文信息相关的选择码字符(是阿拉伯数字字符)或字符串(是翻页用字符与选择码阿拉伯数字字符混合排列的字符串),此时,系统就会自动地将要输入的中文信息输入到中文信息处理设备中,并且在要输入中文信息文本中所确定好的位置上显示出来,同时屏幕上又重新显示出杨码汉字输入法窗口开始状态时的界面,等待操作者输入下条中文信息或进行其它操作。
③键盘式其它型杨码汉字输入法
a采用此法的中文信息处理设备中,其输入设备或装置至少要配备有用于输入其它型杨码字符的各个字符键、输入中文信息各个选择码字符的10个阿拉伯数字的数字键、、翻页键、退格键、确定键,其输出设备或装置至少要配备有显示屏设备或装置,其系统软件中至少要配备有与其硬件相适应的中文操作系统和键盘式其它型杨码汉字输入系统。
b用此法输入中文信息的步骤:首先打开要输入中文信息的文本,并且在其上定位好要输入中文信息的位置后,再进入键盘式其它型杨码汉字输入系统,此时,屏幕上显示出杨码汉字输入法窗口开始状态时的界面;然后按照要输入的中文信息杨码字符的前后顺序逐一地用手指敲击键盘上相对应的字符键,这时,显示屏上的杨码汉字输入法窗口界面内也随之逐屏显示出与敲击过的字符或字符串相对应的同杨码中文信息及其选择码和具有联想关系的中文信息及其选择码,当敲击完要输入的中文信息的全部杨码字符后,显示屏上的杨码汉字输入法窗口界面内就显示出与要输入的中文信息同杨码的全部中文信息及其选择码和具有联想关系的中文信息及其选择码;最后根据显示屏上的杨码汉字输入法窗口界面内的提示,输入与要输入的中文信息相关的选择码字符(是阿拉伯数字字符)或字符串(是翻页用字符与选择码阿拉伯数字字符混合排列的字符串),此时,系统就会自动地将要输入的中文信息输入到中文信息处理设备中,并且在要输入中文信息文本中所确定好的位置上显示出来,同时屏幕上又重新显示出杨码汉字输入法窗口开始状态时的界面,等待操作者输入下条中文信息或进行其它操作。
(2)鼠标式杨码汉字输入法
①采用此法的中文信息处理设备中,其输入设备或装置至少要配备有鼠标设备或装置,其输出设备或装置至少要配备有显示屏设备或装置,其系统软件中至少要配备有与其硬件相适应的中文操作系统和鼠标式杨码汉字输入系统。
②用此法输入中文信息的步骤:首先打开要输入中文信息的文本,并且在其上定位好要输入中文信息的位置后,再进入鼠标式杨码汉字输入系统,此时屏幕上显示出杨码汉字输入法窗口开始状态时的界面;然后用手操作鼠标,按照要输入的中文信息及其杨码字符的前后顺序逐一地去点击杨码汉字输入法窗口界面内的与之相对应的信息提示处,或者按照要输入的中文信息杨码字符的前后顺序逐一地去点击虚拟键盘上与要输入的中文信息杨码字符相对应的字符处,这时,显示屏上的杨码汉字输入法窗口界面内也随之逐屏显示与点击过信息具有同杨码和联想关系的信息;当点击到与要输入的中文信息相符的信息后,或当点击完与要输入的中文信息的杨码字符相对应的全部字符及其选择码字符后,如果显示屏上不再显示出其它中文信息及其选择码,则系统就会自动地将要输入的中文信息输入到中文信息处理设备中,并且在要输入中文信息文本中所确定好的位置上显示出来,同时屏幕上又重新显示出杨码汉字输入法窗口开始状态时的界面,等待操作者输入下条中文信息或进行其它操作;如果显示屏上杨码汉字输入法窗口界面内还在继续显示出其它中文信息及其选择码,则点击一下杨码汉字输入法窗口界面内的确定符后,系统就会自动地将要输入的中文信息输入到中文信息处理设备中,并且在要输入中文信息文本中所确定好的位置上显示出来,同时屏幕上又重新显示出杨码汉字输入法窗口开始状态时的界面,等待操作者输入下条中文信息或进行其它操作。
(3)触摸式杨码汉字输入法
①采用此法的中文信息处理设备中,其输入和输出设备或装置至少要配备有触摸屏设备或装置,其系统软件中至少要配备有与其硬件相适应的中文操作系统和触摸式杨码汉字输入系统。
②用此法输入中文信息的步骤:首先打开要输入中文信息的文本,并且在其上定位好要输入中文信息的位置后,再进入触摸式杨码汉字输入系统,此时屏幕上显示出杨码汉字输入法窗口开始状态时的界面;然后用手或笔或其它器物按照要输入的中文信息或其杨码字符的前后顺序逐一地触摸杨码汉字输入法窗口界面内的与之相对应的信息提示处,这时,显示屏上的杨码汉字输入法窗口界面内也随之逐屏显示与触摸过的信息具有同杨码和联想关系的信息,当触摸到与要输入的中文信息相符的信息或触摸完要输入的中文信息杨码字符后,如果显示屏上不再显示出其它中文信息及其选择码,则系统就会自动地将要输入的中文信息输入到中文信息处理设备中,并且在要输入中文信息文本中所确定好的位置上显示出来,同时屏幕上又重新显示出杨码汉字输入法窗口开始状态时的界面,等待操作者输入下条中文信息或进行其它操作;如果显示屏上杨码汉字输入法窗口界面内还在继续显示出其它中文信息及其选择码,则触摸一下杨码汉字输入法窗口界面内的确定符处后,系统就会自动地将要输入的中文信息输入到中文信息处理设备中,并且在要输入中文信息文本中所确定好的位置上显示出来,同时屏幕上又重新显示出杨码汉字输入法窗口开始状态时的界面,等待操作者输入下条中文信息或进行其它操作。
(4)书写式杨码汉字输入法
①采用此法的中文信息处理设备中,其输入设备或装置至少要配备有用于输入字符的书写笔和书写板设备或装置,其输出设备或装置至少要配备有显示屏设备或装置,其系统软件中至少要配备有与其硬件相适应的中文操作系统和书写式杨码汉字输入系统。
②用此法输入中文信息的步骤:首先打开要输入中文信息的文本,并且在其上定位好要输入中文信息的位置后,再进入书写式杨码汉字输入系统,此时,屏幕上显示出杨码汉字输入法窗口开始状态时的界面;然后用书写笔将要输入的中文信息杨码字符按照前后顺序逐一地写在书写板上,这时,显示屏上的杨码汉字输入法窗口界面内也随之逐屏显示出与输入过的字符或字符串相对应的具有同杨码和联想关系的中文信息,当书写完要输入中文信息杨码的全部字符后,显示屏上的杨码汉字输入法窗口界面内就显示出与要输入中文信息杨码同杨码的全部中文信息及其选择码和具有联想关系的中文信息及其选择码;最后根据显示屏上的杨码汉字输入法窗口界面内的提示,在书写板上写上与要输入的中文信息相关的选择码字符或字符串(是翻页用字符与选择码字符混合排列的字符串),此时,如果显示屏上不再显示出其它中文信息及其选择码,则系统就会自动地将要输入的中文信息输入到中文信息处理设备中,并且在要输入中文信息的文本中所确定好的位置上显示出来,同时屏幕上又重新显示出杨码汉字输入法窗口开始状态时的界面,等待操作者输入下条中文信息或进行其它操作;如果显示屏上杨码汉字输入法窗口界面内还在继续显示出其它中文信息及其选择码,则在书写板上写上确定符后,系统就会自动地将要输入的中文信息输入到中文信息处理设备中,并且在要输入中文信息的文本中所确定好的位置上显示出来,同时屏幕上又重新显示出杨码汉字输入法窗口开始状态时的界面,等待操作者输入下条中文信息或进行其它操作。
(5)语音式杨码汉字输入法
①采用此法的中文信息处理设备中,其输入设备或装置至少要配备有语音输入设备或装置,其输出设备或装置至少要配备有显示屏设备或装置,其系统软件中至少要配备有与其硬件相适应的中文操作系统和语音式杨码汉字输入系统。
②用此法输入中文信息的步骤:首先打开要输入中文信息的文本,并且在其上定位好要输入中文信息的位置后,再进入语音式杨码汉字输入系统,此时,屏幕上显示出杨码汉字输入法窗口开始状态时的界面;然后将要输入的中文信息杨码字符以其语音的形式按照前后顺序逐一地通过语音输入设备或装置输入到中文信息处理设备中,这时,显示屏上的杨码汉字输入法窗口界面内也随之逐屏地显示出与输入过的字符或字符串相对应的具有同杨码和联想关系的中文信息,当输完要输入中文信息的全部杨码字符后,显示屏上的杨码汉字输入法窗口界面内就显示出与要输入中文信息同杨码的全部中文信息及其选择码和具有联想关系的中文信息及其选择码;最后根据显示屏上的杨码汉字输入法窗口界面内的提示,再输入与要输入中文信息相关的选择码字符或字符串(是翻页用字符与选择码字符混合排列的字符串)中的各个字符的语音,此时,如果显示屏上杨码汉字输入法窗口界面内不再显示出其它中文信息及其选择码,则系统就会自动输入要输入的中文信息,并且在要输入中文信息文本中所确定好的位置上显示出来,同时屏幕上又重新显示出杨码汉字输入法窗口开始状态时的界面,等待操作者输入下条中文信息或进行其它操作;如果显示屏上的杨码汉字输入法窗口界面内还在继续显示出其它中文信息及其选择码,则输入确定符的语音后,系统就会自动地将要输入的中文信息输入到中文信息处理设备中,并且在要输入中文信息文本中所确定好的位置上显示出来,同时屏幕上又重新显示出杨码汉字输入法窗口开始状态时的界面,等待操作者输入下条中文信息或进行其它操作。
(6)在实际应用中,本发明容许以上各类汉字输入法中的各个版本可以在各中文信息处理设备中单独存在和应用,也容许它们之中的不同类型的不同版本或同类型中的不同版本同时存在于同一个中文信息处理设备中,以便可以分别提取出来或同时提取出来进行应用,还容许它们之中的之一或几种版本的杨码汉字输入法与其它非杨码汉字输入法中的之一或几种版本汉字输入法同时存在于同一个中文信息处理设备中,以便可以分别提取出来或同时提取出来进行应用。
9.如权利要求1、2、3和4所述的汉语杨码及其汉字输入法和汉字检索法,其特征在于:杨码汉字输入法窗口界面的形式目前有两类:其一是用目前已在广泛应用的Windows中文信息操作系统中的输入法生成器所生成的杨码汉字输入法窗口界面形式;其二是至少具有如下设置的杨码汉字输入法窗口界面形式:
(1)该窗口界面内设置一个编辑框,用来显示和编辑已输入的中文信息杨码和选择码的字符或字符串;
(2)该窗口界面内设置一个中文信息提示栏,用来显示与编辑框中的字符或字符串相对应的具有同杨码或联想关系的中文信息;
(3)该窗口界面内,在中文信息提示栏内的每条中文信息的前端设置一个用来选择该中文信息的选择码提示符;
(4)该窗口界面内,在中文信息提示栏内的每条中文信息上面都设置一个用来选择该中文信息或选择该中文信息选择码提示符的不可见按钮;
(5)该窗口界面内设置有翻页符,并且,在此翻页符上具有不可见按钮,用来翻页中文信息提示栏;
(6)该窗口界面内设置一个确定符,并且,在此确定符上具有一个不可见按钮,用来确定已选定的中文信息;
(7)该窗口界面内设置一个窗口界面关闭按钮,用以关闭该窗口界面。
10.如权利要求1、2、3和4所述的汉语杨码及其汉字输入法和汉字检索法,其特征在于:中文信息排序规则;
(1)杨码汉字输入法中的中文信息排序规则
①单个汉字的排序规则:
a在简体汉字系统或繁体汉字系统中的同版本杨码汉字输入法中,对于不同杨码的单个汉字是按照各个汉字杨码字符的自然序列升序排序,对于同杨码的单个汉字是按照汉字的使用频度(指该汉字与其同杨码汉字比较,在日常使用中所出现的频率)排序,使用频度高者排在前面,使用频度低者排在后面;
b在简繁体汉字共存系统中的同版本杨码汉字输入法中,对于不同杨码的单个汉字是按照各个汉字杨码字符的自然序列升序排序,对于同杨码的单个汉字是先按照汉字的使用频度排序好简体汉字后,再接着按照汉字的使用频度排序好未排到的同杨码的繁体汉字,而且,在同杨码的简体汉字中,使用频度高者排在前面,使用频度低者排在后面,同样,在同杨码的繁体汉字中,使用频度高者排在前面,使用频度低者排在后面。
②两个或两个以上汉字的词、词组、短语和语句的排序规则:
a在同版本杨码汉字输入法中,同杨码的两个或两字以上汉字的词、词组、短语和语句均排在同杨码单个汉字(除容错码单个汉字外)之后;
b在同版本杨码汉字输入法中,同杨码的两个或两个以上汉字的词、词组、短语和语句之间是按照其汉字个数的多少进行排序,即字数少的词、词组、短语和语句排在前面,字数多的词、词组、短语和语句排在后面;
c在同版本杨码汉字输入法中,不同杨码的两个或两个以上汉字的词、词组、短语和语句是按照其杨码字符的自然序列升序排序。
③非汉字字符和图形的排序规则:
非汉字字符和图形在同版本杨码汉字输入法中的排序规则,均与同版本杨码汉字输入法中汉语的排序规则相同,即非汉字字符和图形在同版本杨码汉字输入法中均视同同版本杨码汉字输入法中汉字的单字、词、词组、短语或语句来处理。
④容错码汉字的排序规则:
a在同版本杨码汉字输入法中,依据容错码编码和取码的汉字,均排在依据标准码编码和取码的同杨码汉字的单字、词、词组、短语和语句之后;
b在同版本杨码汉字输入法中,依据容错码编码和取码的同杨码汉字之间,使用频度高者排在前面,使用频度低者排在后面;
c在同版本杨码汉字输入法中,依据容错码编码和取码的同杨码两个或两个以上汉字的词、词组、短语和语句均排在其同杨码单个汉字之后,而它们之间则是按照其汉字个数的多少进行排序,即字数少的词、词组、短语和语句排在前面,字数多的词、词组、短语和语句排在后面。
(2)杨码汉字检索法中的中文信息排序规则
杨码汉字检索法中的中文信息是指在依据杨码序排列的字典、词(辞)典、其它中文信息记录中的中文信息,其排序规则如下:
①单个汉字的排序规则:
在以杨码序排列的同版本中文信息中,对于不同杨码的字头及其信息是按照各个字头杨码字符的自然序列升序排序,对于同杨码的字头及其信息先是分别按照字头简体汉字,繁体汉字,异体汉字的先后顺序排序后,再将简体汉字字头之间的同杨码字头及其信息或繁体汉字字头之间的同杨码字头及其信息或异体汉字字头之间的同杨码字头及其信息分别按照字头编码自然序列升序排序,同编码的汉字字头及其信息是按照字头使用频度排序,使用频度高者及其信息排在前面,使用频度低者及其信息排在后面;
②两个或两个以上汉字的词、词组、短语和语句及其信息的排序规则:
a在同版本中,两个或两个以上汉字的词、词组、短语和语句及其信息均排其字头信息之后;
b在同版本中,字头相同的同杨码两个或两个以上汉字的词、词组、短语和语句及其信息之间的排序是按照同杨码两个或两个以上汉字的词、词组、短语和语句汉字个数的多少进行排序,即字数少的词、词组、短语和语句及其信息排在前面,字数多的词、词组、短语和语句及其信息排在后面,字数相同时,按其最后一个汉字编码的自然序列升序排序;
c在同版本中,字头相同的不同杨码两个或两个以上汉字的词、词组、短语和语句及其信息之间的排序是按照不同杨码两个或两个以上汉字的词、词组、短语和语句杨码的自然序列升序排序。
③非汉字字符和图形的排序规则:
非汉字字符和图形在各个版本中的排序规则,均与同杨码汉字的排序规则相同,即非汉字字符和图形在各个版本中均视同汉字的单字、词、词组、短语或语句来处理。
④容错码汉字的排序规则:
a在同版本中,依据容错码规则编码和取码的字头,均排在与其同杨码且依据标准码规则编码和取码的字头的汉字的单字、词、词组、短语和语句及其信息之后,并在该容错码汉字旁边标注上其标准码;
b在同版本中,依据容错码规则编码和取码的同杨码汉字字头及其信息之间的排序是按照它们字头编码字符的自然序列升序排序;同编码的容错码汉字字头是按照其使用频度排序,使用频度高者及其信息排在前面,使用频度低者及其信息排在后面;
c在同版本中,依据容错码编码和取码的不同杨码汉字字头及其信息之间的排序是按照它们字头杨码字符的自然序列升序排序。
CN 200410064731 2004-09-24 2004-09-24 汉语编码及其汉字输入法和汉字检索法 Expired - Fee Related CN1752899B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN 200410064731 CN1752899B (zh) 2004-09-24 2004-09-24 汉语编码及其汉字输入法和汉字检索法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN 200410064731 CN1752899B (zh) 2004-09-24 2004-09-24 汉语编码及其汉字输入法和汉字检索法

Publications (2)

Publication Number Publication Date
CN1752899A true CN1752899A (zh) 2006-03-29
CN1752899B CN1752899B (zh) 2010-04-28

Family

ID=36679773

Family Applications (1)

Application Number Title Priority Date Filing Date
CN 200410064731 Expired - Fee Related CN1752899B (zh) 2004-09-24 2004-09-24 汉语编码及其汉字输入法和汉字检索法

Country Status (1)

Country Link
CN (1) CN1752899B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102566770A (zh) * 2010-12-24 2012-07-11 汉王科技股份有限公司 一种模糊笔顺的五笔画输入法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1349157A (zh) * 2001-11-28 2002-05-15 翁健华 数字笔形码汉字输入法
CN100353299C (zh) * 2003-02-27 2007-12-05 汤步青 一种使用数字键盘的汉字输入方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102566770A (zh) * 2010-12-24 2012-07-11 汉王科技股份有限公司 一种模糊笔顺的五笔画输入法

Also Published As

Publication number Publication date
CN1752899B (zh) 2010-04-28

Similar Documents

Publication Publication Date Title
CN1759593A (zh) 字母字符输入装置和方法
CN1280748C (zh) 使用计算机键入字母表中字母的方法
CN1154502A (zh) 教育规范五笔字型汉字输入法及其装置
CN1752899A (zh) 汉语编码及其汉字输入法和汉字检索法
CN1048343C (zh) 自由组合码汉字输入方法及键盘
CN1140865C (zh) 超级数字码
CN1529219A (zh) 语言码输入法
CN1089919C (zh) 一种叠加式按形归类的文字拆分编码输入方法及键盘
CN1321941A (zh) 中外文信息数字化运算编码处理系统
CN1026924C (zh) 汉字析音编码计算机汉字输入方法
CN1025896C (zh) 新概念编码计算机汉字输入键盘
CN1068127C (zh) 文字信息处理方法和装置
CN1399185A (zh) 整体汉字输入法及其键盘
CN1043209A (zh) 计算机汉字处理方法
CN1155874C (zh) 一种简繁汉字统一键盘编码的输入方法
CN1281178A (zh) 黎明形意类字母汉字多功能输入编码技术
CN1442780A (zh) 英文快速输入法及其键盘、鼠标
CN1208187A (zh) 一种全息万能汉字键盘及输入方法
CN86104850A (zh) 安子介式编码输入的多功能语言文字处理装置—安子介式写字机
CN1297187A (zh) 中文手写数码、语音数码及模糊语音数码的计算机输入方法
CN1664811A (zh) 语文编码与输入方法
CN1485718A (zh) 一种能够输入语句、短语、词、字的智能汉字输入方法
CN1530808A (zh) 小键盘输入
CN1414448A (zh) 小键盘信息输入装置和利用该装置的输入方法
CN1165337A (zh) 中文字父汉字系统及其中文键盘

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C17 Cessation of patent right
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20100428

Termination date: 20120924