CN1124851A - 声母拆字码汉字输入编码方案 - Google Patents

声母拆字码汉字输入编码方案 Download PDF

Info

Publication number
CN1124851A
CN1124851A CN 94102437 CN94102437A CN1124851A CN 1124851 A CN1124851 A CN 1124851A CN 94102437 CN94102437 CN 94102437 CN 94102437 A CN94102437 A CN 94102437A CN 1124851 A CN1124851 A CN 1124851A
Authority
CN
China
Prior art keywords
word
characters
yards
code
sign indicating
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN 94102437
Other languages
English (en)
Inventor
邓兆林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to CN 94102437 priority Critical patent/CN1124851A/zh
Publication of CN1124851A publication Critical patent/CN1124851A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)

Abstract

声母拆字码汉字输入编码方案属计算机汉字输入编码领域。本发明的特征在于:以键入声母代替写字,每字四码。第一码是分类码,为该字拼音的第一个字母,第二至第四码为拆字码,拆字码取自构成汉字三要素的“笔划、部首、单字”(单一或混合),每个要素名称的声母为其代码。拆字时,每字三码拆光为首选,不能三码拆光就两码拆光,加复码(末码中的末字或末笔)打够三码,四码以上的字取前二末一(取大优先)。

Description

声母拆字码汉字输入编码方案
本方案属于计算机汉字输入编码领域。
计算机汉字输入编码方案种类繁多,目前使用的编码方案可归纳为四类:一类为数字码。使用阿拉伯数字,不考虑汉字的发音和书写规律,为每个汉字规定一组数字代码。如国标区位码,电报码等。优点是不重码,输入速度快。缺点是记忆量巨大,很少有人能够掌握。二类为拼音码。以汉字发音为依据,输入每个汉字的拼音,在同音字中寻找所需汉字。如:全拼码,双拼码等。优点是不用专门学习,会拼音方案即可操作。缺点是重码字太多,输入速度慢;卷平舌发音不易做到准确无误;不会读的字无法输入。三类是字型码。不考虑汉字的发音,以字的构造形态为基础,规定若干拆分部件和它们在键盘上的位置。如:五笔字型等。优点是重码率低,输入速度快。缺点是拆分部件较多,与已有文字知识联系不够紧密,需专门学习,负担一定的记忆量,非专职操作人员不易牢固掌握。四类是混合码。拼音和字型并用。如:自然码等。这类编码吸收了拼音码和字型码的优点,同时也保留了它们的缺点。
声母拆字码是以不用死记硬背,无需专门训练,符合书写习惯,一天即可学会为目的的汉字输入编码方案。
为了实现上述目的,本发明是采取如下技术方案来实现的:
1、本方案将汉字分成“笔划、部首、单字”三种基本要素。
笔划分“点、横、竖、撇、捺、折、提、钩、弯”9种。
部首选自新华字典部首目录,共50种(主要是非字部首)。这些部首在取码时不再拆分,如:“氵、扌、艹、讠”等。每个部首取一个表义字作为它的要素名称,如:氵(水),扌(手),艹(草),讠(言)等。
单字即字中字。如:“努”中的“女、又、力”,“语”中的“五、口”等。字中字大小随机而定,数量不限,认识即可,字本身就是要素名称。
2、每个汉字,不论笔划多少,均取四码。第一码是分类码,为该字拼音方案的第一个字母(以下称声母)。如:前—Q,知—Z,安—A等。第二码至第四码为拆字码,每码均取所拆要素名称的声母。如:大(横、撇、捺),拆字码为HPN,全码为DHPN;描(手、草、田),拆字码为SCT,全码为MSCT;喘(口、山、而),拆字码为KSE,全码为CKSE。以此类推。拆字码的取码顺序是先左后右,先上后下,先外后内,先横后竖。如:树(木、又、寸),莫(草、日、大),国(口、王、点),长(横、钩、捺)等。
一个字以三码拆光为首选。如:辞(舌、立、十),不能拆成两码“舌,辛”和四码“千、口、立、十”;活(水、千、口),不能拆成两码“水、舌”和四码“水、撇、十、口”;王(横、十、横),不能拆成两码“横、土”和四码“横、横、竖、横”。
在拆分过程中,要遵循“先大后小,取字优先”的原则。如:辞(舌、立、十)不能拆成“千、口、辛”;兢(克、古、儿)不能拆成“十、兄、克”、“古、儿、克”和“克、十、兄”;活(水、千、口),不能拆成“水、撇、古”等。
一个字如果不能正好三码拆光,就选择两码拆光,这时需再取一个复码,即再取末码中的末字(取大优先)、末部首或末笔,补够三码。如:坡(土、皮),末码“皮”中的末字为“又”,其拆字码为TPY(土、皮、又),全码为PTPY;硕(石、页),全码为SSYB(石、页、贝);樱(木、婴),全码为YMYN(木、婴、女)。如果末码中无末字可取,就取末部首或末笔。如:喻(口,俞),末部首为“刀”,全码为YKYD(口,俞,刀);吕(口、口,,末笔为“横”,全码为LKKH;佛(人、弗),末笔为“竖”,全码为FRFS。以此类推。
在拆分过程中,要坚持“先拆散、后拆连、不拆交”的原则。如:“楂”,首选方案拆分为“木、杳、一”(先拆散),次选方案为“木、木、旦”(后拆连)。这类字,两种拆法均可。“朱”(撇、未),再取复码“捺”,全码为ZPWN(撇、未、捺),不能拆成“撇、横、木”(不拆交);好(女、子),再取复码“横”,全码为HNZH(女、子、横),不能拆成“女、了、横”(不拆交)。
如果一个字只能拆成四码以上(含四码)时,按“前二末一”取码,剩余的放弃。如:嚣(口、口、口),拆字码为KKK;游(水、方、子),拆字码为SFZ;发(折、撇、点),拆字码为ZPD。按“前二末一”取码也遵循“取大优先”的原则。
3、在四笔以上的字中含有两笔的单字时,两笔单字不拆,如果拆字码不够三码,加打复码。如:朴(木、卜、点),拆字码为MBD;公(八、厶、点),拆字码为BSD;古(十、口、横),拆字码为SKH。但不成字的可以拆,如:叫(口、折、竖),拆字码为KZS;石(横、撇、口),拆字码为HPK。
4、三笔以内的字,一律按笔划取码。如:土(横、竖、横),拆字码为HSH;下(横、竖、点),拆字码为HSD。二笔的字,末笔打两次。如:人(撇、捺、捺),拆字码为PNN;十(横、竖、竖),拆字码为HSS;一笔的字,连打三次,如:一(横、横、横),拆字码为HHH。
5、四笔以上的字,不能在散和连的条件下两码拆光,称独体字。独体字可以拆相交的要素。这类字的拆法是:按书写顺序依次拆出编码要素,规则同前。如:长(横、钩、捺),手(撇、二、钩),东(横、折、小),井(二、撇、竖)。
6、多音字、允许打错拆字码的字和既可这样打也可那样打的字设置了多码。如:“长”有“CHGN”和“ZHGN”两个编码;“张”有“ZGCN”和“ZGZN”两个编码,输入哪个编码都能打出该字。如:“樱”的标准编码为“YMYN”(木、婴、女),误打成“YMBN”(木、贝、女);将“楂”的标准编码“ZMYY”(木、杳、一)打成“ZMMD”(木、木、旦);再如:“禁”,按规则既可打成JMMS(木、木、示),也可打成JLEX(林、二、小)等等。多码字打哪个编码都能输入该字,可以减少错打次数,提高输入效率。
7、词汇的编码以字的编码为基础。两字词汇的编码,依次取每个字全码的前两码,共四码。如:森林—SMLM,动员—DEYK,笔记—BZJY,工人—GHRP。其余类推。
三字词汇的编码,依次取每个字的分类码加空格键。如:国务院—GWY,不得不—BDB,了不起—LBQ,等等。
四字词汇的编码,依次取每个字的分类码。如:计划经济—JHJJ,改革开放—GGKF,调查研究—DCYJ,等等。
五字和六字词汇的编码,依次取一、二、三、末字的分类码。如:电子工业部—DZGB,据不完全统计—JBWJ,计划委员会—JHWH。以此类推。
七字以上词汇的编码,依次取一、三、五、末字的分类码。如:中华人民共和国—ZRGG,计划生育委员会——JSWH,全国人民代表大会—QRDH。依此类推。
8、为方便使用,设置了一部分简码。字母键“I”加键盘上排的阿拉伯数字(“0”代表“10”)键为该数字的小写;字母键“U”加键盘上排的阿拉伯数字(“0”代表“10”)键为该数字的大写。键盘上的26个字母键加空格键,分别代表一个通用高频字。如;L—了,Z—在,D—的,等等。在两字词汇中挑选676个通用高频词,以两码加空格键输入。其编码是依次输入每个字的分类码加空格键。如;因为—YW,所以—SY,只有—ZY,才能—CN。等等。
9、为满足实际操作的需要,设置了万能键“V”。在取码时,不知道四码中的任何一码(或更多时),均可用“V”代替,这时,已知码相同的字,依次在提示行显示,供选择。如;“殁”,不知道该字读什么,分类码可以打“V”键,然后键入拆字码“DJY”(歹、几、又),全码为“VDJY”此时,拆字码相同的字在提示行依次全部显示,供选择;如:“吮”(口、厶、儿),既不知该字读什么,也不知拆字码的第二码“厶”读什么,此时键入“VKVE”,这时,2、4码相同的字在提示行依次显示,供选择。其余类推。
10、上述编码所用拼音字母与键盘英文字母完全一致。为合理利用键盘,便于操作,降低重码率,在键盘上规定了三个例外键来代表出现频率较高的笔划和部首。它们的替代关系是:字母键“O”代表“冫、氵”,字母键“I”代表“丨、扌”,字母键“U”代表“艹”。如:“莫”的编码为“MURD”,“河流”的编码为“HOLO”,“推广”的编码为“TIGD”,等等。
本编码方案中,无论输入单个汉字还是词汇都是四码输入,中间没有换档操作。当出现重码时,响笛提醒,提示行显示顺序为:单字在前,词汇在后(依字数多少顺次排列)。重码单字在两个以上时,常用字在前(词汇同理)。本编码方案中,每组编码的重码单字一般只有2—3个,最多不超过5个,如果所需要的汉字(或词)是提示行的第一个字(或词),继续输入下面的字(或词),使该字(或词)自动输入即可。
本方案与现有编码方案相比较,具有如下优点:
与数字码相比较,避免了巨大的记忆负担,不经常使用也不会忘记,并可输入词汇。
与拼音码相比较,可以避免大量的重码字选择,提高输入速度。发音不需要准确无误,能知道每个要素名称的第一个字母就行(不知道的可以用“V”键代替)。没学过拼音的人,只要认识26个拼音字母,了解拼音的一般知识即可。
与字型码相比较,不需学习拆字部件,不用记住部件与键盘字母的对应关系,不必对字进行分型识别,仅靠小学程度的文字知识就能操作,编码方法与书写汉字关系密切,有利于加深理解汉字的构造,容易学会,不易忘记。
与混合码相比较,规则简单,规律性强,没有例外。无需对字进行表音、表义和分型判断,无需输入拼音方案,操作失误率极低。
本编码方案无重码输入率可达90%,易学难忘,适合各种文化程度、各种年龄、各类操作人员使用,具有更高的推广价值。
实现本方案的方式与实现其它方案的方式相同。

Claims (8)

  1. 声母拆字码汉字输入编码方案,与已有的各种编码方案一样,是由现有的计算机键盘和击键时字母的某种排列组合而组成的,键盘上键入的是计算机汉字的外码,通过键入外码,调出所需要的字或词汇。
    声母拆字码的技术特征是:
    1.将“笔划、部首、单字”作为构成汉字的三种基本要素。笔划分“点、横、竖、撇、捺、折、提、钩、弯”9种。部首共50个(主要是非字部首),取每个部首名称的一个表义字作为该部首的要素名称。单字,即字中字,大小随机而定,认识即可,字本身就是要素名称;
  2. 2.每个汉字,不论笔划多少,均取四码。第1码是分类码,为该字拼音方案的第一个字母。第2、3、4码为拆字码,按三种基本要素拆分(单一或混合),每码均取要素名称的声母;
  3. 3.每个字的拆分,都以三码分光为首选,三码不能分光就两码分光。两码分光的字,须再补一个复码,即在末码要素中再取一个末字(取大优先)、未部首或末笔划,补足三码。如果一个字只能拆成四码以上(含四码)时,按前二末一取码(取大优先,剩余的放弃);
  4. 4.三笔以内的字,一律按笔划取码。两笔的字,末笔取两次。一笔的字,连取三次。
    四笔以上的字中含有两笔的单字时,两笔的单字一律不拆,拆字码不够三码时,用复码补够;
  5. 5.多码。多音字、允许拆错的字和既可这样拆也可那样拆的字,设置了多码。打多码同样可以输入该字;
  6. 6.两字词汇依次取每字全码的前两码,合为四码。三字词汇依次取每字的分类码加空格键。四字词汇依次取每字的分类码。五字和六字词汇依次取一、二、三、末字的分类码。七字以上词汇依次取一、三、五、末字的分类码;
  7. 7.简码。字母键“I”加键盘上排的阿拉伯数字键(“0”代表“10”)为相应的小写。字母键“U”加键盘上排的阿拉伯数字键为相应的大写。
    在双字词汇中挑选676个常用词汇,以两个单字的分类码加空格输入;
  8. 8.万能键“V”代表单字编码中的任何一个未知码,使其余已知码相同的字在提示行显示,供选择。
CN 94102437 1994-03-26 1994-03-26 声母拆字码汉字输入编码方案 Pending CN1124851A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN 94102437 CN1124851A (zh) 1994-03-26 1994-03-26 声母拆字码汉字输入编码方案

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN 94102437 CN1124851A (zh) 1994-03-26 1994-03-26 声母拆字码汉字输入编码方案

Publications (1)

Publication Number Publication Date
CN1124851A true CN1124851A (zh) 1996-06-19

Family

ID=5030652

Family Applications (1)

Application Number Title Priority Date Filing Date
CN 94102437 Pending CN1124851A (zh) 1994-03-26 1994-03-26 声母拆字码汉字输入编码方案

Country Status (1)

Country Link
CN (1) CN1124851A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1055166C (zh) * 1997-01-07 2000-08-02 朱伟 电脑汉字规范码输入方法
CN1295589C (zh) * 2004-07-02 2007-01-17 赵畅 无根码汉字输入法
CN1316338C (zh) * 2000-06-14 2007-05-16 索尼公司 汉字输入方法

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1055166C (zh) * 1997-01-07 2000-08-02 朱伟 电脑汉字规范码输入方法
CN1316338C (zh) * 2000-06-14 2007-05-16 索尼公司 汉字输入方法
CN1295589C (zh) * 2004-07-02 2007-01-17 赵畅 无根码汉字输入法

Similar Documents

Publication Publication Date Title
US5119296A (en) Method and apparatus for inputting radical-encoded chinese characters
JP2007535693A (ja) 語学を教授する方法
WO2000060560A1 (en) Text processing and display methods and systems
CN1124851A (zh) 声母拆字码汉字输入编码方案
EP2336850A1 (en) Guixi input method and system for splitting word letters
CN100399245C (zh) 中文拼音声调笔划组合输入法
CN1027839C (zh) 中华双拼汉字编入的计算机键盘
CN1260528A (zh) 计算机中文输入方法
CN104615269B (zh) 一种藏文拉丁全简双拼编码方法及其智能输入系统
Graves et al. The ogham alphabet
CN1022350C (zh) 汉字字母编码输入法
CN1026271C (zh) 智能拼音汉字输入系统
CN1030867C (zh) 音素易码输入法
CN101082838A (zh) 音顺码汉字输入法
CN1080070A (zh) 形声位全息汉字编码
CN1148198A (zh) 一种普及型汉字编码输入法
JP2002516004A (ja) 非音標文字を代用単語に変換しコンピュータに入力する方法
CN1099882A (zh) 汉字速成输入键盘
CN1341884A (zh) 一种汉语输入法
CN1164695A (zh) 汉字笔形数值编码法
CN1202647A (zh) 拼音汉字
AU780472B2 (en) Text processing and display methods and systems
CN1122469A (zh) 拼音、声调、首笔码汉字输入法
CN1098208A (zh) 字音四声计算机键盘汉字输入方法
CN1100538A (zh) 新拼音汉字输入法及其键盘设计

Legal Events

Date Code Title Description
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C06 Publication
PB01 Publication
C01 Deemed withdrawal of patent application (patent law 1993)
WD01 Invention patent application deemed withdrawn after publication