CN1307269A - 汉字笔顺部首双重输入系统 - Google Patents

汉字笔顺部首双重输入系统 Download PDF

Info

Publication number
CN1307269A
CN1307269A CN 99123094 CN99123094A CN1307269A CN 1307269 A CN1307269 A CN 1307269A CN 99123094 CN99123094 CN 99123094 CN 99123094 A CN99123094 A CN 99123094A CN 1307269 A CN1307269 A CN 1307269A
Authority
CN
China
Prior art keywords
code
character
word
account
chinese
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN 99123094
Other languages
English (en)
Other versions
CN1178121C (zh
Inventor
邱国权
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to CNB991230949A priority Critical patent/CN1178121C/zh
Publication of CN1307269A publication Critical patent/CN1307269A/zh
Application granted granted Critical
Publication of CN1178121C publication Critical patent/CN1178121C/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)

Abstract

本发明提供用于普及汉字输入的一二级汉字(GB)和大字符集汉字(GBK)的笔顺数字输入系统和笔顺部首双重数字输入系统。其中,一二级汉字笔顺部首双重输入系统字均码长最短:在重码不过10时,高频字为3.18位,一级汉字为3.89位,一二级汉字为4.39位。在输入系统中,大字符集汉字字均码长5.40-6.27位。单字码长可调,重码数可指定,词组不编码,首字跟踪、末字跟踪或指定字跟踪输入,可定义和输入由中西文字、数字和符号混合组成的词组和字符串。除电脑外,还能用来在没有字母键的手机和其他产品上输入汉字。

Description

汉字笔顺部首双重输入系统
到目前为止,国内的汉字输入,拆字码难记,拼音码有方言干扰,普及问题没有真正解决。
本发明的目的在于:为广大非专职汉字输入的,电脑和手机等需要输入汉字的电子产品使用者,提供自学就会的,一二级汉字(GB)和大字符集汉字(GBK)的笔顺数字输入系统和笔顺部首双重数字输入系统,促进汉字输入的普及。
一二级汉字的笔顺数字码(以下简称笔顺码)已由国家规范化了,就是国家语言文字工作委员会和中华人民共和国新闻出版社于1997年4月7日联合发布的《现代汉语通用字笔顺规范》中的序号式。
《规范》规定,笔画分五类,用1-5五个数字作为它们的代码,如下:
1.横、挑,2.竖,3.撇,4.点、捺,5.折,
例如:″王″字的笔顺全码为:1121,
      ″巍″字的笔顺全码为:25231234531325113554等等。
大字符集汉字中,除一二级汉字外,汉字的笔顺码,国家还没有规范化,是参照上述《规范》和《汉语大字典》编写的。
一二级汉字的笔顺全码,字均码长10.67位,最长码长26位,大字符集汉字的笔顺全码,字均码长12.88位,最长码长48位。这些笔顺全码,由于码长过长,不能直接用作在键盘上进行输入的输入码。要使它们成为能用来在键盘上进行输入,产生技术效果的输入码,需经如下步骤处理:
(a)把全码按全码第一位的数字代码分类;
(b)分类后的各类分别按汉字的使用频率从高频到低频排序,使各类中排在最前面的都是该类中使用频率最高的字;
(c)取各类全码第一位的数字代码,即分类根据,作为各类中排在最前面的,10位以内(含10位)的字的实际使用的找字码,使这些字的找字码成为一位码,重码字不超过10个;
(d)各类中取过找字码后剩下的字,按全码的第一二两位的数字代码分类;
(e)分类后的各类分别按汉字的使用频率从高频到低频排序,使各类中排在最前面的都是该类中使用频率最高的字;
(f)取各类全码第一二两位的数字代码,即分类根据,作为各类中排在最前面的,10位以内(含10位)的字的实际使用的找字码,使这些字的找字码成为二位码,重码字不超过10个;
(g)各类中取过找字码后剩下的字,按(a)-(f)的方法和步骤,继续分类、排序和取找字码,直到所有全码都有了实际使用的找字码为止,其中,每次分类的分类根据,都比前一次分类的分类根据增加一个全码中的下一位数字代码,所取的找字码也相应地比前一次取的加长一位。
(h)在(a)-(g)的过程中,难于取短于全码的找字码的全码,就取全码作为找字码,在轮到这些全码取找字码时,给这些全码排序优先权,使它们排在序列的最前面,成为重码数10(含10)以内的字。
下面是第一位数字代码为4的一类全码的部分找字码。
4    这主为产学就义部方说    4411    河源满江灌渐潮湖洪浇
44   实家定深法性斗它没治    44111   污浅汗潜添涛汪沫渍沅
441  头流油活温清海注济测    441111  沣溱滟
笔顺全码,经上述(a)-(h)处理后,所得找字码的码长分类统计如下:
码长  高频字(1499) 一级字(3600) 一二级字(6716) 大字符集(20720)
1位码2位码3位码4位码5位码6位码7位码8位码9位码10位码11位码12位码13位码14位码  50  占3%233  占16%564  占38%461  占31%186  占12%5  占-%-   占-%-   占-%-   占-%-   占-%-   占-%-   占-%-   占-%-   占-%  50  占1%247  占7%754  占21%1126 占31%900  占25%444  占12%70  占2%9  占-%-   占-%-   占-%-   占-%-   占-%-   占-%-   占-%   50  占1%250  占4%856  占13%1629  占24%1867  占28%1281  占19%549  占8%183  占3%51  占1%-   占-%-   占-%-   占-%-   占-%-   占-%   50  占-%250  占1%984  占5%2486  占12%3977  占20%4588  占22%3675  占18%1957  占9%1325  占6%649  占3%345  占2%219  占1%163  占1%52  占-%
字均码长    3.34位    4.18位     4.83位     6.27位
以上统计显示:高频字:字均码长3.34位,其中57%码长1-3位,88%码长1-4位。
一级汉字:字均码长4.18位,其中60%码长1-4位,84%码长1-5位。
一二级汉字:字均码长从10.67位缩短为4.83位,其中,70%码长1-5位,96%码长1-7位,最长码长从26位缩短为9位。
大字符集汉字:字均码长从12.88位缩短为6.27位,其中60%码长1-6位,93%码长1-9位。最长码长从48位缩短为14位。
这说明:一二级汉字的笔顺全码和大字符集汉字的笔顺全码,都已成了可以单独使用的汉字笔顺输入码。
为了进一步缩短找字码码长,提高输入速度,除了上述笔顺码外,本发明还对字典部首中部首在字首的汉字,给出部首数字码(以下简称部首码)。部首码按如下公式构成:
部首码=部首首笔+0+余部笔顺。
例如:″舞″字。笔顺全码为352512115115452码长15位
                部首全码为305115452      码长9位显然,部首全码比笔顺全码短。
笔顺码可以与部首码相结合,构成汉字笔顺部首双重输入码,不仅能提高输入速度,也为使用者提供了方便。
例如:一二级汉字的笔顺码可以与其中四笔和四笔以上的字典部首中部首在字首的字的部首码构成汉字笔顺部首双重输入码。该编码,由于全码字均码长10.20位,最长码长26位,需经上述(a)-(h)的方法和步骤处理后,才能成为可以用来在键盘上进行双重输入,产生技术效果的双重输入码。
该全码经上述(a)-(h)的方法和步骤处理后,所得找字码的码长分类统计如下:
码长 高频字(1499) 一级字(3600) 一二级字(6716) 双重输入码(9230)
1位码2位码3位码4位码5位码6位码7位码8位码9位码  50  占3%268  占18%637  占42%445  占30%99  占7%-    占-%-    占-%-    占-%-    占-%   50  占1%291  占8%862  占24%1375  占38%851  占24%171  占5%-    占-%-    占-%-    占-%   50  占1%299  占4%992  占15%2114  占32%2284  占34%832  占12%145  占2%-    占-%-    占-%      50  占1%300  占3%1079  占12%2409  占26%2888  占31%1609  占17%644  占7%194  占2%57  占1%
字均码长    3.18位    3.89位     4.39位      4.70位
以上统计显示:
高频字:字均码长3.18位,其中63%码长1-3位,93%码长1-4位。
一级汉字:字均码长3.89位,其中71%码长1-4位,95%码长1-5位。
一二级汉字:字均码长4.39位,其中86%码长1-5位。最长码长从26位缩短为7位。
双重输入码:字均码长4.70位,最长码长从26位缩短为9位。
这些说明:该编码已成了可以单独使用的一种一二级汉字笔顺部首双重输入码。
又如:大字符集汉字的笔顺码也可以与其中四笔和四笔以上的字典部首中部首在字首的字的部首码构成汉字笔顺部首双重输入码。该编码的全码字均码长12.06位,最长码长48位,也需经上述(a)-(h)的方法和步骤处理后,才能成为可以用来在键盘上进行双重输入,产生技术效果的双重输入码。
该全码经上述(a)-(h)的方法和步骤处理后,所得找字码的码长分类统计如下:
码长 高频字(1499) 一级字(3600) 一二级字(6716) 大字符集(20685) 双重输入码(30758)
1位码2位码3位码4位码5位码6位码7位码8位码9位码10位码11位码12位码13位码14位码  50  占3%257  占17%621  占42%445  占30%122  占8%4  占-%-    占-%-    占-%-    占-%-    占-%-    占-%-    占-%-    占-%-    占-%   50  占1%279  占8%832  占23%1329  占37%878  占25%220  占6%12  占-%-    占-%-    占-%-    占-%-    占-%-    占-%-    占-%-    占-%   50  占1%287  占4%961  占14%2023  占30%2292  占34%915  占14%166  占3%22  占-%-    占-%-    占-%-    占-%-    占-%-    占-%-    占-%   50  占-%300  占1%1177  占6%3321  占16%6063  占29%5912  占29%2767  占13%937  占5%249  占1%-    占-%-    占-%-    占-%-    占-%-    占-%       50  占-%300  占1%1229  占4%7878  占12%7021  占23%7721  占25%5208  占17%2648  占9%1562  占5%663  占2%364  占1%226  占1%173  占-%51   占-%
字均码长    3.23位     3.95位     4.45位     5.40位      6.10位
以上统计显示:
高频字:字均码长3.23位,其中62%码长1-3位,92%码长1-4位。
一级汉字:字均码长3.95位,其中69%码长1-4位,94%码长1-5位。
一二级汉字:字均码长4.45位,其中83%码长1-5位。最长码长从26位缩短为8位。
大字符集汉字:字均码长5.40位,其中,81%码长1-6位。最长码长从48位缩短为9位。
双重输入码:字均码长从12.06位缩短为6.10位,最长码长从48位缩短为14位。
这说明:该编码已成了可以单独使用的一种大字符集汉字笔顺部首双重输入码。
上述找字码都是以字频为序的有重码编码,单字找字码的码长是由单字的字频和输入系统的重码数决定的,所以,可以通过人为地改变单字的频序来缩短或加长单字找字码的码长。单字找字码码长可调,使不同地区、不同时间、不同行业和不同个人所使用的不同的高频字集的找字码,可以长期地或临时地调整到系统允许的最短码位上,提高输入速度。
单字找字码码长可调,也使重码数成为可以改变的。如果某产品所需汉字总量有限,显示屏面积又小,便可把重码数10,改为8,7,6或更小。
上述数字代码可以单重或双重映射在键盘的数字按键上,构成数码数字键映射系统;也可以单重或双重映射在键盘的字母按键上,构成数码字母键映射系统。
上述汉字笔顺输入码和笔顺部首双重输入码,与上述码键映射系统,以及输入时的屏幕显示引导系统相结合,就构成了汉字笔顺输入系统和汉字笔顺部首双重输入系统,其优点是:
1.汉字的笔顺和部首都是汉字字形基础教学的基本内容,也是九年义务教学的内容,对它们的记忆是以汉语为母语的人,或学过汉语的人的常识性记忆。学习笔顺码,只需记住五类笔画,以及它们的五个数字代码,数量很少;学习部首码,只需记住一个很简单的公式,其中,部首码的首码与笔顺码的首码思路一致。这些都为记住输入码提供了方便。数字代码一般都映射在数字键上,这又为使用方块汉字的人提供了操作上的方便。
2.输入系统的重码字按重码数一次显示,不换屏。
3.当输入系统采用数字代码对数字键单重映射系统时,输入系统便能用来在没有字母键,只有数字键的手机和其他产品上输入汉字。
4.当输入系统采用数字代码对数字键单重映射系统时,由于找字码和送字码都是数字码,使用的是相同的数字键,所以,需要设置送字标识。设置不同的送字标识,可以使用简体汉字的输入码输入相应的繁体汉字,也可以使用繁体汉字的输入码输入相应的简体汉字,还可以跟踪检索资料库。
5.词组不编码,采用跟踪联想方去输入。这给采用词组首字跟踪、末字跟踪和指定字跟踪,以及中西文字、数字和符号混合组词组串等技术带来了方便,不仅保证了词组输入的速度,还能定义和输入混编词组和字符串。

Claims (7)

1.一种汉字笔顺和部首字形数字输入系统,该系统采用1.横挑,2.竖,3.撇,4.点捺和5.折的规范的汉字笔画数字代码系统,编制笔顺数字码和部首数字码,并跟上述数字代码与键盘上按键的映射系统,以及输入时的屏幕显示引导系统相结合,构成汉字字形数字输入系统,其特征在于:
(1)一二级汉字的笔顺数字码取自《现代汉语通用字笔顺规范》中的序号式,大字符集汉字中,除一二级汉字外,汉字的笔顺数字码,参照上述《规范》和《汉语大字典》编制;
(2)对字典部首中部首在字首的字,除上述笔顺数字码外,还按部首首笔,部首码标识和余部笔顺的顺序编制部首数字码,其中部首标识的数字代码从6,7,8,9和0中任选一个;
(3)上述笔顺数字码单独,或者与上述部首数字码一起,
(a)把全码按全码第一位的数字代码分类,
(b)分类后的各类分别按汉字的使用频率从高频到低频排序,使各类中排
   在最前面的都是该类中使用频率最高的字,
(c)取各类全码第一位的数字代码即分类根据,作为各类中排在最前面的,10位以内(含10位)的字的找字码,使这些字的找字码成为一位码,重码字不超过10个,
(d)各类中取过找字码后剩下的字,按全码的第一二两位的数字代码分类,
(e)分类后的各类分别按汉字的使用频率从高频到低频排序,使各类中排在最前面的都是该类中使用频率最高的字,
(f)取各类全码第一二两位的数字代码即分类根据,作为各类中排在最前面的,10位以内(含10位)的字的实际使用的找字码,使这些字的找字码成为二位码,重码字不超过10个,
(g)各类中取过找字码后剩下的字,按(a)-(f)的方法和步骤,继续分类、排序和取找字码,直到所有全码都有了找字码为止,其中,每次分类的分类根据,都比前一次分类的分类根据增加一个全码中的下一位数字代码,所取的找字码也相应地比前一次取的加长一位,
(h)在(a)-(g)的过程中,难于取短于全码的找字码的全码,就取全码作为找字码,在轮到这些全码取找字码时,给这些全码排序优先权,使它们排在序列的最前面,成为重码数10以内(含10)的字;
(4)制定上述数字代码与键盘上按键的映射系统,把上述找字码输入电脑或手机,并设置送字标识,按照屏幕显示引导,把选定的字送到显示屏上光标所在位置。
2.根据权利要求1所述输入系统,其特征在于:
上述汉字笔顺数字码的上述找字码可以单独跟上述数字代码与键盘上按键的映射系统,以及屏幕显示引导系统相结合,构成汉字笔顺输入系统,也可以与上述部首数字码的上述找字码一起,跟上述数字代码与键盘上按键的映射系统,以及屏幕显示引导系统相结合,构成汉字笔顺部首双重输入系统。
3.根据权利要求1和2所述输入系统,其特征在于:
一二级汉字笔顺输入系统中的字均码长已从10.67位缩短为4.83位,最长码长已从26位缩短为9位;
大字符集汉字笔顺输入系统中的字均码长已从12.88位缩短为6.27位,最长码长已从48位缩短为14位;
一二级汉字笔顺部首双重输入系统中,一二级汉字的字均码长已从10.20位缩短为4.39位,最长码长已从26位缩短为7位;
大字符集汉字笔顺部首双重输入系统中,大字符集汉字的字均码长已从12.06位缩短为6.10位,最长码长已从48位缩短为9位。
4.根据权利要求1所述输入系统,其特征在于:
上述找字码都是以字频为序的有重码编码,单字找字码的码长是由单字的频序和输入系统的重码数决定的,需要时可以调整,即通过人为地改变单字的频序来缩短或加长单字找字码的码长。
5.根据权利要求1和4所述输入系统,其特征在于:
单字找字码码长可调,使输入系统的重码数可以改变,需要时可以指定不同的重码数来满足不同产品的不同的需求。
6.根据权利要求1所述输入系统,其特征在于:
设置不同的送字标识,可以使用简体汉字的输入码输入相应的繁体汉字,也可以使用繁体汉字的输入码输入相应的简体汉字,还可以跟踪检索资料库。
7.根据权利要求1所述输入系统,其特征在于:
词组不编码,可以采用首字跟踪、末字跟踪和指定字跟踪等技术输入,还可以定义和输入由中西文字、数字和符号混合组成的词组和字符串。
CNB991230949A 1999-12-08 1999-12-08 汉字笔顺部首双重输入方法及系统 Expired - Fee Related CN1178121C (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CNB991230949A CN1178121C (zh) 1999-12-08 1999-12-08 汉字笔顺部首双重输入方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CNB991230949A CN1178121C (zh) 1999-12-08 1999-12-08 汉字笔顺部首双重输入方法及系统

Publications (2)

Publication Number Publication Date
CN1307269A true CN1307269A (zh) 2001-08-08
CN1178121C CN1178121C (zh) 2004-12-01

Family

ID=5282796

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB991230949A Expired - Fee Related CN1178121C (zh) 1999-12-08 1999-12-08 汉字笔顺部首双重输入方法及系统

Country Status (1)

Country Link
CN (1) CN1178121C (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101807119A (zh) * 2010-03-30 2010-08-18 中南民族大学 计算机女书字部首输入法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101807119A (zh) * 2010-03-30 2010-08-18 中南民族大学 计算机女书字部首输入法

Also Published As

Publication number Publication date
CN1178121C (zh) 2004-12-01

Similar Documents

Publication Publication Date Title
CN1307269A (zh) 汉字笔顺部首双重输入系统
CN101359259A (zh) 数码声韵双拼输入法
CN1177271C (zh) 四笔号码字词不重输入法及其键盘
CN1293448C (zh) 十笔数码输入法
CN1439954A (zh) 双拼双形序码数字键汉字输入法
CN1349157A (zh) 数字笔形码汉字输入法
CN1142474C (zh) 字典码汉字输入法
CN1818836A (zh) 快易码数码象形输入法
CN1744014A (zh) 数字二笔和汉字输入法及键盘
CN1017662B (zh) 无理序号数字编码法及其键盘
CN1043381C (zh) 汉字四笔画数码输入法
CN1873589A (zh) 基于音码的汉字输入方法
CN1419179A (zh) 按笔顺输入的汉字输入法及其键盘
CN1828496A (zh) 一种汉字笔形网络输入法
CN86103506A (zh) “一键双值”键盘及中外文字高速输入方法
CN1141634C (zh) 单笔画编码汉字输入法
CN1068444C (zh) 一种汉字编码输入方法
CN1046402A (zh) 形音符汉字、符号编码法及其键盘
CN101021843A (zh) 笔画笔顺数码汉字检索、输入法
CN1425975A (zh) 笔形数码汉字输入法
CN1365040A (zh) 数字键盘拼音加笔顺汉字输入法
CN1100288C (zh) 四笔序音计算机汉字键盘输入方法
CN87104964A (zh) 文字录入机中日汉字合壁输入法
CN1357815A (zh) 汉字数码输入法
CN1396511A (zh) 键码、窗位同号对应的微电脑操作系统及其汉字九码

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C19 Lapse of patent right due to non-payment of the annual fee
CF01 Termination of patent right due to non-payment of annual fee