CN1307269A - 汉字笔顺部首双重输入系统 - Google Patents
汉字笔顺部首双重输入系统 Download PDFInfo
- Publication number
- CN1307269A CN1307269A CN 99123094 CN99123094A CN1307269A CN 1307269 A CN1307269 A CN 1307269A CN 99123094 CN99123094 CN 99123094 CN 99123094 A CN99123094 A CN 99123094A CN 1307269 A CN1307269 A CN 1307269A
- Authority
- CN
- China
- Prior art keywords
- code
- character
- word
- account
- chinese
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Document Processing Apparatus (AREA)
Abstract
本发明提供用于普及汉字输入的一二级汉字(GB)和大字符集汉字(GBK)的笔顺数字输入系统和笔顺部首双重数字输入系统。其中,一二级汉字笔顺部首双重输入系统字均码长最短:在重码不过10时,高频字为3.18位,一级汉字为3.89位,一二级汉字为4.39位。在输入系统中,大字符集汉字字均码长5.40-6.27位。单字码长可调,重码数可指定,词组不编码,首字跟踪、末字跟踪或指定字跟踪输入,可定义和输入由中西文字、数字和符号混合组成的词组和字符串。除电脑外,还能用来在没有字母键的手机和其他产品上输入汉字。
Description
到目前为止,国内的汉字输入,拆字码难记,拼音码有方言干扰,普及问题没有真正解决。
本发明的目的在于:为广大非专职汉字输入的,电脑和手机等需要输入汉字的电子产品使用者,提供自学就会的,一二级汉字(GB)和大字符集汉字(GBK)的笔顺数字输入系统和笔顺部首双重数字输入系统,促进汉字输入的普及。
一二级汉字的笔顺数字码(以下简称笔顺码)已由国家规范化了,就是国家语言文字工作委员会和中华人民共和国新闻出版社于1997年4月7日联合发布的《现代汉语通用字笔顺规范》中的序号式。
《规范》规定,笔画分五类,用1-5五个数字作为它们的代码,如下:
1.横、挑,2.竖,3.撇,4.点、捺,5.折,
例如:″王″字的笔顺全码为:1121,
″巍″字的笔顺全码为:25231234531325113554等等。
大字符集汉字中,除一二级汉字外,汉字的笔顺码,国家还没有规范化,是参照上述《规范》和《汉语大字典》编写的。
一二级汉字的笔顺全码,字均码长10.67位,最长码长26位,大字符集汉字的笔顺全码,字均码长12.88位,最长码长48位。这些笔顺全码,由于码长过长,不能直接用作在键盘上进行输入的输入码。要使它们成为能用来在键盘上进行输入,产生技术效果的输入码,需经如下步骤处理:
(a)把全码按全码第一位的数字代码分类;
(b)分类后的各类分别按汉字的使用频率从高频到低频排序,使各类中排在最前面的都是该类中使用频率最高的字;
(c)取各类全码第一位的数字代码,即分类根据,作为各类中排在最前面的,10位以内(含10位)的字的实际使用的找字码,使这些字的找字码成为一位码,重码字不超过10个;
(d)各类中取过找字码后剩下的字,按全码的第一二两位的数字代码分类;
(e)分类后的各类分别按汉字的使用频率从高频到低频排序,使各类中排在最前面的都是该类中使用频率最高的字;
(f)取各类全码第一二两位的数字代码,即分类根据,作为各类中排在最前面的,10位以内(含10位)的字的实际使用的找字码,使这些字的找字码成为二位码,重码字不超过10个;
(g)各类中取过找字码后剩下的字,按(a)-(f)的方法和步骤,继续分类、排序和取找字码,直到所有全码都有了实际使用的找字码为止,其中,每次分类的分类根据,都比前一次分类的分类根据增加一个全码中的下一位数字代码,所取的找字码也相应地比前一次取的加长一位。
(h)在(a)-(g)的过程中,难于取短于全码的找字码的全码,就取全码作为找字码,在轮到这些全码取找字码时,给这些全码排序优先权,使它们排在序列的最前面,成为重码数10(含10)以内的字。
下面是第一位数字代码为4的一类全码的部分找字码。
4 这主为产学就义部方说 4411 河源满江灌渐潮湖洪浇
44 实家定深法性斗它没治 44111 污浅汗潜添涛汪沫渍沅
441 头流油活温清海注济测 441111 沣溱滟
笔顺全码,经上述(a)-(h)处理后,所得找字码的码长分类统计如下:
以上统计显示:高频字:字均码长3.34位,其中57%码长1-3位,88%码长1-4位。
码长 | 高频字(1499) | 一级字(3600) | 一二级字(6716) | 大字符集(20720) |
1位码2位码3位码4位码5位码6位码7位码8位码9位码10位码11位码12位码13位码14位码 | 50 占3%233 占16%564 占38%461 占31%186 占12%5 占-%- 占-%- 占-%- 占-%- 占-%- 占-%- 占-%- 占-%- 占-% | 50 占1%247 占7%754 占21%1126 占31%900 占25%444 占12%70 占2%9 占-%- 占-%- 占-%- 占-%- 占-%- 占-%- 占-% | 50 占1%250 占4%856 占13%1629 占24%1867 占28%1281 占19%549 占8%183 占3%51 占1%- 占-%- 占-%- 占-%- 占-%- 占-% | 50 占-%250 占1%984 占5%2486 占12%3977 占20%4588 占22%3675 占18%1957 占9%1325 占6%649 占3%345 占2%219 占1%163 占1%52 占-% |
字均码长 | 3.34位 | 4.18位 | 4.83位 | 6.27位 |
一级汉字:字均码长4.18位,其中60%码长1-4位,84%码长1-5位。
一二级汉字:字均码长从10.67位缩短为4.83位,其中,70%码长1-5位,96%码长1-7位,最长码长从26位缩短为9位。
大字符集汉字:字均码长从12.88位缩短为6.27位,其中60%码长1-6位,93%码长1-9位。最长码长从48位缩短为14位。
这说明:一二级汉字的笔顺全码和大字符集汉字的笔顺全码,都已成了可以单独使用的汉字笔顺输入码。
为了进一步缩短找字码码长,提高输入速度,除了上述笔顺码外,本发明还对字典部首中部首在字首的汉字,给出部首数字码(以下简称部首码)。部首码按如下公式构成:
部首码=部首首笔+0+余部笔顺。
例如:″舞″字。笔顺全码为352512115115452码长15位
部首全码为305115452 码长9位显然,部首全码比笔顺全码短。
笔顺码可以与部首码相结合,构成汉字笔顺部首双重输入码,不仅能提高输入速度,也为使用者提供了方便。
例如:一二级汉字的笔顺码可以与其中四笔和四笔以上的字典部首中部首在字首的字的部首码构成汉字笔顺部首双重输入码。该编码,由于全码字均码长10.20位,最长码长26位,需经上述(a)-(h)的方法和步骤处理后,才能成为可以用来在键盘上进行双重输入,产生技术效果的双重输入码。
该全码经上述(a)-(h)的方法和步骤处理后,所得找字码的码长分类统计如下:
码长 | 高频字(1499) | 一级字(3600) | 一二级字(6716) | 双重输入码(9230) |
1位码2位码3位码4位码5位码6位码7位码8位码9位码 | 50 占3%268 占18%637 占42%445 占30%99 占7%- 占-%- 占-%- 占-%- 占-% | 50 占1%291 占8%862 占24%1375 占38%851 占24%171 占5%- 占-%- 占-%- 占-% | 50 占1%299 占4%992 占15%2114 占32%2284 占34%832 占12%145 占2%- 占-%- 占-% | 50 占1%300 占3%1079 占12%2409 占26%2888 占31%1609 占17%644 占7%194 占2%57 占1% |
字均码长 | 3.18位 | 3.89位 | 4.39位 | 4.70位 |
以上统计显示:
高频字:字均码长3.18位,其中63%码长1-3位,93%码长1-4位。
一级汉字:字均码长3.89位,其中71%码长1-4位,95%码长1-5位。
一二级汉字:字均码长4.39位,其中86%码长1-5位。最长码长从26位缩短为7位。
双重输入码:字均码长4.70位,最长码长从26位缩短为9位。
这些说明:该编码已成了可以单独使用的一种一二级汉字笔顺部首双重输入码。
又如:大字符集汉字的笔顺码也可以与其中四笔和四笔以上的字典部首中部首在字首的字的部首码构成汉字笔顺部首双重输入码。该编码的全码字均码长12.06位,最长码长48位,也需经上述(a)-(h)的方法和步骤处理后,才能成为可以用来在键盘上进行双重输入,产生技术效果的双重输入码。
该全码经上述(a)-(h)的方法和步骤处理后,所得找字码的码长分类统计如下:
码长 | 高频字(1499) | 一级字(3600) | 一二级字(6716) | 大字符集(20685) | 双重输入码(30758) |
1位码2位码3位码4位码5位码6位码7位码8位码9位码10位码11位码12位码13位码14位码 | 50 占3%257 占17%621 占42%445 占30%122 占8%4 占-%- 占-%- 占-%- 占-%- 占-%- 占-%- 占-%- 占-%- 占-% | 50 占1%279 占8%832 占23%1329 占37%878 占25%220 占6%12 占-%- 占-%- 占-%- 占-%- 占-%- 占-%- 占-%- 占-% | 50 占1%287 占4%961 占14%2023 占30%2292 占34%915 占14%166 占3%22 占-%- 占-%- 占-%- 占-%- 占-%- 占-%- 占-% | 50 占-%300 占1%1177 占6%3321 占16%6063 占29%5912 占29%2767 占13%937 占5%249 占1%- 占-%- 占-%- 占-%- 占-%- 占-% | 50 占-%300 占1%1229 占4%7878 占12%7021 占23%7721 占25%5208 占17%2648 占9%1562 占5%663 占2%364 占1%226 占1%173 占-%51 占-% |
字均码长 | 3.23位 | 3.95位 | 4.45位 | 5.40位 | 6.10位 |
以上统计显示:
高频字:字均码长3.23位,其中62%码长1-3位,92%码长1-4位。
一级汉字:字均码长3.95位,其中69%码长1-4位,94%码长1-5位。
一二级汉字:字均码长4.45位,其中83%码长1-5位。最长码长从26位缩短为8位。
大字符集汉字:字均码长5.40位,其中,81%码长1-6位。最长码长从48位缩短为9位。
双重输入码:字均码长从12.06位缩短为6.10位,最长码长从48位缩短为14位。
这说明:该编码已成了可以单独使用的一种大字符集汉字笔顺部首双重输入码。
上述找字码都是以字频为序的有重码编码,单字找字码的码长是由单字的字频和输入系统的重码数决定的,所以,可以通过人为地改变单字的频序来缩短或加长单字找字码的码长。单字找字码码长可调,使不同地区、不同时间、不同行业和不同个人所使用的不同的高频字集的找字码,可以长期地或临时地调整到系统允许的最短码位上,提高输入速度。
单字找字码码长可调,也使重码数成为可以改变的。如果某产品所需汉字总量有限,显示屏面积又小,便可把重码数10,改为8,7,6或更小。
上述数字代码可以单重或双重映射在键盘的数字按键上,构成数码数字键映射系统;也可以单重或双重映射在键盘的字母按键上,构成数码字母键映射系统。
上述汉字笔顺输入码和笔顺部首双重输入码,与上述码键映射系统,以及输入时的屏幕显示引导系统相结合,就构成了汉字笔顺输入系统和汉字笔顺部首双重输入系统,其优点是:
1.汉字的笔顺和部首都是汉字字形基础教学的基本内容,也是九年义务教学的内容,对它们的记忆是以汉语为母语的人,或学过汉语的人的常识性记忆。学习笔顺码,只需记住五类笔画,以及它们的五个数字代码,数量很少;学习部首码,只需记住一个很简单的公式,其中,部首码的首码与笔顺码的首码思路一致。这些都为记住输入码提供了方便。数字代码一般都映射在数字键上,这又为使用方块汉字的人提供了操作上的方便。
2.输入系统的重码字按重码数一次显示,不换屏。
3.当输入系统采用数字代码对数字键单重映射系统时,输入系统便能用来在没有字母键,只有数字键的手机和其他产品上输入汉字。
4.当输入系统采用数字代码对数字键单重映射系统时,由于找字码和送字码都是数字码,使用的是相同的数字键,所以,需要设置送字标识。设置不同的送字标识,可以使用简体汉字的输入码输入相应的繁体汉字,也可以使用繁体汉字的输入码输入相应的简体汉字,还可以跟踪检索资料库。
5.词组不编码,采用跟踪联想方去输入。这给采用词组首字跟踪、末字跟踪和指定字跟踪,以及中西文字、数字和符号混合组词组串等技术带来了方便,不仅保证了词组输入的速度,还能定义和输入混编词组和字符串。
Claims (7)
1.一种汉字笔顺和部首字形数字输入系统,该系统采用1.横挑,2.竖,3.撇,4.点捺和5.折的规范的汉字笔画数字代码系统,编制笔顺数字码和部首数字码,并跟上述数字代码与键盘上按键的映射系统,以及输入时的屏幕显示引导系统相结合,构成汉字字形数字输入系统,其特征在于:
(1)一二级汉字的笔顺数字码取自《现代汉语通用字笔顺规范》中的序号式,大字符集汉字中,除一二级汉字外,汉字的笔顺数字码,参照上述《规范》和《汉语大字典》编制;
(2)对字典部首中部首在字首的字,除上述笔顺数字码外,还按部首首笔,部首码标识和余部笔顺的顺序编制部首数字码,其中部首标识的数字代码从6,7,8,9和0中任选一个;
(3)上述笔顺数字码单独,或者与上述部首数字码一起,
(a)把全码按全码第一位的数字代码分类,
(b)分类后的各类分别按汉字的使用频率从高频到低频排序,使各类中排
在最前面的都是该类中使用频率最高的字,
(c)取各类全码第一位的数字代码即分类根据,作为各类中排在最前面的,10位以内(含10位)的字的找字码,使这些字的找字码成为一位码,重码字不超过10个,
(d)各类中取过找字码后剩下的字,按全码的第一二两位的数字代码分类,
(e)分类后的各类分别按汉字的使用频率从高频到低频排序,使各类中排在最前面的都是该类中使用频率最高的字,
(f)取各类全码第一二两位的数字代码即分类根据,作为各类中排在最前面的,10位以内(含10位)的字的实际使用的找字码,使这些字的找字码成为二位码,重码字不超过10个,
(g)各类中取过找字码后剩下的字,按(a)-(f)的方法和步骤,继续分类、排序和取找字码,直到所有全码都有了找字码为止,其中,每次分类的分类根据,都比前一次分类的分类根据增加一个全码中的下一位数字代码,所取的找字码也相应地比前一次取的加长一位,
(h)在(a)-(g)的过程中,难于取短于全码的找字码的全码,就取全码作为找字码,在轮到这些全码取找字码时,给这些全码排序优先权,使它们排在序列的最前面,成为重码数10以内(含10)的字;
(4)制定上述数字代码与键盘上按键的映射系统,把上述找字码输入电脑或手机,并设置送字标识,按照屏幕显示引导,把选定的字送到显示屏上光标所在位置。
2.根据权利要求1所述输入系统,其特征在于:
上述汉字笔顺数字码的上述找字码可以单独跟上述数字代码与键盘上按键的映射系统,以及屏幕显示引导系统相结合,构成汉字笔顺输入系统,也可以与上述部首数字码的上述找字码一起,跟上述数字代码与键盘上按键的映射系统,以及屏幕显示引导系统相结合,构成汉字笔顺部首双重输入系统。
3.根据权利要求1和2所述输入系统,其特征在于:
一二级汉字笔顺输入系统中的字均码长已从10.67位缩短为4.83位,最长码长已从26位缩短为9位;
大字符集汉字笔顺输入系统中的字均码长已从12.88位缩短为6.27位,最长码长已从48位缩短为14位;
一二级汉字笔顺部首双重输入系统中,一二级汉字的字均码长已从10.20位缩短为4.39位,最长码长已从26位缩短为7位;
大字符集汉字笔顺部首双重输入系统中,大字符集汉字的字均码长已从12.06位缩短为6.10位,最长码长已从48位缩短为9位。
4.根据权利要求1所述输入系统,其特征在于:
上述找字码都是以字频为序的有重码编码,单字找字码的码长是由单字的频序和输入系统的重码数决定的,需要时可以调整,即通过人为地改变单字的频序来缩短或加长单字找字码的码长。
5.根据权利要求1和4所述输入系统,其特征在于:
单字找字码码长可调,使输入系统的重码数可以改变,需要时可以指定不同的重码数来满足不同产品的不同的需求。
6.根据权利要求1所述输入系统,其特征在于:
设置不同的送字标识,可以使用简体汉字的输入码输入相应的繁体汉字,也可以使用繁体汉字的输入码输入相应的简体汉字,还可以跟踪检索资料库。
7.根据权利要求1所述输入系统,其特征在于:
词组不编码,可以采用首字跟踪、末字跟踪和指定字跟踪等技术输入,还可以定义和输入由中西文字、数字和符号混合组成的词组和字符串。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CNB991230949A CN1178121C (zh) | 1999-12-08 | 1999-12-08 | 汉字笔顺部首双重输入方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CNB991230949A CN1178121C (zh) | 1999-12-08 | 1999-12-08 | 汉字笔顺部首双重输入方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN1307269A true CN1307269A (zh) | 2001-08-08 |
CN1178121C CN1178121C (zh) | 2004-12-01 |
Family
ID=5282796
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNB991230949A Expired - Fee Related CN1178121C (zh) | 1999-12-08 | 1999-12-08 | 汉字笔顺部首双重输入方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN1178121C (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101807119A (zh) * | 2010-03-30 | 2010-08-18 | 中南民族大学 | 计算机女书字部首输入法 |
-
1999
- 1999-12-08 CN CNB991230949A patent/CN1178121C/zh not_active Expired - Fee Related
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101807119A (zh) * | 2010-03-30 | 2010-08-18 | 中南民族大学 | 计算机女书字部首输入法 |
Also Published As
Publication number | Publication date |
---|---|
CN1178121C (zh) | 2004-12-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN1307269A (zh) | 汉字笔顺部首双重输入系统 | |
CN101359259A (zh) | 数码声韵双拼输入法 | |
CN1274883A (zh) | 简化拼音-触摸屏鼠标式汉字输入方法 | |
CN1243277A (zh) | 一种可用数字键盘输入的汉字输入方法及键盘 | |
CN1177271C (zh) | 四笔号码字词不重输入法及其键盘 | |
CN1293448C (zh) | 十笔数码输入法 | |
CN1118085A (zh) | 可用数字键盘输入的汉字输入系统及其键盘 | |
CN1034245C (zh) | 缅文字型智能四码输入系统 | |
CN1439954A (zh) | 双拼双形序码数字键汉字输入法 | |
CN1818836A (zh) | 快易码数码象形输入法 | |
CN1017662B (zh) | 无理序号数字编码法及其键盘 | |
CN1043381C (zh) | 汉字四笔画数码输入法 | |
CN1873589A (zh) | 基于音码的汉字输入方法 | |
CN1419179A (zh) | 按笔顺输入的汉字输入法及其键盘 | |
CN86103506A (zh) | “一键双值”键盘及中外文字高速输入方法 | |
CN1141634C (zh) | 单笔画编码汉字输入法 | |
CN1068444C (zh) | 一种汉字编码输入方法 | |
CN1046402A (zh) | 形音符汉字、符号编码法及其键盘 | |
CN1374581A (zh) | 三笔数码汉字输入方法及键盘 | |
CN101021843A (zh) | 笔画笔顺数码汉字检索、输入法 | |
CN1425975A (zh) | 笔形数码汉字输入法 | |
CN1365040A (zh) | 数字键盘拼音加笔顺汉字输入法 | |
CN1100288C (zh) | 四笔序音计算机汉字键盘输入方法 | |
CN102049925A (zh) | 在印刷类辞书上快速检索汉字的方法 | |
CN1268690A (zh) | 字典码汉字输入法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
C19 | Lapse of patent right due to non-payment of the annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |