CN1749026A - 数码字典查字方法 - Google Patents
数码字典查字方法 Download PDFInfo
- Publication number
- CN1749026A CN1749026A CN 200510032928 CN200510032928A CN1749026A CN 1749026 A CN1749026 A CN 1749026A CN 200510032928 CN200510032928 CN 200510032928 CN 200510032928 A CN200510032928 A CN 200510032928A CN 1749026 A CN1749026 A CN 1749026A
- Authority
- CN
- China
- Prior art keywords
- radicals
- characters
- traditional chinese
- chinese dictionaries
- code
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Document Processing Apparatus (AREA)
Abstract
本发明公开了一种数码字典查字方法,依据国家颁布的《汉字统一部首表(草案)》和《信息处理用GB13000.1字符集汉字部件规范》中的基础及合成部件做为汉字部首信息,选择时参考了《新华字典》不同版本,将汉字拆为主、辅部首,按一定对应规则将它们转化为数字编码即部首字典码。将汉字按部首字典码的顺序排列在检字表中,部首字典码旁列有该字在字典中的页数,按照该页数即可查到该字;部首字典码最多有三码,是依据所代表部首笔画数和其起笔画进行编码的。本发明易学易记,查找速度快;和以往查字方法衔接时有很好的承接性;将简体、异形体和繁体字混排,满足一般汉字查字的需要;便于汉字大规模应用于计算机和信息通讯。
Description
技术领域
本发明涉及一种汉字查字方法,尤其是涉及一种数码字典查字方法。
背景技术
传统的查字方法首先是查找所查字的偏旁部首,然后在检字表中找到该部首,再依据余部的笔画查找该字及页码。这种查字方法,由于没有引入数码概念,在查字时需一笔一笔地数笔画,故查找速度慢,且不能很好地适应现时代计算机和信息通讯的需要。如申请号为02128784,申请日为2002年8月17日,发明名称为汉字首部件检字法的专利申请,它是将汉字拆分为首部件及余部,首部件是指按照规范的汉字书写笔顺,首先书写的那个汉字字头或偏旁,它可以是一个多笔画的汉字结构件,也可以是一个单笔画;首部件目录将首部件按笔画数多少的顺序进行排列,并在每个首部件旁列有该首部件在首部件检字表中的页码;余部是指将汉字首部件拆除后的剩余笔画部分;在首部件检字表中在每个首部件下按拆除汉字首部件后的余部笔画特征的数字编码顺序排列汉字,在每个汉字旁列有该汉字余部笔画特征的数字编码及该汉字在字典正文上的页码。检字时将要检索的字依据部件拆分规则,首先确定该汉字的首部件,并在首部件目录中查得该首部件在首部件检字表中的页码,再在首部件检字表中相应页码处的首部件下按该汉字余部笔画特征的数字编码的大小依序查得该汉字及其在字典正文上的页码,按这个页码就可在字典正文对应页上查到所需的汉字。该查字法查找的速度较慢,而且不能和计算机输入法很好的相适应,不能满足现时代计算机和数字化通讯发展的需要。
发明内容
本发明的目的是提供一种比传统查字方法速度快,易学易记,且适应现时代计算机和数字化通讯发展的需要,可以进一步生成输入法的利用数码进行查字的数码字典查字方法。
本发明是通过下述技术方案来实现上述目的的:
本发明依据国家颁布的《汉字统一部首表(草案)》和《信息处理用GB13000.1字符集汉字部件规范》所规定的基础部件及合成部件做为汉字部首信息,在选择时主要参考了《新华字典》不同版本的部首选择内容,将汉字拆分为主部首和辅部首,主部首的确定基本按照《新华字典》的拆分方法。再通过一定的对应规则将这些部首转化为数字编码,即部首字典码。这些数字代码主要是依据所代表的部首的笔画数,以及该部首的起笔笔画规律进行编码的。
所述汉字部首在拆分时,依据相离、相接可拆;交重不拆的原则,同时又参考了《新华字典》的检字方法,对汉字部首的拆分做进一步说明:(1)部首若是相离形的,按照字体自然形状进行拆分即可;(2)部首如果是相接形的,按如下规则拆分:a、取大不取小,即当取一个相接形的汉字部首时,如有多个部首组合形式可拆分,则优先取笔画数多的部首组合形式,即所谓信息最大化原则;b、取过的笔画不再重复提取,即所谓信息唯一性原则。
部首字典码的编码规则为:对于单部首字,部首字典码由一个数字代码组成;对于二部首汉字,部首字典码由二个数字代码组成,第一数字代码所代表的部首取自汉字的主部首,第二数字代码所代表的部首是汉字的辅部首;对于三部首或三部首以上汉字,部首字典码由三个数字代码组成,第一数字代码所代表的部首取自汉字的主部首,第二、三数字代码所代表的部首分别是汉字的第一、二辅部首。辅部首码的取码原则仍遵循信息最大化原则,即2笔画和2笔画以上的部首先取,然后是单笔画部首;在笔画数相同的情况下,则遵循信息快捷优先原则,按书写顺序,先出现的部首优先选取。
部首字典码中的数字代码与所代表的部首之间的对应规则为:
a、二笔画部首的数字代码用二个数字表示,分别为数字“0”和数字“2”,其中以横笔、点笔、折笔起头的部首数字代码为数字“0”,以竖笔、撇笔起头的部首数字代码为数字“2”;
b、三笔画部首的数字代码用四个数字表示,分别为数字“1”、数字“3”、数字“7”和数字“9”,其中以横笔起头的部首数字代码为数字“1”,以竖笔起头的部首数字代码为数字“3”,以点笔起头的部首数字代码为数字“7”以撇笔和折笔起头的部首数字代码为数字“9”;
c、四笔画部首的数字代码用二个数字表示,分别为数字“4”、数字“8”,其中以横笔、点笔和折笔起头的部首数字代码为数字“4”,以竖笔和撇笔起头的部首数字代码为数字“8”;
d、五笔画的部首数字代码为数字“5”;
e、六笔画和六笔画以上的部首数字代码为数字“6”;
f、单笔画部首,如横、竖、撇、点、折的数字代码分别用数字“1”、“2”、“3”、“4”、“5”表示。
本发明优点在于:数码字典查字法是为适应现代科学发展的需要而设计的,它首先实现了汉字查字方法的数字化,在进一步生产输入法后,便于汉字大规模地应用于计算机和信息通讯;由于它选取的汉字部首是依据国家颁布的《汉字统一部首表(草案)》和《信息处理用GB13000.1字符集汉字部件规范》所规定的汉字部首及拆分规则,因此具有较好的规范性;又由于它是参照《新华字典》进行编码,在选择部首和检字时基本遵照《新华字典》的内容和方法,所以在内容和查字方法上和《新华字典》具有很好的衔接性。中、小学生使用这种汉字查字方法,在学习查字的同时也学习了输入法,省去了以后再学习的过程。数码字典在收录汉字时,以《新华字典》为准,将简体字、异形体字和繁体字混排,满足一般汉字查字的需要,且数码字典的查字速度更换。
具体实施例
本发明通过一定的拆分和取码规则选取汉字的部首信息,再通过一定的对应规则将这些部首转化为数字编码,即部首字典码;再将汉字依照部首字典码进行编码,然后按顺序排列在检字表中。检字表中列出该字在字典中的页数,按照页数即可查到该字。部首字典码最多由三个数字代码组成,这些数字代码主要是依据所代表的部首的笔画数和该部首的起笔笔画规律进行编码的。
汉字部首的选取依据国家颁布的《汉字统一部首表(草案)》和《信息处理用GB13000.1字符集汉字部件规范》所规定的基础部件及合成部件做为汉字部首信息,在选择时主要参考了《新华字典》不同版本的部首选择内容,将汉字拆分为主部首和辅部首,主部首的确定基本按照《新华字典》的拆分方法。
汉字部首的拆分依据相离、相接可拆;交重不拆的原则,同时参考了《新华字典》的检字方法,规定为:
如果部首是相接形的,则按照取大不取小,取先不取后,取过的笔画不重复提取三原则进行拆分,如“产、成、养”:
“产”拆分为“立、丿”;“成”拆分成“戈、丿、”;“养”拆分成“、丶、丿、丨”。
部首字典码中的数字代码与所代表的部首之间的对应规则为:
a、二笔画部首的数字代码用二个数字表示,分别为数字“0”和数字“2”,其中以横笔、点笔、折笔起头的部首数字代码为数字“0”,以竖笔、撇笔起头的部首数字代码为数字“2”;
b、三笔画部首的数字代码用四个数字表示,分别为数字“1”、数字“3”、数字“7”和数字“9”,其中以横笔起头的部首数字代码为数字“1”,以竖笔起头的部首数字代码为数字“3”,以点笔起头的部首数字代码为数字“7”以撇笔和折笔起头的部首数字代码为数字“9”;
c、四笔画部首的数字代码用二个数字表示,分别为数字“4”、数字“8”,其中以横笔、点笔和折笔起头的部首数字代码为数字“4”,以竖笔和撇笔起头的部首数字代码为数字“8”;
d、五笔画的部首数字代码为数字“5”;
e、六笔画和六笔画以上的部首数字代码为数字“6”;
f、单笔画部首,如横、竖、撇、点、折的数字代码分别用数字“1”、“2”、“3”、“4”、“5”表示。
部首字典码的取码规则为:对于单部首字,部首字典码由一个数字代码组成;对于二部首汉字,部首字典码由二个数字代码组成,第一数字代码所代表的部首取自汉字的主部首,第二数字代码所代表的部首是汉字的辅部首;对于三部首或三部首以上汉字,部首字典码由三个数字代码组成,第一数字代码所代表的部首取自汉字的主部首,第二、三数字代码所代表的部首分别是汉字的第一、二辅部首;辅部首码的取码原则仍遵循信息最大化原则,即2笔画和2笔画以上的部首先取,然后是单笔画部首;在笔画数相同的情况下,则遵循信息快捷优先原则,按书写顺序,先出现的部首优先选取。
举例如下:“木”的代码为“4”;“革”的代码为“6”;“洋”的代码为“76”;“现”的代码为“48”;“学”的代码为“904”,“部”的代码为“053”,“都”的代码为“018”,“缝”的代码为“994”,“蹇”的代码为“752”。
具体应用时,先根据上述规则得到所查字的部首字典码,根据部首字典码可直接在检字表中找到该部首字典码在正文中的页码,翻到该页码即可查到该字。
Claims (3)
1、一种数码字典查字方法,其特征在于:通过一定的拆分和取码规则选取汉字部首信息,将汉字拆分为主部首和辅部首,再通过一定的对应规则将这些部首转化为数字编码即部首字典码;将汉字依照其部首字典码的顺序排列在字典检字表中,部首字典码旁列有该字在字典中的正文页数,按照该页数即可查到该字;
部首字典码最多由三个数字代码组成,这些数字代码主要是依据所代表的部首的笔画数和该部首的起笔笔画进行编码的。
2、根据权利要求1所述的数码字典查字方法,其特征在于:
所述汉字部首在拆分时,依据相离、相接可拆;交重不拆的原则,同时又参考了《新华字典》的检字方法,对汉字部首的拆分做进一步说明:(1)部首若是相离形的,按照字体自然形状进行拆分即可;(2)部首如果是相接形的,按如下规则拆分:a、取大不取小,即当取一个相接形的汉字部首时,如有多个部首组合形式可拆分,则优先取笔画数多的部首组合形式,即所谓信息最大化原则;b、取过的笔画不再重复提取,即所谓信息唯一性原则;
部首字典码的编码规则为:对于单部首字,部首字典码由一个数字代码组成;对于二部首汉字,部首字典码由二个数字代码组成,第一数字代码所代表的部首取自汉字的主部首,第二数字代码所代表的部首是汉字的辅部首;对于三部首或三部首以上汉字,部首字典码由三个数字代码组成,第一数字代码所代表的部首取自汉字的主部首,第二、三数字代码所代表的部首分别是汉字的第一、二辅部首。辅部首码的取码原则仍遵循信息最大化原则,即2笔画和2笔画以上的部首先取,然后是单笔画部首;在笔画数相同的情况下,则遵循信息快捷优先原则,按书写顺序,先出现的优先选取。
3、根据权利要求1所述的数码字典查字方法,其特征在于:
部首字典码中的数字代码与所代表的部首之间的对应规则为:
a、二笔画部首的数字代码用二个数字表示,分别为数字“0”和数字“2”,其中以横笔、点笔、折笔起头的部首数字代码为数字“0”,以竖笔、撇笔起头的部首数字代码为数字“2”;
b、三笔画部首的数字代码用四个数字表示,分别为数字“1”、数字“3”、数字“7”和数字“9”,其中以横笔起头的部首数字代码为数字“1”,以竖笔起头的部首数字代码为数字“3”,以点笔起头的部首数字代码为数字“7”以撇笔和折笔起头的部首数字代码为数字“9”;
c、四笔画部首的数字代码用二个数字表示,分别为数字“4”、数字“8”,其中以横笔、点笔和折笔起头的部首数字代码为数字“4”,以竖笔和撇笔起头的部首数字代码为数字“8”;
d、五笔画的部首数字代码为数字“5”;
e、六笔画和六笔画以上的部首数字代码为数字“6”;
f、单笔画部首,如横、竖、撇、点、折的数字代码分别用数字“1”、“2”、“3”、“4”、“5”表示。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 200510032928 CN1749026A (zh) | 2005-01-28 | 2005-01-28 | 数码字典查字方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 200510032928 CN1749026A (zh) | 2005-01-28 | 2005-01-28 | 数码字典查字方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN1749026A true CN1749026A (zh) | 2006-03-22 |
Family
ID=36604749
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN 200510032928 Pending CN1749026A (zh) | 2005-01-28 | 2005-01-28 | 数码字典查字方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN1749026A (zh) |
-
2005
- 2005-01-28 CN CN 200510032928 patent/CN1749026A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN1023038C (zh) | 汉字音形序码计算机汉字输入方法 | |
CN100476826C (zh) | 中文字型排序检索方法和装置以及一种信息系统 | |
CN1136496C (zh) | 简化拼音-触摸屏鼠标式汉字输入方法 | |
CN1719390A (zh) | 利用汉字全信息通过全文检索获取生僻字的检字录入方法 | |
CN1749026A (zh) | 数码字典查字方法 | |
CN101046707A (zh) | 首音汉字输入法 | |
CN1588353A (zh) | 数码字典查字方法 | |
CN1194285C (zh) | 多输入方式的计算机汉字编码输入技术 | |
CN1142474C (zh) | 字典码汉字输入法 | |
CN1380620A (zh) | 图书索引自动编排方法 | |
CN1673935A (zh) | 甲骨文电脑输入法 | |
CN1196057C (zh) | 一码二形数字编码汉字输入方法 | |
CN1209698C (zh) | 汉模输入法 | |
CN1419179A (zh) | 按笔顺输入的汉字输入法及其键盘 | |
CN1069420C (zh) | 文字式音形汉字输入方法 | |
CN1122913C (zh) | 计算机汉字信息处理的规范编码输入方法 | |
CN2476059Y (zh) | 姜码输入法的键盘 | |
CN1458566A (zh) | 汉字明码输入法 | |
CN1207648C (zh) | 五三码及其键盘 | |
CN1056456C (zh) | 优化合书汉字编码的计算机输入方法 | |
CN1153339A (zh) | 汉字“中华之声”码计算机键盘输入法 | |
CN86103506A (zh) | “一键双值”键盘及中外文字高速输入方法 | |
CN1648833A (zh) | 字典数码输入法 | |
CN1542593A (zh) | 五笔区形中文输入法 | |
CN1285539A (zh) | 一种汉字形符输入系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C02 | Deemed withdrawal of patent application after publication (patent law 2001) | ||
WD01 | Invention patent application deemed withdrawn after publication |