CN101157312A - 汉字笔顺数码检字法 - Google Patents
汉字笔顺数码检字法 Download PDFInfo
- Publication number
- CN101157312A CN101157312A CNA2007101864627A CN200710186462A CN101157312A CN 101157312 A CN101157312 A CN 101157312A CN A2007101864627 A CNA2007101864627 A CN A2007101864627A CN 200710186462 A CN200710186462 A CN 200710186462A CN 101157312 A CN101157312 A CN 101157312A
- Authority
- CN
- China
- Prior art keywords
- order
- stroke
- strokes
- chinese
- chinese character
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 24
- 235000009827 Prunus armeniaca Nutrition 0.000 claims description 6
- 244000018633 Prunus armeniaca Species 0.000 claims description 6
- 238000010606 normalization Methods 0.000 claims description 3
- 230000008901 benefit Effects 0.000 abstract description 4
- 230000001174 ascending effect Effects 0.000 abstract description 2
- 230000007547 defect Effects 0.000 abstract 1
- 230000000630 rising effect Effects 0.000 description 4
- 230000001737 promoting effect Effects 0.000 description 2
- 241000282341 Mustela putorius furo Species 0.000 description 1
- 230000002950 deficient Effects 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
Landscapes
- Document Processing Apparatus (AREA)
- Character Discrimination (AREA)
Abstract
本发明是针对现行“汉字笔画检字法”以汉字的笔画数为主、辅以起写笔画进行排序的缺陷,将上述反映汉字特征的两个元素“笔画数”与“起写笔画”主辅易位,改为以汉字起写笔画(前三笔)为主,统领笔画数,并用“首3画笔顺码-笔画数”的数码表示方式,生成一系列按递增顺序格式排列的“笔顺数码”检索节。在检索节下,汉字亦按规范笔顺依次排列,形成一个新的汉字排列方案——汉字笔顺数码检字法。用该方法排序的检字表,直观醒目、易于识别。实现了直接在数码检索节下搜寻汉字,一步到位,对号入座。减少了汉字在检字表中的搜索篇幅,省时省力,达到快速高效查找汉字的目的。主要用作汉语字典正文的汉字索引。
Description
技术领域
本发明属于汉字检索方法方面的一种技术。
背景技术
目前,国内出版的汉语字(词)典的正文以拼音序排列者居多。而正文的汉字检索一般用“部首检字表”或“笔画检字表”进行索引。其中“笔画检字表”是以汉字的笔画数为主进行排列,笔画数由一画起依次递增排列。而在同一笔画数下,再按汉字的起写笔画(起写第一笔、前两笔或前3笔)进行排列。由于同样笔画数下的汉字较多,尤其是汉字比较集中的8至17画部分,找一个字需要在检字表中搜索较大的篇幅。查找汉字时,必须先找到对应笔画数的起始点,然后再在其下面找到对应的起写笔画的位置,最后才能在该位置下检索目标汉字。此检字法要花较多的时间去查找汉字在检字表中对应的两个“节点”位置,搜索篇幅大,查找时间长,检索效率低。
发明内容
本发明的目的是要提供一种清晰直观、方便快捷、效率更高的汉字检索方法。它是针对上述“汉字笔画检字法”检索汉字所存在的缺陷或弊端,仍然利用反映汉字基本特征的两个元素“笔画数”与“起写笔画”,改以汉字起写前三笔画为主,按照国家语言文字规范对汉字笔画数与书写笔顺的规定,采用完全的数码表示方法,将汉字起写前3画的笔顺码与笔画数融合为一体,生成一系列按递增顺序格式排列的“笔顺数码”检索节,且在检索节下按照汉字的规范笔顺依次排列,形成一个新的汉字排列方案——汉字笔顺数码检字法。用该方法排序的检字表“汉字笔顺数码检字表”,实现了直接在“数码检索节”下查找汉字,一步到位,对号入座。可有效地减少汉字在检字表中的搜索篇幅,缩短检索时间,大大地提高人们查阅汉语字典的效率。
具体实施方式
本发明的目标是通过以下的技术方案得以实现的:一种新的汉字检索方法——汉字笔顺数码检字法。其特点是:依据汉字的规范笔顺,首先按汉字书写的起笔前3画归类,然后再在同类项下,按照汉字笔画数的多少进行排列。笔画数相同的,再按剩余笔画的笔顺依次排序。在按汉字书写首3画归类时,笔画名称代码按国家语言文字规范《GB13000.1字符集汉字笔顺规范(GF3003-1999)》的规定:横、竖、撇、点、折分别用阿拉伯数字1、2、3、4、5表示。如“李”字的首3画是横、竖、撇,“笔顺码”为“123”,“钱”字的“首3画是撇、横、横,“笔顺码”为“311”。
每个字的“首3画笔顺码”构成了整个汉字检索的“纲”,这相当于一本书的各分“章”。本检字法根据汉字结构的笔画组合形式,将“首3画笔顺码”归纳为155组,或称作155“章”。然后再在每“章”下面按照汉字的总笔画数分“节”。笔画数从3画起依次升序排列(1至2画汉字的排列方法另见下节)。笔画数亦用阿拉伯数字表示。将“首3画笔顺码”与“笔画数”之间用一短杠(连字符)连接起来,构成一个个数码“检索节”,统称为汉字的“笔顺数码”。查找汉字时可直接在相应的“笔顺数码”检索节下搜索。如“王”字的笔顺数码为112-4;“活”字的笔顺数码为“441-9”;“国”、“固(繁体国)”、“赵”、“趙(繁体赵)”四字的笔顺数码分别为“251-8”、“251-11”、“121-9”、“121-14”。“李”、“杏”、“材”三字虽都排在“123-7”节下,但“材”字将排在“杏”字前面,“李”字要排在“杏”字之后。因该检索方法始终以汉字的书写笔顺为主,统领汉字的笔画数,所有章、节均以数码形式表示,故此检索方法被定名为“汉字笔顺数码检字法”。
上面所说的“首3画笔顺码”155组中,其中有125组用作3画及3画以上的汉字检索。另有30组专用作1至2画的汉字检索。因1至2画的汉字数量不多,且自身代码已经包含了笔画数信息,无需再分节,其“笔顺数码”简化为3位,缺画的第二、第三位上的笔画码以“0”填充。如“一”、“乙”两字的笔顺数码分别为“100”与“500”;“十”、“丁”两字的笔顺数码为“120”;“力、乃”两字的笔顺数码为“530”等。这30组笔顺数码将排列在用于3画以上汉字排序的125组笔顺数码之前。
正因为“汉字笔顺数码检字法”的检字表对汉字设章分节更细一些(有近2000个数码检索节),使得每一小节下面的汉字数量相应减少,加上数码小节标志明显,因此查找起来更加直观、方便、快捷。为便于检索,检字表的每页页眉上可以标明本页的起止“笔顺数码”,实现汉字检索的“一步到位,对号入座”。此检索方法不仅可作为按音序或部首编排正文的字典的查字索引,甚至字典的正文都可以按此数码方式编排。
本发明的优势与实用性
本发明所实施的技术方案“笔顺数码检字法”与原有的旧方案“笔画检字法”相比,具有以下几点明显优势:
1. 数码优势:检字表的大纲“章”、细目“节”均用数码表示,直观醒目,易于查找。因为一般人对数字都比较敏感,可直接到检字表中对应的“笔顺数码”下面去查找汉字。而现行的“笔画检字表”是要先找到笔画数的起始点,然后在其下面查找所属“起写笔画”的位置,最后再在相应位置下搜索、过滤所要查找的汉字。不如数码表示方式直观醒目、易于识别。
2. 检索篇幅小、速度快:“笔顺数码检字表”的“笔顺数码”是“章”与“节”的统一。查找汉字时不必先找到“章”,再在“章”下去搜索“节”,而是一步到位,直接在数码节下搜寻目标汉字。而现行“笔画检字表”是以“笔画数”为主对汉字进行排序,首先将汉字按“笔画数”分割为约26个大块(相当于章),显然每块下的汉字数就比较多,尤其是汉字比较集中的8至17画部分。查找汉字时得先找到相应笔画数的起始点,然后再在其下的众多小块中查找相应的“节”即汉字“起写笔画”的位置。最后再在“起写笔画”下搜索目标汉字。例如:要查找“巢”字,首3画为折、折、折,11画,“笔顺数码法”可直接从检字表的页眉上查找或判断出“检索节”555-11的位置所在,然后便可在该节下很容易地找到“巢”字。而“笔画检字法”则必须先在检字表中找到11画的起点,然后再在儿画的末尾找到起笔为“乛乛”的位置,再在其下面搜到“巢”字。此法在对应笔画数下需要搜索的篇幅较大,往往为寻找“章”与“节”这两个起始节点就要花费不少时间。
3. 笔画数算错时不用全面返工:用“笔顺数码法”检字,当笔画数多算或少算一、两画时只需在当前“笔顺数码”下向后或向前延伸一、两个检索节即可搜到,不必改换它“章”重新检索。而“笔画检字法”则必须返工重来。需要到另一大块(章)下重新开头查找。由于新旧字形的笔画数有所不同,人们对笔画数的识别往往会出现误差误算,甚至一些字典由于新旧字形的原因对笔画数的取定也有差误。“笔画检字法”的这个弊端是影响汉字检索速度的重要因素。
4. 汉字在相应的“笔顺数码”下排列严谨,准确、规范:“笔顺数码法”的检字表,汉字在各“检索节”下是严格按照汉字书写的规范笔顺逐笔逐画依次排列的,其位置先、后是确定的,基本上可以做到“对号入座”。因为,对于多笔画的汉字,笔画数、笔画组成与笔顺完全一样的情况虽有但并不多见。而“笔画检字表”除了按汉字的“起写笔画”编排“检索节”外,并不完全按照汉字的书写笔顺排列(在笔画检字法产生的当时有关方面还没有相应的汉字笔顺规范发布,汉字在“检索节”下多应用过去约定俗成的顺序排列,往往是把起写偏旁相同的汉字排在一起),汉字排列纷乱,位置不确定,容易发生“漏检”,给汉字检索增添了难度。
5.用“笔顺数码法”检索汉字,有利于推广“国家语委”发布的《汉字笔顺规范》,帮助人们掌握汉字书写的正确笔顺,纠正一些人日常写字“倒笔画”的不良习惯,引导人们规范应用汉字。
6.提供字(词)典编纂者用于编排字典正文,作为直查字典:“笔顺数码检字法”亦可用于“汉语”或“汉外”字(词)典的正文编排,并可在字典每页的页眉上标注起始至终末的“笔顺数码”,成为不用检字表“索引”的直查字典。而“笔画检字法”则无法实现此功能。
7.此方法如能得以推广,即以“笔顺数码检字表”取代现行“笔画检字表”用作字典的汉字索引,不仅能减少人们查阅汉语字典的难度,有效地缩短汉字的检索时间,同时将可能产生较好的社会效益。
Claims (1)
1.一种汉字检索方法——汉字笔顺数码检字法,其特征在于:汉字在检字表中的排列方式,不是像“笔画检字表”以汉字的笔画数为主辅以起写笔画,而是以汉字起写笔画(前三笔)为主,统领笔画数,并用“首3画笔顺码-笔画数”的数码表示方式,生成一系列按递增顺序格式排列的“笔顺数码”检索节,且在检索节下按照汉字的规范笔顺依次排列。汉字的笔画名称代码及笔画数均遵循国家语言文字规范《GB13000.1字符集汉字笔顺规范(GF3003-1999)》的规定:横、竖、撇、点、折五种笔画分别用阿拉伯数字1、2、3、4、5表示。笔画数用数字0~9表示。查找汉字时,可直接在对应的“笔顺数码”检索节下按照首3画以后的笔画顺序定位搜索。如“王”字排在112-4节下;“活”字排在“441-9”节下;“国”、“趙(繁体赵)”二字分别排在“251-8”、“121-14”节下等。“李”、“杏”、“材”三字虽都排在“123-7”节下,但“材”字排在“杏”字前面,“李”字要排在“杏”字之后。
对于1至2画的汉字,“笔顺数码”检索节简化为3位数码,缺少笔画的第二、第三数码位上以“零”填充。如“一”、“乙”两字的笔顺数码分别为“100”与“500”;“十、丁”两字的笔顺数码为“120”;“力、乃”两字的笔顺数码为“530”等。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CNA2007101864627A CN101157312A (zh) | 2007-11-19 | 2007-11-19 | 汉字笔顺数码检字法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CNA2007101864627A CN101157312A (zh) | 2007-11-19 | 2007-11-19 | 汉字笔顺数码检字法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN101157312A true CN101157312A (zh) | 2008-04-09 |
Family
ID=39305586
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNA2007101864627A Pending CN101157312A (zh) | 2007-11-19 | 2007-11-19 | 汉字笔顺数码检字法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN101157312A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106991184A (zh) * | 2017-03-29 | 2017-07-28 | 赵现隆 | 基于字型及笔划的汉字检索方法 |
US10289664B2 (en) * | 2015-11-12 | 2019-05-14 | Lenovo (Singapore) Pte. Ltd. | Text input method for completing a phrase by inputting a first stroke of each logogram in a plurality of logograms |
-
2007
- 2007-11-19 CN CNA2007101864627A patent/CN101157312A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10289664B2 (en) * | 2015-11-12 | 2019-05-14 | Lenovo (Singapore) Pte. Ltd. | Text input method for completing a phrase by inputting a first stroke of each logogram in a plurality of logograms |
CN106991184A (zh) * | 2017-03-29 | 2017-07-28 | 赵现隆 | 基于字型及笔划的汉字检索方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102750351A (zh) | 基于规则的地址信息匹配方法 | |
CN106326303A (zh) | 一种口语语义解析系统及方法 | |
CN101751430A (zh) | 电子词典模糊检索方法 | |
CN102929852A (zh) | 一种在富文本编辑器内实现简繁体字互转的方法及系统 | |
CN104268176B (zh) | 一种基于搜索关键词的推荐方法 | |
CN101157312A (zh) | 汉字笔顺数码检字法 | |
CN102385597A (zh) | 一种poi的容错搜索方法 | |
CN100476826C (zh) | 中文字型排序检索方法和装置以及一种信息系统 | |
CN101739142A (zh) | 五笔输入系统及方法 | |
CN103207682A (zh) | 基于音节切分的维哈柯文智能输入法 | |
CN101604210B (zh) | 一种规范音形汉字输入法 | |
CN100458668C (zh) | 首音汉字输入法 | |
CN103049096A (zh) | 移置三类汉字信息字码表实现字词句的随机编码方法 | |
Kollmar-Paulenz | A Mongolian Zungdui Volume from the Ernst Collection (Switzerland) | |
CN102591850A (zh) | 一种基于条件语句的错误文本语句纠正方法及系统 | |
CN1472626A (zh) | 嵌入式智能文字输入解决方法和装置 | |
CN1248024A (zh) | 采用译码的汉字检索方法 | |
CN101034403A (zh) | 一种小键盘电子字典的智能检索方法 | |
Ford et al. | George Buchanan: Poet and Dramatist | |
CN104699264A (zh) | 纯笔画v码输入法 | |
CN101894101A (zh) | 拼音标注方法及其系统 | |
CN101587382A (zh) | 适用于维哈柯文的文字输入方法 | |
CN1786954B (zh) | 多语多本综合查询方法及其系统 | |
CN108334502A (zh) | 一种传统蒙古文与西里尔蒙古文的相互转换方法 | |
CN106959764A (zh) | 一种有助于正确书写汉字的形码输入法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C12 | Rejection of a patent application after its publication | ||
RJ01 | Rejection of invention patent application after publication |
Open date: 20080409 |