CN110328984A - 一种新型两分笔画码汉语字典或字典页面 - Google Patents

一种新型两分笔画码汉语字典或字典页面 Download PDF

Info

Publication number
CN110328984A
CN110328984A CN201910491932.3A CN201910491932A CN110328984A CN 110328984 A CN110328984 A CN 110328984A CN 201910491932 A CN201910491932 A CN 201910491932A CN 110328984 A CN110328984 A CN 110328984A
Authority
CN
China
Prior art keywords
stroke
chinese character
dictionary
word
present
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910491932.3A
Other languages
English (en)
Inventor
孙宇鸽
孙苏成
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to CN201910491932.3A priority Critical patent/CN110328984A/zh
Publication of CN110328984A publication Critical patent/CN110328984A/zh
Pending legal-status Critical Current

Links

Classifications

    • BPERFORMING OPERATIONS; TRANSPORTING
    • B42BOOKBINDING; ALBUMS; FILES; SPECIAL PRINTED MATTER
    • B42DBOOKS; BOOK COVERS; LOOSE LEAVES; PRINTED MATTER CHARACTERISED BY IDENTIFICATION OR SECURITY FEATURES; PRINTED MATTER OF SPECIAL FORMAT OR STYLE NOT OTHERWISE PROVIDED FOR; DEVICES FOR USE THEREWITH AND NOT OTHERWISE PROVIDED FOR; MOVABLE-STRIP WRITING OR READING APPARATUS
    • B42D1/00Books or other bound products
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B42BOOKBINDING; ALBUMS; FILES; SPECIAL PRINTED MATTER
    • B42FSHEETS TEMPORARILY ATTACHED TOGETHER; FILING APPLIANCES; FILE CARDS; INDEXING
    • B42F21/00Indexing means; Indexing tabs or protectors therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • G06F16/355Class or cluster creation or modification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/374Thesaurus
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/237Lexical tools
    • G06F40/242Dictionaries

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Artificial Intelligence (AREA)
  • Databases & Information Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Business, Economics & Management (AREA)
  • Educational Administration (AREA)
  • Educational Technology (AREA)
  • Document Processing Apparatus (AREA)

Abstract

本发明公开了一种新型两分笔画码汉语字典或字典页面,旨在为汉语字典使用者提供一种新型汉语字典,使该字典的使用者可以在已知待查汉字的字形的外部信息而需要方便快捷地通过检索汉语字典查阅该汉字的字音、字形、字义、字用的信息时,可以根据该汉字的已知外部信息立即读出其在字典中的所在页码,从而经过一步翻查即可直接翻到该页码并查到该目标汉字,本发明允许在这种新型字典的基础上进行扩展改造,使其成为新型两分笔画码汉语词典。

Description

一种新型两分笔画码汉语字典或字典页面
技术领域
本发明涉及一种新型两分笔画码汉语字典,更具体地说涉及一种由若干字典页面按各页页标码的顺序叠摞或装订成册而成的纸质字典,该字典可以供字典使用者通过翻动检索查阅;本字典也可以将字典正文编辑存储为电子文档1件或1件以上作为电子字典数据,并编制相应软、硬件操纵该电子字典数据,使其成为一种电子字典供字典使用者通过操作该特定软、硬件检索查阅。
背景技术
目前,以《新华字典》、《汉语大字典》、《现代汉语词典》、《汉英大词典》、《汉法大词典》、《汉德大词典》、《汉意大词典》等字典词典和各种电子字词典为代表的汉语字词典品种繁多,它们在字典的各正文页面中收录了按不同标准选择的字头汉字,其各个字头汉字在字典正文中的排列顺序多数为两种:一种是按拼音顺序排列;另一种是按部首+笔画数+笔画序的顺序排列。
但相当多数的中文字典使用者使用字典的情形是在阅读过程中发现了不知其读音或字义的陌生汉字,因此需要通过检索字典查找该生字的字音、字义或用法等解释项。当使用者在阅读过程中发现某陌生汉字需要通过查字词典的手段,检索其字音、字义或用法等解释项时,使用现行常见的字词典产品,往往必须经过以下3个步骤:
第1步:分析该陌生汉字的部首并在该字典部首表中检索该部首在部首检字表中的页码;
第2步:翻到经第1步检索所得之部首检字表页码,再根据该字的笔画数(或部余笔画数)和/或该字的笔画顺序信息,在部首检字表中检索该字在字典正文中的页码;
第3步:翻到经第2步检索所得的字典正文页码,在字典正文页面中检索获得该陌生汉字的字音、字义或用法等解释项。
然而,我们知道在英、法、德、意等西方语言词典中查找一个陌生单词时只需根据字母序列直接翻查字典正文即可获得,即只需1步即可以直接在字典正文中检索到所希望查找的目标单词及其解释项。
从这个角度上讲,目前的汉语字词典与西语单词词典在编排技术方面仍明显存在较大程度的落后,远不能适应广大汉语字词典使用者的实际需要。广大字词典使用者迫切需要一部能象西语词典使用者查阅西语词典一样方便,即只需1步翻查即可直接获得目标汉字词及其解释项的新型汉语字词典。
为解决这一问题,本发明设计出一种新型两分笔画码汉语字词典,可以根据待检目标汉字的外部信息如字型、笔画、笔序等,直接获得该目标汉字在字典正文中的页码,然后只需1步翻查即可直接定位到该正文页面,从而检索获得该目标汉字在字典正文中的字音、字义或用法等解释项。
发明内容
本发明的目的即是克服现有汉语字词典在查阅简便性、查阅快捷性等方面的缺点和不足,重新设计一种新型汉语字词典,使这种新型汉语字词典的使用者在使用该字词典检索陌生汉字词时,可以根据该汉字本身提供的外部信息直接获得该汉字在字词典正文中的页码,从而可以1步检索即获得该目标汉字的字音、字义或用法等解释项信息,即设计一种可以实现1步查功能的新型汉语字词典。
为实现以上发明目的,本发明采用以下技术方案:
本发明提出一种新型两分笔画码汉语字典,包括字典正文页面1页或1页以上并以后述的(a)和/或(b)的形式提供给字典使用者查阅使用:(a)按各页页标码的顺序叠摞或装订成1册或1册以上作为纸质字典,供字典使用者通过翻页检索查阅;(b)将字典正文编辑存储为电子文档1件或1件以上作为电子字典数据表,供字典使用者通过操作特定软、硬件检索该数据表将目标内容显示于屏幕之上或打印出来用于阅看;所述的“字典正文页面”,是指印有页标码1个或1个以上、字头汉字1个或1个以上及用于解释该字头汉字的汉字解释内容1条或1条以上的纸质字典页面,或显示于屏幕之上的含有页标码1个或1个以上、字头汉字1个或1个以上及用于解释该字头汉字的汉字解释内容1条或1条以上的电子字典页面;所述的“页标码”是指印刷于各字典正文页面之上或显示于电子字典页面之上,用以表达该字典的该页面与该字典的其他页面的先后顺序及位置关系的字符串,该字符串是包括但不限于由阿拉伯字母和/或英文字母构成的字符串;所述的“汉字解释内容”是指该汉字的字音信息和/或字形信息和/或字义信息和/或文字用法信息和/或检索该字之音形义用信息的路径指引信息的汉字信息;所述的“字头汉字”是指由字典编纂者收录于纸面字典和/或电子字典之中,以供该字典使用者检索查阅该字的汉字解释内容的目标汉字;
以上为现有各种汉语字典的共性特征,而本发明之新型两分笔画码汉语字典除具备上述共性特征之外,还具备下述新创的个性特征;本发明的新创个性特征在于:
本发明对汉字字型按其结构类型分类,引入“交叉型”字型的概念,并将全部汉字分为左右型、上下型、包围型、交叉型和独体型的5种类型;本发明引入“空构件”和“空笔画”这两个概念,并将这两个概念用于对字头汉字进行分拆汉字构件和提取笔画的操作;本发明引入汉字“字首构件”和“字余构件”这两个概念,并对左右型、上下型、包围型、交叉型和独体型的5种字型类别的汉字分别规定了分拆认定其字首构件和字余构件的方法;本发明引入“两分笔画码字符串”的概念,并为左右型、上下型、包围型、交叉型和独体型的5种类别字型的汉字分别规定了逐步取码操作和组成各字“两分笔画码字符串”的方法;
本发明以各汉字的两分笔画码字符串为依据对入编本发明字典的全部字头汉字进行排序,并进一步编定本发明字典各个页面的页标码;本发明字典的各页面所使用的页标码,是一种两分笔画码字符串或以两分笔画码字符串为其子字符串的联合字符串;本发明字典对所收列的各字头汉字均按照各字的两分笔画码字符串的顺序或按照以两分笔画码字符串为其子字符串的联合字符串的顺序,进行排序;本发明所述的“两分笔画码字符串”,是指对各字头汉字按下列(1)、(2)、(3)、(4)、(5)、(6)的步骤进行分类别的逐步取码操作,并将取码操作所得之结果按步骤(7)所述的组合方式进行组合,经组合之后所得到的字符串;所述的(1)、(2)、(3)、(4)、(5)、(6)、(7)的操作方法与步骤是指:
(1)本发明取各字头汉字的字型码并用特定字符表示,并称该特定的字型码字符为“型码符”;本发明将各汉字按该字各组成构件的拼装方式分为左右型、上下型、包围型、交叉型和独体型的5种汉字字型类型;本发明将左右型、左中右型和各种复合左右型通视为“左右型”;本发明将上下型、上中下型和各种复合上下型通视为“上下型”;本发明将全包围型、半包围型和各种复合包围型通视为“包围型”;本发明将各汉字构件之间构成穿插或半穿插型的串式交叉关系或复合交叉关系的汉字字型通视为“交叉型”;本发明将由于汉字构件过于单一或各汉字构件之间完全浑然一体而难以按左右型、上下型、包围型和交叉型的汉字构件分拆方法将其分拆为两个或两个以上汉字构件的,通视为“独体型”;本发明对汉字字型的分类方法、对部分汉字的字型认定和汉字构件的拆分方法,系根据本发明字典的编篡者在字典编篡工作中的实际需要和本发明字典的使用者在检索过程中的实际需要而创设的概念和方法,可以不同于其他体系的汉字字型分类方法、汉字字型认定方法及汉字构件拆分方法;本发明允许字典编篡者将少量汉字分别归类为前述2种或2种以上的字型类型,以兼顾部分字典使用者对该部分少量汉字在字型认定问题上的非主流观点;
(2)本发明按构成汉字的笔画形状将全部汉字笔画划分为6类并分别命名为“横”、“竖”、“撇”、“捺”、“折”和“空”笔画;本发明所述的“横”包括各种常规的笔画“横”,也包括笔画“提”和“短横”;本发明所述的“竖”包括各种常规的笔画“竖”,也包括笔画“短竖”,但不包括笔画“竖勾”;本发明所述的“撇”包括各种常规的笔画“撇”,也包括笔画“平撇”和“短撇”;本发明所述的“捺”包括各种常规的笔画“捺”,也包括笔画“平捺”和“点”;本发明所述的“折”包括笔画“折”、“拐”、“弯”、“勾”,其中“勾”包括笔画“横勾”、“竖勾”、“弯勾”、“斜勾”及“折弯勾”;本发明所述的“空”笔画是本发明引入的创新概念,用于表示编码操作中需要使用但在现实中却并不存在的笔画;
(3)本发明引入M和N作为自然数代表符,用于描述对各汉字提取特定字符和编制其两分笔画码字符串的过程;其中M为大于等于2而小于等于10的自然数,N为大于等于1而小于等于10的自然数,且M加N所得之和大于等于4而小于等于20;本发明允许字典编篡者在编篡具体字典时根据该具体字典收录字头汉字数目多寡的需要和该字典页面可纳容字头汉字数量的需要,在本发明的规定范围内设定M和N的确切数值;
(4)本发明针对不同的汉字字型分别规定了将该字型的汉字分拆为字首构件和字余构件的方法;对左右型汉字,取位置在左的汉字构件为字首构件,取剩余的部分为字余构件;对上下型汉字,取位置在上的汉字构件为字首构件,取剩余的部分为字余构件;对包围型汉字,首先将该字分拆为包围者和被包围者等两个汉字构件,然后按书写笔画顺序在包围者与被包围者之间取先写到的那一个汉字构件为字首构件,取剩余的部分为字余构件;对交叉型汉字,首先将该字分拆为构成相互交叉关系的两个汉字构件,然后在两者之间按笔画顺序取先写到的汉字构件为字首构件,取剩余的部分为字余构件;对独体型汉字,本发明规定该独体型汉字本身即为该字的字首构件,设定全部笔画为空且笔画数为N的空构件为该字的字余构件;本发明允许字典编篡者将少量的汉字按2种或2种以上的构件分拆方法认定其字首构件和字余构件,以兼顾部分字典使用者对该部分少量汉字在构件分拆问题上的非主流观点;
(5)本发明按先取字首构件笔画、后取字余构件笔画的两分笔画法的顺序,分别依各构件的书写笔画顺序取得该字字首构件的M个笔画和字余构件的N个笔画,再分别组成其M笔串和N笔串;第一步取字首构件笔画,按书写笔画顺序取M个笔画,并称由该M个笔画码组成的字符串为该汉字的“字首M笔画串”,简称“M笔串”;对于笔画数小于M的字首构件,本发明在该字首构件的全部笔画之后追加“空”笔画1个或1个以上,以便在形式上凑足M个笔画;对于笔画数等于M的字首构件,本发明按书写笔画顺序取该构件的全部M个笔画;对于笔画数大于M的字首构件,本发明允许按以下(c)和(d)两种方法任择其一的方法提取其M个笔画:(c)直接按书写笔画顺序取该字首构件的前M个笔画;(d)首先按书写笔画顺序取该字首构件的前M-1个笔画,再按书写笔画顺序取该字首构件的最后一个笔画为第M个笔画;第二步取字余构件笔画,按书写笔画顺序取N个笔画,并称由该N个笔画码组成的字符串为该汉字的“字余N笔画串”,简称“N笔串”;对于笔画数小于N的字余构件,本发明在该字余构件的全部笔画之后追加“空”笔画1个或1个以上,以便在形式上凑足N个笔画;对于笔画数等于N的字余构件,本发明按书写笔画顺序取该构件的全部N个笔画;对于笔画数大于N的字余构件,本发明允许按以下(e)和(f)两种方法任择其一的方法提取其N个笔画:(e)直接按书写笔画顺序取该字余构件的前N个笔画;(f)首先按书写笔画顺序取该字余构件的前N-1个笔画,再按书写笔画顺序取该字余构件的最后一个笔画为第N个笔画;对于独体型汉字,本发明首先认定其字余构件为由N个空笔画组成的空构件,并取N个空笔画组合成为字符串,再认定其为该字的“字余N笔画串”;本发明允许字典编篡者将少量的汉字构件按2种或2种以上的笔画顺序提取笔画,以兼顾部分字典使用者对这种汉字构件在笔画顺序问题上的非主流观点;
(6)取该汉字的两位笔画数数码构成数码字符串,并简称该串为“笔数串”;对于笔画数小于10的汉字,在笔画数前加“0”使其在形式上成为两位长度的数码字符串,作为该汉字的“笔数串”;
(7)本发明所述的“两分笔画码字符串”,是将通过上述(1)、(2)、(3)、(4)、(5)、(6)步骤取码操作所得的结果即M笔串、N笔串、型码符、笔数串,将该4种结果进行后述(i)、(j)、(k)、(l)、(m)、(n)、(o)、(p)、(q)、(r)、(s)、(t)所列的任意一种组合方式进行组合,所得到的字符串即为“两分笔画码字符串”:(i)M笔串;(j)M笔串与型码符的组合;(k)M笔串与笔数串的组合;(l)M笔串、型码符与笔数串的组合;(m)N笔串;(n)N笔串与型码符的组合;(o)N笔串与笔数串的组合;(p)N笔串、型码符与笔数串的组合;(q)M笔串与N笔串的组合;(r)M笔串、N笔串与型码符的组合;(s)M笔串、N笔串与笔数串的组合;(t)M笔串、N笔串、型码符与笔数串的组合;
既具备现有汉语字典的若干共性特征,又具备本发明的上述新创个性特征的字典,即是本发明所述的新型两分笔画码汉语字典。
本发明所述的新型两分笔画码汉语字典,可以在全部或部分字头汉字之后排放包含有该字头汉字的汉语词汇以及该汉语词汇的解释项,其中“汉语词汇”是指由1个或1个以上汉字组成的具有较稳定语意和语意用法的汉语字符串,从而将该字典改编成一种新型两分笔画码汉语词典。
具体实施方式
下面结合实施例,对本发明的具体实施方式作进一步描述。以下实施例仅用于更加清楚地说明本发明的技术方案,而不能以此来限制本发明的保护范围。
根据本发明人所做的统计和试验,本发明人建议将本发明所述的横、竖、撇、捺、折和“空”笔画分别用字符“1”、“2”、“3”、“4”、“5”、“0”来代表,这样所得的字典,对于字典正文的编辑排列和字典的检索使用是效果较好的。
根据本发明人所做的统计和试验,本发明建议将本发明所述的5种汉字字型即左右型、上下型、包围型、交叉型和独体型分别简称为A型、B型、C型、X型、Z型,这样编排所得的字典在编制和使用的过程中是效果比较好的。
根据本发明人所做的统计和试验,对于收录了GBK字表20902个汉字以内的若干常见的汉语字典而言,本发明人进一步建议根据所编纂字典收录字数的多寡,将本发明所述的自然数M和N均设定为3-6,这样编排所得的新型字典在使用过程中将会是效果比较好的。
根据本发明人所做的抽样统计和抽样试验,对于收录了60370个汉字的《汉语大字典》,甚至收录了85568个汉字的《中华字海》而言,本发明人进一步建议将本发明所述的自然数M和N均设定为6-8,这样编排所得的新型字典在使用过程中将会是效果比较好的。
根据本发明人所做的统计和试验,按字首M笔+字余N笔、字首M笔+字余N笔+字型、字首M笔+字型+字余N笔或字型+字首M笔+字余N笔的方式获得各汉字的两分笔画码字符串,这样编排所得的新型字典在使用过程中将会是效果比较好的。
前述所列的本发明字典的多种实施方式,本发明人正组织力量进行字典和词典的编制工作,在不久的将来将会推向市场,这些字典和词典的使用方法将由各字典和词典的编纂者进行具体的说明和介绍。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明技术原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (2)

1.一种新型两分笔画码汉语字典或字典页面,包括字典正文页面1页或1页以上并以后述的(a)和/或(b)的形式提供给字典使用者查阅使用:(a)按各页页标码的顺序叠摞或装订成1册或1册以上作为纸质字典,供字典使用者通过翻页检索查阅;(b)将字典正文编辑存储为电子文档1件或1件以上作为电子字典数据表,供字典使用者通过操作特定软、硬件检索该数据表将目标内容显示于屏幕之上或打印出来用于阅看;所述的“字典正文页面”,是指印有页标码1个或1个以上、字头汉字1个或1个以上及用于解释该字头汉字的汉字解释内容1条或1条以上的纸质字典页面,或显示于屏幕之上的含有页标码1个或1个以上、字头汉字1个或1个以上及用于解释该字头汉字的汉字解释内容1条或1条以上的电子字典页面;所述的“页标码”是指印刷于各字典正文页面之上或显示于电子字典页面之上,用以表达该字典的该页面与该字典的其他页面的先后顺序及位置关系的字符串,该字符串是包括但不限于由阿拉伯字母和/或英文字母构成的字符串;所述的“汉字解释内容”是指该汉字的字音信息和/或字形信息和/或字义信息和/或文字用法信息和/或检索该字之音形义用信息的路径指引信息的汉字信息;所述的“字头汉字”是指由字典编纂者收录于纸面字典和/或电子字典之中,以供该字典使用者检索查阅该字的汉字解释内容的目标汉字;
以上为现有各种汉语字典的共性特征,而本发明之新型两分笔画码汉语字典除具备上述共性特征之外,还具备下述新创的个性特征;本发明的这些特征在于:
本发明对汉字字型按其结构类型分类,引入“交叉型”字型的概念,并将全部汉字分为左右型、上下型、包围型、交叉型和独体型的5种类型;本发明引入“空构件”和“空笔画”这两个概念,并将这两个概念用于对字头汉字进行分拆汉字构件和提取笔画的操作;本发明引入汉字“字首构件”和“字余构件”这两个概念,并对左右型、上下型、包围型、交叉型和独体型的5种字型类别的汉字分别规定了分拆认定其字首构件和字余构件的方法;本发明引入“两分笔画码字符串”的概念,并为左右型、上下型、包围型、交叉型和独体型的5种类别字型的汉字分别规定了逐步取码操作和组成各字“两分笔画码字符串”的方法;
本发明以各汉字的两分笔画码字符串为依据对入编本发明字典的全部字头汉字进行排序,并进一步编定本发明字典各个页面的页标码;本发明字典的各页面所使用的页标码,是一种两分笔画码字符串或以两分笔画码字符串为其子字符串的联合字符串;本发明字典对所收列的各字头汉字均按照各字的两分笔画码字符串的顺序或按照以两分笔画码字符串为其子字符串的联合字符串的顺序,进行排序;本发明所述的“两分笔画码字符串”,是指对各字头汉字按下列(1)、(2)、(3)、(4)、(5)、(6)的步骤进行分类别的逐步取码操作,并将取码操作所得之结果按步骤(7)所述的组合方式进行组合,经组合之后所得到的字符串;所述的(1)、(2)、(3)、(4)、(5)、(6)、(7)的操作方法与步骤是指:
(1)本发明取各字头汉字的字型码并用特定字符表示,并称该特定的字型码字符为“型码符”;本发明将各汉字按该字各组成构件的拼装方式分为左右型、上下型、包围型、交叉型和独体型的5种汉字字型类型;本发明将左右型、左中右型和各种复合左右型通视为“左右型”;本发明将上下型、上中下型和各种复合上下型通视为“上下型”;本发明将全包围型、半包围型和各种复合包围型通视为“包围型”;本发明将各汉字构件之间构成穿插或半穿插型的串式交叉关系或复合交叉关系的汉字字型通视为“交叉型”;本发明将由于汉字构件过于单一或各汉字构件之间完全浑然一体而难以按左右型、上下型、包围型和交叉型的汉字构件分拆方法将其分拆为两个或两个以上汉字构件的,通视为“独体型”;本发明对汉字字型的分类方法、对部分汉字的字型认定和汉字构件的拆分方法,系根据本发明字典的编篡者在字典编篡工作中的实际需要和本发明字典的使用者在检索过程中的实际需要而创设的概念和方法,可以不同于其他体系的汉字字型分类方法、汉字字型认定方法及汉字构件拆分方法;本发明允许字典编篡者将少量汉字分别归类为前述2种或2种以上的字型类型,以兼顾部分字典使用者对该部分少量汉字在字型认定问题上的非主流观点;
(2)本发明按构成汉字的笔画形状将全部汉字笔画划分为6类并分别命名为“横”、“竖”、“撇”、“捺”、“折”和“空”笔画;本发明所述的“横”包括各种常规的笔画“横”,也包括笔画“提”和“短横”;本发明所述的“竖”包括各种常规的笔画“竖”,也包括笔画“短竖”,但不包括笔画“竖勾”;本发明所述的“撇”包括各种常规的笔画“撇”,也包括笔画“平撇”和“短撇”;本发明所述的“捺”包括各种常规的笔画“捺”,也包括笔画“平捺”和“点”;本发明所述的“折”包括笔画“折”、“拐”、“弯”、“勾”,其中“勾”包括笔画“横勾”、“竖勾”、“弯勾”、“斜勾”及“折弯勾”;本发明所述的“空”笔画是本发明引入的创新概念,用于表示编码操作中需要使用但在现实中却并不存在的笔画;
(3)本发明引入M和N作为自然数代表符,用于描述对各汉字提取特定字符和编制其两分笔画码字符串的过程;其中M为大于等于2而小于等于10的自然数,N为大于等于1而小于等于10的自然数,且M加N所得之和大于等于4而小于等于20;本发明允许字典编篡者在编篡具体字典时根据该具体字典收录字头汉字数目多寡的需要和该字典页面可纳容字头汉字数量的需要,在本发明的规定范围内设定M和N的确切数值;
(4)本发明针对不同的汉字字型分别规定了将该字型的汉字分拆为字首构件和字余构件的方法;对左右型汉字,取位置在左的汉字构件为字首构件,取剩余的部分为字余构件;对上下型汉字,取位置在上的汉字构件为字首构件,取剩余的部分为字余构件;对包围型汉字,首先将该字分拆为包围者和被包围者等两个汉字构件,然后按书写笔画顺序在包围者与被包围者之间取先写到的那一个汉字构件为字首构件,取剩余的部分为字余构件;对交叉型汉字,首先将该字分拆为构成相互交叉关系的两个汉字构件,然后在两者之间按笔画顺序取先写到的汉字构件为字首构件,取剩余的部分为字余构件;对独体型汉字,本发明规定该独体型汉字本身即为该字的字首构件,设定全部笔画为空且笔画数为N的空构件为该字的字余构件;本发明允许字典编篡者将少量的汉字按2种或2种以上的构件分拆方法认定其字首构件和字余构件,以兼顾部分字典使用者对该部分少量汉字在构件分拆问题上的非主流观点;
(5)本发明按先取字首构件笔画、后取字余构件笔画的两分笔画法的顺序,分别依各构件的书写笔画顺序取得该字字首构件的M个笔画和字余构件的N个笔画,再分别组成其M笔串和N笔串;第一步取字首构件笔画,按书写笔画顺序取M个笔画,并称由该M个笔画码组成的字符串为该汉字的“字首M笔画串”,简称“M笔串”;对于笔画数小于M的字首构件,本发明在该字首构件的全部笔画之后追加“空”笔画1个或1个以上,以便在形式上凑足M个笔画;对于笔画数等于M的字首构件,本发明按书写笔画顺序取该构件的全部M个笔画;对于笔画数大于M的字首构件,本发明允许按以下(c)和(d)两种方法任择其一的方法提取其M个笔画:(c)直接按书写笔画顺序取该字首构件的前M个笔画;(d)首先按书写笔画顺序取该字首构件的前M-1个笔画,再按书写笔画顺序取该字首构件的最后一个笔画为第M个笔画;第二步取字余构件笔画,按书写笔画顺序取N个笔画,并称由该N个笔画码组成的字符串为该汉字的“字余N笔画串”,简称“N笔串”;对于笔画数小于N的字余构件,本发明在该字余构件的全部笔画之后追加“空”笔画1个或1个以上,以便在形式上凑足N个笔画;对于笔画数等于N的字余构件,本发明按书写笔画顺序取该构件的全部N个笔画;对于笔画数大于N的字余构件,本发明允许按以下(e)和(f)两种方法任择其一的方法提取其N个笔画:(e)直接按书写笔画顺序取该字余构件的前N个笔画;(f)首先按书写笔画顺序取该字余构件的前N-1个笔画,再按书写笔画顺序取该字余构件的最后一个笔画为第N个笔画;对于独体型汉字,本发明首先认定其字余构件为由N个空笔画组成的空构件,并取N个空笔画组合成为字符串,再认定其为该字的“字余N笔画串”;本发明允许字典编篡者将少量的汉字构件按2种或2种以上的笔画顺序提取笔画,以兼顾部分字典使用者对这种汉字构件在笔画顺序问题上的非主流观点;
(6)取该汉字的两位笔画数数码构成数码字符串,并简称该串为“笔数串”;对于笔画数小于10的汉字,在笔画数前加“0”使其在形式上成为两位长度的数码字符串,作为该汉字的“笔数串”;
(7)本发明所述的“两分笔画码字符串”,是将通过上述(1)、(2)、(3)、(4)、(5)、(6)步骤取码操作所得的结果即M笔串、N笔串、型码符、笔数串,将该4种结果进行后述(i)、(j)、(k)、(l)、(m)、(n)、(o)、(p)、(q)、(r)、(s)、(t)所列的任意一种组合方式进行组合,所得到的字符串即为“两分笔画码字符串”:(i)M笔串;(j)M笔串与型码符的组合;(k)M笔串与笔数串的组合;(l)M笔串、型码符与笔数串的组合;(m)N笔串;(n)N笔串与型码符的组合;(o)N笔串与笔数串的组合;(p)N笔串、型码符与笔数串的组合;(q)M笔串与N笔串的组合;(r)M笔串、N笔串与型码符的组合;(s)M笔串、N笔串与笔数串的组合;(t)M笔串、N笔串、型码符与笔数串的组合;
既具备现有汉语字典的若干共性特征,又具备本发明的上述新创个性特征的字典,即是本发明所述的新型两分笔画码汉语字典。
2.根据权利要求1所述的新型两分笔画码汉语字典,其特征在于,可以在全部或部分字头汉字之后排放包含有该字头汉字的汉语词汇以及该汉语词汇的解释项,其中“汉语词汇”是指由1个或1个以上汉字组成的具有较稳定语意和语意用法的汉语字符串,从而将该字典改编成一种新型两分笔画码汉语词典。
CN201910491932.3A 2019-06-06 2019-06-06 一种新型两分笔画码汉语字典或字典页面 Pending CN110328984A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910491932.3A CN110328984A (zh) 2019-06-06 2019-06-06 一种新型两分笔画码汉语字典或字典页面

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910491932.3A CN110328984A (zh) 2019-06-06 2019-06-06 一种新型两分笔画码汉语字典或字典页面

Publications (1)

Publication Number Publication Date
CN110328984A true CN110328984A (zh) 2019-10-15

Family

ID=68140931

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910491932.3A Pending CN110328984A (zh) 2019-06-06 2019-06-06 一种新型两分笔画码汉语字典或字典页面

Country Status (1)

Country Link
CN (1) CN110328984A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112559728A (zh) * 2020-04-30 2021-03-26 北京师范大学 五大属性整合汉字展示方法、系统、装置及可读存储介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101579981A (zh) * 2009-06-03 2009-11-18 袁强 英语辞典目录的设计技术及其查询方法
CN101716861A (zh) * 2009-05-13 2010-06-02 南车青岛四方机车车辆股份有限公司 汉英词典按首字韵母的第一个字母二次分类法
CN101780735A (zh) * 2008-12-02 2010-07-21 高明利 一种优化字(词)典的方法
CN102336088A (zh) * 2010-07-22 2012-02-01 广州市八景摄影冲印有限公司 一种花名册照片人物查找方法及应用该方法的花名册照片
CN102795021A (zh) * 2012-02-27 2012-11-28 徐金富 一种具有英文字母标尺的字典及其查找英文单词的方法
CN103600595A (zh) * 2013-09-25 2014-02-26 叶先赞 首尾四笔查字法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101780735A (zh) * 2008-12-02 2010-07-21 高明利 一种优化字(词)典的方法
CN101716861A (zh) * 2009-05-13 2010-06-02 南车青岛四方机车车辆股份有限公司 汉英词典按首字韵母的第一个字母二次分类法
CN101579981A (zh) * 2009-06-03 2009-11-18 袁强 英语辞典目录的设计技术及其查询方法
CN102336088A (zh) * 2010-07-22 2012-02-01 广州市八景摄影冲印有限公司 一种花名册照片人物查找方法及应用该方法的花名册照片
CN102795021A (zh) * 2012-02-27 2012-11-28 徐金富 一种具有英文字母标尺的字典及其查找英文单词的方法
CN103600595A (zh) * 2013-09-25 2014-02-26 叶先赞 首尾四笔查字法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112559728A (zh) * 2020-04-30 2021-03-26 北京师范大学 五大属性整合汉字展示方法、系统、装置及可读存储介质
CN112559728B (zh) * 2020-04-30 2023-11-03 北京师范大学 五大属性整合汉字展示方法、系统、装置及可读存储介质

Similar Documents

Publication Publication Date Title
KR100235223B1 (ko) 텍스트 검색에 사용하기 위하여 다중-바이트 문자를 아스키문자의 단일문자 열로 맵핑하는 방법 및 장치
WO2010010918A1 (ja) 情報処理装置および情報処理方法
US20040006458A1 (en) Method and system of creating and using Chinese language data and user-corrected data
CN110328984A (zh) 一种新型两分笔画码汉语字典或字典页面
CN102685347B (zh) 图像处理装置和图像处理方法
US20060066618A1 (en) ZhuYin symbol and tone mark input method, and electronic device
CN100476826C (zh) 中文字型排序检索方法和装置以及一种信息系统
JPH08106464A (ja) 文書生成装置
CN101464875A (zh) 使用xml表示电子字典数据的方法
CN100561469C (zh) 创建和使用中文语言数据和用户自纠正数据的方法和系统
CN107491327A (zh) 一种基于发电机组控制器自定义字符串的写入方法
Becker Unicode 88
KR100923258B1 (ko) 휴대 단말기 소스 파일의 유니코드 변환 방법
TW460804B (en) Data processing apparatus and method for converting the sequence and arrangement of strokes of Chinese characters into the composition of binary data codes
Nederhof Automatic alignment of hieroglyphs and transliteration
CN102053718A (zh) 用于生成汉字的方法以及键盘输入设备
Kataoka et al. Internationalized text manipulation covering perso-arabic enhanced for mongolian scripts
JP2017068307A (ja) 情報検索装置及びその制御方法、情報検索用プログラム
EP1691298B1 (en) Method and system of creating and using Chinese language data and user-corrected data
Koide et al. Research on computer aids for the visually disabled
Nandasara et al. From formation to publication–Design of standards for Sinhala script
Minohara A writing system for the Ancient Egyptian hieroglyphs
Cain The development of Chinese ideographic processing for a shared cataloguing system
KR20200102387A (ko) 키패드에서의 수학 연산자 입력 방법 및 그 장치
van Arkel Transcribing and Encoding. Proposal for the encoding of material to be kept at the Computer Tape Bank in Copenhagen

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination