CN104424264A - 汉字制作方法和装置 - Google Patents

汉字制作方法和装置 Download PDF

Info

Publication number
CN104424264A
CN104424264A CN201310384985.8A CN201310384985A CN104424264A CN 104424264 A CN104424264 A CN 104424264A CN 201310384985 A CN201310384985 A CN 201310384985A CN 104424264 A CN104424264 A CN 104424264A
Authority
CN
China
Prior art keywords
chinese character
parts
relation table
chinese
profile
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201310384985.8A
Other languages
English (en)
Inventor
夏立宁
唐英敏
王玉欣
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Founder Information Industry Holdings Co Ltd
Peking University Founder Group Co Ltd
Beijing Founder Electronics Co Ltd
Original Assignee
Founder Information Industry Holdings Co Ltd
Peking University Founder Group Co Ltd
Beijing Founder Electronics Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Founder Information Industry Holdings Co Ltd, Peking University Founder Group Co Ltd, Beijing Founder Electronics Co Ltd filed Critical Founder Information Industry Holdings Co Ltd
Priority to CN201310384985.8A priority Critical patent/CN104424264A/zh
Publication of CN104424264A publication Critical patent/CN104424264A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/374Thesaurus

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Document Processing Apparatus (AREA)
  • Controls And Circuits For Display Device (AREA)

Abstract

本发明提供了一种汉字制作方法和装置,属于计算机文字输入技术领域。该方法包括:将要制作的汉字拆分成多个部件;在预先创建的汉字集中查找具有所述部件的汉字;从找到的汉字中获取所述部件的轮廓;以获取的轮廓构建所述要制作的汉字。本发明在已有字体制作流程的基础上,针对字体制作人员制作剩余汉字的方法做了一定的改进,使其能更方便更快捷地制作剩余的汉字。避免了更多的重复性工作,提高了效率。

Description

汉字制作方法和装置
技术领域
本发明涉及字库技术领域,具体而言,涉及一种汉字制作方法和装置。
背景技术
在制作一款汉字字体的过程中,往往需要制作数千个汉字。常规的制作方法需要每个汉字每个笔画来制作和调整,使得这些笔画的字体风格与设计师设计出来的字体风格一致。在制作每一个汉字的过程中,需要首先勾勒出当前字的每一个笔画的轮廓,然后进行风格的调整,主要是字体风格的调整,必要的时候还需要增加或删除点。
勾勒笔画轮廓的工作是比较消耗时间和精力的,而且按照这种方式勾勒出的笔画轮廓往往样式比较随意,调整起来也比较费力,效率低。
发明内容
本发明提供一种汉字制作方法和装置,大大提高汉字制作效率。
为此,本发明实施例提供如下技术方案:
本发明实施例提供了一种汉字制作方法,包括:
将要制作的汉字拆分成多个部件;
在预先创建的汉字集中查找具有所述部件的汉字;
从找到的汉字中获取所述部件的轮廓;
以获取的轮廓构建所述要制作的汉字。
优选地,所述方法还包括:
以尽可能少的汉字包含尽可能多的部件为原则,创作多个汉字;
将所述多个汉字构成所述汉字集。
优选地,所述方法还包括:
预先创建汉字部件关系表,所述汉字部件关系表记录了各个汉字所拆分的部件,其中,所述汉字采用符合标准的汉字编码,并且轮廓不同和/或位置不同的部件被设置不同的部件编码;
所述将要制作的汉字拆分成多个部件包括:
根据要制作的汉字的汉字编码检索所述汉字部件关系表,得到所述汉字对应的部件,并获取各部件编码。
优选地,所述方法还包括:
根据所述汉字部件关系表对所述汉字集创建部件汉字关系表,所述部件汉字关系表记录了各个部件在所述汉字集中所对应的汉字,其中,各个汉字采用所述汉字编码,各个部件采用所述部件编码。
优选地,所述根据所述汉字部件关系表对所述汉字集创建部件汉字关系表包括:
遍历所述汉字集中的各个汉字;
以当前汉字的汉字编码检索所述汉字部件关系表,得到所述汉字对应的部件,并获取各部件的部件编码;
进行反映射,得到各部件在所述汉字集中对应的汉字;
创建所述部件汉字关系表,记录各个部件的部件编码及其所述对应的汉字的汉字编码。
优选地,所述在预先创建的汉字集中查找具有所述部件的汉字包括:
以所述部件的部件编码检索所述部件汉字关系表,得到所述部件对应的汉字。
优选地,所述从找到的汉字中获取所述部件的轮廓包括:
从找到的汉字中选择其中一个汉字;
从选择的汉字中获取所述部件的轮廓。
本发明实施例还提供一种汉字制作装置,包括:
拆分模块,用于将要制作的汉字拆分成多个部件;
查找模块,用于在预先创建的汉字集中查找具有所述部件的汉字;
提取模块,用于从找到的汉字中获取所述部件的轮廓;
制作模块,用于以获取的轮廓构建所述要制作的汉字。
优选地,所述装置还包括:
第一创建模块,用于预先创建汉字部件关系表,所述汉字部件关系表记录了各个汉字所拆分的部件,其中,所述汉字采用符合标准的汉字编码,并且轮廓不同和/或位置不同的部件被设置不同的部件编码;
所述拆分模块,具体用于根据要制作的汉字的汉字编码检索所述汉字部件关系表,得到所述汉字对应的部件,并获取各部件编码。
优选地,所述装置还包括:
第二创建模块,用于根据所述汉字部件关系表对所述汉字集创建部件汉字关系表,所述部件汉字关系表记录了各个部件在所述汉字集中所对应的汉字,其中,各个汉字采用所述汉字编码,各个部件采用所述部件编码。
本发明实施例提供的汉字制作方法和装置,可以使字体制作人员在制作一个新汉字的时候,根据当前汉字的编码及组成部件从预先创建的汉字集得到与该汉字相接近的汉字,然后,从得到的汉字中提取相应部件的轮廓,并以该轮廓构建所述要制作的汉字。由于提取的轮廓与要制作的汉字的轮廓非常接近,因此大大提高了汉字的制作效率和制作效果。
附图说明
图1是本发明汉字制作方法的流程图;
图2是利用本发明汉字制作方法制作新字库的一种具体流程图;
图3是本发明汉字制作装置的结构示意图。
具体实施方式
下面将参考附图并结合实施例,来详细说明本发明。
针对常规做法,本发明提出一种效率更高,效果更好的汉字制作方法和装置,以解决其从无到有地勾勒出每一个笔画的轮廓的效率和效果问题。汉字往往是由部首等组合而成,可以把这些部首等统称为部件,这样,汉字的数量虽然很庞大,但是组成汉字的部件却比较有限。当设计师设计一款字体的时候,挑选一些比较有特征的汉字,这部分汉字包含尽可能多的部件。这部分汉字可以是几十个,也可以是数百个。当设计师设计好这部分汉字以后,组成所有汉字的部件基本上也都包含在其中了。这时,制作一个“汉字--部件”对照关系表,这个表里记录了每个汉字由哪些部件组成,这些部件都会有一个编号,代表了部件的类型,也包含了部件的相关信息,如:部件的编码,部件在当前字中所处的位置,这个部件是汉字的部件还是部件的部件等。有了设计师设计好的汉字和这个关系表,字体制作人员在制作一个新汉字的时候,可以直接通过当前字的编码和“汉字—部件”关系表得到当前汉字由哪些部件组成,然后通过这些部件的编码从设计师设计好的汉字里面找到对应的字符,并把里面的字体轮廓数据提取出来,这些字体轮廓数据就可以被直接利用,因为都是最相近的部件,所以其位置、风格、大小等都和最终想要的非常接近。那么字体制作人员在进行第二步工作的时候就非常简单了,只需要简单的挪动部分点,或者进行一下放大缩小等调整工作,就可以成为新汉字的部件了。如此一来,制作汉字的人工成本将大大减少。
如图1所示,是本发明汉字制作方法的流程图,包括以下步骤:
步骤101,将要制作的汉字拆分成多个部件。
具体地,可以预先创建汉字部件关系表,所述汉字部件关系表记录了各个汉字所拆分的部件,其中,所述汉字采用符合标准的汉字编码,并且轮廓不同和/或位置不同的部件被设置不同的部件编码。
相应地,在步骤101中,可以根据要制作的汉字的汉字编码检索所述汉字部件关系表,得到所述汉字对应的部件,并获取各部件编码。
步骤102,在预先创建的汉字集中查找具有所述部件的汉字。
所述汉字集中包括一款字体的部分汉字,这些汉字可以预先由设计师设计好,其原则是以尽可能少的汉字包含尽可能多的部件。
在本发明实施例中,可以根据预先创建的汉字部件关系表对所述汉字集创建部件汉字关系表,所述部件汉字关系表记录了各个部件在所述汉字集中所对应的汉字,其中,各个汉字采用所述汉字编码,各个部件采用所述部件编码。
创建部件汉字关系表的具体过程如下:
(1)遍历所述汉字集中的各个汉字;
(2)以当前汉字的汉字编码检索所述汉字部件关系表,得到所述汉字对应的部件,并获取各部件的部件编码;
(3)进行反映射,得到各部件在所述汉字集中对应的汉字;
(4)创建所述部件汉字关系表,记录各个部件的部件编码及其所述对应的汉字的汉字编码。
相应地,在查找具有所述部件的汉字时,就可以以所述部件的部件编码检索所述部件汉字关系表,从而得到所述部件对应的汉字。
步骤103,从找到的汉字中获取所述部件的轮廓。
具体地,可以从找到的汉字中选择其中一个汉字从该汉字中获取所述部件的轮廓。
步骤104,以获取的轮廓构建所述要制作的汉字。
利用本发明实施例的方法,可以使字体制作人员在制作一个新汉字的时候,根据当前汉字的编码及组成部件从预先创建的汉字集得到与该汉字相接近的汉字,然后,从得到的汉字中提取相应部件的轮廓,并以该轮廓构建所述要制作的汉字。由于提取的轮廓与要制作的汉字的轮廓非常接近,因此大大提高了汉字的制作效率和制作效果。
如图2所示,是利用已有字库部件制作新字库,包括以下步骤:
步骤201,设计师设计好一款字体的部分汉字(字库A)。
当要生产新字体时,需要由设计师先进行字体风格的设计,并且需要设计出一部分汉字的样式,然后在根据这个样式来生产整个字库。所以需要先生产一个包含这部分设计好的汉字的小字库,供后面使用。
在该步骤中,先由设计师进行字体的设计,并确保设计出一定数目的汉字字形,这部分汉字可自由选择,选择的标准是:尽可能多的包含各种汉字部件。假设这部分专门设计的汉字组成的小字库为字库A。
步骤202,整理并生成“汉字—部件”对照关系表。
将所要制作的字库可能包含的所有汉字一一进行拆分,拆分出它所包含的所有部件,并将部件按照其本身编码,位置等信息进行重新编码。例如:“好”,其部件包含“女”和“子”;“妥”,其部件包含“爪”和“女”,虽然两个字都包含了“女”这个部件,但由于其位置的不同,一个位于汉字的左边,一个位于汉字的下边,可以分别对其进行重新编码,重新编码后的编码可能为597301和597302。5973是“女”字这个部件本身的编码,而01和02则代表这个部件位于汉字中的位置。这样,在查找的时候,可以找到在位置和形状上最接近当前正在编辑的部件的那个部件。
按照这种方法,记录下字库中可能包含的所有汉字的“汉字—部件”对照关系。
步骤203,由“汉字—部件”对照关系表,生成“部件—汉字”对照关系表。
所述“部件—汉字”对照关系表即每个部件和包含这个部件的所有汉字的对照关系表。具体地,根据步骤202获得的汉字—部件对照关系表,整理出“部件—汉字”对照关系表。整理的方法是:根据每一个部件的编码,从“汉字—部件”对照关系表中查找包含这个部件的所有汉字,例如:包含部件“女”的汉字有:好,如,她等。
步骤204,根据当前正在制作的汉字编码和“汉字—部件”对照关系表找到组成这个字的所有部件编码。
具体查找方法是:从步骤202中所得到的“汉字—部件“对照关系表中检索。
步骤205,根据步骤204中找到的部件编码和“部件—汉字”对照关系表,找到这些部件都存在于哪些汉字中,并且记录这些汉字的编码。
步骤206,根据步骤205中找到的汉字编码,查看字库A中是否有包含这些汉字,并将包含的汉字的字形轮廓数据读取出来供下一步使用。
步骤207,根据步骤206中读取出的汉字数据,取出其中可用的部件轮廓,然后再适当地进行大小,位置,粗细,字形等方面的调整,使其适应新的汉字。
本发明实施例所提供的汉字制作方法,与现有技术相比,大大方便了字体制作人员根据设计好的字形制作新汉字,减少了工作量,减少了复杂性,降低了操作难度。同时使得字体制作人员制作出来的汉字风格更符合设计师设计出来的风格。
相应地,本发明实施例还提供一种汉字制作装置,如图3所示,是该装置的结构示意图。
在该实施例中,所述装置包括:
拆分模块301,用于将要制作的汉字拆分成多个部件;
查找模块302,用于在预先创建的汉字集中查找具有所述部件的汉字;
提取模块303,用于从找到的汉字中获取所述部件的轮廓;
制作模块304,用于以获取的轮廓构建所述要制作的汉字。
在实际应用中,拆分模块301可以利用预先创建汉字部件关系表进行汉字拆分,为此,在本发明装置的另一实施例中,所述装置还可进一步包括:第一创建模块(未图示),用于创建汉字部件关系表,所述汉字部件关系表记录了各个汉字所拆分的部件,其中,所述汉字采用符合标准的汉字编码,并且轮廓不同和/或位置不同的部件被设置不同的部件编码。
相应地,拆分模块301可以根据要制作的汉字的汉字编码检索所述汉字部件关系表,得到所述汉字对应的部件,并获取各部件编码。
另外,本发明实施例的装置还可进一步包括:第二创建模块(未图示),用于根据所述汉字部件关系表对所述汉字集创建部件汉字关系表,所述部件汉字关系表记录了各个部件在所述汉字集中所对应的汉字,其中,各个汉字采用所述汉字编码,各个部件采用所述部件编码。具体创建过程可以参照前面本发明方法实施例中的描述,在此不再赘述。
相应地,查找模块302可以以所述部件的部件编码检索所述部件汉字关系表,得到所述部件对应的汉字。
利用本发明实施例的装置,可以使字体制作人员在制作一个新汉字的时候,根据当前汉字的编码及组成部件从预先创建的汉字集得到与该汉字相接近的汉字,然后,从得到的汉字中提取相应部件的轮廓,并以该轮廓构建所述要制作的汉字。由于提取的轮廓与要制作的汉字的轮廓非常接近,因此大大提高了汉字的制作效率和制作效果。
显然,本领域的技术人员应该明白,上述的本发明的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本发明不限制于任何特定的硬件和软件结合。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种汉字制作方法,其特征在于,包括:
将要制作的汉字拆分成多个部件;
在预先创建的汉字集中查找具有所述部件的汉字;
从找到的汉字中获取所述部件的轮廓;
以获取的轮廓构建所述要制作的汉字。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
以尽可能少的汉字包含尽可能多的部件为原则,创作多个汉字;
将所述多个汉字构成所述汉字集。
3.根据权利要求1所述的方法,其特征在于,所述方法还包括:
预先创建汉字部件关系表,所述汉字部件关系表记录了各个汉字所拆分的部件,其中,所述汉字采用符合标准的汉字编码,并且轮廓不同和/或位置不同的部件被设置不同的部件编码;
所述将要制作的汉字拆分成多个部件包括:
根据要制作的汉字的汉字编码检索所述汉字部件关系表,得到所述汉字对应的部件,并获取各部件编码。
4.根据权利要求3所述的方法,其特征在于,所述方法还包括:
根据所述汉字部件关系表对所述汉字集创建部件汉字关系表,所述部件汉字关系表记录了各个部件在所述汉字集中所对应的汉字,其中,各个汉字采用所述汉字编码,各个部件采用所述部件编码。
5.根据权利要求4所述的方法,其特征在于,所述根据所述汉字部件关系表对所述汉字集创建部件汉字关系表包括:
遍历所述汉字集中的各个汉字;
以当前汉字的汉字编码检索所述汉字部件关系表,得到所述汉字对应的部件,并获取各部件的部件编码;
进行反映射,得到各部件在所述汉字集中对应的汉字;
创建所述部件汉字关系表,记录各个部件的部件编码及其所述对应的汉字的汉字编码。
6.根据权利要求4所述的方法,其特征在于,所述在预先创建的汉字集中查找具有所述部件的汉字包括:
以所述部件的部件编码检索所述部件汉字关系表,得到所述部件对应的汉字。
7.根据权利要求1所述的方法,其特征在于,所述从找到的汉字中获取所述部件的轮廓包括:
从找到的汉字中选择其中一个汉字;
从选择的汉字中获取所述部件的轮廓。
8.一种汉字制作装置,其特征在于,包括:
拆分模块,用于将要制作的汉字拆分成多个部件;
查找模块,用于在预先创建的汉字集中查找具有所述部件的汉字;
提取模块,用于从找到的汉字中获取所述部件的轮廓;
制作模块,用于以获取的轮廓构建所述要制作的汉字。
9.根据权利要求8所述的装置,其特征在于,所述装置还包括:
第一创建模块,用于预先创建汉字部件关系表,所述汉字部件关系表记录了各个汉字所拆分的部件,其中,所述汉字采用符合标准的汉字编码,并且轮廓不同和/或位置不同的部件被设置不同的部件编码;
所述拆分模块,具体用于根据要制作的汉字的汉字编码检索所述汉字部件关系表,得到所述汉字对应的部件,并获取各部件编码。
10.根据权利要求9所述的装置,其特征在于,所述装置还包括:
第二创建模块,用于根据所述汉字部件关系表对所述汉字集创建部件汉字关系表,所述部件汉字关系表记录了各个部件在所述汉字集中所对应的汉字,其中,各个汉字采用所述汉字编码,各个部件采用所述部件编码。
CN201310384985.8A 2013-08-29 2013-08-29 汉字制作方法和装置 Pending CN104424264A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310384985.8A CN104424264A (zh) 2013-08-29 2013-08-29 汉字制作方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310384985.8A CN104424264A (zh) 2013-08-29 2013-08-29 汉字制作方法和装置

Publications (1)

Publication Number Publication Date
CN104424264A true CN104424264A (zh) 2015-03-18

Family

ID=52973249

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310384985.8A Pending CN104424264A (zh) 2013-08-29 2013-08-29 汉字制作方法和装置

Country Status (1)

Country Link
CN (1) CN104424264A (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1083604A (zh) * 1992-08-29 1994-03-09 文征北 汉字编码方案
CN1268708A (zh) * 1999-10-21 2000-10-04 张彦红 全信息计算机汉字处理系统和实现方法
CN101231558A (zh) * 2008-01-31 2008-07-30 徐州师范大学 甲骨文拼音与部件拆分输入法
CN103186511A (zh) * 2011-12-31 2013-07-03 北京大学 汉字造字方法和设备、构造字体库的方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1083604A (zh) * 1992-08-29 1994-03-09 文征北 汉字编码方案
CN1268708A (zh) * 1999-10-21 2000-10-04 张彦红 全信息计算机汉字处理系统和实现方法
CN101231558A (zh) * 2008-01-31 2008-07-30 徐州师范大学 甲骨文拼音与部件拆分输入法
CN103186511A (zh) * 2011-12-31 2013-07-03 北京大学 汉字造字方法和设备、构造字体库的方法

Similar Documents

Publication Publication Date Title
CN104850633B (zh) 一种基于手绘草图部件分割的三维模型检索系统及方法
JP5930496B2 (ja) レイアウトファイルにおける構造化情報の取得方法及び装置
CN102591612B (zh) 一种基于标点连续性的通用网页正文提取方法及其系统
CN102750337B (zh) 字库的制作方法和装置
CN104298791A (zh) 一种基于集成哈希编码的快速图像检索方法
CN103186511A (zh) 汉字造字方法和设备、构造字体库的方法
CN103500118A (zh) 一种级联样式表优化方法和装置
CN104021198A (zh) 基于本体语义索引的关系数据库信息检索方法及装置
WO2016095645A1 (zh) 笔画输入方法、装置和系统
CN103955514A (zh) 一种基于Lucene倒排索引的图像特征索引方法
CN106095991B (zh) 一种自动生成从关系型数据库向MongoDB数据库数据迁移的代码的方法
CN105224624A (zh) 一种实现倒排链快速归并的方法和装置
CN104636401A (zh) 一种scada系统数据回滚的方法及装置
CN102609455B (zh) 一种实现汉语同音字检索的方法
CN103605521A (zh) 一种实现界面对位的方法及装置
CN106326306A (zh) Pdf文件自动识别生成数字报刊技术
CN104537047B (zh) 一种基于Lucene的服装基样板检索系统
CN104424264A (zh) 汉字制作方法和装置
CN116644740A (zh) 一种基于单文本词项凝固度的字典自动抽取方法与系统
JP6377743B2 (ja) 中間文字ライブラリを構築する方法及び装置
CN105426490A (zh) 一种基于树形结构的索引方法
Li et al. A human-computer interactive dynamic description method for Jiaguwen Characters
CN103077284B (zh) 利用通用文本模板自动生成辅助代码文件的方法及系统
CN106557564A (zh) 一种对象数据分析方法及装置
CN104778247A (zh) 一种基于给定数据资源的信息检索方法及装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20150318

RJ01 Rejection of invention patent application after publication