CN108305209B - 字符变形方法和字符变形设备 - Google Patents
字符变形方法和字符变形设备 Download PDFInfo
- Publication number
- CN108305209B CN108305209B CN201710022236.9A CN201710022236A CN108305209B CN 108305209 B CN108305209 B CN 108305209B CN 201710022236 A CN201710022236 A CN 201710022236A CN 108305209 B CN108305209 B CN 108305209B
- Authority
- CN
- China
- Prior art keywords
- character
- random
- contour
- skeleton
- point
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 68
- 230000008859 change Effects 0.000 claims description 13
- 238000000605 extraction Methods 0.000 claims description 13
- 238000009499 grossing Methods 0.000 claims description 13
- 238000005520 cutting process Methods 0.000 description 85
- 238000010586 diagram Methods 0.000 description 37
- 230000006870 function Effects 0.000 description 8
- 238000004422 calculation algorithm Methods 0.000 description 7
- 238000012549 training Methods 0.000 description 7
- 230000009466 transformation Effects 0.000 description 7
- 238000011426 transformation method Methods 0.000 description 7
- 230000008569 process Effects 0.000 description 6
- 238000012545 processing Methods 0.000 description 6
- 238000004590 computer program Methods 0.000 description 4
- 238000004088 simulation Methods 0.000 description 4
- 230000001133 acceleration Effects 0.000 description 3
- 238000004891 communication Methods 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 239000004575 stone Substances 0.000 description 3
- 230000008901 benefit Effects 0.000 description 2
- 230000000052 comparative effect Effects 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 230000001131 transforming effect Effects 0.000 description 2
- RYGMFSIKBFXOCR-UHFFFAOYSA-N Copper Chemical compound [Cu] RYGMFSIKBFXOCR-UHFFFAOYSA-N 0.000 description 1
- 230000003796 beauty Effects 0.000 description 1
- 229910052802 copper Inorganic materials 0.000 description 1
- 239000010949 copper Substances 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 239000002023 wood Substances 0.000 description 1
Images
Classifications
-
- G06T3/18—
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/44—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
Abstract
公开了一种字符变形方法和字符变形设备,其中该字符变形方法包括:提取字符的骨架;提取字符的轮廓;以及基于骨架和轮廓,对字符进行样本随机变形。根据本公开的实施例,能更好地模拟真实字体。
Description
技术领域
本公开涉及图像处理领域,并且可以应用在古籍文档保护和古籍文档数字化等领域。更具体地,本公开涉及一种能更好地模拟真实字体的字符变形方法和字符变形设备。
背景技术
印章篆刻文化在中国有着悠久的历史,经过甲骨文、陶刻和铜刻,篆刻在中华文明悠久的历史中慢慢蜕变为一种中华汉字特有的艺术形式。与此同时,中国的古籍文献中存在着大量的印章,这些印章中的篆刻文字对于古籍研究者、篆刻艺术爱好者都具有非常重要的研究和艺术价值。
在民用领域,目前市面上有很多模拟印章篆刻的软件和算法,这些软件和算法可以根据用户输入的文字,自动生成具有篆刻风格的印章图像,将神秘的篆刻之美展现给普通用户。但是这些算法绝大多数都是通过直接采用固定的篆刻字体进行排列的方式来生成模拟印章篆刻图像,所得到的图像线条笔直,看起来非常呆板,和真实的篆刻文字相差甚远。图1是示出真实篆刻图像和根据现有技术生成的模拟篆刻图像的示例的图。图1中的左侧是真实篆刻图像,右侧是模拟篆刻图像。从图1可以看出,根据现有技术生成的模拟篆刻图像与真实篆刻图像相比非常呆板,从而不够真实。
此外,在科研领域,和传统的手写或机打文字自动识别不同,印章篆刻文字的自动识别尚属空白,原因是篆刻文字变化多样,并且缺乏大量的训练样本。对于这种情况,一般采用在真实样本上进行随机变形的方式来增加训练样本数量。但上述方法只适用手写文字,不能很好地模拟篆刻文字的风格。
发明内容
在下文中给出了关于本公开的简要概述,以便提供关于本公开的某些方面的基本理解。但是,应当理解,这个概述并不是关于本公开的穷举性概述。它并不是意图用来确定本公开的关键性部分或重要部分,也不是意图用来限定本公开的范围。其目的仅仅是以简化的形式给出关于本公开的某些概念,以此作为稍后给出的更详细描述的前序。
鉴于以上问题,本公开的目的是提供一种能更好地模拟真实字体的字符变形方法和字符变形设备。
根据本公开的一方面,提供了一种用于对字符进行变形的字符变形方法,包括:提取字符的骨架;提取字符的轮廓;以及基于骨架和轮廓,可以对字符进行样本随机变形。
根据本公开的另一方面,还提供了一种用于对字符进行变形的字符变形设备,包括:骨架提取单元,可以被配置成提取字符的骨架;轮廓提取单元,可以被配置成提取字符的轮廓;以及样本随机变形单元,可以被配置成基于骨架和轮廓,对所述字符进行样本随机变形。
根据本公开的其它方面,还提供了用于实现上述根据本公开的方法的计算机程序代码和计算机程序产品以及其上记录有该用于实现上述根据本公开的方法的计算机程序代码的计算机可读存储介质。
在下面的说明书部分中给出本公开实施例的其它方面,其中,详细说明用于充分地公开本公开实施例的优选实施例,而不对其施加限定。
附图说明
本公开可以通过参考下文中结合附图所给出的详细描述而得到更好的理解,其中在所有附图中使用了相同或相似的附图标记来表示相同或者相似的部件。所述附图连同下面的详细说明一起包含在本说明书中并形成说明书的一部分,用来进一步举例说明本公开的优选实施例和解释本公开的原理和优点。其中:
图1是示出真实篆刻图像和根据现有技术生成的模拟篆刻图像的示例的图;
图2是示出根据本公开的实施例的字符变形方法的流程示例的流程图;
图3是示出标准篆体文字的示例的图;
图4是示出根据本公开的实施例的所提取的字符的骨架的示例的图;
图5是示出根据本公开的实施例的所提取的字符的轮廓的示例的图;
图6是示出标准篆刻文字与真实篆刻文字的比较示例的图;
图7是示出根据本公开的实施例的轮廓随机变形的示意图;
图8是示出根据本公开的实施例的轮廓随机变形的字符的示例的图;
图9是示出根据本公开的实施例的轮廓平滑的示例的图;
图10是示出根据本公开的实施例的对字符分别进行纵向等比例拉伸和横向等比例拉伸的示例的图;
图11是示出对字符进行不均匀拉伸的示例的图;
图12是示出根据本公开的实施例的对字符进行纵向不均匀拉伸的示例的图;
图13是真实印章和仿真印章的示例的图;
图14是通过根据本公开的实施例的字符变形方法生成的篆刻样本的示例的图;
图15是示出根据本公开的实施例的字符变形设备的功能配置示例的框图;以及
图16是示出作为本公开的实施例中可采用的信息处理设备的个人计算机的示例结构的框图。
具体实施方式
在下文中将结合附图对本公开的示范性实施例进行描述。为了清楚和简明起见,在说明书中并未描述实际实施方式的所有特征。然而,应该了解,在开发任何这种实际实施例的过程中必须做出很多特定于实施方式的决定,以便实现开发人员的具体目标,例如,符合与系统及业务相关的那些限制条件,并且这些限制条件可能会随着实施方式的不同而有所改变。此外,还应该了解,虽然开发工作有可能是非常复杂和费时的,但对得益于本公开内容的本领域技术人员来说,这种开发工作仅仅是例行的任务。
在此,还需要说明的一点是,为了避免因不必要的细节而模糊了本公开,在附图中仅仅示出了与根据本公开的方案密切相关的设备结构和/或处理步骤,而省略了与本公开关系不大的其它细节。
本发明提出了一种可以用于对字符进行变形的字符变形方法,该方法首先提取字符的骨架和轮廓,然后基于骨架和轮廓来对字符进行样本随机变形。即,该字符变形方法在原始字符上叠加随机变形,从而生成经随机变形的字符。
下面结合附图详细说明根据本公开的实施例。
首先,将参照图2描述根据本公开的实施例的字符变形方法200的流程示例。图2是示出根据本公开的实施例的字符变形方法200的流程示例的流程图。
首先,在步骤S202中,可以提取字符的骨架。
在以下说明中,为了方便,以字符为篆体文字为例进行描述,但是字符变形方法200的应用范围不限于此,即,字符变形方法200也可以应用于除了篆体文字之外的其他字符。当待变形的字符为标准篆体文字时,在步骤S202中,可以提取标准篆体文字的骨架信息。可以利用本领域常用的技术来提取字符的骨架,在此不做详细描述。图3是示出标准篆体文字的示例的图。在图3中,从左至右依次示出了篆体1、篆体2、篆体3、以及篆体4的四个标准篆体文字。图4是示出根据本公开的实施例的所提取的字符的骨架的示例的图。在图4中,以图3中示出的篆体1的标准篆体文字为例,示出了所提取的该标准篆体文字的骨架。
在步骤S204中,可以提取字符的轮廓。以字符为篆体文字为例,当待变形的字符为标准篆体文字时,在步骤S204中,可以提取标准篆体文字的轮廓信息,从而生成该标准篆体文字的轮廓图。可以利用本领域常用的技术来提取字符的轮廓,在此不做详细描述。图5是示出根据本公开的实施例的所提取的字符的轮廓的示例的图。在图5中,仍以图3中示出的篆体1的标准篆体文字为例,示出了所提取的该标准篆体文字的轮廓。
在步骤S206中,可以基于骨架和轮廓,对字符进行样本随机变形。即,在得到了字符的骨架和轮廓之后,可以开始进行样本随机变形。通过根据本公开的实施例的字符变形方法200对字符进行随机变形,使得变形后的字符可以更接近真实字体。
根据中华传统印章的特点,真实篆刻文字与标准篆刻文字主要存在两种差异,第一是轮廓差异,第二是比例差异。所谓轮廓差异是指,一般标准篆刻的文字轮廓会比较平滑笔直,而对于真实篆刻文字,由于文字刻在石材或木材上,受到刻材质地与雕刻者自身的影响,真实篆刻文字的轮廓相比标准篆刻文字会有一些随机差异。所谓比例差异是指,在实际雕刻印章时,考虑到文字的排版,可能会对某些文字进行压缩、拉伸等操作,使得真实篆刻文字的比例与标准篆刻文字有差异。图6是示出标准篆刻文字与真实篆刻文字的比较示例的图。在图6中,最左侧的文字是标准篆刻文字,而中间和最右侧的文字都是真实篆刻文字。如图6所示,中间的真实篆刻文字的轮廓与最左侧的标准篆刻文字相比存在一些随机差异,而最右侧的真实篆刻文字的比例与最左侧的标准篆刻文字相比存在一些随机差异。因此,需要对标准篆刻文字进行轮廓随机变形和/或比例随机变形,以使得变形后的标准篆刻文字更接近真实篆刻文字。
优选地,在根据本公开的实施例的字符变形方法200中,可以对字符进行轮廓随机变形,以改变字符的轮廓。以篆刻文字为例,通过对标准篆刻文字进行轮廓随机变形从而改变标准篆刻文字的轮廓,可以更真实地模拟真实篆刻文字。
优选地,在对字符进行轮廓随机变形时,对于骨架上的每个骨架点:在对应的轮廓中寻找距离该骨架点最近的轮廓点(xc,yc);计算该骨架点到最近的轮廓点之间的欧氏距离D;以及将从该骨架点到最近的轮廓点的延长线上与所述最近的轮廓点距离为D×δ的点,作为轮廓随机变形后的轮廓点,其中,δ是决定变形后的字符的轮廓的随机起伏的随机误差量。
图7是示出根据本公开的实施例的轮廓随机变形的示意图。图7中左侧的图中用方框包围起来的部分是文字的要进行轮廓随机变形的部分。图7中右侧的图是图7中左侧的图中的用方框包围起来的部分的放大图。具体地,首先,遍历骨架上的每一个骨架点。对每一个骨架点(xs,ys),在对应的轮廓图中寻找距离该骨架点(xs,ys)最近的轮廓点(xc,yc),则该骨架点(xs,ys)到最近的轮廓点(xc,yc)之间的欧氏距离D为:
随机变形后的轮廓点(x′c,y′c)可以表示为从骨架点(xs,ys)到最近的轮廓点(xc,yc)的延长线上与最近的轮廓点(xc,yc)距离为D×δ的点,其中,δ是决定变形后的字符的轮廓的随机起伏的随机误差量。
本领域技术人员可以理解,以上轮廓随机变形的实现仅是示例而非限制,还可以以其他方式实现轮廓随机变形,在此不再累述。
优选地,随机误差量δ用下式表示:
δ=A×sin(ωxc+Фr)+B (2)
其中,A为随机增益量;ω为随机频率量;Фr为随机相位量;以及B为随机偏置量。
具体地,A~N(Aa,Ab)为随机增益量,该分量决定随机轮廓的起伏程度,其中,Aa和Ab分别为随机增益量的上限制和下限值;ω~N(ωa,ωb)为随机频率量,该分量决定了随机轮廓起伏的剧烈程度,其中,ωa和ωb分别为随机频率量的上限制和下限值;Фr~N(Фa,Фb)为随机相位量,该分量决定了随机轮廓服从正弦曲线的程度,其中,Фa和Фb分别为随机相位量的上限制和下限值;以及B~N(Ba,Bb)为随机偏置量,该分量决定了随机轮廓的偏置,其中,Ba和Bb分别为随机偏置量的上限制和下限值。
那么,随机变形后的轮廓点(x′c,y′c)可以表示为:
xc’=(1+δ)xc-δxs (3)
yc’=(1+δ)yc-δys
本领域技术人员可以理解,随机误差量δ的以上形式仅是示例而非限制,随机误差量δ还可以具有其他形式,在此不再累述。
图8是示出根据本公开的实施例的轮廓随机变形的字符的示例的图。在图8中,左侧的图示出了原始的字符轮廓,而右侧的图示出了随机变形后的字符的轮廓。从图8中可以看出,随机变形后的字符的轮廓更接近真实篆刻文字的轮廓。
优选地,在根据本公开的实施例的字符变形方法200中,可以对经历了轮廓随机变形之后的字符进行轮廓平滑。随机变形后的轮廓存在很多毛刺,需要利用平滑算法对这些毛刺进行平滑。可以使用诸如中值滤波、均值滤波以及高斯平滑等的滤波器来进行平滑。图9是示出根据本公开的实施例的轮廓平滑的示例的图。图9中最左侧的图示出了未经平滑的随机变形后的轮廓,图9中间的图示出了经平滑后的随机变形后的轮廓,而图9中最右侧的图是对图9的中间的图中的轮廓进行填充以后获得的图。可以看到,图9的中间的图中的轮廓比较平滑,图9中最右侧的经填充轮廓以后的篆刻文字已经非常接近实际的篆刻风格。
优选地,在根据本公开的实施例的字符变形方法200中,可以对字符进行比例随机变形,以改变字符的比例。以篆刻文字为例,通过对标准篆刻文字进行比例随机变形从而改变标准篆刻文字的比例,可以更真实地模拟真实篆刻文字。
优选地,在对字符进行比例随机变形时,可以对字符进行横向和/或纵向的等比例拉伸。例如,可以对上述经填充轮廓后的文字(以下简称为填充轮廓文字)进行横向和/或纵向的等比例拉伸。图10是示出根据本公开的实施例的对字符分别进行纵向等比例拉伸和横向等比例拉伸的示例的图。图10中最左侧是原始填充轮廓文字,图10的中间是对原始填充轮廓文字进行纵向等比例拉伸后得到的文字,以及图10中的最右侧是对原始填充轮廓文字进行横向等比例拉伸后得到的文字。以上描述了对填充轮廓文字进行横向和/或纵向的等比例拉伸,但这仅是示例而非限制,可以对除了填充轮廓文字之外的文字进行横向和/或纵向的等比例拉伸,例如,可以直接对标准篆体文字进行横向和/或纵向的等比例拉伸。
有的篆刻者会在雕刻文字时对文字做一些不均匀的随机拉伸,以适应排版需求。例如将文字的上半部分拉长、下半部分保持不变,或者上半部分保持不变、下半部分拉长等。图11是示出对字符进行不均匀拉伸的示例的图。图11中的左侧是不均匀拉伸之前的字符,而图11中的右侧是进行了不均匀拉伸之后的字符。可以看到,对字符的上半部分和下半部分进行了不均匀拉伸。
优选地,在对字符进行比例随机变形时,可以对字符进行横向和/或纵向的不均匀拉伸。下面主要以纵向的不均匀拉伸为例来进行描述,本领域技术人员可以参照该描述,实现横向的不均匀拉伸。优选地,在进行纵向拉伸时,字符的上半部分比下半部分拉伸程度更大或者字符的下半部分比上半部分拉伸程度更大。以对上述经轮廓随机变形后的轮廓点(x′c,y′c)进行纵向不均匀拉伸为例,纵向不均匀拉伸后的轮廓点的纵坐标y″c可以表示为:
在式(4)中,a为加速度因子,该分量描述了纵向拉伸变化的速度变化。通过式(4),字符的下半部分比上半部分拉伸程度更大。而通过将式(4)表示的曲线进行上下翻转,可以使得字符的上半部分比下半部分拉伸程度更大。
图12是示出根据本公开的实施例的对字符进行纵向不均匀拉伸的示例的图。图12中从左到右的图分别是a=0、a=0.005、a=0.01、以及a=0.02时对填充轮廓文字进行纵向不均匀拉伸的图。
此外,作为示例,对上述经轮廓随机变形后的轮廓点(x′c,y′c)进行纵向不均匀拉伸,纵向不均匀拉伸后的轮廓点的纵坐标还可以分别表示为式(5)和式(6)的形式:
在式(5)中,a为加速度因子,p决定函数曲线的变化趋势,以及m决定函数曲线的偏置。
在式(6)中,a为加速度因子,p和q决定函数曲线的变化趋势,以及m决定函数曲线的偏置。
以上描述了对经轮廓随机变形后的文字进行纵向不均匀拉伸,但这仅是示例而非限制,可以对除了经轮廓随机变形后的文字之外的文字进行纵向不均匀拉伸,例如,可以直接对标准篆体文字进行纵向不均匀拉伸。
优选地,在根据本公开的实施例的字符变形方法200中,所述字符可以是印章篆刻字符。在上文中,以字符为篆体文字为例描述了字符变形方法200,但是字符变形方法200的应用范围不限于此,即,字符变形方法200也可以应用于除了篆体文字之外的其他字符。
根据本公开的实施例的字符变形方法200,结合不同的标准篆体字体,可以生成大量逼真的篆刻仿真字体,这些字体可用于印章生成以及样本训练等目的。图13是真实印章和仿真印章的示例的图。图13中最左侧的图是真实印章,中间的图是根据字符变形方法200模拟的印章,最右侧的图是根据现有技术方法模拟的印章。从图13可以看出,根据字符变形方法200模拟的印章更接近真实印章。
图14是通过根据本公开的实施例的字符变形方法200生成的篆刻样本的示例的图。在图14中,示出了通过根据本公开的实施例的字符变形方法200生成的多个篆刻样本。根据本公开的实施例的字符变形方法200可以用于篆刻识别任务的样本生成。由于样本生成具有随机性的特点,为篆刻文字自动识别算法提供大量的随机训练样本,从而为这一空白领域提供数据基础。
综上所述,根据本公开的实施例的字符变形方法200在固定的篆刻字体的基础上,可以通过在字体的边缘轮廓叠加随机偏移,来模拟真实篆刻过程中由于刀具、石料以及篆刻者自身原因所造成的曲线样条,另外还可以通过比例随机变形来模拟真实篆刻文字的比例,从而使得生成的仿真篆刻文字非常逼真。该技术与现有技术相比,可以更加真实地模拟篆刻风格,同时,由于样本生成具有随机性的特点,该方法可以为篆刻文字自动识别算法提供大量的随机训练样本,为这一空白领域提供数据基础。
与上述方法实施例相对应地,本公开还提供了以下设备实施例。
图15是示出根据本公开的实施例的字符变形设备1500的功能配置示例的框图。
如图15所示,根据本公开的实施例的字符变形设备1500可以包括骨架提取单元1502、轮廓提取单元1504以及样本随机变形单元1506。接下来将描述各个单元的功能配置示例。
在骨架提取单元1502中,可以提取字符的骨架。
在以下说明中,为了方便,以字符为篆体文字为例进行描述,但是字符变形设备1500也可以对除了篆体文字之外的其他字符进行处理。当待变形的字符为标准篆体文字时,在骨架提取单元1502中,可以提取标准篆体文字的骨架信息。关于骨架提取的具体描述可参见以上方法实施例中相应位置的描述,在此不再重复。
在轮廓提取单元1504中,可以提取字符的轮廓。以字符为篆体文字为例,当待变形的字符为标准篆体文字时,在轮廓提取单元1504中,可以提取标准篆体文字的轮廓信息,从而生成该标准篆体文字的轮廓图。关于轮廓提取的具体描述可参见以上方法实施例中相应位置的描述,在此不再重复。
在样本随机变形单元1506中,可以基于骨架和轮廓,对字符进行样本随机变形。即,在得到了字符的骨架和轮廓之后,可以开始进行样本随机变形。通过根据本公开的实施例的字符变形设备1500对字符进行随机变形,使得变形后的字符可以更接近真实字体。
优选地,在样本随机变形单元1506中,可以对字符进行轮廓随机变形,以改变字符的轮廓。以篆刻文字为例,通过对标准篆刻文字进行轮廓随机变形从而改变标准篆刻文字的轮廓,可以更真实地模拟真实篆刻文字。
优选地,在对字符进行轮廓随机变形时,对于骨架上的每个骨架点:在对应的轮廓中寻找距离该骨架点最近的轮廓点(xc,yc);计算该骨架点到最近的轮廓点之间的欧氏距离D;以及将从该骨架点到最近的轮廓点的延长线上与所述最近的轮廓点距离为D×δ的点,作为轮廓随机变形后的轮廓点,其中,δ是决定变形后的字符的轮廓的随机起伏的随机误差量。
关于对字符进行轮廓随机变形的具体描述可参见以上方法实施例中相应位置的描述,在此不再重复。
优选地,随机误差量δ用下式表示:
δ=A×sin(ωxc+Фr)+B (7)
其中,A为随机增益量;ω为随机频率量;Фr为随机相位量;以及B为随机偏置量。
具体地,A~N(Aa,Ab)为随机增益量,该分量决定随机轮廓的起伏程度,其中,Aa和Ab分别为随机增益量的上限制和下限值;ω~N(ωa,ωb)为随机频率量,该分量决定了随机轮廓起伏的剧烈程度,其中,ωa和ωb分别为随机频率量的上限制和下限值;Фr~N(Фa,Фb)为随机相位量,该分量决定了随机轮廓服从正弦曲线的程度,其中,Фa和Фb分别为随机相位量的上限制和下限值;以及B~N(Ba,Bb)为随机偏置量,该分量决定了随机轮廓的偏置,其中,Ba和Bb分别为随机偏置量的上限制和下限值。
关于随机误差量δ的具体描述可参见以上方法实施例中相应位置的描述,在此不再重复。
优选地,在根据本公开的实施例的字符变形设备1500中,可以对经历了轮廓随机变形之后的字符进行轮廓平滑。关于轮廓平滑的具体描述可参见以上方法实施例中相应位置的描述,在此不再重复。
优选地,在样本随机变形单元1506中,可以对字符进行比例随机变形,以改变字符的比例。以篆刻文字为例,通过对标准篆刻文字进行比例随机变形从而改变标准篆刻文字的比例,可以更真实地模拟真实篆刻文字。
优选地,在对字符进行比例随机变形时,可以对字符进行横向和/或纵向的等比例拉伸。关于对字符进行横向和/或纵向的等比例拉伸的具体描述可参见以上方法实施例中相应位置的描述,在此不再重复。
优选地,在对字符进行比例随机变形时,可以对字符进行横向和/或纵向的不均匀拉伸。优选地,在进行纵向拉伸时,字符的上半部分比下半部分拉伸程度更大或者字符的下半部分比上半部分拉伸程度更大。关于对字符进行横向和/或纵向的不均匀拉伸的具体描述可参见以上方法实施例中相应位置的描述,在此不再重复。
优选地,在根据本公开的实施例的字符变形设备1500,所述字符可以是印章篆刻字符。在上文中,以字符为篆体文字为例描述了字符变形设备1500,但是字符变形设备1500也可以对除了篆体文字之外的其他字符进行处理。
根据本公开的实施例的字符变形设备1500,基于不同的标准篆体字体,可以生成大量逼真的篆刻仿真字体,这些字体可用于印章生成以及样本训练等目的。关于印章以及样本生成的具体描述可参见以上方法实施例中相应位置的描述,在此不再重复。
综上所述,根据本公开的实施例的字符变形设备1500在固定的篆刻字体的基础上,可以通过在字体的边缘轮廓叠加随机偏移,来模拟真实篆刻过程中由于刀具、石料以及篆刻者自身原因所造成的曲线样条,另外还可以通过比例随机变形来模拟真实篆刻文字的比例,从而使得生成的仿真篆刻文字非常逼真。与现有技术相比,可以更加真实地模拟篆刻风格,同时,由于样本生成具有随机性的特点,可以为篆刻文字自动识别算法提供大量的随机训练样本,为这一空白领域提供数据基础。
应指出,尽管以上描述了根据本公开的实施例的字符变形设备的功能配置,但是这仅是示例而非限制,并且本领域技术人员可根据本公开的原理对以上实施例进行修改,例如可对各个实施例中的功能模块进行添加、删除或者组合等,并且这样的修改均落入本公开的范围内。
此外,还应指出,这里的装置实施例是与上述方法实施例相对应的,因此在装置实施例中未详细描述的内容可参见方法实施例中相应位置的描述,在此不再重复描述。
应理解,根据本公开的实施例的存储介质和程序产品中的机器可执行的指令还可以被配置成执行上述字符变形方法,因此在此未详细描述的内容可参考先前相应位置的描述,在此不再重复进行描述。
相应地,用于承载上述包括机器可执行的指令的程序产品的存储介质也包括在本发明的公开中。该存储介质包括但不限于软盘、光盘、磁光盘、存储卡、存储棒等等。
另外,还应该指出的是,上述系列处理和装置也可以通过软件和/或固件实现。在通过软件和/或固件实现的情况下,从存储介质或网络向具有专用硬件结构的计算机,例如图16所示的通用个人计算机1600安装构成该软件的程序,该计算机在安装有各种程序时,能够执行各种功能等等。
在图16中,中央处理单元(CPU)1601根据只读存储器(ROM)1602中存储的程序或从存储部分1608加载到随机存取存储器(RAM)1603的程序执行各种处理。在RAM 1603中,也根据需要存储当CPU 1601执行各种处理等时所需的数据。
CPU 1601、ROM 1602和RAM 1603经由总线1604彼此连接。输入/输出接口1605也连接到总线1604。
下述部件连接到输入/输出接口1605:输入部分1606,包括键盘、鼠标等;输出部分1607,包括显示器,比如阴极射线管(CRT)、液晶显示器(LCD)等,和扬声器等;存储部分1608,包括硬盘等;和通信部分1609,包括网络接口卡比如LAN卡、调制解调器等。通信部分1609经由网络比如因特网执行通信处理。
根据需要,驱动器1610也连接到输入/输出接口1605。可拆卸介质1611比如磁盘、光盘、磁光盘、半导体存储器等等根据需要被安装在驱动器1610上,使得从中读出的计算机程序根据需要被安装到存储部分1608中。
在通过软件实现上述系列处理的情况下,从网络比如因特网或存储介质比如可拆卸介质1611安装构成软件的程序。
本领域的技术人员应当理解,这种存储介质不局限于图16所示的其中存储有程序、与设备相分离地分发以向用户提供程序的可拆卸介质1611。可拆卸介质1611的例子包含磁盘(包含软盘(注册商标))、光盘(包含光盘只读存储器(CD-ROM)和数字通用盘(DVD))、磁光盘(包含迷你盘(MD)(注册商标))和半导体存储器。或者,存储介质可以是ROM 1602、存储部分1608中包含的硬盘等等,其中存有程序,并且与包含它们的设备一起被分发给用户。
以上参照附图描述了本公开的优选实施例,但是本公开当然不限于以上示例。本领域技术人员可在所附权利要求的范围内得到各种变更和修改,并且应理解这些变更和修改自然将落入本公开的技术范围内。
例如,在以上实施例中包括在一个单元中的多个功能可以由分开的装置来实现。替选地,在以上实施例中由多个单元实现的多个功能可分别由分开的装置来实现。另外,以上功能之一可由多个单元来实现。无需说,这样的配置包括在本公开的技术范围内。
在该说明书中,流程图中所描述的步骤不仅包括以所述顺序按时间序列执行的处理,而且包括并行地或单独地而不是必须按时间序列执行的处理。此外,甚至在按时间序列处理的步骤中,无需说,也可以适当地改变该顺序。
另外,根据本公开的技术还可以如下进行配置。
附记1.一种用于对字符进行变形的字符变形方法,包括:
提取所述字符的骨架;
提取所述字符的轮廓;以及
基于所述骨架和所述轮廓,对所述字符进行样本随机变形。
附记2.根据附记1所述的字符变形方法,其中,对所述字符进行轮廓随机变形,以改变所述字符的轮廓。
附记3.根据附记2所述的字符变形方法,其中,对经历了轮廓随机变形之后的字符进行轮廓平滑。
附记4.根据附记1所述的字符变形方法,其中,对所述字符进行比例随机变形,以改变所述字符的比例。
附记5.根据附记2所述的字符变形方法,其中,在对所述字符进行轮廓随机变形时,对于所述骨架上的每个骨架点:
在对应的轮廓中寻找距离该骨架点最近的轮廓点<xc,yc>;
计算该骨架点到最近的轮廓点之间的欧氏距离D;以及
将从该骨架点到所述最近的轮廓点的延长线上与所述最近的轮廓点距离为D×δ的点,作为轮廓随机变形后的轮廓点,
其中,δ是决定变形后的字符的轮廓的随机起伏的随机误差量。
附记6.根据附记5所述的字符变形方法,其中,随机误差量δ用下式表示:
δ=A×sin(ωxc+Фr)+B,
其中,A为随机增益量;ω为随机频率量;Фr为随机相位量;以及B为随机偏置量。
附记7.根据附记4所述的字符变形方法,其中,在对所述字符进行比例随机变形时,对所述字符进行横向和/或纵向的等比例拉伸。
附记8.根据附记4所述的字符变形方法,其中,在对所述字符进行比例随机变形时,对所述字符进行横向和/或纵向的不均匀拉伸。
附记9.根据附记8所述的字符变形方法,其中,在进行纵向拉伸时,所述字符的上半部分比下半部分拉伸程度更大或者所述字符的下半部分比上半部分拉伸程度更大。
附记10.根据附记1所述的字符变形方法,其中,所述字符是印章篆刻字符。
附记11.一种用于对字符进行变形的字符变形设备,包括:
骨架提取单元,被配置成提取所述字符的骨架;
轮廓提取单元,被配置成提取所述字符的轮廓;以及
样本随机变形单元,被配置成基于所述骨架和所述轮廓,对所述字符进行样本随机变形。
附记12.根据附记11所述的字符变形设备,其中,在所述样本随机变形单元中,对所述字符进行轮廓随机变形,以改变所述字符的轮廓。
附记13.根据附记12所述的字符变形设备,其中,对经历了轮廓随机变形之后的字符进行轮廓平滑。
附记14.根据附记11所述的字符变形设备,其中,在所述样本随机变形单元中,对所述字符进行比例随机变形,以改变所述字符的比例。
附记15.根据附记12所述的字符变形设备,其中,在对所述字符进行轮廓随机变形时,对于所述骨架上的每个骨架点:
在对应的轮廓中寻找距离该骨架点最近的轮廓点<xc,yc>;
计算该骨架点到最近的轮廓点之间的欧氏距离D;以及
将从该骨架点到所述最近的轮廓点的延长线上与所述最近的轮廓点距离为D×δ的点,作为轮廓随机变形后的轮廓点,
其中,δ是决定变形后的字符的轮廓的随机起伏的随机误差量。
附记16.根据附记15所述的字符变形设备,其中,随机误差量δ用下式表示:
δ=A×sin(ωxc+Фr)+B,
其中,A为随机增益量;ω为随机频率量;Фr为随机相位量;以及B为随机偏置量。
附记17.根据附记14所述的字符变形设备,其中,在对所述字符进行比例随机变形时,对所述字符进行横向和/或纵向的等比例拉伸。
附记18.根据附记14所述的字符变形设备,其中,在对所述字符进行比例随机变形时,对所述字符进行横向和/或纵向的不均匀拉伸。
附记19.根据附记18所述的字符变形设备,其中,在进行纵向拉伸时,所述字符的上半部分比下半部分拉伸程度更大或者所述字符的下半部分比上半部分拉伸程度更大。
附记20.根据附记11所述的字符变形设备,其中,所述字符是印章篆刻字符。
Claims (8)
1.一种用于对字符进行变形的字符变形方法,包括:
提取所述字符的骨架;
提取所述字符的轮廓;以及
基于所述骨架和所述轮廓,对所述字符进行样本随机变形,
其中,对所述字符进行轮廓随机变形,以改变所述字符的轮廓,以及
在对所述字符进行轮廓随机变形时,对于所述骨架上的每个骨架点:
在对应的轮廓中寻找距离该骨架点最近的轮廓点<xc,yc>;
计算该骨架点到最近的轮廓点之间的欧氏距离D;以及
将从该骨架点到所述最近的轮廓点的延长线上与所述最近的轮廓点距离为D×δ的点,作为轮廓随机变形后的轮廓点,
其中,δ是决定变形后的字符的轮廓的随机起伏的随机误差量。
2.根据权利要求1所述的字符变形方法,其中,对经历了轮廓随机变形之后的字符进行轮廓平滑。
3.根据权利要求1所述的字符变形方法,其中,还对所述字符进行比例随机变形,以改变所述字符的比例。
4.根据权利要求1所述的字符变形方法,其中,随机误差量δ用下式表示:
δ=A×sin(ωxc+Фr)+B,
其中,A为随机增益量;ω为随机频率量;Фr为随机相位量;以及B为随机偏置量。
5.根据权利要求3所述的字符变形方法,其中,在对所述字符进行比例随机变形时,对所述字符进行横向和/或纵向的等比例拉伸。
6.根据权利要求3所述的字符变形方法,其中,在对所述字符进行比例随机变形时,对所述字符进行横向和/或纵向的不均匀拉伸。
7.根据权利要求6所述的字符变形方法,其中,在进行纵向拉伸时,所述字符的上半部分比下半部分拉伸程度更大或者所述字符的下半部分比上半部分拉伸程度更大。
8.一种用于对字符进行变形的字符变形设备,包括:
骨架提取单元,被配置成提取所述字符的骨架;
轮廓提取单元,被配置成提取所述字符的轮廓;以及
样本随机变形单元,被配置成基于所述骨架和所述轮廓,对所述字符进行样本随机变形,
其中,在所述样本随机变形单元中,对所述字符进行轮廓随机变形,以改变所述字符的轮廓,以及
在对所述字符进行轮廓随机变形时,对于所述骨架上的每个骨架点:
在对应的轮廓中寻找距离该骨架点最近的轮廓点<xc,yc>;
计算该骨架点到最近的轮廓点之间的欧氏距离D;以及
将从该骨架点到所述最近的轮廓点的延长线上与所述最近的轮廓点距离为D×δ的点,作为轮廓随机变形后的轮廓点,
其中,δ是决定变形后的字符的轮廓的随机起伏的随机误差量。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710022236.9A CN108305209B (zh) | 2017-01-12 | 2017-01-12 | 字符变形方法和字符变形设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710022236.9A CN108305209B (zh) | 2017-01-12 | 2017-01-12 | 字符变形方法和字符变形设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108305209A CN108305209A (zh) | 2018-07-20 |
CN108305209B true CN108305209B (zh) | 2021-06-04 |
Family
ID=62871884
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710022236.9A Active CN108305209B (zh) | 2017-01-12 | 2017-01-12 | 字符变形方法和字符变形设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108305209B (zh) |
Citations (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4748443A (en) * | 1984-09-07 | 1988-05-31 | Hitachi, Ltd. | Method and apparatus for generating data for a skeleton pattern of a character and/or a painted pattern of the character |
US4897638A (en) * | 1987-02-27 | 1990-01-30 | Hitachi, Ltd. | Method for generating character patterns with controlled size and thickness |
JPH04216079A (ja) * | 1990-12-14 | 1992-08-06 | Janome Sewing Mach Co Ltd | 毛筆描字装置の毛筆データ作成装置および作成方法 |
CN1100366A (zh) * | 1993-05-24 | 1995-03-22 | 富士通株式会社 | 字符发生方法及装置 |
CN1150269A (zh) * | 1995-11-15 | 1997-05-21 | 付子宁 | 字形信息表示方法和复原方法 |
CN1169569A (zh) * | 1996-05-28 | 1998-01-07 | 夏普公司 | 能够容易地产生多种不同字体字符的字符图形产生装置 |
JPH1063249A (ja) * | 1996-08-23 | 1998-03-06 | Sharp Corp | 文字パターン生成装置 |
CN1201209A (zh) * | 1997-03-25 | 1998-12-09 | 夏普公司 | 信息处理装置 |
CN101105858A (zh) * | 2007-07-09 | 2008-01-16 | 华南理工大学 | 基于最优全局仿射变换的汉字合成实现方法 |
CN102292721A (zh) * | 2009-01-26 | 2011-12-21 | 三菱电机株式会社 | 将空心字符转换成风格化笔画字符的方法 |
CN102637078A (zh) * | 2012-02-27 | 2012-08-15 | 厦门大学 | 一种结构优化的汉字字形生成方法 |
CN103136769A (zh) * | 2011-12-02 | 2013-06-05 | 北京三星通信技术研究有限公司 | 用户书写风格字体生成的方法和装置 |
CN103632387A (zh) * | 2013-12-03 | 2014-03-12 | 北京理工大学 | 毛笔字帖的生成方法和系统 |
CN105069742A (zh) * | 2015-07-24 | 2015-11-18 | 北京航空航天大学 | 一种基于书写特征编辑的软笔汉字变换方法 |
CN105989341A (zh) * | 2015-02-17 | 2016-10-05 | 富士通株式会社 | 文字识别方法和装置 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3330277B2 (ja) * | 1996-03-25 | 2002-09-30 | シャープ株式会社 | 文字パターン生成装置 |
-
2017
- 2017-01-12 CN CN201710022236.9A patent/CN108305209B/zh active Active
Patent Citations (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4748443A (en) * | 1984-09-07 | 1988-05-31 | Hitachi, Ltd. | Method and apparatus for generating data for a skeleton pattern of a character and/or a painted pattern of the character |
US4897638A (en) * | 1987-02-27 | 1990-01-30 | Hitachi, Ltd. | Method for generating character patterns with controlled size and thickness |
JPH04216079A (ja) * | 1990-12-14 | 1992-08-06 | Janome Sewing Mach Co Ltd | 毛筆描字装置の毛筆データ作成装置および作成方法 |
CN1100366A (zh) * | 1993-05-24 | 1995-03-22 | 富士通株式会社 | 字符发生方法及装置 |
CN1150269A (zh) * | 1995-11-15 | 1997-05-21 | 付子宁 | 字形信息表示方法和复原方法 |
CN1169569A (zh) * | 1996-05-28 | 1998-01-07 | 夏普公司 | 能够容易地产生多种不同字体字符的字符图形产生装置 |
JPH1063249A (ja) * | 1996-08-23 | 1998-03-06 | Sharp Corp | 文字パターン生成装置 |
CN1201209A (zh) * | 1997-03-25 | 1998-12-09 | 夏普公司 | 信息处理装置 |
CN101105858A (zh) * | 2007-07-09 | 2008-01-16 | 华南理工大学 | 基于最优全局仿射变换的汉字合成实现方法 |
CN102292721A (zh) * | 2009-01-26 | 2011-12-21 | 三菱电机株式会社 | 将空心字符转换成风格化笔画字符的方法 |
CN103136769A (zh) * | 2011-12-02 | 2013-06-05 | 北京三星通信技术研究有限公司 | 用户书写风格字体生成的方法和装置 |
CN102637078A (zh) * | 2012-02-27 | 2012-08-15 | 厦门大学 | 一种结构优化的汉字字形生成方法 |
CN103632387A (zh) * | 2013-12-03 | 2014-03-12 | 北京理工大学 | 毛笔字帖的生成方法和系统 |
CN105989341A (zh) * | 2015-02-17 | 2016-10-05 | 富士通株式会社 | 文字识别方法和装置 |
CN105069742A (zh) * | 2015-07-24 | 2015-11-18 | 北京航空航天大学 | 一种基于书写特征编辑的软笔汉字变换方法 |
Non-Patent Citations (4)
Title |
---|
Automatic shape morphing for Chinese characters;Zhouhui Lian .etal;《SA "12: SIGGRAPH Asia 2012 Technical Briefs》;20121130;1-4页 * |
Seamless stitching with shape deformation for historical document images;Wei Liu .etal;《IEEE》;20151123;131-135页 * |
一种从黑体到隶书的汉字字形自动变体方法;高晓 等;《软件学报》;19950930;第6卷(第9期);542-550页 * |
汉字部件的无失真缩放变换方法研究;孙浩 等;《计算机应用研究》;20131031;第30卷(第10期);3155-3158页 * |
Also Published As
Publication number | Publication date |
---|---|
CN108305209A (zh) | 2018-07-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108090400B (zh) | 一种图像文本识别的方法和装置 | |
WO2018223994A1 (zh) | 中文打印字符图像合成方法及装置 | |
CN108596138A (zh) | 一种基于迁移层次网络的人脸识别方法 | |
CN108154167A (zh) | 一种汉字字形相似度计算方法 | |
CN103186511A (zh) | 汉字造字方法和设备、构造字体库的方法 | |
CN112784531B (zh) | 一种基于深度学习和部件拼接的中文字形及字库生成方法 | |
CN102231209B (zh) | 基于异构特征降维的二维角色卡通生成方法 | |
CN111563563B (zh) | 一种手写体识别的联合数据的增强方法 | |
Garg et al. | An algorithm for text line segmentation in handwritten skewed and overlapped Devanagari script | |
CN111127668A (zh) | 一种角色模型生成方法、装置、电子设备和存储介质 | |
KR940006056A (ko) | 문자인식방법 및 장치 | |
CN106296649A (zh) | 一种基于水平集模型的纹理图像分割方法 | |
CN108305209B (zh) | 字符变形方法和字符变形设备 | |
CN111274762A (zh) | 一种基于藏经典文献中多样性字体的计算机表达方法 | |
Islam et al. | Geometry and statistics-preserving manifold embedding for nonlinear dimensionality reduction | |
CN104809721B (zh) | 一种漫画分割方法及装置 | |
Park et al. | A method for automatically translating print books into electronic Braille books | |
Guarnera et al. | Classification of decorative patterns in Kamares pottery | |
Balreira et al. | Handwriting synthesis from public fonts | |
CN116912366A (zh) | 一种基于ai的平面设计生成方法及系统 | |
Aswatha et al. | A method for extracting text from stone inscriptions using character spotting | |
Kesiman et al. | Balinese glyph recognition with gabor filters | |
CN112132916B (zh) | 一种利用生成对抗网络的篆刻作品定制化设计生成装置 | |
Biller et al. | Evolution maps for connected components in text documents | |
Yang et al. | Generating Chinese characters based on stroke splitting and feature extraction |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |