CN111402124A - 一种纹理图像和合成图像的生成方法和装置 - Google Patents

一种纹理图像和合成图像的生成方法和装置 Download PDF

Info

Publication number
CN111402124A
CN111402124A CN202010213843.5A CN202010213843A CN111402124A CN 111402124 A CN111402124 A CN 111402124A CN 202010213843 A CN202010213843 A CN 202010213843A CN 111402124 A CN111402124 A CN 111402124A
Authority
CN
China
Prior art keywords
image
noise
function
texture
value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010213843.5A
Other languages
English (en)
Other versions
CN111402124B (zh
Inventor
赵文龙
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alipay Hangzhou Information Technology Co Ltd
Original Assignee
Alipay Hangzhou Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alipay Hangzhou Information Technology Co Ltd filed Critical Alipay Hangzhou Information Technology Co Ltd
Priority to CN202010213843.5A priority Critical patent/CN111402124B/zh
Publication of CN111402124A publication Critical patent/CN111402124A/zh
Application granted granted Critical
Publication of CN111402124B publication Critical patent/CN111402124B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T3/00Geometric image transformations in the plane of the image
    • G06T3/04Context-preserving transformations, e.g. by using an importance map
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T3/00Geometric image transformations in the plane of the image
    • G06T3/40Scaling of whole images or parts thereof, e.g. expanding or contracting
    • G06T3/4007Scaling of whole images or parts thereof, e.g. expanding or contracting based on interpolation, e.g. bilinear interpolation

Landscapes

  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Character Input (AREA)

Abstract

本发明实施例提供了一种计算机执行的纹理图像和合成图像的生成方法和装置,生成方法包括:对于待生成图像中任意的第一位置的坐标值施加基础图形函数,得到基础值;针对第一位置,至少根据噪声扰动函数,生成扰动噪声值;对于基础值和扰动噪声值的和值,施加调整函数,得到该第一位置的像素值;根据各个位置的像素值,生成纹理图像。使用该方法大量生成复杂、不重复且低成本的纹理图像,可用于训练图像识别模型。结合这种纹理图像和文本图像可以生成一种合成图像,并且记录合成图像中每个文本的位置信息,将其作为合成图像的文本位置标签数据。以该合成图像作为验证码训练验证码识别模型,有效提高了识别模型的识别能力。

Description

一种纹理图像和合成图像的生成方法和装置
技术领域
本说明书一个或多个实施例涉及机器学习领域和数据安全领域,尤其涉及一种纹理图像和合成图像的生成方法和装置。
背景技术
在很多图像识别的项目中,需要用到大量复杂且不重复图像来训练图像识别模型,以增强其识别能力。这样就需要一种自动图像生成方法来大量生成所需的图像。现有的图像生成方法生成的图像比较简单,且风格较为单一,用这样的图像训练出的识别模型对复杂图像的识别能力较差,且容易存在过拟合的问题,即有效识别的图像风格较为单一,不具有识别多种类型风格的图像的能力。因此就需要一种可以大量生成不同风格的复杂纹理图像的方法。
作为图像识别模型的一种具体化应用,专用于识别验证码图像的验证码识别模型,广泛应用于对验证码的安全性测试,验证码模拟攻击等方面。而训练一个高精度的验证码内容识别模型需要大量随机、复杂、不重复、低成本的带标签的验证码,为了满足这种需求,建立一种能大量生产满足上述需要的验证码的生成器是合理的选择。现有的验证码生成器的各种解决方案的基本思想为,将验证码拆分为二个图层,二个图层分别为噪音图层和验证码文本图层,噪音图层通常为较简单的噪音或背景,然后将二个图层合并。这些解决方案生成的验证码较为简单,训练出的识别模型对复杂验证码的识别能力差;每种特定的验证码生成器生成的验证码风格单一,难以覆盖多种类型的验证码,缺乏通用性。因此,也需要一种能够生成多种复杂风格的纹理图像用于合成验证码图像、且生成代价便宜的验证码生成器,以便生成大量的验证码对验证码识别模型进行训练,增强其识别能力。
发明内容
本说明书一个或多个实施例描述了一种计算机执行的纹理图像的生成方法和装置,可以生成随机的平滑复杂纹理图像,用以训练图像识别模型,可以增强图像识别模型的识别能力。以这种纹理图像结合文本图像,可用于生成合成图像,该合成图像可作为验证码图像,加之以文本位置作为验证码的标签数据,使用该验证码进行对验证码识别模型的训练,提高其验证码识别能力。
根据第一方面,提供一种纹理图像的生成方法,所述方法包括:对于待生成图像中任意的第一位置,对该第一位置的坐标值施加基础图形函数,得到基础值;其中所述基础图形函数定义待形成的纹理图案中包含的图形要素;针对上述第一位置,至少根据噪声扰动函数,生成扰动噪声值;对于所述基础值和所述扰动噪声值的和值,施加调整函数,得到该第一位置的像素值;所述调整函数定义所述图形要素形成纹理图案的布局方式;根据各个位置的像素值,生成纹理图像。
在一个实施例中,通过以下步骤生成扰动噪声值:对所述第一位置的坐标值施加所述噪声扰动函数,得到第一函数值;在所述第一函数值的基础上施加扰动强度系数,得到所述扰动噪声值。
进一步,在一个例子中,噪声扰动函数为基于噪声插值算法的平滑噪声扰动函数。
在另一个例子中,所述噪声差值算法包括柏林插值算法,双边插值算法。
在一个实施例中,所述噪声扰动函数还包括扰动尺寸参数,用于定义通过扰动叠加层数确定的扰动尺寸;所述至少根据噪声扰动函数,生成扰动噪声值,包括:利用所述噪声扰动函数,针对所述第一位置的坐标值和所述扰动尺寸参数的参数值,生成所述扰动噪声值
根据一种实施方式,所述图形要素为圆;所述基础图形函数包括,计算所述第一位置距离图像中心的距离比例;所述调整函数定义多个圆环的排布。
根据第二方面,提供一种合成图像的生成方法,包括:
获取根据第一方面的方法生成的纹理图像;
获取文本图像;
至少基于所述纹理图像和所述文本图像的叠加,生成合成图像。
根据一种实施方式,所述合成图像的生成方法还包括:获取前景噪声图像;所述至少基于所述纹理图像和所述文本图像的叠加,生成合成图像,包括:基于所述纹理图像,所述文本图像和所述前景噪声图像的叠加,生成合成图像。
根据一种实施方式,至少基于所述纹理图像和所述文本图像的叠加,生成复合图像,包括:将所述纹理图像和所述文本图像相叠加,生成叠加图像;对所述叠加图像进行畸变或滤镜处理,生成所述合成图像。
根据一种实施方式,所述合成图像的生成方法还包括:记录所述合成图像中每个文本的位置信息,将其作为图像文本识别的文本位置标签数据。
进一步,在一个例子中,所述合成图像中的每个文本经过多次变换得到,所述多次变换包括平移,拉伸,旋转,扭曲,畸变,滤镜中的若干种变换;所述记录所述合成图像中每个文本的位置信息包括,记录每个文本在每次变换后的位置信息。
在另一个例子中,其中所述文本包括字符,所述每个文本的位置信息包括,包围住每个字符的最小矩形框的两个对角的坐标。
在一个实施例中,所述复合图像为验证码图像。
根据第三方面,提供一种纹理图案的生成装置,所述装置包括:
基础图形单元,配置为对于待生成图像中任意的第一位置,对该第一位置的坐标值施加基础图形函数,得到基础值;其中所述基础图形函数定义待形成的纹理图案中包含的图形要素;
扰动单元,配置为针对上述第一位置,至少根据噪声扰动函数,生成扰动噪声值;
调整单元,配置为对于所述基础值和所述扰动噪声值的和值,施加调整函数,得到该第一位置的像素值;所述调整函数定义所述图形要素形成纹理图案的布局方式;
纹理图像生成单元,配置为根据各个位置的像素值,生成纹理图像。
根据第四方面,提供一种合成图像的生成装置,所述装置包括:
第一获取单元,配置为获取根据第三方面的装置生成的纹理图像;
第二获取单元,配置为获取文本图像;
合成单元,配置为至少基于所述纹理图像和所述文本图像的叠加,生成合成图像。
根据第五方面,提供一种计算机可读存储介质,其上存储有计算机程序,当所述计算机程序在计算机中执行时,令计算机执行第一、第二方面的方法。
根据第六方面,提供一种计算设备,包括存储器和处理器,其特征在于,所述存储器中存储有可执行代码,所述处理器执行所述可执行代码时,实现第一、第二方面的方法。
根据本发明实施例提供的方法和装置,可以大量生成随机的复杂图案。并将其与文本图案的结合构成验证码,加之文本位置标签数据,用以训练验证码识别器,提升其识别性能。
附图说明
为了更清楚说明本发明实施例的技术方案,下面将对实施例描述中所需使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本说明书披露的一个实施例的一种纹理图像的生成方法的流程图;
图2示出一个实施例中采用的柏林噪声和一般随机噪声的噪音图像对比图;
图3示出一个实施例中生成的多种参数取值的圆环纹理的效果图;
图4示出若干实施例中生成的多种不同风格的纹理图像的效果图;
图5示出一个实施例的一种合成图像的生成方法的流程图;
图6示出一个实施例的合成图像位置标签数据的示意图;
图7示出一个实施例的一种纹理图像的生成装置的结构性框图;
图8示出一个实施例的一种纹理图像的生成装置的结构性框图;
具体实施方式
下面将结合附图,对本发明书提供的方案进行描述。
如前所述,现有的图像生成方法生成的纹理图像图案简单,风格单一,以之训练的图像识别模型对复杂图像的识别能力较差,且容易存在过拟合问题,缺乏对于多种不同风格的图像的识别能力。当以这样简单的纹理图像作为背景合成验证码图像时,得到的验证码图像中背景层常常具有较强的规律性,从而很容易与文本层分离,不利于复杂验证码的识别训练。
发明人为了解决上述技术问题,在本说明书中的实施例中,提出一种纹理图像的生成方法,该方法整体上通过对基础图形要素进行有规律的排布而形成纹理图像,不过在生成过程中,对定义基础图形要素的基础图形函数施加随机噪音扰动项,从而得到在具有一定规律性基础上还携带平滑扰动噪音的纹理图像。这样生成的纹理图像更为平滑、自然,并且理论上可以达到无限的复杂程度,同时不会重复,有效的解决了现有生成方法生成的纹理图像风格单一、覆盖类型单一的问题,并且生成代价便宜。还可以将以上方式生成的纹理图像与文本图像相结合,进一步生成一种合成图像,并以之训练图像识别模型,尤其可用于训练具有文字识别任务的图像识别模型。这种合成图像还可以用作验证码,方便于大规模生成各种风格的验证码用于各种互联网应用,或以之训练验证码识别模型来提高识别模型的识别能力。
下面,本说明书对这种纹理图像的生成方法整体结构进行概述,然后结合具体的实施例和附图,对该方法进行更详细说明。
根据本说明书的一个或多个实施例,生成纹理图像的方法,整体上通过对基础图形要素施加一定噪声扰动,再进行排布而形成,这个过程可以概括性用公式表示为:
像素值=调整函数(基础图形函数+噪声扰动项) (1)
基础图形函数用于定义纹理图像中的基本纹理要素,即构成其纹理的基本图形要素,比如:一个年轮图案的纹理主要是由多个圆环构成,圆环是根据圆画出的,那么适合一个年轮纹理的基本图形要素可以是圆;再比如,棋格纹理的图案由多个方格构成,那么棋格纹理基本图形要素可以是正方形。相应的,在上述两个例子中,年轮纹理的基础图形函数应为一个在图像中定义圆的特征的函数,棋格纹理的基础图形函数应为一个在图像中定义正方形的特征的函数。
噪声扰动项用于给纹理图像的基本图形施加干扰。在一个实施例中,噪声扰动项可以通过在扰动函数上施加强度系数而得到。其中,扰动函数定义噪声的生成方式,强度系数主要用作调节扰动的强度。扰动函数的具体选择和作用,将在下文中结合实施例详细说明。
调整函数的作用为决定基本图形要素的布局方式,以形成整体纹理图像。比如:一个年轮的纹理主要是由多个圆环构成,其基本图形要素是圆,那么其调整函数可以定义为多个不同大小的同心圆的布局方式;再比如,棋格纹理的图案由多个方格构成,其基本图形要素是正方形,那么其调整函数可以定义为以多个同样大小的正方形组成一个矩形的布局方式。
如此,对于待生成图像中的各个位置,对其位置坐标施加公式(1)中的运算,即可得到该位置的像素值。根据各个位置的像素值,便可生成纹理图像。
下面结合实施例进行进一步描述。
图1为本说明书披露的一个实施例的一种纹理图像的生成方法的流程图。可以理解,该方法可以通过任何具有计算、处理能力的装置、设备、平台、设备集群来执行。如图1所示,纹理图像的生成过程至少包括以下步骤。
在步骤11,对于待生成图像中任意的第一位置,对该第一位置的坐标值施加基础图形函数,得到基础值。
对于生成图像而言,求得其每个位置(坐标)的图像数据,即像素值,是生成过程的主要步骤。在该步骤11中,第一位置用于指代待生成图像中的任意一个位置,或每个位置。对第一位置的坐标值施加的基础图形函数,用于定义待生成图像中的图形要素。根据需要生成的不同种类的图形,基础图形函数定义的图形要素亦不同,可以理解,这样基础图像函数可以有很多种。而基础值即为针对该位置坐标施加基础图形函数得到的定义所述图形要素的值。
在一个实施例中,图形要素为圆。在一个具体的实施方式中,基础图形函数为计算第一位置距离图像中心的距离比例,基础值为所述距离比例值。可以看到,该基础图像函数实际定义了图形要素圆的主要特征,或者说是一种定义图像要素圆的主要特征的一种方式。
此外,在步骤12,针对上述第一位置,至少根据噪声扰动函数,生成扰动噪声值。其目的是对基础图形要素施加一定噪声扰动,增加图像纹理的复杂程度。
一般而言,采用无随机性的数学公式生成的图像容易产生高度规律、缺乏随机性的纹理,这种纹理往往易于被模拟,因而用这种纹理生成的验证码也容易被机器识别。为此,在本说明书的实施例中,在基于图形要素进行排布生成纹理图案之前,在图形要素基础上添加一定的随机纹理。具体的,可以基于噪声函数来获取随机纹理。噪声函数在数学上通常为给定一个输入变量,生成一个值在一定范围内的随机量的函数。在图形学中则一般是输入一个坐标,得到一个在一定范围之间的值的函数,然后可以利用得到的值进行各种颜色(包括灰度)计算得到一些图像效果。本步骤中所述噪声扰动函数,即为一种噪音函数,用于生成图像任意一个位置上扰动噪声值。
在一个具体实施例中,上述噪声扰动函数为随机噪声函数。
进一步地,发明人在对上述问题的研究时发现,为了使得生成的图像更加流畅自然,也使得随机噪音函数带来的纹理更难与周边的图像纹理区分开来,从而更难被模拟,增加识别难度优选采用更为自然、平滑的噪音纹理生成方法。
为此,在一种实施方式中,使用一种平滑噪声扰动函数作为本步骤中的噪声扰动函数。在一个例子中,平滑噪声扰动函数基于噪声插值算法实现。
平滑噪声函数是这样一种噪音函数,其所产生的扰动噪声纹理中的像素值的变化趋势较为平缓,更接近自然图像的纹理。其原理是自然图像中往往包含了不同程度的细节,这些细节的成分并不是完全独立的,它们之间有一定的关联,因此它们的边缘变化较为平滑。反映到图像数据里,其特征就是像素点之间的数据变化较为连续,而不是突兀的。数学中常使用插值的方法用来平滑数值间的变化趋势。所谓插值,就是在若干己知的函数值之间插入未知的函数值,这些插入值是根据己知的函数值推算出来的。可以理解,这些插入值使得已知的函数值变多,由此函数值之间的细致变化更多被显现出来。具体在图像处理领域中,用插值算法来进行平滑处理的基本做法是根据各个已知位置的像素值计算已知位置之间的位置的像素值,由此通过计算获得图像中更多位置的像素值,使得更多的图像细节被表现,整体图像中的图形变化表现的更为平滑而不突兀。常常利用插值算法来进行平滑处理。比如,图像放大处理中根据放大前的图像的像素值计算扩大后的图像多出的像素点的像素值,就是一种利用插值算法的平滑操作。
需要注意的是,本实施例中的平滑噪音扰动函数中的“平滑”的含义是指对基本图形进行扰动的是平滑噪音,与有些文献中的通过平滑处理来去除图像中噪音的操作的含义是有区别的。
在一个更具体的实施例中,所述的噪声扰动函数基于的噪声插值算法是柏林插值算法。柏林插值算法是插值算法中的一种,其基本方法是对由任意的噪音函数生成的初始噪音图像的数据进行插值计算,然后利用该噪音图像的数据中插值点和周围网格多个顶点(二维图中是4个顶点)的距离向量和梯度向量的点积,计算该插值点的噪音值,由此可以得到一个更为连续和平滑的噪音图像,称之为柏林噪声图像。柏林噪声的优势是它的可伸缩性,即随着图像放大或采样增加(例如,相同数量的采样点,但面积较小)时,可以提供所需的任何细节级别。同时,柏林插值算法还具有计算较为简单且运算数据较快的特点。因此,基于柏林插值算法的平滑噪声扰动函数生成的复杂底纹,同时兼具随机性、平滑性、易于计算的特点,因此不容易被模拟,也更不容易被机器识别模型识破。
图2示出一个实施例中采用的柏林噪声和一般随机噪声的噪音图像对比图,其中,左边图像示出一个一般随机噪声图像,右边图像示出一般随机噪音图像经过柏林插值计算后得到的柏林噪音图像,直观上我们也容易看到相对于左边的单纯随机噪音图像,经过柏林插值计算的噪音图像具有更为自然、平滑的纹理特征。因此,当使用基于柏林插值计算的噪音对其他图像进行扰动时,其更容易被认为和基础图像一体的,更难被从其他图像识别出来。
可以理解,噪声扰动函数还可以是基于其他的噪音插值算法的,在另一个具体的实施例中,其噪声扰动函数为基于双边插值(Bilateral Interpolation)算法的平滑噪声扰动函数。噪声扰动函数基于不同的插值算法并不超出本发明精神和原则的范围,其得到的技术效果也未超出本发明的方法预使其达到的,均应属于本发明的保护范围之内。
根据一种实施方式,为了生成扰动噪声值,除了用噪声扰动函数控制噪声的生成方式之外,还在噪声扰动函数基础上施加扰动强度系数,以控制扰动强度。在该实施方式下,扰动噪声值通过以下方式确定:对第一位置的坐标值施加噪声扰动函数,得到第一函数值;在第一函数值的基础上施加扰动强度系数,得到扰动噪声值。施加扰动强度系数的作用是,在扰动函数的基础上,利用扰动强度系数作为放大或缩小扰动强度的手段。
在又一种实施方式中,噪声扰动函数还包括扰动尺寸参数,扰动尺寸参数的作用是用于定义通过扰动叠加层数确定的扰动尺寸。扰动的叠加层次越多,最后得到的图像纹理的细节越丰富。在一个例子里,噪声扰动函数根据第一位置的坐标值和扰动尺寸参数值,生成扰动噪声值。
接着,在步骤13,对于基础值和扰动噪声值的和值,施加调整函数,得到该第一位置的像素值,该调整函数定义图形要素形成纹理图案的布局方式。以上过程也可以概括性用公式表示为:
Bitmap Value(x,y)
=TuneFunc(GraphFunc(x,y)+turbpower
×TurbulenceFunc((x,y))
(2)
公式(2)中,x、y为图像中任意一点位置的坐标值,GraphFunc为基础图形函数,取得任意一个位置的基础值;TurblueneceFunc为扰动函数,turbpower为扰动强度系数,由扰动函数值和扰动强度系数的乘积可以得到任意一个位置的扰动噪声值;TuneFunc是定义了根据表示图形要素的基础值形成一个纹理图案的布局方式的函数,本说明书中称之为调整函数,所述调整函数根据基础值和扰动噪声值的和值,得到待生成图像的任一位置的像素值,BitmapValue即为待生成图像的任一位置的像素值。可以理解,由于调整函数据根据基本值(图形要素)和扰动噪声值的和值进行布局,其产生的结果-待生成图像,是对带有扰动噪音的图形要素进行一种布局而形成的图案。
最后,在步骤14,根据得到的待生成图像的各个位置的像素值,生成纹理图像。
下面通过一个具体的实施例,进一步描述图1所示方法的运用过程。
该实施例的目的是生成一个带有扰动噪音的年轮状纹理图像,其纹理图像生成方法包括以下过程。由于生成年轮纹理的图形要素为圆,可以确定图形要素圆的基础图形函数为计算第一位置距离图像中心的距离比例。此外,利用基于插值算法的平滑扰动函数计算各个图像位置的噪音扰动值。基于图形要素生成纹理的调整函数为,定义多个圆环的排布方式的函数。在更具体的一种实施方式中,图1中步骤11到步骤14过程也可以以如下的数学公式表示:
Figure BDA0002423724230000111
Figure BDA0002423724230000112
Figure BDA0002423724230000113
BitmapValue(x,y)=128×abs(sin(2×num_rings×dist×3.1415926)) (6)
其中,x、y为图像中任意一点位置的坐标值,width为图像宽度,height为图像高度,因此,xi、yi为图像中任意一点位置到图像中心的距离比例;turbpower为扰动强度系数,TurblueneceFuncX为一种平滑噪音扰动函数,turbsize为扰动尺寸参数,dist为基础值和扰动噪声值的和值,BitmapValue为像素值,abs为绝对值函数,num_rings为圆环圈数。
对该实施方式中的图像生成过程可作如下进一步描述:首先,使用公式(3)、公式(4)、公式(5)中的
Figure BDA0002423724230000121
项定义了基础图形函数,根据该基础图形函数和位置坐标得到基础值。接着,公式(5)中的turbpower和
Figure BDA0002423724230000122
分别为扰动强度系数和扰动函数,根据二者的乘积得到噪音扰动值,turbsize参数可被用于提供对扰动细节丰富程度的调节。需要注意的是,本例中TurbulenceFuncX由设定得到的是扰动噪音图像的像素值,因此将其除以256(图像灰阶级数)后再应用于扰动,其原因是本例中的基础值是一个距离比例值,在后续绘图过程中,利用该距离比例值确定像素点的灰度深浅(绘图的本质),为了使得扰动的程度合适,也将TurbulenceFunX得到的扰动像素值除以图像灰阶级数。然后,计算基础值和扰动噪声值的和值dist。将dist其代入一个具体的调整函数128×abs(sin(2×num_rings×dist×3.1415926)),计算得到待生成图像像素值。由前述可知,调整函数起到的作用为决定受到扰动的基础图形的布局方式,具体在该实施例中的调整函数的效果为根据基础图形元素圆和扰动值的和值dist、以及圆环圈数num_rings,布局一种具有扰动噪音的年轮(多个不同大小的同心圆环相嵌套)纹理。
在上述例子中,可以看到,在不同实施例中,根据具体需求,可以进一步设定噪音扰动函数和调整函数的额外参数以增加对图像生成的细节控制、或满足该种需要。还可以看到,调整函数和基础图形函数是有关联的,本实施的基础图形函数定义的是图像要素圆,但它的输出是一种比例关系,而不是直接的距离值,因此调整函数在布局时也是根据比例关系来布局。显然,为了达到预想(不超过也不小于)的扰动效果,相应的噪音扰动值的形式需要与基础图形函数值相对应,上例噪音扰动值也处理为一种比例关系(灰阶)。
可以理解,不考虑随机噪音带来的差异情况下,同样的基本图形纹理生成在不同的实施例中可以由不同的基础图形函数和调整函数的组合构成,但是其并不超出本发明精神和原则的范围,其得到的技术效果也未超出本发明的方法预使其达到的,均应属于本发明的保护范围之内。
进一步的,在该实施例中,调整参数可以取得不同的年轮效果。图3示出了该实施例中生成的多种参数不同取值的年轮纹理的效果图,如图3所示,调整多种参数的取值后,可以得到布局比例、扰动程度、细节丰富程度不同的图像效果。并且,由于噪音扰动函数基于的噪音插值算法的输出具有随机性的特点,所以即使在相同的基础图形函数和噪音扰动函数、以及相同的其他输入参数的条件下,产生的纹理图像虽然风格相同的但是仍有细节上的区别,参见图3中左3、左4纹理图,这两个纹理的生成参数相同,但仍有细微的差别。因此,在使用本说明披露的方法生成大量的纹理图像时,不会产生完全相同的纹理图像。
此外,在不同的实施例中,可以基于不同的基础图形函数和噪音扰动函数生成具有不同风格的纹理图像,图4示出若干实施例中生成的多种不同风格的纹理图像的效果图。
将图1所示方法生成的纹理图像和文本图像结合还可以生成一种合成图像,这种合成图像可进一步用于对包含文字的图像的识别模型的训练。图5示出一个实施例的一种合成图像的生成方法的流程图,可以理解,该方法可以通过任何具有计算、处理能力的装置、设备、平台、设备集群来执行。如图5所示,合成图像的生成过程至少包括以下步骤。
在步骤51,获取根据图1所示的方法生成的纹理图像。
然后,在步骤52,获取文本图像。
文本图像是其中具有文本信息的图像。在一个实施例中,文本为各种字符。
最后,在步骤53,至少基于纹理图像和文本图像的叠加,生成合成图像。
在一个实施例中,在合成图像之前,还获取了前景噪声图像;然后基于纹理图像,文本图像和前景噪声图像的叠加,生成合成图像。
在另一个实施例中,将纹理图像和文本图像相叠加,生成叠加图像;然后,对叠加图像进行畸变或滤镜处理,生成合成图像。
在一种实施方式中,记录合成图像中每个文本的位置信息,将其作为图像文本识别的文本位置标签数据。
具体的,在一个例子中,合成图像中的每个文本可以是经过了多次变换后得到的,所谓多次变换包括平移,拉伸,旋转,扭曲,畸变,滤镜中的若干种变换;在每次文本经过上述变换后,均记录合成图像中的每个文本在变换后的更新的位置信息。
更具体的,在一个例子中的文本为字符,每个文本的位置信息为包围住每个字符的最小矩形框的两个对角的坐标。例如,在一个具体例子中,每个文本的位置信息为包围住每个字符的最小矩形框的左上角及右下角的坐标。图6示出一个实施例的合成图像位置标签数据的示意图,如图6所示,在每次合成图像中的文本经过上述各种变换的一种或多种后,均记录其中每个字符新的位置信息,该位置信息就是如上所述的矩形框的坐标信息。
如前所述,专用于识别验证码图像的验证码识别模型是图像识别模型的一种具体化应用。验证码图像是一种旨在区分人与自动化计算机程序,广泛用于互联网应用安全验证的包含文本纹理的图像。现有的验证码生成方案的基本思想多数为将验证码拆分为为噪音图层/底纹图层和验证码文本图层,噪音图层通常为简单的噪音,最终将合并后的图层加入滤镜特效(如鱼眼、缩放、平移、旋转、拉伸、扭曲、虚化等)得到最终的验证码图形。其问题是,现有的噪音图层/底纹图层较为简单,呈现出较强的规律性,与自然的纹理差异较大,易于被图像识别模型识破。
为解决上述问题,在一种实施方式中,将图2所示合成图像方法生成的合成图像作为验证码图像。使用图2所示方法生成的合成图像作为验证码图像可以有效的解决上述技术问题。因为,上述合成图像方法中利用图1的方法生成的平滑的复杂纹理图像作为验证码底纹图层,可以解决现有验证码生成方法中底纹图层简单、与自然纹理差异大,因此容易与文本层分离的问题。此外,上述合成图像方法生成验证码图像还具有如下优势:利用图1所示方法,结合不同噪音插值算法和基本图形函数可以很方便地生成理论上各种复杂程度的图像,且大量生成中不会重复又成本低廉。
进一步,发明人在对上述问题的研究中发现,用以训练识别模型的文本图像,其常规标注数据仅包括正确的文本字符,而不包含字符位置信息。而发明人发现,如果在标注数据中包含文本的确切位置数据,可以更为有效地训练识别模型,提高其识别效果。前述图5所示方法的一个实施例中提供的,计算和记录合成图像中的文本经过扭曲变换后的位置标签,尤其可用于训练验证码识别模型中的字符定位,从而训练得到识别效果更好的验证码识别模型。利用这样的
实验数据证明,使用图5所示合成图像方法生成的合成图像作为验证码图像训练验证码识别器,明显提升了模型的识别精度和泛化能力,使该模型在多种不同类型验证码的网站上都取得了超高的识别精度,这是现有的别的生成方法产生的验证码所无法达到的。
根据另一方面的实施例,提供了一种纹理图像的生成装置,该装置可以部署在任何具有计算、处理能力的设备、平台或设备集群中。图7示出一个实施例的一种纹理图像的生成装置的结构性框图。如图7所示,该生成装置700包括:
基础图形单元71,配置为对于待生成图像中任意的第一位置,对该第一位置的坐标值施加基础图形函数,得到基础值;其中所述基础图形函数定义待形成的纹理图案中包含的图形要素;
扰动单元72,配置为针对上述第一位置,至少根据噪声扰动函数,生成扰动噪声值;
调整单元73,配置为对于所述基础值和所述扰动噪声值的和值,施加调整函数,得到该第一位置的像素值;所述调整函数定义所述图形要素形成纹理图案的布局方式;
纹理图像生成单元74,配置为根据各个位置的像素值,生成纹理图像。
在一个具体的实施例中,基础图形单元71可以对于待生成图像中任意的第一位置的坐标值,施加各种类型的基础图形函数,得到基础值。进一步,在一个例子中,基础图形单元71施加于第一位置的坐标值的基础图形函数为计算第一位置距离图像中心的距离比例。
在一个具体的实施例中,扰动单元72的具体配置为:对第一位置的坐标值施加所述噪声扰动函数,得到第一函数值;在第一函数值的基础上施加扰动强度系数,得到所述扰动噪声值。
进一步的,扰动单元72施加于第一位置的坐标值的噪声扰动函数为基于噪声插值算法的平滑噪声扰动函数。
更进一步的,扰动单元72施加于第一位置的坐标值的噪声扰动函数所基于的噪声插值算法为柏林插值算法。
在一个实施方式中,扰动单元72施加于第一位置的坐标值的噪声扰动函数还包括扰动尺寸参数,该扰动尺寸参数用于定义通过扰动叠加层数确定的扰动尺寸。
在一个具体的实施例中,调整单元73具体的配置为:生成纹理的图形要素为圆,生成纹理的基础图形函数为计算第一位置距离图像中心的距离比例,调整函数定义了多个圆环的排布,生成一个年轮纹理。
根据又一方面的实施例,提供了一种合成图像的生成装置,该装置可以部署在任何具有计算、处理能力的设备、平台或设备集群中。图8示出一个实施例的一种纹理图像的生成装置的结构性框图。如图8所示,该生成装置800包括:
第一获取单元81,配置为获取根据图7所示的装置700生成的纹理图像;
第二获取单元82,配置为获取文本图像;
合成单元83,配置为至少基于所述纹理图像和所述文本图像的叠加,生成合成图像。
在一个实施例中,所述生成装置800还包括:第三获取单元84,配置获取前景噪声图像;合成单元83的具体配置为基于所述纹理图像,所述文本图像和所述前景噪声图像的叠加,生成合成图像。
在另一个实施例中,所述生成装置800还包括:文本位置记录单元85,配置为记录所述合成图像中每个文本的位置信息,将其作为图像文本识别的文本位置标签数据。
在又一个实施例中,合成单元83的具体配置为:将所述纹理图像和所述文本图像相叠加,生成叠加图像;对所述叠加图像进行畸变或滤镜处理,生成所述合成图像。
进一步的,在一个具体的实施例中,合成单元83生成的合成图像中的每个文本可以经过多次变换得到,所述多次变换包括平移,拉伸,旋转,扭曲,畸变,滤镜中的若干种变换;文本位置记录单元85的具体配置为,记录每个文本在每次变换后的位置信息。在一个实施方式中,其中文本包括字符,每个文本的位置信息包括,包围住每个字符的最小矩形框的两个对角的坐标。在一个例子中,每个文本的位置信息为包围住每个字符的最小矩形框的左上角和右下角,如图6所示。
根据一种实施方式,生成装置800生成的合成图像为验证码图像。
根据另一方面的实施例,还提供一种计算机可读存储介质,其上存储有计算机程序,当所述计算机程序在计算机中执行时,令计算机执行图1所描述的方法。
根据再一方面的实施例,还提供一种计算设备,包括存储器和处理器,所述存储器中存储有可执行代码,所述处理器执行所述可执行代码时,实现图5所述的方法。
本领域技术人员应该可以意识到,在上述一个或多个示例中,本发明所描述的功能可以用硬件、软件、固件或它们的任意组合来实现。当使用软件实现时,可以将这些功能存储在计算机可读介质中或者作为计算机可读介质上的一个或多个指令或代码进行传输。
以上所述的具体实施方式,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施方式而已,并不用于限定本发明的保护范围,凡在本发明的技术方案的基础之上,所做的任何修改、等同替换、改进等,均应包括在本发明的保护范围之内。

Claims (17)

1.一种纹理图像的生成方法,所述方法包括:
对于待生成图像中任意的第一位置,对该第一位置的坐标值施加基础图形函数,得到基础值;其中所述基础图形函数定义待形成的纹理图案中包含的图形要素;
针对上述第一位置,至少根据噪声扰动函数,生成扰动噪声值;
对于所述基础值和所述扰动噪声值的和值,施加调整函数,得到该第一位置的像素值;所述调整函数定义所述图形要素形成纹理图案的布局方式;
根据各个位置的像素值,生成纹理图像。
2.根据权利要求1所述的方法,其中,所述至少根据噪声扰动函数,生成扰动噪声值,包括:
对所述第一位置的坐标值施加所述噪声扰动函数,得到第一函数值;
在所述第一函数值的基础上施加扰动强度系数,得到所述扰动噪声值。
3.根据权利要求1或2所述的方法,其中,所述噪声扰动函数为基于噪声插值算法的平滑噪声扰动函数。
4.根据权利要求3所述的方法,所述噪声差值算法包括柏林插值算法,双边插值算法。
5.根据权利要求1或2所述的方法,其中,所述噪声扰动函数还包括扰动尺寸参数,用于定义通过扰动叠加层数确定的扰动尺寸;
所述至少根据噪声扰动函数,生成扰动噪声值,包括:
利用所述噪声扰动函数,针对所述第一位置的坐标值和所述扰动尺寸参数的参数值,生成所述扰动噪声值。
6.根据权利要求1所述的方法,其中,所述图形要素为圆;所述基础图形函数包括,计算所述第一位置距离图像中心的距离比例;所述调整函数定义多个圆环的排布。
7.一种合成图像的生成方法,包括:
获取根据权利要求1所述的方法生成的纹理图像;
获取文本图像;
至少基于所述纹理图像和所述文本图像的叠加,生成合成图像。
8.根据权利要求7所述的方法,还包括:
获取前景噪声图像;
所述至少基于所述纹理图像和所述文本图像的叠加,生成合成图像,包括:基于所述纹理图像,所述文本图像和所述前景噪声图像的叠加,生成合成图像。
9.根据权利要求7所述的方法,其中,至少基于所述纹理图像和所述文本图像的叠加,生成合成图像,包括:
将所述纹理图像和所述文本图像相叠加,生成叠加图像;
对所述叠加图像进行畸变或滤镜处理,生成所述合成图像。
10.根据权利要求7所述的方法,还包括:记录所述合成图像中每个文本的位置信息,将其作为图像文本识别的文本位置标签数据。
11.根据权利要求10所述的方法,其中,所述合成图像中的每个文本经过多次变换得到,所述多次变换包括平移,拉伸,旋转,扭曲,畸变,滤镜中的若干种变换;
所述记录所述合成图像中每个文本的位置信息包括,记录每个文本在每次变换后的位置信息。
12.根据权利要求10所述的方法,其中所述文本包括字符,所述每个文本的位置信息包括,包围住每个字符的最小矩形框的两个对角的坐标。
13.根据权利要求7-12中任一项所述的方法,其中,所述合成图像为验证码图像。
14.一种纹理图案的生成装置,包括:
基础图形单元,配置为对于待生成图像中任意的第一位置,对该第一位置的坐标值施加基础图形函数,得到基础值;其中所述基础图形函数定义待形成的纹理图案中包含的图形要素;
扰动单元,配置为针对上述第一位置,至少根据噪声扰动函数,生成扰动噪声值;
调整单元,配置为对于所述基础值和所述扰动噪声值的和值,施加调整函数,得到该第一位置的像素值;所述调整函数定义所述图形要素形成纹理图案的布局方式;
纹理图像生成单元,配置为根据各个位置的像素值,生成纹理图像。
15.一种合成图像的生成装置,包括:
第一获取单元,配置为获取根据权利要求14所述的装置生成的纹理图像;
第二获取单元,配置为获取文本图像;
合成单元,配置为至少基于所述纹理图像和所述文本图像的叠加,生成合成图像。
16.一种计算机可读存储介质,其上存储有计算机程序,当所述计算机程序在计算机中执行时,令计算机执行权利要求1-13中任一项的所述的方法。
17.一种计算设备,包括存储器和处理器,其特征在于,所述存储器中存储有可执行代码,所述处理器执行所述可执行代码时,实现权利要求1-13中任一项所述的方法。
CN202010213843.5A 2020-03-24 2020-03-24 一种纹理图像和合成图像的生成方法和装置 Active CN111402124B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010213843.5A CN111402124B (zh) 2020-03-24 2020-03-24 一种纹理图像和合成图像的生成方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010213843.5A CN111402124B (zh) 2020-03-24 2020-03-24 一种纹理图像和合成图像的生成方法和装置

Publications (2)

Publication Number Publication Date
CN111402124A true CN111402124A (zh) 2020-07-10
CN111402124B CN111402124B (zh) 2022-05-17

Family

ID=71432815

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010213843.5A Active CN111402124B (zh) 2020-03-24 2020-03-24 一种纹理图像和合成图像的生成方法和装置

Country Status (1)

Country Link
CN (1) CN111402124B (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112101294A (zh) * 2020-09-29 2020-12-18 支付宝(杭州)信息技术有限公司 针对图像识别模型的增强训练方法及装置
CN112905977A (zh) * 2020-11-23 2021-06-04 重庆大学 一种基于图像风格转换的验证码生成方法
CN113012265A (zh) * 2021-04-22 2021-06-22 中国平安人寿保险股份有限公司 针式打印字符图像生成方法、装置、计算机设备和介质
CN113658064A (zh) * 2021-08-03 2021-11-16 网易(杭州)网络有限公司 纹理图像的生成方法、装置和电子设备
WO2023103548A1 (zh) * 2021-12-06 2023-06-15 广州汽车集团股份有限公司 一种汽车参数化纹理生成方法与系统、存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5872867A (en) * 1995-08-04 1999-02-16 Sarnoff Corporation Method and apparatus for generating image textures
US6879323B1 (en) * 1999-10-04 2005-04-12 Sharp Kabushiki Kaisha Three-dimensional model generation device, three-dimensional model generation method, and recording medium for storing the three-dimensional model generation method
KR101200378B1 (ko) * 2011-08-30 2012-11-12 인하대학교 산학협력단 국소 각 위상을 이용한 강건한 텍스처 특징 추출 방법
CN109523611A (zh) * 2018-11-28 2019-03-26 百度在线网络技术(北京)有限公司 验证码图片生成方法和装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5872867A (en) * 1995-08-04 1999-02-16 Sarnoff Corporation Method and apparatus for generating image textures
US6879323B1 (en) * 1999-10-04 2005-04-12 Sharp Kabushiki Kaisha Three-dimensional model generation device, three-dimensional model generation method, and recording medium for storing the three-dimensional model generation method
KR101200378B1 (ko) * 2011-08-30 2012-11-12 인하대학교 산학협력단 국소 각 위상을 이용한 강건한 텍스처 특징 추출 방법
CN109523611A (zh) * 2018-11-28 2019-03-26 百度在线网络技术(北京)有限公司 验证码图片生成方法和装置

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112101294A (zh) * 2020-09-29 2020-12-18 支付宝(杭州)信息技术有限公司 针对图像识别模型的增强训练方法及装置
US11403487B2 (en) 2020-09-29 2022-08-02 Alipay (Hangzhou) Information Technology Co., Ltd. Enhanced training method and apparatus for image recognition model
CN112905977A (zh) * 2020-11-23 2021-06-04 重庆大学 一种基于图像风格转换的验证码生成方法
CN113012265A (zh) * 2021-04-22 2021-06-22 中国平安人寿保险股份有限公司 针式打印字符图像生成方法、装置、计算机设备和介质
CN113012265B (zh) * 2021-04-22 2024-04-30 中国平安人寿保险股份有限公司 针式打印字符图像生成方法、装置、计算机设备和介质
CN113658064A (zh) * 2021-08-03 2021-11-16 网易(杭州)网络有限公司 纹理图像的生成方法、装置和电子设备
WO2023103548A1 (zh) * 2021-12-06 2023-06-15 广州汽车集团股份有限公司 一种汽车参数化纹理生成方法与系统、存储介质

Also Published As

Publication number Publication date
CN111402124B (zh) 2022-05-17

Similar Documents

Publication Publication Date Title
CN111402124B (zh) 一种纹理图像和合成图像的生成方法和装置
Wang et al. Efficient example-based painting and synthesis of 2d directional texture
JP6435740B2 (ja) データ処理システム、データ処理方法およびデータ処理プログラム
JP4097742B2 (ja) 関数演算プロセッサ制御マシンの操作方法
Liu et al. Unsupervised sketch to photo synthesis
CN105069754B (zh) 基于在图像上无标记增强现实的系统和方法
CN105023253A (zh) 基于视觉底层特征的图像增强方法
CN114746904A (zh) 三维人脸重建
Gerl et al. Interactive example-based hatching
CN106780701A (zh) 非均匀纹理图像的合成控制方法、装置、存储介质及设备
KR102553146B1 (ko) 영상 처리 장치 및 그 동작방법
Yao et al. Manga vectorization and manipulation with procedural simple screentone
Feng et al. PRIF: Primary ray-based implicit function
CN111179193B (zh) 基于DCNNs和GANs的皮肤镜图像增强和分类方法
CN107369185A (zh) 一种基于图像的油画风格化方法
CN116051705B (zh) 模型训练方法、3d服装渲染方法、电子设备及存储介质
US20220157030A1 (en) High Quality AR Cosmetics Simulation via Image Filtering Techniques
CN108460413A (zh) 图像处理方法、神经网络的训练方法、装置以及设备
Kovács et al. Painterly rendering controlled by multiscale image features
CN102938156B (zh) 一种基于积分图像的面状注记配置方法
Chang et al. Artistic painting style transformation using a patch-based sampling method
CN109712094A (zh) 图像处理方法及装置
Pan et al. Salient structural elements based texture synthesis
CN116363329B (zh) 基于CGAN与LeNet-5的三维图像生成方法及系统
CN107993195A (zh) 顾及形变控制的小屏幕变比例尺交通路线图生成方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 40033192

Country of ref document: HK

GR01 Patent grant
GR01 Patent grant