CN114332895A - 文本图像合成方法、装置、设备、存储介质和程序产品 - Google Patents
文本图像合成方法、装置、设备、存储介质和程序产品 Download PDFInfo
- Publication number
- CN114332895A CN114332895A CN202111614727.5A CN202111614727A CN114332895A CN 114332895 A CN114332895 A CN 114332895A CN 202111614727 A CN202111614727 A CN 202111614727A CN 114332895 A CN114332895 A CN 114332895A
- Authority
- CN
- China
- Prior art keywords
- image
- initial
- operator
- processing
- region
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Processing Or Creating Images (AREA)
Abstract
本申请涉及一种文本图像合成方法、装置、设备、存储介质和程序产品。所述方法包括:获取模板图像,所述模板图像携带有标注信息;根据所述标注信息中的内容信息生成初始文本区域;根据局部区域处理规则对所述初始文本区域进行处理得到目标文本区域;根据所述标注信息中的位置信息将所述模板图像和所述目标文本区域融合生成初始文本图像。采用本方法能够快速且容易进行文本图像合成。
Description
技术领域
本申请涉及光学字符识别技术领域,特别是涉及一种文本图像合成方法、装置、设备、存储介质和程序产品。
背景技术
随着人工智能技术的发展,出现了光学字符识别(Optical CharacterRecognition,OCR)技术。光学字符识别OCR是指对包含文本资料的图像资料文件(可简称为文本图像)进行分析识别处理,获取文字信息的技术。在金融场景中包括多种文本图像,例如票据、文档、卡证、表格等不同的具有金融特色的文本图像。这些文本图像具有文字布局不定,字段的字体、颜色、长短、语料不同,文字所处的背景复杂多样的特点。
在针对具有金融特色的文本图像进行OCR模型训练时,需要准备与真实文本图像的数据特征相同或相似的数据集。然而,现有的与真实文本图像的数据特征相同或相似的数据集的数量不能满足训练要求。如果由人工去实际拍摄足够数量的真实文本图像则又会耗费大量的人力和时间成本,且对真实文本图像进行人工标注的代价也很高昂。
为了快速且容易的获取到足够数量的文本图像,可以采用合成文本图像的方式,但如何合成效果佳的文本图像是有待解决的问题。
发明内容
基于此,有必要针对上述技术问题,提供一种能够快速且容易的文本图像合成方法、装置、计算机设备、计算机可读存储介质和计算机程序产品。
第一方面,本申请提供了一种文本图像合成方法,所述方法包括:获取模板图像,所述模板图像携带有标注信息;根据所述标注信息中的内容信息生成初始文本区域;根据局部区域处理规则对所述初始文本区域进行处理得到目标文本区域;根据所述标注信息中的位置信息将所述模板图像和所述目标文本区域融合生成初始文本图像。
在其中一个实施例中,所述根据局部区域处理规则对所述初始文本区域进行处理得到目标文本区域,包括:根据基础图像算子、盖章字体效果算子、针式打印字体效果算子和字迹斑驳效果算子中的至少一个对所述初始文本区域进行处理,得到目标文本区域;所述基础图像算子是指对所述初始文本区域进行区域位置操作的算子;所述盖章字体效果算子是指将所述初始文本区域中的文字处理成盖章字体的算子;所述针式打印字体效果算子是指将所述初始文本区域中的文字处理成针式打印字体的算子;所述字迹斑驳效果算子是指将所述初始文本区域中的文字处理成字迹斑驳字体的算子。
在其中一个实施例中,所述初始文本区域被所述盖章字体效果算子进行处理的过程,包括:从所述初始文本区域中随机选取像素点,并将所述像素点赋值为所述初始文本区域的背景颜色;对赋值后的初始文本区域进行图像膨胀操作和图像腐蚀操作,得到目标文本区域。
在其中一个实施例中,所述初始文本区域被所述针式打印字体效果算子进行处理的过程,包括:在所述初始文本区域上叠加带有所述初始文本区域的背景颜色的网格;通过所述盖章字体效果算子对叠加网格后的初始文本区域进行处理,得到目标文本区域。
在其中一个实施例中,所述初始文本区域被所述字迹斑驳效果算子进行处理的过程,包括:生成高斯分布的矩阵,所述矩阵的尺寸等于所述初始文本区域的尺寸;获取预设值;建立所述矩阵的各元素与所述初始文本区域的像素点的映射关系,并将所述矩阵中小于所述预设值的元素对应像素点随机进行亮度的调节;对进行亮度调节后的初始文本区域进行图像处理操作,得到目标文本区域。
在其中一个实施例中,所述方法还包括:根据整体图像处理规则对所述初始文本图像进行处理得到目标文本图像。在其中一个实施例中,所述根据整体图像处理规则对所述初始文本图像进行处理得到目标文本图像,包括:根据图像加噪操作、局部变淡算子、加盖印章算子和添加水印算子中的至少一个对所述初始文本图像进行处理,得到目标文本图像;所述局部变淡算子是指将所述初始文本图像进行亮度处理的算子;所述加盖印章算子是指在所述初始文本图像中添加印章图像的算子;所述添加水印算子是指在所述初始文本图像中添加水印图像的算子。
在其中一个实施例中,所述初始文本图像被所述局部变淡算子进行处理的过程,包括:获取初始文本图像的变淡区域和中心区域;获取所述变淡范围内的像素的亮度最大值;根据所述变淡区域、所述中心区域和所述亮度最大值对所述初始文本图像进行处理,得到目标文本图像。
在其中一个实施例中,所述初始文本图像被所述加盖印章算子对所述初始文本图像进行处理的过程,包括:获取所述印章图像;根据所述印章图像和所述初始文本图像进行融合处理,得到目标文本图像。
在其中一个实施例中,所述初始文本图像被所述添加水印算子对所述初始文本图像进行处理的过程,包括:获取初始文字区域,并对所述初始文字区域进行图像位置处理操作;将所述处理后的初始文字区域与所述初始文本图像进行融合,得到目标文本图像。
在其中一个实施例中,还包括:根据所述模板图像中的标注信息从所述目标文本图像中提取目标文本图像区域。
在其中一个实施例中,所述获取模板图像,包括:获取模板图像对应的配置文件;所述获取模板图像对应的配置文件之前,包括:获取样本图像,并对所述样本图像的目标区域进行处理得到对应的模板图像;对所述模板图像中的所述目标区域进行标注,以得到标注信息,所述标注信息包括模板图像名称、目标文本区域融合位置、文本区域类别中的至少一个;根据所述标注信息生成所述模板图像对应的配置文件。
在其中一个实施例中,所述根据标注信息生成初始文本区域,包括:提取所述配置文件中各个目标区域对应的标注信息,并根据所述标注信息生成初始文本区域。
第二方面,本申请还提供了一种文本图像合成装置,所述装置包括:获取模块,用于获取模板图像,所述模板图像中包括标注信息;初始区域生成模块,用于根据标注信息和接收的配置指令生成初始文本区域;初始区域处理模块,用于根据局部区域处理规则对所述初始文本区域进行处理得到目标文本区域;融合模块,用于根据所述标注信息中的位置信息将所述模板图像和所述目标文本区域融合生成初始文本图像。
第三方面,本申请还提供了一种计算机设备。所述计算机设备包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现上述的方法的步骤。
第四方面,本申请还提供了一种计算机可读存储介质。所述计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述的方法的步骤。
第五方面,本申请还提供了一种计算机程序产品。所述计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现上述的方法的步骤。
上述文本图像合成方法、装置、设备、存储介质和程序产品,通过模板图像与标注信息生成初始文本区域,通过局部区域处理规则对初始文本区域进行处理获得目标文本区域,根据目标文本区域与模板图像的融合生成初始文本图像。通过模板图像可以生成多个对应的初始文本图像,若模板图像的种类不同,则可以根据不同种类的模板图像生成对应的初始文本图像,以快速且容易的获取到足够数量的文本图像。通过局部区域处理规则对初始文本区域进行处理,使得生成的目标文本区域中的文字特点与真实文字更相似。
附图说明
图1为一个实施例中文本图像合成方法的应用环境图;
图2为一个实施例中文本图像合成方法的流程示意图;
图3为一个实施例中文本图像合成方法中的模板图像的流程示意图;
图4为一个实施例中文本图像合成方法中的目标文本区域的示意图;
图5为一个实施例中文本图像合成方法中的膨胀操作的示意图;
图6为一个实施例中文本图像合成方法中的腐蚀操作的示意图;
图7为另一个实施例中文本图像合成方法中的目标文本区域的示意图;
图8为再一个实施例中文本图像合成方法中的目标文本区域的示意图;
图9为一个实施例中文本图像合成方法中的目标文本图像的示意图;
图10为另一个实施例中文本图像合成方法中的目标文本图像的示意图;
图11为一个实施例中文本图像合成方法的步骤示意图;
图12为一个实施例中文本图像合成方法中的json配置文件的示意图;
图13为一个实施例中文本图像合成方法中的2点标注的示意图;
图14为一个实施例中文本图像合成方法中的4点标注的示意图;
图15为一个实施例中文本图像合成装置的结构框图;
图16为一个实施例中计算机设备的内部结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
本申请实施例提供的文本图像合成方法,可以应用于如图1所示的应用环境中。其中,终端102通过网络与服务器104进行通信。数据存储系统可以存储服务器104需要处理的数据。数据存储系统可以集成在服务器104上,也可以放在云上或其他网络服务器上。终端102获取模板图像,模板图像携带有标注信息;根据标注信息中的内容信息生成初始文本区域;根据局部区域处理规则对初始文本区域进行处理得到目标文本区域;根据标注信息中的位置信息将模板图像和目标文本区域融合生成初始文本图像。能够快速且容易的进行文本图像合成。终端102获取的模板图像可以是用户输入的,也可以为存储在服务器104种的模板图像,终端102生成的初始模板图像也可以存储在服务器104。
其中,终端102可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑、物联网设备和便携式可穿戴设备,物联网设备可为智能音箱、智能电视、智能空调、智能车载设备等。便携式可穿戴设备可为智能手表、智能手环、头戴设备等。服务器104可以用独立的服务器或者是多个服务器组成的服务器集群来实现。
在一个实施例中,如图2所示,提供了一种文本图像合成方法,以该方法应用于图1中的终端102为例进行说明,包括以下步骤:
步骤202,获取模板图像,模板图像携带有标注信息。
其中,模板图像是根据样本图像获取,例如,终端将营业执照的样本图像中的某些区域删除生成营业执照对应的模板图像,模板图像包括但不限于营业执照对应的模板图像、银行票据对应的模板图像、身份卡证对应的模板图像等。其中,标注信息包括但不限于样本图像中被删除区域的位置信息、样本图像的属性、被删除区域内的文字的属性。
具体地,终端获取样本图像,将样本图像中的内容进行处理,将处理后的样本图像作为模板图像,并将样本图像的属性和样本图像中被处理区域的位置信息及被处理区域中的文字属性作为模板图像的标注信息的具体内容信息。若终端对同一样本图像中的多个区域进行处理,则样本图像的属性和各被处理区域对应的位置信息及被处理区域中的文字属性依次作为标注信息的具体内容信息进行存储。
步骤204,根据标注信息中的内容信息生成初始文本区域。
其中,初始文本区域为根据模板图像的标注信息生成初始文本区域的文字并确定对应的尺寸。
具体地,终端根据标注信息中的内容信息,即根据模板图像中样本图像的属性、被处理区域的位置信息和被处理区域中的文字属性生成初始文本区域。
在具体的实施过程中,以图3中的营业执照为例,终端将样本图像中的名称对应的内容删除,并标记删除内容的位置、删除内容的字体属性以及样本图像的属性作为标注信息。终端获取样本图像的属性,样本图像的属性包括但不限于被删除内容对应的是否有锯齿、是否跳过、文本区域类别和语料的生成规则。其中,字体属性包括但不限于字体的类型、字号、样式、颜色、粗细。终端根据删除内容的位置确定初始文本区域中的字段的起始位置。终端根据获取的是否有锯齿对初始文本区域中的字段的锯齿情况进行限定,根据是否跳过来确定删除内容的位置是否生成对应的初始文本区域,根据文本区域类别确定初始文本区域的处理规则,通过该处理规则使得到的文字与真实文字相似,根据语料的生成规则生成初始文本区域的文字内容。根据上述生成的初始文本区域的文字内容确定初始文本区域的尺寸。其中,语料的生成规则可以在配置文件中指定语料库名,在语料生成时随机在指定的语料库中选取一条语料作为文字内容;语料的生成规则也可以通过正则规则来指定文字格式,如随机生成18位仅包含数字和字母的编号。终端根据字体属性对初始文本区域内生成的文字的属性做相应的限定。
步骤206,根据局部区域处理规则对初始文本区域进行处理得到目标文本区域。
其中,局部区域处理规则为对初始文本区域中的文字进行处理的规则,得到的文字与真实文字相似。
终端根据局部处理规则对初始文本区域进行处理,得到的文字与真实文字相似,即为目标文本区域。
步骤208,根据标注信息中的位置信息将模板图像和目标文本区域融合生成初始文本图像。
终端根据标注信息中的位置信息将目标文本区域与模板图像通过泊松图像融合方法,在目标文本区域与模板图像融合过程中引入梯度信息,生成初始文本图像。
上述文本图像合成方法中,通过模板图像与标注信息生成初始文本区域,通过局部区域处理规则对初始文本区域进行处理获得目标文本区域,根据目标文本区域与模板图像的融合生成初始文本图像。通过模板图像可以生成多个对应的初始文本图像,若模板图像的种类不同,则可以根据不同种类的模板图像生成对应的初始文本图像,以快速且容易的获取到足够数量的文本图像。通过局部区域处理规则对初始文本区域进行处理,使得生成的目标文本区域中的文字特点与真实文字更相似。
上述实施例中根据局部区域处理规则对初始文本区域进行处理得到目标文本区域的一种实施方式,包括:根据基础图像算子、盖章字体效果算子、针式打印字体效果算子和字迹斑驳效果算子中的至少一个对初始文本区域进行处理,得到目标文本区域;基础图像算子是指对初始文本区域进行区域位置操作的算子;盖章字体效果算子是指将初始文本区域中的文字处理成盖章字体的算子;针式打印字体效果算子是指将初始文本区域中的文字处理成针式打印字体的算子;字迹斑驳效果算子是指将初始文本区域中的文字处理成字迹斑驳字体的算子。
具体地,终端通过初始文本区域对应的标注信息获取旋转角度和偏移范围,根据基础图像算子对初始文本区域的位置按旋转角度和偏移范围进行旋转、偏移处理,得到目标文本区域。其中,旋转角度和偏移范围可以是指定的值,也可以在一定范围内随机生成。终端根据盖章字体效果算子对初始文本区域中的文字进行处理,形成盖章字体格式的文字,得到具有盖章字体格式的目标文本区域。终端根据针式打印字体效果算子对初始文本区域中的文字进行处理,形成针式打印字体的文字,得到具有针式打印字体的目标文本区域。终端根据字迹斑驳效果算子对初始文本区域中的文字进行处理,形成字迹斑驳的文字,得到具有字迹斑驳效果的目标文本区域。终端可以对初始文本区域进行至少一个算子的处理。终端可以通过模板图像中的标注信息中的文本区域类别属性确定需要执行的算子类型及数目。
上述文本图像合成方法中,根据基础图像算子、盖章字体效果算子、针式打印字体效果算子和字迹斑驳效果算子中的至少一个对初始文本区域进行处理,使得到的目标文本区域中的文字特点与真实文字特点更相似。
在一个实施例中,初始文本区域被盖章字体效果算子进行处理的过程,包括:从初始文本区域中随机选取像素点,并将像素点赋值为初始文本区域的背景颜色;对赋值后的初始文本区域进行图像膨胀操作和图像腐蚀操作,得到目标文本区域。
具体地,终端多次从初始文本区域中随机选取像素点,并为上述随机选取的像素点进行赋值,所赋值为背景颜色。其中,背景颜色为初始文本区域内非文字部分的颜色。终端对赋值后的初始文本区域以叠加的方式进行图像膨胀操作和图像腐蚀操作的叠加操作,得到目标文本区域,目标文本区域中的文字效果与盖章字体效果相同,如图4所示。可选地,图像膨胀操作通过图5进行说明,图5的左边是被处理的图象X,图像X为二值图象,图像膨胀操作的对象为图像X中的黑点;中间是结构元素B,结构元素B中标有origin的点是中心点,即当前处理元素的位置;右边是进行膨胀操作后的结果。膨胀操作的具体过程为,终端将结构元素B在图像X上进行卷积操作,判断结构元素B的中心点与图像X的黑点是否重合,若结构元素B的中心点与图像X的黑点重合,则将图像X上与结构元素B上的黑点重合的位置赋值为黑点;右边是膨胀后的结果。可选地,图像腐蚀操作通过图6进行说明,图6的左边是被处理的图象X,图像X为二值图象,图像腐蚀操作的对象为图像X中的黑点;中间是结构元素B,结构元素B中标有origin的点是中心点,即当前处理元素的位置;右边是进行腐蚀操作后的结果。腐蚀操作的具体过程为,终端将结构元素B在图像X上进行卷积操作,判断结构元素B的所有黑点与图像X的黑点是否重合,若结构元素B的所有黑点与图像X的黑点重合,则将图像X上与结构元素B上的中心点重合的位置赋值为黑点;若结构元素B的所有黑点与图像X的黑点不完全重合,则将图像X上与结构元素B上的中心点重合的位置赋值为白点;右边是腐蚀后的结果。
上述文本图像合成方法,通过从初始文本区域中随机选取像素点,并将像素点赋值为初始文本区域的背景颜色,造成初始文本区域中的文字具有一定程度的颜色缺失,再通过对赋值后的初始文本区域进行图像膨胀操作和图像腐蚀操作,使得初始文本区域中的文字笔划间具有墨迹不规则地融合的特点,从而可以模拟盖章时文字的墨迹所具有的晕染效果,形成目标文本区域。
在一个实施例中,初始文本区域被针式打印字体效果算子进行处理的过程,包括:在初始文本区域上叠加带有初始文本区域的背景颜色的网格;通过盖章字体效果算子对叠加网格后的初始文本区域进行处理,得到目标文本区域。
具体地,终端获取初始文本区域中非文字部分的颜色作为背景颜色,终端根据背景颜色制定颜色为背景颜色的网格,并将上述颜色为背景颜色的网格叠加在初始文本区域上形成网格文本区域。终端多次从网格文本区域中随机选取像素点,并为上述随机选取的像素点进行赋值,所赋值为背景颜色。其中,背景颜色为网格文本区域内非文字部分的颜色。终端对赋值后的网格文本区域以叠加的方式进行图像膨胀操作和图像腐蚀操作的叠加操作,得到目标文本区域,目标文本区域中的文字效果与针式打印字体效果相同,如图7所示。
上述文本图像合成方法,通过在初始文本区域上叠加带有初始文本区域的背景颜色的网格模拟针式打印字体的点阵效果,通过盖章字体效果算子对叠加网格后的初始文本区域进行处理,使得初始文本区域中文字的点阵不规则地融合或断开,从而模拟墨迹晕染形成目标文本区域,使得目标文本区域中的文字效果更加贴近真实场景中针式打印字体效果。
在一个实施例中,初始文本区域被字迹斑驳效果算子进行处理的过程,包括:生成高斯分布的矩阵,矩阵的尺寸等于初始文本区域的尺寸;获取预设值;建立矩阵的各元素与初始文本区域的像素点的映射关系,并将矩阵中小于预设值的元素对应像素点随机进行亮度的调节;对进行亮度调节后的初始文本区域进行图像处理操作,得到目标文本区域。
其中,预设值为高斯分布矩阵的阈值,该阈值是根据经验确定的,阈值越大,目标文本区域中的文字的斑块的平均面积就越大,阈值的确定需要进行多调整,直到目标文本区域中的文字显示效果与模板图像对应的样本图像中的文字显示效果相似度达到预设要求。本实施例并不对预设值做限定,根据目标文本区域中的文字显示效果与模板图像对应的样本图像中的文字显示效果相似度的预设要求确定。
具体地,终端获取初始文本区域的尺寸和高斯分布矩阵的阈值,终端根据初始文本区域的像素点和初始文本区域的尺寸生成尺寸相同的高斯分布矩阵,建立高斯分布矩阵的各元素与初始文本区域的像素点的映射关系,通过阈值对高斯分布矩阵中的各元素进行筛选,将元素的值小于预设值的元素对应的初始文本区域的像素点的亮度值随机的进行增加或减小调节,并对进行亮度调节后的初始文本区域进行高斯模糊柔操作和强边缘操作,得到目标文本区域,目标文本区域中的文字效果与字迹斑驳字体效果相同,如图8所示。
上述文本图像合成方法,通过建立矩阵的各元素与初始文本区域的像素点的映射关系,并将矩阵中小于预设值的元素对应像素点随机进行亮度的调节;以及对进行亮度调节后的初始文本区域进行图像处理操作,使得目标文本区域中的文字颜色具有深深浅浅字迹斑驳的效果。
在一个实施例中,根据整体图像处理规则对初始文本图像进行处理得到目标文本图像。
其中,整体图像处理规则为对初始文本区域进行处理的规则,得到目标文本图像与真实文本图像相似。
终端根据整体图像处理规则对初始文本区域进行处理,得到与真实文本图像相似的目标文本图像。
上述文本图像合成方法,根据整体图像处理规则对初始文本图像进行处理得到与真实文本图像相似的目标文本图像。
上述实施例中根据整体图像处理规则对初始文本图像进行处理得到目标文本图像的一种实施方式,包括:根据图像加噪操作、局部变淡算子、加盖印章算子和添加水印算子中的至少一个对初始文本图像进行处理,得到目标文本图像;局部变淡算子是指将初始文本图像进行亮度处理的算子;加盖印章算子是指在初始文本图像中添加印章图像的算子;添加水印算子是指在初始文本图像中添加水印图像的算子。
具体地,终端根据图像加噪操作对初始文本图像进行椒盐噪声、高斯模糊、运动模糊等加噪操作中的至少一种操作。终端根据局部变淡算子对初始文本图像进行亮度处理,得到局部变淡的目标文本图像;终端根据加盖印章算子对初始文本图像中添加印章图像,得到添加印章图像的目标文本图像;终端根据添加水印算子对初始文本图像中添加水印图像,得到添加水印图像的目标文本图像;终端可以根据样本图像包括的真实场景数据对初始文本图像进行至少一个算子的处理。上述至少一个或至少一种可以是一种,也可以是两种及两种以上的随机组合。
上述文本图像合成方法,根据图像加噪操作、局部变淡算子、加盖印章算子和添加水印算子中的至少一个对初始文本图像进行处理,使得到的目标文本图像的特点与真实文本图像更相似。
在一个实施例中,初始文本图像被局部变淡算子进行处理的过程,包括:获取初始文本图像的变淡区域和中心区域;获取变淡范围内的像素的亮度最大值;根据变淡区域、中心区域和亮度最大值对初始文本图像进行处理,得到目标文本图像。
其中,变淡区域为初始文本图像中需要调整亮度的区域,中心区域位于变淡区域内,具体地,变淡区域和中心区域的位置可以根据终端预设的规则自动生成,也可以通过用户指定。亮度最大值(extr)可以根据终端预设的规则自动生成,也可以通过用户指定,是最大的亮度系数,该最大亮度系数根据实际想达到的效果进行指定或自动生成设置,亮度系数越大图像越亮,图9中最大的亮度系数为2.0。
具体地,终端获取初始文本图像的变淡区域和中心区域,获取变淡范围内的像素的亮度最大值。终端将中心区域的像素点的亮度与最大亮度系数相乘,将变淡区域内中心区域外的像素点的亮度与预设亮度系数相乘,得到目标文本图像,目标文本图像与真实图像具有相同的局部变淡的特点。预设亮度系数的值与变淡区域内中心区域外的像素点从中心区域到变淡区域的距离成线性关系,变淡区域内中心区域外的像素点距离中心区域的距离越大,亮度系数的值越小,直至减小到1。预设亮度系数的取值范围为[1,extr]。
上述文本图像合成方法,根据变淡区域、中心区域和亮度最大值对初始文本图像进行处理,形成逐渐变淡的效果,得到目标文本图像。
在一个实施例中,初始文本图像被加盖印章算子对初始文本图像进行处理的过程,包括:获取印章图像;根据印章图像和初始文本图像进行融合处理,得到目标文本图像。
具体地,终端获取印章图像和印章图像在初始文本图像的位置,其中,印章图像在初始文本图像的位置存储在对应的模板图像的标注信息。终端通过泊松融合方法在印章图像在初始文本图像的位置上将印章图像和初始文本图像进行融合,得到目标文本图像,目标文本图像与真实图像具有相同的带有印章图像的特点。
上述文本图像合成方法,终端根据印章图像和初始文本图像进行融合处理,形成与真实图像相似的带有印章图像的目标文本图像。
在一个实施例中,初始文本图像被添加水印算子对初始文本图像进行处理的过程,包括:获取初始文字区域,并对初始文字区域进行图像位置处理操作;将处理后的初始文字区域与初始文本图像进行融合,得到目标文本图像。
其中,初始文字区域为水印文本内容区域,水印文本内容区域的尺寸可以根据需求预先设置,水印文本内容区域的文字内容和文字特点的生成方式可以但不局限于与初始文本区域中的文字生成方法相同。
具体地,终端获取初始文字区域和初始文字区域在初始文本图像的旋转角度,其中,初始文字区域在初始文本图像的旋转角度存储在对应的模板图像的标注信息。终端通过初始文字区域在初始文本图像的旋转角度对初始文字区域进行旋转,并将旋转后的初始文字区域与初始文本图像进行泊松图像融合。可选地,终端多次将旋转后的初始文字区域与初始文本图像进行泊松图像融合。可选地,终端将初始文本区域从初始文本图像的左上角以预设的距离偏移至右下角,直至超出初始文本图像的尺寸范围,如图10所示。
上述文本图像合成方法,终端将处理后的初始文字区域与初始文本图像进行融合,形成与真实图像相似的带有水印图像的目标文本图像。
在一个实施例中,根据提取位置信息从目标文本图像中提取目标文本图像区域,提取位置信息为目标文本区域融合成初始文本图像后目标文本区域的位置。
具体地,终端根据提取位置信息即目标文本区域融合成初始文本图像后目标文本区域的位置,对目标文本图像进行切片,将切片后提取为位置信息内的目标文本图像提取为目标文本图像区域。将上述目标文本图像区域进行单独存储。可选地,在生成目标文本图像的同时,伴随生成目标文本图像的标注文件,标注文件中包含目标文本图像中所有文本区域的位置信息(OCR检测模型训练数据)、文本区域的类别信息(OCR切片分类模型训练数据)、文本区域的文本内容(OCR识别模型训练数据),终端根据目标文本图像的标注文件中记录的位置信息进行切片操作。上述文本图像合成方法,根据模板图像中的标注信息从目标文本图像中提取目标文本图像区域,可以单独获取目标文本图像区域,满足不同维度的文本图像存储方式。
上述实施例中模板图像的获取过程在本实施例中进行说明,获取模板图像,包括:获取模板图像对应的配置文件;获取模板图像对应的配置文件之前,包括:获取样本图像,并对样本图像的目标区域进行处理得到对应的模板图像;对模板图像中的目标区域进行标注,以得到标注信息,标注信息包括模板图像名称、目标文本区域融合位置、文本区域类别中的至少一个;根据标注信息生成模板图像对应的配置文件。
其中,样本图像为真实文本图像,目标区域为初始文本图像中的目标文本区域对应的位置。文本区域类别为样本图像的目标区域的文字类别,例如,文字类别为盖章字体、针式打印字体、字迹斑驳等。
具体地,终端获取样本图像,并对样本图像中的目标区域进行处理得到对应的模板图像。终端对模板图像的目标区域的位置即目标文本区域融合位置、模板图像名称、目标区域的文字类别、目标区域的文字属性、样本图像的属性即样本图像的水印旋转范围、样本图像的水印属性及位置、样本图像的盖章图像属性及位置、样本图像变淡范围、中心范围以及最大亮度系数中的至少一个进行标注并生成标注信息。并根据上述标注信息成对应的配置文件。
上述文本图像合成方法,根据标注信息生成模板图像对应的配置文件,以配置文件的形式保存,可以提炼出读取配置、生成图像、保存标注信息等通用操作的代码,能够半自动化地生成图像。
在一个实施例中,提取配置文件中各个目标区域对应的标注信息,并根据标注信息生成初始文本区域。
具体地,终端提取配置文件中各个目标区域对应的标注信息,并根据标注信息生成初始文本区域。
上述文本图像合成方法,终端根据标注信息生成初始文本区域,减少逐个编写版式代码的繁琐操作。
在一个实施例中,如图11所示,提供一种金融场景下的文本图像合成方法,包括:
终端通过P图将样本图像中目标区域的文字擦除,生成对应的模板图像,并对模板图像进行标注,标注信息包括模板图像名称、目标区域位置、文本区域类别,如图3所示。终端根据标注信息,自动生成所有模板的初始json(一种数据格式)配置文件,针对每个模板对json文件中的参数进行修改。其中,json配置文件定义了初始文本区域中每个字段的字体大小、字体颜色、起始位置、对齐方式、旋转角度、水平偏移范围、竖直偏移范围、是否有锯齿、是否加粗、是否跳过、字段label即文本区域类别和语料的生成规则,json配置文件如图12所示,整体属性是全局范围的,对所有字段有效,当单个字段属性存在,则会覆盖整体属性,通过将各个不同模板图像的合成方式以配置文件的形式保存。终端将各配置文件中的读取配置、生成图像、保存标注信息等通用操作的代码进行提炼,通过调用通用部分的代码来进行文本图像合成。终端获取并解析json配置文件,提取各字段配置信息,根据配置信息生成每个字段的文本切片。解析的json配置文件中包括字体名称、颜色、大小、粗细、语料的生成规则等,这里根据语料规则生成初始文本区域的文本内容。可选地,语料规则可以在配置文件中指定语料库名,例如,在生成初始文本区域的文本内容时终端随机在指定的语料库中选取一条语料作为文本内容,或者语料规则为正则规则,例如,终端随机生成18位仅包含数字和字母的编号。终端根据json配置文件对初始文本区域进行基础的图像增强操作,包括旋转、偏移等。终端对进行基础的图像增强操作后的初始文本区域按json配置文件指定的增强算子进行处理,获得目标文本区域。例如,终端对进行基础的图像增强操作后的初始文本区域按json配置文件指定的盖章字体效果算子进行处理,先多次随机地选取像素并赋值为背景颜色,接下来对赋值后的初始文本区域进行图像膨胀操作和腐蚀操作的叠加,得到如图4所示的目标文本区域。例如,终端对进行基础的图像增强操作后的初始文本区域按json配置文件指定的针式打印字体效果算子进行处理,先在进行基础的图像增强操作后的初始文本区域上加上颜色为背景颜色的网格,再在上述初始文本区域上多次随机地选取像素并赋值为背景颜色,并对赋值后的初始文本区域进行图像膨胀操作和腐蚀操作的叠加,得到如图7所示的目标文本区域。例如,终端对进行基础的图像增强操作后的初始文本区域按json配置文件指定的字迹斑驳效果算子进行处理,先生成与初始文本区域相同大小的高斯分布矩阵,建立矩阵与初始文本区域的像素点的映射关系,通过指定阈值得到矩阵中小于阈值的部分,对矩阵中小于阈值部分对应的像素点的亮度随机的增加或减少,对亮度调节后的初始文本区域进行高斯模糊柔操作和强边缘操作,得到如图8所示的目标文本区域。终端根据json配置文本的位置信息、初始文本区域中的文字在x、y两个方向的偏移范围、旋转角度范围,根据相应的梯度信息将目标文本区域与模板图像通过泊松图像融合方法进行融合,并随机对目标文本区域进行偏移和旋转得到初始文本图像。终端根据整体图像处理规则对初始文本图像进行处理得到目标文本图像。例如,终端通过泊松融合方法融合印章图像和初始文本图像获得待印章的目标文本图像。终端设置矩形变淡范围和一个亮度系数的极值extr,对变淡范围内像素点的亮度系数乘上[1,extr]之间的亮度系数实现变淡效果。可选地,在变淡范围内设置一个中心区域,在中心区域内,对中心范围内像素点的亮度系数乘以extr,在中心区域外围,亮度系数与像素点到中心区域边缘的距离为线性关系,越远离中心区域亮度系数越小直至减小到1,得到的目标文本图像如图9所示。例如,终端设置水印文本内容和字体并完成水平文字切片的合成,然后对水平文字切片进行字迹斑驳效果算子的增强操作,旋转固定角度后用泊松图像将字迹斑驳的水平文字切片与初始文本图像进行融合,得到添加一条水印后的初始文本图像,将水平文字切片从初始文本图像的左上角以相同的距离偏移至右下角,依次进行融合操作,直至超出初始文本图像范围,则形成了目标文本图像,如图10所示。可选地,终端保存上述生成的目标文本图像和对应的标注信息,可用于扩充检测模型训练数据。其中,标注信息包含每个字段的文本内容和文本框,并支持文本框的4点标注和2点标注。例如图13所示,对文本的标注框可通过2个点指定,即左上角和右下角的坐标(x,y):1041;87;1648;207,只能为水平框。例如图14所示,对文本的标注框也可以顺时针通过4个点指定,即左上、右上、右下、左下:1041;87;1644;78;1648;207;1041;211,且4点标注形式可以为任意形状的四边形。终端根据文本框坐标从目标文本图像上切出切片即目标文本图像区域,即可得到包含文本内容标注的识别模型训练数据。可选地,终端多线程的方式生成目标文本图像。
应该理解的是,虽然如上所述的各实施例所涉及的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,如上所述的各实施例所涉及的流程图中的至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。
基于同样的发明构思,本申请实施例还提供了一种用于实现上述所涉及的文本图像合成方法的文本图像合成装置。该装置所提供的解决问题的实现方案与上述方法中所记载的实现方案相似,故下面所提供的一个或多个文本图像合成装置实施例中的具体限定可以参见上文中对于文本图像合成方法的限定,在此不再赘述。
在一个实施例中,如图15所示,提供了一种文本图像合成装置,包括:获取模块100、初始区域生成模块200、初始区域处理模块300和融合模块400,其中:
获取模块100,用于获取模板图像,模板图像中包括标注信息;
初始区域生成模块200,用于根据标注信息和接收的配置指令生成初始文本区域;
初始区域处理模块300,用于根据局部区域处理规则对初始文本区域进行处理得到目标文本区域;
融合模块400,用于根据标注信息中的位置信息将模板图像和目标文本区域融合生成初始文本图像。
在一个实施例中,初始区域处理模块300,包括:根据基础图像算子、盖章字体效果算子、针式打印字体效果算子和字迹斑驳效果算子中的至少一个对初始文本区域进行处理,得到目标文本区域;基础图像算子是指对初始文本区域进行区域位置操作的算子;盖章字体效果算子是指将初始文本区域中的文字处理成盖章字体的算子;针式打印字体效果算子是指将初始文本区域中的文字处理成针式打印字体的算子;字迹斑驳效果算子是指将初始文本区域中的文字处理成字迹斑驳字体的算子。
在一个实施例中,初始区域处理模块300的盖章字体处理子模块,包括:像素点赋值单元,用于从初始文本区域中随机选取像素点,并将像素点赋值为初始文本区域的背景颜色;膨胀腐蚀子单元,用于对赋值后的初始文本区域进行图像膨胀操作和图像腐蚀操作,得到目标文本区域。
在一个实施例中,初始区域处理模块300的针式打印字体子模块,包括:网格叠加单元,用于在初始文本区域上叠加带有初始文本区域的背景颜色的网格;通过盖章字体处理子模块对叠加网格后的初始文本区域进行处理,得到目标文本区域。
在一个实施例中,初始区域处理模块300的字迹斑驳子模块,包括:矩阵生成单元,用于生成高斯分布的矩阵,矩阵的尺寸等于初始文本区域的尺寸;获取子单元,用于获取预设值;关系建立单元,用于建立矩阵的各元素与初始文本区域的像素点的映射关系,并将矩阵中小于预设值的元素对应像素点随机进行亮度的调节;调解处理单元,用于对进行亮度调节后的初始文本区域进行图像处理操作,得到目标文本区域。
在一个实施例中,文本图像合成装置还包括:初始文本图像处理模块,用于根据整体图像处理规则对初始文本图像进行处理得到目标文本图像。
在一个实施例中,初始文本图像处理模块,包括:根据图像加噪操作、局部变淡算子、加盖印章算子和添加水印算子中的至少一个对初始文本图像进行处理,得到目标文本图像;局部变淡算子是指将初始文本图像进行亮度处理的算子;加盖印章算子是指在初始文本图像中添加印章图像的算子;添加水印算子是指在初始文本图像中添加水印图像的算子。
在一个实施例中,初始文本图像处理模块的局部变淡子模块,包括:区域获取单元,用于获取初始文本图像的变淡区域和中心区域;亮度获取单元,用于获取变淡范围内的像素的亮度最大值;变淡处理单元,用于根据变淡区域、中心区域和亮度最大值对初始文本图像进行处理,得到目标文本图像。
在一个实施例中,初始文本图像处理模块的加盖印章子模块,包括:印章获取单元,用于获取印章图像;印章处理单元,用于根据印章图像和初始文本图像进行融合处理,得到目标文本图像。
在一个实施例中,初始文本图像处理模块的添加水印子模块,包括:初始文字区域单元,用于获取初始文字区域,并对初始文字区域进行图像位置处理操作;融合单元,用于将处理后的初始文字区域与初始文本图像进行融合,得到目标文本图像。
在一个实施例中,还包括:提取模块,用于根据模板图像中的标注信息从目标文本图像中提取目标文本图像区域。
在一个实施例中,获取模块100,包括:配置文件获取模块,用于获取模板图像对应的配置文件;样本图像获取模块,用于获取样本图像,并对样本图像的目标区域进行处理得到对应的模板图像;标注模块,用于对模板图像中的目标区域进行标注,以得到标注信息,标注信息包括模板图像名称、目标文本区域融合位置、文本区域类别中的至少一个;配置文件生成模块,用于根据标注信息生成模板图像对应的配置文件。
在一个实施例中,初始区域生成模块200,包括:提取配置文件中各个目标区域对应的标注信息,并根据标注信息生成初始文本区域。
上述文本图像合成装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是终端,其内部结构图可以如图16所示。该计算机设备包括通过系统总线连接的处理器、存储器、通信接口、显示屏和输入装置。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的通信接口用于与外部的终端进行有线或无线方式的通信,无线方式可通过WIFI、移动蜂窝网络、NFC(近场通信)或其他技术实现。该计算机程序被处理器执行时以实现一种文本图像合成方法。该计算机设备的显示屏可以是液晶显示屏或者电子墨水显示屏,该计算机设备的输入装置可以是显示屏上覆盖的触摸层,也可以是计算机设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。
本领域技术人员可以理解,图16中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现以下步骤:获取模板图像,模板图像携带有标注信息;根据标注信息中的内容信息生成初始文本区域;根据局部区域处理规则对初始文本区域进行处理得到目标文本区域;根据标注信息中的位置信息将模板图像和目标文本区域融合生成初始文本图像。
在其中一个实施例中,处理器执行计算机程序时所实现的根据局部区域处理规则对初始文本区域进行处理得到目标文本区域,包括:根据基础图像算子、盖章字体效果算子、针式打印字体效果算子和字迹斑驳效果算子中的至少一个对初始文本区域进行处理,得到目标文本区域;基础图像算子是指对初始文本区域进行区域位置操作的算子;盖章字体效果算子是指将初始文本区域中的文字处理成盖章字体的算子;针式打印字体效果算子是指将初始文本区域中的文字处理成针式打印字体的算子;字迹斑驳效果算子是指将初始文本区域中的文字处理成字迹斑驳字体的算子。
在其中一个实施例中,处理器执行计算机程序时所实现的初始文本区域被盖章字体效果算子进行处理的过程,包括:从初始文本区域中随机选取像素点,并将像素点赋值为初始文本区域的背景颜色;对赋值后的初始文本区域进行图像膨胀操作和图像腐蚀操作,得到目标文本区域。
在其中一个实施例中,处理器执行计算机程序时所实现的初始文本区域被针式打印字体效果算子进行处理的过程,包括:在初始文本区域上叠加带有初始文本区域的背景颜色的网格;通过盖章字体效果算子对叠加网格后的初始文本区域进行处理,得到目标文本区域。
在其中一个实施例中,处理器执行计算机程序时所实现的初始文本区域被字迹斑驳效果算子进行处理的过程,包括:生成高斯分布的矩阵,矩阵的尺寸等于初始文本区域的尺寸;获取预设值;建立矩阵的各元素与初始文本区域的像素点的映射关系,并将矩阵中小于预设值的元素对应像素点随机进行亮度的调节;对进行亮度调节后的初始文本区域进行图像处理操作,得到目标文本区域。
在其中一个实施例中,处理器执行计算机程序时还实现以下步骤:根据整体图像处理规则对初始文本图像进行处理得到目标文本图像。在其中一个实施例中,根据整体图像处理规则对初始文本图像进行处理得到目标文本图像,包括:根据图像加噪操作、局部变淡算子、加盖印章算子和添加水印算子中的至少一个对初始文本图像进行处理,得到目标文本图像;局部变淡算子是指将初始文本图像进行亮度处理的算子;加盖印章算子是指在初始文本图像中添加印章图像的算子;添加水印算子是指在初始文本图像中添加水印图像的算子。
在其中一个实施例中,处理器执行计算机程序时所实现的初始文本图像被局部变淡算子进行处理的过程,包括:获取初始文本图像的变淡区域和中心区域;获取变淡范围内的像素的亮度最大值;根据变淡区域、中心区域和亮度最大值对初始文本图像进行处理,得到目标文本图像。
在其中一个实施例中,处理器执行计算机程序时所实现的初始文本图像被加盖印章算子对初始文本图像进行处理的过程,包括:获取印章图像;根据印章图像和初始文本图像进行融合处理,得到目标文本图像。
在其中一个实施例中,处理器执行计算机程序时所实现的初始文本图像被添加水印算子对初始文本图像进行处理的过程,包括:获取初始文字区域,并对初始文字区域进行图像位置处理操作;将处理后的初始文字区域与初始文本图像进行融合,得到目标文本图像。
在其中一个实施例中,处理器执行计算机程序时还实现以下步骤:根据模板图像中的标注信息从目标文本图像中提取目标文本图像区域。
在其中一个实施例中,处理器执行计算机程序时所实现的获取模板图像,包括:获取模板图像对应的配置文件;获取模板图像对应的配置文件之前,包括:获取样本图像,并对样本图像的目标区域进行处理得到对应的模板图像;对模板图像中的目标区域进行标注,以得到标注信息,标注信息包括模板图像名称、目标文本区域融合位置、文本区域类别中的至少一个;根据标注信息生成模板图像对应的配置文件。
在其中一个实施例中,处理器执行计算机程序时所实现的根据标注信息生成初始文本区域,包括:提取配置文件中各个目标区域对应的标注信息,并根据标注信息生成初始文本区域。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:获取模板图像,模板图像携带有标注信息;根据标注信息中的内容信息生成初始文本区域;根据局部区域处理规则对初始文本区域进行处理得到目标文本区域;根据标注信息中的位置信息将模板图像和目标文本区域融合生成初始文本图像。
在其中一个实施例中,计算机程序被处理器执行时所实现的根据局部区域处理规则对初始文本区域进行处理得到目标文本区域,包括:根据基础图像算子、盖章字体效果算子、针式打印字体效果算子和字迹斑驳效果算子中的至少一个对初始文本区域进行处理,得到目标文本区域;基础图像算子是指对初始文本区域进行区域位置操作的算子;盖章字体效果算子是指将初始文本区域中的文字处理成盖章字体的算子;针式打印字体效果算子是指将初始文本区域中的文字处理成针式打印字体的算子;字迹斑驳效果算子是指将初始文本区域中的文字处理成字迹斑驳字体的算子。
在其中一个实施例中,计算机程序被处理器执行时所实现的初始文本区域被盖章字体效果算子进行处理的过程,包括:从初始文本区域中随机选取像素点,并将像素点赋值为初始文本区域的背景颜色;对赋值后的初始文本区域进行图像膨胀操作和图像腐蚀操作,得到目标文本区域。
在其中一个实施例中,计算机程序被处理器执行时所实现的初始文本区域被针式打印字体效果算子进行处理的过程,包括:在初始文本区域上叠加带有初始文本区域的背景颜色的网格;通过盖章字体效果算子对叠加网格后的初始文本区域进行处理,得到目标文本区域。
在其中一个实施例中,计算机程序被处理器执行时所实现的初始文本区域被字迹斑驳效果算子进行处理的过程,包括:生成高斯分布的矩阵,矩阵的尺寸等于初始文本区域的尺寸;获取预设值;建立矩阵的各元素与初始文本区域的像素点的映射关系,并将矩阵中小于预设值的元素对应像素点随机进行亮度的调节;对进行亮度调节后的初始文本区域进行图像处理操作,得到目标文本区域。
在其中一个实施例中,计算机程序被处理器执行时还实现以下步骤方法还包括:根据整体图像处理规则对初始文本图像进行处理得到目标文本图像。在其中一个实施例中,根据整体图像处理规则对初始文本图像进行处理得到目标文本图像,包括:根据图像加噪操作、局部变淡算子、加盖印章算子和添加水印算子中的至少一个对初始文本图像进行处理,得到目标文本图像;局部变淡算子是指将初始文本图像进行亮度处理的算子;加盖印章算子是指在初始文本图像中添加印章图像的算子;添加水印算子是指在初始文本图像中添加水印图像的算子。
在其中一个实施例中,计算机程序被处理器执行时所实现的初始文本图像被局部变淡算子进行处理的过程,包括:获取初始文本图像的变淡区域和中心区域;获取变淡范围内的像素的亮度最大值;根据变淡区域、中心区域和亮度最大值对初始文本图像进行处理,得到目标文本图像。
在其中一个实施例中,计算机程序被处理器执行时所实现的初始文本图像被加盖印章算子对初始文本图像进行处理的过程,包括:获取印章图像;根据印章图像和初始文本图像进行融合处理,得到目标文本图像。
在其中一个实施例中,计算机程序被处理器执行时所实现的初始文本图像被添加水印算子对初始文本图像进行处理的过程,包括:获取初始文字区域,并对初始文字区域进行图像位置处理操作;将处理后的初始文字区域与初始文本图像进行融合,得到目标文本图像。
在其中一个实施例中,计算机程序被处理器执行时还实现以下步骤还包括:根据模板图像中的标注信息从目标文本图像中提取目标文本图像区域。
在其中一个实施例中,计算机程序被处理器执行时所实现的获取模板图像,包括:获取模板图像对应的配置文件;获取模板图像对应的配置文件之前,包括:获取样本图像,并对样本图像的目标区域进行处理得到对应的模板图像;对模板图像中的目标区域进行标注,以得到标注信息,标注信息包括模板图像名称、目标文本区域融合位置、文本区域类别中的至少一个;根据标注信息生成模板图像对应的配置文件。
在其中一个实施例中,计算机程序被处理器执行时所实现的根据标注信息生成初始文本区域,包括:提取配置文件中各个目标区域对应的标注信息,并根据标注信息生成初始文本区域。
在一个实施例中,提供了一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现以下步骤:获取模板图像,模板图像携带有标注信息;根据标注信息中的内容信息生成初始文本区域;根据局部区域处理规则对初始文本区域进行处理得到目标文本区域;根据标注信息中的位置信息将模板图像和目标文本区域融合生成初始文本图像。
在其中一个实施例中,计算机程序被处理器执行时所实现的根据局部区域处理规则对初始文本区域进行处理得到目标文本区域,包括:根据基础图像算子、盖章字体效果算子、针式打印字体效果算子和字迹斑驳效果算子中的至少一个对初始文本区域进行处理,得到目标文本区域;基础图像算子是指对初始文本区域进行区域位置操作的算子;盖章字体效果算子是指将初始文本区域中的文字处理成盖章字体的算子;针式打印字体效果算子是指将初始文本区域中的文字处理成针式打印字体的算子;字迹斑驳效果算子是指将初始文本区域中的文字处理成字迹斑驳字体的算子。
在其中一个实施例中,计算机程序被处理器执行时所实现的初始文本区域被盖章字体效果算子进行处理的过程,包括:从初始文本区域中随机选取像素点,并将像素点赋值为初始文本区域的背景颜色;对赋值后的初始文本区域进行图像膨胀操作和图像腐蚀操作,得到目标文本区域。
在其中一个实施例中,计算机程序被处理器执行时所实现的初始文本区域被针式打印字体效果算子进行处理的过程,包括:在初始文本区域上叠加带有初始文本区域的背景颜色的网格;通过盖章字体效果算子对叠加网格后的初始文本区域进行处理,得到目标文本区域。
在其中一个实施例中,计算机程序被处理器执行时所实现的初始文本区域被字迹斑驳效果算子进行处理的过程,包括:生成高斯分布的矩阵,矩阵的尺寸等于初始文本区域的尺寸;获取预设值;建立矩阵的各元素与初始文本区域的像素点的映射关系,并将矩阵中小于预设值的元素对应像素点随机进行亮度的调节;对进行亮度调节后的初始文本区域进行图像处理操作,得到目标文本区域。
在其中一个实施例中,计算机程序被处理器执行时还实现以下步骤方法还包括:根据整体图像处理规则对初始文本图像进行处理得到目标文本图像。在其中一个实施例中,根据整体图像处理规则对初始文本图像进行处理得到目标文本图像,包括:根据图像加噪操作、局部变淡算子、加盖印章算子和添加水印算子中的至少一个对初始文本图像进行处理,得到目标文本图像;局部变淡算子是指将初始文本图像进行亮度处理的算子;加盖印章算子是指在初始文本图像中添加印章图像的算子;添加水印算子是指在初始文本图像中添加水印图像的算子。
在其中一个实施例中,计算机程序被处理器执行时所实现的初始文本图像被局部变淡算子进行处理的过程,包括:获取初始文本图像的变淡区域和中心区域;获取变淡范围内的像素的亮度最大值;根据变淡区域、中心区域和亮度最大值对初始文本图像进行处理,得到目标文本图像。
在其中一个实施例中,计算机程序被处理器执行时所实现的初始文本图像被加盖印章算子对初始文本图像进行处理的过程,包括:获取印章图像;根据印章图像和初始文本图像进行融合处理,得到目标文本图像。
在其中一个实施例中,计算机程序被处理器执行时所实现的初始文本图像被添加水印算子对初始文本图像进行处理的过程,包括:获取初始文字区域,并对初始文字区域进行图像位置处理操作;将处理后的初始文字区域与初始文本图像进行融合,得到目标文本图像。
在其中一个实施例中,计算机程序被处理器执行时还实现以下步骤还包括:根据模板图像中的标注信息从目标文本图像中提取目标文本图像区域。
在其中一个实施例中,计算机程序被处理器执行时所实现的获取模板图像,包括:获取模板图像对应的配置文件;获取模板图像对应的配置文件之前,包括:获取样本图像,并对样本图像的目标区域进行处理得到对应的模板图像;对模板图像中的目标区域进行标注,以得到标注信息,标注信息包括模板图像名称、目标文本区域融合位置、文本区域类别中的至少一个;根据标注信息生成模板图像对应的配置文件。
在其中一个实施例中,计算机程序被处理器执行时所实现的根据标注信息生成初始文本区域,包括:提取配置文件中各个目标区域对应的标注信息,并根据标注信息生成初始文本区域。
需要说明的是,本申请所涉及的用户信息(包括但不限于用户设备信息、用户个人信息等)和数据(包括但不限于用于分析的数据、存储的数据、展示的数据等),均为经用户授权或者经过各方充分授权的信息和数据。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read-OnlyMemory,ROM)、磁带、软盘、闪存、光存储器、高密度嵌入式非易失性存储器、阻变存储器(ReRAM)、磁变存储器(Magnetoresistive Random Access Memory,MRAM)、铁电存储器(Ferroelectric Random Access Memory,FRAM)、相变存储器(Phase Change Memory,PCM)、石墨烯存储器等。易失性存储器可包括随机存取存储器(Random Access Memory,RAM)或外部高速缓冲存储器等。作为说明而非局限,RAM可以是多种形式,比如静态随机存取存储器(Static Random Access Memory,SRAM)或动态随机存取存储器(Dynamic RandomAccess Memory,DRAM)等。本申请所提供的各实施例中所涉及的数据库可包括关系型数据库和非关系型数据库中至少一种。非关系型数据库可包括基于区块链的分布式数据库等,不限于此。本申请所提供的各实施例中所涉及的处理器可为通用处理器、中央处理器、图形处理器、数字信号处理器、可编程逻辑器、基于量子计算的数据处理逻辑器等,不限于此。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本申请专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请的保护范围应以所附权利要求为准。
Claims (17)
1.一种文本图像合成方法,其特征在于,所述方法包括:
获取模板图像,所述模板图像携带有标注信息;
根据所述标注信息中的内容信息生成初始文本区域;
根据局部区域处理规则对所述初始文本区域进行处理得到目标文本区域;
根据所述标注信息中的位置信息将所述模板图像和所述目标文本区域融合生成初始文本图像。
2.根据权利要求1所述的方法,其特征在于,所述根据局部区域处理规则对所述初始文本区域进行处理得到目标文本区域,包括:
根据基础图像算子、盖章字体效果算子、针式打印字体效果算子和字迹斑驳效果算子中的至少一个对所述初始文本区域进行处理,得到目标文本区域;所述基础图像算子是指对所述初始文本区域进行区域位置操作的算子;所述盖章字体效果算子是指将所述初始文本区域中的文字处理成盖章字体的算子;所述针式打印字体效果算子是指将所述初始文本区域中的文字处理成针式打印字体的算子;所述字迹斑驳效果算子是指将所述初始文本区域中的文字处理成字迹斑驳字体的算子。
3.根据权利要求2所述的方法,其特征在于,所述初始文本区域被所述盖章字体效果算子进行处理的过程,包括:
从所述初始文本区域中随机选取像素点,并将所述像素点赋值为所述初始文本区域的背景颜色;
对赋值后的初始文本区域进行图像膨胀操作和图像腐蚀操作,得到目标文本区域。
4.根据权利要求2所述的方法,其特征在于,所述初始文本区域被所述针式打印字体效果算子进行处理的过程,包括:
在所述初始文本区域上叠加带有所述初始文本区域的背景颜色的网格;
通过所述盖章字体效果算子对叠加网格后的初始文本区域进行处理,得到目标文本区域。
5.根据权利要求2所述的方法,其特征在于,所述初始文本区域被所述字迹斑驳效果算子进行处理的过程,包括:
生成高斯分布的矩阵,所述矩阵的尺寸等于所述初始文本区域的尺寸;
获取预设值;
建立所述矩阵的各元素与所述初始文本区域的像素点的映射关系,并将所述矩阵中小于所述预设值的元素对应像素点随机进行亮度的调节;
对进行亮度调节后的初始文本区域进行图像处理操作,得到目标文本区域。
6.根据权利要求1所述的方法,其特征在于,所述方法还包括:
根据整体图像处理规则对所述初始文本图像进行处理得到目标文本图像。
7.根据权利要求6所述的方法,其特征在于,所述根据整体图像处理规则对所述初始文本图像进行处理得到目标文本图像,包括:
根据图像加噪操作、局部变淡算子、加盖印章算子和添加水印算子中的至少一个对所述初始文本图像进行处理,得到目标文本图像;所述局部变淡算子是指将所述初始文本图像进行亮度处理的算子;所述加盖印章算子是指在所述初始文本图像中添加印章图像的算子;所述添加水印算子是指在所述初始文本图像中添加水印图像的算子。
8.根据权利要求7所述的方法,其特征在于,所述初始文本图像被所述局部变淡算子进行处理的过程,包括:
获取初始文本图像的变淡区域和中心区域;
获取所述变淡范围内的像素的亮度最大值;
根据所述变淡区域、所述中心区域和所述亮度最大值对所述初始文本图像进行处理,得到目标文本图像。
9.根据权利要求7所述的方法,其特征在于,所述初始文本图像被所述加盖印章算子对所述初始文本图像进行处理的过程,包括:
获取所述印章图像;
根据所述印章图像和所述初始文本图像进行融合处理,得到目标文本图像。
10.根据权利要求7所述的方法,其特征在于,所述初始文本图像被所述添加水印算子对所述初始文本图像进行处理的过程,包括:
获取初始文字区域,并对所述初始文字区域进行图像位置处理操作;
将所述处理后的初始文字区域与所述初始文本图像进行融合,得到目标文本图像。
11.根据权利要求6所述的方法,其特征在于,还包括:
根据提取位置信息从所述目标文本图像中提取目标文本图像区域,所述提取位置信息为所述目标文本区域融合成初始文本图像后所述目标文本区域的位置。
12.根据权利要求1所述的方法,其特征在于,所述获取模板图像,包括:
获取模板图像对应的配置文件;
所述获取模板图像对应的配置文件之前,包括:
获取样本图像,并对所述样本图像的目标区域进行处理得到对应的模板图像;
对所述模板图像中的所述目标区域进行标注,以得到标注信息,所述标注信息包括模板图像名称、目标文本区域融合位置、文本区域类别中的至少一个;
根据所述标注信息生成所述模板图像对应的配置文件。
13.根据权利要求12所述的方法,其特征在于,所述根据标注信息生成初始文本区域,包括:
提取所述配置文件中各个目标区域对应的标注信息,并根据所述标注信息生成初始文本区域。
14.一种文本图像合成装置,其特征在于,所述装置包括:
获取模块,用于获取模板图像,所述模板图像中包括标注信息;
初始区域生成模块,用于根据标注信息和接收的配置指令生成初始文本区域;
初始区域处理模块,用于根据局部区域处理规则对所述初始文本区域进行处理得到目标文本区域;
融合模块,用于根据所述标注信息中的位置信息将所述模板图像和所述目标文本区域融合生成初始文本图像。
15.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至13中任一项所述的方法的步骤。
16.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至13中任一项所述的方法的步骤。
17.一种计算机程序产品,包括计算机程序,其特征在于,该计算机程序被处理器执行时实现权利要求1至13中任一项所述的方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111614727.5A CN114332895A (zh) | 2021-12-27 | 2021-12-27 | 文本图像合成方法、装置、设备、存储介质和程序产品 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111614727.5A CN114332895A (zh) | 2021-12-27 | 2021-12-27 | 文本图像合成方法、装置、设备、存储介质和程序产品 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114332895A true CN114332895A (zh) | 2022-04-12 |
Family
ID=81013419
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111614727.5A Pending CN114332895A (zh) | 2021-12-27 | 2021-12-27 | 文本图像合成方法、装置、设备、存储介质和程序产品 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114332895A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114724136A (zh) * | 2022-04-27 | 2022-07-08 | 上海弘玑信息技术有限公司 | 标注数据生成的方法及电子设备 |
CN116030466A (zh) * | 2023-03-23 | 2023-04-28 | 深圳思谋信息科技有限公司 | 图像文本信息识别与处理方法、装置及计算机设备 |
-
2021
- 2021-12-27 CN CN202111614727.5A patent/CN114332895A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114724136A (zh) * | 2022-04-27 | 2022-07-08 | 上海弘玑信息技术有限公司 | 标注数据生成的方法及电子设备 |
CN116030466A (zh) * | 2023-03-23 | 2023-04-28 | 深圳思谋信息科技有限公司 | 图像文本信息识别与处理方法、装置及计算机设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106778928B (zh) | 图像处理方法及装置 | |
Zhang et al. | Ensnet: Ensconce text in the wild | |
US20190304066A1 (en) | Synthesis method of chinese printed character images and device thereof | |
CN109800698B (zh) | 基于深度学习的图标检测方法、图标检测系统和存储介质 | |
CN111091167B (zh) | 标志识别训练数据合成方法、装置、电子设备及存储介质 | |
CN114332895A (zh) | 文本图像合成方法、装置、设备、存储介质和程序产品 | |
CN109255826B (zh) | 中文训练图像生成方法、装置、计算机设备及存储介质 | |
US11978216B2 (en) | Patch-based image matting using deep learning | |
CN112183296B (zh) | 模拟票据图像生成、票据图像识别方法和装置 | |
CN113012265B (zh) | 针式打印字符图像生成方法、装置、计算机设备和介质 | |
CN116051575A (zh) | 图像分割方法、装置、计算机设备、存储介质程序产品 | |
WO2017143973A1 (zh) | 文本识别模型建立方法和装置 | |
US10691884B2 (en) | System and method for cheque image data masking using data file and template cheque image | |
CN112380978B (zh) | 基于关键点定位的多人脸检测方法、系统及存储介质 | |
CN112800718A (zh) | 一种pdf文档展示方法、计算机设备及存储介质 | |
CN113255289A (zh) | 一种文案排版布局的方法及系统 | |
CN111275796B (zh) | 车牌合成方法、装置、计算机设备和存储介质 | |
CN115880362B (zh) | 码区定位方法、装置、计算机设备及计算机可读存储介质 | |
CN114565915B (zh) | 样本文本图像获取方法、文本识别模型训练方法和装置 | |
CN111107264A (zh) | 图像处理方法、装置、存储介质以及终端 | |
CN113963354B (zh) | 一种获取订单编号的方法和装置 | |
CN113936187A (zh) | 文本图像合成方法、装置、存储介质及电子设备 | |
US11468658B2 (en) | Systems and methods for generating typographical images or videos | |
CN116452702B (zh) | 信息图表快速设计方法、装置、计算机设备和存储介质 | |
CN115620307B (zh) | 用于扩充ocr训练集的随机字体样式生成方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |