CN110163285A - 票证识别训练样本合成方法和计算机存储介质 - Google Patents
票证识别训练样本合成方法和计算机存储介质 Download PDFInfo
- Publication number
- CN110163285A CN110163285A CN201910435628.7A CN201910435628A CN110163285A CN 110163285 A CN110163285 A CN 110163285A CN 201910435628 A CN201910435628 A CN 201910435628A CN 110163285 A CN110163285 A CN 110163285A
- Authority
- CN
- China
- Prior art keywords
- character
- image
- sample
- ticket
- default
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/413—Classification of content, e.g. text, photographs or tables
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/28—Character recognition specially adapted to the type of the alphabet, e.g. Latin alphabet
- G06V30/287—Character recognition specially adapted to the type of the alphabet, e.g. Latin alphabet of Kanji, Hiragana or Katakana characters
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Computation (AREA)
- Evolutionary Biology (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Computational Biology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Multimedia (AREA)
- Character Input (AREA)
- Image Processing (AREA)
Abstract
本发明公开了一种票证识别训练样本合成方法和计算机存储介质,该方法包括:按照预设规则从语料库中进行字符采样,得到字符采样集合,并从所述字符采样集合中读取字符生成具有预定长度的样本字符串,将多个所述样本字符串组成样本字符串集合;对各样本字符串进行文字掩码预处理并生成对应的前景文字掩码图像;将各前景文字掩码图像与对应选取的票证背景图像进行二次图像融合,以得到用于票证识别的合成训练样本集合。根据本发明的技术方案,可以实现人工合成票证文本识别所需的训练样本,以用于替代真实样本来进行模型训练,进而还可以解决真实样本的样本数量不可控等难题。
Description
技术领域
本发明涉及文本识别技术领域,尤其涉及一种票证识别训练样本合成方法和计算机存储介质。
背景技术
随着智能手机技术的发展,用户在办理金融保险业务时使用手机拍摄各类票据证照(如房产证等)上传作为业务凭证越来越流行,通过OCR技术(Optical CharacterRecognition,光学字符识别)识别所拍摄图片中的文字信息以用于信息录入或信息审核比对,不仅可以提高效率,降低成本,还可提升用户体验。
现有的基于深度学习的OCR技术体系中,一般分为文本检测和文本识别两个步骤,其中文本识别多采用文本串整体识别,并基于真实样本训练识别模型。然而,在实际运用过程中,基于真实样本训练的方法却存在以下主要问题:(1)由于业务量等原因,导致真实训练样本的数量难以控制;(2)真实样本中的字符覆盖往往不均衡,影响识别模型的整体性能等。
发明内容
鉴于上述问题,本发明提出一种票证识别训练样本合成方法和计算机存储介质,通过生成合成训练样本以替代真实样本用于模型训练,可以解决现有真实样本的数量不可控和字符不均衡等问题。
本发明实施例提出一种票证识别训练样本合成方法,包括:
按照预设规则从语料库中进行字符采样,得到字符采样集合,并从所述字符采样集合中读取字符生成具有预定长度的样本字符串,将多个所述样本字符串组成样本字符串集合;
对各样本字符串进行文字掩码预处理并生成对应的前景文字掩码图像;
将各前景文字掩码图像与对应选取的票证背景图像进行二次图像融合,得到用于票证识别的合成训练样本集合。
进一步地,所述“按照预设规则从语料库中进行字符采样,得到字符采样集合,并从所述字符采样集合中读取字符生成具有预定长度的样本字符串,将多个所述样本字符串组成样本字符串集合”包括:
从语料库中读取预选字符集中所包含的字符,若当前读取的字符在字符采样集合中的字频计数小于或等于预设最高字频,则将所述当前读取的字符加入到所述字符采样集合中;
从所述字符采样集合中依次读取字符以生成具有预定长度的字符串,将生成的多个所述样本字符串加入到样本字符串集合;
判断所述样本字符串的数量是否达到预设样本量,并在达到所述预设样本量时停止字符采样。
进一步地,在上述的票证识别训练样本合成方法中,还包括:
停止所述字符采样后,判断所述预选字符集中的每一字符在所述字符采样集合中的字频计数是否小于预设最低字频;
若是,则将小于所述预设最低字频的当前字符补充到字符补充集合中,以使所述当前字符在所述字符补充集合中的字频计数达到所述预设最低字频;
从所述字符补充集合中依次读取字符并生成具有所述预定长度的字符串,将生成的样本字符串加入到所述样本字符串集合中。
进一步地,所述“将所述前景文字掩码图像与预选的票证背景图像进行二次图像融合”包括:
根据第一预设融合规则将所述前景文字掩码图像与所述票证背景图像进行融合,以获取第一融合图像;
根据第二预设融合规则对所述第一融合图像进行融合,以获取第二融合图像,其中,所述第二融合图像作为用于票证识别的合成训练样本。
进一步地,所述“根据第一预设融合规则将所述前景文字掩码图像与所述票证背景图像进行融合”包括:
为所述前景文字掩码图像创建第一图层,所述第一图层的透明度为所述前景文字掩码图像的像素值乘以预设数值集合中的任意一元素,颜色值为集合[0,前景文字掩码图像的像素均值乘以预设倍数]中的一采样取值;
为所述票证背景图像创建第二图层,所述第二图层设为不透明,颜色值为所述票证背景图像的像素均值;
将所述第一图层和所述第一图层进行阿尔法图像融合,以生成所述第一融合图像。
进一步地,所述“根据第二预设融合规则对所述第一融合图像进行融合,以获取第二融合图像”包括:
根据所述第一融合图像和所述票证背景图像的梯度值确定所述第二融合图像中前景文本图像的梯度,以用于计算所述前景文本图像的散度;
根据所述票证背景图像在边缘位置的散度及所述前景文本图像的散度计算所述第二融合图像的散度,并构建泊松方程;
对所述泊松方程进行求解,以得到所述第二融合图像。
进一步地,所述“对各样本字符串进行文字掩码预处理并生成对应的前景文字掩码图像”包括:
按照预设字体处理规则对各样本字符串进行相应的字体效果处理;
在完成所述字体效果处理之后,生成各样本字符串对应的初始前景文字掩码图像;
从所述初始前景文字掩码图像中截取文字区域掩码图像,并根据选取的票证背景图像的尺寸和预设边距值调整所述文字区域掩码图像的尺寸,然后将调整后的文字区域掩码图像进行像素填充,得到与所述票证背景图像尺寸相同的前景文字掩码图像。
进一步地,所述“从所述初始前景文字掩码图像中截取文字区域掩码图像”步骤之后,还包括:
对所述文字区域掩码图像进行倾斜处理、透视变换处理和模糊处理中的至少一种操作。
进一步地,若所述预设样本量为N,所述预定长度为L,所述预选字符集所含总字符数为M,则所述预设最高字频和所述预设最低字频的计算公式分别如下:
本发明另一实施例还提出一种票证识别训练样本合成装置,包括:
样本字符串集合生成模块,用于按照预设规则从语料库中进行字符采样,得到字符采样集合,并从所述字符采样集合中读取字符生成具有预定长度的样本字符串,将多个所述样本字符串组成样本字符串集合;
前景文字掩码图像生成模块,用于对各样本字符串进行文字掩码预处理并生成对应的前景文字掩码图像;
二次图像融合模块,用于将各所述前景文字掩码图像与对应选取的票证背景图像进行二次图像融合,以得到用于票证识别的合成训练样本集合。
本发明又一实施例还提出一种计算机存储介质,所述计算机存储介质中存储有计算机程序,所述计算机程序运行时控制所述计算机存储介质使计算机执行进一步的票证识别训练样本合成方法。
通过本发明的技术方案可以实现人工合成票证文本识别所需的训练样本,以用于替代真实样本来进行模型训练,可以解决真实样本的样本数量不可控和字符覆盖不均衡等难题。
附图说明
为了更清楚地说明本发明的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对本发明保护范围的限定。
图1为本发明实施例票证识别训练样本合成方法的流程示意图;
图2为本发明实施例票证识别训练样本合成方法的生成样本字符串的流程示意图;
图3为本发明实施例票证识别训练样本合成方法的生成前景文字掩码图像的流程示意图;
图4为本发明实施例票证识别训练样本合成方法的二次图像融合的流程示意图;
图5为本发明实施例票证识别训练样本合成方法的第一次图像融合的流程示意图;
图6为本发明实施例票证识别训练样本合成方法的第二次图像融合的流程示意图;
图7为本发明实施例票证识别训练样本合成方法的训练样本合成过程示意图;
图8为本发明实施例票证识别训练样本合成装置的结构示意图。
主要元件符号说明:
10-票证识别训练样本合成装置;100-样本字符串集合生成模块;200-前景文字掩码图像生成模块;300-二次图像融合模块。
具体实施方式
下面将结合本发明实施例中附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施例。基于本发明的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个该特征。在本发明的描述中,“多个”的含义是两个或两个以上,除非另有明确具体的限定。
除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。本文中在说明书中所使用的术语只是为了描述具体的实施例的目的,不是旨在限制本发明。本文所使用的术语“及/或”包括一个或多个相关的所列项目的任意的和所有的组合。
下面结合具体的实施例对本发明进行详细说明。
实施例1
请参照图1,本实施例提出一种票证识别训练样本合成方法,可应用于各种票证的文本识别模型训练,如房产证、土地证等,通过人工合成票证图片样本来替代真实样本,可解决现有利用真实训练样本进行模型训练的样本不可控、字符覆盖不均衡等难题。下面对该方法进行详细说明。
步骤S100,按照预设规则从语料库中进行字符采样,得到字符采样集合,并从所述字符采样集合中读取字符生成具有预定长度的样本字符串,将多个所述样本字符串组成样本字符串集合。
本实施中,为人工合成训练样本来代替真实的票证样本,先获取待合成训练样本所需的文本字符。其中,上述语料库是指经科学加工的大规模电子文本库,其存放的是在语言的实际使用中真实出现过的语言材料,如新闻分类语料库、现代汉语语料库等。可以理解,通过从这些常用的大规模语料库中进行字符采样,其获取的字符将更接近于实际票证中使用的相关字符。
如图2所示,上述步骤S100具体可包括以下几个子步骤。
子步骤S110,从语料库中读取预选字符集中所包含的字符,若当前读取的字符在字符采样集合中的字频计数小于或等于预设最高字频,则对所述当前读取的字符加入到所述字符采样集合中。
经实践验证,在实际的真实票证样本中,往往存在字符覆盖不均衡的问题,故导致影响票证识别模型的整体性能。本实施例中,为解决真实样本的字符覆盖不均衡的问题,将选择包含5000以上的汉字字符,外加数字、英文以及常用标点符号等组成的综合字符集,作为上述预选字符集,并从语料库中读取该预选字符集中所包含的字符。
在上述子步骤S110中,可将采样得到的所有字符放入一字符采样集合中,并在每次读取字符时,判断当前读取的字符在该字符采样集合中出现的字频计数是否超过一预设最高字频。若该字频计数小于或等于该预设最高字频时,则采样该当前字符,然后将其加入到字符采样集合中。若其字频计数大于该预设最高字频,则舍弃该当前字符并对语料库中下一字符进行顺序读取及字频计数判断。
子步骤S120,从所述字符采样集合中依次读取字符并生成具有预定长度的字符串,将生成的多个所述样本字符串加入到样本字符串集合。
示范性地,对于字符采样集合中的各字符依次读取,并将读取的多个字符生成具有预定长度的字符串,从而得到一个个样本字符串并加入到一样本字符串集合中。可以理解,生成的每一样本字符串的长度均等于该预定长度。当然,该预定长度可根据实际需求来相应设定。
子步骤S130,判断所述样本字符串的数量是否达到预设样本量,并在达到所述预设样本量时停止字符采样。
可以理解,该预设样本量可根据实际训练需求来相应设定,例如,该预设样本量可为100万~200万个。于是,直到生成的样本字符串的样本数量达到该预设样本量时,则停止字符采样。示范性地,若样本字符串集合为Q,预设样本量为N,样本字符串为S,则有Q={S1,S2,…,SN}。
进一步地,还通过补充低于预设的最低字频的字符,从而实现样本字符串的均匀采样。如图2所示,在上述子步骤S130之后,还包括子步骤S140~子步骤S160。
子步骤S140,停止字符采样后,判断预选字符集中的每一字符在所述字符采样集合中的字频计数是否小于预设最低字频。
子步骤S150,若所述判断结果为小于,则将小于所述预设最低字频的当前字符补充到字符补充集合中,以使所述补充的当前字符在所述字符补充集合中的字频计数达到所述预设最低字频。
示范性地,若某字符k的字频计数为Ck,预设最低字频为Fmin,当Ck<Fmin时,则补充(Fmin-Ck)数量的字符k到字符补充集合中,直到将该预选字符集中的所有小于预设最低字频的字符补充完成。
子步骤S160,从所述字符补充集合中依次读取字符并生成具有所述预定长度的字符串,将生成的样本字符串加入到该样本字符串集合中。
于是,对字符补充集合中的字符进行随机排序后,进行字符依次读取并生成一个个具有预设长度的样本字符串,将生成的样本字符串加入到上述的样本字符串集合中。
本实施例中,若预设样本量为N,预定长度为L,预选字符集所含总字符数为M,则上述的预设最高字频和预设最低字频的计算公式分别为:
其中,上述的第一预设调整系数和第二预设调整系数可根据实际需求而设定。示范性地,该第一预设调整系数的取值范围可为2.1~2.9,例如可设为2.5;而该第二预设调整系数的取值范围可为0.21~0.29,例如可设为0.25。可以理解,通过预先设置采样字符的最高字频与最低字频,可以实现对字符的均匀采样,从而用于解决训练样本中的字符不均衡问题。例如,在真实票证样本中,如“的”、“地”等字符出现的频率较高,为防止人工合成的大量训练样本中出现该类字符的不均衡问题,可在采样时对采样字符进行字频计数,以使当前采样的字符既不会超过设置的最高字频,又不会低于最低字频。这样可保证人工合成的大量样本中可覆盖更多的字符,从而提高票证文本识别模型的整体识别性能。
步骤S200,对各样本字符串进行文字掩码预处理并生成对应的前景文字掩码图像。
具体地,如图3所示,上述步骤S200可包括以下主要子步骤。
子步骤S210,按照预设字体处理规则对各样本字符串进行相应的字体效果处理。
本实施例中,该预设字体处理规则可包括对不同比例的样本字符串进行不同的字体效果处理。例如,可对20%数量的样本字符串进行预设字号大小的字体效果设置;又或者,可对5%数量的样本字符串进行字体加粗的字体效果设置等等。示范性地,所述字体效果可包括但不限于为设置样本字符串的字号大小、加粗效果、下划线效果和斜体效果等。考虑到样本字符串集合中的样本数量较大,通过对不同比例的样本字符串进行不同的字体效果处理,这样得到的合成样本可以更加贴切地模拟出真实样本图片中不同字体效果情况。
子步骤S220,在完成所述字体效果处理之后,生成各样本字符串对应的初始前景文字掩码图像。
子步骤S230,从所述初始前景文字掩码图像中截取文字区域掩码图像,并根据选取的票证背景图像的尺寸和预设边距值调整所述文字区域掩码图像的尺寸,然后将调整后的文字区域掩码图像进行像素填充,得到与所述票证背景图像尺寸相同的前景文字掩码图像。
示范性地,所述预设边距值可包括上边距、下边距、左边距和右边距中的至少三个。例如,从初始前景文字掩码图像中截取出文字区域掩码图像,可根据预设的上边距tp、下边距dp和选取的票证背景图像的尺寸,保持截取的图像的长宽比,从而计算出该文字区域掩码图像在与该票证背景图像融合后得到的最终融合图像内的宽和高,并对该文字区域掩码图像的尺寸调整为计算得到的宽和高的尺寸。可以理解,该票证背景图像的尺寸可根据实际需求来选取。
随后,根据预设的左边距lp计算该掩码图像的右边距rp。于是,根据上边距tp、下边距dp、左边距lp和右边距rp将该文字区域掩码图像进行像素填充,从而得到与该票证背景图像的尺寸相同的前景文本掩码图像。
可选地,若上述四个边距存在设置为0的情况,则在该文字区域掩码图像相应的水平或垂直方向上设置填充值(即padding)为1个像素。例如,以上边距tp=0为例,则设置该前景文字掩码图像上方的水平方向上填充1个像素,相应地,与其待融合的背景图像上方的相应位置也填充1个像素,以便于后续的图像融合。
其中,在上述步骤S230中,在截取得到文字区域掩码图像之后,还包括对得到的文字区域掩码图像进行倾斜处理、透视变换处理和模糊处理中的至少一种操作。
例如,可根据预设倾斜值对预设比例的文字区域掩码图像实现设定的倾斜效果;又或者,可根据预设透视变换值对预设比例的文字区域掩码图像生成设定的透视变换效果等。可以理解,该掩码效果处理可包括但不限于对文字区域掩码图像进行倾斜、透视变换、加入高斯模糊处理等,以用于模拟不同的真实票证样本。
步骤S300,将所述前景文字掩码图像与预选的票证背景图像进行二次图像融合,以得到用于票证识别的合成训练样本。
于是,得到前景文字掩码图像后,将其与预先选取的票证背景图像进行二次图像融合,二次融合得到的最终融合图像即为合成训练样本,可用于票证识别模型的训练。本实施例中,该票证背景图像的尺寸可根据所需合成的训练样本的尺寸来确定,如可为宽400mm高32mm。
具体地,如图4所示,上述步骤S300可包括以下几个子步骤:
子步骤S310,根据第一预设融合规则将所述前景文字掩码图像与所述票证背景图像进行融合,以获取第一融合图像。
本实施例中,该第一预设融合规则的融合过程具体包括以下步骤:
子步骤S311,为所述前景文字掩码图像创建第一图层,所述第一图层的透明度为所述前景文字掩码图像的像素值乘以预设数值集合中的任意一元素,颜色值为集合[0,前景文字掩码图像的像素均值乘以预设倍数]中的一采样取值。其中,该颜色值的取值可采用随机采样或正态分布采样方式来获取。示范性地,该预设数值集合为[0.9,1.0]。而该预设倍数的取值范围可为0.75~0.85,优选地,取值为0.8。
子步骤S312,为所述票证背景图像创建第二图层,所述第二图层设为不透明,颜色值为所述票证背景图像的像素均值。
子步骤S313,将所述第一图层和所述第一图层进行图像融合,以生成所述第一融合图像。
其中,根据图像合成原理可知,融合后的第一融合图像的透明度为不透明,而其颜色值为前景文字掩码图像与票证背景图像的混合颜色。示范性地,若该前景文字掩码图像的透明度为αf,颜色值为cf,票证背景图像的透明度为1(即不透明),颜色值为cb,于是有:
第一融合图像的颜色值=(1-αf)xcb+αfxcf。
本实施例中,在得到第一次融合图像后,进一步地进行第二次融合,即执行子步骤S320,根据第二预设融合规则对所述第一融合图像进行图像融合,以获取第二融合图像,其中,所述第二融合图像即为所述票证识别的合成训练样本。
本实施例中,如图6所示,该第二预设融合规则的融合过程具体可包括以下步骤:
子步骤S321,根据所述第一融合图像和所述票证背景图像的梯度确定所述第二融合图像中前景文本图像的梯度,以用于计算所述前景文本图像的散度。
示范性地,分别计算第一融合图像和票证背景图像的水平方向梯度值和垂直方向梯度值,以用于确定该第二融合图像中前景文本图像的梯度。其中,该前景文本图像是上述的前景文本掩码图像经过二次融合后所得到的图像区域。
具体地,以水平方向梯度值为例,若第一融合图像的水平方向梯度值小于该票证背景图像的水平方向梯度值,则该前景文本图像的水平方向梯度值取该票证背景图像的水平方向梯度值,否则取该第一融合图像的水平方向梯度值。其中,该前景文本图像的垂直方向梯度值的取值与其水平方向梯度值的取值方式类似。
子步骤S322,根据所述票证背景图像在边缘位置的散度及所述前景文本图像的散度计算所述第二融合图像的散度,并构建泊松方程。
示范性地,对获取的前景文本图像的梯度求导来计算其散度rL,并根据票证背景图像在图像边缘位置的梯度求导后得到其边缘散度rL_b,于是两个散度值相加即得到该第二融合图像的散度r,即有:r=rL+rL_b。其中,该票证背景图像在图像边缘位置的梯度,即为第二融合图像边界像素点的像素值的梯度。
子步骤S323,对所述泊松方程进行求解,以得到所述第二融合图像。
于是,构建泊松方程Ax=r,其中,A是构建的系数矩阵,可根据对应图像的像素值求取得到,r是第二融合图像的散度值,x即为待求解的第二融合图像的像素值。可以理解,在第一次融合的基础上再进行第二次融合,可使合成的训练样本融合更加自然、平滑,这样得到的融合图像将更加接近于真实的票证训练样本图片。
图7示出了一个合成训练样本的整个合成过程示意图。具体地,从字符采样集合中生成一个样本字符串“南都讯记者刘凡周”后,可对其进行斜体字体效果处理后,生成对应的初始前景文本掩码图像。从初始前景文本掩码图像中截取出文字掩码部分,即得到文字区域掩码图像后,再对其进行高斯模糊处理后,票证背景图像的尺寸和设置的边距值来调整该文字区域掩码图像的尺寸,并将调整后的文字区域掩码图像进行像素填充,得到最终的前景文本掩码图像。其中,该前景文本掩码图像的尺寸与票证背景图像的尺寸相同,如图7所示。随后,将该前景文本掩码图像与票证背景图像进行二次融合,从而得到最终的融合图像,而该最终的融合图像即为合成训练样本。
本实施例提出的票证识别训练样本合成方法,通过基于大规模语料库的字符均匀采样来得到合成训练样本所需的文本字符串,然后基于二次图像融合,从而得到最终的合成训练样本。通过上述方法可容易地合成百万量级以上的训练样本以满足实际模型训练需求,而得到的各合成训练样本无论是在模拟拍照效果(如倾斜、模糊、透视变换等),还是在文字效果(如字体类型、字号大小等)方面等都非常逼近真实的票证训练样本。事实上,利用真实样本进行训练前需要对其进行人工标注,标注人员需要把票证图片按文本字符串切割为多个小图片,然后在标注软件中手工输入小图片中文本字符串作为标注信息。而票证图片中的文本往往较多,识别模型所需的训练图片数量往往较大,因此人工标注成本很高,并且人工标注过程中还容易出错,进而影响模型训练等。本实施例中,利用这些人工合成的训练样本来替代真实样本来进行票证识别模型训练,不仅可以很好地解决真实样本的样本数量不可控、字符不均衡等问题,而且还可以解决对真实样本进行人工标注的成本高和效率低等难题。此外,考虑到通过检测模型预测得到的真实样本的文本矩形框可能存在偏差,会造成不同的上边距、下边距、左边距、右边距等,故本实施例通过预先设置边距值可以模拟由检测模型预测得到的各种各样的真实样本的检测结果。经实践证明,利用这些合成训练样本进行训练,所训练得到的识别模型的字符准确率可高达98%以上。
实施例2
请参照图8,基于上述实施例的票证识别训练样本合成方法,本实施例提出一种票证识别训练样本合成装置10,包括:
样本字符串获取模块100,用于按照预设规则从语料库中进行字符采样,得到字符采样集合,并从所述字符采样集合中读取字符生成具有预定长度的样本字符串,将多个所述样本字符串组成样本字符串集合。
前景文字掩码图像生成模块200,用于对各样本字符串进行文字掩码预处理并生成对应的前景文字掩码图像。
二次图像融合模块300,用于将各前景文字掩码图像与对应选取的票证背景图像进行二次图像融合,得到用于票证识别的合成训练样本集合。
本实施例的各模块对应于上述实施例1的票证识别训练样本合成方法,实施例1中的任何可选项也适用于本实施例,在此不再详述。
本发明实施例还提供一种计算机存储介质,所述计算机存储介质中存储有计算机程序,所述计算机程序运行时使计算机执行进一步的票证识别训练样本合成方法。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置和方法,也可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,附图中的流程图和结构图显示了根据本发明实施例的多个实施例的装置、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在作为替换的实现方式中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,结构图和/或流程图中的每个方框、以及结构图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
另外,在本发明实施例各个实施例中的各功能模块或单元可以集成在一起形成一个独立的部分,也可以是各个模块单独存在,也可以两个或更多个模块集成形成一个独立的部分。
所述功能如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实施例的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是智能手机、个人计算机、服务器、或者网络设备等)执行本发明实施例各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,仅为本发明实施例的具体实施方式,但本发明实施例的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明实施例揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明实施例的保护范围之内。因此,本发明实施例的保护范围应所述以权利要求的保护范围为准。
Claims (10)
1.一种票证识别训练样本合成方法,其特征在于,包括:
按照预设规则从语料库中进行字符采样,得到字符采样集合,并从所述字符采样集合中读取字符生成具有预定长度的样本字符串,将多个所述样本字符串组成样本字符串集合;
对各样本字符串进行文字掩码预处理并生成对应的前景文字掩码图像;
将各前景文字掩码图像与对应选取的票证背景图像进行二次图像融合,得到用于票证识别的合成训练样本集合。
2.根据权利要求1所述的票证识别训练样本合成方法,其特征在于,所述“按照预设规则从语料库中进行字符采样,得到字符采样集合,并从所述字符采样集合中读取字符生成具有预定长度的样本字符串,将多个所述样本字符串组成样本字符串集合”包括:
从语料库中读取预选字符集中所包含的字符,若当前读取的字符在字符采样集合中的字频计数小于或等于预设最高字频,则将所述当前读取的字符加入到所述字符采样集合中;
从所述字符采样集合中依次读取字符并生成具有预定长度的字符串,将生成的多个所述样本字符串加入到样本字符串集合;
判断所述样本字符串的数量是否达到预设样本量,并在达到所述预设样本量时停止字符采样。
3.根据权利要求2所述的票证识别训练样本合成方法,其特征在于,还包括:
停止所述字符采样后,判断所述预选字符集中的每一字符在所述字符采样集合中的字频计数是否小于预设最低字频;
若是,则将小于所述预设最低字频的当前字符补充到字符补充集合中,以使所述当前字符在所述字符补充集合中的字频计数达到所述预设最低字频;
从所述字符补充集合中依次读取字符并生成具有所述预定长度的样本字符串,将生成的样本字符串加入到所述样本字符串集合中。
4.根据权利要求1所述的票证识别训练样本合成方法,其特征在于,所述“将各前景文字掩码图像与对应选取的票证背景图像进行二次图像融合”包括:
根据第一预设融合规则将所述前景文字掩码图像与所述票证背景图像进行融合,以获取第一融合图像;
根据第二预设融合规则对所述第一融合图像进行图像融合,以获取第二融合图像,其中,所述第二融合图像作为用于票证识别的合成训练样本。
5.根据权利要求4所述的票证识别训练样本合成方法,其特征在于,所述“根据第一预设融合规则将所述前景文字掩码图像与所述票证背景图像进行融合”包括:
为所述前景文字掩码图像创建第一图层,所述第一图层的透明度为所述前景文字掩码图像的像素值乘以预设数值集合中的任意一元素,颜色值为集合[0,前景文字掩码图像的像素均值乘以预设倍数]中的一采样取值;
为所述票证背景图像创建第二图层,所述第二图层设为不透明,颜色值为所述票证背景图像的像素均值;
将所述第一图层和所述第一图层进行图像融合,以生成所述第一融合图像。
6.根据权利要求5所述的票证识别训练样本合成方法,其特征在于,所述“根据第二预设融合规则对所述第一融合图像进行图像融合,以获取第二融合图像”包括:
根据所述第一融合图像和所述票证背景图像的梯度值确定所述第二融合图像中前景文本图像的梯度,以用于计算所述前景文本图像的散度;
根据所述票证背景图像在边缘位置的散度及所述前景文本图像的散度计算所述第二融合图像的散度,并构建泊松方程;
对所述泊松方程进行求解,以得到所述第二融合图像。
7.根据权利要求1所述的票证识别训练样本合成方法,其特征在于,所述“对各样本字符串进行文字掩码预处理并生成对应的前景文字掩码图像”包括:
按照预设字体处理规则对各样本字符串进行相应的字体效果处理;
在完成所述字体效果处理之后,生成各样本字符串对应的初始前景文字掩码图像;
从所述初始前景文字掩码图像中截取文字区域掩码图像,并根据选取的票证背景图像的尺寸和预设边距值调整所述文字区域掩码图像的尺寸,然后将调整后的文字区域掩码图像进行像素填充,得到与所述票证背景图像尺寸相同的各前景文字掩码图像。
8.根据权利要求7所述的票证识别训练样本合成方法,其特征在于,所述“从所述初始前景文字掩码图像中截取文字区域掩码图像”步骤之后,还包括:
对所述文字区域掩码图像进行倾斜处理、透视变换处理和模糊处理中的至少一种操作。
9.根据权利要求3所述的票证识别训练样本合成方法,其特征在于,若所述预设样本量为N,所述预定长度为L,所述预选字符集所含总字符数为M,则所述预设最高字频和所述预设最低字频的计算公式分别为:
10.一种计算机存储介质,其特征在于,所述计算机存储介质中存储有计算机程序,所述计算机程序运行时使计算机执行根据权利要求1-9任一项所述的票证识别训练样本合成方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910435628.7A CN110163285B (zh) | 2019-05-23 | 2019-05-23 | 票证识别训练样本合成方法和计算机存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910435628.7A CN110163285B (zh) | 2019-05-23 | 2019-05-23 | 票证识别训练样本合成方法和计算机存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110163285A true CN110163285A (zh) | 2019-08-23 |
CN110163285B CN110163285B (zh) | 2021-03-02 |
Family
ID=67632467
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910435628.7A Active CN110163285B (zh) | 2019-05-23 | 2019-05-23 | 票证识别训练样本合成方法和计算机存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110163285B (zh) |
Cited By (33)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110503159A (zh) * | 2019-08-28 | 2019-11-26 | 北京达佳互联信息技术有限公司 | 文字识别方法、装置、设备及介质 |
CN110956170A (zh) * | 2019-09-30 | 2020-04-03 | 京东数字科技控股有限公司 | 生成护照机读码样本的方法、装置、设备及存储介质 |
CN110991265A (zh) * | 2019-11-13 | 2020-04-10 | 四川大学 | 一种火车票图像的版面提取方法 |
CN111291629A (zh) * | 2020-01-17 | 2020-06-16 | 平安医疗健康管理股份有限公司 | 图像中文本的识别方法、装置、计算机设备及计算机存储介质 |
CN111325117A (zh) * | 2020-02-05 | 2020-06-23 | 北京字节跳动网络技术有限公司 | 目标对象识别模型的训练方法、装置和电子设备 |
CN111414906A (zh) * | 2020-03-05 | 2020-07-14 | 北京交通大学 | 纸质票据图片的数据合成与文本识别方法 |
CN111524100A (zh) * | 2020-04-09 | 2020-08-11 | 武汉精立电子技术有限公司 | 一种缺陷图像样本生成方法、装置及面板缺陷检测方法 |
CN111523541A (zh) * | 2020-04-21 | 2020-08-11 | 上海云从汇临人工智能科技有限公司 | 一种基于ocr的数据生成方法、系统、设备及介质 |
CN111553298A (zh) * | 2020-05-07 | 2020-08-18 | 北京天仪百康科贸有限公司 | 一种基于区块链的火灾识别方法及系统 |
CN111652232A (zh) * | 2020-05-29 | 2020-09-11 | 泰康保险集团股份有限公司 | 票据识别方法及装置、电子设备和计算机可读存储介质 |
CN111738326A (zh) * | 2020-06-16 | 2020-10-02 | 中国工商银行股份有限公司 | 句粒度标注训练样本生成方法及装置 |
CN111798543A (zh) * | 2020-09-10 | 2020-10-20 | 北京易真学思教育科技有限公司 | 模型训练方法、数据处理方法、装置、设备及存储介质 |
CN111914846A (zh) * | 2020-07-03 | 2020-11-10 | 苏州开心盒子软件有限公司 | 版面数据合成方法、设备及存储介质 |
CN111931783A (zh) * | 2020-08-18 | 2020-11-13 | 创新奇智(重庆)科技有限公司 | 一种训练样本生成方法、机读码识别方法及装置 |
CN111950293A (zh) * | 2020-06-24 | 2020-11-17 | 北京百度网讯科技有限公司 | 语义表示模型的生成方法、装置、电子设备及存储介质 |
CN112001397A (zh) * | 2020-08-25 | 2020-11-27 | 广东光速智能设备有限公司 | 一种智慧工地的身份证字符识别训练数据生成方法及系统 |
CN112214273A (zh) * | 2020-10-14 | 2021-01-12 | 合肥芯颖科技有限公司 | 一种数字时钟显示方法、装置、电子设备和存储介质 |
CN112529989A (zh) * | 2020-12-19 | 2021-03-19 | 杭州东信北邮信息技术有限公司 | 一种基于票据模板的图片重构方法 |
CN112686243A (zh) * | 2020-12-29 | 2021-04-20 | 平安普惠企业管理有限公司 | 智能识别图片文字的方法、装置、计算机设备及存储介质 |
CN112766268A (zh) * | 2021-03-02 | 2021-05-07 | 阳光财产保险股份有限公司 | 一种文本标注生成方法、装置、电子设备及存储介质 |
CN112819274A (zh) * | 2020-12-30 | 2021-05-18 | 中国农业银行股份有限公司 | 金融凭证样本的生成方法、装置及相关方法 |
CN112926637A (zh) * | 2021-02-08 | 2021-06-08 | 天津职业技术师范大学(中国职业培训指导教师进修中心) | 一种文本检测训练集的生成方法 |
CN112990205A (zh) * | 2021-05-11 | 2021-06-18 | 创新奇智(北京)科技有限公司 | 手写字符样本的生成方法及装置、电子设备、存储介质 |
CN113012054A (zh) * | 2019-12-20 | 2021-06-22 | 舜宇光学(浙江)研究院有限公司 | 基于抠图的样本增强方法和训练方法及其系统和电子设备 |
CN113012265A (zh) * | 2021-04-22 | 2021-06-22 | 中国平安人寿保险股份有限公司 | 针式打印字符图像生成方法、装置、计算机设备和介质 |
WO2021139179A1 (zh) * | 2020-07-31 | 2021-07-15 | 平安科技(深圳)有限公司 | 基于局部阴影特效的图像样本生成方法及装置 |
CN113449728A (zh) * | 2021-07-21 | 2021-09-28 | 北京有竹居网络技术有限公司 | 一种文字识别方法及其相关设备 |
CN113762422A (zh) * | 2021-11-09 | 2021-12-07 | 广州思德医疗科技有限公司 | 一种图像训练集合成方法及系统 |
CN114565915A (zh) * | 2022-04-24 | 2022-05-31 | 深圳思谋信息科技有限公司 | 样本文本图像获取方法、文本识别模型训练方法和装置 |
CN114758339A (zh) * | 2022-06-15 | 2022-07-15 | 深圳思谋信息科技有限公司 | 字符识别模型的获取方法、装置、计算机设备和存储介质 |
TWI780409B (zh) * | 2020-02-19 | 2022-10-11 | 中華電信股份有限公司 | 訓練物件偵測模型的方法及系統 |
WO2023134143A1 (zh) * | 2022-01-17 | 2023-07-20 | 北京百度网讯科技有限公司 | 图像样本生成方法、文本识别方法、装置、设备和介质 |
CN116486418A (zh) * | 2023-06-19 | 2023-07-25 | 恒银金融科技股份有限公司 | 钞票冠字号图像的生成方法和装置 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104462061A (zh) * | 2014-12-05 | 2015-03-25 | 北京国双科技有限公司 | 词语提取方法及提取装置 |
CN105279238A (zh) * | 2015-09-28 | 2016-01-27 | 北京国双科技有限公司 | 字符串处理方法和装置 |
US9460360B2 (en) * | 2013-03-01 | 2016-10-04 | Impac Medical Systems, Inc. | Method and apparatus for learning-enhanced atlas-based auto-segmentation |
CN106157341A (zh) * | 2015-03-30 | 2016-11-23 | 阿里巴巴集团控股有限公司 | 生成合成图片的方法及装置 |
CN108154148A (zh) * | 2018-01-22 | 2018-06-12 | 厦门美亚商鼎信息科技有限公司 | 训练样本的人工合成方法及基于该样本的验证码识别方法 |
CN109272043A (zh) * | 2018-09-21 | 2019-01-25 | 北京京东金融科技控股有限公司 | 用于光学字符识别的训练数据生成方法、系统和电子设备 |
CN109544496A (zh) * | 2018-11-19 | 2019-03-29 | 南京旷云科技有限公司 | 训练数据的生成方法、对象检测模型的训练方法和装置 |
-
2019
- 2019-05-23 CN CN201910435628.7A patent/CN110163285B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9460360B2 (en) * | 2013-03-01 | 2016-10-04 | Impac Medical Systems, Inc. | Method and apparatus for learning-enhanced atlas-based auto-segmentation |
CN104462061A (zh) * | 2014-12-05 | 2015-03-25 | 北京国双科技有限公司 | 词语提取方法及提取装置 |
CN106157341A (zh) * | 2015-03-30 | 2016-11-23 | 阿里巴巴集团控股有限公司 | 生成合成图片的方法及装置 |
CN105279238A (zh) * | 2015-09-28 | 2016-01-27 | 北京国双科技有限公司 | 字符串处理方法和装置 |
CN108154148A (zh) * | 2018-01-22 | 2018-06-12 | 厦门美亚商鼎信息科技有限公司 | 训练样本的人工合成方法及基于该样本的验证码识别方法 |
CN109272043A (zh) * | 2018-09-21 | 2019-01-25 | 北京京东金融科技控股有限公司 | 用于光学字符识别的训练数据生成方法、系统和电子设备 |
CN109544496A (zh) * | 2018-11-19 | 2019-03-29 | 南京旷云科技有限公司 | 训练数据的生成方法、对象检测模型的训练方法和装置 |
Non-Patent Citations (1)
Title |
---|
徐飞 等: "海量食品安全事件下的命名实体识别研究", 《科研管理》 * |
Cited By (46)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110503159A (zh) * | 2019-08-28 | 2019-11-26 | 北京达佳互联信息技术有限公司 | 文字识别方法、装置、设备及介质 |
CN110956170A (zh) * | 2019-09-30 | 2020-04-03 | 京东数字科技控股有限公司 | 生成护照机读码样本的方法、装置、设备及存储介质 |
CN110991265A (zh) * | 2019-11-13 | 2020-04-10 | 四川大学 | 一种火车票图像的版面提取方法 |
CN110991265B (zh) * | 2019-11-13 | 2022-03-04 | 四川大学 | 一种火车票图像的版面提取方法 |
CN113012054A (zh) * | 2019-12-20 | 2021-06-22 | 舜宇光学(浙江)研究院有限公司 | 基于抠图的样本增强方法和训练方法及其系统和电子设备 |
CN113012054B (zh) * | 2019-12-20 | 2023-12-05 | 舜宇光学(浙江)研究院有限公司 | 基于抠图的样本增强方法和训练方法及其系统和电子设备 |
CN111291629A (zh) * | 2020-01-17 | 2020-06-16 | 平安医疗健康管理股份有限公司 | 图像中文本的识别方法、装置、计算机设备及计算机存储介质 |
CN111325117A (zh) * | 2020-02-05 | 2020-06-23 | 北京字节跳动网络技术有限公司 | 目标对象识别模型的训练方法、装置和电子设备 |
CN111325117B (zh) * | 2020-02-05 | 2024-01-26 | 北京字节跳动网络技术有限公司 | 目标对象识别模型的训练方法、装置和电子设备 |
TWI780409B (zh) * | 2020-02-19 | 2022-10-11 | 中華電信股份有限公司 | 訓練物件偵測模型的方法及系統 |
CN111414906B (zh) * | 2020-03-05 | 2024-05-24 | 北京交通大学 | 纸质票据图片的数据合成与文本识别方法 |
CN111414906A (zh) * | 2020-03-05 | 2020-07-14 | 北京交通大学 | 纸质票据图片的数据合成与文本识别方法 |
CN111524100A (zh) * | 2020-04-09 | 2020-08-11 | 武汉精立电子技术有限公司 | 一种缺陷图像样本生成方法、装置及面板缺陷检测方法 |
CN111524100B (zh) * | 2020-04-09 | 2023-04-18 | 武汉精立电子技术有限公司 | 一种缺陷图像样本生成方法、装置及面板缺陷检测方法 |
CN111523541A (zh) * | 2020-04-21 | 2020-08-11 | 上海云从汇临人工智能科技有限公司 | 一种基于ocr的数据生成方法、系统、设备及介质 |
CN111553298A (zh) * | 2020-05-07 | 2020-08-18 | 北京天仪百康科贸有限公司 | 一种基于区块链的火灾识别方法及系统 |
CN111652232A (zh) * | 2020-05-29 | 2020-09-11 | 泰康保险集团股份有限公司 | 票据识别方法及装置、电子设备和计算机可读存储介质 |
CN111652232B (zh) * | 2020-05-29 | 2023-08-22 | 泰康保险集团股份有限公司 | 票据识别方法及装置、电子设备和计算机可读存储介质 |
CN111738326A (zh) * | 2020-06-16 | 2020-10-02 | 中国工商银行股份有限公司 | 句粒度标注训练样本生成方法及装置 |
CN111950293B (zh) * | 2020-06-24 | 2023-06-23 | 北京百度网讯科技有限公司 | 语义表示模型的生成方法、装置、电子设备及存储介质 |
CN111950293A (zh) * | 2020-06-24 | 2020-11-17 | 北京百度网讯科技有限公司 | 语义表示模型的生成方法、装置、电子设备及存储介质 |
CN111914846A (zh) * | 2020-07-03 | 2020-11-10 | 苏州开心盒子软件有限公司 | 版面数据合成方法、设备及存储介质 |
CN111914846B (zh) * | 2020-07-03 | 2024-05-24 | 苏州开心盒子软件有限公司 | 版面数据合成方法、设备及存储介质 |
WO2021139179A1 (zh) * | 2020-07-31 | 2021-07-15 | 平安科技(深圳)有限公司 | 基于局部阴影特效的图像样本生成方法及装置 |
CN111931783A (zh) * | 2020-08-18 | 2020-11-13 | 创新奇智(重庆)科技有限公司 | 一种训练样本生成方法、机读码识别方法及装置 |
CN112001397A (zh) * | 2020-08-25 | 2020-11-27 | 广东光速智能设备有限公司 | 一种智慧工地的身份证字符识别训练数据生成方法及系统 |
CN111798543A (zh) * | 2020-09-10 | 2020-10-20 | 北京易真学思教育科技有限公司 | 模型训练方法、数据处理方法、装置、设备及存储介质 |
CN112214273B (zh) * | 2020-10-14 | 2023-04-21 | 合肥芯颖科技有限公司 | 一种数字时钟显示方法、装置、电子设备和存储介质 |
CN112214273A (zh) * | 2020-10-14 | 2021-01-12 | 合肥芯颖科技有限公司 | 一种数字时钟显示方法、装置、电子设备和存储介质 |
CN112529989A (zh) * | 2020-12-19 | 2021-03-19 | 杭州东信北邮信息技术有限公司 | 一种基于票据模板的图片重构方法 |
CN112686243A (zh) * | 2020-12-29 | 2021-04-20 | 平安普惠企业管理有限公司 | 智能识别图片文字的方法、装置、计算机设备及存储介质 |
CN112819274A (zh) * | 2020-12-30 | 2021-05-18 | 中国农业银行股份有限公司 | 金融凭证样本的生成方法、装置及相关方法 |
CN112926637A (zh) * | 2021-02-08 | 2021-06-08 | 天津职业技术师范大学(中国职业培训指导教师进修中心) | 一种文本检测训练集的生成方法 |
CN112766268A (zh) * | 2021-03-02 | 2021-05-07 | 阳光财产保险股份有限公司 | 一种文本标注生成方法、装置、电子设备及存储介质 |
CN113012265A (zh) * | 2021-04-22 | 2021-06-22 | 中国平安人寿保险股份有限公司 | 针式打印字符图像生成方法、装置、计算机设备和介质 |
CN113012265B (zh) * | 2021-04-22 | 2024-04-30 | 中国平安人寿保险股份有限公司 | 针式打印字符图像生成方法、装置、计算机设备和介质 |
CN112990205A (zh) * | 2021-05-11 | 2021-06-18 | 创新奇智(北京)科技有限公司 | 手写字符样本的生成方法及装置、电子设备、存储介质 |
CN112990205B (zh) * | 2021-05-11 | 2021-11-02 | 创新奇智(北京)科技有限公司 | 手写字符样本的生成方法及装置、电子设备、存储介质 |
CN113449728A (zh) * | 2021-07-21 | 2021-09-28 | 北京有竹居网络技术有限公司 | 一种文字识别方法及其相关设备 |
CN113762422B (zh) * | 2021-11-09 | 2022-04-05 | 广州思德医疗科技有限公司 | 一种图像训练集合成方法及系统 |
CN113762422A (zh) * | 2021-11-09 | 2021-12-07 | 广州思德医疗科技有限公司 | 一种图像训练集合成方法及系统 |
WO2023134143A1 (zh) * | 2022-01-17 | 2023-07-20 | 北京百度网讯科技有限公司 | 图像样本生成方法、文本识别方法、装置、设备和介质 |
CN114565915A (zh) * | 2022-04-24 | 2022-05-31 | 深圳思谋信息科技有限公司 | 样本文本图像获取方法、文本识别模型训练方法和装置 |
CN114758339A (zh) * | 2022-06-15 | 2022-07-15 | 深圳思谋信息科技有限公司 | 字符识别模型的获取方法、装置、计算机设备和存储介质 |
CN116486418B (zh) * | 2023-06-19 | 2023-10-03 | 恒银金融科技股份有限公司 | 钞票冠字号图像的生成方法和装置 |
CN116486418A (zh) * | 2023-06-19 | 2023-07-25 | 恒银金融科技股份有限公司 | 钞票冠字号图像的生成方法和装置 |
Also Published As
Publication number | Publication date |
---|---|
CN110163285B (zh) | 2021-03-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110163285A (zh) | 票证识别训练样本合成方法和计算机存储介质 | |
CN107133211A (zh) | 一种基于注意力机制的作文评分方法 | |
US20060103667A1 (en) | Method, system and computer readable code for automatic reize of product oriented advertisements | |
US20140176564A1 (en) | Chinese Character Constructing Method and Device, Character Constructing Method and Device, and Font Library Building Method | |
US20130014008A1 (en) | Adjusting an Automatic Template Layout by Providing a Constraint | |
CN107305630A (zh) | 文本序列识别方法和装置 | |
Nacenta et al. | FatFonts: combining the symbolic and visual aspects of numbers | |
CN109657204A (zh) | 使用非对称度量学习的自动配对字体 | |
CN103207854A (zh) | 中文文本可读性计量系统及其方法 | |
CN107480688A (zh) | 基于零样本学习的细粒度图像识别方法 | |
CN110489424A (zh) | 一种表格化信息提取的方法、装置、存储介质及电子设备 | |
Ma et al. | Ranking-based readability assessment for early primary children’s literature | |
US8429517B1 (en) | Generating and rendering a template for a pre-defined layout | |
CN107807958A (zh) | 一种文章列表个性化推荐方法、电子设备及存储介质 | |
CN113360608B (zh) | 人机结合的中文作文批改系统和方法 | |
Lopes et al. | EvoDesigner: Towards aiding creativity in graphic design | |
CN117034948B (zh) | 基于多特征自适应融合的段落识别方法、系统及存储介质 | |
CN115130437B (zh) | 一种文档智能填写方法、装置及存储介质 | |
Tashu et al. | Deep learning architecture for automatic essay scoring | |
JP2021051595A (ja) | 情報処理装置、情報処理方法及びプログラム | |
CN110489933B (zh) | 一种平面设计框架的生成方法及系统 | |
KR102602836B1 (ko) | 복잡한 다단 구조의 레이아웃으로 구성된 전자책 및 전자문서 데이터의 음성 합성 방법 및 장치 | |
US20160170941A1 (en) | Replicating the appearance of typographical attributes and text adornments in digital publications | |
Chen et al. | Data‐driven Handwriting Synthesis in a Conjoined Manner | |
Winiwarter et al. | VISCOSE-a Kanji Dictionary Enriched with VISual, COmpositional, and SEmantic Information |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |