CN113012265B - 针式打印字符图像生成方法、装置、计算机设备和介质 - Google Patents
针式打印字符图像生成方法、装置、计算机设备和介质 Download PDFInfo
- Publication number
- CN113012265B CN113012265B CN202110434791.9A CN202110434791A CN113012265B CN 113012265 B CN113012265 B CN 113012265B CN 202110434791 A CN202110434791 A CN 202110434791A CN 113012265 B CN113012265 B CN 113012265B
- Authority
- CN
- China
- Prior art keywords
- image
- disturbance
- character
- needle
- recognition result
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 68
- 238000007639 printing Methods 0.000 claims abstract description 31
- 238000012952 Resampling Methods 0.000 claims abstract description 30
- 238000012545 processing Methods 0.000 claims abstract description 22
- 230000002194 synthesizing effect Effects 0.000 claims abstract description 15
- 238000001514 detection method Methods 0.000 claims abstract description 13
- 239000011159 matrix material Substances 0.000 claims description 30
- 230000006870 function Effects 0.000 claims description 19
- 230000009466 transformation Effects 0.000 claims description 4
- 230000003094 perturbing effect Effects 0.000 claims 1
- 238000012549 training Methods 0.000 abstract description 8
- 230000000694 effects Effects 0.000 description 10
- 239000003086 colorant Substances 0.000 description 6
- 230000008569 process Effects 0.000 description 6
- 238000010586 diagram Methods 0.000 description 5
- 238000004891 communication Methods 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 3
- 230000000295 complement effect Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000005070 sampling Methods 0.000 description 3
- 238000006467 substitution reaction Methods 0.000 description 3
- 230000006835 compression Effects 0.000 description 2
- 238000007906 compression Methods 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 230000001360 synchronised effect Effects 0.000 description 2
- 238000007651 thermal printing Methods 0.000 description 2
- 102100032202 Cornulin Human genes 0.000 description 1
- 101000920981 Homo sapiens Cornulin Proteins 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 238000007648 laser printing Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000005055 memory storage Effects 0.000 description 1
- 230000001737 promoting effect Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T11/00—2D [Two Dimensional] image generation
- G06T11/60—Editing figures and text; Combining figures or text
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/60—Type of objects
- G06V20/62—Text, e.g. of license plates, overlay texts or captions on TV images
- G06V20/63—Scene text, e.g. street names
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/412—Layout analysis of documents structured with printed lines or input boxes, e.g. business forms or tables
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Multimedia (AREA)
- Artificial Intelligence (AREA)
- Image Processing (AREA)
- Record Information Processing For Printing (AREA)
Abstract
本申请实施例属于图像处理领域,应用于智慧城市的智慧企业或智慧政务领域中,涉及一种针式打印字符图像生成方法,包括接收字符图像生成请求,其中,所述字符图像生成请求中包括文字串;根据所述文字串从预设图片库中选择至少一张图片作为背景图像;基于所述背景图像、所述文字串和字体文件,采用检测重采样的方式进行文字图像合成,得到初始图像;通过移动最小二乘法,对所述初始图像进行扰动处理,得到目标针式打印字符图像。本申请还提供一种针式打印字符图像生成装置、计算机设备及存储介质。此外,采用本方法现有技术中对于纸张不平整造成的文字打印畸变,生成的针式打印字符图像达不到模型训练的要求的技术问题。
Description
技术领域
本申请涉及图像处理领域,特别是涉及一种针式打印字符图像生成方法、装置、计算机设备和存储介质。
背景技术
发票等票据上的文字大多是针式打印机打印而成,与激光和热敏打印字体相比,字体的壁画由细点组成,与传统的文字图像差别较大,难以识别。更重要的是,由于发票纸张不平整,在不平整的纸张上利用针式打印机打印的文字图像退化更加严重。这使得计算机对该文字图像识别效果较差。为识别这种文字图像,常常需要人工标注现有样本,用于训练识别模型。然后人工标注针式打印的成本较高,速度较慢,且样本有限。为补充训练数据的不足,需要一种高效的针式打印字符图像的生成方法。
现有方式中,采用的替换字体像素点的方式模拟针式字体,然后仅仅替换像素点并不能够有效模拟针式打印效果,其仅仅是模拟热敏打印的漏墨等效果,对于纸张不平整造成的文字打印畸变,其并未提出任何解决方案,因而,生成的针式打印字符图像达不到模型训练的要求。
发明内容
基于此,针对上述技术问题,本申请提供一种针式打印字符图像生成方法、装置、计算机设备及存储介质,以解决现有技术中对于纸张不平整造成的文字打印畸变,生成的针式打印字符图像达不到模型训练的要求的技术问题。
一种针式打印字符图像生成方法,所述方法包括:
接收字符图像生成请求,其中,所述字符图像生成请求中包括文字串;
根据所述文字串从预设图片库中选择至少一张图片作为背景图像;
基于所述背景图像、所述文字串和字体文件,采用检测重采样的方式进行文字图像合成,得到初始图像;
通过移动最小二乘法,对所述初始图像进行扰动处理,得到目标针式打印字符图像。
一种针式打印字符图像生成装置,所述装置包括:
请求模块,用于接收字符图像生成请求,其中,所述字符图像生成请求中包括文字串;
选择模块,用于根据所述文字串从预设图片库中选择至少一张图片作为背景图像;
合成模块,用于基于所述背景图像、所述文字串和字体文件,采用检测重采样的方式进行文字图像合成,得到初始图像;
扰动模块,用于通过移动最小二乘法,对所述初始图像进行扰动处理,得到目标针式打印字符图像。
一种计算机设备,包括存储器和处理器,以及存储在所述存储器中并可在所述处理器上运行的计算机可读指令,所述处理器执行所述计算机可读指令时实现上述针式打印字符图像生成方法的步骤。
一种计算机可读存储介质,所述计算机可读存储介质存储有计算机可读指令,所述计算机可读指令被处理器执行时实现上述针式打印字符图像生成方法的步骤。
上述针式打印字符图像生成方法、装置、计算机设备和存储介质,通过根据选择的字体、文字串以及背景图像采用检测重采样的方式对文字图像进行合成,然后通过移动最小二乘法对合成的初始图像进行扰动处理,得到目标针式打印字符图像,而且,得到的字符图像十分丰富,提高了样本的多样性,最重要的是解决了现有技术中对于纸张不平整造成的文字打印畸变,生成的针式打印字符图像达不到模型训练的要求的技术问题。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例的描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为针式打印字符图像生成方法的应用环境示意图;
图2为针式打印字符图像生成方法的流程示意图;
图3为针式打印字符图像生成方法中字符图像合成效果示意图;
图4为针式打印字符图像生成方法中字符图像带有畸变的字符图像效果示意图;
图5为针式打印字符图像生成装置的示意图;
图6为一个实施例中计算机设备的示意图。
具体实施方式
除非另有定义,本文所使用的所有的技术和科学术语与属于本申请的技术领域的技术人员通常理解的含义相同;本文中在申请的说明书中所使用的术语只是为了描述具体的实施例的目的,不是旨在于限制本申请;本申请的说明书和权利要求书及上述附图说明中的术语“包括”和“具有”以及它们的任何变形,意图在于覆盖不排他的包含。本申请的说明书和权利要求书或上述附图中的术语“第一”、“第二”等是用于区别不同对象,而不是用于描述特定顺序。
在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。
为了使本申请的目的、技术方案及优点更加清楚明白,下面结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例提供的针式打印字符图像生成方法,可以应用于如图1所示的应用环境中。其中,该应用环境可以包括终端102、网络以及服务端104,网络用于在终端102和服务端104之间提供通信链路介质,网络可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
用户可以使用终端102通过网络与服务端104交互,以接收或发送消息等。终端102上可以安装有各种通讯客户端应用,例如网页浏览器应用、购物类应用、搜索类应用、即时通信工具、邮箱客户端、社交平台软件等。
终端102可以是具有显示屏并且支持网页浏览的各种电子设备,包括但不限于智能手机、平板电脑、电子书阅读器、MP3播放器( Moving Picture Experts Group AudioLayer III,动态影像专家压缩标准音频层面3 )、MP4( Moving Picture Experts GroupAudio Layer IV,动态影像专家压缩标准音频层面4 )播放器、膝上型便携计算机和台式计算机等等。
服务端104可以是提供各种服务的服务器,例如对终端102上显示的页面提供支持的后台服务器。
需要说明的是,本申请实施例所提供的针式打印字符图像生成方法一般由服务端/终端执行,相应地,针式打印字符图像生成装置一般设置于服务端/终端设备中。
本申请可用于众多通用或专用的计算机系统环境或配置中。例如:个人计算机、服务器计算机、手持设备或便携式设备、平板型设备、多处理器系统、基于微处理器的系统、置顶盒、可编程的消费电子设备、网络PC、小型计算机、大型计算机、包括以上任何系统或设备的分布式计算环境等等。本申请可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本申请,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
本申请可应用于智慧城市领域中,特别是智慧企业和智慧银行以及智慧政务领域中,从而推动智慧城市的建设。
应该理解,图1中的终端、网络和服务端的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。
其中,终端102通过网络与服务端104进行通信。终端102 向服务端104发送生成字符图像的请求,服务端104响应该请求获取与请求中文字串匹配的背景图像,并将背景图像与文字串以及字体文件进行合成为包括打印字符的初始图像,然后通过移动最小二乘法获取用户对初始图像进行扰动处理得到最终的打印字符图像再发送给终端102图像生成结果。其中,终端102和服务端104之间通过网络进行连接,该网络可以是有线网络或者无线网络,终端102可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备,服务端104可以用独立的服务器或者是多个组成的服务器集群来实现。
在一个实施例中,如图2所示,提供了一种针式打印字符图像生成方法,以该方法应用于图1中的服务端为例进行说明,包括以下步骤:
步骤202,接收字符图像生成请求,其中,字符图像生成请求中包括文字串。
字符图像生成请求可以是用户通过终端向服务端发送的图像生成请求,一般该请求中携带用户选择的字符图像中字符的字体,以及需要生成的文字信息,即文字串,例如:希望**能够早点结束!而字体可以选择“宋体”或者“楷体”等字体文件中的任一种或多种,在本实施例中不做限定。
步骤204,根据文字串从预设图片库中选择至少一张图片作为背景图像。
预设图片库中包括多个不同单一颜色或者浅色的图片,在选择时,一般根据当前用户选择的文字串的文字颜色确定,与文字颜色尽量错分开。在一些实施例中,可以率先获取文字串的文字颜色,然后从预设图片库中选择与字体颜色呈补色对比的图片作为背景图像,其中,补色对比是最强烈、最极致的色相对比,在色相环上间隔180°的色相对比;例如,文字串的字体为楷体,文字颜色为黑,那么优选的背景图像的颜色背景为白。
一般的,在色相环上任意一种颜色的相邻颜色为邻近色,在伊顿色相环上间隔为30°以内的图片不建议选择为背景图像。因为邻近色对比的特点是色相因素上有互相渗透,色相变化比较少,对比较弱,不便于计算机进行文字的识别和提取。
步骤206,基于背景图像、文字串和字体文件,采用检测重采样的方式进行文字图像合成,得到初始图像。
重采样是指根据一类象元信息的过程,本实施例中,重采样是从文字串中才去点阵像素,来实现针状打印字符的模拟,常用的重采样方式有最邻近内插法(nearestneighbor interpolation)、双线性内插法(bilinear interpolation)和三次卷积内插法(cubic convolution interpolation)。
其中,字体文件是用于支持字符串显示在图片上的各种字体的文件,例如,若要在Word中使用“宋体”,则终端或者服务端上需要有存储一个能显示宋体的文件。
进一步地,在本实施例中,合成初始图像具体实现为:
基于字体文件和字符串,获取初始图像中字体的点阵信息;将字体的点阵信息中的各非0像素,采用预设符号替代,得到替换矩阵;通过间隔重采样的方式,按照预设的间隔,从替换矩阵中进行预设符号采集,得到针式打印字符;合成针式打印字符与背景图像,得到初始图像。
具体地,字体的点阵信息也叫位图字体,其中每个字形都以一组二维像素信息表示。这种文字显示方式于较早前的电脑系统(例如未有图形接口时的 DOS 操作系统)被普遍采用。由于位图的缘故,点阵字体很难进行缩放,特定的点阵字体只能清晰地显示在相应的字号下,否则文字只被强行放大而有损字形,产生成马赛克式的锯齿边缘。但对于字号8-14px 的尺寸较小的汉字字体(即现今操作系统大多采用的默认字号)现今亦仍然被使用于荧幕显示上,能够提供更高的显示效果;不过现今该种点阵字体主要只作为“辅助”的部分,当用户设置的字体尺寸并没有拥有位图像时,字体便会以矢量图象方式显示;而当打印时,印有字体无论大小亦会使用矢量字体打印。常见的纯点阵字体有bdf,pcf,fnt,hbf 等格式。在本实施例中,获取初始图像中文字的点阵信息包括,获取初始图像中文字串对应的字体的点阵信息作为得到的点阵信息。
可选地,若字体文件地格式为TTF字体,则可以通过GetGlyphOutline函数获取的点阵信息。其中,GetGlyphOutline为Windows API中的功能函数,该函数用于取得被选进指定设备环境的TrueType字体的字符轮廓或位图。
如图3所示的字符图像合成效果示意图,其中,预设符号包括但不限于:灰度的█或◆或●等等,具体可根据实际需求进行设定 ,得到针式打印字符,此处不错限定。
在本实施例中,通过重采样的方式,可以快速生成打印字符,有利于提高针式打印字符图像的生成效率。而且在针式打印文字图像合成的过程中采用间隔重采样的方式,利用灰度的预设符号代替相似进行字符点的重排,能够获得更为逼真的针式打印文字图像。
可选地,在通过间隔重采样,按照预设的间隔从替换矩阵中进行预设符号采集,得到针式打印字符具体实现可以是:
对替换矩阵中的每一矩阵行,从左到右进行间隔重采样处理,并将间隔重采样得到的预设符号间隔排列后,便可以得到针式打印字符。其中,预设的间隔可以是1,也可以是2,具体可以根据实际需要设定,本实施例中不做限定。
步骤208,通过移动最小二乘法,对初始图像进行扰动处理,得到目标针式打印字符图像。
其中,移动最小二乘法(Moving Least Square,MLS)是形成无网格方法逼近函数的方式之一。移动最小二乘法是在最小二乘法的基础上,采用不同的拟合函数,MLS建立拟合函数不是采用传统的多项式或者其他函数,而是由一个系数向量a(x)和奇函数p(x)构成,这里的a(x)不是常数,而是坐标x的函数。
具体地,对初始进行扰动处理得到打印字符图像的实现可以是:
从初始图像的针式打印字符中,随机选取多个点作为扰动点,例如N个点作为扰动点/>,并获取预设扰动半径R,其中,N为正整数,R为正数;从参数集中,随机选取一个第一移动方向参数/>,并进行取反操作,得到第二移动方向参数/>;在预设扰动半径内,基于第一移动方向参数/>和第二移动方向参数/>对任一扰动点进行扰动处理,得到第一扰动点/>和第二扰动点/>;基于第一扰动点/>和第二扰动点/>,采用移动最小二乘法变换,得到扰动后的第一扰动图像/>和第二扰动图像/>;通过识别网络分别对第一扰动图像/>和第二扰动图像/>进行识别,得到第一识别结果/>和第二识别结果/>;分别计算第一识别结果/>和第二识别结果/>的字符串编辑距离/>,并根据字符串编辑距离/>从第一识别结果/>和第二识别结果/>中选取得到目标针式打印字符图像。
在本实施例中,参数集包含若干移动方向参数,通过从参数集中选取参数进行扰动,相对于随机扰动,能够更好控制点扰动的效果,后续通过对参数集的更小,有利于提高生成图像的效率和质量。其中,字符串编辑距离,又称为,由俄罗斯科学家Vladimir Levenshtein在1965年提出。是指利用字符操作,把字符串A转换成字符串B所需要的最少操作,其中,字符操作包括:删除一个字符、插入一个字符和修改一个字符等等,例如对于字符串“if”和“iff”,可以通过杀入一个“f”或者删除一个“f”来达到使二者相同的目的。
其中,本申请中的识别网络,为用于进行文字识别的深度学习网络,具体可以是CRNN网络,或者基于注意力机制的深度网络,此处不作限制。
进一步地,在根据字符串编辑距离 从扰动后的图像和/>中选取目标真实打印字符图像包括:
字符串编辑距离包括与第一识别对应的第一字符串编辑距离和与第二识别结果对应的第二字符串编辑距离/>:对比第一字符串编辑距离和第二字符串编辑距离,若第一字符串编辑距离与第二字符串编辑距离相等,则将第一识别结果对应的第一扰动图像作为目标针式打印字符图像;若第一字符串编辑距离小于第二字符串编辑距离,则将第二识别结果对应的第二扰动图像作为目标针式打印字符图像,其中,GT是groundtruth的缩写,是指实际已知的真实的字符图片中字符串,如果人工标注为“个人交往的广义活动”,但是预测值可能是“个人交往的义活动”,所以,在本实施例中,GT即指人工标注结果。
可选地,在根据字符串编辑距离从第一识别结果和第二识别结果中选取得到目标针式打印字符图像之后,还可以对识别网络和参数集进行更新,具体包括:
若第一字符串编辑距离不小于第二字符串编辑距离,则将第一识别结果对应的第一扰动图像作为目标针式打印字符图像;若第一字符串编辑距离小于第二字符串编辑距离,则确定更新损失函数对识别网络和参数集进行更新。
具体地,可以通过更新损失函数:,
对识别网络和参数集进行更新,其中,指扰动点,/>为参数集中移动方向参数,/>指扰动图像/>和/>,当识别网络收敛,或者损失函数的损失值达到预设的值后,停止更新。
如图4所示的带有畸变的字符图像示意图,在一些实施例中,本申请针对局部畸变的问题,涉及了扰动学习的方案,学习到对识别网络中更有用的扰动参数,使得得到的字符图像实际中带有局部畸变的针式打印图像。通过在每轮中更新识别网络和参数集,可以在生成的每个新的字符图像的基础上对识别网络和参数集进行更新,就可以在下一轮字符图像生成时,增加图像的多样性和生成的字符图像中文字的标准性。相比于现有技术中的点阵拷贝转印的方法,本申请采用的间隔重采样生成的字符与针式打印得到的更为相似,合成的文字图像与真实发票更加逼近;而且还针对点扰动的问题,可学习的进行点扰动,比较学习得出对识别网络来说分布更加宽泛的扰动参数,模拟出更为真实的带有形状畸变的针式打印字符。
上述针式打印字符图像生成方法中,通过根据选择的字体、文字串以及背景图像采用检测重采样的方式对文字图像进行合成,然后通过移动最小二乘法对合成的初始图像进行扰动处理,得到目标针式打印字符图像,而且,得到的字符图像十分丰富,提高了样本的多样性,最重要的是解决了现有技术中对于纸张不平整造成的文字打印畸变,生成的针式打印字符图像达不到模型训练的要求的技术问题。
应该理解的是,虽然图2的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图2中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
在一个实施例中,如图5所示,提供了一种针式打印字符图像生成装置,该针式打印字符图像生成装置与上述实施例中针式打印字符图像生成方法一一对应。该针式打印字符图像生成装置包括:
请求模块502,用于接收字符图像生成请求,其中,字符图像生成请求中包括文字串;
选择模块504,用于根据文字串从预设图片库中选择至少一张图片作为背景图像;
合成模块506,用于基于背景图像、文字串和字体文件,采用检测重采样的方式进行文字图像合成,得到初始图像;
扰动模块508,用于通过移动最小二乘法,对初始图像进行扰动处理,得到目标针式打印字符图像。
进一步地,选择模块504,包括:
点阵获取子模块,用于基于字体文件和文字串,获取初始图像中字体的点阵信息;
像素替换子模块,用于将字体的点阵信息中的各非0像素,采用预设符号替代,得到替换矩阵;
间隔采样子模块,用于通过间隔重采样的方式,按照预设的间隔,从替换矩阵中进行预设符号采集,得到针式打印字符;
图像合成子模块,用于合成针式打印字符与背景图像,得到初始图像。
进一步地,间隔采样子模块,包括:
间隔采样单元,用于对替换矩阵中的每一矩阵行,从左到右进行间隔重采样,并将重采样得到的预设符号间隔排列,得到针式打印字符。
进一步地,扰动模块508,包括:
随机扰动子模块,用于从初始图像的针式打印字符中,随机选取多个点作为扰动点,并获取预设扰动半径;
参数取反子模块,用于从参数集中,随机选取一个第一移动方向参数,并进行取反操作,得到第二移动方向参数;
像素扰动子模块,用于在预设扰动半径内,基于第一移动方向参数和第二移动方向参数对任一扰动点进行扰动处理,得到第一扰动点和第二扰动点;
像素变换子模块,用于基于第一扰动点和第二扰动点,采用移动最小二乘法变换,得到扰动后的第一扰动图像和第二扰动图像;
图像识别子模块,用于通过识别网络分别对第一扰动图像和第二扰动图像进行识别,得到第一识别结果和第二识别结果;
距离计算子模块,用于分别计算第一识别结果和第二识别结果的字符串编辑距离,并根据字符串编辑距离从第一识别结果和第二识别结果中选取得到目标针式打印字符图像。
进一步地,距离计算子模块,包括:
第一对比单元,用于若第一字符串编辑距离与第二字符串编辑距离相等,则将第一识别结果对应的第一扰动图像作为目标针式打印字符图像;
第二对比单元,用于若第一字符串编辑距离小于第二字符串编辑距离,则将第二识别结果对应的第二扰动图像作为目标针式打印字符图像。
进一步地,在距离计算子模块之后,还包括:
对比子模块,用于若第一字符串编辑距离不小于第二字符串编辑距离,则将第一识别结果对应的第一扰动图像作为目标针式打印字符图像;
更新子模块,用于若第一字符串编辑距离小于第二字符串编辑距离,则确定更新损失函数对识别网络和参数集进行更新。
上述针式打印字符图像生成装置,通过根据选择的字体、文字串以及背景图像采用检测重采样的方式对文字图像进行合成,然后通过移动最小二乘法对合成的初始图像进行扰动处理,得到目标针式打印字符图像,而且,得到的字符图像十分丰富,提高了样本的多样性,最重要的是解决了现有技术中对于纸张不平整造成的文字打印畸变,生成的针式打印字符图像达不到模型训练的要求的技术问题。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图6所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机可读指令和数据库。该内存储器为非易失性存储介质中的操作系统和计算机可读指令的运行提供环境。该计算机设备的数据库用于存储字符图像。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机可读指令被处理器执行时以实现一种针式打印字符图像生成方法。本实施例通过根据选择的字体、文字串以及背景图像采用检测重采样的方式对文字图像进行合成,然后通过移动最小二乘法对合成的初始图像进行扰动处理,得到目标针式打印字符图像,而且,得到的字符图像十分丰富,提高了样本的多样性,最重要的是解决了现有技术中对于纸张不平整造成的文字打印畸变,生成的针式打印字符图像达不到模型训练的要求的技术问题。
其中,本技术领域技术人员可以理解,这里的计算机设备是一种能够按照事先设定或存储的指令,自动进行数值计算和/或信息处理的设备,其硬件包括但不限于微处理器、专用集成电路(Application Specific Integrated Circuit,ASIC)、可编程门阵列(Field-Programmable Gate Array,FPGA)、数字处理器 (Digital Signal Processor,DSP)、嵌入式设备等。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机可读指令,计算机可读指令被处理器执行时实现上述实施例中针式打印字符图像生成方法的步骤,例如图2所示的步骤202至步骤208,或者,处理器执行计算机可读指令时实现上述实施例中针式打印字符图像生成装置的各模块/单元的功能,例如图5所示模块502至模块508的功能。
本实施例通过根据选择的字体、文字串以及背景图像采用检测重采样的方式对文字图像进行合成,然后通过移动最小二乘法对合成的初始图像进行扰动处理,得到目标针式打印字符图像,而且,得到的字符图像十分丰富,提高了样本的多样性,最重要的是解决了现有技术中对于纸张不平整造成的文字打印畸变,生成的针式打印字符图像达不到模型训练的要求的技术问题。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机可读指令来指令相关的硬件来完成,所述的计算机可读指令可存储于一非易失性计算机可读取存储介质中,该计算机可读指令在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink) DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将所述装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形、改进或者对部分技术特征进行等同替换,而这些修改或者替换,并不使相同技术方案的本质脱离本发明个实施例技术方案地精神和范畴,都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。
Claims (9)
1.一种针式打印字符图像生成方法,其特征在于,所述方法包括:
接收字符图像生成请求,其中,所述字符图像生成请求中包括文字串;
根据所述文字串从预设图片库中选择至少一张图片作为背景图像;
基于所述背景图像、所述文字串和字体文件,采用检测重采样的方式进行文字图像合成,得到初始图像;
通过移动最小二乘法,对所述初始图像进行扰动处理,得到目标针式打印字符图像;
所述通过移动最小二乘法,对所述初始图像进行扰动处理,得到目标针式打印字符图像的步骤包括:
从所述初始图像的针式打印字符中,随机选取多个点作为扰动点,并获取预设扰动半径;
从参数集中,随机选取一个第一移动方向参数,并进行取反操作,得到第二移动方向参数;
在所述预设扰动半径内,基于所述第一移动方向参数和所述第二移动方向参数对任一扰动点进行扰动处理,得到第一扰动点和第二扰动点;
基于所述第一扰动点和所述第二扰动点,采用移动最小二乘法变换,得到扰动后的第一扰动图像和第二扰动图像;
通过识别网络分别对所述第一扰动图像和所述第二扰动图像进行识别,得到第一识别结果和第二识别结果;
分别计算所述第一识别结果和所述第二识别结果的字符串编辑距离,并根据所述字符串编辑距离从所述第一识别结果和所述第二识别结果中选取得到所述目标针式打印字符图像。
2.根据权利要求1所述的方法,其特征在于,所述基于所述背景图像、所述文字串和字体文件,采用检测重采样的方式进行文字图像合成,得到初始图像,其中,所述初始图像上包括针式打印字符,包括:
基于所述字体文件和所述文字串,获取所述初始图像中字体的点阵信息;
将所述字体的点阵信息中的各非0像素,采用预设符号替代,得到替换矩阵;
通过间隔重采样的方式,按照预设的间隔,从所述替换矩阵中进行预设符号采集,得到针式打印字符;
合成所述针式打印字符与所述背景图像,得到所述初始图像。
3.根据权利要求2所述的方法,其特征在于,所述通过间隔重采样的方式,按照预设的间隔,从所述替换矩阵中进行预设符号采集,得到针式打印字符,包括:
对所述替换矩阵中的每一矩阵行,从左到右进行间隔重采样,并将重采样得到的预设符号间隔排列,得到所述针式打印字符。
4.根据权利要求1所述的方法,其特征在于,所述字符串编辑距离包括与所述第一识别结果对应的第一字符串编辑距离和与所述第二识别结果对应的第二字符串编辑距离,所述根据所述字符串编辑距离从所述第一识别结果和所述第二识别结果中选取得到所述目标针式打印字符图像,包括:
若所述第一字符串编辑距离与所述第二字符串编辑距离相等,则将所述第一识别结果对应的第一扰动图像作为目标针式打印字符图像;
若所述第一字符串编辑距离小于所述第二字符串编辑距离,则将所述第二识别结果对应的第二扰动图像作为所述目标针式打印字符图像。
5.根据权利要求4所述的方法,其特征在于,所述字符串编辑距离包括与所述第一识别结果对应的第一字符串编辑距离和与所述第二识别结果对应的第二字符串编辑距离,在所述根据所述字符串编辑距离从所述第一识别结果和所述第二识别结果中选取得到所述目标针式打印字符图像之后,还包括:
若所述第一字符串编辑距离不小于所述第二字符串编辑距离,则将所述第一识别结果对应的第一扰动图像作为所述目标针式打印字符图像;
若所述第一字符串编辑距离小于所述第二字符串编辑距离,则确定更新损失函数对所述识别网络和所述参数集进行更新。
6.根据权利要求5所述的方法,其特征在于,所述确定更新损失函数对所述识别网络和所述参数集进行更新,包括:
通过更新损失函数:
,对所述识别网络和参数集进行更新,其中,/>指扰动点,为参数集中移动方向参数,/>指扰动图像。
7.一种针式打印字符图像生成装置,其特征在于,包括:
请求模块,用于接收字符图像生成请求,其中,所述字符图像生成请求中包括文字串;
选择模块,用于根据所述文字串从预设图片库中选择至少一张图片作为背景图像;
合成模块,用于基于所述背景图像、所述文字串和字体文件,采用检测重采样的方式进行文字图像合成,得到初始图像;
扰动模块,用于通过移动最小二乘法,对所述初始图像进行扰动处理,得到目标针式打印字符图像,其中,所述用于通过移动最小二乘法,对所述初始图像进行扰动处理,得到目标针式打印字符图像的步骤包括:从所述初始图像的针式打印字符中,随机选取多个点作为扰动点,并获取预设扰动半径;从参数集中,随机选取一个第一移动方向参数,并进行取反操作,得到第二移动方向参数;在所述预设扰动半径内,基于所述第一移动方向参数和所述第二移动方向参数对任一扰动点进行扰动处理,得到第一扰动点和第二扰动点;基于所述第一扰动点和所述第二扰动点,采用移动最小二乘法变换,得到扰动后的第一扰动图像和第二扰动图像;通过识别网络分别对所述第一扰动图像和所述第二扰动图像进行识别,得到第一识别结果和第二识别结果;分别计算所述第一识别结果和所述第二识别结果的字符串编辑距离,并根据所述字符串编辑距离从所述第一识别结果和所述第二识别结果中选取得到所述目标针式打印字符图像。
8.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机可读指令,其特征在于,所述处理器执行所述计算机可读指令时实现权利要求1至6中任一项所述方法的步骤。
9.一种计算机可读存储介质,其上存储有计算机可读指令,其特征在于,所述计算机可读指令被处理器执行时实现权利要求1至6中任一项所述的方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110434791.9A CN113012265B (zh) | 2021-04-22 | 2021-04-22 | 针式打印字符图像生成方法、装置、计算机设备和介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110434791.9A CN113012265B (zh) | 2021-04-22 | 2021-04-22 | 针式打印字符图像生成方法、装置、计算机设备和介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113012265A CN113012265A (zh) | 2021-06-22 |
CN113012265B true CN113012265B (zh) | 2024-04-30 |
Family
ID=76389293
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110434791.9A Active CN113012265B (zh) | 2021-04-22 | 2021-04-22 | 针式打印字符图像生成方法、装置、计算机设备和介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113012265B (zh) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114419613A (zh) * | 2022-01-17 | 2022-04-29 | 北京百度网讯科技有限公司 | 图像样本生成方法、文本识别方法、装置、设备和介质 |
CN115310405A (zh) * | 2022-07-21 | 2022-11-08 | 北京汉仪创新科技股份有限公司 | 基于对抗生成网络的字体替换方法、系统、设备和介质 |
CN116051490B (zh) * | 2022-12-30 | 2023-06-20 | 北京辰光融信技术有限公司 | 文档打印质量检测方法、打印装置、电子设备和储存介质 |
CN117217876B (zh) * | 2023-11-08 | 2024-03-26 | 深圳市明心数智科技有限公司 | 基于ocr技术的订单预处理方法、装置、设备及介质 |
Citations (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5185673A (en) * | 1991-06-12 | 1993-02-09 | Hewlett-Packard Company | Automated image calibration |
CN107102998A (zh) * | 2016-02-22 | 2017-08-29 | 阿里巴巴集团控股有限公司 | 一种字符串距离计算方法和装置 |
CN107274345A (zh) * | 2017-06-07 | 2017-10-20 | 众安信息技术服务有限公司 | 一种中文打印字符图像合成方法及装置 |
CN108415073A (zh) * | 2018-03-06 | 2018-08-17 | 中国科学院测量与地球物理研究所 | 角度域逆散射偏移成像方法及装置 |
CN109147011A (zh) * | 2018-08-27 | 2019-01-04 | 平安科技(深圳)有限公司 | 车牌图像生成方法、装置、计算机设备及存储介质 |
CN109685100A (zh) * | 2018-11-12 | 2019-04-26 | 平安科技(深圳)有限公司 | 字符识别方法、服务器及计算机可读存储介质 |
CN110163285A (zh) * | 2019-05-23 | 2019-08-23 | 阳光保险集团股份有限公司 | 票证识别训练样本合成方法和计算机存储介质 |
CN110503100A (zh) * | 2019-08-16 | 2019-11-26 | 湖南星汉数智科技有限公司 | 一种医疗单据识别方法、装置、计算机装置及计算机可读存储介质 |
CN110807823A (zh) * | 2019-11-13 | 2020-02-18 | 四川大学 | 一种点阵字符打印效果的图像仿真生成方法 |
CN111402124A (zh) * | 2020-03-24 | 2020-07-10 | 支付宝(杭州)信息技术有限公司 | 一种纹理图像和合成图像的生成方法和装置 |
CN111784556A (zh) * | 2020-06-23 | 2020-10-16 | 中国平安人寿保险股份有限公司 | 在图像中添加数字水印的方法、装置、终端及存储介质 |
CN112001397A (zh) * | 2020-08-25 | 2020-11-27 | 广东光速智能设备有限公司 | 一种智慧工地的身份证字符识别训练数据生成方法及系统 |
CN112464845A (zh) * | 2020-12-04 | 2021-03-09 | 山东产研鲲云人工智能研究院有限公司 | 票据识别方法、设备及计算机存储介质 |
CN112529989A (zh) * | 2020-12-19 | 2021-03-19 | 杭州东信北邮信息技术有限公司 | 一种基于票据模板的图片重构方法 |
CN112581541A (zh) * | 2020-12-23 | 2021-03-30 | 苏州挚途科技有限公司 | 参数的评估方法、装置和电子设备 |
CN112651399A (zh) * | 2020-12-30 | 2021-04-13 | 中国平安人寿保险股份有限公司 | 检测倾斜图像中同行文字的方法及其相关设备 |
CN112686243A (zh) * | 2020-12-29 | 2021-04-20 | 平安普惠企业管理有限公司 | 智能识别图片文字的方法、装置、计算机设备及存储介质 |
-
2021
- 2021-04-22 CN CN202110434791.9A patent/CN113012265B/zh active Active
Patent Citations (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5185673A (en) * | 1991-06-12 | 1993-02-09 | Hewlett-Packard Company | Automated image calibration |
CN107102998A (zh) * | 2016-02-22 | 2017-08-29 | 阿里巴巴集团控股有限公司 | 一种字符串距离计算方法和装置 |
CN107274345A (zh) * | 2017-06-07 | 2017-10-20 | 众安信息技术服务有限公司 | 一种中文打印字符图像合成方法及装置 |
CN108415073A (zh) * | 2018-03-06 | 2018-08-17 | 中国科学院测量与地球物理研究所 | 角度域逆散射偏移成像方法及装置 |
CN109147011A (zh) * | 2018-08-27 | 2019-01-04 | 平安科技(深圳)有限公司 | 车牌图像生成方法、装置、计算机设备及存储介质 |
CN109685100A (zh) * | 2018-11-12 | 2019-04-26 | 平安科技(深圳)有限公司 | 字符识别方法、服务器及计算机可读存储介质 |
CN110163285A (zh) * | 2019-05-23 | 2019-08-23 | 阳光保险集团股份有限公司 | 票证识别训练样本合成方法和计算机存储介质 |
CN110503100A (zh) * | 2019-08-16 | 2019-11-26 | 湖南星汉数智科技有限公司 | 一种医疗单据识别方法、装置、计算机装置及计算机可读存储介质 |
CN110807823A (zh) * | 2019-11-13 | 2020-02-18 | 四川大学 | 一种点阵字符打印效果的图像仿真生成方法 |
CN111402124A (zh) * | 2020-03-24 | 2020-07-10 | 支付宝(杭州)信息技术有限公司 | 一种纹理图像和合成图像的生成方法和装置 |
CN111784556A (zh) * | 2020-06-23 | 2020-10-16 | 中国平安人寿保险股份有限公司 | 在图像中添加数字水印的方法、装置、终端及存储介质 |
CN112001397A (zh) * | 2020-08-25 | 2020-11-27 | 广东光速智能设备有限公司 | 一种智慧工地的身份证字符识别训练数据生成方法及系统 |
CN112464845A (zh) * | 2020-12-04 | 2021-03-09 | 山东产研鲲云人工智能研究院有限公司 | 票据识别方法、设备及计算机存储介质 |
CN112529989A (zh) * | 2020-12-19 | 2021-03-19 | 杭州东信北邮信息技术有限公司 | 一种基于票据模板的图片重构方法 |
CN112581541A (zh) * | 2020-12-23 | 2021-03-30 | 苏州挚途科技有限公司 | 参数的评估方法、装置和电子设备 |
CN112686243A (zh) * | 2020-12-29 | 2021-04-20 | 平安普惠企业管理有限公司 | 智能识别图片文字的方法、装置、计算机设备及存储介质 |
CN112651399A (zh) * | 2020-12-30 | 2021-04-13 | 中国平安人寿保险股份有限公司 | 检测倾斜图像中同行文字的方法及其相关设备 |
Also Published As
Publication number | Publication date |
---|---|
CN113012265A (zh) | 2021-06-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113012265B (zh) | 针式打印字符图像生成方法、装置、计算机设备和介质 | |
CN102880849B (zh) | 一种二维码识别方法,及设备 | |
CN107016387B (zh) | 一种识别标签的方法及装置 | |
US20190304066A1 (en) | Synthesis method of chinese printed character images and device thereof | |
CN101430768B (zh) | 一种二维条码的定位方法 | |
CN109035370B (zh) | 一种图片标注方法与系统 | |
CN109408058B (zh) | 基于机器学习的前端辅助开发方法和装置 | |
CN109255826B (zh) | 中文训练图像生成方法、装置、计算机设备及存储介质 | |
CN109948518B (zh) | 一种基于神经网络的pdf文档内容文本段落聚合的方法 | |
CN111091167A (zh) | 标志识别训练数据合成方法、装置、电子设备及存储介质 | |
KR102248823B1 (ko) | 데이터 시각화 서비스 시스템, 방법 및 어플리케이션 | |
CN112686243A (zh) | 智能识别图片文字的方法、装置、计算机设备及存储介质 | |
CN113012075A (zh) | 一种图像矫正方法、装置、计算机设备及存储介质 | |
CN111768461A (zh) | 一种基于电子价签的图片生成方法 | |
CN114332895A (zh) | 文本图像合成方法、装置、设备、存储介质和程序产品 | |
CN112418206B (zh) | 基于位置检测模型的图片分类方法及其相关设备 | |
CN112581344A (zh) | 一种图像处理方法、装置、计算机设备及存储介质 | |
CN111353493A (zh) | 文本图像方向校正方法及装置 | |
CN114565915B (zh) | 样本文本图像获取方法、文本识别模型训练方法和装置 | |
CN107943760B (zh) | Pdf文档编辑的字体优化方法、装置、终端设备和存储介质 | |
CN116052195A (zh) | 文档解析方法、装置、终端设备和计算机可读存储介质 | |
CN112395834B (zh) | 基于图片输入的脑图生成方法、装置、设备及存储介质 | |
CN112365402B (zh) | 智能组卷方法、装置、存储介质及电子设备 | |
CN114627464A (zh) | 文本识别方法、装置、电子设备和存储介质 | |
CN112395450A (zh) | 图片文字检测方法、装置、计算机设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant |