CN109522898A - 手写样本图片标注方法、装置、计算机设备及存储介质 - Google Patents

手写样本图片标注方法、装置、计算机设备及存储介质 Download PDF

Info

Publication number
CN109522898A
CN109522898A CN201811084479.6A CN201811084479A CN109522898A CN 109522898 A CN109522898 A CN 109522898A CN 201811084479 A CN201811084479 A CN 201811084479A CN 109522898 A CN109522898 A CN 109522898A
Authority
CN
China
Prior art keywords
picture
handwriting samples
marked
text
samples picture
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201811084479.6A
Other languages
English (en)
Inventor
金晨
刘克亮
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Technology Shenzhen Co Ltd
Original Assignee
Ping An Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Technology Shenzhen Co Ltd filed Critical Ping An Technology Shenzhen Co Ltd
Priority to CN201811084479.6A priority Critical patent/CN109522898A/zh
Publication of CN109522898A publication Critical patent/CN109522898A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/153Segmentation of character regions using recognition of characters or words
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/28Quantising the image, e.g. histogram thresholding for discrimination between background and foreground patterns
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

本发明公开了一种手写样本图片标注方法、装置、计算机设备及存储介质。所述方法包括:获取待标注的手写样本图片和该手写样本图片中包含的手写文本的文本内容;对手写样本图片进行图像预处理,得到手写样本图片对应的二值化图像,并获取该二值化图像的图片尺寸;根据二值化图像中每个像素点的像素值,确定手写文本在二值化图像中对应的目标像素点,并根据目标像素点得到手写文本在手写样本图片中的相对位置信息;设置手写样本图片的图片名称;对图片名称、文本内容、相对位置信息,以及图片尺寸进行组合,得到待标注的手写样本图片的标注信息。本发明的技术方案提高了样本标注效率,以及标注内容的完整性和准确性。

Description

手写样本图片标注方法、装置、计算机设备及存储介质
技术领域
本发明涉及计算机技术领域,尤其涉及一种手写样本图片标注方法、装置、计算机设备及存储介质。
背景技术
在对手写文本识别的研究中,需要准备大量的手写样本以支撑手写文本识别模型的模型训练。
但是,目前的手写样本往往以人工收集为主,由于手写样本的种类繁多,造成人工收集手写样本的工作量大,在人工收集到大量的手写样本后,还需要采用人工方式花费大量的时间和精力对收集到的手写样本进行样本内容标注,导致手写样本的标注效率低,造成用于模型训练和测试的手写样本的生成效率低,同时,人工标注的方式也无法保证标注内容的准确性及完整性。
发明内容
本发明实施例提供一种手写样本图片标注方法、装置、计算机设备及存储介质,以解决目前对手写样本的标注效率低,以及标注内容的准确性和完整性均不高的问题。
一种手写样本图片标注方法,包括:
获取待标注的手写样本图片和所述待标注的手写样本图片中包含的手写文本的文本内容;
对所述待标注的手写样本图片进行图像预处理,得到所述待标注的手写样本图片对应的二值化图像,并获取所述二值化图像的图片尺寸;
根据所述二值化图像中每个像素点的像素值,确定所述手写文本在所述二值化图像中对应的目标像素点,并根据所述目标像素点在所述二值化图像中的位置坐标,确定所述待标注的手写文本在所述手写样本图片中的相对位置信息;
根据预设的命名方式,设置所述待标注的手写样本图片的图片名称;
按照预设的第一组合方式,对所述图片名称、所述文本内容、所述相对位置信息,以及所述图片尺寸进行组合,得到所述待标注的手写样本图片的标注信息;
将所述待标注的手写样本图片和所述标注信息对应保存到预设的手写样本数据库中。
一种手写样本图片标注装置,包括:
获取模块,用于获取待标注的手写样本图片和所述待标注的手写样本图片中包含的手写文本的文本内容;
预处理模块,用于对所述待标注的手写样本图片进行图像预处理,得到所述待标注的手写样本图片对应的二值化图像,并获取所述二值化图像的图片尺寸;
位置确定模块,用于根据所述二值化图像中每个像素点的像素值,确定所述手写文本在所述二值化图像中对应的目标像素点,并根据所述目标像素点在所述二值化图像中的位置坐标,确定所述手写文本在所述待标注的手写样本图片中的相对位置信息;
名称设置模块,用于根据预设的命名方式,设置所述待标注的手写样本图片的图片名称;
第一组合模块,用于按照预设的第一组合方式,对所述图片名称、所述文本内容、所述相对位置信息,以及所述图片尺寸进行组合,得到所述待标注的手写样本图片的标注信息;
保存模块,用于将所述待标注的手写样本图片和所述标注信息对应保存到预设的手写样本数据库中。
一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述手写样本图片标注方法的步骤。
一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述手写样本图片标注方法的步骤。
上述手写样本图片标注方法、装置、计算机设备及存储介质中,通过对获取到的待标注的手写样本图片进行图像预处理,得到二值化图像及其图片尺寸,根据二值化图像中每个像素点的像素值,确定手写文本在待标注的手写样本图片中的相对位置信息,并按照预设命名方式,设置待标注的手写样本图片的图片名称,然后按照预设的第一组合方式,对图片尺寸、图片名称、手写文本的文本内容和相对位置信息进行组合,得到待标注的手写样本图片的标注信息,实现了自动生成标注信息,无需人工标注,提高了样本标注效率,进而提高用于模型训练和测试的手写样本数据库的生成效率,同时,标注信息的内容根据图片尺寸、图片名称、手写文本的文本内容和相对位置信息等属性信息自动组合生成,该标注信息能够全面细致的描述手写样本图片的内容,并且其标注格式可自定义,从而能够有效提高标注内容的完整性和准确性。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例的描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本发明一实施例中手写样本图片标注方法的一流程图;
图2是本发明一实施例中手写样本图片标注方法中一具体手写样本图片的示意图;
图3是本发明一实施例中手写样本图片标注方法中步骤S2的一流程图;
图4是本发明一实施例中手写样本图片标注方法中采用另一标注方式生成标注信息的一流程图;
图5是本发明一实施例中手写样本图片标注方法中生成待标注的手写样本图片的一流程图;
图6是本发明一实施例中手写样本图片标注方法中对待标注的手写样本图片进行扩充处理的一流程图;
图7是本发明一实施例中手写样本图片标注装置的一示意图;
图8是本发明一实施例中计算机设备的一示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本申请提供的手写样本图片标注方法,可应用在服务端,服务端具体可以用独立的服务器或者多个服务器组成的服务器集群实现。
在一实施例中,如图1所示,提供一种手写样本图片标注方法,详述如下:
S1:获取待标注的手写样本图片和该待标注的手写样本图片中包含的手写文本的文本内容。
在本实施例中,用于手写文本识别模型训练的手写样本可以被预先保存在预设的手写样本数据集中,预设的手写样本数据集保存有若干手写样本,每个手写样本包括含有手写文本的样本图片,以及该手写文本的文本内容。
具体地,服务端从预设的手写样本数据集中获取手写样本,将手写样本包含的样本图片作为待标注的手写样本图片,并将该样本图片对应的手写文本的文本内容确定为待标注的手写样本图片中包含的手写文本的文本内容。
S2:对待标注的手写样本图片进行图像预处理,得到该待标注的手写样本图片对应的二值化图像,并获取该二值化图像的图片尺寸。
具体地,对待标注的手写样本图片进行去噪、灰化和二值化等预处理过程,将待标注的手写样本图片转化为只包含黑白两种颜色的二值化图像,即该二值化图像中的像素点的像素值为0或255。
其中,手写样本图片中包含的手写文本在二值化图像中显示为黑色,手写样本图片的其他位置显示为白色,或者,手写样本图片中包含的手写文本在二值化图像中显示为白色,手写样本图片的其他位置显示为黑色。
获取二值化图像的图片尺寸,该图片尺寸可以包括二值化图像的长和宽,其中,二值化图像的长为二值化图像的水平方向占用的像素点数量,二值化图像的宽为二值化图像的垂直方向占用的像素点数量。
可以理解的,二值化图像的图片尺寸即为待标注的手写样本图片的图片尺寸。
S3:根据二值化图像中每个像素点的像素值,确定手写文本在二值化图像中对应的目标像素点,并根据该目标像素点在二值化图像中的位置坐标,确定手写文本在待标注的手写样本图片中的相对位置信息。
具体地,服务端根据步骤S2得到的二值化图像,获取该二值化图像中每个像素点的像素值,由于手写文本在该二值化图像中显示为黑色或者白色,即手写文本对应的像素点的像素值为0或者255,因此根据二值化图像中每个像素点的像素值,可以确定二值化图像中手写文本对应的像素点,并将手写文本对应的像素点标记为目标像素点。
例如,若手写文本对应的像素点的像素值为0,则将二值化图像中像素值为0的像素点标记为目标像素点。
获取目标像素点在二值化图像中的位置坐标,并根据该位置坐标将二值化图像中包含全部目标像素点的最小矩形区域作为手写文本在待标注的手写样本图片中的区域图像,该区域图像的尺寸可以通过区域图像的长和宽分别包含的像素点数量表示。
将区域图像左上角目标像素点在二值化图像中的位置坐标和区域图像的尺寸作为待标注的手写文本在手写样本图片中的相对位置信息。
需要说明的是,手写文本在待标注的手写样本图片中的相对位置信息还可以采用区域图像左上角目标像素点的位置坐标和右下角目标像素点的位置坐标来标识,具体可根据实际应用的需要选择,此处不做限制。
例如,在图2所示的待标注的手写样本图片中,虚线框区域即为区域图像,A点为区域图像左上角目标像素点,B点为区域图像右下角目标像素点,因此,可以将A点的位置坐标和虚线框区域的尺寸作为相对位置信息,也可以将A点的位置坐标和B点的位置坐标作为相对位置信息。
S4:根据预设的命名方式,设置待标注的手写样本图片的图片名称。
具体地,预设的命名方式可以是存储路径和标识ID组合的方式,获取保存待标注的手写样本图片的存储路径,并为该待标注的手写样本图片创建唯一的标识ID,采用“存储路径-标识ID”的命名方式,对待标注的手写样本图片进行命名,得到待标注的手写样本图片的图片名称。
其中,标识ID的创建方式可以是从预设的随机数集合中随机选择一个未被使用过的随机数作为标识ID。
需要说明的是,预设的命名方式还可以是“存储路径-标注日期-标识ID-图片格式”的命名方式,但并不限于此,具体可以根据实际应用的需要进行设置,此处不做限制。
S5:按照预设的第一组合方式,对图片名称、文本内容、相对位置信息,以及图片尺寸进行组合,得到待标注的手写样本图片的标注信息。
具体地,将步骤S1获取到的文本内容,步骤S2得到的图片尺寸,步骤S3得到的相对位置信息,以及步骤S4设置的图片名称,按照第一组合方式进行连接,组合成待标注的手写样本图片的标注信息。
其中,第一组合方式具体可以是“{图片尺寸/图片名称/文本内容/相对位置信息}”的组合方式,也可以是“{图片名称-图片尺寸-文本内容-相对位置信息}”的组合方式,还可以是其他组合方式,其具体可以根据实际应用的需要进行设置,此处不做限制。
例如,图2所示的待标注的手写样本图片的标注信息可以为:
{bolepianti_C000008_20161202_235745.png/280*70/仅供参考,文责自负。/(3,3),270*64}
其中,“bolepianti_C000008_20161202_235745.png”为手写样本图片的图片名称,该图片名称中包含了手写样本图片的相对存储路径“bolepianti_C000008”,标注日期“20161202”,手写样本图片的标识ID“235745”,以及手写样本图片的图片格式“png”;“280*70”为手写样本图片的图片尺寸,即长度为280个像素点,宽度为70个像素点;“仅供参考,文责自负。”为手写文本的文本内容;“(3,3),270*64”为手写文本在手写样本图片中的相对位置信息,“(3,3)”表示手写文本所在的区域图像左上角像素点A在手写样本图片中的位置坐标,即以手写样本图片左上角为坐标原点,向右3个像素点并且向下3个像素点的位置,“270*64”表示区域图像的尺寸,即该手写文本占用的像素点区域的长度为270个像素点,宽度为64个像素点。
S6:将待标注的手写样本图片和标注信息对应保存到预设的手写样本数据库中。
具体地,将步骤S1中获取的待标注的手写样本图片和步骤S6得到的标注信息对应保存到预设的手写样本数据库中。
其中,预设的手写样本数据库用于对手写文本识别模型的训练和调优,当使用手写样本数据库中的手写样本图片对手写文本识别模型进行后续的模型训练时,根据标注信息的格式对手写样本图片的标注信息进行解析,即可完整且准确地得到手写样本图片中包含的手写文本的属性信息,从而能够有效的支撑模型训练。
本实施例中,通过对获取到的待标注的手写样本图片进行图像预处理,得到二值化图像及其图片尺寸,根据二值化图像中每个像素点的像素值,确定手写文本在待标注的手写样本图片中的相对位置信息,并按照预设命名方式,设置待标注的手写样本图片的图片名称,然后按照预设的第一组合方式,对图片尺寸、图片名称、手写文本的文本内容和相对位置信息进行组合,得到待标注的手写样本图片的标注信息,实现了自动生成标注信息,无需人工标注,提高了样本标注效率,进而提高用于模型训练和测试的手写样本数据库的生成效率,同时,标注信息的内容根据图片尺寸、图片名称、手写文本的文本内容和相对位置信息等属性信息自动组合生成,该标注信息能够全面细致的描述手写样本图片的内容,并且其标注格式可自定义,从而能够有效提高标注内容的完整性和准确性。
在一实施例中,如图3所示,在步骤S2中,对手写样本图片进行图像预处理,得到该手写样本图片对应的二值化图像,具体包括如下步骤:
S21:获取待标注的手写样本图片中每个像素点的RGB分量值,并根据该RGB分量值对待标注的手写样本图片进行灰度化处理,得到灰化图像。
具体地,使用RGB模型进行灰度化处理,RGB模型是目前常用的一种彩色信息表达方式,它使用红、绿、蓝三原色的亮度来定量表示颜色。RGB模型也称为加色混色模型,是以RGB三色光互相叠加来实现混色的方法,因而适合于显示器等发光体的显示。
在RGB模型中,如果R=G=B时,则色彩表示只有一种灰度颜色,其中,R=G=B的值为灰度化处理后的像素点的像素值,即灰度值,其像素值范围为0-255,因此,使用RGB模型进行灰度化处理后,对得到的灰化图像中的每个像素点,只需使用一个字节存放该像素点的像素值。
灰度化处理的方式包括但不限于分量法、最大值法、平均值法或者加权平均法等。
在一具体实施例中,使用公式(1)对待标注的手写样本图片进行灰度化处理,得到灰化图像:
其中,P(x,y)为待标注的手写样本图片中的像素点(x,y)灰度化处理后的像素值,R(x,y)为像素点(x,y)在R通道的颜色分量,G(x,y)为像素点(x,y)在G通道的颜色分量,B(x,y)为像素点(x,y)在B通道的颜色分量,a,b,c分别为R通道,G通道,B通道对应的预设权重参数,δ为预设的调节因子,预设权重参数a,b,c和调节因子δ均可以根据实际应用的需要进行设置,此处不做限制。
S22:根据预设的灰度阈值,对灰化图像进行二值化处理,得到二值化图像。
具体地,根据步骤S21得到的灰化图像中每个像素点的像素值,按照预设的灰度阈值,对灰化图像中每个像素点进行遍历,将每个像素点的像素值与灰度阈值进行比较,并根据比较结果修改像素点的像素值,将像素值大于灰度阈值的像素点的像素值修改为灰度极大值,将像素值小于灰度阈值的像素点的像素值修改为灰度极小值,完成二值化处理的过程,其中,灰度级大值为255,灰度极小值为0。
进一步地,灰度阈值的选取方式可以包括固定阈值或自适应阈值,根据灰度阈值选取方式的不同,可以采用不同的二值化算法对灰化图像进行二值化处理,具体的二值化算法包括但不限于:双峰法、P参数法、迭代法和大津算法(OTSU)等。
本实施例中,根据获取到的待标注的手写样本图片中每个像素点的RGB分量值,对待标注的手写样本图片进行灰度化处理,得到灰化图像,并根据预设的灰度阈值,对该灰化图像进行二值化处理,得到二值化图像,实现了对待标注的手写样本图片的二值化处理,为后续确定手写文本在待标注的手写样本图片中的相对位置信息提供基础,并且,使用公式(1)进行灰度化处理,并采用像素值与固定的灰度阈值进行比较的方式完成二值化过程,其算法简单执行效率高,在面对海量的待标注的手写样本图片时,能够提高样本标注效率,进而提高用于模型训练和测试的手写样本数据库的生成效率。
在一实施例中,如图4所示,在步骤S4之后,并且在步骤S6之前,该手写样本图片标注方法还包括采用另一标注方式生成标注信息的处理过程,具体包括如下步骤:
S71:从预设的数据字典中获取文本内容中每个字符对应的字符编码,其中,数据字典包含标准字符和每个标准字符的字符编码。
预设的数据字典中包含标准字符以及每个标准字符对应的字符编码,该字符编码通过预设的编码方式生成,用于唯一标识该标准字符,标准字符包括但不限于汉字、阿拉伯数字、字母、标点符号等。
需要说明的是,预设的编码方式可以是万国码(Unicode)编码,也可以是随机数编码,还可以是自定义的其他编码方式,其具体可根据实际应用的需要进行设置,此处不做限制。
具体地,根据待标注的手写样本图片中包含的手写文本的文本内容,从预设的数据字典中查询该文本内容中每个字符对应的字符编码。
S72:按照预设的第二组合方式,对图片名称、文本内容中每个字符对应的字符编码,相对位置信息,以及图片尺寸进行组合,得到待标注的手写样本图片的标注信息。
具体地,将步骤S2得到的图片尺寸,步骤S3得到的相对位置信息,步骤S4设置的图片名称,以及步骤S71得到的手写文本的文本内容中每个字符对应的字符编码,按照第二组合方式进行连接,组合成待标注的手写样本图片的标注信息。
其中,第二组合方式具体可以是“{图片尺寸/图片名称/字符编码/相对位置信息}”的组合方式,也可以是“{图片名称-图片尺寸-字符编码-相对位置信息}”的组合方式,还可以是其他组合方式,其具体可以根据实际应用的需要进行设置,此处不做限制。
例如,图2所示的待标注的手写样本图片的标注信息可以为:
{bolepianti_C000008_20161202_235745.png/280*70/10607,11373,20999,20925,20929,20924,12343,23044,87584,45891/(3,3),270*64}
其中,“bolepianti_C000008_20161202_235745.png”为手写样本图片的图片名称,该图片名称中包含了手写样本图片的相对存储路径“bolepianti_C000008”,标注日期“20161202”,手写样本图片的标识ID“235745”,以及手写样本图片的图片格式“png”;“280*70”为手写样本图片的图片尺寸,即长度为280个像素点,宽度为70个像素点;“10607,11373,20999,20925,20929,20924,12343,23044,87584,45891”为手写文本的文本内容“仅供参考,文责自负。”的10个字符中每个字符分别对应的字符编码;“(3,3),270*64”为手写文本在手写样本图片中的相对位置信息,“(3,3)”表示手写文本所在的区域图像左上角像素点A在手写样本图片中的位置坐标,即以手写样本图片左上角为坐标原点,向右3个像素点并且向下3个像素点的位置,“270*64”表示区域图像的尺寸,即该手写文本占用的像素点区域的长度为270个像素点,宽度为64个像素点。
本实施例中,通过从预设的数据字典中获取手写文本的文本内容中每个字符对应的字符编码,并按照预设的第二组合方式,对图片名称、文本内容中每个字符对应的字符编码、相对位置信息和图片尺寸进行组合,得到待标注的手写样本图片的标注信息,实现了在标注信息中用字符编码代替字符,当使用手写样本数据库中的手写样本图片对手写文本识别模型进行模型训练时,直接使用从标注信息解析出的字符编码进行训练结果比对的效率更高,同时,当需要将字符编码还原成字符时,需使用预设的数据字典才能准确还原,一定程度上也提高了手写样本数据库中标注信息的数据安全性。
在一实施例中,如图5所示,在步骤S1之前,该手写样本图片标注方法还包括生成待标注的手写样本图片的过程,具体包括如下步骤:
S81:从预设的文本语料库中获取语料文本,并设置该语料文本的手写字体属性。
在本实施例中,预设的文本语料库为预先设置的用于存放语料文本的数据库,进一步地,在文本语料库中可以按照预设的分类方式对语料文本进行分类保存,即将语料文本按照所属的类别,分类存放在文本语料库中。
其中,语料文本可以是一个字、一句话、一个词,或者一段话等,预设的分类方式可以是按照领域进行分类,例如,化学、文学等不同领域,还可以是按照文本属性进行分类,例如,新闻、小说等不同属性,具体的分类方式可以根据实际应用的需要进行设置。
具体地,服务端根据手写文本识别模型训练所需的文本类别,从预设的文本语料库中获取该文本类别中的至少一个语料文本,并设置语料文本的手写字体属性。
其中,手写字体属性包括手写字体类型、字体颜色、字体深度,以及字体尺寸等。服务端对语料文本的手写字体属性的设置方式可以是分别随机选择一定数量的手写字体类型、字体颜色、字体深度和字体尺寸,然后进行组合,也可以是循环选择每种字体类型、字体颜色、字体深度和字体尺寸,然后进行组合,还可以是通过人机交互的方式由用户对手写字体属性进行自定义设置。可以理解的,一个语料文本可以对应一个手写字体属性,也可以对应多个不同的手写字体属性。
S82:按照语料文本的手写字体属性,将语料文本绘制在预设的画布上,得到待标注的手写样本图片和该待标注的手写样本图片中包含的手写文本的文本内容。
具体地,服务端按照一张画布绘制一个语料文本的方式,将语料文本按照步骤S81确定的手写字体属性,绘制在预设的画布上,并将得到的图片作为待标注的手写样本图片,并将语料文本作为该待标注的手写样本图片中包含的手写文本的文本内容。
需要说明的是,预设的画布包括预设尺寸和预设颜色的画布,服务端可以直接使用预设的画布功能组件绘制指定尺寸和颜色的画布,然后使用预设的文本绘制功能组件在画布中按照手写字体属性绘制语料文本。
例如,可以使用GD2函数库中的imagecreate()函数创建画布,imagecolorallocate()函数设置画布的颜色,以及gdImageStringFT()函数进行语料文本绘制。
进一步地,在画布上绘制语料文本时,还可以设置语料文本在画布上的位置。例如,将语料文本的位置坐标作为参数传入gdImageStringFT()函数中,即可在画布的指定位置绘制语料文本。
优选地,将语料文本绘制在画布的中心位置。
本实施例中,通过从预设的文本语料库中获取语料文本,并设置该语料文本的手写字体属性,然后按照语料文本的手写字体属性,将该语料文本绘制在预设的画布上,得到待标注的手写样本图片和该待标注的手写样本图片中包含的手写文本的文本内容,实现了自动生成手写样本图片,不需要人工进行手写样本收集,从而降低手写样本的收集成本,并提高了手写样本的收集效率。
在一实施例中,如图6所示,在步骤S82之后,该手写样本图片标注方法还包括对待标注的手写样本图片的扩充处理,具体包括如下步骤:
S83:按照预设的图片效果处理方式对待标注的手写样本图片进行处理,得到新的待标注的手写样本图片和该新的待标注的手写样本图片中包含的手写文本的文本内容。
具体地,服务端按照预设的图片效果处理方式对步骤S82生成的待标注的手写样本图片进行处理,并将处理后得到的新的图片作为新的待标注的手写样本图片,同时将步骤S82生成的待标注的手写样本图片中包含的手写文本的文本内容直接作为该新的待标注的手写样本图片中包含的手写文本的文本内容。
其中,预设的图片效果处理方式是对待标注的手写样本图片进行图形效果的变换,或者对待标注的手写样本图片中的手写文本进行字形的变换。
例如,图片效果处理方式可以是采用随机高斯模糊算法对待标注的手写样本图片中的手写文本进行模糊处理,或者是采用随机角度倾斜方式对待标注的手写样本图片中的手写文本进行角度调整,或者是采用对待标注的手写样本图片增加水印、增加边框、增加背景图案或者改变画布的背景颜色等。
需要说明的是,图片效果处理方式具体可以根据实际应用的需要进行设置,此处不做限制。
在本实施例中,通过预设的图片效果处理方式对待标注的手写样本图片进行处理得到新的图片,并将该新的图片作为新的待标注的手写样本图片,实现了对待标注的手写样本图片的有效扩充,从而进一步提高手写样本的收集效率。
应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。
在一实施例中,提供一种手写样本图片标注装置,该手写样本图片标注装置与上述实施例中手写样本图片标注方法一一对应。如图7所示,该手写样本图片标注装置包括获取模块71、预处理模块72、位置确定模块73、名称设置模块74、第一组合模块75和保存模块76。各功能模块详细说明如下:
获取模块71,用于获取待标注的手写样本图片和所述待标注的手写样本图片中包含的手写文本的文本内容;
预处理模块72,用于对所述待标注的手写样本图片进行图像预处理,得到所述待标注的手写样本图片对应的二值化图像,并获取所述二值化图像的图片尺寸;
位置确定模块73,用于根据所述二值化图像中每个像素点的像素值,确定所述手写文本在所述二值化图像中对应的目标像素点,并根据所述目标像素点在所述二值化图像中的位置坐标,确定所述手写文本在所述待标注的手写样本图片中的相对位置信息;
名称设置模块74,用于根据预设的命名方式,设置所述待标注的手写样本图片的图片名称;
第一组合模块75,用于按照预设的第一组合方式,对所述图片名称、所述文本内容、所述相对位置信息,以及所述图片尺寸进行组合,得到所述待标注的手写样本图片的标注信息;
保存模块76,用于将所述待标注的手写样本图片和所述标注信息对应保存到预设的手写样本数据库中。
进一步地,预处理模块72包括:
灰化子模块,用于获取所述待标注的手写样本图片中每个像素点的RGB分量值,并根据所述RGB分量值对所述待标注的手写样本图片进行灰度化处理,得到灰化图像;
二值化子模块,用于根据预设的灰度阈值,对所述灰化图像进行二值化处理,得到二值化图像。
进一步地,该手写样本图片标注装置还包括:
编码转换模块,用于从预设的数据字典中获取所述文本内容中每个字符对应的字符编码,其中,所述数据字典包含标准字符和每个所述标准字符的字符编码;
第二组合模块,用于按照预设的第二组合方式,对所述图片名称、所述文本内容中每个字符对应的字符编码、所述相对位置信息,以及所述图片尺寸进行组合,得到所述待标注的手写样本图片的标注信息。
进一步地,该手写样本图片标注装置还包括:
语料获取模块,用于从预设的文本语料库中获取语料文本,并设置所述语料文本的手写字体属性;
图片生成模块,用于按照所述手写字体属性,将所述语料文本绘制在预设的画布上,得到所述待标注的手写样本图片和该待标注的手写样本图片中包含的手写文本的文本内容。
进一步地,该手写样本图片标注装置还包括:
样本扩充模块,用于按照预设的图片效果处理方式对所述待标注的手写样本图片进行处理,得到新的待标注的手写样本图片和该新的待标注的手写样本图片中包含的手写文本的文本内容。
关于手写样本图片标注装置的具体限定可以参见上文中对于手写样本图片标注方法的限定,在此不再赘述。上述手写样本图片标注装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图8所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储手写样本图片及其包含的文本内容。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种手写样本图片标注方法。
在一实施例中,提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时实现上述实施例手写样本图片标注方法的步骤,例如图1所示的步骤S1至步骤S6。或者,处理器执行计算机程序时实现上述实施例中手写样本图片标注装置的各模块/单元的功能,例如图7所示模块71至模块76的功能。为避免重复,此处不再赘述。
在一实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述方法实施例中手写样本图片标注方法,或者,该计算机程序被处理器执行时实现上述装置实施例中手写样本图片标注装置中各模块/单元的功能。为避免重复,此处不再赘述。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将所述装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。
以上所述实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围,均应包含在本发明的保护范围之内。

Claims (10)

1.一种手写样本图片标注方法,其特征在于,所述手写样本图片标注方法包括:
获取待标注的手写样本图片和所述待标注的手写样本图片中包含的手写文本的文本内容;
对所述待标注的手写样本图片进行图像预处理,得到所述待标注的手写样本图片对应的二值化图像,并获取所述二值化图像的图片尺寸;
根据所述二值化图像中每个像素点的像素值,确定所述手写文本在所述二值化图像中对应的目标像素点,并根据所述目标像素点在所述二值化图像中的位置坐标,确定所述手写文本在所述待标注的手写样本图片中的相对位置信息;
根据预设的命名方式,设置所述待标注的手写样本图片的图片名称;
按照预设的第一组合方式,对所述图片名称、所述文本内容、所述相对位置信息,以及所述图片尺寸进行组合,得到所述待标注的手写样本图片的标注信息;
将所述待标注的手写样本图片和所述标注信息对应保存到预设的手写样本数据库中。
2.如权利要求1所述的手写样本图片标注方法,其特征在于,所述对所述待标注的手写样本图片进行图像预处理,得到所述待标注的手写样本图片对应的二值化图像包括:
获取所述待标注的手写样本图片中每个像素点的RGB分量值,并根据所述RGB分量值对所述待标注的手写样本图片进行灰度化处理,得到灰化图像;
根据预设的灰度阈值,对所述灰化图像进行二值化处理,得到二值化图像。
3.如权利要求1所述的手写样本图片标注方法,其特征在于,所述按照预设命名方式,设置所述待标注的手写样本图片的图片名称之后,并且所述将所述待标注的手写样本图片和所述标注信息对应保存到预设的手写样本数据库中之前,所述手写样本图片标注方法还包括:
从预设的数据字典中获取所述文本内容中每个字符对应的字符编码,其中,所述数据字典包含标准字符和每个所述标准字符的字符编码;
按照预设的第二组合方式,对所述图片名称、所述文本内容中每个字符对应的字符编码、所述相对位置信息,以及所述图片尺寸进行组合,得到所述待标注的手写样本图片的标注信息。
4.如权利要求1至3任一项所述的手写样本图片标注方法,其特征在于,所述获取待标注的手写样本图片和所述待标注的手写样本图片中包含的手写文本的文本内容之前,所述手写样本图片标注方法还包括:
从预设的文本语料库中获取语料文本,并设置所述语料文本的手写字体属性;
按照所述手写字体属性,将所述语料文本绘制在预设的画布上,得到所述待标注的手写样本图片和该待标注的手写样本图片中包含的手写文本的文本内容。
5.如权利要求4所述的手写样本图片标注方法,其特征在于,所述按照所述手写字体属性,将所述语料文本绘制在预设的画布上,得到所述待标注的手写样本图片和该待标注的手写样本图片中包含的手写文本的文本内容之后,所述手写样本图片标注方法还包括:
按照预设的图片效果处理方式对所述待标注的手写样本图片进行处理,得到新的待标注的手写样本图片和该新的待标注的手写样本图片中包含的手写文本的文本内容。
6.一种手写样本图片标注装置,其特征在于,所述手写样本图片标注装置包括:
获取模块,用于获取待标注的手写样本图片和所述待标注的手写样本图片中包含的手写文本的文本内容;
预处理模块,用于对所述待标注的手写样本图片进行图像预处理,得到所述待标注的手写样本图片对应的二值化图像,并获取所述二值化图像的图片尺寸;
位置确定模块,用于根据所述二值化图像中每个像素点的像素值,确定所述手写文本在所述二值化图像中对应的目标像素点,并根据所述目标像素点在所述二值化图像中的位置坐标,确定所述手写文本在所述待标注的手写样本图片中的相对位置信息;
名称设置模块,用于根据预设的命名方式,设置所述待标注的手写样本图片的图片名称;
第一组合模块,用于按照预设的第一组合方式,对所述图片名称、所述文本内容、所述相对位置信息,以及所述图片尺寸进行组合,得到所述待标注的手写样本图片的标注信息;
保存模块,用于将所述待标注的手写样本图片和所述标注信息对应保存到预设的手写样本数据库中。
7.如权利要求6所述的手写样本图片标注装置,其特征在于,所述预处理模块包括:
灰化子模块,用于获取所述待标注的手写样本图片中每个像素点的RGB分量值,并根据所述RGB分量值对所述待标注的手写样本图片进行灰度化处理,得到灰化图像;
二值化子模块,用于根据预设的灰度阈值,对所述灰化图像进行二值化处理,得到二值化图像。
8.如权利要求6所述的手写样本图片标注装置,其特征在于,所述手写样本图片标注装置还包括:
编码转换模块,用于从预设的数据字典中获取所述文本内容中每个字符对应的字符编码,其中,所述数据字典包含标准字符和每个所述标准字符的字符编码;
第二组合模块,用于按照预设的第二组合方式,对所述图片名称、所述文本内容中每个字符对应的字符编码、所述相对位置信息,以及所述图片尺寸进行组合,得到所述待标注的手写样本图片的标注信息。
9.一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至5任一项所述手写样本图片标注方法的步骤。
10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至5任一项所述手写样本图片标注方法的步骤。
CN201811084479.6A 2018-09-18 2018-09-18 手写样本图片标注方法、装置、计算机设备及存储介质 Pending CN109522898A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811084479.6A CN109522898A (zh) 2018-09-18 2018-09-18 手写样本图片标注方法、装置、计算机设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811084479.6A CN109522898A (zh) 2018-09-18 2018-09-18 手写样本图片标注方法、装置、计算机设备及存储介质

Publications (1)

Publication Number Publication Date
CN109522898A true CN109522898A (zh) 2019-03-26

Family

ID=65770977

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811084479.6A Pending CN109522898A (zh) 2018-09-18 2018-09-18 手写样本图片标注方法、装置、计算机设备及存储介质

Country Status (1)

Country Link
CN (1) CN109522898A (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111324761A (zh) * 2020-02-25 2020-06-23 平安科技(深圳)有限公司 图像标注管理方法、装置、计算机系统及可读存储介质名称
CN111898424A (zh) * 2020-06-19 2020-11-06 贝壳技术有限公司 文字识别模型训练方法、装置、电子设备及存储介质
CN111914846A (zh) * 2020-07-03 2020-11-10 苏州开心盒子软件有限公司 版面数据合成方法、设备及存储介质
CN113129303A (zh) * 2021-05-18 2021-07-16 广州市吉华勘测股份有限公司 一种巡检图片自动标注方法、装置、存储介质及电子设备
CN113792815A (zh) * 2021-09-24 2021-12-14 浪潮金融信息技术有限公司 一种基于图像处理技术的样本增广方法、系统及介质
WO2022012038A1 (zh) * 2020-07-14 2022-01-20 上海商汤智能科技有限公司 图像处理方法及装置、电子设备、存储介质和程序产品
CN116523544A (zh) * 2023-06-25 2023-08-01 江西省机电设备招标有限公司 一种软件价格测算方法、系统、存储介质以及设备
CN113792815B (zh) * 2021-09-24 2024-06-07 浪潮金融信息技术有限公司 一种基于图像处理技术的样本增广方法、系统及介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106951832A (zh) * 2017-02-28 2017-07-14 广东数相智能科技有限公司 一种基于手写字符识别的验证方法及装置
CN107590491A (zh) * 2016-07-07 2018-01-16 阿里巴巴集团控股有限公司 一种图像处理方法及装置
CN107644006A (zh) * 2017-09-29 2018-01-30 北京大学 一种基于深度神经网络的手写体中文字库自动生成方法
CN108364037A (zh) * 2017-12-28 2018-08-03 顺丰科技有限公司 识别手写汉字的方法、系统及设备
CN108446697A (zh) * 2018-03-06 2018-08-24 平安科技(深圳)有限公司 图片处理方法、电子装置及存储介质

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107590491A (zh) * 2016-07-07 2018-01-16 阿里巴巴集团控股有限公司 一种图像处理方法及装置
CN106951832A (zh) * 2017-02-28 2017-07-14 广东数相智能科技有限公司 一种基于手写字符识别的验证方法及装置
CN107644006A (zh) * 2017-09-29 2018-01-30 北京大学 一种基于深度神经网络的手写体中文字库自动生成方法
CN108364037A (zh) * 2017-12-28 2018-08-03 顺丰科技有限公司 识别手写汉字的方法、系统及设备
CN108446697A (zh) * 2018-03-06 2018-08-24 平安科技(深圳)有限公司 图片处理方法、电子装置及存储介质

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
孟一飞;杨文慧;谢堂健;戴雪瑞;: "基于西夏古籍文字样本数据库设计与实现", 电脑与信息技术, no. 06 *
王维兰;卢小宝;蔡正琦;沈文韬;付吉;才科扎西;: "基于部件组合的联机手写"藏文―梵文"样本生成", 中文信息学报, no. 05 *

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111324761A (zh) * 2020-02-25 2020-06-23 平安科技(深圳)有限公司 图像标注管理方法、装置、计算机系统及可读存储介质名称
CN111324761B (zh) * 2020-02-25 2023-10-13 平安科技(深圳)有限公司 图像标注管理方法、装置、计算机系统及可读存储介质
CN111898424A (zh) * 2020-06-19 2020-11-06 贝壳技术有限公司 文字识别模型训练方法、装置、电子设备及存储介质
CN111898424B (zh) * 2020-06-19 2023-07-21 贝壳技术有限公司 文字识别模型训练方法、装置、电子设备及存储介质
CN111914846A (zh) * 2020-07-03 2020-11-10 苏州开心盒子软件有限公司 版面数据合成方法、设备及存储介质
CN111914846B (zh) * 2020-07-03 2024-05-24 苏州开心盒子软件有限公司 版面数据合成方法、设备及存储介质
WO2022012038A1 (zh) * 2020-07-14 2022-01-20 上海商汤智能科技有限公司 图像处理方法及装置、电子设备、存储介质和程序产品
CN113129303B (zh) * 2021-05-18 2022-01-18 广州市吉华勘测股份有限公司 一种巡检图片自动标注方法、装置、存储介质及电子设备
CN113129303A (zh) * 2021-05-18 2021-07-16 广州市吉华勘测股份有限公司 一种巡检图片自动标注方法、装置、存储介质及电子设备
CN113792815A (zh) * 2021-09-24 2021-12-14 浪潮金融信息技术有限公司 一种基于图像处理技术的样本增广方法、系统及介质
CN113792815B (zh) * 2021-09-24 2024-06-07 浪潮金融信息技术有限公司 一种基于图像处理技术的样本增广方法、系统及介质
CN116523544A (zh) * 2023-06-25 2023-08-01 江西省机电设备招标有限公司 一种软件价格测算方法、系统、存储介质以及设备
CN116523544B (zh) * 2023-06-25 2023-11-14 江西省机电设备招标有限公司 一种软件价格测算方法、系统、存储介质以及设备

Similar Documents

Publication Publication Date Title
CN109522898A (zh) 手写样本图片标注方法、装置、计算机设备及存储介质
CN109933756A (zh) 基于ocr的图像转档方法、装置、设备及可读存储介质
CN109522975A (zh) 手写样本生成方法、装置、计算机设备及存储介质
CN113128442B (zh) 基于卷积神经网络的汉字书法风格识别方法和评分方法
CN110780873B (zh) 界面颜色适配方法、装置、计算机设备及存储介质
CN111428457B (zh) 数据表的自动格式化
CN110443140B (zh) 文本定位的方法、装置、计算机设备及存储介质
CN109446873A (zh) 手写字体识别方法、系统以及终端设备
CN110555433A (zh) 图像处理方法、装置、电子设备及计算机可读存储介质
CN109493400A (zh) 手写样本生成方法、装置、计算机设备及存储介质
CN109189390B (zh) 自动生成布局文件的方法、存储介质
CN111091167A (zh) 标志识别训练数据合成方法、装置、电子设备及存储介质
CN113762269B (zh) 基于神经网络的中文字符ocr识别方法、系统及介质
CN110728687B (zh) 文件图像分割方法、装置、计算机设备和存储介质
CN111563563B (zh) 一种手写体识别的联合数据的增强方法
CN111460782A (zh) 一种信息处理方法、装置及设备
CN107122785B (zh) 文本识别模型建立方法和装置
CN114332895A (zh) 文本图像合成方法、装置、设备、存储介质和程序产品
CN105512096B (zh) 一种基于文档中内嵌字体的优化方法及装置
CN116610304B (zh) 页面代码生成方法、装置、设备和存储介质
CN113780116A (zh) 发票分类方法、装置、计算机设备和存储介质
CN111783881A (zh) 基于预训练模型的场景适配学习方法及系统
WO2023284670A1 (zh) 图形码提取模型构建方法、识别方法、装置、设备和介质
CN114861595B (zh) 一种基于矢量线条变换的个性字体生成方法
Lian et al. CVFont: Synthesizing Chinese Vector Fonts via Deep Layout Inferring

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination