CN113870154A - 图像数据处理方法、装置、计算机设备和存储介质 - Google Patents
图像数据处理方法、装置、计算机设备和存储介质 Download PDFInfo
- Publication number
- CN113870154A CN113870154A CN202010619151.0A CN202010619151A CN113870154A CN 113870154 A CN113870154 A CN 113870154A CN 202010619151 A CN202010619151 A CN 202010619151A CN 113870154 A CN113870154 A CN 113870154A
- Authority
- CN
- China
- Prior art keywords
- image
- pixel
- preset
- pixel value
- pixel point
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000003672 processing method Methods 0.000 title abstract description 15
- 230000000877 morphologic effect Effects 0.000 claims abstract description 59
- 238000005260 corrosion Methods 0.000 claims abstract description 34
- 230000007797 corrosion Effects 0.000 claims abstract description 34
- 238000000034 method Methods 0.000 claims abstract description 26
- 238000004590 computer program Methods 0.000 claims description 15
- 238000004364 calculation method Methods 0.000 claims description 8
- 238000006243 chemical reaction Methods 0.000 claims description 8
- 230000011218 segmentation Effects 0.000 claims description 6
- 238000010586 diagram Methods 0.000 description 5
- 239000003086 colorant Substances 0.000 description 3
- 230000003628 erosive effect Effects 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 2
- 230000001360 synchronised effect Effects 0.000 description 2
- 230000006399 behavior Effects 0.000 description 1
- 238000004042 decolorization Methods 0.000 description 1
- 238000006073 displacement reaction Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/20—Image enhancement or restoration using local operators
- G06T5/30—Erosion or dilatation, e.g. thinning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/136—Segmentation; Edge detection involving thresholding
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/194—Segmentation; Edge detection involving foreground-background segmentation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/60—Analysis of geometric attributes
- G06T7/62—Analysis of geometric attributes of area, perimeter, diameter or volume
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/90—Determination of colour characteristics
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Geometry (AREA)
- Image Analysis (AREA)
Abstract
本申请涉及一种图像数据处理方法、装置、计算机设备和存储介质,所述方法包括:获取原始图像并识别原始图像的背景颜色;当背景颜色不为预设颜色时,灰度化原始图像得到灰度图像;采用膨胀因子对灰度图像进行膨胀操作得到第一图像;采用腐蚀因子对灰度图像进行腐蚀操作得到第二图像;采用第一图像减去第二图像得到形态学梯度图像;采用预设像素值替换原始图像中的第一像素点的像素值,得到目标图像。当图像中包含背景色时,通过形态学对图像中的膨胀和腐蚀操作对图像进行处理,并得到对应的形态学梯度图像,根据形态学梯度图像对图像的背景色进行去除,避免背景色对图像中进行文字识别的影响,提高了识别准确率。
Description
技术领域
本申请涉及计算机技术领域,尤其涉及一种图像数据处理方法、装置、计算机设备和存储介质。
背景技术
背景去除可以分很多种,比如目标背景去除,留下人物部分,也可以称为目标分割。目标分割指把目标轮廓标记出来,组成目标对象的轮廓具有封闭性。当处理的对象为带文字的文档时,则无法采用分割的技术,因为文字不具有封闭性,文字内部和文字之间都有空隙,而且文字内部如果存在颜色,会影响文字识别的效果。尤其是针对登记记录文档的扫描图片,文档包括印刷字、手写字、有色背景、印章和手印,为了更好地识别出文档中的文字内容,需要将有色背景,印章和手印等影响文字识别的因素进行去除。传统的方法需要人工把文字内容录入电脑,耗费大量的人力物力。
发明内容
为了解决上述技术问题,本申请提供了一种图像数据处理方法、装置、计算机设备和存储介质。
第一方面,本申请提供了一种图像数据处理方法,包括:
获取原始图像,识别所述原始图像的背景颜色;
当所述背景颜色不为预设颜色时,灰度化所述原始图像,得到灰度图像;
采用膨胀因子对所述灰度图像进行膨胀操作,得到第一图像;
采用腐蚀因子对所述灰度图像进行腐蚀操作,得到第二图像;
采用所述第一图像减去所述第二图像得到形态学梯度图像;
采用预设像素值,替换所述原始图像中的第一像素点的像素值,得到目标图像,其中,所述第一像素点为与所述形态学梯度图像中像素值小于第一预设阈值的像素点位置相同的像素点。
第二方面,本申请提供了一种图像数据处理装置,包括:
背景颜色识别模块,用于获取原始图像,识别所述原始图像的背景颜色;
图像转换模块,用于当所述背景颜色不为预设颜色时,灰度化所述原始图像,得到灰度图像;
膨胀模块,用于采用膨胀因子对所述灰度图像进行膨胀操作,得到第一图像;
腐蚀模块,用于采用腐蚀因子对所述灰度图像进行腐蚀操作,得到第二图像;
梯度图像计算模块,用于采用所述第一图像减去所述第二图像得到形态学梯度图像;
背景去除模块,用于采用预设像素值,替换所述原始图像中的第一像素点的像素值,得到目标图像,其中,所述第一像素点为与所述形态学梯度图像中像素值小于第一预设阈值的像素点位置相同的像素点。
第三方面,本申请提供了,一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
获取原始图像,识别所述原始图像的背景颜色;
当所述背景颜色不为预设颜色时,灰度化所述原始图像,得到灰度图像;
采用膨胀因子对所述灰度图像进行膨胀操作,得到第一图像;
采用腐蚀因子对所述灰度图像进行腐蚀操作,得到第二图像;
采用所述第一图像减去所述第二图像得到形态学梯度图像;
采用预设像素值,替换所述原始图像中的第一像素点的像素值,得到目标图像,其中,所述第一像素点为与所述形态学梯度图像中像素值小于第一预设阈值的像素点位置相同的像素点。
第四方面,本申请提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:获取原始图像,识别所述原始图像的背景颜色;
当所述背景颜色不为预设颜色时,灰度化所述原始图像,得到灰度图像;
采用膨胀因子对所述灰度图像进行膨胀操作,得到第一图像;
采用腐蚀因子对所述灰度图像进行腐蚀操作,得到第二图像;
采用所述第一图像减去所述第二图像得到形态学梯度图像;
采用预设像素值,替换所述原始图像中的第一像素点的像素值,得到目标图像,其中,所述第一像素点为与所述形态学梯度图像中像素值小于第一预设阈值的像素点位置相同的像素点。
上述图像数据处理方法、装置、计算机设备和存储介质,所述方法包括:获取原始图像,识别所述原始图像的背景颜色;当所述背景颜色不为预设颜色时,灰度化所述原始图像,得到灰度图像;采用膨胀因子对所述灰度图像进行膨胀操作,得到第一图像;采用腐蚀因子对所述灰度图像进行腐蚀操作,得到第二图像;采用所述第一图像减去所述第二图像得到形态学梯度图像;采用预设像素值,替换所述原始图像中的第一像素点的像素值,得到目标图像,其中,所述第一像素点为与所述形态学梯度图像中像素值小于第一预设阈值的像素点位置相同的像素点。当图像中包含背景色时,通过形态学对图像中的膨胀和腐蚀操作对图像进行处理,并得到对应的形态学梯度图像,根据形态学梯度图像对图像的背景色进行去除,避免背景色对图像中进行文字识别的影响,提高了识别准确率。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施例,并与说明书一起用于解释本发明的原理。
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为一个实施例中图像数据处理方法的流程示意图;
图2为一个实施例中图像数据处理装置的结构框图;
图3为一个实施例中计算机设备的内部结构图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请的一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。
如图1所示,在一个实施例中,提供了一种图像数据处理方法。参照图1,该图像数据处理方法具体包括如下步骤:
步骤S201,获取原始图像,识别原始图像的背景颜色。
步骤S202,当背景颜色不为预设颜色时,灰度化原始图像,得到灰度图像。
步骤S203,采用膨胀因子对灰度图像进行膨胀操作,得到第一图像。
步骤S204,采用腐蚀因子对灰度图像进行腐蚀操作,得到第二图像。
步骤S205,采用第一图像减去第二图像得到形态学梯度图像。
步骤S206,采用预设像素值,替换原始图像中的第一像素点的像素值,得到目标图像。
在本具体实施例中,其第一像素点为与形态学梯度图像中像素值小于第一预设阈值的像素点位置相同的像素点。
具体地,原始图像为彩色图像,原始图像可以是原图也可以是原图的区域图像。原图是指拍摄得到的整个图像,原图的区域图像是指对原图进行区域划分后得到的区域图像。原始图像中包含前景和背景,其中前景是指目标对象所在的位置,背景是指目标对象所在的位置之外的位置。其中目标对象包括但不限于字符、图标等。背景颜色是指通过对原始图像的背景进行颜色特征提取,并对颜色特征进行统计后确定的颜色特征。预设颜色特征是指预先设定的背景颜色,若背景颜色不是预设颜色特征时,需要修改图像的背景颜色。即通过形态学的方式确定需要修改的像素点,具体为,相对原始图像进行灰度化操作,将彩色图像转换为灰度图像。膨胀因子是指对灰度图像进行膨胀操作的结构元素,同理腐蚀因子是指对灰度图像进行腐蚀操作的结构元素,其中腐蚀的结构元素的膨胀的结构元素可以为相同大小的结构元素,也可以为不同大小的结构元素,且结构元素的形状和大小可以根据需求自定义。如结构元素的形状可以定义为矩形、星形等等。
在一个具体的实施例中,定义腐蚀因子和膨胀因子为相同大小的结构元素,且结构元素的为边长为n的正方形。
形态学梯度图像,是指对灰度图像进行膨胀操作后得到的第一图像,和对灰度图像进行腐蚀操作后得到的第二图像的差值图像。膨胀操作可以使得字符变粗,腐蚀用操作可以使得字符变细,通过膨胀后的图像减去腐蚀后的图像,可以确定出目标对象以外的像素点,即通过对形态学图像中的像素点的像素值进行判断,若形态学图像中的像素点的像素值小于第一预设阈值时,则表示像素点为背景像素点,采用预设颜色特征对应的像素值,替换原始图像中的背景像素点中不为预设颜色特征的像素点,即第一像素点,得到目标图像。
在一个实施例中,步骤S201,包括:计算原始图像中的各颜色特征对应的区域面积;当颜色特征对应的区域面积大于第一预设区域面积时,将颜色特征作为原始图像的背景颜色。
具体地,原始图像中包含多个颜色特征,计算每个颜色特征对应的区域面积,计算每个颜色特征对应的区域面积时,通过识别出的颜色特征对应的像素点的数目与每个像素点的代表的区域计算得到。若其中一个颜色特征对应的区域面积大于第一预设区域面积时,则表示该颜色特征为背景颜色。其中第一预设区域面积可以根据需求自定义,如某一颜色特征对应的区域面积大于原始图像的区域面积的50%或60%时,将该颜色特征作为背景颜色。其中在识别颜色特征时可以RGB颜色空间或HSV等颜色空间进行识别。
在一个实施例中,对原始图像进行空间转换,得到原始图像的HSV图像;获取第一预设颜色特征集合,第一预设颜色特征集合中包含多个颜色特征;通过第一预设颜色特征集合中的每个颜色特征,对HSV图像进行阈值分割,得到对应的图像掩膜,每个第一预设颜色特征集合中的每个颜色特征对应的一个图像掩膜,图像掩膜的各个像素点的像素值为0或255。
在本实施例中,计算原始图像的每种颜色特征对应的区域面积,包括:统计每个图像掩膜中像素值为255的像素点的数量,根据数量计算对应的区域面积。
具体地,将原始图像转换至HSV空间,得到HSV图像。第一预设颜色特征是指预先设置的颜色特征,第一预设颜色特征包括多个颜色特征,根据第一预设颜色特征中的各个颜色特征在HSV空间中的取值范围对HSV图像进行分割,得到各个颜色特征对应的分割图像,即图像掩膜,其中图像掩膜中的各个像素点的像素值为0或255。统计每个颜色特征的图像掩膜中像素值为255的像素点的数量,根据统计得到的数据确定区域面积。采用各个颜色特征对HSV图像进行轮廓提取,判断轮廓大小,通过阈值筛选,从第一预设颜色特征集合中确定出该图像的背景颜色。
在一个实施例中,原始图像为三通道图像,预设像素值包括三通道像素值,步骤S206包括:判断当前坐标对应的三通道中各个通道的像素值,是否与预设像素值中对应的三通道像素值相同,当前坐标为形态学梯度图像中像素值小于第一预设像素值对应的坐标;当不相同时,采用预设像素值中对应的三通道像素值,替换当前坐标的对应的三通道中各个通道的像素值,得到目标图像。
具体地,原始图像为三通道图像,同一颜色特征在不同通道中的像素值不同。预设像素值包括三通道像素值,即预设像素值包括三个通道对应的像素值,如预设像素值为(x1,x2,x3),其中x1为第一通道的像素值,x2为第二通道的像素值,x3为第三通道的像素值。判断当前坐标对应的三个通道的像素值是否与预设像素值对应的通道的像素值相同,若不相同,则采用预设像素值对应的通道的像素值替换当前坐标对应通道的像素值,如当前坐标对应的像素值为(h1,h2,h3),若h1≠x1,则采用x1替换h1,h2和h3同理,若与对应通道的x2和x3相同在不修改,若不同则修改为对应的x2和x3。
在一个实施例中,采用第一图像减去第二图像得到形态学梯度图像,包括:采用第一图像减去第二图像得到初始形态学图像,初始形态学图像中包含字符;识别初始形态学图像像中各行字符的高度;统计初始形态学图像中各行字符的像素值的和,得到每行字符的像素总和;当当前行的字符的高度大于第一阈值,且当前行的像素总和大于第二阈值时,将初始形态学图像的当前行中的字体内部像素点的像素值调整为大于预设像素值,得到形态学梯度图像。
具体地,检测初始形态学梯度图像中每行字符的高度,并统计每行字符对应的像素值的像素值的和,即计算每行字符对应的各个像素点的像素值进行求和,得到每行字符的像素总和。判断当前行的字符的高度是否大于第一阈值,且当前行的字符的像素总和是否小于第二阈值。若当前行的字符的高度大于第一阈值,且当前行的像素总和大于第二阈值时,将初始形态学图像的当前行中的字体内部像素点的像素值调整为大于预设像素值,得到形态学梯度图像。通过调节字体内部的像素点的像素值,避免了字体内部的像素被当做背景像素去除。
在一个实施例中,当前行包括多个像素行,将当前行中的字体内部像素点的像素值调整为大于预设像素值,包括:提取各个像素行中的每组像素点集合的像素特征,每组像素点集合中包括至少三个像素点,且每组像素点集合的中包括的像素点的数目小于预设数目;判断每个像素行中的每组像素点集合的像素特征,是否满足预设特征条件;当当前像素行的当前组像素点的像素值满足预设特征条件时,在当前像素行的当前组像素点中任意一个像素点进行标记,得到当前像素行的当前组的标记信息,标记信息包括编号;将原始图像中位于当前像素行的当前标记位,和下一标记位之间的像素点作为第三像素点,当前标记位的编号为奇数,下一标记位的编号为偶数,将第三像素点的像素值调整为大于预设像素值。
具体地,当前行的字符的高度大于第一阈值,且当前行的字符的像素总和是否小于第二阈值,则表示当前行的字符存在字体内部的像素点小于第一预设阈值的像素点情况,字体内部的像素点小于第一预设阈值的像素点需要进行修改。当前行是指字符所在的行,像素行是指像素点所在的行。每个像素点存在唯一对应的行坐标,即存在唯一的像素行。对每个当前行的每个像素行进行检测,确定出每个像素行中的边框像素点,确定每个像素行中的边框像素点。对每行像素点按照预设的划分规则进行划分,得到多组像素点集合,其中每组像素点集合中包括至少三个像素点,每组像素点集合中包含相同数量的像素点,且每组像素点集合包含的像素点的数目小于预设数目。其中预设数目可以自定义,如预设数目根据腐蚀因子和/或膨胀因子确定,如当腐蚀因子矩形时,则预设数目为腐蚀因子的矩形边长或为边长加上预设数值等。
在一个实施例中,预设特征条件为:当前组像素点包括至少一个大于预设像素值的第四像素点及至少两个小于预设像素值的第五像素点,第五像素点位于第四像素点的两侧。
在一个实施例中,每组像素点集合包括三个像素点,从左往右排列,第一像素点的像素值小于预设像素值,第二像素点的像素值大于预设像素值,第三像素点的像素值小于预设像素值,则判定该组像素点集合满足预设特征条件。
在一个具体的实施例中,上述图像数据处理方法,包括:
读入一张图片,把原始图像转到HSV空间。
根据所选取的原始图像的颜色范围,获得各颜色的掩膜,寻找各颜色掩膜的轮廓,计算各轮廓的大小,如果某一轮廓的大小大于阈值,则说明原始图像的背景色为该颜色。
背景色去除:把原始图像转为灰度图,对灰度图进行腐蚀和膨胀,将膨胀的图像减去腐蚀的图像,获得形态学梯度。
对原始图像进行遍历,如果某一像素的形态学梯度等于0,则该像素赋值为255,即把该像素调为白色,得到去除背景色后的图像。
去除印章、手印等:
在HSV空间中,对印章盒手印的三个通道(色调、饱和度和亮度)的阈值范围进行确定,样本数据为红色,HSV空间中为红色或品红色,对特定的像素赋值为255。
考虑到对于一些较大或加粗的字体时,对灰度图进行腐蚀和膨胀,将膨胀的图像减去腐蚀的图像,获得形态学梯度图(该操作会得到字体的轮廓)之后,字体的内部会存在较多像素点的像素值小于阈值,但该部分的图像不是背景色,无需去除。故需对形态学梯度图中的该部分像素进行调整,将形态学梯度图中的该部分像素点的像素值调整为大于阈值,使得后续对与小于阈值的像素点位置相同的原图像素点进行处理时,不对字体内部的像素点进行处理。
通过形态学梯度图来识别字高,并以字符行为单位,将每一字符行的各像素点的值相加,计算每一行的像素值总和;当字高大于第一阈值且该字符行的像素值总和小于第二阈值时,认为在形态学梯度图中,该行字中的字体内部存在像素点的像素值小于阈值的情况。
将该行字的字体内部的像素点的值调整为大于阈值(如255),具体方法为:
以像素行为单位,检测每组像素点集合的像素特征,若该组像素点集合包括至少一个大于预设像素值的第四像素点及至少两个小于预设像素值的第五像素点,且第五像素点位于第四像素点的两侧,则认为该组像素点集合为字体的边框,并在该组像素点集合中任一像素点上打上标记;对于每一像素行上的标记,从左往右打上编号,编号从1开始。
对处于奇数标记到下一偶数标记的位移路径上的像素点的值进行替换,替换为大于阈值的像素值。
图1为一个实施例中图像数据处理方法的流程示意图。应该理解的是,虽然图1的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺2依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序2制,这些步骤可以以其它的顺序执行。而且,图1中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行2序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
在一个实施例中,如图2所示,提供了一种图像数据处理装置200,包括:
背景颜色识别模块201,用于获取原始图像,识别原始图像的背景颜色;
图像转换模块202,用于当背景颜色不为预设颜色时,灰度化原始图像,得到灰度图像;
膨胀模块203,用于采用膨胀因子对灰度图像进行膨胀操作,得到第一图像;
腐蚀模块204,用于采用腐蚀因子对灰度图像进行腐蚀操作,得到第二图像;
梯度图像计算模块205,用于采用第一图像减去第二图像得到形态学梯度图像;
背景去除模块206,用于采用预设像素值,替换原始图像中的第一像素点的像素值,得到目标图像,其中,第一像素点为与形态学梯度图像中像素值小于第一预设阈值的像素点位置相同的像素点。
在一个实施例中,背景颜色识别模块201具体用于计算原始图像中的各颜色特征对应的区域面积;当颜色特征对应的区域面积大于第一预设区域面积时,将颜色特征作为原始图像的背景颜色。
在一个实施例中,背景颜色识别模块201具体还用于对所述原始图像进行空间转换,得到原始图像的HSV图像;获取第一预设颜色特征集合,第一预设颜色特征集合中包含多个颜色特征;通过第一预设颜色特征集合中的每个颜色特征,对HSV图像进行阈值分割,得到对应的图像掩膜,每个第一预设颜色特征集合中的每个颜色特征对应的一个图像掩膜,图像掩膜的各个像素点的像素值为0或255;统计每个图像掩膜中像素值为255的像素点的数量,根据数量计算对应的区域面积。
在一个实施例中,原始图像为三通道图像,预设像素值包括三通道像素值,背景去除模块206具体用于判断当前坐标对应的三通道中各个通道的像素值,是否与预设像素值中对应的三通道像素值相同,当前坐标为形态学梯度图像中像素值小于第一预设像素值对应的坐标;当不相同时,采用预设像素值中对应的三通道像素值,替换当前坐标的对应的三通道中各个通道的像素值,得到目标图像。
在一个实施例中,形态学梯度图像中包含字符,梯度图像计算模块205具体用于采用第一图像减去第二图像得到初始形态学图像,初始形态学图像中包含字符;识别初始形态学图像像中各行字符的高度;统计初始形态学图像中各行字符的像素值的和,得到每行字符的像素总和;当当前行的字符的高度大于第一阈值,且当前行的像素总和大于第二阈值时,将初始形态学图像的当前行中的字体内部像素点的像素值调整为大于预设像素值,得到形态学梯度图像。
在一个实施例中,当前行包括多个像素行,梯度图像计算模块205具体用于提取各个像素行中的每组像素点集合中像素特征,每组像素点集合中包括至少三个像素点,且每组像素点集合中包括的像素点的数目小于预设数目;判断每个像素行中的每组像素点集合的像素特征,是否满足预设特征条件;当当前像素行的当前组像素点满足预设特征条件时,在当前像素行的当前组像素点中任意一个像素点进行标记,得到当前像素行的当前组的标记信息,标记信息包括编号;将原始图像中位于当前像素行的当前标记位,和下一标记位之间的像素点作为第三像素点,当前标记位的编号为奇数,下一标记位的编号为偶数;将第三像素点的像素值调整为大于预设像素值。
在一个实施例中,梯度图像计算模块205中的预设特征条件为:当前组像素点包括至少一个大于预设像素值的第四像素点及至少两个小于预设像素值的第五像素点,第五像素点位于第四像素点的两侧。
图3示出了一个实施例中计算机设备的内部结构图。如图3所示,该计算机设备通过系统总线连接的处理器、存储器、网络接口、输入装置和显示屏。其中,存储器包括非易失性存储介质和内存储器。该计算机设备的非易失性存储介质存储有操作系统,还可存储有计算机程序,该计算机程序被处理器执行时,可使得处理器实现图像数据处理方法。该内存储器中也可储存有计算机程序,该计算机程序被处理器执行时,可使得处理器执行图像数据处理方法。计算机设备的显示屏可以是液晶显示屏或者电子墨水显示屏,计算机设备的输入装置可以是显示屏上覆盖的触摸层,也可以是计算机设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。
本领域技术人员可以理解,图3中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,本申请提供的图像数据处理装置可以实现为一种计算机程序的形式,计算机程序可在如图3所示的计算机设备上运行。计算机设备的存储器中可存储组成该图像数据处理装置的各个程序模块,比如,图2所示的背景颜色识别模块201、图像转换模块202、膨胀模块203、腐蚀模块204、梯度图像计算模块205和背景去除模块206。各个程序模块构成的计算机程序使得处理器执行本说明书中描述的本申请各个实施例的图像数据处理方法中的步骤。
例如,图3所示的计算机设备可以通过如图2所示的图像数据处理装置中的背景颜色识别模块201执行获取原始图像,识别所述原始图像的背景颜色。计算机设备可以通过图像转换模块202执行当所述背景颜色不为预设颜色时,灰度化所述原始图像,得到灰度图像。计算机设备可以通过膨胀模块203执行采用膨胀因子对所述灰度图像进行膨胀操作,得到第一图像。计算机设备可以通过腐蚀模块204执行采用腐蚀因子对所述灰度图像进行腐蚀操作,得到第二图像。计算机设备可以通过梯度图像计算模块205执行采用所述第一图像减去所述第二图像得到形态学梯度图像。计算机设备可以通过背景去除模块206执行采用预设像素值,替换所述原始图像中的第一像素点的像素值,得到目标图像,其中,所述第一像素点为与所述形态学梯度图像中像素值小于第一预设阈值的像素点位置相同的像素点。
在一个实施例中,提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时实现上述图像数据处理方法中任意实施例中的步骤。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述图像数据处理方法中任意实施例中的步骤。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一非易失性计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
需要说明的是,在本文中,诸如“第一”和“第二”等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上所述仅是本发明的具体实施方式,使本领域技术人员能够理解或实现本发明。对这些实施例的多种修改对本领域的技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所申请的原理和新颖特点相一致的最宽的范围。
Claims (10)
1.一种图像数据处理方法,其特征在于,所述方法包括:
获取原始图像,识别所述原始图像的背景颜色;
当所述背景颜色不为预设颜色时,灰度化所述原始图像,得到灰度图像;
采用膨胀因子对所述灰度图像进行膨胀操作,得到第一图像;
采用腐蚀因子对所述灰度图像进行腐蚀操作,得到第二图像;
采用所述第一图像减去所述第二图像得到形态学梯度图像;
采用预设像素值,替换所述原始图像中的第一像素点的像素值,得到目标图像,其中,所述第一像素点为与所述形态学梯度图像中像素值小于第一预设阈值的像素点位置相同的像素点。
2.根据权利要求1所述的方法,其特征在于,所述识别所述原始图像的背景颜色,包括:
计算所述原始图像中的各颜色特征对应的区域面积;
当所述颜色特征对应的区域面积大于第一预设区域面积时,将所述颜色特征作为所述原始图像的背景颜色。
3.根据权利要求2所述的方法,其特征在于,所述方法还包括:
对所述原始图像进行空间转换,得到所述原始图像的HSV图像;
获取第一预设颜色特征集合,所述第一预设颜色特征集合中包含多个颜色特征;
通过所述第一预设颜色特征集合中的每个颜色特征,对所述HSV图像进行阈值分割,得到对应的图像掩膜,每个所述第一预设颜色特征集合中的每个颜色特征对应的一个图像掩膜,所述图像掩膜的各个像素点的像素值为0或255;
所述计算所述原始图像的每种所述颜色特征对应的区域面积,包括:统计每个所述图像掩膜中像素值为255的像素点的数量,根据所述数量计算对应的所述区域面积。
4.根据权利要求1所述的方法,其特征在于,所述原始图像为三通道图像,所述预设像素值包括三通道像素值,所述采用预设像素值,替换所述原始图像中的第一像素点的像素值,得到目标图像,包括:
判断当前坐标对应的三通道中各个通道的像素值,是否与所述预设像素值中对应的三通道像素值相同,所述当前坐标为所述形态学梯度图像中像素值小于所述第一预设像素值对应的坐标;
当不相同时,采用所述预设像素值中对应的三通道像素值,替换所述当前坐标的对应的三通道中各个通道的像素值,得到所述目标图像。
5.根据权利要求1所述的方法,其特征在于,所述采用所述第一图像减去所述第二图像得到形态学梯度图像,包括:
采用所述第一图像减去所述第二图像得到初始形态学图像,所述初始形态学图像中包含字符;
识别所述初始形态学图像像中各行字符的高度;
统计所述初始形态学图像中各行字符的像素值的和,得到每行字符的像素总和;
当当前行的字符的高度大于第一阈值,且所述当前行的像素总和大于第二阈值时,将所述初始形态学图像的当前行中的字体内部像素点的像素值调整为大于预设像素值,得到所述形态学梯度图像。
6.根据权利要求5所述的方法,其特征在于,所述当前行包括多个像素行,所述将所述当前行中的字体内部像素点的像素值调整为大于预设像素值,包括:
提取各个所述像素行中的每组像素点集合中像素特征,所述每组像素点集合中包括至少三个像素点,且所述每组像素点集合中包括的像素点的数目小于预设数目;
判断每个所述像素行中的每组像素点集合的像素特征,是否满足预设特征条件;
当当前像素行的当前组像素点满足所述预设特征条件时,在所述当前像素行的当前组像素点中任意一个像素点进行标记,得到所述当前像素行的当前组的标记信息,所述标记信息包括编号;
将所述原始图像中位于所述当前像素行的当前标记位,和下一标记位之间的像素点作为第三像素点,所述当前标记位的编号为奇数,所述下一标记位的编号为偶数;
将所述第三像素点的像素值调整为大于所述预设像素值。
7.根据权利要求6所述的方法,其特征在于,所述预设特征条件为:所述当前组像素点包括至少一个大于所述预设像素值的第四像素点及至少两个小于所述预设像素值的第五像素点,所述第五像素点位于所述第四像素点的两侧。
8.一种图像数据处理装置,其特征在于,所述装置包括:
背景颜色识别模块,用于获取原始图像,识别所述原始图像的背景颜色;
图像转换模块,用于当所述背景颜色不为预设颜色时,灰度化所述原始图像,得到灰度图像;
膨胀模块,用于采用膨胀因子对所述灰度图像进行膨胀操作,得到第一图像;
腐蚀模块,用于采用腐蚀因子对所述灰度图像进行腐蚀操作,得到第二图像;
梯度图像计算模块,用于采用所述第一图像减去所述第二图像得到形态学梯度图像;
背景去除模块,用于采用预设像素值,替换所述原始图像中的第一像素点的像素值,得到目标图像,其中,所述第一像素点为与所述形态学梯度图像中像素值小于第一预设阈值的像素点位置相同的像素点。
9.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010619151.0A CN113870154A (zh) | 2020-06-30 | 2020-06-30 | 图像数据处理方法、装置、计算机设备和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010619151.0A CN113870154A (zh) | 2020-06-30 | 2020-06-30 | 图像数据处理方法、装置、计算机设备和存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113870154A true CN113870154A (zh) | 2021-12-31 |
Family
ID=78981643
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010619151.0A Pending CN113870154A (zh) | 2020-06-30 | 2020-06-30 | 图像数据处理方法、装置、计算机设备和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113870154A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114862897A (zh) * | 2022-04-24 | 2022-08-05 | 北京百度网讯科技有限公司 | 一种图像背景处理方法、装置及电子设备 |
CN115601472A (zh) * | 2022-12-15 | 2023-01-13 | 南京航空航天大学(Cn) | 一种基于膨胀腐蚀算法的无失真黑边绘制方法 |
-
2020
- 2020-06-30 CN CN202010619151.0A patent/CN113870154A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114862897A (zh) * | 2022-04-24 | 2022-08-05 | 北京百度网讯科技有限公司 | 一种图像背景处理方法、装置及电子设备 |
CN115601472A (zh) * | 2022-12-15 | 2023-01-13 | 南京航空航天大学(Cn) | 一种基于膨胀腐蚀算法的无失真黑边绘制方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108710866B (zh) | 汉字模型训练方法、汉字识别方法、装置、设备及介质 | |
CN107729899B (zh) | 一种车牌号码识别方法及装置 | |
CN112184744B (zh) | 显示屏边缘缺陷检测方法和装置 | |
CN110619330A (zh) | 识别模型的训练方法、装置、计算机设备及识别方法 | |
CN110705233B (zh) | 基于文字识别技术的笔记生成方法、装置和计算机设备 | |
CN113379680B (zh) | 缺陷检测方法、装置、电子设备和计算机可读存储介质 | |
CN109389110B (zh) | 一种区域确定方法及装置 | |
CN112686264B (zh) | 数字式仪表读数方法、装置、计算机设备和存储介质 | |
CN113870154A (zh) | 图像数据处理方法、装置、计算机设备和存储介质 | |
CN109740609B (zh) | 一种轨距检测方法及装置 | |
CN110728687B (zh) | 文件图像分割方法、装置、计算机设备和存储介质 | |
CN111325769A (zh) | 一种目标对象检测方法及装置 | |
CN111814736B (zh) | 快递面单信息的识别方法、装置、设备及存储介质 | |
CN108830275B (zh) | 点阵字符、点阵数字的识别方法及装置 | |
JP7433887B2 (ja) | 画像を処理するための装置、プログラム、画像処理方法 | |
CN111680690A (zh) | 一种文字识别方法及装置 | |
CN115273115A (zh) | 一种文档元素标注方法、装置、电子设备和存储介质 | |
CN111814716A (zh) | 印章去除方法、计算机设备和可读存储介质 | |
US9824289B2 (en) | Exploiting color for license plate recognition | |
CN108877030B (zh) | 图像处理方法、装置、终端和计算机可读存储介质 | |
CN109726722B (zh) | 一种字符分割方法及装置 | |
CN113256644A (zh) | 票据图像分割方法、装置、介质和设备 | |
CN116030472A (zh) | 文字坐标确定方法及装置 | |
CN110751013A (zh) | 场景识别方法、装置和计算机可读存储介质 | |
CN111241974A (zh) | 票据信息获取方法、装置、计算机设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |