CN112183229A - 基于计算动态参数的作业纸图像的字格提取方法及装置 - Google Patents
基于计算动态参数的作业纸图像的字格提取方法及装置 Download PDFInfo
- Publication number
- CN112183229A CN112183229A CN202010938743.9A CN202010938743A CN112183229A CN 112183229 A CN112183229 A CN 112183229A CN 202010938743 A CN202010938743 A CN 202010938743A CN 112183229 A CN112183229 A CN 112183229A
- Authority
- CN
- China
- Prior art keywords
- image
- paper image
- dynamic
- parameters
- paper
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/414—Extracting the geometrical structure, e.g. layout tree; Block segmentation, e.g. bounding boxes for graphics or text
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/26—Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
- G06V10/267—Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion by performing operations on regions, e.g. growing, shrinking or watersheds
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Computer Graphics (AREA)
- Geometry (AREA)
- Artificial Intelligence (AREA)
- Image Analysis (AREA)
- Image Processing (AREA)
Abstract
本申请公开了一种基于计算动态参数的作业纸图像的字格提取方法及装置,本申请的方法包括对作业纸图像进行灰度化处理,并分析作业纸图像的图像特征;根据图像特征计算作业纸图像的动态提取参数,不同的作业纸图像对应的动态提取参数不尽相同;根据动态提取参数对灰度化处理后的作业纸图像进行二值化处理;根据动态提取参数并应用形态学开运算和卷积运算识别出作业纸图像中的横线和竖线的坐标;根据横线和竖线的坐标点集合定位交叉点,交叉点为横线和竖线的交叉点;根据交叉点的坐标集合对二值化处理后的图像进行分割,提取字格单元。本申请是为了提出一种提高作业纸图像单字格自动提取的准确率的提取方式。
Description
技术领域
本申请涉及图像处理技术领域,具体而言,涉及一种基于计算动态参数的作业纸图像的字格提取方法及装置。
背景技术
学生在通过线上提交作业时,提交的是图片,在进行自动批改的过程中,需要对图片进行图像处理进行识别。比如对于书法作业,在图像识别过程中需要自动对书法作业纸图像进行提取单字格。现有的对书法作业纸图像进行提取单字格的方法为:预先设置的静态参数,如相邻区域大小和常数,结构元素大小,卷积核大小和迭代次数等。在测试验证环境中,由于图像样本数量有限,现有的提取方式可以实现较高的提取准确率。但在实际使用过程中,由于一些外在因素(光照、拍摄距离、拍摄角度、像素大小等)的影响会造成不同图像明显存在差异,使用预设的静态参数方法实现的提取准确率会降低而且不稳定。因此,亟需提出一种提高作业纸图像单字格自动提取的准确率的提取方式。
发明内容
本申请的主要目的在于提供一种基于计算动态参数的作业纸图像的字格提取方法及装置,以提出一种提高作业纸图像单字格自动提取的准确率的提取方式。
为了实现上述目的,根据本申请的第一方面,提供了一种基于计算动态参数的作业纸图像的字格提取方法。
根据本申请的基于计算动态参数的作业纸图像的字格提取方法包括:
对作业纸图像进行灰度化处理,并分析作业纸图像的图像特征;
根据所述图像特征计算所述作业纸图像的动态提取参数,不同的作业纸图像对应的动态提取参数不尽相同,所述动态提取参数包括相邻区域大小和常数,结构元素大小,卷积核大小和迭代次数;
根据所述动态提取参数对灰度化处理后的作业纸图像进行二值化处理;
根据所述动态提取参数并应用形态学开运算和卷积运算识别出作业纸图像中的横线和竖线的坐标,所述横线和竖线为构成字格的横线和竖线;
根据横线和竖线的坐标点集合定位交叉点,所述交叉点为横线和竖线的交叉点;
根据交叉点的坐标集合对二值化处理后的图像进行分割,提取字格单元。
可选的,所述分析作业纸图像的图像特征包括:
确定作业纸图像的最小外接矩形;
根据最小外接矩形计算作业纸图像的周长、面积、质心。
可选的,所述根据所述动态提取参数对灰度化处理后的作业纸图像进行二值化处理包括:
采用局部自适应阈值二值化方法对灰度化处理后的作业纸图像进行二值化处理。
可选的,所述根据所述动态提取参数并应用形态学开运算和卷积运算识别出作业纸图像中的横线和竖线的坐标包括:
运用形态学开运算算法,结合结构元素大小构造卷积核形状和大小,根据迭代次数进行多次卷积运算,对图像腐蚀然后再膨胀,消除小形体或噪点图像,在纤细点处分离形体、平滑较大形体的边界,识别出横线坐标和竖线坐标。
可选的,所述根据交叉点的坐标集合对二值化处理后的图像进行分割,提取字格单元包括:
根据交叉点坐标集合坐标进行坐标加减运算,查漏补缺,确定单元格轮廓;
根据单元格轮廓进行图像分割提取单元格。
可选的,所述方法还包括:
获取新的作业纸图像后,重新计算动态提取参数;
根据重新计算的动态提取参数对所述新的作业纸图像进行字格提取。
可选的,所述方法还包括:
将字格提取后的作业纸图像的图像特征以及对应的动态提取参数保存到预设列表中。
可选的,所述方法还包括:
获取新的作业纸图像后,将新的作业纸的图像特征与预设列表中记录的图像特征进行比较;
若存在与新的作业纸的图像特征相同或相似的图像特征,则将相同或相似的图像特征对应的动态提取参数确定为所述新的作业纸图像对应的动态提取参数;
根据新的作业纸图像对应的动态提取参数对新的作业纸图像进行字格提取。
为了实现上述目的,根据本申请的第二方面,提供了一种基于计算动态参数的作业纸图像的字格提取装置。
根据本申请的基于计算动态参数的作业纸图像的字格提取装置包括:
分析处理单元,用于对作业纸图像进行灰度化处理,并分析作业纸图像的图像特征;
计算单元,用于根据所述图像特征计算所述作业纸图像的动态提取参数,不同的作业纸图像对应的动态提取参数不尽相同,所述动态提取参数包括相邻区域大小和常数,结构元素大小,卷积核大小和迭代次数;
二值化单元,用于根据所述动态提取参数对灰度化处理后的作业纸图像进行二值化处理;
横线和竖线识别单元,用于根据所述动态提取参数并应用形态学开运算和卷积运算识别出作业纸图像中的横线和竖线的坐标,所述横线和竖线为构成字格的横线和竖线;
交叉点确定单元,用于根据横线和竖线的坐标点集合定位交叉点,所述交叉点为横线和竖线的交叉点;
第一提取单元,用于根据交叉点的坐标集合对二值化处理后的图像进行分割,提取字格单元。
可选的,所述分析处理单元,还包括:
确定模块,用于确定作业纸图像的最小外接矩形;
计算模块,用于根据最小外接矩形计算作业纸图像的周长、面积、质心。
可选的,所述二值化单元还用于
采用局部自适应阈值二值化装置对灰度化处理后的作业纸图像进行二值化处理。
可选的,所述横线和竖线识别单元还用于:
运用形态学开运算算法,结合结构元素大小构造卷积核形状和大小,根据迭代次数进行多次卷积运算,对图像腐蚀然后再膨胀,消除小形体或噪点图像,在纤细点处分离形体、平滑较大形体的边界,识别出横线坐标和竖线坐标。
可选的,所述第一提取单元包括:
轮廓确定模块,用于根据交叉点坐标集合坐标进行坐标加减运算,查漏补缺,确定单元格轮廓;
提取模块,用于根据单元格轮廓进行图像分割提取单元格。
可选的,所述装置还包括:
获取单元,用于获取新的作业纸图像后,重新计算动态提取参数;
第二提取单元,用于根据重新计算的动态提取参数对所述新的作业纸图像进行字格提取。
可选的,所述装置还包括:
保存单元,用于将字格提取后的作业纸图像的图像特征以及对应的动态提取参数保存到预设列表中。
可选的,所述装置还包括:
比较单元,用于获取新的作业纸图像后,将新的作业纸的图像特征与预设列表中记录的图像特征进行比较;
动态提取参数确定单元,用于若存在与新的作业纸的图像特征相同或相似的图像特征,则将相同或相似的图像特征对应的动态提取参数确定为所述新的作业纸图像对应的动态提取参数;
所述第二提取单元,还用于根据新的作业纸图像对应的动态提取参数对新的作业纸图像进行字格提取。
为了实现上述目的,根据本申请的第三方面,提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使所述计算机执行上述第一方面中任意一项所述的基于计算动态参数的作业纸图像的字格提取方法。
为了实现上述目的,根据本申请的第四方面,提供了一种电子设备,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的计算机程序,所述计算机程序被所述至少一个处理器执行,以使所述至少一个处理器执行上述第一方面中任意一项所述的基于计算动态参数的作业纸图像的字格提取方法。
在本申请实施例中,基于计算动态参数的作业纸图像的字格提取方法及装置中,首先,对作业纸图像进行灰度化处理,并分析作业纸图像的图像特征;然后,根据图像特征计算作业纸图像的动态提取参数,不同的作业纸图像对应的动态提取参数不尽相同,动态提取参数包括相邻区域大小和常数,结构元素大小,卷积核大小和迭代次数;再然后根据动态提取参数对灰度化处理后的作业纸图像进行二值化处理;再然后根据动态提取参数并应用形态学开运算和卷积运算识别出作业纸图像中的横线和竖线的坐标,横线和竖线为字格的横线和竖线;再然后根据横线和竖线的坐标点集合定位交叉点,交叉点为横线和竖线的交叉点;最后根据交叉点的坐标集合对二值化处理后的图像进行分割,提取字格单元。可以看出,本申请的作业纸图像的字格提取方法中,提取的参数是动态的参数,能够根据不同的作业图像进行动态的调整,适应由于外在因素造成作业纸图像存在差异的情况,与现有的通过预设的静态参数的提取方法相比更灵活,更准确。
附图说明
构成本申请的一部分的附图用来提供对本申请的进一步理解,使得本申请的其它特征、目的和优点变得更明显。本申请的示意性实施例附图及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1是根据本申请实施例提供的一种基于计算动态参数的作业纸图像的字格提取方法流程图;
图2是根据本申请实施例提供的一种基于计算动态参数的作业纸图像的字格提取装置的组成框图;
图3是根据本申请实施例提供的另一种基于计算动态参数的作业纸图像的字格提取装置的组成框图。
具体实施方式
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分的实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。
需要说明的是,本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。
根据本申请实施例,提供了一种基于计算动态参数的作业纸图像的字格提取方法,如图1所示,该方法包括如下的步骤:
S101.对作业纸图像进行灰度化处理,并分析作业纸图像的图像特征。
首先需要说明的是,本身请应用在自动批改作业中,对提交的作业(比如书法作业)进行图像识别并进行自动批改。具体的,当获取到作业纸图像后,首先将原始的作业纸图像缩放到合适宽高比例和像素大小,增加锐化效果提升图像清晰度,并转化为灰度图像。
“分析作业纸图像的图像特征”包括确定作业纸图像的最小外接矩形;根据最小外接矩形计算作业纸图像的周长、面积、质心(几何中心)。具体的计算作业纸图像的周长、面积、质心可以参考现有的计算方式得到比如:
轮廓特征之矩、面积、周长、几何中心计算如下:
1.图像矩
原始矩
对于二维连续函数f(x,p+q)阶的矩被定义为
图像矩
对于p,q=0,1,2…对于灰度图像的像素的强度I(x,y),原始图像的矩Mij被计算为:
图像中心矩
中心矩被定义为:
标准化的中心矩
图像矩作用:
二值图像的的面积或灰度图像的像素总和,可以表示为:M00
轮廓的面积可以使用函数cv2.contourArea()计算得到,也可以使用矩(0阶矩),M00
area=cv2.contourArea(cnt)
轮廓周长
也被称为弧长。可以使用函数cv2.arcLength()计算得到。这个函数的第二参数可以用来指定对象的形状是闭合的(True),还是打开的(一条曲线)。
perimeter=cv2.arcLength(cnt,True)
S102.根据图像特征计算作业纸图像的动态提取参数。
其中,动态提取参数与现有的预设的静态参数不同,本实施例中的动态提取参数的不同在于,提取参数并不是预设的始终保持不变的参数,而是根据当前识别的作业纸图像的图像特征计算的动态参数,不同的作业纸图像对应的动态提取参数不尽相同,与预设的静态参数相比,动态提取参数可以根据作业图像的变动适应性的调整,以适应不同光照、拍摄角度、像素等的图像的识别,有效的保证了识别的准确性。
其中,动态提取参数包括相邻区域大小和常数,结构元素大小,卷积核大小和迭代次数。动态提取参数是根据卷积运算进行图像识别时需要确定的参数。其中,相邻区域,含周边区域(比如可以为向外扩充10个像素或者15个像素等);常数为不改变算法复杂度但可以加快程序运行速度的数值被称为常数(在卷积运算时使用的常数,具体可以为像素值)。结构元素:是用来对被识别的作业纸图像进行卷积处理时使用的比较小的图像(比如5×5像素的图像等)。
具体的,作业纸图像的动态提取参数是根据前述确定的图像特征(周长、面积、质心)确定。具体的确定方式不作限定,只要是能够根据图像特征确定前述的动态提取参数的任意方式都可以。
S103.根据动态提取参数对灰度化处理后的作业纸图像进行二值化处理。
进行二值化处理即把大于某个临界灰度值的像素灰度设为灰度极大值,把小于这个值的像素灰度设为灰度极小值,使得整个图像呈现出明显的黑白效果,消除图像背景噪声的干扰,方便后续对图像进一步处理和分割该图像。具体的,本实施例采用局部自适应阈值二值化方法对灰度化处理后的作业纸图像进行二值化处理。其中阀值(临界灰度值)取自相邻区域的加权和,权重为一个高斯窗口,同时指定邻域(前述中的相邻区域)用来计算阀值的区域大小,最后减去常数(前述中的常数)得出结果。
S104.根据动态提取参数并应用形态学开运算和卷积运算识别出作业纸图像中的横线和竖线的坐标。
其中,横线和竖线为构成字格的横线和竖线,横线和竖线组成了字格。本步骤中“根据动态提取参数并应用形态学开运算和卷积运算识别出作业纸图像中的横线和竖线的坐标”具体实现为:运用形态学开运算算法,结合结构元素大小构造卷积核形状和大小(卷积核形状大小和结构元素形状大小相同),根据迭代次数进行多次卷积运算,对图像腐蚀然后再膨胀,消除小形体或噪点图像,在纤细点处分离形体、平滑较大形体的边界,识别出横线坐标和竖线坐标,得到的是横线坐标和竖线坐标集合。
其中,形态学中先腐蚀后膨胀的过程称为开运算。用来消除小形体、在纤细点处分离形体、平滑较大物体的边界的同时并不明显改变其面积。在本实施例中,消除小形体或噪点图像为,消除零散的或者孤立的像素点;在纤细点处分离形体为零散的或者孤立的像素点。平滑较大物体的边界为:在图像识别时,得到的作业纸的图像中可能会存在竖线或者横线有断开不连续的情况,大的形体为断开处两边连续的横线或者竖线形体(相比于断开处零散的像素点,连续的横线或者竖线为大形体),平滑较大物体的边界即使有断开的横线或者竖线形体连接,形成平滑的线(形体)。
S105.根据横线和竖线的坐标点集合定位交叉点,交叉点为横线和竖线的交叉点。
具体的,可以运用算法消除不符合实际情况或噪点等干扰坐标点,获得交叉点坐标(二维坐标)集合。其中消除干扰坐标点的算法可以为判断欧式距离、算术均值滤波、高斯滤波等。
S106.根据交叉点的坐标集合对二值化处理后的图像进行分割,提取字格单元。
具体的,“根据交叉点的坐标集合对二值化处理后的图像进行分割,提取字格单元”的实现为:根据交叉点坐标集合坐标进行坐标加减运算,查漏补缺,确定单元格轮廓;根据单元格轮廓进行图像分割提取单元格,即字格单元。
从以上的描述中,可以看出,本申请实施例的基于计算动态参数的作业纸图像的字格提取方法中,首先,对作业纸图像进行灰度化处理,并分析作业纸图像的图像特征;然后,根据图像特征计算作业纸图像的动态提取参数,不同的作业纸图像对应的动态提取参数不尽相同,动态提取参数包括相邻区域大小和常数,结构元素大小,卷积核大小和迭代次数;再然后根据动态提取参数对灰度化处理后的作业纸图像进行二值化处理;再然后根据动态提取参数并应用形态学开运算和卷积运算识别出作业纸图像中的横线和竖线的坐标,横线和竖线为字格的横线和竖线;再然后根据横线和竖线的坐标点集合定位交叉点,交叉点为横线和竖线的交叉点;最后根据交叉点的坐标集合对二值化处理后的图像进行分割,提取字格单元。可以看出,本申请的作业纸图像的字格提取方法中,提取的参数是动态的参数,能够根据不同的作业图像进行动态的调整,适应由于外在因素造成作业纸图像存在差异的情况,与现有的通过预设的静态参数的提取方法相比更灵活,更准确。
进一步的,在进行作业自动批改时,每获取新的作业纸图像后,都需重新计算动态提取参数,即根据新的作业纸图像的图像特征得到新的动态提取参数,然后根据重新计算的动态提取参数对新的作业纸图像进行字格提取。
进一步的,为了提高作业批改的效率,还可以在将字格提取后的作业纸图像的图像特征以及对应的动态提取参数保存到预设列表或者预设数据库中,当获取新的作业纸图像后,将新的作业纸的图像特征与预设列表中记录的图像特征进行比较;若存在与新的作业纸的图像特征相同或相似的图像特征,则将相同或相似的图像特征对应的动态提取参数确定为所述新的作业纸图像对应的动态提取参数;根据新的作业纸图像对应的动态提取参数对新的作业纸图像进行字格提取。其中,判断与新的作业纸的图像特征相同或相似的图像特征时,具体的可以设定判断规则,比如所有图像特征完全相同或者相似度达到95%以上,或者所有图像特征中几个完全相同或者相似度达到95%以上,等等规则。
需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
根据本申请实施例,还提供了一种用于实施上述图1所述方法的基于计算动态参数的作业纸图像的字格提取装置,如图2所示,该装置包括:
分析处理单元201,用于对作业纸图像进行灰度化处理,并分析作业纸图像的图像特征;
计算单元202,用于根据所述图像特征计算所述作业纸图像的动态提取参数,不同的作业纸图像对应的动态提取参数不尽相同,所述动态提取参数包括相邻区域大小和常数,结构元素大小,卷积核大小和迭代次数;
二值化单元203,用于根据所述动态提取参数对灰度化处理后的作业纸图像进行二值化处理;
横线和竖线识别单元204,用于根据所述动态提取参数并应用形态学开运算和卷积运算识别出作业纸图像中的横线和竖线的坐标,所述横线和竖线为构成字格的横线和竖线;
交叉点确定单元205,用于根据横线和竖线的坐标点集合定位交叉点,所述交叉点为横线和竖线的交叉点;
第一提取单元206,用于根据交叉点的坐标集合对二值化处理后的图像进行分割,提取字格单元。
从以上的描述中,可以看出,本申请实施例的基于计算动态参数的作业纸图像的字格提取装置中,首先,对作业纸图像进行灰度化处理,并分析作业纸图像的图像特征;然后,根据图像特征计算作业纸图像的动态提取参数,不同的作业纸图像对应的动态提取参数不尽相同,动态提取参数包括相邻区域大小和常数,结构元素大小,卷积核大小和迭代次数;再然后根据动态提取参数对灰度化处理后的作业纸图像进行二值化处理;再然后根据动态提取参数并应用形态学开运算和卷积运算识别出作业纸图像中的横线和竖线的坐标,横线和竖线为字格的横线和竖线;再然后根据横线和竖线的坐标点集合定位交叉点,交叉点为横线和竖线的交叉点;最后根据交叉点的坐标集合对二值化处理后的图像进行分割,提取字格单元。可以看出,本申请的作业纸图像的字格提取方法中,提取的参数是动态的参数,能够根据不同的作业图像进行动态的调整,适应由于外在因素造成作业纸图像存在差异的情况,与现有的通过预设的静态参数的提取方法相比更灵活,更准确。
进一步的,如图3所示,所述分析处理单元201,还包括:
确定模块2011,用于确定作业纸图像的最小外接矩形;
计算模块2012,用于根据最小外接矩形计算作业纸图像的周长、面积、质心。
进一步的,所述二值化单元203还用于
采用局部自适应阈值二值化装置对灰度化处理后的作业纸图像进行二值化处理。
进一步的,所述横线和竖线识别单元204还用于:
运用形态学开运算算法,结合结构元素大小构造卷积核形状和大小,根据迭代次数进行多次卷积运算,对图像腐蚀然后再膨胀,消除小形体或噪点图像,在纤细点处分离形体、平滑较大形体的边界,识别出横线坐标和竖线坐标。
进一步的,如图3所示,所述第一提取单元206还包括:
轮廓确定模块2061,用于根据交叉点坐标集合坐标进行坐标加减运算,查漏补缺,确定单元格轮廓;
提取模块2062,用于根据单元格轮廓进行图像分割提取单元格。
进一步的,如图3所示,所述装置还包括:
获取单元207,用于获取新的作业纸图像后,重新计算动态提取参数;
第二提取单元208,用于根据重新计算的动态提取参数对所述新的作业纸图像进行字格提取。
进一步的,如图3所示,所述装置还包括:
保存单元209,用于将字格提取后的作业纸图像的图像特征以及对应的动态提取参数保存到预设列表中。
进一步的,如图3所示,所述装置还包括:
比较单元210,用于获取新的作业纸图像后,将新的作业纸的图像特征与预设列表中记录的图像特征进行比较;
动态提取参数确定单元211,用于若存在与新的作业纸的图像特征相同或相似的图像特征,则将相同或相似的图像特征对应的动态提取参数确定为所述新的作业纸图像对应的动态提取参数;
所述第二提取单元208,还用于根据新的作业纸图像对应的动态提取参数对新的作业纸图像进行字格提取。
具体的,本申请实施例的装置中各单元、模块实现其功能的具体过程可参见方法实施例中的相关描述,此处不再赘述。
根据本申请实施例,还提供了一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使所述计算机执行上述方法实施例中的基于计算动态参数的作业纸图像的字格提取方法。
根据本申请实施例,还提供了一种电子设备,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的计算机程序,所述计算机程序被所述至少一个处理器执行,以使所述至少一个处理器执行上述方法实施例中的基于计算动态参数的作业纸图像的字格提取方法。
显然,本领域的技术人员应该明白,上述的本申请的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本申请不限制于任何特定的硬件和软件结合。
以上所述仅为本申请的优选实施例而已,并不用于限制本申请,对于本领域的技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。
Claims (10)
1.一种基于计算动态参数的作业纸图像的字格提取方法,其特征在于,所述方法包括:
对作业纸图像进行灰度化处理,并分析作业纸图像的图像特征;
根据所述图像特征计算所述作业纸图像的动态提取参数,不同的作业纸图像对应的动态提取参数不尽相同,所述动态提取参数包括相邻区域大小和常数,结构元素大小,卷积核大小和迭代次数;
根据所述动态提取参数对灰度化处理后的作业纸图像进行二值化处理;
根据所述动态提取参数并应用形态学开运算和卷积运算识别出作业纸图像中的横线和竖线的坐标,所述横线和竖线为构成字格的横线和竖线;
根据横线和竖线的坐标点集合定位交叉点,所述交叉点为横线和竖线的交叉点;
根据交叉点的坐标集合对二值化处理后的图像进行分割,提取字格单元。
2.根据权利要求1所述的基于计算动态参数的作业纸图像的字格提取方法,其特征在于,所述分析作业纸图像的图像特征包括:
确定作业纸图像的最小外接矩形;
根据最小外接矩形计算作业纸图像的周长、面积、质心。
3.根据权利要求1所述的基于计算动态参数的作业纸图像的字格提取方法,其特征在于,所述根据所述动态提取参数对灰度化处理后的作业纸图像进行二值化处理包括:
采用局部自适应阈值二值化方法对灰度化处理后的作业纸图像进行二值化处理。
4.根据权利要求1所述的基于计算动态参数的作业纸图像的字格提取方法,其特征在于,所述根据所述动态提取参数并应用形态学开运算和卷积运算识别出作业纸图像中的横线和竖线的坐标包括:
运用形态学开运算算法,结合结构元素大小构造卷积核形状和大小,根据迭代次数进行多次卷积运算,对图像腐蚀然后再膨胀,消除小形体或噪点图像,在纤细点处分离形体、平滑较大形体的边界,识别出横线坐标和竖线坐标。
5.根据权利要求1所述的基于计算动态参数的作业纸图像的字格提取方法,其特征在于,所述根据交叉点的坐标集合对二值化处理后的图像进行分割,提取字格单元包括:
根据交叉点坐标集合坐标进行坐标加减运算,查漏补缺,确定单元格轮廓;
根据单元格轮廓进行图像分割提取单元格。
6.根据权利要求1所述的基于计算动态参数的作业纸图像的字格提取方法,其特征在于,所述方法还包括:
获取新的作业纸图像后,重新计算动态提取参数;
根据重新计算的动态提取参数对所述新的作业纸图像进行字格提取。
7.根据权利要求1所述的基于计算动态参数的作业纸图像的字格提取方法,其特征在于,所述方法还包括:
将字格提取后的作业纸图像的图像特征以及对应的动态提取参数保存到预设列表中。
8.根据权利要求7所述的基于计算动态参数的作业纸图像的字格提取方法,其特征在于,所述方法还包括:
获取新的作业纸图像后,将新的作业纸的图像特征与预设列表中记录的图像特征进行比较;
若存在与新的作业纸的图像特征相同或相似的图像特征,则将相同或相似的图像特征对应的动态提取参数确定为所述新的作业纸图像对应的动态提取参数;
根据新的作业纸图像对应的动态提取参数对新的作业纸图像进行字格提取。
9.一种基于计算动态参数的作业纸图像的字格提取装置,其特征在于,所述装置包括:
分析处理单元,用于对作业纸图像进行灰度化处理,并分析作业纸图像的图像特征;
计算单元,用于根据所述图像特征计算所述作业纸图像的动态提取参数,不同的作业纸图像对应的动态提取参数不尽相同,所述动态提取参数包括相邻区域大小和常数,结构元素大小,卷积核大小和迭代次数;
二值化单元,用于根据所述动态提取参数对灰度化处理后的作业纸图像进行二值化处理;
横线和竖线识别单元,用于根据所述动态提取参数并应用形态学开运算和卷积运算识别出作业纸图像中的横线和竖线的坐标,所述横线和竖线为构成字格的横线和竖线;
交叉点确定单元,用于根据横线和竖线的坐标点集合定位交叉点,所述交叉点为横线和竖线的交叉点;
第一提取单元,用于根据交叉点的坐标集合对二值化处理后的图像进行分割,提取字格单元。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使所述计算机执行权利要求1-8任意一项所述的基于计算动态参数的作业纸图像的字格提取方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010938743.9A CN112183229B (zh) | 2020-09-08 | 2020-09-08 | 基于计算动态参数的作业纸图像的字格提取方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010938743.9A CN112183229B (zh) | 2020-09-08 | 2020-09-08 | 基于计算动态参数的作业纸图像的字格提取方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112183229A true CN112183229A (zh) | 2021-01-05 |
CN112183229B CN112183229B (zh) | 2023-05-23 |
Family
ID=73919997
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010938743.9A Active CN112183229B (zh) | 2020-09-08 | 2020-09-08 | 基于计算动态参数的作业纸图像的字格提取方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112183229B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112927148A (zh) * | 2021-01-27 | 2021-06-08 | 上海云深网络技术有限公司 | 图像处理方法及图像处理系统 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1949249A (zh) * | 2005-10-11 | 2007-04-18 | 株式会社理光 | 表格提取方法和设备 |
CN109086714A (zh) * | 2018-07-31 | 2018-12-25 | 国科赛思(北京)科技有限公司 | 表格识别方法、识别系统及计算机装置 |
CN110033471A (zh) * | 2019-04-19 | 2019-07-19 | 福州大学 | 一种基于连通域分析和形态学操作的框线检测方法 |
CN110647795A (zh) * | 2019-07-30 | 2020-01-03 | 正和智能网络科技(广州)有限公司 | 一种表格识别方法 |
US20200089946A1 (en) * | 2018-06-11 | 2020-03-19 | Innoplexus Ag | System and method for extracting tabular data from electronic document |
CN111414919A (zh) * | 2020-03-26 | 2020-07-14 | 遥相科技发展(北京)有限公司 | 带表格印刷体图片文字提取方法、装置、设备及存储介质 |
-
2020
- 2020-09-08 CN CN202010938743.9A patent/CN112183229B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1949249A (zh) * | 2005-10-11 | 2007-04-18 | 株式会社理光 | 表格提取方法和设备 |
US20200089946A1 (en) * | 2018-06-11 | 2020-03-19 | Innoplexus Ag | System and method for extracting tabular data from electronic document |
CN109086714A (zh) * | 2018-07-31 | 2018-12-25 | 国科赛思(北京)科技有限公司 | 表格识别方法、识别系统及计算机装置 |
CN110033471A (zh) * | 2019-04-19 | 2019-07-19 | 福州大学 | 一种基于连通域分析和形态学操作的框线检测方法 |
CN110647795A (zh) * | 2019-07-30 | 2020-01-03 | 正和智能网络科技(广州)有限公司 | 一种表格识别方法 |
CN111414919A (zh) * | 2020-03-26 | 2020-07-14 | 遥相科技发展(北京)有限公司 | 带表格印刷体图片文字提取方法、装置、设备及存储介质 |
Non-Patent Citations (1)
Title |
---|
郑秀清等: "一种改进的自动表格框线检测方法", 《中国民航飞行学院学报》 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112927148A (zh) * | 2021-01-27 | 2021-06-08 | 上海云深网络技术有限公司 | 图像处理方法及图像处理系统 |
Also Published As
Publication number | Publication date |
---|---|
CN112183229B (zh) | 2023-05-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108898610B (zh) | 一种基于mask-RCNN的物体轮廓提取方法 | |
CN109086714B (zh) | 表格识别方法、识别系统及计算机装置 | |
CN110414507B (zh) | 车牌识别方法、装置、计算机设备和存储介质 | |
CN105956582B (zh) | 一种基于三维数据的人脸识别系统 | |
CN110148130B (zh) | 用于检测零件缺陷的方法和装置 | |
CN110427932B (zh) | 一种识别图像中多个票据区域的方法及装置 | |
CN112183038A (zh) | 一种表格识别套打方法、计算机设备及计算机可读存储介质 | |
CN114529459B (zh) | 一种对图像边缘进行增强处理的方法和系统及介质 | |
CN107871319B (zh) | 限束器区域的检测方法、装置、x射线系统和存储介质 | |
CN111368638A (zh) | 电子表格的创建方法、装置、计算机设备和存储介质 | |
CN113781406B (zh) | 电子元器件的划痕检测方法、装置及计算机设备 | |
CN108876795A (zh) | 一种图像中物体的分割方法及系统 | |
CN111754538B (zh) | Usb表面缺陷检测的阈值分割方法 | |
CN110969620A (zh) | 一种磁瓦波纹类缺陷的检测方法及装置 | |
CN111951283A (zh) | 一种基于深度学习的医学图像识别方法及系统 | |
CN115546232A (zh) | 一种肝脏超声图像工作区域提取方法、系统及电子设备 | |
CN114283431B (zh) | 一种基于可微分二值化的文本检测方法 | |
CN112686265A (zh) | 一种基于层级轮廓提取的象形文字分割方法 | |
CN117635615B (zh) | 基于深度学习实现冲孔模具的缺陷检测方法及系统 | |
CN112258532B (zh) | 一种超声图像中胼胝体的定位及分割方法 | |
CN112183229A (zh) | 基于计算动态参数的作业纸图像的字格提取方法及装置 | |
CN116434071B (zh) | 一种规整化建筑掩膜的确定方法、确定装置、设备及介质 | |
CN110276260B (zh) | 一种基于深度摄像头的商品检测方法 | |
CN111340040A (zh) | 一种纸张字符识别方法、装置、电子设备及存储介质 | |
CN114882192B (zh) | 一种建筑立面的分割方法、装置、电子设备以及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |