CN115690823A - 电气图纸中带有毛刺特征的表格信息提取方法及装置 - Google Patents
电气图纸中带有毛刺特征的表格信息提取方法及装置 Download PDFInfo
- Publication number
- CN115690823A CN115690823A CN202211352828.4A CN202211352828A CN115690823A CN 115690823 A CN115690823 A CN 115690823A CN 202211352828 A CN202211352828 A CN 202211352828A CN 115690823 A CN115690823 A CN 115690823A
- Authority
- CN
- China
- Prior art keywords
- coordinates
- module
- image
- extracting
- area
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 34
- 238000001514 detection method Methods 0.000 claims abstract description 29
- 238000012545 processing Methods 0.000 claims abstract description 22
- 238000000605 extraction Methods 0.000 claims abstract description 19
- 238000005520 cutting process Methods 0.000 claims abstract description 18
- 238000005260 corrosion Methods 0.000 claims abstract description 14
- 230000007797 corrosion Effects 0.000 claims abstract description 14
- 230000009466 transformation Effects 0.000 claims abstract description 6
- 238000010008 shearing Methods 0.000 claims abstract description 4
- 238000007781 pre-processing Methods 0.000 claims description 5
- 238000013461 design Methods 0.000 claims description 4
- 238000004870 electrical engineering Methods 0.000 claims description 4
- 238000012549 training Methods 0.000 claims description 4
- 238000012217 deletion Methods 0.000 claims description 2
- 230000037430 deletion Effects 0.000 claims description 2
- 230000000694 effects Effects 0.000 abstract description 9
- 238000010586 diagram Methods 0.000 description 5
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
Images
Landscapes
- Image Analysis (AREA)
- Image Processing (AREA)
Abstract
本发明公开了一种电气图纸中带有毛刺特征的表格信息提取方法及装置,所述方法包括如下步骤:通过目标检测算法,检测表格所在区域;将识别结果保留坐标,对原图进行坐标裁剪,提取表格所在区域;批量读取图片,将图片灰度化处理后进行二值化,腐蚀和膨胀操作,利用霍夫线变换函数检测横竖线;对横竖线组合的区域检测物体的轮廓;根据轮廓坐标获取最大表格,通过剪切把最外面的毛刺去掉,根据轮廓索引分别提取去毛刺后表格内的所有单元格。所述方法能够改善单元格的提取效果,提高识别算法的运算速率。
Description
技术领域
本发明涉及图像处理方法技术领域,尤其涉及一种电气图纸中带有毛刺特征的表格信息提取方法及装置。
背景技术
在电力系统中,根据电气设备的作用将其分为一次设备和二次设备。二次设备及其相互连接的回路称为二次回路。电力设计院和生产厂家根据这些回路信息设计出相应的电气图纸,这些图纸将电气设备信息可视化地展现给电网工作人员,极大地提升了工作人员的工作效率。
近年来,随着图像技术不断推进,电气图纸也正在以数字化形式进行保存,然而在对各类图纸识别的过程中,要想在一张尺寸较大的图纸上识别嵌入在单元格中的细小文字,往往需要先采用目标检测算法检测出表格区域,再对表格进行单元格提取,进而实现对单元格中的文字识别。然而通过目标检测算法识别出的表格几乎都带有毛刺,毛刺会使特征提取发生错误,这些带有毛刺的表格进而会阻碍单元格的提取,最终会导致识别信息的缺失。
发明内容
本发明所要解决的技术问题是如何提供一种能够改善单元格的提取效果,提高识别算法的运算速率的电气图纸中带有毛刺特征的表格信息提取方法及装置。
为解决上述技术问题,本发明所采取的技术方案是:一种电气图纸中带有毛刺特征的表格信息提取方法,其特征在于包括如下步骤:
S1:通过目标检测算法,检测表格所在区域;
S2:将识别结果保留坐标,对原图进行坐标裁剪,提取表格所在区域;
S3:批量读取图片,将图片灰度化处理后进行二值化,腐蚀和膨胀操作,利用霍夫线变换函数检测横竖线;
S4:对横竖线组合的区域检测物体的轮廓;
S5:根据轮廓坐标获取最大表格,通过剪切把最外面的毛刺去掉,根据轮廓索引分别提取去毛刺后表格内的所有单元格。
本发明还公开了一种电气图纸中带有毛刺特征的表格信息提取装置,其特征在于包括:
表格区域识别模块:用于识别图纸中的表格区域,并将提取出的表格所在区域另存为新的目标图片;
图像预处理模块:用于将目标图片转换为灰度图,设定阈值对其进行二值化处理,之后通过腐蚀膨胀对其使用霍夫变换检测横竖线;
轮廓检测模块:用于检测图片中物体的轮廓,并保留所有轮廓坐标;
坐标排序及删除模块:用于对轮廓坐标进行从小到大排序并删除最大的无效坐标;
表格去毛刺模块:用于根据剩余坐标中的最大坐标画出虚拟矩形,裁剪掉虚拟矩形外的多余毛刺。
采用上述技术方案所产生的有益效果在于:本发明所述方法能够解决具有毛刺的表格无法提取内部单元格的问题,相比于直接进行单元格提取方法,有很强的实用性,可靠性较高,能够改善单元格的提取效果,提高后续单元格内部文字识别算法的运算速率。
附图说明
下面结合附图和具体实施方式对本发明作进一步详细的说明。
图1是本发明实施例一所述方法的流程图;
图2是本发明实施例二所述方法的流程图;
图3是本发明实施例二中表格所在区域识别图;
图4是本发明实施例二中横竖线检测效果图;
图5是本发明实施例二中勾画外框边缘矩形效果图;
图6是本发明实施例二中单元格提取效果图;
图7是本发明实施例三所述装置的原理框图。
具体实施方式
下面结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明的一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
在下面的描述中阐述了很多具体细节以便于充分理解本发明,但是本发明还可以采用其他不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本发明内涵的情况下做类似推广,因此本发明不受下面公开的具体实施例的限制。
实施例一
如图1所示,本发明实施例公开了一种电气图纸中带有毛刺特征的表格信息提取方法,包括如下步骤:
S1:通过YOLOv5目标检测算法,检测表格所在区域;
S2:将识别结果保留坐标,通过OpenCV对原图进行坐标裁剪,提取表格所在区域;
S3:批量读取图片,将图片灰度化处理后进行二值化,腐蚀和膨胀操作,利用霍夫线变换函数检测横竖线;
S4:通过OpenCV对横竖线组合的区域检测物体的轮廓;
S5:根据轮廓坐标获取最大表格,通过裁切把最外面的毛刺去掉,根据轮廓索引分别提取去毛刺后表格内的所有单元格。
实施例二
如图2所示,本发明实施例公开了一种电气图纸中带有毛刺特征的表格信息提取方法,包括如下步骤:
S1:通过YOLOv5目标检测算法,检测表格所在区域;
具体的,所述步骤S1包括如下步骤:
S101:通过AutoCAD根据实际电气工程要求设计绘制生成PDF,再转化为计算机可以处理的图像格式;
S102:对图像中的表格所在区域进行标注并训练出模型权重,将此权重用于检测电气设计图纸中的表格区域。
图纸文件根据电气设计要求使用AutoCAD绘制保存为数字化的PDF文件,将其格式转化为PNG图像格式后,使用程序读入其图像像素信息。在图像上进行表格区域标注,并将其作为训练样本传入YOLOv5算法,检测出所有图纸中的表格区域。
S2:将识别结果保留坐标,通过OpenCV对原图进行坐标裁剪,提取表格所在区域;
具体的,所述步骤S2包括如下步骤:
S201:通过YOLOv5算法中设置save-txt参数,将检测出的表格区域坐标保留在TXT文档中;
S202:将YOLO格式TXT标注文件转换为VOC格式XML标注文件;
S203:通过OpenCV读取XML中的信息,在原图中进行裁剪,提取并保存表格区域所在图片。
将图纸中检测出的表格区域坐标保留,并转化为XML格式,通过OpenCV根据XML中的坐标信息,对原图进行裁剪,裁剪后的图片如图3所示。
S3:批量读取图片,将图片灰度化处理后进行二值化,腐蚀和膨胀操作,利用霍夫线变换函数检测横竖线;
具体的,所述步骤S3包括如下步骤:
S301:批量读取图片,使用cv2.cvtColor将图片进行灰度化处理;
S302:将灰度化后的图片使用cv2.threshold进行二值化;
S303:将二值化后的图片使用cv2.erode进行腐蚀操作,iterations=1腐蚀的次数为1;
S304:将腐蚀后的图片使用cv2.dilate进行膨胀操作,iterations=1膨胀的次数为1;
S305:使用霍夫变换cv2.HoughLinesP检测横竖线。
使用程序读入图像像素信息,通过对图像灰度化后根据每个像素的灰度值确定其二值性。对二值化后的图像先将其细化,将直线变得平整,再对其加长让线段更加连续,最后利用霍夫线变换函数对图像分别进行横竖线检测,横竖线组合如图4所示。
S4:通过OpenCV对文字区域检测物体的轮廓;
具体的,所述步骤S4包括如下步骤:
S401:使用cv2.findContours函数对表格区域检测物体的轮廓;
S402:使用cv2.boundingRect函数输出检测到轮廓的坐标;
S403:将检测出的轮廓坐标保留在空列表,并使用sorted进行坐标从小到大排序,删除最外框的无效坐标。
对图像进行轮廓检测,通过输出检测到的轮廓坐标,并将坐标从小到大排序,删除最外框的无效坐标,保留表格区域的有效坐标。
S5:根据轮廓坐标获取最大表格,通过剪切把最外面的毛刺去掉,根据轮廓索引分别提取去毛刺后表格内的所有单元格。
所述步骤S5包括如下步骤:
S501:将剩余坐标中的最大坐标使用cv2.rectangle函数在边缘画出线的粗细为5的矩形;
S502:根据矩形坐标进行切割图片,若表格为单行,则扩大切割范围。
S503:根据轮廓索引分别提取去毛刺后表格内的所有单元格
考虑到表格毛刺紧贴表格,传统的切割方法会产生误切操作,因此需要在表格最外框的边缘勾画从一定宽度的矩形,效果如图5所示。由于表格尺寸不一,对于特殊的单行表格,在去毛刺时需要扩大切割范围,图6展示了单行表格单元格提取效果。
实施例三
如图7所示,相应的,本发明实施例还公开了一种电气图纸中带有毛刺特征的表格信息提取装置,包括:
表格区域识别模块1:用于识别图纸中的表格区域,并将提取出的表格所在区域另存为新的目标图片;
具体的,所述表格区域识别模块1包括:
图像格式处理模块101:用于通过AutoCAD根据实际电气工程要求设计绘制生成PDF,再转化为计算机可以处理的图像格式;
YOLOv5算法检测模块102:用于批量检测表格区域,将原图中的表格区域进行标注,通过YOLOv5算法检测,将检测结果保存TXT文档;
表格区域裁剪模块103:用于提取表格区域,将YOLO格式TXT标注文件转换为VOC格式XML标注文件,通过OpenCV读取XML中的信息,在原图中进行裁剪,提取并保存表格区域所在图片,作为目标图片。
图像预处理模块2:用于将目标图片转换为灰度图,设定阈值对其进行二值化处理,之后通过腐蚀膨胀对其使用霍夫变换检测横竖线;
具体的,所述图像预处理模块2包括:
图像灰度化处理模块201:用于灰度化处理,读取文字区域所在图片,将图片进行灰度化处理;
图像二值化处理模块202:用于对图片进行二值化处理,根据灰度直方图灰度分布信息来确定阈值,再用图像中每个像素的灰度值与这个阈值比较来确定其二值性;
图像横竖线检测模块203:用于将二值化后的图像进行腐蚀膨胀操纵后通过霍夫变换分别进行表格横竖线检测,再将横竖线组合,实现横竖线检测。
轮廓检测模块3:用于检测图片中物体的轮廓,并保留所有轮廓坐标;
具体的,所述轮廓检测模板3包括:
轮廓检测模块301:用于对横竖线区域的轮廓进行检测;
坐标输出模块302:用于输出检测到轮廓的坐标。
坐标排序及删除模块4:用于对轮廓坐标进行从小到大排序并删除最大的无效坐标;
具体的,所述坐标排序及删除模块4包括:
坐标排序模块401:用于对轮廓坐标从小到大排序;
无效坐标删除模块402:用于删除无效轮廓,将坐标最大的最外框删除。
表格去毛刺模块5:用于根据剩余坐标中的最大坐标画出虚拟矩形,裁剪掉虚拟矩形外的多余毛刺。
所述表格去毛刺模块5包括:
边缘矩形勾画模块501:用于在表格边缘勾画虚拟矩形,根据表格的最大有效坐标画出一定宽度的矩形;
图像裁切模块502:用于保留去毛刺表格区域的图片,根据勾画矩形的坐标对图像进行裁切;
单元格提取模板503:用于提取去毛刺后的表格提取内部单元格,根据轮廓索引分别提取去毛刺后表格内的所有单元格。
本发明所述方法能够解决具有毛刺的表格无法提取内部单元格的问题,相比于直接进行单元格提取方法,有很强的实用性,可靠性较高,能够改善单元格的提取效果,提高后续单元格内部文字识别算法的运算速率。
Claims (10)
1.一种电气图纸中带有毛刺特征的表格信息提取方法,其特征在于包括如下步骤:
S1:通过目标检测算法,检测表格所在区域;
S2:将识别结果保留坐标,对原图进行坐标裁剪,提取表格所在区域;
S3:批量读取图片,将图片灰度化处理后进行二值化,腐蚀和膨胀操作,利用霍夫线变换函数检测横竖线;
S4:对横竖线组合的区域检测物体的轮廓;
S5:根据轮廓坐标获取最大表格,通过剪切把最外面的毛刺去掉,根据轮廓索引分别提取去毛刺后表格内的所有单元格。
2.如权利要求1所述的电气图纸中带有毛刺特征的表格信息提取方法,其特征在于,所述步骤S1具体包括:
S101:通过AutoCAD根据实际电气工程要求设计绘制生成PDF,再转化为计算机可以处理的图像格式;
S102:对图像中的表格所在区域进行标注并训练出模型权重,将此权重用于检测电气设计图纸中的表格区域;
所述步骤S2具体包括:
S201:通过YOLOv5算法中设置save-txt参数,将检测出的表格区域坐标保留在TXT文档中;
S202:将YOLO格式TXT标注文件转换为VOC格式XML标注文件;
S203:通过OpenCV读取XML中的信息,在原图中进行裁剪,提取并保存表格区域所在图片。
3.如权利要求1所述的电气图纸中带有毛刺特征的表格信息提取方法,其特征在于,所述步骤S3具体包括如下步骤:
S301:批量读取图片,使用cv2.cvtColor将图片进行灰度化处理;
S302:将灰度化后的图片使用cv2.threshold进行二值化;
S303:将二值化后的图片使用cv2.erode进行腐蚀操作,iterations=1腐蚀的次数为1;
S304:将腐蚀后的图片使用cv2.dilate进行膨胀操作,iterations=1膨胀的次数为1;
S305:使用霍夫变换cv2.HoughLinesP检测横竖线。
4.如权利要求1所述的电气图纸中带有毛刺特征的表格信息提取方法,其特征在于,所述步骤S4具体包括如下步骤:
S401:使用cv2.findContours函数对横竖线区域检测物体的轮廓;
S402:使用cv2.boundingRect函数输出检测到轮廓的坐标;
S403:将检测出的轮廓坐标保留在空列表,并使用sorted进行坐标从小到大排序,删除最外框的无效坐标。
5.如权利要求1所述的电气图纸中带有毛刺特征的表格信息提取方法,其特征在于,所述步骤S5具体包括如下步骤:
S501:根据剩余坐标中的最大坐标使用cv2.rectangle函数在边缘画出线的粗细为5的矩形;
S502:根据矩形坐标进行切割图片,若表格为单行,则扩大切割范围;
S503:根据轮廓索引分别提取去毛刺后表格内的所有单元格。
6.一种电气图纸中带有毛刺特征的表格信息提取装置,其特征在于包括:
表格区域识别模块(1):用于识别图纸中的表格区域,并将提取出的表格所在区域另存为新的目标图片;
图像预处理模块(2):用于将目标图片转换为灰度图,设定阈值对其进行二值化处理,之后通过腐蚀膨胀对其使用霍夫变换检测横竖线;
轮廓检测模块(3):用于检测图片中物体的轮廓,并保留所有轮廓坐标;
坐标排序及删除模块(4):用于对轮廓坐标进行从小到大排序并删除最大的无效坐标;
表格去毛刺模块(5):用于根据剩余坐标中的最大坐标画出虚拟矩形,裁剪掉虚拟矩形外的多余毛刺。
7.如权利要求6所示的电气图纸中带有毛刺特征的表格信息提取装置,其特征在于所述表格区域识别模块(1)包括:
图像格式处理模块(101):用于通过AutoCAD根据实际电气工程要求设计绘制生成PDF,再转化为计算机可以处理的图像格式;
YOLOv5算法检测模块(102):用于批量检测表格区域,将原图中的表格区域进行标注,通过YOLOv5算法检测,将检测结果保存TXT文档;
表格区域裁剪模块(103):用于提取表格区域,将YOLO格式TXT标注文件转换为VOC格式XML标注文件,通过OpenCV读取XML中的信息,在原图中进行裁剪,提取并保存表格区域所在图片,作为目标图片。
8.如权利要求6所示的电气图纸中带有毛刺特征的表格信息提取装置,其特征在于所述图像预处理模块(2)包括:
图像灰度化处理模块(201):用于灰度化处理,读取文字区域所在图片,将图片进行灰度化处理;
图像二值化处理模块(202):用于对图片进行二值化处理,根据灰度直方图灰度分布信息来确定阈值,再用图像中每个像素的灰度值与这个阈值比较来确定其二值性;
图像横竖线检测模块(203):用于将二值化后的图像进行腐蚀膨胀操纵后通过霍夫变换分别进行表格横竖线检测,再将横竖线组合,实现横竖线检测。
9.如权利要求6所示的电气图纸中带有毛刺特征的表格信息提取装置,其特征在于所述轮廓检测模板(3)包括:
轮廓检测模块(301):用于对横竖线区域的轮廓进行检测;
坐标输出模块(302):用于输出检测到轮廓的坐标。
所述坐标排序及删除模块(4)包括:
坐标排序模块(401):用于对轮廓坐标从小到大排序;
无效坐标删除模块(402):用于删除无效轮廓,将坐标最大的最外框删除。
10.如权利要求6所示的电气图纸中带有毛刺特征的表格信息提取装置,其特征在于所述表格去毛刺模块(5)包括:
边缘矩形勾画模块(501):用于在表格边缘勾画虚拟矩形,根据表格的最大有效坐标画出一定宽度的矩形;
图像裁切模块(502):用于保留去毛刺表格区域的图片,根据勾画矩形的坐标对图像进行裁切;
单元格提取模板(503):用于提取去毛刺后的表格提取内部单元格,根据轮廓索引分别提取去毛刺后表格内的所有单元格。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211352828.4A CN115690823B (zh) | 2022-11-01 | 2022-11-01 | 电气图纸中带有毛刺特征的表格信息提取方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211352828.4A CN115690823B (zh) | 2022-11-01 | 2022-11-01 | 电气图纸中带有毛刺特征的表格信息提取方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115690823A true CN115690823A (zh) | 2023-02-03 |
CN115690823B CN115690823B (zh) | 2023-11-10 |
Family
ID=85047929
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211352828.4A Active CN115690823B (zh) | 2022-11-01 | 2022-11-01 | 电气图纸中带有毛刺特征的表格信息提取方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115690823B (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116311333A (zh) * | 2023-02-21 | 2023-06-23 | 南京云阶电力科技有限公司 | 针对电气图纸中边缘细小文字识别的预处理方法及系统 |
CN116978052A (zh) * | 2023-07-21 | 2023-10-31 | 安徽省交通规划设计研究总院股份有限公司 | 基于改进YOLOv5的桥梁设计图的子图布局识别方法 |
CN116994282A (zh) * | 2023-09-25 | 2023-11-03 | 安徽省交通规划设计研究总院股份有限公司 | 一种用于桥梁设计图的钢筋数量识别归集方法 |
CN117611710A (zh) * | 2023-12-07 | 2024-02-27 | 南京云阶电力科技有限公司 | 基于深度学习和图像处理的端子排图纸矢量化方法及系统 |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110309746A (zh) * | 2019-06-21 | 2019-10-08 | 国网辽宁省电力有限公司鞍山供电公司 | 无通信互联的高等级信息安全区表格数据信息提取方法 |
CN111860502A (zh) * | 2020-07-15 | 2020-10-30 | 北京思图场景数据科技服务有限公司 | 图片表格的识别方法、装置、电子设备及存储介质 |
CN112183038A (zh) * | 2020-09-23 | 2021-01-05 | 国信智能系统(广东)有限公司 | 一种表格识别套打方法、计算机设备及计算机可读存储介质 |
CN112861736A (zh) * | 2021-02-10 | 2021-05-28 | 上海大学 | 基于图像处理的文献表格内容识别与信息提取方法 |
CN113158998A (zh) * | 2021-05-26 | 2021-07-23 | 南京云阶电力科技有限公司 | 基于形态学处理的电气设计图纸表格识别方法及装置 |
KR20210140844A (ko) * | 2020-05-14 | 2021-11-23 | 지의소프트 주식회사 | 전자문서 내 테이블 정보 저장 시스템 및 그 방법 |
CN113723252A (zh) * | 2021-08-23 | 2021-11-30 | 上海财联社金融科技有限公司 | 一种表格型文本图片的识别方法和系统 |
CN113837151A (zh) * | 2021-11-25 | 2021-12-24 | 恒生电子股份有限公司 | 表格图像处理方法、装置、计算机设备及可读存储介质 |
CN115171133A (zh) * | 2022-06-23 | 2022-10-11 | 浙江理工大学 | 用于不规则表格图像拉平的表格结构检测方法 |
-
2022
- 2022-11-01 CN CN202211352828.4A patent/CN115690823B/zh active Active
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110309746A (zh) * | 2019-06-21 | 2019-10-08 | 国网辽宁省电力有限公司鞍山供电公司 | 无通信互联的高等级信息安全区表格数据信息提取方法 |
KR20210140844A (ko) * | 2020-05-14 | 2021-11-23 | 지의소프트 주식회사 | 전자문서 내 테이블 정보 저장 시스템 및 그 방법 |
CN111860502A (zh) * | 2020-07-15 | 2020-10-30 | 北京思图场景数据科技服务有限公司 | 图片表格的识别方法、装置、电子设备及存储介质 |
CN112183038A (zh) * | 2020-09-23 | 2021-01-05 | 国信智能系统(广东)有限公司 | 一种表格识别套打方法、计算机设备及计算机可读存储介质 |
CN112861736A (zh) * | 2021-02-10 | 2021-05-28 | 上海大学 | 基于图像处理的文献表格内容识别与信息提取方法 |
CN113158998A (zh) * | 2021-05-26 | 2021-07-23 | 南京云阶电力科技有限公司 | 基于形态学处理的电气设计图纸表格识别方法及装置 |
CN113723252A (zh) * | 2021-08-23 | 2021-11-30 | 上海财联社金融科技有限公司 | 一种表格型文本图片的识别方法和系统 |
CN113837151A (zh) * | 2021-11-25 | 2021-12-24 | 恒生电子股份有限公司 | 表格图像处理方法、装置、计算机设备及可读存储介质 |
CN115171133A (zh) * | 2022-06-23 | 2022-10-11 | 浙江理工大学 | 用于不规则表格图像拉平的表格结构检测方法 |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116311333A (zh) * | 2023-02-21 | 2023-06-23 | 南京云阶电力科技有限公司 | 针对电气图纸中边缘细小文字识别的预处理方法及系统 |
CN116311333B (zh) * | 2023-02-21 | 2023-12-01 | 南京云阶电力科技有限公司 | 针对电气图纸中边缘细小文字识别的预处理方法及系统 |
CN116978052A (zh) * | 2023-07-21 | 2023-10-31 | 安徽省交通规划设计研究总院股份有限公司 | 基于改进YOLOv5的桥梁设计图的子图布局识别方法 |
CN116978052B (zh) * | 2023-07-21 | 2024-04-09 | 安徽省交通规划设计研究总院股份有限公司 | 基于改进YOLOv5的桥梁设计图的子图布局识别方法 |
CN116994282A (zh) * | 2023-09-25 | 2023-11-03 | 安徽省交通规划设计研究总院股份有限公司 | 一种用于桥梁设计图的钢筋数量识别归集方法 |
CN116994282B (zh) * | 2023-09-25 | 2023-12-15 | 安徽省交通规划设计研究总院股份有限公司 | 一种用于桥梁设计图的钢筋数量识别归集方法 |
CN117611710A (zh) * | 2023-12-07 | 2024-02-27 | 南京云阶电力科技有限公司 | 基于深度学习和图像处理的端子排图纸矢量化方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN115690823B (zh) | 2023-11-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN115690823B (zh) | 电气图纸中带有毛刺特征的表格信息提取方法及装置 | |
CN110008809B (zh) | 表格数据的获取方法、装置和服务器 | |
WO1991018368A1 (en) | A polygon-based method for automatic extraction of selected text in a digitized document | |
CN110991448A (zh) | 电力设备铭牌图像的文本检测方法及装置 | |
CN105574486A (zh) | 一种图像表格文字切分方法 | |
CN115588202B (zh) | 一种基于轮廓检测的电气设计图纸中文字提取方法及系统 | |
CN112149548B (zh) | 一种适用于端子排的cad图纸智能录入和识别方法及其装置 | |
CN112364834A (zh) | 一种基于深度学习和图像处理的表格识别的还原方法 | |
CN110008960B (zh) | 一种检测字符片段完整性的方法及终端 | |
CN115223172A (zh) | 文本提取方法、装置及设备 | |
CN109635729B (zh) | 一种表格识别方法及终端 | |
CN109271882B (zh) | 一种区分颜色的手写体汉字提取方法 | |
CN111444903B (zh) | 漫画气泡内文字定位方法、装置、设备及可读存储介质 | |
CN113111728A (zh) | 面向变电站内电力生产作业风险的智能识别方法及系统 | |
CN112200053A (zh) | 一种融合局部特征的表格识别方法 | |
CN115171133A (zh) | 用于不规则表格图像拉平的表格结构检测方法 | |
CN115359505A (zh) | 一种电力图纸检测提取方法及系统 | |
CN112580452A (zh) | 故障树的处理方法、装置、计算机可读存储介质以及处理器 | |
CN113486881A (zh) | 一种文本识别方法、装置、设备及介质 | |
CN112256906A (zh) | 在显示屏上标记批注的方法、装置和存储介质 | |
CN113158999B (zh) | 基于模板匹配的电气设计图纸中端子跳线识别方法及装置 | |
CN113554664B (zh) | 一种地铁隧道反射率影像优化剪裁方法 | |
JP5402417B2 (ja) | 画像処理装置 | |
CN117173723A (zh) | 一种纸质表格识别方法、系统、设备及可存储介质 | |
CN116884028A (zh) | 基于光学文字识别的图纸信息提取方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |