CN115588202B

CN115588202B - 一种基于轮廓检测的电气设计图纸中文字提取方法及系统

Info

Publication number: CN115588202B
Application number: CN202211334990.3A
Authority: CN
Inventors: 谭林林; 陈中; 曹卫国; 钱晶
Original assignee: Nanjing Yunjie Power Technology Co ltd
Current assignee: Nanjing Yunjie Power Technology Co ltd
Priority date: 2022-10-28
Filing date: 2022-10-28
Publication date: 2023-08-15
Anticipated expiration: 2042-10-28
Also published as: CN115588202A

Abstract

本发明涉及一种基于轮廓检测的电气设计图纸中文字提取方法及系统，包括：利用YOLOv5目标检测模型检测目标电气设计图纸中的文字所在区域；确定各文字所在区域的区域坐标，并根据区域坐标对目标电气设计图纸进行剪裁；将所有剪裁文字区域图片进行预处理；对每一预处理后的图片进行文字轮廓检测，并依据轮廓坐标进行排序；根据排序后的文字轮廓确定文字字样区域，并根据文字字样区域之间的水平距离判断是否进行图片拼接；将水平距离小于预设值的文字字样区域进行图片拼接；提取拼接后图片中的文字以及未进行拼接的文字字样区域的文字。本发明解决文字在图像中占比较小而无法识别的问题。

Description

一种基于轮廓检测的电气设计图纸中文字提取方法及系统

技术领域

本发明涉及图像处理领域，特别是涉及一种基于轮廓检测的电气设计图纸中文字区域占比较少的文字提取方法及系统。

背景技术

随着智能电网时代的来临，可视化监控电网现场设备的需求日益增加，电网系统中有大量电气设计图纸以图像文件遗存，它们是连接电网现场设备布局与可视化监控系统的重要桥梁，智能化地处理电气设计图纸对电网智能化非常重要。

其中，对于图纸中文字的识别往往先通过目标检测算法确定文字区域，然后再采用OCR技术对文字进行识别。但是在确定文字所在区域时发现存在大量空白区域，亦或出现文字间空隙过大问题，因而导致后续文字识别技术无法准确识别出区域文字。

发明内容

本发明的目的是提供一种基于轮廓检测的电气设计图纸中文字提取方法及系统，先检测电气设计图纸中的文字所在区域，并基于文字所在区域提取文字轮廓，得到文字字样所在区域，并对需要拼接的文字字样所在区域图片进行拼接，最终能够准确提取出文字字样区域中的文字，提高了文字识别的效率和准确性。

为实现上述目的，本发明提供了如下方案：

一种基于轮廓检测的电气设计图纸中文字提取方法，包括：

利用YOLOv5目标检测模型检测目标电气设计图纸中的文字所在区域；所述文字所在区域中包括空白区域和文字字样区域；

确定各所述文字所在区域的区域坐标，并根据所述区域坐标对所述目标电气设计图纸进行剪裁，得到剪裁文字区域图片；

将所有所述剪裁文字区域图片进行预处理；

对每一预处理后的图片进行文字轮廓检测，并对检测到的各文字轮廓依据轮廓坐标进行排序；

根据排序后的文字轮廓确定所述文字字样区域，并根据所述文字字样区域之间的水平距离判断各所述文字字样区域是否进行图片拼接；

将所述水平距离小于预设值的所述文字字样区域进行图片拼接；

提取拼接后图片中的文字以及未进行拼接的所述文字字样区域的文字。

可选的，所述利用YOLOv5目标检测算法检测电气设计图纸中的文字所在区域，具体包括：

对样本电气设计图纸中的文字所在区域进行标注；

利用标注后的样本电气设计图纸训练YOLOv5目标检测模型；

利用训练好的YOLOv5目标检测模型检测所述目标电气设计图纸中的所述文字所在区域。

可选的，所述确定各所述文字所在区域的区域坐标，并根据所述区域坐标对所述目标电气设计图纸进行剪裁，得到剪裁文字区域图片，具体包括：

在所述文字区域检测时，在所述YOLOv5目标检测模型中设置save-txt参数，将检测出的所述文字所在区域的坐标保留在TXT文档中；

根据所述TXT文档中保留的所述区域坐标对所述目标电气设计图纸进行剪裁，得到剪裁文字区域图片。

可选的，所述根据所述TXT文档中保留的所述区域坐标对所述目标电气设计图纸进行剪裁，得到剪裁文字区域图片，具体包括：

将YOLO格式的TXT文档文件转换为VOC格式的XML标注文件；

读取所述XML标注文件中保留的所述区域坐标，并对所述目标电气设计图纸进行剪裁，得到所述剪裁文字区域图片。

可选的，所述将所有所述剪裁文字区域图片进行预处理，具体包括：

所有所述剪裁文字区域图片进行灰度化处理；

将灰度化处理后的图片进行二值化处理。

可选的，所述对每一预处理后的图片进行文字轮廓检测，并对检测到的各文字轮廓依据轮廓坐标进行排序，具体包括：

使用OpenCV软件中的cv2.findContours函数对每一所述预处理后的图片中的文字轮廓进行检测；

对每一所述预处理后的图片，使用所述OpenCV软件中的cv2.boundingRect函数输出各所述文字轮廓的所述轮廓坐标；

将所述轮廓坐标保留在空列表中，并对所述轮廓坐标按照从小到大的顺序排序。

本发明还提供一种基于轮廓检测的电气设计图纸中文字提取系统，包括：

文字区域识别模块，用于利用YOLOv5目标检测模型检测目标电气设计图纸中的文字所在区域；所述文字所在区域中包括空白区域和文字字样区域；

剪裁模块，用于确定各所述文字所在区域的区域坐标，并根据所述区域坐标对所述目标电气设计图纸进行剪裁，得到剪裁文字区域图片；

预处理模块，用于将所有所述剪裁文字区域图片进行预处理；

文字轮廓检测及排序模块，用于对每一预处理后的图片进行文字轮廓检测，并对检测到的各文字轮廓依据轮廓坐标进行排序；

文字字样区域确定模块，用于根据排序后的文字轮廓确定所述文字字样区域，并根据所述文字字样区域之间的水平距离判断各所述文字字样区域是否进行图片拼接；

图片拼接模块，用于将所述水平距离小于预设值的所述文字字样区域进行图片拼接；

文字提取模块，用于提取拼接后图片中的文字以及未进行拼接的所述文字字样区域的文字。

可选的，所述文字区域识别模块具体包括：

标注单元，用于对样本电气设计图纸中的文字所在区域进行标注；

训练单元，用于利用标注后的样本电气设计图纸训练YOLOv5目标检测模型；

检测单元，用于利用训练好的YOLOv5目标检测模型检测所述目标电气设计图纸中的所述文字所在区域。

可选的，所述剪裁模块具体包括：

坐标保存单元，用于在所述文字区域检测时，在所述YOLOv5目标检测模型中设置save-txt参数，将检测出的所述文字所在区域的坐标保留在TXT文档中；

剪裁单元，用于根据所述TXT文档中保留的所述区域坐标对所述目标电气设计图纸进行剪裁，得到剪裁文字区域图片。

可选的，所述剪裁单元具体包括：

文件格式转换子单元，用于将YOLO格式的TXT文档文件转换为VOC格式的XML标注文件；

剪裁子单元，用于读取所述XML标注文件中保留的所述区域坐标，并对所述目标电气设计图纸进行剪裁，得到所述剪裁文字区域图片。

根据本发明提供的具体实施例，本发明公开了以下技术效果：

本发明提供一种基于轮廓检测的电气设计图纸中文字提取方法及系统，包括：利用YOLOv5目标检测模型检测目标电气设计图纸中的文字所在区域；确定各文字所在区域的区域坐标，并根据区域坐标对目标电气设计图纸进行剪裁；将所有剪裁文字区域图片进行预处理；对每一预处理后的图片进行文字轮廓检测，并依据轮廓坐标进行排序；根据排序后的文字轮廓确定文字字样区域，并根据文字字样区域之间的水平距离判断是否进行图片拼接；将水平距离小于预设值的文字字样区域进行图片拼接；提取拼接后图片中的文字以及未进行拼接的文字字样区域的文字。本发明，先检测电气设计图纸中的文字所在区域，并基于文字所在区域提取文字轮廓，得到文字字样所在区域，并对需要拼接的文字字样所在区域图片进行拼接，最终能够准确提取出文字字样区域中的文字，提高了文字识别的效率和准确性。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本发明实施例1提供的一种基于轮廓检测的电气设计图纸中文字提取方法流程图；

图2为本发明实施例1提供的一种基于轮廓检测的电气设计图纸中文字提取方法技术原理图；

图3为本发明实施例1提供的文字所在区域识别图；

图4为本发明实施例1提供的轮廓检测效果图；

图5为本发明实施例1提供的一段连续文字所在区域提取效果图；

图6为本发明实施例1提供的两段文字区域提取后图片拼接效果图；

图7为本发明实施例2提供的一种基于轮廓检测的电气设计图纸中文字提取系统框图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

为使本发明的上述目的、特征和优点能够更加明显易懂，下面结合附图和具体实施方式对本发明作进一步详细的说明。

实施例1

如图1和2所示，本实施例提供一种基于轮廓检测的电气设计图纸中文字提取方法，包括：

S1：利用YOLOv5目标检测模型检测目标电气设计图纸中的文字所在区域；所述文字所在区域中包括空白区域和文字字样区域。

通过AutoCAD根据实际电气工程要求设计绘制生成PDF，再转化为计算机可以处理的图像格式；之后对图像中的文字所在区域进行标注并训练出模型权重，将此权重用于检测电气设计图纸中的文字区域。具体为，步骤S1包括：

S11：对样本电气设计图纸中的文字所在区域进行标注；

S12：利用标注后的样本电气设计图纸训练YOLOv5目标检测模型；

S13：利用训练好的YOLOv5目标检测模型检测所述目标电气设计图纸中的所述文字所在区域。

图纸文件根据电气设计要求使用AutoCAD绘制保存为数字化的PDF文件，将其格式转化为PNG图像格式后，使用程序读入其图像像素信息。在图像上进行文字区域标注，并将其作为训练样本传入YOLOv5算法，检测出所有图纸中的文字区域。

S2：确定各所述文字所在区域的区域坐标，并根据所述区域坐标对所述目标电气设计图纸进行剪裁，得到剪裁文字区域图片。

通过YOLOv5算法中设置save-txt参数，将检测出的文字区域坐标保留在TXT文档中；将YOLO格式TXT标注文件转换为VOC格式XML标注文件；通过OpenCV读取XML中的信息，在原图中进行裁剪，提取并保存文字区域所在图片。具体为，步骤S2包括：

S21：在所述文字区域检测时，在所述YOLOv5目标检测模型中设置save-txt参数，将检测出的所述文字所在区域的坐标保留在TXT文档中；

S22：根据所述TXT文档中保留的所述区域坐标对所述目标电气设计图纸进行剪裁，得到剪裁文字区域图片。具体为，

将YOLO格式的TXT文档文件转换为VOC格式的XML标注文件；

将图纸中检测出的文字区域坐标保留，并转化为XML格式，通过OpenCV根据XML中的坐标信息，对原图进行裁剪，裁剪后的图片如图3所示。

S3：将所有所述剪裁文字区域图片进行预处理。

步骤S3具体包括：

所有所述剪裁文字区域图片进行灰度化处理；

将灰度化处理后的图片进行二值化处理。

使用程序读入图像像素信息，通过对图像整体提取直方图，利用直方图提供的信息可以观察到其存在两个间隔很远的波峰，因此可以使用全局单阈值处理从背景中提取目标点。将图像中每个像素的灰度值与这个阈值想比较确定其二值性。根据灰度直方图灰度分布信息来确定阈值，再用图像中每个像素的灰度值与这个阈值比较来确定其二值性。

S4：对每一预处理后的图片进行文字轮廓检测，并对检测到的各文字轮廓依据轮廓坐标进行排序。

通过OpenCV对文字区域检测物体的轮廓；使用cv2.findContours函数对文字区域检测物体的轮廓；使用cv2.boundingRect函数输出检测到轮廓的坐标；将检测出的轮廓坐标保留在空列表，并进行坐标从小到大排序，删除最外框的无效坐标。具体为，步骤S4包括：

S41：使用OpenCV软件中的cv2.findContours函数对每一所述预处理后的图片中的文字轮廓进行检测；

S42：对每一所述预处理后的图片，使用所述OpenCV软件中的cv2.boundingRect函数输出各所述文字轮廓的所述轮廓坐标；

S43：将所述轮廓坐标保留在空列表中，并对所述轮廓坐标按照从小到大的顺序排序。

对图像进行轮廓检测，检测效果图如图4所示，通过输出检测到的轮廓坐标，并将坐标从小到大排序，删除最外框的无效坐标，保留文字区域的有效坐标。

S5：根据排序后的文字轮廓确定所述文字字样区域，并根据所述文字字样区域之间的水平距离判断各所述文字字样区域是否进行图片拼接。

根据排序后的坐标，找到左上角和右下角坐标，框出目标区域并裁剪保留，根据文字的分布情况，考虑是否需要图片拼接。

针对一段文字留白太多的情况，根据排序后的坐标，找到左上角和右下角坐标，框出目标区域并裁剪保留。

针对两端文字留白太多的情况，需按照上述步骤，检测出两段区域，对两段区域进行分别提取，将提取后的两张图片进行拼接。

对于一段文字留白太多问题，如图5所示，根据排序后的坐标，找到左上角和右下角坐标，框出目标区域并裁剪保留。

S6：将所述水平距离小于预设值的所述文字字样区域进行图片拼接。

对于两端文字留白太多问题，如图6所示，检测出两段区域，对两段区域进行分别提取，将提取后的两张图片进行拼接。

S7：提取拼接后图片中的文字以及未进行拼接的所述文字字样区域的文字。

本实施例中，能够解决文字在图像中占比较小而无法识别的问题，相比于直接进行文字识别方法，有很强的实用性，可靠性较高，能够改善文字的识别结果，提高识别算法的运算速率和准确性。

实施例2

如图所示，本实施例提供一种基于轮廓检测的电气设计图纸中文字提取系统，包括：

文字区域识别模块M1，用于利用YOLOv5目标检测模型检测目标电气设计图纸中的文字所在区域；所述文字所在区域中包括空白区域和文字字样区域.

所述文字区域识别模块M1具体包括：

剪裁模块M2，用于确定各所述文字所在区域的区域坐标，并根据所述区域坐标对所述目标电气设计图纸进行剪裁，得到剪裁文字区域图片。

所述剪裁模块M2具体包括：

坐标保存单元，用于在所述文字区域检测时，在所述YOLOv5目标检测模型中设置save-txt参数，将检测出的所述文字所在区域的坐标保留在TXT文档中。

具体的，所述剪裁单元包括：

文件格式转换子单元，用于将YOLO格式的TXT文档文件转换为VOC格式的XML标注文件。

预处理模块M3，用于将所有所述剪裁文字区域图片进行预处理。

文字轮廓检测及排序模块M4，用于对每一预处理后的图片进行文字轮廓检测，并对检测到的各文字轮廓依据轮廓坐标进行排序。

文字字样区域确定模块M5，用于根据排序后的文字轮廓确定所述文字字样区域，并根据所述文字字样区域之间的水平距离判断各所述文字字样区域是否进行图片拼接。

图片拼接模块M6，用于将所述水平距离小于预设值的所述文字字样区域进行图片拼接。

文字提取模块M7，用于提取拼接后图片中的文字以及未进行拼接的所述文字字样区域的文字。

本说明书中每个实施例重点说明的都是与其他实施例的不同之处，各个实施例之间相同相似部分互相参见即可。对于实施例公开的系统而言，由于其与实施例公开的方法相对应，所以描述的比较简单，相关之处参见方法部分说明即可。

本文中应用了具体个例对本发明的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本发明的方法及其核心思想；同时，对于本领域的一般技术人员，依据本发明的思想，在具体实施方式及应用范围上均会有改变之处。综上所述，本说明书内容不应理解为对本发明的限制。

Claims

1.一种基于轮廓检测的电气设计图纸中文字提取方法，其特征在于，包括：

将所有所述剪裁文字区域图片进行预处理；

2.根据权利要求1所述的基于轮廓检测的电气设计图纸中文字提取方法，其特征在于，所述利用YOLOv5目标检测算法检测电气设计图纸中的文字所在区域，具体包括：

对样本电气设计图纸中的文字所在区域进行标注；

利用标注后的样本电气设计图纸训练YOLOv5目标检测模型；

3.根据权利要求1所述的基于轮廓检测的电气设计图纸中文字提取方法，其特征在于，所述确定各所述文字所在区域的区域坐标，并根据所述区域坐标对所述目标电气设计图纸进行剪裁，得到剪裁文字区域图片，具体包括：

4.根据权利要求3所述的基于轮廓检测的电气设计图纸中文字提取方法，其特征在于，所述根据所述TXT文档中保留的所述区域坐标对所述目标电气设计图纸进行剪裁，得到剪裁文字区域图片，具体包括：

将YOLO格式的TXT文档文件转换为VOC格式的XML标注文件；

5.根据权利要求1所述的基于轮廓检测的电气设计图纸中文字提取方法，其特征在于，所述将所有所述剪裁文字区域图片进行预处理，具体包括：

所有所述剪裁文字区域图片进行灰度化处理；

将灰度化处理后的图片进行二值化处理。

6.根据权利要求1所述的基于轮廓检测的电气设计图纸中文字提取方法，其特征在于，所述对每一预处理后的图片进行文字轮廓检测，并对检测到的各文字轮廓依据轮廓坐标进行排序，具体包括：

7.一种基于权利要求1至6任一项所述的方法的系统，其特征在于，包括：

8.根据权利要求7所述的系统，其特征在于，所述文字区域识别模块具体包括：

9.根据权利要求7所述的系统，其特征在于，所述剪裁模块具体包括：

10.根据权利要求8所述的系统，其特征在于，所述剪裁单元具体包括：