CN112733735A

CN112733735A - 一种采用机器学习进行图纸布局分类识别的方法

Info

Publication number: CN112733735A
Application number: CN202110040792.5A
Authority: CN
Inventors: 储琳琳; 宗明; 张宇俊; 肖业凡; 朱夏; 王经纬; 顾志铭; 翟清纲; 辛洪波; 张晓莉
Original assignee: Shanghai Koollook Information Technology Co ltd; State Grid Shanghai Electric Power Co Ltd
Current assignee: Shanghai Koollook Information Technology Co ltd; State Grid Shanghai Electric Power Co Ltd
Priority date: 2021-01-13
Filing date: 2021-01-13
Publication date: 2021-04-30
Anticipated expiration: 2041-01-13
Also published as: CN112733735B

Abstract

本发明公开了一种采用机器学习进行图纸布局分类识别的方法，通过步骤1图纸布局特征提取，步骤2机器学习模型训练，步骤3图纸区域布局分类，从而获得图纸要素布局的分类结果，图纸要素布局的分类结果可在匹配相应布局参数后，供后续做图形边界，表格文字等处理使用。本发明能够实现对于图纸的快速分类。

Description

一种采用机器学习进行图纸布局分类识别的方法

技术领域

本发明涉及一种用于图纸处理领域的采用机器学习进行图纸布局分类识别的方法。

背景技术

图纸是一种市政规划、工程建筑、机械设计等诸多领域的常用技术文件。在图纸打印输出为图纸电子文件后，图纸内容以图像或图形形式存在，其中所包含的大量原始要素信息就丢失了。如市政规划的详细控制图纸是电网建设规划中的重要依据和资料来源，它们在公开发布/发行时，图纸中的文字，图层，图形，色块等都已转换为图形或图像。这给使用中图纸要素信息的识别和提取带来极大不便。

由于图纸要素复杂，根据图纸中所包含的要素内容，图纸要素区域可分为图形区域、表格文字区域、标题区域、图例区域等。图纸要素布局的边界可根据图框及分割线进行划定，图纸中要素区域形状为矩形。不同来源图纸的要素布局不统一，相同类别的图纸，图框及分割线的布局位置相对固定。由于不同图纸要素区域中的内容识别和信息提取方法具有显著差异，图纸布局结构的分类识别是后续图纸要素区域内容识别和信息提取的基础，也是技术人员的主要目标。

发明内容

本发明的目的是为了克服现有技术的不足，提供一种采用机器学习进行图纸布局分类识别的方法，能够对图纸进行快速分类。

实现上述目的的一种技术方案是：一种采用机器学习进行图纸布局分类识别的方法，包括如下步骤：

步骤1，图纸布局特征提取，具体步骤如下；

步骤1.1，图形文件的图像化转换，将不同类型的图纸文件，分页转换为图纸图像；

步骤1.2，对图纸图像进行灰度化处理后，使用OTSU算法完成二值化处理，得到二值化图纸图像；

步骤1.3，二值化图纸图像，提取图纸边框及分割线的线条，通过腐蚀ERODE及膨胀DILATE算法，去除无关图像、线条噪声后，使用水平及垂直的单像素宽度矩形形态转换方法，提取图形中的水平集垂直线条，合并形成图纸的线图图像；

步骤1.4，对线图图像进行归一化处理，将不同大小的图纸线条图像缩放为统一大小；

步骤1后得到统一大小的灰度图像，即为图纸布局特征图像；

步骤2，机器学习模型训练，具体步骤如下；

步骤2.1，训练及验证数据集的准备，选择一定数量的各类型图纸文件，执行第一步的图纸布局特征提取处理，并进行人工布局分类标签；通过擦除图像中部分线条，修改线条颜色灰度的方法，生成扩展训练及验证图像集；得到满足模型训练及验证的一定规模的图纸布局特征图像集合；

步骤2.2，模型的选择与训练，使用训练图像集，测试图像集数据，基于InceptionResNetV2卷积神经网络基础模型，通过多次训练和验证，生成模型权重数据，参数如下：

优化器：RMSProp算法；

LOSS函数：Categorical Crossentropy；

步骤3，图纸区域布局分类，具体步骤如下；

步骤3.1，对待分类的图纸集合，执行第一步图纸布局特征提取的预处理过程，得到归一化的图纸要素特征图像集合；

步骤3.2，使用经第二步训练得到的模型参数，对待分类的图纸要素特征图像集合进行分类，获得图纸要素布局的分类结果；

图纸要素布局的分类结果可在匹配相应布局参数后，供后续做图形边界，表格文字等处理使用。

本发明的一种采用机器学习进行图纸布局分类识别的方法，通过图像特征提取及深度机器学习方法，为图纸要素布局分类识别提供了一种灵活、快速的方法，通过调整训练数据，该方法对通用类型图纸进行快速分类。

具体实施方式

为了能更好地对本发明的技术方案进行理解，下面通过具体地实施例进行详细地说明：

本发明的一种采用机器学习进行图纸布局分类识别的方法，包括如下步骤：

步骤1，图纸布局特征提取。图纸可以抽象化为一种格式化图像，图纸要素布局的边界是由图框及分割线组成的。特征提取过程是去除图纸中的无关图形，将图纸中的边框、分割线提取出来的过程。具体步骤如下：

步骤1.4，对线图图像进行归一化处理，将不同大小(宽，高)的图纸线条图像缩放为统一大小；

步骤1后得到统一大小的灰度图像，即为图纸布局特征图像。

步骤2，机器学习模型训练。对不同应用领域的图纸布局，可以通过制定应用场景相关的训练、验证图纸布局特征图像集，利用机器学习方法，训练出相应的模型权重参数，满足通用化图纸布局分类识别需求。具体步骤如下：

优化器：RMSProp算法；

LOSS函数：Categorical Crossentropy。

以规划图纸场景为例，使用小规模图像数据(小于100份图纸)经10次epoch训练，训练结果为loss:0.0699-val_loss:0.0320，较直接使用原图纸进行机器学习训练的结果，识别率大幅提高。

步骤3，图纸区域布局分类，具体步骤如下；

步骤3.2，使用经第二步训练得到的模型参数，对待分类的图纸要素特征图像集合进行分类，获得图纸要素布局的分类结果。

本技术领域中的普通技术人员应当认识到，以上的实施例仅是用来说明本发明，而并非用作为对本发明的限定，只要在本发明的实质精神范围内，对以上所述实施例的变化、变型都将落在本发明的权利要求书范围内。

Claims

1.一种采用机器学习进行图纸布局分类识别的方法，其特征在于，包括如下步骤：

步骤1，图纸布局特征提取，具体步骤如下；

步骤1后得到统一大小的灰度图像，即为图纸布局特征图像；

步骤2，机器学习模型训练，具体步骤如下；

优化器：RMSProp算法；

LOSS函数：Categorical Crossentropy；

步骤3，图纸区域布局分类，具体步骤如下；