CN112733735A - 一种采用机器学习进行图纸布局分类识别的方法 - Google Patents

一种采用机器学习进行图纸布局分类识别的方法 Download PDF

Info

Publication number
CN112733735A
CN112733735A CN202110040792.5A CN202110040792A CN112733735A CN 112733735 A CN112733735 A CN 112733735A CN 202110040792 A CN202110040792 A CN 202110040792A CN 112733735 A CN112733735 A CN 112733735A
Authority
CN
China
Prior art keywords
layout
training
image
line
model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110040792.5A
Other languages
English (en)
Other versions
CN112733735B (zh
Inventor
储琳琳
宗明
张宇俊
肖业凡
朱夏
王经纬
顾志铭
翟清纲
辛洪波
张晓莉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Koollook Information Technology Co ltd
State Grid Shanghai Electric Power Co Ltd
Original Assignee
Shanghai Koollook Information Technology Co ltd
State Grid Shanghai Electric Power Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Koollook Information Technology Co ltd, State Grid Shanghai Electric Power Co Ltd filed Critical Shanghai Koollook Information Technology Co ltd
Priority to CN202110040792.5A priority Critical patent/CN112733735B/zh
Publication of CN112733735A publication Critical patent/CN112733735A/zh
Application granted granted Critical
Publication of CN112733735B publication Critical patent/CN112733735B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/42Document-oriented image-based pattern recognition based on the type of document
    • G06V30/422Technical drawings; Geographical maps
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/20Image enhancement or restoration using local operators
    • G06T5/30Erosion or dilatation, e.g. thinning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/11Region-based segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/44Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Data Mining & Analysis (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Software Systems (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Medical Informatics (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种采用机器学习进行图纸布局分类识别的方法,通过步骤1图纸布局特征提取,步骤2机器学习模型训练,步骤3图纸区域布局分类,从而获得图纸要素布局的分类结果,图纸要素布局的分类结果可在匹配相应布局参数后,供后续做图形边界,表格文字等处理使用。本发明能够实现对于图纸的快速分类。

Description

一种采用机器学习进行图纸布局分类识别的方法
技术领域
本发明涉及一种用于图纸处理领域的采用机器学习进行图纸布局分类识别的方法。
背景技术
图纸是一种市政规划、工程建筑、机械设计等诸多领域的常用技术文件。在图纸打印输出为图纸电子文件后,图纸内容以图像或图形形式存在,其中所包含的大量原始要素信息就丢失了。如市政规划的详细控制图纸是电网建设规划中的重要依据和资料来源,它们在公开发布/发行时,图纸中的文字,图层,图形,色块等都已转换为图形或图像。这给使用中图纸要素信息的识别和提取带来极大不便。
由于图纸要素复杂,根据图纸中所包含的要素内容,图纸要素区域可分为图形区域、表格文字区域、标题区域、图例区域等。图纸要素布局的边界可根据图框及分割线进行划定,图纸中要素区域形状为矩形。不同来源图纸的要素布局不统一,相同类别的图纸,图框及分割线的布局位置相对固定。由于不同图纸要素区域中的内容识别和信息提取方法具有显著差异,图纸布局结构的分类识别是后续图纸要素区域内容识别和信息提取的基础,也是技术人员的主要目标。
发明内容
本发明的目的是为了克服现有技术的不足,提供一种采用机器学习进行图纸布局分类识别的方法,能够对图纸进行快速分类。
实现上述目的的一种技术方案是:一种采用机器学习进行图纸布局分类识别的方法,包括如下步骤:
步骤1,图纸布局特征提取,具体步骤如下;
步骤1.1,图形文件的图像化转换,将不同类型的图纸文件,分页转换为图纸图像;
步骤1.2,对图纸图像进行灰度化处理后,使用OTSU算法完成二值化处理,得到二值化图纸图像;
步骤1.3,二值化图纸图像,提取图纸边框及分割线的线条,通过腐蚀ERODE及膨胀DILATE算法,去除无关图像、线条噪声后,使用水平及垂直的单像素宽度矩形形态转换方法,提取图形中的水平集垂直线条,合并形成图纸的线图图像;
步骤1.4,对线图图像进行归一化处理,将不同大小的图纸线条图像缩放为统一大小;
步骤1后得到统一大小的灰度图像,即为图纸布局特征图像;
步骤2,机器学习模型训练,具体步骤如下;
步骤2.1,训练及验证数据集的准备,选择一定数量的各类型图纸文件,执行第一步的图纸布局特征提取处理,并进行人工布局分类标签;通过擦除图像中部分线条,修改线条颜色灰度的方法,生成扩展训练及验证图像集;得到满足模型训练及验证的一定规模的图纸布局特征图像集合;
步骤2.2,模型的选择与训练,使用训练图像集,测试图像集数据,基于InceptionResNetV2卷积神经网络基础模型,通过多次训练和验证,生成模型权重数据,参数如下:
优化器:RMSProp算法;
LOSS函数:Categorical Crossentropy;
步骤3,图纸区域布局分类,具体步骤如下;
步骤3.1,对待分类的图纸集合,执行第一步图纸布局特征提取的预处理过程,得到归一化的图纸要素特征图像集合;
步骤3.2,使用经第二步训练得到的模型参数,对待分类的图纸要素特征图像集合进行分类,获得图纸要素布局的分类结果;
图纸要素布局的分类结果可在匹配相应布局参数后,供后续做图形边界,表格文字等处理使用。
本发明的一种采用机器学习进行图纸布局分类识别的方法,通过图像特征提取及深度机器学习方法,为图纸要素布局分类识别提供了一种灵活、快速的方法,通过调整训练数据,该方法对通用类型图纸进行快速分类。
具体实施方式
为了能更好地对本发明的技术方案进行理解,下面通过具体地实施例进行详细地说明:
本发明的一种采用机器学习进行图纸布局分类识别的方法,包括如下步骤:
步骤1,图纸布局特征提取。图纸可以抽象化为一种格式化图像,图纸要素布局的边界是由图框及分割线组成的。特征提取过程是去除图纸中的无关图形,将图纸中的边框、分割线提取出来的过程。具体步骤如下:
步骤1.1,图形文件的图像化转换,将不同类型的图纸文件,分页转换为图纸图像;
步骤1.2,对图纸图像进行灰度化处理后,使用OTSU算法完成二值化处理,得到二值化图纸图像;
步骤1.3,二值化图纸图像,提取图纸边框及分割线的线条,通过腐蚀ERODE及膨胀DILATE算法,去除无关图像、线条噪声后,使用水平及垂直的单像素宽度矩形形态转换方法,提取图形中的水平集垂直线条,合并形成图纸的线图图像;
步骤1.4,对线图图像进行归一化处理,将不同大小(宽,高)的图纸线条图像缩放为统一大小;
步骤1后得到统一大小的灰度图像,即为图纸布局特征图像。
步骤2,机器学习模型训练。对不同应用领域的图纸布局,可以通过制定应用场景相关的训练、验证图纸布局特征图像集,利用机器学习方法,训练出相应的模型权重参数,满足通用化图纸布局分类识别需求。具体步骤如下:
步骤2.1,训练及验证数据集的准备,选择一定数量的各类型图纸文件,执行第一步的图纸布局特征提取处理,并进行人工布局分类标签;通过擦除图像中部分线条,修改线条颜色灰度的方法,生成扩展训练及验证图像集;得到满足模型训练及验证的一定规模的图纸布局特征图像集合;
步骤2.2,模型的选择与训练,使用训练图像集,测试图像集数据,基于InceptionResNetV2卷积神经网络基础模型,通过多次训练和验证,生成模型权重数据,参数如下:
优化器:RMSProp算法;
LOSS函数:Categorical Crossentropy。
以规划图纸场景为例,使用小规模图像数据(小于100份图纸)经10次epoch训练,训练结果为loss:0.0699-val_loss:0.0320,较直接使用原图纸进行机器学习训练的结果,识别率大幅提高。
步骤3,图纸区域布局分类,具体步骤如下;
步骤3.1,对待分类的图纸集合,执行第一步图纸布局特征提取的预处理过程,得到归一化的图纸要素特征图像集合;
步骤3.2,使用经第二步训练得到的模型参数,对待分类的图纸要素特征图像集合进行分类,获得图纸要素布局的分类结果。
图纸要素布局的分类结果可在匹配相应布局参数后,供后续做图形边界,表格文字等处理使用。
本技术领域中的普通技术人员应当认识到,以上的实施例仅是用来说明本发明,而并非用作为对本发明的限定,只要在本发明的实质精神范围内,对以上所述实施例的变化、变型都将落在本发明的权利要求书范围内。

Claims (1)

1.一种采用机器学习进行图纸布局分类识别的方法,其特征在于,包括如下步骤:
步骤1,图纸布局特征提取,具体步骤如下;
步骤1.1,图形文件的图像化转换,将不同类型的图纸文件,分页转换为图纸图像;
步骤1.2,对图纸图像进行灰度化处理后,使用OTSU算法完成二值化处理,得到二值化图纸图像;
步骤1.3,二值化图纸图像,提取图纸边框及分割线的线条,通过腐蚀ERODE及膨胀DILATE算法,去除无关图像、线条噪声后,使用水平及垂直的单像素宽度矩形形态转换方法,提取图形中的水平集垂直线条,合并形成图纸的线图图像;
步骤1.4,对线图图像进行归一化处理,将不同大小的图纸线条图像缩放为统一大小;
步骤1后得到统一大小的灰度图像,即为图纸布局特征图像;
步骤2,机器学习模型训练,具体步骤如下;
步骤2.1,训练及验证数据集的准备,选择一定数量的各类型图纸文件,执行第一步的图纸布局特征提取处理,并进行人工布局分类标签;通过擦除图像中部分线条,修改线条颜色灰度的方法,生成扩展训练及验证图像集;得到满足模型训练及验证的一定规模的图纸布局特征图像集合;
步骤2.2,模型的选择与训练,使用训练图像集,测试图像集数据,基于InceptionResNetV2卷积神经网络基础模型,通过多次训练和验证,生成模型权重数据,参数如下:
优化器:RMSProp算法;
LOSS函数:Categorical Crossentropy;
步骤3,图纸区域布局分类,具体步骤如下;
步骤3.1,对待分类的图纸集合,执行第一步图纸布局特征提取的预处理过程,得到归一化的图纸要素特征图像集合;
步骤3.2,使用经第二步训练得到的模型参数,对待分类的图纸要素特征图像集合进行分类,获得图纸要素布局的分类结果;
图纸要素布局的分类结果可在匹配相应布局参数后,供后续做图形边界,表格文字等处理使用。
CN202110040792.5A 2021-01-13 2021-01-13 一种采用机器学习进行图纸布局分类识别的方法 Active CN112733735B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110040792.5A CN112733735B (zh) 2021-01-13 2021-01-13 一种采用机器学习进行图纸布局分类识别的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110040792.5A CN112733735B (zh) 2021-01-13 2021-01-13 一种采用机器学习进行图纸布局分类识别的方法

Publications (2)

Publication Number Publication Date
CN112733735A true CN112733735A (zh) 2021-04-30
CN112733735B CN112733735B (zh) 2024-04-09

Family

ID=75592819

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110040792.5A Active CN112733735B (zh) 2021-01-13 2021-01-13 一种采用机器学习进行图纸布局分类识别的方法

Country Status (1)

Country Link
CN (1) CN112733735B (zh)

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150095022A1 (en) * 2013-09-29 2015-04-02 Founder Apabi Technology Limited List recognizing method and list recognizing system
CN109002841A (zh) * 2018-06-27 2018-12-14 淮阴工学院 一种基于Faster-RCNN模型的建筑构件提取方法
CN109034159A (zh) * 2018-05-28 2018-12-18 北京捷通华声科技股份有限公司 图像信息提取方法和装置
CN109947967A (zh) * 2017-10-10 2019-06-28 腾讯科技(深圳)有限公司 图像识别方法、装置、存储介质和计算机设备
CN110334346A (zh) * 2019-06-26 2019-10-15 京东数字科技控股有限公司 一种pdf文件的信息抽取方法和装置
CN111242024A (zh) * 2020-01-11 2020-06-05 北京中科辅龙科技股份有限公司 基于机器学习识别图纸内图例及文字的方法及系统
CN111273905A (zh) * 2020-01-17 2020-06-12 南京大学 基于界面草图的应用检索方法和装置
CN111401312A (zh) * 2020-04-10 2020-07-10 深圳新致软件有限公司 Pdf图纸文字识别方法、系统以及设备
CN112036519A (zh) * 2020-11-06 2020-12-04 中科创达软件股份有限公司 基于多位sigmoid的分类处理方法、装置及电子设备

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150095022A1 (en) * 2013-09-29 2015-04-02 Founder Apabi Technology Limited List recognizing method and list recognizing system
CN109947967A (zh) * 2017-10-10 2019-06-28 腾讯科技(深圳)有限公司 图像识别方法、装置、存储介质和计算机设备
CN109034159A (zh) * 2018-05-28 2018-12-18 北京捷通华声科技股份有限公司 图像信息提取方法和装置
CN109002841A (zh) * 2018-06-27 2018-12-14 淮阴工学院 一种基于Faster-RCNN模型的建筑构件提取方法
CN110334346A (zh) * 2019-06-26 2019-10-15 京东数字科技控股有限公司 一种pdf文件的信息抽取方法和装置
CN111242024A (zh) * 2020-01-11 2020-06-05 北京中科辅龙科技股份有限公司 基于机器学习识别图纸内图例及文字的方法及系统
CN111273905A (zh) * 2020-01-17 2020-06-12 南京大学 基于界面草图的应用检索方法和装置
CN111401312A (zh) * 2020-04-10 2020-07-10 深圳新致软件有限公司 Pdf图纸文字识别方法、系统以及设备
CN112036519A (zh) * 2020-11-06 2020-12-04 中科创达软件股份有限公司 基于多位sigmoid的分类处理方法、装置及电子设备

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
苏欣;袁宗明;范小霞;谢英;: "油气长输管道检漏技术综述", 石油化工安全技术, no. 04, 25 July 2005 (2005-07-25) *

Also Published As

Publication number Publication date
CN112733735B (zh) 2024-04-09

Similar Documents

Publication Publication Date Title
CN106447658B (zh) 基于全局和局部卷积网络的显著性目标检测方法
CN111652332B (zh) 基于二分类的深度学习手写中文字符识别方法及系统
CN107871101A (zh) 一种人脸检测方法及装置
CN105447522A (zh) 一种复杂图像文字识别系统
CN103699523A (zh) 产品分类方法和装置
CN105139041A (zh) 基于图像的语种识别方法及装置
CN112307919B (zh) 一种基于改进YOLOv3的单证图像中数字信息区域识别方法
CN111242024A (zh) 基于机器学习识别图纸内图例及文字的方法及系统
CN113076816B (zh) 基于红外与可见光图像的太阳能光伏组件热斑识别方法
CN103473545A (zh) 一种基于多特征的文本图像相似度度量方法
CN112069900A (zh) 基于卷积神经网络的票据文字识别方法及系统
CN106650696A (zh) 一种基于奇异值分解的手写电气元件符号识别方法
CN111241933A (zh) 一种基于通用对抗扰动的养猪场目标识别方法
CN110689018A (zh) 一种智能阅卷系统及其处理方法
CN113159014A (zh) 基于手写题号的客观题批阅方法、装置、设备及存储介质
CN115880529A (zh) 基于注意力和解耦知识蒸馏的鸟类细粒度分类方法及系统
Karatzas et al. An on-line platform for ground truthing and performance evaluation of text extraction systems
CN106709437A (zh) 一种改进的针对早期专利文档扫描件中图文信息的智能处理方法
US20230110558A1 (en) Systems and methods for detecting objects
US20230154217A1 (en) Method for Recognizing Text, Apparatus and Terminal Device
CN111079742A (zh) 一种扫描试卷中作文区域图像文本块精准定位方法
CN116189212A (zh) 一种基于图像的表格智能识别与计分方法
CN116630604A (zh) 一种垃圾图像分类方法及系统
CN116486228A (zh) 一种基于改进yolov5模型的纸质药盒钢印字符识别方法
CN112733735B (zh) 一种采用机器学习进行图纸布局分类识别的方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant