CN117058157A - 一种cad图纸的切割与标注方法 - Google Patents

一种cad图纸的切割与标注方法 Download PDF

Info

Publication number
CN117058157A
CN117058157A CN202310877837.3A CN202310877837A CN117058157A CN 117058157 A CN117058157 A CN 117058157A CN 202310877837 A CN202310877837 A CN 202310877837A CN 117058157 A CN117058157 A CN 117058157A
Authority
CN
China
Prior art keywords
lines
cutting
algorithm
labeling
line
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310877837.3A
Other languages
English (en)
Inventor
李子力
宋红景
胡文锋
钱增志
李太胜
孙玉龙
邢路
马良杰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Railway Construction Group Co Ltd
Beijing Construction Technology Co Ltd of China Railway Construction Group Co Ltd
Original Assignee
China Railway Construction Group Co Ltd
Beijing Construction Technology Co Ltd of China Railway Construction Group Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Railway Construction Group Co Ltd, Beijing Construction Technology Co Ltd of China Railway Construction Group Co Ltd filed Critical China Railway Construction Group Co Ltd
Priority to CN202310877837.3A priority Critical patent/CN117058157A/zh
Publication of CN117058157A publication Critical patent/CN117058157A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/0464Convolutional networks [CNN, ConvNet]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T11/002D [Two Dimensional] image generation
    • G06T11/60Editing figures and text; Combining figures or text
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/82Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20081Training; Learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20084Artificial neural networks [ANN]

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Computing Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Molecular Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Medical Informatics (AREA)
  • Multimedia (AREA)
  • Databases & Information Systems (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种CAD图纸的切割与标注方法,包括如下步骤:通过元素解析器解析DXF文件中的元素并提取出线类型的图像实体;通过切割算法将有关联的线归为一组;将分组后的线重新绘制成DXF文件并生成图片;标注算法依赖CNN卷积神经网络对图像进行识别,识别出每张图片中包含的结构并对结构进行标注,并且根据识别结果持续优化网络提高识别的准确率。本发明通过将输入的图纸依次经过元素解析器、切割算法、绘图算法和标注算法得到正确的切割与标注,高效地完成了图纸相关的重复工作内容的提取,大大地减少人力成本,降低了建筑工人运用图纸的技术门槛,提升工人职业技能水平。

Description

一种CAD图纸的切割与标注方法
技术领域
本发明涉及CAD图纸技术领域,具体来说,涉及一种CAD图纸的切割与标注方法。
背景技术
CAD图纸中有很多重复工作内容需要进行提取并进行系统的设计和分析,传统的提取工作大都需要人力进行,既费时又费力,而且还很容易出错。针对上述问题,目前还没有有效的解决办法。
发明内容
针对相关技术中的上述技术问题,本发明提出一种CAD图纸的切割与标注方法,能够克服现有技术的上述不足。
为实现上述技术目的,本发明的技术方案是这样实现的:
一种CAD图纸的切割与标注方法,包括如下步骤:
S1通过元素解析器解析DXF文件中的元素并提取出线类型的图像实体;
S2通过切割算法将有关联的线归为一组;
S2的具体步骤如下:
S21切割算法对传入的每一条线进行分析,通过线的起止点和长度绘制出每条线所占据的一个矩形区域,分别以(lx,ly)和(rx,ry)表示该矩形区域的左上和右下两点,取这个矩形两条对角线的交点(midx,midy),针对每条线得到(lx,lyx,rx,ry,midx,midy)一组共6个属性;
S22引入两个常量c和p,c表示两个矩形区域相交比例的阈值,p代表两条线距离的阈值;
S23针对每一条线有li=(lxi,lyxi,rxi,ryi,midxi,midyi)与其他的线进行计算得到矩形区域相交比例ci和距离pi,将满足ci<c且pi<p的线分为一组;不在一组的线被切割算法抛弃;
S24将图纸中剩下的绘制结构的线传入绘图算法;
S3将分组后的线重新绘制成DXF文件并生成图片;
S4标注算法依赖CNN卷积神经网络对图像进行识别,识别出每张图片中包含的结构并对结构进行标注,并且根据识别结果持续优化网络提高识别的准确率;同时根据整体识别的结果反馈和优化切割算法中的常量c和常量p。
进一步地,S1的具体步骤如下:
S11图纸通过元素解析器提取图纸中所有的线,提取的线包含线的属性,属性以二进制的形式保存在DXF文件中;
S12解析器把这些属性转化为文本形式保存为标准的json数据结构并传入切割算法中。
进一步地,所述线的属性包括形状、长度和起止点坐标。
进一步地,所述切割算法针对TABLES表中定义的LTYPE线进行,解析DXF文件后提取出图纸中包含所有Line类型的图像实体。
进一步地,S3具体步骤如下:
S31根据每组中线的相对位置得到每个结构的上下左右边框4个坐标,将这些坐标作为新图纸的大小来将线的原始坐标按照相对位置平移到新DXF图纸中,使每个结构都位于新DXF图纸的中央位置;
S32将DXF图纸转化成图片格式传入标注算法。
进一步地,步骤S4的结构包括门、窗和墙体。
本发明的有益效果:本发明通过将输入的图纸依次经过元素解析器、切割算法、绘图算法和标注算法得到正确的切割与标注,高效地完成了图纸相关的重复工作内容的提取,大大地减少人力成本,降低了建筑工人运用图纸的技术门槛,提升工人职业技能水平。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是根据本发明实施例所述的CAD图纸的切割与标注方法的系统流程图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员所获得的所有其他实施例,都属于本发明保护的范围。
如图1所示,根据本发明实施例所述的一种CAD图纸的切割与标注方法,包括如下步骤:
S1通过元素解析器解析DXF文件中的元素并提取出线类型的图像实体;
S2通过切割算法将有关联的线归为一组;
S2的具体步骤如下:
S21切割算法对传入的每一条线进行分析,通过线的起止点和长度绘制出每条线所占据的一个矩形区域,分别以(lx,ly)和(rx,ry)表示该矩形区域的左上和右下两点,取这个矩形两条对角线的交点(midx,midy),针对每条线得到(lx,lyx,rx,ry,midx,midy)一组共6个属性;
S22引入两个常量c和p,c表示两个矩形区域相交比例的阈值,p代表两条线距离的阈值;
S23针对每一条线有li=(lxi,lyxi,rxi,ryi,midxi,midyi)与其他的线进行计算得到矩形区域相交比例ci和距离pi,将满足ci<c且pi<p的线分为一组;不在一组的线被切割算法抛弃;
S24将图纸中剩下的绘制结构的线传入绘图算法;
S3将分组后的线重新绘制成DXF文件并生成图片;
S4标注算法依赖CNN卷积神经网络对图像进行识别,识别出每张图片中包含的结构并对结构进行标注,并且根据识别结果持续优化网络提高识别的准确率;同时根据整体识别的结果反馈和优化切割算法中的常量c和常量p。
实施例中,S1的具体步骤如下:
S11图纸通过元素解析器提取图纸中所有的线,提取的线包含线的属性,属性以二进制的形式保存在DXF文件中;
S12解析器把这些属性转化为文本形式保存为标准的json数据结构并传入切割算法中。
实施例中,所述线的属性包括形状、长度和起止点坐标。
实施例中,所述切割算法针对TABLES表中定义的LTYPE线进行,解析DXF文件后提取出图纸中包含所有Line类型的图像实体。
实施例中,S3具体步骤如下:
S31根据每组中线的相对位置得到每个结构的上下左右边框4个坐标,将这些坐标作为新图纸的大小来将线的原始坐标按照相对位置平移到新DXF图纸中,使每个结构都位于新DXF图纸的中央位置;
S32将DXF图纸转化成图片格式传入标注算法。
实施例中,步骤S4的结构包括门、窗和墙体。为了方便理解本发明的上述技术方案,以下通过具体使用方式上对本发明的上述技术方案进行详细说明。
在具体使用时,根据本发明所述的一种CAD图纸的切割与标注方法,可以将整张CAD图纸中的元素按照结构切割到多张CAD图纸中去;通过深度学习训练识别算法,将切分后的图纸按照结构分类进行标注,如:门、窗、梁、柱等。
为实现上述目标,本专利提出的方法包括以下几个步骤:
CAD图纸的解析:DXF是AutoCAD公司开发的一种图纸格式,一个主要的DXF文件包含HEADER部分、CLASSES部分、TABLES部分、BLOCKS部分、ENTITIES部分、OBJECTS部分、THUMBNAILIMAGE部分,其中TABLES部分中包含若干符号表的定义。本专利中的切割方法针对TABLES表中定义的LTYPE(线)进行,解析DXF文件后提取出图纸中包含的所有Line类型的图像实体。
图纸的切割:对提取出的所有的线进行分析,把相互关联的线保存到一组,去掉无用的线。按组创建新的dxf文件,每组对应一个文件,把线按照相对位置关系绘制到新创建的文件中,保存文件,把文件生成图片。
图纸的标注:训练深度学习识别算法,对切割后的图纸进行图像识别,识别出图纸中包含的结构,并对结构进行标注,如门、窗、墙体等。
本系统具备4个模块:元素解析器,切割算法,绘图算法,标注算法,输入的图纸需要一次经过4个模块才能得到正确的切割与标注。元素解析器用于解析DXF文件中的元素并提取出线类型的图像实体;切割算法用于将有关联的线归为一组;绘图算法用于将分组后的线重新绘制成DXF文件并生成图片;标注算法接受绘图算法传递的图片,通过AI算法识别图纸中包含的结构并进行标注。
如图1所示,所属实施例分为了元素解析器、切割算法、绘图算法、标注算法共4部分,图纸一次经过这4个部分,最终得到标注后的结果。
CAD图纸中的主要关键要素是由线组成的,图纸经过元素解析器时,会提取出图纸中所有的线,这样在接下来的处理中可以避免文字、尺寸的影响,提取出的线包含线的形状、长度、起止点坐标等属性,这些属性会以二进制的形式保存在DXF文件中,解析器会把这些属性转化为文本形式,并保存为标准的json数据结构,传入切割算法。
切割算法会对传入的每一条线进行分析,有线的起止点和长度等信息可以绘制出每条线所占据的一个矩形区域,分别以(lx,ly)和(rx,ry)表示该举行区域的左上和右下两点,取这个矩形两条对角线的交点(midx,midy),这样针对每条线,都可以得到(lx,lyx,rx,ry,midx,midy)一组共6个属性。引入两个常量c和p,c表示两个矩形区域相交比例的阈值,p代表两条线距离的阈值。针对每一条线有li=(lxi,lyxi,rxi,ryi,midxi,midyi),与其他的线进行计算得到矩形区域相交比例ci和距离pi,ci<c且pi<p,则认为两条线属于同一结构,将这两条线分为一组。除此之外整张图纸的外框线和图纸图例之类的线会被算法抛弃,最终只剩图纸中所绘制结构的线,将这些线传入绘图算法。
传入绘图算法中的数据不能直接绘制,需要进行坐标转化,根据每组中线的相对位置,得到每个结构的上下左右边框4个坐标,将这个坐标作为新图纸的大小,将线的原始坐标按照相对位置平移到新图纸中,使每个结构都可以位于新图纸的中央位置。之后将DXF图纸转化成图片格式,传入标注算法。
标注算法依赖CNN卷积神经网络对图像进行识别,识别出每张图片中包含的结构,如门、窗、梁柱、墙体等,并且根据识别结果持续优化网络,提高识别的准确率。同时根据整体识别的结果反馈和优化切割算法,优化切割算法中的常量c和常量p,提高切割的准确率。
本发明通过实现CAD图纸的切割与标注,可以提供以下效益:通过对实际围绕着图纸相关的重复工作内容进行提取,并进行系统的设计和分析,将这部分重复的工作内容设计成软件系统,用于一线的施工团队,减少人力成本;降低建筑工人运用图纸的技术门槛,提升工人职业技能水平。
综上所述,借助于本发明的上述技术方案,通过将输入的图纸依次经过元素解析器、切割算法、绘图算法和标注算法得到正确的切割与标注,高效地完成了图纸相关的重复工作内容的提取,大大地减少人力成本,降低了建筑工人运用图纸的技术门槛,提升工人职业技能水平。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (6)

1.一种CAD图纸的切割与标注方法,其特征在于,包括如下步骤:
S1通过元素解析器解析DXF文件中的元素并提取出线类型的图像实体;
S2通过切割算法将有关联的线归为一组;
S2的具体步骤如下:
S21切割算法对传入的每一条线进行分析,通过线的起止点和长度绘制出每条线所占据的一个矩形区域,分别以(lx,ly)和(rx,ry)表示该矩形区域的左上和右下两点,取这个矩形两条对角线的交点(midx,midy),针对每条线得到(lx,lyx,rx,ry,midx,midy)一组共6个属性;
S22引入两个常量c和p,c表示两个矩形区域相交比例的阈值,p代表两条线距离的阈值;
S23针对每一条线有li=(lxi,lyxi,rxi,ryi,midxi,midyi)与其他的线进行计算得到矩形区域相交比例ci和距离pi,将满足ci<c且pi<p的线分为一组;不在一组的线被切割算法抛弃;
S24将图纸中剩下的绘制结构的线传入绘图算法;
S3将分组后的线重新绘制成DXF文件并生成图片;
S4标注算法依赖CNN卷积神经网络对图像进行识别,识别出每张图片中包含的结构并对结构进行标注,并且根据识别结果持续优化网络提高识别的准确率;同时根据整体识别的结果反馈和优化切割算法中的常量c和常量p。
2.根据权利要求1所述的CAD图纸的切割与标注方法,其特征在于,S1的具体步骤如下:
S11图纸通过元素解析器提取图纸中所有的线,提取的线包含线的属性,属性以二进制的形式保存在DXF文件中;
S12解析器把这些属性转化为文本形式保存为标准的json数据结构并传入切割算法中。
3.根据权利要求2所述的CAD图纸的切割与标注方法,其特征在于,所述线的属性包括形状、长度和起止点坐标。
4.根据权利要求1所述的CAD图纸的切割与标注方法,其特征在于,所述切割算法针对TABLES表中定义的LTYPE线进行,解析DXF文件后提取出图纸中包含所有Line类型的图像实体。
5.根据权利要求1所述的CAD图纸的切割与标注方法,其特征在于,S3具体步骤如下:
S31根据每组中线的相对位置得到每个结构的上下左右边框4个坐标,将这些坐标作为新图纸的大小来将线的原始坐标按照相对位置平移到新DXF图纸中,使每个结构都位于新DXF图纸的中央位置;
S32将DXF图纸转化成图片格式传入标注算法。
6.根据权利要求1所述的CAD图纸的切割与标注方法,其特征在于,步骤S4的结构包括门、窗和墙体。
CN202310877837.3A 2023-07-18 2023-07-18 一种cad图纸的切割与标注方法 Pending CN117058157A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310877837.3A CN117058157A (zh) 2023-07-18 2023-07-18 一种cad图纸的切割与标注方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310877837.3A CN117058157A (zh) 2023-07-18 2023-07-18 一种cad图纸的切割与标注方法

Publications (1)

Publication Number Publication Date
CN117058157A true CN117058157A (zh) 2023-11-14

Family

ID=88668235

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310877837.3A Pending CN117058157A (zh) 2023-07-18 2023-07-18 一种cad图纸的切割与标注方法

Country Status (1)

Country Link
CN (1) CN117058157A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117392269A (zh) * 2023-12-08 2024-01-12 中交第一航务工程勘察设计院有限公司 一种管网图纸数据提取方法及装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117392269A (zh) * 2023-12-08 2024-01-12 中交第一航务工程勘察设计院有限公司 一种管网图纸数据提取方法及装置
CN117392269B (zh) * 2023-12-08 2024-02-27 中交第一航务工程勘察设计院有限公司 一种管网图纸数据提取方法及装置

Similar Documents

Publication Publication Date Title
CN100550038C (zh) 图片内容识别方法及识别系统
CN110751137A (zh) 一种自动求解数学题的方法和系统
CN112396049A (zh) 文本纠错方法、装置、计算机设备及存储介质
CN110675940A (zh) 病理图像标注方法、装置、计算机设备及存储介质
CN101763516A (zh) 一种基于拟合函数的文字识别方法
CN117058157A (zh) 一种cad图纸的切割与标注方法
CN113780276B (zh) 一种结合文本分类的文本识别方法及系统
CN110909123A (zh) 一种数据提取方法、装置、终端设备及存储介质
CN110135407B (zh) 样本标注方法及计算机存储介质
CN110942063B (zh) 证件文字信息获取方法、装置以及电子设备
CN110363092B (zh) 柱状图识别方法、装置、设备及计算机可读存储介质
CN109684395B (zh) 一种基于自然语言处理的可视化数据接口通用解析方法
CN113743159A (zh) 一种应用于电力企业的ocr方法
CN116541912A (zh) 一种基于cad图像识别生成接线图的方法及装置
CN115565193A (zh) 问卷信息录入方法、装置、电子设备及存储介质
CN113657279B (zh) 一种票据类图像版面解析方法及装置
CN111931018B (zh) 试题匹配及试题拆分方法、装置和计算机存储介质
CN112348022B (zh) 一种基于深度学习的自由格式文档识别方法
CN114283438A (zh) 核电厂图纸信息识别与提取方法及系统
CN110175563B (zh) 金属切削刀具图纸标注识别方法及系统
CN107563382A (zh) 基于特征捕捉技术的文本识别方法
CN114049686A (zh) 签名识别模型训练方法、装置及电子设备
CN113850265A (zh) Pdf文档的解析方法、装置、电子设备及存储介质
Rocha et al. A solution to the problem of touching and broken characters
CN112395834A (zh) 基于图片输入的脑图生成方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination