CN114973299B - 建筑图纸构件识别方法、装置、电子设备及存储介质 - Google Patents
建筑图纸构件识别方法、装置、电子设备及存储介质 Download PDFInfo
- Publication number
- CN114973299B CN114973299B CN202210918088.XA CN202210918088A CN114973299B CN 114973299 B CN114973299 B CN 114973299B CN 202210918088 A CN202210918088 A CN 202210918088A CN 114973299 B CN114973299 B CN 114973299B
- Authority
- CN
- China
- Prior art keywords
- component
- target
- resolution
- image set
- drawing data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/42—Document-oriented image-based pattern recognition based on the type of document
- G06V30/422—Technical drawings; Geographical maps
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/70—Determining position or orientation of objects or cameras
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/146—Aligning or centring of the image pick-up or image-field
- G06V30/1473—Recognising objects as potential recognition candidates based on visual cues, e.g. shapes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/148—Segmentation of character regions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/19—Recognition using electronic means
- G06V30/191—Design or setup of recognition systems or techniques; Extraction of features in feature space; Clustering techniques; Blind source separation
- G06V30/19147—Obtaining sets of training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/19—Recognition using electronic means
- G06V30/191—Design or setup of recognition systems or techniques; Extraction of features in feature space; Clustering techniques; Blind source separation
- G06V30/1918—Fusion techniques, i.e. combining data from various sources, e.g. sensor fusion
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- General Health & Medical Sciences (AREA)
- Databases & Information Systems (AREA)
- Medical Informatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Molecular Biology (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Image Processing (AREA)
Abstract
本申请涉及一种建筑图纸构件识别方法、装置、电子设备及存储介质,在该方法中,结合高分辨率的对应CAD图纸数据中存在目标构件的局部区域的图像和低分辨率的对应完整的CAD图纸数据的图像,可通过数据增强即增加高分辨率的对应CAD图纸数据中存在目标构件的局部区域的图像,来进行多次构件识别,并基于识别结果进行去重,从而对CAD图纸数据中的目标构件进行比较精准的识别,避免由于CAD图纸数据中的目标构件转换为图像时出现失真的情况,导致识别结果不准确的问题。
Description
技术领域
本申请涉及通信技术领域,尤其涉及一种建筑图纸构件识别方法、装置、电子设备及存储介质。
背景技术
现有技术中,一般可以通过以下方式来对建筑图纸数据(一般为CAD图纸数据,本申请以CAD图纸数据为例)中的构件进行识别:其一,将CAD图纸数据转换为图像后,使用检测模型例如yolo一阶段检测模型,来对该图像所表达出来的CAD图纸数据中的构件进行识别。其二,将CAD图纸数据转换为图像后,使用检测模型和分类模型来对该图像所表达出来的CAD图纸数据中的构件进行识别。其中,该检测模型主要用于提高构件召回率,该分类模型用于识别检测模型所检测到的构件的类别。示例性的,分类模型可以为例如类似vgg的分类模型。其三,直接采用CAD图纸数据来进行构件识别,即先从CAD图纸数据中获取矢量数据,再基于获取到的矢量数据对CAD图纸数据中的构件进行识别。但一般从CAD图纸数据或者是图像中准确获取矢量数据的成本较高。其四,对CAD图纸数据进行解析得到构件图元,再采用图形图像方法识别构件。但由于同一类构件的画法可能是多种多样的,这种识别方法的泛化能力较差,识别准确性可能会较低。
在上述现有技术中,对于CAD图纸数据中的目标构件例如较小的构件或不明显的构件,即转化为图像后像素数量较少且由于分辨率较低可能会出现模糊失真的构件,例如图1所示的虚线框内的“地漏”构件,识别效果较差,可能会出现识别结果不全面或者说不准确的问题。
发明内容
本申请提供了一种建筑图纸构件识别方法、装置、电子设备及存储介质,以解决对于CAD图纸数据中的目标构件的识别效果较差,可能会出现识别结果不全面或者说不准确的问题。
第一方面,本申请提供了一种建筑图纸构件识别方法,所述方法包括:
获取第一目标图像集与第二目标图像集;所述第一目标图像集包括用于构成完整的CAD图纸数据对应的图像的子图像,所述第二目标图像集为用于构成CAD图纸数据中目标构件所在的区域对应的图像的子图像;所述第一目标图像集中的图像的分辨率为第一分辨率,所述第二目标图像集中的图像的分辨率为第二分辨率;所述第一分辨率小于所述第二分辨率;
将所述第一目标图像集中的图像输入目标构件识别模型,得到第一构件坐标和第一构件类型;所述第一构件坐标与所述第一构件类型存在对应关系;
将所述第二目标图像集中的图像输入所述目标构件识别模型,得到第二构件坐标和第二构件类型;所述第二构件坐标与所述第二构件类型存在对应关系;
基于所述第一构件坐标和所述第二构件坐标进行去重,确定目标构件坐标与目标构件类型。
可选地,所述获取第一目标图像集与第二目标图像集,包括:
获取所述CAD图纸数据;
以第一分辨率对所述CAD图纸数据,进行光栅化处理,得到第一分辨率的图像;
对第一分辨率的图像进行裁切处理,得到所述第一目标图像集。
可选地,所述获取第一目标图像集与第二目标图像集,包括:
获取所述CAD图纸数据;
确定所述CAD图纸数据中目标构件所在的区域的图纸数据;
以第二分辨率对所述CAD图纸数据中目标构件所在的区域的图纸数据,进行光栅化处理,得到第二分辨率的图像;
对所述第二分辨率的图像进行裁切处理,得到所述第二目标图像集。
可选地,所述确定所述CAD图纸数据中目标构件所在的区域的图纸数据,包括:
获取所述CAD图纸数据中的目标空间的描述性文本,所述目标空间为存在目标构件的空间;
以所述目标空间的描述性文本为中心,选取目标尺寸的区域,所述目标尺寸基于所述目标空间的大小确定;
将所述CAD图纸数据中所述目标尺寸的区域的图纸数据,确定为所述CAD图纸数据中目标构件所在的区域的图纸数据。
可选地,所述对第一分辨率的图像进行裁切处理,得到所述第一目标图像集,包括:
按照第一预设尺寸对所述第一分辨率的图像进行裁切,得到第一图像集;
筛选出所述第一图像集中存在构件的图像,作为所述第一目标图像集中的图像。
可选地,在所述基于所述第一构件坐标和所述第二构件坐标进行去重,确定目标构件坐标与目标构件类型,包括:
将所述第二构件坐标映射到所述第一分辨率的图像中,得到第三构件坐标;所述第三构件坐标为所述第二构件坐标在所述第一分辨率的图像中的坐标;
对所述第三构件坐标和所述第一构件坐标进行去重处理,并将所述去重处理后的第一构件坐标和第三构件坐标,确定为目标构件坐标,并将去重处理后的第一构件坐标对应的第一构件类型和去重处理后的第三构件坐标对应的第二构件类型,确定为所述目标构件类型;所述目标构件坐标与所述目标构件类型存在对应关系。
可选地,在所述获取第一目标图像集与第二目标图像集之前,所述方法还包括:
获取第一训练图像集、第二训练图像集、CAD训练图纸数据中的构件坐标和构件类型;所述第一训练图像集为用于构成完整的CAD训练图纸数据对应的图像的子图像,所述第二训练图像集为用于构成所述CAD训练图纸数据中目标构件所在的区域对应的图像的子图像;所述第一目标图像集中的图像的分辨率为第一分辨率,所述第二目标图像集中的图像的分辨率为第二分辨率;所述第一分辨率小于所述第二分辨率;
将所述第一训练图像集和所述第二训练图像集输入预设构件识别模型中,得到构件识别结果;
基于所述构件识别结果与所述CAD训练图纸数据中的构件坐标和构件类型,对所述预设构件识别模型中的参数进行调整,得到目标构件识别模型。
第二方面,本申请提供一种建筑图纸构件识别装置,该装置包括:
获取模块,用于获取第一目标图像集与第二目标图像集;所述第一目标图像集包括用于构成完整的CAD图纸数据对应的图像的子图像,所述第二目标图像集为用于构成CAD图纸数据中目标构件所在的区域对应的图像的子图像;所述第一目标图像集中的图像的分辨率为第一分辨率,所述第二目标图像集中的图像的分辨率为第二分辨率;所述第一分辨率小于所述第二分辨率;
模型识别模块,用于将所述第一目标图像集中的图像输入目标构件识别模型,得到第一构件坐标和第一构件类型;所述第一构件坐标与所述第一构件类型存在对应关系;将所述第二目标图像集中的图像输入所述目标构件识别模型,得到第二构件坐标和第二构件类型;所述第二构件坐标与所述第二构件类型存在对应关系;
确定模块,用于基于所述第一构件坐标和所述第二构件坐标进行去重,确定目标构件坐标与目标构件类型。
第三方面,本申请提供了一种电子设备,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;
存储器,用于存放计算机程序;
处理器,用于执行存储器上所存放的程序时,实现第一方面任一项实施例所述的建筑图纸构件识别方法的步骤。
第四方面,本申请还提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如第一方面任一项实施例所述的建筑图纸构件识别方法的步骤。
本申请实施例提供的上述技术方案与现有技术相比具有如下优点:
本申请实施例提供的该建筑图纸构件识别方法,获取用于构成完整的CAD图纸数据对应的图像的子图像的集合,即第一目标图像集,和用于构成CAD图纸数据中目标构件所在的区域对应的图像的子图像的集合,即第二目标图像集,随后,将分辨率较低的第一分辨率的第一目标图像集中的图像,和分辨率较高的第二分辨率的第二目标图像集中的图像,分别输入目标构件识别模型,得到第一构件坐标、第一构件坐标对应的第一构件类型和第二构件坐标、第二构件坐标对应的第二构件类型,最后,基于第一构件坐标和第二构件坐标进行去重,确定目标构件坐标和目标构件类型。这样的话,结合高分辨率的对应CAD图纸数据中存在目标构件的局部区域的图像和低分辨率的对应完整的CAD图纸数据的图像,可通过数据增强即增加高分辨率的对应CAD图纸数据中存在目标构件的局部区域的图像,来进行多次构件识别,并基于识别结果进行去重,从而对CAD图纸数据中的目标构件进行比较精准的识别,避免由于CAD图纸数据中的目标构件转换为图像时出现失真的情况,导致识别结果不准确的问题。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施例,并与说明书一起用于解释本发明的原理。
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例提供的一种目标构件的示意图;
图2为本申请实施例提供的一种建筑图纸构件识别方法的示意图;
图3为本申请实施例提供的一种滑动裁切的示意图;
图4为本申请实施例提供的一种模型识别构件的流程的示意图;
图5为本申请实施例提供的一种建筑图纸构件识别装置的示意图;
图6为本申请实施例提供的一种电子设备的结构示意图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请的一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。
为了解决对于CAD图纸数据中的目标构件的识别效果较差,可能会出现识别结果不全面或者说不准确的问题,本申请实施例提供了一种建筑图纸构件识别方法,应用于任一设备中。如图2所示,该建筑图纸构件识别方法包括步骤201-步骤204:
步骤201:获取第一目标图像集与第二目标图像集。
其中,第一目标图像集包括用于构成完整CAD图纸数据对应的图像的子图像,第二目标图像集包括用于构成CAD图纸数据中目标构件所在区域对应的图像的子图像。
另,第一目标图像集中图像的分辨率为第一分辨率,第二目标图像集中的图像的分辨率为第二分辨率,该第一分辨率小于第二分辨率。
在一种可能的实现方式中,第二分辨率为第一分辨率的两倍。
可选地,获取CAD图纸数据,以第一分辨率和第二分辨率分别对获取到的CAD图纸数据进行光栅化处理,得到第一分辨率和第二分辨率的图像后,对不同分辨率的图像分别进行裁切处理,从而得到第一分辨率的第一目标图像集和第二分辨率的第二目标图像集。
在一种可能的实现方式中,获取第一目标图像集的过程中,先获取CAD图纸数据,再以第一分辨率对CAD图纸数据进行光栅化处理,得到CAD图纸数据对应的图像即第一分辨率的图像,最后,对第一分辨率的图像进行裁切处理,得到第一目标图像集。
具体地,获取CAD图纸数据后,以第一分辨率对所有CAD图纸数据进行光栅化处理,得到完整的CAD图纸数据对应的图像,即第一分辨率的图像。
随后,以第一预设尺寸对第一分辨率的图像进行裁切处理,得到第一图像集,并筛选出第一图像集中存在构件的图像,作为第一目标图像集中的图像。其中,第一预设尺寸可以是根据实际工况确定的。
相应的,剔除掉第一图像集中不存在构件的图像。
其中,对第一分辨率的图像进行裁切处理所采用的方式可以为滑动裁切。当然,具体的裁切方式也可根据实际需求确定,例如对第一分辨率的图像进行裁切的方式还可以是中心裁切法等。
示例性的,如图3所示,滑动裁切时,以CAD图纸进行光栅化转换处理得到的图像1中边框的一角为起始点,以该起始点对应的角的对角为终止点,按照第一预设尺寸进行滑动裁切,得到子图像1、子图像2、子图像3、……、子图像n等,直至完成整个CAD图纸的裁切。其中,框1、框2、框3、……、框n的尺寸(或者说大小)一致,框1、框2、框3、……、框n的尺寸为第一预设尺寸。
在一种可能的实现方式中,获取第二目标图像集的过程中,先获取CAD图纸数据,确定CAD图纸数据中目标构件所在的区域的图纸数据,再以第二分辨率对CAD图纸数据中目标构件所在的区域的图纸数据,进行光栅化处理,得到CAD图纸数据中目标构件所在的区域对应的图像即第二分辨率的图像,最后,对第二分辨率的图像进行裁切处理,得到第二目标图像集。
具体地,对第二分辨率的图像进行裁切处理,得到第二目标图像集的过程中,以第二预设尺寸对第二分辨率的图像进行裁切处理,得到第二图像集,并筛选出第二图像集中存在构件的图像,作为第二目标图像集中的图像。其中,第二预设尺寸可以是根据实际工况确定的。
其中,对第二分辨率的图像进行裁切处理所采用的方式可以为中心裁切。当然,具体的裁切方式也可根据实际需求确定。
需要说明的是,上述第一预设尺寸与第二预设尺寸可以是相同的,也可以是不同的,即第一预设尺寸大于第二预设尺寸,或者第一预设尺寸小于第二预设尺寸。
具体地,确定CAD图纸数据中目标构件所在的区域的图纸数据时,先获取CAD图纸数据中的目标空间即存在目标构件的空间的描述性文本,并以该目标空间的描述性文本为中心,选取目标尺寸的区域,随后,将CAD图纸数据中目标尺寸的区域的图纸数据,确定为CAD图纸数据中目标构件所在的区域的图纸数据。
其中,目标尺寸基于目标空间的大小确定。
在选取目标尺寸的区域时,先获取建筑的实际尺寸与CAD图纸数据中的尺寸之间的比例,并获取目标空间的实际尺寸,随后,根据目标空间的实际尺寸和上述比例,确定目标尺寸。
示例性的,目标空间可以为卫生间、阳台等容易出现较小的目标构件的空间。目标空间的描述性文本即为容易出现较小构件的目标空间,例如卫生间、阳台等空间的描述性文本。
示例性的,目标空间可以为地下室等容易出现不明显的目标构件的空间。目标空间的描述性文本即为容易出现不明显的构件的目标空间,例如地下室等空间的描述性文本。
示例性的,在CAD图纸中,以目标空间例如卫生间为例,该目标空间的描述性文本为例如“卫生间”,在CAD格式数据中,按照目标空间的实际尺寸、建筑实际尺寸和CAD图纸的比例关系,换算得到在CAD图纸中目标空间的尺寸即目标尺寸。随后,以目标空间的描述性文本的文本框为中心,扩大区域至目标尺寸,将该目标尺寸大小的区域内的CAD图纸数据光栅化转换为较高分辨率的图像,例如上述第二分辨率的图像。最后,使用裁切第一分辨率的图像的方式,对该第二分辨率的图像进行裁切,并将裁切后得到的子图像添加至第一目标图像集中,以将该第二目标图像集中的图像输入目标构件识别模型中,得到第二分辨率的图像的构件识别结果,即第二构件坐标和对应的第二构件类型。
需要说明的是,CAD图纸数据一般是矢量图。在基于通过CAD图纸数据进行光栅化转换处理后得到的图像,对CAD图纸数据中的构件进行识别的过程中,若想使光栅化转换处理后得到的图像能够清晰表达出CAD图纸数据中的每个构件,则光栅化转换后得到图像的分辨率通常会比较大,即通常以较大的分辨率对CAD图纸数据进行光栅化转换处理。但是,在实际应用的过程中,深度学习检测模型对其输入图像的大小有一定的限制。当图像的分辨率过大时,图像可能会比较大,此时可能不能采用深度学习检测模型,基于CAD图纸数据进行光栅化转换处理后得到的图像对CAD图纸数据中的构件进行识别。因此,对CAD图纸数据进行光栅化转换处理得到图像的分辨率一般会比较低,此时,CAD图纸数据中较小的构件或地下室类型的CAD图纸数据中的构件,在光栅化转换处理后,可能会由于分辨率低出现失真的情况,影响模型识别的准确率。
在本申请中,在将CAD图纸数据对应的图像输入目标构件识别模型进行构件识别前,对CAD图纸数据对应的图像进行裁剪,可使得输入目标构件识别模型的图像的大小较小,以能够通过目标构件识别模型对CAD图纸数据对应的图像中的构件进行识别。
需要说明的是,本申请从工程角度提出一种数据增强的策略,可增加预测数据即用于构件识别的图像的多样性,即增加样本尺度的多样性,从而有效增强模型识别效果,改善CAD图纸数据中目标构件在转换成图像时出现失真的情况。
在一种可能的实现方式中,可以直接指定目标空间,或目标空间的描述性文本,增加相应的目标空间的构件识别样本,从而进一步提高构件识别的准确性。
步骤202:将第一目标图像集中的图像输入目标构件识别模型,得到第一构件坐标和第一构件类型。
其中,第一构件坐标与第一构件类型存在对应关系。
在一种可能的实现方式中,在执行步骤201前,即在获取第一目标图像集与第二目标图像集之前,进行模型训练,得到目标构件识别模型,以便于在步骤202和步骤203中采用该目标构件识别模型进行构件识别。
具体地,在进行模型训练时,先获取第一训练图像集、第二训练图像集、CAD训练图纸数据中的构件坐标和构件类型。其中,第一训练图像集为用于构成完整的CAD训练图纸数据对应的图像的子图像,第二训练图像集为用于构成CAD训练图纸数据中目标构件所在的区域对应的图像的子图像,第一训练图像集中的图像的分辨率为第一分辨率,第二训练图像集中的图像的分辨率为第二分辨率,且第一分辨率小于第二分辨率。关于第一分辨率和第二分辨率的介绍可参见上述内容。也就是说,第一训练图像集和第二训练图像集是基于CAD训练图纸数据确定的。
随后,将第一训练图像集和第二训练图像集输入预设构件识别模型中,得到构件识别结果。其中,该构件识别结果包括第一训练图像集对应的第一构件识别结果,和第二训练图像集对应的第二构件识别结果。
再之后,在基于构件识别结果与CAD训练图纸数据中的构件坐标和构件类型,对预设构件识别模型中的参数进行调整时,先对构件识别结果中的第一构件识别结果和第二构件识别结果进行去重处理。具体去重处理的过程,可以参见下述基于第一构件坐标和第二构件坐标进行去重的过程。在进行去重处理后,将保留下来的构件坐标和构件类型,和对应的CAD训练图纸数据中的构件坐标和构件类型,进行对比得到对比结果。基于对比结果确定保留下来的构件坐标和构件类型,与CAD训练图纸数据中的构件坐标和构件类型是否一致,并基于对比结果,对预设构件识别模型中的参数进行调整,从而实现模型训练。最后,将经过上述模型训练后得到的构件识别模型,确定为目标构件识别模型。具体的模型训练过程可参照现有技术,在此不再进行详细说明。
示例性的,预设构件识别模型可以为例如开源模型yolov5x6。
示例性的,在模型训练完成得到目标构件识别模型后,经步骤201获取预测数据,即获取第一目标图像集与第二目标图像集,具体获取过程参见上述介绍。随后,通过步骤202-步骤203,使用目标构件识别模型对预测数据进行推理识别,得到构件坐标和构件类别,随后,针对第二目标图像集中子图像的大小、CAD图纸的图框大小、CAD图纸的图框在CAD中的坐标,将对第二目标图像集中的图像进行推理识别得到的构件坐标,转换为第一目标图像集构成的第一分辨率的图像中的坐标。最后,对转换后得到的坐标和对第一目标图像集中的图像进行推理识别得到的构件坐标,进行非极大值抑制处理即去重处理,得到最终的构件坐标和对应的构件类型。
需要说明的是,基于对应同一CAD图纸数据的高分辨率的图像和低分辨率的图像,进行模型训练,可有效增加训练数据中的样本,使得用于训练的样本的尺度多样性增加,从而增强训练得到的模型的拟合能力,增强训练得到模型的鲁棒性,提高训练得到的模型即目标构件识别模型的识别效果。
步骤203:将第二目标图像集中的图像输入目标构件识别模型,得到第二构件坐标和第二构件类型。
其中,第二构件坐标和第二构件类型存在对应关系。
由于在第一目标图像集中的图像构成的第一分辨率的图像中,目标构件可能会因为分辨率较低存在模糊失真的问题,导致目标构件识别模型难以全面识别第一分辨率的图像中存在的构件。在本申请中,还基于目标构件识别模型和第二目标图像集中的图像构成的第二分辨率的图像,对第二分辨率的图像进行构件识别,从而基于该分辨率较高的第二分辨率的图像,进行较为精准的构件识别。最后,基于低分辨率即第一分辨率的图像和高分辨率即第二分辨率的图像,进行构件识别的识别结果,将第二分辨率的图像识别得到的构件坐标转换为第一分辨率的图像中的坐标,从而实现构件识别结果的融合,保证构件的识别结果的准确性和识别结果的全面性。
需要说明的是,步骤202与步骤203可以是先后顺序执行的,此时,步骤202可在步骤203之前执行,也可在步骤203之后执行。当然,步骤202与步骤203也可以是同时执行的。
步骤204:基于第一构件坐标和第二构件坐标进行去重,确定目标构件坐标与目标构件类型。
可选地,将第二构件坐标映射到第一分辨率的图像中,得到第三构件坐标,随后,对第三构件坐标和第一构件坐标进行去重处理,并将去重处理后的第一构件坐标和第三构件坐标,确定为目标构件坐标,将去重处理后的第一构件坐标对应的第一构件类型和去重处理后的第三构件坐标对应的第二构件类型,确定为目标构件类型。
其中,第三构件坐标即第二构件坐标在第一分辨率的图像中的坐标。
示例性的,采用例如非极大值抑制(non-maximum suppression,NMS)算法,对第三构件坐标和第一构件坐标进行去重处理。当然,也可根据实际情况选择其他算法,对第三构件坐标和第一构件坐标进行去重处理。
示例性的,建筑图纸构件识别的流程可如图4所示,获取CAD图纸,对完整的CAD图纸对应的图像进行滑窗裁切(即上述滑动裁切),得到图像子集,以空间文本为中心对局部区域图像进行中心裁切,得到图像子集,将这两个图像子集分别输入到模型训练得到的神经网络模型即目标构件识别模型中,在基于该模型进行构件识别的过程中,先得到输入图像的图像特征,再基于图像特征进行目标分类,得到构件类别,并基于图像特征进行边框回归处理,得到构件坐标。其中,构件类别与构件坐标之间存在对应关系。
其中,利用卷积神经网络的特征提取方式或其他目标检测网络的特征提取方式,来进行图像特征提取。即上述训练得到的网络模型可以是卷积神经网络模型,也可以是其他目标检测网络模型。
如图5所示,本申请实施例提供一种建筑图纸构件识别装置,该装置包括获取模块501、模型识别模块502和确定模块503。
其中,获取模块501,用于获取第一目标图像集与第二目标图像集。第一目标图像集包括用于构成完整的CAD图纸数据对应的图像的子图像,第二目标图像集为用于构成CAD图纸数据中目标构件所在的区域对应的图像的子图像,且第一目标图像集中的图像的分辨率为第一分辨率,第二目标图像集中的图像的分辨率为第二分辨率,第一分辨率小于第二分辨率。
模型识别模块502,用于将第一目标图像集中的图像输入目标构件识别模型,得到第一构件坐标和第一构件类型;第一构件坐标与第一构件类型存在对应关系;将第二目标图像集中的图像输入目标构件识别模型,得到第二构件坐标和第二构件类型;第二构件坐标与第二构件类型之间存在对应关系。
确定模块503,用于基于第一构件坐标和第二构件坐标进行去重,确定目标构件坐标与目标构件类型。
如图6所示,本申请实施例提供了一种电子设备,该电子设备可以为上述系统中的任一设备,包括处理器601、通信接口602、存储器603和通信总线604,其中,处理器601,通信接口602,存储器603通过通信总线604完成相互间的通信,
存储器603,用于存放计算机程序;
在本申请一个实施例中,处理器601,用于执行存储器603上所存放的程序时,实现前述任意一个方法实施例提供的建筑图纸构件识别方法。
本申请实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如前述任意一个方法实施例提供的建筑图纸构件识别方法。
需要说明的是,在本文中,诸如“第一”和“第二”等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上所述仅是本发明的具体实施方式,使本领域技术人员能够理解或实现本发明。对这些实施例的多种修改对本领域的技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所申请的原理和新颖特点相一致的最宽的范围。
Claims (10)
1.一种建筑图纸构件识别方法,其特征在于,所述方法包括:
获取第一目标图像集与第二目标图像集;所述第一目标图像集包括用于构成完整的CAD图纸数据对应的图像的子图像,所述第二目标图像集为用于构成CAD图纸数据中目标构件所在的区域对应的图像的子图像;所述第一目标图像集中的图像的分辨率为第一分辨率,所述第二目标图像集中的图像的分辨率为第二分辨率;所述第一分辨率小于所述第二分辨率;所述目标构件所在的区域为存在小构件或不明显构件的区域;
将所述第一目标图像集中的图像输入目标构件识别模型,得到第一构件坐标和第一构件类型;所述第一构件坐标与所述第一构件类型存在对应关系;
将所述第二目标图像集中的图像输入所述目标构件识别模型,得到第二构件坐标和第二构件类型;所述第二构件坐标与所述第二构件类型存在对应关系;
基于所述第一构件坐标和所述第二构件坐标进行去重,确定目标构件坐标与目标构件类型,包括:将所述第二构件坐标映射到所述第一分辨率的图像中,得到第三构件坐标;对所述第三构件坐标和所述第一构件坐标进行去重处理,并基于去重处理后的第一构件坐标和第三构件坐标,确定目标构件坐标与目标构件类型;所述第三构件坐标为所述第二构件坐标在所述第一分辨率的图像中的坐标。
2.根据权利要求1所述的建筑图纸构件识别方法,其特征在于,所述获取第一目标图像集与第二目标图像集,包括:
获取所述CAD图纸数据;
以第一分辨率对所述CAD图纸数据,进行光栅化处理,得到第一分辨率的图像;
对第一分辨率的图像进行裁切处理,得到所述第一目标图像集。
3.根据权利要求1所述的建筑图纸构件识别方法,其特征在于,所述获取第一目标图像集与第二目标图像集,包括:
获取所述CAD图纸数据;
确定所述CAD图纸数据中目标构件所在的区域的图纸数据;
以第二分辨率对所述CAD图纸数据中目标构件所在的区域的图纸数据,进行光栅化处理,得到第二分辨率的图像;
对所述第二分辨率的图像进行裁切处理,得到所述第二目标图像集。
4.根据权利要求3所述的建筑图纸构件识别方法,其特征在于,所述确定所述CAD图纸数据中目标构件所在的区域的图纸数据,包括:
获取所述CAD图纸数据中的目标空间的描述性文本,所述目标空间为存在目标构件的空间;
以所述目标空间的描述性文本为中心,选取目标尺寸的区域,所述目标尺寸基于所述目标空间的大小确定;
将所述CAD图纸数据中所述目标尺寸的区域的图纸数据,确定为所述CAD图纸数据中目标构件所在的区域的图纸数据。
5.根据权利要求2所述的建筑图纸构件识别方法,其特征在于,所述对第一分辨率的图像进行裁切处理,得到所述第一目标图像集,包括:
按照第一预设尺寸对所述第一分辨率的图像进行裁切,得到第一图像集;
筛选出所述第一图像集中存在构件的图像,作为所述第一目标图像集中的图像。
6.根据权利要求1所述的建筑图纸构件识别方法,其特征在于,所述基于去重处理后的第一构件坐标和第三构件坐标,确定目标构件坐标与目标构件类型,包括:
将所述去重处理后保留下来的第一构件坐标和第三构件坐标,确定为目标构件坐标,并将去重处理后保留下来的第一构件坐标对应的第一构件类型,和去重处理后保留下来的第三构件坐标对应的第二构件类型,确定为所述目标构件类型;所述目标构件坐标与所述目标构件类型存在对应关系。
7.根据权利要求1-6中任一项所述的建筑图纸构件识别方法,其特征在于,在所述获取第一目标图像集与第二目标图像集之前,所述方法还包括:
获取第一训练图像集、第二训练图像集、CAD训练图纸数据中的构件坐标和构件类型;所述第一训练图像集为用于构成完整的CAD训练图纸数据对应的图像的子图像,所述第二训练图像集为用于构成所述CAD训练图纸数据中目标构件所在的区域对应的图像的子图像;所述第一训练图像集中的图像的分辨率为第一分辨率,所述第二训练图像集中的图像的分辨率为第二分辨率;所述第一分辨率小于所述第二分辨率;
将所述第一训练图像集和所述第二训练图像集输入预设构件识别模型中,得到构件识别结果;
基于所述构件识别结果与所述CAD训练图纸数据中的构件坐标和构件类型,对所述预设构件识别模型中的参数进行调整,得到目标构件识别模型。
8.一种建筑图纸构件识别装置,其特征在于,所述装置包括:
获取模块,用于获取第一目标图像集与第二目标图像集;所述第一目标图像集包括用于构成完整的CAD图纸数据对应的图像的子图像,所述第二目标图像集为用于构成CAD图纸数据中目标构件所在的区域对应的图像的子图像;所述第一目标图像集中的图像的分辨率为第一分辨率,所述第二目标图像集中的图像的分辨率为第二分辨率;所述第一分辨率小于所述第二分辨率;所述目标构件所在的区域为存在小构件或不明显构件的区域;
模型识别模块,用于将所述第一目标图像集中的图像输入目标构件识别模型,得到第一构件坐标和第一构件类型;所述第一构件坐标与所述第一构件类型存在对应关系;将所述第二目标图像集中的图像输入所述目标构件识别模型,得到第二构件坐标和第二构件类型;所述第二构件坐标与所述第二构件类型存在对应关系;
确定模块,用于基于所述第一构件坐标和所述第二构件坐标进行去重,确定目标构件坐标与目标构件类型,包括:将所述第二构件坐标映射到所述第一分辨率的图像中,得到第三构件坐标;对所述第三构件坐标和所述第一构件坐标进行去重处理,并基于去重处理后的第一构件坐标和第三构件坐标,确定目标构件坐标与目标构件类型;所述第三构件坐标为所述第二构件坐标在所述第一分辨率的图像中的坐标。
9.一种电子设备,其特征在于,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;
存储器,用于存放计算机程序;
处理器,用于执行存储器上所存放的程序时,实现权利要求1-7中任一项所述的建筑图纸构件识别方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1-7中任一项所述的建筑图纸构件识别方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210918088.XA CN114973299B (zh) | 2022-08-01 | 2022-08-01 | 建筑图纸构件识别方法、装置、电子设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210918088.XA CN114973299B (zh) | 2022-08-01 | 2022-08-01 | 建筑图纸构件识别方法、装置、电子设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114973299A CN114973299A (zh) | 2022-08-30 |
CN114973299B true CN114973299B (zh) | 2023-01-10 |
Family
ID=82969932
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210918088.XA Active CN114973299B (zh) | 2022-08-01 | 2022-08-01 | 建筑图纸构件识别方法、装置、电子设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114973299B (zh) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111832447A (zh) * | 2020-06-30 | 2020-10-27 | 万翼科技有限公司 | 建筑图纸构件识别方法、电子设备及相关产品 |
CN113392761A (zh) * | 2021-06-15 | 2021-09-14 | 万翼科技有限公司 | 构件识别方法、装置、设备及存储介质 |
CN113780190A (zh) * | 2021-09-14 | 2021-12-10 | 万翼科技有限公司 | 空间轮廓识别及空间检测模型构建方法、设备及存储介质 |
CN114240737A (zh) * | 2021-12-14 | 2022-03-25 | 北京构力科技有限公司 | 用于从图纸生成数字模型的方法、装置、设备和介质 |
CN114417486A (zh) * | 2022-03-14 | 2022-04-29 | 深圳市斯维尔科技股份有限公司 | 建筑设计图纸导入方法和装置、电子设备、存储介质 |
CN114724169A (zh) * | 2022-03-28 | 2022-07-08 | 广东博智林机器人有限公司 | 一种二维图纸构件的识别方法及系统 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6336010B2 (ja) * | 2016-11-16 | 2018-06-06 | 三菱電機株式会社 | 路上区画線認識装置、路上区画線認識方法、路上区画線認識装置を備えた運転支援装置、および路上区画線認識方法を備えた運転支援方法 |
CN112651378B (zh) * | 2021-01-08 | 2021-10-15 | 唐旸 | 紧固件二维图纸的标注信息识别方法、设备及介质 |
CN113657202B (zh) * | 2021-07-28 | 2022-10-11 | 万翼科技有限公司 | 构件识别方法、构建训练集方法、装置、设备及存储介质 |
CN113592886B (zh) * | 2021-07-28 | 2024-03-19 | 金地(集团)股份有限公司 | 建筑图纸的审图方法、装置、电子设备及介质 |
CN113971709B (zh) * | 2021-10-26 | 2024-04-26 | 上海品览数据科技有限公司 | 一种cad电气施工平面图壁装构件自动绘制方法 |
-
2022
- 2022-08-01 CN CN202210918088.XA patent/CN114973299B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111832447A (zh) * | 2020-06-30 | 2020-10-27 | 万翼科技有限公司 | 建筑图纸构件识别方法、电子设备及相关产品 |
CN113392761A (zh) * | 2021-06-15 | 2021-09-14 | 万翼科技有限公司 | 构件识别方法、装置、设备及存储介质 |
CN113780190A (zh) * | 2021-09-14 | 2021-12-10 | 万翼科技有限公司 | 空间轮廓识别及空间检测模型构建方法、设备及存储介质 |
CN114240737A (zh) * | 2021-12-14 | 2022-03-25 | 北京构力科技有限公司 | 用于从图纸生成数字模型的方法、装置、设备和介质 |
CN114417486A (zh) * | 2022-03-14 | 2022-04-29 | 深圳市斯维尔科技股份有限公司 | 建筑设计图纸导入方法和装置、电子设备、存储介质 |
CN114724169A (zh) * | 2022-03-28 | 2022-07-08 | 广东博智林机器人有限公司 | 一种二维图纸构件的识别方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN114973299A (zh) | 2022-08-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11494577B2 (en) | Method, apparatus, and storage medium for identifying identification code | |
CN107545262B (zh) | 一种在自然场景图像中检测文本的方法及装置 | |
WO2020038205A1 (zh) | 目标检测方法、装置、计算机可读存储介质及计算机设备 | |
WO2018166116A1 (zh) | 车损识别方法、电子装置及计算机可读存储介质 | |
CN109146892A (zh) | 一种基于美学的图像裁剪方法及装置 | |
CN107784288B (zh) | 一种基于深度神经网络的迭代定位式人脸检测方法 | |
US10395393B2 (en) | Method for assessing the quality of an image of a document | |
CN108305260B (zh) | 一种图像中角点的检测方法、装置及设备 | |
CN109360179B (zh) | 一种图像融合方法、装置及可读存储介质 | |
CN109934216B (zh) | 图像处理的方法、装置、计算机可读存储介质 | |
CN111814905A (zh) | 目标检测方法、装置、计算机设备和存储介质 | |
CN110263730B (zh) | 图像识别方法、装置、电子设备及存储介质 | |
CN109241867B (zh) | 采用人工智能算法识别数字岩心图像的方法及装置 | |
CN116071309B (zh) | 元器件的声扫缺陷检测方法、装置、设备和存储介质 | |
CN111899270A (zh) | 卡片边框检测方法、装置、设备及可读存储介质 | |
CN110766007A (zh) | 证件遮挡检测方法、装置、设备及可读存储介质 | |
CN111079730A (zh) | 一种在界面图中确定样图所在区域的方法和电子设备 | |
CN113160087A (zh) | 图像增强方法、装置、计算机设备及存储介质 | |
CN116797590A (zh) | 一种基于机器视觉的Mura缺陷检测方法及系统 | |
CN108052918A (zh) | 一种笔迹比对系统及方法 | |
KR102653177B1 (ko) | 객체 정보 추출 장치 및 방법 | |
CN111144425A (zh) | 检测拍屏图片的方法、装置、电子设备及存储介质 | |
CN114863431A (zh) | 一种文本检测方法、装置及设备 | |
CN111353514A (zh) | 模型训练方法、图像识别方法、装置及终端设备 | |
CN114973299B (zh) | 建筑图纸构件识别方法、装置、电子设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
TR01 | Transfer of patent right |
Effective date of registration: 20230704 Address after: A601, Zhongke Naneng Building, No. 06 Yuexing 6th Road, Gaoxin District Community, Yuehai Street, Nanshan District, Shenzhen City, Guangdong Province, 518063 Patentee after: Shenzhen Wanyi Digital Technology Co.,Ltd. Address before: 519085 Room 715, No. 128, Xingsheng 1st Road, Hengqin New District, Zhuhai City, Guangdong Province Patentee before: WANYI TECHNOLOGY Co.,Ltd. |
|
TR01 | Transfer of patent right |