CN113205024A - 工程图纸的预处理方法、装置、电子设备和存储介质 - Google Patents

工程图纸的预处理方法、装置、电子设备和存储介质 Download PDF

Info

Publication number
CN113205024A
CN113205024A CN202110447806.5A CN202110447806A CN113205024A CN 113205024 A CN113205024 A CN 113205024A CN 202110447806 A CN202110447806 A CN 202110447806A CN 113205024 A CN113205024 A CN 113205024A
Authority
CN
China
Prior art keywords
coordinate
bounding box
primitive
component
engineering
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110447806.5A
Other languages
English (en)
Other versions
CN113205024B (zh
Inventor
余兵
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wanyi Technology Co Ltd
Original Assignee
Wanyi Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wanyi Technology Co Ltd filed Critical Wanyi Technology Co Ltd
Priority to CN202110447806.5A priority Critical patent/CN113205024B/zh
Publication of CN113205024A publication Critical patent/CN113205024A/zh
Application granted granted Critical
Publication of CN113205024B publication Critical patent/CN113205024B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/42Document-oriented image-based pattern recognition based on the type of document
    • G06V30/422Technical drawings; Geographical maps
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/25Determination of region of interest [ROI] or a volume of interest [VOI]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/26Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
    • G06V10/267Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion by performing operations on regions, e.g. growing, shrinking or watersheds
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/414Extracting the geometrical structure, e.g. layout tree; Block segmentation, e.g. bounding boxes for graphics or text

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Artificial Intelligence (AREA)
  • Data Mining & Analysis (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Graphics (AREA)
  • Geometry (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Image Generation (AREA)

Abstract

本申请涉及一种工程图纸的预处理方法、装置、电子设备和存储介质,应用于数据处理技术领域,其中,方法包括:获取工程图纸中每个类别图层中的图元的基本信息,基本信息包括图元的空间坐标;根据图元的空间坐标,确定每个类别图层中各构件的第一边界框;根据第一边界框内的图元的基本信息,绘制得到各构件的构件图像,以通过构件图像进行分类。以解决现有技术中,需要先将图纸的格式转化成图片数据,而图纸打印转换成图片后,图片的数据较大,程序运行时需要占用极大内存,耗费时间较长的问题。

Description

工程图纸的预处理方法、装置、电子设备和存储介质
技术领域
本申请涉及数据处理技术领域,尤其涉及一种工程图纸的预处理方法、装置、电子设备和存储介质。
背景技术
建筑图纸的设计、审查是建筑项目开发流程中的重要环节,图纸的质量将直接影响到项目进度、项目成本和项目质量,优质的图纸能够为项目建立良好的口碑。为保证项目的交付质量,设计师也常常需要花大量的精力来管控好图纸质量,他们对能够提升审图效率的工具有着强烈的诉求,据此,市面上出现了智能审图工具。审图工具在对图纸进行审核时,需要先进行预处理,以得到图纸中各构件的图像。
相关技术中,对图纸进行预处理得到构件图像时,往往需要先将图纸本身的格式数据,转化成图片格式数据得到打印原图,进而确定构件在打印原图中的位置区域,在打印原图上抠出包括该构件所在位置区域的小图,得到构件的图像,进而对构件进行深度学习分类。
但是,这种方式,需要先将图纸的格式转化成图片数据,而图纸打印转换成图片后,图片的数据较大,程序运行时需要占用极大内存,耗费时间较长。
发明内容
本申请提供了一种工程图纸的预处理方法、装置、电子设备和存储介质,用以解决现有技术中,需要先将图纸的格式转化成图片数据,而图纸打印转换成图片后,图片的数据较大,程序运行时需要占用极大内存,耗费时间较长的问题。
第一方面,本申请实施例提供了一种工程图纸的预处理方法,包括:
获取工程图纸中每个类别图层中的图元的基本信息,所述基本信息包括图元的空间坐标;
根据所述图元的空间坐标,确定每个类别图层中各构件的第一边界框;
将所述工程图纸转换为工程图像;
基于所述第一边界框对所述工程图像进行切割,得到各所述构件的构件图像,以通过所述构件图像进行分类。
可选的,根据所述图元的空间坐标,确定每个类别图层中各构件的第一边界框,包括:
根据所述图元的空间坐标,得到所述图元的第二边界框;
判断所述类别图层中的各所述第二边界框之间是否重叠;
若重叠,将重叠的所述第二边界框进行合并,得到所述第一边界框;
若未重叠,将所述第二界框作为所述构件的所述第一边界框。
可选的,所述根据所述图元的空间坐标,得到所述图元的第二边界框,包括:
获取所述图元的所述空间坐标中各顶点的坐标;
将所述顶点坐标中横坐标的最小值和纵坐标的最小值,作为所述第二边界框的第一坐标;
将所述顶点坐标中横坐标的最大值和纵坐标的最大值,作为所述第二边界框的第二坐标;
根据所述第一坐标和所述第二坐标,绘制得到所述第二边界框。
可选的,所述判断所述类别图层中的各所述第二边界框之间是否重叠,包括:
获取各所述第二边界框的所述第一坐标和所述第二坐标;
根据第三边界框的第一坐标和第四边界框的第一坐标中,横坐标的最大值和纵坐标的最大值,得到第三坐标,所述第三边界框和所述第四边界框为相邻的两个第二边界框;
根据第三边界框的第二坐标和第四边界框的第二坐标中,横坐标的最小值和纵坐标的最小值,得到第四坐标;
若所述第四坐标的横坐标小于所述第三坐标的横坐标,并且,所述第四坐标的纵坐标小于所述第三坐标的纵坐标,确定所述第三边界框和所述第四边界框未重叠;
否则,确定所述第三边界框和所述第四边界框重叠。
可选的,所述将重叠的所述第二边界框进行合并,得到所述第一边界框,包括:
获取所述第三边界框中第一坐标的横坐标和第二坐标的横坐标、以及第四边界框中第一坐标的横坐标和第二坐标的横坐标的最小值,作为所述第一边界框的第五坐标的横坐标;
获取所述第三边界框中第一坐标的纵坐标和第二坐标的纵坐标,以及第四边界框中第一坐标的纵坐标和第二坐标的纵坐标的最小值,作为所述第一边界框的第五坐标的纵坐标;
获取所述第三边界框中第一坐标的横坐标和第二坐标的横坐标,以及第四边界框中第一坐标的横坐标和第二坐标的横坐标的最大值,作为所述第一边界框的第六坐标的横坐标;
获取所述第三边界框中第一坐标的纵坐标和第二坐标的纵坐标,以及第四边界框中第一坐标的纵坐标和第二坐标的纵坐标的最大值,作为所述第一边界框的第六坐标的纵坐标;
根据所述第五坐标和所述第六坐标,得到所述第一边界框。
可选的,所述基本信息还包括所述图元的类型,所述根据所述第一边界框内的图元的基本信息,绘制得到各所述构件的构件图像,包括:
获取预设大小的初始图像;
根据所述图元的空间坐标和所述图元的类型,将所述图元映射至所述初始图像中,得到所述构件图像。
可选的,所述根据所述图元的空间坐标和所述图元的类型,将所述图元映射至所述初始图像中,得到所述构件图像之前,还包括:
判断所述第一边界框的面积是否小于预设值;
若是,获取所述图元的空间坐标的缩放比;
所述根据所述图元的空间坐标和所述图元的类型,将所述图元映射至所述初始图像中,得到所述构件图像,包括:
将所述空间坐标按照所述缩放比进行缩放,得到目标空间坐标;
将所述图元按照所述目标空间坐标和所述图元的类型,映射至所述初始图像中,得到所述构件图像。
第二方面,本申请实施例提供了一种工程图纸的预处理装置,包括:
获取模块,用于获取工程图纸中每个类别图层中的图元的基本信息,所述基本信息包括图元的空间坐标;
确定模块,用于根据所述图元的空间坐标,确定每个类别图层中各构件的第一边界框;
转换模块,用于将所述工程图纸转换为工程图像;
切割模块,用于基于所述第一边界框对所述工程图像进行切割,得到各所述构件的构件图像,以通过所述构件图像进行分类。
第三方面,本申请实施例提供了一种电子设备,包括:处理器、通信接口、存储器和通信总线,其中,处理器、通信接口和存储器通过通信总线完成相互间的通信;
所述存储器,用于存储计算机程序;
所述处理器,用于执行所述存储器中所存储的程序,实现第一方面所述的工程图纸的预处理方法。
第四方面,本申请实施例提供了一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时实现第一方面所述的工程图纸的预处理方法。
本申请实施例提供的上述技术方案与现有技术相比具有如下优点:本申请实施例提供的该方法,通过获取工程图纸中每个类别图层中的图元的基本信息,基本信息包括图元的空间坐标;根据图元的空间坐标,确定每个类别图层中各构件的第一边界框;将工程图纸转换为图片;基于第一边界框对图片进行切割,得到各构件的构件图像,以通过构件图像进行分类。如此,在对工程图纸的预处理过程中,直接采用工程图纸中的图元信息,对构件进行确定,并在确定构件的第一边框后,再切割得到构件图像,避免了在确定构件过程中,由于图片数据过大导致的占用内存,耗费时间长的问题。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施例,并与说明书一起用于解释本发明的原理。
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本申请一实施例提供的工程图纸的预处理方法的系统架构的结构图;
图2为本申请一实施例提供的工程图纸的预处理方法的流程图;
图3为本申请另一实施例提供的工程图纸的预处理方法的流程图;
图4为本申请一实施例提供的工程图纸的预处理方法中边界框的示意图;
图5为本申请另一实施例提供的工程图纸的预处理方法中边界框的示意图;
图6为本申请一实施例提供的工程图纸的预处理方法中构件图像的示意图;
图7为本申请另一实施例提供的工程图纸的预处理方法中边界框的示意图;
图8为本申请又一实施例提供的工程图纸的预处理方法中边界框的示意图;
图9为本申请一实施例提供的工程图纸的预处理装置的结构图;
图10为本申请一实施例提供的电子设备的结构图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请的一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。
根据本申请一实施例提供了一种工程图纸的预处理方法。可选地,在本申请实施例中,上述工程图纸的预处理方法可以应用于如图1所示的由终端101和服务器102所构成的硬件环境中。如图1所示,服务器102通过网络与终端101进行连接,可用于为终端或终端上安装的客户端提供服务(如视频服务、应用服务等),可在服务器上或独立于服务器设置数据库,用于为服务器102提供数据存储服务,上述网络包括但不限于:广域网、城域网或局域网,终端101并不限定于PC、手机、平板电脑等。
本申请实施例的工程图纸的预处理方法可以由服务器102来执行,也可以由终端101来执行,还可以是由服务器102和终端101共同执行。其中,终端101执行本申请实施例的工程图纸的预处理方法,也可以是由安装在其上的客户端来执行。
以终端执行本申请实施例的工程图纸的预处理方法为例,图2是根据本申请实施例的一种可选的工程图纸的预处理方法的流程示意图,如图2所示,该方法的流程可以包括以下步骤:
步骤201、获取工程图纸中每个类别图层中的图元的基本信息,基本信息包括图元的空间坐标。
一些实施例中,工程图纸可以为多种格式的图纸,例如,文件扩展名为.dwg或.sat的计算机辅助设计(ComputerAidedDesign,简称CAD)图纸,本申请的保护范围不以工程图纸的具体格式为限制。
其中,工程图纸在绘制过程中,会根据构件的不同,创建多个类别的类别图层。类别图层是根据图层的命名分类得到的。在同一类别图层中,图层的数量为至少一个。在每个类别图层中均包括至少一个图元,至少一个图元构成上述的构件。其中,图元为工程图纸中的点、线、面等基本图形中的至少一种。
其中,工程图纸中设置有直角坐标系,工程图纸中各图元的空间坐标均是根据该直角坐标系确定的空间坐标。
示例性的,工程图纸为建筑图纸时,构件可以但不限于为门、窗和楼梯等。
步骤202、根据图元的空间坐标,确定每个类别图层中各构件的第一边界框。
一些实施例中,在同一类别图层中至少包括一个构件,在获取得到图元的空间坐标后,便可以通过图元的空间坐标,得到各构件的第一边界框。其中,第一边界框可以但不限于为构件的轮廓的外接矩形。如此,只需要通过图元空间坐标便可以得到构件的第一边界框,不需要用到图形或图片数据,降低了内存的占用。
图3是根据本申请实施例的一种可选的工程图纸的预处理方法的流程示意图,基于上述各实施例的内容,作为一种可选实施例,根据图元的空间坐标,确定每个类别图层中各构件的第一边界框,可以包括以下步骤:
步骤301、根据图元的空间坐标,得到图元的第二边界框。
一些实施例中,对于每个图元均具有至少一个空间坐标,例如,图元为线段时,空间坐标包括线段两个顶点的坐标;图元为矩形平面时,空间坐标包括该矩形平面四个顶点的坐标。在确定各图元的空间坐标后,便可以根据图元的空间坐标,确定该图元的第二边界框。
进一步的,根据图元的空间坐标,得到图元的第二边界框,包括:
获取图元的空间坐标中各顶点的坐标;将顶点坐标中横坐标的最小值和纵坐标的最小值,作为第二边界框的第一坐标;将顶点坐标中横坐标的最大值和纵坐标的最大值,作为第二边界框的第二坐标;根据第一坐标和第二坐标,绘制得到第二边界框。
本实施例中,参照图4,以图元为线段为例,该线段的空间坐标为两个顶点的坐标,将两个顶点坐标表示为(line_x1,line_y1),(line_x2,line_y2)。将第二边界框的左下顶点(即第一坐标)表示为(bbox_x1,bbox_y1),右上顶点(即第二坐标)表示为(bbox_x2,bbox_y2)。由此,确定第二边界框中各顶点的坐标如下:
bbox_x1=min(line_x1,line_x2);
bbox_x2=max(line_x1,line_x2);
bbox_y1=min(line_y1,line_y2);
bbox_y2=max(line_y1,line_y2)。
步骤302、判断类别图层中的各第二边界框之间是否重叠;若重叠,执行步骤303;若未重叠,执行步骤304。
一些实施例中,在构件绘制过程中,组成该构件的各图元可能会发生重叠,为了更加准确的确定构件的完整边界框,本实施例中,在确定了各图元的第二边界框后,还会再判断各第二边界框之间是否发生重叠。
进一步的,步骤302的实现方式有多种,一种可选实施例中,该判断类别图层中的各第二边界框之间是否重叠的方法,包括以下步骤:
获取各第二边界框的第一坐标和第二坐标;
根据第三边界框的第一坐标和第四边界框的第一坐标中,横坐标的最大值和纵坐标的最大值,得到第三坐标,第三边界框和第四边界框为相邻的两个第二边界框;
根据第三边界框的第二坐标和第四边界框的第二坐标中,横坐标的最小值和纵坐标的最小值,得到第四坐标;
若第四坐标的横坐标小于第三坐标的横坐标,并且,第四坐标的纵坐标小于第三坐标的纵坐标,确定第三边界框和第四边界框未重叠;
否则,确定第三边界框和第四边界框重叠。
基于上述相关实施例,对于每个第二边界框来说,其左下顶点坐标均为其第一坐标,右上顶点坐标均为其第二坐标。在判断各第二边界框是否重叠时,通过各第二边界框的第一坐标和第二坐标值进行判断。
具体的,参照图5,以两个图元均为线段为例,两个线段分别表示为线段a和线段b,其中,线段a的边界框为第三边界框,第三边界框的第一坐标表示为(a_bbox_x1,a_bbox_y1),第二坐标表示为(a_bbox_x2,a_bbox_y2);线段b的边界框为第四边界框,第四边界框的第一坐标表示为(b_bbox_x1,bbox_y1),第二坐标表示为(b_bbox_x2,b_bbox_y2)。
进而,第三坐标中横坐标表示为x1=max(a_bbox_x1,b_bbox_x1),第三坐标中纵坐标表示为y1=max(a_bbox_y1,b_bbox_y1);第四坐标中的横坐标表示为x2=min(a_bbox_x2,b_bbox_x2),第四坐标中纵坐标表示为y2=min(a_bbox_y2,b_bbox_y2)。
由此,得到第三坐标(x1,y1)以及第四坐标(x2,y2),基于此,在x2<x1并且y2<y1时,确定第三边界框和第四边界框未重叠;否则,确定第三边界框和第四边界框重叠。
步骤303、将重叠的第二边界框进行合并,得到第一边界框。
一些实施例中,在确定第三边界框与第四边界框发生重叠后,便可以确定二者为同一构件的图元。因此,将两个边界框进行合并,便可以得到该构件的第一边界框。
可以理解的是,在有多个第二边界框发生重叠时,可以先两两合并,再将合并得到的边界框再次合并,直至所有重叠的边框合并完毕,得到第一边界框;也可以将两个边界框合并后,再与其他边界框进行合并,直至所有重叠的边框合并完毕,得到第一边界框。
进一步的,一个可选实施例中,将重叠的第二边界框进行合并,得到第一边界框,可以采用以下步骤:
获取第三边界框中第一坐标的横坐标和第二坐标的横坐标、以及第四边界框中第一坐标的横坐标和第二坐标的横坐标的最小值,作为第一边界框的第五坐标的横坐标;
获取第三边界框中第一坐标的纵坐标和第二坐标的纵坐标,以及第四边界框中第一坐标的纵坐标和第二坐标的纵坐标的最小值,作为第一边界框的第五坐标的纵坐标;
获取第三边界框中第一坐标的横坐标和第二坐标的横坐标,以及第四边界框中第一坐标的横坐标和第二坐标的横坐标的最大值,作为第一边界框的第六坐标的横坐标;
获取第三边界框中第一坐标的纵坐标和第二坐标的纵坐标,以及第四边界框中第一坐标的纵坐标和第二坐标的纵坐标的最大值,作为第一边界框的第六坐标的纵坐标;
根据第五坐标和第六坐标,得到第一边界框。
基于上述相关实施例,在得到线段a和线段b的坐标后,便可以基于二者的坐标,确定第一边界框的坐标。具体的,第一边界框的第五坐标的横坐标为m_x1=min(a_bbox_x1,a_bbox_x1,b_bbox_x1,b_bbox_x2);第五坐标的纵坐标为m_y1=min(a_bbox_y1,a_bbox_y1,b_bbox_y1,b_bbox_y2),第六坐标的横坐标为m_x2=max(a_bbox_x1,a_bbox_x1,b_bbox_x1,b_bbox_x2),第六坐标的纵坐标为m_y2=max(a_bbox_y1,a_bbox_y1,b_bbox_y1,b_bbox_y2)。
步骤304、将第二界框作为构件的第一边界框。
一些实施例中,在图元的各第二边界框均未发生重叠时,直接将该图元的边界框作为该构件的第一边界框。
步骤203、将工程图纸转换为工程图像。
一些实施例中,将工程图纸转换为工程图像的方式有多种,示例性的,可以包括:将工程图纸进行打印,得到多个打印图像,并将打印图纸进行图层合并,图层合并之后,每一个构件都拥有完整的图元(在一个大的拼接边界框内),从而得到工程图像。其中,不同的打印图像为不同类型图层的图像。
步骤204、基于第一边界框对工程图像进行切割,得到各构件的构件图像,以通过构件图像进行分类。
一些实施例中,在得到工程图像后,将工程图像沿着每一个第一边界框进行切割,从而得到每个构件的构件图像。可以理解的是,对工程图像进行切割的方式有多种,具体可以采用相关技术中的切割方式,此处不再赘述。
进而,在得到构件图像后,便可以将各构件图像输入至神经网络模型中,从而通过神经网络模型对构件图像分类,以确定构件的类型。
在具体应用中,参照图6,由于各图元的大小不相同,因此,在得到的构件图像中,可能会由于图元过小,而使构件图像失真。
以工程图纸为CAD图纸为例,由于CAD图纸中的数据是矢量数据,但是CAD图纸的大小是不固定的,一般将CAD转换图片,采用的是固定的分辨率,而在CAD图纸图框中平面数据过大时候,过小的构件显示的不是足够大,导致图片只用了极少的像素来表示,导致构件小图失真,导致预处理流程中图片分类出错。
进一步的,一个可选实施例中,在得到构件图像后,还会判断构件图像的面积是否小于预设值;若是,根据第一边界框内的图元的基本信息,对构件进行绘制得到绘制图像,将绘制图像作为构件的构件图像。
一些实施例中,构件图像的面积可以为像素面积或几何面积。在切割得到的构件图像的面积小于预设值时,可以根据第一边界框内的图元的基本信息,对构件进行绘制得到绘制图像,将绘制图像作为构件的构件图像。
进一步的,在一个可选实施例中,基本信息还包括图元的图元类型,根据第一边界框内的图元的基本信息,对构件进行绘制得到绘制图像,包括:
获取预设大小的初始图像;
获取图元的空间坐标的缩放比;
将空间坐标按照缩放比进行缩放,得到目标空间坐标;
将图元按照目标空间坐标和图元的类型,映射至初始图像中,得到绘制图像。
一些实施例中,初始图像为空白图像,初始图像的预设大小可以根据实际情况进行设置,此处不做限定。例如,预设大小可以但不限于为长和宽为预设个数的像素或长和宽为预设长度,其中预设个数可以为8-20中的任意数值,预设长度可以但不限于2-5厘米中的任一数值。
其中,该缩放比可以采用以下方式得到:
Min(图元面积,num)=初始图像的面积;
缩放比scale=min((x2-x1),(y2-y1))/num。
可以理解的是,缩放比也可以根据实际情况进行设置,此处不做限定。
具体的,将图元按照目标空间坐标和图元的类型,映射至初始图像中,得到绘制图像。
其中,计算得到缩放比后,便可以基于该缩放比对图元的空间坐标进行缩放,将得到的目标空间坐标和图元的类型,映射到初始图像中,从而得到绘制图像。
示例性的,图元为线段,该图元的空间坐标为(line_x1,line_y1),(line_x2,line_y2),则其缩放后得到的目标空间坐标为(line_x1/scale,line_y1/scale),(line_x2/scale,line_y2/scale)。
目前工程图纸转为图片后分辨率通常为8400*11000,数据量为8400*11000*3,大约为两个多GB,过大的数据量大必然导致运算速度的缓慢。本申请中,采用上述实施例提供的工程图纸的预处理方法,在预处理过程中,不需要使用图片数据,极大节省了空间、时间,并且,相关技术中,在确定边界框时,采用的是利用opencv确定构件外轮廓,本申请中不需要调用软件算法,确定边界框只需要图元的坐标信息即可,确定过程简便并且结果准确。
另外,在对工程图纸的预处理过程中,不必将图纸转化为图片数据,直接采用工程图纸中的图元信息,对构件进行确定,并在确定构件的第一边框后,再绘制得到构件图像,避免了在确定构件过程中,由于图片数据过大导致的占用内存,耗费时间长的问题。
图7是根据本申请实施例的一种可选的工程图纸的预处理方法的流程示意图,如图7所示,该方法的流程可以包括以下步骤:
步骤701、提取工程图纸中图层的原始数据。
步骤702、提取单个图元的第二边界框。
步骤703、判断相邻的两个第二边界框是否相交,若是,执行步骤705,否则,执行步骤704。
步骤704、将相邻的两个第二边界框合并,得到第一边界框。
步骤705、将第二边界框作为构件的第一边界框。
步骤706、滤除长宽比不合适的第一边界框并结束。
图8是根据本申请实施例的一种可选的工程图纸的预处理方法的流程示意图,如图8所示,该方法的流程可以包括以下步骤:
步骤801、将工程图纸转换为工程图像;
步骤802、将各图层进行合并,得到构件图像。
步骤803、判断构件图像的面积是否大于预设值;若是,执行步骤805,否则,执行步骤804。
步骤804、根据第一边界框内的图元的基本信息,对构件进行绘制得到绘制图像。
步骤805、根据构件图像进行分类。
基于同一构思,本申请实施例中提供了一种工程图纸的预处理装置,该装置的具体实施可参见方法实施例部分的描述,重复之处不再赘述,如图9所示,该装置主要包括:
获取模块901,用于获取工程图纸中每个类别图层中的图元的基本信息,基本信息包括图元的空间坐标;
确定模块902,用于根据图元的空间坐标,确定每个类别图层中各构件的第一边界框;
转换模块903,用于将工程图纸转换为工程图像;
切割模块904,用于基于第一边界框对工程图像进行切割,得到各构件的构件图像,以通过构件图像进行分类。
基于同一构思,本申请实施例中还提供了一种电子设备,如图10所示,该电子设备主要包括:处理器1001、存储器1002和通信总线1003,其中,处理器1001和存储器1002通过通信总线1003完成相互间的通信。其中,存储器1002中存储有可被至处理器1001执行的程序,处理器1001执行存储器1002中存储的程序,实现如下步骤:
获取工程图纸中每个类别图层中的图元的基本信息,基本信息包括图元的空间坐标;
根据图元的空间坐标,确定每个类别图层中各构件的第一边界框;
将工程图纸转换为工程图像;
基于第一边界框对工程图像进行切割,得到各构件的构件图像,以通过构件图像进行分类。
上述电子设备中提到的通信总线1003可以时外设部件互连标准(PeripheralComponent Interconnect,简称PCI)总线或扩展工业标准结构(Extended IndustryStandard Architecture,简称EISA)总线等。该通信总线1003可以分为地址总线、数据总线、控制总线等。为便于表示,图10中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
存储器1002可以包括随机存取存储器(Random Access Memory,简称RAM),也可以包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。可选地,存储器还可以是至少一个位于远离前述处理器1001的存储装置。
上述的处理器1001可以是通用处理器,包括中央处理器(Central ProcessingUnit,简称CPU)、网络处理器(Network Processor,简称NP)等,还可以是数字信号处理器(Digital Signal Processing,简称DSP)、专用集成电路(Application SpecificIntegrated Circuit,简称ASIC)、现场可编程门阵列(Field-Programmable Gate Array,简称FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
在本申请的又一实施例中,还提供了一种计算机可读存储介质,该计算机可读存储介质中存储有计算机程序,当该计算机程序在计算机上运行时,使得计算机执行上述实施例中所描述的工程图纸的预处理方法。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。该计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行该计算机指令时,全部或部分地产生按照本申请实施例所述的流程或功能。该计算机可以时通用计算机、专用计算机、计算机网络或者其他可编程装置。该计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,计算机指令从一个网站站点、计算机、服务器或者数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、微波等)方式向另外一个网站站点、计算机、服务器或数据中心进行传输。该计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。该可用介质可以是磁性介质(例如软盘、硬盘、磁带等)、光介质(例如DVD)或者半导体介质(例如固态硬盘)等。
需要说明的是,在本文中,诸如“第一”和“第二”等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上所述仅是本发明的具体实施方式,使本领域技术人员能够理解或实现本发明。对这些实施例的多种修改对本领域的技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所申请的原理和新颖特点相一致的最宽的范围。

Claims (10)

1.一种工程图纸的预处理方法,其特征在于,包括:
获取工程图纸中每个类别图层中的图元的基本信息,所述基本信息包括图元的空间坐标;
根据所述图元的空间坐标,确定每个类别图层中各构件的第一边界框;
将所述工程图纸转换为工程图像;
基于所述第一边界框对所述工程图像进行切割,得到各所述构件的构件图像,以通过所述构件图像进行分类。
2.根据权利要求1所述的工程图纸的预处理方法,其特征在于,所述根据所述图元的空间坐标,确定每个类别图层中各构件的第一边界框,包括:
根据所述图元的空间坐标,得到所述图元的第二边界框;
判断所述类别图层中的各所述第二边界框之间是否重叠;
若重叠,将重叠的所述第二边界框进行合并,得到所述第一边界框;
若未重叠,将所述第二界框作为所述构件的所述第一边界框。
3.根据权利要求2所述的工程图纸的预处理方法,其特征在于,所述根据所述图元的空间坐标,得到所述图元的第二边界框,包括:
获取所述图元的所述空间坐标中各顶点的坐标;
将所述顶点坐标中横坐标的最小值和纵坐标的最小值,作为所述第二边界框的第一坐标;
将所述顶点坐标中横坐标的最大值和纵坐标的最大值,作为所述第二边界框的第二坐标;
根据所述第一坐标和所述第二坐标,绘制得到所述第二边界框。
4.根据权利要求3所述的工程图纸的预处理方法,其特征在于,所述判断所述类别图层中的各所述第二边界框之间是否重叠,包括:
获取各所述第二边界框的所述第一坐标和所述第二坐标;
根据第三边界框的第一坐标和第四边界框的第一坐标中,横坐标的最大值和纵坐标的最大值,得到第三坐标,所述第三边界框和所述第四边界框为相邻的两个第二边界框;
根据第三边界框的第二坐标和第四边界框的第二坐标中,横坐标的最小值和纵坐标的最小值,得到第四坐标;
若所述第四坐标的横坐标小于所述第三坐标的横坐标,并且,所述第四坐标的纵坐标小于所述第三坐标的纵坐标,确定所述第三边界框和所述第四边界框未重叠;
否则,确定所述第三边界框和所述第四边界框重叠。
5.根据权利要求4所述的工程图纸的预处理方法,其特征在于,所述将重叠的所述第二边界框进行合并,得到所述第一边界框,包括:
获取所述第三边界框中第一坐标的横坐标和第二坐标的横坐标、以及第四边界框中第一坐标的横坐标和第二坐标的横坐标的最小值,作为所述第一边界框的第五坐标的横坐标;
获取所述第三边界框中第一坐标的纵坐标和第二坐标的纵坐标,以及第四边界框中第一坐标的纵坐标和第二坐标的纵坐标的最小值,作为所述第一边界框的第五坐标的纵坐标;
获取所述第三边界框中第一坐标的横坐标和第二坐标的横坐标,以及第四边界框中第一坐标的横坐标和第二坐标的横坐标的最大值,作为所述第一边界框的第六坐标的横坐标;
获取所述第三边界框中第一坐标的纵坐标和第二坐标的纵坐标,以及第四边界框中第一坐标的纵坐标和第二坐标的纵坐标的最大值,作为所述第一边界框的第六坐标的纵坐标;
根据所述第五坐标和所述第六坐标,得到所述第一边界框。
6.根据权利要求1所述的工程图纸的预处理方法,其特征在于,所述得到各所述构件的构件图像之后,还包括:
判断所述构件图像的面积是否小于预设值;
若是,根据所述第一边界框内的图元的基本信息,对所述构件进行绘制得到绘制图像,将所述绘制图像作为所述构件的构件图像。
7.根据权利要求6所述的工程图纸的预处理方法,其特征在于,所述基本信息还包括所述图元的图元类型,所述根据所述第一边界框内的图元的基本信息,对所述构件进行绘制得到绘制图像,包括:
获取预设大小的初始图像;
获取所述图元的空间坐标的缩放比;
将所述空间坐标按照所述缩放比进行缩放,得到目标空间坐标;
将所述图元按照所述目标空间坐标和所述图元的类型,映射至所述初始图像中,得到所述绘制图像。
8.一种工程图纸的预处理装置,其特征在于,包括:
获取模块,用于获取工程图纸中每个类别图层中的图元的基本信息,所述基本信息包括图元的空间坐标;
确定模块,用于根据所述图元的空间坐标,确定每个类别图层中各构件的第一边界框;
转换模块,用于将所述工程图纸转换为工程图像;
切割模块,用于基于所述第一边界框对所述工程图像进行切割,得到各所述构件的构件图像,以通过所述构件图像进行分类。
9.一种电子设备,其特征在于,包括:处理器、通信接口、存储器和通信总线,其中,处理器、通信接口和存储器通过通信总线完成相互间的通信;
所述存储器,用于存储计算机程序;
所述处理器,用于执行所述存储器中所存储的程序,实现权利要求1-7任一项所述的工程图纸的预处理方法。
10.一种计算机可读存储介质,存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1-7任一项所述的工程图纸的预处理方法。
CN202110447806.5A 2021-04-25 2021-04-25 工程图纸的预处理方法、装置、电子设备和存储介质 Active CN113205024B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110447806.5A CN113205024B (zh) 2021-04-25 2021-04-25 工程图纸的预处理方法、装置、电子设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110447806.5A CN113205024B (zh) 2021-04-25 2021-04-25 工程图纸的预处理方法、装置、电子设备和存储介质

Publications (2)

Publication Number Publication Date
CN113205024A true CN113205024A (zh) 2021-08-03
CN113205024B CN113205024B (zh) 2023-01-10

Family

ID=77028470

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110447806.5A Active CN113205024B (zh) 2021-04-25 2021-04-25 工程图纸的预处理方法、装置、电子设备和存储介质

Country Status (1)

Country Link
CN (1) CN113205024B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113763338A (zh) * 2021-08-24 2021-12-07 合肥欣奕华智能机器有限公司 一种面板的缺陷检测方法、装置及存储介质
CN113780190A (zh) * 2021-09-14 2021-12-10 万翼科技有限公司 空间轮廓识别及空间检测模型构建方法、设备及存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101673410A (zh) * 2008-09-12 2010-03-17 中国科学院计算技术研究所 一种基于矢量建筑图纸重建三维模型的方法
EP3147885A1 (en) * 2015-09-28 2017-03-29 The Boeing Company Automated aircraft intent generation process based on specifications expressed in formal languages
CN107506391A (zh) * 2017-07-28 2017-12-22 上海网罗电子科技有限公司 一种提取cad图纸信息至室内地图的方法
CN111782584A (zh) * 2020-06-15 2020-10-16 万翼科技有限公司 建筑图纸预处理系统、方法、电子设备及存储介质

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101673410A (zh) * 2008-09-12 2010-03-17 中国科学院计算技术研究所 一种基于矢量建筑图纸重建三维模型的方法
EP3147885A1 (en) * 2015-09-28 2017-03-29 The Boeing Company Automated aircraft intent generation process based on specifications expressed in formal languages
CN107506391A (zh) * 2017-07-28 2017-12-22 上海网罗电子科技有限公司 一种提取cad图纸信息至室内地图的方法
CN111782584A (zh) * 2020-06-15 2020-10-16 万翼科技有限公司 建筑图纸预处理系统、方法、电子设备及存储介质

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
S. SHIMOTSUJI ET AL: "Engineering drawing recognition based on a line decomposition and re-composition method", 《IEEE INTERNATIONAL CONFERENCE ON SYSTEMS ENGINEERING》 *
章斌全: "基于四叉树的平面矢量图对比方法优化", 《电脑开发与应用》 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113763338A (zh) * 2021-08-24 2021-12-07 合肥欣奕华智能机器有限公司 一种面板的缺陷检测方法、装置及存储介质
CN113780190A (zh) * 2021-09-14 2021-12-10 万翼科技有限公司 空间轮廓识别及空间检测模型构建方法、设备及存储介质

Also Published As

Publication number Publication date
CN113205024B (zh) 2023-01-10

Similar Documents

Publication Publication Date Title
CN112348815B (zh) 图像处理方法、图像处理装置以及非瞬时性存储介质
CN108446698B (zh) 在图像中检测文本的方法、装置、介质及电子设备
US8749587B2 (en) System and method for content based automatic zooming for document viewing on small displays
US8000529B2 (en) System and method for creating an editable template from a document image
CN109771951B (zh) 游戏地图生成的方法、装置、存储介质和电子设备
CN113205024B (zh) 工程图纸的预处理方法、装置、电子设备和存储介质
US11314400B2 (en) Unified digital content selection system for vector and raster graphics
US20110097011A1 (en) Multi-resolution image editing
CN111027554B (zh) 商品价签文字精确检测定位系统及定位方法
EP4322109A1 (en) Green screen matting method and apparatus, and electronic device
WO2023019995A1 (zh) 训练方法、译文展示方法、装置、电子设备以及存储介质
CN115861609A (zh) 遥感图像的分割标注方法、电子设备及存储介质
US20230162413A1 (en) Stroke-Guided Sketch Vectorization
CN114445844A (zh) 板构件识别方法、装置、设备及存储介质
CN113033715B (zh) 目标检测模型训练方法和目标车辆检测信息生成方法
CN113762235A (zh) 检测页面叠加区域的方法和装置
CN111612838A (zh) 一种图像获取方法、装置及电子设备
CN115661851A (zh) 获取样本数据及构件识别方法及电子设备
CN116385859A (zh) 图元识别方法、装置、计算机设备及其介质
CN115756471A (zh) 一种页面代码生成方法、装置、电子设备及存储介质
CN110825989A (zh) 图片展示方法、装置、电子设备及可读介质
CN114283186A (zh) 工程图纸中对象识别方法、装置、电子设备和存储介质
US11232613B1 (en) Curve antialiasing based on curve-pixel intersection
JP2008158847A (ja) 画像配信装置および画像配信方法
CN113554882A (zh) 用于输出信息的方法、装置、设备以及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant