CN116935430A

CN116935430A - 图框识别方法、装置、电子设备和存储介质

Info

Publication number: CN116935430A
Application number: CN202310803078.6A
Authority: CN
Inventors: 王宇涵; 刘绍福; 袁松岭
Original assignee: Shenzhen Wanyi Digital Technology Co ltd
Current assignee: Shenzhen Wanyi Digital Technology Co ltd
Priority date: 2023-06-30
Filing date: 2023-06-30
Publication date: 2023-10-24

Abstract

本申请涉及一种图框识别方法、装置、电子设备和存储介质，应用于计算机技术领域，其中，方法包括：获取图纸中的图元信息，所述图元信息包括线段信息和文本信息；对所述线段信息对线段进行整合，得到目标线段信息；基于所述目标线段信息对所述图纸中的闭合矩形进行提取，得到至少一个矩形框；获取每个所述矩形框的属性信息；基于所述文本信息和/或所述属性信息，对每个所述矩形框进行筛选，得到图框。以解决现有技术中，对图框的识别精度不高的问题。

Description

图框识别方法、装置、电子设备和存储介质

技术领域

本申请涉及计算机技术领域，尤其涉及一种图框识别方法、装置、电子设备和存储介质。

背景技术

图框，是指工程制图中图纸上限定绘图区域的线框。

现有的一些图框识别方法，大多基于分析DWG图纸中是否存在封闭矩形以及封闭矩形的边长是否和标准的图框尺寸相符等一些技术来实现的。

然而，上述识别方法的识别结果容易出现异常，比如设计师画的草图只是套了个矩形就被识别成了图框，或者图框外面随便画了一个矩形就把内部有效图框过滤掉。这种情况下识别出的图框往往是一系列嵌套矩形外包围最大的一个矩形，这种矩形经常只是干扰或者辅助线段，而非真正意义上的图框。从而，造成了图框的识别精度不高。

发明内容

本申请提供了一种图框识别方法、装置、电子设备和存储介质，用以解决现有技术中，对图框的识别精度不高的问题。

第一方面，本申请实施例提供了一种图框识别方法，包括：

获取图纸中的图元信息，所述图元信息包括线段信息和文本信息；

对所述线段信息对线段进行整合，得到目标线段信息；

基于所述目标线段信息对所述图纸中的闭合矩形进行提取，得到至少一个矩形框；

获取每个所述矩形框的属性信息；

基于所述文本信息和/或所述属性信息，对每个所述矩形框进行筛选，得到图框。

可选的，所述对所述线段信息进行整合，得到目标线段信息，包括：

基于所述线段信息判断任意两线段是否相对重合；

若重合，将重合的所述两线段一端的第一端点合并，以使所述两线段合并，得到所述目标线段信息；和/或，

基于所述线段信息判断任意两线段的第二端点之间的距离是否在预设范围内；

若是，将所述第二端点合并，得到所述目标线段信息。

可选的，所述基于所述目标线段信息对所述图纸中的闭合矩形进行提取，得到至少一个矩形框，包括：

根据所述目标线段信息，确定相交的候选线段；

确定首尾相连的四条所述候选选段构成的形状为所述矩形框。

可选的，所述属性信息包括：所述矩形框的面积、所述矩形框的短边长长度。

可选的，基于所述文本信息，对每个所述矩形框进行筛选，得到图框，包括：

对每个所述矩形框内的所述文本信息进行属性分类得到至少一个分类类别；

若所述分类类别的数量小于第一预设阈值，将所述矩形框过滤；

若所述分类类别的数量不小于所述第一预设阈值，将所述矩形框作为所述图框；

可选的，所述属性信息包括所述矩形框的面积，基于所述属性信息，对每个所述矩形框进行筛选，得到图框，包括：

基于所述矩形框的面积，确定任意两矩形框的面积的重叠面积；

计算所述重叠面积与第一矩形框的面积的面积比，所述第一矩形框为所述两矩形框中面积较小的矩形框；

若所述面积比大于第二预设阈值，将所述第一矩形框过滤。

可选的，所述属性信息包括所述矩形框的短边长长度，所述文本信息包括字体大小，所述基于所述文本信息和/或所述属性信息，对每个所述矩形框进行筛选，得到图框，包括：

计算每个所述矩形框中，所述字体大小与所述短边长长度的比值；

筛选所述比值不在预设范围内的矩形框，得到所述图框。

第二方面，本申请实施例提供了一种图框识别装置，包括：

第一获取模块，用于获取图纸中的图元信息，所述图元信息包括线段信息和文本信息；

整合模块，用于对所述线段信息对线段进行整合，得到目标线段信息；

提取模块，用于基于所述目标线段信息对所述图纸中的闭合矩形进行提取，得到至少一个矩形框；

第二获取模块，用于获取每个所述矩形框的属性信息；

筛选模块，用于基于所述文本信息和/或所述属性信息，对每个所述矩形框进行筛选，得到图框。

第三方面，本申请实施例提供了一种电子设备，包括：处理器、通信接口、存储器和通信总线，其中，处理器、通信接口和存储器通过通信总线完成相互间的通信；

所述存储器，用于存储计算机程序；

所述处理器，用于执行所述存储器中所存储的程序，实现第一方面所述的图框识别方法。

第四方面，本申请实施例提供了一种计算机可读存储介质，存储有计算机程序，所述计算机程序被处理器执行时实现第一方面所述的图框识别方法。

本申请实施例提供的上述技术方案与现有技术相比具有如下优点：本申请实施例提供的该方法，通过获取图纸中的图元信息，所述图元信息包括线段信息和文本信息；对所述线段信息对线段进行整合，得到目标线段信息；基于所述目标线段信息对所述图纸中的闭合矩形进行提取，得到至少一个矩形框；获取每个所述矩形框的属性信息；基于所述文本信息和/或所述属性信息，对每个所述矩形框进行筛选，得到图框。如此，通过对图纸中的线段信息进行整合，使图纸中的线段更加规范，提高了图纸识别准确度，通过对图纸中矩形框的筛选，得到图框，从而滤除了不属于图框的矩形框，提高了图框的识别精度。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分，示出了符合本发明的实施例，并与说明书一起用于解释本发明的原理。

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，对于本领域普通技术人员而言，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1为本申请一实施例提供的图框识别方法的应用场景图；

图2为本申请一实施例提供的图框识别方法的流程图；

图3为本申请一实施例提供的图框识别装置的结构图；

图4为本申请一实施例提供的电子设备的结构图。

具体实施方式

为使本申请实施例的目的、技术方案和优点更加清楚，下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本申请的一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例，都属于本申请保护的范围。

在对本发明实施例进行进一步详细说明之前，对本发明实施例中涉及的名词和术语进行说明，本发明实施例中涉及的名词和术语适用于如下的解释。

图框的实际特征，是包围着有效结构信息(线段、建筑结构、文本说明)的特殊矩形，并且存在重要的属性信息(图纸的图名、图号)。同时，由于实际使用过程中，最终都会经过一个线下的纸质打印、出图、装订成册的环节，所以图纸上的重要信息，都会符合人的认知习惯：图框内内容在纸张上要有一个合适的分辨率，重要信息都肉眼可见，不可以出现模糊的情况，关键属性如图名、图号、签名的字体大小都有比较明确的限制，以保证在图纸上足够显眼。因此，图框大小和内部关键信息的字体大小之间，会有一个很强的相关性，这种相关性可以避免一些过大的干扰框被识别为有效图框，也可以避免一些没有足够多有效文本信息的结构被识别为有效图框。

根据本申请一实施例提供了一种图框识别方法。可选地，在本申请实施例中，上述图框识别方法可以应用于如图1所示的由终端101和服务器102所构成的硬件环境中。如图1所示，服务器102通过网络与终端101进行连接，可用于为终端或终端上安装的客户端提供服务(如应用服务等)，可在服务器上或独立于服务器设置数据库，用于为服务器102提供数据存储服务，上述网络包括但不限于：广域网、城域网或局域网，终端101并不限定于PC、手机、平板电脑等。

本申请实施例的图框识别方法可以由服务器102来执行，也可以由终端101来执行，还可以是由服务器102和终端101共同执行。其中，终端101执行本申请实施例的图框识别方法，也可以是由安装在其上的客户端来执行。

以终端执行本申请实施例的图框识别方法为例，图2是根据本申请实施例的一种可选的图框识别方法的流程示意图，如图2所示，该方法的流程可以包括以下步骤：

步骤201、获取图纸中的图元信息，所述图元信息包括线段信息和文本信息；

步骤202、对所述线段信息对线段进行整合，得到目标线段信息；

步骤203、基于所述目标线段信息对所述图纸中的闭合矩形进行提取，得到至少一个矩形框；

步骤204、获取每个所述矩形框的属性信息；

步骤205、基于所述文本信息和/或所述属性信息，对每个所述矩形框进行筛选，得到图框。

一些实施例中，通过通过对图纸中的线段信息进行整合，使图纸中的线段更加规范，提高了图纸识别准确度，通过对图纸中矩形框的筛选，得到图框，从而滤除了不属于图框的矩形框，提高了图框的识别精度。

在一个可选实施例中，所述对所述线段信息进行整合，得到目标线段信息，包括：

基于所述线段信息判断任意两线段是否相对重合；

若是，将所述第二端点合并，得到所述目标线段信息。

一些实施例中，对于线段信息进行一些规范和纠错处理：

首先，要进行线段纠错，因为CAD原始线段中可能存在未及点，看似相交实则未相交的交点，重复的线段等问题。对共线且存在部分重叠的直线进行合并处理，通过阈值(例如可以是0.5度)来控制共线角度差异。

其次，计算垂直相交的线段是否在相交点存在误差，对一定阈值(例如可以是0.001米)范围内的相交误差进行直线的延伸或者截断处理。

最后，将距离接近的端点进行合并。

在一个可选实施例中，所述基于所述目标线段信息对所述图纸中的闭合矩形进行提取，得到至少一个矩形框，包括：

根据所述目标线段信息，确定相交的候选线段；

一些实施例中，利用纠正后的线段信息进行矩形框提取，将首尾相连且可以构成矩形的候选线段进行配对，得到一系列闭合矩形即矩形框。其中，可以采用最小闭合多边形算法进行闭合矩形识别。

在一个可选实施例中，所述属性信息包括：所述矩形框的面积、所述矩形框的短边长长度。

在一个可选实施例中，基于所述文本信息，对每个所述矩形框进行筛选，得到图框，包括：

在一个可选实施例中，所述属性信息包括所述矩形框的面积，基于所述属性信息，对每个所述矩形框进行筛选，得到图框，包括：

若所述面积比大于第二预设阈值，将所述第一矩形框过滤。

在一个可选实施例中，所述属性信息包括所述矩形框的短边长长度，所述文本信息包括字体大小，所述基于所述文本信息和/或所述属性信息，对每个所述矩形框进行筛选，得到图框，包括：

筛选所述比值不在预设范围内的矩形框，得到所述图框。

一些实施例中，对于矩形框的筛选可以通过如下方式得到。

第一种：对于闭合矩形进行初步筛选，统计每个矩形内部文本数量，因有效图框内都存在大量描述性信息，不会存在文本数量过少的图框，因此，将文本数量小于阈值10的矩形进行剔除。

第二种：对于闭合矩形内的关键属性信息进行识别，可以使用bert+mlp分类器(也可以选择rnn、lstm、gpt等模型)的方法对矩形内的文本进行类型判断，找到图名、图号、专业、子项、项目名称、工程名称、公司名称等属性。因图框需要关键信息以用于索引和其他使用，因此重要内容不会完全缺失，若大量缺失则图框无法使用。基于此，若图框内重要属性缺失过多(例如缺失3个以上)，则判断为无效。

第三种：若字体过小则实际打印后看不清关键信息，若字体过大则图签栏放不下关键信息。通过计算每个矩形框中，关键属性字体大小和图框短边长度的相对比例，使用人比较习惯的打印图纸和关键信息字体外接矩形大小的相关比例范围进行筛选，将50～200倍比例范围内的图框进行保留。此举可以避免现有其他识别方法中正常图框外部额外的大矩形框带来的干扰，也可以避免正常图框内部部分异常矩形的干扰，同时具有很高的安全性。

第四种：对存在嵌套关系的矩形框进行一步筛选，去除面积重叠比例(例如，可以是0.7)较高的矩形框对中较小的一个。如此，可以用来去除部分图框内同时存在的内框和外框造成的重复干扰。

可以理解的是，在实际应用时，可以采用上述四种筛选方式中的任一一种或几种的组合。

本申请的图框识别方法，不会过分依赖某一单独的步骤，每个环节都是一个弱分类器，保证筛除的一定是错误的图框，通过多个弱分类器级联来获得更好的准确率。文本数量筛选单独使用会漏掉一部分错误图框，重要属性筛选也无法去除嵌套错误，嵌套关系筛选以及文本与矩形框相对大小筛选也都无法完全去除错误，但是同时能逃过所有筛除步骤的错误图框出现几率趋近于0。单一强分类器虽然能保证错误图框一定被筛除，但却无法保证正确图框不被错删。

基于同一构思，本申请实施例中提供了一种图框识别装置，该装置的具体实施可参见方法实施例部分的描述，重复之处不再赘述，如图3所示，该装置主要包括：

第一获取模块301，用于获取图纸中的图元信息，所述图元信息包括线段信息和文本信息；

整合模块302，用于对所述线段信息对线段进行整合，得到目标线段信息；

提取模块303，用于基于所述目标线段信息对所述图纸中的闭合矩形进行提取，得到至少一个矩形框；

第二获取模块304，用于获取每个所述矩形框的属性信息；

筛选模块305，用于基于所述文本信息和/或所述属性信息，对每个所述矩形框进行筛选，得到图框。

基于同一构思，本申请实施例中还提供了一种电子设备，如图4所示，该电子设备主要包括：处理器401、存储器402和通信总线403，其中，处理器401和存储器402通过通信总线403完成相互间的通信。其中，存储器402中存储有可被处理器401执行的程序，处理器401执行存储器402中存储的程序，实现如下步骤：

对所述线段信息对线段进行整合，得到目标线段信息；

获取每个所述矩形框的属性信息；

上述电子设备中提到的通信总线403可以是外设部件互连标准(PeripheralComponent Interconnect，简称PCI)总线或扩展工业标准结构(Extended IndustryStandard Architecture，简称EISA)总线等。该通信总线403可以分为地址总线、数据总线、控制总线等。为便于表示，图4中仅用一条粗线表示，但并不表示仅有一根总线或一种类型的总线。

存储器402可以包括随机存取存储器(Random Access Memory，简称RAM)，也可以包括非易失性存储器(non-volatile memory)，例如至少一个磁盘存储器。可选地，存储器还可以是至少一个位于远离前述处理器401的存储装置。

上述的处理器401可以是通用处理器，包括中央处理器(Central ProcessingUnit，简称CPU)、网络处理器(Network Processor，简称NP)等，还可以是数字信号处理器(Digital Signal Processing，简称DSP)、专用集成电路(Application SpecificIntegrated Circuit，简称ASIC)、现场可编程门阵列(Field-Programmable Gate Array，简称FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。

在本申请的又一实施例中，还提供了一种计算机可读存储介质，该计算机可读存储介质中存储有计算机程序，当该计算机程序在计算机上运行时，使得计算机执行上述实施例中所描述的图框识别方法。

在上述实施例中，可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时，可以全部或部分地以计算机程序产品的形式实现。该计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行该计算机指令时，全部或部分地产生按照本申请实施例所述的流程或功能。该计算机可以是通用计算机、专用计算机、计算机网络或者其他可编程装置。该计算机指令可以存储在计算机可读存储介质中，或者从一个计算机可读存储介质向另一个计算机可读存储介质传输，例如，计算机指令从一个网站站点、计算机、服务器或者数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、微波等)方式向另外一个网站站点、计算机、服务器或数据中心进行传输。该计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。该可用介质可以是磁性介质(例如软盘、硬盘、磁带等)、光介质(例如DVD)或者半导体介质(例如固态硬盘)等。

需要说明的是，在本文中，诸如“第一”和“第二”等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

以上所述仅是本发明的具体实施方式，使本领域技术人员能够理解或实现本发明。对这些实施例的多种修改对本领域的技术人员来说将是显而易见的，本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下，在其它实施例中实现。因此，本发明将不会被限制于本文所示的这些实施例，而是要符合与本文所申请的原理和新颖特点相一致的最宽的范围。

Claims

1.一种图框识别方法，其特征在于，包括：

对所述线段信息对线段进行整合，得到目标线段信息；

获取每个所述矩形框的属性信息；

2.根据权利要求1所述的图框识别方法，其特征在于，所述对所述线段信息进行整合，得到目标线段信息，包括：

基于所述线段信息判断任意两线段是否相对重合；

若是，将所述第二端点合并，得到所述目标线段信息。

3.根据权利要求1所述的图框识别方法，其特征在于，所述基于所述目标线段信息对所述图纸中的闭合矩形进行提取，得到至少一个矩形框，包括：

根据所述目标线段信息，确定相交的候选线段；

4.根据权利要求1所述的图框识别方法，其特征在于，所述属性信息包括：所述矩形框的面积、所述矩形框的短边长长度。

5.根据权利要求1所述的图框识别方法，其特征在于，基于所述文本信息，对每个所述矩形框进行筛选，得到图框，包括：

若所述分类类别的数量不小于所述第一预设阈值，将所述矩形框作为所述图框。

6.根据权利要求1或4所述的图框识别方法，其特征在于，所述属性信息包括所述矩形框的面积，基于所述属性信息，对每个所述矩形框进行筛选，得到图框，包括：

若所述面积比大于第二预设阈值，将所述第一矩形框过滤。

7.根据权利要求1或4所述的图框识别方法，其特征在于，所述属性信息包括所述矩形框的短边长长度，所述文本信息包括字体大小，所述基于所述文本信息和/或所述属性信息，对每个所述矩形框进行筛选，得到图框，包括：

筛选所述比值不在预设范围内的矩形框，得到所述图框。

8.一种图框识别装置，其特征在于，包括：

第二获取模块，用于获取每个所述矩形框的属性信息；

9.一种电子设备，其特征在于，包括：处理器、通信接口、存储器和通信总线，其中，处理器、通信接口和存储器通过通信总线完成相互间的通信；

所述存储器，用于存储计算机程序；

所述处理器，用于执行所述存储器中所存储的程序，实现权利要求1-7任一项所述的图框识别方法。

10.一种计算机可读存储介质，存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现权利要求1-7任一项所述的图框识别方法。