CN114722440A - Cad文件数据提取识别、检查方法、系统、设备及存储介质 - Google Patents
Cad文件数据提取识别、检查方法、系统、设备及存储介质 Download PDFInfo
- Publication number
- CN114722440A CN114722440A CN202210352038.XA CN202210352038A CN114722440A CN 114722440 A CN114722440 A CN 114722440A CN 202210352038 A CN202210352038 A CN 202210352038A CN 114722440 A CN114722440 A CN 114722440A
- Authority
- CN
- China
- Prior art keywords
- equipment
- graph
- type
- cad file
- matched
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 53
- 238000013075 data extraction Methods 0.000 title claims abstract description 41
- 238000007689 inspection Methods 0.000 title claims abstract description 15
- 238000012216 screening Methods 0.000 claims description 16
- 238000004590 computer program Methods 0.000 claims description 12
- 238000000605 extraction Methods 0.000 claims description 8
- 238000010586 diagram Methods 0.000 description 4
- 239000003086 colorant Substances 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000011960 computer-aided design Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F30/00—Computer-aided design [CAD]
- G06F30/10—Geometric CAD
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/284—Lexical analysis, e.g. tokenisation or collocates
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/30—Computing systems specially adapted for manufacturing
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Geometry (AREA)
- Artificial Intelligence (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Health & Medical Sciences (AREA)
- Bioinformatics & Computational Biology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Computational Mathematics (AREA)
- Evolutionary Biology (AREA)
- Mathematical Analysis (AREA)
- Mathematical Optimization (AREA)
- Pure & Applied Mathematics (AREA)
- Computer Hardware Design (AREA)
- Image Analysis (AREA)
Abstract
本发明涉及一种CAD文件数据提取识别、检查方法、系统、设备及存储介质,CAD文件包括设备图形和设备标注,其方法包括;提取CAD文件中的设备图形;识别所提取的设备图形的设备类型;根据预设的规则,判断所识别的设备类型是属于第一类型或第二类型,根据设备类型所属是第一类型或是第二类型,采用不同的方法将设备图形与其对应的设备标注进行。本发明可以解决如何快捷地从CAD数据中提取识别设备图形和设备标注,并将两者关联的问题,实现批量化、高效化的CAD文件数据提取识别。
Description
技术领域
本发明涉及计算机辅助设计图形领域,更具体地,涉及一种CAD文件数据提取识别、检查方法、系统、设备及存储介质。
背景技术
将存量的CAD图纸进行提取识别和系统化整理,是发展数字化的重要支撑。数字化技术可以提高数据价值,以数据作为核心生产要素,搭建数字化平台。
由于CAD图纸编制随机性强、数据体量大,而且图形有着不同的样式,其中不乏有块(多个图形的组合组件)、多段线形成的多边形、多条散线组合成的多边形,目前对于CAD数据提取的方法乏善可陈。
现有的CAD数据提取方法主要是对于CAD数据整理、录入创造的一套规则,然后通过人工调整来提取符合规则的各种文本、图形数据,为保证准确性,该过程仍需要安排人力一一核对,再通过识别软件的方式提取CAD数据。重复单一的数据提取工作占据了人员的大量工作时间,且由于相关数据的规则缺乏明确统一的标准,更使人工提取数据的难度加大、成本激增。
发明内容
针对上述问题,本发明提出了一种CAD文件数据提取识别、检查方法、系统、设备及存储介质,用于解决如何快捷地从CAD数据中提取识别设备图形和设备标注,并将两者关联的问题。
本发明第一方面提供一种CAD文件数据提取识别方法,所述CAD文件包括设备图形和设备标注,所述识别方法包括:
提取所述CAD文件中的设备图形;
识别所提取的所述设备图形的设备类型;
根据预设的规则,判断所识别的所述设备类型是属于第一类型或第二类型;
当所识别的所述设备类型属于第一类型时:
在所述CAD文件中以所述设备图形为中心,形成一内径为a、外径为b的环形区域,a≥0,b≥0;
根据预设的设备类型与关键词的对应关系,确定识别的所述设备类型对应的关键词;
根据确定的所述关键词,在所述环形区域查找匹配所述关键词的设备标注;
在匹配所述关键词的设备标注中,筛选出与识别的所述设备图形距离最小的设备标注,将筛选出的所述设备标注关联所识别的所述设备图形,得到关联信息;
当所识别的所述设备类型属于第二类型时:
在所述CAD文件中以所述设备图形为中心,形成一半径为x的设备面域,并以所述设备图形为中心,形成一半径为x+y的描述面域,x≥0,y≥0;
将所述设备面域中各设备图形与所述描述面域中各设备标注进行匹配组合;
计算不同匹配组合下各设备图形与匹配的设备标注之间的距离之和;
将所述距离之和最小的匹配组合作为最优组合,将识别的所述设备图形关联在所述最优组合中所匹配的设备标注,得到关联信息。
可选地,在形成一半径为x的设备面域之后,形成一半径为x+y的描述面域之前,所述方法还包括:
判断所述设备面域是否存在与提取的所述设备图形,设备类型相同的其它设备图形;
若存在,则保持x的取值不变;
若不存在,则将x的取值增大,扩大所述设备面域,判断扩大后的所述设备面域是否新增与提取的所述设备图形,设备类型相同的其它设备图形;
若有新增,则将x的取值增大,扩大所述设备面域,继续判断扩大后的所述设备面域是否新增与提取的所述设备图形,设备类型相同的其它设备图形,直至无新增为止;
若无新增,则保持x的取值不变。
可选地,识别所提取的所述设备图形的设备类型,包括:
根据预设的元素库,所述元素库包括多个设备类型以及每个所述设备类型对应的图例样式,将提取的所述设备图形匹配所述元素库中的图例样式,将匹配的所述图例样式对应的设备类型作为所述设备图形的设备类型。
可选地,识别所提取的所述设备图形的设备类型,包括:
判断所述设备图形是否为块;
若是,则提取所述设备图形的块名称,根据预设的元素库,所述元素库包括多个设备类型以及每个所述设备类型对应的图例样式,将提取的所述块名称匹配所述元素库中的设备类型,将匹配的所述设备类型作为所述设备图形的设备类型;
若否,则根据所述元素库,将提取的所述设备图形匹配所述元素库中的图例样式,将匹配的所述图例样式对应的设备类型作为所述设备图形的设备类型。
可选地,将提取的所述设备图形匹配所述元素库中的图例样式,包括:
将提取的所述设备图形匹配所述元素库中的图例样式,得到初步匹配的图例样式;
根据提取的所述设备图形的几何特征,在初步匹配的图例样式中筛选出最终匹配的图例样式。
可选地,所述几何特征包括周长、面积、边长、相对距离的一种或多种。
本发明第二方面提供一种CAD文件数据提取检查方法,包括如上所述的CAD文件数据提取识别方法,在得到关联信息之后,所述检查方法还包括:
根据所述关联信息,采用直线连接相互关联的所述设备图形和所述设备标注;
和/或,
根据所述关联信息,将已关联的所述设备图形和所述设备标注的颜色修改为灰色。
本发明第三方面提供一种CAD文件数据提取识别系统,所述CAD文件包括设备图形和设备标注,所述系统包括:
图形提取模块,用于提取所述CAD文件中的设备图形;
类型识别模块,用于识别所述图形提取模块所提取的所述设备图形的设备类型;
类型判断模块,用于根据预设的规则,判断所述类型识别模块所识别的所述设备类型是属于第一类型或第二类型;
第一关联模块,用于当所述类型判断模块判定所识别的所述设备类型属于第一类型时:
在所述CAD文件中以所述设备图形为中心,形成一内径为a、外径为b的环形区域,a≥0,b≥0;
根据预设的设备类型与关键词的对应关系,确定识别的所述设备类型对应的关键词;
根据确定的所述关键词,在所述环形区域查找匹配所述关键词的设备标注;
在匹配所述关键词的设备标注中,筛选出与识别的所述设备图形距离最小的设备标注,将筛选出的所述设备标注关联所识别的所述设备图形,得到关联信息;
第二关联模块,用于当所述类型判断模块判定所所识别的所述设备类型属于第二类型时:
在所述CAD文件中以所述设备图形为中心,形成一半径为x的设备面域,并以所述设备图形为中心,形成一半径为x+y的描述面域,x≥0,y≥0;
将所述设备面域中各设备图形与所述描述面域中各设备标注进行匹配组合;
计算不同匹配组合下各设备图形与匹配的设备标注之间的距离之和;
将所述距离之和最小的匹配组合作为最优组合,将识别的所述设备图形关联在所述最优组合中所匹配的设备标注,得到关联信息。
本发明第四方面提供一种计算机设备,包括存储器和处理器,存储器存储有计算机程序,所述处理器执行计算机程序时实现如上所述的CAD文件数据提取识别方法。
本发明第五方面提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如上所述的CAD文件数据提取识别方法。
与现有技术相比,本发明的有益效果为:可以智能便捷地提取识别设备图形、设备标注并将设备图形与对应的设备标注关联起来,替代识别提取CAD数据的人工机械重复工作,降低了人工搬运数据的出错率,节省了大量的人力成本和时间成本,实现批量化、高效化的CAD文件数据提取识别。
附图说明
图1是实施例1的一种CAD文件数据提取识别方法流程示意图。
图2是实施例1步骤S120识别所提取的设备图形的设备类型的流程示意图。
图3是实施例2步骤S120识别所提取的设备图形的设备类型的流程示意图。
图4是实施例3的一种CAD文件数据提取检查方法流程示意图。
图5是实施例4的一种CAD文件数据提取识别系统组成示意图。
图6是实施例4类型识别模块的组成示意图。
具体实施方式
在以下优选的实施例的具体描述中,将参考构成本发明一部分的所附的附图。所附的附图通过示例的方式示出了能够实现本发明的特定的实施例。示例的实施例并不旨在穷尽根据本发明的所有实施例。在不偏离本发明的范围的前提下,可以利用其他实施例,也可以进行结构性或者逻辑性的修改。应当理解,给出这些示例性实施例仅是为了使本领域技术人员能够更好地理解进而实现本发明的实施例,而并非以任何方式限制发明的范围。
对于相关领域普通技术人员已知的技术、方法和设备可能不作详细讨论,但在适当情况下,所述技术、方法和设备应当被视为说明书的一部分。
实施例1
本实施例提供一种CAD文件数据提取识别方法,可以用于快捷地、准确地提取和识别CAD文件中的数据,该CAD文件包括设备图形和设备标注,设备图形可以是CAD中的line(直线)、polyline(多段线)、hatch(填充)、ellipse(椭圆)等元素构成,设备标注可以是CAD中的mtext(多行文字)等元素构成。可以理解的是,该CAD文件除了包括设备图形和设备标注,还可以包括其他信息,例如电气中的馈线组信息等。
当CAD文件被导入打开时,图面上设备标注应是位于对应的设备图形附近,以标注解释该设备图形。
图1是本实施例的一种CAD文件数据提取识别方法流程示意图。如图1所示,本实施例所提供的CAD文件数据提取识别方法可以包括以下步骤:
S110.提取CAD文件中的设备图形。
在CAD文件所包括的信息中,提取设备图形。
S120.识别所提取的设备图形的设备类型。
提取出设备图形后,可以识别设备图形的设备类型,从而获知该设备图形对应的是哪种设备类型。在一种优选的实施方式下,当识别出设备图形的设备类型后,可以将识别出的设备类型赋值给设备图形的属性中,以便后续将所识别提取的信息进行数字化入库。
图2是本实施例步骤S120的具体流程示意图。如图2所示,在一种可选的实施例下,步骤S120识别所提取的设备图形的设备类型,可以具体包括:
S121.根据预设的元素库,元素库包括多个设备类型以及每个设备类型对应的图例样式,将提取的设备图形匹配元素库中的图例样式;
S122.将匹配的图例样式对应的设备类型作为设备图形的设备类型。
示例性地,预设的元素库可以如表1所示。
表1元素库
根据元素库中已预设的图例样式与设备图形进行匹配,可以识别并确认出该设备图形属于哪一个图例样式,再将所属图例样式对应的设备类型,作为该设备图形的设备类型。
在一些可能的情况下,不同设备类型对应的图例样式存在相似的情况,如表1中的序号1和序号2都存在两个圆形元素,一个设备图形可能会误匹配出多个图例样式。为了进一步提高设备图形的设备类型识别准确性,在一种可选的实施例下,步骤S121中将提取的设备图形匹配元素库中的图例样式,可以具体包括:
将提取的设备图形匹配元素库中的图例样式,得到初步匹配的图例样式;
根据提取的设备图形的几何特征,在初步匹配的图例样式中筛选出最终匹配的图例样式。
将设备图形与图例样式进行匹配,可以进行初步匹配,当初步匹配为某一图例样式或某多个图例样式后,根据该设备图形几何特征,如周长、面积、边长、相对距离等的一个或多个,再作进一步甄别,筛选出最终匹配的图例样式,继而识别出该图形设备的设备类型为该最终匹配的图例样式所对应的设备类型。
S130.根据预设的规则,判断所识别的设备类型是属于第一类型或第二类型。
对于已识别出设备类型的设备图形,需要将图面上该设备图形对应的标注信息进行匹配。但由于不同设备类型的设备图形,可能存在相近的情况,所以需要将设备类型分属于两个类型:第一类型和第二类型。
第一类型的设备类型对应的设备图形,是与其它设备类型的设备图形不存在相似的情况;第二类型的设备类型对应的设备图形,是与其它设备类型的设备图形存在相似的情况。
将设备类型分属于两个类型,可以分开两种情况进行设备图形和设备标注的匹配关联。
当所识别的设备类型属于第一类型时,可以包括以下步骤:
S141.在CAD文件中以设备图形为中心,形成一内径为a、外径为b的环形区域,a≥0,b≥0;
S142.根据预设的设备类型与关键词的对应关系,确定识别的设备类型对应的关键词;
S143.根据确定的关键词,在环形区域查找匹配关键词的设备标注;
S144.在匹配关键词的设备标注中,筛选出与识别的设备图形距离最小的设备标注,将筛选出的设备标注关联所识别的设备图形,得到关联信息。
设备类型与关键词的对应关系是预设的。例如如表1所示序号1的公用变压器,其对应的关键词可以为“公用”、“变压”,序号2的专用变压器,其对应的关键词可以为“专用”、“变压”。
在环形区域查找匹配关键词的设备标注,可以是查找包含关键词的设备标注,也可以是查找包含关键词的部分的设备标注。
当所识别的设备类型属于第二类型时,可以包括以下步骤:
S141’.在CAD文件中以设备图形为中心,形成一半径为x的设备面域,并以设备图形为中心,形成一半径为x+y的描述面域,x≥0,y≥0;
S142’.将设备面域中各设备图形与描述面域中各设备标注进行匹配组合;
S143’.计算不同匹配组合下各设备图形与匹配的设备标注之间的距离之和;
S144’.将距离之和最小的匹配组合作为最优组合,将识别的设备图形关联在最优组合中所匹配的设备标注,得到关联信息。
示例性地,假设在设备面域有设备图形A、设备图形B和设备图形C,在描述面域有设备标注a、设备标注b和设备标注c。将设备图形A、设备图形B、设备图形C与设备标注a、设备标注b、设备标注c进行匹配组合,可以得到以下六种不同的匹配组合:
(1)设备图形A匹配设备标注a,设备图形B匹配设备标注b,设备图形C匹配设备标注c;
(2)设备图形A匹配设备标注a,设备图形B匹配设备标注c,设备图形C匹配设备标注b;
(3)设备图形A匹配设备标注b,设备图形B匹配设备标注c,设备图形C匹配设备标注a;
(4)设备图形A匹配设备标注b,设备图形B匹配设备标注a,设备图形C匹配设备标注c;
(5)设备图形A匹配设备标注c,设备图形B匹配设备标注b,设备图形C匹配设备标注a;
(6)设备图形A匹配设备标注c,设备图形B匹配设备标注a,设备图形C匹配设备标注b。
将以上六种匹配组合可以用Pi表示:
P1=(pAa、pBb、pCc);
P2=(pAa、pBc、pCb);
P3=(pAb、pBc、pCa);
P4=(pAb、pBa、pCc);
P5=(pAc、pBb、pCa);
P6=(pAc、pBa、pCb)。
pjk表示“设备图形j”与“设备标注k”匹配。计算不同匹配组合下各设备图形与匹配的设备标注之间的距离之和,也即计算六种组合下设备图形A、设备图形B、设备图形C与匹配的设备标注a、设备标注b、设备标注c距离之和D(n),n=1,2,3,4,5,6:
D(1)=d(pAa)+d(pBb)+d(pCc);
D(2)=d(pAa)+d(pBc)+d(pCb);
D(3)=d(pAb)+d(pBc)+d(pCa);
D(4)=d(pAb)+d(pBa)+d(pCc);
D(5)=d(pAc)+d(pBb)+d(pCa);
D(6)=d(pAc)+d(pBa)+d(pCb);
d(pjk)表示“设备图形j”的中心与“设备标注k”捕捉点之间的距离。通过比较上述D(n),取最小的D(n)作为最优组合。
假设D(4)为最优组合,则根据最优组合,将设备图形A关联设备标注b、设备图形B关联设备标注a、设备图形C关联设备标注c,得到关联信息。
为了进一步提高设备标注与设备图形匹配的准确性,在一种可选的实施例下,步骤S141’中,在形成一半径为x的设备面域之后,形成一半径为x+y的描述面域之前,还可以包括:
判断设备面域是否存在与提取的设备图形,设备类型相同的其它设备图形;
若存在,则保持x的取值不变;
若不存在,则将x的取值增大,扩大设备面域,判断扩大后的设备面域是否新增与提取的设备图形,设备类型相同的其它设备图形;
若有新增,则将x的取值增大,扩大设备面域,继续判断扩大后的设备面域是否新增与提取的设备图形,设备类型相同的其它设备图形,直至无新增为止;
若无新增,则保持x的取值不变。
在半径为x的设备面域内,如果还有相同设备类型的设备图形,可以将设备面域继续以所提取的设备图形为中心,继续向外扩大,直到再扩大也不会新增相同设备类型的设备图形位置,从而尽可能地让相同设备类型的设备图形被包括在同一设备面域中,统一进行后续的设备图形与设备标注的匹配,而且可以提高匹配的准确性。
实施例2
本实施例提供一种CAD文件数据提取识别方法,与实施例1不同在于步骤S120的具体流程。
图3是本实施例步骤S120的具体流程示意图。CAD文件中块是指多个图形组成的一个整体。块具备多个属性,包括块名称、块拾取点等。当设备图形为块时,可以充分利用块属性中的块名称,快速地识别出该设备图形的设备类型。
如图3所示,步骤S120识别所提取的设备图形的设备类型,可以具体包括:
S121’.判断设备图形是否为块;
S122’.若判定设备图形为块,则提取设备图形的块名称,根据预设的元素库,元素库包括多个设备类型以及每个设备类型对应的图例样式,将提取的块名称匹配元素库中的设备类型,将匹配的设备类型作为设备图形的设备类型;
S123’若判定设备图形不是块,则根据元素库,将提取的设备图形匹配元素库中的图例样式,将匹配的图例样式对应的设备类型作为设备图形的设备类型。
为了进一步提高设备图形的设备类型识别准确性,在一种可选的实施例下,步骤S123’中将提取的设备图形匹配元素库中的图例样式,可以具体包括:
将提取的设备图形匹配元素库中的图例样式,得到初步匹配的图例样式;
根据提取的设备图形的几何特征,在初步匹配的图例样式中筛选出最终匹配的图例样式。
将设备图形与图例样式进行匹配,可以进行初步匹配,当初步匹配为某一图例样式或某多个图例样式后,根据该设备图形几何特征,如周长、面积、边长、相对距离等的一个或多个,再作进一步甄别,筛选出最终匹配的图例样式,继而识别出该图形设备的设备类型为该最终匹配的图例样式所对应的设备类型。
本实施例与实施例1内容相同的部分不再赘述,请参见实施例1中的相应部分。
实施例3
为了方便在CAD文件数据提取后进行进一步的人工核对,本实施例提供一种CAD文件数据提取检查方法。
图4是本实施例的一种CAD文件数据提取检查方法流程示意图。如图4所示,本实施例所提供的检查方法包括如实施例1或实施例2所述的CAD文件数据提取识别方法,也即,包括步骤S110至步骤S140,并在得到关联信息之后,还可以包括以下步骤:
S150.根据关联信息,采用直线连接相互关联的设备图形和设备标注;和/或,根据关联信息,将已关联的设备图形和设备标注的颜色修改为灰色。
在图面上将相互关联的设备图形和设备标注采用直线连接,可以方便人工核对设备图形和设备标注的关联情况。
在图面上将已关联的设备图形和设备标注的颜色修改为灰色,其它未关联或者未提取识别的则颜色不改变,可以方便人工核对是否有遗漏未能提取识别或者未能成功关联的设备图形和设备标注。
本实施例与实施例1、实施例2内容相同的部分不再赘述,请参见实施例1、实施例2中的相应部分。
实施例4
本实施例提供一种CAD文件数据提取识别系统,可以用于快捷地、准确地提取和识别CAD文件中的数据,该CAD文件包括设备图形和设备标注,设备图形可以是CAD中的line(直线)、polyline(多段线)、hatch(填充)、ellipse(椭圆)等元素构成,设备标注可以是CAD中的mtext(多行文字)等元素构成。可以理解的是,该CAD文件除了包括设备图形和设备标注,还可以包括其他信息,例如电气中的馈线组信息等。
当CAD文件被导入打开时,图面上设备标注应是位于对应的设备图形附近,以标注解释该设备图形。
图5是本实施例的一种CAD文件数据提取识别系统组成示意图。如图5所示,本实施例提供的CAD文件数据提取识别系统包括:
图形提取模块,用于提取CAD文件中的设备图形;
类型识别模块,用于识别图形提取模块所提取的设备图形的设备类型;
类型判断模块,用于根据预设的规则,判断类型识别模块所识别的设备类型是属于第一类型或第二类型;
第一关联模块,用于当类型判断模块判定所识别的设备类型属于第一类型时:
在CAD文件中以设备图形为中心,形成一内径为a、外径为b的环形区域,a≥0,b≥0;
根据预设的设备类型与关键词的对应关系,确定识别的设备类型对应的关键词;
根据确定的关键词,在环形区域查找匹配关键词的设备标注;
在匹配关键词的设备标注中,筛选出与识别的设备图形距离最小的设备标注,将筛选出的设备标注关联所识别的设备图形,得到关联信息;
第二关联模块,用于当类型判断模块判定所所识别的设备类型属于第二类型时:
在CAD文件中以设备图形为中心,形成一半径为x的设备面域,并以设备图形为中心,形成一半径为x+y的描述面域,x≥0,y≥0;
将设备面域中各设备图形与描述面域中各设备标注进行匹配组合;
计算不同匹配组合下各设备图形与匹配的设备标注之间的距离之和;
将距离之和最小的匹配组合作为最优组合,将识别的设备图形关联在最优组合中所匹配的设备标注,得到关联信息。
在一种可选的实施例下,所述第二关联模块,用于在形成一半径为x的设备面域之后,形成一半径为x+y的描述面域之前,还用于:
判断设备面域是否存在与提取的设备图形,设备类型相同的其它设备图形;
若存在,则保持x的取值不变;
若不存在,则将x的取值增大,扩大设备面域,判断扩大后的设备面域是否新增与提取的设备图形,设备类型相同的其它设备图形;
若有新增,则将x的取值增大,扩大设备面域,继续判断扩大后的设备面域是否新增与提取的设备图形,设备类型相同的其它设备图形,直至无新增为止;
若无新增,则保持x的取值不变。
在一种可选的实施例下,类型识别模块,用于识别图形提取模块所提取的设备图形的设备类型,具体包括:
类型识别模块,用于根据预设的元素库,元素库包括多个设备类型以及每个设备类型对应的图例样式,将图形提取模块所提取的设备图形匹配元素库中的图例样式,将匹配的图例样式对应的设备类型作为设备图形的设备类型。
为了进一步提高设备图形的设备类型识别准确性,可选地,类别识别模块,用于将提取的设备图形匹配元素库中的图例样式,可以包括:
类别识别模块,用于将提取的设备图形匹配元素库中的图例样式,得到初步匹配的图例样式;根据提取的设备图形的几何特征,在初步匹配的图例样式中筛选出最终匹配的图例样式。
图6为本实施例类型识别模块的组成示意图。如图6所示,在一种可选的实施例下,类型识别模块包括:
块判断单元,用于判断设备图形是否为块;
第一识别单元,用于当块判断单元判定设备图形为块时,提取设备图形的块名称,根据预设的元素库,元素库包括多个设备类型以及每个设备类型对应的图例样式,将提取的块名称匹配元素库中的设备类型,将匹配的设备类型作为设备图形的设备类型;
第二识别单元,用于当块判断单元判定设备图形不为块时,根据元素库,将提取的设备图形匹配元素库中的图例样式,将匹配的图例样式对应的设备类型作为设备图形的设备类型。
为了进一步提高设备图形的设备类型识别准确性,可选地,第二识别单元用于将提取的设备图形匹配元素库中的图例样式,可以包括:
第二识别单元,用于将提取的设备图形匹配元素库中的图例样式,得到初步匹配的图例样式;根据提取的设备图形的几何特征,在初步匹配的图例样式中筛选出最终匹配的图例样式。
为了方便人工核对,在一种可选的实施例下,本实施例提供的CAD文件数据提取识别系统还包括:
直线连接模块,用于根据关联信息,采用直线连接相互关联的设备图形和设备标注;
和/或,
颜色修改模块,用于根据关联信息,将已关联的设备图形和设备标注的颜色修改为灰色。
直线连接模块和颜色修改模块未在附图中示意。直线连接模块和颜色修改模块的设置可以方便后续的人工核对,核对是否有遗漏未能提取识别,或者未能成功关联的设备图形和设备标注,或者错误关联的设备图形和设备标注。
本实施例还提供一种计算机设备,包括存储器和处理器,存储器存储有计算机程序,处理器执行计算机程序时实现如实施例1或实施例2的CAD文件数据提取识别方法,或者如实施例3的CAD文件数据提取检查方法。
本实施例还提供一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现如实施例1或实施例2的CAD文件数据提取识别方法,或者如实施例3的CAD文件数据提取检查方法。
本实施例与实施例1、实施例2、实施例3内容相同的部分不再赘述,请参见实施例1、实施例2、实施例3中的相应部分。
Claims (10)
1.一种CAD文件数据提取识别方法,所述CAD文件包括设备图形和设备标注,其特征在于,所述方法包括:
提取所述CAD文件中的设备图形;
识别所提取的所述设备图形的设备类型;
根据预设的规则,判断所识别的所述设备类型是属于第一类型或第二类型;
当所识别的所述设备类型属于第一类型时:
在所述CAD文件中以所述设备图形为中心,形成一内径为a、外径为b的环形区域,a≥0,b≥0;
根据预设的设备类型与关键词的对应关系,确定识别的所述设备类型对应的关键词;
根据确定的所述关键词,在所述环形区域查找匹配所述关键词的设备标注;
在匹配所述关键词的设备标注中,筛选出与识别的所述设备图形距离最小的设备标注,将筛选出的所述设备标注关联所识别的所述设备图形,得到关联信息;
当所识别的所述设备类型属于第二类型时:
在所述CAD文件中以所述设备图形为中心,形成一半径为x的设备面域,并以所述设备图形为中心,形成一半径为x+y的描述面域,x≥0,y≥0;
将所述设备面域中各设备图形与所述描述面域中各设备标注进行匹配组合;
计算不同匹配组合下各设备图形与匹配的设备标注之间的距离之和;
将所述距离之和最小的匹配组合作为最优组合,将识别的所述设备图形关联在所述最优组合中所匹配的设备标注,得到关联信息。
2.根据权利要求1所述的一种CAD文件数据提取识别方法,其特征在于,在形成一半径为x的设备面域之后,形成一半径为x+y的描述面域之前,还包括:
判断所述设备面域是否存在与提取的所述设备图形,设备类型相同的其它设备图形;
若存在,则保持x的取值不变;
若不存在,则将x的取值增大,扩大所述设备面域,判断扩大后的所述设备面域是否新增与提取的所述设备图形,设备类型相同的其它设备图形;
若有新增,则将x的取值增大,扩大所述设备面域,继续判断扩大后的所述设备面域是否新增与提取的所述设备图形,设备类型相同的其它设备图形,直至无新增为止;
若无新增,则保持x的取值不变。
3.根据权利要求1所述的一种CAD文件数据提取识别方法,其特征在于,识别所提取的所述设备图形的设备类型,包括:
根据预设的元素库,所述元素库包括多个设备类型以及每个所述设备类型对应的图例样式,将提取的所述设备图形匹配所述元素库中的图例样式,将匹配的所述图例样式对应的设备类型作为所述设备图形的设备类型。
4.根据权利要求1所述的一种CAD文件数据提取识别方法,其特征在于,识别所提取的所述设备图形的设备类型,包括:
判断所述设备图形是否为块;
若是,则提取所述设备图形的块名称,根据预设的元素库,所述元素库包括多个设备类型以及每个所述设备类型对应的图例样式,将提取的所述块名称匹配所述元素库中的设备类型,将匹配的所述设备类型作为所述设备图形的设备类型;
若否,则根据所述元素库,将提取的所述设备图形匹配所述元素库中的图例样式,将匹配的所述图例样式对应的设备类型作为所述设备图形的设备类型。
5.根据权利要求3或4所述的一种CAD文件数据提取识别方法,其特征在于,将提取的所述设备图形匹配所述元素库中的图例样式,包括:
将提取的所述设备图形匹配所述元素库中的图例样式,得到初步匹配的图例样式;
根据提取的所述设备图形的几何特征,在初步匹配的图例样式中筛选出最终匹配的图例样式。
6.根据权利要求5所述的一种CAD文件数据提取识别方法,其特征在于,所述几何特征包括周长、面积、边长、相对距离的一种或多种。
7.一种CAD文件数据提取检查方法,其特征在于,包括如权利要求1至6任一项所述的CAD文件数据提取识别方法,在得到关联信息之后,还包括:
根据所述关联信息,采用直线连接相互关联的所述设备图形和所述设备标注;
和/或,
根据所述关联信息,将已关联的所述设备图形和所述设备标注的颜色修改为灰色。
8.一种CAD文件数据提取识别系统,所述CAD文件包括设备图形和设备标注,其特征在于,所述系统包括:
图形提取模块,用于提取所述CAD文件中的设备图形;
类型识别模块,用于识别所述图形提取模块所提取的所述设备图形的设备类型;
类型判断模块,用于根据预设的规则,判断所述类型识别模块所识别的所述设备类型是属于第一类型或第二类型;
第一关联模块,用于当所述类型判断模块判定所识别的所述设备类型属于第一类型时:
在所述CAD文件中以所述设备图形为中心,形成一内径为a、外径为b的环形区域;
根据预设的设备类型与关键词的对应关系,确定识别的所述设备类型对应的关键词;
根据确定的所述关键词,在所述环形区域查找匹配所述关键词的设备标注;
在匹配所述关键词的设备标注中,筛选出与识别的所述设备图形距离最小的设备标注,将筛选出的所述设备标注关联所识别的所述设备图形,得到关联信息;
第二关联模块,用于当所述类型判断模块判定所所识别的所述设备类型属于第二类型时:
在所述CAD文件中以所述设备图形为中心,形成一半径为x的设备面域,并以所述设备图形为中心,形成一半径为x+y的描述面域;
将所述设备面域中各设备图形与所述描述面域中各设备标注进行匹配组合;
计算不同匹配组合下各设备图形与匹配的设备标注之间的距离之和;
将所述距离之和最小的匹配组合作为最优组合,将识别的所述设备图形关联在所述最优组合中所匹配的设备标注,得到关联信息。
9.一种计算机设备,包括存储器和处理器,存储器存储有计算机程序,其特征在于,所述处理器执行计算机程序时实现如权利要求1至6任一项所述的CAD文件数据提取识别方法或如权利要求7所述的CAD文件数据提取检查方法。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至6任一项所述的CAD文件数据提取识别方法或如权利要求7所述的CAD文件数据提取检查方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210352038.XA CN114722440B (zh) | 2022-04-02 | 2022-04-02 | Cad文件数据提取识别、检查方法、系统、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210352038.XA CN114722440B (zh) | 2022-04-02 | 2022-04-02 | Cad文件数据提取识别、检查方法、系统、设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114722440A true CN114722440A (zh) | 2022-07-08 |
CN114722440B CN114722440B (zh) | 2024-07-23 |
Family
ID=82242713
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210352038.XA Active CN114722440B (zh) | 2022-04-02 | 2022-04-02 | Cad文件数据提取识别、检查方法、系统、设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114722440B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115859439A (zh) * | 2022-12-13 | 2023-03-28 | 青鸟消防股份有限公司 | 一种消防控制室图形显示系统及其自动布点方法 |
Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008033875A (ja) * | 2006-07-03 | 2008-02-14 | Bigvan Inc | Cad製図データのレイヤ振分けプログラム、記録媒体及びその装置、並びにそのレイヤ振分けシステム、cad製図基準データチェック装置 |
CN101882225A (zh) * | 2009-12-29 | 2010-11-10 | 北京中科辅龙计算机技术股份有限公司 | 基于模板的工程图纸材料信息提取方法 |
CN102999524A (zh) * | 2011-09-16 | 2013-03-27 | 中广核工程有限公司 | 一种文档关联检索方法及系统 |
KR20150021730A (ko) * | 2013-08-21 | 2015-03-03 | 주식회사 마이다스아이티 | 캐드객체 및 정보태그를 이용한 연관테이블 생성 장치 및 그 방법 |
CN107045526A (zh) * | 2016-12-30 | 2017-08-15 | 许昌学院 | 一种电子建筑施工图的图形识别方法 |
CN110795809A (zh) * | 2019-11-07 | 2020-02-14 | 国网河北省电力有限公司电力科学研究院 | 基于cad图自动拾取的变电站电气二次回路连接关系的方法、系统及介质 |
CN111222186A (zh) * | 2020-01-03 | 2020-06-02 | 湖南特能博世科技有限公司 | 图元识别的方法、装置及服务器 |
CN111461066A (zh) * | 2020-04-24 | 2020-07-28 | 北京联合普肯工程技术股份有限公司 | 过程工业流程图的识别方法及装置、电子设备 |
CN112116011A (zh) * | 2020-09-21 | 2020-12-22 | 上海晓材科技有限公司 | 一种用于cad图形的特征编码方法和相似度比较方法 |
CN112613112A (zh) * | 2021-03-08 | 2021-04-06 | 巧夺天宫(深圳)科技有限公司 | 一种基于bim开发的cad建筑图纸逆向建模方法 |
CN113052023A (zh) * | 2021-03-12 | 2021-06-29 | 深圳小库科技有限公司 | Cad图纸解析方法、装置、设备及存储介质 |
CN113065475A (zh) * | 2021-04-08 | 2021-07-02 | 上海晓材科技有限公司 | 一种cad图例快速精准识别方法 |
CN113128457A (zh) * | 2021-04-30 | 2021-07-16 | 杭州品茗安控信息技术股份有限公司 | 一种建筑模型的识别方法、系统及相关装置 |
-
2022
- 2022-04-02 CN CN202210352038.XA patent/CN114722440B/zh active Active
Patent Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008033875A (ja) * | 2006-07-03 | 2008-02-14 | Bigvan Inc | Cad製図データのレイヤ振分けプログラム、記録媒体及びその装置、並びにそのレイヤ振分けシステム、cad製図基準データチェック装置 |
CN101882225A (zh) * | 2009-12-29 | 2010-11-10 | 北京中科辅龙计算机技术股份有限公司 | 基于模板的工程图纸材料信息提取方法 |
CN102999524A (zh) * | 2011-09-16 | 2013-03-27 | 中广核工程有限公司 | 一种文档关联检索方法及系统 |
KR20150021730A (ko) * | 2013-08-21 | 2015-03-03 | 주식회사 마이다스아이티 | 캐드객체 및 정보태그를 이용한 연관테이블 생성 장치 및 그 방법 |
CN107045526A (zh) * | 2016-12-30 | 2017-08-15 | 许昌学院 | 一种电子建筑施工图的图形识别方法 |
CN110795809A (zh) * | 2019-11-07 | 2020-02-14 | 国网河北省电力有限公司电力科学研究院 | 基于cad图自动拾取的变电站电气二次回路连接关系的方法、系统及介质 |
CN111222186A (zh) * | 2020-01-03 | 2020-06-02 | 湖南特能博世科技有限公司 | 图元识别的方法、装置及服务器 |
CN111461066A (zh) * | 2020-04-24 | 2020-07-28 | 北京联合普肯工程技术股份有限公司 | 过程工业流程图的识别方法及装置、电子设备 |
CN112116011A (zh) * | 2020-09-21 | 2020-12-22 | 上海晓材科技有限公司 | 一种用于cad图形的特征编码方法和相似度比较方法 |
CN112613112A (zh) * | 2021-03-08 | 2021-04-06 | 巧夺天宫(深圳)科技有限公司 | 一种基于bim开发的cad建筑图纸逆向建模方法 |
CN113052023A (zh) * | 2021-03-12 | 2021-06-29 | 深圳小库科技有限公司 | Cad图纸解析方法、装置、设备及存储介质 |
CN113065475A (zh) * | 2021-04-08 | 2021-07-02 | 上海晓材科技有限公司 | 一种cad图例快速精准识别方法 |
CN113128457A (zh) * | 2021-04-30 | 2021-07-16 | 杭州品茗安控信息技术股份有限公司 | 一种建筑模型的识别方法、系统及相关装置 |
Non-Patent Citations (4)
Title |
---|
张琪;叶颖;: "基于对象图例及其拓扑关系识别的二维工程CAD图纸矢量化方法", 计算机与现代化, no. 11, 15 November 2018 (2018-11-15), pages 40 - 45 * |
王雪巍: "建筑铝模板安装施工图自动标注与布局优化方法研究与实现", 《中国优秀硕士学位论文全文数据库 工程科技II辑》, 15 August 2021 (2021-08-15), pages 038 - 570 * |
秦红斌;刘云华;张卫国;钟毅芳;: "三牙轮钻头牙轮图形标注识别技术研究", 组合机床与自动化加工技术, no. 10, 20 October 2008 (2008-10-20), pages 78 - 82 * |
胡蓉辉;朱林;黄鸿纲;: "参数化标准件文件的可视化自动生成算法研究", 机械设计与制造, no. 08, 8 August 2007 (2007-08-08), pages 145 - 147 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115859439A (zh) * | 2022-12-13 | 2023-03-28 | 青鸟消防股份有限公司 | 一种消防控制室图形显示系统及其自动布点方法 |
Also Published As
Publication number | Publication date |
---|---|
CN114722440B (zh) | 2024-07-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102177550B1 (ko) | 이미지화된 pid 도면에서 설계 정보를 자동으로 인식하여 분류하는 방법 | |
US11756323B2 (en) | Method of automatically recognizing and classifying design information in imaged PID drawing and method of automatically creating intelligent PID drawing using design information stored in database | |
US20070168382A1 (en) | Document analysis system for integration of paper records into a searchable electronic database | |
US11182544B2 (en) | User interface for contextual document recognition | |
Chang et al. | Fabric defect detection based on pattern template correction | |
US8881078B2 (en) | Proprietary circuit layout identification | |
CN112651378B (zh) | 紧固件二维图纸的标注信息识别方法、设备及介质 | |
WO2008105611A1 (en) | Database auto-building method for link of search data in gis system using cad drawings | |
JP2003296383A (ja) | 3次元モデリングシステム | |
CN103176905B (zh) | 一种缺陷关联方法及装置 | |
CN111626989B (zh) | 针对缺失标注的病理图像的高精度检测网络训练方法 | |
CN107315817A (zh) | 电子图纸文本匹配方法、装置、存储介质和计算机设备 | |
CN113841156B (zh) | 基于图像识别的控制方法与装置 | |
CN116257877A (zh) | 一种面向隐私计算的数据分类分级方法 | |
CN108717544A (zh) | 一种基于智能图像分析的报纸样稿文字自动检测方法 | |
CN112632926B (zh) | 票据的数据处理方法、装置、电子设备及存储介质 | |
CN103678327B (zh) | 一种信息关联的方法及装置 | |
CN110806977A (zh) | 基于产品需求的测试用例集生成方法、装置及电子设备 | |
JP2015005100A (ja) | 情報処理装置、テンプレート生成方法、およびプログラム | |
CN114722440A (zh) | Cad文件数据提取识别、检查方法、系统、设备及存储介质 | |
CN106663133A (zh) | 用于自动建立表征技术图的数据组的方法 | |
JPH1173472A (ja) | フォーマット情報登録方法及びocrシステム | |
CN115203053A (zh) | 基于频繁序列挖掘的代码克隆检测方法 | |
CN118035764B (zh) | 数据主体的确定方法、装置及电子设备 | |
CN114048084B (zh) | 一种原理图的测试用例大纲的生成方法、装置和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |