CN110704880B - 一种工程图纸的关联方法 - Google Patents

一种工程图纸的关联方法 Download PDF

Info

Publication number
CN110704880B
CN110704880B CN201810630300.6A CN201810630300A CN110704880B CN 110704880 B CN110704880 B CN 110704880B CN 201810630300 A CN201810630300 A CN 201810630300A CN 110704880 B CN110704880 B CN 110704880B
Authority
CN
China
Prior art keywords
legend
engineering
data set
symbol
symbols
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810630300.6A
Other languages
English (en)
Other versions
CN110704880A (zh
Inventor
邹桐
孙丽丽
朱春田
张华�
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sinopec Engineering Inc
Sinopec Engineering Group Co Ltd
Original Assignee
Sinopec Engineering Inc
Sinopec Engineering Group Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sinopec Engineering Inc, Sinopec Engineering Group Co Ltd filed Critical Sinopec Engineering Inc
Priority to CN201810630300.6A priority Critical patent/CN110704880B/zh
Publication of CN110704880A publication Critical patent/CN110704880A/zh
Application granted granted Critical
Publication of CN110704880B publication Critical patent/CN110704880B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提出了一种工程图纸的关联方法,包括:对于待处理的工程图纸电子档案,基于本发明创建的增强分类器,识别出属于图例符号图像集的图例符号以及其所对应的字符编码;对所识别的图例符号中的字符编码在图纸中的位置进行提取;将在同一个项目中涉及到同一个字符编码的相同图例符号进行关联,将各个图例符号在工程图纸中的定位与关联关系存储在数据库中。本发明的关联效率高、关联文件种类多;可维持各参与方的工作习惯,避免统一软件工具和模板带来项目执行中的困难,提高社会生产效率;解决工程图纸关系复杂的问题,可扩展性强;对于各领域的技术应用和管理更有业务价值。

Description

一种工程图纸的关联方法
技术领域
本发明涉及工程图纸的数字化技术,具体地,涉及一种工程图纸的关联方法。
背景技术
现代工业和制造业的工厂设计越来越复杂,涉及到大量的工艺、设备、控制、电气等技术内容。在现代工业或者制造业的设计技术中,对于生产优化、自动化、智能化、安全环保等的要求很高,从而要求技术专业的精细划分。多专业交叉协作,意味着对于某一个工厂实体通过不同的角度进行关于流程、逻辑、连锁、制造、安装、安全、保护、仿真、模拟等的操作。换句话说,一个实体(可以理解为工厂对象,即构成工厂的设备、管道、仪表、电气和建构筑物等具有编号可独立识别的工厂实体)会同时与多种不同的技术资料相关联,每一种技术资料都只能看到某个技术侧面,并且通常情况下在同一张工程图纸上会涉及到多个工厂对象的内容。这样,在传统档案的卷册管理方法中,如果想收集涉及到某个工厂实体的所有资料,需要花费大量的时间和精力查找、精确定位。
现在有的软件供应商所提供的解决方案,从项目设计初始对所有内容进行数据建模,通过共享数据库,使用统一数据交互平台,可以解决部分数据的定位。但是由于受限于产品、不同的软件供应商解决方案数据不共享、还有很大部分的工程图纸无法使用基于数据库的应用软件,从而无法达到真正意义上的工程图纸关联。同时,因为基于数据库和统一数据交互,导致需要花费大量时间在数据的定义和管理上,并且只适用于新项目,扩展性非常有限。
从技术管理的角度,以及工程建设、企业(工业及制造业)运行维护的角度,需要将这些技术资料整合,才能更好地对其业务进行整理和数据服务。通常来说工程图纸包括更抽象的流程图、逻辑图、联锁图、布置图、回路图、系统图、原理图、配置图,一般图纸上通过位号或实体编码表示;还包括更具体的制造图、装配图、零部件图、安装图、装配图、爆炸图、结构图,一般图纸上通过零部件号或材料号表示。
因此,有必要开发一种能够对图例符号和工厂对象位号进行定位和识别,并能够对同一个工厂对象的技术资料进行关联整合的方法。
公开于本发明背景技术部分的信息仅仅旨在加深对本发明的一般背景技术的理解,而不应当被视为承认或以任何形式暗示该信息构成已为本领域技术人员所公知的现有技术。
发明内容
为解决现有工程图纸的关联过程中存在的问题,本发明提供一种基于增强机器学习的工程图纸的关联方法。通过机器学习算法从工程图纸中将同一工厂对象建立关联关系,建立工程图纸的关系模型,可以快速检索、查询,使业务人员可以从不同的技术角度分析。
本发明提出了一种工程图纸的关联方法,该方法包括:
1)基于预先获取的工程图纸电子档案的图例符号和其中所包含的字符编码分别创建图例符号数据集以及与其对应的编码数据集;
2)对所述编码数据集中的数字和英文字母进行重新组合,形成新的编码数据集;
3)基于步骤1)中创建的图例符号数据集和编码数据集以及步骤2)中形成的新的编码数据集,通过机器学习算法创建图例符号的增强分类器和字符编码的增强分类器;
4)对于待处理的工程图纸电子档案,基于所设置的窗口尺寸和扫描步长,利用窗口扫描法识别图例符号的位置,通过所述图例符号的增强分类器识别图例符号,并通过所述字符编码的增强分类器识别所述图例符号中的字符编码;
5)对所识别的图例符号中的字符编码在图纸中的位置进行提取;
6)将在同一个项目中涉及到同一个字符编码的图例符号进行关联,将各个图例符号在工程图纸中的字符编码、符号类型、定位、关联关系存储在数据库中。
优选地,当工程图纸是基于位号机制的,则其中的图例符号所包含的字符编码为工厂对象位号。
优选地,基于位号机制的工程图纸包括流程图、逻辑图、联锁图、布置图、回路图、系统图、原理图、配置图。
优选地,当工程图纸是基于零件号机制的,则其中的图例符号所包含的字符编码为零部件号。
优选地,基于零件号机制的工程图纸包括制造图、装配图、零部件图、安装图、爆炸图、结构图。
优选地,所述工程图纸电子档案为按照统一设定的尺寸、清晰度扫描的工程图纸。
优选地,所述工程图纸的关联方法还包括:建立工程图纸电子档案文件类型的决策树,通过命名规则将不同专业、不同类型的工程图纸电子档案区分开。
优选地,所述工程图纸的关联方法还包括:通过对训练数据集进行放大、缩小、旋转、局部扭曲来增加训练数据集的数量以训练分类器。
优选地,步骤3)包括,对于图例符号数据集中的样本,设置阈值减少外部线段的干扰并且通过均值算法确定字符编码出现的位置,从而建立图例符号与字符编码的形态特征,以创建图例符号的增强分类器。
优选地,步骤5)包括:通过投影法确定图例符号中单个字符的位置。
本发明通过机器学习识别工程图纸电子档案,自动建立工程图纸的关联模型,与传统工程图纸的关联方法相比具有以下有益技术效果:关联效率高、关联文件种类多;可维持各参与方的工作习惯,避免统一软件工具和模板带来项目执行中的困难,提高社会生产效率;解决工程图纸关系复杂的问题,可扩展性强;对于各领域的技术应用和管理更有业务价值。并且本发明所提出的方法可以作为数字化工厂建设的参照、部分数据来源,对于利用增强机器学习算法建设的数字化工厂有校验作用。
附图说明
通过结合附图对本发明示例性实施例进行更详细的描述,本发明的上述以及其它目的、特征和优势将变得更加明显,其中,在本发明示例性实施例中,相同的参考标号通常代表相同部件。
图1为根据本发明的示例性实施方案的工程图纸的关联方法的流程图;
图2为基于命名规则的文件类型决策树;
图3为示例性工艺流程图;
图4为均值算法提取图例符号形态特征的示意图。
图5为示例性制造图纸,其中的图例符号中包含零部件号。
具体实施方式
下面将参照附图更详细地描述本发明。虽然附图中显示了本发明的优选实施例,然而应该理解,可以以各种形式实现本发明而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了使本发明更加透彻和完整,并且能够将本发明的范围完整地传达给本领域的技术人员。
以下参考图1详细描述根据本发明示例性实施方案的工程图纸的关联方法,其主要包括以下步骤:
步骤1:将预先获取的工程图纸电子档案的图例符号和其中所包含的字符编码分别作为训练数据集,创建图例符号图像集以及与其对应的编码数据集。
工程图纸电子档案优选为按照统一设定的尺寸、清晰度扫描的工程图纸。
当工程图纸是基于位号机制的,则其中的图例符号所包含的字符编码为工厂对象位号,如图2所示。其中圆形的符号以及方框中包含圆形的符号即为图例符号。基于位号机制的工程图纸包括流程图、逻辑图、联锁图、布置图、回路图、系统图、原理图、配置图等等。本领域技术人员应当理解,基于位号机制的工程图纸还可以包括其他类型的图纸。
当工程图纸是基于零件号机制的,则其中的图例符号所包含的字符编码为零部件号,如图3所示。其中,圆形的符号以及方形的符号即为图例符号。基于零件号机制的工程图纸包括制造图、装配图、零部件图、安装图、爆炸图、结构图等等。本领域技术人员应当理解,基于零件号机制的工程图纸还可以包括其他类型的图纸。
对于预先获得的图例符号图像标定其所代表的工厂对象名称,之后将所获取的包括了图例符号图像和工厂对象名称的图例符号组成图例符号数据集;将所获取的图例符号中所包含的字符编码组成编码数据集。
步骤2:对所述编码数据集中的数字和英文字母进行重新组合,形成新的编码数据集。
预先获取的工程图纸电子档案的图例符号中所包含的字符编码是有限的,实际情况有不同的组合形式。通过将编码数据集中的数字和英文字母进行重新组合,可以获得更多可能的字符编码。对于基于位号机制的工程图纸,可以获得更多的工厂对象位号;对于基于零件号机制的工程图纸,则可以获得更多的零部件号。
步骤3:基于步骤1)中创建的图例符号数据集和编码数据集以及步骤2)中形成的新的编码数据集,通过机器学习算法创建图例符号的增强分类器和字符编码的增强分类器;
在一个示例中,通过对训练数据集,包括图例符号数据集和编码数据集,进行放大、缩小、旋转、局部扭曲来增加训练数据集的数量以训练分类器,即统一像素尺寸的图像经过数据增广后再作为初始训练样本。
在一个示例中,对于图例符号数据集中的样本,如图4中所述的图例符号,设置阈值减少外部线段的干扰,并且通过均值算法确定字符编码出现的位置,突出了图例符号的基本特征,从而建立图例符号与字符编码的形态特征,以创建图例符号的增强分类器。
在一个示例中,将工程图纸生成或转换成有颜色区分的图例符号,通过颜色过滤的方法直接筛选。
步骤4:对于待处理的工程图纸电子档案,通过所述图例符号的增强分类器识别图例符号,并通过所述字符编码的增强分类器识别所述图例符号中的字符编码。
通过图例符号的增强分类器,并设置合适的窗口尺寸和扫描步长,用窗口扫描法识别工程图纸中图例符号及其位置,即识别出工程图纸电子档案中属于图例符号数据集中的图例符号图像以及与该图例符号图像所对应的工厂对象名称。
对于单个已经识别的图例符号,通过图例符号与字符编码的形态特征,再利用投影法确定图例符号中单个字符的位置。
通过字符编码的增强分类器对其中的字符编码进行识别,即能够确定出该图例符号所对应的位号或者零部件号。
步骤5:对所识别的图例符号的字符编码在图纸中的位置进行提取。
以基于位号机制的工程图纸为例,即是对工厂对象位号在图纸中的位置包括其出现在此文件中的页码、横坐标、纵坐标进行提取。
步骤6:将在同一个项目中涉及到同一个字符编码的图例符号进行关联,将各个图例符号在工程图纸中的字符编码、符号类型、定位、关联关系存储在数据库中。
对于基于位号机制的工程图纸,可以通过将所有工程图纸中涉及每一位号的信息记录下来,包括图纸号、图例和位号出现在图纸中的位置,进而形成工程图纸间相互引用的有向图数据结构。
对于基于零件号机制的制造装配类图纸,其包括总图和零部件图,在总图中会通过引用图纸号来引用零部件图,但是对于每一个零部件并没有精确定位。通过本发明的工程图纸关联方法,可以将总图和零部件图中相同零部件号的图例符号关联起来。也即,零部件机制关联是将制造图纸中零部件号的信息记录下来,包括零部件图号、零部件号在图纸中的位置,进行形成一套制造图纸的树状数据结构。
这种数据结构是工程图纸关联的基础,再通过数据可视化的呈现,使得工程图纸的信息可以快速定位、查询、检索。
在一个示例中,建立工程图纸电子档案文件类型的决策树,通过命名规则将不同专业、不同类型的工程图纸电子档案区分开。
以竣工图纸资料的电子档案为例,第一级按照专业进行分类,可将竣工图纸资料分为工艺、设备、仪表等等,第二级按照电子档案的类型进行分类,以设备的电子档案为例,可将其分为工程图纸、数据表、说明书等等,将不同专业、不同类型的电子文档区分开后,再将训练样本分类汇总。通过文档命名规则即能够自动识别图纸类别,以及设备的名称、种类,如图5所示。

Claims (7)

1.一种工程图纸的关联方法,其特征在于,所述方法包括:
1)基于预先获取的工程图纸电子档案的图例符号和其中所包含的字符编码分别创建图例符号数据集以及与其对应的编码数据集;
2)对所述编码数据集中的数字和英文字母进行重新组合,形成新的编码数据集;
3)基于步骤1)中创建的图例符号数据集和编码数据集以及步骤2)中形成的新的编码数据集,通过机器学习算法创建图例符号的增强分类器和字符编码的增强分类器;
4)对于待处理的工程图纸电子档案,基于所设置的窗口尺寸和扫描步长,利用窗口扫描法识别图例符号的位置,通过所述图例符号的增强分类器识别图例符号,并通过所述字符编码的增强分类器识别所述图例符号中的字符编码;
5)对所识别的图例符号中的字符编码在图纸中的位置进行提取;
6)将在同一个项目中涉及到同一个字符编码的图例符号进行关联,将各个图例符号在工程图纸中的字符编码、符号类型、定位、关联关系存储在数据库中;
其中,当工程图纸是基于位号机制的,则其中的图例符号所包含的字符编码为工厂对象位号;
其中,当工程图纸是基于零件号机制的,则其中的图例符号所包含的字符编码为零部件号;
其中,步骤3)包括,对于图例符号数据集中的样本,设置阈值减少外部线段的干扰并且通过均值算法确定字符编码出现的位置,从而建立图例符号与字符编码的形态特征,以创建图例符号的增强分类器。
2.根据权利要求1所述的工程图纸的关联方法,其特征在于,基于位号机制的工程图纸包括流程图、逻辑图、联锁图、布置图、回路图、系统图、原理图、配置图。
3.根据权利要求1所述的工程图纸的关联方法,其特征在于,基于零件号机制的工程图纸包括制造图、装配图、零部件图、安装图、爆炸图、结构图。
4.根据权利要求1所述的工程图纸的关联方法,其特征在于,所述工程图纸电子档案为按照统一设定的尺寸、清晰度扫描的工程图纸。
5.根据权利要求1所述的工程图纸的关联方法,其特征在于,还包括:建立工程图纸电子档案文件类型的决策树,通过命名规则将不同专业、不同类型的工程图纸电子档案区分开。
6.根据权利要求1所述的工程图纸的关联方法,其特征在于,还包括:通过对数据集进行放大、缩小、旋转、局部扭曲来增加进行训练的数据集的数量以训练分类器。
7.根据权利要求1所述的工程图纸的关联方法,其特征在于,步骤5)包括:通过投影法确定图例符号中单个字符的位置。
CN201810630300.6A 2018-06-19 2018-06-19 一种工程图纸的关联方法 Active CN110704880B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810630300.6A CN110704880B (zh) 2018-06-19 2018-06-19 一种工程图纸的关联方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810630300.6A CN110704880B (zh) 2018-06-19 2018-06-19 一种工程图纸的关联方法

Publications (2)

Publication Number Publication Date
CN110704880A CN110704880A (zh) 2020-01-17
CN110704880B true CN110704880B (zh) 2022-12-02

Family

ID=69192140

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810630300.6A Active CN110704880B (zh) 2018-06-19 2018-06-19 一种工程图纸的关联方法

Country Status (1)

Country Link
CN (1) CN110704880B (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111310254B (zh) * 2020-03-10 2023-10-27 广联达科技股份有限公司 Cad图例的识别方法、装置、存储介质、电子设备
CN111475663A (zh) * 2020-04-07 2020-07-31 中冶赛迪重庆信息技术有限公司 一种基于图纸关联的浏览方法
CN111461066A (zh) * 2020-04-24 2020-07-28 北京联合普肯工程技术股份有限公司 过程工业流程图的识别方法及装置、电子设备
CN111859805B (zh) * 2020-07-21 2023-08-29 国网山东省电力公司青岛供电公司 基于人工智能的电力图纸拓扑关系的检测方法
CN112085791A (zh) * 2020-08-26 2020-12-15 广州市纬纶国际建筑设计有限公司 施工设计图纸自动定位方法、装置、设备以及存储介质
CN112100422A (zh) * 2020-09-24 2020-12-18 武汉百家云科技有限公司 工程图纸处理方法、装置、设备及存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10134144A (ja) * 1996-10-29 1998-05-22 Meidensha Corp 図面の認識方法
CN102609687A (zh) * 2012-01-31 2012-07-25 华中科技大学 一种地铁施工图纸及工程参数自动识别方法
WO2017113232A1 (zh) * 2015-12-30 2017-07-06 中国科学院深圳先进技术研究院 一种基于深度学习的产品分类方法及装置
CN107729946A (zh) * 2017-10-26 2018-02-23 广东欧珀移动通信有限公司 图片分类方法、装置、终端及存储介质

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2003108433A (ru) * 2003-03-28 2004-09-27 Аби Софтвер Лтд. (Cy) Способ предварительной обработки изображения машиночитаемой формы
RU2598300C2 (ru) * 2015-01-27 2016-09-20 Общество с ограниченной ответственностью "Аби Девелопмент" Способы и системы автоматического распознавания символов с использованием дерева решений
US9824304B2 (en) * 2015-10-06 2017-11-21 Adobe Systems Incorporated Determination of font similarity

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10134144A (ja) * 1996-10-29 1998-05-22 Meidensha Corp 図面の認識方法
CN102609687A (zh) * 2012-01-31 2012-07-25 华中科技大学 一种地铁施工图纸及工程参数自动识别方法
WO2017113232A1 (zh) * 2015-12-30 2017-07-06 中国科学院深圳先进技术研究院 一种基于深度学习的产品分类方法及装置
CN107729946A (zh) * 2017-10-26 2018-02-23 广东欧珀移动通信有限公司 图片分类方法、装置、终端及存储介质

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
工程技术文档全过程管理探析;高远霞;《石油化工设计》;20170525(第02期);第76-78页 *
试论图档管理系统的开发;尹承仁等;《中国勘察设计》;19990115(第01期);第14-16页 *

Also Published As

Publication number Publication date
CN110704880A (zh) 2020-01-17

Similar Documents

Publication Publication Date Title
CN110704880B (zh) 一种工程图纸的关联方法
US10635945B2 (en) Machine learning analysis of piping and instrumentation diagrams
US10339378B2 (en) Method and apparatus for finding differences in documents
US20100303356A1 (en) Method for processing optical character recognition (ocr) data, wherein the output comprises visually impaired character images
CN106547915B (zh) 基于模型库的智能数据提取方法
CN112818398B (zh) 针对大数据隐私保护的数据处理方法及大数据处理设备
CN111950922B (zh) 一种基于多源数据交互分析的装备经济数据评估方法
RU2640322C2 (ru) Способы и системы эффективного автоматического распознавания символов
CN115099321B (zh) 双向自回归无监督预训练微调式排污异常监控方法及应用
CN114724169A (zh) 一种二维图纸构件的识别方法及系统
CN115857905A (zh) 图形化编程的代码转换方法、装置、电子设备及存储介质
CN115860023A (zh) 基于二维码的卷烟设备管理方法、装置、电子设备及介质
CN110619128B (zh) 一种数字化工厂的建设方法
EP3933653A1 (en) Method and system for generating a digital representation of one or more engineering diagrams in a computing environment
Hung et al. Automatic vietnamese passport recognition on android phones
CN110688445B (zh) 一种数字化档案建设方法
CN110688457A (zh) 一种基于标识解析的汽摩行业文本信息录入方法
CN115982272A (zh) 一种城市大数据管理的数据标注方法、装置及计算机存储介质
CN116012456A (zh) 一种电力巡检机器人视觉定位方法
CN115171145A (zh) 图纸图元处理方法及装置
CN111859896B (zh) 配方文档检测方法、装置、计算机可读介质及电子设备
CN113850085B (zh) 企业的等级评估方法、装置、电子设备及可读存储介质
US20210097342A1 (en) Identifying reference data in a source data set
CN113360653A (zh) 获取文本意图的方法和系统
CN113887274A (zh) 电气工程数据的处理方法、装置、计算机设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant