CN111460556A - 图纸之间关联性的确定方法、装置、存储介质及终端 - Google Patents

图纸之间关联性的确定方法、装置、存储介质及终端 Download PDF

Info

Publication number
CN111460556A
CN111460556A CN202010247955.2A CN202010247955A CN111460556A CN 111460556 A CN111460556 A CN 111460556A CN 202010247955 A CN202010247955 A CN 202010247955A CN 111460556 A CN111460556 A CN 111460556A
Authority
CN
China
Prior art keywords
text
drawings
electronic engineering
engineering
determining
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010247955.2A
Other languages
English (en)
Other versions
CN111460556B (zh
Inventor
余芳强
彭阳
张铭
高尚
张明正
赵强
李晨辉
赵震
曹强
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Construction No 4 Group Co Ltd
Original Assignee
Shanghai Construction No 4 Group Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Construction No 4 Group Co Ltd filed Critical Shanghai Construction No 4 Group Co Ltd
Priority to CN202010247955.2A priority Critical patent/CN111460556B/zh
Publication of CN111460556A publication Critical patent/CN111460556A/zh
Application granted granted Critical
Publication of CN111460556B publication Critical patent/CN111460556B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • G06F16/90335Query processing
    • G06F16/90344Query processing by using string matching techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种工程项目中图纸之间关联性的确定方法、装置、存储介质及终端,该方法包括:根据一个工程项目的所有电子工程图纸的构件清单、空间划分清单和图纸类型清单,确定所有电子工程图纸中的文本语义集合;以及,根据每张电子工程图纸的文本内容,确定每张电子工程图纸的文本内容集合;根据所有电子工程图纸中的文本语义集合、以及每张电子工程图纸的文本内容集合,建立所有电子工程图纸之间的关联关系。本发明的方案,可以解决从多个相关图纸中查找某个区域的相关信息存在查找难度大的问题,达到提升从多个相关图纸中查找某个区域的相关信息的便捷性的效果。

Description

图纸之间关联性的确定方法、装置、存储介质及终端
技术领域
本发明属于建造工程信息化技术领域,涉及一种图纸之间关联性的确定方法、装置、存储介质及终端,具体涉及一种工程项目中图纸之间关联性的确定方法、装置、存储介质及终端,尤其涉及一种通过内容文本分析挖掘各个图纸之间关联关系的方法、装置、存储介质及终端。
背景技术
电子工程图纸是工程建造的核心资料,是建造的主要依据。由于工程规模不断增加,一个工程的电子图纸常常有上千份;并且随着工程不断进展,由于建造条件、技术更新和业主需求等的变化,工程图纸会不断完善和更新,使得图纸数量成倍增加,为使用带来大量麻烦。
特别地,随着工程中专业越来越多,构件越来越复杂,往往一张图不能够描述所有信息;因此需要查看多个相关的图纸才能准确了解某个区域的最终建造结果。另外,对于一个工程建造企业而言,如何从以往工程的图纸中查找相关的信息,也是工程建造企业的迫切需求。
上述内容仅用于辅助理解本发明的技术方案,并不代表承认上述内容是现有技术。
发明内容
本发明的目的在于,针对上述缺陷,提供一种工程项目中图纸之间关联性的确定方法、装置、存储介质及终端,以解决从多个相关图纸中查找某个区域的相关信息存在查找难度大的问题,达到提升从多个相关图纸中查找某个区域的相关信息的便捷性的效果。
本发明提供一种工程项目中图纸之间关联性的确定方法,包括:根据一个工程项目的所有电子工程图纸的构件清单、空间划分清单和图纸类型清单,确定所有电子工程图纸中的文本语义集合;以及,根据每张电子工程图纸的文本内容,确定每张电子工程图纸的文本内容集合;根据所有电子工程图纸中的文本语义集合、以及每张电子工程图纸的文本内容集合,建立所有电子工程图纸之间的关联关系。
可选地,其中,确定所有电子工程图纸中的文本语义集合,包括:确定该工程项目的所有电子工程图纸的构件清单,基于所有电子工程图纸的构件清单,建立构件文本语义集合;确定该工程项目的所有电子工程图纸的空间划分清单,基于所有电子工程图纸的空间划分清单,建立楼层名称文本集合和分区名称文本集合;确定该工程项目的所有电子工程图纸的图纸类型清单,基于所有电子工程图纸的图纸类型清单,建立图纸类型文本集合;和/或,确定每张电子工程图纸的文本内容集合,包括:针对该工程项目的每张电子工程图纸,确定每张电子工程图纸内所有文本元素的集合即文本集合;该文本集合中的文本元素,包括:文本内容、字号、中心点坐标和方向向量;根据字号,对每张电子工程图纸的文本集合中所有文本元素进行排序;按排序结果遍历每张电子工程图纸内所有文本集合中的所有文本元素,将字号和方向向量相同、且中心点距离小于设定距离的两个文本元素合并,得到该每张电子工程图纸的文本集合;提取每张电子工程图纸的文本集合中所有元素的文本内容,形成文本内容集合。
可选地,建立所有电子工程图纸之间的关联关系,包括:分别以所有电子工程图纸中的文本语义集合中的构件文本语义集合、楼层名称文本集合、分区名称文本集合、图纸类型文本集合,对每张电子工程图纸的文本内容集合进行字符串匹配和分词处理,得到所有电子工程图纸的语义关键词集合;以及,对每张电子工程图纸的文本内容集合进行最短路径分词算法进行分词处理,得到每张工程图纸的房间主题词集合;根据所有电子工程图纸的语义关键词集合、以及每张工程图纸的房间主题词集合,确定该工程项目中所有电子工程图纸之间的相关系数;针对每张电子工程图纸,选择所有相关系数中相关系数最大的设定数量个电子工程图纸与该张电子工程图纸之间建立关联,得到该张电子工程图纸在该工程项目中的关联关系,以此类推,得到该工程项目中所有电子工程图纸之间的关联关系。
可选地,还包括:基于所有电子工程图纸之间的关联关系,按设定排序方式对所有电子工程图纸进行排序,以基于排序结果对工程项目中的任一电子工程图纸进行查询和/或检索。
与上述方法相匹配,本发明另一方面提供一种工程项目中图纸之间关联性的确定装置,包括:确定单元,用于根据一个工程项目的所有电子工程图纸的构件清单、空间划分清单和图纸类型清单,确定所有电子工程图纸中的文本语义集合;以及,确定单元,还用于根据每张电子工程图纸的文本内容,确定每张电子工程图纸的文本内容集合;关联单元,用于根据所有电子工程图纸中的文本语义集合、以及每张电子工程图纸的文本内容集合,建立所有电子工程图纸之间的关联关系。
可选地,其中,确定单元确定所有电子工程图纸中的文本语义集合,包括:确定该工程项目的所有电子工程图纸的构件清单,基于所有电子工程图纸的构件清单,建立构件文本语义集合;确定该工程项目的所有电子工程图纸的空间划分清单,基于所有电子工程图纸的空间划分清单,建立楼层名称文本集合和分区名称文本集合;确定该工程项目的所有电子工程图纸的图纸类型清单,基于所有电子工程图纸的图纸类型清单,建立图纸类型文本集合;和/或,确定单元确定每张电子工程图纸的文本内容集合,包括:针对该工程项目的每张电子工程图纸,确定每张电子工程图纸内所有文本元素的集合即文本集合;该文本集合中的文本元素,包括:文本内容、字号、中心点坐标和方向向量;根据字号,对每张电子工程图纸的文本集合中所有文本元素进行排序;按排序结果遍历每张电子工程图纸内所有文本集合中的所有文本元素,将字号和方向向量相同、且中心点距离小于设定距离的两个文本元素合并,得到该每张电子工程图纸的文本集合;提取每张电子工程图纸的文本集合中所有元素的文本内容,形成文本内容集合。
可选地,关联单元建立所有电子工程图纸之间的关联关系,包括:分别以所有电子工程图纸中的文本语义集合中的构件文本语义集合、楼层名称文本集合、分区名称文本集合、图纸类型文本集合,对每张电子工程图纸的文本内容集合进行字符串匹配和分词处理,得到所有电子工程图纸的语义关键词集合;以及,对每张电子工程图纸的文本内容集合进行最短路径分词算法进行分词处理,得到每张工程图纸的房间主题词集合;根据所有电子工程图纸的语义关键词集合、以及每张工程图纸的房间主题词集合,确定该工程项目中所有电子工程图纸之间的相关系数;针对每张电子工程图纸,选择所有相关系数中相关系数最大的设定数量个电子工程图纸与该张电子工程图纸之间建立关联,得到该张电子工程图纸在该工程项目中的关联关系,以此类推,得到该工程项目中所有电子工程图纸之间的关联关系。
可选地,还包括:关联单元,还用于基于所有电子工程图纸之间的关联关系,按设定排序方式对所有电子工程图纸进行排序,以基于排序结果对工程项目中的任一电子工程图纸进行查询和/或检索。
与上述装置相匹配,本发明再一方面提供一种终端,包括:以上所述的工程项目中图纸之间关联性的确定装置。
与上述方法相匹配,本发明再一方面提供一种存储介质,包括:所述存储介质中存储有多条指令;所述多条指令,用于由处理器加载并执行以上所述的工程项目中图纸之间关联性的确定方法。
与上述方法相匹配,本发明再一方面提供一种终端,包括:处理器,用于执行多条指令;存储器,用于存储多条指令;其中,所述多条指令,用于由所述存储器存储,并由所述处理器加载并执行以上所述的工程项目中图纸之间关联性的确定方法。
由此,本发明的方案,通过根据电子工程图纸的内容,分析图纸关联的构件和空间划分,建立图纸之间的关联关系,解决从多个相关图纸中查找某个区域的相关信息存在查找难度大的问题,达到提升从多个相关图纸中查找某个区域的相关信息的便捷性的效果。
本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。
下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。
附图说明
图1为本发明的工程项目中图纸之间关联性的确定方法的一实施例的流程示意图;
图2为本发明的方法中确定所有电子工程图纸中的文本语义集合的一实施例的流程示意图;
图3为本发明的方法中确定每张电子工程图纸的文本内容集合的一实施例的流程示意图;
图4为本发明的方法中建立所有电子工程图纸之间的关联关系的一实施例的流程示意图;
图5为本发明的工程项目中图纸之间关联性的确定装置的一实施例的结构示意图;
图6为电子工程图纸的设备编码标注方式示意图;
图7为一种基于文本分析的电子工程图纸半自动关联方法的一实施例的流程示意图;
图8为电子工程图纸的一实施例的图纸内容示例图;
图9为电子工程图纸的另一实施例的图纸内容示例图。
结合附图,本发明实施例中附图标记如下:
102-确定单元;104-关联单元。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明具体实施例及相应的附图对本发明技术方案进行清楚、完整地描述。显然,所描述的实施例仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
根据本发明的实施例,提供了一种工程项目中图纸之间关联性的确定方法,如图1所示本发明的方法的一实施例的流程示意图。该工程项目中图纸之间关联性的确定方法可以包括:步骤S110至步骤S130。
步骤S110,获取一个工程项目的所有电子工程图纸,根据一个工程项目的所有电子工程图纸的构件清单、空间划分清单和图纸类型清单,确定所有电子工程图纸中的文本语义集合。例如:针对一个工程项目,基于构件清单、空间划分清单和图纸类型清单,建立文本语义集合。
可选地,可以结合图2所示本发明的方法中确定所有电子工程图纸中的文本语义集合的一实施例流程示意图,进一步说明步骤S110中确定所有电子工程图纸中的文本语义集合的具体过程,可以包括:步骤S210至步骤S230。
步骤S210,确定该工程项目的所有电子工程图纸的构件清单,基于所有电子工程图纸的构件清单,建立构件文本语义集合。
例如:导入构件清单,建立构件文本语义集合。构件文本语义集合,可以包括:构件名称文本集合{eni}和构件类型名称文本集合{tni}。对于字数不小于L字符的文本(优选L=4),使用自然语言分析的关键词提取算法,整理为若干语义表达的字典形式,然后剔除构件名称文本集合{eni}和构件类型名称文本集合{tni}中的重复元素。其中,该导入,可以是人工导入,因为每个工程项目的构件清单都不相同。如表1所示,构件名称文本集合{eni}={“EF-1F-02”,“EF-1F-03”,“EF-4F-03”,“EF-4F-04”,……},构件类型文本原始集合={“离心式风机箱”,“管道风机”,……},由于一些文本字数>L,处理为语义集合后得到{tni}={“离心式风机箱”:“离心-风机-风机箱”,“管道风机”:“风机”,……}。
表1:构件类型表示意图
Figure BDA0002434447560000061
步骤S220,确定该工程项目的所有电子工程图纸的空间划分清单,基于所有电子工程图纸的空间划分清单,建立楼层名称文本集合和分区名称文本集合。
例如:导入空间划分清单,可以包括楼层名称文本集合{fni}和分区名称文本集合{ani},同上使用自然语言分析算法提取关键词,并增加同义词(即将这些关键词的同义词也加入进来),整理为语义表达的字典形式,然后剔除楼层名称文本集合{fni}和分区名称文本集合{ani}中的重复元素。其中,对于每个集合,都再增加一些同义词到本集合。如表2所示,楼层名称文本语义集合={“B2/地下二层”:“B2-地下二层”,“B1/地下一层”:“B1-地下一层”,“1F/首层”:“1F-首层-一楼-1楼”,“2F/二层”:“2F-二层-二楼”,……},分区名称语义集合={“地下室”:“地下室-地下”,“裙房”,……}。
表2:空间划分表示意图
Figure BDA0002434447560000062
步骤S230,确定该工程项目的所有电子工程图纸的图纸类型清单,基于所有电子工程图纸的图纸类型清单,建立图纸类型文本集合。
例如:导入图纸类型清单,可以包括常见的图纸类型名称,即为{ttyi},如前述表3所示,图纸类型文本集合为{“平面图”、“立面图”、“剖面图”、“系统图”,……}。
由此,通过一个工程项目的所有电子工程图纸的构件清单、空间划分清单、图纸类型清单,建立构件文本语义集合、楼层名称文本集合、分区名称文本集合、图纸类型文本集合,形成所有电子工程图纸的文本语义集合,以实现对该工程项目的所有电子工程图纸的文本语义信息的精准确定。
以及,步骤S120,根据每张电子工程图纸的文本内容,确定每张电子工程图纸的文本内容集合。例如:读取每张工程图纸tj中的文本词组{tcj}。
可选地,可以结合图3所示本发明的方法中确定每张电子工程图纸的文本内容集合的一实施例流程示意图,进一步说明步骤S120中确定每张电子工程图纸的文本内容集合的具体过程,可以包括:步骤S310至步骤S340。
步骤S310,针对该工程项目的每张电子工程图纸,确定每张电子工程图纸内所有文本元素的集合即文本集合。该文本集合中的文本元素,可以包括:文本内容、字号、中心点坐标和方向向量。
例如:针对该工程项目的每张电子工程图纸tj,读取图纸tj内所有文本元素,记为集合{ttj};元素ttj是四元组,可以包括:文本内容cj、字号sj、中心点坐标lcj和方向向量vej,ttj=(cj,sj,lcj,vej)。如图8所示,{ttj}为{[[“EF”,50,(300,200),(1,0)]],[[“1F-03”,50,(300,140),(1,0)]],……}。
步骤S320,根据字号,对每张电子工程图纸的文本集合中所有文本元素进行排序。例如:根据字号sj,对图纸tj内所有文本元素的集合{ttj}中所有元素进行正序排序。
步骤S330,按排序结果遍历每张电子工程图纸内所有文本集合中的所有文本元素,将字号和方向向量相同、且中心点距离小于设定距离的两个文本元素合并,得到该每张电子工程图纸的文本集合。
例如:顺序遍历图纸tj内所有文本元素的集合{ttj}中所有元素,将字号和方向向量一样、中心点距离小于距离d的两个文本词组tti和ttj合并,即将“tci-tcj”设置为新的tci和tcj。d优选为4倍sj。如图8所示,[“EF”,50,(300,200),(1,0)]和[“1F-03”,50,(300,140),(1,0)]字号相同,中心点坐标距离60小于2*50,将两个文本内容进行合并,变为[“EF-1F-03”,50,(300,200),(1,0)],[“EF-1F-03”,50,(300,140),(1,0)]。
步骤S340,提取每张电子工程图纸的文本集合中所有元素的文本内容,形成文本内容集合。
例如:将图纸tj内所有文本元素的集合{ttj}中所有元素文本内容提取出来,并剔除相同的文本内容,形成文本内容集合{tcj}。如图8所示,TC1={“EF-1F-02”、“EF-1F-03”、“EF-1F-04”、“门诊大厅排风”、“消控中心室外机”、“门诊大厅排风”、“卫生间排风”、“接自地下室”}。如图9所示,TC2={“EF-1F-02”、“EF-1F-03”、“FVDH”、“PS”、“排风对外百叶”、“消防控制中心”}。
由此,通过确定每张电子工程图纸的文本内容集合,可以准确得到一个工程项目中每张电子工程图纸的文本内容信息。
步骤S130,根据所有电子工程图纸中的文本语义集合、以及每张电子工程图纸的文本内容集合,建立所有电子工程图纸之间的关联关系。
其中,本发明的方案中,根据所有电子工程图纸中的文本语义集合、以及每张电子工程图纸的文本内容集合建立所有电子工程图纸之间的关联关系,文本内容及其语义是自然语言处理后的结果,判断的方法可以认为是关键语义的模糊匹配,去除了次要语义的干扰。
另外,本发明的方案中的关联方法,是基于主题词的匹配,而非全部文本直接判断异同。例如:对于图纸中约定的常见文字,采用最短路径分词,使用关键字匹配,可以剔除无关语义的影响,增加准确性;图纸中大量存在的其它文本,这些文本是动态的无法事先预料;可以对图纸中所有文本内容做语义匹配。此外,最终判断结果是一个反映相似程度的数字,而不是非黑即白,这样增加了正匹配的概率,更为科学。
由此,通过内容文本分析挖掘各个图纸之间关联关系的方式,通过根据电子工程图纸内容,快速分析图纸关联的构件和空间划分,建立图纸之间的关联关系,方便图纸查看与检索。
可选地,步骤S130中根据所有电子工程图纸中的文本语义集合、以及每张电子工程图纸的文本内容集合,建立所有电子工程图纸之间的关联关系的具体过程,可以参见以下示例性说明。
下面结合图4所示本发明的方法中建立所有电子工程图纸之间的关联关系的一实施例流程示意图,进一步说明步骤S130中建立所有电子工程图纸之间的关联关系的具体过程,可以包括:步骤S410至步骤S440。
步骤S410,分别以所有电子工程图纸中的文本语义集合中的构件文本语义集合、楼层名称文本集合、分区名称文本集合、图纸类型文本集合,对每张电子工程图纸的文本内容集合进行字符串匹配和分词处理,得到所有电子工程图纸的语义关键词集合。
例如:分别以前述获取的构件名称语义集合{eni}、构件类型名称语义集合{tni}、楼层名称语义集合{fni}、分区名称语义集合{ani}对文本内容集合{tcj}(即文本词组)进行匹配和分词,分别得到构件名称语义关键词、楼层名称语义关键词、分区名称语义关键词、图纸类型语义关键词,形成语义关键词集合。
具体地,针对构件名称文本集合{eni}每个元素eni,采用字符串匹配方式,计算(即字符串匹配的过程)文本集合{tcj}中是否有元素可以包括元素eni;如果有,则将元素eni加入集合Tj={tnk}供相关系数的确定使用。如图8所示,E1={“EF-1F-02”、“EF-1F-03”、“EF-1F-04”};如图9所示,E2={“EF-1F-02”、“EF-1F-03”}。
具体地,针对构件类型文本集合{tni}每个元素tni,采用字符串匹配方式,计算文本集合{tcj}中是否有元素可以包括元素eni的语义关键词;如果有,则将元素tni加入集合Ej={enk}供相关系数的确定使用。如图8和图9所示,T1={“风机”,“风机箱”},T2={“风机”}。
具体地,针对文本集合{tci}和楼层名称文本集合{fni}每个元素tci、fni,采用字符串匹配方式,计算文本集合{tcj}中是否有元素可以包括元素tci或fni的语义关键词;如果有,则将元素fni加入集合Fj={fnk},若{tcj}中元素包含{tci}中元素tci,也是将对应的{fni}加入到集合Fj中供相关系数的确定使用。如图8和图9所示,F1={“1F/首层”,“4F/四层”},F2={“1F/首层”}。
具体地,针对文本集合{ani}、{aci}每个元素ani、aci,采用字符串匹配方式,计算文本集合{tcj}中是否有元素可以包括元素ani或aci的语义关键词;如果有,则将元素ani加入集合Fj={ank},若{tcj}中元素包含{aci}中元素aci,也是将对应的{ani}加入到集合Aj中供相关系数的确定使用。如图8所示,A1={“地下室”},图9,A2为空集。
具体地,针对文本集合{ttyi};每个元素ttyi,采用字符串匹配方式,计算文本集合{tcj}中是否有元素可以包括元素ttyi;如果有,则将元素ttyi加入集合Yj={ttyk}供相关系数的确定使用。如图8所示,Y1={“平面图”},图9,Y2={“系统图”}。以及,
步骤S420,对每张电子工程图纸的文本内容集合进行最短路径分词算法进行分词处理,得到每张工程图纸的房间主题词集合。
例如:获取房间主题词:对集合{tcj}用N最短路径分词算法进行分词。若有词属于“位置词”集合{“室”、“间”、“房”、“站”、“库”、“厅”、“中心”},则将该词与前一个词语合并,加入表示房间的主题词集合Rj={rj}。例如{……,“体检”,“中心”,……}的“中心”属于位置词集合,则与前一词合并为“体检中心”表示一个完整的位置。若有词包含以上位置词,例如“卫生间”本身就是一个完整位置,则直接将其加入Rj供步骤5使用。如图8所示,R1可以包括{“消防控制中心”、“门诊大厅”、“卫生间”、“地下室”}。如图9所示,R2可以包括{“门诊大厅”、“消防控制中心”}。
步骤S430,根据所有电子工程图纸的语义关键词集合、以及每张工程图纸的房间主题词集合,确定该工程项目中所有电子工程图纸之间的相关系数。
例如:计算图纸之间相关系数:例如针对2个图纸ti和tj,按步骤3和4得到ti对应的Ei、Ti、Fi、Ai、Ri、Yi,以及tj对应的Ej、Tj、Fj、Aj、Rj、Yj。然后计算它们对应集合的交集IEij=Ej∩Ei,ITij=Tj∩Ti,IFij=Fj∩Fi,IAij=Aj∩Ai,IRij=Rj∩Ri。IYij=Yj∩Yi则tj对于ti的相关系数rij的计算公式优选如下:
Figure BDA0002434447560000101
其中,pe、pt、pf、pa、pr、pr是加权系数。Card(Ej)表示集合Ej的元素数量。优选地,pe=pt=0.25;pf=pa=0.1,pr=py=0.15。IEij,ITij,IFij,IAij,IRij;IYij等集合,是两个图纸文件中一一对应的元素集合,I表示交集。如图8和图9所示,IE12={“EF-1F-02”、“EF-1F-03”},IT12={“风机”},IF12={“1F/首层”},IA12=空集,IR12={“门诊大厅”、“消防控制中心”},IY12=空集。则:
Figure BDA0002434447560000111
Figure BDA0002434447560000112
步骤S440,针对每张电子工程图纸,选择所有相关系数中相关系数最大的设定数量个电子工程图纸与该张电子工程图纸之间建立关联,得到该张电子工程图纸在该工程项目中的关联关系,以此类推,得到该工程项目中所有电子工程图纸之间的关联关系。
例如:建立图纸之间的关联关系:针对每个图纸ti,选择所有相关系数rij中相关系数最大的n个图纸tj,在数据库的关系表中以添加记录的方式建立ti和tj之间的关联关系,并按rij大小进行正序排序,存入数据库,方便图纸查看时检索相关的图纸。如图8和图9所示,针对图7,将表3作为图7的关联图纸,并排序靠前;对于表3,将图7作为表3的关联图纸,但排序比较靠后。
由此,通过根据所有电子工程图纸中的文本语义集合、以及每张电子工程图纸的文本内容集合,准确建立所有电子工程图纸之间的关联关系,以方便用户查询和检索。
在一个可选实施方式中,上述工程项目中图纸之间关联性的确定方法,还可以包括:基于所有电子工程图纸之间的关联关系,按设定排序方式对所有电子工程图纸进行排序,以基于排序结果对工程项目中的任一电子工程图纸进行查询和/或检索。
由此,通过快速分析一个工程项目中各个电子工程图纸中可以包括的主要构件和涉及的空间划分,然后通过构件和空间划分建立各个工程图纸之间的关联,并进行准确排序,提高工程图纸的查阅和相互索引效率。
经大量的试验验证,采用本实施例的技术方案,通过内容文本分析挖掘各个图纸之间关联关系,可以方便使用者根据关联关系对图纸进行查看与检索,提升用户从多个相关图纸中查找某个区域的相关信息的便捷性。
根据本发明的实施例,还提供了对应于工程项目中图纸之间关联性的确定方法的一种工程项目中图纸之间关联性的确定装置。参见图5所示本发明的装置的一实施例的结构示意图。该工程项目中图纸之间关联性的确定装置可以包括:确定单元102和关联单元104。
在一个可选例子中,确定单元102,可以用于获取一个工程项目的所有电子工程图纸,根据一个工程项目的所有电子工程图纸的构件清单、空间划分清单和图纸类型清单,确定所有电子工程图纸中的文本语义集合。例如:针对一个工程项目,基于构件清单、空间划分清单和图纸类型清单,建立文本语义集合。该确定单元102的具体功能及处理参见步骤S110。
可选地,确定单元102确定所有电子工程图纸中的文本语义集合,可以包括:
确定单元102,具体还可以用于确定该工程项目的所有电子工程图纸的构件清单,基于所有电子工程图纸的构件清单,建立构件文本语义集合。该确定单元102的具体功能及处理还参见步骤S210。
例如:导入构件清单,建立构件文本语义集合。构件文本语义集合,可以包括:构件名称文本集合{eni}和构件类型名称文本集合{tni}。对于字数不小于L字符的文本(优选L=4),使用自然语言分析的关键词提取算法,整理为若干语义表达的字典形式,然后剔除构件名称文本集合{eni}和构件类型名称文本集合{tni}中的重复元素。其中,该导入,可以是人工导入,因为每个工程项目的构件清单都不相同。如前述表1所示,构件名称文本集合{eni}={“EF-1F-02”,“EF-1F-03”,“EF-4F-03”,“EF-4F-04”,……},构件类型文本原始集合={“离心式风机箱”,“管道风机”,……},由于一些文本字数>L,处理为语义集合后得到{tni}={“离心式风机箱”:“离心-风机-风机箱”,“管道风机”:“风机”,……}。
确定单元102,具体还可以用于确定该工程项目的所有电子工程图纸的空间划分清单,基于所有电子工程图纸的空间划分清单,建立楼层名称文本集合和分区名称文本集合。该确定单元102的具体功能及处理还参见步骤S220。
例如:导入空间划分清单,可以包括楼层名称文本集合{fni}和分区名称文本集合{ani},同上使用自然语言分析算法提取关键词,并增加同义词(即将这些关键词的同义词也加入进来),整理为语义表达的字典形式,然后剔除楼层名称文本集合{fni}和分区名称文本集合{ani}中的重复元素。其中,对于每个集合,都再增加一些同义词到本集合。如前述表2所示,楼层名称文本语义集合={“B2/地下二层”:“B2-地下二层”,“B1/地下一层”:“B1-地下一层”,“1F/首层”:“1F-首层-一楼-1楼”,“2F/二层”:“2F-二层-二楼”,……},分区名称语义集合={“地下室”:“地下室-地下”,“裙房”,……}。
确定单元102,具体还可以用于确定该工程项目的所有电子工程图纸的图纸类型清单,基于所有电子工程图纸的图纸类型清单,建立图纸类型文本集合。该确定单元102的具体功能及处理还参见步骤S230。
例如:导入图纸类型清单,可以包括常见的图纸类型名称,即为{ttyi},如前述表3所示,图纸类型文本集合为{“平面图”、“立面图”、“剖面图”、“系统图”,……}。
由此,通过一个工程项目的所有电子工程图纸的构件清单、空间划分清单、图纸类型清单,建立构件文本语义集合、楼层名称文本集合、分区名称文本集合、图纸类型文本集合,形成所有电子工程图纸的文本语义集合,以实现对该工程项目的所有电子工程图纸的文本语义信息的精准确定。
以及,在一个可选例子中,确定单元102,还可以用于根据每张电子工程图纸的文本内容,确定每张电子工程图纸的文本内容集合。例如:读取每张工程图纸tj中的文本词组{tcj}。该确定单元102的具体功能及处理还参见步骤S120。
可选地,确定单元102确定每张电子工程图纸的文本内容集合,可以包括:
确定单元102,具体还可以用于针对该工程项目的每张电子工程图纸,确定每张电子工程图纸内所有文本元素的集合即文本集合。该文本集合中的文本元素,可以包括:文本内容、字号、中心点坐标和方向向量。该确定单元102的具体功能及处理还参见步骤S310。
例如:针对该工程项目的每张电子工程图纸tj,读取图纸tj内所有文本元素,记为集合{ttj};元素ttj是四元组,可以包括:文本内容cj、字号sj、中心点坐标lcj和方向向量vej,ttj=(cj,sj,lcj,vej)。如图8所示,{ttj}为{[[“EF”,50,(300,200),(1,0)]],[[“1F-03”,50,(300,140),(1,0)]],……}。
确定单元102,具体还可以用于根据字号,对每张电子工程图纸的文本集合中所有文本元素进行排序。例如:根据字号sj,对图纸tj内所有文本元素的集合{ttj}中所有元素进行正序排序。该确定单元102的具体功能及处理还参见步骤S320。
确定单元102,具体还可以用于按排序结果遍历每张电子工程图纸内所有文本集合中的所有文本元素,将字号和方向向量相同、且中心点距离小于设定距离的两个文本元素合并,得到该每张电子工程图纸的文本集合。该确定单元102的具体功能及处理还参见步骤S330。
例如:顺序遍历图纸tj内所有文本元素的集合{ttj}中所有元素,将字号和方向向量一样、中心点距离小于距离d的两个文本词组tti和ttj合并,即将“tci-tcj”设置为新的tci和tcj。d优选为4倍sj。如图8所示,[“EF”,50,(300,200),(1,0)]和[“1F-03”,50,(300,140),(1,0)]字号相同,中心点坐标距离60小于2*50,将两个文本内容进行合并,变为[“EF-1F-03”,50,(300,200),(1,0)],[“EF-1F-03”,50,(300,140),(1,0)]。
确定单元102,具体还可以用于提取每张电子工程图纸的文本集合中所有元素的文本内容,形成文本内容集合。该确定单元102的具体功能及处理还参见步骤S340。
例如:将图纸tj内所有文本元素的集合{ttj}中所有元素文本内容提取出来,并剔除相同的文本内容,形成文本内容集合{tcj}。如图8所示,TC1={“EF-1F-02”、“EF-1F-03”、“EF-1F-04”、“门诊大厅排风”、“消控中心室外机”、“门诊大厅排风”、“卫生间排风”、“接自地下室”}。如图9所示,TC2={“EF-1F-02”、“EF-1F-03”、“FVDH”、“PS”、“排风对外百叶”、“消防控制中心”}。
由此,通过确定每张电子工程图纸的文本内容集合,可以准确得到一个工程项目中每张电子工程图纸的文本内容信息。
在一个可选例子中,关联单元104,可以用于根据所有电子工程图纸中的文本语义集合、以及每张电子工程图纸的文本内容集合,建立所有电子工程图纸之间的关联关系。该关联单元104的具体功能及处理参见步骤S130。
其中,本发明的方案中,根据所有电子工程图纸中的文本语义集合、以及每张电子工程图纸的文本内容集合建立所有电子工程图纸之间的关联关系,文本内容及其语义是自然语言处理后的结果,判断的方法可以认为是关键语义的模糊匹配,去除了次要语义的干扰。
另外,本发明的方案中的关联方法,是基于主题词的匹配,而非全部文本直接判断异同。例如:对于图纸中约定的常见文字,采用最短路径分词,使用关键字匹配,可以剔除无关语义的影响,增加准确性;图纸中大量存在的其它文本,这些文本是动态的无法事先预料;可以对图纸中所有文本内容做语义匹配。此外,最终判断结果是一个反映相似程度的数字,而不是非黑即白,这样增加了正匹配的概率,更为科学。
由此,通过内容文本分析挖掘各个图纸之间关联关系的方式,通过根据电子工程图纸内容,快速分析图纸关联的构件和空间划分,建立图纸之间的关联关系,方便图纸查看与检索。
可选地,关联单元104根据所有电子工程图纸中的文本语义集合、以及每张电子工程图纸的文本内容集合,建立所有电子工程图纸之间的关联关系,可以包括:
关联单元104,具体还可以用于分别以所有电子工程图纸中的文本语义集合中的构件文本语义集合、楼层名称文本集合、分区名称文本集合、图纸类型文本集合,对每张电子工程图纸的文本内容集合进行字符串匹配和分词处理,得到所有电子工程图纸的语义关键词集合。该关联单元104的具体功能及处理还参见步骤S410。
例如:分别以前述获取的构件名称语义集合{eni}、构件类型名称语义集合{tni}、楼层名称语义集合{fni}、分区名称语义集合{ani}对文本内容集合{tcj}(即文本词组)进行匹配和分词,分别得到构件名称语义关键词、楼层名称语义关键词、分区名称语义关键词、图纸类型语义关键词,形成语义关键词集合。
具体地,针对构件名称文本集合{eni}每个元素eni,采用字符串匹配方式,计算(即字符串匹配的过程)文本集合{tcj}中是否有元素可以包括元素eni;如果有,则将元素eni加入集合Tj={tnk}供相关系数的确定使用。如图8所示,E1={“EF-1F-02”、“EF-1F-03”、“EF-1F-04”};如图9所示,E2={“EF-1F-02”、“EF-1F-03”}。
具体地,针对构件类型文本集合{tni}每个元素tni,采用字符串匹配方式,计算文本集合{tcj}中是否有元素可以包括元素eni的语义关键词;如果有,则将元素tni加入集合Ej={enk}供相关系数的确定使用。如图8和图9所示,T1={“风机”,“风机箱”},T2={“风机”}。
具体地,针对文本集合{tci}和楼层名称文本集合{fni}每个元素tci、fni,采用字符串匹配方式,计算文本集合{tcj}中是否有元素可以包括元素tci或fni的语义关键词。如果有,则将元素fni加入集合Fj={fnk},若{tcj}中元素包含{tci}中元素tci,也是将对应的{fni}加入到集合Fj中供相关系数的确定使用。如图8和图9所示,F1={“1F/首层”,“4F/四层”},F2={“1F/首层”}。
具体地,针对文本集合{ani}、{aci}每个元素ani、aci,采用字符串匹配方式,计算文本集合{tcj}中是否有元素可以包括元素ani或aci的语义关键词;如果有,则将元素ani加入集合Fj={ank},若{tcj}中元素包含{aci}中元素aci,也是将对应的{ani}加入到集合Aj中供相关系数的确定使用。如图8所示,A1={“地下室”},图9,A2为空集。
具体地,针对文本集合{ttyi};每个元素ttyi,采用字符串匹配方式,计算文本集合{tcj}中是否有元素可以包括元素ttyi;如果有,则将元素ttyi加入集合Yj={ttyk}供相关系数的确定使用。如图8所示,Y1={“平面图”},图9,Y2={“系统图”}。以及,
关联单元104,具体还可以用于对每张电子工程图纸的文本内容集合进行最短路径分词算法进行分词处理,得到每张工程图纸的房间主题词集合。该关联单元104的具体功能及处理还参见步骤S420。
例如:获取房间主题词:对集合{tcj}用N最短路径分词算法进行分词。若有词属于“位置词”集合{“室”、“间”、“房”、“站”、“库”、“厅”、“中心”},则将该词与前一个词语合并,加入表示房间的主题词集合Rj={rj}。例如{……,“体检”,“中心”,……}的“中心”属于位置词集合,则与前一词合并为“体检中心”表示一个完整的位置。若有词包含以上位置词,例如“卫生间”本身就是一个完整位置,则直接将其加入Rj供步骤5使用。如图8所示,R1可以包括{“消防控制中心”、“门诊大厅”、“卫生间”、“地下室”}。如图9所示,R2可以包括{“门诊大厅”、“消防控制中心”}。
关联单元104,具体还可以用于根据所有电子工程图纸的语义关键词集合、以及每张工程图纸的房间主题词集合,确定该工程项目中所有电子工程图纸之间的相关系数。该关联单元104的具体功能及处理还参见步骤S430。
例如:计算图纸之间相关系数:例如针对2个图纸ti和tj,按步骤3和4得到ti对应的Ei、Ti、Fi、Ai、Ri、Yi,以及tj对应的Ej、Tj、Fj、Aj、Rj、Yj。然后计算它们对应集合的交集IEij=Ej∩Ei,ITij=Tj∩Ti,IFij=Fj∩Fi,IAij=Aj∩Ai,IRij=Rj∩Ri;IYij=Yj∩Yi则tj对于ti的相关系数rij的计算公式优选如下:
Figure BDA0002434447560000161
其中,pe、pt、pf、pa、pr、pr是加权系数。Card(Ej)表示集合Ej的元素数量。优选地,pe=pt=0.25;pf=pa=0.1,pr=py=0.15。IEij,ITij,IFij,IAij,IRij;IYij等集合,是两个图纸文件中一一对应的元素集合,I表示交集。如图8和图9所示,IE12={“EF-1F-02”、“EF-1F-03”},IT12={“风机”},IF12={“1F/首层”},IA12=空集,IR12={“门诊大厅”、“消防控制中心”},IY12=空集;则:
Figure BDA0002434447560000171
Figure BDA0002434447560000172
关联单元104,具体还可以用于针对每张电子工程图纸,选择所有相关系数中相关系数最大的设定数量个电子工程图纸与该张电子工程图纸之间建立关联,得到该张电子工程图纸在该工程项目中的关联关系,以此类推,得到该工程项目中所有电子工程图纸之间的关联关系。该关联单元104的具体功能及处理还参见步骤S440。
例如:建立图纸之间的关联关系:针对每个图纸ti,选择所有相关系数rij中相关系数最大的n个图纸tj,在数据库的关系表中以添加记录的方式建立ti和tj之间的关联关系,并按rij大小进行正序排序,存入数据库,方便图纸查看时检索相关的图纸。如图8和图9所示,针对图7,将表3作为图7的关联图纸,并排序靠前;对于表3,将图7作为表3的关联图纸,但排序比较靠后。
由此,通过根据所有电子工程图纸中的文本语义集合、以及每张电子工程图纸的文本内容集合,准确建立所有电子工程图纸之间的关联关系,以方便用户查询和检索。
在一个可选实施方式中,上述工程项目中图纸之间关联性的确定装置,还可以包括:关联单元104,还可以用于基于所有电子工程图纸之间的关联关系,按设定排序方式对所有电子工程图纸进行排序,以基于排序结果对工程项目中的任一电子工程图纸进行查询和/或检索。
由此,通过快速分析一个工程项目中各个电子工程图纸中可以包括的主要构件和涉及的空间划分,然后通过构件和空间划分建立各个工程图纸之间的关联,并进行准确排序,提高工程图纸的查阅和相互索引效率。
由于本实施例的装置所实现的处理及功能基本相应于前述图1至图4所示的方法的实施例、原理和实例,故本实施例的描述中未详尽之处,可以参见前述实施例中的相关说明,在此不做赘述。
经大量的试验验证,采用本发明的技术方案,通过根据电子工程图纸的内容,分析图纸关联的构件和空间划分,建立图纸之间的关联关系,可以方便图纸查看与检索。
根据本发明的实施例,还提供了对应于工程项目中图纸之间关联性的确定装置的一种终端。该终端可以包括:以上所述的工程项目中图纸之间关联性的确定装置。
海量的电子工程图纸详细地描述了工程的构件和空间划分。其中构件是工程的基本组成单元,空间划分是工程内使用空间的基本划分。譬如采用平、立、剖面图以及详图等描述构件和空间的几何形状和位置,通过文本标注构件的名称和类型,通过分层和分区等方式描述工程中的空间划分。根据工程制图规范,图纸中一般有主要构件的结构化清单,以及分区和分层的结构化清单。而工程中常见的房间,其命名有通用格式,大都以“室”、“间”、“库”、“房”等字结尾,有利于文本分析。另外图纸类型也是电子工程图纸很重要的信息,制图标准规定了常规的图纸类型,如表3所示。因此,可结合工程图纸制图规范、构件和空间划分的命名规范,从图纸内容中挖掘关联的构件和空间划分,然后根据构件和空间划分建立图纸之间的关联,支持图纸相互参考。
表3:各专业工程图纸类型
通用图纸类型 建筑专业图纸类型 结构专业图纸类型 给排水专业图纸类型
图纸目录 图纸目录 图纸目录 图纸目录
设计说明 设计说明 设计说明 设计说明
主要设备材料表 材料表 轴线平面图 主要设备器材表
平面图 分区图 桩平面图 系统图
系统图系统 防火分区图 墙平面图 平面图
立面图 图框图 结构布置图 节点图
剖面图 柱墙图 模板平面图 卫生间图
大样图 轴线图 板配筋图 机房详图
详图 洞口图 梁配筋图 设备详图
清单 平面图 楼梯详图 其他详图
简图 屋面图 坡道详图 总平面详图
三维视图 立面图 核心筒详图 高程表总图
剖面图 暗柱详图 纵断总图
核心筒详图 水池详图 人防图
楼梯详图 节点详图
电梯详图 钢结构详图
扶梯详图 预应力详图
自动步道详图 人防图
坡道详图
卫生间详图
厨房详图
墙身详图
节点详图
门窗详图
幕墙详图
但工程图纸制图过程常有一些构件名称标记标准模块,如图6所示,常常将构件名称分为两行,上面一行为标准的构件类型编码,下面一行为每个构件的编码;从而导致不能直接获取包含构件名称的文本词组,需要进行针对性的处理。
本发明的方案,提供一种基于文本分析的电子工程图纸半自动关联方法,具体是一种通过内容文本分析挖掘各个图纸之间关联关系的方法,可以通过根据电子工程图纸内容,快速分析图纸关联的构件和空间划分,建立图纸之间的关联关系,方便图纸查看与检索。
如图7所示,本发明的方案提供的一种基于文本分析的电子工程图纸半自动关联方法,可以包括以下步骤:
步骤1:针对一个工程项目,基于构件清单、空间划分和图纸类型清单,建立文本语义集合,具体可以包括:
步骤1.1导入构件清单,建立构件文本语义集合。构件文本语义集合,可以包括:构件名称文本集合{eni}和构件类型名称文本集合{tni}。对于字数不小于L字符的文本(优选L=4),使用自然语言分析的关键词提取算法,整理为若干语义表达的字典形式,然后剔除构件名称文本集合{eni}和构件类型名称文本集合{tni}中的重复元素。其中,该导入,可以是人工导入,因为每个工程项目的构件清单都不相同。如前述表1所示,构件名称文本集合{eni}={“EF-1F-02”,“EF-1F-03”,“EF-4F-03”,“EF-4F-04”,……},构件类型文本原始集合={“离心式风机箱”,“管道风机”,……},由于一些文本字数>L,处理为语义集合后得到{tni}={“离心式风机箱”:“离心-风机-风机箱”,“管道风机”:“风机”,……}。
步骤1.2导入空间划分清单,包括楼层名称文本集合{fni}和分区名称文本集合{ani},同上使用自然语言分析算法提取关键词,并增加同义词(即将这些关键词的同义词也加入进来),整理为语义表达的字典形式,然后剔除楼层名称文本集合{fni}和分区名称文本集合{ani}中的重复元素。其中,对于每个集合,都再增加一些同义词到本集合。如前述表2所示,楼层名称文本语义集合={“B2/地下二层”:“B2-地下二层”,“B1/地下一层”:“B1-地下一层”,“1F/首层”:“1F-首层-一楼-1楼”,“2F/二层”:“2F-二层-二楼”,……},分区名称语义集合={“地下室”:“地下室-地下”,“裙房”,……}。
步骤1.3导入图纸类型清单,包括常见的图纸类型名称,即为{ttyi},如前述表3所示,图纸类型文本集合为{“平面图”、“立面图”、“剖面图”、“系统图”,……}。
步骤2:读取每张工程图纸tj中的文本词组{tcj},可以包括以下步骤:
步骤2.1针对该工程项目的每张电子工程图纸tj,读取图纸tj内所有文本元素,记为集合{ttj};元素ttj是四元组,可以包括:文本内容cj、字号sj、中心点坐标lcj和方向向量vej,ttj=(cj,sj,lcj,vej)。如图8所示,{ttj}为{[[“EF”,50,(300,200),(1,0)]],[[“1F-03”,50,(300,140),(1,0)]],……}。
步骤2.2根据字号sj,对图纸tj内所有文本元素的集合{ttj}中所有元素进行正序排序。
步骤2.3顺序遍历图纸tj内所有文本元素的集合{ttj}中所有元素,将字号和方向向量一样、中心点距离小于距离d的两个文本词组tti和ttj合并,即将“tci-tcj”设置为新的tci和tcj。d优选为4倍sj。如图8所示,[“EF”,50,(300,200),(1,0)]和[“1F-03”,50,(300,140),(1,0)]字号相同,中心点坐标距离60小于2*50,将两个文本内容进行合并,变为[“EF-1F-03”,50,(300,200),(1,0)],[“EF-1F-03”,50,(300,140),(1,0)]。
步骤2.4将图纸tj内所有文本元素的集合{ttj}中所有元素文本内容提取出来,并剔除相同的文本内容,形成文本内容集合{tcj}。如图8所示,TC1={“EF-1F-02”、“EF-1F-03”、“EF-1F-04”、“门诊大厅排风”、“消控中心室外机”、“门诊大厅排风”、“卫生间排风”、“接自地下室”};如图9所示,TC2={“EF-1F-02”、“EF-1F-03”、“FVDH”、“PS”、“排风对外百叶”、“消防控制中心”}。
步骤3:分别以步骤1获取的构件名称语义集合{eni}、构件类型名称语义集合{tni}、楼层名称语义集合{fni}、分区名称语义集合{ani}对文本内容集合{tcj}(即文本词组)进行匹配和分词,具体可以包括以下步骤:
步骤3.1针对构件名称文本集合{eni}每个元素eni,采用字符串匹配方式,计算(即字符串匹配的过程)文本集合{tcj}中是否有元素包括元素eni;如果有,则将元素eni加入集合Tj={tnk}供步骤5使用。如图8所示,E1={“EF-1F-02”、“EF-1F-03”、“EF-1F-04”};如图9所示,E2={“EF-1F-02”、“EF-1F-03”}。
步骤3.2针对构件类型文本集合{tni}每个元素tni,采用字符串匹配方式,计算文本集合{tcj}中是否有元素包括元素eni的语义关键词;如果有,则将元素tni加入集合Ej={enk}供步骤5使用。如图8和图9所示,T1={“风机”,“风机箱”},T2={“风机”}。
步骤3.3针对文本集合{tci}和楼层名称文本集合{fni}每个元素tci、fni,采用字符串匹配方式,计算文本集合{tcj}中是否有元素包括元素tci或fni的语义关键词;如果有,则将元素fni加入集合Fj={fnk},若{tcj}中元素包含{tci}中元素tci,也是将对应的{fni}加入到集合Fj中供步骤5使用。如图8和图9所示,F1={“1F/首层”,“4F/四层”},F2={“1F/首层”}。
步骤3.4针对文本集合{ani}、{aci}每个元素ani、aci,采用字符串匹配方式,计算文本集合{tcj}中是否有元素包括元素ani或aci的语义关键词;如果有,则将元素ani加入集合Fj={ank},若{tcj}中元素包含{aci}中元素aci,也是将对应的{ani}加入到集合Aj中供步骤5使用。如图8所示,A1={“地下室”},图9,A2为空集。
步骤3.5针对文本集合{ttyi};每个元素ttyi,采用字符串匹配方式,计算文本集合{tcj}中是否有元素包括元素ttyi;如果有,则将元素ttyi加入集合Yj={ttyk}供步骤5使用。如图8所示,Y1={“平面图”},图9,Y2={“系统图”}。
步骤4:获取房间主题词:对集合{tcj}用N最短路径分词算法进行分词。若有词属于“位置词”集合{“室”、“间”、“房”、“站”、“库”、“厅”、“中心”},则将该词与前一个词语合并,加入表示房间的主题词集合Rj={rj}。例如{……,“体检”,“中心”,……}的“中心”属于位置词集合,则与前一词合并为“体检中心”表示一个完整的位置。若有词包含以上位置词,例如“卫生间”本身就是一个完整位置,则直接将其加入Rj供步骤5使用。如图8所示,R1包括{“消防控制中心”、“门诊大厅”、“卫生间”、“地下室”};如图9所示,R2包括{“门诊大厅”、“消防控制中心”}。
步骤5:计算图纸之间相关系数:例如针对2个图纸ti和tj,按步骤3和4得到ti对应的Ei、Ti、Fi、Ai、Ri、Yi,以及tj对应的Ej、Tj、Fj、Aj、Rj、Yj。然后计算它们对应集合的交集IEij=Ej∩Ei,ITij=Tj∩Ti,IFij=Fj∩Fi,IAij=Aj∩Ai,IRij=Rj∩Ri;IYij=Yj∩Yi则tj对于ti的相关系数rij的计算公式优选如下:
Figure BDA0002434447560000221
其中,pe、pt、pf、pa、pr、pr是加权系数。Card(Ej)表示集合Ej的元素数量。优选地,pe=pt=0.25;pf=pa=0.1,pr=py=0.15。IEij,ITij,IFij,IAij,IRij;IYij等集合,是两个图纸文件中一一对应的元素集合,I表示交集。
如图8和图9所示,IE12={“EF-1F-02”、“EF-1F-03”},IT12={“风机”},IF12={“1F/首层”},IA12=空集,IR12={“门诊大厅”、“消防控制中心”},IY12=空集;则:
Figure BDA0002434447560000222
Figure BDA0002434447560000223
步骤6:建立图纸之间的关联关系:针对每个图纸ti,选择所有相关系数rij中相关系数最大的n个图纸tj,在数据库的关系表中以添加记录的方式建立ti和tj之间的关联关系,并按rij大小进行正序排序,存入数据库,方便图纸查看时检索相关的图纸。如图8和图9所示,针对图7,将表3作为图7的关联图纸,并排序靠前;对于表3,将图7作为表3的关联图纸,但排序比较靠后。
可见,本发明的方案,可以快速分析一个工程项目中各个电子工程图纸中包括的主要构件和涉及的空间划分,然后通过构件和空间划分建立各个工程图纸之间的关联,并进行准确排序,提高工程图纸的查阅和相互索引效率。
由于本实施例的终端所实现的处理及功能基本相应于前述图5所示的装置的实施例、原理和实例,故本实施例的描述中未详尽之处,可以参见前述实施例中的相关说明,在此不做赘述。
经大量的试验验证,采用本发明的技术方案,通过分析一个工程项目中各个电子工程图纸中包括的主要构件和空间划分,通过构件和空间划分建立各个工程图纸之间的关联,并进行准确排序,可以方便图纸查看与检索。
根据本发明的实施例,还提供了对应于工程项目中图纸之间关联性的确定方法的一种存储介质。该存储介质,可以包括:所述存储介质中存储有多条指令;所述多条指令,用于由处理器加载并执行以上所述的工程项目中图纸之间关联性的确定方法。
由于本实施例的存储介质所实现的处理及功能基本相应于前述图1至图4所示的方法的实施例、原理和实例,故本实施例的描述中未详尽之处,可以参见前述实施例中的相关说明,在此不做赘述。
经大量的试验验证,采用本发明的技术方案,通过根据电子工程图纸的内容,分析图纸关联的构件和空间划分,建立图纸之间的关联关系,有利于提高工程图纸的查阅和相互索引效率。
根据本发明的实施例,还提供了对应于工程项目中图纸之间关联性的确定方法的一种终端。该终端,可以包括:处理器,用于执行多条指令;存储器,用于存储多条指令;其中,所述多条指令,用于由所述存储器存储,并由所述处理器加载并执行以上所述的工程项目中图纸之间关联性的确定方法。
由于本实施例的终端所实现的处理及功能基本相应于前述图1至图4所示的方法的实施例、原理和实例,故本实施例的描述中未详尽之处,可以参见前述实施例中的相关说明,在此不做赘述。
经大量的试验验证,采用本发明的技术方案,通过分析一个工程项目中各个电子工程图纸中包括的主要构件和空间划分,通过构件和空间划分建立各个工程图纸之间的关联,并进行准确排序,有利于提高工程图纸的查阅和相互索引效率。
综上,本领域技术人员容易理解的是,在不冲突的前提下,上述各有利方式可以自由地组合、叠加。
以上所述仅为本发明的实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的权利要求范围之内。

Claims (10)

1.一种工程项目中图纸之间关联性的确定方法,其特征在于,包括:
根据一个工程项目的所有电子工程图纸的构件清单、空间划分清单和图纸类型清单,确定所有电子工程图纸中的文本语义集合;
以及,根据每张电子工程图纸的文本内容,确定每张电子工程图纸的文本内容集合;
根据所有电子工程图纸中的文本语义集合、以及每张电子工程图纸的文本内容集合,建立所有电子工程图纸之间的关联关系。
2.根据权利要求1所述的工程项目中图纸之间关联性的确定方法,其特征在于,其中,
确定所有电子工程图纸中的文本语义集合,包括:
确定该工程项目的所有电子工程图纸的构件清单,基于所有电子工程图纸的构件清单,建立构件文本语义集合;
确定该工程项目的所有电子工程图纸的空间划分清单,基于所有电子工程图纸的空间划分清单,建立楼层名称文本集合和分区名称文本集合;
确定该工程项目的所有电子工程图纸的图纸类型清单,基于所有电子工程图纸的图纸类型清单,建立图纸类型文本集合;
和/或,
确定每张电子工程图纸的文本内容集合,包括:
针对该工程项目的每张电子工程图纸,确定每张电子工程图纸内所有文本元素的集合即文本集合;该文本集合中的文本元素,包括:文本内容、字号、中心点坐标和方向向量;
根据字号,对每张电子工程图纸的文本集合中所有文本元素进行排序;
按排序结果遍历每张电子工程图纸内所有文本集合中的所有文本元素,将字号和方向向量相同、且中心点距离小于设定距离的两个文本元素合并,得到该每张电子工程图纸的文本集合;
提取每张电子工程图纸的文本集合中所有元素的文本内容,形成文本内容集合。
3.根据权利要求1或2所述的工程项目中图纸之间关联性的确定方法,其特征在于,建立所有电子工程图纸之间的关联关系,包括:
分别以所有电子工程图纸中的文本语义集合中的构件文本语义集合、楼层名称文本集合、分区名称文本集合、图纸类型文本集合,对每张电子工程图纸的文本内容集合进行字符串匹配和分词处理,得到所有电子工程图纸的语义关键词集合;以及,
对每张电子工程图纸的文本内容集合进行最短路径分词算法进行分词处理,得到每张工程图纸的房间主题词集合;
根据所有电子工程图纸的语义关键词集合、以及每张工程图纸的房间主题词集合,确定该工程项目中所有电子工程图纸之间的相关系数;
针对每张电子工程图纸,选择所有相关系数中相关系数最大的设定数量个电子工程图纸与该张电子工程图纸之间建立关联,得到该张电子工程图纸在该工程项目中的关联关系,以此类推,得到该工程项目中所有电子工程图纸之间的关联关系。
4.根据权利要求1至3中任一项所述的工程项目中图纸之间关联性的确定方法,其特征在于,还包括:
基于所有电子工程图纸之间的关联关系,按设定排序方式对所有电子工程图纸进行排序,以基于排序结果对工程项目中的任一电子工程图纸进行查询和/或检索。
5.一种工程项目中图纸之间关联性的确定装置,其特征在于,包括:
确定单元,用于根据一个工程项目的所有电子工程图纸的构件清单、空间划分清单和图纸类型清单,确定所有电子工程图纸中的文本语义集合;
以及,确定单元,还用于根据每张电子工程图纸的文本内容,确定每张电子工程图纸的文本内容集合;
关联单元,用于根据所有电子工程图纸中的文本语义集合、以及每张电子工程图纸的文本内容集合,建立所有电子工程图纸之间的关联关系。
6.根据权利要求5所述的工程项目中图纸之间关联性的确定装置,其特征在于,其中,
确定单元确定所有电子工程图纸中的文本语义集合,包括:
确定该工程项目的所有电子工程图纸的构件清单,基于所有电子工程图纸的构件清单,建立构件文本语义集合;
确定该工程项目的所有电子工程图纸的空间划分清单,基于所有电子工程图纸的空间划分清单,建立楼层名称文本集合和分区名称文本集合;
确定该工程项目的所有电子工程图纸的图纸类型清单,基于所有电子工程图纸的图纸类型清单,建立图纸类型文本集合;
和/或,
确定单元确定每张电子工程图纸的文本内容集合,包括:
针对该工程项目的每张电子工程图纸,确定每张电子工程图纸内所有文本元素的集合即文本集合;该文本集合中的文本元素,包括:文本内容、字号、中心点坐标和方向向量;
根据字号,对每张电子工程图纸的文本集合中所有文本元素进行排序;
按排序结果遍历每张电子工程图纸内所有文本集合中的所有文本元素,将字号和方向向量相同、且中心点距离小于设定距离的两个文本元素合并,得到该每张电子工程图纸的文本集合;
提取每张电子工程图纸的文本集合中所有元素的文本内容,形成文本内容集合。
7.根据权利要求5或6所述的工程项目中图纸之间关联性的确定装置,其特征在于,关联单元建立所有电子工程图纸之间的关联关系,包括:
分别以所有电子工程图纸中的文本语义集合中的构件文本语义集合、楼层名称文本集合、分区名称文本集合、图纸类型文本集合,对每张电子工程图纸的文本内容集合进行字符串匹配和分词处理,得到所有电子工程图纸的语义关键词集合;以及,
对每张电子工程图纸的文本内容集合进行最短路径分词算法进行分词处理,得到每张工程图纸的房间主题词集合;
根据所有电子工程图纸的语义关键词集合、以及每张工程图纸的房间主题词集合,确定该工程项目中所有电子工程图纸之间的相关系数;
针对每张电子工程图纸,选择所有相关系数中相关系数最大的设定数量个电子工程图纸与该张电子工程图纸之间建立关联,得到该张电子工程图纸在该工程项目中的关联关系,以此类推,得到该工程项目中所有电子工程图纸之间的关联关系。
8.根据权利要求5至7中任一项所述的工程项目中图纸之间关联性的确定装置,其特征在于,还包括:
关联单元,还用于基于所有电子工程图纸之间的关联关系,按设定排序方式对所有电子工程图纸进行排序,以基于排序结果对工程项目中的任一电子工程图纸进行查询和/或检索。
9.一种终端,其特征在于,包括:如权利要求5至8中任一项所述的工程项目中图纸之间关联性的确定装置;
或者,包括:
处理器,用于执行多条指令;
存储器,用于存储多条指令;
其中,所述多条指令,用于由所述存储器存储,并由所述处理器加载并执行如权利要求1至4中任一项所述的工程项目中图纸之间关联性的确定方法。
10.一种存储介质,其特征在于,所述存储介质中存储有多条指令;所述多条指令,用于由处理器加载并执行如权利要求1至4中任一项所述的工程项目中图纸之间关联性的确定方法。
CN202010247955.2A 2020-04-01 2020-04-01 图纸之间关联性的确定方法、装置、存储介质及终端 Active CN111460556B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010247955.2A CN111460556B (zh) 2020-04-01 2020-04-01 图纸之间关联性的确定方法、装置、存储介质及终端

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010247955.2A CN111460556B (zh) 2020-04-01 2020-04-01 图纸之间关联性的确定方法、装置、存储介质及终端

Publications (2)

Publication Number Publication Date
CN111460556A true CN111460556A (zh) 2020-07-28
CN111460556B CN111460556B (zh) 2023-03-28

Family

ID=71684317

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010247955.2A Active CN111460556B (zh) 2020-04-01 2020-04-01 图纸之间关联性的确定方法、装置、存储介质及终端

Country Status (1)

Country Link
CN (1) CN111460556B (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112581476A (zh) * 2020-12-08 2021-03-30 北京构力科技有限公司 在建筑设计中使用的图纸分割的方法和电子设备
CN112733527A (zh) * 2020-12-15 2021-04-30 上海建工四建集团有限公司 建筑工程文档知识网络的构建方法及系统
CN113094787A (zh) * 2021-04-06 2021-07-09 万翼科技有限公司 基于图纸poi的施工图纸数据化方法、装置和电子设备
CN113094786A (zh) * 2021-04-06 2021-07-09 万翼科技有限公司 基于图纸poi的施工图结构化组织方法和装置
CN113159065A (zh) * 2021-04-06 2021-07-23 万翼科技有限公司 图纸poi特征的展示方法、装置和电子设备
CN113408032A (zh) * 2021-06-22 2021-09-17 广联达科技股份有限公司 一种生成门窗大样图的方法、设备及可读存储介质

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001143058A (ja) * 1999-03-19 2001-05-25 Koncheruto:Kk イメージ情報文書化システム
FR2805063A1 (fr) * 2000-02-15 2001-08-17 Vhsoft Technologies Company Lt Methode de gestion informatisee de dessins industriels
JP2009193219A (ja) * 2008-02-13 2009-08-27 Nippon Telegr & Teleph Corp <Ntt> インデックス作成装置、その方法、プログラム及び記録媒体
CN108416131A (zh) * 2018-02-28 2018-08-17 江苏国泰新点软件有限公司 一种图纸文件展示方法、装置、服务器以及存储介质
CN109190209A (zh) * 2018-08-17 2019-01-11 长沙恩为软件有限公司 一种基于bim模型的弱关联方法及系统
CN109697297A (zh) * 2017-10-24 2019-04-30 上海嘉实(集团)有限公司 工程图纸的管理方法、系统、存储器及电子设备
CN110347796A (zh) * 2019-07-05 2019-10-18 神思电子技术股份有限公司 向量语义张量空间下的短文本相似度计算方法
CN110689607A (zh) * 2019-09-18 2020-01-14 山东新汉唐数据科技有限公司 图纸识别和三维建模的系统、方法、计算机可读存储介质及设备

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001143058A (ja) * 1999-03-19 2001-05-25 Koncheruto:Kk イメージ情報文書化システム
FR2805063A1 (fr) * 2000-02-15 2001-08-17 Vhsoft Technologies Company Lt Methode de gestion informatisee de dessins industriels
JP2009193219A (ja) * 2008-02-13 2009-08-27 Nippon Telegr & Teleph Corp <Ntt> インデックス作成装置、その方法、プログラム及び記録媒体
CN109697297A (zh) * 2017-10-24 2019-04-30 上海嘉实(集团)有限公司 工程图纸的管理方法、系统、存储器及电子设备
CN108416131A (zh) * 2018-02-28 2018-08-17 江苏国泰新点软件有限公司 一种图纸文件展示方法、装置、服务器以及存储介质
CN109190209A (zh) * 2018-08-17 2019-01-11 长沙恩为软件有限公司 一种基于bim模型的弱关联方法及系统
CN110347796A (zh) * 2019-07-05 2019-10-18 神思电子技术股份有限公司 向量语义张量空间下的短文本相似度计算方法
CN110689607A (zh) * 2019-09-18 2020-01-14 山东新汉唐数据科技有限公司 图纸识别和三维建模的系统、方法、计算机可读存储介质及设备

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
伊国栋等: "基于关联约束的工程图纸表信息识别与重组", 《计算机辅助设计与图形学学报》 *

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112581476A (zh) * 2020-12-08 2021-03-30 北京构力科技有限公司 在建筑设计中使用的图纸分割的方法和电子设备
CN112733527A (zh) * 2020-12-15 2021-04-30 上海建工四建集团有限公司 建筑工程文档知识网络的构建方法及系统
CN112733527B (zh) * 2020-12-15 2024-05-10 上海建工四建集团有限公司 建筑工程文档知识网络的构建方法及系统
CN113094787A (zh) * 2021-04-06 2021-07-09 万翼科技有限公司 基于图纸poi的施工图纸数据化方法、装置和电子设备
CN113094786A (zh) * 2021-04-06 2021-07-09 万翼科技有限公司 基于图纸poi的施工图结构化组织方法和装置
CN113159065A (zh) * 2021-04-06 2021-07-23 万翼科技有限公司 图纸poi特征的展示方法、装置和电子设备
CN113159065B (zh) * 2021-04-06 2024-04-09 深圳市万翼数字技术有限公司 图纸poi特征的展示方法、装置和电子设备
CN113408032A (zh) * 2021-06-22 2021-09-17 广联达科技股份有限公司 一种生成门窗大样图的方法、设备及可读存储介质
CN113408032B (zh) * 2021-06-22 2024-01-30 广联达科技股份有限公司 一种生成门窗大样图的方法、设备及可读存储介质

Also Published As

Publication number Publication date
CN111460556B (zh) 2023-03-28

Similar Documents

Publication Publication Date Title
CN111460556B (zh) 图纸之间关联性的确定方法、装置、存储介质及终端
CN106649260B (zh) 基于评论文本挖掘的产品特征结构树构建方法
US8060505B2 (en) Methodologies and analytics tools for identifying white space opportunities in a given industry
US7024402B2 (en) Spatial data mining method, spatial data mining apparatus and storage medium
AU2014228754C1 (en) Non-deterministic disambiguation and matching of business locale data
EP3937029A2 (en) Method and apparatus for training search model, and method and apparatus for searching for target object
JP2006506692A (ja) テンプレート・オートマトンとレイテント・セマンティック・インデックス原理に基づく新しいコンピュータ支援メモリ翻訳スキーム
CN111460202A (zh) 电子工程图纸的标签确定方法、装置、存储介质及终端
CN116431837B (zh) 基于大型语言模型和图网络模型的文档检索方法和装置
Chen et al. Georeferencing places from collective human descriptions using place graphs
CN103942232B (zh) 用于挖掘意图的方法和设备
CN109886844B (zh) 基于贝叶斯网络模型的房屋登记数据关联楼盘表方法
JP7098502B2 (ja) 報告書作成装置、方法、およびプログラム
CN116680356A (zh) 地址数据处理方法、装置、电子设备及存储介质
CN106776590A (zh) 一种获取词条译文的方法及系统
JP4073734B2 (ja) 入力単語候補を推薦する情報検索システム
JPH08272806A (ja) データベース検索システム
CN114757147A (zh) 一种基于bert的自动分层树扩展方法
Yousaf et al. How to identify appropriate key-value pairs for querying osm
CN110941743B (zh) 一种基于深度学习算法自动实现字段权重分配的科技项目查重方法
JPH09259141A (ja) 地図データリンケージシステム
CN114461746A (zh) 用于检索数据的方法和检索引擎系统
Jones et al. GIR'05 2005 ACM workshop on geographical information retrieval
CN113536077B (zh) 一种移动app特定事件内容检测方法与装置
Luaces et al. An ontology-based index to retrieve documents with geographic information

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant