CN115982329A - 一种工程施工方案编制依据的智能生成方法及系统 - Google Patents

一种工程施工方案编制依据的智能生成方法及系统 Download PDF

Info

Publication number
CN115982329A
CN115982329A CN202211684300.7A CN202211684300A CN115982329A CN 115982329 A CN115982329 A CN 115982329A CN 202211684300 A CN202211684300 A CN 202211684300A CN 115982329 A CN115982329 A CN 115982329A
Authority
CN
China
Prior art keywords
scheme
basis
engineering
compiling
compilation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211684300.7A
Other languages
English (en)
Inventor
张永涛
田唯
王永威
朱浩
李焜耀
肖垚
杨华东
郑建新
王紫超
刘志昂
陈圆
薛现凯
李�浩
代百华
周浩
孙南昌
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Cccc Wuhan Chi Heng International Engineering Consulting Co ltd
CCCC Second Harbor Engineering Co
Original Assignee
CCCC Second Harbor Engineering Co
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by CCCC Second Harbor Engineering Co filed Critical CCCC Second Harbor Engineering Co
Priority to CN202211684300.7A priority Critical patent/CN115982329A/zh
Publication of CN115982329A publication Critical patent/CN115982329A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Stored Programmes (AREA)

Abstract

本发明公开了一种工程施工方案编制依据的智能生成方法及系统,编制依据生成方法包括:收集汇总以往施工方案并进行粗分类、对施工方案文档格式转换统一、按单位工程类型进行细分类、梳理方案编制依据的选择性影响因素并构建方案编制依据知识图谱、根据单位工程与方案编制依据之间关联路径的语义相似度生成方案编制依据、进行方案的风险合规性审查、结合风险合规性审查结果与人工校对规则进行不合规性定位与修正。本发明提出的编制依据生成方法和系统实现了对以往工程施工方案的关联存储与价值利用,同时将人工经验与风险合规性审查方法相结合,有效识别方案存在的纰漏错误并给出纠错建议和提示,辅助方案编制人员提升合规性效率。

Description

一种工程施工方案编制依据的智能生成方法及系统
技术领域
本发明涉及智能建造技术领域。更具体地说,本发明涉及一种工程施工方案编制依据的智能生成方法及系统。
背景技术
随着社会各界对施工现场的安全性、施工过程的规范性以及对工程质量的可靠性的要求越来越高,工程施工方案编制的重要程度日益凸显,各大基建企业纷纷成立了针对不同工程领域的施工方案编制部门。与此同时,由于工程项目规模与数量的急剧增长,工程施工方案的需求量与方案编制人员数量不足的矛盾日趋突出。诸如此类问题直接导致难以保证新编工程施工方案的合规性,尤其是编制依据的全面性与时效性,以至于方案编制的质量和已有工程施工方案进行高效管理受到极大挑战。
在传统施工方案编制工作中,对于工程施工方案的风险合规性审查依靠人工核对与经验甄别,尤其是对方案编制依据的有效性审查周期长,效率低。其中,为确保方案编制依据中相关标准规范文档的有效性,需要反复查询对比相关的发文编号是否存在更新废止情况,同时由于人工经验参差不齐而容易出现漏报误报的现象;其次,对于以往工程施工方案的管理主要使用磁盘或纸质文件进行存储,存储类型单一,无法建立起文档之间的关联性且方案版本管理混乱;对于新编施工方案的形成主要依靠有经验的方案编制人员进行内容编制,编制效率较低,难以利用以往同类型工程施工方案的参考价值且方案编制依据容易出现遗漏或被替代废止的情况。同时,随着工程施工方案数量的持续增加,也无疑会造成知识资源闲置,以及查找使用不便的问题。工程施工方案编制工作主要依靠于编制依据的生成,因此,鉴于传统方案编制依据和管理技术与实际工程方案编制依据需求之间的巨大矛盾,亟需提出一种更加高效的工程施工方案编制依据的智能形成方法和系统。
发明内容
本发明的一个目的是提供一种工程施工方案编制依据的智能生成方法及系统,实现了对以往工程施工方案的关联存储与价值利用,方案编制依据的智能生成也提升了方案编制的效率与可靠性,同时将人工经验与基于知识表示的风险合规性审查方法相结合,有效识别方案存在的纰漏错误并给出纠错建议和提示,辅助方案编制人员提升合规性效率,为方案编制的质量提供了有益保障。
为了实现根据本发明的这些目的和其它优点,提供了一种工程施工方案编制依据的智能生成方法,包括如下步骤:
步骤一、收集汇总以往工程施工方案数据,并按照工程项目类别对工程施工方案数据进行粗分类,然后结合工程施工方案数据的文档类型对数据进行归档存储;
步骤二、对工程施工方案文档数据进行预处理,并将文档格式转换为统一格式存储;
步骤三、对上述工程施工方案文档数据进一步细分类,并存储在对应的项目数据库中;
步骤四、梳理方案编制依据的选择性影响因素,梳理方案编制依据,并构建方案编制依据知识图谱;
步骤五、根据上述步骤四中所构建的方案编制依据知识图谱,计算得到不同单位工程及其方案编制依据的关联路径;结合用户输入的单位工程检索关键词,分别计算单位工程到编制依据之间路径的语义相似度并对相似度计算结果进行排序,根据相似度排序结果进行方案编制依据的智能生成。
优选的是,所述步骤一中文档类型包括可编辑类文档和不可编辑类文档;所述步骤二中对于可编辑类文档,通过解析后转换为JSON格式;对于不可编辑类文档,先进行文档的字符识别,然后将识别后的文件转码为JSON格式。
优选的是,所述步骤三中,首先,利用中文正则表达式对转换的统一格式文档进行文档内容选择性分析,提取得到各工程施工方案文档数据的标题,得到标题列表数据库文件;其次,对上述获取的标题列表数据库文件进行中文分词,提取得到单位工程类型以及方案类型,并分别存入单位工程类型数据库与方案类型数据库文件;最后,进一步按照单位工程类型以及方案类型对工程施工方案数据进行细分类,并将数据存储到相应的项目数据库中。
优选的是,所述步骤四中,梳理方案编制依据的选择性影响因素具体包括:对方案编制部门相关人员采取匿名、独立的问卷调查,并对调查问卷结果进行统计整理、去重归纳,结合词云工具实现对方案编制人员在选择方案编制依据时应考虑的影响因素的梳理,得到各项目层级关系。
优选的是,所述步骤四中,梳理方案编制依据具体为:利用中文正则表达式从统一格式文件中批量获取工程施工方案文档数据中的方案编制依据,将结果存储于CSV文件并做文档聚类分析,结合文档聚类分析结果将各工程施工方案中的编制依据进行梳理归类,同时梳理相应编制依据的编号及其替代废止关系。
优选的是,所述步骤四中,构建方案编制依据知识图谱具体为:
a)根据方案编制依据的选择性影响因素之间的项目层级关系,定义方案编制依据知识图谱的本体模型;
b)结合上述本体模型以及方案编制依据的梳理归类结果,定义方案编制依据知识图谱的工程实体类型及指称项;
c)根据本体模型以及方案编制依据的选择性影响因素之间的项目层级类属关系、各方案编制依据与其编号之间的对应关系,定义方案编制依据知识图谱的关系类型及其指称项;
d)根据上述步骤b)和步骤c)中对工程实体、关系的定义结果,以半自动化的方式进行工程实体---关系三元组数据抽取,最终构建得到方案编制依据知识图谱所需的(工程实体,关系,工程实体)三元组数据;
e)利用包括知识图谱中的关系三元组、关系路径和邻接信息的结构信息以及知识图谱中的属性三元组的属性信息进行工程实体对齐,同时结合通过采用基于深度学习的方法进行实体链接,丰富和扩展所构造的方案编制依据知识图谱;
f)将步骤d)中得到的三元组数据集导入图数据库进行关联存储,将工程实体作为图节点,将实体间关系作为关系边,通过实体及关系的向量表示以形成知识图谱。
优选的是,所述步骤d)具体为:首先利用文本数据标注平台进行工程实体指称项及实体间关系标注,标注后的数据以设定的格式导出,作为信息抽取模型的数据输入,即以人工甄别的方式从以往的工程施工方案中对步骤b)和步骤c)中定义的工程实体以及工程实体之间的关系进行识别并做标注,基于人工数据标注的结果,初步构建种子数据集,将标注后的数据作为实体关系抽取模型的输入,经模型训练与参数调整后,实现基于信息抽取模型的实体关系抽取,从而构建起(工程实体,关系,工程实体)三元组数据集。
优选的是,所述步骤五中,单位工程到编制依据之间联通路径的语义相似度计算过程为:首先利用图数据库的查询语句,查询获取得到当前单位工程到编制依据之间所有的实体关系关联路径,并得到每条路径的词向量表示;然后对所得到的词向量计算余弦相似度,从而得到向量夹角,即文本语义相似度,对计算得到的文本语义相似度进行降序排序以生成得到方案编制依据候选列表;计算公式如下:
Figure BDA0004020373610000041
A,B代表基于单位工程类型检索关键词得到的单位工程与方案编制依据之间的关联路径的词向量表示,similarity(A,B)为词向量A与B之间的语义相似度;||A||与||B||分别代表向量A与向量B的模。
优选的是,根据生成的工程施工方案编制依据的版本迭代更新或废止引用关系进行工程施工方案的风险合规性审查并结合风险合规性审查结果与人工校对规则进行不合规性定位与修正,具体为:
第一、根据步骤四中所构建的方案编制依据知识图谱,得到不同方案编制依据与其对应的版本编号关系;通过对工程方案编制依据版本编号的迭代更新及废止关系的查询,确保所引用的方案编制依据具有时效性;其中,若发现当前所引用的标准或规范被其他版本的标准或规范所替代更新,则视为当前所编方案不合规,便通过知识图谱的链接关系定位到相应标准或规范的实体节点,同时查询得到工程方案编制单位并向方案编制单位进行反馈;
第二、通过中文分词与主题词提取,分别获取方案编制依据名称、方案名称、单位工程类型的主题词,通过计算这三个主题词之间的语义相似度,确定当前所引用的方案编制依据是否与当前项目以及单位工程类型相关;通过所构建的知识图谱,查询获取得到当前项目所在位置,并对地方性标准规范进行分词与主题词提取,通过对比项目所在位置与地方标准规范发行地是否一致,来判断地方性标准规范是否引用合理;
第三、通过模式匹配的方式对存在迭代更新的方案编制依据进行内容上的匹配检索,从而对具体的迭代更新内容进行识别定位;对存在替代废止关系的方案编制依据直接进行工程施工方案相应章节内容上的整体替换更新,同时通过知识图谱链路连通性以及实体间属性关系的向量表示与查询,确定方案内容上的合规性;通过将人工经验审核与基于知识表示的工程方案编合规性审查结果相结合,实现新编工程施工方案全文合规性的审查。
本发明还提供了一种工程施工方案编制依据的智能生成系统,包括:
方案编制依据知识图谱数据构建模块,其用于构建形成建立知识图谱所需的数据集,具体用于对原始工程施工方案数据收集整理,以及基于原始数据进行(工程实体,关系,工程实体)三元组数据构建;
方案编制依据知识图谱构建模块,其用于将上述构建得到的(工程实体,关系,工程实体)三元组数据导入图数据库,并通过知识表示学习,学习得到实体及关系的向量表示以构建形成工程施工方案编制依据知识图谱;同时,方案编制依据知识图谱构建模块还包括对方案编制依据知识图谱的更新扩展,更新扩展包括对方案编制依据知识图谱的实体节点上的内容更新扩展,以及对方案编制依据知识图谱实体关系上的逻辑更新;
工程施工方案编制依据智能生成模块,其用于向用户生成方案编制依据;其中,对用户输入的检索序列进行中文分词并进行单位工程关键词的信息提取,并通过计算用户所输入的单位工程检索关键词与知识图谱中相应单位工程及其方案编制依据的关联路径之间的语义相似度,对相似度计算结果进行排序后,根据相似度排序结果进行方案编制依据的智能生成;
施工方案风险合规性审查与违规修正模块,其用于对新编工程施工方案进行风险合规性审查并对不合规的审查结果进行定位与反馈。
本发明至少包括以下有益效果:
(1)与传统的工程施工方案管理方法相比,本发明基于知识表示智能生成编制依据的方式实现了对各方案文档的关联存储与内容上的动态更新,并极大程度地克服资源闲置而发挥起历史工程方案对于方案编制人员的参考利用价值,降低了工程施工方案编制对人员素质的依赖;
(2)本发明提供的一种基于知识表示的工程施工方案编制依据的智能生成方法与系统,可以便捷地根据用户检索的单位工程关键词,为用户生成方案编制依据候选列表,提高方案编制效率。同时,通过基于知识表示的方法对工程施工方案中的不合规性进行识别定位并结合人工经验知识进行工程施工方案的风险合规性审查与违规修正,提升了工程施工方案的风险合规性审查效率,确保了工程施工方案的可靠性。
本发明的其它优点、目标和特征将部分通过下面的说明体现,部分还将通过对本发明的研究和实践而为本领域的技术人员所理解。
附图说明
图1为方案编制依据及其版本迭代更新与替代废止示例图;
图2为方案编制依据智能生成流程图;
图3为方案编制依据知识图谱本体模型;
图4为基于结构信息和属性信息的工程实体对齐算法框架;
图5为方案编制依据生成过程示意图;
图6为方案智能编制系统结构图。
具体实施方式
下面结合附图对本发明做进一步的详细说明,以令本领域技术人员参照说明书文字能够据以实施。
需要说明的是,下述实施方案中所述实验方法,如无特殊说明,均为常规方法,所述试剂和材料,如无特殊说明,均可从商业途径获得;在本发明的描述中,术语“横向”、“纵向”、“上”、“下”、“前”、“后”、“左”、“右”、“竖直”、“水平”、“顶”、“底”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,并不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。
本发明提供一种工程施工方案编制依据智能生成方法。如附图2所示,其具体包括如下步骤:
(1)施工方案数据收集汇总与方案文档粗分类
从方案编制部门、各分子公司、科研管理部、企业文档知识云盘、公司工程技术共享库、网络知识百科、行业论坛等来源,收集汇总工程施工方案数据;其中,对从网络知识百科与行业论坛收集得到的工程方案数据需经过领域专家进行质量评估,以筛选出内容规范完整的高质量工程方案数据,确保所收集汇总得到的工程方案数据的整体有效性;其次,按照公路工程、铁路工程、桥梁工程、隧道工程、港口工程等工程项目类别对收集得到的工程施工方案数据进行粗分类,然后,结合工程方案数据的文档类型,对工程方案数据进行归档存储,基本划分为HTML类、XML类、PDF类、Txt类、Word类、图片类及PDF扫描件类。其中,图片类及PDF扫描件为不可编辑类文档;
(2)施工方案文档数据预处理与格式转换统一
对于图片及PDF扫描件等不可编辑类方案文档:首先利用光学字符识别OCR技术对其进行字符识别,得到识别后的txt文件,然后将识别得到的txt文件转码为JSON格式的文件存储;
对于可编辑类方案文档:将HTML类与XML类工程方案文档进行解析后直接进行JSON格式转换;对PDF类工程方案文档,首先利用PDF解析器进行Doc格式转换,得到Doc文档;将转换得到的Doc文档与原始格式为Doc格式的工程方案数据统一进行Zip格式转换与解压,批量进行XML格式转换,并转码为JSON格式存储;
(3)施工方案文档主题词获取与方案文档细分类
利用中文正则表达式对上述转换得到的JSON文档进行文档内容选择性分析,提取得到各工程方案文档数据的标题,例如“航空港特大桥桩基专项施工方案”,得到标题列表数据库文件;
利用JIEBA中文分词工具对获取得到的方案标题进行中文分词,提取得到单位工程类型以及方案类型;例如“航空港特大桥桩基专项施工方案”经中文分词与主题词提取之后,得到该方案类型为“专项施工方案”,该方案对应的单位工程类型为“桩基”;将批量得到的单位工程类型及方案类型分别存入单位工程类型数据库与方案类型数据库文件;
进一步按照桩基、桥塔、墩身、承台、等单位工程类型以及方案类型对收集得到的施工方案数据进行细分类,将收集整理后的施工方案数据存储在相应的项目数据库中;
(4)影响因素梳理与知识图谱构建
由于方案编制依据的选择过程中具有较大的经验性因素,故而对方案编制部门相关人员采取匿名、独立的问卷调查,收集汇总方案编制依据的选择性影响因素,即在特定的方案编制任务中,对促使方案编制人员选择某些编制依据的影响因素进行总结。
该过程形式化表示如下:
f(一些潜在的影响因素)→(依据1),(依据2),...,(依据n)
其中,f为大脑,即由于存在一些潜在的影响因素,促使编制人员选择
(依据1),(依据2),...,(依据n)作为方案编制依据。
梳理方案编制依据的选择性影响因素:对调查问卷结果进行统计整理、去重归纳,结合词云工具WordCloud实现对方案编制人员在选择方案编制依据时应考虑的影响因素的梳理,梳理结果包括但不限于工程项目类别、单位工程类型、工艺、项目所在地、项目开始年份、方案编制单位等。其中,工程项目类别包括市政工程、公路工程、桥梁工程、铁路工程、港口码头工程等;单位工程类型包括桩基、墩身、承台、梁等;工艺包括反循环冲击钻、陆上旋挖钻、螺旋钻机等;
梳理方案编制依据:利用中文正则表达式从JSON文件中批量获取工程方案文档数据中的方案编制依据,将结果存储于CSV文件并做文档聚类分析。由于特定类型的单位工程对应的编制依据具有一定的一致性,因此结合聚类分析结果将各工程施工方案中的编制依据进行梳理归类,包括但不限于:项目招投标及合同文件、勘察设计及业主文件、法律法规与标准规范(含地方标准规范)、总体施工组织设计等前期文件、公司相关管理文件、现场实际情况调查(环境敏感区项目必须对周边环境进行影响调查,如有)、环评报告及环评批复对本专项施工的要求(如有),同时梳理相应编制依据的编号及其替代废止关系;
构建方案编制依据知识图谱:这一步骤又包括如下步骤:
a)根据方案编制依据的选择性影响因素之间的项目层级关系,定义方案编制依据知识图谱的本体模型。如附图3所示,即设计方案编制依据知识图谱的数据组织方式,明确各影响因素之间的层级关系。
b)结合本体模型以及方案编制依据的归类结果,定义方案编制依据知识图谱的工程实体类型及指称项;根据图3的方案编制依据本体模型,从工程施工方案中提取项目名称、项目所在地、项目年份、项目单位工程类型、方案编制单位、方案编制依据的条文类别、方案编制依据名称、方案编制依据的发文编号、工艺及具体的工程机械定义为方案编制依据知识图谱的工程实体;
c)根据本体模型以及方案编制依据的选择性影响因素之间的项目层级类属关系、各方案编制依据与其编号之间的对应关系,定义方案编制依据知识图谱的关系类型及其指称项;根据图3,项目类别与项目名称之间、项目名称与单位工程类型之间、单位工程类型与施工方案之间、方案编制依据与招投标及合同文件之间均为一对多的关系,因此将满足一对多关系的实体对之间的关系定义为包含关系;项目名称与项目所在地之间为多对一的关系,将项目名称与项目所在地之间的关系定义为地理位置关系;工程施工方案与方案编制单位之间为编制关系;方案编制依据与发文编号之间为编号关系,发文编号与编号之间为迭代更新或废止关系,具体关系定义如表1所示;
表1方案编制依据知识图谱关系定义
Figure BDA0004020373610000081
Figure BDA0004020373610000091
d)根据步骤b、c中对工程实体、关系的定义结果,以半自动化的方式进行工程实体---关系三元组数据抽取,即先以人工标注的形式手动标注获取一部分工程实体---关系数据,然后以这部分数据为种子数据集,训练实体关系抽取模型,实现基于算法程序半自动化的实体关系抽取,以提高信息抽取的效率;最终构建得到方案编制依据知识图谱所需的(工程实体,关系,工程实体)三元组数据;
步骤d的具体实现过程为:以图3所示的本体模型与表1所示的工程实体关系定义结果为依据,首先利用doccano或brat等文本数据标注平台进行工程实体指称项及实体间关系标注,标注后的数据以JSON或Txt格式导出,作为信息抽取模型的数据输入。即以人工甄别的方式从以往的工程施工方案中对步骤b、c中定义的工程实体以及工程实体对之间的关系进行识别并做标注,基于人工数据标注的结果,初步构建种子数据集,将标注后的数据作为实体关系抽取模型Bert4Keras或GPLinker的输入,经模型训练与参数调整后,实现基于信息抽取模型的实体关系抽取,从而构建起(工程实体、关系、工程实体)三元组数据集。例如三元组(枣阳市沙河流域城市水环境综合治理项目,地理位置,枣阳市)中,“地理位置”为工程实体对“枣阳市沙河流域城市水环境综合治理项目”与“枣阳市”之间的关系;
e)知识获取和知识融合:通过采用基于知识表示学习的方法进行工程实体对齐、通过采用基于深度学习的方法进行实体链接。结合实体对齐和实体链接,丰富和扩展所构造的方案编制依据知识图谱;其中,本发明进行工程实体对齐过程中综合利用了方案编制依据知识图谱的结构信息和属性信息,结构信息包括知识图谱中的关系三元组、关系路径和邻接信息;属性信息即知识图谱中的属性三元组。本发明综合利用结构信息和属性信息进行工程实体对齐,算法框架如图4所示,具体步骤如下:
首先将已有的关系三元组作为训练的正例,然后根据正例生成反例,之后根据正例和反例进行训练,得到工程实体和关系的嵌入表示。其中,在训练时已对齐的实体对共享相同的嵌入;
本发明假设已对齐的工程实体对的属性是相关的,且相关属性的嵌入之间是相似的。基于此假设,从而得到属性的嵌入;
根据属性嵌入计算工程实体之间的相似度,之后将得到的相似度矩阵与结构嵌入相结合,从而得到最终的嵌入,根据最终的嵌入进行工程实体对齐。其中,本发明在计算候选实体e的相似性时,采用的距离度量指标如公式(1)所示:
Figure BDA0004020373610000101
f)将步骤d中得到的三元组数据集导入图数据库Neo4j进行关联存储,将工程实体作为图节点,将实体间关系作为关系边,通过实体及关系的向量表示以形成知识图谱,利用Neo4j图数据库的节点关系可视化功能即可对构建的知识图谱进行可视化;
(5)方案编制依据智能生成
根据步骤(4)中所构建的方案编制依据知识图谱,计算得到不同单位工程及其方案编制依据的关联路径;结合用户输入的单位工程检索关键词,分别计算单位工程到编制依据之间路径的语义相似度并对相似度计算结果进行排序,根据相似度排序结果进行方案编制依据的智能生成,生成过程如图5所示。
对于用户的输入,首先利用jieba分词工具对用户输入的检索语句进行分词处理,然后利用TF-IDF算法进行单位工程关键词提取,基于提取得到的单位工程关键词在知识图谱中检索单位工程到方案编制依据的联通路径。
其中,单位工程到编制依据之间联通路径的语义相似度计算过程为:首先利用Neo4j图数据库的Cypher查询语句,查询获取得到当前单位工程到编制依据之间所有的实体关系关联路径,利用词嵌入Word2Embedding的方法得到每条路径的词向量表示;然后对所得到的词向量计算余弦相似度,从而得到向量夹角,即文本语义相似度。对计算得到的文本相似度进行降序排序以生成得到方案编制依据候选列表。计算过程如公式2所示:
Figure BDA0004020373610000111
上式中,A,B代表基于单位工程类型检索关键词得到的单位工程与方案编制依据之间的关联路径的词向量表示,similarity(A,B)为词向量A与B之间的语义相似度;||A||与||B||分别代表向量A与向量B的模。
(6)施工方案的风险合规性审查
基于知识表示的施工方案风险合规性审查包括不合规性的识别与定位,所谓不合规性的识别是通过方案编制依据知识图谱的链接关系对存在不合规引用、标准规范失效情况的方案编制依据实体节点进行识别,即识别得到方案编制依据发文编号的迭代更新与替代废止情况以及所引用的标准规范与当前项目无关的情况;所谓不合规性的定位是通过模式匹配的方式,通过对比相应编制依据的章节内容,施工方案的关键参数等方案内容进行内容上的匹配检索,即定位并找到存在不合规性的具体内容。
具体地:
第一种合规性:即方案编制依据是否存在自身失效
根据步骤(4)中所构建的方案编制依据知识图谱,得到不同方案编制依据与其对应的版本编号关系;通过对工程方案编制依据版本编号的迭代更新及废止关系的查询,确保所引用的方案编制依据具有时效性;其中,若发现当前所引用的标准或规范被其他版本的标准或规范所替代更新,则视为当前所编方案不合规,便通过知识图谱的链接关系定位到相应标准或规范的实体节点,同时查询得到工程方案编制单位并向方案编制单位进行反馈。如图1所示,发文编号为DB42/T159-2012的湖北省地方标准与编号DB42/159-2004之间存在代替关系,则将对引用了编号为DB42/159-2004的施工方案视为不合规,于是方案编制依据自身的合规性得以确保。
第二种合规性:即方案编制依据是否引用合理
首先,通过中文分词与主题词提取,分别获取标准规范等方案编制依据名称、方案名称、单位工程类型等文本段中的主题词,通过计算这三个主题词之间的语义相似度,确定当前所引用的方案编制依据是否与当前项目以及单位工程类型相关。例如,对方案名称为“航空港特大桥桩基专项施工方案”、方案编制依据名称为“建筑桩基技术规范(JGJ94-2008)”、单位工程类型为“桩基工程”,则主题词“桩基施工”、“桩基技术”、“桩基工程”都包含“桩基”,在语义上高度一致,说明该项编制依据与当前项目及单位工程类型相关。
其次,通过所构建的知识图谱,查询获取得到当前项目所在位置,如“湖北省枣阳市”;然后对地方性标准规范进行分词与主题词提取,如“湖北省地方标准之基坑工程技术规程”中的“湖北省”。通过对比项目所在位置与地方标准规范发行地是否一致,来判断地方性标准规范是否引用合理。
第三种合规性:即对关键的方案内容进行比对
首先,通过模式匹配的方式对存在迭代更新的方案编制依据进行内容上的匹配检索,从而对具体的迭代更新内容进行识别定位;对存在替代废止关系的方案编制依据直接进行工程施工方案相应章节内容上的整体替换更新。同时通过知识图谱链路连通性以及实体间属性关系的向量表示与查询,确定方案内容上的合规性。包括:关键施工参数的确定与修正、工艺流程的正确性验证、验收制度的完整性与正确性等。
最终通过将人工经验审核与基于知识表示的工程方案编合规性审查结果相结合,实现新编工程施工方案全文合规性的审查,并综合提升施工方案风险合规性审查的效率。
本发明还提供一种工程施工方案编制依据的智能生成系统。如附图6所示,包括如下模块:方案编制依据知识图谱数据构建模块、方案编制依据知识图谱构建模块、工程施工方案编制依据智能生成模块以及施工方案风险合规性审查与违规修正模块。
(1)方案编制依据知识图谱数据构建模块
方案编制依据知识图谱数据构建模块用于构建形成建立知识图谱所需的数据集,具体用于对原始工程施工方案数据(简称,原始数据)收集整理,以及基于原始数据进行(工程实体、关系、工程实体)三元组数据构建;
进一步,方案编制依据知识图谱数据构建模块包括:
原始工程施工方案数据收集整理模块:用于按照项目类型与单位工程类型收集整理并对工程施工方案数据进行归类存储;
三元组数据构建模块:用于定义工程施工方案本体模型,并进行工程实体及实体间关系的定义抽取,构建方案编制依据知识图谱的底层数据集;
(2)方案编制依据知识图谱构建模块
方案编制依据知识图谱构建模块用于将(1)构建得到的(工程实体、关系、工程实体)三元组数据导入图数据库Neo4j,并通过知识表示学习,学习得到实体及关系的向量表示以构建形成工程方案编制依据知识图谱;
进一步,方案编制依据知识图谱构建模块包括:
知识获取和知识融合模块:用于进行工程实体对齐与实体链接,消除三元组数据中的语义歧义;
数据加载模块:用于将(1)中构建得到的(工程实体、关系、工程实体)三元组数据导入图数据库Neo4j中进行存储;
图谱可视化模块:用于对存储于Neo4j中的三元组数据以图的形式进行可视化,形成视觉意义上的知识图谱;
图谱更新扩展模块:用于对上述构建的知识图谱进行更新扩展。其中,图谱的更新扩展包括对方案编制依据知识图谱的实体节点上的内容更新扩展,以及对方案编制依据知识图谱实体关系上的逻辑更新;具体的,内容上的更新扩展为:对新发布施行的标准规范或新编工程施工方案进行命名实体识别与关系抽取,将其与已有知识图谱的节点相关联,实现知识图谱内容上的更新扩展;
逻辑上的更新扩展为:通过工程施工方案的风险合规性审查和违规修正模块对已有知识图谱的实体属性和关系进行更新,例如:风险合规性审查之前,当前编制的工程施工方案P引用了标准文档A,而标准文档A与标准文档B是版本废止替代关系,则知识图谱更新前的实体关系为P→A→B(P引用A,A被B代替),于是知识图谱更新后的实体关系为P→B→A(P引用B,B代替A),实现知识图谱逻辑上的更新扩展;
(3)工程施工方案编制依据智能生成模块
工程施工方案编制依据智能生成模块用于向用户生成方案编制依据。其中,对用户输入的检索序列进行中文分词并进行单位工程关键词的信息提取,并通过计算用户所输入的单位工程检索关键词与知识图谱中相应单位工程及其方案编制依据的关联路径之间的语义相似度,对相似度计算结果进行排序后,根据相似度排序结果进行方案编制依据的智能生成。
进一步,工程施工方案编制依据智能生成模块包括:
中文分词与关键词信息提取模块:用于对用户输入的检索序列进行中文分词,并对检索序列中的单位工程进行关键信息提取;
关联路径检索模块:用于检索并计算得到单位工程关键词到方案编制依据之间的关联路径,实现单位工程与方案编制依据的语义关联;
语义相似度计算模块:用于将单位工程到方案编制依据之间的关联路径进行词向量嵌入表示,并计算词向量嵌入之间的语义相似度;
方案编制依据候选列表生成模块:用于对关联路径之间的语义相似度进行排序并结合排序结果为用户返回相关单位工程所对应的方案编制依据列表;
(4)施工方案风险合规性审查与违规修正模块
施工方案风险合规性审查与违规修正模块用于对新编工程施工方案进行风险合规性审查并对不合规的审查结果进行定位与反馈。
进一步,施工方案风险合规性审查与违规修正模块包括:
工程方案编制依据不合规性识别模块:用于对工程施工方案是否存在不合规性进行识别判断,即通过当前模块的检索功能来判断当前工程施工方案的编制依据之间是否存在编制依据版本编号的迭代更新及废止关系;以及通过计算方案编制依据主题词与项目名称及单位工程主题词之间的语义相似性,判断当前标准规范是否引用合理;
工程方案编制依据不合规性定位模块:用于对工程施工方案中的不合规性进行查找定位,即通过当前模块的模式匹配功能对存在迭代更新关系的方案编制依据的章节内容进行快速对比,找到具体的不合规性章节内容;从而确定关键施工参数、施工计划等内容上的合规性;
工程方案合规性审查报告生成与反馈模块:用于结合不合规性识别与定位模型的合规性审查结果,生成合规性审查报告,并将不合规的具体知识链路情况像方案编制单位进行反馈;
工程施工方案违规修正模块:用于方案编制单位对存在不合规性的方案章节内容进行修正更新
尽管本发明的实施方案已公开如上,但其并不仅仅限于说明书和实施方式中所列运用,它完全可以被适用于各种适合本发明的领域,对于熟悉本领域的人员而言,可容易地实现另外的修改,因此在不背离权利要求及等同范围所限定的一般概念下,本发明并不限于特定的细节和这里示出与描述的图例。

Claims (10)

1.一种工程施工方案编制依据的智能生成方法,其特征在于,包括如下步骤:
步骤一、收集汇总以往工程施工方案数据,并按照工程项目类别对工程施工方案数据进行粗分类,然后结合工程施工方案数据的文档类型对数据进行归档存储;
步骤二、对工程施工方案文档数据进行预处理,并将文档格式转换为统一格式存储;
步骤三、对上述工程施工方案文档数据进一步细分类,并存储在对应的项目数据库中;
步骤四、梳理方案编制依据的选择性影响因素,梳理方案编制依据,并构建方案编制依据知识图谱;
步骤五、根据上述步骤四中所构建的方案编制依据知识图谱,计算得到不同单位工程及其方案编制依据的关联路径;结合用户输入的单位工程检索关键词,分别计算单位工程到编制依据之间路径的语义相似度并对相似度计算结果进行排序,根据相似度排序结果进行方案编制依据的智能生成。
2.如权利要求1所述的工程施工方案编制依据的智能生成方法,其特征在于,所述步骤一中文档类型包括可编辑类文档和不可编辑类文档;所述步骤二中对于可编辑类文档,通过解析后转换为JSON格式;对于不可编辑类文档,先进行文档的字符识别,然后将识别后的文件转码为JSON格式。
3.如权利要求1所述的工程施工方案编制依据的智能生成方法,其特征在于,所述步骤三中,首先,利用中文正则表达式对转换的统一格式文档进行文档内容选择性分析,提取得到各工程施工方案文档数据的标题,得到标题列表数据库文件;其次,对上述获取的标题列表数据库文件进行中文分词,提取得到单位工程类型以及方案类型,并分别存入单位工程类型数据库与方案类型数据库文件;最后,进一步按照单位工程类型以及方案类型对工程施工方案数据进行细分类,并将数据存储到相应的项目数据库中。
4.如权利要求1所述的工程施工方案编制依据的智能生成方法,其特征在于,所述步骤四中,梳理方案编制依据的选择性影响因素具体包括:对方案编制部门相关人员采取匿名、独立的问卷调查,并对调查问卷结果进行统计整理、去重归纳,结合词云工具实现对方案编制人员在选择方案编制依据时应考虑的影响因素的梳理,得到各项目层级关系。
5.如权利要求4所述的工程施工方案编制依据的智能生成方法,其特征在于,所述步骤四中,梳理方案编制依据具体为:利用中文正则表达式从统一格式文件中批量获取工程施工方案文档数据中的方案编制依据,将结果存储于CSV文件并做文档聚类分析,结合文档聚类分析结果将各工程施工方案中的编制依据进行梳理归类,同时梳理相应编制依据的编号及其替代废止关系。
6.如权利要求5所述的工程施工方案编制依据的智能生成方法,其特征在于,所述步骤四中,构建方案编制依据知识图谱具体为:
a)根据方案编制依据的选择性影响因素之间的项目层级关系,定义方案编制依据知识图谱的本体模型;
b)结合上述本体模型以及方案编制依据的梳理归类结果,定义方案编制依据知识图谱的工程实体类型及指称项;
c)根据本体模型以及方案编制依据的选择性影响因素之间的项目层级类属关系、各方案编制依据与其编号之间的对应关系,定义方案编制依据知识图谱的关系类型及其指称项;
d)根据上述步骤b)和步骤c)中对工程实体、关系的定义结果,以半自动化的方式进行工程实体---关系三元组数据抽取,最终构建得到方案编制依据知识图谱所需的(工程实体,关系,工程实体)三元组数据;
e)利用包括知识图谱中的关系三元组、关系路径和邻接信息的结构信息以及知识图谱中的属性三元组的属性信息进行工程实体对齐,同时结合通过采用基于深度学习的方法进行实体链接,丰富和扩展所构造的方案编制依据知识图谱;
f)将步骤d)中得到的三元组数据集导入图数据库进行关联存储,将工程实体作为图节点,将实体间关系作为关系边,通过实体及关系的向量表示以形成知识图谱。
7.如权利要求6所述的工程施工方案编制依据的智能生成方法,其特征在于,所述步骤d)具体为:首先利用文本数据标注平台进行工程实体指称项及实体间关系标注,标注后的数据以设定的格式导出,作为信息抽取模型的数据输入,即以人工甄别的方式从以往的工程施工方案中对步骤b)和步骤c)中定义的工程实体以及工程实体之间的关系进行识别并做标注,基于人工数据标注的结果,初步构建种子数据集,将标注后的数据作为实体关系抽取模型的输入,经模型训练与参数调整后,实现基于信息抽取模型的实体关系抽取,从而构建起(工程实体,关系,工程实体)三元组数据集。
8.如权利要求6所述的工程施工方案编制依据的智能生成方法,其特征在于,所述步骤五中,单位工程到编制依据之间联通路径的语义相似度计算过程为:首先利用图数据库的查询语句,查询获取得到当前单位工程到编制依据之间所有的实体关系关联路径,并得到每条路径的词向量表示;然后对所得到的词向量计算余弦相似度,从而得到向量夹角,即文本语义相似度,对计算得到的文本语义相似度进行降序排序以生成得到方案编制依据候选列表;计算公式如下:
Figure FDA0004020373600000031
A,B代表基于单位工程类型检索关键词得到的单位工程与方案编制依据之间的关联路径的词向量表示,similarity(A,B)为词向量A与B之间的语义相似度;||A||与||B||分别代表向量A与向量B的模。
9.如权利要求6所述的工程施工方案编制依据的智能生成方法,其特征在于,根据生成的工程施工方案编制依据的版本迭代更新或废止引用关系进行工程施工方案的风险合规性审查并结合风险合规性审查结果与人工校对规则进行不合规性定位与修正,具体为:
第一、根据步骤四中所构建的方案编制依据知识图谱,得到不同方案编制依据与其对应的版本编号关系;通过对工程方案编制依据版本编号的迭代更新及废止关系的查询,确保所引用的方案编制依据具有时效性;其中,若发现当前所引用的标准或规范被其他版本的标准或规范所替代更新,则视为当前所编方案不合规,便通过知识图谱的链接关系定位到相应标准或规范的实体节点,同时查询得到工程方案编制单位并向方案编制单位进行反馈;
第二、通过中文分词与主题词提取,分别获取方案编制依据名称、方案名称、单位工程类型的主题词,通过计算这三个主题词之间的语义相似度,确定当前所引用的方案编制依据是否与当前项目以及单位工程类型相关;通过所构建的知识图谱,查询获取得到当前项目所在位置,并对地方性标准规范进行分词与主题词提取,通过对比项目所在位置与地方标准规范发行地是否一致,来判断地方性标准规范是否引用合理;
第三、通过模式匹配的方式对存在迭代更新的方案编制依据进行内容上的匹配检索,从而对具体的迭代更新内容进行识别定位;对存在替代废止关系的方案编制依据直接进行工程施工方案相应章节内容上的整体替换更新,同时通过知识图谱链路连通性以及实体间属性关系的向量表示与查询,确定方案内容上的合规性;通过将人工经验审核与基于知识表示的工程方案编合规性审查结果相结合,实现新编工程施工方案全文合规性的审查。
10.一种工程施工方案编制依据的智能生成系统,其特征在于,包括:
方案编制依据知识图谱数据构建模块,其用于构建形成建立知识图谱所需的数据集,具体用于对原始工程施工方案数据收集整理,以及基于原始数据进行(工程实体,关系,工程实体)三元组数据构建;
方案编制依据知识图谱构建模块,其用于将上述构建得到的(工程实体,关系,工程实体)三元组数据导入图数据库,并通过知识表示学习,学习得到实体及关系的向量表示以构建形成工程施工方案编制依据知识图谱;同时,方案编制依据知识图谱构建模块还包括对方案编制依据知识图谱的更新扩展,更新扩展包括对方案编制依据知识图谱的实体节点上的内容更新扩展,以及对方案编制依据知识图谱实体关系上的逻辑更新;
工程施工方案编制依据智能生成模块,其用于向用户生成方案编制依据;其中,对用户输入的检索序列进行中文分词并进行单位工程关键词的信息提取,并通过计算用户所输入的单位工程检索关键词与知识图谱中相应单位工程及其方案编制依据的关联路径之间的语义相似度,对相似度计算结果进行排序后,根据相似度排序结果进行方案编制依据的智能生成;
施工方案风险合规性审查与违规修正模块,其用于对新编工程施工方案进行风险合规性审查并对不合规的审查结果进行定位与反馈。
CN202211684300.7A 2022-12-27 2022-12-27 一种工程施工方案编制依据的智能生成方法及系统 Pending CN115982329A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211684300.7A CN115982329A (zh) 2022-12-27 2022-12-27 一种工程施工方案编制依据的智能生成方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211684300.7A CN115982329A (zh) 2022-12-27 2022-12-27 一种工程施工方案编制依据的智能生成方法及系统

Publications (1)

Publication Number Publication Date
CN115982329A true CN115982329A (zh) 2023-04-18

Family

ID=85959119

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211684300.7A Pending CN115982329A (zh) 2022-12-27 2022-12-27 一种工程施工方案编制依据的智能生成方法及系统

Country Status (1)

Country Link
CN (1) CN115982329A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116188091A (zh) * 2023-05-04 2023-05-30 品茗科技股份有限公司 造价清单自动匹配单价引用的方法、装置、设备及介质
CN117973947A (zh) * 2024-04-01 2024-05-03 国网山东省电力公司宁津县供电公司 一种配电网工程施工工艺标准化验收方法及系统

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116188091A (zh) * 2023-05-04 2023-05-30 品茗科技股份有限公司 造价清单自动匹配单价引用的方法、装置、设备及介质
CN117973947A (zh) * 2024-04-01 2024-05-03 国网山东省电力公司宁津县供电公司 一种配电网工程施工工艺标准化验收方法及系统

Similar Documents

Publication Publication Date Title
CN111428053B (zh) 一种面向税务领域知识图谱的构建方法
CN111428054B (zh) 一种网络空间安全领域知识图谱的构建与存储方法
CN111708773B (zh) 一种多源科创资源数据融合方法
CN111723215B (zh) 基于文本挖掘的生物技术信息知识图谱构建装置与方法
TWI509435B (zh) 用於自動地執行聯結操作之方法、器件及電腦程式產品
CN115982329A (zh) 一种工程施工方案编制依据的智能生成方法及系统
CN110990590A (zh) 一种基于强化学习和迁移学习的动态金融知识图谱构建方法
CN113434623B (zh) 一种基于多源异构空间规划数据的融合方法
CN112612863B (zh) 一种基于中文分词器的地址匹配方法及系统
CN113918725A (zh) 一种水务领域知识图谱的构建方法
CN111737477A (zh) 一种基于知识产权大数据的情报调查方法、系统和存储介质
CN115438199A (zh) 一种基于智慧城市场景数据中台技术的知识平台系统
Wu et al. Automating common data integration for improved data-driven decision-support system in industrial construction
CN111104503A (zh) 一种建筑工程质量验收规范问答系统及其构建方法
CN111325235B (zh) 面向多语种的通用地名语义相似度计算方法及其应用
CN115827885A (zh) 一种运维知识图谱的构建方法、装置及电子设备
CN115495594A (zh) 基于城市公共设施决策案例的知识图谱融合方法及系统
Tang et al. Risk minimization based ontology mapping
Faiz et al. OD2WD: From Open Data to Wikidata through Patterns.
CN117151659B (zh) 一种基于大语言模型的生态修复工程全生命周期追溯方法
Bajpai et al. Data quality issues and current approaches to data cleaning process in data warehousing
CN109299381A (zh) 一种基于语义概念的软件缺陷检索和分析系统及方法
Cheng et al. Data fusion method for digital gazetteer
Shbita et al. Automatically Constructing Geospatial Feature Taxonomies from OpenStreetMap Data
Li et al. Information Extraction for Semantic Enrichment of BIM for Bridges

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right

Effective date of registration: 20230602

Address after: 430048 No. 11 Jinyinhu Road, Dongxihu District, Wuhan City, Hubei Province

Applicant after: CCCC SECOND HARBOR ENGINEERING Co.,Ltd.

Applicant after: CCCC WUHAN CHI HENG INTERNATIONAL ENGINEERING CONSULTING Co.,Ltd.

Address before: 430048 No. 11 Jinyinhu Road, Dongxihu District, Wuhan City, Hubei Province

Applicant before: CCCC SECOND HARBOR ENGINEERING Co.,Ltd.

TA01 Transfer of patent application right