CN109214642B - 一种建筑施工工序约束的自动抽取和分类方法及系统 - Google Patents

一种建筑施工工序约束的自动抽取和分类方法及系统 Download PDF

Info

Publication number
CN109214642B
CN109214642B CN201810750801.8A CN201810750801A CN109214642B CN 109214642 B CN109214642 B CN 109214642B CN 201810750801 A CN201810750801 A CN 201810750801A CN 109214642 B CN109214642 B CN 109214642B
Authority
CN
China
Prior art keywords
construction
lstm
mode
process constraint
model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810750801.8A
Other languages
English (en)
Other versions
CN109214642A (zh
Inventor
钟波涛
邢雪娇
骆汉宾
周启瑞
尹紫微
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huazhong University of Science and Technology
Original Assignee
Huazhong University of Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huazhong University of Science and Technology filed Critical Huazhong University of Science and Technology
Priority to CN201810750801.8A priority Critical patent/CN109214642B/zh
Publication of CN109214642A publication Critical patent/CN109214642A/zh
Application granted granted Critical
Publication of CN109214642B publication Critical patent/CN109214642B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0633Workflow analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • G06F40/295Named entity recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/02Knowledge representation; Symbolic representation
    • G06N5/022Knowledge engineering; Knowledge acquisition
    • G06N5/025Extracting rules from data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
    • G06Q50/08Construction

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Human Resources & Organizations (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Economics (AREA)
  • Strategic Management (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Computational Linguistics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Tourism & Hospitality (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Marketing (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • General Business, Economics & Management (AREA)
  • Game Theory and Decision Science (AREA)
  • Quality & Reliability (AREA)
  • Operations Research (AREA)
  • Primary Health Care (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Educational Administration (AREA)
  • Development Economics (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • Computing Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Stored Programmes (AREA)

Abstract

本发明公开了一种建筑施工工序约束的自动抽取和分类方法及系统,属于自然语言处理和建筑工程领域,该方法包括:采集建筑工程规范条文并标注工序约束模式;构建BI‑LSTM‑CRF模型,识别规范条文中的命名实体,并标记实体属性;构建LSTM‑MLP模型,判断规范条文内含有的工序约束的模式类型,并对该工序约束进行结构化表达;利用已标注的训练样本,进行模型训练;利用已标注的测试样本,进行模型测试,分析测试结果与实际结果的误差值,并反馈修改模型参数。本发明的方法及系统采用BI‑LSTM‑CRF和LSTM‑MLP模型,可实现建筑工程规范条文中施工工序约束的自动抽取和分类,并进行约束知识的结构化表达,有助于对施工工序约束知识的学习、查询与应用。

Description

一种建筑施工工序约束的自动抽取和分类方法及系统
技术领域
本发明属于自然语言处理和建筑工程领域,更具体地,涉及一种基于机器学习的建筑施工工序约束的自动抽取和分类方法及系统。
背景技术
近年来,我国的建筑业发展十分迅速,建筑工程效率明显提升,但是从工程施工质量管理的角度来看,仍然存在着诸多的问题,比如:施工从业人员没有熟练的施工技术、工程质量验收工作力度不足、信息沟通不够及时和畅通等。这些问题都会在一定程度上影响建筑工程的质量,甚至会造成工程安全事故。因此要想保障建筑工程质量,就必须做好施工质量管理工作。
建筑工程往往呈现施工周期长,多专业、多工种、多工序在同一项目上交叉作业,隐蔽工程多等特点。因此,建筑工程施工质量的控制难度较大。当前,工程施工质量的控制按照施工活动形成过程的时间段可划分为事前控制、事中控制和事后控制。无论是哪个阶段的质量控制,都需要相关从业人员熟练掌握建筑材料、产品的属性约束以及工序约束等相关约束知识。
然而,这些约束知识广泛地存在于大量非结构化或半结构文档中(例如设计文件、施工规范文件和验收规范文件等),造成了知识学习、查询与应用过程的低效。
各类工程规范文件中对于工程质量的要求大体上可以分为两类,分别是定性约束和定量约束。定性约束指的是施工的顺序、施工的环境条件等,定量约束指的是工程材料和产品的物理尺寸、强度要求等。对于定量约束,往往伴随着数学符号这样的明显特征,信息的抽取过程相对比较容易,但是对于定性约束,尤其是工序约束,由于描述方式的不统一,使得知识学习、查询与应用过程更为困难。
因此,急需一种能够将工程规范的定性约束进行统一描述的方法。
发明内容
针对现有技术的以上缺陷或改进需求,本发明提供了一种建筑施工工序约束的自动抽取和分类方法及系统,其目的在于,通过BI-LSTM-CRF模型(“bidirectional”-“longshort-term memory”-“conditional random field”)和LSTM-MLP模型(“long short-termmemory”-“multilayer perceptron”)对建筑工程规范条文进行字词提取、模式分类及结构化表达,实现对建筑工程规范条文的统一描述及自动分类,降低其学习、查询与应用的难度。
为了实现上述目的,本发明提供了一种建筑施工工序约束的自动抽取和分类方法,包括如下步骤:
A、采集一定数量的建筑工程规范条文,标注上述建筑工程规范条文的工序约束模式类型,并提取工序约束模式中的命名实体;然后从已标注工序约束模式及对应命名实体的建筑工程规范条文中,选取训练样本和测试样本;
B、从训练样本中选择一条建筑工程规范条文输入BI-LSTM-CRF模型,识别出该建筑工程规范条文中的命名实体,并标记实体属性;
C、将步骤B识别出的命名实体输入LSTM-MLP模型,判断步骤B选用的建筑工程规范条文内含有的工序约束模式的类型,并对该工序约束模式进行结构化表达;
D、对训练样本重复步骤B、C,对BI-LSTM-CRF模型和LSTM-MLP模型进行训练;
E、将测试样本输入经步骤D训练后的各模型,分析输出的测试结果与实际结果的误差值,若该误差值符合预期,则结束训练;否则,按照步骤A采集新的训练样本和测试样本,重复步骤D、E,直至误差值符合预期。
进一步地,步骤A包括如下子步骤:
A1、定义建筑工程施工工序约束模式的类型,并规定每类模式下的施工活动与施工活动或工作状态之间的时间关系;
A2、采集一定数量的建筑工程规范条文,根据步骤A1的定义,判断每条规范所含的工序约束模式并进行标注;
A3、提取每条建筑工程规范条文对应的工序约束模式中的命名实体,包括:施工对象、施工动作以及时间关系。
进一步地,步骤B包括如下子步骤:
B1、将一条步骤A中已标注工序约束模式及对应命名实体的建筑工程规范条文,通过字嵌入方式以单个文字为单位转换为二维空间矩阵;
B2、构建BI-LSTM-CRF模型;
B3、将步骤B1建立的二维空间矩阵输入步骤B2的BI-LSTM-CRF模型,识别出规范条文中的命名实体,并对实体属性进行标记。
进一步地,步骤B1包括如下子步骤:
B11、建立或直接获取已有的建筑工程规范条文领域字典;
B12、将选定的建筑工程规范条文中包含的字,分别在步骤B11的字典中进行检索,确定各字的向量;
B13、按照选定的建筑工程规范条文中的字的序列,将步骤B12查找的字的向量,组合成建筑工程规范条文的二维空间矩阵。
进一步地,步骤B2中的BI-LSTM-CRF模型包括BI-LSTM层、隐藏层和CRF层。
进一步地,步骤C包括如下子步骤:
C1、依据步骤B识别出的命名实体,将选定的建筑工程规范条文以命名实体为单位,通过词嵌入方式转换为二维空间矩阵;
C2、构建LSTM-MLP模型;
C3、将步骤C1建立的二维空间矩阵输入LSTM-MLP模型,识别规范条文工序约束模式的类型;
C4、依据步骤B识别的命名实体与步骤C3识别的工序约束模式类型对选定的建筑工程规范条文的工序约束模式进行结构化表达。
进一步地,步骤C1包括如下子步骤:
C11、建立或直接获取已有的建筑工程规范条文领域词典;
C12、将选定的建筑工程规范条文中包含的命名实体,分别在步骤C11的词典中进行检索;
C13、按照选定的建筑工程规范条文中的命名实体的序列,将步骤C12查找到的命名实体的向量,组合成建筑工程规范条文的二维空间矩阵。
进一步地,步骤C2所述的LSTM-MLP模型包括LSTM层和MLP层;MLP层包括输入层、隐藏层和输出层。
为了实现上述目的,本发明还提供了一种基于机器学习的建筑施工工序约束的自动抽取和分类系统,包括:
建筑工程规范条文获取和标注模块、命名实体识别模块、工序约束模式分类模块和工序约束模式结构化表达模块;其中,
建筑工程规范条文获取和标注模块,用于采集建筑工程规范条文,并对采集的建筑工程规范条文进行工序约束模式类型的标注;
命名实体识别模块,用于识别已标注的建筑工程规范条文中的命名实体,并标记实体属性;
工序约束模式分类模块,用于根据命名实体识别模块已识别的命名实体,判断对应的建筑工程规范条文内含有的工序约束的模式类型;
工序约束模式结构化表达模块,用于根据命名实体识别模块已识别的命名实体,以及工序约束模式分类模块识别出的对应的工序约束的模式类型,将对应的建筑工程规范条文的工序约束进行结构化表达。
进一步地,该系统还包括模型参数优化模块,用于根据实际需求定期或不定期地将新建筑工程规范条文数据,输入建筑工程规范条文获取和标注模块进行相应处理,并将处理后的数据,输入命名实体识别模块、工序约束模式分类模块和工序约束模式结构化表达模块,从而对上述模块进行训练,优化各模块的内部参数。
总体而言,本发明所构思的以上技术方案与现有技术相比,能够取得下列有益效果:
1、本发明通过对建筑工程规范条文进行工序约束模式的标注,进而利用BI-LSTM-CRF模型和LSTM-MLP模型对建筑工程规范条文进行字词提取、模式分类及结构化表达,将抽象的定性描述转换为固定模式的结构化表达,从而实现对建筑工程规范条文的统一描述及自动分类,降低其学习、查询与应用的难度;
2、通过对工序约束模式的类型进行定义,将不同建筑工程规范条文进行统一化处理,转化为固定的几个模式的文本,有利于机器自动识别及提取;
3、通过BI-LSTM-CRF模型对标注后的建筑工程规范条文进行以字为单位的解构,转换为计算机易于识别及运算的二维空间矩阵,从而将抽象的定性约束转换为数学符号特征,实现计算机对命名实体的自动提取及识别;
4、通过将BI-LSTM-CRF模型处理后的以字为单位的二维空间矩阵转换为以词(即命名实体)为单位的二维空间矩阵,进一步利用LSTM-MLP模型进行识别,从而实现对规范条文的工序约束模式进行结构化表达,将抽象的定性约束转换为直观形象的、计算机易于描述、识别及传播的结构化信息,从而实现建筑工程规范中施工工序约束的自动分类;
5、本发明可实现对建筑工程规范中施工工序约束的自动提取和分类,结合直观形象的结构化表达,可对施工工序约束进行统一化描述,有利于对工序约束知识的学习、查询与应用。
附图说明
图1是本发明优选实施例中的基于机器学习的建筑施工工序约束的自动抽取和分类方法示意图;
图2是本发明优选实施例中的基于BI-LSTM-CRF模型的规范条文命名实体的识别与标记示意图;
图3是本发明优选实施例中针对规范条文“砌筑基础前应校核放线尺寸”的工序约束模式的识别及结构化表达过程示意图;
图4是本发明优选实施例中的LSTM-MLP模型中基于MLP层的工序模式的分类与结构化表达示意图;
图5是本发明优选实施例中的基于机器学习的建筑施工工序约束的自动抽取和分类系统结构示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。此外,下面所描述的本发明各个实施方式中所涉及到的技术特征只要彼此之间未构成冲突就可以相互组合。
参阅图1所示,是本发明优选实施例中的基于机器学习的建筑施工工序约束的自动抽取和分类方法示意图。该建筑施工工序约束的自动抽取和分类方法包括以下步骤:
A、采集一定数量的建筑工程规范条文,并进行工序约束模式的标注:
A1、定义建筑工程施工工序约束模式的类型,并规定每类模式下的施工活动与施工活动(或工作状态)间的时间关系。本实例中以五种类别的工序模式为例,分别命名为模式1~模式5,模式1~模式5含义如下:
模式1:工序X结束后,立即进行工序Y;
模式2:工序X结束后,工序Y需要在特定时间段内进行;
模式3:工序X结束后,进行工序Y,但没有具体时间间隔要求;
模式4:工序X结束后,工序Y需至少等待特定时间后进行;
模式5:工序X需要在某一特定施工状态下才能进行;
根据实际工程内容的不同,上述模式的数量也可以增加或减少,具体时间关系也可以根据实际工程内容进行调整;
A2、采集一定数量的建筑工程规范条文,依据上述五类约束模式类别,判断每条规范所含的工序约束模式并进行标注;
A3、提取每条建筑工程规范条文中对应工序约束模式的命名实体,即“施工对象(object,OBJ)”、“施工动作(procedure,PROC)”、“时间关系”等。
B、构建BI-LSTM-CRF模型(参阅图2所示),以规范条文“砌筑基础前应校核放线尺寸”为例,识别规范条文中的命名实体,并标记实体属性:
B1、将建筑工程规范条文通过字嵌入转换为二维空间矩阵,如将规范条文“砌筑基础前应校核放线尺寸”转换为二维空间矩阵M1(参阅图3所示);
B2、构建BI-LSTM-CRF模型;
B3、将代表规范条文“砌筑基础前应校核放线尺寸”的二维空间矩阵M输入到BI-LSTM-CRF模型,识别规范条文中的命名实体,并对实体属性进行标记。即,砌筑(施工动作,PROC)基础(施工对象,OBJ)前(其他,O)应(其他,O)校核(施工动作,PROC)放线尺寸(施工对象,OBJ)。
首次进行步骤B的操作之前,先对BI-LSTM-CRF模型进行初始化,本实施例是通过计算机对BI-LSTM-CRF模型中的参数随机赋予初值。随后,上述参数会在训练过程中根据每次输入的内容进行自适应调整。
C、构建LSTM-MLP模型,判断规范条文内含有的工序约束的模式类型,并对该工序约束进行结构化表达:
C1、依据从规范条文中识别的命名实体,将建筑工程规范条文通过词嵌入转换为二维空间矩阵。如,将“砌筑/基础/前/应/校核/放线尺寸”转换为二维空间矩阵M2(参阅图3所示);
C2、构建LSTM-MLP模型;
C3、将二维空间矩阵输入到LSTM-MLP模型,判断规范条文工序约束模式的类型,如,“砌筑基础前应校核放线尺寸”所属的约束模式类型为模式3(工序X结束后,进行工序Y,但没有具体时间间隔要求);
C4、依据识别的命名实体与工序约束模式类型对规范条文的工序约束模式进行结构化表达(参阅图4所示,其中,不同类型的箭头形式代表工序间不同的时间关系)。
首次进行步骤C的操作之前,先对LSTM-MLP模型进行初始化,本实施例是通过计算机对LSTM-MLP模型中的参数随机赋予初值。随后,上述参数会在训练过程中根据每次输入的内容进行自适应调整。
D、利用已经步骤A标注的训练样本,对步骤B、C的模型进行训练。
E、利用已经步骤A标注的测试样本,对训练后的模型进行测试,分析测试结果与实际结果的误差值,及测试结果错误的数量占总测试样本数量的比例,并反馈修改模型参数。
优选地,假定理想的误差值≤5%,即识别错误率≤5%,若测试结果错误率≤5%,则训练后的模型可用,停止训练;若测试结果错误率>5%,则从步骤A标注后的规范条文中(在其他实施例中,也可以直接按照步骤A的方式获取全新的样本数据),重新选一批分为新的训练样本和新的测试样本,利用新的训练样本重新训练步骤B、C的模型,再利用新的测试样本对重新训练后的模型进行测试,直至误差值达到理想范围。
根据实际的使用需求,上述误差值可以适当调高或者调低,并不受本实施例的限制。
参阅图5所示,是本发明实施例中的基于机器学习的建筑施工工序约束的自动抽取和分类系统结构示意图。所述的建筑施工工序约束的自动抽取和分类系统包括建筑工程规范条文获取模块、命名实体识别模块、工序约束模式分类模块、工序约束模式结构化表达模块、建筑工程规范条文标注模块和参数优化模块:
建筑工程规范条文获取模块,用于采集建筑工程规范条文;命名实体识别模块,用于识别规范条文中的命名实体,并标记实体属性;工序约束模式分类模块,用于判断规范条文内含有的工序约束的模式类型;工序约束模式结构化表达模块,用于对规范条文的工序约束进行结构化表达;建筑工程规范条文标注模块,用于建筑工程规范条文工序约束模式类型的标注;模型参数优化模块,用于定期使用新数据训练模型,通过分析模型运行结果与实际结果的误差值,反馈修改优化模型参数。
通过本发明提供的基于机器学习的建筑施工工序约束的自动抽取和分类方法及系统,可实现对建筑工程规范中施工工序约束的自动提取和分类,结合直观形象的结构化表达,可对施工工序约束进行统一化描述,有利于对工序约束知识的学习、查询与应用。
本领域的技术人员容易理解,以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

Claims (9)

1.一种建筑施工工序约束的自动抽取和分类方法,其特征在于,包括如下步骤:
A、采集一定数量的建筑工程规范条文,标注上述建筑工程规范条文的工序约束模式类型,并提取工序约束模式中的命名实体;然后从已标注工序约束模式及对应命名实体的建筑工程规范条文中,选取训练样本和测试样本;
B、从训练样本中选择一条建筑工程规范条文输入BI-LSTM-CRF模型,识别出该建筑工程规范条文中的命名实体,并标记实体属性;
C、将步骤B识别出的命名实体输入LSTM-MLP模型,判断步骤B选用的建筑工程规范条文内含有的工序约束模式的类型,并对该工序约束模式进行结构化表达;
D、对训练样本重复步骤B、C,对BI-LSTM-CRF模型和LSTM-MLP模型进行训练;
E、将测试样本输入经步骤D训练后的各模型,分析输出的测试结果与实际结果的误差值,若该误差值符合预期,则结束训练;否则,按照步骤A采集新的训练样本和测试样本,重复步骤D、E,直至误差值符合预期;
其中,步骤A包括如下子步骤:
A1、定义建筑工程施工工序约束模式的类型,并规定每类模式下的施工活动与施工活动或工作状态之间的时间关系;
A2、采集一定数量的建筑工程规范条文,根据步骤A1的定义,判断每条规范所含的工序约束模式并进行标注;
A3、提取每条建筑工程规范条文对应的工序约束模式中的命名实体,包括:施工对象、施工动作以及时间关系。
2.根据权利要求1所述的一种建筑施工工序约束的自动抽取和分类方法,其特征在于,步骤B包括如下子步骤:
B1、将一条步骤A中已标注工序约束模式及对应命名实体的建筑工程规范条文,通过字嵌入方式以单个文字为单位转换为二维空间矩阵;
B2、构建BI-LSTM-CRF模型;
B3、将步骤B1建立的二维空间矩阵输入步骤B2的BI-LSTM-CRF模型,识别出规范条文中的命名实体,并对实体属性进行标记。
3.根据权利要求2所述的一种建筑施工工序约束的自动抽取和分类方法,其特征在于,步骤B1包括如下子步骤:
B11、建立或直接获取已有的建筑工程规范条文领域字典;
B12、将选定的建筑工程规范条文中包含的字,分别在步骤B11的字典中进行检索,确定各字的向量;
B13、按照选定的建筑工程规范条文中的字的序列,将步骤B12查找的字的向量,组合成建筑工程规范条文的二维空间矩阵。
4.根据权利要求2所述的一种建筑施工工序约束的自动抽取和分类方法,其特征在于,步骤B2中的BI-LSTM-CRF模型包括BI-LSTM层、隐藏层和CRF层。
5.根据权利要求1~4任意一项所述的一种建筑施工工序约束的自动抽取和分类方法,其特征在于,步骤C包括如下子步骤:
C1、依据步骤B识别出的命名实体,将选定的建筑工程规范条文以命名实体为单位,通过词嵌入方式转换为二维空间矩阵;
C2、构建LSTM-MLP模型;
C3、将步骤C1建立的二维空间矩阵输入LSTM-MLP模型,识别规范条文工序约束模式的类型;
C4、依据步骤B识别的命名实体与步骤C3识别的工序约束模式类型对选定的建筑工程规范条文的工序约束模式进行结构化表达。
6.根据权利要求5所述的一种建筑施工工序约束的自动抽取和分类方法,其特征在于,步骤C1包括如下子步骤:
C11、建立或直接获取已有的建筑工程规范条文领域词典;
C12、将选定的建筑工程规范条文中包含的命名实体,分别在步骤C11的词典中进行检索;
C13、按照选定的建筑工程规范条文中的命名实体的序列,将步骤C12查找到的命名实体的向量,组合成建筑工程规范条文的二维空间矩阵。
7.根据权利要求5所述的一种建筑施工工序约束的自动抽取和分类方法,其特征在于,步骤C2所述的LSTM-MLP模型包括LSTM层和MLP层;MLP层包括输入层、隐藏层和输出层。
8.一种基于机器学习的建筑施工工序约束的自动抽取和分类系统,用于执行权利要求1~7任意一项所述的建筑施工工序约束的自动抽取和分类方法,其特征在于,包括:
建筑工程规范条文获取和标注模块、命名实体识别模块、工序约束模式分类模块和工序约束模式结构化表达模块;其中,
建筑工程规范条文获取和标注模块,用于采集建筑工程规范条文,并对采集的建筑工程规范条文进行工序约束模式类型的标注;
命名实体识别模块,用于识别已标注的建筑工程规范条文中的命名实体,并标记实体属性;
工序约束模式分类模块,用于根据命名实体识别模块已识别的命名实体,判断对应的建筑工程规范条文内含有的工序约束的模式类型;
工序约束模式结构化表达模块,用于根据命名实体识别模块已识别的命名实体,以及工序约束模式分类模块识别出的对应的工序约束的模式类型,将对应的建筑工程规范条文的工序约束进行结构化表达。
9.根据权利要求8所述的一种基于机器学习的建筑施工工序约束的自动抽取和分类系统,其特征在于,还包括模型参数优化模块,用于根据实际需求定期或不定期地将新建筑工程规范条文数据,输入建筑工程规范条文获取和标注模块进行相应处理,并将处理后的数据,输入命名实体识别模块、工序约束模式分类模块和工序约束模式结构化表达模块,从而对上述模块进行训练,优化各模块的内部参数。
CN201810750801.8A 2018-07-10 2018-07-10 一种建筑施工工序约束的自动抽取和分类方法及系统 Active CN109214642B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810750801.8A CN109214642B (zh) 2018-07-10 2018-07-10 一种建筑施工工序约束的自动抽取和分类方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810750801.8A CN109214642B (zh) 2018-07-10 2018-07-10 一种建筑施工工序约束的自动抽取和分类方法及系统

Publications (2)

Publication Number Publication Date
CN109214642A CN109214642A (zh) 2019-01-15
CN109214642B true CN109214642B (zh) 2020-09-18

Family

ID=64990036

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810750801.8A Active CN109214642B (zh) 2018-07-10 2018-07-10 一种建筑施工工序约束的自动抽取和分类方法及系统

Country Status (1)

Country Link
CN (1) CN109214642B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112101023B (zh) * 2020-10-29 2022-12-06 深圳市欢太科技有限公司 文本处理方法、装置以及电子设备
CN112446203A (zh) * 2020-11-25 2021-03-05 深圳供电局有限公司 一种建筑变电可研规范条文结构生成方法
CN113779992A (zh) * 2021-07-19 2021-12-10 西安理工大学 基于词汇增强和预训练的BcBERT-SW-BiLSTM-CRF模型的实现方法
CN117252202B (zh) * 2023-11-20 2024-03-19 江西风向标智能科技有限公司 高中数学题目中命名实体的构建方法、识别方法和系统
CN117435595B (zh) * 2023-12-21 2024-03-08 上海建工集团股份有限公司 建筑施工过程中工艺数据的存储和分析的方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107480549A (zh) * 2017-06-28 2017-12-15 银江股份有限公司 一种面向数据共享的敏感信息脱敏方法及系统
CN107644014A (zh) * 2017-09-25 2018-01-30 南京安链数据科技有限公司 一种基于双向lstm和crf的命名实体识别方法
KR101846824B1 (ko) * 2017-12-11 2018-04-09 가천대학교 산학협력단 개체명 인식시스템, 방법, 및 컴퓨터 판독가능매체
CN107943860A (zh) * 2017-11-08 2018-04-20 北京奇艺世纪科技有限公司 模型的训练方法、文本意图的识别方法及装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107480549A (zh) * 2017-06-28 2017-12-15 银江股份有限公司 一种面向数据共享的敏感信息脱敏方法及系统
CN107644014A (zh) * 2017-09-25 2018-01-30 南京安链数据科技有限公司 一种基于双向lstm和crf的命名实体识别方法
CN107943860A (zh) * 2017-11-08 2018-04-20 北京奇艺世纪科技有限公司 模型的训练方法、文本意图的识别方法及装置
KR101846824B1 (ko) * 2017-12-11 2018-04-09 가천대학교 산학협력단 개체명 인식시스템, 방법, 및 컴퓨터 판독가능매체

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Deep learning-based extraction of construction procedural constraints from construction regulations;Botao Zhonga et al.;《Advanced Engineering Informatics》;20200131;第43卷;全文 *
建筑工程质量验收规范知识建模与抽取研究;胡海盟;《中国优秀硕士学位论文全文数据库》;20161231(第12期);C038-80 *

Also Published As

Publication number Publication date
CN109214642A (zh) 2019-01-15

Similar Documents

Publication Publication Date Title
CN109214642B (zh) 一种建筑施工工序约束的自动抽取和分类方法及系统
CN107122375B (zh) 基于图像特征的图像主体的识别方法
CN108875599A (zh) 一种建筑行业工程cad图纸的识别审图方法
CN111259873B (zh) 一种表格数据提取方法及装置
CN110489749B (zh) 一种智能办公自动化系统的业务流程优化方法
CN110046356B (zh) 标签嵌入的微博文本情绪多标签分类方法
CN110825839B (zh) 一种对文本信息中目标的关联关系分析方法
CN112163553B (zh) 物料价格核算方法、装置、存储介质和计算机设备
CN105975457A (zh) 基于全自动学习的信息分类预测系统
EP2323083A1 (de) Technisches Klassifikationssystem
CN112115265A (zh) 文本分类中的小样本学习方法
Robbes et al. Leveraging small software engineering data sets with pre-trained neural networks
CN114936835A (zh) 一种基于bim的合规性自动审查方法及系统
CN112580332B (zh) 一种基于标签分层延深建模的企业画像方法
CN113591093A (zh) 基于自注意力机制的工业软件漏洞检测方法
CN110837703A (zh) 基于Pro/E的液压缸快速设计系统及方法
CN111860981A (zh) 一种基于lstm深度学习的企业国民行业类别预测方法及系统
CN115146062A (zh) 融合专家推荐与文本聚类的智能事件分析方法和系统
CN116401338A (zh) 一种基于数据资产智能检索输入输出要求设计特征提取和注意力机制及其方法
CN110414819B (zh) 一种工单评分方法
CN113240443B (zh) 面向电力客服问答的实体属性对抽取方法和系统
CN111581815B (zh) 一种基于xml的工艺模型本体构建方法
CN114035783A (zh) 一种软件代码知识图谱构建方法及工具
CN111046934B (zh) 一种swift报文软条款识别方法及装置
CN111027318B (zh) 基于大数据的行业分类方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant