CN115809854A - 施工方案计算书的智能化审核方法及系统 - Google Patents
施工方案计算书的智能化审核方法及系统 Download PDFInfo
- Publication number
- CN115809854A CN115809854A CN202211464416.XA CN202211464416A CN115809854A CN 115809854 A CN115809854 A CN 115809854A CN 202211464416 A CN202211464416 A CN 202211464416A CN 115809854 A CN115809854 A CN 115809854A
- Authority
- CN
- China
- Prior art keywords
- construction scheme
- model training
- content
- construction
- rule base
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明为一种施工方案计算书的智能化审核方法及系统,系统包括基于自然语言处理技术(NLP)的审核内容语义表、基于人工整理的系统规则库、基于光学字符识别技术(OCR)的文档解析、基于计算机视觉技术(CV)的文档标注、基于算法的模型训练等。本发明基于自然语言处理技术(NLP),结合审核规则库和OCR识别技术,可实现不同类型施工方案中计算书的结果校核、规范引用正确性的审核等功能,并输出审核报告以便人工复审,精准击破计算内容风险,提高技术人员工作效率。
Description
技术领域
本发明属于建筑施工领域,尤其涉及一种施工方案计算书的智能化审核方法及系统。
背景技术
建筑施工方案是工程项目的实施方案,是建筑企业技术人员日常大量编写的文档材料。其中包括组织机构方案、人员组成方案、技术方案、安全方案、材料供应方案、计算书等。其中,计算书是施工方案的重要组成部分,关系到施工过程安全管控。
通常建筑施工方案中计算书由现场技术人员编撰完成后,提交技术管理条线人员进行校对和审核。由于计算书的复杂性和校验困难性,该部分审核往往耗时费力。传统审核流程中技术人员的工作量较大、耗时较长、效率较低,如何进一步提高工作质量、缩短工作时长是值得研究的问题。
发明内容
本发明的目的在于提供一种施工方案计算书的智能化审核方法及系统,该方法及系统通过人工智能替代技术人员开展施工方案中计算书审核,减少了技术人员工作量,并提高施工方案审核质量和效率。
本发明通过以下技术方案来实现:
一种施工方案计算书的智能化审核方法,其包括步骤:
整理人工审核的施工方案样本素材,按照不同施工方案类型进行整理;
确认样本素材的内容和抽取格式,整理成审核内容语义表;
确认人工智能审核的系统规则库;
基于光学字符识别技术进行待审核施工方案文档解析识别和文档格式转换;
基于计算机视觉技术进行待审核施工方案文档标注,对解析识别后的特征内容进行标注抽取;
邀请专家对标注抽取的信息进行人工审核,确保标注准确性;
基于各种算法模型对标注抽取的信息进行模型训练,包括内容语义表和规则库对比审核;
对模型训练后待完善内容进行优化;
对于系统审核有误的内容进行人工修改;
对待审核施工方案进行状态分类;
导出系统已审核和人工已审核的施工方案审核报告。
在本发明的实施例中,对标注抽取的信息进行模型训练的步骤中所涉及的算法包括:
结构化抽取算法,对于模板匹配度高、特征明显的已标注信息,抽取并基于内容语义表和规则库进行模型训练;
序列标注模块,包括一系列基础的序列标注技术,对于特征不明显的已标注信息,抽取并基于内容语义表和规则库进行模型训练。
在本发明的实施例中,对模型训练后待完善内容进行优化的步骤包括:
特征抽取,在不损伤核心信息的情况下降低向量空间维数,简化计算,提高文本处理的速度和效率;
调用智能分类模块,针对不同的抽取场景,使用包含但不限于下列基础分类器:支持向量机、xgboost、TextCNN;
使用计算图的方式开展优化审核,审核规则对应计算图上的节点,每个节点通过SPO三元组表达,文档内容及抽取的结果通过数据流的方式流经计算图完成优化审核。
一种施工方案计算书的智能化审核系统,其包括:
存储器,用于存储如上所述的施工方案计算书的智能化审核方法处理过程对应的程序代码;
处理器,用于运行所述程序代码。
一种施工方案计算书的智能化审核系统,其包括:
基于自然语言处理技术的审核内容语义表,用于在人工审核施工方案样本素材基础上,采用自然语言处理技术对文本内容进行识别和格式抽取,并按照不同施工方案类型整理成审核内容语义表;
基于人工整理的系统规则库,用于根据传统人工对施工方案进行审核的规则,确认人工智能审核的系统规则库;
基于光学字符识别技术的文档解析,用于采用光学字符识别技术,对不同文档格式的待审查施工方案的文字进行解析识别;
基于计算机视觉技术的文档标注,用于针对解析识别后的待审查施工方案特征内容,通过采用计算机视觉技术进行文档标注抽取,并邀请专家对标注信息进行审核以确保标注的准确性;
基于算法的模型训练,用于通过结构化抽取算法和序列标注模块,对标注后的待审核方案进行模型训练,并针对训练后显示待完善的内容,在系统规则库的基础上进行优化。
与现有技术相比,本发明具有以下有益效果:
1、将线下施工方案审核转换为线上施工方案智能集中审核方式,通过固化施工方案审核规则、提供可快速提取目标内容的内容语义表,实现施工方案计算书高效率、高质量审核;
2、根据内容比对,智能生成施工方案审核报告和优化结果,供现场生产人员参照执行;
3、打通机审与人审流程,通过人工智能对数据进行精准识别与审核,处理后交由人工进行二次审核,该工作方式自由度与灵活度极高,精准击破各类计算风险,提升审核效率。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的施工方案计算书的智能化审核方法的流程图。
具体实施方式
名称解释:
NLP:全称是Natural Language Processing,中文名称是自然语言处理,是研究人与计算机交互的语言问题的一门学科。按照技术实现难度的不同,这类系统可以分成简单匹配式、模糊匹配式和段落理解式三种类型。
OCR:全称是Optical Character Recognition,中文名称是光学字符识别,是指电子设备(例如扫描仪或数码相机)检查纸上打印的字符,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程;即,针对印刷体字符,采用光学的方式将纸质文档中的文字转换成为黑白点阵的图像文件,并通过识别软件将图像中的文字转换成文本格式,供文字处理软件进一步编辑加工的技术。
CV:全称是Computer Vision,中文名称是计算机视觉,是使用计算机及相关设备对生物视觉的一种模拟,是人工只能领域的一个重要部分,它的研究目标是使计算机具有通过二维图像认知三维环境信息的能力。计算机视觉是以图像处理技术、信号处理技术、概率统计分析、计算几何、神经网络、机器学习理论和计算机信息处理技术等为基础,通过计算机分析与处理视觉信息。
CRF:全称是conditional random field algorithm,中文名称是条件随机场算法,是一种数学算法,是2001年提出的,基于遵循马尔可夫性的概率图模型。
BiLSTM+CRF,是目前比较流行的序列标注算法,其将BiLSTM和 CRF结合在一起,使模型即可以像CRF一样考虑序列前后之间的关联性,又可以拥有LSTM的特征抽取及拟合能力。
Transformer:是一个利用注意力机制来提高模型训练速度的模型。
SVM:全称是Support Vector Machine,中文名称是支持向量机,是一类按监督学习(supervised learning)方式对数据进行二元分类的广义线性分类器,其决策边界是对学习样本求解的最大边距超平面。
Xgboost:是一个优化的分布式梯度增强库,旨在实现高效,灵活和便携。它在Gradient Boosting框架下实现机器学习算法。XGBoost提供并行树提升(也称为GBDT,GBM),可以快速准确地解决许多数据科学问题。相同的代码在主要的分布式环境(Hadoop,SGE,MPI)上运行,并且可以解决数十亿个示例之外的问题。
TextCNN:是使用卷积神经网络来进行文本分类;
SPO三元组:Subject,Predicate,Object,是知识表示的基本单位,简称SPO<Subject-主语,Predicate-谓语,Object-宾语>。
下面结合附图对本发明的具体实施方式作进一步说明。在此需要说明的是,对于这些实施方式的说明用于帮助理解本发明,但并不构成对本发明的限定。此外,下面所描述的本发明各个实施方式中所涉及的技术特征只要彼此之间未构成冲突就可以相互组合。
本发明提供了一种施工方案计算书的智能化审核方法及系统,基于自然语言处理技术(NLP),结合审核规则库和OCR识别技术,可实现不同类型施工方案中计算书的结果校核、规范引用正确性的审核等功能,并输出审核报告以便人工复审,精准击破计算内容风险,提高技术人员工作效率。
为实现上述目的,本发明采用的技术方案为:
实施例1:
一种施工方案计算书的智能化审核系统,包括基于自然语言处理技术 (NLP)的审核内容语义表、基于人工整理的系统规则库、基于光学字符识别技术(OCR)的文档解析、基于计算机视觉技术(CV)的文档标注、基于算法的模型训练等。所述基于自然语言处理技术(NLP)的审核内容语义表特征在于:在人工审核施工方案样本素材基础上,采用自然语言处理技术(NLP)对文本内容进行识别和格式抽取,并按照编制依据(段落)、工程概况(段落)、建筑设计概况(表格)、计算书(段落)等内容,整理成审核内容语义表;所述基于人工整理的系统规则库特征在于:根据传统人工对施工方案进行审核的规则,确认人工智能审核的系统规则库,如编制依据的合规性、工程概况的完整性、建筑设计参数的规范性、计算书的结果准确性等;所述基于光学字符识别技术(OCR)的文档解析特征在于:采用光学字符识别技术(OCR),对不同文档格式的待审查施工方案的文字进行解析识别;所述基于计算机视觉技术(CV)的文档标注特征在于:针对解析识别后的待审查施工方案特征内容,通过采用计算机视觉技术(CV)进行文档标注抽取,并邀请专家对标注信息进行审核以确保标注的准确性;所述基于算法的模型训练特征在于:通过结构化抽取算法和序列标注模块,对标注后的待审核方案进行模型训练,并针对训练后显示待完善的内容,在系统规则库的基础上进行优化。
本发明的工作原理为:通过自然语言处理技术(NLP)在样本素材基础上建立审核内容语义表,并基于人工审核情况整理系统规则库;待审核施工方案采用光学字符识别技术(OCR)和计算机视觉技术(CV)进行文档解析和标注后,通过比对审核内容语义表和系统规则库,对待审核施工方案进行模型训练并进行完善;此外,通过打通机审和人审流程,可实现人工对机审结果的复审,提高计算书审核工作的自由度、灵活度和精确度。
实施例2:参阅图1,本发明施工方案计算书的智能化审核步骤具体如下:
1)第一步,整理人工审核的施工方案样本素材,按照不同施工方案类型进行整理,例如悬挑脚手架施工方案、施工组织设计施工方案、高支模施工方案等;
2)第二步,确认样本素材的内容和抽取格式,整理成审核内容语义表,例如编制依据(段落)、工程概况(段落)、建筑设计概况(表格)、计算书(段落)等;
3)第三步,确认人工审核的规则,例如编制依据的合规性、工程概况的完整性、建筑设计参数的规范性、计算书的结果准确性等,并建立系统规则库;
4)第四步,基于光学字符识别技术(OCR)进行待审核施工方案文档解析识别和文档格式转换;
5)第五步,基于计算机视觉技术(CV)进行待审核施工方案文档标注,对解析识别后的特征内容进行标注抽取;
6)第六步,邀请专家对标注抽取的信息进行人工审核,确保标注准确性;
7)第七步,基于各种算法模型对标注抽取的信息进行模型训练,包括内容语义表和规则库对比审核;
8)第八步,对模型训练后待完善内容进行优化;
9)第九步,对于系统审核有误的内容进行人工修改;
10)第十步,对待审核施工方案进行状态分类,比如识别失败、识别中、识别成果、未审核、审核中、系统已审核、人工已复核等;
11)第十一步,导出系统已审核和人工已审核的施工方案审核报告,方便评审专家查阅及后续存档。
进一步的,第七步中,对标注抽取信息进行模型训练,所涉及算法包括:
1)结构化抽取算法,对于模板匹配度高、特征明显的已标注信息,抽取并基于内容语义表和规则库进行模型训练;
2)序列标注模块,包括一系列基础的序列标注技术:BiLSTM-CRF、 CRF条件随机场、Transformer,对于特征不明显的已标注信息,抽取并基于内容语义表和规则库进行模型训练。
进一步的,第八步中,模型训练后优化机制建立步骤如下:
1)特征抽取,在不损伤核心信息的情况下降低向量空间维数,简化计算,提高文本处理的速度和效率;
2)调用IDPS智能分类模块,针对不同的抽取场景例如章节定位、段落抽取、表格抽取等,使用包含但不限于下列基础分类器:支持向量机 (SVM)、xgboost、TextCNN;
3)使用计算图的方式开展优化审核,审核规则对应计算图上的节点,每个节点通过SPO(Subject,Predicate,Object)三元组表达,文档内容及抽取的结果通过数据流的方式流经计算图完成优化审核。
实施例3:
本发明一实施例的施工方案计算书的智能化审核系统,包括:
存储器,用于存储上述实施例的施工方案计算书的智能化审核方法处理过程对应的程序代码;
处理器,用于运行所述程序代码。
处理器可以采用DSP(Digital Signal Processing)数字信号处理器、 FPGA(Field-Programmable Gate Array)现场可编程门阵列、 MCU(Microcontroller Unit)系统板、SoC(system on a chip)系统板或包括I/O 的PLC(Programmable LogicController)最小系统。
与现有技术相比,本发明具有以下优点:
1、将线下施工方案审核转换为线上施工方案智能集中审核方式,通过固化施工方案审核规则、提供可快速提取目标内容的内容语义表,实现施工方案计算书高效率、高质量审核;
2、根据内容比对,智能生成施工方案审核报告和优化结果,供现场生产人员参照执行;
3、打通机审与人审流程,通过人工智能对数据进行精准识别与审核,处理后交由人工进行二次审核,该工作方式自由度与灵活度极高,精准击破各类计算风险,提升审核效率。
以上结合附图对本发明的实施方式作了详细说明,但本发明不限于所描述的实施方式。对于本领域的技术人员而言,在不脱离本发明原理和精神的情况下,对这些实施方式进行多种变化、修改、替换和变型,仍落入本发明的保护范围内。
从上述内容可以看出,本发明很好地适用于实现上述所有目的和目标,以及其它明显的和该结构固有的优点。应当理解,某些特征和子组合是有用的,并且可以在不参考其他特征和子组合的情况下使用。这是在本发明的范围内。
Claims (5)
1.一种施工方案计算书的智能化审核方法,其特征在于,包括步骤:
整理人工审核的施工方案样本素材,按照不同施工方案类型进行整理;
确认样本素材的内容和抽取格式,整理成审核内容语义表;
确认人工智能审核的系统规则库;
基于光学字符识别技术进行待审核施工方案文档解析识别和文档格式转换;
基于计算机视觉技术进行待审核施工方案文档标注,对解析识别后的特征内容进行标注抽取;
邀请专家对标注抽取的信息进行人工审核,确保标注准确性;
基于各种算法模型对标注抽取的信息进行模型训练,包括内容语义表和规则库对比审核;
对模型训练后待完善内容进行优化;
对于系统审核有误的内容进行人工修改;
对待审核施工方案进行状态分类;
导出系统已审核和人工已审核的施工方案审核报告。
2.根据权利要求1所述的施工方案计算书的智能化审核方法,其特征在于,对标注抽取的信息进行模型训练的步骤中所涉及的算法包括:
结构化抽取算法,对于模板匹配度高、特征明显的已标注信息,抽取并基于内容语义表和规则库进行模型训练;
序列标注模块,包括一系列基础的序列标注技术,对于特征不明显的已标注信息,抽取并基于内容语义表和规则库进行模型训练。
3.根据权利要求1所述的施工方案计算书的智能化审核方法,其特征在于,对模型训练后待完善内容进行优化的步骤包括:
特征抽取,在不损伤核心信息的情况下降低向量空间维数,简化计算,提高文本处理的速度和效率;
调用智能分类模块,针对不同的抽取场景,使用包含但不限于下列基础分类器:支持向量机、xgboost、TextCNN;
使用计算图的方式开展优化审核,审核规则对应计算图上的节点,每个节点通过SPO三元组表达,文档内容及抽取的结果通过数据流的方式流经计算图完成优化审核。
4.一种施工方案计算书的智能化审核系统,其特征在于,包括:
存储器,用于存储如权利要求1至3中任一项所述的施工方案计算书的智能化审核方法处理过程对应的程序代码;
处理器,用于运行所述程序代码。
5.一种施工方案计算书的智能化审核系统,其特征在于,包括:
基于自然语言处理技术的审核内容语义表,用于在人工审核施工方案样本素材基础上,采用自然语言处理技术对文本内容进行识别和格式抽取,并按照不同施工方案类型整理成审核内容语义表;
基于人工整理的系统规则库,用于根据传统人工对施工方案进行审核的规则,确认人工智能审核的系统规则库;
基于光学字符识别技术的文档解析,用于采用光学字符识别技术,对不同文档格式的待审查施工方案的文字进行解析识别;
基于计算机视觉技术的文档标注,用于针对解析识别后的待审查施工方案特征内容,通过采用计算机视觉技术进行文档标注抽取,并邀请专家对标注信息进行审核以确保标注的准确性;
基于算法的模型训练,用于通过结构化抽取算法和序列标注模块,对标注后的待审核方案进行模型训练,并针对训练后显示待完善的内容,在系统规则库的基础上进行优化。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211464416.XA CN115809854A (zh) | 2022-11-22 | 2022-11-22 | 施工方案计算书的智能化审核方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211464416.XA CN115809854A (zh) | 2022-11-22 | 2022-11-22 | 施工方案计算书的智能化审核方法及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115809854A true CN115809854A (zh) | 2023-03-17 |
Family
ID=85483809
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211464416.XA Pending CN115809854A (zh) | 2022-11-22 | 2022-11-22 | 施工方案计算书的智能化审核方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115809854A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116703337A (zh) * | 2023-08-08 | 2023-09-05 | 金现代信息产业股份有限公司 | 一种基于人工智能技术的项目文档审查系统及方法 |
CN116934278A (zh) * | 2023-09-19 | 2023-10-24 | 中铁建设集团有限公司 | 一种建筑施工方案审核方法与装置 |
CN117494701A (zh) * | 2023-11-10 | 2024-02-02 | 杭州市余杭区数据资源管理局 | 基于改进的自然语言处理的数据审核方法 |
-
2022
- 2022-11-22 CN CN202211464416.XA patent/CN115809854A/zh active Pending
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116703337A (zh) * | 2023-08-08 | 2023-09-05 | 金现代信息产业股份有限公司 | 一种基于人工智能技术的项目文档审查系统及方法 |
CN116934278A (zh) * | 2023-09-19 | 2023-10-24 | 中铁建设集团有限公司 | 一种建筑施工方案审核方法与装置 |
CN117494701A (zh) * | 2023-11-10 | 2024-02-02 | 杭州市余杭区数据资源管理局 | 基于改进的自然语言处理的数据审核方法 |
CN117494701B (zh) * | 2023-11-10 | 2024-04-30 | 杭州市余杭区数据资源管理局 | 基于改进的自然语言处理的数据审核方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN115809854A (zh) | 施工方案计算书的智能化审核方法及系统 | |
Kashmira et al. | Generating entity relationship diagram from requirement specification based on nlp | |
CN114580424B (zh) | 一种用于法律文书的命名实体识别的标注方法和装置 | |
CN111143571B (zh) | 实体标注模型的训练方法、实体标注方法以及装置 | |
CN111259153A (zh) | 一种完全注意力机制的属性级情感分析方法 | |
CN111651994B (zh) | 一种信息抽取方法、装置、电子设备和存储介质 | |
CN114881043B (zh) | 基于深度学习模型的法律文书语义相似度评估方法及系统 | |
CN115983571A (zh) | 一种基于人工智能的建筑业施工方案审核方法及其系统 | |
CN114239579A (zh) | 基于正则表达式和crf模型的电力可研文档提取方法及装置 | |
CN113902569A (zh) | 数字资产中的绿色资产的占比的识别方法及相关产品 | |
CN111831624A (zh) | 数据表创建方法、装置、计算机设备及存储介质 | |
CN115482075A (zh) | 财务数据的异常分析方法、装置、电子设备及存储介质 | |
CN115033280A (zh) | 一种基于知识图谱的需求规格文档自动化生成方法及存储介质 | |
Yang et al. | A general solution and practice for automatically constructing domain knowledge graph | |
CN113868312A (zh) | 多方法融合的机构匹配方法、装置、设备和存储介质 | |
CN115481240A (zh) | 一种数据资产质量检测方法和检测装置 | |
Khan et al. | Analysis of Cursive Text Recognition Systems: A Systematic Literature Review | |
CN117332761B (zh) | 一种pdf文档智能识别标注系统 | |
CN114997168B (zh) | 一种基于神经化正则表达式的电网故障处置预案解析方法 | |
CN114169966B (zh) | 一种用张量提取货物订单元数据的方法及系统 | |
CN108959275A (zh) | 基于在线语言翻译的人机对练系统 | |
Wang et al. | Span-based Joint Entity and Relation Extraction with Light Attention Encoder | |
Abdulla et al. | KIKO: A Tools Framework for Industrial Domain-specific Natural Language Processing Tasks | |
CN114528400A (zh) | 基于多选匹配网络的统一低样本关系抽取方法及装置 | |
CN115587582A (zh) | 公证文书模板生成方法、装置、电子设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |