CN116579424B - 隧道施工地质灾害防控知识体系构建方法与系统 - Google Patents
隧道施工地质灾害防控知识体系构建方法与系统 Download PDFInfo
- Publication number
- CN116579424B CN116579424B CN202310843444.0A CN202310843444A CN116579424B CN 116579424 B CN116579424 B CN 116579424B CN 202310843444 A CN202310843444 A CN 202310843444A CN 116579424 B CN116579424 B CN 116579424B
- Authority
- CN
- China
- Prior art keywords
- knowledge
- control
- tunnel construction
- disaster prevention
- prevention
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000010276 construction Methods 0.000 title claims abstract description 109
- 230000002265 prevention Effects 0.000 title claims abstract description 98
- 238000000605 extraction Methods 0.000 claims abstract description 44
- 238000000034 method Methods 0.000 claims abstract description 39
- 238000002372 labelling Methods 0.000 claims abstract description 16
- 238000007499 fusion processing Methods 0.000 claims abstract description 13
- 239000000463 material Substances 0.000 claims abstract description 10
- 238000009960 carding Methods 0.000 claims abstract description 8
- 239000013598 vector Substances 0.000 claims description 32
- 230000015654 memory Effects 0.000 claims description 20
- 238000012549 training Methods 0.000 claims description 18
- 230000008569 process Effects 0.000 claims description 13
- 238000010606 normalization Methods 0.000 claims description 7
- 238000007781 pre-processing Methods 0.000 claims description 7
- 238000013528 artificial neural network Methods 0.000 claims description 6
- 238000004140 cleaning Methods 0.000 claims description 6
- 230000010485 coping Effects 0.000 claims description 3
- 230000006698 induction Effects 0.000 claims description 3
- 230000010354 integration Effects 0.000 claims description 3
- 238000012552 review Methods 0.000 claims description 3
- 230000001502 supplementing effect Effects 0.000 claims description 3
- 238000012795 verification Methods 0.000 claims description 3
- 238000012015 optical character recognition Methods 0.000 claims 4
- 239000000284 extract Substances 0.000 claims 1
- 238000004458 analytical method Methods 0.000 abstract description 7
- 238000012545 processing Methods 0.000 abstract description 7
- 230000002452 interceptive effect Effects 0.000 abstract description 2
- 238000003672 processing method Methods 0.000 abstract 1
- 239000011435 rock Substances 0.000 description 13
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 11
- 238000012544 monitoring process Methods 0.000 description 7
- 230000014509 gene expression Effects 0.000 description 5
- 230000006378 damage Effects 0.000 description 4
- 238000003860 storage Methods 0.000 description 4
- 238000009412 basement excavation Methods 0.000 description 3
- 238000013461 design Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 230000007246 mechanism Effects 0.000 description 3
- 230000003068 static effect Effects 0.000 description 3
- 208000027418 Wounds and injury Diseases 0.000 description 2
- 238000009933 burial Methods 0.000 description 2
- 238000012512 characterization method Methods 0.000 description 2
- 230000001808 coupling effect Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 239000007789 gas Substances 0.000 description 2
- 208000014674 injury Diseases 0.000 description 2
- 238000013507 mapping Methods 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 230000001360 synchronised effect Effects 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 238000009825 accumulation Methods 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000002457 bidirectional effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000005422 blasting Methods 0.000 description 1
- 238000013136 deep learning model Methods 0.000 description 1
- 238000003745 diagnosis Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000006073 displacement reaction Methods 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 230000008451 emotion Effects 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 239000003673 groundwater Substances 0.000 description 1
- 230000001939 inductive effect Effects 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 238000012805 post-processing Methods 0.000 description 1
- 238000003908 quality control method Methods 0.000 description 1
- 239000002689 soil Substances 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
- 238000012876 topography Methods 0.000 description 1
- 238000009423 ventilation Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/02—Knowledge representation; Symbolic representation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/26—Government or public services
- G06Q50/265—Personal security, identity or safety
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A10/00—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE at coastal zones; at river basins
- Y02A10/40—Controlling or monitoring, e.g. of flood or hurricane; Forecasting, e.g. risk assessment or mapping
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Tourism & Hospitality (AREA)
- Physics & Mathematics (AREA)
- Computer Security & Cryptography (AREA)
- Educational Administration (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Evolutionary Computation (AREA)
- Data Mining & Analysis (AREA)
- Computational Linguistics (AREA)
- Development Economics (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Health & Medical Sciences (AREA)
- Economics (AREA)
- General Health & Medical Sciences (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- General Business, Economics & Management (AREA)
- Alarm Systems (AREA)
Abstract
本发明涉及一种隧道施工地质灾害防控知识体系构建方法及系统,属于监督或预测目的的数据处理系统或方法,针对目前缺乏有效的隧道施工地质灾害防控知识体系对隧道施工地质灾害防控知识进行标准化管理的问题。本发明通过知识框架梳理、交互式标注、智能化抽取与知识融合加工的方式建立隧道施工地质灾害防控结构化知识库,有效管理了隧道概况、工程地质、水文地质、灾害类型、位置、规模、形态、性质、演化状态等特征与防控对策涉及的防控原则、措施、时机、材料、设备、工序及参数等知识单元及相互之间的内在联系,指导灾害防控智能分析与智能决策。
Description
技术领域
本发明涉及隧道施工地质灾害防控领域,属于监督或预测目的的数据处理系统或方法,尤其涉及一种隧道施工地质灾害防控知识体系构建方法与系统。
背景技术
隧道施工地质灾害的发生会引起机械设施破坏、作业人员伤亡,严重影响工程进度,造成建设成本的增加。为了降低施工地质灾害的影响,必须进行有效的灾害预测与防控。
在工程应用中,《铁路隧道设计规范》(TB 10003-2016)、《高速铁路隧道工程施工技术规程》(Q/CR 9406-2015)及《铁路隧道工程施工安全技术规程》(TB 10304-2020)对特殊岩土和不良地质隧道的施工措施进行了规范,为单一类型不良地质高风险区的施工提供指导;但是,在复杂地质条件下,隧道施工地质灾害受到多种灾害源的耦合作用,灾变演化机制极其复杂,灾害防控对策相关的原则、措施、时机、材料、装备、工序等知识单元与灾害发生的工程地质、水文地质条件以及灾害类型、位置、规模、形态、性质等特征密切相关,比如超长深埋隧道常建造于构造复杂、岩性多变的极复杂地质环境,施工面临高水压、高地温、高地应力等高能环境,致灾水体、断裂、岩溶、蚀变带、高地温、有害气体等不良地质问题突出,易发生突水涌泥、岩爆、大变形、塌方、高温热害、有害气体突出等灾害,威胁隧道施工安全。多灾害源耦合作用下,灾变演化机制极其复杂,灾变信息难以准确辨识,灾害防控决策盲目低效,难以满足对隧道施工地质灾害“及时、准确、主动、智能”防控的需求,易造成较大的施工事故,严重影响施工进度与工程质量。
因此目前缺乏有效的隧道施工地质灾害防控知识体系对这些业务知识进行标准化管理。
发明内容
本发明所要解决的技术问题是提供一种隧道施工地质灾害防控知识体系构建方法与系统,建立隧道施工地质灾害防控结构化知识库,有效管理隧道概况、工程地质、水文地质、灾害类型、位置、规模、形态、性质、演化状态等特征与防控对策涉及的防控原则、措施、时机、材料、设备、工序及参数等知识单元及相互之间的内在联系,指导灾害防控智能分析与智能决策。
为解决上述问题,本发明所采取的技术方案是:
隧道施工地质灾害防控知识体系构建方法,所述方法包括:
获取目标数据:所述目标数据为既往隧道工程实践中总结形成的相关案例或经验认识,用于提供工程实践中应对各种隧道施工地质灾害的防控对策;
知识框架梳理:对目标数据进行知识分类、归纳和整合,梳理为灾害防控总体知识框架,形成初步的知识体系;
知识标注:对目标数据知识标注,获取隧道施工地质灾害防控相关的知识要素,形成知识语料样本;
知识抽取:基于知识语料样本,训练知识抽取自然语言模型,实现批量化和自动化的隧道施工地质灾害防控知识抽取;所述自然语言模型的训练过程具体包括:采用ERNIE预训练模型针对隧道施工地质灾害防控任务需求进行调整,然后基于UIE模型,应用LSTM网络开展模型训练,从非结构化文本中提取实体和关系结构化信息,再基于准确率、召回率和F1值指标评估和优化模型,得到知识抽取自然语言模型;
知识融合加工:通过实体链接操作将多个不同表述的实体统一为一个标准的实体对象,通过知识合并的操作将多个知识实体合并,实现对隧道施工地质灾害防控相关知识实体的规范统一,形成规范化隧道施工地质灾害防控知识体系。
进一步的,还包括防控知识体系更新:获取新增的隧道施工地质灾害防控相关的数据样本,开展知识框架梳理、知识标注、知识抽取和知识融合加工,对隧道施工地质灾害防控知识体系进行优化和迭代。
进一步的,所述目标数据包括案例文章、案例汇编、工程报告、综述文章和标准规范,数据格式上表现为文本文件。
进一步的,所述获取目标数据和知识框架梳理步骤之间,还包括对目标数据预处理的步骤,具体包括OCR识别、清洗和规范化操作。
进一步的,所述数据预处理步骤中,OCR识别将图像或者PDF文件转化为可编辑的文本文件;清洗是针对收集的资料中存在的与灾害防控业务无关的信息,清洗去除;规范化操作是对资料中存在的多余空格、换行符和OCR识别的一些无效格式或信息,进行规范处理。
进一步的,所述知识框架梳理步骤,应用神经网络词向量模型与词频-逆文档频率模型提取文本特征,对目标数据进行知识分类、归纳和整合。
进一步的,所述知识标注步骤,依托文本标注工具,标注实体、关系和属性,并以规范化的格式输出。
进一步的,所述知识抽取步骤,辅以人工校验,不断修正完善知识抽取自然语言模型。
进一步的,所述知识抽取步骤还包括:知识抽取的结果用于补充与完善初步的知识体系。
进一步的,所述知识融合加工过程具体包括如下步骤:首先基于聚类算法将知识实体归类,然后基于SBERT模型将实体向量化表征,Faiss库计算实体向量与标准实体向量的语义相似度,根据语义相似度的大小表述为对应的标准实体。
一种隧道施工地质灾害防控知识体系构建系统,包括:
一个或多个存储器,用于存储指令;以及
一个或多个处理器,用于从所述存储器中调用并运行所述指令,执行如上所述的隧道施工地质灾害防控知识体系构建方法。
采用上述技术方案所产生的有益效果在于:
本发明提出一种隧道施工地质灾害防控知识体系构建方法,充分调研总结既有的专家知识与大量隧道施工地质灾害防控案例,通过知识框架梳理、交互式标注、智能化抽取与知识融合加工的方式,构建了灾害防控知识体系与术语词典,有效管理了隧道概况、工程地质、水文地质、灾害类型、位置、规模、形态、性质、演化状态等特征与防控对策涉及的防控原则、措施、时机、材料、设备、工序及参数等知识单元及相互之间的内在联系,指导灾害防控智能分析与智能决策。
附图说明
图1是隧道施工地质灾害防控知识体系构建技术路线图。
图2是知识框架梳理得到的初步的知识体系实例。
图3是知识标注实例。
图4是自然语言训练模型步骤图。
图5是知识抽取步骤中实体抽取实例。
图6是知识抽取步骤中关系抽取实例。
图7是知识融合加工实例。
图8是基于SBERT模型和Faiss库实现实体链接/关系对齐全过程的流程图。
图9是图8中应用过程的具体展示。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面结合具体实施例对发明进行清楚、完整的描述。
实施例
如图1所示,为隧道施工地质灾害防控知识体系构建技术路线图。具体而言,隧道施工地质灾害防控知识体系构建方法包括:
获取目标数据:即案例资料收集:收集既往隧道工程实践中总结形成的相关案例或经验认识,用于提供工程实践中应对各种隧道施工地质灾害的防控对策;这些资料数据能够提供工程实践中应对各种灾害的防控对策。所述资料包括案例文章、案例汇编、工程报告、综述文章和标准规范,数据格式上表现为文本文件。其中案例文章、案例汇编和工程报告主要提供对特定隧道工程具体灾害的防控措施;综述文章和标准规范是专家学者根据以往多个工程实践中防控隧道施工地质灾害所采取措施的知识提炼,更具通用指导意义;
数据预处理:对收集到的资料进行预处理,包括OCR识别、清洗和规范化操作;具体来讲,收集到的部分案例数据为图像或者扫描版本PDF文件,需要利用OCR识别技术将其转化为可编辑的文本文件;针对案例文本中存在的大量与灾害防控业务无关的信息,需要清洗去除;对文本中存在的多余空格、换行符、OCR识别的一些无效格式或信息,进行规范化处理。通过数据预处理,确保案例数据的质量和一致性,便于后续的知识抽取与利用;
知识框架梳理:应用神经网络词向量模型与词频-逆文档频率模型提取文本特征,对知识进行分类、归纳和整合,梳理为灾害防控总体知识框架,形成初步的知识体系;应用神经网络词向量模型和词频-逆文档频率(TF-IDF)模型提升了文本特征的表达能力,具体包括如下步骤:
1. 使用神经网络词向量模型获取词向量表示:使用Word2Vec、GloVe、或FastText预训练的词向量模型,将文本中的每个单词转换为对应的词向量,从而得到整个文本的词向量表示。
2. 计算词频-逆文档频率(TF-IDF)值:使用TF-IDF模型计算每个单词在文本集合中的重要性权重,对于给定的文本,计算每个词语的TF-IDF值。
3. 组合词向量表示与TF-IDF值:将步骤1中得到的词向量表示与步骤2中得到的TF-IDF值进行组合,比如将词向量与对应的TF-IDF值相乘,以加权词向量的形式表示文本中每个单词的特征。
4. 聚合特征表示:对于每个文本,通过将加权词向量进行求和或取平均来得到整个文本的特征表示,进而将文本转换为固定长度的向量表示,方便后续的机器学习或深度学习模型处理。
本发明中综合使用神经网络词向量模型和TF-IDF模型可以在捕捉单词语义信息的同时考虑到单词在文本集合中的重要性,这种综合特征提取方法可以提供更全面、更丰富的文本表示,从而在处理任务中带来更好的效果。
针对隧道施工地质灾害防控业务场景,本发明围绕隧道概况、工程地质、水文地质、施工条件、灾害信息、监测预警、灾害防控7个知识单元,对涉及的知识单元归纳整合,明确知识单元及知识要素之间的关系,实现灾害防控总体知识框架的梳理。
具体而言:
(1)隧道概况是灾害防控的依托对象,需要掌握隧道名称、所属线路、起止里程、参建单位等基本信息。另外,隧道的长度、埋深、跨度知识要素是选择隧道施工技术的重要依据,与发生隧道施工地质灾害的可能性密切相关,且会影响防控措施的选择。例如,隧道跨度越大,工作面开挖面积越大,施工难度越大,发生施工地质灾害的可能性也越大;隧道埋深越大,通常隧道围岩地应力越高、地温越高、水压力越大,发生施工地质灾害的可能性越大;隧道长度越长,施工的安全问题越复杂,为有效防控施工地质灾害的发生,需要有针对性地采取适当的工程措施。
(2)工程地质提供隧道建造的地质环境,包含地形地貌、地质构造、地层岩性、围岩性质等重要知识要素,其中地质构造包括褶皱、断层、破碎带、岩溶、层理等类型,影响隧道围岩的稳定性、地下水的赋存状态与流通性质;不同地层岩性具有不同的硬度,例如未风化的岩浆岩一般为极硬岩,强风化的各类岩石一般为软岩,岩石的硬度一定程度影响了围岩的级别,围岩级别是隧道设计与施工的关键指标之一,影响隧道的开挖方式、支护参数等。
(3)水文地质提供隧道建造的水文环境,在工程地质的基础上体现地下水赋水类型、赋水状态、空间分布、补给来源、水质等化学特征、出水状态、涌水量等特征,决定了突水突泥等灾害发生的可能性与状态。
(4)施工条件包含隧道施工过程所涉及的施工方法、开挖方法、爆破参数、支护方法、防排水措施、通风条件等,是影响施工质量的重要因素,与灾害的发生及防控密切相关。
(5)灾害信息涵盖灾害类型、位置、规模、形态、性质、演化阶段等,与工程、水文地质及施工条件密切相关,是灾害特征的直接描述,决定了灾害防控对策的选取。
(6)监测预警是对隧道施工环境及灾害演化的实时感知与诊断发布,通过监测围岩及结构的应力、变形、位移、温度等基本参数提供隧道状态动态信息,并未临灾预警提供实时数据;临灾预警通过分析监测数据的时变特征评价灾害发生的风险等级、演化状态与发生概率,指导灾害防控对策及时机的选择。
(7)灾害防控知识单元主要包括防控原则、措施、时机、材料、设备、效果等知识要素,尽可能全面地表述清楚对特定类型、规模、性质的灾害应该采取什么样的防控措施,用到哪些材料、设备,选择合适的施作时机,确保有效的防控效果,保障隧道施工安全;
对知识进行分类、归纳和整合,具体的,首先综合应用神经网络词向量模型与词频-逆文档频率模型提取文本特征,为了更好的进行质量把控,可以再由人工(专家)充分利用前人总结的专家知识,并通过大量的文献调研与分析总结,围绕隧道概况、工程地质、水文地质、灾害信息、灾害防控等知识单元以及知识单元之间的关系梳理,进一步提高质量;如图2,展示了知识框架梳理得到的初步的知识体系实例,其梳理了防控知识框架,对特定项目,涉及隧道概况、工程地质、水文地质、灾害信息、施工监测、临灾预警与灾害防控等知识单元,每一项知识单元又对一些重要的知识要素进行了展开,各知识单元相互之间存在关联关系,例如隧道概况为灾害防控提供隧道基本信息;工程地质与水文地质共同作用引起隧道施工灾害,并为灾害防控提供地质与水文环境;施工监测为灾害演化提供动态信息,为临灾预警提供监测数据;临灾预警的结论决定了灾害防控的处治时机。
知识标注:基于初步的知识体系,对收集的资料开展知识标注,获取隧道施工地质灾害防控相关的知识要素,形成知识语料样本;如图3,是知识标注实例,对案例文本开展知识标注,可获取更多具体的隧道施工地质灾害防控相关的知识要素,其依托文本标注工具,标注实体、关系和属性,并以规范化的格式输出;
知识抽取:基于知识语料样本,训练知识抽取自然语言模型,实现批量化和自动化的隧道施工地质灾害防控知识抽取,同时知识抽取的结果用于补充与完善初步的知识体系;考虑到语料样本可能不完备,知识抽取模型精度可能不够高,在前期智能化抽取的过程中,辅以人工校验,不断修正完善知识抽取自然语言模型;
所述自然语言模型的训练过程如图4,具体包括:基于知识语料样本,对文本中的实体、关系等信息进行标注,例如将工程地质、水文地质、灾害防控等实体和实体之间的关系进行标注;其中采用BIO标注法进行处理,即对每个实体使用“B”(beginning)表示该实体的起始位置,“I”(inner)表示该实体的内部部分,“O”(outside)表示非实体的部分 ;然后随机分割训练、验证和测试样本,然后首先采用ERNIE3.0预训练模型针对隧道施工地质灾害防控任务需求进行调整,然后基于UIE模型(Universal Information Extraction),应用LSTM网络开展模型训练,从非结构化文本中提取实体和关系结构化信息,基于准确率、召回率和F1值指标评估和优化模型,得到知识抽取自然语言模型;其中在随机分割训练、验证、测试样本前,为了提高语料样本质量,可以开展数据清洗、去重预处理;
UIE模型框架使用Promt方式实现实体抽取、关系抽取、事件抽取、情感分析等任务的统一建模,结合ERNIE 3.0知识增强预训练模型,在中文语料上可以获得最佳性能表现。根据抽取的内容类型,本发明知识抽取模型分为实体识别和关系抽取。如图5-6,是知识抽取实例,其中图5为实体抽取,图6为关系抽取;模型结构输入Prompt提示语和Content文本内容,经过Encoder语义编码层,最后预测文本内容每个字符的标签,其中B-C,I-C标识路段这个实体抽取的结果为“大理瑞丽铁路大保段”。模型输入Promt和Content,经过语义编码层,输出层输出提示关系的头实体和尾实体的字符位置标识(ST-ET,EN-ET)及关系标识(SH-OHHS)。通过后处理,就可以将头实体和尾实体提出出来,达到关系抽取的目的。
知识融合加工:如图7,为知识融合加工实例,不可避免地,来源于不同案例的同一个实体有多种表述,例如“突水突泥”也表述为“突水涌泥”、“涌水涌泥”、“涌水突泥”等,需要通过实体链接操作将多个不同表述的实体统一为一个标准的实体对象。另外,同一类灾害表现为不同的形式,例如“高温热害”表现为“高岩热”或“高水温”,二者各自有不同的成因、特征等,通常需要通过知识合并的操作将多个知识实体合并,构建统一的灾害防控知识库;经过知识融合加工,实现了对隧道施工地质灾害防控相关知识实体的规范统一,总结形成规范化的专业术语词典;所述知识融合加工过程具体包括如下步骤:首先基于聚类算法将知识实体归类,然后基于SBERT模型将实体向量化表征,Faiss库计算实体向量与标准实体向量的语义相似度,根据语义相似度的大小表述为对应的标准实体;具体的聚类算法可以是K-Means或DBSCAN;如图8,是基于SBERT模型和Faiss库实现实体链接/关系对齐全过程的流程图,实体链接的离线部分采用计算文本对相似度的双塔模型SBERT,模型输入为文本对,输出为文本对的语义相似度,相似度得分0-1之间,再利用Faiss将向量和向量检索库作相似度计算,得到与其相似的标准实体索引,取最相似的标准实体作为实体链接的结果;如图9,是图8中应用过程的具体展示。
SBERT(Sentence-BERT)是一种基于BERT(Bidirectional EncoderRepresentations from Transformers)的模型,用于计算句子级别的语义表示。
本发明SBERT模型主要包括以下几个步骤:
1. 输入处理:将一对句子作为输入,使用预训练的BERT模型对每个句子进行编码。
2. 编码融合:通过对两个句子的编码进行融合,生成一个综合的句子表示。
3. 对齐汇聚:为了确保两个句子在语义空间中有一致的表示,采用自注意力机制(self-attention)来对齐两个句子中的关键信息,并将其融合到最终的汇聚表示中。
4. 映射和归一化:对生成的句子级别表示进行映射和归一化操作,得到固定长度的语义向量表示。
Faiss(Facebook AI Similarity Search)是一个开源的相似性搜索库,专门用于高效地进行向量检索,基于C++实现。
图8中,离线指的是模型训练的阶段,线上指的是模型应用的阶段,虚线方框内的SBERT模型会用到模型训练和应用两个阶段。具体过程为(1)本业务领域涉及的所有“实体/关系句子对”应用SBERT模型开展“向量表征推理”,存储到“Faiss向量检索库”;(2)然后从右到左实现对特定“实体/关系”应用SBERT模型进行“向量表征”,然后基于“Faiss向量检索库”进行向量检索,同时计算语义相似度,衡量输入的实体/关系与库内标准实体/关系之间的语义相似度。
通过上述步骤,形成防控知识体系,实现对灾害防控对策相关原则、措施、时机、材料、装备、工序等知识单元及灾害地质背景、类型、位置、规模、形态、性质等基本特征相关的知识实体的梳理与规范,并建立防控对策与灾害特征之间的内在联系,完成规范化隧道施工地质灾害防控知识体系的构建,形成结构化的灾害防控知识库,同时形成了规范化的专业术语词典(如下表1,术语词典示例,其中只列出了隧道特征相关的一部分术语)。
表1术语词典示例
本发明充分考虑了隧道施工地质灾害发生所处的地质环境、灾变成因、表现形式以及对主动防控对策选择的影响,充分利用前人总结的专家知识,并通过对大量案例数据的调研分析,围绕隧道概况、工程地质、水文地质、灾害信息、灾害防控等知识单元建立了隧道施工地质灾害防控知识体系,规范了各知识单元所涉及的知识要素、层级结构及术语表述,总结形成了规范化的专业术语词典,实现了对隧道施工地质灾害防控知识体系的结构化表示,有效管理了隧道概况、工程地质、水文地质、灾害类型、位置、规模、形态、性质、演化状态等特征与防控对策涉及的防控原则、措施、时机、材料、设备、工序及参数等知识单元及相互之间的内在联系,指导灾害防控智能分析与智能决策。
本发明提出的隧道施工地质灾害防控知识体系构建方法,在应用的过程中随着越来越多的案例数据不断累积,可以对知识体系不断补充完善。
本发明还提供一种隧道施工地质灾害防控知识体系构建系统,该系统包括:
一个或多个存储器,用于存储指令;以及
一个或多个处理器,用于从所述存储器中调用并运行所述指令,执行如上所述的隧道施工地质灾害防控知识体系构建方法。
本发明还提供一种计算机可读存储介质,包括:程序,当所述程序被处理器运行时,如上所述的隧道施工地质灾害防控知识体系构建方法被执行。
本发明还提供了一种芯片系统,该芯片系统包括处理器,用于实现上述内容中所涉及的功能,例如,生成,接收,发送,或处理上述方法中所涉及的数据和/或信息。
该芯片系统,可以由芯片构成,也可以包括芯片和其他分立器件。
上述任一处提到的处理器,可以是一个CPU,微处理器,ASIC,或一个或多个用于控制上述的反馈信息传输的方法的程序执行的集成电路。
在一种可能的设计中,该芯片系统还包括存储器,该存储器,用于保存必要的程序指令和数据。该处理器和该存储器可以解耦,分别设置在不同的设备上,通过有线或者无线的方式连接,以支持该芯片系统实现上述实施例中的各种功能。或者,该处理器和该存储器也可以耦合在同一个设备上。
可选地,该计算机指令被存储在存储器中。
可选地,该存储器为该芯片内的存储单元,如寄存器、缓存等,该存储器还可以是该终端内的位于该芯片外部的存储单元,如ROM或可存储静态信息和指令的其他类型的静态存储设备,RAM等。
可以理解,本发明中的存储器可以是易失性存储器或非易失性存储器,或可包括易失性和非易失性存储器两者。
非易失性存储器可以是ROM、可编程只读存储器(programmable ROM,PROM)、可擦除可编程只读存储器(erasablePROM,EPROM)、电可擦除可编程只读存储器(electricallyEPROM,EEPROM)或闪存。
易失性存储器可以是RAM,其用作外部高速缓存。RAM有多种不同的类型,例如静态随机存取存储器(static RAM,SRAM)、动态随机存取存储器(dynamic RAM,DRAM)、同步动态随机存取存储器(synchronous DRAM,SDRAM)、双倍数据速率同步动态随机存取存储器(doubledata rate SDRAM,DDR SDRAM)、增强型同步动态随机存取存储器(enhancedSDRAM,ESDRAM)、同步连接动态随机存取存储器(synch link DRAM,SLDRAM)和直接内存总线随机存取存储器。
Claims (9)
1.隧道施工地质灾害防控知识体系构建方法,其特征在于,所述方法包括:
获取目标数据:所述目标数据为既往隧道工程实践中总结形成的相关案例或经验认识,用于提供工程实践中应对各种隧道施工地质灾害的防控对策;
知识框架梳理:对目标数据进行知识分类、归纳和整合,梳理为灾害防控总体知识框架,形成初步的知识体系;
知识标注:对目标数据知识标注,获取隧道施工地质灾害防控相关的知识要素,形成知识语料样本;
知识抽取:基于知识语料样本,训练知识抽取自然语言模型,实现批量化和自动化的隧道施工地质灾害防控知识抽取;所述自然语言模型的训练过程具体包括:采用ERNIE预训练模型针对隧道施工地质灾害防控任务需求进行调整,然后基于UIE模型,应用LSTM网络开展模型训练,从非结构化文本中提取实体和关系结构化信息,再基于准确率、召回率和F1值指标评估和优化模型,得到知识抽取自然语言模型;
知识融合加工:通过实体链接操作将多个不同表述的实体统一为一个标准的实体对象,通过知识合并的操作将多个知识实体合并,实现对隧道施工地质灾害防控相关知识实体的规范统一,形成规范化隧道施工地质灾害防控知识体系;
所述知识融合加工过程具体包括如下步骤:首先基于聚类算法将知识实体归类,然后基于SBERT模型将实体向量化表征,Faiss库计算实体向量与标准实体向量的语义相似度,根据语义相似度的大小表述为对应的标准实体。
2.根据权利要求1所述的隧道施工地质灾害防控知识体系构建方法,其特征在于,还包括防控知识体系更新:获取新增的隧道施工地质灾害防控相关的数据样本,开展知识框架梳理、知识标注、知识抽取和知识融合加工,对隧道施工地质灾害防控知识体系进行优化和迭代。
3.根据权利要求1所述的隧道施工地质灾害防控知识体系构建方法,其特征在于,所述目标数据包括案例文章、案例汇编、工程报告、综述文章和标准规范,数据格式上表现为文本文件。
4.根据权利要求1所述的隧道施工地质灾害防控知识体系构建方法,其特征在于,所述获取目标数据和知识框架梳理步骤之间,还包括对目标数据预处理的步骤,具体包括OCR识别、清洗和规范化操作。
5.根据权利要求4所述的隧道施工地质灾害防控知识体系构建方法,其特征在于,所述数据预处理步骤中,OCR识别将图像或者PDF文件转化为可编辑的文本文件;清洗是针对收集的资料中存在的与灾害防控业务无关的信息,清洗去除;规范化操作是对资料中存在的多余空格、换行符和OCR识别的一些无效格式或信息,进行规范处理。
6.根据权利要求1所述的隧道施工地质灾害防控知识体系构建方法,其特征在于,所述知识框架梳理步骤,应用神经网络词向量模型与词频-逆文档频率模型提取文本特征,对目标数据进行知识分类、归纳和整合。
7.根据权利要求1所述的隧道施工地质灾害防控知识体系构建方法,其特征在于,所述知识抽取步骤,辅以人工校验,不断修正完善知识抽取自然语言模型。
8.根据权利要求1所述的隧道施工地质灾害防控知识体系构建方法,其特征在于,所述知识抽取步骤还包括:知识抽取的结果用于补充与完善初步的知识体系。
9.一种隧道施工地质灾害防控知识体系构建系统,其特征在于,包括:
一个或多个存储器,用于存储指令;以及
一个或多个处理器,用于从所述存储器中调用并运行所述指令,执行如权利要求1至8中任意一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310843444.0A CN116579424B (zh) | 2023-07-11 | 2023-07-11 | 隧道施工地质灾害防控知识体系构建方法与系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310843444.0A CN116579424B (zh) | 2023-07-11 | 2023-07-11 | 隧道施工地质灾害防控知识体系构建方法与系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116579424A CN116579424A (zh) | 2023-08-11 |
CN116579424B true CN116579424B (zh) | 2023-11-03 |
Family
ID=87534386
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310843444.0A Active CN116579424B (zh) | 2023-07-11 | 2023-07-11 | 隧道施工地质灾害防控知识体系构建方法与系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116579424B (zh) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101729985B1 (ko) * | 2017-03-02 | 2017-04-25 | 주식회사 대영 | 영상정보를 이용해 다수의 터널통합방재장치를 통합 관리하는 터널 통합 방재 방송 시스템 |
KR102396771B1 (ko) * | 2021-12-15 | 2022-05-16 | 대한민국 | 재난원인 정보 자동 추출 방법 |
CN114692874A (zh) * | 2022-03-29 | 2022-07-01 | 中国地质大学(武汉) | 一种面向地质灾害领域的知识图谱自动化构建方法及系统 |
-
2023
- 2023-07-11 CN CN202310843444.0A patent/CN116579424B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101729985B1 (ko) * | 2017-03-02 | 2017-04-25 | 주식회사 대영 | 영상정보를 이용해 다수의 터널통합방재장치를 통합 관리하는 터널 통합 방재 방송 시스템 |
KR102396771B1 (ko) * | 2021-12-15 | 2022-05-16 | 대한민국 | 재난원인 정보 자동 추출 방법 |
CN114692874A (zh) * | 2022-03-29 | 2022-07-01 | 中国地质大学(武汉) | 一种面向地质灾害领域的知识图谱自动化构建方法及系统 |
Non-Patent Citations (1)
Title |
---|
面向一体化综合减灾的知识图谱构建方法;陶坤旺;赵阳阳;朱鹏;朱月月;刘帅;赵习枝;;武汉大学学报(信息科学版)(第08期);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN116579424A (zh) | 2023-08-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110765265B (zh) | 信息分类抽取方法、装置、计算机设备和存储介质 | |
US11580415B2 (en) | Hierarchical multi-task term embedding learning for synonym prediction | |
CN110825721A (zh) | 大数据环境下高血压知识库构建与系统集成方法 | |
Liu et al. | Using text mining to establish knowledge graph from accident/incident reports in risk assessment | |
US20220004545A1 (en) | Method of searching patent documents | |
CN113868432B (zh) | 一种用于钢铁制造企业的知识图谱自动构建方法和系统 | |
CN113196277A (zh) | 用于检索自然语言文档的系统 | |
CN113011161A (zh) | 一种基于深度学习与模式匹配的人案物关联关系抽取方法 | |
CN117252255B (zh) | 一种面向辅助决策的灾害应急知识图谱构建方法 | |
CN107103363A (zh) | 一种基于lda的软件故障专家系统的构建方法 | |
Li et al. | A method for resume information extraction using bert-bilstm-crf | |
Yang et al. | Group decision making with incomplete interval‐valued q‐rung orthopair fuzzy preference relations | |
CN116579631A (zh) | 一种隧道施工地质灾害防控智能分析方法及系统 | |
CN113988048A (zh) | 基于多轮机器阅读理解的情感原因对抽取方法 | |
CN117077631A (zh) | 一种基于知识图谱的工程应急预案生成方法 | |
Zhang et al. | A new approach of integrating industry prior knowledge for HAZOP interaction | |
CN116579424B (zh) | 隧道施工地质灾害防控知识体系构建方法与系统 | |
Pogorilyy et al. | Assessment of Text Coherence by Constructing the Graph of Semantic, Lexical, and Grammatical Consistancy of Phrases of Sentences | |
Huang et al. | A novel geometry problem understanding method based on uniform vectorized syntax-semantics model | |
CN116069951A (zh) | 一种施工工人安全知识抽取和知识图谱构建方法 | |
Chen et al. | Converting natural language policy article into MBSE model | |
Xu et al. | Entity recognition in the field of coal mine construction safety based on a pre-training language model | |
CN114298339A (zh) | 一种变电站设备告警智能决策方法及系统 | |
Dhashanamoorthi | Resolving insurance claims with Artificial Intelligence powered decision making | |
CN117891958B (zh) | 一种基于知识图谱的标准数据处理方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |