CN116450833A - 一种复杂装备知识图谱构建系统 - Google Patents

一种复杂装备知识图谱构建系统 Download PDF

Info

Publication number
CN116450833A
CN116450833A CN202211738314.2A CN202211738314A CN116450833A CN 116450833 A CN116450833 A CN 116450833A CN 202211738314 A CN202211738314 A CN 202211738314A CN 116450833 A CN116450833 A CN 116450833A
Authority
CN
China
Prior art keywords
knowledge
module
model
user
layer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211738314.2A
Other languages
English (en)
Inventor
王淑营
李雪
丁国富
郑庆
李忠阳
张海柱
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Southwest Jiaotong University
Original Assignee
Southwest Jiaotong University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Southwest Jiaotong University filed Critical Southwest Jiaotong University
Priority to CN202211738314.2A priority Critical patent/CN116450833A/zh
Publication of CN116450833A publication Critical patent/CN116450833A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/31Indexing; Data structures therefor; Storage structures
    • G06F16/316Indexing structures
    • G06F16/322Trees
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/30Computing systems specially adapted for manufacturing

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Animal Behavior & Ethology (AREA)
  • Computational Linguistics (AREA)
  • Software Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了复杂装备知识图谱构建系统,包括接入层,用于系统在接入上考虑基于Web的访问,并预留嵌入式调用代理接口,支持设计、制造、运维各孪生系统对知识的调用;应用交互层,用于系统的维护和应用服务;分析计算层,用于自然语言处理、问题处理以及答案检索;数据持久层,用于对知识进行抽取、图谱化和存储;AI接口层,用于提供AI扩展服务;工具层,用于调用提供上述所有层级中实现功能和服务所需的工具。并且分别在应用交互层、分析计算层和AI接口层配置了相应的子系统,对整个系统提供的强大的模型调用,数据分析和处理功能,针对知识表示,问题的识别等功能实现上也更加的智能化。

Description

一种复杂装备知识图谱构建系统
技术领域
本发明属于技术知识图谱领域,尤其涉及一种复杂装备识图谱构建系统。
背景技术
电力、工程机械、轨道交通等领域的产品是在长生命周期、复杂工况下安全可靠服役的典型复杂装备,其研发过程是一项复杂的系统工程。在其研发周期的各个阶段都会产生模型、业务和感知等各类数据,随着制造过程和运维过程各类感知数据的不断采集分析,数据呈现爆炸性的增长。装备数字孪生是是数据驱动的,多源数据的融合是首要解决的问题,但纯数据驱动的分析方法会忽略了经验知识,如何形成复杂装备的“大脑”,将这些多源数据进行融合,挖崛它们的潜在关系,对构建复杂装备数字孪生而言至关重要。
作为新一代人工智能技术的重要分支,知识图谱被称作“有学识的AI”,常常被用于融合多源数据来构建大规模知识库。知识图谱是一种语义网络,表达了实体之间的语义关系,适合于描述复杂装备多层系统、子系统、部件、零件的复杂空间结构化,通过多源异构时间序列感知数据的接入分析挖掘可以得到更全面时空关联知识。
但复杂装备系统结构化具有多层级的特点,同时复杂产品全生命周期各阶段的数据来源不一,结构化形式不同,具有多源异构的特点。复杂产品的在全生命周期各阶段的知识数据包含文档、图片、表格、模型、文件等,不仅有结构化数据、还有半结构化和非结构化数据。这些数据不仅来源于全生命周期各阶段,还来源于复杂装备系统结构化的系统、子系统、部件、零件各个层级。给知识抽取带来非常大的困难,使得在知识抽取过程中,数据处理量大,而且容易遗漏,
发明内容
有鉴于此,本发明提供一种智能化功能较为全面,图谱构建效率更高的复杂装备知识图谱构建系统,包括:
接入层,用于系统在接入上考虑基于Web的访问,并预留嵌入式调用代理接口,支持设计、制造、运维各孪生系统对知识的调用;
应用交互层,用于系统的维护和应用服务;
分析计算层,用于自然语言处理、问题处理以及答案检索;
数据持久层,用于对知识进行抽取、图谱化和存储;
AI接口层,用于提供AI扩展服务;
工具层,用于调用提供上述所有层级中实现功能和服务所需的工具。
优选的,包括:知识图谱服务子系统,被配置在所述应用交互层,负责与用户交互,提供知识服务,
所述知识图谱服务子系统包括:
基于产品结构树的知识交互模块,用于按复杂装备族的方式提供关于该类产品的静态知识;
基于产品实例结构树的知识交互模块,用于接入复杂装备的感知数据;
语义搜索模块,用于对用户的自然问题进行语义解析,抽取其中的关键词并利用查询语句检索出相关的一系列知识,最后通过语义相似度及结果排序算法返回得分最高的几个答案返回给用户;
智能问答与知识推荐模块,用于对用户的自然语言问题进行解析,了解用户问题背后的意图并定位到图谱中精确知识,将用户的问句转换为标准的查询语句对该知识进行查询,并将检索出来的结构化知识组装为用户友好的语句返回。
优选的,,所述基于产品结构树的知识交互模块包括:
产品逻辑结构树管理子模块,提供对产品逻辑结构树的管理服务,逻辑结构树按产品型号进行逻辑管理,在结构树节点对应产品BOM树的系统-部件-构件组织;
逻辑结构树节点模型及信息维护子模块,提供针对逻辑结构树中的系统-部件-构件各个节点基本信息、模型维护接口;
实例结构图谱展示及交互子模块,按图数据库展示方式,根据实例BOM关系展示图边连接关系,可调整图谱显示的比例,点节点图标,浮出该系统-部件-构件节点的知识界面;
结构树节点知识查看子模块,在浮出该节点的知识界面,包括节点系统知识卡品信息、模型、需求知识、设计知识、制造知识、维护知识等映射在节点上的知识。
优选的,所述基于产品实例结构树的知识交互模块包括:
产品结构树管理子模块。提供对产品实例结构树的管理服务,在结构树节点对应产品实例的BOM树的系统-部件-构件组织;
实例树节点信息及模型维护子模块。提供针对结构树中的系统-部件-构件各个节点基本信息、设计人、制造工艺过程、维修历史等信息维护;
结构图谱展示及交互子模块。按图数据库展示方式,展示图边连接关系,可调整图谱显示的比例,点节点图标,浮出该系统-部件-构件节点的知识界面;
结构树实例节点知识查看子模块。在浮出该节点的知识界面,包括节点系统知识卡品信息、模型、设计人、制造工艺信息、服役时间、故障及换件信息,以及挂接在在节点的各类需求、寿命预测、健康诊断智能服务。
优选的,所述语义搜索服务模块包括:
用户输入语义解析子模块,通过对用户的问句进行关键词抽取和句法分析,提取用户的语义,并将关键词及关键词间的句法关系作为检索的依据;
字典管理子模块,根据标记的命名实体以及识别的命名实体,构建名词词库,并开放同义词接口,允许用户构建同义词;
查询构建及图谱检索子模块,利用问句中的关键词查询字典进行关键词标准化转换,利用关键词间的句法关系构建查询语句,以此对知识图谱进行模糊检索;
搜索答案排序子模块,通过对检索出来的一系列结果结合使用与原问句的语义相似度匹配和结果排序算法实现对答案的排序功能。
优选的,所述智能问答与知识推荐服务模块包括:
用户问题语义解析子模块,包括对用户的问题进行实体抽取、意图识别和句法分析,用户提问后,利用深度学习模型抽取出问句中的实体并利用分类算法对用户的问题进行分类,最后利用句法分析理解实体间的关系,通过这3个信息定位到知识图谱中的具体知识,实现各种不同的如运维、设计制造方面的问题解析功能;
查询意图识别转换子模块,根据意图类别确立查询模板,通过实体与查询语句的结合实现知识图谱的检索功能;
谓词词库管理子模块,根据标记的命名实体以及识别的命名实体,构建名词词库,并开放同义词接口,允许用户构建同义词;根据本体模式定义的联系,构建谓词词库,在用户问题查询时,先对用户意图识别结果按词库进行标准化;
问题模板管理子模块,在对问句进行处理时,需要对抽取的实体进行消歧以及纠错,为此需要建立复杂装备领域的实体词典库及同义词词典库,问句解析完成后还需要建立类别所对应的查询模板,因此,提供词典库及模板库的管理、维护服务;
答案组装反馈子模块,将知识检索出来后,可依据问题类别建立答案模板,将知识与模板结合起来形成答案,实现答案的组装功能。
优选的,还包括知识推理服务子系统,被配置在分析计算层,用于接受各类嵌入式应用请求,对请求进行解析和路由,形成结果返回;
所述知识推理服务子系统包括:
推理请求与路由模块,用于接收来自各系统的嵌入式请求,对请求进行解析和路由;
结果反馈与知识更新模块;
AI运行管控模块,用于对AI模型调用日志进行分析和AI模型运行资源进行调度。
优选的,所述推理请求清洗与路由模块包括:
推理请求队列管理子模块,通过接口接收各系统的嵌入式知识服务请求,以消息队列的方式管理请求和对请求进行处理;
推理请求解析子模块,对请求知识的类型进行解析,先按语义关键字或问题请求知识图谱,返回知识图谱的结果,若不为空,则直接调用推理结果反馈功能返回结果。
AI模型调用推理子模块,若上述知识图谱反馈结果为空,则调用对应的AI模型,通过AI模型进行推理,或者结果。
优选的,还包括AI模型及接口管理子系统,被配置在所述AI接口层,用于对产品全生命周期的各种AI模型提供接口,实现知识图谱与AI模型的动态融合;
包括,AI模型知识融合模块,用于AI模型的本体构建和本体融合;
AI模型发布管理模块,用于AI模型发布及运行容器部署。
优选的,所述AI模型知识融合模块包括:
AI模型本体构建子模块,当进行AI模型的注册时,调用本体建模工具Protégé进行AI模型的本体构建,保存后生成OWL文件在平台上解析;
AI模型本体融合子模块,基于构建的AI模型本体以及产品实例结构树,通过本体映射算和本体对齐算法进行AI模型本体融合。
本发明提供的复杂装备知识图谱构建系统,包括接入层,用于系统在接入上考虑基于Web的访问,并预留嵌入式调用代理接口,支持设计、制造、运维各孪生系统对知识的调用;应用交互层,用于系统的维护和应用服务;分析计算层,用于自然语言处理、问题处理以及答案检索;数据持久层,用于对知识进行抽取、图谱化和存储;AI接口层,用于提供AI扩展服务;工具层,用于调用提供上述所有层级中实现功能和服务所需的工具。并且分别在应用交互层、分析计算层和AI接口层配置了相应的子系统,对整个系统提供的强大的模型调用,数据分析和处理功能,针对知识表示,问题的识别等功能实现上也更加的智能化。
附图说明
图1为本发明实施例提供的复杂装备知识图谱构建系统架构图;
图2为本发明实施例提供的知识图谱服务子系统结构图;
图3为本发明实施例提供的知识推理服务子系统结构图;
图4为本发明实施例提供的AI模型及接口管理子系统结构图。
具体实施方式
为了使本领域的技术人员更好地理解本发明的技术方案,下面结合具体实施方式对本发明作进一步的详细说明。
本发明以高速列车转向架知识图谱的构建为实例。高速列车转向架是高速列车的走行装置,是负责完成整个车辆走行任务的部件;其作用相当于汽车的地盘和车轮,具有导向、承载、减振、牵引、制动等作用,对于车辆的正常运行有着至关重要的作用。高速列车转向架的结构组成有构架、轮对轴箱、一系悬挂装置、二系悬挂装置、驱动装置和基础制动装置。
本发明提供的复杂装备知识图谱构建系统总体上采用分层式体系结构,分为接入层、应用交互层、分析计算层、数据持久层、AI接口层和工具层6层,如图1所示,其中:
接入层:知识服务子平台在接入上考虑基于Web的访问,并预留嵌入式调用代理接口,支持设计、制造、运维各孪生系统对知识的调用(目前设计开发暂以Web访问为主,后续调研清楚后再设计嵌入式访问代理)。
应用交互层:为用户提供知识服务子平台的维护和应用服务,包括基于产品。逻辑结构树的知识交互、产品实例结构树的知识交互、语义搜索、智能问答、智能推荐、字典维护等。
分析计算层:包括自然语言处理、问题处理以及答案检索等分析计算服务,其中自然语言处理需要进行中文分词、词性标注、实体识别、句法分析、语义消歧等,问题处理包括问题判定、意图识别、语义分析、问题分类、关键词抽取等,答案检索包括相似度计算、结果排序服务。
数据持久层:对知识进行抽取、图谱化和存储服务,其中知识获取包括结构化抽取、半结构化抽取、数据清洗、无结构化抽取,图谱化包括知识表示、三元组化、实体融合、关联融合等,知识存储采用Ne04j和FastDFS分别存储知识和文档模型等数据。
AI接口层:AI接口层是面向各组提供的AI扩展服务,包括AI模型OWL本体接口及AI模型接口两个部分,通过接口层实现本体融合,并建立与AI模型的访问服务。
工具层:包括数据标记工具、知识存储工具、本体构建工具、论文、专利等知识爬取工具等。
为了进一步提高用户交互和服务管理,本发明还提供了知识图谱服务子系统,配置在应用交互层,知识图谱服务子系统是服务服务平台的入口,其负责与用户交互,提供知识服务,由于复杂装备全生命周期数据的多样性和复杂性,参照本项目技术路线的4维模型,将周期维、感知维(时序数据)向结构维和模型维映射,模型维主要用于感知数据的交互,从知识的角度来说,更加关注知识向产品结构维的映射。根据复杂装备知识服务的需求,知识图谱服务子系统结构如图2所示。
基于产品逻辑结构树的知识交互、基于产品实例结构树的知识交互、语义搜索、智能问答与知识推荐4个模块。其中基于产品逻辑结构树的知识交互、基于产品实例结构树的知识交互两个模块的差异在于:逻辑结构树按复杂装备族的方式提供关于该类产品的静态知识,如需求知识、设计标准及规则、工艺知识、故障分类、故障检测等;而基于产品实例结构树的知识交互支持接入该装备的感知数据,可提供实时数据驱动的制造质量预警、运维健康检测、故障报警、寿命预测等服务。
具体的,所述基于产品结构树的知识交互模块,产品逻辑结构树是按照复杂装备基于产品族的设计管理模式组织静态知识数据,为用户提供服务,包括:
产品逻辑结构树管理子模块:提供对产品逻辑结构树的管理服务,逻辑结构树按产品型号进行逻辑管理,在结构树节点对应产品BOM树的系统-部件-构件组织。
逻辑结构树节点模型及信息维护子模块:提供针对逻辑结构树中的系统-部件-构件各个节点基本信息、模型(图片)等维护接口。
实例结构图谱展示及交互子模块:按图数据库展示方式,根据实例BOM关系展示图边连接关系,可调整图谱显示的比例,点节点图标,浮出该系统-部件-构件节点的知识界面。
结构树节点知识查看子模块:在浮出该节点的知识界面,包括节点系统(部件或构件)知识卡品信息、模型、需求知识、设计知识、制造知识、维护知识等映射在节点上的知识。
具体的,基于产品实例结构树的知识交互模块
产品实例结构树是针对具体装备产品的知识组织交互模式,通过实例结构树为用户提供与该实例有关的知识和数据服务,与逻辑结构树的最大不同在于,实例结构树节点可按需求接入制造与运维过程感知数据,通过感知数据调用知识图谱推理,从而实现实时健康诊断及故障预测。
产品结构树管理子模块:提供对产品实例结构树的管理服务,在结构树节点对应产品实例的BOM树的系统-部件-构件组织。
实例树节点信息及模型维护子模块:提供针对结构树中的系统-部件-构件各个节点基本信息、设计人、制造工艺过程、维修历史等信息维护。
结构图谱展示及交互子模块:按图数据库展示方式,展示图边连接关系,可调整图谱显示的比例,点节点图标,浮出该系统-部件-构件节点的知识界面。
结构树实例节点知识查看子模块:在浮出该节点的知识界面,包括节点系统(部件或构件)知识卡品信息、模型、设计人、制造工艺信息、服役时间、故障及换件信息,以及挂接在在节点的各类需求、寿命预测、健康诊断等智能服务。
具体的,语义搜索服务模块主要通过对用户的自然问题进行语义解析,抽取其中的关键词并利用查询语句检索出相关的一系列知识,最后通过语义相似度及结果排序算法返回得分最高的几个答案返回给用户。语义搜索主要包括:
用户输入语义解析子模块:通过对用户的问句进行关键词抽取和句法分析,提取用户的语义,并将关键词及关键词间的句法关系作为检索的依据。
字典管理子模块:根据标记的命名实体以及识别的命名实体,构建名词词库,并开放同义词接口,允许用户构建同义词。
查询构建及图谱检索子模块:利用问句中的关键词查询字典进行关键词标准化转换,利用关键词间的句法关系构建查询语句,以此对知识图谱进行模糊检索。
搜索答案排序子模块:通过对检索出来的一系列结果结合使用与原问句的语义相似度匹配和结果排序算法(如ranknet算法)实现对答案的排序功能。
具体的,智能问答与知识推荐服务模块主要通过对用户的自然语言问题进行解析,了解用户问题背后的意图并定位到图谱中精确知识,将用户的问句转换为标准的查询语句对该知识进行查询,并将检索出来的结构化知识组装为用户友好的语句返回,以此实现对用户的各类知识问答功能。智能问答主要包含了以下几个方面:
用户问题语义解析子模块:包括对用户的问题进行实体抽取、意图识别和句法分析,用户提问后,利用深度学习模型(如BERT模型)抽取出问句中的实体并利用分类算法(如SVM分类器)对用户的问题进行分类,最后利用句法分析理解实体间的关系,通过这3个信息定位到知识图谱中的具体知识,实现各种不同的如运维、设计制造方面的问题解析功能。
查询意图识别转换子模块:根据意图类别确立查询模板,通过实体与查询语句的结合实现知识图谱的检索功能。
谓词词库管理子模块:根据标记的命名实体以及识别的命名实体,构建名词词库,并开放同义词接口,允许用户构建同义词;根据本体模式定义的联系,构建谓词词库,在用户问题查询时,先对用户意图识别结果按词库进行标准化。
问题模板管理子模块:在对问句进行处理时,需要对抽取的实体进行消歧以及纠错,为此需要建立复杂装备领域的实体词典库及同义词词典库,问句解析完成后还需要建立类别所对应的查询模板,因此,提供词典库及模板库的管理、维护服务。
答案组装反馈子模块:将知识检索出来后,可依据问题类别建立答案模板,将知识与模板结合起来形成答案,实现答案的组装功能。
为了更好的提供智能化的数据解析和路由,本发明提供的系统还包括知识推理服务子系统,被配置在分析计算层,
知识推理服务子系统的任务是接受流式数据处理平台、Web孪生平台、C/S模式设计/制造/运行子系统的各类嵌入式应用请求,对请求进行解析和路由,形成结果返回,若调用AI模型产生的新的知识,则调用知识存储系统接口写入知识库,具体如图3所示,包括推理请求与路由、结果反馈与知识更新及AI运行管控3个模块。
具体的,推理请求清洗与路由模块用于推理请求解析与路由模块接收来自各系统的嵌入式请求,对请求进行解析和路由,具体功能包括:
推理请求队列管理子模块:通过接口接收各系统的嵌入式知识服务请求,以消息队列的方式管理请求和对请求进行处理。
推理请求解析子模块:对请求知识的类型进行解析,先按语义关键字或问题请求知识图谱,返回知识图谱的结果,若不为空,则直接调用推理结果反馈功能返回结果。
AI模型调用推理子模块:若上述知识图谱反馈结果为空,则调用对应的AI模型,通过AI模型进行推理,或者结果。
具体的,结果反馈及知识更新模块包括:
推理结果组织反馈子模块:将知识图谱搜索或问答结果,或通过对应的AI模型推理结果组织反馈给调用者。
AI模型推理结果存储子模块:对于知识图谱中没有答案,通过AI模型推理得到的结果,将其作为新的知识更新到图谱中。
具体的,AI模型运行管控模块包括AI模型调用日志分析和AI模型运行资源调度两个功能:
AI模型调用日志分析子模块:系统记录所用AI模型的调用日志,包括请求者、请求时间、请求的推理数据、服务响应时间、是否正常运行、反馈结果等。
AI模型运行资源调度子模块:后台运行,根据AI模型的调用日志和响应性能,动态调整计算资源的分配。
为了更好的提供调用及管理AI模型,本发明的系统还包括了AI模型及接口管理子系统,被配置在AI接口层,AI模型注册与调用子系统用于对产品全生命周期的各种AI模型提供接口,实现知识图谱与AI模型的动态融合。
AI模型注册与调用子系统功能包括两类:如图4所示,分为AI模型管理和AI模型知识展示。其中,AI模型管理提供AI模型的注册和调用功能,对AI模型的模型文件、python程序文件以及运行平台进行管理;AI模型知识展示调用本体管理子系统提供AI模型本体构建和融合功能。
具体的,AI模型知识融合模块,提供AI模型的本体构建和本体融合功能,包括:
AI模型本体构建子模块:用户进行AI模型的注册时,调用本体建模工具Protégé进行AI模型的本体构建,保存后生成OWL文件在平台上解析。
AI模型本体融合子模块:基于构建的AI模型本体以及产品实例结构树,通过本体映射算和本体对齐算法进行AI模型本体融合。
具体的,AI模型发布管理模块提供AI模型发布及运行容器部署服务,包括:
AI模型发布管理子模块:提供AI模型语义注册、调用接口及数据类型、输出结果及数据类型、是否开放服务等管理。
AI模型运行容器管理子模块:提供AI模型对应的模型文件、python程序文件并加载运行平台。
需要说明的是,在最优选的情况下,本发明提供的系统主体框架基于Springboot框架,知识图谱的存储采用Neo4j架构的数据库,文档存储采用FastDFS轻量级分布式文件系统,并整合了ElastiSearch文本搜索引擎,
另外,本发明提供的系统为了更好的提供知识图谱的构建,结合本发明的人的研究,还在系统中配置了知识抽取模块,用于对采集或挖掘的数据进行识别和分类后,针对不同类型的数据进行不同方法的知识抽取,
若所述数据类型为结构化数据,则调用关系数据库中的相关数据库表单对应保存的数据,获得对应第一知识数据;
若所述数据类型为半结构化数据,则通过网络数据抽取模板和非网络数据抽取模板抽取对应第二知识数据;
若所述数据类型为非结构化数据,则通过深度学习模型对数据进行标注、实体识别、文本分类和关系抽取,获得对应第三知识数据。
并且在抽取第三知识数据时,其中包括了文本分类,主要是由于高速列车转向架在故障阶段,由于不同的故障模式具有不同维修方法和策略,同时,相同的故障模式往往具有相同的维修方法和策略,为了更准确的获取故障对维修方法,以故障指导维修,基于故障文本数据进行故障模式的分类,本发明基于word2vec+TextCNN的深度学习模型进行文本分类。具体为:将标注后的训练数据输入到word2vec模型中,训练得到词向量模型,然后将词向量模型作为TextCNN模型的输入,经过卷积层的特征提取,池化层的池化;通过全连接单softmax输出每个类别的概率,利用得到的模型对未标注的测试集进行分类。
故障文本数据进行故障模式分类后,可以把故障模式也看成为一个实体或者概念,那么实体识别后的零件与故障模式分类就可以通过关系对应。所以实体识别,故障分类,关系抽取必须全部都有才能解决现有技术问题。
在系统的具体执行过程中,还包括,对故障类型进行分类高速列车转向架故障领域知识图谱的的构建,除了为故障的查询提供知识支持外,还可以为故障维修提供指导。对于同一故障,其故障现象可能不同,但维修方法却可能相同,如故障现象为“齿轮箱漏油”和“减震器漏油”,维修方法为“工序1:对齿轮箱进行探伤”;而两种故障现象都属于同一故障模式“漏油”。为能够更好的指导维修,我们对故障文本进行故障模式分类,即基于word2vec+TextCNN的深度学习模型训练分类模型,对输入文本进行故障模式分类。
该模型主要有两层,词嵌入(embeeding)层和TextCNN(卷积神经网络)层。
词嵌入(embeeding)层
利用神经网络进行训练时,需要将文本转换成模型可以理解的形式。该层的作用是将文本表示为低维稠密的词向量,这个向量往往是具有语义信息的,包含了对分类有用的特征,本发明采用基于word2vec的CBOW方法预训练词向量,可以捕获句子的语义信息。Word2vec模型的构建流程如下:
分词和去停用词:使用基于BILSTM-CRF-TextCNN的分词器训练得到的高速列车转向架领域的分词器对句子进行分词。分词器的训练流程及效果将在第三部分进行详细说明。
构造词典:统计词频。对整个文本进行遍历,对文本中所有词语出现的频率进行统计。
构造Haffman树:按照词出现的概率构造哈夫曼树,所有的分类都位于哈夫曼树的叶子节点。
训练词向量:对哈夫曼树中的叶子节点生成二进制码,对各非叶子节点和叶子结点中的词向量初始化然后进行训练。
测试生成的模型。
TextCNN(卷积神经网络)层使用embedding层输出的词向量作为模型的输入,使用不同大小的卷积核进行特征提取,通过池化层固定向量的维度,最后通过全连接的softmax层,输出每个类别的概率。
特征提取:使用不同卷积核对数据进行特征提取,滑动窗口即卷积核的大小分别为3,4,5。
池化层:提取特征之后,经过一个最大池化层固定输入向量维度,便于计算。
全连接层:模型经过特征提取,最大池化后通过一个全连接的softmax来输出每个类别的概率。
模型训练:将标注的训练数据输入到模型中,使用word2vec模型训练得到词向量模型,然后将词向量模型输入至TextCNN中,经过卷积层的特征提取,池化层的池化,最后经过softmax(Softmax的含义在于不唯一的确定某一个最大值,而是为每个输出分类的结果都赋予一个概率值,表示属于每个类别的可能性)输出每个类别的概率,最后利用得到的模型对未标注的测试集进行分类。分类模型同样是神经网络,需要在训练过程中根据相应的评价标准调整模型参数。
通过本发明提供的系统对复杂装置进行知识图谱构建时,能够抓取更多数据,针对不同类型的数据使用不同的知识抽取方法,并且通过三个子系统的搭建,能够更准确的调用AI模型,对实体识别,文本分类具有更高的效率。
以上仅是本发明的优选实施方式,应当指出的是,上述优选实施方式不应视为对本发明的限制,本发明的保护范围应当以权利要求所限定的范围为准。对于本技术领域的普通技术人员来说,在不脱离本发明的精神和范围内,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (10)

1.一种复杂装备知识图谱构建系统,其特征在于,包括:
接入层,用于系统在接入上考虑基于Web的访问,并预留嵌入式调用代理接口,支持设计、制造、运维各孪生系统对知识的调用;
应用交互层,用于系统的维护和应用服务;
分析计算层,用于自然语言处理、问题处理以及答案检索;
数据持久层,用于对知识进行抽取、图谱化和存储;
AI接口层,用于提供AI扩展服务;
工具层,用于调用提供上述所有层级中实现功能和服务所需的工具。
2.根据权利要求1所述的系统,其特征在于,包括:
知识图谱服务子系统,被配置在所述应用交互层,负责与用户交互,提供知识服务,
所述知识图谱服务子系统包括:
基于产品结构树的知识交互模块,用于按复杂装备族的方式提供关于该类产品的静态知识;
基于产品实例结构树的知识交互模块,用于接入复杂装备的感知数据;
语义搜索模块,用于对用户的自然问题进行语义解析,抽取其中的关键词并利用查询语句检索出相关的一系列知识,最后通过语义相似度及结果排序算法返回得分最高的几个答案返回给用户;
智能问答与知识推荐模块,用于对用户的自然语言问题进行解析,了解用户问题背后的意图并定位到图谱中精确知识,将用户的问句转换为标准的查询语句对该知识进行查询,并将检索出来的结构化知识组装为用户友好的语句返回。
3.根据权利要求2所述的系统,其特征在于,所述基于产品结构树的知识交互模块包括:
产品逻辑结构树管理子模块,提供对产品逻辑结构树的管理服务,逻辑结构树按产品型号进行逻辑管理,在结构树节点对应产品BOM树的系统-部件-构件组织;
逻辑结构树节点模型及信息维护子模块,提供针对逻辑结构树中的系统-部件-构件各个节点基本信息、模型维护接口;
实例结构图谱展示及交互子模块,按图数据库展示方式,根据实例BOM关系展示图边连接关系,可调整图谱显示的比例,点节点图标,浮出该系统-部件-构件节点的知识界面;
结构树节点知识查看子模块,在浮出该节点的知识界面,包括节点系统知识卡品信息、模型、需求知识、设计知识、制造知识、维护知识等映射在节点上的知识。
4.根据权利要求2所述的系统,其特征在于,所述基于产品实例结构树的知识交互模块包括:
产品结构树管理子模块。提供对产品实例结构树的管理服务,在结构树节点对应产品实例的BOM树的系统-部件-构件组织;
实例树节点信息及模型维护子模块。提供针对结构树中的系统-部件-构件各个节点基本信息、设计人、制造工艺过程、维修历史等信息维护;
结构图谱展示及交互子模块。按图数据库展示方式,展示图边连接关系,可调整图谱显示的比例,点节点图标,浮出该系统-部件-构件节点的知识界面;
结构树实例节点知识查看子模块。在浮出该节点的知识界面,包括节点系统知识卡品信息、模型、设计人、制造工艺信息、服役时间、故障及换件信息,以及挂接在在节点的各类需求、寿命预测、健康诊断智能服务。
5.根据权利要求2所述的系统,其特征在于,所述语义搜索服务模块包括:
用户输入语义解析子模块,通过对用户的问句进行关键词抽取和句法分析,提取用户的语义,并将关键词及关键词间的句法关系作为检索的依据;
字典管理子模块,根据标记的命名实体以及识别的命名实体,构建名词词库,并开放同义词接口,允许用户构建同义词;
查询构建及图谱检索子模块,利用问句中的关键词查询字典进行关键词标准化转换,利用关键词间的句法关系构建查询语句,以此对知识图谱进行模糊检索;
搜索答案排序子模块,通过对检索出来的一系列结果结合使用与原问句的语义相似度匹配和结果排序算法实现对答案的排序功能。
6.根据权利要求2所述的系统,其特征在于,所述智能问答与知识推荐服务模块包括:
用户问题语义解析子模块,包括对用户的问题进行实体抽取、意图识别和句法分析,用户提问后,利用深度学习模型抽取出问句中的实体并利用分类算法对用户的问题进行分类,最后利用句法分析理解实体间的关系,通过这3个信息定位到知识图谱中的具体知识,实现各种不同的如运维、设计制造方面的问题解析功能;
查询意图识别转换子模块,根据意图类别确立查询模板,通过实体与查询语句的结合实现知识图谱的检索功能;
谓词词库管理子模块,根据标记的命名实体以及识别的命名实体,构建名词词库,并开放同义词接口,允许用户构建同义词;根据本体模式定义的联系,构建谓词词库,在用户问题查询时,先对用户意图识别结果按词库进行标准化;
问题模板管理子模块,在对问句进行处理时,需要对抽取的实体进行消歧以及纠错,为此需要建立复杂装备领域的实体词典库及同义词词典库,问句解析完成后还需要建立类别所对应的查询模板,因此,提供词典库及模板库的管理、维护服务;
答案组装反馈子模块,将知识检索出来后,可依据问题类别建立答案模板,将知识与模板结合起来形成答案,实现答案的组装功能。
7.根据权利要求1所述的系统,其特征在于,还包括知识推理服务子系统,被配置在分析计算层,用于接受各类嵌入式应用请求,对请求进行解析和路由,形成结果返回;
所述知识推理服务子系统包括:
推理请求与路由模块,用于接收来自各系统的嵌入式请求,对请求进行解析和路由;
结果反馈与知识更新模块;
AI运行管控模块,用于对AI模型调用日志进行分析和AI模型运行资源进行调度。
8.根据权利要求7所述的系统,其特征在于,所述推理请求清洗与路由模块包括:
推理请求队列管理子模块,通过接口接收各系统的嵌入式知识服务请求,以消息队列的方式管理请求和对请求进行处理;
推理请求解析子模块,对请求知识的类型进行解析,先按语义关键字或问题请求知识图谱,返回知识图谱的结果,若不为空,则直接调用推理结果反馈功能返回结果。
AI模型调用推理子模块,若上述知识图谱反馈结果为空,则调用对应的AI模型,通过AI模型进行推理,或者结果。
9.根据权利要求1所述的系统,其特征在于,还包括AI模型及接口管理子系统,被配置在所述AI接口层,用于对产品全生命周期的各种AI模型提供接口,实现知识图谱与AI模型的动态融合;
包括,AI模型知识融合模块,用于AI模型的本体构建和本体融合;
AI模型发布管理模块,用于AI模型发布及运行容器部署。
10.根据权利要求9所述的系统,其特征在于,所述AI模型知识融合模块包括:
AI模型本体构建子模块,当进行AI模型的注册时,调用本体建模工具Protégé进行AI模型的本体构建,保存后生成OWL文件在平台上解析;
AI模型本体融合子模块,基于构建的AI模型本体以及产品实例结构树,通过本体映射算和本体对齐算法进行AI模型本体融合。
CN202211738314.2A 2022-12-31 2022-12-31 一种复杂装备知识图谱构建系统 Pending CN116450833A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211738314.2A CN116450833A (zh) 2022-12-31 2022-12-31 一种复杂装备知识图谱构建系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211738314.2A CN116450833A (zh) 2022-12-31 2022-12-31 一种复杂装备知识图谱构建系统

Publications (1)

Publication Number Publication Date
CN116450833A true CN116450833A (zh) 2023-07-18

Family

ID=87127858

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211738314.2A Pending CN116450833A (zh) 2022-12-31 2022-12-31 一种复杂装备知识图谱构建系统

Country Status (1)

Country Link
CN (1) CN116450833A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117076653A (zh) * 2023-10-17 2023-11-17 安徽农业大学 基于思维链及可视化提升上下文学习知识库问答方法
CN117112769A (zh) * 2023-10-23 2023-11-24 南京国睿信维软件有限公司 基于大语言模型的故障维修智能问答系统及方法
CN117435749A (zh) * 2023-12-21 2024-01-23 摩斯智联科技有限公司 生成知识图谱的方法、装置和存储介质

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117076653A (zh) * 2023-10-17 2023-11-17 安徽农业大学 基于思维链及可视化提升上下文学习知识库问答方法
CN117076653B (zh) * 2023-10-17 2024-01-02 安徽农业大学 基于思维链及可视化提升上下文学习知识库问答方法
CN117112769A (zh) * 2023-10-23 2023-11-24 南京国睿信维软件有限公司 基于大语言模型的故障维修智能问答系统及方法
CN117112769B (zh) * 2023-10-23 2024-04-09 南京国睿信维软件有限公司 基于大语言模型的故障维修智能问答系统及方法
CN117435749A (zh) * 2023-12-21 2024-01-23 摩斯智联科技有限公司 生成知识图谱的方法、装置和存储介质
CN117435749B (zh) * 2023-12-21 2024-03-15 摩斯智联科技有限公司 生成知识图谱的方法、装置和存储介质

Similar Documents

Publication Publication Date Title
Kalfoglou et al. Ontology mapping: the state of the art
Gagnon Ontology-based integration of data sources
Kalfoglou et al. IF-Map: An ontology-mapping method based on information-flow theory
Wache et al. Ontology-based integration of information-a survey of existing approaches.
CN103124980B (zh) 包括从多个文档段收集答案的提供问题答案
CN116450833A (zh) 一种复杂装备知识图谱构建系统
US9715531B2 (en) Weighting search criteria based on similarities to an ingested corpus in a question and answer (QA) system
Narula et al. Ontology mapping and merging aspects in semantic web
CN117290489B (zh) 一种行业问答知识库快速构建方法与系统
Al-Rajebah et al. Extracting ontologies from Arabic Wikipedia: A linguistic approach
CN116010619A (zh) 一种复杂装备知识图谱构建过程中的知识抽取方法
Arbaaeen et al. Natural language processing based question answering techniques: A survey
Bharambe et al. Ontology and knowledge graphs for semantic analysis in natural language processing
CN114091464B (zh) 一种融合五维特征的高普适性多对多关系三元组抽取方法
Burov et al. The Basic Ontology Development Process Automation Based on Text Resources Analysis
Gupta et al. Role of text mining in business intelligence
CN106055702B (zh) 一种面向互联网的数据服务统一描述方法
Ostrowski et al. A semantic based framework for the purpose of big data integration
Bajwa A framework for ontology creation and management for semantic web
US11574017B2 (en) Sub-question result merging in question and answer (QA) systems
Peruginelli et al. Knowledge Organization Systems in the Law Domain: Benefits and Challenges.
Rifaieh et al. MurO: a Multi-representation Ontology as a foundation of Enterprise Information Systems
Blomqvist State of the Art: Patterns in Ontology Engineering
Fu Design of a Higher Education Question and Answer System Based on Multimodal Adversarial Networks
Kumar et al. Knowledge Extraction from Domain-Specific Documents

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination