CN115080765A - 一种航天质量知识图谱构建方法、系统、介质和设备 - Google Patents
一种航天质量知识图谱构建方法、系统、介质和设备 Download PDFInfo
- Publication number
- CN115080765A CN115080765A CN202210858734.8A CN202210858734A CN115080765A CN 115080765 A CN115080765 A CN 115080765A CN 202210858734 A CN202210858734 A CN 202210858734A CN 115080765 A CN115080765 A CN 115080765A
- Authority
- CN
- China
- Prior art keywords
- knowledge
- quality
- aerospace
- entity
- triples
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/34—Browsing; Visualisation therefor
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/30—Computing systems specially adapted for manufacturing
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Mathematical Physics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Animal Behavior & Ethology (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种航天质量知识图谱构建方法、系统、介质和设备,涉及软件管理领域。该方法包括:分析航天质量领域知识的来源和属性,获得航天质量领域知识的实体类、属性及实体类之间的关系,根据实体类、属性及实体类之间的关系构建航天质量知识图谱的模式层,根据航天质量知识图谱的模式层的需求联合查询业务数据表,抽取知识三元组,将知识三元组进行融合,获得航天质量知识图谱,对航天质量知识图谱进行存储和可视化显示,通过构建航天质量知识图谱,能够实现质量数据的知识化表达,让质量数据易查、易用及可视化,充分发挥质量问题数据在驱动型号研制质量改进方面的效能,为型号研制企业实现型号质量数据重用提供了一种智能化的解决方案。
Description
技术领域
本发明涉及软件管理领域,尤其涉及一种航天质量知识图谱构建方法、系统、介质和设备。
背景技术
随着航天企业信息化程度的逐渐加深,型号研制过程产生的质量数据量日渐庞大和复杂。这些质量数据一般都存储在专用的信息系统数据库中,关系型数据库采用二维表形式对数据进行存储管理,这种存储方式存在着数据模式动态变迁困难、数据使用专业程度高等不足,这些问题已难以满足型号研制过程质量管控中对质量数据使用的精确性、易用性、强关联、可视化的要求。
发明内容
本发明所要解决的技术问题是针对现有技术的不足,提供一种航天质量知识图谱构建方法、系统、介质和设备。
本发明解决上述技术问题的技术方案如下:
一种航天质量知识图谱构建方法,包括:
S1,分析航天质量领域知识的来源和属性,获得所述航天质量领域知识的属性、多个实体类,及多个实体类之间的关系;
S2,根据所述实体类、所述属性及所述实体类之间的关系构建航天质量知识图谱的模式层;
S3,根据所述航天质量知识图谱的模式层的需求联合查询业务数据表,抽取知识三元组;
S4,将所述知识三元组进行融合,获得航天质量知识图谱,对所述航天质量知识图谱进行存储和可视化显示。
本发明的有益效果是:本方案通过构建航天质量知识图谱,能够实现质量数据的知识化表达,让质量数据易查、易用及可视化,充分发挥质量问题数据在驱动型号研制质量改进方面的效能,为型号研制企业实现型号质量数据重用提供了一种智能化的解决方案。
通过本方案能够定制化展示知识节点及关系,直观展示航天质量知识图谱,发现知识间的关联关系,实现航天质量知识的隐形知识显性化,显性知识图谱化。
本方案能够以航天质量关系数据库的数据作为数据源,通过简单配置就能够实现知识图谱的快速自动化构建。
进一步地,所述将所述知识三元组进行融合,具体包括:
将所述知识三元组中的指代同一对象的多个实体类进行融合;
将所述知识三元组中的多个相同实体类进行融合,保留其中任意一个实体类;
将所述知识三元组中的互为同义词的不同实体类进行融合,合并为一个实体类;
将所述知识三元组中的多个实体间存在多种相同含义的关系进行合并,保留一个关系,以实现融合。
进一步地,所述根据所述航天质量知识图谱的模式层的需求联合查询业务数据表,抽取知识三元组,具体包括:
根据所述航天质量知识图谱的模式层的需求查询每一条业务数据表;
提取经过企业闭环处理的质量问题数据;
当所述航天质量知识图谱中不存在所述质量问题数据时,根据所述质量问题数据结合所述模式层抽取到知识三元组;所述知识三元组表示航天质量知识图谱的基本组成单元。
进一步地,所述知识三元组,包括:两个实体类之间的关系或一个实体类的属性。
本发明解决上述技术问题的另一种技术方案如下:
一种航天质量知识图谱构建系统,包括:关系分析模块、模式层构建模块、知识抽取模块和融合模块;
所述关系分析模块用于分析航天质量领域知识的来源和属性,获得所述航天质量领域知识的属性、多个实体类,及多个实体类之间的关系;
所述模式层构建模块用于根据所述实体类、所述属性及所述实体类之间的关系构建航天质量知识图谱的模式层;
所述知识抽取模块用于根据所述航天质量知识图谱的模式层的需求联合查询业务数据表,抽取知识三元组;
所述融合模块用于将所述知识三元组进行融合,获得航天质量知识图谱,对所述航天质量知识图谱进行存储和可视化显示。
本发明的有益效果是:本方案通过构建航天质量知识图谱,能够实现质量数据的知识化表达,让质量数据易查、易用及可视化,充分发挥质量问题数据在驱动型号研制质量改进方面的效能,为型号研制企业实现型号质量数据重用提供了一种智能化的解决方案。
通过本方案能够定制化展示知识节点及关系,直观展示航天质量知识图谱,发现知识间的关联关系,实现航天质量知识的隐形知识显性化,显性知识图谱化。
本方案能够以航天质量关系数据库的数据作为数据源,通过简单配置就能够实现知识图谱的快速自动化构建。
进一步地,所述融合模块具体用于
将所述知识三元组中的指代同一对象的多个实体类进行融合;
将所述知识三元组中的多个相同实体类进行融合,保留其中任意一个实体类;
将所述知识三元组中的互为同义词的不同实体类进行融合,合并为一个实体类;
将所述知识三元组中的多个实体间存在多种相同含义的关系进行合并,保留一个关系,以实现融合。
进一步地,所述知识抽取模块具体用于根据所述航天质量知识图谱的模式层的需求查询每一条业务数据表;
提取经过企业闭环处理的质量问题数据;
当所述航天质量知识图谱中不存在所述质量问题数据时,根据所述质量问题数据结合所述模式层抽取到知识三元组;所述知识三元组表示航天质量知识图谱的基本组成单元。
进一步地,所述知识三元组,包括:两个实体类之间的关系或一个实体类的属性。
本发明解决上述技术问题的另一种技术方案如下:
一种存储介质,所述存储介质中存储有指令,当计算机读取所述指令时,使所述计算机执行如上述任一方案所述的一种航天质量知识图谱构建方法。
本发明解决上述技术问题的另一种技术方案如下:
一种电子设备,包括处理器和上述方案所述的存储介质,所述处理器执行所述存储介质中的指令。
本发明附加的方面的优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明实践了解到。
附图说明
图1为本发明的实施例提供的一种航天质量知识图谱构建方法的流程示意图;
图2为本发明的实施例提供的一种航天质量知识图谱构建系统的结构框图;
图3为本发明的其他实施例提供的属性图示例;
图4为本发明的其他实施例提供的航天质量知识图谱示意图。
具体实施方式
以下结合附图对本发明的原理和特征进行描述,所举实施例只用于解释本发明,并非用于限定本发明的范围。
如图1所示,为本发明实施例提供的一种航天质量知识图谱构建方法,包括:
S1,分析航天质量领域知识的来源和属性,获得所述航天质量领域知识的属性、多个实体类,及多个实体类之间的关系;
S2,根据所述实体类、所述属性及所述实体类之间的关系构建航天质量知识图谱的模式层;
需要说明的是,航天质量知识图谱的模式层表示形成知识图谱数据层的基础,用来表达某种最基本思维对象的实体、属性、关系的概念和事物。模式层用来规范知识图谱的数据层,为其实体以及关系提供语义。资源描述框架(Resource description Framework,RDF)是目前普遍使用的语义网络描述模型,RDF三元组由主体(subject)、谓词(Predicate)和宾语(object)构成,一个三元组描述的是两个实体之间的关系或者一个实体的属性,是构成知识图谱的基础单元。
S3,根据所述航天质量知识图谱的模式层的需求联合查询业务数据表,抽取知识三元组;
在某一实施例中,所述S3具体包括:
通过以关系数据库中主键为索引查询每一条业务数据表;
根据图数据库的数据格式对其中的日期格式字段以及数值型的格式字段做格式转换处理,将关系数据库的数据格式转换为图数据库中对应格式;
根据知识建模规则从业务数据表中抽取知识三元组。其中,知识三元组包括:“实体-关系-实体”、“实体-属性-属性值”三元组知识单元。
S4,将所述知识三元组进行融合,获得航天质量知识图谱,对所述航天质量知识图谱进行存储和可视化显示。
在某一实施例中,将抽取的知识三元组进行融合具体包括:
由于型号研制质量知识的来源比较广泛,通过知识抽取得到的“实体-关系-实体”、“实体-属性-属性值”三元组知识单元存在实体重复、矛盾或者知识之间关联有错误等问题,因此需要进行知识融合。
存储在关系数据库的业务系统数据已经按照字段的约束规则进行填写,知识结构符合知识建模的规范要求,因此知识融合过程分为以下几个过程:
针对多个相同实体指代同一个对象的实体融合。将多个相同实体进行合并,只保留一个实体。如表1所示,数据库中两条质量问题记录问题所属型号都是型号A,则抽取出的关于问题所属型号的两个三元组为<电连接器无法正常分离,问题所属型号,型号A>、<显示器出现黑屏问题,问题所属型号,型号A>,原本两个三元组中,对应着两个相同节点型号A,那么通过型号名称进行节点融合,图数据库中只保留一个节点型号A。
多个不同实体互为同义词的实体融合。构建同义词库,然后在知识库按照构建的同义词库新增等价关系。如表1所示,产品XX1与产品XX1号指代的同一个产品,则对两个实体之间新增等价关系,抽取知识三元组时,通过节点融合保留标准实体XX1号,则抽取出的三元组为<电连接器无法正常分离,问题所属产品,XX1号>、<显示器出现黑屏问题,问题所属产品,XX1号>。
多个实体间存在多种相同含义的关系融合。将关系进行合并,只保留一个关系。如表1所示,两条记录中都提取出(XX1号,生产于,A所)的两组三元组,在进行实体融合的基础上,还需进行关系的融合,原本实体XX1号与A所之间根据抽取出的三元组存在两条关系“生产于”,则通过知识融合保留一条关系,以防止出现两条相同的冗余关系。
在另一实施例中,航天质量知识图谱存储及可视化可以包括:可以选择的知识存储数据库为Neo4j图数据库,它是通过属性图的方式来存储知识。属性图是由顶点(Vertex)、边(Edge)、标签(Label)、关系类型和属性(Property)组成的有向图。其中,顶点也称为节点(Node)、边也称为关系(Relationship)。在图形中,节点和关系是最重要的实体,如图3所示为属性图示例。图的基本构成要素为节点和关系,通过实体和关系的连接,可以将各类知识实体联系起来,构成一个复杂的知识库,而采用图数据库专用的图查询语言构建图查询语句,可以实现关联知识的查询,。同时,图具有较强的可扩展性,能够存储各种类型的知识。此外,面向大规模图数据的深度复杂关系查询的效率要远高于基于关系数据库的笛卡尔积查询效率。Neo4j图数据库有内置的图可视化插件,能够定制化展示知识节点及关系,直观展示航天质量知识图谱,发现知识间的关联关系,实现航天质量知识的隐形知识显性化,显性知识图谱化。其中,航天质量知识图谱示意图如图4所示。
本方案通过构建航天质量知识图谱,能够实现质量数据的知识化表达,让质量数据易查、易用及可视化,充分发挥质量问题数据在驱动型号研制质量改进方面的效能,为型号研制企业实现型号质量数据重用提供了一种智能化的解决方案。
通过本方案能够定制化展示知识节点及关系,直观展示航天质量知识图谱,发现知识间的关联关系,实现航天质量知识的隐形知识显性化,显性知识图谱化。
本方案能够以航天质量关系数据库的数据作为数据源,通过简单配置就能够实现知识图谱的快速自动化构建。
可选地,在上述任意实施例中,所述将所述知识三元组进行融合,具体包括:
将所述知识三元组中的指代同一对象的多个实体类进行融合;
将所述知识三元组中的多个相同实体类进行融合,保留其中任意一个实体类;
将所述知识三元组中的互为同义词的不同实体类进行融合,合并为一个实体类;
将所述知识三元组中的多个实体间存在多种相同含义的关系进行合并,保留一个关系,以实现融合。可选地,在上述任意实施例中,所述根据所述航天质量知识图谱的模式层的需求联合查询业务数据表,抽取知识三元组,具体包括:
根据所述航天质量知识图谱的模式层的需求查询每一条业务数据表;
提取经过企业闭环处理的质量问题数据,能够基于该条质量问题数据复现质量问题处理的过程、排除故障流程中的决策,在各个环节中使用的方法,直至最终质量问题处理的效果评价;
当所述航天质量知识图谱中不存在所述质量问题数据时,根据所述质量问题数据结合所述模式层抽取到知识三元组;所述知识三元组表示航天质量知识图谱的基本组成单元。
可选地,在上述任意实施例中,所述知识三元组,包括:两个实体类之间的关系或一个实体类的属性。
在某一实施例中,知识图谱构建方法包括:
S10:构建航天质量知识图谱模式层。
知识图谱的模式层是形成知识图谱数据层的基础,用来表达某种最基本思维对象的实体、属性、关系的概念和事物。模式层用来规范知识图谱的数据层,为其实体以及关系提供语义。资源描述框架(Resource description Framework,RDF)是目前普遍使用的语义网络描述模型,RDF三元组由主体(subject)、谓词(Predicate)和宾语(object)构成,一个三元组描述的是两个实体之间的关系或者一个实体的属性,是构成知识图谱的基础单元。
存储于关系数据库中的质量问题信息通过实体数据库表和关系表来存储的,因此,基于已有的结构化质量问题数据构建知识图谱的过程中,最关键的是模式层的数据模式设计,即类、实体和关系,用来解决关系数据库中的数据记录向图数据库中的节点和边的映射问题。根据W3C于2012年推出的2种映射语言标准,Direct Mapping(A direct mappingof relational data to RDF)和R2RML(RDB to RDF mapping language),其中DirectMapping是采用将关系数据库表结构直接输出为RDF图的映射机制,而R2RML则是通过自定义词汇表实现关系数据库到RDF数据集的转化,这种方式具有良好的可定制性和灵活性。由于关系数据库中的表及其字段与本体中的概念类、概念、以及属性和实体之间不存在明确的映射关系和关联约束,故本专利采用定制的R2RML映射语言来完成基于模式的数据映射。
R2RML映射是设计一个从关系数据库中检索数据的逻辑表。我们将关系数据库的一个基表的SQL查询定义为逻辑表,每个逻辑表被一个三元组映射转换成RDF,即逻辑表中每一行实例数据被映射为若干RDF三元组。以质量归零案例本体为例来说明R2RML映射原理。质量归零案例关系数据库的部分字段如表1所示:
表1
基于R2RML映射原理可以抽取如下的RDF三元组:
<电连接器无法正常分离,问题所属类型,机械故障>;
<电连接器无法正常分离,问题所属工作阶段,靶场试验阶段>;
<电连接器无法正常分离,问题责任单位,XX厂>;
……
采用上述映射原理可以实现对来自质量问题关系数据表的RDF三元组的抽取,从而构建起型号质量问题知识单元集合。
知识图谱的本质是由概念、实体以及实体之间的关系构成的语义网络。通过知识的本体建模与知识单元的抽取,我们可以得到一系列的RDF三元组,这些三元组又可以分别映射为实体、实体属性和实体关联。映射后的实体、实体属性、实体关联可能存在冗余和错误等需要进行实体/属性的消歧和实体对齐处理,实现对实体的链接和知识合并等处理,处理后的实体、实体属性和实体关联又与知识图谱可视化处理的节点、节点属性、边和边属性等进行映射,就可以构建起可视化的复杂关系网络,使得型号质量问题知识可以实现隐性知识的显性化、显性知识的立体化。
S11:针对型号质量问题信息知识化管理的需求,将多源异构关系数据库中的数据整合到质量问题知识图谱中,形成有效知识重用的网络化的知识库,为搭建智能搜索引擎、实现质量大数据的智能检索和关联推荐提供知识库基础。通过分析型号质量问题领域知识来源与知识属性,将领域知识实体类划分为:质量问题归零案例类、产品类、组织类、型号类、人员类、标准类、原因类以及故障模式类等。
S12:围绕上述设计的知识图谱模式层,拓展相关联的关系类型最大限度识别和完善质量问题知识集关系类型。例如,归零质量问题实体与型号实体存在关系“问题所属型号”,用BelongToModel表示;与产品实体存在关系“问题所属产品”,用BelongToProduct表示,等等。
S20:围绕知识图谱模式层进行数据库知识的抽取
质量问题数据的抽取加载采取全量抽取、增量更新的策略,数据来源可能来自于多张业务数据表中,例如存储在质量归零问题数据表为主表,而型号、产品等数据信息存储在PDM系统数据库中,但是数据表之间存在关联关系,要根据知识图谱模式层的需求,根据关系数据库中的外键关联进行联合查询多张业务数据表,并建立概念实体及属性与数据字段间的关系,例如归零质量问题与型号存在“问题所属型号”的关系。
S21:通过以主键为索引查询业务数据表中每一条已经过企业闭环处理的质量问题数据。
S21:根据图数据库的数据格式对其中的日期格式字段以及数值型的格式字段做格式转换处理,然后根据设定的唯一标识与质量知识图谱中的知识作一一对比,若存在此条知识,则作知识库的更新覆盖;若不存在这条知识,则将该条数据依据知识图谱模式层建立的概念实体与数据字段间的映射关系抽取出到知识图谱中。
S30:将知识三元组进行知识融合
由于型号研制质量知识的来源比较广泛,通过知识抽取得到的“实体-关系-实体”、“实体-属性-属性值”三元组知识单元存在实体重复、关系重复、两个实体存在同义关系等问题,因此需要进行知识融合。
知识融合过程分为以下几个过程。
S31:针对多个相同实体指代同一个对象的实体融合。将多个相同实体进行合并,只保留一个实体。例如数据库中两条质量问题记录问题所属型号都是型号a,则对两条记录中的型号a合并为一个节点。
S32:多个不同实体互为同义词的实体融合。构建同义词库,然后在知识库按照构建的同义词库新增等价关系。例如产品b与产品b号指代的同一个产品,则对两个实体之间新增等价关系。
S33:多个实体间存在多种相同含义的关系融合。将关系进行合并,只保留一个关系。例如两条记录中都提取出(产品a,生产于,产品生产单位)的两组三元组,在进行实体融合的基础上还需进行关系的融合,防止出现两条相同的冗余关系。
S40:航天质量知识图谱存储及可视化
本专利选择的知识存储数据库为Neo4j图数据库,它是通过属性图的方式来存储知识。属性图是由顶点(Vertex)、边(Edge)、标签(Label)、关系类型和属性(Property)组成的有向图。其中,顶点也称为节点(Node)、边也称为关系(Relationship)。在图形中,节点和关系是最重要的实体,如图3所示为属性图示例,图的基本构成要素为节点和关系,通过实体和关系的连接,可以将各类知识实体联系起来,构成一个复杂的知识库,而采用图数据库专用的图查询语言构建图查询语句,可以实现关联知识的查询。同时,图具有较强的可扩展性,能够存储各种类型的知识。此外,面向大规模图数据的深度复杂关系查询的效率要远高于基于关系数据库的笛卡尔积查询效率。Neo4j图数据库有内置的图可视化插件,能够定制化展示知识节点及关系,直观展示航天质量知识图谱,发现知识间的关联关系,实现航天质量知识的隐形知识显性化,显性知识图谱化。
在某一实施例中,一种航天质量知识图谱构建系统,包括:关系分析模块1101、模式层构建模块1102、知识抽取模块1103和融合模块1104;
所述关系分析模块1101用于分析航天质量领域知识的来源和属性,获得所述航天质量领域知识的属性、多个实体类,及多个实体类之间的关系;
所述模式层构建模块1102用于根据所述实体类、所述属性及所述实体类之间的关系构建航天质量知识图谱的模式层;
所述知识抽取模块1103用于根据所述航天质量知识图谱的模式层的需求联合查询业务数据表,抽取知识三元组;
所述融合模块1104用于将所述知识三元组进行融合,获得航天质量知识图谱,对所述航天质量知识图谱进行存储和可视化显示。
本方案通过构建航天质量知识图谱,能够实现质量数据的知识化表达,让质量数据易查、易用及可视化,充分发挥质量问题数据在驱动型号研制质量改进方面的效能,为型号研制企业实现型号质量数据重用提供了一种智能化的解决方案。
通过本方案能够定制化展示知识节点及关系,直观展示航天质量知识图谱,发现知识间的关联关系,实现航天质量知识的隐形知识显性化,显性知识图谱化。
本方案能够以航天质量关系数据库的数据作为数据源,通过简单配置就能够实现知识图谱的快速自动化构建。
可选地,在上述任意实施例中,所述融合模块1104具体用于
将所述知识三元组中的指代同一对象的多个实体类进行融合;
将所述知识三元组中的多个相同实体类进行融合,保留其中任意一个实体类;
将所述知识三元组中的互为同义词的不同实体类进行融合,合并为一个实体类;
将所述知识三元组中的多个实体间存在多种相同含义的关系进行合并,保留一个关系,以实现融合。
可选地,在上述任意实施例中,所述知识抽取模块1103具体用于根据所述航天质量知识图谱的模式层的需求查询每一条业务数据表;
提取经过企业闭环处理的质量问题数据;
当所述航天质量知识图谱中不存在所述质量问题数据时,根据所述质量问题数据结合所述模式层抽取到知识三元组;所述知识三元组表示航天质量知识图谱的基本组成单元。
可选地,在上述任意实施例中,所述知识三元组,包括:两个实体类之间的关系或一个实体类的属性。
在另一实施例中,一种知识图谱构建系统,包括安装知识建模模块100、知识抽取模块200、知识融合模块300以及知识图谱存储及可视化模块400。
知识建模模块100用于对航天质量知识图谱进行建模。
本专利主要采用自上而下的方式构建知识图谱,使用kettle集成Neo4j图数据库的Neo4jOutput插件,集成该插件后Kettle能够实现将Oracle的输入字段自动映射成图模型。
建模的实体类型有:首先构建归零质量问题实体,将ID、质量问题名称、问题发生时间、问题描述、问题等级、问题经济损失、问题归零周期作为其实体属性,为了实现更好的质量问题关联分析,将型号、产品、工作阶段、问题原因、问题责任单位、问题发生地点、标准条款、型号研制阶段设计为实体,通过设计各种关系与“归零质量问题”实体类型关联起来,用于描述“归零质量问题”实体类型的其它特征,例如设计归零质量问题实体与型号实体间的关联关系为“问题所属型号”。
同时,为了集成与“产品”实体有关联的知识,设计了产品生产单位、产品设计单位、产品级别等实体对象,形成更加丰富的归零质量问题知识网络。
在归零质量问题知识集中,围绕上述设计的概念层,拓展相关联的关系类型最大限度识别和完善质量问题归零知识集关系类型。
知识抽取模块200用于将质量数据以三元组的形式抽取出来。
由于ETL抽取工具Kettle的主要优势在于支持多种数据源,能够支持数据库分区以及数据库集群访问的数据库连接,具有成熟的异常处理功能,支持多任务并发,能够较好的实现与Java的集成。使用kettle将关系数据库中的数据以三元组的形式抽取出来。
知识融合模块300用于将冗余的三元组进行知识融合。
通过设置唯一标识,将具有相同唯一标识的实体进行实体融合,即解决了第一种情形的知识融合问题;对于第二种情形,在构建了同义词库以后,在知识库中新增等价关系完成实体的融合;而对于第三种情形,在知识建模的过程中,指代的同一类型关系设为相同的知识名称,然后Kettle在构建知识图谱的过程中会将同一类名称的关系融合成一种关系,实现关系的融合。
知识存储及可视化模块400用于存储知识图谱,并以可视化的形式展现给用户。
用户可以通过Neo4j可视化质量知识图谱,Neo4j图数据库内置D3.js可视化JavaScript库,用户可以通过配置实体的展示半径、颜色,定制化展示知识图谱。
此外,其内置的cypher语句可以实现较复杂的查询,包括路径查询等高级的图遍历算法,直观展示航天质量知识图谱的实体关联。
在某一实施例中,一种存储介质,所述存储介质中存储有指令,当计算机读取所述指令时,使所述计算机执行如上述任一实施例所述的一种航天质量知识图谱构建方法。
在某一实施例中,一种电子设备,包括处理器和上述实施例所述的存储介质,所述处理器执行所述存储介质中的指令。
可以理解,在一些实施例中,可以包含如上述各实施例中的部分或全部可选实施方式。
需要说明的是,上述各实施例是与在先方法实施例对应的产品实施例,对于产品实施例中各可选实施方式的说明可以参考上述各方法实施例中的对应说明,在此不再赘述。
读者应理解,在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的方法实施例仅仅是示意性的,例如,步骤的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个步骤可以结合或者可以集成到另一个步骤,或一些特征可以忽略,或不执行。
上述方法如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分,或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-OnlyMemory)、随机存取存储器(RAM,RandomAccessMemory)、磁碟或者光盘等各种可以存储程序代码的介质。
以上,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。
Claims (10)
1.一种航天质量知识图谱构建方法,其特征在于,包括:
S1,分析航天质量领域知识的来源和属性,获得所述航天质量领域知识的属性、多个实体类,及多个实体类之间的关系;
S2,根据所述实体类、所述属性及所述实体类之间的关系构建航天质量知识图谱的模式层;
S3,根据所述航天质量知识图谱的模式层的需求联合查询业务数据表,抽取知识三元组;
S4,将所述知识三元组进行融合,获得航天质量知识图谱,对所述航天质量知识图谱进行存储和可视化显示。
2.根据权利要求1所述的一种航天质量知识图谱构建方法,其特征在于,所述将所述知识三元组进行融合,具体包括:
将所述知识三元组中的指代同一对象的多个实体类进行融合;
将所述知识三元组中的多个相同实体类进行融合,保留其中任意一个实体类;
将所述知识三元组中的互为同义词的不同实体类进行融合,合并为一个实体类;
将所述知识三元组中的多个实体间存在多种相同含义的关系进行合并,保留一个关系,以实现融合。
3.根据权利要求1或2所述的一种航天质量知识图谱构建方法,其特征在于,所述根据所述航天质量知识图谱的模式层的需求联合查询业务数据表,抽取知识三元组,具体包括:
根据所述航天质量知识图谱的模式层的需求查询每一条业务数据表;
提取经过企业闭环处理的质量问题数据;
当所述航天质量知识图谱中不存在所述质量问题数据时,根据所述质量问题数据结合所述模式层抽取到知识三元组;所述知识三元组表示航天质量知识图谱的基本组成单元。
4.根据权利要求1或2所述的一种航天质量知识图谱构建方法,其特征在于,所述知识三元组,包括:两个实体类之间的关系或一个实体类的属性。
5.一种航天质量知识图谱构建系统,其特征在于,包括:关系分析模块、模式层构建模块、知识抽取模块和融合模块;
所述关系分析模块用于分析航天质量领域知识的来源和属性,获得所述航天质量领域知识的属性、多个实体类,及多个实体类之间的关系;
所述模式层构建模块用于根据所述实体类、所述属性及所述实体类之间的关系构建航天质量知识图谱的模式层;
所述知识抽取模块用于根据所述航天质量知识图谱的模式层的需求联合查询业务数据表,抽取知识三元组;
所述融合模块用于将所述知识三元组进行融合,获得航天质量知识图谱,对所述航天质量知识图谱进行存储和可视化显示。
6.根据权利要求5所述的一种航天质量知识图谱构建系统,其特征在于,所述融合模块具体用于
将所述知识三元组中的指代同一对象的多个实体类进行融合;
将所述知识三元组中的多个相同实体类进行融合,保留其中任意一个实体类;
将所述知识三元组中的互为同义词的不同实体类进行融合,合并为一个实体类;
将所述知识三元组中的多个实体间存在多种相同含义的关系进行合并,保留一个关系,以实现融合。
7.根据权利要求5或6所述的一种航天质量知识图谱构建系统,其特征在于,所述知识抽取模块具体用于根据所述航天质量知识图谱的模式层的需求查询每一条业务数据表;
提取经过企业闭环处理的质量问题数据;
当所述航天质量知识图谱中不存在所述质量问题数据时,根据所述质量问题数据结合所述模式层抽取到知识三元组;所述知识三元组表示航天质量知识图谱的基本组成单元。
8.根据权利要求5或6所述的一种航天质量知识图谱构建系统,其特征在于,所述知识三元组,包括:两个实体类之间的关系或一个实体类的属性。
9.一种存储介质,其特征在于,所述存储介质中存储有指令,当计算机读取所述指令时,使所述计算机执行如权利要求1至4中任一项所述的一种航天质量知识图谱构建方法。
10.一种电子设备,其特征在于,包括处理器和权利要求9所述的存储介质,所述处理器执行所述存储介质中的指令。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210858734.8A CN115080765A (zh) | 2022-07-20 | 2022-07-20 | 一种航天质量知识图谱构建方法、系统、介质和设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210858734.8A CN115080765A (zh) | 2022-07-20 | 2022-07-20 | 一种航天质量知识图谱构建方法、系统、介质和设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115080765A true CN115080765A (zh) | 2022-09-20 |
Family
ID=83243637
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210858734.8A Pending CN115080765A (zh) | 2022-07-20 | 2022-07-20 | 一种航天质量知识图谱构建方法、系统、介质和设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115080765A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115879550A (zh) * | 2022-12-21 | 2023-03-31 | 北京政务科技有限公司 | 知识图谱的构建方法、装置及存储介质 |
CN116028571A (zh) * | 2023-03-31 | 2023-04-28 | 南京航空航天大学 | 一种基于薄壁零件知识图谱构建方法和系统 |
CN116932780A (zh) * | 2023-09-13 | 2023-10-24 | 之江实验室 | 天文知识图谱构建方法、资源查找方法、设备和介质 |
-
2022
- 2022-07-20 CN CN202210858734.8A patent/CN115080765A/zh active Pending
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115879550A (zh) * | 2022-12-21 | 2023-03-31 | 北京政务科技有限公司 | 知识图谱的构建方法、装置及存储介质 |
CN116028571A (zh) * | 2023-03-31 | 2023-04-28 | 南京航空航天大学 | 一种基于薄壁零件知识图谱构建方法和系统 |
CN116028571B (zh) * | 2023-03-31 | 2023-06-02 | 南京航空航天大学 | 一种基于薄壁零件知识图谱构建方法和系统 |
CN116932780A (zh) * | 2023-09-13 | 2023-10-24 | 之江实验室 | 天文知识图谱构建方法、资源查找方法、设备和介质 |
CN116932780B (zh) * | 2023-09-13 | 2024-01-09 | 之江实验室 | 天文知识图谱构建方法、资源查找方法、设备和介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108038222B (zh) | 用于信息系统建模和数据访问的实体-属性框架的系统 | |
CN106095862B (zh) | 集中式可扩展融合型多维复杂结构关系数据的存储方法 | |
CN115080765A (zh) | 一种航天质量知识图谱构建方法、系统、介质和设备 | |
US20050010550A1 (en) | System and method of modelling of a multi-dimensional data source in an entity-relationship model | |
Dadjoo et al. | An approach for transforming of relational databases to OWL ontology | |
US9785725B2 (en) | Method and system for visualizing relational data as RDF graphs with interactive response time | |
US11334549B2 (en) | Semantic, single-column identifiers for data entries | |
CN106250382A (zh) | 一种元数据管理引擎系统及实现方法 | |
US9110970B2 (en) | Destructuring and restructuring relational data | |
Chouder et al. | EXODuS: exploratory OLAP over document stores | |
CN103559189B (zh) | 基于元数据集成模型的电力仿真培训资源管理系统及方法 | |
Varga et al. | Conceptual design of document NoSQL database with formal concept analysis | |
Khouri et al. | A methodology and tool for conceptual designing a data warehouse from ontology-based sources | |
CN114661832B (zh) | 一种基于数据质量的多模态异构数据存储方法及系统 | |
EP3249557B1 (en) | Computer implemented and computer controlled method, computer program product and platform for arranging data for processing and storage at a data storage engine | |
CN116108194A (zh) | 基于知识图谱的搜索引擎方法、系统、存储介质和电子设备 | |
US11068459B2 (en) | Computer implemented and computer controlled method, computer program product and platform for arranging data for processing and storage at a data storage engine | |
CN115757810A (zh) | 一种知识图谱标准本体构建方法 | |
Ma et al. | A novel data integration framework based on unified concept model | |
CN110019554B (zh) | 数据驱动型应用的数据模型、数据建模系统和方法 | |
Khalil et al. | New approach for implementing big datamart using NoSQL key-value stores | |
CN115618007A (zh) | 基于知识图谱的监察数据分析系统 | |
Chen | Database Design and Implementation | |
Zancanaro et al. | Publishing multidimensional statistical linked data | |
CN113221528A (zh) | 基于openEHR模型的临床数据质量评估规则的自动生成与执行方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |