CN114064922A - 一种基于第三方云平台的服务价值链多链知识图谱构建方法 - Google Patents

一种基于第三方云平台的服务价值链多链知识图谱构建方法 Download PDF

Info

Publication number
CN114064922A
CN114064922A CN202111370349.0A CN202111370349A CN114064922A CN 114064922 A CN114064922 A CN 114064922A CN 202111370349 A CN202111370349 A CN 202111370349A CN 114064922 A CN114064922 A CN 114064922A
Authority
CN
China
Prior art keywords
entity
knowledge
data
model
service
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202111370349.0A
Other languages
English (en)
Other versions
CN114064922B (zh
Inventor
孙林夫
刘鹏程
韩敏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Southwest Jiaotong University
Original Assignee
Southwest Jiaotong University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Southwest Jiaotong University filed Critical Southwest Jiaotong University
Priority to CN202111370349.0A priority Critical patent/CN114064922B/zh
Publication of CN114064922A publication Critical patent/CN114064922A/zh
Application granted granted Critical
Publication of CN114064922B publication Critical patent/CN114064922B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/25Integrating or interfacing systems involving database management systems
    • G06F16/254Extract, transform and load [ETL] procedures, e.g. ETL data flows in data warehouses
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Animal Behavior & Ethology (AREA)
  • Computational Linguistics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及一种基于第三方云平台的服务价值链多链知识图谱构建方法,通过对多链数据的集成,经过二个阶段求解出精确知识图谱模型,将知识图谱模型存储到图数据库,完成服务价值链多链知识图谱的构建,统一了多条服务价值链的相关业务类对象集合及其关系的语义描述和定义,融合多链知识,实现了多链知识的组织,为支持业务决策提供更丰富的知识。

Description

一种基于第三方云平台的服务价值链多链知识图谱构建方法
技术领域
本发明属于信息技术领域,具体涉及一种基于第三方云平台的服务价值链多链知识图谱构建方法。
背景技术
随着信息技术的发展,基于云平台的网络化协同模式逐渐成为服务价值链运营和管控的重要手段。云平台突破了制造企业与服务企业业务协同的空间和时间限制,制造企业可以通过云平台与地理分散的服务企业进行业务协同和信息交互,提升了制造企业对服务价值链的运营和管控水平。较私有云平台而言,依托第三方云平台的网络化协同模式可以同时为多条服务价值链提供业务协同服务,具有更多的业务参与者,更强的资源汇聚能力,但当前平台主要存在以下问题:
平台决策支持能力不足;第三方云平台侧重于对业务协同流程的运行管理,控制业务信息流,缺乏数据向知识的转化能力,导致平台对业务运行的决策支持能力不足。
平台数据资源闲置;在服务价值链业务协同过程中,第三方平台积累了大量多链业务数据资源,但多数的数据分散闲置,并未得到有效利用,潜在价值亟待挖掘;
多链连接亟待打通;第三方云平台虽然连接了多条服务价值链,汇聚多方资源,但服务价值链内外各个价值节点间的横向连接并未打通,信息与知识并未在多链范围内流动,网络效应未完全激发。
发明内容
针对上述问题,如何挖掘数据资源潜力,提升知识转化和共享能力,已成为支持业务决策、进一步激发网络效应的重要途经之一。知识图谱作为基于对象集合和实体关系的语义知识库、是实现数据和知识组织的一种技术,提供对信息理解和管理的能力。本发明通过研究服务价值链多链知识图谱的构建,以集成分散的多链数据资源,抽取多链知识,以充分发掘数据价值,实现知识共享,持续地支持多链服务业务决策。为了实现上述发明目的,本发明提供了以下技术方案:
一种基于第三方云平台的服务价值链多链知识图谱构建方法,其特征在于,包括如下步骤:
步骤1:至少基于服务业务、服务资源和产品维度,构建服务价值链多链知识图谱总体框架,所述服务价值链多链知识图谱总体框架包括模式层和实例层。
步骤2:基于所述服务价值链多链知识图谱总体框架构建服务价值链多链知识图谱模型;其中,所述构建服务价值链多链知识图谱模型包括:数据集成、知识建模和知识存储。
优选地,所述数据集成包括:
步骤1:确定源于多个业务系统数据形成的操作数据层为s;其中,价值链i的数据源为si,所述操作数据层s共有k个数据源{s1,s2,…,sk};
步骤2:依据目标实体数据,确定抽取实体的全局统一数据模式为
Figure BDA0003362250710000021
其中,tg为实体类型数目,基于全局数据模式确定各局部数据源与之对应的映射关系及相应的抽取操作;
步骤3:对各个所述数据源执行筛选操作直接抽取出目标实体集合;确定各个局部数据源的数据模式
Figure BDA0003362250710000031
Figure BDA0003362250710000032
的对应关系,利用所述筛选操作抽取出目标实体集合
Figure BDA0003362250710000033
其中ti,g为数据源si对应的g类实体的集合;
步骤4:针对除去步骤3中执行所述筛选操作的其余数据源,首先执行筛选操作抽取出中间数据集
Figure BDA0003362250710000034
Figure BDA0003362250710000035
步骤5:基于步骤4的所述中间数据集合执行合并操作形成最终的实体数据;对所述中间数据集执行合并操作从
Figure BDA0003362250710000036
抽取目标实体数据
Figure BDA0003362250710000037
对于多个数据源,执行上述过程si形成t1类实体数据集合为
Figure BDA0003362250710000038
其中ni为数据源si所对应的t1类实体数据集合数目;
步骤6将步骤3-5中形成的各类实体数据集合{T1,T2,…,Tg}构成实体数据库,其中任意的
Figure BDA0003362250710000039
优选地,所述知识建模包括构建初始模型和构建精确模型,具体包括:
步骤1:基于服务价值链多链知识表示获取模式层对象集合及其关系的语义信息,基于OWL构建模式层本体模型;
步骤2:建立实体数据与知识模型实例层的映射关系,以实体数据库为数据源,基于实体数据类型形成实体对象集合,构造实体数值属性,设定实体数值属性名称及值类型,构造实体关系属性,设定实体间关系名称及类型,基于上述映射关系,构造实体及其关系集合,形成实例层模型,实现对知识元的抽取;
步骤3:建立对象集合与实例的映射关系,关联模式层模型与实例层模型,实现模式层与实例层知识的融合,形成初始模型;
步骤4:对所述初始知识模型的知识进行一致性检测,包括可满足性检测、实例检测和对象集合包含检测;其中,可满足性检测用于对知识库的一致性进行检测,以判断知识库是否存在错误;实例检测用于判断实例层中实体是否为对象集合的实例;对象集合包含检测用于判断对象集合间的包含关系,即判断对象集合间的包含关系是否为知识模型的逻辑结论;
步骤5在知识模型一致性检测过程中,对模型中的知识进行推理,发现对象集合间的包含关系,推理出实例层实体对应的所有对象集合;
步骤6将推理所得新知识与知识模型的现有知识进行融合,形成新模型,同时,利用OWL数据模式序列化知识模型,求解出精确知识模型。
优选地,所述知识存储包括:
步骤1:解析知识图谱模型数据模式,抽取实体数值属性、实体间关系,形成实体数据集和实体关系集,在实体集合中包含二级Map结构,其中第一级以实体uri为键值,以实体属性关系为值,形成全局唯一实体集合,以同样的数据结构形成关系二级Map结构集合;
步骤2:读取二级Map结构中的实体集合,在neo4j数据库中创建实体节点,遍历实体集合,将实体节点插入数据库中,由Map结构确保实体的唯一性,所以不再进行节点存在性判断;
步骤3:当实体集合读取结束后,通过遍历实体关系集合,插入节点关系,在neo4j数据库中创建实体间节点关系,当实体关系集合遍历完成后,整个存储流程结束,实现知识图谱模型到neo4j图数据库的存储。
与现有技术相比,本发明具有如下有益的技术效果:
本发明通过对基于第三方云平台的多服务价值链系统进行详细分析,针对该系统存在的问题及需求,提出服务价值链多链知识图谱构建的框架和方法,通过对多链数据的集成,经过二个阶段求解出精确知识图谱模型,将知识图谱模型存储到图数据库,完成服务价值链多链知识图谱的构建,统一了多条服务价值链的相关业务类对象集合及其关系的语义描述和定义,融合多链知识,实现了多链知识的组织,为支持业务决策提供更丰富的知识。
附图说明:
图1为服务价值链多链知识图谱总体框架;
图2为服务价值链多链数据集成过程;
图3为二阶段求解知识图谱模型;
图4为基于两级Map结构的知识图谱转存算法。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合附图,对本发明实施例中的技术方案进行清楚、完整的描述。显然,所描述的实施例是本发明的一部分实施例,而不是全部的实施例。
因此,以下对本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的部分实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
需要说明的是,在不冲突的情况下,本发明中的实施例及实施例中的特征和技术方案可以相互组合。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。
在本发明的描述中,需要说明的是,术语“上”、“下”等指示的方位或位置关系为基于附图所示的方位或位置关系,或者是该发明产品使用时惯常摆放的方位或位置关系,或者是本领域技术人员惯常理解的方位或位置关系,这类术语仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。此外,术语“第一”、“第二”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
本发明从服务业务、服务资源和产品等维度出发,构建基于第三方云平台的服务价值链多链知识体系,形成规范统一的多链知识,建立了面向服务价值链多链环境下的知识图谱总体框架,以实现对服务价值链内外分散知识的组织、序化和统一,为服务价值链的业务提供决策支持。
服务价值链多链知识图谱模型形式化表示为KG=<T,A>,其中T代表模型的模式层,A代表模型的实例层,模式层定义领域对象集合及其关系,通过模式层管理和组织实例层,完善实例层知识,并对实例层进行规范和约束。通常利用本体进行模式层建模,通过本体描述对象集合及其关系(对象集合与对象集合属性),形成公理知识,实例层是由实体及其关系(实体与实体属性)构成,描述事实性知识。
当前知识图谱在制造业服务环节的研究,主要涉及对产品故障和维修知识的组织,集中在对单个产品的诊断和维护中,数据源和功能相对单一,忽略了服务环节中其它业务对象集合及其关系的知识,本发明将关联服务价值链中多种业务对象集合及实例,更为完整地组织服务价值链业务知识体系。
如附图1中所示的,本发明中将模式层分为全局核心对象集合层和局部扩展对象集合层。在全局核心对象集合层中,对全局核心对象集合及其关系进行定义,形成服务价值链多链间统一和规范的顶层共享对象集合,避免共享对象集合在价值链间的重复定义;在局部扩展对象集合层中,针对各服务价值链的特有对象集合,实现对全局核心对象集合的扩展和继承;在实例层中,实例个体对象集合及关系均依赖于模式层中对象集合及关系的定义,通过抽取服务价值链多链数据形成实例层知识。基于映射关系实现实例层与模式层间的关联,形成统一的多链知识模型框架。图1中的实例层包含了两条服务价值链的实例及其关联关系,以及各个实例与模式层中对象集合间的关系,基于该知识模型框架实现服务价值链多链知识组织。
知识图谱的构建一般包括自顶向下和自底向上两种方式,这两种方式的选择主要取决于数据源。当数据质量较高且拥有规范模式时,可以采用自顶向下的方法,利用确定的模式构建知识图谱,当数据没有规范模式时,可以采用自底向上的方法,利用实体识别、关系抽取等技术提取数据模式来构建知识图谱,此外,还可将自顶向下和自底向上两种方式进行融合构建知识图谱。本发明以自顶向下方式构建服务价值链多链知识图谱。
知识图谱模型架构的设计侧重于对模式层对象集合的表示和组织,基于模式层中的全局及局部对象集合控制知识图谱模型的构建过程。针对该构建过程,本发明提出服务价值链多链知识图谱构建框架及相关方法,实现对多链知识的组织,主要包括:数据集成、知识建模和知识存储三个部分。
数据集成;基于模式层对象集合及其关系构建统一数据模式形成全局视图,集成多源异构的服务价值链数据,进行知识抽取形成实体数据库。
知识建模;通过二个阶段实现对知识模型的求解,在一阶段中,建立模式层和实体数据库的映射,形成初始知识模型;在二阶段中,求解出规范和完整的精确知识模型。基于知识模型的模式层和实例层,实现对知识的组织,改变原有数据的组织形式,实现对多链知识的描述和序列化。
知识存储;将精确知识模型存入图数据库,实现知识图谱的落地,利用知识图谱转存算法,实现序列化知识模型到图数据库的存储,以便进行知识管理和计算。
由于知识图谱模型架构的设计侧重于对模式层对象集合的表示和组织,基于模式层中的全局及局部对象集合控制知识图谱模型的构建过程。本发明基于对服务业务的分析和梳理,以服务价值链中的共性对象集合及其关系为基础构建模式层。模式层中主要包括如下对象集合:
1、全局核心对象集合
本发明利用描述逻辑对模型的模式层对象集合及其关系进行形式化描述,实现对服务价值链多链知识的统一表示。
全局核心对象集合层主要包括6个顶层服务价值链实体对象集合ValueChainEntity,各对象集合间不相交,分别为:服务业务对象集合ServiceBusiness、服务业务流程对象集合ServiceBusinessProcess、服务业务资源对象集合ServiceBusinessResource、产品对象集合Product、客户对象集合Customer和地点对象集合Location。服务业务顶层对象集合间存在较多关联关系,大致可归纳为:业务与业务流程、业务流程与业务资源、客户与产品等对象集合之间的关联关系。
(1)服务业务实体对象集合
服务业务对象集合ServiceBusiness是整个服务价值链的主体部分,面向服务业务需求,核心企业和服务企业协同推动业务执行,所定义的服务业务对象集合主要包括保养业务MaintenanceBusiness、索赔业务(主要指三包期内的维修业务)ClaimBusiness和旧件业务OldPartBusiness三种,各个服务业务对象集合间不相交。保养业务和索赔业务直接面向客户,为客户提供产品的售后服务。旧件业务为保养和维修的后序业务,实现对旧件资源的管理。
(2)业务资源实体对象集合
业务资源ServiceBusinessResource是指维持业务流程运转所需的资源,包括业务活动中人力、物力和信息等要素以及各要素的组合,基于资源在业务活动中的流动方向,业务资源可以分为输入业务资源和输出业务资源,输入业务资源指业务流程运行过程中需要消耗的人力、物力和信息等要素,输出业务资源指业务流程运行过程中需要产生的物力和信息等要素,服务价值链中业务资源包括:组织类业务资源OrganizationResource、物料类业务资源MaterialResource和信息类业务资源InformationResource,分别对应人力、物力和信息要素。
a组织类业务对象集合
组织类业务资源指参与到价值链流程运行中的企业Enterprise和该企业中的人力资源HumanResource,由于服务价值链中的业务流程是一类跨企业边界的业务流程,所以流程的参与者来自多个企业的多部门人员。从服务价值链业务协同的宏观角度看,开展服务业务协同的企业分为核心企业与协同企业两类;从企业角度看,服务价值链中核心企业与业务协同企业(服务企业)由不同对象集合类组成,如在汽车行业中,核心企业包括发动机制造厂、汽车制造厂等中上游制造企业,业务协同企业包括与之进行业务协同的4S店、服务商等服务企业;从业务人员角度看,组织资源包括各单位内部参与业务活动的人员,如服务站内部与核心企业对接业务的索赔专员、制造企业内部审核索赔单的业务人员。
b物料类业务资源对象集合
物料类业务资源MaterialResource指服务价值链流程中涉及到的物料类资源,基于物料资源的流动方向将物料类业务资源分为:输入类物料业务资源InputMaterialResource和输出类物料业务资源OutputMaterialResource。输入类物料业务资源主要指业务流程运行过程中所消耗的物料,如维修活动中的配件业务资源为一类重要的输入物料业务资源,配件对象集合体系在产品领域中具有一定的通用性,构建统一的配件对象集合组织体系对知识图谱跨链知识共享具有重要意义。输出类物料业务资源主要指业务流程运行过程中所产生的物料,如在维修过程中会消耗新配件替换故障件,此时所产生的旧件OldPart为当前流程产生的物料资源。输入与输出物料间也存在一定的关联关系,如旧件与配件类对象集合之间的关系
Figure BDA0003362250710000101
c信息类业务资源对象集合
信息类业务资源InformationResource指服务价值链流程运行中所涉及到的信息资源,同样基于资源流动方向分为输入类信息业务资源InputInformationResource和输出类信息业务资源OutputInformationResource。如在索赔业务流程中,维修人员使用的维修手册即为信息类业务资源,这些知识为当前业务流程的输入信息资源。当完成产品维修后,服务企业会向制造厂(核心企业)提交索赔单,索赔单中记录了维修活动的相关信息,此时索赔单即为当前业务流程的输出信息资源。
(3)业务流程实体对象集合
业务流程是服务价值链的核心对象集合,基于两端三方的基本组织关系,业务流程对象集合组织和关联价值链中所涉及到的诸多重要实体,通过对服务业务流程的分析,选取服务价值链中的核心流程作为全局对象集合。以索赔业务流程ClaimBusinessProcess为例,给出相关对象集合及其关系描述,基于索赔业务流程将产品、客户和业务资源等对象集合进行关联。
(4)其它实体对象集合
a地点实体对象集合
地点对象集合描述空间信息,用于关联业务活动、企业等对象集合。设Location为地点实体顶层对象集合,对于省、地级市等相关地点对象集合的定义如下:
Figure BDA0003362250710000111
Figure BDA0003362250710000112
其中Province为省级地点对象集合,City为地级市地点对象集合,通过地点实体对象集合对相关的地点对象集合进行组织。地点实体对象集合与其企业对象集合存在关联关系,如
Figure BDA0003362250710000113
表示企业位于某座城市。
b产品及客户实体对象集合
产品Product为业务流程服务的对象,基于顶层对象集合Product组织相关产品对象集合,如对于整车产品Automobile,其定义为
Figure BDA0003362250710000121
此外,客户Customer为产品Product的所有者,客户购买产品
Figure BDA0003362250710000122
Figure BDA0003362250710000123
将产品与客户进行关联,同时,产品Product与服务业务流程对象集合也存在关联。
2、局部扩展对象集合
全局核心对象集合层实现了对服务价值链全局共享对象集合及其关系的表示和组织,但部分服务价值链存在特有实体对象集合,这些特有实体对象集合及其关系可基于全局核心对象集合层进行扩展。从对象集合划分粒度分析,全局核心对象集合层是在归纳服务价值链中实体对象集合及其关联对象集合的基础上所形成的抽象对象集合,局部扩展对象集合是在全局核心对象集合基础上实现得更细粒度的对象集合分类组织。
在图1中,全局核心对象集合层的协作企业CollaborativeEnterprise可以直接作为数据层实例所关联的对象集合,CollaborativeEnterprise(cei)表示cei为协作企业的实例,当对协作企业对象集合进行扩展后,如添加配件供应商对象集合
Figure BDA0003362250710000124
可以利用PartSupplier(cei)将实例cei表示为更为具体对象集合。在图1的索赔流程中,不同服务价值链中围绕索赔核心流程会设计一些辅助流程,如某些制造厂针对三包期内的业务活动会特定地设计一些业务流程,可以将该类流程包含于全局核心对象集合的特殊申请流程中,定义在扩展对象集合层,减少对全局核心对象集合层的影响。
服务价值链多链知识图谱模型建模,是基于服务价值链多链知识图谱总体框架,通过集成分散的异构数据构建实体数据集,利用二个阶段求解出规范和完整的精确知识模型。其中,以上述模式层的对象集合为标准构建统一数据模式形成全局视图,以确定数据抽取的范围及集成数据模型;根据对象集合组织集成后的多链数据,构建统一的模式与实例知识;基于上述模式层的对象集合对实例层知识进行一致性检测,模式层包含多层级对象集合,基于知识推理,进行知识发现,即对象集合及关系包含推理,最后将所得知识图谱模型存储到图数据库中。主要包括以下内容:
1、构建实体数据集
服务价值链中核心企业与服务企业的业务协同数据是构建服务价值链多链知识图谱的主要数据源,基于模式层中所涉及的实体、关系和属性对象集合对数据进行筛选,确定各局部数据源与全局统一数据模式之间对应的映射关系,从服务价值链多链数据抽取和集成实体数据,构建实体数据集。为方便构建实体数据集,本发明做出如下定义:
定义1设需要抽取的目标数据集合为t,目标实体集合对应的数据源集合为
Figure BDA0003362250710000131
其中si为来源于第i个数据源的集合,
Figure BDA0003362250710000132
mi为该数据源中si的记录数。
定义2设ψt为目标实体的数据模式,
Figure BDA0003362250710000133
为si的数据模式,且
Figure BDA0003362250710000134
那么存在筛选操作,使得数据源中的记录
Figure BDA0003362250710000135
映射到集合t,记为筛选:
Figure BDA0003362250710000136
Figure BDA0003362250710000137
定义3设ψt为目标实体的数据模式,
Figure BDA0003362250710000138
为si的n个局部数据模式,且
Figure BDA0003362250710000139
那么存在合并操作,使得
Figure BDA00033622507100001310
映射到集合t,记为合并:
Figure BDA00033622507100001311
基于上述定义对数据集成过程进行描述,基于各数据源的局部模式和全局模式,利用筛选操作和合并操作进行数据抽取,实现业务操作数据与实例数据的映射,构建实体数据集,附图2为该过程的一个简单案例展示,多个数据源经过筛选操作、筛选和合并混合操作实现集成,具体流程如下:
步骤1设源于多个业务系统数据形成的操作数据层为s,价值链i的数据源为si,如图2中操作数据层共有k个数据源{s1,s2,…,sk};
步骤2依据目标实体数据,设抽取实体的全局统一数据模式为
Figure BDA0003362250710000141
tg为实体类型数目,基于全局数据模式确定各局部数据源与之对应的映射关系及相应的抽取操作操作;
步骤3对各个数据源执行筛选操作,图2展示了对各个局部数据源的筛选操作,经过筛选操作可以直接抽取部分目标实体,如图2中对于实体类Tg,确定各个局部数据源的数据模式
Figure BDA0003362250710000142
Figure BDA0003362250710000143
的对应关系,利用筛选操作抽取出目标实体集合
Figure BDA0003362250710000144
其中ti,g为数据源si对应的g类实体的集合;
步骤4步骤3实现从部分数据源直接抽取目标实体,但存在一些目标实体类,需要混合筛选和合并操作才能实现抽取,如图2中对实体类T1,全局模式
Figure BDA0003362250710000145
需要混合数据源中多个数据模式,对于数据源si而言,
Figure BDA0003362250710000146
需要
Figure BDA0003362250710000147
Figure BDA0003362250710000148
两种数据模式,通过筛选操作抽取出中间数据集
Figure BDA0003362250710000149
Figure BDA00033622507100001410
步骤5基于步骤4的中间数据集合形成最终的实体数据,对于来自数据源si的中间结果集,通过合并操作从
Figure BDA00033622507100001411
抽取目标实体数据
Figure BDA00033622507100001412
对于多个数据源,利用该过程si形成t1类实体数据集合为
Figure BDA00033622507100001413
其中ni为数据源si所对应的t1类实体数据集合数目;
步骤6将步骤3-5中形成的各类实体数据集合{T1,T2,…,Tg}构成实体数据库,其中任意的
Figure BDA0003362250710000151
2、二阶段求解知识图谱模型
服务价值链多链知识图谱是一种领域知识图谱,领域知识图谱深入到某个领域,其知识有较强的专业性与针对性,对知识准确性有较高要求。为保证知识准确性,在知识图谱模型求解过程中,对知识进行一致性检测和补全,为形成精确知识模型提供保证。在服务价值链多链数据集成过程中,以目标实体数据模式作为全局统一模式,抽取实体数据,这些实体数据为实例层知识模型的数据源,知识模型的求解过程如图3所示,具体步骤如下:
(1)一阶段求解—构建初始模型
步骤1基于服务价值链多链知识表示获取模式层对象集合及其关系的语义信息,基于OWL构建模式层本体模型;
步骤2建立实体数据与知识模型实例层的映射关系,以实体数据库为数据源,基于实体数据类型形成实体对象集合,构造实体数值属性,设定实体数值属性名称及值类型,构造实体关系属性,设定实体间关系名称及类型,基于上述映射关系,构造实体及其关系集合,形成实例层模型,实现对知识元的抽取;
步骤3建立对象集合与实例的映射关系,关联模式层模型与实例层模型,实现模式层与实例层知识的融合,形成初始模型;
(2)二阶段求解—构建精确模型
步骤4对初始知识模型的知识进行一致性检测,包括可满足性检测、实例检测和对象集合包含检测。可满足性检测是对知识库的一致性进行检测,以判断知识库是否存在错误;实例检测用于判断实例层中实体是否为对象集合的实例;对象集合包含检测用于判断对象集合间的包含关系,即判断对象集合间的包含关系是否为知识模型的逻辑结论;
步骤5在知识模型一致性检测过程中,对模型中的知识进行推理,发现对象集合间的包含关系,推理出实例层实体对应的所有对象集合;
步骤6将推理所得新知识与知识模型的现有知识进行融合,形成新模型,同时,利用OWL数据模式序列化知识模型,求解出精确知识模型。
3、面向图结构数据库的知识图谱存储
基于二阶段求解出知识图谱模型,为取得更优的查询和存储性能,将知识图谱模型转存入neo4j图数据库形成知识图谱。本发明提出一种基于两级Map结构的知识图谱转存算法(Two Level Map Transform Store,TLMTS)实现知识图谱模型到neo4j图数据库的存储,通过对知识模型的解析构建两级Map数据结构,形成模型的实体集和关系集,减少运行过程中对节点存在性的判断,提升转存性能,算法过程如图4所示。
步骤1解析知识图谱模型数据模式,抽取实体数值属性、实体间关系,形成实体数据集和实体关系集,在实体集合中包含二级Map结构,其中第一级以实体uri为键值,以实体属性关系为值,形成全局唯一实体集合,以同样的数据结构形成关系二级Map结构集合;
步骤2读取二级Map结构中的实体集合,在neo4j数据库中创建实体节点,遍历实体集合,将实体节点插入数据库中,由Map结构确保实体的唯一性,所以不再进行节点存在性判断;
步骤3当实体集合读取结束后,通过遍历实体关系集合,插入节点关系,在neo4j数据库中创建实体间节点关系,当实体关系集合遍历完成后,整个存储流程结束,实现知识图谱模型到neo4j图数据库的存储。
以上实施例仅用以说明本发明而并非限制本发明所描述的技术方案,尽管本说明书参照上述的各个实施例对本发明已进行了详细的说明,但本发明不局限于上述具体实施方式,因此任何对本发明进行修改或等同替换;而一切不脱离发明的精神和范围的技术方案及其改进,其均涵盖在本发明的权利要求范围当中。

Claims (4)

1.一种基于第三方云平台的服务价值链多链知识图谱构建方法,其特征在于,包括如下步骤:
步骤1:至少基于服务业务、服务资源和产品维度,构建服务价值链多链知识图谱总体框架,所述服务价值链多链知识图谱总体框架包括模式层和实例层;
步骤2:基于所述服务价值链多链知识图谱总体框架构建服务价值链多链知识图谱模型;其中,所述构建服务价值链多链知识图谱模型包括:数据集成、知识建模和知识存储。
2.如权利要求1所述的基于第三方云平台的服务价值链多链知识图谱构建方法,其特征在于,所述数据集成包括:
步骤1:确定源于多个业务系统数据形成的操作数据层为s;其中,价值链i的数据源为si,所述操作数据层s共有k个数据源{s1,s2,…,sk};
步骤2:依据目标实体数据,确定抽取实体的全局统一数据模式为
Figure FDA0003362250700000011
其中,tg为实体类型数目,基于全局数据模式确定各局部数据源与之对应的映射关系及相应的抽取操作;
步骤3:对各个所述数据源执行筛选操作直接抽取出目标实体集合;确定各个局部数据源的数据模式
Figure FDA0003362250700000012
Figure FDA0003362250700000013
的对应关系,利用所述筛选操作抽取出目标实体集合
Figure FDA0003362250700000014
其中ti,g为数据源si对应的g类实体的集合;
步骤4:针对除去步骤3中执行所述筛选操作的其余数据源,首先执行筛选操作抽取出中间数据集
Figure FDA0003362250700000015
Figure FDA0003362250700000016
步骤5:基于步骤4的所述中间数据集合执行合并操作形成最终的实体数据;对所述中间数据集执行合并操作从
Figure FDA0003362250700000021
抽取目标实体数据
Figure FDA0003362250700000022
对于多个数据源,执行上述过程si形成t1类实体数据集合为
Figure FDA0003362250700000023
其中ni为数据源si所对应的t1类实体数据集合数目;
步骤6将步骤3-5中形成的各类实体数据集合{T1,T2,…,Tg}构成实体数据库,其中任意的
Figure FDA0003362250700000024
3.如权利要求1-2中任意一项所述的基于第三方云平台的服务价值链多链知识图谱构建方法,其特征在于,所述知识建模包括构建初始模型和构建精确模型,具体包括:
步骤1:基于服务价值链多链知识表示获取模式层对象集合及其关系的语义信息,基于OWL构建模式层本体模型;
步骤2:建立实体数据与知识模型实例层的映射关系,以实体数据库为数据源,基于实体数据类型形成实体对象集合,构造实体数值属性,设定实体数值属性名称及值类型,构造实体关系属性,设定实体间关系名称及类型,基于上述映射关系,构造实体及其关系集合,形成实例层模型,实现对知识元的抽取;
步骤3:建立对象集合与实例的映射关系,关联模式层模型与实例层模型,实现模式层与实例层知识的融合,形成初始模型;
步骤4:对所述初始知识模型的知识进行一致性检测,包括可满足性检测、实例检测和对象集合包含检测;其中,可满足性检测用于对知识库的一致性进行检测,以判断知识库是否存在错误;实例检测用于判断实例层中实体是否为对象集合的实例;对象集合包含检测用于判断对象集合间的包含关系,即判断对象集合间的包含关系是否为知识模型的逻辑结论;
步骤5在知识模型一致性检测过程中,对模型中的知识进行推理,发现对象集合间的包含关系,推理出实例层实体对应的所有对象集合;
步骤6将推理所得新知识与知识模型的现有知识进行融合,形成新模型,同时,利用OWL数据模式序列化知识模型,求解出精确知识模型。
4.如权利要求1-3中任意一项所述的基于第三方云平台的服务价值链多链知识图谱构建方法,其特征在于,所述知识存储包括:
步骤1:解析知识图谱模型数据模式,抽取实体数值属性、实体间关系,形成实体数据集和实体关系集,在实体集合中包含二级Map结构,其中第一级以实体uri为键值,以实体属性关系为值,形成全局唯一实体集合,以同样的数据结构形成关系二级Map结构集合;
步骤2:读取二级Map结构中的实体集合,在neo4j数据库中创建实体节点,遍历实体集合,将实体节点插入数据库中,由Map结构确保实体的唯一性,所以不再进行节点存在性判断;
步骤3:当实体集合读取结束后,通过遍历实体关系集合,插入节点关系,在neo4j数据库中创建实体间节点关系,当实体关系集合遍历完成后,整个存储流程结束,实现知识图谱模型到neo4j图数据库的存储。
CN202111370349.0A 2021-11-18 2021-11-18 一种基于第三方云平台的服务价值链多链知识图谱构建方法 Active CN114064922B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111370349.0A CN114064922B (zh) 2021-11-18 2021-11-18 一种基于第三方云平台的服务价值链多链知识图谱构建方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111370349.0A CN114064922B (zh) 2021-11-18 2021-11-18 一种基于第三方云平台的服务价值链多链知识图谱构建方法

Publications (2)

Publication Number Publication Date
CN114064922A true CN114064922A (zh) 2022-02-18
CN114064922B CN114064922B (zh) 2023-07-14

Family

ID=80277843

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111370349.0A Active CN114064922B (zh) 2021-11-18 2021-11-18 一种基于第三方云平台的服务价值链多链知识图谱构建方法

Country Status (1)

Country Link
CN (1) CN114064922B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115130013A (zh) * 2022-07-01 2022-09-30 西南交通大学 一种多企业价值链超链融动协同方法
CN115146963A (zh) * 2022-07-01 2022-10-04 西南交通大学 一种基于第三方云平台的多链联动协同方法及系统
CN117556059A (zh) * 2024-01-12 2024-02-13 天津滨电电力工程有限公司 一种基于知识融合与推理充电站数据的检测及矫正方法

Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120324347A1 (en) * 2011-06-15 2012-12-20 Terrence Monroe Method for parsing, searching and formatting of text input for visual mapping of knowledge information
CN109255034A (zh) * 2018-08-08 2019-01-22 数据地平线(广州)科技有限公司 一种基于产业链的行业知识图谱构建方法
CN109446343A (zh) * 2018-11-05 2019-03-08 上海德拓信息技术股份有限公司 一种公共安全知识图谱构建的方法
CN110543573A (zh) * 2019-08-28 2019-12-06 珠海格力电器股份有限公司 一种基于知识图谱的垃圾分类方法及装置
CN111098301A (zh) * 2019-12-20 2020-05-05 西南交通大学 一种基于场景知识图谱任务型机器人的控制方法
CN111177400A (zh) * 2019-12-05 2020-05-19 国网能源研究院有限公司 基于知识图谱的设备、业务及数据的关联显示方法和装置
CN112182410A (zh) * 2020-11-05 2021-01-05 西南交通大学 基于时空轨迹知识图谱的用户出行模式挖掘方法
CN112199515A (zh) * 2020-11-17 2021-01-08 西安交通大学 一种多形态知识图谱驱动的知识服务创新方法
US20210173711A1 (en) * 2015-10-28 2021-06-10 Qomplx, Inc. Integrated value chain risk-based profiling and optimization
CN113127606A (zh) * 2021-06-18 2021-07-16 西南交通大学 基于知识图谱的施工行为安全风险分析与危险点识别方法
CN113190687A (zh) * 2021-05-08 2021-07-30 上海爱数信息技术股份有限公司 知识图谱的确定方法、装置、计算机设备及存储介质
CN113434704A (zh) * 2021-03-23 2021-09-24 汪威 基于大数据的知识图谱处理方法和云计算系统

Patent Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120324347A1 (en) * 2011-06-15 2012-12-20 Terrence Monroe Method for parsing, searching and formatting of text input for visual mapping of knowledge information
US20210173711A1 (en) * 2015-10-28 2021-06-10 Qomplx, Inc. Integrated value chain risk-based profiling and optimization
CN109255034A (zh) * 2018-08-08 2019-01-22 数据地平线(广州)科技有限公司 一种基于产业链的行业知识图谱构建方法
CN109446343A (zh) * 2018-11-05 2019-03-08 上海德拓信息技术股份有限公司 一种公共安全知识图谱构建的方法
CN110543573A (zh) * 2019-08-28 2019-12-06 珠海格力电器股份有限公司 一种基于知识图谱的垃圾分类方法及装置
CN111177400A (zh) * 2019-12-05 2020-05-19 国网能源研究院有限公司 基于知识图谱的设备、业务及数据的关联显示方法和装置
CN111098301A (zh) * 2019-12-20 2020-05-05 西南交通大学 一种基于场景知识图谱任务型机器人的控制方法
CN112182410A (zh) * 2020-11-05 2021-01-05 西南交通大学 基于时空轨迹知识图谱的用户出行模式挖掘方法
CN112199515A (zh) * 2020-11-17 2021-01-08 西安交通大学 一种多形态知识图谱驱动的知识服务创新方法
CN113434704A (zh) * 2021-03-23 2021-09-24 汪威 基于大数据的知识图谱处理方法和云计算系统
CN113190687A (zh) * 2021-05-08 2021-07-30 上海爱数信息技术股份有限公司 知识图谱的确定方法、装置、计算机设备及存储介质
CN113127606A (zh) * 2021-06-18 2021-07-16 西南交通大学 基于知识图谱的施工行为安全风险分析与危险点识别方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
刘鹏程;孙林夫: "基于第三方云平台的服务价值链多链知识图谱构建" *
赵祥龙: "基于第三方云平台的车辆故障知识图谱构建" *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115130013A (zh) * 2022-07-01 2022-09-30 西南交通大学 一种多企业价值链超链融动协同方法
CN115146963A (zh) * 2022-07-01 2022-10-04 西南交通大学 一种基于第三方云平台的多链联动协同方法及系统
CN117556059A (zh) * 2024-01-12 2024-02-13 天津滨电电力工程有限公司 一种基于知识融合与推理充电站数据的检测及矫正方法
CN117556059B (zh) * 2024-01-12 2024-05-31 天津滨电电力工程有限公司 一种基于知识融合与推理充电站数据的检测及矫正方法

Also Published As

Publication number Publication date
CN114064922B (zh) 2023-07-14

Similar Documents

Publication Publication Date Title
CN114064922A (zh) 一种基于第三方云平台的服务价值链多链知识图谱构建方法
US7620639B2 (en) Comparison of models of a complex system
Pardillo et al. Using ontologies for the design of data warehouses
US8027859B2 (en) Analysis of a model of a complex system, based on two models of the system, wherein the two models represent the system with different degrees of detail
CN102004767A (zh) 一种基于抽象业务逻辑的交互式语义Web服务动态组合方法
US7941301B2 (en) Modelling a complex system
Djebbi et al. Industry survey of product lines management tools: Requirements, qualities and open issues
CN115496337A (zh) 一种支撑企业大脑的数据系统
Postina et al. An ea-approach to develop soa viewpoints
CN110598074A (zh) 关于科技咨询大数据的统一资源组织管理的方法与系统
Glava et al. Information Systems Reengineering Approach Based on the Model of Information Systems Domains
Albert et al. A constrained object model for configuration based workflow composition
US20140372386A1 (en) Detecting wasteful data collection
Wang et al. Application of Service Modular Design Based on a Fuzzy Design Structure Matrix: A Case Study from the Mining Industry
Paim et al. Towards a methodology for requirements analysis of data warehouse systems
Tuladhar Why is unified modeling language, UML, for cadastral systems
Sanderson et al. SDI Communities: Data quality and knowledge sharing
CN111562904B (zh) 一种基于SysML系统模型的可靠性框图RBD辅助建模方法
Wu et al. Integration and formal representation in civil engineering supervision based on data-driven
Navarro et al. Weaving a network of architectural knowledge
El-Diraby Infrastructure development in the knowledge city
Prakash et al. Functionality for business indicators in data warehouse requirements engineering
Yu et al. A new decision making method for product development based on multiple neural network
Kirianova et al. SYNTHESIS OF THE PROCESS AND OBJECT-ORIENTED APPROACHES TO THE STRUCTURIZATION OF KNOWLEDGE
Li et al. A multi-dimensional ontology model for product lifecycle knowledge management

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant