CN109635119A - 一种基于本体融合的工业大数据集成系统 - Google Patents

一种基于本体融合的工业大数据集成系统 Download PDF

Info

Publication number
CN109635119A
CN109635119A CN201811253578.2A CN201811253578A CN109635119A CN 109635119 A CN109635119 A CN 109635119A CN 201811253578 A CN201811253578 A CN 201811253578A CN 109635119 A CN109635119 A CN 109635119A
Authority
CN
China
Prior art keywords
ontology
big data
data
fusion
mapping
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201811253578.2A
Other languages
English (en)
Other versions
CN109635119B (zh
Inventor
凌卫青
王坚
赵凡
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tongji University
Original Assignee
Tongji University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tongji University filed Critical Tongji University
Priority to CN201811253578.2A priority Critical patent/CN109635119B/zh
Publication of CN109635119A publication Critical patent/CN109635119A/zh
Application granted granted Critical
Publication of CN109635119B publication Critical patent/CN109635119B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/30Computing systems specially adapted for manufacturing

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及一种基于本体融合的工业大数据集成系统,包括:大数据本体构建模块,用于利用工业大数据构建大数据本体;相似度计算模块,用于基于本体的语言学特征与结构特征,计算大数据本体中的概念进行相似度计算;本体融合模块,用于根据相似度计算结果,进行本体融合,获得融合后的本体模型;本体库构建模块,用于根据融合后的本体模型,将企业内部数据与企业外部数据映射成本体实例数据,生成工业大数据本体库,实现数据集成。与现有技术相比,本发明通过本体融合后形成的工业大数据本体库,能够避免初期构建工业大数据本体存在的内外部数据不连通造成的关系模糊、语义不清的问题,从而实现不同来源工业大数据的集成。

Description

一种基于本体融合的工业大数据集成系统
技术领域
本发明涉及工业领域的大数据集成技术,尤其是涉及一种基于本体融合的工业大数据集成系统。
背景技术
工业行业经过多年建设和发展,数字化、信息化已经渗透进工业生产的每个角落,数据量的快速增长和深度应用已经处于量变到质变的关键节点,快速获取信息能力、及时准确分析及评估信息的能力成为流程工业企业核心竞争要素。
要发挥流程工业大数据的价值,需要解决知识建模复杂、知识模型异构、知识数据处理时效性强等问题。工业大数据应用的本质目标就是从高维、复杂、关联的海量数据中挖掘有价值的新信息,发现新模式与新知识。而海量数据关系密切、关联性强、语义稳定度高的特点,使本体成为解决多源、异构数据集成的有效工具。从企业管理的维度,将信息系统数据、设备数据归为企业内部数据,而外部互联网数据归为企业外部数据。目前制造领域本体主要根据企业内各业务领域专业知识独立构建,不仅各本体相互独立,而且对于来自互联网领域的大量信息缺乏集成与综合能力。
发明内容
本发明的目的就是为了克服上述现有技术存在的缺陷而提供一种基于本体融合的工业大数据集成系统。
本发明的目的可以通过以下技术方案来实现:
一种基于本体融合的工业大数据集成系统,包括:
大数据本体构建模块,用于利用工业大数据构建大数据本体;
相似度计算模块,用于基于本体的语言学特征与结构特征,计算大数据本体中的概念进行相似度计算;
本体融合模块,用于根据相似度计算结果,进行本体融合,获得融合后的本体模型;
本体库构建模块,用于根据融合后的本体模型,将企业内部数据与企业外部数据映射成本体实例数据,生成工业大数据本体库,实现数据集成。
进一步地,所述大数据本体包括企业内部本体和企业外部本体。
进一步地,所述企业内部本的构建具体包括:
将企业内部的信息系统数据和设备数据转化为概念术语,获取各信息系统概念的层次关系和各设备概念的层次关系;
对所述信息系统概念和设备概念进行整合和抽取,形成企业内部实体和信息的关联描述,构建企业内部本体。
进一步地,所述企业外部本体的构建具体包括:
将分布在互联网上的相关工业大数据转化为概念术语,获取各概念术语的关联描述,构建企业外部本体。
进一步地,所述大数据本体通过protégé本体建模工具实现本体可视化。
进一步地,所述相似度计算模块包括:
语言学特征相似度计算单元,用于采用基于VSM的余弦相似度计算方法对本体的语言学特征进行相似度计算;
结构特征相似度计算单元,用于采用基于RDF有向二部图的GMO算法对本体的结构特征进行相似度计算;
整合单元,根据所述语言学特征相似度计算单元和结构特征相似度计算单元的计算结果,整合获得最终相似度。
进一步地,所述本体融合具体包括以下步骤:
1)根据相似度计算结果,判断待融合的两个本体之间是否存在类映射对,若是,则执行步骤2);若否,则结束融合;
2)判断待融合的两个本体之间的类映射对是否唯一,若是,则直接执行步骤3)和4);若否,则选择相似度最高的一个类映射对后执行步骤3)和4);
3)判断类映射对中是否存在关系映射对,若是,则进行该关系的子节点映射对的查找,若子节点映射对存在,则输出关系映射对与子节点映射对,否则输出关系映射对,并记录子节点,添加为领域本体中的一个类;若否,则记录关系与子节点,添加为领域本体的对象属性与类;
4)判断类映射对中是否存在数值属性映射对,若是,则保留映射对中的一个数值属性,若否,则记录数值属性,添加领域本体中的数值属性。
进一步地,所述本体库构建模块调用D2RQ映射引擎将企业内部数据与企业外部数据映射成本体实例数据。
与现有技术相比,本发明具有以如下有益效果:
1)本发明在工业大数据环境下,通过本体融合,实现企业内外部不同数据源之间的互联互通互融,集成工业大数据,能够为工业大数据分析及创新应用提供统一的数据视图,为工业大数据分析以及创新性应用提供支撑。
2)本发明将工业大数据进行分类,引入本体分别建模,在相似度计算的基础上进行本体融合后,映射实例数据,生成工业大数据本体库,避免了在初期由于不同来源数据存储管理方式不同造成的数据之间概念模糊、关系不清,从而带来了本体完整性、一致性得不到保证的问题。
3)生成的本体库可以支撑对工业大数据的分析与创新性应用。
附图说明
图1为企业内部信息系统ERP数据层次梳理图;
图2为企业内部设备数据层次梳理图;
图3为企业内部本体实体类层次梳理图;
图4为企业内部本体信息类层次梳理图;
图5为企业内部本体概念之间的关联图;
图6为企业外部互联网供应商数据层次梳理图;
图7为相似度计算流程图;
图8为本体融合流程图;
图9工业大数据本体库构建流程图。
具体实施方式
下面结合附图和具体实施例对本发明进行详细说明。本实施例以本发明技术方案为前提进行实施,给出了详细的实施方式和具体的操作过程,但本发明的保护范围不限于下述的实施例。
本发明提供一种基于本体融合的工业大数据集成系统,可适用于制造领域,包括:
大数据本体构建模块,用于利用工业大数据构建大数据本体;
相似度计算模块,用于基于本体的语言学特征与结构特征,计算大数据本体中的概念进行相似度计算;
本体融合模块,用于根据相似度计算结果,进行本体融合,获得融合后的本体模型;
本体库构建模块,用于根据融合后的本体模型,将企业内部数据与企业外部数据映射成本体实例数据,生成工业大数据本体库,实现数据集成。
从企业管理的维度,本发明将不同来源的工业大数据分为企业内部数据与企业外部数据,其中,企业内部数据包括了信息系统数据、设备数据,企业外部数据包括了分布在互联网上的工业大数据。信息系统数据与设备数据通常由企业进行统一存储与管理,数据之间的业务逻辑及层次关系较明确,归为企业内部数据;而互联网上的市场环境数据、资源数据、评价数据以及供应商信息等外部数据,企业往往不做定期抓取与存储,仅在需求产生时通过互联网爬取,为企业外部数据。
对应地,大数据本体包括企业内部本体和企业外部本体。企业内部本体模型描述了企业内部信息系统、设备数据的概念术语,这些术语包括固定资产、物料、组织、人员、信息载体以及他们之间的关系。企业外部本体模型描述了互联网上采集到的工业大数据的概念术语,如供应商、财务报表、市场评价等。可根据不同的应用方向,择其中的若干概念进行描述与关联。
企业内部本的构建具体包括:
将企业内部的信息系统数据和设备数据转化为概念术语,获取各信息系统概念的层次关系和各设备概念的层次关系,如图1和图2所示;
对所述信息系统概念和设备概念进行整合和抽取,形成企业内部实体和信息的关联描述,构建企业内部本体,通过protégé本体建模工具实现本体模型开发与可视化。本体中包含了固定资产、人员、物料、信息载体、组织五个实体以及固定资产信息、人员信息、物料信息、信息载体信息、组织信息五个信息,实体与信息的层次关系图如图3和图4所示,概念之间的关联图如图5所示。
企业外部本体的构建具体包括:
将分布在互联网上的相关工业大数据转化为概念术语,获取各概念术语的关联描述,构建企业外部本体,通过protégé本体建模工具实现本体模型开发与可视化,如图6所示。
相似度计算模块包括语言学特征相似度计算单元、结构特征相似度计算单元和整合单元,语言学特征相似度计算单元用于采用基于VSM的余弦相似度计算方法对本体的语言学特征进行相似度计算;结构特征相似度计算单元用于采用基于RDF有向二部图的GMO算法对本体的结构特征进行相似度计算;整合单元根据所述语言学特征相似度计算单元和结构特征相似度计算单元的计算结果,整合获得最终相似度。相似度计算流程如图7所示。
本体融合的具体过程如图8所示,根据相似度计算结果,提出若干本体融合规则,进行本体中类、属性、关系的融合,形成涵盖了企业内部数据与企业外部数据的领域本体。本体融合包括以下步骤:
1)在映射对中找出类的映射对及相似度,存在两种情况:
I)对于待融合的两个本体,针对特定的类,存在唯一的映射对:此时保留该映射对并输出到步骤2);
II)对于待融合本体之一中的类,在另一待融合本体中,存在多个映射对(如本体O1中概念a与本体O2中的概念b与概念c的相似度都在设置的阈值之上,都会作为映射对被输出):此时选择相似度较高的映射对输出,并进行人工干预,判断剩余概念是否保留作为融合后本体的一个类独立存在。
2)在输出的类映射对的基础上,在映射对中找出关系(对象属性)的映射对,存在两种情况:
I)存在关系映射对:则进行该关系连接的子节点映射对的查找,若子节点相似(即映射对存在),则输出关系的映射对与子节点的映射对,分别保留类、对象属性、子节点映射对的一个实体为融合后领域本体中的类、对象属性;若子节点不相似(即映射对不存在),则输出关系的映射对,并记录子节点,,分别保留类、对象属性映射对的一个实体,添加子节点为融合后领域本体中的类、对象属性;
II)不存在关系映射对:记录关系与子节点,保留类映射对的一个实体,添加对象属性、子节点为融合后制造领域本体中的类、对象属性;
3)在类映射对的基础上,进行数值属性的相似度计算,也有两种情况:
I)存在数值属性的映射对:进行人工干预,进行属性的筛选,分别保留类、数值属性映射对的一个实体为融合后制造领域本体中的类、数值属性;
II)不存在数值属性的映射对:记录数值属性,保留类映射对的一个实体,添加数值属性为融合后领域本体中的类、数值属性。
本体库构建模块在融合后的本体上进行实例数据绑定,将企业内部数据与互联网上抓取的工业大数据映射到本体上,形成工业大数据本体库,从而完成不同来源的工业大数据集成,为工业大数据分析以及创新性应用提供支撑。
如图9所示,工业大数据本体库生成具体为,
1)根据融合后的本体模型,以及数据的存储结构,利用D2RQ映射语言制定映射规则。
2)根据1)中制定的映射规则,编写映射文件。
3)采用JENA开发平台,调用D2RQ映射引擎,输入本体模型文件和D2RQ映射文件,将企业内部数据与企业外部数据映射成本体实例数据,生成工业大数据本体库。
以上详细描述了本发明的较佳具体实施例。应当理解,本领域的普通技术人员无需创造性劳动就可以根据本发明的构思作出诸多修改和变化。因此,凡本技术领域中技术人员依本发明的构思在现有技术的基础上通过逻辑分析、推理或者有限的实验可以得到的技术方案,皆应在由权利要求书所确定的保护范围内。

Claims (8)

1.一种基于本体融合的工业大数据集成系统,其特征在于,包括:
大数据本体构建模块,用于利用工业大数据构建大数据本体;
相似度计算模块,用于基于本体的语言学特征与结构特征,计算大数据本体中的概念进行相似度计算;
本体融合模块,用于根据相似度计算结果,进行本体融合,获得融合后的本体模型;
本体库构建模块,用于根据融合后的本体模型,将企业内部数据与企业外部数据映射成本体实例数据,生成工业大数据本体库,实现数据集成。
2.根据权利要求1所述的基于本体融合的工业大数据集成系统,其特征在于,所述大数据本体包括企业内部本体和企业外部本体。
3.根据权利要求2所述的基于本体融合的工业大数据集成系统,其特征在于,所述企业内部本的构建具体包括:
将企业内部的信息系统数据和设备数据转化为概念术语,获取各信息系统概念的层次关系和各设备概念的层次关系;
对所述信息系统概念和设备概念进行整合和抽取,形成企业内部实体和信息的关联描述,构建企业内部本体。
4.根据权利要求2所述的基于本体融合的工业大数据集成系统,其特征在于,所述企业外部本体的构建具体包括:
将分布在互联网上的相关工业大数据转化为概念术语,获取各概念术语的关联描述,构建企业外部本体。
5.根据权利要求1所述的基于本体融合的工业大数据集成系统,其特征在于,所述大数据本体通过protégé本体建模工具实现本体可视化。
6.根据权利要求1所述的基于本体融合的工业大数据集成系统,其特征在于,所述相似度计算模块包括:
语言学特征相似度计算单元,用于采用基于VSM的余弦相似度计算方法对本体的语言学特征进行相似度计算;
结构特征相似度计算单元,用于采用基于RDF有向二部图的GMO算法对本体的结构特征进行相似度计算;
整合单元,根据所述语言学特征相似度计算单元和结构特征相似度计算单元的计算结果,整合获得最终相似度。
7.根据权利要求1所述的基于本体融合的工业大数据集成系统,其特征在于,所述本体融合具体包括以下步骤:
1)根据相似度计算结果,判断待融合的两个本体之间是否存在类映射对,若是,则执行步骤2);若否,则结束融合;
2)判断待融合的两个本体之间的类映射对是否唯一,若是,则直接执行步骤3)和4);若否,则选择相似度最高的一个类映射对后执行步骤3)和4);
3)判断类映射对中是否存在关系映射对,若是,则进行该关系的子节点映射对的查找,若子节点映射对存在,则输出关系映射对与子节点映射对,否则输出关系映射对,并记录子节点,添加为领域本体中的一个类;若否,则记录关系与子节点,添加为领域本体的对象属性与类;
4)判断类映射对中是否存在数值属性映射对,若是,则保留映射对中的一个数值属性,若否,则记录数值属性,添加领域本体中的数值属性。
8.根据权利要求1所述的基于本体融合的工业大数据集成系统,其特征在于,所述本体库构建模块调用D2RQ映射引擎将企业内部数据与企业外部数据映射成本体实例数据。
CN201811253578.2A 2018-10-25 2018-10-25 一种基于本体融合的工业大数据集成系统 Active CN109635119B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811253578.2A CN109635119B (zh) 2018-10-25 2018-10-25 一种基于本体融合的工业大数据集成系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811253578.2A CN109635119B (zh) 2018-10-25 2018-10-25 一种基于本体融合的工业大数据集成系统

Publications (2)

Publication Number Publication Date
CN109635119A true CN109635119A (zh) 2019-04-16
CN109635119B CN109635119B (zh) 2023-08-04

Family

ID=66066576

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811253578.2A Active CN109635119B (zh) 2018-10-25 2018-10-25 一种基于本体融合的工业大数据集成系统

Country Status (1)

Country Link
CN (1) CN109635119B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110795476A (zh) * 2019-10-16 2020-02-14 北京百分点信息科技有限公司 一种本体库的数据写入方法及装置
CN112163430A (zh) * 2020-10-29 2021-01-01 北京理工大学 面向mes系统的工业设备数据的本体融合方法和系统
CN113095540A (zh) * 2019-12-23 2021-07-09 财团法人工业技术研究院 数据整合方法及数据整合系统
CN116383345A (zh) * 2023-06-05 2023-07-04 中国医学科学院医学信息研究所 本体融合的方法、装置、电子设备及存储介质

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102542027A (zh) * 2011-12-22 2012-07-04 北京航空航天大学深圳研究院 一种基于关系模式学习本体的数据集成系统的构建方法
CN104182454A (zh) * 2014-07-04 2014-12-03 重庆科技学院 基于领域本体构建的多源异构数据语义集成的模型及方法
CN104239660A (zh) * 2013-06-08 2014-12-24 北京航空航天大学 云制造模式下基于动态本体的知识融合方法
CN104699767A (zh) * 2015-02-15 2015-06-10 首都经济贸易大学 一种面向中文语言的大规模本体映射方法
CN105701193A (zh) * 2016-01-11 2016-06-22 同济大学 一种交通大数据动态信息快速搜索方法及其应用
CN105808734A (zh) * 2016-03-10 2016-07-27 同济大学 一种基于语义网的钢铁制造过程知识间隐性关系获取方法
CN108268883A (zh) * 2016-12-31 2018-07-10 上海交通大学 基于开放数据的移动端信息模板自构建系统
CN108647318A (zh) * 2018-05-10 2018-10-12 北京航空航天大学 一种基于多源数据的知识融合方法

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102542027A (zh) * 2011-12-22 2012-07-04 北京航空航天大学深圳研究院 一种基于关系模式学习本体的数据集成系统的构建方法
CN104239660A (zh) * 2013-06-08 2014-12-24 北京航空航天大学 云制造模式下基于动态本体的知识融合方法
CN104182454A (zh) * 2014-07-04 2014-12-03 重庆科技学院 基于领域本体构建的多源异构数据语义集成的模型及方法
CN104699767A (zh) * 2015-02-15 2015-06-10 首都经济贸易大学 一种面向中文语言的大规模本体映射方法
CN105701193A (zh) * 2016-01-11 2016-06-22 同济大学 一种交通大数据动态信息快速搜索方法及其应用
CN105808734A (zh) * 2016-03-10 2016-07-27 同济大学 一种基于语义网的钢铁制造过程知识间隐性关系获取方法
CN108268883A (zh) * 2016-12-31 2018-07-10 上海交通大学 基于开放数据的移动端信息模板自构建系统
CN108647318A (zh) * 2018-05-10 2018-10-12 北京航空航天大学 一种基于多源数据的知识融合方法

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110795476A (zh) * 2019-10-16 2020-02-14 北京百分点信息科技有限公司 一种本体库的数据写入方法及装置
CN110795476B (zh) * 2019-10-16 2022-03-08 北京百分点科技集团股份有限公司 一种本体库的数据写入方法及装置
CN113095540A (zh) * 2019-12-23 2021-07-09 财团法人工业技术研究院 数据整合方法及数据整合系统
CN112163430A (zh) * 2020-10-29 2021-01-01 北京理工大学 面向mes系统的工业设备数据的本体融合方法和系统
CN116383345A (zh) * 2023-06-05 2023-07-04 中国医学科学院医学信息研究所 本体融合的方法、装置、电子设备及存储介质
CN116383345B (zh) * 2023-06-05 2023-08-22 中国医学科学院医学信息研究所 本体融合的方法、装置、电子设备及存储介质

Also Published As

Publication number Publication date
CN109635119B (zh) 2023-08-04

Similar Documents

Publication Publication Date Title
Bordogna et al. A fuzzy object‐oriented data model for managing vague and uncertain information
Cobo et al. SciMAT: A new science mapping analysis software tool
Selma et al. Ontology-based structured web data warehouses for sustainable interoperability: requirement modeling, design methodology and tool
CN109635119A (zh) 一种基于本体融合的工业大数据集成系统
AU2020380139B2 (en) Data preparation using semantic roles
El-Gohary et al. Merging architectural, engineering, and construction ontologies
de Vasconcelos et al. An organisational memory information system using ontologies
Bastinos et al. Multi-criteria decision making in ontologies
De Tré et al. Handling veracity in multi-criteria decision-making: a multi-dimensional approach
Saeidlou et al. An ontology-based intelligent data query system in manufacturing networks
Partridge et al. Formalization of the classification pattern: survey of classification modeling in information systems engineering
Arenas et al. Temporal regular path queries
CN115577519A (zh) 基于本体和知识图谱的双层次多重时空耦合建模方法
Carniel et al. fsr: An R package for fuzzy spatial data handling
Yuan et al. Knowledge fusion method based on fuzzy set theory
Shi Cloud manufacturing service recommendation model based on GA-ACO and carbon emission hierarchy
Cheng et al. Representing and reasoning fuzzy spatio-temporal knowledge with description logics: A survey
Labella et al. Extending the linguistic decision suite FLINTSTONES to deal with comparative linguistic expressions with symbolic translation information
Esnaola-Gonzalez An ontology-based approach for making machine learning systems accountable
Simov et al. Accessing linked open data via a common ontology
CN111291132A (zh) 面向智慧旅游的文物领域本体构建及分析方法
De Tré et al. Soft computing in database and information management
Goonetillake et al. A hybrid approach towards optimisation of data and knowledge management through cooperation of database and ontology
Frimpong Ontology matching algorithms for data model alignment in big data
Bai et al. Querying multi-source heterogeneous fuzzy spatiotemporal data

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant