CN102385635A - 一种基于本体模式的异构数据集成方法 - Google Patents

一种基于本体模式的异构数据集成方法 Download PDF

Info

Publication number
CN102385635A
CN102385635A CN2011104174742A CN201110417474A CN102385635A CN 102385635 A CN102385635 A CN 102385635A CN 2011104174742 A CN2011104174742 A CN 2011104174742A CN 201110417474 A CN201110417474 A CN 201110417474A CN 102385635 A CN102385635 A CN 102385635A
Authority
CN
China
Prior art keywords
ontology
database
heterogeneous
heterogeneous data
semantic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2011104174742A
Other languages
English (en)
Inventor
李朝奎
吴柏燕
王文杰
高振记
李拥
冯志元
陶能成
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Henan University of Science and Technology
Hunan University of Science and Technology
Original Assignee
Hunan University of Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hunan University of Science and Technology filed Critical Hunan University of Science and Technology
Priority to CN2011104174742A priority Critical patent/CN102385635A/zh
Publication of CN102385635A publication Critical patent/CN102385635A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于本体模式的异构数据集成方法。它包括以下步骤:使用语义映射编辑工具配置异构数据源资源的访问信息;根据数据库资源注册文件获取数据库模式信息,根据不同的模式信息用本体的建模语言构建各异构数据源的局部本体;按照本体模式描述文件获取集成平台数据库的模式信息,并图形化地显示出来供用户操作,采用OWL作为本体的描述语言构建全局本体;将局部本体同全局本体作为输入,按照语义关联关系将本体中的元素建立相应的语义关系。本发明可以使用户完全不用考虑异构数据库结构的差异就可以得到所需要的数据,并具有可行性、可扩展性、透明性、普遍性的优点。

Description

一种基于本体模式的异构数据集成方法
技术领域
本发明涉及一种分布式异构数据库的数据集成方法,特别涉及一种基于本体模式的异构数据集成方法。
背景技术
随着信息和网络时代的飞速发展,各行业领域都已积累了海量的行业数据,而且这些数据仍在呈指数级不断增长的趋势。实现这些数据最大共享与集成应用对于行业的发展,减少重复性建设,节约人力物力资源,以最小的成本赢得最大化的利润都具有十分重要的意义。然而由于行业在长期的发展过程中,由于不同的发展时期和特殊需求采用了不同模式来描述数据,并使用各种不同的模型数据库来存储。这为行业部门之间、甚至行业之间的数据共享和集成造成了极大的困难。
发明内容
为了解决现有行业之间不同数据库数据共享存在的上述技术问题,本发明提供一种基于本体模式的异构数据集成方法。本发明引入“本体”作为公共语义模型,通过本体映射在异构数据间建立语义映射关系,屏蔽语义异构有效地解决了语义异构问题。
本发明解决上述技术问题的技术方案包括以下步骤:
(1)    配置各异构数据源资源属性:使用语义映射编辑工具配置异构数据源资源的访问信息;
(2)    异构数据库局部本体构建:根据数据库资源注册文件获取数据库模式信息,根据不同的模式信息用本体的建模语言构建各异构数据源的局部本体;
(3)    全局本体构建:按照本体模式描述文件获取集成平台数据库的模式信息,并图形化地显示出来供用户操作,采用OWL作为本体的描述语言构建全局本体;
(4)     局部本体同全局本体的语义映射:将局部本体同全局本体作为输入,按照语义关联关系将本体中的元素建立相应的语义关系。
上述的基于本体模式的异构数据集成方法中,所述的步骤(4)中构建局部本体同全局本体的语义映射步骤如下:
构建全局本体的值属性与局部本体的值属性间的映射关系(1:1、1:n、n:1、1:null、n:m);
构建全局本体模式的对象属性同异构数据库中数据表间的连接关系之间的映射关系(1:1、1:n)。
本发明的技术效果在于:本发明根据不同的模式信息用本体的建模语言构建各异构数据源的局部本体及全局本体,并按照语义关联关系将本体中的元素建立相应的语义关系,这样可以解决了行业部门之间、甚至行业之间数据共享和集成的技术难题。
附图说明
附图1为本发明中基于本体异构数据集成模型。
附图2 为本发明中实施例的部分全局本体示意图。
附图3 为本发明中实施例的部分局部本体示意图。
附图4 为本发明中本体映射的流程图。
具体实施方式
下面结合附图对本发明作进一步的说明。
附图1为本发明基于本体的异构数据库集成模型。
本集成方法的数据流程如附图1所示,图中对本方法的数据的具体流向过程进行了图形化的表示:通过对各异构数据库(结构化数据或半结构化数据)提取框架结构信息生成各局部本体模式,然后构建集成平台全局本体模式与各个局部本体模式间的映射关系。
配置异构数据源信息
使用语义映射编辑工具配置各个异构数据源数据库资源的访问信息:用户名、密码、IP地址、端口号、数据库名、数据库实例名等;
附图2和3为实例构建本体模式中一个实例,图2所示为全局模式中业务_污水处理厂信息在集成平台数据库中构建后地一个本体实例。图3所示为某异构数据库构建局部本体中污水处理厂信息的本体实例。
(一)   构建本体模式
局部本体是对异构数据源的语义描述,根据异构数据源模型构建。构建本体应遵循的原则:
清晰性、明确性和客观性:即本体应该采用自然语言对所定义术语给出明确的、客观的语义定义;
完全性:即所给出的定义是完整的,完全能表达所描述术语的含义;
一致性:即由术语得出的推论与术语本身的含义是相容的,不会产生矛盾;
最大单调可扩展性:即向本体中添加通用或专用的术语时,不需要修改其已有的概念定义和内容;
最小承诺:即对待建模对象给出尽可能少的约束。
1)    关系数据库构建本体
从关系数据库构建本体,关键在于分析关系模型中的信息结构,然后将其用本体来表达。关系数据库构建本体的方法:
关系模式的关系名映射到一个QWL:Class;
关系模式的普通属性的域映射到一个XSD:xsdDataType;
   关系模式的普通属性映射到一个OWL:DatatypeProperty,并对OWL:DatatypeProperty的rdfs:range 和 rdfs:domain 取值约束进行表示;
    关系模式中的外键映射为一个 OWL:ObjectProperty;
    创建两个 OWL:ObjectProperty 来表示两个关系之间的多对多关系。可以用OWL:inverserOf 定 义 这 两 个 OWL:ObjectProperty 互 逆 , 然 后 定 义OWL:ObjectProperty 的 rdfs:domain 和 rdfs:range。
2)    从XML文档构建本体
对于以XML半结构化文档形式的异构数据源,构建本体可以利用局部数据源的XMLSchema并依据相应的转化关系构建。
在XMLSchema中,元素和属性是基本的构成单位,元素能够被表达为简单类型和复杂类型,可以使用minLength和MaxLength来限制数据值得长度,minInclusive和maxInclusive来限制取值范围,使用key和keyref来描述数据间的主外键关系。
XMLSchema构建本体的方法:
    XMLSchema映射到一个本体中的元素;
   SimpleType映射到一个OWL:DatatypeProperty;
   ComplexType映射到一个OWL:Class;
   Attribute映射到一个OWL:DatatypeProperty。
(二)   全局本体同局部本体间的映射构建
映射关系的构建流程如附图4所示。映射将全局本体同一个或多个局部本体作为输入,遍历全局本体与各局部本体中语义关联的本体元素(概念、属性、关系)在语法距离、语义词典、结构、约束属性等方面的相似度。最终综合得到一个相似度值,若该相似度值大于给定的相似阈值就构建映射关系,若小于则不认为两者有相似映射关系。
在局部本体同全局本体之间,按照语义关联关系将本体中的元素(概念、属性、关系)建立相应的语义关系。全局本体的值属性与局部本体的值属性间的映射关系(1:1、1:n、n:1、1:null)。映射类型如表1。(O为全局本体,P为局部本体)
表1 映射模型
Figure 43190DEST_PATH_IMAGE001
本发明方法具有以下特点:
1.    异构数据源的多样性:本发明针对的异构数据源不单纯只是存储结构化数据的关系型数据库,而且包括存储半结构化数据的XML文档或文本文件。具有数据源多样性的特点;
2.    异构数据库的扩展性;本发明对异构数据源具有很好的扩展性,需要添加新的数据源时只需要对新加的数据源添加链接配置信息构建一个新的局部本体;
可视化映射:对于语义异构较复杂的映射关系提供用户可视化的界面来减少产生错误的映射的机会。

Claims (2)

1.一种基于本体模式的异构数据集成方法,包括以下步骤:
1)配置各异构数据源资源属性:使用语义映射编辑工具配置异构数据源资源的访问信息;
2)异构数据库局部本体构建:根据数据库资源注册文件获取数据库模式信息,根据不同的模式信息用本体的建模语言构建各异构数据源的局部本体;
3)全局本体构建:按照本体模式描述文件获取集成平台数据库的模式信息,并图形化地显示出来供用户操作,采用OWL作为本体的描述语言构建全局本体;
4)局部本体同全局本体的语义映射:将局部本体同全局本体作为输入,按照语义关联关系将本体中的元素建立相应的语义关系。
2.根据权利要求1所述的基于本体模式的异构数据集成方法,所述的步骤4)中构建局部本体同全局本体的语义映射步骤如下:
构建全局本体的值属性与局部本体的值属性间的映射关系为1:1、1:n、n:1、1:null、n:m;
构建全局本体模式的对象属性同异构数据库中数据表间的连接关系之间的映射关系为1:1、1:n。
CN2011104174742A 2011-12-14 2011-12-14 一种基于本体模式的异构数据集成方法 Pending CN102385635A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2011104174742A CN102385635A (zh) 2011-12-14 2011-12-14 一种基于本体模式的异构数据集成方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2011104174742A CN102385635A (zh) 2011-12-14 2011-12-14 一种基于本体模式的异构数据集成方法

Publications (1)

Publication Number Publication Date
CN102385635A true CN102385635A (zh) 2012-03-21

Family

ID=45825051

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2011104174742A Pending CN102385635A (zh) 2011-12-14 2011-12-14 一种基于本体模式的异构数据集成方法

Country Status (1)

Country Link
CN (1) CN102385635A (zh)

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102682122A (zh) * 2012-05-15 2012-09-19 北京科技大学 基于本体构建材料科学领域语义数据模型的方法
CN102789491A (zh) * 2012-07-03 2012-11-21 河海大学 一种可配置的数据订阅和发布系统及其方法
CN104361017A (zh) * 2014-10-17 2015-02-18 同济大学 一种基于统一语义理解的交通信息处理方法
CN108733793A (zh) * 2018-05-14 2018-11-02 北京大学 一种面向关系数据库的本体模型构造方法及系统
CN109063114A (zh) * 2018-07-27 2018-12-21 华南理工大学广州学院 能源云平台的异构数据集成方法、装置、终端及存储介质
CN109597925A (zh) * 2018-10-25 2019-04-09 同济大学 一种基于本体的供应商数据分析方法及分析系统
CN110019474A (zh) * 2017-12-19 2019-07-16 北京金山云网络技术有限公司 异构数据库中的同义数据自动关联方法、装置及电子设备
CN110795476A (zh) * 2019-10-16 2020-02-14 北京百分点信息科技有限公司 一种本体库的数据写入方法及装置
CN111858649A (zh) * 2020-08-05 2020-10-30 哈尔滨工业大学(威海) 一种基于本体映射的异构数据融合方法
CN112287124A (zh) * 2020-11-20 2021-01-29 华能(福建漳州)能源有限责任公司 一种基于人员信息验证本体论的互操作方法
CN112908441A (zh) * 2021-03-04 2021-06-04 文华学院 一种医疗平台的数据处理方法、装置以及处理设备
CN113360518A (zh) * 2021-06-07 2021-09-07 哈尔滨工业大学 一种基于多源异构数据的层次本体构造方法

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101149749A (zh) * 2007-10-29 2008-03-26 浙江大学 一种基于语义的异质异构关系型数据库的数据集成方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101149749A (zh) * 2007-10-29 2008-03-26 浙江大学 一种基于语义的异质异构关系型数据库的数据集成方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
雷琼: "《基于本体的异构数据集成研究》", 《中国优秀硕士学位论文全文数据库》, 31 July 2005 (2005-07-31), pages 5 - 6 *

Cited By (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102682122B (zh) * 2012-05-15 2014-11-26 北京科技大学 基于本体构建材料科学领域语义数据模型的方法
CN102682122A (zh) * 2012-05-15 2012-09-19 北京科技大学 基于本体构建材料科学领域语义数据模型的方法
CN102789491A (zh) * 2012-07-03 2012-11-21 河海大学 一种可配置的数据订阅和发布系统及其方法
CN102789491B (zh) * 2012-07-03 2016-03-16 河海大学 一种可配置的数据订阅和发布系统及其方法
CN104361017A (zh) * 2014-10-17 2015-02-18 同济大学 一种基于统一语义理解的交通信息处理方法
CN104361017B (zh) * 2014-10-17 2018-06-05 同济大学 一种基于统一语义理解的交通信息处理方法
CN110019474A (zh) * 2017-12-19 2019-07-16 北京金山云网络技术有限公司 异构数据库中的同义数据自动关联方法、装置及电子设备
CN108733793A (zh) * 2018-05-14 2018-11-02 北京大学 一种面向关系数据库的本体模型构造方法及系统
CN109063114B (zh) * 2018-07-27 2020-11-24 华南理工大学广州学院 能源云平台的异构数据集成方法、装置、终端及存储介质
CN109063114A (zh) * 2018-07-27 2018-12-21 华南理工大学广州学院 能源云平台的异构数据集成方法、装置、终端及存储介质
CN109597925A (zh) * 2018-10-25 2019-04-09 同济大学 一种基于本体的供应商数据分析方法及分析系统
CN110795476A (zh) * 2019-10-16 2020-02-14 北京百分点信息科技有限公司 一种本体库的数据写入方法及装置
CN110795476B (zh) * 2019-10-16 2022-03-08 北京百分点科技集团股份有限公司 一种本体库的数据写入方法及装置
CN111858649A (zh) * 2020-08-05 2020-10-30 哈尔滨工业大学(威海) 一种基于本体映射的异构数据融合方法
CN111858649B (zh) * 2020-08-05 2022-06-17 哈尔滨工业大学(威海) 一种基于本体映射的异构数据融合方法
CN112287124A (zh) * 2020-11-20 2021-01-29 华能(福建漳州)能源有限责任公司 一种基于人员信息验证本体论的互操作方法
CN112287124B (zh) * 2020-11-20 2024-02-06 华能(福建漳州)能源有限责任公司 一种基于人员信息验证本体论的互操作方法
CN112908441A (zh) * 2021-03-04 2021-06-04 文华学院 一种医疗平台的数据处理方法、装置以及处理设备
CN113360518A (zh) * 2021-06-07 2021-09-07 哈尔滨工业大学 一种基于多源异构数据的层次本体构造方法
CN113360518B (zh) * 2021-06-07 2023-03-21 哈尔滨工业大学 一种基于多源异构数据的层次本体构造方法

Similar Documents

Publication Publication Date Title
CN102385635A (zh) 一种基于本体模式的异构数据集成方法
Sevilla Ruiz et al. Inferring versioned schemas from NoSQL databases and its applications
Costa et al. Connecting building component catalogues with BIM models using semantic technologies: an application for precast concrete components
Li et al. Learning ontology from relational database
Vo et al. Transformation of uml class diagram into owl ontology
CN104200402A (zh) 一种电网多个数据源的源数据发布方法及系统
KR20080019439A (ko) Dbms 기반 지식 확장 및 추론 서비스 시스템 및 그방법
Čerāns et al. Rdb2owl: A RDB-to-RDF/OWL mapping specification language
Li et al. Graph-based semantic evolution for context information management platforms
Jetlund et al. Adapted rules for UML modelling of geospatial information for model-driven implementation as OWL ontologies
Aydinoğlu et al. Modelling and publishing geographic data with model-driven and linked data approaches: case study of administrative units in Turkey
Tong Mapping object-oriented database models into RDF (S)
Mountantonakis et al. Extending VoID for Expressing Connectivity Metrics of a Semantic Warehouse.
Herrera-Martín et al. A method for transferring BIM data into domain ontologies: A case study based on airport services
CN102930030A (zh) 基于本体的智能语义文献检索推理系统
Sarkar Conceptual level design of semi-structured database system: Graph-semantic based approach
Soussi et al. Graph database for collaborative communities
Khouri et al. LogLInc: LoG queries of linked open data investigator for cube design
Liu et al. The advanced data service architecture for modern enterprise information system
Ulutaş Karakol et al. Architecture for semantic web service composition in spatial data infrastructures
Bill et al. On Synergies between Model Transformations and Semantic Web Technologies.
Orsi Context based querying of dynamic and heterogeneous information sources.
Zeginis et al. Facilitating the exploitation of linked open statistical data: JSON-QB API requirements and design criteria
Taniguchi Understanding RDA as a DC application profile
Ramathilagam et al. A framework for owl dl based ontology construction from relational database using mapping and semantic rules

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C12 Rejection of a patent application after its publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20120321