CN101329682B - 一种分布异构信息资源集成方法 - Google Patents

一种分布异构信息资源集成方法 Download PDF

Info

Publication number
CN101329682B
CN101329682B CN2008101169702A CN200810116970A CN101329682B CN 101329682 B CN101329682 B CN 101329682B CN 2008101169702 A CN2008101169702 A CN 2008101169702A CN 200810116970 A CN200810116970 A CN 200810116970A CN 101329682 B CN101329682 B CN 101329682B
Authority
CN
China
Prior art keywords
information
data
information resources
catalogue
database
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN2008101169702A
Other languages
English (en)
Other versions
CN101329682A (zh
Inventor
李国栋
柳长安
刘琳
赵娜
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
North China Electric Power University
Original Assignee
North China Electric Power University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by North China Electric Power University filed Critical North China Electric Power University
Priority to CN2008101169702A priority Critical patent/CN101329682B/zh
Publication of CN101329682A publication Critical patent/CN101329682A/zh
Application granted granted Critical
Publication of CN101329682B publication Critical patent/CN101329682B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明属于信息处理技术领域,尤其涉及一种分布异构信息资源集成方法。该方法通过信息资源提供者端和信息资源汇集端的操作,实现分布异构信息资源的集成和共享,其实现步骤如下:(1)信息资源提供者端依次执行:异构数据发现、元数据配置、目录生成、目录融合、数据封装以及数据上传,即将封装好的数据以数据包的形式上传到信息资源汇集端;(2)信息资源汇集端收到信息资源提供者端传来的数据包后,进行解压、配置文件解析和数据存储。本方法充分考虑结构的灵活性和扩展性,解决数据库种类异构和数据表异构,解决分布式信息资源的集中存储或分布管理,实现分布异构信息资源的统一目录存储,解决了日益严重的“信息孤岛”问题,有效完成了分布异构信息资源的集成和共事。

Description

一种分布异构信息资源集成方法
技术领域
本发明属于信息处理技术领域,尤其涉及一种分布异构信息资源集成方法。
背景技术
随着我国信息产业技术的发展,网络信息资源数量剧增,资源异构、分散、不规范的问题愈加突出,资源的分类体系也不统一,各个数据库、应用系统以孤岛形式独立运作,跨平台、跨领域、跨地域的信息资源整合与共享困难重重。现有技术并不能够较好的解决上述问题,而且现有解决方案的灵活性和扩展性不强。
发明内容
鉴于现有技术的不足,本发明提出一种分布异构信息资源集成方法,目的是解决分布异构信息资源的集成及共享问题。该方法通过系统处理,实现分布异构信息资源的集中式存储或分布式管理,并实现统一的分类及共享。
所述分布异构信息资源集成方法,其技术方案为:通过信息资源提供者端和信息资源汇集端的操作,实现分布异构信息资源的集成和共享,所述方法的实现步骤如下:
(1)信息资源提供者端依次执行:异构数据发现、元数据配置、目录生成、目录融合、数据封装以及数据上传,即将封装好的数据以数据包的形式上传到信息资源汇集端;
(2)所述信息资源汇集端收到所述信息资源提供者端传来的数据包后,进行解压、配置文件解析和数据存储。
所述异构数据发现为:通过判别数据库的类型,加载不同数据库驱动程序,屏蔽数据库系统的异构性,并通过数据表字段描述信息的填写和关键字段的选取,屏蔽数据库表的异构性。
所述方法能够识别的异构数据库系统包括SQL Server数据库、Oracle数据库、MySQL数据库、DB2数据库和Sybase数据库等,数据库类型可以通过加载不同的数据库驱动来扩充。
所述元数据配置实现对信息资源的元描述,从宏观的角度解决信息资源的异构问题,并为信息资源汇集后对数据的查询和获取提供支持。
所述目录生成为信息资源提供者提供构建自主目录服务的途径,帮助信息资源提供者创建目录,并对信息资源提供者的数据文件进行归类;目录融合采用集中式或分布式的融合方法,实现信息资源提供者自主构建的目录与信息资源汇集端目录体系的融合和关联,最终实现对分布信息资源的统一管理。所述集中式融合为将数据表连同数据表间的目录关系一并提交到信息资源汇集端;所述分布式融合为只将数据表的目录关系提交到信息资源汇集端,而数据表仍然在信息资源提供者端存储。
所述数据封装为将信息资源提供者填写的配置文件和提取的数据文件或目录信息进行压缩和打包,数据上传是通过FTP的数据传输方法将数据包上传到信息资源汇集端。
所述数据包解压为对接收到的信息资源提供者上传的数据包进行解压,从中获得数据存储及目录融合所需的配置信息,为实现信息资源的存储做准备。
所述配置文件解析为将解压后的配置文件进行解析,提取元数据配置信息、中英文配置信息、对应字段描述配置信息及目录融合配置信息,为元数据、实体数据及目录存储提供支持。
所述数据存储为通过分析元数据配置信息、中英文配置信息和对应字段描述配置信息,实现对元数据和实体数据的存储;通过分析用户目录与系统目录的关联关系,建立关联关系表,进行数据或目录的存储,实现目录融合。
通过以上过程,最终实现对分布异构信息资源的集成和共享。
本发明的有益效果:本方法充分考虑结构的灵活性和扩展性,屏蔽各个节点数据库系统的异构性,将分布异构的信息资源按照统一的分类汇集起来,并进行统一的目录存储,以实现信息资源的高度共享,有效解决了数据库种类异构和数据表异构以及分布式信息资源的集中存储或分布管理,在一定程度上解决了目前日益严重的“信息孤岛”问题,实现分布异构信息资源的集成。
附图说明
图1为本发明分布异构信息资源集成方法结构示意图;
图2为本发明分布异构信息资源集成方法图形化实例过程图。
具体实施方式
下面结合附图说明此模型的具体实施方式:
图1为本发明分布异构信息资源集成方法结构示意图,其中,101为信息资源提供者端,102为信息资源汇集端。
本方法的流程图如图1所示,图中对本方法的具体实现过程进行了图形化的表示:信息资源提供者端101依次完成异构数据发现、元数据配置、目录生成融合和数据封装,然后通过FTP上传方式将打包好的数据上传到信息资源汇集端102,信息资源汇集端将数据包进行解压、解析数据文件,最后完成数据的存储,最终实现分布异构信息资源的共享。
图2为本发明采用集中式融合方法进行分布异构信息资源集成的图形化实例过程图。
其中,201为信息资源提供者端,202为信息资源汇集端,203为各类分布异构数据库,204为数据库连接,205为信息资源提供者,206为信息资源配置,207为关键字段选取,208为中英文描述,209为元数据配置,210为目录生成及融合,211为数据封装,212为被封装的配置文件,213为被封装的数据文件,214为压缩的数据包,215为解压后的配置文件及数据文件,216为所提交数据表详细描述信息,217为所提交数据表字段列表,218为用户目录结构描述,219为数据文件,220为信息资源汇集端数据表,221为目录关系表,222为关键字段信息表,223为资源信息表,224为元数据配置表,225为实体数据表,226为信息资源汇集端数据库。
现选取SQL Server2000数据库中的数据表“树木”为例对本方法具体实施方式进行阐述:
1)异构数据发现
针对不同类型数据库系统,通过加载不同数据库驱动程序的方法实现对异构数据库屏蔽。信息资源提供者端首先定制数据库连接,通过输入数据库服务器IP、数据库名等连接到相应数据库;选定集中式融合方法,利用数据库查询语句获取数据表中的数据资源,并将查询到的结果集写入到数据文件中。通过数据表字段描述信息的填写和关键字段的选取,屏蔽数据表的异构。
选取数据表“树木”,选取如下关键字段:
信息标题:name;
信息描述:description。
然后对本数据表的各个字段进行中英文对照描述:
id:编号;
name:学名;
province:出产地;
description:描述;
class:分类描述。
2)元数据配置
元数据配置需要数据资源提供者填写数据资源的标题、主题、创始人、描述、发布者、来源、描述语言等信息,并将信息记录到用户目录配置文件中。
对选取的数据表“树木”进行如下元数据配置:
标题:树木数据库;
主题:树木数据库;
创始人:华北电力大学;
描述:描述各种树木信息;
发布者:华北电力大学;
来源:北京市;
描述语言:中文。
3)目录生成融合
目录生成融合利用图形化目录框架建立目录树,信息资源提供者可以对自己的信息资源的结构进行组织,并且通过对目录树节点拖拽的方式实现信息资源提供者自主构建的目录与信息汇集端目录体系的融合和关联,并将关联关系记录到配置文件中。
如在刚刚建立的信息资源“树木数据库”根目录下建立新的节点“园林树木”,完成后拖动该节点到系统目录的国民经济行业分类->农、林、牧、渔业->林业子目录下。
4)数据封装上传
数据封装上传为资源提供者填写的配置文件和提取的数据文件进行压缩和打包,并且通过FTP的数据传输方法将数据包上传到信息资源汇集端。
5)数据包解压
数据包解压通过解压程序实现对上传数据包的解压。
6)数据解析
数据解析通过分析配置文件标示各个数据表的结构及相互间的关联关系。
7)数据存储
数据存储通过调用存储过程实现,存储过程利用解析的配置文件获取相应信息,提取数据表的结构信息及相互间的关联关系,将数据按信息资源汇集端的目录结构存储。分析所述数据解析得到的详细描述信息、字段列表、用户目录结构描述等配置文件,根据目录结构描述将各表的目录关系记入目录关系表,从详细描述信息表中提取关键字段记入关键字段信息表,根据详细描述信息将每个数据表的描述信息记入资源信息表,从用户目录结构中提取元数据配置信息记入元数据表,根据字段列表及相应的数据文件还原实体数据表,为后续的资源数据展示提供数据准备。
以上实施例为基于本发明的技术特征,以集中式融合方法具体阐述发明。而本发明同样适用于采用分布式融合方法。采用分布式融合方法与集中式融合方法有以下不同:在异构数据发现过程中,应选择分布式目录融合方法;在数据封装上传时,不生成带有实体数据信息的相关文件;在数据包解压时,不生成带有实体数据信息的文件;在数据解析存储时,不执行实体数据表还原。而其他实施步骤与采用集中式融合方法相同,这里不再赘述。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应该以权利要求的保护范围为准。

Claims (2)

1.一种分布异构信息资源集成方法,其特征在于,通过信息资源提供者端和信息资源汇集端的操作,实现分布异构信息资源的集成和共享,所述方法的实现步骤如下:
(1)信息资源提供者端依次执行:异构数据发现、元数据配置、目录生成、目录融合、数据封装以及数据上传,即将封装好的数据以数据包的形式上传到信息资源汇集端;
(2)所述信息资源汇集端收到所述信息资源提供者端传来的数据包后,进行数据包解压、配置文件解析和数据存储;
所述异构数据发现通过判别数据库的类型,加载不同数据库驱动程序,屏蔽数据库系统的异构性,并通过数据表字段描述信息的填写和关键字段的选取,屏蔽数据库表的异构性;
所述元数据配置实现对信息资源的元描述,由数据资源提供者填写数据资源的信息,并将信息记录到用户目录配置文件中;
所述目录生成为信息资源提供者提供构建自主目录服务的途径,帮助信息资源提供者创建目录,并对信息资源提供者的数据文件进行归类;所述目录融合采用集中式或分布式的融合方法,实现信息资源提供者自主构建的目录与信息资源汇集端目录体系的融合和关联,实现对分布信息资源的统一管理;
所述数据封装为将信息资源提供者填写的配置文件和提取的数据文件或目录信息进行压缩和打包;
所述数据上传是通过FTP的数据传输方法将数据包上传到信息资源汇集端;
所述数据包解压为对接收到的信息资源提供者上传的数据包进行解压,从中获得数据存储及目录融合所需的配置信息,为实现信息资源的存储做准备;
所述配置文件解析为将解压后的配置文件进行解析,提取元数据配置信息、中英文配置信息、对应字段描述配置信息及目录融合配置信息,为元数据、实体数据及目录存储提供支持;
所述数据存储为通过分析元数据配置信息、中英文配置信息和对应字段描述配置信息,实现对元数据和实体数据的存储;通过分析用户目录与系统目录的关联关系,建立关联关系表,进行数据或目录的存储,实现目录融合。
2.根据权利要求1所述的分布异构信息资源集成方法,其特征在于,所述方法能够识别的异构数据库系统包括SQL Server数据库、Oracle数据库、MySQL数据库、DB2数据库和Sybase数据库,数据库类型通过加载不同的数据库驱动来扩充。
CN2008101169702A 2008-07-22 2008-07-22 一种分布异构信息资源集成方法 Expired - Fee Related CN101329682B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2008101169702A CN101329682B (zh) 2008-07-22 2008-07-22 一种分布异构信息资源集成方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2008101169702A CN101329682B (zh) 2008-07-22 2008-07-22 一种分布异构信息资源集成方法

Publications (2)

Publication Number Publication Date
CN101329682A CN101329682A (zh) 2008-12-24
CN101329682B true CN101329682B (zh) 2010-04-07

Family

ID=40205492

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2008101169702A Expired - Fee Related CN101329682B (zh) 2008-07-22 2008-07-22 一种分布异构信息资源集成方法

Country Status (1)

Country Link
CN (1) CN101329682B (zh)

Families Citing this family (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101719135A (zh) * 2009-11-18 2010-06-02 上海众恒信息产业有限公司 一种政务资源目录控制系统及方法
CN101945126A (zh) * 2010-09-09 2011-01-12 中国林业科学研究院资源信息研究所 森林资源异构数据分布式管理系统
CN102289483B (zh) * 2011-08-02 2012-12-19 中国科学院计算机网络信息中心 面向全球变化研究的空间科学数据元数据自动汇聚方法
CN102254030B (zh) * 2011-08-02 2013-04-10 中国科学院计算机网络信息中心 一种面向全球变化研究的空间科学数据自动汇聚方法
CN102354342A (zh) * 2011-10-18 2012-02-15 浙江大学 一种个人健康档案显示方法和系统
CN102332059A (zh) * 2011-10-18 2012-01-25 浙江大学 一种个人生理信息建立方法和系统
CN103049482B (zh) * 2012-11-30 2015-12-09 国家电网公司 一种分布式异构系统中数据融合存储的实现方法
CN104267952B (zh) * 2014-09-25 2018-01-09 山东康威通信技术股份有限公司 一种基于结构化存储的文件打包方法
CN104881462B (zh) * 2015-05-22 2018-11-13 广东中标数据科技股份有限公司 元数据管理系统
CN105045912A (zh) * 2015-08-13 2015-11-11 浪潮通用软件有限公司 一种关系型数据库数据分发的方法
CN105548826A (zh) * 2015-12-02 2016-05-04 国网新疆电力公司电力科学研究院 多传感器数据融合的局放数据管理方法
CN106020772B (zh) * 2016-05-13 2018-03-27 中国人民解放军信息工程大学 异构系统中基于数据表精简技术的超越函数访存优化方法
CN105939259B (zh) * 2016-07-01 2019-08-20 锐捷网络股份有限公司 路由器的控制方法、装置及路由器
CN106528810B (zh) * 2016-11-18 2021-07-13 党玉龙 一种融合异构数据便于快速大数据分析的方法
CN106790521B (zh) * 2016-12-20 2020-11-06 深圳创新科技术有限公司 采用基于ftp的节点设备进行分布式组网的系统及方法
CN109214969B (zh) * 2017-06-30 2023-04-25 勤智数码科技股份有限公司 一种数据梳理系统和方法
CN108228692A (zh) * 2017-06-30 2018-06-29 勤智数码科技股份有限公司 一种目录动态更新方法及系统
CN108228693A (zh) * 2017-06-30 2018-06-29 勤智数码科技股份有限公司 一种异构数据源的封装方法
CN109218350B (zh) * 2017-06-30 2023-05-05 勤智数码科技股份有限公司 一种数据信息资源共享系统和方法
CN108280157B (zh) * 2018-01-15 2020-10-09 国网信息通信产业集团有限公司 数据信息集成系统
CN109933587B (zh) * 2019-02-26 2023-04-11 厦门市美亚柏科信息股份有限公司 基于目录注册的数据处理方法、装置、系统及存储介质
CN110362618B (zh) * 2019-06-26 2022-04-01 山东省科学院海洋仪器仪表研究所 一种分布式海洋在线监测数据的实时聚合系统及聚合方法
CN113590085B (zh) * 2020-04-30 2023-06-16 广东中砼物联网科技有限公司 多源异构数据的处理方法、计算机设备、存储介质
CN112035709A (zh) * 2020-08-25 2020-12-04 上海中通吉网络技术有限公司 资源目录的编排方法、高速读取方法、装置和设备
CN113687984A (zh) * 2021-08-24 2021-11-23 杭州迪普科技股份有限公司 Vpn分支设备的备份方法、装置及系统
CN114885044B (zh) * 2022-04-20 2023-08-18 中国西安卫星测控中心 面向测控设备异构监控数据包的自适应解析处理方法
CN117707026B (zh) * 2024-02-05 2024-06-07 中铁四局集团有限公司 基于多源异构系统的场景联动平台及其构建方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6446071B1 (en) * 1999-04-26 2002-09-03 International Business Machines Corporation Method and system for user-specific management of applications in a heterogeneous server environment
CN1687922A (zh) * 2005-05-30 2005-10-26 北京慧讯信息技术有限公司 分布式数据源数据集成系统及方法
CN101094173A (zh) * 2007-06-28 2007-12-26 上海交通大学 分布式异构环境下的数据交换集成系统

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6446071B1 (en) * 1999-04-26 2002-09-03 International Business Machines Corporation Method and system for user-specific management of applications in a heterogeneous server environment
CN1687922A (zh) * 2005-05-30 2005-10-26 北京慧讯信息技术有限公司 分布式数据源数据集成系统及方法
CN101094173A (zh) * 2007-06-28 2007-12-26 上海交通大学 分布式异构环境下的数据交换集成系统

Non-Patent Citations (6)

* Cited by examiner, † Cited by third party
Title
刘军,李冠宇,张俊,黄海.基于CORBA的异构数据集成系统中分布式目录服务的设计.微型机与应用 3.2003,(3),27-30.
刘军,李冠宇,张俊,黄海.基于CORBA的异构数据集成系统中分布式目录服务的设计.微型机与应用 3.2003,(3),27-30. *
朱爱华.分布式异构网格化系统的集成方法探讨和实践.计算机系统应用 5.2007,(5),1-4.
朱爱华.分布式异构网格化系统的集成方法探讨和实践.计算机系统应用 5.2007,(5),1-4. *
陈宏,曹健等.分布异构环境下的数据集成和交换方法及应用.微型电脑应用20 6.2004,20(6),13-18.
陈宏,曹健等.分布异构环境下的数据集成和交换方法及应用.微型电脑应用20 6.2004,20(6),13-18. *

Also Published As

Publication number Publication date
CN101329682A (zh) 2008-12-24

Similar Documents

Publication Publication Date Title
CN101329682B (zh) 一种分布异构信息资源集成方法
Schram et al. MySQL to NoSQL: data modeling challenges in supporting scalability
CN105989150B (zh) 一种基于大数据环境的数据查询方法及装置
CN102999537B (zh) 一种数据迁移系统和方法
CN106372176B (zh) 一种支持对嵌套文档进行统一sql查询的方法
CN101799826B (zh) 一种基于虚拟视图的网络化数据共享系统及方法
CN103064933B (zh) 数据查询方法及系统
CN104200402A (zh) 一种电网多个数据源的源数据发布方法及系统
CN103425726A (zh) 使用业务智能工具访问开放数据
CN102646039A (zh) 基于XML Schema的软件界面生成系统及方法
CN104573065A (zh) 一种基于元数据的报表展示引擎
CN103729463A (zh) 基于Lucene和Solr实现全文检索的方法
US20130191328A1 (en) Standardized framework for reporting archived legacy system data
CN105956932A (zh) 配用电数据融合方法和系统
Di Guida et al. The CMS condition database system
CN106528641A (zh) 一种数据存储方法、装置及通信网关机
CN108446145A (zh) 一种分布式文件自动加载mpp数据库方法
CN102722368A (zh) 一种基于文档树和消息泵的插件式软件设计方法
CN101799890A (zh) 证照数据处理方法和系统
CN102426588A (zh) 一种基于关键要素的产品协同设计支撑方法
Dawei et al. Research on the application of distributed key-value storage technology in computer database platform
CN107729410A (zh) 一种适用于电力设备大数据的数据库引擎
De Barros et al. Development of a Relational Database Oriented on the Common Information Model for Power Distribution Networks
CN106126644A (zh) 基于NoSQL数据库的录波文件存储方法
CN110019522A (zh) 基于xml的多源异构数据整合系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C17 Cessation of patent right
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20100407

Termination date: 20120722