CN107862078A - 一种基于元数据的云数据中心系统架构 - Google Patents

一种基于元数据的云数据中心系统架构 Download PDF

Info

Publication number
CN107862078A
CN107862078A CN201711223252.0A CN201711223252A CN107862078A CN 107862078 A CN107862078 A CN 107862078A CN 201711223252 A CN201711223252 A CN 201711223252A CN 107862078 A CN107862078 A CN 107862078A
Authority
CN
China
Prior art keywords
data
metadata
cloud
data center
cloud data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201711223252.0A
Other languages
English (en)
Inventor
张军
李锋
张美华
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Blue Silk Association Intelligent Engineering Co Ltd
Original Assignee
Shanghai Blue Silk Association Intelligent Engineering Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Blue Silk Association Intelligent Engineering Co Ltd filed Critical Shanghai Blue Silk Association Intelligent Engineering Co Ltd
Priority to CN201711223252.0A priority Critical patent/CN107862078A/zh
Publication of CN107862078A publication Critical patent/CN107862078A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/283Multi-dimensional databases or data warehouses, e.g. MOLAP or ROLAP
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/25Integrating or interfacing systems involving database management systems
    • G06F16/254Extract, transform and load [ETL] procedures, e.g. ETL data flows in data warehouses

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开一种基于元数据的云数据中心系统架构。架构的特征为,元数据信息读取,进行数据抽取、净化,并载入云数据中心;通过对云数据中心的数据,进行聚合处理,为数据仓库提供数据;从数据仓库中抽取相应的特定元数据,形成数据集市;将知识库的元数据,通过匹配与合并逻辑,与业务系统的字典数据进行映射,提供统一的分析口径和数据服务。

Description

一种基于元数据的云数据中心系统架构
技术领域
本发明涉及一种基于元数据的云数据中心系统架构
背景技术
随着公有云平台和私有云平台的流行,数据集成问题越来越重要。以往存储在企业内部的信息,现在要分散在不同的公有云平台上。这些信息,要进行广泛的共享。企业内部部署的系统、公有云平台上部署的系统,彼此之间都需要共享信息。
到目前为止,数据集成焦点还集中于现有的集成技术,包括传统的和非传统的。所执行的任务包括:数据复制、语义解析、数据清洗、海量数据迁移。这些技术帮助企业在云-云之间、云-企业之间,或者企业-企业之间传输数据,以支持核心业务流程。
随着云计算技术的成熟,数据集成将呈现新的形式、扮演新的角色。数据在云上存储,和在非云系统上存储的方法不同。新的数据集成的功能应能够分别处理这两种存储方法,并高效地进行数据结构和内容的处理,从而让目标系统如同访问本地数据一样。
海量数据迁移包括ETL(抽取-转换-加载)功能,并包括海量数据的定时迁移、内容和结构的变更,以满足目标系统,例如云数据仓库的需要。数据清洗技术,使数据集成过程中能够去掉或者改正错误和不准确的数据。
数据仓库是面向主题、集成、反映历史变化和不可更新的数据集合,它被用于支持决策过程管理和商业智能。同时,数据仓库也为建立数据集市提供了数据来源。数据集市是一种数据仓库,它的范围有限,是为特定终端用户群的决策应用而制定的。
知识库是知识库子系统的核心,知识库中存储的是那些既不能用数据表示,也不能用模型方法描述的专家知识和经验,也就是决策专家的决策知识和经验知识,同时也包括一些特定问题领域的专门知识,使知识库具有从已知事实推出新事实的机理。
元数据是对某个潜在信息性对象做出的陈述。元数据的模式指一个规则集,规定允许进行哪些类型的主谓宾陈述以及如何做出这样的陈述。在元数据模式中,一个元素是关于某种资源做出的陈述,同时也可以用来命名资源的某种属性。值是分配给某个元素的数据。
本发明提供了一种基于元数据的云数据中心系统架构。架构的特征为,元数据信息读取,进行数据抽取、净化,并载入云数据中心;通过对云数据中心的数据,进行聚合处理,为数据仓库提供数据;从数据仓库中抽取相应的特定元数据,形成数据集市;将知识库的元数据,通过匹配与合并逻辑,与业务系统的字典数据进行映射,提供统一的分析口径和数据服务。
发明内容
本发明的目的在于提供一种基于元数据的云数据中心系统架构。本发明包括以下特征:
发明技术方案
1.一种基于元数据的云数据中心系统架构,架构的特征:
1)元数据信息读取,进行数据抽取、净化,并载入云数据中心;
2)通过对云数据中心的数据,进行聚合处理,为数据仓库提供数据;
3)从数据仓库中抽取相应的特定元数据,形成数据集市;
4)将知识库的元数据,通过匹配与合并逻辑,与业务系统的字典数据进行映射,提供统一的分析口径和数据服务。
附图说明
附图1是基于元数据的云数据中心系统架构图。
具体实施方式
这种基于元数据的云数据中心系统架构,包括如下步骤特征:
1)元数据信息读取,进行数据抽取、净化,并载入云数据中心;
2)通过对云数据中心的数据,进行聚合处理,为数据仓库提供数据;
3)从数据仓库中抽取相应的特定元数据,形成数据集市;
4)将知识库的元数据,通过匹配与合并逻辑,与业务系统的字典数据进行映射,提供统一的分析口径和数据服务。

Claims (1)

1.一种基于元数据的云数据中心系统架构,架构的特征:
1)元数据信息读取,进行数据抽取、净化,并载入云数据中心;
2)通过对云数据中心的数据,进行聚合处理,为数据仓库提供数据;
3)从数据仓库中抽取相应的特定元数据,形成数据集市;
4)将知识库的元数据,通过匹配与合并逻辑,与业务系统的字典数据进行映射,提供统一的分析口径和数据服务。
CN201711223252.0A 2017-11-29 2017-11-29 一种基于元数据的云数据中心系统架构 Pending CN107862078A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711223252.0A CN107862078A (zh) 2017-11-29 2017-11-29 一种基于元数据的云数据中心系统架构

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711223252.0A CN107862078A (zh) 2017-11-29 2017-11-29 一种基于元数据的云数据中心系统架构

Publications (1)

Publication Number Publication Date
CN107862078A true CN107862078A (zh) 2018-03-30

Family

ID=61704356

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711223252.0A Pending CN107862078A (zh) 2017-11-29 2017-11-29 一种基于元数据的云数据中心系统架构

Country Status (1)

Country Link
CN (1) CN107862078A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021056338A1 (zh) * 2019-09-26 2021-04-01 西门子股份公司 用于向应用程序提供云数据的方法及装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101566981A (zh) * 2008-04-24 2009-10-28 长沙创智天马财务软件有限公司 分析处理系统中建立动态虚拟数据仓库的方法
CN103873546A (zh) * 2012-12-17 2014-06-18 国际商业机器公司 控制存储系统中区域存储中心间的数据存储的方法和装置
CN104115144A (zh) * 2011-12-12 2014-10-22 安大略理工大学 用于多维时域和相关数据挖掘框架、分析和子分组的系统、方法和计算机程序
CN105574667A (zh) * 2015-12-15 2016-05-11 中广核工程有限公司 核电设计数据集成方法及系统

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101566981A (zh) * 2008-04-24 2009-10-28 长沙创智天马财务软件有限公司 分析处理系统中建立动态虚拟数据仓库的方法
CN104115144A (zh) * 2011-12-12 2014-10-22 安大略理工大学 用于多维时域和相关数据挖掘框架、分析和子分组的系统、方法和计算机程序
CN103873546A (zh) * 2012-12-17 2014-06-18 国际商业机器公司 控制存储系统中区域存储中心间的数据存储的方法和装置
CN105574667A (zh) * 2015-12-15 2016-05-11 中广核工程有限公司 核电设计数据集成方法及系统

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021056338A1 (zh) * 2019-09-26 2021-04-01 西门子股份公司 用于向应用程序提供云数据的方法及装置

Similar Documents

Publication Publication Date Title
US11200240B2 (en) Techniques for ranking content item recommendations
JP7170779B2 (ja) 自動的な意図のマイニング、分類、及び配置のための方法及びシステム
US20190332921A1 (en) Decentralized storage structures and methods for artificial intelligence systems
US11068439B2 (en) Unsupervised method for enriching RDF data sources from denormalized data
US20240338389A1 (en) System and method for smart categorization of content in a content management system
US10055410B1 (en) Corpus-scoped annotation and analysis
Hammad et al. Big data analysis and storage
KR102485129B1 (ko) 정보 푸시 방법, 장치, 기기 및 저장매체
US10885065B2 (en) Data convergence
US10936625B2 (en) Progressive optimization for implicit cast predicates
US20170212930A1 (en) Hybrid architecture for processing graph-based queries
JPWO2012147428A1 (ja) テキストクラスタリング装置、テキストクラスタリング方法、およびプログラム
US10747824B2 (en) Building a data query engine that leverages expert data preparation operations
US20190146636A1 (en) Generating predicted reactions of a user
US10331723B2 (en) Messaging digest
CN111177462B (zh) 视频分发时效的确定方法和装置
US20170124090A1 (en) Method of discovering and exploring feature knowledge
CN106570151A (zh) 一种海量文件的数据收集处理方法及系统
KR20180077830A (ko) 비공유 아키텍처 기반의 분산 스트림 처리 엔진에서 관계형 질의를 처리하는 방법, 이를 수행하기 위한 기록 매체 및 장치
CN112015866A (zh) 用于生成同义文本的方法、装置、电子设备及存储介质
CN111125332B (zh) 计算词的tf-idf值的方法、装置、设备及存储介质
CN107862078A (zh) 一种基于元数据的云数据中心系统架构
CN107958053A (zh) 一种基于元数据的云数据中心系统原型
CN103699522A (zh) 基于混合主题的文本标注方法及系统
JP2021531540A (ja) マルチソース型の相互運用性および/または情報検索の最適化

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20180330