CN103516809A - 一种高扩展、高性能的分布式存储体系结构 - Google Patents

一种高扩展、高性能的分布式存储体系结构 Download PDF

Info

Publication number
CN103516809A
CN103516809A CN201310494887.XA CN201310494887A CN103516809A CN 103516809 A CN103516809 A CN 103516809A CN 201310494887 A CN201310494887 A CN 201310494887A CN 103516809 A CN103516809 A CN 103516809A
Authority
CN
China
Prior art keywords
node
metadata
configuration
memory
architecture
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201310494887.XA
Other languages
English (en)
Inventor
陈大雅
李桂周
刘粉粉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Inspur Electronic Information Industry Co Ltd
Original Assignee
Inspur Electronic Information Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Inspur Electronic Information Industry Co Ltd filed Critical Inspur Electronic Information Industry Co Ltd
Priority to CN201310494887.XA priority Critical patent/CN103516809A/zh
Publication of CN103516809A publication Critical patent/CN103516809A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及计算机存储领域,公开了一种高扩展、高性能的分布式存储体系结构,包括存储节点,元数据节点,路由节点,配置节点,其中,以存储节点为核心,通过路由节点、元数据节点、配置信息节点的配合,简化复杂的存储协议,实现高扩展、高性能的分布式存储集群,并且实现简单可靠的负载均衡机制和高可用机制,其中,存储节点是体系的核心,元数据节点主要负责元数据的存储,元数据节点主要负责元数据的存储,配置节点存储集群的配置信息。本发明弥补了传统分布式存储系统的不足,使其体系结构所带来的高扩展、高性能、高可用等诸多特性,更加适用于大数据存储、云计算等需要存储海量数据的领域,因而具有非常广阔的发展前景。

Description

一种高扩展、高性能的分布式存储体系结构
技术领域
    本发明涉及计算机存储领域,具体涉及一种高扩展、高性能的分布式存储架构体系结构。
技术背景
存储技术的发展史伴随着计算机技术发展而发展的,也就是说,从计算机技术诞生之日起,人们就在为追求性能更高,容量更大的存储技术而努力。在过去几十年间,可以说是存储技术不断创新的年代,出现了包括NSF、Lustre、Ceph等各种各样的分布式存储技术。
但是这次存储技术技术复杂,难管理,难调优,更是难扩展。最近几年,随着Google的GFS发表,出现了大批性能高、扩展性好、管理配置简单的分布式存储系统,比如开源的HDFS。在云计算、物联网、大数据领域,此类简单的分布式存储系统应用最广。
发明内容
本发明要解决的技术问题是:提供一种高扩展、高性能的分布式存储体系结构。
本发明所采用的技术方案为:一种高扩展、高性能的分布式存储体系结构,包括:存储节点,元数据节点,路由节点,配置节点。与传统的分布式存储体系结构不同,本发明的结构是以存储节点为核心,通过路由节点、元数据节点、配置信息节点的配合,简化复杂的存储协议,实现高扩展、高性能的分布式存储集群,并且实现了简单可靠的负载均衡机制和高可用机制。其中:
存储节点是体系的核心,负债数据的存储以及协议的转化;
元数据节点主要负责元数据的存储,为了避免多用户共同使用集群时的元数据不一致问题和元数据的可靠性,采用开源的MySQL数据库实现;
路由节点负责向元数据节点读取元数据找到数据存储位置和向元数据节点请求数据的存放位置,从存储节点读取数据并把数据传送给客户端和把数据存储到存储节点;
配置节点存储集群的配置信息,包括分片信息、副本信息和各个节点的角色。
所有的节点可以采用通用的存储设备,如PC、服务器等;存储节点可以采用通用的存储设备,如光线磁盘阵列,SCSI磁盘阵列、磁带库、磁带机等存储设备。
该系统内部需要较高的网络,特别是存储节点和路由节点之间经常需要大规模的数据传输,网络要求较高,最好采用万兆网或者Infiniband(一种支持多并发链接的“转换线缆”技术)等新兴网络设备。
可以把若干个存储节点分为一组,互为副本集,保证数据的安全性。
体系结构中,存储节点、元数据节点、路由节点、配置节点相互配合,并有冗余配置,当某个节点发生故障时,相应的冗余配置接管故障节点继续工作,从而提高系统的整体可用性。
体系结构中,存储节点、元数据节点、路由节点、配置节点各自分工,其中存储节点没有数量的限制,可以无限扩展。存储节点之间没有耦合性,可以并行工作,提高存储系统的性能。
体系结构具有低耦合灵活可扩展的特性,体系结构中存储节点、元数据节点、路由节点和配置节点作为灵活可动态添、删除的节点,可以进行灵活的配置。这种灵活性体现在添加和删除某一种节点时,基本不用或很少对其他节点进行复杂的配置工作,从而减少系统管理的复杂程度。
本发明的有益效果为:
本发明弥补了传统分布式存储系统的不足,使其体系结构所带来的高扩展、高性能、高可用等诸多特性,更加适用于大数据存储、云计算等需要存储海量数据的领域,因而具有非常广阔的发展前景。
附图说明
图1为高扩展、高性能的分布式存储架构示意图。
具体实施方式
下面参照附图,结合实施例对本发明详细说明。
实施例1:
一种高扩展、高性能的分布式存储体系结构,包括存储节点,元数据节点,路由节点,配置节点,以存储节点为核心,通过路由节点、元数据节点、配置信息节点的配合,简化复杂的存储协议,实现高扩展、高性能的分布式存储集群,并且实现简单可靠的负载均衡机制和高可用机制,其中,存储节点是体系的核心,负债数据的存储以及协议的转化;元数据节点主要负责元数据的存储,为了避免多用户共同使用集群时的元数据不一致问题和元数据的可靠性,采用开源的MySQL集群存储元数据;采用开源的MySQL数据库实现;
路由节点负责向元数据节点读取元数据,找到数据存储位置和向元数据节点请求数据的存放位置,从存储节点读取数据并把数据传送给客户端和把数据存储到存储节点;
配置节点存储集群的配置信息,包括分片信息、副本信息和各个节点的角色。
实施例2:
在实施例1的基础上,本实施例节点采用通用的存储设备.
实施例3:
在实施例1或2的基础上,本实施例存储节点采用光线磁盘阵列、SCSI磁盘阵列、磁带库或磁带机。
实施例4:
在实施例1或2的基础上,本实施例系统内部网络采用万兆网或者Infiniband网络设备。
实施例5:
在实施例1的基础上,本实施可以把若干个存储节点分为一组,互为副本集,保证数据的安全性。
实施例6:
在实施例1的基础上,本实施例在体系结构中,存储节点、元数据节点、路由节点、配置节点相互配合,并有冗余配置,当某个节点发生故障时,相应的冗余配置接管故障节点继续工作,从而提高系统的整体可用性。
实施例7:
在实施例1或2的基础上,本实施例体系结构中,存储节点、元数据节点、路由节点、配置节点各自分工,其中存储节点没有数量的限制,可以无限扩展,存储节点之间没有耦合性,可以并行工作,提高存储系统的性能。
实施例8:
在实施例7的基础上,本实施例的体系结构具有低耦合、灵活可扩展的特性,体系结构中存储节点、元数据节点、路由节点和配置节点作为灵活可动态添加、删除的节点,能够进行灵活的配置,在添加和删除某一种节点时,不用或很少对其他节点进行复杂的配置工作。
实施例9:
如图所示,采用6台服务器作为存储节点,3台服务器作为路由节点和配置节点,2台服务器作为元数据节点。其中六台服务器分为两个副本集,保证数据的安全性,两组存储节点作为分片,并行地存取数据。路由节点和配置节点在运行在一个服务器上,因为配置节点占用资源很少;路由节点负责和客户端的连接,和数据的中转站;为了保证三台配置节点的数据一致性,采用二阶段提交算法,即,三台配置节点所有的数据同时修改完成后,返回修改成功。元数据节点安装在两台服务器上,运行Mysql集群,采用主从架构,保证元数据的可靠性,当然,这里也可用多台。
该系统支持灵活的配置和扩展,从而可以构建出适合大数据存储、云计算等需要存储海量数据的领域的需求的存储系统。

Claims (8)

1.一种高扩展、高性能的分布式存储体系结构,包括存储节点,元数据节点,路由节点,配置节点,其特征在于:以存储节点为核心,通过路由节点、元数据节点、配置信息节点的配合,简化复杂的存储协议,实现高扩展、高性能的分布式存储集群,并且实现简单可靠的负载均衡机制和高可用机制,其中:
存储节点是体系的核心,负债数据的存储以及协议的转化;
元数据节点主要负责元数据的存储,采用开源的MySQL数据库实现;
路由节点负责向元数据节点读取元数据,找到数据存储位置和向元数据节点请求数据的存放位置,从存储节点读取数据并把数据传送给客户端和把数据存储到存储节点;
配置节点存储集群的配置信息,包括分片信息、副本信息和各个节点的角色。
2.根据权利要求1所述的一种高扩展、高性能的分布式存储体系结构,其特征在于:节点采用通用的存储设备。
3.根据权利要求1或2所述的一种高扩展、高性能的分布式存储体系结构,其特征在于:存储节点采用光线磁盘阵列、SCSI磁盘阵列、磁带库或磁带机。
4.根据权利要求1或2所述的一种高扩展、高性能的分布式存储体系结构,其特征在于:系统内部网络采用万兆网或者Infiniband网络设备。
5.根据权利要求1所述的一种高扩展、高性能的分布式存储体系结构,其特征在于:把若干个存储节点分为一组,互为副本集。
6.根据权利要求1所述的一种高扩展、高性能的分布式存储体系结构,其特征在于:在体系结构中,存储节点、元数据节点、路由节点、配置节点相互配合,并有冗余配置,当某个节点发生故障时,相应的冗余配置接管故障节点继续工作。
7.根据权利要求1、2所述的一种高扩展、高性能的分布式存储体系结构,其特征在于:在体系结构中,存储节点、元数据节点、路由节点、配置节点各自分工,其中存储节点没有数量的限制,能无限扩展,存储节点之间没有耦合性,能并行工作。
8.根据权利要求7所述的一种高扩展、高性能的分布式存储体系结构,其特征在于:体系结构具有低耦合、灵活可扩展的特性,体系结构中存储节点、元数据节点、路由节点和配置节点作为灵活可动态添加、删除的节点,能够进行灵活的配置,在添加和删除某一种节点时,不用或很少对其他节点进行复杂的配置工作。
CN201310494887.XA 2013-10-22 2013-10-22 一种高扩展、高性能的分布式存储体系结构 Pending CN103516809A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310494887.XA CN103516809A (zh) 2013-10-22 2013-10-22 一种高扩展、高性能的分布式存储体系结构

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310494887.XA CN103516809A (zh) 2013-10-22 2013-10-22 一种高扩展、高性能的分布式存储体系结构

Publications (1)

Publication Number Publication Date
CN103516809A true CN103516809A (zh) 2014-01-15

Family

ID=49898826

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310494887.XA Pending CN103516809A (zh) 2013-10-22 2013-10-22 一种高扩展、高性能的分布式存储体系结构

Country Status (1)

Country Link
CN (1) CN103516809A (zh)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106066890A (zh) * 2016-06-16 2016-11-02 上海天玑科技股份有限公司 一种分布式高性能数据库一体机系统
CN106527981A (zh) * 2016-10-31 2017-03-22 华中科技大学 一种基于配置的自适应分布式存储系统的数据分片方法
CN106844399A (zh) * 2015-12-07 2017-06-13 中兴通讯股份有限公司 分布式数据库系统及其自适应方法
CN107391033A (zh) * 2017-06-30 2017-11-24 北京奇虎科技有限公司 数据迁移方法及装置、计算设备、计算机存储介质
CN108900347A (zh) * 2018-07-09 2018-11-27 郑州云海信息技术有限公司 集群初始化配置方法、装置、系统、设备及可读存储介质
CN109327509A (zh) * 2018-09-11 2019-02-12 武汉魅瞳科技有限公司 一种主/从架构的低耦合的分布式流式计算框架
CN110851416A (zh) * 2018-08-03 2020-02-28 阿里巴巴集团控股有限公司 数据存储性能分析方法和装置、宿主机确定方法和装置
CN112052219A (zh) * 2020-08-05 2020-12-08 中国建设银行股份有限公司 文件的存储与检索方法、装置、电子设备及可读存储介质
CN113630441A (zh) * 2021-07-12 2021-11-09 中国科学院国家天文台 低功耗分布式存储系统及终端设备

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101783814A (zh) * 2009-12-29 2010-07-21 上海交通大学 海量存储系统的元数据存储方法
CN102567495A (zh) * 2011-12-22 2012-07-11 国网信息通信有限公司 一种海量信息存储系统及实现方法
WO2012139008A1 (en) * 2011-04-08 2012-10-11 Andrew Liebman Systems, computer readable storage media, and computer implemented methods for project sharing

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101783814A (zh) * 2009-12-29 2010-07-21 上海交通大学 海量存储系统的元数据存储方法
WO2012139008A1 (en) * 2011-04-08 2012-10-11 Andrew Liebman Systems, computer readable storage media, and computer implemented methods for project sharing
CN102567495A (zh) * 2011-12-22 2012-07-11 国网信息通信有限公司 一种海量信息存储系统及实现方法

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106844399A (zh) * 2015-12-07 2017-06-13 中兴通讯股份有限公司 分布式数据库系统及其自适应方法
CN106066890B (zh) * 2016-06-16 2020-02-18 上海天玑科技股份有限公司 一种分布式高性能数据库一体机系统
CN106066890A (zh) * 2016-06-16 2016-11-02 上海天玑科技股份有限公司 一种分布式高性能数据库一体机系统
CN106527981A (zh) * 2016-10-31 2017-03-22 华中科技大学 一种基于配置的自适应分布式存储系统的数据分片方法
CN106527981B (zh) * 2016-10-31 2020-04-28 华中科技大学 一种基于配置的自适应分布式存储系统的数据分片方法
CN107391033A (zh) * 2017-06-30 2017-11-24 北京奇虎科技有限公司 数据迁移方法及装置、计算设备、计算机存储介质
CN107391033B (zh) * 2017-06-30 2020-07-07 北京奇虎科技有限公司 数据迁移方法及装置、计算设备、计算机存储介质
CN108900347A (zh) * 2018-07-09 2018-11-27 郑州云海信息技术有限公司 集群初始化配置方法、装置、系统、设备及可读存储介质
CN108900347B (zh) * 2018-07-09 2021-06-29 郑州云海信息技术有限公司 集群初始化配置方法、装置、系统、设备及可读存储介质
CN110851416A (zh) * 2018-08-03 2020-02-28 阿里巴巴集团控股有限公司 数据存储性能分析方法和装置、宿主机确定方法和装置
CN110851416B (zh) * 2018-08-03 2023-10-27 阿里巴巴集团控股有限公司 数据存储性能分析方法和装置、宿主机确定方法和装置
CN109327509A (zh) * 2018-09-11 2019-02-12 武汉魅瞳科技有限公司 一种主/从架构的低耦合的分布式流式计算框架
CN112052219A (zh) * 2020-08-05 2020-12-08 中国建设银行股份有限公司 文件的存储与检索方法、装置、电子设备及可读存储介质
CN113630441A (zh) * 2021-07-12 2021-11-09 中国科学院国家天文台 低功耗分布式存储系统及终端设备
CN113630441B (zh) * 2021-07-12 2023-12-08 中国科学院国家天文台 低功耗分布式存储系统及终端设备

Similar Documents

Publication Publication Date Title
CN103516809A (zh) 一种高扩展、高性能的分布式存储体系结构
CN103106249B (zh) 一种基于Cassandra的数据并行处理系统
Mai et al. Cloud databases for internet-of-things data
Vora Hadoop-HBase for large-scale data
CN103312791B (zh) 物联网异构数据存储方法及系统
Greenberg et al. {MDHIM}: A Parallel {Key/Value} Framework for {HPC}
CN102937964B (zh) 基于分布式系统的智能数据服务方法
US11743333B2 (en) Tiered queuing system
CN103399894A (zh) 一种基于共享存储池的分布式事务处理方法
CN102142032B (zh) 一种分布式文件系统的数据读写方法及系统
CN105516284A (zh) 一种集群数据库分布式存储的方法和装置
US11080207B2 (en) Caching framework for big-data engines in the cloud
WO2020019313A1 (zh) 一种图数据的更新方法、系统、计算机可读存储介质及设备
CN103595799A (zh) 一种实现分布式共享数据库的方法
US9767107B1 (en) Parallel file system with metadata distributed across partitioned key-value store
CN105516313A (zh) 一种用于大数据的分布式存储系统
Li et al. The overview of big data storage and management
Gu et al. Analysis of data storage mechanism in NoSQL database MongoDB
Sawyer et al. Understanding query performance in Accumulo
CN102820998A (zh) 实现面向办公应用的双机容错服务系统及其数据存储方法
Lawson et al. Empress: extensible metadata provider for extreme-scale scientific simulations
CN104636327A (zh) 一种基于增量计算的分布式流式数据系统
CN103209219A (zh) 一种分布式集群文件系统
CN107220003A (zh) 一种数据读取方法和系统
Costa et al. Towards an adaptive and distributed architecture for managing workflow provenance data

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20140115

RJ01 Rejection of invention patent application after publication