CN104754021A - 用于促进对分布式存储系统中的数据的访问的装置和方法 - Google Patents

用于促进对分布式存储系统中的数据的访问的装置和方法 Download PDF

Info

Publication number
CN104754021A
CN104754021A CN201310756039.1A CN201310756039A CN104754021A CN 104754021 A CN104754021 A CN 104754021A CN 201310756039 A CN201310756039 A CN 201310756039A CN 104754021 A CN104754021 A CN 104754021A
Authority
CN
China
Prior art keywords
metadata
data
memory system
distributed memory
running status
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201310756039.1A
Other languages
English (en)
Other versions
CN104754021B (zh
Inventor
郭峰
王天青
颜开
陈齐彦
张芸
吴怡沧
彭麟
陆之豪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
EMC Corp
Original Assignee
EMC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by EMC Corp filed Critical EMC Corp
Priority to CN201310756039.1A priority Critical patent/CN104754021B/zh
Priority to US14/577,045 priority patent/US11314694B2/en
Publication of CN104754021A publication Critical patent/CN104754021A/zh
Application granted granted Critical
Publication of CN104754021B publication Critical patent/CN104754021B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/17Details of further file system functions
    • G06F16/174Redundancy elimination performed by the file system
    • G06F16/1748De-duplication implemented within the file system, e.g. based on file segments

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明的实施方式涉及用于促进对分布式存储系统中的数据的访问的装置和方法。该装置包括:收集单元,被配置为收集分布式存储系统的运行状态相关信息;元数据获取单元,被配置为获取与分布式存储系统中所存储的数据有关的元数据;接口单元,被配置为响应于来自客户端的请求,向客户端提供运行状态相关信息和与待访问的数据有关的元数据;以及访问扩展单元,被配置为对分布式存储系统中的存储节点进行扩展,以使得客户端能够利用运行状态相关信息和与待访问的数据有关的元数据直接访问存储节点。还公开了相应的方法。利用本发明的技术方案,客户端能够自行决定访问数据的适当方式,以获得最佳的访问性能或实现最佳的应用目的。

Description

用于促进对分布式存储系统中的数据的访问的装置和方法
技术领域
本发明的实施方式总体上涉及数据处理领域,更具体地,涉及用于促进对分布式存储系统中的数据的访问的装置和方法。
背景技术
近年来,分布式存储架构已被广泛应用于存储基础设施设计,以实现可扩展性、大数据量、高可用性等。一些分布式存储系统将大数据量(典型地在千兆字节到兆兆字节范围内)分成多个分片(partition)并且基于商业机器或者企业硬件而在分布式存储系统的多个存储节点上存储所述多个分片。此外,为了实现可靠性,这些分布式存储系统通常会对数据的每个分片进行备份,以生成分片的一个或多个副本,并且将该一个或多个副本存储在一个或多个存储节点。
然而,数据的分片信息以及各分片及其副本的存储位置信息对于请求访问该数据的客户端而言是透明的。换言之,客户端并不知晓数据被分成多少个分片以及各分片分别存储于哪个存储节点上。以EMC公司的Isilon集群存储系统为例,Isilon集群存储系统中的任一个节点都可作为访问节点。当客户端向访问节点发送请求以访问Isilon集群存储系统中所存储的数据,由于数据的分片被存储于系统中的多个节点上,因此访问节点负责从存储该数据的各分片的节点取回各分片,将各分片进行组装,并将组装后的分片(即数据)提供给客户端。显然,这不可避免地需要访问节点上的高资源消耗并且对Isilon集群存储系统带来显著的带宽开销。
如果客户端能够获得数据的分片信息以及各分片及其副本在存储系统中的分布信息,那么客户端自身可以从存储节点取回数据的分片并将各分片进行组装,从而减轻存储系统的负荷。
发明内容
为了缓解上述问题,本发明提供一种用于促进对分布式存储系统中的数据的访问的装置和方法、以及访问分布式存储系统中的数据的相应装置和方法。
根据本发明实施方式的第一方面,提供了一种用于促进对分布式存储系统中的数据的访问的装置。该装置包括:收集单元,被配置为收集所述分布式存储系统的运行状态相关信息;元数据获取单元,被配置为获取与所述分布式存储系统中所存储的数据有关的元数据;接口单元,被配置为响应于来自客户端的请求,向所述客户端提供所述运行状态相关信息和与待访问的数据有关的元数据;以及访问扩展单元,被配置为对所述分布式存储系统中的存储节点进行扩展,以使得所述客户端能够利用所述运行状态相关信息和与待访问的数据有关的所述元数据直接访问所述存储节点。
在一个示例性实施方式中,所述接口单元可被进一步配置为响应于来自客户端的所述请求,向所述收集单元发送第一查询请求以获取所述运行状态相关信息以及向所述元数据获取单元发送第二查询请求以获取所述元数据。
在一个示例性实施方式中,所述收集单元可被进一步配置为响应于所述第一查询请求,从所述分布式存储系统收集所述运行状态相关信息;并且其中所述元数据获取单元被进一步配置为响应于所述第二查询请求,从所述分布式存储系统获取所述元数据。
在一个示例性实施方式中,所述元数据获取单元可被进一步配置为周期性地从所述分布式存储系统获取所述元数据。
在一个示例性实施方式中,所述元数据获取单元可被进一步配置为接收所述数据的存储状态发生改变的通知,并响应于所述通知而从所述分布式存储系统获取所述元数据。
在一个示例性实施方式中,所述元数据获取单元被进一步配置为监听消息总线,以获取与所述数据的存储状态发生改变有关的信息,所述信息包括所述元数据。
在一个示例性实施方式中,所述装置可进一步包括:信息存储库,被配置为存储所述收集单元所收集的所述运行状态相关信息、以及所述元数据获取单元所获取的所述元数据。
在一个示例性实施方式中,所述接口单元可被进一步配置为响应于来自客户端的所述请求,查询所述信息存储库以获取所述运行状态相关信息和所述元数据。
根据本发明实施方式的第二方面,提供了一种用于访问分布式存储系统中的数据的装置。该装置包括:发送单元,被配置为发送用于获取所述分布式存储系统的运行状态相关信息和与待访问的数据有关的元数据的请求;接收单元,被配置为接收对所述请求的响应,所述响应中包含所述运行状态相关信息和所述元数据;以及访问单元,被配置为利用所述运行状态相关信息和所述元数据直接访问所述分布式存储系统中的存储节点。
根据本发明实施方式的第三方面,提供了一种用于促进对分布式存储系统中的数据的访问的方法。该方法包括:收集所述分布式存储系统的运行状态相关信息;获取与所述分布式存储系统中所存储的数据有关的元数据;响应于来自客户端的请求,向所述客户端提供所述运行状态相关信息和与待访问的数据有关的元数据;以及对所述分布式存储系统中的存储节点进行扩展,以使得所述客户端能够利用所述运行状态相关信息和与待访问的数据有关的所述元数据直接访问所述存储节点。
根据本发明实施方式的第四方面,提供了一种用于访问分布式存储系统中的数据的方法。该方法包括:发送用于获取所述分布式存储系统的运行状态相关信息和与待访问的数据有关的元数据的请求;接收对所述请求的响应,所述响应中包含所述运行状态相关信息和所述元数据;以及利用所述运行状态相关信息和所述元数据直接访问所述分布式存储系统中的存储节点。
通过下文的详细描述将会理解,采用本发明的实施方式,通过向客户端提供分布式存储系统的运行状态相关信息和与分布式存储系统中所存储的数据有关的元数据,具有较大的计算能力、存储能力和联网能力并且能够嵌入复杂智能的客户端(下文中简称为“有能力的客户端”)能够自行决定访问数据的适当方式,以获得最佳的访问性能或实现最佳的应用目的,例如最小化数据备份窗等。此外,基于分布式存储系统的运行状态相关信息和与待访问的数据有关的元数据,客户端能够直接访问存储数据的存储节点,从相应存储节点获取待访问数据的各个分片(或其副本),在客户端本地进行分片的组装,而无需由分布式存储系统中的访问节点进行分片的组装,从而可以防止访问节点成为瓶颈,有助于分担分布式存储系统的负荷。
附图说明
结合附图并参考以下详细说明,本发明各实施方式的特征、优点及其他方面将变得更加明显,在此以示例性而非限制性的方式示出了本发明的若干实施方式。在附图中:
图1示出了根据本发明一个实施方式的用于促进对分布式存储系统中的数据的访问的装置100的框图;
图2示出了根据本发明一个实施方式的用于访问分布式存储系统中的数据的装置200的框图;
图3示出了根据本发明一个实施方式的用于促进对分布式存储系统中的数据的访问的方法300的流程图;
图4示出了根据本发明一个实施方式的用于访问分布式存储系统中的数据的方法400的流程图;以及
图5示出了适合用来实践本发明实施方式的计算机系统500的框图。
在各个附图中,相同或对应的标号表示相同或对应的部分。
具体实施方式
下面将参考附图中示出的若干示例性实施方式来描述本发明的原理和精神。应当理解,给出这些实施方式仅仅是为了使本领域技术人员能够更好地理解进而实现本发明,而并非以任何方式限制本发明的范围。
首先参考图1,其示出了根据本发明一个实施方式的用于促进对分布式存储系统中的数据的访问的装置100的框图。装置100可以实施为现有分布式存储系统的一部分,或者可以实施为现有分布式存储系统外部的、能够与分布式存储系统进行通信的装置。
如图1所示,装置100包括收集单元101、元数据获取单元102、接口单元103以及访问扩展单元104。
收集单元101被配置为从分布式存储系统收集分布式存储系统的运行状态相关信息。所述分布式存储系统的运行状态相关信息可包括分布式存储系统在某个时间点的状态信息和分布式存储系统在给定时间段内的状态统计信息。分布式存储系统在某个时间点的状态信息包括但不限于:在某个时间点的存储节点负荷(例如CPU使用率、存储器使用率、网络速度、响应时间)、存储节点性能、节点健康状态等。分布式存储系统在给定时间段内的状态统计信息例如包括在过去的几分钟内存储节点的平均响应时间等。以收集分布式存储系统在某个时间点的状态信息为例,收集分布式存储系统在某个时间点的状态信息可以包括从分布式存储系统收集实时矩阵,并基于所述实时矩阵来生成在某个时间点、整个分布式存储系统的状态概览和每个存储节点的具体状态。此外,基于所收集的实时矩阵,还可以生成分布式存储系统在给定时间段内的状态统计信息。可以理解,所述实时矩阵用来表示分布式存储系统中每个节点从不同维度考量的一系列值,基于所述实时矩阵来生成在某个时间点、整个分布式存储系统的状态概览和每个存储节点的具体状态可以按照本领域技术人员已知的方式进行,因而不再赘述。同样,基于所述实时矩阵来生成分布式存储系统在给定时间段内的状态统计信息也可以按照本领域技术人员已知的方式进行,故不再赘述。
元数据获取单元102被配置为获取与分布式存储系统中所存储的数据有关的元数据。在此使用的术语“元数据”是指用于描述所存储的数据的信息的数据。作为示例,元数据可以包括但不限于:所存储的数据的存储位置信息、所存储的数据的复制策略、所存储的数据的分片规则等。更具体地,所存储的数据的存储位置信息例如可以指示数据的分片及其备份分别存储于哪个存储节点上。
可以理解,元数据获取单元102具体从何处获取与分布式存储系统中所存储的数据有关的元数据取决于分布式存储系统具体架构。例如,在具有主节点(master node)的分布式存储系统的情况下,由于主节点维护与所有被存储的数据有关的元数据,因此,元数据获取单元102可以从主节点获取所述元数据。
在一个实施方式中,元数据获取单元102被配置为周期性地从分布式存储系统获取所述元数据。例如,元数据获取单元102可以按照预定的时间间隔(例如每5秒)从分布式存储系统获取所述元数据。在另一个实施方式中,元数据获取单元102被配置为接收数据的存储状态发生改变的通知,并响应于该通知而从分布式存储系统获取元数据。因而,响应于通知而从分布式存储系统获取元数据更能确保装置100中的元数据与分布式存储系统中的元数据保持同步和一致。
接口单元103被配置为响应于来自客户端的请求,向客户端提供分布式存储系统的运行状态相关信息和与客户端待访问的数据有关的元数据。
在一个实施方式中,接口单元103被进一步配置为响应于来自客户端的请求,向收集单元101发送第一查询请求以获取分布式存储系统的运行状态相关信息以及向元数据获取单元102发送第二查询请求以获取与客户端待访问的数据有关的元数据。收集单元101响应于该第一查询请求,从分布式存储系统收集所述运行状态相关信息,并且元数据获取单元102响应于该第二查询请求,从分布式存储系统获取所述元数据。在该实施方式中,由于接口单元103响应于来自客户端的请求分别向收集单元101和元数据获取单元102发送查询请求,收集单元101和元数据获取单元102分别响应于查询请求而获取运行状态相关信息和元数据,因而更能够确保获取运行状态相关信息和元数据的实时性以及一致性。
访问扩展单元104被配置为对分布式存储系统中的存储节点进行扩展,以使得客户端能够利用分布式存储系统的运行状态相关信息和与待访问的数据有关的元数据直接访问存储节点。现有的存储接口通常只能够接受来自分布式存储系统内部的访问,因此必须需要访问扩展单元104完成数据访问中转,令存储系统外部的客户端能够经由该访问扩展单元104直接访问存储节点。访问扩展单元104甚至可以安装在每个存储节点上。访问扩展单元104可以利用存储节点的现有功能或者被实施为存储节点中的新功能。
根据本发明的某些实施方式,装置100进一步包括信息存储库(未示出),该信息存储库被配置为存储收集单元101所收集的运行状态相关信息、以及元数据获取单元102所获取的元数据。接口单元103被进一步配置为响应于来自客户端的请求,查询该信息存储库以获取所述运行状态相关信息和与待访问的数据有关的元数据。所述信息存储库可以利用任何目前已知或将来开发的适当技术来实现。例如,所述信息存储库可以实现为数据库,例如关系数据库或者其他类型的数据库。备选地,所述信息存储库的其他实施方式也是可行的。本发明的范围在此方面不受限制。
应当理解,上文参考图1描述的装置100可以利用各种方式实现。例如,在某些实施方式中,装置100可以利用软件和/或固件来实现。备选地或附加地,装置100可以部分地或者完全地基于硬件来实现。例如,装置100可以实现为集成电路(IC)芯片或专用集成电路(ASIC)。装置100也可以实现为片上系统(SOC)。现在已知或者将来开发的其他方式也是可行的,本发明的范围在此方面不受限制
接下来参照图2,其示出了根据本发明一个实施方式的用于访问分布式存储系统中的数据的装置200的框图。根据某些实施方式,装置200例如可以与上文参照图1所描述的装置100结合使用。
如图2所示,装置200包括发送单元201、接收单元202和访问单元203。
发送单元201被配置为发送用于获取分布式存储系统的运行状态相关信息和与待访问的数据有关的元数据的请求。在装置200与图1所示的装置100结合使用的情况下,发送单元201例如可以向装置100的接口单元103发送用于获取所述运行状态相关信息和所述元数据的所述请求。根据一个实施方式,所述请求中可以包括待访问的数据的标识,例如待访问的文件的文件名或其他标识符。
接收单元202被配置为接收对所述请求的响应,响应中包含所述运行状态相关信息和所述元数据。在装置200与图1所示的装置100结合使用的情况下,接收单元202例如可以从装置100的接口单元103接收所述响应。
访问单元203被配置为利用所述运行状态相关信息和所述元数据直接访问分布式存储系统中的存储节点,以便访问存储节点上所存储的数据。
利用所获取的分布式存储系统的运行状态相关信息和与待访问的数据有关的元数据,访问单元203能够自行决定访问数据的适当方式,以或实现最佳的应用目的。
具体而言,如上所述,与待访问的数据有关的元数据例如包括待访问的数据的存储位置信息、所存储的数据的复制策略、所存储的数据的分片规则等。基于与待访问的数据有关的元数据,可以获知待访问的数据被分为多少个分片、每个分片具有多少个副本、以及各个分片及其副本分别存储于哪个存储节点上。仍然如上所述,分布式存储系统的运行状态相关信息例如包括在某个时间点或给定时间段内,存储节点负荷(例如CPU使用率、存储器使用率、网络速度、响应时间)、存储节点性能、节点健康状态等。基于分布式存储系统的运行状态相关信息,可以获知存储有待访问的数据的分片及其副本的存储节点的负荷状况。因而,访问单元203能够基于存储系统的运行状态相关信息和与待访问数据有关的元数据,自行决定并行访问不同存储节点上所存储的数据分片或分片的副本,还是从能够获得最佳输入输出(IO)性能的存储节点智能地访问数据。
下文中将以数据备份应用客户端(下文中简称客户端)作为装置200的一个具体示例,详细描述装置200与装置100的交互过程。可以理解,以下描述仅为示例,根据不同的应用场景,装置200与装置100之间可以执行不同的交互过程以及交互不同的信息。
1.客户端200的发送单元201与装置100的接口单元103进行交互,例如向接口单元103发送用于获取分布式存储系统的运行状态相关信息和与待访问的数据有关的元数据的请求,所述请求中可以包括待访问的数据的标识,例如待访问的文件的文件名或其他标识符。
2.接口单元103响应于接收到来自客户端200的请求,分别向收集单元101发送第一查询请求以获取所述运行状态相关信息以及向元数据获取单元102发送第二查询请求以获取所述元数据。所述运行状态相关信息例如包括在过去的3分钟(或任意指定的时段)内每个存储节点的平均响应时间和工作负荷(例如CPU使用率、网络速度、存储器使用率等)。与待访问的数据有关的元数据例如包括待访问的数据的各分片在存储节点上的存储位置以及各分片的副本在存储节点上的存储位置。例如,待访问的数据被分为3个分片,3个分片分别存储于3个不同的存储节点上,并且每个分片具有1个副本。
3.收集单元101响应于第一查询请求从分布式存储系统收集运行状态相关信息并将所收集的运行状态相关信息提供给接口单元103,并且元数据获取单元102响应于第二查询请求从分布式存储系统获取元数据并将所获取的元数据提供给接口单元103。
4.接口单元103向客户端200发送所述运行状态相关信息和元数据。
5.客户端200的接收单元202接收所述运行状态相关信息和元数据。
6.基于接收到的运行状态相关信息和元数据,客户端200的访问单元203向存储有数据的分片的存储节点发起3个数据访问请求,以经由访问扩展单元104并行地访问存储有数据的分片的存储节点。对于每个分片,访问单元203可以基于存储有该分片的存储节点和存储有该分片的副本的存储节点的状态信息(例如负荷状况),智能地选择两个存储节点中的一个来进行访问,以获得最佳的访问性能,例如最小化数据备份窗。
下面参照图3,其示出了根据本发明一个实施方式的用于促进对分布式存储系统中的数据的访问的方法300的流程图。应当理解,方法300中示出的步骤仅仅是示意性的。例如,这些步骤可以按照不同的顺序执行甚至并行执行。此外,方法300也可以包括附加的步骤,替换某些步骤,或者省略某些步骤。
首先,在步骤S301,收集分布式存储系统的运行状态相关信息。
在步骤S302,获取与分布式存储系统中所存储的数据有关的元数据。根据一个实施方式,获取与分布式存储系统中所存储的数据有关的元数据包括周期性地从分布式存储系统获取元数据。根据另一个实施方式,获取与分布式存储系统中所存储的数据有关的元数据包括:接收数据的存储状态发生改变的通知;以及响应于通知而从分布式存储系统获取元数据。
在步骤S303,响应于来自客户端的请求,向客户端提供运行状态相关信息和与待访问的数据有关的元数据。根据一个实施方式,响应于来自客户端的请求,向客户端提供运行状态相关信息和与待访问的数据有关的元数据包括:响应于来自客户端的请求,从分布式存储系统收集运行状态相关信息以及从分布式存储系统获取元数据。
在步骤S304,对分布式存储系统中的存储节点进行扩展,以使得客户端能够利用运行状态相关信息和与待访问的数据有关的元数据直接访问存储节点。
根据某些实施方式,方法300进一步包括:将运行状态相关信息以及元数据存储于分布式存储系统中的信息存储库中。根据某些实施方式,响应于来自客户端的请求,向客户端提供运行状态相关信息和与待访问的数据有关的元数据包括:响应于来自客户端的请求,向信息存储库发送查询请求以获取运行状态相关信息和元数据;以及将从信息存储库中获取的运行状态相关信息和元数据提供给客户端。
应当理解,结合图3描述的方法300可以由结合图1描述的装置100来执行。特别地,方法300中的各个步骤可以由装置100中的相应单元来执行。由此,上文参考装置100描述的各种特征均适用于方法300中的各个步骤,在此不再赘述。
接下来参照图4,其示出了根据本发明一个实施方式的用于访问分布式存储系统中的数据的方法400的流程图。
在步骤S401,发送用于获取分布式存储系统的运行状态相关信息和与待访问的数据有关的元数据的请求。
在步骤S402,接收对请求的响应,响应中包含运行状态相关信息和元数据;以及
在步骤S403,利用运行状态相关信息和元数据直接访问分布式存储系统中的存储节点。
应当理解,结合图4描述的方法400可以由结合图2描述的装置200来执行。特别地,方法400中的各个步骤可以由装置200中的相应单元来执行。由此,上文参考装置200描述的各种特征均适用于方法400中的各个步骤,在此不再赘述。
下面参考图5,其示出了适于用来实践本发明实施方式的计算机系统500的示意性框图。例如,图5所示的计算机系统500可以用于实现如上文描述的用于促进对分布式存储系统中的数据的访问的装置100和用于访问分布式存储系统中的数据的装置200。
如图5所示,计算机系统可以包括:CPU(中央处理单元)501、RAM(随机存取存储器)502、ROM(只读存储器)503、系统总线504、硬盘控制器505、键盘控制器506、串行接口控制器507、并行接口控制器508、显示控制器509、硬盘510、键盘511、串行外部设备512、并行外部设备513和显示器514。在这些设备中,与系统总线504耦合的有CPU501、RAM502、ROM503、硬盘控制器505、键盘控制器506、串行控制器507、并行控制器508和显示控制器509。硬盘510与硬盘控制器505耦合,键盘511与键盘控制器506耦合,串行外部设备512与串行接口控制器507耦合,并行外部设备513与并行接口控制器508耦合,以及显示器514与显示控制器509耦合。应当理解,图5所述的结构框图仅仅为了示例的目的而示出的,而不是对本发明范围的限制。在某些情况下,可以根据具体情况而增加或者减少某些设备。
如上所述,装置100和200可以实现为纯硬件,例如芯片、ASIC、SOC等。这些硬件可以集成在计算机系统500中。此外,本发明的实施方式也可以通过计算机程序产品的形式实现。例如,参考图3描述的方法300和参考图4描述的方法400可以通过计算机程序产品来实现。该计算机程序产品可以存储在例如图5所示的RAM502、ROM503、硬盘510和/或任何适当的存储介质中,或者通过网络从适当的位置下载到计算机系统500上。计算机程序产品可以包括计算机代码部分,其包括可由适当的处理设备(例如,图5中示出的CPU501)执行的程序指令。所述程序指令至少可以包括用于实现方法300和400的步骤的指令。
应当注意,本发明的实施方式可以通过硬件、软件或者软件和硬件的结合来实现。硬件部分可以利用专用逻辑来实现;软件部分可以存储在存储器中,由适当的指令执行系统,例如微处理器或者专用设计硬件来执行。本领域的普通技术人员可以理解上述的设备和方法可以使用计算机可执行指令和/或包含在处理器控制代码中来实现,例如在诸如磁盘、CD或DVD-ROM的载体介质、诸如只读存储器(固件)的可编程的存储器或者诸如光学或电子信号载体的数据载体上提供了这样的代码。本发明的设备及其模块可以由诸如超大规模集成电路或门阵列、诸如逻辑芯片、晶体管等的半导体、或者诸如现场可编程门阵列、可编程逻辑设备等的可编程硬件设备的硬件电路实现,也可以用由各种类型的处理器执行的软件实现,也可以由上述硬件电路和软件的结合例如固件来实现。
说明书中提及的通信网络可以包括各类网络,包括但不限于局域网(“LAN”),广域网(“WAN”),根据IP协议的网络(例如,因特网)以及端对端网络(例如,ad hoc对等网络)。
应当注意,尽管在上文详细描述中提及了设备的若干装置或子装置,但是这种划分仅仅并非强制性的。实际上,根据本发明的实施方式,上文描述的两个或更多装置的特征和功能可以在一个装置中具体化。反之,上文描述的一个装置的特征和功能可以进一步划分为由多个装置来具体化。
此外,尽管在附图中以特定顺序描述了本发明方法的操作,但是,这并非要求或者暗示必须按照该特定顺序来执行这些操作,或是必须执行全部所示的操作才能实现期望的结果。相反,流程图中描绘的步骤可以改变执行顺序。附加地或备选地,可以省略某些步骤,将多个步骤合并为一个步骤执行,和/或将一个步骤分解为多个步骤执行。
虽然已经参考若干具体实施方式描述了本发明,但是应该理解,本发明并不限于所公开的具体实施方式。本发明旨在涵盖所附权利要求的精神和范围内所包括的各种修改和等同布置。所附权利要求的范围符合最宽泛的解释,从而包含所有这样的修改及等同结构和功能。

Claims (18)

1.一种用于促进对分布式存储系统中的数据的访问的装置,包括:
收集单元,被配置为收集所述分布式存储系统的运行状态相关信息;
元数据获取单元,被配置为获取与所述分布式存储系统中所存储的数据有关的元数据;
接口单元,被配置为响应于来自客户端的请求,向所述客户端提供所述运行状态相关信息和与待访问的数据有关的元数据;以及
访问扩展单元,被配置为对所述分布式存储系统中的存储节点进行扩展,以使得所述客户端能够利用所述运行状态相关信息和与待访问的数据有关的所述元数据直接访问所述存储节点。
2.根据权利要求1所述的装置,其中所述接口单元被进一步配置为响应于来自客户端的所述请求,向所述收集单元发送第一查询请求以获取所述运行状态相关信息以及向所述元数据获取单元发送第二查询请求以获取所述元数据。
3.根据权利要求2所述的装置,其中所述收集单元被进一步配置为响应于所述第一查询请求,从所述分布式存储系统收集所述运行状态相关信息;并且
其中所述元数据获取单元被进一步配置为响应于所述第二查询请求,从所述分布式存储系统获取所述元数据。
4.根据权利要求1所述的装置,其中所述元数据获取单元被进一步配置为周期性地从所述分布式存储系统获取所述元数据。
5.根据权利要求1所述的装置,其中所述元数据获取单元被进一步配置为接收所述数据的存储状态发生改变的通知,并响应于所述通知而从所述分布式存储系统获取所述元数据。
6.根据权利要求1所述的装置,其中所述元数据获取单元被进一步配置为监听消息总线,以获取与所述数据的存储状态发生改变有关的信息,所述信息包括所述元数据。
7.根据权利要求1、4、5或6所述的装置,进一步包括:
信息存储库,被配置为存储所述收集单元所收集的所述运行状态相关信息、以及所述元数据获取单元所获取的所述元数据。
8.根据权利要求7所述的装置,其中所述接口单元被进一步配置为响应于来自客户端的所述请求,查询所述信息存储库以获取所述运行状态相关信息和所述元数据。
9.一种用于访问分布式存储系统中的数据的装置,包括:
发送单元,被配置为发送用于获取所述分布式存储系统的运行状态相关信息和与待访问的数据有关的元数据的请求;
接收单元,被配置为接收对所述请求的响应,所述响应中包含所述运行状态相关信息和所述元数据;以及
访问单元,被配置为利用所述运行状态相关信息和所述元数据直接访问所述分布式存储系统中的存储节点。
10.一种用于促进对分布式存储系统中的数据的访问的方法,包括:
收集所述分布式存储系统的运行状态相关信息;
获取与所述分布式存储系统中所存储的数据有关的元数据;
响应于来自客户端的请求,向所述客户端提供所述运行状态相关信息和与待访问的数据有关的元数据;以及
对所述分布式存储系统中的存储节点进行扩展,以使得所述客户端能够利用所述运行状态相关信息和与待访问的数据有关的所述元数据直接访问所述存储节点。
11.根据权利要求10所述的方法,其中响应于来自客户端的请求,向所述客户端提供所述运行状态相关信息和与待访问的数据有关的元数据包括:
响应于来自客户端的所述请求,从所述分布式存储系统收集所述运行状态相关信息以及从所述分布式存储系统获取所述元数据。
12.根据权利要求10所述的方法,其中获取与所述分布式存储系统中所存储的数据有关的元数据包括:
周期性地从所述分布式存储系统获取所述元数据。
13.根据权利要求10所述的方法,其中获取与所述分布式存储系统中所存储的数据有关的元数据包括:
接收所述数据的存储状态发生改变的通知;以及
响应于所述通知而从所述分布式存储系统获取所述元数据。
14.根据权利要求10所述的方法,其中获取与所述分布式存储系统中所存储的数据有关的元数据包括:
监听消息总线,以获取与所述数据的存储状态发生改变有关的信息,所述信息包括所述元数据。
15.根据权利要求10、12、13或14所述的方法,进一步包括:
将所述运行状态相关信息以及所述元数据存储于所述分布式存储系统中的信息存储库中。
16.根据权利要求15所述的方法,其中响应于来自客户端的请求,向所述客户端提供所述运行状态相关信息和与待访问的数据有关的元数据包括:
响应于来自客户端的所述请求,向所述信息存储库发送查询请求以获取所述运行状态相关信息和所述元数据;以及
将从所述信息存储库中获取的所述运行状态相关信息和所述元数据提供给所述客户端。
17.一种用于访问分布式存储系统中的数据的方法,包括:
发送用于获取所述分布式存储系统的运行状态相关信息和与待访问的数据有关的元数据的请求;
接收对所述请求的响应,所述响应中包含所述运行状态相关信息和所述元数据;以及
利用所述运行状态相关信息和所述元数据直接访问所述分布式存储系统中的存储节点。
18.一种分布式存储系统,包括根据权利要求1至8中任一项所述的装置。
CN201310756039.1A 2013-12-31 2013-12-31 用于促进对分布式存储系统中的数据的访问的装置和方法 Active CN104754021B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201310756039.1A CN104754021B (zh) 2013-12-31 2013-12-31 用于促进对分布式存储系统中的数据的访问的装置和方法
US14/577,045 US11314694B2 (en) 2013-12-31 2014-12-19 Facilitating access to data in distributed storage system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310756039.1A CN104754021B (zh) 2013-12-31 2013-12-31 用于促进对分布式存储系统中的数据的访问的装置和方法

Publications (2)

Publication Number Publication Date
CN104754021A true CN104754021A (zh) 2015-07-01
CN104754021B CN104754021B (zh) 2018-04-13

Family

ID=53482050

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310756039.1A Active CN104754021B (zh) 2013-12-31 2013-12-31 用于促进对分布式存储系统中的数据的访问的装置和方法

Country Status (2)

Country Link
US (1) US11314694B2 (zh)
CN (1) CN104754021B (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107835080A (zh) * 2017-11-09 2018-03-23 成都国盛天丰网络科技有限公司 一种分布式系统数据收集方法及数据签名生成方法
CN107924337A (zh) * 2015-11-13 2018-04-17 谷歌有限责任公司 分布式存储系统中的性能监测
CN108519861A (zh) * 2018-04-02 2018-09-11 广东能龙教育股份有限公司 一种基于提供大规模并行访问的动态存储方法
WO2021189670A1 (zh) * 2020-03-26 2021-09-30 上海依图网络科技有限公司 数据同步方法、数据同步系统及其装置、介质和系统
WO2023109864A1 (zh) * 2021-12-16 2023-06-22 华为技术有限公司 一种数据系统、数据访问方法及设备

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10698622B2 (en) * 2018-05-22 2020-06-30 International Business Machines Corporation Maintaining container to storage volume relations

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6263298B1 (en) * 1998-08-13 2001-07-17 Precise Software Solutions Ltd. Method for analyzing system performance
CN101710901A (zh) * 2009-10-22 2010-05-19 乐视网信息技术(北京)股份有限公司 一种具有p2p功能的分布式存储系统和方法
CN101753478A (zh) * 2008-12-05 2010-06-23 中国移动通信集团公司 一种分布式电子邮件系统及其服务方法
CN102567438A (zh) * 2010-09-28 2012-07-11 迈塔斯威士网络有限公司 对分布式存储系统中的数据项进行访问的方法
CN102594852A (zh) * 2011-01-04 2012-07-18 中国移动通信集团公司 数据访问方法、节点及系统
CN102752381A (zh) * 2012-06-28 2012-10-24 北京邮电大学 一种应用于分布式存储的多活动副本机制及其存取方法

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020138559A1 (en) * 2001-01-29 2002-09-26 Ulrich Thomas R. Dynamically distributed file system
US20030005152A1 (en) * 2001-03-09 2003-01-02 Arif Diwan Content-request redirection method and system
US7107285B2 (en) * 2002-03-16 2006-09-12 Questerra Corporation Method, system, and program for an improved enterprise spatial system
US8930989B2 (en) * 2007-08-20 2015-01-06 AdsVantage System and method for providing supervised learning to associate profiles in video audiences
CN102546782B (zh) * 2011-12-28 2015-04-29 北京奇虎科技有限公司 一种分布式系统及其数据操作方法
US9940111B2 (en) * 2013-12-18 2018-04-10 Red Hat, Inc. Policy-based application deployment to a target application platform system

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6263298B1 (en) * 1998-08-13 2001-07-17 Precise Software Solutions Ltd. Method for analyzing system performance
CN101753478A (zh) * 2008-12-05 2010-06-23 中国移动通信集团公司 一种分布式电子邮件系统及其服务方法
CN101710901A (zh) * 2009-10-22 2010-05-19 乐视网信息技术(北京)股份有限公司 一种具有p2p功能的分布式存储系统和方法
CN102567438A (zh) * 2010-09-28 2012-07-11 迈塔斯威士网络有限公司 对分布式存储系统中的数据项进行访问的方法
CN102594852A (zh) * 2011-01-04 2012-07-18 中国移动通信集团公司 数据访问方法、节点及系统
CN102752381A (zh) * 2012-06-28 2012-10-24 北京邮电大学 一种应用于分布式存储的多活动副本机制及其存取方法

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107924337A (zh) * 2015-11-13 2018-04-17 谷歌有限责任公司 分布式存储系统中的性能监测
CN107835080A (zh) * 2017-11-09 2018-03-23 成都国盛天丰网络科技有限公司 一种分布式系统数据收集方法及数据签名生成方法
CN108519861A (zh) * 2018-04-02 2018-09-11 广东能龙教育股份有限公司 一种基于提供大规模并行访问的动态存储方法
WO2021189670A1 (zh) * 2020-03-26 2021-09-30 上海依图网络科技有限公司 数据同步方法、数据同步系统及其装置、介质和系统
WO2023109864A1 (zh) * 2021-12-16 2023-06-22 华为技术有限公司 一种数据系统、数据访问方法及设备

Also Published As

Publication number Publication date
CN104754021B (zh) 2018-04-13
US20150186520A1 (en) 2015-07-02
US11314694B2 (en) 2022-04-26

Similar Documents

Publication Publication Date Title
US9900378B2 (en) Node device function and cache aware task assignment
US12033000B2 (en) Automated device selection and provisioning for distributed computing workloads
US11714853B2 (en) Efficient storage and searching of vector datasets
Qiu et al. Optimal big data sharing approach for tele-health in cloud computing
CN104754021A (zh) 用于促进对分布式存储系统中的数据的访问的装置和方法
Curino et al. Mobile data collection in sensor networks: The TinyLime middleware
US10516726B2 (en) Data partitioning in internet-of-things (IOT) network
CN104335137B (zh) 管理计算系统的功耗和性能
CN102591921A (zh) 个人数据中心内的调度和管理
CA2974556C (en) Compilation for node device gpu-based parallel processing
US20190320022A1 (en) Quality of service knobs for visual data storage
CN109376866B (zh) 元数据的记录方法及装置、量子程序的运行方法及装置
Trivedi et al. Sharing and caring of data at the edge
US9742867B1 (en) Network data retrieval
CN110413845B (zh) 基于物联网操作系统的资源存储方法及装置
US20190228009A1 (en) Information processing system and information processing method
US11522807B2 (en) Computationally efficient analysis and management of systems modeled as networks
CN104754008A (zh) 网络存储节点、网络存储系统以及用于网络存储节点的装置和方法
US20160006633A1 (en) Monitoring item selection method and device, and storage medium
US10642530B2 (en) Global occupancy aggregator for global garbage collection scheduling
CN103136322A (zh) 用于配置查询的装置和方法
CN104951855A (zh) 用于促进对资源的管理的装置和方法
CN116910568B (zh) 图神经网络模型的训练方法及装置、存储介质及电子装置
CN104063377A (zh) 信息处理方法和使用其的电子设备
Mansouri An effective weighted data replication strategy for data grid

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20200410

Address after: Massachusetts, USA

Patentee after: EMC IP Holding Company LLC

Address before: Massachusetts, USA

Patentee before: EMC Corp.