CN104202387B - 一种元数据恢复方法及相关装置 - Google Patents

一种元数据恢复方法及相关装置 Download PDF

Info

Publication number
CN104202387B
CN104202387B CN201410427894.2A CN201410427894A CN104202387B CN 104202387 B CN104202387 B CN 104202387B CN 201410427894 A CN201410427894 A CN 201410427894A CN 104202387 B CN104202387 B CN 104202387B
Authority
CN
China
Prior art keywords
metadata
data block
information
file destination
client
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201410427894.2A
Other languages
English (en)
Other versions
CN104202387A (zh
Inventor
刘洋
张克星
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Cloud Computing Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Priority to CN201410427894.2A priority Critical patent/CN104202387B/zh
Publication of CN104202387A publication Critical patent/CN104202387A/zh
Priority to PCT/CN2015/083226 priority patent/WO2016029744A1/zh
Application granted granted Critical
Publication of CN104202387B publication Critical patent/CN104202387B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L65/00Network arrangements, protocols or services for supporting real-time applications in data packet communication
    • H04L65/40Support for services or applications

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本发明实施例公开了一种元数据恢复方法及相关装置,该方法可包括:接收对目标文件的写操作请求,其中,所述目标文件保存在多个数据节点上;从元数据节点获取所述目标文件的元数据,所述目标文件的元数据包含所述多个数据节点的信息;根据所述目标文件的元数据生成元数据恢复信息;向所述多个数据节点中的至少一个数据节点发送所述元数据恢复信息,所述元数据恢复信息用于被所述至少一个数据节点进行保存,并在所述元数据节点出现异常后被发送到所述元数据节点进行所述元数据的恢复。本发明实施例可以恢复NN异常时的元数据。

Description

一种元数据恢复方法及相关装置
技术领域
本发明涉及通信领域,尤其涉及一种元数据恢复方法及相关装置。
背景技术
Hadoop是目前通信领域中应用十分广泛的分布式系统架构,在Hadoop中包含一个非常重要的存储组件,即Hadoop分布式文件系统(Hadoop Distributed File System,简称HDFS)。其中,HDFS包括元数据节点(NameNode,简称NN)和数据节点(DataNode,简称DN),NN主要用来提供文件的元数据服务,该服务中NN在内存会生成该文件的元数据,元数据可以表示该文件的数据结构,而DN主要用来存储文件的实际数据。在实际应用中当NN出现异常时,这样该NN就会出现元数据丢失的问题,以导致该NN失效。
其中,目前主要通过如下技术解决上述问题:
在NN内部开启一个定时线程,该线程定期将NN内存中的元数据写到本地磁盘或者远端存储设备形成一个特定文件。当NN出现异常后,NN在重新启动过程中加载该特定文件,以恢复之前的某一时段的元数据,以实现NN恢复到这一时段的内存状态。
但上述技术方案中,由于是定期的存储NN内的元数据,例如:每隔十分钟存储一次元数据,这样当NN出现异常的时间点还未到十分钟一次的存储时间点时,那么NN内的出现异常时的元数据不会存储,从而这部分元数据就无法恢复。可见,上述技术方案中无法恢复NN异常时的元数据。
发明内容
本发明提供了一种元数据恢复方法及相关装置,可以恢复NN异常时的元数据。
第一方面,本发明提供一种元数据恢复方法,包括:
接收对目标文件的写操作请求,其中,所述目标文件保存在多个DN上;
从NN获取所述目标文件的元数据,所述目标文件的元数据包含所述多个DN的信息;
根据所述目标文件的元数据生成元数据恢复信息;
向所述多个DN中的至少一个DN发送所述元数据恢复信息,所述元数据恢复信息用于被所述至少一个DN进行保存,并在所述NN出现异常后被发送到所述NN进行所述元数据的恢复。
在第一方面的第一种可能的实现方式中,所述目标文件被划分为多个数据块,所述多个数据块被保存在所述多个DN上;
则,所述从NN获取所述目标文件的元数据,根据所述目标文件的元数据生成元数据恢复信息包括:
从所述NN获取所述多个数据块的元数据,每个数据块的元数据包含每个数据块的信息和所述每个数据块所在的DN的信息;
根据所述每个数据块的元数据,生成所述每个数据块的元数据恢复信息。
结合第一方面的第一种可能的实现方式,在第二种可能实现方式中,所述从所述NN获取所述多个数据块的元数据包括:
依次接收所述NN发送的所述每个数据块的元数据;或者,接收所述NN根据所述目标文件的写操作请求一次性发送的所有数据块的元数据。
结合第一方面的第一种可能的实现方式或者第二种可能的实现方式,在第三种可能实现方式中,所述接收的元数据至少包括第一数据块的元数据和第二数据块的元数据,其中:
所述生成的所述第一数据块的元数据恢复信息包括:
所述目标文件的属性信息和所述第一数据块在所述目标文件中的位置信息;
所述生成的所述第二数据块的元数据恢复信息包括:
所述第二数据块在所述目标文件中的位置信息。
第三方面,本发明提供一种元数据恢复方法,包括:
接收客户端发送的目标文件的元数据恢复信息,并保存所述元数据恢复信息,其中,所述元数据恢复信息是所述客户端在接收对目标文件的写操作请求时,从NN获取的所述目标文件的元数据,并根据所述元数据生成的元数据恢复信息.;
在所述NN出现异常后,向所述NN发送所述元数据恢复信息,元数据恢复信息被所述NN用于进行所述元数据的恢复。
在第二方面的第一种可能的实现方式中,所述目标文件被划分为多个数据块,所述接收客户端发送的目标文件的元数据恢复信息,包括:
接收所述客户端发送的所述目标文件的数据块的元数据恢复信息,所述数据块的元数据恢复信息为所述客户端根据该数据块的元数据生成的元数据恢复信息。
结合第二方面的第一种可能的实现方式,在第二方面的第二种可能的实现方式中,所述接收所述客户端发送的所述目标文件的数据块的元数据恢复信息包括:
依次接收所述客户端点发送的所述目标文件的多个数据块的元数据恢复信息;或者,接收所述客户端一次性发送的所述目标文件的多个数据块的元数据恢复信息。
结合第二方面的第一种可能的实现方式或者第二种可能的实现方式中,在第二方面的第三种可能的实现方式中,所述接收的元数据恢复信息至少包括第一数据块的元数据恢复信息和第二数据块的元数据恢复信息,其中:
所述第一数据块的元数据恢复信息包括:
所述目标文件的属性信息和所述第一数据块在所述目标文件中的位置信息;
所述第二数据块的元数据恢复信息包括:
所述第二数据块在所述目标文件中的位置信息。
第三方面,本发明提供一种元数据恢复方法,包括:
接收客户端发送的对目标文件进行写操作请求,其中,所述目标文件保存在多个DN上;
生成所述目标文件的元数据,并向所述客户端发送所述元数据,其中,所述元数据包含所述多个DN的信息;
当本端出现异常时,接收所述多个DN中的至少一个DN发送的元数据恢复信息,并根据所述元数据恢复信息恢复所述元数据,其中,所述元数据恢复信息是所述客户端根据所述元数据生成的,由所述客户端发送至所述至少一个DN进行保存的元数据恢复信息。
在第三方面的第一种可能的实现方式中,所述目标文件被划分为多个数据块,所述多个数据块被保存在所述多个DN上;
则所述生成所述目标文件的元数据,并向所述客户端发送所述元数据包括:
生成所述多个数据块的元数据,并向所述客户端发送所述多个数据块的元数据,每个数据块的元数据包含每个数据块的信息和所述每个数据块所在的DN的信息;
所述接收所述多个DN中的至少一个DN发送的元数据恢复信息,并根据所述元数据恢复信息恢复所述元数据,包括:
接收所述多个DN中的至少一个DN发送的所述多个数据块的元数据恢复信息,并根据所述多个数据块的元数据恢复信息恢复所述目标文件的元数据。
结合第三方面的第一种可能的实现方式,在第三方面的第二种可能的实现方式中,所述向所述客户端发送所述多个数据块的元数据包括:
依次向所述客户端发送所述多个数据块的元数据;或者,根据所述目标文件的写操作请求一次性向所述客户端发送所有数据块的元数据。
结合第三方面的第一种可能的实现方式或者第二种可能的实现方式,在第三方面的第三种可能的实现方式中,所述多个数据块至少包括第一数据块和第二数据块,其中:
所述第一数据块的元数据恢复信息包括:
所述目标文件的属性信息和所述第一数据块在所述目标文件中的位置信息;
所述第二数据块的元数据恢复信息包括:
所述第二数据块在所述目标文件中的位置信息。
第四方面,本发明提供一种客户端,包括:接收单元、获取单元、生成单元和发送单元,其中:
所述接收单元,用于接收对目标文件的写操作请求,其中,所述目标文件保存在多个DN上;
所述获取单元,用于从NN获取所述目标文件的元数据,所述目标文件的元数据包含所述多个DN的信息;
所述生成单元,用于根据所述目标文件的元数据生成元数据恢复信息;
所述发送单元,用于向所述多个DN中的至少一个DN发送所述元数据恢复信息,所述元数据恢复信息用于被所述至少一个DN进行保存,并在所述NN出现异常后被发送到所述NN进行所述元数据的恢复。
在第四方面的第一种可能的实现方式中,所述目标文件被划分为多个数据块,所述多个数据块被保存在所述多个DN上;
则,所述获取单元用于从所述NN获取所述多个数据块的元数据,每个数据块的元数据包含每个数据块的信息和所述每个数据块所在的DN的信息;
所述生成单元用于根据所述每个数据块的元数据,生成所述每个数据块的元数据恢复信息。
结合第四方面的第一种可能的实现方式,在第四方面的第二种可能的实现方式中,所述获取单元用于依次接收所述NN发送的所述每个数据块的元数据;或者,所述获取单元用于接收所述NN根据所述目标文件的写操作请求一次性发送的所有数据块的元数据。
结合第四方面的第一种可能的实现方式或者第二种可能的实现方式,在第四方面的第三种可能的实现方式中,所述接收的元数据至少包括第一数据块的元数据和第二数据块的元数据,其中:
所述生成的所述第一数据块的元数据恢复信息包括:
所述目标文件的属性信息和所述第一数据块在所述目标文件中的位置信息;
所述生成的所述第二数据块的元数据恢复信息包括:
所述第二数据块在所述目标文件中的位置信息。
第五方面,本发明提供一种DN,包括:接收单元和发送单元,其中:
所述接收单元,用于接收客户端发送的目标文件的元数据恢复信息,并保存所述元数据恢复信息,其中,所述元数据恢复信息是所述客户端在接收对目标文件的写操作请求时,从NN获取的所述目标文件的元数据,并根据所述元数据生成的元数据恢复信息.;
所述发送单元,用于在所述NN出现异常后,向所述NN发送所述元数据恢复信息,元数据恢复信息被所述NN用于进行所述元数据的恢复。
在第五方面的第一种可能的实现方式中,所述目标文件被划分为多个数据块,所述接收单元用于接收所述客户端发送的所述目标文件的数据块的元数据恢复信息,所述数据块的元数据恢复信息为所述客户端根据该数据块的元数据生成的元数据恢复信息。
结合第五方面的第一种可能的实现方式,在第五方面的第二种可能的实现方式中,所述接收单元用于依次接收所述客户端点发送的所述目标文件的多个数据块的元数据恢复信息;或者,所述接收单元用于接收所述客户端一次性发送的所述目标文件的多个数据块的元数据恢复信息。
结合第五方面的第一种可能的实现方式或者第二种可能的实现方式,在第三种可能的实现方式中,所述接收的元数据恢复信息至少包括第一数据块的元数据恢复信息和第二数据块的元数据恢复信息,其中:
所述第一数据块的元数据恢复信息包括:
所述目标文件的属性信息和所述第一数据块在所述目标文件中的位置信息;
所述第二数据块的元数据恢复信息包括:
所述第二数据块在所述目标文件中的位置信息。
第六方面,本发明提供一种NN,包括:接收单元、生成单元和恢复单元,其中:
所述接收单元,用于接收客户端发送的对目标文件进行写操作请求,其中,所述目标文件保存在多个DN上;
所述生成单元,用于生成所述目标文件的元数据,并向所述客户端发送所述元数据,其中,所述元数据包含所述多个DN的信息;
所述恢复单元,用于当本端出现异常时,接收所述多个DN中的至少一个DN发送的元数据恢复信息,并根据所述元数据恢复信息恢复所述元数据,其中,所述元数据恢复信息是所述客户端根据所述元数据生成的,由所述客户端发送至所述至少一个DN进行保存的元数据恢复信息。
在第六方面的第一种可能的实现方式中,所述目标文件被划分为多个数据块,所述多个数据块被保存在所述多个DN上;
所述生成单元用于生成所述多个数据块的元数据,并向所述客户端发送所述多个数据块的元数据,每个数据块的元数据包含每个数据块的信息和所述每个数据块所在的DN的信息;
所述恢复单元用于当本端出现异常时,接收所述多个DN中的至少一个DN发送的所述多个数据块的元数据恢复信息,并根据所述多个数据块的元数据恢复信息恢复所述目标文件的元数据。
结合第六方面的第一种可能的实现方式,在第二种可能的实现方式中,所述生成单元用于生成所述多个数据块的元数据,并依次向所述客户端发送所述多个数据块的元数据;或者,所述生成单元用于生成所述多个数据块的元数据,并根据所述目标文件的写操作请求一次性向所述客户端发送所有数据块的元数据。
结合第六方面的第一种可能的实现方式或者第二种可能的实现方式,在第三种可能的实现方式中,所述多个数据块至少包括第一数据块和第二数据块,其中:
所述第一数据块的元数据恢复信息包括:
所述目标文件的属性信息和所述第一数据块在所述目标文件中的位置信息;
所述第二数据块的元数据恢复信息包括:
所述第二数据块在所述目标文件中的位置信息。
上述技术方案中,接收对目标文件的写操作请求,再从NN获取所述目标文件的元数据,根据所述目标文件的元数据生成元数据恢复信息,再向所述多个DN中的至少一个DN发送所述元数据恢复信息。这样该元数据恢复信息就可以用于被所述至少一个DN进行保存,并在所述NN出现异常后被发送到所述NN进行所述元数据的恢复。从而可以恢复NN出异常时的元数据。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的一种可选的元数据的示意图;
图2是本发明实施例提供的一种元数据恢复方法的流程示意图;
图3是本发明实施例提供的另一种元数据恢复方法的流程示意图;
图4是本发明实施例提供的一种可选的数据信息的示意图;
图5是本发明实施例提供的另一种元数据恢复方法的流程示意图;
图6是本发明实施例提供的另一种元数据恢复方法的流程示意图;
图7是本发明实施例提供的另一种元数据恢复方法的流程示意图;
图8是本发明实施例提供的一种客户端的结构示意图;
图9是本发明实施例提供的一种DN的结构示意图;
图10是本发明实施例提供的一种NN的结构示意图;
图11是本发明实施例提供的另一种元数据恢复设备的结构示意图;
图12是本发明实施例提供的一种DN设备的结构示意图;
图13是本发明实施例提供的一种NN设备的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例中,元数据可以是用于表示文件数据结构的数据,其中,文件的元数据具体可以表示该文件所在的HDFS系统的版本信息和该文件的属性信息,例如:文件的元数据包括的HDFS系统的版本信息可以包括如下一项或者多项:
HDFS系统的版本信息(例如:imgVersion)、名称空间标识(例如:namespaceID)、HDFS系统的文件个数(例如:numFiles)和HDFS系统的时间戳(例如:genStamp);
文件的元数据包括的该文件的属性信息可以包括如下一项或者多项:
文件的路径(例如:Path)、文件的副本数(例如:replicas)、文件的访问时间(例如:atime)、文件的每个数据块大小(例如:blockSize)、文件的数据块的块数(例如:numBlock)、文件占据的空间的限制信息(例如:nsQuota和dsQuota)和用户权限信息(例如:username、group和perm)。
另外,当文件包括多个数据块时,文件的元数据还可以包括各数据块的元数据,其中,数据块的元数据包括该数据块所属的文件的属性信息和该数据块的属性信息;其中,数据块的属性信息可以包括如下一项或者多项:
数据块标识(例如:BlockId)、数据块存储的数据量(例如:numBytes)和数据块的时间戳(例如:genStamp)。另外,文件的属性信息上面已经介绍,此处不重复说明。
例如:文件的元数据可以如图1所示,文件的元数据可以包括图1中的三行数据,其中,第一行表示HDFS系统的版本信息,第二行表示文件的属性信息,第三行表示数据块的元数据。即文件的元数据可以包括HDFS系统的版本信息、文件的属性信息和数据块的元数据。
另外,本发明实施例应用的场景可以是单个设备,即该设备上包括HDFS的客户端、至少一个NN和至少一个DN;或者本发明实施例应用的场景可以是设备集群,即HDFS的客户端、至少一个NN和至少一个DN部署在多个设备上。其中,上述设备可以是网络侧设备,例如:基站、服务器、控制器等设备,上述设备还可以是用户侧设备,例如:计算机、平板电脑、手机、电子阅读器、遥控器、笔记本电脑、车载设备、网络电视、可穿戴设备等具有网络功能的智能设备。
请参阅图2,图2是本发明实施例提供的一种元数据恢复方法的流程示意图,如图2所示,包括以下步骤:
201、接收对目标文件的写操作请求,其中,所述目标文件保存在多个DN上。
上述目标文件保存在多个DN上可以是响应上述写操作请求,将上述目标文件保存在多个DN上,其中,该保存过程的时间不作限定,例如:可以是在步骤204之后,或者在步骤204之前。
202、从NN获取所述目标文件的元数据,所述目标文件的元数据包含所述多个DN的信息。
可选的,当接收到上述写操作请求时,本端就可以向NN申请用于保存目标文件的多个DN,从而NN就可以为该目标文件分配NN,以及生成该目标文件的元数据,并将该目标文件的元数据返回到上述本端。另外,上述多个DN的信息可以是各DN保存上述目标文件的路径信息,例如:上述介绍的文件的属性信息中的文件的路径。
203、根据所述目标文件的元数据生成元数据恢复信息。
可选的,上述元数据恢复信息可以包括该目标文件的元数据,例如:包括目标文件的属性信息。其中,该属性信息可以包括该目标文件的如下一项或者多项:
HDFS系统的版本信息、文件名、文件占据的空间的限制信息、用户权限信息、文件的每个数据块大小、文件的数据块的块数。
其中,上述文件名还可以携带有文件的路径信息。
204、向所述多个DN中的至少一个DN发送所述元数据恢复信息,所述元数据恢复信息用于被所述至少一个DN进行保存,并在所述NN出现异常后被发送到所述NN进行所述元数据的恢复。
可选的,上述方法可以应用于HDFS的客户端(Client),即该客户端可以实现上述方法。
上述技术方案中,接收对目标文件的写操作请求,再从NN获取所述目标文件的元数据,根据所述目标文件的元数据生成元数据恢复信息,再向所述多个DN中的至少一个DN发送所述元数据恢复信息。这样该元数据恢复信息就可以用于被所述至少一个DN进行保存,并在所述NN出现异常后被发送到所述NN进行所述元数据的恢复。从而可以恢复NN出异常时的元数据。
请参阅图3,图3是本发明实施例提供的另一种元数据恢复方法的流程示意图,如图3所示,包括以下步骤:
301、接收对目标文件的写操作请求,其中,所述目标文件被划分为多个数据块,所述多个数据块被保存在所述多个DN上。
可选的,对目标文件进行数据写操作可以是以数据块为单位进行写操作,即一个目标文件可以被划分为多个数据块中,其中,每个数据块的大小可以是相同。例如:每个数据块可以是64兆(MB)或者128MB等。另外,上述数据块的大小可以是数据块的存储空间大小,但在实际应用中一个文件的各数据块存储的该文件的数据量可以是不同的,例如:一个文件包含150MB数据,而每个数据块的大小为64MB,那么该文件的第一个数据块就可以存储该文件的64MB数据,而第二个数据块就可以存储该文件的64MB数据,而第三个数据块就可以存储该文件的22MB数据。
302、从所述NN获取所述多个数据块的元数据,每个数据块的元数据包含每个数据块的信息和所述每个数据块所在的DN的信息。
可选的,当接收到上述写操作请求时,本端就可以向NN申请用于保存目标文件的多个数据块,以及保存数据块的多个DN。这样从而NN就可以为该目标文件分配数据块,以及数据块所在的DN,以及生成每个数据块的元数据,并将每个数据块的元数据返回到上述本端。另外,上述数据块的信息可以是数据块的属性信息,例如:数据块标识和数据块的时间戳。上述多个DN的信息可以是各DN保存数据块的路径信息,例如:上述介绍的文件的属性信息中的文件的路径。
303、根据所述每个数据块的元数据,生成所述每个数据块的元数据恢复信息。
可选的,上述数据块的元数据恢复信息可以包括该数据块的元数据,例如:包括目标文件的属性信息。
304、向所述多个DN中的至少一个DN发送所述元数据恢复信息,所述元数据恢复信息用于被所述至少一个DN进行保存,并在所述NN出现异常后被发送到所述NN进行所述目标文件的元数据的恢复。
由于上述元数据恢复信息被一个或者多个DN保存,这样可以防止单个DN出现异常后,导致该元数据恢复信息丢失。
可选的,上述从所述NN获取所述多个数据块的元数据可以包括:
依次接收所述NN发送的所述每个数据块的元数据。
例如:本端可以是每次向NN申请一个数据块,这样NN就会为目标文件分配一个数据块,以及生成该数据块的元数据,并将该数据块的元数据返回到上述本端。当上述数据块被写完时,而目标文件还没有被写完,本端再向NN申请另一个数据块,NN就会为目标文件分配另一个数据块,以及生成该数据块的元数据,并将该数据块的元数据返回到上述本端。当上述数据块被写完时,而目标文件还没有被写完,继续向NN申请数据块,直到目标文件被写完。从而步骤303可以是本端每获取一个数据块的元数据,再生成该数据块的元数据恢复信息,步骤304再将该数据块的元数据恢复信息发送至上述至少一个DN。
可选的,上述从所述NN获取所述多个数据块的元数据可以包括:
接收所述NN根据所述目标文件的写操作请求一次性发送的所有数据块的元数据。
例如:本端可以是一次性向NN申请多个数据块,这样NN就会为目标文件分配多个数据块,以及生成这些数据块的元数据,并将这些数据块的元数据返回到上述本端。从而步骤303可以是一次性生成多个数据块的元数据恢复信息,步骤304再将这多个数据块的元数据恢复信息发送至上述至少一个DN。
可选的,上述接收的元数据至少包括第一数据块的元数据和第二数据块的元数据,即目标文件至少被划分为第一数据块和第二数据块。
其中,上述生成的所述第一数据块的元数据恢复信息可以包括:
所述目标文件的属性信息和所述第一数据块在所述目标文件中的位置信息。
其中,目标文件的属性信息可以包括:
HDFS系统的版本信息、文件名、文件的副本数、文件的每个数据块大小、文件占据的空间的限制信息和用户权限信息。
上述第一数据块在所述目标文件中的位置信息可以是指,第一数据块的目标文件的数据块序号,例如:第一数据块可以是目标文件的序号为1的数据块,其中,序号为1的数据块可以是目标文件中时间戳最早的一个数据块;上述第一数据块在所述目标文件中的位置信息可以包括:
数据块序号和文件结束数据块信息。
上述生成的所述第二数据块的元数据恢复信息可以包括:
所述第二数据块在所述目标文件中的位置信息。
上述第二数据块在所述目标文件中的位置信息可以包括:
数据块序号和文件结束数据块信息。
另外,第二数据块的元数据恢复信息还可以包括HDFS系统的版本信息和文件名,这样就可以清楚地知道第二数据块的元数据恢复信息是用于恢复哪个文件的数据块,以及该文件的HDFS系统的版本信息。
例如:如图4a所示,第一数据块的元数据恢复信息可以包括:
HDFS系统的版本信息、文件名、文件的副本数、文件的每个数据块大小、文件占据的空间的限制信息、用户权限信息、数据块序号和文件结束数据块信息。
如图4b所示,第一数据块的元数据恢复信息可以包括:
HDFS系统的版本信息、文件名、数据块序号和文件结束数据块信息。
其中,文件结束数据块信息可以是用当前数据块是否为结束Block的信息表示,例如:上述第一数据块的元数据恢复信息中的文件结束数据块信息可以用假(false)表示;当上述目标文件只包括两个数据块时,那么,上述第一数据块的元数据恢复信息中的文件结束数据块信息可以用真(true)表示;当上述目标文件包括三个或者三个以上的数据块时,上述第一数据块的元数据恢复信息和上述第二数据块的元数据恢复信息中的文件结束数据块信息可以用假(false)表示;即该实施方式中,只有目标文件的最后一个数据块对应的文件结束数据块信息才用真(true)表示,其余的都用假(false)表示,从而可以根据文件结束数据块信息可以确定目标文件包括的数据块的个数。
另外,由于一个文件内各数据块的元数据都可以包括文件的属性信息,而文件的属性信息是相同的,例如:文件占据的空间的限制信息、用户权限信息、数据块的大小信息和副本数等信息是相同的,这样就只需要在其中一个数据块的元数据恢复信息中写入这些信息即可,从而可以节省其他DN的存储空间。
另外,上述仅举例了所述第一数据块和第二数据块的元数据恢复信息的多种可选的实施方式,本实施例中对此不作限定,例如:第一数据块的元数据恢复信息也可以包括:
HDFS系统的版本信息、文件名、文件的副本数、文件的访问时间、文件的数据块的块数、文件占据的空间的限制信息、用户权限信息、数据块标识、数据块的大小和数据块时间戳。
可选的,本方法中每获取NN发送的数据块的元数据之前,都可以是向NN发送数据块的申请请求,NN接收到该请求后,就可以为目标文件分配数据块,以及存储该数据块的DN。另外,在步骤301之前,所述方法还可以包括以下步骤:
创建目标文件,并生成该目标文件的概要信息。例如:生成该文件的文件名等信息。
可选的,上述方法可以应用于HDFS的客户端(Client),即该客户端可以实现上述方法。
上述技术方案中,接收对目标文件的写操作请求,从NN获取多个数据块的元数据,再根据所述每个数据块的元数据,生成所述每个数据块的元数据恢复信息,从而可以向所述多个DN中的至少一个DN发送所述元数据恢复信息。这样元数据恢复信息可以用于被所述至少一个DN进行保存,并在所述NN出现异常后被发送到所述NN进行所述元数据的恢复。从而当NN出现异常后,可以及时恢复NN在出现异常时生成的元数据。
请参阅图5,图5是本发明实施例提供的另一种元数据恢复方法的流程示意图,如图5所示,包括以下步骤:
501、接收客户端发送的目标文件的元数据恢复信息,并保存所述元数据恢复信息,其中,所述元数据恢复信息是所述客户端在接收对目标文件的写操作请求时,从NN获取的所述目标文件的元数据,并根据所述元数据生成的元数据恢复信息.。
其中,上述目标文件所述目标文件保存在多个DN上,且上述元数据包括所述多个DN的信息。
可选的,步骤501可以是将元数据恢复信息存储在本地,或者将元数据恢复信息存储第三方面存储设备上。
502、在所述NN出现异常后,向所述NN发送所述元数据恢复信息,元数据恢复信息被所述NN用于进行所述元数据的恢复。
可选的,本方法可以应用于HDFS的DN。
上述技术方案中,接收客户端发送的目标文件的元数据恢复信息,并保存所述元数据恢复信息;在所述NN出现异常后,向所述NN发送所述元数据恢复信息,元数据恢复信息被所述NN用于进行所述元数据的恢复。从而可以实现恢复NN出异常时的元数据。
请参阅图6,图6是本发明实施例提供的另一种元数据恢复方法的流程示意图,如图6所示,包括以下步骤:
601、接收所述客户端发送的所述目标文件的数据块的元数据恢复信息,并保存所述元数据恢复信息,其中,所述元数据恢复信息是所述客户端在接收对目标文件的写操作请求时,所述客户端根据该数据块的元数据生成的元数据恢复信息.。
其中,上述目标文件被划分为多个数据块,且上述每个数据块的元数据包含每个数据块的信息和所述每个数据块所在的DN的信息。
可选的,步骤601接收到元数据恢复信息可以是一个或者多个数据块的元数据恢复信息。例如:目标文件被划分为多个数据块,其中,执行本方法的DN可以是保存其中一个或者多个数据块的元数据恢复信息。
可选的,步骤601可以是将上述元数据恢复信息保存在一个特定文件内,例如:保存在命名为:blk_blockId_genstamp.blockmeta的文件内,其中,该文件的名称可以包括数据块的标识,且该文件名称还可以包括数据块的时间戳,例如:DN在接收到数据块的元数据恢复信息的同时,还可以接收到客户端发送的数据的标识和数据块的时间戳。另外,该文件内还可以将客户端在上述数据块中写入的该目标文件的数据保存至另一个特定的文件内,例如:保存在命名为:blk_blockId的文件内。当客户端还写入了上述数据块的循环冗余校验码(Cyclic Redundancy Check,CRC),本方法还可以将该CRC保存用于保存上述元数据恢复信息的特定文件内,即将上述元数据恢复信息和CRC存储在同一个特定文件内,当然,本方法还可以将CRC存储在一个专门用于存储CRC的特定文件内。另外,上述两个特定文件可以是接收到上述数据信息之前设置好的,例如:接收到客户端发送的写请求时,生成上述两个特定文件。由于步骤601将上述数据信息以文件的形式进行存储,这样可以实现数据仓库工(例如:Hive)功能,或者Spark功能,其中,Spark是一个基于内存计算的开源的集群计算系统,目的是让数据分析更加快速。
另外,上述元数据恢复信息还可以是预定义的数据格式进行保存,例如:以HBase的数据格式进行保存,其中,HBase是一个分布式的、面向列的开源数据库。
可选的,在获取到上述元数据恢复信息时,还可以在内存中保存上述元数据恢复信息,这样可以更快速地发送该元数据恢复信息。可以直接将内存的元数据恢复信息上传到NN。另外,当实现本方法的DN重新启动后,可以扫描本地存储的元数据恢复信息,再将该元数据恢复信息上传给NN。
602、在所述NN出现异常后,向所述NN发送所述元数据恢复信息,元数据恢复信息被所述NN用于进行所述目标文件的元数据的恢复。
例如:DN在NN重新启动时,会接收到该NN发送的通知消息,该通知消息用于请求发送上述数据信息,这样就可以响应消息通知消息,以返回上述元数据恢复信息。
可选的,所述接收所述客户端发送的所述目标文件的数据块的元数据恢复信息包括:
依次接收所述客户端点发送的所述目标文件的多个数据块的元数据恢复信息;或者,接收所述客户端一次性发送的所述目标文件的多个数据块的元数据恢复信息。
可选的,所述接收的元数据恢复信息至少可以包括第一数据块的元数据恢复信息和第二数据块的元数据恢复信息,其中:
所述第一数据块的元数据恢复信息可以包括:
所述目标文件的属性信息和所述第一数据块在所述目标文件中的位置信息;
所述第二数据块的元数据恢复信息可以包括:
所述第二数据块在所述目标文件中的位置信息。
另外,本实施例中,当所述生成的元数据出现异常后,可以是向NN发送目标文件的所有数据块的元数据恢复信息。例如:当DN接收到NN异常重启的通知消息后,响应该通知消息扫描本地或者内存中所有数据块的元数据恢复信息,并向NN上传所有数据块的元数据恢复信息。
可选的,上述方法可以应用于HDFS的DN,即该DN可以实现上述方法。
上述技术方案中,接收所述客户端发送的所述目标文件的数据块的元数据恢复信息,并保存所述元数据恢复信息,在所述NN出现异常后,向所述NN发送所述元数据恢复信息,元数据恢复信息被所述NN用于进行所述元数据的恢复。从而可以及时恢复NN在出现异常时生成的元数据。
请参阅图7,图7是本发明实施例提供的另一种元数据恢复方法的流程示意图,如图7所示,包括以下步骤:
701、接收客户端发送的对目标文件进行写操作请求,其中,所述目标文件保存在多个DN上。
702、生成所述目标文件的元数据,并向所述客户端发送所述元数据,其中,所述元数据包含所述多个DN的信息。
可选的,步骤702可以是接收到上述写操作请求后,为上述目标文件分配所述多个DN,再生成上述目标文件的元数据。
703、当本端出现异常时,接收所述多个DN中的至少一个DN发送的元数据恢复信息,并根据所述元数据恢复信息恢复所述元数据,其中,所述元数据恢复信息是所述客户端根据所述元数据生成的,由所述客户端发送至所述至少一个DN进行保存的元数据恢复信息。
这样当本端,即NN出现异常时,可以接收到上述至少一个DN发送的元数据恢复信息,从而可以恢复出上述目标文件的元数据。
可选的,上述目标文件可以被划分为多个数据块,所述多个数据块被保存在所述多个DN上;
则,上述生成所述目标文件的元数据,并向所述客户端发送所述元数据可以包括:
生成所述多个数据块的元数据,并向所述客户端发送所述多个数据块的元数据,每个数据块的元数据包含每个数据块的信息和所述每个数据块所在的DN的信息。
上述接收所述多个DN中的至少一个DN发送的元数据恢复信息,并根据所述元数据恢复信息恢复所述元数据,可以包括:
接收所述多个DN中的至少一个DN发送的所述多个数据块的元数据恢复信息,并根据所述多个数据块的元数据恢复信息恢复所述目标文件的元数据。
这样可以实现根据多个数据块的元数据恢复信息恢复目标文件的元数据。
可选的,向所述客户端发送所述多个数据块的元数据包括:
依次向所述客户端发送所述多个数据块的元数据;或者,根据所述目标文件的写操作请求一次性向所述客户端发送所有数据块的元数据。
可选的,上述多个数据块至少可以包括第一数据块和第二数据块,其中:
所述第一数据块的元数据恢复信息可以包括:
所述目标文件的属性信息和所述第一数据块在所述目标文件中的位置信息;
所述第二数据块的元数据恢复信息可以包括:
所述第二数据块在所述目标文件中的位置信息。
需要说明的是,本实施例中针对元数据和元数据恢复信息的定义可以参考图2或者图3所示的实施例,此处不作重复说明。
可选的,上述方法可以应用于HDFS内的NN。
上述技术方案中,接收客户端发送的对目标文件进行写操作请求,生成所述目标文件的元数据,并向所述客户端发送所述元数据;这样当本端出现异常时,接收所述多个DN中的至少一个DN发送的元数据恢复信息,并根据所述元数据恢复信息恢复所述元数据。从而可以恢复NN出异常时的元数据。
下面为本发明装置实施例,本发明装置实施例用于执行本发明方法实施例一至五实现的方法,为了便于说明,仅示出了与本发明实施例相关的部分,具体技术细节未揭示的,请参照本发明实施例一、实施例二、实施例三、实施例四和实施例五。
请参阅图8,图8是本发明实施例提供的一种客户端的结构示意图,如图8所示,包括:接收单元81、获取单元82、生成单元83和发送单元84,其中:
所述接收单元81,用于接收对目标文件的写操作请求,其中,所述目标文件保存在多个DN上。
所述获取单元82,用于从NN获取所述目标文件的元数据,所述目标文件的元数据包含所述多个DN的信息。
所述生成单元83,用于根据所述目标文件的元数据生成元数据恢复信息。
所述发送单元84,用于向所述多个DN中的至少一个DN发送所述元数据恢复信息,所述元数据恢复信息用于被所述至少一个DN进行保存,并在所述NN出现异常后被发送到所述NN进行所述元数据的恢复。
在另一个实施例中,所述目标文件被划分为多个数据块,所述多个数据块被保存在所述多个DN上;
则,获取单元82可以用于从所述NN获取所述多个数据块的元数据,每个数据块的元数据包含每个数据块的信息和所述每个数据块所在的DN的信息;
生成单元83可以用于根据所述每个数据块的元数据,生成所述每个数据块的元数据恢复信息。
该实施方式中,可以实现生成每个数据块的元数据恢复信息,以使NN根据多个数据块的元数据恢复信息恢复目标文件的元数据。
可选的,所述获取单元82可以用于依次接收所述NN发送的所述每个数据块的元数据;或者,所述获取单元82可以用于接收所述NN根据所述目标文件的写操作请求一次性发送的所有数据块的元数据。
可选的,上述接收的元数据至少可以包括第一数据块的元数据和第二数据块的元数据,其中:
所述生成的所述第一数据块的元数据恢复信息可以包括:
所述目标文件的属性信息和所述第一数据块在所述目标文件中的位置信息;
所述生成的所述第二数据块的元数据恢复信息可以包括:
所述第二数据块在所述目标文件中的位置信息。
可选的,上述客户端可以是HDFS的客户端(Client)。
上述技术方案中,接收对目标文件的写操作请求,再从NN获取所述目标文件的元数据,根据所述目标文件的元数据生成元数据恢复信息,再向所述多个DN中的至少一个DN发送所述元数据恢复信息。这样该元数据恢复信息就可以用于被所述至少一个DN进行保存,并在所述NN出现异常后被发送到所述NN进行所述元数据的恢复。从而可以恢复NN出异常时的元数据。
请参阅图9,图9是本发明实施例提供的一种DN的结构示意图,如图9所示,包括:接收单元91和发送单元92,其中:
接收单元91,用于接收客户端发送的目标文件的元数据恢复信息,并保存所述元数据恢复信息,其中,所述元数据恢复信息是所述客户端在接收对目标文件的写操作请求时,从NN获取的所述目标文件的元数据,并根据所述元数据生成的元数据恢复信息.。
发送单元92,用于在所述NN出现异常后,向所述NN发送所述元数据恢复信息,元数据恢复信息被所述NN用于进行所述元数据的恢复。
在另一个实施例中,所述目标文件被划分为多个数据块,所述接收单元91可以用于接收所述客户端发送的所述目标文件的数据块的元数据恢复信息,所述数据块的元数据恢复信息为所述客户端根据该数据块的元数据生成的元数据恢复信息。
可选的,接收单元91可以用于依次接收所述客户端点发送的所述目标文件的多个数据块的元数据恢复信息;或者,所述接收单元91可以用于接收所述客户端一次性发送的所述目标文件的多个数据块的元数据恢复信息。
可选的,上述接收的元数据恢复信息至少可以包括第一数据块的元数据恢复信息和第二数据块的元数据恢复信息,其中:
所述第一数据块的元数据恢复信息可以包括:
所述目标文件的属性信息和所述第一数据块在所述目标文件中的位置信息;
所述第二数据块的元数据恢复信息可以包括:
所述第二数据块在所述目标文件中的位置信息。
可选的,本节点可以是HDFS的DN。
上述技术方案中,接收客户端发送的目标文件的元数据恢复信息,并保存所述元数据恢复信息;在所述NN出现异常后,向所述NN发送所述元数据恢复信息,元数据恢复信息被所述NN用于进行所述元数据的恢复。从而可以实现恢复NN出异常时的元数据。
请参阅图10,图10是本发明实施例提供的一种NN的结构示意图,如图10所示,包括:接收单元101、生成单元102和恢复单元103,其中:
所述接收单元101,用于接收客户端发送的对目标文件进行写操作请求,其中,所述目标文件保存在多个DN上。
所述生成单元102,用于生成所述目标文件的元数据,并向所述客户端发送所述元数据,其中,所述元数据包含所述多个DN的信息。
所述恢复单元103,用于当本端出现异常时,接收所述多个DN中的至少一个DN发送的元数据恢复信息,并根据所述元数据恢复信息恢复所述元数据,其中,所述元数据恢复信息是所述客户端根据所述元数据生成的,由所述客户端发送至所述至少一个DN进行保存的元数据恢复信息。
在另一个实施例中,所述目标文件被划分为多个数据块,所述多个数据块被保存在所述多个DN上;
所述生成单元102可以用于生成所述多个数据块的元数据,并向所述客户端发送所述多个数据块的元数据,每个数据块的元数据包含每个数据块的信息和所述每个数据块所在的DN的信息;
所述恢复单元103可以用于当本端出现异常时,接收所述多个DN中的至少一个DN发送的所述多个数据块的元数据恢复信息,并根据所述多个数据块的元数据恢复信息恢复所述目标文件的元数据。
可选的,生成单元102可以用于生成所述多个数据块的元数据,并依次向所述客户端发送所述多个数据块的元数据;或者,所述生成单元102可以用于生成所述多个数据块的元数据,并根据所述目标文件的写操作请求一次性向所述客户端发送所有数据块的元数据。
可选的,上述多个数据块至少可以包括第一数据块和第二数据块,其中:
所述第一数据块的元数据恢复信息可以包括:
所述目标文件的属性信息和所述第一数据块在所述目标文件中的位置信息;
所述第二数据块的元数据恢复信息可以包括:
所述第二数据块在所述目标文件中的位置信息。
可选的,上述节点可以是HDFS内的NN。
上述技术方案中,接收客户端发送的对目标文件进行写操作请求,生成所述目标文件的元数据,并向所述客户端发送所述元数据;这样当本端出现异常时,接收所述多个DN中的至少一个DN发送的元数据恢复信息,并根据所述元数据恢复信息恢复所述元数据。从而可以恢复NN出异常时的元数据。
请参阅图11,图11是本发明实施例提供的另一种元数据恢复设备的结构示意图,包括至少一个处理器1102(例如CPU),至少一个网络接口1105或者其他通信接口,存储器1106,和至少一个通信总线1103,用于实现这些装置之间的连接通信。处理器1102用于执行存储器1106中存储的可执行模块,例如计算机程序。存储器1106可能包含高速随机存取存储器(RAM:Random Access Memory),也可能还包括非不稳定的存储器(non-volatilememory),例如至少一个磁盘存储器。通过至少一个网络接口1105(可以是有线或者无线)实现该系统网关与至少一个其他网元之间的通信连接,可以使用互联网,广域网,本地网,城域网等。
在一些实施方式中,存储器1106存储了程序11061,程序11061可以被处理器1102执行,这个程序包括:
接收对目标文件的写操作请求,其中,所述目标文件保存在多个DN上;
从NN获取所述目标文件的元数据,所述目标文件的元数据包含所述多个DN的信息;
根据所述目标文件的元数据生成元数据恢复信息;
向所述多个DN中的至少一个DN发送所述元数据恢复信息,所述元数据恢复信息用于被所述至少一个DN进行保存,并在所述NN出现异常后被发送到所述NN进行所述元数据的恢复。
在另一个实施例中,所述目标文件可以被划分为多个数据块,所述多个数据块可以被保存在所述多个DN上;处理器1102执行的从NN获取所述目标文件的元数据,根据所述目标文件的元数据生成元数据恢复信息的程序,可以包括:
从所述NN获取所述多个数据块的元数据,每个数据块的元数据包含每个数据块的信息和所述每个数据块所在的DN的信息;
根据所述每个数据块的元数据,生成所述每个数据块的元数据恢复信息。
可选的,处理器1102执行的从所述NN获取所述多个数据块的元数据的程序,可以包括:
依次接收所述NN发送的所述每个数据块的元数据;或者,接收所述NN根据所述目标文件的写操作请求一次性发送的所有数据块的元数据。
可选的,所述接收的元数据至少可以包括第一数据块的元数据和第二数据块的元数据,其中:
所述生成的所述第一数据块的元数据恢复信息可以包括:
所述目标文件的属性信息和所述第一数据块在所述目标文件中的位置信息;
所述生成的所述第二数据块的元数据恢复信息可以包括:
所述第二数据块在所述目标文件中的位置信息。
可选的,上述设备可以是HDFS的客户端(Client)所属的设备。
上述技术方案中,接收对目标文件的写操作请求;从NN获取所述目标文件的元数据;根据所述目标文件的元数据生成元数据恢复信息;向所述多个DN中的至少一个DN发送所述元数据恢复信息。这样元数据恢复信息可以用于被所述至少一个DN进行保存,并在所述NN出现异常后被发送到所述NN进行所述元数据的恢复,从而可以恢复NN出异常时的元数据。
请参阅图12,图12是本发明实施例提供的一种DN设备的结构示意图,包括至少一个处理器1202(例如CPU),至少一个网络接口1205或者其他通信接口,存储器1206,和至少一个通信总线1203,用于实现这些装置之间的连接通信。处理器1202用于执行存储器1206中存储的可执行模块,例如计算机程序。存储器1206可能包含高速随机存取存储器(RAM:Random Access Memory),也可能还包括非不稳定的存储器(non-volatile memory),例如至少一个磁盘存储器。通过至少一个网络接口1205(可以是有线或者无线)实现该系统网关与至少一个其他网元之间的通信连接,可以使用互联网,广域网,本地网,城域网等。
在一些实施方式中,存储器1206存储了程序12061,程序12061可以被处理器1202执行,这个程序包括:
接收客户端发送的目标文件的元数据恢复信息,并保存所述元数据恢复信息,其中,所述元数据恢复信息是所述客户端在接收对目标文件的写操作请求时,从NN获取的所述目标文件的元数据,并根据所述元数据生成的元数据恢复信息.;
在所述NN出现异常后,向所述NN发送所述元数据恢复信息,元数据恢复信息被所述NN用于进行所述元数据的恢复。
在另一个实施例中,所述目标文件被划分为多个数据块,处理器1202执行的接收客户端发送的目标文件的元数据恢复信息的程序,可以包括:
接收所述客户端发送的所述目标文件的数据块的元数据恢复信息,所述数据块的元数据恢复信息为所述客户端根据该数据块的元数据生成的元数据恢复信息。
可选的,处理器1202执行的接收所述客户端发送的所述目标文件的数据块的元数据恢复信息的程序,可以包括:
依次接收所述客户端点发送的所述目标文件的多个数据块的元数据恢复信息;或者,接收所述客户端一次性发送的所述目标文件的多个数据块的元数据恢复信息。
可选的,所述接收的元数据恢复信息至少可以包括第一数据块的元数据恢复信息和第二数据块的元数据恢复信息,其中:
所述第一数据块的元数据恢复信息可以包括:
所述目标文件的属性信息和所述第一数据块在所述目标文件中的位置信息;
所述第二数据块的元数据恢复信息可以包括:
所述第二数据块在所述目标文件中的位置信息。
可选的,本节点设备可以是HDFS的DN所属的设备。
上述技术方案中,接收客户端发送的目标文件的元数据恢复信息,并保存所述元数据恢复信息;在所述NN出现异常后,向所述NN发送所述元数据恢复信息,元数据恢复信息被所述NN用于进行所述元数据的恢复。从而可以实现恢复NN出异常时的元数据。
请参阅图13,图13是本发明实施例提供的一种NN设备的结构示意图,包括至少一个处理器1302(例如CPU),至少一个网络接口1305或者其他通信接口,存储器1306,和至少一个通信总线1303,用于实现这些装置之间的连接通信。处理器1302用于执行存储器1306中存储的可执行模块,例如计算机程序。存储器1306可能包含高速随机存取存储器(RAM:Random Access Memory),也可能还包括非不稳定的存储器(non-volatile memory),例如至少一个磁盘存储器。通过至少一个网络接口1305(可以是有线或者无线)实现该系统网关与至少一个其他网元之间的通信连接,可以使用互联网,广域网,本地网,城域网等。
在一些实施方式中,存储器1306存储了程序13061,程序13061可以被处理器1302执行,这个程序包括:
接收客户端发送的对目标文件进行写操作请求,其中,所述目标文件保存在多个DN上;
生成所述目标文件的元数据,并向所述客户端发送所述元数据,其中,所述元数据包含所述多个DN的信息;
当本端出现异常时,接收所述多个DN中的至少一个DN发送的元数据恢复信息,并根据所述元数据恢复信息恢复所述元数据,其中,所述元数据恢复信息是所述客户端根据所述元数据生成的,由所述客户端发送至所述至少一个DN进行保存的元数据恢复信息。
在另一个实施例中,所述目标文件被划分为多个数据块,所述多个数据块被保存在所述多个DN上;处理器1302执行的生成所述目标文件的元数据,并向所述客户端发送所述元数据,可以包括:
生成所述多个数据块的元数据,并向所述客户端发送所述多个数据块的元数据,每个数据块的元数据包含每个数据块的信息和所述每个数据块所在的DN的信息。
处理器1302执行的接收所述多个DN中的至少一个DN发送的元数据恢复信息,并根据所述元数据恢复信息恢复所述元数据的程序,可以包括:
接收所述多个DN中的至少一个DN发送的所述多个数据块的元数据恢复信息,并根据所述多个数据块的元数据恢复信息恢复所述目标文件的元数据。
可选的,处理器1302执行的向所述客户端发送所述多个数据块的元数据的程序,可以包括:
依次向所述客户端发送所述多个数据块的元数据;或者,根据所述目标文件的写操作请求一次性向所述客户端发送所有数据块的元数据。
可选的,上述多个数据块至少可以包括第一数据块和第二数据块,其中:
所述第一数据块的元数据恢复信息可以包括:
所述目标文件的属性信息和所述第一数据块在所述目标文件中的位置信息;
所述第二数据块的元数据恢复信息可以包括:
所述第二数据块在所述目标文件中的位置信息。
可选的,上述节点设备可以是HDFS内的NN所属的设备。
上述技术方案中,接收客户端发送的对目标文件进行写操作请求;生成所述目标文件的元数据,并向所述客户端发送所述元数据;当本端出现异常时,接收所述多个DN中的至少一个DN发送的元数据恢复信息,并根据所述元数据恢复信息恢复所述元数据。从而可以恢复NN出异常时的元数据。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)或随机存取存储器(Random AccessMemory,简称RAM)等。
以上所揭露的仅为本发明较佳实施例而已,当然不能以此来限定本发明之权利范围,因此依本发明权利要求所作的等同变化,仍属本发明所涵盖的范围。

Claims (24)

1.一种元数据恢复方法,其特征在于,包括:
接收对目标文件的写操作请求,其中,所述目标文件保存在多个数据节点上;
从元数据节点获取所述目标文件的元数据,所述目标文件的元数据包含所述多个数据节点的信息;
根据所述目标文件的元数据生成元数据恢复信息;
向所述多个数据节点中的至少一个数据节点发送所述元数据恢复信息,所述元数据恢复信息用于被所述至少一个数据节点进行保存,并在所述元数据节点出现异常后被发送到所述元数据节点进行所述元数据的恢复。
2.如权利要求1所述的方法,其特征在于,所述目标文件被划分为多个数据块,所述多个数据块被保存在所述多个数据节点上;
则,所述从元数据节点获取所述目标文件的元数据,根据所述目标文件的元数据生成元数据恢复信息包括:
从所述元数据节点获取所述多个数据块的元数据,每个数据块的元数据包含每个数据块的信息和所述每个数据块所在的数据节点的信息;
根据所述每个数据块的元数据,生成所述每个数据块的元数据恢复信息。
3.如权利要求2所述的方法,其特征在于,所述从所述元数据节点获取所述多个数据块的元数据包括:
依次接收所述元数据节点发送的所述每个数据块的元数据;或者,接收所述元数据节点根据所述目标文件的写操作请求一次性发送的所有数据块的元数据。
4.如权利要求2或3所述的方法,其特征在于,所述接收的元数据至少包括第一数据块的元数据和第二数据块的元数据,其中:
所述生成的所述第一数据块的元数据恢复信息包括:
所述目标文件的属性信息和所述第一数据块在所述目标文件中的位置信息;
所述生成的所述第二数据块的元数据恢复信息包括:
所述第二数据块在所述目标文件中的位置信息。
5.一种元数据恢复方法,其特征在于,包括:
接收客户端发送的目标文件的元数据恢复信息,并保存所述元数据恢复信息,其中,所述元数据恢复信息是所述客户端在接收对目标文件的写操作请求时,从元数据节点获取的所述目标文件的元数据,并根据所述元数据生成的元数据恢复信息.;
在所述元数据节点出现异常后,向所述元数据节点发送所述元数据恢复信息,元数据恢复信息被所述元数据节点用于进行所述元数据的恢复。
6.如权利要求5所述的方法,其特征在于,所述目标文件被划分为多个数据块,所述接收客户端发送的目标文件的元数据恢复信息,包括:
接收所述客户端发送的所述目标文件的数据块的元数据恢复信息,所述数据块的元数据恢复信息为所述客户端根据该数据块的元数据生成的元数据恢复信息。
7.如权利要求6所述的方法,其特征在于,所述接收所述客户端发送的所述目标文件的数据块的元数据恢复信息包括:
依次接收所述客户端点发送的所述目标文件的多个数据块的元数据恢复信息;或者,接收所述客户端一次性发送的所述目标文件的多个数据块的元数据恢复信息。
8.如权利要求6或7所述的方法,其特征在于,所述接收的元数据恢复信息至少包括第一数据块的元数据恢复信息和第二数据块的元数据恢复信息,其中:
所述第一数据块的元数据恢复信息包括:
所述目标文件的属性信息和所述第一数据块在所述目标文件中的位置信息;
所述第二数据块的元数据恢复信息包括:
所述第二数据块在所述目标文件中的位置信息。
9.一种元数据恢复方法,其特征在于,包括:
接收客户端发送的对目标文件进行写操作请求,其中,所述目标文件保存在多个数据节点上;
生成所述目标文件的元数据,并向所述客户端发送所述元数据,其中,所述元数据包含所述多个数据节点的信息;
当本端出现异常时,接收所述多个数据节点中的至少一个数据节点发送的元数据恢复信息,并根据所述元数据恢复信息恢复所述元数据,其中,所述元数据恢复信息是所述客户端根据所述元数据生成的,由所述客户端发送至所述至少一个数据节点进行保存的元数据恢复信息。
10.如权利要求9所述的方法,其特征在于,所述目标文件被划分为多个数据块,所述多个数据块被保存在所述多个数据节点上;
则所述生成所述目标文件的元数据,并向所述客户端发送所述元数据包括:
生成所述多个数据块的元数据,并向所述客户端发送所述多个数据块的元数据,每个数据块的元数据包含每个数据块的信息和所述每个数据块所在的数据节点的信息;
所述接收所述多个数据节点中的至少一个数据节点发送的元数据恢复信息,并根据所述元数据恢复信息恢复所述元数据,包括:
接收所述多个数据节点中的至少一个数据节点发送的所述多个数据块的元数据恢复信息,并根据所述多个数据块的元数据恢复信息恢复所述目标文件的元数据。
11.如权利要求10所述的方法,其特征在于,所述向所述客户端发送所述多个数据块的元数据包括:
依次向所述客户端发送所述多个数据块的元数据;或者,根据所述目标文件的写操作请求一次性向所述客户端发送所有数据块的元数据。
12.如权利要求10或11所述的方法,其特征在于,所述多个数据块至少包括第一数据块和第二数据块,其中:
所述第一数据块的元数据恢复信息包括:
所述目标文件的属性信息和所述第一数据块在所述目标文件中的位置信息;
所述第二数据块的元数据恢复信息包括:
所述第二数据块在所述目标文件中的位置信息。
13.一种客户端,其特征在于,包括:接收单元、获取单元、生成单元和发送单元,其中:
所述接收单元,用于接收对目标文件的写操作请求,其中,所述目标文件保存在多个数据节点上;
所述获取单元,用于从元数据节点获取所述目标文件的元数据,所述目标文件的元数据包含所述多个数据节点的信息;
所述生成单元,用于根据所述目标文件的元数据生成元数据恢复信息;
所述发送单元,用于向所述多个数据节点中的至少一个数据节点发送所述元数据恢复信息,所述元数据恢复信息用于被所述至少一个数据节点进行保存,并在所述元数据节点出现异常后被发送到所述元数据节点进行所述元数据的恢复。
14.如权利要求13所述的客户端,其特征在于,所述目标文件被划分为多个数据块,所述多个数据块被保存在所述多个数据节点上;
则,所述获取单元用于从所述元数据节点获取所述多个数据块的元数据,每个数据块的元数据包含每个数据块的信息和所述每个数据块所在的数据节点的信息;
所述生成单元用于根据所述每个数据块的元数据,生成所述每个数据块的元数据恢复信息。
15.如权利要求14所述的客户端,其特征在于,所述获取单元用于依次接收所述元数据节点发送的所述每个数据块的元数据;或者,所述获取单元用于接收所述元数据节点根据所述目标文件的写操作请求一次性发送的所有数据块的元数据。
16.如权利要求14或15所述的客户端,其特征在于,所述接收的元数据至少包括第一数据块的元数据和第二数据块的元数据,其中:
所述生成的所述第一数据块的元数据恢复信息包括:
所述目标文件的属性信息和所述第一数据块在所述目标文件中的位置信息;
所述生成的所述第二数据块的元数据恢复信息包括:
所述第二数据块在所述目标文件中的位置信息。
17.一种数据节点,其特征在于,包括:接收单元和发送单元,其中:
所述接收单元,用于接收客户端发送的目标文件的元数据恢复信息,并保存所述元数据恢复信息,其中,所述元数据恢复信息是所述客户端在接收对目标文件的写操作请求时,从元数据节点获取的所述目标文件的元数据,并根据所述元数据生成的元数据恢复信息.;
所述发送单元,用于在所述元数据节点出现异常后,向所述元数据节点发送所述元数据恢复信息,元数据恢复信息被所述元数据节点用于进行所述元数据的恢复。
18.如权利要求17所述的数据节点,其特征在于,所述目标文件被划分为多个数据块,所述接收单元用于接收所述客户端发送的所述目标文件的数据块的元数据恢复信息,所述数据块的元数据恢复信息为所述客户端根据该数据块的元数据生成的元数据恢复信息。
19.如权利要求18所述的数据节点,其特征在于,所述接收单元用于依次接收所述客户端点发送的所述目标文件的多个数据块的元数据恢复信息;或者,所述接收单元用于接收所述客户端一次性发送的所述目标文件的多个数据块的元数据恢复信息。
20.如权利要求17或18所述的数据节点,其特征在于,所述接收的元数据恢复信息至少包括第一数据块的元数据恢复信息和第二数据块的元数据恢复信息,其中:
所述第一数据块的元数据恢复信息包括:
所述目标文件的属性信息和所述第一数据块在所述目标文件中的位置信息;
所述第二数据块的元数据恢复信息包括:
所述第二数据块在所述目标文件中的位置信息。
21.一种元数据节点,其特征在于,包括:接收单元、生成单元和恢复单元,其中:
所述接收单元,用于接收客户端发送的对目标文件进行写操作请求,其中,所述目标文件保存在多个数据节点上;
所述生成单元,用于生成所述目标文件的元数据,并向所述客户端发送所述元数据,其中,所述元数据包含所述多个数据节点的信息;
所述恢复单元,用于当本端出现异常时,接收所述多个数据节点中的至少一个数据节点发送的元数据恢复信息,并根据所述元数据恢复信息恢复所述元数据,其中,所述元数据恢复信息是所述客户端根据所述元数据生成的,由所述客户端发送至所述至少一个数据节点进行保存的元数据恢复信息。
22.如权利要求21所述的元数据节点,其特征在于,所述目标文件被划分为多个数据块,所述多个数据块被保存在所述多个数据节点上;
所述生成单元用于生成所述多个数据块的元数据,并向所述客户端发送所述多个数据块的元数据,每个数据块的元数据包含每个数据块的信息和所述每个数据块所在的数据节点的信息;
所述恢复单元用于当本端出现异常时,接收所述多个数据节点中的至少一个数据节点发送的所述多个数据块的元数据恢复信息,并根据所述多个数据块的元数据恢复信息恢复所述目标文件的元数据。
23.如权利要求21所述的元数据节点,其特征在于,所述生成单元用于生成所述多个数据块的元数据,并依次向所述客户端发送所述多个数据块的元数据;或者,所述生成单元用于生成所述多个数据块的元数据,并根据所述目标文件的写操作请求一次性向所述客户端发送所有数据块的元数据。
24.如权利要求22或23所述的元数据节点,其特征在于,所述多个数据块至少包括第一数据块和第二数据块,其中:
所述第一数据块的元数据恢复信息包括:
所述目标文件的属性信息和所述第一数据块在所述目标文件中的位置信息;
所述第二数据块的元数据恢复信息包括:
所述第二数据块在所述目标文件中的位置信息。
CN201410427894.2A 2014-08-27 2014-08-27 一种元数据恢复方法及相关装置 Active CN104202387B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201410427894.2A CN104202387B (zh) 2014-08-27 2014-08-27 一种元数据恢复方法及相关装置
PCT/CN2015/083226 WO2016029744A1 (zh) 2014-08-27 2015-07-02 一种元数据恢复方法及相关装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410427894.2A CN104202387B (zh) 2014-08-27 2014-08-27 一种元数据恢复方法及相关装置

Publications (2)

Publication Number Publication Date
CN104202387A CN104202387A (zh) 2014-12-10
CN104202387B true CN104202387B (zh) 2017-11-24

Family

ID=52087612

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410427894.2A Active CN104202387B (zh) 2014-08-27 2014-08-27 一种元数据恢复方法及相关装置

Country Status (2)

Country Link
CN (1) CN104202387B (zh)
WO (1) WO2016029744A1 (zh)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104202387B (zh) * 2014-08-27 2017-11-24 华为技术有限公司 一种元数据恢复方法及相关装置
CN107562368B (zh) * 2016-06-30 2019-11-22 杭州海康威视数字技术股份有限公司 一种数据处理方法及装置
CN108241555B (zh) * 2016-12-26 2022-03-01 阿里巴巴集团控股有限公司 一种分布式数据库的备份、恢复方法、装置和服务器
CN109947730B (zh) * 2017-07-25 2024-02-02 中兴通讯股份有限公司 元数据恢复方法、装置、分布式文件系统及可读存储介质
CN109426587B (zh) * 2017-08-25 2020-08-28 杭州海康威视数字技术股份有限公司 一种数据恢复方法及装置
CN108390771B (zh) * 2018-01-25 2021-04-16 中国银联股份有限公司 一种网络拓扑重建方法和装置
CN111984460B (zh) * 2019-05-21 2023-11-24 华为云计算技术有限公司 元数据的恢复方法及装置
CN112947864B (zh) * 2021-03-29 2024-03-08 南方电网数字平台科技(广东)有限公司 元数据的存储方法、装置、设备和存储介质
CN115185723B (zh) * 2022-06-02 2023-06-02 广州市玄武无线科技股份有限公司 一种Region元信息修复方法、系统、装置及存储介质

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101059807A (zh) * 2007-01-26 2007-10-24 华中科技大学 一种提高元数据服务可靠性的方法及其系统

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030220943A1 (en) * 2002-05-23 2003-11-27 International Business Machines Corporation Recovery of a single metadata controller failure in a storage area network environment
CN101539873B (zh) * 2009-04-15 2011-02-09 成都市华为赛门铁克科技有限公司 数据恢复的方法、数据节点及分布式文件系统
CN101986276B (zh) * 2010-10-21 2013-07-10 华为数字技术(成都)有限公司 文件存储方法、文件恢复方法、系统及服务器
CN102024044B (zh) * 2010-12-08 2012-11-21 华为技术有限公司 分布式文件系统
JP5611889B2 (ja) * 2011-05-17 2014-10-22 株式会社東芝 データ転送装置、データ送信システムおよびデータ送信方法
CN102843403A (zh) * 2011-06-23 2012-12-26 盛大计算机(上海)有限公司 基于分布式文件系统的文件处理方法、系统及客户端
CN103067418A (zh) * 2011-10-19 2013-04-24 北大方正集团有限公司 一种元数据重建方法、设备及系统
CN103076994B (zh) * 2012-12-31 2016-02-03 北京中科大洋科技发展股份有限公司 一种san共享文件系统中实现离线写文件的方法
CN103761162B (zh) * 2014-01-11 2016-12-07 深圳清华大学研究院 分布式文件系统的数据备份方法
CN104202387B (zh) * 2014-08-27 2017-11-24 华为技术有限公司 一种元数据恢复方法及相关装置

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101059807A (zh) * 2007-01-26 2007-10-24 华中科技大学 一种提高元数据服务可靠性的方法及其系统

Also Published As

Publication number Publication date
WO2016029744A1 (zh) 2016-03-03
CN104202387A (zh) 2014-12-10

Similar Documents

Publication Publication Date Title
CN104202387B (zh) 一种元数据恢复方法及相关装置
CN104348859B (zh) 文件同步方法、装置、服务器、终端及系统
CN105404679B (zh) 数据处理方法和装置
CN105868231A (zh) 缓存数据的更新方法及装置
CN106357539B (zh) 一种数据获取方法和设备
CN107888666A (zh) 一种跨地域数据存储系统以及数据同步方法和装置
CN101677325A (zh) 发布媒体描述信息和获取媒体的方法、装置、系统
CN103346960A (zh) 一种基于可识别图形的跨网络数据传输方法
CN105208058A (zh) 基于web会话共享的信息交互系统
CN107533611A (zh) 在遥测数据的传输中保护用户可标识信息
CN109462631A (zh) 数据处理方法、装置、存储介质及电子装置
CN108347459A (zh) 一种云端数据快速存储方法及装置
CN103455599A (zh) 用于数据同步的方法、设备和系统
CN105653209A (zh) 一种对象存储数据传输方法及装置
CN106850761A (zh) 日志文件存储方法及装置
CN106973073A (zh) 多媒体数据的传输方法及设备
CN104348661B (zh) 网络失效数据上传、接收方法和设备及记录方法和系统
KR102225815B1 (ko) 데이터 피드 관리
CN106203179B (zh) 一种对文件的完整性校验系统及方法
CN102624932A (zh) 基于索引的异地云数据同步方法
CN202694340U (zh) 数据传送系统
CN106302625B (zh) 数据更新方法、装置及相关系统
CN106776151A (zh) Samba集群tdb数据库记录备份方法、装置及系统
CN105227661B (zh) 文件分享方法及系统、服务器
CN103503358B (zh) 一种群组资源交互消息的方法及其装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20220208

Address after: 550025 Huawei cloud data center, jiaoxinggong Road, Qianzhong Avenue, Gui'an New District, Guiyang City, Guizhou Province

Patentee after: Huawei Cloud Computing Technology Co.,Ltd.

Address before: 518129 Bantian HUAWEI headquarters office building, Longgang District, Guangdong, Shenzhen

Patentee before: HUAWEI TECHNOLOGIES Co.,Ltd.

TR01 Transfer of patent right