CN109165206B

CN109165206B - 基于容器的hdfs高可用实现方法

Info

Publication number: CN109165206B
Application number: CN201810980102.2A
Authority: CN
Inventors: 江胡忠; 宋怀明; 郭庆; 谢莹莹; 蒋丹东
Original assignee: Zhongke Shuguang International Information Industry Co ltd
Current assignee: Zhongke Shuguang International Information Industry Co ltd
Priority date: 2018-08-27
Filing date: 2018-08-27
Publication date: 2022-02-22
Anticipated expiration: 2038-08-27
Also published as: CN109165206A

Abstract

本发明提供一种基于容器的HDFS高可用实现方法。所述方法包括：通过HDFS集群系统中的Pod挂载预先分配的远端NFS共享目录；当Kubernetes重新调度HDFS集群中的异常Pod或容器时，通过所述异常Pod或者容器重新挂载所述远端NFS共享目录中的对应数据文件目录，以恢复异常Pod或者容器中的数据，从而实现容器内HDFS的高可用性；其中，所述NFS共享目录用于存放HDFS所有节点的数据文件的保存目录。本发明通过预先分配一个远端NFS共享目录，并将之与容器相对应，通过挂载远端NFS共享目录将HDFS节点的数据文件保存目录存放在远端NFS共享目录中，这样容器被销毁重建之后，通过重新挂载预先分配的远端NFS共享目录就可以恢复容器的用户数据，从而使得HDFS节点数据不会丢失。

Description

基于容器的HDFS高可用实现方法

技术领域

本发明涉及计算机技术领域，尤其涉及一种基于容器的HDFS高可用实现方法。

背景技术

HDFS(Hadoop Distributed File system，Hadoop分布式文件系统)是一个具有高度容错性的分布式文件系统，能够提供高吞吐量的数据访问，同时具备一定的故障恢复能力，适合在大规模的数据集上使用。HDFS是一个主/从体系结构，包括两类节点：NameNode和DataNode，其中，NameNode负责处理客户端的请求，配置副本策略，管理HDFS的命名空间等；DataNode负责数据块的读写操作等。HDFS更适合于一次写入，多次读取的应用场景，不适宜频繁写入和实时获取的应用场景。NFS(Network File System，网络文件系统)允许计算机通过TCP/IP网络访问远端的计算机上的硬盘目录，提供了一种文件共享的方式，安装NFS客户端的计算机就可以像访问本地磁盘那样读写NFS服务器上共享出来的磁盘目录。

Docker容器技术是基于LXC(Linux Container)技术衍生的一种新型内核虚拟化技术，从2013年诞生之日起便持续得到开发者和企业的关注和青睐。使用Docker技术，开发者可以轻松的在容器上部署和运行应用，并通过配置文件轻松实现应用的自动化安装、部署和升级。Kubernetes是一个全新的基于Docker容器技术的分布式架构领先方案，为容器化的应用提供部署运行、资源调度、服务发现和动态伸缩等一系列完整功能，提高了大规模容器集群管理的便捷性。Pod作为集群中最基本操作单元，包含一个或多个紧密相关的容器，这些容器共享存储和网络资源。与传统物理机的部署相比，借助于容器的轻量级和容器编排系统Kubernetes，可以在同等的物理硬件条件下，部署更多的HDFS集群，提供给更多的用户使用，并且这些HDFS相互隔离，不会有影响。

通常情况下，在Kubernetes中的每个Pod上只创建一个容器，并在容器中部署HDFS集群，根据Kubernetes的调度策略，当Pod或容器因未知原因发生异常终止时Kubernetes会删除掉异常终止的Pod，并重新根据yaml文件生成新的Pod，并把它启动起来加入到原HDFS集群中，其中，yaml文件是一种编写配置文件的语言。

在实现本发明的过程中，发明人发现现有技术中至少存在如下技术问题：

虽然按照上述部署方式的确可以为多个用户创建更多的HDFS集群，并且一旦HDFS集群中的某个数据节点DataNode出现异常终止，Kubernetes能够重新调度该数据节点DataNode并将其加入原HDFS集群中。由于重新调度后的DataNode是一个全新的、失去所有用户数据的节点，因此需要借助HDFS文件系统本身的高可用特性保证HDFS上的数据不丢失。

但是一旦在同一个HDFS集群里同时发生调度的容器较多，例如，全部DataNode都发生重新调度，那么HDFS文件系统也无法保证数据的完整，这一点与高可用性是相悖的，也是实际业务场景中用户不能接受的。出现这样的问题与Kubernetes本身重新调度后的pod生成方式是密不可分的。当发现某个Pod出现异常终止，正在运行的Pod副本数低于RC(Replication Controller，Kubernetes管理Pod副本组件)设置的数量时，RC会清理掉终止的Pod，根据定义Pod的yaml文件，读取镜像，生成新的Pod，并将其运行起来。然而新生成的Pod因为是根据镜像仓库或本地预先设置的镜像生成的，因此导致原Pod的容器中用户在该DataNode上保存的数据丢失。

发明内容

本发明提供的基于容器的HDFS高可用实现方法，通过预先分配一个远端NFS共享目录，并将之与容器相对应，通过挂载远端NFS共享目录将HDFS节点的数据文件保存目录存放在远端NFS共享目录中，这样容器被销毁重建之后，通过重新挂载预先分配的远端NFS共享目录就可以恢复容器的用户数据，从而使得HDFS节点数据不会丢失。

本发明提供一种基于容器的HDFS高可用实现方法，包括：

通过HDFS集群系统中的Pod挂载预先分配的远端NFS共享目录；

当Kubernetes重新调度HDFS集群中的异常Pod或容器时，通过所述异常Pod或者容器重新挂载所述远端NFS共享目录中的对应数据文件的保存目录，以恢复异常Pod或者容器中的数据，从而实现容器内HDFS的高可用性；

其中，所述NFS共享目录用于存放HDFS所有节点的数据文件的保存目录。

本发明实施例提供的基于容器的HDFS高可用实现方法，通过预先分配一个远端NFS共享目录，并将之与容器相对应，通过挂载远端NFS共享目录将HDFS节点的数据文件保存目录存放在远端NFS共享目录中，这样容器被销毁重建之后，通过重新挂载预先分配的远端NFS共享目录就可以恢复容器的用户数据，从而使得HDFS节点数据不会丢失。

附图说明

图1为本发明一实施例基于容器的HDFS高可用实现方法的流程图；

图2为本发明一实施例容器挂载NFS共享目录的结构图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

本发明提供一种基于容器的HDFS高可用实现方法，如图1所示，包括：

S11、通过HDFS集群系统中的Pod挂载预先分配的远端NFS共享目录。

S12、当Kubernetes重新调度HDFS集群中的异常Pod或容器时，通过所述异常Pod或者容器重新挂载所述远端NFS共享目录中的对应数据文件的保存目录，以恢复异常Pod或者容器中的数据，从而实现容器内HDFS的高可用性。

可选地，步骤S11具体包括：

1、在所述远端NFS共享目录中为每个HDFS集群分配一个父目录；

2、在所述父目录中根据所述HDFS集群中的节点数量为每个HDFS节点分配一个HDFS节点文件夹；

3、定义kubernetes集群中的包括PV组件、PVC组件、RC组件、Pod和容器的资源对象。

进一步地，所述步骤3具体包括如下步骤：

1)创建PV组件，并将所述PV组件挂载所述远端NFS共享目录；

2)创建PVC组件，并建立所述PVC组件与所述PV组件的强绑定；

3)创建所述Pod，并通过yaml文件属性指定资源请求所述PVC组件；

4)创建所述RC组件，并通过yaml文件属性建立所述Pod与其包含的容器的目录挂载对应关系；

5)指定所述容器的挂载目录。

如图2所示，给出了容器挂载NFS共享目录的结构图，通过开源NFS Client API或是编写的程序，在NFS共享目录中根据业务含义为每个HDFS集群分配父目录，并在父目录中根据集群中节点数量为每一个HDFS节点分配一个文件夹，通过Kubernetes的资源定义文件，分别定义PV(Persistent Volume，Kubernetes用以定义存储的组件)、PVC(PersistentVolume Claim，Kubernetes用以定义存储请求的组件)、RC(Replication Controller，Kubernetes管理Pod副本组件)、Pod、Container(容器)等资源对象，其中，PV挂载NFS共享目录中预先分配的HDFS节点文件夹，依次建立：

1)HDFS节点文件夹->PV，创建PV并挂载NFS共享目录，通过Fabric8 API或是直接编写yaml文件，本方案采用Fabric8 API，示例如下：

//创建pv

PersistentVolume pv＝new PersistentVolume()；

……

//设置labels

meta.setLabels(ImmutableMap.<String,String>builder().put("pv-lable",name).pu t("del_lable",nameSpace).build())；

……

//设置spec

PersistentVolumeSpec pvs＝new PersistentVolumeSpec()；

//设置spec-nfs

NFSVolumeSource nfsVolumeSource＝new NFSVolumeSource()；

//设置NFS SERVER地址

nfsVolumeSource.setServer("172.16.0.205")；

//设置共享目录

nfsVolumeSource.setPath("/home/share")；

pvs.setNfs(nfsVolumeSource)；

//设置pv的spec

pv.setSpec(pvs)；

……

2)创建PVC，并建立PV->PVC的强绑定，通过Kubernetes的label selector；

//创建PVC

PersistentVolumeClaim pvc＝new PersistentVolumeClaim()；

……

//设置spec

PersistentVolumeClaimSpec pvcs＝new PersistentVolumeClaimSpec()；

……

//设置spec-selector

LabelSelector labelSelector＝new LabelSelector()；

labelSelector.setMatchLabels(ImmutableMap.<String,String>builder().put("pv-lable",name).build())；

pvcs.setSelector(labelSelector)；

//设置pvc-spec

pvc.setSpec(pvcs)；

……

3)创建Pod,并通过yaml文件属性指定资源请求PVC，PVC->Pod；

……

//设置pod-container-volumeMounts name和mountPath属性

List<VolumeMount>volumeMounts＝new ArrayList<VolumeMount>()；

//设置persistent文件夹

VolumeMount persistentVm＝new VolumeMount()；

persistentVm.setName(name+"-persistent")；

persistentVm.setMountPath("/persistent")；

volumeMounts.add(persistentVm)；

……

4)创建RC，并通过yaml文件属性在建立Pod->Container的目录挂载对应关系。

……

Volume persistentV＝new Volume()；

persistentV.setName(name+"-persistent")；

PersistentVolumeClaimVolumeSource

persistentVolumeClaimVolumeSource＝

new PersistentVolumeClaimVolumeSource()；

persistentVolumeClaimVolumeSource.setClaimName(pvcName)；

persistentV.setPersistentVolumeClaim(persistentVolumeClaimVolumeSource)；

volumes.add(persistentV)；

……

5)指定Container中的挂载目录(例如/persistent)。修改镜像中HDFS的数据存放目录，如下：

(1)core-site.xml

<name>hadoop.tmp.dir</name>

<value>/persistent/hadoop/data/tmp</value>

</property>

此参数指定HDFS的数据存放目录，将其放到NFS的共享目录上。

从上述配置可以看出，通过将NFS共享目录映射到容器中，将HDFS所有节点的数据文件目录放到NFS的共享目录上，这样当Pod被Kubernetes重新调度后，Pod、Container本地的磁盘数据会丢失，但是远端NFS上共享目录/persistent中HDFS节点的数据不会丢失，当Pod被重新创建运行起来时，会重新挂载上这个目录，无需重新进行format操作，HDFS节点上的数据，便又可以在集群中使用了。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，所述的程序可存储于一计算机可读取存储介质中，该程序在执行时，可包括如上述各方法的实施例的流程。其中，所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory，ROM)或随机存储记忆体(Random AccessMemory，RAM)等。

以上所述，仅为本发明的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，可轻易想到的变化或替换，都应涵盖在本发明的保护范围之内。因此，本发明的保护范围应该以权利要求的保护范围为准。

Claims

1.一种基于容器的HDFS高可用实现方法，其特征在于，包括：

通过HDFS集群系统中的Pod挂载预先分配的远端NFS共享目录；

其中，所述NFS共享目录用于存放HDFS所有节点的数据文件的保存目录；

所述通过HDFS集群系统中的Pod挂载预先分配的远端NFS共享目录包括：在所述远端NFS共享目录中为每个HDFS集群分配一个父目录；在所述父目录中根据所述HDFS集群中的节点数量为每个HDFS节点分配一个HDFS节点文件夹；定义kubernetes集群中的包括PV组件、PVC组件、RC组件、Pod和容器的资源对象。

2.根据权利要求1所述的方法，其特征在于，所述定义kubernetes集群中的包括PV组件、PVC组件、RC组件、Pod和容器的资源对象包括：

创建PV组件，并将所述PV组件挂载所述远端NFS共享目录；

创建PVC组件，并建立所述PVC组件与所述PV组件的强绑定；

创建所述Pod，并通过yaml文件属性指定资源请求所述PVC组件；

创建所述RC组件，并通过yaml文件属性建立所述Pod与其包含的容器的目录挂载对应关系；

指定所述容器的挂载目录。