CN111124275A

CN111124275A - 一种分布式块存储系统的监控服务优化方法及装置

Info

Publication number: CN111124275A
Application number: CN201911120940.3A
Authority: CN
Inventors: 李军站
Original assignee: Suzhou Inspur Intelligent Technology Co Ltd
Current assignee: Suzhou Inspur Intelligent Technology Co Ltd
Priority date: 2019-11-15
Filing date: 2019-11-15
Publication date: 2020-05-08
Anticipated expiration: 2039-11-15
Also published as: CN111124275B

Abstract

本发明提供一种分布式块存储系统的监控服务优化方法及装置，包括如下步骤：检测是否重新部署分布式块存储系统；若是，分布式块存储系统部署程序进行分布式块存储系统的部署，部署过程中选择一个SSD并划分设定阈值的分区作为监控服务的挂载点；进行分布式块存储系统部署时把监控服务放到SSD硬盘；若否，监控服务迁移程序将监控服务挂载到SSD中，同时将监控服务告警机制修改为按照设定阈值空间为标准检测剩余空间。解决元数据和数据与监控服务的交互能力瓶颈问题，提高存储系统的IO读写性能；还兼容已部署的分布式块存储系统监控服务不在SSD上场景，支持分布式块存储系统的跨版本升级。

Description

一种分布式块存储系统的监控服务优化方法及装置

技术领域

本发明涉及分布式存储技术领域，具体涉及一种分布式块存储系统的监控服务优化方法及装置。

背景技术

分布式块存储系统在IT企业、云计算、大数据、虚拟化等领域得到了广泛应用，与此同时这些领域对IO读写性能要求也越来越高，提高分布式块存储系统的IO读写性能日益重要。分布式块存储系统的元数据信息非常少且访问频率不高，因此不需要通过守护进程将元数据加载到内存来提高元数据访问速度，所有的元数据和数据操作直接与存储系统中的监控服务(即MON服务)和数据存储服务(即OSD服务)交互。SSD硬盘具有高的IO读写性能，通常使用SSD硬盘分区做OSD journal和OSD缓存cache，这样可以实现日志快速下刷、IO操作缓存和预读等功能，提高元数据和数据与数据存储服务交互能力，从而提高了存储系统的IO读写性能。随着元数据和数据与数据存储服务交互能力的提升，它们与监控服务的交互能力就成为分布式块存储系统的瓶颈，这将导致监控服务处理缓慢、存储系统卡顿、甚至存储系统节点宕机等严重问题。

发明内容

针对随着元数据和数据与数据存储服务交互能力的提升，它们与监控服务的交互能力就成为分布式块存储系统的瓶颈，这将导致监控服务处理缓慢、存储系统卡顿、甚至存储系统节点宕机等严重问题，本发明提供一种分布式块存储系统的监控服务优化方法及装置。

本发明的技术方案是：

一方面，本发明技术方案提供一种分布式块存储系统的监控服务优化方法，包括如下步骤：

检测是否重新部署分布式块存储系统；

若是，分布式块存储系统部署程序进行分布式块存储系统的部署，部署过程中选择一个SSD并划分设定阈值的分区作为监控服务的挂载点；一般的监控服务所在的磁盘通常是SAS、SATA盘，进行分布式块存储系统部署时把监控服务放到SSD硬盘；

若否，监控服务迁移程序将监控服务挂载到SSD中，同时将监控服务告警机制修改为按照设定阈值空间为标准检测剩余空间。

优选地，所述的部署过程中选择一个SSD并划分设定阈值的分区作为监控服务的挂载点的步骤是根据分布式块存储系统的SSD和HDD的配比关系，选择OSD Journal和OSDCache挂载点少的SSD划分设定阈值分区作为监控服务的挂载点。这样保证Cache分区的足够大，通常Cache容量越大，系统性能越好。

优选地，所述的部署过程中选择一个SSD并划分设定阈值的分区作为监控服务的挂载点的步骤，具体包括：

OSD的Journal重定向到SSD的部分分区上；

SSD余下的空间再均分作为OSD Cache挂载点和监控服务挂载点，其中OSD的Cache和OSD Journal的大小关系是1∶1；

选择除去OSD Journal后余下空间较大的SSD再划分设定阈值分区作为监控服务挂载点。

优选地，若除去OSD Journal余下的SSD空间都相等，选择存储节点中的第一个SSD划分设定阈值空间做监控服务挂载点。解决元数据和数据与监控服务的交互能力瓶颈问题，提高存储系统的IO读写性能；还兼容已部署的分布式块存储系统监控服务不在SSD上场景，支持分布式块存储系统的跨版本升级。

优选地，所述的监控服务迁移程序将监控服务挂载到SSD中，同时将监控服务告警机制修改为按照设定阈值空间为标准检测剩余空间的步骤具体包括：

步骤301：系统状态获取模块获取系统状态并判断系统状态是否正常，若系统状态正常，与目录获取模块建立通信连接，执行步骤302；若系统状态不正常，等待设定时间再次执行步骤301；

步骤302：目录获取模块获取监控服务所在的具体目录以及最大的OSD Cache所在的目录，若监控服务目录在SSD上，输出无需迁移提示信息；若监控服务目录在系统盘内与监控服务阈值处理模块建立通信，执行步骤303；

步骤303：监控服务阈值处理模块将监控服务告警机制修改为按照设定阈值空间为标准检测剩余空间，监控服务告警机制修改完成后与系统配置文件管理模块建立通信，执行步骤304；

步骤304：当系统配置文件管理模块接收到监控服务告警机制修改完成信息后，修改存储系统配置文件并把监控服务启动的必备信息更新到系统配置文件中，待存储系统配置文件更新完成后，重启监控服务使新的监控服务生效。

优选地，监控服务迁移的步骤还包括步骤205：

步骤305：步骤304中新的监控服务生效后，系统状态获取模块获取到存储系统状态正常，目录获取模块更新监控服务所在的具体目录、最大的OSD Cache所在的目录信息。

由于分布式块存储系统的SSD和HDD有配比关系，监控服务迁移程序选择Cache空间较大的OSD Cache存放监控服务。同时，由于OSD Cache会随着数据写入空间利用率发生变化，如果还采用原来的监控服务告警机制最终会出现监控服务所在的空间使用率达到95％而造成监控服务退出，当多个监控服务退出时存储系统将不可再使用；因此把原来监控服务告警机制修改为按照10GB空间为标准检测剩余空间，即(OSD Cache中剩余空间)/(10GB空间)＜5％时监控服务才退出，分布式块存储系统对OSD Cache空间使用情况做了限制，OSD Cache并不会写满并留有一定的余量。其中，原来的监控服务告警机制，即空间阈值达到70％时出现监控服务告警且达到95％时监控服务退出。

另一方面，本发明技术方案还提供一种分布式块存储系统的监控服务优化装置，包括检测单元、分布式块存储系统部署程序单元和监控服务迁移程序单元；

检测单元，用于检测是否重新部署分布式块存储系统；

分布式块存储系统部署程序单元，用于接受检测单元输出的重新部署分布式块存储系统的信息进行分布式块存储系统的部署并在部署过程中选择一个SSD并划分设定阈值的分区作为监控服务的挂载点；

监控服务迁移程序单元，接受检测单元输出的不需要重新部署分布式块存储系统的信息后监控服务迁移程序将监控服务挂载到SSD中，同时将监控服务告警机制修改为按照设定阈值空间为标准检测剩余空间。

优选地，分布式块存储系统部署程序单元包括重定向模块、计算处理模块；

重定向模块，用于将OSD的Journal重定向到SSD的部分分区上；

计算处理模块，用于SSD余下的空间再均分作为OSDCache挂载点和监控服务挂载点，其中OSD的Cache和OSD Journal的大小关系是1∶1；选择除去OSDJournal后余下空间较大的SSD再划分设定阈值分区作为监控服务挂载点；

计算处理模块，还用于若除去OSD Journal余下的SSD空间都相等，选择存储节点中的第一个SSD划分设定阈值空间做监控服务挂载点。

优选地，所述的监控服务迁移程序单元包括系统状态获取模块、目录获取模块、监控服务阈值处理模块、系统配置文件管理模块；

系统状态获取模块，用于获取系统状态并判断系统状态是否正常，若系统状态正常，与目录获取模块建立通信连接；

目录获取模块，用于获取监控服务所在的具体目录以及最大的OSD Cache所在的目录，若监控服务目录在SSD上，输出无需迁移提示信息；若监控服务目录在系统盘内与监控服务阈值处理模块建立通信；

监控服务阈值处理模块，用于将监控服务告警机制修改为按照设定阈值空间为标准检测剩余空间，监控服务告警机制修改完成后与系统配置文件管理模块建立通信；

系统配置文件管理模块，用于接收到监控服务告警机制修改完成信息后，修改存储系统配置文件并把监控服务启动的必备信息更新到系统配置文件中，待存储系统配置文件更新完成后，重启监控服务使新的监控服务生效。

优选地，系统状态获取模块，还用于在新的监控服务生效后，获取到存储系统状态正常，目录获取模块更新监控服务所在的具体目录、最大的OSD Cache所在的目录信息。

从以上技术方案可以看出，本发明具有以下优点：本发明提出的分布式块存储系统的监控服务优化方法，不仅解决元数据和数据与监控服务的交互能力瓶颈问题，提高存储系统的IO读写性能；同时还兼容已部署的分布式块存储系统监控服务不在SSD上场景，支持分布式块存储系统的跨版本升级。分布式块存储系统的监控服务优化方法增加了分布式块存储系统的灵活性和可信度，提升了分布式块存储产品的竞争力。

此外，本发明设计原理可靠，结构简单，具有非常广泛的应用前景。

由此可见，本发明与现有技术相比，具有突出的实质性特点和显著地进步，其实施的有益效果也是显而易见的。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，对于本领域普通技术人员而言，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本发明实施例一的方法的示意性流程图。

图2是本发明实施例二提供的监控服务迁移程序运行示意性流程图。

图3是本发明实施例三提供的监控服务迁移程序单元的运行示意图。

具体实施方式

为了使本技术领域的人员更好地理解本发明中的技术方案，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都应当属于本发明保护的范围。

实施例一

如图1所示，本发明技术方案提供一种分布式块存储系统的监控服务优化方法，包括如下步骤：

步骤101：检测是否重新部署分布式块存储系统，若是，执行步骤102，若否，执行步骤103；

步骤102：分布式块存储系统部署程序进行分布式块存储系统的部署，部署过程中选择一个SSD并划分设定阈值的分区作为监控服务的挂载点；

一般的监控服务所在的磁盘通常是SAS、SATA盘，进行分布式块存储系统部署时把监控服务放到SSD硬盘；

根据分布式块存储系统的SSD和HDD的配比关系，选择OSD Journal和OSD Cache挂载点少的SSD划分设定阈值分区作为监控服务的挂载点。

由于分布式块存储系统中的监控服务所占用的空间不大，本实施例中，所述的设定阈值为10GB，因此在部署分布式块存储系统的时候通过特定算法选择存储系统中的某块SSD划分的单独10GB分区。根据SSD和HDD个数把OSD的Journal和Cache尽可能的均分到各个SSD上，具体包括：OSD的Journal重定向到SSD的部分分区上；通常分区大小5G，如sdb1-sdb5，SSD余下的空间再均分作为OSD Cache挂载点如sdb6-sdb10和监控服务挂载点sdb11，其中OSD的Cache和OSD Journal的大小关系是1∶1；选择除去OSD Journal后余下空间较大的SSD再划分10GB分区作为监控服务挂载点。若除去OSD Journal余下的SSD空间都相等，选择存储节点中的第一个SSD划分10GB空间做监控服务挂载点。这样保证Cache分区的足够大，通常Cache容量越大，系统性能越好。

步骤103：监控服务迁移程序将监控服务挂载到SSD中，同时将监控服务告警机制修改为按照设定阈值空间为标准检测剩余空间。

解决元数据和数据与监控服务的交互能力瓶颈问题，提高存储系统的IO读写性能；还兼容已部署的分布式块存储系统监控服务不在SSD上场景，支持分布式块存储系统的跨版本升级。

实施例二

如图2所示，本发明实施例提供一种分布式块存储系统的监控服务优化方法，所述的方法与实施例一的不同之处包括：

步骤103中，所述的监控服务迁移程序将监控服务挂载到SSD中，同时将监控服务告警机制修改为按照设定阈值空间为标准检测剩余空间的步骤具体包括：

步骤305：新的监控服务生效后，系统状态获取模块获取到存储系统状态正常，目录获取模块更新监控服务所在的具体目录、最大的OSD Cache所在的目录信息。

本实施例提出的分布式块存储系统的监控服务优化方法，不仅解决元数据和数据与监控服务的交互能力瓶颈问题，提高存储系统的IO读写性能；同时还兼容已部署的分布式块存储系统监控服务不在SSD上场景，支持分布式块存储系统的跨版本升级。分布式块存储系统的监控服务优化方法增加了分布式块存储系统的灵活性和可信度，提升了分布式块存储产品的竞争力。

实施例三

如图3所示，本发明实施例还提供一种分布式块存储系统的监控服务优化装置，包括检测单元、分布式块存储系统部署程序单元和监控服务迁移程序单元；

检测单元，用于检测是否重新部署分布式块存储系统；

分布式块存储系统部署程序单元，用于接受检测单元输出的重新部署分布式块存储系统的信息进行分布式块存储系统的部署并在部署过程中选择一个SSD并划分设定阈值的分区作为监控服务的挂载点；分布式块存储系统部署程序单元包括重定向模块、计算处理模块；重定向模块，用于将OSD的Journal重定向到SSD的部分分区上；计算处理模块，用于SS D余下的空间再均分作为OSD Cache挂载点和监控服务挂载点，其中OSD的Cache和OSDJournal的大小关系是1∶1；选择除去OSD Journal后余下空间较大的SSD再划分设定阈值分区作为监控服务挂载点；计算处理模块，还用于若除去OSD Journal余下的SSD空间都相等，选择存储节点中的第一个SSD划分设定阈值空间做监控服务挂载点。监控服务迁移程序单元，接受检测单元输出的不需要重新部署分布式块存储系统的信息后监控服务迁移程序将监控服务挂载到SSD中，同时将监控服务告警机制修改为按照设定阈值空间为标准检测剩余空间。本实施例中设定阈值为10GB；通过监控服务迁移程序把监控服务放到节点的某一个特定的OSD Cache中(OSD Cache是放在SSD上的)。之所以需要把监控服务放到某一特定的OSD Cache中，是因为存储系统中的所有SSD的分区都已经被OSD Journal和OSD Cache占用完了；要想把监控服务放到SSD上，则只能放在某一特定的OSD Cache中。监控服务迁移程序包括系统状态获取模块、目录获取模块、监控服务阈值处理模块、系统配置文件管理模块。系统状态获取模块，用于获取系统状态并判断系统状态是否正常，若系统状态正常，与目录获取模块建立通信连接；目录获取模块，用于获取监控服务所在的具体目录以及最大的OSD Cache所在的目录，若监控服务目录在SSD上，输出无需迁移提示信息；若监控服务目录在系统盘内与监控服务阈值处理模块建立通信；监控服务阈值处理模块，用于将监控服务告警机制修改为按照设定阈值空间为标准检测剩余空间，监控服务告警机制修改完成后与系统配置文件管理模块建立通信；系统配置文件管理模块，用于接收到监控服务告警机制修改完成信息后，修改存储系统配置文件并把监控服务启动的必备信息更新到系统配置文件中，待存储系统配置文件更新完成后，重启监控服务使新的监控服务生效。系统状态获取模块，还用于在新的监控服务生效后，获取到存储系统状态正常，目录获取模块更新监控服务所在的具体目录、最大的OSD Cache所在的目录信息。系统状态获取模块获取到系统状态是否正常，如系统状态正常则与目录获取模块建立通信连接，若系统状态不正常则迁移程序给出″等系统状态正常再执行迁移动作″信息。目录获取模块记录着监控服务所在的具体目录、最大的OSD Cache所在的目录。监控服务阈值处理模块把原来监控服务告警机制修改为按照10GB空间为标准检测剩余空间，即(OSD Cache中剩余空间)/(10GB空间)＜5％时监控服务才退出，分布式块存储系统对OSD Cache空间使用情况做了限制，OSD Cache并不会写满并留有一定的余量(如2.5GB)。系统配置文件管理模块记录着监控服务迁移的新位置，并控制着新的监控服务是否能够正常工作，即通过重启监控服务进程使新的监控服务生效。

监控服务(MON，Monitor)负责监控存储系统的状态，包括Monitor状态、OSD状态，同时负责维护状态变化。

OSD(Object Storage Devices)对象存储设备，提供数据存储服务。

Cache是为了弥补高速设备和低速设备的鸿沟而引入的中间层，最终起到加快访问速度的作用。

尽管通过参考附图并结合优选实施例的方式对本发明进行了详细描述，但本发明并不限于此。在不脱离本发明的精神和实质的前提下，本领域普通技术人员可以对本发明的实施例进行各种等效的修改或替换，而这些修改或替换都应在本发明的涵盖范围内/任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，可轻易想到变化或替换，都应涵盖在本发明的保护范围之内。因此，本发明的保护范围应以所述权利要求的保护范围为准。

Claims

1.一种分布式块存储系统的监控服务优化方法，其特征在于包括如下步骤：

检测是否重新部署分布式块存储系统；

若是，分布式块存储系统部署程序进行分布式块存储系统的部署，部署过程中选择一个SSD并划分设定阈值的分区作为监控服务的挂载点；

2.根据权利要求1所述的一种分布式块存储系统的监控服务优化方法，其特征在于所述的部署过程中选择一个SSD并划分设定阈值的分区作为监控服务的挂载点的步骤是根据分布式块存储系统的SSD和HDD的配比关系，选择OSD Journal和OSD Cache挂载点少的SSD划分设定阈值分区作为监控服务的挂载点。

3.根据权利要求2所述的一种分布式块存储系统的监控服务优化方法，其特征在于所述的部署过程中选择一个SSD并划分设定阈值的分区作为监控服务的挂载点的步骤，具体包括：

OSD的Journal重定向到SSD的部分分区上；

4.根据权利要求3所述的一种分布式块存储系统的监控服务优化方法，其特征在于若除去OSD Journal余下的SSD空间都相等，选择存储节点中的第一个SSD划分设定阈值空间做监控服务挂载点。

5.根据权利要求1所述的一种分布式块存储系统的监控服务优化方法，其特征在于所述的监控服务迁移程序将监控服务挂载到SSD中，同时将监控服务告警机制修改为按照设定阈值空间为标准检测剩余空间的步骤具体包括：

6.根据权利要求5所述的一种分布式块存储系统的监控服务优化方法，其特征在于监控服务迁移的步骤还包括步骤305：

7.一种分布式块存储系统的监控服务优化装置，其特征在于包括检测单元、分布式块存储系统部署程序单元和监控服务迁移程序单元；

检测单元，用于检测是否重新部署分布式块存储系统；

8.根据权利要求7所述的一种分布式块存储系统的监控服务优化装置，其特征在于分布式块存储系统部署程序单元包括重定向模块、计算处理模块；

重定向模块，用于将OSD的Journal重定向到SSD的部分分区上；

计算处理模块，用于SSD余下的空间再均分作为OSD Cache挂载点和监控服务挂载点，其中OSD的Cache和OSD Journal的大小关系是1∶1；选择除去OSD Journal后余下空间较大的SSD再划分设定阈值分区作为监控服务挂载点；

9.根据权利要求7所述的一种分布式块存储系统的监控服务优化装置，其特征在于所述的监控服务迁移程序单元包括系统状态获取模块、目录获取模块、监控服务阈值处理模块、系统配置文件管理模块；

10.根据权利要求9所述的一种分布式块存储系统的监控服务优化装置，其特征在于系统状态获取模块，还用于在新的监控服务生效后，获取到存储系统状态正常，目录获取模块更新监控服务所在的具体目录、最大的OSD Cache所在的目录信息。