CN110196752A - 数据处理方法、装置及存储介质 - Google Patents

数据处理方法、装置及存储介质 Download PDF

Info

Publication number
CN110196752A
CN110196752A CN201810579326.2A CN201810579326A CN110196752A CN 110196752 A CN110196752 A CN 110196752A CN 201810579326 A CN201810579326 A CN 201810579326A CN 110196752 A CN110196752 A CN 110196752A
Authority
CN
China
Prior art keywords
storage pool
hard disk
storage
cloud hard
cloud
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201810579326.2A
Other languages
English (en)
Inventor
符策富
吉永光
马文霜
史佳婧
肖军
吴光辉
高学强
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN201810579326.2A priority Critical patent/CN110196752A/zh
Publication of CN110196752A publication Critical patent/CN110196752A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/455Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
    • G06F9/45533Hypervisors; Virtual machine monitors
    • G06F9/45558Hypervisor-specific management and integration aspects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/455Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
    • G06F9/45533Hypervisors; Virtual machine monitors
    • G06F9/45558Hypervisor-specific management and integration aspects
    • G06F2009/4557Distribution of virtual machine instances; Migration and load balancing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/455Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
    • G06F9/45533Hypervisors; Virtual machine monitors
    • G06F9/45558Hypervisor-specific management and integration aspects
    • G06F2009/45595Network integration; Enabling network access in virtual machine instances

Landscapes

  • Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请公开了一种数据处理方法,包括:当确定第一存储池的存储优化指标达到第一阈值时,从所述第一存储池中选择待迁移出的云硬盘;确定与所述云硬盘所在物理硬盘的类型对应的目标存储池集合,所述目标存储池集合中包含至少一个目标存储池;在所述目标存储池集合中,选择存储优化指标小于等于第二阈值的第二存储池;将所述云硬盘迁移到所述选择的第二存储池中。本申请还公开了相应的装置及存储介质。

Description

数据处理方法、装置及存储介质
技术领域
本申请涉及互联网技术领域,尤其涉及一种数据处理方法、装置及存储介质。
背景技术
云平台可为用户提供云计算、云存储等基于互联网的相关服务,通常涉及通过互联网来提供动态易扩展且经常是虚拟化的资源。
云平台使用虚拟机(Cloud Virtual Machine,云服务器)面向使用者提供服务。使用者可向云平台提交申请创建云服务器,云平台选择宿主机(host),在该宿主机上创建云服务器,并依据使用者的需求向存储集群申请创建一个或多个云硬盘。云硬盘(CloudBlock Storage,CBS)是一种基于分布式存储架构,可弹性扩展的虚拟块存储设备。云硬盘可作为云服务器的系统盘或数据盘,在作为系统盘时,可用于存放虚拟机的操作系统,在作为数据盘时,可用于存放使用者的业务数据。
发明内容
本申请实例提供了一种数据处理方法,包括:当确定第一存储池的存储优化指标达到第一阈值时,从所述第一存储池中选择待迁移出的云硬盘;确定与所述云硬盘所在物理硬盘的类型对应的目标存储池集合,所述目标存储池集合中包含至少一个目标存储池;在所述目标存储池集合中,选择存储优化指标小于等于第二阈值的第二存储池;将所述云硬盘迁移到所述选择的第二存储池中。
本申请实例还提供了一种数据处理装置,包括:选择模块,当确定第一存储池的存储优化指标达到第一阈值时,从所述第一存储池中选择待迁移出的云硬盘;确定与所述云硬盘所在物理硬盘的类型对应的目标存储池集合,所述目标存储池集合中包含至少一个存储池;在所述目标存储池集合中,选择存储优化指标小于等于第二阈值的第二存储池;迁移模块,将所述云硬盘迁移到所述选择的第二存储池中。
本申请实例还提供了一种存储介质,存储有计算机可读指令,可以使至少一个处理器执行上述方法。
上述技术方案中,多个存储池的设置,可以实现对各终端的资源进行物理隔离,从而提高了各存储池的安全使用性能。此外,通过上述技术方案,可以将存储优化指标达到第一阈值的第一存储池中的云硬盘迁移至满足条件的第二存储池中,使得各存储池得以充分利用,以进一步提高各存储池的整体利用率。
附图说明
为了更清楚地说明本申请实例中的技术方案,下面将对实例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1a是本申请一些实例涉及的一种系统构架示意图;
图1b是本申请一些实例涉及的用户界面示意图;
图2是本申请一些实例的方法流程图;
图3是本申请一些实例提供的数据处理方法的另一流程图;
图4a-4b是本申请一些实例涉及的云硬盘迁移的示意图;
图5是本申请一些实例的装置结构示意图;及
图6是本申请一些实例的设备结构示意图。
具体实施方式
下面将结合本申请实例中的附图,对本申请实例中的技术方案进行清楚、完整地描述,显然,所描述的实例仅是本申请一部分实例,而不是全部的实例。基于本申请中的实例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实例,都属于本申请保护的范围。
本申请实例提出了一种数据处理方法,可应用于图1a的系统架构中,如图1a所示,该系统构架包括:终端101a和云平台102a,两者通过网络103a进行通信,其中,云平台102a包括管理模块和存储集群。其中,存储集群包括至少一个数据处理装置和多个存储池,如图1a所示的存储池1、存储池2……存储池n,且每个存储池可以包括一个或多个物理硬盘。
这里,当某个存储池发生故障时,仅会对使用该存储池的终端产生影响,相比于一个存储集群仅有一个存储池时,一旦发生故障或访问高峰,将对该存储集群中的所有终端产生影响的情形,可以将影响降到最低,能够达到将各终端101a的资源进行物理隔离的技术效果,从而提高了存储集群的使用性能。
一个数据处理装置可以对多个(例如12个)物理硬盘进行管理,每一个物理硬盘的空间可以为2T或者更多。其中,一个存储池中的存储空间可以分配给各个终端101a,形成多个云硬盘,如存储池1包含云硬盘11、云硬盘12……云硬盘1n,存储池n包含云硬盘n1、云硬盘n2……云硬盘nn。
云平台102a的管理模块接收终端101a的请求,为终端101a创建云服务器,每个云服务器都具有处理器、内存、网络连接和存储功能等,可以运行各自的操作系统和应用程序。管理模块还可以向存储集群申请创建一个或多个云硬盘,该一个或多个云硬盘与上述云服务器对应。在一些实施例中,存储集群中的数据处理装置可以响应于管理模块的申请,在存储集群的任一存储池为终端101a创建一个或多个云硬盘,供终端101a使用,即该一个或多个云硬盘的存储空间已被终端101a预订。
终端101a可以是个人用户终端,也可以是企业用户终端。
对于企业用户来说,传统存储的硬件故障会导致业务中断数十小时。云硬盘高效支持虚拟机热迁移,提前避免物理故障造成业务中断。云硬盘具备完善的数据备份、快照、数据恢复能力;适用于高负载、核心关键业务系统,满足企业弹性可靠的大容量块存储办公需求。
图1b为本申请实例涉及的用户界面示意图。如图1b所示,终端101a在该界面中可以通过操作控件101b所示的“+新建”来购买云硬盘,这里,操作控件101b后,弹出窗口102b,窗口102b中显示有云硬盘的大小、类型、所在区域等选项,以供终端101a选择。例如,终端101a可以根据其需求指定云硬盘的大小和类型等,如终端101a为企业用户终端,对数据安全级别较高,则可以选择安全级别较高的云硬盘进行数据存储,例如可以选择如图1b中103b所示的固态硬盘驱动器(SSD,Solid State Drives)云硬盘;此外,使用该终端101a的用户还可以操作图1b中控件104b来选择相应大小的云硬盘存储空间,或操作图1b中控件105b来输入任意数值以选择相应大小的云硬盘存储空间。
例如,数据处理装置可以将存储池1中100GB的存储空间分配给终端A,此时,终端101a需求的云硬盘的存储空间较小,例如终端101a为个人用户终端,该100GB的存储空间称为云硬盘11;类似的,数据处理装置还可以将存储池1中10000GB的存储空间分配给终端B,该10000GB的空间称为云硬盘12,此时,终端101a需求的云硬盘的存储空间较大,例如终端101a为企业用户终端;依此类推。
这里,推广方在前期可能没法投入足够多的设备,会将所述存储集群的存储空间进行超卖,例如,卖家只有100GB的空间,即上述物理硬盘的总存储空间为100GB,但实际卖给用户200GB空间,即将所述总存储空间进行放大,这里放大比例为2,或者说超卖比就是2,在一些实例中,放大比例可以为1.3~1.6,以便增加收入。随着各终端不断地将资源写入各云硬盘,各存储池的数据越来越多,最终导致各存储池有可能被写满的风险,此时,该存储池的运行将非常缓慢,其运行性能将大大下降。
针对这种情形,在一些实例中,可以对即将写满的存储池进行扩容,即增大该存储池的总存储空间。当数据处理装置调高超卖比后,该存储池将再次面临上述问题,此时,数据处理装置仍然可以再次对该存储池进行扩容,然而当对该存储池扩容了多次后,该存储池的总存储空间将变得非常大,给存储集群整体的运营带来了巨大的挑战。
在一些实例中,存储集群中的数据处理装置可以确定各存储池的存储优化指标,从而确定各存储池的使用情况,以对各存储池的使用情况进行优化调整。例如,有些存储池的存储利用率较低,有些存储池的存储利用率较高,则可以将存储利用率较高的存储池中的云硬盘迁移至存储利用率较低的存储池中,以使得各存储池得以均衡使用,以保证存储集群的整体利用率,也避免了部分存储池写满的风险。
在一些实施例中,当上述数据处理装置确定第一存储池的存储优化指标达到第一阈值时,从所述第一存储池中选择待迁移出的云硬盘;确定与所述云硬盘所在物理硬盘的类型对应的目标存储池集合,所述目标存储池集合中包含至少一个目标存储池;在所述目标存储池集合中,选择存储优化指标小于等于第二阈值的第二存储池;将所述云硬盘迁移到所述选择的第二存储池中。
图2示出了本申请实例提出的数据处理方法的流程图。如图2所示,该方法应用于存储集群,进一步的,该方法可应用于存储集群中的数据处理装置,包括如下步骤:
步骤201:当确定第一存储池的存储优化指标达到第一阈值时,从所述第一存储池中选择待迁移出的云硬盘。
其中,所述云硬盘对应于所述第一存储池中预订的存储空间。
在一些实施例中,所述第一存储池的存储优化指标可以包括所述第一存储池的存储利用率;其中,所述第一存储池的存储利用率代表所述第一存储池中已占用空间占第一存储池的总存储空间的比例。
在一些实施例中,所述存储优化指标还可以进一步包括以下至少一个:存储利用率的平均增长率,平均磁盘利用率、平均带宽利用率;
其中,所述存储利用率的平均增长率代表所述存储利用率的增长率的平均值;所述平均磁盘利用率代表各物理硬盘的磁盘利用率的平均值;所述平均带宽利用率代表各物理硬盘的带宽利用率的平均值。
在一些实施例中,可以将所述第一存储池中各云硬盘按照云硬盘利用率进行排序;其中,所述云硬盘利用率代表该云硬盘中已占用空间占云硬盘总存储空间的比例;然后将前N个云硬盘确定为所述待迁移的云硬盘;其中,在将所述前N个云硬盘迁移出所述第一存储池之后,所述第一存储池的存储优化指标小于第三阈值,N为正整数。
在一些实施例中,也可以从所述第一存储池中随机选择一个或多个待迁移出的云硬盘;其中,在将所述一个或多个云硬盘迁移出所述第一存储池之后,所述第一存储池的存储优化指标小于第三阈值。
步骤202,确定与所述云硬盘所在物理硬盘的类型对应的目标存储池集合,所述目标存储池集合中包含至少一个目标存储池。
在一些实施例中,在确定了待迁移的云硬盘之后,可以获取所述云硬盘所在物理硬盘的类型;根据所述物理硬盘的类型,寻找包含相同类型的物理硬盘的一个或多个目标存储池;将寻找出的所述一个或多个目标存储池作为所述目标存储池集合。
步骤203,在所述目标存储池集合中,选择存储优化指标小于等于第二阈值的第二存储池。
在一些实施例中,所述存储优化指标可以是第二存储池的存储利用率;其中,所述第二存储池的存储利用率代表所述第二存储池中已占用空间占第二存储池的总存储空间的比例。
在一些实施例中,所述存储优化指标也可以进一步包括以下至少一个:存储利用率的平均增长率,平均磁盘利用率、平均带宽利用率。
步骤204,将所述云硬盘迁移到所述选择的第二存储池中。
在一些实施例中,可以在所述第二存储池中,为所述云硬盘分配存储空间,其中,所述存储空间与所述云硬盘在所述第一存储池中占用的存储空间大小相同;将所述第一存储池中存储的云硬盘的数据,拷贝到所述第二存储池中为云硬盘分配的存储空间中。
上述技术方案中,多个存储池的设置,可以实现对各终端的资源进行物理隔离,从而提高了各存储池的安全使用性能。此外,通过上述技术方案,可以将存储优化指标达到第一阈值的第一存储池中的云硬盘迁移至满足条件的第二存储池中,使得各存储池得以充分利用,以进一步提高各存储池的整体利用率。
图3示出了本申请实例涉及的数据处理方法的另一流程图。如图3所示,该过程包括如下步骤:
步骤301:存储集群中的数据处理装置统计各存储池的存储优化指标。
在一些实施例中,存储集群中的数据处理装置可以定期统计各存储池的存储优化指标。
在一些实例中,所述存储优化指标可以是存储池的存储利用率。此时,步骤301可以包括:
3011,统计各存储池的存储利用率。
在一些实例中,所述存储优化指标可以进一步包含:存储利用率的平均增长率、平均磁盘利用率、平均带宽利用率中的至少一个。
此时,步骤301还可以包括:
3012,统计各存储池的存储利用率,以及统计各存储池以下参数中的至少一个:存储利用率的平均增长率、平均磁盘利用率、平均带宽利用率,以得到各个存储池的存储优化指标。
在一些实例中,可以根据以下公式(1)确定所述存储优化指标:
score=X+Y*n1+Z*n2+W*n3 (1)
其中,score代表所述存储优化指标;X代表存储利用率;Y代表存储利用率的平均增长率;n1代表所述存储利用率的平均增长率对应的第一权重系数;Z代表平均磁盘利用率,如一段时间内存储池中各物理硬盘的磁盘利用率的平均值;n2代表所述平均磁盘利用率对应的第二权重系数;W代表平均带宽利用率,如一段时间内存储池各物理硬盘的带宽利用率的平均值;n3代表所述平均带宽利用率对应的第三权重系数。
其中,n1、n2及n3可以根据云平台的实际运行状况进行调节,可以为0、正数及负数。当n1、n2及n3均为0时,所述存储优化指标为所述存储利用率,即所述存储优化指标仅考虑存储利用率一个维度;当n1、n2和/或n3不为0时,则从多个维度计算所述存储优化指标。当0≤n1≤1,0≤n2≤1及0≤n3≤1时,影响所述存储优化指标的因素主要为存储利用率。
在一些实例中,所述平均增长率通过以下方式确定:
确定第一时刻所述存储池的第一存储利用率;
确定预订时间间隔后的第二时刻所述存储池的第二存储利用率;
将所述第二存储利用率和所述第一存储利用率的差值除以所述第一存储利用率,得到所述预订时间间隔内的所述存储利用率的增长率;
确定所述一段时间内所述存储利用率的增长率的平均值,得到所述平均增长率。
例如,所述一段时间可以为一个星期,预订时间间隔可以为每日,某个存储池第一天的存储利用率为40%,第二天的存储利用率为45%,则第二天相对于第一天的存储利用率的增长率为(45%-40%)/40%=12.5%,以此类推,则该存储池一个星期内的存储利用率的平均增长率Y为(12.5%+10%+1%-10%+50%-30%)/6=5.58%。
在一些实例中,所述平均磁盘利用率通过以下方式确定:确定所述存储池中物理硬盘的个数;根据一段时间内各物理硬盘的磁盘利用率和所述物理硬盘的个数确定所述平均磁盘利用率。
例如,所述一定时间可以为最近一天,通过计算这一天存储池中所有物理硬盘的磁盘利用率的平均值,即将各物理硬盘的所有每秒磁盘利用率之和除以86400,再除以物理硬盘的个数,得到这一天该存储池的平均磁盘利用率Z,其中,86400为一天的总秒数。
在一些实例中,所述平均带宽利用率通过以下方式确定:确定所述存储池中各物理硬盘的每秒数据传输量;根据所述各物理硬盘的每秒数据传输量之和得到每秒带宽利用率;确定所述一段时间内所述每秒带宽利用率的平均值,得到所述平均带宽利用率。
例如,数据处理装置监测所述存储池中各物理硬盘的每秒数据传输量之和为800,且使用的网卡为万兆网卡,即网卡固定最大流量为10000M/s,则该存储池每秒带宽利用率为8%,所述一定时间可以为最近一天,通过计算这一天所有每秒带宽利用率的平均值,即将所有每秒带宽利用率之和除以86400,得到这一天所述存储池的平均带宽利用率W。
步骤302,当确定各存储池中,存储池1的存储优化指标达到第一阈值时,从存储池1中选择待迁移出的云硬盘。
在一些实施例中,当其中任一存储池的存储优化指标达到第一阈值,例如存储池1的存储利用率达到第一阈值时,启动调度程序,即执行步骤303~步骤310。否则,返回步骤301。在一些实例中,所述第一阈值可以是90%。
在一些实例中,步骤302可以包括步骤3021,其中,步骤3021可以包括:
30211,将存储池1中各云硬盘按照云硬盘利用率进行排序;其中,所述云硬盘利用率代表该云硬盘中已占用空间占云硬盘总存储空间的比例;
30212,将前N个云硬盘确定为所述待迁移的云硬盘;其中,在将所述前N个云硬盘迁移出所述存储池1之后,所述存储池1的存储优化指标小于第三阈值,N为正整数。
例如,存储池1中的云硬盘11的云硬盘利用率为25%,云硬盘12的云硬盘利用率为80%,云硬盘13的云硬盘利用率为70%,则优先对云硬盘利用率高的云硬盘进行迁移,即将云硬盘利用率高的云硬盘确定为待迁移云硬盘,从而可以快速的降低存储池的存储利用率,以保证存储池1的运行性能。
例如,可以对云硬盘11、云硬盘12及云硬盘13根据云硬盘利用率进行降序排序,将前2个云硬盘,即云硬盘12和云硬盘13,迁移出存储池1,此时,存储池1的存储优化指标为25%,低于第三阈值,第三阈值例如为50%。
这里,还可以设置阈值,当所述云硬盘利用率达到阈值时,将该云硬盘确定为待迁移云硬盘,例如阈值为75%,则确定云硬盘2为待迁移云硬盘,而云硬盘2的总存储空间为20GB,则待迁移云硬盘需要的总存储空间为20GB。
在一些实例中,步骤302可以包括:
3022,从存储池1中随机选择一个或多个待迁移出的云硬盘;其中,在将所述一个或多个云硬盘迁移出存储池1之后,存储池1的存储优化指标小于第三阈值。
步骤303:关闭存储池1,使得存储池1处于不可预订状态。
步骤304,确定与所述待迁移的云硬盘所在物理硬盘的类型对应的目标存储池集合。
在一些实例中,步骤304可以包括:
3041,获取所述云硬盘所在物理硬盘的类型;
3042,根据所述物理硬盘的类型,寻找包含相同类型的物理硬盘的一个或多个目标存储池;
3043,将寻找出的所述一个或多个目标存储池作为所述目标存储池集合。
如前所述,数据处理装置响应于管理模块的申请,在存储集群的任一存储池为终端101a创建一个或多个云硬盘,这里,创建云硬盘的指令包含要创建的云硬盘的类型和大小,数据处理装置根据该指令在存储集群的任一存储池为终端101a创建一个或多个云硬盘时,需考虑云硬盘的类型和大小。其中,所述云硬盘的类型与物理硬盘的类型对应,包括普通云硬盘、高性能云硬盘及SSD云硬盘,普通云硬盘由普通硬盘驱动器(HDD,Hard DiskDrive)提供支持(即底层存储介质),SSD云硬盘由固态硬盘驱动器(SSD)提供支持,而高性能云硬盘则是基于HDD-SSD混合介质存储的。
这里,需选择与云硬盘对应的物理硬盘相同类型的物理硬盘进行迁移。
步骤305,在所述目标存储池集合中,选择存储优化指标小于等于第二阈值的第二存储池。
在一些实例中,所述第二存储池的存储优化指标可以包括所述第二存储池的存储利用率;其中,所述第二存储池的存储利用率代表所述第二存储池中已占用空间占第二存储池的总存储空间的比例。
在一些实例中,所述第二存储池的存储优化指标还可以包括以下至少一个:存储利用率的平均增长率,平均磁盘利用率、平均带宽利用率。其中,所述第二存储池的存储优化指标与存储池1的存储优化指标的计算方法相同,此处不赘述。
步骤306:确定存储池1中的待迁移云硬盘需要的总存储空间。
例如,存储池1的总存储空间为100GB,云硬盘11的总存储空间为30GB,云硬盘12的总存储空间为30GB,云硬盘13的总存储空间为40GB,如前所述,对云硬盘11、云硬盘12及云硬盘13根据云硬盘利用率进行降序排序,将前2个云硬盘,即云硬盘12和云硬盘13,迁移出存储池1,此时待迁移云硬盘需要的总存储空间为70GB。
步骤307:在所述存储优化指标小于等于第二阈值的第二存储池中,根据所述待迁移的云硬盘的总存储空间,选择未预订空间大于所述总存储空间的存储池2。
步骤308:关闭存储池2,使得存储池2处于不可预订状态。
步骤309:启动云硬盘迁移,即将存储池1中的云硬盘12和云硬盘13迁移至存储池2中。
首先,在存储池2中为云硬盘12分配一云硬盘21,云硬盘21的空间大小云硬盘12的空间大小相同,在存储池2中还为云硬盘13分配一云硬盘22,云硬盘22的空间大小云硬盘13的空间大小相同;然后,将云硬盘12的数据拷贝到云硬盘21中,以及将云硬盘13的数据拷贝到云硬盘22中,即完成迁移过程。
步骤310:当上述迁移过程完成后,打开存储池1和存储池2以继续售卖。
将存储池1中的云硬盘11和云硬盘12迁移至存储池2后,存储池中相应大小的存储空间释放,从而降低存储池1的存储利用率,提高存储池1的运行性能。
将所述云硬盘迁移至所述存储池2之后,将所述存储池1和所述存储池2均设置为可预订状态。
在一些实施例中,在步骤310之后,可以返回步骤301,更新各存储池的存储优化指标。
通过数据处理装置定期遍历其中的所有存储池,以确定各存储池的存储优化指标,以确定各存储池是否存在写满的风险,当存储池存在写满的风险时,将会使得终端的访问以及云硬盘等的运行变得非常缓慢,不利于整体的使用;然而,存储集群中可能存在其中一部分存储池写满,而其他存储池未被利用的情形,因此,需要对各存储池的利用进行调度,使得各存储池得以充分利用,以提高存储集群的整体利用率。这里,所述对各存储池的利用进行调度,即将存储池1中的云硬盘迁移至存储池2。
图4a为本申请一些实施例中将存储池1中的云硬盘迁移至存储池2的示意图。
如图4a所示,可以将存储池1中的云硬盘12和云硬盘13均迁移至存储池2。
在上述实例中,以存储池1中的云硬盘12和云硬盘13均迁移至存储池2这一种情形进行举例说明,除此之外,还可以有其他的迁移方法。
图4b为本申请一些实例提供的云硬盘迁移的另一示意图。如图4b所示,可以将存储池1中的云硬盘12和云硬盘13分别迁移到不同的存储池,例如存储池3和存储池5。
基于上述实例提供的方法,本申请实例还提出了一种数据处理装置500,如图5所示,包括:
选择模块501,当确定第一存储池的存储优化指标达到第一阈值时,从所述第一存储池中选择待迁移出的云硬盘;确定与所述云硬盘所在物理硬盘的类型对应的目标存储池集合,所述目标存储池集合中包含至少一个存储池;在所述目标存储池集合中,选择存储优化指标小于等于第二阈值的第二存储池;
迁移模块502,将所述云硬盘迁移到所述选择的第二存储池中。
在一些实例中,所述第一存储池的存储优化指标包括所述第一存储池的存储利用率;其中,所述第一存储池的存储利用率代表所述第一存储池中已占用空间占第一存储池的总存储空间的比例;
所述第二存储池的存储优化指标包括所述第二存储池的存储利用率;其中,所述第二存储池的存储利用率代表所述第二存储池中已占用空间占第二存储池的总存储空间的比例。
在一些实例中,所述存储优化指标进一步包括以下至少一个:存储利用率的平均增长率,平均磁盘利用率、平均带宽利用率;
其中,所述存储利用率的平均增长率代表所述存储利用率的增长率的平均值;
所述平均磁盘利用率代表各物理硬盘的磁盘利用率的平均值;
所述平均带宽利用率代表各物理硬盘的带宽利用率的平均值。
在一些实例中,所述存储优化指标是根据上述公式(1)确定的。
在一些实例中,选择模块501进一步用于:获取所述云硬盘所在物理硬盘的类型;根据所述物理硬盘的类型,寻找包含相同类型的物理硬盘的一个或多个目标存储池;寻找出的所述一个或多个目标存储池形成所述目标存储池集合。
在一些实例中,选择模块501进一步用于:将所述第一存储池中各云硬盘按照云硬盘利用率进行排序;其中,所述云硬盘利用率代表该云硬盘中已占用空间占云硬盘总存储空间的比例;将前N个云硬盘确定为所述待迁移的云硬盘;其中,在将所述前N个云硬盘迁移出所述第一存储池之后,所述第一存储池的存储优化指标小于第三阈值,N为正整数。
在一些实例中,选择模块501进一步用于:从所述第一存储池中随机选择一个或多个待迁移出的云硬盘;其中,在将所述一个或多个云硬盘迁移出所述第一存储池之后,所述第一存储池的存储优化指标小于第三阈值。
在一些实例中,选择模块501进一步用于:在所述存储优化指标小于等于第二阈值的第二存储池中,根据所述待迁移的云硬盘的总存储空间,选择未预订空间大于所述总存储空间的第二存储池。
在一些实例中,数据处理装置500进一步包括设置模块503,在所述第一存储池的存储优化指标达到所述第一阈值时,设置模块503将所述第一存储池设置为不可预订状态;在将所述云硬盘迁移到所述第二存储池之前,设置模块503将所述第二存储池设置为不可预订状态;将所述云硬盘迁移至所述第二存储池之后,设置模块503将所述第一存储池和所述第二存储池设置为可预订状态。
在一些实例中,迁移模块502进一步用于:在所述第二存储池中,为所述云硬盘分配存储空间,其中,所述存储空间与所述云硬盘在所述第一存储池中占用的存储空间大小相同;将所述第一存储池中存储的云硬盘的数据,拷贝到所述第二存储池中为云硬盘分配的存储空间中。
在一些实例中,数据处理装置500进一步包括更新模块504,在将所述云硬盘迁移到所述第二存储池之后,更新模块504更新所述第一存储池和所述第二存储池的存储优化指标。
上述技术方案中,多个存储池的设置,可以实现对各终端的资源进行物理隔离,从而提高了各存储池的安全使用性能。此外,通过上述技术方案,可以将存储优化指标达到第一阈值的第一存储池中的云硬盘迁移至满足条件的第二存储池中,使得各存储池得以充分利用,以进一步提高各存储池的整体利用率。
图6示出了数据处理装置所在的计算设备的组成结构图。如图6所示,该计算设备包括一个或者多个处理器(CPU)602、存储器604、用户接口606,以及用于互联这些组件的通信总线608。
用户接口606包括一个或多个输出设备612,其包括一个或多个扬声器和/或一个或多个可视化显示器。用户接口610也包括一个或多个输入设备614,其包括诸如,键盘,鼠标,声音命令输入单元或扩音器,触屏显示器,触敏输入板,姿势捕获摄像机或其他输入按钮或控件等。
存储器604可以是高速随机存取存储器,诸如DRAM、SRAM、DDR RAM、或其他随机存取固态存储设备;或者非易失性存储器,诸如一个或多个磁盘存储设备、光盘存储设备、闪存设备,或其他非易失性固态存储设备。
存储器604存储处理器602可执行的指令集,包括:
操作系统616,包括用于处理各种基本系统服务和用于执行硬件相关任务的程序;
应用618,包括用于数据处理的各种应用程序,这种应用程序能够实现上述各实例中的处理流程,比如可以包括图5所示的装置500。
在一些实例中,装置500可包括图5所示的各模块501-504。各模块501-504可以存储有机器可执行指令。处理器602通过执行存储器606中各模块501-504的机器可执行指令,进而能够实现上述各模块501-504的功能。
需要说明的是,上述各流程和各结构图中不是所有的步骤和模块都是必须的,可以根据实际的需要忽略某些步骤或模块。各步骤的执行顺序不是固定的,可以根据需要进行调整。各模块的划分仅仅是为了便于描述采用的功能上的划分,实际实现时,一个模块可以分由多个模块实现,多个模块的功能也可以由同一个模块实现,这些模块可以位于同一个设备中,也可以位于不同的设备中。
各实例中的硬件模块可以以硬件方式或硬件平台加软件的方式实现。上述软件包括机器可读指令,存储在非易失性存储介质中。因此,各实例也可以体现为软件产品。例如,对应上述数据处理方法和装置,本申请的实例还提供了一种计算机可读存储介质,其上存储有计算机指令,其中,所述计算机指令被处理器执行时实现上述数据处理方法的步骤。
各实例中,硬件可以由专门的硬件或执行机器可读指令的硬件实现。例如,硬件可以为专门设计的永久性电路或逻辑器件(如专用处理器,如FPGA或ASIC)用于完成特定的操作。硬件也可以包括由软件临时配置的可编程逻辑器件或电路(如包括通用处理器或其它可编程处理器)用于执行特定操作。
另外,本申请的每个实例可以通过由数据处理设备如计算机执行的数据处理程序来实现。显然,数据处理程序构成了本申请。此外,通常存储在一个存储介质中的数据处理程序通过直接将程序读取出存储介质或者通过将程序安装或复制到数据处理设备的存储设备(如硬盘和/或内存)中执行。因此,这样的存储介质也构成了本申请,本申请还提供了一种非易失性存储介质,其中存储有数据处理程序,这种数据处理程序可用于执行本申请上述方法实例中的任何一种实例。
图5中的模块对应的机器可读指令可以使计算机上操作的操作系统等来完成这里描述的部分或者全部操作。非易失性计算机可读存储介质可以是插入计算机内的扩展板中所设置的存储器中或者写到与计算机相连接的扩展单元中设置的存储器。安装在扩展板或者扩展单元上的CPU等可以根据指令执行部分和全部实际操作。
另外,在本申请各个实例中的装置及各模块可以集成在一个处理单元中,也可以是各个模块单独物理存在,也可以两个或两个以上装置或模块集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
以上所述仅为本申请的较佳实例而已,并不用以限制本申请,凡在本申请的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本申请保护的范围之内。

Claims (15)

1.一种数据处理方法,其特征在于,包括:
当确定第一存储池的存储优化指标达到第一阈值时,从所述第一存储池中选择待迁移出的云硬盘;
确定与所述云硬盘所在物理硬盘的类型对应的目标存储池集合,所述目标存储池集合中包含至少一个目标存储池;
在所述目标存储池集合中,选择存储优化指标小于等于第二阈值的第二存储池;
将所述云硬盘迁移到所述选择的第二存储池中。
2.根据权利要求1所述的方法,所述第一存储池的存储优化指标包括所述第一存储池的存储利用率;其中,所述第一存储池的存储利用率代表所述第一存储池中已占用空间占第一存储池的总存储空间的比例;
所述第二存储池的存储优化指标包括所述第二存储池的存储利用率;其中,所述第二存储池的存储利用率代表所述第二存储池中已占用空间占第二存储池的总存储空间的比例。
3.根据权利要求2所述的方法,其中,所述存储优化指标进一步包括以下至少一个:存储利用率的平均增长率,平均磁盘利用率、平均带宽利用率;
其中,所述存储利用率的平均增长率代表所述存储利用率的增长率的平均值;
所述平均磁盘利用率代表各物理硬盘的磁盘利用率的平均值;
所述平均带宽利用率代表各物理硬盘的带宽利用率的平均值。
4.根据权利要求3所述的方法,
其中,所述存储优化指标是根据以下公式确定的:
score=X+Y*n1+Z*n2+W*n3
其中,score代表所述存储优化指标,X代表所述存储利用率;Y代表所述存储利用率的平均增长率;n1代表所述存储利用率的平均增长率对应的第一权重系数;Z代表所述平均磁盘利用率;n2代表所述平均磁盘利用率对应的第二权重系数;W代表所述平均带宽利用率;n3代表所述平均带宽利用率对应的第三权重系数。
5.根据权利要求1所述的方法,其中,所述确定与所述云硬盘所在物理硬盘的类型对应的目标存储池集合包括:
获取所述云硬盘所在物理硬盘的类型;
根据所述物理硬盘的类型,寻找包含相同类型的物理硬盘的一个或多个目标存储池;
寻找出的所述一个或多个目标存储池形成所述目标存储池集合。
6.根据权利要求1所述的方法,其中,所述从所述第一存储池中选择待迁移出的云硬盘包括:
将所述第一存储池中各云硬盘按照云硬盘利用率进行排序;其中,所述云硬盘利用率代表该云硬盘中已占用空间占云硬盘总存储空间的比例;
将前N个云硬盘确定为所述待迁移的云硬盘;其中,在将所述前N个云硬盘迁移出所述第一存储池之后,所述第一存储池的存储优化指标小于第三阈值,N为正整数。
7.根据权利要求1所述的方法,其中,所述从所述第一存储池中选择待迁移出的云硬盘包括:
从所述第一存储池中随机选择一个或多个待迁移出的云硬盘;其中,在将所述一个或多个云硬盘迁移出所述第一存储池之后,所述第一存储池的存储优化指标小于第三阈值。
8.根据权利要求1所述的方法,在所述目标存储池集合中,选择存储优化指标小于等于第二阈值的第二存储池之后,进一步包括:
在所述存储优化指标小于等于第二阈值的第二存储池中,根据所述待迁移的云硬盘的总存储空间,选择未预订空间大于所述总存储空间的第二存储池。
9.根据权利要求1所述的方法,进一步包括:
在所述第一存储池的存储优化指标达到所述第一阈值时,
将所述第一存储池设置为不可预订状态;
在将所述云硬盘迁移到所述第二存储池之前,
将所述第二存储池设置为不可预订状态;
将所述云硬盘迁移至所述第二存储池之后,
将所述第一存储池和所述第二存储池设置为可预订状态。
10.根据权利要求1所述的方法,其中,将所述云硬盘迁移到所述选择的第二存储池中,包括:
在所述第二存储池中,为所述云硬盘分配存储空间,其中,所述存储空间与所述云硬盘在所述第一存储池中占用的存储空间大小相同;
将所述第一存储池中存储的云硬盘的数据,拷贝到所述第二存储池中为云硬盘分配的存储空间中。
11.根据权利要求1所述的方法,进一步包括:
在将所述云硬盘迁移到所述第二存储池之后,更新所述第一存储池和所述第二存储池的存储优化指标。
12.一种数据处理装置,其特征在于,包括:
选择模块,当确定第一存储池的存储优化指标达到第一阈值时,从所述第一存储池中选择待迁移出的云硬盘;确定与所述云硬盘所在物理硬盘的类型对应的目标存储池集合,所述目标存储池集合中包含至少一个存储池;在所述目标存储池集合中,选择存储优化指标小于等于第二阈值的第二存储池;
迁移模块,将所述云硬盘迁移到所述选择的第二存储池中。
13.根据权利要求12所述的数据处理装置,进一步包括设置模块,
在所述第一存储池的存储优化指标达到所述第一阈值时,
所述设置模块将所述第一存储池设置为不可预订状态;
在将所述云硬盘迁移到所述第二存储池之前,
所述设置模块将所述第二存储池设置为不可预订状态;
将所述云硬盘迁移至所述第二存储池之后,
所述设置模块将所述第一存储池和所述第二存储池设置为可预订状态。
14.根据权利要求12所述的数据处理装置,进一步包括更新模块,
在将所述云硬盘迁移到所述第二存储池之后,所述更新模块更新所述第一存储池和所述第二存储池的存储优化指标。
15.一种存储介质,存储有计算机可读指令,可以使至少一个处理器执行如权利要求1至11任一项所述的方法。
CN201810579326.2A 2018-06-07 2018-06-07 数据处理方法、装置及存储介质 Pending CN110196752A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810579326.2A CN110196752A (zh) 2018-06-07 2018-06-07 数据处理方法、装置及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810579326.2A CN110196752A (zh) 2018-06-07 2018-06-07 数据处理方法、装置及存储介质

Publications (1)

Publication Number Publication Date
CN110196752A true CN110196752A (zh) 2019-09-03

Family

ID=67751357

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810579326.2A Pending CN110196752A (zh) 2018-06-07 2018-06-07 数据处理方法、装置及存储介质

Country Status (1)

Country Link
CN (1) CN110196752A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110764909A (zh) * 2019-10-22 2020-02-07 中国银联股份有限公司 一种用于云计算平台的存储设备的负载均衡的方法和系统
CN113535087A (zh) * 2021-07-13 2021-10-22 咪咕互动娱乐有限公司 数据迁移过程中的数据处理方法、服务器及存储系统

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103365781A (zh) * 2012-03-29 2013-10-23 国际商业机器公司 用于动态地重新配置存储系统的方法和设备
US20130339419A1 (en) * 2012-06-18 2013-12-19 Hitachi, Ltd. Method and apparatus to maximize return on investment in hybrid cloud environment
CN104662518A (zh) * 2013-09-24 2015-05-27 华为技术有限公司 数据迁移方法、数据迁移装置和存储设备
US20170269862A1 (en) * 2016-03-15 2017-09-21 International Business Machines Corporation Storage capacity allocation using distributed spare space
CN108089814A (zh) * 2016-11-23 2018-05-29 中移(苏州)软件技术有限公司 一种数据存储方法及装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103365781A (zh) * 2012-03-29 2013-10-23 国际商业机器公司 用于动态地重新配置存储系统的方法和设备
US20130339419A1 (en) * 2012-06-18 2013-12-19 Hitachi, Ltd. Method and apparatus to maximize return on investment in hybrid cloud environment
CN104662518A (zh) * 2013-09-24 2015-05-27 华为技术有限公司 数据迁移方法、数据迁移装置和存储设备
US20170269862A1 (en) * 2016-03-15 2017-09-21 International Business Machines Corporation Storage capacity allocation using distributed spare space
CN108089814A (zh) * 2016-11-23 2018-05-29 中移(苏州)软件技术有限公司 一种数据存储方法及装置

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110764909A (zh) * 2019-10-22 2020-02-07 中国银联股份有限公司 一种用于云计算平台的存储设备的负载均衡的方法和系统
CN110764909B (zh) * 2019-10-22 2023-11-17 中国银联股份有限公司 一种用于云计算平台的存储设备的负载均衡的方法和系统
CN113535087A (zh) * 2021-07-13 2021-10-22 咪咕互动娱乐有限公司 数据迁移过程中的数据处理方法、服务器及存储系统
CN113535087B (zh) * 2021-07-13 2023-10-17 咪咕互动娱乐有限公司 数据迁移过程中的数据处理方法、服务器及存储系统

Similar Documents

Publication Publication Date Title
US10534542B2 (en) Dynamic core allocation for consistent performance in a non-preemptive scheduling environment
CN107430528B (zh) 机会性资源迁移以优化资源放置
US10387202B2 (en) Quality of service implementation in a networked storage system with hierarchical schedulers
US10853139B2 (en) Dynamic workload management based on predictive modeling and recommendation engine for storage systems
US10394606B2 (en) Dynamic weight accumulation for fair allocation of resources in a scheduler hierarchy
CN104142853B (zh) 虚拟机存储资源部署方法和装置
US10523743B2 (en) Dynamic load-based merging
US10356150B1 (en) Automated repartitioning of streaming data
CN101702115B (zh) 一种基于集群存储系统实现块协议接口的方法
US10616134B1 (en) Prioritizing resource hosts for resource placement
CN103455577A (zh) 云主机镜像文件的多备份就近存储和读取方法及系统
CN102981929A (zh) 磁盘镜像的管理方法和系统
US11914894B2 (en) Using scheduling tags in host compute commands to manage host compute task execution by a storage device in a storage system
Hsieh et al. The incremental load balance cloud algorithm by using dynamic data deployment
CN111352592B (zh) 磁盘读写控制方法、装置、设备及计算机可读存储介质
US10019182B2 (en) Management system and management method of computer system
CN110196752A (zh) 数据处理方法、装置及存储介质
US10776173B1 (en) Local placement of resource instances in a distributed system
Wang et al. Provision of storage QoS in distributed file systems for clouds
CN107329798A (zh) 数据复制的方法、装置和虚拟化系统
JP5612223B1 (ja) ストレージシステム、ストレージ装置の制御方法及びプログラム
US10721181B1 (en) Network locality-based throttling for automated resource migration
WO2016032803A1 (en) Dynamic load-based merging
Herodotou Towards a distributed multi-tier file system for cluster computing
Ra et al. Ioarbiter: Dynamic provisioning of backend block storage in the cloud

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination