CN116414663A - 一种基于容量使用预测的扩容提示方法、装置及存储介质 - Google Patents

一种基于容量使用预测的扩容提示方法、装置及存储介质 Download PDF

Info

Publication number
CN116414663A
CN116414663A CN202310443568.XA CN202310443568A CN116414663A CN 116414663 A CN116414663 A CN 116414663A CN 202310443568 A CN202310443568 A CN 202310443568A CN 116414663 A CN116414663 A CN 116414663A
Authority
CN
China
Prior art keywords
task
target
time
memory cluster
target memory
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310443568.XA
Other languages
English (en)
Inventor
和希文
侯绪森
杨云鹏
张金存
王绍密
李梦宇
宋万里
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shandong Traceability Safety Technology Co ltd
Original Assignee
Shandong Traceability Safety Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shandong Traceability Safety Technology Co ltd filed Critical Shandong Traceability Safety Technology Co ltd
Priority to CN202310443568.XA priority Critical patent/CN116414663A/zh
Publication of CN116414663A publication Critical patent/CN116414663A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/32Monitoring with visual or acoustical indication of the functioning of the machine
    • G06F11/324Display of status information
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0602Interfaces specially adapted for storage systems specifically adapted to achieve a particular effect
    • G06F3/0608Saving storage space on storage systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0628Interfaces specially adapted for storage systems making use of a particular technique
    • G06F3/0653Monitoring storage devices or systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0668Interfaces specially adapted for storage systems adopting a particular infrastructure
    • G06F3/0671In-line storage system
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • Quality & Reliability (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提供了一种基于容量使用预测的扩容提示方法、装置及存储介质,属于数据处理领域,方法包括:基于设定历史时间段内接入目标存储器集群中的第一历史任务和第二历史任务获取用于得到目标存储器集群的扩容预测值的目标扩容预测模型;获取当前目标存储器集群在目标时间窗口内对应的存储量信息集C和对应的历史接入任务信息集R;基于C和F构建当前目标存储器集群的目标特征向量F;将F输入到所述目标扩容预测模型中,以得到当前目标存储器集群对应的扩容预测值Y,如果Y≥Y0,则输出对所述目标存储器集群进行扩容的提示信息。本发明能够在新任务接入目标存储器集群前进行扩容,能够提高新任务接入效率。

Description

一种基于容量使用预测的扩容提示方法、装置及存储介质
技术领域
本发明涉及数据处理领域,特别是涉及一种基于容量使用预测的扩容提示方法、装置及存储介质。
背景技术
当前,广泛使用存储器集群来存储数据,以获得更高的并发访问性能。影响并发访问性能的一个关键因素是集群的容量。容量预测是通过对系统存储空间历史数据进行时间序列进行算法建模,并对未来存储空间使趋势进行预测,方便运维采购工作提前进行准备。正常的存储器集群扩容,仅需要根据剩余容量和容量增长曲线就能提前预测需要扩容的时刻。但是往往当需要新增任务后,增长曲线会出现较大的波动,且若是新任务的存储空间需求量较大,还需要在任务接入前提前进行扩容,才能保证存储器集群正常运行。但由于需要先进行扩容才能进行新任务的接入,这无疑会降低新任务接入的效率。
发明内容
针对上述技术问题,本发明采用的技术方案为:
本发明实施例提供一种基于容量使用预测的扩容提示方法,所述方法包括如下步骤:
S200,基于设定历史时间段内接入目标存储器集群中的第一历史任务和第二历史任务获取用于得到目标存储器集群的扩容预测值的目标扩容预测模型;所述扩容预测值用于判断所述目标存储器集群是否需要扩容;所述第一历史任务为所述目标存储器集群在该第一历史任务接入所述目标存储器集群前的设定时间窗口内进行过扩容的任务,所述第二历史任务为所述目标存储器集群在该第二历史任务接入所述目标存储器集群前的设定时间窗口内没有进行过扩容但任务类型与第一历史任务的任务类型相同的任务;
S210,获取当前目标存储器集群在目标时间窗口内对应的存储量信息集C={C1,C2,…,Ci,…,Cn}和按照时间先后顺序获取目标存储器集群距离当前时间最近的m个历史接入任务信息形成的信息集R={R1,R2,…,Rj,…,Rm};其中,目标时间窗口的结束时间为当前时间,目标时间窗口包括n个连续排布的时间段,目标时间窗口的长度为n·ΔT,ΔT为每一时间段的长度;Ci为目标时间窗口内的第i个时间段内目标存储器集群的最大实时存储量与总存储量的比值,i的取值为1到n;Rj为第j个历史接入任务信息,j的取值为1到m;
S220,基于C和F构建当前目标存储器集群的目标特征向量F=(K1,K2,…,Kj,…,Km,C1,C2,…,Ci,…,Cn),其中,Kj=α·Rj,α为影响系数;
S230,将F输入到所述目标扩容预测模型中,以得到当前目标存储器集群对应的扩容预测值Y,如果Y≥Y0,则输出对所述目标存储器集群进行扩容的提示信息;Y0为预设阈值。本发明实施例还提供一种基于容量使用预测的扩容提示装置,包括:
模型构建模块,用于基于设定历史时间段内接入目标存储器集群中的第一历史任务和第二历史任务获取用于得到目标存储器集群的扩容预测值的目标扩容预测模型;所述扩容预测值用于判断所述目标存储器集群是否需要扩容;所述第一历史任务为所述目标存储器集群在该第一历史任务接入所述目标存储器集群前的设定时间窗口内进行过扩容的任务,所述第二历史任务为所述目标存储器集群在该第二历史任务接入所述目标存储器集群前的设定时间窗口内没有进行过扩容但任务类型与第一历史任务的任务类型相同的任务。
数据获取模块,用于获取当前目标存储器集群在目标时间窗口内对应的存储量信息集C={C1,C2,…,Ci,…,Cn}和按照时间先后顺序获取目标存储器集群距离当前时间最近的m个历史接入任务信息形成的信息集R={R1,R2,…,Rj,…,Rm};其中,目标时间窗口的结束时间为当前时间,目标时间窗口包括n个连续排布的时间段,目标时间窗口的长度为n·ΔT,ΔT为每一时间段的长度;Ci为目标时间窗口内的第i个时间段内目标存储器集群的最大实时存储量与总存储量的比值,i的取值为1到n;Rj为第j个历史接入任务信息,j的取值为1到m。
特征向量获取模块,用于基于C和F构建当前目标存储器集群的目标特征向量F=(K1,K2,…,Kj,…,Km,C1,C2,…,Ci,…,Cn),其中,Kj=α·Rj,α为影响系数。
扩容预测模块,用于将F输入到所述目标扩容预测模型中,以得到当前目标存储器集群对应的扩容预测值Y,如果Y≥Y0,则输出对所述目标存储器集群进行扩容的提示信息;Y0为预设阈值。
本发明实施例还提供一种非瞬时性计算机可读存储介质,所述存储介质中存储有至少一条指令或至少一段程序,所述至少一条指令或所述至少一段程序由处理器加载并执行以实现前述方法。
本发明至少具有以下有益效果:
本发明实施例提供的基于容量使用预测的扩容提示方法,能够利用基于目标存储器集群的接入任务变化规律和存储量变化规律训练得到的预测模型对当前目标存储器集群是否需要扩容进行预测,从而能够避免在未来出现新任务接入时而容量不够需先进行扩容再接入新任务的问题,能够提高新任务的接入效率。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的基于容量使用预测的扩容提示方法的流程图。
实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例提供一种基于容量使用预测的扩容提示方法,如图1所示,所述方法可包括如下步骤:
S200,基于设定历史时间段内接入目标存储器集群中的第一历史任务和第二历史任务获取用于得到目标存储器集群的扩容预测值的目标扩容预测模型;所述扩容预测值用于判断所述目标存储器集群是否需要扩容;所述第一历史任务为所述目标存储器集群在该第一历史任务接入所述目标存储器集群前的设定时间窗口内进行过扩容的任务,所述第二历史任务为所述目标存储器集群在该第二历史任务接入所述目标存储器集群前的设定时间窗口内没有进行过扩容但任务类型与第一历史任务的任务类型相同的任务。
在本发明实施例中,设定历史时间段可基于实际需要进行设置,本发明不做特别限定。
S210,获取当前目标存储器集群在目标时间窗口内对应的存储量信息集C和对应的历史接入任务信息集R。
其中,目标时间窗口的结束时间为当前时间,目标时间窗口包括n个连续排布的时间段,目标时间窗口的长度为n·ΔT,ΔT为每一时间段的长度。
其中,C={C1,C2,…,Ci,…,Cn},Ci为目标时间窗口内的第i个时间段内目标存储器集群的最大实时存储量与总存储量的比值,i的取值为1到n。在本发明实施例中,实时存储量为占用的存储空间。第i个时间段内目标存储器集群的最大实时存储量等于max(SCi1,SCi2,…,SCig,…,SCip),SCig为目标存储器集群在第i个时间段内的第g个时刻的实时存储量,g的取值为1到p,p为每个时间段内的时刻数量。
本发明实施例中,通过C1,C2,…,Ci,…,Cn,可以知晓目标存储器集群的存储量变化规律。在本发明实施例中,n和ΔT的取值可基于实际情况进行确定,只要能够明显反应出目标存储器集群的存储量变化规律即可。
在本发明实施例中,R为为按照时间先后顺序获取目标存储器集群距离当前时间最近的m个历史接入任务信息形成的信息集,R={R1,R2,…,Rj,…,Rm},Rj为第j个历史接入任务信息,j的取值为1到m。其中,Rj=(typej,Numj,Timej,spacej,Tagj,Qj)。其中,typej为Rj对应的历史任务的任务类型标识,在本发明实施例中,接入到目标存储器集群中的任务为会产生存储数据的任务,例如采样任务、监控任务等。任务类型标识可基于实际需要进行设置,例如,以不同的数值表示不同的任务类型。不同的任务类型所需要的存储量不同。Numj为需要执行Rj对应的历史任务的电子设备的数量,例如,某个采样任务需要对5个电子设备进行采样,某个监控任务需要对10个电子设备进行监控等。电子设备的数量不同会导致所需存储量不同。Timej为Rj对应的历史任务开始接入目标存储器集群的接入时间。spacej为Rj对应的历史任务开始接入目标存储器集群时,目标存储器集群的当前存储量与当前总存储量之间的比值。Tagj为Rj对应的历史任务的扩容标识,Qj为Rj对应的历史任务的时间属性标识。
并且,在Rm对应的历史任务开始接入目标存储器集群的接入时间和当前时间之间的时间间隔内没有历史任务接入所述目标存储器集群,即Δt1>Δt2>…>Δtj>…>Δtm,并且在Δtm内没有历史任务接入所述目标存储器集群,Δtj为第j个历史接入任务信息Rj对应的历史任务开始接入目标存储器集群的接入时间和当前时间之间的时间间隔。本发明实施例中,通过R1,R2,…,Rj,…,Rm可以得到目标存储器集群的业务变化规律。
在本发明实施例中,扩容标识可包括第一扩容标识值和第二扩容标识值。其中,第一扩容标识值用于表示在对应的接入任务接入目标存储器集群前的设定时间窗口内,所述目标存储器集群进行过扩容,可使用例如1表示。第二扩容标识值用于表示在对应的任务接入目标存储器集群前的设定时间窗口内,所述目标存储器集群没有进行过扩容,可使用例如0表示。这样,第一历史任务的扩容标识为第一扩容标识值,第二历史任务的扩容标识为第二扩容标识值。
在本发明实施例中,时间属性标识可包括第一时间属性标识值和第二时间属性标识值,第一时间属性标识值用于表示对应的接入任务位于对应的时间窗口内,可使用例如1表示。第二时间属性标识值用于表示对应的接入任务没有位于对应的时间窗口内,可使用例如0表示。
具体地,Tagj用于表示所述目标存储器集群在Rj对应的历史任务接入目标存储器集群前的设定时间窗口内是否进行过扩容,所述设定时间窗口的长度小于所述目标时间窗口的长度;如果Tagj为第一扩容标识值例如为1,则表示所述目标存储器集群在Rj对应的历史任务接入目标存储器集群前的设定时间窗口内进行过扩容,如果Tagj为第二扩容标识值例如为0,则表示所述目标存储器集群在Rj对应的历史任务接入目标存储器集群前的设定时间窗口内没有进行过扩容。Qj用于表示Timej是否位于目标时间窗口内,如果Qj为第一时间属性标识值例如1,则表示Timej位于所述目标时间窗口内,如果Qj为第二时间属性标识值例如0,则表示Timej不位于所述目标时间窗口内。
S220,基于C和F构建当前目标存储器集群的目标特征向量F=(K1,K2,…,Kj,…,Km,C1,C2,…,Ci,…,Cn),其中,第j个接入任务影响因素Kj=α·Rj,α为影响系数。
在本发明实施例中,α=u/m,u基于Q1,Q2,…,Qj,…,Qm确定或者基于Tag1,Tag2,…,Tagj,…,Tagm确定。
进一步地,在一个示意性实施例中,u基于Q1,Q2,…,Qj,…,Qm确定,具体可通过如下步骤确定:
S121,设置j=m,Var=0;
S122,如果j≥1,执行S123;否则,执行S125;
S123,对于Rj,如果Qj为第一时间属性标识值,设置Var=Var+1,执行S124;如果Qj为第二时间属性标识值,执行S124;
S124,设置j=j-1,执行S122;
S125,设置u=Var,并退出当前控制程序。
S121至S125的技术效果在于,将u设置为m个历史任务中接入时间位于目标时间窗口内的任务数量,这样,如果属于目标时间窗口内的接人任务越多,则说明当前目标存储器集群需要扩容的概率越大,即R对当前目标存储器集群的扩容概率的影响越大。
进一步地,在另一个示意性实施例中,u基于Tag1,Tag2,…,Tagj,…,Tagm确定,具体可通过如下步骤确定:
S1201,如果Rm对应的扩容标识Tagm为第一扩容标识值,设置u=0,说明R对当前目标存储器集群的扩容概率的影响为0,并退出当前控制程序,如果Rm对应的扩容标识Tagm为第二扩容标识值,执行S1202;
S1202,设置r=m-1,Var=1;
S1203,如果r≥1,执行S1204;否则,执行S1206;
S1204,对于Rr,如果Rr对应的扩容标识Tagr为第二扩容标识值并且Rr+1对应的扩容标识Tagr+1为第二扩容标识值,设置Var=Var+1,执行S1205;如果Rr对应的扩容标识Tagr为第一扩容标识值,执行S1206;
S1205,设置r=r-1,执行S1203;
S1206,设置u=Var,并退出当前控制程序。
S1201至S1206的技术效果在于,将u设置为从当前时间往前数,连续的接入前目标存储器集群没有进行扩容的任务的数量,这样,如果这类任务的数量越多,则说明当前目标存储器集群需要扩容的概率越大,即R对当前目标存储器集群的扩容概率的影响越大。
本领域技术人员知晓,输入到目标扩容预测模型中的F中的各向量的维度可以是相同的也可以是不同的,只要能够便于模型识别即可。
S230,将F输入到所述目标扩容预测模型中,以得到当前目标存储器集群对应的扩容预测值Y,如果Y≥Y0,则输出对所述目标存储器集群进行扩容的提示信息;否则,输出表示不需要对所述目标存储器集群进行扩容的提示信息。Y0为预设阈值,在一个示例中,Y0可为固定值,可经验值。
在本发明实施例中,Y=f(b1·K1,b2·K2,…,bj·Kj,…,bm·Km,d1·C1, d2·C2,…,di·Ci,…,dn·Cn),f()为预设的扩充概率确定函数,b1,b2,…,bj,…,bm,d1,d2,…,di,…,dn为所述通过训练初始扩容预测模型得到的参数,即S200得到的参数。
在本发明一示意性实施例中,f()为线性回归函数表达式。在另一个示意性实施例中,f()为逻辑回归函数表达式。
本发明实施例提供的基于容量使用预测的扩容提示方法,能够利用基于目标存储器集群的接入任务变化规律和存储量变化规律训练得到的预测模型对当前目标存储器集群是否需要扩容进行预测,从而能够避免在未来出现新任务接入时而容量不够需先进行扩容再接入新任务的问题,能够提高新任务的接入效率。
进一步地,在本发明实施例中,S200可具体包括:
S201,获取第一数据集D1={D11,D12,…,D1u,…,D1p},D1u为第u个第一历史任务对应的数据集,D1u={R1u,C1u},u的取值为1到p,p为第一历史任务的数量。
其中,R1u为按照时间先后顺序获取目标存储器集群距离第u个第一历史任务对应的扩容开始时间TSEu最近的m个历史接入任务信息形成的历史接入信息集;R1u={R1u1,R1u2,…,R1uj,…,R1um},R1uj为第u个第一历史任务对应的第j个历史接入任务信息,并且,在R1um对应的历史任务开始接入目标存储器集群的接入时间和TSEu之间的时间间隔内没有历史任务接入所述目标存储器集群,即Δt1u1>Δt1u2>…>Δt1uj>…>Δt1um,并且在Δt1um内没有历史任务接入所述目标存储器集群;Δt1uj为第u个第一历史任务对应的第j个历史接入任务信息R1uj对应的历史任务开始接入目标存储器集群的接入时间和第u个第一历史任务对应的扩容开始时间之间的时间间隔,j的取值为1到m。
进一步地,R1uj=(type1uj,Num1uj,Time1uj,space1uj,Tag1uj,Q1uj),其中,type1uj为R1uj对应的历史任务的任务类型标识,Num1uj为R1uj对应的历史任务所使用的电子设备的数量,Time1uj为R1uj对应的历史任务开始接入目标存储器集群的接入时间,space1uj为R1uj对应的历史任务开始接入目标存储器集群时,目标存储器集群的当前存储量与当前总存储量之间的比值,Tag1uj为R1uj对应的历史任务的扩容标识,Q1uj为R1uj对应的历史任务的时间属性标识。
进一步地,C1u为第u个第一历史任务对应的时间窗口TW1u内的存储量信息集C1u={C1u1,C1u2,…,C1ui,…,C1un},其中,TW1u的结束时间为第u个第一历史任务对应的扩容开始时间TSEu,TW1u的长度与目标时间窗口的长度相同,C1ui为在TW1u内的第i个时间段内目标存储器集群的最大实时存储量与总存储量的比值。
S202,基于D1获取第一训练集F1={F11,F12,…,F1u,…,F1p},F1u为F1中的第u个特征向量,F1u=(K1u1,K1u2,…,K1uj,…,K1um,C1u1,C1u2,…,C1ui,…,C1un),K1uj=α·R1uj;F1中的每个特征向量对应的扩容预测值为1。
本领域技术人员知晓,F1的获取方法与前述的F获取方法相类似。
S203,获取第二数据集D2={D21,D22,…,D2v,…,D2q},D2v为D2中的第v个第二历史任务,v的取值为1到q,q为第二历史任务的数量。
其中,R2v为按照时间先后顺序获取目标存储器集群距离第v个第二历史任务开始接入目标存储器集群的接入时间TCv最近的m个历史接入任务信息形成的历史接入信息集,R2v={R2v1,R2v2,…,R2vj,…,R2vm},其中,R2vj为第v个第二历史任务对应的第j个历史接入任务信息,并且,在R2vm对应的历史任务开始接入目标存储器集群的接入时间和TCv之间的时间间隔内没有历史任务接入所述目标存储器集群,即Δt2v1>Δt2v2>…>Δt2vj>…>Δt2vm,并且在Δt2vm内没有历史任务接入所述目标存储器集群;Δt2vj为第v个第二历史任务对应的第j个历史接入任务信息R2vj对应的历史任务开始接入目标存储器集群的接入时间和TCv之间的时间间隔。
进一步地,R2vj=(type2vj,Nvm2vj,Time2vj,space2vj,Tag2vj,Q2vj),其中,type2vj为R2vj对应的历史任务的任务类型标识,Nvm2vj为R2vj对应的历史任务所使用的电子设备的数量,Time2vj为R2vj对应的历史任务开始接入目标存储器集群的接入时间,space2vj为R2vj对应的历史任务开始接入目标存储器集群时,目标存储器集群的当前存储量与当前总存储量之间的比值,Tag2vj为R2vj对应的历史任务的扩容标识,Q2vj为R2vj对应的历史任务的时间属性标识。
其中,C2v为第v个第二历史任务对应的时间窗口TW2v内的存储量信息集C2v={C2v1,C2v2,…,C2vi,…,C2vn},其中,TW2v的结束时间为第v个第二历史任务开始接入目标存储器集群的接入时间TCv,TW2v的长度与目标时间窗口的长度相同,C2vi为在TW2v内的第i个时间段内目标存储器集群的最大实时存储量与总存储量的比值。
S204,基于D2获取第二训练集F2={F21,F22,…,F2v,…,F2q},F2v为F2中的第v个特征向量,F2v=(K2v1,K2v2,…,K2vj,…,K2vm,C2v1,C2v2,…,C2vi,…,C2vn),K2vj=α·R2vj;F2中的每个特征向量对应的扩容预测值为0。
本领域技术人员知晓,F2的获取方法与前述的F获取方法相类似。
S205,根据F1和F2对初始扩容预测模型进行训练,以得到所述目标扩容预测模型。
本领域技术人员知晓,初始扩容预测模型可为现有的神经网络模型。此外,在模型训练过程中,可基于本领域的公知操作设置初始扩容模型的约束条件例如,设置b1+b2+…+bj+…+bm =rat1,设置d1+d2+…+di+…+dn=rat2,b1,b2,…,bj,…,bm,d1,d2,…,di,…,dn≠0,其中,rat1和rat2为预设的系数约束值,rat1+rat2=1。
此外,本领域技术人员知晓,对初始扩容预测模型进行训练的过程可为现有方法。
本发明实施例中,由于使用了在接入前的设定时间窗口内产生了扩容行为的任务以及在接入前的设定时间窗口内没有产生扩容行为的任务的相关信息作为训练集,能够提高模型的预测准确性。
进一步地,在本发明一示意性实施例中,m=max(Y1,Y2,…,Ye1,…,Yz1),Ye1为设定历史时间段内的第e1个未扩容任务组对应的任务数量,e1的取值为1到z1,z1为未扩容任务组的数量,其中,第e1个未扩容任务组包括连续接入目标存储器集群的Ye1个任务,并且Ye1个任务中任一任务对应的扩容标识为第二扩容标识值即Ye1个任务中任一任务在接入目标存储器集群时目标存储器集群均没有进行扩容。
在本发明实施例中,设定历史时间段可基于实际需要进行设置。本实施例中,将m设置为历史时间段内连续接入的任务在接入前均未进行扩容的任务数量的最大值,这样,由于u可被设置为从当前时间往前数,连续的接入前目标存储器集群没有进行扩容的任务的数量,这样,能够使得u=m,能够确保u设置更加准确,当α=1时,R对当前目标存储器集群的扩容概率的影响最大。
进一步地,在本发明另一示意性实施例中,m=max(X1,X2,…,Xe2,…,Xz2),Xe2为设定历史时间段内的第e2个接入任务组对应的任务数量,e2的取值为1到z2,z2为接入任务组的数量,其中,每个接入任务组对应的任务为在目标时间窗口对应的时长内接入到目标存储器集群中的任务。
在本实施例中,将m设置为历史时间段内在目标时间窗口对应的时长内接入到目标存储器集群中的新任务的数量中的最大值,能够设置m的设置合理,使得m个任务的接入时间能够填满目标时间窗口,能够避免目标时间窗口内可能不存在接入任务而导致的采用补零的方法保持数据长度一致的问题,并且不会超出目标时间窗口太多,能够避免由于m设置过小而导致数据太少而影响模型预测精度,以及m设置过大而导致出现无用数据所导致的处理速率慢的问题。
进一步地,在本发明实施例中,所述设定时间窗口的长度等于MD·tav。其中,MD为存储器增量集IQ的众数,IQ={IQ1,IQ2,…,IQh,…,IQL},IQh为在设定历史时间段内的第h次目标扩容时接入到当前目标存储器集群中的存储器数量,h的取值为1到L,L为目标扩容的次数,所述目标扩容为在当前目标存储器集群中接入新任务而进行的扩容;tav=(At1+At2+…+Atb+…+Atd)/(IQ1+IQ2+…+IQh+…+IQL),Atb为IQ对应的d个存储器中的第b个存储器接入到目标存储器集群所需要到的时间即成功接入到目标存储器集群中所需要的时间,b的取值为1到d。
在本发明实施例中,如果IQ的众数为多个,则MD为IQ的众数中的最大值。
本发明实施例中,将设定时间窗口的长度设置为于MD·tav,能够使得设定时间窗口的长度相对准确,进而能够准确找到为了接入新任务而进行的扩容,使得数据更加准确。
本发明另一实施例提供一种基于容量使用预测的扩容提示装置,包括:
模型构建模块,用于基于设定历史时间段内接入目标存储器集群中的第一历史任务和第二历史任务获取用于得到目标存储器集群的扩容预测值的目标扩容预测模型;所述扩容预测值用于判断所述目标存储器集群是否需要扩容;所述第一历史任务为所述目标存储器集群在该第一历史任务接入所述目标存储器集群前的设定时间窗口内进行过扩容的任务,所述第二历史任务为所述目标存储器集群在该第二历史任务接入所述目标存储器集群前的设定时间窗口内没有进行过扩容但任务类型与第一历史任务的任务类型相同的任务;
数据获取模块,用于获取当前目标存储器集群在目标时间窗口内对应的存储量信息集C={C1,C2,…,Ci,…,Cn}和按照时间先后顺序获取目标存储器集群距离当前时间最近的m个历史接入任务信息形成的信息集R={R1,R2,…,Rj,…,Rm};其中,目标时间窗口的结束时间为当前时间,目标时间窗口包括n个连续排布的时间段,目标时间窗口的长度为n·ΔT,ΔT为每一时间段的长度;Ci为目标时间窗口内的第i个时间段内目标存储器集群的最大实时存储量与总存储量的比值,i的取值为1到n;Rj为第j个历史接入任务信息,j的取值为1到m;
特征向量获取模块,用于基于C和F构建当前目标存储器集群的目标特征向量F=(K1,K2,…,Kj,…,Km,C1,C2,…,Ci,…,Cn),其中,Kj=α·Rj,α为影响系数;
扩容预测模块,用于将F输入到所述目标扩容预测模型中,以得到当前目标存储器集群对应的扩容预测值Y,如果Y≥Y0,则输出对所述目标存储器集群进行扩容的提示信息;Y0为预设阈值。
本发明的实施例还提供了一种非瞬时性计算机可读存储介质,该存储介质可设置于电子设备之中以保存用于实现方法实施例中一种方法相关的至少一条指令或至少一段程序,该至少一条指令或该至少一段程序由该处理器加载并执行以实现上述实施例提供的方法。
本发明的实施例还提供了一种电子设备,包括处理器和前述的非瞬时性计算机可读存储介质。
本发明的实施例还提供一种计算机程序产品,其包括程序代码,当所述程序产品在电子设备上运行时,所述程序代码用于使该电子设备执行本说明书上述描述的根据本发明各种示例性实施方式的方法中的步骤。
虽然已经通过示例对本发明的一些特定实施例进行了详细说明,但是本领域的技术人员应该理解,以上示例仅是为了进行说明,而不是为了限制本发明的范围。本领域的技术人员还应理解,可以对实施例进行多种修改而不脱离本发明的范围和精神。本发明公开的范围由所附权利要求来限定。

Claims (10)

1.一种基于容量使用预测的扩容提示方法,其特征在于,所述方法包括如下步骤:
S200,基于设定历史时间段内接入目标存储器集群中的第一历史任务和第二历史任务获取用于得到目标存储器集群的扩容预测值的目标扩容预测模型;所述扩容预测值用于判断所述目标存储器集群是否需要扩容;所述第一历史任务为所述目标存储器集群在该第一历史任务接入所述目标存储器集群前的设定时间窗口内进行过扩容的任务,所述第二历史任务为所述目标存储器集群在该第二历史任务接入所述目标存储器集群前的设定时间窗口内没有进行过扩容但任务类型与第一历史任务的任务类型相同的任务;
S210,获取当前目标存储器集群在目标时间窗口内对应的存储量信息集C={C1,C2,…,Ci,…,Cn}和按照时间先后顺序获取目标存储器集群距离当前时间最近的m个历史接入任务信息形成的信息集R={R1,R2,…,Rj,…,Rm};其中,目标时间窗口的结束时间为当前时间,目标时间窗口包括n个连续排布的时间段,目标时间窗口的长度为n·ΔT,ΔT为每一时间段的长度;Ci为目标时间窗口内的第i个时间段内目标存储器集群的最大实时存储量与总存储量的比值,i的取值为1到n;Rj为第j个历史接入任务信息,j的取值为1到m;S220,基于C和F构建当前目标存储器集群的目标特征向量F=(K1,K2,…,Kj,…,Km,C1,C2,…,Ci,…,Cn),其中,Kj=α·Rj,α为影响系数;
S230,将F输入到所述目标扩容预测模型中,以得到当前目标存储器集群对应的扩容预测值Y,如果Y≥Y0,则输出对所述目标存储器集群进行扩容的提示信息;Y0为预设阈值。
2.根据权利要求1所述的方法,其特征在于,S200具体包括:
S201,获取第一数据集D1={D11,D12,…,D1u,…,D1p},D1u为第u个第一历史任务对应的数据集,D1u={R1u,C1u},u的取值为1到p,p为第一历史任务的数量;R1u为按照时间先后顺序获取目标存储器集群距离第u个第一历史任务对应的扩容开始时间TSEu最近的m个历史接入任务信息形成的历史接入信息集;R1u={R1u1,R1u2,…,R1uj,…,R1um},R1uj为第u个第一历史任务对应的第j个历史接入任务信息,并且,在R1um对应的历史任务开始接入目标存储器集群的接入时间和TSEu之间的时间间隔内没有历史任务接入所述目标存储器集群,j的取值为1到m;C1u为第u个第一历史任务对应的时间窗口TW1u内的存储量信息集C1u={C1u1,C1u2,…,C1ui,…,C1un},其中,TW1u的结束时间为TSEu,TW1u的长度与目标时间窗口的长度相同,C1ui为在TW1u内的第i个时间段内目标存储器集群的最大实时存储量与总存储量的比值;i的取值为1到n;
S202,基于D1获取第一训练集F1={F11,F12,…,F1u,…,F1p},F1u为F1中的第u个特征向量,F1u=(K1u1,K1u2,…,K1uj,…,K1um,C1u1,C1u2,…,C1ui,…,C1un),K1uj=α·R1uj;F1中的每个特征向量对应的扩容预测值为1;
S203,获取第二数据集D2={D21,D22,…,D2v,…,D2q},D2v为D2中的第v个第二历史任务,第二历史任务与第一历史任务的任务类型相同,但对应的扩容标识为第二扩容标识值的任务,v的取值为1到q,q为第二历史任务的数量;R2v为按照时间先后顺序获取目标存储器集群距离第v个第二历史任务开始接入目标存储器集群的接入时间TCv最近的m个历史接入任务信息形成的历史接入信息集;R2v={R2v1,R2v2,…,R2vj,…,R2vm},R2vj为第v个第二历史任务对应的第j个历史接入任务信息,并且,在R2vm对应的历史任务开始接入目标存储器集群的接入时间和TCv之间的时间间隔内没有历史任务接入所述目标存储器集群;C2v为第v个第二历史任务对应的时间窗口TW2v内的存储量信息集C2v={C2v1,C2v2,…,C2vi,…,C2vn},其中,TW2v的结束时间为TCv,TW2v的长度与目标时间窗口的长度相同,C2vi为在TW2v内的第i个时间段内目标存储器集群的最大实时存储量与总存储量的比值;
S204,基于D2获取第二训练集F2={F21,F22,…,F2v,…,F2q}, F2v为F2中的第v个特征向量,F2v=(K2v1,K2v2,…,K2vj,…,K2vm,C2v1,C2v2,…,C2vi,…,C2vn),K2vj=α·R2vj;F2中的每个特征向量对应的扩容预测值为0;
S205,根据F1和F2对初始扩容预测模型进行训练,以得到所述目标扩容预测模型。
3.根据权利要求1所述的方法,其特征在于,Rj=(typej,Numj,Timej,spacej,Tagj,Qj),其中,typej为Rj对应的历史任务的任务类型标识,Numj为需要执行Rj对应的历史任务的电子设备的数量,Timej为Rj对应的历史任务开始接入目标存储器集群的接入时间,spacej为Rj对应的历史任务开始接入目标存储器集群时,目标存储器集群的当前存储量与当前总存储量之间的比值,Tagj为Rj对应的历史任务的扩容标识,Qj为Rj对应的历史任务的时间属性标识;其中,Tagj用于表示所述目标存储器集群在Rj对应的历史任务接入目标存储器集群前的设定时间窗口内是否进行过扩容,所述设定时间窗口的长度小于所述目标时间窗口的长度;如果Tagj为第一设定扩容标识值,则表示所述目标存储器集群在Rj对应的历史任务接入目标存储器集群前的设定时间窗口内进行过扩容,如果Tagj为第二设定扩容标识值,则表示所述目标存储器集群在Rj对应的历史任务接入目标存储器集群前的设定时间窗口内没有进行过扩容;Qj用于表示Timej是否位于目标时间窗口内,如果Qj为第一时间属性标识值,则表示Timej位于所述目标时间窗口内,如果Qj为第二时间属性标识值,则表示Timej不位于所述目标时间窗口内;并且,在Rm对应的历史任务开始接入目标存储器集群的接入时间和当前时间之间的时间间隔内没有历史任务接入所述目标存储器集群。
4.根据权利要求3所述的方法,其特征在于,α=u/m,u基于Q1,Q2,…,Qj,…,Qm确定或者基于Tag1,Tag2,…,Tagj,…,Tagm确定。
5.根据权利要求4所述的方法,其特征在于,u具体通过如下步骤确定:
S121,设置j=m,Var=0;
S122,如果j≥1,执行S123;否则,执行S125;
S123,对于Rj,如果Qj为第一时间属性标识值,设置Var=Var+1,执行S124;如果Qj为第二时间属性标识值,执行S124;
S124,设置j=j-1,执行S122;
S125,设置u=Var,并退出当前控制程序。
6.根据权利要求4所述的方法,其特征在于,u基于如下步骤确定:
S1201,如果Rm对应的扩容标识Tagm为第一扩容标识值,设置u=0,并退出当前控制程序,如果Rm对应的扩容标识Tagm为第二扩容标识值,执行S1202;
S1202,设置r=m-1,Var=1;
S1203,如果r≥1,执行S1204;否则,执行S1206;
S1204,对于Rr,如果Rr对应的扩容标识Tagr为第二扩容标识值并且Rr+1对应的扩容标识Tagr+1为第二扩容标识值,设置Var=Var+1,执行S1205;如果Rr对应的扩容标识Tagr为第一扩容标识值,执行S1206;
S1205,设置r=r-1,执行S1203;
S1206,设置u=Var,并退出当前控制程序。
7.根据权利要求1所述的方法,其特征在于,m=max(Y1,Y2,…,Ye1,…,Yz1),Ye1为设定历史时间段内的第e1个未扩容任务组对应的任务数量,e1的取值为1到z1,z1为未扩容任务组的数量,其中,第e1个未扩容任务组包括连续接入当前目标存储器集群的Ye1个任务,并且Ye1个任务中任一任务对应的扩容标识为第二扩容标识值。
8.根据权利要求1所述的方法,其特征在于,所述设定时间窗口的长度等于MD·tav,MD为存储器增量集IQ的众数,IQ={IQ1,IQ2,…,IQh,…,IQL},IQh为在设定历史时间段内的第h次目标扩容时接入到当前目标存储器集群中的存储器数量,h的取值为1到L,L为目标扩容的次数,所述目标扩容为在当前目标存储器集群中接入新任务而进行的扩容;tav=(At1+At2+…+Atb+…+Atd)/(IQ1+IQ2+…+IQh+…+IQL),Atb为IQ对应的d个存储器中的第b个存储器接入到当前目标存储器集群所需要到的时间,b的取值为1到d。
9.一种基于容量使用预测的扩容提示装置,其特征在于,包括:
模型构建模块,用于基于设定历史时间段内接入目标存储器集群中的第一历史任务和第二历史任务获取用于得到目标存储器集群的扩容预测值的目标扩容预测模型;所述扩容预测值用于判断所述目标存储器集群是否需要扩容;所述第一历史任务为所述目标存储器集群在该第一历史任务接入所述目标存储器集群前的设定时间窗口内进行过扩容的任务,所述第二历史任务为所述目标存储器集群在该第二历史任务接入所述目标存储器集群前的设定时间窗口内没有进行过扩容但任务类型与第一历史任务的任务类型相同的任务;
数据获取模块,用于获取当前目标存储器集群在目标时间窗口内对应的存储量信息集C={C1,C2,…,Ci,…,Cn}和按照时间先后顺序获取目标存储器集群距离当前时间最近的m个历史接入任务信息形成的信息集R={R1,R2,…,Rj,…,Rm};其中,目标时间窗口的结束时间为当前时间,目标时间窗口包括n个连续排布的时间段,目标时间窗口的长度为n·ΔT,ΔT为每一时间段的长度;Ci为目标时间窗口内的第i个时间段内目标存储器集群的最大实时存储量与总存储量的比值,i的取值为1到n;Rj为第j个历史接入任务信息,j的取值为1到m;
特征向量获取模块,用于基于C和F构建当前目标存储器集群的目标特征向量F=(K1,K2,…,Kj,…,Km,C1,C2,…,Ci,…,Cn),其中,Kj=α·Rj,α为影响系数;
扩容预测模块,用于将F输入到所述目标扩容预测模型中,以得到当前目标存储器集群对应的扩容预测值Y,如果Y≥Y0,则输出对所述目标存储器集群进行扩容的提示信息;Y0为预设阈值。
10.一种非瞬时性计算机可读存储介质,所述存储介质中存储有至少一条指令或至少一段程序,其特征在于,所述至少一条指令或所述至少一段程序由处理器加载并执行以实现如权利要求1-8中任意一项的所述方法。
CN202310443568.XA 2023-04-24 2023-04-24 一种基于容量使用预测的扩容提示方法、装置及存储介质 Pending CN116414663A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310443568.XA CN116414663A (zh) 2023-04-24 2023-04-24 一种基于容量使用预测的扩容提示方法、装置及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310443568.XA CN116414663A (zh) 2023-04-24 2023-04-24 一种基于容量使用预测的扩容提示方法、装置及存储介质

Publications (1)

Publication Number Publication Date
CN116414663A true CN116414663A (zh) 2023-07-11

Family

ID=87056157

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310443568.XA Pending CN116414663A (zh) 2023-04-24 2023-04-24 一种基于容量使用预测的扩容提示方法、装置及存储介质

Country Status (1)

Country Link
CN (1) CN116414663A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117148798A (zh) * 2023-09-01 2023-12-01 山东溯源安全科技有限公司 一种设备监控方法、装置、存储介质及电子设备

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103903069A (zh) * 2014-04-15 2014-07-02 广东电网公司信息中心 存储容量预测方法及存储容量预测系统
WO2016086406A1 (zh) * 2014-12-05 2016-06-09 华为技术有限公司 一种网络资源部署方法和设备
CN109885469A (zh) * 2019-02-27 2019-06-14 深信服科技股份有限公司 一种扩容方法、预测模型创建方法、装置、设备及介质
CN111427753A (zh) * 2020-03-23 2020-07-17 上海新炬网络信息技术股份有限公司 基于arima模型的容量预测装置及其控制方法
WO2021254354A1 (zh) * 2020-06-18 2021-12-23 中兴通讯股份有限公司 容量控制方法、网管设备、管理编排设备、系统及介质
JP7079998B1 (ja) * 2021-12-16 2022-06-03 北京穿楊科技有限公司 クラスタの容量拡張方法及び装置
CN114625477A (zh) * 2022-01-25 2022-06-14 浙江大华技术股份有限公司 一种服务节点容量调整方法、设备及计算机可读存储介质

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103903069A (zh) * 2014-04-15 2014-07-02 广东电网公司信息中心 存储容量预测方法及存储容量预测系统
WO2016086406A1 (zh) * 2014-12-05 2016-06-09 华为技术有限公司 一种网络资源部署方法和设备
CN109885469A (zh) * 2019-02-27 2019-06-14 深信服科技股份有限公司 一种扩容方法、预测模型创建方法、装置、设备及介质
CN111427753A (zh) * 2020-03-23 2020-07-17 上海新炬网络信息技术股份有限公司 基于arima模型的容量预测装置及其控制方法
WO2021254354A1 (zh) * 2020-06-18 2021-12-23 中兴通讯股份有限公司 容量控制方法、网管设备、管理编排设备、系统及介质
JP7079998B1 (ja) * 2021-12-16 2022-06-03 北京穿楊科技有限公司 クラスタの容量拡張方法及び装置
CN114625477A (zh) * 2022-01-25 2022-06-14 浙江大华技术股份有限公司 一种服务节点容量调整方法、设备及计算机可读存储介质

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117148798A (zh) * 2023-09-01 2023-12-01 山东溯源安全科技有限公司 一种设备监控方法、装置、存储介质及电子设备

Similar Documents

Publication Publication Date Title
CN111709533B (zh) 机器学习模型的分布式训练方法、装置以及计算机设备
US9015083B1 (en) Distribution of parameter calculation for iterative optimization methods
JP2022500769A (ja) 電力システム熱負荷の予測方法及び予測装置
CN111859986B (zh) 基于多任务孪生网络的语义匹配方法、装置、设备和介质
CN111783993A (zh) 智能标注方法、装置、智能平台及存储介质
CN111950810B (zh) 一种基于自演化预训练的多变量时间序列预测方法和设备
CN113220450B (zh) 面向云端多数据中心的负载预测方法、资源调度方法及装置
CN116414662B (zh) 一种存储空间扩容提示方法、装置、电子设备及存储介质
CN116414663A (zh) 一种基于容量使用预测的扩容提示方法、装置及存储介质
JPWO2020075771A1 (ja) 計画装置、計画方法、および計画プログラム
CN115600109A (zh) 样本集优化方法及其装置、设备、介质、产品
CN111598329A (zh) 基于自动化参数调整循环神经网络的时序数据预测方法
US11681935B2 (en) Apparatus for data analysis and method thereof
Lazzaro et al. Minimizing energy consumption of deep learning models by energy-aware training
CN113159441A (zh) 银行业务项目实施情况的预测方法及装置
CN116933657A (zh) 一种复杂型面加工参数特征提取方法、系统、设备及介质
CN109189973B (zh) 基于策略梯度的大规模图像检索方法及装置
CN105701207A (zh) 资源的请求量预测方法、应用推荐方法和装置
CN116089595A (zh) 基于科技成果的数据处理推送方法、装置及介质
Grzybowska et al. Application of Machine Learning Method under IFRS 9 Approach to LGD Modeling.
CN110858355A (zh) 项目预算结余预测方法及装置
CN112463378B (zh) 一种服务器资产扫描方法、系统、电子设备及存储介质
CN111061875B (zh) 超参数确定方法、装置、计算机设备和存储介质
CN111462893B (zh) 一种提供诊断依据的中文病历辅助诊断方法及系统
CN114389953A (zh) 一种基于流量预测的Kubernetes容器动态扩缩容方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination