CN114265720A - 选择备份目的地的方法、电子设备和计算机程序产品 - Google Patents

选择备份目的地的方法、电子设备和计算机程序产品 Download PDF

Info

Publication number
CN114265720A
CN114265720A CN202010972953.XA CN202010972953A CN114265720A CN 114265720 A CN114265720 A CN 114265720A CN 202010972953 A CN202010972953 A CN 202010972953A CN 114265720 A CN114265720 A CN 114265720A
Authority
CN
China
Prior art keywords
backup
destination
information
storage device
task
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010972953.XA
Other languages
English (en)
Inventor
贾真
王琪
张赟
王韧
于靖
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
EMC Corp
Original Assignee
EMC IP Holding Co LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by EMC IP Holding Co LLC filed Critical EMC IP Holding Co LLC
Priority to CN202010972953.XA priority Critical patent/CN114265720A/zh
Priority to US17/072,702 priority patent/US11275655B1/en
Publication of CN114265720A publication Critical patent/CN114265720A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1446Point-in-time backing up or restoration of persistent data
    • G06F11/1458Management of the backup or restore process
    • G06F11/1461Backup scheduling policy
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3409Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment for performance assessment
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1446Point-in-time backing up or restoration of persistent data
    • G06F11/1456Hardware arrangements for backup
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3466Performance evaluation by tracing or monitoring
    • G06F11/3485Performance evaluation by tracing or monitoring for I/O devices
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2201/00Indexing scheme relating to error detection, to error correction, and to monitoring
    • G06F2201/805Real-time
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2201/00Indexing scheme relating to error detection, to error correction, and to monitoring
    • G06F2201/81Threshold

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Hardware Design (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本公开的实现方式提供了选择备份目的地的方法、电子设备和计算机程序产品。在一种方法中,接收存储设备集合中的存储设备的设备信息,备份任务在存储设备集合中被执行。接收备份任务的备份信息。获取目的地关联关系,目的地关联关系描述参考存储设备集合中的参考备份任务与参考备份任务的参考备份目的地之间的关联关系,参考备份目的地包括参考存储系统中的一组存储设备。根据目的地关联关系,基于设备信息和备份信息,在存储设备集合中为备份任务选择备份目的地,备份目的地包括存储设备集合中的一组存储设备。通过本公开的实现方式,可以大大降低选择备份目的地的计算量,从而提高存储系统的自动化水平和性能。

Description

选择备份目的地的方法、电子设备和计算机程序产品
技术领域
本公开的实现方式一般地涉及存储系统,并且更特别地涉及用于选择作为备份目的地的存储设备的方法、电子设备和计算机程序产品。
背景技术
如今,许多公司或企业每天都会生成大量的数据。为了数据的安全,对数据的保护变得越来越重要。在这方面,备份存储系统可以提供数据保护,以便将待备份的数据复制到一个或多个存储设备,从而获得存放在不同存储设备中的一个或多个数据副本。
目前已经提出了基于存储设备集合中的多个可选存储设备的状态,来选择可以作为备份目的地的存储设备子集。例如,可以为存储设备集合中的每个存储设备的状态设置评分,并且确定生成存储设备子集的各种组合方式(例如,基于排列组合的方式)。然而,当存在大量(例如,数十甚至更多)存储设备时,基于备份副本的数量,将存在数万甚至数十万种组合方式。此时,在选择备份目的地时,将涉及巨大的计算量,因而不能以有效的方式向用户提供备份目的地的建议。
发明内容
本公开的实现方式提出了一种在存储设备集合中确定用于数据备份的存储设备子集的技术方案,并且具体提供了一种存储管理方法、电子设备和计算机程序产品。
在本公开的第一方面,提供了一种用于为备份任务选择备份目的地的方法。在该方法中,接收存储设备集合中的存储设备的设备信息,备份任务在存储设备集合中被执行。接收备份任务的备份信息。获取目的地关联关系,目的地关联关系描述参考存储设备集合中的参考备份任务与参考备份任务的参考备份目的地之间的关联关系,参考备份目的地包括参考存储系统中的一组存储设备。根据目的地关联关系,基于设备信息和备份信息,在存储设备集合中为备份任务选择备份目的地,备份目的地包括存储设备集合中的一组存储设备。
在本公开的第二方面,提供了一种电子设备,包括:至少一个处理器;以及至少一个存储器,存储有计算机程序指令,至少一个存储器和计算机程序指令被配置为,与至少一个处理器一起,使电子设备执行一种用于为备份任务选择备份目的地的动作。该动作包括:接收存储设备集合中的存储设备的设备信息,备份任务在存储设备集合中被执行;接收备份任务的备份信息;获取目的地关联关系,目的地关联关系描述参考存储设备集合中的参考备份任务与参考备份任务的参考备份目的地之间的关联关系,参考备份目的地包括参考存储系统中的一组存储设备;以及根据目的地关联关系,基于设备信息和备份信息,在存储设备集合中为备份任务选择备份目的地,备份目的地包括存储设备集合中的一组存储设备。
在本公开的第三方面,提供了一种计算机程序产品。该计算机程序产品被有形地存储在非易失性计算机可读介质上并且包括机器可执行指令。机器可执行指令在被执行时使机器执行根据第一方面的方法的步骤。
应当理解,发明内容部分中所描述的内容并非旨在限定本公开的实现方式的关键或重要特征,亦非用于限制本公开的范围。本公开的其他特征通过以下的描述将变得容易理解。
附图说明
通过参考附图阅读下文的详细描述,本公开的实现方式的上述以及其他目的、特征和优点将变得容易理解。在附图中,以示例性而非限制性的方式示出了本公开的若干实现方式。
图1示意性示出了其中可以实现本公开的示例性实现方式的示例应用环境的框图。
图2示意性示出了根据本公开的示例性实现方式的用于选择备份目的地的过程的框图。
图3示意性示出了根据本公开的示例性实现方式的用于选择备份目的地的方法的流程图。
图4A示意性示出了根据本公开的示例性实现方式的设备信息的数据结构的框图;
图4B示意性示出了根据本公开的示例性实现方式的备份信息的数据结构的框图;
图4C示意性示出了根据本公开的示例性实现方式的特征向量的数据结构的框图;
图5示意性示出了根据本公开的示例性实现方式的基于特征向量来获取目的地关联关系的框图;
图6A示意性示出了根据本公开的示例性实现方式的有关可用存储空间的变化的框图;
图6B示意性示出了根据本公开的示例性实现方式的有关网络带宽的变化的框图;
图7示意性示出了根据本公开的示例性实现方式的基于特征向量来获取目的地关联关系的框图;以及
图8示意性示出了一种可以被用来实施本公开的示例性实现方式的设备的框图。
贯穿所有附图,相同或者相似的参考标号被用来表示相同或者相似的组件。
具体实施方式
下面将参考附图中示出的若干示例性实现方式来描述本公开的原理和精神。应当理解,描述这些实现方式仅是为了使本领域的技术人员能够更好地理解并实现本公开,而并非以任何方式限制本公开的范围。在本文的描述和权利要求中,除非另有定义,否则本文中使用的所有技术术语和科学术语具有与本公开所属领域的普通技术人员通常所理解的含义。
目前已经提出了分布式存储系统的概念,分布式存储系统可以包括上百甚至更多的存储设备。例如,这些存储设备可以分布在世界各地。首先参见图1描述根据本公开的示例性实现方式的应用环境。图1示意性示出了其中可以实现本公开的示例性实现方式的示例应用环境的框图100。如图1所示的存储系统可以包括存储设备集合110,其中可以包括N个存储设备,如附图标记110-1、110-2、110-3、110-4、110-5、110-6、110-7、……、以及110-N所示。
备份任务120可以指定备份副本的数量,例如,可以指定需要3个备份副本。副本数量可以由存储系统的用户来输入,用户可以在服务等级协议(SLA)中指定副本数量。为方便描述起见,在下文中将仅以副本数量为3作为示例进行描述。应当理解,本公开的实现方式可以适用于其他任何数量的副本的情形。
此时,需要从N个存储设备中选择3个存储设备来作为备份目的地。可以存在多个候选子集130,并且每个候选子集包括3个存储设备。例如,候选子集130-1可以包括存储设备110-1、110-2以及110-3,……,以及候选子集130-M可以包括存储设备110-6、110-7以及110-N。可以从多个候选子集130中选择备份目的地140,以便作为备份任务120的备份目的地。
目前已经提出了基于存储设备集合中的多个可选存储设备的状态,来选择可以作为备份目的地的一组存储设备。例如,可以为存储设备集合中的每个存储设备的状态设置评分,并且确定生成存储设备的候选子集的各种组合方式(例如,基于排列组合的方式)的评分。然而,当存在大量(例如,数十甚至更多)存储设备时,基于备份副本的数量,将存在数万甚至数十万种组合方式。假设存在N个存储设备,并且期望存储X个副本,则可以存在
Figure BDA0002684768170000041
种组合方式。例如,N=1000并且X=3,则组合方式的数量为
Figure BDA0002684768170000042
此时,在从大量组合方式中选择备份目的地时,将涉及巨大的计算量。
鉴于传统方案中存在的上述问题以及潜在的其他问题,本公开的实现方式提出了一种在存储设备集合中为备份任务选择备份目的地的技术方案。在本公开的实现方式中,可以基于当前存储系统或者其他类似存储系统的运行历史,创建目的地关联关系。继而,当需要在存储系统中执行备份任务时,可以采集存储系统的当前信息,并且将该当前信息输入至目的地关联关系中,以便获得可以用作备份目的地的存储设备。
在下文中,将参见图2描述根据本公开的示例性实现方式的概要。如图2所示,接收存储设备集合110中的存储设备的设备信息210,并且接收备份任务120的备份信息220。根据目的地关联关系230,基于设备信息210和备份信息220,在存储设备集合110中为备份任务120选择备份目的地140。根据本公开的示例性实现方式,在此的目的地关联关系230可以是基于存储系统的历史运行状态信息获得的,也可以是基于与当前存储系统类似的其他存储系统的历史运行状态信息来获得的。
利用本公开的示例性实现方式,可以直接基于被验证为有效的历史经验来建立目的地关联关系230。以此方式,不必逐一针对每种组合方式来确定评分,而是直接将当前的设备信息210和备份信息220输入至目的地关联关系230,即可获得一个或多个备份目的地。以此方式,可以大大降低选择备份目的地过程中的计算资源和时间开销,并且以更为快速和有效的方式确定备份目的地。
在下文中,将参见图3描述根据本公开的示例性实现方式的更多细节。图3示意性示出了根据本公开的示例性实现方式的用于选择备份目的地的方法300的流程图。在框310处,接收存储设备集合110中的存储设备的设备信息210。在此,在存储设备集合110中执行备份任务120。将会理解,存储设备集合110包括大量存储设备,此时的设备信息210可以包括存储设备集合110中的各个存储设备的信息。
设备信息210可以包括多方面的内容,在下文中,将参见图4A描述有关设备信息210的更多细节。图4A示意性示出了根据本公开的示例性实现方式的设备信息210的数据结构的框图400A。如图4A所示,设备信息210可以包括以下中的至少任一项:存储设备的位置410、存储设备的可用存储空间412、存储设备的网络带宽414、存储设备的CPU使用率416、存储设备的存储器使用率418以及存储设备的耗尽时间420,等等。
在本公开的上下文中,位置410可以利用存储设备所在的经纬度或者其他坐标信息来表示。可用存储空间412表示存储设备中的剩余存储空间,例如可以以可用存储空间大小(GB)表示。备选地和/或附加地,可以利用可用存储空间的百分比来表示。存储设备的网络带宽414是指存储设备的可用带宽,该带宽可以随着存储设备的数据传输负载的大小而变化。存储设备的CPU使用率416和存储器使用率分别表示存储设备中的CPU和存储器被使用的绝对值或者百分比。耗尽时间420是指存储设备中的可用存储空间412将在多久后被耗尽。耗尽时间420可以基于向存储设备传输数据的速度和可用存储空间412来确定。
将会理解,图4A仅示意性示出了存储设备的相关信息的示例,根据本公开的示例性实现方式,设备信息210可以包括存储设备的其他信息,例如,存储设备的存储介质的类型(例如,固态存储设备或者传统硬盘设备)。利用本公开的示例性实现方式,可以统计存储设备集合110中的每个存储设备的设备信息。以此方式,可以充分考虑每个存储设备的多方面的信息,以便从中选择适合的备份目的地。
返回图3,在图3的框320处,接收备份任务120的备份信息220。参见图4B来描述有关备份信息220的更多信息,该图4B示意性示出了根据本公开的示例性实现方式的备份信息220的数据结构的框图400B。如图4B所示,备份信息220可以包括:源数据大小430,表示由备份任务120指定的将要被备份的源数据的大小。将会理解,源数据通常会越来越大,因而备份信息220可以包括源数据增长率432,用于表示源数据每天增长的比例(例如,5%)或者绝对值。进一步,源数据通常不会彻底被改变,而是前后连续两次备份的源数据会存在一定的重复。因而,备份信息220可以包括源数据重复率434,用于表示前后连续的两次备份的源数据的重复率(例如,50%)。
将会理解,图4B仅示意性示出了备份任务120的相关备份信息220的示例,根据本公开的示例性实现方式,备份信息220可以包括备份任务的其他信息,例如,将源数据备份至某个存储设备所花费的传输时间,等等。可以基于存储设备的可用带宽以及源数据大小430来确定传输时间。利用本公开的示例性实现方式,可以统计将要被执行的备份任务120的备份信息220。进而,可以充分考虑备份任务120的多方面的信息,以便从存储设备集合110中选择适合于备份任务120的备份目的地。
上文已经参见图4A和图4B描述了有关设备信息210和备份信息220的具体内容。进一步,可以基于设备信息210和备份信息220来生成表示与在存储系统中执行备份任务120相关联的整体状态的特征向量。在下文中,将参见图4C描述有关特征向量的更多细节,该图4C示意性示出了根据本公开的示例性实现方式的特征向量440的数据结构的框图400C。
如图4C所示,特征向量440可以包括各个存储设备的设备信息:第一个存储设备的备份信息512、第二个存储设备的备份信息514、……、以及第N个存储设备的备份信息516。进一步,该特征向量440可以包括备份任务120的备份信息220。根据本公开的示例性实现方式,可以使用多维向量来表示特征向量440。
返回图3描述如何获取目的地关联关系230。在框330处,获取目的地关联关系230,在此的目的地关联关系230可以是基于机器学习技术获得的网络模型,该网络模型可以描述参考存储设备集合中的参考备份任务与参考备份任务的参考备份目的地之间的关联关系,参考备份目的地包括参考存储系统中的一组存储设备。
根据本公开的示例性实现方式,参考存储设备集合可以是当前的存储系统中的存储设备集合。例如,可以基于当前存储系统的运行历史数据来获得目的地关联关系230。假设存储设备集合包括1000个存储设备,并且在存储系统的运行期间已经执行了500个备份任务。此时,可以利用执行500个历史备份任务相关的特征向量和历史备份目的地来生成训练样本,以便获得备份目的地与备份环境之间的关联关系。
具体地,可以基于上文描述的方式,针对每个历史备份任务生成如图4C所示的特征向量440,可以获取每个历史备份任务的历史备份目的地。将会理解,在此并不限制以何种方式来获取历史备份目的地。根据本公开的示例性实现方式,可以基于存储系统的管理员的手工操作来选择历史备份目的地。又例如,可以基于各个存储设备的使用均衡度,来选择历史备份目的地。
进一步,可以基于特征向量440和历史备份目的地来获得该目的地关联关系230。根据本公开的示例性实现方式,可以基于目前已知的和/或将在未来开发的多种技术执行训练操作。根据本公开的示例性实现方式,可以基于卷积神经网络来获得目的地关联关系230。
根据本公开的示例性实现方式,可以确定参考存储设备集合中的一组参考备份任务的参考备份信息。根据上文图4C所示出的格式,可以基于一组参考备份任务的参考备份信息和各个参考存储设备的参考设备信息生成一组训练样本。进一步,可以确定参考存储设备集合中的各个参考存储设备的参考设备信息,并且基于一组训练样本和一组参考备份任务的参考备份目的地,获得目的地关联关系230。
图5示意性示出了根据本公开的示例性实现方式的基于特征向量来获取目的地关联关系230的框图500。如图5所示,可以针对一个历史备份任务来生成一个训练样本510,该训练样本510可以包括参考特征向量512和参考备份目的地514。具体地,可以基于上文描述的方法来接收关于每个存储设备的设备信息以及关于历史备份任务的备份信息,以便生成参考特征向量512。进一步,可以获取历史备份任务的备份目的地,以便作为参考备份目的地514。可以针对每个历史备份任务执行类似的操作,以便获得与每个历史备份任务相对应的训练样本。利用本公开的示例性实现方式,基于过去的历史操作,可以获得丰富的训练样本。此时的训练样本将包括选择备份目的地的成功经验,进而有助于为未来的备份操作选择适合的备份目的地。
根据本公开的示例性实现方式,利用各个训练样本,可以以迭代的方式来获得目的地关联关系230。例如,可以基于卷积神经网络520来实现该目的地关联关系230。在训练阶段完成之后,当将参考特征向量512输入至经训练的目的地关联关系230时,输出的备份目的地530与训练样本510中的参考备份目的地514相一致。
根据本公开的示例性实现方式,可以利用训练集中的训练样本来获得目的地关联关系230。可以利用测试集中的测试样本来测试目的地关联关系230是否可以获得正确的输出结果。进一步,可以调整目的地关联关系230,以便使得该关联关系可以更加匹配于测试集。
上文已经描述了基于存储系统自身的历史数据来训练目的地关联关系230的过程。根据本公开的示例性实现方式,还可以基于不同的存储系统的历史数据来获得目的地关联关系230。假设存在两个完全相同的存储系统,可以使用一个存储系统的历史数据来获得目的地关联关系230。进一步,可以将获得的目的地关联关系230分别用于在两个不同的存储系统中选择备份目的地。
根据本公开的示例性实现方式,用于提供训练样本的参考存储系统不必与当前存储系统完全相同,而是该参考存储系统可以与当前存储系统相类似。例如,参考存储系统所包括的参考存储设备集合可以与当前存储设备集合具有相似的存储设备数量。可以设置两个存储设备集合的存储设备数量的比例应当满足阈值范围,例如,该阈值范围可以表示为[1-△,1+△],其中△可以被设置为0.005和/或其他数值。△的数值越小,则两个存储设备集合中的存储设备数量越相似,此时基于参考存储系统的历史数据获得的目的地关联关系230越适合于当前的存储系统。
将会理解,备份目的地的选择在很大程度上依赖于存储系统的存储设备的配置,因而,参考存储系统和当前存储系统应当具有相同或相似的设备配置。例如,可以指定参考存储系统中的参考存储设备的容量应当与当前存储系统的存储设备的容量类似,可以指定参考存储设备的硬盘类型与存储设备的硬盘类型相同,等等。以此方式,可以确保用作训练基础的参考存储系统中的参考存储设备的各方面配置都与当前存储系统相近似,进而使得目的地关联关系230可以更加适合于当前存储系统。
将会理解,尽管利用来自参考存储系统的目的地关联关系230可能会导致出现在某些情况下准确性较低的情况。然而,在绝大多数情况下,该目的地关联关系230可以输出较为优选的备份目的地。利用本公开的示例性实现方式,不必针对每个存储系统训练各自的目的地关联关系230,因而可以大大提高目的地关联关系230的重用性,并且降低训练阶段的时间和计算资源的开销。
将会理解,备份目的地所包括的存储设备的数量依赖于备份任务指定的副本数量。根据本公开的示例性实现方式,用作训练样本的参考备份任务和当前存储系统的备份任务应当指定相同的副本数量。假设当前存储系统的备份任务指定需要3个副本,则可以选择指定3个副本的历史备份任务来生成训练样本。
根据本公开的示例性实现方式,用作训练样本的参考备份任务的备份副本的数量可以大于当前存储系统的备份任务的副本数量。假设当前存储系统的备份任务指定需要3个副本,假设在过去并未执行过指定3个副本的备份任务,则可以选择指定4个副本的历史备份任务来生成训练样本。此时生成的备份目的地将会涉及4个存储设备,可以从4个存储设备中选择3个存储设备来用作备份目的地。尽管此时获得的备份目的地可能并非最优,相对于完全人工选择的方式和/或针对每种组合方式来确定备份目的地的已有技术方案而言,该技术方案可以尽量利用已有的经验来服务于未来的备份任务。
上文已经描述了获取某个时间点的设备信息210和备份信息220,并且生成特征向量440的示例。根据本公开的示例性实现方式,可以接收在某个预定时间段内的设备信息210和备份信息220。此时,获得的设备信息210和备份信息220都以时间序列数据来表示。
图6A示意性示出了根据本公开的示例性实现方式的有关可用存储空间的变化的框图600A。在图6A中,横坐标表示时间而纵坐标表示可用存储空间。可以指定获取1小时(或者其他时间长度)内的可用存储空间的变化。此时,可用存储空间可以如曲线610A所示的时间序列来表示。图6B示意性示出了根据本公开的示例性实现方式的有关网络带宽的变化的框图600B。在图6B中,横坐标表示时间而纵坐标表示网络带宽。可以指定获取1小时(或者其他时间长度)内的网络带宽的变化。此时,网络带宽可以如曲线610B所示的时间序列来表示。
类似地,可以基于在预定时间段内的备份任务来生成相应的备份信息220。此时,特征向量440中的设备信息和备份信息都将以时间序列的形式来表示。根据本公开的示例性实现方式,为了以更为准确的方式来分析有关时间序列数据的关联关系,可以在目的地关联关系230中引入长短期记忆网络。在下文中,将参见图7描述更多细节,该图7示意性示出了根据本公开的示例性实现方式的基于特征向量来获取目的地关联关系的框图700。
如图7所示,可以基于卷积神经网络520和长短期记忆网络710来构建目的地关联关系230。此时,基于卷积神经网络520的网络模型可以将特征向量512(包括参考备份信息和参考设备信息)映射至内部特征向量。在此的内部特征向量可以是不具有物理含义的高维特征向量。接着,基于长短期记忆网络710的网络模型可以将内部特征向量映射至备份目的地530。
将会理解,尽管此时存在卷积神经网络520和长短期记忆网络710,对于外部用户而言,无需知晓有关目的地关联关系230的内部细节,而是可以将目的地关联关系230作为一个黑盒进行训练。也即,无需独立地训练卷积神经网络520和长短期记忆网络710,而是仅需要利用训练样本510,来使得目的地关联关系230可以接收特征向量,并且输出备份目的地530。
上文已经描述有关训练过程的细节,在已经获得目的地关联关系230之后,可以向该目的地关联关系230输入利用当前存储系统的设备信息和备份信息所建立的特征向量,以便获得相对应的备份目的地。此时,由目的地关联关系230输出的备份目的地表示可以用作备份目的地的一组存储设备。具体地,当使用如图7所示的目的地关联关系230时,卷积神经网络520可以将包括备份信息和设备信息的特征向量映射至高维的内部特征向量。继而,长短期记忆网络710可以将高维的内部特征向量映射至备份目的地。利用本公开的示例性实现方式,卷积神经网络520可以有效地提取存储系统的多方面的特征,并且长短期记忆网络710可以充分挖掘时序数据中的内在联系。以此方式,可以使得目的地关联关系230具有更高的准确性。
根据本公开的示例性实现方式,可以基于目的地关联关系230输出多个候选备份目的地。进一步,可以基于多个指标来验证备份目的地,并且基于预定性能要求来过滤多个候选备份目的地。例如,可以基于存储设备之间的距离来设置预定性能要求。具体地,预定性能要求可以包括:候选备份目的地中的任意两个存储设备之间的距离大于阈值距离(例如,300公里)。假设候选备份目的地包括3个存储设备,并且其中的任意两个设备之间的距离都大于阈值距离,可以将该候选备份目的地作为备份目的地。否则,可以过滤掉该候选备份目的地,并且从多个候选备份目的地中选择其他适合的候选备份目的地。
将会理解,阈值距离可以确保每个候选备份目的地中的存储设备都具有不同的物理环境,因此降低不同存储设备遭受同时故障(例如,停电、洪水、机械撞击等)的可能性。将理解,这里列举的阈值距离的具体数值仅为示例性的,无意以任何方式限制本公开的范围。在其他实现方式中,阈值距离可以根据具体的技术环境和性能要求被设置为任何值。
根据本公开的示例性实现方式,可以指定候选备份目的地所包括的一组存储设备中的任意存储设备的可用资源量应当大于阈值资源量。具体地,可以基于存储设备中的可用资源来设置预定性能要求。预定性能要求可以包括:候选备份目的地中的任意存储设备的可用资源量大于阈值资源量。以此方式,确保任何候选备份目的地均可以完成数据备份。例如,这里的可用资源量可以包括存储设备的计算资源量、存储器资源量、存储容量、网络带宽,等等。根据本公开的示例性实现方式,阈值资源量可以基于备份任务所需要的资源量来设置。在其他实现方式中,阈值资源量也可以是根据具体的技术环境和性能要求预先确定的。
根据本公开的示例性实现方式,可以指定与候选备份目的地相关联的全局均衡度应当高于阈值均衡度。在此,全局均衡度指示在候选备份目的地中的存储设备被用于备份任务的情况下存储设备集合的使用均衡度。将会理解,“使用均衡度”可以是指对于多个存储设备在任何方面的“使用”的均衡程度。例如,“使用均衡度”可以是指对于多个存储设备的可用存储容量的“使用均衡度”,对于多个存储设备的输入网络带宽的“使用均衡度”,对于多个存储设备的处理资源的“使用均衡度”,对于多个存储设备的存储器资源的“使用均衡度”,等等。
可以分别确定各个候选备份目的地的全局均衡度,继而基于全局均衡度来确定最终的备份目的地。根据本公开的示例性实现方式,可以基于多种方式来确定全局均衡度。例如,可以基于候选备份目的地中的各个存储设备的使用度量以及向候选备份目的地中的各个存储设备的传输备份数据所需的时间,来确定候选备份目的地的全局均衡度。
根据本公开的示例性实现方式,期望多个存储设备的使用率均匀地增长,而并不希望某个存储设备过早被用尽。因而,可以利用使用度量来衡量存储设备被用尽的时间。例如,可以基于存储设备中的剩余存储容量、待备份的源数据的大小、以及源数据每天的增长速度来确定存储设备何时被用尽。例如,可以基于如下公式1和公式2来确定第i个存储设备被用尽的时间:
Figure BDA0002684768170000141
其中VEi表示第i个存储设备每天的数据增长量,i为正整数并且i≤存储设备的数量N,n表示带备份的源数据的数量,SDSs表示第S个源数据,DDIi表示第i个存储设备每天的数据增长(例如,以百分比表示),并且DR表示数据重复率。
Figure BDA0002684768170000142
其中ETFRi表示第i个存储设备的预测的用尽时间,其中VEi表示第i个存储设备每天的数据增长量,以及RCi表示在第i个存储设备上的可用存储空间。
进一步,可用基于如下公式3来确定各个存储设备的有关用尽时间的标准差:
Figure BDA0002684768170000143
其中σ1表示有关用尽时间的标准差,N表示存储设备的数量,ETFRi表示第i个存储设备的预测的用尽时间,
Figure BDA0002684768170000144
表示各个存储设备的用尽时间的均值。将会理解,上文的公式1至3仅仅是用于确定全局均衡度中有关用尽时间的分量的具体示例。根据本公开的示例性实现方式,可以基于其他公式来确定该分量。
在下文中,将介绍有关确定传输时间的更多信息。根据本公开的示例性实现方式,可以基于各个存储设备的带宽来确定向某个存储设备传输源数据所需要的时间。例如,可以基于如下公式4来确定向第i个存储设备传输源数据的时间。
Figure BDA0002684768170000145
其中ETCi表示向第i个存储设备传输源数据的时间,VEi表示第i个存储设备每天的数据增长量,以及NBi表示第i个存储设备的带宽。
进一步可以基于公式5来确定各个存储设备的有关传输时间的标准差:
Figure BDA0002684768170000151
其中σ2表示有关传输时间的标准差,N表示存储设备的数量,ETCi表示第i个存储设备的预测的传输时间,
Figure BDA0002684768170000152
表示各个存储设备的传输时间的均值。将会理解,上文的公式4至5仅仅是用于确定全局均衡度中有关传输时间的分量的具体示例。根据本公开的示例性实现方式,可以基于其他公式来确定该分量。
根据本公开的示例性实现方式,可以基于如下公式6来确定与每个候选备份目的地相关联的全局均衡度函数GE:
GE=σ1*v1+σ2*v2+v3 公式6
其中v1和v2分布表示自定义权重,σ1和σ2是按照上文描述的公式确定的分量,v3表示自定义的偏移值。将会理解,在此的公式6仅仅是示意性的。根据本公开的示例性实现方式,可以采用其他的公式来确定全局均衡度函数GE。例如,可以基于σ1和σ2的乘积来确定全局均衡度函数GE。
根据本公开的示例性实现方式,可以针对多个候选备份目的地来确定相应的全局均衡度函数GE。可以将多个候选备份目的地的全局均衡度进行排序,并且选择全局均衡度最优的候选备份目的地作为备份目的地。根据本公开的示例性实现方式,可以指定全局均衡度的阈值,并且可以指定从多个候选备份目的地中过滤掉高于该阈值的候选备份目的地。根据本公开的示例性实现方式,可以基于历史经验来设置该阈值。根据本公开的示例性实现方式,可以基于各个存储设备的当前状态来设置该阈值。
将会理解,在此的全局均衡度表示当选择某个候选备份目的地作为备份目的地之后,存储设备集合中的各个存储设备的使用之间的差异。全局均衡度的数值越小,则表示选取该候选备份目的地更加有助于各个存储设备的使用平衡。利用本公开的示例性实现方式,可以尽量选择有助于各个存储设备的使用平衡的候选备份目的地来作为备份目的地。
上文已经参见图2至图7描述了用于执行根据本公开的示例性实现方式的方法。根据本公开的示例性实现方式,提供了一种用于为备份任务选择备份目的地的装置。该装置包括:设备信息接收模块,配置用于接收存储设备集合中的存储设备的设备信息,备份任务在存储设备集合中被执行;备份信息接收模块,配置用于接收备份任务的备份信息;获取模块,配置用于获取目的地关联关系,目的地关联关系描述参考存储设备集合中的参考备份任务与参考备份任务的参考备份目的地之间的关联关系,参考备份目的地包括参考存储系统中的一组存储设备;以及选择模块,配置用于根据目的地关联关系,基于设备信息和备份信息,在存储设备集合中为备份任务选择备份目的地,备份目的地包括存储设备集合中的一组存储设备。根据本公开的示例性实现方式,该装置可以进一步包括用于执行上文描述的方法300的其他步骤的模块。
图8示意性示出了一种可以被用来实施本公开的示例性实现方式的设备800的框图。根据本公开的示例性实现方式,设备800可以是电子设备,示例设备800包括中央处理单元(CPU)801,其可以根据存储在只读存储设备(ROM)802中的计算机程序指令或者从存储单元808加载到随机访问存储设备(RAM)803中的计算机程序指令,来执行各种适当的动作和处理。在RAM 803中,还可存储示例设备800操作所需的各种程序和数据。CPU 801、ROM 802以及RAM 803通过总线804彼此相连。输入/输出(I/O)接口805也连接至总线804。
示例设备800中的多个部件连接至I/O接口805,包括:输入单元806,例如键盘、鼠标等;输出单元807,例如各种类型的显示器、扬声器等;存储单元808,例如磁盘、光盘等;以及通信单元809,例如网卡、调制解调器、无线通信收发机等。通信单元809允许示例设备800通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
上文所描述的各个过程和处理,例如示例方法或示例过程可由处理单元801来执行。例如,根据本公开的示例性实现方式,各种示例方法或示例过程可被实现为计算机软件程序,其被有形地包含于机器可读介质,例如存储单元808。根据本公开的示例性实现方式,计算机程序的部分或者全部可以经由ROM 802和/或通信单元809而被载入和/或安装到示例设备800上。当计算机程序被加载到RAM 803并由CPU 801执行时,可以执行上文描述的示例方法或示例过程的一个或多个步骤。
根据本公开的示例性实现方式,提供了一种电子设备,包括:至少一个处理器;以及至少一个存储器,存储有计算机程序指令,至少一个存储器和计算机程序指令被配置为,与至少一个处理器一起,使电子设备执行一种用于为备份任务选择备份目的地的动作。该动作包括:接收存储设备集合中的存储设备的设备信息,备份任务在存储设备集合中被执行;接收备份任务的备份信息;获取目的地关联关系,目的地关联关系描述参考存储设备集合中的参考备份任务与参考备份任务的参考备份目的地之间的关联关系,参考备份目的地包括参考存储系统中的一组存储设备;以及根据目的地关联关系,基于设备信息和备份信息,在存储设备集合中为备份任务选择备份目的地,备份目的地包括存储设备集合中的一组存储设备。
根据本公开的示例性实现方式,接收设备信息和备份信息进一步包括:接收预定时间段内的设备信息和备份信息。
根据本公开的示例性实现方式,设备信息包括以下中的至少任一项:存储设备的位置;存储设备的可用存储空间;存储设备的网络带宽;存储设备的CPU使用率;存储设备的存储器使用率;以及存储设备的耗尽时间。
根据本公开的示例性实现方式,备份信息包括以下中的至少任一项:备份任务指定的备份副本的数量;备份任务指定的源数据大小;以及源数据的重复率。
根据本公开的示例性实现方式,获取目的地关联关系包括:确定在参考存储设备集合中执行的各个参考备份任务的参考备份信息;确定参考存储设备集合中的各个参考存储设备的参考设备信息;以及基于参考备份信息、参考运设备信息以及参考备份任务的参考备份目的地,训练目的地关联关系。
根据本公开的示例性实现方式,目的地关联关系包括:基于卷积神经网络的第一网络模型,第一网络模型用于将参考备份信息和参考设备信息映射至内部特征向量;以及基于长短期记忆网络的第二网络模型,第二网络模型用于将内部特征向量映射至参考备份任务的参考备份目的地。
根据本公开的示例性实现方式,确定备份目的地包括:基于第一网络模型,将备份信息和设备信息映射至内部特征向量;以及基于第二网络模型,将内部特征向量映射至备份目的地。
根据本公开的示例性实现方式,确定备份目的地进一步包括:响应于备份目的地满足以下条件,验证备份目的地:备份目的地包括的一组存储设备中的任意两个存储设备之间的距离大于阈值距离;备份目的地包括的一组存储设备中的任意存储设备的可用资源量大于阈值资源量;以及与备份目的地相关联的全局均衡度高于阈值均衡度,全局均衡度指示在备份目的地中的存储设备被用于备份任务的情况下存储设备集合的使用均衡度。
根据本公开的示例性实现方式,存储设备集合与参考存储设备集合满足以下中的至少任一项:具有相同或相似的存储设备数量;以及具有相同或相似的设备型号。
根据本公开的示例性实现方式,备份任务指定的副本数量不高于参考备份任务指定的副本数量。
根据本公开的示例性实现方式,提供了一种计算机程序产品,计算机程序产品被有形地存储在非易失性计算机可读介质上并且包括机器可执行指令,机器可执行指令在被执行时使机器执行上文描述的方法。
根据本公开的示例性实现方式,提供了一种计算机可读介质,该介质包括机器可执行指令,机器可执行指令在被执行时使机器执行上文描述的方法。
如本文所使用的,术语“包括”及其类似用语应当理解为开放性包含,即“包括但不限于”。术语“基于”应当理解为“至少部分地基于”。术语“一个实现方式”或“该实现方式”应当理解为“至少一个实现方式”。术语“第一”、“第二”等等可以指代不同的或相同的对象。本文还可能包括其他明确的和隐含的定义。
如本文所使用的,术语“确定”涵盖各种各样的动作。例如,“确定”可以包括运算、计算、处理、导出、调查、查找(例如,在表格、数据库或另一数据结构中查找)、查明等。此外,“确定”可以包括接收(例如,接收信息)、访问(例如,访问存储器中的数据)等。此外,“确定”可以包括解析、选择、选取、建立等。
应当注意,本公开的实现方式可以通过硬件、软件或者软件和硬件的结合来实现。硬件部分可以利用专用逻辑来实现;软件部分可以存储在存储器中,由适当的指令执行系统,例如微处理器或者专用设计硬件来执行。本领域的技术人员可以理解上述的设备和方法可以使用计算机可执行指令和/或包含在处理器控制代码中来实现,例如在可编程的存储器或者诸如光学或电子信号载体的数据载体上提供了这样的代码。
此外,尽管在附图中以特定顺序描述了本公开的方法的操作,但是这并非要求或者暗示必须按照该特定顺序来执行这些操作,或是必须执行全部所示的操作才能实现期望的结果。相反,流程图中描绘的步骤可以改变执行顺序。附加地或备选地,可以省略某些步骤,将多个步骤组合为一个步骤执行,和/或将一个步骤分解为多个步骤执行。还应当注意,根据本公开的两个或更多装置的特征和功能可以在一个装置中具体化。反之,上文描述的一个装置的特征和功能可以进一步划分为由多个装置来具体化。
虽然已经参考若干具体实现方式描述了本公开,但是应当理解,本公开不限于所公开的具体实现方式。本公开旨在涵盖所附权利要求的精神和范围内所包括的各种修改和等效布置。

Claims (21)

1.一种用于为备份任务选择备份目的地的方法,包括:
接收存储设备集合中的存储设备的设备信息,所述备份任务在所述存储设备集合中被执行;
接收所述备份任务的备份信息;
获取目的地关联关系,所述目的地关联关系描述参考存储设备集合中的参考备份任务与所述参考备份任务的参考备份目的地之间的关联关系,所述参考备份目的地包括所述参考存储系统中的一组存储设备;以及
根据所述目的地关联关系,基于所述设备信息和所述备份信息,在存储设备集合中为所述备份任务选择备份目的地,所述备份目的地包括所述存储设备集合中的一组存储设备。
2.根据权利要求1所述的方法,其中接收所述设备信息和所述备份信息进一步包括:接收预定时间段内的所述设备信息和所述备份信息。
3.根据权利要求1所述的方法,其中所述设备信息包括以下中的至少任一项:
所述存储设备的位置;
所述存储设备的可用存储空间;
所述存储设备的网络带宽;
所述存储设备的CPU使用率;
所述存储设备的存储器使用率;以及
所述存储设备的耗尽时间。
4.根据权利要求1所述的方法,其中所述备份信息包括以下中的至少任一项:
所述备份任务指定的备份副本的数量;
所述备份任务指定的源数据大小;以及
所述源数据的重复率。
5.根据权利要求1所述的方法,其中获取所述目的地关联关系包括:
确定在所述参考存储设备集合中执行的各个参考备份任务的参考备份信息;
确定所述参考存储设备集合中的各个参考存储设备的参考设备信息;以及
基于所述参考备份信息、所述参考运设备信息以及所述参考备份任务的参考备份目的地,训练所述目的地关联关系。
6.根据权利要求5所述的方法,其中所述目的地关联关系包括:
基于卷积神经网络的第一网络模型,所述第一网络模型用于将所述参考备份信息和所述参考设备信息映射至内部特征向量;以及
基于长短期记忆网络的第二网络模型,所述第二网络模型用于将所述内部特征向量映射至所述参考备份任务的参考备份目的地。
7.根据权利要求6所述的方法,其中确定所述备份目的地包括:
基于所述第一网络模型,将所述备份信息和所述设备信息映射至内部特征向量;以及
基于所述第二网络模型,将所述内部特征向量映射至所述备份目的地。
8.根据权利要求7所述的方法,其中确定所述备份目的地进一步包括:响应于所述备份目的地满足以下条件,验证所述备份目的地:
所述备份目的地包括的所述一组存储设备中的任意两个存储设备之间的距离大于阈值距离;
所述备份目的地包括的所述一组存储设备中的任意存储设备的可用资源量大于阈值资源量;以及
与所述备份目的地相关联的全局均衡度高于阈值均衡度,所述全局均衡度指示在所述备份目的地中的存储设备被用于所述备份任务的情况下所述存储设备集合的使用均衡度。
9.根据权利要求1所述的方法,其中所述存储设备集合与所述参考存储设备集合满足以下中的至少任一项:
具有相同或相似的存储设备数量;以及
具有相同或相似的设备型号。
10.根据权利要求1所述的方法,其中所述备份任务指定的副本数量不高于所述参考备份任务指定的副本数量。
11.一种电子设备,包括:
至少一个处理器;以及
至少一个存储器,存储有计算机程序指令,所述至少一个存储器和所述计算机程序指令被配置为,与所述至少一个处理器一起,使所述电子设备执行一种用于为备份任务选择备份目的地的动作,所述动作包括:
接收存储设备集合中的存储设备的设备信息,所述备份任务在所述存储设备集合中被执行;
接收所述备份任务的备份信息;
获取目的地关联关系,所述目的地关联关系描述参考存储设备集合中的参考备份任务与所述参考备份任务的参考备份目的地之间的关联关系,所述参考备份目的地包括所述参考存储系统中的一组存储设备;以及
根据所述目的地关联关系,基于所述设备信息和所述备份信息,在存储设备集合中为所述备份任务选择备份目的地,所述备份目的地包括所述存储设备集合中的一组存储设备。
12.根据权利要求11所述的设备,其中接收所述设备信息和所述备份信息进一步包括:接收预定时间段内的所述设备信息和所述备份信息。
13.根据权利要求11所述的设备,其中所述设备信息包括以下中的至少任一项:
所述存储设备的位置;
所述存储设备的可用存储空间;
所述存储设备的网络带宽;
所述存储设备的CPU使用率;
所述存储设备的存储器使用率;以及
所述存储设备的耗尽时间。
14.根据权利要求11所述的设备,其中所述备份信息包括以下中的至少任一项:
所述备份任务指定的备份副本的数量;
所述备份任务指定的源数据大小;以及
所述源数据的重复率。
15.根据权利要求11所述的设备,其中获取所述目的地关联关系包括:
确定在所述参考存储设备集合中执行的各个参考备份任务的参考备份信息;
确定所述参考存储设备集合中的各个参考存储设备的参考设备信息;以及
基于所述参考备份信息、所述参考运设备信息以及所述参考备份任务的参考备份目的地,训练所述目的地关联关系。
16.根据权利要求15所述的设备,其中所述目的地关联关系包括:
基于卷积神经网络的第一网络模型,所述第一网络模型用于将所述参考备份信息和所述参考设备信息映射至内部特征向量;以及
基于长短期记忆网络的第二网络模型,所述第二网络模型用于将所述内部特征向量映射至所述参考备份任务的参考备份目的地。
17.根据权利要求16所述的设备,其中确定所述备份目的地包括:
基于所述第一网络模型,将所述备份信息和所述设备信息映射至内部特征向量;以及
基于所述第二网络模型,将所述内部特征向量映射至所述备份目的地。
18.根据权利要求17所述的设备,其中确定所述备份目的地进一步包括:响应于所述备份目的地满足以下条件,验证所述备份目的地:
所述备份目的地包括的所述一组存储设备中的任意两个存储设备之间的距离大于阈值距离;
所述备份目的地包括的所述一组存储设备中的任意存储设备的可用资源量大于阈值资源量;以及
与所述备份目的地相关联的全局均衡度高于阈值均衡度,所述全局均衡度指示在所述备份目的地中的存储设备被用于所述备份任务的情况下所述存储设备集合的使用均衡度。
19.根据权利要求11所述的设备,其中所述存储设备集合与所述参考存储设备集合满足以下中的至少任一项:
具有相同或相似的存储设备数量;以及
具有相同或相似的设备型号。
20.根据权利要求11所述的设备,其中所述备份任务指定的副本数量不高于所述参考备份任务指定的副本数量。
21.一种计算机程序产品,所述计算机程序产品被有形地存储在非易失性计算机可读介质上并且包括机器可执行指令,所述机器可执行指令在被执行时使机器执行根据权利要求1-10中任一项所述的方法的步骤。
CN202010972953.XA 2020-09-16 2020-09-16 选择备份目的地的方法、电子设备和计算机程序产品 Pending CN114265720A (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN202010972953.XA CN114265720A (zh) 2020-09-16 2020-09-16 选择备份目的地的方法、电子设备和计算机程序产品
US17/072,702 US11275655B1 (en) 2020-09-16 2020-10-16 Method, electronic device, and computer program product for selecting backup destination

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010972953.XA CN114265720A (zh) 2020-09-16 2020-09-16 选择备份目的地的方法、电子设备和计算机程序产品

Publications (1)

Publication Number Publication Date
CN114265720A true CN114265720A (zh) 2022-04-01

Family

ID=80627810

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010972953.XA Pending CN114265720A (zh) 2020-09-16 2020-09-16 选择备份目的地的方法、电子设备和计算机程序产品

Country Status (2)

Country Link
US (1) US11275655B1 (zh)
CN (1) CN114265720A (zh)

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016199232A1 (ja) * 2015-06-10 2016-12-15 株式会社日立製作所 ストレージ管理計算機、及びストレージ装置の管理方法
EP3188019B1 (en) * 2015-12-30 2019-09-18 InterDigital CE Patent Holdings Method for selecting a content comprising audiovisual data and corresponding electronic device, system, computer readable program product and computer readable storage medium
US10606709B1 (en) * 2018-10-26 2020-03-31 EMC IP Holding Company LLC Method and system for intelligently load balancing database backup operations in information technology environments

Also Published As

Publication number Publication date
US11275655B1 (en) 2022-03-15
US20220083431A1 (en) 2022-03-17

Similar Documents

Publication Publication Date Title
CN108833458B (zh) 一种应用推荐方法、装置、介质及设备
CN106919957B (zh) 处理数据的方法及装置
EP3557418B1 (en) Resource management of resource-controlled system
US10379999B2 (en) Duplicate bug report detection using machine learning algorithms and automated feedback incorporation
JP5023899B2 (ja) ストリームデータ制御システム、ストリームデータ制御方法およびストリームデータ制御用プログラム
US11651271B1 (en) Artificial intelligence system incorporating automatic model updates based on change point detection using likelihood ratios
CN111507479B (zh) 特征分箱方法、装置、设备及计算机可读存储介质
CN110414569A (zh) 聚类实现方法及装置
US20220043581A1 (en) Optimized selection of subset of storage devices for data backup
CN111090401B (zh) 存储设备性能预测方法及装置
CN116707859A (zh) 特征规则提取方法和装置、网络入侵检测方法和装置
CN104301170B (zh) 基于特征分类的移动终端应用友好性评判方法
CN113296992A (zh) 异常原因确定方法、装置、设备和存储介质
CN113204642A (zh) 文本聚类方法、装置、存储介质和电子设备
CN117540822A (zh) 跨移动边缘网络的联邦类增量学习方法、设备和存储介质
CN114265720A (zh) 选择备份目的地的方法、电子设备和计算机程序产品
CN116225636A (zh) 任务处理模型的生成方法、装置、设备及存储介质
CN113850346B (zh) Mec环境下多维属性感知的边缘服务二次聚类方法及系统
CN111783883A (zh) 一种异常数据的检测方法及装置
CN111291092A (zh) 一种数据处理方法、装置、服务器及存储介质
CN110134575B (zh) 一种服务器集群的服务能力计算方法及装置
CN115203556A (zh) 一种评分预测模型训练方法、装置、电子设备及存储介质
CN108280224A (zh) 万级维度数据生成方法、装置、设备以及存储介质
CN113191674A (zh) 一种安全风险评估方法、装置、存储介质及电子设备
US10983837B2 (en) Method and apparatus for load estimation

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination