CN112685222A - 管理备份数据的方法、设备和计算机程序产品 - Google Patents

管理备份数据的方法、设备和计算机程序产品 Download PDF

Info

Publication number
CN112685222A
CN112685222A CN201910990225.9A CN201910990225A CN112685222A CN 112685222 A CN112685222 A CN 112685222A CN 201910990225 A CN201910990225 A CN 201910990225A CN 112685222 A CN112685222 A CN 112685222A
Authority
CN
China
Prior art keywords
target data
time period
time
backup storage
determining
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910990225.9A
Other languages
English (en)
Inventor
王毅
郑庆霄
李海涛
李科
赵靖荣
彭赓
李鹏飞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
EMC Corp
Original Assignee
EMC IP Holding Co LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by EMC IP Holding Co LLC filed Critical EMC IP Holding Co LLC
Priority to CN201910990225.9A priority Critical patent/CN112685222A/zh
Priority to US16/799,581 priority patent/US11983142B2/en
Publication of CN112685222A publication Critical patent/CN112685222A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/11File system administration, e.g. details of archiving or snapshots
    • G06F16/113Details of archiving
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1446Point-in-time backing up or restoration of persistent data
    • G06F11/1448Management of the data involved in backup or backup restore
    • G06F11/1451Management of the data involved in backup or backup restore by selection of backup contents
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1446Point-in-time backing up or restoration of persistent data
    • G06F11/1458Management of the backup or restore process
    • G06F11/1461Backup scheduling policy
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1446Point-in-time backing up or restoration of persistent data
    • G06F11/1458Management of the backup or restore process
    • G06F11/1464Management of the backup or restore process for networked environments
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1446Point-in-time backing up or restoration of persistent data
    • G06F11/1458Management of the backup or restore process
    • G06F11/1469Backup restoration techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/3034Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system component is a storage system, e.g. DASD based or network based
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3065Monitoring arrangements determined by the means or processing involved in reporting the monitored data
    • G06F11/3072Monitoring arrangements determined by the means or processing involved in reporting the monitored data where the reporting involves data filtering, e.g. pattern matching, time or event triggered, adaptive or policy-based reporting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3065Monitoring arrangements determined by the means or processing involved in reporting the monitored data
    • G06F11/3072Monitoring arrangements determined by the means or processing involved in reporting the monitored data where the reporting involves data filtering, e.g. pattern matching, time or event triggered, adaptive or policy-based reporting
    • G06F11/3075Monitoring arrangements determined by the means or processing involved in reporting the monitored data where the reporting involves data filtering, e.g. pattern matching, time or event triggered, adaptive or policy-based reporting the data filtering being achieved in order to maintain consistency among the monitored data, e.g. ensuring that the monitored data belong to the same timeframe, to the same system or component
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/14Details of searching files based on file metadata
    • G06F16/148File search processing
    • G06F16/152File search processing using file content signatures, e.g. hash values
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning

Abstract

本公开的实施例涉及管理备份数据的方法、设备和计算机程序产品。该方法包括:获取在第一时间段内针对备份存储装置中的目标数据的多个历史操作的历史信息,历史信息至少指示多个历史操作的类型和发生时间;基于历史信息确定目标数据在第一时间段之后的第二时间段内是否将被重新写入到备份存储装置;以及响应于确定目标数据在第二时间段内将被写入到备份存储装置,调整目标数据在备份存储装置中的过期时间。由此,可以提高备份系统的效率。

Description

管理备份数据的方法、设备和计算机程序产品
技术领域
本公开的实施例涉及计算机领域,并且更具体地,涉及管理备份数据的方法、设备和计算机程序产品。
背景技术
近年来,随着计算机技术的发展,人们越来越关注数据存储的安全性。数据备份也逐渐成为保证数据安全性的一项常用技术。随着用户需要备份的数据的规模变得越来越大,越来越多的数据需要被写入到有限的备份系统的备份存储装置中。因此,如何提高备份系统的效率已经成为当前的一个关注焦点。
发明内容
本公开的实施例提供一种用于管理备份数据的方案。
根据本公开的第一方面,提出了一种管理备份数据的方法。该方法包括:获取在第一时间段内针对备份存储装置中的目标数据的多个历史操作的历史信息,历史信息至少指示多个历史操作的类型和发生时间;基于历史信息确定目标数据在第一时间段之后的第二时间段内是否将被重新写入到备份存储装置;以及响应于确定目标数据在第二时间段内将被写入到备份存储装置,调整目标数据在备份存储装置中的过期时间。
根据本公开的第二方面,提出了一种用于管理备份数据的设备。该设备包括:至少一个处理单元;至少一个存储器,该至少一个存储器被耦合到该至少一个处理单元并且存储用于由该至少一个处理单元执行的指令,该指令当由该至少一个处理单元执行时,使得该设备执行动作,该动作包括:获取在第一时间段内针对备份存储装置中的目标数据的多个历史操作的历史信息,历史信息至少指示多个历史操作的类型和发生时间;基于历史信息确定目标数据在第一时间段之后的第二时间段内是否将被重新写入到备份存储装置;以及响应于确定目标数据在第二时间段内将被写入到备份存储装置,调整目标数据在备份存储装置中的过期时间。
在本公开的第三方面,提供了一种计算机程序产品。该计算机程序产品被存储在非瞬态计算机存储介质中并且包括机器可执行指令,该机器可执行指令在设备中运行时使该设备执行根据本公开的第一方面所描述的方法的任意步骤。
提供发明内容部分是为了以简化的形式来介绍对概念的选择,它们在下文的具体实施方式中将被进一步描述。发明内容部分无意标识本公开的关键特征或必要特征,也无意限制本公开的范围。
附图说明
通过结合附图对本公开示例性实施例进行更详细的描述,本公开的上述以及其它目的、特征和优势将变得更加明显,其中,在本公开示例性实施例中,相同的参考标号通常代表相同部件。
图1示出了本公开的多个实施例能够在其中实现的示例环境的示意图;
图2图示了根据本公开实施例的管理备份数据的过程的流程图;
图3图示了根据本公开实施例的示例历史信息列表的示意图;
图4图示了根据本公开实施例的历史写入列表的示意图;
图5图示了根据本公开实施例的调整过期时间的过程的流程图;以及
图6图示了可以用来实施本公开内容的实施例的示例设备的示意性框图。
具体实施方式
下面将参照附图更详细地描述本公开的优选实施例。虽然附图中显示了本公开的优选实施例,然而应该理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了使本公开更加透彻和完整,并且能够将本公开的范围完整地传达给本领域的技术人员。
在本文中使用的术语“包括”及其变形表示开放性包括,即“包括但不限于”。除非特别申明,术语“或”表示“和/或”。术语“基于”表示“至少部分地基于”。术语“一个示例实施例”和“一个实施例”表示“至少一个示例实施例”。术语“另一实施例”表示“至少一个另外的实施例”。术语“第一”、“第二”等等可以指代不同的或相同的对象。下文还可能包括其他明确的和隐含的定义。
图1示出了本公开实施例可以在其中被实施的环境100的示意图。如图1所示,环境100包括计算设备120和备份存储装置130,计算设备120可以接收待备份的数据110,并在对数据110进行预处理后将数据110写入到备份存储装置130中。具体地,计算设备120可以对数据110按照预定的大小进行分块,这样的大小例如可以根据不同的备份系统的需求而被相应地配置。
随后,计算设备120还例如可以根据每个数据块中数据的散列值以确定该数据块中的数据是否已经被存储在备份存储装置130中。如果数据块中的数据已经被存储在备份存储装置130中,则计算设备120可以避免重复写入该数据块。相反,计算设备120可以写入该数据块,并记录该数据块的散列值以用于下次备份的去冗余操作。
在一些实施例中,考虑到备份存储装置130的大小有限,备份系统可以针对备份存储装置130中所存储的数据块140设置过期时间(例如,一个月)。应当理解,过期时间可以根据备份存储装置130的规模和用户对备份的需求而相应地设置。在数据块140的过期时间到期时,也即在数据块140上次被备份的时间已经达到过期时间时,备份系统例如可以从备份存储装置130中删除已经过期的数据块140。
如上文所讨论的,随着用户需要备份的数据的规模变得越来越大,越来越多的数据需要被写入到备份系统有限的备份存储装置130中。备份系统中先前备份的一些数据需要被替换为新的备份数据,然而某些备份数据在因为过期而被删除之后,还可能在短时间内还将被重复写入到备份存储装置130中。由此,这样重复的删除和写入将影响备份系统的效率。
根据本公开的实施例,提供了一种管理备份数据的方案。在该方案中,获取在第一时间段内针对备份存储装置中的目标数据的多个历史操作的历史信息,历史信息至少指示多个历史操作的类型和发生时间;基于历史信息确定目标数据在第一时间段之后的第二时间段内是否将被重新写入到备份存储装置;以及响应于确定目标数据在第二时间段内将被写入到备份存储装置,调整目标数据在备份存储装置中的过期时间。本公开的实施例能够为不同的目标数据设置不同的过期时间,为具有较大可能性被重复写入的数据设置较长的过期时间。基于这样的方式,在后续再次备份该数据时,因为该数据具有较长的过期时间而处于未过期状态,本公开的实施例可以省去将该数据再次写入到备份存储装置的开销,进而提高备份系统的效率。
下文将参考图2至图5来描述根据本公开实施例的管理备份数据的过程。图2示出了根据本公开的一些实施例的管理备份数据的过程200的流程图。过程200例如可以由图1中所示的计算设备120来实现。
在框202,计算设备120获取在第一时间段内针对备份存储装置中130的目标数据的多个历史操作的历史信息,其中历史信息至少指示多个历史操作的类型和发生时间。
在一些实施例中,计算设备120可以在预定的第一时间段内监控对目标数据的各种操作。具体地,响应于在第一时间段内的针对目标数据的历史操作,计算设备120确定目标数据的散列值。历史操作可以包括:基于备份目标数据的请求的写入操作,以及基于目标数据到期而进行垃圾回收的删除操作。
在一些实施例中,计算设备120可以确定目标数据的散列值,并将历史操作的类型和发生时间与散列值相关联地存储。在一些实施例中,计算设备120例如可以基于历史信息列表来维护关于目标数据的历史操作的信息。
图3示出了根据本公开实施例的示例历史信息列表300的示意图。如图3所示,历史信息列表300可以包括目标数据的散列值310,以及在后续每次针对目标数据的操作的类型320-1、320-2和330-N(单独或统称为操作类型320)以及操作发生的时间330-1、330-2和330-N(单独或统称为发生时间330)。在每次新的操作发生时,计算设备120例如可以在历史信息列表300尾部添加新的条目以记录该次操作对应的类型和发生时间。在一些实施例中,计算设备120可以在与其耦合的存储设备中存储与备份存储装置130中的每个数据块140所对应的历史信息列表。
继续参考图2,在框204,计算设备120基于历史信息确定目标数据在第一时间段之后的第二时间段内是否将被重新写入到备份存储装置130。在一些实施例中,计算设备120可以基于历史信息所反映的删除和写入规律来确定目标数据在后续的第二时间段是否将被再次写入备份存储装置中。在一些实施例中,第二时间段的长度可以根据备份系统的需要而被相应地设置,以实现避免重复写入与备份系统的可用备份空间的平衡。
在一些实施例中,计算设备120可以基于历史信息确定针对目标数据的度量。度量的示例可以包括:
·目标数据在第一时间段内被写入的次数。计算设备120可以对历史信息列表300进行统计,以确定目标数据在第一时间内被写入的总次数。总次数越高,则表示目标数据经常发生重新写入。该度量可以指示目标数据在第一时间段内被重写的总体情况。
·在第一时间段内写入目标数据的时间间隔。在一些实施例中,计算设备120可以确定历史信息列表300相邻写入操作的发生时间之间的时间间隔的方差。方差越小,则表示目标数据以较为固定的频率被重新写入。该度量可以指示目标数据在第一时间段内被重写的均衡程度。
·目标数据在第一时间段中的特定时间段内被写入的频率。在一些实施例中,计算设备120可以选择最近的较短时间内目标数据被写入的频率。该度量可以指示目标数据被重写的趋势,例如是越来越频繁或者越来越少。
·在第一时间段内删除目标数据的时间间隔。在一些实施例中,计算设备120可以确定历史信息列表300相邻删除操作的发生时间之间的平均时间间隔。该度量可以指示目标数据被保留的时长,以及因为过期时间到期或者用户手动删除而从备份存储设备130被移除的频率。
计算设备120可以利用以上示例度量中的一项或多项来进行目标数据在第二时间段内是否将被重新写入到备份存储装置130中的预测。应当理解,还可以利用其它任何适当的度量来进行预测。在一些实施例中,计算设备120可以基于所确定的度量确定目标数据在第二时间段内是否将被重新写入到备份存储装置130。在一些实施例中,计算设备120例如可以基于规则的方法来确定目标数据在第二时间段内是否将被重新写入。在一些实施例中,计算设备120还可以利用机器学习的方法来预测目标数据在第二时间段内是否将被重新写入。
具体地,在一些实施例中,计算设备120可以利用机器学习模型处理度量以确定目标数据在第二时间段内是否将被写入到备份存储装置。其中该机器学习模型至少基于以下至少一项而被训练:基于在第三时间段内针对参考数据的多次历史操作而确定的参考度量,以及关于参考数据在第三时间段之后的第四时间段内是否被写入到备份存储装置的指示。机器学习模型的示例包括但不限于各类深度神经网络(DNN)、卷积神经网络(CNN)、支持向量机(SVM)、决策树、随机森林模型等等。
在一些实施例中,计算设备120可以将备份存储装置130中的目数据的历史操作信息划分为用于输入特定部分和作为训练真值的部分。例如,计算设备120可以从部分存储装置130中的目标数据的18个月前到6个月前之间的历史操作数据确定的度量作为到机器学习模型的输入特征。计算设备120还可以基于过去6个月中的历史操作数据确定目标数据是否在过去6个月中被重新写入,并将该确定作为该模型的训练目标。也即,通过这样的训练,机器学习模型能够从1年的参数中学习到预测后续6个月中是否将发生数据重写。
在一些实施例中,计算设备120还可以实时监控针对备份存储系统130中的每个数据块140在后续的第四时间段是否被重新写入。例如,计算设备120可以将从过去一年的历史信息确定的度量作为机器学习模型的输入特征,并以接下来一年中对数据是否被重新写入的监控结果作为训练的目标。基于这样的方式,计算设备120也可以训练机器学习模型以使得其具有预测后续的第四时间段中是否将发生数据重写的能力。
在一些实施例中,在获取经训练的机器学习模型后,计算设备120可以将针对目标数据的度量作为特征输入到该机器学习模型中,以获得该目标数据在第二时间段内是否将被重新写入的指示。
继续参考图2,响应于在框204确定目标数据在第二时间段内将被写入到备份存储装置130,则方法进行到框206,即计算设备120调整目标数据在备份存储装置130中的过期时间。在一些实施例中,计算设备120例如可以为目标数据设置一个比默认的过期时间更长的过期时间,从而使得目标数据在发生下次重写前仍未过期。
在一些实施例中,计算设备120还可以根据历史信息来确定针对目标数据的过期时间。具体地,计算设备120可以基于历史信息确定在第一时间段内目标数据的多次写入操作之间的一组时间间隔。
图4图示了根据本公开实施例的历史写入列表400的示意图。如图4所示,计算设备120可以基于历史信息列表300提取与写入操作对应的历史写入列表400。历史写入列表400可以包括散列值300以及后续发生多次写入操作410-1、410-2、410-3、410-(M-1)和410-M(单独或统称为写入操作410)以及对应的发生时间420-1、420-2、420-3、420-(M-1)和420-M。
如图4所示,写入1发生时间420-1与写入2发生时间420-2之间的间隔可以被表示为D1,写入2发生时间420-2与写入3发生时间420-3之间的间隔可以被表示为D2,写入M-1发生时间420-(M-1)与写入M发生时间420-M之间的间隔可以被表示为DM-1
在一些实施例中,计算设备120可以基于一组时间间隔确定目标数据的过期时间。在一个示例中,计算设备120可以从该组时间间隔中选择间隔时间最大的时间间隔作为过期时间。在另一示例中,计算设备120例如还可以选择该时间间隔的平均值作为过期时间。
备选地,计算设备120还可以对该组时间间隔进行过滤以排除波动过大的时间间隔。具体地,在一些实施例中,基于一组时间间隔中的两个相邻时间间隔之间的变化程度,计算设备120可以从一组时间间隔中确定至少一个时间间隔。
以图4作为示例,计算设备120可以计算相邻两个时间间隔的时间差值,例如,ΔTm=|Dm+1-Dm|。计算设备120进一步可以确定时间差值的平均值,并过滤掉时间差值大于特定阈值(例如,时间差值的平均值)的时间间隔对,从而从该组时间间隔中确定至少一个时间间隔。基于这样的方式,可以避免某些剔除在第一时间段内因为某些突发情况的写入而带来的影响,从而使得所确定的过期时间更能够符合该目标数据的一般规律。
在一些实施例中,计算设备120还可以基于至少一个时间间隔,确定目标数据在备份存储装置中的过期时间。例如,计算设备120可以计算经过滤所得到的至少一个时间间隔的均值,并将该均值作为该目标数据的过期时间。基于这样的方式所设置的过期时间,可以使得该目标数据能够减少因过期被删除后短期内被重新写入的可能性。
在一些实施例中,上文所讨论的目标数据可以包括仍在备份存储装置130中被存储的数据,与可以包括因为过期而从备份存储装置130中被删除的历史备份数据。本公开的实施例可以针对两种不同的目标数据执行的不同处理。以下将参考图5来描述框206的具体过程。图5示出了根据本公开实施例的调整过期时间段的过程的流程图。
如图5所示,在框502,计算设备120可以确定目标数据在备份存储装置130中是否已被删除。响应于在框502确定目标数据仍未被删除,则方法可以直接进行到框506,其中计算设备120可以基于上文所述的确定过期时间的方法来修改目标数据在备份存储装置130中的过期时间。
相反,响应于在框502确定目标数据在备份存储装置130中已被删除,则方法可以进行到框504,其中计算设备120可以基于针对写入目标数据的请求而向备份存储装置130重新写入目标数据。随后,在框506,计算设备120还可以在重新写入时修改目标数据在备份存储装置130中的过期时间,从而使得被重新写入的目标数据具有比默认的过期时间更长的过期时间。
当备份存储装置130的默认过期时间到期时,计算设备120并不会回收经上文所述方法调整了过期时间的目标数据,这是因为它们被设置了更长的过期时间。基于这样的方式,在后续再次备份目标数据时,因为目标数据具有更长的过期时间而仍处于未过期的状态,本公开的实施例可以省去再次写入到备份存储装置的开销,进而提高备份系统的效率。
图6示出了可以用来实施本公开内容的实施例的示例设备600的示意性框图。例如,根据本公开实施例的计算设备120可以由设备600来实施。如图所示,设备600包括中央处理单元(CPU)601,其可以根据存储在只读存储器(ROM)602中的计算机程序指令或者从存储单元608加载到随机访问存储器(RAM)603中的计算机程序指令,来执行各种适当的动作和处理。在RAM 603中,还可存储设备600操作所需的各种程序和数据。CPU 601、ROM 602以及RAM 603通过总线604彼此相连。输入/输出(I/O)接口605也连接至总线604。
设备600中的多个部件连接至I/O接口605,包括:输入单元606,例如键盘、鼠标等;输出单元607,例如各种类型的显示器、扬声器等;存储单元608,例如磁盘、光盘等;以及通信单元609,例如网卡、调制解调器、无线通信收发机等。通信单元609允许设备600通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
上文所描述的各个过程和处理,例如方法200,可由处理单元601执行。例如,在一些实施例中,方法200可被实现为计算机软件程序,其被有形地包含于机器可读介质,例如存储单元608。在一些实施例中,计算机程序的部分或者全部可以经由ROM 602和/或通信单元609而被载入和/或安装到设备600上。当计算机程序被加载到RAM 603并由CPU 601执行时,可以执行上文描述的方法200的一个或多个动作。
本公开可以是方法、装置、系统和/或计算机程序产品。计算机程序产品可以包括计算机可读存储介质,其上载有用于执行本公开的各个方面的计算机可读程序指令。
计算机可读存储介质可以是可以保持和存储由指令执行设备使用的指令的有形设备。计算机可读存储介质例如可以是――但不限于――电存储设备、磁存储设备、光存储设备、电磁存储设备、半导体存储设备或者上述的任意合适的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、静态随机存取存储器(SRAM)、便携式压缩盘只读存储器(CD-ROM)、数字多功能盘(DVD)、记忆棒、软盘、机械编码设备、例如其上存储有指令的打孔卡或凹槽内凸起结构、以及上述的任意合适的组合。这里所使用的计算机可读存储介质不被解释为瞬时信号本身,诸如无线电波或者其他自由传播的电磁波、通过波导或其他传输媒介传播的电磁波(例如,通过光纤电缆的光脉冲)、或者通过电线传输的电信号。
这里所描述的计算机可读程序指令可以从计算机可读存储介质下载到各个计算/处理设备,或者通过网络、例如因特网、局域网、广域网和/或无线网下载到外部计算机或外部存储设备。网络可以包括铜传输电缆、光纤传输、无线传输、路由器、防火墙、交换机、网关计算机和/或边缘服务器。每个计算/处理设备中的网络适配卡或者网络接口从网络接收计算机可读程序指令,并转发该计算机可读程序指令,以供存储在各个计算/处理设备中的计算机可读存储介质中。
用于执行本公开操作的计算机程序指令可以是汇编指令、指令集架构(ISA)指令、机器指令、机器相关指令、微代码、固件指令、状态设置数据、或者以一种或多种编程语言的任意组合编写的源代码或目标代码,所述编程语言包括面向对象的编程语言—诸如Smalltalk、C++等,以及常规的过程式编程语言—诸如“C”语言或类似的编程语言。计算机可读程序指令可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络—包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。在一些实施例中,通过利用计算机可读程序指令的状态信息来个性化定制电子电路,例如可编程逻辑电路、现场可编程门阵列(FPGA)或可编程逻辑阵列(PLA),该电子电路可以执行计算机可读程序指令,从而实现本公开的各个方面。
这里参照根据本公开实施例的方法、装置(系统)和计算机程序产品的流程图和/或框图描述了本公开的各个方面。应当理解,流程图和/或框图的每个方框以及流程图和/或框图中各方框的组合,都可以由计算机可读程序指令实现。
这些计算机可读程序指令可以提供给通用计算机、专用计算机或其它可编程数据处理装置的处理单元,从而生产出一种机器,使得这些指令在通过计算机或其它可编程数据处理装置的处理单元执行时,产生了实现流程图和/或框图中的一个或多个方框中规定的功能/动作的装置。也可以把这些计算机可读程序指令存储在计算机可读存储介质中,这些指令使得计算机、可编程数据处理装置和/或其他设备以特定方式工作,从而,存储有指令的计算机可读介质则包括一个制造品,其包括实现流程图和/或框图中的一个或多个方框中规定的功能/动作的各个方面的指令。
也可以把计算机可读程序指令加载到计算机、其它可编程数据处理装置、或其它设备上,使得在计算机、其它可编程数据处理装置或其它设备上执行一系列操作步骤,以产生计算机实现的过程,从而使得在计算机、其它可编程数据处理装置、或其它设备上执行的指令实现流程图和/或框图中的一个或多个方框中规定的功能/动作。
附图中的流程图和框图显示了根据本公开的多个实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或指令的一部分,所述模块、程序段或指令的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
以上已经描述了本公开的各实施方式,上述说明是示例性的,并非穷尽性的,并且也不限于所披露的各实施方式。在不偏离所说明的各实施方式的范围和精神的情况下,对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。本文中所用术语的选择,旨在最好地解释各实施方式的原理、实际应用或对市场中的技术的改进,或者使本技术领域的其他普通技术人员能理解本文披露的各实施方式。

Claims (15)

1.一种管理备份数据的方法,包括:
获取在第一时间段内针对备份存储装置中的目标数据的多个历史操作的历史信息,所述历史信息至少指示所述多个历史操作的类型和发生时间;
基于所述历史信息确定所述目标数据在所述第一时间段之后的第二时间段内是否将被重新写入到所述备份存储装置;以及
响应于确定所述目标数据在所述第二时间段内将被写入到所述备份存储装置,调整所述目标数据在所述备份存储装置中的过期时间。
2.根据权利要求1所述的方法,其中获取所述历史信息包括:
响应于在所述第一时间段内的针对所述目标数据的历史操作,确定所述目标数据的散列值;以及
将所述历史操作的类型和发生时间与所述散列值相关联地存储。
3.根据权利要求1所述的方法,其中确定所述目标数据在未来的第二时间段内是否将被重新写入到备份存储装置包括:
基于所述历史信息,确定针对所述目标数据的度量,所述度量包括以下中的至少一项:所述目标数据在所述第一时间段内被写入的次数、在所述第一时间段内写入所述目标数据的时间间隔、所述目标数据在所述第一时间段中的特定时间段内被写入的频率、以及在第一时间段内删除目标数据的时间间隔;以及
基于所述度量,确定所述目标数据在所述第二时间段内是否将被重新写入到所述备份存储装置。
4.根据权利要求3所述的方法,其中基于所述度量确定所述目标数据在所述第二时间段内是否将被写入到所述备份存储装置包括:
利用机器学习模型处理所述度量,以确定所述目标数据在所述第二时间段内是否将被写入到所述备份存储装置,其中所述机器学习模型至少基于以下至少一项而被训练:基于在第三时间段内针对参考数据的多次历史操作而确定的参考度量,以及关于所述参考数据在所述第三时间段之后的第四时间段内是否被写入到所述备份存储装置的指示。
5.根据权利要求1所述的方法,其中调整所述过期时间包括:
基于所述历史信息,确定在所述第一时间段内所述目标数据的多次写入操作之间的一组时间间隔;以及
基于所述一组时间间隔,确定所述目标数据的所述过期时间。
6.根据权利要求5所述的方法,其中确定所述过期时间包括:
基于所述一组时间间隔中的两个相邻时间间隔之间的变化程度,从所述一组时间间隔中确定至少一个时间间隔;以及
基于所述至少一个时间间隔,确定所述目标数据在所述备份存储装置中的所述过期时间。
7.根据权利要求1所述的方法,其中调整所述过期时间包括:
响应于确定所述目标数据在所述备份存储装置中已被删除,基于针对写入所述目标数据的请求而向所述备份存储装置重新写入所述目标数据;
修改所述目标数据在所述备份存储装置中的所述过期时间。
8.一种用于管理备份数据的设备,包括:
至少一个处理单元;
至少一个存储器,所述至少一个存储器被耦合到所述至少一个处理单元并且存储用于由所述至少一个处理单元执行的指令,所述指令当由所述至少一个处理单元执行时,使得所述设备执行动作,所述动作包括:
获取在第一时间段内针对备份存储装置中的目标数据的多个历史操作的历史信息,所述历史信息至少指示所述多个历史操作的类型和发生时间;
基于所述历史信息确定所述目标数据在所述第一时间段之后的第二时间段内是否将被重新写入到所述备份存储装置;以及
响应于确定所述目标数据在所述第二时间段内将被写入到所述备份存储装置,调整所述目标数据在所述备份存储装置中的过期时间。
9.根据权利要求8所述的设备,其中获取所述历史信息包括:
响应于在所述第一时间段内的针对所述目标数据的历史操作,确定所述目标数据的散列值;以及
将所述历史操作的类型和发生时间与所述散列值相关联地存储。
10.根据权利要求8所述的设备,其中确定所述目标数据在未来的第二时间段内是否将被重新写入到备份存储装置包括:
基于所述历史信息,确定针对所述目标数据的度量,所述度量包括以下中的至少一项:所述目标数据在所述第一时间段内被写入的次数、在所述第一时间段内写入所述目标数据的时间间隔、所述目标数据在所述第一时间段中的特定时间段内被写入的频率、以及在第一时间段内删除目标数据的时间间隔;以及
基于所述度量,确定所述目标数据在所述第二时间段内是否将被重新写入到所述备份存储装置。
11.根据权利要求10所述的设备,其中基于所述度量确定所述目标数据在所述第二时间段内是否将被写入到所述备份存储装置包括:
利用机器学习模型处理所述度量,以确定所述目标数据在所述第二时间段内是否将被写入到所述备份存储装置,其中所述机器学习模型至少基于以下至少一项而被训练:基于在第三时间段内针对参考数据的多次历史操作而确定的参考度量,以及关于所述参考数据在所述第三时间段之后的第四时间段内是否被写入到所述备份存储装置的指示。
12.根据权利要求8所述的设备,其中调整所述过期时间包括:
基于所述历史信息,确定在所述第一时间段内所述目标数据的多次写入操作之间的一组时间间隔;以及
基于所述一组时间间隔,确定所述目标数据的所述过期时间。
13.根据权利要求12所述的设备,其中确定所述过期时间还包括:
基于所述一组时间间隔中的两个相邻时间间隔之间的变化程度,从所述一组时间间隔中确定至少一个时间间隔;以及
基于所述至少一个时间间隔,确定所述目标数据在所述备份存储装置中的所述过期时间。
14.根据权利要求8所述的设备,其中调整所述过期时间包括:
响应于确定所述目标数据在所述备份存储装置中已被删除,基于针对写入所述目标数据的请求而向所述备份存储装置重新写入所述目标数据;
修改所述目标数据在所述备份存储装置中的所述过期时间。
15.一种计算机程序产品,所述计算机程序产品被存储在非瞬态计算机存储介质中并且包括机器可执行指令,所述机器可执行指令在设备中运行时使所述设备执行根据权利要求1至7中的任一项所述的方法。
CN201910990225.9A 2019-10-17 2019-10-17 管理备份数据的方法、设备和计算机程序产品 Pending CN112685222A (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201910990225.9A CN112685222A (zh) 2019-10-17 2019-10-17 管理备份数据的方法、设备和计算机程序产品
US16/799,581 US11983142B2 (en) 2019-10-17 2020-02-24 Method for managing backup data, electronic device and computer program product

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910990225.9A CN112685222A (zh) 2019-10-17 2019-10-17 管理备份数据的方法、设备和计算机程序产品

Publications (1)

Publication Number Publication Date
CN112685222A true CN112685222A (zh) 2021-04-20

Family

ID=75444582

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910990225.9A Pending CN112685222A (zh) 2019-10-17 2019-10-17 管理备份数据的方法、设备和计算机程序产品

Country Status (1)

Country Link
CN (1) CN112685222A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108733508A (zh) * 2017-04-17 2018-11-02 伊姆西Ip控股有限责任公司 用于控制数据备份的方法和系统

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040167901A1 (en) * 2003-02-26 2004-08-26 Permabit, Inc., A Massachusetts Corporation History preservation in a computer storage system
CN1627267A (zh) * 1995-03-23 2005-06-15 切恩尼软件(英国)有限公司 备份系统和备份方法
US20080022061A1 (en) * 2005-01-07 2008-01-24 Yoshikatsu Ito Backup System, Recording/Reproduction Device, Backup Device, Backup Method, Program, and Integrated Circuit
CN103154901A (zh) * 2010-10-06 2013-06-12 国际商业机器公司 自动及自调节的数据备份操作
CN104094236A (zh) * 2012-04-02 2014-10-08 国际商业机器公司 防止数据丢失的系统和方法
CN106155839A (zh) * 2015-04-28 2016-11-23 阿里巴巴集团控股有限公司 一种用于备份数据的方法与设备
US20180095816A1 (en) * 2015-01-23 2018-04-05 EMC IP Holding Company LLC Scalable predictive early warning system for data backup event log
US20180336210A1 (en) * 2017-05-18 2018-11-22 Geoffrey Bourgeois Methods and systems relating to network based storage

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1627267A (zh) * 1995-03-23 2005-06-15 切恩尼软件(英国)有限公司 备份系统和备份方法
US20040167901A1 (en) * 2003-02-26 2004-08-26 Permabit, Inc., A Massachusetts Corporation History preservation in a computer storage system
US20080022061A1 (en) * 2005-01-07 2008-01-24 Yoshikatsu Ito Backup System, Recording/Reproduction Device, Backup Device, Backup Method, Program, and Integrated Circuit
CN103154901A (zh) * 2010-10-06 2013-06-12 国际商业机器公司 自动及自调节的数据备份操作
CN104094236A (zh) * 2012-04-02 2014-10-08 国际商业机器公司 防止数据丢失的系统和方法
US20180095816A1 (en) * 2015-01-23 2018-04-05 EMC IP Holding Company LLC Scalable predictive early warning system for data backup event log
CN106155839A (zh) * 2015-04-28 2016-11-23 阿里巴巴集团控股有限公司 一种用于备份数据的方法与设备
US20180336210A1 (en) * 2017-05-18 2018-11-22 Geoffrey Bourgeois Methods and systems relating to network based storage

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108733508A (zh) * 2017-04-17 2018-11-02 伊姆西Ip控股有限责任公司 用于控制数据备份的方法和系统

Also Published As

Publication number Publication date
US20210117288A1 (en) 2021-04-22

Similar Documents

Publication Publication Date Title
US10613799B2 (en) Updating storage migration rates
US20150324404A1 (en) Probabilistically finding the connected components of an undirected graph
US8868993B1 (en) Data replacement policy
CN111104342B (zh) 用于存储的方法、电子设备和计算机程序产品
CN112685224A (zh) 任务管理的方法、设备和计算机程序产品
US10361905B2 (en) Alert remediation automation
US20190235717A1 (en) Progress bar updated based on crowd sourced statistics
US10248639B2 (en) Recommending form field augmentation based upon unstructured data
US20150379410A1 (en) Method and apparatus for generating data in a missing segment of a time data sequence
US20220292378A1 (en) Preprocessing of time series data automatically for better ai
CN112685222A (zh) 管理备份数据的方法、设备和计算机程序产品
US10540828B2 (en) Generating estimates of failure risk for a vehicular component in situations of high-dimensional and low sample size data
US10691552B2 (en) Data protection and recovery system
CN111488117B (zh) 用于管理元数据的方法、电子设备和计算机可读介质
US20230236923A1 (en) Machine learning assisted remediation of networked computing failure patterns
CN111104247A (zh) 管理数据复制的方法、设备和计算机程序产品
US20230095807A1 (en) Method, electronic device, and computer program product for managing storage device
US11922045B2 (en) Method, device and computer program product for data backup
US11983142B2 (en) Method for managing backup data, electronic device and computer program product
US20180198749A1 (en) Time and sentiment based messaging
CN113724115A (zh) 基于在线教育的数据处理方法及服务器
CN115202924A (zh) 用于存储管理的方法、电子设备和计算机程序产品
CN113297003A (zh) 管理备份数据的方法、电子设备和计算机程序产品
US11513718B2 (en) Method, electronic device and computer program product for configuring buffer size associated with backup threads
US11340825B1 (en) Method, device, and computer program product for managing storage system

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination