CN103605585B - 一种基于数据发现的智能备份方法 - Google Patents

一种基于数据发现的智能备份方法 Download PDF

Info

Publication number
CN103605585B
CN103605585B CN201310545644.4A CN201310545644A CN103605585B CN 103605585 B CN103605585 B CN 103605585B CN 201310545644 A CN201310545644 A CN 201310545644A CN 103605585 B CN103605585 B CN 103605585B
Authority
CN
China
Prior art keywords
backup
data
client
server
object description
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201310545644.4A
Other languages
English (en)
Other versions
CN103605585A (zh
Inventor
邓平
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Eisoo Information Technology Co Ltd
Original Assignee
Shanghai Eisoo Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Eisoo Information Technology Co Ltd filed Critical Shanghai Eisoo Information Technology Co Ltd
Priority to CN201310545644.4A priority Critical patent/CN103605585B/zh
Publication of CN103605585A publication Critical patent/CN103605585A/zh
Application granted granted Critical
Publication of CN103605585B publication Critical patent/CN103605585B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Abstract

本申请公开了一种基于数据发现的智能备份方法,该方法应用于备份客户端与备份服务器组成的数据备份系统,包括:备份客户端基于数据发现技术,实时记录备份保护路径下数据的数据对象描述信息;根据备份策略条件向备份服务器发送备份请求;备份服务器获取所述数据对象描述信息,根据所述数据对象描述信息从预先配置的备份策略中匹配出对应的备份子策略,根据匹配出的备份子策略对所述备份客户端备份保护路径下数据进行数据备份。

Description

一种基于数据发现的智能备份方法
技术领域
本申请涉及计算机数据存储与备份技术领域,尤其涉及一种基于数据发现的智能备份方法。
背景技术
在计算机领域,备份是指为了防止计算机数据因计算机故障、病毒、人为因素等原因而造成的数据丢失及损坏,从而对原始数据进行复制或拷贝进行单独存储,通过原始数据的备份副本可以提供在数据丢失或故障后的数据恢复的一种技术手段。
当前对数据的备份方式主要有两种,分别是定时备份和实时备份。定时备份通常都是根据预先设置的备份策略自动执行备份,又叫计划备份,而两个备份计划之间的时间间隔,则叫备份窗口。实时备份是指对数据进行自动监控,连续捕获和备份数据变化,只要数据发生变化,便实时、准确的备份下来,数据安全性更高,RPO可以为0。
随着IT业务系统的发展和普及,数据量增长速度非常明显,并且根据IT业务系统的不同而产生的数据种类繁多,数据的重要程度不一,访问频率也不一。有些数据经常会被访问和发生变化;有些数据自创建后,就不会发生变化;有些数据无关紧要,不需要进行备份保护;有些数据不再会被访问,但还长期存放在主存储空间中。现有技术中,无法准确地获取这些数据的价值和访问特点对不同类型及重要性的数据进行差别化备份。并且备份策略的应用主要依靠人工,无法根据数据的类型及生命周期进行智能的匹配。
发明内容
本申请提供了一种基于数据发现的智能备份方法,能够根据不同数据的实际情况自动进行差异化备份。
本申请实施例提供的一种基于数据发现的智能备份方法,该方法应用于备份客户端与备份服务器组成的数据备份系统,该方法包括:
A、备份客户端基于数据发现技术,实时记录备份保护路径下数据的数据对象描述信息;根据备份策略条件向备份服务器发送备份请求;
B、备份服务器获取所述数据对象描述信息,根据所述数据对象描述信息从预先配置的备份策略中匹配出对应的备份子策略,根据匹配出的备份子策略对所述备份客户端备份保护路径下数据进行数据备份。
较佳地,所述数据对象描述信息包括数据的文件类型、数据被访问的时间、数据被访问的频率、数据被修改的时间、数据被修改的频率、文件的数据量大小或以上内容的任意组合。
较佳地,步骤A所述备份客户端基于数据发现技术,实时记录备份保护路径下数据对象描述信息包括:
A1、备份客户端基于备份保护路径生成数据类型分布表,数据类型分布表中记录每一类型数据在存储分区或目录中的路径;
A2、以文件为单位,在数据类型分布表中记录的存储分区或目录中查找和识别数据,以文件为对象生成数据对象描述信息;
A3、根据对文件对象数据的访问、修改操作来更新数据在指定时间段的访问次数和修改次数,并且根据目录或文件数据的新建、修改或删除操作更新数据类型分布表中相应路径记录。
较佳地,步骤A3之后进一步包括:
A4、将数据类型分布表和数据对象描述信息按照转储策略转移存储到指定存储介质中;
步骤B所述备份服务器获取所述数据对象描述信息包括:备份服务器从所述指定存储介质中获取数据类型分布表和数据对象描述信息。
较佳地,所述备份子策略包括:数据类型、备份方式、备份窗口、数据保留周期、备份介质类型和满足备份的条件。
较佳地,所述备份方式包括:实时备份、周期性备份或不备份。
较佳地,步骤A之前进一步包括:备份客户端从备份服务器获取本备份客户端的备份策略及备份保护路径。
从以上技术方案可以看出,根据数据发现得到的数据对象描述信息自动应用对应的备份子策略,从而实现基于不同数据类型的重要程度等级来智能的匹配备份策略,在提升重要数据的安全性的同时,降低数据备份管理的复杂性,提升主存储设备、备份存储设备的存储空间利用价值;在数据服务器众多,数据类型繁多和数据量庞大的情况下,通过数据发现机制的数据分类和数据量统计,有利于更好更智能的管理数据的备份容灾情况,以及设计更好的备份策略。
附图说明
图1为本申请提供的智能备份方法中备份客户端的处理流程图;
图2为本申请提供的智能备份方法中备份服务器的处理流程图。
具体实施方式
本申请提供的一种基于数据发现的智能备份方法,备份客户端基于数据发现技术,实时记录备份保护路径下数据的数据对象描述信息;根据备份策略条件向备份服务器发送备份请求;备份服务器获取所述数据对象描述信息,根据所述数据对象描述信息从预先配置的备份策略中匹配出对应的备份子策略,根据匹配出的备份子策略对所述备份客户端进行数据备份。本申请方案可以提高数据的备份保护等级,提高数据的安全性,提升主存储的资源利用价值,降低数据备份产生的资源浪费。
本申请文件中所指的数据发现机制,是指通过在客户端主机中安装发现代理,通过发现代理获取和分析客户端主机中的数据及其类型,并对其进行分类、访问记录、变化、数据量统计等的一系列措施的过程。
本申请文件中的智能备份,是指可以在备份系统根据业务需要及政策规定预先设定好备份策略(包括数据类型、备份方式、备份窗口、数据保留周期、备份介质类型),然后备份系统根据备份客户端选择保护的数据类型范围和数据的访问及变化情况自动匹配相应的备份策略进行数据备份保护,不需要人工干预和定期检查的过程。
为使本申请技术方案的技术原理、特点以及技术效果更加清楚,以下结合具体实施例对本申请技术方案进行详细阐述。
本申请技术方案主要包括两个部分,第一个部分是基于数据发现机制的数据识别和分类、数据统计、数据变化记录,并主动向备份服务器发起备份请求;第二个部分是根据数据发现的结果,针对不同的数据类型来智能的选择和调整备份方式和备份策略,并根据需要管理和调整备份策略。
本申请涉及的数据备份系统主要包括备份客户端和备份服务器,两者通过网络连接。在备份客户端实现数据发现机制中的数据类型识别,数据量统计及数据访问记录,在备份服务器端实现备份策略管理及备份策略应用和执行情况。
备份客户端的处理过程如图1所示,包括如下步骤:
步骤101:获取备份策略和保护路径:从备份服务器获取本备份客户端的备份策略及备份保护路径。
步骤102:装载或生成数据类型分布表:所述数据类型分布表基于备份保护路径生成,所述数据类型分布表中记录每一类型数据在存储分区或目录中的位置,用于应用备份策略和执行备份。
步骤103:实时记录备份保护路径下数据的数据对象描述信息:
根据备份策略中的数据保护类型,以文件为单位在在数据类型分布表中记录的存储分区或目录中查找和识别数据,对所识别的数据进行分类,并以文件为对象生成数据对象描述信息。所述数据分类的方式可以包括但不限于:根据文件扩展名对数据进行分类;对文件的数据量大小进行统计并分类。根据对文件对象数据的访问、修改操作来更新数据在指定时间段的访问次数和修改次数,并且根据目录或文件数据的新建、修改或删除操作更新分布表中相应路径记录。
步骤104:转移存储数据对象描述信息:将上述数据类型分布表和数据对象描述信息按照转储策略转移存储到指定存储介质中,可供其他程序分析和访问;
步骤105:发起备份:根据备份策略条件发起指定数据类型或指定数据文件对象的备份。
基于上述步骤,备份客户端完成对指定计算机路径下的数据识别、数据分类、数据类型大小统计及修改次数相关信息的记录,并同时保持对文件或目录删除操作进行实时的更新。
备份服务器的处理过程如图2所示,包括如下步骤:
步骤201:制定和修改备份策略:备份策略中可以包含一个以上的子策略,每一条子策略用于指定特定数据类型在特定条件下执行具体的备份条件和参数,备份子策略包括:数据类型、备份方式、备份窗口、数据保留周期、备份介质类型、满足备份的条件;根据各方面要求制定和修改不同数据类型的备份策略。所述备份方式包括:实时备份、周期性备份或不备份。
步骤202:从指定存储介质获取数据类型分布表和数据对象描述信息。
步骤203:根据所述数据对象描述信息从预先配置的备份策略中匹配出对应的备份子策略。
步骤204:发送匹配出的备份子策略和备份保护路径到客户端;
步骤205:根据匹配出的备份子策略对所述备份客户端备份保护路径下数据进行数据备份。
基于本申请的技术方案,结合两个具体的实施例来进一步阐述。
实施例一包括如下步骤:
步骤301:安装部署备份客户端和备份服务器端。
计算机A:为文档服务器,已安装Windows2003操作系统、系统的D、E盘为数据盘,存有各部门设计图稿、工程文档、参考资料以及其他视频文件,在计算机A上安装部署备份客户端;
计算机B:已安装Windows2003操作系统,在计算机B上安装部署备份服务器,将备份客户端的备份服务器地址设置为备份服务器的地址。
步骤302:制定备份策略,添加备份子策略:在备份服务器上新建文档备份策略1。
在文档备份策略1中添加Office文档备份子策略,内容为:数据类型为Office文档(包含所有Office文档类型);当数据的修改频率大于等于5次/小时,执行实时备份,无备份窗口;当数据的修改频率小于5次/小时,则每修改超过5次则执行一次备份,同时每天晚20:00定期执行一次备份,备份窗口最长为一天;当数据的最后访问时间超过1年时,备份数据后,对原数据进行删除,以释放主存储空间;使用磁盘备份介质保留最近三个月的数据,使用磁带介质保护最近三年的数据;
在文档备份策略1中添加设计图稿文档备份子策略,内容为:数据类型为扩展名为CAD的文档;当数据的修改频率大于等于10次/小时,执行实时备份,无备份窗口;当数据的修改频率小于10次/小时,但每修改超过10次则执行一次备份,同时每天晚20:00定期执行一次备份,备份窗口最长为一天;当数据的最后访问时间超过1年时,备份数据后,对原数据进行删除,以释放主存空间;使用磁盘备份介质保留最近三个月的数据,使用磁带介质保护最近三年的数据。
步骤303:选择备份客户端的数据保护路径为D:\和E:\;
步骤304:在备份服务器机器B上将备份客户端机器A选择应用文档备份策略1,备份系统的数据发现机制将自动分析和识别备份客户端机器A中D:\和E:\下的Office文档及CAD文档,并针对这两类数据的数据变化情况自动选择备份子策略。
实施例二包括如下步骤:
步骤401:安装部署备份客户端和备份服务器端:
计算机C为数据库服务器,已安装Windows2003操作系统、SQL Server数据库服务器,在计算机C上安装部署备份客户端;
计算机D已安装Windows2003操作系统,在计算机D上安装部署备份服务器,将备份客户端的备份服务器地址设置为备份服务器的地址;
步骤402:制定备份策略,添加备份子策略:在备份服务器上新建数据库备份策略2;
在数据库备份策略2中添加SQL Server数据库备份子策略,内容为:数据类型为SQL Server数据库;当数据库的修改频率大于等于20次/分钟,执行实时备份,无备份窗口;当数据的修改频率小于20次/分钟,但每修改超过20次则执行一次备份,同时每天晚20:00定期执行一次备份,备份窗口最长为一天;使用磁盘备份介质保留最近三个月的数据,使用磁带介质保护最近三年的数据;
在备份服务器计算机D上将备份客户端计算机C选择应用数据库备份策略2,备份系统将自动根据计算机C的数据类型情况及数据变化情况自动选择数据类型的备份子策略。
通过本申请技术方案,可以实现以下效果:
根据数据发现得到的数据对象描述信息自动应用对应的备份子策略,从而实现基于不同数据类型的重要程度等级来智能的匹配备份策略,在提升重要数据的安全性的同时,降低数据备份管理的复杂性,提升主存储设备、备份存储设备的存储空间利用价值;在数据服务器众多,数据类型繁多和数据量庞大的情况下,通过数据发现机制的数据分类和数据量统计,有利于更好更智能的管理数据的备份容灾情况,以及设计更好的备份策略。
以上所述仅为本申请的较佳实施例而已,并不用以限制本申请的保护范围,凡在本申请技术方案的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本申请保护的范围之内。

Claims (6)

1.一种基于数据发现的智能备份方法,该方法应用于备份客户端与备份服务器组成的数据备份系统,其特征在于,该方法包括:
A、备份客户端基于数据发现技术,实时记录备份保护路径下数据的数据对象描述信息;根据备份策略条件向备份服务器发送备份请求;
B、备份服务器获取所述数据对象描述信息,根据所述数据对象描述信息从预先配置的备份策略中匹配出对应的备份子策略,根据匹配出的备份子策略对所述备份客户端备份保护路径下数据进行数据备份;
其中,
步骤A所述备份客户端基于数据发现技术,实时记录备份保护路径下数据对象描述信息包括:
A1、备份客户端基于备份保护路径生成数据类型分布表,数据类型分布表中记录每一类型数据在存储分区或目录中的路径;
A2、以文件为单位,在数据类型分布表中记录的存储分区或目录中查找和识别数据,以文件为对象生成数据对象描述信息;
A3、根据对文件对象数据的访问、修改操作来更新数据在指定时间段的访问次数和修改次数,并且根据目录或文件数据的新建、修改或删除操作更新数据类型分布表中相应路径记录。
2.根据权利要求1所述的方法,其特征在于,所述数据对象描述信息包括数据的文件类型、数据被访问的时间、数据被访问的频率、数据被修改的时间、数据被修改的频率、文件的数据量大小或以上内容的任意组合。
3.根据权利要求1所述的方法,其特征在于,步骤A3之后进一步包括:
A4、将数据类型分布表和数据对象描述信息按照转储策略转移存储到指定存储介质中;
步骤B所述备份服务器获取所述数据对象描述信息包括:备份服务器从所述指定存储介质中获取数据类型分布表和数据对象描述信息。
4.根据权利要求1所述的方法,其特征在于,所述备份子策略包括:数据类型、备份方式、备份窗口、数据保留周期、备份介质类型和满足备份的条件。
5.根据权利要求4所述的方法,其特征在于,所述备份方式包括:实时备份、周期性备份或不备份。
6.根据权利要求1至5任一项所述的方法,其特征在于,步骤A之前进一步包括:备份客户端从备份服务器获取本备份客户端的备份策略及备份保护路径。
CN201310545644.4A 2013-11-06 2013-11-06 一种基于数据发现的智能备份方法 Expired - Fee Related CN103605585B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310545644.4A CN103605585B (zh) 2013-11-06 2013-11-06 一种基于数据发现的智能备份方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310545644.4A CN103605585B (zh) 2013-11-06 2013-11-06 一种基于数据发现的智能备份方法

Publications (2)

Publication Number Publication Date
CN103605585A CN103605585A (zh) 2014-02-26
CN103605585B true CN103605585B (zh) 2017-01-18

Family

ID=50123814

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310545644.4A Expired - Fee Related CN103605585B (zh) 2013-11-06 2013-11-06 一种基于数据发现的智能备份方法

Country Status (1)

Country Link
CN (1) CN103605585B (zh)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103942124A (zh) * 2014-04-24 2014-07-23 深圳市中博科创信息技术有限公司 一种数据备份的方法及装置
CN104182302A (zh) * 2014-09-15 2014-12-03 北京国双科技有限公司 数据库备份方法及装置
CN105677507B (zh) * 2014-11-21 2019-01-01 中国移动通信集团公司 一种企业数据云备份系统及方法
CN104657234B (zh) * 2015-02-04 2018-05-22 深圳神州数码云科数据技术有限公司 一种磁盘阵列raid的超级块superblock的备份方法
CN109379325B (zh) * 2018-08-21 2022-03-18 广州数源畅联科技有限公司 一种无需用户配置的备份客户端交付方法
CN111176549B (zh) * 2018-11-13 2021-05-18 杭州海康威视系统技术有限公司 基于云存储的数据存储方法、装置和存储介质
CN109885425A (zh) * 2019-01-29 2019-06-14 人人行科技股份有限公司 数据的备份方法、备份装置、存储介质和处理器
CN111143280B (zh) * 2019-12-31 2023-10-10 广州广电运通信息科技有限公司 一种数据调度方法、系统、装置及存储介质
CN112839112B (zh) * 2021-03-25 2023-02-17 中国工商银行股份有限公司 一种分层数据存储系统及方法、备份管理服务器
CN112989389A (zh) * 2021-04-09 2021-06-18 国网陕西省电力公司电力科学研究院 一种数据安全防护方法及系统
CN114579367B (zh) * 2022-05-05 2022-07-29 武汉四通信息服务有限公司 数据备份系统、方法及电子设备
CN114579369A (zh) * 2022-05-09 2022-06-03 武汉四通信息服务有限公司 数据的备份方法、计算机设备及存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6898600B2 (en) * 2002-05-16 2005-05-24 International Business Machines Corporation Method, system, and program for managing database operations
CN101051285A (zh) * 2006-09-21 2007-10-10 上海交通大学 计算机网络数据备份中文件匹配的方法
CN102521076A (zh) * 2011-12-01 2012-06-27 浪潮电子信息产业股份有限公司 一种智能实时文件备份方法
CN102637169A (zh) * 2011-02-14 2012-08-15 大连兆阳软件科技有限公司 安全实用的数据库备份方法及系统
CN103092718A (zh) * 2011-10-27 2013-05-08 鸿富锦精密工业(深圳)有限公司 测试数据备份系统及方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8433870B2 (en) * 2010-10-12 2013-04-30 International Business Machines Corporation Multiple incremental virtual copies

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6898600B2 (en) * 2002-05-16 2005-05-24 International Business Machines Corporation Method, system, and program for managing database operations
CN101051285A (zh) * 2006-09-21 2007-10-10 上海交通大学 计算机网络数据备份中文件匹配的方法
CN102637169A (zh) * 2011-02-14 2012-08-15 大连兆阳软件科技有限公司 安全实用的数据库备份方法及系统
CN103092718A (zh) * 2011-10-27 2013-05-08 鸿富锦精密工业(深圳)有限公司 测试数据备份系统及方法
CN102521076A (zh) * 2011-12-01 2012-06-27 浪潮电子信息产业股份有限公司 一种智能实时文件备份方法

Also Published As

Publication number Publication date
CN103605585A (zh) 2014-02-26

Similar Documents

Publication Publication Date Title
CN103605585B (zh) 一种基于数据发现的智能备份方法
US11740974B2 (en) Restoring a database using a fully hydrated backup
US20200267055A1 (en) Automated grouping of computing devices in a networked data storage system
US10963350B2 (en) Dynamic triggering of block-level backups based on block change thresholds and corresponding file identities using indexing in a data storage management system
US11474984B2 (en) Differential health checking of an information management system
US20220283989A1 (en) Transaction log index generation in an enterprise backup system
US9645892B1 (en) Recording file events in change logs while incrementally backing up file systems
US11354065B2 (en) Cloud edition and retrieve
US20150172120A1 (en) Managing non-conforming entities in information management systems, including enforcing conformance with a model entity
EP3796174B1 (en) Restoring a database using a fully hydrated backup
US10809922B2 (en) Providing data protection to destination storage objects on remote arrays in response to assignment of data protection to corresponding source storage objects on local arrays
US10146637B1 (en) Intelligent snapshot rollbacks
US11436089B2 (en) Identifying database backup copy chaining
US11966297B2 (en) Identifying database archive log dependency and backup copy recoverability
US11042454B1 (en) Restoration of a data source
Rao Data duplication using Amazon Web Services cloud storage
US11068354B1 (en) Snapshot backups of cluster databases

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information

Address after: 201112 Shanghai, Minhang District, United Airlines route 1188, building second layer A-1 unit 8

Applicant after: SHANGHAI EISOO INFORMATION TECHNOLOGY CO., LTD.

Address before: 200072 room 3, building 840, No. 101 Middle Luochuan Road, Shanghai, Zhabei District

Applicant before: Shanghai Eisoo Software Co.,Ltd.

COR Change of bibliographic data
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20170118

Termination date: 20191106