CN106874144A - 基于电子档案属性的存储备份策略评价方法 - Google Patents

基于电子档案属性的存储备份策略评价方法 Download PDF

Info

Publication number
CN106874144A
CN106874144A CN201611257201.5A CN201611257201A CN106874144A CN 106874144 A CN106874144 A CN 106874144A CN 201611257201 A CN201611257201 A CN 201611257201A CN 106874144 A CN106874144 A CN 106874144A
Authority
CN
China
Prior art keywords
electronic record
backup policy
attribute
backup
method based
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201611257201.5A
Other languages
English (en)
Inventor
张曙华
杨安荣
袁嘉新
马来娣
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
SHANGHAI ZHONGXIN INFORMATION DEVELOPMENT Co Ltd
Original Assignee
SHANGHAI ZHONGXIN INFORMATION DEVELOPMENT Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by SHANGHAI ZHONGXIN INFORMATION DEVELOPMENT Co Ltd filed Critical SHANGHAI ZHONGXIN INFORMATION DEVELOPMENT Co Ltd
Priority to CN201611257201.5A priority Critical patent/CN106874144A/zh
Publication of CN106874144A publication Critical patent/CN106874144A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1446Point-in-time backing up or restoration of persistent data
    • G06F11/1458Management of the backup or restore process
    • G06F11/1461Backup scheduling policy
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3447Performance evaluation by modeling

Abstract

本发明涉及一种基于电子档案属性的存储备份策略评价方法,包括:对电子档案的属性和备份策略进行赋值评分;利用灰色关联分析法进行建模,为选出最佳的档案备份策略提供参考;计算灰色关联度,对各备选方案进行排序。和现有技术相比,本发明综合考虑了电子档案存储备份策略的各项因素,可根据电子档案的特性,对多种存储备份策略进行评估,从而对档案机构如何根据自身的电子档案特性选择合适的存储介质和存储备份策略提供了有意义的指导和参考。

Description

基于电子档案属性的存储备份策略评价方法
技术领域
本发明涉及电子档案存储领域,具体地说是一种基于电子档案属性的存储备份策略评价方法。
背景技术
近年来,随着电子政务和企业信息化的大力推进,越来越多形态各异,种类繁多的电子文件随之产生,其中有保存价值的部分需要归档形成电子档案。电子档案已经成为各类档案机构的收集保管对象,对电子档案进行存储和备份也逐步成为档案机构的重要工作内容之一。
电子档案存储和备份的介质有磁盘、磁带、光盘等多种,不同的介质在存储容量、价格、访问速度、保存时间和管理复杂度上有很大不同。一般来讲,磁盘的容量较大、访问速度快,但价格高,保存时间短;磁带的容量大,价格低、保存时间较长,但是对保存环境要求高,访问速度慢,查询利用不便;光盘容量较小,保存时间长,访问速度较慢,管理复杂度高。此外,某些档案机构还采用缩微胶片作为电子档案的异质备份手段。
不同存储介质的特性适合不同的应用场景。考虑到电子档案存储和备份的复杂性,以及长时间保存过程中可能面临的技术风险,有必要考虑综合采用多种存储介质对电子档案进行存储备份,同时设置合适的备份策略,包括备份套数、备份周期和备份方式等。实践工作中,根据不同电子档案类型的属性,如保管期限、数据类别、数据量、访问频率、价值等因素,所采用的电子档案存储备份介质和备份策略也会体现出较大的差异。如频繁访问的电子档案,宜采用可快速访问的存储介质;保存时间长、数据量大的电子档案,需要充分考虑长期保存过程中介质的经济性;价值较高的电子档案,需要备份多套,并使用不同的介质降低技术风险等。
对于电子档案的存储备份策略,国内已有一定的研究,并发表了一些论文成果,如赵云澜、赵伟东、吴永涛的《档案馆海量数据存储备份策略》;杜琳琳的《海量数据离线存储系统研究》(《中国档案》,2016(2):62-63)等,同时经过专利检索,也有一些相关的专利,如《银行业务档案光盘脱机安全存储系统及存储方法》(申请号:CN201510479174.5,实质性审查阶段)。但这些论文和专利成果或者只研究具备某一类特性(如海量的、永久保存)的电子档案,或者只考虑某一种存储介质,没有综合考虑电子档案的多种属性,没有综合采用多种存储备份介质,缺少全面的策略设置指导。
发明内容
本发明为解决现有的问题,旨在提供一种基于电子档案属性的存储备份策略评价方法。
本发明采用的技术方案包括:
步骤一,对电子档案的属性和备份策略进行赋值评分;
步骤二,利用灰色关联分析法进行建模,为选出最佳的档案备份策略提供参考;
步骤三,计算灰色关联度,对各备选方案进行排序。
其中,所述电子档案的属性包括密级属性和/或保管期限和/或文件大小和/或数据类别和/或访问频率和/或应急程度和/或价值。
其中,所述电子档案的备份策略包括介质选择和/或周期选择和/或方式选择和/或数据备份套数。
其中,所述步骤一进一步地包括:赋值评分完成后,对电子档案属性对应选择的备份策略建立评价打分表。
其中,利用灰色关联分析法(GRA)进一步地包括:首先对目标备份方案建立一个可比性序列,并确定最优的理想目标序列;然后计算各方案与理想最优目标序列的灰色关联系数;最后计算灰色关联度,对各备选方案进行排序。
本发明和现有技术相比具有如下优势:
(1)综合性:本发明综合考虑了电子档案存储备份策略的各项因素,充分发挥了磁盘、磁带、光盘和缩微等不同存储介质在电子档案存储备份中的优势,可根据电子档案的特性,对多种存储备份策略进行评估,从而对档案机构如何根据自身的电子档案特性选择合适的存储介质和存储备份策略提供了有意义的指导和参考。
(2)适应性:本发明可适应各种类型的电子档案存储备份策略的评估和选择。对于各类电子档案,本发明均可依据其特性,对其可能采用的各类存储备份策略进行评估,从而指导设计适合该类型电子档案的存储备份策略。
(3)客观性:对于电子档案存储备份策略,通过多种计算方法,消除主观评价时可能产生的偏差,从而达到客观评估的效果。
(4)指导性:本发明不仅可以用于对档案机构当前的电子档案存储备份策略进行评估,还可以通过评估过程指标的取值情况,说明当前策略在哪些方面存在需要改进的地方,从而指导档案机构对电子档案存储备份策略进行改进。
附图说明
图1为本发明一个实施例的流程图。
具体实施方式
现结合附图对本发明作进一步地说明。
参见图1,图1展示的是本发明的一个实施例,本实施例根据对电子档案的属性与其选择的存储备份策略之间适合程度的评分,利用灰色关联分析法对采集的评分数据进行分析,得出基于档案属性的多介质备份对策与措施,技术方案主要包括:
步骤一,对电子档案的属性和备份策略进行赋值评分;
步骤二,利用灰色关联分析法进行建模,为选出最佳的档案备份策略提供参考;
步骤三,计算灰色关联度,对各备选方案进行排序。
其中,其中进行分析的电子档案的属性包括:
密级属性:该属性表示档案的秘密程度,包括公开、限制、秘密、机密、绝密等;
保管期限:该属性表示档案的保管时间长度,包括永久、长期、短期,30年、10年等;
文件大小:该属性表示档案电子原文的容量大小;
数据类别:该属性表示档案电子原文的类别,有版式、文本、图像、图形、音频、视频、程序、超媒体、信息包等类别;
访问频率:该属性表示档案访问频率的高低,如高、中、低等;
应急程度:该属性表示档案需要访问时的紧急程度,如某些重要工程档案,可用于救灾、抢险,应急程度就比较高;
价值:该属性是对档案价值的评估,有一级、二级、三级等。
在备份策略上主要包括如下几个方面的策略:
介质选择:可选择磁盘、磁带、光盘和缩微等介质中的一种或多种组合;
周期选择:每周备份,或者按月、按季度、按年来备份;
方式选择:可选择全备份,全备份+增量备份,全备份+差分备份等备份方式。数据备份套数:可将电子档案数据备份一套、二套、三套或更多套。
为了得到最优的档案备份策略,前期可通过对电子档案属性对于相应存储备份策略的选择来进行打分。评分标准参考相对应的选择合适程度等级表:等级1表示该档案属性不适合采用这种备份策略;等级3表示该档案属性比较不适合采用这种备份策略;等级5表示该档案属性相对适合采用这种备份策略;等级7表示该档案属性比较适合采用这种备份策略;等级9表示该档案属性适合采用这种备份策略;2、4、6、8表示上述适合程度的中间值。
灰色关联分析法(GRA)通常被用来分析各个因素对于选择结果的影响程度,其基本思想是通过确定比较数据序列和最优理想参考数据序列之间的相似关联程度是否接近。
本实施例关于灰色关联分析法的分析步骤是:先通过赋值方式,对电子档案属性对应选择的备份策略建立评价打分表;然后利用灰色关联分析法(GRA)对基于电子档案属性下的备份策略进行数学建模分析:首先对目标备份方案建立一个可比性序列,并确定最优的理想目标序列;然后计算各方案与理想最优目标序列的灰色关联系数;最后计算灰色关联度,对各备选方案进行排序,为选出最佳的档案备份策略提供参考。
采用灰色关联度(GRA)分析的具体步骤如下:
(1)根据档案属性以及档案备份策略方案,确定原始评价矩阵及参考数列。档案备份策略由备份介质、备份周期、备份方式、备份套数等因素构成,各因素之间相对独立。这里我们以备份介质的选择为例,假设档案属性为n个,备份介质的选择方案为m种(其中包含多种介质的组合方案),我们用xij表示对第i个档案属性对应选择第j种策略的备份介质进行打分的评价值,该矩阵表示为然后我们对该矩阵进行标准化,构建标准化的决策矩阵,记标准化后的矩阵为其中
(2)生成参考向量X0′。
X0′=(x0′(1),x0′(2),...,x0′(n)),其中x0′(j)为第j个指标的最大值,表示为针对该档案某一属性选择的最优的理想介质组合方案的值。
(3)我们将第i个档案属性对应选择第j种备份介质组合方案进行打分的理想最优值与标准化的评估值进行相减,从而计算标准化后的序列与参考序列的差异度Δ0i(j):Δ0i(j)=|x0′(j)-x′ij|,并构建差异度矩阵:
(4)计算灰色关联系数r0i(j)
我们计算第i个比较序列Xi与第j个属性的关联度,用r0i(j)表示,显然r0i(j)的值越大,表示该属性对应选择这种介质组合方案的关联程度越高。灰色关联系数的计算公式为:(其中表示第i个比较序列Xi与第j个属性的关联度的最小值;表示第i个比较序列Xi与第j个属性的关联度的最大值;δ表示分辨系数,δ的取值越小,关联系数间的差异性越大,分辨能力越强,δ的取值为[0,1],本专利中我们取δ=0.5)。
(5)计算关联度
我们知道档案的不同属性对档案的介质组合方案选择影响情况不同,因此首先对档案各属性指标赋予权重W,W=(ω12,...,ωn),且满足为得到关联度,对各个介质组合方案分别计算其档案属性评价指标与参考序列对应元素的关联系数的均值,记为P,P=(p01,p02,...,p0m)T,其中p0i的值越大,表示档案的属性与选择这种介质组合方案的关联性越好,则越倾向于选择这种介质组合方案。
(6)选择最优备份策略
与备份介质组合方案的选择类似,采用灰色关联分析法可对备份周期、备份方式、备份套数等其他因素的选择进行建模分析。
我们用Pi表示不同备份策略下的关联度,用ψi表示评价该备份策略的权重,且满足针对某一特定档案的属性,灰色关联度的值越大则此选择越好,因此对每个因素的各个选择值进行评分和排序,最终灰色关联度的评估值为我们从各个因素中选择最优的组合备份策略,形成基于档案属性的最优备份策略推荐。
本实施例创新性地发明了一种新的综合评估方法,基于电子档案属性中与存储备份相关的多个属性,利用赋值评价法和灰色关联分析法,对采用多种存储介质的不同存储备份策略的进行了分析和评估,可适用于具有不同类型和特性的电子档案的存储备份策略的量化评估,突破了以往凭主观经验感性评估方法的局限性,从而对档案机构如何根据自身的电子档案特性选择合适的存储备份策略提供了有意义的指导和参考。
上面结合附图及实施例描述了本发明的实施方式,实施例给出的并不构成对本发明的限制,本领域内熟练的技术人员可依据需要做出调整,在所附权利要求的范围内做出各种变化或改动均在保护范围内。

Claims (5)

1.一种基于电子档案属性的存储备份策略评价方法,其特征在于包括:
步骤一,对电子档案的属性和备份策略进行赋值评分;
步骤二,利用灰色关联分析法进行建模,为选出最佳的档案备份策略提供参考;
步骤三,计算灰色关联度,对各备选方案进行排序。
2.根据权利要求1所述的一种基于电子档案属性的存储备份策略评价方法,其特征在于:所述电子档案的属性包括密级属性和/或保管期限和/或文件大小和/或数据类别和/或访问频率和/或应急程度和/或价值。
3.根据权利要求1所述的一种基于电子档案属性的存储备份策略评价方法,其特征在于:所述电子档案的备份策略包括介质选择和/或周期选择和/或方式选择和/或数据备份套数。
4.根据权利要求1所述的一种基于电子档案属性的存储备份策略评价方法,其特征在于:所述步骤一进一步地包括:赋值评分完成后,对电子档案属性对应选择的备份策略建立评价打分表。
5.根据权利要求1所述的一种基于电子档案属性的存储备份策略评价方法,其特征在于:利用灰色关联分析法(GRA)进一步地包括:
首先对目标备份方案建立一个可比性序列,并确定最优的理想目标序列;
然后计算各方案与理想最优目标序列的灰色关联系数;
最后计算灰色关联度,对各备选方案进行排序。
CN201611257201.5A 2016-12-30 2016-12-30 基于电子档案属性的存储备份策略评价方法 Pending CN106874144A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201611257201.5A CN106874144A (zh) 2016-12-30 2016-12-30 基于电子档案属性的存储备份策略评价方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201611257201.5A CN106874144A (zh) 2016-12-30 2016-12-30 基于电子档案属性的存储备份策略评价方法

Publications (1)

Publication Number Publication Date
CN106874144A true CN106874144A (zh) 2017-06-20

Family

ID=59165291

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201611257201.5A Pending CN106874144A (zh) 2016-12-30 2016-12-30 基于电子档案属性的存储备份策略评价方法

Country Status (1)

Country Link
CN (1) CN106874144A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107766178A (zh) * 2017-10-24 2018-03-06 上海金档信息技术有限公司 电子档案存储系统、存储方法及修复方法
CN109885425A (zh) * 2019-01-29 2019-06-14 人人行科技股份有限公司 数据的备份方法、备份装置、存储介质和处理器
CN113791935A (zh) * 2021-09-06 2021-12-14 广州宝云信息科技有限公司 一种数据备份方法、网络节点及系统
CN117240613A (zh) * 2023-11-13 2023-12-15 浙江星汉信息技术股份有限公司 一种基于云端存储的档案风险管理方法与系统

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5018060A (en) * 1989-01-26 1991-05-21 Ibm Corporation Allocating data storage space of peripheral data storage devices using implied allocation based on user parameters
CN1653422A (zh) * 2002-05-31 2005-08-10 国际商业机器公司 基于策略的存储管理的方法、系统和程序
CN101576898A (zh) * 2008-11-26 2009-11-11 北京中加国道科技有限公司 一种适用于网络学术资源永久存档及使用的元数据方案
CN101894327A (zh) * 2010-07-07 2010-11-24 清华大学 一种数字资源长期保存格式过时风险量化评估方法
CN102117231A (zh) * 2009-12-30 2011-07-06 上海文广互动电视有限公司 一种分布式数据备份容灾系统以及方法
EP2375347A3 (en) * 2005-11-28 2012-12-19 Commvault Systems, Inc. Systems and methods for classifying and transferring information in a storage network
US8380960B2 (en) * 2008-11-04 2013-02-19 Microsoft Corporation Data allocation and replication across distributed storage system
CN103905517A (zh) * 2012-12-28 2014-07-02 中国移动通信集团公司 一种数据存储方法及设备
CN105740126A (zh) * 2016-03-08 2016-07-06 西北工业大学 基于五种能力的嵌入式系统性能评价方法

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5018060A (en) * 1989-01-26 1991-05-21 Ibm Corporation Allocating data storage space of peripheral data storage devices using implied allocation based on user parameters
CN1653422A (zh) * 2002-05-31 2005-08-10 国际商业机器公司 基于策略的存储管理的方法、系统和程序
EP2375347A3 (en) * 2005-11-28 2012-12-19 Commvault Systems, Inc. Systems and methods for classifying and transferring information in a storage network
US8380960B2 (en) * 2008-11-04 2013-02-19 Microsoft Corporation Data allocation and replication across distributed storage system
CN101576898A (zh) * 2008-11-26 2009-11-11 北京中加国道科技有限公司 一种适用于网络学术资源永久存档及使用的元数据方案
CN102117231A (zh) * 2009-12-30 2011-07-06 上海文广互动电视有限公司 一种分布式数据备份容灾系统以及方法
CN101894327A (zh) * 2010-07-07 2010-11-24 清华大学 一种数字资源长期保存格式过时风险量化评估方法
CN103905517A (zh) * 2012-12-28 2014-07-02 中国移动通信集团公司 一种数据存储方法及设备
CN105740126A (zh) * 2016-03-08 2016-07-06 西北工业大学 基于五种能力的嵌入式系统性能评价方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
郝强,朱梅林: "基于模糊灰色分析的方案排序及应用", 《系统工程》 *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107766178A (zh) * 2017-10-24 2018-03-06 上海金档信息技术有限公司 电子档案存储系统、存储方法及修复方法
CN109885425A (zh) * 2019-01-29 2019-06-14 人人行科技股份有限公司 数据的备份方法、备份装置、存储介质和处理器
CN113791935A (zh) * 2021-09-06 2021-12-14 广州宝云信息科技有限公司 一种数据备份方法、网络节点及系统
CN113791935B (zh) * 2021-09-06 2023-10-24 广州宝云信息科技有限公司 一种数据备份方法、网络节点及系统
CN117240613A (zh) * 2023-11-13 2023-12-15 浙江星汉信息技术股份有限公司 一种基于云端存储的档案风险管理方法与系统
CN117240613B (zh) * 2023-11-13 2024-03-08 浙江星汉信息技术股份有限公司 一种基于云端存储的档案风险管理方法与系统

Similar Documents

Publication Publication Date Title
CN106874144A (zh) 基于电子档案属性的存储备份策略评价方法
US7451155B2 (en) Statistical methods and apparatus for records management
US8965891B1 (en) Training scoring models optimized for highly-ranked results
US6061658A (en) Prospective customer selection using customer and market reference data
US8189963B2 (en) Matching advertisements to visual media objects
EP1544754A3 (en) System and method for file and storage management
CN104281713B (zh) 数据汇总方法和数据汇总装置
CN104298736B (zh) 数据集合连接方法、装置及数据库系统
Hardman et al. Predicting students' progression in higher education by using the random forest algorithm
US7996409B2 (en) System and method for content-based object ranking to facilitate information lifecycle management
CN108287916B (zh) 一种资源推荐方法
CN103064906A (zh) 文件管理方法及装置
CN105404660A (zh) 多级数据存储方法及装置、多级数据结构、信息检索方法
CN108255915A (zh) 一种文件管理方法、装置及机器可读存储介质
CN107092525A (zh) 数据缓存方法和装置
CN109522273A (zh) 一种实现数据写入的方法及装置
CN113837630A (zh) 基于文本识别的区域内esg指数确定方法及相关产品
CN104298739A (zh) 一种数据处理方法及装置
CN104539895B (zh) 一种视频分层存储系统及处理方法
CN107305615A (zh) 数据表识别方法和系统
CN109803022A (zh) 一种数字化资源共享系统及其服务方法
CN108256064A (zh) 一种数据搜索方法和装置
Lyons et al. Quantifying the Need: A Survey of Existing Sound Recordings in Collections in the United States
CN104820709B (zh) 一种移动用户数据处理、推送方法及相应的系统
CN115204289A (zh) 基于主动学习回归树的模型训练方法、系统及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information
CB02 Change of applicant information

Address after: 200041, room 710, 302 Changping Road, Shanghai, Jingan District

Applicant after: Shanghai Xinlian Information Development Co., Ltd

Address before: 200041, room 710, 302 Changping Road, Shanghai, Jingan District

Applicant before: SHANGHAI ZHONGXIN INFORMATION DEVELOPMENT Co.,Ltd.

RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20170620