CN102024002A - 一种电子文件归档的安全存储方法及系统 - Google Patents

一种电子文件归档的安全存储方法及系统 Download PDF

Info

Publication number
CN102024002A
CN102024002A CN2009101954849A CN200910195484A CN102024002A CN 102024002 A CN102024002 A CN 102024002A CN 2009101954849 A CN2009101954849 A CN 2009101954849A CN 200910195484 A CN200910195484 A CN 200910195484A CN 102024002 A CN102024002 A CN 102024002A
Authority
CN
China
Prior art keywords
file
pdf
filing
sign indicating
indicating number
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2009101954849A
Other languages
English (en)
Inventor
张曙华
杨安荣
李志卿
路斌
张二伟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
SHANGHAI ZHONGXIN INFORMATION DEVELOPMENT Co Ltd
Original Assignee
SHANGHAI ZHONGXIN INFORMATION DEVELOPMENT Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by SHANGHAI ZHONGXIN INFORMATION DEVELOPMENT Co Ltd filed Critical SHANGHAI ZHONGXIN INFORMATION DEVELOPMENT Co Ltd
Priority to CN2009101954849A priority Critical patent/CN102024002A/zh
Publication of CN102024002A publication Critical patent/CN102024002A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明揭示了一种电子文件归档的安全存储方法及系统,其对电子文件的真实性进行两阶段保证,第一阶段是通过数字摘要算法实现电子文件归档的真实性保证,第二阶段是通过数字签名来实现归档后的电子文件的真实性保证。另外,本发明还通过设置PDF转换服务器,以及在文件归档时将元数据作为PDF的一个文件层嵌入等方法实现电子文件的有效性和完整性的保证。

Description

一种电子文件归档的安全存储方法及系统
技术领域
本发明涉及电子文件归档领域,特别涉及一种电子文件归档的安全存储方法及系统。
背景技术
电子文件在档案局归档时,电子文件的三性保证问题是决定电子文件是否具有“档案”属性的关键问题。对此国家标准GB/T18894-2002《电子文件归档与管理规范》中对电子文件的真实性、完整性和有效性进行了明确定义,确定了三性问题在电子文件管理领域的重要地位。国内档案界由此展开了针对电子文件三性问题的研究热潮,近年来也取得一定的研究成果,但这些成果基本上都是局限在理论层面,在具体的实现手段和技术措施上如何完成电子文件的三性保证,迄今为止依然没有取得突破性进展,这也是目前电子文件归档依然只能作为纸质文件归档的补充手段的根本原因。
发明内容
本发明的目的是提供一种电子文件归档的安全存储方法及系统,其能有效保证电子文件归档时的真实性、完整性及有效性。
一方面,本发明提供一种电子文件归档的安全存储方法,包括以下步骤:
在提交端,对归档前的电子文件包进行摘要运算并生成第一摘要码,将所述电子文件及其第一摘要码输出;
在接收端,接收上步骤输出的所述电子文件包及其摘要码,对所述电子文件进行二次摘要运算并生成第二摘要码;
对所述第一摘要码和第二摘要码进行比对,若相同则将所述电子文件包归档存储,若不同则拒绝归档。
所述摘要运算为数字摘要运算法,其生成128位摘要码。
在将所述电子文件包归档存储时还包括以下步骤:
设置CA认证服务器以及PDF转换服务器;
通过PDF转换服务器将所述电子文件包转换为PDF格式;
通过硬件密钥读取所述CA认证服务器中的数字证书,并调用PDF工具包中的数字签名接口对所述PDF格式的电子文件包进行数字签名;
将经数字签名的PDF格式电子文件包归档存储。
在将所述电子文件包归档存储时还包括以下步骤:
将所述电子文件包的元数据封装为XML格式;
调用PDF工具包中的元数据嵌入接口,将XML格式元数据作为PDF一个文件层嵌入所述电子文件中。
另一方面,本发明还提供一种电子文件归档的安全存储系统,包括:
应用服务器,连接所述系统各单元并输出控制指令;
位于提交端的第一摘要运算单元,对归档前的电子文件包进行摘要运算并生成第一摘要码,将所述电子文件及其第一摘要码输出;
位于应用服务器的第二摘要运算单元,接收所述第一摘要运算单元输出的所述电子文件包及其摘要码,对所述电子文件进行二次摘要运算并生成第二摘要码;
位于应用服务器的比较单元,对所述第一摘要码和第二摘要码进行比对,若相同则将所述电子文件包输出并归档存储;
数据库,连接所述比较单元,存储所述比较单元输出的电子文件。
所述第一摘要运算单元和第二摘要运算单元基于数字摘要运算法进行摘要运算,并生成128位摘要码。
所述系统还包括CA认证服务器以及PDF转换服务器,所述PDF转换服务器将所述电子文件包转换为PDF格式,所述CA认证服务器根据硬件密钥输出数字证书,所述应用服务器通过PDF工具包中的数字签名接口对所述PDF格式的电子文件包进行数字签名,并将经数字签名的PDF格式电子文件包归档存储于所述数据库。
所述系统还包括以下模块:
将所述电子文件包的元数据封装为XML格式的模块;
调用PDF工具包中的元数据嵌入接口,将XML格式元数据作为PDF一个文件层嵌入所述电子文件中的模块。
采用本发明所述的一种电子文件归档的安全存储方法及系统,其对电子文件的真实性进行两阶段保证,第一阶段是通过数字摘要算法实现电子文件归档的真实性保证,第二阶段是通过数字签名来实现归档后的电子文件的真实性保证。另外,本发明还通过设置PDF转换服务器,以及在文件归档时将元数据作为PDF的一个文件层嵌入等方法实现电子文件的有效性和完整性的保证。
附图说明
图1是本发明所述方法的流程图;
图2是本发明所述数字摘要算法流程图;
图3是本发明所述系统的原理框图;
图4为本发明所述PDF文件的三个文件层示意图。
具体实施方式
下面结合附图和实施例进一步说明本发明的技术方案。
参见图1,本发明提供一种电子文件归档的安全存储方法100,包括以下步骤:
101、在提交端,对归档前的电子文件包进行摘要运算并生成第一摘要码,将所述电子文件及其第一摘要码输出;
102、在接收端,接收上步骤输出的所述电子文件包及其摘要码,对所述电子文件进行二次摘要运算并生成第二摘要码;
103、对所述第一摘要码和第二摘要码进行比对,若相同则转下步骤,若不同则拒绝归档。
104、将所述电子文件包归档存储。
作为一实施例,所述摘要运算为数字摘要运算法,其生成128位摘要码,如SHA-1数字摘要运算法,参见图2,在电子文件提交归档之前和归档接收之前分别采用SHA-1数字摘要算法对归档电子文件包进行摘要运算,生成128位“数字指纹”(摘要码),通过比对两次生成的“数字指纹”是否一致来判断归档电子文件的真实性。由于SHA-1是一个不可逆的字符串变换算法,换句话说就是,即使看到源程序和算法描述,也无法将一个SHA-1的值变换回原始的字符串,因此从数学原理上来说,SHA-1反演算法有无穷多个解,是不可破解的。
对于一个确定的文档,用摘要算法生成的128位“数字指纹”是唯一的,但对于一个和原始文档有着一个微小变化的文档(比如病毒感染、传输过程不够完整、中途被人篡改等),用摘要算法生成的128位“数字指纹”和原始“数字指纹”有着巨大的差别,这样只需要前后两次生成的“数字指纹”是一致的,就能判定档案管理员接受到的文档就是业务人员提交归档的归档,这样就保证了归档过程的真实性。
另外,如果认为SHA-1摘要算法强度不够,还可以采用强度更高的SHA-128/SHA-256摘要算法。当然算法的强度越高,破解难度也越大,但同时运算时间也越长。
参见图3,本发明还提供一种电子文件归档的安全存储系统200,包括:
应用服务器210,连接所述系统各单元并输出控制指令。
位于提交端的第一摘要运算单元220,对归档前的电子文件包进行摘要运算并生成第一摘要码,将所述电子文件及其第一摘要码输出。
位于应用服务器210的第二摘要运算单元211,接收所述第一摘要运算单元220输出的所述电子文件包及其摘要码,对所述电子文件进行二次摘要运算并生成第二摘要码。作为一实施例,所述第一摘要运算单元220和第二摘要运算单元211基于SHA-1数字摘要运算法进行摘要运算,并生成128位摘要码。
位于应用服务器210的比较单元212,对所述第一摘要码和第二摘要码进行比对,若相同则将所述电子文件包输出并归档存储。
数据库230,连接所述比较单元212,存储所述比较单元212输出的电子文件。
所述系统200还包括CA认证服务器240以及PDF转换服务器250,所述PDF转换服务器250将所述电子文件包转换为PDF格式,所述CA认证服务器根据硬件密钥输出数字证书,所述应用服务器210通过PDF工具包中的数字签名接口对所述PDF格式的电子文件包进行数字签名,并将经数字签名的PDF格式电子文件包归档存储于所述数据库230。
另外,所述系统还包括以下模块:
将所述电子文件包的元数据封装为XML格式的模块。调用PDF工具包中的元数据嵌入接口,将XML格式元数据作为PDF一个文件层嵌入所述电子文件中的模块。
下面通过真实性、完整性和有效性这三方面来进一步介绍本发明:
一,真实性保证
1,保证方法
结合机关立档单位电子文件归档的实际情况,采用“两阶段真实性保证”来解决:
即将电子文件的真实性保证分成归档前(业务部门)和归档后(档案部门)两个阶段,分别采取一定的技术措施进行真实性,分别称为:“电子文件归档的真实性保证”以及“归档电子文件的真实性保证”:
1.电子文件归档的真实性保证:在业务部门提交归档时,以“件”为单位,将电子文件的元数据、正文、附件和过程信息一起打包归档;并加业务人员的数字签名(有CA认证条件的单位)进行真实性保证,或者采用SHA-1等数字摘要算法(没有CA认证条件的单位)进行防篡改处理;
2.归档电子文件的真实性保证:档案部门接收归档电子文件之后,在完成完整性、有效性检查并整理完毕之后,加档案管理员的数字签名(数字摘要)保证其归档之后的真实性。
2,电子文件归档的真实性保证
参见图2,图2显示了电子文件归档阶段的真实性保证的流程,上面已经描述过了。
3,归档电子文件的真实性保证
对于具备CA认证条件的单位,可以通过调用USB-Key(硬件密钥)证书访问接口,从客户端USB-Key中读取CA认证服务器240中的数字证书,并通过调用PDF转换服务器250中的CES PDF SDK(PDF工具包)中的数字签名接口,用USB-Key中的证书对PDF文件实现签名操作。
比如档案管理员接收到归档电子文件并完成归档整理操作之后,用他自己的USB-Key对PDF文档加上数字签名,起到真实性保护的目的。
另外,考虑到档案管理员一次接收的文件比较多,如果需要对每个文件逐个进行签名操作,操作非常繁琐,工作量很大。因此,可由系统实现后台批量签名操作,用户只需要点击一次“签名”按钮,当前记录对应的所有电子文件一次性批量完成签名,这样就大大方便了档案管理员的操作。
二,完整性保证
首先,参照上海市档案局《上海市电子文件归档管理实施指南(征求意见稿)》和国家档案局《电子文件元数据标准(征求意见稿)》中有关元数据的标准定义设计通用软件的数据接口和完整性校验条件,当电子文件提交归档时,按照标准的要求对其元数据的完整性进行校验,并提醒档案管理员元数据是否完整。
其次,在电子文件接收时系统可以自动获取部分电子文件环境信息,比如文件大小、文件类型等,减少用户元数据补充著录的工作量。
最后,归档时将元数据封装成XML格式,并通过调用CES PDF SDK中的元数据嵌入接口将XML元数据作为PDF的一个文件层嵌入电子文件中,使元数据依附于电子文件,任何时间和环境下都能读取比对,不受系统环境限制,进一步保证了归档电子文件的完整性。这样一来,参见图4,PDF文件便有了三个文件层:文件形式层、文件内容层以及元数据层。
三,有效性保证
1、对于PDF格式的归档电子文件进行可读性和规范性检测,保证其可读并符合PDF1.1以上标准;对于非PDF格式的归档电子文件提供PDF格式转换功能,确保其环境无关性。
比如,对于非标准格式的PDF转换功能,可以将PDF转换服务放在服务器端自动运行,无需用户干预,由服务器在后台实现批量自动转换,这样就方便了用户操作。
2、对存放电子文件的载体进行检测,包括随机抽样检测、指定抽样检测、全盘完整检测等,提供完备的载体备份记录,并可恢复被检测载体中的损坏文件。
需要说明的是,本发明所述的系统200和所述的方法100在原理以及实现过程中基本相同或类似,故不再分开描述。
本技术领域中的普通技术人员应当认识到,以上的实施例仅是用来说明本发明,而并非用作为对本发明的限定,只要在本发明的实质精神范围内,对以上实施例的变化、变型都将落在本发明的权利要求书范围内。

Claims (8)

1.一种电子文件归档的安全存储方法,其特征在于,包括以下步骤:
在提交端,对归档前的电子文件包进行摘要运算并生成第一摘要码,将所述电子文件及其第一摘要码输出;
在接收端,接收上步骤输出的所述电子文件包及其摘要码,对所述电子文件进行二次摘要运算并生成第二摘要码;
对所述第一摘要码和第二摘要码进行比对,若相同则将所述电子文件包归档存储,若不同则拒绝归档。
2.如权利要求1所述的方法,其特征在于,所述摘要运算为数字摘要运算法,其生成128位摘要码。
3.如权利要求2所述的方法,其特征在于,在将所述电子文件包归档存储时还包括以下步骤:
设置CA认证服务器以及PDF转换服务器;
通过PDF转换服务器将所述电子文件包转换为PDF格式;
通过硬件密钥读取所述CA认证服务器中的数字证书,并调用PDF工具包中的数字签名接口对所述PDF格式的电子文件包进行数字签名;
将经数字签名的PDF格式电子文件包归档存储。
4.如权利要求2所述的方法,其特征在于,在将所述电子文件包归档存储时还包括以下步骤:
将所述电子文件包的元数据封装为XML格式;
调用PDF工具包中的元数据嵌入接口,将XML格式元数据作为PDF一个文件层嵌入所述电子文件中。
5.一种电子文件归档的安全存储系统,其特征在于,包括:
应用服务器,连接所述系统各单元并输出控制指令;
位于提交端的第一摘要运算单元,对归档前的电子文件包进行摘要运算并生成第一摘要码,将所述电子文件及其第一摘要码输出;
位于应用服务器的第二摘要运算单元,接收所述第一摘要运算单元输出的所述电子文件包及其摘要码,对所述电子文件进行二次摘要运算并生成第二摘要码;
位于应用服务器的比较单元,对所述第一摘要码和第二摘要码进行比对,若相同则将所述电子文件包输出并归档存储;
数据库,连接所述比较单元,存储所述比较单元输出的电子文件。
6.如权利要求5所述的系统,其特征在于,所述第一摘要运算单元和第二摘要运算单元基于数字摘要运算法进行摘要运算,并生成128位摘要码。
7.如权利要求6所述的系统,其特征在于,所述系统还包括CA认证服务器以及PDF转换服务器,所述PDF转换服务器将所述电子文件包转换为PDF格式,所述CA认证服务器根据硬件密钥输出数字证书,所述应用服务器通过PDF工具包中的数字签名接口对所述PDF格式的电子文件包进行数字签名,并将经数字签名的PDF格式电子文件包归档存储于所述数据库。
8.如权利要求6所述的系统,其特征在于,所述系统还包括以下模块:
将所述电子文件包的元数据封装为XML格式的模块;
调用PDF工具包中的元数据嵌入接口,将XML格式元数据作为PDF一个文件层嵌入所述电子文件中的模块。
CN2009101954849A 2009-09-10 2009-09-10 一种电子文件归档的安全存储方法及系统 Pending CN102024002A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2009101954849A CN102024002A (zh) 2009-09-10 2009-09-10 一种电子文件归档的安全存储方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2009101954849A CN102024002A (zh) 2009-09-10 2009-09-10 一种电子文件归档的安全存储方法及系统

Publications (1)

Publication Number Publication Date
CN102024002A true CN102024002A (zh) 2011-04-20

Family

ID=43865305

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2009101954849A Pending CN102024002A (zh) 2009-09-10 2009-09-10 一种电子文件归档的安全存储方法及系统

Country Status (1)

Country Link
CN (1) CN102024002A (zh)

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102509041A (zh) * 2011-10-14 2012-06-20 中国科学院自动化研究所 用于数字内容作品著作权登记的内容备案存档系统及方法
CN103473284A (zh) * 2013-08-29 2013-12-25 北京华财理账顾问有限公司 一种电子凭证管理系统及方法
CN103973692A (zh) * 2014-05-13 2014-08-06 浙江大学 基于虚拟打印的电子档案自动采集系统及采集方法
CN104376235A (zh) * 2013-08-13 2015-02-25 腾讯科技(深圳)有限公司 一种归档文件包的签名方法和装置
CN106528794A (zh) * 2016-11-10 2017-03-22 国网安徽省电力公司 一种基于档案管理系统的电子文件归档方法
CN107222311A (zh) * 2017-07-04 2017-09-29 四川云物益邦科技有限公司 一种多次通信校验身份的处理系统
CN107545411A (zh) * 2017-08-01 2018-01-05 丁辰科技(北京)有限公司 一种确保文件信息真实可靠的管理方法及系统
CN108875322A (zh) * 2018-05-31 2018-11-23 四川物联亿达科技有限公司 一种基于电子政务网的数字档案印章方法
CN110737629A (zh) * 2019-08-30 2020-01-31 华迪计算机集团有限公司 一种用于归档电子文件的方法及系统
CN111506268A (zh) * 2020-04-17 2020-08-07 北京百度网讯科技有限公司 代码文件存储方法、装置和电子设备
CN112100687A (zh) * 2020-09-18 2020-12-18 杭州天谷信息科技有限公司 一种支持各种格式附件的电子合同签署的方法
CN112464267A (zh) * 2020-12-07 2021-03-09 中国标准化研究院 一种电子文件的封装方法
CN113448918A (zh) * 2021-08-31 2021-09-28 中国建筑第五工程局有限公司 一种企业科研成果管理方法及管理平台、设备、存储介质
CN113742786A (zh) * 2020-05-29 2021-12-03 北京金山云网络技术有限公司 区块链中归档数据校验方法及装置

Cited By (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102509041A (zh) * 2011-10-14 2012-06-20 中国科学院自动化研究所 用于数字内容作品著作权登记的内容备案存档系统及方法
CN104376235A (zh) * 2013-08-13 2015-02-25 腾讯科技(深圳)有限公司 一种归档文件包的签名方法和装置
CN103473284A (zh) * 2013-08-29 2013-12-25 北京华财理账顾问有限公司 一种电子凭证管理系统及方法
CN103973692B (zh) * 2014-05-13 2018-09-14 浙江大学 基于虚拟打印的电子档案自动采集系统及采集方法
CN103973692A (zh) * 2014-05-13 2014-08-06 浙江大学 基于虚拟打印的电子档案自动采集系统及采集方法
CN106528794A (zh) * 2016-11-10 2017-03-22 国网安徽省电力公司 一种基于档案管理系统的电子文件归档方法
CN106528794B (zh) * 2016-11-10 2020-06-26 国网安徽省电力有限公司 一种基于档案管理系统的电子文件归档方法
CN107222311A (zh) * 2017-07-04 2017-09-29 四川云物益邦科技有限公司 一种多次通信校验身份的处理系统
CN107545411A (zh) * 2017-08-01 2018-01-05 丁辰科技(北京)有限公司 一种确保文件信息真实可靠的管理方法及系统
CN108875322A (zh) * 2018-05-31 2018-11-23 四川物联亿达科技有限公司 一种基于电子政务网的数字档案印章方法
CN108875322B (zh) * 2018-05-31 2022-02-01 四川物联亿达科技有限公司 一种基于电子政务网的数字档案印章方法
CN110737629A (zh) * 2019-08-30 2020-01-31 华迪计算机集团有限公司 一种用于归档电子文件的方法及系统
CN111506268A (zh) * 2020-04-17 2020-08-07 北京百度网讯科技有限公司 代码文件存储方法、装置和电子设备
CN113742786A (zh) * 2020-05-29 2021-12-03 北京金山云网络技术有限公司 区块链中归档数据校验方法及装置
CN113742786B (zh) * 2020-05-29 2024-02-20 北京金山云网络技术有限公司 区块链中归档数据校验方法及装置
CN112100687A (zh) * 2020-09-18 2020-12-18 杭州天谷信息科技有限公司 一种支持各种格式附件的电子合同签署的方法
CN112464267A (zh) * 2020-12-07 2021-03-09 中国标准化研究院 一种电子文件的封装方法
CN112464267B (zh) * 2020-12-07 2024-04-02 中国标准化研究院 一种电子文件的封装方法
CN113448918A (zh) * 2021-08-31 2021-09-28 中国建筑第五工程局有限公司 一种企业科研成果管理方法及管理平台、设备、存储介质
CN113448918B (zh) * 2021-08-31 2021-11-12 中国建筑第五工程局有限公司 一种企业科研成果管理方法及管理平台、设备、存储介质

Similar Documents

Publication Publication Date Title
CN102024002A (zh) 一种电子文件归档的安全存储方法及系统
US11934494B2 (en) Method and system for verifying integrity of a digital asset using a distributed hash table and a peer to-peer distributed ledger
CN109791594B (zh) 在关系数据库上执行写入和存储操作的方法及可读介质
US11907406B2 (en) Computer-implemented method and system of tamper-evident recording of a plurality of service data items
KR20200011435A (ko) 파라미터화 가능 스마트 계약
GB2477307A (en) Embedding authentication data into an electronic document image
CN102609769A (zh) 数据采集工具及数据采集方法
US8677133B1 (en) Systems and methods for verifying an electronic documents provenance date
CN114416638A (zh) 一种电子文件自动归档方法及系统
CN117632855A (zh) 一种基于四包结构的单套制电子档案归档系统、方法、设备及存储介质
CN114417425B (zh) 一种基于OAuth的文档安全预览及溯源方法
US20210176068A1 (en) Apparatus, computer program and method
JP5511270B2 (ja) 情報処理装置、及び情報処理方法
TW201342869A (zh) 數位內容雲存儲與存證方法
CN103092940A (zh) 一种重构可验证的文档结构、数字签名方法和数字签名验证方法
US11671243B2 (en) Apparatus, computer program and method
Garfinkel Aff and aff4: Where we are, where we are going, and why it matters to you
CN117910011A (zh) 检测单套电子档案文件数据总量完整性的方法、系统及介质
Somasundar et al. MongoDB integration with Python and Node. js, Express. js
Li et al. Research and Implementation of Electronic Seal System Based on Blockchain Technology
Zainuddin et al. Design a Document Verification System Based on Blockchain Technology
CN114117516A (zh) 一种水冷磁体实验数据的认证方法
WO2020240170A1 (en) Data verification
KR20220038013A (ko) 법적 신뢰성 확보가 가능한 문서 전자화 방법 및 이를 위한 시스템
JP2004289471A (ja) 署名装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C12 Rejection of a patent application after its publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20110420