CN117632855A - 一种基于四包结构的单套制电子档案归档系统、方法、设备及存储介质 - Google Patents
一种基于四包结构的单套制电子档案归档系统、方法、设备及存储介质 Download PDFInfo
- Publication number
- CN117632855A CN117632855A CN202311626560.3A CN202311626560A CN117632855A CN 117632855 A CN117632855 A CN 117632855A CN 202311626560 A CN202311626560 A CN 202311626560A CN 117632855 A CN117632855 A CN 117632855A
- Authority
- CN
- China
- Prior art keywords
- file
- electronic
- archive
- evidence
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000003860 storage Methods 0.000 title claims abstract description 77
- 238000000034 method Methods 0.000 title claims description 136
- 238000004806 packaging method and process Methods 0.000 claims abstract description 45
- 230000001502 supplementing effect Effects 0.000 claims abstract description 11
- 230000008569 process Effects 0.000 claims description 97
- 241000234282 Allium Species 0.000 claims description 12
- 235000002732 Allium cepa var. cepa Nutrition 0.000 claims description 12
- 238000000605 extraction Methods 0.000 claims description 11
- 238000006243 chemical reaction Methods 0.000 claims description 10
- 238000007711 solidification Methods 0.000 claims description 10
- 230000008023 solidification Effects 0.000 claims description 10
- 238000013475 authorization Methods 0.000 claims description 9
- 239000000284 extract Substances 0.000 claims description 2
- 230000000295 complement effect Effects 0.000 claims 1
- 238000012795 verification Methods 0.000 abstract description 16
- 230000000694 effects Effects 0.000 abstract 1
- 238000007726 management method Methods 0.000 description 80
- 238000001514 detection method Methods 0.000 description 18
- 238000005516 engineering process Methods 0.000 description 18
- 238000012545 processing Methods 0.000 description 18
- 230000007774 longterm Effects 0.000 description 16
- 238000010586 diagram Methods 0.000 description 10
- 230000006870 function Effects 0.000 description 10
- 238000005538 encapsulation Methods 0.000 description 6
- 238000012986 modification Methods 0.000 description 5
- 230000004048 modification Effects 0.000 description 5
- 238000012015 optical character recognition Methods 0.000 description 5
- 230000015572 biosynthetic process Effects 0.000 description 4
- 230000002776 aggregation Effects 0.000 description 3
- 238000004220 aggregation Methods 0.000 description 3
- 230000006835 compression Effects 0.000 description 3
- 238000007906 compression Methods 0.000 description 3
- 238000013507 mapping Methods 0.000 description 3
- 238000012550 audit Methods 0.000 description 2
- 238000004321 preservation Methods 0.000 description 2
- 230000035945 sensitivity Effects 0.000 description 2
- 230000006399 behavior Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 239000003086 colorant Substances 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000006378 damage Effects 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000002950 deficient Effects 0.000 description 1
- 238000000586 desensitisation Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000013508 migration Methods 0.000 description 1
- 230000005012 migration Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 238000012384 transportation and delivery Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/10—File systems; File servers
- G06F16/11—File system administration, e.g. details of archiving or snapshots
- G06F16/113—Details of archiving
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/10—File systems; File servers
- G06F16/11—File system administration, e.g. details of archiving or snapshots
- G06F16/116—Details of conversion of file system types or formats
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/60—Protecting data
- G06F21/64—Protecting data integrity, e.g. using checksums, certificates or signatures
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Computer Security & Cryptography (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Bioethics (AREA)
- Software Systems (AREA)
- Computer Hardware Design (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Storage Device Security (AREA)
Abstract
本发明提出一种基于四包结构的单套制电子档案归档系统,获取、解析并自动补齐待归档电子文件及元数据,将电子文件转换为标准格式;提取签名制作数据、用户协议、数字证书、签名信息、存证信息等证据数据,生成证据文件并形成与原文的关联;根据封装规则将待归档数据封装生成“存档信息包、档案利用包、档案管理包、档案证据包”四包结构的归档信息包,固化存证后完成归档。存档信息包保留电子文件原始形态,且与档案证据包形成关联,支持文件验真与独立举证,实现档案证据自包含、自验证。根据本发明生成的归档信息包保证了电子档案的通用性、原始性、稳定性、可验证和防篡改,同时维护了电子档案的凭证法律效力。
Description
技术领域
本发明涉及计算机信息处理技术及信息安全技术领域,具体为基于四包结构的单套制电子档案归档技术。
背景技术
随着计算机信息技术、网络技术的迅猛发展,信息化系统在日常办公、办文中的广泛应用,以及政务一体化、无纸化系统的建设与推进,电子档案日益成为信息记录、传输、交换、利用与共享的主流方式,也成为国家档案资源的重要组成部分,传统的档案管理模式面临深刻变革。随着相关政策及规范文件的陆续出台,为电子文件“单套制”管理提供了切实可靠的落地实施执行依据,电子档案“单套制”归档亦从试点走向广泛实施阶段。
然而,法律法规虽赋予了电子文件“单套制”归档的可行性,但“单套制”条件下电子文件的真实性及凭证效力问题却亟待解决。电子文件的真实性,不仅包括电子文件形成过程的真实,也包括电子文件形成之后结果的真实,即电子文件从形成、保存、整理、利用等全生命周期始终保持电子文件的原始状态。
现有一系列电子档案归档方法中,由于技术的限制对电子文件真实性的验证存在瑕疵,往往抛弃了电子签名原始数据或舍弃电子签名功能属性,仅保存签名、签章的影像,或是通过后期合成将作者的签名字迹、签章图形嵌入文件,不仅完全丧失了电子签名的功能,还有人为合成文件的嫌疑。此外,出于对档案长期保存的需要,现有电子档案系统往往将归档电子文件合为一个OFD版式文件进行归档,也使得电子文件归档后不可验证,使得归档电子文件失去了原件属性。
同时,根据《电子档案单套管理一般要求》(DA/T 92)等规范要求,“应以独立的方式存储电子档案,在不依赖特定管理系统前提下实现归档电子文件的自包含、自描述和自证明”,现有电子档案系统在电子签名信息元数据的提取及电子签名功能作用的维护上极度欠缺,使得归档电子文件难以满足自包含、自验证需求,归档电子文件缺乏凭证效力。
此外,根据《电子文件归档与电子档案管理规范》(GB/T 18894)规范要求,“应持续并自动采集电子档案管理过程元数据,应记录的电子档案管理过程包括登记、格式转换、迁移、鉴定、销毁、移交等”,也即除了电子档案形成归档过程之外,电子档案查询利用、管理过程产生的过程数据,亦需要经常变动更新。而进入长期保存阶段的电子档案,出于长期存储与备份(包括介质备份、异地备份等)的需要,往往不期望被频繁访问或修改。
综上,如何保证电子档案的原始性、真实性、完整性和长期保存的稳定性,并使其具备法律凭证效力,同时方便后期管理与利用,是实现“单套制”电子文件归档重点需要解决的问题。
发明内容
针对上述问题,本发明提供了一种基于四包结构的单套制电子档案归档方法,能够同时满足电子档案长期保存、管理、利用、且具备证据效力、可独立举证的归档档案。
根据本发明第一方面,提出一种基于四包结构的单套制电子档案归档系统,包括:数据捕获模块、格式转换模块、证据提取模块、归档配置模块,数据捕获模块,用于获取并解析、补齐待归档电子文件及元数据;格式转换模块,用于将不符合归档规范要求格式的电子文件转换为符合归档规范要求的格式;证据提取模块,用于从区块链存证中心提取证据数据,生成证据文件并形成与原文的关联,作为电子文件签署形成过程真实有效的证据自包含、自验证;归档配置模块,用于配置归档标准与封包规则;档案封包模块,用于根据配置的封包规则生成“存档信息包、档案利用包、档案管理包、档案证据包”四包结构的归档档案信息包,并通过数字签名技术固化存证后,完成归档。
进一步优选,所述生成四包结构的归档档案信息包包括:根据电子文件、证据文件及元数据按照配置文件要求生成存档信息包;根据电子文件、内容文件及元数据生成档案利用包;根据管理过程信息元数据及证据文件生成档案管理包;根据电子文件全生命周期存证数据、证书、签字数据包、用户协议生成档案证据包。
进一步优选,数据捕获模块通过标准接口或FTP文件下载地址从异构业务系统或电子档案系统获取待归档电子数据;若获取的电子数据是信息包形式,则根据配置的档案封包规则反向解析获取电子文件及元数据;通过获取的电子文件捕获基本信息、数字化属性信息、电子签名信息等,对业务系统提交的元数据进行一致性比对与补齐补全,实现元数据的智能捕获与自动著录。
进一步优选,归档配置模块包括归档标准配置与封包规则配置。归档标准配置包括配置归档文件格式、元数据特殊字符以及根据不同档案门类、不同立档单位配置归档范围、归档文件目录、归档元数据标准等。依据电子档案相关政策规范及标准要求,可根据配置文件对归档电子文件格式是否符合归档标准予以检测;对元数据特殊字符是否符合归档标准予以检测;对实际归档文件目录、签字签章必要性等是否符合配置的应归档标准予以检测;对元数据著录项的必要性、长度、数据类型等是否符合配置的应归档标准予以检测等;归档标准配置主要用于支撑数据捕获模块与四性检测模块。封包规则包括元数据XML封装规则、存档信息包目录生成规则、档号及文件命名规则等,通过封包规则配置文件与内置规则可用于支撑档案封包模块。
进一步优选,证据提取模块根据业务ID、文件ID和档案ID从存证中心提取电子签名信息、证据文件、存证数据,并建立证据与原文的关联,包括:根据文件ID获取数字证书、证书链、证书撤销序列、签名结果如base64格式的签字图片或印章图样、印章颁发机构等电子签名信息,作为文件签署直接证据描述信息补齐元数据;根据文件ID获取签署文件签名制作数据、用户协议、授权协议等证据文件,并在元数据中建立证据文件与原文件的关联,作为文件签署真实意愿证据;通过文件ID获取签署任务签署过程的实名认证、印章授权、签署过程等存证信息,生成证据文件XML,并在元数据中建立证据文件与原文件的关联,作为文件签署身份真实证据;根据业务ID、档案ID获取电子档案形成归档至管理利用各环节对于电子档案相关操作的存证信息,并在元数据中建立证据与档案的关联,形成签署全过程证据闭环,基于区块链技术的存证数据跟踪回溯了电子文件形成归档全过程,确保电子档案来源可靠、程序规范、要素合规;最终形成符合《中华人民共和国电子签名法》关于“可靠电子签名”要求的、多维立体的证据数据体系用于维护档案的证据性、支撑存档信息包和档案证据包的封包,解决了归档电子文件具备凭证和法律效力问题。
进一步优选,档案封包模块根据配置的封包规则将待归档电子数据生成“存档信息包、档案利用包、档案管理包、档案证据包”四包结构的归档信息包,包括:根据配置的封包规则,根据电子文件、证据文件及元数据生成EEP或ZIP格式的存档信息包;根据电子文件、内容文件以及元数据生成三层OFD格式的档案利用包;根据管理过程信息元数据及证据文件生成XML格式档案管理包;根据电子文件全生命周期存证数据、证书、签字数据包、用户协议等生成档案证据包;生成的四包结构档案信息包进行固化加密存证,完成归档。
进一步优选,根据配置的封包规则,根据电子文件、证据文件及元数据生成EEP或ZIP格式的存档信息包,包括:建立以档号或电子文件号命名的根目录,在根目录下建立“电子文件”子目录、“证据文件”子目录;解析元数据电子文件目录信息,在“电子文件”目录下,根据归档配置要求生成各级子目录,将获取的电子文件放入对应目录文件夹并依据“档案·顺序号”的方式对电子文件命名;将证据文件放入对应目录文件夹并通过文件命名建立与原文的联系,与档案相关的证据文件按“档号·ZJ·证据顺序号”方式命名,与电子文件相关的证据文件按“电子文件名·ZJ·证据顺序号”的方式命名;将获取的元数据根据归档元数据标准,封装为基本信息、过程信息、归档配置及电子文件属性信息等元数据XML,放入根目录用于描述档案;根据配置要求对归档电子文件加盖电子归档章或通过数字签名技术进行固化加密存证;采用EEP或ZIP封包方式对电子档案进行封包并以档号命名,形成包括元数据XML、多层级电子文件及证据文件的存档信息包。
进一步优选,所述将获取的元数据根据归档元数据标准,封装为基本信息、过程信息、归档配置及电子文件属性信息等元数据XML,放入根目录用于描述档案,包括:基本信息包括档案分类、聚合层次、档案馆名称、档案馆代码、全宗号、全宗单位、电子文件号、档号、年度、保管期限、责任者、归档日期、密级等基本信息,以及不同档案门类业务属性元数据,封装构成“基本信息.XML”;归档配置及电子文件属性信息包括归档配置信息、归档目录、基本属性、数字化属性、电子签名信息、证据信息等结构单元,封装构成“归档配置及电子文件属性信息.XML”,根据不同档案门类归档配置信息不同,若档案门类没有“归档配置信息”元数据,则将归档目录、基本属性、数字化属性、电子签名信息、证据信息等结构单元,封装为“电子文件属性信息.XML”;过程信息包括业务阶段信息、操作人信息、操作时间信息、操作事件信息以及操作主体所属单位、所属部门等扩展信息,封装构成“过程信息.XML”。
进一步优选,所述电子文件属性信息中的电子签名信息,包括签名类型、签名规则、签名时间、签名人、签名结果如base64格式的签字图片或印章图样、文件摘要杂凑值、证书、证书链、证书撤销序列、印章颁发机构等,封装为电子文件属性信息中的“电子签名信息”结构单元,每个电子文件的电子签名信息元数据越丰富,其所含所附的证据力及凭证效力越强。
进一步优选,所述根据电子文件全生命周期存证数据、证书、签字数据包、用户协议生成档案证据包,包括:通过签署文件ID获取签名制作数据(如签字数据包)、印章图样、数字证书、用户授权协议等原始证据文件;根据档案ID、业务ID、签署文件ID获取全生命周期存证数据,将获取的存证数据根据XML封装规范生成XML证据文件;根据获取的原始证据文件和生成的XML证据文件放入证据文件目录、编号,并根据证据文件命名规则进行命名,建立证据文件与原文的关联;将证据文件关联更新至基础信息元数据,将证据文件与电子文件的关联更新至电子文件属性信息元数据,将管理过程证据文件更新至管理过程元数据;通过上述操作,即建立了所有证据文件与档案原文及管理过程的关联,形成电子档案全生命周期证据链闭环,将证据文件与电子文件一并存档,使得归档档案实现证据自包含、自验证,解决了归档电子文件具备凭证和法律效力问题。
进一步优选,根据电子文件及元数据、内容文件生成三层OFD档案利用包,具体包括:将完成格式转换的待归档文件按文件顺序号进行排列合并为一个OFD版式文件;通过OCR识别提取电子文件全文内容数据,生成XML格式文件,嵌入到OFD版式文件中;将电子文件基本信息、过程信息、归档配置及电子文件属性信息等元数据合并XML格式文件,嵌入到OFD文件中;通过数字签名或数字信封技术对生成的OFD版式文件实施固化加密存证。
进一步优选,所述根据管理过程信息元数据及证据文件生成XML格式档案管理包,包括:根据业务归档接口提交的元数据解析获得档案形成归档阶段过程信息;根据业务ID、存证类型从区块链存证中心获取业务存证数据,获取业务阶段信息、操作人信息、操作时间信息、操作事件信息、操作主体信息等更新补充档案管理过程信息;电子档案归档阶段形成的过程信息封装为XML,并以“档号-过程信息”命名,归档放入存档信息包根目录下;电子档案归档后的管理利用阶段产生的过程信息封装为XML,并以“档号-管理信息”命名,形成档案管理包。档案管理包着重解决电子档案进入长期保存阶段后,持续对后续管理过程的跟踪记录,同时不会对存档信息包频繁调用、修改,有利于完善单套制电子档案归档后的管理过程记录。
当对电子档案文件进行增补或其他操作使得长期保存阶段电子档案发生变化时,将本次归档时间与上一次归档时间之间产生的管理过程信息封装为过程信息.XML,并以洋葱结构封装进存档信息包。电子档案形成、归档、管理、利用、销毁全生命周期产生的过程信息封装为XML,并以“档号-管理信息”命名,形成档案管理包,管理过程信息包中的管理过程信息支持持续、实时不间断更新。
根据本申请第二方面,提出一种基于四包结构的单套制电子档案归档方法,包括:从异构业务系统、电子档案系统、存证中心获取并处理电子文件、证据文件及元数据;加载四性检测模型和策略,对待归档电子文件及元数据进行四性检测,确保电子档案真实、完整、可用、安全;根据电子文件、证据文件及元数据按照配置文件要求生成EEP或ZIP格式存档信息包;根据电子文件、内容文件及元数据生成OFD格式档案利用包;根据管理过程信息元数据及证据文件生成XML格式档案管理包;根据电子文件生命全周期存证数据、证书、签字数据包、用户协议等生成档案证据包;档案固化存证、返回归档四包结构、完成归档。
进一步优选,从异构业务系统、电子档案系统、存证中心获取并处理电子文件、证据文件及元数据,包括:通过标准接口或FTP文件下载地址获取待归档电子文件及元数据;通过接口获取归档标准配置文件及封包规则配置文件;根据获取的电子文件捕获元数据,依据归档元数据标准,对从业务系统、电子档案系统获取的元数据进行补齐补全;通过接口获取电子签名信息、证据文件及存证数据,补齐电子签名信息元数据、生成存证证据文件XML并建立证据文件与原文的关联。
根据获取的电子文件捕获元数据并对从业务系统、电子档案系统获取的元数据进行更新补充包括:获取文件基本属性信息,包括电子文件计算机名称、文件格式、文件大小、文件创建时间、文件修改时间、文件最后访问时间等;获取文件数字化属性信息,包括数字化形态、扫描分辨率、扫描色彩模式、图像压缩方案、数字化授权信息等;根据文件ID及文件签名域信息从存证中心获取电子签名信息,包括签名类型、签名规则、签名时间、签名人、签名结果、文件摘要杂凑值、证书、证书链等,返回值为数组结构;根据电子文件模板ID获取模板,通过模板解析识别提取元数据,更新至基本信息结构单元;根据证照类型编码获取证照模板,通过OCR(光学字符识别)识别提取元数据,更新至基本信息结构单元。
进一步优选,所述根据电子文件、证据文件及元数据按照配置文件要求生成EEP或ZIP格式存档信息包,包括:建立以档号为根目录的各级文件目录,用于分别存放电子文件、证据文件,将电子文件放入对应目录文件夹并依据“档案·顺序号”的方式对电子文件进行命名,将证据文件放入对应目录文件夹并通过文件命名建立与原文的联系,电子文件基本信息、过程信息、归档配置及电子文件属性信息元数据封装为XML格式,根据配置要求对归档电子文件加盖电子归档章或通过数字签名固化加密存证,采用EEP或ZIP封包方式对电子档案进行封包并以档号命名。
根据电子文件基本信息、过程信息、归档配置及电子文件属性信息元数据按配置要求封装为XML格式文件,生成文件基础信息,基础信息包括档案分类、聚合层次、档案馆名称、档案馆代码、全宗号、全宗单位、电子文件号、档号、年度、保管期限、责任者、归档日期、密级,以及不同档案门类业务属性元数据,构成基本信息.XML;根据元数据生成归档配置及电子文件属性信息.XML,包括归档配置信息、归档目录、基本属性、数字化属性、电子签名信息、证据信息等结构单元,其中,归档配置信息根据不同门类归档标准进行封装,电子文件属性信息按通用标准封装。
进一步优选,所述根据电子文件生命全周期存证数据、证书、签字数据包、用户协议生成档案证据包,包括:根据档案ID、业务ID、文件ID获取相关证据文件和存证数据;根据存证数据生成XML证据文件;根据获取和生成的证据文件放入证据文件目录、编号,并根据证据文件命名规则进行命名,建立证据文件与原文的关联;将证据文件与关联更新至基础信息元数据,将证据文件与电子文件的关联更新至电子文件属性信息元数据,将管理过程证据文件更新至管理过程元数据。
进一步优选,所述根据电子文件及元数据、内容文件生成OFD档案利用包,包括:将完成格式转换的待归档文件按文件顺序号排列合并为一个OFD版式文件;通过OCR识别提取电子文件全文内容数据,生成XML格式文件,嵌入到OFD版式文件中;将电子文件基本信息、过程信息、归档配置及属性信息元数据合并XML格式文件,嵌入到OFD文件中;通过数字签名或数字信封技术对生成的OFD版式文件实施固化加密存证。利用OFD容器功能实现电子档案利用包三层结构,形式层方便浏览借阅,通过内容层、元数据层提高电子档案检索及利用效率;通过敏感信息遮盖、文档页面处理及文档权限处理实现电子档案的分级分层利用,解决因部分信息敏感而造成整个档案不可公开利用的情况,扩大了电子档案的利用知悉范围;同时,通过数字水印、数字签名、数字信封等技术实现档案利用副本的有效监管,实现档案借阅的可控、可查,实现档案流出可溯源、篡改可发现、副本可收回等,从一定程度上解决了电子文件流出不可控的情况。
根据管理过程信息元数据及证据文件生成XML档案管理包,包括,
根据接口传入的元数据解析获得档案形成归档阶段过程信息;根据业务ID、存证类型从区块链存证中心获取业务存证数据,获取业务阶段信息、操作人信息、操作时间信息、操作事件信息以及操作主体所属单位、所属部门等扩展信息,并根据过程信息元数据标准进行过程信息更新;电子档案形成归档阶段形成的过程信息封装为XML,并以“档号-过程信息”命名,放在存档信息包根目录下进行归档;电子档案形成归档阶段形成的过程信息以及电子档案归档后的管理利用阶段产生的过程信息封装为XML,并以“档号-管理信息”命名,形成档案管理包。
档案固化存证、返回归档四包结构,完成归档包括:通过归档印章或数字签名对存档信息包实施固化加密存证;通过数字签名或数字信封对利用信息包实施固化加密存证;通过数字签名或数字信封对管理信息包实施固化加密存证;通过数字签名或数字信封对档案证据包实施固化加密存证;向电子档案系统返回归档成功状态,并返回四包结构ZIP压缩信息包。
根据第三方面,本发明提供了一种电子设备,包括:存储器和处理器,所述存储器和所属处理器之间相互通信连接,所述存储器中存储有计算机指令,所述处理器执行所述计算机指令,从而执行本发明第一方面,或者第一方面任意一种可选实施方式中所述的方法。
根据第四方面,本发明提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使计算机执行第一方面,或者第一方面任意一种可选实施方式中所述的方法。
根据本发明生成的存档信息包保留了电子文件原件属性,可用于长期保存具备通用、原始、可验证、防篡改等特点:首先,其格式与计算机软硬件无关,符合电子文件归档规范的通用格式,可不依赖于特定软硬件系统而被打开查阅共享使用;其次,其电子文件保留了原始性,支持对文件真实性、有效性进行验证,具备证据效力和法律效力;再次,通过归档章或数字签名技术对存档信息包固化加密存证,存档信息包发生单文件篡改、增加或抽取文件均可被发现,且有效防止电子档案被篡改。根据本发明生成的利用信息包可在不频繁调取存档信息包的情形下,依据用户权限进行分级分层利用,实现不同用户查看、借阅不同等,实现档案的最大化共享利用。根据本发明生成的管理信息包可跟踪、记录电子文件从形成、归档、管理、利用乃至销毁的全生命周期的背景和管理信息,且不频繁调取、修改存档信息包,实现管理过程信息全记录。根据本发明生成的档案证据包,围绕电子档案全生命周期提供证据数据,使电子文件形成归档形成证据闭环,可回溯还原电子文件形成归档全过程,支持司法举证验证。
综述,本发明实施例提供的单套制电子档案四包结构归档方法,根据长期保存需要生成保留文件原始性的存档信息包,根据共享利用需要生成支持多级利用的OFD格式档案利用包,根据归档前、后过程管理需要生成档案管理包,根据档案凭证属性生成用于支持验证、举证的档案证据包,满足了电子档案按归档后的保存、利用、管理和凭证等各方面用途,保证了电子档案的原始性、稳定性,极大提高了电子档案的利用率,完善了电子档案过程监管记录,满足电子档案全程过程监管与审计需要,同时维护了电子档案的凭证法律效力。可用于电子档案归档后的保存、利用、管理和凭证等各方面用途,;档案利用包通过三层OFD封装实现全文快速检索的同时支持用户分层分级利用,极大提高了电子档案的利用率;档案管理包在电子档案进入长期保存阶段后,在不频繁读取、修改存档信息包的情况下,持续跟踪记录后续管理过程,符合《电子档案单套管理一般要求》等相关标准规范要求。
附图说明
为了更清楚地说明本发明具体实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为根据本申请示例性实施例所提供的基于四包结构归档单套制电子档案的系统结构示意图;
图2为根据本申请示例性实施例所提供的基于四包结构归档单套制电子档案的方法流程图;
图3为根据本申请示例性实施例所提供的存档信息包结构图;
图4为根据本申请示例性实施例所提供的洋葱嵌套结构存档信息包结构图;
图5为根据本申请示例性实施例所提供的档案利用包封包流程图;
图6为根据本申请示例性实施例所提供的档案证据包证据与原文关系封装示意图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述。显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。
电子档案归档应满足长期保存的固化状态、查询利用的频繁读取、档案全生命周期过程监管以及档案维护档案作为凭证的法律效力,本发明提供了一种基于四包结构的单套制电子档案归档方法,其中,存档信息包是电子档案的基本单元,具有原始凭证作用,用于长期保存;档案利用包是存档信息包的镜像副本,满足电子档案频繁查询利用需求,且支持用户分层分级利用查询;档案管理包是电子文件归档管理全生命周期过程元数据信息,实时监管、动态更新;档案证据包是电子文件从签署形成、归档到归档后管理、利用乃至销毁全生命周期形成的所有证据信息,构成电子档案证据闭环,形成证据自包含、可自验证,具备凭证司法效力,可用于出证、举证等用途。
本发明从异构业务系统、电子档案系统、存证中心获取并处理电子文件、证据文件及元数据;加载四性检测模型和策略,对待归档电子文件及元数据进行四性检测,确保电子档案真实、完整、可用、安全;根据电子文件、证据文件及元数据按照配置文件要求生成洋葱结构EEP(电子记录封装包)或ZIP(压缩包)格式存档信息包;根据电子文件、内容文件及元数据生成OFD(开放式版式文件)格式档案利用包;根据管理过程信息元数据及证据文件生成XML(可扩展标记语言)格式档案管理包;根据电子文件全生命周期存证数据、证书、签字数据包、用户协议等生成档案证据包;对上述存档信息包、档案利用包、档案管理包、档案证据包进行固化存证,生成四包结构的归档档案信息包,完成归档。
如图1所示为根据本申请示例性实施例所提供的一种基于四包结构的单套制电子档案归档系统结构示意图,包括:数据捕获模块、证据提取模块、四性检测模块、档案封包模块、格式转换模块、归档配置模块。
数据捕获模块,从异构业务系统、电子档案系统获取并解析、补齐电子文件及元数据;格式转换模块,用于对不符合归档标准的电子文件格式进行转换;证据提取模块,用于对签名制作数据、数字证书、用户协议等电子签名信息、明文证据以及存证数据等证据文件的提取、生成、封装;四性检测模块加载配置的四性检测策略和模型,对待归档数据进行真实性、完整性、可用性、安全性检测,检测通过后将待归档电子数据输入档案封包模块。
档案封包模块,用于根据配置的元数据XML封装规则、档案封包规则等,形成存档信息包;包括根据电子文件、证据文件及元数据按照配置文件要求生成EEP或ZIP格式存档信息包;根据电子文件、内容文件及元数据生成OFD格式档案利用包;根据管理过程信息元数据及证据文件生成XML格式档案管理包;根据电子文件全生命周期存证数据、证书、签字数据包、用户协议等生成档案证据包;根据归档章、数字签名或数字信封技术对上述存档信息包、档案利用包、档案管理包、档案证据包进行固化存证,形成四包结构的归档档案,完成归档。
本发明实施例提供的一种基于四包结构单套制电子档案归档系统及处理装置完成了电子档案的快速、自动化归档,并形成了保留原件属性、具备证据效力、满足电子档案保存、管理、利用各环节所需的档案信息包结构,极大提高档案管理人员的工作效率、提高电子档案利用率、提升档案管理业务水平。
如图2所示,为本发明实施例提供了基于四包结构的单套制电子档案归档方法步骤流程示意框图,具体可包括:
电子档案文件可能来自不同的业务系统,可通过标准归档接口从异构业务系统、电子档案系统获取并处理电子文件及元数据,并从区块链存证中心获取并处理相关证据文件用于后续档案封包用,具体可采用如下方法:
首先,从异构系统、电子档案系统获取电子文件及元数据。具体地,通过标准归档接口从异构系统或电子档案系统获取电子文件及元数据,也可直接从接口约定的FTP(文件传送协议)文件下载地址获取电子文件,或将获取的元数据进行解析,从解析的元数据提供的FTP下载地址获取电子文件。
通过接口从归档配置模块获取归档配置文件。归档配置文件包括归档文件格式配置文件、元数据特殊字符配置文件、归档文件目录配置文件、归档元数据标准配置文件等。根据电子档案相关政策规范及标准,应以通用格式对电子档案进行归档保存,且对电子文件元数据特殊符号有限制要求,因此,可通过归档文件格式要求、元数据限制要求等,对获取的电子文件及元数据是否符合归档标准予以检测,并将不符合配置的归档标准要求的电子文件格式进行转换,对于符合标准的电子文件或配置文件中无格式要求时,保留电子文件原始格式。
此外,依据不同行业标准、不同企业、不同档案门类与不同归档范围要求,可通过归档文件目录配置文件根据约定的应归档文件目录、签字签章必要性等对归档目录是否符合标准进行检测;而归档元数据标准配置文件则对不同行业标准、不同档案门类、不同企业、不同档案门类的元数据著录项进行了定义,包括字段名、字段标识、字段编码、字段必要性、字段长度、字段数据类型等,可对实际归档的元数据著录项进行检测。
由于业务系统提交归档的元数据可能不完整或存在缺失、错漏,需要通过获取的电子文件捕获相关元数据,并对从业务系统获取的归档元数据进行更新补充,实现元数据智能补全、自动著录。
本实例性实施例通过获取文件基本属性信息,包括电子文件计算机名称、文件格式、文件大小、文件创建时间、文件修改时间、文件最后访问时间等,将获取的元数据更新至电子文件属性信息基本信息结构单元。在进行元数据更新时,若与传入的元数据信息不一致,则结束归档任务,将归档失败原因反馈业务系统或电子档案系统。
获取文件数字化属性信息,包括数字化形态、扫描分辨率、扫描色彩模式、图像压缩方案、数字化授权信息等,将获取的元数据更新至电子文件属性信息数字化属性结构单元。在进行元数据更新时,若与传入的元数据信息不一致,则结束归档任务,将归档失败原因反馈业务系统或电子档案系统。
根据文件ID从存证中心获取电子签名信息,包括签名类型、签名规则、签名时间、签名人、签名结果如签字图片或签章图片、签署前文件HASH、签署后文件HASH,若采用数字签名技术实现的电子签名,需采集证书、证书链、证书撤销序列等证书相关元数据,采用电子印章签字的,需采集印模相关信息及电子印章证书信息,其中,签名结果、数字证书等均以base64编码格式显示。将获取的元数据更新至电子文件属性信息电子签名信息结构单元,若与传入的元数据信息不一致或与电子文件签名域获取的信息不一致,则归档失败,结束归档任务,将归档失败原因反馈业务系统或电子档案系统。
为了确保归档电子档案真实、完整、可用、安全,进一步可加载四性检测模型及策略,对待归档电子文件及元数据进行四性检测。
具体地,在锁定待检测电子档案数据后,通过后台配置的各项归档标准配置文件、四性检测模型,逐一执行检测任务并反馈各项检测结果,所有检测项均检测通过方为四性检测通过。四性检测通过后可进入下一步进行归档打包;四性检测不通过时,向业务系统或电子档案系统反馈检测结果,归档封包任务结束。
优选地,调用电子签名签章验证接口对电子签名签章进行真实性、有效性验证、验证签名文件在签署过程中未被篡改等,采用支持全国可查可验的开放验证接口,解决了部分签章平台仅能局部验证、跨系统不可验证或不互认的缺陷。
根据电子文件及元数据、配置文件和证据文件生成EEP或ZIP格式存档信息包。存档信息封装包即利用标准的、与软硬件无关的XML语言将电子文件、证据文件与其元数据按照规范结构封装在一个数据包中,以维护电子文件与其元数据的完整性,并保障两者之间的可靠联系,实现电子文件自包含、自描述、自证明。
根据电子文件生命全周期存证数据、证书、签字数据包、用户协议等生成档案证据包,档案证据数据包括支持签名真实性验证的签名制作数据、用户协议等电子文件以及电子文件形成归档管理全生命周期的所有存证数据以构成电子档案的证据链闭环。具体步骤包括:根据档案ID、业务ID、文件ID获取相关证据文件和存证数据;根据存证数据生成XML证据文件;根据获取和生成的证据文件放入证据文件目录、编号,并根据证据文件命名规则进行命名,建立证据文件与原文的关联;将证据文件与关联更新至基本信息元数据,将证据文件与电子文件的关联更新至电子文件属性信息元数据,将管理过程证据文件更新至管理过程元数据。
将获取的证据文件及生成的存证证据文件通过元数据描述、文件命名等方式建立原文与证据的关联,将档案形成归档阶段的证据文件随存档信息包一并保存,进入长期保存阶段;在档案管理过程形成的证据文件形成证据包,待档案更新时,通过洋葱头结构进行封包。档案证据包的形成跟踪回溯了电子文件形成归档的全过程,确保电子档案来源可靠、程序规范、要素合规,并形成电子档案全生命周期证据链闭环,解决了归档电子文件具备凭证和法律效力问题。
完成档案四包结构封包后,对档案进行固化存证完成归档。根据配置要求,通过归档章或数字签名技术对存档信息包进行固化加密存证,通过数字签名或数字信封技术对利用信息包、管理信息包、档案证据包进行固化加密存证,完成后,向电子档案系统返回归档成功状态,并返回四包结构EEP或ZIP格式压缩信息包。
本发明实施例提供的单套制电子档案四包结构归档方法,根据长期保存需要生成保留文件原始性的存档信息包,根据共享利用需要生成支持多级利用的OFD格式档案利用包,根据归档前、后过程管理需要生成档案管理包,根据档案凭证属性生成用于支持验证、举证的档案证据包,满足了电子档案按归档后的保存、利用、管理和凭证等各方面用途,保证了电子档案的原始性、稳定性,并且极大提高了电子档案的利用率,满足电子档案全程过程监管与审计需要,同时维护了电子档案的凭证法律效力。
如图3所示为本申请示例性实施例所提供的存档信息包结构图,根据该结构进行存档信息包封包。
存档信息包包括:电子文件原件即WPS、PDF、JPG、OFD等格式的数字对象,在“电子文件”目录下以多层级文件子目录存放;用户协议、签字数据包、数字证书、存证信息等系列证据文件,存放于“证据文件”文目下;将元数据封装为“基本信息”、“过程信息”、“归档配置及电子文件属性信息”XML格式文件,存放于根目录下,用于描述电子档案;以上文件形成的文件夹以EEP或ZIP格式进行封包,并以档号命名。具体包括:
建立以档号或电子文件号命名的根目录,在根目录下建立“电子文件”子目录、“证据文件”子目录,用于分别存放电子文件数据对象、证据文件。
解析元数据电子文件目录信息,在“电子文件”目录下,根据归档配置要求生成各级子目录,如依据《政务服务事项电子文件归档规范》(DA/T 85)要求的“行政许可决定书”、“行政许可申请表”、“行政许可申请材料”等子目录。通过电子文件各级子目录对电子文件进行分组,能够直观对电子文件子件进行管理,包括缺失文件的快速确认,也便于快速查阅、以及分级利用设置。
将电子文件放入对应目录文件夹并依据“档案·顺序号”的方式对电子文件进行命名,顺序号为电子档案件内顺序号,通常为两位,如文书类档案档号为“Z101-BGS·2022·D30-000006”,则该档案第一个文件命名为“Z101-BGS·2022·D30-000006·01.OFD”。
将获取的证据文件放入对应目录文件夹并通过文件命名建立与原文的联系,具体包括,电子档案相关证据按“档号·ZJ·证据顺序号”的方式命名,与电子文件相关证据按“电子文件名·ZJ·证据顺序号”的方式命名,也即“档号·顺序号·ZJ·证据顺序号”,其中证据顺序号为每个证据关联对象下所有证据的编号。
将获取的电子文件基本信息、过程信息、归档配置及电子文件属性信息等元数据按配置要求封装为XML格式文件。
基本信息包括档案分类、聚合层次、档案馆名称、档案馆代码、全宗号、全宗单位、电子文件号、档号、年度、保管期限、责任者、归档日期、密级等基本信息,以及不同档案门类业务属性元数据,封装为“基本信息.XML”。
过程信息包括环节或阶段名称、处理或操作人、处理或操作部门、处理或操作时间、处理或操作结果、处理或操作信息系统、软硬件环境、对应业务流水号、对应存证事件ID、生成的证据文件ID及证据文件哈希等元数据,封装为“过程信息.XML”。电子档案进入长期保存阶段后,持续对后续管理过程进行跟踪记录,并在下一次更新档案信息时,将其补充进“过程信息.XML”。表1所示为管理过程信息元数据标准:
表1:过程信息元数据标准示意图
归档配置及电子文件属性信息包括归档配置信息、归档目录、基本属性、数字化属性、电子签名信息、证据信息等结构单元,封装为“归档配置及电子文件属性信息.XML”,根据不同档案门类,归档配置信息不同,若该档案门类没有“归档配置信息”元数据,则将归档目录、基本属性、数字化属性、电子签名信息、证据信息等结构单元,封装为“电子文件属性信息.XML”。
归档配置信息具体包括:归档事项或业务ID、名称、版本、容缺归档标记、归档目录要求以及是否必传、是否必签等扩展信息等;归档目录是根据实际归档文件组件目录信息包括根目录、子目录等,支持多级目录嵌套;通过获取的文件组件列表形成多级目录后,在各文件列表下依次生成电子文件属性结构单元,包括:基本属性、数字化属性、电子签名信息、证据信息结构单元。
电子文件基本属性,包括电子文件计算机名称、文件格式、文件大小、文件创建时间、文件修改时间、文件最后访问时间及文件形成软硬件环境等,封装为电子文件属性基本信息结构单元。
电子文件数字化属性,包括数字化形态、扫描分辨率、扫描色彩模式、图像压缩方案、数字化授权信息等,封装为电子文件属性数字化属性结构单元。
电子签名信息,包括签名类型、签名规则、签名时间、签名人、签名结果、文件摘要杂凑值、证书、证书链等,封装为电子文件属性电子签名信息结构单元。
证据信息,包括电子文件关联证据文件ID、关联证据文件哈希,电子文件相关存证ID、存证哈希以及关联存证信息文件ID等,补充在电子文件属性元数据中。
每个电子文件的电子签名信息元数据越丰富,其所附所含的证据力越强。通过电子签名元数据信息作为签署过程的描述,可与电子文件相互印证,作为档案凭证效力的支撑.本发明示例性实施例根据《文书类电子文件元数据方案》(DA/T46)中初步规定的电子签名元数据元素,对电子签名元数据信息进行了优化,具体电子签名信息元数据如表2所示:
表2:电子签名结构单元元数据
将封装形成的基本信息.XML、过程信息.XML、归档配置及电子文件属性信息.XML文件放于根目录,作为对电子档案的描述;采用标准的、与软硬件无关的XML语言将电子文件、证据文件与其元数据按照规范结构封装在一个数据包中,以维护电子文件与其元数据的完整性,并保障两者之间的可靠联系。
采用EEP封包或ZIP格式将形成的多级目录及电子文件、证据文件及元数据进行封包,并采用电子归档章或数字签名技术进行固化存证,最终形成存档信息包,保留了电子文件的原始凭证作用,实现电子文件自包含、自描述、自证明,完成了电子档案的快速、自动化归档,并形成了保留原件属性、具备证据效力、便于分级利用设置、且可用于电子档案长期保存的档案信息包结构。
图4所示为根据本申请示例性实施例所提供的洋葱头嵌套结构存档信息包结构图,当对电子档案文件进行增补或其他操作需对电子档案相关信息进行更新时,需采用洋葱结构对存档信息包进行封装,具体包括:
将本次节点前、上一次封装形成的存档信息包放入根目录;将本次归档节点新增的电子文件放入“电子文件”子目录下,并根据配置的归档文件目录放置于对应各级子目录中;将新增文件对应的证据文件放入“证据文件”子目录,并建立与原文的关联;将自上一节点至本次节点产生的存证数据以XML格式放入“证据文件”子目录,并建立与档案的关联;将本次节点产生的元数据补充封装形成新的“基本信息.XML”、“电子文件属性信息.XML”;将自上一节点至本次节点产生的过程信息(管理信息)补充封装至“过程信息.XML”,对新形成的文件结构进行EEP或ZIP格式封装;以此类推,形成类似洋葱结构的一层一层包裹原始归档信息的电子档案存档信息包。
洋葱头结构最里层是原始档案包,每次修订就在外面包裹一层,包裹信息为文件修订元数据、增补文件及证据文件按照存档信息包封包结构进行再封包,且每一层都用数字签名进行锁定,洋葱结构实现了原始档案的自包含,且每一层均可查验是否篡改。
图5所示为根据本申请示例性实施例所提供的档案利用包封包流程示意图,具体包括:
通过OFD文件转换工具将待归档电子文件、内容文件及元数据合并转换形成一份三层OFD文件,三层结构包括形式层、内容层、元数据层,其中形式层为可见层,保留原件可视形态,用于将来调阅、利用时的显示;内容层与元数据层为不可见层,用于描述和检索。
进一步地,将待归档电子文件按存档信息包封包结构的要求进行文件排序,调用格式转换接口将电子文件进行格式转换,并将该多个电子文件组合为一个OFD文件,形成三层OFD利用文件的形式层。通常,支持支持将Office(Doc、Docx、XLS、XLSX、PPT、PPTX)、WPS、PDF、TXT、PDF、CEB、SEP、GD、GW、图片、网页、邮件、TXT、PS、CAD等格式文件组合转换为OFD文件。
进一步地,通过OCR识别提取电子文件全文内容数据,生成XML格式内容文件,嵌入到OFD文件中,形成三层OFD利用文件的内容层。若识别的电子文件配置有识别字段规则,则可根据识别规则形成字段名、字段值描述组合形成内容数据。归档电子文件内容数据的抽取,可用于电子档案查询利用阶段的全文检索。
进一步地,将存档信息包中的基本信息.XML、过程信息.XML、归档配置及电子文件属性信息.XML合并为一个XML格式文件,嵌入到OFD文件中,形成三层OFD利用文件的元数据层。电子档案元数据的封装,既可用于电子档案的检索,也可使OFD文件作为完整电子档案格式不依赖于文件系统、数据库等运行环境独立存在。值得注意的是,采用XML嵌入替代OFD内嵌功能嵌套元数据,相较而言,XML格式更易于展示,且利于后期管理信息数据的增加和更新。
进一步地,对形成的三层OFD利用文件,根据配置通过数字水印接口在OFD文档中添加文本或图片水印。支持在指定页加入水印,支持水印平铺等,还可设置水印的字体、字号、颜色、透明度、显示位置、旋转角度、指定位置、页面范围、奇偶页、水印平铺等属性。
进一步地,通过数字签名或数字信封技术对生成的三层OFD利用文件实施固化加密存证,以实现档案利用包的防篡改。
档案利用包生成后,可在每一次借阅时,根据用户及用户权限,生成档案利用副本,具体实施步骤包括:
根据传入敏感信息,对OFD文件进行敏感信息遮盖。提供文档掩膜与关键字区域遮盖形式,可设置所遮盖内容的页码和区域的大小,支持文档内容关键字批量遮盖,实现敏感信息脱敏处理的同时实现段落级、关键词级分级利用。
进一步地,根据传入的页面参数,对OFD文件进行页面和页码处理。在指定位置插入页面或删除指定页面后,对页面处理后的文档的奇数页、偶数页、文档部分页或所有页面的页码进行重置,以满足不同页面不同内容的显示需求,实现页面级分级利用。
进一步地,根据传入的用户角色类型及权限参数,对OFD文件进行权限处理,同时设置文档阅读有效期。权限包括打印权限、打印次数、打开次数、另存、注释、导出、签名等,一旦定义了文档处理权限,则当打开OFD文件时将只有允许的操作权限。
进一步地,根据传入的参数包括借阅周期、借阅人信息等,通过动态水印接口,为生成的档案利用副本添加动态水印。
进一步地,通过通过数字签名或数字信封技术对生成的档案利用副本实施固化加密,沿用档案信息包的数字证书。
综上,本发明利用OFD容器功能实现电子档案利用包三层结构,形式层方便浏览借阅,通过内容层、元数据层提高电子档案检索及利用效率;通过敏感信息遮盖、文档页面处理及文档权限处理实现电子档案的分级分层利用,解决因部分信息敏感而造成整个档案不可公开利用的情况,扩大了电子档案的利用知悉范围;同时,通过数字水印、数字签名、数字信封等技术实现档案利用副本的有效监管,实现档案借阅的可控、可查,实现档案流出可溯源、篡改可发现、副本可收回等,从一定程度上解决了电子文件流出不可控的情况。
图6所示为本发明档案证据包的形成及关联证据映射关系图。档案证据数据包括支持签名真实性验证的签名制作数据、用户协议等电子文件以及电子文件形成归档管理全生命周期的所有存证数据以构成电子档案的证据链闭环。其中,用户协议等保持电子文件原文,存证数据以UTF-8编码格式存为XML文件,并建立证据与原文的关联映射,包括:
基本信息、过程信息与存证中心提取的证据包进行证据关联;电子文件属性信息与证据包进行证据关联,证据包包括:签字位RA用户协议、授权协议、制作数据、各环节数据存证、档案存证、业务存证、行为存证,基本信息包括:档号、全宗号、关联证据(关联证据文件ID、文件哈希、存证ID),过程信息包括:环节(环节名称、处理人、处理时间、关联证据(关联证据ID、关联证据文件哈希、关联证据存证ID))。
根据档案ID、业务ID、文件ID获取相关证据文件和存证数据。根据传入的业务ID、档号、文件ID等,通过证据提取接口,从存证中心获取对应业务、档案、文件相关的存证数据,解析电子文件签名域信息,获取以及签署电子文件中各签字位对应的签署证据文件,并将获取的存证数据根据存证ID去重。
将去重后的存证数据参照《政务服务事项电子出证文件归档规范》(GB/T 42727-2023)要求生成XML格式的证据文件,参考以下示例:
通过证据文件命名及文件存放目录建立原文与证据文件的关联。
优选地,可通过证据文件命名建立电子文件原文与证据文件的映射关联关系,命名规则如下:
A.与档案相关的证据,如业务办理过程存证数据、电子档案归档管理存证数据等,按ArchiveID·zj·XX.XML的格式命名等,其中XX为ArchiveID下证据的顺序号;
B.与数字对象相关的证据,如签字数据包、签章相关用协议等,按ObjectID·zj·XX.XML的格式命名等,其中XX为ObjectID下证据的顺序号。
通过元数据描述建立元数据、原文与证据文件的关联,,具体包括:
A.与档案相关的证据,在基本信息中以数组形式写入基本信息.XML;与管理过程相关的证据,以每个环节节点的要素写入过程信息.XML,
B.与数字对象相关的证据,以数组形式写入电子文件属性信息.XML中的文件列表;与数字对象中签名相关的证据,以数组形式写入电子文件属性信息.XML中的电子签名信息。
将获取的证据文件及生成的存证证据文件通过元数据描述、文件命名等方式建立原文与证据的关联,将档案形成归档阶段的证据文件随存档信息包一并保存,进入长期保存阶段;在档案管理过程形成的证据文件形成证据包,待档案更新时,通过洋葱头结构进行封包。
综述,档案证据包的形成跟踪回溯了电子文件形成归档的全过程,确保电子档案来源可靠、程序规范、要素合规,并形成电子档案全生命周期证据链闭环,解决了归档电子文件具备凭证和法律效力问题。
综述,以上对本发明所提供的一种单套制电子档案四包结构归档方法、系统、设备及介质进行了详细介绍。本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想。应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以对本公开进行若干改进和修饰,这些改进和修饰也落入本公开权利要求的保护范围内。
Claims (14)
1.基于四包结构的单套制电子档案归档系统,其特征在于,包括:数据捕获模块、格式转换模块、证据提取模块、归档配置模块、档案封包模块,其中,数据捕获模块,用于获取并解析、补齐待归档电子文件及元数据;格式转换模块,用于将电子文件转换为符合归档规范要求的格式;证据提取模块,用于提取证据数据生成证据文件并形成与原文的关联;归档配置模块,用于配置归档标准与封包规则;档案封包模块,用于根据配置的封包规则生成四包结构的归档档案信息包,并通过数字签名固化存证完成归档。
2.根据权利要求1所述的单套制电子档案归档系统,其特征在于,所述生成四包结构的归档档案信息包包括:根据电子文件、证据文件及元数据按照配置文件要求生成洋葱结构的EEP或ZIP格式存档信息包;根据电子文件、内容文件及元数据生成OFD格式档案利用包;根据管理过程信息元数据及证据文件生成XML格式档案管理包;根据电子文件全生命周期存证数据、证书、签字数据包、用户协议生成档案证据包。
3.根据权利要求1或2所述的单套制电子档案归档系统,其特征在于,归档配置模块包括归档标准配置与封包规则配置,归档标准配置包括配置归档文件格式、元数据特殊字符,根据不同档案门类、不同立档单位配置归档范围、归档文件目录、归档元数据标准;封包规则包括元数据XML封装规则、存档信息包目录生成规则、档号及文件命名规则,通过封包规则配置文件与内置规则支撑档案封包模块。
4.根据权利要求1所述的单套制电子档案归档系统,其特征在于,证据提取模块根据业务ID、文件ID和档案ID从存证中心提取电子签名信息、证据文件、存证数据,并建立证据与原文的关联,具体包括:电子签名信息作为文件签署直接证据描述信息补齐元数据,根据文件ID获取签署文件签名制作数据、用户协议、授权协议,在元数据中建立证据文件与原文件的关联;通过文件ID获取签署过程的存证信息生成证据文件XML,并在元数据中建立证据文件与原文件的关联;根据业务ID、档案ID获取对电子档案相关操作的存证信息,并在元数据中建立证据与档案的关联。
5.根据权利要求2所述的单套制电子档案归档系统,其特征在于,生成EEP或ZIP格式的存档信息包包括:建立以档号或电子文件号命名的根目录,在根目录下建立“电子文件”子目录、“证据文件”子目录,解析元数据电子文件目录信息,在“电子文件”目录下,根据归档配置要求生成各级子目录,将获取的电子文件放入对应目录文件夹并依据“档案·顺序号”方式对电子文件命名;将证据文件放入对应目录文件夹并通过文件命名建立与原文的联系,与档案相关的证据文件按“档号·ZJ·证据顺序号”方式命名,与电子文件相关的证据文件按“电子文件名·ZJ·证据顺序号”的方式命名;将元数据封装为基本信息、过程信息、归档配置及电子文件属性信息等元数据XML,放入根目录,采用EEP或ZIP封包方式对电子档案进行封包,形成存档信息包。
6.根据权利要求5所述的单套制电子档案归档系统,其特征在于,将元数据封装为基本信息、过程信息、归档配置及电子文件属性信息等元数据XML包括:将获取的元数据根据归档元数据标准,封装为基本信息、过程信息、归档配置及电子文件属性信息等元数据XML,放入根目录,具体包括:将基本信息及不同档案门类业务属性元数据,封装构成“基本信息.XML”;包括归档配置信息、归档目录、基本属性、数字化属性、电子签名信息、证据信息等结构单元封装构成“归档配置及电子文件属性信息.XML”;若档案门类没有“归档配置信息”元数据,则将归档目录、基本属性、数字化属性、电子签名信息、证据信息等结构单元,封装为“电子文件属性信息.XML”;包括业务阶段信息、操作人信息、操作时间信息、操作事件信息、操作主体所属单位、所属部门等扩展信息封装构成“过程信息.XML”。
7.根据权利要求6所述的单套制电子档案归档系统,其特征在于,电子文件属性信息中包含的签名类型、签名规则、签名时间、签名人、签名结果、文件摘要杂凑值、证书、证书链、证书撤销序列、印章颁发机构封装为电子文件属性信息中的“电子签名信息”结构单元。
8.根据权利要求2所述的单套制电子档案归档系统,其特征在于,根据电子文件全生命周期存证数据、证书、签字数据包、用户协议生成档案证据包包括:通过签署文件ID获取原始证据文件,所述证据文件包括:签名制作数据、印章图样、数字证书、用户授权协议;根据档案ID、业务ID、签署文件ID获取电子档案归档全生命周期存证数据,将存证数据生成XML证据文件;建立证据文件与电子文件的关联,将关联更新至基础信息元数据、电子文件属性信息元数据和管理过程元数据。
9.根据权利要求2、5、8其中之一所述的单套制电子档案归档系统,其特征在于,所述生成OFD档案利用包包括:将待归档电子文件按文件顺序号排列合并为一个OFD版式文件,提取电子文件内容数据生成XML格式文件,嵌入到OFD版式文件中,将电子文件基本信息、过程信息、归档配置及电子文件属性信息元数据合并XML格式文件嵌入到OFD文件中;对生成的OFD版式文件固化加密存证。
10.根据权利要求2、5、8其中之一所述的单套制电子档案归档系统,其特征在于,所述生成XML格式档案管理包包括:根据业务归档接口提交的元数据解析获得档案形成归档阶段过程信息,根据业务ID、存证类型获取业务存证数据,根据业务阶段信息、操作人信息、操作时间信息、操作事件信息、操作主体信息更新补充档案管理过程信息,将归档阶段过程信息封装为XML并以“档号-过程信息”命名,归档后利用阶段产生的过程信息封装为XML,并以“档号-管理信息”命名,形成档案管理包;将本次归档时间与上一次归档时间之间产生的管理过程信息封装为过程信息.XML,并以洋葱结构封装进存档信息包。
11.一种基于四包结构的单套制电子档案归档方法,其特征在于,采用如权利要求1~10任一项所述的单套制电子档案归档系统实现。
12.根据权利要求11所述的方法,其特征在于,数据捕获模块从异构业务系统、电子档案系统获取并处理电子文件、元数据,从存证中心获取证据文件,具体包括:通过标准接口或FTP文件下载地址获取待归档电子文件,捕获其元数据,通过接口获取归档标准配置文件及封包规则配置文件;通过标准接口获取电子签名信息、证据文件及存证数据,补齐电子签名信息元数据、生成存证证据文件XML。
13.一种电子设备,包括:处理器;以及存储程序的存储器,其中,所述程序包括指令,所述指令在由所述处理器执行时使所述处理器执行根据权利要求11所述的基于四包结构的单套制电子档案归档方法。
14.一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行根据权利要求11所述的基于四包结构的单套制电子档案归档方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311626560.3A CN117632855A (zh) | 2023-11-30 | 2023-11-30 | 一种基于四包结构的单套制电子档案归档系统、方法、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311626560.3A CN117632855A (zh) | 2023-11-30 | 2023-11-30 | 一种基于四包结构的单套制电子档案归档系统、方法、设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117632855A true CN117632855A (zh) | 2024-03-01 |
Family
ID=90030011
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311626560.3A Pending CN117632855A (zh) | 2023-11-30 | 2023-11-30 | 一种基于四包结构的单套制电子档案归档系统、方法、设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117632855A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117875299A (zh) * | 2024-03-13 | 2024-04-12 | 南京智握信息技术有限公司 | 一种电子档案集成处理方法及系统 |
-
2023
- 2023-11-30 CN CN202311626560.3A patent/CN117632855A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117875299A (zh) * | 2024-03-13 | 2024-04-12 | 南京智握信息技术有限公司 | 一种电子档案集成处理方法及系统 |
CN117875299B (zh) * | 2024-03-13 | 2024-05-24 | 南京智握信息技术有限公司 | 一种电子档案集成处理方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106874461B (zh) | 一种工作流引擎支持多数据源配置安全访问系统及方法 | |
US11063744B2 (en) | Document flow tracking using blockchain | |
US11356268B2 (en) | Digital composition hashing | |
US6796489B2 (en) | Processing electronic documents with embedded digital signatures | |
US20020019937A1 (en) | Secure document transport process | |
US8078880B2 (en) | Portable personal identity information | |
JP5103243B2 (ja) | 書類画像を認証するサーバーシステム及び方法 | |
WO2001095078A1 (en) | Creating and verifying electronic documents | |
CN115982764A (zh) | 基于区块链存证电子档案的方法、系统、设备及介质 | |
CN117632855A (zh) | 一种基于四包结构的单套制电子档案归档系统、方法、设备及存储介质 | |
CN111445238A (zh) | 一种基于区块链的电子存证系统 | |
WO2017053404A1 (en) | Security application for data security formatting, tagging and control | |
CN102024002A (zh) | 一种电子文件归档的安全存储方法及系统 | |
CN106294810A (zh) | 一种企业产品数据归档的系统和方法 | |
CN113704708A (zh) | 基于浏览器对文档在线预览加水印的方法及系统 | |
CN112100685A (zh) | 一种检验检测电子报告的加密与防篡改处理方法 | |
CN112487490A (zh) | 篡改识别方法、设备和介质 | |
CN114416638A (zh) | 一种电子文件自动归档方法及系统 | |
CN108171639A (zh) | 基于警务综合平台的电子案卷应用方法 | |
US20070013961A1 (en) | Original document verification system and method in an electronic document transaction | |
CN113342743A (zh) | 一种基于联盟链区块链底层的电子档案数据交互的方法 | |
CN114417425B (zh) | 一种基于OAuth的文档安全预览及溯源方法 | |
CN115796764A (zh) | 一种基于区块链和ipfs的贷款档案管理方法、系统及终端 | |
JP3979049B2 (ja) | ハイパーメディアドキュメントの提示方法、ブラウザ装置およびハイパーメディアドキュメント作成支援装置 | |
CN111784339A (zh) | 一种基于区块链的商品房项目证照文件防伪存证方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |