CN117390696A - 电子档案的完整性检测系统、方法、设备及介质 - Google Patents
电子档案的完整性检测系统、方法、设备及介质 Download PDFInfo
- Publication number
- CN117390696A CN117390696A CN202311399461.6A CN202311399461A CN117390696A CN 117390696 A CN117390696 A CN 117390696A CN 202311399461 A CN202311399461 A CN 202311399461A CN 117390696 A CN117390696 A CN 117390696A
- Authority
- CN
- China
- Prior art keywords
- file
- electronic
- integrity
- archive
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 259
- 238000000034 method Methods 0.000 title claims abstract description 141
- 230000008569 process Effects 0.000 claims abstract description 110
- 238000007405 data analysis Methods 0.000 claims abstract description 8
- 238000009877 rendering Methods 0.000 claims abstract description 7
- 239000000463 material Substances 0.000 claims description 39
- 238000012545 processing Methods 0.000 claims description 25
- 238000012216 screening Methods 0.000 claims description 10
- 238000012546 transfer Methods 0.000 claims description 10
- 230000008859 change Effects 0.000 claims description 8
- 238000004458 analytical method Methods 0.000 claims description 5
- 238000000605 extraction Methods 0.000 claims description 4
- 238000001914 filtration Methods 0.000 claims description 4
- 210000003462 vein Anatomy 0.000 claims description 3
- 230000015572 biosynthetic process Effects 0.000 claims description 2
- 238000010586 diagram Methods 0.000 description 9
- 238000004590 computer program Methods 0.000 description 7
- 238000012795 verification Methods 0.000 description 7
- 238000005516 engineering process Methods 0.000 description 5
- 238000004891 communication Methods 0.000 description 4
- 238000009825 accumulation Methods 0.000 description 3
- 238000013475 authorization Methods 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 238000007689 inspection Methods 0.000 description 3
- 238000011895 specific detection Methods 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 2
- 230000007547 defect Effects 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000000007 visual effect Effects 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000000712 assembly Effects 0.000 description 1
- 238000000429 assembly Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000010267 cellular communication Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000006837 decompression Effects 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 239000006185 dispersion Substances 0.000 description 1
- 238000010348 incorporation Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000012552 review Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/60—Protecting data
- G06F21/64—Protecting data integrity, e.g. using checksums, certificates or signatures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/10—File systems; File servers
- G06F16/13—File access structures, e.g. distributed indices
- G06F16/137—Hash-based
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/10—File systems; File servers
- G06F16/16—File or folder operations, e.g. details of user interfaces specifically adapted to file systems
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Computer Security & Cryptography (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Bioethics (AREA)
- Software Systems (AREA)
- Computer Hardware Design (AREA)
- Human Computer Interaction (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请公开一种电子档案的完整性检测系统,档案数据接收模块接收电子档案文件数据;数据解析单元解析待检测电子档案文件数据,策略加载单元调用配置中心完整性规则配置模块加载完整性检测策略,检测执行单元通过存证中心回溯存证数据验证电子文件的完整性、过程元数据完整性,通过电子签名、签署数据、关联数据检测电子档案证据数据的完整性,通过归档标准配置检测档案信息包完整性、电子文件内容完整性、元数据完整性;检测结果反馈单元汇总各项完整性检测结果,检测报告生成模块进行数据渲染,结构化嵌入到检测报告中。本发明从内容、结构、背景信息、元数据和证据性多方面检测电子档案的完整性,确保归档电子文件的完整性与可靠性。
Description
技术领域
本发明涉及电子档案的自动化检测技术领域,具体来说,是一种应用于电子档案的完整性检测的方法及系统。
背景技术
随着计算机信息技术、网络技术的迅猛发展,使得办公自动化系统、信息化系统、电子政务等在政府部门、企事业单位管理工作各个领域得到广泛应用,电子档案日益成为信息记录、传输、交换、利用与共享的主流方式,单套制电子档案归档管理已是必然趋势。
真实性、完整性、可用性和安全性是确保电子档案性质的重要属性,因此,采用技术手段对电子档案的真实性、完整性、可用性和安全性进行技术检测,是单套制电子档案归档管理的重要步骤和基本保障。
国家档案局正式发布的《文书类电子档案检测一般要求》(DA/T 70—2018),为开展电子档案四性检测提供了技术规范和指导。现有电子档案系统基本都依据该规范提供了相应的四性检测功能,但在实操过程中,归档电子档案的真实性、可靠性、完整性等离实际需求仍有一定的距离。
公开号:CN113688300A,名称“一种电子档案四性检测实现的方法”,强调将四性检测“工具化”并内嵌至档案系统中,解压待检测电子档案数据包,使用四性检测工具进行检测,检测完成后自动生成检测报告。
公开号:CN116304263A,名称“一种应用于电子档案系统的四性检测方法及系统”,强调针对电子档案不同检测环节(即电子档案不同阶段),依据不同目标检测方案进行四性检测,最终汇总形成四性检测报告。
以上技术以及现有电子档案系统,在进行“完整性”检测时普遍是基于对业务系统的信任,基于电子文件提交归档时点,检测业务系统提交的数据与业务系统在提交时所描述的数据是否相符,并未从电子文件形成过程开始追溯,尤其在一些信息化系统自动归档场景,无法从根本上确保提交归档的业务数据是否完整。
电子档案完整性是指电子文件的内容、结构、背景信息和元数据等完整无缺损。档案记录是一系列事件或行为,缺少记录的档案是不完整、不可靠的。例如在公文收发流转过程中,记录了大量的背景信息,包括收文流传过程中的领导批示、意见处理情况、流转人签名等,发文过程中的拟稿、核稿、会签、签发、排版等。由于业务系统的异构性、存储分散以及存在跨系统数据流转等情况,电子文件经常处于流动或离散状态, 伴随着处理过程的不断累加,一些电子文件或过程文件可能还未到最后提交归档环节就已经丢失,或因搞不清楚电子文件的来龙去脉,而在提交业务数据归档时出现缺失、遗漏或找不到相关文件的情况,容易造成过程信息的丢失,无法确保业务系统最终提交归档的电子文件的完整性与可靠性。
更为重要的一方面,传统电子档案系统因无法对签署电子文件电子签名信息进行真实性、完整性检测,出于技术的限制而不得不在归档时将电子签名信息转为图片归档,使得电子文件失去原件属性、缺乏证据效力,使得电子档案查考凭证效力存在瑕疵。
发明内容
有鉴于此,基于本申请的一方面,提出一种电子档案的完整性检测系统,包括:档案数据接收模块、完整性规则配置模块、完整性检测模块、检测报告生成模块,其中,完整性检测模块包括:数据解析单元、策略加载单元、检测执行单元、检测结果反馈单元,档案数据接收模块接收电子档案文件数据;数据解析单元解析待检测电子档案文件数据,策略加载单元调用配置中心完整性规则配置模块加载完整性检测策略,检测执行单元通过存证中心回溯存证数据验证电子文件及元数据过程背景完整性,通过电子签名、签署数据、关联数据检测电子档案证据数据的完整性,通过归档标准配置检测档案信息包完整性、电子文件内容完整性、元数据完整性;检测结果反馈单元汇总各项完整性检测结果,检测报告生成模块进行数据渲染,结构化嵌入到检测报告中。
进一步优选,完整性规则配置模块为归档标准配置全树模型,以全宗为单位建立档案分类标准,分类支持多层级结构,形成全树模型,其中,根据档案不同门类、业务、事项建立不同标准构建分类架构形成树干;根据组件规则形成电子档案目录构建文件目录形成树叶,根据包括电子文件、证据文件、元数据提取信息的归档数据要素形成叶脉,构建归档标准配置全树模型。
进一步优选,完整性规则配置模块包括:档案分类配置单元、归档信息包结构标准配置单元、电子文件模板标准配置单元、元数据著录标准配置单元、完整性检测策略配置单元,档案分类配置单元针对每个归档文件目录配置必要性属性和签署必要性属性、配置关联文件模板ID, 配置完成后形成XML格式的归档材料范围配置文件;电子文件模板标准配置单元通过模板配置固定样式的文件,生成完整性检测标准,元数据著录标准配置单元依据DA/T 46标准配置元数据完整著录项、必填著录项,设置元数据编码、元数据名称、必要性,结合检测标准生成XML格式的元数据配置文件;完整性检测策略配置单元,根据不同档案分类、阶段设置不同的完整性检测执行标准。
进一步优选,数据解析单元解析待检测电子档案数据包括,在电子档案形成归档阶段,依次计算获取的电子文件哈希值及元数据json字符串的MD5值,调取存证中心对应电子文件哈希值及json字符串MD5值逐一比对并进行解析,比对通过后,解析json字符串获得待检测电子文件及元数据结构体;形成归档文件后各阶段,通过数据交换方式获取档案信息包,计算档案总包哈希值,通过存证ID调取对应存证数据哈希值与总包哈希值进行一致性比对,解压档案总包形成单档案信息包序列;通过档案ID调取存证中心对应档案信息包哈希值与单档案信息包哈希值逐一比对,解压单档案信息包,依次计算文件哈希值并与存证数据中文件哈希值逐一比对,逐级解压档案信息包、解析XML格式元数据文件,获得待检测电子文件及元数据结构体。
进一步优选,所述通过存证数据验证电子文件及元数据过程背景完整性包括通过存证数据验证签署文件过程完整性、业务过程完整性以及元数据过程完整性,通过签署文件查找签署前文件ID(prevFileId)、签署前文件哈希值(prevFileHash)回溯原文,通过prevFileId查找对应电子文件,计算哈希值与对应的prevFileHash进行一致性比对,通过签名域信息计算原文哈希与存证中心prevFileHash进行一致性比对,回溯完整签署过程确认电子文件签署过程完整;通过业务ID从存证中心获取所有业务存证数据,解析获得文件清单,通过填写前文件ID(signPlaceFieldId)筛查同一电子文件填写变化过程存证的文件ID,并保留最后一个文件,通过prevFileId筛查同一电子文件签署变化过程存证的文件ID,并保留最后一个文件,通过最终获得的电子文件序列ID和对应文件哈希值,与待检测电子文件序列ID和对应文件哈希值进行逐一比对,检测确认电子文件形成业务过程完整性;通过解析签署过程信息元数据,比对存证中心业务阶段信息与待检测电子文件元数据的业务阶段信息的一致性,逐一比对各阶段操作人或处理人信息、操作时间或处理时间信息、处理意见、处理部门信息的一致性,以检测过程元数据的完整性。
进一步优选,档案数据接收模块接收获取检测参数、取待检测数据,接收获取的检测参数包括:档案分类、事件或业务类型、归档文件所处阶段、数据过滤条件,获取的待检测数据结构包括:未完成归档前的散列文件列表及元数据json字符串,形成归档后的ZIP或EEP格式档案信息包,解压单档案信息包获得电子文件及元数据描述XML格式文件,解析XML文件、元数据json字符串,获取元数据结构体包括基本信息、过程信息、归档配置信息、电子文件组件信息、电子文件属性信息。
基于本发明第二方面,提出一种电子档案的完整性检测方法,获取并解析电子档案数据,加载四性检测模型完整性检测策略;通过存证数据检测电子文件及元数据归档过程、背景信息的完整性,通过电子签名、签署证据数据、关联证据数据检测证据数据的完整性;通过归档标准配置检测电子档案数据信息包内容结构、电子文件内容、元数据完整性;汇总返回各项完整性检测结果并数据渲染,结构化嵌入到检测报告中。
进一步优选,档案分类配置单元针对每个归档文件目录配置必要性属性和签署必要性属性、配置关联文件模板ID, 配置完成后形成XML格式的归档材料范围配置文件;电子文件模板标准配置单元通过模板配置固定样式的文件,生成完整性检测标准,元数据著录标准配置单元依据DA/T 46标准配置元数据完整著录项、必填著录项,设置元数据编码、元数据名称、必要性,结合检测标准生成XML格式的元数据配置文件;完整性检测策略配置单元,根据不同档案分类、阶段设置不同的完整性检测执行标准。
进一步优选,数据解析单元解析待检测电子档案数据包括,在电子档案形成归档阶段,依次计算电子文件哈希值及元数据json字符串的MD5值,获取元数据结构体,调取存证中心文件ID逐一比对并进行解析,形成归档文件后,通过数据交换方式获取档案信息包,计算档案总包哈希值,通过存证ID调取对应存证数据哈希值与总包哈希值进行一致性比对,解压档案总包形成单档案信息包序列;通过档案ID调取存证中心对应档案信息包哈希值与单档案信息包哈希值逐一比对,解压单档案信息包,依次计算文件哈希值并与存证数据中文件哈希值逐一比对,逐级解压档案信息包、解析XML格式元数据文件和json字符串,获得待检测电子文件及元数据。
进一步优选,所述通过存证数据验证电子文件及元数据过程背景完整性包括,通过签署文件查找签署前文件prevFileId、prevFileHash回溯原文,通过prevFileId查找对应电子文件,计算哈希值与对应的prevFileHash进行一致性比对,通过签名域信息计算原文哈希与存证中心prevFileHash进行一致性比对,回溯完整签署过程确认电子文件签署过程完整;通过业务ID从存证中心获取所有业务存证数据,解析获得文件清单,通过signPlaceFieldId筛查同一电子文件填写变化过程存证的文件ID,并保留最后一个文件,通过prevFileId筛查同一电子文件签署变化过程存证的文件ID,并保留最后一个文件,通过最终获得的电子文件序列ID和对应文件哈希值,与待检测电子文件序列ID和对应文件哈希值进行逐一比对,检测确认电子文件形成业务过程完整性;通过解析签署过程信息元数据,比对存证中心业务阶段信息与待检测电子文件元数据的业务阶段信息的一致性,逐一比对各阶段操作人或处理人信息、操作时间或处理时间信息、处理意见、处理部门信息的一致性,以检测过程元数据的完整性。
进一步优选,通过电子签名、签署数据、关联数据检测证据数据的完整性包括,根据文件ID从存证中心获取电子签名信息,提取签名类型、签名规则、签名时间、签名人、签名结果、证书、证书链、证书撤销序列、签名算法标识以及电子印章相关信息,与从归档文件签名域提取签名人、签名时间、证书信息进行一致性比对验证电子签名的完整性,与从单电子档案和/或档案信息包解析的电子签名信息结构体进行一致性比对,确认电子签名元数据的完整性;检测电子文件各签名域,根据元数据描述中各签名域对应证据文件ID及哈希值与归档的证据文件ID及哈希值逐一比对,根据元数据描述中各电子文件对应的关联证据ID及哈希值与归档的证据文件ID及哈希值逐比对验证电子文件关联证据信息完整性;解析单档案信息包中以XML格式存放的元数据描述信息,获取各签名域对应的关联证据文件ID及哈希值、待检测文件对应的关联证据文件ID及哈希值、单档案对应的关联文件ID及哈希值,证据文件夹中证据文件ID及哈希值,逐一比对检测归档信息包证据文件完整性。
进一步优选,通过归档标准配置检测电子档案数据信息包内容结构、电子文件内容、元数据完整性包括:解析信息包中“说明文件.XML”,获得归档移交总件数字段值、总字节数字段值,与待检测电子档案数量、电子文件总字节数一致性比对,获取智能表单中记录的总件数字段值、总字节数字段值,与待检测电子档案数量、电子文件总字节数一致性比对,检测信息包内容结构完整性;根据批量提交数据或单一档案信息包解析单个档案信息包中“基本信息.XML”,获得子文件数字段值、总页数字段值,检测电子文件总文件数量、电子文件总页数与元数据中或记录中描述的文件数一致性比对,检测总字节数是否相符性;从配置中心获取“归档范围标准配置文件.XML”进行解析,获取属性为“必填”的应归档文件目录,解析待检测电子档案元数据中的电子文件组件目录,与应归档文件目录进行逐一匹配,检测归档范围完整性;从配置中心获取“归档范围标准配置文件.XML”并进行解析,从配置中心获取属性为“必填”的应归档文件目录,回溯归档电子文件存放相对路径得到归档目录结构;从根目录开始逐级往下匹配,直至匹配完应归档目录,检测归档信息包结构完整性;从批量移交信息包中获取以XML格式存放的元数据说明文件,从单档案信息包中获取以XML格式存放的元数据说明文件,解析出字段包含有基础信息结构体、过程信息结构体、电子文件属性信息结构体、归档电子文件子件描述信息,检测单档案信息包与批量移交信息包的一致性、归档电子文件及其目录结构与元数据描述中的文件及其目录结构的一致性,检测归档信息包元数据描述完整性;通过电子文件模板及要素配置,识别检测电子文件所含指定位置内容信息、关键词信息、图形图像信息、电子签名信息以及链接附件信息是否完整检测电子文件内容完整性。
进一步优选,通过归档标准配置检测电子文件内容数据完整性,根据模板配置的控件坐标及填写属性配置,通过OCR识别电子文件对应控件是否完成内容填写,根据模板配置的关键词及必要性配置,通过OCR识别电子文件对应关键词要素是否完整;根据模板配置的关键词、内容识别坐标配置及必要性配置,通过OCR识别电子文件对应关键词对应内容信息要素是否完整;根据模板配置的识别坐标区域及图像要素配置,通过图像识别匹配检测对应图像元数是否完整;对待检测电子文件全文检索链接标签,计算其哈希值与待检测电子文件进行匹配,检索对应附件名称,与待检测电子文件进行文件名称模糊匹配,检测电子文件附件数据完整性;通过归档标准配置中的元数据著录项、元数据必填项、元数据连续性检测项以及电子签名、数字化属性著录要求,对待检测数据中解析的元数据进行完整性检测;依据配置的元数据著录标准中的关键措辞信息配置,检测过程信息结构体元数据中的关键流程信息描述检测元数据项完整性;依据配置的电子文件签名要素配置、容缺归档配置,检测归档电子文件属性除基础信息元数据以外,是否包含电子签名信息或数字化属性信息等元数据描述检测子文件属性信息完整性。
根据本申请另一方面,提供一种电子设备,包括:处理器;以及存储程序的存储器,其中,所述程序包括指令,所述指令在由所述处理器执行时使所述处理器执行上面所述的电子档案的完整性检测方法。
根据本申请另一方面,提供一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行根据上面任一项所述的电子档案的完整性检测方法。
本发明通过存证数据回溯还原电子文件签署形成过程,通过业务存证回溯业务文件形成提交过程,通过存证数据与过程元数据的一致性检测及证据与文件的一致性检测确认电子文件过程及背景信息的完整性,确保电子文件内容、结构及元数据的完整性,解决了现有的电子档案完整性检测只能基于时点、单一、不全面的情况,提供了一种覆盖电子档案全生命周期的可验证过程、背景信息的完整性检测方法。从根本上解决了电子档案完整、可靠性检测问题。
通过归档材料范围、归档电子文件要素、元数据著录标准等归档标准配置检测,解决了电子档案对象结构、电子文件内容和元数据的完整性检测问题。电子档案的完整性不仅仅是档案资源收集齐全的形式要求,更是内容管理的质量要求。通过归档标准配置检测实现了档案业务属性本身对资源完整性、关联完整性的具体要求。
通过证据文件完整性检测、电子签名元数据完整性检测等,通过技术手段降低档案对软硬件依赖的同时,使得归档电子文件具备自验证、自包含及证据效力,使得电子文件得已保留其原件属性,解决了传统电子档案系统因无法对电子签名信息进行真实性、完整性检测不得不将电子签名信息转为图片归档而使电子文件丧失原件属性的极大弊端。
因此,本发明提供的应用于电子档案的完整性检测系统和方法,不依赖于对业务系统的信任,不再仅仅基于电子文件提交归档时点,检测业务系统提交的数据与业务系统在提交时所描述的数据是否相符,而是从电子文件形成过程开始追溯,实现了从内容、结构、背景信息、元数据和证据性多方面检测电子档案的完整性,确保归档电子文件的完整性与可靠性。
附图说明
图1所示为本示例性实施例中电子档案完整性检测系统关系图;
图2所示为本示例性实施例中归档标准配置的整体架构(全树模型)示意图。
图3所示为本示例性实施例中电子档案完整性检测流程示意图;
图4所示为本示例性实施例中业务过程文件存证验证逻辑示意图;
图5所示为根据本申请示例性实施例的电子设备结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明技术方案进行清楚、完整的描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本申请示例性实施例针对电子档案四性检测之一的完整性检测,适用于电子档案各阶段,从电子文件内容、结构、背景信息、元数据和证据性全方位进行电子档案完整性检测。
如图1所示,本申请示例性实施例提供一种应用于电子档案的完整性检测系统,包括:档案数据接收模块、完整性规则配置模块、完整性检测模块、检测报告生成模块。其中,完整性检测模块包括:数据解析单元、策略加载单元、检测执行单元、检测结果反馈单元,档案数据接收模块获取待检测电子档案文件数据送人完整性监测模块;数据解析单元解析待检测电子档案文件数据,策略加载单元调用配置中心完整性规则配置模块加载四性检测模型完整性检测策略,检测执行单元通过存证数据验证电子文件的完整性、可靠性、证据完整性,通过归档标准配置检测档案信息包完整性、电子文件内容完整性、元数据完整性;检测结果反馈单元汇总返回各项完整性检测结果。
其中,完整性规则配置模块包括,档案分类配置单元、归档信息包结构标准配置单元、电子文件模板标准配置单元、元数据著录标准配置单元、完整性检测策略配置单元,形成归档标准配置全树模型。
如图2所示为本示例性实施例中归档标准配置的整体架构(全树模型)示意图。通过规则配置提供完整性检测执行标准,进而完成依据《文书类电子档案检测一般要求》(DA/T 70)要求的完整性检测的具体检测项。
档案分类配置单元在配置中心以全宗为单位建立档案分类标准,分类支持多层级结构,形成树状枝干。以全宗为单位建立档案分类标准,根据档案不同门类、业务、事项建立不同标准构建分类架构作为树干;根据组件规则形成电子档案目录构建文件目录作为树叶,其中,文件目录中包括卷宗(包含文件及子件)、文件(组合件或单件),文档作为最小单元(包括申请表、申请材料、审批处理单、电子证据、文件正文、附件、文件处理单、修改稿…);根据包括电子文件、证据文件、元数据提取信息的归档数据要素形成的数据作为叶脉,其中,电子文件包括:背景、内容、结构,证据文件包括:电子签名制作数据、视频认证辅助证据、业务存证记录、用户授权协议、RA用户协议,元数据提取信息包括:过程信息、档案及业务基本信息、电子文件基本属性、电子签名信息。
档案分类通常会配置到具体业务或事项颗粒度,提出业务侧对归档资源的具体要求。例如,婚姻登记档案需细分到结婚登记、离婚登记等具体事项,可建立“全宗/ZW/MS/HYDJ/JH”(全宗/政务/民生/婚姻登记/结婚)或“全宗/HYDJ/JH”这样的分类路径,具体分类方案根据各全宗各业务场景具体需要自定义配置。
归档信息包结构标准配置单元主要根据电子文件组件要求,通过配置归档材料范围目录,形成归档信息包电子文件目录结构标准,形成树状枝叶。
在设置的档案分类下,依次添加父级归档材料目录,在父级归档材料目录下添加子级归档材料目录,支持多层级目录结构配置,最终形成归档材料目录树。
针对每个归档材料目录配置必要性属性,若设为必要,表示归档时该目录下必须有文件,否则不符合归档要求。针对每个归档材料目录配置签署必要性属性,若设为必要,表示归档时该目录下文件必须含有电子签名,否则不符合归档要求。
针对每个归档材料目录配置关联文件模板ID,设置关联文件后,表示归档时该目录下文件需至少包含该文件模板配置的基础要素。配置完成后形成XML格式的归档材料范围配置文件。以婚姻登记档案中的结婚登记为例,创建的归档材料范围配置文件如下:
<?xml version="1.0" encoding="UTF-8"?>
<归档范围>
<全宗号>Z109</全宗号>
<档案分类>婚姻登记</档案分类>
<事项类型>结婚登记</事项类型>
<事项编码>3D8BA7302D519F2643203E8A56B66CEE</事项编码>
……
<归档材料目录>
<归档材料目录名称>结婚登记审查处理表</归档材料目录名称>
<材料必要性>必要</材料必要性>
<签署必要性>必要</签署必要性>
<模板文件ID>169020243595073702</模板文件ID>
……
</归档材料目录>
<归档材料目录>
<归档材料目录名称>证明材料</归档材料目录名称>
<材料必要性>必要</材料必要性>
<归档材料目录>
<归档材料目录名称>身份证(男)</归档材料目录名称>
<材料必要性>必要</材料必要性>
</归档材料目录>
<归档材料目录>
<归档材料目录名称>身份证(女)</归档材料目录名称>
<材料必要性>必要</材料必要性>
</归档材料目录>
……
</归档材料目录>
……
</归档范围>
电子文件模板标准配置单元,针对特定的、固定样式的文件材料可通过模板配置,生成电子文件内容完整性检测标准。如工商营业执照必须有名称、类型、住所、法定代表人、注册资本、成立日期、营业期限、经营范围等关键词字段,在固定位置需有国徽等图形,须有可识别二维码、公章等要素,若为电子营业执照须有符合电子签名法的电子公章等。如某公司人事档案入职协议有固定位置填写内容、固定位置必须签字或签章等。在执行检测时,若通过坐标信息识别、OCR识别以及签名域信息识别,提取对应字段和要素,获得相关信息认为文件内容完整,若提取不到对应字段或对应要素,则可认为该文件内容不完整。由于电子文件内容检测需要结合大量机器学习算法且存在众多不确定性,因此通过电子文件模板进行内容完整性检测仅为最小限度的电子文件完整性检测标准。
元数据著录标准配置单元,依据DA/T 46标准配置元数据完整著录项、必填著录项等标准,以检测从业务系统获取或从电子文件捕获的元数据是否符合归档要求,以完成电子文件元数据完整性检测。配置时,需设置元数据编码、元数据名称、必要性,结合元数据真实合理性检测标准一并生成XML格式的元数据配置文件。
完整性检测策略配置单元,根据不同档案分类、所处不同阶段设置不同的完整性检测执行标准。例如,在业务系统提交归档阶段,电子文件尚未组件归档,档号并未生成,因此可在元数据著录标准配置时去除档号的必填性检测。此外,在进行完整性检测策略配置时,可对具体检测项设置开启或关闭,可对具体检测项设置不同的执行标准,以适应具体业务场景需要。
完整性检测模块,解析待检测电子档案文件数据,调用配置中心完整性规则配置模块加载四性检测模型完整性检测策略,通过存证数据验证电子文件的完整性、可靠性、证据完整性,通过归档标准配置检测档案信息包完整性、电子文件内容完整性、元数据完整性,执行完整性检测。
在完成电子档案四性检测之后,检测报告生成模块汇总各项检测结果,依据检测报告模板加载渲染生成可视化的检测结果完整展示页面,并通过数字签名技术对形成的检测结果进行固化加签,最终形成凭证性文件反馈给电子档案系统,以确认此次检测结果的有效性。四性检测中的完整性检测各项检测结果反馈及数据渲染,并结构化嵌入到四性检测报告中。
通过上述各个组成部分、各个模块的协调合作,本示例性实施例提供的一种应用于电子档案的完整性检测系统,通过前置归档标准配置与各环节业务存证,在电子文件归档、移交、管理等各环节,通过存证数据与配置的归档标准完成对电子文件内容、结构、背景信息、元数据和证据性的完整性检测,是电子档案四性检测中重要、核心检测环节,扩大了电子档案检测阶段范围、提高了电子档案检测准确性、极大降低了档案工作人员的工作成本。
另一方面,本申请提出一种应用于电子档案的完整性检测的方法,通过业务存证检测电子文件自形成至归档过程、背景信息的完整性,通过归档标准配置检测电子文件内容、结构及元数据的完整性,通过电子签名、签署证据、关联证据完整性检测确认电子档案证据效力,从而检测从异构业务系统或电子档案系统获取的电子文件及元数据是否完整无缺失。包括:
获取并解析待检测电子档案数据;加载四性检测模型完整性检测策略;通过存证数据验证电子文件及元数据过程背景完整性;通过存证数据验证电子文件及元数据证据完整性;通过归档标准配置检测信息包内容结构完整性;通过归档标准配置检测电子文件内容完整性;通过归档标准配置检测元数据完整性;汇总并返回完整性各项检测结果。
所述获取并解析待检测电子档案数据,包括获取检测参数、获取待检测数据、根据待检测数据结构解析提取电子文件及元数据。获取的检测参数包括档案分类、事件或业务类型、所处阶段、数据过滤条件等,用于支撑后续数据处理、模型加载等。待检测数据有两种结构,一种是未完成归档前的散列文件列表及元数据json字符串,一种是形成归档之后的ZIP或EEP格式档案信息包。通过 WebService接口方式获取待检测数据后,根据不同数据结构进行解析,最终获得待检测的电子文件及元数据。
加载四性检测模型完整性检测策略包括,通过获取的档案分类、事件或业务类型、所处阶段等参数,从配置中心获取、加载对应的四性检测模型完整性检测策略,根据事先配置好的各项完整性检测规则执行后续各项检测。
所述通过存证数据验证电子文件及元数据过程背景完整性包括,通过存证数据验证签署文件过程完整性、业务过程文件完整性以及过程元数据完整性。
具体地,通过存证数据验证签署文件过程完整性,指通过存证中心回溯还原电子文件签署过程并获取相关电子签名信息,与待检测签署文件签名域信息进行一致性比对,以确认电子文件签署过程的完整性、可靠性;通过存证数据验证业务过程文件完整性,指通过存证中心获取电子文件形成过程提交的文件序列与待检测电子文件序列逐一进行一致性比对,以检测确认电子文件形成业务过程中提交的文件是否悉数归档;通过存证数据验证过程元数据完整性,指通过存证中心获取的过程元数据与待检测电子文件过程信息元数据进行一致性比对,以检测电子文件归档过程信息是否存在遗漏。
所述通过存证数据验证电子文件及元数据证据完整性,包括电子签名元数据完整性检测、电子文件关联证据完整性检测、归档信息包证据文件完整性检测。
具体地,通过签名域提取的电子签名元数据、存证中心获取的电子签名元数据与档案信息包中电子签名元数据进行一致性比对,确认对签署电子文件电子签名信息描述完整;通过存证中心获取的电子文件签署过程产生的签字数据包、RA用户协议、用户授权协议等与档案信息包中各电子文件关联的证据文件进行一致性比对,确认电子文件签署过程证据完整;通过存证中心获取的电子档案关联证据文件与存证中心获取的关联的证据文件进行一致性比对,确认电子档案形成过程各环节证据完整、形成闭环。通过档案证据完整性检测有助于进一步确认电子文件签署及业务过程文件的完整性,并使归档电子档案具备《电子档案单套管理一般要求》(DA/T 92 — 2022)要求的自验证、自包含,具备司法效力。
所述通过归档标准配置检测档案信息包内容结构完整性包括,总件数(档案数量)相符性检测、总字节数相符性检测、总文件数相符性检测、总页数相符性检测、归档材料范围完整性检测、归档信息包结构完整性检测、归档信息包元数据描述完整性检测。
具体地,通过配置的应归档材料范围检测待检测文件是否根据业务对资源的基本要求提交完整;通过配置的归档材料目录结构检测归档信息包结构是否完整,从而检测实际归档组件数据与应归档数据之间的完整一致性。
此外,通过实际归档档案件数、字节数、文件数、页数等与元数据描述或登记表中描述的对应字段值是否一致确认待检测数据的完整性,此为DA/T 70 规范中提出的完整性检测项;通过归档信息包元数据描述与实际归档组件信息的一致性比对有利于进一步确认电子文件归档组件信息的完整性。
所述通过归档标准配置检测电子文件内容完整性包括,电子文件签名要素完整性检测、电子文件内容数据完整性检测、电子文件附件数据完整性检测。
具体地,通过配置的电子文件模板及电子文件归档要素,检测确认需签署的电子文件是否含有电子签名、配置的签署位是否已完成签署、配置的填写项内容是否已完成填写、是否包含配置的关键词要素、是否包含配置的关键图形要素以及电子文件中所含所附的链接信息、附件信息是否完整等,以确认归档电子文件内容是否完整、是否符合业务实际归档要求。
所述通过归档标准配置检测元数据完整性包括,元数据项完整性检测、元数据必填著录项检测、元数据连续性检测、流程信息完整新检测。
具体地,通过获取并解析待检测电子文件元数据的基本信息、过程信息、电子文件属性信息等元数据信息结构体;通过从配置中心获取的归档标准配置中的元数据著录项、元数据必填项、元数据连续项、关键过程信息要求进行逐一匹配比对,以确认待检测文件元数据的完整性。
汇总并返回完整性各项检测结果,根据档案各阶段完整性检测策略执行情况,依次得到各项完整性检测结果,汇总检测结果时,当全部为检测通过的,则整体完整性检测为通过,否则为不通过;根据传入的检测结果反馈类型,分别反馈整体完整性检测结果、各项完整性检测结果以及完整性检测报告。
如图3所示为本示例性实施例中电子档案完整性检测流程示意图。本申请示例性实施例根据《文书类电子档案检测一般要求》(DA/T 70)中提到的完整性检测要求,并结合实际场景需要,提供了一种应用于电子档案的完整性检测方法。具体包括:
获取并解析待检测电子档案数据。
首先,数据接收模块从各异构业务系统获取检测参数。用于支撑电子档案系统后续数据处理、模型加载等。检测参数包括:档案分类、事件或业务类型、电子档案所处阶段、数据过滤条件等检测参数。待检测数据有两种结构,一种是未完成归档前的散列文件列表及元数据json字符串,一种是形成归档之后的ZIP或EEP格式档案信息包。数据接收模块从各异构业务系统获取散列文件列表及元数据json字符串,从电子档案系统获取形成归档之后的档案信息包,两种数据均通过WebService标准接口方式传输。散列数据以信息交换方式在发送方与接收方之间以直接建立接口和传输通道的方式进行数据传输;档案信息包以数据交换方式,通过 FTP 或 OSS 方式进行存档信息包的上传、下载和检测反馈。
在电子档案形成归档阶段,通过信息交换方式从业务系统获取电子文件及元数据,依次计算电子文件哈希值及元数据字符串json的密钥MD5值,调取存证中心电子文件ID对应逐一比对,比对通过后对数据进行解析。
形成归档文件之后的预归档、正式归档、档案管理、档案利用等阶段,通过数据交换方式下载获取档案信息包,计算其档案总包哈希值,通过存证ID调取对应存证数据中的哈希值与计算出的总包哈希值进行一致性比对;档案总包解压,形成单档案信息包序列,通过档案ID(档号)调取存证中心存证数据,通过对应档案信息包哈希值与计算出的单档案信息包哈希值进行逐一比对;档案信息包解压,依次计算电子文件哈希值与存证数据中电子文件哈希值进行逐一比对。
比对通过后,解析档案信息包待检测数据,根据获取的待检测数据的结构,对档案信息包进行逐级解压、XML格式元数据文件进行解析、以及对json字符串进行解析,从而获得待检测电子文件及元数据。
在形成归档阶段,将元数据字符串json进行解析,获取基本信息、过程信息、归档配置信息、电子文件组件信息、电子文件属性信息等元数据结构体,与待检测电子文件列表一并进入完整性检测模块进行检测;在形成归档之后的预归档、正式归档、档案管理、档案利用等阶段,通过档案信息总包解压获得各单档案信息包。
通过单档案信息包解压获得电子文件及元数据描述XML格式文件;通过XML文件解析,基本信息、过程信息、归档配置信息、电子文件组件信息、电子文件属性信息等元数据结构体,与待检测电子文件列表一并输入完整性检测模块进行检测。
加载完整性检测策略模型。
完整性检测策略模型根据接收到的档案类型、业务或事项类型、当前所处阶段调取相应的归档标准配置文件XML并进行解析,调取对应的完整性检测策略,依次加载设置为开启的各检测规则项,依次执行后续各项检测规则。
完整性检测模块通过存证数据验证电子文件及元数据的完整性、可靠性。具体包括:
通过存证数据验证签署文件过程完整性,以检测签署电子文件是否真实完整。
通过签署文件ID从存证中心获取所有存证数据;通过签署文件查找签署前文件ID(prevFileId)、签署前文件哈希值(prevFileHash)回溯原文;通过prevFileId查找对应电子文件,计算哈希值与对应的prevFileHash进行一致性比对;通过签名域信息获取计算原文哈希与存证中心prevFileHash进行一致性比对;循环执行以上过程,直至回溯完整个签署过程,以确认电子文件签署过程完整、真实、无篡改。
通过存证数据验证业务过程文件完整性,以检测业务过程文件是否存在缺失或遗漏。
如图4所示为本申请示例性实施例中业务过程文件验证逻辑示意图,根据业务ID对文件1-1、文件3,文件2-1、文件4进行归档,分别计算各个归档文件哈希;通过业务ID解析获得文件清单:存档文件1-1…文件3、文件2-1…文件4。
具体地,本示例性实施例通过业务ID从存证中心获取所有业务存证数据,解析获得文件清单;通过填写签署文件ID(signPlaceFieldId)筛查同一电子文件填写变化过程存证的文件ID,并保留最后一个文件;通过prevFileId筛查同一电子文件签署变化过程存证的文件ID,并保留最后一个文件;通过最终获得的电子文件序列ID和对应文件哈希值,与待检测电子文件序列ID和对应文件哈希值进行逐一比对,以检测确认电子文件形成业务过程中提交的文件是否悉数归档。
通过存证数据验证过程元数据完整性,以检测电子文件归档过程背景信息是否存在缺失或遗漏。通过业务ID从存证中心获取所有业务存证数据,解析获得过程信息元数据;比对存证中心获取的业务阶段信息与待检测电子文件元数据的业务阶段信息的一致性,并逐一比对各阶段操作人或处理人信息、操作时间或处理时间信息、处理意见、处理部门等信息的一致性,以检测确认电子文件形成过程背景信息是否悉数被记录归档。
通过存证数据验证电子文件及元数据证据完整性,具体包括:
通过存证数据验证电子签名等技术性元数据的完整性。
依据《文书类电子文件元数据方案》(DA/T 46—2009)引入的电子签名元数据(M57)等,主要面向电子档案电子文件的可读性、可理解性及证据性描述,从而降低电子档案软硬件依赖性,需在电子文件收集时采集,在归档时检测验证。
根据文件ID从存证中心获取电子签名信息,提取签名类型、签名规则、签名时间、签名人、签名结果、证书、证书链、证书撤销序列、签名算法标识以及电子印章相关信息;从签名域提取签名人、签名时间、证书等与存证中心获取的签名信息进行一致性比对;获取并解析单电子档案或档案信息包的电子签名信息结构体,与存证中心获取的签名信息进行一致性比对,从而确认电子签名元数据的完整性。
通过存证数据检测验证电子文件关联证据信息完整性。
电子文件关联证据完整性检测,指检测用以辅助证明电子文件签署真实性的证据文件以及业务过程文件证明文件是否完整,以确保电子档案的证据效力。
具体地,根据元数据描述,首先检测电子文件各签名域是否对应关联证据,包括签字数据包、RA用户协议、签字授权协议等;其次,根据元数据描述中各签名域对应证据文件ID及哈希值与实际归档的证据文件ID及哈希值逐一进行一致性比对;再次,根据元数据描述中各电子文件对应的关联证据ID及哈希值与实际归档的证据文件ID及哈希值逐一进行一致性比对,从而确认电子文件关联证据的完整性。
归档信息包证据文件完整性检测。
具体地,从单档案信息包中获取以XML格式存放的元数据描述信息并进行解析,获取电子文件各签名域对应的关联证据文件ID及哈希值、获取电子文件对应的关联证据文件ID及哈希值、获取单档案对应的关联文件ID及哈希值,获取证据文件夹中证据文件ID及哈希值,逐一进行一致性比对,以确保归档信息包关联证据文件完整无遗漏,从而确保电子档案的法律效力。
通过归档标准配置检测信息包内容结构完整性,具体包括:
总件数(档案数量)相符性检测。针对批量提交数据需检测档案信息包中提交的档案数量与元数据或提交记录中描述的档案数量是否一致,具体包括:解析信息包中“说明文件.XML”,获得归档移交总件数字段值,与检测模块获取的待检测电子档案数量进行一致性比对;获取智能表单《归档登记表》或《移交接收登记表》中记录的总件数字段值,与检测模块获取的电子档案数量进行一致性比对;
总字节数相符性检测。针对批量提交数据或单一档案信息包,需检待检测电子文件总字节数与元数据或提交记录中描述的字节数是否一致。具体包括:解析信息包中“说明文件.XML”,获得归档移交总字节数字段值,计算获取的电子文件总字节数进行一致性比对;获取智能表单《归档登记表》或《移交接收登记表》中记录的总字节数字段值,计算获取的电子文件总字节数进行一致性比对。
总文件数相符性检测。针对单档案信息包,可检测电子文件信息包子问件数量即总文件数与元数据中或提交记录中描述的文件数是否一致。具体地,解析单个档案信息包中“基本信息.XML”,获得子文件数(文件数)字段值,计算获取的电子文件总文件数量进行一致性比对。
总页数相符性检测。针对单档案信息包,可检测电子文件总页数与元数据中或提交记录中描述的文件数是否一致。可通过解析单个档案信息包中“基本信息.XML”,获得总页数字段值,计算获取的电子文件总页数进行一致性比对。
归档范围完整性检测。针对单档案信息包,检测根据档案分类及事件或业务类型指定要求的电子文件其形成全过程需归档的文件是否均已提交归档,如电子公文的修改过程稿、公文审批稿,行政服务事项的执法过程文件、审批过程文件等均需归档,归档范围完整性检测即检测归档文件是否依据归档要求提交完整。具体地,可从配置中心获取“归档范围标准配置文件.XML”并进行解析,获取属性为“必填”的应归档文件目录;解析待检测电子档案元数据中的电子文件组件目录,与应归档文件目录进行逐一匹配,若属性为“必填”的应归档文件目录均有匹配,且电子文件组件目录下均有文件,则归档范围完整性检测通过。
归档信息包结构完整性检测。检测归档电子文件是否按指定要求进行组件、排序、存放。具体地,从配置中心获取“归档范围标准配置文件.XML”并进行解析,获取属性为“必填”的应归档文件目录;依据具体归档电子文件回溯电子文件存放相对路径即实际归档目录结构;从根目录开始逐级往下匹配,直至应归档目录完结时终止匹配,若实际归档目录结构与应归档目录结构一致或未超出配置的目录结构范围,则归档电子文件符合归档范围标准配置文件的组件要求。
归档信息包元数据描述完整性检测。
从批量移交信息包中获取以XML格式存放的元数据说明文件并进行解析;批量移交信息包中需包括含有本次批量移交情况说明的描述信息,至少包括移交批次号或编号、档案数量、信息包大小、起止编号、移交时间等字段。批量移交信息包中还需包括以数组结构提交的本次移交档案列表信息,至少包括唯一条目编号或档号、全宗号或部门名称等信息;需检测档案数量与档案列表中条目信息数的一致性;需检测档案条目编号或档号未超出起止编号范围。
其次,从单档案信息包中获取以XML格式存放的元数据说明文件并进行解析;单档案信息包中至少能解析出包含有档号、全宗号、立档单位、归档日期、题名、保管期限、密级等字段的基础信息机构体,包含环节、处理人、处理时间、处理部门等字段的过程信息结构体,以及包含归档目录、电子文件组件信息描述、电子签名信息等关于归档电子文件子件描述信息的电子文件属性信息结构体;需检测单档案信息包中档号与批量移交信息包中档号的一致性;需检测实际归档电子文件及其目录结构与元数据描述中的文件及其目录结构的一致性。
完成以上检测后,即完成对归档信息包中批量移交信息包元数据描述以及单档案信息包元数据描述的完整性检测。
通过归档标准配置检测电子文件内容完整性。通过电子文件模板及要素配置,识别检测电子文件所含所附指定位置内容信息、关键词信息、图形图像信息、电子签名信息以及链接附件信息是否完整,具体包括:
通过归档标准配置检测电子文件签名要素完整性。根据归档电子文件签署必要性配置以及签署类型如签字、签章、捺印配置,通过签名域信息识别确认电子文件是否包含电子签名、电子签章、电子捺印等要素信息;根据电子文件模板配置的签字位、签署类型及坐标配置,通过签名域识别匹配检测电子文件的签名要素是否完整,包括指定位置是否含有签名、是否含有指定类型签名等,通过电子文件签名要素的完整性检测,有助于确认电子文件的法律效力。
通过归档标准配置检测电子文件内容数据完整性。识别电子文件的模板ID,从配置中心获取模板ID对应模板配置;根据模板配置的控件坐标以及填写属性配置,通过OCR识别电子文件对应控件是否完成内容填写;根据模板配置的关键词及必要性配置,通过OCR识别电子文件对应关键词要素是否完整;根据模板配置的关键词、内容识别坐标配置及必要性配置,通过OCR识别电子文件对应关键词对应内容信息要素是否完整;根据模板配置的识别坐标区域及图像要素配置,通过图像识别匹配检测对应图像元数是否完整。
电子文件附件数据完整性检测,指根据电子文件内容中带有链接或附件信息描述,检测其对应文件是否已经归档。
对待检测电子文件全文检索链接标签,并下载对应电子文件,计算其哈希值与待检测电子文件进行匹配,有文件可匹配表示附件数据已提交归档;对待检测电子文件中进行设置的附件关键词检索,并检索对应附件名称,与待检测电子文件进行文件名称模糊匹配,当模糊匹配度超过配置的数值时,表示附件文件已提交归档。
通过归档标准配置检测元数据完整性,指通过归档标准配置中的元数据著录项、元数据必填项、元数据连续性检测项以及电子签名、数字化属性著录要求,对待检测数据中解析的元数据进行完整性检测,具体包括:
元数据项完整性检测。依据配置的元数据著录标准中的元数据项配置,检测获取的元数据项是否存在缺项;元数据必填著录项检测,依据配置的元数据著录标准中的必填项配置,检测获取的元数据必填项是否存在空值;元数据连续性检测,依据配置的元数据著录标准中的连续性检测项配置,检测获取的所有待检测档案元数据其归档号、件内顺序号、归档流水号等用户自定义的具有连续编号性质的元数据项是否连续、是否从指定的起始号开始编号等,避免出现档案数据跳号或缺漏等情况;
过程信息完整性检测,依据配置的元数据著录标准中的关键措辞信息配置,检测获取的过程信息结构体元数据中是否包含关键流程信息描述,以确认归档电子文件元数据中包含的处理过程信息或环节信息否完整、规范;
子文件属性信息完整性检测,依据配置的电子文件签名要素配置、容缺归档配置等,检测获取的电子文件属性除了电子文件名称、大小、格式等基础信息元数据以外,是否包含电子签名信息或数字化属性信息等元数据描述,以确认归档电子文件具体对象的元数据完整性。
汇总并返回完整性各项检测结果。根据完整性检测策略执行各检测项是否通过,汇总执行检测情况并输出检测结果,当全部为检测通过,则整体完整性检测为通过,否则为不通过。输出检测结果包括整体检测结果反馈、单档案检测结果反馈、单档案各项检测结果反馈及检测未通过原因等,依据传入的检测结果反馈类型,分别反馈整体完整性检测结果、各项完整性检测结果以及完整性检测报告,其中,完整性检测报告模块集成至四性检测报告中,是以可视化方式呈现的四性检测结果,通过数字签名技术对包含完整性检测在内的四性检测报告进行固化存证,可作为确定性检测结果及凭证反馈给电子档案系统。
通过执行上述检测,本发明实现电子档案的完整性检测,根据存证数据回溯、还原检测验证电子文件过程及背景信息完整性,根据存证数据检测验证电子文件签署及形成归档过程关联证据完整性,根据归档标准配置检测结合《文书类电子档案检测一般要求》(DA/T 70)的要求确保电子文件内容、结构及元数据的完整性,解决了现有的电子档案完整性检测只能基于时点、单一、不全面的情况,从根本上解决了电子档案完整、可靠性检测问题。
本申请示例性实施例还提供一种电子设备,包括:至少一个处理器;以及与至少一个处理器通信连接的存储器。所述存储器存储有能够被所述至少一个处理器执行的计算机程序,所述计算机程序在被所述至少一个处理器执行时用于使所述电子设备执行根据本申请实施例的方法。
本申请示例性实施例还提供一种存储有计算机程序的非瞬时计算机可读存储介质,其中,所述计算机程序在被计算机的处理器执行时用于使所述计算机执行根据本申请实施例的方法。
本申请示例性实施例还提供一种计算机程序产品,包括计算机程序,其中,所述计算机程序在被计算机的处理器执行时用于使所述计算机执行根据本申请实施例的方法。
参考图5,现将描述可以作为本申请的服务器或客户端的电子设备300的结构框图,其是可以应用于本申请的各方面的硬件设备的示例。电子设备旨在表示各种形式的数字电子的计算机设备,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本申请的实现。
电子设备300包括计算单元301,其可以根据存储在只读存储器(ROM)302中的计算机程序或者从存储单元308加载到随机访问存储器(RAM)303中的计算机程序,来执行各种适当的动作和处理。在RAM303中,还可存储设备300操作所需的各种程序和数据。计算单元301、ROM 302以及RAM 303通过总线304彼此相连。输入/输出(I/O)接口305也连接至总线304。
电子设备300中的多个部件连接至I/O接口305,包括:输入单元306、输出单元307、存储单元308以及通信单元309。输入单元306可以是能向电子设备300输入信息的任何类型的设备,输入单元306可以接收输入的数字或字符信息,以及产生与电子设备的用户设置和/或功能控制有关的键信号输入。输出单元307可以是能呈现信息的任何类型的设备,并且可以包括但不限于显示器、扬声器、视频/音频输出终端、振动器和/或打印机。存储单元308可以包括但不限于磁盘、光盘。通信单元309允许电子设备300通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据,并且可以包括但不限于调制解调器、网卡、红外通信设备、无线通信收发机和/或芯片组,例如蓝牙设备、WiFi设备、WiMax设备、蜂窝通信设备和/或类似物。
计算单元301可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元301的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。计算单元301执行上文所描述的各个方法和处理。
Claims (15)
1.一种电子档案的完整性检测系统,其特征在于,包括:档案数据接收模块、完整性规则配置模块、完整性检测模块、检测报告生成模块,其中,完整性检测模块包括:数据解析单元、策略加载单元、检测执行单元、检测结果反馈单元,档案数据接收模块接收电子档案文件数据;数据解析单元解析待检测电子档案文件数据,策略加载单元调用配置中心完整性规则配置模块加载完整性检测策略,检测执行单元通过存证中心回溯存证数据验证电子文件及元数据过程背景完整性,通过电子签名、签署数据、关联数据检测电子档案证据数据的完整性,通过归档标准配置检测档案信息包完整性、电子文件内容完整性、元数据完整性;检测结果反馈单元汇总各项完整性检测结果,检测报告生成模块进行数据渲染,结构化嵌入到检测报告中。
2.根据权利要求1所述的完整性检测系统,其特征在于,完整性规则配置模块为归档标准配置全树模型,以全宗为单位建立档案分类标准,分类支持多层级结构形成全树模型,其中,根据档案不同门类、业务、事项建立不同标准构建分类架构形成树干;根据组件规则形成电子档案目录构建文件目录形成树叶,根据包括电子文件、证据文件、元数据提取信息的归档数据要素形成叶脉,构建归档标准配置全树模型。
3.根据权利要求1或2所述的完整性检测系统,其特征在于,完整性规则配置模块包括:档案分类配置单元、归档信息包结构标准配置单元、电子文件模板标准配置单元、元数据著录标准配置单元、完整性检测策略配置单元,档案分类配置单元针对每个归档文件目录配置必要性属性和签署必要性属性、配置关联文件模板ID, 配置完成后形成XML格式的归档材料范围配置文件;电子文件模板标准配置单元通过模板配置固定样式的文件,生成完整性检测标准,元数据著录标准配置单元依据DA/T 46标准配置元数据完整著录项、必填著录项,设置元数据编码、元数据名称、必要性,结合检测标准生成XML格式的元数据配置文件;完整性检测策略配置单元,根据不同档案分类、阶段设置不同的完整性检测执行标准。
4.根据权利要求1或2所述的完整性检测系统,其特征在于,数据解析单元解析待检测电子档案数据包括,在电子档案形成归档阶段,依次计算获取的电子文件哈希值及元数据字符串的MD5值,获取元数据结构体,调取存证中心对应电子文件哈希值及MD5值逐一比对并进行解析,获得待检测电子文件及元数据结构体;形成归档文件后,通过数据交换方式获取档案信息包,计算档案总包哈希值,通过存证ID调取对应存证数据哈希值与总包哈希值进行一致性比对,解压档案总包形成单档案信息包序列;通过档案ID调取存证中心对应档案信息包哈希值与单档案信息包哈希值逐一比对,解压单档案信息包,依次计算文件哈希值并与存证数据中文件哈希值逐一比对,逐级解压档案信息包、解析XML格式元数据文件和字符串,获得待检测电子文件及元数据结构体。
5.根据权利要求1或2所述的完整性检测系统,其特征在于,所述通过存证数据验证电子文件及元数据过程背景完整性包括,通过签署文件查找签署前文件ID、签署文件哈希值回溯原文,通过prevFileId查找对应电子文件,计算哈希值与对应的prevFileHash进行一致性比对;通过签名域信息计算原文哈希与存证中心prevFileHash进行一致性比对,回溯完整签署过程确认电子文件签署过程完整;通过业务ID从存证中心获取所有业务存证数据,解析获得文件清单,通过signPlaceFieldId筛查同一电子文件填写变化过程存证的文件ID,并保留最后一个文件,通过prevFileId筛查同一电子文件签署变化过程存证的文件ID,并保留最后一个文件;通过最终获得的电子文件序列ID和对应文件哈希值,与待检测电子文件序列ID和对应文件哈希值进行逐一比对,检测确认电子文件形成业务过程完整性。
6.根据权利要求1-5其中之一所述的完整性检测系统,其特征在于,检测参数包括:档案分类、事件或业务类型、归档文件所处阶段、数据过滤条件;待检测数据结构包括:未完成归档前的散列文件列表及元数据json字符串,形成归档后的ZIP或EEP格式档案信息包,解压单档案信息包获得电子文件及元数据描述XML格式文件,解析XML文件、元数据json字符串,获取包括基本信息、过程信息、归档配置信息、电子文件组件信息、电子文件属性信息的元数据结构体。
7.一种电子档案的完整性检测方法,其特征在于,获取并解析电子档案数据,加载四性检测模型完整性检测策略;通过存证数据检测电子文件及元数据归档过程、背景信息的完整性,通过电子签名、签署证据数据、关联证据数据检测电子文件数据的完整性;通过归档标准配置检测电子档案数据信息包内容结构、电子文件内容、元数据完整性;汇总返回各项完整性检测结果并数据渲染,结构化嵌入到检测报告中。
8.根据权利要求7所述的完整性检测方法,其特征在于,档案分类配置单元针对每个归档文件目录配置必要性属性和签署必要性属性、配置关联文件模板ID, 配置完成后形成XML格式的归档材料范围配置文件;电子文件模板标准配置单元通过模板配置固定样式的文件,生成完整性检测标准,元数据著录标准配置单元依据DA/T 46标准配置元数据完整著录项、必填著录项,设置元数据编码、元数据名称、必要性,结合检测标准生成XML格式的元数据配置文件;完整性检测策略配置单元,根据不同档案分类、阶段设置不同的完整性检测执行标准。
9.根据权利要求7或8所述的完整性检测方法,其特征在于,数据解析单元解析待检测电子档案数据包括,在电子档案形成归档阶段,依次计算电子文件哈希值及元数据json字符串的密钥MD5值,获取元数据结构体,调取存证中心文件ID逐一比对并进行解析,形成归档文件后,通过数据交换方式获取档案信息包,计算档案总包哈希值,通过存证ID调取对应存证数据哈希值与总包哈希值进行一致性比对,解压档案总包形成单档案信息包序列;通过档案ID调取存证中心对应档案信息包哈希值与单档案信息包哈希值逐一比对,解压单档案信息包,依次计算文件哈希值并与存证数据中文件哈希值逐一比对,逐级解压档案信息包、解析XML格式元数据文件和json字符串,获得待检测电子文件及元数据。
10.根据权利要求7或8所述的完整性检测方法,其特征在于,所述通过存证数据验证过程元数据完整性包括,通过签署文件查找签署前文件prevFileId、prevFileHash回溯原文,通过prevFileId查找对应电子文件,计算哈希值与对应的prevFileHash进行一致性比对;通过签名域信息计算原文哈希与存证中心prevFileHash进行一致性比对,回溯完整签署过程确认电子文件签署过程完整;解析签署过程信息元数据,比对存证中心业务阶段信息与待检测电子文件元数据的业务阶段信息的一致性,逐一比对各阶段操作人或处理人信息、操作时间或处理时间信息、处理意见、处理部门信息的一致性;所述验证电子文件的完整性包括:通过业务ID从存证中心获取所有业务存证数据,解析获得文件清单,通过signPlaceFieldId筛查同一电子文件填写变化过程存证的文件ID,并保留最后一个文件;通过prevFileId筛查同一电子文件签署变化过程存证的文件ID,并保留最后一个文件;通过最终获得的电子文件序列ID和对应文件HASH值,与待检测电子文件序列ID和对应文件HASH值进行逐一比对,检测确认电子文件形成业务过程。
11.根据权利要求7或8所述的完整性检测方法,其特征在于,通过电子签名、签署数据、关联数据检测证据数据的完整性包括,根据文件ID从存证中心获取电子签名信息,提取签名类型、签名规则、签名时间、签名人、签名结果、证书、证书链、证书撤销序列、签名算法标识以及电子印章相关信息,与从归档文件签名域提取签名人、签名时间、证书信息进行一致性比对验证电子签名的完整性,与从单电子档案和/或档案信息包解析的电子签名信息结构体进行一致性比对,确认电子签名元数据的完整性;检测电子文件各签名域,根据元数据描述中各签名域对应证据文件ID及哈希值与归档的证据文件ID及哈希值逐一比对,根据元数据描述中各电子文件对应的关联证据ID及哈希值与归档的证据文件ID及哈希值逐一比对验证电子文件关联证据信息完整性;解析单档案信息包中以XML格式存放的元数据描述信息,获取各签名域对应的关联证据文件ID及哈希值、待检测文件对应的关联证据文件ID及哈希值、单档案对应的关联文件ID及哈希值,证据文件夹中证据文件ID及哈希值,逐一比对检测归档信息包证据文件完整性。
12.根据权利要求7或8所述的完整性检测方法,其特征在于,通过归档标准配置检测电子档案数据信息包内容结构、电子文件内容、元数据完整性包括:解析信息包中“说明文件.XML”,获得归档移交总件数字段值、总字节数字段值,与待检测电子档案数量、电子文件总字节数一致性比对,获取智能表单中记录的总件数字段值、总字节数字段值,与待检测电子档案数量、电子文件总字节数一致性比对,检测信息包内容结构完整性;根据批量提交数据或单一档案信息包解析单个档案信息包中“基本信息.XML”,获得子文件数字段值、总页数字段值,检测电子文件总文件数量、电子文件总页数与元数据中或记录中描述的文件数一致性比对,检测总字节数是否相符性;从配置中心获取“归档范围标准配置文件.XML”进行解析,获取属性为“必填”的应归档文件目录,解析待检测电子档案元数据中的电子文件组件目录,与应归档文件目录进行逐一匹配,检测归档范围完整性;从配置中心获取“归档范围标准配置文件.XML”并进行解析,从配置中心获取属性为“必填”的应归档文件目录,回溯归档电子文件存放相对路径得到归档目录结构;从根目录开始逐级往下匹配,直至匹配完应归档目录,检测归档信息包结构完整性;从批量移交信息包中获取以XML格式存放的元数据说明文件,从单档案信息包中获取以XML格式存放的元数据说明文件,解析出字段包含有基础信息结构体、过程信息结构体、电子文件属性信息结构体、归档电子文件子件描述信息,检测单档案信息包与批量移交信息包的一致性、归档电子文件及其目录结构与元数据描述中的文件及其目录结构的一致性,检测归档信息包元数据描述完整性;通过电子文件模板及要素配置,识别检测电子文件所含指定位置内容信息、关键词信息、图形图像信息、电子签名信息以及链接附件信息是否完整检测电子文件内容完整性。
13.根据权利要求12所述的完整性检测方法,其特征在于,通过归档标准配置检测电子文件内容数据完整性,根据模板配置的控件坐标及填写属性配置,通过OCR识别电子文件对应控件是否完成内容填写,根据模板配置的关键词及必要性配置,通过OCR识别电子文件对应关键词要素是否完整;根据模板配置的关键词、内容识别坐标配置及必要性配置,通过OCR识别电子文件对应关键词对应内容信息要素是否完整;根据模板配置的识别坐标区域及图像要素配置,通过图像识别匹配检测对应图像元数是否完整;对待检测电子文件全文检索链接标签,与待检测电子文件进行匹配,与待检测电子文件进行文件名称模糊匹配,检测电子文件附件数据完整性;通过归档标准配置中的元数据著录项、元数据必填项、元数据连续性检测项以及电子签名、数字化属性著录要求,对待检测数据中解析的元数据进行完整性检测;依据配置的元数据著录标准中的关键措辞信息配置,检测过程信息结构体元数据中的关键流程信息描述检测元数据项完整性;依据配置的电子文件签名要素配置、容缺归档配置,检测归档电子文件属性除基础信息元数据以外,是否包含电子签名信息或数字化属性信息检测子文件属性信息完整性。
14.一种电子设备,包括:处理器;以及存储程序的存储器,其中,所述程序包括指令,所述指令在由所述处理器执行时使所述处理器执行根据权利要求7-13中任一项所述的电子档案的完整性检测方法。
15.一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行根据权利要求7-13中任一项所述的电子档案的完整性检测方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311399461.6A CN117390696A (zh) | 2023-10-26 | 2023-10-26 | 电子档案的完整性检测系统、方法、设备及介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311399461.6A CN117390696A (zh) | 2023-10-26 | 2023-10-26 | 电子档案的完整性检测系统、方法、设备及介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117390696A true CN117390696A (zh) | 2024-01-12 |
Family
ID=89471666
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311399461.6A Pending CN117390696A (zh) | 2023-10-26 | 2023-10-26 | 电子档案的完整性检测系统、方法、设备及介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117390696A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN118093232A (zh) * | 2024-04-19 | 2024-05-28 | 山东广厚信息科技有限公司 | 一种用于电子档案检测的数据处理方法及系统 |
-
2023
- 2023-10-26 CN CN202311399461.6A patent/CN117390696A/zh active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN118093232A (zh) * | 2024-04-19 | 2024-05-28 | 山东广厚信息科技有限公司 | 一种用于电子档案检测的数据处理方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110737630B (zh) | 电子归档文件的处理方法、装置、计算机设备及存储介质 | |
CN117390696A (zh) | 电子档案的完整性检测系统、方法、设备及介质 | |
US11403283B2 (en) | Distributed ledger based generation of electronic documents | |
US11243907B2 (en) | Digital file recognition and deposit system | |
CN112329418A (zh) | 并行审批方法、设备及计算机可读存储介质 | |
CN115982764A (zh) | 基于区块链存证电子档案的方法、系统、设备及介质 | |
US11356278B2 (en) | Blockchain driven embedded video and digital signatures on signed documents | |
KR102040772B1 (ko) | 조달물품등록 관련 컨설팅 프로젝트에 필요한 데이터의 관리 방법 | |
CN113627145A (zh) | 一种参数化配置的文件生成方法、装置、设备和介质 | |
CN115952560B (zh) | 基于原笔迹签名校验电子档案文件真实性的方法、系统、设备及介质 | |
CN107085584B (zh) | 一种基于内容的云文档管理方法、系统及服务端 | |
CN112580073A (zh) | 一种基于区块链与ipfs的存证方法及系统 | |
CN115563600A (zh) | 数据审核方法和装置、电子设备及存储介质 | |
CN115964684A (zh) | 检测电子档案元数据真实性的方法、系统、设备及介质 | |
CN112966304B (zh) | 流程文档的防篡改方法、装置、计算机设备及介质 | |
CN111552663A (zh) | 文件一致性验证方法、装置、计算机设备及存储介质 | |
CN112597321B (zh) | 基于区块链的多媒体处理方法及相关设备 | |
CN115934642A (zh) | 基于锁链哈希的电子档案巡检系统、方法、设备及介质 | |
CN115526551A (zh) | 基于人工智能的农产品溯源数据处理方法及云平台 | |
CN108052842A (zh) | 签名数据的存储、验证方法及装置 | |
CN111324914B (zh) | 文件的传输方法、装置、服务器、设备和介质 | |
CN112669000A (zh) | 政务事项处理方法、装置、电子设备及存储介质 | |
CN113434577A (zh) | 业务数据处理方法、存储介质及设备 | |
CN113378549B (zh) | 单证校验方法、装置、计算机设备及存储介质 | |
CN115827940A (zh) | 电子档案的归档方法、装置、电子设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |