CN112365373A - 一种随案电子卷宗保全和互认处理方法 - Google Patents
一种随案电子卷宗保全和互认处理方法 Download PDFInfo
- Publication number
- CN112365373A CN112365373A CN202011250318.7A CN202011250318A CN112365373A CN 112365373 A CN112365373 A CN 112365373A CN 202011250318 A CN202011250318 A CN 202011250318A CN 112365373 A CN112365373 A CN 112365373A
- Authority
- CN
- China
- Prior art keywords
- file
- text
- preservation
- portfolio
- judicial
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims description 43
- 238000004321 preservation Methods 0.000 claims abstract description 31
- 238000003672 processing method Methods 0.000 claims abstract description 10
- 230000008569 process Effects 0.000 claims description 23
- 238000012545 processing Methods 0.000 claims description 11
- 230000005540 biological transmission Effects 0.000 claims description 8
- 230000002427 irreversible effect Effects 0.000 claims description 6
- 238000012886 linear function Methods 0.000 claims description 6
- 230000009466 transformation Effects 0.000 claims description 4
- 230000004048 modification Effects 0.000 claims description 3
- 238000012986 modification Methods 0.000 claims description 3
- 238000012795 verification Methods 0.000 claims description 3
- 238000000605 extraction Methods 0.000 claims 1
- 230000007547 defect Effects 0.000 abstract description 5
- 238000007689 inspection Methods 0.000 description 14
- 238000005516 engineering process Methods 0.000 description 13
- 238000007726 management method Methods 0.000 description 7
- 230000008859 change Effects 0.000 description 3
- 230000007246 mechanism Effects 0.000 description 3
- 238000012546 transfer Methods 0.000 description 3
- 238000012790 confirmation Methods 0.000 description 2
- 230000003111 delayed effect Effects 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 206010063385 Intellectualisation Diseases 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 210000000056 organ Anatomy 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 238000010200 validation analysis Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/18—Legal services
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/27—Replication, distribution or synchronisation of data between databases or within a distributed database system; Distributed database system architectures therefor
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/10—Protecting distributed programs or content, e.g. vending or licensing of copyrighted material ; Digital rights management [DRM]
- G06F21/16—Program or content traceability, e.g. by watermarking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/60—Protecting data
- G06F21/64—Protecting data integrity, e.g. using checksums, certificates or signatures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L63/00—Network architectures or network communication protocols for network security
- H04L63/08—Network architectures or network communication protocols for network security for authentication of entities
- H04L63/083—Network architectures or network communication protocols for network security for authentication of entities using passwords
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L63/00—Network architectures or network communication protocols for network security
- H04L63/08—Network architectures or network communication protocols for network security for authentication of entities
- H04L63/0876—Network architectures or network communication protocols for network security for authentication of entities based on the identity of the terminal or configuration, e.g. MAC address, hardware or software configuration or device fingerprint
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L63/00—Network architectures or network communication protocols for network security
- H04L63/12—Applying verification of the received information
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/01—Protocols
- H04L67/02—Protocols based on web technology, e.g. hypertext transfer protocol [HTTP]
- H04L67/025—Protocols based on web technology, e.g. hypertext transfer protocol [HTTP] for remote control or remote monitoring of applications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/01—Protocols
- H04L67/06—Protocols specially adapted for file transfer, e.g. file transfer protocol [FTP]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/01—Protocols
- H04L67/12—Protocols specially adapted for proprietary or special-purpose networking environments, e.g. medical networks, sensor networks, networks in vehicles or remote metering networks
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Computer Security & Cryptography (AREA)
- General Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Computer Networks & Wireless Communication (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Computer Hardware Design (AREA)
- Computing Systems (AREA)
- Software Systems (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Business, Economics & Management (AREA)
- Tourism & Hospitality (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Multimedia (AREA)
- Technology Law (AREA)
- Databases & Information Systems (AREA)
- Economics (AREA)
- Data Mining & Analysis (AREA)
- Artificial Intelligence (AREA)
- Power Engineering (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- General Business, Economics & Management (AREA)
- Medical Informatics (AREA)
- Bioethics (AREA)
- Storage Device Security (AREA)
Abstract
本发明涉及一种随案电子卷宗保全和互认处理方法,包括如下步骤:步骤1.卷宗局部和整体保全,步骤2.卷宗来源互认,步骤3.卷宗撰写人互认,步骤4.卷宗内容互认。本发明通过对随案电子卷宗进行局部和整体信息保护,继承了传统卷宗整体信息保全,弥补了基于整体信息保全的不足;对随案电子卷宗内容不仅提供了内容认证,还结合局部和整体信息实现了电子卷宗内容的全方位保全。
Description
技术领域
本发明涉及信息加密及解密技术领域,特别涉及一种随案电子卷宗保全和互认处理方法。
背景技术
随着社会经济的快速发展和公民法律意识的增强,各级司法部门每年需要处理案件以千万级的数量递增,使得“案多人少”的矛盾日益突出,同时传统卷宗传送交接过程复杂。在卷宗流传过程易导致卷宗文件丢失、附卷材料混乱甚至遗漏,卷宗送归档过程中需要重复处理大量与案件审判结果无直接关系的事务性工作,降低了案件处理效率。为了提高其效率,各级司法部门初步建设了案件信息化和网上办案业务系统:全国法院和人民法庭构建了专网,实现了“一张网”办公办案和全程留痕监督;全国检察机关搭建了统一业务应用系统,实现了四级检察机关网上案件信息录入、案件处理流程管理及活动监督;一些司法职能机构也建立了单位内部业务管理系统:如“司法社区矫正管理系统”和“监狱管理信息系统”。虽然国内法院、检察院和司法行政机关已经开展了案件信息处理业务,基本上建立了各自的电子卷宗信息化管理系统,但法院、检察院和司法行政部门卷宗信息化处理系统相对独立,部门间卷宗自动流传技术尚处于起步阶段。目前,司法部门间卷宗流转环节仍依靠专人递送卷宗纸质版或证据材料的电子版(U盘,光盘);凭借司法人事职务介绍函确认卷宗来源;记录纸质版卷宗页数或者电子版卷宗容量实现卷宗内容保全。因此传统卷宗签收流转管理信息化技术(保全和互认)尚处于初期。
有关文件曾指出,各类案件在办理过程中实时将收集和产生的卷宗文件文档数据化和结构化处理,实现案件办理、诉讼服务和司法管理等各类业务的自动化和智能化,提供全方位智能服务。然而由于信息化技术起步较晚,目前法院在实际操作中只能采用立案、立卷、收集纸质诉讼材料、卷宗随案流传、结案归档及数字化等过程。在卷宗流传环节主要存在以下不足:1)卷宗在法院、检察院和司法行政等部门间流转效率低下,部门间交接前后均需重复处理大量与卷宗内容不直接相关的事务性工作,如卷宗格式规范审查,图像证据清晰度审查。2)卷宗来源确认事务复杂,目前依靠专人传送卷宗纸质版或者电子版,拼接司法人事职务介绍函确认卷宗来源,介绍函的签署和确认流程复杂,同时缺乏对交接过程监管。3)确认卷宗撰写人周期较长,目前正卷卷宗文件上在页眉处只能写明了撰写单位,在流程记录表汇中仅仅登记了递交的具体司法部门或单位,不能快速捕获撰写人。若需要查询撰写人,则需从相应司法部门的大量工作薄中依据时间和卷宗文件进行搜索,其查询人力和时间成本较高。4)在流转过程中不能有效保证卷宗内容是否存在篡改。目前根据纸质版卷宗页数或者电子版卷宗容量对内容进行整体保全,缺乏对卷宗局部信息和内容互认(是否被篡改)。
针对当前卷宗在司法部门间流转需大量重复处理与卷宗内容不直接相关的事务性工作,缺乏对卷宗文件局部、整体信息保全或者篡改辨识等系列问题。迫切需要覆盖公安、法院、检察院和司法行政机关等部分卷宗流转的保全和互认技术,对卷宗内容进行局部、整体保全和内容认证,实现卷宗自动流传,提高流转效率。
解决上述技术问题的难度:
1)卷宗保全和内容互认:目前电子卷宗主要由文本、图像、音频和视频等模态构成。图像、音频和视频文件仅仅作为卷宗内容的支撑材料,卷宗关键内容主要通过文本等自然语言来刻画,而自然语言虽然表达能力丰富,但一字之差则意思差之千里。
2)卷宗交接来源互认:目前卷宗流转仍需专人递送卷宗纸质版或者证据的电子版(U盘,光盘),卷宗传递过程缺乏监督,同时在交接前后不仅一方面需要多次重复处理大量与卷宗内容不直接相关的审查工作,如卷宗格式规范审查,图像证据清晰度审查,另一方面需要处理大量的卷宗交接事务性工作。为了减少卷宗流传过程的事务工作以及高效地卷宗互认。
3)卷宗撰写人互认:目前正卷卷宗文件上只写明了撰写单位,或卷宗交接记录表中仅仅登记了递交的具体司法部门,而不能直接快速地查询撰写人。这使得法律工作者难以直接对卷宗文件内容进行核实。
发明内容
为了克服背景技术中的问题,本发明提出一种随案电子卷宗保全和互认处理方法,通过对随案电子卷宗进行局部和整体信息保护,继承了传统卷宗整体信息保全,弥补了基于整体信息保全的不足;对随案电子卷宗内容不仅提供了内容认证,还结合局部和整体信息实现了电子卷宗内容的全方位保全;对阅卷人提供了随案电子卷宗文件的来源和撰写人信息互认;为案件卷宗签收流转管理信息化奠定了一定基础。
为了实现上述目的,本发明是按照以下方式实现的:
一种随案电子卷宗保全和互认处理方法,包括如下步骤:
1.步骤1.卷宗局部和整体保全
a.若为图像、音频、视频信息,对图像、音频和视频等卷宗文件保全方式仍沿用传统的整体保全,即记录其存储容量,其存储容量大小通过查询该文件属性项即可获取。
b.若为文本信息,则首先对解析电子文书卷宗PDF结构,利用文字识别方法提取卷宗文件的文本;其次统计各行字数和页码,并对各行字数求和得到文书卷宗的总字数;最后记录该文件每行字数、总字数和总页数,实现文书类卷宗的整体和局部信息保全。
2.步骤2.卷宗来源互认
将卷宗集中存储在第三方服务器中,分析了文本、图像、音频和视频等内容的表现方式,其中图像、音频和视频表现为像素空间域分布或者时空域像素变化,主要用于证据支撑而不允许任意修改;文本卷宗主要由法院、检察院、司法行政或司法个人依据案情独立提供的文书,该类卷宗描述了案件关键内容,为了便于阅读人及时确认文本卷宗来源,运用数字水印技术在文本卷宗上嵌入存储服务器域名,以便阅读人及时确认该文件来源。
首先解析文书类卷宗PDF结构,获取每页卷宗PDF的最顶层;其次将卷宗存储的第三方服务器域名45度角倾斜,并设置为透明度为0.6作为水印信息;最后计算水印嵌入位置,并将水印加性嵌入每页卷宗PDF的最顶层。
3.步骤3.卷宗撰写人互认
运用数字签名算法,在卷宗PDF格式嵌入撰写人相关信息。卷宗数字签名包括初始化秘钥、私有秘钥签名和公开秘钥验证过程:
(1)初始化秘钥:
首先生产素数p、q和参数g使得:
其次生成卷宗撰写人的私有秘钥x,x是随机数,且满足:0<x<q。最后生产公开秘钥y,且满足:y=gxmodp。在司法系统中参数p、q、g和公开秘钥y。
(2)私有密钥签名:
首先根据撰写人工号从司法人事数据库中查询其相关信息M,将信息M运用MD5,算法生成128位的哈希值H(M);其次计算R和S:
式中k为临时密钥。
将撰写人相关信息M的签名(R,S)和撰写人工号加载到随案卷宗的指定位置。
其次,根据撰写人工号从司法人事数据库中查询其相关信息M,并运用MD5 算法计算M的哈希值H(M),同时计算v:
最后检验v和R′是否相等,如果v=R′则签名有效,反之则签名无效。
步骤5.卷宗内容互认
根据卷宗文书特点运用MD5算法,计算传送前后文本卷宗的哈希值,通过比较两者的哈希值确认该卷宗内容是否被篡改。
MD5算法将任意长度卷宗文本通过不可逆文本通过不可逆的字符串变换算法转化成杂乱的128位消息摘要,即哈希值。为了防止卷宗被篡改,哈希值应敏感于输入卷宗文件,即使卷宗文件更改一个符号或文字其结果应该截然不同。该算法将任意输入的卷宗文本划分为512位分组,每分组又划分为16个32位子分组,经过了系列的处理输出由四个32位分组,将其级联后将生产一个128 位哈希值。具体算法如下:
(1)卷宗文字提取。解析电子文书卷宗的PDF结构,利用文字识别方法提取卷宗文本。
(2)数据填充。由于不同卷宗文本长短差异较大,任意长度的卷宗文本转换成转化成杂乱的128位哈希值,需要进行数据填充。具体操作为:将输入的卷宗文本转化为二进制序列,在其二进制序列后面填充一个1和无数个0形成伪二进制序列,使其序列字节长度对512取模为448.假设伪二进制序列长度为 X,即满足Xmod 512=448。
(3)设定4个32位的链接整数变量和4个线性函数,其中4个链接整数变量分别A=0x67452301,B=0x0EFCDAB89,C=0x98BADCFE,D=0x10325476;4个线性函数分别为:
式中~,|,&,∧分别表示非,或、与和异或操作。
(4)对伪二进制序列进行循环运算,其循环次数是分组个数(N+1)。每次循环的具体过程如下:
首先对每份组的16个子分组进行4种左移位,第j个子分组Mj左移位操作分别为:
FF(a,b,c,d,Mj,s,ti):a=b+((a+F(b,c,d)+Mj+ti)<<s)
GG(a,b,c,d,Mj,s,ti):a=b+((a+G(b,c,d)+Mj+ti)<<s)
HH(a,b,c,d,Mj,s,ti):a=b+((a+H(b,c,d)+Mj+ti)<<s)
II(a,b,c,d,Mj,s,ti):a=b+((a+I(b,c,d)+Mj+ti)<<s)
式中常数ti=232|sin(i)|。
其次每分组的16个子分组依次进行
FF(a,b,c,d,Mj,s,ti),j=0,1,…15,GG(a,b,c,d,Mj,s,ti),j=0,1,…15,
GG(a,b,c,d,Mj,s,ti),j=0,1,…15,GG(a,b,c,d,Mj,s,ti),j=0,1,…15,左移位,最后将A,B,C,D分别加上a,b,c,d后进入下一循环。
本发明的有益效果:
随着互联网在各个领域的广泛应用,而传统卷宗保全和互认技术降低了卷宗文件在法院、检察院、司法行政、公安等司法部门流传效率。对此本发明促进了随案电子卷宗在各部门间快速流转,减轻了司法人员从事与案件审判结果无直接关系的工作量,支持法院、检察院、司法行政和公安等部门间电子卷宗的无缝交接,实现无纸化办案。具体表现为:
1)本发明提取了卷宗文件整体和局部信息,一方面利用整体信息实现了对卷宗文件总页数和总字数等全局保全,弥补了传统仅仅从卷宗文件页数或者电子卷宗存储容量进行保全的不足;另一方面结合卷宗文件局部信息实现了各行字数保全。
2)本发明在卷宗流传过程中增加了卷宗哈希值,解决了电子卷宗在法院、检察院、司法行政和公安等司法部门流传中对卷宗文件等字数替换和篡改问题,实现了电子卷宗基本单元保全,为卷宗在流传过程中提供了数据级别的保护和内容互认。
3)在卷宗文件撰写者互认方面,传统只能通过查阅交接记录确定文件上交部门,再查阅部门内部相关文件才能确认卷宗撰写者。本发明在传统电子卷宗上增加了数字签名,以便阅读人及时了解该文件的撰写司法部门或者个人,实现了卷宗撰写者互认。减少了传统互认的时间和周期,节约了人力,提高了撰写者互认效率。
4)在卷宗文件存储方面,目前采用公安、检察院和法院各级存储,使得每份卷宗文件多次备份存贮,导致存储设备浪费。本发明将卷宗文件集中存储在第三方服务器中,并在电子卷宗上增加了数字水印。一方面以便阅读人及时了解该文件来源服务器及其地质;另一方面较少了存储容量。
5)在卷宗来源互认方面,目前依据司法部门间的人事身份互认机制,确认卷宗流传宗来源。本发明传统电子卷宗上增加了数字水印,以便阅读人及时确认该文件来源和真实性,减少了卷宗文件真实性确认的时间,提高了流传效率。
6)本发明以法院、检察院、司法行政、公安等司法部门间电子卷宗流传过程,对卷宗文件的保全和互认问题,构建了流程框架,为构建跨部门电子文件快速流传奠定了一定的基础。
附图说明
图1为本发明的随案电子卷宗保全和互认流程图;
图2为本发明的流程示意图。
具体实施方式
为了使本发明的目的、技术方案和有益效果更加清楚、明白,下面将结合附图,对本发明的优选实施例进行详细的说明,以方便技术人员理解。
一种随案电子卷宗保全和互认处理方法,包括如下步骤:
S101.卷宗局部和整体保全
S102.卷宗来源互认
S103.卷宗撰写人互认
S104.卷宗内容互认。
案件处理主要涉及法院、检察院、司法行政机关和诉讼参与人(律师)等部门独立联合工作:案件卷宗主要来源于各司法部门或个人依据案情独立提供的文书、图像、音频和视频等文件;各司法部门随案独立阅读传送的卷宗文件;联合分析、辩论案情。传统案件处理流程中需要重复处理与案件审判结果无直接相关的事务性,如卷宗整理和卷宗送归等,耗费了大量人力和时间。随着社会经济的发展和人民群众法律意识的提高,各级司法部门需要处理的案件量逐年增长,而实际操作中仍沿用立案、立卷、收集纸质诉讼材料、卷宗随案流传、结案归档、档案扫描数字化等系列办法。在“人案矛盾”扩大情况下,卷宗流转过程中频繁出现卷宗丢失、附卷材料混乱、卷宗送档不及时等现象。其主要原因在于:1)由于“案多人少”,卷宗整理和送档等事务性工作常被延后或耽搁,不能实现立案暨归档机制。2)目前审书人人员大部分采用人工送档,其质量和效率不高。3)人工送档方式,对卷宗来源及撰写人确认复杂,且无法实现过程监督。
为了减轻司法工作者的办案压力,改革优化卷宗流传流程,借助互联网技术将与案件审判结果无直接相关的事务性工作交由卷宗信息化系统自动处理,将卷宗文件存储在各个政法服务公司的数据中心,实现卷宗优化集中管理。本发明针对卷宗在法院、检察院、司法行政机关和诉讼参与人(律师)之间传送签收,总结了传统卷宗流传方式存在的不足,分析了互联网环境下卷宗自动向承办人提交环节的核心问题:卷宗保全和互认,提出了一种随案电子卷宗保全和互认方法。
其主要内容如下:
如图1,如下:
1)卷宗局部和整体保全
电子卷宗主要由文本、图像、音频和视频等模态构成。其中图像、音频和视频等客观证据文件内容常常借助像素在空间域分布或者时空域变化等形式进行刻画,传统对其保全采用记录电子版容量方式。由于图像、音频和视频存在大量冗余信息,对其内容局部篡改虽可能不改变其容量大小,但篡改技术要求高且难度较大。倘若篡改图像局部内容必须由计算机图像处理专业人员花费大量时间借助专业技术才能进行粗略篡改,但篡改痕迹人眼易于辨识。对音频和视频内容篡改需要删除局部时间段媒体,这样会导致其存储容量差异较大。所以本发明对图像、音频和视频等卷宗文件保全方式仍沿用传统的整体保全,即记录其存储容量。其存储容量大小通过查询该文件属性项即可获取。
案件关键内容都记录在文书类文件中,该文件主要表现为文本字数,行数和页数。传统方法利用文书页数对其进行简单的内容保全,而忽略了文书每行字数和总字数等信息。本发明继承传统文书保全方法,完善局部信息保护弥补了文书整体保全的不足,其具体方法如下:首先对解析电子文书卷宗PDF结构,利用文字识别技术提取卷宗文件的文本;其次统计各行字数和页码,并对各行字数求和得到文书卷宗的总字数;最后记录该文件每行字数、总字数和总页数。实现文书类卷宗的整体和局部信息保全。
2)卷宗来源互认
目前卷宗文件存储在各级公安、检察院和法院的数据中心或卷宗资料室中,使得每份卷宗文件多次备份存贮,导致存储设备浪费。而卷宗来源互认方面依据司法部门间的人事身份互认机制。本发明将卷宗集中存储在第三方服务器中,分析了文本、图像、音频和视频等内容的表现方式,其中图像、音频和视频表现为像素空间域分布或者时空域像素变化,他们主要用于证据支撑而不允许任意修改;文本卷宗主要由法院、检察院、司法行政或司法个人依据案情独立提供的文书,该类卷宗描述了案件关键内容,为了便于阅读人及时确认文本卷宗来源,本发明运用数字水印技术在文本卷宗上嵌入了存储服务器域名,一遍阅读人及时确认该文件来源。
本发明的具体过程:首先解析文书类卷宗PDF结构,获取每页卷宗PDF的最顶层;其次将卷宗存储的第三方服务器域名45度角清晰,并设置为透明度为 0.6作为水印信息;最后计算水印嵌入位置,并将水印加性嵌入每页卷宗PDF的最顶层。
3)卷宗撰写人互认
案件卷宗主要由法院、检察院、司法行政或司法个人依据案情独立提供的文书类、图像、音频和视屏类等证据类文件,从卷宗文件撰写人的角度来看,案件卷宗可以认为是不同司法人员撰写、收集和采集的各类文件总称。为了便于阅卷个人或者部门确认卷宗撰写人,本发明运用数字签名(DSA)算法,在卷宗PDF格式嵌入撰写人相关信息。
卷宗数字签名是指卷宗撰写人利用私有秘钥对其相关信息进行加密后所得的数据。从技术上而言,它是通过一个单向函数对撰写人的相关信息进行处理,产生无任何意义的数字串,并用来证明撰写人信息是否发生了变化。在数字签名中,运用撰写人的私有秘钥签署随案电子卷宗,利用公开秘钥进行验证签名,其中公开秘钥存放司法人事数据库中。卷宗数字签名包括初始化秘钥,私有秘钥签名和公开秘钥验证过程:
(1)初始化秘钥:
首先生成素数p、q和参数g使得:
其次生成卷宗撰写人的私有秘钥x,x是随机数,且满足:0<x<q。最后生成公开秘钥y,且满足:y=gxmodp。在司法系统中参数p、q、g和公开秘钥y。
(2)私有密钥签名:
首先根据撰写人工号从司法人事数据库中查询其相关信息M,将信息M运用MD5,算法生成128位的哈希值H(M);其次计算R和S:
式中k为临时密钥。
将撰写人相关信息M的签名(R,S)和撰写人工号加载到随案卷宗的指定位置。
其次,根据撰写人工号从司法人事数据库中查询其相关信息M,并运用MD5 算法计算M的哈希值H(M),同时计算v:
最后检验v和R′是否相等,如果v=R′则签名有效,反之则签名无效。
4)卷宗内容互认
卷宗关键内容主要通过文本等自然语言来刻画,文本卷宗具有以下特点:1) 不同卷宗文本长短差异较大,比如拘留证仅仅只有几行文本,而询问笔录则多达几十页;2)自然语言虽然表达能力丰富,但一字之差则意思差之千里。文本卷宗内容容易认为篡改,若对卷宗文本的字或者词进行简单地替换,就可以更改卷宗关键内容;3)传统卷宗内容互认常常运用文字比对技术,但该技术需要参考卷宗。在实际上送档的卷宗,每份卷宗是唯一的,但缺乏比对所需的参考卷宗,导致文字比对技术失败。为了保证文本卷宗在传送过程未被恶意篡改,本发明根据卷宗文书特点运用MD5(哈希)算法,计算传动前后文本卷宗的哈希值,通过比较两者的哈希值确认该卷宗内容是否被篡改。
MD5算法将任意长度卷宗文本通过不可逆文本通过不可逆的字符串变换算法转化成杂乱的128位消息摘要,即哈希值。为了防止卷宗被篡改,哈希值应敏感于输入卷宗文件,即使卷宗文件更改一个符号或文字其结果应该截然不同。该算法将任意输入的卷宗文本划分为512位分组,每分组又划分为16个32位子分组,经过了系列的处理输出由四个32位分组,将其级联后将生产一个128 位哈希值。具体算法如下:
(1)卷宗文字提取。解析电子文书卷宗的PDF结构,利用文字识别技术提取卷宗文本。
(2)数据填充。由于不同卷宗文本长短差异较大,任意长度的卷宗文本转换成转化成杂乱的128位哈希值,需要进行数据填充。具体操作:将输入的卷文本转化为二进制序列,在其二进制序列后面填充一个1和无数个0形成伪二进制序列,使其序列字节对512取模为448.假设伪二进制序列长度为X,即满足Xmod512=448。
(3)设定4个32位的链接整数变量和4个线性函数,其中4个链接整数变量分别A=0x67452301,B=0x0EFCDAB89,C=0x98BADCFE,D=0x10325476;4个线性函数分别为:
式中~,|,&,∧分别表示非,或、与和异或操作。
(4)对伪二进制序列进行循环运算,其循环次数是分组个数(N+1)。每次循环的具体过程如下:
首先对每份组的16个子分组进行4种左移位,第j个子分组Mj左移位操作分别为:
FF(a,b,c,d,Mj,s,ti):a=b+((a+F(b,c,d)+Mj+ti)<<s)
GG(a,b,c,d,Mj,s,ti):a=b+((a+G(b,c,d)+Mj+ti)<<s)
HH(a,b,c,d,Mj,s,ti):a=b+((a+H(b,c,d)+Mj+ti)<<s)
II(a,b,c,d,Mj,s,ti):a=b+((a+I(b,c,d)+Mj+ti)<<s)
式中常数ti=232|sin(i)|。
其次每分组的16个子分组依次进行
FF(a,b,c,d,Mj,s,ti),j=0,1,…15,GG(a,b,c,d,Mj,s,ti),j=0,1,…15,
GG(a,b,c,d,Mj,s,ti),j=0,1,…15,GG(a,b,c,d,Mj,s,ti),j=0,1,…15,左移位,最后将A,B,C,D分别加上a,b,c,d后进入下一循环。
最后说明的是,以上所述为本发明的优选实施方式,尽管通过上述优选实施例,已经对本发明进行了详细的说明,但本领域技术人员应当理解,可以在形式上和细节上对其作出各种改变,而不偏离本发明的权利要求书所要求的的范围。
Claims (8)
1.一种随案电子卷宗保全和互认处理方法,其特征在于,包括如下步骤:
步骤1.卷宗局部和整体保全;
步骤2.卷宗来源互认;
步骤3.卷宗撰写人互认;
步骤4.卷宗内容互认。
2.根据权利要求1所述的随案电子卷宗保全和互认处理方法,其特征在于,步骤1中若为图像、音频、视频信息,则对图像、音频和视频的卷宗文件保全采用整体保全,即记录其存储容量,其存储容量大小通过查询文件属性项获取。
3.根据权利要求1所述的随案电子卷宗保全和互认处理方法,其特征在于,步骤1中若为文本信息,则首先解析电子文书卷宗PDF结构,利用文字识别方法提取卷宗文件的文本;其次统计各行字数和页码,并对各行字数求和得到文书卷宗的总字数;最后记录该文件每行字数、总字数和总页数,实现文书类卷宗的整体和局部信息保全。
4.根据权利要求1所述的随案电子卷宗保全和互认处理方法,其特征在于,若卷宗为图像、音频、视频信息,则步骤2中采用将卷宗集中存储在第三方服务器中,分析文本、图像、音频和视频的内容的表现方式,其中图像、音频和视频表现为像素空间域分布或者时空域像素变化,用于证据支撑而不允许任意修改。
5.根据权利要求1所述的随案电子卷宗保全和互认处理方法,其特征在于,若卷宗为文本信息,文本卷宗由法院、检察院、司法行政或司法个人依据案情独立提供的文书,该类卷宗描述了案件关键内容,为了便于阅读人及时确认文本卷宗来源,则步骤2中运用数字水印方法在文本卷宗上嵌入存储服务器域名,以便阅读人及时确认该文件来源。
6.根据权利要求5所述的随案电子卷宗保全和互认处理方法,其特征在于,具体操作是首先解析文书类卷宗PDF结构,获取每页卷宗PDF的最顶层;其次将卷宗存储的第三方服务器域名45度角倾斜,并设置为透明度为0.6作为水印信息;最后计算水印嵌入位置,并将水印加性嵌入每页卷宗PDF的最顶层。
7.根据权利要求1所述的随案电子卷宗保全和互认处理方法,其特征在于,步骤3包括运用数字签名算法,在卷宗PDF格式嵌入撰写人相关信息,卷宗数字签名包括初始化秘钥、私有秘钥签名和公开秘钥验证过程:
(1)初始化秘钥:
首先生产素数p、q和参数g使得:
其次生成卷宗撰写人的私有秘钥x,x是随机数,且满足:0<x<q,最后生产公开秘钥y,且满足:y=gxmodp,在司法系统中参数p、q、g和公开秘钥y;
(2)私有密钥签名:
首先根据撰写人工号从司法人事数据库中查询其相关信息M,将信息M运用MD5,算法生成128位的哈希值H(M);其次计算R和S:
式中k为临时密钥;
将撰写人相关信息M的签名(R,S)和撰写人工号加载到随案卷宗的指定位置,其次,根据撰写人工号从司法人事数据库中查询其相关信息M,并运用MD5算法计算M的哈希值H(M),同时计算v:
最后检验v和R′是否相等,如果v=R′则签名有效,反之则签名无效。
8.根据权利要求1所述的随案电子卷宗保全和互认处理方法,其特征在于,步骤4包括根据卷宗文书特点运用MD5算法,计算传送前后文本卷宗的哈希值,通过比较两者的哈希值确认该卷宗内容是否被篡改:
MD5算法将任意长度卷宗文本通过不可逆文本、不可逆的字符串变换算法转化成杂乱的128位消息摘要,即哈希值,为了防止卷宗被篡改,哈希值应敏感于输入卷宗文件,即使卷宗文件更改一个符号或文字其结果应该截然不同,该算法将任意输入的卷宗文本划分为512位分组,每分组又划分为16个32位子分组,经过了系列的处理输出由四个32位分组,将其级联后将生产一个128位哈希值,具体算法如下:
(1)卷宗文字提取
解析电子文书卷宗的PDF结构,利用文字识别方法提取卷宗文本;
(2)数据填充
由于不同卷宗文本长短差异较大,任意长度的卷宗文本转换成杂乱的128位哈希值,需要进行数据填充;
具体操作为:将输入的卷宗文本转化为二进制序列,在其二进制序列后面填充一个1和无数个0形成伪二进制序列,使其序列字节长度对512取模为448,假设伪二进制序列长度为X,即满足X mod 512=448;
(3)设定4个32位的链接整数变量和4个线性函数,其中4个链接整数变量分别A=0x67452301,B=0x0EFCDAB89,C=0x98BADCFE,D=0x10325476;4个线性函数分别为:
式中~,|,&,∧分别表示非,或、与和异或操作;
(4)对伪二进制序列进行循环运算,其循环次数是分组个数(N+1),每次循环的具体过程如下:
首先对每份组的16个子分组进行4种左移位,第j个子分组Mj左移位操作分别为:
FF(a,b,c,d,Mj,s,ti):a=b+((a+F(b,c,d)+Mj+ti)<<s)
GG(a,b,c,d,Mj,s,ti):a=b+((a+G(b,c,d)+Mj+ti)<<s)
HH(a,b,c,d,Mj,s,ti):a=b+((a+H(b,c,d)+Mj+ti)<<s)
II(a,b,c,d,Mj,s,ti):a=b+((a+I(b,c,d)+Mj+ti)<<s)
式中常数ti=232|sin(i)|;
其次每分组的16个子分组依次进行
FF(a,b,c,d,Mj,s,ti),j=0,1,…15,GG(a,b,c,d,Mj,s,ti),j=0,1,…15,
GG(a,b,c,d,Mj,s,ti),j=0,1,…15,GG(a,b,c,d,Mj,s,ti),j=0,1,…15,左移位,最后将A,B,C,D分别加上a,b,c,d后进入下一循环。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011250318.7A CN112365373B (zh) | 2020-11-10 | 2020-11-10 | 一种随案电子卷宗保全和互认处理方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011250318.7A CN112365373B (zh) | 2020-11-10 | 2020-11-10 | 一种随案电子卷宗保全和互认处理方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112365373A true CN112365373A (zh) | 2021-02-12 |
CN112365373B CN112365373B (zh) | 2022-07-12 |
Family
ID=74508677
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011250318.7A Expired - Fee Related CN112365373B (zh) | 2020-11-10 | 2020-11-10 | 一种随案电子卷宗保全和互认处理方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112365373B (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20210344504A1 (en) * | 2018-12-31 | 2021-11-04 | Lleidanetworks Serveis Telemàtics, S.A. | Universal certified and qualified contracting method |
CN114661524A (zh) * | 2022-03-21 | 2022-06-24 | 重庆市规划和自然资源信息中心 | 基于日志分析的不动产登记数据回备技术的实现方法 |
CN117236899A (zh) * | 2023-10-17 | 2023-12-15 | 广西北投声远科技股份公司 | 基于移动终端的电子卷宗信息发布系统 |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20050204037A1 (en) * | 2004-03-09 | 2005-09-15 | Levy Kenneth L. | Method and apparatus for content identification/control |
US7124094B1 (en) * | 1999-10-27 | 2006-10-17 | Konica Corporation | Print system, service system, data server, master server, print client system and printer |
CN101894238A (zh) * | 2010-08-09 | 2010-11-24 | 中国人民解放军海军工程大学 | 基于双重认证的word文档电子印章系统及方法 |
CN105160262A (zh) * | 2015-08-25 | 2015-12-16 | 浙江工业大学 | 一种基于Struts2框架和MD5加密技术的服务器上传文件命名方法 |
CN107204852A (zh) * | 2017-06-23 | 2017-09-26 | 郑州云海信息技术有限公司 | 一种基于数据一致性校验算法的优化算法 |
CN108243146A (zh) * | 2016-12-23 | 2018-07-03 | 航天星图科技(北京)有限公司 | 一种高效的信息提交方法 |
PT110223A (pt) * | 2017-07-27 | 2019-03-19 | Beyond Emotions Lda | Sistema de assinatura de voz indiscutível e não repudiável, legalmente vinculante |
CN109902197A (zh) * | 2019-02-28 | 2019-06-18 | 山西同方知网数字出版技术有限公司 | 一种基于司法卷宗图像的电子化存储方法 |
CN110597818A (zh) * | 2019-09-19 | 2019-12-20 | 腾讯科技(深圳)有限公司 | 基于区块链的卷宗查询方法、装置、设备及存储介质 |
-
2020
- 2020-11-10 CN CN202011250318.7A patent/CN112365373B/zh not_active Expired - Fee Related
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7124094B1 (en) * | 1999-10-27 | 2006-10-17 | Konica Corporation | Print system, service system, data server, master server, print client system and printer |
US20050204037A1 (en) * | 2004-03-09 | 2005-09-15 | Levy Kenneth L. | Method and apparatus for content identification/control |
CN101894238A (zh) * | 2010-08-09 | 2010-11-24 | 中国人民解放军海军工程大学 | 基于双重认证的word文档电子印章系统及方法 |
CN105160262A (zh) * | 2015-08-25 | 2015-12-16 | 浙江工业大学 | 一种基于Struts2框架和MD5加密技术的服务器上传文件命名方法 |
CN108243146A (zh) * | 2016-12-23 | 2018-07-03 | 航天星图科技(北京)有限公司 | 一种高效的信息提交方法 |
CN107204852A (zh) * | 2017-06-23 | 2017-09-26 | 郑州云海信息技术有限公司 | 一种基于数据一致性校验算法的优化算法 |
PT110223A (pt) * | 2017-07-27 | 2019-03-19 | Beyond Emotions Lda | Sistema de assinatura de voz indiscutível e não repudiável, legalmente vinculante |
CN109902197A (zh) * | 2019-02-28 | 2019-06-18 | 山西同方知网数字出版技术有限公司 | 一种基于司法卷宗图像的电子化存储方法 |
CN110597818A (zh) * | 2019-09-19 | 2019-12-20 | 腾讯科技(深圳)有限公司 | 基于区块链的卷宗查询方法、装置、设备及存储介质 |
Non-Patent Citations (4)
Title |
---|
刘祺: "数字水印技术的应用研究", 《华南金融电脑》 * |
周荣: "计算机取证系统中的电子证据防篡改研究", 《中国优秀博硕士学位论文全文数据库(硕士)信息科技辑》 * |
杨占民等: "基于MD5和数字水印的电子签章文件校验方案", 《贵州大学学报(自然科学版)》 * |
袁薇: "MD5报文摘要算法的研究与实现", 《科技信息》 * |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20210344504A1 (en) * | 2018-12-31 | 2021-11-04 | Lleidanetworks Serveis Telemàtics, S.A. | Universal certified and qualified contracting method |
CN114661524A (zh) * | 2022-03-21 | 2022-06-24 | 重庆市规划和自然资源信息中心 | 基于日志分析的不动产登记数据回备技术的实现方法 |
CN117236899A (zh) * | 2023-10-17 | 2023-12-15 | 广西北投声远科技股份公司 | 基于移动终端的电子卷宗信息发布系统 |
CN117236899B (zh) * | 2023-10-17 | 2024-05-28 | 广西北投声远科技股份公司 | 基于移动终端的电子卷宗信息发布系统 |
Also Published As
Publication number | Publication date |
---|---|
CN112365373B (zh) | 2022-07-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112365373B (zh) | 一种随案电子卷宗保全和互认处理方法 | |
US20190372769A1 (en) | Blockchain-universal document identification | |
US11288345B2 (en) | Identifying copyrighted material using embedded timestamped copyright information | |
US10755252B1 (en) | Identifying copyrighted material using embedded copyright information | |
US20210312019A1 (en) | Identifying copyrighted material using embedded copyright information | |
US11017061B2 (en) | Identifying copyrighted material using copyright information embedded in electronic files | |
US20020052896A1 (en) | Secure signature and date placement system | |
US20090157987A1 (en) | System and Method for Creating Self-Authenticating Documents Including Unique Content Identifiers | |
US8176409B2 (en) | System and method for electronic publication of scientific data and analysis | |
CN107665399A (zh) | 一种基于数字签名技术的人事档案存贮和可信电子文件管理方法 | |
US20210201430A1 (en) | Identifying copyrighted material using copyright information embedded in tables | |
US10810325B2 (en) | Method for custody and provenance of digital documentation | |
US11256787B2 (en) | Identifying copyrighted material using embedded copyright information | |
CN112685795B (zh) | 数字存证创建方法、数字存证验证方法和数字存证系统 | |
US8335922B2 (en) | Recording medium, digital information verification apparatus, and digital information verification method | |
Justina et al. | A Secured Cloud-Based Electronic Document Management System | |
CN104182525A (zh) | 应用有版权保护功能的多媒体文件和国密算法的电子档案管理装置 | |
US20100084849A1 (en) | System and Method for Linking Digital and Printed Contents Using Unique Content Identifiers | |
Yang et al. | BDCP: a framework for big data copyright protection based on digital watermarking | |
Nandakumar et al. | Proving multimedia integrity using sanitizable signatures recorded on blockchain | |
KR20090001457A (ko) | 공인전자문서보관소에서의 약관 보관, 증명 및 버전관리서비스 제공 시스템 및 그 방법 | |
CN114792270B (zh) | 基于区块链的贷款合同在线签署系统 | |
CN113888131B (zh) | 基于区块链的工时信息处理方法、装置、设备及存储介质 | |
Geethanjali et al. | Ipfs-based image sharing using perceptual hash code with digital right management | |
Eisenberg et al. | Building an Electronic Records Archive at the National Archives and Records Administration: Recommendations for a Long-Term Strategy |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20220712 |