CN116402477A - 一种档案数字化信息管理系统 - Google Patents
一种档案数字化信息管理系统 Download PDFInfo
- Publication number
- CN116402477A CN116402477A CN202310663986.XA CN202310663986A CN116402477A CN 116402477 A CN116402477 A CN 116402477A CN 202310663986 A CN202310663986 A CN 202310663986A CN 116402477 A CN116402477 A CN 116402477A
- Authority
- CN
- China
- Prior art keywords
- electrically connected
- file
- output end
- information
- item
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000012795 verification Methods 0.000 claims abstract description 93
- 238000012545 processing Methods 0.000 claims abstract description 39
- 238000000034 method Methods 0.000 claims abstract description 29
- 230000008569 process Effects 0.000 claims abstract description 21
- 238000007726 management method Methods 0.000 claims description 75
- 238000000605 extraction Methods 0.000 claims description 21
- 238000010586 diagram Methods 0.000 claims description 9
- 230000011218 segmentation Effects 0.000 claims description 9
- 238000012550 audit Methods 0.000 claims description 8
- 230000006855 networking Effects 0.000 claims description 3
- 230000000694 effects Effects 0.000 abstract description 6
- 230000006870 function Effects 0.000 abstract description 5
- 238000012552 review Methods 0.000 description 7
- 238000004422 calculation algorithm Methods 0.000 description 6
- 238000007635 classification algorithm Methods 0.000 description 3
- 238000001914 filtration Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 230000002123 temporal effect Effects 0.000 description 2
- 238000012549 training Methods 0.000 description 2
- 230000002411 adverse Effects 0.000 description 1
- 238000013475 authorization Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 230000008092 positive effect Effects 0.000 description 1
- 238000012384 transportation and delivery Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/10—Office automation; Time management
- G06Q10/103—Workflow collaboration or project management
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/22—Indexing; Data structures therefor; Storage structures
- G06F16/2228—Indexing structures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/22—Indexing; Data structures therefor; Storage structures
- G06F16/2282—Tablespace storage structures; Management thereof
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/60—Protecting data
- G06F21/62—Protecting access to data via a platform, e.g. using keys or access control rules
- G06F21/6218—Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
- G06F21/6227—Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database where protection concerns the structure of data, e.g. records, types, queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2221/00—Indexing scheme relating to security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F2221/21—Indexing scheme relating to G06F21/00 and subgroups addressing additional information or applications relating to security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F2221/2141—Access rights, e.g. capability lists, access control lists, access tables, access matrices
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Human Resources & Organizations (AREA)
- Strategic Management (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Software Systems (AREA)
- Entrepreneurship & Innovation (AREA)
- General Business, Economics & Management (AREA)
- Tourism & Hospitality (AREA)
- Quality & Reliability (AREA)
- Operations Research (AREA)
- Marketing (AREA)
- Economics (AREA)
- Health & Medical Sciences (AREA)
- Bioethics (AREA)
- General Health & Medical Sciences (AREA)
- Computer Hardware Design (AREA)
- Computer Security & Cryptography (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明涉及数据处理系统技术领域,具体为一种档案数字化信息管理系统,档案数字化信息管理系统是由档案综合管理系统、权限管理数据库、登入验证系统、档案入库管理系统、档案数据库组成。本发明中,在档案入库操作过程中,基于证书信息和印章信息生成对应数字证书、电子签章,作为检索相关条件,并基于内容项识别单元运作,达成标题、内容识别效果,对档案文件进行数字化处理,并提取关键词和短句,过滤无效词汇并生成档案词汇表,基于数据标签建立改写单元运作生成档案的状态标签以及特征标签,并基于此在管理过程中建立状态索引、特征索引、特征门类索引,以此达成对于档案数据高自动化、准确性的归类管理功能,确保审核、处理工作的高效执行。
Description
技术领域
本发明涉及数据处理系统技术领域,尤其涉及一种档案数字化信息管理系统。
背景技术
数据处理系统,是一种通过自身系统结构,达成行政、商业、金融、管理、监督或预测目的专业系统,其原理是基于数据项目分类方法,给数据处理中的审核、批处理、预测等工作提供便捷,达成数据批量化、联合处理效果。
在现有数据处理系统中,由于档案所递交的文件类型往往为不可更改的矢量图形文件,而对档案文件所执行的数据处理工作,也往往仅能够通过档案中所附带证书信息、档案名,以及存储过程中操作人员的手动分类,进行划分,但由于档案所附带签证信息具有权利效用,较难进行更改,导致档案信息管理工作的灵活性较弱,而档案文件名以及操作人员手动分类操作,均为人员手动执行,速率较低的同时容易出现误差,会给后续的管理、审阅工作造成不良影响,需要进行改进。
发明内容
本发明的目的是解决现有技术中存在的缺点,而提出的一种档案数字化信息管理系统。
为了实现上述目的,本发明采用了如下技术方案:一种档案数字化信息管理系统是由档案综合管理系统、权限管理数据库、登入验证系统、档案入库管理系统、档案数据库组成,所述档案综合管理系统的输出端与权限管理数据库、登入验证系统、档案入库管理系统、档案数据库的输入端电性连接,所述权限管理数据库的输出端与登入验证系统的输入端电性连接,所述档案入库管理系统的输出端电性连接有档案数字化处理单元,所述档案数字化处理单元的输出端电性连接有内容项识别单元,所述内容项识别单元的输出端电性连接有数据标签建立改写单元,所述数据标签建立改写单元的输出端与档案数据库的输入端电性连接,所述档案数据库的输出端电性连接有档案调用审核单元,所述档案调用审核单元的输出端电性连接有档案处理执行单元,所述档案处理执行单元的输出端电性连接有处理项记录单元,所述处理项记录单元的输出端与数据标签建立改写单元的输入端电性连接。
作为本发明的进一步方案:所述权限管理数据库包括表间调用索引、内容项目表集群,所述表间调用索引的输出端与内容项目表集群的输入端电性连接,所述内容项目表集群包括人员信息表、职权信息表,所述人员信息表包括用户编码、密钥信息、指纹信息、人脸信息,所述职权信息表包括用户编码副本、所属部门、职位信息,所述用户编码、用户编码副本、所属部门、职位信息的输出端电性连接有权限详情表。
作为本发明的进一步方案:所述权限详情表包括用户编码投影、部门门类、权限级别,所述部门门类的输出端电性连接有可选档案类,所述权限级别的输出端电性连接有操作项目集,所述操作项目集的输出端电性连接有只读预览、档案递交、档案审核、档案改写,所述档案改写的输出端电性连接有可见档案改写、从属档案改写。
作为本发明的进一步方案:所述登入验证系统的输出端电性连接有用户编码填写,所述用户编码填写的输出端电性连接有人员信息表检索,所述人员信息表检索的第一输出端与登入验证系统的输入端电性连接,所述人员信息表检索的第二输出端电性连接有人员信息表调用,所述人员信息表调用的输出端电性连接有验证随机信息调取,所述验证随机信息调取的输出端电性连接有随机信息项目,所述随机信息项目的输出端电性连接有组合验证项提交,所述组合验证项提交的输出端电性连接有验证项比对,所述验证项比对的第一输出端与登入验证系统的输入端电性连接,所述验证项比对的第二输出端电性连接有验证通过,所述验证通过的输出端电性连接有权限详情表调用,所述权限详情表调用的输出端电性连接有可操作项目信息,所述可操作项目信息的输出端电性连接有系统登入。
作为本发明的进一步方案:所述档案入库管理系统的输出端电性连接有档案递交审核单元,所述档案递交审核单元的输出端电性连接有档案文件上传,所述档案文件上传的输出端电性连接有电子签章发布单元,所述电子签章发布单元的输出端电性连接有档案内容项提取,所述档案内容项提取的输出端电性连接有证书信息、印章信息,所述证书信息的输出端与印章信息的输入端电性连接,所述证书信息、印章信息的输出端电性连接有信息验证单元。
作为本发明的进一步方案:所述信息验证单元包括证书印章比对认证、证书真伪认证、印章真伪认证,所述证书真伪认证、印章真伪认证的输出端电性连接有联网信息检索,所述证书真伪认证包括格式识别、完整性识别,所述印章真伪认证包括污点缺漏验证,所述信息验证单元的输出端电性连接有信息内容项提取,所述信息内容项提取的输出端电性连接有数字证书生成,所述数字证书生成的输出端电性连接有电子签章唯一码、电子签章矢量图,所述电子签章唯一码、电子签章矢量图的输出端电性连接有档案入库执行。
作为本发明的进一步方案:所述内容项识别单元包括档案标题识别、档案内容识别,所述档案标题识别的输出端电性连接有一级标题、二级标题、三级标题,所述档案内容识别的输出端电性连接有标题对应项文本,所述一级标题、二级标题、三级标题、标题对应项文本的输出端电性连接有标题对照表,所述标题对照表的输出端电性连接有标题关键词提取、长句分段处理,所述长句分段处理包括基于空格、基于分隔符、基于词义识别,所述标题关键词提取、长句分段处理的输出端电性连接有无效词过滤,所述无效词过滤的输出端电性连接有档案词汇表。
作为本发明的进一步方案:所述数据标签建立改写单元的输出端电性连接有档案状态标签、内容项相关标签,所述档案状态标签包括预审档案、已审档案,所述预审档案的输出端电性连接有待审核标签,所述已审档案的输出端电性连接有审批通过标签、审批驳回标签。
作为本发明的进一步方案:所述内容项相关标签的输出端电性连接有词汇计数组件,所述词汇计数组件的输出端电性连接有高频词汇排序,所述高频词汇排序的输出端电性连接有排序项调用,所述排序项调用的输出端电性连接有特征标签库文件,所述排序项调用、特征标签库文件的输出端电性连接有同意项比对,所述同意项比对的输出端电性连接有特征标签,所述特征标签的输出端电性连接有计数循环,所述计数循环的输出端与高频词汇排序的输入端电性连接。
作为本发明的进一步方案:所述档案数据库的输出端电性连接有索引库文件,所述索引库文件包括状态索引、特征索引,所述特征索引的输出端电性连接有特征门类索引,所述索引库文件的输出端电性连接有档案文件集。
与现有技术相比,本发明的优点和积极效果在于:
本发明中,基于权限管理数据库所记录对应内容,对于相关人员操作项进行详细限定,确保档案数据在管理过程中的安全性特征,在档案入库操作过程中,基于证书信息和印章信息生成对应数字证书、电子签章,作为检索相关条件,并基于内容项识别单元运作,达成标题、内容识别效果,对档案文件进行数字化处理,并提取关键词和短句,过滤无效词汇并生成档案词汇表,基于数据标签建立改写单元运作生成档案的状态标签以及特征标签,并基于此在管理过程中建立状态索引、特征索引、特征门类索引,以此达成对于档案数据高自动化、准确性的归类管理功能,确保审核、处理工作的高效执行。
附图说明
图1为本发明提出一种档案数字化信息管理系统的系统主框架示意图;
图2为本发明提出一种档案数字化信息管理系统的权限管理数据库流程图;
图3为本发明提出一种档案数字化信息管理系统的登入验证系统流程图;
图4为本发明提出一种档案数字化信息管理系统的档案入库管理系统流程图;
图5为本发明提出一种档案数字化信息管理系统的内容项识别单元流程图;
图6为本发明提出一种档案数字化信息管理系统的数据标签建立改写单元流程图;
图7为本发明提出一种档案数字化信息管理系统的数据标签建立档案数据库流程图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
在本发明的描述中,需要理解的是,术语“长度”、“宽度”、“上”、“下”、“前”、“后”、“左”、“右”、“竖直”、“水平”、“顶”、“底”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。此外,在本发明的描述中,“多个”的含义是两个或两个以上,除非另有明确具体的限定。
实施例一,请参阅图1,一种档案数字化信息管理系统是由档案综合管理系统、权限管理数据库、登入验证系统、档案入库管理系统、档案数据库组成,档案综合管理系统的输出端与权限管理数据库、登入验证系统、档案入库管理系统、档案数据库的输入端电性连接,权限管理数据库的输出端与登入验证系统的输入端电性连接,档案入库管理系统的输出端电性连接有档案数字化处理单元,档案数字化处理单元的输出端电性连接有内容项识别单元,内容项识别单元的输出端电性连接有数据标签建立改写单元,数据标签建立改写单元的输出端与档案数据库的输入端电性连接,档案数据库的输出端电性连接有档案调用审核单元,档案调用审核单元的输出端电性连接有档案处理执行单元,档案处理执行单元的输出端电性连接有处理项记录单元,处理项记录单元的输出端与数据标签建立改写单元的输入端电性连接。
具体而言,基于权限管理数据库所记录对应内容,对于相关人员操作项进行详细限定,确保档案数据在管理过程中的安全性特征,在档案入库操作过程中,基于证书信息和印章信息生成对应数字证书、电子签章,作为检索相关条件,并基于内容项识别单元运作,达成标题、内容识别效果,对档案文件进行数字化处理,并提取关键词和短句,过滤无效词汇并生成档案词汇表,基于数据标签建立改写单元运作生成档案的状态标签以及特征标签,并基于此在管理过程中建立状态索引、特征索引、特征门类索引,以此达成对于档案数据高自动化、准确性的归类管理功能,确保审核、处理工作的高效执行。
请参阅图2,权限管理数据库包括表间调用索引、内容项目表集群,表间调用索引的输出端与内容项目表集群的输入端电性连接,内容项目表集群包括人员信息表、职权信息表,人员信息表包括用户编码、密钥信息、指纹信息、人脸信息,职权信息表包括用户编码副本、所属部门、职位信息,用户编码、用户编码副本、所属部门、职位信息的输出端电性连接有权限详情表,权限详情表包括用户编码投影、部门门类、权限级别,部门门类的输出端电性连接有可选档案类,权限级别的输出端电性连接有操作项目集,操作项目集的输出端电性连接有只读预览、档案递交、档案审核、档案改写,档案改写的输出端电性连接有可见档案改写、从属档案改写。
具体而言,权限管理数据库中,基于表间调用索引对内容项目表集群中的人员信息表、职权信息表相关数据,人员信息表为后续登录验证步骤提供数据支持,基于其中用户编码、用户编码副本、所属部门、职位信息建立对应的权限详情表记录,权限详情表具体包含用户编码投影、部门门类、权限级别数据,且基于部门门类规范可选档案类,基于权限级别规范人员可执行的操作项目集,操作项目集具体包含只读预览、档案递交、档案审核、档案改写等内容,且档案改写可分为可见档案改写、从属档案改写,对应审阅人员操作项以及非审阅人员操作项。
请参阅图3,登入验证系统的输出端电性连接有用户编码填写,用户编码填写的输出端电性连接有人员信息表检索,人员信息表检索的第一输出端与登入验证系统的输入端电性连接,人员信息表检索的第二输出端电性连接有人员信息表调用,人员信息表调用的输出端电性连接有验证随机信息调取,验证随机信息调取的输出端电性连接有随机信息项目,随机信息项目的输出端电性连接有组合验证项提交,组合验证项提交的输出端电性连接有验证项比对,验证项比对的第一输出端与登入验证系统的输入端电性连接,验证项比对的第二输出端电性连接有验证通过,验证通过的输出端电性连接有权限详情表调用,权限详情表调用的输出端电性连接有可操作项目信息,可操作项目信息的输出端电性连接有系统登入。
具体而言,登入验证系统中,首先填写用户编码,系统检索人员信息表是否具有对应编码,若不包含对应编码则返回登入验证系统起始步骤,若包含编码,则调用人员信息表,进行验证随机信息调取工作,选定随机的两组或多组信息项目,包含指纹、密钥或人脸信息验证,用户提交组合验证项后,进行验证项比对工作编码,若验证不匹配则返回登入验证系统起始步骤,若验证匹配则反馈验证通过,调用权限详情表填入用户对应的可操作项目信息作为用户在系统中可见的选项卡操作项,登入系统。
登入验证系统采用Spring Security安全框架,该框架提供身份验证和授权的功能,可以帮助开发人员确保应用程序的安全性,主要基于用户名和密码来验证用户身份。
请参阅图4,档案入库管理系统的输出端电性连接有档案递交审核单元,档案递交审核单元的输出端电性连接有档案文件上传,档案文件上传的输出端电性连接有电子签章发布单元,电子签章发布单元的输出端电性连接有档案内容项提取,档案内容项提取的输出端电性连接有证书信息、印章信息,证书信息的输出端与印章信息的输入端电性连接,证书信息、印章信息的输出端电性连接有信息验证单元,信息验证单元包括证书印章比对认证、证书真伪认证、印章真伪认证,证书真伪认证、印章真伪认证的输出端电性连接有联网信息检索,证书真伪认证包括格式识别、完整性识别,印章真伪认证包括污点缺漏验证,信息验证单元的输出端电性连接有信息内容项提取,信息内容项提取的输出端电性连接有数字证书生成,数字证书生成的输出端电性连接有电子签章唯一码、电子签章矢量图,电子签章唯一码、电子签章矢量图的输出端电性连接有档案入库执行。
具体而言,档案入库管理系统中,首先进入档案递交审核单元,上传档案文件,并进入电子签章发布单元,提取档案的证书信息、印章信息内容项,进行信息验证工作,信息验证工作具体包含证书印章比对认证、证书真伪认证、印章真伪认证,即证书与印章的内容项是否一致,证书的真伪、完整性、格式验证,印章污点缺漏验证,并联网检索信息公证特征,通过验证后,进行信息内容项提取工作,生成数字证书,数字证书包含电子签章唯一码以及矢量图内容,将档案登记入库。
档案入库管理系统根据GM/T 0031-2014《安全电子签章密码技术规范》和GM/T0047-2016 《安全电子签章密码检测规范》规定电子印章和电子签章的数据格式,给电子签章唯一码、电子签章矢量图提供规范;
证书真伪认证具体方法在于基于 Hash 算法获取该证书的 Hash 值 H1,浏览器收到证书后可以使用 CA 的公钥解密 Certificate Signature 内容,得到一个 Hash 值H2 ,最后比较 H1 和 H2,如果值相同,则为可信赖的证书,否则则认为证书不可信;
印章真伪认证具体方法在于调用API或使用SDK对图片中的文字进行识别,提供各类文字识别的云端Paas服务接口,进行云端真伪识别工作;
证书印章比对认证具体为基于证书文件格式内容,如.crt格式(证书文件)、.key格式(私钥文件)、.csr格式(请求文件)、.pem格式(文本文件)、.der格式(二进制文件)识别文件格式及内容项是否符合,识别所包含公钥、持有者信息、证书认证机构(CA)的信息,并对比印章信息记录内容是否与证书内容对应。
档案审核具体采用MEAN堆栈编写的自我审核工具,基于电子邮件搜索在Web上挖掘信息信息,基于angular / node.js以及RESTful API设计依存关系的自我审核工具,安装 Node.js命令提示符: > npm install -g bower > bower-install > node server.js使用的API: :config / apiKey.json中需要服务器端api密钥(未提供) :需要客户端公共api密钥等代码实施审核验证工作。
请参阅图5,内容项识别单元包括档案标题识别、档案内容识别,档案标题识别的输出端电性连接有一级标题、二级标题、三级标题,档案内容识别的输出端电性连接有标题对应项文本,一级标题、二级标题、三级标题、标题对应项文本的输出端电性连接有标题对照表,标题对照表的输出端电性连接有标题关键词提取、长句分段处理,长句分段处理包括基于空格、基于分隔符、基于词义识别,标题关键词提取、长句分段处理的输出端电性连接有无效词过滤,无效词过滤的输出端电性连接有档案词汇表。
具体而言,内容项识别单元中,基于文字内容识别,获取档案一级标题、二级标题、三级标题,以及标题对应的文本数据,生成标题对照表,对所有标题的关键词进行提取,并对长句依照基于空格、基于分隔符、基于词义识别等方式,划分为短词,过滤如关联词、助词等无效词后,建立档案词汇表。
内容项识别单元具体采用Faster R-CNN算法,基于anchor高度可扩展模型生成机制、Connectionist Temporal Classification算法,以及CNN+BLSTM特征提取,anchor高度可扩展模型在数据库中,将模型规范至6NF,并转换为K-V结构模型,是数据库管理数据规范式手段,Connectionist Temporal Classification算法是一种联结主义时间分类算法,基于动态时间规则,进行算法映射路径,并建立原始标签。
请参阅图6,数据标签建立改写单元的输出端电性连接有档案状态标签、内容项相关标签,档案状态标签包括预审档案、已审档案,预审档案的输出端电性连接有待审核标签,已审档案的输出端电性连接有审批通过标签、审批驳回标签,内容项相关标签的输出端电性连接有词汇计数组件,词汇计数组件的输出端电性连接有高频词汇排序,高频词汇排序的输出端电性连接有排序项调用,排序项调用的输出端电性连接有特征标签库文件,排序项调用、特征标签库文件的输出端电性连接有同意项比对,同意项比对的输出端电性连接有特征标签,特征标签的输出端电性连接有计数循环,计数循环的输出端与高频词汇排序的输入端电性连接。
具体而言,数据标签建立改写单元中,基于档案状态标签,标注预审、已审档案,生成待审核标签、审批通过标签、审批驳回标签,并基于内容项相关标签加载词汇计数组件,依照出现高频率的词汇进行排序,调用排序项目后,依照特征标签库文件执行同意项比对,获取对应特征标签,执行指定次数的计数循环后,结束特征标签的生成工作。
数据标签的建立以及改写工作具体通过python脚本从xml文件(可扩展标记数据文件)中提取信息,转为yolov5算法所需要的标签格式: class_id center_x center_y wh 并存入txt文件 转换后可直接用于yolov算法的模型训练工作,yolov系列算法是一种基于深度学习的回归方法,用于视觉名词识别的模型训练工作。
请参阅图7,档案数据库的输出端电性连接有索引库文件,索引库文件包括状态索引、特征索引,特征索引的输出端电性连接有特征门类索引,索引库文件的输出端电性连接有档案文件集。
具体而言,档案数据库中,基于状态标签以及特征标签信息,对照索引库文件生成响应的状态索引、特征索引,且基于特征索引所属门类,建立特征门类索引,管理档案文件集,方便档案调用审核单元执行具体审阅工作,档案处理执行单元下达审阅结果,处理项记录单元记录处理结果,并返回数据标签建立改写单元,改写数据标签。
档案数据库具体采用SQL关系型数据库,可以通过SQL管理数据库;定义和操作数据,维护数据的完整性和安全性。
工作原理:基于权限管理数据库所记录对应内容,对于相关人员操作项进行详细限定,确保档案数据在管理过程中的安全性特征,在档案入库操作过程中,基于证书信息和印章信息生成对应数字证书、电子签章,作为检索相关条件,并基于内容项识别单元运作,达成标题、内容识别效果,对档案文件进行数字化处理,并提取关键词和短句,过滤无效词汇并生成档案词汇表,基于数据标签建立改写单元运作生成档案的状态标签以及特征标签,并基于此在管理过程中建立状态索引、特征索引、特征门类索引,以此达成对于档案数据搞自动化、准确性的归类管理功能,确保审核、处理工作的高效执行,具体地说,权限管理数据库中,基于表间调用索引对内容项目表集群中的人员信息表、职权信息表相关数据,人员信息表为后续登录验证步骤提供数据支持,基于其中用户编码、用户编码副本、所属部门、职位信息建立对应的权限详情表记录,权限详情表具体包含用户编码投影、部门门类、权限级别数据,且基于部门门类规范可选档案类,基于权限级别规范人员可执行的操作项目集,操作项目集具体包含只读预览、档案递交、档案审核、档案改写等内容,且档案改写可分为可见档案改写、从属档案改写,对应审阅人员操作项以及非审阅人员操作项,登入验证系统中,首先填写用户编码,系统检索人员信息表是否具有对应编码,若不包含对应编码则返回登入验证系统起始步骤,若包含编码,则调用人员信息表,进行验证随机信息调取工作,选定随机的两组或多组信息项目,包含指纹、密钥或人脸信息验证,用户提交组合验证项后,进行验证项比对工作编码,若验证不匹配则返回登入验证系统起始步骤,若验证匹配则反馈验证通过,调用权限详情表填入用户对应的可操作项目信息作为用户在系统中可见的选项卡操作项,登入系统,档案入库管理系统中,首先进入档案递交审核单元,上传档案文件,并进入电子签章发布单元,提取档案的证书信息、印章信息内容项,进行信息验证工作,信息验证工作具体包含证书印章比对认证、证书真伪认证、印章真伪认证,即证书与印章的内容项是否一致,证书的真伪、完整性、格式验证,印章污点缺漏验证,并联网检索信息公证特征,通过验证后,进行信息内容项提取工作,生成数字证书,数字证书包含电子签章唯一码以及矢量图内容,将档案登记入库,内容项识别单元中,基于文字内容识别,获取档案一级标题、二级标题、三级标题,以及标题对应的文本数据,生成标题对照表,对所有标题的关键词进行提取,并对长句依照基于空格、基于分隔符、基于词义识别等方式,划分为短词,过滤如关联词、助词等无效词后,建立档案词汇表,数据标签建立改写单元中,基于档案状态标签,标注预审、已审档案,生成待审核标签、审批通过标签、审批驳回标签,并基于内容项相关标签加载词汇计数组件,依照出现高频率的词汇进行排序,调用排序项目后,依照特征标签库文件执行同意项比对,获取对应特征标签,执行指定次数的计数循环后,结束特征标签的生成工作,档案数据库中,基于状态标签以及特征标签信息,对照索引库文件生成响应的状态索引、特征索引,且基于特征索引所属门类,建立特征门类索引,管理档案文件集,方便档案调用审核单元执行具体审阅工作,档案处理执行单元下达审阅结果,处理项记录单元记录处理结果,并返回数据标签建立改写单元,改写数据标签。
以上,仅是本发明的较佳实施例而已,并非对本发明作其他形式的限制,任何熟悉本专业的技术人员可能利用上述揭示的技术内容加以变更或改型为等同变化的等效实施例应用于其他领域,但是凡是未脱离本发明技术方案内容,依据本发明的技术实质对以上实施例所做的任何简单修改、等同变化与改型,仍属于本发明技术方案的保护范围。
Claims (10)
1.一种档案数字化信息管理系统,其特征在于:所述档案数字化信息管理系统是由档案综合管理系统、权限管理数据库、登入验证系统、档案入库管理系统、档案数据库组成,所述档案综合管理系统的输出端与权限管理数据库、登入验证系统、档案入库管理系统、档案数据库的输入端电性连接,所述权限管理数据库的输出端与登入验证系统的输入端电性连接,所述档案入库管理系统的输出端电性连接有档案数字化处理单元,所述档案数字化处理单元的输出端电性连接有内容项识别单元,所述内容项识别单元的输出端电性连接有数据标签建立改写单元,所述数据标签建立改写单元的输出端与档案数据库的输入端电性连接,所述档案数据库的输出端电性连接有档案调用审核单元,所述档案调用审核单元的输出端电性连接有档案处理执行单元,所述档案处理执行单元的输出端电性连接有处理项记录单元,所述处理项记录单元的输出端与数据标签建立改写单元的输入端电性连接。
2.根据权利要求1所述的档案数字化信息管理系统,其特征在于:所述权限管理数据库包括表间调用索引、内容项目表集群,所述表间调用索引的输出端与内容项目表集群的输入端电性连接,所述内容项目表集群包括人员信息表、职权信息表,所述人员信息表包括用户编码、密钥信息、指纹信息、人脸信息,所述职权信息表包括用户编码副本、所属部门、职位信息,所述用户编码、用户编码副本、所属部门、职位信息的输出端电性连接有权限详情表。
3.根据权利要求2所述的档案数字化信息管理系统,其特征在于:所述权限详情表包括用户编码投影、部门门类、权限级别,所述部门门类的输出端电性连接有可选档案类,所述权限级别的输出端电性连接有操作项目集,所述操作项目集的输出端电性连接有只读预览、档案递交、档案审核、档案改写,所述档案改写的输出端电性连接有可见档案改写、从属档案改写。
4.根据权利要求1所述的档案数字化信息管理系统,其特征在于:所述登入验证系统的输出端电性连接有用户编码填写,所述用户编码填写的输出端电性连接有人员信息表检索,所述人员信息表检索的第一输出端与登入验证系统的输入端电性连接,所述人员信息表检索的第二输出端电性连接有人员信息表调用,所述人员信息表调用的输出端电性连接有验证随机信息调取,所述验证随机信息调取的输出端电性连接有随机信息项目,所述随机信息项目的输出端电性连接有组合验证项提交,所述组合验证项提交的输出端电性连接有验证项比对,所述验证项比对的第一输出端与登入验证系统的输入端电性连接,所述验证项比对的第二输出端电性连接有验证通过,所述验证通过的输出端电性连接有权限详情表调用,所述权限详情表调用的输出端电性连接有可操作项目信息,所述可操作项目信息的输出端电性连接有系统登入。
5.根据权利要求1所述的档案数字化信息管理系统,其特征在于:所述档案入库管理系统的输出端电性连接有档案递交审核单元,所述档案递交审核单元的输出端电性连接有档案文件上传,所述档案文件上传的输出端电性连接有电子签章发布单元,所述电子签章发布单元的输出端电性连接有档案内容项提取,所述档案内容项提取的输出端电性连接有证书信息、印章信息,所述证书信息的输出端与印章信息的输入端电性连接,所述证书信息、印章信息的输出端电性连接有信息验证单元。
6.根据权利要求5所述的档案数字化信息管理系统,其特征在于:所述信息验证单元包括证书印章比对认证、证书真伪认证、印章真伪认证,所述证书真伪认证、印章真伪认证的输出端电性连接有联网信息检索,所述证书真伪认证包括格式识别、完整性识别,所述印章真伪认证包括污点缺漏验证,所述信息验证单元的输出端电性连接有信息内容项提取,所述信息内容项提取的输出端电性连接有数字证书生成,所述数字证书生成的输出端电性连接有电子签章唯一码、电子签章矢量图,所述电子签章唯一码、电子签章矢量图的输出端电性连接有档案入库执行。
7.根据权利要求1所述的档案数字化信息管理系统,其特征在于:所述内容项识别单元包括档案标题识别、档案内容识别,所述档案标题识别的输出端电性连接有一级标题、二级标题、三级标题,所述档案内容识别的输出端电性连接有标题对应项文本,所述一级标题、二级标题、三级标题、标题对应项文本的输出端电性连接有标题对照表,所述标题对照表的输出端电性连接有标题关键词提取、长句分段处理,所述长句分段处理包括基于空格、基于分隔符、基于词义识别,所述标题关键词提取、长句分段处理的输出端电性连接有无效词过滤,所述无效词过滤的输出端电性连接有档案词汇表。
8.根据权利要求1所述的档案数字化信息管理系统,其特征在于:所述数据标签建立改写单元的输出端电性连接有档案状态标签、内容项相关标签,所述档案状态标签包括预审档案、已审档案,所述预审档案的输出端电性连接有待审核标签,所述已审档案的输出端电性连接有审批通过标签、审批驳回标签。
9.根据权利要求8所述的档案数字化信息管理系统,其特征在于:所述内容项相关标签的输出端电性连接有词汇计数组件,所述词汇计数组件的输出端电性连接有高频词汇排序,所述高频词汇排序的输出端电性连接有排序项调用,所述排序项调用的输出端电性连接有特征标签库文件,所述排序项调用、特征标签库文件的输出端电性连接有同意项比对,所述同意项比对的输出端电性连接有特征标签,所述特征标签的输出端电性连接有计数循环,所述计数循环的输出端与高频词汇排序的输入端电性连接。
10.根据权利要求1所述的档案数字化信息管理系统,其特征在于:所述档案数据库的输出端电性连接有索引库文件,所述索引库文件包括状态索引、特征索引,所述特征索引的输出端电性连接有特征门类索引,所述索引库文件的输出端电性连接有档案文件集。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310663986.XA CN116402477A (zh) | 2023-06-07 | 2023-06-07 | 一种档案数字化信息管理系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310663986.XA CN116402477A (zh) | 2023-06-07 | 2023-06-07 | 一种档案数字化信息管理系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116402477A true CN116402477A (zh) | 2023-07-07 |
Family
ID=87018298
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310663986.XA Pending CN116402477A (zh) | 2023-06-07 | 2023-06-07 | 一种档案数字化信息管理系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116402477A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117786741A (zh) * | 2023-12-22 | 2024-03-29 | 翼健(上海)信息科技有限公司 | 一种密文存储与密文检索开放云服务方法、系统和介质 |
Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1932816A (zh) * | 2006-09-30 | 2007-03-21 | 华中科技大学 | 基于密文的全文检索系统 |
CN108491495A (zh) * | 2018-03-19 | 2018-09-04 | 合肥泓泉档案信息科技有限公司 | 一种档案数字化管理系统 |
CN111680199A (zh) * | 2020-05-21 | 2020-09-18 | 宁波金匮信息技术有限公司 | 档案管理系统及操作流程 |
CN112506865A (zh) * | 2020-12-21 | 2021-03-16 | 广东天亿马信息产业股份有限公司 | 一种档案数字化管理系统及其方法 |
CN113157646A (zh) * | 2021-05-06 | 2021-07-23 | 日照蓝鸥信息科技有限公司 | 一种档案数字化信息管理系统 |
CN113204610A (zh) * | 2021-05-06 | 2021-08-03 | 广东博维创远科技有限公司 | 基于刑事案件电子卷宗的自动编目的方法、计算机可以读取的存储装置 |
CN114117171A (zh) * | 2021-11-16 | 2022-03-01 | 华中师范大学 | 一种基于赋能思维的工程档案智能收整方法及系统 |
CN114202319A (zh) * | 2022-02-21 | 2022-03-18 | 南京云档信息科技有限公司 | 一种基于混合类元数据方案的档案管理系统 |
CN114445822A (zh) * | 2021-12-17 | 2022-05-06 | 国网浙江省电力有限公司温州供电公司 | 一种基于业扩报装全流程的数字化档案管理方法及系统 |
CN114706938A (zh) * | 2022-03-28 | 2022-07-05 | 北京明略昭辉科技有限公司 | 一种文档标签确定方法、装置、电子设备及存储介质 |
CN115033905A (zh) * | 2022-06-17 | 2022-09-09 | 江西睿创科技有限公司 | 一种基于物联网的智慧档案管理系统平台 |
CN115374781A (zh) * | 2022-08-25 | 2022-11-22 | 上海浦东发展银行股份有限公司 | 文本数据信息挖掘方法、装置、设备 |
CN115640930A (zh) * | 2022-10-27 | 2023-01-24 | 国网新源控股有限公司 | 一种档案利用系统 |
-
2023
- 2023-06-07 CN CN202310663986.XA patent/CN116402477A/zh active Pending
Patent Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1932816A (zh) * | 2006-09-30 | 2007-03-21 | 华中科技大学 | 基于密文的全文检索系统 |
CN108491495A (zh) * | 2018-03-19 | 2018-09-04 | 合肥泓泉档案信息科技有限公司 | 一种档案数字化管理系统 |
CN111680199A (zh) * | 2020-05-21 | 2020-09-18 | 宁波金匮信息技术有限公司 | 档案管理系统及操作流程 |
CN112506865A (zh) * | 2020-12-21 | 2021-03-16 | 广东天亿马信息产业股份有限公司 | 一种档案数字化管理系统及其方法 |
CN113157646A (zh) * | 2021-05-06 | 2021-07-23 | 日照蓝鸥信息科技有限公司 | 一种档案数字化信息管理系统 |
CN113204610A (zh) * | 2021-05-06 | 2021-08-03 | 广东博维创远科技有限公司 | 基于刑事案件电子卷宗的自动编目的方法、计算机可以读取的存储装置 |
CN114117171A (zh) * | 2021-11-16 | 2022-03-01 | 华中师范大学 | 一种基于赋能思维的工程档案智能收整方法及系统 |
CN114445822A (zh) * | 2021-12-17 | 2022-05-06 | 国网浙江省电力有限公司温州供电公司 | 一种基于业扩报装全流程的数字化档案管理方法及系统 |
CN114202319A (zh) * | 2022-02-21 | 2022-03-18 | 南京云档信息科技有限公司 | 一种基于混合类元数据方案的档案管理系统 |
CN114706938A (zh) * | 2022-03-28 | 2022-07-05 | 北京明略昭辉科技有限公司 | 一种文档标签确定方法、装置、电子设备及存储介质 |
CN115033905A (zh) * | 2022-06-17 | 2022-09-09 | 江西睿创科技有限公司 | 一种基于物联网的智慧档案管理系统平台 |
CN115374781A (zh) * | 2022-08-25 | 2022-11-22 | 上海浦东发展银行股份有限公司 | 文本数据信息挖掘方法、装置、设备 |
CN115640930A (zh) * | 2022-10-27 | 2023-01-24 | 国网新源控股有限公司 | 一种档案利用系统 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117786741A (zh) * | 2023-12-22 | 2024-03-29 | 翼健(上海)信息科技有限公司 | 一种密文存储与密文检索开放云服务方法、系统和介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10740052B2 (en) | Integrated services for forms generation and maintenance on cloud | |
US20180075138A1 (en) | Electronic document management using classification taxonomy | |
US11403305B2 (en) | Performing data mining operations within a columnar database management system | |
US11163906B2 (en) | Adaptive redaction and data releasability systems using dynamic parameters and user defined rule sets | |
US10585947B2 (en) | Linking business objects and documents | |
US8880440B2 (en) | Automatic combination and mapping of text-mining services | |
CN110119395B (zh) | 大数据治理中基于元数据实现数据标准与数据质量关联处理的方法 | |
US11860950B2 (en) | Document matching and data extraction | |
US10963686B2 (en) | Semantic normalization in document digitization | |
EP4352655A1 (en) | Identifying a classification hierarchy using a trained machine learning pipeline | |
CN111414740A (zh) | 一种电子实验记录本报告生成系统 | |
US20220319143A1 (en) | Implicit Coordinates and Local Neighborhood | |
CN116402477A (zh) | 一种档案数字化信息管理系统 | |
CN115526605A (zh) | 基于企业内部控制管理的审批方法及系统 | |
CN116882380A (zh) | 一种用于文本管理系统的文档模板生成方法 | |
CN114896293A (zh) | 数据集成管理方法和装置、存储介质、电子设备 | |
CN110941957A (zh) | 交通科技数据标引方法及系统 | |
US11816112B1 (en) | Systems and methods for automated process discovery | |
US11977514B1 (en) | Predictive revision recommendations | |
US20220405235A1 (en) | System and method for reference dataset management | |
WO2018206819A1 (en) | Data storage method and apparatus | |
US20240346257A1 (en) | Document classification | |
CN117453982B (zh) | 一种档案管理文件分类系统 | |
CN113222621A (zh) | 一种平台订单同步方法、装置、计算机设备及存储介质 | |
CN117056289A (zh) | 基于标签的数据资产目录构建方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20230707 |