CN112115915A - 一种纸质档案数字化处理系统和方法 - Google Patents

一种纸质档案数字化处理系统和方法 Download PDF

Info

Publication number
CN112115915A
CN112115915A CN202011045278.2A CN202011045278A CN112115915A CN 112115915 A CN112115915 A CN 112115915A CN 202011045278 A CN202011045278 A CN 202011045278A CN 112115915 A CN112115915 A CN 112115915A
Authority
CN
China
Prior art keywords
file
paper
printing
filing
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202011045278.2A
Other languages
English (en)
Other versions
CN112115915B (zh
Inventor
杨志高
冯和平
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jiangsu Erren Information Technology Co ltd
Original Assignee
Jiangsu Erren Information Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jiangsu Erren Information Technology Co ltd filed Critical Jiangsu Erren Information Technology Co ltd
Priority to CN202011045278.2A priority Critical patent/CN112115915B/zh
Publication of CN112115915A publication Critical patent/CN112115915A/zh
Application granted granted Critical
Publication of CN112115915B publication Critical patent/CN112115915B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting
    • G06F40/177Editing, e.g. inserting or deleting of tables; using ruled lines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06KGRAPHICAL DATA READING; PRESENTATION OF DATA; RECORD CARRIERS; HANDLING RECORD CARRIERS
    • G06K17/00Methods or arrangements for effecting co-operative working between equipments covered by two or more of main groups G06K1/00 - G06K15/00, e.g. automatic card files incorporating conveying and reading operations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Processing Or Creating Images (AREA)

Abstract

本发明公开了一种纸质档案数字化处理系统,包括归档章识别装置、条形码打印装置、条形码粘贴装置、档案传送装置、归档章打印装置和管理服务器;所述归档章打印装置对纸质档案上的条形码进行识别,将识别结果发送至管理服务器,管理服务器根据条形码获取该纸质档案对应的档案目录信息,根据档案目录信息生成归档章信息和归档章预设位置,以及结合归档章信息和归档章预设位置,生成打印图片,驱动归档章打印装置将打印图片打印在纸质档案的归档章印制页上,输出纸质档案。本发明能够有效减少人工操作步骤,减少人工处理工作量,有效降低因人工操作而出错的概率,提高档案数字化工作效率,降低档案数字化工作成本。

Description

一种纸质档案数字化处理系统和方法
技术领域
本发明涉及纸质档案归档和数字化处理技术领域,具体而言涉及一种纸质档案数字化处理系统和方法。
背景技术
档案是国家机构、社会组织或个人在社会活动中直接形成的有价值的各种形式的历史记录。随着时代的发展和技术的进步,记录档案信息的载体形式由目前发现的甲骨档案、金文档案、缣帛档案、简牍档案、石刻档案等演变为纸质档案。我国档案载体从纸质档案起发生了重大变革,取代了简牍等其他载体,成为国家正式书写材料,一直沿用至今。目前,各个档案管理机构已经存有大量的纸质档案,后续还不断有新的纸质档案产生。纸质档案从诞生到现在的很长时间内都是以手工管理为主,手工管理纸质档案费时、费力,检索极其不方便、效率低,利用时经常造成档案丢失和损坏、非常不利于档案的保管,档案信息无法共享、利用率低、经济效益不显著。
随着计算机技术、打印技术、扫描技术、OCR技术、数据库技术、存储技术等技术的发展,让档案使用信息化手段进行管理成为了可能。使用信息化手段管理档案能提高档案管理工作效率,使档案检索方便快捷,可以有效保护档案原件,共享档案信息提高档案利用率、能产生显著经济效益;同时还能增强档案管理部门的服务水平,为各部门和单位以及社会公众提供全面高效的档案服务,充分发挥档案资源的独特价值,为社会发展和经济建设贡献档案力量。
实现档案信息化管理首先要有数字化的档案信息,因此需要对现有及后续产生的纸质档案进行数字化(称为档案数字化)。当前我国档案信息化建设全面提速,在“存量档案数字化、增量档案电子化”的方针指导下,各地各档案管理部门都在如火如荼地开展档案数字化工作。档案数字化是使用计算机技术、扫描技术、OCR技术、数据库技术、存储技术将纸质档案资源转化为数字化档案信息并存储的过程。如专利号为CN108509542A的发明中提及一种档案快速归档系统及其归档方法,通过制定归档模板和文件夹结构,对扫描后的档案进行特征提取,根据提取的特征按照归档模板进行档案的归档,提高了档案归档的效率,降低了错误率的同时方便了访问者快速查阅检索所需档案。
在档案数字化过程中采集的档案目录信息是非常重要的信息,一般采集档案目录信息时使用Excel表格保存数据,在档案目录信息核对无误后会导入到对应的档案管理系统数据库中,后续都是以档案目录信息为基础对档案进行信息化管理。因此,档案目录信息要百分之百准确。当前,档案目录信息的采集一般是通过人对纸质档案进行识别后将相关信息手工录入计算机形成档案目录信息初稿,然后再由另外的人进行审核和修正,确认信息无误后形成正式档案目录信息。人工录入档案目录信息成本高、效率低而且极其容易出错、审核和修正工作量大。同时,在各立档单位每年将纸质档案移交到同级国家综合档案馆进行归档时,首先需要人工对归档的纸质档案进行整理,其次人工生成档案目录信息、人工生成档号、由专人审核和修正,再次人工在纸质档案上加盖归档印章并手工填写归档信息、由专人进行审核,最后再进行档案数字化。盖完归档印章并填写完整相关内容(信息来源于档号)后才能完成纸质档案加盖归档章的工作步骤。如果归档章信息填写错误得重新盖章填写或在出错的信息上订正,会破坏档案的美观。人工盖归档案印章并填写归档信息的方式成本高、效率低而且归档信息填写容易出错、审核修正工作量大。
归档印章和档案目录文件作为纸质档案归档过程产生的重要数据,目前仍采用人工为主、系统为辅的工作模式进行处理,显然已经越来越不符合当前纸质档案数字化发展需求。
发明内容
本发明针对现有技术中的不足,提供一种纸质档案数字化处理系统和方法,通过OCR技术实现目录信息自动识别,对于新归档的纸质档案自动生成档号和归档印章,并将归档印章嵌入到对应的图像文件中、以及通过归档章打印装置打印归档印章到对应的纸质档案上,有效减少人工操作步骤,减少人工处理工作量,有效降低因人工操作而出错的概率,提高档案数字化工作效率,降低档案数字化工作成本;同时,通过合理设计数字化处理系统和整个处理过程,使纸质档案、纸质档案的图像文件、归档章和档案目录文件之间建立紧密的连接,降低归档出错风险。
为实现上述目的,本发明采用以下技术方案:
一种纸质档案数字化处理系统,所述处理系统包括归档章识别装置、条形码打印装置、条形码粘贴装置、档案传送装置、归档章打印装置和管理服务器;
所述归档章识别装置包括用于放置纸质档案的放置平台,归档章识别装置根据管理服务器发送的控制指令判断放置平台上的纸质档案上是否打印有归档章,如果没有,请求管理服务器获取纸质档案的图像信息,根据纸质档案的图像信息生成唯一对应的条形码,并调用条形码打印装置打印条形码,将打印的条形码采用条形码粘贴装置粘贴在纸质档案的归档章印制页上,再将纸质档案通过档案传送装置传送至归档章打印装置的进纸盒内,其中,归档章印制页位于首页且条形码朝上设置;
所述归档章打印装置对纸质档案上的条形码进行识别,将识别结果发送至管理服务器,管理服务器根据条形码获取该纸质档案对应的档案目录信息,并根据条形码识别结果和档案目录信息获取结果对纸质档案进行处理:
(1)如果管理服务器成功根据条形码获取到纸质档案对应的档案目录信息,根据档案目录信息生成归档章信息和归档章预设位置,以及结合归档章信息和归档章预设位置,生成打印图片,驱动归档章打印装置将打印图片打印在纸质档案的归档章印制页上,输出纸质档案;
(2)否则,直接输出纸质档案,且输出位置和打印有归档章的纸质档案不同。
为优化上述技术方案,采取的具体措施还包括:
进一步地,所述归档章打印装置包括底座、进纸盒、传送机构、面罩、条形码识别机构、打印机构、输出导板、第一出纸盒和第二出纸盒;
所述面罩呈长方体状,罩设在底座上方,与底座上表面构成一容纳腔;所述传送机构水平设置在底座上表面上,沿传送方向依次被划分成进纸区、处理区和出纸区,所述处理区位于容纳腔内,进纸区和出纸区分别位于容纳腔两侧;所述进纸盒设置在传送机构的进纸区处,所述第一出纸盒和第二出纸盒设置在传送机构的出纸区处;所述传送机构用于根据外部控制指令将进纸盒内的纸质档案传送至第一出纸盒或第二出纸盒;
将处理区沿传送方向依次划分成识别区、打印区和输出区,所述条形码识别机构、打印机构和输出导板安装在容纳腔内,挂接在面罩内侧,条形码识别机构安装在识别区上方,打印机构安装在打印区上方,输出导板安装在输出区上方;
所述条形码识别机构用于对识别区内的纸质档案进行扫描,将识别结果发送至管理服务器,管理服务器根据条形码获取该纸质档案对应的档案目录信息和图像信息,根据档案目录信息生成归档章信息,结合归档章信息和图像信息计算得到归档章预设位置;所述管理服务器结合归档章信息和归档章预设位置,生成打印图片,将打印图片发送至打印机构;所述打印机构悬置在传送机构上方,用于根据管理服务器的控制指令抓取纸质档案的归档章印制页,将归档章打印在归档章印制页上,以及在纸质档案的剩余页经由传送机构传输至输出区后,将归档章印制页放置在最上方,重新整合纸质档案后将纸质档案传输至输出区,以使打印有归档章的纸质档案经由传送机构直接传送至第一出纸盒内;
如果条形码识别机构无法识别条形码或管理服务器无法根据条形码获取纸质档案对应的档案目录信息,管理服务器驱使传送机构和输出导板将纸质文件直接传送至第二出纸盒内。
进一步地,所述第二出纸盒悬置在第一出纸盒上方,输出导板上设置有传送组件,其沿传送方向设置有第一端部和第二端部,输出导板的第二端部与第二出纸盒铰接,输出导板根据管理服务器的控制指令绕铰接点转动,以使输出导板平行于传送机构或输出导板的第一端部与传送机构相接,相接点为输出区和打印区的分界点;
如果条形码识别机构无法识别条形码或管理服务器无法根据条形码获取纸质档案对应的档案目录信息,管理服务器转动输出导板,使输出导板的第一端部与传送机构相接,传送机构将纸质档案依次经由传送机构和输出导板传输至第二出纸盒内。
进一步地,所述打印机构包括位置识别单元、第一抓取单元、悬置单元、打印设备、第二抓取单元和限位单元,所述位置识别单元、第一抓取单元、第二抓取单元、限位单元和打印设备均与管理服务器连接;
所述打印设备通过悬置单元安装在面罩内侧,其悬置在传送机构上方;
所述位置识别单元位于打印设备临近条形码识别机构的一侧,用于实时探测是否有纸质档案进入打印区,将探测结果发送至管理服务器;
所述限位单元可升降地安装在传送机构上,位于打印设备临近输出区的一侧,根据管理服务器的控制指令升起至传送机构上方或者下降至完全收纳在传送机构内部;
所述管理服务器响应于位置识别单元探测到有纸质档案进入打印区,驱使第一抓取单元抓取位于最上方的归档章印制页,传送至打印设备,启动打印设备将打印图片打印在归档章印制页上;同时,其余档案页沿传送机构继续前行,直至其前边沿接触限位单元;
当其余档案页的前边沿接触限位单元时,管理服务器驱使第二抓取单元从打印设备上抓取打印好的归档章印制页,将其放置在其余档案页的正上方。
进一步地,如果所述归档章识别装置识别到纸质档案上存在归档章,管理服务器采用OCR技术获取纸质档案的归档章信息,对提取到的归档章信息进行处理以生成对应的档号。
进一步地,所述归档章信息包括归档章模板,以及归档章模板中与当前纸质档案对应的每个项目的填写信息。
进一步地,所述归档章模板的填写项包括全宗号、年度、件号、机构或问题、保管期限和页数。
本发明还提及一种纸质档案数字化处理方法,所述处理方法包括:
S1,根据需要处理的档案类型选择相应的档案目录信息模板,并加载档案目录信息;
S2,选择需要处理的纸质档案对应的图像文件夹;
S3,按照图像文件夹中的图像信息顺序使用OCR技术识别档案目录信息中的相应信息;其中,对于没有归档章的纸质档案,将其标记为新归档纸质档案,采用如前所述的纸质档案数字化处理系统对其进行归档章印制处理后,根据归档章信息生成对应的档号;对于具有归档章的纸质档案,按照归档印章自动识别档号;
S4,将档案目录信息按照档案目录信息模板导出为excel格式文件,定义为档案目录文件,档案目录文件中包括档号;
S5,输出档案目录文件和对应的经归档处理后的图像文件。
进一步地,所述归档处理后的图像文件包括带有归档章信息的纸质档案图像。
进一步地,步骤S3中,所述采用如前所述的纸质档案数字化处理系统对其进行归档章印制处理包括以下步骤:
S31,选择进纸盒内的其中一份纸质档案,经传送机构传送至识别区;
S32,采用条形码识别机构对识别区内的纸质档案进行扫描,如果识别成功,将识别结果发送至管理服务器,进入步骤S33,如果识别失败,转入步骤S36;
S33,管理服务器根据条形码获取该纸质档案对应的档案目录信息和图像信息,如果获取成功,根据档案目录信息生成归档章信息,结合归档章信息和图像信息计算得到归档章预设位置,转入步骤S34,如果获取失败,转入步骤S36;
S34,管理服务器结合归档章信息和归档章预设位置,生成打印图片,将打印图片发送至打印机构,以及驱使打印机构抓取纸质档案的归档章印制页,将归档章打印在归档章印制页上,在纸质档案的剩余页经由传送机构传输至输出区后,将归档章印制页放置在最上方,重新整合纸质档案后将纸质档案传输至输出区;
S35,采用传送机构将打印有归档章的纸质档案直接传送至第一出纸盒内,结束流程;
S36,采用传送机构和输出导板将纸质文件直接传送至第二出纸盒内。
本发明的有益效果是:
(1)通过OCR技术实现目录信息自动识别,对于新归档的纸质档案自动生成档号和归档印章,并将归档印章嵌入到对应的图像文件中、以及通过归档章打印装置打印归档印章到对应的纸质档案上,有效减少人工操作步骤,减少人工处理工作量,有效降低因人工操作而出错的概率,提高档案数字化工作效率,降低档案数字化工作成本。
(2)同时,通过合理设计数字化处理系统和整个处理过程,使纸质档案、纸质档案的图像文件、归档章和档案目录文件之间建立紧密的连接,降低归档出错风险。
(3)通过归档章打印装置可以批量自动打印归档章到纸质档案能有效提升工作效率、降低数字化成本。
(4)归档章打印装置设置了两种出纸方式,主要是用来区分有归档章打印和无归档章打印两种情况,有效避免将两种不同情况混淆在一起,可以针对无归档章打印的情况进行再次处理,以提升处理效率。
附图说明
图1是本发明的纸质档案数字化处理系统的结构示意图。
图2是本发明的归档章打印装置的两种输出方式对应的结构示意图。
图3是本发明的纸质档案数字化处理方法的流程图。
图4是本发明的归档章打印装置的工作方法流程图。
图5是其中一种归档章模板的示意图。
图6是填写后的归档章的示例图。
具体实施方式
现在结合附图对本发明作进一步详细的说明。
需要注意的是,发明中所引用的如“上”、“下”、“左”、“右”、“前”、“后”等的用语,亦仅为便于叙述的明了,而非用以限定本发明可实施的范围,其相对关系的改变或调整,在无实质变更技术内容下,当亦视为本发明可实施的范畴。
结合图1,本发明提及一种纸质档案数字化处理系统,所述处理系统包括归档章识别装置、条形码打印装置、条形码粘贴装置、档案传送装置、归档章打印装置和管理服务器。
所述归档章识别装置包括用于放置纸质档案的放置平台,归档章识别装置根据管理服务器发送的控制指令判断放置平台上的纸质档案上是否打印有归档章:
如果所述归档章识别装置识别到纸质档案上存在归档章,管理服务器采用OCR技术获取纸质档案的归档章信息,对提取到的归档章信息进行处理以生成对应的档号。如果没有,则需要进入新归档纸质档案处理流程。具体的,请求管理服务器获取纸质档案的图像信息,根据纸质档案的图像信息生成唯一对应的条形码,并调用条形码打印装置打印条形码,将打印的条形码采用条形码粘贴装置粘贴在纸质档案的归档章印制页上,再将纸质档案通过档案传送装置传送至归档章打印装置的进纸盒2内,其中,归档章印制页位于首页且条形码朝上设置。
所述归档章打印装置对纸质档案上的条形码进行识别,将识别结果发送至管理服务器,管理服务器根据条形码获取该纸质档案对应的档案目录信息,并根据条形码识别结果和档案目录信息获取结果对纸质档案进行处理:
(1)如果管理服务器成功根据条形码获取到纸质档案对应的档案目录信息,根据档案目录信息生成归档章信息和归档章预设位置,以及结合归档章信息和归档章预设位置,生成打印图片,驱动归档章打印装置将打印图片打印在纸质档案的归档章印制页上,输出纸质档案。
(2)否则,直接输出纸质档案,且输出位置和打印有归档章的纸质档案不同。
本发明使用了OCR技术,OCR(Optical Character Recognition,光学字符识别)是对图像文件通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程;即,针对印刷体字符,采用光学的方式将纸质文档中的文字转换成为黑白点阵的图像文件,并通过识别软件将图像中的文字转换成文本格式,供文字处理软件进一步编辑加工的技术。对于印刷体字符,OCR识别的准确率已达到99%以上。当前需要进行档案数字化工作的纸质档案中有相当大的一部分都是印刷体字符的纸质档案,后续新产生的纸质档案绝大部分都是印刷体字符的纸质档案。
结合图2,所述归档章打印装置包括底座1、进纸盒2、传送机构3、面罩4、条形码识别机构5、打印机构6、输出导板7、第一出纸盒9和第二出纸盒8。
所述面罩4呈长方体状,罩设在底座1上方,与底座1上表面构成一容纳腔;所述传送机构3水平设置在底座1上表面上,沿传送方向依次被划分成进纸区、处理区和出纸区,所述处理区位于容纳腔内,进纸区和出纸区分别位于容纳腔两侧;所述进纸盒2设置在传送机构3的进纸区处,所述第一出纸盒9和第二出纸盒8设置在传送机构的出纸区处;所述传送机构3用于根据外部控制指令将进纸盒2内的纸质档案传送至第一出纸盒9或第二出纸盒8。
将处理区沿传送方向依次划分成识别区、打印区和输出区,所述条形码识别机构5、打印机构6和输出导板7安装在容纳腔内,挂接在面罩4内侧,条形码识别机构5安装在识别区上方,打印机构6安装在打印区上方,输出导板7安装在输出区上方。
所述条形码识别机构5用于对识别区内的纸质档案进行扫描,将识别结果发送至管理服务器,管理服务器根据条形码获取该纸质档案对应的档案目录信息和图像信息,根据档案目录信息生成归档章信息,结合归档章信息和图像信息计算得到归档章预设位置;所述管理服务器结合归档章信息和归档章预设位置,生成打印图片,将打印图片发送至打印机构6;所述打印机构6悬置在传送机构3上方,用于根据管理服务器的控制指令抓取纸质档案的归档章印制页,将归档章打印在归档章印制页上,以及在纸质档案的剩余页经由传送机构3传输至输出区后,将归档章印制页放置在最上方,重新整合纸质档案后将纸质档案传输至输出区,以使打印有归档章的纸质档案经由传送机构3直接传送至第一出纸盒9内。
如果条形码识别机构5无法识别条形码或管理服务器无法根据条形码获取纸质档案对应的档案目录信息,管理服务器驱使传送机构3和输出导板7将纸质文件直接传送至第二出纸盒8内。
本发明使用了条形码技术,条形码(barcode)是将宽度不等的多个黑条和空白,按照一定的编码规则排列,用以表达一组信息的图形标识符。通过条码打印机可以打印条码,将条码粘贴在相关物品上,通过条形码阅读器可以读取条形码信息,进而可以获取条形码与物品的对应关系,从而可以获得条形码所表示物品的相关信息。
归档章打印装置与管理服务器连接,其工作流程如下:
将需要打印归档章的纸质档案有条形码的一面向上放置在进纸盒2中。
通过传动机构3将纸质档案依次从左往右传送,过程中会经过条形码识别机构5和打印机构6,最后由输出导板7确定将纸质档案送入第一出纸盒9还是第二出纸盒8。
在纸质档案经过条形码识别机构5时,条形码识别机构5会读取纸质档案上的条形码,管理服务器按照条形码获取到该纸质档案对应的档案目录信息,继而可以获取到归档章信息和归档章位置。在纸质档案经过打印机构6时,管理服务器按照获取的归档章信息和归档章位置打印归档章到纸质档案的归档章印制页上。
归档章打印装置设置了两种出纸方式,主要是用来区分有归档章打印和无归档章打印两种情况,有效避免将两种不同情况混淆在一起,可以针对无归档章打印的情况进行再次处理,以提升处理效率。系统默认设置出第二出纸盒8为无归档章打印出纸纸盒,第一出纸盒9为有归档章打印出纸纸盒,可以根据需要调整设置,按照设置情况,输出导板7默认将出纸方向控制在有归档章打印出纸纸盒。当纸质档案经过条形码识别机构5时如果没有读取到条码信息或按照条码信息没有获取到归档章信息时则会判定为无归档章打印的情形,此时会联动输出导板7将出纸方向调整到无归档章打印出纸纸盒,当纸质档案到达对应出纸纸盒后,输出导板7恢复到出纸方向为有归档章打印出纸纸盒。
通过归档章打印装置可以批量自动打印归档章到纸质档案能有效提升工作效率、降低数字化成本。
下面结合图2对其中一种输出导板7的结构和工作原理进行说明。
所述第二出纸盒8悬置在第一出纸盒9上方,输出导板7上设置有传送组件,其沿传送方向设置有第一端部和第二端部,输出导板7的第二端部与第二出纸盒8铰接,输出导板7根据管理服务器的控制指令绕铰接点转动,以使输出导板7平行于传送机构或输出导板7的第一端部与传送机构相接,相接点为输出区和打印区的分界点。
如果条形码识别机构5无法识别条形码或管理服务器无法根据条形码获取纸质档案对应的档案目录信息,管理服务器转动输出导板7,使输出导板7的第一端部与传送机构相接,传送机构将纸质档案依次经由传送机构和输出导板7传输至第二出纸盒8内。如图2所示,当输出导板7放下时,纸质档案输出到第二出纸盒8,当输出导板7收起时,纸质档案输出到第一出纸盒9。
下面是其中一种打印机构6的结构和工作原理说明。
所述打印机构6包括位置识别单元、第一抓取单元、悬置单元、打印设备、第二抓取单元和限位单元,所述位置识别单元、第一抓取单元、第二抓取单元、限位单元和打印设备均与管理服务器连接。
所述打印设备通过悬置单元安装在面罩4内侧,其悬置在传送机构3上方。
所述位置识别单元位于打印设备临近条形码识别机构5的一侧,用于实时探测是否有纸质档案进入打印区,将探测结果发送至管理服务器。
所述限位单元可升降地安装在传送机构3上,位于打印设备临近输出区的一侧,根据管理服务器的控制指令升起至传送机构上方或者下降至完全收纳在传送机构内部。
所述管理服务器响应于位置识别单元探测到有纸质档案进入打印区,驱使第一抓取单元抓取位于最上方的归档章印制页,传送至打印设备,启动打印设备将打印图片打印在归档章印制页上;同时,其余档案页沿传送机构继续前行,直至其前边沿接触限位单元。
当其余档案页的前边沿接触限位单元时,管理服务器驱使第二抓取单元从打印设备上抓取打印好的归档章印制页,将其放置在其余档案页的正上方。
优选的,所述归档章信息包括归档章模板,以及归档章模板中与当前纸质档案对应的每个项目的填写信息。图5是常见的一种归档章模板的示意图,可以看到,在该归档章模板中,填写项包括全宗号、年度、件号、机构或问题、保管期限和页数。图6是填写后的归档章的示例图。
结合图3,本发明还提及一种纸质档案数字化处理方法,所述处理方法包括:
S1,根据需要处理的档案类型选择相应的档案目录信息模板,并加载档案目录信息。
S2,选择需要处理的纸质档案对应的图像文件夹。
S3,按照图像文件夹中的图像信息顺序使用OCR技术识别档案目录信息中的相应信息;其中,对于没有归档章的纸质档案,将其标记为新归档纸质档案,采用如前所述的纸质档案数字化处理系统对其进行归档章印制处理后,根据归档章信息生成对应的档号;对于具有归档章的纸质档案,按照归档印章自动识别档号。
S4,将档案目录信息按照档案目录信息模板导出为excel格式文件,定义为档案目录文件,档案目录文件中包括档号。
S5,输出档案目录文件和对应的经归档处理后的图像文件。优选的,所述归档处理后的图像文件包括带有归档章信息的纸质档案图像。
结合图4,步骤S3中,所述采用如前所述的纸质档案数字化处理系统对其进行归档章印制处理包括以下步骤:
S31,选择进纸盒2内的其中一份纸质档案,经传送机构3传送至识别区。
S32,采用条形码识别机构5对识别区内的纸质档案进行扫描,如果识别成功,将识别结果发送至管理服务器,进入步骤S33,如果识别失败,转入步骤S36。
S33,管理服务器根据条形码获取该纸质档案对应的档案目录信息和图像信息,如果获取成功,根据档案目录信息生成归档章信息,结合归档章信息和图像信息计算得到归档章预设位置,转入步骤S34,如果获取失败,转入步骤S36。
S34,管理服务器结合归档章信息和归档章预设位置,生成打印图片,将打印图片发送至打印机构6,以及驱使打印机构6抓取纸质档案的归档章印制页,将归档章打印在归档章印制页上,在纸质档案的剩余页经由传送机构3传输至输出区后,将归档章印制页放置在最上方,重新整合纸质档案后将纸质档案传输至输出区。
S35,采用传送机构3将打印有归档章的纸质档案直接传送至第一出纸盒9内,结束流程。
S36,采用传送机构3和输出导板7将纸质文件直接传送至第二出纸盒8内。
本发明的纸质档案数字化方法主要有以下步骤和功能:
1、根据纸质档案的类型制定相应的档案目录信息模型,档案目录信息包含但不限于:档号、题名、文号、责任者、成文日期、序号(可选)等信息,可按照具体的档案类型和实际需要自定义。档案目录信息模型一般会使用Excel表格保存成模板,称为档案目录信息模板。档案目录信息模板的自定义功能,可以适应不同类型的纸质档案的数字化需要。
2、将需要进行档案数字化的纸质档案借出,在拆卷(件)后,按照顺序进行扫描生成对应的图像文件(如:JPEG、TIFF等格式的图像文件)并保存。
3、按照需要处理的档案类型选择相应的档案目录信息模板,系统按照所选的模板加载档案目录信息。
4、选择需要处理的图像文件夹。
5、系统自动按照图像文件夹中图像文件顺序读取图片信息并进行处理,过程如下:
5.1、归档章识别,归档章位于图片头部,一个2行3列的表格,若存在归档章则确定归档章位置并使用OCR技术提取归档章信息,对提取到的信息进行处理生成档号;若无归档章则档号为空,标记为新归档纸质档案,同时生成唯一的条形码信息,通过与系统连接的条码打印机打印条码,然后将打印的条形码粘贴到对应的纸质档案上。
5.2、使用OCR技术识别档案目录信息中相应信息。档案目录信息的生成由系统自动完成,减少了人工输入目录信息的步骤,有效降低了档案目录出错概率、提高了档案数字化工作效率、降低了档案数字化工作成本。
6、人工使用系统对识别的信息进行审核和修正,对于未识别到的信息手工选择对应图像文件的相关区域进行定点识别;对于识别错误的信息手工修正识别结果;对于多页的情况确定序号信息;确定新归档纸质档案标记信息是否正确。当前OCR识别技术已经非常成熟,识别准确率很高,因此,审核时修正的工作量较小。系统支持在图像文件上选择区域进行定点识别,则可以更加高效的完成信息修正,进一步减少修正的工作量。
7、(可选)对于新归档纸质档案,系统按照当前数据集自动生成档号。
8、将档案目录信息按照档案目录信息模板导出为Excel格式文件,称为档案目录文件。档案目录文件文件中会存储新归档纸质档案标记、对应图像文件的路径、条形码信息等模板中可能未定义的特殊信息。
9、(可选)对于新归档纸质档案,人工对档案目录文件中系统生成的档号进行审核和调整,并保存调整的档号信息到档案目录文件中。
10、(可选)对于新归档纸质档案,自动将档案目录文件导入到系统中。
11、(可选)对于新归档纸质档案,自动根据档号生成带归档信息的归档印章并嵌入到对应的图像文件中,归档印章的位置默认在图像文件的头部并居中,系统自动识别默认位置是否是空白区域,如果非空白,默认位置往右、往左、往下依次查找空白区域,找到合适的空白位置则为该纸质档案归档章所在位置。
12、(可选)对于新归档纸质档案,人工使用系统审核归档印章的位置是否合适,如果不合适则手工调整到合适位置,并保存调整后的位置信息。
13、(可选)将需要打印归档章的纸质档案放入归档章打印装置中批量打印归档章。归档印章打印功能减少了人工盖章和手工填写归档信息的步骤,杜绝了归档信息填写出错的问题、提升了档案数字化工作效率、降低了档案数字化工作成本。
14、将导出的档案目录文件和处理后的图像文件作为档案数字化成果提交后续使用。
15、人工将纸质档案装订、装盒、归还、上架保存。
以上仅是本发明的优选实施方式,本发明的保护范围并不仅局限于上述实施例,凡属于本发明思路下的技术方案均属于本发明的保护范围。应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理前提下的若干改进和润饰,应视为本发明的保护范围。

Claims (10)

1.一种纸质档案数字化处理系统,其特征在于,所述处理系统包括归档章识别装置、条形码打印装置、条形码粘贴装置、档案传送装置、归档章打印装置和管理服务器;
所述归档章识别装置包括用于放置纸质档案的放置平台,归档章识别装置根据管理服务器发送的控制指令判断放置平台上的纸质档案上是否打印有归档章,如果没有,请求管理服务器获取纸质档案的图像信息,根据纸质档案的图像信息生成唯一对应的条形码,并调用条形码打印装置打印条形码,将打印的条形码采用条形码粘贴装置粘贴在纸质档案的归档章印制页上,再将纸质档案通过档案传送装置传送至归档章打印装置的进纸盒内,其中,归档章印制页位于首页且条形码朝上设置;
所述归档章打印装置对纸质档案上的条形码进行识别,将识别结果发送至管理服务器,管理服务器根据条形码获取该纸质档案对应的档案目录信息,并根据条形码识别结果和档案目录信息获取结果对纸质档案进行处理:
(1)如果管理服务器成功根据条形码获取到纸质档案对应的档案目录信息,根据档案目录信息生成归档章信息和归档章预设位置,以及结合归档章信息和归档章预设位置,生成打印图片,驱动归档章打印装置将打印图片打印在纸质档案的归档章印制页上,输出纸质档案;
(2)否则,直接输出纸质档案,且输出位置和打印有归档章的纸质档案不同。
2.根据权利要求1所述的纸质档案数字化处理系统,其特征在于,所述归档章打印装置包括底座、进纸盒、传送机构、面罩、条形码识别机构、打印机构、输出导板、第一出纸盒和第二出纸盒;
所述面罩呈长方体状,罩设在底座上方,与底座上表面构成一容纳腔;所述传送机构水平设置在底座上表面上,沿传送方向依次被划分成进纸区、处理区和出纸区,所述处理区位于容纳腔内,进纸区和出纸区分别位于容纳腔两侧;所述进纸盒设置在传送机构的进纸区处,所述第一出纸盒和第二出纸盒设置在传送机构的出纸区处;所述传送机构用于根据外部控制指令将进纸盒内的纸质档案传送至第一出纸盒或第二出纸盒;
将处理区沿传送方向依次划分成识别区、打印区和输出区,所述条形码识别机构、打印机构和输出导板安装在容纳腔内,挂接在面罩内侧,条形码识别机构安装在识别区上方,打印机构安装在打印区上方,输出导板安装在输出区上方;
所述条形码识别机构用于对识别区内的纸质档案进行扫描,将识别结果发送至管理服务器,管理服务器根据条形码获取该纸质档案对应的档案目录信息和图像信息,根据档案目录信息生成归档章信息,结合归档章信息和图像信息计算得到归档章预设位置;所述管理服务器结合归档章信息和归档章预设位置,生成打印图片,将打印图片发送至打印机构;所述打印机构悬置在传送机构上方,用于根据管理服务器的控制指令抓取纸质档案的归档章印制页,将归档章打印在归档章印制页上,以及在纸质档案的剩余页经由传送机构传输至输出区后,将归档章印制页放置在最上方,重新整合纸质档案后将纸质档案传输至输出区,以使打印有归档章的纸质档案经由传送机构直接传送至第一出纸盒内;
如果条形码识别机构无法识别条形码或管理服务器无法根据条形码获取纸质档案对应的档案目录信息,管理服务器驱使传送机构和输出导板将纸质文件直接传送至第二出纸盒内。
3.根据权利要求2所述的纸质档案数字化处理系统,其特征在于,所述第二出纸盒悬置在第一出纸盒上方,输出导板上设置有传送组件,其沿传送方向设置有第一端部和第二端部,输出导板的第二端部与第二出纸盒铰接,输出导板根据管理服务器的控制指令绕铰接点转动,以使输出导板平行于传送机构或输出导板的第一端部与传送机构相接,相接点为输出区和打印区的分界点;
如果条形码识别机构无法识别条形码或管理服务器无法根据条形码获取纸质档案对应的档案目录信息,管理服务器转动输出导板,使输出导板的第一端部与传送机构相接,传送机构将纸质档案依次经由传送机构和输出导板传输至第二出纸盒内。
4.根据权利要求2所述的纸质档案数字化处理系统,其特征在于,所述打印机构包括位置识别单元、第一抓取单元、悬置单元、打印设备、第二抓取单元和限位单元,所述位置识别单元、第一抓取单元、第二抓取单元、限位单元和打印设备均与管理服务器连接;
所述打印设备通过悬置单元安装在面罩内侧,其悬置在传送机构上方;
所述位置识别单元位于打印设备临近条形码识别机构的一侧,用于实时探测是否有纸质档案进入打印区,将探测结果发送至管理服务器;
所述限位单元可升降地安装在传送机构上,位于打印设备临近输出区的一侧,根据管理服务器的控制指令升起至传送机构上方或者下降至完全收纳在传送机构内部;
所述管理服务器响应于位置识别单元探测到有纸质档案进入打印区,驱使第一抓取单元抓取位于最上方的归档章印制页,传送至打印设备,启动打印设备将打印图片打印在归档章印制页上;同时,其余档案页沿传送机构继续前行,直至其前边沿接触限位单元;
当其余档案页的前边沿接触限位单元时,管理服务器驱使第二抓取单元从打印设备上抓取打印好的归档章印制页,将其放置在其余档案页的正上方。
5.根据权利要求1所述的纸质档案数字化处理系统,其特征在于,如果所述归档章识别装置识别到纸质档案上存在归档章,管理服务器采用OCR技术获取纸质档案的归档章信息,对提取到的归档章信息进行处理以生成对应的档号。
6.根据权利要求1所述的纸质档案数字化处理系统,其特征在于,所述归档章信息包括归档章模板,以及归档章模板中与当前纸质档案对应的每个项目的填写信息。
7.根据权利要求6所述的纸质档案数字化处理系统,其特征在于,所述归档章模板的填写项包括全宗号、年度、件号、机构或问题、保管期限和页数。
8.一种纸质档案数字化处理方法,其特征在于,所述处理方法包括:
S1,根据需要处理的档案类型选择相应的档案目录信息模板,并加载档案目录信息;
S2,选择需要处理的纸质档案对应的图像文件夹;
S3,按照图像文件夹中的图像信息顺序使用OCR技术识别档案目录信息中的相应信息;其中,对于没有归档章的纸质档案,将其标记为新归档纸质档案,采用如权利要求1-7中任意一项所述的纸质档案数字化处理系统对其进行归档章印制处理后,根据归档章信息生成对应的档号;对于具有归档章的纸质档案,按照归档印章自动识别档号;
S4,将档案目录信息按照档案目录信息模板导出为excel格式文件,定义为档案目录文件,档案目录文件中包括档号;
S5,输出档案目录文件和对应的经归档处理后的图像文件。
9.根据权利要求8所述的纸质档案数字化处理方法,其特征在于,所述归档处理后的图像文件包括带有归档章信息的纸质档案图像。
10.根据权利要求8所述的纸质档案数字化处理方法,其特征在于,步骤S3中,所述采用如权利要求1-7中任意一项所述的纸质档案数字化处理系统对其进行归档章印制处理包括以下步骤:
S31,选择进纸盒内的其中一份纸质档案,经传送机构传送至识别区;
S32,采用条形码识别机构对识别区内的纸质档案进行扫描,如果识别成功,将识别结果发送至管理服务器,进入步骤S33,如果识别失败,转入步骤S36;
S33,管理服务器根据条形码获取该纸质档案对应的档案目录信息和图像信息,如果获取成功,根据档案目录信息生成归档章信息,结合归档章信息和图像信息计算得到归档章预设位置,转入步骤S34,如果获取失败,转入步骤S36;
S34,管理服务器结合归档章信息和归档章预设位置,生成打印图片,将打印图片发送至打印机构,以及驱使打印机构抓取纸质档案的归档章印制页,将归档章打印在归档章印制页上,在纸质档案的剩余页经由传送机构传输至输出区后,将归档章印制页放置在最上方,重新整合纸质档案后将纸质档案传输至输出区;
S35,采用传送机构将打印有归档章的纸质档案直接传送至第一出纸盒内,结束流程;
S36,采用传送机构和输出导板将纸质文件直接传送至第二出纸盒内。
CN202011045278.2A 2020-09-29 2020-09-29 一种纸质档案数字化处理系统和方法 Active CN112115915B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011045278.2A CN112115915B (zh) 2020-09-29 2020-09-29 一种纸质档案数字化处理系统和方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011045278.2A CN112115915B (zh) 2020-09-29 2020-09-29 一种纸质档案数字化处理系统和方法

Publications (2)

Publication Number Publication Date
CN112115915A true CN112115915A (zh) 2020-12-22
CN112115915B CN112115915B (zh) 2024-01-16

Family

ID=73797170

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011045278.2A Active CN112115915B (zh) 2020-09-29 2020-09-29 一种纸质档案数字化处理系统和方法

Country Status (1)

Country Link
CN (1) CN112115915B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112754177A (zh) * 2020-12-31 2021-05-07 南京惠达威信息科技有限公司 一种档案数字化加工数据保密管理系统
CN114138710A (zh) * 2021-12-02 2022-03-04 山东合联互联网科技有限公司 一种用于城建档案的电子化归档方法及系统

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR3001562A1 (fr) * 2013-01-28 2014-08-01 Sinexy Gestion informatisee de l'archivage de documents au moyen de codes a plusieurs dimensions
CN104361013A (zh) * 2014-10-14 2015-02-18 国家电网公司 基于云服务器的档案同步存储查阅系统及方法
CN108509564A (zh) * 2018-03-23 2018-09-07 乐清咔咔网络科技有限公司 基于印章印文扫描的电子档案归档和查询服务系统及方法
CN109670150A (zh) * 2018-12-12 2019-04-23 上海中信信息发展股份有限公司 一种电子文档归档方法及装置
CN110413569A (zh) * 2019-07-30 2019-11-05 石浩灼 纸质档案电子化归档方法、装置及终端设备
CN111597150A (zh) * 2020-05-09 2020-08-28 云南驰宏锌锗股份有限公司 一种自动化归档整理信息系统

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR3001562A1 (fr) * 2013-01-28 2014-08-01 Sinexy Gestion informatisee de l'archivage de documents au moyen de codes a plusieurs dimensions
CN104361013A (zh) * 2014-10-14 2015-02-18 国家电网公司 基于云服务器的档案同步存储查阅系统及方法
CN108509564A (zh) * 2018-03-23 2018-09-07 乐清咔咔网络科技有限公司 基于印章印文扫描的电子档案归档和查询服务系统及方法
CN109670150A (zh) * 2018-12-12 2019-04-23 上海中信信息发展股份有限公司 一种电子文档归档方法及装置
CN110413569A (zh) * 2019-07-30 2019-11-05 石浩灼 纸质档案电子化归档方法、装置及终端设备
CN111597150A (zh) * 2020-05-09 2020-08-28 云南驰宏锌锗股份有限公司 一种自动化归档整理信息系统

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
RUHAIMI ET AL.: "Scanning Process in Digitization of Records and Archives Materials", 《INTERNATIONAL JOURNAL OF ACADEMIC RESEARCH IN BUSINESS AND SOCIAL SCIENCES》, vol. 8, no. 9, pages 191 - 201 *
丁德胜;: "《纸质档案数字复制件光学字符识别(OCR)工作规范》解读", 中国档案, no. 02, pages 35 - 36 *
刘淑妮等: "再谈"卷"改"件"——新《归档文件整理规则》颁布之后", 《档案学研究》, vol. 04, pages 11 - 16 *
郭英等: "民政纸质档案数字化整理过程及方法", 《吉林化工学院学报》, vol. 37, no. 08, pages 97 - 100 *
陆坚;芮振;: "新形势下档案安全管理工作初探――以太仓市档案局为例", 档案与建设, no. 01, pages 84 - 86 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112754177A (zh) * 2020-12-31 2021-05-07 南京惠达威信息科技有限公司 一种档案数字化加工数据保密管理系统
CN114138710A (zh) * 2021-12-02 2022-03-04 山东合联互联网科技有限公司 一种用于城建档案的电子化归档方法及系统

Also Published As

Publication number Publication date
CN112115915B (zh) 2024-01-16

Similar Documents

Publication Publication Date Title
US8477992B2 (en) Document processing system control using document feature analysis for identification
US5191525A (en) System and method for extraction of data from documents for subsequent processing
US4553261A (en) Document and data handling and retrieval system
US5344132A (en) Image based document processing and information management system and apparatus
CN112115915A (zh) 一种纸质档案数字化处理系统和方法
US5659164A (en) Method of and system for apparatus for two-way automatically creating, identifying, routing and storing digitally scanned documents
EP1727054A2 (en) Digitized document archiving system
US20070206223A1 (en) Centralized, automatic extraction of data from remotely transformed and transmitted forms
CN101257554A (zh) 文档处理装置、文档处理系统和文档处理方法
US20040162831A1 (en) Document handling system and method
US5974177A (en) Apparatus and method of network distribution of record data using transmittal symbols hand entered on a transmittal sheet
CN102147864B (zh) 票据读取装置和票据读取方法
US7333936B2 (en) Bar code synchronization process for scanning mail envelopes and their contents
CN1781073B (zh) 一种文档处理的方法和系统
CN201222256Y (zh) 一种数字化集成加工的档案系统
US8698032B2 (en) Mail sorting system and method of sorting mails
CN108388412B (zh) 打印用印装置及打印用印控制方法、装置、系统
US8322846B2 (en) System and method for providing multiple uses of printer coversheets
CN216527248U (zh) 一种民航旅客行李分拣系统
US9531906B2 (en) Method for automatic conversion of paper records to digital form
CN109598863B (zh) 一种公章自助备案自助制章系统及方法
US7423777B2 (en) Imaging system and business methodology
CN201570062U (zh) 一种基于档案信息资源规划的档案整理与数字化加工系统
JP6736277B2 (ja) 帳票処理方法、帳票処理装置、システムおよびプログラム
CN104680414A (zh) 帐票数据管理系统、方法、以及帐票数据管理装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant