CN115019326B - 档案录入系统、方法、装置以及存储介质 - Google Patents
档案录入系统、方法、装置以及存储介质 Download PDFInfo
- Publication number
- CN115019326B CN115019326B CN202210924873.6A CN202210924873A CN115019326B CN 115019326 B CN115019326 B CN 115019326B CN 202210924873 A CN202210924873 A CN 202210924873A CN 115019326 B CN115019326 B CN 115019326B
- Authority
- CN
- China
- Prior art keywords
- cell
- archive
- image
- information
- position information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/413—Classification of content, e.g. text, photographs or tables
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/1444—Selective acquisition, locating or processing of specific regions, e.g. highlighted text, fiducial marks or predetermined fields
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/412—Layout analysis of documents structured with printed lines or input boxes, e.g. business forms or tables
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Artificial Intelligence (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请涉及档案信息管理以及信息检索技术领域,公开了一种档案录入系统、方法、装置以及存储介质。其中,档案录入系统,包括图像形成设备以及与图像形成设备连接的计算设备。其中,图像形成设备用于生成与纸质档案对应的档案图像;以及计算设备配置用于执行以下操作:从图像形成设备获取档案图像;对档案图像进行识别,确定与纸质档案对应的表格类别以及人员标识信息;以及根据所确定的表格类别以及人员标识信息,将档案图像存储在与人员标识信息和表格类别对应的数据单元中。解决了现有技术中存在的纸质档案的录入和挂接需要人工手动录入,从而耗费人力且效率低下的技术问题。
Description
技术领域
本申请涉及档案信息管理以及信息检索技术领域,特别是涉及一种档案录入系统、方法、装置以及存储介质。
背景技术
档案的数字化管理已经越来越普遍地得到应用,并且大大提高了档案管理的效率。通过将各个人员的档案以数字化信息的方式录入数据库中,可以方便管理人员快速准确地检索以及查阅指定人员在某个时期的信息。
已经公开的发明专利申请(CN108510020A)公开了一种档案录入管理系统,包括主界面、以太网、档案录入单元、档案查询单元、档案借阅单元、条码枪。所述主界面上连接有以太网,所述以太网上连接有档案录入单元、档案查询单元、档案借阅单元,所述档案录入单元上连接有条码枪。本发明具有稳定性高、存储信息安全、提取信息效率快、操作简单的优点。
另一篇已经公开的发明专利申请(CN111597418A)公开了一种基于大数据的档案数据存储系统,包括档案数据存储控制装置和档案数据存储中心,档案数据存储控制装置包括身份验证模块、档案录入模块、档案分类模块、档案加密模块、档案存储模块、档案提取模块、档案解密模块、档案比较模块和档案输出模块,身份验证通过之后,对档案数据进行分类、加密并存储在对应的存储模块中,当进行档案提取时,根据待提取的档案数据集名称从对应的存储模块中得到加密档案数据集并进行加密,经过档案比较判断之后,若满足条件,则输出。该档案数据存储系统能够提升档案数据存储的安全性,并能够保证提取得到的档案数据集没有被破坏或者被篡改。
档案录入是档案数字化管理的一个非常重要的环节。在日常档案录入的过程中,工作人员接收的往往都是档案散材料,这意味着不同人员的档案是零散提供的,并且不同类别的档案也是零散提供的。但是按照国家对于档案数字化技术规范的相关要求,数字档案必须按照不同人员以及不同类别实现有序存储,这样才能够根据人员标识信息和表格类别快速检索到该档案。
为了满足上述要求,在以往的纸质档案的录入和挂接工作中仍然是通过工作人员人工查找纸质档案中的内容,并手动录入与档案关联的人员标识信息以及类别信息,因此档案的录入和挂接不仅消耗大量人力,并且效率低下。
针对上述的现有技术中存在的纸质档案的录入和挂接需要人工手动录入,从而耗费人力且效率低下的技术问题,目前尚未提出有效的解决方案。
发明内容
本公开的实施例提供了一种档案录入系统、方法、装置以及存储介质,以至少解决现有技术中存在的纸质档案的录入和挂接需要人工手动录入,从而耗费人力且效率低下的技术问题。
根据本公开实施例的一个方面,提供了一种档案录入系统,包括图像形成设备以及与图像形成设备连接的计算设备。图像形成设备用于生成与纸质档案对应的档案图像;以及计算设备配置用于执行以下操作:从图像形成设备获取档案图像;对档案图像进行识别,确定与纸质档案对应的表格类别以及人员标识信息;以及根据所确定的表格类别以及人员标识信息,将档案图像存储在与人员标识信息和表格类别对应的数据单元中。
根据本公开实施例的另一方面,还提供了一种档案录入方法,包括:获取与纸质档案对应的档案图像;对档案图像进行识别,确定与纸质档案对应的表格类别以及人员标识信息;以及根据所确定的表格类别以及人员标识信息,将档案图像存储在与人员标识信息和表格类别对应的数据单元中。
根据本公开实施例的另一个方面,还提供了一种存储介质,存储介质包括存储的程序,其中,在程序运行时由处理器执行以上的方法。
根据本公开实施例的另一个方面,还提供了一种档案录入装置,包括:图像获取模块,用于获取与纸质档案对应的档案图像;识别模块,用于对档案图像进行识别,确定与纸质档案对应的表格类别以及人员标识信息;以及存储模块,用于根据所确定的表格类别以及人员标识信息,将档案图像存储在与人员标识信息和表格类别对应的数据单元中。
根据本公开实施例的另一个方面,还提供了一种档案录入装置,包括:处理器;以及存储器,与处理器连接,用于为处理器提供处理以下处理步骤的指令:获取与纸质档案对应的档案图像;对档案图像进行识别,确定与纸质档案对应的表格类别以及人员标识信息;以及根据所确定的表格类别以及人员标识信息,将档案图像存储在与人员标识信息和表格类别对应的数据单元中。
从而,本公开的技术方案巧妙地利用了档案的表格中各个单元格与内容的关系,首先根据单元格的位置信息确定包含人员标识信息的目标单元格,然后再在档案图像中确定与目标单元格对应的目标图像区域。从而根据上述操作,可以准确地在档案图像中提取出包含人员标识信息的图像区域,从而有利于快速准确地实现档案的录入挂接。
附图说明
此处所说明的附图用来提供对本公开的进一步理解,构成本申请的一部分,本公开的示意性实施例及其说明用于解释本公开,并不构成对本公开的不当限定。在附图中:
图1是用于实现根据本公开实施例1所述的方法的计算设备的硬件结构框图;
图2是根据本公开实施例1第一个方面所述的档案录入系统的示意图;
图3是根据本公开实施例1的第一个方面所述档案录入系统的计算设备所执行的操作的流程示意图;
图4A示例性的示出了作为档案的一种表格类别的干部任免审批表的首页的档案图像的示意图;
图4B示例性的示出了干部任免审批表的第二页的档案图像的示意图;
图5A示出了档案录入系统的计算设备中所布署的档案库的数据结构的示意图;
图5B进一步示出了档案库中与各个人员对应的数据单元的进一步的数据结构;
图6A示出了从图4A所示的档案图像中提取的各个矩形单元格的示意图;
图6B示出了从图4B所示的档案图像中提取的各个矩形单元格的示意图;
图7A示出了存在填写错误的干部任免审批表的档案图像的示意图;
图7B示出了从图7A所示的档案图像中提取的各个矩形单元格的示意图;
图8是根据本公开实施例1的第二个方面所述的档案录入方法的流程示意图;
图9A和图9B是根据本公开实施例1的第一个方面所述的档案录入系统的计算设备所执行的操作的详细流程示意图;
图10是根据本公开实施例2所述的档案录入装置的示意图;以及
图11是根据本公开实施例3所述的档案录入装置的示意图。
具体实施方式
为了使本技术领域的人员更好地理解本公开的技术方案,下面将结合本公开实施例中的附图,对本公开实施例中的技术方案进行清楚、完整地描述。显然,所描述的实施例仅仅是本公开一部分的实施例,而不是全部的实施例。基于本公开中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本公开保护的范围。
需要说明的是,本公开的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本公开的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
实施例1
根据本实施例,提供了一种档案录入方法的方法实施例,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
本实施例所提供的方法实施例可以在移动终端、计算机终端、服务器或者类似的计算设备中执行。图1示出了一种用于实现档案录入方法的计算设备的硬件结构框图。如图1所示,计算设备可以包括一个或多个处理器(处理器可以包括但不限于微处理器MCU或可编程逻辑器件FPGA等的处理装置)、用于存储数据的存储器、用于通信功能的传输装置以及输入/输出接口。其中存储器、传输装置以及输入/输出接口通过总线与处理器连接。除此以外,还可以包括:与输入/输出接口连接的显示器、键盘以及光标控制设备。本领域普通技术人员可以理解,图1所示的结构仅为示意,其并不对上述电子装置的结构造成限定。例如,计算设备还可包括比图1中所示更多或者更少的组件,或者具有与图1所示不同的配置。
应当注意到的是上述一个或多个处理器和/或其他数据处理电路在本文中通常可以被称为“数据处理电路”。该数据处理电路可以全部或部分的体现为软件、硬件、固件或其他任意组合。此外,数据处理电路可为单个独立的处理模块,或全部或部分的结合到计算设备中的其他元件中的任意一个内。如本公开实施例中所涉及到的,该数据处理电路作为一种处理器控制(例如与接口连接的可变电阻终端路径的选择)。
存储器可用于存储应用软件的软件程序以及模块,如本公开实施例中的档案录入方法对应的程序指令/数据存储装置,处理器通过运行存储在存储器内的软件程序以及模块,从而执行各种功能应用以及数据处理,即实现上述的应用程序的档案录入方法。存储器可包括高速随机存储器,还可包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器可进一步包括相对于处理器远程设置的存储器,这些远程存储器可以通过网络连接至计算设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
传输装置用于经由一个网络接收或者发送数据。上述的网络具体实例可包括计算设备的通信供应商提供的无线网络。在一个实例中,传输装置包括一个网络适配器(Network Interface Controller,NIC),其可通过基站与其他网络设备相连从而可与互联网进行通讯。在一个实例中,传输装置可以为射频(Radio Frequency,RF)模块,其用于通过无线方式与互联网进行通讯。
显示器可以例如触摸屏式的液晶显示器(LCD),该液晶显示器可使得用户能够与计算设备的用户界面进行交互。
此处需要说明的是,在一些可选实施例中,上述图1所示的计算设备可以包括硬件元件(包括电路)、软件元件(包括存储在计算机可读介质上的计算机代码)、或硬件元件和软件元件两者的结合。应当指出的是,图1仅为特定具体实例的一个实例,并且旨在示出可存在于上述计算设备中的部件的类型。
图2是根据本实施例第一个方面所述的档案录入系统的示意图。参考图2所示,档案录入系统包括图像形成设备100以及与图像形成设备100连接的计算设备200。其中,图像形成设备100例如可以是扫描仪或者照相机,用于对纸质档案进行扫描或者拍照,从而生成与纸质档案对应的档案图像。计算设备200例如可以是终端设备与服务器相结合的系统,也可以是单独的计算机设备,此处不做限制。其中,计算设备200可以适用于图1示出的构造。
其中,图3示出了计算设备200所执行的操作的流程图,参考图3所示,计算设备200配置用于执行以下操作:
S302:从图像形成设备100获取档案图像;
S304:对档案图像进行识别,确定与纸质档案对应的表格类别以及人员标识信息;以及
S306:根据所确定的表格类别以及人员标识信息,将档案图像存储在与人员标识信息和表格类别对应的数据单元中。
具体地,参考图2所示,在进行纸质档案的录入挂接时,工作人员首先利用图像形成设备100对纸质档案进行扫描或者拍照。从而图像形成设备100生成与纸质档案对应的档案图像,并将档案图像发送至计算设备200。从而计算设备200从图像形成设备100获取与纸质档案对应的档案图像(S302)。
其中,作为纸质档案的实例,该纸质档案例如可以是“干部任免审批表”。进而,图像形成设备100对干部任免审批表进行扫描或拍照,并形成干部任免审批表的档案图像。从而计算设备200从图像形成设备100获取干部任免审批表的档案图像。其中图4A示出了一个“干部任免审批表”的首页的档案图像的示意图,并且图4B示出了该“干部任免审批表”的第二页的档案图像的示意图。
然后,计算设备200对该档案图像进行识别,确定与纸质档案对应的表格类别以及人员标识信息(S304)。
根据本实施例,纸质档案例如可以是多个不同表格类别中的一种表格,例如图4A和图4B示出了该纸质档案是干部任免审批表。除了干部任免审批表之外,纸质档案的类别还可以包括干部任前审核登记表等多个不同类别的表格。从而,计算设备200可以对该档案图像进行识别,从而确定纸质档案属于哪个表格类别。
此外,计算设备200还对档案图像进行识别,从而确定与纸质档案对应的人员标识信息。例如,计算设备200根据档案图像,确定该纸质档案对应的人员的姓名以及出生年月等信息作为与该纸质档案对应的人员标识信息。具体地,例如计算设备200根据图4A和图4B示出的档案图像,识别出与纸质档案对应的人员的姓名为“杜三”,出生年月为“1964年2月”。
然后,计算设备200根据所识别的人员标识信息以及表格类别,将档案图像存储在与人员标识信息及表格类别对应的数据单元中(S306)。
具体地,图5A示出了计算设备200中所布署的档案库的数据结构的示意图。该数据结构例如可以是根据国标GB/T33870-2017构建的文件夹,或者是文件管理目录。参考图5A所示,该档案库首先按照不同的人员来构建与之对应的数据单元,其中该数据单元例如可以是与各个人员对应的文件夹,例如与杜三对应的文件夹、与人员2对应的文件夹或者与人员3对应的文件夹等等。此外,该数据单元也可以是与各个人员对应的存储空间,例如与杜三对应的存储空间、与人员2对应的存储空间或者与人员3对应的存储空间等等。从而与不同人员对应的档案图像可以存储在与不同人员对应的文件夹或者存储空间中。
例如与杜三对应的档案图像会存储在与杜三对应的文件夹或存储空间中,与人员2对应的档案图像会存储在与人员2对应的文件夹或存储空间中,以此类推。
此外,图5B进一步以杜三为例示出了档案库中与各个人员对应的数据单元的进一步的数据结构。参考图5B所示,与杜三对应的数据单元进一步包括与不同的表格类别对应的多个数据单元。例如杜三对应的数据单元进一步包括与干部任免审批表对应的数据单元以及与干部任前审核登记表对应的数据单元等。该数据单元例如可以是与各个表格类别对应的文件夹或者存储空间,例如与干部任免审批表对应的文件夹或存储空间以及与干部任前审核登记表对应的文件夹或存储空间等。从而不同表格类别的档案图像可以存储在不同表格类别对应的数据单元中。
例如,杜三的干部任免审批表的档案图像存储在杜三的与干部任免审批表对应的文件夹或存储空间中,杜三的干部任前审核登记表的档案图像存储在杜三的与干部任前审核登记表对应的文件夹或存储空间中。
此外,尽管图5B中是以杜三为例进行说明,但是对于档案库中其他人员也参照图5B相同的形式存储各个表格类别的档案图像,此处不再赘述。
从而,计算设备200在从图像形成设备100接收档案图像,并且根据档案图像确定纸质档案对应的表格类别以及人员标识信息之后。根据所确定的表格类别和人员标识信息,将档案图像存储在与人员标识信息及表格类别对应的数据单元中。例如,计算设备200根据图4A所示出的档案图像识别出该人员标识信息为杜三的人员标识信息,并且纸质档案的表格类别为干部任免审批表后,将该纸质档案对应的档案图像存储在档案库中杜三的“干部任免审批表”数据单元中。
正如背景技术中所述的,在日常档案录入的过程中,工作人员接收的往往都是档案散材料,这意味着不同人员的档案是零散提供的,并且不同类别的档案也是零散提供的。尽管如此,为了实现后续检索的高效性和准确性,仍然希望数字档案能够按照不同人员以及按照不同类别实现有序存储,以便能够根据人员标识信息和表格类别快速检索到该档案。为了满足上述要求,纸质档案的录入和挂接仍然是通过工作人员人工查找纸质档案中的内容,并手动录入与档案关联的人员标识信息以及类别信息,因此档案的录入和挂接不仅消耗大量人力,并且效率低下。
有鉴于此,根据本公开的技术方案,计算设备在获取档案图像之后,会对档案图像进行识别,从而确定与纸质档案对应的表格类别以及人员标识信息(例如,这里的人员标识信息可以是指纸质档案所属人员的姓名和出生年月)。然后,计算设备根据所识别的表格类别以及人员标识信息将档案图像存储在与该人员和表格类别对应的数据单元中,从而实现了纸质档案的自动录入挂接。从而,通过这种方式,即便是在针对纸质档案散材料录入时,也不需要人工手动录入,因此减少了人力的消耗,提高了档案录入挂接的效率。解决了现有技术中存在的纸质档案的录入和挂接需要人工手动录入,从而耗费人力且效率低下的技术问题。
可选地,在对档案图像进行识别之前,计算设备200还配置用于执行以下操作:对档案图像进行旋转,以纠正档案图像的角度偏移。具体地,计算设备200可以确定与档案图像中的表格对应的最小外接矩形,并根据所确定的最小外接矩形的偏移角度来确定档案图像的偏移角度。然后,计算设备200可以根据所确定的档案图像的偏移角度,对档案图像进行旋转,以便纠正档案图像的角度偏移。
可选地,对档案图像进行识别,确定与纸质档案对应的表格类别的操作,包括:利用预先训练的基于神经网络的表格识别模型,根据档案图像从多个预先定义的表格类别中确定与纸质档案对应的表格类别。
具体地,计算设备200中部署有预先训练的表格识别模型,从而计算设备200可以将档案图像输入表格识别模型,从而确定该档案图像对应的表格类别。例如,计算设备200将图4A所示的档案图像输入至表格识别模型,可以确定与该档案图像对应的表格类别是“干部任免审批表”。
具体地,在本公开的技术方案中,该表格识别模型例如可以是基于Resnet18网络设计的分类模型,并且本公开的技术方案针对档案预先定义17个不同的表格类别,包括干部任免审批表、干部任前审核登记表、......以及空白页等。从而计算设备200在将档案图像输入该表格识别模型后,可以从以上17个预先定义的类别中确定与该档案图像对应的表格类别。
其中,该表格识别模型可以通过以下方式进行构建和训练:
首先,构建训练样本集。具体地,可以先通过人工合成的方式构建档案样本,例如利用word和excel文档制作不同表格类别的档案样本,并且利用word和execl的文档接口进行表格内容的丰富,然后保存成图片从而形成档案样本。然后,将人工合成的档案样本与真实档案样本以1:3的比重进行组合,从而构建训练样本集。
然后,先使用imagenet的训练模型对初始模型进行迁移学习。具体地,利用imagenet对基于Resnet18构建的初始化模型进行迁移学习,从而得到进行迁移学习后的表格识别模型。
最后,利用构建的训练样本集对迁移学习后的表格识别模型进行训练。具体地,训练过程中先进行冻结训练,首先冻结预训练好的主干特征提取网络,只更新全局平均池化层和全连接层的权重,之后再进行全网络的正常训练。从而通过训练得到的最优的表格识别模型,用于确定档案图像的表格类别。
从而,本公开的技术方案利用基于神经网络的表格识别模型,可以借助于深度学习的理论,通过大规模的训练样本集,训练得到更加准确的表格识别模型,从而能够准确地对档案的表格类别进行预测。
可选地,对档案图像进行识别,确定与纸质档案对应的人员标识信息的操作,包括:确定档案图像所包含的表格的各个单元格的第一位置信息;根据第一位置信息,确定包含人员标识信息的目标单元格;从档案图像中获取与目标单元格对应的目标图像区域;以及对目标图像区域进行识别,确定人员标识信息。
具体地,计算设备200首先从档案图像中提取档案图像所包含的表格的轮廓,并提取表格的各个矩形单元格。然后,计算设备200确定各个矩形单元格的位置信息(即第一位置信息)。
其中,例如图6A示出了与图4A中的档案图像对应的边框的示意图,图6B示出了与图4B中的档案图像对应的边框的示意图。并且图6A和图6B进一步分别示出了从图4A和图4B所示的干部任免审批表的档案图像中提取的各个矩形单元格的示意图。并且作为示例,图6A和图6B示出了各个单元格位置信息(即第一位置信息)。例如:印刷体标识“姓名”所对应的单元格的位置信息为(0,0),与填写的姓名对应的单元格的位置信息为(0,1),以此类推。
然后,计算设备200根据各个单元格的位置信息,确定包含人员标识信息的目标单元格(即第一目标单元格)。
例如,根据本公开的技术方案,在针对档案预先定义17个不同的表格类别后,可以针对每一个表格类别配置与该表格类别对应的单元格信息。其中单元格信息描述了与该表格类别对应的档案的表格中,不同位置信息的单元格的内容信息。
例如,下面表1以列表形式示出了干部任免审批表的单元格信息:
表1
从而,计算设备200在确定图6A和图6B所示出的各个矩形单元格的位置信息之后,根据上面表1列出的信息可以确定位置信息为(0,1)的单元格的内容对应于档案相关的人员的姓名,以及确定位置信息为(0,5)的单元格的内容对应于档案相关的人员的出生年月。从而计算设备200将位置信息为(0,1)和(0,5)的单元格作为包含人员标识信息的目标单元格。
然后,计算设备200例如可以通过裁剪的方式根据所确定的目标单元格从档案图像中获取与位置信息为(0,1)和(0,5)的单元格对应的目标图像区域(即第一目标图像区域)。
最后,计算设备200对所获取的目标图像区域进行识别,确定与档案关联的人员的姓名以及出生年月(即人员标识信息)。
正如上文中所述的,根据本公开的技术方案,计算设备对档案图像进行识别,确定与纸质档案对应的表格类别以及人员标识信息。但是档案图像中包含的内容繁多,而人员标识信息在档案图像中仅仅占据很少的一部分。以图4A所示的档案图像为例,档案图像的内容不仅包括相关人员的姓名和出生年月,还包括相关人员的性别、民族、籍贯、学历以及简历等诸多内容。而其中相关人员的姓名和出生年月的图像区域,相对于整个档案图像,仅仅占有很小的比例。因此如果想要根据档案图像准确识别相关人员的标识信息,就需要首先将包含人员标识信息的图像区域准确地从档案图像中提取出来。
为了解决这个问题,本公开的技术方案巧妙地利用了档案的表格中各个单元格与内容的关系,首先根据单元格的位置信息确定包含人员标识信息的目标单元格,然后再在档案图像中确定与目标单元格对应的目标图像区域。从而根据上述操作,可以准确地在档案图像中提取出包含人员标识信息的图像区域,从而有利于快速准确地实现档案的录入挂接。
可选地,确定档案图像所包含的表格的各个单元格的第一位置信息的操作,包括:确定各个单元格的第二位置信息,其中第二位置信息指示各个单元格所对应的图像区域的位置信息;以及根据第二位置信息对各个单元格进行排序,从而确定各个单元格的第一位置信息,其中第一位置信息用于指示各个单元格进行排序后的序列位置。
正如上面所述,本公开的技术方案根据单元格的位置信息确定包含人员标识信息的目标单元格,然后再在档案图像中确定与目标单元格对应的目标图像区域。但是在由纸质档案生成档案图像的过程中,即便是相同表格类别的档案图像,由于扫描或拍摄的原因也容易出现表格不一致的情况。例如,不同档案图像的表格大小不一致,或者不同档案图像的表格的像素位置不一致等。从而容易出现根据档案图像所确定的单元格的位置信息与预先配置的单元格信息中的位置信息不匹配的情形,从而导致无法准确地确定包含人员标识信息的单元格。因此在档案的批量录入挂接过程中,如何快速准确地从档案图像中提取包含人员标识信息的单元格成为难于解决的问题。
有鉴于此,根据本公开的技术方案,计算设备200在获取档案图像(参考图4A和图4B所示的档案图像)之后,首先确定表格中各个单元格所对应的图像区域的位置信息(即第二位置信息),例如各个单元格相对于表格的像素坐标原点(即表格的左上角的像素,例如图4A中的像素点A1和图4B中的像素点A2)的像素坐标信息。其中,各个单元格的像素位置信息例如可以简化地通过各个单元格的左上角像素的像素坐标信息来表示。因此各个单元格所对应的图像区域的位置信息可以简化地表示为各个单元格的左上角的像素相对于表格的左上角像素的像素坐标信息。
然后,计算设备200根据各个单元格所对应的图像区域的位置信息,对各个单元格进行排序,从而根据排序确定各个单元格排序后的序列位置(即第一位置信息)。例如,图6A和图6B分别示出的各个单元格的位置信息为各个单元格分别按照行和列进行排序后的序列位置。例如序列位置信息(0,1)表示相应单元格为第0行的第1列单元格,序列位置信息(1,3)表示相应单元格为第1行第3列单元格,以此类推。当然,图6A和图6B仅仅示出了一种排序的方法,除此以外,也可以逐行对各个单元格进行排序,或者逐列对各个单元格进行排序,从而确定各个单元格的序列位置,只要排序后得到的序列位置与相应的单元格唯一对应即可。
此外相应的,表1中示出的各个单元格的位置信息,也是各个单元格的序列位置信息。
从而,通过这种方式,本公开的技术方案根据各个单元格的序列位置而不是各个单元格的像素位置对各个单元格进行标识。因此,即便是存在相同表格类别的档案图像由于扫描或拍摄的原因出现表格不一致的情况,也可以准确且唯一地通过单元格的序列位置标识各个单元格,进而能够准确地根据单元格的序列位置信息确定包含人员标识信息的单元格。
可选地,确定表格的各个单元格的第二位置信息的操作,包括:从档案图像提取横线段集合和竖线段集合,其中横线段集合包括档案图像所包含的横线段,并且竖线段集合包括档案图像所包含的竖线段;根据横线段集合与竖线段集合构建与表格对应的边框;以及根据边框的单元格确定表格的各个单元格的第二位置信息。
具体地,计算设备200在获取档案图像(例如图4A和图4B示出的档案图像)之后,利用基于深度学习网络unet的线段提取模型从档案图像中提取档案图像所包含的横线段集合以及竖线段集合。并且,进一步地,在线段提取模型提取横线段集合和竖线段集合之后,可以采用哈夫曼线弥补横线段集合和竖线段集合的断点。
然后计算设备200根据所提取的横线段集合以及竖线段集合重新构建与档案图像所包含的表格对应的边框。例如,图6A和图6B示出了与图4A和图4B中的干部任免审批表的档案图像对应的边框的示意图。
然后计算设备200根据图6A和图6B中示出的边框的单元格确定档案图像所包含的表格的单元格的像素位置信息。例如计算设备200可以将边框的各个单元格的左上角的像素相对于边框的左上角像素(例如图6A中示出的像素点A1和图6B中示出的像素点A2)的像素坐标信息,作为档案图像所包含的表格的各个单元格的像素位置信息(即第二位置信息)。
从而通过以上操作,本公开的技术方案可以准确地确定档案图像的表格中各个单元格的像素位置信息。
其中基于深度学习网络unet的线段提取模型可以通过以下流程进行构建和训练:
首先构建训练样本集。具体地,收集包含横线和竖线的图片,然后针对图片进行数据标注,标出图片上的横线与竖线的集合,从而构建训练样本集。
然后,构建基于unet的线段提取模型,并且加载预训练后的权重。
最后,利用训练样本集对该线段提取模型进行训练,在训练50个世代之后保存最优的线段提取模型。
可选地,在确定与档案图像所包含的表格的各个单元格的第一位置信息,之后,计算设备还配置于执行以下操作:将所确定的各个单元格的第一位置信息与预先配置的单元格信息进行比对,确定错误的单元格,其中单元格信息与所确定的表格类别对应。
具体地,由于档案相关的人员在填写档案表格内容时的书写原因,容易导致计算设备200在提取横线段集合与竖线段集合时出现错误。图7A示出了人员杜三填写的“干部任免审批表”的另一个档案图像的示意图。参考图7A所示,人员杜三在填写出生年月时,将数字“1964.2”中的“1”写得过长甚至超出单元格,从而计算设备在提取竖线段集合时,会将数字“1”识别为竖线段。进而,导致构建的边框出现错误。
其中,图7B示出了计算设备200根据图7A示出的档案图像所生成的表格边框的示意图。参考图7B所示,由于杜三在填写出生年月时,将“1964.02”中的“1”写得过长,因此,计算设备200将原本序列位置信息为(0,5)的单元格错识别为两个单元格(0,5)和(0,6)。因此,如果按照错误的单元格,就不能正确地在图7A所示的档案图像中确定与杜三的人员标识信息对应的图像区域,从而导致出现档案录入挂接的错误。
有鉴于此,计算设备200在构建与表格对应的边框之后,还可以通过以下操作检查边框中的错误:
具体地,计算设备200在构建图7B所示的边框之后,确定边框中各个单元格所对应的图像区域的序列位置信息(对应于第一位置信息)。例如,图7B中示出了各个单元格的序列位置信息。
然后,计算设备200将边框的各个单元格的序列位置信息与预先存储的相同表格类别的单元格信息(例如表1所示的单元格信息)中的各个单元格的序列位置信息进行比对,从而检测边框中存在的错误单元格。例如,通过比对,计算设备200可以检测出第0行的单元格的列数与相应表格类别的单元格信息中的列数不一致,从而可以确定该行存在错误的单元格,即第0行为存在错误的错误行。然后进一步地,计算设备200根据该错误行的各个单元格所对应的图像区域所包含的内容信息,确定错误行的中的错误单元格。例如,计算设备200根据与序列位置信息为(0,5)的图像区域进行检测,确定相应图像区域的内容为空白。但是根据相应的单元格信息(例如表1所示的单元格信息),可知与该序列位置信息对应的内容为相关人员的出生年月,因此可以确定序列位置信息为(0,5)的单元格出现了错误。
从而计算设备200在检测出错误后,会输出提示信息,提示工作人员进行检查,避免由于相关人员在填写档案时的书写问题导致的档案的录入挂接过程中出现错误。
可选地,对目标图像区域进行识别,确定人员标识信息的操作,包括:利用基于神经网络的文本检测模型,从目标图像区域中检测包含人员标识信息的文本区域;以及利用基于神经网络的文本识别模型,根据文本区域确定人员标识信息。
具体地,计算设备200在通过裁剪的方式根据所确定的目标单元格从档案图像中获取与位置信息为(0,1)和(0,5)的单元格对应的图像区域(图4A所示的档案图像中内容为“杜三”和“1964.02”的单元格所对应的图像区域,即目标图像区域)之后,可以利用基于神经网络的文本检测模型,从位置信息为(0,1)的单元格对应的图像区域检测包含人员姓名的文本区域以及从位置信息为(0,5)的单元格对应的图像区域检测包含人员出生年月的文本区域(其中人员姓名以及人员出生年月对应于人员标识信息)。具体地,文本检测模型例如可以是基于神经网络dbnet的文本检测模型。从而可以利用该文本检测模型分别对上述两个图像区域进行检测。
然后,计算设备200利用基于神经网络的文本识别模型,在包含人员姓名的文本区域识别人员姓名,以及在包含人员出生年月的文本区域识别人员出生年月。具体地,该文本识别模型例如是基于神经网络densenet的文本识别模型,从而可以根据文本区域识别文本的内容信息。
在实际的档案录入挂接过程中,即便是能够通过单元格准确地定位到与人员标识信息对应的目标图像区域。但是,由于纸质档案容易受到油污等损坏,因此如果目标图像区域存在油污,就很难从目标图像区域中准确识别人员标识信息。
从而为了避免纸质档案的油污对档案录入挂接的干扰,本公开的技术方案在通过单元格确定与人员标识信息相关的目标图像区域之后,并不是直接从目标图像区域中识别人员标识信息,而是用文本检测模型首先在该目标图像区域中进一步检测包含人员标识信息的文本区域。从而通过这种方式,能够将文本区域与油污污染的图像区域分离,然后再从文本区域中确定人员标识信息,从而能够根据目标图像区域准确地识别与人员相关的人员标识信息,从而准确地实现档案的录入挂接。
此外,文本检测模型例如可以通过以下步骤进行构建和训练:
首先,构建训练样本集。具体地,根据本公开的技术方案,首先使用3000张扫描过的图片作为训练数据。优选地可以对图片进行增强处理,例如进行图片的色域变化、亮度变化、随机翻转等操作。
然后,构建基于神经网络dbnet的文本检测模型,并利用imagenet进行预训练。
最后,利用构建的训练样本集对预训练后的文本检测模型进行训练。其中,训练过程使用预训练后的权重作为初始权重,先冻结主干特征提取网络的权重并对主干特征提取网络后端的各个网络层的权重进行微调,然后再解冻主干特征提取网络的权重进行全网络正常训练。训练200世代之后选择最优的模型进行模型压缩,对得到的权重进行INT8量化,将模型大小可以压缩为原来的1/4大小,fps提高为原来的3倍。
此外,文本识别模型例如可以通过以下步骤进行构建和训练:
首先,构建训练样本集。具体地,本公开技术方案选择330万中文数据集合进行的训练,每张图片有10个中文汉字,图片大小为32*280。数据集合采用了图片模糊、倾斜、拉伸、字体等技术随机生成。数据集合中包括5983个常用中文字符,并采用“空格”作为分隔符。根据已知中文字符集合和数据集信息按照3:1的比例人工合成110万中文数据集合。
然后构建基于神经网络densenet的文本识别模型,并利用imagenet进行预训练。
最后,利用构建的训练样本集对预训练后的文本识别模型进行训练。其中,训练过程使用预训练后的权重作为初始权重,利用构建的训练样本集进行训练。在训练过程中按照8:1:1划分为训练集、验证集和测试集。先进行20个世代的冻结训练,再解冻之后进行30个世代的正常训练。模型评估之后选择最优的模型作为推理模型。
此外,在图4A所示出的表格中,相关人员是以打字填写表格的,从而表格中填写的内容是印刷体形式的文字。通过上面所述的方法训练的文本检测模型以及文本识别模型可以对印刷体形式的文字进行有效识别。但是,经过测试后发现利用上述方法训练的文本检测模型以及文本识别模型也可以用于在手写方式填写的表格中进行有效识别(只是训练样本为手写文字的样本图像)。由于本公开的技术方案首先在表格中确定目标单元格,然后根据目标单元格在档案图像中确定相应的目标图像区域,因此文本检测和文本识别仅仅在已经确定的目标图像区域中进行即可。从而本公开的技术方案大大减少了文本检测模型以及文本识别模型所处理的信息的复杂度。
此外优选地,本公开的技术方案将推理模型进行INT8量化压缩可以减少模型的占用显存空间并提高推理速度。推理模型的准确率可以达到97.8%,单张图片在RTX2070显卡上的推理时间为1.7ms。
此外,计算设备200还配置用于执行以下操作:对档案图像进行识别,确定与纸质档案的生成时间对应的时间信息;以及根据所确定的时间信息,将所述档案图像存储在与所述时间信息对应的数据单元中。
具体地,参考图5B所示,对于同一个人员即便是在同一个表格类别对应的数据单元中,也可以包括与该表格类别对应的多个不同的档案信息的数据单元。
例如,参考图5B所示,与“杜三”的“干部任免审批表”对应的数据单元中可以包括分别与杜三在不同时期填写的不同的干部任免审批表对应的数据单元。从而,与杜三在不同时期的干部任免相关的档案信息按照时间循序存储在不同的数据单元中。
因此,为了实现档案图像的按序存储,计算设备200进一步在档案图像中识别与纸质档案的生成时间对应的时间信息,并根据所识别的时间信息按序存储该档案图像。
具体地,参考图4B与图6B所示,根据本公开的技术方案,对于“干部任免审批表”,可以预先设定为将“审核机关意见”中签署的日期作为该档案的生成日期。
从而计算设备200可以根据表1示出的单元格信息,将序列位置信息为(13,1)的单元格,确定为包含审核机关意见的签署日期的目标单元格(即第二目标单元格)。从而计算设备200根据该目标单元格在图4B所示的档案图像中确定包含审核机关意见的目标图像区域(即第二目标图像区域)。
然后,计算设备200在该目标图像区域中利用文本检测模型(即第二文本检测模型,例如也可以是基于dbnet的文本检测模型)检测文本区域(即第二文本区域),并且利用文本识别模型(即第二文本识别模型,例如也可以是基于densenet的文本识别模型)对该文本区域进行识别,从而识别出目标图像区域中签署的日期作为该纸质档案的生成时间对应的时间信息。
从而通过这种方式,可以自动根据档案图像,按照档案生成的时间顺序,依序对档案进行录入挂接。
此外,根据本实施例的第二个方面,提供了一种档案录入方法,该方法例如由图2中示出的计算设备200来实施,其中图8示出了该方法的流程示意图。参考图8所示,方法包括:
S802:获取与纸质档案对应的档案图像;
S804:对档案图像进行识别,确定与纸质档案对应的表格类别以及人员标识信息;以及
S806:根据所确定的表格类别以及人员标识信息,将档案图像存储在与人员标识信息和表格类别对应的数据单元中。
可选地,对所述档案图像进行识别,确定与所述纸质档案对应的表格类别的操作,包括:利用预先训练的基于神经网络的表格识别模型,根据所述档案图像从多个预先定义的表格类别中确定与所述纸质档案对应的表格类别。
可选地,对所述档案图像进行识别,确定与所述纸质档案对应的人员标识信息的操作,包括:确定所述档案图像所包含的表格的各个单元格的第一位置信息;根据所述第一位置信息,确定包含所述人员标识信息的目标单元格;从所述档案图像中获取与所述目标单元格对应的目标图像区域;以及对所述目标图像区域进行识别,确定所述人员标识信息。
可选地,确定所述档案图像所包含的表格的各个单元格的第一位置信息的操作,包括:确定所述表格的各个单元格的第二位置信息,其中所述第二位置信息指示所述表格的各个单元格所对应的图像区域的位置信息;以及根据所述第二位置信息对所述表格的各个单元格进行排序,从而确定所述表格的各个单元格的所述第一位置信息,其中所述第一位置信息用于指示所述表格的各个单元格进行所述排序后的序列位置。
可选地,确定所述表格的各个单元格的第二位置信息的操作,包括:从所述档案图像提取横线段集合和竖线段集合,其中所述横线段集合包括所述档案图像所包含的横线段,并且所述竖线段集合包括所述档案图像所包含的竖线段;根据所述横线段集合与所述竖线段集合构建与所述表格对应的边框;以及根据所述边框的单元格确定所述表格的各个单元格的第二位置信息。
可选地,对所述目标图像区域进行识别,确定所述人员标识信息的操作,包括:利用基于神经网络的文本检测模型,从所述目标图像区域中检测包含所述人员标识信息的文本区域;以及利用基于神经网络的文本识别模型,根据所述文本区域确定所述人员标识信息。
此外,图9A和图9B按照时间顺序示出了图2所示的档案录入系统的计算设备200的操作的详细流程图,具体地,参考图9所示:
首先,计算设备200从图像形成设备100获取与纸质档案对应的档案图像(S902);
然后,计算设备200利用预先训练的基于神经网络resnet18的表格识别模型,识别与纸质档案对应的表格类别(S904);
然后,计算设备200利用基于神经网络unet从档案图像提取横线段集合和竖线段集合,并且利用霍夫曼线弥补断点后的横线段和竖线段(S906);
然后,计算设备200根据提取的横线段集合与竖线段集合,重构与纸质档案包含的表格对应的边框(S908);
然后,计算设备200根据边框的各个单元格,确定纸质档案包含的表格的各个单元格所对应的图像区域的位置信息(即第二位置信息)(S910);
然后,计算设备200根据表格的各个单元格的第二位置信息,对各个单元格进行排序,确定各个单元格的序列位置信息(即第一位置信息)(S912);
然后,计算设备200根据各个单元格的序列位置信息,确定包含人员标识信息的第一目标单元格(S914);
然后,计算设备200根据目标单元格在档案图像中确定与第一目标单元格对应的第一目标图像区域(S916);
然后,计算设备200利用基于神经网络dbnet的文本检测模型在第一目标图像区域中检测第一文本区域(S918);
然后,计算设备200利用基于神经网络densenet的文本识别模型,从第一文本区域识别人员标识信息(S920);
然后,计算设备200根据各个单元格的序列位置信息,确定包含与纸质档案的生成时间对应的时间信息的第二目标单元格(S922);
然后,计算设备200根据第二目标单元格在档案图像中确定与第二目标单元格对应的第二目标图像区域(S924);
然后,计算设备200利用基于神经网络dbnet的文本检测模型在第二目标图像区域中检测第二文本区域(S926);
然后,计算设备200利用基于神经网络densenet的文本识别模型,从第二文本区域识别时间信息(S928);
最后,计算设备200根据识别的人员标识信息、表格类别以及时间信息,将档案图像存储到对应的数据单元(S930)。
此外,参考图1所示,根据本实施例的第三个方面,提供了一种存储介质。所述存储介质包括存储的程序,其中,在所述程序运行时由处理器执行以上任意一项所述的方法。
从而根据本公开的技术方案,计算设备在获取档案图像之后,会对档案图像进行识别,从而确定与纸质档案对应的表格类别以及人员标识信息(例如,这里的人员标识信息可以是指纸质档案所属人员的姓名和出生年月)。然后,计算设备根据所识别的表格类别以及人员标识信息将档案图像存储在与该人员和表格类别对应的数据单元中,从而实现了纸质档案的自动录入挂接。从而,通过这种方式,即便是在针对纸质档案散材料录入时,也不需要人工手动录入,因此减少了人力的消耗,提高了档案录入挂接的效率。解决了现有技术中存在的纸质档案的录入和挂接需要人工手动录入,从而耗费人力且效率低下的技术问题。
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制,因为依据本发明,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本发明所必须的。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到根据上述实施例的方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
实施例2
图10示出了根据本实施例所述的档案录入装置1000,该装置1000与根据实施例1的第二个方面所述的方法相对应。参考图10所示,该装置1000包括:图像获取模块1010,用于获取与纸质档案对应的档案图像;识别模块1020,用于对档案图像进行识别,确定与纸质档案对应的表格类别以及人员标识信息;以及存储模块1030,用于根据所确定的表格类别以及人员标识信息,将档案图像存储在与人员标识信息和表格类别对应的数据单元中。
可选地,识别模块1020包括:表格类别识别子模块,用于利用预先训练的基于神经网络的表格识别模型,根据档案图像从多个预先定义的表格类别中确定与纸质档案对应的表格类别。
可选地,识别模块1020包括:第一位置信息确定子模块,用于确定档案图像所包含的表格的各个单元格的第一位置信息;目标单元格确定子模块,根据第一位置信息,确定包含人员标识信息的目标单元格;目标图像区域确定子模块,用于从档案图像中获取与目标单元格对应的目标图像区域;以及人员标识信息确定子模块,用于对目标图像区域进行识别,确定人员标识信息。
可选地,第一位置信息确定子模块包括:第二位置信息确定单元,用于确定表格的各个单元格的第二位置信息,其中第二位置信息指示表格的各个单元格所对应的图像区域的位置信息;以及排序单元,根据第二位置信息对表格的各个单元格进行排序,从而确定表格的各个单元格的第一位置信息,其中第一位置信息用于指示表格的各个单元格进行排序后的序列位置。
可选地,第二位置信息确定单元包括:线段确定子单元,用于从档案图像提取横线段集合和竖线段集合,其中横线段集合包括档案图像所包含的横线段,并且竖线段集合包括档案图像所包含的竖线段;边框构建子单元,用于根据横线段集合与竖线段集合构建与表格对应的边框;以及第二位置信息确定子单元,根据边框的单元格确定表格的各个单元格的第二位置信息。
可选地,人员标识信息确定子模块包括:文本检测单元,用于利用基于神经网络的文本检测模型,从目标图像区域中检测包含人员标识信息的文本区域;以及文本识别单元,用于利用基于神经网络的文本识别模型,根据文本区域确定人员标识信息。
从而根据本实施例,计算设备在获取档案图像之后,会对档案图像进行识别,从而确定与纸质档案对应的表格类别以及人员标识信息(例如,这里的人员标识信息可以是指纸质档案所属人员的姓名和出生年月)。然后,计算设备根据所识别的表格类别以及人员标识信息将档案图像存储在与该人员和表格类别对应的数据单元中,从而实现了纸质档案的自动录入挂接。从而,通过这种方式,即便是在针对纸质档案散材料录入时,也不需要人工手动录入,因此减少了人力的消耗,提高了档案录入挂接的效率。解决了现有技术中存在的纸质档案的录入和挂接需要人工手动录入,从而耗费人力且效率低下的技术问题。
实施例3
图11示出了根据本实施例所述的档案录入装置1100,该装置1100与根据实施例1的第二个方面所述的方法相对应。参考图11所示,该装置1100包括:处理器;以及存储器,与处理器连接,用于为处理器提供处理以下处理步骤的指令:获取与纸质档案对应的档案图像;对档案图像进行识别,确定与纸质档案对应的表格类别以及人员标识信息;以及根据所确定的表格类别以及人员标识信息,将档案图像存储在与人员标识信息和表格类别对应的数据单元中。
可选地,对所述档案图像进行识别,确定与所述纸质档案对应的表格类别的操作,包括:利用预先训练的基于神经网络的表格识别模型,根据所述档案图像从多个预先定义的表格类别中确定与所述纸质档案对应的表格类别。
可选地,对所述档案图像进行识别,确定与所述纸质档案对应的人员标识信息的操作,包括:确定所述档案图像所包含的表格的各个单元格的第一位置信息;根据所述第一位置信息,确定包含所述人员标识信息的目标单元格;从所述档案图像中获取与所述目标单元格对应的目标图像区域;以及对所述目标图像区域进行识别,确定所述人员标识信息。
可选地,确定所述档案图像所包含的表格的各个单元格的第一位置信息的操作,包括:确定所述表格的各个单元格的第二位置信息,其中所述第二位置信息指示所述表格的各个单元格所对应的图像区域的位置信息;以及根据所述第二位置信息对所述表格的各个单元格进行排序,从而确定所述表格的各个单元格的所述第一位置信息,其中所述第一位置信息用于指示所述表格的各个单元格进行所述排序后的序列位置。
可选地,确定所述表格的各个单元格的第二位置信息的操作,包括:从所述档案图像提取横线段集合和竖线段集合,其中所述横线段集合包括所述档案图像所包含的横线段,并且所述竖线段集合包括所述档案图像所包含的竖线段;根据所述横线段集合与所述竖线段集合构建与所述表格对应的边框;以及根据所述边框的单元格确定所述表格的各个单元格的第二位置信息。
可选地,对所述目标图像区域进行识别,确定所述人员标识信息的操作,包括:利用基于神经网络的文本检测模型,从所述目标图像区域中检测包含所述人员标识信息的文本区域;以及利用基于神经网络的文本识别模型,根据所述文本区域确定所述人员标识信息。
从而根据本实施例,计算设备在获取档案图像之后,会对档案图像进行识别,从而确定与纸质档案对应的表格类别以及人员标识信息(例如,这里的人员标识信息可以是指纸质档案所属人员的姓名和出生年月)。然后,计算设备根据所识别的表格类别以及人员标识信息将档案图像存储在与该人员和表格类别对应的数据单元中,从而实现了纸质档案的自动录入挂接。从而,通过这种方式,即便是在针对纸质档案散材料录入时,也不需要人工手动录入,因此减少了人力的消耗,提高了档案录入挂接的效率。解决了现有技术中存在的纸质档案的录入和挂接需要人工手动录入,从而耗费人力且效率低下的技术问题。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
在本发明的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的技术内容,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。
Claims (8)
1.一种档案录入系统,包括图像形成设备(100)以及与所述图像形成设备(100)连接的计算设备(200),其特征在于,
所述图像形成设备(100)用于生成与纸质档案对应的档案图像;以及
所述计算设备(200)配置用于执行以下操作:
从所述图像形成设备(100)获取所述档案图像;
对所述档案图像进行识别,确定与所述纸质档案对应的表格类别以及人员标识信息;以及
根据所确定的表格类别以及人员标识信息,将所述档案图像存储在与所述人员标识信息和所述表格类别对应的数据单元中,其中
对所述档案图像进行识别,确定与所述纸质档案对应的人员标识信息的操作,包括:确定所述档案图像所包含的表格的各个单元格的第一位置信息;根据所述第一位置信息,确定包含所述人员标识信息的目标单元格,其中预先定义有多个不同的表格类别,并针对每一个表格类别配置与所述表格类别对应的单元格信息,并且其中所述单元格信息用于描述与所述表格类别对应的档案的表格中,不同位置信息的单元格的内容信息;根据所述单元格信息从所述档案图像中获取与所述目标单元格对应的目标图像区域;以及对所述目标图像区域进行识别,确定所述人员标识信息,并且
在确定与档案图像所包含的表格的各个单元格的第一位置信息后,计算设备(200)还配置于执行以下操作:将所确定的各个单元格的所述第一位置信息与预先配置的单元格信息进行比对,确定错误的单元格,其中所述单元格信息与所确定的表格类别对应,并且其中
确定所述档案图像所包含的表格的各个单元格的第一位置信息的操作,包括:确定所述表格的各个单元格的第二位置信息,其中所述第二位置信息用于指示所述各个单元格的像素位置信息;以及根据所述第二位置信息对所述表格的各个单元格进行排序,从而确定所述表格的各个单元格的所述第一位置信息,其中所述第一位置信息用于指示所述表格的各个单元格进行所述排序后的序列位置。
2.根据权利要求1所述的系统,其特征在于,对所述档案图像进行识别,确定与所述纸质档案对应的表格类别的操作,包括:利用预先训练的基于神经网络的表格识别模型,根据所述档案图像从多个预先定义的表格类别中确定与所述纸质档案对应的表格类别。
3.根据权利要求1所述的系统,其特征在于,确定所述表格的各个单元格的第二位置信息的操作,包括:
从所述档案图像提取横线段集合和竖线段集合,其中所述横线段集合包括所述档案图像所包含的横线段,并且所述竖线段集合包括所述档案图像所包含的竖线段;
根据所述横线段集合与所述竖线段集合构建与所述表格对应的边框;以及
根据所述边框的单元格确定所述表格的各个单元格的第二位置信息。
4.根据权利要求1所述的系统,其特征在于,对所述目标图像区域进行识别,确定所述人员标识信息的操作,包括:
利用基于神经网络的文本检测模型,从所述目标图像区域中检测包含所述人员标识信息的文本区域;以及
利用基于神经网络的文本识别模型,根据所述文本区域确定所述人员标识信息。
5.一种档案录入方法,其特征在于,包括:
获取与纸质档案对应的档案图像;
对所述档案图像进行识别,确定与所述纸质档案对应的表格类别以及人员标识信息;以及
根据所确定的表格类别以及人员标识信息,将所述档案图像存储在与所述人员标识信息和所述表格类别对应的数据单元中,其中
对所述档案图像进行识别,确定与所述纸质档案对应的人员标识信息的操作,包括:确定所述档案图像所包含的表格的各个单元格的第一位置信息;根据所述第一位置信息,确定包含所述人员标识信息的目标单元格,其中预先定义有多个不同的表格类别,并针对每一个表格类别配置与所述表格类别对应的单元格信息,并且其中所述单元格信息用于描述与所述表格类别对应的档案的表格中,不同位置信息的单元格的内容信息;根据所述单元格信息从所述档案图像中获取与所述目标单元格对应的目标图像区域;以及对所述目标图像区域进行识别,确定所述人员标识信息,并且
在确定与档案图像所包含的表格的各个单元格的第一位置信息后,将所确定的各个单元格的所述第一位置信息与预先配置的单元格信息进行比对,确定错误的单元格,其中所述单元格信息与所确定的表格类别对应,并且其中
确定所述档案图像所包含的表格的各个单元格的第一位置信息的操作,包括:确定所述表格的各个单元格的第二位置信息,其中所述第二位置信息指示所述表格的各个单元格所对应的图像区域的位置信息;以及根据所述第二位置信息用于指示所述各个单元格的像素位置信息,从而确定所述表格的各个单元格的所述第一位置信息,其中所述第一位置信息用于指示所述表格的各个单元格进行排序后的序列位置。
6.一种存储介质,其特征在于,所述存储介质包括存储的程序,其中,在所述程序运行时由处理器执行权利要求5所述的方法。
7.一种档案录入装置,其特征在于,包括:
图像获取模块,用于获取与纸质档案对应的档案图像;
识别模块,用于对所述档案图像进行识别,确定与所述纸质档案对应的表格类别以及人员标识信息;以及
存储模块,用于根据所确定的表格类别以及人员标识信息,将所述档案图像存储在与所述人员标识信息和所述表格类别对应的数据单元中,其中
对所述档案图像进行识别,确定与所述纸质档案对应的人员标识信息的操作,包括:确定所述档案图像所包含的表格的各个单元格的第一位置信息;根据所述第一位置信息,确定包含所述人员标识信息的目标单元格,其中预先定义有多个不同的表格类别,并针对每一个表格类别配置与所述表格类别对应的单元格信息,并且其中所述单元格信息用于描述与所述表格类别对应的档案的表格中,不同位置信息的单元格的内容信息;根据所述单元格信息从所述档案图像中获取与所述目标单元格对应的目标图像区域;以及对所述目标图像区域进行识别,确定所述人员标识信息,并且
在确定与档案图像所包含的表格的各个单元格的第一位置信息后,将所确定的各个单元格的所述第一位置信息与预先配置的单元格信息进行比对,确定错误的单元格,其中所述单元格信息与所确定的表格类别对应,并且其中
确定所述档案图像所包含的表格的各个单元格的第一位置信息的操作,包括:确定所述表格的各个单元格的第二位置信息,其中所述第二位置信息用于指示所述各个单元格的像素位置信息;以及根据所述第二位置信息对所述表格的各个单元格进行排序,从而确定所述表格的各个单元格的所述第一位置信息,其中所述第一位置信息用于指示所述表格的各个单元格进行所述排序后的序列位置。
8.一种档案录入装置,其特征在于,包括:
处理器;以及
存储器,与所述处理器连接,用于为所述处理器提供处理以下处理步骤的指令:
获取与纸质档案对应的档案图像;
对所述档案图像进行识别,确定与所述纸质档案对应的表格类别以及人员标识信息;以及
根据所确定的表格类别以及人员标识信息,将所述档案图像存储在与所述人员标识信息和所述表格类别对应的数据单元中,其中
对所述档案图像进行识别,确定与所述纸质档案对应的人员标识信息的操作,包括:确定所述档案图像所包含的表格的各个单元格的第一位置信息;根据所述第一位置信息,确定包含所述人员标识信息的目标单元格,其中预先定义有多个不同的表格类别,并针对每一个表格类别配置与所述表格类别对应的单元格信息,并且其中所述单元格信息用于描述与所述表格类别对应的档案的表格中,不同位置信息的单元格的内容信息;根据所述单元格信息从所述档案图像中获取与所述目标单元格对应的目标图像区域;以及对所述目标图像区域进行识别,确定所述人员标识信息,并且
在确定与档案图像所包含的表格的各个单元格的第一位置信息后,将所确定的各个单元格的所述第一位置信息与预先配置的单元格信息进行比对,确定错误的单元格,其中所述单元格信息与所确定的表格类别对应,并且其中
确定所述档案图像所包含的表格的各个单元格的第一位置信息的操作,包括:确定所述表格的各个单元格的第二位置信息,其中所述第二位置信息用于指示所述各个单元格的像素位置信息;以及根据所述第二位置信息对所述表格的各个单元格进行排序,从而确定所述表格的各个单元格的所述第一位置信息,其中所述第一位置信息用于指示所述表格的各个单元格进行所述排序后的序列位置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210924873.6A CN115019326B (zh) | 2022-08-02 | 2022-08-02 | 档案录入系统、方法、装置以及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210924873.6A CN115019326B (zh) | 2022-08-02 | 2022-08-02 | 档案录入系统、方法、装置以及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115019326A CN115019326A (zh) | 2022-09-06 |
CN115019326B true CN115019326B (zh) | 2023-08-22 |
Family
ID=83066092
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210924873.6A Active CN115019326B (zh) | 2022-08-02 | 2022-08-02 | 档案录入系统、方法、装置以及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115019326B (zh) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107729576A (zh) * | 2017-11-28 | 2018-02-23 | 北京筑业志远软件开发有限公司 | 档案的管理方法和系统 |
CN109635268A (zh) * | 2018-12-29 | 2019-04-16 | 南京吾道知信信息技术有限公司 | Pdf文件中表格信息的提取方法 |
CN110705515A (zh) * | 2019-10-18 | 2020-01-17 | 山东健康医疗大数据有限公司 | 一种基于ocr文字识别的医院纸质档案归档方法及系统 |
WO2020232872A1 (zh) * | 2019-05-22 | 2020-11-26 | 平安科技(深圳)有限公司 | 表格识别方法、装置、计算机设备和存储介质 |
CN114120345A (zh) * | 2020-09-01 | 2022-03-01 | 中国移动通信有限公司研究院 | 信息提取方法、装置、设备及存储介质 |
-
2022
- 2022-08-02 CN CN202210924873.6A patent/CN115019326B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107729576A (zh) * | 2017-11-28 | 2018-02-23 | 北京筑业志远软件开发有限公司 | 档案的管理方法和系统 |
CN109635268A (zh) * | 2018-12-29 | 2019-04-16 | 南京吾道知信信息技术有限公司 | Pdf文件中表格信息的提取方法 |
WO2020232872A1 (zh) * | 2019-05-22 | 2020-11-26 | 平安科技(深圳)有限公司 | 表格识别方法、装置、计算机设备和存储介质 |
CN110705515A (zh) * | 2019-10-18 | 2020-01-17 | 山东健康医疗大数据有限公司 | 一种基于ocr文字识别的医院纸质档案归档方法及系统 |
CN114120345A (zh) * | 2020-09-01 | 2022-03-01 | 中国移动通信有限公司研究院 | 信息提取方法、装置、设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN115019326A (zh) | 2022-09-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11645826B2 (en) | Generating searchable text for documents portrayed in a repository of digital images utilizing orientation and text prediction neural networks | |
CN111753767B (zh) | 一种作业自动批改的方法、装置、电子设备和存储介质 | |
RU2668717C1 (ru) | Генерация разметки изображений документов для обучающей выборки | |
CN111753120B (zh) | 一种搜题的方法、装置、电子设备和存储介质 | |
KR20090084968A (ko) | 모바일 장치 시스템을 이용한 디지탈 이미지 아카이빙 및 검색 | |
CN111178147B (zh) | 屏幕破碎分级方法、装置、设备及计算机可读存储介质 | |
CN110569856A (zh) | 样本标注方法及装置、损伤类别的识别方法及装置 | |
CN104079587A (zh) | 证书识别装置及证书检验系统 | |
CN114463567B (zh) | 一种基于区块链的智慧教育作业大数据防抄袭方法与系统 | |
US11315353B1 (en) | Systems and methods for spatial-aware information extraction from electronic source documents | |
CN112084812A (zh) | 图像处理方法、装置、计算机设备及存储介质 | |
CN110110110A (zh) | 一种以图搜图方法、装置、电子设备及存储介质 | |
CN110781811B (zh) | 异常工单识别方法、装置、可读存储介质和计算机设备 | |
CN115019326B (zh) | 档案录入系统、方法、装置以及存储介质 | |
JP2015138458A (ja) | 情報処理システム、情報処理装置及びプログラム | |
CN113837169B (zh) | 文本数据处理方法、装置、计算机设备及存储介质 | |
CN111079777A (zh) | 一种基于书页定位的点读方法及电子设备 | |
JP7420578B2 (ja) | 帳票仕分システム、帳票仕分方法、及びプログラム | |
CN114973218A (zh) | 图像处理方法、装置及系统 | |
CN113807256A (zh) | 票据数据处理方法、装置、电子设备和存储介质 | |
CN113780116A (zh) | 发票分类方法、装置、计算机设备和存储介质 | |
CN110751140A (zh) | 字符批量识别方法、装置和计算机设备 | |
Nair et al. | A Smarter Way to Collect and Store Data: AI and OCR Solutions for Industry 4.0 Systems | |
CN115265620B (zh) | 一种仪器显示数据的获取录入方法、装置和存储介质 | |
Bhagat et al. | Complex document classification and integration with indexing |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |