CN115439871A - 档案自动化采集方法、装置和电子设备 - Google Patents
档案自动化采集方法、装置和电子设备 Download PDFInfo
- Publication number
- CN115439871A CN115439871A CN202211111937.7A CN202211111937A CN115439871A CN 115439871 A CN115439871 A CN 115439871A CN 202211111937 A CN202211111937 A CN 202211111937A CN 115439871 A CN115439871 A CN 115439871A
- Authority
- CN
- China
- Prior art keywords
- archive
- image
- scanned
- definition
- file
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 60
- 238000012545 processing Methods 0.000 claims abstract description 108
- 238000004590 computer program Methods 0.000 claims description 17
- 238000013473 artificial intelligence Methods 0.000 description 29
- 238000010586 diagram Methods 0.000 description 18
- 238000012549 training Methods 0.000 description 15
- 230000006870 function Effects 0.000 description 12
- 230000011218 segmentation Effects 0.000 description 6
- 238000004891 communication Methods 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 4
- 230000009286 beneficial effect Effects 0.000 description 2
- 238000012937 correction Methods 0.000 description 2
- 238000012015 optical character recognition Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 1
- 238000003708 edge detection Methods 0.000 description 1
- 238000003709 image segmentation Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/416—Extracting the logical structure, e.g. chapters, sections or page numbers; Identifying elements of the document, e.g. authors
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/146—Aligning or centring of the image pick-up or image-field
- G06V30/147—Determination of region of interest
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/148—Segmentation of character regions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/16—Image preprocessing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/16—Image preprocessing
- G06V30/1607—Correcting image deformation, e.g. trapezoidal deformation caused by perspective
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/413—Classification of content, e.g. text, photographs or tables
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/414—Extracting the geometrical structure, e.g. layout tree; Block segmentation, e.g. bounding boxes for graphics or text
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Software Systems (AREA)
- General Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Databases & Information Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Molecular Biology (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Computer Graphics (AREA)
- Geometry (AREA)
- Processing Or Creating Images (AREA)
Abstract
本发明提供一种档案自动化采集方法、装置和电子设备,涉及图像处理技术领域。该方法包括:通过获取待采集档案对应的扫描档案图像;并确定扫描档案图像对应的预测画框区域,根据预测画框区域对扫描档案图像进行裁切,得到档案图像;再对档案图像进行高清处理,得到待采集档案对应的高清档案图像,实现了档案的自动化采集,从而提高了档案的采集效率。
Description
技术领域
本发明涉及图像处理技术领域,尤其涉及一种档案自动化采集方法、装置和电子设备。
背景技术
随着档案的种类越来越多,档案数字化应运而生。所谓档案数字化,是指将纸质的档案转变为电子档案,通过电子档案实现档案的管理。
在将纸质的档案转变为电子档案时,通常需要采用扫描技术,对纸质档案进行扫描,得到对应的扫描图像;再通过人工方式对扫描得到的扫描图像进行进一步地处理,例如裁切处理以及高清处理等,得到最终采集的扫描图像,即电子档案。
但是,采用现有的档案采集方法,会导致档案的采集效率较低。
发明内容
本发明提供一种档案自动化采集方法、装置和电子设备,实现了档案的自动化采集,从而提高了档案的采集效率。
本发明提供一种档案自动化采集方法,该档案自动化采集方法可以包括:
获取待采集档案对应的扫描档案图像。
确定所述扫描档案图像对应的预测画框区域,并根据所述预测画框区域对所述扫描档案图像进行裁切,得到档案图像。
对所述档案图像进行高清处理,得到所述待采集档案对应的高清档案图像。
根据本发明提供的一种档案自动化采集方法,所述确定所述扫描档案图像对应的预测画框区域,包括:
将所述扫描档案图像输入至图像裁切模型中的编码器中,得到所述扫描档案图像对应的特征向量。
将所述特征向量输入至所述图像裁切模型中的解码器中,得到所述预测画框区域。
根据本发明提供的一种档案自动化采集方法,所述对所述档案图像进行高清处理,得到所述待采集档案对应的高清档案图像,包括:
对所述档案图像进行分割处理,得到所述档案图像对应的多个分块图像。
对所述多个分块图像进行高清处理,得到所述待采集档案对应的高清档案图像。
根据本发明提供的一种档案自动化采集方法,所述对所述多个分块图像进行高清处理,得到所述待采集档案对应的高清档案图像,包括:
将所述多个分块图像输入至高清处理模型中的生成网络中,得到所述多个分块图像各自对应的高清分块图像。
对多个高清分块图像进行重构处理,得到所述待采集档案对应的所述高清档案图像。
根据本发明提供的一种档案自动化采集方法,所述方法还包括:
对所述扫描档案图像进行内容识别,得到所述待采集档案对应的内容信息;其中,所述内容信息包括所述待采集档案的标题、类别号、页码以及时间。
根据所述待采集档案对应的内容信息,对所述扫描档案图像进行分类处理。
根据本发明提供的一种档案自动化采集方法,所述获取待采集档案对应的扫描档案图像,包括:
采集所述待采集档案对应的初始扫描档案图像。
根据所述初始扫描档案图像的倾斜角度,对所述初始扫描档案图像进行纠偏处理,得到所述扫描档案图像。
本发明还提供一种档案自动化采集装置,该档案自动化采集装置可以包括:
获取单元,用于获取待采集档案对应的扫描档案图像。
裁切单元,用于确定所述扫描档案图像对应的预测画框区域,并根据所述预测画框区域对所述扫描档案图像进行裁切,得到档案图像。
处理单元,用于对所述档案图像进行高清处理,得到所述待采集档案对应的高清档案图像。
根据本发明提供的一种档案自动化采集装置,所述裁切单元,具体用于将所述扫描档案图像输入至图像裁切模型中的编码器中,得到所述扫描档案图像对应的特征向量;将所述特征向量输入至所述图像裁切模型中的解码器中,得到所述预测画框区域。
根据本发明提供的一种档案自动化采集装置,所述处理单元,具体用于对所述档案图像进行分割处理,得到所述档案图像对应的多个分块图像;对所述多个分块图像进行高清处理,得到所述待采集档案对应的高清档案图像。
根据本发明提供的一种档案自动化采集装置,所述处理单元,具体用于将所述多个分块图像输入至高清处理模型中的生成网络中,得到所述多个分块图像各自对应的高清分块图像;对多个高清分块图像进行重构处理,得到所述待采集档案对应的所述高清档案图像。
根据本发明提供的一种档案自动化采集装置,所述装置还包括识别单元和分类单元。
所述识别单元,用于对所述扫描档案图像进行内容识别,得到所述待采集档案对应的内容信息;其中,所述内容信息包括所述待采集档案的标题、类别号、页码以及时间。
所述分类单元,用于根据所述待采集档案对应的内容信息,对所述扫描档案图像进行分类处理。
根据本发明提供的一种档案自动化采集装置,所述获取单元,具体用于采集所述待采集档案对应的初始扫描档案图像;根据所述初始扫描档案图像的倾斜角度,对所述初始扫描档案图像进行纠偏处理,得到所述扫描档案图像。
本发明还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述任一种所述的档案自动化采集方法。
本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述任一种所述的档案自动化采集方法。
本发明还提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现如上述任一种所述的档案自动化采集方法。
本发明提供的档案自动化采集方法、装置和电子设备,通过获取待采集档案对应的扫描档案图像;并确定扫描档案图像对应的预测画框区域,根据预测画框区域对扫描档案图像进行裁切,得到档案图像;再对档案图像进行高清处理,得到待采集档案对应的高清档案图像,实现了档案的自动化采集,从而提高了档案的采集效率。
附图说明
为了更清楚地说明本发明或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种自动化采集系统的示意图;
图2为本发明实施例提供的一种档案自动化采集方法的流程示意图;
图3为本发明实施例提供的一种基于纠偏处理后的扫描档案图像进行分类处理的示意图;
图4为本发明实施例提供的一种扫描档案图像的示意图;
图5为本发明实施例提供的一种基于图像裁切模型对扫描档案图像进行裁切的示意图;
图6为本发明实施例提供的一种预测画框区域的示意图;
图7为本发明实施例提供的一种多个分块图像的示意图;
图8为本发明实施例提供的一种采用高清处理模型对多个分块图像进行高清处理的示意图;
图9为本发明实施例提供的一种档案自动化采集装置的结构示意图;
图10为本发明实施例提供的一种电子设备的实体结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明中的附图,对本发明中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
在本发明的实施例中,“至少一个”是指一个或者多个,“多个”是指两个或两个以上。“和/或”,描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况,其中A,B可以是单数或者复数。在本发明的文字描述中,字符“/”一般表示前后关联对象是一种“或”的关系。
本发明实施例提供的技术方案可以应用于图像处理场景中,尤其是基于图像处理的档案自动化采集方法场景中。现有技术中,在将纸质的档案转变为电子档案时,通常需要采用扫描技术,对纸质档案进行扫描,得到对应的扫描图像;再通过人工方式对扫描得到的扫描图像进行进一步地处理,例如裁切处理以及高清处理等,得到最终采集的扫描图像,即电子档案。但是,采用现有的档案采集方法,会导致档案的采集效率较低。
为了实现档案的自动化采集,从而提高档案的采集效率,本发明实施例提供了一种档案的自动化采集系统,示例地,请参见图1所示,图1为本发明实施例提供的一种自动化采集系统的示意图,该自动化采集系统可以包括扫描仪、管理平台以及人工智能(Artificial Intelligence,AI)服务平台。其中,扫描仪主要用于对待采集档案进行扫描处理,采集待采集档案对应的初始扫描档案图像;管理平台主要用于将初始扫描档案图像传输至AI服务平台;AI服务平台主要用于对初始扫描档案图像纠偏后得到的扫描档案图像进行裁切处理以及高清处理,得到高清档案图像,该高清档案图像即为自动化采集的电子档案。
其中,图像纠偏是指利用Canny边缘检测算法,传统计算机视觉算法检测出档案图像中的倾斜角度,并基于倾斜角度对档案图像进行纠偏处理。
此外,需要说明的是,AI服务平台还可以用于对扫描档案图像进行内容识别,并将识别得到的内容信息与纠偏后得到的扫描档案图像一并传输至管理平台;对应的,管理平台还可以用于根据内容信息对纠偏后得到的扫描档案图像进行分类处理,以实现对待采集档案的自动化管理。
基于上述图1提供的自动化采集系统,本发明实施例提供了一种档案自动化采集方法,通过获取待采集档案对应的扫描档案图像;并确定扫描档案图像对应的预测画框区域,根据预测画框区域对扫描档案图像进行裁切,得到档案图像;再对档案图像进行高清处理,得到待采集档案对应的高清档案图像,实现了档案的自动化采集,从而提高了档案的采集效率。
下面,将通过下述几个具体的实施例对本发明提供的档案自动化采集方法进行详细地说明。可以理解的是,下面这几个具体的实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例不再赘述。
图2为本发明实施例提供的一种档案自动化采集方法的流程示意图,该档案自动化采集方法可以由软件和/或硬件装置执行。示例的,请参见图2所示,该档案自动化采集方法可以包括:
S201、获取待采集档案对应的扫描档案图像。
示例地,获取待采集档案对应的扫描档案图像时,结合上述图1所示,扫描仪可以基于光电技术及数字技术的原理,对待采集档案进行扫描,采集待采集档案对应的初始扫描档案图像;其中,初始扫描档案图像为扫描生成的数字化档案图像;并将采集到的初始扫描档案图像传输至管理平台;对应的,管理平台可以采用base64的方式,对初始扫描档案图像进行编码处理,得到初始扫描档案图像对应的数据流,再采用超文本传输协议(HyperText Transfer Protocol,HTTP)协议将编码后的数据流传输至AI服务平台;对应的,AI服务平台接收到管理平台发送的数据流后,采用base64的方式对数据流进行解码处理,得到初始扫描档案图像。
考虑到在采用扫描仪对待采集档案进行扫描时,可能会因为操作不熟练、失误等原因,使得扫描得到的初始扫描档案图像会存在一定角度的倾斜,由于存在倾斜角的图像会影响初始扫描档案图像的内容信息的识别,示例地,AI服务平台在解码得到初始扫描档案图像后,可以初始扫描档案图像进行纠偏处理,得到纠偏处理后的扫描档案图像。示例地,可参见图3所示,图3为本发明实施例提供的一种基于纠偏处理后的扫描档案图像进行分类处理的示意图。
在得到纠偏处理后扫描档案图像后,AI服务平台可以对扫描档案图像进行内容识别,得到待采集档案对应的内容信息;其中,内容信息包括待采集档案的标题、类别号、页码以及时间;根据待采集档案对应的内容信息,对扫描档案图像进行分类处理,从而实现待采集档案的自动化管理。
可以理解的是,在本发明实施例中,通过对初始扫描档案图像进行纠偏处理,并对纠偏处理后的扫描档案图像进行内容识别,可以有效地提高内容识别的准确度。此外,需要说明的是,在本发明实施例中,当内容识别出多个时间时,可以将多个时间中,最晚时间确定为内容信息中包括的时间。
示例地,在对扫描档案图像进行内容识别时,AI服务平台可以采用光学字符识别(Optical Character Recognition,OCR)模型对扫描档案图像进行内容识别,得到待采集档案对应的内容信息;并将待采集档案对应的内容信息通过JSON(JavaScript ObjectNotation)数据格式进行存储,得到JSON文件;再对JSON文件和扫描档案图像进行编码处理,得到对应的数据流,并采用HTTP协议将数据流传输至管理平台;对应的,管理平台接收到数据流后,对数据流进行解码处理,得到JSON文件和扫描档案图像,并基于JSON文件中包括的内容信息,将扫描档案图像划分至对应的文件夹中,从而对扫描档案图像进行分类处理。
示例地,在对扫描档案图像进行分类处理后,管理平台可以对扫描档案图像进行编码处理,得到对应的数据流,并采用HTTP协议将数据流传输至AI服务平台,以使AI服务平台执行扫描档案图像的裁切任务;对应的,AI服务平台接收到数据流后,对数据流进行解码处理,得到扫描档案图像,并对扫描档案图像进行裁切,即执行下述S202:
S202、确定扫描档案图像对应的预测画框区域,并根据预测画框区域对扫描档案图像进行裁切,得到档案图像。
其中,图像裁切是指基于图像裁切模型将图像的背景与主体进行划分,并去除冗余部分。
示例地,在本发明实施例中,图像裁切模型可以为UNET模型,为预先对初始图像裁切模型进行训练得到的。示例地,初始图像裁切模型可以包括编码器和解码器,在对初始图像裁切模型进行训练时,可以先获取多个扫描档案图像样本以及各扫描档案图像样本对应的画框区域标签,并将多个扫描档案图像样本输入至初始图像裁切模型的编码器中,得到各扫描档案图像样本对应的特征向量;并将各扫描档案图像样本对应的特征向量输入至初始图像裁切模型的解码器中,得到各扫描档案图像样本对应的预测画框区域;再根据各扫描档案图像样本对应的预测画框区域和画框区域标签,对初始图像裁切模型的模型参数进行更新,以得到图像裁切模型,从而训练得到图像裁切模型。
示例地,根据各扫描档案图像样本对应的预测画框区域和画框区域标签,对初始图像裁切模型的模型参数进行更新时,针对各扫描档案图像样本,可以根据扫描档案图像样本对应的预测画框区域和画框区域标签,构造扫描档案图像样本对应交叉熵损失函数;并计算多个交叉熵损失函数对应的平均值;基于平均值对初始图像裁切模型的模型参数进行更新,直至满足更新条件,例如更新次数达到预设阈值,和/或更新后的图像裁切模型收敛,并将满足更新条件时的图像裁切模型确定为最终训练得到的图像裁切模型。
示例地,可参见图4所示,图4为本发明实施例提供的一种扫描档案图像的示意图,在基于图像裁切模型对扫描档案图像进行裁切时,示例地,可参见图5所示,图5为本发明实施例提供的一种基于图像裁切模型对扫描档案图像进行裁切的示意图,AI服务平台可以先将扫描档案图像输入至图像裁切模型中的编码器中,得到扫描档案图像对应的特征向量;再将特征向量输入至图像裁切模型中的解码器中,得到预测画框区域,示例地,可参见图6所示,图6为本发明实施例提供的一种预测画框区域的示意图,再根据预测画框区域对扫描档案图像进行裁切,以去掉扫描档案图像中无用的背景边缘信息,使得得到的档案图像中仅包括扫描档案图像中的主体信息,从而实现了对扫描档案图像的自动化裁切。
需要说明的是,在本发明实施例中,考虑到在训练图像裁切模型时,为了提高图像裁切模型的训练效率,通常会对用于训练图像裁切模型的扫描档案图像样本的尺寸进行限制,例如用于训练图像裁切模型的扫描档案图像样本的分辨率为实际采集的扫描档案图像样本的分辨率的1/3;那么,在图像裁切模型的应用过程中,将扫描档案图像输入至图像裁切模型时,可以先对扫描档案图像的尺寸进行调整,例如,将输入至图像裁切模型的扫描档案图像的分辨率调整为实际采集的扫描档案图像的分辨率的1/3;在该种情况下,图像裁切模型输出的预测画框区域也会为实际采集的扫描档案图像的1/3,因此,在根据图像裁切模型输出的预测画框区域对扫描档案图像进行裁切时,需要先将图像裁切模型输出的预测画框区域进行还原处理,将还原后的预测画框区域还原到实际采集的扫描档案图像中的相关位置,以对扫描档案图像进行裁切。
示例地,AI服务平台对扫描档案图像进行裁切,得到档案图像后,可以对档案图像进行编码处理,得到对应的数据流,并采用HTTP协议将数据流传输至管理平台,以使管理平台获取到裁切任务对应的裁切结果。在获取到档案图像后,管理平台可以对档案图像进行编码处理,得到对应的数据流,并采用HTTP协议将数据流传输至AI服务平台,以使AI服务平台执行档案图像的高清处理任务;对应的,AI服务平台接收到数据流后,对数据流进行解码处理,得到档案图像,并对得到档案图像进行高清处理任务,即执行下述S202。
或者,结合上述S201中的相关描述,管理平台在对扫描档案图像进行分类处理后,管理平台可以对扫描档案图像进行编码处理,得到对应的数据流,并采用HTTP协议将数据流传输至AI服务平台,以使AI服务平台执行扫描档案图像的裁切任务以及高清处理任务;对应的,AI服务平台接收到数据流后,对数据流进行解码处理,得到扫描档案图像;并直接对扫描档案图像进行裁切以及高清处理;在该种情况下,AI服务平台无需先将裁切任务对应的裁切结果传输至管理平台,而是直接对裁切结果进行高清处理,之后,再将裁切结果和高清处理结果一并传输至管理平台即可,这样可以有效地减少管理平台和AI服务平台之间的数据传输。
S203、对档案图像进行高清处理,得到待采集档案对应的高清档案图像。
其中,高清处理是指采用高清处理模型,例如Real-ESRGAN模型对多个分块图像进行高清处理,得到多个高清分块图像,高清分块图像的底色为国标规定RGB底色。
示例地,AI服务平台在对档案图像进行高清处理时,可以先对档案图像进行分割处理,得到档案图像对应的多个分块图像,示例地,请参见图7所示,图7为本发明实施例提供的一种多个分块图像的示意图,再对多个分块图像进行高清处理,得到待采集档案对应的高清档案图像,该高清档案图像即为自动化采集的电子档案。
可以理解的是,在对档案图像进行分割处理时,可以按照预设尺寸对档案图像进行分割处理,若得到的多个分块图像中存在部分分块图像的尺寸小于预设尺寸,则可以对小于预设尺寸的分块图像进行扩充处理,使得扩充后的分块图像的尺寸等于预设尺寸,这样可以使得输入至高清处理模型的分块图像的尺寸保持一致。其中,预设尺寸的取值可以根据实际需要进行设置,在此,对于预设尺寸的取值,本发明实施例不做具体限制。
示例地,在本发明实施例中,可以采用高清处理模型对多个分块图像进行高清处理,该高清处理模型可以为对初始高清处理模型进行训练得到的。示例地,初始高清处理模型可以包括生成网络和鉴别网络。在对初始高清处理模型进行训练时,可以先获取多个档案图像样本;并分别对多个档案图像样本进行分割处理,得到各档案图像样本对应的多个分块图像样本,并获取档案图像样本对应的多个分块图像样本各自对应的高清分块图像标签;将多个档案图像样本各自对应的多个分块图像样本输入至初始高清处理模型的生成网络中,得到各档案图像样本对应的多个分块图像样本各自对应的预测高清分块图像;将各档案图像样本对应的多个分块图像样本各自对应的预测高清分块图像和高清分块图像标签输入至鉴别网络中,针对各档案图像样本,根据档案图像样本对应的多个分块图像样本各自对应的预测高清分块图像和高清分块图像标签,构造档案图像样本对应的交叉熵损失函数和均方差损失函数;并根据各档案图像样本对应的交叉熵损失函数和均方差损失函数,对初始高清处理模型的模型参数进行更新,以得到高清处理模型,从而训练得到高清处理模型。
需要说明的是,在本发明实施例中,鉴别网络只是用于参与高清处理模型的训练过程,最终生成的高清处理模型中仅包括生成网络,并不包括鉴别网络。
示例地,根据各档案图像样本对应的交叉熵损失函数和均方差损失函数,对初始高清处理模型的模型参数进行更新时,针对各档案图像样本,可以根据档案图像样本对应的交叉熵损失函数和均方差损失函数,确定档案图像样本对应的目标损失函数;并计算多个目标损失函数对应的平均值;基于平均值对初始高清处理模型的模型参数进行更新,直至满足更新条件,例如更新次数达到预设阈值,和/或更新后的高清处理模型收敛,并将满足更新条件时的高清处理模型确定为最终训练得到的高清处理模型。
示例地,采用高清处理模型对多个分块图像进行高清处理时,示例地,可参见图8所示,图8为本发明实施例提供的一种采用高清处理模型对多个分块图像进行高清处理的示意图,AI服务平台可以先将多个分块图像输入至高清处理模型中的生成网络中,得到多个分块图像各自对应的高清分块图像;在通过高清处理模型得到多个分块图像各自对应的高清分块图像后,再对得到的多个高清分块图像进行重构处理,得到待采集档案对应的高清档案图像,从而实现了对档案的自动化采集,且提高了档案的自动化采集效率。
需要说明的是,在本发明实施例中,考虑到在训练高清处理模型时,为了提高高清处理模型的训练效率,通常会对用于训练高清处理模型的分块图像样本的尺寸进行限制,例如用于训练图像裁切模型的分块图像样本的分辨率为实际分割得到的档案图像样本的分辨率的1/4;那么,在高清处理模型的应用过程中,将分块图像输入至高清处理模型时,可以先对分块图像的尺寸进行调整,例如,将输入至高清处理模型的分块图像的分辨率调整为实际分割得到的分块图像的分辨率的1/4;在该种情况下,高清处理模型输出的高清分块图像也会为实际输出的高清分块图像的1/4,因此,在对得到的多个高清分块图像进行重构处理时,需要先将高清处理模型输出的高清分块图像进行还原处理,并对还原处理后的多个高清分块图像进行重构处理,得到待采集档案对应的高清档案图像。
示例地,对还原处理后的多个高清分块图像进行重构处理,到待采集档案对应的高清档案图像时,可以对还原处理后的多个高清分块图像进行去除边缘处理,并去除边缘后的多个高清分块图像进行合并处理,得到待采集档案对应的高清档案图像。
示例地,AI服务平台对档案图像进行高清处理,得到待采集档案对应的高清档案图像后,可以对高清档案图像进行编码处理,得到对应的数据流,并采用HTTP协议将数据流传输至管理平台,以使管理平台获取到待采集档案对应的高清档案图像,并对高清档案图像进行存储管理,从而实现档案的自动化采集,不仅提高了档案的采集精度,而且提高了档案的采集效率。
此外,需要说明的是,在本发明实施例中,在对待采集档案进行分类时,上述S201只是以AI服务平台对纠偏得到的扫描档案图像进行内容识别,得到待采集档案对应的内容信息;并根据待采集档案对应的内容信息,对扫描档案图像进行分类处理为例进行说明;当然,也可以在获取到待采集档案对应的高清档案图像后,对高清档案图像进行内容识别,得到待采集档案对应的内容信息;并根据待采集档案对应的内容信息,对扫描档案图像进行分类处理,具体可以根据实际需要进行设置。
可以看出,在本发明实施例中,通过获取待采集档案对应的扫描档案图像;并确定扫描档案图像对应的预测画框区域,根据预测画框区域对扫描档案图像进行裁切,得到档案图像;再对档案图像进行高清处理,得到待采集档案对应的高清档案图像,实现了档案的自动化采集,从而提高了档案的采集效率。
下面对本发明提供的档案自动化采集装置进行描述,下文描述的档案自动化采集装置与上文描述的档案自动化采集方法可相互对应参照。
图9为本发明实施例提供的一种档案自动化采集装置的结构示意图,示例的,请参见图9所示,该档案自动化采集装置90可以包括:
获取单元901,用于获取待采集档案对应的扫描档案图像。
裁切单元902,用于确定扫描档案图像对应的预测画框区域,并根据预测画框区域对扫描档案图像进行裁切,得到档案图像。
处理单元903,用于对档案图像进行高清处理,得到待采集档案对应的高清档案图像。
可选地,裁切单元902,具体用于将扫描档案图像输入至图像裁切模型中的编码器中,得到扫描档案图像对应的特征向量;将特征向量输入至图像裁切模型中的解码器中,得到预测画框区域。
可选地,处理单元903,具体用于对档案图像进行分割处理,得到档案图像对应的多个分块图像;对多个分块图像进行高清处理,得到待采集档案对应的高清档案图像。
可选地,处理单元903,具体用于将多个分块图像输入至高清处理模型中的生成网络中,得到多个分块图像各自对应的高清分块图像;对多个高清分块图像进行重构处理,得到待采集档案对应的高清档案图像。
可选地,档案自动化采集装置90还包括识别单元和分类单元。
识别单元,用于对扫描档案图像进行内容识别,得到待采集档案对应的内容信息;其中,内容信息包括待采集档案的标题、类别号、页码以及时间。
分类单元,用于根据待采集档案对应的内容信息,对扫描档案图像进行分类处理。
可选地,获取单元901,具体用于采集待采集档案对应的初始扫描档案图像;根据初始扫描档案图像的倾斜角度,对初始扫描档案图像进行纠偏处理,得到扫描档案图像。
本发明实施例提供的档案自动化采集装置90,可以执行上述任一实施例中档案自动化采集方法的技术方案,其实现原理以及有益效果与档案自动化采集方法的实现原理及有益效果类似,可参见档案自动化采集方法的实现原理及有益效果,此处不再进行赘述。
图10为本发明实施例提供的一种电子设备的实体结构示意图,如图10所示,该电子设备可以包括:处理器(processor)1010、通信接口(Communications Interface)1020、存储器(memory)1030和通信总线1040,其中,处理器1010,通信接口1020,存储器1030通过通信总线1040完成相互间的通信。处理器1010可以调用存储器1030中的逻辑指令,以执行档案自动化采集方法,该方法包括:获取待采集档案对应的扫描档案图像;确定扫描档案图像对应的预测画框区域,并根据预测画框区域对扫描档案图像进行裁切,得到档案图像;对档案图像进行高清处理,得到待采集档案对应的高清档案图像。
此外,上述的存储器1030中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
另一方面,本发明还提供一种计算机程序产品,所述计算机程序产品包括计算机程序,计算机程序可存储在非暂态计算机可读存储介质上,所述计算机程序被处理器执行时,计算机能够执行上述各方法所提供的档案自动化采集方法,该方法包括:获取待采集档案对应的扫描档案图像;确定扫描档案图像对应的预测画框区域,并根据预测画框区域对扫描档案图像进行裁切,得到档案图像;对档案图像进行高清处理,得到待采集档案对应的高清档案图像。
又一方面,本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现以执行上述各方法提供的档案自动化采集方法,该方法包括:获取待采集档案对应的扫描档案图像;确定扫描档案图像对应的预测画框区域,并根据预测画框区域对扫描档案图像进行裁切,得到档案图像;对档案图像进行高清处理,得到待采集档案对应的高清档案图像。
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
Claims (10)
1.一种档案自动化采集方法,其特征在于,包括:
获取待采集档案对应的扫描档案图像;
确定所述扫描档案图像对应的预测画框区域,并根据所述预测画框区域对所述扫描档案图像进行裁切,得到档案图像;
对所述档案图像进行高清处理,得到所述待采集档案对应的高清档案图像。
2.根据权利要求1所述的档案自动化采集方法,其特征在于,所述确定所述扫描档案图像对应的预测画框区域,包括:
将所述扫描档案图像输入至图像裁切模型中的编码器中,得到所述扫描档案图像对应的特征向量;
将所述特征向量输入至所述图像裁切模型中的解码器中,得到所述预测画框区域。
3.根据权利要求1所述的档案自动化采集方法,其特征在于,所述对所述档案图像进行高清处理,得到所述待采集档案对应的高清档案图像,包括:
对所述档案图像进行分割处理,得到所述档案图像对应的多个分块图像;
对所述多个分块图像进行高清处理,得到所述待采集档案对应的高清档案图像。
4.根据权利要求3所述的档案自动化采集方法,其特征在于,所述对所述多个分块图像进行高清处理,得到所述待采集档案对应的高清档案图像,包括:
将所述多个分块图像输入至高清处理模型中的生成网络中,得到所述多个分块图像各自对应的高清分块图像;
对多个高清分块图像进行重构处理,得到所述待采集档案对应的所述高清档案图像。
5.根据权利要求1-4任一项所述的档案自动化采集方法,其特征在于,所述方法还包括:
对所述扫描档案图像进行内容识别,得到所述待采集档案对应的内容信息;其中,所述内容信息包括所述待采集档案的标题、类别号、页码以及时间;
根据所述待采集档案对应的内容信息,对所述扫描档案图像进行分类处理。
6.根据权利要求1-4任一项所述的档案自动化采集方法,其特征在于,所述获取待采集档案对应的扫描档案图像,包括:
采集所述待采集档案对应的初始扫描档案图像;
根据所述初始扫描档案图像的倾斜角度,对所述初始扫描档案图像进行纠偏处理,得到所述扫描档案图像。
7.一种档案自动化采集装置,其特征在于,包括:
获取单元,用于获取待采集档案对应的扫描档案图像;
裁切单元,用于确定所述扫描档案图像对应的预测画框区域,并根据所述预测画框区域对所述扫描档案图像进行裁切,得到档案图像;
处理单元,用于对所述档案图像进行高清处理,得到所述待采集档案对应的高清档案图像。
8.一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至6任一项所述的档案自动化采集方法。
9.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至6任一项所述的档案自动化采集方法。
10.一种计算机程序产品,包括计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至6任一项所述的档案自动化采集方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211111937.7A CN115439871A (zh) | 2022-09-13 | 2022-09-13 | 档案自动化采集方法、装置和电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211111937.7A CN115439871A (zh) | 2022-09-13 | 2022-09-13 | 档案自动化采集方法、装置和电子设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115439871A true CN115439871A (zh) | 2022-12-06 |
Family
ID=84247532
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211111937.7A Pending CN115439871A (zh) | 2022-09-13 | 2022-09-13 | 档案自动化采集方法、装置和电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115439871A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116167597A (zh) * | 2023-04-26 | 2023-05-26 | 烟台市重科产业技术研究院有限公司 | 一种用于档案材料的智能维护管理系统 |
CN117853509A (zh) * | 2023-12-29 | 2024-04-09 | 北京航星永志科技有限公司 | 档案图像边缘裁剪方法、装置、设备及介质 |
Citations (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20150026637A1 (en) * | 2013-07-17 | 2015-01-22 | Adobe Systems Incorporated | Providing Selection Areas for Selectable Objects in Graphical Interface |
CN108022257A (zh) * | 2017-12-28 | 2018-05-11 | 中国科学院半导体研究所 | 适用于硬件的高速卷积神经网络目标跟踪方法和装置 |
CN109299716A (zh) * | 2018-08-07 | 2019-02-01 | 北京市商汤科技开发有限公司 | 神经网络的训练方法、图像分割方法、装置、设备及介质 |
CN110765907A (zh) * | 2019-10-12 | 2020-02-07 | 安徽七天教育科技有限公司 | 一种基于深度学习的视频中试卷纸质文档信息提取系统及方法 |
CN111507251A (zh) * | 2020-04-16 | 2020-08-07 | 北京世纪好未来教育科技有限公司 | 试题图像中作答区域的定位方法、装置和电子设备 |
CN111598175A (zh) * | 2020-05-19 | 2020-08-28 | 南京甄视智能科技有限公司 | 一种基于在线难例挖掘方式的检测器训练优化方法 |
US20200356794A1 (en) * | 2018-06-26 | 2020-11-12 | Waymo Llc | Phrase recognition model for autonomous vehicles |
CN112463726A (zh) * | 2020-11-19 | 2021-03-09 | 深圳供电局有限公司 | 一种移动财务票据的自动化归档方法 |
CN112926441A (zh) * | 2021-02-24 | 2021-06-08 | 广州极点三维信息科技有限公司 | 基于机器视觉的家居识别方法、系统、装置及介质 |
CN113610732A (zh) * | 2021-08-10 | 2021-11-05 | 大连理工大学 | 基于交互对抗学习的全聚焦图像生成方法 |
CN113705395A (zh) * | 2021-08-16 | 2021-11-26 | 南京英诺森软件科技有限公司 | 一种基于深度学习模型的纸质表格转word文档的方法 |
CN113793264A (zh) * | 2021-09-07 | 2021-12-14 | 北京航星永志科技有限公司 | 一种基于卷积模型的档案图像处理方法、系统和电子设备 |
CN113888547A (zh) * | 2021-09-27 | 2022-01-04 | 太原理工大学 | 基于gan网络的无监督域自适应遥感道路语义分割方法 |
CN114067335A (zh) * | 2021-11-08 | 2022-02-18 | 清远市中盛合力网络科技有限公司 | 电子档案文本识别方法、系统、计算机设备和存储介质 |
-
2022
- 2022-09-13 CN CN202211111937.7A patent/CN115439871A/zh active Pending
Patent Citations (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20150026637A1 (en) * | 2013-07-17 | 2015-01-22 | Adobe Systems Incorporated | Providing Selection Areas for Selectable Objects in Graphical Interface |
CN108022257A (zh) * | 2017-12-28 | 2018-05-11 | 中国科学院半导体研究所 | 适用于硬件的高速卷积神经网络目标跟踪方法和装置 |
US20200356794A1 (en) * | 2018-06-26 | 2020-11-12 | Waymo Llc | Phrase recognition model for autonomous vehicles |
CN109299716A (zh) * | 2018-08-07 | 2019-02-01 | 北京市商汤科技开发有限公司 | 神经网络的训练方法、图像分割方法、装置、设备及介质 |
CN110765907A (zh) * | 2019-10-12 | 2020-02-07 | 安徽七天教育科技有限公司 | 一种基于深度学习的视频中试卷纸质文档信息提取系统及方法 |
CN111507251A (zh) * | 2020-04-16 | 2020-08-07 | 北京世纪好未来教育科技有限公司 | 试题图像中作答区域的定位方法、装置和电子设备 |
CN111598175A (zh) * | 2020-05-19 | 2020-08-28 | 南京甄视智能科技有限公司 | 一种基于在线难例挖掘方式的检测器训练优化方法 |
CN112463726A (zh) * | 2020-11-19 | 2021-03-09 | 深圳供电局有限公司 | 一种移动财务票据的自动化归档方法 |
CN112926441A (zh) * | 2021-02-24 | 2021-06-08 | 广州极点三维信息科技有限公司 | 基于机器视觉的家居识别方法、系统、装置及介质 |
CN113610732A (zh) * | 2021-08-10 | 2021-11-05 | 大连理工大学 | 基于交互对抗学习的全聚焦图像生成方法 |
CN113705395A (zh) * | 2021-08-16 | 2021-11-26 | 南京英诺森软件科技有限公司 | 一种基于深度学习模型的纸质表格转word文档的方法 |
CN113793264A (zh) * | 2021-09-07 | 2021-12-14 | 北京航星永志科技有限公司 | 一种基于卷积模型的档案图像处理方法、系统和电子设备 |
CN113888547A (zh) * | 2021-09-27 | 2022-01-04 | 太原理工大学 | 基于gan网络的无监督域自适应遥感道路语义分割方法 |
CN114067335A (zh) * | 2021-11-08 | 2022-02-18 | 清远市中盛合力网络科技有限公司 | 电子档案文本识别方法、系统、计算机设备和存储介质 |
Non-Patent Citations (3)
Title |
---|
WIPHADA JIRASIRILERD 等: "Automatic Labeling for Thai News Articles Based on Vector Representation of Documents", 《2018 INTERNATIONAL CONFERENCE ON ENGINEERING, APPLIED SCIENCES, AND TECHNOLOGY (ICEAST)》 * |
张云锦: "文档图像表格提取算法研究", 《中国优秀硕士学位论文全文数据库 (信息科技辑)》 * |
杨博雄, 北京:北京邮电大学出版社 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116167597A (zh) * | 2023-04-26 | 2023-05-26 | 烟台市重科产业技术研究院有限公司 | 一种用于档案材料的智能维护管理系统 |
CN117853509A (zh) * | 2023-12-29 | 2024-04-09 | 北京航星永志科技有限公司 | 档案图像边缘裁剪方法、装置、设备及介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN115439871A (zh) | 档案自动化采集方法、装置和电子设备 | |
US9898808B1 (en) | Systems and methods for removing defects from images | |
CN110705405B (zh) | 目标标注的方法及装置 | |
JP4152789B2 (ja) | クラスタリングシステムおよびクラスタリング方法 | |
US20130279758A1 (en) | Method and system for robust tilt adjustment and cropping of license plate images | |
EP1173003A2 (en) | Image processing method and image processing apparatus | |
CN112529004A (zh) | 智能图像识别方法、装置、计算机设备及存储介质 | |
US8300939B2 (en) | Image processing method, image processing apparatus, and program | |
US6771836B2 (en) | Zero-crossing region filtering for processing scanned documents | |
US20160198051A1 (en) | Image processing system, image output device, and image processing method | |
US9167129B1 (en) | Method and apparatus for segmenting image into halftone and non-halftone regions | |
CN113657370B (zh) | 一种文字识别方法及其相关设备 | |
JP6160138B2 (ja) | パターン認識のためのモアレ除去方法およびこの方法を用いたモアレ除去装置ならびにプログラム | |
US10341671B2 (en) | Method and system for image compression | |
CN111507119A (zh) | 标识码识别方法、装置、电子设备及计算机可读存储介质 | |
CN111079738B (zh) | 一种图像处理方法、系统及终端设备 | |
CN111950562A (zh) | 图片处理方法、装置、终端设备和存储介质 | |
Khan et al. | Shadow removal from digital images using multi-channel binarization and shadow matting | |
CN107330470B (zh) | 识别图片的方法和装置 | |
CN110957016B (zh) | 基于健康云管理平台的体检数据智能识别系统及方法 | |
CN110728173A (zh) | 基于感兴趣目标显著性检测的视频传输方法和装置 | |
CN117372933B (zh) | 图像去冗方法、装置及电子设备 | |
CN113989511B (zh) | 图像语义分割方法、装置、电子设备和存储介质 | |
CN117290296B (zh) | 电子档案格式转换检测方法、装置及设备 | |
CN114001671B (zh) | 激光数据提取方法、数据处理方法、和三维扫描系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20221206 |
|
RJ01 | Rejection of invention patent application after publication |