CN117853509A - 档案图像边缘裁剪方法、装置、设备及介质 - Google Patents
档案图像边缘裁剪方法、装置、设备及介质 Download PDFInfo
- Publication number
- CN117853509A CN117853509A CN202311861945.8A CN202311861945A CN117853509A CN 117853509 A CN117853509 A CN 117853509A CN 202311861945 A CN202311861945 A CN 202311861945A CN 117853509 A CN117853509 A CN 117853509A
- Authority
- CN
- China
- Prior art keywords
- image
- edge
- target
- file
- electronic
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 81
- 238000012549 training Methods 0.000 claims abstract description 74
- 238000013527 convolutional neural network Methods 0.000 claims abstract description 24
- 238000007781 pre-processing Methods 0.000 claims abstract description 22
- 238000012545 processing Methods 0.000 claims abstract description 13
- 238000012937 correction Methods 0.000 claims description 36
- 238000004422 calculation algorithm Methods 0.000 claims description 23
- 238000001514 detection method Methods 0.000 claims description 19
- 238000004590 computer program Methods 0.000 claims description 15
- 238000013528 artificial neural network Methods 0.000 claims description 3
- 238000010586 diagram Methods 0.000 description 7
- 238000004891 communication Methods 0.000 description 6
- 238000003708 edge detection Methods 0.000 description 4
- 239000000463 material Substances 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000011895 specific detection Methods 0.000 description 2
- 230000001629 suppression Effects 0.000 description 2
- 239000003086 colorant Substances 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/12—Edge-based segmentation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0464—Convolutional networks [CNN, ConvNet]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20112—Image segmentation details
- G06T2207/20132—Image cropping
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Biomedical Technology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Image Analysis (AREA)
Abstract
本发明提供一种档案图像边缘裁剪方法、装置、设备及介质,属于图像处理技术领域,其中方法包括:获取目标档案对应的电子图像;将所述电子图像进行预处理,得到目标图像;将所述目标图像输入边缘确定模型,确定所述目标图像中档案信息的位置信息;所述边缘确定模型是基于卷积神经网络对训练样本集进行训练得到的;基于所述档案信息的位置信息,对所述目标图像的边缘进行裁剪,得到所述电子图像对应的主体图像。本发明的档案图像边缘裁剪方法,提升了档案数字化之后对边缘冗余部分裁剪的准确率和效率。
Description
技术领域
本发明涉及图像处理技术领域,尤其涉及一种档案图像边缘裁剪方法、装置、设备及介质。
背景技术
随着社会的发展,档案的种类越来越多,纸质档案逐渐被电子档案所替代。
在将纸质档案转化为电子档案的过程中,由于纸质档案大小不一,会造成扫描时生成颜色不一的背景图,而这些与档案无关的背景需要进行裁剪。
传统的边缘裁剪方法采用人工手动裁剪或者固定规则算法,其中人工进行裁剪速度较慢,且对于数以万计、百万计的图像裁剪任务,需要耗费大量的人力资源、物力资源;基于传统固定规则算法的裁剪方式适用场景又非常的单一,例如文档主体与背景对比不明显的图像、背景场景繁多的图像、模糊的图像等,导致裁剪的准确率和效率较低。
发明内容
针对现有技术存在的问题,本发明提供一种档案图像边缘裁剪方法、装置、设备及介质。
本发明提供一种档案图像边缘裁剪方法,包括:
获取目标档案对应的电子图像;
将所述电子图像进行预处理,得到目标图像;
将所述目标图像输入边缘确定模型,确定所述目标图像中档案信息的位置信息;所述边缘确定模型是基于卷积神经网络对训练样本集进行训练得到的;
基于所述档案信息的位置信息,对所述目标图像的边缘进行裁剪,得到所述电子图像对应的主体图像。
根据本发明提供的一种档案图像边缘裁剪方法,所述预处理包括方向矫正和角度纠偏。
根据本发明提供的一种档案图像边缘裁剪方法,所述将所述电子图像进行预处理,得到目标图像,包括:
获取所述电子图像中所述档案信息的方向;
基于所述卷积神经网络对根据所述档案信息的方向,将所述电子图像进行预设方向的旋转,得到第一电子图像;
对所述第一电子图像进行预设角度的纠偏,得到所述目标图像。
根据本发明提供的一种档案图像边缘裁剪方法,所述边缘确定模型基于如下方式进行训练:
获取所述训练样本集;所述训练样本集中包括至少一个标记了主体图像的样本档案电子图像;
基于所述卷积神经网络对所述训练样本集中的各所述标记了主体图像的样本档案电子图像进行卷积训练,得到所述边缘确定模型。
根据本发明提供的一种档案图像边缘裁剪方法,所述卷积神经网络为目标检测算法网络。
根据本发明提供的一种档案图像边缘裁剪方法,所述位置信息为所述目标图像中档案信息的至少一个位置坐标。
本发明还提供一种档案图像边缘裁剪装置,包括:
获取模块,用于获取目标档案对应的电子图像;
处理模块,用于将所述电子图像进行预处理,得到目标图像;
确定模块,用于将所述目标图像输入边缘确定模型,确定所述目标图像中档案信息的位置信息;所述边缘确定模型是基于卷积神经网络对训练样本集进行训练得到的;
裁剪模块,用于基于所述档案信息的位置信息,对所述目标图像的边缘进行裁剪,得到所述电子图像对应的主体图像。
本发明还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述任一种所述的档案图像边缘裁剪方法。
本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述任一种所述的档案图像边缘裁剪方法。
本发明还提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现如上述任一种所述的档案图像边缘裁剪方法。
本发明提供的档案图像边缘裁剪方法、装置、设备及介质,通过对获取的目标档案对应的电子图像先进行预处理,得到电子图像对应的目标图像,然后基于预先训练好的边缘确定模型对目标图像中的档案信息进行识别,得到目标图像中档案信息的位置信息,边缘确定模型是基于卷积神经网络对训练样本集进行训练得到的;然后,基于边缘确定模型输出额度目标图像中档案信息的位置信息,对目标图像进行裁剪,得到不包括冗余边缘的主体图像。本发明的档案图像边缘裁剪方法,提升了档案图像数字化过程中,对冗余边缘裁剪的准确率和效率。
附图说明
为了更清楚地说明本发明或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明提供的档案图像边缘裁剪方法的流程示意图之一,;
图2是本发明提供的档案图像边缘裁剪方法的流程示意图之二;
图3是本发明提供的档案图像边缘裁剪方法的模型训练流程示意图;
图4是本发明提供的档案图像边缘裁剪装置的结构示意图;
图5是本发明提供的电子设备的结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明中的附图,对本发明中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
下面结合图1-图5描述本发明的档案图像边缘裁剪方法、装置、设备及介质。
图1是本发明提供的档案图像边缘裁剪方法的流程示意图之一,如图1所示,本发明实施例提供的档案图像边缘裁剪方法,包括:
步骤110、获取目标档案对应的电子图像;
具体地,在本步骤中,需要先获得目标档案对应的电子图像。需要说明的是,目标档案为纸质,目标档案中的内容可以是文书档案或者是文书图表档案,在此不做具体限定。需要先对目标档案进行对应处理,得到目标档案对应的电子图像。处理方式可以是通过扫描仪扫描或者高拍仪拍照等。具体可根据目标档案的实际情况决定。
进一步的,需要说明的是,以目标档案的大小为A4纸的大小为例,对该目标档案进行扫描之后,得到该目标档案对应的电子图像,在电子图像中目标档案会有冗余边缘出现。
步骤120、将所述电子图像进行预处理,得到目标图像;
具体地,在本步骤中,对电子图像进行预处理,预处理指的是对电子图像中的档案信息进行位置调整。位置调整可以包括方向矫正和角度纠偏。
在进行目标档案的电子化的过程中,首先要对大量的纸质档案进行扫描,从而获得纸质档案的电子图像。可选地,由于扫描的数量巨大,且由于扫描设备的扫描方向和扫描方式的不同,档案的扫描图像会存在一定角度的偏移、旋转和反转等问题,从而也就使得根据纸质档案的扫描图像无法准确地定位出目标信息的位置。
以目标档案的内容是文本为例,进行说明。首先需要检测电子图像中,目标档案中的文字的方向,具体的检测方法在此不做限定。在检测到目标档案中的文字的方向为非0度时,即电子图像中的档案信息不是正位方向,正位方向即目标档案中的文字的方向为0度。
首先对电子图像进行方向矫正。在具体实施中,基于电子图像中目标档案中的文字的方向,对电子图像进行方向矫正,具体实施方式为将电子图像进行顺时针和/或逆时针方向的旋转,进一步的,旋转的角度为预设角度,预设角度为与当前电子图像中的目标档案的偏移角度最接近的预设角度。在具体实施中,本发明实施例中的预设角度可以是90度、180度和270度中的至少一项。例如,检测到电子图像找那个的目标档案中的文字的偏移角度为100度,则选择预设角度为90度,经过方向矫正后,电子图像中的目标档案中的文字部分会为10度,接近于0度。
进一步的,经过方向矫正之后,还需要进行细节上的调整,即调整到0度。本发明中通过角度纠偏进行细节上的调整,即对电子图像中的目标档案的文字部分为接近正位的部分,进行小角度的纠偏处理,使得电子图像中的目标档案的文字部分为完全正位不偏斜,即电子图像对应的目标图像。预处理
在具体实施中,具体的纠偏方式在此不做具体限定。本发明实施例中可以使用Canny边缘检测算法得到电子图像中的目标档案的文字部分的具体的倾斜角度。Canny边缘检测算法的基本原理为,首先使用高斯滤波器降噪,以平滑图像。然后,进行梯度计算,使用Sobel算子计算图像的梯度强度和方向,梯度方向垂直于边缘,可以用来定位边缘。进一步的,进行非极大值抑制,将梯度强度图像中的所有像素转换为它们在局部最大方向上的梯度强度,以消除边缘宽度;然后使用双阈值检测,使用双阈值检测来确定哪些边缘是真实的边缘,如果像素的梯度强度大于高阈值,则将其视为边缘像素,如果像素的梯度强度小于低阈值,则其被排除在边缘之外,如果像素的梯度强度在两个阈值之间,则只有当该像素与高梯度强度像素相连时,将才将其视为边缘像素,最后,使用边缘跟踪算法连接所有真实的边缘像素,以形成完整的边缘。
步骤130、将所述目标图像输入边缘确定模型,确定所述目标图像中档案信息的位置信息;所述边缘确定模型是基于卷积神经网络对训练样本集进行训练得到的;
具体地,在本步骤中,将经过预处理之后得到的电子图像对应的目标图像,输入预先训练好的边缘确定模型中,经过模型的处理,可以得到目标图像中的目标文档的位置信息。
本发明实施例中的边缘确定模型,是基于目标检测算法,对训练样本集中的样本图像进行训练得到的。具体的训练方式可以为,首先获取训练样本集,训练样本集中包括了大量的样本图像,样本图像为标记了主体图像的样本档案电子图像,具体的标记方法在此不做限定。然后基于目标检测算法,对样本集中的样本档案电子图像进行训练。
具体地,获取标记了主体图像的样本档案电子图像,然后,将样本档案的电子图像输入待训练的边缘确定模型,基于目标检测算法对样本档案的电子图像中的主体部分的位置坐标进行检测,即得到主体图像在样本档案的电子图像中的位置坐标;最后,根据边缘确定模型识别到的主体图像在样本档案的电子图像中的位置坐标以及样本档案的电子图像中已标记的位置坐标,进行有监督的训练之后,就可以得到可以准确识别出电子图像中主体图像的位置坐标的边缘确定模型。
步骤140、基于所述档案信息的位置信息,对所述目标图像的边缘进行裁剪,得到所述电子图像对应的主体图像。
具体地,基于上述边缘确定模型可以得到目标图像中档案信息的位置信息,即至少一个位置坐标,基于这些位置坐标,对目标图像进行裁剪,得到电子图像对应主体图像,即将电子图像中的除了目标档案内容的部分裁减掉,即裁剪掉目标图像中主体图像的冗余边缘都裁减掉,得到初始的电子图像对应的主题图像,即目标档案的电子化部分。
本发明实施例提供的档案图像边缘裁剪方法,通过扫描等方式,获取目标档案对应的电子图像,然后对电子图像进行预处理,包括方向矫正和角度纠偏,得到电子图像对应的目标图像,然后基于预先训练好的边缘确定模型对目标图像中的档案信息进行识别,得到目标图像中档案信息的位置信息,边缘确定模型是基于卷积神经网络对训练样本集进行训练得到的;然后,基于边缘确定模型输出额度目标图像中档案信息的位置信息,对目标图像进行裁剪,得到不包括冗余边缘的主体图像。本发明的档案图像边缘裁剪方法,提升了档案图像数字化过程中,对冗余边缘裁剪的准确率和效率。
可选地,根据本发明实施例提供的一种档案图像边缘裁剪方法,所述预处理包括方向矫正和角度纠偏。
具体地,本发明实施例中,需要对电子图像进行预处理,预处理指的是对电子图像中的档案信息进行位置调整。位置调整可以包括方向矫正和角度纠偏。
在进行目标档案的电子化的过程中,首先要对大量的纸质档案进行扫描,从而获得纸质档案的电子图像。可选地,由于扫描的数量巨大,且由于扫描设备的扫描方向和扫描方式的不同,档案的扫描图像会存在一定角度的偏移、旋转和反转等问题,从而也就使得根据纸质档案的扫描图像无法准确地定位出目标信息的位置。
以目标档案的内容是文本为例,进行说明。首先需要检测电子图像中,目标档案中的文字的方向,具体的检测方法在此不做限定。在检测到目标档案中的文字的方向为非0度时,即电子图像中的档案信息不是正位方向,正位方向即目标档案中的文字的方向为0度。
本发明实施例提供的档案图像边缘裁剪方法,通过扫描等方式,获取目标档案对应的电子图像,然后对电子图像进行预处理,包括方向矫正和角度纠偏,得到电子图像对应的目标图像,然后基于预先训练好的边缘确定模型对目标图像中的档案信息进行识别,得到目标图像中档案信息的位置信息,边缘确定模型是基于卷积神经网络对训练样本集进行训练得到的;然后,基于边缘确定模型输出额度目标图像中档案信息的位置信息,对目标图像进行裁剪,得到不包括冗余边缘的主体图像。本发明的档案图像边缘裁剪方法,提升了档案图像数字化过程中,对冗余边缘裁剪的准确率和效率。
图2是本发明提供的档案图像边缘裁剪方法的流程示意图之二,如图2所示,上述步骤120具体实施方式如下,即将所述电子图像进行预处理,得到目标图像,包括:
步骤210、获取所述电子图像中所述档案信息的方向;
步骤220、基于所述卷积神经网络对根据所述档案信息的方向,将所述电子图像进行预设方向的旋转,得到第一电子图像;
步骤230、对所述第一电子图像进行预设角度的纠偏,得到所述目标图像。
具体地,首先对电子图像进行方向矫正。在具体实施中,基于电子图像中目标档案中的文字的方向,对电子图像进行方向矫正,具体实施方式为将电子图像进行顺时针和/或逆时针方向的旋转,进一步的,旋转的角度为预设角度,预设角度为与当前电子图像中的目标档案的偏移角度最接近的预设角度。在具体实施中,本发明实施例中的预设角度可以是90度、180度和270度中的至少一项。例如,检测到电子图像找那个的目标档案中的文字的偏移角度为100度,则选择预设角度为90度,经过方向矫正后,电子图像中的目标档案中的文字部分会为10度,接近于0度。
进一步的,经过方向矫正之后,还需要进行细节上的调整,即调整到0度。本发明中通过角度纠偏进行细节上的调整,即对电子图像中的目标档案的文字部分为接近正位的部分,进行小角度的纠偏处理,使得电子图像中的目标档案的文字部分为完全正位不偏斜,即电子图像对应的目标图像。
在具体实施中,具体的纠偏方式在此不做具体限定。本发明实施例中可以使用Canny边缘检测算法得到电子图像中的目标档案的文字部分的具体的倾斜角度。Canny边缘检测算法的基本原理为,首先使用高斯滤波器降噪,以平滑图像。然后,进行梯度计算,使用Sobel算子计算图像的梯度强度和方向,梯度方向垂直于边缘,可以用来定位边缘。进一步的,进行非极大值抑制,将梯度强度图像中的所有像素转换为它们在局部最大方向上的梯度强度,以消除边缘宽度;然后使用双阈值检测,使用双阈值检测来确定哪些边缘是真实的边缘,如果像素的梯度强度大于高阈值,则将其视为边缘像素,如果像素的梯度强度小于低阈值,则其被排除在边缘之外,如果像素的梯度强度在两个阈值之间,则只有当该像素与高梯度强度像素相连时,将才将其视为边缘像素,最后,使用边缘跟踪算法连接所有真实的边缘像素,以形成完整的边缘。
本发明实施例提供的档案图像边缘裁剪方法,通过扫描等方式,获取目标档案对应的电子图像,然后对电子图像进行预处理,包括方向矫正和角度纠偏,得到电子图像对应的目标图像,然后基于预先训练好的边缘确定模型对目标图像中的档案信息进行识别,得到目标图像中档案信息的位置信息,边缘确定模型是基于卷积神经网络对训练样本集进行训练得到的;然后,基于边缘确定模型输出额度目标图像中档案信息的位置信息,对目标图像进行裁剪,得到不包括冗余边缘的主体图像。本发明的档案图像边缘裁剪方法,提升了档案图像数字化过程中,对冗余边缘裁剪的准确率和效率。
图3是本发明提供的档案图像边缘裁剪方法的模型训练流程示意图,如图3所示,本发明实施例的边缘确定模型基于如下方式进行训练:
步骤310、获取所述训练样本集;所述训练样本集中包括至少一个标记了主体图像的样本档案电子图像;
步骤320、基于所述卷积神经网络对所述训练样本集中的各所述标记了主体图像的样本档案电子图像进行卷积训练,得到所述边缘确定模型。
具体地,本发明实施例中的边缘确定模型,是基于目标检测算法,对训练样本集中的样本图像进行训练得到的。具体的训练方式可以为,首先获取训练样本集,训练样本集中包括了大量的样本图像,样本图像为标记了主体图像的样本档案电子图像,具体的标记方法在此不做限定。然后基于目标检测算法,对样本集中的样本档案电子图像进行训练。
具体地,获取标记了主体图像的样本档案电子图像,然后,将样本档案的电子图像输入待训练的边缘确定模型,基于目标检测算法对样本档案的电子图像中的主体部分的位置坐标进行检测,即得到主体图像在样本档案的电子图像中的位置坐标;最后,根据边缘确定模型识别到的主体图像在样本档案的电子图像中的位置坐标以及样本档案的电子图像中已标记的位置坐标,进行有监督的训练之后,就可以得到可以准确识别出电子图像中主体图像的位置坐标的边缘确定模型。
还需要说明的是,本发明实施例的卷积神经网络可以是目标检测算法网络,本发明实施例中可以使用YOLO-V8目标检测算法。
可选地,根据本发明实施例提供的一种档案图像边缘裁剪方法,所述卷积神经网络为目标检测算法网络。
具体地,本发明实施例中的边缘确定模型,是基于目标检测算法,对训练样本集中的样本图像进行训练得到的。具体的训练方式可以为,首先获取训练样本集,训练样本集中包括了大量的样本图像,样本图像为标记了主体图像的样本档案电子图像,具体的标记方法在此不做限定。然后基于目标检测算法,对样本集中的样本档案电子图像进行训练。
本发明实施例提供的档案图像边缘裁剪方法,通过扫描等方式,获取目标档案对应的电子图像,然后对电子图像进行预处理,包括方向矫正和角度纠偏,得到电子图像对应的目标图像,然后基于预先训练好的边缘确定模型对目标图像中的档案信息进行识别,得到目标图像中档案信息的位置信息,边缘确定模型是基于卷积神经网络对训练样本集进行训练得到的;然后,基于边缘确定模型输出额度目标图像中档案信息的位置信息,对目标图像进行裁剪,得到不包括冗余边缘的主体图像。本发明的档案图像边缘裁剪方法,提升了档案图像数字化过程中,对冗余边缘裁剪的准确率和效率。
可选地,根据本发明提供的一种档案图像边缘裁剪方法,所述位置信息为所述目标图像中档案信息的至少一个位置坐标。
具体地,基于上述边缘确定模型可以得到目标图像中档案信息的位置信息,即至少一个位置坐标,基于这些位置坐标,对目标图像进行裁剪,得到电子图像对应主体图像,即将电子图像中的除了目标档案内容的部分裁减掉,裁剪掉目标图像中主体图像的冗余边缘都裁减掉,得到初始的电子图像对应的主题图像,即目标档案的电子化部分。
本发明实施例提供的档案图像边缘裁剪方法,通过扫描等方式,获取目标档案对应的电子图像,然后对电子图像进行预处理,包括方向矫正和角度纠偏,得到电子图像对应的目标图像,然后基于预先训练好的边缘确定模型对目标图像中的档案信息进行识别,得到目标图像中档案信息的位置信息,边缘确定模型是基于卷积神经网络对训练样本集进行训练得到的;然后,基于边缘确定模型输出额度目标图像中档案信息的位置信息,对目标图像进行裁剪,得到不包括冗余边缘的主体图像。本发明的档案图像边缘裁剪方法,提升了档案图像数字化过程中,对冗余边缘裁剪的准确率和效率。进一步减少了人力、物力资源的投入。
下面对本发明提供的档案图像边缘裁剪装置进行描述,下文描述的档案图像边缘裁剪装置与上文描述的档案图像边缘裁剪方法可相互对应参照。
图4是本发明提供的档案图像边缘裁剪装置的结构示意图,如图4所示,本发明实施例的档案图像边缘裁剪装置,包括:
获取模块410,用于获取目标档案对应的电子图像;
具体地,在本模块中,需要先获得目标档案对应的电子图像。需要说明的是,目标档案为纸质,目标档案中的内容可以是文书档案或者是文书图表档案,在此不做具体限定。需要先对目标档案进行对应处理,得到目标档案对应的电子图像。处理方式可以是通过扫描仪扫描或者高拍仪拍照等。具体可根据目标档案的实际情况决定。
处理模块420,用于将所述电子图像进行预处理,得到目标图像;
具体地,在本模块中,对电子图像进行预处理,预处理指的是对电子图像中的档案信息进行位置调整。位置调整可以包括方向矫正和角度纠偏。
确定模块430,用于将所述目标图像输入边缘确定模型,确定所述目标图像中档案信息的位置信息;所述边缘确定模型是基于卷积神经网络对训练样本集进行训练得到的;
具体的,在本模块中,将经过预处理之后得到的电子图像对应的目标图像,输入预先训练好的边缘确定模型中,经过模型的处理,可以得到目标图像中的目标文档的位置信息。
本发明实施例中的边缘确定模型,是基于目标检测算法,对训练样本集中的样本图像进行训练得到的。具体的训练方式可以为,首先获取训练样本集,训练样本集中包括了大量的样本图像,样本图像为标记了主体图像的样本档案电子图像,具体的标记方法在此不做限定。然后基于目标检测算法,对样本集中的样本档案电子图像进行训练。
裁剪模块440,用于基于所述档案信息的位置信息,对所述目标图像的边缘进行裁剪,得到所述电子图像对应的主体图像。
具体地,在本模块中,基于上述边缘确定模型可以得到目标图像中档案信息的位置信息,即至少一个位置坐标,基于这些位置坐标,对目标图像进行裁剪,得到电子图像对应主体图像,即将电子图像中的除了目标档案内容的部分裁减掉,即裁剪掉目标图像中主体图像的冗余边缘都裁减掉,得到初始的电子图像对应的主题图像,即目标档案的电子化部分。
本发明实施例提供的档案图像边缘裁剪装置,通过各个模块之间的相互配合,实现了目标档案数字化之后的目标图像中的冗余边缘进行精确裁剪。通过扫描等方式,获取目标档案对应的电子图像,然后对电子图像进行预处理,包括方向矫正和角度纠偏,得到电子图像对应的目标图像,然后基于预先训练好的边缘确定模型对目标图像中的档案信息进行识别,得到目标图像中档案信息的位置信息,边缘确定模型是基于卷积神经网络对训练样本集进行训练得到的;然后,基于边缘确定模型输出额度目标图像中档案信息的位置信息,对目标图像进行裁剪,得到不包括冗余边缘的主体图像。本发明的档案图像边缘裁剪方法,提升了档案图像数字化过程中,对冗余边缘裁剪的准确率和效率。进一步减少了人力、物力资源的投入。
图5是本发明提供的电子设备的结构示意图。图5示例了一种电子设备的实体结构示意图,如图5所示,该电子设备可以包括:处理器(processor)510、通信接口(Communications Interface)520、存储器(memory)530和通信总线540,其中,处理器510,通信接口520,存储器530通过通信总线540完成相互间的通信。处理器510可以调用存储器530中的逻辑指令,以执行上述的档案图像边缘裁剪方法,该方法包括:
获取目标档案对应的电子图像;
将所述电子图像进行预处理,得到目标图像;
将所述目标图像输入边缘确定模型,确定所述目标图像中档案信息的位置信息;所述边缘确定模型是基于卷积神经网络对训练样本集进行训练得到的;
基于所述档案信息的位置信息,对所述目标图像的边缘进行裁剪,得到所述电子图像对应的主体图像。
此外,上述的存储器530中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
另一方面,本发明还提供一种计算机程序产品,所述计算机程序产品包括计算机程序,计算机程序可存储在非暂态计算机可读存储介质上,所述计算机程序被处理器执行时,计算机能够执行上述各方法所提供的档案图像边缘裁剪方法,该方法包括:
获取目标档案对应的电子图像;
将所述电子图像进行预处理,得到目标图像;
将所述目标图像输入边缘确定模型,确定所述目标图像中档案信息的位置信息;所述边缘确定模型是基于卷积神经网络对训练样本集进行训练得到的;
基于所述档案信息的位置信息,对所述目标图像的边缘进行裁剪,得到所述电子图像对应的主体图像。
又一方面,本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现以执行上述各方法提供的档案图像边缘裁剪方法,该方法包括:
获取目标档案对应的电子图像;
将所述电子图像进行预处理,得到目标图像;
将所述目标图像输入边缘确定模型,确定所述目标图像中档案信息的位置信息;所述边缘确定模型是基于卷积神经网络对训练样本集进行训练得到的;
基于所述档案信息的位置信息,对所述目标图像的边缘进行裁剪,得到所述电子图像对应的主体图像。
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
Claims (10)
1.一种档案图像边缘裁剪方法,其特征在于,包括:
获取目标档案对应的电子图像;
将所述电子图像进行预处理,得到目标图像;
将所述目标图像输入边缘确定模型,确定所述目标图像中档案信息的位置信息;所述边缘确定模型是基于卷积神经网络对训练样本集进行训练得到的;
基于所述档案信息的位置信息,对所述目标图像的边缘进行裁剪,得到所述电子图像对应的主体图像。
2.根据权利要求1所述的档案图像边缘裁剪方法,其特征在于,所述预处理包括方向矫正和角度纠偏。
3.根据权利要求2所述的档案图像边缘裁剪方法,其特征在于,所述将所述电子图像进行预处理,得到目标图像,包括:
获取所述电子图像中所述档案信息的方向;
基于所述卷积神经网络对根据所述档案信息的方向,将所述电子图像进行预设方向的旋转,得到第一电子图像;
对所述第一电子图像进行预设角度的纠偏,得到所述目标图像。
4.根据权利要求1所述的档案图像边缘裁剪方法,其特征在于,所述边缘确定模型基于如下方式进行训练:
获取所述训练样本集;所述训练样本集中包括至少一个标记了主体图像的样本档案电子图像;
基于所述卷积神经网络对所述训练样本集中的各所述标记了主体图像的样本档案电子图像进行卷积训练,得到所述边缘确定模型。
5.根据权利要求4所述的档案图像边缘裁剪方法,其特征在于,
所述卷积神经网络为目标检测算法网络。
6.根据权利要求1所述的档案图像边缘裁剪方法,其特征在于,
所述位置信息为所述目标图像中档案信息的至少一个位置坐标。
7.一种档案图像边缘裁剪装置,其特征在于,包括:
获取模块,用于获取目标档案对应的电子图像;
处理模块,用于将所述电子图像进行预处理,得到目标图像;
确定模块,用于将所述目标图像输入边缘确定模型,确定所述目标图像中档案信息的位置信息;所述边缘确定模型是基于卷积神经网络对训练样本集进行训练得到的;
裁剪模块,用于基于所述档案信息的位置信息,对所述目标图像的边缘进行裁剪,得到所述电子图像对应的主体图像。
8.一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至6任一项所述的档案图像边缘裁剪方法。
9.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至6任一项所述的档案图像边缘裁剪方法。
10.一种计算机程序产品,包括计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至6任一项所述的档案图像边缘裁剪方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311861945.8A CN117853509A (zh) | 2023-12-29 | 2023-12-29 | 档案图像边缘裁剪方法、装置、设备及介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311861945.8A CN117853509A (zh) | 2023-12-29 | 2023-12-29 | 档案图像边缘裁剪方法、装置、设备及介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117853509A true CN117853509A (zh) | 2024-04-09 |
Family
ID=90543424
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311861945.8A Pending CN117853509A (zh) | 2023-12-29 | 2023-12-29 | 档案图像边缘裁剪方法、装置、设备及介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117853509A (zh) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112052853A (zh) * | 2020-09-09 | 2020-12-08 | 国家气象信息中心 | 一种基于深度学习的手写气象档案资料的文本定位方法 |
CN115439871A (zh) * | 2022-09-13 | 2022-12-06 | 北京航星永志科技有限公司 | 档案自动化采集方法、装置和电子设备 |
WO2023053102A1 (en) * | 2021-10-03 | 2023-04-06 | Imageprovision Technology Private Limited | Method and system for automated proofreading of digitized visual imageries |
CN116433494A (zh) * | 2023-04-19 | 2023-07-14 | 南通大学 | 一种基于深度学习的档案扫描图像自动纠偏裁边方法 |
-
2023
- 2023-12-29 CN CN202311861945.8A patent/CN117853509A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112052853A (zh) * | 2020-09-09 | 2020-12-08 | 国家气象信息中心 | 一种基于深度学习的手写气象档案资料的文本定位方法 |
WO2023053102A1 (en) * | 2021-10-03 | 2023-04-06 | Imageprovision Technology Private Limited | Method and system for automated proofreading of digitized visual imageries |
CN115439871A (zh) * | 2022-09-13 | 2022-12-06 | 北京航星永志科技有限公司 | 档案自动化采集方法、装置和电子设备 |
CN116433494A (zh) * | 2023-04-19 | 2023-07-14 | 南通大学 | 一种基于深度学习的档案扫描图像自动纠偏裁边方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP2288135B1 (en) | Deblurring and supervised adaptive thresholding for print-and-scan document image evaluation | |
US8682080B2 (en) | Image processing apparatus, image processing method, image processing program, and storage medium | |
JP4358193B2 (ja) | 画像対象の自動切抜き方法 | |
US20050196070A1 (en) | Image combine apparatus and image combining method | |
US20050249429A1 (en) | Method, apparatus, and program for image processing | |
CN110136069B (zh) | 文本图像矫正方法、装置与电子设备 | |
CN114049641B (zh) | 基于深度学习的文字识别方法及系统 | |
WO2017008031A1 (en) | Realtime object measurement | |
US7903876B2 (en) | Distortion correction of a captured image | |
CN109359497A (zh) | 一种增值税发票图像二维码区域的定位与识别方法 | |
JP2003016440A5 (zh) | ||
CN111079738B (zh) | 一种图像处理方法、系统及终端设备 | |
CN114267046A (zh) | 一种文档图像的方向校正方法与装置 | |
CN117853509A (zh) | 档案图像边缘裁剪方法、装置、设备及介质 | |
CN112818983A (zh) | 一种利用图片相识度判断字符倒置的方法 | |
WO2017008029A1 (en) | Nearsighted camera object detection | |
CN115187989A (zh) | 图像的处理方法、装置、电子设备、扫描笔和存储介质 | |
CN111079756B (zh) | 一种单据图像中的表格提取与重建方法和设备 | |
CN113627442A (zh) | 医疗信息的录入方法、装置、设备及存储介质 | |
JPH06203202A (ja) | 画像処理装置 | |
Hiyama et al. | Fast information retrieval method from printed images considering mobile devices | |
JP2000261653A (ja) | 画像処理装置 | |
JPWO2004077356A1 (ja) | 画像結合装置、画像結合方法 | |
CN117173391B (zh) | 一种基于深度学习和多视几何的倾斜图像矫正方法及系统 | |
CN115880300B (zh) | 图像模糊检测方法、装置、电子设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |