CN115619656A - 数字化档案纠偏矫正方法及系统 - Google Patents
数字化档案纠偏矫正方法及系统 Download PDFInfo
- Publication number
- CN115619656A CN115619656A CN202211147662.2A CN202211147662A CN115619656A CN 115619656 A CN115619656 A CN 115619656A CN 202211147662 A CN202211147662 A CN 202211147662A CN 115619656 A CN115619656 A CN 115619656A
- Authority
- CN
- China
- Prior art keywords
- image
- file
- component
- text
- inclination angle
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 73
- 238000012545 processing Methods 0.000 claims abstract description 18
- 238000007781 pre-processing Methods 0.000 claims abstract description 14
- 230000008569 process Effects 0.000 claims abstract description 13
- PXFBZOLANLWPMH-UHFFFAOYSA-N 16-Epiaffinine Natural products C1C(C2=CC=CC=C2N2)=C2C(=O)CC2C(=CC)CN(C)C1C2CO PXFBZOLANLWPMH-UHFFFAOYSA-N 0.000 claims abstract description 8
- 230000009466 transformation Effects 0.000 claims abstract description 8
- 238000010586 diagram Methods 0.000 claims description 38
- 238000012937 correction Methods 0.000 claims description 28
- 238000001514 detection method Methods 0.000 claims description 22
- 238000012216 screening Methods 0.000 claims description 3
- 238000000926 separation method Methods 0.000 claims description 3
- 238000001914 filtration Methods 0.000 claims description 2
- 210000000988 bone and bone Anatomy 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 241000764238 Isis Species 0.000 description 2
- 230000000712 assembly Effects 0.000 description 2
- 238000000429 assembly Methods 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- NAWXUBYGYWOOIX-SFHVURJKSA-N (2s)-2-[[4-[2-(2,4-diaminoquinazolin-6-yl)ethyl]benzoyl]amino]-4-methylidenepentanedioic acid Chemical compound C1=CC2=NC(N)=NC(N)=C2C=C1CCC1=CC=C(C(=O)N[C@@H](CC(=C)C(O)=O)C(O)=O)C=C1 NAWXUBYGYWOOIX-SFHVURJKSA-N 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000005530 etching Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000014509 gene expression Effects 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 238000002955 isolation Methods 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 230000000873 masking effect Effects 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 239000000049 pigment Substances 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
- 239000002023 wood Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/80—Geometric correction
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T3/00—Geometric image transformations in the plane of the image
- G06T3/02—Affine transformations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T3/00—Geometric image transformations in the plane of the image
- G06T3/40—Scaling of whole images or parts thereof, e.g. expanding or contracting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/10—Image enhancement or restoration using non-spatial domain filtering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/11—Region-based segmentation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20048—Transform domain processing
- G06T2207/20056—Discrete and fast Fourier transform, [DFT, FFT]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20112—Image segmentation details
- G06T2207/20132—Image cropping
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Character Input (AREA)
Abstract
本发明属于档案加工技术领域,特别涉及一种数字化档案纠偏矫正方法及系统,首先,读取扫描的待纠偏校正的档案图像,并对档案图像进行预处理,所述预处理至少包含:白边裁剪和灰度化处理;接着,利用傅里叶变换获取预处理后的档案图像倾斜角α,通过边界拟合来确定档案图像外边界线和倾斜角β,并利用空间仿射变换对档案图像倾斜进行修正;然后,提取档案图像中的文字图片列表,并利用预设的偏旁组件和/或文字组件对档案图像中文字图片进行匹配,确定档案图像上下倒置情况,并对倒置档案图像进行翻转来获取文字内容正向且倾斜角度符合规范要求的档案图像。本发明能够处理各类档案图像,且实时性可满足当前项目实际需求,便于档案数字化管理中的应用。
Description
技术领域
本发明属于档案加工技术领域,特别涉及一种数字化档案纠偏矫正方法及系统。
背景技术
档案数字化加工过程中,由于老旧档案存在外边框磨损严重、档案版制多样化等情况,导致其的倾斜角度难以计算,且档案加工人员在扫描档案过程中存在较大的主观因素,致使扫描后的档案图像会出现不同程度的倾斜角度和方向倒置,从而影响档案图像的后处理等相关操作。对于档案图像的倾斜矫正问题,目前主要有基于投影的方法、基于霍夫变换的方法和基于K近邻的方法等。但投影法仅适用于纯文本图像倾角检测,霍夫变换仅适用于直线检测,K近邻方法时效性差,同时以上算法并不能检测档案倒置问题。
发明内容
为此,本发明提供一种数字化档案纠偏矫正方法及系统,能够处理各类档案图像,对于年代久远的老旧档案图像和倒置情况具有较好地处理效果,且实时性可满足当前项目实际需求,便于档案数字化管理中的应用。
按照本发明所提供的设计方案,提供一种数字化档案纠偏矫正方法,包含如下内容:
读取扫描的待纠偏校正的档案图像,并对档案图像进行预处理,所述预处理至少包含:白边裁剪和灰度化处理;
利用傅里叶变换获取预处理后的档案图像倾斜角α,通过边界拟合来确定档案图像外边界线和倾斜角β,并利用空间仿射变换对档案图像倾斜进行修正;
提取档案图像中的文字图片列表,并利用预设的偏旁组件和/或文字组件对档案图像中文字图片进行匹配,确定档案图像上下倒置情况,并对倒置档案图像进行翻转来获取文字内容正向且倾斜角度符合规范要求的档案图像。
作为本发明中数字化档案纠偏矫正方法,进一步地,利用傅里叶变换获取档案图像的倾斜角度中,首先,通过对档案图像进行二维离散傅里叶变换得到档案图像的频域分布图;接着,利用霍夫变换检测直线,将直线绘制在频域分布图上,得到对应的频域图;通过遍历频域图全图连通域来消除频域图上噪声,并通过频道分离来获取偏斜基图和偏斜辅图,利用偏斜基图和偏斜幅图来获取档案图像偏斜角度α。
作为本发明中数字化档案纠偏矫正方法,进一步地,利用偏斜基图和偏斜幅图来获取档案图像偏斜角度的过程,包含如下内容:利用FAST特征检测来获取偏斜基图特征分布图,依据特征点分布图来计算各直线端点坐标;在偏斜辅图中,依据预设的倾斜判定条件判定档案图像是否符合倾斜要求,对不符合倾斜要求的档案图像,通过档案水平直线斜率夹角和档案垂直直线斜率夹角来获取档案图像倾斜角度,其中,预设的倾斜判定条件为水平垂直标记位为真且偏斜基图最大外接矩形面积符合预设面积区域要求。
作为本发明中数字化档案纠偏矫正方法,进一步地,通过边界拟合来确定档案图像外边界线中,首先,对预处理后的灰度化档案图像进行二值化处理,裁剪档案图像每个顶角矩形块,依据矩形块平均值来判定档案图像是否存在黑边;接着,依据预设颜色像素点和对应像素点坐标来定位档案图像边界位置并绘制边界散列点集;然后,利用最小二乘法拟合档案图像边界线,并利用拟合直线斜率来计算档案图像外边框倾斜角度β。
作为本发明数字化档案纠偏矫正方法,进一步地,利用最小二乘法拟合档案图像边界线的过程包含如下内容:首先,利用档案图像各顶点到边界散列点最短距离来确定区域关节点,通过将区域关节点分别与档案图像中心点连线来将档案图像进行区域划分,每个区域中设置有一条直线,且在直线拟合过程中,将其他区域和当前直线拟合区域最近两个顶点组合形成遮罩多边形,并将该多边形与散列点图像与或获取对应方向点集;利用最小二乘法对方向点集拟合得到拟合直线方程。
作为本发明数字化档案纠偏矫正方法,进一步地,利用拟合直线斜率来计算档案图像外边框倾斜角度中,首先将拟合直线斜率转换成方向标识,依据方向标识来获取档案图像倾斜方向,并将拟合直线斜率转换成水平方向的夹角;然后,通过最短距离公式获取水平方向夹角中两个最相似角,并依据该两个最相似角获取水平方向倾斜角;最后,依据倾斜角和倾斜方向来确定档案图像倾斜角度。
作为本发明数字化档案纠偏矫正方法,进一步地,提取档案图像中的文字信息,首先,标定档案图像中每一个文字,通过检查标定框是否符合文字尺寸来对文字标定框进行筛选过滤,然后,对筛选过滤后的文字标定框进行裁剪,获取文字图片列表。
作为本发明数字化档案纠偏矫正方法,进一步地,利用预设的偏旁组件和/或文字组件对档案图像中文字信息进行匹配来确定档案图像上下倒置情况中,首先,依据组件类型和预设占比生成遮挡矩形区域,并依据遮挡后的图片来确定文字偏旁外接矩形,并依据外接矩形大小和组件规格计算组件图像缩放比例;然后,依据模板匹配方法将提取的档案文字图片与组件图像进行正反倒置两个方向下的模板相似度匹配,分别统计档案图片中文字与正、反模板相似度高的个数,最后通过其个数判定档案图像是否倒置。
作为本发明数字化档案纠偏矫正方法,进一步地,获取预设的偏旁组件和/或文字组件中,采用人事档案数字化技术规范中规定的字体来绘制对应尺寸规格要求的偏旁组件图片和文字组件图片,并通过掩膜操作和占比率设置将偏旁组件图片和文字组件图片转换为预设背景和占比要求的图片数据;通过对图片数据进行FAST特征检测来生成对应特征关键点图,依据预设的偏旁类型和文字类型生成组件列表配置文件,以利用配置文件来获取预设的偏旁组件和文字组件。
进一步地,本发明还提供一种数字化档案纠偏矫正系统,包含:图像数据读取模块、图像角度修正模块和图像方向翻转模块,其中,
图像数据读取模块,用于读取扫描的待纠偏校正的档案图像,并对档案图像进行预处理,所述预处理至少包含:白边裁剪和灰度化处理;
图像角度修正模块,用于利用傅里叶变换获取预处理后的档案图像倾斜角α,通过边界拟合来确定档案图像外边界线和倾斜角β,并利用空间仿射变换对档案图像倾斜进行修正;
图像方向翻转模块,用于提取档案图像中的文字图片列表,并利用预设的偏旁组件和/或文字组件对档案图像中文字图片进行匹配,确定档案图像上下倒置情况,并对倒置档案图像进行翻转来获取文字内容正向且倾斜角度符合规范要求的档案图像。
本发明的有益效果:
本发明通过拟合扫描档案图像边框,并对其进行傅里叶变换,从而实现对档案图像的倾斜矫正,能够解决由于档案存放时间过久造成纸张破损而出现的直线无法准确拟合的情况,能够屏蔽版面内容无关信息,进而提升倾斜矫正的准确度;对于存在倒置情况,通过倒置检测来保证档案文本正向,提高档案加工效率,便于在档案数字化管理和归档中的应用。
附图说明:
图1为实施例中档案纠偏流程图;
图2为实施例中傅里叶变换处理示意图;
图3为实施例中边界拟合示意图;
图4为实施例中外边框处理示意图;
图5为实施例中组件生成流程示意图;
图6为实施例中组件检测流程示意图;
图7为实施例中组件类型示意图;
图8为实施例中宽高示意图;
图9为实施例中偏旁组件示意图;
图10为实施例中偏旁占比示意图;
图11为实施例中文字框定示意图;
图12为实施例中框定文字偏旁计算示意图;
图13为实施例中偏旁组件关键点检测示意图。
具体实施方式:
为使本发明的目的、技术方案和优点更加清楚、明白,下面结合附图和技术方案对本发明作进一步详细的说明。
针对档案数字化过程中存在倾斜矫正、裁黑边和方向倒置等问题,本发明实施例,提供一种数字化档案纠偏矫正方法,首先,读取扫描的待纠偏校正的档案图像,并对档案图像进行预处理,所述预处理至少包含:白边裁剪和灰度化处理;接着,利用傅里叶变换获取预处理后的档案图像倾斜角α,通过边界拟合来确定档案图像外边界线和倾斜角β,并利用空间仿射变换对档案图像倾斜进行修正;然后,提取档案图像中的文字图片列表,并利用预设的偏旁组件和/或文字组件对档案图像中文字图片进行匹配,确定档案图像上下倒置情况,并对倒置档案图像进行翻转来获取文字内容正向且倾斜角度符合规范要求的档案图像。
收集档案图像中,可利用平板扫描仪对数字档案进行扫描和读取,并对读取的宽度为20 像素的白边进行裁剪和灰度化处理。针对档案数字化加工过程中存在的倾斜矫正和裁黑边的问题,参见图1所示,本案实施例中,利用基于傅里叶检测和外边框拟合相结合的方法,档案图像经过傅里叶变换得到档案图像的倾斜角度,该方法适用于单色背景档案图像,对于存在黑色边界的档案图像而言,效果较差。利用边界拟合方法能够有效地解决该问题,准确获得存在黑边的档案图像的倾斜角度。对于外边界存在损坏的老旧档案而言,外边界拟合算法仍然具有较好的鲁棒性。同时通过边界拟合得到档案的真实外边界线,后续对外边界线进行相同角度的倾斜矫正,可得到档案需要裁剪的尺寸。倒置检测方法中,针对《干部人事档案数字化技术规范》中要求字体格式为宋体,本案实施例中,可使用宋体生成多个偏旁组件和多个文字组件。分析档案中偏旁和文字出现频率,可选取最常见且上下特征明显的“木”,“亻”等作为偏旁组件,而在文字组件中则选择常见字“名”,“表”,“专”等。首先对输入的档案进行文字分割,其次对文字进行组件检测。组件检测是通过自适应文字大小而进行得模板匹配方法。对于文字较多的档案,可在偏旁组件检测中就可得知文字倒置情况,而对于文字较少的档案,仍需要在文字组件检测阶段才可得知。
作为优选实施例,进一步地,利用傅里叶变换获取档案图像的倾斜角度中,首先,通过对档案图像进行二维离散傅里叶变换得到档案图像的频域分布图;接着,利用霍夫变换检测直线,将直线绘制在频域分布图上,得到对应的频域图;通过遍历频域图全图连通域来消除频域图上噪声,并通过频道分离来获取偏斜基图和偏斜辅图,利用偏斜基图和偏斜幅图来获取档案图像偏斜角度α。
傅里叶变换和拟合直线都是为了确定倾斜角度,拟合直线能够提高准确度。拟合直线中,能够确定直线的倾斜角度;并可以确定档案图像中档案真实的文本边界。
对灰度化档案图像进行二维离散傅立叶变换(DFT)得到频域分布图Ib,接着利用霍夫变换检测直线,最后将直线绘制在频域图Ic上,其中水平和垂直线使用灰色绘制,其他直线采用黑色绘制。如图2所示,(1)是傅里叶变化生成的频域分布图Ib,(2)是霍夫变换重绘后的频域图Ic。重绘频域图Ic往往含有诸多线段噪点,遍历全图连通域,保留最大面积的连通区域,其余连通区域裁剪并赋为白色,得到无噪频域图Id。随后分离图Id灰黑通道得到偏斜基图Ie和偏斜辅图If,其中偏斜基图Ie可能会存在两个方向的直线,若存在水平方向直线,则水平标记位flagh为true,垂直方向直线同理。如图2中的(3)所示,存在水平方向直线flagh为 true,不存在垂直方向直线flagv为false。最后求出偏斜基图Ie最大外接矩形面积SF。
本案实施例中,进一步地,利用偏斜基图和偏斜幅图来获取档案图像偏斜角度的过程,包含如下内容:利用FAST特征检测来获取偏斜基图特征分布图,依据特征点分布图来计算各直线端点坐标;在偏斜辅图中,依据预设的倾斜判定条件判定档案图像是否符合倾斜要求,对不符合倾斜要求的档案图像,通过档案水平直线斜率夹角和档案垂直直线斜率夹角来获取档案图像倾斜角度,其中,预设的倾斜判定条件为水平垂直标记位为真且偏斜基图最大外接矩形面积符合预设面积区域要求。
图Ie经过FAST特征检测得到特征分布图Ig,如图2中的(5)所示,灰色点是特征点集,其坐标Hn={(x0,y0),(x1,y1),…,(xn,yn)},xi∈[0,w),yj∈[0,h),n=[0,w×h)。通过公式(1) 可得到p0,p1,p2,p3在Hn中的下标,其index0,index1,index2,index3分别代表p0,p1,p2,p3的下标。四个端点的坐标集
端点和直线如图2中的(6)所示。
若偏斜辅图If中,flagv和flagh都为true且SF<w×n×0.16成立,则档案图像已符合倾斜要求,不需要矫正,否则需要进一步进行斜率夹角计算。直线lv可由公式(2)求出斜率夹角αv,同理公式(3)求出lh斜率夹角αh,使用公式(4)求出偏斜角度α。
作为优选实施例,进一步地,通过边界拟合来确定档案图像外边界线中,首先,对预处理后的灰度化档案图像进行二值化处理,裁剪档案图像每个顶角矩形块,依据矩形块平均值来判定档案图像是否存在黑边;接着,依据预设颜色像素点和对应像素点坐标来定位档案图像边界位置并绘制边界散列点集;然后,利用最小二乘法拟合档案图像边界线,并利用拟合直线斜率来计算档案图像外边框倾斜角度β。
对灰度化的档案图像进行二值化处理,依次裁剪图像每个顶角20*20的矩形块,计算每块平均值是否等于0,并统计等于0的个数。若个数大于等于3,则认为存在黑边。否则,视为不存在黑色边界。计算出中第e行白色像素坐标集pe,再求出第e行第一个白色像素点坐标和最后一个白色像素点坐标,即可定位边界位置。假设 pe=[225,226……1997,1998],则依此遍历每行,可得到边框散列点集。如图4中的(1)所示,灰色表示边框散列点集。
档案图像各顶点vi,i∈[0,4)到边框散列点最短距离可确定4个区域关节点,分别是 b0,b1,b2,b3。通过4个区域关节点分别与图像中心点C连线可将图像分为四个区域,每个区域中有一条直线。在进行直线拟合时,将其他3个区域和该拟合直线最近两个顶点组合形成遮罩多边形,如图4中的(2)所示。并将其与散列点图像与或,得到该方向点集l如下所示:
li={(x0,y0),(x1,y1),…,(xn,yn)},xi∈[0,w),yj∈[0,h),i∈[0,4)
最后,利用最小二乘法对方向点集拟合得到直线y=k·x+b。依次进行如上操作,即可得到全部方向拟合直线ei,i∈[0,4)。图4中的(2)中,灰色表示l0的遮罩多边形,是由区域 1、区域2、区域3和顶点v0,v3组合生成。图3中不同色块代表不同区域,v0,v1,v2,v3表示档案图像顶点,l0,l1,l2,l3表示方向点集,灰色线条表示vi到li的最短距离,其点是灰色点bi。
进一步地,利用最小二乘法拟合档案图像边界线的过程包含如下内容:首先,利用档案图像各顶点到边界散列点最短距离来确定区域关节点,通过将区域关节点分别与档案图像中心点连线来将档案图像进行区域划分,每个区域中设置有一条直线,且在直线拟合过程中,将其他区域和当前直线拟合区域最近两个顶点组合形成遮罩多边形,并将该多边形与散列点图像与或获取对应方向点集;利用最小二乘法对方向点集拟合得到拟合直线方程。进一步地,利用拟合直线斜率来计算档案图像外边框倾斜角度中,首先将拟合直线斜率转换成方向标识,依据方向标识来获取档案图像倾斜方向,并将拟合直线斜率转换成水平方向的夹角;然后,通过最短距离公式获取水平方向夹角中两个最相似角,并依据该两个最相似角获取水平方向倾斜角;最后,依据倾斜角和倾斜方向来确定档案图像倾斜角度。
利用最小二乘法得到4条拟合直线ei,i∈[0,4),其中直线e0是方向点集l0的拟合直线,且斜率为k0。同理,k1,k2,k3分别是拟合直线e1,e2,e3的斜率。计算角度偏斜方向d,向左倾斜用0表示,向右偏则用1表示。考虑到e0与e2属于同一方向近似平行直线,e1与e3属于同一方向近似平行线,且e0与e1水平夹角相差90°,为了方便计算倾斜方向对其斜率进行如下规格化,通过公式(5)和(6)将4个斜率转换成方向标识di′。然后通过公式(7)即可得到倾斜方向d。
根据公式(8),将其斜率转换成于水平方向的夹角βi,i∈[0,4),,符合0°≤βi≤90°,i∈ [0,4)。
Dmin=min(|βi-βj|),0≤i<4,i≤j<4#(9)
作为优选实施例,进一步地,提取档案图像中的文字信息,首先,标定档案图像中每一个文字,通过检查标定框是否符合文字尺寸来对文字标定框进行筛选过滤,然后,对筛选过滤后的文字标定框进行裁剪,获取文字图片列表。进一步地,获取预设的偏旁组件和/或文字组件中,采用人事档案数字化技术规范中规定的字体来绘制对应尺寸规格要求的偏旁组件图片和文字组件图片,并通过掩膜操作和占比率设置将偏旁组件图片和文字组件图片转换为预设背景和占比要求的图片数据;通过对图片数据进行FAST特征检测来生成对应特征关键点图,依据预设的偏旁类型和文字类型生成组件列表配置文件,以利用配置文件来获取预设的偏旁组件和文字组件
经上述倾斜矫正处理之后,数字化档案已达到《干部人事档案数字化技术规范》倾斜规范要求,但可能存在上下倒置情况,为此,本案实施例中设置自适应上下倒置矫正算法,分为组件生成模块和组件检测模块。其中组件检测模块含有两部分,分别是偏旁组件检测和文字组件检测。偏旁组件的定义为 componentr=(templater,maskr,boner,typer,thresholdr,widthr,heightr,scaler)和文字组件的定义为componentw=(templatew,maskw,typew,thresholdw,widthw,heightw)。在 componentr中templater表示模板图片,如图9中的(1)所示;maskr表示在模板匹配中所关注的目标区域,如图9中的(2)所示;boner是用来保存偏旁关键点信息;如图9中的(3) 所示;typer表示偏旁组件的类型,有5种,分别为全区域类、左区域类、上区域类、右区域类和下区域类,如图7所示;thresholdr是指模板匹配相似度阈值,在生成模块默认指定阈值为0.81;widthr,heightr分别指模板图片中偏旁最大外接矩形的宽和高,如图8所示;scaler表示偏旁占比率。文字组件和偏旁组件组成基本类似,typew只有一种类型,如图7中的(6) 所示;widthw,heightw分别指模板图片中文字最大外接矩形的宽和高。图5和图6分别是组件生成和组件检测的流程图。
组件生成算法的步骤可设计如下:
步骤一:文字和偏旁图生成。采用《干部人事档案数字化技术规范》所规定的新宋体绘制图片templater或templatew。其尺寸规格:500*500。
步骤二:计算文字或偏旁宽高。使用倾斜矫正模块中步骤四介绍的方法,可确定图片中偏旁或文字的四个角点,其将左右角点左边按垂直方向延伸扩展,再将上下角点坐标沿着水平方向扩展,这样所延长的直线将围成一个矩形,如图8所示,灰色透明区域代表矩形区域,其区域的宽、高分别代表着文字或偏旁的宽、高,即widthw为左右角点X轴方向相减,heightw为上下角点Y轴方向相减。
步骤三:生成文字maskw或偏旁图maskr。将生成的文字templatew或偏旁图templater转换为黑底白字,在通过腐蚀操作扩大白色区域,如图9的(2)所示。
步骤四:判别生成模板类型。偏旁类型有5类,即typer={0,1,2,3,4},通过黑色像素所在区域确定。区域是通过黑色像素点位于中心点的上下左右进行区分的。在9的(1)中黑色像素占据图像上、下、左、右4个区域,则为偏旁类型0;在图9的(2)中黑色像素仅分布在左区域,则为类型1。其余类型判别与类型1较为相似。其余类型判断可参考图9。本发明通过建立人事档案常见字样,进一步提高上下倒置判别准确度,其类型typew={5}。
步骤五:计算偏旁占比率scaler。在偏旁类型0和文字类型中由于占据图片全篇幅,无需计算占比率。偏旁外接矩形内侧边界穿过矩形内部到图像外边界最短距离成为偏旁占比。图 10为偏旁占比示意图。在步骤二中偏旁类型1围成的矩形右边界x坐标则为偏旁占比lengthl,其占比率表示为对于类型2,矩形下边界y轴坐标表示为偏旁占比lengthu,占比率为对于类型3,是矩形左边界到图像右边界的距离成为占比,其占比率对于类型4的占比是矩形上边界到图像下边界的距离,占比率为
步骤六:生成偏旁特征关键点图boner。对生成的偏旁图进行FAST特征检测得到特征点并将其绘制成图。如图9的(3)所示。
步骤七:组件生成和生成配置文件。考虑到人事档案实际应用场景,引入偏旁类型为0的“辶”;偏旁类型为1的“亻”,“纟”,“马”,“木”,“扌”;偏旁类型为2的“宀”;偏旁类型为3的“阝”,偏旁类型为4的“心”;文字类型为5的“表”,“名”,“员”,“专”,“学”。生成偏旁组件列表文字组件列表为将生成的组件列表转换成相应的配置文件。
作为优选实施例,进一步地,利用预设的偏旁组件和/或文字组件对档案图像中文字信息进行匹配来确定档案图像上下倒置情况中,首先,依据组件类型和预设占比生成遮挡矩形区域,并依据遮挡后的图片来确定文字偏旁外接矩形,并依据外接矩形大小和组件规格计算组件图像缩放比例;然后,依据模板匹配方法将提取的档案文字图片与组件图像进行正反倒置两个方向下的模板相似度匹配,分别统计档案图片中文字与正、反模板相似度高的个数,最后通过其个数判定档案图像是否倒置。
组件检测算法的步骤可设计如下:
步骤一:组件检测预处理。首先读取针对数字化档案的配置文件,生成相应的组件。然后对傅里叶和外边距拟合模块处理后的数字化档案使用NL-Means算法进行降噪处理。再接着使用区域特征提取MSER算法,标定每一个汉字,对于标定框的筛选,检查标定框是否符合汉字高宽近似相等特点。最后裁剪每个汉字生成图片列表 Ln={image0,image1,…,imagei,…,imagen}。如图11所示,灰色框表示一个imagei。
步骤二:生成遮挡矩形区域。假设当前使用的组件是定位的图片是imagei。若文字图像imagei的宽为wt,高为ht。首先计算遮挡区域,按照偏旁组件类型和占比率生成一个遮挡矩形,其位置随着组件类型的变化而不同。
若偏旁类型是0,则在文字图片左半部分生成一个宽为高为ht的白色底色矩形;若偏旁类型是1,则在文字图片下半部分生成一个宽为wt、高为的白色区域。类型0和2较为相似,差异在于遮挡矩形在图片左半部分,同理可知类型3遮挡区域在图像的上半部分。在图12的(2)展示类型1的遮挡矩形,在图12 的(3)展示了遮挡后的效果。
步骤三:计算图像的缩放比例。在步骤二中,遮挡后的图只剩下偏旁部分,使用倾斜矫正模块中步骤四介绍的方法,可确定文字偏旁的外接矩形,如图12的(4)所示。假设文字 imagei偏旁的外接矩形宽为wr,高为hr,然后根据偏旁组件类型计算组件中的缩放比例scale。
步骤四:偏旁组件检测。使用模板匹配方法进行相似度匹配,其中输入图像是imagei,模板是目标关注区域是输出是文字图像imagei与模板的相似度。文字图片列表Ln依此对偏旁组件进行模板匹配,并统计相似度大于且通过关键点检测的数量amount。再将Ln图像依此倒置,再进行匹配,统计倒置后相似度大于且通过关键点检测的数量re_amount。若amount+re_amount>10成立且 amount>re_amount则数字档案放置正向。若amount+re_amount<10,则需要进一步进行文字组件匹配,其匹配方式与偏旁匹配基本一致,但仅统计相似度大于的个数,不会进行关键点检测。
关键点检测是指文字图像imagei与偏旁组件相似度大于时,各关键点到黑色像素应在合理范围内。裁剪模板匹配到的矩形区域II,并使用进行与或操作,得到仅有偏旁部分的图像IJ,在中白色像素点坐标代表着缩放后的关键点,计算关键点到IJ中黑色色素的最短距离,若存在最短距离大于图IJ宽的0.12倍,则认为imagei与并不相似。图 13中展示了关键点检测中的流程样例,图13的(1)表示imagei,图13的(2)中黑色区域为自适应模板框选区域II,图13的(3)为图像IJ,图13的(4)为图像IJ二值化,图13的 (5)灰色点表示关键点。
步骤五:倒置图像翻转。将步骤四中确定的倒置档案图像进行翻转得到一张内容文字正向且倾斜角度符合规范的档案图片。
进一步地,基于上述的方法,本发明实施例还提供一种数字化档案纠偏矫正系统,包含:图像数据读取模块、图像角度修正模块和图像方向翻转模块,其中,
图像数据读取模块,用于读取扫描的待纠偏校正的档案图像,并对档案图像进行预处理,所述预处理至少包含:白边裁剪和灰度化处理;
图像角度修正模块,用于利用傅里叶变换获取预处理后的档案图像倾斜角α,通过边界拟合来确定档案图像外边界线和倾斜角β,并利用空间仿射变换对档案图像倾斜进行修正;
图像方向翻转模块,用于提取档案图像中的文字图片列表,并利用预设的偏旁组件和/或文字组件对档案图像中文字图片进行匹配,确定档案图像上下倒置情况,并对倒置档案图像进行翻转来获取文字内容正向且倾斜角度符合规范要求的档案图像。
除非另外具体说明,否则在这些实施例中阐述的部件和步骤的相对步骤、数字表达式和数值并不限制本发明的范围。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的系统而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
结合本文中所公开的实施例描述的各实例的单元及方法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已按照功能一般性地描述了各示例的组成及步骤。这些功能是以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。本领域普通技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不认为超出本发明的范围。
本领域普通技术人员可以理解上述方法中的全部或部分步骤可通过程序来指令相关硬件完成,所述程序可以存储于计算机可读存储介质中,如:只读存储器、磁盘或光盘等。可选地,上述实施例的全部或部分步骤也可以使用一个或多个集成电路来实现,相应地,上述实施例中的各模块/单元可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。本发明不限制于任何特定形式的硬件和软件的结合。
最后应说明的是:以上所述实施例,仅为本发明的具体实施方式,用以说明本发明的技术方案,而非对其限制,本发明的保护范围并不局限于此,尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本发明实施例技术方案的精神和范围,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应所述以权利要求的保护范围为准。
Claims (10)
1.一种数字化档案纠偏矫正方法,其特征在于,包含如下内容:
读取扫描的待纠偏校正的档案图像,并对档案图像进行预处理,所述预处理至少包含:白边裁剪和灰度化处理;
利用傅里叶变换获取预处理后的档案图像倾斜角α,通过边界拟合来确定档案图像外边界线和倾斜角β,并利用空间仿射变换对档案图像倾斜进行修正;
提取档案图像中的文字图片列表,并利用预设的偏旁组件和/或文字组件对档案图像中文字图片进行匹配,确定档案图像上下倒置情况,并对倒置档案图像进行翻转来获取文字内容正向且倾斜角度符合规范要求的档案图像。
2.根据权利要求1所述的数字化档案纠偏矫正方法,其特征在于,利用傅里叶变换获取档案图像的倾斜角度中,首先,通过对档案图像进行二维离散傅里叶变换得到档案图像的频域分布图;接着,利用霍夫变换检测直线,将直线绘制在频域分布图上,得到对应的频域图;通过遍历频域图全图连通域来消除频域图上噪声,并通过频道分离来获取偏斜基图和偏斜辅图,利用偏斜基图和偏斜幅图来获取档案图像倾斜角α。
3.根据权利要求2所述的数字化档案纠偏矫正方法,其特征在于,利用偏斜基图和偏斜幅图来获取档案图像偏斜角度的过程,包含如下内容:利用FAST特征检测来获取偏斜基图特征分布图,依据特征点分布图来计算各直线端点坐标;在偏斜辅图中,依据预设的倾斜判定条件判定档案图像是否符合倾斜要求,对不符合倾斜要求的档案图像,通过档案水平直线斜率夹角和档案垂直直线斜率夹角来获取档案图像倾斜角度,其中,预设的倾斜判定条件为水平垂直标记位为真且偏斜基图最大外接矩形面积符合预设面积区域要求。
4.根据权利要求1所述的数字化档案纠偏矫正方法,其特征在于,通过边界拟合来确定档案图像外边界线,首先,对预处理后的灰度化档案图像进行二值化处理,裁剪档案图像每个顶角矩形块,依据矩形块平均值来判定档案图像是否存在黑边;接着,依据预设颜色像素点和对应像素点坐标来定位档案图像边界位置并绘制边界散列点集;然后,利用最小二乘法拟合档案图像边界线,并利用拟合直线斜率来计算档案图像外边框倾斜角β。
5.根据权利要求4所述的数字化档案纠偏矫正方法,其特征在于,利用最小二乘法拟合档案图像边界线的过程包含如下内容:首先,利用档案图像各顶点到边界散列点最短距离来确定区域关节点,通过将区域关节点分别与档案图像中心点连线来将档案图像进行区域划分,每个区域中设置有一条直线,且在直线拟合过程中,将其他区域和当前直线拟合区域最近两个顶点组合形成遮罩多边形,并将该多边形与散列点图像与或获取对应方向点集;利用最小二乘法对方向点集拟合得到拟合直线方程。
6.根据权利要求4所述的数字化档案纠偏矫正方法,其特征在于,利用拟合直线斜率来计算档案图像外边框倾斜角度中,首先将拟合直线斜率转换成方向标识,依据方向标识来获取档案图像倾斜方向,并将拟合直线斜率转换成水平方向的夹角;然后,通过最短距离公式获取水平方向夹角中两个最相似角,并依据该两个最相似角获取水平方向倾斜角;最后,依据倾斜角和倾斜方向来确定档案图像倾斜角度。
7.根据权利要求1所述的数字化档案纠偏矫正方法,其特征在于,提取档案图像中的文字信息,首先,标定档案图像中每一个文字,通过检查标定框是否符合文字尺寸来对文字标定框进行筛选过滤,然后,对筛选过滤后的文字标定框进行裁剪,获取文字图片列表。
8.根据权利要求1所述的数字化档案纠偏矫正方法,其特征在于,利用预设的偏旁组件和/或文字组件对档案图像中文字信息进行匹配来确定档案图像上下倒置情况中,首先,依据组件类型和预设占比生成遮挡矩形区域,并依据遮挡后的图片来确定文字偏旁外接矩形,并依据外接矩形大小和组件规格计算组件图像缩放比例;然后,依据模板匹配方法将提取的档案文字图片与组件图像进行正反倒置两个方向下的模板相似度匹配,分别统计档案图片中文字与正、反模板相似度高的个数,最后通过其个数判定档案图像是否倒置。
9.根据权利要求1或7或8所述的数字化档案纠偏矫正方法,其特征在于,获取预设的偏旁组件和/或文字组件中,采用人事档案数字化技术规范中规定的字体来绘制对应尺寸规格要求的偏旁组件图片和文字组件图片,并通过掩膜操作和占比率设置将偏旁组件图片和文字组件图片转换为预设背景和占比要求的图片数据;通过对图片数据进行FAST特征检测来生成对应特征关键点图,依据预设的偏旁类型和文字类型生成组件列表配置文件,以利用配置文件来获取预设的偏旁组件和文字组件。
10.一种数字化档案纠偏矫正系统,其特征在于,包含:图像数据读取模块、图像角度修正模块和图像方向翻转模块,其中,
图像数据读取模块,用于读取扫描的待纠偏校正的档案图像,并对档案图像进行预处理,所述预处理至少包含:白边裁剪和灰度化处理;
图像角度修正模块,用于利用傅里叶变换获取预处理后的档案图像倾斜角α,通过边界拟合来确定档案图像外边界线和倾斜角β,并利用空间仿射变换对档案图像倾斜进行修正;
图像方向翻转模块,用于提取档案图像中的文字图片列表,并利用预设的偏旁组件和/或文字组件对档案图像中文字图片进行匹配,确定档案图像上下倒置情况,并对倒置档案图像进行翻转来获取文字内容正向且倾斜角度符合规范要求的档案图像。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211147662.2A CN115619656A (zh) | 2022-09-19 | 2022-09-19 | 数字化档案纠偏矫正方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211147662.2A CN115619656A (zh) | 2022-09-19 | 2022-09-19 | 数字化档案纠偏矫正方法及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115619656A true CN115619656A (zh) | 2023-01-17 |
Family
ID=84859524
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211147662.2A Pending CN115619656A (zh) | 2022-09-19 | 2022-09-19 | 数字化档案纠偏矫正方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115619656A (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115995080A (zh) * | 2023-03-22 | 2023-04-21 | 曲阜市检验检测中心 | 基于ocr识别的档案智能管理系统 |
CN116187717A (zh) * | 2023-04-24 | 2023-05-30 | 四川金投科技股份有限公司 | 一种档案入库管理方法及系统 |
CN116433494A (zh) * | 2023-04-19 | 2023-07-14 | 南通大学 | 一种基于深度学习的档案扫描图像自动纠偏裁边方法 |
CN117671714A (zh) * | 2023-12-13 | 2024-03-08 | 江苏中博通信有限公司 | 一种构建全生命周期的智慧档案管理方法及系统 |
-
2022
- 2022-09-19 CN CN202211147662.2A patent/CN115619656A/zh active Pending
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115995080A (zh) * | 2023-03-22 | 2023-04-21 | 曲阜市检验检测中心 | 基于ocr识别的档案智能管理系统 |
CN116433494A (zh) * | 2023-04-19 | 2023-07-14 | 南通大学 | 一种基于深度学习的档案扫描图像自动纠偏裁边方法 |
CN116433494B (zh) * | 2023-04-19 | 2024-02-02 | 南通大学 | 一种基于深度学习的档案扫描图像自动纠偏裁边方法 |
CN116187717A (zh) * | 2023-04-24 | 2023-05-30 | 四川金投科技股份有限公司 | 一种档案入库管理方法及系统 |
CN116187717B (zh) * | 2023-04-24 | 2023-07-11 | 四川金投科技股份有限公司 | 一种档案入库管理方法及系统 |
CN117671714A (zh) * | 2023-12-13 | 2024-03-08 | 江苏中博通信有限公司 | 一种构建全生命周期的智慧档案管理方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111814722B (zh) | 一种图像中的表格识别方法、装置、电子设备及存储介质 | |
CN115619656A (zh) | 数字化档案纠偏矫正方法及系统 | |
US6898316B2 (en) | Multiple image area detection in a digital image | |
US10289924B2 (en) | System and method for scanned document correction | |
US8331670B2 (en) | Method of detection document alteration by comparing characters using shape features of characters | |
JP2012243307A (ja) | 入力画像における歪を検出する方法、入力画像における歪を検出する装置およびコンピューター読み取り可能な媒体 | |
JP3278471B2 (ja) | 領域分割方法 | |
CN111353961B (zh) | 一种文档曲面校正方法及装置 | |
JPH03201866A (ja) | 圧縮形態のデータを含むデータから画像スキュー角度を決定する方法 | |
JP2009020613A (ja) | 画像処理プログラム、画像処理方法及び画像処理装置 | |
JP4419269B2 (ja) | 二次元コード抽出方法 | |
US6771842B1 (en) | Document image skew detection method | |
JP4013060B2 (ja) | 画像補正方法および画像補正装置 | |
US20130050765A1 (en) | Method and apparatus for document authentication using image comparison on a block-by-block basis | |
CN112800824A (zh) | 扫描文件的处理方法、装置、设备及存储介质 | |
JP4208520B2 (ja) | 画像処理装置および画像処理方法、プログラムおよび記憶媒体 | |
JP3006466B2 (ja) | 文字入力装置 | |
JP3303246B2 (ja) | 画像処理装置 | |
CN102682308B (zh) | 图像处理方法和图像处理设备 | |
KR100603618B1 (ko) | 어파인 변환을 이용한 문서 영상의 기하학적 왜곡 보정장치 및 방법 | |
JP2006229685A (ja) | 帳票歪み判定装置 | |
JP2004094427A (ja) | 帳票画像処理装置及び該装置を実現するためのプログラム | |
JPH11288453A (ja) | 再生用のスキャン環境における原稿画像のスキュ―角度および黒い境界線を検出する方法およびシステム | |
JP5418057B2 (ja) | 画像処理装置及びコンピュータプログラム | |
CN113077390B (zh) | 一种基于深度学习的图像摆正方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |