CN112241737B - 文字图像校正方法和装置 - Google Patents
文字图像校正方法和装置 Download PDFInfo
- Publication number
- CN112241737B CN112241737B CN202011262934.4A CN202011262934A CN112241737B CN 112241737 B CN112241737 B CN 112241737B CN 202011262934 A CN202011262934 A CN 202011262934A CN 112241737 B CN112241737 B CN 112241737B
- Authority
- CN
- China
- Prior art keywords
- binary image
- sequence
- image
- row
- frequency
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 43
- 238000003702 image correction Methods 0.000 title claims abstract description 31
- 238000009825 accumulation Methods 0.000 claims abstract description 32
- 238000007781 pre-processing Methods 0.000 claims abstract description 11
- 230000001186 cumulative effect Effects 0.000 claims description 39
- 238000004364 calculation method Methods 0.000 claims description 23
- 238000001914 filtration Methods 0.000 claims description 14
- 238000012935 Averaging Methods 0.000 claims description 11
- 239000013598 vector Substances 0.000 claims description 8
- 238000000605 extraction Methods 0.000 claims description 6
- 238000005070 sampling Methods 0.000 claims description 6
- 238000009499 grossing Methods 0.000 claims description 5
- 238000010183 spectrum analysis Methods 0.000 claims description 5
- 238000004590 computer program Methods 0.000 claims description 3
- 125000003275 alpha amino acid group Chemical group 0.000 description 7
- 238000004458 analytical method Methods 0.000 description 7
- 150000001875 compounds Chemical class 0.000 description 7
- 238000004422 calculation algorithm Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 239000011159 matrix material Substances 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 238000004891 communication Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000001831 conversion spectrum Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/24—Aligning, centring, orientation detection or correction of the image
- G06V10/243—Aligning, centring, orientation detection or correction of the image by compensating for image skew or non-uniform image deformations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/34—Smoothing or thinning of the pattern; Morphological operations; Skeletonisation
Abstract
本发明公开了一种文字图像校正方法,同时公开了相应的文字图像校正装置。该方法所使用的行向累积曲线的频率信息对倾斜角补偿角度和真实倾斜角之前的误差敏感,具有很好的鲁棒性。利用本发明,可以较准确地估计出倾斜角的补偿角度,并且校正倾斜的文字图片。本发明可以应用到图像预处理、扫描文字图像角度自动补偿,手机拍照倾斜角自动补偿等场景中。
Description
技术领域
本发明涉及一种文字图像校正方法,同时涉及相应的文字图像校正装置,属于图像校正技术领域。
背景技术
随着数字技术的发展和数字办公系统的普及,在工作或者日常生活中,人们常常使用手机拍摄纸质文件,直接共享给他人;或者上传至业务系统进行进一步自动的校验、识别等后续处理。拍照分享文件让人们的生活更加便利、业务办理更加简化和智能。
但是在拍摄纸质文件的过程中,因为人为或非人为的原因,很容易导致拍摄所得的文件图片中的文字倾斜。这种文字倾斜的文件图片会影响打印出来的阅读效果,或者在上传至业务系统后,给后续处理造成困难,甚至完全不能被校验和识别。
发明内容
本发明所要解决的首要技术问题在于提供一种文字图像校正方法。
本发明所要解决的另一技术问题在于提供一种文字图像校正装置。
为了实现上述目的,本发明采用下述的技术方案:
根据本发明实施例的第一方面,提供一种文字图像校正方法,包括如下步骤:
将待校正图像预处理为二值图像;
以预定步长,将二值图像按同一方向依次旋转,在每次旋转后,记录累积旋转角度,并计算当前二值图像的行向累积量,直至当前二值图像旋转至阈值角度;
针对每张二值图像的行向累积量提取满足预设条件的频率;
在各二值图像满足预设条件的各频率中,将最高频率所对应的累积旋转角度,作为补偿角度对待校正图像进行校正。
其中较优地,所述将待校正图像预处理为二值图像,具体包括:
转化待校正图像为灰度图像;
基于最大类间差法,将灰度图像转化为二值图像。
其中较优地,所述计算当前二值图像的行向累积量,具体包括:
针对当前二值图像,计算每一行的行向累积量;
将各行的行向累积量按顺序构建列向量St,作为当前二值图像的行向累积量;
所述每一行的行向累积量的计算式为:
上式中,为当前二值图像Dt中第i行的行向累积量,/>为当前二值图像Dt中第i行第j列的元素。
其中较优地,所述针对每张二值图像的行向累积量提取满足预设条件的频率,具体包括:
针对当前二值图像的行向累积量,进行滑动窗平滑滤波,得到对应滤波序列Qt;
对滤波序列Qt进行去均值处理,得到对应去均值序列Ht;
针对去均值序列Ht进行频谱分析,得到离散序列Pt;
提取离散序列Pt中满足预设条件的频率ft。
其中较优地,所述滤波序列Qt的计算式为:
上式中,为Qt的第i个元素,L为滑动窗的宽度,/>为当前二值图像Dt中第i+j行的行向累积量。
其中较优地,所述去均值序列Ht的计算式为:
上式中,为去均值序列Ht的第i个元素,M(*)表示计算输入序列的均值。
其中较优地,所述离散序列Pt的计算式为:
上式中,为去均值序列Ht的第j个元素,/>为离散序列Pt的第k个元素,N为大于序列Ht长度的最小的2的幂数。
其中较优地,所述满足预设条件的频率ft的计算式为:
上式中,Fs为当前二值图像的行向累积量的采样率,为可配系统参数。
其中较优地,所述将二值图像按同一方向依次旋转的计算式为:
上式中,为旋转后的二值图像在第x行y列的元素,θt为旋转后二值图像的旋转角度,/>为旋转前的二值图像在第i行j列的元素,<*>表示对结果四舍五入取整。
根据本发明实施例的第二方面,提供一种文字图像校正装置,包括处理器和存储器,所述处理器读取所述存储器中的计算机程序,用于执行以下操作:
将待校正图像预处理为二值图像;
以预定步长,将二值图像按同一方向依次旋转,在每次旋转后,记录累积旋转角度,并计算当前二值图像的行向累积量,直至当前二值图像旋转至阈值角度;
针对每张二值图像的行向累积量提取满足预设条件的频率;
在各二值图像满足预设条件的各频率中,将最高频率所对应的累积旋转角度,作为补偿角度对待校正图像进行校正。
与现有技术相比较,本发明所提供的文字图像校正方法和装置可以较准确地估计出倾斜角的补偿角度,并且校正倾斜的文字图片。本发明可应用到图像预处理、扫描文字图像角度自动补偿,手机拍照倾斜角自动补偿等场景中。
附图说明
图1为本发明实施例提供的文字图像校正方法的流程图;
图2为本发明实施例中,图像校正过程的流程示意图;
图3为本发明实施例中,提取二值图像行向累积量频率的流程示意图;
图4(a)为本发明实施例中,二值图像旋转0.5度后的示例图;
图4(b)为本发明实施例中,二值图像旋转0.5度后行向累积变量的频率分析曲线;
图4(c)为本发明实施例中,二值图像旋转0.5度后行向累积变量的变化曲线;
图5(a)为本发明实施例中,二值图像旋转8.5度后的示例图;
图5(b)为本发明实施例中,二值图像旋转8.5度后行向累积变量的频率分析曲线;
图5(c)为本发明实施例中,二值图像旋转8.5度后行向累积变量的变化曲线;
图6(a)为本发明实施例中,二值图像旋转69.5度后的示例图;
图6(b)为本发明实施例中,二值图像旋转69.5度后行向累积变量的频率分析曲线;
图6(c)为本发明实施例中,二值图像旋转69.5度后行向累积变量的变化曲线;
图7为本发明实施例中,累积旋转角度和对应二值图像行向累积量的关系曲线;
图8为本发明实施例提供的文字图像校正装置的结构示意图。
具体实施方式
下面结合附图和具体实施例对本发明的技术内容进行详细具体的说明。
如图1所示,本发明实施例提供的文字图像校正方法,主要包括如下步骤:
101、将待校正图像预处理为二值图像;具体地:
1011、转化待校正图像为灰度图像;
如图2所示,读取待校正图像(原文字图像)Do,设定数字图像对应数据矩阵Do的维度为m×n×3,其中m和n分别为待校正图像Do的高度和宽度对应的像素点的个数。
一般情况下,待校正图像Do为彩色的,由r/g/b三个颜色通道的数据表示,其维度都为m×n。
按下式,将待校正图像Do转换为灰度图像Dg:
Dg=0.2989*R+0.5870*G+0.1140*B (1)
式(1)中,R/G/B分别代表原彩色图像Do中的红色、绿色以及蓝色分量,其矩阵各个元素取值和原彩色图像关系如下:
式(2)中,r(i,j)、g(i,j)和b(i,j)分别表示R/G/B矩阵中的第i行第j列的元素。
1012、基于最大类间差法,将灰度图像转化为二值图像。
获取到灰度图像Dg后,为了祛除拍摄环境背景光线对于文字区域判定的影响,进一步采用最大类间方差法计算一个合适的阈值T,然后按下式将其转化为二值图像Db,表达式为:
式(3)中,和/>分别表示Dg和的Db第i行第j列的元素。
最大类间差方法又名Ostu方法,是一个经典的常用的阈值选择算法。其通过统计整个图像的直方图特性来实现全局阈值T的自动选取,其算法步骤为:
Step1、先计算图像的直方图,即将图像所有的像素点按照0~255共256个bin,统计落在每个bin的像素点数量;
Step2、归一化直方图,也即将每个bin中像素点数量除以总的像素点;
Step3、i表示分类的阈值,也即一个灰度级,从0开始迭代;
Step4、通过归一化的直方图,统计0~i灰度级的像素(假设像素值在此范围的像素叫做前景像素)所占整幅图像的比例w0,并统计前景像素的平均灰度u0;统计i~255灰度级的像素(假设像素值在此范围的像素叫做背景像素)所占整幅图像的比例w1,并统计背景像素的平均灰度u1;
Step5、计算前景像素和背景像素的方差g=w0*w1*(u0-u1)(u0-u1);
Step6、i++;转到4,直到i为256时结束迭代;
Step7、将最大g相应的i值作为图像的全局阈值。
102、以预定步长,将二值图像按同一方向依次旋转,在每次旋转后,记录累积旋转角度,并计算当前二值图像的行向累积量,直至当前二值图像旋转至阈值角度;
为了提取不同旋转角度下的图像文字和留白的分布信息,需要将二值图像Db遍历性的旋转一定的角度,然后通过计算行向累积量将二维信息降维到一维空间,再对所得行向累积量进行频谱分析,提取出较强的几个频率分量并存储供后续分析。
如图3所示,以角度为θΔ步长,将二值图像Db按同一方向依次旋转,使二值图像Db的累积旋转角度θt由0度增加到θmax。其中θΔ和θmax是可配置的算法参数,本实施中θΔ为0.5度,θmax为180度。
在本发明的一个实施例中,同一方向为顺时针方向或逆时针方向。由于待校正图像Do是顺时针倾斜或逆时针倾斜,在按某一方向依次旋转180度的过程中,总会有唯一使图像中文字水平的角度对应。
在本发明的一个实施例中,步长θΔ决定了倾斜角度估计的精度,决定了系统误差的大小,也影响着整个算法的计算复杂度和时延。假设二值图像Db旋转的累积角度为θt(从0度开始每次增加0.5度至θt),记经过旋转的当前图像为Dt,旋转过程为:
式(4)中,为旋转后的二值图像在第x行y列的元素,θt为旋转后二值图像的旋转角度,/>为旋转前的二值图像在第i行j列的元素,<*>表示对结果四舍五入取整。
得到旋转后的二值图像后,就可计算该图像的行向累积量,记为St;
1021、针对当前二值图像,计算每一行的行向累积量;
所述每一行的行向累积量的计算式为:
式(5)中,为当前二值图像Dt中第i行的行向累积量,/>为当前二值图像Dt中第i行第j列的元素。
1022、将各行的行向累积量按顺序构建列向量St,作为当前二值图像的行向累积量。
假设在本发明的一个实施例中,待校正图像Do为顺时针倾斜8.5度。在将对应二值图像Db逆时针旋转0.5度,即θt=0.5度时,二值图像Db的行向累积变量的变化曲线如图4(c)所示;当θt=8.5度时,二值图像Db的行向累积变量的变化曲线如图5(c)所示;当θt=69.5度时,二值图像Db的行向累积变量的变化曲线如图6(c)所示。若当θt=0.5度、θt=8.5度和θt=69.5度时,对应的St都为采样率为Fs下对二值图像Db的列向采样所得,则从其对应的行向累积变量变化曲线中可以看出,在不同旋转角度下,二值图像行向累积变量变化曲线的变化明显。当累积旋转角度θt等于或接近真实倾斜角度8.5度时,二值图像行向累积变量变化曲线分布均匀且对应频率值明显升高。由此,从二值图像行向累积变量变化曲线的规律中可以判定文字是否是水平。
103、针对每张二值图像的行向累积量提取满足预设条件的频率;具体地:
1031、针对当前二值图像的行向累积量,进行滑动窗平滑滤波,得到对应滤波序列Qt;
如图3所示,为了防止图像噪点的影响,首先对当前二值图像Db的行向累积变量St进行滑动窗平滑滤波,以祛除部分毛刺,得到对应滤波序列Qt。所述滤波序列Qt的计算式为:
式(6)中,为Qt的第i个元素,L为滑动窗的宽度,/>为当前二值图像Dt中第i+j行的行向累积量。
在本发明的一个实施例中,当滑动窗超出St的实际长度后,窗内的无效元素默认为0。
1032、对滤波序列Qt进行去均值处理,得到对应去均值序列Ht;
为了防止直流信号对后续的频率分析的影响,对滤波序列Qt进行去均值处理;所述去均值序列Ht的计算式为:
式(7)中,为去均值序列Ht的第i个元素,M(*)表示计算输入序列的均值。
1033、针对去均值序列Ht进行频谱分析,得到离散序列Pt;
对去均值序列Ht进行DFT变换频谱分析:所述离散序列Pt的计算式为:
式(8)中,为去均值序列Ht的第j个元素,/>为离散序列Pt的第k个元素,N为大于序列Ht长度的长度的最小的2的幂数。
在本发明的一个实施例中,离散序列Pt描述了不同频率分量对去均值序列Ht的贡献大小,对应到当前二值图像Dt中文字和留白之间规律分布的概率的大小。则通过对St进行频率分析,就可以获取到随着累积旋转角度变化,二值图像Dt中文字和留白在行方向上的变化规律信息,如图4(c)至6(c)所示。
1034、提取离散序列Pt中满足预设条件的频率ft。
提取Pt中主要的频率分量,如式(9)所示,找出所有满足条件的k,然后将其转化为对应的频率。找出所有满足条件的ft,组成输出向量Ft。
所述满足预设条件的频率ft的计算式为:
式(9)中,Fs为当前二值图像的行向累积量的采样率,为可配系统参数。在本发明的一个实施例中,采样率Fs为算法参数,取值为50Hz。/>主要用来确定频率贡献大小的标准,值为15。/>太小会导致误判的频率分量增多;反之,如果太大,可能遗漏信息频率分量。其设置的最佳效果应该是每次旋转都能选出1~2个贡献明显较大的频率分量。
提取当前二值图像Dt满足预设条件的频率后,将满足预设条件的频率与对应记录的累积旋转角度θt关联;然后按步长θΔ更新θt:
θt:=θt+θΔ (10)
进入下一个二值图像Dt所对应的提取计算过程中,直至θt=180度结束。
104、在各二值图像满足预设条件的各频率中,将最高频率所对应的累积旋转角度,作为补偿角度对待校正图像进行校正。
理想情况下,如果二值图像中文字没有倾斜,则对应的图像的行向累积曲线应该是按图5(c)规律振荡的趋势,具有很好的频率特性。反之,如果可以在不同的旋转角度下提取出图像行向累积曲线的频率信息,也可以估计出文字的倾斜角度。
将各二值图像的输出向量Ft首尾拼接而组成的频率成分序列°F,从°F的各元素中搜索最高频率,然后从记录的各累积旋转角度中,获取最高频率所对应的累积旋转角度,作为补偿角度:
在获取补偿角度后,将未旋转前的二值图像Db旋转/>输出校正后二值图像/>
式(12)中,分别表示图像矩阵Db第i行第j列的元素、/>第x行第y列的元素。
在本发明的一个实施例中,待校正图像Do为顺时针倾斜8.5度,获取补偿角度为8.5度后,也可以将待校正图像Do逆时针旋转8.5度。
以下结合应用实例,对上述技术方案进行详细说明:
获取待校正图像Do,转换为二值图像Db。二值图像Db顺时针倾斜8.5度。将二值图像Db以步长为0.5度,逆时针旋转180度:
当二值图像Db逆时针旋转0.5度后,当前二值图像Dt的示例图如图4(a)所示,当前二值图像Dt中文字依然倾斜。对θt=0.5度的二值图像Dt计算对应行向累积量St,然后针对该行向累积量St提取频率分量,如图4(c)所示,然后得到对应输出向量Ft,如图4(b),可以看到当θt=0.5度时,最高频率为0.073242Hz。
将二值图像Db继续逆时针旋转,当旋转至8.5度后,当前二值图像D的示例图如图5(a)所示,当前二值图像Dt文字水平。对θt=8.5度的二值图像Dt计算对应行向累积量St,然后针对该行向累积量St提取频率分量,如图5(c)所示,然后得到对应输出向量Ft,如图5(b),可以看到当θt=8.5度时,最高频率为1.001Hz,大于0.073242Hz。
将二值图像Db继续逆时针旋转,当旋转至69.5度后,当前二值图像Dt的示例图如图6(a)所示,当前二值图像Dt中文字严重倾斜。对θt=69.5度的二值图像Dt计算对应行向累积量St,然后针对该行向累积量St提取频率分量,如图6(c)所示,然后得到对应输出向量Ft,如图6(b),可以看到当θt=69.5度时,最高频率为0.24414Hz,小于1.001Hz。
如图7所示,最高点表示θt=8.5度,由此,在旋转角度靠近或等于真实的倾斜补偿角度的时候,二值图像的行向累积曲线的主要贡献频率明显变高。
由此可知,在二值图像Dt中文字水平时,对应的最高频率是在旋转过程中产生的所有频率中最高的,从而验证了本文字图像校正方法的合理性。
为实现本发明所提供的文字图像校正方法,本发明还提供一种文字图像校正装置。如图8所示,该文字图像校正装置包括处理器82和存储器81,还可以根据实际需要进一步包括通信组件、传感器组件、电源组件、多媒体组件及输入/输出接口。其中,存储器、通信组件、传感器组件、电源组件、多媒体组件及输入/输出接口均与该处理器82连接。
在上述文字图像校正装置中,所述处理器82读取所述存储器81中的计算机程序,用于执行以下操作:
将待校正图像预处理为二值图像;
以预定步长,将二值图像按同一方向依次旋转,在每次旋转后,记录累积旋转角度,并计算当前二值图像的行向累积量,直至当前二值图像旋转至阈值角度;
针对每张二值图像的行向累积量提取满足预设条件的频率;
在各二值图像满足预设条件的各频率中,将最高频率所对应的累积旋转角度,作为补偿角度对待校正图像进行校正。
本发明所提供的文字图像校正方法和装置可以较准确地估计出倾斜角的补偿角度,并且校正倾斜的文字图片。所使用的行向累积曲线的频率信息对倾斜角补偿角度和真实倾斜角之前的误差敏感,具有很好的鲁棒性。本发明可以应用到图像预处理、扫描文字图像角度自动补偿,手机拍照倾斜角自动补偿等场景中。
上面对本发明所提供的文字图像校正方法和装置进行了详细的说明。对本领域的一般技术人员而言,在不背离本发明实质内容的前提下对它所做的任何显而易见的改动,都将构成对本发明专利权的侵犯,将承担相应的法律责任。
Claims (5)
1.一种文字图像校正方法,其特征在于包括如下步骤:
将待校正图像预处理为二值图像;
以预定步长,将二值图像按同一方向依次旋转,在每次旋转后,记录累积旋转角度,并计算当前二值图像的行向累积量,直至当前二值图像旋转至阈值角度;
针对每张二值图像的行向累积量提取满足预设条件的频率;
在各二值图像满足预设条件的各频率中,将最高频率所对应的累积旋转角度,作为补偿角度对待校正图像进行校正,
所述针对每张二值图像的行向累积量提取满足预设条件的频率,进一步包括:
针对当前二值图像的行向累积量,进行滑动窗平滑滤波,得到对应滤波序列Qt;
对滤波序列Qt进行取均值处理,得到对应去均值序列Ht;
针对去均值序列Ht进行频谱分析,得到离散序列Pt;
提取离散序列Pt中满足预设条件的频率ft,
其中,所述滤波序列Qt的计算式为:
上式中,为Qt的第i个元素,L为滑动窗的宽度,/>为当前二值图像Dt中第i+j行的行向累积量,
所述去均值序列Ht的计算式为:
上式中,为去均值序列Ht的第i个元素,M(*)表示计算输入序列的均值;
所述离散序列Pt的计算式为:
上式中,为去均值序列Ht的第j个元素,/>为离散序列Pt的第k个元素,N为大于序列Ht长度的最小的2的幂数,i表示虚数单位;
所述满足预设条件的频率ft的计算式为:
上式中,Fs为当前二值图像的行向累积量的采样率,为可配系统参数。
2.如权利要求1所述的文字图像校正方法,其特征在于所述将待校正图像预处理为二值图像,进一步包括:
转化待校正图像为灰度图像;
基于最大类间差法,将灰度图像转化为二值图像。
3.如权利要求1所述的文字图像校正方法,其特征在于所述计算当前二值图像的行向累积量,进一步包括:
针对当前二值图像,计算每一行的行向累积量;
将各行的行向累积量按顺序构建列向量St,作为当前二值图像的行向累积量;
所述每一行的行向累积量的计算式为:
上式中,为当前二值图像Dt中第i行的行向累积量,/>为当前二值图像Dt中第i行第j列的元素。
4.如权利要求1所述的文字图像校正方法,其特征在于所述将二值图像按同一方向依次旋转的计算式为:
上式中,为旋转后的二值图像在第x行y列的元素,θt为旋转后二值图像的旋转角度,/>为旋转前的二值图像在第i行j列的元素,<*>表示对结果四舍五入取整。
5.一种文字图像校正装置,其特征在于包括:处理器和存储器,所述处理器读取所述存储器中的计算机程序,用于执行以下操作:
将待校正图像预处理为二值图像;
以预定步长,将二值图像按同一方向依次旋转,在每次旋转后,记录累积旋转角度,并计算当前二值图像的行向累积量,直至当前二值图像旋转至阈值角度;
针对每张二值图像的行向累积量提取满足预设条件的频率;
在各二值图像满足预设条件的各频率中,将最高频率所对应的累积旋转角度,作为补偿角度对待校正图像进行校正,
所述针对每张二值图像的行向累积量提取满足预设条件的频率,进一步包括:
针对当前二值图像的行向累积量,进行滑动窗平滑滤波,得到对应滤波序列Qt;
对滤波序列Qt进行取均值处理,得到对应去均值序列Ht;
针对去均值序列Ht进行频谱分析,得到离散序列Pt;
提取离散序列Pt中满足预设条件的频率ft,
其中,所述滤波序列Qt的计算式为:
上式中,为Qt的第i个元素,L为滑动窗的宽度,/>为当前二值图像Dt中第i+j行的行向累积量,
所述去均值序列Ht的计算式为:
上式中,为去均值序列Ht的第i个元素,M(*)表示计算输入序列的均值;
所述离散序列Pt的计算式为:
上式中,为去均值序列Ht的第j个元素,/>为离散序列Pt的第k个元素,N为大于序列Ht长度的最小的2的幂数,i表示虚数单位;
所述满足预设条件的频率ft的计算式为:
上式中,Fs为当前二值图像的行向累积量的采样率,为可配系统参数。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011262934.4A CN112241737B (zh) | 2020-11-12 | 2020-11-12 | 文字图像校正方法和装置 |
PCT/CN2021/130369 WO2022100698A1 (zh) | 2020-11-12 | 2021-11-12 | 文字图像校正方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011262934.4A CN112241737B (zh) | 2020-11-12 | 2020-11-12 | 文字图像校正方法和装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112241737A CN112241737A (zh) | 2021-01-19 |
CN112241737B true CN112241737B (zh) | 2024-01-26 |
Family
ID=74166761
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011262934.4A Active CN112241737B (zh) | 2020-11-12 | 2020-11-12 | 文字图像校正方法和装置 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN112241737B (zh) |
WO (1) | WO2022100698A1 (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112241737B (zh) * | 2020-11-12 | 2024-01-26 | 瞬联软件科技(北京)有限公司 | 文字图像校正方法和装置 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6804414B1 (en) * | 1998-05-01 | 2004-10-12 | Fujitsu Limited | Image status detecting apparatus and document image correcting apparatus |
CN102496018A (zh) * | 2011-12-08 | 2012-06-13 | 方正国际软件有限公司 | 一种文档倾斜检测方法及系统 |
CN107992869A (zh) * | 2016-10-26 | 2018-05-04 | 深圳超多维科技有限公司 | 用于倾斜文字校正的方法、装置及电子设备 |
CN109583445A (zh) * | 2018-11-26 | 2019-04-05 | 平安科技(深圳)有限公司 | 文字图像校正处理方法、装置、设备及存储介质 |
CN111260569A (zh) * | 2020-01-10 | 2020-06-09 | 百度在线网络技术(北京)有限公司 | 图像倾斜校正的方法、装置、电子设备和存储介质 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3471578B2 (ja) * | 1997-08-29 | 2003-12-02 | シャープ株式会社 | 行方向判定装置、画像傾き検出装置及び画像傾き補正装置 |
CN112241737B (zh) * | 2020-11-12 | 2024-01-26 | 瞬联软件科技(北京)有限公司 | 文字图像校正方法和装置 |
-
2020
- 2020-11-12 CN CN202011262934.4A patent/CN112241737B/zh active Active
-
2021
- 2021-11-12 WO PCT/CN2021/130369 patent/WO2022100698A1/zh active Application Filing
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6804414B1 (en) * | 1998-05-01 | 2004-10-12 | Fujitsu Limited | Image status detecting apparatus and document image correcting apparatus |
CN102496018A (zh) * | 2011-12-08 | 2012-06-13 | 方正国际软件有限公司 | 一种文档倾斜检测方法及系统 |
CN107992869A (zh) * | 2016-10-26 | 2018-05-04 | 深圳超多维科技有限公司 | 用于倾斜文字校正的方法、装置及电子设备 |
CN109583445A (zh) * | 2018-11-26 | 2019-04-05 | 平安科技(深圳)有限公司 | 文字图像校正处理方法、装置、设备及存储介质 |
CN111260569A (zh) * | 2020-01-10 | 2020-06-09 | 百度在线网络技术(北京)有限公司 | 图像倾斜校正的方法、装置、电子设备和存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN112241737A (zh) | 2021-01-19 |
WO2022100698A1 (zh) | 2022-05-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109657665B (zh) | 一种基于深度学习的发票批量自动识别系统 | |
US6985631B2 (en) | Systems and methods for automatically detecting a corner in a digitally captured image | |
CN108921161B (zh) | 模型训练方法、装置、电子设备和计算机可读存储介质 | |
WO2019233393A1 (zh) | 图像处理方法和装置、存储介质、电子设备 | |
CN112560861B (zh) | 票据处理方法、装置、设备及存储介质 | |
CN100502471C (zh) | 图像处理装置、图像处理方法和成像装置 | |
CN109344820B (zh) | 基于计算机视觉和深度学习的数字式电表读数识别方法 | |
US8107738B2 (en) | Image processing method, image processing apparatus, image forming apparatus, image reading apparatus and memory product | |
CN110188747A (zh) | 一种文本图像的倾斜校正方法、装置以及图像处理设备 | |
CN114283156B (zh) | 一种用于去除文档图像颜色及手写笔迹的方法及装置 | |
US20100246972A1 (en) | Image processing apparatus, image processing method, and recording medium | |
US8594446B2 (en) | Method for enhancing a digitized document | |
CN112241737B (zh) | 文字图像校正方法和装置 | |
US7986839B2 (en) | Image processing method, image processing apparatus, image forming apparatus, and storage medium | |
CN109543487B (zh) | 一种基于条码边缘分割的自动感应触发方法及其系统 | |
CN111063029A (zh) | 地图构建方法、装置、计算机可读存储介质及机器人 | |
CN110874814B (zh) | 一种图像处理方法、图像处理装置及终端设备 | |
CN107845080B (zh) | 卡片图像增强方法 | |
CN116128748A (zh) | 一种基于有效区域提取算法的鱼眼图像校正方法及系统 | |
CN110213457B (zh) | 一种图像传输方法及装置 | |
US20240161523A1 (en) | Text image correction method and apparatus | |
CN108596874B (zh) | 图像清晰判定方法、装置,以及计算机设备、产品 | |
US20060126931A1 (en) | Image processor for and method of performing tonal transformation on image data | |
CN117057377B (zh) | 码的识别匹配方法 | |
JP2000276581A (ja) | 画像処理装置および画像処理方法ならびに画像処理プログラムを記録した記録媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |