CN113537216B - 一种点阵字体文本行倾斜校正方法及装置 - Google Patents
一种点阵字体文本行倾斜校正方法及装置 Download PDFInfo
- Publication number
- CN113537216B CN113537216B CN202110829492.5A CN202110829492A CN113537216B CN 113537216 B CN113537216 B CN 113537216B CN 202110829492 A CN202110829492 A CN 202110829492A CN 113537216 B CN113537216 B CN 113537216B
- Authority
- CN
- China
- Prior art keywords
- text line
- angle
- dot
- corrected
- text
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 239000011159 matrix material Substances 0.000 title claims abstract description 101
- 238000000034 method Methods 0.000 title claims abstract description 50
- 230000001629 suppression Effects 0.000 claims description 15
- 230000009466 transformation Effects 0.000 claims description 15
- PXFBZOLANLWPMH-UHFFFAOYSA-N 16-Epiaffinine Natural products C1C(C2=CC=CC=C2N2)=C2C(=O)CC2C(=CC)CN(C)C1C2CO PXFBZOLANLWPMH-UHFFFAOYSA-N 0.000 claims description 7
- 238000001914 filtration Methods 0.000 claims description 6
- 238000000605 extraction Methods 0.000 claims description 2
- 238000010586 diagram Methods 0.000 description 7
- 230000000877 morphologic effect Effects 0.000 description 4
- 229910052704 radon Inorganic materials 0.000 description 4
- SYUHGPGVQRZVTB-UHFFFAOYSA-N radon atom Chemical compound [Rn] SYUHGPGVQRZVTB-UHFFFAOYSA-N 0.000 description 4
- 230000011218 segmentation Effects 0.000 description 4
- 238000007619 statistical method Methods 0.000 description 4
- 238000011426 transformation method Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000000513 principal component analysis Methods 0.000 description 2
- 238000012847 principal component analysis method Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
Landscapes
- Character Input (AREA)
Abstract
本申请提供一种点阵字体文本行倾斜校正方法及装置。所述方法包括:获取待校正点阵字体文本行图像;对所述待校正点阵字体文本行图像进行二值化处理,得到二值化图像;根据所述二值化图像获取点阵字体文本行的特征点数据;根据所述特征点数据进行倾斜角度搜索,获得倾斜校正角度;根据所述倾斜校正角度对所述待校正点阵字体文本行图像进行倾斜校正,得到校正图像。通过本申请提供的倾斜校正方法,首先对点阵字体文本行图像进行二值化处理,然后提取特征点数据,搜索得到倾斜校正角度,最后根据倾斜校正角度校正点阵字体文本行图像,调整点阵字体文本行中的字符沿垂直方向,从而实现对点阵字体文本行的倾斜校正。
Description
技术领域
本申请涉及图像识别技术领域,尤其涉及一种点阵字体文本行倾斜校正方法及装置。
背景技术
应用机器视觉代替人眼,高效识别图像中的文本已经成为自动化生产的重要组成部分。其中,字符识别(optical character recognise,OCR)技术可以对纸上的印刷及打印文字字符进行识别,将识别结果以文本方式存储在计算机器中。通过字符识别可将书面上不可编辑的文档及图片转换为可编辑内容。在对图像中的文本进行识别时,需要将整行文本逐字分割,得到单字符图像,以便后续识别,然而单字符分割需要在垂直方向上进行,而斜体字轮廓并不在垂直方向,容易导致单字符分割错误。因此,需要校正倾斜文本行中的字符至垂直方向,以便准确的识别文本。
现有的文本行倾斜校正方法包括统计法与局部法,统计法包括霍夫变换法、Radon变换法、主成分分析法。霍夫变换假定直角坐标系的共线点在极坐标系对应的曲线必定相交于一点,借此判别直线估算倾斜角;Radon变换则是以线积分的方式将图像空间投影到变换域,是直线参数变换的连续形式,与霍夫变换同样是通过判别直线估算倾斜角;主成分分析法则是计算对倾斜角度分布具有最大影响的特征向量。局部法从字符笔画入手,结合字符笔画斜率特点估算倾斜角度。
但是,对于点阵字体文本行而言,点阵字体是以每个点的虚实来表示字符的轮廓。统计法通过判别直线查找倾斜角,连续字体直线轮廓明显,而点阵字体轮廓则离散,并不具备直线特征。局部法结合字符笔画斜率,然而点阵字体轮廓离散,难以确定斜率。因此,现有的文本行倾斜校正方法无法应用于点阵字体文本行。
发明内容
本申请提供了一种点阵字体文本行倾斜校正方法及装置。以解决现有的文本行倾斜校正方法无法应用于点阵字体文本行的问题。
第一方面,本申请提供一种点阵字体文本行倾斜校正方法,包括:
获取待校正点阵字体文本行图像;
对所述待校正点阵字体文本行图像进行二值化处理,得到二值化图像;
根据所述二值化图像提取点阵字体文本行的特征点数据;
根据所述特征点数据进行倾斜角度搜索,获得倾斜校正角度;
根据所述倾斜校正角度对所述待校正点阵字体文本行图像进行倾斜校正,得到校正图像。
结合第一方面,在一种可能的实现方式中,所述特征点数据包括:特征点强度和特征点方位,所述根据所述特征点数据进行倾斜角度搜索,获得倾斜校正角度包括:
获取搜索角度范围;
计算所述搜索角度范围内各个角度的字符特征值,所述字符为所述待校正点阵字体文本行图像中组成文本行的字符;
获取最大的所述字符特征值对应的角度值,所述角度值为所述倾斜校正角度。
结合第一方面,在一种可能的实现方式中,所述计算所述搜索角度范围内各个角度的字符特征值包括:
根据所述特征点强度和所述特征点方位生成投影直方图;
对所述投影直方图进行离散性抑制处理,获得抑制后投影直方图;
根据所述抑制后投影直方图,计算所述字符特征值,所述字符特征值包括:各字符投影直方图间隔和各字符特征强度均值。
结合第一方面,在一种可能的实现方式中,当所述投影直方图满足高斯分布时,所述对所述投影直方图进行离散性抑制处理包括:对所述投影直方图进行均值滤波。
结合第一方面,在一种可能的实现方式中,所述根据所述倾斜校正角度对所述待校正点阵字体文本行图像进行倾斜校正包括:根据所述倾斜校正角度对所述待校正点阵字体文本行图像进行仿射变换。
第二方面,本申请还提供一种点阵字体文本行倾斜校正装置,所述装置包括:
获取模块,用于获取待校正点阵字体文本行图像;
二值化模块,用于对所述待校正点阵字体文本行图像进行二值化处理,得到二值化图像;
提取模块,用于根据所述二值化图像提取点阵字体文本行的特征点数据;
倾斜角度搜索模块,用于根据所述特征点数据进行倾斜角度搜索,获得倾斜校正角度;
校正模块,用于根据所述倾斜校正角度对所述待校正点阵字体文本行图像进行倾斜校正,得到校正图像。
结合第二方面,在一种可能的实现方式中,所述特征点数据包括:特征点强度和特征点方位,所述倾斜角度搜索模块还用于:
获取搜索角度范围;
计算所述搜索角度范围内各个角度的字符特征值,所述字符为所述待校正点阵字体文本行图像中组成文本行的字符;
获取最大的所述字符特征值对应的角度值,所述角度值为所述倾斜校正角度。
结合第二方面,在一种可能的实现方式中,所述倾斜角度搜索模块还用于:
根据所述特征点强度和所述特征点方位生成投影直方图;
对所述投影直方图进行离散性抑制处理,获得抑制后投影直方图;
根据所述抑制后投影直方图,计算所述字符特征值,所述字符特征值包括:各字符投影直方图间隔和各字符特征强度均值。
结合第二方面,在一种可能的实现方式中,当所述投影直方图满足高斯分布时,所述对所述投影直方图进行离散性抑制处理包括:对所述投影直方图进行均值滤波。
结合第二方面,在一种可能的实现方式中,所述校正模块,还用于根据所述倾斜校正角度对所述待校正点阵字体文本行图像进行仿射变换。
由以上技术方案可知,本申请提供的一种点阵字体文本行倾斜校正方法及装置。所述方法包括:获取待校正点阵字体文本行图像;对所述待校正点阵字体文本行图像进行二值化处理,得到二值化图像;根据所述二值化图像获取点阵字体文本行的特征点数据;根据所述特征点数据进行倾斜角度搜索,获得倾斜校正角度;根据所述倾斜校正角度对所述待校正点阵字体文本行图像进行倾斜校正,得到校正图像。通过本申请提供的倾斜校正方法,首先对点阵字体文本行图像进行二值化处理,然后提取特征点数据,搜索得到倾斜校正角度,最后根据倾斜校正角度校正点阵字体文本行图像,调整点阵字体文本行中的字符沿垂直方向,从而实现对点阵字体文本行的倾斜校正。
附图说明
为了更清楚地说明本申请的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例提供的一种连续字体的示意图;
图2为本申请实施例提供的一种点阵字体的示意图;
图3为本申请实施例提供的一种点阵字体文本行倾斜校正方法的流程图;
图4为本申请实施例提供的点阵字体文本行图像;
图5为本申请实施例提供的二值化图像;
图6为本申请实施例提供的一种根据二值化图像进行倾斜角度搜索方法的流程图;
图7为本申请实施例提供的计算所述搜索角度范围内各个角度的字符特征值的流程图;
图8为本申请实施例提供的投影直方图;
图9为本申请实施例提供的离散性抑制后投影直方图;
图10为本申请实施例提供的倾斜校正后图像;
图11为本申请实施例提供的一种点阵字体文本行倾斜校正装置。
具体实施方式
下面将详细地对实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下实施例中描述的实施方式并不代表与本申请相一致的所有实施方式。仅是与权利要求书中所详述的、本申请的一些方面相一致的系统和方法的示例。
应用机器视觉代替人眼,高效识别图像中的文本已经成为自动化生产的重要组成部分。其中,字符识别(optical character recognise,OCR)技术可以对纸上的印刷及打印文字字符进行识别,将识别结果以文本方式存储在计算机器中。通过字符识别可将书面上不可编辑的文档及图片转换为可编辑内容。在对图像中的文本进行识别时,需要将整行文本逐字分割,得到单字符图像,以便后续识别,然而单字符分割需要在垂直方向上进行,而斜体字轮廓并不在垂直方向,容易导致单字符分割错误。因此,需要校正倾斜文本行字符至垂直方向,以便准确的识别文本。
图1是本申请实施例提供的一种连续字体的示意图,如图1所示,连续字体的轮廓是由连续实点构成,是日常生活中常见的文本表示字体。对于连续字体文本行的倾斜校正方法包括统计法与局部法,统计法包括霍夫变换法、Radon变换法、主成分分析法。霍夫变换假定直角坐标系的共线点在极坐标系对应的曲线必定相交于一点,借此判别直线估算倾斜角;Radon变换则是以线积分的方式将图像空间投影到变换域,是直线参数变换的连续形式,与霍夫变换同样是通过判别直线估算倾斜角;主成分分析法则是计算对倾斜角度分布具有最大影响的特征向量。局部法从字符笔画入手,结合字符笔画斜率特点估算倾斜角度。
但是,对于点阵字体文本行而言,如图2所示,图2是本申请实施例提供的一种点阵字体的示意图,点阵字体是以每个点的虚实来表示字符的轮廓。统计法通过判别直线查找倾斜角,连续字体直线轮廓明显,而点阵字体轮廓则离散,并不具备直线特征。局部法结合字符笔画斜率,然而点阵字体轮廓离散,难以确定斜率。因此,现有的文本行倾斜校正方法无法应用于点阵字体文本行。
本申请提供了一种点阵字体文本行倾斜校正方法及装置。以解决现有的文本行倾斜校正方法无法应用于点阵字体文本行的问题。
第一方面,本申请提供一种点阵字体文本行倾斜校正方法,图3为本申请实施例提供的一种点阵字体文本行倾斜校正方法的流程图,如图3所示,所述方法包括以下步骤:
S100:获取待校正点阵字体文本行图像。
在本实施例中,所述待校正点阵字体文本行图像中包括点阵字体文本行,所述点阵字体文本行为倾斜字体,即所述点阵字体文本行的字符方向与垂直方向呈一定角度。图4是本申请实施例提供的一种点阵字体文本行图像,如图4所示,点阵字体文本行内容包括“QHT38207/11/2008 04:”,所述点阵字体文本行中的字符不处于垂直方向,即与垂直方向呈一定角度。为了提高图像字符识别的准确性,需要对点阵字体文本行进行倾斜校正。
所述待校正点阵字体文本行图像的格式可以是:JPEG(Joint PhotographicExpert Group,联合照片专家组)格式、PNG(Portable Network Graphics,便携式网络图形)格式以及BMP(BitMaP,位图)等格式,本申请对获取的待校正点阵字体文本行图像格式以及获取方法不做具体限定。
S200:对所述待校正点阵字体文本行图像进行二值化处理,得到二值化图像。
在本实施例中,首先对校正点阵字体文本行图像进行二值化处理。示例地,二值化处理就是将点阵字体文本行图像上的像素点的灰度值设置为0或255,也就是将整个点阵字体文本行图像呈现出明显的黑白效果的过程。图像的二值化处理有利于点阵字体文本行图像的进一步处理,使点阵字体文本行图像变得简单,而且数据量减小,能凸显出目标的轮廓。图5是本申请实施例提供的一种二值化图像,如图5所示,二值化图像中点阵字体文本行内容“QHT382 07/11/2008 04:”变为白色,背景颜色变为黑色。本申请提供的方法通过二值化处理,可以初步滤除除了点阵字体文本行外的无关背景干扰,以提高倾斜校正的准确性。
S300:根据所述二值化图像提取点阵字体文本行的特征点数据;
在一种可能的实现方式中,所述特征点数据包括特征点的特征点强度和特征点方位。其中,所述特征点强度包括特征点的灰度信息等,所述特征点方位包括特征点位于所述待校正点阵字体文本行图像的位置,例如,特征点在所述待校正点阵字体文本行图像上的X、Y坐标值。所述特征点强度和所述特征点方位用于确定倾斜校正角度。
S400:根据所述特征点数据进行倾斜角度搜索,获得倾斜校正角度。
在本实施例中,通过对二值化图像进行处理,在搜索角度范围内,得到点阵字体文本行倾斜校正角度。
在一种可能的实现方式中,如图6所示,步骤S400,根据所述特征点数据进行倾斜角度搜索,获得倾斜校正角度具体包括以下步骤S410-S430:
S410:获取搜索角度范围。
在本实施例中,所述搜索角度范围由操作人员设置,通常根据获取的待校正点阵字体文本行与水平方向之间的夹角大小确定,一般搜索角度范围为正负60°。
可选的,根据所述搜索角度范围由粗到精地缩小搜索范围。例如,首先进行粗尺度搜索,将所述搜索角度范围5等分,分为5个角度范围进行粗尺度搜索,得到一个最接近的粗尺度搜索角度范围。然后再将所述粗尺度搜索角度范围5等分,分为5个角度范围进行精确搜索,最后获得倾斜校正角度。这样,可以提高倾斜校正角度搜索的效率。需要说明的是,在精度要求不高的场景下可以仅采用粗尺度搜索,实现点阵字体文本行更高效率地倾斜校正。
S420:计算所述搜索角度范围内各个角度的字符特征值,所述字符为所述待校正点阵字体文本行图像中组成文本行的字符。
在一种可能的实现方式中,图7是本申请实施例提供的计算所述搜索角度范围内各个角度的字符特征值的流程图,如图7所示,步骤S420具体包括以下步骤:
S421:根据所述特征点强度和所述特征点方位生成投影直方图。图8是本申请实施例提供的投影直方图,如图8所示,其中,投影直方图的横坐标表示所述特征点方位,投影直方图的纵坐标表示所述特征点强度。所述投影直方图可以表示所述待校正点阵字体文本行图像中特征点的强度与方位之间的关系,以便于获取点阵字体文本行的倾斜校正角度。
S422:对所述投影直方图进行离散性抑制处理,获得抑制后投影直方图。
在本实施例中,对所述投影直方图进行形态学处理,进行投影直方图的离散性抑制,缓解由点阵字体离散性导致的特征强度波动,去除干扰的噪声点,得到更为平滑的投影直方图。图9是本申请实施例提供的抑制后投影直方图,如图9所示,经过离散性抑制处理后的投影直方图中曲线更加平滑,更有利于获取倾斜校正角度。
在一种可能的实现方式中,当所述投影直方图满足高斯分布时,所述对所述投影直方图进行离散性抑制处理包括:对所述投影直方图进行均值滤波。
可选的,通过调节对投影直方图的离散性抑制程度,可以使本申请提供的倾斜校正方法直接应用于连续字体文本行的倾斜校正,甚至可以在连续字体出现断裂时将其视作点阵字体处理。具体的,可以通过调节对所述投影直方图形态学处理的参数,例如,形态学处理的结构元素,点阵字体可以用大结构元素,连续字体可以用小结构元素;形态学处理也可以多次迭代,点阵字体可以执行多次形态学处理,连续字体可以只执行一次形态学处理。因此,本申请提供的倾斜校正方法应用更加广泛。
S423:根据所述抑制后投影直方图,计算所述字符特征值,所述字符特征值包括:各字符投影直方图间隔和各字符特征强度均值。
所述各字符投影直方图间隔为点阵字体文本行中相邻的两个字符之间的间隔,所述各字符特征强度均值为点阵字体文本行中每个字符的特征点强度的均值。示例地,在所述抑制后投影直方图中,根据其中一个字符的曲线,首先获取这个字符曲线每个点的高度,然后计算分别计算所有高度的均值,该均值即为所述各字符特征强度均值。
根据计算得到的各字符投影直方图间隔和各字符特征强度均值,可以查找获得倾斜校正角度。所述计算各字符投影直方图间隔和各字符特征强度均值的具体表达式可根据实际获取的点阵字体文本行以及字符识别的要求而确定,本申请对此不做具体限定。
S430:获取最大的所述字符特征值对应的角度值,所述角度值为所述倾斜校正角度。
在本实施例中,所述倾斜校正角度为点阵字体文本行与垂直方向的夹角角度。获取所述倾斜校正角度具体包括:首先查找在搜索角度范围内各个角度的字符特征值的最大值,然后根据所述字符特征值的最大值确定对应的角度值,所述角度值即作为倾斜校正角度。
S500:根据所述倾斜校正角度对所述待校正点阵字体文本行图像进行倾斜校正,得到校正图像。
在一种可能的实现方式中,对所述待校正点阵字体文本行图像进行倾斜校正包括,根据所述倾斜校正角度对所述待校正点阵字体文本行图像进行仿射变换。例如,当倾斜校正角度为θ°时,即点阵字体文本行中字符的方向与垂直方向夹角为顺时针θ°,则对所述待校正点阵字体文本行图像进行x、y缩放因子为1,x、y偏置为0,x旋转角度为0°,y旋转角度逆时针θ°的6自由度仿射变换,即得到校正图像。图10是本申请实施例提供的倾斜校正后图像,如图10所示,经过倾斜校正后,点阵字体文本行“QHT382 07/11/2008 04:”中的每个字符的位置已校正为沿垂直方向。
第二方面,本申请还提供一种点阵字体文本行倾斜校正装置,图11是本申请实施例提供的一种点阵字体文本行倾斜校正装置,如图11所示,所述装置包括:
获取模块11,用于获取待校正点阵字体文本行图像。
二值化模块12,用于对所述待校正点阵字体文本行图像进行二值化处理,得到二值化图像;
提取模块13,用于根据所述二值化图像提取点阵字体文本行的特征点数据;
倾斜角度搜索模块14,用于根据所述特征点数据进行倾斜角度搜索,获得倾斜校正角度;
校正模块15,用于根据所述倾斜校正角度对所述待校正点阵字体文本行图像进行倾斜校正,得到校正图像。
在一种可能的实现方式中,所述特征点数据包括:特征点强度和特征点方位,所述倾斜角度搜索模块14还用于:
获取搜索角度范围。
计算所述搜索角度范围内各个角度的字符特征值,所述字符为所述待校正点阵字体文本行图像中组成文本行的字符;
获取最大的所述字符特征值对应的角度值,所述角度值为所述倾斜校正角度。
在一种可能的实现方式中,所述倾斜角度搜索模块14还用于:
根据所述特征点强度和所述特征点方位生成投影直方图。
对所述投影直方图进行离散性抑制处理,获得抑制后投影直方图。
根据所述抑制后投影直方图,计算所述字符特征值,所述字符特征值包括:各字符投影直方图间隔和各字符特征强度均值。
在一种可能的实现方式中,当所述投影直方图满足高斯分布时,所述对所述投影直方图进行离散性抑制处理包括:对所述投影直方图进行均值滤波。
在一种可能的实现方式中,所述校正模块15,还用于根据所述倾斜校正角度对所述待校正点阵字体文本行图像进行仿射变换。
由以上技术方案可知,本申请提供的一种点阵字体文本行倾斜校正方法及装置。所述方法包括:获取待校正点阵字体文本行图像;对所述待校正点阵字体文本行图像进行二值化处理,得到二值化图像;根据所述二值化图像获取点阵字体文本行的特征点数据;根据所述特征点数据进行倾斜角度搜索,获得倾斜校正角度;根据所述倾斜校正角度对所述待校正点阵字体文本行图像进行倾斜校正,得到校正图像。通过本申请提供的倾斜校正方法,首先对点阵字体文本行图像进行二值化处理,然后提取特征点数据,搜索得到倾斜校正角度,最后根据倾斜校正角度校正点阵字体文本行图像,调整点阵字体文本行中的字符沿垂直方向,从而实现对点阵字体文本行的倾斜校正。
本申请提供的实施例之间的相似部分相互参见即可,以上提供的具体实施方式只是本申请总的构思下的几个示例,并不构成本申请保护范围的限定。对于本领域的技术人员而言,在不付出创造性劳动的前提下依据本申请方案所扩展出的任何其他实施方式都属于本申请的保护范围。
Claims (6)
1.一种点阵字体文本行倾斜校正方法,其特征在于,包括:
获取待校正点阵字体文本行图像;
对所述待校正点阵字体文本行图像进行二值化处理,得到二值化图像;
根据所述二值化图像提取点阵字体文本行的特征点数据;所述特征点数据包括:特征点强度和特征点方位;
获取搜索角度范围;
根据所述特征点强度和所述特征点方位生成投影直方图;
对所述投影直方图进行离散性抑制处理,获得抑制后投影直方图;
根据所述抑制后投影直方图,计算字符特征值,所述字符特征值包括:各字符投影直方图间隔和各字符特征强度均值,所述字符为所述待校正点阵字体文本行图像中组成文本行的字符;
获取最大的所述字符特征值对应的角度值,所述角度值为倾斜校正角度;
根据所述倾斜校正角度对所述待校正点阵字体文本行图像进行倾斜校正,得到校正图像。
2.根据权利要求1所述的点阵字体文本行倾斜校正方法,其特征在于,当所述投影直方图满足高斯分布时,所述对所述投影直方图进行离散性抑制处理包括:对所述投影直方图进行均值滤波。
3.根据权利要求1或2所述的点阵字体文本行倾斜校正方法,其特征在于,所述根据所述倾斜校正角度对所述待校正点阵字体文本行图像进行倾斜校正包括:根据所述倾斜校正角度对所述待校正点阵字体文本行图像进行仿射变换。
4.一种点阵字体文本行倾斜校正装置,其特征在于,所述装置包括:
获取模块,用于获取待校正点阵字体文本行图像;
二值化模块,用于对所述待校正点阵字体文本行图像进行二值化处理,得到二值化图像;
提取模块,用于根据所述二值化图像提取点阵字体文本行的特征点数据;
倾斜角度搜索模块,用于根据所述特征点数据进行倾斜角度搜索,获得倾斜校正角度;
校正模块,用于根据所述倾斜校正角度对所述待校正点阵字体文本行图像进行倾斜校正,得到校正图像;
所述特征点数据包括:特征点强度和特征点方位,所述倾斜角度搜索模块还用于:
获取搜索角度范围;
计算所述搜索角度范围内各个角度的字符特征值,所述字符为所述待校正点阵字体文本行图像中组成文本行的字符;
获取最大的所述字符特征值对应的角度值,所述角度值为所述倾斜校正角度;
所述倾斜角度搜索模块还用于:
根据所述特征点强度和所述特征点方位生成投影直方图;
对所述投影直方图进行离散性抑制处理,获得抑制后投影直方图;
根据所述抑制后投影直方图,计算所述字符特征值,所述字符特征值包括:各字符投影直方图间隔和各字符特征强度均值。
5.根据权利要求4所述的点阵字体文本行倾斜校正装置,其特征在于,当所述投影直方图满足高斯分布时,所述对所述投影直方图进行离散性抑制处理包括:对所述投影直方图进行均值滤波。
6.根据权利要求4或5所述的点阵字体文本行倾斜校正装置,其特征在于,所述校正模块,还用于根据所述倾斜校正角度对所述待校正点阵字体文本行图像进行仿射变换。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110829492.5A CN113537216B (zh) | 2021-07-22 | 2021-07-22 | 一种点阵字体文本行倾斜校正方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110829492.5A CN113537216B (zh) | 2021-07-22 | 2021-07-22 | 一种点阵字体文本行倾斜校正方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113537216A CN113537216A (zh) | 2021-10-22 |
CN113537216B true CN113537216B (zh) | 2024-05-31 |
Family
ID=78088782
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110829492.5A Active CN113537216B (zh) | 2021-07-22 | 2021-07-22 | 一种点阵字体文本行倾斜校正方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113537216B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117132998B (zh) * | 2023-08-29 | 2024-05-03 | 安徽以观文化科技有限公司 | 书法作品单个字体识别方法及其识别系统 |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007102702A (ja) * | 2005-10-07 | 2007-04-19 | Institute Of National Colleges Of Technology Japan | 文字列の傾斜補正方法及び装置 |
US8913836B1 (en) * | 2013-12-20 | 2014-12-16 | I.R.I.S. | Method and system for correcting projective distortions using eigenpoints |
CN104834929A (zh) * | 2015-04-28 | 2015-08-12 | 安徽清新互联信息科技有限公司 | 一种基于方差特征的车牌校正方法 |
CN108052936A (zh) * | 2017-11-03 | 2018-05-18 | 中国科学院计算技术研究所 | 一种盲文图像自动倾斜校正方法及系统 |
CN108241859A (zh) * | 2016-12-26 | 2018-07-03 | 浙江宇视科技有限公司 | 车牌的校正方法及装置 |
CN108681729A (zh) * | 2018-05-08 | 2018-10-19 | 腾讯科技(深圳)有限公司 | 文本图像矫正方法、装置、存储介质及设备 |
CN108932516A (zh) * | 2018-07-11 | 2018-12-04 | 凌云光技术集团有限责任公司 | 一种旋转文本图像的校正方法及装置 |
CN110991434A (zh) * | 2019-11-19 | 2020-04-10 | 国网浙江省电力有限公司宁波供电公司 | 自助终端证件识别方法及装置 |
CN111259899A (zh) * | 2020-01-13 | 2020-06-09 | 华中科技大学 | 一种喷码字符检测方法 |
-
2021
- 2021-07-22 CN CN202110829492.5A patent/CN113537216B/zh active Active
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007102702A (ja) * | 2005-10-07 | 2007-04-19 | Institute Of National Colleges Of Technology Japan | 文字列の傾斜補正方法及び装置 |
US8913836B1 (en) * | 2013-12-20 | 2014-12-16 | I.R.I.S. | Method and system for correcting projective distortions using eigenpoints |
CN104834929A (zh) * | 2015-04-28 | 2015-08-12 | 安徽清新互联信息科技有限公司 | 一种基于方差特征的车牌校正方法 |
CN108241859A (zh) * | 2016-12-26 | 2018-07-03 | 浙江宇视科技有限公司 | 车牌的校正方法及装置 |
CN108052936A (zh) * | 2017-11-03 | 2018-05-18 | 中国科学院计算技术研究所 | 一种盲文图像自动倾斜校正方法及系统 |
CN108681729A (zh) * | 2018-05-08 | 2018-10-19 | 腾讯科技(深圳)有限公司 | 文本图像矫正方法、装置、存储介质及设备 |
CN108932516A (zh) * | 2018-07-11 | 2018-12-04 | 凌云光技术集团有限责任公司 | 一种旋转文本图像的校正方法及装置 |
CN110991434A (zh) * | 2019-11-19 | 2020-04-10 | 国网浙江省电力有限公司宁波供电公司 | 自助终端证件识别方法及装置 |
CN111259899A (zh) * | 2020-01-13 | 2020-06-09 | 华中科技大学 | 一种喷码字符检测方法 |
Non-Patent Citations (1)
Title |
---|
基于Mojette变换的倾斜文本图像方向校正;沙周阳;张翠;;计算机技术与发展(第07期);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN113537216A (zh) | 2021-10-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8750619B2 (en) | Character recognition | |
US5410611A (en) | Method for identifying word bounding boxes in text | |
WO2019056346A1 (zh) | 一种利用膨胀法校正文本图像倾斜的方法及装置 | |
CN111461131B (zh) | 身份证号码信息识别方法、装置、设备及存储介质 | |
CN110598566A (zh) | 图像处理方法、装置、终端和计算机可读存储介质 | |
Konya et al. | Fast seamless skew and orientation detection in document images | |
CN108256518B (zh) | 文字区域检测方法及装置 | |
EP2545498B1 (en) | Resolution adjustment of an image that includes text undergoing an ocr process | |
CN113537216B (zh) | 一种点阵字体文本行倾斜校正方法及装置 | |
CN113361547B (zh) | 一种签章识别方法、装置、设备及可读存储介质 | |
CN113421257B (zh) | 一种点阵字体文本行旋转校正方法及装置 | |
Van Beusekom et al. | Automated ocr ground truth generation | |
CN113421256B (zh) | 一种点阵文本行字符投影分割方法及装置 | |
CN116994269A (zh) | 一种图像文档中印章相似度比对方法及对比系统 | |
Naz et al. | Challenges in baseline detection of cursive script languages | |
CN115995080B (zh) | 基于ocr识别的档案智能管理系统 | |
JP3223878B2 (ja) | 文字列照合装置、方法及び記録媒体 | |
CN117132998B (zh) | 书法作品单个字体识别方法及其识别系统 | |
CN117877037B (zh) | 一种ocr单字符定位识别方法、系统及计算机存储介质 | |
CN117252767A (zh) | 文本图片矫正方法及装置 | |
RIANTO et al. | MIN-COST FLOW NETWORK TO DETECT TEXT LINE ON CERTIFICATE | |
JP3127413B2 (ja) | 文字認識装置 | |
Singh et al. | Skew detection in image processing | |
CN116778503A (zh) | 一种基于ocr识别的印章真伪鉴别方法及系统 | |
CN115171134A (zh) | 一种基于特征值近似的ocr数字识别方法和系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |