CN111553344A - 文本图像的倾斜校正方法、系统、设备和存储介质 - Google Patents

文本图像的倾斜校正方法、系统、设备和存储介质 Download PDF

Info

Publication number
CN111553344A
CN111553344A CN202010303874.XA CN202010303874A CN111553344A CN 111553344 A CN111553344 A CN 111553344A CN 202010303874 A CN202010303874 A CN 202010303874A CN 111553344 A CN111553344 A CN 111553344A
Authority
CN
China
Prior art keywords
contour
inclination angle
image
average
text
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010303874.XA
Other languages
English (en)
Other versions
CN111553344B (zh
Inventor
黄登
周源
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ctrip Travel Information Technology Shanghai Co Ltd
Original Assignee
Ctrip Travel Information Technology Shanghai Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ctrip Travel Information Technology Shanghai Co Ltd filed Critical Ctrip Travel Information Technology Shanghai Co Ltd
Priority to CN202010303874.XA priority Critical patent/CN111553344B/zh
Publication of CN111553344A publication Critical patent/CN111553344A/zh
Application granted granted Critical
Publication of CN111553344B publication Critical patent/CN111553344B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/24Aligning, centring, orientation detection or correction of the image
    • G06V10/243Aligning, centring, orientation detection or correction of the image by compensating for image skew or non-uniform image deformations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/13Edge detection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/136Segmentation; Edge detection involving thresholding
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/44Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/153Segmentation of character regions using recognition of characters or words
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10004Still image; Photographic image

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)
  • Character Input (AREA)

Abstract

本发明公开了一种文本图像的倾斜校正方法、系统、设备和存储介质,方法包括:对文本图像利用边缘检测算法获取二值图像;提取二值图像的所有轮廓,轮廓包括第一轮廓和第二轮廓,第一轮廓内包含多个第二轮廓;利用轮廓特征寻找符合预设的边缘轮廓,获取边缘轮廓及内部的第二轮廓的角度集合,并根据角度集合计算出倾斜角度;若不存在边缘轮廓,利用自适应霍夫变换筛选出所有线段并求出角度集合,再利用聚类算法求出倾斜角度;根据倾斜角度对文本图像进行倾斜校正。本发明结合文本图像的特征,根据边缘轮廓及霍夫直线检测并结合聚类算法计算图像的倾斜角度,可以准确快速的获得文本图像的倾斜角度并进行倾斜校正,提高了文本图像倾斜校正的准确率。

Description

文本图像的倾斜校正方法、系统、设备和存储介质
技术领域
本发明涉及图像处理领域,具体涉及一种文本图像的倾斜校正方法、系统、设备和存储介质。
背景技术
文本图像的倾斜校正属于图像校正处理中的一种,是为了将图像中倾斜的文本进行旋转校正后,更有利于人们查看,也更有利机器进行识别和分析图像中的文字内容。文本图像的倾斜校正广泛应用于文字识别领域。
文本图像的倾斜校正技术的关键在于如何有效地找到最准确的倾斜角度,而通常会将寻找角度转换为寻找最优的倾斜直线,然后求出对应的倾斜角度。目前文本图像的倾斜校正的方法主要包括:
(1)投影法;(2)Hough(霍夫)变换法;(3)最近邻聚类法;(4)基于OCR(光学字符识别,Optical Character Recognition)识别反馈的文档倾斜校正方法等。
上述方法都有各自的优点,但是,仍然有一些不足,如投影法一般计算量较大且精度较差;Hough变换法对于文字边缘不清晰或边缘不连续或有干扰的图像的检测精度不准;最近邻聚类法依赖文档图像的排版,适应性较差;而基于OCR识别反馈的方法,虽然提高了检测精度,但是计算量大且依赖识别的精度,在OCR文字识别过程中,由于用户拍摄或图像本身存在倾斜,导致图片的文本倾斜,在OCR识别过程中,对倾斜的文本检测难度加大,同时对倾斜的文本识别难度加大,从而降低了识别准确率;总之,目前现有文本图像的倾斜校正方法普遍存在精度不高,算法适应性较差或计算量大的问题,不能满足实际使用需求。
发明内容
本发明要解决的技术问题是为了克服现有技术中文本图像的倾斜校正方法存在文本检测的精度较低及文本的整体识别率低的缺陷,提供一种文本图像的倾斜校正方法、系统、设备和存储介质。
本发明是通过下述技术方案来解决上述技术问题:
一种文本图像的倾斜校正方法,包括:
获取文本图像的二值图像;
获取所述二值图像中的所有轮廓,所述轮廓包括第一轮廓和第二轮廓,所述第一轮廓内包括若干个所述第二轮廓,所述第二轮廓为所述二值图像中单个文字对应的轮廓;
判断所述第一轮廓是否符合预设边缘轮廓的条件,若符合,则获取所述第一轮廓的第一倾斜角度和所述第一轮廓中所述第二轮廓的第二倾斜角度集合;
根据所述第一倾斜角度和所述第二倾斜角度集合计算得到所述文本图像的目标倾斜角度;
根据所述目标倾斜角度对所述文本图像进行倾斜校正。
较佳地,所述判断所述第一轮廓是否符合预设边缘轮廓的条件的步骤包括:
对所述第一轮廓进行遍历;
判断所述第一轮廓是否符合预设边缘轮廓的条件;
所述预设边缘轮廓的条件包括:所述第一轮廓的四条边连续且至少有三个交点、获取的所述第一轮廓内的每个所述第二轮廓的倾斜角度与所述第一轮廓的倾斜角度相差小于预设角度值,和获取的所述第一轮廓内的所述第二轮廓的数量大于预设数量值。
较佳地,所述获取文本图像的二值图像的步骤包括:
对所述文本图像进行预处理以得到第一图像;
获取所述第一图像的亮度平均值和标准差;
设置第一参数,所述第一参数可动态调整;
根据所述亮度平均值、所述标准差和所述第一参数计算得到第一阈值和第二阈值;
根据所述第一阈值和所述第二阈值使用边缘检测算法对所述第一图像进行边缘检测得到所述二值图像。
较佳地,所述获取所述二值图像中的所有轮廓,所述轮廓包括第一轮廓和第二轮廓,所述第一轮廓内包括若干个所述第二轮廓,所述第二轮廓为所述二值图像中单个文字对应的轮廓的步骤具体包括:
使用寻找轮廓函数计算得到所述二值图像中的所有轮廓;
计算得到所有所述轮廓的最小外接矩形;
计算得到所有所述最小外接矩形的第一平均高度、第一平均宽度和平均面积;
采用聚类算法筛选出在第一预设范围内的所述第一平均高度和第一平均宽度,并根据筛选后的所述第一平均高度和第一平均宽度重新计算得到第二平均高度和第二平均宽度;
根据所述第二平均高度和所述第二平均宽度获取文本平均高度;
根据所述文本平均高度设置面积阈值;
获取所述轮廓中面积值大于所述面积阈值的轮廓作为第二轮廓,所述第二轮廓包括所述二值图像中单个文字的轮廓;
获取所述第二轮廓的最大外接矩形;
根据所述平均面积、所述最大外接矩形及所述文本平均高度值获取包含若干所述第二轮廓的所述第一轮廓。
较佳地,在所述第一轮廓不符合预设边缘轮廓的条件时,所述倾斜校正方法还包括:
根据最大外接矩形和文本平均高度值获取霍夫变换算法对应的设定参数阈值;
采用霍夫变换算法根据设定参数阈值对所述二值图像进行直线检测得到直线线段;
利用反正切函数获取所有所述直线线段的第一角度;
将每个所述第一角度转换为预设角度范围内以形成第三角度集合;
使用聚类算法获取所述第三角度集合中的最优角度集合;
根据所述最优角度集合计算得到平均倾斜角度集合;
判断所述平均倾斜角度集合中的每个平均倾斜角度是否有效,若有效,则将所述平均倾斜角度作为目标倾斜角度。
一种文本图像的倾斜校正系统,包括:
二值图像获取模块,用于获取文本图像的二值图像;
轮廓获取模块,用于获取所述二值图像中的所有轮廓,所述轮廓包括第一轮廓和第二轮廓,所述第一轮廓内包括若干个所述第二轮廓,所述第二轮廓为所述二值图像中单个文字对应的轮廓;
边缘轮廓判断模块,用于判断所述第一轮廓是否符合预设边缘轮廓的条件,若符合,则调用角度获取模块,所述角度获取模块用于获取所述第一轮廓的第一倾斜角度和所述第一轮廓中所述第二轮廓的第二倾斜角度集合;
目标倾斜角度计算模块,用于根据所述第一倾斜角度和所述第二倾斜角度集合计算得到所述文本图像的目标倾斜角度;
文本图像校正模块,用于根据所述目标倾斜角度对所述文本图像进行倾斜校正。
较佳地,所述边缘轮廓判断模块包括:
轮廓遍历单元,用于对所述第一轮廓进行遍历;
条件判断单元,用于判断所述第一轮廓是否符合预设边缘轮廓的条件;
所述预设边缘轮廓的条件包括:所述第一轮廓的四条边连续且至少有三个交点、获取的所述第一轮廓内的每个所述第二轮廓的倾斜角度与所述第一轮廓的倾斜角度相差小于预设角度值,和获取的所述第一轮廓内的所述第二轮廓的数量大于预设数量值。
较佳地,所述二值图像获取模块包括:
预处理单元,用于对所述文本图像进行预处理以得到第一图像;
亮度和标准差获取单元,用于获取所述第一图像的亮度平均值和标准差;
第一参数设置单元,用于设置第一参数,所述第一参数可动态调整;
阈值计算单元,用于根据所述亮度平均值、所述标准差和所述第一参数计算得到第一阈值和第二阈值;
二值图像获取单元,用于根据所述第一阈值和所述第二阈值使用边缘检测算法对所述第一图像进行边缘检测得到所述二值图像。
较佳地,所述轮廓获取模块包括:
轮廓计算单元,用于使用寻找轮廓函数计算得到所述二值图像中的所有轮廓;
最小外接矩形计算单元,用于计算得到所有所述轮廓的最小外接矩形;
计算单元,用于计算得到所有所述最小外接矩形的第一平均高度、第一平均宽度和平均面积;
筛选单元,用于采用聚类算法筛选出在第一预设范围内的所述第一平均高度和第一平均宽度,并根据筛选后的所述第一平均高度和第一平均宽度重新计算得到第二平均高度和第二平均宽度;
文本平均高度获取单元,用于根据所述第二平均高度和所述第二平均宽度获取文本平均高度;
面积阈值设置单元,用于根据所述文本平均高度设置面积阈值;
第二轮廓获取单元,用于获取所述轮廓中面积值大于所述面积阈值的轮廓作为第二轮廓,所述第二轮廓包括所述二值图像中单个文字的轮廓;
最大外接矩形获取单元,用于获取所述第二轮廓的最大外接矩形;
第一轮廓获取单元,用于根据所述平均面积、所述最大外接矩形及所述文本平均高度值获取包含若干所述第二轮廓的所述第一轮廓。
较佳地,所述边缘轮廓判断模块用于在所述第一轮廓不符合预设边缘轮廓的条件时,所述倾斜校正系统还包括:
参数阈值设定模块,用于根据最大外接矩形和文本平均高度值获取霍夫变换算法对应的设定参数阈值;
直线检测模块,用于采用霍夫变换算法根据设定参数阈值对所述二值图像进行直线检测得到直线线段;
直线角度获取模块,用于利用反正切函数获取所有直线线段的第三角度集合;
角度转换模块,用于所述第三角度集合转换至第一预设角度范围内得到第三倾斜角度集合;
最优角度获取模块,用于使用聚类算法获取所述第三倾斜角度集合中的最优角度集合;
平均倾斜角度计算模块,用于根据所述最优角度集合计算得到平均倾斜角度集合;
平均倾斜角度判断模块,用于判断所述平均倾斜角度集合中的每个平均倾斜角度是否有效,若有效,则将所述平均倾斜角度作为目标倾斜角度。
一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述任意一项所述的文本图像的倾斜校正方法。
一种计算机可读存储介质,其上存储有计算机程序,所述程序被处理器执行时实现上述任意一项所述的文本图像的倾斜校正方法的步骤。
本发明的积极进步效果在于:本发明通过检测文本图像的所有轮廓,判断出是否存在边缘轮廓,存在边缘轮廓时,根据边缘轮廓计算出倾斜角度进行文本倾斜校正;若不存在,也能根据自适应霍夫变换结合聚类算法计算出倾斜角度并进行文本倾斜校正,本发明结合文本图像的特征,可以准确快速的获得文本图像的倾斜角度并进行文本图像倾斜校正,对背景噪声干扰很多的图像能够通过精准定位图像的边缘来进行倾斜校正,文本检测的精度较高,文本的整体识别率也较高。
附图说明
图1为本发明实施例1的文本图像的倾斜校正方法的流程示意图。
图2为本发明实施例2的文本图像的倾斜校正方法中步骤S101的流程示意图。
图3为本发明实施例2的文本图像的倾斜校正方法中步骤S102的流程示意图。
图4为本发明实施例2的文本图像的倾斜校正方法的流程示意图。
图5为本发明实施例2的文本图像的倾斜校正方法的原始文本图像。
图6为通过对图5进行轮廓提取后的输出图像。
图7为通过对图6进行边缘轮廓提取后的边缘图像。
图8为对图5进行自适应Hough变换后的直线图。
图9为对图5通过本发明实施例2的文本图像的倾斜校正方法校正后的图像。
图10为本发明实施例2的文本图像的倾斜校正方法的原始文本图像。
图11为通过对图10进行轮廓提取后的输出图像。
图12为通过对图10进行边缘轮廓提取后的边缘图像。
图13为对图12进行自适应聚类算法后筛选出的倾斜直线图。
图14为对图10通过本发明实施例2的文本图像的倾斜校正方法校正后的图像。
图15为本发明实施例3的文本图像的倾斜校正系统的结构示意图。
图16为本发明实施例4的文本图像的倾斜校正系统的结构示意图。
图17为本发明较佳实施例5的文本图像的倾斜校正方法的电子设备的结构示意图。
具体实施方式
下面通过实施例的方式进一步说明本发明,但并不因此将本发明限制在所述的实施例范围之中。
实施例1
如图1所示,本实施例的文本图像的倾斜校正方法的流程示意图,包括以下步骤:
S101、获取文本图像的二值图像;
S102、获取二值图像中的所有轮廓,轮廓包括第一轮廓和第二轮廓,第一轮廓内包括若干个第二轮廓,第二轮廓为二值图像中单个文字对应的轮廓;
S103、判断第一轮廓是否符合预设边缘轮廓的条件,若符合,执行步骤S104;
S104、获取第一轮廓的第一倾斜角度和第一轮廓中第二轮廓的第二倾斜角度集合;
S105、根据第一倾斜角度和第二倾斜角度集合计算得到文本图像的目标倾斜角度;
S106、根据目标倾斜角度对文本图像进行倾斜校正。
本实施例的文本图像的倾斜校正方法通过检测文本图像的所有轮廓,判断出是否存在边缘轮廓,存在边缘轮廓时,根据边缘轮廓计算出倾斜角度进行文本倾斜校正,结合文本图像的特征,可以准确快速的获得文本图像的倾斜角度并进行文本图像倾斜校正,对背景噪声干扰很多的图像能够通过精准定位图像的边缘来进行倾斜校正,文本检测的精度较 ,文本的整体识别率也较高。
实施例2
本实施例的文本图像的倾斜校正方法是对实施例1的进一步限定:
具体地,如图2所示,S101具体包括以下步骤:
S2101、对文本图像进行预处理以得到第一图像;
具体地,预处理过程如下:
a1)求输入的文本图像I(x,y)的高度Ih和宽度Iw,并求出宽和高的最小值Min,即
Figure BDA0002455037390000081
a2)根据最小值Min计算图像缩放的比率值radio,即
Figure BDA0002455037390000091
其中,std为一个可输入的固定变量值,默认设置为500,当然std的值可以根据实际情况进行调整;
a3)根据缩放的比率值radio对文本图像I(x,y)进行归一化处理获得缩放后的文本图像In(x,y),即
In(x,y)=I(x,y)*radio
a4)对归一化后的文本图像In(x,y)进行灰度化处理,得到灰度图像G(x,y);
a5)对灰度图像G(x,y)进行腐蚀处理,得到腐蚀后的图像Ge(x,y);
a6)对腐蚀后的图像Ge(x,y)进行膨胀处理,得到膨胀后的图像Gd(x,y)以得到预处理后的第一图像。
S2102、获取第一图像的亮度平均值和标准差;
S2103、设置第一参数,第一参数可动态调整;
S2104、根据亮度平均值、标准差和第一参数计算得到第一阈值和第二阈值;
S2105、根据第一阈值和第二阈值使用边缘检测算法对第一图像进行边缘检测得到二值图像。
步骤S2102-S2105的具体计算过程如下:
b1)求第一图像的亮度平均值μ0和标准差σ0,并设置一个可动态输入的比例值r0作为第一参数,第一参数r0默认设置值为0.3,第一参数r0动态设置不同的值,可得到不同的边缘二值图,根据实际经验设置第一参数r0默认值为0.3;
b2)根据亮度平均值μ0,标准差σ0和第一参数r0,求出Canny(一种边缘检测算法)的低阈值thlow和高阈值thhigh,分别作为第一阈值和第二阈值,即
thlow=Math.max(0,(1-r0)*(μ00))
thhigh=Math.min(255,(1+r0)*(μ00))
第一阈值的最小值必须大于或者等于0,第二阈值的最大值必须小于或者等于255;
b3)根据求出的第一阈值和第二阈值,通过Canny算法对第一图像进行边缘检测得到边缘二值图像Bc(x,y)作为二值图像;
本实施例的文本图像的倾斜校正方法采用自适应Canny算法,对文本图像进行边缘检测,对Canny算法设置不同的比例值以实现能准确检测不同背景的文本图像边缘,提高了文本图像校正的适用范围。
如图3所示,步骤S102具体包括以下步骤:
S2201、使用寻找轮廓函数计算得到二值图像中的所有轮廓;
S2202、计算得到所有轮廓的最小外接矩形;
S2203、计算得到所有最小外接矩形的第一平均高度、第一平均宽度和平均面积;
S2204、采用聚类算法筛选出在第一预设范围内的第一平均高度和第一平均宽度,并根据筛选后的第一平均高度和第一平均宽度重新计算得到第二平均高度和第二平均宽度;
S2205、根据第二平均高度和第二平均宽度获取文本平均高度;
S2206、根据文本平均高度设置面积阈值;
S2207、获取轮廓中面积值大于面积阈值的轮廓作为第二轮廓,第二轮廓包括二值图像中单个文字的轮廓;
S2208、获取第二轮廓的最大外接矩形;
S2209、根据平均面积、最大外接矩形及文本平均高度值获取包含若干第二轮廓的第一轮廓。
步骤S2201-2209的具体计算过程如下:
c1)使用寻找轮廓函数findContours求出二值图像中的所有轮廓;
c2)求出所有轮廓的最小外接拒形,根据最小外接矩形求出对应的第一平均高度havg、第一平均宽度wavg、平均面积aavg、高度标准差hstd、宽度标准差hstd以及所有最小外接矩形的倾斜角度集合A=a1,…,an(n为所有轮廓的个数);
c3)根据Kmeans聚类算法求出最靠近第一预设范围(havg-hstd,havg+hstd)的聚类,并计算出第二平均高度值havgn
c4)按上述步骤同样的方法,求出第二平均宽度wavgn;并取第二平均高度和第二平均宽度的最小值作为文本平均高度值havgt,即
havgt=Math.min(havgn,wavgn)
c5)根据文本平均高度值havgt,筛选出面积大于预设面积阈值0.5*havgt*havgt的所有轮廓作为第二轮廓以去除干扰噪声,第二轮廓包括二值图像中单个文字的轮廓,并求出对应所有第二轮廓的二值图像的最大外接矩形(即二值图像的四个边的起点值);
c6)对所有轮廓按面积从大到小排序,并对轮廓进行筛选,需满足一定的条件,如轮廓面积要大于平均面积aavg,最短边大于文本平均高度值n倍,以及轮廓内必须包含小轮廓,正常图像的边框的面积最大,根据平均面积aavg,最大外接矩形以及文本平均高度值havgt,提取出面积较大且内部包含小轮廓的大轮廓作为第一轮廓。最小外接矩形,最大外接矩形是某一个轮廓的两种不同的矩形,最小外接矩形和最大外接矩形是常识,大轮廓就是轮廓面积相对较大的轮廓,而小轮廓指面积较小的轮廓。
如图4所示,步骤S103具体包括以下步骤:
S3101、对第一轮廓进行遍历;
S3102、判断第一轮廓是否符合预设边缘轮廓的条件;
预设边缘轮廓的条件包括:第一轮廓的四条边连续且至少有三个交点、获取的第一轮廓内的每个第二轮廓的倾斜角度与第一轮廓的倾斜角度相差小于预设角度值,和获取的第一轮廓内的第二轮廓的数量大于预设数量值。
步骤S103具体计算过程如下:
d1)对获取到的满足条件的第一轮廓进行遍历;
d2)判断第一轮廓是否符合文本边缘轮廓要求,必须满足两个条件:条件(1):第一轮廓的边界的四条直线均是真正的具有连续性的真正的边缘,边缘连续长度均需大于第一轮廓对应边缘长度的70%,且4个交点需有三个及以上相交;条件(2):对第一轮廓内的第二轮廓进行遍历,须有第二轮廓和第一轮廓的倾斜角度相差小于等于3度的第二轮廓,且第二轮廓数量至少大于总数量(所有轮廓的总数量)的30%以上(该百分比数据设置为一个可输入的变量,默认30%,可以根据需求设计不同的值);
步骤S104和步骤S105具体包括:
d3)通过遍历寻找出满足上述条件的边缘轮廓;
d4)求出满足条件的边缘轮廓的第一倾斜角度和第一轮廓内的第二轮廓的第二倾斜角度集合,根据轮廓的最小外接矩形来计算第一倾斜角度和第二倾斜角度集合,将第一倾斜角度和第二倾斜角度集合合成第一倾斜角度集合,去除第一倾斜角度集合中的角度最大值和最小值后,计算剩余角度集合的平均值,即为目标倾斜角度。
步骤S106具体包括:
对上述步骤中求出的目标倾斜角度进行判断,如目标倾斜角度值不为0,则对输入的文本图像根据对应的目标倾斜角度进行旋转,并返回旋转后的目标文本图像,否则,返回原文本图像。
本实施例的文本图像的倾斜校正方法在判断第一轮廓不符合预设边缘轮廓的条件时,本实施例的文本图像的倾斜校正方法还包括以下步骤:
S107、根据最大外接矩形和文本平均高度值获取霍夫变换算法对应的设定参数阈值;
S108、采用霍夫变换算法根据设定参数阈值对二值图像进行直线检测得到直线线段;
S109、利用反正切函数获取所有直线线段的第一角度;
S110、将每个第一角度转换为预设角度范围内以形成第三角度集合;
步骤S107-S110具体计算过程如下:
e1)根据上述步骤中获取到的最大外接矩形和文本平均高度值获取Hough(霍夫)变换的几个主要阈值,即threshold(累积平面的阈值参数,即识别某部分为图中的一条直线时它在累积平面中必须达到的值)、minLineLength(最低线段的长度)和maxLineGap(同一行点与点之间连接的最大距离);该阈值为动态阈值,作用是排除一些干扰的无用的直线,因为检测直线判断的条件不一样,得到检测出的直线结果会不一样;
e2)利用Hough变换对二值图像进行直线检测,求出所有的直线线段;
e3)根据直线线段上两点,以及反正切函数求出所有直线线段的第一角度angle,将所有的第一角度转换到预设角度范围-45到45度以形成第三角度集合,即
Figure BDA0002455037390000131
S111、使用聚类算法获取第三角度集合中的最优角度集合;
S112、根据最优角度集合计算得到平均倾斜角度集合;
S113、判断平均倾斜角度集合中的每个平均倾斜角度是否有效,若有效,则将平均倾斜角度作为目标倾斜角度。
步骤S111-S113的具体计算过程如下:
f1)对所有的第三角度集合(第三角度集合长度大于1,否则跳出下面所有步骤,返回目标倾斜角度为0)进行Kmeans聚合分类,迭代遍历求出最优角度集合;具体步骤为:
f11)定义迭代计数器n=1,定义最大迭代次数N(N最大取7),定义最小预设标准差为δ,定义分类的聚类簇数的初始个数k=2,定义第三角度集合为D=x1,x2,…,xm
f12)利用Kmeans函数进行分类,簇划分的结果为C=C1,C2,…,Ck
f13)对划分的结果C进行循环遍历,求出最优的分类Cx(其中,x为1到k中的某个值);具体步骤为:
f131)求出C1的个数为maxCount,标准差σ,设最优值的index=1,若k<2,返回最优角度集合为C1,否则进行下一步;
f132)对C进行循环(for j=2,3,…,k)遍历,求出Cj的个数count标准差σt,若满足如下条件,count>maxCount||(count≥maxCount&&σt<σ),则更新maxCount=count,σ=σt,并更新index=j;
f133)循环结束,求出最优解Cx
f14)判断最优解Cx是否为聚类的最优解,如Cx的标准差σ<δ或者n>N或maxCount<4,则迭代结束,返回最优解Cx,否则,更新迭代次数,即n=n+1,并返回到第一步进行循环;
f2)根据上面求出的最优角度集合Cx,计算出集合的个数ac平均倾斜角度aavg
f3)判断倾斜角度是否有效;遍历上述c2)步骤中计算出的所有轮廓倾斜角度集合A,找出其中倾斜角度与平均倾斜角度aavg绝对值小于等于3的数量cn,若cn>0.25*ac,则目标倾斜角度为aavg
对上述步骤中求出的目标倾斜角度进行判断,如果目标倾斜角度不为0,则对输入的文本图像根据对应的目标倾斜角度进行旋转,并返回旋转后的目标文本图像,否则,返回原文本图像。
本实施例的文本图像的倾斜校正方法具体应用如下:
具体应用1:
如图5所示,本实施例的原始文本图像。该原始文本图像占整个图像的比例较小,且背景噪声非常多,如果仅仅使用霍夫变换进行直线检测后再利用自适应聚类求取目标倾斜角度,如图8所示对图5进行自适应Hough变换后的直线图,则会被背景噪声严重干扰,求取的目标倾斜角度值准确度非常低。
针对上面方法存在的不足,本应用的文本图像的倾斜校正方法采用预处理技术对图5中的原始文本图像进行预处理,然后,利用自适应Canny算法对预处理后的原始文本图像进行边缘检测得到二值图像,利用轮廓检测方法获取二值图像的二值轮廓信息,得到如图6所示的对图5进行轮廓提取后的输出图像;
利用最大边缘轮廓法,对图6进行边缘轮廓寻找,提取出边缘轮廓,如图7所示,并计算得到边缘轮廓的第一倾斜角度和边缘轮廓内的所有第二轮廓的第二角度集合,并结合自适应聚类算法,求出目标倾斜角度,根据目标倾斜角度将图5进行旋转的到图9所示的校正后的图像。本实施例的文本图像的倾斜校正方法,通过精准定位边缘轮廓而计算得到精准的倾斜角度,滤除了背景干扰,而且充分利用了证件文本具有边缘轮廓的特征,能够快速而准确地求出原始文本图像的目标倾斜角度。
具体应用2:
如图10所示的原始文本图像,由于边缘和背景一致,导致图像无四周的边缘。
本应用的文本图像的倾斜校正方法,
采用预处理技术对图10中的原始文本图像进行预处理,然后,利用自适应Canny算法对预处理后的原始文本图像进行边缘检测得到二值图像,利用轮廓检测方法获取二值图像的二值轮廓信息,得到如图11所示的对图10进行轮廓提取后的输出图像;
对图11进行边缘轮廓提取后的边缘图像如图12所示,从图12可以看出,图12没有边缘轮廓,所以无法使用最大边缘轮廓法,对图11进行边缘轮廓寻找,提取出边缘轮廓;
对图11的处理方法是通过自适应Hough变换进行直线检测初步检测出所有怀疑的图像,然后,通过自适应聚类算法,将非文本倾斜直线进行过滤,得到真正的倾斜直线,图13为对图12进行自适应聚类算法后筛选出的倾斜直线图;利用反正切函数获取图13中直线线段的第一角度;使用聚类算法获取第一角度集合中的最优角度集合;根据最优角度集合计算得到平均倾斜角度集合;判断平均倾斜角度有效后,将平均倾斜角度作为目标倾斜角度,并对图10进行倾斜校正得到校正后的图像如图14所示。
具体应用3:
本实施例的文本图像的倾斜校正方法同样适用于原始文本图像本身无四条明显的边缘轮廓,图像文本排列长短不一,一行有并排的多个文本,且非文本的背景图像较多的图像。具体处理过程与具体应用2类似,此处不再赘述。
本实施例的附图中描述位置关系的用于仅用于示例性说明,不能理解为对本专利的限制。
本实施例的文本图像的倾斜校正方法利用图像预处理技术对图像进行预处理,然后,利用自适应Canny算法得到二值图像,利用轮廓检测方法获取二值轮廓信息;利用最大边缘轮廓法或自适应Hough变换方法,并结合自适应聚类算法,对各类文本图像均具有很好的兼容性,如对背景噪声干扰很多的图像能够通过精准定位图像的边缘来进行倾斜校正,也能通过直线检测并结合轮廓提取的信息对图像边缘不明显或无边缘的文本图像或图像排版复杂并有除文字外有其他干扰背景的图像,来快速寻找到文本倾斜的直线并求出文本倾斜角度。
本实施例的文本图像的倾斜校正方法对图像大小的兼容性很好,能够将大图像先进行压缩后再进行倾斜校正,大大的节省了时间;同时本实施例适应各类证件文本图像,如护照、名片以及其他普通文本图像。
本实施例的文本图像的倾斜校正方法,利用图像预处理技术对图像进行预处理,然后,利用自适应Canny算法得到二值图像,利用轮廓检测方法获取二值轮廓信息;通过检测文本图像的所有轮廓,判断出是否存在边缘轮廓,存在边缘轮廓时,根据边缘轮廓计算出倾斜角度进行文本倾斜校正,结合文本图像的特征,可以准确快速的获得文本图像的倾斜角度并进行文本图像倾斜校正;进一步的,本实施例采用自适应Canny算法,对文本图像进行边缘检测,对Canny算法设置不同的比例值以实现能准确检测不同背景的文本图像边缘,提高了文本图像校正的适用范围;进一步的,本实施例使用Hough变换算法,对不存在边缘轮廓的文本图像进行倾斜角度计算,霍夫变换算法采用动态阈值以滤除干扰直线,通过直线检测并结合轮廓提取对文本图像边缘不明显或无边缘的文本图像或文本图像排版复杂并有除文字外有其他干扰背景的图像,可快速寻找到文本倾斜的直线并求出文本倾斜角度;进一步的,利用聚类算法,滤除边缘轮廓干扰和Hough变换法计算出的角度干扰,以进一步提高准确度。
实施例3
如图15所示,本发明实施例的文本图像的倾斜校正系统包括:
二值图像获取模块1,用于获取文本图像的二值图像;
轮廓获取模块2,用于获取二值图像中的所有轮廓,轮廓包括第一轮廓和第二轮廓,第一轮廓内包括若干个第二轮廓,第二轮廓为二值图像中单个文字对应的轮廓;
边缘轮廓判断模块3,用于判断第一轮廓是否符合预设边缘轮廓的条件,若符合,则调用角度获取模块4;
角度获取模块4用于获取第一轮廓的第一倾斜角度和第一轮廓中第二轮廓的第二倾斜角度集合;
目标倾斜角度计算模块5,用于根据第一倾斜角度和第二倾斜角度集合计算得到文本图像的目标倾斜角度;
文本图像校正模块6,用于根据目标倾斜角度对文本图像进行倾斜校正。
本实施例的文本图像的倾斜校正系统通过检测文本图像的所有轮廓,判断出是否存在边缘轮廓,存在边缘轮廓时,根据边缘轮廓计算出倾斜角度进行文本倾斜校正,结合文本图像的特征,可以准确快速的获得文本图像的倾斜角度并进行文本图像倾斜校正,对背景噪声干扰很多的图像能够通过精准定位图像的边缘来进行倾斜校正,文本检测的精度较 ,文本的整体识别率也较高。
实施例4
如图16所示,本发明实施例的文本图像的倾斜校正系统是对实施例3的进一步限定:
具体地,二值图像获取模块1包括:
预处理单元11,用于对文本图像进行预处理以得到第一图像;
具体的预处理过程与实施例2中的a1)-a6)相同,此处不再赘述。
亮度和标准差获取单元12,用于获取第一图像的亮度平均值和标准差;
第一参数设置单元13,用于设置第一参数,第一参数可动态调整;
阈值计算单元14,用于根据亮度平均值、标准差和第一参数计算得到第一阈值和第二阈值;
二值图像获取单元15,用于根据第一阈值和第二阈值使用边缘检测算法对第一图像进行边缘检测得到二值图像。
单元12-15的具体计算过程与实施例2中的b1)-b3)相同,此处不再赘述。
轮廓获取模块2包括:
轮廓计算单元21,用于使用寻找轮廓函数计算得到二值图像中的所有轮廓;
最小外接矩形计算单元22,用于计算得到所有轮廓的最小外接矩形;
计算单元23,用于计算得到所有最小外接矩形的第一平均高度、第一平均宽度和平均面积;
筛选单元24,用于采用聚类算法筛选出在第一预设范围内的第一平均高度和第一平均宽度,并根据筛选后的第一平均高度和第一平均宽度重新计算得到第二平均高度和第二平均宽度;
文本平均高度获取单元25,用于根据第二平均高度和第二平均宽度获取文本平均高度;
面积阈值设置单元26,用于根据文本平均高度设置面积阈值;
第二轮廓获取单元27,用于获取轮廓中面积值大于面积阈值的轮廓作为第二轮廓,第二轮廓包括二值图像中单个文字的轮廓;
最大外接矩形获取单元28,用于获取第二轮廓的最大外接矩形;
第一轮廓获取单元29,用于根据平均面积、最大外接矩形及文本平均高度值获取包含若干第二轮廓的第一轮廓。
单元21-29的具体计算过程与实施例2中的c1)-c6)相同,此处不再赘述。
边缘轮廓判断模块3包括:
轮廓遍历单元38,用于对第一轮廓进行遍历;
条件判断单元39,用于判断第一轮廓是否符合预设边缘轮廓的条件;
预设边缘轮廓的条件包括:第一轮廓的四条边连续且至少有三个交点、获取的第一轮廓内的每个第二轮廓的倾斜角度与第一轮廓的倾斜角度相差小于预设角度值,和获取的第一轮廓内的第二轮廓的数量大于预设数量值。
边缘轮廓判断模块3的具体计算过程与实施例2中的d1)和d2)相同,此处不再赘述。
角度获取模块4和目标倾斜角度计算模块5具体内容与实施例2中的d3)和d4)相同,此处不再赘述。
文本图像校正模块6具体包括:
对上述步骤中求出的目标倾斜角度进行判断,如目标倾斜角度值不为0,则对输入的文本图像根据对应的目标倾斜角度进行旋转,并返回旋转后的目标文本图像,否则,返回原文本图像。
本实施例的文本图像的倾斜校正系统在判断第一轮廓不符合预设边缘轮廓的条件时,本实施例的文本图像的倾斜校正系统还包括以下模块:
边缘轮廓判断模块4用于在第一轮廓不符合预设边缘轮廓的条件时,倾斜校正系统还包括:
参数阈值设定模块7,用于根据最大外接矩形和文本平均高度值获取霍夫变换算法对应的设定参数阈值;
直线检测模块8,用于采用霍夫变换算法根据设定参数阈值对二值图像进行直线检测得到直线线段;
直线角度获取模块9,用于利用反正切函数获取所有直线线段的第三角度集合;
角度转换模块10,用于第三角度集合转换至第一预设角度范围内得到第三倾斜角度集合;
模块7-10具体计算过程与实施例2中的e1)-e3)相同,此处不再赘述。
最优角度获取模块11,用于使用聚类算法获取第三倾斜角度集合中的最优角度集合;
平均倾斜角度计算模块12,用于根据最优角度集合计算得到平均倾斜角度集合;
平均倾斜角度判断模块13,用于判断平均倾斜角度集合中的每个平均倾斜角度是否有效,若有效,则将平均倾斜角度作为目标倾斜角度。
模块11-13具体计算过程与实施例2中的f1)-f3)相同,此处不再赘述。
本实施例的文本图像的倾斜校正系统具体应用与实施例2中的具体应用1-3相同,此处不再赘述。
本实施例的文本图像的倾斜校正系统利用图像预处理技术对图像进行预处理,然后,利用自适应Canny算法得到二值图像,利用轮廓检测方法获取二值轮廓信息;利用最大边缘轮廓法或自适应Hough变换方法,并结合自适应聚类算法,对各类文本图像均具有很好的兼容性,如对背景噪声干扰很多的图像能够通过精准定位图像的边缘来进行倾斜校正,也能通过直线检测并结合轮廓提取的信息对图像边缘不明显或无边缘的文本图像或图像排版复杂并有除文字外有其他干扰背景的图像,来快速寻找到文本倾斜的直线并求出文本倾斜角度。
本实施例的文本图像的倾斜校正方法对图像大小的兼容性很好,能够将大图像先进行压缩后再进行倾斜校正,大大的节省了时间;同时本实施例适应各类证件文本图像,如护照、名片以及其他普通文本图像。
本实施例的文本图像的倾斜校正系统,利用图像预处理技术对图像进行预处理,然后,利用自适应Canny算法得到二值图像,利用轮廓检测方法获取二值轮廓信息;通过检测文本图像的所有轮廓,判断出是否存在边缘轮廓,存在边缘轮廓时,根据边缘轮廓计算出倾斜角度进行文本倾斜校正,结合文本图像的特征,可以准确快速的获得文本图像的倾斜角度并进行文本图像倾斜校正;进一步的,本实施例采用自适应Canny(一种边缘检测算法)算法,对文本图像进行边缘检测,对Canny算法设置不同的比例值以实现能准确检测不同背景的文本图像边缘,提高了文本图像校正的适用范围;进一步的,本实施例使用Hough(霍夫)变换算法,对不存在边缘轮廓的文本图像进行倾斜角度计算,霍夫变换算法采用动态阈值以滤除干扰直线,通过直线检测并结合轮廓提取对文本图像边缘不明显或无边缘的文本图像或文本图像排版复杂并有除文字外有其他干扰背景的图像,可快速寻找到文本倾斜的直线并求出文本倾斜角度;进一步的,利用聚类算法,滤除边缘轮廓干扰和Hough变换法计算出的角度干扰,以进一步提高准确度。
实施例5
图17为本发明实施例5提供的一种电子设备的结构示意图。电子设备包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行程序时实现实施例1或2的文本图像的倾斜校正方法。图17显示的电子设备30仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图17所示,电子设备30可以以通用计算设备的形式表现,例如其可以为服务器设备。电子设备30的组件可以包括但不限于:上述至少一个处理器31、上述至少一个存储器32、连接不同系统组件(包括存储器32和处理器31)的总线33。
总线33包括数据总线、地址总线和控制总线。
存储器32可以包括易失性存储器,例如随机存取存储器(RAM)321和/或高速缓存存储器322,还可以进一步包括只读存储器(ROM)323。
存储器32还可以包括具有一组(至少一个)程序模块324的程序/实用工具325,这样的程序模块324包括但不限于:操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。
处理器31通过运行存储在存储器32中的计算机程序,从而执行各种功能应用以及数据处理,例如本发明实施例1或2所提供的文本图像的倾斜校正方法。
电子设备30也可以与一个或多个外部设备34(例如键盘、指向设备等)通信。这种通信可以通过输入/输出(I/O)接口35进行。并且,模型生成的设备30还可以通过网络适配器36与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。如图所示,网络适配器36通过总线33与模型生成的设备30的其它模块通信。应当明白,尽管图中未示出,可以结合模型生成的设备30使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理器、外部磁盘驱动阵列、RAID(磁盘阵列)系统、磁带驱动器以及数据备份存储系统等。
应当注意,尽管在上文详细描述中提及了电子设备的若干单元/模块或子单元/模块,但是这种划分仅仅是示例性的并非强制性的。实际上,根据本发明的实施方式,上文描述的两个或更多单元/模块的特征和功能可以在一个单元/模块中具体化。反之,上文描述的一个单元/模块的特征和功能可以进一步划分为由多个单元/模块来具体化。
实施例6
本实施例提供了一种计算机可读存储介质,其上存储有计算机程序,程序被处理器执行时实现实施例1或2所提供的文本图像的倾斜校正方法步骤。
其中,可读存储介质可以采用的更具体可以包括但不限于:便携式盘、硬盘、随机存取存储器、只读存储器、可擦拭可编程只读存储器、光存储器件、磁存储器件或上述的任意合适的组合。
在可能的实施方式中,本发明还可以实现为一种程序产品的形式,其包括程序代码,当程序产品在终端设备上运行时,程序代码用于使终端设备执行实现实施例1或2的文本图像的倾斜校正方法中的步骤。
其中,可以以一种或多种程序设计语言的任意组合来编写用于执行本发明的程序代码,程序代码可以完全地在用户设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户设备上部分在远程设备上执行或完全在远程设备上执行。
虽然以上描述了本发明的具体实施方式,但是本领域的技术人员应当理解,这仅是举例说明,本发明的保护范围是由所附权利要求书限定的。本领域的技术人员在不背离本发明的原理和实质的前提下,可以对这些实施方式做出多种变更或修改,但这些变更和修改均落入本发明的保护范围。

Claims (12)

1.一种文本图像的倾斜校正方法,其特征在于,包括:
获取文本图像的二值图像;
获取所述二值图像中的所有轮廓,所述轮廓包括第一轮廓和第二轮廓,所述第一轮廓内包括若干个所述第二轮廓,所述第二轮廓为所述二值图像中单个文字对应的轮廓;
判断所述第一轮廓是否符合预设边缘轮廓的条件,若符合,则获取所述第一轮廓的第一倾斜角度和所述第一轮廓中所述第二轮廓的第二倾斜角度集合;
根据所述第一倾斜角度和所述第二倾斜角度集合计算得到所述文本图像的目标倾斜角度;
根据所述目标倾斜角度对所述文本图像进行倾斜校正。
2.如权利要求1所述的文本图像的倾斜校正方法,其特征在于,所述判断所述第一轮廓是否符合预设边缘轮廓的条件的步骤包括:
对所述第一轮廓进行遍历;
判断所述第一轮廓是否符合预设边缘轮廓的条件;
所述预设边缘轮廓的条件包括:所述第一轮廓的四条边连续且至少有三个交点、获取的所述第一轮廓内的每个所述第二轮廓的倾斜角度与所述第一轮廓的倾斜角度相差小于预设角度值,和获取的所述第一轮廓内的所述第二轮廓的数量大于预设数量值。
3.如权利要求1所述的文本图像的倾斜校正方法,其特征在于,所述获取文本图像的二值图像的步骤包括:
对所述文本图像进行预处理以得到第一图像;
获取所述第一图像的亮度平均值和标准差;
设置第一参数,所述第一参数可动态调整;
根据所述亮度平均值、所述标准差和所述第一参数计算得到第一阈值和第二阈值;
根据所述第一阈值和所述第二阈值使用边缘检测算法对所述第一图像进行边缘检测得到所述二值图像。
4.如权利要求1所述的文本图像的倾斜校正方法,其特征在于,所述获取所述二值图像中的所有轮廓,所述轮廓包括第一轮廓和第二轮廓,所述第一轮廓内包括若干个所述第二轮廓,所述第二轮廓为所述二值图像中单个文字对应的轮廓的步骤具体包括:
使用寻找轮廓函数计算得到所述二值图像中的所有轮廓;
计算得到所有所述轮廓的最小外接矩形;
计算得到所有所述最小外接矩形的第一平均高度、第一平均宽度和平均面积;
采用聚类算法筛选出在第一预设范围内的所述第一平均高度和第一平均宽度,并根据筛选后的所述第一平均高度和第一平均宽度重新计算得到第二平均高度和第二平均宽度;
根据所述第二平均高度和所述第二平均宽度获取文本平均高度;
根据所述文本平均高度设置面积阈值;
获取所述轮廓中面积值大于所述面积阈值的轮廓作为第二轮廓,所述第二轮廓包括所述二值图像中单个文字的轮廓;
获取所述第二轮廓的最大外接矩形;
根据所述平均面积、所述最大外接矩形及所述文本平均高度值获取包含若干所述第二轮廓的所述第一轮廓。
5.如权利要求4所述的文本图像的倾斜校正方法,其特征在于,在所述第一轮廓不符合预设边缘轮廓的条件时,所述倾斜校正方法还包括:
根据最大外接矩形和文本平均高度值获取霍夫变换算法对应的设定参数阈值;
采用霍夫变换算法根据设定参数阈值对所述二值图像进行直线检测得到直线线段;
利用反正切函数获取所有所述直线线段的第一角度;
将每个所述第一角度转换为预设角度范围内以形成第三角度集合;
使用聚类算法获取所述第三角度集合中的最优角度集合;
根据所述最优角度集合计算得到平均倾斜角度集合;
判断所述平均倾斜角度集合中的每个平均倾斜角度是否有效,若有效,则将所述平均倾斜角度作为目标倾斜角度。
6.一种文本图像的倾斜校正系统,其特征在于,包括:
二值图像获取模块,用于获取文本图像的二值图像;
轮廓获取模块,用于获取所述二值图像中的所有轮廓,所述轮廓包括第一轮廓和第二轮廓,所述第一轮廓内包括若干个所述第二轮廓,所述第二轮廓为所述二值图像中单个文字对应的轮廓;
边缘轮廓判断模块,用于判断所述第一轮廓是否符合预设边缘轮廓的条件,若符合,则调用角度获取模块,所述角度获取模块用于获取所述第一轮廓的第一倾斜角度和所述第一轮廓中所述第二轮廓的第二倾斜角度集合;
目标倾斜角度计算模块,用于根据所述第一倾斜角度和所述第二倾斜角度集合计算得到所述文本图像的目标倾斜角度;
文本图像校正模块,用于根据所述目标倾斜角度对所述文本图像进行倾斜校正。
7.如权利要求6所述的文本图像的倾斜校正系统,其特征在于,所述边缘轮廓判断模块包括:
轮廓遍历单元,用于对所述第一轮廓进行遍历;
条件判断单元,用于判断所述第一轮廓是否符合预设边缘轮廓的条件;
所述预设边缘轮廓的条件包括:所述第一轮廓的四条边连续且至少有三个交点、获取的所述第一轮廓内的每个所述第二轮廓的倾斜角度与所述第一轮廓的倾斜角度相差小于预设角度值,和获取的所述第一轮廓内的所述第二轮廓的数量大于预设数量值。
8.如权利要求6所述的文本图像的倾斜校正系统,其特征在于,所述二值图像获取模块包括:
预处理单元,用于对所述文本图像进行预处理以得到第一图像;
亮度和标准差获取单元,用于获取所述第一图像的亮度平均值和标准差;
第一参数设置单元,用于设置第一参数,所述第一参数可动态调整;
阈值计算单元,用于根据所述亮度平均值、所述标准差和所述第一参数计算得到第一阈值和第二阈值;
二值图像获取单元,用于根据所述第一阈值和所述第二阈值使用边缘检测算法对所述第一图像进行边缘检测得到所述二值图像。
9.如权利要求6所述的文本图像的倾斜校正系统,其特征在于,所述轮廓获取模块包括:
轮廓计算单元,用于使用寻找轮廓函数计算得到所述二值图像中的所有轮廓;
最小外接矩形计算单元,用于计算得到所有所述轮廓的最小外接矩形;
计算单元,用于计算得到所有所述最小外接矩形的第一平均高度、第一平均宽度和平均面积;
筛选单元,用于采用聚类算法筛选出在第一预设范围内的所述第一平均高度和第一平均宽度,并根据筛选后的所述第一平均高度和第一平均宽度重新计算得到第二平均高度和第二平均宽度;
文本平均高度获取单元,用于根据所述第二平均高度和所述第二平均宽度获取文本平均高度;
面积阈值设置单元,用于根据所述文本平均高度设置面积阈值;
第二轮廓获取单元,用于获取所述轮廓中面积值大于所述面积阈值的轮廓作为第二轮廓,所述第二轮廓包括所述二值图像中单个文字的轮廓;
最大外接矩形获取单元,用于获取所述第二轮廓的最大外接矩形;
第一轮廓获取单元,用于根据所述平均面积、所述最大外接矩形及所述文本平均高度值获取包含若干所述第二轮廓的所述第一轮廓。
10.如权利要求9所述的文本图像的倾斜校正系统,其特征在于,所述边缘轮廓判断模块用于在所述第一轮廓不符合预设边缘轮廓的条件时,所述倾斜校正系统还包括:
参数阈值设定模块,用于根据最大外接矩形和文本平均高度值获取霍夫变换算法对应的设定参数阈值;
直线检测模块,用于采用霍夫变换算法根据设定参数阈值对所述二值图像进行直线检测得到直线线段;
直线角度获取模块,用于利用反正切函数获取所有直线线段的第三角度集合;
角度转换模块,用于所述第三角度集合转换至第一预设角度范围内得到第三倾斜角度集合;
最优角度获取模块,用于使用聚类算法获取所述第三倾斜角度集合中的最优角度集合;
平均倾斜角度计算模块,用于根据所述最优角度集合计算得到平均倾斜角度集合;
平均倾斜角度判断模块,用于判断所述平均倾斜角度集合中的每个平均倾斜角度是否有效,若有效,则将所述平均倾斜角度作为目标倾斜角度。
11.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现权利要求1至5中任意一项所述的文本图像的倾斜校正方法。
12.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现权利要求1至5中任意一项所述的文本图像的倾斜校正方法的步骤。
CN202010303874.XA 2020-04-17 2020-04-17 文本图像的倾斜校正方法、系统、设备和存储介质 Active CN111553344B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010303874.XA CN111553344B (zh) 2020-04-17 2020-04-17 文本图像的倾斜校正方法、系统、设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010303874.XA CN111553344B (zh) 2020-04-17 2020-04-17 文本图像的倾斜校正方法、系统、设备和存储介质

Publications (2)

Publication Number Publication Date
CN111553344A true CN111553344A (zh) 2020-08-18
CN111553344B CN111553344B (zh) 2023-05-12

Family

ID=72005747

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010303874.XA Active CN111553344B (zh) 2020-04-17 2020-04-17 文本图像的倾斜校正方法、系统、设备和存储介质

Country Status (1)

Country Link
CN (1) CN111553344B (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112257710A (zh) * 2020-10-26 2021-01-22 北京云杉世界信息技术有限公司 一种带文字平面的图片倾斜度检测方法及装置
CN112434640A (zh) * 2020-12-04 2021-03-02 小米科技(武汉)有限公司 确定文档图像的旋转角度方法、装置及存储介质
CN112508015A (zh) * 2020-12-15 2021-03-16 山东大学 一种铭牌识别方法、计算机设备、存储介质
CN112700440A (zh) * 2021-01-18 2021-04-23 上海闻泰信息技术有限公司 物体缺陷检测方法、装置、计算机设备及存储介质
CN112966318A (zh) * 2021-04-12 2021-06-15 青矩技术股份有限公司 一种显示cad文件中字符的方法及终端设备
CN113379681A (zh) * 2021-05-20 2021-09-10 深圳技术大学 Led芯片倾斜角度的获取方法、系统、电子装置及存储介质
CN117690139A (zh) * 2023-12-12 2024-03-12 北京蓝湾博阅科技有限公司 一种基于纸质图书阅览电子化后的图像前处理方法及系统

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05174182A (ja) * 1991-12-19 1993-07-13 Seiko Epson Corp 文書傾き角検出方法および文書傾き角検出装置
US20050094897A1 (en) * 2003-11-03 2005-05-05 Zuniga Oscar A. Method and device for determining skew angle of an image
CN101593277A (zh) * 2008-05-30 2009-12-02 电子科技大学 一种复杂彩色图像中文本区域自动定位方法及装置
US20140022406A1 (en) * 2012-07-19 2014-01-23 Qualcomm Incorporated Automatic correction of skew in natural images and video
US20150009520A1 (en) * 2013-07-08 2015-01-08 Fuji Xerox Co., Ltd. Tilt angle correction apparatus, image reader, image forming apparatus, and non-transitory computer readable medium storing program
CN105761219A (zh) * 2016-02-03 2016-07-13 北京云江科技有限公司 文本图像倾斜矫正方法和系统
CN105989366A (zh) * 2015-01-30 2016-10-05 深圳市思路飞扬信息技术有限责任公司 文本图像的倾斜角矫正、版面分析方法和助视装置、系统
US20170372460A1 (en) * 2016-06-28 2017-12-28 Abbyy Development Llc Method and system that efficiently prepares text images for optical-character recognition
CN107680108A (zh) * 2017-07-28 2018-02-09 平安科技(深圳)有限公司 倾斜图像的倾斜值获取方法、装置、终端及存储介质
CN108427946A (zh) * 2018-03-16 2018-08-21 福州大学 复杂场景下基于内特征和文本域布局的驾驶证检测识别方法
CN110647882A (zh) * 2019-09-20 2020-01-03 上海眼控科技股份有限公司 图像校正方法、装置、设备及存储介质

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05174182A (ja) * 1991-12-19 1993-07-13 Seiko Epson Corp 文書傾き角検出方法および文書傾き角検出装置
US20050094897A1 (en) * 2003-11-03 2005-05-05 Zuniga Oscar A. Method and device for determining skew angle of an image
CN101593277A (zh) * 2008-05-30 2009-12-02 电子科技大学 一种复杂彩色图像中文本区域自动定位方法及装置
US20140022406A1 (en) * 2012-07-19 2014-01-23 Qualcomm Incorporated Automatic correction of skew in natural images and video
US20150009520A1 (en) * 2013-07-08 2015-01-08 Fuji Xerox Co., Ltd. Tilt angle correction apparatus, image reader, image forming apparatus, and non-transitory computer readable medium storing program
CN105989366A (zh) * 2015-01-30 2016-10-05 深圳市思路飞扬信息技术有限责任公司 文本图像的倾斜角矫正、版面分析方法和助视装置、系统
CN105761219A (zh) * 2016-02-03 2016-07-13 北京云江科技有限公司 文本图像倾斜矫正方法和系统
US20170372460A1 (en) * 2016-06-28 2017-12-28 Abbyy Development Llc Method and system that efficiently prepares text images for optical-character recognition
CN107680108A (zh) * 2017-07-28 2018-02-09 平安科技(深圳)有限公司 倾斜图像的倾斜值获取方法、装置、终端及存储介质
CN108427946A (zh) * 2018-03-16 2018-08-21 福州大学 复杂场景下基于内特征和文本域布局的驾驶证检测识别方法
CN110647882A (zh) * 2019-09-20 2020-01-03 上海眼控科技股份有限公司 图像校正方法、装置、设备及存储介质

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
JAVAD S等: "A new approach for skew correction of documents based on particle swarm optimization", 《/PROCEEDINGS OF THE 10TH INTERNATIONAL CONFERENCE ON DOCUMENT ANALYSIS AND RECOGNITION.BARCELONA》 *
沙周阳;张翠;: "基于Mojette变换的倾斜文本图像方向校正" *
王晓君;陈锐;刁彦华;: "一种倾斜文本图像的旋转校正技术" *

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112257710A (zh) * 2020-10-26 2021-01-22 北京云杉世界信息技术有限公司 一种带文字平面的图片倾斜度检测方法及装置
CN112434640A (zh) * 2020-12-04 2021-03-02 小米科技(武汉)有限公司 确定文档图像的旋转角度方法、装置及存储介质
CN112434640B (zh) * 2020-12-04 2024-04-30 小米科技(武汉)有限公司 确定文档图像的旋转角度方法、装置及存储介质
CN112508015A (zh) * 2020-12-15 2021-03-16 山东大学 一种铭牌识别方法、计算机设备、存储介质
CN112700440A (zh) * 2021-01-18 2021-04-23 上海闻泰信息技术有限公司 物体缺陷检测方法、装置、计算机设备及存储介质
CN112700440B (zh) * 2021-01-18 2022-11-04 上海闻泰信息技术有限公司 物体缺陷检测方法、装置、计算机设备及存储介质
CN112966318A (zh) * 2021-04-12 2021-06-15 青矩技术股份有限公司 一种显示cad文件中字符的方法及终端设备
CN113379681A (zh) * 2021-05-20 2021-09-10 深圳技术大学 Led芯片倾斜角度的获取方法、系统、电子装置及存储介质
CN117690139A (zh) * 2023-12-12 2024-03-12 北京蓝湾博阅科技有限公司 一种基于纸质图书阅览电子化后的图像前处理方法及系统

Also Published As

Publication number Publication date
CN111553344B (zh) 2023-05-12

Similar Documents

Publication Publication Date Title
CN111553344B (zh) 文本图像的倾斜校正方法、系统、设备和存储介质
Ban et al. Face detection based on skin color likelihood
Tan et al. Enhanced local texture feature sets for face recognition under difficult lighting conditions
US9384409B1 (en) Word segmentation for document image using recursive segmentation
US9014432B2 (en) License plate character segmentation using likelihood maximization
CN109492642B (zh) 车牌识别方法、装置、计算机设备及存储介质
CN111950610B (zh) 基于精确尺度匹配的弱小人体目标检测方法
JP2004318879A (ja) 画像内容を比較する自動化技術
Chauhan et al. Binarization techniques for degraded document images—A review
US8792711B2 (en) System and method of foreground-background segmentation of digitized images
CN110717497B (zh) 图像相似度匹配方法、装置及计算机可读存储介质
CN109447117B (zh) 双层车牌识别方法、装置、计算机设备及存储介质
CN112364862B (zh) 一种基于直方图相似度的扰动变形汉字图片匹配的方法
Nie et al. Two-dimensional extension of variance-based thresholding for image segmentation
Saddami et al. Effective and fast binarization method for combined degradation on ancient documents
Peng et al. Text line segmentation using Viterbi algorithm for the palm leaf manuscripts of Dai
CN115331245A (zh) 一种基于图像实例分割的表格结构识别方法
CN116052152A (zh) 一种基于轮廓检测和深度神经网络的车牌识别系统
CN114943754A (zh) 一种基于sift的图像配准方法、系统及存储介质
Li et al. Detection and recognition of characters on the surface of metal workpieces with complex background
CN108694411B (zh) 一种识别相似图像的方法
Thilagavathy et al. Fuzzy based edge enhanced text detection algorithm using MSER
CN114387592B (zh) 一种复杂背景下字符定位和识别方法
CN116188826A (zh) 一种复杂光照条件下的模板匹配方法及装置
Su et al. Skew detection for Chinese handwriting by horizontal stroke histogram

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant