CN109948521A - 图像纠偏方法和装置、设备及存储介质 - Google Patents

图像纠偏方法和装置、设备及存储介质 Download PDF

Info

Publication number
CN109948521A
CN109948521A CN201910202982.5A CN201910202982A CN109948521A CN 109948521 A CN109948521 A CN 109948521A CN 201910202982 A CN201910202982 A CN 201910202982A CN 109948521 A CN109948521 A CN 109948521A
Authority
CN
China
Prior art keywords
tilt angle
prospect
image
textual
class prospect
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910202982.5A
Other languages
English (en)
Other versions
CN109948521B (zh
Inventor
全克球
刘明
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
BEIJING THUNISOFT INFORMATION TECHNOLOGY Co Ltd
Original Assignee
BEIJING THUNISOFT INFORMATION TECHNOLOGY Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by BEIJING THUNISOFT INFORMATION TECHNOLOGY Co Ltd filed Critical BEIJING THUNISOFT INFORMATION TECHNOLOGY Co Ltd
Priority to CN201910202982.5A priority Critical patent/CN109948521B/zh
Publication of CN109948521A publication Critical patent/CN109948521A/zh
Application granted granted Critical
Publication of CN109948521B publication Critical patent/CN109948521B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Character Input (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种图像纠偏方法、装置、设备及存储介质,该图像纠偏方法包括:对图像进行边缘检测;对经过边缘检测的图像进行前景分类,以将所述图像的前景分为文本类前景和非文本类前景;判断是否有文本类前景,如果有则确定文本类前景的倾斜角度;判断是否有非文本类前景,如果有确定非文本类前景的倾斜角度;根据所述文本类前景的倾斜角度和/或所述非文本类前景的倾斜角度确定所述图像的倾斜角度;根据所述图像的倾斜角度对所述图像进行纠偏。该图像纠偏方法、装置、设备及存储介质可以适用于各种类型的图像纠偏,并且速度较快。

Description

图像纠偏方法和装置、设备及存储介质
技术领域
本发明总体地涉及图像识别技术领域,特别是涉及图像纠偏方法和装置、设备及存储介质。
背景技术
图像纠偏在ocr识别中是一个很重要的应用。ocr识别是通过一系列技术将图像翻译成文本的过程,通过ocr识别出的结果,可以为上层应用提供便利,对材料进行分析提取。例如在法院立案及案件审理过程中,随时都有卷宗材料生成,这些都是需要扫描归档的。由于扫描时的各种失误,极易导致图像发生倾斜,不仅不美观,而且对于图像信息的利用也有一定影响。这时候纠偏就发挥了重大的作用。通过图像纠偏可以自动检测图像倾斜角度并进行矫正,再通过ocr将图像中的信息转换成文本,提高识别准确度。
目前图像纠偏的其中一种方法是基于方向投影的方法,其利用图像中的一个共同特点就是需要纠正的图像前景是矩形或者类矩形。比如,纸张轮廓、或者图像中的票据等,这些都有一个矩形框,然后通过计算矩形的倾斜角度来纠偏图像。这种方法的缺点是只能对具有矩形特征的图像纠偏,如果图像没有明显的矩形特性时,该方法效果不理想甚至失效。此外,如果图像中的纸张只有纯文本,且文本倾斜时,虽然纸张有矩形特性,但是该方法缺没办法纠偏文本。
目前图像纠偏的另一种方法是基于Hough变换等方法,其是利用扫描图像中文本特征,拟合直线,通过计算直线的斜率来纠偏图像。这种方法的缺点是hough变换的时间复杂度大,特别是图像文字等目标像素点较多时,处理时间过于太长。并且前景目标(如:文本)较少或没有时,拟合结果准确度会很低。或者前景目标(如:二维码图像)较为集中时,拟合结果准确度会很低。
存在对能够更快速地,适用性广的图像纠偏的技术的需要。
发明内容
鉴于上述情况,提出了本发明,可以适用于各种类型的图像纠偏,并且速度较快。
根据本发明的一个方面,提供了一种图像纠偏方法,其包括:
对图像进行边缘检测;
对经过边缘检测的图像进行前景分类,以将所述图像的前景分为文本类前景和非文本类前景;
判断是否有文本类前景,如果有则确定所述文本类前景的倾斜角度;
判断是否有非文本类前景,如果有确定所述非文本类前景的倾斜角度;
根据所述文本类前景的倾斜角度和/或所述非文本类前景的倾斜角度确定所述图像的倾斜角度;
根据所述图像的倾斜角度对所述图像进行纠偏。
在本发明一个实施例中,该方法还包括:
对所述图像进行预处理。
在本发明一个实施例中,所述预处理包括:
对所述图像进行灰度化;
对灰度化的所述图像进行降噪处理。
在本发明一个实施例中,确定所述文本类前景的倾斜角度包括:
通过膨胀操作使每行/列的文本类前景相连;
确定每行/列相连的文本类前景的最小外接矩形的倾斜角度;
判断所述最小外接矩形的最大倾斜角度和最小倾斜角度的差值是否小于设定值;
如果所述最小外接矩形的最大倾斜角度和最小倾斜角度的差值小于设定值,则以所有最小外接矩形的倾斜角度的平均值作为所述文本类前景的倾斜角度,反之则统计所有最小外接矩形的倾斜角度,并取分布集中的所述最小外接矩形的倾斜角度作为所述文本类前景的倾斜角度。
在本发明一个实施例中,确定所述非文本类前景的倾斜角度包括:
确定每个所述非文本前景的连通区域;
判断每个所述连通区域是否矩形,如果是则确定该矩形连通区域的倾斜角度;
判断所述矩形连通区域的最大倾斜角度和最小倾斜角度的差值是否小于设定值;
如果所述矩形连通区域的最大倾斜角度和最小倾斜角度的差值小于设定值,则以所有矩形连通区域的倾斜角度的平均值作为所述非文本类前景的倾斜角度,反之则统计所有矩形连通区域的倾斜角度,并取分布集中的所述矩形连通区域的倾斜角度作为所述非文本类前景的倾斜角度。
在本发明一个实施例中,如果所述图像中有文本类前景,则以所述文本类前景的倾斜角度作为所述图像的倾斜角度。
在本发明一个实施例中,如果所述图像中有非文本类前景,则以所述非文本类前景的倾斜角度作为所述图像的倾斜角度。
在本发明一个实施例中,确定所述图像的倾斜角度包括:
确定所述文本类前景占整体前景的比例权值;
确定所述非文本类前景占整体前景的比例权值;
判断所述文本类前景的比例权值或所述非文本类前景的比例权值是否大于或等于设定比例权值;
如果所述文本类前景的比例权值大于或等于设定比例权值,则以所述文本类前景的倾斜角度作为所述图像的倾斜角度,或者,如果所述非文本类前景的比例权值大于或等于设定比例权值,则以所述非文本类前景的倾斜角度作为所述图像的倾斜角度;
反之则以所述文本类前景的倾斜角度和比例权值,以及所述非文本类前景的倾斜角度和比例权值确定所述图像的倾斜角度。
在本发明一个实施例中,在确定所述文本类前景占整体前景的比例权值时赋于比确定所述非文本类前景占整体前景的比例权值时更高的系数。
根据本发明另一方面,提供了一种图像纠偏装置,其包括
边缘检测模块,其用于对图像进行边缘检测;
前景分类模块,其用于对经过边缘检测的图像进行前景分类,以将所述图像的前景分为文本类前景和非文本类前景;
判断模块,其用于判断是否有文本类前景或非文本类前景;
文本角度确定模块,其用于在有文本类前景时确定文本类前景的倾斜角度;
非文本角度确定模块,其用于在非文本类前景时确定非文本类前景的倾斜角度;
图像角度确定模块,其用于根据所述文本类前景的倾斜角度和/或所述非文本类前景的倾斜角度确定所述图像的倾斜角度;
纠偏模块,其用于根据所述图像的倾斜角度对所述图像进行纠偏。
在本发明一个实施例中,该装置还包括:
预处理模块,其用于对所述图像进行预处理。
在本发明一个实施例中,所述预处理模块包括:
灰度化子模块,其用于使所述图像灰度化;
降噪子模块,其用于对灰度化的所述图像进行降噪处理。
在本发明一个实施例中,所述文本角度确定模块包括:
膨胀子模块,其用于通过膨胀操作使每行/列的文本类前景相连;
矩形子模块,其用于确定每行/列相连的文本类前景的最小外接矩形的倾斜角度;
判断子模块,其用于判断所述最小外接矩形的最大倾斜角度和最小倾斜角度的差值是否小于设定值;
角度确定子模块,其配置为如果所述最小外接矩形的最大倾斜角度和最小倾斜角度的差值小于设定值,则以所有最小外接矩形的倾斜角度的平均值作为所述文本类前景的倾斜角度,反之则统计所有最小外接矩形的倾斜角度,并取分布集中的所述最小外接矩形的倾斜角度作为所述文本类前景的倾斜角度。
在本发明一个实施例中,所述非文本角度确定模块包括:
连通域检测子模块,其用于确定每个所述非文本前景的连通区域;
矩形子模块,其用于判断每个所述连通区域是否矩形,如果是则确定该矩形连通区域的倾斜角度;
判断子模块,其用于判断所述矩形连通区域的最大倾斜角度和最小倾斜角度的差值是否小于设定值;
角度确定子模块,其配置为如果所述矩形连通区域的最大倾斜角度和最小倾斜角度的差值小于设定值,则以所有矩形连通区域的倾斜角度的平均值作为所述非文本类前景的倾斜角度,反之则统计所有矩形连通区域的倾斜角度,并取分布集中的所述矩形连通区域的倾斜角度作为所述非文本类前景的倾斜角度。
在本发明一个实施例中,所述图像角度确定模块配置为在所述图像中有文本类前景时以所述文本类前景的倾斜角度作为所述图像的倾斜角度。
在本发明一个实施例中,所述图像角度确定模块配置为在所述图像中有非文本类前景时以所述非文本类前景的倾斜角度作为所述图像的倾斜角度。
在本发明一个实施例中,所述图像角度确定模块包括:
比例权值确定子模块,其用于确定所述文本类前景占整体前景的比例权值,以及所述非文本类前景占整体前景的比例权值;
判断子模块,其用于判断所述文本类前景的比例权值或所述非文本类前景的比例权值是否大于或等于设定比例权值;
角度确定子模块,其配置为如果所述文本类前景的比例权值大于或等于设定比例权值,则以所述文本类前景的倾斜角度作为所述图像的倾斜角度,或者,如果所述非文本类前景的比例权值大于或等于设定比例权值,则以所述非文本类前景的倾斜角度作为所述图像的倾斜角度;
反之则以所述文本类前景的倾斜角度和比例权值,以及所述非文本类前景的倾斜角度和比例权值确定所述图像的倾斜角度。
在本发明一个实施例中,所述比例权值确定子模块配置为在确定所述文本类前景占整体前景的比例权值时赋于比确定所述非文本类前景占整体前景的比例权值时更高的系数。
根据本发明再一方面,提供了一种图像纠偏设备,能够对图像进行纠偏,所述图像纠偏设备具有存储器和处理器,所述存储器中存储有用于进行图像纠偏的计算机可执行指令,所述计算机可执行指令被处理器执行时,可操作来执行上述的图像纠偏方法。
根据本发明再一方面,提供了一种存储介质,所述存储介质上存储有计算机程序,所述计算机程序在运行时可操作来执行上述的图像纠偏方法。
本发明实施例提供的图像纠偏方法和装置、设备及存储介质,通过对图像前景进行分类,然后分别确定文本类前景和非文本类前景的倾斜角度,从而综合文本类前景和非文本类前景的倾斜角度得到图像的倾斜角度,并且诶由于以文本类前景的外接矩形的倾斜角度和/或非文本类前景的矩形连通区域的倾斜角度来确定图像的倾斜角度,因而无论图像是否有明显的矩形特性,或者为纯文本都可以实现准确的纠偏,且对于前景较少、集中或目标像素点多的图像可以实现快速准确的纠偏。
附图说明
从下面结合附图对本发明实施例的详细描述中,本发明的这些和/或其它方面和优点将变得更加清楚并更容易理解,其中:
图1是用于实现根据本发明实施例的图像纠偏方法和装置的示例电子设备的示意性框图;
图2为根据本发明实施例的图像纠偏方法的示意性流程图;
图3为根据本发明实施例的确定文本类前景倾斜角度的方法的示意性流程图;
图4为根据本发明实施例的确定非文本类前景倾斜角度的方法的示意性流程图;
图5为根据本发明实施例的图像纠偏装置的示意性结构框图;
图6为根据本发明实施例的文本角度确定模块的示意性结构框图;
图7为根据本发明实施例的非文本角度确定模块的示意性结构框图;
图8为根据本发明实施例的图像角度确定模块的示意性结构框图;
图9为根据本发明实施例的图像纠偏系统的示意性结构框图。
具体实施方式
在下文的描述中,给出了大量具体的细节以便提供对本发明更为彻底的理解。然而,对于本领域技术人员来说显而易见的是,本发明实施例可以无需一个或多个这些细节而得以实施。在其他的例子中,为了避免与本发明实施例发生混淆,对于本领域公知的一些技术特征未进行描述。
应当理解的是,本发明能够以不同形式实施,而不应当解释为局限于这里提出的实施例。相反地,提供这些实施例将使公开彻底和完全,并且将本发明的范围完全地传递给本领域技术人员。在附图中,为了清楚,部件、元件等的尺寸以及相对尺寸可能被夸大。自始至终相同附图标记表示相同的元件。
为了使得本发明的目的、技术方案和优点更为明显,下面将参照附图详细描述根据本发明的示例实施例。显然,所描述的实施例仅仅是本发明的一部分实施例,而不是本发明的全部实施例,应理解,本发明不受这里描述的示例实施例的限制。基于本发明中描述的本发明实施例,本领域技术人员在没有付出创造性劳动的情况下所得到的所有其它实施例都应落入本发明的保护范围之内。
首先,参照图1来描述用于实现根据本发明实施例的图像纠偏方法和装置的示例电子设备100。如图1所示,电子设备100包括一个或多个处理器102、一个或多个存储装置104、输入/输出装置106、通信接口108以及一个或多个图像传感器110,这些组件通过总线系统112和/或其它形式的连接机构(未示出)互连。应当注意,图1所示的电子设备100的组件和结构只是示例性的,而非限制性的,根据需要,所述电子设备也可以具有其他组件和结构,也可以不包括前述的部分组件。
所述处理器102一般表示任何类型或形式的能够处理数据或解释和执行指令的处理单元。一般而言,处理器可以是中央处理单元(CPU)或者具有数据处理能力和/或指令执行能力的其它形式的处理单元,并且可以控制所述电子设备100中的其它组件以执行期望的功能。在特定实施例中,处理器102可以接收来自软件应用或模块的指令。这些指令可以导致处理器102完成本文描述和/或示出的一个或多个示例实施例的功能。
所述存储装置104可以包括一个或多个计算机程序产品,所述计算机程序产品可以包括各种形式的计算机可读存储介质,例如易失性存储器和/或非易失性存储器。所述易失性存储器例如可以包括随机存取存储器(RAM)和/或高速缓冲存储器(cache)等。所述非易失性存储器例如可以包括只读存储器(ROM)、硬盘、闪存等。在所述计算机可读存储介质上可以存储一个或多个计算机程序指令,处理器102可以运行所述程序指令,以实现下文所述的本发明实施例中(由处理器实现)的客户端功能以及/或者其它期望的功能。在所述计算机可读存储介质中还可以存储各种应用程序和各种数据,例如所述应用程序使用和/或产生的各种数据等。
所述输入/输出装置106可以是用户用来输入指令和向外部输出各种信息的装置,例如输入装置可以包括键盘、鼠标、麦克风和触摸屏等中的一个或多个。输出装置可以包括显示器、扬声器等中的一个或多个。
通信接口108广泛地表示任何类型或形式的能够促进示例电子设备100和一个或多个附加设备之间的通信的适配器或通信设备。例如,通信接口108可以促进电子设备100和前端或附件电子设备以及后端服务器或云端的通信。通信接口108的示例包括但不限于有线网络接口(诸如网络接口卡)、无线网络接口(诸如无线网络接口卡)、调制解调器和任何其他合适的接口。在一实施例中,通信接口108通过与诸如因特网的网络的直连提供到远程服务器/远程前端设备的直连。在特定实施例中,通信接口108通过与专用网络,例如视频监控网络、天网系统网络等网络的直连提供到远程服务器/远程前端设备的直连。通信接口108还可以间接提供这种通过任何其它合适连接的连接。
所述图像采集单元110可以采集图像,并且将采集的图像存储在所述存储装置104中以供其它组件使用。图像采集单元110可以为各种摄像装置或扫描装置。
示例性地,用于实现根据本发明实施例的图像纠偏方法和装置的示例电子设备可以被实现为诸如智能手机、智能眼镜、平板电脑、便携式电脑、桌面计算机、服务器或云处理器等等。
示例性地,用于实现根据本发明实施例的图像纠偏方法和装置的示例电子设备可以被实现为诸如智能手机、智能眼镜、平板电脑、门禁系统的图像采集端等,以及各种监控、安防领域等的图像采集端或者后端控制处理端或服务器端或云端等等。
下面参考图2描述根据本发明实施例的图像纠偏方法。
本发明实施例公开的图像纠偏方法,用于对图像进行纠偏,以利于观看,如图2所示该方法包括:
步骤S200,对图像进行预处理,以降低减少后续数据运算量和准确性。
示例性地,所述预处理包括:对图像进行灰度化以及对灰度化的所述图像进行降噪处理。
图像的灰度化可以通过各种方法实现,例如第一种方法是求出图像每个像素点的R、G、B三个分量的平均值,然后将这个平均值赋予给这个像素的三个分量。第二种方法是根据YUV的颜色空间中,Y的分量的物理意义是点的亮度,由该值反映亮度等级,根据RGB和YUV颜色空间的变化关系可建立亮度Y与R、G、B三个颜色分量的对应:Y=0.3R+0.59G+0.11B,以这个亮度值表达图像的灰度值。
图像降噪处理可以采用各种降噪方法实现,例如高斯滤波处理。高斯滤波是一种线性平滑滤波,适用于消除高斯噪声,广泛应用于图像处理的减噪过程。简言之,高斯滤波就是对整幅图像进行加权平均的过程,每一个像素点的值,都由其本身和邻域内的其他像素值经过加权平均后得到。高斯滤波的具体操作是:用一个模板(或称卷积、掩模)扫描图像中的每一个像素,用模板确定的邻域内像素的加权平均灰度值去替代模板中心像素点的值。
通过对图像进行灰度化,可以降低后续数据处理的运算量,通过对降噪处理,可以减少图像的噪点,降低噪点的影响。
步骤S201,对图像进行边缘检测,提取所有可能的前景目标轮廓。
周知的两个具有不同灰度值的相邻区域之间总存在边缘,边缘是灰度值不连续的表现。由于边缘是图像上灰度变化最剧烈的地方,边缘检测就是利用了这个特点,对图像各个像素点进行微分或求二阶微分来确定边缘像素点。边缘检测可以通过各种常用的方法实现,例如差分边缘检测方法,Sobel边缘检测方法,Reborts边缘检测方法等。
步骤S202,对经过边缘检测的图像进行前景分类,以将所述图像的前景分为文本类前景和非文本类前景。
通过边缘检测提取所有可能的前景轮廓后,即根据所有的前景轮廓进行分类。示例性地,在本实施例中,可以文字的轮廓基本都是接近于方形这一特征来分类,即轮廓为方形的前景分为文本类前景,非方形的分为非文本类前景。
步骤S203,判断是否有文本类前景,如果有则进入步骤S205。
即判断文本类前景分类是否存在前景,如果有则认为有文本类前景,反之则认为没有。
步骤S204,判断是否有非文本类前景,如果有则进入步骤S206。
即判断非文本类前景分类是否存在前景,如果有则认为有非文本类前景,反之则认为没有。
步骤S205确定所述文本类前景的倾斜角度。
在有文本类前景时,则确定所述文本类前景的倾斜角度。
确定所述文本类前景的倾斜角度的方法将在后文详细描述在此不再赘述。
步骤S206,确定所述非文本类前景的倾斜角度。
在有非文本类前景时,则确定所述非文本类前景的倾斜角度。
确定所述非文本类前景的倾斜角度的方法将在后文详细描述在此不再赘述。
步骤S207,根据所述文本类前景的倾斜角度和/或所述非文本类前景的倾斜角度确定所述图像的倾斜角度。
作为一个示例,如果所述图像中有文本类前景,则以所述文本类前景的倾斜角度作为所述图像的倾斜角度。即如果测重图像中文本的识别或观看,则当图像中有文本类前景,则以所述文本类前景的倾斜角度作为所述图像的倾斜角度,这使得以该角度为基准进行纠偏得到图像可以获得更好的文本纠偏结果以及文本观看体验。
作为另一个示例,如果所述图像中有非文本类前景,则以所述非文本类前景的倾斜角度作为所述图像的倾斜角度。即如果测重图像中非文本(例如非文字的图形)的识别或观看,则当图像中有非文本类前景,则以所述非文本类前景的倾斜角度作为所述图像的倾斜角度,这使得以该角度为基准进行纠偏得到图像可以获得更好的非文本纠偏结果以及非文本观看体验。
作为又一个示例,可以综合文本类前景和非文本前景的倾斜程度和权重来确定图像的倾斜角度。示例性地,确定所述图像的倾斜角度通过下述步骤实现:
确定所述文本类前景占整体前景的比例权值;
确定所述非文本类前景占整体前景的比例权值;
判断所述文本类前景的比例权值或所述非文本类前景的比例权值是否大于或等于设定比例权值,所述设定比例权值例如为60%或其他合适的值。当所述文本类前景的比例权值或所述非文本类前景的比例权值大于或等于设定比例权值时,则表示所述文本类前景的比例权值或所述非文本类前景为图像的主要前景,则以该主要前景为目标进行纠偏。具体地,如果所述文本类前景的比例权值大于或等于设定比例权值,则以所述文本类前景的倾斜角度作为所述图像的倾斜角度,如果所述非文本类前景的比例权值大于或等于设定比例权值,则以所述非文本类前景的倾斜角度作为所述图像的倾斜角度。
反之如果所述文本类前景的比例权值何所述非文本类前景的比例权值均小于设定比例权值时,则表示所述文本类前景的比例权值和所述非文本类前景都不是图像的主要前景,或者二者比重相差不大,则以所述文本类前景的倾斜角度和比例权值,以及所述非文本类前景的倾斜角度和比例权值确定所述图像的倾斜角度。示例性地,图像的倾斜角度等于文本类前景的倾斜角度*权值+非文本类前景的倾斜角度*权值。
示例性地,如果图像纠偏更侧重于文本纠偏,则在确定所述文本类前景占整体前景的比例权值时赋于比确定所述非文本类前景占整体前景的比例权值时更高的系数。例如文本类前景和非文本前景的数量都为10,则赋予文本类前景占整体前景的比例权值为55%,赋予非文本类前景占整体前景的比例权值为45%,这样最后的图像纠偏结果可以保证文本类前景获得更好的纠偏。
步骤S208,根据所述图像的倾斜角度对所述图像进行纠偏。
示例性地,例如通过透视变换方法旋转图像进行纠偏,然后纠偏后的图像输出。所述透视变换方法是利用透视中心、像点、目标点三点共线的条件,按透视旋转定律使承影面(透视面)绕迹线(透视轴)旋转某一角度,破坏原有的投影光线束,仍能保持承影面上投影几何图形不变的变换。
示例性地,根据本实施例的图像纠偏方法可以在具有存储器和处理器的设备、装置或者系统中实现。
根据本实施例的图像纠偏方法通过对图像前景进行分类,然后分别确定文本类前景和非文本类前景的倾斜角度,从而综合文本类前景和非文本类前景的倾斜角度得到图像的倾斜角度,并且诶由于以文本类前景的外接矩形的倾斜角度和/或非文本类前景的矩形连通区域的倾斜角度来确定图像的倾斜角度,因而无论图像是否有明显的矩形特性,或者为纯文本都可以实现准确的纠偏,且对于前景较少、集中或目标像素点多的图像可以实现快速准确的纠偏。
图3为根据本发明实施例的确定文本类前景倾斜角度的方法的示意性流程图。
如图3所示,根据本发明实施例的确定文本类前景倾斜角度的方法包括:
步骤S301,通过膨胀操作使每行/列的文本类前景相连。
腐蚀和膨胀是数学形态学的基本操作,数学形态学的很多操作都是以膨胀和腐蚀为基础推导的算法。膨胀是指将像素加到图像中对象的边缘,而腐蚀是指删除图像中对像的边缘。增加或者删除的像素数目依赖于处理过程中使用的结构元素的大小和形状。而膨胀和腐蚀的形态学操作中,输出像素的任何状态都是输入图像中相应像素与领域像素执行膨胀或者腐蚀运算得到的。
即,膨胀是将与物体接触的全部背景点合并到该物体中,使边界向外部扩张的过程,能够用来填补物体中的空洞。
可以通过各种合适的膨胀方法使每行/列的文本类前景相连,例如基于结构元素分解的方法或基于曼哈顿距离的方法,通过膨胀操作得到二值化的图像,然后可以提取二值化图像的边缘点的集合。
应当理解,在本步骤中可以通过膨胀操作使每列的文本类前景相连,也可以通过膨胀操作使每行列的文本类前景相连,其可以实现文本类前景的角度确定。示例性地,在本实施例中,通过膨胀操作使每列的文本类前景相连。
步骤S302,确定每行/列相连的文本类前景的最小外接矩形的倾斜角度。
通过膨胀操作后得到二值化的图像,并提取二值化图像的边缘点的集合,然后根据该提取二值化图像的边缘点的集合便可以获得二值化图像的边缘。然后根据该边缘可以确定每行/列相连的文本类前景的最小外接矩形,以及该最小外接矩形的倾斜角度。
最小外接矩形及其倾斜角度可以通过各种已知的最小外接矩形方法确定,例如使用opencv(开源库)的接口实现。
步骤S303,判断所述最小外接矩形的最大倾斜角度和最小倾斜角度的差值是否小于设定值。
即计算所述最小外接矩形的最大倾斜角度和最小倾斜角度的差值,然后判断该差值是否小于设定值。所述设定值例如为2度或者其它合适的角度值。如果所述最小外接矩形的最大倾斜角度和最小倾斜角度的差值小于该设定值则表示各个最小外接矩形的倾斜程度基本一致,反之则表示各个最小外接矩形的倾斜程度不一致。
如果所述最小外接矩形的最大倾斜角度和最小倾斜角度的差值小于设定值,则进入步骤S304,以所有最小外接矩形的倾斜角度的平均值作为所述文本类前景的倾斜角度。即由于各最小外接矩形的倾斜角度相差不大,因而以最小外接矩形的倾斜角度的平均值作为所述文本类前景的倾斜角度可以较好的反应所述文本类前景的倾斜程度。
如果所述最小外接矩形的最大倾斜角度和最小倾斜角度的差值大于或等于设定值,则进入步骤S305,统计所有最小外接矩形的倾斜角度,并取分布集中的所述最小外接矩形的倾斜角度作为所述文本类前景的倾斜角度。即由于各最小外接矩形的倾斜角度相差较大,因而以分布集中的所述最小外接矩形的倾斜角度作为所述文本类前景的倾斜角度可以较好的反应所述文本类前景的倾斜程度。
示例性地,根据本实施例的确定文本类前景倾斜角度的方法可以在具有存储器和处理器的设备、装置或者系统中实现。
根据本实施例的确定文本类前景倾斜角度的方法通过膨胀、边缘提取、最小外接矩形确定角度等步骤来确定文本类前景倾斜角度,其对于纯文本图像或图片文字等目标像素点多的图像都可以实现准确快速的纠偏。
图4为根据本发明实施例的确定非文本类前景倾斜角度的方法的示意性流程图。
如图4所示,本发明实施例的确定非文本类前景倾斜角度的方法包括:
步骤S401,确定每个所述非文本前景的连通区域。
每个所述非文本前景的连通区域可以通过连通域检测实现。连通域为图像中具有相同像素值且位置相邻的前景像素点组成的图像区域,连通域检测可以让每个单独的连通区域形成一个被标识的块。连通域检测可以采用各种常用的方法实现,例如轮廓标记方法,two-pass方法等。
步骤S402,判断每个所述连通区域是否矩形,如果是则进入步骤S404,反之则进步步骤S403。
判断每个所述连通区域是否矩形可以通过诸如矩形检出等方法实现。
步骤S403,对于不是矩形的连通区域则舍弃,不计算其倾斜角度,从而降低运算量。
步骤S404,确定该矩形连通区域的倾斜角度。矩形连通区域的倾斜角度可以通过矩形的顶点坐标来确定。
步骤S405,判断所述矩形连通区域的最大倾斜角度和最小倾斜角度的差值是否小于设定值。
即计算矩形连通区域的最大倾斜角度和最小倾斜角度的差值,然后判断该差值是否小于设定值。所述设定值例如为2度或者其它合适的角度值。如果所述矩形连通区域的最大倾斜角度和最小倾斜角度的差值小于该设定值则表示各个矩形连通区域的倾斜程度基本一致,反之则表示各个矩形连通区域的倾斜程度不一致。
如果所述矩形连通区域的最大倾斜角度和最小倾斜角度的差值小于设定值,则进入步骤S406,以所有矩形连通区域的倾斜角度的平均值作为所述非文本类前景的倾斜角度。即由于各矩形连通区域的倾斜角度相差不大,因而以矩形连通区域的倾斜角度的平均值作为所述非文本类前景的倾斜角度可以较好的反应所述非文本类前景的倾斜程度。
如果所述矩形连通区域的最大倾斜角度和最小倾斜角度的差值小于设定值,则进入步骤S407,统计所有矩形连通区域的倾斜角度,并取分布集中的所述矩形连通区域的倾斜角度作为所述非文本类前景的倾斜角度。即由于各矩形连通区域的倾斜角度相差较大,因而以分布集中的所述矩形连通区域的倾斜角度作为所述非文本类前景的倾斜角度可以较好的反应所述非文本类前景的倾斜程度。
示例性地,根据本实施例的确定非文本类前景倾斜角度的方法可以在具有存储器和处理器的设备、装置或者系统中实现。
根据本实施例的确定非文本类前景倾斜角度的方法通过连通区域检测、矩形连通区域确定角度等步骤来确定非文本类前景倾斜角度,其对于没有明显矩形特性或前景目标较为集中的图像可以实现准确快速的纠偏。
图5为根据本发明实施例的图像纠偏装置的示意性结构框图。下面结合图5对根据本发明实施例的图像纠偏装置进行说明。
如图5所示,根据本发明实施例的图像纠偏装置500包括预处理模块510、边缘检测模块520、前景分类模块530、判断模块540、文本角度确定模块550、非文本角度确定模块560、图像角度确定模块570和纠偏模块580。
预处理模块510用于对所述图像进行预处理。示例性地,预处理模块510包括灰度化子模块511和降噪子模块512,灰度化子模块511用于使所述图像灰度化,降噪子模块512用于对灰度化的所述图像进行降噪处理。预处理模块510以及灰度化子模块511和降噪子模块512可以由图1所示的电子设备中的处理器102运行存储装置104中存储的程序指令来实现,并且可以执行根据本发明实施例的图像纠偏方法中的步骤S200。
边缘检测模块520用于对图像进行边缘检测。边缘检测模块520可以由图1所示的电子设备中的处理器102运行存储装置104中存储的程序指令来实现,并且可以执行根据本发明实施例的图像纠偏方法中的步骤S201。
前景分类模块530用于对经过边缘检测的图像进行前景分类,以将所述图像的前景分为文本类前景和非文本类前景。前景分类模块530可以由图1所示的电子设备中的处理器102运行存储装置104中存储的程序指令来实现,并且可以执行根据本发明实施例的图像纠偏方法中的步骤S202。
判断模块540用于判断是否有文本类前景或非文本类前景。判断模块540可以由图1所示的电子设备中的处理器102运行存储装置104中存储的程序指令来实现,并且可以执行根据本发明实施例的图像纠偏方法中的步骤S203-S204。
文本角度确定模块550用于在有文本类前景时确定文本类前景的倾斜角度。文本角度确定模块550可以由图1所示的电子设备中的处理器102运行存储装置104中存储的程序指令来实现,并且可以执行根据本发明实施例的图像纠偏方法中的步骤S205,以及S301至S305。
非文本角度确定模块560用于在非文本类前景时确定非文本类前景的倾斜角度。非文本角度确定模块560可以由图1所示的电子设备中的处理器102运行存储装置104中存储的程序指令来实现,并且可以执行根据本发明实施例的图像纠偏方法中的步骤S206,以及S401-S40。
图像角度确定模块570用于根据所述文本类前景的倾斜角度和/或所述非文本类前景的倾斜角度确定所述图像的倾斜角度。图像角度确定模块570可以由图1所示的电子设备中的处理器102运行存储装置104中存储的程序指令来实现,并且可以执行根据本发明实施例的图像纠偏方法中的步骤S207。
纠偏模块580用于根据所述图像的倾斜角度对所述图像进行纠偏。纠偏模块580可以由图1所示的电子设备中的处理器102运行存储装置104中存储的程序指令来实现,并且可以执行根据本发明实施例的图像纠偏方法中的步骤S208。
示例性地,根据本实施例的图像纠偏装置可以被实现为诸如智能手机、智能眼镜、平板电脑、便携式电脑、桌面计算机、服务器或云处理器等等。
根据本实施例的图像纠偏装置可以实现图2-图4所示的图像纠偏方法,并具有类似的优点,在此不再赘述。
图6为根据本发明实施例的文本角度确定模块的示意性结构框图。如图6所示,根据本发明实施例的文本角度确定模块550包括膨胀子模块551、矩形子模块552、判断子模块553和角度确定子模块554。
膨胀子模块551用于通过膨胀操作使每行/列的文本类前景相连。膨胀子模块551可以由图1所示的电子设备中的处理器102运行存储装置104中存储的程序指令来实现,并且可以执行根据本发明实施例的确定文本类前景倾斜角度的方法中的步骤S301。
矩形子模块552用于确定每行/列相连的文本类前景的最小外接矩形的倾斜角度。矩形子模块552可以由图1所示的电子设备中的处理器102运行存储装置104中存储的程序指令来实现,并且可以执行根据本发明实施例的确定文本类前景倾斜角度的方法中的步骤S302。
判断子模块553用于判断所述最小外接矩形的最大倾斜角度和最小倾斜角度的差值是否小于设定值。判断子模块553可以由图1所示的电子设备中的处理器102运行存储装置104中存储的程序指令来实现,并且可以执行根据本发明实施例的确定文本类前景倾斜角度的方法中的步骤S303。
角度确定子模块554配置为如果所述最小外接矩形的最大倾斜角度和最小倾斜角度的差值小于设定值,则以所有最小外接矩形的倾斜角度的平均值作为所述文本类前景的倾斜角度,反之则统计所有最小外接矩形的倾斜角度,并取分布集中的所述最小外接矩形的倾斜角度作为所述文本类前景的倾斜角度。角度确定子模块554可以由图1所示的电子设备中的处理器102运行存储装置104中存储的程序指令来实现,并且可以执行根据本发明实施例的确定文本类前景倾斜角度的方法中的步骤S304-S305。
示例性地,根据本实施例的文本角度确定模块可以被实现为诸如智能手机、智能眼镜、平板电脑、便携式电脑、桌面计算机、服务器或云处理器等等。
根据本实施例的文本角度确定模块可以实现图3所示的确定文本类前景倾斜角度的方法,并具有类似的优点,在此不再赘述。
图7为根据本发明实施例的非文本角度确定模块的示意性结构框图。如图7所示,根据本发明实施例的非文本角度确定模块560包括连通域检测子模块561、矩形子模块562、判断子模块563和角度确定子模块564。
连通域检测子模块561用于确定每个所述非文本前景的连通区域。连通域检测子模块561可以由图1所示的电子设备中的处理器102运行存储装置104中存储的程序指令来实现,并且可以执行根据本发明实施例的确定非文本类前景倾斜角度的方法中的步骤S401。
矩形子模块562用于判断每个所述连通区域是否矩形,如果是则确定该矩形连通区域的倾斜角度。矩形子模块562可以由图1所示的电子设备中的处理器102运行存储装置104中存储的程序指令来实现,并且可以执行根据本发明实施例的确定非文本类前景倾斜角度的方法中的步骤S402-S404。
判断子模块563用于判断所述矩形连通区域的最大倾斜角度和最小倾斜角度的差值是否小于设定值。判断子模块563可以由图1所示的电子设备中的处理器102运行存储装置104中存储的程序指令来实现,并且可以执行根据本发明实施例的确定非文本类前景倾斜角度的方法中的步骤S405。
角度确定子模块564配置为如果所述矩形连通区域的最大倾斜角度和最小倾斜角度的差值小于设定值,则以所有矩形连通区域的倾斜角度的平均值作为所述非文本类前景的倾斜角度,反之则统计所有矩形连通区域的倾斜角度,并取分布集中的所述矩形连通区域的倾斜角度作为所述非文本类前景的倾斜角度。角度确定子模块564可以由图1所示的电子设备中的处理器102运行存储装置104中存储的程序指令来实现,并且可以执行根据本发明实施例的确定非文本类前景倾斜角度的方法中的步骤S406-S407。
示例性地,根据本实施例的非文本角度确定模块可以被实现为诸如智能手机、智能眼镜、平板电脑、便携式电脑、桌面计算机、服务器或云处理器等等。
根据本实施例的非文本角度确定模块可以实现图4所示的确定非文本类前景倾斜角度的方法,并具有类似的优点,在此不再赘述。
图8为根据本发明实施例的图像角度确定模块的示意性结构框图。如图8所示,根据本发明实施例的图像角度确定模块包括比例权值确定子模块571、判断子模块572和角度确定子模块573。
比例权值确定子模块571用于确定所述文本类前景占整体前景的比例权值,以及所述非文本类前景占整体前景的比例权值。示例性地,所述比例权值确定子模块配置为在确定所述文本类前景占整体前景的比例权值时赋于比确定所述非文本类前景占整体前景的比例权值时更高的系数。比例权值确定子模块571可以由图1所示的电子设备中的处理器102运行存储装置104中存储的程序指令来实现,并且可以执行根据本发明实施例的图像纠偏方法中的步骤S207。
判断子模块572用于判断所述文本类前景的比例权值或所述非文本类前景的比例权值是否大于或等于设定比例权值。判断子模块572可以由图1所示的电子设备中的处理器102运行存储装置104中存储的程序指令来实现,并且可以执行根据本发明实施例的图像纠偏方法中的步骤S207。
角度确定子模块573配置为如果所述文本类前景的比例权值大于或等于设定比例权值,则以所述文本类前景的倾斜角度作为所述图像的倾斜角度,或者,如果所述非文本类前景的比例权值大于或等于设定比例权值,则以所述非文本类前景的倾斜角度作为所述图像的倾斜角度;反之则以所述文本类前景的倾斜角度和比例权值,以及所述非文本类前景的倾斜角度和比例权值确定所述图像的倾斜角度。角度确定子模块573可以由图1所示的电子设备中的处理器102运行存储装置104中存储的程序指令来实现,并且可以执行根据本发明实施例的图像纠偏方法中的步骤S207。
示例性地,根据本实施例的图像角度确定模块可以被实现为诸如智能手机、智能眼镜、平板电脑、便携式电脑、桌面计算机、服务器或云处理器等等。
根据本实施例的图像角度确定模块可以实现图2所示方法中的图像角度确定步骤,并具有类似的优点,在此不再赘述。
图9为根据本发明实施例的图像纠偏系统的示意性结构框图。下面结合图9对根据本发明实施例的图像纠偏系统进行描述。
如图9所示,根据本发明实施例的图像纠偏系统600包括图像采集单元610、存储器620和处理器630。
图像采集610用于采集图像,其可以为各种摄像装置或图像扫描装置。
所述存储器620存储用于实现根据本发明实施例的图像纠偏方法中的相应步骤的程序代码。
所述处理器630用于运行所述存储器620中存储的程序代码,以执行根据本发明实施例的图像纠偏方法的相应步骤,并且用于实现根据本发明实施例的图像纠偏装置中的预处理模块510、边缘检测模块520、前景分类模块530、判断模块540、文本角度确定模块550、非文本角度确定模块560、图像角度确定模块570和纠偏模块580。
在一个实施例中,在所述程序代码被所述处理器630运行时执行以下步骤:
对图像进行边缘检测;
对经过边缘检测的图像进行前景分类,以将所述图像的前景分为文本类前景和非文本类前景;
判断是否有文本类前景,如果有则确定所述文本类前景的倾斜角度;
判断是否有非文本类前景,如果有确定所述非文本类前景的倾斜角度;
根据所述文本类前景的倾斜角度和/或所述非文本类前景的倾斜角度确定所述图像的倾斜角度;
根据所述图像的倾斜角度对所述图像进行纠偏。
示例性地,根据本发明实施例的图像纠偏系统可以实现为具有图像采集单元、存储器、通信接口/单元和处理器的设备、装置或者系统。
根据本发明实施例的图像纠偏系统可以部署为一个整体,例如具有图像采集单元、处理器和存储器的电子设备中,例如智能手机、智能眼镜、监控摄像机等。替代地,根据本发明实施例的图像纠偏系统还可以分布地部署在服务器端(或云端)和图像采集端。
此外,根据本发明实施例,还提供了图像纠偏设备,其包括:一个或多个存储器,用于存储一个或多个计算机程序;一个或多个处理器,当所述一个或多个计算机程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现根据本发明实施例所述的图像纠偏方法。
示例性地,根据本发明实施例的图像纠偏设备可以实现为智能手机、智能眼镜、平板电脑、便携式PC、桌面计算机等设备。
此外,根据本发明实施例,还提供了一种存储介质,在所述存储介质上存储了程序指令,在所述程序指令被计算机或处理器运行时用于执行本发明实施例的图像纠偏方法的相应步骤,并且用于实现根据本发明实施例的图像纠偏装置中的相应模块。所述存储介质例如可以包括智能电话的存储卡、平板电脑的存储部件、个人计算机的硬盘、只读存储器(ROM)、可擦除可编程只读存储器(EPROM)、便携式紧致盘只读存储器(CD-ROM)、USB存储器、或者上述存储介质的任意组合。所述计算机可读存储介质可以是一个或多个计算机可读存储介质的任意组合,例如一个计算机可读存储介质包含用于图像采集的计算机可读的程序代码,另一个计算机可读存储介质包含用于图像纠偏方法的计算机可读的程序代码。
在一个实施例中,所述计算机程序指令在被计算机运行时可以实现根据本发明实施例的图像纠偏装置的各个功能模块,并且/或者可以执行根据本发明实施例的图像纠偏方法。
在一个实施例中,所述计算机程序指令在被计算机运行时执行以下步骤:对图像进行边缘检测;对经过边缘检测的图像进行前景分类,以将所述图像的前景分为文本类前景和非文本类前景;判断是否有文本类前景,如果有则确定所述文本类前景的倾斜角度;判断是否有非文本类前景,如果有确定所述非文本类前景的倾斜角度;根据所述文本类前景的倾斜角度和/或所述非文本类前景的倾斜角度确定所述图像的倾斜角度;根据所述图像的倾斜角度对所述图像进行纠偏。
根据本发明实施例的图像纠偏装置中的各模块可以通过根据本发明实施例的电子设备的处理器运行在存储器中存储的计算机程序指令来实现,或者可以在根据本发明实施例的计算机程序产品的计算机可读存储介质中存储的计算机指令被计算机运行时实现。
根据本发明实施例提供的图像纠偏方法和装置、设备及存储介质,通过对图像前景进行分类,然后分别确定文本类前景和非文本类前景的倾斜角度,从而综合文本类前景和非文本类前景的倾斜角度得到图像的倾斜角度,并且诶由于以文本类前景的外接矩形的倾斜角度和/或非文本类前景的矩形连通区域的倾斜角度来确定图像的倾斜角度,因而无论图像是否有明显的矩形特性,或者为纯文本都可以实现准确的纠偏,且对于前景较少、集中或目标像素点多的图像可以实现快速准确的纠偏。
尽管这里已经参考附图描述了示例实施例,应理解上述示例实施例仅仅是示例性的,并且不意图将本发明的范围限制于此。本领域普通技术人员可以在其中进行各种改变和修改,而不偏离本发明的范围和精神。所有这些改变和修改意在被包括在所附权利要求所要求的本发明的范围之内。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
在本申请所提供的几个实施例中,应该理解到,所揭露的设备和方法,可以通过其它的方式实现。例如,以上所描述的设备实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个设备,或一些特征可以忽略,或不执行。
在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。
类似地,应当理解,为了精简本发明并帮助理解各个发明方面中的一个或多个,在对本发明的示例性实施例的描述中,本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该本发明的方法解释成反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如相应的权利要求书所反映的那样,其发明点在于可以用少于某个公开的单个实施例的所有特征的特征来解决相应的技术问题。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。
本领域的技术人员可以理解,除了特征之间相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。
此外,本领域的技术人员能够理解,尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。
本发明的各个部件实施例可以以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用微处理器或者数字信号处理器(DSP)来实现根据本发明实施例的物品分析设备中的一些模块的一些或者全部功能。本发明还可以实现为用于执行这里所描述的方法的一部分或者全部的装置程序(例如,计算机程序和计算机程序产品)。这样的实现本发明的程序可以存储在计算机可读介质上,或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供。
应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。
以上所述,仅为本发明的具体实施方式或对具体实施方式的说明,本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。本发明的保护范围应以权利要求的保护范围为准。

Claims (10)

1.一种图像纠偏方法,其特征在于,包括:
对图像进行边缘检测;
对经过边缘检测的图像进行前景分类,以将所述图像的前景分为文本类前景和非文本类前景;
判断是否有文本类前景,如果有则确定所述文本类前景的倾斜角度;
判断是否有非文本类前景,如果有确定所述非文本类前景的倾斜角度;
根据所述文本类前景的倾斜角度和/或所述非文本类前景的倾斜角度确定所述图像的倾斜角度;
根据所述图像的倾斜角度对所述图像进行纠偏。
2.根据权利要求1的图像纠偏方法,其特征在于,还包括:
对所述图像进行预处理。
3.根据权利要求2的图像纠偏方法,其特征在于,所述预处理包括:
对所述图像进行灰度化;
对灰度化的所述图像进行降噪处理。
4.根据权利要求1的图像纠偏方法,其特征在于,确定所述文本类前景的倾斜角度包括:
通过膨胀操作使每行/列的文本类前景相连;
确定每行/列相连的文本类前景的最小外接矩形的倾斜角度;
判断所述最小外接矩形的最大倾斜角度和最小倾斜角度的差值是否小于设定值;
如果所述最小外接矩形的最大倾斜角度和最小倾斜角度的差值小于设定值,则以所有最小外接矩形的倾斜角度的平均值作为所述文本类前景的倾斜角度,反之则统计所有最小外接矩形的倾斜角度,并取分布集中的所述最小外接矩形的倾斜角度作为所述文本类前景的倾斜角度。
5.根据权利要求1的图像纠偏方法,其特征在于,确定所述非文本类前景的倾斜角度包括:
确定每个所述非文本前景的连通区域;
判断每个所述连通区域是否矩形,如果是则确定该矩形连通区域的倾斜角度;
判断所述矩形连通区域的最大倾斜角度和最小倾斜角度的差值是否小于设定值;
如果所述矩形连通区域的最大倾斜角度和最小倾斜角度的差值小于设定值,则以所有矩形连通区域的倾斜角度的平均值作为所述非文本类前景的倾斜角度,反之则统计所有矩形连通区域的倾斜角度,并取分布集中的所述矩形连通区域的倾斜角度作为所述非文本类前景的倾斜角度。
6.根据权利要求1的图像纠偏方法,其特征在于,如果所述图像中有文本类前景,则以所述文本类前景的倾斜角度作为所述图像的倾斜角度。
7.根据权利要求1的图像纠偏方法,其特征在于,如果所述图像中有非文本类前景,则以所述非文本类前景的倾斜角度作为所述图像的倾斜角度。
8.一种图像纠偏装置,其特征在于,其特征在于,包括:
边缘检测模块,其用于对图像进行边缘检测;
前景分类模块,其用于对经过边缘检测的图像进行前景分类,以将所述图像的前景分为文本类前景和非文本类前景;
判断模块,其用于判断是否有文本类前景或非文本类前景;
文本角度确定模块,其用于在有文本类前景时确定文本类前景的倾斜角度;
非文本角度确定模块,其用于在非文本类前景时确定非文本类前景的倾斜角度;
图像角度确定模块,其用于根据所述文本类前景的倾斜角度和/或所述非文本类前景的倾斜角度确定所述图像的倾斜角度;
纠偏模块,其用于根据所述图像的倾斜角度对所述图像进行纠偏。
9.一种图像纠偏设备,能够对图像进行纠偏,所述图像纠偏设备具有存储器和处理器,所述存储器中存储有用于进行图像纠偏的计算机可执行指令,所述计算机可执行指令被处理器执行时,可操作来执行权利要求1到7中的任一项所述的图像纠偏方法。
10.一种存储介质,所述存储介质上存储有计算机程序,所述计算机程序在运行时可操作来执行权利要求1到7中的任一项所述的图像纠偏方法。
CN201910202982.5A 2019-03-18 2019-03-18 图像纠偏方法和装置、设备及存储介质 Active CN109948521B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910202982.5A CN109948521B (zh) 2019-03-18 2019-03-18 图像纠偏方法和装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910202982.5A CN109948521B (zh) 2019-03-18 2019-03-18 图像纠偏方法和装置、设备及存储介质

Publications (2)

Publication Number Publication Date
CN109948521A true CN109948521A (zh) 2019-06-28
CN109948521B CN109948521B (zh) 2021-05-11

Family

ID=67008939

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910202982.5A Active CN109948521B (zh) 2019-03-18 2019-03-18 图像纠偏方法和装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN109948521B (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110866525A (zh) * 2019-11-26 2020-03-06 深圳市信联征信有限公司 图像角度矫正方法、装置、计算机设备及存储介质
CN110942435A (zh) * 2019-11-27 2020-03-31 讯飞智元信息科技有限公司 一种文档图像处理的方法和装置
CN112215756A (zh) * 2020-10-19 2021-01-12 珠海奔图电子有限公司 扫描纠偏方法、装置、存储介质及计算机设备
CN112862694A (zh) * 2019-11-12 2021-05-28 合肥欣奕华智能机器有限公司 屏幕位置矫正方法、装置、计算设备和存储介质
WO2021169102A1 (zh) * 2020-02-27 2021-09-02 平安国际智慧城市科技股份有限公司 文本图像处理方法、装置、计算机设备和存储介质

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101149801A (zh) * 2007-10-23 2008-03-26 北京大学 一种复杂结构文档图像倾斜快速检测方法
CN101887521A (zh) * 2010-06-22 2010-11-17 中兴通讯股份有限公司 一种实现文件纠偏的方法及终端
JP2013218411A (ja) * 2012-04-05 2013-10-24 Panasonic Corp 画像処理装置およびこれを備えた原稿読取システム
CN103460249A (zh) * 2011-12-21 2013-12-18 松下电器产业株式会社 图像处理装置以及图像处理方法
CN104202585A (zh) * 2014-09-19 2014-12-10 联想(北京)有限公司 一种控制方法和装置
CN105608455A (zh) * 2015-12-18 2016-05-25 浙江宇视科技有限公司 一种车牌倾斜校正方法及装置
CN105989366A (zh) * 2015-01-30 2016-10-05 深圳市思路飞扬信息技术有限责任公司 文本图像的倾斜角矫正、版面分析方法和助视装置、系统
CN108681729A (zh) * 2018-05-08 2018-10-19 腾讯科技(深圳)有限公司 文本图像矫正方法、装置、存储介质及设备
CN109308476A (zh) * 2018-09-06 2019-02-05 邬国锐 票据信息处理方法、系统及计算机可读存储介质

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101149801A (zh) * 2007-10-23 2008-03-26 北京大学 一种复杂结构文档图像倾斜快速检测方法
CN101887521A (zh) * 2010-06-22 2010-11-17 中兴通讯股份有限公司 一种实现文件纠偏的方法及终端
CN103460249A (zh) * 2011-12-21 2013-12-18 松下电器产业株式会社 图像处理装置以及图像处理方法
JP2013218411A (ja) * 2012-04-05 2013-10-24 Panasonic Corp 画像処理装置およびこれを備えた原稿読取システム
CN104202585A (zh) * 2014-09-19 2014-12-10 联想(北京)有限公司 一种控制方法和装置
CN105989366A (zh) * 2015-01-30 2016-10-05 深圳市思路飞扬信息技术有限责任公司 文本图像的倾斜角矫正、版面分析方法和助视装置、系统
CN105608455A (zh) * 2015-12-18 2016-05-25 浙江宇视科技有限公司 一种车牌倾斜校正方法及装置
CN108681729A (zh) * 2018-05-08 2018-10-19 腾讯科技(深圳)有限公司 文本图像矫正方法、装置、存储介质及设备
CN109308476A (zh) * 2018-09-06 2019-02-05 邬国锐 票据信息处理方法、系统及计算机可读存储介质

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
HONG HAI LIU, XIANG HUA HOU: "The Correction Algorithm Research of Inclination Paper Currency Image", 《ADVANCED MATERIALS RESEARCH》 *
吴军 等: "一种快速的文档图像倾斜角检测算法", 《电子技术与软件工程》 *
康夏艳: "复杂版面分析和病例编号识别", 《中国优秀硕士学位论文全文数据库 信息科技辑》 *

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112862694A (zh) * 2019-11-12 2021-05-28 合肥欣奕华智能机器有限公司 屏幕位置矫正方法、装置、计算设备和存储介质
CN110866525A (zh) * 2019-11-26 2020-03-06 深圳市信联征信有限公司 图像角度矫正方法、装置、计算机设备及存储介质
CN110942435A (zh) * 2019-11-27 2020-03-31 讯飞智元信息科技有限公司 一种文档图像处理的方法和装置
CN110942435B (zh) * 2019-11-27 2023-05-30 讯飞智元信息科技有限公司 一种文档图像处理的方法和装置
WO2021169102A1 (zh) * 2020-02-27 2021-09-02 平安国际智慧城市科技股份有限公司 文本图像处理方法、装置、计算机设备和存储介质
CN112215756A (zh) * 2020-10-19 2021-01-12 珠海奔图电子有限公司 扫描纠偏方法、装置、存储介质及计算机设备
CN112215756B (zh) * 2020-10-19 2024-05-03 珠海奔图电子有限公司 扫描纠偏方法、装置、存储介质及计算机设备

Also Published As

Publication number Publication date
CN109948521B (zh) 2021-05-11

Similar Documents

Publication Publication Date Title
CN109948521A (zh) 图像纠偏方法和装置、设备及存储介质
CN106203305B (zh) 人脸活体检测方法和装置
CN106650662B (zh) 目标对象遮挡检测方法及装置
CN108875731B (zh) 目标识别方法、装置、系统及存储介质
CN109376631B (zh) 一种基于神经网络的回环检测方法及装置
US11682225B2 (en) Image processing to detect a rectangular object
CN111008935B (zh) 一种人脸图像增强方法、装置、系统及存储介质
CN110490181B (zh) 一种基于ocr识别技术的表单填写审核方法、装置、设备以及计算机存储介质
CN106203425B (zh) 字符识别方法及装置
US11657644B2 (en) Automatic ruler detection
Li et al. Automatic comic page segmentation based on polygon detection
CN110136069A (zh) 文本图像矫正方法、装置与电子设备
CN110263682A (zh) 基于轮廓提取的表格识别方法和装置、设备及存储介质
CN109766818A (zh) 瞳孔中心定位方法及系统、计算机设备及可读存储介质
CN111626163A (zh) 一种人脸活体检测方法、装置及计算机设备
CN109214995A (zh) 图片质量的确定方法、装置和服务器
CN110781890A (zh) 身份证识别方法、装置、电子设备及可读取存储介质
CN109087439A (zh) 票据校验方法、终端设备、存储介质及电子设备
CN111179245B (zh) 图像质量检测方法、装置、电子设备和存储介质
CN108353143B (zh) 在不规则形状显示表面上投射图像
CN111008635A (zh) 一种基于ocr的多票据自动识别方法及识别系统
CN115374517A (zh) 布线软件的测试方法、装置、电子设备及存储介质
CN113516131A (zh) 图像处理方法、装置、设备和存储介质
Jiang et al. Video-based document image scanning using a mobile device
CN109902569A (zh) 指纹图像的转换方法、装置和指纹识别方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant