CN108665495A - 图像处理方法及装置、移动终端 - Google Patents

图像处理方法及装置、移动终端 Download PDF

Info

Publication number
CN108665495A
CN108665495A CN201710204524.6A CN201710204524A CN108665495A CN 108665495 A CN108665495 A CN 108665495A CN 201710204524 A CN201710204524 A CN 201710204524A CN 108665495 A CN108665495 A CN 108665495A
Authority
CN
China
Prior art keywords
quadrangle
initial
straight
true
image processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201710204524.6A
Other languages
English (en)
Other versions
CN108665495B (zh
Inventor
孟春芝
蔡进
王浩
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Spreadtrum Communications Shanghai Co Ltd
Original Assignee
Spreadtrum Communications Shanghai Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Spreadtrum Communications Shanghai Co Ltd filed Critical Spreadtrum Communications Shanghai Co Ltd
Priority to CN201710204524.6A priority Critical patent/CN108665495B/zh
Publication of CN108665495A publication Critical patent/CN108665495A/zh
Application granted granted Critical
Publication of CN108665495B publication Critical patent/CN108665495B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20048Transform domain processing
    • G06T2207/20061Hough transform

Abstract

一种图像处理方法及装置、移动终端。所述方法包括:提取输入图像的边缘图像;对提取到的边缘图像进行直线检测;基于直线检测结果,确定初始四边形集合;基于所述初始四边形集合中组成各初始四边形的四条直线是真实边缘的概率,从所述初始四边形集合筛选出真实四边形。应用上述方案,可以提高利用直线检测方法检测图像中四边形区域的准确性。

Description

图像处理方法及装置、移动终端
技术领域
本发明涉及图像处理技术领域,具体涉及一种图像处理方法及装置、移动终端。
背景技术
目前,文档自动检测与矫正功能,已经成为提升手机等终端产品竞争力的一个重要功能。该功能可自动检测待拍摄场景中的身份证、银行卡、名片、PPT等四边形区域,并对变形的四边形进行透视矫正。
由于拍摄场景内可能存在待检测区域与周围区域对比度过低、四边形物体周围有其它物体干扰等问题,因此,对图像中的四边形区域的正确检测是实现文档自动检测与矫正功能的关键。
目前,主要采用基于直线检测的方法来检测图像中四边形区域。但是现有的直线检测方法检测图像中四边形区域的准确性较差。
发明内容
本发明要解决的问题是如何提高利用直线检测方法检测图像中四边形区域的准确性。
为解决上述问题,本发明实施例提供了一种图像处理方法,所述方法包括:提取输入图像的边缘图像;对提取到的边缘图像进行直线检测;基于直线检测结果,确定初始四边形集合;基于所述初始四边形集合中组成各初始四边形的四条直线是真实边缘的概率,从所述初始四边形集合筛选出真实四边形。
可选地,所述提取输入图像的边缘图像包括:利用预设的canny算子提取所述输入图像的边缘图像。
可选地,所述对提取到的边缘图像进行直线检测,包括:利用霍夫变换对提取到的边缘图像进行直线检测。
可选地,所述基于直线检测结果,确定初始四边形集合,包括:按照预设的剔除条件,对检测出的直线进行剔除;基于剔除后的直线,确定初始四边形集合。
可选地,所述按照预设的剔除条件,对检测出的直线进行剔除,包括:当检测出的任意两条直线的斜率的绝对值之差小于预设斜率阈值,且所述两条直线之间的距离小于预设距离阈值时,将所述两条直线合并为一条直线。
可选地,所述基于剔除后的直线,确定初始四边形集合,包括:根据剔除后的直线,分别构造四边形四个顶点的集合;基于所构造的顶点及组成每个顶点的直线,确定相应的初始四边形,得到所述初始四边形集合。
可选地,所述基于剔除后的直线,确定初始四边形集合之后,所述基于直线检测结果,确定初始四边形集合,还包括:基于所述初始四边形的面积,对所述初始四边形集合中的初始四边形进行筛选,得到筛选后的初始四边形集合。
可选地,将直线经过所述边缘图像相应线段的像素点的个数,与所述直线所在初始四边形边长的比值,作为所述直线是真实边缘的概率。
可选地,所述基于所述初始四边形集合中组成各初始四边形的四条直线是真实边缘的概率,从所述初始四边形集合筛选出真实四边形,包括:基于所述初始四边形集合中组成各初始四边形的四条直线是真实边缘的概率,计算得到所述初始四边形集合中各初始四边形为真实四边形的概率;将所述初始四边形集合中真实四边形的概率大于预设概率阈值的四边形作为候选四边形,得到候选四边形集合;将所述候选四边形集合中面积最大的候选四边形,作为所述真实四边形。
可选地,在提取输入图像的边缘图像之前,还包括:对所述输入图像进行降采样处理。
本发明实施例还提供了一种图像处理装置,所述装置包括:提取单元,适于提取输入图像的边缘图像;直线检测单元,适于对提取到的边缘图像进行直线检测;第一检测单元,适于基于直线检测结果,确定初始四边形集合;第二检测单元,适于基于所述初始四边形集合中组成各初始四边形的四条直线是真实边缘的概率,从所述初始四边形集合筛选出真实四边形。
可选地,所述提取单元适于利用预设的canny算子提取所述输入图像的边缘图像。
可选地,所述直线检测单元,适于利用霍夫变换对提取到的边缘图像进行直线检测。
可选地,所述第一检测单元包括:剔除子单元,适于按照预设的剔除条件,对检测出的直线进行剔除;第一检测子单元,适于基于剔除后的直线,确定初始四边形集合。
可选地,所述剔除子单元,适于当检测出的任意两条直线的斜率的绝对值之差小于预设斜率阈值,且所述两条直线之间的距离小于预设距离阈值时,将所述两条直线合并为一条直线。
可选地,所述第一检测子单元,适于根据剔除后的直线,分别构造四边形四个顶点的集合;以及基于所构造的顶点及组成每个顶点的直线,确定相应的初始四边形,得到所述初始四边形集合。
可选地,所述第一检测单元还包括:筛选子单元,适于在第一检测子单元基于剔除后的直线,确定初始四边形集合之后,基于所述初始四边形的面积,对所述初始四边形集合中的初始四边形进行筛选,得到筛选后的初始四边形集合。
可选地,所述直线是真实边缘的概率为直线经过所述边缘图像相应线段的像素点的个数与所述直线所在初始四边形边长的比值。
可选地,所述第二检测单元,包括:计算子单元,适于基于所述初始四边形集合中组成各初始四边形的四条直线是真实边缘的概率,计算得到所述初始四边形集合中各初始四边形为真实四边形的概率;第二检测子单元,适于将所述初始四边形集合中真实四边形的概率大于预设概率阈值的四边形作为候选四边形,得到候选四边形集合;第三检测子单元,适于将所述候选四边形集合中面积最大的候选四边形,作为所述真实四边形。
可选地,所述装置还包括:降采样单元,适于在提取输入图像的边缘图像之前,对所述输入图像进行降采样处理。
本发明实施例还提供了一种移动终端,所述移动终端包括上述任一种的图像处理装置。
相对于现有技术,本发明实施例的优点在于:
采用上述方案,在基于直线检测结果确定初始四边形集合后,基于所述初始四边形集合中组成各初始四边形的四条直线是真实边缘的概率,从所述初始四边形集合筛选出真实四边形,相对于直接从初始四边形集合找出面积最大的四边形作为真实四边形,可以更大程度地保证所检测到的四边形是图像中真实存在的四边形,因此准确性更高。
进一步地,先根据剔除后的直线,分别构造四边形四个顶点的集合,再基于所构造的顶点及组成每个顶点的直线,确定相应的初始四边形,得到所述初始四边形集合,可以避免单一根据四条直线确定初始四边形而产生一些完全不可能是真实四边形的情况,故可以进一步提高图像中四边形区域检测的准确性。
附图说明
图1是本发明实施例中一种图像处理方法的流程图;
图2是本发明实施例中一种真实四边形的筛选示意图;
图3是本发明实施例中一种确定初始四边形集合的方法的流程图;
图4是本发明实施例中一种四边形四个顶点的角度范围示意图;
图5是本发明实施例中一种确定初始四边形的示意图;
图6是本发明实施例提供的一种图像处理装置的结构示意图。
具体实施方式
目前,采用直线检测方法检测图像中四边形区域时,在基于直线检测结果确定初始四边形集合后,直接从初始四边形集合中找出面积最大的四边形作为真实四边形,准确性较差。
针对上述问题,本发明的实施例提供了一种图像处理方法,在基于直线检测结果确定初始四边形集合后,基于所述初始四边形集合中组成各初始四边形的四条直线是真实边缘的概率,从所述初始四边形集合筛选出真实四边形,相对于直接从初始四边形集合找出面积最大的四边形作为真实四边形,可以更大程度地保证所检测到的四边形是图像中真实存在的四边形,因此准确性更高。
为使本发明的上述目的、特征和优点能够更为明显易懂,下面结合附图对本发明的具体实施例作详细地说明。
参照图1,本发明实施例提供了一种图像处理方法,所述方法可以包括如下步骤:
步骤11,提取输入图像的边缘图像。
在本发明的一实施例中,可以利用预设的canny算子提取所述输入图像的边缘图像。利用canny算子提取输入图像的边缘图像,不仅可以抑制噪声,而且可以提高边缘图像的准确性。
步骤12,对提取到的边缘图像进行直线检测。
在本发明的一实施例中,可以利用霍夫变换(Hough Transform)对提取到的边缘图像进行直线检测,即利用点与线的对偶性,将边缘图像空间的给定的曲线通过曲线表达形式变为参数空间的一个点,通过寻找参数空间中的峰值,确定边缘图像中的直线。
步骤13,基于直线检测结果,确定初始四边形集合。
在本发明的一实施例中,为了更加准确地确定初始四边形集合,可以先按照预设的剔除条件,对检测出的直线进行剔除,再基于剔除后的直线,确定初始四边形集合。
在具体实施中,可以根据两条直线的斜率及距离设置所述剔除条件,比如,当检测出的任意两条直线的斜率ki及kj的绝对值之差小于预设斜率阈值ε1,且所述两条直线之间的距离d小于预设距离阈值ε2时,即当|ki-kj|<ε1且d<ε2时,将所述两条直线合并为一条直线。
在具体实施中,基于剔除后的直线,可以采用多种方法确定初始四边形集合,具体不作限制。比如,可以单独根据剔除后的直线确定一初始四边形,也可以同时根据剔除后的直线及四边形的顶点,确定初始四边形。
步骤14,基于所述初始四边形集合中组成各初始四边形的四条直线是真实边缘的概率,从所述初始四边形集合筛选出真实四边形。
在本发明的一实施例中,可以将直线检测得到的直线经过所述边缘图像相应线段的像素点的个数,与所述直线所在初始四边形边长的比值,作为所述直线是真实边缘的概率。其中,直线检测得到的直线通常为直线线段。
在本发明的一实施例中,可以基于所述初始四边形集合中组成各初始四边形的四条直线是真实边缘的概率,计算得到所述初始四边形集合中各初始四边形为真实四边形的概率,进而将所述初始四边形集合中真实四边形的概率最大的四边形作为所述真实四边形。
在本发明的另一实施例中,为了更准确地确定所述真实四边形,可以基于所述初始四边形集合中组成各初始四边形的四条直线是真实边缘的概率,计算得到所述初始四边形集合中各初始四边形为真实四边形的概率,进而将所述初始四边形集合中真实四边形的概率大于预设概率阈值的四边形作为候选四边形,得到候选四边形集合,并将所述候选四边形集合中面积最大的候选四边形,作为所述真实四边形。
图2为本发明实施例中一种真实四边形的筛选示意图。参照图2,虚线线段为提取到的边缘图像,实线线段为直线检测得到的线段。直线检测得到的线段可能只是真实存在直线中的一部分,也就是说,实线线段可能只占虚线线段的一部分。
如图2所示,实线线段l1,l2,l3及l4的延长线可以构成一个四边形,实线线段l1,l2,l5及l4的延长线也可以构成一个四边形。令实线线段l5所在的虚线线段中像素点的个数与实线线段l5所在四边形的边长的比值为x1,实线线段l3所在的虚线线段中像素点的个数与实线线段l3所在四边形的边长的比值为x2。由于x1<x2,因此,实线线段l5是真实边缘的概率小于实线线段l3是真实边缘的概率,故实线线段l1,l2,l3及l4的延长线构成的四边形为真实四边形的可能性更高。
根据组成各初始四边形的四条直线是真实边缘的概率,计算得到所述初始四边形集合中各初始四边形为真实四边形的概率。此时,既可以直接将对应的真实四边形的概率最大的初始四边形作为真实四边形,也可以先将真实四边形的概率大于预设概率阈值的四边形作为候选四边形集合,再从四边形集合中选出面积最大的四边形,作为真实四边形。其中,概率阈值可以根据实际情况进行设定。
在具体实施中,获得候选四边形集合后,还可以采用其它方法从候选四边形集合选出真实四边形,并不限于上述通过面积筛选的方式。
在本发明的一实施例中,为了提高四边形区域的检测速度,并减少图像中细小纹理的干扰,在提取输入图像的边缘图像之前,可以先对输入图像进行降采样处理,在基于降采样后的输入图像进行后续的四边形区域检测。比如,可以将输入图像降采样到320*240大小,在320*240输入图像的基础上,执行上述步骤11至14。
由上述内容可知,结合边缘图像以及检测得到的直线,通过先判定组成初始四边形的四条直线是真实存在的边缘的概率,进而判定对应的初始四边形是真实四边形的概率,可以更大程度的保证检测到的初始四边形是图像中真实存在的四边形,有效提高四边形区域检测成功的概率。
在本发明的一实施例中,参照图3,为了进一步提高图像中四边形区域检测的准确性,可以采用如下方法确定所述初始四边形集合:
步骤31,基于剔除后的直线,构造四边形四个顶点的集合。
具体地,可以先根据剔除后的直线,构造四边形左上角、右上角、左下角、右下角四个顶点的集合。
图4中包含四边形四个顶点的角度范围示意图,其中有四个子图:图4(a)表示两条直线的夹角可以作为左上角顶点的情况示意图,图4(b)表示两条直线的夹角可以作为右上角顶点的情况示意图,图4(c)表示两条直线的夹角可以作为左下角顶点的情况示意图,图4(d)表示两条直线的夹角可以作为右下角顶点的情况示意图。
下面结合图4,对如何构造四边形左上角、右上角、左下角、右下角四个顶点的集合进行详细说明。
在具体实施中,矩形畸变成普通四边形时其四个角的取值范围在30度到150度范围内。
参照图4(a),以图像的左上角顶点为原点,沿水平向右横坐标依次增大,沿竖直向下纵坐标依次增大。
在具体实施中,可以将满足以下任意一种约束条件的两条线段的交点判定为左上角的顶点:
1)两条线段的纵坐标都大于交点的纵坐标,同时两条线段的最大横坐标不都小于交点的横坐标,且该两条线段的夹角位于30度到150度范围内;
2)两条线段中,其中一条线段的纵坐标都大于交点的纵坐标,另一条线段的纵坐标都小于交点的纵坐标,同时该两条线段的最小横坐标都大于交点的横坐标,且该两条线段的夹角位于30度到150度范围内;
3)两条线段中,其中一条线段的横坐标都大于交点横坐标,并且该线段的纵坐标都小于交点纵坐标,而另一条线段的横坐标都小于交点横坐标,并且纵坐标都大于交点纵坐标,且该两条线段的夹角位于30度到150度范围内。
参照图4(b),以图像的右上角顶点为原点,沿水平向右横坐标依次增大,沿竖直向下纵坐标依次增大。
在具体实施中,可以将满足以下任意一种约束条件的两条线段的交点判定为右上角的顶点:
1)两条线段的纵坐标都大于交点的纵坐标,同时该两条线段的最小横坐标不都大于交点的横坐标,且该两条线段的夹角位于30度到150度范围内;
2)两条线段中,其中一条两条线段的纵坐标都大于交点的纵坐标,另一条线段的纵坐标都小于交点的纵坐标,且该两条线段的最大的横坐标都小于交点的横坐标,该两条线段的夹角位于30度到150度范围内;
3)两条线段中,其中一条两条线段的横坐标都小于交点横坐标,纵坐标小于交点纵坐标,而另一条线段的横坐标都大于交点横坐标,纵坐标大于交点纵坐标,并且该两条线段的夹角位于30度到150度范围内。
参照图4(c),以图像的左下角顶点为原点,沿水平向右横坐标依次增大,沿竖直向下纵坐标依次增大。
在具体实施中,可以将满足以下任意一种约束条件的两条线段的交点判定为左下角的顶点:
1)两条线段的纵坐标都小于交点的纵坐标,同时该两条线段的最大横坐标不都小于交点的横坐标,且该两条线段的夹角位于30度到150度范围内;
2)两条线段中,其中一条线段的纵坐标大于交点的纵坐标,另一条线段的纵坐标小于交点的纵坐标,且该两条线段的最小横坐标都大于交点的横坐标,该两条线段的夹角位于30度到150度范围内;
3)两条线段中,其中一条线段的横坐标都大于交点横坐标,纵坐标都大于交点纵坐标,另一条线段的横坐标都小于交点横坐标,纵坐标都小于交点纵坐标,而且该两条线段的夹角位于30度到150度范围内。
参照图4(d),以图像的右下角顶点为原点,沿水平向右横坐标依次增大,沿竖直向下纵坐标依次增大。
在具体实施中,可以将满足以下任意一种约束条件的两条线段的交点判定为右下角的顶点:
1)两条线段的纵坐标都小于交点的纵坐标,同时两条线段的最小横坐标不都大于交点的横坐标,且该两条线段的夹角位于30度到150度范围内;
2)两条线段中,其中一条线段的纵坐标都大于交点的纵坐标,另一条线段的纵坐标小于交点的纵坐标,且该两条线段的最大的横坐标都小于交点的横坐标,该两条线段的夹角位于30度到150度范围内;
3)两条线段中,其中一条线段的横坐标都小于交点横坐标,纵坐标都大于交点纵坐标,而另一条线段横坐标都大于交点横坐标,纵坐标都小于交点纵坐标,而且该两条线段的夹角位于30度到150度范围内。
步骤32,基于所构造的顶点及组成每个顶点的直线,确定相应的初始四边形,得到所述初始四边形集合。
在具体实施中,确定四边形的四个顶点的集合后,可以基于所构造的顶点及组成每个顶点的直线,确定相应的初始四边形。
比如,参照图5,可以从左上角顶点的集合中,选择其中一个左上角顶点α,假设顶点α由l1及l4两条直线构成,此时,可以从右上角集合中选择由l1构成的右上角顶点作为候选右上角顶点集合。然后从候选右上角顶点集合中选择一个右上角顶点β,假设顶点β由l2及l1两条直线构成,此时,可以从右下角顶点集合中选择由l2构成的右下角顶点作为候选右下角顶点集合。然后从候选右下角顶点集合中选择一个右下角顶点γ,假设顶点γ由l3及l2两条直线构成,此时,可以再从左下角顶点集合中选择由l3及l4构成的顶点作为左下角顶点ξ。顶点α、β、γ及ξ,以及直线l1、l2、l3及l4组成一个初始四边形。
重新从左上角顶点集合中选择一个左上角顶点,按照上述过程,确定另一初始四边形,直到遍历完整个左上角顶点集合。
在具体实施中,当然也可以先从其它顶点集合中选择相应顶点,按照逆时针或顺时针顺序,确定相应的四边形,具体不作限制。
在本发明的另一实施例中,基于剔除后的直线,确定初始四边形集合之后,上述方法还可以包括:
步骤33,基于所述初始四边形的面积,对所述初始四边形集合中的初始四边形进行筛选,得到筛选后的初始四边形集合。
在具体实施中,可以预先设置一面积阈值,当得到的初始四边形的面积大于该面积阈值时,保留该初始四边形,否则删除该初始四边形,最终保留下来的初始四边形构成初始四边形集合。
在具体实施中,所述面积阈值的大小可以根据情况设定,比如,可以设置所述面积阈值为输入图像面积的三分之一。
由上述内容可知,根据直线的位置以及构成的夹角信息确定初始四边形的四个顶点的集合,通过遍历四个顶点的集合,确定图像中存在的初始四边形,克服了单一的根据四条直线确定初始四边形时所产生的许多完全不可能是真实的四边形的情况,提高四边形区域检测的准确性。
为了使本领域技术人员更好地理解和实现本发明,以下对上述图像处理方法对应的图像处理装置及移动终端进行详细描述。
参照图6,本发明实施例提供了一种图像处理装置60,所述装置60可以包括:提取单元61,直线检测单元62,第一检测单元63及第二检测单元64。其中:
所述提取单元61,适于提取输入图像的边缘图像;
所述直线检测单元62,适于对提取到的边缘图像进行直线检测;
所述第一检测单元63,适于基于直线检测结果,确定初始四边形集合;
所述第二检测单元64,适于基于所述初始四边形集合中组成各初始四边形的四条直线是真实边缘的概率,从所述初始四边形集合筛选出真实四边形。
在本发明的一实施例中,所述提取单元61适于利用预设的canny算子提取所述输入图像的边缘图像。
在本发明的一实施例中,所述直线检测单元62,适于利用霍夫变换对提取到的边缘图像进行直线检测。
在本发明的一实施例中,所述第一检测单元63可以包括:剔除子单元631及第一检测子单元632,其中:
所述剔除子单元631,适于按照预设的剔除条件,对检测出的直线进行剔除;
所述第一检测子单元632,适于基于剔除后的直线,确定初始四边形集合。
在本发明的一实施例中,所述剔除子单元631,适于当检测出的任意两条直线的斜率的绝对值之差小于预设斜率阈值,且所述两条直线之间的距离小于预设距离阈值时,将所述两条直线合并为一条直线。
所述第一检测子单元632,适于根据剔除后的直线,分别构造四边形四个顶点的集合;以及基于所构造的顶点及组成每个顶点的直线,确定相应的初始四边形,得到所述初始四边形集合。
在本发明的一实施例中,所述第一检测单元63还可以包括:筛选子单元(未示出)。所述筛选子单元,适于在第一检测子单元基于剔除后的直线,确定初始四边形集合之后,基于所述初始四边形的面积,对所述初始四边形集合中的初始四边形进行筛选,得到筛选后的初始四边形集合。
在本发明的一实施例中,所述直线是真实边缘的概率为所述将直线经过所述边缘图像相应线段像素点的个数与所述直线所在初始四边形边长的比值。
本发明的一实施例中,所述第二检测单元64可以包括:计算子单元641,第二检测子单元642及第三检测子单元643,其中:
所述计算子单元641,适于基于所述初始四边形集合中组成各初始四边形的四条直线是真实边缘的概率,计算得到所述初始四边形集合中各初始四边形为真实四边形的概率;
所述第二检测子单元642,适于将所述初始四边形集合中真实四边形的概率大于预设概率阈值的四边形作为候选四边形,得到候选四边形集合;
所述第三检测子单元643,适于将所述候选四边形集合中面积最大的候选四边形,作为所述真实四边形。
在本发明的一实施例中,所述装置60还可以包括:降采样单元65,适于在提取输入图像的边缘图像之前。对所述输入图像进行降采样处理。
本发明实施例还提供了一种移动终端,所述移动终端可以包括上述的图像处理装置60。利用所述图像处理装置60,移动终端可以准确检测出拍摄图像中的四边形区域,进而可以更好地实现文档矫正等功能。
可以理解的是,本发明实施例中的图像处理装置60,不仅可以应用于文档矫正功能中,还可以应用于其它需要检测图像中四边形区域的场景或功能中,此处不再一一列举。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:ROM、RAM、磁盘或光盘等。
虽然本发明披露如上,但本发明并非限定于此。任何本领域技术人员,在不脱离本发明的精神和范围内,均可作各种更动与修改,因此本发明的保护范围应当以权利要求所限定的范围为准。

Claims (21)

1.一种图像处理方法,其特征在于,包括:
提取输入图像的边缘图像;
对提取到的边缘图像进行直线检测;
基于直线检测结果,确定初始四边形集合;
基于所述初始四边形集合中组成各初始四边形的四条直线是真实边缘的概率,从所述初始四边形集合筛选出真实四边形。
2.如权利要求1所述的图像处理方法,其特征在于,所述提取输入图像的边缘图像包括:
利用预设的canny算子提取所述输入图像的边缘图像。
3.如权利要求1所述的图像处理方法,其特征在于,所述对提取到的边缘图像进行直线检测,包括:
利用霍夫变换对提取到的边缘图像进行直线检测。
4.如权利要求1所述的图像处理方法,其特征在于,所述基于直线检测结果,确定初始四边形集合,包括:
按照预设的剔除条件,对检测出的直线进行剔除;
基于剔除后的直线,确定初始四边形集合。
5.如权利要求4所述的图像处理方法,其特征在于,所述按照预设的剔除条件,对检测出的直线进行剔除,包括:
当检测出的任意两条直线的斜率的绝对值之差小于预设斜率阈值,且所述两条直线之间的距离小于预设距离阈值时,将所述两条直线合并为一条直线。
6.如权利要求4所述的图像处理方法,其特征在于,所述基于剔除后的直线,确定初始四边形集合,包括:
根据剔除后的直线,分别构造四边形四个顶点的集合;
基于所构造的顶点及组成每个顶点的直线,确定相应的初始四边形,得到所述初始四边形集合。
7.如权利要求6所述的图像处理方法,其特征在于,所述基于剔除后的直线,确定初始四边形集合之后,所述基于直线检测结果,确定初始四边形集合,还包括:
基于所述初始四边形的面积,对所述初始四边形集合中的初始四边形进行筛选,得到筛选后的初始四边形集合。
8.如权利要求6或7所述的图像处理方法,其特征在于,将直线经过所述边缘图像相应线段的像素点的个数,与所述直线所在初始四边形边长的比值,作为所述直线是真实边缘的概率。
9.如权利要求8所述的图像处理方法,其特征在于,所述基于所述初始四边形集合中组成各初始四边形的四条直线是真实边缘的概率,从所述初始四边形集合筛选出真实四边形,包括:
基于所述初始四边形集合中组成各初始四边形的四条直线是真实边缘的概率,计算得到所述初始四边形集合中各初始四边形为真实四边形的概率;
将所述初始四边形集合中真实四边形的概率大于预设概率阈值的四边形作为候选四边形,得到候选四边形集合;
将所述候选四边形集合中面积最大的候选四边形,作为所述真实四边形。
10.如权利要求1所述的图像处理方法,其特征在于,在提取输入图像的边缘图像之前,还包括:
对所述输入图像进行降采样处理。
11.一种图像处理装置,其特征在于,包括:
提取单元,适于提取输入图像的边缘图像;
直线检测单元,适于对提取到的边缘图像进行直线检测;
第一检测单元,适于基于直线检测结果,确定初始四边形集合;
第二检测单元,适于基于所述初始四边形集合中组成各初始四边形的四条直线是真实边缘的概率,从所述初始四边形集合筛选出真实四边形。
12.如权利要求11所述的图像处理装置,其特征在于,所述提取单元适于利用预设的canny算子提取所述输入图像的边缘图像。
13.如权利要求11所述的图像处理装置,其特征在于,所述直线检测单元,适于利用霍夫变换对提取到的边缘图像进行直线检测。
14.如权利要求11所述的图像处理装置,其特征在于,所述第一检测单元包括:
剔除子单元,适于按照预设的剔除条件,对检测出的直线进行剔除;
第一检测子单元,适于基于剔除后的直线,确定初始四边形集合。
15.如权利要求14所述的图像处理装置,其特征在于,所述剔除子单元,适于当检测出的任意两条直线的斜率的绝对值之差小于预设斜率阈值,且所述两条直线之间的距离小于预设距离阈值时,将所述两条直线合并为一条直线。
16.如权利要求14所述的图像处理装置,其特征在于,所述第一检测子单元,适于根据剔除后的直线,分别构造四边形四个顶点的集合;以及基于所构造的顶点及组成每个顶点的直线,确定相应的初始四边形,得到所述初始四边形集合。
17.如权利要求16所述的图像处理装置,其特征在于,所述第一检测单元还包括:
筛选子单元,适于在第一检测子单元基于剔除后的直线,确定初始四边形集合之后,基于所述初始四边形的面积,对所述初始四边形集合中的初始四边形进行筛选,得到筛选后的初始四边形集合。
18.如权利要求16或17所述的图像处理装置,其特征在于,所述直线是真实边缘的概率为直线经过所述边缘图像相应线段的像素点的个数与所述直线所在初始四边形边长的比值。
19.如权利要求18所述的图像处理装置,其特征在于,所述第二检测单元,包括:
计算子单元,适于基于所述初始四边形集合中组成各初始四边形的四条直线是真实边缘的概率,计算得到所述初始四边形集合中各初始四边形为真实四边形的概率;
第二检测子单元,适于将所述初始四边形集合中真实四边形的概率大于预设概率阈值的四边形作为候选四边形,得到候选四边形集合;
第三检测子单元,适于将所述候选四边形集合中面积最大的候选四边形,作为所述真实四边形。
20.如权利要求11所述的图像处理装置,其特征在于,还包括:降采样单元,适于在提取输入图像的边缘图像之前,对所述输入图像进行降采样处理。
21.一种移动终端,其特征在于,包括权利要求11至20任一项所述的图像处理装置。
CN201710204524.6A 2017-03-30 2017-03-30 图像处理方法及装置、移动终端 Active CN108665495B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710204524.6A CN108665495B (zh) 2017-03-30 2017-03-30 图像处理方法及装置、移动终端

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710204524.6A CN108665495B (zh) 2017-03-30 2017-03-30 图像处理方法及装置、移动终端

Publications (2)

Publication Number Publication Date
CN108665495A true CN108665495A (zh) 2018-10-16
CN108665495B CN108665495B (zh) 2021-11-26

Family

ID=63785651

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710204524.6A Active CN108665495B (zh) 2017-03-30 2017-03-30 图像处理方法及装置、移动终端

Country Status (1)

Country Link
CN (1) CN108665495B (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110135412A (zh) * 2019-04-30 2019-08-16 北京邮电大学 名片识别方法和装置
CN112507759A (zh) * 2019-09-16 2021-03-16 中国银联股份有限公司 用于识别银行卡的图像处理方法以及图像处理装置
CN113255413A (zh) * 2020-02-13 2021-08-13 北京小米松果电子有限公司 确定文档边框的方法、装置及介质
WO2022087846A1 (zh) * 2020-10-27 2022-05-05 Oppo广东移动通信有限公司 图像的处理方法、装置、设备以及存储介质
CN116962816A (zh) * 2023-09-20 2023-10-27 世优(北京)科技有限公司 设置植入标识的方法、装置、电子设备及存储介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102236784A (zh) * 2010-05-07 2011-11-09 株式会社理光 屏幕区域检测方法及系统
CN104835184A (zh) * 2014-02-10 2015-08-12 成都理想境界科技有限公司 图像中四边形区域的提取方法
CN105096299A (zh) * 2014-05-08 2015-11-25 北京大学 多边形检测方法和多边形检测装置
CN105654097A (zh) * 2015-12-29 2016-06-08 上海珍岛信息技术有限公司 图像中四边形标记物的检测方法
CN106127730A (zh) * 2015-03-30 2016-11-16 美国西门子医疗解决公司 使用机器学习和扩展的霍夫变换的自动化感兴趣区域检测
WO2016207875A1 (en) * 2015-06-22 2016-12-29 Photomyne Ltd. System and method for detecting objects in an image

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102236784A (zh) * 2010-05-07 2011-11-09 株式会社理光 屏幕区域检测方法及系统
CN104835184A (zh) * 2014-02-10 2015-08-12 成都理想境界科技有限公司 图像中四边形区域的提取方法
CN105096299A (zh) * 2014-05-08 2015-11-25 北京大学 多边形检测方法和多边形检测装置
CN106127730A (zh) * 2015-03-30 2016-11-16 美国西门子医疗解决公司 使用机器学习和扩展的霍夫变换的自动化感兴趣区域检测
WO2016207875A1 (en) * 2015-06-22 2016-12-29 Photomyne Ltd. System and method for detecting objects in an image
CN105654097A (zh) * 2015-12-29 2016-06-08 上海珍岛信息技术有限公司 图像中四边形标记物的检测方法

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110135412A (zh) * 2019-04-30 2019-08-16 北京邮电大学 名片识别方法和装置
CN110135412B (zh) * 2019-04-30 2021-05-11 北京邮电大学 名片识别方法和装置
CN112507759A (zh) * 2019-09-16 2021-03-16 中国银联股份有限公司 用于识别银行卡的图像处理方法以及图像处理装置
CN113255413A (zh) * 2020-02-13 2021-08-13 北京小米松果电子有限公司 确定文档边框的方法、装置及介质
CN113255413B (zh) * 2020-02-13 2024-04-05 北京小米松果电子有限公司 确定文档边框的方法、装置及介质
WO2022087846A1 (zh) * 2020-10-27 2022-05-05 Oppo广东移动通信有限公司 图像的处理方法、装置、设备以及存储介质
CN116962816A (zh) * 2023-09-20 2023-10-27 世优(北京)科技有限公司 设置植入标识的方法、装置、电子设备及存储介质
CN116962816B (zh) * 2023-09-20 2023-12-12 世优(北京)科技有限公司 设置植入标识的方法、装置、电子设备及存储介质

Also Published As

Publication number Publication date
CN108665495B (zh) 2021-11-26

Similar Documents

Publication Publication Date Title
US11798253B2 (en) Determining a position of an object in a rotation corrected image
CN108665495A (zh) 图像处理方法及装置、移动终端
US10360689B2 (en) Detecting specified image identifiers on objects
US10210415B2 (en) Method and system for recognizing information on a card
EP3306562B1 (en) Image processing method and device
CN104504669B (zh) 一种基于局部二值模式的中值滤波检测方法
CN110866871A (zh) 文本图像矫正方法、装置、计算机设备及存储介质
US10747993B2 (en) Detecting a fragmented object in an image
US20180025246A1 (en) Realtime object measurement
KR20110057536A (ko) 문자인식장치 및 그 제어방법
WO2016029555A1 (zh) 图像插值方法和装置
US20220058422A1 (en) Character recognition method and terminal device
CN109313705B (zh) 指纹识别方法、装置、设备及存储介质
CN111899270A (zh) 卡片边框检测方法、装置、设备及可读存储介质
EP3163604A1 (en) Position detection apparatus, position detection method, information processing program, and storage medium
KR101725501B1 (ko) 문자 인식 방법 및 장치
US10275888B2 (en) Algorithmic method for detection of documents in images
JP6221283B2 (ja) 画像処理装置、画像処理方法および画像処理プログラム
CN108304840B (zh) 一种图像数据处理方法以及装置
JP2008084109A (ja) 目開閉判定装置及び目開閉判定方法
US20220198814A1 (en) Image dewarping with curved document boundaries
JP7435191B2 (ja) 情報処理装置及び情報処理プログラム
KR101373405B1 (ko) 식물 영상에 대한 객체 검출 방법 및 장치
JP6121768B2 (ja) 画像検出装置及び制御プログラム並びに画像検出方法
CN109670519B (zh) 图像处理装置和图像处理方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant