CN103455996B - 边缘提取方法和设备 - Google Patents
边缘提取方法和设备 Download PDFInfo
- Publication number
- CN103455996B CN103455996B CN201210177743.7A CN201210177743A CN103455996B CN 103455996 B CN103455996 B CN 103455996B CN 201210177743 A CN201210177743 A CN 201210177743A CN 103455996 B CN103455996 B CN 103455996B
- Authority
- CN
- China
- Prior art keywords
- gradient
- edge
- extracted
- trend
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims abstract description 74
- 239000000284 extract Substances 0.000 claims abstract description 24
- 238000005728 strengthening Methods 0.000 claims abstract description 10
- 238000012545 processing Methods 0.000 claims description 10
- 238000001514 detection method Methods 0.000 claims description 6
- 230000001915 proofreading effect Effects 0.000 claims description 4
- 238000003384 imaging method Methods 0.000 abstract description 12
- 210000003141 lower extremity Anatomy 0.000 description 9
- 238000012937 correction Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 238000000605 extraction Methods 0.000 description 4
- 230000006978 adaptation Effects 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 238000004590 computer program Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- RNAMYOYQYRYFQY-UHFFFAOYSA-N 2-(4,4-difluoropiperidin-1-yl)-6-methoxy-n-(1-propan-2-ylpiperidin-4-yl)-7-(3-pyrrolidin-1-ylpropoxy)quinazolin-4-amine Chemical compound N1=C(N2CCC(F)(F)CC2)N=C2C=C(OCCCN3CCCC3)C(OC)=CC2=C1NC1CCN(C(C)C)CC1 RNAMYOYQYRYFQY-UHFFFAOYSA-N 0.000 description 1
- 206010061619 Deformity Diseases 0.000 description 1
- 241000406668 Loxodonta cyclotis Species 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 230000000052 comparative effect Effects 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000009499 grossing Methods 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 238000012804 iterative process Methods 0.000 description 1
- 239000007788 liquid Substances 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 230000003313 weakening effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/20—Image enhancement or restoration using local operators
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/12—Edge-based segmentation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/73—Deblurring; Sharpening
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/181—Segmentation; Edge detection involving edge growing; involving edge linking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10004—Still image; Photographic image
- G06T2207/10008—Still image; Photographic image from scanner, fax or copier
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20172—Image enhancement details
- G06T2207/20192—Edge enhancement; Edge preservation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30176—Document
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Image Analysis (AREA)
- Image Processing (AREA)
Abstract
本发明公开了一种边缘提取方法和设备,该边缘提取方法包括:梯度估计步骤,用于估计所捕获的图像中的各个像素的梯度;梯度调整步骤,用于通过增强所捕获的图像中包含的对象的目标边缘的梯度并且减弱噪声边缘的梯度来调整所估计的梯度,以将调整后的梯度作为当前梯度;以及边缘提取步骤,用于基于当前梯度,提取对象的边缘。根据本发明的实施例,在利用非接触式成像装置来捕获图像的情况下,可以更准确地提取所捕获的图像中包含的对象的边缘。
Description
技术领域
本发明涉及一种边缘提取方法和设备,更具体地,涉及一种能够通过自适应地增强目标边缘的梯度同时减弱噪声边缘的梯度并且去除可能存在的干扰梯度而准确地提取目标边缘的边缘提取方法和设备。
背景技术
与传统的平板扫描仪相比,一些非接触式成像装置(诸如顶置式扫描仪或数码摄像装置等)不仅能够对平面物体张进行成像,而且能够对具有一定厚度的物体成像。例如,可以利用顶置式扫描仪对书进行成像而无需将其分成单页形式。然而,由于受到曲面成像模式的限制,扫描得到的书本图像会存在曲面变形。因此,通常采用基于上下轮廓的矫正模型来对曲面变形进行矫正,并且为了保证矫正结果的精度,需要提取当前页的页面边缘。
传统的边缘提取方法通常是通过跟踪具有最大梯度和的曲线来检测物体的边缘。然而,例如,如图1和图2所示,对于利用例如顶置式成像装置对诸如书的厚物体进行成像得到的图像而言,由于当前页的边缘(即,目标边缘)附近通常存在有其它页的边缘(即,噪声边缘),因此,如果采用基于梯度的方法来对页面边缘进行跟踪,其它页的边缘会影响对当前页的边缘的跟踪结果的准确性。此外,当前页的边缘附近的内容梯度也可能会影响跟踪结果的准确性。
发明内容
在下文中给出了关于本发明的简要概述,以便提供关于本发明的某些方面的基本理解。但是,应当理解,这个概述并不是关于本发明的穷举性概述。它并不是意图用来确定本发明的关键性部分或重要部分,也不是意图用来限定本发明的范围。其目的仅仅是以简化的形式给出关于本发明的某些概念,以此作为稍后给出的更详细描述的前序。
因此,鉴于以上情形,本发明的目的是提供一种能够通过自适应地增强目标边缘的梯度同时减弱噪声边缘的梯度,以基于梯度的方法来准确地提取物体边缘的方法和设备。此外,该边缘提取方法和设备还可以针对边缘跟踪的结果,利用迭代式的边缘检测和校正操作来剔除可能存在的干扰梯度并更新边缘跟踪结果,从而进一步提高边缘跟踪的准确性。
因此,为了实现上述目的,根据本发明的实施例的一方面,提供了一种边缘提取方法,该方法可以包括:梯度估计步骤,用于估计所捕获的图像中的各个像素的梯度;梯度调整步骤,用于通过增强所捕获的图像中包含的对象的目标边缘的梯度并且减弱噪声边缘的梯度来调整所估计的梯度,以将调整后的梯度作为当前梯度;以及边缘提取步骤,用于基于当前梯度,提取对象的边缘。
根据本发明的优选实施例,在梯度调整步骤中,可以利用基于各个像素点的预定的两个相邻区域之间的梯度差而确定的权重对所估计的梯度进行加权,从而增强目标边缘的梯度并减弱噪声边缘的梯度。
根据本发明的另一优选实施例,可以基于以下公式来确定权重:TB=Dt/(Db+∈),其中,Dt=max{f(Nt)}-min{f(Nt)},Db=max{f(Nb)}-min{f(Nb)},Nt、Nb表示各个像素点的预定的两个相邻区域,Dt表示区域Nt中的最大梯度与最小梯度之差,Db表示区域Nb中的最大梯度与最小梯度之差,且Dt≥Db,ε是预定常数。
根据本发明的另一优选实施例,该边缘提取方法还可以包括:错误边缘确定步骤,用于检测所提取的边缘的平滑度,以确定所提取的边缘是否是错误的;梯度校正步骤,用于在确定所提取的边缘是错误的情况下,对当前梯度进行校正,以将校正后的梯度作为当前梯度;以及迭代步骤,用于基于当前梯度,重复执行边缘提取步骤、错误边缘确定步骤以及梯度校正步骤,直到满足预定标准为止。
根据本发明的另一优选实施例,梯度校正步骤可以进一步包括:边缘趋势预测子步骤,用于从所提取的边缘的可靠度较高的区域开始,预测在预定方向上对象的边缘的趋势;边缘比较子步骤,用于在预定方向上,从检测到边缘不平滑的转折点开始,将所提取的边缘上的各个点与所预测的趋势进行比较;错误区间确定子步骤,将从转折点到所提取的边缘上与所预测的趋势之间的差小于预定阈值的第一个点的区间确定为错误区间;以及剔除子步骤,用于将所确定的错误区间中的各个点的梯度置零。
根据本发明的另一方面,还提供了一种边缘提取设备,该边缘提取设备可以包括:梯度估计单元,被配置成估计所捕获的图像中的各个像素的梯度;梯度调整单元,被配置成通过增强所捕获的图像中包含的对象的目标边缘的梯度并且减弱噪声边缘的梯度来调整所估计的梯度,以将调整后的梯度作为当前梯度;以及边缘提取单元,被配置成基于当前梯度,提取对象的边缘。
根据本发明的又一方面,还提供了一种存储介质,该存储介质包括机器可读的程序代码,当在信息处理设备上执行程序代码时,该程序代码使得信息处理设备执行根据本发明的上述边缘提取方法。
此外,根据本发明的再一方面,还提供了一种程序产品,该程序产品包括机器可执行的指令,当在信息处理设备上执行指令时,该指令使得信息处理设备执行根据本发明的上述边缘提取方法。
因此,根据本发明的实施例,能够通过自适应地增强利用非接触式成像装置所捕获的物体的图像的目标边缘同时抑制噪声边缘,并且进一步通过剔除可能存在的干扰梯度对已得到的边缘跟踪结果进行校正,大大提高边缘提取的准确性。
在下面的说明书部分中给出本发明实施例的其它方面,其中,详细说明用于充分地公开本发明实施例的优选实施例,而不对其施加限定。
附图说明
本发明可以通过参考下文中结合附图所给出的详细描述而得到更好的理解,其中在所有附图中使用了相同或相似的附图标记来表示相同或者相似的部件。所述附图连同下面的详细说明一起包含在本说明书中并形成说明书的一部分,用来进一步举例说明本发明的优选实施例和解释本发明的原理和优点。其中:
图1示出了利用非接触式成像装置对摊开的书进行成像的示意图;
图2示出了通过图1所示的成像操作得到的成像结果的示例;
图3是示出根据本发明的实施例的边缘提取方法的流程图;
图4是详细地示出图3所示的梯度校正步骤中的处理的流程图;
图5示意性地示出了作为示例所捕获的书的图像的上、下边缘的梯度图的示例;
图6A和6B分别示意性地示出了自适应增强前和自适应增强后的页面的上边缘的梯度图;
图7A和7B分别示意性地示出了剔除干扰梯度之前和剔除干扰梯度之后的页面边缘的梯度图的示例;
图8是根据本发明的实施例的边缘提取设备的功能配置的框图;
图9是详细地示出图8所示的梯度校正单元的功能配置的框图;以及
图10是示出作为本发明的实施例中所采用的信息处理设备的个人计算机的示例性结构的框图。
具体实施方式
在下文中将结合附图对本发明的示范性实施例进行描述。为了清楚和简明起见,在说明书中并未描述实际实施方式的所有特征。然而,应该了解,在开发任何这种实际实施例的过程中必须做出很多特定于实施方式的决定,以便实现开发人员的具体目标,例如,符合与系统及业务相关的那些限制条件,并且这些限制条件可能会随着实施方式的不同而有所改变。此外,还应该了解,虽然开发工作有可能是非常复杂和费时的,但对得益于本公开内容的本领域技术人员来说,这种开发工作仅仅是例行的任务。
在此,还需要说明的一点是,为了避免因不必要的细节而模糊了本发明,在附图中仅仅示出了与根据本发明的方案密切相关的设备结构和/或处理步骤,而省略了与本发明关系不大的其它细节。
以下将参照图1至图10来描述根据本发明的实施例的边缘提取方法和设备。应理解,在描述以下实施例时,以书作为成像的对象的示例,并且以提取书的当前页面的上边缘作为示例,但是本发明不限于此,而是也可以应用于提取书的页面的其它边缘,诸如下边缘、左边缘以及右边缘,甚至也可以用于提取除书之外的其它物体的边缘。
首先,将参照图3来描述根据本发明的实施例的边缘提取方法。该边缘提取方法可以包括梯度估计步骤S301、梯度调整步骤S302以及边缘提取步骤S303。
具体地,在梯度估计步骤S301中,估计所捕获的图像中的各个像素的梯度,从而得到如图5所示的上、下边缘的梯度图。具体地,利用诸如顶置式扫描仪的非接触式成像装置来捕获摊在桌上的书的图像,从而得到如图2所示的成像结果示例。该梯度图通常是基于图像中的各个像素的像素值而得到的。由于摊开的书具有一定的厚度,因此如图5所示,直接利用现有技术所得到的上、下边缘的梯度图包括多条曲线。换言之,所得到的边缘梯度图不仅包括当前页面的目标边缘的梯度,还包括其它页面的噪声边缘的梯度。用于提取物体边缘的现有技术通常是基于如下原理:当物体与背景之间存在明显对比时,物体的边缘处于图像中像素梯度最高的点,从而通过跟踪图像中具有最高梯度的曲线来提取物体的边缘。因此,期望增强目标边缘的梯度并且减弱噪声边缘的梯度,从而能够准确地提取物体的边缘。
接下来,在梯度调整步骤S302中,可以通过增强所捕获的图像中包含的对象的目标边缘的梯度并且减弱噪声边缘的梯度来调整在梯度估计步骤S301中所获得的边缘梯度图,以将调整后的梯度作为当前梯度。
具体地,在梯度调整步骤S302中,可以利用基于各个像素点的预定的两个相邻区域之间的梯度差而确定的权重对在梯度估计步骤S301中所估计的梯度进行加权,从而增强目标边缘的梯度并减弱噪声边缘的梯度。
优选地,基于以下公式来确定权重:
TB=Dt/(Db+∈)
其中,Dt=max{f(Nt)}-min{f(Nt)},Db=max{f(Nb)}-min{f(Nb)},Nt、Nb表示各个像素点的预定的两个相邻区域,Dt表示区域Nt中的最大梯度与最小梯度之差,Db表示区域Nb中的最大梯度与最小梯度之差,且Dt≥Db,ε是预定常数,以处理Db为零的情况。
具体地,参照图6A,以页面的上边缘为例,根据成像原理可知,可能存在的其它页面的噪声边缘只可能出现在目标边缘的上方。假设目标边缘附近的内容具有均匀背景,因此目标边缘的下方区域的梯度较弱,而上方区域可能存在其它页面的噪声边缘。基于该原理,对于上述公式,各个像素点的预定的两个相邻区域分别指的是每个像素的上、下相邻区域。
接下来,首先对在步骤S301中获得的原始梯度图像进行平滑化,以减弱图像噪声的影响。然后,对每一个像素,计算其上、下相邻区域的最大梯度值。在该示例中,Nt指的是像素的上方区域,而Nb指的是像素的下方区域,区域的大小为经验值,并且Dt、Db分别表示像素的上方区域和下方区域中的最大梯度值与最小梯度值之差。对于目标边缘,基于以上假设可知,其下方区域的内容具有均匀背景,因而其Db值较小,而上方区域由于存在噪声边缘,因而Dt值较大。对于噪声边缘,其下方区域不具备均匀性,因而Db值较大。
因此,根据以上公式可知,目标边缘的权重远远大于噪声边缘的权重,因而利用算出的各个像素点的权重对原始梯度图进行加权,增强目标边缘的梯度同时减弱噪声边缘的梯度。例如,图6B示出了通过加权后得到的当前页面的上边缘的梯度图的示例,从图6B可以清楚地看出,目标边缘相比于噪声边缘被大大增强,从而能够基于调整后的梯度图而准确地提取目标边缘。
应理解,此处以页面的上边缘为例说明了如何对原始梯度图进行调整,但是本发明不限于此,而是也可以对页面的下边缘、左边缘以及右边缘进行调整。
例如,当对页面的下边缘的梯度进行调整时,对于上述公式,由于此时页面的下边缘的上方区域具备均匀性,而下方区域由于存在噪声干扰而不具备均匀性,因此此时Nt指的是下方区域,而Nb指的是上方区域。因此,对于作为目标边缘的页面下边缘,其上方区域的内容具有均匀背景,因而其Db值较小,而下方区域由于存在噪声边缘,因而Dt值较大。对于噪声边缘,其上方区域不具备均匀性,因而Db值较大。类似地,利用根据上述公式算出的权重对页面下边缘的原始梯度图进行加权,从而增强了作为目标边缘的当前页面的下边缘的梯度,同时减弱了作为噪声边缘的其它页面的下边缘。
类似地,对于对页面的左边缘和右边缘的梯度调整,其原理与以上示例相同。然而,根据成像原理可知,对于左边缘和右边缘,其噪声边缘分别位于其左方或右方,并且其梯度图的计算是在与上、下边缘的梯度图垂直的方向(即,左右方向)上进行的,因此,对于上述权重计算公式,Nt、Nb分别指的是左右相邻区域,其它操作与对上边缘的梯度调整类似,在此不再赘述。
接下来,在边缘提取步骤S303中,可以基于在梯度调整步骤S302中得到的当前梯度,提取对象(在本示例中为书)的边缘。对于根据梯度图来提取目标边缘的方法,这是本领域公知的技术,在此不再赘述,例如,可参见EricN.MortensenandWilliamA.Barrett,InteractiveSegmentationwithIntelligentScissors,GraphicalModelsandImageProcessing,No.60,pp.349-384,1998中所公开的方法。
尽管根据在上述步骤S301至S303中的处理,增强了目标边缘的梯度同时抑制了噪声边缘的梯度,但是仍然无法保证利用现有技术的方法、基于增强后的边缘梯度能够跟踪到正确的边缘。因此,期望能够对基于上述调整后的梯度提取的对象边缘进行检查和校正,以进一步提高边缘提取的准确性。本发明提出了一种迭代式的边缘校正方法,并且根据本发明的优选实施例,该边缘提取方法还可以包括错误边缘确定步骤S304、梯度校正步骤S305以及迭代步骤S306。
在错误边缘确定步骤S304中,可以检测在步骤S303中提取的边缘的平滑度,以确定所提取的边缘是否是错误的。
具体地,可以如下检测边缘的平滑度:根据成像原理可知,假设正确的书的边缘曲线是平滑的,并且所提取的上边缘的中心附近的可靠度较高,因此,如图7A所示,以上边缘的右半部分为例,从中心开始对曲线上的每个点(x,y)进行检测,对于其右侧间隔N个像素的点(x’,y’),其中x’=x+N,如果|y’-y|>N*k,则表明曲线不平滑,其中,N、k均是经验值,在实际使用时可以根据实验结果来确定。一旦检测到从点(x0,y0)向右存在不平滑,则确定该点右侧的梯度为干扰梯度,即有可能跟踪到错误的边缘,因此需要对干扰梯度进行校正。应理解,该平滑度检测方法仅是示例而非限制,并且本领域技术人员可根据本领域公知的任意方法来检测曲线的平滑度。
接下来,在梯度校正步骤S305中,可以在错误边缘确定步骤S304中确定所提取的边缘是错误的情况下,对当前梯度进行校正,以将校正后的梯度作为当前梯度。
具体地,参照图4,梯度校正步骤S305可以进一步包括边缘趋势预测子步骤S401、边缘比较子步骤S402、错误区间确定子步骤S403以及剔除子步骤S404。
具体地,在边缘趋势预测子步骤S401中,可以从所提取的边缘的可靠度较高的区域开始,预测在预定方向上的对象边缘的趋势。仍以上边缘的右侧为例,上边缘曲线的中心开始的部分的可靠度较高,且预定方向为右侧方向。因此,如上所述,对于第t次迭代,假设在错误边缘确定步骤S304中检测到在点(x0,y0)处向右存在不平滑性,则在基于第t-1次迭代所确定的梯度gt-1(x,y)而提取的边缘曲线上,根据从点(x0,y0)向左M(M为预定数值)个连续的点估计出一条直线,该直线表示正常范围内的页面边缘趋势,即,以基于直线拟合的方法来预测页面边缘趋势。应理解,该直线拟合方法仅是边缘趋势预测的一种方法示例而不应理解为限制,本领域技人员可想到利用其它方法来进行趋势预测。
接下来,在边缘比较子步骤S402中,可以在预定方向上,从检测到边缘不平滑的转折点开始,将所提取的边缘上的各个点与所预测的趋势进行比较。
具体地,在该实施例中,预定方向为右侧方向,转折点为点(x0,y0),并且比较操作为确定所提取的边缘上从点(x0,y0)向右的每个点与所预测的趋势之间的距离是否小于预定阈值。
然后,在错误区间确定子步骤S403中,可以将从转折点到所提取的边缘上与所预测的趋势之间的差小于预定阈值的第一个点的区间确定为错误区间。具体地,根据在边缘比较子步骤S402中的比较结果,对于所提取的边缘上与所预测的直线之间的距离小于预定阈值的第一个点(x1,y1),将所预测的边缘上从转折点(x0,y0)到点(x1,y1)的部分确定为错误区间,如图7A所示。
接着,在剔除子步骤S404中,可以将所确定的错误区间中的各个点的梯度置零。具体地,将在错误区间确定子步骤S404中确定的错误区间(例如从点(x0,y0)到点(x1,y1))中的各个点所对应的梯度置零,从而得到经梯度校正后的梯度图gt+1(x,y),如图7B所示。通过将噪声边缘的干扰梯度置零,减弱了噪声边缘,从而能够更准确地提取目标边缘。
返回参照图3,在迭代步骤S306中,可以基于当前梯度,重复执行边缘提取步骤S303、错误边缘确定步骤S304以及梯度校正步骤S305,直到满足预定标准为准。具体地,在边缘提取步骤S303中,再次基于在梯度校正步骤S305中得到的校正后的梯度图gt+1(x,y)来提取对象的边缘,并且该边缘提取结果将作为第t+1次迭代的输入而输入到错误边缘确定步骤S304中。如果在某次迭代过程中在错误边缘确定步骤S304中没有检测到错误边缘,则表明所提取的边缘是光滑的,即,此时所提取的边缘的准确度满足了预定要求,从而结束迭代过程,输出最终的边缘提取结果。
以上实施例仅是针对目标页面的上边缘的右侧进行说明,但是应理解,本发明不限于此,而是可以根据本发明的原理而对任意边缘进行处理,甚至可以对除书之外的其它物体的边缘进行处理。
虽然上面结合附图1-7B详细描述了根据本发明实施例的边缘提取方法,但是本领域的技术人员应当明白,附图所示的流程图仅仅是示例性的,并且可以根据实际应用和具体要求的不同,对上述方法流程进行相应的修改。例如,根据需要,可以对上述方法中的某些步骤的执行顺序进行调整,或者可以省去或者添加某些处理步骤。
与根据本发明实施例的边缘提取方法相对应,本发明实施例还提供了一种边缘提取设备。
具体地,如图8所示,边缘提取设备可以包括梯度估计单元801、梯度调整单元802以及边缘提取单元803。以下将参照图8详细描述边缘提取设备的各个单元的功能配置。
梯度估计单元801可以被配置成估计所捕获的图像中的各个像素的梯度。例如,梯度估计单元801可以计算如图2所示的图像中各个像素的梯度值,由于对象边缘与背景之间的对比,从而得到如图5所示的书的上、下边缘的梯度图。
梯度调整单元802可以被配置成通过增强所捕获的图像中包含的对象的目标边缘的梯度并减弱噪声边缘的梯度来调整梯度估计单元802所估计的梯度,以将调整后的梯度作为当前梯度。优选地,通过利用上述公式确定的权重对所估计的梯度进行加权,增强了目标边缘的梯度且减弱了噪声边缘的梯度。具体调整过程可以参考以上关于根据本发明的实施例的方法所进行的描述,在此不再重复描述。
边缘提取单元803可以被配置成基于当前梯度,提取对象(在本示例中为书)的边缘。
如上所述,尽管经过梯度估计单元801、梯度调整单元802以及边缘提取单元603的处理,能够在一定程度上提高边缘提取的准确度,但是并不能保证所提取的边缘就是实际的页面边缘。因此,优选地,根据本发明的实施例的边缘提取设备还可以包括错误边缘确定单元804、梯度校正单元805以及迭代单元806,它们能够对所提取的边缘执行迭代式的检测和校正,以进一步提高边缘提取的准确度。
具体地,错误边缘确定单元804可以被配置成检测边缘提取单元803所提取的边缘的平滑度,以确定所提取的边缘是否是错误的。优选地,作为示例,对于书的图像的上边缘,假设实际边缘是平滑的,并且从书的边缘的中心开始向左右两侧检测其平滑度,从而找到在第t次迭代中检测到的其右侧的曲线不平滑的转折点(x0,y0)。
梯度校正单元805可以被配置成在错误边缘确定单元804确定所提取的边缘是错误的情况下,对当前梯度进行校正,以将校正后的梯度作为当前梯度。优选地,梯度校正单元805进一步包括边缘趋势预测子单元901、边缘比较子单元902、错误区间确定子单元903以及剔除子单元904。以下将参照图9详细描述梯度校正单元805的各个组成子单元的功能配置。
边缘趋势预测子单元901可以被配置成从所提取的边缘的可靠度较高的区域开始,预测在预定方向上对象的边缘的趋势。优选地,作为示例,以基于直线拟合的方法、根据所提取的边缘上从错误边缘确定单元804确定的转折点(x0,y0)往左的M(M是预定值)个连续的点来预测转折点(x0,y0)右侧的边缘趋势。
边缘比较子单元902可以被配置成在预定方向(在该示例中为右侧方向)上,从检测到不平滑的转折点(x0,y0)开始,将所提取的边缘上的各个点与边缘预测子单元901所预测的趋势进行比较。
错误区间确定子单元903可以被配置成将所提取的边缘上从转折点(x0,y0)到与所预测的趋势之间的差小于预定阈值的第一点的区间确定为错误区间,即,如图7A所示,从点(x0,y0)到点(x1,y1)的区间。
剔除子单元904可以被配置成将错误区间确定子单元903所确定的错误区间中的各个点的梯度置零,从而去除干扰梯度的影响,进一步增强目标边缘的梯度。
返回参照图8,迭代单元806可以被配置成基于当前梯度,重复执行边缘提取单元803、错误边缘确定单元804、梯度校正单元805的处理,直到满足预定标准为止。如果在某一次迭代中没有检测到错误边缘,则表明所提取的边缘曲线是平滑的,即满足了边缘提取的准确度要求,从而结束迭代过程,输出最终的边缘提取结果。
需要说明的是,本发明实施例所述的设备是与前述方法实施例相对应的,因此,设备实施例中未详述部分,请参见方法实施例中相应位置的介绍,这里不再赘述。
另外,还应该指出的是,上述系列处理和设备也可以通过软件和/或固件实现。在通过软件和/或固件实现的情况下,从存储介质或网络向具有专用硬件结构的计算机,例如图10所示的通用个人计算机1000安装构成该软件的程序,该计算机在安装有各种程序时,能够执行各种功能等等。
在图10中,中央处理单元(CPU)1001根据只读存储器(ROM)1002中存储的程序或从存储部分1008加载到随机存取存储器(RAM)1003的程序执行各种处理。在RAM1003中,也根据需要存储当CPU901执行各种处理等等时所需的数据。
CPU1001、ROM1002和RAM1003经由总线1004彼此连接。输入/输出接口1005也连接到总线1004。
下述部件连接到输入/输出接口1005:输入部分1006,包括键盘、鼠标等等;输出部分1007,包括显示器,比如阴极射线管(CRT)、液晶显示器(LCD)等等,和扬声器等等;存储部分1008,包括硬盘等等;和通信部分1009,包括网络接口卡比如LAN卡、调制解调器等等。通信部分1009经由网络比如因特网执行通信处理。
根据需要,驱动器1010也连接到输入/输出接口1005。可拆卸介质1011比如磁盘、光盘、磁光盘、半导体存储器等等根据需要被安装在驱动器1010上,使得从中读出的计算机程序根据需要被安装到存储部分1008中。
在通过软件实现上述系列处理的情况下,从网络比如因特网或存储介质比如可拆卸介质1011安装构成软件的程序。
本领域的技术人员应当理解,这种存储介质不局限于图10所示的其中存储有程序、与设备相分离地分发以向用户提供程序的可拆卸介质1011。可拆卸介质1011的例子包含磁盘(包含软盘(注册商标))、光盘(包含光盘只读存储器(CD-ROM)和数字通用盘(DVD))、磁光盘(包含迷你盘(MD)(注册商标))和半导体存储器。或者,存储介质可以是ROM1002、存储部分1008中包含的硬盘等等,其中存有程序,并且与包含它们的设备一起被分发给用户。
还需要指出的是,执行上述系列处理的步骤可以自然地按照说明的顺序按时间顺序执行,但是并不需要一定按照时间顺序执行。某些步骤可以并行或彼此独立地执行。
虽然已经详细说明了本发明及其优点,但是应当理解在不脱离由所附的权利要求所限定的本发明的精神和范围的情况下可以进行各种改变、替代和变换。而且,本发明实施例的术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
关于包括以上实施例的实施方式,还公开下述附记:
附记1.一种边缘提取方法,包括:
梯度估计步骤,用于估计所捕获的图像中的各个像素的梯度;
梯度调整步骤,用于通过增强所捕获的图像中包含的对象的目标边缘的梯度并且减弱噪声边缘的梯度来调整所估计的梯度,以将调整后的梯度作为当前梯度;以及
边缘提取步骤,用于基于当前梯度,提取所述对象的边缘。
附记2.根据附记1所述的方法,其中,在所述梯度调整步骤中,利用基于各个像素点的预定的两个相邻区域之间的梯度差而确定的权重对所估计的梯度进行加权,从而增强所述目标边缘的梯度并减弱所述噪声边缘的梯度。
附记3.根据附记2所述的方法,其中,基于以下公式来确定所述权重TB:
TB=Dt/(Db+∈)
其中,Dt=max{f(Nt)}-min{f(Nt)},Db=max{f(Nb)}-min{f(Nb)},Nt、Nb表示各个像素点的预定的两个相邻区域,Dt表示区域Nt中的最大梯度与最小梯度之差,Db表示区域Nb中的最大梯度与最小梯度之差,且Dt≥Db,ε是预定常数。
附记4.根据附记1所述的方法,其中,在所述边缘提取步骤之后还包括:
错误边缘确定步骤,用于检测所提取的边缘的平滑度,以确定所提取的边缘是否是错误的;
梯度校正步骤,用于在确定所提取的边缘是错误的情况下,对当前梯度进行校正,以将校正后的梯度作为当前梯度;以及
迭代步骤,用于基于当前梯度,重复执行所述边缘提取步骤、所述错误边缘确定步骤以及所述梯度校正步骤,直到满足预定标准为止。
附记5.根据附记4所述的方法,其中,所述梯度校正步骤进一步包括:
边缘趋势预测子步骤,用于从所提取的边缘的可靠度较高的区域开始,预测在预定方向上所述对象的边缘的趋势;
边缘比较子步骤,用于在所述预定方向上,从检测到边缘不平滑的转折点开始,将所提取的边缘上的各个点与所预测的趋势进行比较;
错误区间确定子步骤,将从所述转折点到所提取的边缘上与所预测的趋势之间的差小于预定阈值的第一个点的区间确定为错误区间;以及
剔除子步骤,用于将所确定的错误区间中的各个点的梯度置零。
附记6.根据附记5所述的方法,其中,在所述边缘预测子步骤中,以基于直线拟合的方法来预测所述对象的边缘的趋势。
附记7.根据附记1-6中任一项所述的方法,其中,所述对象是书。
附记8.一种边缘提取设备,包括:
梯度估计单元,被配置成估计所捕获的图像中的各个像素的梯度;
梯度调整单元,被配置成通过增强所捕获的图像中包含的对象的目标边缘的梯度并且减弱噪声边缘的梯度来调整所估计的梯度,以将调整后的梯度作为当前梯度;以及
边缘提取单元,被配置成基于当前梯度,提取所述对象的边缘。
附记9.根据附记8所述的设备,其中,所述梯度调整单元被配置成利用基于各个像素点的预定的两个相邻区域之间的梯度差而确定的权重对所估计的梯度进行加权,从而增强所述目标边缘的梯度并减弱所述噪声边缘的梯度。
附记10.根据附记9所述的设备,其中,基于以下公式来确定所述权重TB:
TB=Dt/(Db+∈)
其中,Dt=max{f(Nt)}-min{f(Nt)},Db=max{f(Nb)}-min{f(Nb)},Nt、Nb表示各个像素点的预定的两个相邻区域,Dt表示区域Nt中的最大梯度与最小梯度之差,Db表示区域Nb中的最大梯度与最小梯度之差,且Dt≥Db,ε是预定常数。
附记11.根据附记8所述的设备,还包括:
错误边缘确定单元,被配置成检测所提取的边缘的平滑度,以确定所提取的边缘是否是错误的;
梯度校正单元,被配置成在确定所提取的边缘是错误的情况下,对当前梯度进行校正,以将校正后的梯度作为当前梯度;以及
迭代单元,被配置成基于当前梯度,重复执行所述边缘提取单元、所述错误边缘确定单元以及所述梯度校正单元中的处理,直到满足预定标准为止。
附记12.根据附记11所述的设备,其中,所述梯度校正单元进一步包括:
边缘趋势预测子单元,被配置成从所提取的边缘的可靠度较高的区域开始,预测在预定方向上所述对象的边缘的趋势;
边缘比较子单元,被配置成在所述预定方向上,从检测到边缘不平滑的转折点开始,将所提取的边缘上的各个点与所预测的趋势进行比较;
错误区间确定子单元,将从所述转折点到所提取的边缘上与所预测的趋势之间的差小于预定阈值的第一个点的区间确定为错误区间;以及
剔除子单元,被配置成将所确定的错误区间中的各个点的梯度置零。
附记13.根据附记12所述的设备,其中,所述边缘预测子单元被配置成以基于直线拟合的方法来预测所述对象的边缘的趋势。
附记14.根据附记8-13中任一项所述的设备,其中,所述对象是书。
Claims (8)
1.一种边缘提取方法,包括:
梯度估计步骤,用于估计所捕获的图像中的各个像素的梯度;
梯度调整步骤,用于通过增强所捕获的图像中包含的对象的目标边缘的梯度并且减弱噪声边缘的梯度来调整所估计的梯度,以将调整后的梯度作为当前梯度;以及
边缘提取步骤,用于基于当前梯度,提取所述对象的边缘,
其中,在所述梯度调整步骤中,利用基于各个像素点的预定的两个相邻区域之间的梯度差而确定的权重对所估计的梯度进行加权,从而增强所述目标边缘的梯度并减弱所述噪声边缘的梯度。
2.根据权利要求1所述的方法,其中,基于以下公式来确定所述权重TB:
TB=Dt/(Db+ε)
其中,Dt=max{f(Nt)}-min{f(Nt)},Db=max{f(Nb)}-min{f(Nb)},Nt、Nb表示各个像素点的预定的两个相邻区域,Dt表示区域Nt中的最大梯度与最小梯度之差,Db表示区域Nb中的最大梯度与最小梯度之差,且Dt≥Db,ε是预定常数。
3.根据权利要求1所述的方法,其中,在所述边缘提取步骤之后还包括:
错误边缘确定步骤,用于检测所提取的边缘的平滑度,以确定所提取的边缘是否是错误的;
梯度校正步骤,用于在确定所提取的边缘是错误的情况下,对当前梯度进行校正,以将校正后的梯度作为当前梯度;以及
迭代步骤,用于基于当前梯度,重复执行所述边缘提取步骤、所述错误边缘确定步骤以及所述梯度校正步骤,直到满足预定标准为止。
4.根据权利要求3所述的方法,其中,所述梯度校正步骤进一步包括:
边缘趋势预测子步骤,用于从所提取的边缘的可靠度较高的区域开始,预测在预定方向上所述对象的边缘的趋势;
边缘比较子步骤,用于在所述预定方向上,从检测到边缘不平滑的转折点开始,将所提取的边缘上的各个点与所预测的趋势进行比较;
错误区间确定子步骤,将从所述转折点到所提取的边缘上与所预测的趋势之间的差小于预定阈值的第一个点的区间确定为错误区间;以及
剔除子步骤,用于将所确定的错误区间中的各个点的梯度置零。
5.一种边缘提取设备,包括:
梯度估计单元,被配置成估计所捕获的图像中的各个像素的梯度;
梯度调整单元,被配置成通过增强所捕获的图像中包含的对象的目标边缘的梯度并且减弱噪声边缘的梯度来调整所估计的梯度,以将调整后的梯度作为当前梯度;以及
边缘提取单元,被配置成基于当前梯度,提取所述对象的边缘,
其中,所述梯度调整单元被配置成利用基于各个像素点的预定的两个相邻区域之间的梯度差而确定的权重对所估计的梯度进行加权,从而增强所述目标边缘的梯度并减弱所述噪声边缘的梯度。
6.根据权利要求5所述的设备,其中,基于以下公式来确定所述权重TB:
TB=Dt/(Db+ε)
其中,Dt=max{f(Nt)}-min{f(Nt)},Db=max{f(Nb)}-min{f(Nb)},Nt、Nb表示各个像素点的预定的两个相邻区域,Dt表示区域Nt中的最大梯度与最小梯度之差,Db表示区域Nb中的最大梯度与最小梯度之差,且Dt≥Db,ε是预定常数。
7.根据权利要求5所述的设备,还包括:
错误边缘确定单元,被配置成检测所提取的边缘的平滑度,以确定所提取的边缘是否是错误的;
梯度校正单元,被配置成在确定所提取的边缘是错误的情况下,对当前梯度进行校正,以将校正后的梯度作为当前梯度;以及
迭代单元,被配置成基于当前梯度,重复执行所述边缘提取单元、所述错误边缘确定单元以及所述梯度校正单元中的处理,直到满足预定标准为止。
8.根据权利要求7所述的设备,其中,所述梯度校正单元进一步包括:
边缘趋势预测子单元,被配置成从所提取的边缘的可靠度较高的区域开始,预测在预定方向上所述对象的边缘的趋势;
边缘比较子单元,被配置成在所述预定方向上,从检测到边缘不平滑的转折点开始,将所提取的边缘上的各个点与所预测的趋势进行比较;
错误区间确定子单元,将从所述转折点到所提取的边缘上与所预测的趋势之间的差小于预定阈值的第一个点的区间确定为错误区间;以及
剔除子单元,被配置成将所确定的错误区间中的各个点的梯度置零。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201210177743.7A CN103455996B (zh) | 2012-05-31 | 2012-05-31 | 边缘提取方法和设备 |
US13/906,001 US9202282B2 (en) | 2012-05-31 | 2013-05-30 | Boundary extraction method and apparatus |
JP2013114204A JP6260113B2 (ja) | 2012-05-31 | 2013-05-30 | エッジの抽出方法および設備 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201210177743.7A CN103455996B (zh) | 2012-05-31 | 2012-05-31 | 边缘提取方法和设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN103455996A CN103455996A (zh) | 2013-12-18 |
CN103455996B true CN103455996B (zh) | 2016-05-25 |
Family
ID=49670335
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201210177743.7A Expired - Fee Related CN103455996B (zh) | 2012-05-31 | 2012-05-31 | 边缘提取方法和设备 |
Country Status (3)
Country | Link |
---|---|
US (1) | US9202282B2 (zh) |
JP (1) | JP6260113B2 (zh) |
CN (1) | CN103455996B (zh) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104657730B (zh) * | 2013-11-20 | 2018-01-05 | 富士通株式会社 | 文档图像的校正装置、方法以及扫描仪 |
CN104268872B (zh) * | 2014-09-25 | 2017-05-17 | 北京航空航天大学 | 基于一致性的边缘检测方法 |
GB2536715A (en) * | 2015-03-27 | 2016-09-28 | Mas Innovation (Private) Ltd | Image processing method |
US10830581B1 (en) * | 2019-11-08 | 2020-11-10 | International Business Machines Corporation | Surface smoothness analysis |
CN110992254B (zh) * | 2019-12-06 | 2023-05-23 | 北京工业大学 | 一种全向图像中二次曲线的拟合方法 |
CN116150622B (zh) * | 2023-02-17 | 2023-08-11 | 支付宝(杭州)信息技术有限公司 | 一种模型训练方法、装置、存储介质及电子设备 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102446349A (zh) * | 2010-09-29 | 2012-05-09 | 奥林巴斯株式会社 | 图像处理装置和图像处理方法 |
Family Cites Families (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0658687B2 (ja) * | 1987-01-22 | 1994-08-03 | 富士電機株式会社 | エツジ強調装置 |
US5995115A (en) * | 1997-04-04 | 1999-11-30 | Avid Technology, Inc. | Computer system process and user interface for providing intelligent scissors for image composition |
US7003161B2 (en) | 2001-11-16 | 2006-02-21 | Mitutoyo Corporation | Systems and methods for boundary detection in images |
JP2004118335A (ja) * | 2002-09-24 | 2004-04-15 | Hamamatsu Photonics Kk | 画像処理方法および画像処理装置 |
JP4479174B2 (ja) * | 2003-06-30 | 2010-06-09 | 株式会社豊田中央研究所 | 物体検出装置 |
US7529422B2 (en) * | 2004-09-22 | 2009-05-05 | Siemens Medical Solutions Usa, Inc. | Gradient-based image restoration and enhancement |
US7727291B2 (en) * | 2005-04-27 | 2010-06-01 | Himmelsbach Holdings, Llc | Low molecular weight fuel additive |
US8515171B2 (en) * | 2009-01-09 | 2013-08-20 | Rochester Institute Of Technology | Methods for adaptive and progressive gradient-based multi-resolution color image segmentation and systems thereof |
JP5407462B2 (ja) * | 2009-03-19 | 2014-02-05 | 富士通株式会社 | 画像出力装置、輪郭強調装置及び輪郭強調方法 |
CN101567084B (zh) | 2009-06-05 | 2011-04-06 | 西安电子科技大学 | 基于水平集和分水岭相结合的图像轮廓检测方法 |
TWI394434B (zh) * | 2009-12-30 | 2013-04-21 | Altek Corp | The method of eliminating the color dislocation of digital images |
CN102044071A (zh) | 2010-12-28 | 2011-05-04 | 上海大学 | 基于fpga的单像素边缘检测方法 |
CN103455995B (zh) * | 2012-05-31 | 2016-08-03 | 富士通株式会社 | 图像处理装置、图像处理方法和扫描仪 |
CN103473543B (zh) * | 2012-06-07 | 2016-10-05 | 富士通株式会社 | 用于提取图像中对象边界的装置、方法以及电子设备 |
-
2012
- 2012-05-31 CN CN201210177743.7A patent/CN103455996B/zh not_active Expired - Fee Related
-
2013
- 2013-05-30 US US13/906,001 patent/US9202282B2/en active Active
- 2013-05-30 JP JP2013114204A patent/JP6260113B2/ja active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102446349A (zh) * | 2010-09-29 | 2012-05-09 | 奥林巴斯株式会社 | 图像处理装置和图像处理方法 |
Also Published As
Publication number | Publication date |
---|---|
JP2013250976A (ja) | 2013-12-12 |
US20130322768A1 (en) | 2013-12-05 |
US9202282B2 (en) | 2015-12-01 |
JP6260113B2 (ja) | 2018-01-17 |
CN103455996A (zh) | 2013-12-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN103455996B (zh) | 边缘提取方法和设备 | |
CN102521592B (zh) | 基于非清晰区域抑制的多特征融合显著区域提取方法 | |
NO331186B1 (no) | Balansert objektsporer i en bildesekvens | |
CN103679168A (zh) | 文字区域检测方法及装置 | |
CN101533514B (zh) | 利用分级块分裂和运动分割进行目标边界准确运动的检测 | |
CN106251361A (zh) | 一种钢轨表面缺陷图像自适应分割方法 | |
WO2007027731A2 (en) | Method and apparatus for automatic and dynamic vessel detection | |
EP2767933A2 (en) | Method and system for edge detection | |
CN105354866A (zh) | 一种多边形轮廓相似度检测方法 | |
EP1229489A3 (en) | Image processing method and apparatus | |
Medina-Carnicer et al. | Unimodal thresholding for edge detection | |
CN111144215A (zh) | 图像处理方法、装置、电子设备及存储介质 | |
CN103312963A (zh) | 图像处理设备和图像处理方法 | |
CN105320921A (zh) | 双眼定位方法及双眼定位装置 | |
CN104036516A (zh) | 基于对称性分析的摄像机标定棋盘图像角点检测方法 | |
CN105654505A (zh) | 一种基于超像素的协同跟踪算法和系统 | |
CN116109812A (zh) | 一种基于非极大值抑制阈值优化的目标检测方法 | |
CN103837135B (zh) | 工件检测方法及其系统 | |
CN115035164A (zh) | 一种运动目标识别方法及装置 | |
CN102375993A (zh) | 目标检测方法和设备 | |
WO2021068589A1 (zh) | 一种图像中物体及其关键点的确定方法和装置 | |
CN102855484A (zh) | 基于局部积分图像处理的目标检测方法、装置及系统 | |
WO2006131866A3 (en) | Method and system for image processing | |
CN106443590B (zh) | 一种基于频域的类梯形信号检测方法及装置 | |
CN103123689B (zh) | 一种基于人腿检测的奔跑检测方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20160525 Termination date: 20210531 |
|
CF01 | Termination of patent right due to non-payment of annual fee |