CN1430764A - 在图像中探测对象 - Google Patents

在图像中探测对象 Download PDF

Info

Publication number
CN1430764A
CN1430764A CN01809761A CN01809761A CN1430764A CN 1430764 A CN1430764 A CN 1430764A CN 01809761 A CN01809761 A CN 01809761A CN 01809761 A CN01809761 A CN 01809761A CN 1430764 A CN1430764 A CN 1430764A
Authority
CN
China
Prior art keywords
image
pixel
track
width
feature
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN01809761A
Other languages
English (en)
Other versions
CN1228733C (zh
Inventor
埃亚尔·亚艾尔
亚科夫·纳丰
埃拉·巴坎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of CN1430764A publication Critical patent/CN1430764A/zh
Application granted granted Critical
Publication of CN1228733C publication Critical patent/CN1228733C/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/42Global feature extraction by analysis of the whole pattern, e.g. using frequency domain transformations or autocorrelation
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B07SEPARATING SOLIDS FROM SOLIDS; SORTING
    • B07CPOSTAL SORTING; SORTING INDIVIDUAL ARTICLES, OR BULK MATERIAL FIT TO BE SORTED PIECE-MEAL, e.g. BY PICKING
    • B07C3/00Sorting according to destination
    • B07C3/10Apparatus characterised by the means used for detection ofthe destination
    • B07C3/14Apparatus characterised by the means used for detection ofthe destination using light-responsive detecting means
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/60Type of objects
    • G06V20/62Text, e.g. of license plates, overlay texts or captions on TV images
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/42Document-oriented image-based pattern recognition based on the type of document
    • G06V30/424Postal images, e.g. labels or addresses on parcels or postal envelopes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Image Analysis (AREA)
  • Measurement Of Optical Distance (AREA)
  • Studio Devices (AREA)
  • Closed-Circuit Television Systems (AREA)

Abstract

一种在图像中探测预定对象的方法,包括:选择属于此对象的线段,此线段具有已知的笔画宽度;确定最大宽度(56)和最小宽度(58),两者一起确定包含笔画宽度的宽度范围(60);在图像中搜索具有在该范围内的特征宽度的特征;并对该特征进行处理以便判断其是否是对象的一部分。

Description

在图像中探测对象
技术领域
本发明总体上涉及图像处理的方法及装置,特别涉及在图像中探测对象的快速方法。
背景技术
很多图像处理应用涉及探测某个或某些对象是否存在于给定的图像中,如是,那末在图像中的什么位置。对待探测的对象给出一个“字典”。不过,图像中的对象的外观可能不同于字典中的外观。对象外观改变的原因包括转动、缩放、噪声、非线性畸变、对象内及对象与背景之间对比度改变以及微小的拓扑改变。实际的图像处理方法必须能够迅速地在大图像中发现指定的对象,即使是存在这种改变。
公知的在图像中探测对象的技术的大多数方法,或是涉及模式匹配,或是涉及拓扑搜索技术。通常,这些方法要求首先对图像进行预处理,或滤波,来强化所要的特征,如梯度或边缘。模式匹配对上述的变化类型敏感,特别是对非线性变化敏感。拓扑搜索方法涉及膨胀及发现轮廓和骨架之类的运算,而这些运算对于快速处理大的图像来说耗时过多而计算效率低。
在搜索对象之前将图像二值化可减少计算时间,特别是如果图像也是分样图像(decimated)的话。然而,基于二值化的方法对于对比度的变化特别敏感。取决于二值化方法和阈值的选择,图像中对象的重要特征或对象和背景之间的区别可能在二值化时消失。由于图像中的亮度和对比度的变化,经常要求在图像的不同部分取不同的阈值。
一个特别有挑战性的对象探测应用是邮包的自动分拣。包裹分拣设备必须能够识别和定位各种标记和粘贴在包裹上的标签。通常,用于扫描一个很大的总图像区的只有很有限的处理时间。因为图像是由包裹传送带上方的摄象机捕捉,由于包裹的高度不同,缩放比例的变化会很大。包裹本身的物理变形也引起粘贴在包裹上的标签的非线性变形。另外,同一标签的不同印版可能具有不同的灰度对比、笔划宽度、字体和特征布局。
发明内容
本发明的目的是提供一种在图像中快速探测对象的方法和设备。
本发明的某些方面的另一目的是提供一种即使是在很大的图像中也可以快速工作的在图像中探测对象的方法。
本发明的某些方面的再一个目的是提供一种即使是在对象的外观存在变化时也可在图像中探测对象的牢靠准确的方法。
本发明的某些方面的再一个目的是提供一种适用于包裹自动分拣应用的在图像中探测对象的方法。
在本发明的优选实施方式中,要在图像中探测的有关对象是根据组成该对象的线段确定的,尤其是根据线段的笔画宽度进行确定的。(在本申请的说明书的上下文和权利要求中,名词“线段”应该理解为任何细长的特征,不论是直线的还是曲线的)。当这些线段出现在图像中时,其宽度预期在预定范围内。此范围包含属于此对象的线段的已知的笔画宽度,但进行了扩展,以考虑到图像中的实际线段可能由于畸变、缩放、对比度变化或其他原因而引起的宽度的偏差。为了发现此对象,针对具有此范围内的宽度的所有的特征对图像进行快速搜索。此方法一般允许在只对图像中的像素的一个小子集进行扫描的基础上迅速地定位有关的小的区域组,在这些区域中的某个中发现该对象的几率很高。
在本发明的一些优选实施方式中,在一系列的连续阶段中,在灰度级图像中搜索有关对象。每个阶段相对上一个阶段缩小搜索区域,同时逐渐逼近搜索的特定对象。在第一阶段,通过探测看起来像是存在于具有在预定范围内的宽度的特征中的像素群(cluster of pixels)而定位有关区域。之后,对有关区域进行扫描以求发现对比度峰值,即沿着选取的穿过这些区域的扫描线出现的灰度级的突变。当此种峰的幅度超过给定的阈值,并且其宽度在所述范围内时,则它就是组成有关对象的线段之一的一部分的候选。在区域增长过程中,候选峰的形态膨胀成“斑点(stain)”,即具有大致同一灰度值的连通像素组。之后,将现有技术中公知的高级图像识别过程应用于每个斑点,以便确定哪一个斑点或哪些个斑点对应于有关对象。此最后阶段是唯一取决于对象本身的阶段,并且这一阶段的执行只针对包含于斑点中的所有像素的很小的子集。
此处所描述的方法特别适合于识别标记、符号和粘贴于包裹上的标签,应用于快速扫描和分拣应用中。不过,本发明的原理也可应用于多种需要在大的图像中快速定位有关对象而又要避免由于图像中的变化和畸变引起的识别错误的其他情况中。
因此,根据本发明的优选实施方式,提供了一种在图像中探测预定对象的方法,包括:
选择属于此对象的线段,此线段具有已知的笔画宽度;
确定最大宽度和最小宽度,两者一起可确定包含笔画宽度的宽度范围;
在图像中查找具有在该范围内的特征宽度的特征;以及
对该特征进行处理以便判断其是否是所述对象的一部分。
最好,确定最大和最小宽度的步骤包括确定当对象出现于图象中时对象中的线段宽度可能出现的变化。
在优选实施方式中,在图像查找特征的步骤包括:
在图像中搜索属于其宽度小于最大宽度的一个或多个图像元素的像素的第一轨迹(locus);
在图像中搜索属于其宽度小于最小宽度的一个或多个图像元素的像素的第二轨迹;
取第一和第二轨迹的逻辑和。
最好,搜索第一轨迹的步骤包括:搜索一个像素,其灰度值与其他与其相距所述最大宽度的像素的灰度值相差至少一个预定的对比度阈值。另外一种方式或增加的一种方式为,搜索图像中的特征的步骤包括在搜索轨迹之前对图像进行子采样,于是只有图像中的所有像素的一个子集被考虑包括到轨迹中。还有另外一种方式或增加的一种方式为,在图像中搜索特征的步骤包括将在第一和第二轨迹的逻辑和中的像素的群确定为图像中的有关区域,该区域是包含对象的候选区域。
在另一个优选实施方式中,搜索图像中的特征的步骤包括:
在图像中确定一个有关区域,该区域是包含对象的候选区域;
选择穿过该有关区域的扫描线;
评估位于此扫描线上的像素的灰度值,查找互相分开的距离在所述范围内的对比度跃变对;
最好,选择扫描线的步骤包括选择多个扫描线其间的间隔相应于对象的尺寸而确定。另外一种方式或增加的一种方式为,评估灰度值的步骤包括搜索下面这样的对比度跃变,即在扫描线上选取的像素对(任何给定跃变两侧各一个像素)各自的灰度值之间的差别超过预定阈值。最好的是,像素对互相之间的距离选择为笔画宽度的函数。
最好,特征的处理步骤包括:
搜索至少一个属于该特征的初始像素的轨迹;以及
扩张该轨迹来重构对象中的线段,这最好是通过在轨迹上添加一个与至少一个初始像素邻接并具有超出阈值的灰度值的附加像素来实现,上述阈值是相应于至少一个初始像素的灰度值设定的。
最好,向此轨迹上添加附加像素的步骤包括添加第一附加像素,并且扩展轨迹的步骤还包括:
继续进一步添加与轨迹中的像素邻接并具有各自的超出相应的阈值的灰度值的附加像素;以及
当轨迹达到根据对象的尺寸决定的最大尺寸时停止进一步添加附加像素。
另外,对特征的处理步骤最好包括对扩展的轨迹进行处理,以便使轨迹与对象匹配。
在优选实施方式中,对象包括物件上的一个或多个标记,根据这些标记,由分拣系统对所述构件进行分拣,并且其中对特征的处理步骤包括识别所述标记,并且还包括根据识别的标记对物件进行分拣。
根据本发明的优选实施方式,还提供一种在图像中探测预定对象的设备,其构成包括:一个用来在图像中搜索其宽度在预定最大宽度和最小宽度之间的范围内的特征的图像处理器,此范围这样确定,使得属于此对象的线段的已知的笔画宽度处于此范围之内,所述图像处理器还用来对所述特征进行处理,判断其是否是对象的一部分。
最好,此设备包括图像捕捉装置,配置成为可捕捉包括对象的图像,并将此图像的电子表达传送到图像处理器。在优选实施方式中,对象包括物件上的一个或多个标记,由分拣系统根据这些标记对物件进行分拣,并且此设备可读出这些标记并根据这些标记对物件进行分拣。
根据本发明的优选实施方式,还提供一种在图像中搜索预定对象的计算机软件产品,其构成包括计算机可读媒体,其中存放有程序指令,这些指令,在由计算机读出时,使计算机在图像中搜索其特征宽度在预定最大宽度和最小宽度之间的范围内的特征,此范围这样确定,使得属于此对象的线段的已知的笔画宽度处于此范围之内,所述程序指令还使计算机对所述特征进行进一步处理,以便判断其是否是对象的一部分。
通过藉助下面附图的对本发明的详细描述可以对本发明获得更全面的了解。
附图说明
图1为本发明的优选实施方式的包裹分拣系统的示意图。
图2为根据本发明的优选实施方式的用来识别图像中的对象的方法的示意流程图。
图3为根据本发明的优选实施方式,特别适用于图2的目标识别方法的,用来在图像中探测有关区域的方法的示意流程图。
图4为在图1的系统中捕捉的图像的再现,其中,有关区域已利用图2和图3的方法加以识别。
图5示出的是作为沿着穿过图4中有关区域之一的一条线段的像素位置的函数的灰度值曲线。
图6是根据本发明的优选实施方式,由图5的灰度值导出的微分函数曲线。
图7为根据本发明的优选实施方式,特别适用于图2的目标识别方法的区域增长方法的示意流程图。
图8示出的是根据本发明的优选实施方式,通过将图2和7的方法应用于图4的图像而生成的斑点的图像的再现。
具体实施方式
图1为根据本发明的优选实施方式的包裹分拣系统20的示意图。其上具有标签24的包裹22由传送带26传送。包裹的灰度级的图像由摄象机28捕捉,最好是线性摄象机(line camera),或是电视摄像机或照相机。由摄象机捕捉的图像数字化并传送到处理器30,而处理器30应用下述的方法来识别标签24和/或包裹22上的其他特征。或者是,处理器可接收来自其他源的图像,或可从存储器(图中未示出)中提取图像。被识别的标签然后由分拣器32自动读出并由其为包裹分配相应的路线。
处理器30的构成最好是包括一个利用适当的软件编程以便执行本发明的方法的通用计算机。此软件可通过网络下载到处理器中,或者是可通过有形的媒体,如CD-ROM,提供并安装于处理器中。此种软件可以以类似的方式应用于其他图像处理应用中,并且可以以类似的方式提供并安装于其他计算机中。或者,此处所描述的方法也可以利用专用的硬件或可编程的数字信号处理器,或是利用专用的和/或可编程元件和/或软件的组合实现。此处所描述的在包裹分拣系统20中使用处理器30只是示例而不是限制。
图2为根据本发明的优选实施方式的用来探测图像中的对象的方法的示意流程图。此方法特别可用来发现像包裹22上的标签24这样的对象。尽管为了简明起见,下面对此方法的描述是针对在图像中探测单个对象的,但此方法可以很简单地扩展到同时或顺序地探测多个对象。
在核探测步骤40,在整个图像中扫描像素的一个小子集,以探测宽度在预定范围内的图像特征上的像素。为此目的所选择的范围取决于要探测的对象中的实际线段的宽度。这些像素称为核。在聚合步骤42,利用现有技术中公知的任何合适的聚类算法将核聚为群。比如,图像可分割为块(tile)。计数每个块中的核数,核数超过给定阈值的块被确定为属于有关区域(ROI)。
图3为根据本发明的优选实施方式的核探测步骤40的细节的示意流程图。在分拣步骤54,原始图像利用因子D在水平和垂直方向上分拣,从而生成一个只包含具有由(nD,mD)给出的(x,y)坐标的像素的子采样图像,其中n和m是整数。在此阶段待扫描的像素数相对于原始图像缩减为其D2分之一。
对于要在此图像中搜索的对象,笔画宽度的范围是这样确定的,即,使得组成图像中的对象的线段极其可能具有范围内的笔画宽度。此范围由最大宽度w1和w2限定。在最大宽度测试步骤56中,对分样图像中的像素的灰度值P(x,y)进行评估,以判断它们是否满足下面的复合条件:
P(x,y)<T
      AND
{
[P(x-w1,y)-P(x,y)]>t AND[P(x+w1,y)-P(x,y)]>t
     OR
[P(x,y-w1)-P(x,y)]>t AND[P(x,y+w1)-P(x,y)]>t
     OR
[P(x+d1,y+d1)-P(x,y)]>t AND[P(x-d1,y-d1)-P(x,y)]>t
     OR
[P(x+d1,y-d1)-P(x,y)]>t AND[P(x-d1,y+d1)-P(x,y)]>t
}
在这些式子中,T是灰度级阈值,而t是对比度阈值,两者都根据有关图像和对象的特点确定。参数d1等于w1/21/2。不等式P(x,y)<T测试像素的灰度值是否比阈值T暗。其余的不等式测试像素(x,y)和以此像素为中心的直径为w1的圆的相对两侧的上的两点之间的灰度级对比度是否大于t。虽然(x,y)取自分样图像,但圆上的点可取自原始的非分样图像。
满足上述条件的像素在步骤56中标记为“ON”,指示它们可能位于宽度小于最大笔画宽度w1的线段上。在最小宽度测试步骤58中,在步骤56中对标记为“ON”的像素重复同一过程,这一次使用最小笔画宽度w2(和相应的参数d2)。这样,在此步骤中,将可能位于宽度小于最小笔画宽度的线段上的像素标记为“ON”。在XOR步骤60中,取在步骤56和58中标记为“ON”的像素的逻辑和(“异或”)。逻辑和返回一个可能位于其宽度在最大和最小笔画宽度之间的线段上的像素的列表。此列表输入到步骤42以发现ROI。
此处援引作为参考文献的美国专利申请09/310287(已转让给本专利申请的受让人)描述了一种类似于在图3的步骤56中执行的算法。在该申请中,在图像中识别宽度小于预定最大值的线段,来发现文本像素,以便在执行光学字符识别的准备中进行最优二值化。不过在该申请中未提及排除宽度小于更小的最小宽度的线段。
图4为在系统20中捕捉的包裹22的图像的再现,其中示出了根据本发明的优选实施方式,在步骤42中发现的ROI66和68。在此示例中,在图像中搜索的对象是一个三角形的邮政标签64,该邮政标签64包含在ROI66中。在步骤40中使用的最大和最小宽度是根据形成三角形各边的暗色边界线确定的。在此阶段发现的另外的ROI68也包含宽度大约为标签的边界线64的宽度的线段。
返回图2。在对比度峰值提取步骤44中,对每个ROI中的灰度值沿着一组所选择的穿过ROI的扫描线进行扫描。扫描线可以是水平的、垂直的或对角的。尽管每个ROI有一个单个扫描线就可能足够,但最好是每个ROI使用两个或三个扫描线以保证搜索更为可靠。最好,扫描线之间的相对取向和间隔根据所搜索的对象的大小和形状来选择。无论如何,扫描线只包含ROI中的所有像素的一小部分。
图5示出的是沿着穿过ROI66的扫描线之一的灰度级像素值f(x)的曲线。在此图和下述的描述中,灰度值是颠倒的,所以255表示黑色,而0表示白色。曲线中的峰相应于强烈的对比度变化,这种变化,除其他因素之外,可以在扫描线穿过三角形标签64的暗色边界线之一的区域中遇到。为了评估这些峰的宽度和幅度,定义一个微分函数d(x):
d(x)=f(x)-f(x-L)
其中的L是所搜索的对象中的线段的预期笔画宽度的一半。
图6示出的是由图5的像素值f(x)导出的微分函数d(x)的曲线。图像中的对比度峰(CP)由d(x)中的一对正负峰,如峰74和76,的出现确定。为了确定一个CP,正负峰的幅值必须超过各自的预定阈值,并且峰间的间隔必须处于对象线段的预定最大和最小宽度限度之内。基于此间隔标准,峰74和76可代表一个CP,而峰78和80可代表另一个,但是峰82和84相距过远,不能代表CP,因此被废弃。
对于幅值阈值,可以观察到,峰76和78比峰74和80相对较弱。峰76和78代表标签64中的三角形的边界线和三角形内的暗灰色区域之间的跃变。这些跃变的特点在于比对比度比峰74和80代表的边界线和三角形外部的亮灰色区域之间的跃变的对比度更低。为了处理这一差别,应用于内峰76和78的阈值最好是比应用于外峰74和80的低一些。以这些阈值(根据对所搜索的对象的已知知识确定)表示的对比度特性不论图像中的对象取向如何,也不论对扫描线的分析是从左到右还是从右到左,均是适用的。任何满足对比度和峰间隔标准的CP都在步骤44中标记为候选CP。CP的位置标记为相应的正负峰对的中心处的像素。
在半径测试步骤46中,对于在步骤44中发现的每个CP计算半径。此半径定义为从CP到最近的“白”像素的距离。用于此目的的白像素定义为其灰度值较CP中心处像素更明亮,差值大于预定阈值的像素。在步骤44中,对比度是只沿着扫描线测量,而在步骤46中,对比度是在围绕CP中心像素的所有方向上测量。如果从中心像素到最近的白像素的距离小于或大于宽度范围的预定极限,则相应的CP就废弃。只有满足半径标准的CP进入斑点形成步骤48,在此步骤中这些CP经过扩张操作以重构ROI中的对象。
图7为根据本发明的优选实施方式的斑点形成步骤48的细节的示意流程图。在种子选择步骤90中,对于每个ROI,将在ROI中发现的CP之一选作扩张为斑点的种子。在此时也选择一个对比度阈值,应用此阈值来判断ROI中的哪些其他像素应该添加到属于该斑点的像素列表中,见下述。最好,此阈值根据种子的灰度值来选择,比如,为种子灰度值(其中黑色=255)的预定比例或是图像中种子和附近的背景像素之间的对比度的函数。这样,针对可能出现于图像的不同部分的对比度和/或亮度的变化,调整后续的斑点扩张步骤。最好是,如果在ROI之中存在多个CP,将亮度最大的CP初始选择为种子。对此明亮的CP选择的相对低的阈值也会将属于同一斑点的ROI中的较暗的CP吸收进来。
为开始扩张斑点,将一个指针初始化,指向斑点中的像素列表中的第一个像素,即指向种子本身(此时为列表上唯一的像素)。在邻像素检查步骤92中,当前由指针指示的此像素的所有的相邻像素都经受检查。对于每一个相邻像素,在像素检查步骤94中,首先判断此相邻像素是否已经被考虑过是否包括到此斑点中。如果不是,就在灰度检查步骤96中检查该相邻像素的灰度值,以便判断它是否比在步骤90中确定的阈值暗。如果是,就在像素添加步骤98中将此像素添加到斑点的像素列表中。在邻域完成步骤100中,判断此种子是否还有任何其他的相邻像素有待检查,如果是,就在下一个相邻像素步骤101中选择下一个相邻像素。重复步骤94至101一直到指针当前指示的像素的所有的相邻像素全部检查完毕为止。
在当前像素的所有的相邻像素都已经检查完毕时,在列表检查步骤102中对斑点中的像素的当前列表进行检查以便判断在列表中是否还存在其相邻点尚未经检查的像素。如果在列表中还存在这样的像素,就在尺寸监测步骤104检查斑点的当前尺寸,以便确信斑点还未超出预定尺寸限度。此限度由在图像中要搜索的对象的大小给出。如斑点的大小超过尺寸限度,则终止斑点扩张,以便避免在与对象不相对应的斑点上浪费处理时间。不过,只要未超过尺寸限度,就在下一个像素步骤106中将此指针增加1指向列表中的下一个像素,并重复前面的步骤。
当在步骤102中发现此过程到达列表底部时,就在CP检查步骤108中,检查当前ROI中的剩余CP,以便判断是否有CP未包括在现有列表中。如有,就在步骤90中将这些CP之一选作新种子,并且重复整个过程。如果同时在图像中搜索多个不同的对象,最好是首先将可能与最大的对象相对应的CP进行扩张。这些CP在步骤104中将具有较大的尺寸限度,得到的大斑点可能吸收掉被认为与较小的对象相对应的CP扩张时会生成的较小的斑点,从而可缩减完成ROI所要求的总的处理时间。
图8示出的是通过将步骤44、46和48(图2)应用于在图4的图像中确定的ROI66和68而生成的斑点的二值图像的再现。为生成这些斑点,首先利用间隔为三角形64的高度的一半的扫描线在步骤44中在ROI中发现对比度峰。三角形的暗色边界线在相对应的斑点中可清楚地识别。也生成了恰巧包含宽度与三角形的边界线类似的线段其他斑点110和112。
最后,在示于图2的对象识别步骤50中,分析斑点图像,以识别有关对象及其在整个图像中的位置。在此步骤中可以应用现有技术中公知的各种图像识别算法,或是利用单独的二值斑点图像,或是利用原始图像中相对应的灰度级信息。在此阶段中最佳算法的选择取决于对象的具体特点,超出了本发明的范围。不过,很明显,相对于现有技术中公知的对象识别算法必须应用于整个图像的图像处理方法,执行此算法所要求的时间将可以大大缩减,并且对象识别的可靠性可以大大提高。
虽然上述优选实施方式涉及到一定类型的灰度级图像的处理,但可以理解,本发明的原理可以很简单地用来处理任何类型的图像,包括彩色图像。可以理解,上面描述的优选实施方式只是示例,本发明不局限于上面具体示出和描述的内容。正相反,本发明的范围既包括上述各种特征的组合和子组合,也包括本专业人士在阅读上述说明会想到的在现有的技术中未公开的变化和变型。

Claims (19)

1.一种在图像中探测预定对象的方法,包括:
选择属于此对象的线段,此线段具有已知的笔画宽度;
确定最大宽度和最小宽度,两者一起确定一个包含所述笔画宽度的宽度范围;
在所述图像中搜索特征宽度在该范围内的特征;以及
对该特征进行处理以便判断其是否是对象的一部分。
2.如权利要求1的方法,其中,确定最大和最小宽度的步骤包括:确定当对象出现于图象中时对象中的线段宽度可能出现的变化。
3.如权利要求1的方法,其中,在图像中搜索特征的步骤包括:
在图像中搜索属于其宽度小于所述最大宽度的一个或多个图像元素的像素的第一轨迹;
在图像中搜索属于其宽度小于所述最小宽度的一个或多个图像元素的像素的第二轨迹;
取第一和第二轨迹的逻辑和。
4.如权利要求3的方法,其中,搜索第一轨迹的步骤包括:搜索一个像素,其灰度值与其他与其相距所述最大宽度的像素的灰度值相差至少一个预定对比度阈值。
5.如权利要求3的方法,其中搜索图像中的特征的步骤包括:在搜索轨迹之前对图像进行子采样,于是只有图像中的所有像素的一个子集被考虑包括到轨迹中。
6.如权利要求3的方法,其中在图像中搜索特征的步骤包括:将在第一和第二轨迹的逻辑和中的像素的群确定为图像中的有关区域,该区域是包含对象的候选区域。
7.如权利要求1的方法,其中,搜索图像中的特征的步骤包括:
在图像中确定一个有关区域,该区域是包含对象的候选区域;
选择穿过该有关区域的扫描线;
评估位于此扫描线上的像素的灰度值,查找互相分开的距离在所述范围内的对比度跃变对。
8.如权利要求7的方法,其中,选择扫描线的步骤包括:选择多个扫描线,其间的间隔相应于对象的尺寸而确定。
9.如权利要求7的方法,其中,评估灰度值的步骤包括:搜索下面这样的对比度跃变,即,在扫描线上选取的像素对各自的灰度值之间的差别超过预定阈值,所述像素对为:在给定的一个跃变两侧各一个像素。
10.如权利要求9的方法,其中,像素对互相之间的距离选择为笔画宽度的函数。
11.如权利要求1的方法,其中,特征的处理步骤包括:
搜索至少一个属于该特征的初始像素的轨迹;以及
扩张该轨迹来重构对象中的线段。
12.如权利要求11的方法,其中扩张该轨迹的步骤包括:通过在轨迹上添加一个与至少一个初始像素邻接并具有超出阈值的灰度值的附加像素。
13.如权利要求12的方法,其中,向该轨迹上添加附加像素的步骤包括:添加第一附加像素,其中,所述扩展轨迹的步骤还包括:
继续进一步添加与轨迹中的像素邻接并具有各自的超出相应的阈值的灰度值的附加像素;以及
当轨迹达到根据对象的尺寸决定的最大尺寸时停止进一步添加附加像素。
14.如权利要求11的方法,其中,对特征的处理步骤包括:对扩展的轨迹进行处理,以便使轨迹与对象匹配。
15.如权利要求1的方法,其中,对象包括物件上的一个或多个标记,根据这些标记由分拣系统对所述物件进行分拣,其中,对特征的处理步骤包括:识别所述标记,根据识别的标记对物件进行分拣。
16.一种在图像中探测预定对象的设备,其构成包括:一个用来在图像中搜索其宽度在预定最大宽度和最小宽度之间的范围内的特征的图像处理器,此范围这样确定:使得属于此对象的线段的已知的笔画宽度处于此范围之内,所述图像处理器还用来对所述特征进行处理,判断其是否是对象的一部分。
17.如权利要求16的设备,还包括图像捕捉装置,配置成为可捕捉包括对象的图像,并将此图像的电子表达传送到图像处理器。
18.如权利要求17的设备,其中,对象包括物件上的一个或多个标记,由分拣系统根据这些标记对物件进行分拣,并且此设备可读出这些标记并根据这些标记对物件进行分拣。
19.一种在图像中搜索预定对象的计算机软件产品,其构成包括计算机可读媒体,其中存放有程序指令,这些指令,在由计算机读出时,使计算机在图像中搜索其特征宽度在预定最大宽度和最小宽度之间的范围内的特征,此范围这样确定,使得属于此对象的线段的已知的笔画宽度处于此范围之内,所述程序指令还使计算机对所述特征进行进一步处理,以便判断其是否是对象的一部分。
CNB018097618A 2000-05-22 2001-03-26 在图像中探测对象的方法 Expired - Fee Related CN1228733C (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US09/575,570 US6512849B1 (en) 2000-05-22 2000-05-22 Finding objects in an image
US09/575,570 2000-05-22

Publications (2)

Publication Number Publication Date
CN1430764A true CN1430764A (zh) 2003-07-16
CN1228733C CN1228733C (zh) 2005-11-23

Family

ID=24300840

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB018097618A Expired - Fee Related CN1228733C (zh) 2000-05-22 2001-03-26 在图像中探测对象的方法

Country Status (14)

Country Link
US (1) US6512849B1 (zh)
EP (1) EP1290625B1 (zh)
JP (1) JP4132822B2 (zh)
KR (1) KR100503724B1 (zh)
CN (1) CN1228733C (zh)
AT (1) ATE414309T1 (zh)
AU (1) AU2001242725A1 (zh)
BR (2) BR0111017A (zh)
CA (1) CA2406933C (zh)
DE (1) DE60136541D1 (zh)
HK (1) HK1053730A1 (zh)
IL (1) IL152257A0 (zh)
MX (1) MXPA02011290A (zh)
WO (1) WO2001091040A1 (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101593276B (zh) * 2008-05-29 2011-10-12 汉王科技股份有限公司 一种视频ocr图文分离方法及系统
CN101625722B (zh) * 2009-08-11 2012-01-11 中国农业大学 载物识别图像的分类方法

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6912304B1 (en) * 1999-08-02 2005-06-28 Applied Materials, Inc. Two-dimensional scatter plot technique for defect inspection
DE10145608B4 (de) * 2001-09-15 2006-01-26 Eads Deutschland Gmbh Modellbasierte Objektklassifikation und Zielerkennung
US7058203B2 (en) * 2002-05-14 2006-06-06 Lockheed Martin Corporation Region of interest identification using region of adjacent pixels analysis
US7360092B1 (en) 2003-04-28 2008-04-15 Microsoft Corporation Marking and identifying web-based authentication forms
US7809158B2 (en) * 2005-05-02 2010-10-05 Siemens Industry, Inc. Method and apparatus for detecting doubles in a singulated stream of flat articles
DK3261782T3 (da) * 2015-02-26 2023-08-07 Lambhusasund Ehf Apparat til afbildning, sortering og afmåling af hele fisk

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS58217074A (ja) * 1982-05-14 1983-12-16 Hitachi Ltd 線の認識方式
US4817166A (en) * 1986-05-05 1989-03-28 Perceptics Corporation Apparatus for reading a license plate
US4749879A (en) * 1987-06-18 1988-06-07 Spectra-Physics, Inc. Signal transition detection method and system
US4972495A (en) * 1988-12-21 1990-11-20 General Electric Company Feature extraction processor
JP3265595B2 (ja) * 1991-09-27 2002-03-11 オムロン株式会社 画像処理方法およびその装置
JPH0896059A (ja) * 1994-09-28 1996-04-12 Toshiba Corp バーコード読取装置
GB9605207D0 (en) * 1996-03-12 1996-05-15 Ibm Address block location
US5923782A (en) * 1996-08-01 1999-07-13 Nynex Science & Technology, Inc. System for detecting and identifying substantially linear horizontal and vertical lines of engineering drawings
US6175655B1 (en) * 1996-09-19 2001-01-16 Integrated Medical Systems, Inc. Medical imaging system for displaying, manipulating and analyzing three-dimensional images
DE69822608T2 (de) * 1998-05-28 2005-01-05 International Business Machines Corp. Binarisierungsverfahren in einem Zeichenerkennungssystem

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101593276B (zh) * 2008-05-29 2011-10-12 汉王科技股份有限公司 一种视频ocr图文分离方法及系统
CN101625722B (zh) * 2009-08-11 2012-01-11 中国农业大学 载物识别图像的分类方法

Also Published As

Publication number Publication date
IL152257A0 (en) 2003-05-29
EP1290625B1 (en) 2008-11-12
CA2406933C (en) 2007-04-10
BRPI0111017B1 (pt) 2018-02-06
MXPA02011290A (es) 2003-04-25
HK1053730A1 (en) 2003-10-31
JP4132822B2 (ja) 2008-08-13
CA2406933A1 (en) 2001-11-29
KR20030005342A (ko) 2003-01-17
BR0111017A (pt) 2005-01-11
ATE414309T1 (de) 2008-11-15
DE60136541D1 (de) 2008-12-24
EP1290625A4 (en) 2007-06-27
EP1290625A1 (en) 2003-03-12
JP2004513410A (ja) 2004-04-30
AU2001242725A1 (en) 2001-12-03
WO2001091040A1 (en) 2001-11-29
US6512849B1 (en) 2003-01-28
CN1228733C (zh) 2005-11-23
KR100503724B1 (ko) 2005-07-26

Similar Documents

Publication Publication Date Title
Lee et al. Automatic extraction of characters in complex scene images
CN1168040C (zh) 邮件地址阅读器、分类机以及字符串识别方法
CN1111818C (zh) 二维代码识别的器件和方法
CN101122953B (zh) 一种图片文字分割的方法
CN111242899B (zh) 基于图像的瑕疵检测方法及计算机可读存储介质
CN110334760B (zh) 一种基于resUnet的光学元器件损伤检测方法及系统
Azad et al. A novel and robust method for automatic license plate recognition system based on pattern recognition
JPH03257304A (ja) 位置認識装置
CN1228733C (zh) 在图像中探测对象的方法
KR101030130B1 (ko) 중복 콘텐츠 검출 장치 및 검출 방법
JP6487565B2 (ja) 勾配場の特異点の記述子を用いた郵便物の画像のペア作成
Yoon et al. Blob detection and filtering for character segmentation of license plates
CN109690289B (zh) 偏析分析装置和方法
CN109492685B (zh) 一种用于对称特征的目标物体视觉检测方法
JP2005250786A (ja) 画像認識方法
CN110070520B (zh) 基于深度神经网络的路面裂缝检测模型构建及检测方法
JPH04350546A (ja) 異物検出方法
CN114627457A (zh) 一种票面信息识别方法及装置
JP2002277409A (ja) プリント基板パターンの検査装置
JP5157963B2 (ja) 対象物検出装置
CN1153358A (zh) 中英文表单的识别系统及识别方法
CN114202527A (zh) 一种手指检查方法及系统
Penz et al. Fast real-time recognition and quality inspection of printed characters via point correlation
JPH07230549A (ja) 画像処理装置およびその方法
JPH04169987A (ja) 文字列検出方法、文字列検出装置、文字列読取方法及び文字列読取装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C17 Cessation of patent right
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20051123