CN1415103A - 多分辨率标签定位器 - Google Patents
多分辨率标签定位器 Download PDFInfo
- Publication number
- CN1415103A CN1415103A CN00817858A CN00817858A CN1415103A CN 1415103 A CN1415103 A CN 1415103A CN 00817858 A CN00817858 A CN 00817858A CN 00817858 A CN00817858 A CN 00817858A CN 1415103 A CN1415103 A CN 1415103A
- Authority
- CN
- China
- Prior art keywords
- value
- unit
- image
- characteristic
- pixel
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B07—SEPARATING SOLIDS FROM SOLIDS; SORTING
- B07C—POSTAL SORTING; SORTING INDIVIDUAL ARTICLES, OR BULK MATERIAL FIT TO BE SORTED PIECE-MEAL, e.g. BY PICKING
- B07C1/00—Measures preceding sorting according to destination
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/146—Aligning or centring of the image pick-up or image-field
- G06V30/147—Determination of region of interest
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/18—Extraction of features or characteristics of the image
- G06V30/18086—Extraction of features or characteristics of the image by performing operations within image blocks or by using histograms
- G06V30/18095—Summing image-intensity values; Projection and histogram analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/24—Character recognition characterised by the processing or recognition method
- G06V30/248—Character recognition characterised by the processing or recognition method involving plural approaches, e.g. verification by template match; Resolving confusion among similar patterns, e.g. "O" versus "Q"
- G06V30/2504—Coarse or fine approaches, e.g. resolution of ambiguities or multiscale approaches
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/42—Document-oriented image-based pattern recognition based on the type of document
- G06V30/424—Postal images, e.g. labels or addresses on parcels or postal envelopes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10—TECHNICAL SUBJECTS COVERED BY FORMER USPC
- Y10S—TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10S209/00—Classifying, separating, and assorting solids
- Y10S209/90—Sorting flat-type mail
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Artificial Intelligence (AREA)
- Image Analysis (AREA)
- Image Processing (AREA)
- Navigation (AREA)
- Medicines Containing Antibodies Or Antigens For Use As Internal Diagnostic Agents (AREA)
- Ultra Sonic Daignosis Equipment (AREA)
Abstract
一种多分辨率标签定位器系统将输入的图像分成多个多像素单元。然后,该系统创建一个与输入图像相对应的抽样图像或低分辨率图像。抽样图像包括一个公共特性值,这个值对应于输入图像的多像素单元。系统鉴别抽样图像内的一个或多个区域,这些区域的特性与所关心的特性相对应。生成抽样图像的同时,系统还创建一个对应于输入图像的边缘显现图像。边缘显现图像包括对应于输入图像各个单元的边缘值。各个边缘值表示输入图像的对应单元的像素内边缘出现次数。系统鉴别输入图像内的一个或多个候选区域,这些区域的抽样图像特性和边缘显现图像特性与所关心特性相对应。然后,系统根据输入图像包含具有所关心特性的标记的可能性,对候选区域进行分类。最后,系统编辑候选区域列表,这些区域最可能包含具有所关心特性的标记。
Description
技术领域
本发明涉及图像处理,特别是自动包裹分类系统中的多分辨率标签定位器。
背景技术
包裹的自动分类变得非常普遍,因为它在提供快速可靠的包裹递送服务的同时,还减少了人工成本。但是,由于包裹很少有相同的大小和形状,使用图像处理来识别地址标签的自动包裹分类变得非常复杂,还易于出现标签读取错误。
为了捕捉一个包裹的优质的地址标签图像,供人工操作者读取,然后键入目的地址,摄像机必须以相当高的分辨率来扫描包裹的表面。高分辨率图像导致巨大的包裹图像,以及相应大的数据存储需求。在包裹自动分类中的一个问题,是要以与自动包裹分类系统的机械部分或传送系统的输出相匹配的速率,来处理高分辨率包裹图像。
除大图像处理时间之外,包裹的高分辨率图像处理中的另一个问题是定位目的地址标签。即使是高分辨率的图像,人工操作者仍然必须上下左右观看显示图像的屏幕,来鉴别目的地址标签的位置。这样靠眼睛扫描,极大地降低了自动包裹分类系统的效率。
其他的自动包裹分类系统曾尝试通过消除人工操作者读取并键入标签的目的地址的需要来提高效率。这些其他的系统包括使用受托标记的设备,以及依靠具有已知形状的包裹前沿的系统。
使用受托标记的自动包裹分类系统,利用光学字符识别(OCR)来确定附在一个对象上的目标或正文的位置和方向。例如,一个OCR读取系统扫描一个带有受托标记的包裹,并查找受托标记的位置。OCR系统可以以这样方式,利用受托标记来查找目的地址块的位置,受托标记的位置与目的地址块相关。类似地,OCR系统可以利用方向明确的受托标记来确定正文的方向,受托标记的方向与目的地址块中正文的方向有关。
尽管受托标记系统可以提高效率,但这些系统需要各个包裹接收点都有相同的受托标记,使得各个OCR系统都能识别出特殊的受托标记。因此,这样的系统一般要求包括受托标记并说明放置正文的可标记区域的预打印标签或是包裹。预打印的标签和包裹都很昂贵,不可避免地,有一定比例的用户将不会使用。
对于那些不使用受托标记和预打印标签的系统,利用形状已知的包裹的前沿,来确定包裹上正文的方向和位置。但是,与受托标记系统类似,这些系统在包裹的大小和形状方面不提供灵活性。
因此,自动包裹分类系统需要一项技术,不管包裹的大小和形状怎样,它都能方便地鉴别出扫描的包裹图像中的目的地址标签。在自动包裹分类系统中还需要一项技术,它能极大地减少处理图像或从扫描图像获得目的地址标签数据所需的时间。
发明内容
本发明是一个多分辨率标签定位器,它提供所处理的包裹图像中一个或多个区域的列表,其中可能包含所关心的标签。多分辨率标签定位器是自动包裹分类系统中的典型部分。
自动包裹分类系统中通常包括一个视频摄像机,安放在与传送设备相邻处。视频摄像机与两个视频处理器相连进行操作,这两个视频处理器产生至少两种不同的包裹图像信号。视频处理器产生包裹的第一抽样(低分辨率)图像和第二图像,第二图像对应于期望出现在标签上的标记的边缘显现(如正文)。
由视频处理器产生的两个图像,鉴别初始高分辨率图像的不同特性。例如,视频处理器的抽样图像硬件可以鉴别图像中具有代表标签特性的区域,而边缘显现处理器可以鉴别具有代表正文特性的区域。
把这两个图像馈送到一个单独的微处理器中,它使用一个多分辨率标签定位器程序来鉴别包裹上可能包含所关心标签的一个或多个区域。然后,基于从视频处理器产生的第一和第二个图像中提取的数据,多分辨率标签定位器程序把这些区域分类,编辑一个候选区域列表。
一般而言,本发明是用于自动包裹分类系统的一个多分辨率标签定位器系统。该系统获得一个包括多个像素点的视频信号,这些像素点定义了衬底的输入图像。系统把输入的图像分成多个多像素单元。在后面的计算中,系统提取与预处理的抽样图像和边缘显现图像相对应的特征值。
然后,多分辨率定位器系统创建与输入图像相对应的抽样图像(低分辨率图像),以减少后面计算中的数据量。利用与输入图像的各个多像素单元相对应的公共特性值,如单一像素,来生成这个抽样图像。各个公共特性值表示对应单元内像素的抽样图像。例如,如果多分辨率定位器系统设计成查找包或包裹上标签的位置,那么,由于标签相对于包或包裹通常有不同的颜色或不同强度的反射光,该系统会寻找包或包裹上很大的、相对较白的邻近区域(或是根据本发明的操作环境具有不同颜色的区域)。给包裹或包上那些具有较高光亮度或不同颜色值的区域,指配一个抽样图像值,然后把这个数据映射到一个图像空间来创建抽样图像。
用这个抽样图像,在微处理器上执行的特征提取功能可以有效地提取标签候选区域的特征参数。一些特征参数可能包括:标签候选的规范化尺寸和区域,宽高比,以及由抽样图像得出的潜在标签候选区域的相对平均光亮度。这些特征参数成为分类功能(以下要讨论)的输入数据。
多分辨率定位器系统的第一个视频处理器生成抽样图像的同时,第二个视频处理器创建一个与输入图像对应的边缘显现图像。边缘显现图像包含一个边缘值,与输入图像的各单元相对应。各个边缘值表示输入图像的相应单元的像素中边缘出现的数量。例如,如果多分辨率定位器系统设计为查找包或包裹上地址标签的位置,定位器系统将会寻找间隔紧密的黑白转换,因为地址标签上的正文具有这样的特性。条形码也有黑白转换,但这些转换都在同一个方向上排列。另一方面,标签上手书或键入的正文中的黑白转换往往具有随机方向。所以,多分辨率定位器系统利用这些特性来区分条码标签和包含正文的地址标签。
生成边缘显现和抽样图像后,多分辨率标签定位器系统鉴别这些图像中的一个或多个候选区域,它们具有与所关心特性相对应的抽样图像特性和边缘显现特性。该鉴别过程还包括对图像分别进行进一步处理。具体来说,多分辨率标签定位器程序要根据输入图像包含具有所关心特性的标记的可能性,对候选区域进行分类。基于这些特性,多分辨率标签定位器模块再编辑一个候选区域列表,这些区域最可能包含具有所关心特性的标记。
抽样图像属性
多分辨率标签定位器系统通过计算输入图像的各个单元内出现的像素值的直方图,来创建抽样图像。例如,公共特性值或像素值可能对应各像素近似的颜色。然后,系统从直方图中选择一个与像素值相对应的模式值,该像素值在输入图像相应的单元中出现最频繁。接着,系统将该模式值设置为单元的抽样图像中相应的公共特性值。
为了鉴别抽样图像中的一个或多个候选区域,这些区域具有与所期望的标记特性相对应的特性,多分辨率标签定位器系统计算一个与抽样图像相对应的公共特性直方图。然后,系统用低通滤波器和自适应移动窗口滤波器来使公共特性直方图平滑。
为了把标签候选从包裹背景中分离出来,多分辨率标签定位器系统从滤波后的公共特性直方图中选择一个或多个峰值,通过辨别上下限波谷值隔离出一个各波峰值附近的峰区。然后,系统通过把各峰区中的像素映射到与抽样图像相对应的空白图像,创建一个分段图像。接下来,系统鉴别分段图像中一个或多个相连的部分,它们与所关心特性相对应。这就产生了一个分段图像,其中,斑点或候选区域被有边界窗口或框所限制。对于各个有边界窗口,多分辨率标签定位器模块为有边界窗口内的单元计算一个或多个特征值,这些值可能包括有边界窗口的几何特性和/或相对平均光亮度值。其他特征值可能包括有边界窗口的规范尺寸、规范化区域以及宽高比。通常,这些特征值不随摄像机的方向和光照而变化。换而言之,如果摄像机方向改变或是背景光变化,这些特征值也不会改变。获得这些特征值后,多分辨率标签定位器模块合成一个特征矢量,它包括有边界窗口特征值以及有边界窗口内区域的特征值。
边缘显现图像属性
为了创建边缘显现图像,多分辨率标签定位器系统的第一个视频处理器的黑/白阈值功能对输入图像各单元中的像素值进行二元化处理。为了对输入图像的单元中的像素值进行二元化处理,多分辨率标签定位器系统把自适应二元化技术应用到单元中的像素值上,基于鉴别的背景像素值,来选择二元化像素值的阈值。然后,系统在各单元二元化后的像素值中,鉴别在各期望方向上的转换。接着,系统基于单元内的转换为各单元计算总的边缘显现值,并将各单元的边缘值设置为单元内像素的总边缘显现值。
通过把单元中的像素值与多个模板相比较,系统鉴别特定单元中的这些转换,那些模板定义了所关心特性中的像素模式。然后,系统还通过定义各个方向的计数器,累计单元内二元化像素值中在所期望方向上的转换。对于各个模板,系统把各模板的样例与单元的非重叠、相邻部分相比较(该单元具有与模板同样的大小),使单元的各像素与模板的至少一个样例相比较。然后,系统鉴别单元中一个或多个匹配的像素模式,它们与模板定义的像素模式相对应。系统鉴别与该像素模式相关联的方向,并递增一个或多个计数器的值,以响应每个匹配的像素模式的出现。
为了在转换和相应的计数器值的基础上,为各单元计算总的边缘显现值,系统应用了一个求和公式,过滤计数器值,以增加总的边缘显现值来响应随机方向,这些方向表明单元中存在正文。利用这个求和公式,系统避免了增加总的边缘显现值来响应统一的或是平行间距的转换,这样的转换表明单元中存在条码。这就允许系统消除输入图像中的一些候选区域,它们与条码标签相对应,这些条码标签不包括正文和目的地址信息。
有边界窗口属性
多分辨率标签定位器系统可以为各个有边界窗口计算许多不同的特征值。一个特征值是规范高度,表示由有边界窗口定义的高度与分段图像定义的高度之比。另一个有边界窗口特征值是规范宽度,表示由有边界窗口定义的宽度与分段图像定义的宽度之比。还有一个有边界窗口特征值是规范区域面积,表示由有边界窗口定义的区域面积与分段图像定义的区域面积之比。另一个有边界窗口特征值是宽高比,表示由有边界窗口定义的宽度和高度之比。
除了有边界窗口特征值以外,多分辨率标签定位器系统可以为有边界窗口内的单元计算许多不同的特征值,它们对应于平均光亮度。基于规范化的边缘显现密度(它表示有边界窗口内各单元的边缘显现值的和与有边界窗口内单元总数之比),系统可以计算特征值。基于规范化的边缘显现密度(表示有边界窗口内各单元的总的边缘显现值与有边界窗口定义的区域面积之比),系统也可以计算特征值。计算规范化边缘显现密度(优选实施例的转换密度)时,为了去除噪声,系统给低于预定义的阈值的有边界窗口内单元的总转换值赋零。
候选区域的预分类和分类
基于特征值特性,多分辨率标签定位器系统可以通过应用代表所关心特性的阈值先对候选区域进行预分类。例如,如果把多分辨率定位器设计为寻找包或包裹上的目的地址标签,由于标签通常具有最大和最小尺寸,多分辨率定位器就可以根据区域的大小来消除一些候选区域。然后,系统可以消除一个或多个具有相应有边界窗口的候选区域,这些有边界窗口定义了预定义最小阈值以下的区域。类似地,系统可以消除具有相应有边界窗口的一个或多个候选区域,这些有边界窗口定义了预定义最大阈值以上的区域。另外,系统可以修剪一个或多个候选区域,与具有预定义大小的有边界窗口相对应,该窗口的中心在为相应候选区域特征值计算的块中间附近。
对候选区域进行预分类之后,通过比较各个候选区域相应的特征矢量,根据包含具有所关心特性的标记的可能性,系统对候选区域进行分类。为了创建一个对候选区域进行分类的列表,通过把有边界窗口特征值与有边界窗口特征值的期望值相比较,系统计算对应于一个或多个有边界窗口特征值的第一个判定值。在这种情况下,有边界窗口特征值的期望值是所关心特性中的一个。例如,在标签定位器设计中,一个实际标签的有边界窗口可能有一个预定的期望区域、一个预定的期望周长和一个预定的期望宽高比。
在有边界窗口特征值的基础上计算出第一个判定值之后,系统再通过比较特征值与特征值的期望值,计算出与一个或多个其余特征值(也就是除有边界窗口特征值以外的)相对应的第二判定值。这些特征值的期望值也在所关心特性之中。
计算完判定值之后,通过定义一个具有多个判定子空间的判定空间,多分辨率标签定位器系统可以按优先次序列出候选区域列表。然后,系统基于有边界窗口的相关值和特征矢量的特征值,计算判定空间,并把特征矢量映射到判定空间。
硬件部分
本发明可以在视频图像系统中实施,用于接收由像素值组成的数据流(这些像素值定义了一个输入图像),并处理这些像素值,以查找输入图像中具有所关心特性的标记的位置。典型的视频图像系统包括第一图像视频处理器,用于把输入的图像分成多个多像素单元。视频图像系统还创建一个对应于输入图像的抽样图像,它包括与输入图像的各单元相对应的元素。
抽样图像的各元素表示输入图像的对应单元内像素的公共特性,如平均光亮度。为了生成抽样图像,第一视频图像处理器包括一个缓冲存储器,可以连续接收像素值。第一视频图像处理器通常在与缓冲存储器相连的现场可编程门阵列(FPGA)中实现,可以接收像素流。它还包括一个静态存储器设备,设定在像素流经FPGA时执行其操作。
除了第一视频处理器之外,视频图像系统通常还包括第二视频处理器,用于创建一个与输入图像相对应的边缘显现图像,它包括与输入图像的各单元相对应的元素。边缘显现图像的各个元素表示输入图像的相应单元的像素内边缘出现的数量。
同第一视频处理器一样,第二视频处理器通常也在FPGA中实现。为了创建边缘显现图像,第二视频图像处理器通常包括可与多个移位寄存器相连的缓冲存储器。这些移位寄存器都连接到一个动态的存储设备上。
第三视频处理器,最好作为在一般计算机上运行的软件系统进行配置,它鉴别抽样图像中的一个或多个区域,这些区域具有与标记的期望特性相对应的特性。第三视频处理器把抽样图像与边缘显现图像结合起来,根据这些区域包含具有所关心特性的标记的可能性,对候选区域进行分类。分类之后,第三视频处理器编辑候选区域的一个优先次序列表,这些区域最可能包含具有所关心特性的标记。
为了结合第一和第二视频处理器中的数据,计算候选区域的优先次序列表,第三视频图像处理器包括一个中央处理单元和存储设备。第三视频图像处理器可鉴别输入图像中的一个或多个候选区域,它们具有与所关心特性相对应的抽样图像特性和边缘显现图像特性。第三视频图像处理器还可根据包含具有所关心特性的标记的可能性,对候选区域进行分类,并编辑一个或多个候选区域的优先次序列表,这些区域最可能包含具有所关心特性的标记。
示例操作环境
本发明提供了一套可操作系统,用于在移动的包裹或包上定位具有所关心特性的标签。该系统包括一个包、一个可以移动包的传送器,以及安置在上述传送器相邻位置(一般在上方)的视频设备。当各个包经过视频设备时,视频设备对各个包进行扫描。与视频设备相连的视频处理器生成包的抽样图像和边缘显现图像。
为了评估抽样图像和边缘显现图像,系统还包括一个与视频处理器相连的微处理器。微处理器编辑候选区域的优先次序列表,这些区域最可能包含具有所关心特性的标记。
从以下对示范性实施例的详细说明以及附图和权利要求中,将很清楚地了解本发明对早先的自动包裹分类系统的改进以及上述优点的实现。
附图简要说明
图1是带上多分辨率标签定位器系统的功能方块图,它为本发明说明的实施例提供操作环境。
图2是一个方块图,说明多分辨率标签定位器系统所关心的衬底。
图3是一个功能方块图,说明与本发明的示范实施例相一致的多分辨率标签定位器系统。
图4是一个更加详细的逻辑流程图,为多分辨率标签定位器系统鉴别硬件和软件。
图5说明了所关心包裹的衬底的抽样图像。
图6说明了从抽样图像生成的分段图像。
图7说明了由多分辨率标签定位器系统的一个视频图像处理器生成的边缘显现图像。
图8说明了来自分段图像的有边界窗口,分段图像被映射到边缘显现图像。
图9A是硬件的功能方块图,该硬件把从摄像机生成的原始高分辨率图像限为一个黑/白二元图像。
图9B描述了图9A的黑/白二元化图像硬件的黑/白阈值逻辑。
图10是一个功能方块图,说明产生边缘显现图像的硬件。
图11是多分辨率标签定位器系统中负责生成抽样图像的硬件的功能方块图。
图12的逻辑流程图,说明在边缘显现图像的单元内的二元化像素值中,鉴别期望方向上的转换的过程。
图13的逻辑流程图,说明基于边缘显现图像内的转换,为一个单元计算总的边缘显现值的过程。
图14的逻辑流程图,说明通过计算像素值的直方图来创建抽样图像的过程,像素值的直方图出现在抽样图像的各个单元中。
图15的逻辑流程图,说明在抽样图像的各单元直方图中寻找波峰的过程。
图16的逻辑流程图,说明鉴别抽样图像中的一个或多个候选区域的过程,这些区域具有与衬底上的标记的期望特性相对应的特性。
图17说明了抽样图像的直方图。
图18是一个图表,说明如何通过高点和低点来确定抽样图像直方图的峰区。
图19的逻辑流程图,说明鉴别输入图像中一个或多个候选区域的过程,这些区域具有与所关心特性相对应的抽样图像特性和边缘显现图像特性。
图20说明分段图像中各个相连部分周围形成的有边界窗口。
图21的逻辑流程图,说明通过应用一组限定条件对候选区域预分类的过程。
图22的逻辑流程图,说明列出具有一个或多个特征矢量的候选区域的过程。
示范实施例的详细描述
应当了解,这里所描述的程序、过程、方法等,不限于任何特定的计算机、处理器或设备。相反,可以运用各种类型的计算设备来执行本方法的步骤。特别是,这里所描述的优选实施例依靠一个或多个现场可编程门阵列(FPGA)来完成所述的计算机执行过程。但是,其他类型的计算设备,如传统的冯·纽曼处理器或其他类型的专用硬件系统,同样可用于执行所述的方法步骤。
本发明优选实施例的操作环境说明
现在参照附图,图中相同的数字代表相同的部分。图1是多分辨率标签定位器系统20,它为本发明所说明的实施例提供了操作环境。多分辨率标签定位器系统20包括一个传送器22,它载送包裹24a-24c。当包裹24a-24c在CCD摄像机26下通过时,CCD摄像机26从反射光产生传送器22和包裹24a-24c表面的一个标准模拟视频图像。
CCD摄像机26可以是单色、4096像素行扫描型的摄像机,比如使用Thompson TH7833A CCD芯片的摄像机。穿过传送器22由CCD摄像机26创建的模拟图像的分辨率约为187像素或“点”每英寸(DPI)。实际上,可以从一个图像中消除每个其他像素,产生一个93 DPI的视频图像,以减少要处理的数据量。
视频处理器28把CCD摄像机产生的模拟视频图像转换为一个8位灰度级视频信号。然后视频处理器28把这个8位灰度级视频信号转换为抽样图像信号30。视频处理器28还把这个8位灰度级视频信号转换为边缘显现图像信号32。
视频处理器28把抽样图像信号30和边缘显现图像信号32传送给主计算机或微处理器34,它包括一个多分辨率标签定位器程序36。程序36编辑候选区域或标签候选38的优先次序列表,它们当中最可能包含目的地址标签。
总而言之,多分辨率标签定位器系统20的视频处理器28把模拟视频信号27转换为一个8位灰度级视频信号。然后,视频处理器28把这个8位灰度级视频信号转换为一个抽样图像信号30。另外,视频处理器28还把这个8位灰度级视频信号转换为一个边缘显现图像信号32。接着,视频处理器28把抽样图像信号30和边缘显现图像信号32传送给主计算机或微处理器34,在此,多分辨率标签定位器程序36从抽样图像信号30和边缘显现图像信号32提取数据,来产生标签候选38的优先次序列表。
图2说明由CCD摄像机26扫描的包裹24a的表面,其中,包裹是抽样图像和边缘显现信号的对象。包裹24a包括一个目的地址标签40和一个初始地址标签42。包裹24a带有条码44,它通常包括一个与运输部分相对应的编码,以及由包裹运输公司指配给包的一个唯一跟踪码。包裹24a还包括由CCD摄像机26扫描的邮资标记46和外部标记25。外部标记25是包裹上的附带部分,通常发生在包处理期间。标记25可以是在运输期间可能由于接触而给包裹做上标记的墨水印、斑点或其他残片。CCD摄像机26产生一个数字视频图像48,它捕捉了上述的标签40和42、条码44、外部标记25以及邮资标记46。
把二维像素化的图像48分成多个单元(如图5-8所示)。二维像素化图像48的各个单元最好包括32个连续扫描行的32个共线像素,形成32*32像素的正方形或长方形(如32行32列像素)。二维像素化图像48的各单元是一个正方形,其各边约为三分之一英寸(0.85厘米)。因此,32个扫描行包含128个单元,它们穿过传送器22并行排列。这些单元提供了一个固定的参照结构,多分辨率标签定位器系统在其中鉴别标签候选38。
多分辨率标签定位器系统概述
图3说明了多分辨率标签定位器系统20的一个更详细的功能方块图。系统20的视频处理器28包括一个边缘显现图像电路50和抽样图像电路52。边缘显现图像电路50和抽样图像电路52把187 DPI-8比特/像素模拟视频信号转换为3 DPI-8比特/像素数字视频信号。存储设备54(如SRAM)把从边缘显现图像电路50和抽样图像电路52接收到的、处理过的3 DPI-8位/像素数字视频信号存储起来。
视频处理器28包括抽样图像电路50和边缘显现图像电路52,它通常在FPGA这样的硬件中执行,当像素数据流经时,FPGA生成输出图像。视频处理器28把3 DPI边缘显现图像信号32和3 DPI抽样图像信号30传送给一个分类处理器,该处理器包括一个微处理器34和多分辨率标签定位器程序36。分类处理器34、36可以是公共的工作站或个人计算机,能够运行多分辨率标签定位器程序。
分类处理器34、36鉴别输入图像内的一个或多个候选区域,输入图像有抽样图像特性和边缘显现图像特性。分类处理器34、36根据包含所关心标签的可能性,对候选区域进行分类。分类处理器34、36编辑包裹24a的输入图像内候选区域的优先次序列表,它们当中最可能包含目的地址标签。然后,分类处理器34、36输出预定数量的候选标签定位38。
本发明的其它实施例
由于处理器速度和大小的增加,熟悉本发明的人们会承认,多分辨率标签定位器程序也可以在单一处理器的其他程序模块中执行。一般来说,程序模块包括例行程序、运行程序、组成部分、数据结构等等,它们完成特殊任务或实现特殊的理论数据类型。而且,人们还会赞赏,本发明可以与其他计算系统配置一起实施,包括手提设备、多处理器系统、基于微处理器的或可编程的用户电子设备、微型计算机、大型机以及其他类似的设备。本发明还可以在通过远程处理设备完成任务的分布式计算环境中实施,这些远程处理设备通过通信网络相连接。
尽管本发明最好在自动包裹分类系统中使用,但它不限于这种应用,还可以用于其他需要鉴别第一对象或存在于第二对象上的第一组对象的领域。例如,本发明可用于查找特殊元素的位置,如电路板上的导电线或微芯片。在此应用中,抽样图像电路52可以鉴别导电线或微芯片的高层级属性,而边缘显现图像电路50可以在相对于抽样图像电路52较小的规模上,寻找导电线或微芯片之间的离散差异。
与电路板的例子类似,可以选择多分辨率标签定位器系统用于鉴别包裹上的荧光标记或是鉴别包裹上的特殊形状,例如六边形可以表示邮资或其他。作为另一种选择,多分辨率标签定位器可用于制造业环境,来定位产品中的缺陷,比如可以通过视频图像处理检测到裂缝或其他缺陷。其他的制造业应用可能包括鉴别彩色纺织品或其他产品制造中的缺陷,它们都具有视频图像处理很容易检测到的可视特性。这样,本发明可用于许多不同的环境,在此通过视频图像处理可以很容易地检测到对象的可视特性。
多分辨率定位器系统概述
图4是多分辨率标签定位器系统20的计算机执行过程的逻辑流程图。在步骤86中,在边缘显现图像电路50和抽样图像电路52之间分离由CCD摄像机26生成的灰度级图像。边缘显现图像电路50和抽样图像电路52的操作步骤将分别描述,要注意,两个电路同时处理从CCD摄像机26接收到的灰度级图像信号。
在例行程序88中,边缘显现图像电路50把从CCD摄像机接收到的灰度级图像二元化,以产生图7中所说明的边缘显现图像。特别是,在例行程序88中,数字转换器66使用了一种自适应门限技术或类似的方法,把CCD摄像机26产生的模拟信号转换为一个1比特(即黑/白)数字视频信号。
在优选实施例中,在例行程序88期间,边缘显现图像电路40使用一个4*4像素的窗口来检测二元化图像内的转换s(边缘显现)。特别是,边缘显现图像电路50使用了一组预定义的4*4模板来检测被分析单元的4*4像素窗口的边缘显现的空间方向。
下表中示出了一个4*4像素窗口的示例:
表1
像素窗口
表1中,“0”代表所关心单元的像素中的空区,“1”代表所关心单元的像素中存在目标或标记。表1表明最后一行的三列中存在水平线。基于表2,对表1中的各个位置都指配了数值。
0 | 0 | 0 | 0 |
0 | 0 | 0 | 0 |
0 | 0 | 0 | 0 |
0 | 1 | 1 | 1 |
表2
指配表
32768(3,3) | 16384(2,3) | 8192(1,3) | 4096(0,3) |
2048(3,2) | 1024(2,2) | 512(1,2) | 256(0,2) |
128(3,1) | 64(2,1) | 32(1,1) | 16(0,1) |
8(3,0) | 4(2,0) | 2(1,0) | 1(0,0) |
表2中,括号中的数字定义表1中像素的相对位置。表中的各个位置还表示一个十六位寄存器的特定二进制数。各括号中的第一个数字为4*4像素窗口的列数,第二个数字为4*4像素窗口的行数。括号外的数字是与十六位寄存器中各个二进制数相对位置相当的十进制数。对这些值求和,允许由唯一的十进制数值表示4*4窗口每种可能的模式。
对于表1的4*4像素窗口,计算的模式值为7。这个值是由表2的4*4单元中的位置求和得来的:1(0,0),2(1,0),4(2,0),1+2+4=7。然后把这个值与模式值/加权值查找表相比较。给各个模式指配一个权值,通过这个表利用相关联的模式值对模式进行指标,以鉴别模式。查找表中给模式值7指配的加权值为102。
模式值查找表有十个不同的值,对应于指配给模式值组的不同方向或方向组合。换而言之,认为一个特定组中,所有的模式都有相同的方向或方向组合,这个方向或方向组合由指配给该组的模式值表示。特别是,模式值低四位的每一个数字对应于以下特定的方向:135°,90°,45 °,0°。即,二进制“0”位(最低有效位)对应于方向0°,二进制“1”位(第二最低有效位)对应于方向45°,二进制“2”位(第三最低有效位)对应于方向90°,二进制“3”位(第四最低有效位)对应于方向135°。
各个模式值依靠这种基于位的方向指示来表示哪一种方向或方向组合出现在对应的模式组中。例如,模式值65的二进制值为0010 0001。四个最低有效数字0001,表示方向0°(也就是说,没有设135°位、90°位、45°位,而设了0°位)。这样,我们认为指配了模式值65的这个模式组中的所有模式都展示方向0°。
类似地,模式值66,其二进制值为0010 0010,表示方向45°(也就是,没有设135°位、90°位、0°位,而设了45°位)。这样,我们认为指配了模式值66的这个模式组中的所有模式都展示方向45°。模式值68,其二进制值为0110 1100,表示方向135°和90°的组合(也就是,设了135°位、90°位,没有设45°位、0°位)。这样,我们认为指配了模式值108的这个模式组中的所有模式都展示方向135°和90°。表3说明了优选的模式值查找表。表3中示出了与模式值相当的二进制数,其最后四个数字强调各个模式值的基于位的方向指示。
表3
指配的加权值 | 计算的模式值 |
65=0010 0001 | 4369 |
8738 | |
13107 | |
17476 | |
26214 | |
30583 | |
34952 | |
39321 | |
48059 | |
52428 | |
56797 | |
61166 |
指配的加权值 | 计算的模式值 |
66=0010 0010 | 18 |
292 |
310 | |
311 | |
4680 | |
4972 | |
4990 | |
4991 | |
9344 | |
14024 | |
14316 | |
14334 | |
18432 | |
27776 | |
32456 | |
32748 | |
32787 | |
33079 | |
37759 | |
47103 | |
51199 | |
51201 | |
51219 | |
51511 | |
56191 | |
60544 | |
60545 | |
60563 | |
60855 | |
65224 | |
65225 |
65243 | |
65515 | |
65517 |
指配的加权值 | 计算的模式值 |
68=0010 0100 | 15 |
240 | |
255 | |
3840 | |
4080 | |
4095 | |
61440 | |
61455 | |
61695 | |
65280 | |
65295 | |
65520 |
指配的加权值 | 计算的模式值 |
72=0010 1000 | 132 |
139 | |
2114 | |
2246 | |
2254 | |
4236 | |
6350 | |
8448 | |
12543 | |
12552 |
12684 | |
14798 | |
16912 | |
25360 | |
29456 | |
29464 | |
29596 | |
31710 | |
33825 | |
35939 | |
36071 | |
36079 | |
40175 | |
48623 | |
50737 | |
52851 | |
52983 | |
52990 | |
57087 | |
59185 | |
61299 | |
63281 | |
63289 | |
63421 | |
65394 | |
65403 |
指配的加权值 | 计算的模式值 |
99=0110 0011 | 17 |
273 | |
274 | |
275 | |
290 | |
307 | |
4370 | |
4371 | |
4386 | |
4388 | |
4403 | |
4406 | |
4407 | |
4642 | |
4644 | |
4676 | |
4915 | |
4918 | |
4919 | |
4966 | |
4683 | |
8740 | |
8772 | |
8776 | |
9284 | |
9288 | |
9352 | |
13110 | |
13111 | |
13158 |
13164 | |
13175 | |
13182 | |
13183 | |
13926 | |
13932 | |
14028 | |
14199 | |
14206 | |
14207 | |
14318 | |
17480 | |
17536 | |
17544 | |
18560 | |
18568 | |
26220 | |
26312 | |
26316 | |
27784 | |
27848 | |
24852 | |
30590 | |
30591 | |
30700 | |
30702 | |
30718 | |
30719 | |
32460 |
32492 | |
32494 | |
32750 | |
32785 | |
33041 | |
33043 | |
33075 | |
34816 | |
34817 | |
34833 | |
34835 | |
34944 | |
34945 | |
37683 | |
37687 | |
37751 | |
39219 | |
39223 | |
39315 | |
46967 | |
46975 | |
47991 | |
47999 | |
48055 | |
51217 | |
51328 | |
51329 | |
51336 | |
51507 |
51603 | |
51609 | |
52352 | |
52353 | |
52360 | |
52371 | |
52377 | |
52424 | |
52425 | |
56183 | |
56247 | |
56251 | |
56759 | |
56763 | |
56795 | |
60552 | |
60569 | |
60616 | |
60617 | |
60620 | |
60859 | |
60891 | |
60893 | |
61128 | |
61129 | |
61132 | |
61147 | |
61149 | |
61164 |
61165 | |
65228 | |
65245 | |
65260 | |
65261 | |
65262 | |
65518 |
指配的加权值 | 计算的模式值 |
102=0110 0110 | 3 |
7 | |
22 | |
23 | |
30 | |
31 | |
52 | |
55 | |
60 | |
63 | |
120 | |
127 | |
300 | |
318 | |
319 | |
360 | |
382 | |
383 | |
480 | |
510 |
511 | |
840 | |
892 | |
895 | |
960 | |
1020 | |
1023 | |
1920 | |
2040 | |
2047 | |
4800 | |
5100 | |
5118 | |
5119 | |
5760 | |
6120 | |
6142 | |
6143 | |
7680 | |
8160 | |
8190 | |
8191 | |
11264 | |
13440 | |
14280 | |
14332 | |
15360 | |
16064 | |
16320 |
16364 | |
16380 | |
16382 | |
16383 | |
26624 | |
30720 | |
31872 | |
32384 | |
32640 | |
32712 | |
32744 | |
32760 | |
32764 | |
32771 | |
32775 | |
32791 | |
32823 | |
32895 | |
33151 | |
33663 | |
34815 | |
38911 | |
49152 | |
49153 | |
49155 | |
49171 | |
49215 | |
49471 | |
50175 |
51203 | |
51255 | |
52095 | |
54271 | |
57344 | |
57345 | |
57375 | |
57855 | |
59392 | |
59393 | |
59415 | |
59775 | |
60416 | |
60417 | |
60435 | |
60735 | |
63488 | |
63495 | |
63615 | |
64512 | |
64515 | |
64575 | |
64640 | |
64643 | |
64695 | |
65024 | |
65025 | |
65055 | |
65152 |
65153 | |
65175 | |
65216 | |
65217 | |
65235 | |
65408 | |
65415 | |
65472 | |
65475 | |
65480 | |
65483 | |
65504 | |
65505 | |
65512 | |
65513 | |
65528 | |
65532 |
指配的加权值 | 计算的模式值 |
103=0110 0111 | 19 |
14335 | |
32766 | |
32769 | |
51200 | |
65516 |
指配的加权值 | 计算的模式值 |
105=0110 1001 | 136 |
2116 |
2180 | |
2184 | |
2188 | |
2252 | |
4232 | |
4352 | |
4360 | |
4368 | |
4376 | |
4488 | |
4492 | |
6280 | |
6284 | |
6348 | |
8464 | |
8465 | |
8420 | |
8721 | |
8737 | |
12560 | |
12561 | |
12568 | |
12680 | |
13072 | |
13073 | |
13080 | |
13105 | |
13113 | |
13209 |
13212 | |
14745 | |
14748 | |
14796 | |
16913 | |
16929 | |
16930 | |
17441 | |
17442 | |
25361 | |
25393 | |
25395 | |
26161 | |
26163 | |
26211 | |
29457 | |
29489 | |
29491 | |
29497 | |
29593 | |
30513 | |
30515 | |
30521 | |
30579 | |
30587 | |
30651 | |
30653 | |
31675 | |
31677 |
31709 | |
33826 | |
33858 | |
33860 | |
34882 | |
34884 | |
34948 | |
34956 | |
35014 | |
35020 | |
35022 | |
35942 | |
36038 | |
36044 | |
36046 | |
36078 | |
39324 | |
39372 | |
39374 | |
40140 | |
40142 | |
40174 | |
48061 | |
48093 | |
48094 | |
48605 | |
48606 | |
48622 | |
50739 |
50787 | |
50790 | |
52323 | |
52326 | |
52422 | |
52430 | |
52455 | |
52462 | |
52463 | |
52855 | |
52967 | |
52974 | |
52975 | |
56798 | |
56814 | |
56815 | |
57070 | |
57071 | |
59187 | |
59251 | |
59255 | |
61043 | |
61047 | |
61159 | |
61167 | |
61175 | |
61183 | |
61303 | |
63283 |
63347 | |
63351 | |
63355 | |
63419 | |
65399 |
指配的加权值 | 计算的模式值 |
108=0110 1100 | 12 |
14 | |
134 | |
135 | |
142 | |
143 | |
194 | |
195 | |
206 | |
207 | |
225 | |
239 | |
2115 | |
2145 | |
2160 | |
2247 | |
2255 | |
2279 | |
2287 | |
2295 | |
2303 | |
3105 |
3120 | |
3299 | |
3311 | |
3315 | |
3327 | |
3600 | |
3825 | |
3839 | |
4108 | |
4110 | |
4238 | |
4302 | |
4335 | |
6383 | |
7407 | |
7935 | |
12288 | |
12296 | |
12300 | |
12482 | |
12495 | |
12556 | |
12750 | |
14543 | |
15615 | |
15855 | |
17152 | |
24832 | |
28672 |
28680 | |
28815 | |
28928 | |
28936 | |
29070 | |
29440 | |
29448 | |
29580 | |
30975 | |
31215 | |
31695 | |
33840 | |
34320 | |
34560 | |
35955 | |
36087 | |
36095 | |
36465 | |
36607 | |
36720 | |
36855 | |
36863 | |
40703 | |
48383 | |
49680 | |
49920 | |
50992 | |
52785 | |
52979 |
53040 | |
53107 | |
53235 | |
53239 | |
53247 | |
57600 | |
58128 | |
59152 | |
61200 | |
61233 | |
61297 | |
61425 | |
61427 | |
61696 | |
61710 | |
61935 | |
62208 | |
62220 | |
62224 | |
62415 | |
62430 | |
63232 | |
63240 | |
63248 | |
63256 | |
63280 | |
63288 | |
63375 | |
63390 |
63420 | |
65296 | |
65310 | |
65328 | |
65329 | |
65340 | |
65341 | |
65392 | |
65393 | |
65400 | |
65401 | |
65521 | |
65523 |
指配的加权值 | 计算的模式值 |
109=0110 1101 | 140 |
4104 | |
12544 | |
52991 | |
61431 | |
65395 |
在例行程序90中,边缘显现电路50检测一个单元中二元化像素值的存在与方向。“边缘显现”意味着对衬底或目标上的某一标记来说,当以比较高的频率出现时,标记上有特殊表面,表示该标记存在。例如,手写的标签有一套特别的边缘特性,它不同于条码标签的边缘特性。换句话说,当在其他环境中使用多分辨率定位器系统时,如电路板制造业,边缘显现电路50会产生一个边缘显现图像,显示某种微芯片或引线,它们具有较高频率的边缘特性,相对于其他微芯片或引线以及打印的电路板本身都是不同的或是唯一的。
如图7中所说明的,边缘显现图像58显示了标签候选区域25D、40D、42D、44D和46D之间不同的特征值,还显示了打出的标签40D、42D如何不同于条码44D。特别是,打出的标签40D、42D随机定向彩色像素,而条码44D的彩色像素以一致的方式定向。例行程序90提供了一种说明性的方法来鉴别上述的标签候选区域间的不同,参照以下图12将对此进一步详细描述。
例行程序92中,边缘显现图像电路50对边缘显现图像58的各个单元的转换进行合计。参照图13将对例行程序92进一步详细讨论。
例行程序88-92期间,多分辨率标签定位器系统同时进行例行程序94-98。例行程序94中,抽样图像电路52计算了一个像素值直方图,这些像素值出现在包裹或衬底的灰度级图像的一个单元中。参照图14将对例行程序94进一步详细描述。
例行程序96中,抽样图像电路52从例行程序94生成的直方图中,选择一个与最频繁出现在单元中的像素值相对应的抽样图像值。本发明标签定位器应用中的术语“抽样图像”,指通过低通滤波、把自适应移动窗口滤波器应用到输入图像、然后对滤波后的图像进行次采样而得到的图像。“公共特性值”是一个单值,它代表全部对应单元的特性。例如,单元的公共特性值可以是“模式”,或是在单元中最频繁出现的像素值。在这种情况下,公共特性值是峰值,映射到图像空间中相应单元的物理位置。这个公共特性值作为像素值保存起来,它成为图5中说明的抽样图像的基础。即,抽样图像电路52把单元模式值映射到图像空间,以产生抽样图像54,如图5所述。
图5中抽样图像54的突然变化通常鉴别标签候选区域25A、40A、42A、44A和46A。上述标签候选区域一般包括具有不同于背景或包裹表面24a的特性(像素值)的区域。这样,抽样图像54显示了所关心区域(如标签)与背景(包裹表面)之间主要视觉差异的“概况”、或“高层级”、或“低分辨率”的画面。例如,图5中标签候选区域25A、40A、42A、44A和46A由连接在一起的小方块表示,而包裹表面其他空闲区域则没有任何表面表示。与边缘显现图像电路50更加精密的聚焦相比,抽样图像电路52只在粗倍放大的水平上来观察所关心的物品。在对图15逻辑流程图的讨论中,将进一步详细描述多分辨率标签定位器系统如何产生例行程序96中的抽样图像54。
抽样图像54和边缘显现图像58都是源于最初的187 DPI图像信号的3 DPI图像信号。抽样图像电路52和边缘显现图像电路50分别生成各自的图像54和58之后,最好由多分辨率标签定位器程序36来完成多分辨率标签定位器系统20的其余步骤/例行程序98-106。
步骤98中,多分辨率标签定位器程序36对斑点进行分割,或者换句话说,它通过把峰区像素映射入与抽样图像54相对应的空白图像中,来创建一个如图6中所说的分割图像56。为了创建分割图像56,程序36生成一个来自抽样图像54的抽样图像直方图。而且,在步骤98中,程序36还鉴别分割图像56内一个或多个相连的部分,并生成有边界窗口25C、40C、42C、44C和46C。步骤98将参照图18详细描述。
例行程序100中,多分辨率标签定位器程序36把分割图像56和边缘显现图像58结合起来,形成图8的复合图像60。然后,程序36从复合图像60中提取特征值。图19中示出了例行程序100的详细情况。
例行程序102中,多分辨率标签定位器程序根据标签候选区域的期望有边界窗口特征值的预定条件,对标签候选进行预分类。一个条件包括标签候选区域的长度和宽度,如图20所说。参照以下图21,将更详细描述根据例行程序102中预定义的条件进行预分类的过程。
在例行程序104中,多分辨率标签定位器程序36根据另一组预定义的条件,对标签候选区域进行分类,一般引用的特征值包括有边界窗口特征值以外的特征值和有边界窗口特征值。参照以下图22,将更详细描述例行程序104。
在例行程序106中,多分辨率标签定位器程序36输出预定数量的标签候选,或编辑一个或多个候选区域的优选次序列表,它们最可能包括具有所关心特性的标记。例如,如果寻找手写目的地址标签,程序36会产生一个候选区域的优选次序列表,这些区域最可能包括手写目的地址标签,这些标签对应于最初由CCD摄像机26产生的高分辨率图像中的对象。
由多分辨率标签定位器生成的图像
图5说明了包裹24a表面的抽样图像54。抽样图像54与图2中的初始高分辨率数字图像相比,其分辨率较低。在这个多分辨率标签定位器的特殊示例中,抽样图像54包括多个标签候选区域25A、40A、42A、44A和46A。这些标签候选区域对应于图2中的地址标签40和42、条码44、外部标记25和邮资标志46。抽样图像54中的像素表示图2的高分辨率图像48中对应像素区的模式(也就是在对应的单元中最频繁出现的像素值)。因此,抽样图像54保存在最初的高分辨率数字图像48中存在的任何突然的颜色转换。
处理完抽样图像54后,抽样图像电路52产生分割图像56。分割图像包括多个相连的部分25B、40B、42B、44B和46B。这些相连部分对应于抽样图像54的标签候选区域25A、40A、42A、44A和46A。分割图像56还包括有边界窗口25C、40C、42C、44C和46C。这些有边界窗口对应于相连部分25B、40B、42B、44B和46B的边框或周界。生成相连部分和有边界窗口的方法,将参照图12-23的逻辑流程图,在对优选设备操作描述中进一步详细讨论。
多分辨率标签定位器系统生成抽样图像54的同时,系统还产生了边缘显现图像58,如图7所说。边缘显现图像58包括第二组标签候选区域25D、40D、42D、44D和46D。第二组标签候选区域也对应于图2的初始高分辨率数字视频图像48的地址标签40和42、条码44、外部标记25以及邮资标记46。在多分辨率定位器系统的这个特殊应用中,边缘显现图像电路50通过向平均分布的边缘方向均衡指配像素颜色,来创建边缘显现图像58,这些边缘方向在高分辨率数字视频图像48的相应像素区内。即,大量的随机定向转换导致了高的边缘显现值,而少量的转换或大量的一般定向转换导致低的边缘显现值。
当多分辨率标签定位器完成了对边缘显现图像56和分割图像58的处理时,系统创建图8的复合图像60,在此结合分割图像56的数据与边缘显现图像58。把分割图像56的有边界窗口25C、40C、42C、44C和46C映射到边缘显现图像58的第二组标签候选区域25D、40D、42D、44D和46D周围。更加特别的是,由多分辨率标签定位器程序36控制的主机或微处理器34,从复合图像60提取有边界窗口特征值以及与各个有边界窗口内单元的特征值相对应的特征值。在程序36的指导下,主机或微处理器34按照有边界窗口特征值以及由边缘显现电路50生成的标签候选区域的特征值,对标签候选区域25D、40D、42D、44D和46D进行分类。
优选设备描述
如上所述,本发明的优选实施例提供了一种确定地址标签位置的有效方法。而多分辨率标签定位器系统的其他应用也在本发明的范围之内。
为了执行本发明的方法,图9A显示的功能模块图说明了本方法中进行二元化灰度级图像这一步骤的硬件88,它是边缘显现图像电路50的一部分。边缘显现图像电路50的硬件88包括一个黑/白阈逻辑电路62,与缓冲存储器64相连结。缓冲存储器64可以是由商用芯片构造的公共先进先出(FIFO)缓冲器,如IDT公司生产的8k*18比特型号IDT7225 5L20PF芯片。可以选择由一个控制器和一个静态RAM存储器资源来执行缓冲存储器64。边缘显现图像电路50的硬件88把来自CCD摄像机26的初始高分辨率数字视频图像48限为黑/白二进制图像。
二元化硬件88运用标准门限技术或类似的方法,把CCD摄像机26产生的模拟信号转换为一个1比特黑/白数字视频信号67。通过边缘显现图像电路50,1比特黑/白数字视频信号67的使用为处理视频信号67提供了更容易的方法。
如图9B所说,二元化硬件88根据表4中列出的逻辑推导进行操作,表4中有5*4像素窗口定义的变量。二元化硬件88根据像素场中其相邻像素值来确定像素值。换句话说,二元化硬件88通过比较一个图像内的像素之间有关的色彩密度或光亮度值,把前景图像信息与背景图像信息分离开来。表4中的变量由图9B中显示的像素窗口定义如下:B2指扫描行B在位置2的灰度级值;BWC4指扫描行C在位置4的黑/白值。表4中其余变量的定义类似。
表4
(基于图9B的黑/白逻辑示例)F=Max(|B2-A1|,|B2-A2|,|B2-A3|,|B2-B1|,|B2-B3|,|B2-C1|,|B2-C2|,|B2-C3|)S={A1,A2,A3,B1,B3,C1,C2,C3}中的元素,对于|B2-S|=FIf(F>噪声阈值)If(B2>S)BWB2=WhiteElseBWB2=BlackElseIf(BWB3=Black AND BWCI=Black AND BWC2=Black AND BWC3=Black)BWB2=BlackElseBWB2=White
表5提供了图9B中基于像素窗口定义的变量消除斑点或噪声的逻辑。
表5
(基于图9B移去单一黑像素“斑点”)
If(BWB3=White AND BWB4=White AND BWB5=White AND BWC3=White AND BWC5=White AND BWD3=White AND BWD4=White
andBWD5=White)
BWC3=White
Else
BWC3=BWC3
二元化硬件88生成1比特黑白视频信号之后,与图4中的例行程序90相对应的硬件对该黑白视频信号进行处理。图10说明的硬件用于边缘显现图像电路50中的例行程序90。边缘显现图像电路50的硬件90包括数字转换器88、缓冲存储器68、移位寄存器70A-70D、易失性存储器72以及方向累加器74。上面提到的二元化硬件或数字转换器88,把模拟灰度级视频信号转换为1比特数字视频信号67。
二元化硬件88把1比特数字视频信号67发送给缓冲存储器68。缓冲存储器68包括数据行Li至Li-3,其中各个数据行对移位寄存器进行存取,移位寄存器包括4096比特,1个比特对应于CCD摄像机26的一个像素。因此,各个寄存器可以包含1比特图,表示由CCD摄像机26的一个循环产生的图像30的一个扫描行。缓冲存储器68的行Li至Li-3对应于各单元32*32的32像素高度(图中未显示)。
如图10所示,Li至Li-3各行连接到随后的下一个数据行,使得每一次把新扫描行读入缓冲存储器68,前面的扫描行就转移到随后的寄存器。缓冲存储器68可以是由商用芯片构造的公共先进先出(FIFO)缓冲器,比如IDT公司生产的4k*18比特型号为IDT72245LB20PF的芯片。或者,可以通过静态RAM(SRAM)存储源中的一个控制器来执行缓冲存储器64。
缓冲存储器68的数据行Li至Li-3与多个移位寄存器70A-70D相连。移位寄存器70A-70D向易失性存储器72提供像素信息。易失性存储器72可以是由商用芯片(如IDT公司制造的64k*4比特型号为IDT-61298SA12Y)构成的公共随机存取存储器(RAM)芯片。它生成模式方向信号76。易失性存储器72把模式方向信号76馈送给方向累加器92。方向累加器92生成一个单元方向信号78。参照图12,以下要对缓冲存储器68、移位寄存器70A-70D和易失性存储器72的操作进行更加详细的描述。参照图13,对方向累加器74的操作进行更加详细的描述。
当二元化硬件88生成图7的边缘显现图像58时,图11中的硬件52生成抽样图像54。抽样图像电路52最好包括缓冲存储器80、现场可编程门阵列82和SRAM 84。缓冲存储器80可以是由商用芯片(如IDT公司制造的4k*18比特型号为IDT-72245LB20PF FIFO)构成的公共先进先出(FIFO)缓冲器。现场可编程门阵列82可以是公共的FPGA芯片,如Altera公司制造的EPM7256SRC208-7 FPGA芯片。SRAM芯片84可以是由IDT公司制造的64k*16比特型号为IDT-7IV016SAIOPH SRAM的芯片。FIF080和FPGA82为多分辨率标签定位器系统20生成抽样信号30。参照图14、15,对抽样图像特征电路52的操作进行更加详细的描述。
参照逻辑流程图对优选设备操作的描述
以下所述的逻辑流程图,特别详细地说明了图4中边缘显现电路50、抽样图像电路52以及多分辨率标签定位器程序36的操作方法。图4的逻辑流程图对应于图1的整个多分辨率标签定位器系统20。图12、13的逻辑流程图对应于图9A、9B和图10的黑/白阈逻辑62、FIFO64、FIFO 68、移位寄存器70A-70D、RAM72以及方向累加器74。图14、15的逻辑流程图对应于图11的FIFO 80、FPGA 82和SRAM 84。图18、19、21、22的逻辑流程图对应于图1中所示的多分辨率标签定位器程序36。
逻辑流程图说明了执行本发明的首选方法,要注意,在本发明的宗旨和范围以内,可以对所说明的方法进行许多改变和变更。值得赞赏的是,逻辑流程图定义了在上述优选设备中指配程序任务。在本发明宗旨和范围内,也可以类似地定义在各种芯片中程序任务的不同指配和不同的FPGA芯片构成中设计任务的不同指配。
边缘显现图像处理
图12是图4中例行程序20(检测边缘的出现和方向)的计算机执行过程的逻辑流程图。图12还说明了图10中FIFO 68、移位寄存器70A-70D以及RAM 72的计算机执行过程。图12还与图5中说明的创建边缘显现图像54的初始步骤相对应。
例行程序90开始于步骤200,其中,对每32个像素(即32、64、96、128等等),逻辑表达式“pixel_NUM MOD 32=0”在“是”和“否”之间来回切换。该操作对应于把一个扫描行的4,096个像素分成部分的扫描行,每个扫描行宽32像素。如果对判定步骤200的查询答案为“是”,则沿着“是”的分支到达步骤202。如果对判定步骤200的查询答案为“否”,则沿着“否”的分支到达步骤204。
在步骤202中,由计数器A、B、C之间的数学关系来定义累加的边缘显现值T。把二元化图像的各个单元分派给三个计数器A、B、C。这些计数器定义了各个单元中边缘的相对方向。在步骤202中,主要特征图像电路50基于累加的边缘显现值T滤出信息。例如,由于各个单元的计数器A、B、C分别代表一个单元内各边的方向,那么,对于某些边缘(如条码),由于转换s的公共方向,边缘显现图像电路50就可以滤去条码。这样的滤除不限于优选实施例的标签环境。例如,在本发明的电路板识别应用中,可以在滤波等式中说明芯片上具有预定义方向的引线或标记(边缘)。
在步骤206中,把计数器A、B、C复位。步骤208中,边缘显现图像电路50保存当前的单元计数器值。步骤209中,边缘显现图像电路50移动到下一个单元计数器值。
当步骤200中的逻辑表达示pixel_NUM MOD 32不等于0时,执行步骤204的“否”分支,其中把变量M设为假。变量M是一个标志,用于指示步骤200中逻辑表达式的结果。
图12中,进行检测边缘的存在和其方向的操作之后,根据图4的例行程序92累加边缘数,图13对此作了进一步的解释。图13说明了图10中方向累加器74的计算机执行过程。把二元化图像的单元与4*4查找表中的模板进行比较之后,运行例行程序92。
例行程序92开始于步骤300,其中,计数器A、B、C分别代表各单元内各边的方向,它们的初始值为0。步骤304中,累加器74等待下一个扫描行。步骤306中,扫描行计数器Scan line_NUM逐一增加。累加器74的扫描行计数器Scan line_NUM从1计到32,然后滚动计数,与把输入图像分成32像素高的单元相对应。
步骤308中,累加器等待下一个像素。步骤310中,像素计数器pixel_NUM逐一增加。步骤310之后是判定步骤312,其中要确定是否满足pixel_NUM MOD32的条件。
如果步骤312的查询结果为真,则执行步骤314的“是”分支,其中,累加器74计算一个单元的方向值。如果步骤312的查询结果为假,则执行步骤314的“否”分支,其中累加器74确定当前像素的单元方向值是否等于0度而不是90度。
如果步骤314的查询结果为“是”,则执行“是”分支步骤316,在累加器74中令计数器A减1而计数器C加1。如果步骤314的查询结果为“否”,则执行“否”分支步骤318。步骤318中,要确定单元的方向值是否等于90度而不是0度。如果步骤318的查询结果为“是”,则执行“是”分支步骤320,其中累加器74给计数器A、C各加1。如果步骤314的查询结果为“否”,则执行“否”分支步骤322,其中,确定单元方向值是否等于45度而不是135度。
如果步骤322的查询结果为“是”,则执行“是”分支步骤324,其中累加器74给计数器A、C各加1。如果步骤322的查询结果为“否”,则执行“否”分支步骤326,其中,确定单元方向值是否等于135度而不是45度。本发明的单元方向值不限于例行程序92中列举的这些值。其他值随多分辨率系统的特殊应用而定。
继续例行程序92,如果步骤326的查询结果为“是”,则执行“是”分支步骤328,其中计数器B减少而计数器C增加。如果步骤326的查询结果为“否”,则执行“否”分支步骤330,其中确定当前的像素是否为扫描行中的最后一个像素。
如果当前像素不是该扫描行中的最后一个像素,则执行步骤330的“否”分支308,其中累加器74等待下一个像素。如果当前像素是该扫描行中的最后一个像素,则执行步骤330的“是”分支304,累加器74等待下一个扫描行。按照上述的步骤处理完数据之后,多分辨率标签定位器系统生成图7所说的边缘显现图像58。
抽样图像处理
当多分辨率标签定位器系统执行例行程序88-92的步骤进行边缘显现图像处理时,它还同时执行图14-16中说明的例行程序94-98,产生图5的抽样图像54。图14是图4的抽样图像电路52中例行程序94的计算机执行过程的逻辑流程图。
例行程序94开始于图4的步骤4,其中RAM A和RAM B都设为0。步骤402中,抽样图像电路52等待下一个扫描行。步骤404中,扫描行计数器Scan line_NUM逐一增加,从1加到32。
在步骤406中,确定是否满足条件Scan line_NUM MOD 32=0。熟悉该技术的人会赞赏,每隔32(如32、64、96、128等),逻辑表达式Scan line_NUM MOD 32=0会从假到真来回切换。这一操作有效地把输入图像分成32像素高的单元。
如果步骤406的查询结果为“是”,则执行“是”分支步骤408,在此确定每个单元直方图的峰值。如果步骤406的查询结果为“否”,则执行“否”分支步骤408,在此抽样图像电路52等待下一个像素。
步骤410中,像素计数器pixel_NUM加1。步骤412中,确定pixel_NUM计数器的值是否为奇数。如果步骤412的查询结果为“是”,则执行“是”分支步骤414,其中,设置变量VALUE的值与RAM B在地址(pixel_NUM MOD 32,像素值)的内容相等。步骤416中,变量VALUE加1。步骤418中,把变量VALUE写到RAMB的地址(pixel-NUM MOD 32,像素值)。
如果步骤412的查询结果为“否”,则执行“否”分支步骤420,其中,设置变量VALUE的值与RAM A在地址(pixel_NUM MOD32,像素值)的内容相等。步骤422中,变量VALUE加1。步骤424中,把变量VALUE写到RAM A的地址(pixel-NUM MOD 32,像素值)。
步骤426中,确定当前像素值是否是扫描行中的最后一个像素值。如果当前像素不是扫描行中的最后一个,则执行步骤426的“否”分支步骤408,其中抽样图像电路52等待下一个像素。如果当前像素是扫描行中的最后一个,则执行步骤426的“是”分支步骤402,其中抽样图像电路52等待下一个扫描行。
执行完图14中例行程序94的步骤之后,按照选定的抽样图像例行程序92的步骤,多分辨率标签定位器系统继续处理数据。图15说明了图4中选定的抽样图像例行程序96的计算机执行过程。
步骤500是例行程序96的第一步。图15的步骤500中,把地址计数设为0。步骤502中,把峰值变量和峰值二进制数变量设为0。步骤504中,把二进制数的值设置为等于RAM A在地址[地址计数]的内容和RAM B在地址[地址计数]的内容相加。
在判定步骤506中,抽样图像电路52判定二进制数值是否大于峰值。如果答案为“是”,则执行“是”分支步骤508,把峰值设为与二进制数值相等,把峰二进制数值设为与地址计数MOD 255的值相等。
如果步骤506的查询答案为“否”,则执行“否”分支判定步骤510,判定地址计数是否等于最大值。如果答案为“是”,则执行“是”分支,处理过程继续。如果答案为“否”,则执行“否”分支判定步骤512,判定变量地址计数MOD 255的结果是否等于0。
如果判定步骤512的查询结果为“是”,则执行“是”分支步骤514,把单元值设为与地址计数相等,把峰值设为与峰二进制数值相等。抽样图像电路52从步骤514去到步骤502。如果判定步骤512的查询结果为“否”,则执行“否”分支步骤516,其中地址计数加1。抽样图像电路52从步骤516返回步骤504。按照上述步骤处理完数据之后,多分辨率标签定位器系统生成图5所说的抽样图像54。
分段图像处理
图16说明了图4中例行程序98的计算机执行过程,它生成图6的分段图像56。例行程序98开始于图16中的步骤600,其中多分辨率标签定位器程序36计算图5中抽样图像54的直方图。步骤600之后的步骤602中,程序36把分段线性样式中直方图的峰点连接起来,创建一条曲线。程序完成步骤602中的两个过滤阶段:首先,程序36通过低通滤波器对步骤600中计算的直方图进行滤波。低通滤波器包括7像素移动窗口或包络的应用,去除能量振动,并使该直方图平滑。接下来,程序36在第二阶段应用自适应移动窗口滤波器,进一步对滤波后的数据进行处理。
图17是一个图表,展示了图16的步骤602中所运用的平滑包络或低通滤波器。优选实施例的这个图表中,横坐标表示抽样图像54的像素的光亮度,纵坐标表示特定光亮度下出现/像素/直方图的数量。除光亮度以外的其他测量参数都不超过本发明的范围。例如,当一个直方图多分辨率标签定位器系统使用彩色图像时,可使用彩色直方图/图表。程序36应用7个像素移动窗口或包络,来去除能量振动,并使直方图平滑。
接下来,多分辨率标签定位器程序36进行自适应移动窗口滤波过程,包括沿着曲线从左到右移动。如果直方图在每个连续点振荡,则中间点的值等于两个相邻点的平均值。因此,Hi+1=0.5x(hi+hi+2),其中,Hi为点i处的直方图值。这个过程令两个点移向平均值,使曲线粗糙的区域平滑一些。
自适应移动窗口滤波过程完成之后,多分辨率标签定位器程序36继续执行步骤604。该步骤中,程序36鉴别图18说明的滤波后直方图的峰值。在所示的示例中,图18的滤波后直方图的峰值与抽样图像54的相连部分相对应。
如图18所说,多分辨率标签定位器程序36按照从最高到最低的次序搜索各个峰值。如果对于向下倾斜的D1>12且D2>10且H2>20;或D1>5且D2>2且H1>20且H2>8且V<30;或i=255;或hi=-1(其中hi是像素值i处的直方图值),则认为H点为低点。如果向下倾斜的H1>12且V<5;或H1>10且D1>20且V<10;或i=255;或H1=-1;或H1>80且D1>1且V<8;或H1>5且D1>5且V<2,则认为H点为低点。
在判定步骤606中,多分辨率标签定位器程序36判定一个区域的峰数是否大于10、区域的高度是否小于3个像素或者区域的高度是否小于30个像素。峰数、高度、区域等这些值都随多分辨率标签定位器系统的应用而定。换句话说,对于所关心特征的特殊大小,这些值都是可以更改的。例如,如果多分辨率定位器在电路板上搜索到一个特定大小的微芯片,则按特殊微芯片的大小更改这些值。
如果步骤606的查询结果为“是”,则执行“是”分支步骤608,在其中保存该数据。步骤610中,删掉峰值,程序36返回步骤604。如果步骤606的查询结果为“否”,则执行“否”分支步骤612。
步骤612中,多分辨率标签定位器程序36通过把滤波后直方图的各个峰值区内的像素映射到与抽样图像54相对应的空白图像中,创建一个分段图像56(如图6所说)。分段图像通常会显示候选区域或斑点区。步骤614中,程序36使用一个相连部分的子程序(如从SRIInternational可以获得的),来创建相连的组件25B、40B、42B、44B及46B,它们代表候选区域。SRI子程序把分段图像56中具有相似像素亮度的区域连接起来,它还生成有边界窗口25C、40C、42C、44C及46C,它们限定了相连的组件25B、40B、42B、44B及46B。
复合图像处理
作为图16的例行程序98的结果、生成图6的分段图像56之后,多分辨率标签定位器继续图19的例行程序100。例行程序100开始于步骤700,在此,多分辨率标签定位器程序36把分段图像56的有边界窗口25C、40C、42C、44C及46C与边缘显现图像58的标签候选区域25D、40D、42D、44D及46D结合起来。步骤702中,把图6的有边界窗口25C、40C、42C、44C及46C映射到图7的边缘显现图像58中,以生成图8的复合图像60。
步骤704中,多分辨率标签定位器程序36基于有边界窗口特性提取特征值。有边界窗口的特征值包括以下部分:规范高度,表示由有边界窗口定义的高度与分段图像定义的高度之比(X1/H,其中,X1是有边界窗口定义的高度,H是分段图像56定义的高度);规范宽度,表示由有边界窗口定义的宽度与分段图像定义的宽度之比(X2/W,其中,X2是有边界窗口定义的宽度,H是分段图像56定义的宽度);规范区域,表示由有边界窗口定义的区域与分段图像定义的区域之比(X2*X1/H*W);以及宽高比,表示由有边界窗口定义的宽度与高度之比。图20为有边界窗口10的示范性长度X2和宽度X1。把图20的有边界窗口10映射到分段图像56,有边界窗口10包含峰区隔离数据12。按以下式子计算有边界窗口10的宽高比:
如果X1>=X2,则为X1/X2;否则使用X2/X1。
上面说过,多分辨率标签定位器程序36基于有边界窗口特性提取特征值。而特征值可能包括以下的任何一个:规范化的特征密度T,表示有边界窗口内单元的特征值之和与有边界窗口内单元总数之比;规范化的边缘显现密度I,表示有边界窗口内单元的累计边缘显现值之和与有边界窗口定义的区域之比。
一旦多分辨率标签定位器程序36基于有边界窗口特性提取了特征值,程序36在步骤706中为各个标签候选区域合成一个矢量V。矢量V以多个特征值为基础,这些特征值包括那些基于有边界窗口特性的特征值,也包括那些不是基于有边界窗口特性的特征值,如光亮度。程序36在预分类器例行程序102和分类器例行程序104中,利用矢量V来判定特别的标签候选区域是否可能包含实际的目的地址标签。
预分类器例行程序
图21说明了图4中预分类器例行程序102的计算机执行过程。步骤800是例行程序102的第一步。步骤800中,多分辨率标签定位器程序36消除一个或多个斑点或标签候选区域,它们有相应的有边界窗口,定义了一个预定义最小阈值以下的区域。标签候选区域由长度X1和宽度X2确定。如果候选区域小于一个值(如20),程序36可以消除候选区域。熟悉本技术的人们也会承认,基于多分辨率标签定位器系统的应用,可以改变这些阈值。例如,可以设计多分辨率标签定位器系统来鉴别电路板上的特殊引线,电路板有预定义的长度和宽度。这种情况下,这些阈值以所关心引线的长度和宽度为基础。
步骤802中,多分辨率标签定位器程序36消除一个或多个斑点或标签候选区域,它们有相应的有边界窗口,定义了一个超过预定义最大阈值的区域。例如,程序36可以消除值大于1,600的标签候选区域,因为由于图像的尺寸、像素间距等等,这样的区域很可能没有地址标签。地址标签的有边界窗口区域通常小于1600(优选实施例的3 DPI图像中约为40平方英寸)。
步骤804中,程序36可以提取期望的标签大小的候选区域或斑点,其区域在预定义的最小和最大值之间。例如,这样的最小阈值可能是20(约4.5平方英寸),最大值可能是1024(约32平方英寸)。
步骤806中,多分辨率标签定位器程序36修剪一个或多个候选区域或斑点,以对应于预定义大小的有边界窗口,有边界窗口位于为相应候选区域的光亮度特征值计算的块中心附近。步骤806中,程序36调用块中心子程序,来处理具有最高边缘显现密度的可能的候选区域。对于优选实施例,最高的边缘显现可能就是最合适的方向分布。然后,程序36继续进行到输出模块808,其中,变量VBi-m表示一个特殊的斑点或可能的标签候选区域的特征矢量。
分类例行程序
完成图21所说的预分类过程之后,多分辨率标签定位器程序36开始图22所说的分类例行程序104。步骤900是例行程序104中的第一步。步骤900中,程序36计算与一个或多个可能基于有边界窗口特性的特征值相对应的绝对判定值或误差。如上面所提及的,有边界窗口特征值可以是有边界窗口的宽高比。然后,对于期望大小的地址标签,把这个宽高比与期望的或典型的宽高比相比较。
有边界窗口特征值与标签候选区域的尺寸有关,而其他特性值可能与视频摄像机检测到的图像参数有关。例如,一个特征值可能是边缘显现图像58内候选区域的规范化边缘显现密度。然后,把这个规范化边缘显现密度与期望的边缘显现密度相比较。另一个特征值可能是规范化的光亮度。把可能的候选区域的这个规范化的光亮度与抽样图像54的期望光亮度进行比较。步骤900中计算的绝对判定误差值可以概述如下:
宽高比绝对判定误差eR:
eR=|X1/X2-R0|
其中,R0为期望的或典型的宽高比。对于地址标签,确定该值为1.5。X1/X2是特定斑点或标签候选区域的有边界窗口的宽高比。(有边界窗口的长度X1和宽度X2见图20)。
边缘显现绝对判定误差eT:
eT=|Ti/N-T0|
其中,T0是期望的边缘显现密度。对于地址标签,已经把T0确定为1.0。Ti/N是可能的候选区域的边缘显现密度。
灰度级光亮度绝对判定误差eI:
EI=|Ii/N-I0|
其中,I0是抽样图像54的期望光亮度。标签环境下I0的期望值为255。Ii/N是特定斑点或标签候选区域的光亮度。
规范尺寸绝对判定误差eD:
eD1=maximum(|d1-l1|)
eD2=maximum(|d2-l2|)
其中,d1和d2都是标签候选区域的规范尺寸。
d1=X1/W
d2=X2/W
其中,X1和X2是有边界窗口的长度和宽度,W是抽样图像54的宽度。
l1和l2是期望的规范尺寸,其中,
如果d1<d2,则l1=20/W,l2=22/W;或者
如果d1>=d2,则
l1=22/W,l2=20/W
计算完步骤900的绝对判定误差之后,多分辨率标签定位器程序36继续执行步骤902。步骤902中,程序36把四个误差码(CR、CT、CI和CD)指配给各个标签候选区域。各个码(CR、CT、CI和CD)的值以步骤900中涉及判定误差值的计算为基础。熟悉本技术的人们承认,可以依据多分辨率标签定位器系统的应用来调整这些误码值。下面是确定误码的等式:
宽高比误码CR:
1 eR<=1.5CR = 0 1.5<eR<=2.5
-1 eR>2.5边缘显现误码CT:
1 eT<=0.667CT = 0 0.667<eT<=0.800
-1 eT>0.800灰度级光亮度误码CI:
1 eI>IwCI = 0 eI<=IB
-1 IB<eI<Iw其中,IB=0.2*动态范围,Iw=0.5*动态范围。规范尺寸误码CD:
1 e
D1
<=1且eD2<=1
CD = 0 其他
-1 eD1>=|X1-24|或eD2>=|X2-24|
计算出步骤902的误码之后,多分辨率标签定位器程序36继续执行步骤904。步骤904中,基于步骤902中计算出的误码C,程序36把给各个标签候选区域指配一个类“S”值。按以下公式计算类“S”值:
类“S”值:
1 如果CR=1和CT=1
S =0 如果CR=0和CT=1和CD=-1;或
如果CR=1和CT=0和CD=-1;或
如果CR=1和CT=-1和CD=1;或
如果C1=-1和CR=1和CD=-1
-1 其他
当程序36结束给各标签候选区域指配类“S”值时,它开始执行步骤906。步骤906中,给各个标签候选区域指配一个误差表同等值J。按以下公式计算各个误差表同等值J:
误差表同等值J:
11 如果CR=1和CT=1;
0 如果CR=0和CT=1和CD=-1;
J = 1 如果CR=1和CT=0和CD=-1;
2 如果CT=-1和CD=1;
3 如果C1=1和CD=-1和CR=1;
-1 其他
把误差表同等值J指配给各个标签候选区域之后,程序36去除那些类S值等于-1的标签候选区域。一旦程序36去除了这些区域,它继续执行步骤908。
步骤908中,根据下列规则,程序36为各个类S值等于1或0的标签候选区域计算相对判定误差E:
规则(1):
把类S值=1的标签候选区域特征矢量V的相对误差E归类为小于类S值=0的标签候选区域特征矢量V的相对误差;
规则(2):
把类S值=1的标签候选区域特征矢量V的相对误差E设为与其边缘显现绝对判定误差eT相等;
规则(3):
类S值=0的标签候选区域,其特征矢量V的相对误差E计算如下:
多分辨率标签定位器程序36通过分别比较各对标签候选区域的特征矢量V1、V2,来确定类S值=0的标签候选区域的相对误差E,以确定这对区域中哪个的相对误差E较小。程序36使用来自相应标签候选区域对中各个区域的误差表同等值J,来确定误差指标值L。例如,通过使用两个误差表同等值(J1来自第一个标签候选区域,J2来自第二个标签候选区),确定一对标签候选区域的误差指标值L,它提供了误差指标值在表6中的适当位置:
表6
误差指标
J1J2 | 0 | 1 | 2 | 3 |
0 | 1 | 4 | 5 | 6 |
1 | 4 | 1 | 8 | 6 |
2 | 5 | 8 | 3 | 3 |
3 | 6 | 6 | 3 | 3 |
从表6中确定了一对标签候选区域的误差指标L之后,程序36基于以下标准,再确定各区域的相对误差E:
如果L=1,则相对误差Ei=边缘显现绝对判定误差eTi,其中,Ei是标签候选区域的特征矢量Vi的相对误差,i=1、2,分别表示各标签候选区域;
如果L=3,则相对误差Ei=灰度级光亮度绝对判定误差eIi;
如果L=4,则相对误差Ei(边缘显现绝对判定误差eTi+宽高比绝对判定误差eR);
如果L=5且J2=0且规范尺寸误码CD2=1;或者L=5且J2=2且规范尺寸误码CD2≠1,则E2<E1,否则E2>E1;
如果L=6且J1=3且灰度级光亮度误码CI1=1,则E1=0.5*(灰度级光亮度绝对判定误差eI1+宽高比绝对判定误差eR1);
如果L=6且J2=2且灰度级光亮度误码CI2=1,则E2=0.5*(灰度级光亮度绝对判定误差e12+宽高比绝对判定误差eR2);
如果L=8且J2=2且灰度级光亮度误码CI2=1,则E2<E1,否则E2>E1。
步骤908中为各标签候选计算完相对误差E之后,程序36继续执行步骤910。步骤910中,程序36去除那些重叠的标签候选区域。如果一个标签候选区域与另一个交迭达85%,我们就认为这两个区域是重叠的。对于满足该重叠标准的标签候选区域,程序36根据以下标准去除两个重叠标签候选区域中的一个:
如果重叠的标签候选区域中,一个所指配的类值S=1而另一个S=0,则程序36要去除类值S=0的候选区域。否则,程序36要去除相对误差E较大的候选区域。
步骤912中,多分辨率标签定位器程序36根据以下标准,鉴别并列出最可能包含地址标签的标签候选区域:如果有三个以上的标签候选区域的类S值=1,则表示三个最小相对误差E的标签候选区域是最可能包含标签的;如果有两个或三个标签候选区域的类S值=1,则表示这组标签候选区域是最可能包含地址标签的。换句话说,如果少于三个候选区域的S=1,则通过类S值=0的最小相对误差候选来对标签候选配组。如果没有标签候选区域,或者只有一个标签候选区域的类S值=0,则表示所有类S=1的标签候选区域以及类5=0的最小相对误差E标签候选区域,都是最可能包含地址标签的。如果没有候选区域的类S=1或=0,则表示候选区域没有标签。标签候选区域优先次序列表的输出
完成步骤912中的列表和选择过程之后,程序36继续执行例行程序106。例行程序106中,多分辨率标签定位器系统向一个显示设备或其他输出设备(如打印机)输出最可能包含地址标签的标签候选区域的优先次序列表。利用这个标签候选区域优先次序列表,自动包裹分类系统就可以以平均每秒25包的速度来处理包裹了,对于较低动态范围的图像,精确率约为90%。对于高动态范围的图像,包裹分类系统可以约95%的精确率来处理包裹。
虽然本发明提高了包裹处理或分类的精确性,多分辨率标签定位器系统的其他应用或实施并不超过本发明的这个范围。其他的应用或实施包括以下所列(但不限于此):鉴别印刷电路板上的引线或微芯片;鉴别包裹上的荧光标记;鉴别包裹上的特殊形状,如六边形,那可以表示邮资等;定位产品中的缺陷,如通过视频图像处理可检测到的裂缝或其他缺陷;鉴别彩色纺织品加工中的疵点;以及通过视频图像处理可以很容易地检测到对象的视觉特性的其他类似情况。
在上述方式中,多分辨率标签定位器系统20的优选实施例基于扫描图像,输出预定数量的候选标签位置。值得赞赏的是,本发明提供了改进的方法和设备,来对衬底上具有所关心特性的标记进行定位。从本发明的示范性实施例的上述描述,很明显可以看到许多其他的改进和另外的特征。因此应该了解,前面所述的仅涉及本发明的示范性实施例,只要不背离权利要求书所定义的本发明的实质和范围,还可以进行许多的变化。
Claims (27)
1.对衬底上具有所关心特性的标记进行定位的方法,包括以下步骤:
获得由多个像素定义的视频信号,这些像素包含衬底的输入图像;
把输入的图像分成多个多像素单元;
创建一个与输入图像相对应的抽样图像,其中包含与输入图像的各个单元相对应的公共特性值,各个公共特性值表示对应单元内一定数量的像素;
鉴别抽样图像内的一个或多个区域,这些区域的特性对应于所关心的特性;
创建一个与输入图像相对应的边缘显现图像,其中包含与输入图像的各个单元相对应的边缘值,各个边缘值表示对应单元的像素内预定边缘出现的次数;
鉴别输入图像内一个或多个候选区域,它们具有与所关心的特性相对应的抽样图像特性和边缘显现图像特性;
根据包含具有所关心特性的标记的可能性,对候选区域进行分类;以及
编辑一个候选区域优先次序列表,这些区域最可能包含具有所关心特性的标记。
2.根据权利要求1的方法,其中,对于各个单元,创建抽样图像的步骤包括以下步骤:
计算在单元内出现的像素值的直方图;
从直方图中选择一个模式值,对应于最频繁出现于该单元中的像素值;以及
对于该单元,把抽样图像中的公共特性值设为所述模式值。
3.根据权利要求1的方法,其中,鉴别抽样图像内的一个或多个候选区域(这些区域具有与标记的期望特性相对应的特性)的步骤包括以下步骤:
计算对应于抽样图像的公共特性直方图;
用低通滤波器和自适应移动窗口滤波器,对所述公共特性直方图进行平滑处理;
从滤波后的公共特性直方图中选择一个或多个峰值;
通过鉴别上面和下面的有边界谷值,分隔各个峰值附近的峰区;
通过把各峰区内的像素映射到一个与抽样图像相对应的空白图像中,创建一个分段图像;以及
鉴别分段图像内一个或多个相连的部分。
4.根据权利要求1的方法,其中,对于各个单元,创建边缘显现图像的步骤包括以下步骤:
二元化单元内的像素值;
鉴别单元内二元化的像素值中各期望方向的转换;
基于这些转换计算单元总的转换值;以及
将单元内像素值的总的转换值设置为单元的边缘值。
5.根据权利要求4的方法,其中,二元化单元内像素值的步骤包括以下步骤:把自适应二元化技术应用到单元内的像素值,根据鉴别的背景像素值选择一个阈值,来二元化这些像素值。
6.根据权利要求4的方法,其中,在单元内的二元化像素值中鉴别各期望方向的转换的步骤包括以下步骤:把单元内的像素值与多个模板进行比较,这些模板定义了所关心特性中的像素模式。
7.根据权利要求6的方法,其中,在单元内的二元化像素值中鉴别各期望方向的转换的步骤包括以下步骤:
定义多个计数器,它们与各个方向相关联;以及
对各个模板,
把模板的样例与单元的部分进行比较,这些部分具有与模板同样的大小,使单元的各个像素都可以与模板的至少一种样例相比较;
鉴别单元内一个或多个匹配的像素模式,它们对应于模板定义的一个像素模式;
鉴别与所述像素模式相关联的方向;以及
随各个匹配像素模式的出现,递增一个或多个计数器的值。
8.根据权利要求7的方法,其中,计算一个单元总的转换值的步骤包括以下步骤:
应用一个累加公式,过滤计数器值,以增加总的转换值,来响应单元内正文的存在;同时,避免响应单元内条码和无关标记的存在增加总的转换值。
9.根据权利要求3的方法,其中,鉴别输入图像内一个或多个候选区域(这些候选区域具有与所关心特性相应的抽样图像特性和边缘显现图像特性)还包括以下步骤:
计算分段图像内各相连部分周围的有边界窗口;以及
为各个有边界窗口计算一个或多个窗口特征值,计算对应于有边界窗口内单元的一个或多个特征值,合成一个特征矢量,它包括窗口特征值和有边界窗口内单元的特征值。
10.根据权利要求9的方法,其中,从下列组中选择窗口特征值:
规范化高度,表示有边界窗口定义的高度与分段图像定义的高度之比;
规范化宽度,表示有边界窗口定义的宽度与分段图像定义的宽度之比;
规范化区域,表示有边界窗口定义的区域面积与分段图像定义的区域面积之比;
宽高比,表示有边界窗口定义的宽度与其定义的高度之比。
11.根据权利要求9的方法,其中,从下列组中选择所述特征值:
规范化的边缘显现密度,表示有边界窗口内各单元的边缘值之和与有边界窗口内单元总数之比;
规范化的转换密度,表示有边界窗口内各单元的总转换值之和与有边界窗口内定义的区域面积之比。
12.根据权利要求11的方法,还包括把有边界窗口内单元的预定义阈值以下的总转换值归零,以去除计算规范化转换密度时的噪声。
13.根据权利要求9的方法,还包括通过应用以下条件之一对候选区域进行预分类,这些条件包括:
去除一个或多个具有对应有边界窗口的候选区域,该窗口定义了预定义最小阈值以下的区域;
去除一个或多个具有对应有边界窗口的候选区域,该窗口定义了预定义最大阈值以上的区域;
修剪一个或多个与有边界窗口相对应的候选区域,该窗口具有预先定义的大小,位于为相应候选区域的特征值计算的块中心附近。
14.根据权利要求9的方法,其中,根据包含具有所关心特性的标记的可能性来对候选区域进行分类的步骤,还包括通过比较它们各自的特征矢量来列出候选区域的步骤。
15.根据权利要求14的方法,其中,为一个或多个特征矢量列出候选区域的步骤还包括以下步骤:
通过比较窗口特征值和窗口特征值的期望值,计算对应于一个或多个窗口特征值的第一个判定值,窗口特征值的期望值在所关心的特性中;
通过比较单元特征值和单元特征值的期望值,计算对应于一个或多个单元特征值的第二个判定值,单元特征值的期望值在所关心的特性中。
16.根据权利要求15的方法,其中,列出候选区域的步骤包括以下步骤:
定义一个判定空间,它包括多个判定子空间;
列出这些判定子空间;
基于窗口相对值和特征矢量的单元特征值,把特征矢量映射到判定子空间。
17.一种计算机存储介质,它存储计算机可执行指令,来完成权利要求1的方法。
18.一种计算机控制设备,可以用来完成权利要求1的方法。
19.一种视频图像处理器,用于接收包含定义输入图像的像素值组成的数据流,并对像素值进行处理,来查找输入图像内具有所关心特性的标记,这种处理器包括:
第一个视频处理器,它可以把输入图像分成多个多像素单元,创建对应于输入图像的抽样图像,该抽样图像包括对应于输入图像各单元的元素,各元素表示对应单元内一定数量的像素;
第二个视频处理器,它可以创建对应于输入图像的边缘显现图像,该边缘显现图像包括对应于输入图像各单元的元素,各元素表示对应单元的像素内边缘的出现次数;
第三个视频处理器,它可以鉴别主要特征图像内一个或多个区域,这些区域具有与标记的期望特性相对应的特性,它根据包含具有所关心特性的标记的可能性,对候选区域进行分类,它编辑候选区域的列表,这些区域中最可能包含具有所关心特性的标记。
20.根据权利要求19的视频图像处理器,其中,第一个视频图像处理器包括:
一个缓冲存储器,用于连续接收像素值;
一个连接到缓冲存储器的现场可编程门阵列,可接收像素流;
一个静态存储设备,当像素流经现场可编程门阵列时,配置该设备来完成其操作。
21.根据权利要求20的视频图像处理器,其中,缓冲存储器是一个先进先出缓冲器,静态存储设备是一个静态随机存取的存储设备。
22.根据权利要求19的视频图像处理器,其中,第二个视频图像处理器包括一个缓冲存储器,它连接到多个移位寄存器,所述的多个移位寄存器连接到一个动态存储设备上操作。
23.根据权利要求22的视频图像处理器,其中,缓冲存储器是一个先进先出缓冲器,动态存储设备是一个动态随机存取的存储设备。
24.根据权利要求19的视频图像处理器,其中,第三个视频图像处理器包括一个中央处理单元和一个存储设备。
25.一种用于查找包裹上具有所关心特性的标签的系统,包括:
一个传送器,用于移动包裹;
一个安置在传送器附近的视频设备,可用于扫描所述的包以及设置在所述包上的至少一个标签;
一个连接到所述视频设备上操作的视频处理器,用于生成包裹的一个抽样图像和边缘显现图像;
一个连接到所述视频处理器上操作的微处理器,用于估算来自所述的抽样图像和边缘显现图像的数据,并输出候选区域列表,这些区域最可能包含至少一个具有所关心特性的标签。
26.根据权利要求25的系统,其中,所述视频处理器可用于
把输入的图像分成多个多像素单元,
创建一个对应于输入图像的抽样图像,它包括对应于输入图像各单元的公共特性值,各个公共的特性值表示对应单元内一定数量的像素数,
创建一个对应于输入图像的边缘显现图像,它包括对应于输入图像各单元的边缘值,各个边缘值表示对应单元的像素内边缘的出现次数。
27.根据权利要求25的系统,其中,所述微处理器是可用于
鉴别输入图像内的一个或多个候选区域,这些区域具有与所关心特性相对应的抽样图像特性和边缘显现图像特性;
根据包含具有所关心特性的标记的可能性,对候选区域进行分类;
编辑候选区域的列表,这些区域最可能包含具有所关心特性的标记。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US09/454,090 | 1999-12-03 | ||
US09/454,090 US6728391B1 (en) | 1999-12-03 | 1999-12-03 | Multi-resolution label locator |
Publications (2)
Publication Number | Publication Date |
---|---|
CN1415103A true CN1415103A (zh) | 2003-04-30 |
CN100334591C CN100334591C (zh) | 2007-08-29 |
Family
ID=23803262
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNB008178585A Expired - Fee Related CN100334591C (zh) | 1999-12-03 | 2000-11-29 | 用于多分辨率标签定位的方法、装置及系统 |
Country Status (10)
Country | Link |
---|---|
US (1) | US6728391B1 (zh) |
EP (1) | EP1234273B1 (zh) |
JP (1) | JP3910447B2 (zh) |
CN (1) | CN100334591C (zh) |
AT (1) | ATE279757T1 (zh) |
CA (1) | CA2392987C (zh) |
DE (1) | DE60014959T2 (zh) |
DK (1) | DK1234273T3 (zh) |
ES (1) | ES2231309T3 (zh) |
WO (1) | WO2001046899A2 (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101142585B (zh) * | 2005-02-04 | 2010-06-02 | Dts(Bvi)有限公司 | 动画的后期制作中具有可缩放压缩的数字中间(di)处理的方法和系统 |
CN109656388A (zh) * | 2018-12-19 | 2019-04-19 | 湖北银琅兴科技发展有限公司 | 一种特殊定位光标的制作方法 |
CN113366935A (zh) * | 2019-02-19 | 2021-09-07 | 株式会社富士 | 基准标记确定装置、基准标记确定方法 |
Families Citing this family (51)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6728391B1 (en) | 1999-12-03 | 2004-04-27 | United Parcel Service Of America, Inc. | Multi-resolution label locator |
US7672022B1 (en) * | 2000-04-07 | 2010-03-02 | Hewlett-Packard Development Company, L.P. | Methods and apparatus for analyzing an image |
FR2812226B1 (fr) * | 2000-07-25 | 2002-12-13 | Mannesmann Dematic Postal Automation Sa | Procede de traitement d'objets postaux de grande taille dans une installation de tri |
US6829369B2 (en) * | 2001-05-18 | 2004-12-07 | Lockheed Martin Corporation | Coding depth file and method of postal address processing using a coding depth file |
US6834807B2 (en) | 2001-07-13 | 2004-12-28 | Hand Held Products, Inc. | Optical reader having a color imager |
US7474781B2 (en) * | 2001-09-20 | 2009-01-06 | International Business Machines Corporation | Image based bar-code reading and robotic registration apparatus for use in automated tape library systems |
JP3898075B2 (ja) * | 2002-03-18 | 2007-03-28 | 株式会社リコー | 画像処理装置、画像処理方法及び記録媒体 |
US7284230B2 (en) * | 2003-10-30 | 2007-10-16 | International Business Machines Corporation | System for search and analysis of systematic defects in integrated circuits |
IL162878A0 (en) * | 2004-07-06 | 2005-11-20 | Hi Tech Solutions Ltd | Multi-level neural network based characters identification method and system |
US7249717B2 (en) * | 2004-12-10 | 2007-07-31 | Mitek Systems, Inc. | System and method for check fraud detection using signature validation |
US7611060B2 (en) | 2005-03-11 | 2009-11-03 | Hand Held Products, Inc. | System and method to automatically focus an image reader |
US7568628B2 (en) | 2005-03-11 | 2009-08-04 | Hand Held Products, Inc. | Bar code reading device with global electronic shutter control |
US7780089B2 (en) | 2005-06-03 | 2010-08-24 | Hand Held Products, Inc. | Digital picture taking optical reader having hybrid monochrome and color image sensor array |
US7165015B2 (en) * | 2005-03-29 | 2007-01-16 | Cryovac, Inc. | Handheld device for retrieving and analyzing data from an electronic monitoring device |
US7809158B2 (en) * | 2005-05-02 | 2010-10-05 | Siemens Industry, Inc. | Method and apparatus for detecting doubles in a singulated stream of flat articles |
US7770799B2 (en) | 2005-06-03 | 2010-08-10 | Hand Held Products, Inc. | Optical reader having reduced specular reflection read failures |
EP1821417B1 (en) * | 2006-02-15 | 2009-12-30 | Sony Deutschland GmbH | Method for classifying a signal |
US7792359B2 (en) | 2006-03-02 | 2010-09-07 | Sharp Laboratories Of America, Inc. | Methods and systems for detecting regions in digital images |
US7889932B2 (en) * | 2006-03-02 | 2011-02-15 | Sharp Laboratories Of America, Inc. | Methods and systems for detecting regions in digital images |
US8630498B2 (en) * | 2006-03-02 | 2014-01-14 | Sharp Laboratories Of America, Inc. | Methods and systems for detecting pictorial regions in digital images |
US7813547B1 (en) * | 2006-04-05 | 2010-10-12 | Unisys Corporation | Apparatus and method for detection and analysis of imagery |
US7864365B2 (en) | 2006-06-15 | 2011-01-04 | Sharp Laboratories Of America, Inc. | Methods and systems for segmenting a digital image into regions |
US8437054B2 (en) * | 2006-06-15 | 2013-05-07 | Sharp Laboratories Of America, Inc. | Methods and systems for identifying regions of substantially uniform color in a digital image |
US20080008378A1 (en) * | 2006-07-07 | 2008-01-10 | Lockheed Martin Corporation | Arbitration system for determining the orientation of an envelope from a plurality of classifiers |
US7876959B2 (en) * | 2006-09-06 | 2011-01-25 | Sharp Laboratories Of America, Inc. | Methods and systems for identifying text in digital images |
US20080101703A1 (en) * | 2006-10-30 | 2008-05-01 | Lockheed Martin Corporation | Systems and methods for recognizing shapes in an image |
US8279889B2 (en) * | 2007-01-04 | 2012-10-02 | Qualcomm Incorporated | Systems and methods for dimming a first packet associated with a first bit rate to a second packet associated with a second bit rate |
US7775431B2 (en) * | 2007-01-17 | 2010-08-17 | Metrologic Instruments, Inc. | Method of and apparatus for shipping, tracking and delivering a shipment of packages employing the capture of shipping document images and recognition-processing thereof initiated from the point of shipment pickup and completed while the shipment is being transported to its first scanning point to facilitate early customs clearance processing and shorten the delivery time of packages to point of destination |
US8630491B2 (en) | 2007-05-03 | 2014-01-14 | Andrew Longacre, Jr. | System and method to manipulate an image |
US20080298635A1 (en) * | 2007-05-29 | 2008-12-04 | West William M | Method for identifying images using fixtureless tracking and system for performing same |
US9424488B2 (en) * | 2007-06-14 | 2016-08-23 | Hewlett-Packard Development Company, L.P. | Applying a segmentation engine to different mappings of a digital image |
US20090041344A1 (en) * | 2007-08-08 | 2009-02-12 | Richard John Campbell | Methods and Systems for Determining a Background Color in a Digital Image |
US8249366B2 (en) * | 2008-06-16 | 2012-08-21 | Microsoft Corporation | Multi-label multi-instance learning for image classification |
JP2010073047A (ja) * | 2008-09-19 | 2010-04-02 | Toshiba Corp | 情報処理装置およびプログラム |
TWI384427B (zh) * | 2009-04-29 | 2013-02-01 | Utechzone Co Ltd | Background establishment method and device |
JP5574622B2 (ja) * | 2009-05-22 | 2014-08-20 | 株式会社東芝 | 紙葉類処理装置および紙葉類処理方法 |
JP2012194705A (ja) * | 2011-03-15 | 2012-10-11 | Omron Corp | 画像処理装置、画像処理方法および画像処理プログラム |
US8818023B2 (en) * | 2011-03-25 | 2014-08-26 | Siemens Industry, Inc. | Bulk region of interest learning |
US20120250985A1 (en) * | 2011-03-30 | 2012-10-04 | Jing Xiao | Context Constraints for Correcting Mis-Detection of Text Contents in Scanned Images |
US9122952B2 (en) * | 2011-12-23 | 2015-09-01 | Cognex Corporation | Methods and apparatus for one-dimensional signal extraction |
US9157855B2 (en) * | 2013-09-06 | 2015-10-13 | Canon Kabushiki Kaisha | Material classification |
JP6203084B2 (ja) * | 2014-03-06 | 2017-09-27 | 株式会社東芝 | 配達物区分処理システム、および配達物区分処理方法 |
US9811754B2 (en) * | 2014-12-10 | 2017-11-07 | Ricoh Co., Ltd. | Realogram scene analysis of images: shelf and label finding |
CA2979059C (en) * | 2015-03-18 | 2021-07-20 | United Parcel Services Of America, Inc. | Systems and methods for verifying the contents of a shipment |
KR102507383B1 (ko) * | 2016-11-08 | 2023-03-08 | 한국전자통신연구원 | 직사각형 윈도우를 이용한 스테레오 정합 방법 및 스테레오 정합 시스템 |
CN108121982B (zh) * | 2016-11-30 | 2020-02-07 | 杭州海康机器人技术有限公司 | 面单图像的获取方法及装置 |
US11313869B2 (en) * | 2017-04-13 | 2022-04-26 | Siemens Healthcare Diagnostics Inc. | Methods and apparatus for determining label count during specimen characterization |
DE102017217242B4 (de) * | 2017-09-27 | 2024-03-28 | Deutsche Post Ag | Verfahren und System zur Kennzeichnung von Sendungseinheiten |
US10803542B2 (en) * | 2018-09-14 | 2020-10-13 | Buildinglink.com LLC | Physical asset recognition platform |
US10650210B1 (en) | 2019-03-18 | 2020-05-12 | Haier Us Appliance Solutions, Inc. | Method for authenticating a filter cartridge for a refrigerator appliance |
US20220292808A1 (en) * | 2021-03-11 | 2022-09-15 | Hcl Technologies Limited | Method and system for identifying empty region in label and placing content thereon |
Family Cites Families (48)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US3715724A (en) | 1969-12-24 | 1973-02-06 | Olivetti & Co Spa | Apparatus for recognizing graphic symbols |
US3885229A (en) | 1972-10-28 | 1975-05-20 | Nippon Electric Co | Document scanning apparatus |
JPS5295121A (en) | 1976-02-06 | 1977-08-10 | Hitachi Ltd | Code plate |
JPS56129981A (en) | 1980-03-14 | 1981-10-12 | Toshiba Corp | Optical character reader |
JPS5743279A (en) | 1980-08-29 | 1982-03-11 | Fujitsu Ltd | Method for detecting position of x-y symmetrical body |
DE3107521A1 (de) | 1981-02-27 | 1982-09-16 | Siemens AG, 1000 Berlin und 8000 München | Verfahren zum automatischen erkennen von bild- und text- oder graphikbereichen auf druckvorlagen |
DE3373734D1 (en) | 1982-01-20 | 1987-10-22 | Nippon Denso Co | High-sensitive optical reading apparatus and method of reading optical information |
JPS59179691A (ja) | 1983-03-31 | 1984-10-12 | Toshiba Ceramics Co Ltd | コ−クス炉 |
US4782221A (en) | 1985-04-01 | 1988-11-01 | Cauzin Systems, Incorporated | Printed data strip including bit-encoded information and scanner control |
CA1250050A (en) | 1985-04-17 | 1989-02-14 | Miyahiko Orita | Image processing apparatus |
JPS61276080A (ja) | 1985-05-31 | 1986-12-06 | Toshiba Corp | 上下判定装置 |
US4742556A (en) | 1985-09-16 | 1988-05-03 | Davis Jr Ray E | Character recognition method |
JPH01137385A (ja) | 1987-11-25 | 1989-05-30 | Matsushita Electric Ind Co Ltd | 文字認識装置 |
JP2727549B2 (ja) | 1988-01-29 | 1998-03-11 | 日本電気株式会社 | 最適画質選択装置 |
US5053609A (en) | 1988-05-05 | 1991-10-01 | International Data Matrix, Inc. | Dynamically variable machine readable binary code and method for reading and producing thereof |
US4939354A (en) | 1988-05-05 | 1990-07-03 | Datacode International, Inc. | Dynamically variable machine readable binary code and method for reading and producing thereof |
US5124536A (en) | 1988-05-05 | 1992-06-23 | International Data Matrix, Inc. | Dynamically variable machine readable binary code and method for reading and producing thereof |
US5126542A (en) | 1988-05-05 | 1992-06-30 | International Data Matrix, Inc. | Dynamically variable machine readable binary code and method for reading and producing thereof |
JPH02100575A (ja) | 1988-10-07 | 1990-04-12 | Toshiba Corp | 画像処理装置 |
JPH02196565A (ja) | 1989-01-25 | 1990-08-03 | Eastman Kodatsuku Japan Kk | 画像二値化方式 |
US5073954A (en) | 1989-02-28 | 1991-12-17 | Electrocom Automation, Inc. | Bar code location and recognition processing system |
JPH087785B2 (ja) | 1989-05-16 | 1996-01-29 | 松下電器産業株式会社 | 2値化処理装置 |
US5068909A (en) | 1989-05-18 | 1991-11-26 | Applied Imaging Corporation | Method and apparatus for generating quantifiable video displays |
DE3942932A1 (de) | 1989-12-23 | 1991-06-27 | Licentia Gmbh | Verfahren zum verteilen von paketen o. ae. |
FR2657982B1 (fr) | 1990-02-02 | 1992-11-27 | Cga Hbs | Procede de localisation d'adresse sur des articles a trier, etiquette d'adressage et dispositif de mise en óoeuvre du procede. |
JP2768786B2 (ja) | 1990-02-20 | 1998-06-25 | キヤノン株式会社 | 画像読み取り装置 |
US5241166A (en) | 1990-07-02 | 1993-08-31 | Chandler Donald G | Low resolution target acquisition |
DE69131394T2 (de) | 1990-10-30 | 2000-01-20 | Omniplanar, Inc. | Maschinenlesbares Zeichen mit Mehrfachauflösung |
US5223701A (en) | 1990-10-30 | 1993-06-29 | Ommiplanar Inc. | System method and apparatus using multiple resolution machine readable symbols |
US5153418A (en) | 1990-10-30 | 1992-10-06 | Omniplanar, Inc. | Multiple resolution machine readable symbols |
JPH04268987A (ja) | 1991-02-25 | 1992-09-24 | Nippon Steel Corp | 文字認識装置 |
JPH04268989A (ja) | 1991-02-25 | 1992-09-24 | Nippon Steel Corp | 文字認識方法及び装置 |
US5278397A (en) | 1991-07-25 | 1994-01-11 | Symbol Technologies, Inc. | Multi-resolution bar code reader |
US5179599A (en) | 1991-06-17 | 1993-01-12 | Hewlett-Packard Company | Dynamic thresholding system for documents using structural information of the documents |
AU6251894A (en) | 1993-03-01 | 1994-09-26 | United Parcel Service Of America, Inc. | Method and apparatus for locating a two-dimensional symbol using a double template |
JP2933801B2 (ja) | 1993-06-11 | 1999-08-16 | 富士通株式会社 | 文字の切り出し方法及びその装置 |
US5365597A (en) | 1993-06-11 | 1994-11-15 | United Parcel Service Of America, Inc. | Method and apparatus for passive autoranging using relaxation |
US5434629A (en) * | 1993-12-20 | 1995-07-18 | Focus Automation Systems Inc. | Real-time line scan processor |
US5499060A (en) | 1994-01-04 | 1996-03-12 | Texas Instruments Incorporated | System and method for processing video data |
US5495537A (en) | 1994-06-01 | 1996-02-27 | Cognex Corporation | Methods and apparatus for machine vision template matching of images predominantly having generally diagonal and elongate features |
US5515447A (en) | 1994-06-07 | 1996-05-07 | United Parcel Service Of America, Inc. | Method and apparatus for locating an acquisition target in two-dimensional images by detecting symmetry in two different directions |
DK0807297T3 (da) | 1995-01-31 | 2000-04-10 | United Parcel Service Inc | Fremgangsmåde og anordning til adskillelse af forgrund fra baggrund i billeder, der indeholder tekst |
US5642442A (en) | 1995-04-10 | 1997-06-24 | United Parcel Services Of America, Inc. | Method for locating the position and orientation of a fiduciary mark |
JP3545506B2 (ja) * | 1995-08-21 | 2004-07-21 | 株式会社東芝 | 特定色領域抽出方式および特定色領域除去方式 |
DE19532842C1 (de) | 1995-09-05 | 1996-12-19 | Ibm | Bildaufnahmesystem |
US6205499B1 (en) * | 1998-12-18 | 2001-03-20 | The United States Of America As Represented By The Secretary Of The Navy | System for compressing video data using bi-orthogonal wavelet coding having a DSP for adjusting compression ratios to maintain a constant data flow rate of the compressed data |
US6343139B1 (en) * | 1999-03-12 | 2002-01-29 | International Business Machines Corporation | Fast location of address blocks on gray-scale images |
US6728391B1 (en) | 1999-12-03 | 2004-04-27 | United Parcel Service Of America, Inc. | Multi-resolution label locator |
-
1999
- 1999-12-03 US US09/454,090 patent/US6728391B1/en not_active Expired - Lifetime
-
2000
- 2000-11-29 WO PCT/US2000/042360 patent/WO2001046899A2/en active IP Right Grant
- 2000-11-29 CA CA002392987A patent/CA2392987C/en not_active Expired - Fee Related
- 2000-11-29 ES ES00993097T patent/ES2231309T3/es not_active Expired - Lifetime
- 2000-11-29 CN CNB008178585A patent/CN100334591C/zh not_active Expired - Fee Related
- 2000-11-29 DE DE60014959T patent/DE60014959T2/de not_active Expired - Lifetime
- 2000-11-29 EP EP00993097A patent/EP1234273B1/en not_active Expired - Lifetime
- 2000-11-29 AT AT00993097T patent/ATE279757T1/de not_active IP Right Cessation
- 2000-11-29 JP JP2001547342A patent/JP3910447B2/ja not_active Expired - Fee Related
- 2000-11-29 DK DK00993097T patent/DK1234273T3/da active
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101142585B (zh) * | 2005-02-04 | 2010-06-02 | Dts(Bvi)有限公司 | 动画的后期制作中具有可缩放压缩的数字中间(di)处理的方法和系统 |
CN109656388A (zh) * | 2018-12-19 | 2019-04-19 | 湖北银琅兴科技发展有限公司 | 一种特殊定位光标的制作方法 |
CN113366935A (zh) * | 2019-02-19 | 2021-09-07 | 株式会社富士 | 基准标记确定装置、基准标记确定方法 |
CN113366935B (zh) * | 2019-02-19 | 2022-10-14 | 株式会社富士 | 基准标记确定装置、基准标记确定方法 |
Also Published As
Publication number | Publication date |
---|---|
ATE279757T1 (de) | 2004-10-15 |
DK1234273T3 (da) | 2005-01-31 |
CA2392987C (en) | 2008-04-01 |
US6728391B1 (en) | 2004-04-27 |
DE60014959D1 (de) | 2004-11-18 |
WO2001046899A2 (en) | 2001-06-28 |
DE60014959T2 (de) | 2005-12-01 |
JP3910447B2 (ja) | 2007-04-25 |
JP2003518300A (ja) | 2003-06-03 |
ES2231309T3 (es) | 2005-05-16 |
CA2392987A1 (en) | 2001-06-28 |
EP1234273A2 (en) | 2002-08-28 |
EP1234273B1 (en) | 2004-10-13 |
WO2001046899A3 (en) | 2002-03-14 |
CN100334591C (zh) | 2007-08-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN1415103A (zh) | 多分辨率标签定位器 | |
CN1324521C (zh) | 用于识别图象字符的预处理设备和方法 | |
CN1291352C (zh) | 彩色图象处理装置及方法、图案抽取装置及方法 | |
CN1311394C (zh) | 用于二进制化图像的设备和方法 | |
CN1269068C (zh) | 标题抽取设备及标题抽取方法 | |
CN1156791C (zh) | 模式识别设备与方法 | |
CN1184796C (zh) | 图象处理方法和设备以及图象处理系统 | |
CN1119767C (zh) | 字符提取设备及方法,模式提取设备及方法和模式识别设备 | |
CN1292383C (zh) | 视觉装置 | |
CN101069190A (zh) | 具有混合型单色和彩色图像传感器阵列的数字图像获取光学阅读器 | |
CN1190963C (zh) | 数据处理装置和方法,学习装置和方法 | |
CN1505431A (zh) | 用于从图象屏识别字符图象的装置和方法 | |
CN1324526C (zh) | 视频信号的自适应缩放 | |
CN1400806A (zh) | 采用自适应二值化的图象处理方法和设备 | |
CN1620094A (zh) | 用于将图像转换为预定格式的图像处理设备及方法 | |
CN1202065A (zh) | 图像检测方法、图像检测装置、图像处理方法、图像处理装置以及媒体 | |
CN1684492A (zh) | 图像词典作成装置、编码装置、图像词典作成方法 | |
CN1969314A (zh) | 图像处理设备和方法、存储介质及其程序 | |
CN1741035A (zh) | 印刷体阿拉伯字符集文本切分方法 | |
CN1588431A (zh) | 基于游程邻接图的复杂背景彩色图像中字符提取方法 | |
CN1041773C (zh) | 由字符图象直方图0-1图形表示识别字符的方法和装置 | |
CN1653492A (zh) | 纸片鉴别装置、纸片鉴别方法及程序 | |
CN1266643C (zh) | 基于阿拉伯字符集的印刷体字符识别方法 | |
CN1256700C (zh) | 基于n元组或随机存取存储器的神经网络分类系统和方法 | |
CN1153168C (zh) | 字符识别装置及其方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20070829 Termination date: 20141129 |
|
EXPY | Termination of patent right or utility model |