JP2003518300A5 - - Google Patents

Download PDF

Info

Publication number
JP2003518300A5
JP2003518300A5 JP2001547342A JP2001547342A JP2003518300A5 JP 2003518300 A5 JP2003518300 A5 JP 2003518300A5 JP 2001547342 A JP2001547342 A JP 2001547342A JP 2001547342 A JP2001547342 A JP 2001547342A JP 2003518300 A5 JP2003518300 A5 JP 2003518300A5
Authority
JP
Japan
Prior art keywords
image
label
value
resolution
pixel
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2001547342A
Other languages
English (en)
Other versions
JP3910447B2 (ja
JP2003518300A (ja
Filing date
Publication date
Priority claimed from US09/454,090 external-priority patent/US6728391B1/en
Application filed filed Critical
Publication of JP2003518300A publication Critical patent/JP2003518300A/ja
Publication of JP2003518300A5 publication Critical patent/JP2003518300A5/ja
Application granted granted Critical
Publication of JP3910447B2 publication Critical patent/JP3910447B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Description

【書類名】 明細書
【発明の名称】 マルチ解像度ラベルロケータ
【特許請求の範囲】
【請求項1】 基板上で関心のある特性を有する証印の位置を決めるための方法において、
基板の入力画像を構成する複数のピクセルにより定められるビデオ信号を得るステップと、
前記入力画像を複数のマルチピクセルセルに分割するステップと、
それぞれの通常の特性値が対応するセル内のピクセルの選択数を表す、前記入力画像の各セルに対応する通常の特性値で構成される前記入力画像に対応する間引き画像を作成するステップと、
前記関心のある特性に対応する特性を有する前記間引き画像内の1つまたは複数の領域を特定するステップと、
各エッジ値が、前記対応するセルのピクセル内の所定エッジの発生数を表す、前記入力画像の各セルに対応するエッジ値を有する前記入力画像に対応するエッジ発生画像を作成するステップと、
前記関心のある特性に対応する間引き画像特性及びエッジ発生画像特性を有する前記入力画像内の1つまたは複数の候補領域を特定するステップと、
前記関心のある特性を有する証印を含む尤度に従って前記候補領域を分類するステップと、
前記関心のある特性を有する証印を最も含んでいそうな1つまたは複数の候補領域の優先順位が付けられたリストを編成するステップと、
を備える方法。
【請求項2】 前記間引き画像を生成するステップが、セルごとに、
前記セル内で発生するピクセル値のヒストグラムを計算するステップと、
前記セル内で最も頻繁に発生する前記ピクセル値に対応するモード値を前記ヒストグラムから選択するステップと、 前記セルについて前記間引き画像内の前記通常の特性値を前記モード値に設定するステップと、
を備える請求項1記載の方法。
【請求項3】 前記証印の前記予想される特性に対応する特性を有する前記間引き画像内の1つまたは複数の候補領域を特定するステップが、
前記間引き画像に対応する通常の特性ヒストグラムを計算するステップと、
低域フィルタ及び適応移動ウィンドウフィルタを用いて前期通常の特性ヒストグラムを平滑化するステップと、
前記濾波された通常の特性ヒストグラムから1つまたは複数のピーク値を選択するステップと、
上限及び下限の谷値を特定することによって各ピーク値の回りのピーク領域を隔離するステップと、
前記各ピーク領域内のピクセルを、前記間引き画像に対応する空の画像の中に写像することによってセグメント化された画像を作成するステップと、
前記セグメント化された画像内の1つまたは複数の連結される構成要素を特定するステップと、
を備える請求項1記載の方法。
【請求項4】 前記エッジ発生画像を生成するステップが、セルごとに、
前記セル内の前記ピクセル値をバイナリ化するステップと、
前記セル内の前記バイナリ化されたピクセル値の間で予想される向きへの遷移を特定するステップと、
前記遷移に基づいて前記セルについて総遷移値を計算するステップと、
前記セルについての前記エッジ値を前記セル内の前記ピクセルについての前記総遷移値に設定するステップと、
を備える請求項1記載の方法。
【請求項5】 前記セル内で前記ピクセル値をバイナリ化するステップが、特定された背景ピクセル値に基づいて前記ピクセル値をバイナリ化するために閾値を選択するために、前記セル内の前記ピクセル値に適応バイナリ化技法を適用するステップを備える請求項4記載の方法。
【請求項6】 前記セル内の前記バイナリ化されたピクセル値の間で予想される向きの遷移を特定するステップが、前記セル内の前記ピクセル値を、前記関心のある特性の間にあるピクセルパターンを定める複数のテンプレートと比較するステップを備える請求項4記載の方法。
【請求項7】 前記セル内の前記バイナリ化されたピクセル値の間で予想される向きの遷移を特定するステップが、
複数の向きのそれぞれに関連付けられる複数のカウンタを定めるステップと、
テンプレートごとに、
セルの各ピクセルが前記テンプレートの少なくとも1つのインスタンスに比較されるように、前記テンプレートと同じサイズを有する前記セルの部分に前記テンプレートのインスタンスを比較するステップと、
前記テンプレートによって定められるピクセルパターンに対応するセル内の1つまたは複数の一致するピクセルパターンを特定するステップと、
前記ピクセルパターンと関連付けられる向きを特定するステップと、
前記一致するピクセルパターンの発生に応えて前記カウンタの1つまたは複数を増分するステップと、
を備える請求項6記載の方法。
【請求項8】 前記セルについて総遷移値を計算するステップが、
セル内でのバーコード及び外来マーキングの内の1つの存在に応えて、前記総遷移値を増分することを回避しつつ、前記セル内のテキストの存在に応えて前記総遷移値を増分するために、前記カウンタ値を濾波する合計公式を適用するステップを備える請求項7記載の方法。
【請求項9】 前記関心のある特性に対応する前記間引き画像の特性及びエッジ発生画像の特性を有する入力画像内の1つまたは複数の候補領域を特定するステップが、さらに、
前記セグメント化された画像の中の各連結された構成要素の回りの有界ウィンドウを計算するステップと、
有界ウィンドウごとに、
1つまたは複数のウィンドウ特徴値を計算するステップと、
前記有界ウィンドウ内の前記セルに対応する1つまたは複数の特徴値を計算するステップと、
前記ウィンドウ特徴値及び前記有界ウィンドウ内のセルについての前記特徴値を含む特徴ベクタをアセンブルするステップと、
を備える請求項3記載の方法。
【請求項10】 前記ウィンドウ特徴値が、
前記セグメント化された画像によって定められる高さに対する、前記有界ウィンドウによって定められる高さの比率を表す正規化された高さと、
前記セグメント化された画像によって定められる幅に対する、前記有界ウィンドウによって定められる幅の比率を表す正規化された幅と、
前記セグメント化された画像によって定められる面積に対する、前記有界ウィンドウによって定められる面積の比率を表す正規化された面積と、
前記有界ウィンドウによって定められる前記高さに対する、前記有界ウィンドウによって定められる幅の比率を表すアスペクト比と、
を含むグループから選択される請求項9記載の方法。
【請求項11】 前記特徴値が、
前記有界ウィンドウ内のセルの総数に対する、前記有界ウィンドウ内のセルについてのエッジ値の合計の比率を表す正規化されたエッジ発生強さと、
前記有界ウィンドウによって定められる面積に対する、前記有界ウィンドウ内のセルについての前記総遷移値の合計の比率を表す正規化された遷移強さと、
を含むグループから選択される請求項9記載の方法。
【請求項12】 前記正規化された遷移強さを計算するときに雑音を除去するために、事前に定められた閾値以下の前記有界ウィンドウ内のセルの総遷移値をゼロにするステップをさらに備える請求項11記載の方法。
【請求項13】 事前に定められた最小閾値以下の領域を定める対応する有界ウィンドウを有する1つまたは複数の候補領域を排除することと、
事前に定められる最大閾値を上回る領域を定める対応する有界ウィンドウを有する1つまたは複数の候補領域を排除することと、
前記対応する候補領域の前記特徴値について計算される重心を中心に置かれる、事前に定められたサイズを有する有界ウィンドウに対応するように1つまたは複数の候補領域をトリミングすることと、
を含むグループから選択される資格を適用することにより、前記候補領域を事前分類するステップをさらに備える請求項9記載の方法。
【請求項14】 前記関心のある特性を有する証印を含む尤度に従って前記候補領域を分類するステップが、さらに、それらのそれぞれの特徴ベクタを比較することによって前記候補領域をリストするステップを備える請求項9記載の方法。
【請求項15】 前記候補領域をリストするステップが、1つまたは複数の特徴ベクタについて、
前記ウィンドウ特徴値を、前記ウィンドウ特徴値の予想される値に比較することによって、前記ウィンドウ特徴値の1つまたは複数に対応する第1決定値を計算し、前記ウィンドウ特徴値の予想される値が、前記関心のある特徴の間にあるステップと、
前記セル特徴値を、前記セル特徴値の予想される値に比較することによって、前記セル特徴値の1つまたは複数に対応する第2決定値を計算し、前記セル特徴値の予想値されるが前記関心のある特徴の間にあるステップと、
を備える請求項14記載の方法。
【請求項16】 前記候補領域をリストするステップが、
複数の決定サブスペースを有する決定スペースを定めるステップと、
前記決定サブスペースをリストするステップと、
前記特徴ベクタの前記ウィンドウ及びセルの特徴値の前記相対値に基づいて前記決定サブスペースに前記特徴ベクタを写像するステップと、
を備える請求項15記載の方法。
【請求項17】 請求項1に記載の方法を実行するためのコンピュータ実行可能命令を記憶するコンピュータ記憶媒体。
【請求項18】 請求項1に記載の方法を実行するために実行可能なコンピュータ制御式装置。
【請求項19】 入力画像を定めるピクセル値で構成されるデータストリームを受信し、関心のある特徴を有する前記入力画像内で証印の位置を決めるために前記ピクセル値を処理するために利用可能なビデオ画像プロセッサにおいて、
前記入力画像を複数のマルチピクセルセルに分割するため
前記入力画像の各セルに対応する要素で構成される前記入力画像に対応する間引き画像を生成し、各要素が対応するセル内の前記ピクセルの選択数を表すために利用可能な第1ビデオプロセッサと、
前記入力画像の各セルに対応する要素で構成される前記入力画像に対応するエッジ発生画像を作成し、各要素が対応するセルの前記ピクセル内のエッジの発生数を表すために利用可能な第2ビデオプロセッサと、
前記証印の前記予想される特性に対応する特性を有する前記優勢な特徴画像内の1つまたは複数の領域を特定するため
前記関心のある特性を有する証印を含む尤度に従って前記候補領域を分類するため
前記関心のある特性を有する証印を最も含んでいそうな1つまたは複数の候補領域のリストを編成するため
に利用可能な第3ビデオプロセッサと、
を備えるビデオ画像プロセッサ。
【請求項20】 前記第1ビデオ画像プロセッサが、
ピクセル値を連続して受信するために動作できるようなバッファメモリと、
前記バッファメモリに接続され、ピクセルストリーム及び静的メモリデバイスを受け取るように動作でき、前記ピクセルがフィールドプログラマブルゲートアレイを通って流れるにつれて、その動作を実行するように構成される、利用者書き込み可能ゲートアレイと、
を備える請求項19記載のビデオ画像プロセッサ。
【請求項21】 前記バッファメモリが先入れ先出しバッファであり、前記静的メモリデバイスが静的ランダムアクセスメモリデバイスである請求項20に記載のビデオ画像プロセッサ。
【請求項22】 前記第2ビデオ画像プロセッサが、複数のシフトレジスタに動作できるようにリンクされるバッファメモリを備え、前記複数のシフトレジスタが、ダイナミックメモリデバイスに動作できるようにリンクされる請求項19記載のビデオ画像プロセッサ。
【請求項23】 前記バッファメモリが先入れ先出しバッファであり、前記ダイナミックメモリデバイスがダイナミックランダムアクセスメモリデバイスである請求項22記載のビデオ画像プロセッサ。
【請求項24】 前記第3ビデオ画像プロセッサが、中央処理装置及びメモリ記憶装置を備える請求項19記載のビデオ画像プロセッサ。
【請求項25】 パッケージ上で関心のある特性を有するラベルの位置を決めるために利用可能なシステムにおいて、
パッケージを移動するために利用可能なコンベヤと、
前記コンベヤに隣接して置かれるビデオデバイスであって、前記パッケージ及び前記パッケージ上に置かれる少なくとも1つのラベルを走査するために利用可能な前記ビデオデバイスと、
前記ビデオデバイスに動作できるようにリンクされるビデオプロセッサであって、(a)入力画像を複数のマルチピクセルセルに分割するため、(b)前記パッケージの間引き画像及びエッジ発生画像を生成するため、(c)前記入力画像の各セルに対応する共通特性値で構成される前記入力画像に対応する間引き画像を生成し、各通常の特性値が、前記対応するセル内の前記ピクセル数を表すため、(d)前記入力画像の各セルに対応するエッジ値を有する前記入力画像に対応するエッジ発生画像を生成し、各エッジ値が前記対応するセルの前記ピクセル内の前記エッジの発生数を表すために利用可能な前記ビデオプロセッサと、
前記ビデオプロセッサに動作できるようにリンクされるマイクロプロセッサであって、前記マイクロプロセッサが、前記間引き画像及び前記エッジ発生画像からデータを評価するために利用可能であり、前記関心のある特性を有する少なくとも1つのラベルを最も含んでいそうな1つまたは複数の候補領域のリストを出力する前記マイクロプロセッサと、
を備えるシステム。
【請求項26】 前記マイクロプロセッサが、
前記関心のある特性に対応する間引き画像の特性及びエッジ発生画像特性を有する前記入力画像内の1つまたは複数の候補領域を特定するため
前記関心のある特性を有する証印を含む尤度に従って前記候補領域を分類するため
前記関心のある特性を有する証印を最も含んでいそうな1つまたは複数の候補領域のリストを編成するために利用可能である請求項25記載のシステム。
【発明の詳細な説明】
【0001】
技術分野
本発明は、概して画像処理の分野に関し、詳しくは、自動化された荷物仕分けシステムでのマルチ解像度ラベルロケータに関する。
【0002】
発明の背景
荷物の自動仕分けは、高速且つ信頼できる荷物配達サービスを提供し、労働費を削減できるため、一般化しつつある。しかしながら、同じサイズと形状を有する荷物はまれにしかないため、住所ラベルを特定するために画像処理を利用する自動荷物仕分けは、非常に複雑化し、ラベル読み取りエラーを被りやすい場合がある。
【0003】
人間のオペレータが読み取ってから、宛て先住所を打ち込むのに十分な品質の荷物の住所ラベルの画像を捕捉するために、カメラは比較的に高い解像度で荷物の表面を走査しなければならない。高解像度画像は、大きな荷物画像及び相応して大きなデータ記憶を必要にさせる。荷物の自動仕分けでの1つの問題とは、機械的な部分、または自動荷物仕分けシステムのコンベヤシステムの出力に同等な速度で高解像度荷物画像を処理することである。
【0004】
多くの画像処理時間に加えて、荷物の高解像度画像処理の別の問題は、宛て先住所ラベルの位置を決めることである。高解像度画像を使用していても、人間のオペレータは、依然として宛て先住所ラベルの位置を特定するために、画像を表示する画面を、見上げたり、見下げたり、あるいは横切って見なければならない。このような目による走査は、自動荷物仕分けシステムの効率を大幅に低下させる。
【0005】
他の自動荷物仕分けシステムは、人間のオペレータがラベルの宛て先住所を読み取って、打ち込む必要性を排除することにより効率を改善しようとしてきた。このようなそれ以外の自動荷物仕分けシステムは、既知の形状を有するパッケージのリーディングエッジに依存する基準点マーキング及びシステムを利用するデバイスを含む。
【0006】
基準点マークを利用する自動荷物仕分けシステムは、対象物の向き及び位置または対象物に貼られているテキストを確かめるために光学式文字認識(OCR)を使用する。例えば、OCR読み取り装置システムは、基準点マークをつけた荷物を走査し、該基準点マークの位置を決める。このようにして、宛て先住所ブロックに既知の関係で置かれる基準点マークは、宛て先住所ブロックの位置を見つけ出すためにOCRシステムによって使用することができる。同様にして、その向きが宛て先住所ブロック内のテキストの向きに既知の関係で置かれる、向きに特定の基準点は、テキストの向きを確かめるためにOCRシステムによって使用
できる。
【0007】
基準点マークシステムの効率を改善することもできるが、これらのシステムはそれぞれの荷物受け取りサイトが、各OCRシステムが特定の基準点マークを認識できるように同一の基準点マーキングを有することを必要とする。したがって、このようなシステムは、通常、事前に印刷されたラベルまたは基準点マークを備え、テキストを付けるためにマークをつけることのできる領域を指定する荷物を必要とする。事前印刷済みのラベル及び事前印刷済みの荷物は効果であるが、カスタマの数パーセントは不可避的に使用できないだろう。
【0008】
基準点マーク及び事前印刷済みのラベルを利用しないそれ以外のシステムについては、既知の形状をした荷物のリーディングエッジが、荷物の上のテキストの向きと位置を決めるのに活用される。しかしながら、基準点マークシステムと同様に、これらのシステムは、荷物のサイズ及び/または形状で柔軟性を有しない。
【0009】
その結果、荷物のサイズ及び/または形状に関係なく、荷物の走査された画像内の宛て先住所ラベルを容易に特定できる自動荷物仕分けシステムについての技術が求められている。また、画像を処理する、あるいは走査された画像から宛て先住所ラベルデータを取得するために必要とされる時間量を大幅に短縮する自動荷物仕分けシステムについての技術も求められている。
【0010】
発明の概要
本発明は、関心のあるラベルを含むことのある荷物の処理された画像の中で1つまたは複数の領域のリストを提供するマルチ解像度ラベルロケータである。マルチ解像度ラベルロケータは、一般的には、自動荷物仕分けシステムの一部である。
【0011】
自動荷物仕分けシステムは、一般的には、コンベヤ装置に隣接して取り付けられるビデオカメラを含む。該ビデオカメラは、荷物の少なくとも2つの異なる種類の画像信号を生成する、2台のビデオプロセッサに動作できるようにリンクされる。ビデオプロセッサは、荷物の第1の間引き(decimated)(低解像度)画像、及びテキストなどのラベルの上に表示されることが予想される料金別納郵便物などの証印(indicia)(以下では単に証印という。)のエッジ発生に対応する第2画像を生成する。
【0012】
ビデオプロセッサによって生成される2つの画像は、元の高解像度画像のさまざまな特性を特定する。例えば、ビデオプロセッサの間引き画像ハードウェアは、ラベルに一般的な特性を有する画像内の領域を特定することができ、エッジ発生プロセッサは、テキストに一般的な特性を有する領域を特定することができる。
【0013】
2つの画像は、マルチ解像度ラベルロケータプログラムを利用し、関心のあるラベルを含む可能性のある荷物の1つまたは複数の領域を特定する別個のマイクロプロセッサの中に送られる。それから、該マルチ解像度ラベルロケータプログラムは、これらの領域を分類し、ビデオプロセッサによって生成される第1画像と第2画像から抽出されるデータに基づいて、これらの候補領域のリストを編成する。
【0014】
一般的にいうと、本発明は、自動荷物仕分けシステム用のマルチ解像度ラベルロケータシステムである。マルチ解像度ラベルロケータシステムは、基板の入力画像を画定する複数のピクセルを含むビデオ信号を得る。マルチ解像度ラベルロケータシステムは、入力画像を複数のマルチピクセルセルに分割する。それ以降の計算では、マルチ解像度ラベルロケータシステムは、事前処理済みの間引き画像及びエッジ発生画像に対応する特徴値を抽出する。
【0015】
それから、マルチ解像度ラベルロケータシステムは、それ以降の計算のデータの量を削減するために入力画像に対応する間引き画像(低解像度画像)を作成する。この間引き画像は、単一ピクセルなどの、入力画像の各マルチピクセルセルに対応する1つの共通特性値を活用することにより生成される。各共通特性値は、対応するセル内のピクセルの間引き画像を表す。例えば、マルチ解像度ロケータシステムが、パッケージまたは荷物上でラベルの位置を決めるように設計される場合、ラベルは、通常別の色を有するか、あるいはパッケージまたは荷物を基準にして別の強度で光を反射するため、システムは、パッケージ及び荷物上の大きな比較的に白いつながった領域(本発明の動作環境に応じて異なる色を有する領域)を探すだろう。さらに高い光強度または別の色値を有する荷物またはパッケージのそれらの領域には、間引き画像の値が割り当てられ、このデータは、それから、間引き画像を作成するために画像空間上に写像される。
【0016】
この間引き画像を用いると、マイクロプロセッサ上で実現される特徴抽出機能は、ラベル候補領域の特徴パラメータを効率的に抽出することができる。特徴パラメータのいくつかは、以下を含んでよい。つまり、ラベル候補の正規化された寸法及び面積、アスペクト比、及び間引き画像から引き出される潜在的なラベル候補領域の相対平均光強度を含んでよい。これらの特徴パラメータは、(やはり後述される)分類関数のための入力データになる。
【0017】
マルチ解像度ロケータシステムの第1ビデオプロセッサは間引き画像を生成しているが、マルチ解像度ラベルロケータシステムの第2ビデオプロセッサは、同時に、入力画像に対応するエッジ発生画像を作成する。エッジ発生画像は、入力画像の各セルに対応するエッジ値を含む。各エッジ値は、入力画像の対応するセルのピクセル内でのエッジの発生回数を表す。例えば、マルチ解像度ロケータシステムがパッケージまたは荷物の上の住所ラベルの位置を決めるように設計されている場合、住所ラベル上のテキストはこのような特徴を有するので、ロケータシステムは、密接に間隔をあけて配置される白黒遷移を探すだろう。バーコードも白黒遷移を有するが、遷移は一様な向きで整列している。一方、ラベル上の手書きテキストまたはタイプされたテキスト内での遷移は、無作為な向きを有する傾向がある。したがって、マルチ解像度ロケータシステムは、テキストを含む住所ラベルを、バーコードラベルから区別するためにこれらの特性を活用する。
【0018】
エッジ発生画像及び間引き画像を生成した後、マルチ解像度ラベルロケータシステムは、間引き画像の特性及び関心のある特性に対応するエッジ発生特性を有するこれらの画像内の1つまたは複数の領域を特定する。この識別は、別の画像の追加処理を含む。具体的には、マルチ解像度ラベルロケータプログラムは、関心のある特性を有する証印を含む入力画像の尤度に従って候補領域を分類する。これらの特性に基づいて、それから、マルチ解像度ラベルロケータモジュールは、関心のある特性を有する証印を最も含んでいそうな1つまたは複数の候補領域のリストを編成する。
【0019】
間引き画像の属性
マルチ解像度ラベルロケータシステムは、入力画像の各セル内で発生するピクセル値のヒストグラムを計算することにより、間引き画像を作成する。例えば、共通特性値またはピクセル値は、ピクセルごとに近似される色に相当してよい。それから、マルチ解像度ラベルインジケータシステムは、ヒストグラムから、入力画像のそれぞれのセル内で最も頻繁に発生するピクセル値に相当するモード値を選択する。それから、マルチ解像度ラベルロケータシステムは、セルのための間引き画像内のそれぞれの共通特性値をモード値に設定する。
【0020】
証印の予想される特性に対応する特性を有する間引き画像内で1つまたは複数の候補領域を特定するために、マルチ解像度ラベルロケータシステムが、間引き画像に対応する1つの共通した特性ヒストグラムを計算する。それから、マルチ解像度ラベルロケータシステムは、低域フィルタと適応移動ウィンドウフィルタの両方で共通特性ヒストグラムを平滑化する。
【0021】
ラベル候補を荷物背景から分離するために、マルチ解像度ラベルロケータシステムは、濾波された共通特性ヒストグラムから1つまたは複数のピーク値を選択し、上限と下限の谷値を特定することにより、各ピーク値の回りのピーク領域を隔離する。それから、マルチ解像度ラベルロケータシステムは、間引き画像に対応する空の画像の中に各ピーク領域内のピクセルを写像することにより、セグメント化された画像を作成する。それ以降、マルチ解像度ラベルロケータシステムは、関心のある特性に対応するセグメント化された画像内の1つまたは複数の接続された構成要素を特定する。これは、ブロッブ(よごれ、しみ)または候補領域が、有界ウィンドウまたはボックスによって囲まれているセグメント化された画像を生成する。有界ウィンドウごとに、マルチ解像度ラベルロケータモジュールは、該有界ウィンドウの幾何学上の特性、及び/または該有界ウィンドウ内のセルの相対的な平均光強度を含むことがある1つまたは複数の特徴値を計算する。それ以外の特徴値は、有界ウィンドウの正規化された寸法、有界ウィンドウの正規化された面積、及び有界ウィンドウのアスペクト比を含むことがある。典型的には、これらの特徴値は、カメラの向き及び照明に関して不変である。言い換えると、これらの特徴値は、カメラ向きが修正される場合、または背景照明が変化する場合には変化しない。特徴値が得られた後、マルチ解像度ラベルロケータモジュールは、有界ウィンドウ特徴値、及び有界ウィンドウ内の領域の特徴値を含む特徴ベクタを構築する。
【0022】
エッジ発生画像属性
エッジ発生画像を作成するために、マルチ解像度ラベルロケータシステムの第1ビデオプロセッサの黒白閾値関数が、入力画像の各セル内のピクセル値をバイナリ化する。入力画像のセル内でピクセル値をバイナリ化するためには、マルチ解像度ラベルロケータシステムは、背景ピクセル値に基づいてピクセル値をバイナリ化するための閾値を選択するために、セル内のピクセル値に適応バイナリ化技法を適用する。それから、マルチ解像度ラベルロケータシステムは、各セル内のバイナリ化されたピクセル値の間で予想される向きの遷移を特定する。それから、マルチ解像度ラベルロケータシステムは、セル内での遷移に基づきセルごとに合計されたエッジ発生値を計算し、セルごとのエッジ値をセル内のピクセルの合計されたエッジ発生値に設定する。
【0023】
マルチ解像度ラベルロケータシステムは、セル内のピクセル値を、関心のある特性の間にあるピクセル値を定める複数のテンプレートと比較することによって、特定のセルのこれらの遷移を特定する。それから、マルチ解像度ラベルロケータシステムは、やはり向きごとにカウンタを定義することによって、セル内のバイナリ化されたピクセル値の間で予想される向きの遷移を合計する。テンプレートごとに、マルチ解像度ラベルロケータシステムは、セルの各ピクセルがテンプレートの少なくとも1つのインスタンスと比較されるように、各テンプレートのインスタンスを、テンプレートと同じサイズを有するセルの重複しない、つながった部分と比較する。それから、マルチ解像度ラベルロケータシステムは、テンプレートによって定められるピクセルパターンに相当するセル内の1つまたは複数の一致するピクセルパターンを特定する。マルチ解像度ラベルロケータシステムは、ピクセルパターンに関連付けられる向きを特定し、各一致するピクセルパターンの発生に応えて、カウンタの1つまたは複数を増分する。
【0024】
遷移に基づいたセルごとに合計されたエッジ発生値、及びそれらのそれぞれのカウンタ値を計算する単に、マルチ解像度ラベルロケータシステムは、カウンタ値を濾波し、セル内のテキストの存在を示す無作為な向きに応えて合計されたエッジ発生値を増分する合計公式を適用する。この合計公式を用いて、マルチ解像度ラベルロケータシステムは、セル内でのバーコードの存在を示す一様な、または部分的に間隔をあけて配置される遷移に応えて、合計されたエッジ発生値を増分することを避ける。これにより、マルチ解像度ラベルロケータシステムは、テキスト、したがって宛て先アドレス情報を含まないバーコードラベルに対応する入力画像内の候補領域を排除できるようになる。
【0025】
有界ウィンドウの属性
マルチ解像度ラベルロケータシステムは、有界ウィンドウごとに多くの異なる特徴値を計算することができる。1つの特徴値は、セグメント化された画像によって定められる高さに対する、有界ウィンドウによって定められる高さの比率を表す正規化された高さを含む。別の有界ウィンドウ特徴値は、セグメント化された画像によって定められる幅に対する、有界ウィンドウによって定められる幅の比率を表す正規化された幅を含む。追加の有界ウィンドウ特徴値は、セグメント化された画像によって画定される面積に対する、有界ウィンドウによって定められる面積の比率を表す正規化された面積を含む。別の有界ウィンドウ特徴値は、有界ウィンドウによって定められる高さに対する、有界ウィンドウによって定められる幅の比率を表すアスペクト比を含む。
【0026】
有界ウィンドウ特徴値に加えて、マルチ解像度ラベルロケータシステムは、有界ウィンドウ内のセルのための平均光強度に相当する多くの異なる特徴値を計算することができる。マルチ解像度ラベルロケータシステムは、有界ウィンドウ内のセルの総数に対する、有界ウィンドウ内のセルのエッジ発生値の合計の比率を表す正規化されたエッジ発生強度に基づいて、特徴値を計算してよい。マルチ解像度ラベルロケータシステムは、有界ウィンドウにより定められる面積に対する、有界ウィンドウ内のセルの合計されたエッジ発生値の合計の比率を表す正規化されたエッジ発生強度に基づいて特徴値を計算してもよい。正規化されたエッジ発生強度(好ましい実施形態のための遷移強度)を計算するときに雑音を除去するために、マルチ解像度ラベルロケータシステムは、事前に定義された閾値以下の有界ウィンドウ内のセルの合計された遷移値をゼロの目盛りに合わせる。
【0027】
候補領域の事前分類及び分類
特徴値特性に基づいて、マルチ解像度ラベルロケータシステムは、関心のある特性に典型的である閾値を適用することによって、候補領域を事前に分類してよい。例えば、マルチ解像度ロケータがパッケージまたは荷物の上で宛て先住所ラベルを見つけるように設計される場合に、マルチ解像度ロケータは、ラベルが、典型的には最小サイズ及び最大サイズを有するため、領域のサイズに基づいて候補領域を排除できる。それから、マルチ解像度ラベルロケータシステムは、事前に定義された最小閾値以下の領域を画定する対応する有界ウィンドウを有する1つまたは複数の候補領域を排除することができる。同様に、マルチ解像度ラベルロケータシステムは、事前に定義された最大値を超える領域を画定する対応する有界ウィンドウを有する、1つまたは複数の候補領域を排除することができる。加えて、マルチ解像度ラベルロケータシステムは、対応する候補領域の特徴値について計算された重心を中心とする事前に定められたサイズを有する有界ウィンドウに対応するために、1つまたは複数の候補領域をトリミングすることができる。
【0028】
候補領域を事前に分類した後、マルチ解像度ラベルロケータシステムは、それぞれの候補領域のそれぞれの特徴ベクタを比較することによって、関心のある特性を有する証印を含む尤度に従って、候補領域を分類する。候補領域を分類するリストを作成するために、マルチ解像度ラベルロケータシステムは、有界ウィンドウ特徴値を、有界ウィンドウ特徴値の予想値に比較することによって、有界ウィンドウ特徴値の1つまたは複数に対応する第1決定値を計算する。この場合では、有界ウィンドウ特徴値の予想値は、関心のある特徴の間の1つにある。例えば、ラベルロケータ設計において、実際のラベルの有界ウィンドウは、所定の予想面積、所定の予想周縁部、及び/または所定の予想アスペクト比を有することができる。
【0029】
有界ウィンドウ特徴値に基づいて第1決定値を計算した後、マルチ解像度ラベルロケータシステムは、特徴値を、特徴値の予想値と比較することによって1つまたは複数の残りの特徴値(つまり、有界ウィンドウ特徴値以外)に対応する第2決定値を計算する。特徴値の予想値は、関心のある特徴の間にもある。
【0030】
決定値を計算した後、マルチ解像度ラベルロケータシステムは、複数の決定サブスペースを有する決定スペースを画定することによって、優先順位順で候補領域をリストすることができる。それから、マルチ解像度ラベルロケータシステムは、決定空間を計算し、有界ウィンドウの相対値及び特徴ベクタの特徴値に基づいて、特徴ベクタを決定空間に写像する。
【0031】
ハードウェア構成要素
本発明は、入力値を定めるピクセル値を備えるデータストリームを受信し、関心のある特性を有する入力画像内で証印を位置決めするためにピクセル値を処理するように動作可能なビデオ画像システムで実現されてよい。ビデオ画像システムは、典型的には、入力画像を複数のマルチピクセルセルに分割するために動作可能な第1画像ビデオプロセッサを含む。ビデオ画像システムは、入力画像の各セルに対応する要素を備える入力画像に対応する間引き画像も作成する。
【0032】
間引き画像の各要素は、入力画像の対応するセル内のピクセルの、平均光強度などの共通した特性を表す。間引き画像を生成するために、第1ビデオ画像プロセッサは、連続してピクセル値を受信するために動作できるバッファメモリを含む。第1ビデオ画像プロセッサは、典型的には、バッファメモリに接続され、ピクセルストリームを受信するために動作可能であるフィールドプログラマブルゲートアレイ(FPGA)内で実現される。第1ビデオ画像プロセッサは、さらに、静的なメモリデバイスを含み、ピクセルがFPGAを通って流れるにつれて、
その動作を実現するように構成される。
【0033】
第1ビデオプロセッサに加えて、ビデオ画像システムは、一般的には、入力画像の各セルに対応する要素を備える入力画像に対応するエッジ発生画像を作成するために動作可能の第2ビデオプロセッサを含む。エッジ発生画像の各要素は、入力画像の対応するセルのピクセル内でのエッジの発生の数を表す。
【0034】
第1ビデオプロセッサのように、第2ビデオプロセッサは、一般的にはFPGA内で実現される。エッジ発生画像を作成するために、第2ビデオ画像プロセッサは、典型的には、複数のシフトレジスタに動作できるようにリンクされるバッファメモリを含む。該複数のシフトレジスタは、ダイナミックメモリデバイスに動作できるようにリンクされる。
【0035】
第3ビデオプロセッサは、好ましくは汎用コンピュータ上で実行中のソフトウェアシステムとして構成され、証印の予想される特徴に対応する特徴を有する間引き画像内の1つまたは複数の領域を特定する。第3ビデオプロセッサは、間引き画像及びエッジ発生画像を結合し、関心のある特性を有する証印を含むこれらの領域の尤度に従って候補領域を分類する。第3ビデオプロセッサは、分類後、関心のある特性を有する証印を最も含んでいそうな1つまたは複数の候補領域の優先順位が付けられたリストを編成する。
【0036】
第1ビデオプロセッサと第2ビデオプロセッサのデータを結合するため、及び候補領域の優先順位が付けられたリストを計算するために、第3ビデオ画像プロセッサは、中央演算処理装置及びメモリ記憶装置を含む。第3ビデオ画像プロセッサは、関心のある特性に対応する、間引き画像の特性及びエッジ発生画像の特性を有する入力画像内で1つまたは複数の候補領域を特定するために動作可能である。第3ビデオ画像プロセッサは、さらに、関心のある特性を有する証印を含む尤度に従って候補領域を分類し、関心のある特性を有する証印を最も含んでいそうな1つまたは複数の候補領域の優先順位が付けられたリストを編成するために動作可能である。
【0037】
動作環境の例
本発明は、荷物またはパッケージが移動する流れの上で関心のある特性を有するラベルの位置を決めるために動作可能なシステムを提供する。システムは、パッケージ、パッケージを移動するために動作可能なコンベヤ、及びコンベヤに隣接して、典型的にはコンベヤの上に配置されるビデオデバイスを含む。該ビデオデバイスは、各パッケージがビデオデバイスのそばを通過するにつれ、各パッケージを走査する。ビデオデバイスに動作できるように連結されているビデオプロセッサが、パッケージの間引き画像及びエッジ発生画像を生成する。
【0038】
間引き画像及びエッジ発生画像を評価するために、システムは、さらに、ビデオプロセッサに動作できるように連結されるマイクロプロセッサを含む。該マイクロプロセッサは、関心のある特性を有する証印を最も含んでいそうは1つまたは複数の候補領域の優先順位が付けられたリストを編成する。
【0039】
発明が、従来の自動荷物仕分けシステムに優って改善し、前述された優位点を達成することは、例示的な実施の形態の例の以下の詳細な説明及び添付図面と請求の範囲から明らかになる。
【0040】
実施の形態の例の詳細な説明
ここに記述されているプログラム、プロセス、方法等は、任意の特定のコンピュータ、プロセッサまたは装置に関係したり、制限したりされていないものと理解される。むしろ、多様な種類の計算装置が、ここの方法ステップを実行するために使用されてよい。特に、ここに記述されている好ましい実施の形態は、ここに記述されているコンピュータによって実現されるプロセスを実行するために1つまたは複数のフィールドプログラマブルゲートアレイ(FPGA)に依存する。ただし、従来のフォンノイマンプロセッサ、またはその他の種類の専用ハードウェアシステムなどのその他の種類の計算装置も、ここに記述されている方法ステップを実行するために同等に使用できると理解される。
【0041】
本発明の好ましい実施の形態の動作環境の説明
ここで、図面を参照すると、類似する番号がいくつかの図を通して類似する要素を示している。図1は、発明の実施の形態の例に動作環境を提供するマルチ解像度ラベルロケータシステム20の図である。マルチ解像度ラベルロケータシステム20は、荷物24aから24cを運ぶコンベヤ22を含む。CCDカメラ26は、荷物24aから24cがCCDカメラ26の下を通過するにつれて、反射される光から、コンベヤ22及び荷物24aから24cの表面の標準アナログビデオ画像を生成する。
【0042】
CCDカメラ26は、TH7833A CCDチップを使用するカメラなどの、白黒の4,096ピクセルの線走査型カメラであってよい。CCDカメラ26によって作成されるアナログ画像の解像度はコンベヤ22全体で約187ピクセルつまりインチあたりの「ドット数」(DPI)である。実際問題としては、あらゆるそれ以外のピクセルは、処理されるデータ量を削減するために、93DPIビデオ画像を生成するために1つの画像から排除されてよい。
【0043】
ビデオプロセッサ28は、CCDカメラによって生成されるアナログビデオ画像を、8ビットグレースケールビデオ信号に変換する。それから、ビデオプロセッサ28は、この8ビットグレースケールビデオ信号を、間引き画像信号30に変換する。また、ビデオプロセッサ28は、8ビットのグレースケールビデオ信号をエッジ発生画像信号32に変換する。
【0044】
ビデオプロセッサ28は、間引き画像信号30及びエッジ発生画像信号32を、マルチ解像度ラベルロケータプログラム36を含むホストコンピュータまたはマイクロプロセッサ34に伝送する。該マルチ解像度ラベルロケータプログラム36は、宛て先住所ラベルを最も含んでいそうな1つまたは複数の候補領域またはラベル候補38の優先順位が付けられたリストを編成する。
【0045】
要約すると、マルチ解像度ラベルロケータシステム20のビデオプロセッサ28は、アナログビデオ信号27を8ビットグレースケールビデオ信号に変換する。それから、ビデオプロセッサ28は、この8ビットグレースケールビデオ信号を間引き画像信号30に変換する。さらに、ビデオプロセッサ28は、8ビットグレースケールビデオ信号をエッジ発生画像信号32に変換する。それから、ビデオプロセッサ28は、マルチ解像度ラベルロケータプログラム36が、ラベル候補38の優先順位が付けられたリストを作成するために、間引き画像信号30及びエッジ発生画像32からデータを抽出するホストコンピュータまたはマイクロプロセッサ34に、間引き画像信号30及びエッジ発生画像信号32を伝送する。
【0046】
図2は、CCDカメラ26によって走査される荷物24aの表面を描き、荷物は、間引き画像及びエッジ発生信号の対象である。荷物24aは、宛て先住所ラベル40及び発信住所ラベル42を含む。荷物24aは、通常、出荷者に対応する符号及び荷物出荷企業によってパッケージに割り当てられる一意の追跡調査符号を含むバーコード44を付けている。荷物24aは、さらに、CCDカメラ26によって走査される料金別納マーク46及び外来マーク25を含む。外来マーク25は、典型的にはパッケージの処理中に発生する荷物パッケージの付随的な項目である。マーク25は、出荷中に接触し、パッケージに「しるしをつける」可能性のあるインクのマーク、埃、またはくずであってよい。CCDカメラ26は、前記ラベル40と42、バーコード44、外来マーク25、及び料金別納マーク46を捕捉するデジタルビデオ画像48を生成する。
【0047】
二次元ピクセル化画像48は、(図5から図8に図示される)複数のセルに分割される。二次元ピクセル化画像48の各セルは、好ましくは、32ピクセル掛ける32ピクセルの正方形または矩形(つまり、ピクセルの32列と32行)を
形成する32本の連続走査線の32個の同一直線上にあるピクセルを含む。二次元ピクセル化画像48の各セルは、各辺が1インチの約3分の1(0.85センチメートル)の正方形である。したがって、32本の走査された線が、コンベヤ22全体で並べて位置に付けられた128個のセルを備えることが理解されるだろう。セルは、マルチ解像度ラベルロケータシステムがラベル候補38を特定する固定された基準のフレームを提供する。
【0048】
マルチ解像度ラベルロケータシステムの概要
図3は、マルチ解像度ラベルロケータシステム20のさらに詳細な機能ブロック図である。マルチ解像度ラベルロケータシステム20のビデオプロセッサ28は、エッジ発生画像回路50及び間引き画像回路52を含む。エッジ発生画像回路50と間引き画像回路52の両方とも、187のDPI―8ビット/ピクセルアナログビデオ信号を、3DPI−8ビット/ピクセルデジタルビデオ信号に変換する。SRAMなどの記憶装置54は、エッジ発生画像回路50及び間引き画像回路52から受信される処理済みの3つのDPI−8ビット/ピクセルビデオ信号を記憶する。
【0049】
間引き画像回路52及びエッジ発生回路50を含むビデオプロセッサ28は、典型的には、ピクセルデータがハードウェアを通って流れるにつれて出力画像を生成するFPGAなどのハードウェアで実現される。ビデオプロセッサ28は、3DPIエッジ発生画像信号32及び3DPI間引き画像信号30を、マイクロプロセッサ34及びマルチ解像度ラベルロケータプログラム36を含む、分類プロセッサに伝送する。分類プロセッサ34、36は、マルチ解像度ラベルロケータプログラムを実行できる従来のワークステーションまたはパーソナルコンピュータである場合がある。
【0050】
分類プロセッサ34、36は、間引き画像の特性及びエッジ発生画像の特性を有する入力画像内で1つまたは複数の候補領域を特定する。分類プロセッサ34、36は、関心のあるラベルを含む尤度に従って候補領域を分類する。分類プロセッサ34、36は、「住所ラベル」を最も含みそうな荷物24aの入力画像内で1つまたは複数の候補領域の優先順位が付けられたリストを編成する。それから、分類プロセッサ34、36は、所定数の候補ラベル場所38を出力する。
【0051】
本発明の他の実施の形態
プロセッサの速度及び大きさの増加のため、当業者には、マルチ解像度ラベルロケータプログラムが、単一プロセッサ内のその他のプログラムモジュール内で実現されてもよいことが理解される。一般的には、プログラムモジュールは、特定のタスクを実行するか、あるいは特定の抽象データ型を実現するルーチン、プログラム、構成要素、データ構造等を含む。さらに、当業者には、発明が、携帯型装置、マルチプロセッサシステム、マルチプロセッサベースの、または消費者書き込み可能電子製品、ミニコンピュータ、メインフレームコンピュータ等を含む、その他の計算システムを用いて実践されてよいことが理解される。発明は、また、通信網を通してリンクされる遠隔処理装置によってタスクが実行される分散コンピューティング環境でも実現することができる。
【0052】
本発明は好ましくは自動荷物仕分け環境で利用されるが、発明はこの用途に制限されておらず、第1対象または第2対象上に存在する対象の第1集合の識別を必要とするその他の分野でも使用できる。例えば、本発明は、回路基板上の導線またはマイクロチップなどの特定の要素の位置を決めるために使用されてよい。この用途では、間引き画像回路52が、導線またはマイクロチップの高水準属性を特定できるだろうが、エッジ発生画像回路50は、間引き画像回路52を基準にしてさらに小さな規模で導線またはマイクロチップの間の離散的な差異を探すことができるだろう。
【0053】
回路基板例と同様に、マルチ解像度ロケータシステムは、荷物上の蛍光マークを特定するため、あるいは料金別納等を示す可能性がある六角形などの荷物上の特定の形状を特定するために、代わりに利用できるだろう。別の代替策として、マルチ解像度ラベルロケータは、ビデオ画像処理によって検出可能なひび割れまたはその他の欠陥などの製品中の欠陥の位置を決めるために製造環境で使用できるだろう。その他の製造用途は、ビデオ画像処理によって容易に検出可能である視覚的な特性を有する色付きの織物またはその他の製品の製造での欠陥の識別を含むことができるだろう。このようにして、本発明は、対象の視覚的な特性がビデオ画像処理によって容易に検出可能である多くの異なる環境で利用することができる。
【0054】
マルチ解像度ロケータシステムの概要
図4は、マルチ解像度ラベルロケータシステム20のコンピュータによって実現されるプロセスの論理流れ図である。ステップ86では、CCDカメラ26により生成されるグレースケール画像が、エッジ発生画像回路50と間引き画像回路52の間で分割される。エッジ発生画像回路50及び間引き画像回路52のステップの動作は、別個に説明されるが、両方の回路とも、CCDカメラ26から同時に受信されるグレースケール画像信号を処理することが注記される。
【0055】
ルーチン88では、エッジ発生画像回路50は、図7に描かれているようにエッジ発生画像を生成するためにCCDカメラから受信されるグレースケール画像をバイナリ化する。具体的には、ルーチン88で、デジタイザ66が、適応閾値技法または類似したプロセスを利用し、CCDカメラ26によって生成されるアナログ信号を、1ビット(すなわち、黒/白)デジタルビデオ信号に変換する。
【0056】
好ましい実施形態では、ルーチン88の間に、エッジ発生画像回路50が、バイナリ化された画像内での遷移(エッジ発生)を検出するために4ピクセル掛ける4ピクセルのウィンドウを利用する。具体的には、エッジ発生画像回路50は、分析されているセルの4ピクセル掛ける4ピクセルのウィンドウのエッジ発生の空間的な向きを検出するために、事前に定められた4掛ける4のテンプレートの集合を利用する。
【0057】
4ピクセル掛ける4ピクセルのウィンドウの例は、以下の表によって示される。
【0058】
【表1】
Figure 2003518300
表1では、ゼロ(0)は、関心のあるセルのピクセル内の空の領域を表すが、一(1)は、関心のあるセルのピクセル内に対象またはマークが存在することを表す。表1は、表の最後の行の3つの欄に水平線が存在することを示す。表1の中の場所のそれぞれには、表2に基づいた数値が割り当てられている。
【0059】
【表2】
Figure 2003518300
表2では、括弧内の数は、表1のピクセルの相対的な場所を定める。表の各場所は、16ビットレジスタの特定的なビンも表す。それぞれの括弧内の最初の数は、4ピクセル掛ける4ピクセルのウィンドウの欄の数であるが、第2の数は4ピクセル掛ける4ピクセルのウィンドウの行の数である。括弧の外側の数は、16ビットレジスタのそれぞれのビンの相対的な場所の10進同等物である。これらの値を合計すると、4掛ける4のウィンドウを用いるあらゆる考えられるパターンを一意の10進値で表現できるようになる。
【0060】
表1の4掛ける4のウィンドウ場合、パターン値は、七(7)であると計算される。七(7)というこのパターン値は、表2の4セル掛ける4セル内の以下の場所の合計に基づく。つまり1(0,0)、2(1,0)、及び4(2,0)であり、ここでは1+2+4=7である。それから、七(7)というパターン値は、パターン値/加重値ルックアップテーブルに比較される。すなわち、各パターンには、パターンを特定するためにパターンの関連つけられたパターン値を使用する表を通してパターンに索引を付けられる重みが割り当てられる。ルックアップテーブル内の七(7)というパターン値には、百二(102)の加重値が割り当てられる。
【0061】
パターン値ルックアップテーブルは、パターン値のグループに割り当てられる、異なる向きまたは向きの組み合わせに対応する10個の異なる値を有する。言い換えると、ある特定のグループ内のパターンのすべては、同じ向きまたは向きの組み合わせを有すると見なされ、この向きまたは向きの組み合わせが、グループに割り当てられるパターン値によって表される。具体的には、パターン値の下位の4つの数字のそれぞれの数字は、以下に示すようにある特定の向きに対応する。つまり、135°、90°、45°、0°である。すなわち、バイナリ「0」ビット(最下位ビット)は、0°の向きに相当し、バイナリ「1」ビット(第2最下位ビット)は45°の向きに相当し、バイナリ「2」ビット(第3最下位ビット)は90°の向きに相当し、バイナリ「3」ビット(第4最下位ビット)は、135°の向きに相当する。
【0062】
各パターン値は、どの向きまたは向きの組み合わせがパターンの対応するグループに表示されるのかを示すために、このビットベースの向き指定に依存する。例えば、パターン値65は、0010 0001というバイナリ値を有する。最下位の4つの数字0001は、0°という向きを示す(すなわち、135°ビットは設定されず、90°ビットは設定されず、45°ビットは設定されず、0ビットが設定される)。このようにして、65というパターン値を割り当てられるパターンのグループ内のパターンのすべてが、0°という向きを示すと見なされる。
【0063】
同様にして、0010 0010というバイナリ値を有するパターン値66は、45°の向きを示す(すなわち、135°ビットは設定されず、90°ビットは設定されず、45ビットは設定され、0°ビットは設定されない)。このようにして、66というパターン値を割り当てられたパターンのグループ内のパターンのすべてが、45°という向きを示すとみなされる。そして、0110 1100というバイナリ値を有するパターン値108は、135°と90°の向きの組み合わせを示す(つまり、135°ビットは設定され、90°ビットは設定され、45°ビットは設定されず、0ビットは設定されない)。このようにして、108というパターン値を割り当てられたパターンのグループ内のパターンのすべてが、135°と90°の向きを示すと見なされる。好ましいパターン値ルックアップテーブルは、図3に示される。パターン値のバイナリ同等物は、図3に示され、最後の4つの数字は、各パターン値のビットベースの向き指定を強調するために、太字で示されている。
【0064】
【表3】
Figure 2003518300
Figure 2003518300
Figure 2003518300
Figure 2003518300
Figure 2003518300
Figure 2003518300
Figure 2003518300
Figure 2003518300
Figure 2003518300
Figure 2003518300
Figure 2003518300
Figure 2003518300
Figure 2003518300
Figure 2003518300
Figure 2003518300
Figure 2003518300
Figure 2003518300
Figure 2003518300
Figure 2003518300
【0065】
ルーチン90では、エッジ発生回路50が、セル内のバイナリ化されたピクセル値の存在及び向きを検出する。用語「エッジ発生」とは、基板または対象上の一定の証印について、相対的に高周波とともに存在するときに、このような証印の存在を示す証印の上の特定の表面があることを意味する。例えば、手書きラベルは、バーコードレベルについてのエッジ特性の集合とは異なるエッジ特性のある特定の集合を有するだろう。代わりに、マルチ解像度ロケータシステムが、回路基板製造などのその他の環境で利用されると、エッジ発生回路50は、その他のマイクロチップまたはリード線及びプリント回路基板自体を基準にして異なるまたは一意である比較的に高周波のエッジ特性の集合を有する一定のマイクロチップまたはリード線を示すエッジ発生画像を生じさせるだろう。
【0066】
図7に示されるように、エッジ発生画像は、ラベル候補領域25D、40D、42D、44D及び46Dの間の異なる特徴値を示す。エッジ発生画像58は、型書き込み済みラベル40D、42Dの表現が、どのようにバーコード44Dの表現と異なるのかを示す。具体的には、型書き込みラベル表現40D及び42Dは、無作為な手法に適する色付きピクセルを有するが、バーコード表現44Dは、一様な手法に適する色付きピクセルを有する。ラベル候補領域間の前述された差異を特定するための例示的な方法を提供するルーチン90は、図12に関して下記に詳細に説明される。
【0067】
ルーチン92では、エッジ発生画像回路50は、エッジ発生画像58のセルについての遷移を合計する。ルーチン92の追加詳細は、図13を参照して説明される。
【0068】
ルーチン88から92の間、マルチ解像度ラベルロケータシステムは、ルーチン94から98を同時に実行する。ルーチン94では、間引き画像回路52は、荷物または基板のグレースケール画像のセル内で発生するピクセル値のヒストグラムを計算する。ルーチン94の追加説明は、図14に関して説明される。
【0069】
ルーチン96では、間引き画像52が、ルーチン94で生成されたヒストグラムから、セル内で最も頻繁に発生するピクセル値に対応する間引き画像値を選択する。本発明のラベルロケータアプリケーションのための用語「間引き画像」は、低域濾波し、適応移動ウィンドウフィルタを入力画像、及び濾波された画像のサブサンプリングに適用することによって得られる画像を意味する。「共通特性値」とは、対応するセル全体の性格を表す単一値である。例えば、セルの共通特性値は、「モード」であるか、あるいはセル内の最も頻繁に発生するピクセル値であってよい。このケースでは、共通特性値は、画像空間内の対応するセルの物理的な場所に写像されるピクセル値である。この共通特性値は、図5に描かれるように「間引き画像」画像の基礎となるピクセル値として保存される。すなわち、間引き画像回路52は、セルモード値を画像空間に写像し、図5に示されるように、54の間引き画像を生成する。
【0070】
図5に示すように、間引き画像54における突然の変化は典型的には、ラベル候補領域25A、40A、42A、44A、及び46Aを特定する。前述されたラベル候補領域は、通常、背景または荷物表面24aとは異なる特性(ピクセル値)のある領域を含む。間引き画像54は、このようにして、(ラベルなどの)関心のある領域と背景(荷物の表面)間の主要な視覚的な差異の「概要」または「高レベル」または「低解像度」ピクチャを示す。例えば、図5のラベル候補領域25A、40A、42A、44A、及び46Aは、連結された小さな正方形で表されるが、荷物表面の残りの空の領域は表面表現を有していない。間引き画像回路52は、エッジ発生画像回路50のさらに狭められた焦点に比較して、関心のある製品を巨視的なレベルで見る。マルチ解像度ラベルロケータシステムがルーチン96でどのように間引き画像54を生成するのかに関する追加詳細は、図15の論理流れ図の議論において説明される。
【0071】
間引き画像54及びエッジ発生画像58は、ともに元の187DPI画像信号から引き出される3DPI画像信号である。間引き画像回路52及びエッジ発生画像回路50がそのそれぞれの画像54と58を生成した後、マルチ解像度ラベルロケータシステム20の残りのステップ/ルーチン98から106が、好ましくはマルチ解像度ラベルロケータプログラム36によって実行される。
【0072】
ステップ98では、マルチ解像度ラベルロケータプログラム36は、ブロッブをセグメント化する、つまりピーク領域のピクセルを間引き画像54に対応する空の画像の中に写像することによって、図6に示されるようなセグメント化された画像56を作成する。セグメント化された画像56を作成するために、マルチ解像度ラベルロケータプログラム36は、間引き画像54から導出される間引きヒストグラムを生成する。さらに、ステップ98では、マルチ解像度ラベルロケータプログラム36は、セグメント化された画像56内で1つまたは複数の接続済み構成要素を特定し、有界ウィンドウ25C、40C、42C、44C及び46Cを生成する。ステップ98の詳細は、図18に関して説明される。
【0073】
ルーチン100では、マルチ解像度ラベルロケータプログラム36が、セグメント化された画像56をエッジ発生画像58に結合し、図8の複合画像60を形成する。それから、マルチ解像度ラベルロケータプログラム36が、複合画像60から特徴値を抽出する。ルーチン100の追加詳細は、図19に図示されている。
【0074】
ルーチン102で、マルチ解像度ラベルロケータプログラム36は、ラベル候補領域の予想される有界ウィンドウ特徴値の事前に定められた基準に従ってラベル候補を事前に分類する。基準の1つは、図20に描かれるように、ラベル候補領域の長さ及び幅を含む。ルーチン102の事前に定義された基準に従った事前分類プロセスの追加詳細は、以下の図21に関して説明される。
【0075】
ルーチン104では、マルチ解像度ラベルロケータプログラム36は、有界ウィンドウ特徴値以外の特徴値及び有界ウィンドウ特徴値を含む特徴値として一般に参照される、事前に定義される基準の別の集合に従ってラベル候補領域を分類する。ルーチン104の追加詳細は、以下の図22に関して説明される。
【0076】
ルーチン106では、マルチ解像度ラベルロケータプログラム36は、所定数のラベル候補を出力するか、あるいは関心のある特性を有する証印を最も含んでいそうな1つまたは複数の候補領域の優先順位が付けられたリストを編成する。例えば、手書きの宛て先住所ラベルが求められると、マルチ解像度ラベルロケータプログラム36は、CCDカメラ26によって作成される元の高解像度画像の対象に対応する手書き宛て先住所ラベルを最も含んでいそうな候補領域の優先順位が付けられたリストを作成する。
【0077】
マルチ解像度ラベルロケータにより生成される画像
図5は、荷物24aの表面の間引き画像54を示す。間引き画像54は、図2の元の高解像度デジタル画像に比較してはるかに低い解像度を有する。マルチ解像度ラベルロケータのこの特定の例では、間引き画像54は、複数のラベル候補領域25A、40A、42A、44A及び46Aを含む。これらのラベル候補領域は、図2の住所ラベル40と42、バーコード44、外来マーク25、及び郵便料金別納マーク46に対応する。間引き画像54のピクセルは、図2の高解像度画像48のピクセルの対応する領域のモード(つまり、対応するセル内の最も頻繁に発生するピクセル値)を表す。したがって、間引き画像54は、元の高解像度デジタル画像48内に存在する突然の色遷移を保存する。
【0078】
間引き画像54の処理後、間引き画像回路52は、セグメント化された画像56を生成する。セグメント化された画像は、複数の接続された構成要素25B、40B、42B、44B及び46Bを含む。これらの接続された構成要素は、間引き画像54のラベル候補領域25A、40A、42A、44A及び46Aに対応する。セグメント化された画像56は、さらに、有界ウィンドウ25C、40C、42C、44C及び46Cを含む。これらの有界ウィンドウは、接続された構成要素25B、40B、42B、44B及び46Bの外郭または周縁部に相当する。接続された構成要素及び有界ウィンドウを生成するための方法は、図12から23の論理流れ図に関して好ましい装置の動作の説明で詳細に説明される。
【0079】
マルチ解像度ラベルロケータシステムは、間引き画像54を生成するが、システムは、図7に図示されるようなエッジ発生画像58も同時に生成する。エッジ発生画像58は、ラベル候補領域25D、40D,42D,44D及び46Dの複数の第2集合を含む。ラベル候補領域の第2集合は、図2の元の高解像度デジタルビデオ画像48のアドレスラベル40と42、バーコード44、外来マーク25、及び料金別納マーク46にも対応する。マルチ解像度ロケータシステムのこの特定の応用例では、エッジ発生画像回路50が、高解像度デジタルビデオ画像48の対応する領域内のエッジ向きの分散の均等さに比例してピクセル色を割り当てることによって、エッジ発生画像58を作成する。すなわち、大きい数の無作為に向けられる遷移は、高エッジ発生値を生じさせるが、小さい数の遷移または大きい数に共通して向けられる遷移は、低エッジ発生値を生じさせる。
【0080】
マルチ解像度ラベルロケータが、エッジ発生とセグメント化された画像56と58の両方の処理を完了すると、システムは、セグメント化された画像56からのデータがエッジ発生画像58と結合される図8の複合画像60を作成する。セグメント化された画像56の有界ウィンドウ25C,40C、42C、44C及び46Cは、エッジ発生画像58の第2集合ラベル候補領域25D、40D、42D、44D及び46Dの回りで写像される。さらに具体的には、複合画像60から、マルチ解像度ラベルロケータプログラム36によって制御されるホストコンピュータまたはマイクロプロセッサ34が、有界ウィンドウ特徴値及び各有界ウィンドウ内のセルの特徴値に相当する特徴値を抽出する。ホストコンピュータまたはマイクロプロセッサ34は、有界ウィンドウ特徴値、及びエッジ発生回路50によって生成されるラベル候補領域の特徴値に従って、マルチ解像度ラベルロケータプログラム36の指導を受けてラベル候補領域25D、40D、42D、44D及び46Dを分類する。
【0081】
好ましい装置の説明
前述したように、本発明の好ましい実施の形態は、住所ラベルの場所を決めるための効率的な方法を提供する。ただし、マルチ解像度ロケータシステムのそれ以外の応用例は、本発明の範囲内にある。
【0082】
本発明の方法を実現するために、図9Aは、エッジ発生画像回路50の一部である方法のグレースケール画像ステップ88をバイナリ化するためのハードウェアを描く機能ブロック図を示す。エッジ発生画像回路50のハードウェア88は、バッファメモリ64に動作できるように連結される黒/白閾値論理回路62を含む。該バッファメモリ64は、IDT社(IDT Corporation)製の8k掛ける18ビットモデルIDT−72255L20PFチップなどの市販されているチップから構築される従来の先入れ先出し(FIFO)バッファであってよい。バッファメモリ64は、代わりに、制御装置及び静的RAMリソースによって実現されてよい。エッジ発生画像回路50のハードウェア88は、CCDカメラ26から黒/白バイナリ画像の中に元の高解像度デジタルビデオ画像48について閾値によってエッジを検出する。
【0083】
バイナリ化ハードウェア88は、CCDカメラ26によって生成されるアナログ信号を1ビットの黒/白デジタルビデオ信号67に変換するために標準的な閾値技法または類似したプロセスを使用する。1ビット黒/白デジタルビデオ信号67の使用により、エッジ発生画像回路50によるビデオ信号67の処理は容易になる。
【0084】
図9Bに示されるように、バイナリ化ハードウェア88は、5ピクセル掛ける4ピクセルのウィンドウによって定義される変数を有する表4に述べられる論理に従って動作する。バイナリ化ハードウェア88は、ピクセルのフィールドでのその隣接するピクセルの値に従ってピクセル値を求める。言い換えると、バイナリ化ハードウェア88は、ある画像内のピクセル間の相対的な色強度または光強度の値を比較することによって、前景画像情報を背景画像情報から分離する。表4の変数は、以下に示すように図9Bに図示されるピクセルウィンドウにより定義される。つまり、B2は走査線Bのグレースケール値を指す。位置2BWC4は位置4の走査線Cの黒/白値を指す。表4の残りの変数は、同様に定義される。
【0085】
【表4】
Figure 2003518300
【0086】
表5は、図9Bに示されるピクセル値によって定められる変数に基づいてスペックルまたは雑音除去のための論理を提供する。
【0087】
【表5】
Figure 2003518300
【0088】
バイナリ化ハードウェア88が、1ビットの黒白ビデオ信号を生成した後に、図4のルーチン90に対応するハードウェアが、黒白ビデオ信号を処理する。図10は、エッジ発生画像回路50のルーチン90用のハードウェアを示す。エッジ発生回路50のハードウェア90は、デジタイザ88、バッファメモリ68、シフトレジスタ70Aから70D、揮発性メモリ72、及び向き残高総量記録装置74を含む。バイナリ化ハードウェアまたはデジタイザ88は、前述したように、アナロググレースケールビデオ信号をデジタル1ビットビデオ信号67に変換する。
【0089】
バイナリ化ハードウェア88は、該1ビットデジタルビデオ信号67をバッファメモリ68に伝送する。バッファメモリ68は、データ線路LからLi−3を含む。各データ線路は、4096ビット(CCDカメラ26のピクセルごとに対応する1ビット)を含むシフトレジスタにアクセスする。したがって、各レジスタは、CCDカメラ26の1サイクルで生成される画像30の1本の走査線のビットマップ表現を含んでよい。バッファメモリ68の線路LからLi−3は、各セル(図示されていない)の32x32の32ピクセル高さに対応する。
【0090】
図10に図示されるように、各データ線路LからLi−3は、新しい走査線がバッファメモリ68の中に読み込まれるたびに、先行する走査線が続いたレジスタにシフトするように、次に続いたデータ線路に接続される。バッファメモリ68は、IDT社製の4k掛ける18ビットIDT−72245LB20PF型チップのような市販されているチップから構築される従来の先入れ先出し(FIFO)バッファであってよい。代わりに、バッファメモリ68は、静的RAM(SRAM)メモリソース内の制御装置によって実現されてよい。
【0091】
バッファメモリ68のデータ線路LからLi−3は、複数のシフトレジスタ70Aから70Dに接続される。シフトレジスタ70Aから70Dは、ピクセル情報を揮発性メモリ72に提供する。揮発性メモリ72は、IDT社製の64k掛ける4ビットIDT−61298SA12Y型などの市販されているチップから構築される従来のランダムアクセスメモリ(RAM)であってよい。揮発性メモリ72は、パターン向き信号76を生成する。
【0092】
揮発性メモリ72は、向き残高総量記録装置92にパターン向き信号76を送る。向き残高総量記録装置92は、セル向き信号78を生成する。バッファメモリ68、シフトレジスタ70Aから70D、及び揮発性メモリ72の動作は、図12に関してさらに詳細に後述される。向き残高総量記録装置74の動作は、図13に関してさらに詳細に後述される。
【0093】
バイナリ化ハードウェア88は、図7のエッジ発生画像58を生成するが、図11のハードウェア52は、間引き画像54を生成する。間引き画像回路52は、好ましくは、バッファメモリ80、フィールドプログラマブルゲートアレイ82、及びSRAM84を含む。バッファメモリ80は、IDT社製の4k掛ける18ビットIDT−72245LB20PF FIFO型チップなどの市販されているチップから構築される従来の先入れ先出し(FIFO)バッファであってよい。フィールドプログラムブルゲートアレイ82は、アルテラ株式会社(Altera Corporation)製のEPM7256SRC208−7FPGAチップなどの従来のFPGAチップであってよい。SRAMチップ84は、IDT社製の64k掛ける16ビットのIDT−71VO16SA10PH SRAM型チップであってよい。
【0094】
FIFO80及びFPGA82は、マルチ解像度ラベルロケータシステム20用に間引き画像信号30を生成する。間引き画像特徴回路52の動作は、図14と図15に関してさらに詳細に説明される。
【0095】
論理流れ図に関する好ましい装置の動作の説明
後述される論理流れ図は、さらに詳細に図4のエッジ発生回路50、間引き画像回路52、及びマルチ解像度ラベルロケータプログラム36の方法論を図解する。図4の論理流れ図は、全体的なマルチ解像度ラベルロケータシステム20の図1に対応する。図12と図13の論理流れ図は、図9A、図9B及び図10の黒/白閾値論理62、FIFO64、FIFO68、シフトレジスタ70Aから70D、RAM72、及び向き残高総量記録装置74に対応する。図14と図15の論理流れ図は、図11のFIFO80、FPGA82、及びSRAM84に対応する。図18、図19、図21及び図22の論理流れ図は、図1に図示されるようなマルチ解像度ラベルロケータプログラム36に対応する。
【0096】
論理流れ図は、本発明を実現するための好ましい方法を示すが、本発明の範囲及び概念の中で説明されている方法に多くの変更及び変型が加えられてよいことが注記される。また、前述された好ましい装置の間でのプログラミングタスクの割り当てを定義することも理解されるだろう。多様なチップの間でのプログラミングタスクの多くの異なる割り当て及び異なるFPGAチップ構成の間でのプログラミングタスクの多くの異なる割り当ては、本発明の範囲及び概念の中で同様に定義されてよい。
【0097】
エッジ発生画像処理
図12は、図4のルーチン90(エッジの検出及び向きを検出する)のために実現されるコンピュータの論理流れ図である。図12は、図10のFIFO68、シフトレジスタ70から70D、及びRAM72のためのコンピュータによって実現されたプロセスも図解する。図12は、図5に示されるエッジ発生画像54を生成する差異の初期のステップにも対応する。
【0098】
ルーチン90は、論理式「pixel_NUM MOD 32=0」が、32の倍数のたびに、すなわち32、64、96、128等でイエスからノーに切り替え、ステップ200で開始する。この動作は、走査線の4096ピクセルを、それぞれが32ピクセルの幅を有する部分的な走査線に分割することに相当する。決定ステップ200の照会に対する答えがイエスである場合、「イエス」分岐はステップ202に続く。決定ステップ200の照会に対する答えが「ノー」である場合、「ノー」分岐はステップ204に続く。
【0099】
ステップ202では、合計したエッジ発生値Tが、カウンタA、B、及びCの間の数学的な関係によって定義される。バイナリ化画像の各セルには、3つのカウンタA、B、及びCが割り当てられる。これらのカウンタは、それぞれのセルの中のエッジの相対的な向きを定める。ステップ202では、独占特徴画像回路50が、合計されたエッジ発生値Tに基づいて情報を濾波して取り除く。例えば、セルごとのカウンタA、B、及びCは、バーコードなどの一定のエッジについてセル内のエッジの相対的な向きを表すので、エッジ発生画像回路50は、遷移の共通向きのためにバーコードを濾波して取り除くことができる。この濾波は、好ましい実施の形態のラベル環境に制限されない。例えば、本発明についての回路基板識別の応用例では、事前に定められた向きを有するチップ上のリード線またはマーク(エッジ)は、濾波等式の中で考慮に入れられてよい。
【0100】
ステップ206では、カウンタA、B及びCがリセットされる。ステップ208では、エッジ発生画像回路50が現在のセルのカウンタ値を保存する。ステップ209では、エッジ発生画像回路50は、次のセルのカウンタ値に移動する。
【0101】
ステップ200の論理等式「pixel NUM_MOD 32」が0に等しくないとき、「ノー」分岐は、変数Mが偽に設定されるステップ204に続く。変数Mは、ステップ200の論理等式の結果を示すために使用されるフラグである。
【0102】
図12のエッジの存在及び向きを検出する動作に続いて、さらに図13によって説明される図4のルーチン92に従ってエッジの数が合計される。図13は、図10の向き残高総量記録装置74用にコンピュータによって実現されたプロセスを描く。ルーチン92は、4掛ける4のルックアップテーブルのテンプレートとバイナリ化された画像のセルを比較した後に実行される。
【0103】
ルーチン92は、各セル内のエッジの相対的な向きを表すカウンタA、B及びCがゼロに初期化されるステップ300で開始する。ステップ304では、残高総量記録装置74は、次の走査線を待機する。ステップ306では、走査線カウンタScan line_NUMが1、増分される。残高総量記録装置74Scan line_NUM用の走査線カウンタは、32個のピクセルの高さを有するセルの中への入力画像の分割に対応して、1から32までカウントすると一巡する。
【0104】
ステップ308では、残高総計記録装置が次のピクセルを待機する。ステップ310では、ピクセルカウンタpixel_NUMが増分される。ステップ310の後には、ピクセル_NUM MOD 32条件が満たされるかどうかが判断される決定ステップ312が続く。
【0105】
ステップ312の照会に対する答えが真である場合、「イエス」分岐は、残高総量記録装置74がセルの向き値を計算するステップ314に続く。ステップ312に対する答えが偽である場合、「ノー」分岐は、ステップ312から、残高総量記録装置74が、現在のピクセルのセル向き値がゼロ(0)度に等しく、九十(90)度に等しくないかどうかを判断する、ステップ314に続く。
【0106】
ステップ314に対する照会に対する答えがイエスである場合、「イエス」分岐がステップ316に続き、残高総量記録装置74では、カウンタCを増分しながら、カウンタAを減分する。ステップ314の照会に対する答えがノーである場合、「ノー」分岐がステップ318に続く。
【0107】
ステップ318では、セル向き値が九十(90)度に等しく、ゼロ(0)度に等しくないかどうかが判断される。ステップ318に対する照会がイエスである場合、「イエス」分岐が、残高総量記録装置74がカウンタAとCを増分するステップ320に続く。ステップ318の照会に対する答えがノーである場合、「ノー」分岐が、セル向き値が四十五(45)度に等しく、百三十五(135)度には等しくないかどうかが判断される、ステップ322まで続く。
【0108】
ステップ322の照会がイエスである場合、「イエス」分岐は、残高総量記録装置74がカウンタBとCの両方を増分するステップ324に続く。ステップ322に対する照会がノーである場合、「ノー」分岐は、セル向き値が百三十五(135)度に等しく、四十五(45)度に等しくないかどうかが判断されるステップ326に続く。本発明のセル向き値は、ルーチン92で列挙されるそれらの値に制限されない。その他の値は、マルチ解像度システム用の特定の応用例に依存する。
【0109】
ルーチン92で続行すると、ステップ326に対する照会がイエスである場合、「イエス」分岐は、カウンタCが増分される一方、カウンタBが減分されるステップ328に続く。ステップ326に対する照会がノーである場合、「ノー」分岐は、現在のピクセルが走査線内の最後のピクセルであるかどうかが判断されるステップ330に続く。
【0110】
現在のピクセルがこの走査線の最後のピクセルではない場合、「ノー」分岐が、ステップ330から、残高総量記録装置74が次のピクセルを待機するステップ308に続く。現在のピクセルが走査線の最後のピクセルである場合、「イエス」分岐は、ステップ330から、残高総量記録装置74が次の走査線を待機するステップ304に続く。前記に概略されたステップに従ってデータを処理した後、マルチ解像度ラベルロケータシステムが、図7に図示されるようなエッジ発生画像58を生成する。
【0111】
間引き画像処理
マルチ解像度ラベルロケータシステムは、エッジ発生画像処理のためのルーチン88から92のステップを実行するが、マルチ解像度ラベルロケータシステムは、図5の間引き画像54を生成するために、図14から図16に示されるルーチン94から98のステップを同時に実行する。図14は、図4の間引き画像回路52のルーチン94のためのコンピュータによって実現されたプロセスの論理流れ図である。
【0112】
ルーチン94は、RAM AとBがゼロに等しく設定される、図4のステップ400で開始する。ステップ402では、間引き回路52が次の走査線を待機する。ステップ404では、走査線カウンタScan line_NUMが1、増分される。走査線カウンタScan line_NUMが1から32をカウントする。
【0113】
ステップ406では、Scan line_NUM MOD 32が0に等しいという条件が満たされるかどうかが判断される。当業者は、論理式「Scan line_NUM MOD 32=0」が、32の倍数ごとに、つまり32、64、96、128等で偽から真に切り替えられることを理解することができるだろう。この動作は、実際には、32個のピクセルの高さを有するセルに入力画像を分割する。
【0114】
ステップ406の照会に対する答えがイエスである場合、「イエス」分岐が、各セルのピークヒストグラムが決定されるステップ408に続く。ステップ406の照会に対する答えがノーである場合、「ノー」分岐が、間引き画像回路52が次のピクセルを待機するステップ408に続く。
【0115】
ステップ410では、ピクセルカウンタpixel_NUMが増分される。ステップ412では、pixel_NUMカウンタ値が奇数であるかどうかが判断される。ステップ412に対する照会がイエスである場合、「イエス」分岐が、変数VALUEがアドレス、pixel_NUM MOD 32ピクセル値でRAM Bのコンテンツに等しく設定されるステップ414まで続けられる。ステップ416では、変数VALUEが増分される。ステップ418では、変数値が、アドレスpixel−NUM MOD 32、ピクセル値でRAM Bに書き込まれる。
【0116】
ステップ412に対する照会がノーである場合、「ノー」分岐が、変数VALUEがアドレスpixel_NUM MOD 32ピクセル値でRAM Aのコンテンツに等しく設定されるステップ420に続く。ステップ422では、変数VALUEは1増分される。ステップ424では、変数VALUEが、アドレスpixel_NUM MOD 32、ピクセル値でRAM Aに書き込まれる。
【0117】
ステップ426では、現在のピクセル値が走査線の最後のピクセル値であるのかどうかが判断される。現在のピクセルが走査線内のピクセルではない場合、「ノー」分岐が、ステップ426から、間引き画像回路52が次のピクセルを待機するステップ408まで続けられる。現在のピクセルが走査線の最後のピクセルである場合、「イエス」分岐は、ステップ426から、間引き画像回路52が次の走査線を待機するステップ402に続く。
【0118】
ルーチン94について図14に描かれるステップが実行された後、マルチ解像度ラベルロケータシステムは、間引き画像選択ルーチン92のステップに従ってデータの処理を続ける。図15は、図4の間引き画像選択ルーチン96のためにコンピュータによって実現されるプロセスを描く。
【0119】
ステップ500は、ルーチン96の第1ステップである。図15のステップ500では、アドレスカウンタはゼロに等しく設定される。ステップ502では、ピーク値変数及びピークビン変数がゼロに等しく設定される。ステップ504では、ビン値は、アドレス[アドレスカウンタ]でRAM Bのコンテンツを加えた、アドレス[アドレスカウンタ]でのRAM Aのコンテンツに等しく設定される。
【0120】
決定ステップ506では、間引き画像回路52が、ビン値がピーク値より大きいかどうかを判断する。ステップ506に対する照会がイエスである場合、「イエス」分岐が、ピーク値がビン値に等しく設定され、ピークビン値がアドレスカウンタMOD255に等しく設定されるステップ508に続く。
【0121】
ステップ506に対する照会がノーである場合、「ノー」分岐が、アドレスカウンタが最大値に等しいかどうかが判断される決定ステップ510に続く。決定ステップ510に対する照会がイエスである場合には、「イエス」分岐は、プロセスが続行するところに続く。ステップ510に対する照会がノーである場合、「ノー」分岐は、可変アドレスカウンタMOD255がゼロに等しく設定されるかどうかが判断される決定ステップ512に続く。
【0122】
決定ステップ512に対する照会がイエスである場合、「イエス」分岐は、セル値がアドレスカウンタに等しく設定され、ピーク値がピークビン値に等しく設定されるステップ514に続く。ステップ514から、間引き画像回路52は、ステップ502に移動する。
【0123】
決定ステップ512がノーである場合には、「ノー」分岐は、アドレスカウンタが1増分されるステップ516まで続けられる。ステップ516から、間引き画像回路52は、ステップ504まで遡る。前記に概略されたステップに従ってデータを処理した後で、マルチ解像度ラベルロケータシステムは、図5に描かれるように間引き画像54を生成する。
【0124】
セグメント化された画像処理
図16は、図6のセグメント化された画像56を生成する、図4のルーチン98のためにコンピュータによって実現されるプロセスを示す。ルーチン98は、マルチ解像度ラベルロケータプログラム36が、図5の間引き画像54のヒストグラムを計算する、図16のステップ600で開始される。
【0125】
ステップ600に続いて、ステップ602では、マルチ解像度ラベルロケータプログラム36が、曲線を作成するために、部分に関して線形様式でヒストグラムのピークを連結する。マルチ解像度ラベルロケータプログラムは、ステップ602で濾波の2つの段階を実行する。第1に、マルチ解像度ラベルロケータプログラム36が、低域フィルタを利用することによってステップ600で計算されるヒストグラムを濾波する。低域フィルタは、低エネルギー発振を除去し、ステップ600で計算されるヒストグラムを平滑化するために七(7)ピクセル移動ウィンドウまたは包絡線のアプリケーションを含む。次に、マルチ解像度ラベルロケータプログラム36は、濾波されたデータをさらに処理するために、第2段階として適応移動ウィンドウフィルタを適用する。
【0126】
図17は、図16のステップ602で利用される平滑化包絡線または低域フィルタを示すグラフである。好ましい実施形態のグラフの横座標は、間引き画像54のピクセルの光強度を表すが、縦座標は、ある特定の光強度の発生/ピクセル/ヒストグラムの数を表す。光強度以外のそれ以外の測定パラメータは、本発明の範囲を超えるものではない。例えば、マルチ解像度ロケータシステムが色イメージングを利用するときの、色に基づいたヒストグラム/グラフが利用できるだろう。マルチ解像度ラベルロケータプログラム36は、低エネルギー発振を除去し、ヒストグラムを平滑化するために、七(7)ピクセル移動ウィンドウまたは包絡線を適用する。
【0127】
次に、マルチ解像度ラベルロケータプログラム36は、左から右へ曲線に沿って移動することを含む適応移動ウィンドウ濾波プロセスを用いる。ヒストグラムが連続点ごとに発振する場合、中間点の値は2つの隣接する点の平均に等しい。したがって、Hi+1=0.5x(h+hi+2)であり、ここではHは点iでのヒストグラム値である。このプロセスは、曲線の粗い領域を平滑化する2点移動平均である。
【0128】
適応移動ウィンドウ濾波プロセスが完了された後、マルチ解像度ラベルロケータプログラム36は、ステップ604まで処理を続行する。ステップ604では、マルチ解像度ラベルロケータプログラム36は、図18で描かれるように、濾波されたヒストグラムのピークを特定する。図示される例では、図18の濾波されたヒストグラムのピークは、間引き画像54の接続される構成要素に対応する。
【0129】
図18に示されるように、マルチ解像度ラベルロケータプログラム36は、最高ピークから最低ピークまでの順序でピークごとに検索する。点Hは、下方傾斜について、D>12及びD>10及びH>20の場合、あるいはD>5及びD>2及びH>8及びV<30の場合、あるいはi=255の場合、あるいはh=−1(hはピクセル値iでのヒストグラム値である)の場合に、低い点と見なされる。点Hは、上方傾斜について、H>12及びV<5の場合、あるいはH>10及びD>20及びV<10の場合、あるいはi=255の場合、あるいはH=1の場合、あるいはH>80及びD>1及びV<8の場合、あるいはH>5及びD>5及びV<2の場合に低い点と見なされる。
【0130】
決定ステップ606では、マルチ解像度ラベルロケータプログラム36が、ある領域についてのピーク数が10より大きいかどうかを、該領域の高さが三(3)ピクセル未満である場合、あるいは面積が三十(30)ピクセル未満である場合に判断する。ピーク、高さ、及び面積のこれらの値は、マルチ解像度ロケータシステムの応用例に依存している。言い換えると、これらの値は、関心のある特徴の特定のサイズについて修正できる。例えば、マルチ解像度ロケータが、回路基板上で特定のサイズに作られたマイクロチップを検索する場合、値は、該特定のマイクロチップのサイズについて修正されるだろう。
【0131】
ステップ606の照会がイエスである場合には、「イエス」分岐が、このデータが保存されるステップ608に続く。ステップ610では、ピークは削除され、マルチ解像度ラベルロケータプログラム36がステップ604に戻る。ステップ606の照会がノーである場合、「ノー」分岐はステップ612まで戻る。
【0132】
ステップ612では、マルチ解像度ラベルロケータプログラム36は、間引き画像54に対応する空の画像の中に、濾波されたヒストグラムの各ピーク領域内のピクセルを写像することによって(図6に描かれるような)セグメント化された画像56を生成する。該セグメント化された画像は、典型的には、候補領域つまりBLOBSi−nを表示するだろう。ステップ614では、マルチ解像度ラベルロケータプログラム36が、候補領域を表す連結された構成要素25B、40B,42B、44B及び46Bを作成するために、SRIインターナショナル(SRI International)から入手できるもののような連結された構成要素関数を利用する。SRI関数は、類似するピクセル強さを有するセグメント化画像54内の領域を接続する。SRI関数は、さらに、連結された構成要素25B、40B、42B、44B及び46Bを境界線で囲む有界ウィンドウ25C、40C、42C、44C及び46Cを生成する。
【0133】
複合画像処理
図6のルーチン98の結果として図6のセグメント化された画像56を生成した後に、マルチ解像度ラベルロケータは、図19のルーチン100を続行する。ルーチン100は、ステップ700を開始し、このステップ700では、マルチ解像度ラベルロケータプログラム36が、エッジ発生画像58のラベル候補領域25D、40D、42D、44D、及び46Dと、セグメント化された画像56の有界ウィンドウ25C、40C、42C、44C及び46Cを結合する。ステップ702では、図6の有界ウィンドウ25C、40C、42C、44C及び46Cが、図8の複合画像60を生成するために、図7のエッジ発生画像58の中に写像される。
【0134】
ステップ704では、マルチ解像度ラベルロケータプログラム36が、有界ウィンドウ特性に基づいた特徴値を抽出する。有界ウィンドウ特徴値は、以下を含む。つまり、セグメント化された画像によって定められる高さに対する、有界ウィンドウによって定められる高さの比率を表す正規化された高さ(X/Hであり、ここではXが有界ウィンドウの高さであり、Hがセグメント化された画像56によって定められる高さである)、セグメント化された画像によって定められる幅に対する、有界ウィンドウによって定められる幅の比率を表す正規化された幅(X/Wであり、ここではXは有界ウィンドウの幅であり、Wはセグメント化された幅56によって定められる幅である)、セグメント化された画像によって定められる面積に対する、有界ウィンドウによって定められる面積の比率を表す正規化された面積(X /HW)、及び有界ウィンドウによって定められる高さに対する、有界ウィンドウによって定められる幅の比率を表すアスペクト比である。
【0135】
図20の有界ウィンドウ10は、ピーク領域隔離データ12が、有界ウィンドウ10によって含まれるセグメント化された画像56に写像された。有界ウィンドウ10のアスペクト比は、以下のとおりに計算される。つまり、X>=Xである場合、X/Xであり、それ以外の場合はX/Xが使用される。
【0136】
上記に注記されたように、マルチ解像度ラベルロケータプログラム36が、有界ウィンドウ特徴に基づいて特徴値を抽出する。しかしながら、特徴値は、以下のどれか1つを含むことがある。つまり、有界ウィンドウ内のセルの総数に対する、有界ウィンドウ内のセルの特徴値の合計の比率を表す正規化された特徴強さT、及び有界ウィンドウによって定められる領域に対する、有界ウィンドウ内のセルについての合計されたエッジ発生値の合計の比率を表す正規化されたエッジ発生強さIである。
【0137】
いったんマルチ解像度ラベルロケータプログラム36が、有界ウィンドウ特性に基づいて特徴値を抽出すると、ステップ706内のプログラム36が、ラベル候補領域ごとにベクタVをアセンブルする。ベクタVは、有界ウィンドウ特性に基づいたものを含む複数の特徴値、及び光強度などの有界ウィンドウ特性に基づかない値に基づく。プログラム36は、ある特定のラベル候補領域が実際の宛て先住所ラベルを含みそうかどうか判断するために、事前選別器ルーチン102及び選別器ルーチン104でベクタVを利用する。
【0138】
事前選別器ルーチン
図21は、図4の事前選別器ルーチン102のコンピュータによって実現されるプロセスを描く。ステップ800は、ルーチン102の第1ステップである。ステップ800では、マルチ解像度ラベルロケータプログラム36が、事前に定められる最小閾値以下の領域を画定する対応する有界ウィンドウを有する1つまたは複数のブロッブまたはラベル候補領域を排除する。ラベル候補領域は、長さXと幅Xを有する辺によって求められる。マルチ解像度ラベルロケータプログラム36が、このような領域が20のような値を下回る場合に、候補領域を排除することができる。当業者は、これらの閾値が、マルチ解像度ロケータシステムのアプリケーションに基づいて変化できることを認識するだろう。例えば、マルチ解像度ラベルロケータシステムは、事前に定められた長さ及び幅を有する回路基板上で特定のリード線を特定するように設計できるだろう。このようなケースでは、閾値は、関心のあるリード線の長さ及び幅に基づくだろう。
【0139】
ステップ802では、マルチ解像度ラベルロケータプログラム36が、事前に定められる最大閾値を超える領域を画定する対応する有界ウィンドウを有する1つまたは複数のブロッブまたは候補領域を排除する。例えば、マルチ解像度ラベルロケータプログラム36は、このような領域が、画像の寸法、ピクセル間隔等という点からアドレスラベルを多分有さないために、1600より大きい値を有するラベル候補領域を排除することができる。アドレスラベルは、典型的には、1600(好ましい実施形態の3DPI画像での約40平方インチ)未満である有界ウィンドウ面積を有する。
【0140】
ステップ804では、マルチ解像度ラベルロケータプログラム36は、事前に定められた最小値及び最大値の間に該当する面積を有する、予想されたラベルの大きさに作られる候補領域またはブロッブを抽出することができる。例えば、このような最小値は、20(約4.5平方インチ)となるだろうが、最大閾値は1024(約32平方インチ)となるだろう。
【0141】
ステップ806では、マルチ解像度ラベルロケータプログラム36は、対応する候補領域の光強度特徴値について計算された重心を中心にして置かれる事前に定められたサイズを有する有界ウィンドウに相当するために、1つまたは複数の候補領域またはブロッブをトリミングする。ステップ806では、マルチ解像度ラベルロケータプログラム36は、エッジ発生密度が最高のa´潜在候補領域の回りで切削するために重心サブルーチンを呼び出す。好ましい実施形態の場合、最高エッジ発生は、向きの最も等しい分散だろう。それから、マルチ解像度ラベルロケータプログラム36は、変数VBi−mが、ある特定のブロッブまたは潜在的なラベル候補領域の特徴ベクタを表す、出力ボックス808に進む。
【0142】
分類ルーチン
図21に描かれる事前分類プロセスを完了後、マルチ解像度ラベルロケータプログラム36は、図22に示されるように分類ルーチン104を開始する。ステップ900は、ルーチン104の第1ステップである。ステップ900では、マルチ解像度ラベルロケータプログラム36が、有界ウィンドウ特性に基づくことがある特徴値の1つまたは複数に対応する絶対決定値またはエラーを計算する。前述したように、有界ウィンドウ特徴値は、有界ウィンドウのアスペクト比であってよい。それから、このアスペクト比が、予想される大きさに作られる住所ラベルの予想されるアスペクト比または典型的なアスペクト比に比較される。
【0143】
有界ウィンドウ特徴値は、ラベル候補領域の寸法に関係するが、その他の特徴値特性は、ビデオカメラによって検出可能な画像パラメータに関係してよい。例えば、1つの特徴値は、エッジ発生画像58内の候補領域の正規化されるエッジ発生密度である。それから、この正規化されたエッジ発生密度が、予想されるエッジ発生密度に比較される。別の特徴値は、正規化された光強度である場合がある。潜在的な候補領域のこの正規化された光強度は、ラベルの間引き画像54の予想光強度に比較される。
【0144】
ステップ900で計算される絶対値決定エラー値は、以下のとおりに要約できる。
【0145】
アスペクト比絶対決定エラーe
=|X/X−R
ここで、Rは、予想アスペクト比または典型的なアスペクト比である。住所ラベルについて、この値は、1.5として求められた。X/Xは、特定のブロッブまたはラベル候補領域の有界ウィンドウのアスペクト比である(有界ウィンドウの長さ及び幅の寸法XとXについて、図20を参照すること)。
【0146】
エッジ発生絶対決定エラーe
=|T/N−T
ここで、Tは、予想されるエッジ発生密度である。住所ラベルについて、Tは、1.0として求められた。T/Nは、潜在的な候補領域のエッジ発生密度である。
【0147】
グレースケール光強度絶対決定エラーe
EI=|I/n−I
ここで、Iは、間引き画像54の予想される光強度である。ラベル環境のためのIの予想値は255である。I/Nは、特定のブロッブまたはラベル候補領域の光強度である。
【0148】
正規化された寸法絶対決定エラーe
D1=最大(|d−l|)
D2=最大(|d−l|)であり、この場合、dとdはラベル候補領域の正規化された寸法である。
【0149】
=X/W
=X/W
この場合、X及びXは、有界ウィンドウの長さ及び幅の寸法であるが、Wは間引き画像54の幅である。
【0150】
とlは、予想される正規化寸法である。
【0151】
ここで、d<dであるならば、l=20/W及びl=22/Wである。あるいは、d>dであるならば、l=22/W、及びl=20/Wである。
【0152】
ステップ900の絶対決定エラーを計算した後に、マルチ解像度ラベルロケータプログラム36がステップ902まで続行する。ステップ902では、マルチ解像度ラベルロケータプログラム36が4つのエラーコード(C、C,C,C)を各ラベル候補領域に割り当てる。コード(C,C,C,C)のそれぞれは、ステップ900の決定エラー値を含む計算に基づいた値を有する。当業者は、これらのエラーコード値が、マルチ解像度ロケータシステム用のアプリケーションの種類に依存して調整することができることを認識するだろう。
以下が、エラーコードを求めるための等式である。
【0153】
アスペクト比エラーコードC
1 e<=1.5
= 0 1.5<e<=2.5
−1 e>2.5
エッジ発生エラーコードC
1 e<=0.667
= 0 0.667<e<=0.800
−1 e>0.800
グレースケール光強度エラーコードC
1 e>=I
= 0 e<I
−1 I<e<I
=0.2ダイナミック範囲及びIw=0.5ダイナミック範囲
正規化された寸法エラーコードCD:
1 eD1<1及びeD2<=1
= 0 それ以外の場合
−1 eD1>=|X−24|eD2>=|X−24|
ステップ902のエラーコードを計算した後、マルチ解像度ラベルロケータプログラム36は、ステップ904まで続行する。ステップ904では、マルチ解像度ラベルロケータプログラム36が、ステップ902で計算されるエラーコードCに基づいて、各ラベル候補領域にクラス「S」を割り当てる。クラス「S」値は、以下の通りに計算される。
【0154】
クラス「S」値:
1 C=1及びC=1の場合
S= 0 C=0及びC=1ならびにC=−1の場合、あるいは
=1及びC=0ならびにC−1の場合、あるいは
=1及びC=−1、及びC=1の場合、あるいは
=−1及びC=1及びC=−1の場合
−1 それ以外の場合
マルチ解像度ラベルロケータプログラム36が、各ラベル候補領域にクラス「S」値を割り当てるのを終了すると、それはステップ906に進む。ステップ906では、各ラベル候補領域にエラー表座標値Jが割り当てられる。各エラー表座標値Jは、以下の通りに計算される。
【0155】
エラー表座標値J:
11 C=1及びC=1の場合
0 C=0及びC=1及びC=−1の場合
J= 1 C=1及びC=0及びC=−1の場合
2 C=−1及びC=1の場合
3 C=1及びC=−1及びC=1の場合
−1 それ以外の場合
エラー表座標値Jを各ラベル候補領域に割り当てた後、マルチ解像度ラベルロケータプログラム36は、−1に等しいクラスSを有するラベル候補領域を排除する。いったんプログラム36が、−1に等しいクラスS値を有するラベル候補領域の排除を実行すると、プログラム36はステップ908に進む。
【0156】
ステップ908では、マルチ解像度ラベルロケータプログラム36が、以下の規則に従って1または0に等しいクラスS値を有するラベル候補量伊沖ごとに相対決定エラーEを計算する。
【0157】
規則(1):
クラスS値=1を有するラベル候補領域の特徴ベクタVの相対エラーEは、クラスS値=0を有するラベル候補領域の特徴ベクタVの相対エラーより小さいとして分類される。
【0158】
規則(2):
クラスS値=1を有するラベル候補領域の特徴ベクタVの相対エラーEは、そのエッジ発生絶対決定エラーeに等しく設定される。
【0159】
規則(3):
クラスS値=0を有するラベル候補領域の特徴ベクタVの相対エラーEは、以下の通りに計算される。
【0160】
マルチ解像度ラベルロケータプログラム36は、1組のラベル候補領域のどの一方がより小さい相対エラーEを有するのかを判断するために、ラベル候補領域のそれぞれの組の特徴ベクタV、Vの組を比較することによって、クラスS値を有するラベル候補領域の相対エラーEを求める。プログラム36は、エラーインデックス値Lを求めるためにラベル候補領域のそれぞれの組の各ラベル候補領域からエラー表座標値Jを利用する。例えば、1組のラベル候補領域のエラーインデックス値Lは、表6に存在するエラーインデックス値の適切な場所を提供する2つのエラー表座標値(第1ラベル候補領域からのJと第2ラベル候補領域からのJ)を利用することによって求められる。
【0161】
【表6】
Figure 2003518300
【0162】
1組のラベル候補候補領域について表6からエラーインデックスLを求めた後、プログラム36は、以下の基準に基づいて1組のラベル候補領域のそれぞれについて相対エラーEを求める。
【0163】
L=1の場合には、相対エラーE=エッジ発生絶対決定エラーeTiであり、この場合、Eは、ラベル候補領域の特徴ベクタVの相対エラーであり、この場合、i=2は、ラベル候補領域のそれぞれの組のそれぞれを示す。
【0164】
L=3の場合には、相対エラーE=グレースケール光強度絶対決定エラーeIiである。
【0165】
L=4の場合には、相対エラーE(エッジ発生絶対決定エラーeTi+アスペクト比絶対決定エラーe)である。
【0166】
L=5及びJ=0、及び正規化寸法エラーコードCD2=1の場合、またはL=5及びJ=2及び正規化寸法エラーコードCD1≠1の場合には、E<Eである。それ以外の場合には、E>Eである。
【0167】
L=6及びJ=3及びグレースケール光強度エラーコードCI1=1の場合、E=0.5(グレースケール光強度絶対決定エラーeI1+アスペクト比絶対決定エラーeR1)である。
【0168】
L=6及びJ=2及びグレースケール光強度エラーコードCI2=1の場合には、E=0.5(グレースケール光強度絶対決定エラーeI2+アスペクト比絶対決定エラーeR2)である。
【0169】
L=8及びJ=2及びグレースケール光強度エラーコードCI2=1の場合にはE<Eである。それ以外の場合、E>Eである。
【0170】
ステップ908のラベル候補ごとに相対エラーEを計算した後、プログラム36はステップ910に続行する。ステップ910では、プログラム36は、重複するラベル候補領域を排除する。ラベル候補領域は、それぞれのラベル候補領域が、八十五パーセント(85%)別のラベル候補領域の各寸法に沿って重複する場合に、重複していると見なされる。この重複基準を満たすラベル候補領域の場合、プログラム36は、以下の基準に従って2つの重複するラベル候補領域の一方を排除する。
【0171】
重複するラベル候補領域の一方がS=1という割り当てられたクラス値を有し、他方のラベル候補領域がS=0というクラス値を有する場合、プログラム36は、クラス値S=0を有する領域を排除するだろう。それ以外の場合、プログラム36は、さらに大きな相対エラーEを有する候補領域を排除する。
【0172】
ステップ912では、マルチ解像度ラベルロケータプログラム36が、以下の基準に従った住所ラベルを最も含んでいそうなラベル候補領域を特定し、リストする。クラスS値=1を有する4つ以上のラベル候補領域がある場合には、該3つの最小相対エラーEラベル候補領域を、ラベルを最も含んでいそうなラベル候補領域として示す。クラスS値=1を有する2つまたは3つのラベル候補領域がある場合には、ラベル候補領域のこのグループを、住所ラベルを最も含んでいそうなラベル候補領域として示す。言い換えると、S=1の3つ未満の候補がある場合には、クラスS値=0である最小相対エラー候補で、ラベル候補を突き合わせる。ラベル候補領域がない場合、あるいはクラスS=0を有する1つのラベル候補領域がある場合には、クラスS=1を有するすべてのラベル候補領域クラスS=0を有する最小相対エラーEラベル候補を、住所ラベルを最も含んでいそうなラベル候補領域として示す。クラスS値=1または=0を有する候補がある場合には、候補はラベルではない。
【0173】
ラベル候補領域の優先順位が付けられたリストの出力
プログラム36が、リスト及び選択プロセスをステップ912で終了した後、プログラム36はルーチン106まで続行する。ルーチン106では、マルチ解像度ラベルロケータシステムは、ディスプレイデバイスまたは(プリンタなどの)その他の出力装置に、住所ラベルを最も含んでいそうなラベル候補領域の優先順位が付けられたリストを出力する。ラベル候補領域のこの優先順位が付けられたリストを使用すると、自動化された荷物分類システムは、低いダイナミック範囲を有する画像について約九十パーセント(90%)の精度率で、毎秒25個のパッケージという平均速度で荷物パッケージを処理することができる。高いダイナミック範囲の画像については、荷物仕分けシステムは、約九十五パーセント(95%)という精度で荷物パッケージを処理することができる。
【0174】
本発明は、荷物処理または仕分け制度を高めるが、マルチ解像度ロケータシステムのその他の応用例または実施の形態は、本発明の範囲を超えていない。その他の応用例または実施の形態は、以下を含むが、以下に限られていない。つまり、プリント回路基板上のリード線またはマイクロチップを特定すること、荷物上の蛍光マーキングを特定すること、郵便料金別納等を示すことのある六角形などの荷物上の特定の形状を特定すること、ビデオ画像処理によって検出可能なひび割れまたはその他の毛間などの製品の欠陥の位置を決めること、色付き織物の製造において欠陥を特定すること、及び対象の視覚的な特性がビデオ画像処理によって容易に検出可能であるその他の類似した環境である。
【0175】
前述されたように、マルチ解像度ラベルロケータシステム20の好ましい実施の形態は、走査された画像に基づいた所定数の候補ラベル場所を出力する。本発明が、基板上の関心のある特性を有する証印の位置を決めるための改善された方法及び装置を提供することが理解されるだろう。多くのそれ以外の変型及び追加の特徴は、発明の実施の形態の例の先行する説明という点で明らかになるだろう。したがって、前記が本発明の実施形態の例だけに関係し、多数の変更が、特許請求の範囲により定められるような発明の概念及び範囲から逸脱することなくなされてもよいことが理解されであろう。
【図面の簡単な説明】
【図1】
図1は本発明の実施の形態の例に動作環境を提供するベルト上マルチ解像度ラベルロケータシステムの機能ブロック図である。
【図2】
図2はマルチ解像度ラベルロケータシステムにとって関心のある基板を描くブロック図である。
【図3】
図3は本発明の実施の形態の例によるマルチ解像度ラベルロケータシステムを描く機能ブロック図である。
【図4】
図4はマルチ解像度ラベルロケータシステムのハードウェア及びソフトウェアを特定するさらに詳細な論理流れ図である。
【図5】
図5は関心のある荷物の基板の画像の間引き画像を描く図である。
【図6】
図6は間引き画像から生成されるセグメント化された画像を描く図である。
【図7】
図7はマルチ解像度ラベルロケータシステムのビデオ画像プロセッサの内の1つによって生成されるエッジ発生画像を描く図である。
【図8】
図8はセグメント化された画像からエッジ発生画像に写像されている有界ウィンドウを描く図である。
【図9A】
図9Aは黒/白バイナリ画像の中に、カメラから生成された元の高解像度画像を閾値によってエッジを検出するためのハードウェアの機能ブロック図である。
【図9B】
図9Bは図9Aの黒/白バイナリ画像ハードウェア用の黒と白の閾値論理を記述する図である。
【図10】
図10はエッジ発生画像を生成するためのハードウェアを描く機能ブロック図である。
【図11】
図11はマルチ解像度ラベルロケータシステムの間引き画像の生成を担当するハードウェアの機能ブロック図である。
【図12】
図12はエッジ発生画像のセル内のバイナリ化されたピクセル値の間で予想される向きの遷移を特定するためのプロセスを描く論理流れ図である。
【図13】
図13はエッジ発生画像内の遷移に基づいてセルの合計されたエッジ発生値を計算するためのプロセスを描く論理流れ図である。
【図14】
図14は間引き画像の各セル内で発生するピクセル値のヒストグラムを計算することにより、間引き画像を作成するためのプロセスを描く論理流れ図である。
【図15】
図15は間引き画像の各セルのヒストグラム内でピークを見つけるためのプロセスを描く論理流れ図である。
【図16】
図16は基板上の証印の予想される特性に対応する特性を有する間引き画像内で1つまたは複数の候補領域を特定するためのプロセスを描く、論理流れ図である。
【図17】
図17は間引き画像のヒストグラムを描く図である。
【図18】
図18は高い点と低い点によって間引き画像のヒストグラムがどのようにして求められるのかを描くグラフである。
【図19】
図19は間引き画像の特性、及び関心のある特性に対応するエッジ発生画像特性を有する入力画像内で1つまたは複数の候補領域を特定するためのプロセスを描く論理流れ図である。
【図20】
図20はセグメント化された画像内の各接続された構成要素の回りに形成される有界ウィンドウを描く図である。
【図21】
図21は資格のグループを適用することにより、候補領域を事前に分類するためのプロセスを描く論理流れ図である。
【図22】
図22は1つまたは複数の特徴ベクタを有する候補領域をリストするためのプロセスを描く論理流れ図である。
JP2001547342A 1999-12-03 2000-11-29 マルチ解像度ラベルロケータ Expired - Fee Related JP3910447B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US09/454,090 US6728391B1 (en) 1999-12-03 1999-12-03 Multi-resolution label locator
US09/454,090 1999-12-03
PCT/US2000/042360 WO2001046899A2 (en) 1999-12-03 2000-11-29 Multi-resolution label locator

Publications (3)

Publication Number Publication Date
JP2003518300A JP2003518300A (ja) 2003-06-03
JP2003518300A5 true JP2003518300A5 (ja) 2006-05-18
JP3910447B2 JP3910447B2 (ja) 2007-04-25

Family

ID=23803262

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001547342A Expired - Fee Related JP3910447B2 (ja) 1999-12-03 2000-11-29 マルチ解像度ラベルロケータ

Country Status (10)

Country Link
US (1) US6728391B1 (ja)
EP (1) EP1234273B1 (ja)
JP (1) JP3910447B2 (ja)
CN (1) CN100334591C (ja)
AT (1) ATE279757T1 (ja)
CA (1) CA2392987C (ja)
DE (1) DE60014959T2 (ja)
DK (1) DK1234273T3 (ja)
ES (1) ES2231309T3 (ja)
WO (1) WO2001046899A2 (ja)

Families Citing this family (53)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6728391B1 (en) 1999-12-03 2004-04-27 United Parcel Service Of America, Inc. Multi-resolution label locator
US7672022B1 (en) * 2000-04-07 2010-03-02 Hewlett-Packard Development Company, L.P. Methods and apparatus for analyzing an image
FR2812226B1 (fr) * 2000-07-25 2002-12-13 Mannesmann Dematic Postal Automation Sa Procede de traitement d'objets postaux de grande taille dans une installation de tri
US6829369B2 (en) * 2001-05-18 2004-12-07 Lockheed Martin Corporation Coding depth file and method of postal address processing using a coding depth file
US6834807B2 (en) 2001-07-13 2004-12-28 Hand Held Products, Inc. Optical reader having a color imager
US7474781B2 (en) * 2001-09-20 2009-01-06 International Business Machines Corporation Image based bar-code reading and robotic registration apparatus for use in automated tape library systems
JP3898075B2 (ja) * 2002-03-18 2007-03-28 株式会社リコー 画像処理装置、画像処理方法及び記録媒体
US7284230B2 (en) * 2003-10-30 2007-10-16 International Business Machines Corporation System for search and analysis of systematic defects in integrated circuits
IL162878A0 (en) * 2004-07-06 2005-11-20 Hi Tech Solutions Ltd Multi-level neural network based characters identification method and system
US7249717B2 (en) * 2004-12-10 2007-07-31 Mitek Systems, Inc. System and method for check fraud detection using signature validation
US7110605B2 (en) * 2005-02-04 2006-09-19 Dts Az Research, Llc Digital intermediate (DI) processing and distribution with scalable compression in the post-production of motion pictures
US7568628B2 (en) 2005-03-11 2009-08-04 Hand Held Products, Inc. Bar code reading device with global electronic shutter control
US7780089B2 (en) 2005-06-03 2010-08-24 Hand Held Products, Inc. Digital picture taking optical reader having hybrid monochrome and color image sensor array
US7611060B2 (en) 2005-03-11 2009-11-03 Hand Held Products, Inc. System and method to automatically focus an image reader
US7165015B2 (en) * 2005-03-29 2007-01-16 Cryovac, Inc. Handheld device for retrieving and analyzing data from an electronic monitoring device
US7809158B2 (en) * 2005-05-02 2010-10-05 Siemens Industry, Inc. Method and apparatus for detecting doubles in a singulated stream of flat articles
US7770799B2 (en) 2005-06-03 2010-08-10 Hand Held Products, Inc. Optical reader having reduced specular reflection read failures
DE602006011422D1 (ja) * 2006-02-15 2010-02-11 Sony Deutschland Gmbh
US7889932B2 (en) * 2006-03-02 2011-02-15 Sharp Laboratories Of America, Inc. Methods and systems for detecting regions in digital images
US8630498B2 (en) * 2006-03-02 2014-01-14 Sharp Laboratories Of America, Inc. Methods and systems for detecting pictorial regions in digital images
US7792359B2 (en) 2006-03-02 2010-09-07 Sharp Laboratories Of America, Inc. Methods and systems for detecting regions in digital images
US7813547B1 (en) 2006-04-05 2010-10-12 Unisys Corporation Apparatus and method for detection and analysis of imagery
US8437054B2 (en) * 2006-06-15 2013-05-07 Sharp Laboratories Of America, Inc. Methods and systems for identifying regions of substantially uniform color in a digital image
US7864365B2 (en) * 2006-06-15 2011-01-04 Sharp Laboratories Of America, Inc. Methods and systems for segmenting a digital image into regions
US20080008378A1 (en) * 2006-07-07 2008-01-10 Lockheed Martin Corporation Arbitration system for determining the orientation of an envelope from a plurality of classifiers
US7876959B2 (en) * 2006-09-06 2011-01-25 Sharp Laboratories Of America, Inc. Methods and systems for identifying text in digital images
US20080101703A1 (en) * 2006-10-30 2008-05-01 Lockheed Martin Corporation Systems and methods for recognizing shapes in an image
US8279889B2 (en) * 2007-01-04 2012-10-02 Qualcomm Incorporated Systems and methods for dimming a first packet associated with a first bit rate to a second packet associated with a second bit rate
US7775431B2 (en) * 2007-01-17 2010-08-17 Metrologic Instruments, Inc. Method of and apparatus for shipping, tracking and delivering a shipment of packages employing the capture of shipping document images and recognition-processing thereof initiated from the point of shipment pickup and completed while the shipment is being transported to its first scanning point to facilitate early customs clearance processing and shorten the delivery time of packages to point of destination
US8630491B2 (en) 2007-05-03 2014-01-14 Andrew Longacre, Jr. System and method to manipulate an image
US20080298635A1 (en) * 2007-05-29 2008-12-04 West William M Method for identifying images using fixtureless tracking and system for performing same
US9424488B2 (en) * 2007-06-14 2016-08-23 Hewlett-Packard Development Company, L.P. Applying a segmentation engine to different mappings of a digital image
US20090041344A1 (en) * 2007-08-08 2009-02-12 Richard John Campbell Methods and Systems for Determining a Background Color in a Digital Image
US8249366B2 (en) * 2008-06-16 2012-08-21 Microsoft Corporation Multi-label multi-instance learning for image classification
JP2010073047A (ja) * 2008-09-19 2010-04-02 Toshiba Corp 情報処理装置およびプログラム
TWI384427B (zh) * 2009-04-29 2013-02-01 Utechzone Co Ltd Background establishment method and device
JP5574622B2 (ja) * 2009-05-22 2014-08-20 株式会社東芝 紙葉類処理装置および紙葉類処理方法
JP2012194705A (ja) * 2011-03-15 2012-10-11 Omron Corp 画像処理装置、画像処理方法および画像処理プログラム
US8818023B2 (en) * 2011-03-25 2014-08-26 Siemens Industry, Inc. Bulk region of interest learning
US20120250985A1 (en) * 2011-03-30 2012-10-04 Jing Xiao Context Constraints for Correcting Mis-Detection of Text Contents in Scanned Images
US9218536B2 (en) * 2011-12-23 2015-12-22 Cognex Corporation Methods and apparatus for one-dimensional signal extraction
US9157855B2 (en) * 2013-09-06 2015-10-13 Canon Kabushiki Kaisha Material classification
JP6203084B2 (ja) * 2014-03-06 2017-09-27 株式会社東芝 配達物区分処理システム、および配達物区分処理方法
US9483704B2 (en) * 2014-12-10 2016-11-01 Ricoh Co., Ltd. Realogram scene analysis of images: superpixel scene analysis
US11126950B2 (en) 2015-03-18 2021-09-21 United Parcel Service Of America, Inc. Systems and methods for verifying the contents of a shipment
KR102507383B1 (ko) * 2016-11-08 2023-03-08 한국전자통신연구원 직사각형 윈도우를 이용한 스테레오 정합 방법 및 스테레오 정합 시스템
CN108121982B (zh) * 2016-11-30 2020-02-07 杭州海康机器人技术有限公司 面单图像的获取方法及装置
EP3610269A4 (en) * 2017-04-13 2020-04-22 Siemens Healthcare Diagnostics Inc. METHODS AND APPARATUS FOR DETERMINING THE NUMBER OF MARKERS DURING A SAMPLE CHARACTERIZATION
DE102017217242B4 (de) * 2017-09-27 2024-03-28 Deutsche Post Ag Verfahren und System zur Kennzeichnung von Sendungseinheiten
US10803542B2 (en) * 2018-09-14 2020-10-13 Buildinglink.com LLC Physical asset recognition platform
CN109656388B (zh) * 2018-12-19 2022-07-01 湖北银琅兴科技发展有限公司 一种特殊定位光标的制作方法
JP7078791B2 (ja) * 2019-02-19 2022-05-31 株式会社Fuji 基準マーク特定装置、基準マーク特定方法
US10650210B1 (en) 2019-03-18 2020-05-12 Haier Us Appliance Solutions, Inc. Method for authenticating a filter cartridge for a refrigerator appliance

Family Cites Families (48)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3715724A (en) 1969-12-24 1973-02-06 Olivetti & Co Spa Apparatus for recognizing graphic symbols
US3885229A (en) 1972-10-28 1975-05-20 Nippon Electric Co Document scanning apparatus
JPS5295121A (en) 1976-02-06 1977-08-10 Hitachi Ltd Code plate
JPS56129981A (en) 1980-03-14 1981-10-12 Toshiba Corp Optical character reader
JPS5743279A (en) 1980-08-29 1982-03-11 Fujitsu Ltd Method for detecting position of x-y symmetrical body
DE3107521A1 (de) 1981-02-27 1982-09-16 Siemens AG, 1000 Berlin und 8000 München Verfahren zum automatischen erkennen von bild- und text- oder graphikbereichen auf druckvorlagen
DE3373734D1 (en) 1982-01-20 1987-10-22 Nippon Denso Co High-sensitive optical reading apparatus and method of reading optical information
JPS59179691A (ja) 1983-03-31 1984-10-12 Toshiba Ceramics Co Ltd コ−クス炉
US4782221A (en) 1985-04-01 1988-11-01 Cauzin Systems, Incorporated Printed data strip including bit-encoded information and scanner control
EP0198481B1 (en) 1985-04-17 1996-03-13 Hitachi, Ltd. Image processing apparatus
JPS61276080A (ja) 1985-05-31 1986-12-06 Toshiba Corp 上下判定装置
US4742556A (en) 1985-09-16 1988-05-03 Davis Jr Ray E Character recognition method
JPH01137385A (ja) 1987-11-25 1989-05-30 Matsushita Electric Ind Co Ltd 文字認識装置
JP2727549B2 (ja) 1988-01-29 1998-03-11 日本電気株式会社 最適画質選択装置
US5053609A (en) 1988-05-05 1991-10-01 International Data Matrix, Inc. Dynamically variable machine readable binary code and method for reading and producing thereof
US5126542A (en) 1988-05-05 1992-06-30 International Data Matrix, Inc. Dynamically variable machine readable binary code and method for reading and producing thereof
US5124536A (en) 1988-05-05 1992-06-23 International Data Matrix, Inc. Dynamically variable machine readable binary code and method for reading and producing thereof
US4939354A (en) 1988-05-05 1990-07-03 Datacode International, Inc. Dynamically variable machine readable binary code and method for reading and producing thereof
JPH02100575A (ja) 1988-10-07 1990-04-12 Toshiba Corp 画像処理装置
JPH02196565A (ja) 1989-01-25 1990-08-03 Eastman Kodatsuku Japan Kk 画像二値化方式
US5073954A (en) 1989-02-28 1991-12-17 Electrocom Automation, Inc. Bar code location and recognition processing system
JPH087785B2 (ja) 1989-05-16 1996-01-29 松下電器産業株式会社 2値化処理装置
US5068909A (en) 1989-05-18 1991-11-26 Applied Imaging Corporation Method and apparatus for generating quantifiable video displays
DE3942932A1 (de) 1989-12-23 1991-06-27 Licentia Gmbh Verfahren zum verteilen von paketen o. ae.
FR2657982B1 (fr) 1990-02-02 1992-11-27 Cga Hbs Procede de localisation d'adresse sur des articles a trier, etiquette d'adressage et dispositif de mise en óoeuvre du procede.
JP2768786B2 (ja) 1990-02-20 1998-06-25 キヤノン株式会社 画像読み取り装置
US5241166A (en) 1990-07-02 1993-08-31 Chandler Donald G Low resolution target acquisition
US5153418A (en) 1990-10-30 1992-10-06 Omniplanar, Inc. Multiple resolution machine readable symbols
DE69131394T2 (de) 1990-10-30 2000-01-20 Omniplanar Inc Maschinenlesbares Zeichen mit Mehrfachauflösung
US5223701A (en) 1990-10-30 1993-06-29 Ommiplanar Inc. System method and apparatus using multiple resolution machine readable symbols
JPH04268989A (ja) 1991-02-25 1992-09-24 Nippon Steel Corp 文字認識方法及び装置
JPH04268987A (ja) 1991-02-25 1992-09-24 Nippon Steel Corp 文字認識装置
US5278397A (en) 1991-07-25 1994-01-11 Symbol Technologies, Inc. Multi-resolution bar code reader
US5179599A (en) 1991-06-17 1993-01-12 Hewlett-Packard Company Dynamic thresholding system for documents using structural information of the documents
JP2764224B2 (ja) 1993-03-01 1998-06-11 ユナイテツド パーセル サービス オブ アメリカ インコーポレイテツド 補足目標の位置を求める方法および装置
JP2933801B2 (ja) 1993-06-11 1999-08-16 富士通株式会社 文字の切り出し方法及びその装置
US5365597A (en) 1993-06-11 1994-11-15 United Parcel Service Of America, Inc. Method and apparatus for passive autoranging using relaxation
US5434629A (en) * 1993-12-20 1995-07-18 Focus Automation Systems Inc. Real-time line scan processor
US5499060A (en) 1994-01-04 1996-03-12 Texas Instruments Incorporated System and method for processing video data
US5495537A (en) 1994-06-01 1996-02-27 Cognex Corporation Methods and apparatus for machine vision template matching of images predominantly having generally diagonal and elongate features
US5515447A (en) 1994-06-07 1996-05-07 United Parcel Service Of America, Inc. Method and apparatus for locating an acquisition target in two-dimensional images by detecting symmetry in two different directions
CA2211258C (en) 1995-01-31 2000-12-26 United Parcel Service Of America, Inc. Method and apparatus for separating foreground from background in images containing text
US5642442A (en) 1995-04-10 1997-06-24 United Parcel Services Of America, Inc. Method for locating the position and orientation of a fiduciary mark
JP3545506B2 (ja) * 1995-08-21 2004-07-21 株式会社東芝 特定色領域抽出方式および特定色領域除去方式
DE19532842C1 (de) 1995-09-05 1996-12-19 Ibm Bildaufnahmesystem
US6205499B1 (en) * 1998-12-18 2001-03-20 The United States Of America As Represented By The Secretary Of The Navy System for compressing video data using bi-orthogonal wavelet coding having a DSP for adjusting compression ratios to maintain a constant data flow rate of the compressed data
US6343139B1 (en) * 1999-03-12 2002-01-29 International Business Machines Corporation Fast location of address blocks on gray-scale images
US6728391B1 (en) 1999-12-03 2004-04-27 United Parcel Service Of America, Inc. Multi-resolution label locator

Similar Documents

Publication Publication Date Title
JP3910447B2 (ja) マルチ解像度ラベルロケータ
JP2003518300A5 (ja)
US5487115A (en) Method and apparatus for determining the fine angular orientation of bar code symbols in two-dimensional CCD images
US6014450A (en) Method and apparatus for address block location
US5276315A (en) Method and apparatus for processing low resolution images of degraded bar code symbols
JP3124296B2 (ja) 基準マークの位置および方向の検出方法
US6386454B2 (en) Detecting bar code candidates
US6438265B1 (en) Method of binarization in an optical character recognition system
CN1867928A (zh) 用于分析物体轮廓图像的方法与图像处理装置 ,用于检测物体的方法与图像处理装置 ,工业视觉设备 ,智能相机,图像显示器 ,安全系统 ,以及计算机程序产品
CN109949331B (zh) 货箱边缘检测方法及装置
Pölzleitner et al. Real-time surface grading of profiled wooden boards
US5748804A (en) Method and apparatus for processing images with symbols with dense edges
CN109741551B (zh) 一种商品识别结算方法、装置及系统
EP1416421A1 (en) Barcode detection system and corresponding method
US6343139B1 (en) Fast location of address blocks on gray-scale images
US6934413B2 (en) Segmentation of text lines in digitized images
US5438636A (en) Apparatus for simultaneously convolving multiple digital binary images using a single convolver with a binary mask to determine pixel densities
KR100503724B1 (ko) 화상에서의 객체 탐색 방법
CN111386533B (zh) 使用对称定位的空白区域检测和识别图像数据中图形字符表示的方法和装置
JP3268552B2 (ja) 領域抽出方法、宛名領域抽出方法、宛名領域抽出装置、及び画像処理装置
US7058203B2 (en) Region of interest identification using region of adjacent pixels analysis
EP0569982B1 (en) Method and apparatus for processing images with symbols with dense edges
CA2208788C (en) Method and apparatus for simultaneously convolving multiple digital binary images using a single convolver with a binary mask to determine pixel densities
Shimotsuji et al. Robust drawing recognition based on model-guided segmentation
Cracknell et al. A colour classification approach to form dropout