JP2003506767A - 走査イメージを照合するための装置および方法 - Google Patents
走査イメージを照合するための装置および方法Info
- Publication number
- JP2003506767A JP2003506767A JP2001514365A JP2001514365A JP2003506767A JP 2003506767 A JP2003506767 A JP 2003506767A JP 2001514365 A JP2001514365 A JP 2001514365A JP 2001514365 A JP2001514365 A JP 2001514365A JP 2003506767 A JP2003506767 A JP 2003506767A
- Authority
- JP
- Japan
- Prior art keywords
- image
- intensity
- along
- scanned
- card
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 57
- 238000004458 analytical method Methods 0.000 claims abstract description 20
- 238000000926 separation method Methods 0.000 claims abstract description 19
- 238000010937 topological data analysis Methods 0.000 claims abstract description 6
- 238000004519 manufacturing process Methods 0.000 claims description 29
- 238000010606 normalization Methods 0.000 claims description 17
- 238000003860 storage Methods 0.000 claims description 14
- 238000005286 illumination Methods 0.000 claims description 13
- 230000008859 change Effects 0.000 claims description 9
- 238000004590 computer program Methods 0.000 claims description 7
- 230000001747 exhibiting effect Effects 0.000 claims description 3
- 238000010147 laser engraving Methods 0.000 claims description 2
- 238000004422 calculation algorithm Methods 0.000 abstract description 58
- 230000000320 anti-stroke effect Effects 0.000 abstract description 11
- 238000013077 scoring method Methods 0.000 abstract description 3
- 238000013459 approach Methods 0.000 description 18
- 238000012015 optical character recognition Methods 0.000 description 11
- 230000008569 process Effects 0.000 description 10
- 238000003384 imaging method Methods 0.000 description 8
- 238000010586 diagram Methods 0.000 description 7
- 230000000694 effects Effects 0.000 description 7
- 239000003086 colorant Substances 0.000 description 6
- 230000006870 function Effects 0.000 description 6
- 230000007704 transition Effects 0.000 description 6
- 238000013528 artificial neural network Methods 0.000 description 5
- 238000004049 embossing Methods 0.000 description 5
- 238000012545 processing Methods 0.000 description 4
- 230000008901 benefit Effects 0.000 description 3
- 238000013500 data storage Methods 0.000 description 3
- 238000012360 testing method Methods 0.000 description 3
- 238000012795 verification Methods 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 2
- 239000002131 composite material Substances 0.000 description 2
- 238000012937 correction Methods 0.000 description 2
- 239000011888 foil Substances 0.000 description 2
- 238000002156 mixing Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 239000007787 solid Substances 0.000 description 2
- 101000631695 Homo sapiens Succinate dehydrogenase assembly factor 3, mitochondrial Proteins 0.000 description 1
- 102100028996 Succinate dehydrogenase assembly factor 3, mitochondrial Human genes 0.000 description 1
- 239000003795 chemical substances by application Substances 0.000 description 1
- 210000001072 colon Anatomy 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000005530 etching Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000013213 extrapolation Methods 0.000 description 1
- 238000010191 image analysis Methods 0.000 description 1
- 230000001788 irregular Effects 0.000 description 1
- 230000009191 jumping Effects 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 230000001537 neural effect Effects 0.000 description 1
- 239000013643 reference control Substances 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 238000012549 training Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q20/00—Payment architectures, schemes or protocols
- G06Q20/38—Payment protocols; Details thereof
- G06Q20/40—Authorisation, e.g. identification of payer or payee, verification of customer or shop credentials; Review and approval of payers, e.g. check credit lines or negative lists
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/12—Detection or correction of errors, e.g. by rescanning the pattern
- G06V30/133—Evaluation of quality of the acquired characters
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/16—Image preprocessing
- G06V30/162—Quantising the image signal
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- Accounting & Taxation (AREA)
- Multimedia (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Quality & Reliability (AREA)
- Computer Security & Cryptography (AREA)
- Finance (AREA)
- Strategic Management (AREA)
- General Business, Economics & Management (AREA)
- Character Input (AREA)
- Character Discrimination (AREA)
Abstract
(57)【要約】
走査イメージのトポロジカル解析に基づく照合アルゴリズムを利用して走査イメージを照合することが可能な装置および方法、ならびに文字アウトライニング法を伴うアンチストロークスコアリング法を含む改良された2値分離解析に基づく照合アルゴリズムを利用して走査イメージを照合することが可能な装置および方法。
Description
【0001】
(背景)
光学式文字照合(OCV:Optical Character Verification)の業界では、走
査してコンピュータシステム内に取り込んだ個々の文字またはイメージの照合信
頼性が向上されたOCV装置および方法が要求されている。
査してコンピュータシステム内に取り込んだ個々の文字またはイメージの照合信
頼性が向上されたOCV装置および方法が要求されている。
【0002】
具体的には、従来の光学式文字認識(OCR)およびOCVアルゴリズムとは
異なるOCV方法が求められている。従来のアルゴリズムは純然たる2値イメー
ジの解析に基づいている。2値イメージは、2つの色または2つの強度レベルの
みを含むものである。典型的には、これらは白黒イメージとして視覚化される。
すべては黒(1方の階調)か、白(他方の階調)である。中間階調は全く存在し
ない。さらに、従来のOCRおよびOCVアプローチは、主として、走査イメー
ジの前景画素の統計的解析に依存している。
異なるOCV方法が求められている。従来のアルゴリズムは純然たる2値イメー
ジの解析に基づいている。2値イメージは、2つの色または2つの強度レベルの
みを含むものである。典型的には、これらは白黒イメージとして視覚化される。
すべては黒(1方の階調)か、白(他方の階調)である。中間階調は全く存在し
ない。さらに、従来のOCRおよびOCVアプローチは、主として、走査イメー
ジの前景画素の統計的解析に依存している。
【0003】
1つの例は、白色紙上の黒色テキストのOCRのケースである。これらのタイ
プの文書が走査されると(または、これらのイメージが別のやり方によりコンピ
ュータ形式で得られる場合にはいつでも)、グレースケールイメージが通常得ら
れる。グレースケールイメージは「色」を全く持たず、変動するグレーの強度を
含んでいる。白は非常に明るいグレーとして表され、黒は非常に暗いグレーとし
て表される。これら2つの両極端の間にはグレーの多くの中間階調がある。カッ
トオフ値を選択することにより、生のグレースケールイメージを2値フォームに
変換するやり方は当該技術では公知である。カットオフよりも強度が大きいすべ
ての画素は白(考えられる最も明るいグレースケール強度)にされ、他の全画素
は黒(考えられる最も暗いグレースケール強度)にされる。
プの文書が走査されると(または、これらのイメージが別のやり方によりコンピ
ュータ形式で得られる場合にはいつでも)、グレースケールイメージが通常得ら
れる。グレースケールイメージは「色」を全く持たず、変動するグレーの強度を
含んでいる。白は非常に明るいグレーとして表され、黒は非常に暗いグレーとし
て表される。これら2つの両極端の間にはグレーの多くの中間階調がある。カッ
トオフ値を選択することにより、生のグレースケールイメージを2値フォームに
変換するやり方は当該技術では公知である。カットオフよりも強度が大きいすべ
ての画素は白(考えられる最も明るいグレースケール強度)にされ、他の全画素
は黒(考えられる最も暗いグレースケール強度)にされる。
【0004】
「グレースケールカードイメージ」は、一般に商業的に利用可能な任意の従来
の走査システム(例えば、UltraChekIシステム)によって走査されたカードの
イメージである。また、強度正規化アルゴリズムをカードに実行することにより
、カードイメージは、UltraChekIで走査した生のイメージよりも視覚的に若干
良好に見えるようになる。しかし、これは文字イメージ処理に根本的に影響する
ものではない。
の走査システム(例えば、UltraChekIシステム)によって走査されたカードの
イメージである。また、強度正規化アルゴリズムをカードに実行することにより
、カードイメージは、UltraChekIで走査した生のイメージよりも視覚的に若干
良好に見えるようになる。しかし、これは文字イメージ処理に根本的に影響する
ものではない。
【0005】
カードイメージは表面のグレーの強度が変動する。カード背景は完全に白色で
はないが、一般に完全に白に近く、散乱した若干のグレーの画素を全体に渡って
有している。太い文字は非常に暗いグレーとして現れ、それらのエッジ近くに中
間強度のグレーが現れる。小さい文字は、大きい文字よりも強度がかなり小さく
なって現れる。この影響は普通であり、カードイメージ走査に用いたカメラの解
像度に主に起因する。また、隣接の画素は、一般にそれらの強度の一部を中心画
素に寄与し、その結果、強度にじみ効果を生じる。
はないが、一般に完全に白に近く、散乱した若干のグレーの画素を全体に渡って
有している。太い文字は非常に暗いグレーとして現れ、それらのエッジ近くに中
間強度のグレーが現れる。小さい文字は、大きい文字よりも強度がかなり小さく
なって現れる。この影響は普通であり、カードイメージ走査に用いたカメラの解
像度に主に起因する。また、隣接の画素は、一般にそれらの強度の一部を中心画
素に寄与し、その結果、強度にじみ効果を生じる。
【0006】
グレースケールカードイメージについての画素強度ヒストグラムを図1に例示
する。白い背景は、走査イメージの画素データの大半を占める。これは値220
付近に中心を置く広いスパイクとして示される。さらに、このスパイクは広すぎ
て、スケールからはみ出している。値0付近にも広いスパイク22があり、これ
はソースカード上に現れる黒いテキストの大半を表すものである。さらに、画素
がテキストの完全な黒色から背景の完全な白色にフェードするにつれて、中間強
度の小さいスパイクが記録される。
する。白い背景は、走査イメージの画素データの大半を占める。これは値220
付近に中心を置く広いスパイクとして示される。さらに、このスパイクは広すぎ
て、スケールからはみ出している。値0付近にも広いスパイク22があり、これ
はソースカード上に現れる黒いテキストの大半を表すものである。さらに、画素
がテキストの完全な黒色から背景の完全な白色にフェードするにつれて、中間強
度の小さいスパイクが記録される。
【0007】
ヒストグラムにより表されたイメージは、適切なカットオフ値(例えば、12
8)を選択することにより、白黒イメージに変換できる。適切なカットオフ値の
選択、およびカットオフより上のすべての強度を白として、他のすべてを黒とし
てマークすることにより、2値の白黒イメージが得られる。
8)を選択することにより、白黒イメージに変換できる。適切なカットオフ値の
選択、およびカットオフより上のすべての強度を白として、他のすべてを黒とし
てマークすることにより、2値の白黒イメージが得られる。
【0008】
この技術により、OCRアルゴリズムがより大きい文字を容易に認識できるよ
うになる。しかし、より小さい文字の多くがかなり歪められるので、OCRアル
ゴリズムはこれらの文字を正確に認識できない。2値イメージの品質への寄与要
因の1つは、UltraChek-Iイメージキャプチャシステムによりもたらされた歪み
である。このイメージキャプチャシステムは、画素を一緒に混ぜてしまう傾向が
あり、その結果、カード表面で物理的に隣接する画素は結果として生じる走査イ
メージの論理的画素に実際に寄与する。例えば、小さいテキスト上でコロン文字
を形成するために用いられるドットは、それを取り囲む背景画素によって、強度
において歪められる。ブレンド効果は、前景および背景画素の間のぼやけたカッ
トオフ値という結果になる。歪みは、カード全体を考慮してカットオフを決定す
るのでなく、文字自身の直近の画素強度ヒストグラムを評価することによって多
少低減し得る。
うになる。しかし、より小さい文字の多くがかなり歪められるので、OCRアル
ゴリズムはこれらの文字を正確に認識できない。2値イメージの品質への寄与要
因の1つは、UltraChek-Iイメージキャプチャシステムによりもたらされた歪み
である。このイメージキャプチャシステムは、画素を一緒に混ぜてしまう傾向が
あり、その結果、カード表面で物理的に隣接する画素は結果として生じる走査イ
メージの論理的画素に実際に寄与する。例えば、小さいテキスト上でコロン文字
を形成するために用いられるドットは、それを取り囲む背景画素によって、強度
において歪められる。ブレンド効果は、前景および背景画素の間のぼやけたカッ
トオフ値という結果になる。歪みは、カード全体を考慮してカットオフを決定す
るのでなく、文字自身の直近の画素強度ヒストグラムを評価することによって多
少低減し得る。
【0009】
アプローチを問わず、カットオフ値が用いられるときはいつでも、いったん文
字イメージが2値形式に変換されると、一般にかなり顕著な歪みが文字イメージ
に存在する。しかし、無地色の背景上に印刷された無地色のテキストについては
、イメージの2値フォームは、人が文字を認識するのに一般に十分である。
字イメージが2値形式に変換されると、一般にかなり顕著な歪みが文字イメージ
に存在する。しかし、無地色の背景上に印刷された無地色のテキストについては
、イメージの2値フォームは、人が文字を認識するのに一般に十分である。
【0010】
イメージの2値フォームがいったん作り出されれると、従来の文字処理アルゴ
リズムは、ソースイメージ(例えば、カード)上に現れる文字イメージと基準文
字イメージセット(例えば、コンピュータのメモリ回路内に記憶された文字また
はイメージの基準テンプレート)とのマッチングを試みる。文字マッチングは、
ソースと基準イメージとの間のある程度の相関関係に基づいている。いくつかの
異なる相関関係アプローチが従来のソフトウェアプログラムにより使われている
。
リズムは、ソースイメージ(例えば、カード)上に現れる文字イメージと基準文
字イメージセット(例えば、コンピュータのメモリ回路内に記憶された文字また
はイメージの基準テンプレート)とのマッチングを試みる。文字マッチングは、
ソースと基準イメージとの間のある程度の相関関係に基づいている。いくつかの
異なる相関関係アプローチが従来のソフトウェアプログラムにより使われている
。
【0011】
多くの場合、従来のソフトウェアプログラムは、ソースイメージ上に現れる個
々の文字を分離しようと試みる。これにより、個々に処理できる一連の離散的文
字イメージが作り出される。1度に1文字を認識するのではなく、より大きい文
字列の認識に基づく他のシステムがある。しかし、大半のソフトウェアプログラ
ムは1度に1文字で作動する。
々の文字を分離しようと試みる。これにより、個々に処理できる一連の離散的文
字イメージが作り出される。1度に1文字を認識するのではなく、より大きい文
字列の認識に基づく他のシステムがある。しかし、大半のソフトウェアプログラ
ムは1度に1文字で作動する。
【0012】
現段階では、従来のOCRおよびOCVソフトウェアプログラムにより取られ
たアプローチには相違がある。従来のOCVソフトウェアプログラムが既知のテ
キストデータセットに従ってテキストを照合するのに対して、従来のOCRソフ
トウェアプログラムは、どんなテキストが実際に存在すべきかの知識なしにテキ
ストを認識する。
たアプローチには相違がある。従来のOCVソフトウェアプログラムが既知のテ
キストデータセットに従ってテキストを照合するのに対して、従来のOCRソフ
トウェアプログラムは、どんなテキストが実際に存在すべきかの知識なしにテキ
ストを認識する。
【0013】
典型的には、OCRソフトウェアプログラムはかなりのテキスト量(例えば、
印刷されたページ)について作動する。従って、OCRソフトウェアプログラム
はページ上のすべての文字をかなり迅速に読み取らねばならない。このプログラ
ムは、どの単独の文字にも多くの時間を費やすことはできない。それに対し、O
CVソフトウェアプログラムは、典型的には、非常に短いテキスト文字列(例え
ば、1ダースの文字)に関して作動し、どんなテキストが特定の文字座標位置に
存在すべきであるかを一般に知っている。従って、OCVソフトウェアプログラ
ムは、OCRソフトウェアプログラムが費やせる時間よりも多くの時間を個々の
文字の解析に費すことができる。
印刷されたページ)について作動する。従って、OCRソフトウェアプログラム
はページ上のすべての文字をかなり迅速に読み取らねばならない。このプログラ
ムは、どの単独の文字にも多くの時間を費やすことはできない。それに対し、O
CVソフトウェアプログラムは、典型的には、非常に短いテキスト文字列(例え
ば、1ダースの文字)に関して作動し、どんなテキストが特定の文字座標位置に
存在すべきであるかを一般に知っている。従って、OCVソフトウェアプログラ
ムは、OCRソフトウェアプログラムが費やせる時間よりも多くの時間を個々の
文字の解析に費すことができる。
【0014】
OCRソフトウェアプログラムがある個別のソース文字をひとたび分離したら
、ソースイメージから走査された文字とコンピュータまたはコントローラのメモ
リに記憶された基準文字イメージとの間である種の比較が行われる。この比較は
、走査イメージを周波数領域表現に変換するフーリエ変換または他の同様な周波
数変換を用いて、空間領域よりは周波数領域においてしばしば実行される。文字
イメージは、空間領域よりも周波数領域に変換されると、一般的に外観における
ばらつきがより少なくなる。従って、個々の欠落画素は、周波数領域ではそれほ
ど問題にならない。従って、マッチングプロセスは、より迅速かつ確実に行える
。
、ソースイメージから走査された文字とコンピュータまたはコントローラのメモ
リに記憶された基準文字イメージとの間である種の比較が行われる。この比較は
、走査イメージを周波数領域表現に変換するフーリエ変換または他の同様な周波
数変換を用いて、空間領域よりは周波数領域においてしばしば実行される。文字
イメージは、空間領域よりも周波数領域に変換されると、一般的に外観における
ばらつきがより少なくなる。従って、個々の欠落画素は、周波数領域ではそれほ
ど問題にならない。従って、マッチングプロセスは、より迅速かつ確実に行える
。
【0015】
文字イメージの周波数領域比較は当該技術においては一般的かつ公知であるけ
れども、空間比較技術を用いるシステムもいくつか存在する。これらの技術は、
コネクタの数、閉曲線の数などの、ソース文字イメージについての基本的特徴の
計算を含んでいる。比較は次に、実際にソースイメージ中に存在し得る妥当な文
字セットにソース文字を絞り込むために用いられる。続いて、個々の画素におい
て統計的マッチングが実行され、走査文字セットを実際に認識する。
れども、空間比較技術を用いるシステムもいくつか存在する。これらの技術は、
コネクタの数、閉曲線の数などの、ソース文字イメージについての基本的特徴の
計算を含んでいる。比較は次に、実際にソースイメージ中に存在し得る妥当な文
字セットにソース文字を絞り込むために用いられる。続いて、個々の画素におい
て統計的マッチングが実行され、走査文字セットを実際に認識する。
【0016】
周波数領域の比較および空間領域の比較のどちらのケースでも、比較ロジック
を実行する方法が多数ある。従来のアルゴリズム型ソフトウェアプログラムだけ
でなくニューラルネットも一般的に用いられる。ニューラルネットは、多数のサ
ンプルイメージが供給される「訓練された」システムである。しかし、ニューラ
ルネットは、実生活においてそれらが実際にどのように機能するかについてはあ
まり予測可能ではない。ニューラルネットは訓練されなければならない。もし訓
練が成功すれば、システムは次に現実の文字の認識において試される。ニューラ
ルネットのノードは訓練されたパラメータを備えているので、それらの正確なレ
イアウトは極めて重要である。なぜならば、そのノードが訓練されたパラメータ
を含んでいるからである。ニューラルネットは非常に敏感なので、それらが、任
意の入力セットの変動(例えば、別のフォントへの切換え)についてどの程度う
まく機能するかを予測することは困難である。
を実行する方法が多数ある。従来のアルゴリズム型ソフトウェアプログラムだけ
でなくニューラルネットも一般的に用いられる。ニューラルネットは、多数のサ
ンプルイメージが供給される「訓練された」システムである。しかし、ニューラ
ルネットは、実生活においてそれらが実際にどのように機能するかについてはあ
まり予測可能ではない。ニューラルネットは訓練されなければならない。もし訓
練が成功すれば、システムは次に現実の文字の認識において試される。ニューラ
ルネットのノードは訓練されたパラメータを備えているので、それらの正確なレ
イアウトは極めて重要である。なぜならば、そのノードが訓練されたパラメータ
を含んでいるからである。ニューラルネットは非常に敏感なので、それらが、任
意の入力セットの変動(例えば、別のフォントへの切換え)についてどの程度う
まく機能するかを予測することは困難である。
【0017】
アルゴリズム式アプローチは、文字認識機能を実行するためのソフトウェアプ
ログラム(またはコード)の開発を伴う。アルゴリズム式文字認識ソフトウェア
プログラムが行っていることを正確に計算する「魔法のブラックボックス」は皆
無である。このような事情で、このプログラムは、文字イメージをしばしば誤っ
て解釈することがある。
ログラム(またはコード)の開発を伴う。アルゴリズム式文字認識ソフトウェア
プログラムが行っていることを正確に計算する「魔法のブラックボックス」は皆
無である。このような事情で、このプログラムは、文字イメージをしばしば誤っ
て解釈することがある。
【0018】
OCVは、典型的には空間領域において実行される。文字イメージの比較は、
人が行うであろうやり方と同様な方法で実行される。例えば、走査文字イメージ
は、基準イメージ(例えば、メモリ中のテンプレート)に対して比較される。続
いて、文字が一致するかどうかを決定するため、両者の間である種の統計的相関
関係が実行される。この動作は、空間領域中の文字を比較するためにOCRソフ
トウェアにより用いられる方法と同様である。しかし、OCVは典型的にはより
小さい文字セットにおいて実行され、かつ文字解析に利用可能な時間がより多く
あるので、OCV機能を実行するために、より計算面に集中したアルゴリズムが
用い得る。
人が行うであろうやり方と同様な方法で実行される。例えば、走査文字イメージ
は、基準イメージ(例えば、メモリ中のテンプレート)に対して比較される。続
いて、文字が一致するかどうかを決定するため、両者の間である種の統計的相関
関係が実行される。この動作は、空間領域中の文字を比較するためにOCRソフ
トウェアにより用いられる方法と同様である。しかし、OCVは典型的にはより
小さい文字セットにおいて実行され、かつ文字解析に利用可能な時間がより多く
あるので、OCV機能を実行するために、より計算面に集中したアルゴリズムが
用い得る。
【0019】
従来のOCRおよびOCVシステムでは克服できないいくつかの問題がある。
第1に、白色紙上の単純な黒色テキストよりも複雑なイメージは、前景と背景と
の間にシャープな区分があるので、本来、認識または照合がより困難である。ソ
ースグレースケールイメージを単純な2値イメージに分解する実用的な方法は皆
無である。第2に、もしイメージが非常に複雑な背景上に配置されると、テキス
ト画素をそのイメージ中のすべての他の画素から分離するのは困難である。多く
の場合、ソースイメージの前景および背景の画素は色と強度が非常に近いので、
前景要素と背景要素とうまく分離するのは事実上不可能である。背景データから
文字(前景)データを明確に分離するイメージの白黒表現が得られなければ、従
来の認識および照合アプローチは適用できない。
第1に、白色紙上の単純な黒色テキストよりも複雑なイメージは、前景と背景と
の間にシャープな区分があるので、本来、認識または照合がより困難である。ソ
ースグレースケールイメージを単純な2値イメージに分解する実用的な方法は皆
無である。第2に、もしイメージが非常に複雑な背景上に配置されると、テキス
ト画素をそのイメージ中のすべての他の画素から分離するのは困難である。多く
の場合、ソースイメージの前景および背景の画素は色と強度が非常に近いので、
前景要素と背景要素とうまく分離するのは事実上不可能である。背景データから
文字(前景)データを明確に分離するイメージの白黒表現が得られなければ、従
来の認識および照合アプローチは適用できない。
【0020】
前景要素と背景要素のクリーンな分離なしでは、周波数領域へジャンプしても
予測可能な結果は得られない。さらに、イメージ中に外来性のラインが存在する
ことは、どのような従来のOCRシステムにとっても重要な問題になる。文字自
身の一部であると誤って解釈される外来性のラインは、OCRまたはOCVシス
テムをおそらく混乱させる。
予測可能な結果は得られない。さらに、イメージ中に外来性のラインが存在する
ことは、どのような従来のOCRシステムにとっても重要な問題になる。文字自
身の一部であると誤って解釈される外来性のラインは、OCRまたはOCVシス
テムをおそらく混乱させる。
【0021】
克服すべき別の問題は、イメージングシステムによりもたらされる欠陥の分析
である。例えば、従来のイメージングシステムはカードイメージを大きく歪めて
しまう。特に、広いエリア上での画素強度の混合である。走査されるべき前景画
素は、イメージングシステムによって文字のエッジの近くで大きく歪められる。
例えば、暗い前景と明るい背景を考えると、文字のエッジ近くの画素は、混合効
果のために、本来よりも明るくなって現れるであろう。画素境界を明快に定義す
るより高解像度のカメラを用いてイメージを走査することにより、認識過程はか
なり助けられるであろう。しかし、この選択は常に利用できるものではない。
である。例えば、従来のイメージングシステムはカードイメージを大きく歪めて
しまう。特に、広いエリア上での画素強度の混合である。走査されるべき前景画
素は、イメージングシステムによって文字のエッジの近くで大きく歪められる。
例えば、暗い前景と明るい背景を考えると、文字のエッジ近くの画素は、混合効
果のために、本来よりも明るくなって現れるであろう。画素境界を明快に定義す
るより高解像度のカメラを用いてイメージを走査することにより、認識過程はか
なり助けられるであろう。しかし、この選択は常に利用できるものではない。
【0022】
前述の理由により、走査イメージのトポロジカル解析に基づくイメージ照合ア
ルゴリズムを利用した、走査イメージの照合が可能な装置および方法が求められ
ている。また、イメージアウトライニング法と共にアンチストロークスコアリン
グ法を含む改良された2値分離方法(例えば、いくつの「漂遊」画素が存在する
かを求めるために、イメージの定義された外周の外側に配置されたイメージ領域
を解析する方法)を用いて、走査イメージを照合することが可能な装置および方
法も求められている。
ルゴリズムを利用した、走査イメージの照合が可能な装置および方法が求められ
ている。また、イメージアウトライニング法と共にアンチストロークスコアリン
グ法を含む改良された2値分離方法(例えば、いくつの「漂遊」画素が存在する
かを求めるために、イメージの定義された外周の外側に配置されたイメージ領域
を解析する方法)を用いて、走査イメージを照合することが可能な装置および方
法も求められている。
【0023】
(要旨)
上で述べた関連技術の制約を克服し、さらに本明細書を読みかつ理解すること
により明らかになるその他の制約を克服するため、本発明は、走査イメージのト
ポロジカル解析に基づく照合アルゴリズムを利用して走査イメージを照合できる
装置および方法に向けられている。本発明は、文字アウトライニング法と共にア
ンチストロークスコアリング法を含む改良された2値分離解析に基づく照合アル
ゴリズムを利用して走査イメージを照合できる装置および方法にも向けられてい
る。
により明らかになるその他の制約を克服するため、本発明は、走査イメージのト
ポロジカル解析に基づく照合アルゴリズムを利用して走査イメージを照合できる
装置および方法に向けられている。本発明は、文字アウトライニング法と共にア
ンチストロークスコアリング法を含む改良された2値分離解析に基づく照合アル
ゴリズムを利用して走査イメージを照合できる装置および方法にも向けられてい
る。
【0024】
本発明の特徴を有する装置の1つの局面には、イメージを照合するためのイメ
ージ照合装置が含まれる。この装置は、照明源とイメージスキャナを含み、イメ
ージを走査しかつその照明源により照明されたイメージを電子可読形式に変換す
る。この装置は、プログラムを実行するコンピュータ、電子的に読取り可能な走
査イメージを、第1および第2の境界、そしてその間に主要部分を有し、強度変
化を示す離散的要素の配列にて記憶するための記憶装置も含んでいる。この装置
は、所定のイメージを記憶装置の別個の部分に記憶可能なプログラマブルテンプ
レート、および走査イメージを前記所定のイメージに対して照合するためのイメ
ージ認識ロジックも含んでいる。
ージ照合装置が含まれる。この装置は、照明源とイメージスキャナを含み、イメ
ージを走査しかつその照明源により照明されたイメージを電子可読形式に変換す
る。この装置は、プログラムを実行するコンピュータ、電子的に読取り可能な走
査イメージを、第1および第2の境界、そしてその間に主要部分を有し、強度変
化を示す離散的要素の配列にて記憶するための記憶装置も含んでいる。この装置
は、所定のイメージを記憶装置の別個の部分に記憶可能なプログラマブルテンプ
レート、および走査イメージを前記所定のイメージに対して照合するためのイメ
ージ認識ロジックも含んでいる。
【0025】
本発明の特徴を有する装置の別の局面には、走査イメージを照合するための走
査イメージ照合装置が含まれる。この装置は、プログラムを実行するコンピュー
タ、電子可読走査イメージを、第1および第2の境界そしてその間に主要部分を
有し、強度変化を示す離散的要素の配列にて記憶するための記憶装置も含んでい
る。この装置は、所定のイメージを記憶装置の別個の部分に記憶可能なプログラ
マブルテンプレート、および走査イメージを前記所定のイメージに対して照合す
るためのイメージ認識ロジックも含んでいる。
査イメージ照合装置が含まれる。この装置は、プログラムを実行するコンピュー
タ、電子可読走査イメージを、第1および第2の境界そしてその間に主要部分を
有し、強度変化を示す離散的要素の配列にて記憶するための記憶装置も含んでい
る。この装置は、所定のイメージを記憶装置の別個の部分に記憶可能なプログラ
マブルテンプレート、および走査イメージを前記所定のイメージに対して照合す
るためのイメージ認識ロジックも含んでいる。
【0026】
本発明の特徴を有する装置のさらなる局面には、カード表面に証印を印字しそ
の証印を照合するためのカード製造装置が含まれる。この装置は、表面に証印が
印字されたカードを製造するように配置された複数のカード処理モジュールを含
み、少なくとも1つのモジュールは、カードの一部の走査イメージの強度変化を
用いる証印照合モジュールである。
の証印を照合するためのカード製造装置が含まれる。この装置は、表面に証印が
印字されたカードを製造するように配置された複数のカード処理モジュールを含
み、少なくとも1つのモジュールは、カードの一部の走査イメージの強度変化を
用いる証印照合モジュールである。
【0027】
本発明の特徴を有する方法の1つの局面には、走査イメージを照合するための
方法が含まれる。この方法は、イメージの走査、走査イメージの電子可読形式へ
の変換、走査イメージの強度変化の離散的要素の配列としての記憶、および強度
変化の離散的要素の配列の所定イメージに対する解析を含む。
方法が含まれる。この方法は、イメージの走査、走査イメージの電子可読形式へ
の変換、走査イメージの強度変化の離散的要素の配列としての記憶、および強度
変化の離散的要素の配列の所定イメージに対する解析を含む。
【0028】
本発明の特徴を有する製品のさらに別の局面には、記憶媒体上のコンピュータ
プログラムが含まれる。この製品は、所定イメージを記憶装置中に記憶できるプ
ログラマブルテンプレートと、あるイメージを所定イメージに対して照合するた
めのイメージ認識ロジックとを含んでいる。本発明の特徴を有する方法のさらな
る局面には、カードイメージとこのカードイメージデータの位置を識別する座標
とを含む第1の個人化データベースと、イメージを識別するためのデータを含む
第2のテンプレートデータベースと、走査イメージデータとカード上の走査デー
タの位置を識別する座標とを含む第3のデータベースとを有するコンピュータシ
ステムが含まれる。カード上の走査イメージを照合するための方法は、第1の個
人化データベースを記憶装置からコンピュータ内の第1のメモリ領域にロードす
る段階と、第2のテンプレートデータベースをコンピュータ内の第2のメモリ領
域にロードする段階と、第3の走査イメージデータベースをコンピュータ内の第
3のメモリ領域にロードする段階と、第1の座標位置においてカードから得られ
た走査イメージデータが、第2のテンプレートデータに従ってその座標位置にお
いて識別された個人化データと一致することを照合する段階とを含む。
プログラムが含まれる。この製品は、所定イメージを記憶装置中に記憶できるプ
ログラマブルテンプレートと、あるイメージを所定イメージに対して照合するた
めのイメージ認識ロジックとを含んでいる。本発明の特徴を有する方法のさらな
る局面には、カードイメージとこのカードイメージデータの位置を識別する座標
とを含む第1の個人化データベースと、イメージを識別するためのデータを含む
第2のテンプレートデータベースと、走査イメージデータとカード上の走査デー
タの位置を識別する座標とを含む第3のデータベースとを有するコンピュータシ
ステムが含まれる。カード上の走査イメージを照合するための方法は、第1の個
人化データベースを記憶装置からコンピュータ内の第1のメモリ領域にロードす
る段階と、第2のテンプレートデータベースをコンピュータ内の第2のメモリ領
域にロードする段階と、第3の走査イメージデータベースをコンピュータ内の第
3のメモリ領域にロードする段階と、第1の座標位置においてカードから得られ
た走査イメージデータが、第2のテンプレートデータに従ってその座標位置にお
いて識別された個人化データと一致することを照合する段階とを含む。
【0029】
これらおよびその他の種々の新規性の特徴ならびに本発明を特徴付ける利点は
、添付され、本願の一部となっている特許請求の範囲において詳細に指摘される
。しかし、本発明をより一層理解するため、本願のさらなる一部となっている図
面、ならびに本発明による装置および方法の特定の例が例示および説明されてい
る添付の説明文書を参照すべきである。
、添付され、本願の一部となっている特許請求の範囲において詳細に指摘される
。しかし、本発明をより一層理解するため、本願のさらなる一部となっている図
面、ならびに本発明による装置および方法の特定の例が例示および説明されてい
る添付の説明文書を参照すべきである。
【0030】
本発明のこれらのおよびその他の特徴、局面および利点は、以下の説明、添付
の請求項、および付属図面に関してより一層理解されるであろう。
の請求項、および付属図面に関してより一層理解されるであろう。
【0031】
(説明)
特定の実施形態についての以下の説明において、その一部をなす付属図面が参
照され、そこでは本発明が実行できる特定の実施形態が例示により示される。本
発明の範囲を逸脱することなく構造面の変更がなされるように、他の実施形態が
利用し得ることが理解される必要がある。
照され、そこでは本発明が実行できる特定の実施形態が例示により示される。本
発明の範囲を逸脱することなく構造面の変更がなされるように、他の実施形態が
利用し得ることが理解される必要がある。
【0032】
本明細書で説明された本発明の実施形態は、トポロジカルアプローチおよびイ
メージアウトライニングアプローチを伴う2値分離による、走査イメージの照合
が可能な走査イメージ照合装置および方法として実施される。
メージアウトライニングアプローチを伴う2値分離による、走査イメージの照合
が可能な走査イメージ照合装置および方法として実施される。
【0033】
ここで図1を参照すると、カードの強度走査のヒストグラムが示してある。こ
のヒストグラムは、走査イメージまたは文字のどの部分が前景に属し、そしてど
れが背景に属するかを決定するために利用される。ヒストグラムを生成するため
に用いられたカードが主に白い背景を含んでいるので、画素データの大半は白色
である。このことは、強度値220における広いスパイク20として示される。
スパイク22は、カード上の黒色のテキストを表す。
のヒストグラムは、走査イメージまたは文字のどの部分が前景に属し、そしてど
れが背景に属するかを決定するために利用される。ヒストグラムを生成するため
に用いられたカードが主に白い背景を含んでいるので、画素データの大半は白色
である。このことは、強度値220における広いスパイク20として示される。
スパイク22は、カード上の黒色のテキストを表す。
【0034】
図2は、本発明の1つの実施形態を実施するために使用されるイメージ走査お
よび照合システムの図である。カード24がコンベアまたは他の搬送システム上
を方向40に移動する。カード24から反射された光をイメージスキャナ26が
キャプチャしそれをコンピュータ可読形式に変換する間、照明源23がカード2
4を照明する。照明源23は典型的には、1つまたは複数の発光ダイオード(L
ED)で構成されている。しかし、本発明の原理を逸脱することなく他の照明源
で代替し得ることは当業者には理解されるであろう。
よび照合システムの図である。カード24がコンベアまたは他の搬送システム上
を方向40に移動する。カード24から反射された光をイメージスキャナ26が
キャプチャしそれをコンピュータ可読形式に変換する間、照明源23がカード2
4を照明する。照明源23は典型的には、1つまたは複数の発光ダイオード(L
ED)で構成されている。しかし、本発明の原理を逸脱することなく他の照明源
で代替し得ることは当業者には理解されるであろう。
【0035】
イメージスキャナ26は、カードのフルグレースケールイメージを表すデジタ
ル形式のデータを出力する。グレースケールデータは走査コンピュータシステム
28の記憶装置36内に記憶される。走査データは、データ記憶装置36からホ
ストコンピュータ30のメモリへ転送される。メモリセクション32において、
イメージ認識ロジック34に割り当てられた、走査データを照合するためのアル
ゴリズムが実行される。別のメモリセクションでは、アルゴリズムを誘導するた
めに文字またはイメージテンプレートをロードするためにテンプレート領域38
が確保される。
ル形式のデータを出力する。グレースケールデータは走査コンピュータシステム
28の記憶装置36内に記憶される。走査データは、データ記憶装置36からホ
ストコンピュータ30のメモリへ転送される。メモリセクション32において、
イメージ認識ロジック34に割り当てられた、走査データを照合するためのアル
ゴリズムが実行される。別のメモリセクションでは、アルゴリズムを誘導するた
めに文字またはイメージテンプレートをロードするためにテンプレート領域38
が確保される。
【0036】
ホストコンピュータ30は、一般に、中央演算処理装置42および基本入出力
44(I/O)機能を含んでいる。情報は、キーボード48、あるいは他のタッ
チスクリーン、マウスなどの入力装置を介してホストコンピュータ30に入力さ
れる。ビデオディスプレイ46のような端末は、走査コンピュータシステム28
により生成された出力を見るために備えてある。
44(I/O)機能を含んでいる。情報は、キーボード48、あるいは他のタッ
チスクリーン、マウスなどの入力装置を介してホストコンピュータ30に入力さ
れる。ビデオディスプレイ46のような端末は、走査コンピュータシステム28
により生成された出力を見るために備えてある。
【0037】
走査文字イメージは強度プロットの形で表される。イメージは、カード表面で
エンボス加工文字により反射された光の強度を、文字の背景(例えば、カードの
残部)に対比して表している。換言すれば、文字は強度の観点から表されている
。カード24上に典型的に見られるエンボス加工文字は、カード24の残部より
も明るい強度として現れる。文字のすぐ周囲の領域は一般にはより暗く、カード
の背景を表している。
エンボス加工文字により反射された光の強度を、文字の背景(例えば、カードの
残部)に対比して表している。換言すれば、文字は強度の観点から表されている
。カード24上に典型的に見られるエンボス加工文字は、カード24の残部より
も明るい強度として現れる。文字のすぐ周囲の領域は一般にはより暗く、カード
の背景を表している。
【0038】
文字のエンボス加工面の部分により反射された光の強度は、その特定の画素位
置における強度スパイクの高さにより表される。主として、エンボス加工文字表
面が光源および反射光検出システムに背景よりも近いので、テキスト自身が周囲
の背景よりも明るく現れることに留意すべきである。
置における強度スパイクの高さにより表される。主として、エンボス加工文字表
面が光源および反射光検出システムに背景よりも近いので、テキスト自身が周囲
の背景よりも明るく現れることに留意すべきである。
【0039】
また、エンボス加工文字の高くなった表面は、その文字のすぐ近傍の背景と比
較して色の濃さが若干明るくなる傾向がある。従って、文字の高くなった輪郭部
分のすぐ周りには深い谷がある。しかし、テキスト自身からさらに離れた距離で
は、画素は再び明るくなる。強度グラフの高いスポットがより明るい画素を表す
一方で、低いスポットはより暗い画素を表している。
較して色の濃さが若干明るくなる傾向がある。従って、文字の高くなった輪郭部
分のすぐ周りには深い谷がある。しかし、テキスト自身からさらに離れた距離で
は、画素は再び明るくなる。強度グラフの高いスポットがより明るい画素を表す
一方で、低いスポットはより暗い画素を表している。
【0040】
強度グラフは、文字強度上に現れ得る暗い斜め線の影響も示すことができる。
例えば、「4」および「0」は、その線が文字と交差する位置で顕著な降下を有
する。エンボス加工テキストは、普通はクレジットカード等に見られる。エンボ
ス加工テキストはカードの表側で高くなっている。次にカードには、着色箔が載
せられる。文字がカードの裏側から打ち抜かれている場合に、エンボス加工によ
って実際にプラスチック製カード自身が変形するので、文字のエッジ周囲には常
に大きな色の違いがある。
例えば、「4」および「0」は、その線が文字と交差する位置で顕著な降下を有
する。エンボス加工テキストは、普通はクレジットカード等に見られる。エンボ
ス加工テキストはカードの表側で高くなっている。次にカードには、着色箔が載
せられる。文字がカードの裏側から打ち抜かれている場合に、エンボス加工によ
って実際にプラスチック製カード自身が変形するので、文字のエッジ周囲には常
に大きな色の違いがある。
【0041】
図3Aには、カード24上で見られると予想される文字のテンプレート51を
記憶するために用いられる文字テンプレートデータベース50が例示してある。
文字テンプレートデータベース50は、コンピュータ30のメモリ回路32のテ
ンプレート領域38にロードされるべき文字形状を記憶する。このテンプレート
はアルゴリズムに対するガイドを提供し、それによってアルゴリズムは、照合し
ようと試みている文字の公知の輪郭すなわちアウトラインをたどることができる
。
記憶するために用いられる文字テンプレートデータベース50が例示してある。
文字テンプレートデータベース50は、コンピュータ30のメモリ回路32のテ
ンプレート領域38にロードされるべき文字形状を記憶する。このテンプレート
はアルゴリズムに対するガイドを提供し、それによってアルゴリズムは、照合し
ようと試みている文字の公知の輪郭すなわちアウトラインをたどることができる
。
【0042】
図3Bには、氏名、カード番号などのカード保持者の個人情報を記憶するため
に用いられる個人化データベース52が例示してある。個人化データベース52
は、特定の文字55がカード24上に位置すると思われる所のX−Y座標53を
含んでいる。個人化データベース52は、照合を試みているカード24上に存在
する情報をイメージ走査コンピュータ28に提供する。X−Y座標53は、特定
の文字55がカード24上のどこに現れるかを識別する。
に用いられる個人化データベース52が例示してある。個人化データベース52
は、特定の文字55がカード24上に位置すると思われる所のX−Y座標53を
含んでいる。個人化データベース52は、照合を試みているカード24上に存在
する情報をイメージ走査コンピュータ28に提供する。X−Y座標53は、特定
の文字55がカード24上のどこに現れるかを識別する。
【0043】
図3Cは、走査されたカード24のグレースケールイメージデータを記憶する
ために用いられる走査データデータベース54である。アルゴリズムが個人化デ
ータベース52から座標53および文字55をコンピュータシステム30中のメ
モリ領域32にロードすると、アルゴリズムは、文字テンプレートデータベース
50からその文字51の対応する適切なテンプレートをロードする。次にこのア
ルゴリズムは、個人化データベース52中に記憶された座標53において文字5
5と一致することを照合するために、テンプレート文字51に従って、走査デー
タデータベース54から座標57で対応する文字59をトレースする。
ために用いられる走査データデータベース54である。アルゴリズムが個人化デ
ータベース52から座標53および文字55をコンピュータシステム30中のメ
モリ領域32にロードすると、アルゴリズムは、文字テンプレートデータベース
50からその文字51の対応する適切なテンプレートをロードする。次にこのア
ルゴリズムは、個人化データベース52中に記憶された座標53において文字5
5と一致することを照合するために、テンプレート文字51に従って、走査デー
タデータベース54から座標57で対応する文字59をトレースする。
【0044】
I.トポロジカルアプローチ
前景と背景とを区別する従来のアプローチを使うのではなく、本発明の1つの
実施形態の装置と方法では、走査されたカードイメージの解析および照合にトポ
ロジカルアプローチが利用される。
実施形態の装置と方法では、走査されたカードイメージの解析および照合にトポ
ロジカルアプローチが利用される。
【0045】
本発明の1つの実施形態によると、イメージ照合アルゴリズムはイメージのト
ポロジカル解析に基づく。標準的な認識ソフトウェアは、イメージの前景と背景
との間の明快な2値分離に依存している。しかし、本発明の1つの実施形態によ
る照合システムは、走査イメージのフルグレースケールバージョンに基づくトポ
ロジカル解析を実行することによってこのステップを排除している。
ポロジカル解析に基づく。標準的な認識ソフトウェアは、イメージの前景と背景
との間の明快な2値分離に依存している。しかし、本発明の1つの実施形態によ
る照合システムは、走査イメージのフルグレースケールバージョンに基づくトポ
ロジカル解析を実行することによってこのステップを排除している。
【0046】
従来のクレジットカードの走査イメージを考慮すると、ソースイメージ中に存
在し得るどのような斜め線も、カード上でエンボス加工された文字の走査イメー
ジ品質にかなり影響する。どのような暗い斜め線でも各走査文字の強度への影響
があるので、この影響はイメージングシステムにより引き起こされる。
在し得るどのような斜め線も、カード上でエンボス加工された文字の走査イメー
ジ品質にかなり影響する。どのような暗い斜め線でも各走査文字の強度への影響
があるので、この影響はイメージングシステムにより引き起こされる。
【0047】
ここで図3A〜(D)を参照すると、ここに説明される本発明の様々な実施形
態において、カード上に現れる走査テキストデータ54は、既知の個人化データ
52のセットおよびデータの参照テンプレート50に対して照合される。例えば
、カード保有者名、カード番号、満了データ、およびその他の個人化情報などの
カード上にあると思われるテキストは、走査コンピュータシステム28のメモリ
32中のデータファイル52またはデータ記憶装置36に記憶される。
態において、カード上に現れる走査テキストデータ54は、既知の個人化データ
52のセットおよびデータの参照テンプレート50に対して照合される。例えば
、カード保有者名、カード番号、満了データ、およびその他の個人化情報などの
カード上にあると思われるテキストは、走査コンピュータシステム28のメモリ
32中のデータファイル52またはデータ記憶装置36に記憶される。
【0048】
さらに、照合アルゴリズムにより利用される文字テンプレートデータファイル
50も、走査コンピュータシステム28のメモリ32またはデータ記憶装置36
に記憶される。従って、照合すべきテキストは既知であり、かつ適切な情報がカ
ード28上に置かれたこと(例えば、エンボス加工によって)を保証するために
使用される。もちろん当業者は、テキストまたはイメージを、エンボス加工以外
の様々な方法によりカード24上に置き得ることを理解するであろう。例えば、
本発明の原理を逸脱することなく、印刷、エッチング、刻設、レーザー刻設、ま
たは他の同様なプロセスによって、テキストをカード24上に置き得る。テキス
トなどの証印またはイメージをカード上に適用するために用いた方法にかかわら
ず、一般にエンボス加工カードに着色箔が載せられる。
50も、走査コンピュータシステム28のメモリ32またはデータ記憶装置36
に記憶される。従って、照合すべきテキストは既知であり、かつ適切な情報がカ
ード28上に置かれたこと(例えば、エンボス加工によって)を保証するために
使用される。もちろん当業者は、テキストまたはイメージを、エンボス加工以外
の様々な方法によりカード24上に置き得ることを理解するであろう。例えば、
本発明の原理を逸脱することなく、印刷、エッチング、刻設、レーザー刻設、ま
たは他の同様なプロセスによって、テキストをカード24上に置き得る。テキス
トなどの証印またはイメージをカード上に適用するために用いた方法にかかわら
ず、一般にエンボス加工カードに着色箔が載せられる。
【0049】
図3Dには、第1の境界58と第2の境界60との間の主要部分66および主
要トレースパス62に沿った第1および第2の側64を有する文字「O」56が
例示してある。トポロジカルアプローチは、方向62に沿った走査イメージ56
の輪郭を論理的にトレースするアルゴリズムを用いる。このアルゴリズムは、文
字の主要部分(例えば、境界58と60との間)66に沿って文字56のパス6
2を論理的にトレースし、トレースパス62に沿っての強度変化がトレースパス
のどちら側64においてもトレースパス62の方向に沿ってよりもシャープであ
ることを照合する。
要トレースパス62に沿った第1および第2の側64を有する文字「O」56が
例示してある。トポロジカルアプローチは、方向62に沿った走査イメージ56
の輪郭を論理的にトレースするアルゴリズムを用いる。このアルゴリズムは、文
字の主要部分(例えば、境界58と60との間)66に沿って文字56のパス6
2を論理的にトレースし、トレースパス62に沿っての強度変化がトレースパス
のどちら側64においてもトレースパス62の方向に沿ってよりもシャープであ
ることを照合する。
【0050】
論理トレースパス62に沿った個々の所定ポイントで、アルゴリズムは文字一
致スコアを求める。換言すれば、アルゴリズムは、文字の主要な論理トレースパ
ス62に沿った隣接画素の強度移行と、現在のポジション64のどちらかの側の
第1の境界58および第2の境界60をちょうど超えるところの画素の強度移行
との対比に基づいてスコアを評価する。これがあてはまるパス62に沿った各ポ
イントでは、解析されている現在の文字の文字マッチングスコアが増加する。パ
ス62に沿ってアルゴリズムが進行するにつれて、アルゴリズムはランニングス
コアを維持する。このスコアは、走査文字がカード上のその座標位置にあると想
定される文字とどの程度うまく一致するかを表示するものである。
致スコアを求める。換言すれば、アルゴリズムは、文字の主要な論理トレースパ
ス62に沿った隣接画素の強度移行と、現在のポジション64のどちらかの側の
第1の境界58および第2の境界60をちょうど超えるところの画素の強度移行
との対比に基づいてスコアを評価する。これがあてはまるパス62に沿った各ポ
イントでは、解析されている現在の文字の文字マッチングスコアが増加する。パ
ス62に沿ってアルゴリズムが進行するにつれて、アルゴリズムはランニングス
コアを維持する。このスコアは、走査文字がカード上のその座標位置にあると想
定される文字とどの程度うまく一致するかを表示するものである。
【0051】
さらに、このアルゴリズムはアンチストロークの追跡を追う。アンチストロー
クは、アルゴリズムがストロークがあるべきでない所でストロークを見出したこ
とを示す。トレースパスに沿ってというよりもアンチストロークの側に対してよ
り急勾配な強度移行は文字スコアに対してカウントする。アルゴリズムは、サー
チウインドウ内の可能な各位置で各10文字についてスコアを計算し、最もスコ
アが良いものを「正しい」認識文字であるとして選択する。もしいずれかの認識
文字が個人化データベース52に基づく実際の文字と一致しなければ、そのカー
ドは不合格とされる。換言すれば、もしいずれかの文字がカード上の一定の座標
位置にあると実際思われる文字と一致しなければ、照合は不合格である。
クは、アルゴリズムがストロークがあるべきでない所でストロークを見出したこ
とを示す。トレースパスに沿ってというよりもアンチストロークの側に対してよ
り急勾配な強度移行は文字スコアに対してカウントする。アルゴリズムは、サー
チウインドウ内の可能な各位置で各10文字についてスコアを計算し、最もスコ
アが良いものを「正しい」認識文字であるとして選択する。もしいずれかの認識
文字が個人化データベース52に基づく実際の文字と一致しなければ、そのカー
ドは不合格とされる。換言すれば、もしいずれかの文字がカード上の一定の座標
位置にあると実際思われる文字と一致しなければ、照合は不合格である。
【0052】
記憶された文字のテンプレート50はアルゴリズムにより利用され、これによ
りアルゴリズムは文字イメージ56をどのように論理的にトレースするかを知る
。例えば、照合すべき文字について、アルゴリズムは、個人化データベース52
に記憶されたそのX−Y座標53に基づいて文字55の値を取り出す(ロードす
る)。こうして、アルゴリズムは現在どの文字を照合すべきかを知るようになる
ので、アルゴリズムは対応する文字の論理テンプレート51を文字テンプレート
データベース50から取り出す(ロードする)。アルゴリズムは次に、走査文字
を走査データデータベース54から取り出す(ロードする)。従って、既知の文
字55の論理テンプレート51の値は、アルゴリズムを、走査データデータベー
ス54に記憶されたエンボス加工文字の走査イメージを通るべく案内する。これ
は、文字53が個人化データベース52に従って実際にカード24上の正しいX
−Y座標に位置しているかを照合するため、または文字がカード24上で適切に
エンボス加工されているかを照合するためになされる。
りアルゴリズムは文字イメージ56をどのように論理的にトレースするかを知る
。例えば、照合すべき文字について、アルゴリズムは、個人化データベース52
に記憶されたそのX−Y座標53に基づいて文字55の値を取り出す(ロードす
る)。こうして、アルゴリズムは現在どの文字を照合すべきかを知るようになる
ので、アルゴリズムは対応する文字の論理テンプレート51を文字テンプレート
データベース50から取り出す(ロードする)。アルゴリズムは次に、走査文字
を走査データデータベース54から取り出す(ロードする)。従って、既知の文
字55の論理テンプレート51の値は、アルゴリズムを、走査データデータベー
ス54に記憶されたエンボス加工文字の走査イメージを通るべく案内する。これ
は、文字53が個人化データベース52に従って実際にカード24上の正しいX
−Y座標に位置しているかを照合するため、または文字がカード24上で適切に
エンボス加工されているかを照合するためになされる。
【0053】
例えば、「40」の最終桁の「0」の文字については、この文字の形または輪
郭が論理的にトレースされる。トレースプロセスは、文字の主要部分に沿った行
程方向に沿って起こる(例えば、実際の文字を表している画素内)。トレースプ
ロセスの間、アルゴリズムは、トレース方向に沿った各ステップにおいて、トレ
ースパスのいずれかの側にも画素強度の面でシャープな移行があり、そして前方
トレース方向にはあまりシャープでない強度移行があることを照合する。
郭が論理的にトレースされる。トレースプロセスは、文字の主要部分に沿った行
程方向に沿って起こる(例えば、実際の文字を表している画素内)。トレースプ
ロセスの間、アルゴリズムは、トレース方向に沿った各ステップにおいて、トレ
ースパスのいずれかの側にも画素強度の面でシャープな移行があり、そして前方
トレース方向にはあまりシャープでない強度移行があることを照合する。
【0054】
トポロジカルアプローチは、むしろパスに沿って歩きかつ常にレベルを維持す
るようなものであって、崖を上ったり谷に下る必要を回避している。当然ながら
、偽のおよび人工的な不規則性を有するパスに沿っていくつかのステップがあり
、アップまたはダウンのステップを取る必要がある。しかし、文字の主要部分6
6内のトレース方向62に沿ったパスは、トレースパス64を横切るよりかなり
滑らかであろう。
るようなものであって、崖を上ったり谷に下る必要を回避している。当然ながら
、偽のおよび人工的な不規則性を有するパスに沿っていくつかのステップがあり
、アップまたはダウンのステップを取る必要がある。しかし、文字の主要部分6
6内のトレース方向62に沿ったパスは、トレースパス64を横切るよりかなり
滑らかであろう。
【0055】
トポロジカルアプローチは、走査イメージから得られる完全なグレースケール
強度データを利用する。重要な強度データが捨てられることは全くない。このこ
とは、イメージを2値形式に還元する際にデータを捨てる従来のOCRおよびO
CVアルゴリズムとは対照的である。トポロジカルアルゴリズムにおいては、実
際の文字照合ロジックは、記憶された走査ソースイメージ中に現われる完全なグ
レースケール強度データ(例えば、すべての隆起および谷)へのフルアクセスを
有している。この方法により、従来システムよりも信頼性の高い文字照合結果が
得られる。
強度データを利用する。重要な強度データが捨てられることは全くない。このこ
とは、イメージを2値形式に還元する際にデータを捨てる従来のOCRおよびO
CVアルゴリズムとは対照的である。トポロジカルアルゴリズムにおいては、実
際の文字照合ロジックは、記憶された走査ソースイメージ中に現われる完全なグ
レースケール強度データ(例えば、すべての隆起および谷)へのフルアクセスを
有している。この方法により、従来システムよりも信頼性の高い文字照合結果が
得られる。
【0056】
データベース54中に記憶された走査イメージ文字59を、事前記録された個
人化データ52のセットに対してマッチングするには、走査文字イメージ56の
トレースパス64を横切って配置された画素が、文字56の主要トレースパス6
2に沿った画素とは強度がかなり違うことが必要である。これが当てはまる限り
、文字の主要部分に沿って文字の第1の境界58および第2の境界60のどちら
側にもシャープな崖様構造があるであろう。
人化データ52のセットに対してマッチングするには、走査文字イメージ56の
トレースパス64を横切って配置された画素が、文字56の主要トレースパス6
2に沿った画素とは強度がかなり違うことが必要である。これが当てはまる限り
、文字の主要部分に沿って文字の第1の境界58および第2の境界60のどちら
側にもシャープな崖様構造があるであろう。
【0057】
エンボス加工プロセス(カード表側を実際に貫通することはない)によりプラ
スチック製カードにおいて変形が生じるので、各文字またはイメージのピークと
谷の走査強度の間には十分な相違があり、識別可能な強度の相違を有する走査イ
メージを取得することができる。このことは、カードのトッピング色が背景色と
一致しているケースにおいてさえも当てはまる。例えば、クレジットカードのホ
ログラム領域に置かれた数字は印刷されているホログラム背景とほとんど同色で
あるが、それにもかかわらず文字のエッジ周囲に非常にシャープな移行領域が存
在するであろう。
スチック製カードにおいて変形が生じるので、各文字またはイメージのピークと
谷の走査強度の間には十分な相違があり、識別可能な強度の相違を有する走査イ
メージを取得することができる。このことは、カードのトッピング色が背景色と
一致しているケースにおいてさえも当てはまる。例えば、クレジットカードのホ
ログラム領域に置かれた数字は印刷されているホログラム背景とほとんど同色で
あるが、それにもかかわらず文字のエッジ周囲に非常にシャープな移行領域が存
在するであろう。
【0058】
カードが印刷、例えばUltraGraphix印刷、される場合には、UltraGraphixテキ
ストの色は、そのテキストを包囲している背景色とは色がかなり異なっているべ
きである。UltraGraphixまたはエンボス加工印刷のいずれについても、本発明に
よるOCVは、走査文字イメージ56の第1の境界58および第2の境界60領
域にシャープなエッジが存在することを保証しようと試みる。
ストの色は、そのテキストを包囲している背景色とは色がかなり異なっているべ
きである。UltraGraphixまたはエンボス加工印刷のいずれについても、本発明に
よるOCVは、走査文字イメージ56の第1の境界58および第2の境界60領
域にシャープなエッジが存在することを保証しようと試みる。
【0059】
本発明の1つの実施形態による、トポロジカルアルゴリズムにおいてたどられ
る段階は以下の通りである。 (a)動作する色平面を選定する。 (b)各位置に最も一致する文字を得る。 (c)最善の一致が各座標位置において実際の文字と一致することを照合する。
る段階は以下の通りである。 (a)動作する色平面を選定する。 (b)各位置に最も一致する文字を得る。 (c)最善の一致が各座標位置において実際の文字と一致することを照合する。
【0060】
(その中で動作する色平面の選定)
イメージングシステムは、フル24ビットカラー(赤、緑および青の各色平面
のについて8ビットのデータ)でイメージをキャプチャする。アルゴリズムは1
つの色平面を選定し、それをグレースケールイメージとして取り扱って動作する
。(合成グレースケールイメージを作るために3つの色平面が組み合わされるの
ではないことに留意されたい。)色平面は独立して試されなければならない。な
ぜならば、もし色平面が1つの合成グレースケールにマージされたら、色が必ず
しも識別可能にならないケースがあり得るからである。
のについて8ビットのデータ)でイメージをキャプチャする。アルゴリズムは1
つの色平面を選定し、それをグレースケールイメージとして取り扱って動作する
。(合成グレースケールイメージを作るために3つの色平面が組み合わされるの
ではないことに留意されたい。)色平面は独立して試されなければならない。な
ぜならば、もし色平面が1つの合成グレースケールにマージされたら、色が必ず
しも識別可能にならないケースがあり得るからである。
【0061】
例えば、もしカードが2色を含みかつそれらが別の色平面において同一の強度
レベルとして現れたら(例えば、カード上の非常に暗い青および非常に暗い赤)
、これら2つの色平面を1つの合成グレースケールイメージにマージすると識別
不可能な色平面が得られる。従って、3つの平面のそれぞれでの動作は、他の2
つの色平面とは独立してなされなければならない。もし第1の選定色平面によっ
て、見い出されると期待されるテキストが現れないならば、第2の色平面が試さ
れる。もし3つの面すべてで満足のいく結果を得ることに失敗したならば、アル
ゴリズムはそのカードが無効データを含んでいるものとみなす。
レベルとして現れたら(例えば、カード上の非常に暗い青および非常に暗い赤)
、これら2つの色平面を1つの合成グレースケールイメージにマージすると識別
不可能な色平面が得られる。従って、3つの平面のそれぞれでの動作は、他の2
つの色平面とは独立してなされなければならない。もし第1の選定色平面によっ
て、見い出されると期待されるテキストが現れないならば、第2の色平面が試さ
れる。もし3つの面すべてで満足のいく結果を得ることに失敗したならば、アル
ゴリズムはそのカードが無効データを含んでいるものとみなす。
【0062】
(各位置に最も一致する文字を得る)
このステップは、各文字ポジション(例えば、カード上の各文字の各々の座標
位置)における考えられるすべての文字について前述のトポロジカル認識アルゴ
リズムを実行することを含んでいる。その文字51の記憶されたテンプレートに
従って対応する座標位置53において個人化データベース52中の対応する記憶
された文字55に最も良好に一致する、走査データデータベース54中のX−Y
座標57における走査文字59は、最終的に正しいとみなされる文字である。本
発明の1つの実施形態においては、このアルゴリズムは考えられるすべての用い
られた特定のフォントを照合する。当然ながら、本発明の原理を逸脱することな
く、任意の数の文字、記号およびイメージ等が使用され得るので、このことが任
意的であることを当業者は理解するであろう。
位置)における考えられるすべての文字について前述のトポロジカル認識アルゴ
リズムを実行することを含んでいる。その文字51の記憶されたテンプレートに
従って対応する座標位置53において個人化データベース52中の対応する記憶
された文字55に最も良好に一致する、走査データデータベース54中のX−Y
座標57における走査文字59は、最終的に正しいとみなされる文字である。本
発明の1つの実施形態においては、このアルゴリズムは考えられるすべての用い
られた特定のフォントを照合する。当然ながら、本発明の原理を逸脱することな
く、任意の数の文字、記号およびイメージ等が使用され得るので、このことが任
意的であることを当業者は理解するであろう。
【0063】
(最良の一致が各座標位置の実際の文字と一致することを照合)
アルゴリズムのこのステップは、アルゴリズムにより一致された最良の文字が
、見出されることが期待されるテキストと実際に確実に一致することをチェック
する。密接なつながりを壊すためのいくつかの公差設定があることがある。例え
ば、個人化データベース52は、「1」がカード24の現在の座標位置に置かれ
るべきであったことを示す。しかし、「7」も同様に、照合される文字列のその
同じ文字座標位置に置かれた可能性がある(または、ほぼ同様にその可能性があ
る)。予期される文字が実際「1」なので、たとえ照合プロセスの間に得られた
文字一致スコアに基づいて「7」が多少高い一致スコアランキングを受け取った
としても、その文字が有効であるとして容認するためのいくらかの許容誤差が必
要とされる。
、見出されることが期待されるテキストと実際に確実に一致することをチェック
する。密接なつながりを壊すためのいくつかの公差設定があることがある。例え
ば、個人化データベース52は、「1」がカード24の現在の座標位置に置かれ
るべきであったことを示す。しかし、「7」も同様に、照合される文字列のその
同じ文字座標位置に置かれた可能性がある(または、ほぼ同様にその可能性があ
る)。予期される文字が実際「1」なので、たとえ照合プロセスの間に得られた
文字一致スコアに基づいて「7」が多少高い一致スコアランキングを受け取った
としても、その文字が有効であるとして容認するためのいくらかの許容誤差が必
要とされる。
【0064】
強度正規化は、本発明の1つの実施形態の別の特徴である。強度正規化は、カ
ードが走査されている間、カードがあたかも均一に照明されるように見えるよう
にすることを意図している。UltraChekモジュールにおいて用いられる物理的照
明が不規則なので、イメージ化された白無地カード上では、カードの走査イメー
ジはそのエッジ部よりも中央部がずっと明るい。しかし、強度正規化後には、エ
ッジ周囲の暗い領域は一般に消滅する。
ードが走査されている間、カードがあたかも均一に照明されるように見えるよう
にすることを意図している。UltraChekモジュールにおいて用いられる物理的照
明が不規則なので、イメージ化された白無地カード上では、カードの走査イメー
ジはそのエッジ部よりも中央部がずっと明るい。しかし、強度正規化後には、エ
ッジ周囲の暗い領域は一般に消滅する。
【0065】
本発明の1つの実施形態において、正規化補正は画素ごとに実行される。各画
素について、適切な補正パラメータが独立して計算される。これは問題に対する
多少力ずくのアプローチであり、数十万のパラメータを独立して計算して、走査
イメージに適用する必要がある。しかし、もし走査プロセスの間にいくつかの小
さいライティング変動が生じても(照明源の一部が故障した時など)、このアプ
ローチはそれでもうまく作動するという利点がもたらされる。特定の画素位置で
のカメラレスポンスの個々の変動も、正規化アプローチを用いてマスキングされ
る。
素について、適切な補正パラメータが独立して計算される。これは問題に対する
多少力ずくのアプローチであり、数十万のパラメータを独立して計算して、走査
イメージに適用する必要がある。しかし、もし走査プロセスの間にいくつかの小
さいライティング変動が生じても(照明源の一部が故障した時など)、このアプ
ローチはそれでもうまく作動するという利点がもたらされる。特定の画素位置で
のカメラレスポンスの個々の変動も、正規化アプローチを用いてマスキングされ
る。
【0066】
正規化プロセス実行に先立って、白黒較正基準が得られる。これらの基準は到
達可能な最も暗い黒および最も明るい白とすべきである。なぜならば、これらの
基準対照により設定された範囲外に出る実際の走査イメージは、基準に従って最
も極端な値に固定されるからである。この結果、ダイナミックレンジの損失につ
ながる。
達可能な最も暗い黒および最も明るい白とすべきである。なぜならば、これらの
基準対照により設定された範囲外に出る実際の走査イメージは、基準に従って最
も極端な値に固定されるからである。この結果、ダイナミックレンジの損失につ
ながる。
【0067】
走査されたカードイメージ上の各画素位置については、単純な線形変換が計算
され、生の入力画素を正規化出力範囲に変換する。本発明の1つの実施形態によ
るイメージングシステムにより、グレーの256階調のイメージが作られ、従っ
て、出力範囲は0から255である。
され、生の入力画素を正規化出力範囲に変換する。本発明の1つの実施形態によ
るイメージングシステムにより、グレーの256階調のイメージが作られ、従っ
て、出力範囲は0から255である。
【0068】
例えば、黒いカードを30の強度として、そして白いカードを250の強度と
して認識する画素位置は、0から255の出力範囲にマッピングし得る。従って
、もし30の生のカード走査イメージ強度が得られれば、これは0にマッピング
され、従って、250の入力は255にマッピングされ、140の中間の入力は
128にマッピングされることになろう。
して認識する画素位置は、0から255の出力範囲にマッピングし得る。従って
、もし30の生のカード走査イメージ強度が得られれば、これは0にマッピング
され、従って、250の入力は255にマッピングされ、140の中間の入力は
128にマッピングされることになろう。
【0069】
本発明の1つの実施形態によると、補正された画素強度を計算するための式は
以下の通りである。 ここで、cは補正された画素強度である。これは常に出力範囲のどこかに入る
。 rは生の値である。 B は黒の出力値で、出力範囲中で考えられる最も黒い画素に割り当てられる
強度レベルである。 Wは白の出力値で、出力範囲中で考えられる最も白い画素に割り当てられる強
度レベルである。 bは黒の入力値で、黒の基準目標のイメージングから受け取った強度レベルで
ある。 wは白の入力値で、白の基準目標のイメージングから受け取った強度レベルで
ある。
以下の通りである。 ここで、cは補正された画素強度である。これは常に出力範囲のどこかに入る
。 rは生の値である。 B は黒の出力値で、出力範囲中で考えられる最も黒い画素に割り当てられる
強度レベルである。 Wは白の出力値で、出力範囲中で考えられる最も白い画素に割り当てられる強
度レベルである。 bは黒の入力値で、黒の基準目標のイメージングから受け取った強度レベルで
ある。 wは白の入力値で、白の基準目標のイメージングから受け取った強度レベルで
ある。
【0070】
この式のパラメータは、カード走査イメージの各画素位置について独立して計
算される。
算される。
【0071】
本発明の1つの実施形態において、強度正規化は別のロジックを利用して実行
できる。例えば、飽和なしで基準カードの範囲を超える画素光強度を考慮する。
実際には、利用可能な最も明るい(白)基準カードより明るいカードが存在する
。従って、本発明の1つの実施形態においては、コード(ロジック)は基準ポイ
ント間にその間に入る画素を内挿し、基準範囲外の画素について外挿する。
できる。例えば、飽和なしで基準カードの範囲を超える画素光強度を考慮する。
実際には、利用可能な最も明るい(白)基準カードより明るいカードが存在する
。従って、本発明の1つの実施形態においては、コード(ロジック)は基準ポイ
ント間にその間に入る画素を内挿し、基準範囲外の画素について外挿する。
【0072】
例えば、表1に示されるように、システムは赤色平面について以下の入力が与
えられる。
えられる。
【0073】
基準ポイントは、走査システムに(例えば、カメラ)が受け取った実際の強度
値である。ノルムポイントは、所望の正規化イメージ(出力)出力である。2つ
のサンプルポイント(ダーク基準、ダークノルム)および(ブライト基準、ブラ
イトノルム)に基づき、システムは実際の生イメージデータを以下のように内挿
および外挿する。 Out=(ダークノルム)+(ブライトノルム-ダークノルム)/(ブライト基準 - ダーク
基準)*(生 - ダーク基準)
値である。ノルムポイントは、所望の正規化イメージ(出力)出力である。2つ
のサンプルポイント(ダーク基準、ダークノルム)および(ブライト基準、ブラ
イトノルム)に基づき、システムは実際の生イメージデータを以下のように内挿
および外挿する。 Out=(ダークノルム)+(ブライトノルム-ダークノルム)/(ブライト基準 - ダーク
基準)*(生 - ダーク基準)
【0074】
あるいは、より一般的な表記では以下の通りである。
y=y0+(y1-y0)/(x1-x0)*(x-x0)
【0075】
この例については以下のようになる。
y=10+235/200*(x-40)
【0076】
結果を表2に示す。
【0077】
上で論じた、最初の方のアプローチにおいては、基準範囲外のどのような入力
値も基準範囲に固定されるであろう。同じ標準内挿式が用いられた。
値も基準範囲に固定されるであろう。同じ標準内挿式が用いられた。
【0078】
現在説明されているアプローチにおいては、値は基準範囲に固定されない。む
しろ、基準範囲外にある値は単に外挿という結果になる。
しろ、基準範囲外にある値は単に外挿という結果になる。
【0079】
(*)のケースでは、出力値が、用いたナンバリングシステムの最大表示可能
範囲に固定される必要があることに留意されたい。上記の例では、最大範囲は、
通常の8ビットグレースケールカラーイメージについては255であろう(すべ
ての画素は0から255の範囲になければならない)。
範囲に固定される必要があることに留意されたい。上記の例では、最大範囲は、
通常の8ビットグレースケールカラーイメージについては255であろう(すべ
ての画素は0から255の範囲になければならない)。
【0080】
II.アウトライニングを伴うグレースケールベースの2値分離
次に図4をみると、本発明の別の実施形態においては、2値イメージ分離は、
走査イメージの前景を背景から分離するために生成される。これは、強度ヒスト
グラム68を生成し、カットオフ値70を選択することにより達成される。従っ
て、カットオフ値70以上のものはすべて前景画素であるとみなされ、カットオ
フ値70以下のものはすべて背景画素であるとみなされる。
走査イメージの前景を背景から分離するために生成される。これは、強度ヒスト
グラム68を生成し、カットオフ値70を選択することにより達成される。従っ
て、カットオフ値70以上のものはすべて前景画素であるとみなされ、カットオ
フ値70以下のものはすべて背景画素であるとみなされる。
【0081】
各候補起源において、例えば、文字は記憶された個人化データ52に従ってソ
ースカード24の特定の座標において現われるはずであり、文字ストロークは、
記憶された文字テンプレートデータ50から得られ、その下にある画素が解析さ
れる。画素強度のヒストグラム68が次に構成されて、2値化操作のための基礎
として使われる。上で論じたように、テンプレート画素の強度範囲のいくらかの
フラクションの強度を有しているすべての画素が前景とみなされ、他すべてが背
景とみなされる。
ースカード24の特定の座標において現われるはずであり、文字ストロークは、
記憶された文字テンプレートデータ50から得られ、その下にある画素が解析さ
れる。画素強度のヒストグラム68が次に構成されて、2値化操作のための基礎
として使われる。上で論じたように、テンプレート画素の強度範囲のいくらかの
フラクションの強度を有しているすべての画素が前景とみなされ、他すべてが背
景とみなされる。
【0082】
ここで図5Aを参照すると、分離ステップ後、アルゴリズムは、トレースパス
76に沿って文字の外部境界72の外側領域を論理的にトレースし、ヒストグラ
ムカットオフ値70に基づいて「背景」画素であると実際に分類された画素数を
カウントする。画素の総数は、文字を照合するための1つの根拠として使われる
。例えば、クリーンな外周72(例えば、クリーンなエッジ)を有する良好に定
義された文字は、外周72外に位置する漂遊画素が最も少なく、従って外部画素
が前景画素としてマークされることはほとんどない。良好に定義された文字は、
照合アルゴリズムによってよりよい総合スコアを得る。
76に沿って文字の外部境界72の外側領域を論理的にトレースし、ヒストグラ
ムカットオフ値70に基づいて「背景」画素であると実際に分類された画素数を
カウントする。画素の総数は、文字を照合するための1つの根拠として使われる
。例えば、クリーンな外周72(例えば、クリーンなエッジ)を有する良好に定
義された文字は、外周72外に位置する漂遊画素が最も少なく、従って外部画素
が前景画素としてマークされることはほとんどない。良好に定義された文字は、
照合アルゴリズムによってよりよい総合スコアを得る。
【0083】
この方法は、単純および複雑な各種の背景でうまく機能する。しかし、「斑点
がついた」すなわちキメの粗い背景によってこのアルゴリズムは混乱する。なぜ
なら、背景領域中のランダムな画素が前景強度バンドの限界内に入るからである
。また、エンボス加工の結果である文字外周72のすぐ周囲の歪みエッジが全く
なければ、背景と同一色である文字は同様にうまく働かない。前景色が背景色と
完全またはほぼ一致することはめったに起こらないが、時々は起こることが知ら
れている。
がついた」すなわちキメの粗い背景によってこのアルゴリズムは混乱する。なぜ
なら、背景領域中のランダムな画素が前景強度バンドの限界内に入るからである
。また、エンボス加工の結果である文字外周72のすぐ周囲の歪みエッジが全く
なければ、背景と同一色である文字は同様にうまく働かない。前景色が背景色と
完全またはほぼ一致することはめったに起こらないが、時々は起こることが知ら
れている。
【0084】
次に図5Bを参照すると、2値化プロセスは次に、上述の「トポロジカル」法
で用いられるアンチストロークスコアリング法と組み合わされる。アンチストロ
ークスコアリング法は、2値化アルゴリズムが、主として他の文字のサブセット
である文字をマッチングしようとする特別なケース(例えば、実際の走査イメー
ジが「3」の文字80を含んでいる場合に「8」の文字78とマッチングしよう
とする場合)をカバーするために使用される。
で用いられるアンチストロークスコアリング法と組み合わされる。アンチストロ
ークスコアリング法は、2値化アルゴリズムが、主として他の文字のサブセット
である文字をマッチングしようとする特別なケース(例えば、実際の走査イメー
ジが「3」の文字80を含んでいる場合に「8」の文字78とマッチングしよう
とする場合)をカバーするために使用される。
【0085】
2値化アルゴリズムは、走査イメージ文字の輪郭をその外周72のすぐ外側を
論理的にトレースするので、サブセット文字80は、一致する文字の輪郭82が
走査イメージ文字80と交差する領域で、いくつかのミスマッチを明らかにする
。例えば、上述のケースでは、もしアルゴリズムが「8」の文字78の輪郭を論
理的にトレースしており、ただし走査イメージが実際には「3」の文字80であ
れば、アルゴリズムは、「3」の文字80の2つの外方端部が「8」の文字78
の論理的トレースパスと重なる領域84でアンチストロークカウントを発生させ
る。しかし、アンチストロークカウントを引き起こす不一致の結果になるような
画素は一般にほんの一握りである。
論理的にトレースするので、サブセット文字80は、一致する文字の輪郭82が
走査イメージ文字80と交差する領域で、いくつかのミスマッチを明らかにする
。例えば、上述のケースでは、もしアルゴリズムが「8」の文字78の輪郭を論
理的にトレースしており、ただし走査イメージが実際には「3」の文字80であ
れば、アルゴリズムは、「3」の文字80の2つの外方端部が「8」の文字78
の論理的トレースパスと重なる領域84でアンチストロークカウントを発生させ
る。しかし、アンチストロークカウントを引き起こす不一致の結果になるような
画素は一般にほんの一握りである。
【0086】
ここで図5Aを参照すると、他の特別な文字は「7」の文字74および「1」
の文字75である。もし適切にオフセットされれば、「7」の文字74はフォン
ト中の他の数字のほとんどとよく調和する。特定の文字について多くの起源が試
されるので、「7」の文字74が、これがフォントセット中の他の文字の多くに
ついての正しいマッチと思われる決定的なポジションに達するのは容易である。
例えば、複雑な背景と単純な背景を有する121枚のカードの試運転において、
97の不一致のうち55は、別の文字として読み誤られた「7」の文字74であ
った。換言すれば、エラーの半数以上は、何もなかったところにアルゴリズムが
「7」の文字74を認識したことになる。
の文字75である。もし適切にオフセットされれば、「7」の文字74はフォン
ト中の他の数字のほとんどとよく調和する。特定の文字について多くの起源が試
されるので、「7」の文字74が、これがフォントセット中の他の文字の多くに
ついての正しいマッチと思われる決定的なポジションに達するのは容易である。
例えば、複雑な背景と単純な背景を有する121枚のカードの試運転において、
97の不一致のうち55は、別の文字として読み誤られた「7」の文字74であ
った。換言すれば、エラーの半数以上は、何もなかったところにアルゴリズムが
「7」の文字74を認識したことになる。
【0087】
アンチストローク技術を2値化アウトライン技術に組み込むことにより、この
特定の問題の排除に役立つ。カード上に置かれたカラートッピングが背景色と一
致しているという特殊なケースの排除にも役立つ。2値化アルゴリズムは前景画
素と背景画素との識別に依存しているので、アルゴリズムはサーチ窓中のいくつ
の画素が背景として分類されるかを求めることによりこの発生を検出する。前景
画素のある閾値が交差された(例えば、サーチ窓中の画素の40%以上がすべて
前景としてマークされる)ことをアルゴリズムが検出すれば、アルゴリズムは不
一致を排除できる。もしそうであれば、アルゴリズムは文字前景が背景と一致す
るとみなす。
特定の問題の排除に役立つ。カード上に置かれたカラートッピングが背景色と一
致しているという特殊なケースの排除にも役立つ。2値化アルゴリズムは前景画
素と背景画素との識別に依存しているので、アルゴリズムはサーチ窓中のいくつ
の画素が背景として分類されるかを求めることによりこの発生を検出する。前景
画素のある閾値が交差された(例えば、サーチ窓中の画素の40%以上がすべて
前景としてマークされる)ことをアルゴリズムが検出すれば、アルゴリズムは不
一致を排除できる。もしそうであれば、アルゴリズムは文字前景が背景と一致す
るとみなす。
【0088】
III. アウトライニングを伴う色ベースの2値分離
本発明の1つの実施形態は、考えられるすべての文字テンプレートをサーチ窓
中の考えられるすべての文字起源に対してマッチングさせ、実際のイメージと最
もよく一致する文字テンプレートを「読み取られた」文字として選択するという
原理に基づいている。もし読み取られた文字が予期される文字と一致すれば、テ
ストはパスし、かつ評価は次の文字ポジションへ進む。
中の考えられるすべての文字起源に対してマッチングさせ、実際のイメージと最
もよく一致する文字テンプレートを「読み取られた」文字として選択するという
原理に基づいている。もし読み取られた文字が予期される文字と一致すれば、テ
ストはパスし、かつ評価は次の文字ポジションへ進む。
【0089】
本発明の1つの実施形態においては、一致された文字テンプレートのセットが
フォント定義に組み入れられる。例えば、フォント定義は、各文字の幅と高さが
固定(すべての文字は同一サイズである)という原則に基づくことができる。文
字セルは次に、どの画素が文字の中心線上にあるかを示す。例えば、「0」の文
字は矩形の画素配列として表され、背景画素は白色であり、「0」を描く際に中
心線にくる実際の画素は黒色である。さらに、中間領域にある画素を示すグレー
ゾーンがある(例えば、これらは、中心線上にないが、背景でもない画素である
)。
フォント定義に組み入れられる。例えば、フォント定義は、各文字の幅と高さが
固定(すべての文字は同一サイズである)という原則に基づくことができる。文
字セルは次に、どの画素が文字の中心線上にあるかを示す。例えば、「0」の文
字は矩形の画素配列として表され、背景画素は白色であり、「0」を描く際に中
心線にくる実際の画素は黒色である。さらに、中間領域にある画素を示すグレー
ゾーンがある(例えば、これらは、中心線上にないが、背景でもない画素である
)。
【0090】
空白文字は、どのような実際のイメージ定義も与えられていないので、フォン
ト中の特別な文字である。しかし、文字幅(画素で表す)は指定される。空白文
字は、フォント中の他の文字と幅が異なることができる唯一の文字である。これ
により、可変ピッチフォントを含む、一般に使用されるフォントを取り扱うシス
テムが可能になる。可変ピッチフォントは、たとえ他の文字の幅が様々であって
も、文字幅が同じ数字文字を一般に有している。これは、印刷されたページ上で
、数字の列が実際に整列するようにするためである。従って、ほとんどの可変ピ
ッチフォントは、本発明の原理を用いて取り扱うことができる。
ト中の特別な文字である。しかし、文字幅(画素で表す)は指定される。空白文
字は、フォント中の他の文字と幅が異なることができる唯一の文字である。これ
により、可変ピッチフォントを含む、一般に使用されるフォントを取り扱うシス
テムが可能になる。可変ピッチフォントは、たとえ他の文字の幅が様々であって
も、文字幅が同じ数字文字を一般に有している。これは、印刷されたページ上で
、数字の列が実際に整列するようにするためである。従って、ほとんどの可変ピ
ッチフォントは、本発明の原理を用いて取り扱うことができる。
【0091】
可変ピッチフォントは、数字文字について空白文字に対して異なる幅を有する
ことができる。空白文字は、カード上に配置された口座番号中の数字を分離する
ために一般に用いられる。従って、空白文字の幅はフォント定義の一部として指
定されるべきである。
ことができる。空白文字は、カード上に配置された口座番号中の数字を分離する
ために一般に用いられる。従って、空白文字の幅はフォント定義の一部として指
定されるべきである。
【0092】
文字のためのサーチ窓は、現在使用されているフォントの特性として定義され
る。理想的には、カード上に配置された文字の正確な位置が既知であり、それに
より、文字が正しいかどうかを照合するにはカードイメージ上の1つの位置のみ
をチェックすればよい。当然ながら、種々のフォントについて文字配置における
多少の変化がある。文字配置公差は、文字をインプリントする種々の方法により
異なる。例えば、エンボッサーには1つの公差があり、UltraGraphixには別の公
差が有り、他の方法にはそれ自身の配置誤差がある。
る。理想的には、カード上に配置された文字の正確な位置が既知であり、それに
より、文字が正しいかどうかを照合するにはカードイメージ上の1つの位置のみ
をチェックすればよい。当然ながら、種々のフォントについて文字配置における
多少の変化がある。文字配置公差は、文字をインプリントする種々の方法により
異なる。例えば、エンボッサーには1つの公差があり、UltraGraphixには別の公
差が有り、他の方法にはそれ自身の配置誤差がある。
【0093】
従って、文字を照合する時には、予期される位置に中心のある文字について複
数の候補位置を見ることが必要である。もし文字が5画素(文字は、予期される
位置の上下左右の5画素であり得る)であれば、その文字について全部で121
の位置(左に5個、右に5個、中心について1個あり、縦軸についても同じ個数
のセットがある)が考えられる。公差が広くなれば、より多くの考えられる文字
位置が検査されなければならない。
数の候補位置を見ることが必要である。もし文字が5画素(文字は、予期される
位置の上下左右の5画素であり得る)であれば、その文字について全部で121
の位置(左に5個、右に5個、中心について1個あり、縦軸についても同じ個数
のセットがある)が考えられる。公差が広くなれば、より多くの考えられる文字
位置が検査されなければならない。
【0094】
任意の候補位置で文字一致を採点するため、テンプレートは実際のイメージの
上に重ねられる。テンプレート上の中心線画素の直下にくる画素が解析される。
これらの画素は基準画素である。理想的には、これらすべての画素は、正しい文
字テンプレートについて正確に同じ色である。もしこのシステムが現在の文字位
置で「0」を読み取ることを予期していたら、最良の場合でも、このシステムは
同じ正確な色において0の文字を作っているすべての画素を見る程度であろう。
上に重ねられる。テンプレート上の中心線画素の直下にくる画素が解析される。
これらの画素は基準画素である。理想的には、これらすべての画素は、正しい文
字テンプレートについて正確に同じ色である。もしこのシステムが現在の文字位
置で「0」を読み取ることを予期していたら、最良の場合でも、このシステムは
同じ正確な色において0の文字を作っているすべての画素を見る程度であろう。
【0095】
しかし、実際には、画素色は、正しい文字ポジションの正しい文字テンプレー
ト上の中心線画素についてまったくしばしば非常に近い。色差は、0〜255ス
ケールでの赤、緑および青の色チャンネルの各々についてしばしば5以下程度で
ある。
ト上の中心線画素についてまったくしばしば非常に近い。色差は、0〜255ス
ケールでの赤、緑および青の色チャンネルの各々についてしばしば5以下程度で
ある。
【0096】
また、正しい文字一致のための中心線から離れている画素は、基準色とはかな
り異なるはずである。現在の文字テンプレートの矩形領域中の各画素が基準画素
と比較される。もしテスト画素が基準画素色の1つと非常に近ければ、その場合
にその画素は前景としてカウントされる。そうでなければ、背景としてカウント
される。中心線から離れた画素は背景の一部となるはずである。
り異なるはずである。現在の文字テンプレートの矩形領域中の各画素が基準画素
と比較される。もしテスト画素が基準画素色の1つと非常に近ければ、その場合
にその画素は前景としてカウントされる。そうでなければ、背景としてカウント
される。中心線から離れた画素は背景の一部となるはずである。
【0097】
文字一致(カードイメージ上の特定位置の特定の文字テンプレート)について
実際のスコアを計算するためには、実際に背景画素として際立たせるテンプレー
トの背景中の画素数を解析しなければならない。基準画素との比較に基づいて背
景として実際に分類された背景領域画素のパーセンテージが最大である文字は、
「読み取られた」文字である。
実際のスコアを計算するためには、実際に背景画素として際立たせるテンプレー
トの背景中の画素数を解析しなければならない。基準画素との比較に基づいて背
景として実際に分類された背景領域画素のパーセンテージが最大である文字は、
「読み取られた」文字である。
【0098】
スコア計算の際に無視される、文字中心線のすぐまわりを囲んでいる中間領域
があることに留意されたい。これらは前景画素として分類される可能性の高い画
素であるが、これらは、それらがなり得ない文字の中心線から十分に遠く離れ得
る。これらは、このアルゴリズムについては完全に無視されるあいまいな境界画
素である。
があることに留意されたい。これらは前景画素として分類される可能性の高い画
素であるが、これらは、それらがなり得ない文字の中心線から十分に遠く離れ得
る。これらは、このアルゴリズムについては完全に無視されるあいまいな境界画
素である。
【0099】
どれほど近ければある画素を前景として分類するのに十分に近いかの決定は統
計的になされる。基準セット自体については、統計データは色サンプル間の距離
に基づいて計算される。この距離は、「rgb」空間中の色サンプル間のユーク
リッド距離である。
計的になされる。基準セット自体については、統計データは色サンプル間の距離
に基づいて計算される。この距離は、「rgb」空間中の色サンプル間のユーク
リッド距離である。
【0100】
赤、緑および青の値の差は独立して取られる。次にこの差を自乗し、合計する
。最後に、合計の平方根を取って、ユークリッド距離を以下のように得る。 d = sqrt((rl-r2)^2 + (gl-g2)^2 +(bl-b2)^2)
。最後に、合計の平方根を取って、ユークリッド距離を以下のように得る。 d = sqrt((rl-r2)^2 + (gl-g2)^2 +(bl-b2)^2)
【0101】
基準色間の平均距離は、閾値選択の基礎である。ある文字セルについて他の画
素を解析する場合には、システムは単に最も近い基準画素(色の)を見い出し、
距離を計算し、もしその画素が選択された閾値内であれば前景として分類する。
そうでなければ、それは背景である。
素を解析する場合には、システムは単に最も近い基準画素(色の)を見い出し、
距離を計算し、もしその画素が選択された閾値内であれば前景として分類する。
そうでなければ、それは背景である。
【0102】
図6には、種々の機能を実行するための種々のモジュールを含むカード製造装
置86のブロック図が例示してある。例えば1つの実施形態において、カード上
に配置しそして照合するための適切な個人化データの入力および出力を含む装置
の様々な製造機能を電子的に制御するためにコントローラ88が備えてある。
置86のブロック図が例示してある。例えば1つの実施形態において、カード上
に配置しそして照合するための適切な個人化データの入力および出力を含む装置
の様々な製造機能を電子的に制御するためにコントローラ88が備えてある。
【0103】
コントローラ88はカード上に配置する個人化データを、以下のモジュール、
すなわちエンボッサーモジュール90、グラフィックスプリンタ92、磁気スト
ライプエンコーダ94等、のいずれか1つまたはすべてにダウンロードする。こ
れらの特定のモジュールを開示してきたが、これらは、様々なスタイルおよび形
式のカード上に証印を配置できるどのようなモジュールも本発明の原理を逸脱す
ることなく代替できる。
すなわちエンボッサーモジュール90、グラフィックスプリンタ92、磁気スト
ライプエンコーダ94等、のいずれか1つまたはすべてにダウンロードする。こ
れらの特定のモジュールを開示してきたが、これらは、様々なスタイルおよび形
式のカード上に証印を配置できるどのようなモジュールも本発明の原理を逸脱す
ることなく代替できる。
【0104】
いったん情報がカードに配置されたら、その情報は、本明細書で説明された光
学式照合モジュール96により照合されなければならない。さらに、カード上へ
の証印を配置し、その証印を個人化データの様々なデータベース、基準テンプレ
ートデータおよび走査データデータベースに対して照合する作業に伴う、その他
の機能を実行するために、付加的なモジュール98をカード製造装置へ直列また
は並列にいくつでも連結できる。
学式照合モジュール96により照合されなければならない。さらに、カード上へ
の証印を配置し、その証印を個人化データの様々なデータベース、基準テンプレ
ートデータおよび走査データデータベースに対して照合する作業に伴う、その他
の機能を実行するために、付加的なモジュール98をカード製造装置へ直列また
は並列にいくつでも連結できる。
【0105】
以上、本発明の特定の好ましい実施例を参照して本発明を詳細に説明してきた
が、他の実施例も可能である。従って、付属の請求項の精神および範囲は、本明
細書中に含まれる好ましい実施例の説明に限定されるべきではない。
が、他の実施例も可能である。従って、付属の請求項の精神および範囲は、本明
細書中に含まれる好ましい実施例の説明に限定されるべきではない。
【図1】
走査イメージの画素強度ヒストグラムを示す図である。
【図2】
本発明の1つの実施形態を実行するために用いられる装置環境を示す図である
。
。
【図3A】
文字テンプレートデータベースの図である。
【図3B】
個人化データベースの図である。
【図3C】
走査データ、データベースの図である。
【図3D】
本発明の1つの実施形態による、走査文字を解析するためのトポロジカル法の
概略図である。
概略図である。
【図4】
走査文字画素強度ヒストグラムを示す図である。
【図5A】
本発明の1つの実施形態による、走査文字解析のための2値化アウトライニン
グ法の概略図である。
グ法の概略図である。
【図5B】
本発明の1つの実施形態による、走査文字解析のための2値化アウトライニン
グ法の概略図である。
グ法の概略図である。
【図6】
本発明の1つの実施形態による、イメージ照合モジュールを含むカード製造装
置のブロック図である。
置のブロック図である。
─────────────────────────────────────────────────────
フロントページの続き
(81)指定国 EP(AT,BE,CH,CY,
DE,DK,ES,FI,FR,GB,GR,IE,I
T,LU,MC,NL,PT,SE),OA(BF,BJ
,CF,CG,CI,CM,GA,GN,GW,ML,
MR,NE,SN,TD,TG),AP(GH,GM,K
E,LS,MW,MZ,SD,SL,SZ,TZ,UG
,ZW),EA(AM,AZ,BY,KG,KZ,MD,
RU,TJ,TM),AE,AG,AL,AM,AT,
AU,AZ,BA,BB,BG,BR,BY,BZ,C
A,CH,CN,CR,CU,CZ,DE,DK,DM
,DZ,EE,ES,FI,GB,GD,GE,GH,
GM,HR,HU,ID,IL,IN,IS,JP,K
E,KG,KP,KR,KZ,LC,LK,LR,LS
,LT,LU,LV,MA,MD,MG,MK,MN,
MW,MX,MZ,NO,NZ,PL,PT,RO,R
U,SD,SE,SG,SI,SK,SL,TJ,TM
,TR,TT,TZ,UA,UG,UZ,VN,YU,
ZA,ZW
(72)発明者 ニコルス, ディーン アール.
アメリカ合衆国 ミネソタ州 55038,
ヒューゴ, 11577−124ティーエイチ.エ
スティー.エヌ.
(72)発明者 ジョンソン, ブライアン ピー.
アメリカ合衆国 ミネソタ州 55346,
エデン プレイリー, パーク ビュー
レーン 6809
Fターム(参考) 5B029 AA05 EE14
5B058 CA35 YA18
5B064 DC06 DC11
【要約の続き】
Claims (65)
- 【請求項1】 イメージを照合するためのイメージ照合装置であって、 照明源と、 イメージを走査し、前記照明源により照明された前記イメージを電子可読形式
へ変換するイメージスキャナと、 プログラムを実行するコンピュータと、 第1と第2の境界およびその間に主要部分を有し、強度変化を示す離散的要素
の配列にて、前記電子可読走査イメージを記憶するための記憶装置と、 前記記憶装置の別個の部分に所定イメージを記憶可能なプログラマブルテンプ
レートと、 前記走査イメージを前記所定イメージに対して照合するためのイメージ認識ロ
ジックとを含むイメージ照合装置。 - 【請求項2】 前記イメージ認識ロジックは、強度変化を示す離散的要素
の前記配列を前記所定イメージに対して解析することにより、前記走査イメージ
を論理的に照合する、請求項1に記載のイメージ照合装置。 - 【請求項3】 強度変化の前記離散的要素の前記解析は、 前記走査イメージを表す強度変化の離散的要素の前記配列の輪郭を、前記所定
イメージのプログラムされたテンプレートから得られる情報に従って前記主要部
分に沿って論理的にトレースすることと、 トレース方向に沿って、前記第1および第2の境界に沿って前記要素の強度が
、前記主要部分または要素の前記配列内部の前記要素の強度から著しく変動する
ことを照合することをさらに含む、請求項2に記載のイメージ照合装置。 - 【請求項4】 前記要素は画素である、請求項1に記載のイメージ照合装
置。 - 【請求項5】 前記画素は画素強度に応じてグレースケール形式で記憶さ
れる、請求項4に記載のイメージ照合装置。 - 【請求項6】 前記イメージ認識ロジックは、前記走査イメージの前記解
析に先立って、各要素について正規化を行う、請求項2に記載のイメージ照合装
置。 - 【請求項7】 各要素の前記強度正規化は、以下の式、 ここで、cは正規化された画素強度、 rは生の値、 Bは黒の出力値、 Wは白の出力値、 bは黒の入力値、 wは白の入力値、 に従って実行される、請求項6に記載のイメージ照合装置。
- 【請求項8】 各要素の前記強度正規化は、以下の式、 y = y0 + (y1 - y0)/(x1 - x0)*(x - x0) ここで、yは正規化された画素強度、 xは生の値、 y0はダークノルム値、 y1はブライトノルム値、 x0はダーク基準値、 x1はブライト基準値、 に従って実行される、請求項6に記載のイメージ照合装置。
- 【請求項9】 前記イメージ認識ロジックは、要素の前記配列の前記主要
部分内の前記要素の強度から著しく強度が変動する前記第1および第2の境界に
沿って前記要素の数に基づいて前記走査イメージについてスコアを計算する、請
求項3に記載のイメージ照合装置。 - 【請求項10】 前記イメージ認識ロジックは、前記解析の実行に先立っ
て、その中で動作するための色平面を選択する、請求項1に記載のイメージ照合
装置。 - 【請求項11】 前記色平面は、赤、緑および青の色平面のいずれか1つ
である、請求項10に記載のイメージ照合装置。 - 【請求項12】 前記照明源は、発光ダイオード(LED)をさらに含む
、請求項1に記載のイメージ照合装置。 - 【請求項13】 前記イメージスキャナは電荷結合素子を含む、請求項1
に記載のイメージ照合装置。 - 【請求項14】 前記イメージ認識ロジックは、前記走査イメージの2値
分離を実行しかつ前記走査イメージ領域外に位置する領域を前記所定イメージ領
域および背景領域に対して解析することにより、前記走査イメージを論理的に照
合する、請求項1に記載のイメージ照合装置。 - 【請求項15】 前記走査イメージおよび解析の前記2値分離は、 前記走査イメージを表す強度変化の離散的要素の前記配列の輪郭を、前記走査
イメージの部分に沿って、前記走査イメージの領域外に位置する背景領域に沿っ
て、前記所定イメージのプログラムされたテンプレートから得られる情報に従っ
て論理的にトレースすることと、 トレース方向に沿って、前記トレース輪郭に沿った背景要素の数が、所定のス
コアリング閾値以下であることを照合することをさらに含む、請求項14に記載
のイメージ照合装置。 - 【請求項16】 走査メージを照合するための走査イメージ照合装置であ
って、 プログラムを実行するコンピュータと、 第1と第2の境界およびその間に主要部分を有し、強度変化を示す離散的要素
の配列にて、電子可読走査イメージを記憶するための記憶装置と、 前記記憶装置の別個の部分に所定イメージを記憶可能なプログラマブルテンプ
レートと、 前記走査イメージを前記所定イメージに対して照合するためのイメージ認識ロ
ジックとを含む、走査イメージ照合装置。 - 【請求項17】 前記イメージ認識ロジックは、強度変化の離散的要素の
前記配列を前記所定イメージに対して解析することにより、前記走査イメージを
論理的に照合する、請求項16に記載の走査イメージ照合装置。 - 【請求項18】 強度変化の前記離散的要素の前記解析は、 前記走査イメージを表す強度変化の離散的要素の前記配列の輪郭を、前記所定
イメージのプログラムされたテンプレートから得られる情報に従って前記主要部
分に沿って論理的にトレースすることと、 トレース方向に沿って、前記第1および第2の境界に沿って前記要素の強度が
、前記主要部分または要素の前記配列内部の前記要素の強度から著しく変動する
ことを照合することをさらに含む、請求項17に記載の走査イメージ照合装置。 - 【請求項19】 前記要素は画素である、請求項16に記載の走査イメー
ジ照合装置。 - 【請求項20】 前記画素は画素強度に応じてグレースケール形式で記憶
される、請求項19に記載の走査イメージ照合装置。 - 【請求項21】 前記イメージ認識ロジックは、前記走査イメージの前記
解析に先立って、各要素について正規化を行う、請求項17に記載の走査イメー
ジ照合装置。 - 【請求項22】 各要素の前記強度正規化は、以下の式、 ここで、cは正規化された画素強度、 rは生の値、 Bは黒の出力値、 Wは白の出力値、 bは黒の入力値、 wは白の入力値、 に従って実行される、請求項21に記載の走査イメージ照合装置。
- 【請求項23】 各要素の前記強度正規化は、以下の式、 y = y0 + (y1 - y0)/(x1 - x0)*(x - x0) ここで、yは正規化された画素強度、 xは生の値、 y0はダークノルム値、 y1はブライトノルム値、 x0はダーク基準値、 x1はブライト基準値、 に従って実行される、請求項21に記載の走査イメージ照合装置。
- 【請求項24】 前記イメージ認識ロジックが、要素の前記配列の前記主
要部分内の前記要素の強度から著しく強度が変動する前記第1および第2の境界
に沿って前記要素の数に基づいて前記走査イメージについてスコアを計算する、
請求項18に記載の走査イメージ照合装置。 - 【請求項25】 前記イメージ認識ロジックは、前記解析の実行に先立っ
て、その中で動作するための色平面を選択する、請求項16に記載の走査イメー
ジ照合装置。 - 【請求項26】 前記色平面は、赤、緑および青の色平面のいずれか1つ
である、請求項25に記載の走査イメージ照合装置。 - 【請求項27】 前記照明源は、発光ダイオード(LED)をさらに含む
、請求項16に記載の走査イメージ照合装置。 - 【請求項28】 前記イメージスキャナは電荷結合素子を含む、請求項1
6に記載の走査イメージ照合装置。 - 【請求項29】 前記イメージ認識ロジックは、前記走査イメージの2値
分離を実行しかつ前記走査イメージ領域外に位置する領域を前記所定イメージ領
域および背景領域に対して解析することにより、前記走査イメージを論理的に照
合する、請求項16に記載の走査イメージ照合装置。 - 【請求項30】 前記走査イメージおよび解析の前記2値分離は、 前記走査イメージを表す強度変化の離散的要素の前記配列の輪郭を、前記走査
イメージの部分に沿って、前記走査イメージの領域外に位置する背景領域に沿っ
て、前記所定イメージのプログラムされたテンプレートから得られる情報に従っ
て論理的にトレースすることと、 トレース方向に沿って、前記トレース輪郭に沿った背景要素の数が、所定のス
コアリング閾値以下であることを照合することをさらに含む、請求項29に記載
の走査イメージ照合装置。 - 【請求項31】 カード上に証印を配置しかつ該認証を照合するためのカ
ード製造装置であって、 証印を表面に配置したカードを製造するべく配列された複数のカード製造モジ
ュールを含み、該モジュールの少なくとも1つが、前記カードの一部における走
査イメージの強度変化を用いている証印照合モジュールである、カード製造装置
。 - 【請求項32】 前記カード製造モジュールの少なくとも1つはエンボッ
サーである、請求項31に記載のカード製造装置。 - 【請求項33】 前記カード製造モジュールの少なくとも1つはプリンタ
である、請求項31に記載のカード製造装置。 - 【請求項34】 前記カード製造モジュールの少なくとも1はレーザー彫
刻装置である、請求項31に記載のカード製造装置。 - 【請求項35】 前記カード上に配置された前記証印を照合する前記カー
ド製造モジュールの少なくとも1つは、 照明源と、 イメージを走査し、前記照明源により照明された前記イメージを電子可読形式
へ変換するイメージスキャナと、 プログラムを実行するコンピュータと、 第1と第2の境界およびその間に主要部分を有し、強度変化を示す離散的要素
の配列にて、前記電子可読走査イメージを記憶するための記憶装置と、 前記記憶装置の別個の部分に所定イメージを記憶可能なプログラマブルテンプ
レートと、 前記走査イメージを前記所定イメージに対して照合するためのイメージ認識ロ
ジックとをさらに含む、請求項31に記載のカード製造装置。 - 【請求項36】 前記イメージ認識ロジックは、強度変化の離散的要素の
前記配列を前記所定のイメージに対して解析することにより、前記走査イメージ
を論理的に照合する、請求項35に記載のカード製造装置。 - 【請求項37】 変動変動の前記離散的要素の前記解析は、 前記走査イメージを表す強度変化の離散的要素の前記配列の輪郭を、前記所定
イメージのプログラムされたテンプレートから得られる情報に従って前記主要部
分に沿って論理的にトレースすることと、 トレース方向に沿って、前記第1および第2の境界に沿って前記要素の強度が
、前記主要部分または要素の前記配列内部の前記要素の強度から著しく変動する
ことを照合することをさらに含む、請求項36に記載のカード製造装置。 - 【請求項38】 前記要素は画素である、請求項35に記載のカード製造
装置。 - 【請求項39】 前記画素は画素強度に応じてグレースケール形式で記憶
される、請求項38に記載のカード製造装置。 - 【請求項40】 前記イメージ認識ロジックは、前記走査イメージの前記
解析に先立って、各要素について正規化を行う、請求項31に記載のカード製造
装置。 - 【請求項41】 各要素の前記強度正規化は、以下の式、 ここで、cは正規化された画素強度、 rは生の値、 Bは黒の出力値、 Wは白の出力値、 bは黒の入力値、 wは白の入力値、 に従って実行される、請求項40に記載のカード製造装置。
- 【請求項42】 各要素の前記強度正規化は、以下の式、 y = y0 + (y1 - y0)/(x1 - x0)*(x - x0) ここで、yは正規化された画素強度、 xは生の値、 y0はダークノルム値、 y1はブライトノルム値、 x0はダーク基準値、 x1はブライト基準値である に従って実行される、請求項40に記載のカード製造装置。
- 【請求項43】 前記イメージ認識ロジックは、要素の前記配列の前記主
要部分内の前記要素の強度から著しく強度が変動する前記第1および第2の境界
に沿って前記要素の数に基づいて前記走査イメージについてスコアを計算する、
請求項40に記載のカード製造装置。 - 【請求項44】 前記イメージ認識ロジックは、前記解析の実行に先立っ
て、その中で動作するための色平面を選択する、請求項35に記載のカード製造
装置。 - 【請求項45】 前記色平面は、赤、緑および青の色平面のいずれか1つ
である、請求項44に記載のカード製造装置。 - 【請求項46】 前記照明源は、発光ダイオード(LED)をさらに含む
、請求項35に記載のカード製造装置。 - 【請求項47】 前記イメージスキャナは電荷結合素子を含む、請求項3
5に記載のカード製造装置。 - 【請求項48】 前記イメージ認識ロジックは、前記走査イメージの2値
分離を実行しかつ前記走査イメージ領域外に位置する領域を前記所定イメージ領
域および背景領域に対して解析することにより、前記走査イメージを論理的に照
合する、請求項35に記載のカード製造装置。 - 【請求項49】 前記走査イメージおよび解析の前記2値分離は、 前記走査イメージを表す強度変化の離散的要素の前記配列の輪郭を、前記走査
イメージの部分に沿って、前記走査イメージの領域外に位置する背景領域に沿っ
て、前記所定イメージのプログラムされたテンプレートから得られる情報に従っ
て論理的にトレースすることと、 トレース方向に沿って、前記トレース輪郭に沿った背景要素の数が、所定のス
コアリング閾値以下であることを照合することをさらに含む、請求項48に記載
のカード製造装置。 - 【請求項50】 走査イメージを照合するための方法であって、 イメージを走査することと、 前記走査イメージを電子可読形式へ変換することと、 前記走査イメージを、強度変化の離散的要素の配列として記憶することと、 強度変化の離散的要素の前記配列を所定イメージに対して解析することとを含
む、方法。 - 【請求項51】 強度変化の前記離散的要素の前記解析は、 前記走査イメージを表す強度変化の離散的要素の前記配列の輪郭を、前記所定
イメージのプログラムされたテンプレートから得られる情報に従って前記配列の
主要部分に沿って論理的にトレースすることと、 トレース方向に沿って、前記第1および第2の境界に沿って前記要素の強度が
、前記主要部分または要素の前記配列内部の前記要素の強度から著しく変動する
ことを照合することをさらに含む、請求項50に記載の方法。 - 【請求項52】 前記イメージの解析に先立ち、各要素の強度を正規化す
ることをさらに含む、請求項50に記載の方法。 - 【請求項53】 前記イメージ強度正規化は、以下の式、 ここで、cは正規化された画素強度、 rは生の値、 Bは黒の出力値、 Wは白の出力値、 bは黒の入力値、 wは白の入力値、 に従って実行される、請求項52に記載の方法。
- 【請求項54】 前記イメージ強度正規化は、以下の式、 y=y0+(y1-y0)/(x1-x0)*(x-x0) ここで、yは正規化された画素強度、 xは生の値、 y0はダークノルム値、 y1はブライトノルム値、 x0はダーク基準値、 x1はブライト基準値である、 に従って実行される、請求項52に記載の方法。
- 【請求項55】 要素の前記配列の前記主要部分内の前記要素の強度から
著しく強度が変動する前記第1および第2の境界に沿って前記要素の数に基づい
て前記走査イメージについてスコアを計算することをさらに含む、請求項51に
記載の方法。 - 【請求項56】 前記トポロジカル解析の実行に先立ち、その中で動作す
るための色平面を選択することをさらに含む、請求項50に記載の方法。 - 【請求項57】 前記色平面選択段階は、赤、緑および青の色平面のいず
れか1つを選択することを含む、請求項56に記載の走査イメージ照合装置。 - 【請求項58】 前記離散的要素の前記解析は、前記走査イメージの2値
分離を実行しかつ前記走査イメージ領域外に位置する領域を前記所定イメージ領
域および背景領域に対して解析することにより前記走査イメージを論理的に照合
することをさらに含む、請求項50に記載の方法。 - 【請求項59】 前記離散的要素の前記解析は、 前記走査イメージを表す強度変化の離散的要素の前記配列の輪郭を、前記走査
イメージの部分に沿って、前記走査イメージの領域外に位置する背景領域に沿っ
て、前記所定イメージのプログラムされたテンプレートから得られる情報に従っ
て論理的にトレースすることと、 トレース方向に沿って、前記トレース輪郭に沿った背景要素の数が、所定のス
コアリング閾値以下であることを照合することをさらに含む、請求項58に記載
の方法。 - 【請求項60】 記憶媒体上のコンピュータプログラムであって、 記憶装置内に所定イメージを記憶することが可能なプログラマブルテンプレー
トと、 イメージを前記所定イメージに対して照合するためのイメージ認識ロジックと
を含む、コンピュータプログラム。 - 【請求項61】 前記イメージ認識ロジックは、強度変化の離散的要素の
前記配列を前記所定イメージに対して解析することによって走査イメージを論理
的に照合する、請求項60に記載のコンピュータプログラム。 - 【請求項62】 第1と第2の境界およびその間の主要部分の間の強度変
化の前記離散的要素の前記解析は、 前記走査イメージを表す強度変化の離散的要素の前記配列の輪郭を、前記所定
のイメージのプログラムされたテンプレートから得られる情報に従って前記主要
部分に沿って論理的にトレースし、 トレース方向に沿って、前記第1および第2の境界に沿って前記要素の強度が
要素の前記配列の前記主要部分内部の前記要素の強度から著しく変動することを
照合するためのプログラム手段をさらに含む、請求項61に記載のコンピュータ
プログラム。 - 【請求項63】 前記イメージ認識ロジックは、前記走査イメージの2値
分離を実行しかつ前記走査イメージ領域外に位置する領域を前記所定イメージ領
域および背景領域に対して解析することにより前記走査イメージを論理的に照合
する、請求項60に記載のコンピュータプログラム。 - 【請求項64】 前記走査イメージおよび解析の前記2値分離は、 前記走査イメージを表す強度変化の離散的要素の前記配列の輪郭を、前記走査
イメージの部分に沿って、前記走査イメージの領域外に位置する背景領域に沿っ
て、前記所定イメージのプログラムされたテンプレートから得られる情報に従っ
て論理的にトレースすることと、 トレース方向に沿って、前記トレース輪郭に沿った背景要素の数が、所定のス
コアリング閾値以下であることを照合することを含む、請求項63に記載のコン
ピュータプログラム。 - 【請求項65】 カードイメージデータおよび該カードイメージデータの
位置を識別する座標とを含む第1の個人化データベースと、イメージを識別する
ためのデータを含む第2のテンプレートデータベースと、走査イメージデータお
よびカード上の走査データの位置を識別する座標を含む第3のデータベースとを
有するコンピュータシステムにおける、カード上の走査イメージを照合するため
の方法であって、 記憶装置から第1の個人化データベースをコンピュータ内のメモリの第1の領
域へロードする段階と、 前記コンピュータ内のメモリの第2の領域から第2のテンプレートデータベー
スをロードする段階と、 前記コンピュータ内のメモリの第3の領域へ第3の走査イメージデータベース
をロードする段階と、 第1の座標位置のカードから得られた前記走査イメージデータが、前記第2の
テンプレートデータに従い前記座標位置で識別された前記個人化データと一致す
ることを照合する段階とを含む、方法。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US09/362,197 | 1999-07-28 | ||
US09/362,197 US6628808B1 (en) | 1999-07-28 | 1999-07-28 | Apparatus and method for verifying a scanned image |
PCT/US2000/020306 WO2001009822A1 (en) | 1999-07-28 | 2000-07-26 | Apparatus and method for verifying a scanned image |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2003506767A true JP2003506767A (ja) | 2003-02-18 |
Family
ID=23425076
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2001514365A Pending JP2003506767A (ja) | 1999-07-28 | 2000-07-26 | 走査イメージを照合するための装置および方法 |
Country Status (6)
Country | Link |
---|---|
US (1) | US6628808B1 (ja) |
EP (1) | EP1204945A1 (ja) |
JP (1) | JP2003506767A (ja) |
AU (1) | AU6376800A (ja) |
CA (1) | CA2379952A1 (ja) |
WO (1) | WO2001009822A1 (ja) |
Families Citing this family (158)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3662769B2 (ja) * | 1999-05-12 | 2005-06-22 | 株式会社東研 | カラー画像対応のコード読取装置及び方法 |
US8645137B2 (en) | 2000-03-16 | 2014-02-04 | Apple Inc. | Fast, language-independent method for user authentication by voice |
AU2002230484A1 (en) * | 2000-11-16 | 2002-05-27 | Interlegis, Inc. | System and method of managing documents |
US6748102B2 (en) * | 2001-01-24 | 2004-06-08 | International Business Machines Corporation | Document alteration indicating system and method |
JP2004334402A (ja) * | 2003-05-02 | 2004-11-25 | Seiko Epson Corp | 小切手処理装置、プログラム、記録媒体、pos端末並びにposシステム |
US7143942B2 (en) * | 2003-09-01 | 2006-12-05 | Seiko Epson Corporation | Card processing apparatus and system, POS terminal for card processing, and credit card processing control method |
JP2005216225A (ja) * | 2004-02-02 | 2005-08-11 | Seiko Epson Corp | クレジットカード処理制御方法、プログラム、クレジットカード処理装置、pos端末およびposシステム |
JP2006259830A (ja) * | 2005-03-15 | 2006-09-28 | Toshiba Corp | 光学的文字認識装置および光学的文字認識結果確認方法 |
US7213761B2 (en) * | 2005-03-23 | 2007-05-08 | Microscan Systems Incorporated | Apparatus and process for two-stage decoding of high-density optical symbols |
US9769354B2 (en) * | 2005-03-24 | 2017-09-19 | Kofax, Inc. | Systems and methods of processing scanned data |
US7593591B2 (en) * | 2005-08-05 | 2009-09-22 | Seiko Epson Corporation | Method and apparatus for increasing contrast in a digital image |
US7984849B2 (en) * | 2005-08-16 | 2011-07-26 | University of Nevada, Las Vegas | Portable magnetic stripe reader for criminality security applications |
US8677377B2 (en) | 2005-09-08 | 2014-03-18 | Apple Inc. | Method and apparatus for building an intelligent automated assistant |
US20070058867A1 (en) * | 2005-09-15 | 2007-03-15 | Shieh Johnny M | Portable device which does translation and retrieval of information related to a text object |
US9318108B2 (en) | 2010-01-18 | 2016-04-19 | Apple Inc. | Intelligent automated assistant |
US8977255B2 (en) | 2007-04-03 | 2015-03-10 | Apple Inc. | Method and system for operating a multi-function portable electronic device using voice-activation |
US9330720B2 (en) | 2008-01-03 | 2016-05-03 | Apple Inc. | Methods and apparatus for altering audio output signals |
US8996376B2 (en) | 2008-04-05 | 2015-03-31 | Apple Inc. | Intelligent text-to-speech conversion |
US10496753B2 (en) | 2010-01-18 | 2019-12-03 | Apple Inc. | Automatically adapting user interfaces for hands-free interaction |
US20100030549A1 (en) | 2008-07-31 | 2010-02-04 | Lee Michael M | Mobile device having human language translation capability with positional feedback |
US20100067806A1 (en) * | 2008-09-12 | 2010-03-18 | Halberd Match Corp. | System and method for pleographic recognition, matching, and identification of images and objects |
US20110188707A1 (en) * | 2008-09-12 | 2011-08-04 | Halberd Match Corp. | System and Method for Pleographic Subject Identification, Targeting, and Homing Utilizing Electromagnetic Imaging in at Least One Selected Band |
WO2010067118A1 (en) | 2008-12-11 | 2010-06-17 | Novauris Technologies Limited | Speech recognition involving a mobile device |
US9767354B2 (en) | 2009-02-10 | 2017-09-19 | Kofax, Inc. | Global geographic information retrieval, validation, and normalization |
US9576272B2 (en) | 2009-02-10 | 2017-02-21 | Kofax, Inc. | Systems, methods and computer program products for determining document validity |
US9858925B2 (en) | 2009-06-05 | 2018-01-02 | Apple Inc. | Using context information to facilitate processing of commands in a virtual assistant |
US10255566B2 (en) | 2011-06-03 | 2019-04-09 | Apple Inc. | Generating and processing task items that represent tasks to perform |
US10241644B2 (en) | 2011-06-03 | 2019-03-26 | Apple Inc. | Actionable reminder entries |
US10241752B2 (en) | 2011-09-30 | 2019-03-26 | Apple Inc. | Interface for a virtual digital assistant |
US9431006B2 (en) | 2009-07-02 | 2016-08-30 | Apple Inc. | Methods and apparatuses for automatic speech recognition |
US10276170B2 (en) | 2010-01-18 | 2019-04-30 | Apple Inc. | Intelligent automated assistant |
US10553209B2 (en) | 2010-01-18 | 2020-02-04 | Apple Inc. | Systems and methods for hands-free notification summaries |
US10679605B2 (en) | 2010-01-18 | 2020-06-09 | Apple Inc. | Hands-free list-reading by intelligent automated assistant |
US10705794B2 (en) | 2010-01-18 | 2020-07-07 | Apple Inc. | Automatically adapting user interfaces for hands-free interaction |
WO2011089450A2 (en) | 2010-01-25 | 2011-07-28 | Andrew Peter Nelson Jerram | Apparatuses, methods and systems for a digital conversation management platform |
US8682667B2 (en) | 2010-02-25 | 2014-03-25 | Apple Inc. | User profiling for selecting user specific voice input processing information |
US8660371B2 (en) * | 2010-05-06 | 2014-02-25 | Abbyy Development Llc | Accuracy of recognition by means of a combination of classifiers |
US10762293B2 (en) | 2010-12-22 | 2020-09-01 | Apple Inc. | Using parts-of-speech tagging and named entity recognition for spelling correction |
WO2012124252A1 (ja) | 2011-03-14 | 2012-09-20 | 株式会社ニコン | 電子機器、電子機器の制御方法およびプログラム |
US9262612B2 (en) | 2011-03-21 | 2016-02-16 | Apple Inc. | Device access using voice authentication |
US8989492B2 (en) * | 2011-06-03 | 2015-03-24 | Apple Inc. | Multi-resolution spatial feature extraction for automatic handwriting recognition |
US10672399B2 (en) | 2011-06-03 | 2020-06-02 | Apple Inc. | Switching between text data and audio data based on a mapping |
US10057736B2 (en) | 2011-06-03 | 2018-08-21 | Apple Inc. | Active transport based notifications |
EP2724288A4 (en) * | 2011-06-27 | 2015-03-18 | Datacard Corp | VISUAL INSPECTION SYSTEM FOR PACKAGING FOILS |
US8577131B1 (en) * | 2011-07-12 | 2013-11-05 | Google Inc. | Systems and methods for visual object matching |
US8994660B2 (en) | 2011-08-29 | 2015-03-31 | Apple Inc. | Text correction processing |
US10146795B2 (en) | 2012-01-12 | 2018-12-04 | Kofax, Inc. | Systems and methods for mobile image capture and processing |
US9514357B2 (en) | 2012-01-12 | 2016-12-06 | Kofax, Inc. | Systems and methods for mobile image capture and processing |
US10134385B2 (en) | 2012-03-02 | 2018-11-20 | Apple Inc. | Systems and methods for name pronunciation |
US9483461B2 (en) | 2012-03-06 | 2016-11-01 | Apple Inc. | Handling speech synthesis of content for multiple languages |
US9280610B2 (en) | 2012-05-14 | 2016-03-08 | Apple Inc. | Crowd sourcing information to fulfill user requests |
US9721563B2 (en) | 2012-06-08 | 2017-08-01 | Apple Inc. | Name recognition system |
US9495129B2 (en) | 2012-06-29 | 2016-11-15 | Apple Inc. | Device, method, and user interface for voice-activated navigation and browsing of a document |
US9576574B2 (en) | 2012-09-10 | 2017-02-21 | Apple Inc. | Context-sensitive handling of interruptions by intelligent digital assistant |
US9547647B2 (en) | 2012-09-19 | 2017-01-17 | Apple Inc. | Voice-based media searching |
US8942420B2 (en) | 2012-10-18 | 2015-01-27 | Qualcomm Incorporated | Detecting embossed characters on form factor |
DE112014000709B4 (de) | 2013-02-07 | 2021-12-30 | Apple Inc. | Verfahren und vorrichtung zum betrieb eines sprachtriggers für einen digitalen assistenten |
US9208536B2 (en) | 2013-09-27 | 2015-12-08 | Kofax, Inc. | Systems and methods for three dimensional geometric reconstruction of captured image data |
US9355312B2 (en) | 2013-03-13 | 2016-05-31 | Kofax, Inc. | Systems and methods for classifying objects in digital images captured using mobile devices |
EP2973226A4 (en) | 2013-03-13 | 2016-06-29 | Kofax Inc | CLASSIFICATION OF OBJECTS ON DIGITAL IMAGES RECORDED BY MOBILE DEVICES |
US9368114B2 (en) | 2013-03-14 | 2016-06-14 | Apple Inc. | Context-sensitive handling of interruptions |
US10652394B2 (en) | 2013-03-14 | 2020-05-12 | Apple Inc. | System and method for processing voicemail |
AU2014233517B2 (en) | 2013-03-15 | 2017-05-25 | Apple Inc. | Training an at least partial voice command system |
WO2014144579A1 (en) | 2013-03-15 | 2014-09-18 | Apple Inc. | System and method for updating an adaptive speech recognition model |
KR101449257B1 (ko) * | 2013-03-26 | 2014-10-08 | 현대자동차주식회사 | 각인 문자 인식 장치 및 그 방법과 이를 이용한 문자의 각인 깊이 검출 시스템 |
US20140316841A1 (en) | 2013-04-23 | 2014-10-23 | Kofax, Inc. | Location-based workflows and services |
JP5735126B2 (ja) * | 2013-04-26 | 2015-06-17 | 株式会社東芝 | システムおよび筆跡検索方法 |
EP2992481A4 (en) | 2013-05-03 | 2017-02-22 | Kofax, Inc. | Systems and methods for detecting and classifying objects in video captured using mobile devices |
WO2014197334A2 (en) | 2013-06-07 | 2014-12-11 | Apple Inc. | System and method for user-specified pronunciation of words for speech synthesis and recognition |
US9582608B2 (en) | 2013-06-07 | 2017-02-28 | Apple Inc. | Unified ranking with entropy-weighted information for phrase-based semantic auto-completion |
WO2014197336A1 (en) | 2013-06-07 | 2014-12-11 | Apple Inc. | System and method for detecting errors in interactions with a voice-based digital assistant |
WO2014197335A1 (en) | 2013-06-08 | 2014-12-11 | Apple Inc. | Interpreting and acting upon commands that involve sharing information with remote devices |
US10176167B2 (en) | 2013-06-09 | 2019-01-08 | Apple Inc. | System and method for inferring user intent from speech inputs |
EP3937002A1 (en) | 2013-06-09 | 2022-01-12 | Apple Inc. | Device, method, and graphical user interface for enabling conversation persistence across two or more instances of a digital assistant |
AU2014278595B2 (en) | 2013-06-13 | 2017-04-06 | Apple Inc. | System and method for emergency calls initiated by voice command |
DE112014003653B4 (de) | 2013-08-06 | 2024-04-18 | Apple Inc. | Automatisch aktivierende intelligente Antworten auf der Grundlage von Aktivitäten von entfernt angeordneten Vorrichtungen |
US9386235B2 (en) | 2013-11-15 | 2016-07-05 | Kofax, Inc. | Systems and methods for generating composite images of long documents using mobile video data |
US9620105B2 (en) | 2014-05-15 | 2017-04-11 | Apple Inc. | Analyzing audio input for efficient speech and music recognition |
US10592095B2 (en) | 2014-05-23 | 2020-03-17 | Apple Inc. | Instantaneous speaking of content on touch devices |
US9502031B2 (en) | 2014-05-27 | 2016-11-22 | Apple Inc. | Method for supporting dynamic grammars in WFST-based ASR |
US9633004B2 (en) | 2014-05-30 | 2017-04-25 | Apple Inc. | Better resolution when referencing to concepts |
US9785630B2 (en) | 2014-05-30 | 2017-10-10 | Apple Inc. | Text prediction using combined word N-gram and unigram language models |
US9430463B2 (en) | 2014-05-30 | 2016-08-30 | Apple Inc. | Exemplar-based natural language processing |
US10078631B2 (en) | 2014-05-30 | 2018-09-18 | Apple Inc. | Entropy-guided text prediction using combined word and character n-gram language models |
US9760559B2 (en) | 2014-05-30 | 2017-09-12 | Apple Inc. | Predictive text input |
US9734193B2 (en) | 2014-05-30 | 2017-08-15 | Apple Inc. | Determining domain salience ranking from ambiguous words in natural speech |
TWI566107B (zh) | 2014-05-30 | 2017-01-11 | 蘋果公司 | 用於處理多部分語音命令之方法、非暫時性電腦可讀儲存媒體及電子裝置 |
US9715875B2 (en) | 2014-05-30 | 2017-07-25 | Apple Inc. | Reducing the need for manual start/end-pointing and trigger phrases |
US9842101B2 (en) | 2014-05-30 | 2017-12-12 | Apple Inc. | Predictive conversion of language input |
US10170123B2 (en) | 2014-05-30 | 2019-01-01 | Apple Inc. | Intelligent assistant for home automation |
US10289433B2 (en) | 2014-05-30 | 2019-05-14 | Apple Inc. | Domain specific language for encoding assistant dialog |
US9338493B2 (en) | 2014-06-30 | 2016-05-10 | Apple Inc. | Intelligent automated assistant for TV user interactions |
US10659851B2 (en) | 2014-06-30 | 2020-05-19 | Apple Inc. | Real-time digital assistant knowledge updates |
US10446141B2 (en) | 2014-08-28 | 2019-10-15 | Apple Inc. | Automatic speech recognition based on user feedback |
US9818400B2 (en) | 2014-09-11 | 2017-11-14 | Apple Inc. | Method and apparatus for discovering trending terms in speech requests |
US10789041B2 (en) | 2014-09-12 | 2020-09-29 | Apple Inc. | Dynamic thresholds for always listening speech trigger |
US10074360B2 (en) | 2014-09-30 | 2018-09-11 | Apple Inc. | Providing an indication of the suitability of speech recognition |
US9668121B2 (en) | 2014-09-30 | 2017-05-30 | Apple Inc. | Social reminders |
US10127911B2 (en) | 2014-09-30 | 2018-11-13 | Apple Inc. | Speaker identification and unsupervised speaker adaptation techniques |
US9886432B2 (en) | 2014-09-30 | 2018-02-06 | Apple Inc. | Parsimonious handling of word inflection via categorical stem + suffix N-gram language models |
US9646609B2 (en) | 2014-09-30 | 2017-05-09 | Apple Inc. | Caching apparatus for serving phonetic pronunciations |
US9760788B2 (en) | 2014-10-30 | 2017-09-12 | Kofax, Inc. | Mobile document detection and orientation based on reference object characteristics |
US10552013B2 (en) | 2014-12-02 | 2020-02-04 | Apple Inc. | Data detection |
US9711141B2 (en) | 2014-12-09 | 2017-07-18 | Apple Inc. | Disambiguating heteronyms in speech synthesis |
CN104732644B (zh) * | 2015-01-19 | 2017-10-31 | 广州广电运通金融电子股份有限公司 | 纸币鉴别的质量控制方法及其系统 |
US9865280B2 (en) | 2015-03-06 | 2018-01-09 | Apple Inc. | Structured dictation using intelligent automated assistants |
US9886953B2 (en) | 2015-03-08 | 2018-02-06 | Apple Inc. | Virtual assistant activation |
US9721566B2 (en) | 2015-03-08 | 2017-08-01 | Apple Inc. | Competing devices responding to voice triggers |
US10567477B2 (en) | 2015-03-08 | 2020-02-18 | Apple Inc. | Virtual assistant continuity |
US9899019B2 (en) | 2015-03-18 | 2018-02-20 | Apple Inc. | Systems and methods for structured stem and suffix language models |
US9842105B2 (en) | 2015-04-16 | 2017-12-12 | Apple Inc. | Parsimonious continuous-space phrase representations for natural language processing |
US10083688B2 (en) | 2015-05-27 | 2018-09-25 | Apple Inc. | Device voice control for selecting a displayed affordance |
US10127220B2 (en) | 2015-06-04 | 2018-11-13 | Apple Inc. | Language identification from short strings |
US10101822B2 (en) | 2015-06-05 | 2018-10-16 | Apple Inc. | Language input correction |
US9578173B2 (en) | 2015-06-05 | 2017-02-21 | Apple Inc. | Virtual assistant aided communication with 3rd party service in a communication session |
US10186254B2 (en) | 2015-06-07 | 2019-01-22 | Apple Inc. | Context-based endpoint detection |
US10255907B2 (en) | 2015-06-07 | 2019-04-09 | Apple Inc. | Automatic accent detection using acoustic models |
US11025565B2 (en) | 2015-06-07 | 2021-06-01 | Apple Inc. | Personalized prediction of responses for instant messaging |
US10242285B2 (en) | 2015-07-20 | 2019-03-26 | Kofax, Inc. | Iterative recognition-guided thresholding and data extraction |
US10671428B2 (en) | 2015-09-08 | 2020-06-02 | Apple Inc. | Distributed personal assistant |
US10747498B2 (en) | 2015-09-08 | 2020-08-18 | Apple Inc. | Zero latency digital assistant |
US9697820B2 (en) | 2015-09-24 | 2017-07-04 | Apple Inc. | Unit-selection text-to-speech synthesis using concatenation-sensitive neural networks |
US10366158B2 (en) | 2015-09-29 | 2019-07-30 | Apple Inc. | Efficient word encoding for recurrent neural network language models |
US11010550B2 (en) | 2015-09-29 | 2021-05-18 | Apple Inc. | Unified language modeling framework for word prediction, auto-completion and auto-correction |
US11587559B2 (en) | 2015-09-30 | 2023-02-21 | Apple Inc. | Intelligent device identification |
US10691473B2 (en) | 2015-11-06 | 2020-06-23 | Apple Inc. | Intelligent automated assistant in a messaging environment |
US10049668B2 (en) | 2015-12-02 | 2018-08-14 | Apple Inc. | Applying neural network language models to weighted finite state transducers for automatic speech recognition |
US10223066B2 (en) | 2015-12-23 | 2019-03-05 | Apple Inc. | Proactive assistance based on dialog communication between devices |
US10446143B2 (en) | 2016-03-14 | 2019-10-15 | Apple Inc. | Identification of voice inputs providing credentials |
US9779296B1 (en) | 2016-04-01 | 2017-10-03 | Kofax, Inc. | Content-based detection and three dimensional geometric reconstruction of objects in image and video data |
US10275971B2 (en) * | 2016-04-22 | 2019-04-30 | Ncr Corporation | Image correction |
US9934775B2 (en) | 2016-05-26 | 2018-04-03 | Apple Inc. | Unit-selection text-to-speech synthesis based on predicted concatenation parameters |
US9972304B2 (en) | 2016-06-03 | 2018-05-15 | Apple Inc. | Privacy preserving distributed evaluation framework for embedded personalized systems |
US10249300B2 (en) | 2016-06-06 | 2019-04-02 | Apple Inc. | Intelligent list reading |
US10049663B2 (en) | 2016-06-08 | 2018-08-14 | Apple, Inc. | Intelligent automated assistant for media exploration |
DK179588B1 (en) | 2016-06-09 | 2019-02-22 | Apple Inc. | INTELLIGENT AUTOMATED ASSISTANT IN A HOME ENVIRONMENT |
US10067938B2 (en) | 2016-06-10 | 2018-09-04 | Apple Inc. | Multilingual word prediction |
US10586535B2 (en) | 2016-06-10 | 2020-03-10 | Apple Inc. | Intelligent digital assistant in a multi-tasking environment |
US10192552B2 (en) | 2016-06-10 | 2019-01-29 | Apple Inc. | Digital assistant providing whispered speech |
US10490187B2 (en) | 2016-06-10 | 2019-11-26 | Apple Inc. | Digital assistant providing automated status report |
US10509862B2 (en) | 2016-06-10 | 2019-12-17 | Apple Inc. | Dynamic phrase expansion of language input |
DK201670540A1 (en) | 2016-06-11 | 2018-01-08 | Apple Inc | Application integration with a digital assistant |
DK179415B1 (en) | 2016-06-11 | 2018-06-14 | Apple Inc | Intelligent device arbitration and control |
DK179049B1 (en) | 2016-06-11 | 2017-09-18 | Apple Inc | Data driven natural language event detection and classification |
DK179343B1 (en) | 2016-06-11 | 2018-05-14 | Apple Inc | Intelligent task discovery |
FR3055721B1 (fr) * | 2016-09-05 | 2019-10-18 | Ingenico Group | Procede de reconnaissance de caracteres en reliefs, produit programme d'ordinateur et dispositif correspondants |
US10043516B2 (en) | 2016-09-23 | 2018-08-07 | Apple Inc. | Intelligent automated assistant |
US10593346B2 (en) | 2016-12-22 | 2020-03-17 | Apple Inc. | Rank-reduced token representation for automatic speech recognition |
US10552699B2 (en) | 2016-12-27 | 2020-02-04 | Datalogic Usa, Inc. | Robust string text detection for industrial optical character recognition |
DK201770439A1 (en) | 2017-05-11 | 2018-12-13 | Apple Inc. | Offline personal assistant |
DK179745B1 (en) | 2017-05-12 | 2019-05-01 | Apple Inc. | SYNCHRONIZATION AND TASK DELEGATION OF A DIGITAL ASSISTANT |
DK179496B1 (en) | 2017-05-12 | 2019-01-15 | Apple Inc. | USER-SPECIFIC Acoustic Models |
DK201770432A1 (en) | 2017-05-15 | 2018-12-21 | Apple Inc. | Hierarchical belief states for digital assistants |
DK201770431A1 (en) | 2017-05-15 | 2018-12-20 | Apple Inc. | Optimizing dialogue policy decisions for digital assistants using implicit feedback |
DK179560B1 (en) | 2017-05-16 | 2019-02-18 | Apple Inc. | FAR-FIELD EXTENSION FOR DIGITAL ASSISTANT SERVICES |
US10438098B2 (en) * | 2017-05-19 | 2019-10-08 | Hand Held Products, Inc. | High-speed OCR decode using depleted centerlines |
US11062176B2 (en) | 2017-11-30 | 2021-07-13 | Kofax, Inc. | Object detection and image cropping using a multi-detector approach |
US11210676B2 (en) * | 2019-07-01 | 2021-12-28 | Capital One Services, Llc | System and method for augmented reality display of account information |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH08185481A (ja) * | 1994-12-28 | 1996-07-16 | Nec Corp | 文字認識装置 |
Family Cites Families (26)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US3612833A (en) * | 1969-01-08 | 1971-10-12 | Ibm | Embossed card reading device |
US3611292A (en) | 1969-05-21 | 1971-10-05 | Texaco Inc | Credit card validation system |
US3939327A (en) | 1969-08-05 | 1976-02-17 | Data Source Corporation | Optical reading apparatus and method |
US3760162A (en) | 1969-11-13 | 1973-09-18 | Smiths Industries Ltd | Photoelectric readers |
US3774015A (en) | 1971-05-18 | 1973-11-20 | Amp Inc | Optical reader for an embossed card |
CA1004363A (en) | 1972-02-28 | 1977-01-25 | Edward Dillingham | Method and means for reading numerals |
JPS51102866A (en) | 1973-10-09 | 1976-09-10 | Yokohama Rubber Co Ltd | Taiyano jidosenbetsusochi |
US3937928A (en) | 1974-04-15 | 1976-02-10 | Sharp Kabushiki Kaisha | Embossed card reader |
US4020327A (en) | 1976-01-30 | 1977-04-26 | Bell Telephone Laboratories, Incorporated | Apparatus for reading optical codes |
US4628195A (en) | 1984-03-09 | 1986-12-09 | American Magnetics Corporation | Credit card security system |
US4783823A (en) * | 1985-09-16 | 1988-11-08 | Omron Tateisi Electronics, Co. | Card identifying method and apparatus |
JPS62184908A (ja) | 1986-02-07 | 1987-08-13 | Bridgestone Corp | タイヤの自動判別方法 |
US4724307A (en) * | 1986-04-29 | 1988-02-09 | Gtech Corporation | Marked card reader |
US4845770A (en) | 1986-11-20 | 1989-07-04 | Oki Electric Industry Co., Ltd. | Method and apparatus for processing embossed card |
DE3731853A1 (de) * | 1987-09-22 | 1989-03-30 | Gao Ges Automation Org | Mehrschichtige als druckstock verwendbare ausweiskarte und verfahren zu deren herstellung |
DE3741179A1 (de) * | 1987-12-04 | 1989-06-15 | Gao Ges Automation Org | Dokument mit faelschungssicherem oberflaechenrelief und verfahren zur herstellung desselben |
US4902880A (en) * | 1988-09-30 | 1990-02-20 | Peripheral Dynamics, Inc. | Card reader system and method with printing and verification capability |
JPH02166577A (ja) | 1988-12-21 | 1990-06-27 | Hitachi Ltd | 自動取引処理装置 |
DE69015238T2 (de) | 1989-04-12 | 1995-05-04 | Oki Electric Ind Co Ltd | Reliefbildabtaster. |
US5410642A (en) * | 1989-08-23 | 1995-04-25 | Dai Nippon Printing Co., Ltd. | ID card issuing system |
US5331443A (en) * | 1992-07-31 | 1994-07-19 | Crown Roll Leaf, Inc. | Laser engraved verification hologram and associated methods |
FI98414C (fi) | 1994-03-25 | 1997-06-10 | Harri Olavi Vaarala | Menetelmä ja väline pysyvän viivakoodin lukemiseksi |
KR100242880B1 (ko) | 1994-12-29 | 2000-02-01 | 전주범 | 분할된 영역의 윤곽추적장치 |
GB9426339D0 (en) | 1994-12-29 | 1995-03-01 | At & T Global Inf Solution | System for creating a document information database |
US6085976A (en) * | 1998-05-22 | 2000-07-11 | Sehr; Richard P. | Travel system and methods utilizing multi-application passenger cards |
AU4975497A (en) | 1997-09-30 | 1999-04-23 | Siemens Aktiengesellschaft | A method of and apparatus for inspecting printed information |
-
1999
- 1999-07-28 US US09/362,197 patent/US6628808B1/en not_active Expired - Fee Related
-
2000
- 2000-07-26 CA CA002379952A patent/CA2379952A1/en not_active Abandoned
- 2000-07-26 EP EP00950697A patent/EP1204945A1/en not_active Withdrawn
- 2000-07-26 WO PCT/US2000/020306 patent/WO2001009822A1/en not_active Application Discontinuation
- 2000-07-26 AU AU63768/00A patent/AU6376800A/en not_active Abandoned
- 2000-07-26 JP JP2001514365A patent/JP2003506767A/ja active Pending
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH08185481A (ja) * | 1994-12-28 | 1996-07-16 | Nec Corp | 文字認識装置 |
Also Published As
Publication number | Publication date |
---|---|
AU6376800A (en) | 2001-02-19 |
WO2001009822A1 (en) | 2001-02-08 |
CA2379952A1 (en) | 2001-02-08 |
EP1204945A1 (en) | 2002-05-15 |
US6628808B1 (en) | 2003-09-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2003506767A (ja) | 走査イメージを照合するための装置および方法 | |
US7362901B2 (en) | Systems and methods for biometric identification using handwriting recognition | |
AU2008335636B2 (en) | Identification and verification of an unknown document according to an Eigen image process | |
AU2008335637B2 (en) | Document verification using dynamic document identification framework | |
Gebhardt et al. | Document authentication using printing technique features and unsupervised anomaly detection | |
US7724958B2 (en) | Systems and methods for biometric identification using handwriting recognition | |
CN106326887B (zh) | 一种光学字符识别结果的校验方法及装置 | |
CN107247950A (zh) | 一种基于机器学习的身份证图像文本识别方法 | |
CN108345880A (zh) | 发票识别方法、装置、计算机设备和存储介质 | |
US20080310721A1 (en) | Method And Apparatus For Recognizing Characters In A Document Image | |
JP2003145898A (ja) | 画像品質判定方法、判定装置、判定プログラム | |
JP2002133426A (ja) | 多値画像から罫線を抽出する罫線抽出装置 | |
CN106033535A (zh) | 电子阅卷方法 | |
CN115423771A (zh) | 基于特征非一致性的准动态镭射防伪标签识别方法 | |
Subasic et al. | Face image validation system | |
CN108921006B (zh) | 手写签名图像真伪鉴别模型建立方法及真伪鉴别方法 | |
IL98293A (en) | A method for distinguishing between text and graphics | |
US20210312210A1 (en) | Object matching device | |
CN110766001B (zh) | 基于cnn和rnn的银行卡卡号定位与端到端识别方法 | |
JPH11306325A (ja) | 対象物検出装置及び対象物検出方法 | |
CN102682308B (zh) | 图像处理方法和图像处理设备 | |
Pati et al. | Handwriting Quality Assessment using Structural Features and Support Vector Machines | |
JP4492258B2 (ja) | 文字・図形の認識方法および検査方法 | |
Perez-Hernandez et al. | Simplified stroke-based approach for off-line signature recognition | |
CN117291926B (zh) | 字符缺陷检测方法、设备及计算机可读存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20070726 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100122 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20100621 |