JP2007534040A - 学習サンプルおよび/またはテストサンプルを作成および/または更新する方法 - Google Patents
学習サンプルおよび/またはテストサンプルを作成および/または更新する方法 Download PDFInfo
- Publication number
- JP2007534040A JP2007534040A JP2006526552A JP2006526552A JP2007534040A JP 2007534040 A JP2007534040 A JP 2007534040A JP 2006526552 A JP2006526552 A JP 2006526552A JP 2006526552 A JP2006526552 A JP 2006526552A JP 2007534040 A JP2007534040 A JP 2007534040A
- Authority
- JP
- Japan
- Prior art keywords
- data
- sample
- samples
- address
- shipment
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/98—Detection or correction of errors, e.g. by rescanning the pattern or by human intervention; Evaluation of the quality of the acquired patterns
Landscapes
- Engineering & Computer Science (AREA)
- Quality & Reliability (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Character Discrimination (AREA)
- Sorting Of Articles (AREA)
- Optical Recording Or Reproduction (AREA)
Abstract
本発明は、適応形分類器による発送物の文字に対する自動光学式読み取りを最適化するための学習サンプルおよび/またはテストサンプルを作成および/または更新する方法に関する。この方法は、自動光学式読み取りに加えて、発送物上または発送物内にあり、無線で読み出しおよび書き込み可能な記憶ユニットを読み出すステップと、記憶ユニットから宛先アドレスデータが識別されて読み出された場合、このデータを宛先アドレス目標データとして、記録した発送物表面のコピーと共にサンプルデータバンクに記憶するステップとを有する。
Description
本発明は、適応形分類器による発送物の文字に対する自動読み取りを最適化するための学習サンプルおよび/またはテストサンプルを作成および/または更新する方法に関する。
郵便自動化処理に対して実際のソーティングマシンに加えて重要であるのは、アドレスの読み取りである。発送物の郵便アドレスが求められてはじめて、ソーティングマシンにおいてこの郵便発送物を正しい仕切りにソートすることができるのである。
アドレスを読み取るための処理プロセスは、一連の適応形の処理ステップからなり、これらのステップは、画像記録、アドレスブロックの位置特定、行および単語へのアドレスブロックのセグメンテーション、記号および/または単語の識別、および引き続いてのアドレスデータバンクと比較に分けることができる。
アドレス情報が読み取りシステムによって自動的に求められないか、または必要な情報の一部しか読み取られない場合、この発送物は、手動による処理場所に送られる(ビデオコーディング)。ここでは欠けていたアドレスエントリがビデオコーディングのパワーによって手動で入力される。
したがって各アドレス読み取りシステムの目的は、極めて高い読み取りレートを達成して、ビデオコーディングの際の人手によるコストを可能な限り小さくする維持することである。このような高い自動読み取りレートを達成するためには、読み取るべき発送物の文字に適合するため、個々の処理ステップ毎に一連の専門知識が必要である。
アドレス読み取り器において発生する処理ステップ、例えば記号識別、単語識別および書体識別のステップの大部分は、適応形の分類方式に基づいている。すべての適合形方式に共通である基本原理は、前もって集めたパターンを学習することであり、ここでこのパターンの特性は、定量化可能な特徴集合またはフィーチャ集合にマッピングされる。このようにすれば、その後の過程でクラス所属を推論することができるのである。このため、適応形の方式においては結果的につぎの2つの作業フェーズが得られる。すなわち、
a) もっぱら学習フェーズおよびテストフェーズからなる最適化フェーズ、
b) 可能フェーズ(Kannphase)
が得られるのである。
a) もっぱら学習フェーズおよびテストフェーズからなる最適化フェーズ、
b) 可能フェーズ(Kannphase)
が得られるのである。
上記の最適化フェーズ中には、役割に応じて例えば記号、単語またはアドレスからなるパターンの各特徴集合にその意味を目標情報の形で追加して、分類システムの決定量(Bestimmungsgroesse)が最適に設定できるようにしなければならない。システムが最適な設定に向かって変動するこのフェーズは2つのステップで進行する。学習フェーズではパラメタの基本設定が行われ、これに対してテストフェーズではパラメタの微調整が行われる。つぎに上記の可能フェーズではパターンの特徴集合だけが必要になり、分類システムは、記憶されたパラメタに応じてこの特徴集合からクラス所属を導出するのである。
分類システムを実現するための最大の技術開発コストは、学習フェーズおよびテストフェーズにかかり、これらそのものはそれぞれ2つのメインアクティビティに分割することができる。まず一度、識別作業を十分に良好に代表するサンプルを準備しなければならない。つぎに分類システムの実際の適合化を行う。この適合化では分類方式および分類器の設計に応じて、ベースとなる決定量の最適化、例えば多項式形分類器における分類器係数の最適化、ニューラルネットワークにおける重み付け係数の最適化、または最近傍分類器における最も効率の高い基準ベクトルの選択が集中的に行われる。
学習フェーズおよびテストフェーズの第2側面は、一般的に明確な数学的手法および最適化方式に基づいているため、十分に自動的に進行することができるのに対して、第1側面の背後にはプランニング作業、計算作業およびチェック作業についての高いコストが隠されており、これが適応形の解決方式における事実上のボトルネックになることもまれではない。
従来技術によれば、サンプルをまとめるために現場で大量の発送物(ライフメール Life-Mail)が集められ、またいわゆるラベルによってこれらに目標情報(文字の意味、レイアウトデータ)が手動で付与される。すなわち画像によって、失われてしまった元々の目標情報/意味を推論しなればならないのである。(Juergen Schuermann: Pattern Classification, Verlag: John Wiley & Sons, Inc., 1995, Chapter "Introduction Learning", p.17-21参照)。
サンプルをまとめる過程は、極めてさまざまな理由から自動認識にとって重要である。それはこの品質が直接、後続の適応形分類システムの性能となって表れるからである。各サンプルが、観察対象の読み取り作業を十分に良好に反映する場合、上記の可能フェーズにおいても、発生するパターンの幅の広い領域に対して十分に良好な読み取り性能が得られる。サンプルの幅を狭く選択しすぎると、可能フェーズにおいてこの制限された領域においてのみ良好な性能が予想され、発生する残りのパターンについては期待される性能が達成されない。サンプルが十分に包括的であるという側面と、サンプルの代表性の概念とは、数学的な統計から直接的に相関するのである。
高品質かつ代表に値するサンプルを得るためには一連の判定条件を満たさなければならない。良好な学習サンプルおよびテストサンプルに対する基本的な前提は、学習すべき全パターンクラス形態が十分に存在することである。すでにこれが容易には満たすことのできない条件であることが多い。その理由は、課題の設定が通例、全体識別作業の一部分だけしか表さない固有の適用からなされるからである。例えば、郵便の分野における文字認識の領域では、分類器の適合化の時点に特定のフォント(書体)、印刷技術または印刷装置が好んで使用されるが、これは全範囲のうちの制限された部分だけしか表さないのである。発送物文字読み取り器の寿命が経過してうちにおそらく他のフォントおよび印刷技術が前面に出てくるが、そうであってもこれらを十分に良好に識別しなければならない。この側面は、このような技術をさまざまな国々で使用する際にも変わることが多い。先進国では中進国とはまったく別のフォントおよび印刷/タイプ装置が使用される。このために必要となるのは、かなり先を見通してサンプルをまとめることおよびパターン生成に対する可能な限りに広いベースである。
つぎに1パターンに対応づけられる実際の意味が正しくなければならない。すなわち適応形システムは誤ったクラス所属と1つのパターンとをあまりに頻繁に対応づけられると、相応するパターンが提示される場合、可能フェーズにおいても誤った判定が行われることが多くなるのである。このシステムは、まさに適応形であり、これに誤ったものが提示されればこの誤ったものを学習してしまう。学習サンプルまたはテストサンプルおける誤った識別が少なければ少ないほど、育て上げられる分類システムの性能も向上するのである。
別の側面は直接、特徴集合の生成に関連している。ふつう特徴集合は、使用されている読み取りソフトウェアに含まれている識別アルゴリズムによって生成される。それは多くの場合に量が相当なものになるからであり(例えば、記号識別においては記号当たり数千例)、また上記の特徴をできる限り現実のものに近づけたいからである。しかしながら既存のアルゴリズムは、ことごとくエラーフリーではない。例えば、記号のセグメンティングの際にはつぎのような誤ったセグメントが得られる。すなわち、このセグメントは、記号の代わりに記号の破片を含んだり、または1つよりも多くの記号を含んだり、または障害となる情報だけしか含まないことも多い。このような情報は、適合化のために全体として重要でないばかりか極めて邪魔である。それはこれが分類システムをまったくの誤りに導いてしまうからである。
またパターン識別プロセス内では一連の処理ステップがすべて動作する。ここでこれらの処理ステップは、目に見える形で決定して捉えることはできず、概略的に統計的に処理しなければならない。これに挙げられるのは、バイナリ化による量子化の影響、紙の下地の色が異なることによるコントラスト変化、スキャン装置および印刷装置における分解およびラスタライズアルゴリズムが異なることによる丸めの影響、装置の劣化およびメンテナンス状態が異なることによるスキャン品質および印刷品質の変動などである。
自動読み取り器(OCR)が読み取り動作/または可能フェーズにある場合、読み取られる発送物の特性が変化して、この自動読み取り器がもはや最適に動作しないことがある。この自動読み取り器が、変化した条件に再度適合できるようにするためには、読み取り器を最適化する新たなサンプルまたは更新されたサンプルが必要である。すなわちコストをかけてサンプルを上記のように再びまとめなければならないのである。
本発明の課題は、適応形分類器による発送物の文字に対する自動読み取りを最適化するための学習およびテストサンプルを作成および/または更新する方法を提供して、この方法により、読み取り動作中に学習サンプルおよび/またはテストサンプルが自動的に作成および/または更新されるようにすることである。
この課題は、本発明の請求項1の特徴部分に記載された特徴的構成によって解決される。
その特徴は、
− 自動光学式読み取りに加えて、発送物上または発送物内にあり、無線で読み出しおよび書き込み可能な記憶ユニットを読み出すステップと、
− 記憶ユニットから宛先アドレスデータが読み出されて識別された場合、このデータを宛先アドレス目標データとして、記録した発送物表面のコピーと共にサンプルデータバンクに記憶するステップとを有することである。これにより、格段の人手によるコストなしに自動光学式読み取り器(OCR)を最適化するための学習サンプルおよびテストサンプルを作成することができる。
− 自動光学式読み取りに加えて、発送物上または発送物内にあり、無線で読み出しおよび書き込み可能な記憶ユニットを読み出すステップと、
− 記憶ユニットから宛先アドレスデータが読み出されて識別された場合、このデータを宛先アドレス目標データとして、記録した発送物表面のコピーと共にサンプルデータバンクに記憶するステップとを有することである。これにより、格段の人手によるコストなしに自動光学式読み取り器(OCR)を最適化するための学習サンプルおよびテストサンプルを作成することができる。
本発明の有利な実施形態は従属請求項に記載されている。
有利であるのは、サンプルデータバンクにおいて自動生成したエントリが所定数に達した場合および/または前回の最適化以来、決められた時間を上回った場合に自動光学式読み取り器を最適化するための信号を生成することである。
上記の記憶ユニットをRFIDタグ/トランスポンダとして実施することも有利である。すなわち、これらの記憶ユニットは無線の信号波を用いて書き込みおよび読み出し可能である。
サンプルの目標データがテキスト形式であると有利であるため、アドレスデータが符号化形式で記憶されている場合、すべての変形形態を有するアドレス辞書からアドレステキストを自動的に求めてサンプルデータバンクに入力することができる。
以下では本発明の実施例を図面に基づいて説明する。
ここで図1は、本発明の方法の流れを示すフローチャートを示している。
RFIDタグ、殊に受動的なRFIDタグを使用して発送物を特徴付けることはかなり前からすでに公知の従来技術である(US 3 750 167,US 6 557 758 B1)。これらは、電波を用いて発送物を非接触で識別するために使用される。RFIDタグは識別データに加えて別のデータ、例えば宛先アドレスデータを含むことができる。
発送物が配送システム(例えば郵便サービス)に到達すると、宛先アドレスを有する発送物表面がカメラ装置によって都度記録されて記憶され、OCR読み取り器において宛先アドレスが読み取られる。同時に該当する発送物内また発送物上に設けられているRFIDタグの無線による読み出しが行われる1。つぎに求められるのは、このRFIDタグが宛先アドレスデータを含むか否かである2。RFIDタグから宛先アドレスデータが識別されずまた読み出されなかった場合、発送物の通常の後続処理が行われる3。すなわち、OCR読み取り、ソートプラン(Sortierplan)にしたがったソートなどが行われるのである。RFIDタグがアドレスデータを含む場合、このアドレスデータはテキスト形式であるかが自動的に確認される4。イエスの場合、実際データであるこの発送物の画像データが、目標データである対応するテキスト形式の宛先アドレスデータと共にサンプルデータバンクに記憶される6。これによってこのデータバンクは、つねに最新のサンプルを含むようになる。宛先アドレスデータが符号化形式でRFIDタグに記憶されていた場合、アドレスデータバンクを用いてテキスト形式に変換し5、つぎにこれをサンプルデータバンクに入力する。ここではアドレス辞書のコードデータ項目に記録されているすべての変形形態がサンプルデータバンクに取り込まれる。新たなエントリが所定数を上回るか、または最後の最適化以来の所定時間を上回った場合には、OCR読み取り器を新たに最適化するための信号を出力する7。このようにしてOCR読み取り器に対する学習サンプルおよびテストサンプルが、自動的かつ人手によるコストなしに読み取り動作時に更新されるのである。
Claims (4)
- 適応形分類器による発送物の文字に対する自動光学式読み取りを最適化するための学習サンプルおよび/またはテストサンプルを作成および/または更新する方法において、
− 自動光学式読み取りに加えて、発送物上または発送物内にあり、無線で読み出しおよび書き込み可能な記憶ユニットを読み出すステップと、
− 記憶ユニットから宛先アドレスデータが識別されて読み出された場合、当該データを宛先アドレス目標データとして、記録した発送物表面のコピーと共にサンプルデータバンクに記憶するステップとを有することを特徴とする、
学習サンプルおよび/またはテストサンプルを作成および/または更新する方法。 - 前記のサンプルデータバンクにて自動生成したエントリが所定数に達した場合および/または前回の最適化以来、決められた時間を上回った場合に自動光学式読み取り器を最適化するための信号を形成する、
請求項1に記載の方法。 - 前記記憶ユニットは、RFIDタグ/トランスポンダとして実施されている、
請求項1に記載の方法。 - アドレスデータが符号化形式で記憶されている場合、すべての変形形態を有するアドレス辞書からアドレステキストを自動的に求めてサンプルデータバンクに入力する、
請求項1に記載の方法。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE10345047A DE10345047B4 (de) | 2003-09-26 | 2003-09-26 | Verfahren zum Erzeugen und/oder Aktualisieren von Lern- und/oder Teststichproben |
PCT/EP2004/009963 WO2005038701A1 (de) | 2003-09-26 | 2004-09-07 | Verfahren zum erzeugen und/oder aktualisieren von lern- und/oder teststichproben |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2007534040A true JP2007534040A (ja) | 2007-11-22 |
Family
ID=34399011
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006526552A Withdrawn JP2007534040A (ja) | 2003-09-26 | 2004-09-07 | 学習サンプルおよび/またはテストサンプルを作成および/または更新する方法 |
Country Status (5)
Country | Link |
---|---|
US (1) | US20070084641A1 (ja) |
EP (1) | EP1665136B1 (ja) |
JP (1) | JP2007534040A (ja) |
DE (2) | DE10345047B4 (ja) |
WO (1) | WO2005038701A1 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TWI490691B (zh) * | 2008-08-29 | 2015-07-01 | Mstar Semiconductor Inc | 晶片測試裝置及其測試方法 |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US3750167A (en) * | 1971-07-22 | 1973-07-31 | Gen Dynamics Corp | Postal tracking system |
US5770841A (en) * | 1995-09-29 | 1998-06-23 | United Parcel Service Of America, Inc. | System and method for reading package information |
US6421463B1 (en) * | 1998-04-01 | 2002-07-16 | Massachusetts Institute Of Technology | Trainable system to search for objects in images |
US6148106A (en) * | 1998-06-30 | 2000-11-14 | The United States Of America As Represented By The Secretary Of The Navy | Classification of images using a dictionary of compressed time-frequency atoms |
NZ514051A (en) * | 1999-02-12 | 2003-10-31 | Siemens Ag | Method for reading document entries and addresses |
US7647230B2 (en) * | 1999-06-24 | 2010-01-12 | Pitney Bowes Inc. | Method and apparatus for tracking a special service delivery of a mail item created by an office worker |
WO2001002104A1 (en) * | 1999-07-05 | 2001-01-11 | Ptt Post Holdings B.V. | Installation and method for updating an address database with recorded address records |
US6557758B1 (en) * | 1999-10-01 | 2003-05-06 | Moore North America, Inc. | Direct to package printing system with RFID write/read capability |
US7031530B2 (en) * | 2001-11-27 | 2006-04-18 | Lockheed Martin Corporation | Compound classifier for pattern recognition applications |
US7969306B2 (en) * | 2002-01-11 | 2011-06-28 | Sap Aktiengesellschaft | Context-aware and real-time item tracking system architecture and scenarios |
-
2003
- 2003-09-26 DE DE10345047A patent/DE10345047B4/de not_active Expired - Fee Related
-
2004
- 2004-09-07 EP EP04764906A patent/EP1665136B1/de not_active Expired - Lifetime
- 2004-09-07 DE DE502004004255T patent/DE502004004255D1/de not_active Expired - Fee Related
- 2004-09-07 JP JP2006526552A patent/JP2007534040A/ja not_active Withdrawn
- 2004-09-07 US US10/573,403 patent/US20070084641A1/en not_active Abandoned
- 2004-09-07 WO PCT/EP2004/009963 patent/WO2005038701A1/de active IP Right Grant
Also Published As
Publication number | Publication date |
---|---|
WO2005038701A1 (de) | 2005-04-28 |
US20070084641A1 (en) | 2007-04-19 |
EP1665136B1 (de) | 2007-07-04 |
DE10345047B4 (de) | 2005-12-15 |
DE502004004255D1 (de) | 2007-08-16 |
EP1665136A1 (de) | 2006-06-07 |
DE10345047A1 (de) | 2005-05-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110942074B (zh) | 字符切分识别方法、装置、电子设备、存储介质 | |
JP2575539B2 (ja) | 書類上の金額フィールドの位置特定方法および識別方法 | |
US7092561B2 (en) | Character recognition, including method and system for processing checks with invalidated MICR lines | |
US8033470B2 (en) | Information recognition processing apparatus and information recognition processing method | |
EP1139272A2 (en) | Method and apparatus for identification of documents, and computer product | |
CN100540156C (zh) | 利用改进的条码读取处理邮件项目的方法 | |
JP2004527042A (ja) | 画像処理方法およびシステム | |
JP2012008791A (ja) | 帳票認識装置及び帳票認識方法 | |
JP3485020B2 (ja) | 文字認識方法及び装置ならびに記憶媒体 | |
JPH11238097A (ja) | 郵便物宛先読取装置及び宛先読取方法 | |
JP5003051B2 (ja) | 郵便自動区分機及び郵便自動区分方法 | |
CN109740553A (zh) | 一种基于识别的图像语义分割数据筛选方法及系统 | |
US7286687B2 (en) | Method for generating learning and/or sample probes | |
CN110796210A (zh) | 一种标签信息的识别方法及装置 | |
CN107240185A (zh) | 一种冠字号识别方法、装置、设备及存储介质 | |
CN112668444A (zh) | 一种基于YOLOv5的鸟类检测与识别方法 | |
CN113841156B (zh) | 基于图像识别的控制方法与装置 | |
CN107491884A (zh) | 条形码管理系统及方法 | |
JPH06282686A (ja) | 文字認識方法 | |
CN107563689A (zh) | 使用条形码管理系统及方法 | |
JP2007534040A (ja) | 学習サンプルおよび/またはテストサンプルを作成および/または更新する方法 | |
US8818023B2 (en) | Bulk region of interest learning | |
EP0955600B1 (en) | Process and equipment for recognition of a pattern on an item presented | |
CN116486418B (zh) | 钞票冠字号图像的生成方法和装置 | |
JP6098065B2 (ja) | 画像検査装置、画像検査方法、及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A761 | Written withdrawal of application |
Free format text: JAPANESE INTERMEDIATE CODE: A761 Effective date: 20080827 |