JP2007534040A

JP2007534040A - 学習サンプルおよび／またはテストサンプルを作成および／または更新する方法

Info

Publication number: JP2007534040A
Application number: JP2006526552A
Authority: JP
Inventors: バイアートーマス; ツィーアペーター
Original assignee: Siemens AG
Current assignee: Siemens AG
Priority date: 2003-09-26
Filing date: 2004-09-07
Publication date: 2007-11-22
Also published as: WO2005038701A1; US20070084641A1; EP1665136B1; DE10345047B4; DE502004004255D1; EP1665136A1; DE10345047A1

Abstract

本発明は、適応形分類器による発送物の文字に対する自動光学式読み取りを最適化するための学習サンプルおよび／またはテストサンプルを作成および／または更新する方法に関する。この方法は、自動光学式読み取りに加えて、発送物上または発送物内にあり、無線で読み出しおよび書き込み可能な記憶ユニットを読み出すステップと、記憶ユニットから宛先アドレスデータが識別されて読み出された場合、このデータを宛先アドレス目標データとして、記録した発送物表面のコピーと共にサンプルデータバンクに記憶するステップとを有する。

Description

本発明は、適応形分類器による発送物の文字に対する自動読み取りを最適化するための学習サンプルおよび／またはテストサンプルを作成および／または更新する方法に関する。

郵便自動化処理に対して実際のソーティングマシンに加えて重要であるのは、アドレスの読み取りである。発送物の郵便アドレスが求められてはじめて、ソーティングマシンにおいてこの郵便発送物を正しい仕切りにソートすることができるのである。

アドレスを読み取るための処理プロセスは、一連の適応形の処理ステップからなり、これらのステップは、画像記録、アドレスブロックの位置特定、行および単語へのアドレスブロックのセグメンテーション、記号および／または単語の識別、および引き続いてのアドレスデータバンクと比較に分けることができる。

アドレス情報が読み取りシステムによって自動的に求められないか、または必要な情報の一部しか読み取られない場合、この発送物は、手動による処理場所に送られる（ビデオコーディング）。ここでは欠けていたアドレスエントリがビデオコーディングのパワーによって手動で入力される。

したがって各アドレス読み取りシステムの目的は、極めて高い読み取りレートを達成して、ビデオコーディングの際の人手によるコストを可能な限り小さくする維持することである。このような高い自動読み取りレートを達成するためには、読み取るべき発送物の文字に適合するため、個々の処理ステップ毎に一連の専門知識が必要である。

アドレス読み取り器において発生する処理ステップ、例えば記号識別、単語識別および書体識別のステップの大部分は、適応形の分類方式に基づいている。すべての適合形方式に共通である基本原理は、前もって集めたパターンを学習することであり、ここでこのパターンの特性は、定量化可能な特徴集合またはフィーチャ集合にマッピングされる。このようにすれば、その後の過程でクラス所属を推論することができるのである。このため、適応形の方式においては結果的につぎの２つの作業フェーズが得られる。すなわち、
ａ）もっぱら学習フェーズおよびテストフェーズからなる最適化フェーズ、
ｂ）可能フェーズ（Kannphase）
が得られるのである。

上記の最適化フェーズ中には、役割に応じて例えば記号、単語またはアドレスからなるパターンの各特徴集合にその意味を目標情報の形で追加して、分類システムの決定量（Bestimmungsgroesse）が最適に設定できるようにしなければならない。システムが最適な設定に向かって変動するこのフェーズは２つのステップで進行する。学習フェーズではパラメタの基本設定が行われ、これに対してテストフェーズではパラメタの微調整が行われる。つぎに上記の可能フェーズではパターンの特徴集合だけが必要になり、分類システムは、記憶されたパラメタに応じてこの特徴集合からクラス所属を導出するのである。

分類システムを実現するための最大の技術開発コストは、学習フェーズおよびテストフェーズにかかり、これらそのものはそれぞれ２つのメインアクティビティに分割することができる。まず一度、識別作業を十分に良好に代表するサンプルを準備しなければならない。つぎに分類システムの実際の適合化を行う。この適合化では分類方式および分類器の設計に応じて、ベースとなる決定量の最適化、例えば多項式形分類器における分類器係数の最適化、ニューラルネットワークにおける重み付け係数の最適化、または最近傍分類器における最も効率の高い基準ベクトルの選択が集中的に行われる。

学習フェーズおよびテストフェーズの第２側面は、一般的に明確な数学的手法および最適化方式に基づいているため、十分に自動的に進行することができるのに対して、第１側面の背後にはプランニング作業、計算作業およびチェック作業についての高いコストが隠されており、これが適応形の解決方式における事実上のボトルネックになることもまれではない。

従来技術によれば、サンプルをまとめるために現場で大量の発送物（ライフメール Life-Mail）が集められ、またいわゆるラベルによってこれらに目標情報（文字の意味、レイアウトデータ）が手動で付与される。すなわち画像によって、失われてしまった元々の目標情報／意味を推論しなればならないのである。（Juergen Schuermann: Pattern Classification, Verlag: John Wiley & Sons, Inc., 1995, Chapter "Introduction Learning", p.17-21参照）。

サンプルをまとめる過程は、極めてさまざまな理由から自動認識にとって重要である。それはこの品質が直接、後続の適応形分類システムの性能となって表れるからである。各サンプルが、観察対象の読み取り作業を十分に良好に反映する場合、上記の可能フェーズにおいても、発生するパターンの幅の広い領域に対して十分に良好な読み取り性能が得られる。サンプルの幅を狭く選択しすぎると、可能フェーズにおいてこの制限された領域においてのみ良好な性能が予想され、発生する残りのパターンについては期待される性能が達成されない。サンプルが十分に包括的であるという側面と、サンプルの代表性の概念とは、数学的な統計から直接的に相関するのである。

高品質かつ代表に値するサンプルを得るためには一連の判定条件を満たさなければならない。良好な学習サンプルおよびテストサンプルに対する基本的な前提は、学習すべき全パターンクラス形態が十分に存在することである。すでにこれが容易には満たすことのできない条件であることが多い。その理由は、課題の設定が通例、全体識別作業の一部分だけしか表さない固有の適用からなされるからである。例えば、郵便の分野における文字認識の領域では、分類器の適合化の時点に特定のフォント（書体）、印刷技術または印刷装置が好んで使用されるが、これは全範囲のうちの制限された部分だけしか表さないのである。発送物文字読み取り器の寿命が経過してうちにおそらく他のフォントおよび印刷技術が前面に出てくるが、そうであってもこれらを十分に良好に識別しなければならない。この側面は、このような技術をさまざまな国々で使用する際にも変わることが多い。先進国では中進国とはまったく別のフォントおよび印刷／タイプ装置が使用される。このために必要となるのは、かなり先を見通してサンプルをまとめることおよびパターン生成に対する可能な限りに広いベースである。

つぎに１パターンに対応づけられる実際の意味が正しくなければならない。すなわち適応形システムは誤ったクラス所属と１つのパターンとをあまりに頻繁に対応づけられると、相応するパターンが提示される場合、可能フェーズにおいても誤った判定が行われることが多くなるのである。このシステムは、まさに適応形であり、これに誤ったものが提示されればこの誤ったものを学習してしまう。学習サンプルまたはテストサンプルおける誤った識別が少なければ少ないほど、育て上げられる分類システムの性能も向上するのである。

別の側面は直接、特徴集合の生成に関連している。ふつう特徴集合は、使用されている読み取りソフトウェアに含まれている識別アルゴリズムによって生成される。それは多くの場合に量が相当なものになるからであり（例えば、記号識別においては記号当たり数千例）、また上記の特徴をできる限り現実のものに近づけたいからである。しかしながら既存のアルゴリズムは、ことごとくエラーフリーではない。例えば、記号のセグメンティングの際にはつぎのような誤ったセグメントが得られる。すなわち、このセグメントは、記号の代わりに記号の破片を含んだり、または１つよりも多くの記号を含んだり、または障害となる情報だけしか含まないことも多い。このような情報は、適合化のために全体として重要でないばかりか極めて邪魔である。それはこれが分類システムをまったくの誤りに導いてしまうからである。

またパターン識別プロセス内では一連の処理ステップがすべて動作する。ここでこれらの処理ステップは、目に見える形で決定して捉えることはできず、概略的に統計的に処理しなければならない。これに挙げられるのは、バイナリ化による量子化の影響、紙の下地の色が異なることによるコントラスト変化、スキャン装置および印刷装置における分解およびラスタライズアルゴリズムが異なることによる丸めの影響、装置の劣化およびメンテナンス状態が異なることによるスキャン品質および印刷品質の変動などである。

自動読み取り器（ＯＣＲ）が読み取り動作／または可能フェーズにある場合、読み取られる発送物の特性が変化して、この自動読み取り器がもはや最適に動作しないことがある。この自動読み取り器が、変化した条件に再度適合できるようにするためには、読み取り器を最適化する新たなサンプルまたは更新されたサンプルが必要である。すなわちコストをかけてサンプルを上記のように再びまとめなければならないのである。

本発明の課題は、適応形分類器による発送物の文字に対する自動読み取りを最適化するための学習およびテストサンプルを作成および／または更新する方法を提供して、この方法により、読み取り動作中に学習サンプルおよび／またはテストサンプルが自動的に作成および／または更新されるようにすることである。

この課題は、本発明の請求項１の特徴部分に記載された特徴的構成によって解決される。

その特徴は、
− 自動光学式読み取りに加えて、発送物上または発送物内にあり、無線で読み出しおよび書き込み可能な記憶ユニットを読み出すステップと、
− 記憶ユニットから宛先アドレスデータが読み出されて識別された場合、このデータを宛先アドレス目標データとして、記録した発送物表面のコピーと共にサンプルデータバンクに記憶するステップとを有することである。これにより、格段の人手によるコストなしに自動光学式読み取り器（ＯＣＲ）を最適化するための学習サンプルおよびテストサンプルを作成することができる。

本発明の有利な実施形態は従属請求項に記載されている。

有利であるのは、サンプルデータバンクにおいて自動生成したエントリが所定数に達した場合および／または前回の最適化以来、決められた時間を上回った場合に自動光学式読み取り器を最適化するための信号を生成することである。

上記の記憶ユニットをＲＦＩＤタグ／トランスポンダとして実施することも有利である。すなわち、これらの記憶ユニットは無線の信号波を用いて書き込みおよび読み出し可能である。

サンプルの目標データがテキスト形式であると有利であるため、アドレスデータが符号化形式で記憶されている場合、すべての変形形態を有するアドレス辞書からアドレステキストを自動的に求めてサンプルデータバンクに入力することができる。

以下では本発明の実施例を図面に基づいて説明する。

ここで図１は、本発明の方法の流れを示すフローチャートを示している。

ＲＦＩＤタグ、殊に受動的なＲＦＩＤタグを使用して発送物を特徴付けることはかなり前からすでに公知の従来技術である（US 3 750 167，US 6 557 758 B1）。これらは、電波を用いて発送物を非接触で識別するために使用される。ＲＦＩＤタグは識別データに加えて別のデータ、例えば宛先アドレスデータを含むことができる。

発送物が配送システム（例えば郵便サービス）に到達すると、宛先アドレスを有する発送物表面がカメラ装置によって都度記録されて記憶され、ＯＣＲ読み取り器において宛先アドレスが読み取られる。同時に該当する発送物内また発送物上に設けられているＲＦＩＤタグの無線による読み出しが行われる１。つぎに求められるのは、このＲＦＩＤタグが宛先アドレスデータを含むか否かである２。ＲＦＩＤタグから宛先アドレスデータが識別されずまた読み出されなかった場合、発送物の通常の後続処理が行われる３。すなわち、ＯＣＲ読み取り、ソートプラン（Sortierplan）にしたがったソートなどが行われるのである。ＲＦＩＤタグがアドレスデータを含む場合、このアドレスデータはテキスト形式であるかが自動的に確認される４。イエスの場合、実際データであるこの発送物の画像データが、目標データである対応するテキスト形式の宛先アドレスデータと共にサンプルデータバンクに記憶される６。これによってこのデータバンクは、つねに最新のサンプルを含むようになる。宛先アドレスデータが符号化形式でＲＦＩＤタグに記憶されていた場合、アドレスデータバンクを用いてテキスト形式に変換し５、つぎにこれをサンプルデータバンクに入力する。ここではアドレス辞書のコードデータ項目に記録されているすべての変形形態がサンプルデータバンクに取り込まれる。新たなエントリが所定数を上回るか、または最後の最適化以来の所定時間を上回った場合には、ＯＣＲ読み取り器を新たに最適化するための信号を出力する７。このようにしてＯＣＲ読み取り器に対する学習サンプルおよびテストサンプルが、自動的かつ人手によるコストなしに読み取り動作時に更新されるのである。

本発明の方法の流れを示すフローチャートである。

Claims

適応形分類器による発送物の文字に対する自動光学式読み取りを最適化するための学習サンプルおよび／またはテストサンプルを作成および／または更新する方法において、
− 自動光学式読み取りに加えて、発送物上または発送物内にあり、無線で読み出しおよび書き込み可能な記憶ユニットを読み出すステップと、
− 記憶ユニットから宛先アドレスデータが識別されて読み出された場合、当該データを宛先アドレス目標データとして、記録した発送物表面のコピーと共にサンプルデータバンクに記憶するステップとを有することを特徴とする、
学習サンプルおよび／またはテストサンプルを作成および／または更新する方法。
前記のサンプルデータバンクにて自動生成したエントリが所定数に達した場合および／または前回の最適化以来、決められた時間を上回った場合に自動光学式読み取り器を最適化するための信号を形成する、
請求項１に記載の方法。
前記記憶ユニットは、ＲＦＩＤタグ／トランスポンダとして実施されている、
請求項１に記載の方法。
アドレスデータが符号化形式で記憶されている場合、すべての変形形態を有するアドレス辞書からアドレステキストを自動的に求めてサンプルデータバンクに入力する、
請求項１に記載の方法。