JPH11345283A - パタ―ンを認識する方法および装置 - Google Patents

パタ―ンを認識する方法および装置

Info

Publication number
JPH11345283A
JPH11345283A JP11125408A JP12540899A JPH11345283A JP H11345283 A JPH11345283 A JP H11345283A JP 11125408 A JP11125408 A JP 11125408A JP 12540899 A JP12540899 A JP 12540899A JP H11345283 A JPH11345283 A JP H11345283A
Authority
JP
Japan
Prior art keywords
recognition
recognition unit
character
pattern
characters
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP11125408A
Other languages
English (en)
Inventor
Udo Maier
ウド・マイヤー
Werner Ruppert
ヴェルナー・ルッパルト
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of JPH11345283A publication Critical patent/JPH11345283A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/98Detection or correction of errors, e.g. by rescanning the pattern or by human intervention; Evaluation of the quality of the acquired patterns
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/24Character recognition characterised by the processing or recognition method
    • G06V30/248Character recognition characterised by the processing or recognition method involving plural approaches, e.g. verification by template match; Resolving confusion among similar patterns, e.g. "O" versus "Q"

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Quality & Reliability (AREA)
  • Character Discrimination (AREA)
  • Image Analysis (AREA)

Abstract

(57)【要約】 【課題】 認識速度向上を達成する文字認識のプロセス
を提供すること。 【解決手段】 提示されたアイテム上のパターンを認識
するための新規なシステムおよび方法を提供する。既知
の認識システムが、1次認識とリンクしている補足的認
識によって拡張される。明確に認識されなかった1次認
識結果は、補足的認識へ送られ、補足的認識によって明
確に認識されなかった文字は、修正システムへ送られ
る。ここでオペレータは認識されない文字を分類し、次
いでその情報が補足的認識ユニットを教育するのに使用
される。このようにして、修正システムの分類されたデ
ータは、修正システムと結合している連続的トレーニン
グ・プロセスのためのトレーニング・データを提供す
る。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、一般に提示された
アイテム上のパターンを認識する方法に関する。詳細に
は、連続的パターン適応プロセスを使用するかかるすべ
ての方法に関する。本発明はさらに、かかる方法を実行
するための装置に関する。
【0002】
【従来の技術】提示されたアイテム上の文字または文字
パターンの認識は、現代のビジネス界において、その重
要性が絶えず増大してきている機能である。特に銀行そ
の他の金融事業の分野においては、文字認識ユニットを
有するデータ処理装置が、転送命令、あらかじめ印刷さ
れている小切手やその他の証票の手作業なしでの処理を
支援するために使用されている。このような認識ユニッ
トはまた、郵便物の自動分類にも使用されている。
【0003】このような目的のために、いくつかの特殊
文字を含む英数字セットなど指定された1組の識別子を
使用する。次いで、認識プロセスを使用して、認識対象
の文字に可能な最大の信頼性を与える識別を割り振る。
【0004】これを行うため、認識対象アイテムの分類
の初期段における主題データの詳細な事前処理の後、考
慮する1つまたはいくつかの識別子について、信頼性係
数として知られている数値評価を推定する。この信頼性
係数は、後続段で、識別子へのアイテムの割り振りに関
する判断の基準として使用される。
【0005】これらの割り振り判断は、正しくない識別
子の拒否および受諾によって発生する残留障害を受ける
(置換)。拒否をできるだけ少なくすることと、同時に
置換の割合を最小にすることを望むことは、自動認識プ
ロセスの矛盾する要件を含んでいる。
【0006】パターン認識の信頼性を向上させるため、
「マルチボーティング」法として知られている方法を使
用して実験がなされており、この方法では同じ文字に対
するいくつかのパターン認識ユニットからの読み取り結
果が選択ユニットに送られ、そこで下記の規則に従って
結果が比較され、総合結果が選択される。 a)すべての認識ユニットが同じ結果を生成した場合、
総合結果は、所望のどの認識ユニットからも選択するこ
とができる。 b)信頼できる結果を提出する認識ユニットが1つもな
い場合、総合結果は「拒否」(認識不能)である。 c)すべての認識ユニットの結果が同じであるが、それ
らのうちにあらかじめ定義されたしきい値(例50%)
より大きい信頼性係数を有するものが少なくとも1つあ
る場合、最も信頼性の高い値が総合結果として選択され
る。 d)すべての認識ユニットの結果が異なる場合、総合結
果は「拒否」(認識不能)である。
【0007】ドイツ特許出願DE 41 33 590
A1号から、それぞれの場合に、いくつかの可能な信
号振幅値のうちの1つを表すこのような信号の分類方法
が知られている。この方法では、1つまたは複数のチャ
ネルにおいて下記の作業段が並列に行われる。 i)各場合に、いくつかのスキャンされた値から、サン
プルが形成される。 ii)各サンプルから少なくとも1つの特徴が抽出され
る。 iii)各サンプルから抽出された特徴がアドレスとし
て使用され、それによって、発生確率を格納している表
から特定の発生確率を読み取ることができる。
【0008】更なる評価のために、すべてのサンプルの
発生確率から判断範囲が算出され、規定のしきい値と比
較される。
【0009】ドイツ公告特許DE 21 12 919
B2号は、マルチボーティング法を用いる、文字認識
のための別の装置を開示している。これは、文字からの
情報を受け取る収集配列、処理のために収集配列から信
号を受け取る処理配列、および処理配列から信号を受け
取り、その中で文字が認識可能であり、その出口で判断
信号を表示させる判断配列を有する初期文字処理経路を
含む。さらに、第2の文字処理経路が使用され、これ
は、別の収集配列および別の処理配列の一方または両方
と既存の判断配列とからなるか、またはそれぞれ第2の
収集配列、処理配列、および判断配列からなる。第2の
文字処理経路の3つの配列のうち少なくとも1つは、第
1の文字処理経路の対応する配列とは異なる原理に従っ
て動作し、第2の文字処理経路の出口で判断信号が第1
の文字処理経路からの判断信号とともに比較配列に送ら
れ、その2つが一致した場合にそこで認識信号が生成さ
れる。
【0010】マルチボーティング法はさらに、それぞれ
異なる認識アルゴリズムを使用する少なくとも2つの認
識ユニットを必要とするが、それ以前の方法に比べて認
識プロセスの信頼性はわずかしか向上しない。
【0011】ドイツ特許DE 44 07 998 C
2号から証票上のパターンの認識方法が知られており、
これは少なくとも2つの異なるパターン認識ユニットを
使用して、パターンを認識するものである。また、パタ
ーン認識ユニットによって認識された各パターンに対す
るシャープでない変数によって表される信頼性係数を決
定する手段と、指定の信頼性係数の支援によって認識さ
れたパターンを評価する手段も提供している。
【0012】ドイツ特許DE 44 36 408 C
1号は、トレーニング・フェーズにおいて、分類手段に
よって得られた可能な識別子の評価のためにキャリブレ
ーション仕様が生成され、認識手順において分類手段に
よって推定された評価が、キャリブレーション仕様を用
いて異なる値で置き換えられるという、パターン認識方
法を記述している。
【0013】最後に、特開平8−235304号公報
は、第1および第2の文字認識部を有し、その第2文字
認識部が追加辞書と制御部を有する、文字認識装置を記
述している。抽出された特徴はユーザによって指定され
た修正文字に従って辞書に送られ、再度文字認識が実行
される。2回目の文字認識が完了すると、追加辞書が初
期化される。
【0014】現在のパターン認識システムは、ほとんど
の場合、光学式ピクチャ記録ユニットと実際の認識ユニ
ットの他に、修正ステーションを備えており、これは郵
便の適用例ではビデオ・コーディング・システムでよ
く、このシステムでは、拒否が表示され、特別の訓練を
受けた人によって手作業で修正される。修正されたデー
タ、すなわち認識されなかったかまたは誤って認識され
た文字のビデオ・ピクチャ(非コード化情報、NCI)
は、手作業で入力された関連する正しい文字(コード化
情報、CI)とともに、さらに認識の目的に使用される
ことはなく、修正の目的にのみ使用される。
【0015】パターン認識システムの開発において、大
量の文字パターンがトレーニング・データベースに集め
られる。それらは提案された認識タスクを表すものでな
ければならない。次に、文字は光学式スキャナを用いて
デジタル化され(NCIデータ)、所望の文字カテゴリ
に、たとえば、文字、数字さらには特殊文字にすべて割
り振られる。このセクションはトレーニング・プロセス
とも呼ばれている。文字認識の品質はこのトレーニング
・データベースに大きく依存する。そのデータが次の場
合、トレーニング・プロセスが正しく実行されたにもか
かわらず満足できない認識結果が生成される。 ○代表的ではない ○文字形状のカテゴリが不完全である ○実質的に文字形状の分布から外れる ○旧式の、新しいフォントのまたは最近流行の手書き文
字である ○異なる光学式記録システムから得られたものである。
【0016】トレーニング・システムは、例えば下記に
示すようないくつかのステップが必要なため高価であ
る。 ○パターンの収集 ○それらの代表性の評価 ○パターンのスキャンイン ○文字カテゴリへの手作業による文字の割り振り ○新しい分類子のテスト。
【0017】したがって、それらはできるだけ行われな
い。認識ソフトウェアの2つのバージョン間には約1年
あるいはそれ以上空くことが予想される。本物のデータ
は、例えば手紙の場合のように、しばしば秘密のまたは
個人的なものであるため、必要なデータの収集も問題と
なる。
【0018】
【発明が解決しようとする課題】したがって、本発明の
一目的は、認識速度の向上を達成することのできる文字
認識方法を提供することである。
【0019】本発明の他の目的は、関連の認識システム
に学習させることのできる認識方法を提供することであ
る。
【0020】上記のプロセスを実行できる装置を提供す
ることも、本発明の目的である。
【0021】
【課題を解決するための手段】提示されたアイテム上の
パターンを認識するための新規なシステムおよび方法を
提供する。既知の認識システムが、1次認識とリンクし
ている補足的認識によって拡張される。明確に認識され
なかった1次認識結果は、補足的認識へ送られ、補足的
認識によって明確に認識されなかった文字は、修正シス
テムへ送られる。ここでオペレータは認識されない文字
を分類し、次いでその情報が補足的認識ユニットを教育
するのに使用される。このようにして、修正システムの
分類されたデータは、修正システムと結合している連続
的トレーニング・プロセスのためのトレーニング・デー
タを提供する。
【0022】
【発明の実施の形態】図1に、本発明による認識システ
ム全体の構造を線図の形で示す。これは、少なくとも1
次認識サブシステム1として知られているものと、その
後の特に1次認識サブシステムが認識しなかったまたは
不十分にしか認識しなかった文字を認識するように訓練
された、構成要素3の、2つの認識サブシステムからな
る。したがって、この後続の構成要素は、1次認識サブ
システムを補足する1組の文字を使用し、したがって補
足的認識サブシステムと呼ばれる。さらに、これは形状
カテゴリを含むマトリクスを含んでいなければならず、
したがって、たとえば、新しい流行の文字形状が現れた
かどうかを認識することができる。図1は2つの認識サ
ブシステム1および3だけを示すが、他のかかるサブシ
ステムを1次認識サブシステムと補足的認識サブシステ
ムの間に、または補足的認識サブシステムの後に挿入す
ることが可能であることを当業者なら理解されよう。
【0023】1次認識サブシステムは、個々のテキスト
に対する分類子がパターン適応プロセスによって決定さ
れる通常の認識システムの機能をすべて有する。これら
の分類子は認識プロセスで認識すべき異なるタイプの筆
跡の特徴を含んでいる。したがって、1次認識サブシス
テムは次のものからなる。 ○認識アルゴリズム ○分類子
【0024】分類子は認識結果にかなりの影響を及ぼ
す。これは、1次認識サブシステムを使用したとき、あ
る文字とパターン適応プロセスからの文字パターンのあ
る類似度を表す信頼値を提供する。提案された文字に対
する信頼値が高い場合、置換のリスクは低くなる。信頼
値が低下した場合、ある文字が誤って認識されるリスク
は増大する。規定のしきい値より低い信頼値を有する1
次認識サブシステム1のすべての分類された文字は、次
に補足的認識サブシステム3へ送られる。
【0025】補足的認識サブシステムによっても認識さ
れない、または誤って認識された文字(不合格)は、次
に修正システム5、たとえばビデオ・コーディング・シ
ステムへ送られる。不合格文字は、この修正システムで
手作業で修正され、通常は文字認識の最終結果を形成す
る(図1の矢印6)。
【0026】ここで、本発明による認識システムは追加
のパターン適応システム7を有する。これは、修正シス
テム5の後にあって、修正システムと補足的認識サブシ
ステム3の間に配置されており、連続プロセス中で、補
足的認識サブシステム3の更なるトレーニング(教育)
に修正システム5からの入力を使用できるようにする。
したがって、追加のパターン適応プロセスまたはトレー
ニング・プロセスは、修正システムからの入力の影響を
受け、修正システムで修正され識別された文字は、連続
的適応プロセスを開始するのに使用される。すなわち、
この場合は、修正システムで識別された文字は、最終結
果としてアウトプットされずにパターン適応システムへ
送られる(図1の矢印8を参照のこと)。したがって、
実際の認識プロセスと修正システムで必要な修正作業の
際、パターン適応プロセスはオンラインで実行される。
トレーニング・システムの前に、各文字に、「マスター
識別」として知られるものが手作業で与えられる。これ
は修正ステーションでオンラインで生成される。この識
別は、分類子を算出し、それに続いて認識率、すなわち
拒否、置換、ヒットをテストできるようにするためにト
レーニング・プロセスが必要とする。トレーニング・デ
ータが、適切なスキャナによってすでに読み取られ、識
別を与えられており、したがって代表的であるため、修
正ステーションから直接転送できるという大きな利益を
示している。
【0027】したがって、「マスター識別」の手作業に
よる準備プロセスは修正ステーション自体で行われる。
これは、より短時間で安価であるため、個々の(オフラ
イン)トレーニング・プロセスより有利である。下記の
条件が満たされた場合、本明細書で提案するオンライン
・パターン適応プロセスは自動的に開始する。 ○充分な量の分類された文字が収集されていること ○プロセスを開始する特定の時刻が定義されていること
(例えば、従業員の勤務交代時)。
【0028】このパターン適応プロセスは、分類された
文字に基づいて分類子を生成する。その後、新たに生成
された分類子によって達成した認識結果が再びテスト・
ランにおいて検証される。結果がある特定の品質に達し
ている場合、古い補足的認識が現在の新しいもので置き
換えられる。
【0029】したがって、このオンライン・パターン適
応プロセスの結果として、後続の補足的認識サブシステ
ム3は1次認識サブシステム1の弱点に集中して動作
し、拒否された文字の信頼値を再び増大させることがで
きる。それによって、拒否文字は認識された文字に変換
される(ヒット)。これらの十分に認識されない文字の
連続的オンライン収集と、トレーニング・プロセスまた
はパターン適応プロセスにおけるその後の処理の結果、
修正にかかる経費コストが削減され、認識品質が向上す
る。
【0030】下記に、例として図2を用いて、パターン
適応プロセス(トレーニング・プロセス)全体について
更に詳細に説明する。
【0031】1次認識サブシステム1は、認識アルゴリ
ズムとともに認識ユニットを形成する分類子を有する。
したがって、この1次認識サブシステムの認識性能は、
指定され、ソフトウェアの更新によってしか修正できな
い。しかし先に上記で指摘したように、分類子の更新は
コスト上の理由からほとんど行われない。したがって、
たとえばある顧客のテキストに対する適応の可能性はわ
ずかしかなく、いくつかの文字の認識の不十分さを、ユ
ーザは長期間にわたり頻繁に受容しなければならない。
【0032】しかし、補足的認識サブシステム3によっ
て、分類子は個々のアルゴリズムから分離されている。
それらが常に同じトレーニング・アルゴリズムを用いて
修正ステーションからの新たに分類された文字によって
算出されているからである。その結果、分類子は、パタ
ーン適応プロセスを通して連続的に改善され、それによ
って、新しい分類子と既存の認識アルゴリズムは、毎回
新しい補足的認識を生成することになる。分類子は、自
動的にオンラインで置換することができる。
【0033】補足的認識サブシステムは、分類子を適切
にトレーニングしながら、主に、1次認識サブシステム
1の弱点に集中して動作する。
【0034】図2の例において、1次認識サブシステム
1によって拒否された文字(不合格)は、補足的認識サ
ブシステム3へ送られる。文字「4」の信頼値は29で
あり、規定のしきい値(この例では「30」)を下回る
ので、結果としてその文字は補足的認識サブシステム3
へ送られる。補足的認識サブシステム3による第1次の
分類の試みでも、文字を「4」として分類する信頼値が
「9」に対する信頼値に近すぎるため、その文字が拒否
される結果になる(個々のしきい値と信頼値が互いに近
すぎるために2つの文字が拒否される範囲は共に、所望
の通りに指定できることを指摘しておく)。その結果、
補足的認識サブシステム3も、その文字を拒否すること
を決定する。拒否された文字が存在するフィールド、す
なわちこの場合には、文字フレームの標準(スケール)
に従ってパターン適応プロセスへ直接送ることができる
セグメント化された文字(NCI)は、このとき修正シ
ステム5へ送られる。ここで、文字にマスター識別(必
要な識別)が与えられる。したがって、制御システムに
いる人が、その文字を明確に(この場合は「9」とし
て)特徴付ける。イメージとして、そして追加の属性と
共に追加のパターン適応プロセスまたはトレーニング・
プロセスのための候補を含むデータベースに格納され
る。これらの追加属性の例には下記のものがある。 ○マスター識別 ○スキャナ解像度 ○文字フレームの幅と高さ ○認識ID(Reco−ID)のフィールド。
【0035】このとき、オンライン・トレーニング・プ
ロセス(再トレーニング)によって、補足的認識サブシ
ステム3のさらなる分類の結果、「9」としての分類に
対して十分に高い信頼値(下記参照)が得られるように
なる。したがって、この文字は、もはや修正システムに
は送られず正しく認識されている。
【0036】補足的認識サブシステム3の分類子は、テ
キストをオンラインで調整し(実際の作業現場でトレー
ニングが行われる)、したがって、システム全体の認識
品質が向上する。
【0037】拒否文字のデータベースから取り出された
分類された文字には、関連する文字カテゴリ中で形状カ
テゴリが与えられる。トレーニング・プロセスにおける
文字のばらつきをカバーするために、各文字カテゴリご
とに、対応する形状カテゴリが存在する。
【0038】図3に、文字カテゴリ「4」に対する形状
カテゴリの原理を示す。
【0039】文字カテゴリ中の各形状カテゴリに対し
て、他の文字カテゴリからの関連する形状カテゴリが、
トレーニング・ランの際、分類子を自動的に算出するの
に使用される。ゾーン特性と反対特性(anti-character
istics)を認識のために使用するプロセス(欧州特許E
P−B−O 632 404号参照)が好んで使用され
る。このプロセスは、修正システムにおける文字の分類
の後、それ以上、トレーニング・プロセス(パターン適
応プロセス)において人の注意を必要としないという利
点を有する。
【0040】パターン適応プロセスを複数段で実装する
ことが可能である。第1段において、修正システムから
の修正された文字を、指定の期間格納する。次いで、こ
のデータをトレーニング・プロセスで処理する。認識ソ
フトウェアの製造業者のところで、トレーニング・ラン
を実施することも可能である。トレーニング・ランの結
果、分類子が得られ、それが補足的認識サブシステムに
ロードされる。補足的認識サブシステムはこのとき、次
の認識ユニットとして働き、拒否を修正システムへ送
る。ただし、この第1段では、第1認識サブシステムの
開始のための連続プロセスはオフラインで行われる。こ
の場合、修正ステーションは、初期トレーニング・デー
タを収集するためにのみ使用される。文字は分類され、
文字のアウトラインが格納される。データの処理(トレ
ーニング・プロセス)はオフラインで行われる。次い
で、第1トレーニング・プロセスからの分類子が1回の
みロードされ、たとえば、顧客のところで、システム全
体を動作させる。
【0041】次いで、第2フェーズにおいて、トレーニ
ング・プロセスが、補足的認識サブシステムに組み込ま
れ、したがってオンラインで開始され、修正システムに
よって構築された文字データベースからのデータを読み
取ることができるようになる。
【0042】本明細書で提案するシステムの主な利点
は、常に1次認識サブシステムより良い結果を提供する
ことである。新しい優れた結果をもたらす新しい1次認
識サブシステムが市場に出回るとしても、それは本明細
書に記載のシステムによってさらにより良い結果を提供
するはずである。その場合、このシステムは、拒否文字
が生じた場合、すなわち補足的認識サブシステムによっ
て向上が可能なときのみ、動作されることになる。
【0043】このようにして、既存のシステムと比較し
て認識率が著しく増大する自己教育認識システムを提供
することが可能である。
【0044】まとめとして、本発明の構成に関して以下
の事項を開示する。
【0045】(1)少なくとも2つのパターン認識ユニ
ット(1,3)と、前記認識ユニットの後にくる1つま
たは複数の修正システム(5)とを有し、前記少なくと
も2つのパターン認識ユニットが、1つの1次認識ユニ
ット(1)と前記1次認識ユニットの後に配置された少
なくとも1つの補足的認識ユニットから構成される、パ
ターンを認識する装置であって、前記補足的認識ユニッ
ト(3)にパターン適応システム(7)が与えられ、前
記補足的認識ユニット(3)と前記パターン適応システ
ム(7)の間に配置された前記修正システム(5)から
認識対象パターンの修正された文字を前記パターン適応
システムに読み込むことが可能であり、前記修正された
文字が前記補足的認識ユニット(3)の教育に使用され
ることを特徴とする、パターン認識装置。 (2)前記修正された文字が特別な識別を有することを
特徴とする、上記(1)に記載の装置。 (3)前記補足的認識ユニットが、前記1次認識ユニッ
トを補足する文字のストックを使用することを特徴とす
る、上記(1)または(2)に記載の装置。 (4)前記1次認識ユニットまたは前記補足的認識ユニ
ットによって誤って認識された文字のみが、前記修正シ
ステムへ送られることを特徴とする、上記(1)ないし
(3)のいずれか一項に記載の装置。 (5)パターンを認識する方法であって、パターンを第
1認識ユニット(1)に渡すステップと、前記1次認識
ユニット(1)によって誤って識別された文字を第2認
識ユニット(3)に渡すステップと、前記第2認識ユニ
ット(3)によって誤って識別された文字を修正システ
ム(5)に渡すステップと、前記修正システムで前記文
字を正確に識別するステップと、前記第2認識ユニット
(3)を教育するため、前記正確に識別された文字をパ
ターン適応プロセスに渡すステップとを含む方法。 (6)前記パターン適応プロセスが、オンラインで実行
されることを特徴とする、上記(5)に記載の方法。 (7)前記第2認識ユニットによって誤って識別された
文字に、前記修正システムで必要な識別子が与えられる
ことを特徴とする、上記(5)または(6)に記載の方
法。 (8)前記必要な識別子を与えられた文字が前記パター
ン適応プロセス用のデータベースに格納されることを特
徴とする、上記(5)ないし(7)のいずれか一項に記
載の方法。 (9)前記パターン適応プロセスにより、前記第2認識
ユニットで誤って識別された文字が明確に分類されるこ
とを特徴とする、上記(5)ないし(8)のいずれか一
項に記載の方法。
【図面の簡単な説明】
【図1】本発明による認識システム全体の描写を示す図
である。
【図2】本発明によるトレーニング・プロセスの原理を
示す図である。
【図3】マトリクス中の文字の形状カテゴリの例を示す
図である。
【符号の説明】
1 第1認識ユニット 3 第2認識ユニット 5 訂正システム 7 パターン適応システム
───────────────────────────────────────────────────── フロントページの続き (72)発明者 ヴェルナー・ルッパルト ドイツ ディー71101 シェーンアイヒ ガルテンシュトラーセ 9/1

Claims (9)

    【特許請求の範囲】
  1. 【請求項1】少なくとも2つのパターン認識ユニット
    (1,3)と、前記認識ユニットの後にくる1つまたは
    複数の修正システム(5)とを有し、前記少なくとも2
    つのパターン認識ユニットが、1つの1次認識ユニット
    (1)と前記1次認識ユニットの後に配置された少なく
    とも1つの補足的認識ユニットから構成される、パター
    ンを認識する装置であって、 前記補足的認識ユニット(3)にパターン適応システム
    (7)が与えられ、前記補足的認識ユニット(3)と前
    記パターン適応システム(7)の間に配置された前記修
    正システム(5)から認識対象パターンの修正された文
    字を前記パターン適応システムに読み込むことが可能で
    あり、前記修正された文字が前記補足的認識ユニット
    (3)の教育に使用されることを特徴とする、パターン
    認識装置。
  2. 【請求項2】前記修正された文字が特別な識別を有する
    ことを特徴とする、請求項1に記載の装置。
  3. 【請求項3】前記補足的認識ユニットが、前記1次認識
    ユニットを補足する文字のストックを使用することを特
    徴とする、請求項1または2に記載の装置。
  4. 【請求項4】前記1次認識ユニットまたは前記補足的認
    識ユニットによって誤って認識された文字のみが、前記
    修正システムへ送られることを特徴とする、請求項1な
    いし3のいずれか一項に記載の装置。
  5. 【請求項5】パターンを認識する方法であって、 パターンを第1認識ユニット(1)に渡すステップと、 前記1次認識ユニット(1)によって誤って識別された
    文字を第2認識ユニット(3)に渡すステップと、 前記第2認識ユニット(3)によって誤って識別された
    文字を修正システム(5)に渡すステップと、 前記修正システムで前記文字を正確に識別するステップ
    と、 前記第2認識ユニット(3)を教育するため、前記正確
    に識別された文字をパターン適応プロセスに渡すステッ
    プとを含む方法。
  6. 【請求項6】前記パターン適応プロセスが、オンライン
    で実行されることを特徴とする、請求項5に記載の方
    法。
  7. 【請求項7】前記第2認識ユニットによって誤って識別
    された文字に、前記修正システムで必要な識別子が与え
    られることを特徴とする、請求項5または6に記載の方
    法。
  8. 【請求項8】前記必要な識別子を与えられた文字が前記
    パターン適応プロセス用のデータベースに格納されるこ
    とを特徴とする、請求項5ないし7のいずれか一項に記
    載の方法。
  9. 【請求項9】前記パターン適応プロセスにより、前記第
    2認識ユニットで誤って識別された文字が明確に分類さ
    れることを特徴とする、請求項5ないし8のいずれか一
    項に記載の方法。
JP11125408A 1998-05-07 1999-05-06 パタ―ンを認識する方法および装置 Pending JPH11345283A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
DE19820353A DE19820353C2 (de) 1998-05-07 1998-05-07 Verfahren und Vorrichtung zur Erkennung eines Musters auf einer Vorlage
DE19820353.5 1998-05-07

Publications (1)

Publication Number Publication Date
JPH11345283A true JPH11345283A (ja) 1999-12-14

Family

ID=7866933

Family Applications (1)

Application Number Title Priority Date Filing Date
JP11125408A Pending JPH11345283A (ja) 1998-05-07 1999-05-06 パタ―ンを認識する方法および装置

Country Status (5)

Country Link
US (1) US6373982B1 (ja)
EP (1) EP0955600B1 (ja)
JP (1) JPH11345283A (ja)
CN (1) CN1163847C (ja)
DE (2) DE19820353C2 (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102004030415A1 (de) * 2004-06-24 2006-01-19 Siemens Ag Verfahren zur automatischen Ermittlung operativer Leistungsdaten von Lesesystemen
DE102006050347A1 (de) * 2006-10-25 2008-04-30 Siemens Ag Verfahren zum Prüfen eines Aufdrucks und Aufdruckprüfvorrichtung
CN102592121B (zh) * 2011-12-28 2013-12-04 方正国际软件有限公司 一种ocr漏识判断方法及系统
US10019000B2 (en) 2012-07-17 2018-07-10 Elwha Llc Unmanned device utilization methods and systems
US20140025230A1 (en) 2012-07-17 2014-01-23 Elwha LLC, a limited liability company of the State of Delaware Unmanned device interaction methods and systems

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
NL7004381A (ja) * 1970-03-26 1971-09-28
JPS6142083A (ja) 1984-08-03 1986-02-28 Fujitsu Ltd 文字認識装置
JPS6227874A (ja) 1985-07-30 1987-02-05 Toshiba Corp 文字認識装置
JPS62103784A (ja) 1985-10-31 1987-05-14 Toshiba Corp 文字読取装置
JPH01246678A (ja) * 1988-03-29 1989-10-02 Toshiba Corp パターン認識装置
US5052043A (en) * 1990-05-07 1991-09-24 Eastman Kodak Company Neural network with back propagation controlled through an output confidence measure
JPH04302073A (ja) 1991-03-29 1992-10-26 Meidensha Corp 文字認識装置
JPH05346970A (ja) * 1991-04-04 1993-12-27 Fuji Xerox Co Ltd 文書認識装置
DE4133590A1 (de) * 1991-07-03 1993-01-14 Bosch Gmbh Robert Verfahren zur klassifikation von signalen
US5251268A (en) * 1991-08-09 1993-10-05 Electric Power Research Institute, Inc. Integrated method and apparatus for character and symbol recognition
DE69315990T2 (de) * 1993-07-01 1998-07-02 Ibm Mustererkennung durch Erzeugung und Benutzung zonenweiser Merkmale und Anti-Merkmale
DE4407998C2 (de) * 1994-03-10 1996-03-14 Ibm Verfahren und Vorrichtung zur Erkennung eines Musters auf einem Beleg
DE4436408C1 (de) * 1994-10-12 1995-12-07 Daimler Benz Ag Mustererkennungsverfahren
JPH08235304A (ja) * 1995-02-24 1996-09-13 Oki Electric Ind Co Ltd 文字認識装置
DE19624977A1 (de) * 1996-06-22 1998-01-02 Siemens Ag Verfahren zur Verarbeitung von Postsachen
US5881172A (en) * 1996-12-09 1999-03-09 Mitek Systems, Inc. Hierarchical character recognition system

Also Published As

Publication number Publication date
CN1235319A (zh) 1999-11-17
DE19820353C2 (de) 2001-06-13
EP0955600A3 (en) 2002-06-12
DE19820353A1 (de) 1999-11-11
DE69928320T2 (de) 2006-07-27
DE69928320D1 (de) 2005-12-22
US6373982B1 (en) 2002-04-16
CN1163847C (zh) 2004-08-25
EP0955600B1 (en) 2005-11-16
EP0955600A2 (en) 1999-11-10

Similar Documents

Publication Publication Date Title
US5764799A (en) OCR method and apparatus using image equivalents
US6424728B1 (en) Method and apparatus for verification of signatures
US7650035B2 (en) Optical character recognition based on shape clustering and multiple optical character recognition processes
US7697758B2 (en) Shape clustering and cluster-level manual identification in post optical character recognition processing
US8175394B2 (en) Shape clustering in post optical character recognition processing
US7627177B2 (en) Adaptive OCR for books
US20080063277A1 (en) High resolution replication of document based on shape clustering
US20040006467A1 (en) Method of automatic language identification for multi-lingual text recognition
US8340429B2 (en) Searching document images
US5561720A (en) Method for extracting individual characters from raster images of a read-in handwritten or typed character sequence having a free pitch
CN111177308A (zh) 一种文本内容的识别情绪方法
JPH11345283A (ja) パタ―ンを認識する方法および装置
EP2116971A2 (en) Shape clustering in document image processing
JP3313272B2 (ja) 住所読み取り方法および識別関数重みベクトル生成方法
JP3095069B2 (ja) 文字認識装置、学習方法および文字認識プログラムを記録した記録媒体
US6993155B1 (en) Method for reading document entries and addresses
JP2001022883A (ja) 文字認識方式及び該文字認識方式の機能を実現させるための記録媒体
JPH0654503B2 (ja) パタ−ン認識装置
JPS638884A (ja) 文字読取装置
JP2003099709A (ja) 誤読文字修正方法及び光学的文字認識装置
JPS6198487A (ja) 辞書選択方式
JP2002074262A (ja) 認識文字修正方法
Allgrove et al. Optimisation issues in dynamic and static signature verification
JPH0318987A (ja) 辞書登録方法
JP2003016281A (ja) 帳票認識方法