JP2991779B2 - 文字認識方法及び装置 - Google Patents
文字認識方法及び装置Info
- Publication number
- JP2991779B2 JP2991779B2 JP2414876A JP41487690A JP2991779B2 JP 2991779 B2 JP2991779 B2 JP 2991779B2 JP 2414876 A JP2414876 A JP 2414876A JP 41487690 A JP41487690 A JP 41487690A JP 2991779 B2 JP2991779 B2 JP 2991779B2
- Authority
- JP
- Japan
- Prior art keywords
- character
- certainty factor
- processing
- recognition result
- certainty
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
- G06F18/254—Fusion techniques of classification results, e.g. of results related to same input data
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Character Discrimination (AREA)
Description
【0001】
【産業上の利用分野】本発明は、文字認識方法及び装置
に係り、特に利用者による認識結果の評価や修正などを
容易にする文字認識方法及び装置に関する。
に係り、特に利用者による認識結果の評価や修正などを
容易にする文字認識方法及び装置に関する。
【0002】
【従来の技術】文字認識装置は基本的に、入力パターン
とパターン辞書とを比較して相違度の小さいもの、また
は類似度の大きなものを認識結果として出力する。しか
し認識率100%を実現することは事実上不可能であ
る。そうなると当然、認識結果の中には間違えた文字も
含まれるので、その修正を利用者が行なう必要がある。
とパターン辞書とを比較して相違度の小さいもの、また
は類似度の大きなものを認識結果として出力する。しか
し認識率100%を実現することは事実上不可能であ
る。そうなると当然、認識結果の中には間違えた文字も
含まれるので、その修正を利用者が行なう必要がある。
【0003】この修正作業の効率化のためには、認識結
果がどの程度信頼できるものかを装置利用者が容易に評
価できるようにするとよい。
果がどの程度信頼できるものかを装置利用者が容易に評
価できるようにするとよい。
【0004】この目的を達成するため、パターン辞書と
の類似度に応じて認識結果の表示色を変化させる光学文
字認識装置が提案されている(例えば特公昭61−64
30号公報)。
の類似度に応じて認識結果の表示色を変化させる光学文
字認識装置が提案されている(例えば特公昭61−64
30号公報)。
【0005】また、認識中に文字のパターンまたは特徴
量を保存しておき、認識結果を修正した場合に、保存さ
れているパターンまたは特徴量を用いて認識のための辞
書の学習(更新、追加登録)を行う方式が考案されてい
る。
量を保存しておき、認識結果を修正した場合に、保存さ
れているパターンまたは特徴量を用いて認識のための辞
書の学習(更新、追加登録)を行う方式が考案されてい
る。
【0006】
【発明が解決しようとする課題】近年、読み取り対象原
稿に用いられる書体や文字種が著しく増加し、また低品
質のコピー原稿なども読み取り対象となることが多くな
っていることから、パターンマッチングのみでは認識率
の向上に限界があることが分かり、切り出し技術、言語
処理などの後処理技術の研究が精力的に行なわれた。そ
の成果として、現在の文字認識装置は、最終的な認識結
果を得るまでの処理過程が複雑・多段階になっている。
稿に用いられる書体や文字種が著しく増加し、また低品
質のコピー原稿なども読み取り対象となることが多くな
っていることから、パターンマッチングのみでは認識率
の向上に限界があることが分かり、切り出し技術、言語
処理などの後処理技術の研究が精力的に行なわれた。そ
の成果として、現在の文字認識装置は、最終的な認識結
果を得るまでの処理過程が複雑・多段階になっている。
【0007】このような現在の文字認識装置では、従来
のようなパターンマッチングの類似度のみで認識結果の
確からしさを判断したのでは判断を誤る危険が大きい。
のようなパターンマッチングの類似度のみで認識結果の
確からしさを判断したのでは判断を誤る危険が大きい。
【0008】また、認識結果の修正は、ある単位毎に認
識処理を中断して行なう方式と、原稿全面の認識処理が
終了した後に行なう方式とがある。いずれの方式であっ
ても、従来は、認識結果の修正時に辞書学習を行なう場
合、認識処理の開始から中断または終了までに対象とな
った全文字のパターンまたは特徴量を保存する。したが
って、原稿全面を一括して認識する方式の場合、極めて
大量のパターンまたは特徴量を保存しなければならず、
RAMや磁気ディスクの大きな記憶スペースを必要と
し、しかも、保存情報の大部分は辞書学習に利用されな
いため、極めて不経済である。他方、ある単位で認識処
理を中断して修正を行なう方式によれば、処理の単位を
小さくすることによりパターンまたは特徴量を保存する
ための記憶スペースを減らすことができるが、処理が小
さな単位毎に中断するために効率が非常に悪い。
識処理を中断して行なう方式と、原稿全面の認識処理が
終了した後に行なう方式とがある。いずれの方式であっ
ても、従来は、認識結果の修正時に辞書学習を行なう場
合、認識処理の開始から中断または終了までに対象とな
った全文字のパターンまたは特徴量を保存する。したが
って、原稿全面を一括して認識する方式の場合、極めて
大量のパターンまたは特徴量を保存しなければならず、
RAMや磁気ディスクの大きな記憶スペースを必要と
し、しかも、保存情報の大部分は辞書学習に利用されな
いため、極めて不経済である。他方、ある単位で認識処
理を中断して修正を行なう方式によれば、処理の単位を
小さくすることによりパターンまたは特徴量を保存する
ための記憶スペースを減らすことができるが、処理が小
さな単位毎に中断するために効率が非常に悪い。
【0009】本発明の主たる目的は、認識結果の確信度
をより的確に決定し、利用者による認識結果の評価や修
正を容易にする文字認識方法及び装置を提供することに
ある。
をより的確に決定し、利用者による認識結果の評価や修
正を容易にする文字認識方法及び装置を提供することに
ある。
【0010】本発明の他の目的は、希望するような認識
結果が得られないことが明らかな場合に、処理を継続す
ることによる時間的な無駄を減らし、また利用者が必要
な処置を迅速に採り得るようにした文字認識装置を提供
することにある。
結果が得られないことが明らかな場合に、処理を継続す
ることによる時間的な無駄を減らし、また利用者が必要
な処置を迅速に採り得るようにした文字認識装置を提供
することにある。
【0011】本発明の更に他の目的は、処理過程のでき
る限りは早い時点で不適切な候補を排除し、あるいは処
理の方法やパラメータを変更するなどして処理の効率や
認識率を向上できる文字認識装置を提供することにあ
る。
る限りは早い時点で不適切な候補を排除し、あるいは処
理の方法やパラメータを変更するなどして処理の効率や
認識率を向上できる文字認識装置を提供することにあ
る。
【0012】本発明の更に他の目的は、利用者が誤認識
の原因や必要な処置を容易に判断できるようにした文字
認識装置を提供することにある。
の原因や必要な処置を容易に判断できるようにした文字
認識装置を提供することにある。
【0013】本発明の更に他の目的は、認識処理の単位
が原稿全面というように大きい場合においても、辞書学
習のための文字のパターンまたは特徴量の保存に大きな
記憶スペースを必要とせず、また辞書の学習を効率的に
行う文字認識装置を提供することにある。
が原稿全面というように大きい場合においても、辞書学
習のための文字のパターンまたは特徴量の保存に大きな
記憶スペースを必要とせず、また辞書の学習を効率的に
行う文字認識装置を提供することにある。
【0014】
【課題を解決するための手段】請求項1の発明は、入力
された文字や記号の未知パターン(以下、文字パターン
と略称する)を認識するために複数段階の処理を施こし
て最終的な認識結果を得る文字認識方法において、前記
各段階の処理での認識結果の評価情報を取得し、前記評
価情報に基づいて、前記最終的な認識結果の確信度を決
定することを特徴とする。
された文字や記号の未知パターン(以下、文字パターン
と略称する)を認識するために複数段階の処理を施こし
て最終的な認識結果を得る文字認識方法において、前記
各段階の処理での認識結果の評価情報を取得し、前記評
価情報に基づいて、前記最終的な認識結果の確信度を決
定することを特徴とする。
【0015】請求項2の発明は、請求項1の文字認識方
法において、個々の処理毎に確信度を求め、当該確信度
により前の処理までに求めた確信度を更新する操作を繰
り返して、最終的な認識結果に対する最終的な確信度を
決定することを特徴とする。
法において、個々の処理毎に確信度を求め、当該確信度
により前の処理までに求めた確信度を更新する操作を繰
り返して、最終的な認識結果に対する最終的な確信度を
決定することを特徴とする。
【0016】請求項3の発明は、請求項1または2の文
字認識方法において、ある処理までの確信度を、その前
または後の処理に反映させることを特徴とする。
字認識方法において、ある処理までの確信度を、その前
または後の処理に反映させることを特徴とする。
【0017】請求項4の発明は、文字認識装置におい
て、認識対象の文字パターンを入力する手段と、入力さ
れた文字パターンを認識するために複数段階の処理を施
こして最終的な認識結果を求める処理手段と、各段階の
処理での認識結果の評価情報を取得し、該評価情報に基
づいて、前記最終的な認識結果の確信度を決定する手段
と、前記決定した確信度の情報を前記認識結果に付加し
て出力する手段とを有することを特徴とする。
て、認識対象の文字パターンを入力する手段と、入力さ
れた文字パターンを認識するために複数段階の処理を施
こして最終的な認識結果を求める処理手段と、各段階の
処理での認識結果の評価情報を取得し、該評価情報に基
づいて、前記最終的な認識結果の確信度を決定する手段
と、前記決定した確信度の情報を前記認識結果に付加し
て出力する手段とを有することを特徴とする。
【0018】請求項5の発明は、請求項4の文字認識装
置において、確信度を決定する手段は、個々の処理毎に
確信度を求め、当該確信度により前の処理までに求めた
確信度を更新する操作を繰り返して、最終的な認識結果
に対する最終的な確信度を決定することを特徴とする。
置において、確信度を決定する手段は、個々の処理毎に
確信度を求め、当該確信度により前の処理までに求めた
確信度を更新する操作を繰り返して、最終的な認識結果
に対する最終的な確信度を決定することを特徴とする。
【0019】請求項6の発明は、請求項4または5の文
字認識装置において、出力される認識結果の視覚的な条
件を確信度に応じて変化させることを特徴とする。
字認識装置において、出力される認識結果の視覚的な条
件を確信度に応じて変化させることを特徴とする。
【0020】請求項7の発明は、請求項4または5の文
字認識装置において、確信度が一定レベル以下の認識結
果文字数を計数し、計数値が所定の閾値を越えたことを
検出して警告を発し、または処理を中断する手段を有す
ることを特徴とする。
字認識装置において、確信度が一定レベル以下の認識結
果文字数を計数し、計数値が所定の閾値を越えたことを
検出して警告を発し、または処理を中断する手段を有す
ることを特徴とする。
【0021】請求項8の発明は、請求項5の文字認識装
置において、ある処理において確信度が一定レベル以下
となった候補を後の処理の候補から外すための手段を有
することを特徴とする。
置において、ある処理において確信度が一定レベル以下
となった候補を後の処理の候補から外すための手段を有
することを特徴とする。
【0022】請求項9の発明は、請求項5の文字認識装
置において、最終的な確信度とは別に個々の処理毎の確
信度の情報を保存する手段と、認識結果文字に関して前
記保存された個々の処理毎の確信度の情報に基づきメッ
セージを出力する手段を有することを特徴とする。
置において、最終的な確信度とは別に個々の処理毎の確
信度の情報を保存する手段と、認識結果文字に関して前
記保存された個々の処理毎の確信度の情報に基づきメッ
セージを出力する手段を有することを特徴とする。
【0023】請求項10の発明は、請求項4または5の
文字認識装置において、認識対象文字のパターンまたは
その特徴量を保存するための記憶手段と、認識結果が修
正された場合に、修正された認識結果に対する確信度が
所定レベルのときに限り、前記記憶手段に保存されてい
る対応したパターンまたは特徴量を用いてパターンマッ
チング処理のための辞書の学習を実行する手段を有する
ことを特徴とする。
文字認識装置において、認識対象文字のパターンまたは
その特徴量を保存するための記憶手段と、認識結果が修
正された場合に、修正された認識結果に対する確信度が
所定レベルのときに限り、前記記憶手段に保存されてい
る対応したパターンまたは特徴量を用いてパターンマッ
チング処理のための辞書の学習を実行する手段を有する
ことを特徴とする。
【0024】
【作用】確信度とは、最終認識結果の文字がどの程度確
からしいかを表わすもので、0%から100%の数値で
表わされたり、あるいは、その数値を何段階かに量子化
して表わさせる。例えば、次のA,B,Cの3ランクで
表わす。 Aランク:認識結果は正しい。 Bランク:認識結果は怪しい(正しいか間違いか分から
ない)。 Cランク:認識結果は間違い。
からしいかを表わすもので、0%から100%の数値で
表わされたり、あるいは、その数値を何段階かに量子化
して表わさせる。例えば、次のA,B,Cの3ランクで
表わす。 Aランク:認識結果は正しい。 Bランク:認識結果は怪しい(正しいか間違いか分から
ない)。 Cランク:認識結果は間違い。
【0025】本発明によれば、最終の認識結果を得るた
めの複数段階の処理により得られる情報(評価情報)に
基づき、総合的に確信度を決定する。例えば、パターン
マッチング処理から第一候補の評価値あるいは第一候補
と第二候補との評価値の差、パス選択処理からパス決定
時の評価値、ルール処理から、どのようなルールが適用
され修正されたかを表わす情報、言語処理から言語修正
の結果を表わす情報を集め、これらの情報(ここでは評
価情報と称す)を証拠として例えばデンプスター・シェ
ーファー(Dempster & Shafer)の確率理論を使って
確信度を総合的に判断する。
めの複数段階の処理により得られる情報(評価情報)に
基づき、総合的に確信度を決定する。例えば、パターン
マッチング処理から第一候補の評価値あるいは第一候補
と第二候補との評価値の差、パス選択処理からパス決定
時の評価値、ルール処理から、どのようなルールが適用
され修正されたかを表わす情報、言語処理から言語修正
の結果を表わす情報を集め、これらの情報(ここでは評
価情報と称す)を証拠として例えばデンプスター・シェ
ーファー(Dempster & Shafer)の確率理論を使って
確信度を総合的に判断する。
【0026】このような確信度の決定は、最終の処理段
階で、それまでの処理段階で得られた情報を集めて一括
して行なうか、あるいは各処理段階で得られた情報に基
づき候補の確信度を求め、これによって前処理段階まで
に求められた確信度を更新する操作を最終処理段階まで
繰り返すことにより行なう。
階で、それまでの処理段階で得られた情報を集めて一括
して行なうか、あるいは各処理段階で得られた情報に基
づき候補の確信度を求め、これによって前処理段階まで
に求められた確信度を更新する操作を最終処理段階まで
繰り返すことにより行なう。
【0027】このようにして決定される確信度は、パタ
ーン辞書との類似度のみによる場合に比べ、より的確な
ものとすることができ、また全く不適当な確信度となる
危険を大幅に減らすことができる。
ーン辞書との類似度のみによる場合に比べ、より的確な
ものとすることができ、また全く不適当な確信度となる
危険を大幅に減らすことができる。
【0028】また、ある処理までの確信度を、その前ま
たは後の処理に反映させ、前または後の処理の方法やパ
ラメータ等を適正化することにより、認識率を向上し、
また修正作業の効率を改善することができる。
たは後の処理に反映させ、前または後の処理の方法やパ
ラメータ等を適正化することにより、認識率を向上し、
また修正作業の効率を改善することができる。
【0029】そして、かかる確信度に応じて、認識結果
の表示または印刷の際に色や輝度などの視覚的条件を変
化させ、あるいは認識結果に対応させて文字または記号
を表示または印刷することにより、利用者は、認識結果
の確信度を容易に認識し、修正が必要な文字を素早く的
確に見つけ、その修正作業を効率よく行なうことができ
る。
の表示または印刷の際に色や輝度などの視覚的条件を変
化させ、あるいは認識結果に対応させて文字または記号
を表示または印刷することにより、利用者は、認識結果
の確信度を容易に認識し、修正が必要な文字を素早く的
確に見つけ、その修正作業を効率よく行なうことができ
る。
【0030】さらに、確信度があるレベル以下の文字
数、例えば確信度がBランクとCランクの文字数が所定
の閾値を越えた場合に警告(例えば警告音)を発生する
ことにより、装置利用者は現在読み取り中の原稿は間違
いが多いであろうと判断し、処理を停止させたり、ある
いは認識条件を変更して起動するといった、必要な処置
を素早くとることができる。また、このような場合、処
理を継続しても無駄になることが多いが、自動的に処理
を中断することにより、そのような時間的な無駄を減ら
すことができる。
数、例えば確信度がBランクとCランクの文字数が所定
の閾値を越えた場合に警告(例えば警告音)を発生する
ことにより、装置利用者は現在読み取り中の原稿は間違
いが多いであろうと判断し、処理を停止させたり、ある
いは認識条件を変更して起動するといった、必要な処置
を素早くとることができる。また、このような場合、処
理を継続しても無駄になることが多いが、自動的に処理
を中断することにより、そのような時間的な無駄を減ら
すことができる。
【0031】また、最終処理段階に至るまでの、ある処
理段階における確信度に基づき、正解の可能性が低い候
補をその段階で候補から外すことにより、その分だけ後
続処理段階の処理量を減らし、処理効率を上げることが
できる。
理段階における確信度に基づき、正解の可能性が低い候
補をその段階で候補から外すことにより、その分だけ後
続処理段階の処理量を減らし、処理効率を上げることが
できる。
【0032】最終的な確信度とは別に個々の処理段階毎
の確信度の情報を保存しておくことにより、その情報を
文字認識装置の保守等に活用することができ、また誤認
識文字の修正時に、関連した個々の処理段階毎の確信度
の情報に基づき、誤認識の原因や必要な処置等を利用者
に助言するためのメッセージを出力し、利用者による修
正作業や装置保守を容易にすることができる。
の確信度の情報を保存しておくことにより、その情報を
文字認識装置の保守等に活用することができ、また誤認
識文字の修正時に、関連した個々の処理段階毎の確信度
の情報に基づき、誤認識の原因や必要な処置等を利用者
に助言するためのメッセージを出力し、利用者による修
正作業や装置保守を容易にすることができる。
【0033】さらに、認識結果の修正は確信度が低い文
字を中心に進めるわけであり、また辞書学習の必要度が
高いのは、確信度が低くなった文字についてである。確
信度が所定レベルより低く辞書学習の必要度が高い文字
についてのみ、パターンまたは特徴量を保存することに
より、限られた記憶スペースを用い必要なパターンまた
は特徴量の情報を保存できる。そして、修正時に、確信
度が低く辞書学習の必要度が高い文字に限って、保存さ
れたパターンまたは特徴量を利用し効率的に辞書学習を
行なうことができる。
字を中心に進めるわけであり、また辞書学習の必要度が
高いのは、確信度が低くなった文字についてである。確
信度が所定レベルより低く辞書学習の必要度が高い文字
についてのみ、パターンまたは特徴量を保存することに
より、限られた記憶スペースを用い必要なパターンまた
は特徴量の情報を保存できる。そして、修正時に、確信
度が低く辞書学習の必要度が高い文字に限って、保存さ
れたパターンまたは特徴量を利用し効率的に辞書学習を
行なうことができる。
【0034】
【実施例】図1は本発明の第1の実施例に係る文字認識
装置の概略ブロック図である。図1において、スキャナ
ー1は原稿の画像を読み取り、2値データとして入力す
るもので、切り出し処理部2はその入力画像より文字の
画像を切り出す部分である。正規化処理部3は、切り出
された文字画像の歪みを補正するための正規化処理を行
なう部分である。パターンマッチング処理部4は、正規
化後の文字画像の特徴量を抽出しパターン辞書と比較し
て類似度または相違度を算出し、類似度が大きいまたは
相違度が小さい一つ以上の認識候補を決定する処理部で
ある。パス選択処理部5は、例えば日本語の場合、全角
で1文字なのか半角で2文字なのかなど最適な文字の組
み合わせを選択する処理部である。ルール処理部6は、
文字の行内での相対位置についての情報(例えば「・」
と「.」などの区別に関係)、文字の大きさの情報(正
規化するので、例えばCとcなどの大小文字の区別に関
係)、文字種の情報(例えばカタカナ文字列の中に漢数
字の「一」があったら、これはカタカナの長音記号
「ー」に修正する)などのルールによって、パターンマ
ッチングによる認識結果候補を修正する部分である。言
語処理部7は、ルール処理によって修正後の認識結果文
字列を形態素解析し、単語辞書と照合することにより誤
りを修正する部分である。この言語処理の結果が最終的
な認識結果で、利用者による修正の対象となる。
装置の概略ブロック図である。図1において、スキャナ
ー1は原稿の画像を読み取り、2値データとして入力す
るもので、切り出し処理部2はその入力画像より文字の
画像を切り出す部分である。正規化処理部3は、切り出
された文字画像の歪みを補正するための正規化処理を行
なう部分である。パターンマッチング処理部4は、正規
化後の文字画像の特徴量を抽出しパターン辞書と比較し
て類似度または相違度を算出し、類似度が大きいまたは
相違度が小さい一つ以上の認識候補を決定する処理部で
ある。パス選択処理部5は、例えば日本語の場合、全角
で1文字なのか半角で2文字なのかなど最適な文字の組
み合わせを選択する処理部である。ルール処理部6は、
文字の行内での相対位置についての情報(例えば「・」
と「.」などの区別に関係)、文字の大きさの情報(正
規化するので、例えばCとcなどの大小文字の区別に関
係)、文字種の情報(例えばカタカナ文字列の中に漢数
字の「一」があったら、これはカタカナの長音記号
「ー」に修正する)などのルールによって、パターンマ
ッチングによる認識結果候補を修正する部分である。言
語処理部7は、ルール処理によって修正後の認識結果文
字列を形態素解析し、単語辞書と照合することにより誤
りを修正する部分である。この言語処理の結果が最終的
な認識結果で、利用者による修正の対象となる。
【0035】確信度決定部9は、各処理部4〜7での処
理により得られる情報(評価情報)、例えば、パターン
マッチング処理部4から第一候補の評価値(例えば辞書
との距離を総輪郭数で除した値など)または第一候補と
第二候補との評価値の差、パス選択処理部5からパスを
決めるときの評価値、ルール処理部6から修正のために
適用されたルールの情報、言語処理部7から言語修正の
結果を表わす情報を集め、これらの情報(評価情報)を
証拠としてデンプスター・シェーファーの確率理論を使
って総合的に最終認識結果の確信度を決定する部分であ
る。具体的には、後述のように確信度をA,B,Cラン
クに量子化する。
理により得られる情報(評価情報)、例えば、パターン
マッチング処理部4から第一候補の評価値(例えば辞書
との距離を総輪郭数で除した値など)または第一候補と
第二候補との評価値の差、パス選択処理部5からパスを
決めるときの評価値、ルール処理部6から修正のために
適用されたルールの情報、言語処理部7から言語修正の
結果を表わす情報を集め、これらの情報(評価情報)を
証拠としてデンプスター・シェーファーの確率理論を使
って総合的に最終認識結果の確信度を決定する部分であ
る。具体的には、後述のように確信度をA,B,Cラン
クに量子化する。
【0036】出力制御部8は、最終的認識結果のディス
プレイ11による表示または印字装置12による印刷を
制御する部分であるが、確信度決定部9により与えられ
た確信度の情報を認識結果に付加してディスプレイ11
または印字装置12より出力させるために、表示または
印刷される認識結果の視覚的条件を確信度に応じて変化
させる。
プレイ11による表示または印字装置12による印刷を
制御する部分であるが、確信度決定部9により与えられ
た確信度の情報を認識結果に付加してディスプレイ11
または印字装置12より出力させるために、表示または
印刷される認識結果の視覚的条件を確信度に応じて変化
させる。
【0037】具体的には、確信度がAランクの文字は
黒、BランクとCランクの文字は背景を黒で白抜きとし
たり、確信度により文字の輝度を変化させたり、背景色
を黒として、Aランクの文字は白色、Bランクの文字は
黄色(注意を促す色)、Cランクの文字は赤色(警告を
表わす色)とするなど、確信度に応じて文字または背景
の色を変化させる。
黒、BランクとCランクの文字は背景を黒で白抜きとし
たり、確信度により文字の輝度を変化させたり、背景色
を黒として、Aランクの文字は白色、Bランクの文字は
黄色(注意を促す色)、Cランクの文字は赤色(警告を
表わす色)とするなど、確信度に応じて文字または背景
の色を変化させる。
【0038】あるいは、背景色を黒とし、Aランクの文
字は白色、Bランクの文字はシングル・アンダーライン
付きまたは淡い網掛け、Cランクの文字はダブル・アン
ダーライン付きまたは濃い網掛けにするというように、
確信度に応じて文字の装飾を変化させたり、背景色を黒
とし、Aランクの文字は明朝体、Bランクの文字はゴシ
ック体、Cランクの文字は斜体という具合に、確信度に
応じて文字の書体を変化させる。
字は白色、Bランクの文字はシングル・アンダーライン
付きまたは淡い網掛け、Cランクの文字はダブル・アン
ダーライン付きまたは濃い網掛けにするというように、
確信度に応じて文字の装飾を変化させたり、背景色を黒
とし、Aランクの文字は明朝体、Bランクの文字はゴシ
ック体、Cランクの文字は斜体という具合に、確信度に
応じて文字の書体を変化させる。
【0039】または、文字に対応する画像の背景色を白
色、Aランクの結果に対応する画像は黒色、Bランクの
結果に対応する画像は黄色、Cランクの結果に対応する
画像は赤色といった具合に、確信度に応じて認識結果の
文字に対応する画像の色を変化させる。
色、Aランクの結果に対応する画像は黒色、Bランクの
結果に対応する画像は黄色、Cランクの結果に対応する
画像は赤色といった具合に、確信度に応じて認識結果の
文字に対応する画像の色を変化させる。
【0040】あるいは、Bランクの文字の下にB、Cラ
ンクの文字の下にCを並べて表示または印刷するという
ように、認識結果に対応付けて確信度を表わす文字もし
くは記号を出力する。
ンクの文字の下にCを並べて表示または印刷するという
ように、認識結果に対応付けて確信度を表わす文字もし
くは記号を出力する。
【0041】装置制御部10は装置全体の制御を司るほ
か、確信度が一定レベル以下の認識結果文字、例えばB
ランクとCランクの文字の個数を計数し、計数値が所定
の閾値を越えたときに、処理を中断させるとともに、デ
ィスプレイ11に付属したブザーを鳴動させるなどして
利用者に警告する。
か、確信度が一定レベル以下の認識結果文字、例えばB
ランクとCランクの文字の個数を計数し、計数値が所定
の閾値を越えたときに、処理を中断させるとともに、デ
ィスプレイ11に付属したブザーを鳴動させるなどして
利用者に警告する。
【0042】次に、確信度決定部9の処理内容を具体的
に説明する。この確信度決定部9での処理の流れを図2
に示す。
に説明する。この確信度決定部9での処理の流れを図2
に示す。
【0043】前述のように、確信度決定部9はパターン
マッチング処理、パス選択処理、ルール処理、言語処理
の各処理段階から集めた情報(評価情報)を証拠とし
て、デンプスター・シェーファーの確率理論を使って総
合的に確信度を決定する。
マッチング処理、パス選択処理、ルール処理、言語処理
の各処理段階から集めた情報(評価情報)を証拠とし
て、デンプスター・シェーファーの確率理論を使って総
合的に確信度を決定する。
【0044】このデンプスター・シェーファーの確率理
論は、無知量を表わすことができ、断片的な情報(独立
な証拠)を集め合成できるという特徴があり、
論は、無知量を表わすことができ、断片的な情報(独立
な証拠)を集め合成できるという特徴があり、
【表1】 のように、確率を「信用」「無知」「不信用」の領域に
わけて表わし、「信用」を下界確率、「信用+無知」を
上界確率と呼ぶ。
わけて表わし、「信用」を下界確率、「信用+無知」を
上界確率と呼ぶ。
【0045】具体的には、まず、この文字は正しいとい
う仮説H1、この文字は間違いであるという仮説H2を
たて、集まった各証拠について擬似可能性分布(各仮説
に割り当てられた、その仮説が真である可能性の分布)
を求める。本実施例においては、図2に示すように、パ
ターンマッチング処理より集めた証拠である第一候補の
評価値に関する擬似可能性分布、同じく第一候補と第二
候補との評価値の差に関する擬似可能性分布、パス選択
処理より集めた証拠であるパス選択時の評価値の差に関
する擬似可能性分布、ルール処理から集めた証拠内容に
関する擬似可能性分布、言語処理より集めた修正内容に
関する擬似可能性分布を生成する。
う仮説H1、この文字は間違いであるという仮説H2を
たて、集まった各証拠について擬似可能性分布(各仮説
に割り当てられた、その仮説が真である可能性の分布)
を求める。本実施例においては、図2に示すように、パ
ターンマッチング処理より集めた証拠である第一候補の
評価値に関する擬似可能性分布、同じく第一候補と第二
候補との評価値の差に関する擬似可能性分布、パス選択
処理より集めた証拠であるパス選択時の評価値の差に関
する擬似可能性分布、ルール処理から集めた証拠内容に
関する擬似可能性分布、言語処理より集めた修正内容に
関する擬似可能性分布を生成する。
【0046】証拠が数値情報の場合、この擬似可能性分
布は例えばy=−x/3+100(yは擬似可能性分
布、xは数値情報の証拠)のような一次方程式による求
める。この式で、評価値が100の場合、仮説H1の可
能性67%、仮説H2の可能性33%が求められる。
布は例えばy=−x/3+100(yは擬似可能性分
布、xは数値情報の証拠)のような一次方程式による求
める。この式で、評価値が100の場合、仮説H1の可
能性67%、仮説H2の可能性33%が求められる。
【0047】証拠が数値情報でない場合は、ヒューリス
ティックに与える。例えば、あるルールを満足しなかっ
たという証拠の場合、仮説H1の可能性は20%、仮説
H2の可能性は80%というように予め決めておく。
ティックに与える。例えば、あるルールを満足しなかっ
たという証拠の場合、仮説H1の可能性は20%、仮説
H2の可能性は80%というように予め決めておく。
【0048】このようにして集めた各証拠についての擬
似可能性分布から、次に基本確率割り当てを求める。す
なわち、擬似可能性分布を「正しい」「無知」「間違
い」の各確率に振り分ける。
似可能性分布から、次に基本確率割り当てを求める。す
なわち、擬似可能性分布を「正しい」「無知」「間違
い」の各確率に振り分ける。
【0049】例えば仮説H1の可能性が67%、仮説H
2の可能性が33%の場合は、
2の可能性が33%の場合は、
【表2】 のようにする。
【0050】また例えば、仮説H1の可能性が20%、
仮説H2の可能性が80%の場合、
仮説H2の可能性が80%の場合、
【表3】 のようにする。
【0051】つぎにデンプスター(Dempster)の統合
規則により、基本確率を合成する。これは独立な証拠か
ら推論された基本確率を統合する方法であり、
規則により、基本確率を合成する。これは独立な証拠か
ら推論された基本確率を統合する方法であり、
【数1】 ただし、m1,m2は基本確率 HはH1またはH2またH1H2 H1H2はH1かH2であるという必ず真の仮説 で表わされる。
【0052】次に、下界確率と上界確率を求める。次の
陪審員のモデルを例に説明する。
陪審員のモデルを例に説明する。
【表4】 この例では、有罪の下界確率は15%、上界確率は74%(=15+59 ) 無罪の下界確率は26%、上界確率は85%(=26+59 ) となる。
【0053】最後に、下界確率と上界確率から確信度の
ランクを決定する。その方法は様々考えられるが、もっ
とも簡単な方法としては例えば、仮説H2の上界確率か
ら次のような閾値によりA,B,Cのランクを決める。 H2の上界確率が0〜19 正しい(Aランク) H2の上界確率が20〜79 怪しい(Bランク) H2の上界確率が80〜100 間違い(Cランク) なお、下界確率と上界確率の2段階で確信度のランクを
決定してもよい。
ランクを決定する。その方法は様々考えられるが、もっ
とも簡単な方法としては例えば、仮説H2の上界確率か
ら次のような閾値によりA,B,Cのランクを決める。 H2の上界確率が0〜19 正しい(Aランク) H2の上界確率が20〜79 怪しい(Bランク) H2の上界確率が80〜100 間違い(Cランク) なお、下界確率と上界確率の2段階で確信度のランクを
決定してもよい。
【0054】図3は本発明の第2の実施例に係る文字認
識装置の概略ブロック図である。図3において、スキャ
ナー101、切り出し処理部102、正規化処理部10
3、パターンマッチング処理部104、ルール処理部1
05、言語処理部106、出力制御部108、ディスプ
レイ113、印字装置114は図1に示した対応部分と
同じ部分である。
識装置の概略ブロック図である。図3において、スキャ
ナー101、切り出し処理部102、正規化処理部10
3、パターンマッチング処理部104、ルール処理部1
05、言語処理部106、出力制御部108、ディスプ
レイ113、印字装置114は図1に示した対応部分と
同じ部分である。
【0055】確信度決定部107は、デンプスター・シ
ェーファーの確率理論を用い確信度を求める部分である
が、図1に示した確信度決定部9とは若干の相違があ
る。すなわち、この確信度決定部107においては、パ
ターンマッチング処理部104から第一候補の評価値
(例えば辞書との距離を総輪郭数で除した値)または第
一候補と第二候補との評価値の差の情報、ルール処理部
105から修正のために適用されたルールの情報、言語
処理部106から言語修正の結果を表わす情報を集め、
さらに切り出し処理部102からも文字間ピッチと文字
矩形幅等の情報を集める。そして、これら各処理段階で
集めた情報(評価情報)を証拠として、その処理段階で
の候補についての確信度を決定し、これによって前処理
段階までの確信度を更新し、この操作を最終処理段階す
なわち言語処理段階まで繰り返すことによって、最終的
認識結果に対する最終的な確信度を決定し、これを前述
のようなA,B,Cの3ランクに量子化する。
ェーファーの確率理論を用い確信度を求める部分である
が、図1に示した確信度決定部9とは若干の相違があ
る。すなわち、この確信度決定部107においては、パ
ターンマッチング処理部104から第一候補の評価値
(例えば辞書との距離を総輪郭数で除した値)または第
一候補と第二候補との評価値の差の情報、ルール処理部
105から修正のために適用されたルールの情報、言語
処理部106から言語修正の結果を表わす情報を集め、
さらに切り出し処理部102からも文字間ピッチと文字
矩形幅等の情報を集める。そして、これら各処理段階で
集めた情報(評価情報)を証拠として、その処理段階で
の候補についての確信度を決定し、これによって前処理
段階までの確信度を更新し、この操作を最終処理段階す
なわち言語処理段階まで繰り返すことによって、最終的
認識結果に対する最終的な確信度を決定し、これを前述
のようなA,B,Cの3ランクに量子化する。
【0056】文字数計数部109は、確信度決定部10
7により決定された最終的な確信度が一定レベル以下の
認識結果文字、例えばBランクとCランクの文字の個数
を計数し、計数値が所定の閾値を越えたときに文字数超
過信号を出す。
7により決定された最終的な確信度が一定レベル以下の
認識結果文字、例えばBランクとCランクの文字の個数
を計数し、計数値が所定の閾値を越えたときに文字数超
過信号を出す。
【0057】候補削除判定部110は、切り出し処理段
階で得られた情報に基づき確信度決定部107により得
られた各候補の確信度を一定の閾値と比較し、それを下
回る確信度の候補を削除候補と判定し削除信号を出力す
る。ここでは、対象処理段階として切り出し処理が選ば
れたが、他の処理段階を対象に選んでもよく、あるいは
2以上の処理段階を対象に選んでもよい。
階で得られた情報に基づき確信度決定部107により得
られた各候補の確信度を一定の閾値と比較し、それを下
回る確信度の候補を削除候補と判定し削除信号を出力す
る。ここでは、対象処理段階として切り出し処理が選ば
れたが、他の処理段階を対象に選んでもよく、あるいは
2以上の処理段階を対象に選んでもよい。
【0058】装置制御部112は、装置全体の制御を司
るほか、文字計数部109から文字数超過信号が出た場
合に処理を中断させるとともに、ディスプレイ113に
付属したブザー等を鳴動させて装置利用者に警告し、ま
た候補削除判定部110から削除信号が出た場合に該当
の候補を次の処理段階の候補から外す制御を行なう。
るほか、文字計数部109から文字数超過信号が出た場
合に処理を中断させるとともに、ディスプレイ113に
付属したブザー等を鳴動させて装置利用者に警告し、ま
た候補削除判定部110から削除信号が出た場合に該当
の候補を次の処理段階の候補から外す制御を行なう。
【0059】確信度決定部107の処理内容を具体的に
説明する。また、各処理段階での確信度決定処理の流れ
を図5に示す。
説明する。また、各処理段階での確信度決定処理の流れ
を図5に示す。
【0060】前述のように、確信度決定には処理段階か
ら得られた情報(評価情報)を証拠として、デンプスタ
ー・シェーファーの確率理論を使って行なう。より具体
的には、H1:第1候補、H2:第2候補,...,H
n:第n候補、というように、予め決まっている最大候
補数分の仮説Hiをたてる。つまり、最終の認識結果文
字は1番目の候補なのか、2番目の候補なのか、といっ
た具合に考えて、それぞれの確率を求める。
ら得られた情報(評価情報)を証拠として、デンプスタ
ー・シェーファーの確率理論を使って行なう。より具体
的には、H1:第1候補、H2:第2候補,...,H
n:第n候補、というように、予め決まっている最大候
補数分の仮説Hiをたてる。つまり、最終の認識結果文
字は1番目の候補なのか、2番目の候補なのか、といっ
た具合に考えて、それぞれの確率を求める。
【0061】まず、各処理段階において、そこで集まっ
た各情報すなわち各証拠について擬似可能性分布(各仮
説に割り当てられた、その仮説が真である可能性の分
布)を求める。このときに、証拠が数値情報であればy
=−x/3+100のような一次方程式により擬似可能
性(y)を求めること、証拠が数値情報でなければ擬似
可能性分布をヒューリスティックに与えることは、前述
の通りである。
た各情報すなわち各証拠について擬似可能性分布(各仮
説に割り当てられた、その仮説が真である可能性の分
布)を求める。このときに、証拠が数値情報であればy
=−x/3+100のような一次方程式により擬似可能
性(y)を求めること、証拠が数値情報でなければ擬似
可能性分布をヒューリスティックに与えることは、前述
の通りである。
【0062】次に、仮説H1〜Hnの擬似可能性分布を
用いて、consonant sequenceと呼ばれる仮説の列H1,
H2,...,Hnを作り、基本確率割り当てへ変換す
る。すなわち、擬似可能性分布を「正しい」「無知」
「間違い」の各基本確率に振り分ける。基本確率は確信
度であるが、それより求められる下界確率と上界確率か
ら確信度を決定してもよい。
用いて、consonant sequenceと呼ばれる仮説の列H1,
H2,...,Hnを作り、基本確率割り当てへ変換す
る。すなわち、擬似可能性分布を「正しい」「無知」
「間違い」の各基本確率に振り分ける。基本確率は確信
度であるが、それより求められる下界確率と上界確率か
ら確信度を決定してもよい。
【0063】もし、証拠が複数あるならば、前述のよう
にデンプスターの統合規則を使用し合成式(数1)によ
り各証拠について求めた各仮説の基本確率を合成する。
にデンプスターの統合規則を使用し合成式(数1)によ
り各証拠について求めた各仮説の基本確率を合成する。
【0064】このようにして各処理段階で得られた証拠
に基づいた各仮説の基本確率(確信度)が得られたら、
これを直前の処理段階までに得られている各仮説の基本
確率と前記合成式(数1)によって合成する(更新す
る)。当然、各仮説の下界確率と上界確率も求まる。
に基づいた各仮説の基本確率(確信度)が得られたら、
これを直前の処理段階までに得られている各仮説の基本
確率と前記合成式(数1)によって合成する(更新す
る)。当然、各仮説の下界確率と上界確率も求まる。
【0065】最終段階すなわち言語処理では、決定した
確信度をランク付けする。このランク付けの方法は様々
考えられるが、最も簡単な方法は前述のような上界確率
と閾値との比較による方法である。
確信度をランク付けする。このランク付けの方法は様々
考えられるが、最も簡単な方法は前述のような上界確率
と閾値との比較による方法である。
【0066】以上の確信度決定処理について、文字認識
処理の流れに従ってより具体的に説明する。
処理の流れに従ってより具体的に説明する。
【0067】まず、切り出し処理で、図4に示すような
切り出し結果となったとする。図中の矩形は文字の候補
となる文字矩形を表わしている。そして、A,B,Cの
矩形に注目した場合、A矩形(全角文字)、BとCの矩
形(半角文字)が文字の候補となり、それぞれについて
文字間ピッチや矩形の幅等の情報(証拠)から前述の確
率(確信度)が A矩形 下界確率?% 上界確率?% B矩形 下界確率?% 上界確率?% C矩形 下界確率?% 上界確率?% というように求められる。
切り出し結果となったとする。図中の矩形は文字の候補
となる文字矩形を表わしている。そして、A,B,Cの
矩形に注目した場合、A矩形(全角文字)、BとCの矩
形(半角文字)が文字の候補となり、それぞれについて
文字間ピッチや矩形の幅等の情報(証拠)から前述の確
率(確信度)が A矩形 下界確率?% 上界確率?% B矩形 下界確率?% 上界確率?% C矩形 下界確率?% 上界確率?% というように求められる。
【0068】本実施例では、例えば下界確率または上界
確率が所定の閾値を下回った矩形は、次の処理段階の文
字候補から外す。
確率が所定の閾値を下回った矩形は、次の処理段階の文
字候補から外す。
【0069】なお、この段階の確信度より最も確からし
い一つの矩形だけを候補に決定することもできる。
い一つの矩形だけを候補に決定することもできる。
【0070】これらの矩形A,B,Cのそれぞれについ
て(文字候補から除外されたものは当然含まれない)、
次のパターンマッチング処理(認識処理)で認識結果候
補群が得られるが、各矩形に対する第一候補の評価値、
第一候補と第二候補との評価値の差などの情報に基づ
き、 A矩形 第1候補 下界確率?% 上界確率?% 第2候補 下界確率?% 上界確率?% 第3候補 下界確率?% 上界確率?% B矩形 第1候補 下界確率?% 上界確率?% 第2候補 下界確率?% 上界確率?% 第3候補 下界確率?% 上界確率?% C矩形 第1候補 下界確率?% 上界確率?% 第2候補 下界確率?% 上界確率?% 第3候補 下界確率?% 上界確率?% を求める。そして、前段の切り出し処理で求められた確
信度と合成することにより、確信度の更新を行なうこと
は前述の通りである。
て(文字候補から除外されたものは当然含まれない)、
次のパターンマッチング処理(認識処理)で認識結果候
補群が得られるが、各矩形に対する第一候補の評価値、
第一候補と第二候補との評価値の差などの情報に基づ
き、 A矩形 第1候補 下界確率?% 上界確率?% 第2候補 下界確率?% 上界確率?% 第3候補 下界確率?% 上界確率?% B矩形 第1候補 下界確率?% 上界確率?% 第2候補 下界確率?% 上界確率?% 第3候補 下界確率?% 上界確率?% C矩形 第1候補 下界確率?% 上界確率?% 第2候補 下界確率?% 上界確率?% 第3候補 下界確率?% 上界確率?% を求める。そして、前段の切り出し処理で求められた確
信度と合成することにより、確信度の更新を行なうこと
は前述の通りである。
【0071】なお、この段階で各矩形の候補中の確信度
が予め定めた閾値以下の候補を、切り出し処理の場合と
同様に候補から除外することにより、処理時間の節減を
図ってもよい。さらに、この段階でA矩形であるか、
B,C矩形であるかを合成された確信度から判断するこ
ともできる。ここでは、A矩形が文字の候補として選ば
れたものとして説明を進める。
が予め定めた閾値以下の候補を、切り出し処理の場合と
同様に候補から除外することにより、処理時間の節減を
図ってもよい。さらに、この段階でA矩形であるか、
B,C矩形であるかを合成された確信度から判断するこ
ともできる。ここでは、A矩形が文字の候補として選ば
れたものとして説明を進める。
【0072】次のルール処理では、文字の位置、文字の
サイズ、文字種等の情報から各認識結果候補の確信度を
求め、パターンマッチング処理段階での確信度と合成
し、更新された確信度 第1候補 下界確率?% 上界確率?% 第2候補 下界確率?% 上界確率?% 第3候補 下界確率?% 上界確率?% を求める。例えば文字の位置情報に関しては、対象画像
が行の中心辺りに位置しているならば「・」の確信度は
上昇するが、「.」「’」の確信度は下がることにな
る。
サイズ、文字種等の情報から各認識結果候補の確信度を
求め、パターンマッチング処理段階での確信度と合成
し、更新された確信度 第1候補 下界確率?% 上界確率?% 第2候補 下界確率?% 上界確率?% 第3候補 下界確率?% 上界確率?% を求める。例えば文字の位置情報に関しては、対象画像
が行の中心辺りに位置しているならば「・」の確信度は
上昇するが、「.」「’」の確信度は下がることにな
る。
【0073】次の言語処理では、どの候補が最も相応し
いかを単語辞書等を使って決定し、その結果に対して確
信度を求め、前処理段階の確信度と合成する。例えば単
語辞書との照合によれば、注目文字の第1候補と次の文
字の第2候補との組み合わせにより意味のある単語を形
成するときには、注目文字の第1候補と次の文字の第2
候補の確信度が上がる。したがって、言語処理を行なう
ためには、ある程度の長さの文字列が必要である。
いかを単語辞書等を使って決定し、その結果に対して確
信度を求め、前処理段階の確信度と合成する。例えば単
語辞書との照合によれば、注目文字の第1候補と次の文
字の第2候補との組み合わせにより意味のある単語を形
成するときには、注目文字の第1候補と次の文字の第2
候補の確信度が上がる。したがって、言語処理を行なう
ためには、ある程度の長さの文字列が必要である。
【0074】このようにして、例えば、 第1候補 下界確率80% 上界確率15% 第2候補 下界確率33% 上界確率10% 第3候補 下界確率12% 上界確率33% のような最終的な確信度が得られるので、例えば下界確
率が最大の第1候補を最終的な認識結果として出力し、
その確信度には前述のような閾値処理によつてランク付
けをする。なお、候補の並びは、各処理段階で確信度の
高い順にソートしてもよいし、最終的な確信度の高い順
にソートしてもよい。
率が最大の第1候補を最終的な認識結果として出力し、
その確信度には前述のような閾値処理によつてランク付
けをする。なお、候補の並びは、各処理段階で確信度の
高い順にソートしてもよいし、最終的な確信度の高い順
にソートしてもよい。
【0075】また、複数の証拠がある場合の下界確率と
上界確率の求め方は、前記表4を用い陪審員のモデルを
例に説明したように、対応した基本確率を加算するだけ
でよい。なお、ここでは文字認識処理の場合であるか
ら、上記陪審員モデルでの説明中の「有罪」「分からな
い」「無罪」を「正しい」、「正しいか間違いか分から
ない」「間違い」と言い替えればよい。
上界確率の求め方は、前記表4を用い陪審員のモデルを
例に説明したように、対応した基本確率を加算するだけ
でよい。なお、ここでは文字認識処理の場合であるか
ら、上記陪審員モデルでの説明中の「有罪」「分からな
い」「無罪」を「正しい」、「正しいか間違いか分から
ない」「間違い」と言い替えればよい。
【0076】次に前記第2の実施例の変形例について説
明する。本変形例においては、前記第2実施例と同様に
確信度決定部107で切り出し処理、パターンマッチン
グ処理、ルール処理、言語処理(さらにはパス選択処
理)の各処理段階毎に確信度を求め、合成することによ
って最終的な確信度を決定するが、最終的な確信度とは
別に、各処理段階毎の確信度、すなわち各処理段階で得
られた情報を基に決定された確信度(数値あるいはラン
ク)をメモリに保存する。そして、ユーザーがディスプ
レイ113の画面上で認識結果文字に対する修正を指示
した場合、装置制御部112は、その文字に関する各処
理段階毎の確信度の情報を上記メモリより読み出し、そ
の情報を基にユーザーに対するメッセージ(助言)を作
成して出力制御部108へ渡しディスプレイ113の画
面に表示させる。
明する。本変形例においては、前記第2実施例と同様に
確信度決定部107で切り出し処理、パターンマッチン
グ処理、ルール処理、言語処理(さらにはパス選択処
理)の各処理段階毎に確信度を求め、合成することによ
って最終的な確信度を決定するが、最終的な確信度とは
別に、各処理段階毎の確信度、すなわち各処理段階で得
られた情報を基に決定された確信度(数値あるいはラン
ク)をメモリに保存する。そして、ユーザーがディスプ
レイ113の画面上で認識結果文字に対する修正を指示
した場合、装置制御部112は、その文字に関する各処
理段階毎の確信度の情報を上記メモリより読み出し、そ
の情報を基にユーザーに対するメッセージ(助言)を作
成して出力制御部108へ渡しディスプレイ113の画
面に表示させる。
【0077】例えば、確信度情報より、切り出し処理の
確からしさが他の処理段階に比べて怪しいと判断される
場合は「文字を正確に切り出すことができなかった可能
性があります。」というようなメッセージを、パターン
マッチング処理(認識処理)の確からしさが他の処理段
階に比べて怪しいと判断される場合は「認識した文字画
像をチェックしてください。」というようなメッセージ
を、後処理(ルール処理または言語処理)の確からしさ
が他の処理段階に比べて怪しいと判断される場合は「文
字列単位でチェックしてください。」あるいは「知識
(ルール)、単語辞書をチェックしてください。」とい
うようなメッセージを表示させる。
確からしさが他の処理段階に比べて怪しいと判断される
場合は「文字を正確に切り出すことができなかった可能
性があります。」というようなメッセージを、パターン
マッチング処理(認識処理)の確からしさが他の処理段
階に比べて怪しいと判断される場合は「認識した文字画
像をチェックしてください。」というようなメッセージ
を、後処理(ルール処理または言語処理)の確からしさ
が他の処理段階に比べて怪しいと判断される場合は「文
字列単位でチェックしてください。」あるいは「知識
(ルール)、単語辞書をチェックしてください。」とい
うようなメッセージを表示させる。
【0078】このようなメッセージの表示により、ユー
ザーは誤認識文字の修正のみならず、その原因の判断が
容易になり必要な処置をとりやすくなる。
ザーは誤認識文字の修正のみならず、その原因の判断が
容易になり必要な処置をとりやすくなる。
【0079】また、前記第2(または第2)の実施例に
おいて、ある処理段階までの確信度に応じて、その前ま
たは後、あるいは前後の処理段階の処理方式あるいはパ
ラメータ等を複数ある中から最適なものを選択すること
も、認識率の向上、最終的な修正作業の効率向上に効果
がある。
おいて、ある処理段階までの確信度に応じて、その前ま
たは後、あるいは前後の処理段階の処理方式あるいはパ
ラメータ等を複数ある中から最適なものを選択すること
も、認識率の向上、最終的な修正作業の効率向上に効果
がある。
【0080】このような変形例を次に示す。前記第2の
実施例において、装置制御部112は、パターンマッチ
ング処理までの確信度が低い場合に、判断文字切り出し
処理での切り出し位置を変えて再度認識をしたり、ある
いはパターンマッチング処理内の前処理である特徴抽出
の方法を変更して再度認識をするように各部を制御す
る。前者は文字切り出し位置が不適切であるために認識
結果の確信度が低いと考えられるからであり、後者は認
識画像が前回の特徴抽出方法には適切でなかったと考え
られるからである。このように確信度の情報を前の処理
にフィードバックした場合、装置制御部112は、処理
方法またはパラメータを変えて試みた複数の認識結果よ
り確信度の高い結果を有効なものとして選択する。
実施例において、装置制御部112は、パターンマッチ
ング処理までの確信度が低い場合に、判断文字切り出し
処理での切り出し位置を変えて再度認識をしたり、ある
いはパターンマッチング処理内の前処理である特徴抽出
の方法を変更して再度認識をするように各部を制御す
る。前者は文字切り出し位置が不適切であるために認識
結果の確信度が低いと考えられるからであり、後者は認
識画像が前回の特徴抽出方法には適切でなかったと考え
られるからである。このように確信度の情報を前の処理
にフィードバックした場合、装置制御部112は、処理
方法またはパラメータを変えて試みた複数の認識結果よ
り確信度の高い結果を有効なものとして選択する。
【0081】逆に、パターンマッチング処理までの確信
度が高い場合、その後の言語処理内の単語照合の際に結
果を変更させないように装置制御部112が制御する。
つまり、単語照合は一般的に、認識結果候補の組み合わ
せを予め用意されている単語辞書と照合するわけである
が、その際に確信度の高い文字は固定し、確信度の低い
文字の候補のみを入れ替え単語辞書と照合する。こうす
ることにより、単語の組み合わせ数が減り、処理時間の
短縮、認識率の向上につながる。このように、後の処理
に確信度の情報を活用する場合は、後の処理でのパラメ
ータ、条件、処理方法などを選択することが可能にな
る。
度が高い場合、その後の言語処理内の単語照合の際に結
果を変更させないように装置制御部112が制御する。
つまり、単語照合は一般的に、認識結果候補の組み合わ
せを予め用意されている単語辞書と照合するわけである
が、その際に確信度の高い文字は固定し、確信度の低い
文字の候補のみを入れ替え単語辞書と照合する。こうす
ることにより、単語の組み合わせ数が減り、処理時間の
短縮、認識率の向上につながる。このように、後の処理
に確信度の情報を活用する場合は、後の処理でのパラメ
ータ、条件、処理方法などを選択することが可能にな
る。
【0082】図6は本発明の第3の実施例を示す概略ブ
ロック図である。200は図1または図2に示した文字
認識装置本体と同様の構成にスキャナーを加えた部分で
あり、便宜上ここでは装置本体と呼ぶ。201は認識結
果等を表示するためのディスプレイである。
ロック図である。200は図1または図2に示した文字
認識装置本体と同様の構成にスキャナーを加えた部分で
あり、便宜上ここでは装置本体と呼ぶ。201は認識結
果等を表示するためのディスプレイである。
【0083】202は装置本体200内のパターンマッ
チング処理部で抽出された文字パターンの特徴量または
装置本体200内の正規化処理部により正規化後の文字
パターンを保存するための保存メモリである。ただし、
ここでは保存メモリ202に文字パターンの特徴量が保
存されるものとして説明する。204は装置本体200
内の確信度決定部より確信度ランクの情報を受けて、B
ランクとCランクの場合に対応した文字パターンの特徴
量を保存メモリ202に保存させる制御を行う保存制御
部である。この保存制御部204による特徴量(または
パターン)の保存の処理の流れを図7に示す。
チング処理部で抽出された文字パターンの特徴量または
装置本体200内の正規化処理部により正規化後の文字
パターンを保存するための保存メモリである。ただし、
ここでは保存メモリ202に文字パターンの特徴量が保
存されるものとして説明する。204は装置本体200
内の確信度決定部より確信度ランクの情報を受けて、B
ランクとCランクの場合に対応した文字パターンの特徴
量を保存メモリ202に保存させる制御を行う保存制御
部である。この保存制御部204による特徴量(または
パターン)の保存の処理の流れを図7に示す。
【0084】206は図1または図3には示さなかった
が前記第1実施例または第2実施例においても当然に備
わっていた認識結果メモリであり、ここには認識結果デ
ータと確信度情報が記憶される。210は使用者が情報
を入力するためのキーボードであり、認識結果の修正時
の正解文字はここから入力される。208はキーボード
210からの入力に従って認識結果206内の認識結果
データを修正する修正処理部である。
が前記第1実施例または第2実施例においても当然に備
わっていた認識結果メモリであり、ここには認識結果デ
ータと確信度情報が記憶される。210は使用者が情報
を入力するためのキーボードであり、認識結果の修正時
の正解文字はここから入力される。208はキーボード
210からの入力に従って認識結果206内の認識結果
データを修正する修正処理部である。
【0085】212は装置本体200内のパターンマッ
チング処理部での認識処理に用いられる辞書を格納した
辞書メモリであり、これも当然に前記第1実施例または
第2実施例においても存在したものである。214は、
この辞書の学習を行うための学習処理部である。この学
習処理部214は、認識結果の修正が行なわれた時に、
修正処理部208より修正文字の確信度ランクの情報と
正解文字コードを渡されると、確信度ランクがBランク
またはCランクの場合に、修正文字の特徴量を保存メモ
リ202より読み出し、これを用いて辞書の学習処理を
実行する。
チング処理部での認識処理に用いられる辞書を格納した
辞書メモリであり、これも当然に前記第1実施例または
第2実施例においても存在したものである。214は、
この辞書の学習を行うための学習処理部である。この学
習処理部214は、認識結果の修正が行なわれた時に、
修正処理部208より修正文字の確信度ランクの情報と
正解文字コードを渡されると、確信度ランクがBランク
またはCランクの場合に、修正文字の特徴量を保存メモ
リ202より読み出し、これを用いて辞書の学習処理を
実行する。
【0086】なお、保存メモリ202に文字パターンを
保存する場合には、学習処理部214は辞書学習時に、
保存メモリ202より修正文字のパターンを読み込み、
その特徴量の抽出を学習処理部内部で行ない、あるい
は、装置本体200内のパターンマッチング処理部に行
なわせ、得られた特徴量を辞書学習に用いる。
保存する場合には、学習処理部214は辞書学習時に、
保存メモリ202より修正文字のパターンを読み込み、
その特徴量の抽出を学習処理部内部で行ない、あるい
は、装置本体200内のパターンマッチング処理部に行
なわせ、得られた特徴量を辞書学習に用いる。
【0087】
【発明の効果】以上詳細に説明した如く、本発明によれ
ば、認識対象の文字パターンについて、複数段階の認識
処理を施こして最終的な認識結果を得る文字認識処理に
おいて、認識結果の確信度をより的確に決定して、その
情報を認識結果に付加して利用者に知らせることができ
るため、利用者は認識結果の確信度を的確容易に認識
し、必要な修正作業を効率よく行なうことができるよう
になり、認識結果の確信度が低く、処理継続が無駄な場
合などに利用者は処理を停止させたり、あるいは認識条
件を変更して起動するといった、必要な処置を素早くと
ることができるようになり、また、このような場合に無
駄な処理の継続による時間の無駄を減らすことができ、
さらに個々の処理毎の確信度の情報に基づき誤認識の原
因や必要な処置等のメッセージを出力し、利用者の修正
作業や装置保守作業等を容易にし、またさらに、ある処
理までの確信度に応じて前または後の処理あるいは前後
の処理の方法やパラメータ等を自動的に切り替えること
により、認識率を向上し、あるいは修正作業を効率化す
ることができ、また、認識結果の修正時に効率よく辞書
学習を行うことができ、辞書学習に必要な文字パターン
または特徴量を保存するための記憶スペースを減らすこ
とができる等の効果が得られる。
ば、認識対象の文字パターンについて、複数段階の認識
処理を施こして最終的な認識結果を得る文字認識処理に
おいて、認識結果の確信度をより的確に決定して、その
情報を認識結果に付加して利用者に知らせることができ
るため、利用者は認識結果の確信度を的確容易に認識
し、必要な修正作業を効率よく行なうことができるよう
になり、認識結果の確信度が低く、処理継続が無駄な場
合などに利用者は処理を停止させたり、あるいは認識条
件を変更して起動するといった、必要な処置を素早くと
ることができるようになり、また、このような場合に無
駄な処理の継続による時間の無駄を減らすことができ、
さらに個々の処理毎の確信度の情報に基づき誤認識の原
因や必要な処置等のメッセージを出力し、利用者の修正
作業や装置保守作業等を容易にし、またさらに、ある処
理までの確信度に応じて前または後の処理あるいは前後
の処理の方法やパラメータ等を自動的に切り替えること
により、認識率を向上し、あるいは修正作業を効率化す
ることができ、また、認識結果の修正時に効率よく辞書
学習を行うことができ、辞書学習に必要な文字パターン
または特徴量を保存するための記憶スペースを減らすこ
とができる等の効果が得られる。
【図1】第1の実施例に係る文字認識装置の概略ブロッ
ク図である。
ク図である。
【図2】第1の実施例における確信度決定処理の流れ図
である。
である。
【図3】第2の実施例に係る文字認識装置の概略ブロッ
ク図である。
ク図である。
【図4】文字切り出し処理に関する説明図である。
【図5】第2の実施例における各処理段階での確信度決
定処理の流れ図である。
定処理の流れ図である。
【図6】第3の実施例に係る文字認識装置の概略ブロッ
ク図である。
ク図である。
【図7】第3の実施例における特徴量またはパターンの
保存処理の流れ図である。
保存処理の流れ図である。
【図8】第3の実施例における辞書学習処理の流れ図で
ある。
ある。
1 スキャナー 2 切り出し処理部 3 正規化処理部 4 パターンマッチング処理部 5 パス選択処理部 6 ルール処理部 7 言語処理部 8 出力制御部 9 確信度決定部 10 装置制御部 11 ディスプレイ 12 印字装置 101 スキャナー 102 切り出し処理部 103 正規化処理部 104 パターンマッチング処理部 105 ルール処理部 106 言語処理部 107 確信度決定部 108 出力制御部 109 文字数計数部 110 候補削除判定部 112 装置制御部 113 ディスプレイ 114 印字装置 200 装置本体 202 保存メモリ 204 保存制御部 206 認識結果メモリ 208 修正処理部 210 キーボード 212 辞書メモリ 214 学習処理部
Claims (10)
- 【請求項1】 入力された文字や記号の未知パターン
(以下、文字パターンと略称する)を認識するために複
数段階の処理を施こして最終的な認識結果を得る文字認
識方法において、 前記各段階の処理での認識結果の評価情報を取得し、該
評価情報に基づいて、前記最終的な認識結果の確信度を
決定することを特徴とする文字認識方法。 - 【請求項2】 個々の処理毎に確信度を求め、当該確信
度により前の処理までに求めた確信度を更新する操作を
繰り返して、最終的な認識結果に対する最終的な確信度
を決定することを特徴とする請求項1記載の文字認識方
法。 - 【請求項3】 ある処理までの確信度を、その前または
後の処理に反映させることを特徴とする請求項1または
2記載の文字認識方法。 - 【請求項4】 認識対象の文字パターンを入力する手段
と、 入力された文字パターンを認識するために複数段階の処
理を施こして最終的な認識結果を求める処理手段と、 前記各段階の処理での認識結果の評価情報を取得し、該
評価情報に基づいて、前記最終的な認識結果の確信度を
決定する手段と、 前記決定した確信度の情報を前記認識結果に付加して出
力する手段と、 を有することを特徴とする文字認識装置。 - 【請求項5】 確信度を決定する手段は、個々の処理毎
に確信度を求め、当該確信度により前の処理までに求め
た確信度を更新する操作を繰り返して、最終的な認識結
果に対する最終的な確信度を決定することを特徴とする
請求項4記載の文字認識装置。 - 【請求項6】 出力される認識結果の視覚的な条件を確
信度に応じて変化させることを特徴とする請求項4また
は5記載の文字認識装置。 - 【請求項7】 確信度が一定レベル以下の認識結果文字
数を計数し、計数値が所定の閾値を越えたことを検出し
て警告を発し、または処理を中断する手段を有すること
を特徴とする請求項4または5記載の文字認識装置。 - 【請求項8】 ある処理において確信度が一定レベル以
下となった候補を後の処理の候補から外すための手段を
有することを特徴とする請求項5記載の文字認識装置。 - 【請求項9】 最終的な確信度とは別に個々の処理毎の
確信度の情報を保存する手段と、認識結果文字に関して
前記保存された個々の処理毎の確信度の情報に基づきメ
ッセージを出力する手段を有することを特徴とする請求
項5記載の文字認識装置。 - 【請求項10】 認識対象文字のパターンまたはその特
徴量を保存するための記憶手段と、認識結果が修正され
た場合に、修正された認識結果に対する確信度が所定レ
ベルのときに限り、前記記憶手段に保存されている対応
したパターンまたは特徴量を用いてパターンマッチング
処理のための辞書の学習を実行する手段を有することを
特徴とする請求項4または5記載の文字認識装置。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2414876A JP2991779B2 (ja) | 1990-06-11 | 1990-12-27 | 文字認識方法及び装置 |
DE4119091A DE4119091C2 (de) | 1990-06-11 | 1991-06-10 | Verfahren zum Erkennen von Zeichen, insbesondere Schriftzeichen und Einrichtung zur Durchführung des Verfahrens |
US08/931,163 US5966464A (en) | 1990-06-11 | 1997-09-16 | Character recognition method and apparatus, including generation of a degree of belief |
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP15234590 | 1990-06-11 | ||
JP15631890 | 1990-06-14 | ||
JP2-156318 | 1990-06-14 | ||
JP2-152345 | 1990-06-14 | ||
JP2414876A JP2991779B2 (ja) | 1990-06-11 | 1990-12-27 | 文字認識方法及び装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH04211883A JPH04211883A (ja) | 1992-08-03 |
JP2991779B2 true JP2991779B2 (ja) | 1999-12-20 |
Family
ID=27320263
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2414876A Expired - Fee Related JP2991779B2 (ja) | 1990-06-11 | 1990-12-27 | 文字認識方法及び装置 |
Country Status (3)
Country | Link |
---|---|
US (1) | US5966464A (ja) |
JP (1) | JP2991779B2 (ja) |
DE (1) | DE4119091C2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8059896B2 (en) | 2006-05-11 | 2011-11-15 | Fuji Xerox Co., Ltd. | Character recognition processing system and computer readable medium storing program for character recognition processing |
Families Citing this family (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE4304082A1 (de) * | 1993-02-11 | 1994-08-18 | Bernd Dipl Phys Nitzschmann | Verfahren zum verbesserten Erkennen von gedruckten Schriftzeichen |
DE4407998C2 (de) * | 1994-03-10 | 1996-03-14 | Ibm | Verfahren und Vorrichtung zur Erkennung eines Musters auf einem Beleg |
US7099507B2 (en) * | 1998-11-05 | 2006-08-29 | Ricoh Company, Ltd | Method and system for extracting title from document image |
US6904408B1 (en) * | 2000-10-19 | 2005-06-07 | Mccarthy John | Bionet method, system and personalized web content manager responsive to browser viewers' psychological preferences, behavioral responses and physiological stress indicators |
US7095875B2 (en) * | 2001-05-15 | 2006-08-22 | Lockheed Martin Corporation | Method and system for address result arbitration |
US6721452B2 (en) | 2001-09-12 | 2004-04-13 | Auburn University | System and method of handwritten character recognition |
US6990255B2 (en) * | 2001-09-19 | 2006-01-24 | Romanik Philip B | Image defect display system |
US6986106B2 (en) | 2002-05-13 | 2006-01-10 | Microsoft Corporation | Correction widget |
US7137076B2 (en) * | 2002-07-30 | 2006-11-14 | Microsoft Corporation | Correcting recognition results associated with user input |
US7848573B2 (en) * | 2003-12-03 | 2010-12-07 | Microsoft Corporation | Scaled text replacement of ink |
US7506271B2 (en) * | 2003-12-15 | 2009-03-17 | Microsoft Corporation | Multi-modal handwriting recognition correction |
FR2898709B1 (fr) * | 2006-03-17 | 2008-09-26 | Solystic Sas | Methode pour fusionner des ocr postaux exploitant des fonctions de croyance |
US20080210474A1 (en) * | 2006-10-31 | 2008-09-04 | Volkswagen Of America, Inc. | Motor vehicle having a touch screen |
JP5390440B2 (ja) * | 2010-03-17 | 2014-01-15 | 株式会社東芝 | 集中情報処理装置及び集中情報処理システム |
JP5216828B2 (ja) * | 2010-09-29 | 2013-06-19 | 株式会社東芝 | 画像処理装置、方法及びプログラム |
TWI478074B (zh) * | 2010-12-01 | 2015-03-21 | Inst Information Industry | 文字辨識方法、裝置以及儲存其之電腦可讀取紀錄媒體 |
JP7263721B2 (ja) * | 2018-09-25 | 2023-04-25 | 富士フイルムビジネスイノベーション株式会社 | 情報処理装置及びプログラム |
JP7559397B2 (ja) * | 2020-07-22 | 2024-10-02 | 株式会社リコー | 情報処理装置およびプログラム |
Family Cites Families (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US31692A (en) * | 1861-03-12 | Improvement in mowing-machines | ||
USRE31692E (en) | 1972-05-02 | 1984-10-02 | Optical Recognition Systems, Inc. | Combined magnetic optical character reader |
US3842402A (en) * | 1973-10-25 | 1974-10-15 | Ibm | Bayesian online numeric discriminator |
JPS6024994B2 (ja) * | 1980-04-21 | 1985-06-15 | シャープ株式会社 | パタ−ン類似度計算方式 |
JPS57778A (en) * | 1980-06-03 | 1982-01-05 | Mitsubishi Electric Corp | Optical character reader |
JPS616430A (ja) * | 1984-06-20 | 1986-01-13 | Hitachi Ltd | 軸継手 |
US4760604A (en) * | 1985-02-15 | 1988-07-26 | Nestor, Inc. | Parallel, multi-unit, adaptive, nonlinear pattern class separator and identifier |
US4773099A (en) * | 1985-10-10 | 1988-09-20 | The Palantir Corporation | Pattern classification means for use in a pattern recognition system |
JPS62280983A (ja) * | 1986-05-29 | 1987-12-05 | Fujitsu Ltd | 図形認識結果のチエツク方式 |
US4747058A (en) * | 1986-12-15 | 1988-05-24 | Ncr Corporation | Code line display system |
JP2553608B2 (ja) * | 1988-01-04 | 1996-11-13 | 住友電気工業 株式会社 | 光学文字読取装置 |
US5287275A (en) * | 1988-08-20 | 1994-02-15 | Fujitsu Limited | Image recognition apparatus and method for recognizing a pattern within an image |
US5052043A (en) * | 1990-05-07 | 1991-09-24 | Eastman Kodak Company | Neural network with back propagation controlled through an output confidence measure |
US5257323A (en) * | 1991-05-29 | 1993-10-26 | Canon Kabushiki Kaisha | Selection agent for a symbol determination system with multiple character recognition processors |
-
1990
- 1990-12-27 JP JP2414876A patent/JP2991779B2/ja not_active Expired - Fee Related
-
1991
- 1991-06-10 DE DE4119091A patent/DE4119091C2/de not_active Expired - Lifetime
-
1997
- 1997-09-16 US US08/931,163 patent/US5966464A/en not_active Expired - Lifetime
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8059896B2 (en) | 2006-05-11 | 2011-11-15 | Fuji Xerox Co., Ltd. | Character recognition processing system and computer readable medium storing program for character recognition processing |
Also Published As
Publication number | Publication date |
---|---|
DE4119091A1 (de) | 1991-12-12 |
JPH04211883A (ja) | 1992-08-03 |
US5966464A (en) | 1999-10-12 |
DE4119091C2 (de) | 1995-04-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2991779B2 (ja) | 文字認識方法及び装置 | |
JP2001167131A (ja) | 文書シグネチュアを使用する文書の自動分類方法 | |
US5197107A (en) | Character recognition apparatus | |
JP2001175811A (ja) | 単語大分類装置及びその単語大分類方法並びにその制御プログラムを記録した記録媒体 | |
JPH0520500A (ja) | 文書認識装置 | |
US5625710A (en) | Character recognition apparatus using modification of a characteristic quantity | |
JP2986074B2 (ja) | 近傍点検出方法及びパターン認識装置 | |
JPH05182014A (ja) | 文字認識方法 | |
JP3099797B2 (ja) | 文字認識装置 | |
CN112528980B (zh) | Ocr识别结果纠正方法及其终端、系统 | |
JP2003030654A (ja) | パターン識別装置、パターン識別方法及びパターン識別用プログラム | |
JP4148966B2 (ja) | パターン照合装置及びそれを実現するためのプログラム、記録媒体 | |
JPH11184976A (ja) | 辞書学習方式および文字認識装置 | |
JP4633271B2 (ja) | 辞書学習方法及び辞書学習プログラム | |
JP2995818B2 (ja) | 文字切り出し方法 | |
JP2848560B2 (ja) | 画像認識方法及び装置 | |
JPH06318267A (ja) | 文字認識出力方法 | |
JPH06208649A (ja) | 文字認識装置 | |
CN115204151A (zh) | 中文文本纠错方法、系统及可读存储介质 | |
JP4194790B2 (ja) | 文字認識装置及び文字認識方法 | |
JPH06337966A (ja) | 文字認識装置 | |
JPH04315278A (ja) | 文字認識装置 | |
JPH08147314A (ja) | 認識型文書ファイリング装置及びその制御方法 | |
JPH08202830A (ja) | 文字認識システム | |
JPH04293185A (ja) | ファイリング装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20071015 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20081015 Year of fee payment: 9 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20081015 Year of fee payment: 9 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20091015 Year of fee payment: 10 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20101015 Year of fee payment: 11 |
|
LAPS | Cancellation because of no payment of annual fees |