JPH11143983A - 文字認識装置、文字認識方法及び文字認識プログラムを記録したコンピュータ読み取り可能な記録媒体 - Google Patents

文字認識装置、文字認識方法及び文字認識プログラムを記録したコンピュータ読み取り可能な記録媒体

Info

Publication number
JPH11143983A
JPH11143983A JP9311920A JP31192097A JPH11143983A JP H11143983 A JPH11143983 A JP H11143983A JP 9311920 A JP9311920 A JP 9311920A JP 31192097 A JP31192097 A JP 31192097A JP H11143983 A JPH11143983 A JP H11143983A
Authority
JP
Japan
Prior art keywords
character
character string
correction
data
document image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP9311920A
Other languages
English (en)
Inventor
Akihiro Uda
田 明 弘 宇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP9311920A priority Critical patent/JPH11143983A/ja
Publication of JPH11143983A publication Critical patent/JPH11143983A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】 【課題】 文字認識装置において、誤読が生じた場合
に、ユーザの修正を容易にし、その修正の内容を未修整
部分に迅速にフィードバックすることを目的とする。 【解決手段】 テキスト・データ上でユーザによる修正
がなされた時点で、テキスト・データの未修正部分に対
して、同様の修正をすべきと未修正文字列をユーザに指
示したり、自動的に同一方法で修正したり、修正後の文
字列から推定される比較的精度の高い幾何学的情報を用
いて自動的に再認識を行なう。また、ユーザが1つの文
字を訂正した時に、その周囲の文字も同様に文字幅、高
さ、間隔といった幾何学的特徴が誤っている可能性があ
るので、修正された文字の周囲の文字の幾何学的特徴も
自動的に推定して、再度認識しなおすことによって、ユ
ーザの修正の手間を著しく軽減することもできる。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、文字認識装置、文
字認識方法及び文字認識プログラムを記録したコンピュ
ータ読み取り可能な記録媒体に関する。より具体的に
は、本発明は、光学式スキャナなどにより読みとったイ
メージ・データから文字を認識してテキスト・データを
作成する際に、誤って認識された文字を容易に修正する
ことができる文字認識装置、文字認識方法及び文字認識
プログラムを記録したコンピュータ読み取り可能な記録
媒体に関する。
【0002】
【従来の技術】文書などが記載されている原稿をスキャ
ナなどにより読みとって、その文書のテキスト・データ
を作成する文字認識装置は、種々の文書データの電子フ
ァイル化に欠かすことができない装置であり、事務のO
A化の促進に極めて重要な役割を有する。従来の文字認
識装置は、まず、スキャナなどにより原稿を光学的に読
みとって、電子化された「イメージ・データ」を作成す
る。作成された「イメージ・データ」は、文字認識装置
の磁気ディスク装置や主メモリなどに一旦格納されるこ
とが多い。次に、この「イメージ・データ」から文字を
認識して「テキスト・データ」を作成する。文字の認識
に際しては、「イメージ・データ」上でのそれぞれの文
字の幾何学的特徴(文字の形状、幅、高さ或いは間隔な
ど)を元にして、文字コード(それぞれの文字に割り当
てられているコード)や文字属性(全角/半角、文字種
類)を推定することにより、「イメージ・データ」の上
のそれぞれの文字を認識する。このようにして、元の文
書の「テキスト・データ」を作成することができる。
【0003】
【発明が解決しようとする課題】しかし、文字認識装置
において、「イメージ・データ」から文字を認識する際
に誤読、すなわち文字を誤って認識することは、殆どの
場合に避けることができない。たとえば、丸括弧を表す
記号である「(」が、アルファベットの「C」と誤読さ
れることがある。文字認識装置に読みとらせる原稿のフ
ォントは、極めて多種に及び、また、その表示品質も常
に鮮明なものとは限らず、かすれたものや、濃度が高す
ぎて文字がつぶれたもの、形状が歪んだものなども対象
とされるからである。このような事情から、極めて精度
の高い文字認識装置においても、誤読を解消することは
困難である。
【0004】従来は、誤読が生じた場合、ユーザが「テ
キスト・データ」上で、それぞれの誤読箇所毎に修正を
施す必要があった。しかし、文字の幅、高さ或いは間隔
などの幾何学的特徴や文字属性の推定を誤ったことによ
り誤読が生ずるような場合には、同一の文書中で、同様
の誤読が頻発する確率が高い。例えば、丸括弧「(」を
アルファベット「C」と認識する誤読が生ずる場合に
は、このような丸誤読は、文書中の特定の1箇所だけで
なく、その文書中の全ての「(」について生ずる場合が
多い。従来は、このような場合においても、それぞれの
誤読箇所毎にユーザが同じ修正を繰り返す必要があり、
その手間は極めて煩雑であった。
【0005】また、このような誤読を「一括置換」によ
り修正しようとすると、本来アルファベットの「C」で
あった文字まで、丸括弧「(」に置換されてしまうとい
う問題を生ずる。
【0006】一方、文字認識過程において「文字切り出
し」が適正に行われない場合、例えば、全角文字列が一
連の半角文字列と認識され、分解されて誤読されるよう
な場合がある。このような場合には、ユーザが、その誤
読部分をまとめて削除した後、入力し直すか、あるいは
誤読文字を丁寧に1文字ずつ修正する必要があり、その
修正の手間も極めて煩雑であった。
【0007】本発明は、かかる問題点に鑑みてなされた
ものである。すなわち、その目的は、文字認識装置にお
いて、誤読が生じた場合に、ユーザの修正を容易にし、
その修正の内容を未修整部分に迅速にフィードバックす
ることができる文字認識装置、文字認識方法及び文字認
識プログラムを記録したコンピュータ読み取り可能な記
録媒体を提供することにある。
【0008】
【課題を解決するための手段】すなわち、本発明による
文字認識装置は、イメージ・データとしての文書画像を
入力し、前記文書画像に含まれている文字を認識してテ
キスト・データを生成する文字認識装置であって、ユー
ザがテキスト・データの中の誤読文字列を修正文字列に
置き換えるため修正入力手段と、前記テキスト・データ
の中で、前記誤読文字列と同一の文字コードを有する未
修正文字列を検索する照合手段と、前記検索された前記
未修正文字列の前記テキスト・データにおける位置を表
示する位置表示手段と、を備えたことを特徴とし、同一
の誤読文字を文字コードに基づいて検索し、表示するこ
とにより、修正の手間を軽減することができる。
【0009】また、修正対象の文字列の検索に際して、
イメージ・データ上での幾何学的特徴を調べることによ
り、誤読文字であるのか否かをより正確に照合すること
ができる。
【0010】さらに、検索された文字列を表示する際
に、修正後の文字列も併せて表示すると修正作業が容易
となる。
【0011】また、検索した文字列を自動的に修正する
ことにより、修正の手間を大幅に軽減することができ
る。
【0012】あるいは、検索された文字列の部分を文書
画像上で、再度、認識するようにしても良い。この際
に、ユーザが修正した文字列の幾何学的特徴をパラメー
タとして用いることにより、より精度の高い文字認識を
することができる。
【0013】ここで、文書画像上でそれぞれの文字が有
する幾何学的特徴を、テキスト・データとともに保持し
ておくようにすると、誤読文字列の照合を迅速且つ正確
に行うことができるようになる。
【0014】以上に説明した種々の手段は、コンピュー
タ読み取り可能な記録媒体、例えば、磁気ディスク、光
ディスク、光磁気ディスク、半導体メモリなどにプログ
ラムとして記録し、コンピュータがそのプログラムを読
み取って実行することによっても、同様に実現すること
ができる。
【0015】
【発明の実施の形態】本発明においては、テキスト・デ
ータ上でユーザによる修正がなされた時点で、幾何学的
特徴の推定誤りの可能性があると考え、テキスト・デー
タの未修正部分に対して、同様の修正をすべきと未修正
文字列をユーザに指示したり、自動的に同一方法で修正
したり、修正後の文字列から推定される比較的精度の高
い幾何学的情報を用いて自動的に再認識を行なう。
【0016】また、ユーザが1つの文字を訂正した時
に、その周囲の文字も同様に文字幅、高さ、間隔といっ
た幾何学的特徴が誤っている可能性がある。しかし、従
来技術では修正時に幾何学的情報の自動的に変更しなか
った為、ユーザが修正した文字の周囲の文字列に対して
は認識パラメータを再調整することはなかった。これに
対して、本発明によれば、修正された文字の周囲の文字
の幾何学的特徴も自動的に推定して、再度認識しなおす
ことによって、ユーザの修正の手間を著しく軽減するこ
ともできる。
【0017】以下、図面を参照しつつ本発明の実施の形
態について詳細に説明する。図1は、本発明の第1の実
施の形態にかかる文字認識装置の要部構成を示すブロッ
ク図である。本発明による認識装置10Aとしては、例
えば、コンピュータを用いることができる。認識装置1
0Aには、必要に応じて、光学式スキャナなどの読み取
り装置100が接続され、所定の文書画像データ、すな
わち文書の「イメージ・データ」が入力される。また、
スキャナ100の代わりに、データ通信ラインを介し
て、他の情報機器などから、文書画像が認識装置10A
に送信されるようにしても良い。また、このようにして
入力された文書画像データは、認識装置10Aにおい
て、図示しないメモリや記録ディスクなどに、一旦格納
されるようにしても良い。
【0018】入力された文書画像データ、すなわちイメ
ージ・データは、認識部11において、文字認識され、
認識結果が出力される。この認識結果は、いわゆる「テ
キスト・データ」を含んだものである。ここで、「テキ
スト・データ」とは、通常は、「文字コード」によりそ
れぞれの文字が特定された文書データのことをいう。ま
た、「文字コード」とは、それぞれの文字に対して割り
当てられているコードのことである。「文字コード」に
基づき、「文字属性」も一義的に決定される。ここで、
「文字属性」とは、全角/半角、及び文字の種類(ひら
がな、カタカナ、漢字、アルファベット、記号など)を
表す用語である。
【0019】本発明においては、後に詳述するように、
認識結果を「テキスト・データ」のみとしても良い。ま
たは、本発明においては、「テキスト・データ」のそれ
ぞれの文字毎に、文書画像における対応する文字の幾何
学的形状(文字の幅、高さ、間隔、フォント、表示ビッ
トの占有率など)に関する情報を対応させて認識結果に
含めても良い。
【0020】次に、この認識結果は修正入力部12に送
られ、ユーザによる修正が施される。
【0021】図2は、この修正部以降の処理の流れを表
した説明図である。まず、認識結果は、図示しないディ
スプレイなどにより表示される。ここでは、認識結果の
うちの「テキスト・データ」のみを表示すれば良い。そ
して、ユーザは、そのディスプレイ上で、修正範囲を指
定する(S1)。修正範囲は、ユーザが明示的に指定し
ても良く、または半自動的に判断されるようにしても良
い。
【0022】図3は、ユーザが修正範囲を明示的に指定
する場合を例示した説明図である。すなわち、同図に示
したように、ユーザが修正開始位置と修正終了位置とを
指定することにより、修正範囲を明示的に指定すること
ができる。
【0023】また、図4は、修正範囲が自動的に判断さ
れる場合を例示した説明図である。同図に示した例にお
いては、元の原稿で「重力波は適切な」であったもの
が、「重力ミ皮(よ適切な」と誤読されている。つま
り、「波は」の部分が、半角文字列として分解され、誤
読されている。このような場合に、ユーザが修正開始位
置として、認識結果のうちの「ミ」と「皮」とを指定し
て削除し、「波」を挿入する修正を施すと、その前後で
半角と認識されている範囲が自動的に判断され指定され
る。同図に表した例においては、「ミ皮(よ」の部分が
指定される。すなわち、修正中の文字の周囲において幾
何学的特徴が他の箇所と一致しない範囲を推定し、その
範囲を修正範囲と判断して指定しても良い。
【0024】このようにして、修正範囲を指定した後
に、ユーザが修正を行なう(図2のS2)。修正に際し
ては、文字を入力しても良いし、文字の属性(ひらがな
/アルファベット/半角/全角/倍角など)を変更して
も良い。
【0025】修正入力部12において、ユーザがテキス
ト・データの修正範囲を指定して修正を施すと、その修
正データは、修正前のデータと共に特徴検出部13に送
られる。特徴検出部13においては、修正が施された文
字の修正前の文字コード列、各種の幾何学的特徴、ある
いは文字属性(半角/全角/倍角あるいは日本語/英
語)などの特徴パラメータが検出される(図2のS
3)。ここで、「幾何学的特徴」とは、文書画像、すな
わち「イメージ・データ」上でのそれぞれの文字の幅、
高さ、間隔、フォント、ビット占有率などの幾何学的な
特徴のことである。このような幾何学的な情報を得るた
めには、「イメージ・データ」を格納しておき、特徴検
出部がその「イメージ・データ」上において読みとるよ
うにしても良いし、または、認識部11が文字認識して
認識結果を出力する際に、「テキスト・データ」と共
に、それぞれの文字の特徴を認識結果として出力し、文
字コードと対応させて格納するようにしても良い。
【0026】特徴検出部13において検出された特徴情
報は、修正後の文字の情報と共に修正情報として修正情
報データベース14に保存される(図2のS4)。
【0027】図5は、修正情報データベース14に格納
される情報の内容を例示する説明図である。すなわち、
テキスト・データの中で、「C」が「(」に修正された
場合を例示すると、修正前の「C」に関する文字情報
と、修正後の「(」に関する文字情報とが、それぞれ修
正情報データベース14に格納される。ここで、修正前
の文字の幅や高さなどの情報は、前述したように、予め
認識結果に含めておいても良く、または、特徴検出部1
3が文書画像を調べて検出するようにしても良い。図示
した例では、修正後の文字の幅や高さは、修正前の文字
と同一である。
【0028】なお、同図に示した修正情報は例示に過ぎ
ない。図示した以外にも、修正情報としては、例えば、
文字間隔や、フォント、ビット占有率など各種のパラメ
ータを同様に用いることができる。
【0029】次に、照合部15において、認識結果のう
ちの未修正部分について、修正情報データベース14に
格納された修正前の文字情報と一致する箇所を探す検索
照合が行われる。この検索の手順としては、例えば、ま
ず修正前の文字コードと一致する文字を検索し、さら
に、その他の特徴(文字属性、幾何学的特徴など)の一
致度を調べることにより、検索の精度を高めることがで
きる。それぞれの文字の幾何学的特徴に関しては、認識
結果に含まれている場合は、そのデータを検索し、含ま
れていない場合には、格納されている文書画像上で読み
とる必要がある。
【0030】図6は、照合部15において行われる検索
照合の一例を表す説明図である。すなわち、同図におい
ては、「(」が誤って「C」と認識された場合が例示さ
れている。ユーザが、ある箇所の「C」を「(」と修正
すると、その修正前の「C」に基づいて未修正部分が検
索される。例えば、まず、文字コードが一致する文字が
検索される。そして、同一の文字コード、すなわち、図
示した例においては、「C」が検出されたら、その文字
を修正対象とすることができる。
【0031】さらに、本発明においては、文字コードが
一致した場合に、その他のパラメータを比較することに
より、さらに正確に修正対象を同定することができる。
例えば、図6に示した例においては、文字コード「C」
を有する文字が検出された場合に、さらにその文字幅を
比較する事により修正すべきか否かを正確に照合するこ
とができる。何故ならば、「(」が誤読されて「C」と
認識された場合には、その文字の文字幅は、本来の
「C」の文字幅よりも狭いからである。このように、本
発明によれば、文字コードだけでなく、その他のパラメ
ータ、特に、幾何学的特徴に関するパラメータを調べる
ことにより、修正対象であるか否かをより正確に照合判
断することができる。このためには、本発明において、
認識結果は、文字コードすなわち「テキスト・データ」
の他に、文書画像、すなわち「イメージ・データ」上で
それぞれの文字が有する幾何学的特徴に関する情報も、
併せて格納することが望ましい。
【0032】図7は、別の検索の例を表す説明図であ
る。同図においては、「働く」が「イ動く」と誤読され
た例が示されている。つまり、認識結果に対してユーザ
が行った修正範囲の指定と修正とが複数の文字コードに
またがる場合を例示している。この場合には、ユーザが
修正した「働」という文字の文字幅は「8mm」とされ
ている。この文字幅は、認識結果にデータとして含まれ
ている「イ」と「動」の文字のそれぞれの文字幅および
それらの間隔を合計することによって算出することもで
きる。また、認識結果に文字幅が含まれていない場合に
は、格納されている文書画像の上で、それぞれの文字幅
とそれらの間隔を読みとることができる。
【0033】ユーザが修正すると、前述の場合と同様
に、まず、文字コードに基づいて未修正部分を検索して
修正対象となる文字列を検出する。つまり、「イ」と
「動」の文字コードが連続している文字列を検索する。
さらに、文字コードが一致した文字列のそれぞれの文字
の幾何学的特徴や文字属性を調べることにより、修正対
象であるか否かについて、さらに正確に照合することが
できる。つまり、検出された「イ」の文字幅がユーザが
修正した文字の修正前の「イ」と同様に「2mm」であ
り、検出された「動」の文字幅もユーザが修正した文字
の修正前の「動」と同様に「5mm」である場合には、
その「イ」と「動」からなる文字列は、「働」の誤読文
字列である確率が高い。
【0034】このようにして、修正対象文字が検索照合
されたら、次に、その一致部分をユーザに対して表示す
る(図2のS6)。これは、認識装置10Aの位置表示
修正部16において行われる。位置表示に際しては、修
正対象となる文字の色を変更したり、特定の記号を挿入
したり、反転表示したり、点滅させたり、下線あるいは
網掛けなどの修飾を加えることが望ましい。また、個別
文字の認識時の誤りと文字切り出し時の誤りとを同様の
表示方法で表示しても良いし、区別する為に異なる表示
にしても良い。
【0035】図8は、位置表示の一例を表す説明図であ
る。すなわち、同図においては、誤読箇所Aに示した
「C」をユーザが「(」に修正した結果として、同一の
誤読である可能性が高い箇所が検索され、誤読箇所Bと
して示した「C」が反転表示されている。また、ここ
で、検索された文字列の位置を表示するだけでなく、修
正後にいかなる修正結果になるかを併せて表示すること
もできる。
【0036】図9は、このように修正結果を表示させた
場合を例示する説明図である。すなわち、同図において
は、誤読箇所Aに示した「C」をユーザが「(」に修正
した結果として、同種の誤読の可能性が高い箇所が検索
され、誤読箇所Bとして示した「C」が反転表示される
とともに、修正後の「(」がその付近に表示されてい
る。このようにすれば、修正すべきか否かを、より容易
に判断することができるようになる。
【0037】このように未修正部分について、検索され
た修正文字列が表示された後は、ユーザは、順次、必要
に応じて、それぞれの文字列が誤読か否かを容易に判断
し、適宜修正することができる。この修正作業も位置表
示修正部において行うようにすることができる。一連の
修正作業、例えば、テキスト中の誤読文字「C」をすべ
て修正文字「(」に修正する作業が終了したら、次の誤
読文字の修正を行うために、修正入力部12に戻るよう
にしても良い。このようにしてテキスト・データのすべ
ての誤読文字の修正を終了すると、文字認識装置10A
の一連の文字認識処理動作は、完了する。
【0038】以上説明した一連の文字認識方法は、コン
ピュータ読み取り可能な記録媒体、例えば、磁気ディス
ク、光ディスク、光磁気ディスク、半導体メモリなどの
記録媒体にプログラムとして記録され、コンピュータが
そのプログラムを読み取って実行することによっても、
同様に実現することができる。
【0039】本発明によれば、従来と異なり、同種の誤
読が生じている箇所をユーザが繰り返し探す必要がなく
なる。従って、誤読文字の修正作業を極めて迅速且つ的
確に行うことができるようになる。
【0040】さらに、本発明によれば、文字認識により
得られた認識結果のそれぞれの文字について、イメージ
・データの上での幾何学的特徴をそれぞれの文字ごとに
格納しておくか、或いは、検索に際して、イメージ・デ
ータ上で幾何学的特徴を読み出してから、ユーザが修正
した文字のデータと比較することにより、修正対象とす
べき文字列をより正確に検索できるようになる。
【0041】次に、本発明の第2の実施の形態について
説明する。図10は、本発明の第2の実施の形態に係る
文字認識装置の要部構成を例示するブロック図である。
【0042】また、図11は、本実施形態に係る文字認
識装置の認識処理の流れを表すフロー図である。図10
に表した文字認識装置10Bも、認識部11、修正入力
部12、特徴検出部13、修正情報データベース14、
及び照合部15を備える。図1に関して前述した文字認
識装置10Aと同一の部分については、同一の名称を付
して詳細な説明は省略する。
【0043】本実施形態においては、照合部の後段に自
動修正部20が設けられている。照合部においてユーザ
が行った修正の対象文字と一致すると判定された未修整
の文字は、自動修正部20において、自動的に修正され
る。ユーザが行ったある修正について、未修整部分で、
複数の文字が一致していると判定された場合に、それぞ
れの文字の自動修正をユーザが受け入れるか否かを逐次
的に問い合わせるようにしても良いし、または、全ての
修正対象文字を一括で修正しても良い。
【0044】また、逐次的に問い合わせる場合に、自動
的に次の修正候補の位置までカーソルを移動することに
より、ユーザの修正の手間を軽減することもできる。さ
らに、修正が終了した部分については、修正済みである
ことを示すために、表示色を変えたり、記号、下線、反
転表示、あるいは点滅表示などにより修飾しても良い。
【0045】本実施形態においても、照合部15におい
て、ユーザが修正した文字の修正前の文字コードと同一
の文字を検索するとともに、イメージ・データ上での幾
何学的特徴を比較することにより、誤読した文字である
か否かをより正確に検索することができる。
【0046】次に、本発明の第3の実施の形態について
説明する。図12は、本発明の第3の実施の形態に係る
文字認識装置の要部構成を例示するブロック図である。
また、図13は、本実施形態に係る文字認識装置の認識
処理の流れを表すフロー図である。同図に表した文字認
識装置10Cも、認識部11、修正入力部12、特徴検
出部13、修正情報データベース14、及び照合部15
を備える。図1に関して前述した文字認識装置10Aと
同一の部分については、同一の名称を付して詳細な説明
は省略する。
【0047】本実施形態においては、照合部の後段に再
認識部25が設けられている。照合部15においてユー
ザが行った修正の対象文字と一致すると判定された未修
整の文字は、再認識部25において、再び自動的に文字
認識される(図13のS36)。再認識の際には、ユー
ザによる修正部分に対応する幾何学的特徴を用いて再認
識部の内部パラメータを再度設定し直した上で、再認識
を行うようにすることもできる。これにより、正読率の
向上を図ることができる。また、設定しなおした認識パ
ラメータを記憶することにより、文字切り出しパラメー
タを学習することもできる。
【0048】なお、図12に表した例においては、認識
部11の他に再認識部25が設けられているが本発明は
これに限定されるものではない。すなわち、この他の例
として、再認識部25が設けられず、照合部15におけ
る照合結果に基づいて、認識部11が再度、検索された
箇所を文字認識するようにしても良い。
【0049】さらに、本発明のその他の例としては、照
合部15も省略した構成を挙げることができる。この場
合には、ユーザが行った修正により、認識部11の内部
パラメータを更新して、文書画像の全体を再度、文字認
識する。すなわち、ユーザが修正を行った場合に、文書
画像の上で修正前の文字が有する幾何学的特徴を抽出し
て、修正後の文字の幾何学的特徴として取り扱うことが
できる。つまり、認識部11の内部パラメータをユーザ
の修正に応じて更新し、更新されたパラメータに基づい
て文書画像の全体を再度、文字認識するようにしても良
い。
【0050】次に、本発明の第4の実施の形態について
説明する。図14は、本発明の第4の実施の形態に係る
文字認識装置の要部構成を例示するブロック図である。
また、図15は、本実施形態に係る文字認識装置の認識
処理の流れを表すフロー図である。同図に表した文字認
識装置10Dも、認識部11、修正入力部12、特徴検
出部13、及び修正情報データベース14を備える。図
1に関して前述した文字認識装置10Aと同一の部分に
ついては、同一の名称を付して詳細な説明は省略する。
【0051】本実施形態においては、特徴検出部の後段
に範囲決定部30が設けられ、その後段に再認識部35
が設けられている。そして、本実施形態においても、ユ
ーザによる修正部分から抽出される幾何学的特徴から文
字認識の際に用いるための内部パラメータを再設定した
上で再度、文字認識を行うことができる。図12に示し
た認識装置10Cと異なる点は、再認識の範囲をユーザ
の修正個所の前後に限定して、ユーザが修正している途
中でその前後の修正を推測する点である。このようにす
れば、ユーザのキー入力の手間を軽減することができ
る。
【0052】手順としては、図15に示したように、ユ
ーザの修正により変更された幾何学的特徴や文字属性か
ら認識部の内部パラメータの誤りを推定し(S44)、
新たに設定したパラメータを用いて認識し直す(S4
5)。
【0053】図16は、再認識が行われる場合を例示し
た説明図である。同図では、原稿で「動的な」とあった
文字列が、「重力白勺な」と誤読された例を表す。ユー
ザがこの認識結果のうちの「重力」を「動」と修正する
と、特徴検出部13は、修正の前後の文字の幾何学的特
徴を抽出する。この抽出結果に基づいて、範囲決定部3
0は、修正文字の前後で共通の特徴を有する範囲を推定
する。図示した例の場合は、半角の文字幅を有する範囲
として、「重力白勺」が指定される。そして、抽出され
た内部パラメータ、すなわち、図示した例においては、
文字幅を再度推定し直して、「白勺」の部分が「的」と
自動的に再認識される。このようにすれば、全角文字列
が一連の半角文字列として誤読されたような場合に、最
初の1文字をユーザが修正することにより、その後に連
続する全ての半角文字列部分が自動的に再認識され、ユ
ーザの修正の手間を大幅に軽減することができる。
【0054】なお、本実施形態においても、再認識部3
5を設ける代わりに、範囲決定部30の出力に応じて認
識部11が再度、所定の範囲を新たな内部パラメータに
基づいて文書画像から再度文字認識するようにしても良
い。
【0055】以上説明した各実施形態における手順は、
コンピュータ読み取り可能な記録媒体、例えば、磁気デ
ィスク、光ディスク、光磁気ディスク、半導体メモリな
どにプログラムとして記録され、コンピュータがそのプ
ログラムを読み取って実行することによっても、同様に
実現することができる。
【0056】
【発明の効果】本発明は、以上説明した形態により実施
され、以下に説明する効果を奏する。
【0057】まず、本発明によれば、従来と異なり、同
種の誤読が生じている箇所をユーザが繰り返し探す必要
がなくなる。従って、誤読文字の修正作業を極めて迅速
且つ的確に行うことができるようになる。
【0058】また、本発明によれば、文字認識により得
られた認識結果のそれぞれの文字について、文書画像の
上での幾何学的特徴をそれぞれの文字ごとに格納してお
くか、或いは、検索に際して、文書画像上で幾何学的特
徴を読み出してから、ユーザが修正した文字のデータと
比較することにより、修正対象とすべき文字列をより正
確に検索できるようになる。
【0059】さらに、本発明によれば、検索された修正
文字を逐次的に問い合わせる場合に、自動的に次の修正
候補の位置までカーソルを移動することにより、ユーザ
の修正の手間を軽減することもできる。
【0060】また、本発明によれば、ユーザが行った修
正と同一の文字部分について、自動的に修正を施すこと
により、修正の手間を軽減することができる。
【0061】さらに、本発明によれば、ユーザが行った
修正と同一の文字部分について、再び自動的に文字認識
することにより修正の手間を軽減することもできる。こ
の場合に、ユーザによる修正部分に対応する幾何学的特
徴を用いて再認識部の内部パラメータを再度設定し直し
た上で、再認識を行うようにすることもできる。これに
より、正読率の向上を図ることができる。また、設定し
なおした認識パラメータを記憶することにより、文字切
り出しパラメータを学習することもできる。
【0062】また、本発明によれば、全角文字列が一連
の半角文字列として誤読されたような場合に、最初の1
文字をユーザが修正することにより、その後に連続する
全ての半角文字列部分が自動的に再認識され、ユーザの
修正の手間を大幅に軽減することができる。
【0063】以上説明したように、本発明によれば、文
字認識装置の誤読を極めて簡易に修正することができる
ようになり、産業上のメリットは多大である。
【図面の簡単な説明】
【図1】本発明の第1の実施の形態にかかる文字認識装
置の要部構成を示すブロック図である。
【図2】文字認識装置10Aの修正の処理の流れを表し
た説明図である。
【図3】ユーザが修正範囲を明示的に指定する場合を例
示した説明図である。
【図4】修正範囲が半自動的に判断される場合を例示し
た説明図である。
【図5】修正情報データベース14に格納される情報の
内容を例示する説明図である。
【図6】照合部15において行われる検索照合の一例を
表す説明図である。
【図7】別の検索の例を表す説明図である。
【図8】位置表示の一例を表す説明図である。
【図9】修正結果を表示させた場合を例示する説明図で
ある。
【図10】本発明の第2の実施の形態に係る文字認識装
置の要部構成を例示するブロック図である。
【図11】第2実施形態に係る文字認識装置の認識処理
の流れを表すフロー図である。
【図12】本発明の第3の実施の形態に係る文字認識装
置の要部構成を例示するブロック図である。
【図13】第3実施形態に係る文字認識装置の認識処理
の流れを表すフロー図である。
【図14】本発明の第4の実施の形態に係る文字認識装
置の要部構成を例示するブロック図である。
【図15】第4実施形態に係る文字認識装置の認識処理
の流れを表すフロー図である。
【図16】再認識が行われる場合を例示した説明図であ
る。
【符号の説明】
10A〜D 文字認識装置 11 認識部 12 修正入力部 13 特徴検出部 14 修正情報データベース 15 照合部 16 位置表示部 20 自動修正部 25 再認識部 30 範囲決定部 35 再認識部

Claims (16)

    【特許請求の範囲】
  1. 【請求項1】イメージ・データとしての文書画像を入力
    し、前記文書画像に含まれている文字を認識してテキス
    ト・データを生成する文字認識装置であって、 生成したテキスト・データを表示し、前記テキスト・デ
    ータの中の誤読文字列を修正文字列に置き換えるための
    修正データを入力する修正入力手段と、 前記テキスト・データの中で、前記誤読文字列と同一の
    文字コードを有する未修正文字列を検索する照合手段
    と、 前記検索された前記未修正文字列の前記テキスト・デー
    タにおける位置を表示する位置表示手段と、 を備えたことを特徴とする文字認識装置。
  2. 【請求項2】イメージ・データとしての文書画像を入力
    し、前記文書画像に含まれている文字を認識してテキス
    ト・データを生成する文字認識装置であって、 生成したテキスト・データを表示し、前記テキスト・デ
    ータの中の誤読文字列を修正文字列に置き換えるための
    修正データを入力する修正入力手段と、 前記テキスト・データの中で、前記誤読文字列と同一の
    文字コードを有する文字列を検索し、検索された文字列
    の前記文書画像における幾何学的特徴と前記誤読文字列
    の前記文書画像における幾何学的特徴とを照合する照合
    手段と、 前記照合手段において一致すると判断された前記文字列
    の前記テキスト・データにおける位置を表示する位置表
    示手段と、 を備えたことを特徴とする文字認識装置。
  3. 【請求項3】前記位置表示手段は、前記修正文字列も併
    せて表示するものとして構成されていることを特徴とす
    る請求項1または2に記載の文字認識装置。
  4. 【請求項4】イメージ・データとしての文書画像を入力
    し、前記文書画像に含まれている文字を認識してテキス
    ト・データを生成する文字認識装置であって、 生成したテキスト・データを表示し、前記テキスト・デ
    ータの中の誤読文字列を修正文字列に置き換えるための
    修正データを入力する修正入力手段と、 前記テキスト・データの中で、前記誤読文字列と同一の
    文字コードを有する文字列を検索し、検索された文字列
    の前記文書画像における幾何学的特徴と前記誤読文字列
    の前記文書画像における幾何学的特徴とを照合する照合
    手段と、 前記照合手段において一致すると判断された前記文字列
    を前記修正文字列に置き換える自動修正手段と、 を備えたことを特徴とする文字認識装置。
  5. 【請求項5】イメージ・データとしての文書画像を入力
    し、前記文書画像に含まれている文字を認識してテキス
    ト・データを生成する文字認識装置であって、 生成したテキスト・データを表示し、前記テキスト・デ
    ータの中の誤読文字列を修正文字列に置き換えるための
    修正データを入力する修正入力手段と、 前記誤読文字列が前記文書画像において有する幾何学的
    特徴に基づいて、前記文書画像に含まれている文字を再
    度、認識してテキスト・データを生成する再認識手段
    と、 を備えたことを特徴とする文字認識装置。
  6. 【請求項6】前記文書画像に含まれているそれぞれの文
    字が有する幾何学的特徴を、前記テキスト・データのそ
    れぞれの文字の文字コードと対応させて保持する保持手
    段をさらに備えたことを特徴とする請求項2、4、及び
    5のいずれか1つに記載の文字認識装置。
  7. 【請求項7】イメージ・データとしての文書画像を入力
    し、 前記文書画像に含まれている文字を認識してテキスト・
    データを生成し、 生成したテキスト・データを表示し、 前記テキスト・データの中の誤読文字列を修正文字列に
    置き換えるための修正データを入力し、 前記テキスト・データの中で、前記誤読文字列と同一の
    文字コードを有する未修正文字列を検索し、 前記検索された前記未修正文字列の前記テキスト・デー
    タにおける位置を表示する、 ことを特徴とする文字認識方法。
  8. 【請求項8】イメージ・データとしての文書画像を入力
    し、 前記文書画像に含まれている文字を認識してテキスト・
    データを生成し、 生成したテキスト・データを表示し、 前記テキスト・データの中の誤読文字列を修正文字列に
    置き換えるための修正データを入力し、 前記テキスト・データの中で、前記誤読文字列と同一の
    文字コードを有する文字列を検索し、 検索された文字列の前記文書画像における幾何学的特徴
    と前記誤読文字列の前記文書画像における幾何学的特徴
    とを照合し、 前記照合手段において一致すると判断された前記文字列
    の前記テキスト・データにおける位置を表示する、 ことを特徴とする文字認識方法。
  9. 【請求項9】イメージ・データとしての文書画像を入力
    し、 前記文書画像に含まれている文字を認識してテキスト・
    データを生成し、 生成したテキスト・データを表示し、 前記テキスト・データの中の誤読文字列を修正文字列に
    置き換えるための修正データを入力し、 前記テキスト・データの中で、前記誤読文字列と同一の
    文字コードを有する文字列を検索し、 検索された文字列の前記文書画像における幾何学的特徴
    と前記誤読文字列の前記文書画像における幾何学的特徴
    とを照合し、 前記照合手段において一致すると判断された前記文字列
    を前記修正文字列に置き換える、 ことを特徴とする文字認識方法。
  10. 【請求項10】イメージ・データとしての文書画像を入
    力し、 前記文書画像に含まれている文字を認識してテキスト・
    データを生成し、 生成したテキスト・データを表示し、 前記テキスト・データの中の誤読文字列を修正文字列に
    置き換えるための修正データを入力し、 前記誤読文字列が前記文書画像において有する幾何学的
    特徴に基づいて、前記文書画像に含まれている文字を再
    度、認識してテキスト・データを生成する、 ことを特徴とする文字認識方法。
  11. 【請求項11】前記文書画像に含まれているそれぞれの
    文字が有する幾何学的特徴を、前記テキスト・データの
    それぞれの文字の文字コードと対応させて保持すること
    を特徴とする請求項7〜10のいずれか1つに記載の文
    字認識方法。
  12. 【請求項12】イメージ・データとしての文書画像を入
    力させる手順と、 前記文書画像に含まれている文字を認識してテキスト・
    データを生成させる手順と、 生成したテキスト・データを表示させる手順と、 前記テキスト・データの中の誤読文字列を修正文字列に
    置き換えるための修正データを入力させる手順と、 前記テキスト・データの中で、前記誤読文字列と同一の
    文字コードを有する未修正文字列を検索させる手順と、 前記検索された前記未修正文字列の前記テキスト・デー
    タにおける位置を表示させる手順と、 をコンピュータに実行させるプログラムを記録したコン
    ピュータ読み取り可能な記録媒体。
  13. 【請求項13】イメージ・データとしての文書画像を入
    力させる手順と、 前記文書画像に含まれている文字を認識してテキスト・
    データを生成させる手順と、 生成したテキスト・データを表示させる手順と、 前記テキスト・データの中の誤読文字列を修正文字列に
    置き換えるための修正データを入力させる手順と、 前記テキスト・データの中で、前記誤読文字列と同一の
    文字コードを有する文字列を検索する手順と、 前記検索された文字列の前記文書画像における幾何学的
    特徴と前記誤読文字列の前記文書画像における幾何学的
    特徴とを照合させる手順と、 前記照合させた結果、一致すると判断された前記文字列
    の前記テキスト・データにおける位置を表示させる手順
    と、 をコンピュータに実行させるプログラムを記録したコン
    ピュータ読み取り可能な記録媒体。
  14. 【請求項14】イメージ・データとしての文書画像を入
    力させる手順と、 前記文書画像に含まれている文字を認識してテキスト・
    データを生成させる手手順と、 生成したテキスト・データを表示させる手順と、 前記テキスト・データの中の誤読文字列を修正文字列に
    置き換えるための修正データを入力させる手順と、 前記テキスト・データの中で、前記誤読文字列と同一の
    文字コードを有する文字列を検索させる手順と、 前記検索された文字列の前記文書画像における幾何学的
    特徴と前記誤読文字列の前記文書画像における幾何学的
    特徴とを照合させる手順と、 前記照合手段において一致すると判断された前記文字列
    を前記修正文字列に置き換させる手順と、 をコンピュータに実行させるプログラムを記録したコン
    ピュータ読み取り可能な記録媒体。
  15. 【請求項15】イメージ・データとしての文書画像を入
    力させる手順と、 前記文書画像に含まれている文字を認識してテキスト・
    データを生成させる手順と、 生成したテキスト・データを表示させる手順と、 前記テキスト・データの中の誤読文字列を修正文字列に
    置き換えるための修正データを入力させる手順と、 前記誤読文字列が前記文書画像において有する幾何学的
    特徴に基づいて、前記文書画像に含まれている文字を再
    度、認識してテキスト・データを生成させる手順と、 をコンピュータに実行させるプログラムを記録したコン
    ピュータ読み取り可能な記録媒体。
  16. 【請求項16】前記文書画像に含まれているそれぞれの
    文字が有する幾何学的特徴を、前記テキスト・データの
    それぞれの文字の文字コードと対応させて保持させる手
    順ををコンピュータに実行させるプログラムをさらに記
    録した請求項12〜15のいずれか1つに記載のコンピ
    ュータ読み取り可能な記録媒体。
JP9311920A 1997-11-13 1997-11-13 文字認識装置、文字認識方法及び文字認識プログラムを記録したコンピュータ読み取り可能な記録媒体 Pending JPH11143983A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP9311920A JPH11143983A (ja) 1997-11-13 1997-11-13 文字認識装置、文字認識方法及び文字認識プログラムを記録したコンピュータ読み取り可能な記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP9311920A JPH11143983A (ja) 1997-11-13 1997-11-13 文字認識装置、文字認識方法及び文字認識プログラムを記録したコンピュータ読み取り可能な記録媒体

Publications (1)

Publication Number Publication Date
JPH11143983A true JPH11143983A (ja) 1999-05-28

Family

ID=18023022

Family Applications (1)

Application Number Title Priority Date Filing Date
JP9311920A Pending JPH11143983A (ja) 1997-11-13 1997-11-13 文字認識装置、文字認識方法及び文字認識プログラムを記録したコンピュータ読み取り可能な記録媒体

Country Status (1)

Country Link
JP (1) JPH11143983A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002074262A (ja) * 2000-08-28 2002-03-15 Nippon Digital Kenkyusho:Kk 認識文字修正方法
US10134138B2 (en) 2016-03-09 2018-11-20 Canon Kabushiki Kaisha Information processing apparatus, computer-readable storage medium, information processing method

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002074262A (ja) * 2000-08-28 2002-03-15 Nippon Digital Kenkyusho:Kk 認識文字修正方法
US10134138B2 (en) 2016-03-09 2018-11-20 Canon Kabushiki Kaisha Information processing apparatus, computer-readable storage medium, information processing method

Similar Documents

Publication Publication Date Title
JP3427692B2 (ja) 文字認識方法および文字認識装置
KR100412317B1 (ko) 문자인식/수정방법및장치
JP3294995B2 (ja) 帳票読取装置
JP2000293626A (ja) 文字認識方法及び装置ならびに記憶媒体
JP2008077454A (ja) タイトル抽出装置、画像読取装置、タイトル抽出方法、及びタイトル抽出プログラム
JP2010061471A (ja) 文字認識装置およびプログラム
JP2000089786A (ja) 音声認識結果の修正方法および装置
JPH11143983A (ja) 文字認識装置、文字認識方法及び文字認識プログラムを記録したコンピュータ読み取り可能な記録媒体
JP2586372B2 (ja) 情報検索装置及び情報検索方法
JPH06215184A (ja) 抽出領域のラベリング装置
JP2022095391A (ja) 情報処理装置、及び情報処理プログラム
JP2003331214A (ja) 文字認識誤り訂正方法、装置及びプログラム
JP4677750B2 (ja) 文書属性取得方法および装置並びにプログラムを記録した記録媒体
JP2002063197A (ja) 検索装置、記録媒体およびプログラム
JPH09274645A (ja) 文字認識方法および装置
JP2002207960A (ja) 認識文字修正方法及び認識文字修正プログラム
JPH07271921A (ja) 文字認識装置および文字認識方法
JPH06251187A (ja) 文字認識誤り修正方法及び装置
JP3599734B2 (ja) 文章校正装置およびその方法
JP3138665B2 (ja) 手書き文字認識方式および記録媒体
JPH1069494A (ja) 画像検索方法とその装置
JPH11120294A (ja) 文字認識装置および媒体
JP2829186B2 (ja) 光学的文字読取装置
JP3113712B2 (ja) 文字認識方法及びその装置
JPH0749924A (ja) 手書き文字認識装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20041104

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20071011

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20071016

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20080822