JP2001266066A - 文字認識装置および文字認識方法 - Google Patents
文字認識装置および文字認識方法Info
- Publication number
- JP2001266066A JP2001266066A JP2000076507A JP2000076507A JP2001266066A JP 2001266066 A JP2001266066 A JP 2001266066A JP 2000076507 A JP2000076507 A JP 2000076507A JP 2000076507 A JP2000076507 A JP 2000076507A JP 2001266066 A JP2001266066 A JP 2001266066A
- Authority
- JP
- Japan
- Prior art keywords
- character
- order
- character recognition
- recognition result
- correction
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Landscapes
- Character Discrimination (AREA)
Abstract
(57)【要約】
【課題】 修正のための作業時間を短くして、効率よく
認識結果を修正することが可能な文字認識装置の実現を
課題とする。 【解決手段】 帳票を走査するスキャナー1と、スキャ
ナー1の走査によってOCRより入力される画像情報を
格納する格納ROMまたはRAM3と、この画像情報か
ら辞書6等を用いて文字を認識する中央演算処理装置2
と、得られた文字認識結果の確からしさの情報を求める
手段と、各文字の確からしさの情報からその帳票の代表
値を求める手段と、代表値の小さなものの順に帳票の認
識結果修正の順番を決定する手段とを設け、代表値が比
較的大きな帳票については認識結果の確認、修正を省略
する。
認識結果を修正することが可能な文字認識装置の実現を
課題とする。 【解決手段】 帳票を走査するスキャナー1と、スキャ
ナー1の走査によってOCRより入力される画像情報を
格納する格納ROMまたはRAM3と、この画像情報か
ら辞書6等を用いて文字を認識する中央演算処理装置2
と、得られた文字認識結果の確からしさの情報を求める
手段と、各文字の確からしさの情報からその帳票の代表
値を求める手段と、代表値の小さなものの順に帳票の認
識結果修正の順番を決定する手段とを設け、代表値が比
較的大きな帳票については認識結果の確認、修正を省略
する。
Description
【0001】
【発明の属する技術分野】本発明は、文字認識装置およ
び文字認識方法に関し、特に文字認識の確認と修正を行
うことが可能な文字認識装置および文字認識方法に関す
る。
び文字認識方法に関し、特に文字認識の確認と修正を行
うことが可能な文字認識装置および文字認識方法に関す
る。
【0002】
【従来の技術】OCR(光学的文字読取装置)等のよう
に文字認識装置においては、文字をイメージデータとし
て一旦読み取った上で、ここの文字を処理して認識して
文字を読み取っている。しかしながら、読み取ったイメ
ージデータを認識する際に、認識できない文字が発生し
たり、誤って認識される文字が発生したりする。これを
正すために、文字のイメージを画面に表示して、認識で
きなかった文字や、誤って認識された文字の修正を利用
者に求める方法が広く行われている。しかしながら、こ
の様な方法では、文字の修正に時間がかかり、短時間で
多量の文字入力ができないという問題があった。
に文字認識装置においては、文字をイメージデータとし
て一旦読み取った上で、ここの文字を処理して認識して
文字を読み取っている。しかしながら、読み取ったイメ
ージデータを認識する際に、認識できない文字が発生し
たり、誤って認識される文字が発生したりする。これを
正すために、文字のイメージを画面に表示して、認識で
きなかった文字や、誤って認識された文字の修正を利用
者に求める方法が広く行われている。しかしながら、こ
の様な方法では、文字の修正に時間がかかり、短時間で
多量の文字入力ができないという問題があった。
【0003】この問題を多少でも解決し、単位時間に処
理できる伝票などの数を増やしたいという考え方から、
特開平6−162253号公報では、誤認識された文字
や認識できなかった文字の数が、予め設定されている設
定値より大きいか否かを判定し、誤認識された文字や認
識できなかった文字の数が予め設定されている設定値よ
り小さい場合は、誤認識された文字や認識できなかった
文字のイメージデータを表示して修正させ、設定値より
大きい場合は、誤認識された文字や認識できなかった文
字が記入されている帳票のイメージデータを表示して文
字を修正させるという方法を採っている。しかし、この
方法では、結局、入力した全ての原稿をチェックするこ
とになってしまう。実際には、入力した全原稿の90%
以上が認識できている場合が多く、必ずしも全原稿のチ
ェックが必要でない場合があるにも拘らず、この方法で
は、特に大量に原稿(帳票)が入力された場合などで、
修正作業効率が低下することになる。
理できる伝票などの数を増やしたいという考え方から、
特開平6−162253号公報では、誤認識された文字
や認識できなかった文字の数が、予め設定されている設
定値より大きいか否かを判定し、誤認識された文字や認
識できなかった文字の数が予め設定されている設定値よ
り小さい場合は、誤認識された文字や認識できなかった
文字のイメージデータを表示して修正させ、設定値より
大きい場合は、誤認識された文字や認識できなかった文
字が記入されている帳票のイメージデータを表示して文
字を修正させるという方法を採っている。しかし、この
方法では、結局、入力した全ての原稿をチェックするこ
とになってしまう。実際には、入力した全原稿の90%
以上が認識できている場合が多く、必ずしも全原稿のチ
ェックが必要でない場合があるにも拘らず、この方法で
は、特に大量に原稿(帳票)が入力された場合などで、
修正作業効率が低下することになる。
【0004】
【発明が解決しようとする課題】上述のごとく、従来の
文字認識装置においては、結局のところ、入力した全て
の原稿をチェックして、誤認識や認識漏れを修正するこ
とになっているため、修正作業の効率が悪く、大量の原
稿の入力に対応できないという問題があった。本発明
は、比較的簡単な方法でこの問題を解決して、大量に原
稿(帳票)が入力された場合においても、効率よく認識
結果を修正することが可能な文字認識装置の実現を課題
とする。
文字認識装置においては、結局のところ、入力した全て
の原稿をチェックして、誤認識や認識漏れを修正するこ
とになっているため、修正作業の効率が悪く、大量の原
稿の入力に対応できないという問題があった。本発明
は、比較的簡単な方法でこの問題を解決して、大量に原
稿(帳票)が入力された場合においても、効率よく認識
結果を修正することが可能な文字認識装置の実現を課題
とする。
【0005】
【課題を解決するための手段】上記課題を達成するた
め、本発明は、文字原稿の画像情報から文字を認識し処
理する文字認識装置において、文字原稿である帳票を画
像情報として入力する画像入力手段と、この画像入力手
段によって入力された画像情報から文字を認識する文字
認識手段と、この文字認識手段により得られた文字認識
結果の確からしさの情報を求める確度演算手段と、前記
文字認識手段により得られた文字認識結果と前記確度演
算手段がもとめた文字認識の確からしさの情報とを記憶
する認識結果記憶手段と、この認識結果記憶手段に記憶
された各文字の確からしさの情報から、その帳票の代表
値を求める代表値手段と、その代表値をもとに確からし
さの情報の小さなものの順に認識結果修正の順番を決定
する修正順序決定手段とを具備することを特徴とする。
これにより、確からしさを表す代表値の小さなものの順
に認識結果修正を行い、代表値が比較的大きな帳票につ
いては認識結果の確認、修正を省略することができるの
で、効率よく認識結果を修正することが可能な文字認識
装置を実現することができる。。
め、本発明は、文字原稿の画像情報から文字を認識し処
理する文字認識装置において、文字原稿である帳票を画
像情報として入力する画像入力手段と、この画像入力手
段によって入力された画像情報から文字を認識する文字
認識手段と、この文字認識手段により得られた文字認識
結果の確からしさの情報を求める確度演算手段と、前記
文字認識手段により得られた文字認識結果と前記確度演
算手段がもとめた文字認識の確からしさの情報とを記憶
する認識結果記憶手段と、この認識結果記憶手段に記憶
された各文字の確からしさの情報から、その帳票の代表
値を求める代表値手段と、その代表値をもとに確からし
さの情報の小さなものの順に認識結果修正の順番を決定
する修正順序決定手段とを具備することを特徴とする。
これにより、確からしさを表す代表値の小さなものの順
に認識結果修正を行い、代表値が比較的大きな帳票につ
いては認識結果の確認、修正を省略することができるの
で、効率よく認識結果を修正することが可能な文字認識
装置を実現することができる。。
【0006】また、文字原稿の画像情報から文字を認識
する文字認識方法において、文字原稿である帳票を画像
情報として入力する画像入力過程と、この画像入力過程
によって入力された画像情報から文字を認識する文字認
識過程と、この文字認識過程により得られた文字認識結
果の確からしさの情報を求める確度演算過程と、前記文
字認識過程により得られた文字認識結果と前記確度演算
過程がもとめた文字認識の確からしさの情報とを記憶す
る認識結果記憶過程と、この認識結果記憶過程で記憶さ
れた各文字の確からしさの情報から、その帳票の代表値
を求める代表値選択過程と、この代表値選択過程で求め
た代表値をもとに確からしさの情報の小さなものの順に
前記帳票の認識結果修正の順番を決定する修正順序決定
過程と、この修正順序決定過程できまった順にしたがっ
て前記帳票の認識結果の確認や修正を行い、順序の後の
帳票については認識結果の確認や修正を省略することを
特徴とする。これにより、代表値が比較的大きな帳票に
ついては認識結果の確認、修正を省略することができ、
効率よく認識結果を修正することが可能な文字認識方法
がえられる。
する文字認識方法において、文字原稿である帳票を画像
情報として入力する画像入力過程と、この画像入力過程
によって入力された画像情報から文字を認識する文字認
識過程と、この文字認識過程により得られた文字認識結
果の確からしさの情報を求める確度演算過程と、前記文
字認識過程により得られた文字認識結果と前記確度演算
過程がもとめた文字認識の確からしさの情報とを記憶す
る認識結果記憶過程と、この認識結果記憶過程で記憶さ
れた各文字の確からしさの情報から、その帳票の代表値
を求める代表値選択過程と、この代表値選択過程で求め
た代表値をもとに確からしさの情報の小さなものの順に
前記帳票の認識結果修正の順番を決定する修正順序決定
過程と、この修正順序決定過程できまった順にしたがっ
て前記帳票の認識結果の確認や修正を行い、順序の後の
帳票については認識結果の確認や修正を省略することを
特徴とする。これにより、代表値が比較的大きな帳票に
ついては認識結果の確認、修正を省略することができ、
効率よく認識結果を修正することが可能な文字認識方法
がえられる。
【0007】
【発明の実施の形態】少量の原稿を入力する場合は、1
枚1枚認識結果を確認しながら作業を行うことも可能だ
が、大量の原稿を入力する場合は、認識が終了する度に
1枚1枚認識結果を確認するのでは、非常に作業効率が
悪い。従って、そのような場合には、バッチ処理的に認
識だけを先に行い、後でまとめて認識結果を修正する方
法が採用される。このように、後でまとめて認識結果を
修正する場合、作業効率を向上させるために、認識結果
とその文字の画像上の位置(座標値)とを画像に関連付
けて、認識結果の文字コード単位に記億させる方法を採
用することにより、認識結果修正時の誤認文字の発見と
修正を容易にすることができる。しかし、この方法にお
いても、結局は全ての認識結果を確認する必要があるた
め作業効率は必ずしも良くない。
枚1枚認識結果を確認しながら作業を行うことも可能だ
が、大量の原稿を入力する場合は、認識が終了する度に
1枚1枚認識結果を確認するのでは、非常に作業効率が
悪い。従って、そのような場合には、バッチ処理的に認
識だけを先に行い、後でまとめて認識結果を修正する方
法が採用される。このように、後でまとめて認識結果を
修正する場合、作業効率を向上させるために、認識結果
とその文字の画像上の位置(座標値)とを画像に関連付
けて、認識結果の文字コード単位に記億させる方法を採
用することにより、認識結果修正時の誤認文字の発見と
修正を容易にすることができる。しかし、この方法にお
いても、結局は全ての認識結果を確認する必要があるた
め作業効率は必ずしも良くない。
【0008】本発明は、このような問題の解決を図った
文字認識装置および文字認識方法の実現を課題にするも
のである。以下、本発明にかかる文字認識装置を添付図
面を参照にして詳細に説明することにする。
文字認識装置および文字認識方法の実現を課題にするも
のである。以下、本発明にかかる文字認識装置を添付図
面を参照にして詳細に説明することにする。
【0009】図1は、本発明の文字認識装置の構成を示
すブロック図である。図1において、符号1はスキャナ
ー、符号2は中央演算処理装置、符号3はOCR格納R
OMまたはRAM、符号4はディスプレイ、符号5はメ
モリ、符号6は辞書、符号7はワークエリアRAM、符
号8はCD−ROMまたはFDドライブである。この文
字認識装置では、帳票などの認識対象の原稿をスキャナ
ー1で走査し、OCRで読み取って、その結果はOCR
格納ROMまたはRAM3に一旦記憶された後、中央演
算処理装置2によって辞書6等を用いて文字認識され、
認識結果はディスプレイ4に表示されて操作者の確認、
修正を受けることになる。確認、修正語の認識結果はC
D−ROMまたはFDドライブ8からCD−ROMやF
Dなどに記録される。
すブロック図である。図1において、符号1はスキャナ
ー、符号2は中央演算処理装置、符号3はOCR格納R
OMまたはRAM、符号4はディスプレイ、符号5はメ
モリ、符号6は辞書、符号7はワークエリアRAM、符
号8はCD−ROMまたはFDドライブである。この文
字認識装置では、帳票などの認識対象の原稿をスキャナ
ー1で走査し、OCRで読み取って、その結果はOCR
格納ROMまたはRAM3に一旦記憶された後、中央演
算処理装置2によって辞書6等を用いて文字認識され、
認識結果はディスプレイ4に表示されて操作者の確認、
修正を受けることになる。確認、修正語の認識結果はC
D−ROMまたはFDドライブ8からCD−ROMやF
Dなどに記録される。
【0010】例えば、図2のように、N枚の大量の帳票
を処理する場合を仮定する。この場合、当然、認識結果
ファイルもN枚分存在することになる。ここで、仮に、
3枚目と、n枚目と、最後のN枚目に文字の誤認識が含
まれている認識結果ファイルがあると仮定する。そうす
ると、この場合、ユーザーは、どの認識結果ファイルに
誤認識が含まれているのかわからないので、結局1枚目
から最後のN枚目までを対象に認識結果を確認すること
になる。なぜならば、一番最後の認識結果ファイルにも
誤認識が含まれている可能性が否定できないからであ
る。N枚目にご認識があるかどうかは、最後まで確認し
て初めてわかることである。例えば、帳票単位で90%
以上の認識率が得られていると仮定すると、飛び飛びに
散らばっている10%の誤認識を含む認識結果ファイル
のために、残りの90%の誤認識を含まない認識結果フ
ァイルをも確認しなければならないということである。
このようにつまり、どこに誤認識が含まれているのかわ
からないことが、ユーザーを不安にさせ、作業効率を低
下させることになる。
を処理する場合を仮定する。この場合、当然、認識結果
ファイルもN枚分存在することになる。ここで、仮に、
3枚目と、n枚目と、最後のN枚目に文字の誤認識が含
まれている認識結果ファイルがあると仮定する。そうす
ると、この場合、ユーザーは、どの認識結果ファイルに
誤認識が含まれているのかわからないので、結局1枚目
から最後のN枚目までを対象に認識結果を確認すること
になる。なぜならば、一番最後の認識結果ファイルにも
誤認識が含まれている可能性が否定できないからであ
る。N枚目にご認識があるかどうかは、最後まで確認し
て初めてわかることである。例えば、帳票単位で90%
以上の認識率が得られていると仮定すると、飛び飛びに
散らばっている10%の誤認識を含む認識結果ファイル
のために、残りの90%の誤認識を含まない認識結果フ
ァイルをも確認しなければならないということである。
このようにつまり、どこに誤認識が含まれているのかわ
からないことが、ユーザーを不安にさせ、作業効率を低
下させることになる。
【0011】しかし、図3のように、確からしさの代表
値によって認識結果ファイルの順番がソーティングされ
ているとする、代表値が低い、つまり、誤認識文字を含
む確率の高いものから順番に並ぶために、認識結果の修
正作業が最初の方に集中し、代表値が高くなるにつれ
て、修正作業の負荷が下降していき、やがて、まったく
修正する必要がなくなる。
値によって認識結果ファイルの順番がソーティングされ
ているとする、代表値が低い、つまり、誤認識文字を含
む確率の高いものから順番に並ぶために、認識結果の修
正作業が最初の方に集中し、代表値が高くなるにつれ
て、修正作業の負荷が下降していき、やがて、まったく
修正する必要がなくなる。
【0012】図4に、代表値によってソーティングされ
たファイルでの原稿順序と、代表値および修正作業の負
荷を示す。ユーザーは、ファイルが代表値でソーティン
グされていると、この図に示すようなカーブを頭に描き
ながら、現在、修正している認識結果ファイルの代表値
を知ることで、全体のカーブのどのあたりを修正してい
るのか把握しながら作業をすることできる。そして、ま
ったく修正する必要がない認識結果ファイルがある程度
続いたら(図4では+α枚として示している。このα枚
の値はユーザーの判断で決める)、残りの認識結果ファ
イルは大丈夫だろうということで、認識結果の修正作業
を途中で終了することができる。これによって、短い修
正のための作業時間で、品質の高い認識結果ファイルを
得ることができる。本発明は、少量原稿の入力時にも効
果を発揮するが、大量原稿の入力時には、さらにその効
果が増大する。尚、各文字の確からしさを求める方法に
ついて示したものとして、例えば、特開平4−2118
83号公報に記載の「文字認識装置」がある。
たファイルでの原稿順序と、代表値および修正作業の負
荷を示す。ユーザーは、ファイルが代表値でソーティン
グされていると、この図に示すようなカーブを頭に描き
ながら、現在、修正している認識結果ファイルの代表値
を知ることで、全体のカーブのどのあたりを修正してい
るのか把握しながら作業をすることできる。そして、ま
ったく修正する必要がない認識結果ファイルがある程度
続いたら(図4では+α枚として示している。このα枚
の値はユーザーの判断で決める)、残りの認識結果ファ
イルは大丈夫だろうということで、認識結果の修正作業
を途中で終了することができる。これによって、短い修
正のための作業時間で、品質の高い認識結果ファイルを
得ることができる。本発明は、少量原稿の入力時にも効
果を発揮するが、大量原稿の入力時には、さらにその効
果が増大する。尚、各文字の確からしさを求める方法に
ついて示したものとして、例えば、特開平4−2118
83号公報に記載の「文字認識装置」がある。
【0013】図5に、この発明での認識結果の修正作業
のフローチャートを示す。ステップ100でこのルーチ
ンをスタートすると、ステップ101で文字認識(OC
R)を行う。文字認識には文字切り出し、認識、後処
理、確信度処理が含まれる。ステップ102で代表値が
算出され、ステップ103で算出された代表値によって
認識結果ファイルを並べ変える。そうして、並べ変えら
れたファイルに対して途中までステップ104で修正作
業を実行する。
のフローチャートを示す。ステップ100でこのルーチ
ンをスタートすると、ステップ101で文字認識(OC
R)を行う。文字認識には文字切り出し、認識、後処
理、確信度処理が含まれる。ステップ102で代表値が
算出され、ステップ103で算出された代表値によって
認識結果ファイルを並べ変える。そうして、並べ変えら
れたファイルに対して途中までステップ104で修正作
業を実行する。
【0014】以上の説明では、文字の確からしさを表す
数値として代表値という表現をとったが、次にこの代表
値を、具体的に各文字の確からしさ情報の最小値で表す
ものとする。すなわち、1枚の認識結果ファイルに存在
する全文字の中で、確からしさ情報の最小のものを代表
値とする。すなわち、図6(a)に示すような帳票の例
で、認識項目がA〜Fのそれぞれの確からしさが図6
(b)に示すように、それぞれ100、90、80、2
0、50、90であったとすると、最小値の20を代表
値とする。ただし、ここでは、確からしさ、および代表
値は100に近いほど確からしいものとし、各認識項目
は1文字であるとする。
数値として代表値という表現をとったが、次にこの代表
値を、具体的に各文字の確からしさ情報の最小値で表す
ものとする。すなわち、1枚の認識結果ファイルに存在
する全文字の中で、確からしさ情報の最小のものを代表
値とする。すなわち、図6(a)に示すような帳票の例
で、認識項目がA〜Fのそれぞれの確からしさが図6
(b)に示すように、それぞれ100、90、80、2
0、50、90であったとすると、最小値の20を代表
値とする。ただし、ここでは、確からしさ、および代表
値は100に近いほど確からしいものとし、各認識項目
は1文字であるとする。
【0015】最小値を求めるフローチャートを図7に示
す。ステップ200でこのルーチンをスタートすると、
ステップ201で最小値を100に設定して記憶する。
次にステップ202で最初の認識項目の「確からしさ」
を最小値と比較判断し、この「確からしさ」が記憶され
ている最小値よりも小さい時は、ステップ203に進
み、この「確からしさ」を最小値として記憶し、ステッ
プ204に進む。ステップ202で「確からしさ」が記
憶されている最小値よりも小さくないときは、そのまま
ステップ204に進む。ステップ204では全認識項目
(全文字)について比較判断が終了したかどうかを判定
し、終了していないときは、ステップ202に戻って認
識項目の「確からしさ」を最小値と比較判断する。そう
して、全認識項目について終了したときはステップ20
5に進んでこのルーチンを終了する。
す。ステップ200でこのルーチンをスタートすると、
ステップ201で最小値を100に設定して記憶する。
次にステップ202で最初の認識項目の「確からしさ」
を最小値と比較判断し、この「確からしさ」が記憶され
ている最小値よりも小さい時は、ステップ203に進
み、この「確からしさ」を最小値として記憶し、ステッ
プ204に進む。ステップ202で「確からしさ」が記
憶されている最小値よりも小さくないときは、そのまま
ステップ204に進む。ステップ204では全認識項目
(全文字)について比較判断が終了したかどうかを判定
し、終了していないときは、ステップ202に戻って認
識項目の「確からしさ」を最小値と比較判断する。そう
して、全認識項目について終了したときはステップ20
5に進んでこのルーチンを終了する。
【0016】同じ最小値をもつファイルが複数存在する
場合は、最小値が同じファイルに対し、その次に最小で
ある値を比較し、その値の小さいものをより代表値が低
いとして認識結果修正の順番を決定する。例えば、N枚
の帳票を処理したと仮定する。その場合、N枚の帳票フ
ァイルの全ての代表値が異なれば間題ないが、当然、同
じ代表値を持っものが複数存在する場合もありうる。そ
の場合は、その同じ代表値のものをどのような基準で並
べるかということになり、その次に最小な値がより小さ
い方を、より代表値が低いとして順番を決めるというも
のである。
場合は、最小値が同じファイルに対し、その次に最小で
ある値を比較し、その値の小さいものをより代表値が低
いとして認識結果修正の順番を決定する。例えば、N枚
の帳票を処理したと仮定する。その場合、N枚の帳票フ
ァイルの全ての代表値が異なれば間題ないが、当然、同
じ代表値を持っものが複数存在する場合もありうる。そ
の場合は、その同じ代表値のものをどのような基準で並
べるかということになり、その次に最小な値がより小さ
い方を、より代表値が低いとして順番を決めるというも
のである。
【0017】代表値を、各文字の確からしさ情報の平均
値としてもよい。すなわち、図8(a)に示すような帳
票の例で、認識項目がA〜Fのそれぞれの確からしさが
図8(b)に示すように、それぞれ100、90、8
0、20、50、90であったとすると、この図8
(b)のように、この平均値(100+90+80+2
0+50+90)/6=71.7を代表値とする。
値としてもよい。すなわち、図8(a)に示すような帳
票の例で、認識項目がA〜Fのそれぞれの確からしさが
図8(b)に示すように、それぞれ100、90、8
0、20、50、90であったとすると、この図8
(b)のように、この平均値(100+90+80+2
0+50+90)/6=71.7を代表値とする。
【0018】最小値を代表値として認識結果修正の順番
を決める場合、同じ最小値をもつファイルが複数存在す
る時に、最小値が同じものについては、平均値を比較
し、平均値の小さいものをより代表値が低いとして認識
結果修正の順番を決定してもいい。例えば、N枚の帳票
を処理したと仮定する。その場合、N枚全ての代表値
(最小値)が異なれば間題ないが、当然、同じ値を持っ
ものが複数存在する場合がありうる。その場合は、その
同じ代表値のものをどのような基準で並べるかというこ
とになり、その場合に平均値の小さいものが、より代表
値が低いとして順番を決める。もし、最小値も平均値も
同じであれば、処理順に並べても良いし、別の情報を基
準にしても良い。
を決める場合、同じ最小値をもつファイルが複数存在す
る時に、最小値が同じものについては、平均値を比較
し、平均値の小さいものをより代表値が低いとして認識
結果修正の順番を決定してもいい。例えば、N枚の帳票
を処理したと仮定する。その場合、N枚全ての代表値
(最小値)が異なれば間題ないが、当然、同じ値を持っ
ものが複数存在する場合がありうる。その場合は、その
同じ代表値のものをどのような基準で並べるかというこ
とになり、その場合に平均値の小さいものが、より代表
値が低いとして順番を決める。もし、最小値も平均値も
同じであれば、処理順に並べても良いし、別の情報を基
準にしても良い。
【0019】また、平均値を代表値として認識結果修正
の順番を決める場合、同じ平均値をもつファイルが複数
存在する時に、平均値が同じものについては、最小値を
比較し、最小値の小さいものをより代表値が低いとして
認識結果修正の順番を決定してもいい。例えば、N枚の
帳票を処理したと仮定する。その場合、N枚全ての代表
値(平均値)が異なれば間題ないが、当然、同じ値を持
つものが複数存在する場合がありうる。その場合は、そ
の同じ代表値のものをどのような基準で並べるかという
ことになり、その場合に最小値の小さいものを、より代
表値が低いとして順番を決める。もし、平均値も最小値
も同じであれば、処理順に並べても良いし、別の情報を
基準にしても良い。
の順番を決める場合、同じ平均値をもつファイルが複数
存在する時に、平均値が同じものについては、最小値を
比較し、最小値の小さいものをより代表値が低いとして
認識結果修正の順番を決定してもいい。例えば、N枚の
帳票を処理したと仮定する。その場合、N枚全ての代表
値(平均値)が異なれば間題ないが、当然、同じ値を持
つものが複数存在する場合がありうる。その場合は、そ
の同じ代表値のものをどのような基準で並べるかという
ことになり、その場合に最小値の小さいものを、より代
表値が低いとして順番を決める。もし、平均値も最小値
も同じであれば、処理順に並べても良いし、別の情報を
基準にしても良い。
【0020】さらに、図9に示すように、代表値の推移
と現在修正している帳票の代表値との関係を表示し、ユ
ーザーに現在どのあたりを修正しているのか情報を提供
することで、修正作業の打ち切り時期の判断を容易にす
ることができる。この図を見れば、全体の中のどの程度
を処理したのか、どのあたりを処理しているのか、この
後どの程度修正し、どこで打ち切れば良いのかを把握す
ることができる。表示については、常に表示しても良い
し、メニュー等で指定したときのみ表示しても良い。
と現在修正している帳票の代表値との関係を表示し、ユ
ーザーに現在どのあたりを修正しているのか情報を提供
することで、修正作業の打ち切り時期の判断を容易にす
ることができる。この図を見れば、全体の中のどの程度
を処理したのか、どのあたりを処理しているのか、この
後どの程度修正し、どこで打ち切れば良いのかを把握す
ることができる。表示については、常に表示しても良い
し、メニュー等で指定したときのみ表示しても良い。
【0021】このようにすることによって、確からしさ
を表す代表値の小さい順に帳票を配列し、代表値が比較
的大きな帳票については認識結果の確認、修正を省略す
ることができるので、短い修正のための作業時間で効率
よく認識結果を修正することが可能な文字認識装置を実
現することができる。以上の文字認識装置について説明
したが、この文字認識装置に基づいて行われる文字認識
方法も本発明の対象とするものである。
を表す代表値の小さい順に帳票を配列し、代表値が比較
的大きな帳票については認識結果の確認、修正を省略す
ることができるので、短い修正のための作業時間で効率
よく認識結果を修正することが可能な文字認識装置を実
現することができる。以上の文字認識装置について説明
したが、この文字認識装置に基づいて行われる文字認識
方法も本発明の対象とするものである。
【0022】
【発明の効果】以上説明したように本発明の請求項1の
発明は、文字原稿の画像情報から文字を認識し処理する
文字認識装置において、文字原稿である帳票を画像情報
として入力する画像入力手段と、この画像入力手段によ
って入力された画像情報から文字を認識する文字認識手
段と、この文字認識手段により得られた文字認識結果の
確からしさの情報を求める確度演算手段と、文字認識手
段により得られた文字認識結果と確度演算手段がもとめ
た文字認識の確からしさの情報とを記憶する認識結果記
憶手段と、この認識結果記憶手段に記憶された各文字の
確からしさの情報から、その帳票の代表値を求める代表
値手段と、その代表値をもとに確からしさの情報の小さ
なものの順に認識結果修正の順番を決定する修正順序決
定手段とを具備することを特徴とする。これにより、確
からしさを表す代表値の小さい順に帳票を配列すること
ができ、代表値が比較的大きな帳票については認識結果
の確認、修正を省略することで、修正のための作業時間
を短くして、効率よく認識結果を修正することが可能な
文字認識装置を実現することができる。
発明は、文字原稿の画像情報から文字を認識し処理する
文字認識装置において、文字原稿である帳票を画像情報
として入力する画像入力手段と、この画像入力手段によ
って入力された画像情報から文字を認識する文字認識手
段と、この文字認識手段により得られた文字認識結果の
確からしさの情報を求める確度演算手段と、文字認識手
段により得られた文字認識結果と確度演算手段がもとめ
た文字認識の確からしさの情報とを記憶する認識結果記
憶手段と、この認識結果記憶手段に記憶された各文字の
確からしさの情報から、その帳票の代表値を求める代表
値手段と、その代表値をもとに確からしさの情報の小さ
なものの順に認識結果修正の順番を決定する修正順序決
定手段とを具備することを特徴とする。これにより、確
からしさを表す代表値の小さい順に帳票を配列すること
ができ、代表値が比較的大きな帳票については認識結果
の確認、修正を省略することで、修正のための作業時間
を短くして、効率よく認識結果を修正することが可能な
文字認識装置を実現することができる。
【0023】本発明の請求項2の発明は、代表値をその
帳票の各文字の確からしさの情報の最小値とすることを
特徴とする。本発明の請求項3の発明は、代表値をその
帳票の各文字の確からしさの情報の平均値とすることを
特徴とする。これらにより、代表値の具体的な決定方法
が決まり、簡単に代表値を求めることができる。
帳票の各文字の確からしさの情報の最小値とすることを
特徴とする。本発明の請求項3の発明は、代表値をその
帳票の各文字の確からしさの情報の平均値とすることを
特徴とする。これらにより、代表値の具体的な決定方法
が決まり、簡単に代表値を求めることができる。
【0024】本発明の請求項4の発明は、代表値である
最小値が同一である帳票が複数存在する場合には、その
最小値が同じ帳票については、修正順序決定手段はその
次に最小である値の小さなものの順に認識結果修正の順
番を決定することを特徴とする。本発明の請求項5の発
明は、代表値である最小値が同一である帳票が複数存在
する場合には、その最小値が同じ帳票については、修正
順序決定手段は平均値の小さなものの順に認識結果修正
の順番を決定することを特徴とする。本発明の請求項6
の発明は、代表値である平均値が同一である帳票が複数
存在する場合には、その平均値が同じ帳票については、
修正順序決定手段は最小値の小さなものの順に認識結果
修正の順番を決定することを特徴とする。これらによ
り、同一の代表値がある場合でも、認識結果修正の順番
を決定することができる。
最小値が同一である帳票が複数存在する場合には、その
最小値が同じ帳票については、修正順序決定手段はその
次に最小である値の小さなものの順に認識結果修正の順
番を決定することを特徴とする。本発明の請求項5の発
明は、代表値である最小値が同一である帳票が複数存在
する場合には、その最小値が同じ帳票については、修正
順序決定手段は平均値の小さなものの順に認識結果修正
の順番を決定することを特徴とする。本発明の請求項6
の発明は、代表値である平均値が同一である帳票が複数
存在する場合には、その平均値が同じ帳票については、
修正順序決定手段は最小値の小さなものの順に認識結果
修正の順番を決定することを特徴とする。これらによ
り、同一の代表値がある場合でも、認識結果修正の順番
を決定することができる。
【0025】本発明の請求項7の発明は、代表値の推移
と現在修正している帳票の代表値との関係を表示する表
示手段を有すことを特徴とする。これにより、作業者は
認識結果修正の順番と代表値の推移の関係を簡単に把握
することができ、認識結果の確認、修正を省略する位置
を容易に判断することができる。
と現在修正している帳票の代表値との関係を表示する表
示手段を有すことを特徴とする。これにより、作業者は
認識結果修正の順番と代表値の推移の関係を簡単に把握
することができ、認識結果の確認、修正を省略する位置
を容易に判断することができる。
【0026】本発明の請求項8の発明は、文字原稿の画
像情報から文字を認識する文字認識方法において、文字
原稿である帳票を画像情報として入力する画像入力過程
と、この画像入力過程によって入力された画像情報から
文字を認識する文字認識過程と、この文字認識過程によ
り得られた文字認識結果の確からしさの情報を求める確
度演算過程と、文字認識過程により得られた文字認識結
果と確度演算過程がもとめた文字認識の確からしさの情
報とを記憶する認識結果記憶過程と、この認識結果記憶
過程で記憶された各文字の確からしさの情報から、その
帳票の代表値を求める代表値選択過程と、この代表値選
択過程で求めた代表値をもとに確からしさの情報の小さ
なものの順に帳票の認識結果修正の順番を決定する修正
順序決定過程と、この修正順序決定過程できまった順に
したがって帳票の認識結果の確認や修正を行い、順序の
後の帳票については認識結果の確認や修正を省略するこ
とを特徴とする。これにより、確からしさを表す代表値
の小さい順に帳票を配列して、代表値が比較的大きな帳
票については認識結果の確認、修正を省略するようにし
て、修正のための作業時間を短くして、効率よく認識結
果を修正することができる。
像情報から文字を認識する文字認識方法において、文字
原稿である帳票を画像情報として入力する画像入力過程
と、この画像入力過程によって入力された画像情報から
文字を認識する文字認識過程と、この文字認識過程によ
り得られた文字認識結果の確からしさの情報を求める確
度演算過程と、文字認識過程により得られた文字認識結
果と確度演算過程がもとめた文字認識の確からしさの情
報とを記憶する認識結果記憶過程と、この認識結果記憶
過程で記憶された各文字の確からしさの情報から、その
帳票の代表値を求める代表値選択過程と、この代表値選
択過程で求めた代表値をもとに確からしさの情報の小さ
なものの順に帳票の認識結果修正の順番を決定する修正
順序決定過程と、この修正順序決定過程できまった順に
したがって帳票の認識結果の確認や修正を行い、順序の
後の帳票については認識結果の確認や修正を省略するこ
とを特徴とする。これにより、確からしさを表す代表値
の小さい順に帳票を配列して、代表値が比較的大きな帳
票については認識結果の確認、修正を省略するようにし
て、修正のための作業時間を短くして、効率よく認識結
果を修正することができる。
【図1】本発明の文字認識装置の構成を示すブロック
図。
図。
【図2】N枚の帳票を処理する場合の処理イメージを示
す図。
す図。
【図3】確からしさの代表値によって認識結果ファイル
の順番がソーティングされているN枚の帳票を処理する
場合の処理イメージを示す図。
の順番がソーティングされているN枚の帳票を処理する
場合の処理イメージを示す図。
【図4】代表値によってソーティングされたファイルで
の原稿順序と代表値および修正作業の負荷の関係を示す
図。
の原稿順序と代表値および修正作業の負荷の関係を示す
図。
【図5】本発明の認識結果の修正作業のフローチャー
ト。
ト。
【図6】代表値を最小値とした場合の処理内容を示す説
明図。
明図。
【図7】最小値を求める処理のフローチャート。
【図8】代表値を平均値とした場合の処理内容を示す説
明図。
明図。
【図9】代表値の推移と現在修正している帳票の代表値
との関係を表示する図。
との関係を表示する図。
1 スキャナー 2 中央演算処理装置 3 OCR格納ROMまたはRAM 4 ディスプレイ 5 メモリ 6 辞書 7 ワークエリアRAM 8 CD−ROMまたはFDドライブ
Claims (8)
- 【請求項1】 文字原稿の画像情報から文字を認識し処
理する文字認識装置において、 文字原稿である帳票を画像情報として入力する画像入力
手段と、 この画像入力手段によって入力された画像情報から文字
を認識する文字認識手段と、 この文字認識手段により得られた文字認識結果の確から
しさの情報を求める確度演算手段と、 前記文字認識手段により得られた文字認識結果と前記確
度演算手段がもとめた文字認識の確からしさの情報とを
記憶する認識結果記憶手段と、 この認識結果記憶手段に記憶された各文字の確からしさ
の情報から、その帳票の代表値を求める代表値手段と、 この代表値手段が求めた代表値をもとに確からしさの情
報の小さなものの順に前記帳票の認識結果修正の順番を
決定する修正順序決定手段とを具備することを特徴とす
る文字認識装置。 - 【請求項2】 前記代表値をその帳票の各文字の確から
しさの情報の最小値とすることを特徴とする請求項1に
記載の文字認識装置。 - 【請求項3】 前記代表値をその帳票の各文字の確から
しさの情報の平均値とすることを特徴とする請求項1に
記載の文字認識装置。 - 【請求項4】 代表値である最小値が同一である帳票が
複数存在する場合は、その最小値が同じ帳票について
は、前記修正順序決定手段はその次に最小である値の小
さなものの順に認識結果修正の順番を決定することを特
徴とする請求項2に記載の文字認識装置。 - 【請求項5】 代表値である最小値が同一である帳票が
複数存在する場合は、その最小値が同じ帳票について
は、前記修正順序決定手段は平均値の小さなものの順に
認識結果修正の順番を決定することを特徴とする請求項
2に記載の文字認識装置。 - 【請求項6】 代表値である平均値が同一である帳票が
複数存在する場合は、その平均値が同じ帳票について
は、前記修正順序決定手段は最小値の小さなものの順に
認識結果修正の順番を決定することを特徴とする請求項
3に記載の文字認識装置。 - 【請求項7】 代表値の推移と現在修正している帳票の
代表値との関係を表示する表示手段を有すことを特徴と
する請求項1に記載の文字認識装置。 - 【請求項8】 文字原稿の画像情報から文字を認識する
文字認識方法において、 文字原稿である帳票を画像情報として入力する画像入力
過程と、 この画像入力過程によって入力された画像情報から文字
を認識する文字認識過程と、 この文字認識過程により得られた文字認識結果の確から
しさの情報を求める確度演算過程と、 前記文字認識過程により得られた文字認識結果と前記確
度演算過程がもとめた文字認識の確からしさの情報とを
記憶する認識結果記憶過程と、 この認識結果記憶過程で記憶された各文字の確からしさ
の情報から、その帳票の代表値を求める代表値選択過程
と、 この代表値選択過程で求めた代表値をもとに確からしさ
の情報の小さなものの順に前記帳票の認識結果修正の順
番を決定する修正順序決定過程と、 この修正順序決定過程できまった順にしたがって前記帳
票の認識結果の確認や修正を行い、順序の後の帳票につ
いては認識結果の確認や修正を省略することを特徴とす
る文字認識方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2000076507A JP2001266066A (ja) | 2000-03-17 | 2000-03-17 | 文字認識装置および文字認識方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2000076507A JP2001266066A (ja) | 2000-03-17 | 2000-03-17 | 文字認識装置および文字認識方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2001266066A true JP2001266066A (ja) | 2001-09-28 |
Family
ID=18594234
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2000076507A Withdrawn JP2001266066A (ja) | 2000-03-17 | 2000-03-17 | 文字認識装置および文字認識方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2001266066A (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
ES2208126A1 (es) * | 2002-11-19 | 2004-06-01 | Jose Rivera Len | Sistema de reconocimiento comparativo de caracteres impresos sobre soportes fisicos. |
WO2004047031A1 (es) * | 2002-11-19 | 2004-06-03 | Rivera Len Jose | Sistema de reconocimiento comparativo de caracteres impresos sobre soportes físicos |
-
2000
- 2000-03-17 JP JP2000076507A patent/JP2001266066A/ja not_active Withdrawn
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
ES2208126A1 (es) * | 2002-11-19 | 2004-06-01 | Jose Rivera Len | Sistema de reconocimiento comparativo de caracteres impresos sobre soportes fisicos. |
WO2004047031A1 (es) * | 2002-11-19 | 2004-06-03 | Rivera Len Jose | Sistema de reconocimiento comparativo de caracteres impresos sobre soportes físicos |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8503784B2 (en) | Image recognition apparatus, image recognition method, and storage medium recording image recognition program | |
JP5262869B2 (ja) | 画像処理システム、画像処理サーバ、mfp及び画像処理方法 | |
US7240062B2 (en) | System and method for creating a searchable word index of a scanned document including multiple interpretations of a word at a given document location | |
JP4553241B2 (ja) | 文字方向識別装置、文書処理装置及びプログラム並びに記憶媒体 | |
JPH1139428A (ja) | 文書映像の方向修正方法 | |
JP4661921B2 (ja) | 文書処理装置およびプログラム | |
JPH10105655A (ja) | 光学文字認識のための検証および訂正の方法およびシステム | |
US10706581B2 (en) | Image processing apparatus for clipping and sorting images from read image according to cards and control method therefor | |
JP2010061471A (ja) | 文字認識装置およびプログラム | |
US20010043742A1 (en) | Communication document detector | |
JP2001266066A (ja) | 文字認識装置および文字認識方法 | |
JP6624120B2 (ja) | 文字認識装置、文字認識方法、文字認識プログラム、及び文字認識プログラムを記録したコンピューター読み取り可能な記録媒体 | |
JP2020087112A (ja) | 帳票処理装置および帳票処理方法 | |
US11657632B2 (en) | Image processing device, image reading device, image processing method, and non-transitory computer readable medium, using two pieces of image data | |
JPH06103411A (ja) | 文書読取装置 | |
JP2003030654A (ja) | パターン識別装置、パターン識別方法及びパターン識別用プログラム | |
JP5251652B2 (ja) | 帳票イメージファイリングシステム | |
JP3917322B2 (ja) | 文字認識装置 | |
JP4299977B2 (ja) | 認識結果修正装置、認識結果修正方法および記録媒体 | |
JP5381225B2 (ja) | 情報処理装置およびプログラム | |
JPH11213087A (ja) | 文字認識装置 | |
JPH10302025A (ja) | 手書き文字認識装置およびそのプログラム記録媒体 | |
KR20050054713A (ko) | 문자 군집화 기술 기반 문서의 디지털화 검증 시스템 및방법 | |
JP3620299B2 (ja) | 文書ファイリング装置及び文書ファイリング方法 | |
JP4089807B2 (ja) | バーコード認識方法および装置並びにプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20050121 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20050208 |
|
A761 | Written withdrawal of application |
Free format text: JAPANESE INTERMEDIATE CODE: A761 Effective date: 20070914 |