JP2004013704A - 文字認識処理における原稿方向判別方法 - Google Patents
文字認識処理における原稿方向判別方法 Download PDFInfo
- Publication number
- JP2004013704A JP2004013704A JP2002168897A JP2002168897A JP2004013704A JP 2004013704 A JP2004013704 A JP 2004013704A JP 2002168897 A JP2002168897 A JP 2002168897A JP 2002168897 A JP2002168897 A JP 2002168897A JP 2004013704 A JP2004013704 A JP 2004013704A
- Authority
- JP
- Japan
- Prior art keywords
- reliability determination
- determination value
- document
- character recognition
- reliability
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Abstract
【課題】文字認識処理において、迅速かつ正確に原稿方向の判別をする。
【解決手段】原稿画像(a)に対して文字認識して信頼度判定値1を算出し、信頼度判定値1がしきい値よりも低ければ、入力された原稿画像を90°回転させた原稿画像(b)に対して文字認識して信頼度判定値2を算出し、信頼度判定値2がしきい値よりも低ければ、信頼度判定値1と信頼度判定値2のうち高いほうの信頼度判定値に対応する角度からさらに180°回転させた原稿画像(c)又は(e)に対して文字認識して信頼度判定値3を算出し、信頼度判定値3がしきい値よりも低ければ、直交4方向のうち、まだ信頼度判定をしていない方向の原稿画像(b)又は(f)に対して文字認識して信頼度判定値4を算出し、信頼度判定値4がしきい値よりも高ければ、その方向を原稿方向として確定する。
【選択図】 図4
【解決手段】原稿画像(a)に対して文字認識して信頼度判定値1を算出し、信頼度判定値1がしきい値よりも低ければ、入力された原稿画像を90°回転させた原稿画像(b)に対して文字認識して信頼度判定値2を算出し、信頼度判定値2がしきい値よりも低ければ、信頼度判定値1と信頼度判定値2のうち高いほうの信頼度判定値に対応する角度からさらに180°回転させた原稿画像(c)又は(e)に対して文字認識して信頼度判定値3を算出し、信頼度判定値3がしきい値よりも低ければ、直交4方向のうち、まだ信頼度判定をしていない方向の原稿画像(b)又は(f)に対して文字認識して信頼度判定値4を算出し、信頼度判定値4がしきい値よりも高ければ、その方向を原稿方向として確定する。
【選択図】 図4
Description
【0001】
【発明の属する技術分野】
本発明は、スキャナ(光学文字読取装置)により原稿画像を読み取って文字認識処理をする場合に、原稿方向を自動的に判別することができる原稿方向判別方法に関するものである。
【0002】
【従来の技術】
従来、スキャナにより原稿画像を読み取って、その中の文字を認識することが行われている。
文字認識は、あくまで文字が正しい方向を向いていることが前提なので、原稿画像が間違った方向を向いていないかどうかをチェックする処理が必要である。そこで、読み取った原稿画像データを、メモリ上で90°,180°,270°回転させて、それぞれの回転画像に対して、文字認識をし、各方向における文字認識精度の一番高かった方向を正しい方向とする原稿方向判別方法が提案されている。
【0003】
【発明が解決しようとする課題】
ところが、前記方法では、原稿画像データを回転させる順番が、図5に示すように固定されているので、当然、正解の方向の認識が、不正解の方向の認識よりも後になることがある。
原稿画像データを回転させて文字認識していく過程で、正解である確率の高い方向が推定できれば、それ以外の方向における文字認識を後回しにすることができ、認識回数の軽減、文字認識速度の向上に結びつく。
【0004】
そこで、本発明は、文字認識処理において、迅速かつ正確に原稿方向の判別をすることができる原稿方向判別方法を提供することを目的とする。
【0005】
【課題を解決するための手段及び発明の効果】
本発明の文字認識処理における原稿方向判別方法は、原稿画像を入力し、原稿画像の一部又は全部に対して文字認識して信頼度判定値1を算出し、信頼度判定値1がしきい値よりも高ければ、その方向を原稿方向として確定し、信頼度判定値1がしきい値よりも低ければ、入力された原稿画像を90°回転させて原稿画像の一部又は全部に対して文字認識して信頼度判定値2を算出し、信頼度判定値2がしきい値よりも高ければ、その方向を原稿方向として確定し、信頼度判定値2がしきい値よりも低ければ、信頼度判定値1と信頼度判定値2のうち高いほうの信頼度判定値に対応する角度からさらに180°回転させて原稿画像の一部又は全部に対して文字認識して信頼度判定値3を算出し、信頼度判定値3がしきい値よりも高ければ、その方向を原稿方向として確定し、信頼度判定値3がしきい値よりも低ければ、直交4方向のうち、まだ信頼度判定をしていない方向について原稿画像の一部又は全部に対して文字認識して信頼度判定値4を算出し、信頼度判定値4がしきい値よりも高ければ、その方向を原稿方向として確定することを特徴とする(請求項1)。
【0006】
この方法よれば、原稿画像を0°で文字認識して信頼度判定値1を算出し、信頼度判定値1がしきい値よりも低ければ、90°で文字認識して信頼度判定値2を算出し、信頼度判定値2もしきい値より低ければ、信頼度判定値1,2のうち大きいものに対応する方向から180°回転させて信頼度判定値3を算出している。この180°回転により、0°及び90°で原稿画像の正しい方向が得られない場合に、原稿画像の正しい方向が得られる確率が高くなる。これは実験的に証明できることであり、実験結果を実施例に示す。もし、前記180°回転によって正しい方向が得られない場合にのみ、直交4方向のうち、まだ信頼度判定をしていない方向について文字認識する。
【0007】
したがって、0°及び90°で原稿画像の正しい方向が得られない場合に、信頼度判定値3を得る過程で、正解である確率の高い方向について、先に文字認識できるので、認識回数を軽減でき、文字認識速度の向上を達成することができる。
前記請求項1記載の原稿方向判別方法は、信頼度判定値1を算出し、信頼度判定値1がしきい値よりも高ければ、その方向を原稿方向として確定し、信頼度判定値1がしきい値よりも低ければ、入力された原稿画像を90°回転させて信頼度判定値2を算出するステップに進んでいるが、信頼度判定値1と信頼度判定値2とをまず算出し、信頼度判定値1又は信頼度判定値2のいずれかがしきい値よりも高ければ、その高い方向を原稿方向として確定し、信頼度判定値1,2のいずれもがしきい値よりも低ければ、信頼度判定値1と信頼度判定値2のうち高いほうの信頼度判定値に対応する角度からさらに180°回転させて原稿画像の一部又は全部に対して文字認識して信頼度判定値3を算出し、信頼度判定値3がしきい値よりも高ければ、その方向を原稿方向として確定し、信頼度判定値3がしきい値よりも低ければ、直交4方向のうち、まだ信頼度判定をしていない方向について原稿画像の一部又は全部に対して文字認識して信頼度判定値4を算出し、信頼度判定値4がしきい値よりも高ければ、その方向を原稿方向として確定するという原稿方向判別方法も想定できる(請求項2)。
【0008】
この方法よれば、原稿画像を0°及び90°で文字認識し、信頼度判定値1と信頼度判定値2を算出し、いずれもしきい値より低ければ、信頼度判定値1,2のうち大きいものに対応する方向から180°回転させる。これにより、請求項1記載の方法と同様、0°及び90°で原稿画像の正しい方向が得られない場合に、信頼度判定値3を得る過程で、原稿画像の正しい方向が得られる確率が高くなる。もし、前記180°回転によって正しい方向が得られない場合にのみ、直交4方向のうち、まだ信頼度判定をしていない方向について文字認識する。
【0009】
したがって、請求項1記載の方法と同様、0°及び90°で原稿画像の正しい方向が得られない場合に、正解である確率の高い方向について、先に文字認識できるので、認識回数を軽減でき、文字認識速度の向上を達成することができる。また、本発明の文字認識処理における原稿方向判別方法は、原稿画像の一部又は全部に対して文字認識して信頼度判定値1を算出し、入力された原稿画像を90°回転させて原稿画像の一部又は全部に対して文字認識して信頼度判定値2を算出し、信頼度判定値1と信頼度判定値2のうち高いほうの信頼度判定値に対応する角度からさらに180°回転させて原稿画像の一部又は全部に対して文字認識して信頼度判定値3を算出し、信頼度判定値1、信頼度判定値2又は信頼度判定値3がしきい値よりも高ければ、その高い方向を原稿方向として確定し、 信頼度判定値1,2,3のいずれもがしきい値よりも低ければ、直交4方向のうち、まだ信頼度判定をしていない方向について原稿画像の一部又は全部に対して文字認識して信頼度判定値4を算出し、信頼度判定値4がしきい値よりも高ければ、その方向を原稿方向として確定する方法である(請求項3)。
【0010】
この方法よれば、原稿画像を0°及び90°で文字認識して信頼度判定値1と信頼度判定値2を算出し、同時に、信頼度判定値1,2のうち大きいものに対応する方向から180°回転させて、信頼度判定値3を算出する。これにより、請求項1記載の方法と同様、0°及び90°で原稿画像の正しい方向が得られない場合でも、信頼度判定値3を得る過程で、原稿画像の正しい方向が得られる確率が高くなる。もし、前記180°回転によって正しい方向が得られない場合にのみ、直交4方向のうち、まだ信頼度判定をしていない方向について文字認識する。
【0011】
したがって、請求項1,2記載の方法と同様、0°及び90°で原稿画像の正しい方向が得られない場合に、正解である確率の高い方向について、先に文字認識できるので、認識回数を軽減でき、文字認識速度の向上を達成することができる。
信頼度判定値4がしきい値よりも低かった場合、信頼度判定値がもっとも高い原稿方向を確定するとよい(請求項4)。またこれ以外に、原稿方向判定不能との結果を出してもよい。
【0012】
前記信頼度判定値の算出において、認識した対称な文字や記号を除外して信頼度判定値を算出することが望ましい(請求項5)。これにより、正しい方向と正しくない方向との信頼度判定値の差が顕著に表れるので、正しい原稿方向を判定しやすくなる。
原稿画像の一部に対して文字認識する場合に、原稿に含まれる1又は複数の文字領域を抽出し、一番大きな文字領域の中の文字から文字認識を始めることが望ましい(請求項6)。文字領域の大きい方から認識することにより、一度の認識処理で多くの認識結果が得られ、領域の切替え処理が減る。
【0013】
また、原稿画像の一部に対して文字認識する場合に、回転のたびに、原稿に含まれる1又は複数の文字領域を抽出することが望ましい(請求項7)。回転のたびに文字領域を抽出することで、原稿の属性が縦書き、横書きのいずれの場合にも、正しい文字領域の抽出が行え、文字認識の精度が高くなるからである。
【0014】
【発明の実施の形態】
以下、本発明の実施の形態を、添付図面を参照しながら詳細に説明する。
図1は、本発明の原稿方向判別方法を実施するための文字認識装置1の機能ブロック図である。
文字認識装置1は、原稿画像を光学的に読み取るスキャナに接続されている。文字認識装置1は、CPU、RAM、ハードディスクなどから構成され、その文字認識処理は、RAMやハードディスクなどに記録された所定のプログラムを、CPUが実行することにより実現される。
【0015】
図1に沿って概略説明すると、スキャナから入力された原稿画像は、画像回転部2によってメモリ上で所定角回転させられる。レイアウト解析部3は、回転後の画像に基づいて、原稿画像に含まれる文字のかたまり(領域という)を検出する。文字切出し・認識部4は、領域中の1つ1つの文字を認識する。信頼度算出部5は、文字認識の信頼度を算出する。この信頼度に応じて、原稿画像が再度回転され、レイアウト解析、文字認識処理が繰り返される。そして、回転によりもっとも信頼度の高い原稿方向が出力され、その方向での認識結果が出力される。
【0016】
図2は、本発明の原稿方向判別方法を説明するためのフローチャートである。まず、スキャナから原稿画像が入力されると(ステップS1)、その原稿画像データは、RAMなどのメモリに蓄積される。つぎに、今までの回転回数を調べ(ステップS2)、回転回数が3以下であれば、レイアウト解析処理に進む(ステップS3)。その結果、文字領域が検出されれば(ステップS4のYES)、一番面積の大きな文字領域に対して文字認識を開始する(ステップS5)。文字領域が検出されなければ処理を終了する。
【0017】
この文字認識処理は、種々のアルゴリズムが考案されているが、例えば次のようなものを採用できる。文字領域の中の各文字を切出し、それぞれの文字を複数の小領域に分割する。各小領域において、白黒画素の境界の方向別(例えば0°,45°,90°,135°)のヒストグラムをとる。このヒストグラムを、辞書のヒストグラムと比較することによって、もっとも類似する文字を選択し、これを認識文字とする。
【0018】
一方、信頼度を算出する条件となる上限文字数(例えば100文字)と、上限領域数(例えば3)とを設定しておく。
前記認識した文字数が上限文字数に達していれば(ステップS6)、信頼度を算出する(ステップS9)。上限文字数に達していなければ、次に面積の大きな領域に対して文字認識を行う(ステップS8)。このようにして、上限文字数に達するまで、領域数を広げて文字認識をつづける。上限文字数に達しないうちに上限領域数に達すれば(ステップS7)、そこで文字認識を打ち切り、信頼度を算出する(ステップS9)。
【0019】
ステップS5では、一番大きな文字領域から文字認識を行うことで、領域を切り替えなくても、一度の処理で多くの文字を認識できることとなり、処理の高速化が図れる。また、大きな領域は、小さな領域に比べ、ノイズ領域である可能性が低いと考えられるので、より制度の高い認識結果が得られる。
信頼度は、認識した文字の信頼度の総和を、認識した文字数で割った平均値とする。ここで「文字の信頼度」とは、文字認識の確からしさのことをいう。例えば、認識した文字と辞書の文字とを比較したときの類似の度合いを、0から255までの数値で表したものである。
【0020】
この信頼度を算出する場合、文字の中にアルファベットの「I」「O」など上下左右対称な文字、アルファベットの「b」「q」など上下対称な文字が含まれ、又は「−」「●」、スペースなど上下左右対称な記号が含まれるとき、その文字・記号は、「認識した文字」の中に含めないことが望ましい。このことによって、算出する信頼度の差を、より顕著にすることができて、原稿方向を正確に確定することができる。
【0021】
信頼度がしきい値以上あるかどうか判定し(ステップS10)、しきい値以上あれば、その原稿方向を確定する(ステップS11)。この場合は、画像を回転させるステップS12には入らない。そして、この確定された原稿方向において、すべての領域の文字に対して文字認識処理を行い、その結果を出力する(ステップS14)。
なお、前記しきい値は、文字認識装置1で多くの原稿を読み取って、試行錯誤により適切な値に定めるとよい。
【0022】
信頼度がしきい値以上なければ、画像を回転させる(ステップS12)。この回転方法は後に説明する。
つぎに、今までの回転回数を調べ(ステップS2)、回転回数が3を超えていれば(つまり0°,90°,180°,270°の4方向について文字認識処理が終わっていれば)、信頼度が最大となる方向を原稿方向として確定する(ステップS13)。そして、この確定された原稿方向において、すべての領域の文字に対して文字認識処理を行い、その結果を出力する(ステップS14)。
【0023】
回転回数が3以下であるときは、その回転方向に対して、前記レイアウト解析、文字認識、信頼度の算出を繰り返す。回転のたびにレイアウト解析による文字領域の抽出を行うことで、確かな領域の縦書き横書きの属性が得られ、認識結果の精度が高くなる。
ここで、画像を回転させるステップS12の内容を詳しく説明する。
図3は、ステップS12の内容を説明するための詳細フローチャートである。図4は、時間を追って原稿が回転される様子を説明するための図解図である。現行の向きは白抜き矢印で示している。
【0024】
まず、いままでの回転回数が0の場合(ステップS12−1、図4(a))、原稿を右に90°回転させる(ステップS12−6、図4(b))。そして、回転回数を1プラスする(ステップS12−8)。
回転回数が1の場合(ステップS12−2、図4(b) )、回転角が0°の時の信頼度と、回転角が90°の時の信頼度とを比較する。
(回転角が0°の時の信頼度)>(回転角が90°の時の信頼度)
であれば、原稿をさらに右に90°回転させる(ステップS12−6、図4(c))。そして、回転回数を1プラスする(ステップS12−8)。
【0025】
(回転角が0°の時の信頼度)≦(回転角が90°の時の信頼度)
であれば、原稿を180°回転させる(ステップS12−5、図4(e))。そして、回転回数を1プラスする(ステップS12−8)。
ここで、回転角が0°の時の信頼度と、回転角が90°の時の信頼度との比較結果に応じて、原稿方向の回転角度を変える理由を、実施例を用いて説明する。
【0026】
【実施例】
表1は、8種類の原稿について、正しい方向から右90°又は180度回転させて、文字認識を試みた例を示す。この正しい方向から右90°又は180度回転させた状態を基準方向0°とする。
【0027】
【表1】
【0028】
基準方向0°での信頼度判定値1と、それから90°回転させたときの信頼度判定値2とを算出した。いずれも正しい方向でないので、信頼度判定値は低くなっている。
そして、0°又は90°のうち、信頼度の高い方の方向に対して180°回転させたときの信頼度判定値3と、残りの回転角度に対する信頼度判定値4とを算出した。
【0029】
いずれの原稿も、信頼度の高い方の方向に対して180°回転させたときの信頼度判定値3のほうが、残りの回転角度に対する信頼度判定値4よりも高くなっている。
したがって、基準方向0°での信頼度判定値1と、それから90°回転させたときの信頼度判定値2とを算出して、いずれも信頼度判定値が低く出た場合、信頼度の高い方の方向に対して180°回転させたほうが、正しい原稿方向が早く得られる可能性が高いといえる。
【0030】
以上で、本発明の実施の形態を説明したが、本発明の実施は、前記の形態に限定されるものではない。例えば、前記の実施形態では、回転回数が0の時点で文字認識して信頼度判定値1を求め、信頼度判定値1がしきい値以上あれば、原稿方向を確定していた(ステップS10→S11)。しかし、回転回数が0の時点ではまだ信頼度判定値1をしきい値と比較せずに記憶し、さらに90°回転させて信頼度判定値2を求めた時点で、記憶した信頼度判定値1及び信頼度判定値2をしきい値とそれぞれ比較し、いずれもしきい値より低い場合に、次の2回目の回転に移るという実施も可能である。また、信頼度判定値1と信頼度判定値2を求めて記憶し、さらに信頼度判定値1と信頼度判定値2のうち高いほうの信頼度判定値に対応する角度からさらに180°回転させて信頼度判定値3を求め、この時点で、記憶した信頼度判定値1,2及び信頼度判定値3をしきい値とそれぞれ比較し、いずれもしきい値より低い場合に、次の3回目の回転に移るという実施も可能である。その他、本発明の範囲内で種々の変更を施すことが可能である。
【図面の簡単な説明】
【図1】本発明の文字認識方法を実施する文字認識装置1の機能ブロック図である。
【図2】文字認識処理の流れを説明するためのフローチャートである。
【図3】ステップS12の画像を回転する詳細手順を説明するための詳細フローチャートである。
【図4】時間を追って原稿画像が回転される様子を説明するための図解図である。
【図5】従来の、原稿画像が回転される様子を説明するための図解図である。
【符号の説明】
1 文字認識装置
2 画像回転部
3 レイアウト解析部
4 文字切出し・認識部
5 信頼度算出部
【発明の属する技術分野】
本発明は、スキャナ(光学文字読取装置)により原稿画像を読み取って文字認識処理をする場合に、原稿方向を自動的に判別することができる原稿方向判別方法に関するものである。
【0002】
【従来の技術】
従来、スキャナにより原稿画像を読み取って、その中の文字を認識することが行われている。
文字認識は、あくまで文字が正しい方向を向いていることが前提なので、原稿画像が間違った方向を向いていないかどうかをチェックする処理が必要である。そこで、読み取った原稿画像データを、メモリ上で90°,180°,270°回転させて、それぞれの回転画像に対して、文字認識をし、各方向における文字認識精度の一番高かった方向を正しい方向とする原稿方向判別方法が提案されている。
【0003】
【発明が解決しようとする課題】
ところが、前記方法では、原稿画像データを回転させる順番が、図5に示すように固定されているので、当然、正解の方向の認識が、不正解の方向の認識よりも後になることがある。
原稿画像データを回転させて文字認識していく過程で、正解である確率の高い方向が推定できれば、それ以外の方向における文字認識を後回しにすることができ、認識回数の軽減、文字認識速度の向上に結びつく。
【0004】
そこで、本発明は、文字認識処理において、迅速かつ正確に原稿方向の判別をすることができる原稿方向判別方法を提供することを目的とする。
【0005】
【課題を解決するための手段及び発明の効果】
本発明の文字認識処理における原稿方向判別方法は、原稿画像を入力し、原稿画像の一部又は全部に対して文字認識して信頼度判定値1を算出し、信頼度判定値1がしきい値よりも高ければ、その方向を原稿方向として確定し、信頼度判定値1がしきい値よりも低ければ、入力された原稿画像を90°回転させて原稿画像の一部又は全部に対して文字認識して信頼度判定値2を算出し、信頼度判定値2がしきい値よりも高ければ、その方向を原稿方向として確定し、信頼度判定値2がしきい値よりも低ければ、信頼度判定値1と信頼度判定値2のうち高いほうの信頼度判定値に対応する角度からさらに180°回転させて原稿画像の一部又は全部に対して文字認識して信頼度判定値3を算出し、信頼度判定値3がしきい値よりも高ければ、その方向を原稿方向として確定し、信頼度判定値3がしきい値よりも低ければ、直交4方向のうち、まだ信頼度判定をしていない方向について原稿画像の一部又は全部に対して文字認識して信頼度判定値4を算出し、信頼度判定値4がしきい値よりも高ければ、その方向を原稿方向として確定することを特徴とする(請求項1)。
【0006】
この方法よれば、原稿画像を0°で文字認識して信頼度判定値1を算出し、信頼度判定値1がしきい値よりも低ければ、90°で文字認識して信頼度判定値2を算出し、信頼度判定値2もしきい値より低ければ、信頼度判定値1,2のうち大きいものに対応する方向から180°回転させて信頼度判定値3を算出している。この180°回転により、0°及び90°で原稿画像の正しい方向が得られない場合に、原稿画像の正しい方向が得られる確率が高くなる。これは実験的に証明できることであり、実験結果を実施例に示す。もし、前記180°回転によって正しい方向が得られない場合にのみ、直交4方向のうち、まだ信頼度判定をしていない方向について文字認識する。
【0007】
したがって、0°及び90°で原稿画像の正しい方向が得られない場合に、信頼度判定値3を得る過程で、正解である確率の高い方向について、先に文字認識できるので、認識回数を軽減でき、文字認識速度の向上を達成することができる。
前記請求項1記載の原稿方向判別方法は、信頼度判定値1を算出し、信頼度判定値1がしきい値よりも高ければ、その方向を原稿方向として確定し、信頼度判定値1がしきい値よりも低ければ、入力された原稿画像を90°回転させて信頼度判定値2を算出するステップに進んでいるが、信頼度判定値1と信頼度判定値2とをまず算出し、信頼度判定値1又は信頼度判定値2のいずれかがしきい値よりも高ければ、その高い方向を原稿方向として確定し、信頼度判定値1,2のいずれもがしきい値よりも低ければ、信頼度判定値1と信頼度判定値2のうち高いほうの信頼度判定値に対応する角度からさらに180°回転させて原稿画像の一部又は全部に対して文字認識して信頼度判定値3を算出し、信頼度判定値3がしきい値よりも高ければ、その方向を原稿方向として確定し、信頼度判定値3がしきい値よりも低ければ、直交4方向のうち、まだ信頼度判定をしていない方向について原稿画像の一部又は全部に対して文字認識して信頼度判定値4を算出し、信頼度判定値4がしきい値よりも高ければ、その方向を原稿方向として確定するという原稿方向判別方法も想定できる(請求項2)。
【0008】
この方法よれば、原稿画像を0°及び90°で文字認識し、信頼度判定値1と信頼度判定値2を算出し、いずれもしきい値より低ければ、信頼度判定値1,2のうち大きいものに対応する方向から180°回転させる。これにより、請求項1記載の方法と同様、0°及び90°で原稿画像の正しい方向が得られない場合に、信頼度判定値3を得る過程で、原稿画像の正しい方向が得られる確率が高くなる。もし、前記180°回転によって正しい方向が得られない場合にのみ、直交4方向のうち、まだ信頼度判定をしていない方向について文字認識する。
【0009】
したがって、請求項1記載の方法と同様、0°及び90°で原稿画像の正しい方向が得られない場合に、正解である確率の高い方向について、先に文字認識できるので、認識回数を軽減でき、文字認識速度の向上を達成することができる。また、本発明の文字認識処理における原稿方向判別方法は、原稿画像の一部又は全部に対して文字認識して信頼度判定値1を算出し、入力された原稿画像を90°回転させて原稿画像の一部又は全部に対して文字認識して信頼度判定値2を算出し、信頼度判定値1と信頼度判定値2のうち高いほうの信頼度判定値に対応する角度からさらに180°回転させて原稿画像の一部又は全部に対して文字認識して信頼度判定値3を算出し、信頼度判定値1、信頼度判定値2又は信頼度判定値3がしきい値よりも高ければ、その高い方向を原稿方向として確定し、 信頼度判定値1,2,3のいずれもがしきい値よりも低ければ、直交4方向のうち、まだ信頼度判定をしていない方向について原稿画像の一部又は全部に対して文字認識して信頼度判定値4を算出し、信頼度判定値4がしきい値よりも高ければ、その方向を原稿方向として確定する方法である(請求項3)。
【0010】
この方法よれば、原稿画像を0°及び90°で文字認識して信頼度判定値1と信頼度判定値2を算出し、同時に、信頼度判定値1,2のうち大きいものに対応する方向から180°回転させて、信頼度判定値3を算出する。これにより、請求項1記載の方法と同様、0°及び90°で原稿画像の正しい方向が得られない場合でも、信頼度判定値3を得る過程で、原稿画像の正しい方向が得られる確率が高くなる。もし、前記180°回転によって正しい方向が得られない場合にのみ、直交4方向のうち、まだ信頼度判定をしていない方向について文字認識する。
【0011】
したがって、請求項1,2記載の方法と同様、0°及び90°で原稿画像の正しい方向が得られない場合に、正解である確率の高い方向について、先に文字認識できるので、認識回数を軽減でき、文字認識速度の向上を達成することができる。
信頼度判定値4がしきい値よりも低かった場合、信頼度判定値がもっとも高い原稿方向を確定するとよい(請求項4)。またこれ以外に、原稿方向判定不能との結果を出してもよい。
【0012】
前記信頼度判定値の算出において、認識した対称な文字や記号を除外して信頼度判定値を算出することが望ましい(請求項5)。これにより、正しい方向と正しくない方向との信頼度判定値の差が顕著に表れるので、正しい原稿方向を判定しやすくなる。
原稿画像の一部に対して文字認識する場合に、原稿に含まれる1又は複数の文字領域を抽出し、一番大きな文字領域の中の文字から文字認識を始めることが望ましい(請求項6)。文字領域の大きい方から認識することにより、一度の認識処理で多くの認識結果が得られ、領域の切替え処理が減る。
【0013】
また、原稿画像の一部に対して文字認識する場合に、回転のたびに、原稿に含まれる1又は複数の文字領域を抽出することが望ましい(請求項7)。回転のたびに文字領域を抽出することで、原稿の属性が縦書き、横書きのいずれの場合にも、正しい文字領域の抽出が行え、文字認識の精度が高くなるからである。
【0014】
【発明の実施の形態】
以下、本発明の実施の形態を、添付図面を参照しながら詳細に説明する。
図1は、本発明の原稿方向判別方法を実施するための文字認識装置1の機能ブロック図である。
文字認識装置1は、原稿画像を光学的に読み取るスキャナに接続されている。文字認識装置1は、CPU、RAM、ハードディスクなどから構成され、その文字認識処理は、RAMやハードディスクなどに記録された所定のプログラムを、CPUが実行することにより実現される。
【0015】
図1に沿って概略説明すると、スキャナから入力された原稿画像は、画像回転部2によってメモリ上で所定角回転させられる。レイアウト解析部3は、回転後の画像に基づいて、原稿画像に含まれる文字のかたまり(領域という)を検出する。文字切出し・認識部4は、領域中の1つ1つの文字を認識する。信頼度算出部5は、文字認識の信頼度を算出する。この信頼度に応じて、原稿画像が再度回転され、レイアウト解析、文字認識処理が繰り返される。そして、回転によりもっとも信頼度の高い原稿方向が出力され、その方向での認識結果が出力される。
【0016】
図2は、本発明の原稿方向判別方法を説明するためのフローチャートである。まず、スキャナから原稿画像が入力されると(ステップS1)、その原稿画像データは、RAMなどのメモリに蓄積される。つぎに、今までの回転回数を調べ(ステップS2)、回転回数が3以下であれば、レイアウト解析処理に進む(ステップS3)。その結果、文字領域が検出されれば(ステップS4のYES)、一番面積の大きな文字領域に対して文字認識を開始する(ステップS5)。文字領域が検出されなければ処理を終了する。
【0017】
この文字認識処理は、種々のアルゴリズムが考案されているが、例えば次のようなものを採用できる。文字領域の中の各文字を切出し、それぞれの文字を複数の小領域に分割する。各小領域において、白黒画素の境界の方向別(例えば0°,45°,90°,135°)のヒストグラムをとる。このヒストグラムを、辞書のヒストグラムと比較することによって、もっとも類似する文字を選択し、これを認識文字とする。
【0018】
一方、信頼度を算出する条件となる上限文字数(例えば100文字)と、上限領域数(例えば3)とを設定しておく。
前記認識した文字数が上限文字数に達していれば(ステップS6)、信頼度を算出する(ステップS9)。上限文字数に達していなければ、次に面積の大きな領域に対して文字認識を行う(ステップS8)。このようにして、上限文字数に達するまで、領域数を広げて文字認識をつづける。上限文字数に達しないうちに上限領域数に達すれば(ステップS7)、そこで文字認識を打ち切り、信頼度を算出する(ステップS9)。
【0019】
ステップS5では、一番大きな文字領域から文字認識を行うことで、領域を切り替えなくても、一度の処理で多くの文字を認識できることとなり、処理の高速化が図れる。また、大きな領域は、小さな領域に比べ、ノイズ領域である可能性が低いと考えられるので、より制度の高い認識結果が得られる。
信頼度は、認識した文字の信頼度の総和を、認識した文字数で割った平均値とする。ここで「文字の信頼度」とは、文字認識の確からしさのことをいう。例えば、認識した文字と辞書の文字とを比較したときの類似の度合いを、0から255までの数値で表したものである。
【0020】
この信頼度を算出する場合、文字の中にアルファベットの「I」「O」など上下左右対称な文字、アルファベットの「b」「q」など上下対称な文字が含まれ、又は「−」「●」、スペースなど上下左右対称な記号が含まれるとき、その文字・記号は、「認識した文字」の中に含めないことが望ましい。このことによって、算出する信頼度の差を、より顕著にすることができて、原稿方向を正確に確定することができる。
【0021】
信頼度がしきい値以上あるかどうか判定し(ステップS10)、しきい値以上あれば、その原稿方向を確定する(ステップS11)。この場合は、画像を回転させるステップS12には入らない。そして、この確定された原稿方向において、すべての領域の文字に対して文字認識処理を行い、その結果を出力する(ステップS14)。
なお、前記しきい値は、文字認識装置1で多くの原稿を読み取って、試行錯誤により適切な値に定めるとよい。
【0022】
信頼度がしきい値以上なければ、画像を回転させる(ステップS12)。この回転方法は後に説明する。
つぎに、今までの回転回数を調べ(ステップS2)、回転回数が3を超えていれば(つまり0°,90°,180°,270°の4方向について文字認識処理が終わっていれば)、信頼度が最大となる方向を原稿方向として確定する(ステップS13)。そして、この確定された原稿方向において、すべての領域の文字に対して文字認識処理を行い、その結果を出力する(ステップS14)。
【0023】
回転回数が3以下であるときは、その回転方向に対して、前記レイアウト解析、文字認識、信頼度の算出を繰り返す。回転のたびにレイアウト解析による文字領域の抽出を行うことで、確かな領域の縦書き横書きの属性が得られ、認識結果の精度が高くなる。
ここで、画像を回転させるステップS12の内容を詳しく説明する。
図3は、ステップS12の内容を説明するための詳細フローチャートである。図4は、時間を追って原稿が回転される様子を説明するための図解図である。現行の向きは白抜き矢印で示している。
【0024】
まず、いままでの回転回数が0の場合(ステップS12−1、図4(a))、原稿を右に90°回転させる(ステップS12−6、図4(b))。そして、回転回数を1プラスする(ステップS12−8)。
回転回数が1の場合(ステップS12−2、図4(b) )、回転角が0°の時の信頼度と、回転角が90°の時の信頼度とを比較する。
(回転角が0°の時の信頼度)>(回転角が90°の時の信頼度)
であれば、原稿をさらに右に90°回転させる(ステップS12−6、図4(c))。そして、回転回数を1プラスする(ステップS12−8)。
【0025】
(回転角が0°の時の信頼度)≦(回転角が90°の時の信頼度)
であれば、原稿を180°回転させる(ステップS12−5、図4(e))。そして、回転回数を1プラスする(ステップS12−8)。
ここで、回転角が0°の時の信頼度と、回転角が90°の時の信頼度との比較結果に応じて、原稿方向の回転角度を変える理由を、実施例を用いて説明する。
【0026】
【実施例】
表1は、8種類の原稿について、正しい方向から右90°又は180度回転させて、文字認識を試みた例を示す。この正しい方向から右90°又は180度回転させた状態を基準方向0°とする。
【0027】
【表1】
【0028】
基準方向0°での信頼度判定値1と、それから90°回転させたときの信頼度判定値2とを算出した。いずれも正しい方向でないので、信頼度判定値は低くなっている。
そして、0°又は90°のうち、信頼度の高い方の方向に対して180°回転させたときの信頼度判定値3と、残りの回転角度に対する信頼度判定値4とを算出した。
【0029】
いずれの原稿も、信頼度の高い方の方向に対して180°回転させたときの信頼度判定値3のほうが、残りの回転角度に対する信頼度判定値4よりも高くなっている。
したがって、基準方向0°での信頼度判定値1と、それから90°回転させたときの信頼度判定値2とを算出して、いずれも信頼度判定値が低く出た場合、信頼度の高い方の方向に対して180°回転させたほうが、正しい原稿方向が早く得られる可能性が高いといえる。
【0030】
以上で、本発明の実施の形態を説明したが、本発明の実施は、前記の形態に限定されるものではない。例えば、前記の実施形態では、回転回数が0の時点で文字認識して信頼度判定値1を求め、信頼度判定値1がしきい値以上あれば、原稿方向を確定していた(ステップS10→S11)。しかし、回転回数が0の時点ではまだ信頼度判定値1をしきい値と比較せずに記憶し、さらに90°回転させて信頼度判定値2を求めた時点で、記憶した信頼度判定値1及び信頼度判定値2をしきい値とそれぞれ比較し、いずれもしきい値より低い場合に、次の2回目の回転に移るという実施も可能である。また、信頼度判定値1と信頼度判定値2を求めて記憶し、さらに信頼度判定値1と信頼度判定値2のうち高いほうの信頼度判定値に対応する角度からさらに180°回転させて信頼度判定値3を求め、この時点で、記憶した信頼度判定値1,2及び信頼度判定値3をしきい値とそれぞれ比較し、いずれもしきい値より低い場合に、次の3回目の回転に移るという実施も可能である。その他、本発明の範囲内で種々の変更を施すことが可能である。
【図面の簡単な説明】
【図1】本発明の文字認識方法を実施する文字認識装置1の機能ブロック図である。
【図2】文字認識処理の流れを説明するためのフローチャートである。
【図3】ステップS12の画像を回転する詳細手順を説明するための詳細フローチャートである。
【図4】時間を追って原稿画像が回転される様子を説明するための図解図である。
【図5】従来の、原稿画像が回転される様子を説明するための図解図である。
【符号の説明】
1 文字認識装置
2 画像回転部
3 レイアウト解析部
4 文字切出し・認識部
5 信頼度算出部
Claims (7)
- 原稿画像を入力し、
原稿画像の一部又は全部に対して文字認識して信頼度判定値1を算出し、
信頼度判定値1がしきい値よりも高ければ、その方向を原稿方向として確定し、
信頼度判定値1がしきい値よりも低ければ、入力された原稿画像を90°回転させて原稿画像の一部又は全部に対して文字認識して信頼度判定値2を算出し、
信頼度判定値2がしきい値よりも高ければ、その方向を原稿方向として確定し、
信頼度判定値2がしきい値よりも低ければ、信頼度判定値1と信頼度判定値2のうち高いほうの信頼度判定値に対応する角度からさらに180°回転させて原稿画像の一部又は全部に対して文字認識して信頼度判定値3を算出し、
信頼度判定値3がしきい値よりも高ければ、その方向を原稿方向として確定し、
信頼度判定値3がしきい値よりも低ければ、直交4方向のうち、まだ信頼度判定をしていない方向について原稿画像の一部又は全部に対して文字認識して信頼度判定値4を算出し、
信頼度判定値4がしきい値よりも高ければ、その方向を原稿方向として確定することを特徴とする、文字認識処理における原稿方向判別方法。 - 原稿画像を入力し、
原稿画像の一部又は全部に対して文字認識して信頼度判定値1を算出し、
入力された原稿画像を90°回転させて原稿画像の一部又は全部に対して文字認識して信頼度判定値2を算出し、
信頼度判定値1又は信頼度判定値2がしきい値よりも高ければ、その高い方向を原稿方向として確定し、
信頼度判定値1,2のいずれもがしきい値よりも低ければ、信頼度判定値1と信頼度判定値2のうち高いほうの信頼度判定値に対応する角度からさらに180°回転させて原稿画像の一部又は全部に対して文字認識して信頼度判定値3を算出し、
信頼度判定値3がしきい値よりも高ければ、その方向を原稿方向として確定し、
信頼度判定値3がしきい値よりも低ければ、直交4方向のうち、まだ信頼度判定をしていない方向について原稿画像の一部又は全部に対して文字認識して信頼度判定値4を算出し、
信頼度判定値4がしきい値よりも高ければ、その方向を原稿方向として確定することを特徴とする、文字認識処理における原稿方向判別方法。 - 原稿画像を入力し、
原稿画像の一部又は全部に対して文字認識して信頼度判定値1を算出し、
入力された原稿画像を90°回転させて原稿画像の一部又は全部に対して文字認識して信頼度判定値2を算出し、
信頼度判定値1と信頼度判定値2のうち高いほうの信頼度判定値に対応する角度からさらに180°回転させて原稿画像の一部又は全部に対して文字認識して信頼度判定値3を算出し、
信頼度判定値1、信頼度判定値2又は信頼度判定値3がしきい値よりも高ければ、その高い方向を原稿方向として確定し、
信頼度判定値1,2,3のいずれもがしきい値よりも低ければ、直交4方向のうち、まだ信頼度判定をしていない方向について原稿画像の一部又は全部に対して文字認識して信頼度判定値4を算出し、
信頼度判定値4がしきい値よりも高ければ、その方向を原稿方向として確定することを特徴とする、文字認識処理における原稿方向判別方法。 - 信頼度判定値4がしきい値よりも低かった場合、信頼度判定値がもっとも高い原稿方向を確定する請求項1、請求項2又は請求項3記載の文字認識処理における原稿方向判別方法。
- 前記信頼度判定値の算出において、認識した対称な文字や記号を除外して信頼度判定値を算出する請求項1、請求項2又は請求項3記載の文字認識処理における原稿方向判別方法。
- 原稿画像の一部に対して文字認識する場合に、原稿に含まれる1又は複数の文字領域を抽出し、一番大きな文字領域の中の文字から文字認識を始める請求項1、請求項2又は請求項3記載の文字認識処理における原稿方向判別方法。
- 原稿画像の一部に対して文字認識する場合に、回転のたびに、原稿に含まれる1又は複数の文字領域を抽出し、いずれかの文字領域に対して文字認識を行う請求項1、請求項2又は請求項3記載の文字認識処理における原稿方向判別方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002168897A JP2004013704A (ja) | 2002-06-10 | 2002-06-10 | 文字認識処理における原稿方向判別方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002168897A JP2004013704A (ja) | 2002-06-10 | 2002-06-10 | 文字認識処理における原稿方向判別方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2004013704A true JP2004013704A (ja) | 2004-01-15 |
Family
ID=30435683
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2002168897A Pending JP2004013704A (ja) | 2002-06-10 | 2002-06-10 | 文字認識処理における原稿方向判別方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2004013704A (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011070601A (ja) * | 2009-09-28 | 2011-04-07 | Fujitsu Ltd | 画像管理装置、画像管理方法、及び、コンピュータプログラム |
JP2013025800A (ja) * | 2011-07-20 | 2013-02-04 | Fujitsu Ltd | 画像ブロックにおける文字の方向を認識する方法及び装置 |
-
2002
- 2002-06-10 JP JP2002168897A patent/JP2004013704A/ja active Pending
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011070601A (ja) * | 2009-09-28 | 2011-04-07 | Fujitsu Ltd | 画像管理装置、画像管理方法、及び、コンピュータプログラム |
JP2013025800A (ja) * | 2011-07-20 | 2013-02-04 | Fujitsu Ltd | 画像ブロックにおける文字の方向を認識する方法及び装置 |
EP2549407B1 (en) * | 2011-07-20 | 2020-06-10 | Fujitsu Limited | Method of and device for identifying direction of characters in image block |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4208918B2 (ja) | 文書画像からテキストを抽出する方法及び装置並びにコンピュータプログラム及びその記憶媒体 | |
US7738734B2 (en) | Image processing method | |
Shivakumara et al. | An efficient edge based technique for text detection in video frames | |
JPH1139428A (ja) | 文書映像の方向修正方法 | |
WO2011128777A2 (en) | Segmentation of textual lines in an image that include western characters and hieroglyphic characters | |
JP2010170539A (ja) | コード検出及び復号化システム | |
JP2000339457A (ja) | 顔画像処理装置 | |
KR20000076486A (ko) | 안화상 처리장치 | |
JP5262493B2 (ja) | 画像処理装置、画像処理方法、プログラムおよびコンピュータ読み取り可能な記憶媒体 | |
CN111695540A (zh) | 视频边框识别方法及裁剪方法、装置、电子设备及介质 | |
JP2000113103A (ja) | 文書画像の方向判定方法、装置および記録媒体 | |
JP2004013704A (ja) | 文字認識処理における原稿方向判別方法 | |
CN114359923A (zh) | 证件字符识别方法、装置、计算机及存储介质 | |
JPH064704A (ja) | 罫線識別方法及び領域識別方法 | |
KR0186172B1 (ko) | 문자 인식장치의 접촉문자 분리 및 특징 추출방법 | |
CN112580594A (zh) | 文档识别方法、装置、计算机设备和存储介质 | |
JP2004241827A (ja) | 画像処理装置、画像処理方法、画像処理プログラムおよび記憶媒体 | |
JP3343305B2 (ja) | 文字切り出し装置、及び文字切り出し方法 | |
JPH04276888A (ja) | 文字読取装置 | |
JP4580520B2 (ja) | 文字認識方法および文字認識装置 | |
JP3712825B2 (ja) | 画像処理方法、装置および記録媒体 | |
JP4819661B2 (ja) | 方向判定装置、画像処理装置、画像方向判別方法、および画像方向判別プログラム | |
JP2022186250A (ja) | 画像処理装置、画像処理方法、及びプログラム | |
JP2005056346A (ja) | 傾き検出方法、傾き検出装置およびプログラム | |
JPH08202876A (ja) | 画像処理装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A711 Effective date: 20041207 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20041207 |