JPH04329492A - 文字切り出し方法 - Google Patents
文字切り出し方法Info
- Publication number
- JPH04329492A JPH04329492A JP3128410A JP12841091A JPH04329492A JP H04329492 A JPH04329492 A JP H04329492A JP 3128410 A JP3128410 A JP 3128410A JP 12841091 A JP12841091 A JP 12841091A JP H04329492 A JPH04329492 A JP H04329492A
- Authority
- JP
- Japan
- Prior art keywords
- character
- image
- characters
- projection
- cutting
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims description 20
- 238000005520 cutting process Methods 0.000 claims description 37
- 238000000605 extraction Methods 0.000 claims description 37
- 238000000926 separation method Methods 0.000 claims description 12
- 238000007781 pre-processing Methods 0.000 abstract description 21
- 238000012545 processing Methods 0.000 description 18
- 238000010586 diagram Methods 0.000 description 13
- 230000011218 segmentation Effects 0.000 description 8
- 230000006870 function Effects 0.000 description 6
- 238000009499 grossing Methods 0.000 description 4
- 238000010606 normalization Methods 0.000 description 4
- 238000013507 mapping Methods 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 230000006399 behavior Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 239000003086 colorant Substances 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000002203 pretreatment Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Landscapes
- Character Input (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【0001】
【産業上の利用分野】この発明は、手書き文字を光学的
に入力して読み取るOCR装置等において、文字列の入
力画像から文字を認識するための前処理として、文字イ
メージを1文字分ごとに切り出す方法に関する。
に入力して読み取るOCR装置等において、文字列の入
力画像から文字を認識するための前処理として、文字イ
メージを1文字分ごとに切り出す方法に関する。
【0002】
【従来の技術】OCR装置等において手書き文字を認識
させるには一般的に次の手順を踏む。文字切り出し →
前処理 → 認識処理従来、帳票などに文字認識させ
る目的で手書き文字を記入する場合には、ドロップアウ
トカラー(読取用のセンサで感知されない色)で印刷さ
れた枠内に記入するようにしていた。その目的は次の通
りである。
させるには一般的に次の手順を踏む。文字切り出し →
前処理 → 認識処理従来、帳票などに文字認識させ
る目的で手書き文字を記入する場合には、ドロップアウ
トカラー(読取用のセンサで感知されない色)で印刷さ
れた枠内に記入するようにしていた。その目的は次の通
りである。
【0003】■文字の形を一定の大きさに整える。■結
合文字を防ぐ。■重なり文字を防ぐ。ドロップアウトカ
ラーによる枠のない帳票等に手書きされた文字の認識を
しようとすると、文字の自由度が高くなり、主に上記■
及び■の結合文字及び重なり文字が発生しやすいため、
文字列の入力パターン(イメージ)から文字パターンを
1文字分ごとに切り出すのが困難になり、誤認識が多く
なる。
合文字を防ぐ。■重なり文字を防ぐ。ドロップアウトカ
ラーによる枠のない帳票等に手書きされた文字の認識を
しようとすると、文字の自由度が高くなり、主に上記■
及び■の結合文字及び重なり文字が発生しやすいため、
文字列の入力パターン(イメージ)から文字パターンを
1文字分ごとに切り出すのが困難になり、誤認識が多く
なる。
【0004】このような文字切り出し方法としては、例
えば特開平1−112388号公報,特開平1−114
992号公報等に見られるように、原稿の読み取り画像
のパターンから文字行イメージを切り出してその垂直射
影をとり、文字の存在する部分を矩形領域として切り出
す方法がある。
えば特開平1−112388号公報,特開平1−114
992号公報等に見られるように、原稿の読み取り画像
のパターンから文字行イメージを切り出してその垂直射
影をとり、文字の存在する部分を矩形領域として切り出
す方法がある。
【0005】また、重なり文字の切り出しも可能にする
ために、例えば特開平1−116891号公報に見られ
るように、文字列の入力パターンから文字外接矩形を抽
出し、さらにその中の文字の輪郭抽出によって得られた
データを用いて、各文字ブロックを切り出す方法も提案
されている。
ために、例えば特開平1−116891号公報に見られ
るように、文字列の入力パターンから文字外接矩形を抽
出し、さらにその中の文字の輪郭抽出によって得られた
データを用いて、各文字ブロックを切り出す方法も提案
されている。
【0006】
【発明が解決しようとする課題】しかしながら、このよ
うな従来の文字切り出し方法によっても、ドロップアウ
トカラーによる枠のない帳票等に手書きされた自由度の
高い文字列の入力パターンを、1文字分ごとの文字ブロ
ックとして確実に切り出すのは困難であり、文字認識率
を充分に高めることができないという問題があった。
うな従来の文字切り出し方法によっても、ドロップアウ
トカラーによる枠のない帳票等に手書きされた自由度の
高い文字列の入力パターンを、1文字分ごとの文字ブロ
ックとして確実に切り出すのは困難であり、文字認識率
を充分に高めることができないという問題があった。
【0007】この発明はこのような現状に鑑みてなされ
たものであり、自由度の高い文字列に対しても、より正
確に各文字のパターンを分割して正しく文字を切り出せ
るようにすること、及びどうしても文字を切り出せない
場合にはそれを通知できるようにすることを目的とする
。
たものであり、自由度の高い文字列に対しても、より正
確に各文字のパターンを分割して正しく文字を切り出せ
るようにすること、及びどうしても文字を切り出せない
場合にはそれを通知できるようにすることを目的とする
。
【0008】
【課題を解決するための手段】この発明は上記の目的を
達成するため、手書き文字列の入力画像から文字認識で
きるように1文字分ずつのイメージを切り出す文字切り
出し方法において、入力文字列の原画像イメージに対し
て垂直及び水平射影をとって文字の切り出しを行ない、
その切り出した文字画像の縦横比が所定の範囲内にある
ときにのみ、その文字画像を正規化して輪郭追跡を行な
うことにより文字分離線を求めて1文字を切り離し、そ
の切り離した1文字の原画像のイメージを消去して前記
射影をとり直して次の文字を切り出すことを特徴とする
。
達成するため、手書き文字列の入力画像から文字認識で
きるように1文字分ずつのイメージを切り出す文字切り
出し方法において、入力文字列の原画像イメージに対し
て垂直及び水平射影をとって文字の切り出しを行ない、
その切り出した文字画像の縦横比が所定の範囲内にある
ときにのみ、その文字画像を正規化して輪郭追跡を行な
うことにより文字分離線を求めて1文字を切り離し、そ
の切り離した1文字の原画像のイメージを消去して前記
射影をとり直して次の文字を切り出すことを特徴とする
。
【0009】さらに、この文字切り出し方法において、
切り出した文字画像により正しい文字認識結果が得られ
た場合の文字画像の縦横比の集計値に基づいて、適正な
文字切り出しサイズを推定するとよい。また、適正な文
字切り出しが行なえなかった場合にはエラーとして通知
する。
切り出した文字画像により正しい文字認識結果が得られ
た場合の文字画像の縦横比の集計値に基づいて、適正な
文字切り出しサイズを推定するとよい。また、適正な文
字切り出しが行なえなかった場合にはエラーとして通知
する。
【0010】
【作用】この発明によれば、射影による文字切り出しと
輪郭追跡による1文字の分離を有機的に組合せたので、
手書きの重なり文字も切り離すことができ、しかも効率
のよい文字切り出しが可能になる。特に、輪郭追跡は正
規化したイメージで行うので実行時間が速く、求めた文
字分離線により切り離した文字のイメージを原画像から
消去して射影を部分的に取り直すことにより、以後の切
り出しを射影のみで行える可能性を高くすることができ
る。
輪郭追跡による1文字の分離を有機的に組合せたので、
手書きの重なり文字も切り離すことができ、しかも効率
のよい文字切り出しが可能になる。特に、輪郭追跡は正
規化したイメージで行うので実行時間が速く、求めた文
字分離線により切り離した文字のイメージを原画像から
消去して射影を部分的に取り直すことにより、以後の切
り出しを射影のみで行える可能性を高くすることができ
る。
【0011】また、切り出した文字画像の縦横比とその
文字認識結果の集計値基づいて、文字切り出しサイズ(
枠の縦横比)を推定して文字切り出しを行うことにより
、文字切り出し処理をより効率的に行なうことができる
。さらに、結合文字等のために適正な文字切り出しが行
なえなかった場合にはエラーとして通知することにより
、文字認識部での誤認識を防ぎ、適切な処置が可能にな
る。
文字認識結果の集計値基づいて、文字切り出しサイズ(
枠の縦横比)を推定して文字切り出しを行うことにより
、文字切り出し処理をより効率的に行なうことができる
。さらに、結合文字等のために適正な文字切り出しが行
なえなかった場合にはエラーとして通知することにより
、文字認識部での誤認識を防ぎ、適切な処置が可能にな
る。
【0012】
【実施例】以下、この発明の実施例を図面を参照して具
体的に説明する。図1はこの発明による文字切り出し方
法を実施する文字読取装置の機能構成を示すブロック図
である。
体的に説明する。図1はこの発明による文字切り出し方
法を実施する文字読取装置の機能構成を示すブロック図
である。
【0013】この文字読取装置は、イメージスキャナな
どの画像入力装置1と、それから手書き文字等の画像イ
メージを入力して画像メモリ3に格納させる入出力制御
部2と、その画像メモリ3及び画像処理用ワークメモリ
4(いずれもRAM)と、これらを制御するCPU5及
び文字列切出部6と、さらにCPU5によってOCR制
御部7を介して制御される文字切出部8及び前処理部9
と、文字認識部10とによって構成されている。
どの画像入力装置1と、それから手書き文字等の画像イ
メージを入力して画像メモリ3に格納させる入出力制御
部2と、その画像メモリ3及び画像処理用ワークメモリ
4(いずれもRAM)と、これらを制御するCPU5及
び文字列切出部6と、さらにCPU5によってOCR制
御部7を介して制御される文字切出部8及び前処理部9
と、文字認識部10とによって構成されている。
【0014】画像メモリ3に画像イメージが格納される
と、CPU5によって文字列切出部6が作動され、画像
メモリ上の2値画像から文字列の部分を切り出して画像
処理用ワークメモリ4に移す。具体的には、タイミング
マーク方式や枠線認識方式などによって、OCR文字認
識エリアの矩形座標を取り出す。
と、CPU5によって文字列切出部6が作動され、画像
メモリ上の2値画像から文字列の部分を切り出して画像
処理用ワークメモリ4に移す。具体的には、タイミング
マーク方式や枠線認識方式などによって、OCR文字認
識エリアの矩形座標を取り出す。
【0015】文字切出部8は、垂直・水平射影手段11
,文字切出手段12及び文字枠推定手段13からなり、
画像処理用ワークメモリ4上の文字列の2値画像データ
から、1文字分ずつのブロックを切り出して文字認識部
へ送る機能をなすが、その詳細は後述する。
,文字切出手段12及び文字枠推定手段13からなり、
画像処理用ワークメモリ4上の文字列の2値画像データ
から、1文字分ずつのブロックを切り出して文字認識部
へ送る機能をなすが、その詳細は後述する。
【0016】前処理部9は、正規化処理手段14,スム
ージング手段15,輪郭追跡手段16,文字分離抽出手
段17及び画像消去手段18からなり、文字切出部8に
よって切り出されるイメージデータに対して、文字認識
部10で文字を認識し易くするための前処理を行なう機
能をなすが、その詳細も後述する。なお、図1において
二点鎖線で囲んだ部分、すなわち文字切出部8の文字枠
推定手段13と、前処理部9の文字分離抽出手段17及
び画像消去手段18が、この発明の特徴とする部分であ
る。
ージング手段15,輪郭追跡手段16,文字分離抽出手
段17及び画像消去手段18からなり、文字切出部8に
よって切り出されるイメージデータに対して、文字認識
部10で文字を認識し易くするための前処理を行なう機
能をなすが、その詳細も後述する。なお、図1において
二点鎖線で囲んだ部分、すなわち文字切出部8の文字枠
推定手段13と、前処理部9の文字分離抽出手段17及
び画像消去手段18が、この発明の特徴とする部分であ
る。
【0017】次に、この実施例による文字切り出し及び
文字認識の前処理について説明するが、この実施例では
公知の技術として次の2つを使用する。(1)文字画像
の垂直・水平射影をとり1文字を切り出す。(2)文字
の輪郭追跡を行なって重なり文字を分離する。通常の場
合は、上述した図1の文字切出部8における垂直・水平
射影手段11と文字切出手段12とによって、上記(1
)の技術を用いて次の手順で文字切り出しを行なう。
文字認識の前処理について説明するが、この実施例では
公知の技術として次の2つを使用する。(1)文字画像
の垂直・水平射影をとり1文字を切り出す。(2)文字
の輪郭追跡を行なって重なり文字を分離する。通常の場
合は、上述した図1の文字切出部8における垂直・水平
射影手段11と文字切出手段12とによって、上記(1
)の技術を用いて次の手順で文字切り出しを行なう。
【0018】■原稿の画像イメージから、図5の(A)
に示すような文字列を切り出す。■垂直射影をとり文字
列から1文字分ずつ切り出す。図5の(B)に示すよう
に、文字列のデータに対して垂直射影をとり、それをあ
るしきい値で切ると1文字の左端と右端が見つかる。■
同図の(C)に示すように切り出した1文字の水平射影
をとり、文字の上部と下部の余白を詰める。
に示すような文字列を切り出す。■垂直射影をとり文字
列から1文字分ずつ切り出す。図5の(B)に示すよう
に、文字列のデータに対して垂直射影をとり、それをあ
るしきい値で切ると1文字の左端と右端が見つかる。■
同図の(C)に示すように切り出した1文字の水平射影
をとり、文字の上部と下部の余白を詰める。
【0019】しかしながら、ドロップアウトカラーなど
で記入枠が規定されていない場合には、書かれる文字の
自由度が高くなり、図6の(A)に示すような結合文字
や、同図(B)に示すような重なり文字が生じやすい。 このような文字列は、文字画像の垂直及び水平射影をと
っただけでは、1文字分ずつに切り離せない。
で記入枠が規定されていない場合には、書かれる文字の
自由度が高くなり、図6の(A)に示すような結合文字
や、同図(B)に示すような重なり文字が生じやすい。 このような文字列は、文字画像の垂直及び水平射影をと
っただけでは、1文字分ずつに切り離せない。
【0020】そこで、次のような条件下においてのみ、
図1の前処理部9における輪郭追跡手段16によって、
文字の輪郭追跡を行って文字を切り離す。すなわち、切
り出された文字の縦横比がa/b(図7参照)以上の場
合に輪郭追跡を行う。このa/bの具体的な値の決め方
については後述する。
図1の前処理部9における輪郭追跡手段16によって、
文字の輪郭追跡を行って文字を切り離す。すなわち、切
り出された文字の縦横比がa/b(図7参照)以上の場
合に輪郭追跡を行う。このa/bの具体的な値の決め方
については後述する。
【0021】また、オリジナルの画像に切れがあったり
、2値画像として取り込んだイメージに乱れがあって、
垂直射影や水平射影をとると図8の(A)〜(C)に例
示するように射影に切れが生じる場合がある。 (A)と(B)は垂直射影に切れが生じる例、(C)は
水平射影に切れが生じる例である。
、2値画像として取り込んだイメージに乱れがあって、
垂直射影や水平射影をとると図8の(A)〜(C)に例
示するように射影に切れが生じる場合がある。 (A)と(B)は垂直射影に切れが生じる例、(C)は
水平射影に切れが生じる例である。
【0022】そこで、射影にあるドット数(θドット)
以上の切れがある場合には、その文字画像を分離し、切
れがθドット以内の場合にはその切れを継なぐ(併合す
る)操作をし、前処理部9及び文字認識部10に文字の
併合操作を行なったことを知らせる。文字認識ルーチン
はそれに応じた認識動作をする。また、このような併合
操作を行った時には輪郭追跡を行なわないようにする。 なぜなら、輪郭追跡を行なうと分離してはならない文字
を分離してしまうことになるからである。
以上の切れがある場合には、その文字画像を分離し、切
れがθドット以内の場合にはその切れを継なぐ(併合す
る)操作をし、前処理部9及び文字認識部10に文字の
併合操作を行なったことを知らせる。文字認識ルーチン
はそれに応じた認識動作をする。また、このような併合
操作を行った時には輪郭追跡を行なわないようにする。 なぜなら、輪郭追跡を行なうと分離してはならない文字
を分離してしまうことになるからである。
【0023】縦横比がa/b以上の場合には輪郭追跡を
行って文字を切り離すが、その手順について説明する。 輪郭追跡は原画像に対して行うのではなく、正規化処理
手段14によって正規化処理をした正規化イメージで行
う。この方が計算時間が短くて済む垂直・水平射影によ
り切り出されたイメージが図9の(A)に示すようなも
ので、その縦横比がa/b以上であるとする。正規化イ
メージは同図の(B)に示すようになる。
行って文字を切り離すが、その手順について説明する。 輪郭追跡は原画像に対して行うのではなく、正規化処理
手段14によって正規化処理をした正規化イメージで行
う。この方が計算時間が短くて済む垂直・水平射影によ
り切り出されたイメージが図9の(A)に示すようなも
ので、その縦横比がa/b以上であるとする。正規化イ
メージは同図の(B)に示すようになる。
【0024】輪郭追跡開始点は次のように求める。図9
の(C)に示すように正規化イメージを上から下へ垂直
方向へ走査し、その走査線を順次左から右へずらしてい
って、走査線が最初にぶつかるイメージの点が追跡開始
点になる。そして、同図の(D)に示すように輪郭追跡
をすると、文字イメージ「1」の輪郭が判明する。つま
り文字イメージ「1」と「2」を分離する境界線を求め
ることができる。
の(C)に示すように正規化イメージを上から下へ垂直
方向へ走査し、その走査線を順次左から右へずらしてい
って、走査線が最初にぶつかるイメージの点が追跡開始
点になる。そして、同図の(D)に示すように輪郭追跡
をすると、文字イメージ「1」の輪郭が判明する。つま
り文字イメージ「1」と「2」を分離する境界線を求め
ることができる。
【0025】原画像イメージから正規化イメージを作る
時には、ある写像関数fにもとづいて行なわれる。よっ
て、正規化イメージで求められた文字イメージを分離す
る境界線を原画像にて復元することは可能である。但し
、この写像関数fは、全射の関数であって単射の関数で
はない。従って正規化イメージの複数の点が原画像の1
点に対応する可能性があるので、原画像にて復元された
境界線は少々ぼやけたものになる。
時には、ある写像関数fにもとづいて行なわれる。よっ
て、正規化イメージで求められた文字イメージを分離す
る境界線を原画像にて復元することは可能である。但し
、この写像関数fは、全射の関数であって単射の関数で
はない。従って正規化イメージの複数の点が原画像の1
点に対応する可能性があるので、原画像にて復元された
境界線は少々ぼやけたものになる。
【0026】正規化イメージにおいて輪郭追跡して切り
出したイメージを、図1の文字認識部10へ渡す。また
、図10に示すように、原画像において復元された文字
画像の境界線の左側にある画像を原画像から取り除く(
消去する)。そして射影をとり直すと、次に文字イメー
ジ「2」を切り出す時に、輪郭追跡をしなくともそれを
切り出せる。
出したイメージを、図1の文字認識部10へ渡す。また
、図10に示すように、原画像において復元された文字
画像の境界線の左側にある画像を原画像から取り除く(
消去する)。そして射影をとり直すと、次に文字イメー
ジ「2」を切り出す時に、輪郭追跡をしなくともそれを
切り出せる。
【0027】次に、もっと普通に書かれた図11の(A
)に示すような文字列を考える。この例では、同図(B
)に示す垂直射影によって文字を切り出すと、「1」と
「2」及び「4」と「5」の切り出しができない。そこ
で、既に述べたように射影と輪郭追跡を組み合わせると
以下のように文字が切り出せる。
)に示すような文字列を考える。この例では、同図(B
)に示す垂直射影によって文字を切り出すと、「1」と
「2」及び「4」と「5」の切り出しができない。そこ
で、既に述べたように射影と輪郭追跡を組み合わせると
以下のように文字が切り出せる。
【0028】図11の(B)に示す垂直射影をとり、ま
ず「12」を切り出す。そして輪郭追跡により正規化イ
メージから「1」を切り出し、原画像から「1」のイメ
ージを消して、垂直射影をとり直すと同図(C)に示す
ようになる。
ず「12」を切り出す。そして輪郭追跡により正規化イ
メージから「1」を切り出し、原画像から「1」のイメ
ージを消して、垂直射影をとり直すと同図(C)に示す
ようになる。
【0029】この射影による切り出しで「2」と「3」
は切り出せるが、「45」は射影と輪郭追跡を組み合わ
せないと切り出せない。輪郭追跡により正規化イメージ
から「4」を切り出した後に、原画像から「4」のイメ
ージを消し、「4」の周辺の射影をとり直すと、図11
の(D)に示すようになる。すると、「5」,「6」,
「7」は射影により切り出せる。
は切り出せるが、「45」は射影と輪郭追跡を組み合わ
せないと切り出せない。輪郭追跡により正規化イメージ
から「4」を切り出した後に、原画像から「4」のイメ
ージを消し、「4」の周辺の射影をとり直すと、図11
の(D)に示すようになる。すると、「5」,「6」,
「7」は射影により切り出せる。
【0030】次に、図1における文字切出部8と前処理
部9及び文字認識部10との情報の流れについて説明す
る。文字切出部8では基本的に射影による文字切り出し
を行う。前処理部9では、正規化処理手段14による原
画像の正規化処理、スムージング手段15によるイメー
ジのスムージング処理、輪郭追跡手段16による前述し
た輪郭追跡により、文字分離線抽出手段17が文字分離
線を抽出して文字切り出しを行ない、画像消去手段18
がその切り出された画像部分を原画像から消去する処理
等を行う。
部9及び文字認識部10との情報の流れについて説明す
る。文字切出部8では基本的に射影による文字切り出し
を行う。前処理部9では、正規化処理手段14による原
画像の正規化処理、スムージング手段15によるイメー
ジのスムージング処理、輪郭追跡手段16による前述し
た輪郭追跡により、文字分離線抽出手段17が文字分離
線を抽出して文字切り出しを行ない、画像消去手段18
がその切り出された画像部分を原画像から消去する処理
等を行う。
【0031】文字認識部10では、切り出された1文字
分ずつの文字画像(イメージ)から文字認識を行う。そ
の際、文字切出部8は切り出した文字画像の縦横比の範
囲により、また切り出された文字が併合文字かどうかに
より、前処理部9及び文字認識部10の挙動が変わるの
で、切り出し結果を前処理部9及び文字認識部10に通
知する必要がある。
分ずつの文字画像(イメージ)から文字認識を行う。そ
の際、文字切出部8は切り出した文字画像の縦横比の範
囲により、また切り出された文字が併合文字かどうかに
より、前処理部9及び文字認識部10の挙動が変わるの
で、切り出し結果を前処理部9及び文字認識部10に通
知する必要がある。
【0032】文字切出部8からの通知事項は次のような
ものである。 ■ 併合文字かどうか。 ■ 切り出しエラーがあったかどうか。 ■ 文字画像の縦横比がa0/b0以下か。 ■ 同じくa0/b0より大きくa2/b2以下か。 ■ 同じくa2/b2より大きいか。
ものである。 ■ 併合文字かどうか。 ■ 切り出しエラーがあったかどうか。 ■ 文字画像の縦横比がa0/b0以下か。 ■ 同じくa0/b0より大きくa2/b2以下か。 ■ 同じくa2/b2より大きいか。
【0033】なお、上記■は文字画像の幅が1文字の幅
にしては広すぎる場合であり、■は文字切出部8で切り
出された文字が横に長すぎる場合である。前処理部9及
び文字認識部10では、文字切出部8からのこれらの通
知事項に対し次の行動をとる。
にしては広すぎる場合であり、■は文字切出部8で切り
出された文字が横に長すぎる場合である。前処理部9及
び文字認識部10では、文字切出部8からのこれらの通
知事項に対し次の行動をとる。
【0034】1. 併合文字なら輪郭追跡をせずにその
まま認識動作に入る。2. 切り出しエラーがある時に
は、何もせずに抜ける。3. 文字画像の縦横比がa0
/b0以下の時には、文字が正常に切り出されたものと
し、輪郭追跡をせずにそのまま認識動作に入る。4.
輪郭追跡をして文字を切り出し、その文字を認識する。 5. エラーとして何もせずに抜ける。
まま認識動作に入る。2. 切り出しエラーがある時に
は、何もせずに抜ける。3. 文字画像の縦横比がa0
/b0以下の時には、文字が正常に切り出されたものと
し、輪郭追跡をせずにそのまま認識動作に入る。4.
輪郭追跡をして文字を切り出し、その文字を認識する。 5. エラーとして何もせずに抜ける。
【0035】5のケースのような結合文字を無理に分離
して認識するより、エラーとしてORC文字記入者に知
らせる方が良いと考えられる。結合文字の分離が100
%うまく行く保証はないし、いろいろな特殊ケースを考
える必要性が生じるからである。文字切り出しについて
、さらに詳細に説明する。
して認識するより、エラーとしてORC文字記入者に知
らせる方が良いと考えられる。結合文字の分離が100
%うまく行く保証はないし、いろいろな特殊ケースを考
える必要性が生じるからである。文字切り出しについて
、さらに詳細に説明する。
【0036】まず、文字列のイメージからの文字切り離
し手順の概略を説明する。(1) しきい値を設定する
。 (2) しきい値で垂直射影を切り、文字列の左端を見
つける。 (3) しきい値で垂直射影を切り、文字列の左端から
の最初の文字列の切れ目を見つける。(4) (2)で
得られた値が文字の左端になり、(3)で得られた値が
文字の右端になる。(5) 文字の左端と右端の妥当性
をチェックして、妥当ならそれを文字認識ルーチン(文
字認識部)に渡す。もし妥当でなければ、しきい値を2
倍にしてもう一度2と3を行う。
し手順の概略を説明する。(1) しきい値を設定する
。 (2) しきい値で垂直射影を切り、文字列の左端を見
つける。 (3) しきい値で垂直射影を切り、文字列の左端から
の最初の文字列の切れ目を見つける。(4) (2)で
得られた値が文字の左端になり、(3)で得られた値が
文字の右端になる。(5) 文字の左端と右端の妥当性
をチェックして、妥当ならそれを文字認識ルーチン(文
字認識部)に渡す。もし妥当でなければ、しきい値を2
倍にしてもう一度2と3を行う。
【0037】上述した文字の切り出し処理で重要な部分
は、(2),(3),(5) であるので、それについ
て重点的な説明をする。(5) における妥当性のチェ
ックは、切り出された文字の縦横比がa1/b1以下か
どうかのチエックである。もしa1/b1より大きいな
ら、しきい値を2倍にしてもう一度切り出し作業をする
。最大でも3回しかリトライしない。
は、(2),(3),(5) であるので、それについ
て重点的な説明をする。(5) における妥当性のチェ
ックは、切り出された文字の縦横比がa1/b1以下か
どうかのチエックである。もしa1/b1より大きいな
ら、しきい値を2倍にしてもう一度切り出し作業をする
。最大でも3回しかリトライしない。
【0038】文字の切り出しのために行う共通手順とし
て、垂直射影をとると図12のようになる。そこで、破
線で示すしきい値でこの射影データを切ると、射影イメ
ージデータとの交点ができる。その点が基本的に切り出
し位置になる。しきい値は、射影イメージデータ量に大
きく依存するので、解像度や書体が変わる毎に変えなけ
ればいけない。
て、垂直射影をとると図12のようになる。そこで、破
線で示すしきい値でこの射影データを切ると、射影イメ
ージデータとの交点ができる。その点が基本的に切り出
し位置になる。しきい値は、射影イメージデータ量に大
きく依存するので、解像度や書体が変わる毎に変えなけ
ればいけない。
【0039】先ず、垂直座標を左から走査して文字の左
端Aを見つける。文字の左端となる必要条件は、次の(
1)から(3)をアンド条件で満たすか、または(2)
から(4)をアンド条件で満たす。
端Aを見つける。文字の左端となる必要条件は、次の(
1)から(3)をアンド条件で満たすか、または(2)
から(4)をアンド条件で満たす。
【0040】(1) 垂直射影の大きさがしきい値より
大きい。 (2) 垂直射影の値が右上がり。 (3) 文字の左端候補位置からしきい値より大きな垂
直射影データが連続して所定数以上存在して、且つ左端
候補位置から現地点の積分値が所定値以上。(4) あ
る1点の垂直射影の大きさが設定値以上。(2)の条件
を加えたのは、通常の文字のどの垂直射影値も文字の左
端付近は右上がりになり、文字の右端付近は右下がりに
なるからである。
大きい。 (2) 垂直射影の値が右上がり。 (3) 文字の左端候補位置からしきい値より大きな垂
直射影データが連続して所定数以上存在して、且つ左端
候補位置から現地点の積分値が所定値以上。(4) あ
る1点の垂直射影の大きさが設定値以上。(2)の条件
を加えたのは、通常の文字のどの垂直射影値も文字の左
端付近は右上がりになり、文字の右端付近は右下がりに
なるからである。
【0041】〈右端の切り出し〉
文字の左端をもとにして右端を切り出す。次の(2)か
ら(3)をアンド条件で満たすか、または(1),(2
)と(4)をアンド条件で満たす。(1) ある地点の
しきい値より小さい垂直射影が所定数以上続く。(2)
ある地点より、垂直射影の大きさが右下がりになる。 (3) 左端からこの位置までの積分値が所定値以上。 (4) 左端からこの位置までに設定値以上の射影があ
る。枠内が文字のイメージデータのみの場合は、以上の
処理により文字を切り出すことができる。実際に図12
では、Aが左端,Bが右端になる。
ら(3)をアンド条件で満たすか、または(1),(2
)と(4)をアンド条件で満たす。(1) ある地点の
しきい値より小さい垂直射影が所定数以上続く。(2)
ある地点より、垂直射影の大きさが右下がりになる。 (3) 左端からこの位置までの積分値が所定値以上。 (4) 左端からこの位置までに設定値以上の射影があ
る。枠内が文字のイメージデータのみの場合は、以上の
処理により文字を切り出すことができる。実際に図12
では、Aが左端,Bが右端になる。
【0042】次に、文字枠サイズの推定方法について述
べる。なお、ここでは数字のみに特定して述べる。正し
く認識された文字のサイズをメモリのあるエリアに記録
しておく。たとえば「3」と認識された文字に対してそ
の縦横比a/b(図7参照)の値を記録しておく。これ
をある一定回数繰り返して各文字毎の平均をとり、その
中でもっとも大きい値を a0/b0 の値とする。
a1/b1,a2/b2 は次の式で求める。
べる。なお、ここでは数字のみに特定して述べる。正し
く認識された文字のサイズをメモリのあるエリアに記録
しておく。たとえば「3」と認識された文字に対してそ
の縦横比a/b(図7参照)の値を記録しておく。これ
をある一定回数繰り返して各文字毎の平均をとり、その
中でもっとも大きい値を a0/b0 の値とする。
a1/b1,a2/b2 は次の式で求める。
【0043】a1/b1=(a0/b0)×1.5a2
/b2=(a0/b0)×2.0 このようにして決定した a0/b0 の値で文字切り
出しを行った場合、何度も輪郭追跡を行うようであった
ら、文字の大きさは一様でなく、自由度の大きい手書き
文字であると推定できる。
/b2=(a0/b0)×2.0 このようにして決定した a0/b0 の値で文字切り
出しを行った場合、何度も輪郭追跡を行うようであった
ら、文字の大きさは一様でなく、自由度の大きい手書き
文字であると推定できる。
【0044】初めてOCR処理をする時には、a0/b
0,a1/b1,a2/b2 には適当な初期値を入
れておく。また、輪郭追跡をあまり行なわないようだっ
たら、文字はバランス良く書かれていると推定される。
0,a1/b1,a2/b2 には適当な初期値を入
れておく。また、輪郭追跡をあまり行なわないようだっ
たら、文字はバランス良く書かれていると推定される。
【0045】次に、図2乃至図4のフローチャートに従
って、この発明に係わる処理のアルゴリズムについて説
明する。図2は文字切出部8による文字切り出しのアル
ゴリズムであり、スタートするとまず、入力された文字
列の画像イメージの垂直・水平射影により1文字分ずつ
切り離す。
って、この発明に係わる処理のアルゴリズムについて説
明する。図2は文字切出部8による文字切り出しのアル
ゴリズムであり、スタートするとまず、入力された文字
列の画像イメージの垂直・水平射影により1文字分ずつ
切り離す。
【0046】そして、切り出した文字の縦横比が a1
/b1 以下であるか否かを判断し、そうでない場合に
は、切り出しのリトライ回数が3回以内か否かを判断す
る。 3回以内であればしきい値を2倍にし上述の処理を繰り
返す。切り出した文字の縦横比が a1/b1 以下で
あるか、そうでない場合でも切り出しのリトライ回数が
3回以内でないときは、画像に切れがあるかどうかをチ
エックして、切れがあれば併合処理を行なう。
/b1 以下であるか否かを判断し、そうでない場合に
は、切り出しのリトライ回数が3回以内か否かを判断す
る。 3回以内であればしきい値を2倍にし上述の処理を繰り
返す。切り出した文字の縦横比が a1/b1 以下で
あるか、そうでない場合でも切り出しのリトライ回数が
3回以内でないときは、画像に切れがあるかどうかをチ
エックして、切れがあれば併合処理を行なう。
【0047】そして、切り出した文字の縦横比をチエッ
クして、前述した■〜■の情報を文字認識の前処理部9
へ渡す。図3は前処理部9による前処理のアルゴリズム
であり、スタートするとまず、切り出した文字画像の正
規化を行ない、続いてその正規化したイメージにスムー
ジング処理を施す。
クして、前述した■〜■の情報を文字認識の前処理部9
へ渡す。図3は前処理部9による前処理のアルゴリズム
であり、スタートするとまず、切り出した文字画像の正
規化を行ない、続いてその正規化したイメージにスムー
ジング処理を施す。
【0048】そして、併合文字かあるいは縦横比がa0
/b0以下か否かを判断し、そうであればそのイメージ
をそのまま文字認識部10へ渡すが、そうでなければ切
り出しエラーかあるいは縦横比がa2/b2以上か否か
を判断する。その結果、切り出しエラーあるいは縦横比
がa2/b2以上であれば、エラーを返すかリジェクト
にする。そのいずれでもなければ、正規化されたイメー
ジの輪郭追跡を行なって文字を切り出す。その結果、文
字の切り出しに成功したら、そのイメージを文字認識部
10へ渡し、原画像の該当イメージを消去して射影をと
り直す。
/b0以下か否かを判断し、そうであればそのイメージ
をそのまま文字認識部10へ渡すが、そうでなければ切
り出しエラーかあるいは縦横比がa2/b2以上か否か
を判断する。その結果、切り出しエラーあるいは縦横比
がa2/b2以上であれば、エラーを返すかリジェクト
にする。そのいずれでもなければ、正規化されたイメー
ジの輪郭追跡を行なって文字を切り出す。その結果、文
字の切り出しに成功したら、そのイメージを文字認識部
10へ渡し、原画像の該当イメージを消去して射影をと
り直す。
【0049】従来は、文字切出部と文字認識部(前処理
部を含む)は独立して順次処理していたが、この実施例
では上述のように、文字切出部と文字認識部(前処理部
を含む)が有機的に相互干渉する。そうすることにより
、折角併合した文字イメージを輪郭追跡により分離して
しまうような不都合を避けることができる。
部を含む)は独立して順次処理していたが、この実施例
では上述のように、文字切出部と文字認識部(前処理部
を含む)が有機的に相互干渉する。そうすることにより
、折角併合した文字イメージを輪郭追跡により分離して
しまうような不都合を避けることができる。
【0050】図4は文字枠推定手段13による文字切り
出し枠の推定処理のアルゴリズムであり、スタートする
とまず省略時の値(初期設定値) a0/b0,a1/
b1,a2/b2 を使用して文字を切り出す。その切
り出した文字イメージを文字認識部10へ渡す。そして
、認識処理の結果が正しい時には、その文字と縦横比を
メモリのある場所へ記録し、記録した文字数をカウント
する。 これらの情報は、例えは図13に示すような形式でメモ
リに格納する。
出し枠の推定処理のアルゴリズムであり、スタートする
とまず省略時の値(初期設定値) a0/b0,a1/
b1,a2/b2 を使用して文字を切り出す。その切
り出した文字イメージを文字認識部10へ渡す。そして
、認識処理の結果が正しい時には、その文字と縦横比を
メモリのある場所へ記録し、記録した文字数をカウント
する。 これらの情報は、例えは図13に示すような形式でメモ
リに格納する。
【0051】カウント数が予め設定したある一定数以上
に達するまで上記の処理を繰り返し、一定数に達すると
文字毎に縦横比の平均をとり、その各平均値の中で最大
のものをa0/b0とする。但し、平均の計算をする文
字の中で、数字の「1」や英字の「I」などは縦横比が
極端なので参考にならないから除き、数字なら「3,2
,8」英字なら「I」を除いた文字が文字枠推定の対象
となる。
に達するまで上記の処理を繰り返し、一定数に達すると
文字毎に縦横比の平均をとり、その各平均値の中で最大
のものをa0/b0とする。但し、平均の計算をする文
字の中で、数字の「1」や英字の「I」などは縦横比が
極端なので参考にならないから除き、数字なら「3,2
,8」英字なら「I」を除いた文字が文字枠推定の対象
となる。
【0052】基本の文字枠a0/b0が決定したら、図
14に示すようにそれより大きい文字枠を2つ設定する
。 すなわち、縦横比a1/b1がa0/b0 の1.5倍
の文字枠サイズ1と、縦横比a2/b2 がa0/b0
の2倍の文字枠サイズ2とを設定する。そして、射影
による文字切り出しでは文字枠サイズ1を使用して文字
を切り出す。 また、射影により切り出した文字のサイズが文字枠サイ
ズ2よりも大きい時はエラーとする。
14に示すようにそれより大きい文字枠を2つ設定する
。 すなわち、縦横比a1/b1がa0/b0 の1.5倍
の文字枠サイズ1と、縦横比a2/b2 がa0/b0
の2倍の文字枠サイズ2とを設定する。そして、射影
による文字切り出しでは文字枠サイズ1を使用して文字
を切り出す。 また、射影により切り出した文字のサイズが文字枠サイ
ズ2よりも大きい時はエラーとする。
【0053】切り出した文字のサイズが a0/b0
の基本文字枠サイズより大きくて文字枠サイズ2より小
さい時は、輪郭追跡を行う。従来は、文字切り出し枠の
サイズはアプリケーション側で指定したが、この実施例
ではそれを文字切り出しルーチンで自動的に判定するこ
とにした。そうすることにより、輪郭追跡による文字切
り出しの頻度が減り、文字切り出し時間の節約になる。
の基本文字枠サイズより大きくて文字枠サイズ2より小
さい時は、輪郭追跡を行う。従来は、文字切り出し枠の
サイズはアプリケーション側で指定したが、この実施例
ではそれを文字切り出しルーチンで自動的に判定するこ
とにした。そうすることにより、輪郭追跡による文字切
り出しの頻度が減り、文字切り出し時間の節約になる。
【0054】
【発明の効果】この発明によれば、射影による文字切り
出しと輪郭追跡による1文字の分離を有機的に組合せた
ので、手書きの重なり文字等も切り離すことができ、輪
郭追跡は正規化したイメージで行うので実行時間が速く
、求めた文字分離線により切り離した文字のイメージを
原画像から消去して射影を部分的に取り直すことにより
、以後の切り出しを射影のみで行える可能性を高くし、
切り出し効率を上げることができる。
出しと輪郭追跡による1文字の分離を有機的に組合せた
ので、手書きの重なり文字等も切り離すことができ、輪
郭追跡は正規化したイメージで行うので実行時間が速く
、求めた文字分離線により切り離した文字のイメージを
原画像から消去して射影を部分的に取り直すことにより
、以後の切り出しを射影のみで行える可能性を高くし、
切り出し効率を上げることができる。
【0055】また、切り出した文字画像の縦横比とその
文字認識結果の集計値基づいて、文字切り出しサイズ(
枠の縦横比)を推定して文字切り出しを行うことにより
、文字切り出し処理をより効率的に行なうことができる
。さらに、結合文字等のために適正な文字切り出しが行
なえなかった場合にはエラーとして文字認識部及びオペ
レータに判るように光又は音などによって通知すること
により、文字認識部での誤認識を防ぎ、その後の適切な
処置が可能になる。
文字認識結果の集計値基づいて、文字切り出しサイズ(
枠の縦横比)を推定して文字切り出しを行うことにより
、文字切り出し処理をより効率的に行なうことができる
。さらに、結合文字等のために適正な文字切り出しが行
なえなかった場合にはエラーとして文字認識部及びオペ
レータに判るように光又は音などによって通知すること
により、文字認識部での誤認識を防ぎ、その後の適切な
処置が可能になる。
【図1】この発明による文字切り出し方法を実施する文
字読取装置の機能構成を示すブろロック図である。
字読取装置の機能構成を示すブろロック図である。
【図2】図1の文字切出部8による文字切り出し処理の
アルゴリズムを示すフロー図である。
アルゴリズムを示すフロー図である。
【図3】図1の前処理部9による文字認識前処理のアル
ゴリズムを示すフロー図である。
ゴリズムを示すフロー図である。
【図4】図1の文字枠推定手段13による文字枠推定処
理のアルゴリズムを示すフロー図である。
理のアルゴリズムを示すフロー図である。
【図5】文字列の入力パターンに対する垂直及び水平投
影の説明図である。
影の説明図である。
【図6】結合文字及び重なり文字の説明図である。
【図7】文字画像の縦横比の説明図である。
【図8】文字に切れがある場合の射影の説明図ある。
【図9】輪郭追跡についての説明図である。
【図10】原画像の1文字分消去による垂直射影の変化
を示す説明図である。
を示す説明図である。
【図11】文字列イメージからの重なり文字の分離の説
明図である。
明図である。
【図12】垂直射影による文字切り出しの説明図である
。
。
【図13】メモリに記憶する情報の格納形式の説明図で
ある。
ある。
【図14】文字枠サイズの説明図である。
1 画像入力装置
2 入力制御部3 画像メモリ
4 画像処理用ワークメモリ 5 CPU
6 文字列切出部7 OCR制御部
8 文字切出部9 前処
理部 10
文字認識部11 垂直・水平射影手段
12 文字切出手段13 文字枠推定手段
14 正規化処理手段
2 入力制御部3 画像メモリ
4 画像処理用ワークメモリ 5 CPU
6 文字列切出部7 OCR制御部
8 文字切出部9 前処
理部 10
文字認識部11 垂直・水平射影手段
12 文字切出手段13 文字枠推定手段
14 正規化処理手段
Claims (3)
- 【請求項1】 手書き文字列の入力画像から文字認識
できるように1文字分ずつのイメージを切り出す文字切
り出し方法において、入力文字列の原画像イメージに対
して垂直及び水平射影をとって文字の切り出しを行ない
、その切り出した文字画像の縦横比が所定の範囲内にあ
るときにのみ、その文字画像を正規化して輪郭追跡を行
なうことにより文字分離線を求めて1文字を切り離し、
その切り離した1文字の原画像のイメージを消去して前
記射影をとり直して次の文字を切り出すことを特徴とす
る文字切り出し方法。 - 【請求項2】 請求項1記載の文字切り出し方法にお
いて、切り出した文字画像により正しい文字認識結果が
得られた場合の文字画像の縦横比の集計値に基づいて、
適正な文字切り出しサイズを推定することを特徴とする
文字切り出し方法。 - 【請求項3】 請求項1又は2記載の文字切り出し方
法において、適正な文字切り出しが行なえなかった場合
にはエラーとして通知することを特徴とする文字切り出
し方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP3128410A JPH04329492A (ja) | 1991-05-01 | 1991-05-01 | 文字切り出し方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP3128410A JPH04329492A (ja) | 1991-05-01 | 1991-05-01 | 文字切り出し方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH04329492A true JPH04329492A (ja) | 1992-11-18 |
Family
ID=14984088
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP3128410A Pending JPH04329492A (ja) | 1991-05-01 | 1991-05-01 | 文字切り出し方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH04329492A (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH07160813A (ja) * | 1993-12-03 | 1995-06-23 | Nec Corp | 光学文字切出し装置 |
-
1991
- 1991-05-01 JP JP3128410A patent/JPH04329492A/ja active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH07160813A (ja) * | 1993-12-03 | 1995-06-23 | Nec Corp | 光学文字切出し装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US5410611A (en) | Method for identifying word bounding boxes in text | |
JP3343864B2 (ja) | 語体の分離方法 | |
JP3943638B2 (ja) | Ocrを利用しない文書画像中のドロップワードの自動認識方法 | |
JPH09179937A (ja) | 文書画像のセンテンスの境界の自動識別方法 | |
JP4834351B2 (ja) | 文字認識装置及び文字認識方法 | |
JPH08287184A (ja) | 画像切り出し装置及び文字認識装置 | |
JPH09185676A (ja) | 罫線除去方法 | |
JP3615333B2 (ja) | 罫線消去装置 | |
JPH07105312A (ja) | 光学式文字読取装置における文字イメージのごみ除去方法及び装置 | |
JPH11272800A (ja) | 文字認識装置 | |
JPH04329492A (ja) | 文字切り出し方法 | |
JP2868134B2 (ja) | 画像処理方法及び装置 | |
JP3794285B2 (ja) | 光学式文字読取装置 | |
JP3190794B2 (ja) | 文字切り出し装置 | |
JP2868392B2 (ja) | 手書き記号認識装置 | |
JPH04130979A (ja) | 文字画像切出し方法 | |
JP2925270B2 (ja) | 文字読取装置 | |
JP2539026B2 (ja) | 文字切り出し装置 | |
JPH08221518A (ja) | 光学文字読取装置 | |
JPH051510B2 (ja) | ||
JP4571447B2 (ja) | 文字画像抽出プログラム、文字画像抽出方法および文字画像抽出装置 | |
JPH11203406A (ja) | 文字切り出し方法、文字認識方法、文字認識装置および記録媒体 | |
JP2000339408A (ja) | 文字切り出し装置 | |
JP4304920B2 (ja) | 文字列認識装置とそのプログラム | |
JP3039427B2 (ja) | 文字切り出し方式及び方法 |