JP2908495B2 - 文字画像抽出装置 - Google Patents

文字画像抽出装置

Info

Publication number
JP2908495B2
JP2908495B2 JP2030834A JP3083490A JP2908495B2 JP 2908495 B2 JP2908495 B2 JP 2908495B2 JP 2030834 A JP2030834 A JP 2030834A JP 3083490 A JP3083490 A JP 3083490A JP 2908495 B2 JP2908495 B2 JP 2908495B2
Authority
JP
Japan
Prior art keywords
image
character
stored
line
storage unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP2030834A
Other languages
English (en)
Other versions
JPH03233787A (ja
Inventor
功 菅野
浩一 樋口
義征 山下
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP2030834A priority Critical patent/JP2908495B2/ja
Publication of JPH03233787A publication Critical patent/JPH03233787A/ja
Application granted granted Critical
Publication of JP2908495B2 publication Critical patent/JP2908495B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Description

【発明の詳細な説明】 (産業上の利用分野) 本発明は、文字認識機能を有する光学式文字読取り装
置(OPtical Character Reader、以下OCRという)等に
おいて、文字画像を抽出するための文字画像抽出装置に
関するものである。
(従来の技術) 従来、このような分野の技術としては、特公昭62-759
0号公報(文献1)、及び特開昭64-36384号公報(文献
2)に記載されるものがあった。
例えば、OCRは、各種帳票上に記載されている文字を
コンピュータ等に入力する装置として広く普及しつつあ
る。従来のOCRでは、文字記入枠をドロップアウトカラ
ー(OCRが感知できない色)で印刷し、文字を非ドロッ
プアウトカラー(OCRが感知できる色)で記入するとい
った制限を設けることにより、入力時に文字画像のみを
光学的に読取るという方式が一般的であった。
ところが、このような文字画像抽出方式では、指定さ
れたドロップアウトカラーで文字記入枠が印刷された帳
票しか用いる事ができず、印刷コストが増加するといっ
た問題もあり、文字記入枠が非ドロップアウトカラーで
印刷されているものでも、文字画像抽出可能なOCRの要
求が高まり、それに対する種々の提案がなされている。
第2図は、文字が文字記入枠に接している例を示す図
である。従来のOCRでは、文字記入枠10に接するように
記入されている文字画像11を抽出することができなかっ
た。そこで、前記文献1,2では、このような場合でも文
字画像を抽出するための技術が記載されている。
即ち、前記文献1の技術では、先ず文字記入枠10を構
成する縦線及び横線と、文字画像11を、構成する縦線及
び横線とに対し、太さ及び長さに関してそれぞれ異なる
制限を設定し、文字記入枠10の制限に該当する縦線及び
横線を検出する。そして、前記の検出された縦線及び横
線に相当するパタンを消去した後、これら消去した縦線
及び横線と、これら以外の文字等が交わっていた部分の
パタンを補充する構成であった。
これに対して前記文献2の技術では、入力画像全体を
細線化し、この細線化パタンの文字記入枠10土の屈折点
及び分岐点から分離候補点を抽出する。そして、抽出さ
れた分離候補点と予め定められた分離タイプとから、分
離情報を抽出した後、前記入力画像、細線化パタン及び
分離情報を入力とし、前記入力画像の分離画素を決定
し、その分離画素により、前記入力画像から文字画像の
みを分離・抽出する構成であった。
(発明が解決しようとする課題) しかしながら、上記構成の装置では、次のような課題
があった。
(a) 前記文献1の技術では、帳票上の画像の性質と
走査部の性質から、縦線及び横線の太さ及び長さに関す
る制限を設定することが必要となる、しかも、抽出文字
画像を構成する縦線及び横線のうち、例外的に文字記入
枠10を構成する縦線及び横線の線幅より細く長いものが
ある場合、その線を文字記入枠10として検出して描出文
字画像から消去してしまうため、正確な文字画像11が抽
出できない。さらに、文献1の技術では次のような問題
もある。
即ち、第3図(a),(b)は文字記入枠の削除に伴
う文字線の欠落を示す図であり、同図(a)は文字記入
枠削除前の図、及び同図(b)は文字記入枠削除後の図
である。この図に示すように、抽出文字画像が文字記入
枠10と交差している部分では、その交差部分も文字記入
枠10と共に消去してしまうため、その後、消去された部
分を修正処理する必要があり、その修正処理に時間がか
かるという問題もあった。
(b) 前記文献2の技術では、原画像パタンを細線化
する必要があり、これをコンピュータプログラムを用い
たソフトウェアで実現しようとすると、処理時間が増大
し、逆にこの処理時間を短縮しようとすると、コンピュ
ータのハードウェア量が増加するという問題があった。
本発明は前記従来技術が持っていた課題として、抽出
文字と文字記入枠の縦線及び横線の太さと長さに制限が
存在する点と、抽出文字パタンの復元処理あるいは画像
パタンの細線化に時間がかかるといった点について解決
した文書画像抽出装置を提供するものである。
(課題を解決するための手段) 本発明は前記課題を解決するために、入力媒体を光電
変換して2値画像を生成し、その2値画像から文字部分
を切り出して抽出するOCR等の文字画像描出装置におい
て、前記2値画像のうち各文字毎の画像を切り出す文字
切り出し手段と、前記文字切り出し手段で切り出された
画像を保存するパタン記憶手段と、前記パタン記憶手段
に保存された画像中に予め設定された1本の文字記入枠
画像を含む処理対象領域を設定し、その処理対象領域内
の1行分(または1列分)の画像を保存する第1の画像
保存手段と、前記第1の画像保存手段に保存された画像
に対する1行前の1行分の画像(または1列前の1列分
の画像)を保存する第2の画像保存手段と、前記第1の
画像保存手段に保存された画像中の黒画素の連続が前記
処理対象領域の所定の辺に接しているか否かを判定する
辺接触判定手段と、黒画素連続判定手段と、黒画素消去
手段とを、備えたものである。
ここで、黒画素連続判定手段は、前記第1の画像保存
手段に保存された画像中の黒画素の連続が、前記第2の
画像保存手段に保存された画像中の黒画素の連続に接し
ているか否かを判定する機能を有している、また、黒画
素消去手段は、前記辺接触判定手段及び黒画素連続判定
手段の各判定結果に基づき、黒画素の連続を消去し、そ
の消去結果に従い、前記パタン記憶手段及び第2の画像
保存手段の各内容を書き換える機能を有している。
(作用) 本発明によれば、以上のように文字画像抽出装置を構
成したので、入力媒体を光電変換して生成された2値画
像が、文字切り出し手段に入力されると、文字切り出し
手段は、入力された2値画像のうち、例えば文字記入枠
画像を含む各文字毎の画像等を所定の範囲で切り出し、
その切り出した画像をパタン記憶手段に格納させる。第
1の画像保存手段は、パタン記憶手段に保存された画像
のうち、例えば所定の文字記入枠画像を含む処理対象領
域内の処理対象とする1行分(または1列分)の画像を
保存する。これに対して、第2の画像保存手段は、第1
の画像保存手段に保存された画像の1行(または1列)
前の1行分(または1列分)の画像を保存する。する
と、辺接触判定手段では、第1の画像保存手段に保存さ
れた画像中の例えば1つ以上の黒画素の連続が処理対象
領域の所定の辺に接しているか否かを判定し、その判定
結果を黒画素消去手段に与える。また、黒画素連続判定
手段は、第1の画像保存手段に保存された画像の中の例
えば1つ以上の黒画素の連続が、第2の画像保存手段に
保存された画像中の例えば1つ以上の黒画素の連続に接
しているか否かを判定し、その判定結果を黒画素消去手
段に与える。
黒画素消去手段は、辺接触判定手段及び黒画素連続判
定手段の各判定結果に基づき、黒画素の連続を消去する
ための要件が満たされているか否かを判定し、その要件
が満たされている場合には、黒画素の連続を消去し、そ
の消去結果に従い、パタン記憶手段及び第2の画像保存
手段の各内容を書き換える。これにより、目的とする文
字パタンを簡単な装置構成で、かつ高速に抽出すること
が可能となる。従って、前記課題を解決できるのであ
る。
(実施例) 第1図は、本発明の一実施例を示すもので、OCR等に
おける文字画像抽出装置の機能ブロック図である。
この文字画像抽出装置は、光電変換部21により読取り
領域内の画像Dinを読取って2値画像に量子化する読取
部20と、該読取部20により読取られた2値画像をライン
バッファ31に保存する画像記憶部30と、該画像記憶部30
に保存された2値画像から文字画像Doutのみを抽出・出
力する文字画像抽出部40とで、構成されている。
文字画像抽出部40は、画像記憶部30に保存されている
2値画像を入力し、文字認識の時に妨げとなる文字記入
枠画像を消去し、文字画像Doutのみを抽出・出力するも
のである。この文字画像抽出部40は、各文字記入枠画像
を含めた各文字画像を予め設定された範囲で切り出す文
字切り出し手段41と、その文字切り出し手段41により切
り出された画像を保存するレジスタやメモリからなるパ
タン記憶手段42と、第1及び第2の画像保存手段43,44
とを備えている。第1,第2の画像保存手段43,44の出力
側には、辺接触判定手段45及び黒画素連続判定手段46が
接続され、さらにその出力側が、黒画素消去手段47を介
してパタン記憶手段42双び第2の画像保存手段44に接続
されている。
第1の画像保存手段43は、パタン記憶手段42に保存さ
れた画像のうち、予め設定された1本の文字記入枠画像
を含む領域(これを「処理対象領域」という。この処理
対象領域は、文字記入枠の1本が含まれるように、例え
ば、パタン記憶手段42内の画像中の外郭からの距離等で
与えられる。)内の任意の1行または1列の画像を保存
する機能を有している。第2の画像保存手段44は、処理
対象とする行の1行前の1行分の画像、または処理対象
とする列の1列前の1列分の画像を保存する機能を有し
ている。辺接触判定手段45は、第1の画像保存手段43に
保存された画像の中の例えば1つ以上連続している黒画
素列(これを、「黒画素の連続」という)が前記処理対
象領域の所定の辺に接しているか否かを判定するもので
ある。
黒画素連続判定手段46は、第1の画像保存手段43に保
存された画像の中の黒画素の連続が、第2の画像保存手
段44に保存された画像の中の黒画素の連続に接している
か否かを判定する機能を有している。また、黒画素消去
手段47は、辺接触判定手段45双び黒画素連続判定手段46
の各判定結果に基づき、黒画素の連続を消去し、その消
去結果に従い、パタン記憶手段42と第2の画像保存手段
44の各内容を書き換える機能を有している。
第4図(a)〜(c)は文字画像及び文字記入枠画像
例を示す図であり、同図(a)はラインバッファ31に保
存される画像例を示す図、同図(b)はパタン記憶手段
42内に最初に保存される画像例を示す図、同図(C)
は、文字記入枠画像50及び文字画像51における処理対象
領域52とその左辺52a及び右辺52bを示す図である。ま
た、第5図は第1図の動作を説明するためのフローチャ
ートである。この第4図及び第5図を参照しつつ、第1
図の動作を説明する。
なお、以下の説明では、説明を簡単にするために、特
定の縦方向の文字記入枠画像を消去する場合に、処理の
範囲を限定して動作説明を行う。
第5図のフローチャートにおいて、先ず、読取部20が
帳票内の予め設定された読取領域の走査を開始すると
(ステップ60)、読取部20は“0"(白画素)及び“1"
(黒画素)の2値に量子化された画像を走査順に画素毎
に出力するので、その2値画像が順次、画像記憶部30内
のラインバッファ31に保存される(ステップ61)。その
ため、第4図(a)に示すような画像が、ラインバッフ
ァ31に保存されることになる。
文字切り出し手段41では、予め与えられる入力帳票の
フォーマット情報に基づき、画像記憶部30に保存されて
いる2値画像の中から、少なくとも文字記入枠画像50を
含む範囲で各文字画像51を切り出し、その切り出した画
像をパタン記憶手段42に順次保存する(ステップ62)。
その結果、第4図(b)に示すような画像が、パタン記
憶手段42に保存される。なお、文字切り出し手段41に予
め与えられる入力帳票のフォーマット情報は、各文字画
像51の切り出し範囲を示すもので、文字記入枠画像50か
らどれだけ文字画像51のはみ出しを許容するかによって
決定されるものであり、本実施例では、例えば帳票エッ
ジからの距離として与えられるものとする。
次に、パタン記憶手段42において、増分変数Dに初期
値として“1"を設定する(ステップ63)。本実施例の文
字画像抽出方式では、例えば各行毎の処理を上端の行か
ら下端の行へ向かって行った後、同様の処理を下端の行
から上端の行へ向かって行うようにしている。増分変数
Dは、この時の処理対象行座標の増分を示すと共に、処
理の方向を示す。従って、増分変数Dの値が“1"の場
合、処理対象行座標の増分が“1"であると共に、上端の
行から下端の行に向かって処理を行っていることを示
し、また増分変数Dの値が“−1"の場合、処理対象行座
標の増分が“−1"であると共に、下端の行から上端の行
に向かって処理を行っていることを示す。そのため、ス
テップ63では、増分変数Dの初期値として“1"を設定す
る。
次に、文字切り出し手段41における行方向座標Yの初
期値として“0"を設定し(ステップ64)、第2の画像保
存手段44の内容を全て“0"にクリアする(ステップ6
5)。ここで、第2の画像保存手段44は、処理対象とな
る行の1行前の1行分の画像を保存するものであるが、
1行目を処理対象行とする場合には、その前の1行、つ
まり切り出し領域外の1行に文字画像51が存在している
ことが考えにくいので、本実施例ではそれを考慮しない
ことにしている。従って、第2の画像保存手段44の初期
値としては、保存すべき黒画素が全くない状態、つまり
全て“0"をステップ65で設定するようにしている。
その後、行方向座標Yに増分変数Dの値を加える(ス
テップ66)。この結果、行方向座標Yの値は“1"とな
り、第1の画像保存手段43には、1行目の画像が保存さ
れる(ステップ67)。なお、このステップ67における保
存画像もまた、例えば予め与えられている入力帳票のフ
ォーマット情報に示されているものとする。本実施例の
場合、説明を簡単にするために、前記保存画像の範囲
を、第4図(c)の破線で囲まれている部分のみを文字
記入枠画像50の消去対象領域(52)とし、以下の動作説
明を行う。従って、ステップ67において、第1の画像保
存手段43に保存される画像は、第4図(c)に示す処理
対象領域52の上端の1行分の画像になる。
ステップ68では、辺接触判定手段45において、第1の
画像保存手段43に保存されている処理対象行の画像中の
黒画素の連続が、第4図(c)に示す処理対象領域52の
左辺52aあるいは右辺52bに接しているか否かを判定し、
接触している場合にはその黒画素の連続をそのまま保存
する。ステップ68において、接触していないという判定
結果の場合には、黒画素連続判定手段46において、その
黒画素の連続が第2の画像保存手段44に保存されている
1行前の行画像内のいずれかの黒画素の連続に接してい
るか否かを判定する(ステップ69)。この結果、接触し
ていると判定された場合は、その黒画素の連続をそのま
ま保存し、接触していないと判定された場合には、黒画
素消去手段47において、その黒画素の連続を消去する
(ステップ70)。
以上のステップ68〜ステップ70までの処理を、第1の
画像保存手段43に保存されている画像の全ての黒画素の
連続について行い、その結果得られる1行分の画像を、
パタン記憶手段42の処理対象領域52の処理対象行に書込
み(ステップ71)、さらに結合子bを介してステップ72
で、第2の画像保存手段44にも保存する。このステップ
72の処理は、処理対象となる行の1行前の行画像を第2
の画像保存手段44に保存しておくことに対応する。
以上のステップ66〜ステップ72までの一連の処理を、
処理対象領域52の上端の行から下端の行までのそれぞれ
の行について全て行う(ステップ73)。その後、増分変
数Dの値を参照し(ステップ74)、この値が“1"の場合
には、処理が処理対象領域52の上端の行がら下端の行へ
の1方向のみしか行っていないことを示すため、増分変
数Dに“−1"を代入し(ステップ75)、結合子aを介し
てステップ65へ戻る。そして、処理対象領域52の下端の
行から上端の行に向かって、ステップ65〜ステップ73に
かけての処理を繰り返し、その処理の終了後に、最終的
に得られたパタン記憶手段42の保存画像(Dout)を出力
する(ステップ76)。この画像Doutに対して図示しない
手段で文字認識処理を施せば、入力画像(Din)の文字
認識が行える。
第6図(a)〜(f)は、第5図の処理を行う際の処
理対象領域52内の画像の変化を、典型的な文字画像・文
字記入枠画像接触の2種類の例を用いた場合を示す図で
ある。
第6図(a),(d)は、第4図に示す縦方向の文字
記入枠画像50に文字画像51が接触及び交差している場合
の典型的な切り出し例、つまりパタン記憶手段42に初期
設定される画像のうちの処理対象領域52の典型的な切り
出し例を示している。
また、第6図(b),(c)及び第6図(e),
(f)は、それぞれ同図(a)及び(d)を切り出し画
像とした時の、一定処理後の画像を示している。即ち、
第6図(b)及び(e)は、それぞれ同図(a)及び同
図(d)の画像に対して第5図のステップ72までの処理
を片方向、つまり処理対象領域52の上端の行から下端の
行まで行った結果得られる画像を示す。さらに第6図
(c)及び(f)は、同図(b)及び(e)に対する処
理終了後の画像をそれぞれ示す。
次に、この第6図(a)〜(f)について、第5図の
フローチャートを参照しつつ、第4図における処理対象
領域52内の文字抽出の処理を詳細に説明する。
第6図(a)の画像を処理する場合、先ず、第5図の
ステップ65により、第2の画像保存手段44がクリアさ
れ、ステップ67により、第1の画像保存手段43には1行
目の画像がセットされる。そして、ステップ68〜ステッ
プ70までの処理により、処理対象領域52の左辺52a及び
右辺52bに接触しておらず、かつ前行の画像(即ち、第
2の画像保存手段44に保存されている画像)のうち、黒
画素の連続に接していない黒画素の連続が消去される。
この場合、第6図(a)の1行目の黒画素の連続は、横
方向の5,6列に存在するが、文字画像51が処理対象領域5
2の左辺52a及び右辺52bのいずれにも接触しておらず、
かつ第2の画像保存手段44が初期設定としてクリアされ
ているため、5,6列の黒画素の連続は消去されることに
なる。
次に第5図のステップ71及びステップ72により、パタ
ン記憶手段42の処理対象領域52内の1行目及び第2の画
像保存手段44には、黒画素の連続消去後の画像がセット
され、ステップ66により、処理対象行が、第6図(a)
に示す処理対象領域52の2行目に移る。この行には、黒
画素の連続が1列及び5,6列に存在し、1列は左辺52aに
接しているので保存されるが、5,6列は左辺52a及び右辺
52bのいずれにも接しておらず、かつ第2の画像保存手
段44に保存されている前行の画像にも黒画素の連続がな
いため、消去される。以上の処理を下端の行(16行目)
まで行うと、パタン記憶手段42内には、第6図(b)に
示すような処理対象領域52の画像が保存されることにな
る。
その後、ステップ65により、第2の画像保存手段44を
クリアした後、前記と同様の処理を、処理対象領域52の
下端の行(16行目)から上端の行(1行目)まで行う
と、パタン記憶手段42には、第6図(c)に示すよう
に、処理対象領域52の画像が得られる。
なお、第6図(b)及び(c)と同様の処理を第6図
(d)に対して行った場合、第6図(e)及び(f)に
示すように画像が変化する。
以上説明したように、第6図(b),(c)及び
(e),(f)から明らかなように、第5図のフローチ
ャートでは、行単位のステップ68〜ステップ72までの処
理を、上端の行から下端の行まで行い、上端の行から下
端の行に沿って、文字記入枠画像50が文字画像51に接す
る部分までの、文字記入枠画像50を順次消去していく。
次に、ステップ68〜ステップ72までの処理を下端の行か
ら上端の行まで行い、下端の行から上端の行に向かっ
て、文字記入枠画像50が文字画像51に接する部分まで
の、文字記入枠画像50を順次消去することにより、文字
画像のみをパタン記憶手段42から出力するようにしてい
る。
本実施例では、次のような利点を有している。
(i) 本実施例では、黒画素の連続の所定の辺への接
触状況と、前行からの連結状況を判定して文字記入枠画
像50を消去しているので、文字記入枠や罫線等を含む画
像から、文字のみの画像の抽出が的確に行える。従っ
て、従来の装置では文字画像51と文字記入枠画像50のそ
れぞれに対して存在した色の種類の制限を排除すること
ができ、それによってOCR等の適用範囲が拡大する。そ
の上、本実施例では画像記憶部30に入力される2値画像
に対して画像処理を行うようにしているので、大容量の
多値画像メモリを必要とせず、回路規模の小形化と、処
理速度の高速化が図れるばかりか、低コスト化も可能と
なる。
また本実施例では、文字画像51及び文字記入枠画像50
等の線幅、あるいは線長とは全く無関係に、文字画像51
のみの的確な抽出が行えるため、読取対象となる帳票等
における線画像に対する制限事項を削減することがで
き、それによって汎用性が向上する。
(ii) 第7図(a)〜(c)は、第6図(a)〜
(c)に対応するもので、処理対象領域内の他の画像の
変化を示す図であり、同図(a)は処理対象領域の原画
像例、同図(b)は処理途中の画像、同図(c)は処理
終了後の画像をそれぞれ示す図である。
第7図(a)に示すように、文字画像51が文字記入枠
画像50に接触・交差していない場合でも、第5図と同様
の処理手順により、第7図(c)に示すように、文字記
入枠画像50を消去して文字画像51のみを的確に抽出する
ことができる。
(iii) 第5図の動作説明では、説明の簡単化のため
に、第4図(c)に示すように、消去対象とする文字記
入枠画像50を、右端の縦方向の文字記入枠画像1箇所に
限定してその文字記入枠画像の消去を行う処理について
説明したが、他の縦方向の文字記入枠画像50も、第5図
と同様の処理手順で消去することができる。
(iv) 第5図では、縦方向の文字記入枠画像50の消去
処理を行う場合について説明したが、横方向の上・下の
文字記入枠画像に対しても、同様の処理が可能である。
即ち、パタン記憶手段42に保存されている画像を列方
向に走査し、処理対象領域内の処理対象とする1列の画
像を第1の画像保存手段43に格納すると共に、処理対象
とする列の1列前の1列分の画像を第2の画像保存手段
44に格納する等の処理を行えば、横方向の上・下の文字
記入枠画像を消去して、文字画像のみを的確に抽出でき
る。
なお、本発明は上記実施例に限定されず、例えば第1
図の各ブロックを個別回路で構成する以外に、文字画像
抽出部40等をコンピュータプログラム等によるソフトウ
エアで実行したり、さらに第5図の処理手順を他の処理
手順に変更する等、種々の変形が可能である。
(発明の効果) 以上詳細に説明したように、本発明によれば、第1,第
2の画像保存手段、辺接触判定手段、及び黒画素連続判
定手段により、黒画素の連続の所定の辺への接触状況
と、前行または前列からの連結状況を判定し、その判定
結果に基づき、黒画素消去手段によって文字記入枠画像
や罫線画像等を消去するようにしたので、文字記入枠や
罫線等を含む画像から、文字画像のみを的確に抽出でき
る。従って、従来のように、文字画像と文字記入枠画像
のそれぞれに対して存在した色の種類の制限を除去する
ことができ、それによってOCR等への適用範囲が拡大す
る。その上、文字切り出し手段に2値の画像を入力して
処理する構成にしたので、大容量を有する多値の画像メ
モリを必要とせず、回路規模の小形化と処理速度の高速
化が図れるばかりか、低コスト化も可能となる。さら
に、本発明では文字画像及び文字記入枠画像の線幅ある
いは線長とは無関係に、文字画像のみの抽出が行えるの
で、読取対象となる帳票等における線画像に対する制限
事項を削減することが可能となり、それによって汎用性
が著しく向上する。
【図面の簡単な説明】 第1図は本発明の実施例を示す文字画像抽出装置の機能
ブロック図、第2図は文字が記入枠に接している例を示
す図、第3図(a),(b)は文字記入枠の削除に伴う
文字線の欠落を示す図、第4図(a)〜(c)は文字画
像及び文字記入枠画像の例を示す図、第5図は第1図の
動作を示すフローチャート、第6図(a)〜(f)は処
理対象領域内の画像の変化を示す図、第7図(a)〜
(c)は処理対象領域内の他の画像の変化を示す図であ
る。 20……読取部、30……画像記憶部、40……文字画像抽出
部、41……文字切り出し手段、42……パタン記憶手段、
43,44……第1,第2の画像保存手段、45……辺接触判定
手段、46……黒画素連続判定手段、47……黒画素消去手
段。
───────────────────────────────────────────────────── フロントページの続き (58)調査した分野(Int.Cl.6,DB名) G06K 9/34 G06K 9/20

Claims (1)

    (57)【特許請求の範囲】
  1. 【請求項1】入力媒体を光電変換して2値画像を生成
    し、その2値画像から文字部分を切り出して抽出する文
    字画像抽出装置において、 前記2値画像のうち各文字毎の画像を切り出す文字切り
    出し手段と、 前記文字切り出し手段で切り出された画像を保存するパ
    タン記憶手段と、 前記パタン記憶手段に保存された画像中に予め設定され
    た1本の文字記入枠画像を含む処理対象領域を設定し、
    その処理対象領域内の1行分または1列分の画像を保存
    する第1の画像保存手段と、 前記第1の画像保存手段に保存された画像に対する1行
    前の1行分の画像または1列前の1列分の画像を保存す
    る第2の画像保存手段と、 前記第1の画像保存手段に保存された画像中の黒画素の
    連続が前記処理対象領域の所定の辺に接しているか否か
    を判定する辺接触判定手段と、 前記第1の画像保存手段に保存された画像中の黒画素の
    連続が、前記第2の画像保存手段に保存された画像中の
    黒画素の連続に接しているか否かを判定する黒画素連続
    判定手段と、 前記辺接触判定手段及び黒画素連続判定手段の各判定結
    果に基づき黒画素の連続を消去し、その消去結果に従い
    前記パタン記憶手段及び第2の画像保存手段の各内容を
    書き換える黒画素消去手段とを、 備えたことを特徴とする文字画像抽出装置。
JP2030834A 1990-02-09 1990-02-09 文字画像抽出装置 Expired - Lifetime JP2908495B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2030834A JP2908495B2 (ja) 1990-02-09 1990-02-09 文字画像抽出装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2030834A JP2908495B2 (ja) 1990-02-09 1990-02-09 文字画像抽出装置

Publications (2)

Publication Number Publication Date
JPH03233787A JPH03233787A (ja) 1991-10-17
JP2908495B2 true JP2908495B2 (ja) 1999-06-21

Family

ID=12314729

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2030834A Expired - Lifetime JP2908495B2 (ja) 1990-02-09 1990-02-09 文字画像抽出装置

Country Status (1)

Country Link
JP (1) JP2908495B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5989880A (en) * 1990-01-08 1999-11-23 Nika Health Products Ltd. Method of preparing lysozyme dimers
US9275030B1 (en) * 2014-09-30 2016-03-01 Konica Minolta Laboratory U.S.A., Inc. Horizontal and vertical line detection and removal for document images

Also Published As

Publication number Publication date
JPH03233787A (ja) 1991-10-17

Similar Documents

Publication Publication Date Title
US5048107A (en) Table region identification method
JP3338537B2 (ja) 画像傾き検出装置
CA2019134C (en) Method for compressing and decompressing forms by means of very large symbol matching
EP0843275B1 (en) Pattern extraction apparatus and method for extracting patterns
JPH07105312A (ja) 光学式文字読取装置における文字イメージのごみ除去方法及び装置
JP2908495B2 (ja) 文字画像抽出装置
JP2721415B2 (ja) 文字画像抽出方法
JP2796561B2 (ja) 表形式文書認識方式
JP2803736B2 (ja) 文字認識方式
JP4040231B2 (ja) 文字抽出方法及び装置並びに記憶媒体
JP2708604B2 (ja) 文字認識方法
JP3199033B2 (ja) 光学式文字読取方法、及び光学式文字読取装置
JP3147281B2 (ja) アンダライン抽出方法
JP2003317107A (ja) 罫線抽出方法及び装置
JP3191265B2 (ja) 画像入力装置およびその画像入力制御方法
JP3502130B2 (ja) 表認識装置および表認識方法
JP2613211B2 (ja) 画像入力装置
JP2827288B2 (ja) 文字認識装置
JPS609887Y2 (ja) 文字読取装置における前処理回路
JP2954218B2 (ja) 画像処理方法及び装置
JPS6343788B2 (ja)
JP3084833B2 (ja) 特徴抽出装置
JPH09238247A (ja) 光学式文字読取装置
JPH0271379A (ja) 画像処理装置
JPH1040334A (ja) パターン抽出装置及びパターン領域の切り出し方法