JPH03233787A - 文字画像抽出装置 - Google Patents

文字画像抽出装置

Info

Publication number
JPH03233787A
JPH03233787A JP2030834A JP3083490A JPH03233787A JP H03233787 A JPH03233787 A JP H03233787A JP 2030834 A JP2030834 A JP 2030834A JP 3083490 A JP3083490 A JP 3083490A JP H03233787 A JPH03233787 A JP H03233787A
Authority
JP
Japan
Prior art keywords
image
character
storage means
row
contact
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2030834A
Other languages
English (en)
Other versions
JP2908495B2 (ja
Inventor
Isao Sugano
功 菅野
Koichi Higuchi
浩一 樋口
Yoshiyuki Yamashita
山下 義征
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP2030834A priority Critical patent/JP2908495B2/ja
Publication of JPH03233787A publication Critical patent/JPH03233787A/ja
Application granted granted Critical
Publication of JP2908495B2 publication Critical patent/JP2908495B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〈産業上の利用分野〉 本発明は、文字認識機能を有する光学式文字読取り装置
 (01)tical C1181’aCter Re
a(ler、以下OCRという〉等において、文字画像
を抽出するための文字画像抽出装置に関するものである
(従来の技術〉 従来、このような分野の技術としては、特公昭62−7
590号公報(文献1)、及び特開昭64−36384
号公報(文献2〉に記載されるものがあった。
例えば、OCRは、各種Ill!票上に記載されている
文字をコンピュータ等に入力する装置として広く普及し
つつある。従来のOCRでは、文字記入枠をドロップア
ウトカラー(OCRが感知できない色)で印刷し、文字
を非ドロップアウトカラー(OCf(が感知できる色〉
で記入するといった制限を設けることにより、入力時に
文字画像のみを光学的に読取るという方式が一般的であ
った。
ところが、このような文字画像抽出方式では、指定され
たドロップアウトカラーで文字記入枠が印刷された帳票
しか用いる事ができず、印刷コストが増加するといった
問題もあり、文字記入枠が非ドロップアウトカラーで印
刷されているものでも、文字画像抽出可能なOCRの要
求が高まり、それに対する種々の提案がなされている。
第2図は、文字が文字記入枠に接している例を示す図で
ある。この図に示すように、従来の提案では、帳票等に
おいて文字記入枠10が非ドロップアウトカラーで描か
れていても、その文字記入枠10内に記入された文字画
像11を抽出することは可能である。しかし、文字記入
枠10に接するように記入さitている文字画像11を
抽出することができなかった。そこで、前記文献1,2
では、このような場合でも文字画像を抽出するための技
術が記載されている。
即ち、Air記文献■の技術では、先ず文字記入枠10
を構成する縦線及び横線と、文字画像11を構成する縦
線及び横線とに対し、太さ及び長さに関してそれぞれ異
なる制限を設定し、文字記入枠↓0の制限に該当する縦
線及び横線を検出する。
そして、前記の検出された縦線及び横線に相当するパタ
ンを消去した後、これら消去した縦線及び横線と、これ
ら以外の文字等が交わっていた部分のパタンを補充する
構成であった。
こ〕”しに対して前記文献2の技術では、入力画像全体
を細線化し、この細線化パタンの文字記入枠10上の屈
折点及び分岐点から分離候補点を抽出する。そして、抽
出された分離候補点と予め定められた分離タイプとから
、分離情報を抽出し7’、: t&、前記入力画像、細
線化パタン及び分離情報を入力とし、前記入力画像の分
離画素を決定し、その分離画素により、前記入力画像か
ら文字画像のみを分離・抽出する構成であった。
(発明が解決しようとする課題〉 しかしながら、上記構成の装置では、次のような課題が
あった。
<a>  前記文献1の技術では、帳票上の画像の性質
と走査部の性質から、縦線及び横線の太さ及び長さに関
する制限を設定することが必要となる。
しかも、抽出文字画像を構成する縦線及び横線のうち、
例外的に文字記入枠]−0を構成する縦線及び横線の線
幅より細く長いものがある場合、その線を文字記入枠1
0として検出して抽出文字画像から消去してしまうため
、正確な文字画像11が抽出できない。さt)tご、文
献1の技術では次のような問題もある。
即ち、第3図(a)、(b)は文字記入枠の削除に伴う
文字線の欠落を示す図であり、同図(a)は文字記入枠
削除前の図、及び同図(b)は文字記入枠削除後の図で
ある。この図に示すように、抽出文字画像が文字記入枠
IOと交差している部分では、その交差部分も文字記入
枠10と共に消去してしまうため、その後、消去された
部分を修正処理する一g・要があり、その修正処理に時
間がかかるという問題もあった。
(b)  前記文献2の技術では、原画像パタンを細線
化する必要があり、これをコンピュータプログラムを用
いたソフトウェアで実現しようとすると、R埋時間が増
大し、逆にこの処理時間を短縮しようとすると、コンピ
ュータのハードウェア量が増加するという問題があった
本発明は前記従来技術が持っていた課題として、抽出文
字と文字記入枠の縦線及び横線の太さと長さに制限が存
在する点と、抽出文字パタンの復元処理あるいは画像パ
タンの細線化に時間がかがるといった点について解決し
た文書画像抽出装置を提供するものである。
(課題を解決するための手段〉 本発明は前記課題を解決するために、入力媒体を光電変
換して2値画像を生成し、その2値画像から文字部分を
切り出して抽出するOCR等の文字画1象抽出装置にお
いて、前記2値画像のうち各文字毎の画像を切り出す文
字切り出し手段と、前記文字切り出し手段で切り出され
た画像を保存するパタン記憶手段と、前記パタン記憶手
段に保存さhf、)画像のうち、処理対象領域内の処理
対象とする1行分または1列分の画像を保存する第Iの
画像保7f手段と、前記第1の画像1呆存手段に1呆存
された画像に対する1行前の上桁分の画1@または1列
前の1列分の画像を保7fする第2の画像保存手段と、
前記第)の画像保存手段に保存さhf、z画像中の黒画
素の連続かAir記処理村象頭域の所定の辺に接してい
るか否かを判定する辺接触判定手段と、黒画素連続M定
手段と、黒画素消去手段とを、皓えたものである。
ここて゛、黒画素連続判定手段は、前記第1の画1泊呆
存手段に1呆存さ1また画像中の黒画像の連続が、前記
第2の画像保存手段に保イfさhた画像中の黒画素の連
続に接しているが否かを判定する機能を有している、ま
た、黒画素消去手段は、前記辺接触′[す定手段及び黒
画素連続判定手段の各判定結果に基づき、黒画素の連続
を消去し、その消去結果に従い、前記パタン記憶手段及
び第2の画像保存手段の各内容を書き換える機能を有し
ている。
(作 用) 本発明によhば、以りのように文字画像抽出装置を構成
したので、入力媒体を光電変換して生成さh7′:2値
画像が、文字切り出し手段に入力されると、文字切り出
し手段は、入力された2値画像のうら、例えば文字記入
枠画像を含む各文字毎の画像等を所定の範囲で切り出し
、その切り出した画像をパタン記憶手段に格納させる。
第1の画像保存手段は、パタン記憶手段に保存された画
像のうち、例えば所定の文字記入枠画像を含む処理対象
語域内の処理対象とする1行分または1列分の画像を保
存する。こhに対して、第2の画1象保存手段は、第1
の画像保存手段に保存された画像の1行(または1列〉
前の1−桁分(または1列分〉の画像を保存する。する
と、辺接触判定手段では、第1の画像保存手段に保存さ
れた画像中の例えば丁つ以上の黒画素の連続か処理対象
領域の所定の辺に接しているか否かを判定し、その判定
結果を黒画素消去手段に与える。また、黒画素連続判定
手段は、第丁の画像保存手段に保存された画像の中の例
えば1つ以上の黒画素の連続が、第2の画(’A (”
l= ’A’手段に保存された画像中の例えば1つ以上
の黒画素の連続に接しているか否かを判定し、その判定
結果を黒画素消去手段に与える。
黒画素消去手段は、辺接触上す定手段及び黒画素連続判
定手段ズ)各判定結果に基づき、黒画素の連続を消去す
るための要件が満たされているか否かを判定し、その要
件が満たされている場合には、黒画素の連続を消去し、
その消去結果に従い、パタン記憶手段及び第2の画像保
存手段の各内容を書き換える。これにより、目的とする
文字パタンを簡単な装置構成で、かつ高速に抽出するこ
とが可能となる。従って、前記課題を解決できるのであ
る。
(実施例) 第1図は、本発明の一実施例を示すもので、OCR等に
おける文字画像抽出装置の機能ブロック図である。
この文字画像抽出装置は、光電変換部2】により読取り
領域内の両像Dinを読取って2値画像に量子1ヒする
読取部20と、該読取部20により読取られた2値画像
をラインバッファ31に保存づ−る画f象記憶部30と
、該画像記憶部30に保存さhた2 h!!画像から文
字画像Doutのみを抽出・出力する文字画像抽出部4
0とで、構成されている。
文字画像抽出部40は、画像記憶部30に保存さhてい
る2値画像を入力し、文字認識の時に妨げとなる文字記
入枠画像を消去し、文字画像り。
IJ tのみを抽出・出力するものである。この文字画
像抽出部40は、各文字記入枠画像を含めた各文字画像
を予め設定された範囲で切り出す文字切り出し手段・1
1と、その文字切り出し手段41により切り出された画
像を保存するレジスタやメモリからなるパタン記憶手段
42と、第I及び第2の画像保存手段43.44とを備
えている。第1第2の画像保存手段43.44の出力側
には、辺接触判定手段45及び黒画素連続判定手段46
が接続され、さ4にその出力側が、黒画素消去手段47
を介してパタン記憶手段42及び第2の画像保存手段4
4に接続されている。
第1の画像保7F手段43は、パタン記憶手段42に保
存さjまた画像のうち、予め設定された1本の文字記入
枠画像を含む領域(これを「R理対象領域」という)内
の処理対象とする1行または1列の画像を保存する機能
を有している。第2の画像保存手段44は、対象とする
行の1行前の1行分の両像、または対象とする列の1列
前の1列分の画像を保存する機能を有している。辺接触
判定手段45は、第1の画像保存手段43に保存された
画像の中の例えば(つ以上連続している黒画素列(これ
を、「黒画素の連続」という)が前記処理対象領域の所
定の辺に接しているか否かを判定するものである。
黒画素連続判定手段46は、第1の画像保存手段43に
検子fさ!゛ムた画像の中の黒画素の連続が、第2の画
像保存手段411に保存された画像の中の黒画素の連続
に接しているが否かを判定する機能を存している。また
、黒画素消去手段47は、辺接触t’11定手段45及
び黒画素連続判定手段・16の各判定結果に基づき、黒
画素の連続を消去し、その消失結果に1にい、パタン記
憶手段42と第2の画像(”1=(r手段44の各内容
を書き換える機能を有している。
第4図(a)〜(c>は文字画1象及び文字記入枠画像
例を示す図であり、同図(a>はライフル・ノブ?31
に保存される画像例を示す図、同図(1))はパタン記
憶手段42内に最初(、こ保存される画像例を示す図、
同図(c)は、文字記入作画1吹50及び文字画像51
における処理対象領域52とその左辺52 a及び呑込
52bを示す図である。また、第5図は第り図の動作を
説明するためのフローチャートである。この第4図及び
第5図を参照しつつ、第1図の動作を説明する。
なお、以下の説明では、説明を簡単にするために、特定
の縦方向の文字記入枠画像を消去する場合に、処理の範
囲を限定して動作説明を行う。
第5図のフローチャートにおいて、先ず、読取部20が
帳票内の予め設定された読取領域の走査を開始すると(
ステップ60)、読取部20は°゛0°° (白画素)
及び’1”(黒画素)の2値に、量子化された画像を走
査順に画素毎に出力するので、その2値画像が順次、画
像記憶部30内のラインバッファ31に保存される(ス
テップ61)。
そのため、第4図(a)に示すような画像が、ラインバ
ッファ31に保存されることになる。
文字切り出し手段41では、予め与えられてる入力帳票
のフォーマット情報に基づき、画像記憶部30に保存さ
れている2値画像の中から、少なくとも文字記入枠側(
,150を含む範囲で各文字画像51を切り出し、その
切り出した画像をパタン記憶手段42に順次保存する(
ステ・・ノブ62>。
その結果、第4図(b)に示すような画像が、パタン記
憶手段42に保存される。なお、文字切り出し手段41
に予め与えられる入力帳票のフォーマ・川・情報は、各
文字画像51の切り出し範囲を示すもので、文字記入枠
画像5oがらどilだけ文字画像51のはみ出しを許容
するかによって決定さi=するものであり、本実施例で
は、例えば帳票上・lジからの距離として与えられるも
のとする。
次に、パタン記憶手段42において、増分変数りに11
期値として1“を設定する(ステップ63〉。本実施例
の文字画像抽出方式では、例えば各行′f、、のl)1
埋を上端の行がら下端の行へ向がって行17′?後、同
様の処理を下端の行から上端の行へ向かって行うように
している。増分変数りは、この時の処理対象行座標の増
分を示すと共に、処理の方向を示す。従って、増分変数
りの値が“1′。
の場合、処理対象行座標の増分が1°゛であると共に、
上端の行から下端の行に向がって処理を行っていること
を示し、また増分変数りの値が1”の場合、処理対象行
座標の増分が1−111であると共に、下端の行か^上
端の行に向がって処理を行っていることを示す。そのた
め、ステップ63では、増分変数りのPj)期値として
“1゛°を設定する。
次に、文字切り出し手段41における行方向座標Yの初
期値として“0パを設定しくステップ64)、第2の画
像保存手段44の内容を全てII OIIにクリアする
(ステップ65〉。ここで、第2の画像保存手段・44
は、り匹埋対象となる行の1行前の1行分の画像を保イ
Yするものであるが、1行目を処理対象行とする場合に
は、その前の1行、つまり切り出し領域外の1行に文字
画fπ51が存在していることか考えにくいので、本実
施例ではそれを考慮しないことにしている。tieって
、第2の画像保存手段44の初期11なとしては、保Y
Iすべき黒画素が全くない状態、つまり全て” o ”
をステ・ツブ65で設定するようにしている。
その陵、行方向座標Yに増分変数りの値を加える(ステ
ップ66〉。この結果、行方向座標Yの値は“1°゛と
なり、第1の画像保存手段43には、1行目の画像が保
存される(ステップ67)。なお、このステップ67に
おける保存画像もまた、例えば予め与えられている入力
帳票のフォーマ・ノ1−情報に示されているものとする
。本実施例の場合、説明を簡単にするために、前記保存
画像の範囲を、第4図(C)の破線で囲まれている部分
のみを文字記入枠画像50の消去対象領域(52)とし
、以下の動作説明を行う。従って、ステップ67におい
て、第1の画像保存手段43に保存さhる画像は、第4
図(c)に示ず処理対象領域52の−L端の1行分の画
像になる。
ステ・lプロ8では、辺接触判定手段45において、第
1の画像保存手段43に保存されている処理χ・を電析
の画像中の黒画素の連続が、第4図(c)に示す処理対
象領域52の左辺52aあるいは右辺52bに接してい
るか否かを判定し、接触している場合にはその黒画素の
連続をそのまま保存する。ステ・ノブ68において、接
触していないという判定結果の場合には、黒画素連続判
定手段46において、その黒画素の連続か第2の画像保
存手段44に保存さilでいる■行前の行画像内のいず
hかの黒画素の連続に接しているか否かを判定する(ス
テップ69)。この結果、接触していると判定された場
合は、そσ)黒画素の連続をそのまま1呆/4”L、接
触していないと判定さitた場合には、黒画素消去手段
47において、その黒画素の連続を消去する(ステップ
70)。
以−Fのステップ68〜ステツプ70までの処理を、第
1−の画像保存手段43に保存されている画像の全ての
黒画素の連続について行い、その結果得られる1行分の
画像を、パタン記憶手段42の処理対象領域52の処理
対象行に書込み(ステップ71〉、さらに結合子すを介
してステップ72で、第2の画像保存手段44にも保存
する。このステップ72の処理は、処理対象となる行の
1行rii7の行側I毛を第2の画(’A I’A存手
段44に保存しておくことに対応する。
以上のステップ66〜ステ・・lプ72までの一連の処
理を、処理対象領域52の上端の行から下端の行までの
それぞれの行について全て行う(ステップ73)。その
後、増分変数りの値を参照しくステップ74)、この値
が“1パの場合には、処理が処理対象領域52の上端の
行から下端の行への1方向のみしか行っていないことを
示すため、増分変数りに” −1”を代入しくステップ
75〉、結合子aを介してステップ6:51\戻る。そ
して、処理対象領域32の下端の行から上端の行に向か
って、ステ・ノブ65〜ステツプ73にかけての処理を
繰り返し、その処理の終了後に、最終的に得らf″Lf
Sパタン記憶手段42の保存画像(Dout)を出力す
る(ステップ76)。この画(iDoutに対して図示
しない手段で文字認識処理を施せば、入力画(S(Di
n)の文字認識が行える。
第6図(a)〜(f>は、第5図の処理を行う際の処理
対象領域52内の画像の変化を、典型的な文字画像・文
字記入枠画像接触の2種類の例を用いた場合を示す図で
ある。
第6図(a)、(d)は、第4図に示す縦方向の文字記
入枠画像50に文字画像51が接触及び交差している場
合の典型的な切り出し例、つまりパタン記憶手段42に
初期設定される画像のうちの処理対象領域52の典型的
な切り出し例を示している。
また、第6図(b)、(C)及び第6図(e)(f>は
、それぞれ同図(a>及び(d)を切り出し画像とした
時の、−実処理後の画像を示している。即ち、第6図(
b)及び′(e)は、それぞit同図(a>及び同図(
d)の画像に対し、て第5図のステップ72までの処理
を片方向、つまり処理対象領域52の上端の行から下端
の行まで行った結果得らiする画像を示ず。さらに第6
図(C)及び(f)は、同図(b)及び(e)に対する
処理終了後の画像をそれぞれ示す。
次に、この第6図(a)〜(f)について、第5図のフ
ローチャーj〜を参照しつつ、第4図における処理対象
領域52内の文字抽出の処理を詳細に説明する。
第6図(a)の画像を処理する場合、先づ゛、第5図の
ステップ65により、第2の画像保I′F手段44がク
リアされ、ステ・ツブ67により、第1の画像保存手段
43には1行口の画像かセットさl′Lる。そして、ス
テップ68〜ステップ70までの処理により、処理対象
領域52の左辺52a及び右辺52bに接触してあらず
、かつ411行の画像(即ち、第2の画像保存手段44
に保存されている画像〉のうち、黒画素の連続に接して
いない黒画素の連続が消去さiする。この場合、第6図
(a)の】行目の黒画素の連続は、横方向の5.6列に
存在するが、文字画像51がv3理対象領域52のブL
′、辺52a及び右辺52bのいf7″Lにも接触して
おらず、かつ第2の画像保存手段44が切期設定として
クリアされているため、5.6列の黒画素の連続は消去
されることになる。
次に第3図のステップ71及びステップ72により、パ
タン記憶手段42の処理対象領域52内の1行口及び第
2の画像保存手段44には、黒画素の連続消去後の画像
がセットされ、ステ・ンプ66により、処理対象行が、
第6図(a)に示″3−叫理t、f象頗域52の2行目
に移る。この行には、黒画素の連続が1列及び5.6列
に存在し、そのため、1列は左辺52aに接しているの
で保存さj′とるが、5.6列は左辺52a及び右辺5
2F)のいずれにも接しておらず、かつ前行にも黒画素
の連続がないため、消去される。以上の処理を下端の行
く166行目まで行うと、パタン記憶手段42内には、
第6図(b)に示すような処理対象領域52の画像が保
存されることになる。
その後、ステップ65により、第2の画像保存手段44
をクリアした後、前記と同様の処理を、処理対象領域5
2の下端の行(166行目から土鍋の行(1行目)まで
行うと、パタン記憶手段42には、第6図(c)に示す
ように、処理対象領域52の画像が得られる。
なお、第6図(b)及び(c)と同様の処理を第6図(
d)に対して行った場合、第6図(e)及び(f>に示
すように画像が変化する。
以上説明したように、第6図(b)、(c)及び(e)
、(f)から明らかなように、第5図のフローチャート
では、行単位のステップ68〜ステツプ72までの処理
を、上端の行から下端の行まで行い、上端の行から下端
の行に沿って、文字記入枠画像50が文字画像51に接
する部分までの、文字記入枠画像50を順次消去してい
く。次に、ステップ68〜ステツプ72までの処理を下
端の行から上端の行まで行い、下端の行から上端の行に
向かって、文字記入枠画像50が文字画像51に接する
部分まて゛の、文字記入枠画像50を順次消去すること
により、文字画像のみをパタン記憶手段42から出力す
るようにしている。
本実施例では、次のような利点を有している。
(i>  本実施例では、黒画素の連続の所定の辺への
接触状況と、前行からの連結状況を判定して文字記入枠
画像50を消去しているので、文字記入枠や罫線等を含
む画像から、文字のみの画像の抽出か的確に行える。従
って、従来の装置では文字画像51と文字記入枠画像5
0のそれぞれに対して存在した色の種類の制限を排除す
ることができ、それによってOCR等の適用範囲が拡大
する。
その上、本実施例では画1象記憶部30に入力される2
値画像に対して画像処理を行うようにしているので、大
容量の多値画像メモリを必要とせず、回路規模の小形化
と、処理速度の高速化が図りるばかりか、低コスト化も
可能となる。
また本実施例ては、文字画像51及び文字記入枠画像5
0等の線幅、あるいは線長とは全く無関係に、文字画像
51のみの的確な抽出が行えるため、読取対象となる帳
票等における線画像に対する制限事項を削減することが
でき、それによって汎用性が向−ヒする。
(ii)  第70(a)〜(C)は、第6図(a)〜
(C)に対応するもので、処理対象領域内の池の画像の
変1ヒを示す図であり、同図(a>は処理対象領域の原
画像例、同図(b)は処理途中の画像、同図(C)は処
理終了後の画像をそR;Fjh示す図である。
第7図(a)に示すように、文字画像51が文字記大枠
画(gA50に接触・交差していない場きでも、第5図
と同様の処理手順により、第71”21(c)に示すよ
うに、文字記入枠画像50を消去し、て文字画像51の
みを的確に抽出することができる。
(iii >  第5図の動作説明では、説明の簡単化
のために、第4図(c)に示すように、消去対象とする
文字記入枠画像50を、右端の縦方向の文字記入枠画像
■箇所に限定し、てその文字記入枠画像の消去を行う処
理について説明したが、池の縦方向の文字記入枠画像5
0も、第5図と同様の処理手順で消去することかできる
(i) 第5図では、縦方向の文字記入枠画像50の消
去処理を行う場合について説明したが、横方向の上・下
の文字記入枠画像に対しても、同様の処理が可能である
即ち、予め各文字記入枠画像を中心付近に含む(rxi
i’i:+R報を文字切り出し手段41等に与え、その
文字切り出し手段41で切り出された画像をパタン記憶
手段42に格納する。そしてパタン記憶手段、12に保
存さitている画像を列方向に走査し、処理対象領域内
の処理り・r象とする1列の画像を第1の画e= 保イ
#手段43に格納すると共に、処理対象とする列の1列
前の1列分の画像を第2の画像保存手段44に格納する
等の処理を行えば、横方向の上・下の文字記入枠画像を
消去して、文字画像のみを的確に抽出できる。
なお、本発明は上記実施例に限定されず、例えば第1図
の各ブロックを個別回路で構成する以外に、文字画像抽
出部40等をコンピュータプログラム等によるソフト今
エアで実行したり、さらに第う図の処理手順を池の処理
手順に変更する等、種々の変形が可能である。
(発明の効果) 以上詳細に説明したように、本発明によ11ば、第1.
第2の画像保存手段、辺接触判定手段、及び黒画素連続
判定手段により、黒画素の連続の所定の辺への接触状況
と、前行または前列からの連結状況を判定し、その判定
結果に基づき、黒画素消去手段によって文字記入枠画像
や罫線画像等を消去するようにしたので、文字記入枠や
罫線等を脅む画像から、文字画像のみを的確に抽出でき
る。
ぼって、従来のように、文字画1象と文字記入枠画像の
それぞれに対して存在した色の種類の制限を除去するこ
とができ、それによってOCR等への適用範囲が拡大す
る。その上、文字切り出し手段に2画像を入力して処理
する構成にしたので、大容量を有する多値の画像メモリ
を必要とせず、回路規模の小形fヒと処理速度の高速化
が図れるばかりか、低コスト化も可能となる。さらに、
本発明て°は文字画像及び文字記入枠画像の線幅あるい
は線長とは無関係に、文字画像のみの抽出が行えるので
、読取対象となる帳票等における線画像に対する制限事
項を削減することが可能となり、それによって汎用性が
著しく向上する。
【図面の簡単な説明】
第1図は本発明の実施例を示す文字画像抽出装置の機能
ブロック図、第2図は文字が記入枠に接している例を示
す図、第3図(a>、(b)は文字記入枠の削除に仲う
文字線の欠落を示す図、第4図(a)〜(c)は文字画
像及び文字記入枠画像の例を示す図、第5図は第1図の
動作を示すフローチャート、第6図(a)〜(f>は処
理対象領域内の画像の変化を示す図、第7図(a)〜(
C)は処理対象領域内の他の画像の変化を示す図である
。 20・・・・・・読取部、30・・・・・・画像記憶部
、40・・・・・・文字画像抽出部、41・・・・・・
文字切り出し手段、42・・・・・・パタン記憶手段、
43.44・・・・・・第1゜第2の画像保存手段、4
5・・・・・・辺接触判定手段、46・・・・・・黒画
素連続判定手段、47・・・・・・黒画素消去手段。

Claims (1)

  1. 【特許請求の範囲】 入力媒体を光電変換して2値画像を生成し、その2値画
    像から文字部分を切り出して抽出する文字画像抽出装置
    において、 前記2値画像のうち各文字毎の画像を切り出す文字切り
    出し手段と、 前記文字切り出し手段で切り出された画像を保存するパ
    タン記憶手段と、 前記パタン記憶手段に保存された画像のうち、処理対象
    領域内の処理対象とする1行分または1列分の画像を保
    存する第1の画像保存手段と、前記第1の画像保存手段
    に保存された画像に対する1行前の1行分の画像または
    1列前の1列分の画像を保存する第2の画像保存手段と
    、 前記第1の画像保存手段に保存された画像中の黒画素の
    連続が前記処理対象領域の所定の辺に接しているか否か
    を判定する辺接触判定手段と、前記第1の画像保存手段
    に保存された画像中の黒画像の連続が、前記第2の画像
    保存手段に保存された画像中の黒画素の連続に接してい
    るか否かを判定する黒画素連続判定手段と、 前記辺接触判定手段及び黒画素連続判定手段の各判定結
    果に基づき黒画素の連続を消去し、その消去結果に従い
    前記パタン記憶手段及び第2の画像保存手段の各内容を
    書き換える黒画素消去手段とを、 備えたことを特徴とする文字画像抽出装置。
JP2030834A 1990-02-09 1990-02-09 文字画像抽出装置 Expired - Lifetime JP2908495B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2030834A JP2908495B2 (ja) 1990-02-09 1990-02-09 文字画像抽出装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2030834A JP2908495B2 (ja) 1990-02-09 1990-02-09 文字画像抽出装置

Publications (2)

Publication Number Publication Date
JPH03233787A true JPH03233787A (ja) 1991-10-17
JP2908495B2 JP2908495B2 (ja) 1999-06-21

Family

ID=12314729

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2030834A Expired - Lifetime JP2908495B2 (ja) 1990-02-09 1990-02-09 文字画像抽出装置

Country Status (1)

Country Link
JP (1) JP2908495B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5989880A (en) * 1990-01-08 1999-11-23 Nika Health Products Ltd. Method of preparing lysozyme dimers
JP2016072958A (ja) * 2014-09-30 2016-05-09 コニカ ミノルタ ラボラトリー ユー.エス.エー.,インコーポレイテッド 文書画像における縦線および横線の検出および削除

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5989880A (en) * 1990-01-08 1999-11-23 Nika Health Products Ltd. Method of preparing lysozyme dimers
US6316236B1 (en) 1990-01-08 2001-11-13 Nika Health Products Limited Lysozyme dimer
JP2016072958A (ja) * 2014-09-30 2016-05-09 コニカ ミノルタ ラボラトリー ユー.エス.エー.,インコーポレイテッド 文書画像における縦線および横線の検出および削除

Also Published As

Publication number Publication date
JP2908495B2 (ja) 1999-06-21

Similar Documents

Publication Publication Date Title
JP3504054B2 (ja) 文書処理装置および文書処理方法
US5048107A (en) Table region identification method
US6327384B1 (en) Character recognition apparatus and method for recognizing characters
US7567708B2 (en) Apparatus and method for image processing
JPH03122773A (ja) 画像形成装置
US5164996A (en) Optical character recognition by detecting geo features
CN111626145B (zh) 一种简捷有效的残缺表格识别及跨页拼接方法
JP3795238B2 (ja) 文書画像処理装置及び文書画像処理方法
CN111126266A (zh) 文本处理方法、文本处理系统、设备及介质
JPH03233787A (ja) 文字画像抽出装置
JP2003046746A (ja) 画像処理方法及び画像処理装置
JPH04255080A (ja) 画像入力装置
JP2721415B2 (ja) 文字画像抽出方法
JP2003317107A (ja) 罫線抽出方法及び装置
JP2003216958A (ja) 多角形検出装置、多角形検出方法及び多角形検出プログラム
JP2954218B2 (ja) 画像処理方法及び装置
JPH06337929A (ja) 図面管理方法および装置
JP3502130B2 (ja) 表認識装置および表認識方法
JP2789647B2 (ja) 線画像認識方法
CN115695670A (zh) 用于便携式扫描设备多行扫描的方法及相关产品
JPH09161070A (ja) 領域検出方法および装置
JPH08221518A (ja) 光学文字読取装置
JPS6214263A (ja) 文書画像処理方式
JP2001022884A (ja) 文字認識装置
JPH01189787A (ja) 特徴抽出方法及び特徴抽出装置