JP2964980B2 - 光学的文字認識における直線成分検出方法及び装置 - Google Patents

光学的文字認識における直線成分検出方法及び装置

Info

Publication number
JP2964980B2
JP2964980B2 JP9079786A JP7978697A JP2964980B2 JP 2964980 B2 JP2964980 B2 JP 2964980B2 JP 9079786 A JP9079786 A JP 9079786A JP 7978697 A JP7978697 A JP 7978697A JP 2964980 B2 JP2964980 B2 JP 2964980B2
Authority
JP
Japan
Prior art keywords
block
linear
linear component
component
division
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP9079786A
Other languages
English (en)
Other versions
JPH10275232A (ja
Inventor
武司 長谷川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
Nippon Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Electric Co Ltd filed Critical Nippon Electric Co Ltd
Priority to JP9079786A priority Critical patent/JP2964980B2/ja
Publication of JPH10275232A publication Critical patent/JPH10275232A/ja
Application granted granted Critical
Publication of JP2964980B2 publication Critical patent/JP2964980B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Image Analysis (AREA)

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】この発明は、光学的文字認識
(OCR)における直線成分検出方法及び装置に係り、
特に、文字と罫線やアンダーライン等の直線成分とが混
在する文書から直線成分を検出するための光学的文字認
識における直線成分検出方法及び装置に関する。
【0002】
【従来の技術】文字と罫線やアンダーライン等の直線成
分とが混在する文書では、直線成分と文字とが接触ない
し交差している場合があり、このような文書をスキャナ
等の画像入力手段により読み取り、得られた2値画像を
そのまま光学的文字認識(Optical Character Recognit
ion)処理しても、直線成分と文字とが分離できないた
め、正常な文字認識ができない。そこで、このような文
書の文字認識を可能にするためには、文字を直線成分と
分離して抽出する必要があるが、右の分離・抽出を実現
する技術としては、従来から、例えば、特開昭63−1
57287号公報や特開昭63−236180号公報に
開示されたものがある。以下、前者を第1の従来技術と
いい、後者を第2の従来技術という。
【0003】第1の従来技術においては、まず、文書の
2値画像の水平方向走査を垂直方向に繰り返し行い、白
から黒への変化点と黒から白への変化点を順次検出し、
黒画素の連なりを黒ランとして抽出し、各黒ランの始点
と終点の位置情報をメモリに記憶する。次に、抽出した
黒ランを、その長さが所定値より長いものを長ランとし
直線成分を構成するものとみなし、短いものを短ランと
し文字部分を構成するものとみなして分類する。さら
に、特定の連結条件を満足して長ランと連結する短ラン
を長ランと短ランの境界を構成する境界ランとする。そ
して、接近した境界ラン相互間を埋める補間ランを生成
し、短ラン及び補間ランを文字として抽出する。
【0004】一方、第2の従来技術においては、まず、
上記した第1の従来技術と同様、文書の2値画像の水平
方向走査を垂直方向に繰り返し行い、黒ランを抽出し、
各黒ランの始点と終点の位置情報をメモリに記憶する。
次に、ある黒ランとそれに近接する黒ランとをその長さ
及び位置関係に基づき分離の可否を判定し、分離可能の
場合には各々別々のラベルを付与し、分離不可の場合に
は同一のラベルを付与する。そして、同一のラベルを有
する黒ランの位置情報から外接矩形枠を抽出し、この外
形矩形枠の大きさにより文字領域か否かの判定を行い、
この判定結果に基づいて文字領域を抽出する。
【0005】また、2値画像に含まれる全ての黒ランを
2次元的に追跡し、予め設定した画素数以上で追跡方向
が一定の黒ランを直線成分として検出する黒画素追跡に
よる方法もある。以下、この方法を第3の従来技術とい
う。
【0006】
【発明が解決しようとする課題】ところで、上記した第
1及び第2の従来技術においては、文書中の直線成分が
走査方向、すなわち、水平方向及び垂直方向に対して平
行ないし直交していることを前提として、予め設定され
た長さで直線成分か文字部分かを判定している。したが
って、走査方向に対して平行でない直線成分が存在する
場合には、直線成分であるにも拘らず設定された長さに
満たない場合には、直線成分として検出されず、この結
果、文字の抽出が完全になされないと、いう欠点があっ
た。また、上記した第3の従来技術においては、2値画
像を2次元的に処理するため、直線成分の検出に時間が
かかるという問題があった。さらに、この技術において
は、文字との接触や交差及び連結方向の検索については
何等考慮されておらず、しかも、上記した第1及び第2
の従来技術をそのまま流用することはできない。したが
って、文字のみを抽出するためには、特別な処理を行う
必要があり、さらに処理時間がかかってしまう。
【0007】この発明は、上述の事情に鑑みてなされた
もので、文書中の直線成分が傾いていても、また文字等
と接触ないし交差していても、短時間で直線成分を正確
に検出できる光学的文字認識における直線成分検出方法
及び装置を提供することを目的としている。
【0008】
【課題を解決するための手段】上記課題を解決するため
に、請求項1記載の発明に係る光学的文字認識における
直線成分検出方法は、画像データを所定の分割幅で分割
する第1の工程と、各分割領域に対してラベリングを施
し、外接矩形ブロックを抽出する第2の工程と、上記外
接矩形ブロックの中から、直線成分を含む直線成分ブロ
ックを抽出すると共に、上記直線部分ブロックに接触す
るが、部分的にも包含関係にならない外接矩形ブロック
を直線隣接ブロックとして抽出する第3の工程と、上記
直線部分ブロック同士を所定の統合条件に基づいて統合
して直線成分ブロック塊を生成すると共に、上記直線成
分ブロック塊の両側に位置する直線隣接ブロックを、検
出すべき直線成分の両端部分を含む直線隣接ブロックと
して上記直線成分ブロック塊と所定の統合条件に基づい
て統合する第4の工程とを備えてなることを特徴として
いる。
【0009】また、請求項2記載の発明は、請求項1記
載の光学的文字認識における直線成分検出方法に係り、
上記第4の工程において上記直線成分ブロック塊と統合
されなかった直線隣接ブロックのうち、直線成分以外を
包む非直線部分ブロックとして統合される位置関係にあ
るが、上記直線部分ブロックに接触ないし交差するため
に単独の非直線部分ブロックに統合できない直線隣接ブ
ロックを所定の統合条件に基づいて統合して非直線成分
ブロック塊を生成すると共に、上記直線部分ブロックを
挟んで存在する非直線成分ブロック塊同士を所定の統合
条件に基づいて統合して、非直線部分ブロックを生成す
る第5の工程を備えてなることを特徴としている。
【0010】また、請求項3記載の発明は、請求項1又
は2記載の光学的文字認識における直線成分検出方法に
係り、上記第1の工程は、上記画像データを、上記画像
データに存在する線幅及び方向が異なる複数種類の直線
成分の上記線幅及び上記方向に基づいて設定される各分
割幅でそれぞれ分割し、上記第2の工程から上記第4の
工程までは、上記複数の分割幅及び分割方向毎にそれぞ
れ独立になされ、全ての分割幅及び分割方向についてな
された上記第4の工程までの処理結果を統合する第6の
工程を備えてなることを特徴としている。
【0011】また、請求項4記載の発明に係る光学的文
字認識における直線成分検出装置は、画像データを所定
の分割幅で分割する画像領域分割部と、各分割領域に対
してラベリングを施し、外接矩形ブロックを抽出するラ
ベリング部と、上記外接矩形ブロックの中から、直線成
分を含む直線成分ブロックを抽出すると共に、上記直線
部分ブロックに接触するが、部分的にも包含関係になら
ない外接矩形ブロックを直線隣接ブロックとして抽出す
る直線部分ブロック検出部と、上記直線部分ブロック同
士を所定の統合条件に基づいて統合して直線成分ブロッ
ク塊を生成すると共に、上記直線成分ブロック塊の両側
に位置する直線隣接ブロックを、検出すべき直線成分の
両端部分を含む直線隣接ブロックとして上記直線成分ブ
ロック塊と所定の統合条件に基づいて統合する直線成分
統合部とを備えてなることを特徴としている。
【0012】また、請求項5記載の発明は、請求項4記
載の光学的文字認識における直線成分検出装置に係り、
上記直線成分統合部において上記直線成分ブロック塊と
統合されなかった直線隣接ブロックのうち、直線成分以
外を包む非直線部分ブロックとして統合される位置関係
にあるが、上記直線部分ブロックに接触ないし交差する
ために単独の非直線部分ブロックに統合できない直線隣
接ブロックを所定の統合条件に基づいて統合して非直線
成分ブロック塊を生成すると共に、上記直線部分ブロッ
クを挟んで存在する非直線成分ブロック塊同士を所定の
統合条件に基づいて統合して、非直線部分ブロックを生
成する非直線成分統合部を備えてなることを特徴として
いる。
【0013】さらにまた、請求項6記載の発明は、請求
項4又は5記載の光学的文字認識における直線成分検出
装置に係り、上記画像領域分割部は、上記画像データ
を、上記画像データに存在する線幅及び方向が異なる複
数種類の直線成分の上記線幅及び上記方向に基づいて設
定される各分割幅でそれぞれ分割し、上記ラベリング
部、上記直線部分ブロック検出部及び直線成分統合部
は、上記複数の分割幅及び分割方向毎にそれぞれ独立に
処理を行い、全ての分割幅及び分割方向についてなされ
た上記直線成分統合部の処理結果を統合する統合部を備
えてなることを特徴としている。
【0014】
【発明の実施の形態】以下、図面を参照して、この発明
の実施の態様について説明する。説明は、実施例を用い
て具体的に行う。 ◇第1実施例 図1は、この発明の第1実施例である直線成分検出装置
の電気的構成を示すブロック図である。この例の直線成
分検出装置は、画像処理部1と、画像領域分割部2と、
ラベリング部3と、直線部分ブロック検出部4と、直線
成分統合部5とから概略構成されている。
【0015】画像処理部1は、光源、光学系、CCD等
の撮像素子、A/Dコンバータ、画像メモリ等から構成
され、帳票や文書等の読取対象に光を照射して反射光を
得て、それに基づいて2値画像データを生成し、画像メ
モリに記憶する。また、上記画像領域分割部2は、2値
画像データを予め設定された分割幅で短冊状に分割す
る。また、上記ラベリング部3は、画像領域分割部2に
より分割された各分割領域に対し、ラベリングを施し、
黒画素塊の外接矩形ブロックを抽出する。
【0016】直線部分ブロック検出部4は、ラベリング
部3で得られた外接矩形ブロックの中から、検出すべき
アンダーラインや罫線等の直線成分を含む直線成分ブロ
ックと、各直線部分ブロックに接触する外接矩形ブロッ
クを全て抽出し、このうち、直線部分ブロックと部分的
にも包含関係にならない外接矩形ブロックを直線隣接ブ
ロックとする。直線成分統合部5は、直線部分ブロック
検出部4で得られた外接矩形ブロックのうち、直線部分
ブロック同士を所定の統合条件に基づいて統合してブロ
ック塊を生成すると共に、このブロック塊の両側に位置
する直線隣接ブロックを、検出すべき直線成分の両端部
分を含む直線隣接ブロックとしてブロック塊と所定の統
合条件に基づいて統合する。
【0017】上記構成の直線成分検出装置を用いて読取
対象の直線成分の検出を行うには、画像処理部1は、ま
ず、図2に示すような読取対象に光源より所定波長の光
を照射して得られた反射光を撮像素子の面上に光学系を
用いて結像し、これを走査することにより、電気信号に
変換する。次に、この電気信号をA/Dコンバータによ
り量子化して得られた多値画像を白黒の2値画像に変換
する。この多値画像から2値画像に変換する際に、黒/
白の閾値を複数通り用意し、それぞれの閾値で2値化し
た複数画像(マルチスライス画像)に対して、光学的文
字認識処理を容易にするために、孤立ノイズの除去、ス
ムージング等のフィルタリング処理を行い、直線成分を
検出すべき2値画像データを生成し、画像メモリに記憶
する。なお、この実施例においては、読取対象は横書き
のものを想定している。
【0018】上記画像領域分割部2は、図3に拡大して
示すように、2値画像データの横書きの文字列と平行な
方向に、2値画像データを短冊状に所定の分割幅wで分
割する。分割幅wは、2値画像データに含まれているア
ンダーラインや罫線等の直線成分の線幅と、直線成分の
分割方向に対する傾き(スキュー)の角度の最大値とに
基づき、かつ、同一の分割領域内に存在する文字等と直
線成分とが分離できるように、予め設定する。直線成分
の線幅及びスキュー角度の最大値は、装置の特性及び読
取対象である帳票や文書の特性から統計的に得られる。
1本の直線成分の両端部分以外の部分は、図4にさらに
拡大して示すように、統計的に得られたスキュー角度の
最大値θに応じた長さmずつ複数の分割領域を横切って
存在するものとする。したがって、1つの分割領域内に
存在する直線成分の長さmは、分割幅wと角度θとによ
り、次式で表される。 m=w/tanθ … …(1)
【0019】ラベリング部3は、画像領域分割部2によ
り分割された各分割領域に対し、ラベリングを施し、黒
画素塊の外接矩形ブロックを抽出する。このラベリング
の手法については、従来と同様であり、この詳細につい
ては、「パターン認識」(森健一監修、電子情報通信学
会、p171)を参照されたい。図5に、図3に示す文
字列及び直線成分にラベリングを施し、外接矩形ブロッ
クを抽出した結果を示す。
【0020】直線部分ブロック検出部4は、ラベリング
部3で得られた外接矩形ブロックの中から、まず、上記
した長さm以上の長さを有する外接矩形ブロックを抽出
し、直線部分ブロックBPとして、内部のメモリの当該
外接矩形ブロックに対応する直線部分ブロックフラグを
セットする。次に、抽出した各直線部分ブロックBPに
接触する外接矩形ブロックを全て抽出し、直線部分ブロ
ックBPと部分的にも包含関係にならない外接矩形ブロ
ックを直線隣接ブロックBNとして、内部のメモリの当
該外接矩形ブロックに対応する直線隣接ブロックフラグ
をセットする。この処理は、以下の理由でなされる。す
なわち、直線成分の両端部分を含む外接矩形ブロック
は、長さが長さmに満たない場合があるため、直線部分
ブロックBPとして抽出されず、直線部分ブロックBP
だけを直線成分統合部5で統合しても直線成分全体を検
出できない。そこで、直線成分の両端部分を含む外接矩
形ブロックを直線成分の中央部分を含む直線部分ブロッ
クBPと統合させるために、この統合する候補を抽出す
るのである。図6に、図5に示す外接矩形ブロックの抽
出結果に基づいて、直線部分ブロックBP及び直線隣接
ブロックBNを抽出した結果を示す。
【0021】直線成分統合部5は、直線部分ブロック検
出部4で得られた外接矩形ブロックのうち、まず、図7
に示すように、直線部分ブロックフラグがセットされて
いる直線部分ブロックBPを統合する。統合されるべき
隣接する2つの直線部分ブロックBPは、この接触部分
では必ず両ブロックが包含する直線成分の一部である黒
画素同士が接続される。そこで、統合する際の条件とし
ては、接触する2つの直線部分ブロックBPの接触部分
が黒画素で接続されることとする。直線部分ブロックB
Pとして検出された外接矩形ブロックは、直線成分LN
が分割領域を横切っている場合の外接矩形ブロックを想
定して検出されている。したがって、検出されるべき直
線成分は、短冊状に分割された各分割領域を同じ方向に
横切っているはずであるから、図7に示すように、直線
部分ブロックBPが統合された場合、この直線部分ブロ
ックBPを統合したブロック塊BB1に包含される直線
成分LNは、各直線部分ブロックBPの対角線の連結に
近い直線として、図8に示すように、推測できる。した
がって、ほとんどの場合、直線成分を包含するブロック
塊BB1を構成する複数の直線部分ブロックBPは、そ
れぞれ対角線の延長線上に接続され、右ブロック塊BB
1に包含される直線成分LNの方向は、図8に示すよう
に、略一意的に決定できる。
【0022】次に、検出すべき直線成分LNを含むが、
直線成分LNの両端部分であって、その長さが長さm未
満であるために、直線部分ブロックBPとして検出でき
なかった、直線隣接ブロックフラグがセットされた外接
矩形ブロック、すなわち、直線隣接ブロックBNをブロ
ック塊BB1と統合する。つまり、ブロック塊BB1が包
含する直線成分LNの延長線上に位置する直線隣接ブロ
ックBNをブロック塊BB1と統合して、図9に示すよ
うに、直線成分LN全体を包含するブロック塊BB2
得る。統合する際の条件としては、ブロック塊BB1
包含される直線成分LNの方向が保存されることとす
る。以上の処理により、ブロック塊BB2全体に包含さ
れる統合された直線成分LNは、ブロック塊BB2を構
成する直線部分ブロックBP及び直線隣接ブロックBN
の隣接するもの同士の接触部分を接続する直線として得
られる。
【0023】なお、スキューが小さく、1個ないし2個
の直線部分ブロックBPで直線成分LN全体を包含して
しまう場合や、文字等を含む外接矩形ブロック等の影響
により直線成分LNが明確に分離できない場合等、より
詳細な座標情報を検出する必要がある場合には、ブロッ
ク塊BBの両端部分のみに従来の検出方法を用いること
により、直線成分LNの両端部分の座標を検出すれば良
い。この従来の検出方法としては、上記した第1及び第
2の従来技術の他、単純に主走査方向又は副走査方向へ
の黒画素の投影ピーク値を検出する方法がある。
【0024】◇第2実施例 次に、この発明の第2実施例について説明する。図10
は、この発明の第2実施例である直線成分検出装置の電
気的構成を示すブロック図である。この図において、図
1の各部に対応する部分には同一の符号を付け、その説
明を省略する。この図に示す直線成分検出装置において
は、非直線成分統合部6が新たに設けられている。
【0025】非直線成分統合部6は、ラベリング部3で
得られたが、直線成分統合部5で直線成分LNを包含す
るブロック塊BB2に統合されなかった外接矩形ブロッ
クのうち、通常の光学的文字認識処理において、直線成
分以外の文字等を包含する非直線部分ブロックNLBと
して統合される位置関係にあるが、直線部分ブロックB
Pと接触ないし交差しているために、サイズが小さく、
通常の非直線部分ブロックNLBに統合できない外接矩
形ブロックを統合し、図11に拡大して示すように、ブ
ロック塊BB3を生成する。
【0026】次に、非直線成分統合部6は、直線部分ブ
ロックBPを挟んで存在するブロック塊BB3同士の黒
画素による連結の可否を判定し、黒画素で連結できる場
合には、統合後のブロックが、非直線部分ブロックNL
Bとして文字サイズや形状、文字間隔が適当であるか否
かを統合条件として、直線部分ブロックBPを挟んで存
在するブロック塊BB3同士を統合して、図11に示す
ように、非直線部分ブロックNLBを生成する。統合条
件としての文字サイズや形状、文字間隔は、装置の特性
及び読取対象である帳票や文書の特性から統計的に得ら
れるものである。これにより、直線成分の検出と同時
に、文字等の非直線部分が直線成分と接触ないし交差し
ていることによる悪影響を取り除くことができ、文字等
の非直線部分を包含する非直線部分ブロックNLBのお
おまかな抽出が可能となる。
【0027】以上、この発明の実施例を図面を参照して
詳述してきたが、具体的な構成はこの実施例に限られる
ものではなく、この発明の要旨を逸脱しない範囲の設計
の変更等があってもこの発明に含まれる。例えば、上述
の第1実施例においては、画像領域分割部2で用いる分
割幅w及びスキュー角度aを予め所定の値に設定する例
を示したが、直線成分の検出結果に応じて、作業者が適
宜変更できるようにしても良く、あるいは装置に変更す
る機能を持たせても良い。
【0028】また、上述の第1及び第2実施例において
は、検出すべきアンダーラインや罫線等の直線成分の線
幅及び方向が1種類である例を示したが、これに限定さ
れない。線幅が極端に異なる複数種類のアンダーライン
や罫線が引かれた文書、や罫線が縦横に引かれた帳票に
ついて光学的文字認識処理を行う場合には、図1及び図
10に示す各構成要素2〜5又は6がそれぞれの処理
を、画像処理部1から供給される2値画像データに含ま
れている直線成分の線幅や方向に応じて、複数回実施
し、それぞれの結果を統合するれば良い。
【0029】すなわち、画像領域分割部2は、分割幅w
を直線成分の線幅やスキューに応じて複数回行い、ラベ
リング部3、直線部分ブロック検出部4、直線成分統合
部5又は非直線成分統合部6は、上記複数の分割幅wで
分割された2値画像データに対してそれぞれ独立して処
理を行う。そして、最後に、それぞれの結果を統合する
ことにより、複数種類及び複数方向の直線成分を含む文
書や帳票からも直線成分を検出できる。
【0030】ここで、一例として、図2の示す文書にお
いて、図2にすでに描かれたアンダーラインと直交する
方向に描かれた罫線を検出する場合について説明する。
まず、第1回目の処理は、画像領域分割部2が図2に示
す文字列に対して平行な方向へ2値画像データを分割
し、各構成要素3〜5又は6は、上記した第1又は第2
実施例と同様の処理を行う。この場合、図2に示すアン
ダーラインと直交する罫線(図示略)は、直線部分ブロ
ック検出部4において、文字等と同様に、非直線成分と
して扱われる。次に、第2回目の処理は、画像領域分割
部2が第1回目の分割方向に対して直交する方向へ、罫
線の線幅及びスキュー角度の最大値に基づき予め設定さ
れる分割幅wで2値画像データを分割し、各構成要素3
〜5又は6は、上記した第1又は第2実施例と同様の処
理を行う。この場合、図2に示すアンダーラインは、直
線部分ブロック検出部4において、文字等と同様に、非
直線成分として扱われる。そして、最後に、第1回目及
び第2回目のそれぞれの結果が統合され、アンダーライ
ン及びそれに直交する方向の罫線が検出される。
【0031】また、上記した第1及び第2実施例におい
ては、直線成分は、予め印刷されたり、定規で描かれて
いることを前提としているが、これに限らず、フリーハ
ンドで描かれた場合であっても、極端な湾曲やスキュー
がない限り、検出することは可能である。
【0032】
【発明の効果】以上説明したように、この発明の光学的
文字認識における直線成分検出方法及び装置によれば、
画像データを所定の分割幅で分割した後、ラベリングし
ているので、直線成分を含む直線成分ブロックと直線成
分を含まない直線隣接ブロックとを分離でき、したがっ
て、直線成分ブロックのみを抽出・統合して直線成分を
検出できる。これにより、2次元処理を必要最小限にで
き、従来に比べて簡単な処理で済み、しかも処理時間も
短縮できる。また、画像データの分割幅を適宜設定する
ことにより、直線成分ブロックと直線隣接ブロックとを
分離できるので、読取対象中の直線成分が傾いている場
合でも、正確に直線成分を検出できる。また、この発明
の別の構成によれば、直線部分ブロックに接触ないし交
差している直線隣接ブロックを所定の統合条件に基づい
て統合して非直線成分ブロック塊を生成すると共に、直
線部分ブロックを挟んで存在する非直線成分ブロック塊
同士を所定の統合条件に基づいて統合して、非直線部分
ブロックを生成しているので、文字等と直線部分とが接
触ないし交差していても、正確に直線成分を検出でき
る。さらに、この発明の別の構成によれば、画像データ
を複数種類の直線成分の線幅及び方向に基づいて設定さ
れる各分割幅でそれぞれ分割し、これら複数の分割幅及
び分割方向毎にそれぞれ独立に処理をしているので、読
取対象中に線幅及び方向が異なる複数の直線成分が含ま
れていても、検出することができる。
【図面の簡単な説明】
【図1】この発明の第1実施例である直線成分検出装置
の電気的構成を示すブロック図である。
【図2】読み取り対象としての文書の一例を示す図であ
る。
【図3】画像領域分割部の処理を説明するための拡大図
である。
【図4】画像領域分割部の処理を説明するための拡大図
である。
【図5】ラベリング部の処理を説明するための図であ
る。
【図6】直線部分ブロック検出部の処理を説明するため
の図である。
【図7】直線成分統合部の処理を説明するための図であ
る。
【図8】直線成分統合部の処理を説明するための図であ
る。
【図9】直線成分統合部の処理を説明するための図であ
る。
【図10】この発明の第2実施例である直線成分検出装
置の電気的構成を示すブロック図である。
【図11】非直線成分統合部の処理を説明するための図
である。
【符号の説明】
1 画像処理部 2 画像領域分割部 3 ラベリング部 4 直線部分ブロック検出部 5 直線成分統合部 6 非直線成分統合部 BP 直線部分ブロック BN 直線隣接ブロック BB1,BB2,BB3 ブロック塊 LN 直線成分 NLB 非直線部分ブロック
フロントページの続き (58)調査した分野(Int.Cl.6,DB名) G06T 7/00 G06K 9/20

Claims (6)

    (57)【特許請求の範囲】
  1. 【請求項1】 画像データを所定の分割幅で分割する第
    1の工程と、 各分割領域に対してラベリングを施し、外接矩形ブロッ
    クを抽出する第2の工程と、 前記外接矩形ブロックの中から、直線成分を含む直線成
    分ブロックを抽出すると共に、前記直線部分ブロックに
    接触するが、部分的にも包含関係にならない外接矩形ブ
    ロックを直線隣接ブロックとして抽出する第3の工程
    と、 前記直線部分ブロック同士を所定の統合条件に基づいて
    統合して直線成分ブロック塊を生成すると共に、前記直
    線成分ブロック塊の両側に位置する直線隣接ブロック
    を、検出すべき直線成分の両端部分を含む直線隣接ブロ
    ックとして前記直線成分ブロック塊と所定の統合条件に
    基づいて統合する第4の工程とを備えてなることを特徴
    とする光学的文字認識における直線成分検出方法。
  2. 【請求項2】 前記第4の工程において前記直線成分ブ
    ロック塊と統合されなかった直線隣接ブロックのうち、
    直線成分以外を包む非直線部分ブロックとして統合され
    る位置関係にあるが、前記直線部分ブロックに接触ない
    し交差するために単独の非直線部分ブロックに統合でき
    ない直線隣接ブロックを所定の統合条件に基づいて統合
    して非直線成分ブロック塊を生成すると共に、前記直線
    部分ブロックを挟んで存在する非直線成分ブロック塊同
    士を所定の統合条件に基づいて統合して、非直線部分ブ
    ロックを生成する第5の工程を備えてなることを特徴と
    する請求項1記載の光学的文字認識における直線成分検
    出方法。
  3. 【請求項3】 前記第1の工程は、前記画像データを、
    前記画像データに存在する線幅及び方向が異なる複数種
    類の直線成分の前記線幅及び前記方向に基づいて設定さ
    れる各分割幅でそれぞれ分割し、 前記第2の工程から前記第4の工程までは、前記複数の
    分割幅及び分割方向毎にそれぞれ独立になされ、 全ての分割幅及び分割方向についてなされた前記第4の
    工程までの処理結果を統合する第6の工程を備えてなる
    ことを特徴とする請求項1又は2記載の光学的文字認識
    における直線成分検出方法。
  4. 【請求項4】 画像データを所定の分割幅で分割する画
    像領域分割部と、 各分割領域に対してラベリングを施し、外接矩形ブロッ
    クを抽出するラベリング部と、 前記外接矩形ブロックの中から直線成分を含む直線成分
    ブロックを抽出すると共に、前記直線部分ブロックに接
    触するが、部分的にも包含関係にならない外接矩形ブロ
    ックを直線隣接ブロックとして抽出する直線部分ブロッ
    ク検出部と、前記直線部分ブロック同士を所定の統合条
    件に基づいて統合して直線成分ブロック塊を生成すると
    共に、前記直線成分ブロック塊の両側に位置する直線隣
    接ブロックを、検出すべき直線成分の両端部分を含む直
    線隣接ブロックとして前記直線成分ブロック塊と所定の
    統合条件に基づいて統合する直線成分統合部とを備えて
    なることを特徴とする光学的文字認識における直線成分
    検出装置。
  5. 【請求項5】 前記直線成分統合部において前記直線成
    分ブロック塊と統合されなかった直線隣接ブロックのう
    ち、直線成分以外を包む非直線部分ブロックとして統合
    される位置関係にあるが、前記直線部分ブロックに接触
    ないし交差するために単独の非直線部分ブロックに統合
    できない直線隣接ブロックを所定の統合条件に基づいて
    統合して非直線成分ブロック塊を生成すると共に、前記
    直線部分ブロックを挟んで存在する非直線成分ブロック
    塊同士を所定の統合条件に基づいて統合して、非直線部
    分ブロックを生成する非直線成分統合部を備えてなるこ
    とを特徴とする請求項1記載の光学的文字認識における
    直線成分検出装置。
  6. 【請求項6】 前記画像領域分割部は、前記画像データ
    を、前記画像データに存在する線幅及び方向が異なる複
    数種類の直線成分の前記線幅及び前記方向に基づいて設
    定される各分割幅でそれぞれ分割し、 前記ラベリング部、前記直線部分ブロック検出部及び直
    線成分統合部は、前記複数の分割幅及び分割方向毎にそ
    れぞれ独立に処理を行い、 全ての分割幅及び分割方向についてなされた前記直線成
    分統合部の処理結果を統合する統合部を備えてなること
    を特徴とする請求項4又は5記載の光学的文字認識にお
    ける直線成分検出装置。
JP9079786A 1997-03-31 1997-03-31 光学的文字認識における直線成分検出方法及び装置 Expired - Lifetime JP2964980B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP9079786A JP2964980B2 (ja) 1997-03-31 1997-03-31 光学的文字認識における直線成分検出方法及び装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP9079786A JP2964980B2 (ja) 1997-03-31 1997-03-31 光学的文字認識における直線成分検出方法及び装置

Publications (2)

Publication Number Publication Date
JPH10275232A JPH10275232A (ja) 1998-10-13
JP2964980B2 true JP2964980B2 (ja) 1999-10-18

Family

ID=13699904

Family Applications (1)

Application Number Title Priority Date Filing Date
JP9079786A Expired - Lifetime JP2964980B2 (ja) 1997-03-31 1997-03-31 光学的文字認識における直線成分検出方法及び装置

Country Status (1)

Country Link
JP (1) JP2964980B2 (ja)

Also Published As

Publication number Publication date
JPH10275232A (ja) 1998-10-13

Similar Documents

Publication Publication Date Title
JP3904840B2 (ja) 多値画像から罫線を抽出する罫線抽出装置
JP4525787B2 (ja) 画像抽出装置、及び画像抽出プログラム
US8155445B2 (en) Image processing apparatus, method, and processing program for image inversion with tree structure
US6367698B1 (en) Bar code reader for decoding a four state bar code
JP2000207489A (ja) 文字抽出方法、装置および記録媒体
JP3615333B2 (ja) 罫線消去装置
JP2001043313A (ja) 文字切出し方法
JP3006466B2 (ja) 文字入力装置
JPH1031716A (ja) 文字行抽出方法および装置
JP2964980B2 (ja) 光学的文字認識における直線成分検出方法及び装置
JP3268552B2 (ja) 領域抽出方法、宛名領域抽出方法、宛名領域抽出装置、及び画像処理装置
JP2003115031A (ja) 画像処理装置および方法
JP3957471B2 (ja) 分離文字列統合装置
JP2796561B2 (ja) 表形式文書認識方式
JP2558668B2 (ja) 文字パタ−ン抽出方法
JP4439054B2 (ja) 文字認識装置及び文字枠線の検出方法
JP2003317107A (ja) 罫線抽出方法及び装置
US20030002062A1 (en) Image processing apparatus, method and program, and storage medium
JP3095437B2 (ja) 文字行検出切出装置および文字読取装置
EP0446630A2 (en) Method and apparatus for segmenting characters in an amount field on a financial document
JP3756660B2 (ja) 画像認識方法、装置および記録媒体
JP3341097B2 (ja) 光学文字読取装置
JP3517077B2 (ja) パターン抽出装置及びパターン領域の切り出し方法
JP3009237B2 (ja) 特徴抽出方法
JPH07107689B2 (ja) 画像信号処理装置