JP2003208567A - 画像処理装置、画像処理方法、及び同方法に用いるプログラム - Google Patents

画像処理装置、画像処理方法、及び同方法に用いるプログラム

Info

Publication number
JP2003208567A
JP2003208567A JP2002003625A JP2002003625A JP2003208567A JP 2003208567 A JP2003208567 A JP 2003208567A JP 2002003625 A JP2002003625 A JP 2002003625A JP 2002003625 A JP2002003625 A JP 2002003625A JP 2003208567 A JP2003208567 A JP 2003208567A
Authority
JP
Japan
Prior art keywords
ruled line
image
character
connected component
run
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2002003625A
Other languages
English (en)
Inventor
Fumihiro Hasegawa
史裕 長谷川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP2002003625A priority Critical patent/JP2003208567A/ja
Publication of JP2003208567A publication Critical patent/JP2003208567A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Abstract

(57)【要約】 【課題】 罫線を跨いだ領域統合を行うという不具合、
罫線との連結による抽出漏れを防ぎ、対象画像の文字領
域を表す適切な情報の取得を可能にする。 【解決手段】 入力多値カラー画像に圧縮を掛け、そこ
から求めたラン(水平連続画素列)を対象として、垂直
方向に接する同色のランを連結成分として統合し、文字
候補を生成する。罫線抽出手段207は入力原画像を基
に上記と同様の連結成分を得、そこから罫線の特徴によ
る絞り込み(外接矩形の縦横比から細長い成分、隣接画
素との色相違度)を掛け罫線抽出を行う。罫線は外接矩
形統合手段208により文字候補(連結成分)の外接矩
形(文字領域)を統合するときに罫線を跨いだ領域統合
を禁止する処理に用いる。又求めた罫線を用いて入力画
像から罫線を消去し、これを元に文字領域の抽出を行う
ことにより、文字と罫線の連結を回避する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、カラー画像対応の
文書画像認識システム等に利用される、入力カラー画像
に含まれる文字・文書画像を認識する処理に関し、より
詳細には、対象画像の一部に存在する文字・文書画像が
占める文字領域を表す情報を取得するための画像処理装
置、画像処理方法、及び該方法をコンピューターに実行
させるプログラムに関する。
【0002】
【従来の技術】画像処理では、文字・文書画像の認識処
理が従来より行われている。この認識処理を行う際に、
処理対象画像の一部に存在する文字・文書画像が占める
文字領域の正しい位置情報を取得することは、高い認識
精度を得るために不可欠である。仮に、文書画像のどこ
に文字があるのか不明な状態で文字認識処理を行った場
合、文字認識の必要のない写真、図などの領域に文字認
識処理を行ってしまうことになるため、不要な処理で時
間がかかるだけでなく、文字の存在しない領域に無理に
文字認識を実行した結果として、大量にエラーが出力さ
れることになり、認識結果を利用する際に、大きな困難
を伴うことになる。このため、文字領域の正しい位置情
報を取得する文字領域認識処理方法として、二値画像の
黒画素の連結成分を用いた方法の提案がなされた(特開
2000-67158号公報)。この方法では、入力された画像を
縮小して黒画素の連結成分の外接矩形を得、得た外接矩
形から、文字、表、図、その他、に基本要素を分類し、
その中から文字要素を取り出し統合して行を生成し、生
成した行を統合して文字領域を取得する。さらにこの例
では、文字領域から段組情報を抽出し、抽出段の位置を
参照して過剰に統合された文字領域を修正するようにし
ている。
【0003】ところで、近年カラープリンタなどの普及
に伴い、急速にカラー原稿が文字認識の対象として処理
されるケースが増加してきている。カラー原稿を処理す
る際、上記した黒画素の連結成分を用いた方法の例に示
される文字領域認識処理方法を適用する場合には、カラ
ー情報をどこかで欠落させて二値画像に変換する必要が
ある。しかし、二値化には決定的な方法があるわけでは
なく、処理対象画像によっては文字がつぶれてしまった
り、背景の色が細かいノイズ状になって二値画像に表現
されてしまうなどの問題がしばしば発生する。このよう
な状態では、縮小画像の黒画素の連結成分抽出が思うよ
うにできず、精度が低下してしまう。また、カラー画像
に適用する文字領域認識処理技術としては、特開2000-1
32689号公報、特開平11-213160号公報に示される提案が
なされている。文字認識のための二値画像の質を向上さ
せることを目標に、前者は同一とみなせる色の、後者は
同一とみなせる明度の背景を持つ領域を分割抽出し、各
領域を文字領域とみなし、各領域ごとに二値化を行うも
のである。
【0004】
【発明が解決しようとする課題】しかしながら、カラー
画像への適用を考慮した、特開2000-132689号公報、特
開平11-213160号公報に提案された文字領域認識処理技
術は、背景色が連続的に変化している場合には適用でき
ない。また、抽出された領域は背景が同一色というだけ
で、実際に文字領域かどうかの判定は行っておらず、文
字領域かどうかの判定は生成された二値画像を用いて別
に行うこととなる。例示したカラー画像へ適用を考慮し
た従来の文字領域認識処理技術における問題点を解消す
るために、本願出願人による先の出願(特願2001- 8648
4号)では、カラー画像からカラー情報を抽出し、この
情報を二値化によらず直接用いることによって文字抽出
精度の向上を図るとしている。この先行例の文字領域認
識処理方法は、原画像から圧縮画像を生成し、同色とみ
なせる画素をランとして抽出し、それらの連結成分を色
ごとに求め、得た連結成分を文字候補とみなして近接す
る連結成分同士を統合して文字行を生成し、その後抽出
された文字行から、過抽出部分を排除して文字行を出力
するもので、背景という概念を入れることなく文字領域
を取得可能としたものである。従って、この先行例で
は、直接カラー画像の画素情報を用いることで、上記し
た従来例によっては困難であったカラー文書から、より
精度のよい文字領域抽出を行うことを可能とし、背景色
が連続的に変化している場合でも対処可能とした。
【0005】ところがこの先行例の手法は、近接する連
結成分(文字)同士を統合して生成する矩形はその距離
だけに応じて統合を行い、文字行を生成するので、例え
ば図15に示すように、文字同士が罫線で区切られてい
ても、その距離が近ければ統合を行ってしまう(図示の
文字列を囲む破線が、統合後の矩形を示す)。この場
合、このままの領域で、そこにある文字列を対象として
文字認識を行うと文字列全体としての文脈がおかしくな
ってしまう(図中の〈認識結果〉に示される)。また、
罫線に近接したあるいは接触した文字がある場合は、画
像を圧縮する関係で罫線と文字が同一の連結成分として
融合してしまい、抽出が困難となる。このときの画像デ
ータの状態を図15を参照して説明すると、罫線に近接
した文字を有する原画像(A)は、圧縮処理が施される
と、罫線と文字が融合した圧縮画像(B)となる。従っ
て、この圧縮画像に基づいて連結成分を抽出すると、文
字の構成要素ではない罫線を同一の連結成分として抽出
してしまい、エラーの要因となる。本発明は、画像読み
取り手段等により入力されるカラー画像を対象とし、そ
こに含まれる文字・文書画像が占める文字領域を表す情
報を取得する、文字領域認識処理における上記した従来
技術及び先行例の問題点に鑑みてなされたものであり、
その目的は、先行例の文字領域認識処理技術を採用した
場合に生じる、罫線が介在する場合にも連結成分の統合
を行うという不具合、或いは、文字の構成要素ではない
罫線を同一の連結成分とするエラーが起きるという不具
合を解消し、対象画像の一部に存在する文字・文書画像
が占める文字領域を表す適切な情報の取得を可能とする
処理を行うための画像処理装置、画像処理方法、及び該
方法をコンピューターに実行させるプログラムを提供す
ることにある。
【0006】
【課題を解決するための手段】請求項1の発明は、処理
対象として入力された多値画像、或いはその圧縮画像か
ら同色とみなせる画素をランとして抽出する手段と、隣
接するランを統合して連結成分を生成する手段と、連結
成分のうち文字とみなせない不要成分を排除する手段
と、前記多値画像から罫線を抽出する手段と、罫線が内
在しないように連結成分の外接矩形を統合する手段と、
統合された外接矩形から文字連結成分によるとみなせる
ものを判定する手段と、判定された文字連結成分による
外接矩形を文字領域を表す情報として出力する手段とを
備えたことを特徴とする画像処理装置である。
【0007】請求項2の発明は、処理対象として入力さ
れた多値画像から罫線を抽出する手段と、入力多値画像
から罫線を構成する画素を排除した二次多値画像、或い
はその圧縮画像から同色とみなせる画素をランとして抽
出する手段と、隣接するランを統合して連結成分を生成
する手段と、連結成分のうち文字とみなせない不要成分
を排除する手段と、罫線が内在しないように連結成分の
連結成分の外接矩形を統合する手段と、統合された外接
矩形から文字連結成分によるとみなせるものを判定する
手段と、判定された文字連結成分による外接矩形を文字
領域を表す情報として出力する手段とを備えたことを特
徴とする画像処理装置である。
【0008】請求項3の発明は、請求項1又は2に記載
された画像処理装置において、前記連結成分の外接矩形
を統合する手段は、統合対象として選択された2つの矩
形が前記罫線を境界として互いに反対側にある場合に該
矩形の統合を中止する手段を備えたことを特徴とするも
のである。
【0009】請求項4の発明は、請求項3に記載された
画像処理装置において、前記矩形の統合を中止する手段
が、前記罫線が矩形と同じ色とみなせる場合に統合を中
止する手段であることを特徴とするものである。
【0010】請求項5の発明は、請求項1乃至4のいず
れかに記載された画像処理装置において、前記罫線を抽
出する手段は、多値画像から同色とみなせる画素をラン
として抽出する手段と、抽出されたランのうち所定長以
上のものだけを選別する手段と、選別されたランの隣接
するものを統合し、生成した連結成分を罫線として抽出
する手段を備えたことを特徴とするものである。
【0011】請求項6の発明は、請求項5に記載された
画像処理装置において、前記罫線を抽出する手段は、生
成した前記連結成分を構成するランとこれに隣接する画
素との色の相違度を求める手段と、前記相違度が所定値
以上である場合に該連結成分が罫線であると判断する手
段を備えたことを特徴とするものである。
【0012】請求項7の発明は、請求項5又は6に記載
された画像処理装置において、前記罫線を抽出する手段
は、生成した前記連結成分を構成するランのうち、該連
結成分の外接矩形の全長に比べて相対的に短い長さ部分
を構成するランを除外する手段と、除外後に得られた連
結成分を罫線として出力する手段を備えたことを特徴と
するものである。
【0013】請求項8の発明は、処理対象として入力さ
れた多値画像、或いはその圧縮画像から同色とみなせる
画素をランとして抽出するステップと、隣接するランを
統合して連結成分を生成するステップと、連結成分のう
ち文字とみなせない不要成分を排除するステップと、前
記多値画像から罫線を抽出するステップと、連結成分の
外接矩形を統合するステップと、統合された外接矩形か
ら文字連結成分によるとみなせるものを判定するステッ
プと、判定された文字連結成分による外接矩形を文字領
域を表す情報として出力するステップの各ステップを実
行することを特徴とする画像処理方法である。
【0014】請求項9の発明は、請求項8に記載された
画像処理方法の各ステップをコンピュータに実行させる
ためのプログラムである。
【0015】
【発明の実施の形態】本発明を添付する図面とともに示
す以下の実施形態に基づき説明する。なお、本願では、
本発明の「画像処理装置」を本発明の「画像処理方法」
の手順を実現するための手段(装置)として位置付けて
いるので、下記の「実施形態1」〜「実施形態3」それ
ぞれにおいて、本願に係わる方法発明と装置発明の実施
形態を併せて説明する。 「実施形態1」本実施形態は、先行例(特願2001- 8648
4号)の文字領域認識処理手順中に罫線抽出手順を付加
して構成され、抽出された罫線情報を外接矩形統合処理
に反映させることにより、適切な文字領域の認識を行う
ことを意図するものである。図1は、本実施形態に係る
画像処理方法の処理フローを示すチャートであり、図2
は、本実施形態に係る画像処理装置の構成を示すブロッ
ク図である。
【0016】本実施形態に係る画像処理装置を図2を参
照して説明すると、画像入力手段101は、処理対象の
原画像を取得し、格納しておく手段(例えば、カラー画
像データを出力するスキャナ、撮像装置などの原稿読み
取り装置により実施し得る)であり、画像入力手段10
1で取得した原画像データを圧縮画像生成手段102
と、罫線抽出手段106と、文字行判定手段108に送
出する。圧縮画像生成手段102は、圧縮画像を生成
し、格納するとともに、ラン生成手段103、連結成分
生成手段104、連結成分選別手段105、罫線抽出手
段106、外接矩形統合手段107、文字行判定手段1
08に圧縮画像をそれぞれ出力する。なお、本実施形態
で行う圧縮処理を省略することが可能で、その実施形態
による場合には、画像入力手段101の出力画像を圧縮
画像生成手段102を介さずに各手段に出力するように
構成する。ラン生成手段103は、入力画像からランを
生成する手段であり、生成したランを連結成分生成手段
104に送出する。連結成分生成手段104は、ランか
ら連結成分を生成する手段であり、生成した連結成分は
連結成分選別手段105に送出する。連結成分選別手段
105は、連結成分生成手段104で得られた連結成分
を選別して外接矩形統合手段107に送出する。罫線抽
出手段106は、画像入力手段101から入力された画
像に基づいて罫線を抽出し(罫線抽出処理については後
記に詳述)、外接矩形統合手段107に送出する。外接
矩形統合手段107は、連結成分選別手段105で得ら
れた連結成分の外接矩形を統合して、文字行判定手段1
08に送出する。統合の際に罫線抽出結果を用いる(罫
線情報を用いた外接矩形統合処理については後記に詳
述)。文字行判定手段108は、外接矩形統合手段10
6で統合された外接矩形から文字行を判定して、文字領
域出力手段109に送出する。文字領域出力手段109
は、文字行と判定された座標を出力する手段である。
【0017】次に、本実施形態に係る画像処理方法を図
1のフローチャートを参照して説明する。なお、以下の
説明は、上記画像処理装置の動作説明を兼ねる。図1の
フローによると、まず、処理したい原稿を画像入力手段
101により原画像(カラー画像)として取得する(S
1)。ここで取得されるカラー画像は、通常のラスタ方
式による連続画素データの形式をとる。続けて、圧縮画
像生成手段102により原画像から圧縮画像を生成する
(S2)。圧縮画像は、処理の高速化のためと、ある色
が細かい点(各色成分ドット)の集合で表現されている
場合の悪影響を防ぐために生成するものである。圧縮画
像の生成方法には様々なものが考えられるが、ここでは
原画像の(2×2)画素を圧縮画像の1画素にまとめるもの
とする。圧縮画像の画素値は、原画像の(2×2)画素内で
最も明度の低い画素値を用いることとする。次に、ラン
生成手段103により圧縮画像からラン生成を行う(S
3)。ここでは、水平方向に隣接する画素の色が互いに
近い場合にそれらを処理単位としてまとめる方法により
ランを生成する。なお、「ラン」は、連続画素データが
同一値をとる場合に、この連続画素のかたまりを指す概
念で、符号化の単位として扱われる(フアクシミリなど
で扱う2値の文書画像において、一次元方向に連続する
白画素、あるいは黒画素のかたまりを「ラン」として符
号化の単位とする例は周知)。ここで、色が近いことを
判定する方法には様々な手法を採用することができる
が、例えば画素値の各色成分(RGBなど)の差の2乗和な
どを計算し、これを画素間の色相違度とみなして、この
値が実験値等を基に予め定めておいた値よりも小さい場
合に近いと判断する、という方法を用いることが可能で
ある。また、このときに、抽出した各ランの色を定義し
ておく。ランを構成する画素が持つ色データの平均値や
メジアンなどにより定義することができるが、本例では
メジアンを用いることとする。ランを圧縮画像の各行ご
とに求め、このステップを終了する。
【0018】次に、連結成分生成手段104によりラン
の連結成分を生成する(S4)。この処理では、前ステ
ップで水平方向の連続画素について求めたランを対象と
して、垂直方向に接するもの同士の色を比較し、色が近
ければ連結成分として統合する。このようにすれば、文
字候補となるひとかたまりの画素がひとつの連結成分と
して抽出できることになる。図3は、連結成分の生成状
態を示す。同図示のように、色が近い同士を連結成分と
して統合し、色が遠い隣接ランは連結せずに非統合にす
ると、入力した文字画像「すり」に対する連結成分を生
成することができる。次に連結成分選別手段105によ
り連結成分の選別を行う(S5)。前ステップで求めた
連結成分は、その中には文字でないものが多数含まれて
いる、いわば文字候補である。例えば、非常に小さな連
結成分はノイズである可能性が高く、これをそのまま後
段の処理に渡すと精度の低下や処理速度の低下を招く可
能性がある。そこで、ある一定以下の大きさの連結成分
は削除する作業を行う。もちろん、連結成分の大きさ以
外の条件、例えば周囲との明るさの関係等で選別を行っ
ても良い。
【0019】次に、罫線抽出手段106により罫線の抽
出を行う(S6)。罫線抽出は、本発明を特徴付ける要
素であり、後段の外接矩形統合処理において統合するか
否かを判定するために使用される。図4は、本実施形態
に係る罫線抽出処理(S6)のより詳細なフローを示す
チャートであり、図5は、本実施形態に係る罫線抽出手
段106のより詳細な構成を示すブロック図である。本
例の罫線抽出手段106を図5を参照して説明すると、
ラン生成手段106−01は、画像入力手段101から
の処理対象の原入力画像からランを生成する手段であ
り、生成したランを長ラン選別手段106−02に送出
する。なお、ここでは、原入力画像を元にして罫線抽出
処理を行っているが、原入力画像に圧縮を掛けた画像を
元にして実施することも可能である。長ラン選別手段1
06−02は、ノイズ成分となるランを除去し、連結成
分抽出手段106−03に送出する。連結成分抽出手段
106−03は、ランから連結成分を抽出する手段であ
り、要素として外接矩形縦横比算出手段106−04、
形状吟味手段106−05、色相違度計算手段106−
06、色相違度判定手段106−07を有し、抽出した
連結成分を相対短ラン除外手段106−08に送出す
る。相対短ラン除外手段106−08は、連結成分抽出
手段106−03で得られた連結成分の短ランを構成す
る部分を削除する処理をし、残ラン統合手段106−0
9に送出する。残ラン統合手段106−09は、相対短
ラン除外手段106−08で処理された連結成分を統合
する処理を行い、罫線出力手段106−10に送出す
る。罫線出力手段106−10は、抽出した罫線を罫線
を利用する外接矩形統合手段107に出力する。なお、
罫線抽出を行う手段として示した形状吟味手段106−
05、色相違度判定手段106−07、相対短ラン除外
手段106−08全てを要素とした、例示した本実施形
態の構成に限らず、実施にあたって、発明思想を逸脱し
ない範囲でその一部の抽出要素に係わる手段を省略して
も良い。
【0020】次に、罫線抽出処理手順を図4のフローチ
ャートを参照して説明する。なお、以下の説明は、上記
罫線抽出手段の動作説明を兼ねる。図4のフローによる
と、先ず入力された原カラー画像を基にしてラン生成手
段106−01によりランを生成する(S6−01)。
ランの生成方法は、先のステップS3と同様でよい。こ
こで、ランの抽出対象を原カラー画像にすると圧縮画像
から抽出する場合(先のステップS3)に比べてより正
確な罫線抽出が可能となる。また、圧縮画像から抽出す
れば処理時間が短くて済むので必要に応じて使い分けれ
るようにするとよい。また、罫線は垂直と水平方向があ
り、いずれも抽出の対象となる。両方向を対象にする場
合、生成したランをもとに、文字行と垂直方向に抽出す
れば、文字行と垂直方向の罫線が抽出できるし、水平方
向に抽出すれば罫線も水平方向のものが抽出できるが、
ここでは文字行と垂直方向のランを抽出する場合につい
て説明をするが、水平方向も基本的には同様に処理可能
である。続いて、長ラン選別手段106−02により、
行方向の各ライン毎に生成されたランから罫線を構成し
ないノイズ成分を除去し、必要な長いランだけ選別して
残す作業を行う(S6−02)。これは、罫線がある程
度以上の長さ(幅)を持っていることから、罫線を構成
するランだけを選び出すことを目的としている。
【0021】その後、選別されたランをもとに連結成分
抽出手段106−03によりランの連結成分を抽出し
(S6−03)、同時に抽出した連結成分をもとに罫線
候補を求める。ここで、罫線候補を求める手順をより詳
細に示すと、ここでは、連結成分の形状と色による2段
階のチェックを行う。前者については、外接矩形縦横比
算出手段106−04により連結成分の外接矩形を生成
し、その外接矩形1つ1つについてその長さの縦横比を
求め(S6−04)、得た結果を形状吟味手段106−
05により吟味する。即ち、外接矩形が細長い形状であ
るか否かを判断し(S6−05)、外接矩形が縦長であ
るものだけを罫線候補として選択し(S6−05−Ye
s)、縦長でないもの(S6−05−NO)は罫線でな
いので、罫線候補から外す。なお、水平方向の罫線を抽
出する場合は横長であることが罫線であるために必要な
条件となる。また、後者については、色相違度計算手段
106−06により隣接画素との色の相違度を計算し
(S6−06)、計算結果をもとに罫線候補とするかを
判断する。即ち、色相違度判定手段106−07により
相違度が大であるか否かを判定し(S6−07)、相違
度が大であるものだけを罫線候補として選択し(S6−
07−Yes)、相違度大でないもの(S6−07−N
o)は罫線でないので、罫線候補から外す。
【0022】この色の相違度による処理の有意性を説明
すると、ここまでのステップ(S6−05の形状による
判定ステップ)の処理だけでは、色を判定の要素として
いなかったので、文字と文字との間が罫線として抽出さ
れることがあり得る。この状態を説明する図6を参照す
ると、図中の(I)、(II)いずれの場合も、縦に細長
い外接矩形が抽出されるので、罫線候補としての条件に
合うが、図中の(II)の場合は、外接矩形(連結成分)
が本当に罫線である場合に比べて隣接する画素に外接矩
形(連結成分)と同色のものが多くなる傾向がある。そ
こで、外接矩形(連結成分)を構成するランとこれに隣
接する画素との間の色相違度を計算し、ある程度以上色
が異なる画素数の、隣接画素の総数に対する割合を連結
成分と隣接画素の色相違度と定義し、これが実験値をも
とに予め定めた基準値に比べて小さい場合には罫線でな
いとみなすという処理により、罫線候補をさらに絞るこ
とができる。連結成分の画素値は、連結成分を構成する
画素の代表画素値を用いる。代表値を得るために、様々
な手法をとることができるが、構成全画素の平均画素値
やメジアンを用いることが可能である。また、連結成分
と隣接画素の色相違度の定義としては、隣接画素の代表
画素値(これも平均値やメジアンとすることが可能であ
る)と連結成分の代表画素値の色相違度(画素値各成分
の差の2乗和など)を用いることが可能である。
【0023】次に、上記のようにして得た罫線候補の連
結成分から相対短ラン除外手段106−08により、連
結成分の外接矩形の長さに対して相対的に短いランを排
除し(S6−08)、残ラン統合手段106−09によ
り残ったランに対して再度連結成分抽出を行って(S6
−09)、罫線候補から最終目的とする罫線を得る。こ
の処理過程を説明する図7を参照すると、同図示のよう
に、非常に長い罫線に大きな図などが重なった場合に
(図中(I)参照)、上記のフローにおけるように、連
結成分抽出(ステップS6−03)、或いは連結成分の
形状と色による2段階のチェック(ステップS6−04
〜S6−07)を行った結果、罫線を含む連結成分とし
て連結成分の外接矩形の全長に比べて相対的に短い長さ
部分を構成するラン部分を持つものが抽出された場合に
(図中(II)参照)、このまま統合処理を行うと、罫線
の外接矩形が不当に太くなってしまう。そこで、これを
防止するために、連結成分の外接矩形の全長に比べて相
対的に短い長さ部分を構成するラン部分を除外する処理
を行い適切な罫線の抽出を行う(図中(III)参照)。
なお、罫線の抽出を行う手順として示した上記ステップ
S6−04〜09は、例示した本実施形態の構成に限ら
ず、実施にあたって、発明思想を逸脱しない範囲でその
一部の抽出要素に係わる手順を省略しても良い。このよ
うにして、残ラン統合手段106−09により残ランを
統合し、全外接矩形を吟味済みか、即ち画像全体の罫線
抽出が済んだかを確認したら(S6−10−Yes)、
統合した外接矩形を罫線の抽出結果として罫線出力手段
106−10により、次の処理であるステップS7へ渡
すために出力する。
【0024】次に、外接矩形統合手段107により連結
成分の外接矩形の統合を行う(S7)。この外接矩形統
合処理は、前段で抽出した罫線を用い、罫線と統合対象
の2外接矩形の関係から、2外接矩形を統合するか否か
を判定するために設けたステップであり、本発明を特徴
付ける要素である。図8は、本実施形態に係る外接矩形
統合処理(S7)のより詳細なフローを示すチャートで
あり、図9は、本実施形態に係る外接矩形統合手段10
7のより詳細な構成を示すブロック図である。本例の外
接矩形統合手段107を図9を参照して説明すると、2
矩形選択・統合手段107−1は、選択した2外接矩形
データを隣接判定手段107−2、サイズ吟味手段10
7−3、矩形間色差異吟味手段107−4、矩形間罫線
有無判定手段107−5、罫線長吟味手段107−6、
矩形−罫線間色差異判定手段107−7に送出し、又、
上記各手段107−2〜7による統合の判定結果を受け
て2矩形の統合を行う。なお、統合の判定を行う上記各
手段107−2〜7は、例示した本実施形態の構成に限
らず、実施にあたって、発明思想を逸脱しない範囲でそ
の一部の判定要素を省略しても良い。隣接判定手段10
7−2は、2外接矩形間の距離により統合を判定する。
サイズ吟味手段107−3は、2外接矩形間のサイズの
近似性により統合を判定する。矩形間色差異吟味手段1
07−4は、2外接矩形間の色の差異により統合を判定
する。矩形間罫線有無判定手段107−5は、罫線に対
する2外接矩形の相互位置関係、即ち罫線を境界として
互いに反対側にあるか否かにより統合を判定する。罫線
長吟味手段107−6は、罫線に対する2外接矩形の相
互長さ関係により真に罫線であるか否かを吟味すること
により、統合を判定する。矩形−罫線間色差異判定手段
107−7は、罫線に対する2外接矩形の色の関係によ
り真に罫線であるか否かを吟味することにより、統合を
判定する。
【0025】次に、外接矩形統合処理手順を図8のフロ
ーチャートを参照して説明する。なお、以下の説明は、
上記外接矩形統合手段の動作説明を兼ねる。図8のフロ
ー(同図中(I))によると、先ず、2矩形選択・統合手
段107−1により、統合の対象とする2つの連結成分
の外接矩形を選択する(S7−01)。この後、選択し
た2外接矩形を統合するか否かを以下の各観点により判
定し、判定結果を受けて2矩形選択・統合手段107−
1は、統合を実行する。統合するか否かの判定は、順次
選択される2外接矩形を対象にして全ての外接矩形につ
いて行う。統合するか否かの判定ステップとして、先
ず、隣接判定手段107−2により対象とする2矩形が
隣接しているかどうか判定する(S7−02)。隣接し
ているかどうかの判定は、水平方向の文字行を抽出して
いる場合には、左右方向の2矩形間の距離が所定の基準
値以内であるか否か、を条件とした判断によることが可
能である。この判定により、隣接していなければ(S7
−02−No)、2外接矩形は同一の行を構成する矩形
ではないと判断し、統合を行わない。本例のフローによ
ると、図8の(II)に示す2矩形選択・統合手段107−
1が実行する統合の非実行/実行フローに従う。統合し
ない場合、ステップS7−08を経て全ての矩形につい
て統合するか否かの判定を行ったかをチェックして(S
7−10)、完了した場合は(S7−10−Yes)こ
の処理を抜け、完了しない場合(S7−10−No)は
次の2矩形に対する処理を行うために、選択ステップ
(S7−01)に戻す。
【0026】2矩形が隣接していれば(S7−02−Y
es)、次に、サイズ吟味手段107−3により2矩形
の大きさが似ているかどうかを判定する(S7−0
3)。ここでは、サイズとして高さの差異により、それ
が所定範囲内にあるか否かを判断し、あまりにも違う大
きさ(高さ)の矩形同士は、同一の行を構成する文字行
の外接矩形ではないと判断し(S7−03−No)、上
記隣接度によるときと同様に、統合を行わないようにす
る図8の(II)に示すフローにおけるステップS7−08
を経る手順を行う。2矩形の大きさ、例えば高さの差異
が所定範囲内であれば(S7−03−Yes)、次に、
矩形間色差異吟味手段107−4により2矩形の色差異
の吟味を行い、色が近いかどうかを判定する(S7−0
4)。ここでは、矩形同士の色が遠い場合、違う色の矩
形であり、矩形同士は、同一の行を構成する文字列の外
接矩形ではないと判断し(S7−04−No)、上記隣
接度によるときと同様に、図8の(II)における統合を行
わないようにするステップS7−08の手順を実行す
る。
【0027】上記のチェックをパスした2矩形に対し
て、次に先に抽出した罫線に係わるチェックを掛ける。
先ず、矩形間罫線有無判定手段107−5により、罫線
が2矩形の間に存在するかどうかを判定する(S7−0
5)。この判定は、水平方向の文字行の途中に、縦罫線
がこれを分断する形である場合は、罫線の左右の文字行
同士は、罫線をまたいで統合すべきものではないと考え
ることが適当であり、この場合に統合実行を止める方向
で、そのための必要条件の一つとしてチェックを掛け
る。罫線が2矩形を分断する形である場合(S7−05
−Yes)、統合実行を止める次の必要条件についてチ
ェックを掛ける。2矩形を分断する形で罫線が存在しな
ければ(S7−05−No)、統合し新たな矩形を生成
することが適当と考えられるので、統合を実行する。本
例のフローによると、図8の(II)に示す2矩形選択・統
合手段107−1が実行する統合の非実行/実行フロー
に従う。統合する場合、ステップS7−09を経て全て
の矩形について統合するか否かの判定を行ったかをチェ
ックして(S7−10)、完了した場合は(S7−10
−Yes)この処理を抜け、完了しない場合(S7−1
0−No)は次の2矩形に対する処理を行うために、選
択ステップ(S7−01)に戻す。
【0028】罫線が2矩形を分断する形で存在すると判
断された場合は(S7−05−Yes)、統合実行を止
める次の必要条件である罫線長について罫線長吟味手段
107−06でその吟味を行う(S7−06)。ここま
でに、みなし罫線として扱ってきた外接矩形が、統合対
象の2矩形の高さに比べて十分に長くない場合は(S7
−06−No)、罫線でなく文字の一部である可能性が
高いので、このような場合は罫線とはみなさず対象2矩
形は統合対象とし、みなし罫線を含め統合する。統合ス
テップは、上記の場合と同様に、図8の(II)に示すフロ
ーにおけるステップS7−09を経る手順を行う。罫線
長吟味の結果、罫線がその性質を持つに十分な長さを持
つ場合(S7−06−Yes)、矩形−罫線間色差異判
定手段107−7により統合対象の2矩形と罫線の色の
差異を吟味する(S7−07)。ここでは、矩形と罫線
の色の差異が大きく、色が違うと判断される場合は(S
7−07−No)、図6に示したように、罫線は文字間
のスペース(背景)がたまたま罫線のような形状になっ
たものである可能性が高いので、このときには罫線とは
みなさず、対象2矩形は統合対象として統合する。統合
ステップは、上記の場合と同様に、図8の(II)に示すフ
ローにおけるステップS7−09を経る手順を行う。矩
形と罫線の色を判定した結果、色の差異が小さく罫線が
その性質を持つに十分であった場合、真の罫線と判断し
て、統合の対象とした矩形同士は統合せず、分断したま
まにしておくべきと判断し(S7−07−Yes)、上
記と同様に、統合を行わないようにする手順(図8の(I
I))におけるステップS7−08を経る手順を行う。こ
のようにして、これらの処理をすべての矩形に対して繰
り返し、対象の全ての外接矩形について統合条件を吟味
したことを確認して(S7−10−Yes)、統合処理
を抜ける。なお、統合の判定を行う手順として示した上
記各ステップS7−02〜07は、例示した本実施形態
の構成に限らず、実施にあたってその一部の判定要素に
係わる手順を省略しても良い。
【0029】次に、文字行判定手段108により、文字
行であるかを最終的に判定する(S8)。この文字行判
定処理は、前段の外接矩形統合手段107で統合された
連結成分の外接矩形を対象にして、それが真に文字行で
あるかの判定を行う。ここまでで文字行を抽出するため
に絞り込んできた連結成分には文字行が含まれている
が、図や写真の一部などを誤って統合するなどした、文
字行でないものが含まれている可能性もあり、その意味
では文字行候補である。そこで、このステップではさら
に絞り込みを行うために文字行の吟味を行う。この絞り
込みを行うための具体的な方法は、先行例(特願2001-
86484号)にも記述がある方法を適用することができ
る。例えば、領域内のエッジ強度を計測し、ある程度以
上強いエッジが多数含まれている場合に文字であると判
断する、などの方法を適宜用いるようにする。こうし
て、文字行の外接矩形を精度良く抽出し、抽出した外接
矩形の領域を文字領域として文字領域出力手段109に
より、認識処理に必要なデータとして処理手段に送出し
(S9)、本例の処理フローを抜ける。なお、上記実施
形態のフローにおけるステップS6の罫線抽出及びステ
ップ7の外接矩形統合以外の各ステップは、先行例(特
願2001- 86484号)に示された文字領域認識処理フロー
の該当するステップと基本的に変わりがないので、詳細
は、先行例を参照することとする。
【0030】「実施形態2」本実施形態は、上記した
「実施形態1」の文字領域認識処理手順中に、原画像か
ら罫線構成画素を排除する手順を付加して構成され、こ
の手順により得た罫線消去画像を基に実施形態1におけ
ると同様の文字領域認識処理を行うことにより、罫線の
影響により文字行矩形抽出に漏れを起こすことがあった
実施形態1における問題点を解消し、適切な文字領域の
認識処理を行うことを可能にすることを意図するもので
ある。図10は、本実施形態に係る画像処理方法の処理
フローを示すチャートであり、図11は、本実施形態に
係る画像処理装置の構成を示すブロック図である。本実
施形態に係る画像処理装置を図11を参照して説明する
と、実施形態1の構成(図2)に付加され、本実施形態
を特徴付ける手段は、罫線消去画像生成手段202にあ
る。この罫線消去画像生成手段202を画像入力手段2
01の後段に備え、圧縮画像生成手段203、罫線抽出
手段207、文字行判定手段209への画像入力を、直
接画像入力手段201からとした実施形態1の方式に代
えて、罫線消去画像生成手段202を通し、罫線を消去
した画像を入力する方式とする(ただし、罫線の抽出に
は直接画像入力手段201からの原画像を用いるので、
罫線抽出手段207に対してそのための接続も行う)。
この方式を採用する以外は、基本的に実施形態1と同様
の装置構成により、ラン生成手段204、連結成分生成
手段205、連結成分選別手段206、罫線抽出手段2
07、外接矩形統合手段208、文字行判定手段20
9、文字領域出力手段210を設ける。
【0031】実施形態2に係る画像処理方法は、図10
のフローチャートに示すように、画像入力手段201に
より処理対象の画像入力(S21)を行った後に、文字
領域の位置情報を取得するための文字行の外接矩形抽出
処理の前に、予め罫線抽出処理を行う(S22)。罫線
抽出処理は、実施形態1に示したこの処理(図1のS
6)と同様に実行する。次いで、前ステップで求めた罫
線のデータを用いて罫線消去画像生成手段202により
原入力画像から罫線を消去する処理を行い、罫線消去画
像を生成する(S23)。こうして生成した罫線消去画
像をもとに、以降の文字行の外接矩形抽出処理を実行す
る。つまり、以降のステップS24〜S30における文
字行の外接矩形抽出処理(文字領域の情報を取得する処
理)では、全て罫線を消去した画像を処理対象として処
理を行う。文字行の外接矩形抽出処理の対象画像として
罫線を消去した画像を用いると、図16に示したよう
な、罫線と文字が接触、あるいは非常に接近している場
合に有効で、罫線を消去することで、罫線に接触してい
る文字を含めて抽出することができる。即ち、文字が罫
線の一部となって、処理過程で文字行の外接矩形から除
かれるという不具合が起きることがない。この後に行う
文字行の外接矩形抽出処理の手順は、実施形態1に示し
たステップS2〜S9と同様に実施し得る。ただし、実
施形態2では、既にステップS22で罫線抽出処理を終
えているので、実施形態1に示したステップS6の手順
は行わない。
【0032】「実施形態3」本実施形態は、上記した
「実施形態1」の文字領域認識処理手順中に、原画像の
圧縮画像から罫線構成画素を排除する手順を付加して構
成され、この手順により得た罫線消去された圧縮画像を
基に実施形態1におけると同様の文字領域認識処理を行
うことにより、データ量の小さい圧縮画像に対する処理
として、適切な文字領域の認識処理を高速に行うことを
可能にすることを意図するものである。図12は、本実
施形態に係る画像処理方法の処理フローを示すチャート
であり、図13は、本実施形態に係る画像処理装置の構
成を示すブロック図である。本実施形態に係る画像処理
装置を図13を参照して説明すると、実施形態1の構成
(図2)に付加され、本実施形態を特徴付ける手段は、
罫線消去圧縮画像生成手段303にある。この罫線消去
圧縮画像生成手段303を圧縮画像生成手段302の後
段に備え、ラン生成手段304、連結成分生成手段30
5、連結成分選別手段306、罫線抽出手段307、外
接矩形統合手段308、文字行判定手段309への画像
入力を、圧縮画像生成手段302からとした実施形態1
の方式に代えて、罫線消去圧縮画像生成手段303を通
し、罫線を消去した圧縮画像を入力する方式とする(た
だし、圧縮画像の罫線抽出には圧縮画像生成手段302
からの圧縮画像を用いるので、罫線抽出手段307に対
してそのための接続も行う)。この方式を採用する以外
は、基本的に実施形態1と同様の装置構成により、ラン
生成手段304、連結成分生成手段305、連結成分選
別手段306、罫線抽出手段307、外接矩形統合手段
308、文字行判定手段309、文字領域出力手段31
0を設ける。
【0033】実施形態3に係る画像処理方法は、図12
のフローチャートに示すように、画像入力手段301に
より処理対象の画像入力(S31)を行い、入力された
原画像に対し圧縮画像生成手段302により圧縮処理
(S32)を行った後に、文字領域の位置情報を取得す
るための文字行の外接矩形抽出処理の前に、圧縮画像に
予め罫線抽出処理を行う(S33)。罫線抽出処理は、
実施形態1に示したこの処理(図1のS6)と同様に実
行するが、ここでは処理対象を圧縮画像とする。次い
で、罫線消去圧縮画像生成手段303により前ステップ
で求めた罫線のデータを用いて原入力の圧縮画像から罫
線を消去する処理を行い、罫線消去圧縮画像を生成する
(S34)。こうして生成した罫線消去圧縮画像をもと
に、以降の文字行の外接矩形抽出処理を実行する。つま
り、以降のステップS35〜S40における文字行の外
接矩形抽出処理(文字領域の情報を取得する処理)で
は、全て罫線を消去した圧縮画像を処理対象として処理
を行う。文字行の外接矩形抽出処理の対象画像として罫
線を消去した圧縮画像を用いると、処理対象を小さいデ
ータ量とすることができ、高速処理が可能になる。後続
する文字行の外接矩形抽出処理の手順は、実施形態1に
示したステップS3〜S9と同様に実施し得る。ただ
し、実施形態3では、既にステップS32で罫線抽出処
理を終えているので、実施形態1に示したステップS6
の手順は行わない。
【0034】「実施形態4」本実施形態は、上記した実
施形態1〜3に示した文字領域認識処理フローの各ステ
ップを実行する手段として、汎用の処理装置(コンピュ
ータ)を利用した実施形態を示すものである。図14
は、本実施形態の処理装置の構成を示す。図14に示す
ように、本実施形態は、汎用の処理装置(コンピュー
タ)により実施する例を示すものであり、構成要素とし
てCPU601、メモリ602、ハードディスクドライ
ブ603、入力装置604、CD−ROMドライブ60
5、ディスプレイ606、マウスなどを用意する。ま
た、CD−ROMドライブ605が用いるCD−ROM
などの記録媒体607には、本発明の文字領域認識・抽
出の上記した処理機能や処理手順を実現させるためのプ
ログラム(ソフトウェア)が記録されている。処理対象
の原稿画像は、スキャナー等の入力装置604により入
力され、例えばハードディスク603などに格納されて
いるものである。CPU601は、記録媒体607から
上記した処理機能、手順を実現するプログラムを読み出
し、プログラムに従う文字領域認識・抽出処理を対象画
像に実行し、その結果をディスプレイ606などに出力
する。
【0035】
【発明の効果】(1) 請求項1の発明に対応する効果 多値のカラー画像を基にして、そこから罫線を抽出し、
又同画像を基に文字候補として生成された連結成分の外
接矩形を統合する際に、得た罫線が内在しないようにし
たので、不適切な統合を回避でき(罫線で区切られた領
域を誤って統合することなく)、対象画像の文字領域を
表す適切な情報の取得を可能にする。 (2) 請求項2の発明に対応する効果 多値のカラー画像を基にして、そこから罫線を抽出し、
又入力多値カラー画像から罫線を構成する画素を排除し
た二次多値画像を基に文字候補の連結成分を生成したの
で、罫線との連結による抽出漏れを防ぎ(罫線と接触し
た文字でも抽出ができ)、さらに、文字候補として生成
された連結成分の外接矩形を統合する際に、得た罫線が
内在しないようにしたので、不適切な統合を回避でき、
対象画像の文字領域を表す適切な情報の取得を可能にす
る。
【0036】(3) 請求項3,4の発明に対応する効
果 上記(1)、(2)の効果に加え、統合対象として選択
された2つの矩形が罫線を境界として互いに反対側にあ
る場合に該矩形の統合を中止し、しかも罫線が矩形と同
じ色とみなせる場合に統合を中止するようにしたので、
請求項1,2の発明を具体化するための有効な手段を提
供し得る。 (4) 請求項5〜7の発明に対応する効果 上記(1)〜(3)の効果に加え、垂直方向に接する同
色のランを連結成分として得、罫線の形状特徴による絞
り込みを掛け罫線抽出を行うようにしたので、容易に罫
線を抽出可能である。しかも、連結成分を構成するラン
とこれに隣接する画素との色の相違度が所定値以上であ
る場合に該連結成分を罫線であると判断すること、さら
に連結成分の外接矩形の全長に比べて相対的に短い長さ
部分を構成するランを除外することにより、精度良く罫
線が抽出可能となる。
【0037】(5) 請求項8の発明に対応する効果 多値のカラー画像を基にして、そこから罫線を抽出し、
又同画像を基に文字候補として生成された連結成分の外
接矩形を統合する際に、得た罫線が内在しないような抽
出を可能にしたので、不適切な統合を回避でき(罫線で
区切られた領域を誤って統合することなく)、又入力多
値カラー画像から罫線を構成する画素を排除した二次多
値画像を基に文字候補の連結成分を生成可能としたの
で、対象画像の文字領域を表す適切な情報の取得が可能
になる。 (6) 請求項9の発明に対応する効果 請求項8に記載された画像処理方法の各ステップを実行
するためのプログラムを汎用の処理装置(コンピュー
タ)に搭載することにより、上記(5)の効果を容易に
具現化することが可能になる。
【図面の簡単な説明】
【図1】 文字領域認識処理を行う本発明に係る画像処
理方法の処理フロー(実施形態1)を示すチャートであ
る。
【図2】 文字領域認識処理を行う本発明に係る画像処
理装置の構成(実施形態1)を示すブロック図である。
【図3】 ランの統合による連結成分の生成状態を示す
図である。
【図4】 図1における罫線抽出処理(S6)の詳細フ
ローを示すチャートである。
【図5】 図2における罫線抽出手段のより詳細な構成
を示すブロック図である。
【図6】 文字間の間隙と罫線の違いを説明する図であ
る。
【図7】 罫線と図が重複した原画像から生成される連
結成分から罫線のみの成分を得る過程を説明する図であ
る。
【図8】 図1における外接矩形統合処理(S7)の詳
細フローを示すチャートである。
【図9】 図2における外接矩形統合手段のより詳細な
構成を示すブロック図である。
【図10】 文字領域認識処理を行う本発明に係る画像
処理方法の処理フロー(実施形態2)を示すチャートで
ある。
【図11】 文字領域認識処理を行う本発明に係る画像
処理装置の構成(実施形態2)を示すブロック図であ
る。
【図12】 文字領域認識処理を行う本発明に係る画像
処理方法の処理フロー(実施形態3)を示すチャートで
ある。
【図13】 文字領域認識処理を行う本発明に係る画像
処理装置の構成(実施形態3)を示すブロック図であ
る。
【図14】 汎用のコンピュータを利用した実施形態の
画像処理装置の構成を示すブロック図である。
【図15】 文字が罫線で区切られていても、距離が近
ければ統合を行ってしまう文字行の生成状態を説明する
図である。
【図16】 画像圧縮により罫線と文字が同一の連結成
分として融合してしまう状態を説明する図である。
【符号の説明】
101,201,301…処理対象画像入力手段、10
2,203,302…圧縮画像生成手段、103,10
6−01,204,304…ラン生成手段、104,2
05,305…連結成分生成手段、105,206,3
06…連結成分選別手段、106,207,307…罫
線抽出手段、107,208,308…外接矩形統合手
段、108,209,309…文字行判定手段、10
9,210,310…文字領域出力手段 106−02…長ラン選別手段、 106−03…連結
成分抽出手段、106−04…外接矩形縦横比算出手
段、106−05…形状吟味手段、 106−06…
色相違度計算手段、106−07…色相違度判定手段、
106−08…相対短ラン除外手段、106−09…残
ラン統合手段、 106−10…罫線出力手段、107
−1…2矩形選択・統合手段、107−2…隣接判定手
段、 107−3…サイズ吟味手段、107−4…
矩形間色差異吟味手段、107−5…矩形間罫線有無判
定手段、107−6…罫線長吟味手段、107−7…矩
形−罫線間色差異判定手段、601…CPU、
602…メモリ、603…ハードディスクドラ
イブ、604…入力装置、605…CD−ROMドライ
ブ、 606…ディスプレイ、607…CD−ROM。

Claims (9)

    【特許請求の範囲】
  1. 【請求項1】 処理対象として入力された多値画像、或
    いはその圧縮画像から同色とみなせる画素をランとして
    抽出する手段と、隣接するランを統合して連結成分を生
    成する手段と、連結成分のうち文字とみなせない不要成
    分を排除する手段と、前記多値画像から罫線を抽出する
    手段と、罫線が内在しないように連結成分の外接矩形を
    統合する手段と、統合された外接矩形から文字連結成分
    によるとみなせるものを判定する手段と、判定された文
    字連結成分による外接矩形を文字領域を表す情報として
    出力する手段とを備えたことを特徴とする画像処理装
    置。
  2. 【請求項2】 処理対象として入力された多値画像から
    罫線を抽出する手段と、入力多値画像から罫線を構成す
    る画素を排除した二次多値画像、或いはその圧縮画像か
    ら同色とみなせる画素をランとして抽出する手段と、隣
    接するランを統合して連結成分を生成する手段と、連結
    成分のうち文字とみなせない不要成分を排除する手段
    と、罫線が内在しないように連結成分の連結成分の外接
    矩形を統合する手段と、統合された外接矩形から文字連
    結成分によるとみなせるものを判定する手段と、判定さ
    れた文字連結成分による外接矩形を文字領域を表す情報
    として出力する手段とを備えたことを特徴とする画像処
    理装置。
  3. 【請求項3】 請求項1又は2に記載された画像処理装
    置において、前記連結成分の外接矩形を統合する手段
    は、統合対象として選択された2つの矩形が前記罫線を
    境界として互いに反対側にある場合に該矩形の統合を中
    止する手段を備えたことを特徴とする画像処理装置。
  4. 【請求項4】 請求項3に記載された画像処理装置にお
    いて、前記矩形の統合を中止する手段が、前記罫線が矩
    形と同じ色とみなせる場合に統合を中止する手段である
    ことを特徴とする画像処理装置。
  5. 【請求項5】 請求項1乃至4のいずれかに記載された
    画像処理装置において、前記罫線を抽出する手段は、多
    値画像から同色とみなせる画素をランとして抽出する手
    段と、抽出されたランのうち所定長以上のものだけを選
    別する手段と、選別されたランの隣接するものを統合
    し、生成した連結成分を罫線として抽出する手段を備え
    たことを特徴とする画像処理装置
  6. 【請求項6】 請求項5に記載された画像処理装置にお
    いて、前記罫線を抽出する手段は、生成した前記連結成
    分を構成するランとこれに隣接する画素との色の相違度
    を求める手段と、前記相違度が所定値以上である場合に
    該連結成分が罫線であると判断する手段を備えたことを
    特徴とする画像処理装置。
  7. 【請求項7】 請求項5又は6に記載された画像処理装
    置において、前記罫線を抽出する手段は、生成した前記
    連結成分を構成するランのうち、該連結成分の外接矩形
    の全長に比べて相対的に短い長さ部分を構成するランを
    除外する手段と、除外後に得られた連結成分を罫線とし
    て出力する手段を備えたことを特徴とする画像処理装
    置。
  8. 【請求項8】 処理対象として入力された多値画像、或
    いはその圧縮画像から同色とみなせる画素をランとして
    抽出するステップと、隣接するランを統合して連結成分
    を生成するステップと、連結成分のうち文字とみなせな
    い不要成分を排除するステップと、前記多値画像から罫
    線を抽出するステップと、連結成分の外接矩形を統合す
    るステップと、統合された外接矩形から文字連結成分に
    よるとみなせるものを判定するステップと、判定された
    文字連結成分による外接矩形を文字領域を表す情報とし
    て出力するステップの各ステップを実行することを特徴
    とする画像処理方法。
  9. 【請求項9】 請求項8に記載された画像処理方法の各
    ステップをコンピュータに実行させるためのプログラ
    ム。
JP2002003625A 2002-01-10 2002-01-10 画像処理装置、画像処理方法、及び同方法に用いるプログラム Pending JP2003208567A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2002003625A JP2003208567A (ja) 2002-01-10 2002-01-10 画像処理装置、画像処理方法、及び同方法に用いるプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002003625A JP2003208567A (ja) 2002-01-10 2002-01-10 画像処理装置、画像処理方法、及び同方法に用いるプログラム

Publications (1)

Publication Number Publication Date
JP2003208567A true JP2003208567A (ja) 2003-07-25

Family

ID=27643172

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002003625A Pending JP2003208567A (ja) 2002-01-10 2002-01-10 画像処理装置、画像処理方法、及び同方法に用いるプログラム

Country Status (1)

Country Link
JP (1) JP2003208567A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014164320A (ja) * 2013-02-21 2014-09-08 Mitsubishi Electric Corp 文字認識装置および文字認識方法
WO2022254560A1 (ja) * 2021-05-31 2022-12-08 株式会社KPMG Ignition Tokyo 光学文字認識により生成されるテキストデータを用いたデータマッチング

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014164320A (ja) * 2013-02-21 2014-09-08 Mitsubishi Electric Corp 文字認識装置および文字認識方法
WO2022254560A1 (ja) * 2021-05-31 2022-12-08 株式会社KPMG Ignition Tokyo 光学文字認識により生成されるテキストデータを用いたデータマッチング

Similar Documents

Publication Publication Date Title
TW201437925A (zh) 物體識別裝置、方法及電腦程式產品
US20040086184A1 (en) Image processing apparatus, image processing method, and storage medium
JP2000137788A (ja) 画像処理方法、画像処理装置及び記録媒体
JP2005037378A (ja) 奥行計測方法と奥行計測装置
JP2002288589A (ja) 画像処理方法、画像処理装置および画像処理方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体
JP2007034733A (ja) 対象物領域検出装置、方法およびプログラム
JP5870745B2 (ja) 画像処理装置、二値化閾値算出方法及びコンピュータプログラム
JP5600524B2 (ja) 画像処理装置、画像処理方法、プログラム、および記憶媒体
JP2003208567A (ja) 画像処理装置、画像処理方法、及び同方法に用いるプログラム
EP2541469B1 (en) Image recognition device, image recognition method and image recognition program
JP5761353B2 (ja) 隆線方向抽出装置、隆線方向抽出方法、隆線方向抽出プログラム
JP6118295B2 (ja) マーカ埋め込み装置、マーカ検出装置、方法、及びプログラム
JP2007206963A (ja) 画像処理装置及び画像処理方法及びプログラム及び記憶媒体
JP4807879B2 (ja) 入力された画像データから少なくとも1以上の認識対象画像を抽出するための画像認識装置、方法、プログラム及び情報記録媒体
JP4910635B2 (ja) 画像処理装置及び画像処理プログラム
JP4257264B2 (ja) パターン照合装置、画像品質検証方法及び画像品質検証プログラム
JP2003208568A (ja) 画像処理装置、画像処理方法、及び同方法に用いるプログラム
JP2004038530A (ja) 画像処理方法、同方法の実行に用いるプログラム及び画像処理装置
JP2008269131A (ja) 画像処理装置及び画像処理プログラム
JP2004145592A (ja) 移動ベクトル抽出装置及び方法及びプログラム及びその記録媒体
JP6055952B1 (ja) 画像検査装置、画像検査方法、およびプログラム
JP4240296B2 (ja) 画像処理装置、画像処理方法及び該方法の実行に用いるプログラム
JP2005165925A (ja) 2値化処理装置、および2値化処理方法
JP4471202B2 (ja) 画像処理装置、画像処理方法及び同方法に用いるプログラム
JP2005309772A (ja) 文字成分抽出装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20040927

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20070517

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070522

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070720

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20070906