JP2001043312A - 文書画像処理装置 - Google Patents

文書画像処理装置

Info

Publication number
JP2001043312A
JP2001043312A JP2000146842A JP2000146842A JP2001043312A JP 2001043312 A JP2001043312 A JP 2001043312A JP 2000146842 A JP2000146842 A JP 2000146842A JP 2000146842 A JP2000146842 A JP 2000146842A JP 2001043312 A JP2001043312 A JP 2001043312A
Authority
JP
Japan
Prior art keywords
plane
rectangle
character
image
pixel
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2000146842A
Other languages
English (en)
Inventor
Toru Suino
水納  亨
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP2000146842A priority Critical patent/JP2001043312A/ja
Publication of JP2001043312A publication Critical patent/JP2001043312A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Facsimile Image Signal Circuits (AREA)
  • Color Image Communication Systems (AREA)
  • Image Analysis (AREA)

Abstract

(57)【要約】 【課題】 高速かつ高精度な文字や画像の抽出が可能と
なる文書画像処理装置を提供する。 【解決手段】 文書画像処理装置は、画像入力部1と、
プレーン分割部2と、二値化部3と、外接矩形作成部4
と、矩形毎の再二値化部5と、外接矩形再作成部6と、
矩形制御部7と、プレーン統合部8と、領域識別部9
と、文字認識部10とを備える。そして、入力カラー画
像を複数プレーンに分割し、それぞれのプレーンを二値
化し、それぞれのプレーンから文字矩形を求め、入力カ
ラー画像を文字矩形内のみ再び二値化することにより、
それぞれのプレーンを再構築し、あるプレーンの文字矩
形内の画素と他のプレーンの同じ座標での画素との論理
演算により、濃い文字プレーンと薄い文字プレーンの二
つのプレーンに文字を抽出する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は文書画像処理装置に
関し、特にカラー文書画像の文字抽出技術に関するもの
である。
【0002】
【従来の技術】文字部分と背景部分との明度差が少ない
カラー印刷物等を読み取ることにより得られたカラー画
像データから文字部分を抽出して文字の認識を行う場
合、明度差でなく色の違いを利用して文字部分を抽出す
ることが従来より行われている。そして例えば、特開平
8−123901号公報には以下のような技術が示され
ている。
【0003】色空間上の位置情報に基づいて色空間にお
ける色分布を求め、さらにカラー画像データを二値化す
る際のしきい値に応じて、色分布を複数の色範囲に分割
する。そして、それぞれの色範囲毎にカラー画像データ
を二値化し、該色範囲内の画素を文字部分とそれ以外の
画素からなる背景部分とすることによって文字画像を抽
出する。
【0004】しかしながら、文字を抽出する場合に、色
空間上の位置情報に基づいて色空間における色分布を求
める従来の文字抽出技術においては、長い処理時間を要
するという問題がある。
【0005】ここで、図1を参照しつつ、従来における
文字認識方法の具体例を説明する。なお以下において
は、「1.AB」と書かれた赤色文字51と、該赤色文
字51の背景を構成する黒色の背景画像53とを含むサ
ンプル画像50が対象とされる場合を説明する。
【0006】まず、サンプル画像50は、Rプレーン5
4とGプレーン55、及びBプレーン56にプレーン分
割される。そして、これらのRプレーン54とGプレー
ン55、及びBプレーン56はそれぞれプレーン毎に二
値化され、Rプレーン57とGプレーン58、及びBプ
レーン59が生成される。
【0007】次に、二値化されたRプレーン57とGプ
レーン58、及びBプレーン59を統合することにより
統合プレーン60を生成して、サンプル画像全体におい
て文字認識がなされる。
【0008】しかしながら、上記においては、黒色の背
景と赤色文字との間で色濃度差が小さいため、プレーン
分割により得られたRプレーン54とGプレーン55、
及びBプレーン56を二値化した以降の段階において
は、「1.AB」との該文字は完全に判別できなくな
り、適正な文字認識ができないという問題がある。
【0009】また同様な問題は、従来の画像認識におい
ても生じている。すなわち例えば図2に示されるよう
に、濃度差が小さい第一画像63と第二画像65を含む
サンプル画像61を上記と同様に画像処理する場合、プ
レーン分割されたプレーンを二値化した以降の段階にお
いては、第一画像63及び第二画像65に対応して、こ
れら二つの画像の区別を不可能とする二値画像69が得
られるため、得られた統合プレーン67において適正な
画像認識ができないという問題がある。
【0010】
【発明が解決しようとする課題】本発明は、上記のよう
な問題を解消するためになされたもので、高速かつ高精
度な文字や画像の抽出が可能となる文書画像処理装置を
提供することを目的とするものである。
【0011】
【課題を解決するための手段】上記の目的を達成するた
めに、請求項1記載の発明は、カラー画像データを入力
する画像入力手段と、カラー画像データのRGB各成分
をある係数で重み付けして複数のプレーンに分割するプ
レーン分割手段と、複数のプレーンをそれぞれ二値化す
る二値化手段と、二値化されたそれぞれのプレーンの黒
連結成分、白連結成分により外接矩形を作成する外接矩
形作成手段と、それぞれのプレーンの外接矩形内をカラ
ー画像データにより再度二値化する再二値化手段と、二
値化手段と再二値化手段で得られた二値化画像に対し外
接矩形を再び作成する外接矩形再作成手段と、あるプレ
ーンの外接矩形内の画素と他のプレーンの同じ座標での
画素との論理演算によりその画素の値を決定するプレー
ン統合手段と、統合されたプレーンを文字領域、表領域
などの領域に分割する領域識別手段と、文字領域での二
値画像から文字認識を行う文字認識手段とを備えたこと
を特徴とするものである。
【0012】また、上記目的を達成するために、請求項
2記載の発明は、請求項1記載において、プレーン内の
黒連結成分による外接矩形と、白連結成分による外接矩
形とが包含関係にある場合、内側の外接矩形を削除する
矩形制御手段をさらに備えたことを特徴とするものであ
る。
【0013】本発明では、色空間上の位置情報に基づい
て色空間における色分布を求めることはせずに、入力カ
ラー画像を複数プレーンに分割し、それぞれのプレーン
を二値化し、それぞれのプレーンから文字矩形を求め、
入力カラー画像を文字矩形内のみ再び二値化することに
より、それぞれのプレーンを再構築し、あるプレーンの
文字矩形内の画素と他のプレーンの同じ座標での画素と
の論理演算により、濃い文字プレーンと薄い文字プレー
ンの二つのプレーンに文字を抽出する。このため、高速
かつ高精度な文字抽出が可能となる。
【0014】
【発明の実施の形態】以下において、本発明の実施の形
態を図面を参照しつつ詳しく説明する。なお、図中同一
符号は同一又は相当部分を示す。
【0015】図3は、本発明の実施の形態に係る文書画
像処理装置の全体構成を示すブロック図である。図3に
示されるように、この文書画像処理装置は、画像入力部
1と、プレーン分割部2と、二値化部3と、外接矩形作
成部4と、矩形毎の再二値化部5と、外接矩形再作成部
6と、矩形制御部7と、プレーン統合部8と、領域識別
部9と、文字認識部10とを備える。
【0016】ここで、画像入力部1は、カラースキャナ
などの入力機器によりカラー画像の入力を行う。また、
プレーン分割部2は、画像入力部1で得た画像(入力画
像)のRGB成分に、例えば1:0:0や0:1:0、
あるいは0:0:1などの重み付けをして、例えば、R
プレーンやGプレーン、Bプレーンといった3つのプレ
ーンに分割する。さらに二値化部3は、判別分析法など
の適応的二値化方式を用いて各プレーンの二値化を行
う。
【0017】外接矩形作成部4は、二値化部3で得られ
た二値化画像に対し、黒ランの連結成分からなる外接矩
形と、白ランの連続成分からなる外接矩形を作成する。
【0018】以下において、外接矩形作成部4による外
接矩形の作成動作を、図4のフローチャートを参照しつ
つ説明する。なお、前提として各文字毎に矩形を作成
し、以下のような手順により該矩形を適宜併合すること
によって、上記外接矩形を作成する。
【0019】まず、ステップS1においてポインタP1
(図示していない。)を画像の左最上段に作成された第
一の矩形にセットする。そしてステップS2において、
右方へ連続的に該ポインタP1をスキャンし、該第一の
矩形から右隣の第二の矩形までの距離がしきい値TH8
より小さいか否か判断する。なおここで、しきい値TH
8は、典型的な文字間隔より少し大きな距離とされ、文
字の大きさに比例する値とされる。
【0020】そして、該第一の矩形から該第二の矩形ま
での距離がしきい値TH8より小さいと判断した場合に
は、ステップS3へ進んで該第二の矩形を該第一の矩形
に併合する。
【0021】一方、ステップS2において、該第一の矩
形から該第二の矩形までの距離がしきい値TH8より小
さくないと判断した場合には、ステップS4へ進んでポ
インタP1をさらに右方へ移動する。ステップS5で
は、作成されている矩形がさらに右隣にあるか否か判断
し、あると判断した場合にはステップS2へ戻り、ない
と判断した場合にはステップS6へ進む。
【0022】ステップS6では、ポインタP1を次の行
の最左端に移動させ、ステップS7において、作成され
ている矩形がさらに残っているか否か判断する。ここ
で、さらに矩形があると判断した場合にはステップS2
へ戻ると共に、残っている矩形がないと判断した場合に
は、ステップS8へ進む。
【0023】そして以下のステップS8からステップS
14においては、上記矩形を該画像の垂直方向に関して
併合する。すなわち、ステップS8では、ポインタP2
(図示していない。)を画像の右最上段に作成された第
三の矩形にセットする。そしてステップS9において、
下方へ連続的に該ポインタP2をスキャンし、該第三の
矩形から直下の第四の矩形までの距離がしきい値TH9
より小さいか否か判断する。なおここで、しきい値TH
9は上記しきい値TH8と同様に、典型的な文字間隔よ
り少し大きな距離とされ、文字の大きさに比例する値と
される。
【0024】そして、該第三の矩形から該第四の矩形ま
での距離がしきい値TH9より小さいと判断した場合に
は、ステップS10へ進んで該第四の矩形を該第三の矩
形に併合する。
【0025】一方、ステップS9において、該第三の矩
形から該第四の矩形までの距離がしきい値TH9より小
さくないと判断した場合には、ステップS11へ進んで
ポインタP2をさらに下方へ移動する。ステップS12
では、作成されている矩形がさらに下方にあるか否か判
断し、あると判断した場合にはステップS9へ戻り、な
いと判断した場合にはステップS13へ進む。
【0026】ステップS13では、ポインタP2を左隣
の列の最上端に移動させ、ステップS14において、作
成されている矩形がさらに残っているか否か判断する。
ここで、さらに矩形があると判断した場合にはステップ
S9へ戻ると共に、残っている矩形がないと判断した場
合には、外接矩形の作成動作を終了する。
【0027】また、矩形毎の再二値化部5は、画像入力
部1で得られた入力画像と外接矩形作成部4で得られた
矩形情報を用いて入力画像の外接矩形内の部分を再び二
値化する。そして、外接矩形再作成部6は、二値化部3
と矩形毎の再二値化部5で得られた二値化画像に対し、
黒ランと白ランを用いて外接矩形を再び作成する。
【0028】矩形制御部7は、プレーン毎に黒ラン外接
矩形に包含された白ラン外接矩形の削除、白ラン外接矩
形に包含された黒ラン外接矩形の削除を行う。また、プ
レーン統合部8は、各プレーンの文字矩形内の画素値
と、同じ座標における他のプレーンの画素値との論理演
算により、統合後のその座標の画素値を算出する。
【0029】領域識別部9は、統合されたプレーンを、
文字領域や表領域、図領域などの領域に分割する。ま
た、文字認識部10は、文字領域での二値画像において
文字認識を行い、文字コードに変換する。なお後述する
ように、該文字認識部10は、図形などからなる領域で
の二値画像において該図形の認識を行う、いわゆる画像
認識の機能も備えたものとすることができる。
【0030】図5は包含された外接矩形を削除する第一
の例を示す図であり、図6は包含された外接矩形を削除
する第二の例を示す図である。図5に示されるように、
黒ランによる図5(a)の外接矩形11に包含された白
ランによる外接矩形12が、図5(b)に示されるよう
に矩形制御部7によって削除される。
【0031】また同様に、図6に示されるように、白ラ
ンによる図6(a)の外接矩形12に包含された黒ラン
による外接矩形11が、図6(b)に示されるように矩
形制御部7によって削除される。
【0032】図7は、矩形毎の再二値化部5による、矩
形情報に応じた再二値化の例を示す図である。二値化部
3は、図7(a)に示されるように、入力画面13の全
面において入力画像を二値化する。このとき、図7
(d)に示されるように、入力画面13において、その
背景に対し文字が適正に抽出されればよいが、図7
(b)に示されるように、二値化されるページ14によ
っては、背景と文字との間における色の組合せにより文
字が精度よく抽出できないことが生じ得る。
【0033】そこで、このような場合には、外接矩形作
成部4は、図7(c)に示されるように、抽出される文
字を包含する外接矩形15を抽出する。
【0034】そして次に、矩形毎の再二値化部5によ
り、図7(d)に示されるように、該抽出された外接矩
形15内の文字に対応する画像データが再二値化され
る。すなわち、矩形毎の再二値化部5が、外接矩形15
内の文字に対応する二値データのレベルを、背景色との
差異を際立たせるよう再設定することにより、より精度
よく該文字を抽出することができる。
【0035】以下において、外接矩形作成部4による文
字を包含した外接矩形15の抽出動作を図8のフローチ
ャートを参照しつつ説明する。まず、ステップS1にお
いて、既に作成されている外接矩形を一つ選択する。次
に、ステップS2において、選択した該矩形の短辺の長
さがしきい値TH1としきい値TH2の間であるか否か
判断する。そして、該矩形の短辺の長さがしきい値TH
1としきい値TH2の間であると判断した場合にはステ
ップS3へ進み、該矩形の短辺の長さがしきい値TH1
としきい値TH2の間にないと判断した場合にはステッ
プS10へ進んで該矩形を抽出の対象から除外する。
【0036】ステップS3では、選択した該矩形の長辺
の長さがしきい値TH3としきい値TH4の間であるか
否か判断する。そして、該矩形の長辺の長さがしきい値
TH3としきい値TH4の間であると判断した場合には
ステップS4へ進み、該矩形の長辺の長さがしきい値T
H3としきい値TH4の間にないと判断した場合にはス
テップS10へ進んで該矩形を抽出の対象から除外す
る。
【0037】さらにステップS4では、選択した該矩形
の短辺の長さに対する長辺の長さの比がしきい値TH5
としきい値TH6の間であるか否か判断する。そして、
該比がしきい値TH5としきい値TH6の間であると判
断した場合にはステップS5へ進み、該比がしきい値T
H5としきい値TH6の間にないと判断した場合にはス
テップS10へ進んで該矩形を抽出の対象から除外す
る。
【0038】次に、ステップS5では、該矩形内の全画
素数に対する該矩形内において同じ二値レベルを有する
連結画素の数の比が、しきい値TH7より大きいか否か
を判断する。ここで、該比がしきい値TH7より大きい
と判断した場合にはステップS6へ進み、該該比がしき
い値TH7より大きくないと判断した場合にはステップ
S10へ進んで該矩形を抽出の対象から除外する。
【0039】そして、ステップS6において全矩形の選
択が完了したか否か判断し、完了していないと判断した
場合にはステップS1へ戻ると共に、完了したと判断し
た場合には文字を包含した外接矩形15の抽出動作を終
了する。
【0040】従って上記において、各しきい値TH1〜
TH7を適切な値に設定することにより、所望の外接矩
形のみを抽出することができる。より具体的には、画像
ノイズに対応して作成されてしまった外接矩形は、文字
に対応して作成された外接矩形(文字矩形)に比して小
さいため、上記ステップS2の処理により抽出対象から
除外することができ、図形画像に対応して作成された外
接矩形は逆に文字矩形に対して大きいため、上記ステッ
プS3の処理により抽出対象から除外できる。さらに、
線や円、絵などの図形に対応する矩形は、その短辺に対
する長辺の比が文字矩形の該比と相違するため、上記ス
テップS4の処理により抽出対象から除外できる。ま
た、図形に対応する矩形においては、該矩形内の全画素
数に対する該矩形内において同じ二値レベルを有する連
結画素数の比が、しばしば文字矩形の該比に対して小さ
いため、上記ステップS5の処理により抽出対象から除
外することができる。
【0041】次に、動的二値化方法の一つである判別分
析法を用いた、矩形毎の再二値化部5による再二値化動
作を、図9に示されたフローチャートを参照しつつ説明
する。なお、以下においては一例として、薄青色の背景
を有した濃い赤色の領域があって、さらに該赤色の領域
中に黒色で文字が書かれているサンプル画像を処理対象
とする場合について説明する。
【0042】まず、ステップS1において、濃度ヒスト
グラムを作成する。ここで、上記画像をプレーン分割す
ることにより得られたRプレーンに対する濃度ヒストグ
ラムが、図10に示される。図10に示されるように、
該濃度ヒストグラムにおいては、それぞれ縦軸が画素
数、横軸が画素の色の濃度を示し、白色の濃度値は0で
黒色の濃度値が255とされる。
【0043】そして、図10に示されるように、該濃度
ヒストグラムにおいては、上記黒色の文字を構成する画
素に対応して第一の画素グループ89が形成され、赤色
の領域を構成する画素に対応して第二の画素グループ9
0が形成され、薄青色の背景を構成する画素に対応して
第三の画素グループ91が形成される。
【0044】次に、ステップS2においては、ステップ
S1で作成された濃度ヒストグラムに基づいて、縦軸が
濃度和または濃度の2乗和で、横軸が濃度とされる和、
2乗和のヒストグラムが作成される。ここで、「濃度
和」とは上記濃度値と該濃度値を持つ画素数の積を順次
積算することにより得られる値であり、「2乗和」とは
上記濃度値の2乗と該濃度値を持つ画素数の積を順次積
算することにより得られる値を意味する。
【0045】そして、ステップS3においては、動的二
値化法におけるしきい値として、図10に示されるよう
にしきい値BTHを暫定的に設定し、該しきい値BTH
を境界として白側の濃度和を算出する。さらに、ステッ
プS4においては、該しきい値BTHを境界としたとき
における黒側の濃度和を算出する。
【0046】ここで、しきい値BTHを境界として文字
を表す画素を含む上記黒側を「クラス内」と呼び、白側
を「クラス外」と呼ぶと、ステップS5においては、ク
ラス外における画素数の分布に係る分散、及びクラス内
における画素数の分布に係る分散をそれぞれ算出する。
【0047】そして、ステップS6においては、算出さ
れたクラス内の分散に対するクラス外の分散の比を算出
する。ここでステップS7においては、図10の矢印に
示されるように、上記しきい値BTHの値を順次0から
255まで1ずつ増加させ、上記ステップS1からステ
ップS6の動作を繰り返すことにより、上記クラス内分
散に対するクラス外分散の比の最大値を算出する。そし
て最後に、ステップS8において、上記クラス内分散に
対するクラス外分散の比が最大値となるときの該しきい
値BTHが求められ、その濃度値が動的二値化方法にお
けるしきい値として設定される。
【0048】ここで、上記のような手順により図10に
示された濃度値D1がしきい値BTHとして設定され、
上記サンプル画像から得られたRプレーンが二値化され
た場合には、図10に示されるように、文字の黒色とそ
れを取り巻く領域の赤色との濃度値が近いため、両画素
グループ89,90が同じ二値データとされる。従っ
て、該二値化により上記領域において文字の判別ができ
なくなる。
【0049】そこで、上記のように所望の外接矩形を抽
出して、以下のように再度判別分析法で二値化する。ま
ず、上記の二値化により得られた画像において、文字を
含む領域の外接矩形を抽出して、抽出された該外接矩形
内の画像に対する濃度ヒストグラムが作成される。
【0050】ここで、抽出された該外接矩形内の画像に
対するRプレーンの濃度ヒストグラムが、図11に示さ
れる。このとき、該外接矩形は上記の赤色領域を囲むも
のであるため、薄青色の背景に対応する画素は濃度ヒス
トグラム上に表れない。従って、図11に示された濃度
ヒストグラムにおいては、図10に示された画素グルー
プ91が消滅している。そして、再度上記図9に示され
た判別分析法を実行することにより、しきい値BTHを
濃度値D2に設定して再二値化すると、黒色の文字を構
成する画素グループ89と、文字を取り巻く赤色の領域
を構成する画素グループ90とを区別でき、文字が認識
できる状態で上記サンプル画像のRプレーンが生成でき
る。
【0051】なお、上記の再二値化により、所望の文字
がそれを取り巻く領域と区別できるようになったか否か
は、以下のように判断する。まず、再二値化により得ら
れた画像に対し上記図4に示された手順などによって外
接矩形を作成する。そして、上記図8に示された手順な
どによって、作成された該外接矩形の大きさが文字に対
応して作成される外接矩形(文字矩形)の大きさか否か
判断する。
【0052】ここで、作成された該外接矩形の大きさが
文字に対応して作成される外接矩形(文字矩形)の大き
さであると判断された場合には、該外接矩形内の画素は
文字を構成するものと判断し、再二値化を終了する。一
方、作成された該外接矩形の大きさが文字に対応して作
成される外接矩形(文字矩形)の大きさでないと判断さ
れた場合には、再度外接矩形を抽出して二値化を繰り返
す。
【0053】なお、上記のようにして所定回数二値化を
繰り返すことによっても文字矩形が得られなければ、該
画像領域に文字が含まれていないと判断して二値化を終
了する。
【0054】次に、矩形制御部7について説明する。プ
レーンの統合を行う場合、黒画素プレーンでは、薄い文
字の中にできる黒ランの連結成分からなる外接矩形中の
画素、白画素プレーンでは、濃い文字の中にできる白ラ
ンの連結成分からなる外接矩形中の画素の存在により、
ノイズが残る可能性がある。
【0055】よって、上記のように、各プレーン(RG
Bプレーン)においては、プレーンの統合をする直前
に、図5及び図6に示されるように、黒ランの連結成分
による外接矩形11に包含される白ランの連結成分によ
る外接矩形12、白ランの連結成分による外接矩形12
に包含される黒ランの連結成分による外接矩形11をそ
れぞれ削除する。
【0056】次に、プレーン統合部8について説明す
る。ここでは、一例としてRGBプレーンを、薄い背景
の下で濃い文字を抽出した黒文字プレーン19と、濃い
背景の下で薄い文字を抽出した白文字プレーン20との
二つのプレーンに統合する動作について説明する。
【0057】図12は、論理和により黒文字が統合され
る場合を示す図である。以下において図12を参照しつ
つ、プレーン統合部8が採用する黒文字プレーン19の
基本的生成方法を説明する。まず図12(a)におい
て、赤(R)プレーン16における黒ランの連結成分に
基づいて設定された文字矩形21中の黒画素をピクセル
R、緑(G)プレーン17における黒ランの連結成分に
基づいて設定された文字矩形21中の黒画素をピクセル
G、青(B)プレーン18における黒ランの連結成分に
基づいて設定された文字矩形21中の黒画素をピクセル
Bとする。このとき、これら3つのプレーンを統合した
後の黒画素をピクセルBKとすると、プレーン統合部8
は、ピクセルRとピクセルG、及びピクセルBの論理和
を取ることによって該ピクセルBKを求め、図12
(b)に示された黒文字プレーン19を生成する。
【0058】つまり、例えば図12(a)に示された赤
(R)プレーン16の文字矩形21内における文字「R
ed」を構成する画素と、他の緑(G)プレーン17や
青(B)プレーン18において該文字「Red」と同じ
位置にある画素との論理和が取られることにより黒文字
「Red」が抽出される。
【0059】なお、プレーン統合部8は論理和に代わる
他の論理演算を実行することによって黒文字プレーン1
9を作成することとしてもよい。
【0060】図13は、論理和により白文字が統合され
る場合を示す図である。以下において図13を参照しつ
つ、プレーン統合部8が採用する白文字プレーン20の
基本的生成方法を説明する。まず図13(a)におい
て、赤(R)プレーン16における白ランの連結成分に
基づいて設定された文字矩形22中の白画素をピクセル
R、緑(G)プレーン17における白ランの連結成分に
基づいて設定された文字矩形22中の白画素をピクセル
G、青(B)プレーン18における白ランの連結成分に
基づいて設定された文字矩形22中の白画素をピクセル
Bとする。このとき、これら3つのプレーンを統合した
後の白画素をピクセルWHとすると、プレーン統合部8
は、ピクセルRとピクセルG、及びピクセルBの論理和
を取ることによって該ピクセルWHを求め、図13
(b)に示された白文字プレーン20を生成する。
【0061】なお、プレーン統合部8は論理和に代わる
他の論理演算を実行することによって白文字プレーン2
0を作成することとしてもよい。
【0062】次に領域識別部9は、上記のような方法に
より生成された黒文字プレーン19と白文字プレーン2
0の画像をそれぞれ、文字領域や表領域、あるいは図そ
の他を示す領域などに識別し、識別された該文字領域中
の文字を文字認識部10が認識する。
【0063】最後に、上記のような本実施の形態に係る
文書画像処理装置を文字認識と、画像認識に適用した具
体例を説明する。まず、図14を参照しつつ、上記文字
認識における動作を説明する。なお以下においては、図
1に示されたものと同じサンプル画像50を用いて説明
する。
【0064】まずプレーン分割部2は、サンプル画像5
0をRプレーン54とGプレーン55、及びBプレーン
56にプレーン分割する。そして二値化部3は、これら
のRプレーン54とGプレーン55、及びBプレーン5
6をそれぞれ、上記判別分析法を用いてプレーン毎に二
値化し、Rプレーン70とGプレーン71、及びBプレ
ーン72を生成する。ここで、外接矩形作成部4は、二
値化されたRプレーン70とGプレーン71、及びBプ
レーン72において、それぞれ外接矩形21を生成し、
該外接矩形21を抽出する。
【0065】次に、矩形毎の再二値化部5は、二値化さ
れたRプレーン70とGプレーン71、及びBプレーン
72において抽出された外接矩形21内の画像を、該画
像に含まれた文字「1.AB」の判別が可能となるまで
繰り返し再二値化し、Rプレーン73とGプレーン7
4、及びBプレーン75を生成する。
【0066】そして、プレーン統合部8は、再二値化に
より得られたRプレーン73とGプレーン74、及びB
プレーン75を統合することにより統合プレーン76を
生成し、さらに再二値化を実行する前のGプレーン71
及びBプレーン72と統合プレーン76とを併合して、
二値のテキスト画像からなる統合プレーン77を生成す
る。
【0067】次に領域識別部9は、得られた統合プレー
ン77において該サンプル画像を構成する各領域を識別
し、文字認識部10は該統合プレーン77全体において
文字認識を実行する。なお、上記プレーンの統合におい
ては、例えばサンプル画像50の横幅一杯に伸びる領域
等といった、明らかに妥当でない大きさを有する外接矩
形に含まれた画像は該統合の対象としない。
【0068】次に、図15を参照しつつ、上記画像認識
における動作を説明する。なお以下においては、図2に
示されたものと同じサンプル画像61を用いて説明す
る。
【0069】まずプレーン分割部2は、サンプル画像6
1をRプレーンとGプレーン、及びBプレーンにプレー
ン分割する。そして二値化部3は、これらのプレーンを
それぞれ、上記判別分析法を用いてプレーン毎に二値化
し、Rプレーン81とGプレーン82、及びBプレーン
83を生成する。なお該二値化により、サンプル画像6
1に含まれた第一画像63と第二画像65とに応じて二
値画像69が生成される。
【0070】次に、外接矩形作成部4は、二値化された
Rプレーン81とGプレーン82、及びBプレーン83
においてそれぞれ外接矩形を生成し、所定の大きさより
大きな外接矩形を抽出する。
【0071】次に、矩形毎の再二値化部5は、二値化さ
れたRプレーン81とGプレーン82、及びBプレーン
83において抽出された外接矩形内の画像を、第一画像
63と第二画像65との判別が可能となるまで繰り返し
再二値化し、Rプレーン84とGプレーン85、及びB
プレーン86を生成する。なお、上記再二値化を所定回
数繰り返しても複数の画像に分けられなければ、該再二
値化を終了する。
【0072】そして、プレーン統合部8は、再二値化に
より得られたRプレーン84とGプレーン85、及びB
プレーン86を統合することにより二値のテキスト画像
からなる統合プレーン87を生成する。なお、背景画像
と対象画像とが分けられない場合、すなわち、上記にお
いて第一画像63と第二画像65とが該再二値化によっ
ても分けられないような場合には、それらにより生成さ
れた二値画像69は上記統合の対象とされない。
【0073】そして、領域識別部9は、得られた統合プ
レーン87において該サンプル画像を構成する各領域を
識別し、文字認識部10は該統合プレーン87全体にお
いて画像認識を実行する。
【0074】
【発明の効果】上述の如く、本発明によれば、色空間上
の位置情報に基づいて色空間における色分布を求めるこ
とはせずに、入力カラー画像を複数プレーンに分割し、
それぞれのプレーンを二値化し、それぞれのプレーンか
ら文字矩形を求め、入力カラー画像を文字矩形内のみ再
び二値化することにより、それぞれのプレーンを再構築
し、あるプレーンの文字矩形内の画素と他のプレーンの
同じ座標での画素との論理演算により、濃い文字プレー
ンと薄い文字プレーンの二つのプレーンに文字を抽出す
るようにしたものであるから、カラー文書から高速にか
つ高精度に濃い文字と薄い文字の抽出を行うことができ
る。
【図面の簡単な説明】
【図1】従来の文字認識方法を説明する図である。
【図2】従来の画像認識方法を説明する図である。
【図3】本発明の実施の形態に係る文書画像処理装置の
全体構成を示すブロック図である。
【図4】図3に示された外接矩形作成部による外接矩形
の作成動作を説明するフローチャートである。
【図5】包含された外接矩形を削除する第一の例を示す
図である。
【図6】包含された外接矩形を削除する第二の例を示す
図である。
【図7】矩形情報による再二値化の例を示す図である。
【図8】図3に示された外接矩形作成部による文字を含
んだ外接矩形の抽出動作を示すフローチャートである。
【図9】図3に示された矩形毎の再二値化部による再二
値化動作を示すフローチャートである。
【図10】図3に示された矩形毎の再二値化部の動作を
説明するための第一の濃度ヒストグラムを示す図であ
る。
【図11】図3に示された矩形毎の再二値化部の動作を
説明するための第二の濃度ヒストグラムを示す図であ
る。
【図12】論理和による黒文字の統合を示す図である。
【図13】論理和による白文字の統合を示す図である。
【図14】本発明の実施の形態に係る文書画像処理装置
による文字認識を説明する図である。
【図15】本発明の実施の形態に係る文書画像処理装置
による画像認識を説明する図である。
【符号の説明】
1 画像入力部 2 プレーン分割部 3 二値化部 4 外接矩形作成部 5 矩形毎の再二値化部 6 外接矩形再作成部 7 矩形制御部 8 プレーン統合部 9 領域識別部 10 文字認識部 11,12,15 外接矩形 13 入力画面 14 ページ 16,54,57,70,73,81,84 赤(R)
プレーン 17,55,58,71,74,82,85 緑(G)
プレーン 18,56,59,72,75,83,86 青(B)
プレーン 19 黒文字プレーン 20 白文字プレーン 21,22 文字矩形 50,61 サンプル画像 51 赤色文字 53 背景画像 60,67,76,77,87 統合プレーン 63 第一画像 65 第二画像 69 二値画像 89,90,91 画素グループ
───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.7 識別記号 FI テーマコート゛(参考) H04N 1/46 Z

Claims (2)

    【特許請求の範囲】
  1. 【請求項1】 カラー画像データを入力する画像入力手
    段と、 前記カラー画像データのRGB各成分をある係数で重み
    付けして複数のプレーンに分割するプレーン分割手段
    と、 前記複数のプレーンをそれぞれ二値化する二値化手段
    と、 二値化されたそれぞれのプレーンの黒連結成分、白連結
    成分により外接矩形を作成する外接矩形作成手段と、 それぞれのプレーンの外接矩形内を前記カラー画像デー
    タにより再度二値化する再二値化手段と、 前記二値化手段と再二値化手段で得られた二値化画像に
    対し外接矩形を再び作成する外接矩形再作成手段と、 あるプレーンの外接矩形内の画素と他のプレーンの同じ
    座標での画素との論理演算によりその画素の値を決定す
    るプレーン統合手段と、 統合されたプレーンを文字領域、表領域などの領域に分
    割する領域識別手段と、 文字領域での二値画像から文字認識を行う文字認識手段
    とを備えたことを特徴とする文字画像処理装置。
  2. 【請求項2】 請求項1記載において、 プレーン内の黒連結成分による外接矩形と、白連結成分
    による外接矩形とが包含関係にある場合、内側の外接矩
    形を削除する矩形制御手段をさらに備えたことを特徴と
    する文書画像処理装置。
JP2000146842A 1999-05-26 2000-05-18 文書画像処理装置 Pending JP2001043312A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2000146842A JP2001043312A (ja) 1999-05-26 2000-05-18 文書画像処理装置

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP11-146404 1999-05-26
JP14640499 1999-05-26
JP2000146842A JP2001043312A (ja) 1999-05-26 2000-05-18 文書画像処理装置

Publications (1)

Publication Number Publication Date
JP2001043312A true JP2001043312A (ja) 2001-02-16

Family

ID=26477260

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000146842A Pending JP2001043312A (ja) 1999-05-26 2000-05-18 文書画像処理装置

Country Status (1)

Country Link
JP (1) JP2001043312A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7711189B2 (en) 2005-12-20 2010-05-04 Fujitsu Limited Layout analysis program, layout analysis apparatus and layout analysis method
JP2012212425A (ja) * 2011-03-30 2012-11-01 Seiko Epson Corp 入力画像を分析する方法、入力画像を分析する装置およびコンピューター読み取り可能な媒体
WO2015159941A1 (ja) * 2014-04-16 2015-10-22 グローリー株式会社 カラー画像における文字背景除去方法及び装置、並びにラインカメラの設置調整方法及び設置調整用チャート
JP2015210802A (ja) * 2014-04-30 2015-11-24 日本電産コパル株式会社 光学式文字認識装置、光学式文字認識方法

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7711189B2 (en) 2005-12-20 2010-05-04 Fujitsu Limited Layout analysis program, layout analysis apparatus and layout analysis method
JP2012212425A (ja) * 2011-03-30 2012-11-01 Seiko Epson Corp 入力画像を分析する方法、入力画像を分析する装置およびコンピューター読み取り可能な媒体
WO2015159941A1 (ja) * 2014-04-16 2015-10-22 グローリー株式会社 カラー画像における文字背景除去方法及び装置、並びにラインカメラの設置調整方法及び設置調整用チャート
JPWO2015159941A1 (ja) * 2014-04-16 2017-04-13 グローリー株式会社 カラー画像における文字背景除去方法及び装置
JP2015210802A (ja) * 2014-04-30 2015-11-24 日本電産コパル株式会社 光学式文字認識装置、光学式文字認識方法

Similar Documents

Publication Publication Date Title
US6993185B2 (en) Method of texture-based color document segmentation
JP4366011B2 (ja) 文書処理装置及び方法
JP3308032B2 (ja) スキュー補正方法およびスキュー角検出方法およびスキュー補正装置およびスキュー角検出装置
US6803920B2 (en) Method and apparatus for digital image segmentation using an iterative method
JP3950777B2 (ja) 画像処理方法、画像処理装置および画像処理プログラム
JP2001297303A (ja) 文書画像認識方法、装置及びコンピュータ読み取り可能な記録媒体
KR20010110416A (ko) 비디오 스트림 분류가능 심볼 고립 방법 및 시스템
JP2005523530A (ja) 取り込み画像データから文字列を識別して抜出するシステムおよび方法
JP2002024836A (ja) ディジタルイメージから表題を抽出する方法
JP2002133426A (ja) 多値画像から罫線を抽出する罫線抽出装置
JP3753357B2 (ja) 文字抽出方法および記録媒体
JP2002288589A (ja) 画像処理方法、画像処理装置および画像処理方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体
US6360006B1 (en) Color block selection
JPH05166002A (ja) ソース画像を分析する方法
JP2018152026A (ja) 文字認識方法及びコンピュータプログラム
JP2001043312A (ja) 文書画像処理装置
JP2004199622A (ja) 画像処理装置、画像処理方法、記録媒体およびプログラム
JP3544324B2 (ja) 文字列情報抽出装置及び方法及びその方法を記録した記録媒体
CN112861860B (zh) 一种基于上下边界提取的自然场景下文字检测方法
JP2001209808A (ja) 物体抽出システムと方法並びに物体抽出用プログラムを記憶した記憶媒体
JPH1125222A (ja) 文字切り出し方法及び文字切り出し装置
JP3172498B2 (ja) イメージ認識用特徴値抽出方法、およびその装置、イメージ解析プログラムを格納する記憶媒体
JP4116377B2 (ja) 画像処理方法および画像処理装置
JP2002175532A (ja) 画像処理装置、画像処理方法および画像処理プログラムを記録した記憶媒体
JP4409713B2 (ja) 文書画像認識装置及び記録媒体