JP2001283153A - カラー画像から文字列パターンを抽出する装置および方法 - Google Patents

カラー画像から文字列パターンを抽出する装置および方法

Info

Publication number
JP2001283153A
JP2001283153A JP2001019060A JP2001019060A JP2001283153A JP 2001283153 A JP2001283153 A JP 2001283153A JP 2001019060 A JP2001019060 A JP 2001019060A JP 2001019060 A JP2001019060 A JP 2001019060A JP 2001283153 A JP2001283153 A JP 2001283153A
Authority
JP
Japan
Prior art keywords
character string
color
string pattern
extracted
background
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2001019060A
Other languages
English (en)
Other versions
JP4275866B2 (ja
Inventor
Yutaka Katsuyama
裕 勝山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2001019060A priority Critical patent/JP4275866B2/ja
Publication of JP2001283153A publication Critical patent/JP2001283153A/ja
Application granted granted Critical
Publication of JP4275866B2 publication Critical patent/JP4275866B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】 カラー文書画像に含まれる文字と背景を高精
度に分離し、小さな文字パターンを抽出することが課題
である。 【解決手段】 パターン抽出装置は、まず、複数色の背
景上の大きな文字を抽出する方法を用いて、カラー画像
から文字列領域を抽出し、各文字列領域内のパターンを
抽出する(S91)。次に、抽出された文字列領域の背
景部分が均一色か否かを判定し(S92)、背景部分が
均一色であれば、一様色の背景上の小さな文字を抽出す
る方法を用いて、文字列領域からより詳細にパターンを
抽出する(S93)。そして、すべての文字列領域の処
理が終了すると、抽出されたパターンの2値画像を出力
する(S95)。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、画像処理技術に係
り、カラー画像からタイトル等の文字列パターンを抽出
するパターン抽出装置およびその方法に関する。
【0002】
【従来の技術】近年、コンピュータやカラープリンタ等
の周辺機器の発達と、その低価格化に伴って、カラー画
像を処理する分野が広がっている。このため、カラー画
像を領域分割し、カラー画像の中から特定領域だけを抽
出する技術、例えば、カラー画像中の同色領域を抽出す
る技術が求められている。
【0003】例えば、CCD(charge coupled device
)カメラで撮影したカラー情景画像を処理対象の入力
画像とする場合、画像認識による果物選別や、車の監
視、セキュリティーのための人物監視等、多方面におい
て、このような技術が求められている。
【0004】また、カラー文書画像を入力画像とする場
合、画像から文書名やキーワード等の文字領域を自動抽
出して、それを検索時に使用するための技術として期待
されている。その一例として、図書館での本の分類や、
管理の自動システムがあげられる。その他にも、画像を
データベースとして蓄積、共有化するグループウェアで
の自動キーワードまたはファイル名付け等に利用され
る。これらの情報は、膨大な量のカラー文書画像を自動
検索するのに使用される。
【0005】カラー文書画像から文字領域を抽出する従
来の技術が記載されている文献としては、以下のような
ものがある。 ・仙田等,「文字の単色性に着目したカラー画像からの
文字パターン抽出法」,電子情報通信学会PRU94−
09,pp.17−24,1994. ・上羽等,「等色線処理によるカラー画像からの文字領
域の抽出」,電子情報通信学会PRU94−09,p
p.9−16,1994. ・松尾等,「カラー文書画像からの単色文字領域の抽
出」,1997電子情報通信学会総合大会D−12−1
9,1997. ・松尾等,「濃淡および色情報による情景画像からの文
字列抽出」,電子情報通信学会PRU92−121,p
p.25−32,1992. ・「画像処理装置およびパターン抽出装置」,特願平1
0−350342. これらの技術は、以下のように分類される。 a)色空間におけるクラスタリング法 RGB画像の画素に対して、RGB空間上またはRGB
以外の色空間(HSV空間等)上で何らかのクラスタリ
ングを行い、1つのクラスタに属する画素だけで色毎の
画像を作成して、同一色の領域を抽出する。また、この
方法により抽出された領域を併合して、新たな領域を抽
出する。 b)領域拡張法 隣接する画素の色が近いときにそれらの画素に同一ラベ
ルを与えることを繰り返して、画像全体を領域に区分し
ていく。この方法は、処理する対象が画素の周辺だけで
あるので、a)に比べて処理時間を短くできる利点があ
る。
【0006】
【発明が解決しようとする課題】しかしながら、上述し
た従来の文字領域抽出方法には、次のような問題があ
る。
【0007】カラー文書画像においては、文字の輪郭部
分で文字色と背景色が混ざり合う混色と呼ばれる現象が
見られる。このため、a)およびb)の両者とも、大き
な文字パターンでは問題ないが、小さな文字パターンで
は、文字の抽出そのものができなくなる場合があるとい
う問題を抱えている。
【0008】本発明の課題は、カラー文書画像に含まれ
る文字と背景を高精度に分離し、小さな文字パターンで
も抽出することができるパターン抽出装置およびその方
法を提供することである。
【0009】
【課題を解決するための手段】図1は、本発明のパター
ン抽出装置の原理図である。本発明の第1の局面におい
て、パターン抽出装置は、概略抽出手段1、詳細抽出手
段2、出力手段3、および判定手段4を備える。
【0010】概略抽出手段1は、複数色の背景上の大き
な文字を抽出可能な抽出方法を用いて、カラー画像から
文字列パターンを抽出する。判定手段4は、抽出された
文字列パターンの領域内において、背景色が均一か否か
を判定する。詳細抽出手段2は、上記背景色が均一であ
るとき、一様色の背景上の小さな文字を抽出可能な抽出
方法を用いて、上記文字列パターンの領域から文字列パ
ターンを再抽出する。そして、出力手段3は、上記背景
色が均一でないとき、概略抽出手段1により抽出された
文字列パターンを出力し、上記背景色が均一であると
き、詳細抽出手段2により抽出された文字列パターンを
出力する。
【0011】判定手段4は、概略抽出手段1により抽出
された文字列パターンの領域内において、さらに詳細抽
出手段2によるパターン抽出を行うか否かを、背景色の
均一性に基づいて決定する。そして、出力手段3は、詳
細抽出手段2により文字列パターンが抽出されたとき、
そのパターンを出力する。
【0012】このようなパターン抽出装置によれば、文
字列パターンの領域内の背景色が均一でなければ、複数
色の背景上の文字を抽出する方法により抽出された文字
列パターンが出力され、その背景色が均一であれば、一
様色の背景上の文字を抽出する方法により抽出された文
字列パターンが出力される。後者の抽出方法では、前者
の抽出方法に比べて、より小さな文字まで詳細に抽出す
ることができるため、均一な背景色を有する領域におけ
る抽出精度が向上する。
【0013】また、本発明の第2の局面において、パタ
ーン抽出装置は、概略抽出手段1、詳細抽出手段2、出
力手段3、および判定手段4を備える。詳細抽出手段2
は、一様色の背景上の小さな文字を抽出可能な抽出方法
を用いて、カラー画像から文字列パターンを抽出する。
判定手段4は、抽出された文字列パターンの領域内にお
いて、背景色が均一か否かを判定する。概略抽出手段1
は、上記背景色が均一でないとき、複数色の背景上の大
きな文字を抽出可能な抽出方法を用いて、上記文字列パ
ターンの領域から文字列パターンを再抽出する。そし
て、出力手段3は、上記背景色が均一であるとき、詳細
抽出手段2により抽出された文字列パターンを出力し、
上記背景色が均一でないとき、概略抽出手段1により抽
出された文字列パターンを出力する。
【0014】判定手段4は、詳細抽出手段2により抽出
された文字列パターンの領域内において、さらに概略抽
出手段1によるパターン抽出を行うか否かを、背景色の
均一性に基づいて決定する。そして、出力手段3は、概
略抽出手段1により文字列パターンが抽出されたとき、
そのパターンを出力する。
【0015】このようなパターン抽出装置によれば、第
1の局面におけるパターン抽出装置と同様に、均一な背
景色を有する領域における抽出精度が向上する。また、
本発明の第3の局面において、パターン抽出装置は、概
略抽出手段1、詳細抽出手段2、出力手段3、および合
成手段5を備える。
【0016】概略抽出手段1は、複数色の背景上の大き
な文字を抽出可能な抽出方法を用いて、カラー画像から
文字列パターンを抽出する。詳細抽出手段2は、一様色
の背景上の小さな文字を抽出可能な抽出方法を用いて、
上記カラー画像から文字列パターンを抽出する。合成手
段5は、概略抽出手段1により抽出された文字列パター
ンと、詳細抽出手段2により抽出された文字列パターン
とを合成する。そして、出力手段3は、合成された文字
列パターンを出力する。
【0017】このようなパターン抽出装置によれば、複
数色の背景上の文字を抽出する方法により抽出された文
字列パターンと、一様色の背景上の文字を抽出する方法
により抽出された文字列パターンが合成されて出力され
る。適切な合成方法を用いれば、前者の抽出方法におけ
る抽出精度の低さを後者の抽出方法により補うことがで
き、全体として抽出精度が向上する。
【0018】また、本発明の第4の局面において、パタ
ーン抽出装置は、概略抽出手段1、詳細抽出手段2、お
よび出力手段3を備える。概略抽出手段1は、複数色の
背景上の大きな文字を抽出可能な抽出方法を用いて、カ
ラー画像から文字列パターンを抽出する。詳細抽出手段
2は、一様色の背景上の小さな文字を抽出可能な抽出方
法を用いて、上記カラー画像から文字列パターンを抽出
する。そして、出力手段3は、概略抽出手段1により抽
出された文字列パターンと、詳細抽出手段2により抽出
された文字列パターンとを個別に出力する。
【0019】このようなパターン抽出装置によれば、複
数色の背景上の文字を抽出する方法により抽出された文
字列パターンと、一様色の背景上の文字を抽出する方法
により抽出された文字列パターンがそれぞれ個別に出力
される。したがって、ユーザは、出力された2つの文字
列パターンを比較して、いずれか一方を選択することが
でき、結果として抽出精度が向上する。
【0020】例えば、図1の概略抽出手段1、詳細抽出
手段2、判定手段4、および合成手段5は、後述する図
56のCPU(中央処理装置)221およびメモリ22
2に対応し、図1の出力手段3は、図56の出力装置2
24に対応する。
【0021】
【発明の実施の形態】以下、図面を参照しながら、本発
明の実施の形態を詳細に説明する。本実施形態において
は、先願の特願平10−350342(以下では、先願
Aと記す)の技術を改良して、さらに高精度なパターン
抽出を実現している。主要な改良点は、先願のパターン
抽出技術に、別の先願のカラーテキスト抽出技術を所定
のアルゴリズムに基づいて組み合わせて、パターン抽出
技術をハイブリッド化したことである。
【0022】別の先願である「文書画像認識装置、その
方法、及び記録媒体」(特願平10−145322,以
下では、先願Bと記す)と「カラー文書画像認識装置」
(特願平10−353045,以下では、先願Cと記
す)に記載されたカラーテキスト抽出技術では、カラー
画像の各画素の明度成分が所定のしきい値で2値化さ
れ、2値画像が生成される。この2値画像は、文字部分
に対応する値と背景部分に対応する値のいずれか一方を
持つ画素から構成される。
【0023】このとき、先願Bでは、カラー画像をグレ
ースケール画像に変換し、グレースケール画像に対して
画素値の補間等の処理を施して、解像度の高い2値画像
を生成する。
【0024】また、先願Cでは、まず、カラー画像をグ
レースケール画像に変換し、文字領域を覆う単一背景色
かつ単一文字色の部分領域の集合を求める。そして、そ
れぞれの部分領域の画像を2値化して部分2値画像を生
成し、部分2値画像を組み合わせて、全体のグレースケ
ール画像に対応する2値画像を生成する。
【0025】このようなカラーテキスト抽出技術によれ
ば、一様色背景上に一様色で文字が記載されている画像
から高精度な2値画像が生成され、小さな文字パターン
を正しく抽出することができる。一方、先願Aのパター
ン抽出技術によれば、大きな文字であれば、写真背景上
の文字であっても抽出することができる。そこで、両者
を組み合わせて実装することで、小さな文字パターンで
もある程度まで抽出することが可能になる。
【0026】このハイブリッド化されたパターン抽出技
術を実現するために改良された点は、以下の通りであ
る。 1)色ラベリング時に小さなパターンまで抽出 先願Aで使用されている色ラベリングでは、1つの同色
連結領域の面積が5画素以下、またはその外接矩形の高
さまたは幅が1画素である場合に、その領域を無視して
いた。今回の改良では、小さなパターンまで正しく抽出
するために、面積が5画素以下の領域だけ無視し、外接
矩形の高さまたは幅が1画素である領域は残すようにし
た。この結果、先願Aの方法ではうまく抽出できていな
かった小さなパターンの抽出が可能になった。 2)矩形単位の図形除去 色ラベリングで抽出された外接矩形を対象に、文字認識
処理を行い、1文字と判断された矩形が他の矩形に包含
される場合に、それを包含している矩形を図形と判断し
て除去する。 3)注目矩形抽出時に小さい矩形まで抽出 先願Aでは、39.4ドット/cm画像に対して、23
ドット以上の大きさの矩形を注目矩形として抽出してい
たが、小さなパターンを取りこぼすことがあったため、
10ドット以上の大きさの矩形を抽出することにした。
この改良により、今までは抽出できなかった小さい文字
パターンの抽出が可能になった。 4)同色グループ抽出の改良 先願Aでは、同色の矩形グループに1つの矩形を組み入
れる場合に、グループの平均色と矩形の色から求められ
る色差のしきい値を用いて、そのグループに矩形を組み
入れるか否かを判定していた。ここでは、代わりに、画
像全体から求めた色差のしきい値を使用する。これによ
り、色ラベリングと同様に高精度な同色判定が可能とな
った。 5)文字線太さによるグループの再分割の改良 先願Aでは、文字線太さによるグループの分割におい
て、グループの平均色と矩形の色から求められる色差の
しきい値を、この処理に独自の固定しきい値として使用
していた。このため、文字線の太さと色に基づく再グル
ープ化が行われていた。その代わりに、4)のグループ
化と同様に、画像全体から求めた色差のしきい値を使用
することで、文字線の太さだけに基づく再グループ化が
正確に行えるようになった。 6)グループ統合の高精度化 グループの統合において、グループの外接矩形の並び方
だけでなく、その内部に含まれる文字列矩形の並び方も
判断に入れるようにした。
【0027】以上説明した1)〜6)の改良点に加え
て、さらに以下のような改良も行った。 7)タイトルらしさによる出力順位の変更 別の先願である「文書画像からのタイトル抽出装置およ
び方法」(特願平7−341983,特開平9−134
406,以下では、先願Dと記す)の技術を応用して、
同色グループを単位としたタイトル抽出処理を開発し
た。これにより、同色グループの面積の大きい順にタイ
トルとして出力していたときに比べて、タイトル抽出の
性能が向上した。 8)第1のノイズ除去の改良 同色グループの中から、背景から抽出されたグループだ
けを除去するノイズグループの除去において、先願Aで
は、グループ内に2つの矩形があり、それらの矩形の端
の座標差が大きい場合にのみ、そのグループを削除する
という単純な処理を行っていた。しかし、このような処
理だけでは、ノイズグループが多数残ってしまってい
た。
【0028】そこで、グループ内部に含まれる文字矩形
を文字認識処理し、その結果文字と判断された矩形が別
のグループの矩形領域にもかかっている場合に、その別
のグループを図形と判断して削除することにした。これ
により、ノイズグループが減少した。 9)第2のノイズ除去の改良 グループ内の文字パターンの画素の縦横のヒストグラム
を生成し、縦横でヒストグラムの2乗和を求める。そし
て、それらの2乗和の差が一定しきい値より小さい場合
に、文字列が存在しないものと判断し、そのグループを
ノイズとして削除することにした。これにより、ノイズ
グループが減少した。
【0029】本実施形態のパターン抽出装置は、以上の
ような改良を加えたパターン抽出処理のプログラムを実
装したコンピュータを含む。そして、CCDカメラやス
キャナ等により入力された画像データから文字パターン
を抽出する。まず、パターン抽出処理の前処理として、
図2に示すようなテーブル作成処理が行われる。
【0030】図2のテーブル作成処理において、パター
ン抽出装置は、まず、印刷シミュレーション処理を行う
(ステップST1)。雑誌等のカラー印刷物は、グラビ
ア等、色々な印刷方法があるが、網点印刷法で印刷され
たものが、世の中には多い。網点印刷法で印刷された画
像では、人間の目には均一色と見える領域でも、拡大し
てみると、図3に示すように、カラーのモアレ模様が生
じている。
【0031】図3において、左側の原画像11内の
「の」と書かれた領域は、例えば、オレンジ色の1色で
描かれているが、その領域の一部を拡大すると、右側に
示すように、その領域は、様々の色が集まって構成され
ている。
【0032】このため、隣接画素の色差(RGBの輝度
差等)を固定しきい値と比較して、それらの画素に同一
ラベルを与えるか否かを判断すると、適応できない場合
がある。例えば、図3の「の」と書かれた領域内の画素
12〜14には、他の画素とは異なるラベルが付加さ
れ、原画像11から「の」の文字を抽出する際に、これ
らの画素12〜14の部分が欠落して、抽出精度が悪化
する。
【0033】そこで、印刷モデルを用いて、RGBの平
均輝度値とスキャナ読み取り解像度毎の隣接画素のRG
B輝度差をあらかじめ求め、それらの結果を色差テーブ
ルに格納しておく。そして、色差テーブルを参照しなが
ら、各色毎にしきい値を制御することにより、ラベリン
グを行う。
【0034】例えば、図3の画素14と画素15との間
の色差が最大の場合、画素14と画素15との間の色差
を、オレンジ色の領域を抽出する際のしきい値に設定す
る。この結果、原画像11から「の」の文字を抽出する
際、画素12〜14についても、他の画素と同一のラベ
ルを付加することが可能となる。
【0035】図4は、カラーの網点印刷法で印刷された
印刷物の画像の拡大図である。図4において、シアン
(水色)、マゼンタ(紫)、黄色の点状の模様が、場所
によって点21、22、23の大きさを変えながら、メ
ッシュ状に規則的に配置されていることが分る。
【0036】網点印刷を行う場合、まず、3原色(また
は、黒を加えた4原色)の1つの色について、ある一定
の間隔のメッシュの交点に、希望する濃度になるような
適当な大きさの塗りつぶし円を配置して、1色を刷り上
げる。次に、少し回転させた同じ間隔のメッシュを用い
て、塗りつぶし円の大きさを変更して、別の色で刷り上
げる。そして、もう1つの色は、さらに回転させたメッ
シュを用いて、塗りつぶし円の大きさも変更して刷り上
げる。このような印刷方法をとることにより、1画素づ
つ見るのではなく大局的に見る人間にとっては、綺麗な
均一色に見えるのである。
【0037】図5は、網点印刷法における印刷モデルの
構築方法を示す図である。図5においては、印刷モデル
として、シアン、マゼンタ、黄色の印刷メッシュM1
1、M12、M13をそれぞれ回転させて重ね合わせた
ものを使用し、カラー画像の色を仮想的に表現する。こ
こで、シアン、マゼンタ、黄色の色の濃さを調節する場
合、印刷メッシュM11、M12、M13の各格子点に
配置される塗りつぶし円D11、D12、D13の大き
さを調節する。
【0038】このとき、一般的な印刷モデルのパラメー
タは、以下のようになる。 ・印刷メッシュM11、M12、M13の格子間隔md (ただし、格子間隔mdは、黄色、シアン、マゼンタに
共通のサイズである) ・黄色メッシュM11の水平線からの角度θ11 ・マゼンタメッシュM12の水平線からの角度θ12 ・シアンメッシュM13の水平線からの角度θ13 ・黄色の塗りつぶし円D11の半径r11 ・マゼンタの塗りつぶし円D12の半径r12 ・シアンの塗りつぶし円D13の半径r13 ただし、本実施形態では、これらのパラメータのすべて
を可変にすると煩雑すぎるので、ある程度の限定を与
え、以下のように設定した。
【0039】・黄色メッシュM11の水平線からの角度
θ11=15度 ・マゼンタメッシュM12の水平線からの角度θ12=
30度 ・シアンメッシュM13の水平線からの角度θ13 =
45度 ・格子間隔md=20ドット この印刷モデルを使用してシミュレーションを行い、黄
色、マゼンタ、シアンの塗りつぶし円D11、D12、
D13のそれぞれの半径r11、r12、r13の影響
を受ける平均RGB値(Rm,Gm,Bm)を求める。
具体的には、印刷メッシュM11、M12、M13の格
子間隔mdよりもかなり大きな単位面積を考え、平均R
GB値(Rm,Gm,Bm)を、次式により求める。 Rm=255−単位面積中のシアンの面積×255/単
位面積 Gm=255−単位面積中のマゼンタの面積×255/
単位面積 Bm=255−単位面積中の黄色の面積×255/単位
面積 次に、パターン抽出装置は、スキャニングシミュレーシ
ョン処理を行う(ステップST2)。ここでは、1つの
色(Rm,Gm,Bm)で均一に印刷されている画像を
スキャナで読み込んだ場合のモデルについて考える。こ
の処理は、図5の印刷メッシュM11、M12、M13
と独立な間隔sdを有する読み込みメッシュM14を導
入し、この読み込みメッシュM14内のRGBの各輝度
値(=各色の面積)を求めることに相当する。
【0040】ここで、読み込みメッシュM14の間隔s
dが、スキャナ読み込み解像度に相当する。なお、同じ
平均色(Rm,Gm,Bm)の画像を読み込む場合で
も、スキャナ読み込み解像度が大きい場合には、読み取
った結果の画素のRGB輝度値は隣接画素間で大きく異
なり、隣接画素間のRGB輝度差は大きくなる。逆に、
スキャナ読み込み解像度が小さい場合には、いずれの画
素のRGB輝度値も(Rm,Gm,Bm)に近づくた
め、隣接画素間のRGB輝度差は0に近づくことにな
る。
【0041】読み込みメッシュM14の1つのメッシュ
内のRGB輝度値(Rc,Gc,Bc)は、以下のよう
になる。 Rc=255−メッシュ内のシアンの面積×255/メ
ッシュ面積 Gc=255−メッシュ内のマゼンタの面積×255/
メッシュ面積 Bc=255−メッシュ内の黄色の面積×255/メッ
シュ面積 上式により、読み込みメッシュM14のメッシュ毎にR
GB輝度値(Rc,Gc,Bc)を求め、隣接メッシュ
とのRGBそれぞれの輝度差を、隣接画素との輝度差と
して求める。そして、得られた輝度差のうちの適当な値
(例えば、最大値)を色差テーブルに記録する。
【0042】本来の印刷モデルでは、各印刷メッシュの
交点に描かれた塗りつぶし円は、相互に重なり合い、R
GBの各輝度値によって相互に影響を及ぼし合うため、
RGBは独立とは言えない。しかし、スキャナ読み込み
モデルでは、単純化のために、RGBは相互に独立であ
るという仮説を立てた。そして、各RGB輝度値、隣接
画素との輝度差、および読み込み解像度(間隔sd)
を、RGB独立のテーブルに保存する。
【0043】図6は、R輝度値の色差テーブルの例を示
している。図6の色差テーブルにおいては、0〜255
のR輝度値について、スキャナ読み込み解像度が14〜
35のそれぞれに対して、隣接画素との輝度差の最大値
が記録されている。G輝度値とB輝度値の色差テーブル
についても同様である。
【0044】これらの色差テーブルにおいて、輝度値の
エントリは、0〜255のすべての値を網羅しているわ
けではなく、数十個の飛び飛びの値を示している。この
場合、以下のような補完演算により、他の輝度値に対す
る隣接画素との輝度差の最大値を求めることができる。
【0045】まず、色差テーブルに登録されている輝度
値Ri、Ri+1に対する隣接画素との輝度差の最大値
を、それぞれ、Rdi、Rdi+1とする。このとき、
色差テーブルに登録されていない輝度値Rmが、輝度値
Riと輝度値Ri+1の間の線形補間で表されるものと
し、その関係を隣接画素との輝度値の最大値にも適用し
て、推定される隣接画素との輝度値の最大値infer
ed_deltaを、次式により求める。 rl=Ri−Ri+1 rm=Rm−Ri rn=Ri+1−Rm infered_delta=Rdi*rn/rl+R
di+1*rm/rl この計算自身は単純であるが、1画素について毎回行う
必要があるので、パターン抽出処理に組み込むと、全体
として処理を遅らせる要因になる。そこで、パターン抽
出装置は、あらかじめ補完演算を行い、すべての輝度値
のエントリを有するフルエントリ色差テーブルを作成し
て(ステップST3)、処理を終了する。
【0046】ここでは、0〜255の輝度値を擬似的に
発生させ、それぞれの輝度値に対する隣接画素との輝度
差の最大値を上述した方法で求めて、その値を色差テー
ブルに格納する。この処理をRGBそれぞれの輝度値に
ついて行う。
【0047】図7は、R輝度値のフルエントリ色差テー
ブルの例を示している。図7の色差テーブルにおいて
は、0〜255のすべてのR輝度値について、スキャナ
読み込み解像度が14〜35のそれぞれに対して、隣接
画素との輝度差の最大値が記録されている。G輝度値と
B輝度値の色差テーブルについても同様である。
【0048】このように、網点印刷法を模倣した印刷モ
デルを構築することにより、網点印刷法で生成される色
をコンピュータ上で再現することが可能となり、実際に
印刷された印刷物を解析することなく、RGBの色差テ
ーブルを生成することができる。後続するパターン抽出
処理においては、これらの色差テーブルを参照すること
により、入力画像から同一色の範囲を検出する際のしき
い値を獲得することができる。
【0049】また、すべての輝度値のエントリを有する
色差テーブルをあらかじめ作成しておくことにより、パ
ターン抽出処理において補完演算を省略することが可能
となる。このため、数十個の飛び飛びの輝度値のエント
リしか持たない色差テーブルを用いる場合に比べて、パ
ラメータ推定や色ラベリング等の処理時間を削減するこ
とができる。
【0050】次に、色差テーブルを用いたパターン抽出
処理について説明する。図8および図9は、パターン抽
出処理のフローチャートである。このフローチャートに
おいて、ステップS4、S5、S7、S9、S11、S
20、S22、S24、およびS25の処理が、上述し
た改良点を含んでいる。
【0051】パターン抽出装置は、まず、CCDカメラ
やスキャナ等の撮像装置でカラー画像を入力し、メモリ
に保存する(図8のステップS1)。次に、フルカラー
判定処理を行う(ステップS2)。ここでは、入力画像
のヘッダに含まれている1画素当たりのビット数を調
べ、24ビット/画素の画像をフルカラー画像とみな
し、ステップS3以降の処理を行う。また、1画素当た
りのビット数が24ビットより小さい場合には、フルカ
ラー以外の入力画像とみなし、ステップS12以降の処
理を行う。
【0052】入力画像がフルカラー画像であれば、次
に、モデル解像度推定処理および距離しきい値獲得処理
を行う(ステップS3)。モデル解像度推定処理では、
入力画像の解像度が印刷モデルのどの読み込み解像度に
適合しているかを推定する。この処理では、入力画像を
メッシュ状に分割し、RGBの各色成分について、各メ
ッシュにおける隣接画素との輝度値の最大値を求め、そ
の値と最も良く一致する読み込み解像度を色差テーブル
から求める。
【0053】具体的には、入力画像を3×3画素のメッ
シュに分割し、その内部の平均RGB輝度値を(Rm,
Gm,Bm)とし、隣接画素との輝度差の最大値を(R
d,Gd,Bd)とする。この処理はRGB独立の処理
であるので、Rを例にして説明する。
【0054】まず、解像度をある値に固定して、Rmか
ら色差テーブルを参照し、推定される隣接画素との輝度
値の最大値infered_deltaを求める。この
値infered_deltaと実際に画像から求めた
Rdとの差diff_rを、次式により求める。 diff_r=|Rd−infered_delta| 次に、解像度をパラメータとしてスキャンし、このdi
ff_rの値が最も小さくなる解像度resol_rを
求める。この解像度resol_rを入力画像中の各メ
ッシュについて算出し、それらの値の平均値mean_
resol_rを求める。
【0055】これと同様の処理をG、Bについても行
い、平均値mean_resol_g、mean_re
sol_bを求める。そして、それらの平均値の平均値
resolutionを、次式により求め、この値を入
力画像の推定解像度として用いる。 resolution=(mean_resol_r+
mean_resol_g+mean_resol_
b)/3 また、距離しきい値獲得処理では、入力画像の中から局
所的に同色領域(色の変化が無い部分)を求め、その局
所領域から色ラベリングで使用する距離値のしきい値を
求める。
【0056】具体的には、入力画像を3×3画素のメッ
シュに分割し、その内部の平均RGB輝度値(Rm,G
m,Bm)と分散値(Rv,Gv,Bv)を求める。そ
して、RGBの各分散値の2乗和のルートを、次式によ
り求める。 s=sqrt(Rv×Rv+Gv×Gv+Bv×Bv) この値sをメッシュの分散値として、入力画像の各メッ
シュのs値を求め、それらを記録する。また、s値の最
大値をsmaxとして記録する。ここで、メッシュのs
値が以下の条件を満足する場合、そのメッシュを対象メ
ッシュとする。
【0057】smax×RANGE_LOW<s<sm
ax×RANGE_HIGH かつ s>MIN_VARI 例えば、RANGE_LOW=0.004、RANGE
_HIGH=0.16、MIN_VALI=10であ
る。次に、画像全体から得られるメッシュの中で、対象
メッシュのs値のルートを標準偏差として求める。そし
て、この標準偏差をk倍して得られる値の平均値TH_
distを全メッシュについて求め、この平均値を距離
のしきい値とする。例えば、k=3.0とすると、しき
い値TH_distは、次式により与えられる。
【0058】
【数1】
【0059】ここで、siはi番目の対象メッシュのs
値を表し、nは対象メッシュの数を表す。次に、色ラベ
リング処理を行って、隣接する画素の色が近い場合にそ
れらの画素に同一のラベルを与える(ステップS4)。
【0060】具体的には、入力画像の左上からラスタス
キャンを行い、ラベル付けがされていない画素に注目す
る。この注目画素のRGB輝度値(R、G、B)と推定
解像度resolutionとを用いて色差テーブルを
検索することにより、隣接画素との輝度差の最大値をR
GBの色成分毎に求める。隣接画素との輝度差の最大値
が求まると、この値をラベリングのしきい値(delt
a_r,delta_g,delta_b)とする。
【0061】次に、注目画素の周囲の8画素を走査し
て、その注目画素の周囲に既にラベル付けされた周囲画
素があり、その周囲画素のRGB輝度値(Rs,Gs,
Bs)が以下の条件を満たす場合に、注目画素の色はそ
の周囲画素の色と近いと判断する。 |R−Rs|<=delta_r かつ |G−Gs|<=delta_g かつ |B−Bs|<=delta_b 周囲画素の色が注目画素の色と近い判断されると、周囲
画素のラベルをカレントラベルregionとして保存
し、注目画素のラベルとしてregionを与える。ま
た、このラベル領域の平均色(Rm,Gm,Bm)とし
て、周囲の同一ラベル領域の平均色に注目画素の色を加
味した新たな平均色を求める。
【0062】それ以外の場合は、カレントラベルとし
て、直前のラベル値に1を加算した値を設定し、注目画
素のラベルにその値を付与する。この場合には、ラベル
領域の平均色(Rm,Gm,Bm)として、注目画素の
RGB値を設定する。また、どちらの場合でも、注目画
素の座標値を処理対象座標配列に保存する。
【0063】次に、注目画素の周りに同色領域を拡張す
る処理を行う。処理対象座標配列の中から、先頭の座標
値を取り出し、その座標値の画素を注目画素とする。注
目画素のRGB輝度値から色差テーブルを検索し、RG
Bの各色成分の隣接画素との輝度差の最大値を推定しき
い値(delta_r,delta_g,delta_
b)とする。
【0064】注目画素の周囲の8画素を走査して、周囲
画素が未処理の場合、その周囲画素のRGB輝度値(R
i,Gi,Bi)を求め(i=1,...,8)、注目
画素のRGB輝度値(Rc,Gc,Bc)およびラベル
領域の平均色(Rm,Gm,Bm)との輝度差をRGB
各色成分毎に求める。
【0065】そして、周囲画素のRGB輝度値(Ri,
Gi,Bi)と注目画素のRGB輝度値(Rc,Gc,
Bc)の関係が、 |Ri−Rc|<=delta_r かつ |Gi−Gc|<=delta_g かつ |Bi−Bc|<=delta_b の条件を満たし、かつ、平均色(Rm,Gm,Bm)と
周囲画素のRGB輝度値(Ri,Gi,Bi)の色差の
距離値が、 |Ri−Rm|+|Gi−Gm|+|Bi−Bm|<T
H_dist の条件を満たす場合、注目画素と同一ラベルを周囲画素
に付し、周囲画素の座標を処理対象座標配列に追加す
る。次に、処理された注目画素を、処理対象座標配列か
ら削除する。そして、処理座標xおよびyの最大値と最
小値を求め、それらの値をこのラベル領域の外接矩形と
して保存する。また、このラベル領域の平均色を外接矩
形の属性(代表色)として保存する。以上の処理を、処
理対象座標配列の内容がなくなるまで続ける。
【0066】図10は、注目画素の周囲の8画素を示し
ている。図10において、注目画素Cの周囲画素は8個
あるので、隣接画素との輝度差を求める場合、これらの
8画素について走査される。
【0067】このような色ラベリングの結果、同一色で
連結している領域には同じラベル値が付与され、同じラ
ベルを持つ領域を囲む外接矩形が獲得される。ここで、
5画素以下の大きさの連結領域については、文字の一部
ではないものと判断し、処理結果の情報を出力しない。
そして、6画素以上の大きさのすべての連結領域につい
て、以下のような情報を色ラベリングの処理結果として
出力する。
【0068】・ラベル画像:4バイト/1画素 ・外接矩形 矩形数:maxcount 矩形情報:lbtbl 内包するラベル画像のラベル番号:label 矩形左上座標:(xmin,ymin) 矩形右下座標:(xmax,ymax) 矩形内の代表色:(r,g,b) 所属するグループ番号:string_label 輪郭長:contour このような色ラベリングによれば、外接矩形の高さまた
は幅が1画素であるような連結領域のうち、面積が6画
素以上のものは無視されずに残されることになる。した
がって、比較的小さな文字パターンが抽出されやすくな
る。
【0069】次に、色ラベリングで抽出された全矩形を
対象として、矩形単位の図形除去処理を行う(ステップ
S5)。図形除去処理とは、文字を囲むパターンを図形
とみなして、除去する処理である。
【0070】ここでは、矩形を包含関係の階層構造で記
述し、ある矩形について文字認識を行う。そして、得ら
れた距離値が一定しきい値(例えば、1000)より小
さく、文字として判定される場合に、この矩形を囲む矩
形を図形として削除する。例えば、図11に示すよう
に、矩形31、32の内部のパターンが文字と認識され
た場合、それらの矩形を包含する矩形33が削除され
る。このように、文字と認識されたパターンの周囲のパ
ターンを除去することで、小さな文字パターンが抽出さ
れやすくなる。
【0071】次に、L字形/コ字形パターン削除処理を
行う(ステップS6)。この処理では、文字パターンの
近くに存在し、かつ、その文字パターンと同色のL字
形、コ字形のパターンを削除する。
【0072】文字パターンの周囲に背景パターンがある
と、背景パターンの一部がL字形またはコ字形のパター
ンとして抽出されやすく、後の重なり矩形統合処理でL
字形またはコ字形のパターンが文字パターンと統合され
てしまう。
【0073】このような統合が行われると、以降の処理
でこれらのパターンは分離されることがなく、統合され
たままの状態で処理が行われる。このため、統合された
矩形は、文字らしさの形状の特性を失い、処理途中で削
除されるか、L字形またはコ字形のノイズパターンを含
んだままで文字として抽出される。そこで、L字形また
はコ字形のパターンをあらかじめ削除しておき、このよ
うな不具合を防止する。
【0074】図12は、L字形パターンが存在する場合
の重なり統合結果を示している。図10においては、
「文字」というパターン42およびL字形のパターン4
3が抽出され、パターン42の外接矩形41およびパタ
ーン43の外接矩形44が生成されている。ここで、外
接矩形41と外接矩形44との重なり矩形統合を行う
と、外接矩形45が生成される。外接矩形45が生成さ
れると、パターン42およびパターン43は、1つのパ
ターンを構成するものとみなされ、パターン42の大き
さや形状の特性が失われる。
【0075】そこで、L字形のパターン43を削除する
ことにより、外接矩形41が外接矩形44と統合される
ことを防止し、パターン42の大きさや形状を保ったま
ま、その後の処理を行うことができるようになる。
【0076】具体的には、矩形内のパターンの黒画素比
率(=パターンの画素数/矩形の面積)を求め、以下の
条件を満たすパターンをL字形またはコ字形のパターン
として削除する。 矩形の幅が幅しきい値以上 かつ 矩形の高さが高さしきい値以上 かつ 黒画素比率が黒画素比率しきい値未満 ここで、例えば、幅しきい値=100(ドット)、高さ
しきい値=100(ドット)、黒画素比率しきい値=
0.4に設定する。
【0077】次に、注目矩形抽出処理を行い、すべての
色についての外接矩形を対象にして、あらかじめ決めら
れた大きさの範囲内の外接矩形を、注目矩形として抽出
する(ステップS7)。具体的には、39.4ドット/
cm画像に対して、以下の条件を満たす外接矩形を注目
矩形として抽出する。 x方向の長さが10ドット以上411ドット以下 かつ y方向の長さが10ドット以上583ドット以下 このように、39.4ドット/cm画像に対して10ド
ット以上の大きさの矩形を注目矩形として抽出すること
により、比較的小さな矩形が抽出されるようになる。し
たがって、小さな文字パターンが抽出されやすくなる。
【0078】次に、注目矩形の周囲にあるサイズの探索
範囲を設定し、その範囲にかかる矩形を抽出する(ステ
ップS8)。図13は、注目矩形の周囲の探索範囲の設
定方法を説明する図である。図13においては、注目矩
形51の周りに探索範囲52が設定されている。ここで
は、注目矩形51の縦横の長さのうち長い方をlenド
ットとし、lenと35の小さい方を探索範囲52の長
さrange_sizeとする。
【0079】また、図14は、探索範囲にかかる矩形の
抽出方法を説明する図である。ここでは、注目矩形の周
囲のrange_sizeの範囲にかかる外接矩形を高
速に求めるため、以下の方法を用いる。
【0080】図14において、矩形番号1〜4の外接矩
形61〜64が抽出されたものとすると、XYの各座標
値に存在する矩形番号および矩形数を求め、これらの矩
形番号および矩形数をXYの各座標値ごとに登録する。
【0081】例えば、X座標値1〜4の位置には矩形が
存在しないので、矩形数n=0、矩形番号=“空”が登
録され、X座標値5〜13の位置には矩形64が存在し
ているので、矩形数n=1、矩形番号=4が登録され、
X座標値14の位置には矩形63および矩形64が存在
しているので、矩形数n=2、矩形番号=3、4が登録
され、X座標値15、16の位置には矩形64が存在し
ているので、矩形数n=1、矩形番号=4が登録され
る。他のX座標値およびY座標値についても同様であ
る。
【0082】次に、矩形63を注目矩形とし、この矩形
の周りに探索範囲65が設定されたとする。このとき、
パターン抽出装置は、探索範囲65に含まれるXYの各
座標値を求める。そして、XYの各座標値の矩形番号を
XYそれぞれについて求め、XYの両方に含まれる矩形
番号の矩形を探索範囲65にかかる矩形とする。
【0083】ここでは、探索範囲65のX座標に含まれ
る外接矩形の矩形番号は2〜4、探索範囲65のY座標
に含まれる外接矩形の矩形番号は1〜4であるので、X
Yの両方に含まれる矩形番号は2〜4となる。この結
果、探索範囲65にかかる矩形として、矩形番号2〜4
に対応する外接矩形62〜64が得られる。具体的に
は、以下のa)〜d)の処理が行われる。 a)画像全体のX軸およびY軸へ矩形番号を投影する。
図14に示したように、X軸およびY軸上において、1
画素毎に、その位置に属する矩形の数と矩形番号の集合
を登録する。例えば、矩形番号iがX軸上の(x1,x
2)の範囲にあるとすれば、X軸のx1からx2までの
各座標値に対する矩形番号の集合には、番号iが入るこ
とになる。同様の処理が、すべての矩形およびXY両座
標値について行われる。 b)注目矩形の周囲にrange_sizeの範囲を設
定する。 c)range_sizeの範囲内で、X軸の座標値毎
に矩形番号の論理和を求め、矩形番号の集合を抽出す
る。Y軸の座標値に対しても同様の処理を行う。 d)X軸から求めた矩形番号の集合とY軸から求めた矩
形番号の集合の論理積を求め、この注目矩形の周囲にあ
る矩形集合を決定する。
【0084】ところで、図14に示した矩形番号の格納
方法では、画像全体に存在するすべての矩形番号を格納
する容量が座標値毎に必要となり、記憶容量が増大す
る。そこで、a)の処理を最小限の記憶容量で高速に行
うために、以下のような方法を用いる。 i)すべての矩形の横幅を合計し、矩形番号と座標値の
情報を合計長さの画素数だけ持ったデータ構造を用意す
る。 ii)矩形の座標値と矩形番号を用意されたデータ構造
のデータにセットする。 iii)このデータ構造のデータを座標値でソートす
る。 iv)データの座標値を順に見ていき、座標値が同じデ
ータの数を座標値毎に数えて、その数をその座標値に属
する矩形の数とする。また、その矩形数だけの矩形番号
を入れる記録領域を確保する。このとき、ソートされた
データ構造を先頭からスキャンして、座標値が同じもの
の数をカウントしていき、座標値が変わった所で数を確
定して、その数を保存する。 v)ソートしたデータ構造において、座標値が同じデー
タの矩形番号を、確保された領域に格納する。このと
き、ソートされたデータ構造を先頭からスキャンして、
座標値が同じデータの矩形番号を、対応する記録領域に
格納する。
【0085】次に、同色グループ抽出処理を行う(ステ
ップS9)。ここでは、1つの注目矩形の色(Rc,G
c,Bc)とその周囲の矩形の集合の中のi番目の矩形
の色(Ri,Gi,Bi)との間でのRGB空間上の距
離を以下のように定義する。
【0086】dist=|Rc−Ri|+|Gc−Gi
|+Bc−Bi| また、注目矩形の色(Rc,Gc,Bc)と解像度re
solutionから求められるRGBの各輝度差を、
delta_r、delta_g、delta_bとす
る。
【0087】また、注目矩形が属する、既に抽出されて
いるグループの色を(Rg,Gg,Bg)とする。グル
ープの色は、そのグループに属する矩形内のパターンの
色の平均色とする。なお、最初は、矩形の色はグループ
の色と同じである。
【0088】このとき、グループの色(Rg,Gg,B
g)とi番目の周囲矩形が属するグループの色(Ri
g,Gig,Big)との色差の距離dist2を以下
のように定義する。 dist2=|Rg−Rig|+|Gg−Gig|+|
Bg−Big| そして、(Rc,Gc,Bc)と(Ri,Gi,Bi)
が以下の条件を満足するとき、i番目の周囲矩形は注目
矩形のグループに属すると判定して、その周囲矩形をそ
のグループに格納する。また、新たにグループに加わっ
た周囲矩形の矩形番号を新規追加矩形領域に格納する。 (dist<TH_RGBまたは(|Rc−Ri|<d
elta_rかつ|Gc−Gi|<delta_gかつ
|Bc−Bi|<delta_b))かつdist2<
TH_dist 例えば、TH_RGB=20である。また、TH_di
stは、距離しきい値獲得処理で画像全体から求めた値
である。このように、画像全体から求めた色差のしきい
値を用いて同色グループの判定を行うことで、色ラベリ
ングと同様に高精度な同色判定が可能となる。
【0089】次に、新規追加矩形領域の先頭の矩形番号
を取り出し、それを新たな注目矩形として、その周囲に
ある矩形を計算する。そして、上記の手順を繰り返し
て、グループに属する矩形を求める。この手順を、グル
ープに新たに加わる矩形がなくなるまで繰り返す。この
処理により抽出されるグループ情報のデータ構造は、以
下のようになる。
【0090】グループ内の矩形数:num グループを構成する矩形番号:child 重なり矩形統合後の矩形数:overlap_num 重なり矩形統合後の矩形情報:overlap (データタイプは、矩形情報lbtbl型) グループ内文字列の方向コード:orient グループ内の文字列数:gyou_num グループ内の文字列情報:gyou (データタイプは、矩形情報lbtbl型) 次に、グループ内平均文字線太さ抽出処理を行う(ステ
ップS10)。ここでは、グループに属する1つの矩形
の矩形範囲内で、その矩形のラベル番号に注目して、ラ
ベル画像上で輪郭追跡処理を行い、抽出した輪郭の長さ
を、その矩形の輪郭長の属性にセットする。そして、そ
の矩形内のパターンの面積を輪郭長で割って、文字の線
の平均的な太さを求め、その値を矩形の属性として矩形
情報に登録する。
【0091】輪郭長獲得処理では、1つのラベル画像の
エッジに注目して、ラベル画像の外接矩形の内部をラス
タスキャンし、ラベル値が特定のラベル値に変化する点
をカウントする。
【0092】図15および図16は、輪郭長獲得処理を
示すフローチャートである。この処理では、処理対象と
なるラベル画像のラベル値をregionとし、そのラ
ベル値のパターンの外接矩形の座標を(xmin,ym
in)および(xmax,ymax)とし、輪郭長をc
ountとし、ラベル画像の画素がエッジかどうかを示
すフラグをflagとし、縦方向の長さが1画素のパタ
ーンを検出するフラグをfirst_flagとする。
【0093】現在の画素の1つ前の画素がregion
の値の画素の場合、flagは1に設定され、1画素幅
の横方向のパターンが検出されると、first_fl
agが1に設定される。
【0094】パターン抽出装置は、まず、初期設定を行
い、count=0、y=ymin、flag=0、f
irst_flag=0、x=xminとする(図15
のステップS31〜S34)。
【0095】次に、flag>0かどうかを判断し(ス
テップS35)、flag>0である場合、カレント画
素(x、y)のラベル値がregionかどうかを判断
する(ステップS36)。そして、カレント画素のラベ
ル値がregionである場合、yがyminまたはy
maxかどうかを判断する(ステップS37)。ここ
で、yがyminまたはymaxである場合、coun
tをインクリメントする(ステップS39)。
【0096】また、ステップS37において、yがym
inでもymaxでもない場合、カレント画素の上か下
の画素のラベル値がregionかどうかを判断し(ス
テップS38)、カレント画素の上も下もregion
でない場合にのみ、countをインクリメントする
(ステップS39)。
【0097】一方、ステップS36において、カレント
画素のラベル値がregionでない場合、yがymi
nまたはymaxかどうかを判断し(ステップS4
0)、yがyminまたはymaxである場合、fla
g=0とする(ステップS44)。
【0098】一方、ステップS40において、yがym
inでもymaxでもない場合、カレント画素の左の画
素の上および下の画素のラベル値がregionであり
(ステップS41)、かつ、first_flagが0
である場合にのみ(ステップS42)、countをイ
ンクリメントし(ステップS43)、それ以外の場合は
ステップS44の処理に進む。
【0099】次に、first_flag=0に設定し
(ステップS45)、x<xmaxかどうかを判断する
(図16のステップS48)。x<xmaxである場
合、xをインクリメントして(ステップS49)、ステ
ップS35の処理に戻る。
【0100】一方、ステップS35において、flag
>0でない場合、カレント画素のラベル値がregio
nかどうかを判断する(図16のステップS46)。こ
こで、カレント画素のラベル値がregionでない場
合、ステップS48の処理に進む。
【0101】一方、ステップS46において、カレント
画素のラベル値がregionである場合、そのカレン
ト画素は輪郭を構成するので、countをインクリメ
ントするとともに、flag=1、first_fla
g=1に設定して(ステップS47)、ステップS48
の処理に進む。以上の処理を、xがxmaxに達するま
で、xを1ずつインクリメントしながら繰り返す。
【0102】そして、xがxmaxに達すると、fla
g>0かどうかを判断し(ステップS50)、flag
>0でない場合、y<ymaxかどうかを判断する(ス
テップS55)。ここで、y<ymaxである場合、y
をインクリメントして(ステップS56)、ステップS
33の処理に戻る。
【0103】一方、ステップS50において、flag
>0である場合、yがyminまたはymaxかどうか
を判断し(ステップS51)、yがyminまたはym
axである場合、ステップS55の処理に進む。
【0104】一方、ステップS51において、yがym
inでもymaxでもない場合、カレント画素の左の画
素の上および下の画素のラベル値がregionであり
(ステップS52)、かつ、first_flagが0
である場合にのみ(ステップS53)、countをイ
ンクリメントし(ステップS54)、それ以外の場合は
ステップS55の処理に進む。
【0105】以上の処理をyがymaxに達するまで、
yを1ずつインクリメントしながら繰り返し、yがym
axに達すると、countをラベル値がregion
のラベル画像の輪郭長として出力して(ステップS5
7)、処理を終了する。
【0106】図17は、輪郭長獲得方法を説明するため
のパターンの具体例を示している。図17において、同
一のラベル値を有するラベル画像71(斜線部分)が抽
出され、そのラベル画像71の外接矩形72が生成され
ているものとする。この矩形72の座標が(xmin,
ymin)および(xmax,ymax)で表されてい
るとき、この矩形の範囲内を(xmin,ymin)の
座標に位置する画素から1ラインずつx方向にスキャン
する。
【0107】このとき、図16のステップS46からス
テップS47に進む過程で、Aの画素がカウントされ、
図15のステップS37からステップS39に進む過程
で、Bの画素がカウントされ、ステップS38からステ
ップS39に進む過程で、Cの画素がカウントされ、ス
テップS42からステップS43に進む過程で、Dの画
素がカウントされ、図16のステップS53からステッ
プS54に進む過程で、Eの画素がカウントされる。こ
の結果、矩形72の範囲内を1回スキャンするだけで、
ラベル画像71の輪郭が求められる。
【0108】次に、文字線太さによる再グループ化処理
を行う(ステップS11)。ここでは、グループ内の矩
形を対象にして、図8のステップS7〜S9の処理を繰
り返し、矩形の平均文字線太さを用いてグループ化を行
い、新たなグループ情報を構築する。このとき、ステッ
プS9のグループ化の際に、色情報だけでなく、推定文
字線太さ(=20×矩形内のパターン面積/パターンの
輪郭長)も使用する。
【0109】具体的には、2つの矩形のうち、第1の矩
形の推定文字線太さthick1および第2の矩形の推
定文字線太さthick2から、文字線太さの比thi
ck_rateを、次式により求める。 thick_rate=max(thick1,thi
ck2)/min(thick1,thick2) そして、thick_rateが以下の条件を満足した
ときに、2つの矩形を同じグループとして記録する。 thick_rate<TH_THICK_RATE かつ (dist<TH_RGBまたは(|Rc−Ri|<d
elta_rかつ|Gc−Gi|<delta_gかつ
|Bc−Bi|<delta_b))かつdist2<
TH_dist ただし、TH_THICK_RATEは、例えば、2.
5とする。この処理を元のグループ内のすべての矩形に
ついて行い、グループ内の新たなグルーピングを行う。
【0110】このような処理により、文字パターンの近
くにその文字パターンの色と同一の背景パターンがあ
り、これらの背景パターンと文字パターンが同じグルー
プに属している場合に、それらのパターンを別々のグル
ープに分けることができる。また、文字パターンだけか
らなるグループにおいて、フォントやサイズが異なるも
のを別々のグループに分けることもできる。
【0111】また、画像全体から求めたしきい値TH_
distを用いて文字線の太さに基づく再グループ化を
行うことで、ステップS9のグループ化と同様に、高精
度な同色判定が可能となる。
【0112】図18は、文字線の太さによる再グルーピ
ング処理の例を示している。図18において、「グルー
プ1」という文字列と「グループ2」という文字列が同
一色で記述され、互いに近接して配置されているため、
「グループ1」という文字列と「グループ2」という文
字列が同一のグループ81にグルーピングされているも
のとする。
【0113】ここで、「グループ1」という文字列に含
まれる文字の太さと「グループ2」という文字列に含ま
れる文字の太さを算出し、異なる太さの文字を別々のグ
ループに分割する。この結果、「グループ1」という文
字列はグループ82にグルーピングされ、「グループ
2」という文字列はグループ83にグルーピングされ
る。
【0114】次に、グループ内で平均的な矩形サイズを
求め、そのサイズを基準として、極端に大きなサイズの
矩形を背景等のノイズとして削除する(図9のステップ
S14)。
【0115】図19は、グループ内の大きな矩形削除処
理を説明する図である。図19において、矩形102〜
111がグループ101にグルーピングされているもの
とすると、グループ101内の各矩形102〜111の
大きさを求める。ここで、矩形102の大きさが他の矩
形103〜111の大きさに比べて、かけ離れているも
のとすると、グループ101から矩形102を削除し、
矩形103〜111よりなるグループ112を生成す
る。
【0116】具体的には、以下のa)〜d)の処理を行
う。 a)グループ内の矩形の高さのヒストグラムを作成し
て、最大頻度値を示す矩形高さfreq_height
を以下の方法で求める。 i)ヒストグラムにぼかし用のウィンドウを用いてコン
ボリューション演算(移動和)を行い、ヒストグラムを
ぼかす。具体的なぼかし用ウィンドウは、例えば、「1
1111」の5画素からなる。 ii)最小高さ値(具体的には、39.4ドット/cm
画像において23ドット)をあらかじめ決めておき、そ
の最小高さ値以上で最大頻度を示す矩形高さfreq_
heightを求める。 b)最大頻度値を示す矩形高さfreq_height
が最小高さ値より小さいときは、freq_heigh
tを最小高さ値とする。 c)大きな矩形と判定するしきい値th_large
を、例えば、th_large=freq_heigh
t*10とする。 d)グループ内の矩形のうち、縦横サイズともth_l
argeより小さいものだけを残して、後はノイズとし
てそのグループから削除する。
【0117】次に、グループ内の矩形のうち、一部でも
重なりがある矩形同士を統合して、それらを囲む外接矩
形を生成し、グループ情報に新たに登録する(ステップ
S15)。
【0118】図20は、グループ内の重なり矩形統合処
理を説明する図である。図20において、矩形131は
矩形132と重なっており、矩形132は矩形133と
部分的に重なっている。この場合、矩形131〜133
を統合し、外接矩形134を生成する。
【0119】次に、先願Dの文字列抽出技術を応用し
て、グループ内で文字列方向を推定し、その方向から文
字列を抽出する(ステップS16)。抽出された文字列
の方向および座標等の情報は、グループ毎に保存され
る。この処理をタイトルの抽出に用いる場合は、1つの
タイトルを構成する個々の文字が横方向または縦方向に
一列に並んでいることが前提となる。
【0120】図21は、グループ内文字列抽出処理を説
明する図である。まず、グループ141において、最も
左にある矩形135から右方向に向かって、隣接する矩
形があるかどうかを探していく。そして、隣接する矩形
が見つかると、見つかった矩形の矩形番号を矩形135
の矩形番号に変更する。この処理を繰り返すことで、矩
形135の右側の矩形の矩形番号が、矩形135の矩形
番号に統一される。
【0121】矩形135から右方向に矩形がなくなる
と、次に、矩形136から右方向に向かって、同様の処
理を行う。これにより、矩形136の右側の矩形の矩形
番号が、矩形136の矩形番号に統一される。そして、
矩形番号の変更処理が終了すると、同一の矩形番号が付
された矩形を囲む外接矩形142、143を生成し、そ
れらを文字列矩形とする。
【0122】具体的には、以下のa)〜e)の処理を行
う。 a)グループ内の矩形の座標から文字列方向を推定す
る。 b)矩形の上下左右の最も近くにある矩形の内向き/外
向きの両方向の隣接関係を求める。 c)横方向の文字列の場合、左からの隣接関係のない矩
形を開始矩形として、右に矩形がなくなるまで、開始矩
形の矩形番号を右にある矩形に伝搬していく。縦方向も
同様である。 d)左からの隣接関係がなく、左への隣接関係がある矩
形については、左の矩形の矩形番号を獲得してそれを右
へ伝搬し、この処理を隣接関係がなくなるまで繰り返
す。 e)ここまでの処理をグループ内のすべての矩形につい
て行った後に、同じ矩形番号が付いている矩形を求め、
それらの矩形の外接矩形を文字列矩形として抽出する。
【0123】次に、先願Dの横書き文書の上下分離文字
統合処理(縦書き文書では、左右分離文字統合処理)を
文字列矩形に適用して、分離している矩形を統合し、1
つの外接矩形に置き換える(ステップS17)。
【0124】図22は、文字列内分離文字統合処理を説
明する図である。図22において、グループ141内に
文字列矩形142、143が生成されている。また、矩
形142内において、矩形144および145が縦方向
に互いに隣接し、矩形146および147が縦方向に互
いに隣接し、矩形143内において、矩形148および
149が縦方向に互いに隣接し、矩形150および15
1が縦方向に互いに隣接している。
【0125】この場合、矩形144および145を囲む
外接矩形152を生成して、これらの矩形を統合し、矩
形146および147を囲む外接矩形153を生成し
て、これらの矩形を統合する。同様に、矩形148およ
び149を囲む外接矩形154と、矩形150および1
51を囲む外接矩形155を生成する。
【0126】具体的には、以下のa)〜c)の処理を行
う。なお、以下の例では、横書き文字列の場合について
説明するが、縦書き文字列の場合についても同様であ
る。 a)文字列矩形内の矩形をx座標で昇順にソートする。 b)最初の矩形をカレント矩形として、それ以降の次の
矩形がカレント矩形のx座標の範囲に重なる場合は統合
し、カレント矩形のx座標の範囲も統合結果の矩形のも
のに変更する。この処理を、統合する矩形がなくなるま
で繰り返す。統合する矩形がなくなったら、統合結果を
分離文字統合後の矩形として保存する。 c)次の矩形を新たなカレント矩形として、b)および
c)の処理を繰り返す。
【0127】次に、グループ内の文字列矩形を、文字列
のサイズと位置関係によって再グループ化し、その結果
を新たなグループ情報に格納する(ステップS18)。
これにより、同色グループ内で、文字サイズが異なる文
字列を別グループに分けることができ、同時に、ノイズ
と文字列を別グループに分けることもできる。
【0128】図23は、グループ内の文字列サイズによ
る再グループ化処理を説明する図である。図23におい
て、グループ141内に文字列矩形142、143が生
成されている。このとき、矩形142、143の高さH
1、H2をそれぞれ算出し、高さH1とH2の差がしき
い値以上の場合は、矩形142と矩形143とを別々の
グループに分ける。
【0129】具体的には、以下の条件を満たすときに、
これらの2つの文字列矩形は同じグループに属するもの
として、同じグループ番号を与える。それ以外の場合
は、2つの文字列矩形は異なるグループに属するものと
して、異なるグループ番号を与える。 2つの文字列矩形の高さの差がしきい値より小さい かつ(2つの文字列矩形が重複する、または、2つの文
字列矩形間の距離がしきい値より小さい) この処理をすべてのグループについて行う。次に、各グ
ループ内で同じグループ番号の文字列を1つのグループ
とする新たなグループを作成する。この処理により、図
8のステップS11で同じグループに分類された文字サ
イズの異なる文字列が、別々のグループに分けられる。
【0130】次に、グループ内の大きな矩形削除処理を
行う(ステップS19)。ここでは、ノイズ除去のた
め、再びグループ内で平均的な矩形サイズを求め、その
矩形サイズを基準として、極端に大きなサイズの矩形を
削除する。言い換えれば、これまでの処理で変化したグ
ループに対して、図9のステップS14の処理を再度行
い、グループ内のノイズを削除する。
【0131】次に、グループ統合処理を行い、左右方向
または上下方向に互いに近接する同色グループを統合す
る(ステップS20)。ここでは、2つのグループがほ
ぼ同じ色でかつ近くにあり、グループの外接矩形が並ん
でいる場合に、それらの2つの矩形を統合して、1つの
グループとする。この処理は、後で行う文字矩形の並び
によるグループの文字列らしさの判定処理を安定させる
ために行われる。
【0132】具体的には、2つのグループの外接矩形の
色と上端座標および下端座標が近く、かつ、これらが近
い距離にあり、2つの矩形をまとめて1つの文字列と見
れそうな場合に、2つのグループを1つのグループにま
とめる。
【0133】まず、2つのグループの平均色をそれぞれ
(Rg1,Gg1,Bg1)と(Rg2,Gg2,Bg
2)として、2つのグループのそれぞれのRGB輝度値
の平均値(Rg1+Rg2,Gg1+Gg2,Bg1+
Bg2)を求める。次に、その平均値と解像度をキーと
して色差テーブルを検索し、得られたRGBそれぞれの
輝度差(delta_r,delta_g,delta
_b)を、同色とみなす場合の輝度差のしきい値とす
る。そして、以下の条件を満たすとき、2つのグループ
の平均色を同色とみなす。 |Rg1−Rg2|<delta_r かつ |Gg1−Gg2|<delta_g かつ |Bg1−Bg2|<delta_b 2つのグループの外接矩形が横並びの場合、さらに、横
方向の距離が固定しきい値より小さく、かつ、上端座標
および下端座標の差がともに固定しきい値より小さい場
合に、2つのグループを統合する。縦並びの場合は、縦
方向の距離が固定しきい値より小さく、かつ、左端座標
および右端座標の差がともに固定しきい値よりも小さい
場合に、2つのグループを統合する。この処理を、統合
するグループがなくなるまで繰り返す。
【0134】図24は、グループ統合処理を説明する図
である。図24において、1つのグループの外接矩形1
61ともう1つのグループの外接矩形162が互いに横
に並んでいる。このとき、矩形161と矩形162の距
離L1と、矩形161と矩形162の上端座標の差E1
および下端座標の差E2を求める。そして、2つのグル
ープの平均色の輝度差、距離L1、座標差E1、および
座標差E2がそれぞれのしきい値より小さいとき、矩形
161と矩形162を統合し、それらの矩形を囲む外接
矩形163を生成する。
【0135】また、2つのグループの外接矩形の座標が
似ていない場合でも、各グループ内の端に位置する矩形
の座標が近ければ、2つのグループを統合する。横並び
の場合、2つのグループ内の最も近い2つの矩形が以下
の条件を満たすとき、2つのグループを統合する。縦並
びの場合も同様である。 ・高さが固定しきい値より小さい。 ・上端座標の差の絶対値が固定しきい値より小さい。 ・下端座標の差の絶対値が固定しきい値より小さい。
【0136】図25は、このようなグループ統合処理を
説明する図である。図25において、矩形164のグル
ープの最右端の矩形166と矩形165のグループの最
左端の矩形167に注目する。そして、2つのグループ
の色が上記の色の条件を満たし、さらに矩形166と矩
形167が上記のサイズおよび位置の条件を満たすと
き、矩形164と矩形165を統合し、それらの矩形を
囲む外接矩形168を生成する。
【0137】このように、グループの外接矩形の並び方
だけでなく、その内部に含まれる矩形の並び方も考慮し
てグループを統合することにより、より正確な文字列を
抽出することが可能になる。
【0138】次に、矩形並びによる文字らしいグループ
の抽出処理を行う(ステップS21)。この処理では、
グループ内の矩形のうち、サイズまたは形等の一定の条
件を満足する矩形を対象にして、上端座標または下端座
標のどちらかが隣りの矩形と近い場合、これらの2つの
矩形が並んでいるものと判定し、並びフラグをセットす
る。そして、グループ内の全対象矩形のうち並んでいる
矩形の数がどの程度の割合であるかを示す並び矩形率を
求め、その並び矩形率が一定のしきい値以上のグループ
を文字列として抽出する。具体的には、以下のa)〜
e)の処理を行う。 a)グループ内でサイズまたは形の一定条件を満足する
2つの隣接する矩形の上端座標または下端座標の差がし
きい値より小さい場合、それらの2つの矩形に横並びフ
ラグを与える。しきい値は、矩形の高さのWID_RA
TE(例えば、0.2)倍とする。また、2つの矩形が
隣接するとは、基準矩形の幅のWID_RATE_DI
ST(例えば、0.5)倍の範囲内に他方の矩形がある
ことをいう。
【0139】また、サイズまたは形の一定条件を満足す
る矩形は、例えば、次のようにして求める。まず、グル
ープ内の矩形の高さの最頻値を求め、その高さの3倍を
large_rectとする。そして、高さが固定サイ
ズ(39.4ドット/cm画像において23ドット)よ
り大きく、large_rectより小さい矩形を、対
象矩形として選択する。 b)グループ内でサイズまたは形の一定条件を満足する
2つの隣接する矩形の左端座標または右端座標の差がし
きい値より小さい場合、それらの2つの矩形に縦並びフ
ラグを与える。しきい値は、矩形の幅のWID_RAT
E倍とする。 c)グループ内の矩形に与えられた横並びフラグと縦並
びフラグの数をかぞえ、数の多い方の方向を文字列方向
として採用して、その方向のフラグの数を並んでいる矩
形の数とする。 d)グループ内の矩形のうち並んでいる矩形の比率を、
次式により算出する。 比率=並んでいる矩形の数/グループ内の一定条件を満
足する矩形の総数 e)並んでいる矩形の比率が一定しきい値NUM_RA
TE(例えば、0.8)より大きい場合に、そのグルー
プを文字列らしいグループとして残し、他のグループを
ノイズとして破棄する。
【0140】図26は、矩形並びによる文字列らしいグ
ループの抽出処理を説明する図である。図26におい
て、矩形171〜174および矩形176〜187が入
力画像から生成され、グルーピングにより、矩形171
〜174が1つのグループに分類されて、これらの矩形
を囲む矩形175が生成されている。また、矩形176
〜187が1つのグループに分類され、これらの矩形を
囲む矩形188が生成されている。
【0141】ここで、各グループ内の矩形のサイズや位
置関係を調べ、横方向に並んでいる矩形に対して横並び
フラグを与え、縦方向に並んでいる矩形に対して縦並び
フラグを与える。このとき、矩形175内の矩形171
〜174はランダムに並んでいるので、これらの矩形に
は横並びフラグも縦並びフラグも付かない。一方、矩形
188内の矩形176〜187は横一列に並んでいるの
で、これらの矩形には横並びフラグが与えられる。
【0142】矩形171〜174および矩形176〜1
87についてのフラグ処理が終了すると、フラグが付さ
れた矩形の割合をグループ毎に算出する。そして、その
割合が大きいグループを文字列として抽出し、割合が小
さいグループをノイズとして破棄する。この結果、矩形
175のグループはノイズとして捨てられ、矩形188
のグループは文字列として抽出される。
【0143】次に、ノイズグループの削除処理を行う
(ステップS22)。ここでは、以下のA)〜C)の3
種類の削除処理を行う。 A)この処理では、グループ内が2つの矩形だけから構
成されているグループについて、それらの2つの矩形の
上下端(または左右端)がともに近いかどうかを判断
し、2つの矩形が並んでいると判断されなければ、その
グループをノイズとして削除する。
【0144】図27は、このようなノイズグループの削
除処理を説明する図である。図27において、2つの矩
形191、192が1つのグループとして抽出され、こ
れらの矩形を囲む矩形193が生成されている。この場
合、矩形191と矩形192の下端座標は揃っている
が、矩形191と矩形192の上端座標は極端に異なっ
ているので、これらの矩形はノイズであるとみなし、こ
のグループを文字列らしいグループの集合から削除す
る。
【0145】具体的には、グループ内の2つの矩形の高
さの平均をheiとし、それらの幅の平均をwidとす
る。また、しきい値を決めるための比率をDEL_RA
TE=0.1として、以下の条件を満足するグループだ
けを残し、他はノイズとして削除する。 (|第1の矩形の上端座標−第2の矩形の上端座標|<
hei×DEL_RATEかつ|第1の矩形の下端座標
−第2の矩形の下端座標|<hei×DEL_RAT
E)または(|第1の矩形の左端座標−第2の矩形の左
端座標|<wid×DEL_RATEかつ|第1の矩形
の右端座標−第2の矩形の右端座標|<wid×DEL
_RATE) この処理では、文字列のグループが確実に残される反
面、背景から抽出されたノイズグループも多数残ってし
まう。また、グループ同士が重なっている状態は、必ず
しも改善されない。このため、次のステップで行われる
グループの出力順位決定処理が、ノイズグループの影響
を受けてしまい、効果的に行われない場合がある。そこ
で、グループ同士の重なりを極力なくして、文字列グル
ープだけを残すために、以下のB)およびC)の処理を
行う。 B)グループ単位の図形除去によるノイズ削除処理 ここでは、グループ内に含まれる矩形を文字認識処理
し、その結果文字と判断された矩形が別のグループの矩
形領域にもかかっている場合に、その別のグループをノ
イズとして削除する。これにより、文字列グループと重
複しているノイズグループが削除される。
【0146】図28は、このようなノイズグループの削
除処理を説明する図である。図28に示すように、文字
列グループの矩形201とノイズグループの矩形202
が重複しているとき、両者のグループが重複している領
域にかかっている、文字列グループ内の矩形203を文
字認識処理する。そして、得られた距離値がしきい値
(例えば、1000)よりも小さい場合に、この矩形2
03を文字であると判定し、矩形203を含まない方の
グループをノイズとして削除する。 C)黒画素ヒストグラムに基づくノイズ削除処理 ここでは、グループ内の黒画素を縦方向および横方向に
それぞれ投影して、黒画素のヒストグラムを生成し、そ
れぞれのヒストグラムの各要素(黒画素数)の2乗和を
求める。縦方向投影、横方向投影のヒストグラムの2乗
和をそれぞれxsum、ysumとし、グループ内の重
なり矩形統合後の矩形数をoverlap_numとす
ると、以下のような条件が満たされるときに、グループ
内に縦または横方向の文字列が存在すると判断して、こ
のグループを残す。 |xsum−ysum|/overlap_num>T
HSUM ただし、THSUMは、固定しきい値であり、ここでは
280とする。また、この条件が満たされない場合は、
このグループをノイズと判断して削除する。縦方向と横
方向とでヒストグラムの各要素の総和があまり変わらな
い場合でも、各要素の2乗和には顕著な差が現れること
が多い。したがって、この処理により、文字列グループ
を正確に抽出することが可能になる。
【0147】図29は、このようなノイズグループの削
除処理を説明する図である。図29において、矩形20
1のグループ内の黒画素を縦方向および横方向に投影す
ると、ヒストグラム204および205が得られる。こ
のとき、各ヒストグラムにおいて、各座標値に対応する
黒画素数を2乗し、すべての座標値に渡る2乗の値の総
和を求める。そして、上述した条件判定を行い、このグ
ループを削除するか否かを決定する。
【0148】次に、グループ内同色パターン抽出処理を
行う(ステップS23)。ここでは、まず、グループの
代表色を、グループ内の矩形の代表色の平均として求め
る。次に、グループの矩形の内部に相当する範囲で原画
像を探索して、グループの代表色に近いパターンであっ
て、既に文字パターンとして抽出されているもの以外の
ものを、2値画像として抽出する。
【0149】そして、抽出されたパターンに対して2値
画像用のラベリングを行い、連結成分の外接矩形を求
め、その矩形の大きさが所定値より大きいパターンだけ
を、文字パターンの一部として、そのグループに追加す
る。この処理により、これまでの処理では抜け落ちる
が、実は文字の一部であるようなパターンを抽出するこ
とができる。
【0150】図30は、グループ内同色パターン抽出処
理を説明する図である。図30において、ステップS2
2までの処理により、「クローハル化への3つの成功モ
デル」という文字列が入力画像から抽出され、この文字
列を囲む矩形211が生成されている。この場合、
「ク」および「ハ」という文字の濁点が欠落している。
ここで、「ク」の濁点が欠落したのは、濁点の色と
「ク」の色の差がしきい値範囲内になかったために、濁
点が「ク」とは異なるグループにグルーピングされたた
めである。「ハ」の濁点についても同様である。
【0151】このように、図8のステップS9の同色グ
ループ抽出処理では、抽出対象となる文字列のうち、局
所的な部分の色同士が比較されるので、抽出対象となる
文字列の色が色ずれ等で局所的に変化している場合に
は、文字の一部が欠落したりする。
【0152】そこで、既に抽出されている「クローハル
化への3つの成功モデル」という文字列全体を考慮し
て、その代表色を求め、この代表色に近い色を有するパ
ターンを原画像から再抽出する。これにより、文字列の
局所的な色の変化の影響を軽減することができ、図30
に示すように、「ク」の濁点212と「ハ」の濁点21
3を抽出することが可能になる。また、同色パターンの
再抽出を行う際には、再抽出の対象となるパターンの探
索範囲を、矩形211の範囲に限定する。これにより、
抽出処理が高速化される。具体的には、以下の処理を行
う。 a)保存されている矩形の代表色情報をグループ内のす
べての矩形について平均し、グループの代表色(Rm,
Gm,Bm)を求める。また、グループ内のRGBの分
散(Vr,Vg,Vb)を求め、その分散からグループ
の標準偏差を次式により求める。 dev=sqrt(sqrt(Vr*Vr+Vg*Vg
+Vb*Vb)) b)グループ内の矩形サイズの最頻値を幅と高さについ
て求め、それぞれmfw、mfhとする。mfwまたは
mfhが最小矩形サイズのしきい値minsize(例
えば、2)より大きな場合には、その値をminsiz
eで置き換える。 c)グループの外接矩形を求め、その大きさの2値画像
を作成する。2値画像の画素値は、すべて0としてお
く。 d)グループの範囲内で原画像の画素の色(R,G,
B)を調べ、その色とグループの代表色(Rm,Gm,
Bm)が以下の関係を満足する場合に、その画素の位置
を記録し、対応する2値画像の画素値を1に設定する。
ただし、kは定数(例えば、5)である。 |Rm−R|+|Gm−G|+|Bm−B|<k×de
v e)グループ内の矩形を構成し、このグループ内の矩形
から既に抽出されているパターンを2値画像から除去
し、2値画像のパターンを、グループの代表色に近い色
を持ち、かつ、これまでの処理で漏れていたパターンだ
けにする。 f)この2値画像に対して、2値画像用のラベリングを
行い、連結成分の外接矩形を求める。 g)外接矩形の幅wおよび高さhが以下の条件を満足す
る矩形だけを残し、他の矩形を削除する。 w>mfw/2 かつ h>mfh/2 h)残った矩形に含まれる連結成分のパターンをグルー
プに追加する。
【0153】次に、グループの出力順位決定処理を行う
(ステップS24)。ここでは、先願Dのタイトル抽出
技術を応用して、グループの外接矩形の位置、位置関
係、サイズ、面積等の指標を用いて、グループ毎にタイ
トルらしさの得点を加算し、総合的にみて最も得点の高
い順にグループを並び替える。具体的な得点の加算方法
は以下の通りである。
【0154】まず、各グループの内部の文字列矩形の高
さの平均値をmean_gyou_sizeとして求
め、各グループの内部の重なり矩形統合後の文字矩形の
高さの最頻値をmost_freq_heightとし
て求める。most_freq_heightが0の場
合には、most_freq_height=mean
_gyou_sizeとする。
【0155】次に、画像中にあるすべてのグループのm
ost_freq_heightの平均値をfreqh
eightとして求め、half_freq=freq
height/2とする。そして、以下の条件に従って
得点を加算する。 ・グループ内文字矩形の高さの最頻値:グループのmo
st_freq_heightがfreqheight
*(1.0±0.5)の範囲内に入っているとき、+2
0点を加算する。また、most_freq_heig
htがfreqheight*1.5より大きく、fr
eqheight*3以下であるとき、+30点を加算
する。また、most_freq_heightがfr
eqheight*3より大きいとき、+40点を加算
する。 ・上下にグループがない:グループの上下とも距離ha
lf_freq以内の領域に他のグループがあるとき、
−40点を加算する(+40点を減算する)。また、上
または下いずれか一方のみの距離half_freq以
内の領域に他のグループがあるとき、−20点を加算す
る。また、上下とも距離half_freq以内の領域
に他のグループがないとき、+20点を加算する。 ・左にグループがない:グループの左側の距離freq
height以内の領域にグループがないとき、+20
点を加算する。 ・画像の上方に位置する:縦方向のグループの位置でソ
ートして、最も上方にあるグループに+20点を加算
し、以下、順位が下がるに従って1点ずつ差し引いた得
点を加算する。ただし、マイナスの得点は加算しないも
のとする。 ・画像の1/3より上方に位置する。
【0156】上述したグループ内文字矩形の高さの最頻
値に基づいてプラスの得点を獲得しており、かつ、グル
ープの下端が画像の1/3より上方に位置するとき、+
10点を加算する。 ・中央に位置する:グループのx座標の中心座標が画像
の中心座標±(画像幅*0.1)の範囲にあるとき、+
5点を加算する。 ・画像の左右端の近くに位置する:グループの左端が、
画像の右端から中心寄りに画像幅*0.1の範囲に入っ
ているか、または、グループの右端が、画像の左端から
中心よりに画像幅*0.1の範囲に入っているとき、−
30点を加算する。 ・グループの面積:グループの外接矩形の面積でソート
して、面積の最も大きなグループに+10点を加算し、
以下、順位が下がるに従って1点ずつ差し引いた得点を
加算する。ただし、マイナスの得点は加算しないものと
する。 ・グループの幅の大きさ:グループの外接矩形の横幅が
画像の1/3より大きいとき、+10点を加算する。 ・グループの外接矩形の位置関係:2つのグループの上
下左右端の対応する座標値の差を求め、その絶対値が固
定しきい値(例えば、10ドット)よりも小さいとき、
2つのグループは同じ文字列を表しているものとみなし
て、面積の小さい方のグループの得点を0にする。影付
き文字列から文字列を抽出する場合、真の文字列部分と
影の部分の両方からグループがそれぞれ抽出されるた
め、ほぼ完全に重複するこのような2つのグループが発
生しやすい。
【0157】以上説明したように、様々な条件を考慮し
てグループ毎に得点を与えることで、タイトルらしい文
字列により上位の出力順位を与えることができ、タイト
ルをより正確に抽出することが可能になる。
【0158】次に、グループを構成するパターンを文字
認識するための2値画像(2値パターン)を生成する
(ステップS25)。ここでは、各グループの領域につ
いて、背景部分が均一色であるか否かを判別し、背景が
均一色である場合には、先願Bまたは先願Cのカラーテ
キスト抽出技術を適用して2値画像を生成する。また、
背景が2色以上の色を含む場合には、グループ内の文字
パターンをそのまま2値画像にして出力する。
【0159】図31から図34までは、背景部分の均一
性をチェックする背景色判定処理のフローチャートであ
る。パターン抽出装置は、まず、グループの文字領域か
ら平均色(Rm,Gm,Bm)を求め(図31のステッ
プS61)、平均色と推定解像度resolution
をキーとして色差テーブルを検索し、色差のしきい値
(ir3,ig3,ib3)を求める(ステップS6
2)。
【0160】次に、グループの外接矩形のサイズの2値
画像領域を用意し、すべての画素値を0に設定して、白
色画像を生成する(ステップS63)。次に、グループ
内の1つの文字矩形のラベル番号と矩形領域を抽出し
(ステップS64)、ラベル画像の対応する矩形領域内
を走査して、そのラベル番号と一致するラベル値を持つ
画素を抽出する。そして、2値画像領域上の対応する座
標の画素値を1に変更して、マスク画像を生成する(ス
テップS65)。こうして生成されたマスク画像におい
て、画素値が1の画素はパターンに対応し、画素値が0
の画素はパターンが存在しない背景部分に対応する。
【0161】次に、グループ内に未処理の文字矩形があ
るか否かを判定し(ステップS66)、そのような矩形
があれば、ステップS64以降の処理を繰り返す。そし
て、すべての文字矩形の処理が終了すると、マスク画像
をその周囲(例えば、上下左右斜め方向)に一定画素
(例えば、1画素)だけ拡張して、膨張したマスク画像
を生成する(ステップS67)。図35は、拡張する前
のマスク画像の例を示しており、図36は、拡張された
マスク画像の例を示している。
【0162】次に、膨張したマスク画像を用いて、グル
ープの外接矩形に対応する入力画像の領域とラベル画像
の領域を走査し、マスク画像上で画素値が0の背景画素
に対応する色(R,G,B)とラベル番号を抽出する
(図32のステップS68)。そして、画素の色(R,
G,B)と文字の平均色(Rm,Gm,Bm)の差が許
容範囲内か否かを、以下の条件により判定する(ステッ
プS69)。 |Rm−R|<ir3 かつ |Gm−G|<ig3 かつ |Bm−B|<ib3 この条件が満たされれば、この画素は文字の一部を構成
しているものとみなして、図33のステップS80以降
の処理を行う。この条件が満たされなければ、次に、図
37に示すような背景色情報が管理領域に登録されてい
るか否かを判定する(ステップS70)。そして、背景
色情報が登録されていなければ、(R,G,B)の背景
色情報を新たに生成し、管理領域に登録して(ステップ
S71)、図33のステップS80以降の処理を行う。
【0163】図37の背景色情報においては、処理対象
の画素のラベル番号、矩形番号、(R,G,B)の値、
およびカウント値が登録されている。このうち、カウン
ト値は、同一とみなされる色を持つ画素の数を表し、最
初は1に設定される。
【0164】ステップS70において、背景色情報が登
録されていれば、1つの背景色情報を取り出し、その色
(Rr,Gr,Br)とラベル番号を抽出する(ステッ
プS72)。次に、(R,G,B)とresoluti
onをキーとして色差テーブルを検索し、しきい値(i
r,ig,ib)を求める(ステップS73)。次に、
(Rr,Gr,Br)とresolutionをキーと
して色差テーブルを検索し、しきい値(ir2,ig
2,ib2)を求める(ステップS74)。
【0165】そして、しきい値irとir2の最大値を
thrとし、しきい値igとig2の最大値をthgと
し、しきい値ibとib2の最大値をthbとする(ス
テップS75)。
【0166】次に、画素の色(R,G,B)と背景色情
報の色(Rr,Gr,Br)の差が許容範囲内か否か
を、以下の条件により判定する(図33のステップS7
6)。 |Rr−R|<thr かつ |Gr−G|<thg かつ |Br−B|<thb この条件が満たされなければ、次に、画素のラベル番号
と背景色情報のラベル番号が一致するか否かを判定する
(ステップS77)。両者が一致すれば、背景色情報の
カウント値に1を加算して(ステップS78)、次の背
景色情報があるか否かを判定する(ステップS79)。
そして、次の背景色情報があれば、ステップS72以降
の処理を繰り返す。
【0167】ステップS76において条件が満たされれ
ば、ステップS78以降の処理を行い、ステップS77
においてラベル番号が一致しなければ、ステップS79
以降の処理を行う。
【0168】このようなカウント処理によれば、既に登
録されている背景色に近い色の画素または背景色と同じ
ラベル番号を持つ画素が検出されたとき、対応する背景
色のカウント値がインクリメントされる。また、膨張し
たマスク画像を用いることで、文字と背景の混色が生じ
ている部分を背景色の判定から除外することができ、よ
り正確な判定が行われる。
【0169】ステップS79において、登録されている
すべての背景色情報の処理が終了すると、次に、グルー
プ内の未処理の背景画素があるか否かを判定する(ステ
ップS80)。そして、未処理の背景画素があれば、図
32のステップS68以降の処理を繰り返す。
【0170】グループ内のすべての背景画素の処理が終
了すると、次に、登録されている背景色情報の中でカウ
ント値が最大のものを選択し(ステップS81)、その
カウント値が以下の条件を満足するか否かを判定する
(図34のステップS82)。
【0171】カウント/マスク画像中の背景画素の総数
>thresh_rate ただし、thresh_rateは固定しきい値(例え
ば、0.91486)である。この条件が満たされれ
ば、このグループの背景は均一色であると判定し(ステ
ップS83)、この条件が満たされなければ、このグル
ープの背景は複数色であると判定して(ステップS8
4)、処理を終了する。
【0172】このような処理によれば、登録された背景
色の数が1つの場合、または、登録された背景色のうち
の1つのカウント値が一定数より大きい場合に、背景が
均一色であると判定される。
【0173】背景が均一色の場合は、パターン抽出装置
は、そのグループに対応する領域のカラー画像について
先願Bまたは先願Cの処理を行い、得られた2値画像を
出力する。このとき、グループに含まれる一様色の文字
矩形の数を調べ、文字矩形が1個であれば先願Bの処理
を採用し、文字矩形が複数個であれば先願Cの処理を採
用する。
【0174】前者の場合、グループの矩形領域のカラー
画像をグレースケール画像に変換し、グレースケール画
像に対して、例えば、画素値の補間処理を施して、解像
度の高い2値画像を生成する。また、後者の場合、グル
ープの矩形領域のカラー画像をグレースケール画像に変
換し、単一背景色かつ単一文字色の部分領域の集合を求
める。そして、それぞれの部分領域の2値画像を組み合
わせて、全体の2値画像を生成する。これにより、より
高精度な2値画像が生成される。
【0175】また、背景が複数色の場合は、ステップS
65で生成された拡張する前のマスク画像を、そのまま
グループの2値画像として出力する。そして、このよう
な処理をすべてのグループの外接矩形について行い、パ
ターン抽出処理を終了する。このとき、グループの2値
画像は、ステップS24で決定された順序で出力され
る。
【0176】このような2値画像生成処理によれば、背
景が均一色である場合にのみ、先願Bまたは先願Cに基
づいて詳細な2値画像が生成され、それ以外の場合は、
すでに生成されている2値画像が出力される。したがっ
て、処理の高速性をあまり損なうことなく、小さな文字
パターンをある程度まで抽出することができるようにな
る。
【0177】ところで、図8のステップS2において、
入力画像がフルカラー画像ではないと判定された場合に
は、次に、画像の色パレットを対象にクラスタリング処
理を行う(ステップS12)。クラスタリング方法とし
ては、例えば、クラスタ中心間のシティブロック距離を
距離尺度とする階層的クラスタリングを用いることがで
きる。距離尺度は、ユークリッド距離、重み付きユーク
リッド距離、またはマハラノビス距離等により定義する
こともできる。
【0178】そして、クラスタ中心間の距離の最小値が
あらかじめ定めたしきい値より小さくなったときに、ク
ラスタリングを終了する。このようなクラスタリングの
結果として、各クラスタについて以下のような情報が得
られる。 ・クラスタ番号 ・クラスタに含まれる色パレットの個数 ・クラスタに含まれる元の画像の色パレット番号 ・クラスタの平均色(R,G,B) 画像の色分布をクラスタリングする場合、クラスタリン
グに使用するベクトルは、画像の色パレット(Ri,G
i,Bi)(例えば、i=1〜255)である。この色
パレットのベクトルを使用して階層的クラスタリングを
行う場合、色差の尺度としてクラスタ間の距離を求め、
クラスタ間の距離が小さいクラスタ同士を統合する。2
つの色(R1,G1,B1)と(R2,G2,B2)の
間の距離distは、シティブロック距離で定義した場
合、次式により表される。 dist=|R1−R2|+|G1−G2|+|B1−
B2| ところで、実際には、コンピュータと人間の色の識別能
力は異なっており、例えば、色空間上での距離値が同じ
値であっても、黒(または白)に近い2つの色は、赤等
の高彩度の2つの色に比べて、人間が見たときに識別し
にくい。すなわち、黒に近い2つの色は、色空間上での
距離がある程度離れていても、人間の目にはそれらの2
つの色が区別されずに同一色に見えてしまう。一方、赤
に近い2つの色は、色空間上での距離がある程度近くて
も、人間の目にはそれらの2つの色が異なる色に見え
る。
【0179】そこで、クラスタリングに先立って、低彩
度色(黒または白に近い色)の2色間の距離値を高彩度
色の2色間の距離値よりも小さくするために、以下のよ
うな色変換を行う。 Rnew={1−cos(R×π/255)}×255
+R×4 Gnew={1−cos(G×π/255)}×255
+G×4 Bnew={1−cos(B×π/255)}×255
+B×4 これにより、0から255までのすべての輝度値につい
て、輝度値の差分を同じ評価基準で判断することができ
る。
【0180】次に、クラスタリング結果の情報を用い
て、カラー画像の色ラベリング処理を行い(ステップS
13)、ステップS5以降の処理を行う。これにより、
フルカラー以外の画像については、その画像を構成する
色パレットのクラスタリング結果がラベリング処理に反
映される。
【0181】色ラベリング処理では、まず、画素値(画
素のパレット番号)からクラスタ番号を獲得するための
変換表を作成する。次に、クラスタ番号に注目した色ラ
ベリング処理を行う。この色ラベリング処理では、隣り
合う画素のクラスタ番号が同じ場合にそれらの画素に同
一ラベルを与える。
【0182】このとき、縮小画像の左上からラスタスキ
ャンを行い、ラベル付けがされていない画素に注目す
る。そして、この未処理の画素の周囲8画素を走査し
て、周囲に既にラベル付けされた画素があり、その周囲
画素のクラスタ番号が注目画素のクラスタ番号と同じで
ある場合に、周囲画素のラベルをカレントラベルreg
ionとして保存し、注目画素のラベルとしてregi
onを与える。また、領域の平均色(Rm,Gm,B
m)として、周囲のラベルの平均色に注目画素の色を加
味した新たな平均色を求める。
【0183】それ以外の場合は、カレントラベルとし
て、今まで付けたラベル値+1のラベル値を設定し、注
目画素のラベルにもその値を付与する。この場合でも、
領域の平均色(Rm,Gm,Bm)として、注目画素の
RGB値を設定する。また、いずれの場合でも、注目画
素の座標値を処理対象座標配列に保存する。
【0184】次に、注目画素の周りに同色領域を拡張す
る処理を行う。処理対象座標配列の中から、先頭の座標
値を取り出し、その座標の画素を注目画素とする。そし
て、注目画素の周囲8画素を走査し、周囲画素が未処理
の画素であり、注目画素のクラスタ番号とその周囲画素
のクラスタ番号が同一である場合、周囲画素に注目画素
と同一のラベルを付け、周囲画素の座標を処理対象座標
配列に追加する。また、処理された注目画素を、処理対
象座標配列から削除する。
【0185】次に、処理座標xおよびyの最大値と最小
値を求め、それらの値をこのラベル領域の外接矩形とし
て保存する。また、このラベル領域の平均色を外接矩形
の属性(代表色)として保存する。
【0186】以上の処理を、処理対象座標配列の内容が
なくなるまで続ける。このような色ラベリングの結果、
ラベル画像と同じラベルを持つ領域を囲む外接矩形が獲
得される。ラベリング処理の出力情報は、ステップS4
と同様である。
【0187】次に、図38から図47までを参照しなが
ら、処理結果の具体例について説明する。図38は、図
8のステップS1で入力されるカラー画像(原画像)の
例を示している。このカラー画像に対してステップS4
の色ラベリング処理を施すと、図39に示すようなラベ
ル画像が生成され、ステップS9の処理により、図40
に示すような複数の同色グループが抽出される。さら
に、ステップS11の文字線太さによる再グループ化処
理により、同色グループは図41のように変化する。
【0188】次に、図9のステップS21の処理によ
り、文字列らしいグループとして、図42に示すような
いくつかのグループが抽出される。これらのグループか
ら、ステップS22の処理によりノイズグループを削除
すると、図43に示すようなグループが残される。これ
らのグループから、ステップS23の処理により、図4
4に示すような同色パターンが抽出される。
【0189】そして、ステップS24およびS25の処
理によりタイトル候補として出力されるパターンのう
ち、第1、第2、第3候補のパターンが、それぞれ、図
45、46、47に示されている。
【0190】本実施形態の技術の有効性を確かめるため
に、雑誌のカラー文書95枚を入力画像として用いて評
価実験を行ったところ、以下のような結果が得られた。 1)対象文書 A4サイズ雑誌: 雑誌J1 2種類 記事5ページ 雑誌J2 2種類 記事5ページ 雑誌J3 2種類 記事5ページ 雑誌J4 2種類 記事5ページ 雑誌J5 2種類 記事5ページ 雑誌J6 2種類 記事5ページ 雑誌J7 1種類 記事5ページ 雑誌J8 1種類 記事5ページ 雑誌J9 1種類 記事5ページ 雑誌J10 1種類 記事5ページ 雑誌J11 1種類 記事5ページ B5サイズ雑誌:(読み取り範囲はA4) 雑誌J12 2種類 記事5ページ 合計:19種類 記事95ページ 2)スキャナ読み取り条件 フルカラー、39.4ドット/cm 3)評価項目 a)キーワード文字列抽出正解率 あらかじめ、目視により、タイトルやキーワードとして
妥当と思える文字列を、正しい文字列として指定してお
く。そして、処理結果として出力された文字列パターン
のうち、パターンの欠けがほとんどないもの/ノイズが
ほとんど乗っていないものを、抽出に成功したパターン
とみなし、抽出正解率(抽出に成功した文字列の数/正
しい文字列の数)を求めた。
【0191】b)タイトル抽出正解率 あらかじめ、各ページ毎にタイトルと思われる文字列を
定めておく。そして、抽出された文字列とその出力順位
から、タイトル文字列が出力される順位を記録し、順位
毎のタイトル抽出正解率を求めた。さらに、その正解率
を累積して、累積タイトル抽出正解率(第i位までに正
しいタイトル文字列を抽出できる確率)を求めた。
【0192】c)キーワード文字認識率 抽出された文字列を、最近の文字認識エンジンで文字認
識し、文字認識率と誤認識原因の分析を行った。
【0193】d)処理時間 95枚のサンプルについて平均処理時間を求めた。 4)評価結果と考察 a)キーワード文字列抽出正解率 対象となる255個の文字列に対して、平均正解率は、
238/255=93.3%であった。これに対して、
本発明を適用していない処理で同じ評価を行うと、21
1/255=82.7%であった。
【0194】いくつかの文字列が抽出できない主な原因
は、以下の通りと思われる。 ・細い文字線や小さなパターンで文字列が構成されてい
て、カラーテキスト抽出処理を行うための前提となる同
色グループの抽出ができていない。 ・グループの背景部分が単一色であるにもかかわらず、
裏面文字の写り込み等で単一色と判定できない。
【0195】b)タイトル抽出正解率 各文書について1つのタイトルを指定したので、全部で
95個のタイトルが指定された。各順位以内の累積正解
率は、以下の通りである。
【0196】 第1位 :64/95=67.4% 第2位以内:82/95=86.3% 第3位以内:86/95=90.5% 第4位以内:89/95=93.7% 第5位以内:90/95=94.7% この結果を見ると、以前の社内文書を対象としたタイト
ル抽出実験に比べて、第1位で23ポイント程度悪くな
っている。この原因は、ノイズ除去が完全にできていな
いためノイズの悪影響が残ったことと、社内文書では1
行を単位にタイトルらしさの得点付けを行ったが、今回
は複数行を1まとまりとするグループを単位に得点付け
を行っているので、タイトルらしさの顕著な特徴が出に
くかったことにあると思われる。例えば、文字列間の重
なりはほとんどなくてもグループ間の重なりはあり得る
ので、重なりがあるか否かをタイトルらしさの指標とし
て用いることができない。
【0197】その他の原因としては、タイトルらしいグ
ループを表す特徴量の解析が不十分であることが挙げら
れる。このことは、社内文書の場合にも問題となった
が、GA(genetic algorithm )等の方法を用いれば、
最適な得点配分を求めることが可能である。
【0198】c)キーワード文字認識率 最新の文字認識エンジンに、誤認識の主要な原因の1つ
である大文字と小文字を判別する処理を組み入れて、文
字認識を行った結果、平均正解率は、2443文字/2
782文字=87.8%であった。
【0199】d)処理時間 500MHzのCPU(中央処理装置)と128Mバイ
トのメモリを備えたコンピュータを用いた場合、以下の
ような結果が得られた。
【0200】フルカラー画像の平均処理時間:5.52
秒/枚 最大処理時間:16.13秒/枚 最小処理時間:2.7秒/枚 このように、本実施形態のパターン抽出処理によれば、
キーワード文字列抽出正解率、タイトル抽出正解率、キ
ーワード文字認識率、および処理時間が全般的に良好な
値を示しており、高速かつ高精度な処理が実現されるこ
とが分かる。
【0201】図48は、以上説明したハイブリッドパタ
ーン抽出処理の概要を示すフローチャートである。この
フローチャートによれば、パターン抽出装置は、まず、
図8のステップS1から図9のステップS24までの処
理に相当するパターン抽出処理を行って、カラー画像か
ら同色グループが覆う領域(例えば、矩形領域)を文字
列領域として抽出し、各文字列領域内のパターンを抽出
する(ステップS91)。
【0202】次に、抽出された文字列領域の背景部分が
均一色か否かを判定する(ステップS92)。背景部分
が均一色であれば、先願Bまたは先願Cの処理を行って
より詳細にパターンを抽出し(ステップS93)、次の
文字列領域があるか否かを判定する(ステップS9
4)。次の文字列領域があれば、ステップS92以降の
処理を繰り返す。
【0203】ステップS92において背景部分が均一色
でなければ、ステップS93の処理をスキップして、ス
テップS94以降の処理を行う。そして、すべての文字
列領域の処理が終了すると、抽出されたパターンの2値
画像を出力して(ステップS95)、処理を終了する。
このとき、背景部分が均一色の文字列領域については、
ステップS93で抽出されたパターンの2値画像が出力
され、それ以外の文字列領域については、ステップS9
1で抽出されたパターンの2値画像が出力される。
【0204】同色グループに基づくパターン抽出処理と
先願Bまたは先願Cに基づく詳細パターン抽出処理を所
定のアルゴリズムに基づいて組み合わせたハイブリッド
パターン抽出処理としては、他にも様々な形態が考えら
れる。図49、50、51は、このようなハイブリッド
パターン抽出処理のフローチャートである。
【0205】図49の処理では、パターン抽出装置は、
まず、先願Bまたは先願Cの処理による詳細パターン抽
出を行い(ステップS101)、領域識別を行って文字
列領域内の文字領域を抽出する(ステップS102)。
【0206】次に、文字列領域内の背景部分の色を調
べ、背景部分が均一色か否かを判定する(ステップS1
03)。背景部分が均一色でなければ、図48のステッ
プS91と同様にして文字列領域内のパターンを抽出し
(ステップS104)、次の文字列領域があるか否かを
判定する(ステップS105)。次の文字列領域があれ
ば、ステップS103以降の処理を繰り返す。
【0207】ステップS103において背景部分が均一
色であれば、ステップS104の処理をスキップして、
ステップS105以降の処理を行う。そして、すべての
文字列領域の処理が終了すると、抽出されたパターンの
2値画像を出力して(ステップS106)、処理を終了
する。このとき、背景部分が均一色の文字列領域につい
ては、ステップS101で抽出されたパターンの2値画
像が出力され、それ以外の文字列領域については、ステ
ップS104で抽出されたパターンの2値画像が出力さ
れる。
【0208】図50の処理では、パターン抽出装置は、
同色グループに基づくパターン抽出処理と、先願Bまた
は先願Cに基づく詳細パターン抽出処理とを全く独立に
行い、出力された文字列パターンを合成する。
【0209】この処理では、パターン抽出装置は、ま
ず、図8のステップS1から図9のステップS24まで
の処理に相当するパターン抽出処理を行って、カラー画
像からグループ内同色パターンを抽出する(ステップS
111)。
【0210】また、このパターン抽出処理と並行して、
同じカラー画像に対して、先願Bまたは先願Cの処理を
行ってより詳細なパターンを抽出し(ステップS11
2)、領域識別を行って文字列領域内の文字領域を抽出
する(ステップS113)。
【0211】次に、2つの方法で抽出されたパターンを
合成して(ステップS114)、合成されたパターンの
2値画像を出力し(ステップS115)、処理を終了す
る。ステップS114の合成処理では、2つのパターン
の2値画像を生成し、それらの2値画像を画素毎に比較
する。そして、例えば、OR合成により、対応する2つ
の画素値の論理和を新たな画素値とする2値画像を生成
する。
【0212】これにより、カラー画像から独立に抽出さ
れた2つのパターンが合成され、合成結果が2値画像と
して出力される。また、OR合成の代わりに、AND合
成等の他の論理演算を用いてもよい。
【0213】図51の処理では、パターン抽出装置は、
同色グループに基づくパターン抽出処理と、先願Bまた
は先願Cに基づく詳細パターン抽出処理とを全く独立に
行い、出力された文字列パターンを合成しないで個別に
出力する。
【0214】この処理では、パターン抽出装置は、ま
ず、図8のステップS1から図9のステップS24まで
の処理に相当するパターン抽出処理を行って、カラー画
像からグループ内同色パターンを抽出する(ステップS
121)。そして、抽出されたパターンの2値画像を生
成して出力する(ステップS122)。
【0215】また、このパターン抽出処理と並行して、
同じカラー画像に対して、先願Bまたは先願Cの処理を
行ってより詳細なパターンを抽出し(ステップS12
3)、領域識別を行って文字列領域内の文字領域を抽出
する(ステップS124)。そして、抽出されたパター
ンの2値画像を生成して出力する(ステップS12
5)。
【0216】こうして、カラー画像から独立に抽出され
た2つのパターンの2値画像をそのまま独立に出力し
て、処理を終了する。この場合、ユーザは、出力された
2つの2値画像を比較して、いずれか一方を選択するこ
とができる。
【0217】図52から図54までは、図49のステッ
プS103で行われる背景色判定処理のフローチャート
である。パターン抽出装置は、まず、文字列領域の2値
画像における黒画素に対応する入力画像の画素を抽出
し、それらの画素の色を平均して、文字列の平均色(R
m,Gm,Bm)を求める(図52のステップS13
1)。次に、文字列領域の2値画像からマスク画像を生
成し(ステップS132)、マスク画像をその周囲に一
定画素だけ拡張して、膨張したマスク画像を生成する
(ステップS133)。
【0218】次に、マスク画像を用いて、グループの外
接矩形に対応する入力画像の領域を走査し、マスク画像
上で画素値が0の背景画素に対応する色(R,G,B)
を抽出する(ステップS134)。そして、画素の色
(R,G,B)と文字列の平均色(Rm,Gm,Bm)
の差が許容範囲内か否かを、以下の条件により判定する
(ステップS135)。 |Rm−R|<thR1 かつ |Gm−G|<thG1 かつ |Bm−B|<thB1 ただし、thR1、thG1、およびthB1は、固定
しきい値である。この条件が満たされれば、この画素は
文字の一部を構成しているものとみなして、図53のス
テップS142以降の処理を行う。この条件が満たされ
なければ、次に、図55に示すような背景色情報が管理
領域に登録されているか否かを判定する(ステップS1
36)。そして、背景色情報が登録されていなければ、
(R,G,B)の背景色情報を新たに生成し、管理領域
に登録して(ステップS137)、図53のステップS
142以降の処理を行う。図55のカウント値は、最初
は1に設定される。
【0219】ステップS136において、背景色情報が
登録されていれば、1つの背景色情報を取り出し、その
色(Rr,Gr,Br)を抽出する(図53のステップ
S138)。次に、画素の色(R,G,B)と背景色情
報の色(Rr,Gr,Br)の差が許容範囲内か否か
を、以下の条件により判定する(ステップS139)。
【0220】|Rr−R|<thR かつ |Gr−G|<thG かつ |Br−B|<thB ただし、thR、thG、およびthBは、固定しきい
値である。この条件が満たされれば、背景色情報のカウ
ント値に1を加算して(ステップS140)、次の背景
色情報があるか否かを判定する(ステップS141)。
そして、次の背景色情報があれば、ステップS138以
降の処理を繰り返す。ステップS139において条件が
満たされなければ、ステップS141以降の処理を行
う。このようなカウント処理によれば、既に登録されて
いる背景色に近い色の画素が検出されたとき、対応する
背景色のカウント値がインクリメントされる。
【0221】ステップS141において、登録されてい
るすべての背景色情報の処理が終了すると、次に、文字
列領域内の未処理の背景画素があるか否かを判定する
(ステップS142)。そして、未処理の背景画素があ
れば、図52のステップS134以降の処理を繰り返
す。
【0222】文字列領域内のすべての背景画素の処理が
終了すると、次に、登録されている背景色情報の中でカ
ウント値が最大のものを選択し(ステップS143)、
そのカウント値が以下の条件を満足するか否かを判定す
る(図54のステップS144)。 カウント/マスク画像中の背景画素の総数>thres
h_rate ただし、thresh_rateは固定しきい値であ
る。この条件が満たされれば、この文字列領域の背景は
均一色であると判定し(ステップS145)、この条件
が満たされなければ、この文字列領域の背景は複数色で
あると判定して(ステップS146)、処理を終了す
る。
【0223】図48から図51までに示したハイブリッ
ドパターン抽出処理を採用することで、小さな文字パタ
ーンであっても、ある程度まで抽出することができるよ
うになり、高精度なパターン抽出処理が実現される。
【0224】ところで、パターン抽出装置は、例えば、
図56に示すような情報処理装置(コンピュータ)を用
いて構成することができる。図56の情報処理装置は、
CPU(中央処理装置)221、メモリ222、入力装
置223、出力装置224、外部記憶装置225、媒体
駆動装置226、ネットワーク接続装置227、および
画像入力装置228を備え、それらはバス229により
互いに接続されている。
【0225】メモリ222は、例えば、ROM(read o
nly memory)、RAM(random access memory)等を含
み、処理に用いられるプログラムとデータを格納する。
CPU221は、メモリ222を利用してプログラムを
実行することにより、必要な処理を行う。
【0226】入力装置223は、例えば、キーボード、
ポインティングデバイス、タッチパネル等であり、ユー
ザからの指示や情報の入力に用いられる。出力装置22
4は、例えば、ディスプレイ、プリンタ、スピーカ等で
あり、ユーザへの問い合わせや処理結果の出力に用いら
れる。
【0227】外部記憶装置225は、例えば、磁気ディ
スク装置、光ディスク装置、光磁気ディスク(magneto-
optical disk)装置等である。情報処理装置は、この外
部記憶装置225に、上述のプログラムとデータを保存
しておき、必要に応じて、それらをメモリ222にロー
ドして使用することができる。また、外部記憶装置22
5は、カラー画像を格納するデータベースとしても用い
られる。
【0228】媒体駆動装置226は、可搬記録媒体23
0を駆動し、その記録内容にアクセスする。可搬記録媒
体230としては、メモリカード、フロッピー(登録商
標)ディスク、CD−ROM(compact disk read only
memory )、光ディスク、光磁気ディスク等、任意のコ
ンピュータ読み取り可能な記録媒体が用いられる。ユー
ザは、この可搬記録媒体230に上述のプログラムとデ
ータを格納しておき、必要に応じて、それらをメモリ2
22にロードして使用することができる。
【0229】ネットワーク接続装置227は、LAN
(local area network)等の任意の通信ネットワークへ
の接続に用いられ、通信に伴うデータ変換を行う。情報
処理装置は、上述のプログラムとデータをネットワーク
接続装置227を介して外部の装置から受け取り、それ
らをメモリ222にロードして使用することができる。
【0230】画像入力装置228は、例えば、CCDカ
メラやスキャナ等の撮像装置であり、カラー画像の入力
に用いられる。図57は、図56の情報処理装置にプロ
グラムとデータを供給することのできるコンピュータ読
み取り可能な記録媒体を示している。可搬記録媒体23
0や外部のデータベース231に保存されたプログラム
とデータは、メモリ222にロードされる。そして、C
PU221は、そのデータを用いてそのプログラムを実
行し、必要な処理を行う。
【0231】
【発明の効果】本発明によれば、カラー文書画像に含ま
れる文字と背景の混色を適切に処理して、小さな文字パ
ターンを抽出することが可能となる。これにより、高精
度なパターン抽出処理が実現される。
【図面の簡単な説明】
【図1】本発明のパターン抽出装置の原理図である。
【図2】テーブル作成処理のフローチャートである。
【図3】網点印刷法によるカラー画像の表現方法を説明
する図
【図4】網点印刷法によるカラー画像の拡大図
【図5】印刷モデルの生成方法を示す図
【図6】第1の色差テーブルの構成を示す図
【図7】第2の色差テーブルの構成を示す図
【図8】パターン抽出処理のフローチャート(その1)
である。
【図9】パターン抽出処理のフローチャート(その2)
である。
【図10】注目画素の周囲の8画素を示す図である。
【図11】図形除去を示す図である。
【図12】L字形パターンが存在する場合の重なり統合
結果を示す図である。
【図13】注目矩形の周囲の探索範囲の設定方法を説明
する図である。
【図14】注目矩形の周囲の探索範囲にかかる矩形の抽
出方法を説明する図である。
【図15】輪郭長獲得処理を示すフローチャート(その
1)である。
【図16】輪郭長獲得処理を示すフローチャート(その
2)である。
【図17】輪郭長獲得方法を説明するためのパターンの
具体例を示す図である。
【図18】再グルーピング処理の例を示す図である。
【図19】グループ内の大きな矩形削除処理を説明する
図である。
【図20】グループ内の重なり矩形統合処理を説明する
図である。
【図21】グループ内文字列抽出処理を説明する図であ
る。
【図22】文字列内分離文字統合処理を説明する図であ
る。
【図23】グループ内の文字列サイズによる再グループ
化処理を説明する図である。
【図24】第1のグループ統合処理を説明する図であ
る。
【図25】第2のグループ統合処理を説明する図であ
る。
【図26】矩形並びによる文字列らしいグループの抽出
処理を説明する図である。
【図27】第1のノイズグループの削除処理を説明する
図である。
【図28】第2のノイズグループの削除処理を説明する
図である。
【図29】第3のノイズグループの削除処理を説明する
図である。
【図30】グループ内同色パターン抽出処理を説明する
図である。
【図31】第1の背景色判定処理のフローチャート(そ
の1)である。
【図32】第1の背景色判定処理のフローチャート(そ
の2)である。
【図33】第1の背景色判定処理のフローチャート(そ
の3)である。
【図34】第1の背景色判定処理のフローチャート(そ
の4)である。
【図35】第1のマスク画像を示す図である。
【図36】第2のマスク画像を示す図である。
【図37】第1の背景色情報を示す図である。
【図38】カラー画像を示す図である。
【図39】ラベル画像を示す図である。
【図40】同色グループを示す図である。
【図41】再グループ化の結果を示す図である。
【図42】文字列らしいグループを示す図である。
【図43】ノイズグループ削除の結果を示す図である。
【図44】グループ内同色パターンを示す図である。
【図45】第1候補を示す図である。
【図46】第2候補を示す図である。
【図47】第3候補を示す図である。
【図48】第1のハイブリッドパターン抽出処理のフロ
ーチャートである。
【図49】第2のハイブリッドパターン抽出処理のフロ
ーチャートである。
【図50】第3のハイブリッドパターン抽出処理のフロ
ーチャートである。
【図51】第4のハイブリッドパターン抽出処理のフロ
ーチャートである。
【図52】第2の背景色判定処理のフローチャート(そ
の1)である。
【図53】第2の背景色判定処理のフローチャート(そ
の2)である。
【図54】第2の背景色判定処理のフローチャート(そ
の3)である。
【図55】第2の背景色情報を示す図である。
【図56】情報処理装置の構成図である。
【図57】記録媒体を示す図である。
【符号の説明】
1 概略抽出手段 2 詳細抽出手段 3 出力手段 4 判定手段 5 合成手段 11 原画像 12、13、14、15 画素 21、22、23 点 31、32、33、41、44、45、61、62、6
3、64、72、102、103、104、105、1
06、107、108、109、110、111、13
1、132、133、134、135、136、14
2、143、144、145、146、147、14
8、149、150、151、161、162、16
3、164、165、166、167、168、17
1、172、173、174、175、176、17
7、178、179、180、181、182、18
3、184、185、186、187、191、19
2、193、201、202、203、211 矩形 42、43 パターン 51 注目矩形 52、65 探索範囲 71 ラベル画像 81、82、83、101、112、141 グループ 204、205 ヒストグラム 212、213 濁点 221 CPU 222 メモリ 223 入力装置 224 出力装置 225 外部記憶装置 226 媒体駆動装置 227 ネットワーク接続装置 228 画像入力装置 229 バス 230 可搬記録媒体 231 データベース

Claims (17)

    【特許請求の範囲】
  1. 【請求項1】 複数色の背景上の大きな文字を抽出可能
    な抽出方法を用いて、カラー画像から文字列パターンを
    抽出する概略抽出手段と、 抽出された文字列パターンの領域内において、背景色が
    均一か否かを判定する判定手段と、 前記背景色が均一であるとき、一様色の背景上の小さな
    文字を抽出可能な抽出方法を用いて、前記文字列パター
    ンの領域から文字列パターンを再抽出する詳細抽出手段
    と、 前記背景色が均一でないとき、前記概略抽出手段により
    抽出された文字列パターンを出力し、前記背景色が均一
    であるとき、前記詳細抽出手段により抽出された文字列
    パターンを出力する出力手段とを備えることを特徴とす
    るパターン抽出装置。
  2. 【請求項2】 前記判定手段は、前記概略抽出手段によ
    り抽出された文字列パターンの領域内において、該文字
    列パターンを拡張し、拡張された文字列パターン以外の
    部分の色を前記背景色とみなすことを特徴とする請求項
    1記載のパターン抽出装置。
  3. 【請求項3】 前記判定手段は、前記概略抽出手段によ
    り抽出された文字列パターンの領域内において、前記カ
    ラー画像の画素の色情報と、該カラー画像から生成され
    たラベル画像の画素のラベル情報とを用いて、背景部分
    の色の数を求め、得られた数に基づいて背景色が均一か
    否かを判定することを特徴とする請求項1記載のパター
    ン抽出装置。
  4. 【請求項4】 前記判定手段は、前記文字列パターンの
    領域内において、該文字列パターンを拡張し、拡張され
    た文字列パターン以外の部分を前記背景部分とみなすこ
    とを特徴とする請求項3記載のパターン抽出装置。
  5. 【請求項5】 複数の文字列パターンに対して、タイト
    ルらしさを表す得点を付与する付与手段をさらに備え、
    前記出力手段は、付与された得点に基づいて決められた
    順序で該複数の文字列パターンを出力することを特徴と
    する請求項1記載のパターン抽出装置。
  6. 【請求項6】 一様色の背景上の小さな文字を抽出可能
    な抽出方法を用いて、カラー画像から文字列パターンを
    抽出する詳細抽出手段と、 抽出された文字列パターンの領域内において、背景色が
    均一か否かを判定する判定手段と、 前記背景色が均一でないとき、複数色の背景上の大きな
    文字を抽出可能な抽出方法を用いて、前記文字列パター
    ンの領域から文字列パターンを再抽出する概略抽出手段
    と、 前記背景色が均一であるとき、前記詳細抽出手段により
    抽出された文字列パターンを出力し、前記背景色が均一
    でないとき、前記概略抽出手段により抽出された文字列
    パターンを出力する出力手段とを備えることを特徴とす
    るパターン抽出装置。
  7. 【請求項7】 複数色の背景上の大きな文字を抽出可能
    な抽出方法を用いて、カラー画像から文字列パターンを
    抽出する概略抽出手段と、 一様色の背景上の小さな文字を抽出可能な抽出方法を用
    いて、前記カラー画像から文字列パターンを抽出する詳
    細抽出手段と、 前記概略抽出手段により抽出された文字列パターンと、
    前記詳細抽出手段により抽出された文字列パターンとを
    合成する合成手段と、 合成された文字列パターンを出力する出力手段とを備え
    ることを特徴とするパターン抽出装置。
  8. 【請求項8】 複数色の背景上の大きな文字を抽出可能
    な抽出方法を用いて、カラー画像から文字列パターンを
    抽出する概略抽出手段と、 一様色の背景上の小さな文字を抽出可能な抽出方法を用
    いて、前記カラー画像から文字列パターンを抽出する詳
    細抽出手段と、 前記概略抽出手段により抽出された文字列パターンと、
    前記詳細抽出手段により抽出された文字列パターンとを
    個別に出力する出力手段とを備えることを特徴とするパ
    ターン抽出装置。
  9. 【請求項9】 コンピュータのためのプログラムを記録
    した記録媒体であって、 複数色の背景上の大きな文字を抽出可能な概略抽出方法
    を用いて、カラー画像から文字列パターンを抽出し、 抽出された文字列パターンの領域内において、背景色が
    均一か否かを判定し、 前記背景色が均一であるとき、一様色の背景上の小さな
    文字を抽出可能な詳細抽出方法を用いて、前記文字列パ
    ターンの領域から文字列パターンを再抽出し、 前記背景色が均一でないとき、前記概略抽出方法により
    抽出された文字列パターンを出力し、前記背景色が均一
    であるとき、前記詳細抽出方法により抽出された文字列
    パターンを出力する処理を前記コンピュータに実行させ
    ることを特徴とするコンピュータ読み取り可能な記録媒
    体。
  10. 【請求項10】 コンピュータのためのプログラムを記
    録した記録媒体であって、 一様色の背景上の小さな文字を抽出可能な詳細抽出方法
    を用いて、カラー画像から文字列パターンを抽出し、 抽出された文字列パターンの領域内において、背景色が
    均一か否かを判定し、 前記背景色が均一でないとき、複数色の背景上の大きな
    文字を抽出可能な概略抽出方法を用いて、前記文字列パ
    ターンの領域から文字列パターンを再抽出し、 前記背景色が均一であるとき、前記詳細抽出方法により
    抽出された文字列パターンを出力し、前記背景色が均一
    でないとき、前記概略抽出方法により抽出された文字列
    パターンを出力する処理を前記コンピュータに実行させ
    ることを特徴とするコンピュータ読み取り可能な記録媒
    体。
  11. 【請求項11】 コンピュータのためのプログラムを記
    録した記録媒体であって、 複数色の背景上の大きな文字を抽出可能な概略抽出方法
    を用いて、カラー画像から文字列パターンを抽出し、 一様色の背景上の小さな文字を抽出可能な詳細抽出方法
    を用いて、前記カラー画像から文字列パターンを抽出
    し、 前記概略抽出方法により抽出された文字列パターンと、
    前記詳細抽出方法により抽出された文字列パターンとを
    合成し、 合成された文字列パターンを出力する処理を前記コンピ
    ュータに実行させることを特徴とするコンピュータ読み
    取り可能な記録媒体。
  12. 【請求項12】 コンピュータのためのプログラムを記
    録した記録媒体であって、 複数色の背景上の大きな文字を抽出可能な概略抽出方法
    を用いて、カラー画像から文字列パターンを抽出し、 一様色の背景上の小さな文字を抽出可能な詳細抽出方法
    を用いて、前記カラー画像から文字列パターンを抽出
    し、 前記概略抽出方法により抽出された文字列パターンと、
    前記詳細抽出方法により抽出された文字列パターンとを
    個別に出力する処理を前記コンピュータに実行させるこ
    とを特徴とするコンピュータ読み取り可能な記録媒体。
  13. 【請求項13】 複数色の背景上の大きな文字を抽出可
    能な概略抽出方法と、一様色の背景上の小さな文字を抽
    出可能な詳細抽出方法とを所定のアルゴリズムに基づい
    て組み合わせ、 組み合わされた抽出方法により、カラー画像から文字列
    パターンを抽出することを特徴とするパターン抽出方
    法。
  14. 【請求項14】 複数色の背景上の大きな文字を抽出可
    能な概略抽出方法を用いて、カラー画像から文字列パタ
    ーンを抽出し、 抽出された文字列パターンの領域内において、背景色が
    均一か否かを判定し、 前記背景色が均一であるとき、一様色の背景上の小さな
    文字を抽出可能な詳細抽出方法を用いて、前記文字列パ
    ターンの領域から文字列パターンを再抽出し、 前記背景色が均一でないとき、前記概略抽出方法により
    抽出された文字列パターンを出力し、前記背景色が均一
    であるとき、前記詳細抽出方法により抽出された文字列
    パターンを出力する処理をコンピュータに実行させるた
    めのプログラム。
  15. 【請求項15】 一様色の背景上の小さな文字を抽出可
    能な詳細抽出方法を用いて、カラー画像から文字列パタ
    ーンを抽出し、 抽出された文字列パターンの領域内において、背景色が
    均一か否かを判定し、 前記背景色が均一でないとき、複数色の背景上の大きな
    文字を抽出可能な概略抽出方法を用いて、前記文字列パ
    ターンの領域から文字列パターンを再抽出し、 前記背景色が均一であるとき、前記詳細抽出方法により
    抽出された文字列パターンを出力し、前記背景色が均一
    でないとき、前記概略抽出方法により抽出された文字列
    パターンを出力する処理をコンピュータに実行させるた
    めのプログラム。
  16. 【請求項16】 複数色の背景上の大きな文字を抽出可
    能な概略抽出方法を用いて、カラー画像から文字列パタ
    ーンを抽出し、 一様色の背景上の小さな文字を抽出可能な詳細抽出方法
    を用いて、前記カラー画像から文字列パターンを抽出
    し、 前記概略抽出方法により抽出された文字列パターンと、
    前記詳細抽出方法により抽出された文字列パターンとを
    合成し、 合成された文字列パターンを出力する処理をコンピュー
    タに実行させるためのプログラム。
  17. 【請求項17】 複数色の背景上の大きな文字を抽出可
    能な概略抽出方法を用いて、カラー画像から文字列パタ
    ーンを抽出し、 一様色の背景上の小さな文字を抽出可能な詳細抽出方法
    を用いて、前記カラー画像から文字列パターンを抽出
    し、 前記概略抽出方法により抽出された文字列パターンと、
    前記詳細抽出方法により抽出された文字列パターンとを
    個別に出力する処理をコンピュータに実行させるための
    プログラム。
JP2001019060A 2000-01-27 2001-01-26 カラー画像から文字列パターンを抽出する装置および方法 Expired - Fee Related JP4275866B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001019060A JP4275866B2 (ja) 2000-01-27 2001-01-26 カラー画像から文字列パターンを抽出する装置および方法

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2000018166 2000-01-27
JP2000-18166 2000-01-27
JP2001019060A JP4275866B2 (ja) 2000-01-27 2001-01-26 カラー画像から文字列パターンを抽出する装置および方法

Publications (2)

Publication Number Publication Date
JP2001283153A true JP2001283153A (ja) 2001-10-12
JP4275866B2 JP4275866B2 (ja) 2009-06-10

Family

ID=26584250

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001019060A Expired - Fee Related JP4275866B2 (ja) 2000-01-27 2001-01-26 カラー画像から文字列パターンを抽出する装置および方法

Country Status (1)

Country Link
JP (1) JP4275866B2 (ja)

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007164253A (ja) * 2005-12-09 2007-06-28 Nippon Telegr & Teleph Corp <Ntt> 映像中文字認識装置、映像中文字認識方法、プログラム、及び記録媒体
JP2008288898A (ja) * 2007-05-17 2008-11-27 Canon Inc 動画撮像装置及び動画撮像方法
JP2010218420A (ja) * 2009-03-18 2010-09-30 Fuji Xerox Co Ltd 文字認識装置、画像読取装置、およびプログラム
JP2011013898A (ja) * 2009-07-01 2011-01-20 Canon Inc 画像処理装置、画像処理方法、及び、プログラム
JP2011118928A (ja) * 2006-06-23 2011-06-16 Colorzip Media Inc カラーベースのイメージコードの色判別方法
JP2011188293A (ja) * 2010-03-09 2011-09-22 Fuji Xerox Co Ltd 画像処理装置、画像処理システム、及び画像処理プログラム
US8094202B2 (en) 2007-05-17 2012-01-10 Canon Kabushiki Kaisha Moving image capture apparatus and moving image capture method
WO2013145873A1 (ja) * 2012-03-27 2013-10-03 株式会社サタケ 光学式粒状物選別機
JP2013210785A (ja) * 2012-03-30 2013-10-10 Brother Ind Ltd 画像処理装置およびプログラム
JP5695257B1 (ja) * 2014-07-25 2015-04-01 楽天株式会社 画像処理装置、画像処理方法、および画像処理プログラム
JP2019515374A (ja) * 2016-08-31 2019-06-06 バイドゥ オンライン ネットワーク テクノロジー (ベイジン) カンパニー リミテッド 画像内の文字領域を認識するための方法及び装置
JP2020170969A (ja) * 2019-04-04 2020-10-15 富士通株式会社 文書出力プログラム、文書出力方法及び文書出力システム
CN113095327A (zh) * 2021-03-16 2021-07-09 深圳市雄帝科技股份有限公司 光学字符识别区域的定位方法、系统及其存储介质

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7338159B2 (ja) * 2019-01-24 2023-09-05 富士フイルムビジネスイノベーション株式会社 情報処理装置及びプログラム

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06266897A (ja) * 1993-03-17 1994-09-22 Nippon Telegr & Teleph Corp <Ntt> 背景付き文字列からの文字列画像の抽出処理方式
JPH114344A (ja) * 1997-06-11 1999-01-06 Fuji Xerox Co Ltd 画像領域判定方法およびその装置、画像処理装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06266897A (ja) * 1993-03-17 1994-09-22 Nippon Telegr & Teleph Corp <Ntt> 背景付き文字列からの文字列画像の抽出処理方式
JPH114344A (ja) * 1997-06-11 1999-01-06 Fuji Xerox Co Ltd 画像領域判定方法およびその装置、画像処理装置

Cited By (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007164253A (ja) * 2005-12-09 2007-06-28 Nippon Telegr & Teleph Corp <Ntt> 映像中文字認識装置、映像中文字認識方法、プログラム、及び記録媒体
JP2011118928A (ja) * 2006-06-23 2011-06-16 Colorzip Media Inc カラーベースのイメージコードの色判別方法
JP2008288898A (ja) * 2007-05-17 2008-11-27 Canon Inc 動画撮像装置及び動画撮像方法
US8094202B2 (en) 2007-05-17 2012-01-10 Canon Kabushiki Kaisha Moving image capture apparatus and moving image capture method
JP2010218420A (ja) * 2009-03-18 2010-09-30 Fuji Xerox Co Ltd 文字認識装置、画像読取装置、およびプログラム
US8385651B2 (en) 2009-03-18 2013-02-26 Fuji Xerox Co., Ltd. Character recognition device, image-reading device, computer readable medium, and character recognition method
US8675256B2 (en) 2009-07-01 2014-03-18 Canon Kabushiki Kaisha Image processing apparatus, image processing method, and storage medium
JP2011013898A (ja) * 2009-07-01 2011-01-20 Canon Inc 画像処理装置、画像処理方法、及び、プログラム
JP2011188293A (ja) * 2010-03-09 2011-09-22 Fuji Xerox Co Ltd 画像処理装置、画像処理システム、及び画像処理プログラム
WO2013145873A1 (ja) * 2012-03-27 2013-10-03 株式会社サタケ 光学式粒状物選別機
US9024223B2 (en) 2012-03-27 2015-05-05 Satake Corporation Optical type granule sorting machine
JPWO2013145873A1 (ja) * 2012-03-27 2015-12-10 株式会社サタケ 光学式粒状物選別機
JP2013210785A (ja) * 2012-03-30 2013-10-10 Brother Ind Ltd 画像処理装置およびプログラム
JP5695257B1 (ja) * 2014-07-25 2015-04-01 楽天株式会社 画像処理装置、画像処理方法、および画像処理プログラム
JP2019515374A (ja) * 2016-08-31 2019-06-06 バイドゥ オンライン ネットワーク テクノロジー (ベイジン) カンパニー リミテッド 画像内の文字領域を認識するための方法及び装置
US10803338B2 (en) 2016-08-31 2020-10-13 Baidu Online Network Technology (Beijing) Co., Ltd. Method and device for recognizing the character area in a image
JP2020170969A (ja) * 2019-04-04 2020-10-15 富士通株式会社 文書出力プログラム、文書出力方法及び文書出力システム
JP7183923B2 (ja) 2019-04-04 2022-12-06 富士通株式会社 文書出力プログラム、文書出力方法及び文書出力システム
CN113095327A (zh) * 2021-03-16 2021-07-09 深圳市雄帝科技股份有限公司 光学字符识别区域的定位方法、系统及其存储介质
CN113095327B (zh) * 2021-03-16 2022-10-14 深圳市雄帝科技股份有限公司 光学字符识别区域的定位方法、系统及其存储介质

Also Published As

Publication number Publication date
JP4275866B2 (ja) 2009-06-10

Similar Documents

Publication Publication Date Title
JP3748172B2 (ja) 画像処理装置
JP3748164B2 (ja) パターン抽出装置
US6993185B2 (en) Method of texture-based color document segmentation
JP2951814B2 (ja) 画像抽出方式
JP3601658B2 (ja) 文字列抽出装置及びパターン抽出装置
JP3904840B2 (ja) 多値画像から罫線を抽出する罫線抽出装置
JP4275866B2 (ja) カラー画像から文字列パターンを抽出する装置および方法
JP4149464B2 (ja) 画像処理装置
JPH06195513A (ja) 光学式文字認識システム用折曲点抽出方法
JP2001101426A (ja) ディジタル画像処理方法
JP3851742B2 (ja) 帳票処理方法及び装置
JP2002207964A (ja) 多値画像から二値画像を生成する画像処理装置および方法
JP4211941B2 (ja) パターン抽出装置
JP3172498B2 (ja) イメージ認識用特徴値抽出方法、およびその装置、イメージ解析プログラムを格納する記憶媒体
JP2007034613A (ja) 画像処理装置及びその方法
JP3661774B2 (ja) 文字列認識方法、文字認識装置およびプログラム
JPH09305707A (ja) 画像抽出方式
JP2613211B2 (ja) 画像入力装置
JP3972546B2 (ja) 画像処理装置および画像処理方法
JP2003216958A (ja) 多角形検出装置、多角形検出方法及び多角形検出プログラム
JP4763113B2 (ja) 高速ラベリング方式
JPH0520455A (ja) 画像処理方法
Trier A data capture system for hydrographic maps
JPH1021332A (ja) 非線形正規化方法
JP2002074265A (ja) テロップパターン認識装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20051209

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080610

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080805

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20081111

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20081217

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20090120

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20090303

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20090305

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120313

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130313

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130313

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140313

Year of fee payment: 5

LAPS Cancellation because of no payment of annual fees