JP2000172849A - 画像処理装置及びパターン抽出装置 - Google Patents

画像処理装置及びパターン抽出装置

Info

Publication number
JP2000172849A
JP2000172849A JP10350342A JP35034298A JP2000172849A JP 2000172849 A JP2000172849 A JP 2000172849A JP 10350342 A JP10350342 A JP 10350342A JP 35034298 A JP35034298 A JP 35034298A JP 2000172849 A JP2000172849 A JP 2000172849A
Authority
JP
Japan
Prior art keywords
color
image
group
pattern
labeling
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP10350342A
Other languages
English (en)
Other versions
JP3748172B2 (ja
Inventor
Yutaka Katsuyama
裕 勝山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP35034298A priority Critical patent/JP3748172B2/ja
Priority to US09/358,380 priority patent/US6771813B1/en
Publication of JP2000172849A publication Critical patent/JP2000172849A/ja
Priority to US10/781,291 priority patent/US7280688B2/en
Priority to US11/237,665 priority patent/US7349571B2/en
Application granted granted Critical
Publication of JP3748172B2 publication Critical patent/JP3748172B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/11Region-based segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/136Segmentation; Edge detection involving thresholding
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/10Image acquisition
    • G06V10/12Details of acquisition arrangements; Constructional details thereof
    • G06V10/14Optical characteristics of the device performing the acquisition or on the illumination arrangements
    • G06V10/143Sensing or illuminating at different wavelengths
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/414Extracting the geometrical structure, e.g. layout tree; Block segmentation, e.g. bounding boxes for graphics or text
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10004Still image; Photographic image
    • G06T2207/10008Still image; Photographic image from scanner, fax or copier
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10024Color image
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30176Document

Abstract

(57)【要約】 【課題】 様々のカラー画像に対応して精度良く同色領
域を抽出することが可能な画像処理装置を提供する。 【解決手段】 制御手段8は、色数の少ないカラー画像
に対しては、第1のラベリング9を選択することによ
り、色パレットのクラスタリングを用いたラベリングを
行わせ、色数の多いカラー画像に対しては、第1のラベ
リング10を選択することにより、隣接拡張法を用いた
ラベリングを行わせる。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明はカラー画像処理装置
及びパターン抽出装置に関し、特に、カラー画像からタ
イトルなどの文字領域を抽出する場合に適用して好適な
ものである。
【0002】
【従来の技術】近年、コンピュータやカラープリンタな
どの周辺機器の発達と、その低価格化に伴って、カラー
画像を処理する分野が広がっている。このため、カラー
画像を領域分割し、カラー画像の中から特定領域だけを
抽出する技術、例えば、カラー画像中の同色領域を抽出
する技術が求められている。
【0003】この技術は、例えば、CCDカメラで撮影
したカラー情景画像を処理対象の入力画像とする場合で
は、画像認識による果物選別や、車の監視、セキュリテ
ィーのための人物監視等、多方面で求められている。
【0004】また、カラー文書画像を入力画像とする場
合では、画像から文書名やキーワードなどを自動抽出し
て、検索時に使用できるものとして期待されている。そ
の一例として、図書館での本の分類や、管理の自動シス
テムがあげられる。その他にも、画像をデータベースと
して蓄積、共有化するグループウェアでの自動キーワー
ドまたはファイル名付けなどに利用される。これらの情
報は、膨大な量のカラー文書画像を自動検索するのに使
用される。
【0005】従来のカラー画像中の同色領域を抽出する
技術として、カラー画像中の画素を色ごとにクラスタリ
ングすることにより、色分解画像の作成する方法があ
る。また、隣接拡張法による色ラベリング結果を用いる
ことにより、カラー画像中の同色領域を抽出する方法が
ある。
【0006】また、カラー画像中からタイトルを抽出す
る技術として、色分解画像を用いて文字領域の抽出処理
を行う方法がある。
【0007】この方法では、以下の処理が行われる。 ・1つの色の色分解画像から連結領域の外接矩形を求め
る。 ・外接矩形のサイズ、形状で一定の範囲にあるものだけ
に絞る。 ・矩形毎に隣接矩形探索範囲を設け、その内部にかかる
矩形を探索し、お互いに内部にかかる関係の矩形群をグ
ループとして抽出する。 ・グループ内の矩形の重心の直線性がよい物だけを残
す。 ・グループの外接矩形を求め、その内部を対象にグルー
プを構成する領域の色に近いパターンを抽出する。
【0008】なお、従来のカラー文書画像から文字領域
を抽出する技術が記載されている文献として、以下のよ
うなものがある。 ・ 仙田等「文字の単色性に着目したカラー画像からの
文字パターン抽出法」電子情報通信学会PRU94−0
9,p17−24 ・ 上羽等「等色線処理によるカラー画像からの文字領
域の抽出」電子情報通信学会 PRU94−09,p9
−16 ・ 松尾等「カラー文書画像からの単色文字領域の抽
出」1997電子情報通信学会総合大会D−12−19 ・ 松尾等「濃淡及び色情報による情景画像からの文字
列抽出」電子情報通信学会PRU92−121,p25
−32
【0009】
【発明が解決しようとする課題】しかしながら、従来の
カラー画像の画素の色ごとのクラスタリングにより同色
領域を抽出する方法では、画像全体の多数の画素を対象
としたクラスタリングが行われるため、クラスタリング
に必要な計算時間が大きくなる。
【0010】さらに、画像全体の画素を対象としてクラ
スタリングが行われるので、精度のよい領域抽出ができ
ない場合がある。例えば、第1の色の領域と第2の色の
領域とが離れた場所にあり、第1の色と第2の色とが類
似しているために、これらの第1の色と第2の色とが1
つのクラスタに分類されると、このクラスタから生成さ
れる第3の色によっては、第1の色と第2の色との両方
を完全にカバーすることができず、抽出結果のパターン
に穴が空いたり、輪郭がきれいに抽出されなかったりす
る場合がある。
【0011】また、従来の領域拡張法を用いて同色領域
を抽出する方法では、隣り合う画素の色が、人間が見た
時には同じように見えるものについても、隣接画素との
色の近さをどう定義するかによっては、しきい値よりも
大きくかけ離れる場合があり、領域中の穴や領域輪郭が
正しく抽出できない場合がある。
【0012】さらに、隣接画素との関係だけを見ている
ので、文字領域と背景領域の境界で徐々に色が変化して
いく場合には、文字領域が背景領域と同一ラベルになっ
てしまう場合がある。
【0013】また、従来の領域拡張法では、多種多様な
カラー文書画像に対し、予め定められたしきい値を一律
に適用して同色領域の抽出が行われるため、例えば、灰
色や中間色などの同色系統の色が背景と文字に使われて
いる場合には、かなりの頻度で背景と文字が同一ラベル
化し、文字パターンの抽出精度が損なわれたり、逆に抽
出されたラベル領域が文字パターンの中で小さく細切れ
状態となり、結果的に文字パターンの抽出精度が悪化し
たりする場合がある。
【0014】また、256色画像などのフルカラー以外
の画像に領域拡張法を適応すると、細かいラベル領域が
多数発生し、領域抽出の精度が悪化するという問題があ
る。
【0015】また、従来の色分解画像を用いた文字領域
の抽出方法では、画像全体についての色分解画像を、そ
の画像から抽出された色の数だけ生成する必要があり、
色分解画像の生成に時間がかかるという問題がある。さ
らに、各色分解画像は画像全体について生成されるの
で、例えば、その画像からタイトルを抽出する場合に、
タイトル領域以外の色の影響を受けやすく、タイトルの
抽出精度が悪化するという問題がある。また、連結領域
の外接矩形を求める場合、抽出した色分解画像ごとに画
像全体について処理を行う必要があるため、1つのカラ
ー画像から複数(抽出した色数分の)の縦横が同じサイ
ズの画像が必要になり、処理に時間がかかるという問題
がある。
【0016】また、外接矩形のグルーピングも、画像全
体について生成された色分解画像ごとに行われるので、
処理に時間がかかるとともに、抽出対象となる文字が異
なる色分解画像にクラスタリングされると、救済できな
いという問題がある。
【0017】また、グループの構成時に互いに探索範囲
にかかる矩形だけを抽出するので、文字パターンの一部
であるが、小さい部分がグループから抜け落ち易いとい
う問題がある。また、抜け落ちた部分を拾うために、グ
ループ内の色が近いパターンの抽出を最後に行うが、こ
の時に色が近いノイズを拾いやすいという問題がある。
【0018】そこで、本発明の目的は、様々のカラー画
像に対応して精度良く同色領域を抽出することが可能な
画像処理装置を提供することである。
【0019】
【課題を解決するための手段】上述した課題を解決する
ために、本発明によれば、処理対象となるカラー画像の
色数に基づいて、画像処理を使い分けるようにしてい
る。
【0020】このことにより、カラー画像の色数の違い
に応じた最適な画像処理を行うことが可能となり、画像
処理の精度を向上させることが可能となるとともに、画
像処理の高速化も図ることが可能となる。
【0021】また、本発明の一態様によれば、処理対象
となるカラー画像の色数に基づいて、異なるラベリング
方法を選択するようにしている。
【0022】このことにより、色数の少ないカラー画像
に対しては、領域の色差がある程度大きくても、それら
の領域を同一色であるとみなすことが可能となり、同色
領域が微細な領域に分断されることを防止することが可
能となる。また、色数の多いカラー画像では、わずかな
色の違いを検出して、異なる色の領域に異なるラベルを
付与することが可能となり、色の異なるパターンを精度
よく分離して、特定の色のパターンのみを精度良く抽出
することが可能となる。
【0023】また、本発明の一態様によれば、フルカラ
ー画像以外のカラー画像を対象として、色パレットのク
ラスタリングを用いたラベリングを行い、フルカラー画
像を対象として、隣接拡張法を用いたラベリングを行う
ようにしている。
【0024】このことにより、フルカラー画像以外のカ
ラー画像は色数が少ないため、色パレットのクラスタリ
ングを用いた場合にも、短い時間で処理を行うことが可
能となるとともに、同色領域の色のばらつきが大きい場
合でも、それらの色を同一のクラスタに分類して色の欠
落を防止することが可能となることから、同色領域を精
度良く抽出することが可能となる。また、フルカラー画
像については、色のクラスタリングを行うことなく、互
いに隣接する画素同士の色を比較するだけで、同色領域
を抽出することが可能となることから、処理時間を短縮
することが可能となるとともに、離れた領域の色の影響
を受けることなく、同色領域を抽出することが可能とな
る。
【0025】また、本発明の一態様によれば、ラベリン
グ対象となる画像の読み取り情報に基づいて、ラベリン
グのしきい値を各画像ごとに個別に設定するようにして
いる。
【0026】このことにより、画像の色の同一色の範囲
が各画像ごとに異なっている場合においても、その画像
の色の変動を忠実に反映したしきい値を設定することが
可能となり、多種多様なカラー画像を対象として、同色
領域を精度よく抽出することが可能となる。
【0027】また、本発明の一態様によれば、処理対象
となる入力画像の局所領域から色差情報を抽出すること
により、その入力画像に対するラベリングのしきい値を
設定するようにしている。
【0028】このことにより、同色領域の抽出対象とな
る入力画像自体から、入力画像の同色領域の実際の色差
を抽出することが可能となり、多種多様なカラー画像が
入力された場合においても、同色領域を精度よく抽出す
ることが可能となる。
【0029】また、本発明の一態様によれば、カラー画
像をメッシュ状に分割し、そのメッシュ領域内での色の
分散の小さい領域をそのカラー画像についての均一色領
域として抽出するようにしている。
【0030】このことにより、様々な色が分布している
カラー画像に対し、同一色だけからなる領域の位置を特
定することが可能となり、この領域の色の分散を求める
ことにより、入力画像の同色領域の実際の色差を算出す
ることが可能となる。
【0031】また、本発明の一態様によれば、色の分散
値が予め決められた範囲にある局所領域内の色の標準偏
差に基づいて、ラベリングの際のしきい値を決定するよ
うにしている。
【0032】このことにより、同一色の色の範囲を処理
対象となる実際の画像から求めることが可能となり、灰
色や中間色などの同色系統の色が文字と背景とに使われ
ている場合においても、同色系統の色が使われている文
字と背景とを区別して、文字のみを精度良く抽出するこ
とが可能となる。
【0033】また、本発明の一態様によれば、第1の色
に対する肉眼での色差の分解能と第2の色に対する肉眼
での色差の分解能とが一致するように、色信号の色変換
を行うようにしている。
【0034】このことにより、人間に同一色と見える場
合には、色空間上での色差が大きい場合においても、そ
の領域を一体的に抽出することが可能となるとともに、
人間に異なる色と見える場合には、色空間上での色差が
小さい場合においても、その領域を別個に抽出すること
が可能となり、人間の色の識別特性に適合した同色領域
の抽出が可能となる。
【0035】また、本発明の一態様によれば、低彩度色
付近の色の色差を縮小し、高彩度色付近の色の色差を拡
大するようにしている。
【0036】このことにより、低彩度色付近では、人間
の色差の分解能が小さいことに対応して、人間に同一色
に見える部分を精度良く抽出することが可能となるとと
もに、高彩度色付近では、人間の色差の分解能が大きい
ことに対応して、人間に異なる色に見える部分は異なる
領域として抽出することが可能となり、同色領域の抽出
精度を向上させることが可能となる。
【0037】また、本発明の一態様によれば、カラー画
像の色のクラスタリングを行い、同一のクラスタに属す
る色で連結している領域に同一のラベルを付すようにし
ている。
【0038】このことにより、隣接拡張法によるラベリ
ングを行う場合に、カラー画像の色の数を減らしてラベ
リングを行うことが可能となり、処理を高速化すること
が可能となるとともに、ラベリングのしきい値を予め定
めておく必要がなくなり、同色領域の抽出精度を向上さ
せることが可能となる。
【0039】また、本発明の一態様によれば、カラー画
像の色成分ごとにそれぞれ独立に算出された読み取り解
像度に基づいて、カラー画像から同色領域を抽出するし
きい値を設定するようにしている。
【0040】このことにより、CCDやスキャナなどの
読み取り解像度が色成分ごとに異なる場合や、カラー画
像に用いられている色の違いによって肉眼での分解能が
異なる場合においても、これらのことを考慮して同色領
域を抽出することが可能となり、カラー画像からの同色
パターンの抽出精度を向上させることが可能となる。
【0041】また、本発明の一態様によれば、色の輝度
値及び読み取り解像度を変数として隣接画素間の色差の
最大値が格納されている色差テーブルから、入力画像か
ら得られた隣接画素間の色差が最もよく一致する読み取
り解像度を3原色のそれぞれに対して個別に取得し、こ
の3原色の読み取り解像度に基づいて、入力画像の読み
取り解像度を算出するようにしている。
【0042】このことにより、入力画像の読み取り解像
度を算出する際に、読み取り解像度の色成分ごとの違い
を考慮することが可能となることから、カラー画像から
の同色パターンの抽出精度を向上させることが可能とな
る。
【0043】また、本発明の一態様によれば、画像が取
りうる全ての色の輝度値に対し、隣接画素間の色差の最
大値を色差テーブルに登録するようにしている。
【0044】このことにより、画像の色の輝度値がどの
ような値であっても、補間などの演算を行うことなく、
隣接画素間の色差の最大値を色差テーブルから直接取得
することが可能となり、画像の色の輝度値に対応したラ
ベリングのしきい値を高速に求めることが可能となる。
【0045】また、本発明の一態様によれば、画像を所
定の方向へ走査した際のラベル値の変化回数に基づい
て、画像内のパターンの輪郭長を算出するようにしてい
る。
【0046】このことにより、輪郭長の算出対象となる
パターンの外接矩形の範囲内を1回走査するだけで、そ
のパターンの輪郭長を算出することが可能となり、輪郭
長の算出処理を高速化することが可能となる。
【0047】また、本発明の一態様によれば、走査方向
に対し第1のラベル以外の画素から第1のラベルに変化
する画素数を計数し、走査方向に対し第1のラベルが付
された画素が2画素以上続いた後に、第1のラベルから
第1のラベル以外の画素に変化する画素数を計数し、第
1のラベルが付された画素のうち、走査方向の隣接画素
の両方が第1のラベルであり、かつ、走査方向と垂直方
向の隣接画素の少なくとも一方が第1のラベル以外であ
る画素数を計数するようにしている。
【0048】このことにより、パターンのエッジを検出
して輪郭長を算出する際に、走査方向に連続するエッジ
をパターンの輪郭として検出することが可能となるとと
もに、1画素幅のパターンについては、輪郭が2回カウ
ントされることを防止することが可能となり、様々な形
状のパターンの輪郭長を1度の走査で正確に算出するこ
とが可能となる。
【0049】また、本発明の一態様によれば、同色グル
ープに属するパターンの文字認識結果に基づいて、同色
グループの領域が文字領域かどうかを判別するようにし
ている。
【0050】このことにより、タイトル候補としてノイ
ズからなるパターンが抽出された場合においても、この
ノイズからなるパターンをタイトル候補から除くことが
可能となり、タイトル領域の抽出精度を向上させること
が可能となる。
【0051】また、本発明の一態様によれば、同一グル
ープ内のパターンの太さの頻度分布に基づいて設定され
たパターンの太さの範囲に基づいて、同一グループ内の
パターンの再分類を行うようにしている。
【0052】このことにより、様々の太さのパターンが
混在している場合においても、同一の太さのパターンの
みを同一のグループに分類することが可能となり、タイ
トル領域の抽出精度を向上させることが可能となる。
【0053】また、本発明の一態様によれば、第1の色
のグループの外接矩形と第2の色のグループの外接矩形
の形状、大きさまたは位置関係に基づいて、第1の色の
グループと第2の色のグループとを統合するようにして
いる。
【0054】このことにより、外接矩形同士の形状、大
きさまたは位置関係がタイトル領域として適切な場合に
は、外接矩形内のパターンの色が異なっていても、同一
のグループに分類することが可能となり、タイトルを構
成する文字に異なる色の文字が混在している場合におい
ても、タイトル領域を精度良く抽出することが可能とな
る。
【0055】また、本発明の一態様によれば、互いに重
なっている外接矩形同士の統合を行う際に、特定の形状
のパターンを除外するようにしている。
【0056】このことにより、抽出対象のパターンでは
ないと予め判っているものを、処理対象から除外して処
理を行うことが可能となり、同色パターンの抽出精度を
向上させることが可能となる。
【0057】また、本発明の一態様によれば、L字形ま
たはコ字形のパターンを除外してから、互いに重なって
いる外接矩形同士の統合を行うようにしている。
【0058】このことにより、抽出対象の文字がその文
字と同色の背景で囲まれている場合において、背景の隅
の部分のみが抽出対象の文字と同色の領域として抽出さ
れた場合においても、背景の隅の部分が抽出対象の文字
と統合されることを防止することが可能となり、タイト
ル領域を精度良く抽出することが可能となる。
【0059】また、本発明の一態様によれば、グルーピ
ング対象となる外接矩形内のパターンの色情報と既にグ
ルーピングされている外接矩形のグループの色情報とを
比較することにより、外接矩形のグルーピングを行うよ
うにしている。
【0060】このことにより、抽出対象として既に抽出
されている領域の全体の色を考慮して、外接矩形のグル
ーピングを行うことが可能となり、外接矩形内のパター
ンの色が徐々に変化する場合においても、抽出対象とな
る領域の色と異なる色の領域が同一グループに分類され
ることを防止することが可能となる。
【0061】また、本発明の一態様によれば、グループ
の色情報に基づいて、同一色かどうかを判定するしきい
値を設定するようにしている。
【0062】このことにより、同色パターンかどうかを
判定するしきい値を、抽出対象となる同色パターンの色
の変動から求めることが可能となり、パターンの色の同
一色の範囲が各パターンごとに異なる場合においても、
そのパターンの色の変動を忠実に反映したしきい値を設
定することが可能となることから、同色領域を精度良く
抽出することが可能となる。
【0063】また、本発明の一態様によれば、グループ
の色情報に基づいて、グループの統合を行うようにして
いる。
【0064】このことにより、グルーピング対象となる
外接矩形内のパターンの色が局所的に変動している場合
においても、そのパターンの色の局所的な変動を既に抽
出されている領域の全体のパターンの色に吸収させるこ
とが可能となり、全体的に見て同色となっているパター
ンを精度良く抽出することが可能となる。
【0065】
【発明の実施の形態】以下、本発明の実施例に係わる画
像処理装置について図面を参照しながら説明する。
【0066】図1は、本発明の第1実施例に係わる画像
処理装置の構成を示すブロック図である。
【0067】図1において、入力画像1が処理対象とさ
れる場合、読み取り情報取得手段2は、入力画像1の読
み取り情報を取得する。この読み取り情報は、入力画像
1の色数、読み取り解像度、輝度値、彩度、隣接画素間
の色差、または色の分散などである。
【0068】同色範囲設定手段3は、入力画像1の読み
取り情報に基づいて、入力画像1の同一とみなす色の範
囲を設定する。
【0069】ラベリング手段4は、同色範囲設定手段3
で設定された色の範囲の連結画素に同一ラベルを付すこ
とにより、入力画像1のラベリングを行う。
【0070】このことにより、ラベリング対象となる入
力画像1からラベリングのしきい値を求めることが可能
となり、多種多様なカラー画像が処理対象とされ、同一
とみなす色の範囲が各カラー画像ごとに異なっている場
合においても、そのカラー画像の色の範囲に対応したし
きい値を用いてラベリングを行うことができる。
【0071】グルーピング手段5は、ラベリング手段4
により生成されたラベルパターンのグルーピングを行
う。ここで、グルーピング手段5は、同色範囲設定手段
3で設定された同一色の範囲のパターンを同一グループ
にグルーピングすることができる。
【0072】グループ情報算出手段5は、同一グループ
に分類されているパターンの画像情報に基づいて、グル
ープの画像情報を算出する。
【0073】ここで、グループの画像情報は、グループ
の色情報やグループの矩形情報などである。グループの
色情報は、例えば、同一グループに属するパターンの色
の平均値や同一グループに属するパターンの色の分散で
ある。グループの矩形情報は、例えば、同一グループに
属するパターン全体の外接矩形の大きさ、形状、または
位置である。
【0074】グループの画像情報が求まると、このグル
ープの画像情報は、同色範囲設定手段3、ラベリング手
段4及びグルーピング手段5に供給される。
【0075】同色範囲設定手段3は、グループの画像情
報を受け取ると、このグループの画像情報に基づいて、
ラベリングのしきい値を設定することができる。例え
ば、同一グループに属するパターンの色の変動を求め、
同一グループに属するパターンの輝度差の最大値をラベ
リングのしきい値とすることができる。
【0076】このことにより、ラベリングを行うパター
ン自体からラベリングのしきい値を求めることが可能と
なり、同一とみなす色の範囲が背景パターンと文字パタ
ーンとで異なっている場合においても、ラベリングを精
度良く行うことができる。
【0077】ラベリング手段4は、グループの画像情報
を受け取ると、このグループの画像情報に基づいて、ラ
ベリングを行うことができる。例えば、同色パターンの
再抽出を行う場合に、探索する範囲を同一グループに属
するパターンを囲む外接矩形内に限定することができ
る。
【0078】このことにより、入力画像1からタイトル
パターンを抽出する際に、タイトルを構成するパターン
の一部が欠落した場合においても、欠落したパターンの
みを効率よく抽出することが可能となる。
【0079】グルーピング手段5は、グループの画像情
報を受け取ると、このグループの画像情報に基づいて、
パターンのグルーピングを行うことができる。例えば、
パターンのグルーピングを行う場合に、同一グループに
属するパターン全体の色を考慮してグルーピングを行
う。
【0080】このことにより、グルーピング対象となる
パターンの一部に局所的な色の変動がある場合において
も、この局所的な色の変動を吸収してパターンのグルー
ピングを行うことが可能となり、同色パターンの抽出精
度を向上させることが可能となる。
【0081】図2は、本発明の第2実施例に係わる画像
処理装置の構成を示すブロック図である。
【0082】図2において、色数判別手段7は、カラー
画像の色数を判別する。第1のラベリング手段9は、第
1のラベリング方法によりラベリングを行う。第2のラ
ベリング手段10は、第2のラベリング方法によりラベ
リングを行う。制御手段8は、カラー画像の色数に基づ
いて、第1のラベリング手段9または第2のラベリング
手段10にラベリングを行わせる。
【0083】ここで、色数判別手段7は、カラー画像の
1画素当たりのビット数を調べることにより、カラー画
像の色数を判別することができる。
【0084】また、第1のラベリング方法として、色パ
レットのクラスタリングを用いたラベリングを用いるこ
とができ、第2のラベリング方法として、隣接拡張法を
用いたラベリングを用いることができる。
【0085】また、制御手段8は、色数の少ないカラー
画像に対しては、色パレットのクラスタリングを用いた
ラベリングを行わせ、色数の多いカラー画像に対して
は、隣接拡張法を用いたラベリングを行わせることがで
きる。
【0086】このことにより、色数の少ないカラー画像
に対しては、領域の色差がある程度大きくても、それら
の領域を同一色であるとみなしてラベリングを行うこと
が可能となり、同色領域内での色の欠落を防止して、同
色領域を精度良く抽出することが可能となる。また、色
数の多いカラー画像では、わずかな色の違いを検出し
て、異なる色の領域に異なるラベルを付与することが可
能となり、文字の背景が文字の色に近い場合において
も、文字のみを精度良く抽出することが可能となる。
【0087】図3は、本発明の第3実施例に係わる画像
処理装置14の構成及び動作を示す図である。
【0088】図3において、局所領域抽出手段15は、
ラベリング対象となる入力画像13から局所領域を抽出
する。色差情報抽出手段16は、局所領域から入力画像
13の実際の色差情報を抽出する。しきい値設定手段1
7は、入力画像13から抽出した色差情報に基づいて、
入力画像13のラベリングのしきい値を設定する。
【0089】ここで、局所領域抽出手段15は、入力画
像をメッシュで区切り、メッシュ領域12の色の分散値
が予め決められた範囲にあるものだけを局所領域として
抽出することができる。また、色差情報抽出手段16
は、局所領域として抽出されたメッシュ領域12内の色
の標準偏差を色差情報として算出することができる。ま
た、しきい値設定手段17は、メッシュ領域12ごとに
求めた標準偏差の平均値に基づいて、しきい値を設定す
ることができる。
【0090】例えば、互いに隣接する画素11の色差が
しきい値以下かどうかを調べることにより、同色領域1
8を抽出することを考える。
【0091】ここで、画素11の色差を判定するしきい
値は、入力画像13のラベリングを行う前に予め決めて
おく必要がある。このため、このしきい値として、実験
用のカラー画像などを用いて経験的に決めた値を使う
と、多種多様なカラー画像に対応できなくなる場合があ
る。
【0092】そこで、色差情報抽出手段16は、ラベリ
ング対象となる入力画像13自体から同色領域18の色
差情報を抽出し、しきい値設定手段17は、その色差情
報に基づいて入力画像13のラベリングのしきい値を設
定する。
【0093】入力画像13から同色領域18の色差情報
を抽出するために、入力画像13から均一色領域を抽出
する。この均一色領域を抽するために、例えば、入力画
像13を3×3の画素11ごとに分割したメッシュ領域
12を生成する。メッシュ領域12が生成されると、入
力画像13のメッシュ領域12のそれぞれについて、画
素11の色の分散を調べる。そして、画素11の色の分
散の小さいメッシュ領域12を均一色領域とする。
【0094】例えば、入力画像13において、メッシュ
領域F、Gは同色領域18内にあるので、メッシュ領域
F、Gの画素11の色の分散は小さい。一方、メッシュ
領域A、B、C、D、E、H、I、J、K、Lは同色領
域18のそれ以外の領域とが混在しているので、メッシ
ュ領域A、B、C、D、E、H、I、J、K、Lの画素
11の色の分散は大きい。従って、画素11の色の分散
を各メッシュ領域12ごとに調べ、画素11の色の分散
の小さなメッシュ領域12のみを抽出することにより、
メッシュ領域F、Gのみを均一色領域として抽出するこ
とができる。
【0095】均一色領域が抽出されると、均一色領域の
色差情報に基づいて、ラベリングのしきい値を設定す
る。
【0096】例えば、均一色領域としてメッシュ領域
F、Gが入力画像13から抽出されると、各メッシュ領
域F、Gの標準偏差の平均値に基づいて、同色領域18
を抽出するためのしきい値を設定する。
【0097】このように、入力画像13全体には様々な
色が分布していても、小さな領域のみに注目した場合に
は、均一色だけからなる領域も存在するようになる。こ
のため、分割された領域ごとに、その領域の分散を求
め、分散の小さな領域のみを取り出すことにより、入力
画像13から均一色領域を抽出することが可能となる。
入力画像13から均一色領域が抽出されると、この均一
色領域の色の変動を調べることにより、同色領域18を
画素単位で特定するためのラベリングのしきい値を設定
することができる。
【0098】この結果、灰色や中間色などの同色系統の
色が文字と背景とに使われているため、予め実験的に求
めたしきい値を用いただけでは、これらの色を区別でき
ない場合においても、同一色で塗られている範囲の色が
実際にどの程度異なっているかを、処理対象となる実際
の画像から求めることが可能となり、同色系統の色の文
字と背景とが混在した画像から、文字のみを精度良く抽
出することが可能となる。
【0099】以下、本発明の一実施例に係わるパターン
抽出装置について、図面を参照しながら説明する。
【0100】図4は、本発明の第4実施例に係わるパタ
ーン抽出装置の動作を示すフローチャートである。
【0101】図4において、まず、フルエントリ色差テ
ーブル作成処理を行う(ステップS1)。このフルエン
トリ色差テーブルは、入力画像画が取りうるRGBの各
輝度値及び読み込み解像度を変数として、隣接画素との
輝度値の最大値を格納したものである。
【0102】ここで、隣接画素との輝度値の最大値を求
めるために、実際の印刷方法を模倣した印刷モデルを用
いて、RGBの各輝度値ごとの同色領域をコンピュータ
上に仮想的に生成する。そして、コンピュータ上に仮想
的に生成された同色領域での隣接画素との輝度値の最大
値を、読み込み解像度ごとに求める。
【0103】図5は、網点印刷法における印刷モデルの
構築方法を示す図である。
【0104】図5において、印刷モデルとして、シア
ン、マゼンタ、黄色の印刷メッシュM11、M12、M
13をそれぞれ回転させて重ね合わせたものを使用し、
カラー画像の色を仮想的に表現する。ここで、シアン、
マゼンタ、黄色の色の濃さを調節する場合、印刷メッシ
ュM11、M12、M13の各格子点に配置される塗り
つぶし円D11、D12、D13の大きさを調節する。
【0105】この時、一般的な印刷モデルのパラメータ
は、 ・印刷メッシュM11、M12、M13の格子間隔md
(ただし、格子間隔mdは、黄色、シアン、マゼンタ共
通サイズ) ・黄色メッシュM11の水平線からの角度θ11 ・マゼンタメッシュM12の水平線からの角度θ12 ・シアンメッシュM13の水平線からの角度θ13 ・黄色の塗りつぶし円D11の半径r11 ・マゼンタの塗りつぶし円D12の半径r12 ・シアンの塗りつぶし円D13の半径r13 である。ただし、本実施例では、この全てのパラメータ
を可変にすると煩雑すぎるので、ある程度の限定を与
え、以下のように設定した。
【0106】 ・黄色メッシュM11の水平線からの角度θ11=15
度 ・マゼンタメッシュM12の水平線からの角度θ12=
30度 ・シアンメッシュM13の水平線からの角度θ13 =
45度 ・格子間隔md=20ドット この印刷モデルを使用して、シミュレーションを行い、
黄色、マゼンタ、シアンの塗りつぶし円D11、D1
2、D13のそれぞれの半径r11、r12、r13に
影響を受ける平均RGB値(Rm,Gm,Bm)を求め
る。
【0107】具体的には、印刷メッシュM11、M1
2、M13の格子間隔mdよりもかなり大きな単位面積
を考え、平均RGB値(Rm,Gm,Bm)を、 Rm=255−単位面積中のシアンの面積×255/単
位面積 Gm=255−単位面積中のマゼンタの面積×255/
単位面積 Bm=255−単位面積中の黄色の面積×255/単位
面積 として求める。
【0108】次に、1つの色(Rm,Gm,Bm)で均
一に印刷されている画像をスキャナで読み込んだ場合の
スキャナ読み込みモデルについて考える。これは、印刷
メッシュM11、M12、M13と独立な間隔sdを有
する読み込みメッシュM14を導入し、この読み込みメ
ッシュM14内のRGBの各輝度値(=各色の面積)を
求めることに相当する。
【0109】ここで、読み込みメッシュM14の間隔s
dが、スキャナ読み込み解像度に相当する。なお、同じ
平均色(Rm,Gm,Bm)の画像を読み込む場合で
も、スキャナ読み込み解像度が大きい場合には、隣接画
素のRGB輝度差は大きく異なり、逆に、スキャナ読み
込み解像度が小さい場合には、読み取った結果の画素は
どの画素も平均色(Rm,Gm,Bm)に近づくため、
隣接画素のRGB輝度差は0に近づくようになる。
【0110】1つの読み込みメッシュM14内の具体的
なRGB輝度値(Rc,Gc,Bc)は、以下のように
なる。
【0111】 Rc=255−読み込みメッシュ面積中のシアンの面積
×255/読み込みメッシュ面積 Gc=255−読み込みメッシュ面積中のマゼンタの面
積×255/読み込みメッシュ面積 Bc=255−読み込みメッシュ面積中の黄色の面積×
255/読み込みメッシュ面積 読み込みメッシュM14の間隔sdを変えながら、RG
B輝度値(Rc,Gc,Bc)及び隣接画素とのRGB
それぞれの輝度差を求め、各RGB輝度値に対応した輝
度差の適当な値(例えば、最大値)を色差テーブルに記
録する。
【0112】この時、本来は、印刷モデルでは、印刷メ
ッシュの交点に描かれた塗りつぶし円はRGBが相互に
重なり合い、RGBの各輝度値によって相互に影響を及
ぼし合うため、RGBは独立とは言えないが、このスキ
ャナ読み込みモデルでは、単純化のために、RGBは相
互に独立であるという仮説を立てた。
【0113】従って、RGB輝度値、読み込み解像度、
及び隣接画素の輝度差の結果を、RGB独立のテーブル
に保存することができる。
【0114】図6は、Rのテーブルの例を示す図であ
る。
【0115】図6において、R輝度値を0〜255まで
変化させた場合のR輝度値のそれぞれについて、スキャ
ナ読み込み解像度を14〜35まで変化させた時の隣接
画素との輝度差の最大値が格納されている。
【0116】なお、フルエントリ色差テーブルの作成方
法は、0〜255の輝度値を擬似的に発生させ、それぞ
れの輝度値の時の隣接画素の輝度差の最大値を印刷モデ
ル上で求め、その値を色差テーブルに格納する。この処
理をRGBそれぞれの色要素について行う。
【0117】なお、図6の例では、Rのテーブルの場合
について示したが、G、Bのテーブルの構成も同様であ
る。
【0118】R,G,Bの色差テーブルが与えられる
と、このR,G,Bの色差テーブルを参照することによ
り、入力画像から同一色の範囲を検出する際のしきい値
を獲得することができる。
【0119】このように、0〜255の全ての輝度値の
エントリを持ったテーブルを予め作成しておくことによ
り、補完計算を省略することが可能となり、数十個の飛
び飛び輝度値のエントリしか持たない場合に比べて、パ
ラメータ推定処理や色ラベリング処理などの処理時間を
減らすことが可能となり、処理の高速化を図ることが可
能となる。
【0120】なお、数十個の飛び飛び輝度値のエントリ
しか持たない色差テーブルを用いる場合は、以下の補完
演算により隣接画素との輝度差の最大値を求めることが
できる。
【0121】色差テーブルに登録されている輝度値Ri
に対する隣接画素との輝度差の最大値がRdi、色差テ
ーブルに登録されている輝度値Ri+1に対する隣接画
素との輝度差の最大値がRdi+1であるとする。この
時、色差テーブルに登録されていない輝度値Rmが、輝
度値Riと輝度値Ri+1の間の線形補間で表されると
して、その関係を隣接画素との輝度値の最大値にも適応
して、推定される隣接画素との輝度値の最大値infe
red_deltaを求める。すなわち、 rl=Ri−Ri+1 rm=Rm−Ri rn=Ri+1−Rm infered_delta =Rdi*rn/rl+Rdi+1*rm/rl とする。
【0122】次に、画像入力処理を行う(ステップS
2)。
【0123】この画像入力処理では、CCDカメラやス
キャナなどの撮像装置でカラー画像を入力し、メモリに
保存する。
【0124】次に、フルカラー/その他判定処理を行う
(ステップS3)。
【0125】このフルカラー/その他判定処理では、入
力画像のヘッダに含まれている1画素当たりのビット数
を調べ、24ビット/画素の画像をフルカラー画像とみ
なし、図4のステップS4〜ステップS24の処理を行
う。1画素当たりのビット数が24ビットより小さい場
合には、フルカラー以外の入力画像とみなし、図4のス
テップS25、ステップS26及びステップS6〜ステ
ップS24の処理を行う。
【0126】次に、モデル解像度推定処理及び距離しき
い値獲得処理を行う(ステップS4)。
【0127】モデル解像度推定処理は、入力画像の解像
度が印刷モデルのどの読み込み解像度に適合しているか
を推定する。この処理では、入力画像をメッシュ状に分
割し、RGBの各色成分について、各メッシュ領域内に
おける隣接画素との輝度値の最大値と最も良く一致する
読み込み解像度を色差テーブルから求める。
【0128】また、距離しきい値獲得処理は、ラベリン
グで使用するしきい値を実際の入力画像の色差から求め
る。この処理では、入力画像をメッシュ状に分割し、各
メッシュ領域内における画素の色の分散を求めることに
より、均一色からなるメッシュ領域を抽出する。そし
て、均一色からなるメッシュ領域の画素の標準偏差に基
づいて、ラベリングで使用するしきい値を求める。
【0129】以下、モデル解像度推定処理について具体
的に説明する。
【0130】まず、入力画像をn×nのメッシュに区切
り、各メッシュ領域の中の各画素の(R,G,B)の値
を各色成分ごとに分解して考えるのではなく、(R,
G,B)の値をまとめて考えることにより、入力画像に
最も適合する印刷モデルの解像度を求めることを考え
る。この場合、入力画像の解像度を求めるには、印刷モ
デルとの適合具合があまりかけ離れていないメッシュ領
域から求めた解像度だけを対象に、それらの解像度を画
像全体で平均する。
【0131】しかし、この方法では、実際の入力画像が
印刷モデルと一致していない場合、読み込み解像度に誤
差が生じることがある。例えば、実際の入力画像は、Y
(イエロー)、M(マゼンタ)、C(シアン)、K(ブ
ラック)を使って印刷されることが多く、それぞれの色
のメッシュの角度(スクリン角度)、色の印刷の順番、
重ねて印刷された時の色が独立でないことによる影響、
メッシュの解像度、YMCの3色を使用するかYMCK
の4色を使用するかなどは、それぞれの印刷物ごとに異
なっている。一方、印刷モデルの色は、角度固定、色は
独立、YMCの3色、メッシュ解像度はある一定の範囲
という固定された条件で生成されている。このため、実
際の入力画像とのずれが生じ、それが読み込み解像度の
推定に影響するからである。
【0132】この結果、実際に正しいパターンが抽出さ
れる理想的な解像度値と多少ずれた解像度値が推定さ
れ、本来同一の色と見なされる領域で、解像度及び対象
となる色から決まる同色範囲が狭くなる。このため、同
色範囲が細切れの領域に分断され、本来同一のラベルが
付される文字パターンが、小さな細切れ領域に分割され
る現象が発生する。
【0133】そこで、本実施例では、推定解像度を全画
像から(R,G,B)の各成分ごとに独立に求め、各成
分ごとに独立に求めた推定解像度を後で平均化する。
【0134】図7は、本発明の一実施例に係わるモデル
解像度推定処理を説明する図である。
【0135】図7において、入力画像を各RGB成分ご
とに分解したR画像21、G画像23及びB画像25を
それぞれ3×3画素a〜iづつのメッシュ領域22、2
4、26に分割する。そして、各メッシュ領域22、2
4、26内の3×3画素a〜iの平均RGB輝度(R
m,Gm,Bm)及び隣接画素の輝度差の最大値(R
d,Gd,Bd)を、R画像21、G画像23及びB画
像25のそれぞれについて各メッシュ領域22、24、
26ごとに求める。ここで、3×3画素a〜iの隣接方
向は20通りあるので、これらの20通り隣接画素の輝
度差を求め、それらの輝度差のうち最大値(Rd,G
d,Bd)を採用する。
【0136】一方、Rテーブル27、Gテーブル28及
びBテーブル29には、各輝度値に対応する隣接画素と
の輝度差の最大値が解像度をパラメータとして登録され
ている。
【0137】そして、平均R輝度Rm及び隣接画素との
輝度差の最大値Rdをキー情報としてRテーブル27を
検索し、R画像21から求めた隣接画素との輝度差の最
大値RdとRテーブル27に登録されている隣接画素と
の輝度差の最大値との差diff_rを求める。このd
iff_rの算出を平均R輝度Rmについて登録されて
いる全ての解像度に対して行い、diff_rの値が最
小となる解像度resol_rをRテーブル27から求
める。
【0138】このresol_rの算出をR画像21の
全てのメッシュ領域22に対して行い、各メッシュ領域
22について求めた全てのresol_rの平均値me
an_resol_rを算出する。
【0139】また、平均G輝度Gm及び隣接画素との輝
度差の最大値Gdをキー情報としてGテーブル28を検
索し、G画像23から求めた隣接画素との輝度差の最大
値GdとGテーブル28に登録されている隣接画素との
輝度差の最大値との差diff_gを求める。このdi
ff_gの算出を平均G輝度Gmについて登録されてい
る全ての解像度に対して行い、diff_gの値が最小
となる解像度resol_gをGテーブル28から求め
る。
【0140】このresol_gの算出をG画像23の
全てのメッシュ領域24に対して行い、各メッシュ領域
24について求めた全てのresol_gの平均値me
an_resol_gを算出する。
【0141】また、平均B輝度Bm及び隣接画素との輝
度差の最大値Bdをキー情報としてBテーブル29を検
索し、B画像25から求めた隣接画素との輝度差の最大
値BdとBテーブル29に登録されている隣接画素との
輝度差の最大値との差diff_bを求める。このdi
ff_bの算出を平均B輝度Bmについて登録されてい
る全ての解像度に対して行い、diff_bの値が最小
となる解像度resol_bをBテーブル29から求め
る。
【0142】このresol_bの算出をB画像25の
全てのメッシュ領域26に対して行い、各メッシュ領域
26について求めた全てのresol_bの平均値me
an_resol_bを算出する。
【0143】mean_resol_r、mean_r
esol_g及びmean_resol_bが求まる
と、これらの値の平均値resolutionを求め、
このresolutionを入力画像の印刷モデルでの
読み込み解像度とする。
【0144】以下、数式を用いて説明する。入力画像を
3×3画素づつのメッシュ領域に分割した場合に、その
内部の平均RGB輝度を(Rm,Gm,Bm)、隣接画
素の輝度差の最大値を(Rd,Gd,Bd)とする。
【0145】以下、RGB独立の処理であるので、Rを
例にして説明する。
【0146】解像度値をある値に固定して、Rmからテ
ーブルを参照して、推定される隣接画素との輝度値の最
大値infered_deltaを求める。
【0147】この推定される隣接画素との輝度値の最大
値infered_deltaと実際に画像から求めた
Rdとの差diff_rを、 diff_r=|Rd−infered_delta| として求める。
【0148】解像度パラメータをスキャンして、このd
iff_rの値が最も小さくなる解像度resol_r
を求める。この解像度resol_rを入力画像中の各
メッシュ領域全体について算出し、解像度resol_
rの平均値mean_resol_rを求める。
【0149】これと同様の処理をG,Bでも行い、me
an_resol_g,mean_resol_bを求
める。そして、それらの値の平均値resolutio
nを、 resolution=(mean_resol_r+
mean_resol_g+mean_resol_
b)/3 として求め、この平均値resolutionを入力画
像の推定解像度として用いる。
【0150】次に、距離しきい値獲得処理について具体
的に説明する。
【0151】まず、背景と文字領域との色の境目がぼん
やりしている時でも、背景と文字領域との区別を正確に
行えるようにするため、同一ラベルの付されたラベル領
域(同色と判断された領域)の平均色を算出し、その平
均色とその周囲にある対象画素の色との色差が、そのラ
ベル領域の平均色から推定される許容色差の一定倍率の
色差以内にあれば、対象画素をそのラベル領域に組み込
むことを考える。
【0152】この手法によっても、背景と文字領域との
区別をある程度正確に行うことが可能である。
【0153】しかし、この手法では、ラベリングのしき
い値として、色差テーブルに登録されている値を多種多
様なカラー画像に対して一律に適用するため、灰色、中
間色などの特定の色が背景や文字色にあると、背景と文
字とが同じ領域と判断される場合があり、ラベリング対
象となるカラー画像によっては、背景色と文字色とを正
確に区別できない場合がある。
【0154】そこで、本実施例では、入力画像の局地的
な同色判定処理を導入し、入力画像の中から局所的に同
色領域(色の変化が無い部分)を求め、その局所領域か
ら色ラベリングで使用する距離値のしきい値を求める。
【0155】この手法により、背景と文字領域との色の
境目がぼんやりしている時でも、背景と文字領域との区
別を正確に行うことが可能となり、文字領域のみを背景
から精度良く切り離して、文字領域のみを正しく抽出す
ることができる。
【0156】具体的には、入力画像を3×3画素づつの
メッシュ領域に分割し、その内部の平均RGB輝度値
(Rm,Gm,Bm)と分散値(Rv,Gv,Bv)を
求める。そして、RGBの各分散値の2乗和のルート
を、 s=sqrt(Rv×Rv+Gv×Gv+Bv×Bv) として求め、この値sをメッシュ領域の分散値とする。
入力画像の各メッシュ領域ごとのsの値を求め、それを
記録する。また、sの値の最大値をsmaxとして記録
する。
【0157】ここで、メッシュ領域のsの値が、 smax×RANGE_LOW<s<smax×RAN
GE_HIGH かつ s>MIN_VARI (例えば、RANGE_LOW=0.004,RANG
E_HIGH=0.16,MIN_VALI=10とす
る。)の条件を満足する場合、このメッシュ領域をラベ
リングのしきい値を求めるための局所領域とする。
【0158】なお、sの値が小さい程、そのメッシュ領
域内の画素の色は互いに近くなるが、sの値の最も小さ
な領域は、同一色で塗られた背景領域に相当する場合が
多い。このため、sの値の最も小さな領域の色差に基づ
いてラベリングのしきい値を設定し、このしきい値を用
いて文字領域の抽出を行うと、しきい値が小さくなり過
ぎて、文字領域の抽出には適切でないことがある。従っ
て、しきい値の算出に用いるメッシュ領域のsの値に
は、下限が設けられている。
【0159】しきい値の算出に用いるメッシュ領域を入
力画像から求めると、このメッシュ領域のsの値のルー
トを標準偏差として求める。そして、対象メッシュ領域
ごとに求めた標準偏差をk(例えば、k=3.0)倍し
た後の平均値TH_distを以下の式で求め、この平
均値TH_distを距離のしきい値とする。
【0160】
【数1】
【0161】ここで、iは対象メッシュ領域の番号、n
は対象メッシュ領域の個数である。なお、距離しきい値
獲得処理においては、モデル解像度推定処理で使用した
メッシュと同一のメッシュを用いることにより、モデル
解像度推定処理で算出した平均RGB輝度値(Rm,G
m,Bm)を分散値(Rv,Gv,Bv)の算出に使用
することができ、処理を高速化することができる。
【0162】次に、色ラベリング処理を行う(ステップ
S5)。
【0163】この色ラベリング処理では、領域拡張法に
よりラベリングを行う。この領域拡張法は、隣接する画
素の色が近い時に、同一ラベルを与えることを繰り返す
ことにより、画像全体を同色領域で区分けしていく手法
である。領域拡張法は、同一ラベルを与えるかどうかの
判断の対象が注目画素の周辺の画素だけなので、色空間
をクラスタリングする場合に比べてを処理時間を短縮で
きる。
【0164】一方、領域拡張法では、隣接画素との色の
近さをどう定義するかによって、同色パターンに穴が空
いたり、輪郭が綺麗に抽出されたかったりする。また、
隣接画素との関係だけを見ているので、文字領域と背景
領域の境界で徐々に色が変化していく場合には、文字領
域が背景領域と同一ラベルになる場合がある。
【0165】このため、同一ラベルの付されたラベル領
域の平均色を算出し、その平均色とその周囲にある対象
画素の色との色差が、そのラベル領域の平均色から推定
される許容色差の一定倍率の色差以内にあれば、対象画
素をそのラベル領域に組み込むようにすることにより、
背景と文字領域との色の境目がぼんやりしている時で
も、背景と文字領域との区別をある程度は正確に行うこ
とができる。
【0166】しかし、この手法によっても、様々なカラ
ー文書画像には対応できず、灰色や中間色などの領域
で、かなりの頻度で背景と文字が同一ラベル化し、文字
パターンを正確に抽出できないことがあったり、抽出さ
れたラベル領域が文字パターンの中で小さく細切れ状態
となり、結果的に文字パターンを正確に抽出できないこ
とがあったりする。
【0167】そこで、本実施例では、領域拡張法による
ラベリングのしきい値として、ステップS4で求めたし
きい値を用いる。このステップS4で求めたしきい値
は、ラベリング対象となる入力画像の同色領域の実際の
色差に基づいて設定されており、多種多様なカラー文書
画像に対して最適な値を与えることができる。このた
め、印刷モデルなどを用いて求めたしきい値を多種多様
なカラー文書画像に対して一律に適用することなく、多
種多様なカラー文書画像の同一色の範囲を個別に考慮し
てラベリングを行うことが可能となり、同色領域の抽出
精度を向上させることができる。
【0168】図8は、本発明の一実施例に係わる色ラベ
リング処理を説明する図である。
【0169】図8において、画素a〜rからなる領域
(斜線部分)が同色パターン31として抽出され、画素
a〜rに同一ラベルが付されているものとする。ここ
で、例えば、ラベルが付されていない画素sが検出され
ると、画素sの周囲に既にラベル付けされている画素が
あるかどうかを調べる。そして、既にラベル付けされて
いる画素p、q、rが見つかると、画素rの色と画素
p、q、rのいずれかの色との差がしきい値以下である
かどうかを調べる。そして、例えば、画素sの色と画素
pの色との差がしきい値以下であると判断された場合、
画素pと同一ラベルが付されている画素a〜rの色の平
均色と画素sの色とを比較する。この結果、画素pと同
一ラベルが付されている画素a〜rの色の平均色と画素
sの色との差がしきい値以下であると判断された場合、
画素sに画素pと同一ラベルを付す。
【0170】ここで、ラベリングを行うしきい値を、色
差テーブルから求めるのではなく、例えば、画素c、
d、e、h、i、j、k、l、mからなる領域をメッシ
ュ領域として抽出し、このメッシュ領域内における画素
c、d、e、h、i、j、k、l、mの色の分散に基づ
いて求めることにより、ラベリングの精度を向上させる
ことができる。
【0171】具体的には、入力画像の左上からラスタス
キャンを行い、ラベル付けがされていない画素に注目す
る。この注目画素のRGB輝度値(R、G、B)と推定
解像度resolutionとを用いてテーブルを検索
することにより、隣接画素との輝度値の最大値をRGB
の色成分ごとに求める。隣接画素との輝度値の最大値が
求まると、この値をラベリングのしきい値(delat
_r,delta_g,delta_b)とする。
【0172】なお、上述した実施例では、R、G、Bの
各成分について、同一の解像度resolutionを
用いてテーブルを検索することにより、ラベリングのし
きい値(delat_r,delta_g,delta
_b)を求める場合について説明したが、R、G、Bの
各成分の解像度(mean_resol_r,mean
_resol_g,mean_resol_b)を個別
に用いて、Rテーブル、Gテーブル、Bテーブルをそれ
ぞれ検索することにより、ラベリングのしきい値(de
lat_r,delta_g,delta_b)を求め
るようにしてもよい。
【0173】次に、注目画素の周囲の8画素を走査し
て、その注目画素の周囲に既にラベル付けされた周囲画
素があり、その周囲画素のRGB輝度値(Rs,Gs,
Bs)が、 |R−Rs|<=delta_r かつ |G−Gs|<=delta_g かつ |B−Bs|<=delta_b の条件を満たす場合に、注目画素の色はその周囲画素の
色と近いと判断する。
【0174】周囲画素の色が注目画素の色と近い判断さ
れると、周囲画素のラベルをカレントラベル(regi
on)として保存し、注目画素のラベルとしてregi
onを与える。また、ラベル領域の平均色(Rm,G
m,Bm)として、周囲のラベル領域の平均色に注目画
素の色を加味した新たな平均色を求める。
【0175】それ以外の場合は、カレントラベルとし
て、今まで付けたラベル値+1のラベル値を設定し、注
目画素のラベルにもその値を付与する。この場合には、
ラベル領域の平均色(Rm,Gm,Bm)として、注目
画素のRGB値を設定する。
【0176】どちらの場合でも、注目画素の座標値を処
理対象座標配列に保存する。
【0177】次に、注目画素の周りに同色領域を拡張す
る処理を行う。処理対象座標配列の中から、先頭の座標
値を取り出し、その座標値の画素を注目画素とする。注
目画素のRGB輝度値からテーブルを検索し、RGB各
色成分の隣接画素との輝度値の差を推定しきい値(de
lta_r,delta_g,delta_b)とす
る。
【0178】注目画素の周囲の8画素を走査して、周囲
画素が未処理の場合、その周囲画素のRGB輝度値(R
i,Gi,Bi)を求め、注目画素のRGB輝度値(R
c,Gc,Bc)及びラベル領域の平均色(Rm,G
m,Bm)との輝度差をRGB各成分ごとに求める。
【0179】図9は、本発明の一実施例に係わる注目画
素の周囲の8画素を示す図である。図9において、注目
画素Cの周囲画素は8個あるので、隣接画素との輝度値
の差を求める場合、この8画素の走査を行う。
【0180】そして、周囲画素のRGB輝度値(Ri,
Gi,Bi)と注目画素のRGB輝度値(Rc,Gc,
Bc)との関係が、 |Ri−Rc|<=delta_r かつ |Gi−Gc|<=delta_g かつ |Bi−Bc|<=delta_b の条件を満たし、かつ、ラベル領域の平均色(Rm,G
m,Bm)と周囲画素のRGB輝度値(Ri,Gi,B
i)との色差の距離値が、 |Ri−Rm|+|Gi−Gm|+|Bi−Bm|<T
H_dist の条件を満たす場合、注目画素と同一ラベルを周囲画素
に付し、周囲画素の座標を処理対象座標配列に追加す
る。今処理した注目画素は、処理対象座標配列から削除
する。処理座標のx,yの最大値、最小値を求め、その
値をこのラベル領域の外接矩形として保存する。また、
このラベル領域の平均色を外接矩形の属性として保存す
る。
【0181】ここで、ラベル画像の平均色と周囲画素と
の色差を判定するしきい値として、TH_distを用
いる。これは、ラベル画像の平均色と周囲画素との色差
を判定するしきい値として、テーブルに登録されている
しきい値を用いると、テーブルに登録されているしきい
値は隣接画素との輝度差の最大値であるため、同色画素
の欠落を防止するのにはよいが、文字と背景との境界が
ぼんやりしていて、文字と背景との色差があまりない場
合には、背景が文字領域に取り込まれ、文字の境界をは
っきりと検出できなくなるからである。
【0182】一方、TH_distは、色がほぼ同一と
みなせる局所領域での色の実際の散らばり具合の平均に
基づいて設定されているので、実際の画像の均一色の範
囲を精度よく検出することが可能となり、文字と背景と
の境界がぼんやりしている場合においても、文字を表す
色からずれてくる背景の色を区別することが可能とな
る。
【0183】以上の処理を処理対象座標配列の内容がな
くなるまで続ける。
【0184】ラベリングの結果、同一色で連結している
領域には同じラベル値が付与され、同じラベルを持つ領
域を囲む外接矩形が獲得される。なお、ラベリング処理
の出力情報には、以下の内容が含まれる。
【0185】 ・ラベル画像:4バイト/1画素 ・外接矩形 矩形数:maxcount 矩形情報:lbtbl 内包するラベル画像のラベル番号:label 矩形左上座標:(xmin,ymin) 矩形右下座標:(xmax,ymax) 矩形内の代表色:(r,g,b) 所属するグループ番号:string_label 輪郭長:contour 次に、L字形、コ字形パターン削除処理を行う(ステッ
プS6)。
【0186】このL字形、コ字形パターン削除処理で
は、文字パターンの近くに存在し、かつ、その文字パタ
ーンと同色のL字形、コ字形のパターンを削除する。
【0187】これは、文字パターンの周囲に背景パター
ンがあると、背景パターンの一部がL字形またはコ字形
のパターンとして抽出されやすく、重なり矩形統合処理
でL字形またはコ字形のパターンが文字パターンと統合
されるためである。このような統合が行われると、以降
の処理でこれらのパターンは分離されることがなく、統
合されたままの状態で処理が行われるため、文字らしさ
の形状の特性を失い、処理途中で削除されるか、文字以
外のノイズパターンがのったまま文字として抽出され
る。従って、処理の早い段階でL字形またはコ字形のパ
ターンを削除し、このような不具合を防止する。
【0188】図10は、本発明の一実施例に係わるL字
形パターンが存在する場合の重なり統合結果を示す図で
ある。
【0189】図10(a)において、「文字」というパ
ターン42及びL字形のパターン43が抽出され、パタ
ーン42の外接矩形41及びパターン43の外接矩形4
4が生成されているものとする。ここで、外接矩形41
と外接矩形44との重なり矩形統合を行うと、図10
(b)に示すように、外接矩形45が生成される。外接
矩形45が生成されると、「文字」というパターン42
及びL字形のパターン43は、1つのパターンを構成す
るものとみなされ、「文字」というパターン42の大き
さや形状の特性が失われる。
【0190】このため、L字形のパターン43を削除す
ることにより、外接矩形41が外接矩形44と統合され
ることを防止し、「文字」というパターン42の大きさ
や形状を保ったまま、その後の処理を行うことができる
ようにする。
【0191】具体的には、矩形内のパターンの黒画素比
率(=パターンの画素数/矩形の面積)を求める。そし
て、以下の条件を満たすパターンをL字形またはコ字形
パターンとして削除する。
【0192】矩形の幅が幅しきい値以上、かつ矩形の高
さが高さしきい値以上、かつ黒画素比率が黒画素比率し
きい値未満 ここで、例えば、幅しきい値=100dot、高さしき
い値=100dot、黒画素比率しきい値=0.4に設
定する。
【0193】次に、注目矩形抽出処理を行う(ステップ
S7)。
【0194】この注目矩形抽出処理では、全ての色につ
いての外接矩形を対象にして、事前に決めた範囲内のサ
イズの外接矩形を注目矩形として抽出する。
【0195】具体的には、以下の条件を満たす外接矩形
を注目矩形として抽出する。
【0196】x方向長さが23dot(100dpi
時)以上で画像の幅の1/2以下 かつ y方向長さが23dot(100dpi時)以上で画像
の高さの1/2以下 この注目矩形抽出処理により、外接矩形同士をグルーピ
ングする際の基準となる外接矩形の大きさを限定するこ
とが可能となり、例えば、タイトル領域を抽出する場合
に、タイトルとなる文字の大きさに適合した外接矩形を
基準として、外接矩形同士をグルーピングすることが可
能となり、ノイズや背景などのタイトルには含まれない
外接矩形が基準とされて、グルーピング処理が行われる
ことを防止することが可能となることから、不要な処理
を省略して、処理速度を向上させることが可能となる。
【0197】次に、注目矩形の周りの探索範囲とそこに
かかる矩形抽出を行う(ステップS8)。
【0198】この探索範囲にかかる矩形抽出処理では、
注目矩形の周囲に、あるサイズの探索範囲を設定し、そ
の範囲にかかる矩形を抽出する。
【0199】図11は、本発明の一実施例に係わる注目
矩形の周囲の探索範囲の設定方法を説明する図である。
【0200】図11において、矩形番号1〜30の外接
矩形が抽出され、矩形番号1の外接矩形51を注目矩形
としたものとする。そして、この外接矩形51の周りに
探索範囲52が設定されたものとすると、外接矩形51
についてのグルーピングの処理対象として、探索範囲5
2にかかる矩形番号2〜24の外接矩形のみを選択し、
探索範囲52にかからない矩形番号25〜30の外接矩
形については、外接矩形51のグルーピングの処理対象
から除く。
【0201】このように、外接矩形同士をグルーピング
する際に、外接矩形の探索範囲を注目矩形の周りに限定
することにより、所定の範囲内にまとまって存在してい
る文字列のみを抽出することが可能となり、例えば、タ
イトル領域を抽出する場合に、タイトルには含まれない
ような離れた位置に存在する文字を考慮する必要がなく
なることから、タイトル領域の抽出を効率的に行うこと
が可能となる。
【0202】具体的には、探索範囲52は、注目矩形5
1の縦横の長さの内、長い方をlenとすると、len
と100dpiの35dotとの小さい方を注目矩形の
周囲の探索範囲長range_sizeとする。
【0203】注目矩形の周囲range_sizeの範
囲にかかる外接矩形を高速に求めるため、以下の方法を
用いる。
【0204】図12は、本発明の一実施例に係わる注目
矩形の周囲の探索範囲にかかる矩形の抽出方法を説明す
る図である。
【0205】図12において、矩形番号1〜4の外接矩
形61〜64が抽出されたものとすると、XYの各座標
値に存在する矩形番号及び矩形数を求め、これらの矩形
番号及び矩形数をXYの各座標値ごとに登録する。
【0206】例えば、X座標値1〜4の位置には外接矩
形61〜64が存在しないので、矩形数n=0、矩形番
号=空が登録され、X座標値5〜13の位置には矩形番
号4の外接矩形64が存在しているので、矩形数n=
1、矩形番号=4が登録され、X座標値14の位置には
矩形番号3の外接矩形63及び矩形番号4の外接矩形6
4が存在しているので、矩形数n=2、矩形番号=3、
4が登録され、X座標値15、16の位置には矩形番号
4の外接矩形64が存在しているので、矩形数n=1、
矩形番号=4が登録される。以下、同様である。
【0207】次に、矩形番号3の外接矩形63を注目矩
形とし、この外接矩形63の周りに探索範囲65が設定
されたものとすると、この探索範囲65に含まれるXY
の各座標値を求める。そして、XYの各座標値の矩形番
号をXYそれぞれについて求め、XYの両方に含まれる
矩形番号を探索範囲65にかかる外接矩形とする。例え
ば、探索範囲165のX座標に含まれる外接矩形の矩形
番号は1〜4、探索範囲65のY座標に含まれる外接矩
形の矩形番号は2〜4であるので、XYの両方に含まれ
る矩形番号は2〜4となる。この結果、探索範囲65に
かかる外接矩形として、矩形番号2〜4に対応する外接
矩形62〜64が得られる。
【0208】具体的には、以下のa)〜d)の処理を行
う。
【0209】a)画像全体のX,Y軸へ矩形番号を投影
する。すなわち、画像全体のX,Y軸の1画素毎に、そ
れに属する矩形数と矩形番号の集合を登録する。例え
ば、矩形番号iがX軸の(x1,x2)の範囲にあると
すれば、X軸のx1からx2の座標には、番号iが矩形
番号の集合に入ることになる。同じことを全矩形につい
て縦横座標について行う。
【0210】b)注目矩形の周囲にrange_siz
eの範囲を設定する。
【0211】c)range_sizeの範囲のX軸の
座標毎の矩形種類を論理ORして矩形番号の集合を抽出
する。
【0212】同様にY軸でも抽出する。
【0213】d)X軸から求めた矩形番号の集合とY軸
から求めた矩形番号の集合とを論理ANDし、この注目
矩形の周囲にある矩形集合を決定する。
【0214】なお、図12の矩形番号の格納方法では、
画像全体に存在する全ての矩形番号を格納する容量が各
座標値ごとに必要となり、記憶容量が大きくなる。
【0215】そこで、上述した座標毎の矩形数及び矩形
番号を高速に、かつ必要メモリを最小に求めるために、
以下のような方式をとる。
【0216】図13は、本発明の一実施例に係わる注目
矩形の周囲の探索範囲にかかる矩形情報の格納方法を説
明する図である。
【0217】図13(a)において、矩形番号1、2の
外接矩形71、72が抽出されたものとし、外接矩形7
1はX座標が155〜165の範囲内にあり、外接矩形
72はX座標が160〜163の範囲内にあるものとす
る。このため、図13(b)に示すように、外接矩形7
1については、X座標が155〜165の位置に矩形番
号1が登録され、外接矩形72については、X座標が1
60〜163の位置に矩形番号2が登録される。
【0218】次に、図13(c)に示すように、抽出さ
れた矩形番号1、2を、X座標155〜165の順序で
矩形番号1、2順に並べ換え、X座標値が同じ値を示す
矩形番号が幾つあるかを数えることにより、各座標値の
矩形数を求めることができる。
【0219】具体的には、以下のi)〜v)の処理を行
う。
【0220】i)全ての矩形の横幅を合計して、その長
さの数だけ矩形番号、座標の情報を持ったデータ構造を
用意する。
【0221】ii)矩形の座標と矩形番号を用意された
データ構造のデータにセットする。
【0222】iii)このデータ構造のデータを座標値
でソートする。
【0223】iv)データの座標値を順に見ていき、座
標値が同じものの数を座標値毎に数え、それをその座標
に属する矩形数とする。また、その座標毎の矩形数分だ
け矩形番号を入れる記録領域を確保する。ソートしたデ
ータ構造を先頭からスキャンしていき、座標が同じ間は
数をカウントしていき、座標値が変わったところで数を
確定させ、それを保存する。
【0224】v)ソートしたデータ構造で、座標値が同
じ物の矩形番号を上で確保した領域に格納する。これも
ソートしたデータ構造を先頭からスキャンしていき、座
標が同じ間は、矩形番号を格納領域にセットする。
【0225】次に、同色グループ抽出処理を行う(ステ
ップS9)。
【0226】この同色グループ抽出処理は、異なるラベ
ルが付されているパターンのうち、類似色のパターン同
士を1つのグループにまとめるものである。なお、この
処理を用いてタイトルを抽出する場合には、タイトルを
構成する個々の文字が同じ色であることが前提となる。
【0227】まず、1つの矩形の色(なお、矩形の色と
は、その矩形により囲まれるパターンの色。以下同様)
とその周囲にある矩形の色とが近い時に、それらの矩形
を同一グループに入れることを考える。
【0228】しかし、この方法では、矩形の色が徐々に
変化すると、実際には同色でない矩形までも同一のグル
ープに入れられることになる。
【0229】そこで、1つの矩形の色とその周囲にある
矩形の色とを比較することに加え、その矩形が属するグ
ループの色との比較も行い、グループに追加しようとし
ている矩形の色が、グループの色とそれほどかけ離れて
いない場合のみ、その矩形をグループに加えることとし
た。なお、グループの色は、例えば、そのグループに属
する矩形の色の平均値とすることができる。
【0230】図14は、本発明の一実施例に係わる同色
グループの生成方法を示す図である。
【0231】図14(a)において、外接矩形81〜8
3が生成されているものとし、外接矩形81〜83内の
パターンの色が徐々に変化しているものとする。また、
外接矩形81、82内のパターンは文字であるが、外接
矩形83内のパターンは背景の一部であるものとする。
【0232】外接矩形81〜83についてのグルーピン
グを行う場合、まず、外接矩形81の周囲に探索領域8
4を設定し、この探索領域84にかかる外接矩形82を
抽出する。この外接矩形82が抽出されると、外接矩形
81内のパターンの色と外接矩形82内のパターンの色
との間での色空間上の距離distを求める。そして、
距離distが所定値以下の場合、外接矩形81と外接
矩形82とは、図14(b)に示すように、同一のグル
ープ85に分類される。
【0233】次に、外接矩形82の周囲に探索領域86
を設定し、この探索領域86にかかる外接矩形83を抽
出する。この外接矩形83が抽出されると、外接矩形8
2内のパターンの色と外接矩形83内のパターンの色と
の間での色空間上の距離distを求め、距離dist
が所定値以下かどうかを判断する。
【0234】ここで、距離distが所定値以下の場合
に、外接矩形83を外接矩形82と同一のグループ85
に分類すると、文字のグループに背景のパターンが混在
することになる。
【0235】そこで、外接矩形81内のパターンの色と
外接矩形82内のパターンの色との平均値をグループ8
5の色として求め、グループ85の色と外接矩形83内
のパターンの色との間での色空間上の距離dist2を
求める。そして、距離dist2が所定値以下の場合、
外接矩形83を外接矩形82と同一のグループ85に分
類するようにする。
【0236】ここで、外接矩形81〜83内のパターン
の色が徐々に変化している場合、外接矩形82内のパタ
ーンの色と外接矩形83内のパターンの色との間での色
空間上の距離distが近くても、外接矩形81内のパ
ターンの色と外接矩形83内のパターンの色との間での
色空間上の距離は遠くなる。
【0237】この結果、距離dist2は距離dist
より大きくなり、外接矩形83内のパターンの色がグル
ープ85の色と離れていると判断することが可能とな
り、外接矩形83がグループ85に分類されることを防
止することが可能となる。
【0238】具体的には、1つの注目矩形の色(Rc,
Gc,Bc)とその周囲矩形の集合の中の1つの矩形i
の色(Ri,Gi,Bi)との間でのRGB空間上の距
離を以下のように定義する。
【0239】dist=|Rc−Ri|+|Gc−Gi
|+Bc−Bi| また、注目矩形の色(Rc,Gc,Bc)と解像度re
solutionから求められるRGBの各輝度差を、
delta_r,delta_g,delta_bとす
る。
【0240】また、注目矩形が属する既に抽出されてい
るグループの色を(Rg,Gg,Bg)とする。ここ
で、グループの色は、そのグループに属する矩形内のパ
ターンの色の平均色とする。なお、最初は、矩形の色は
グループの色と同じである。
【0241】この時、グループの色(Rg,Gg,B
g)と周囲の矩形iが属するグループの色(Rig,G
ig,Big)との色差の距離dist2を以下のよう
に定義する。
【0242】dist2=|Rg−Rig|+|Gg−
Gig|+|Bg−Big| 注目矩形(Rc,Gc,Bc)とその周囲矩形の集合の
中の1つの矩形i(Ri,Gi,Bi)が以下の条件を
満足する時、これらの2つの矩形は、注目矩形のグルー
プに属すると判定して、周囲矩形iをそのグループに格
納する。また、新たにグループに加わった矩形の矩形番
号を新規追加矩形領域に格納する。
【0243】 (dist<TH_RGB または (|Rc−Ri|<delta_r かつ |Gc−Gi|<delta_g かつ |Bc−Bi|<delta_b)) かつ dist2<thr_rgb ここで、 thr_rgb =(min(Rgから求めた輝度差、Rigから求めた輝度差) +min(Ggから求めた輝度差,Gigから求めた輝度差) +min(Bgから求めた輝度差,Bigから求めた輝度差))/2 とする。また、例えば、TH_RGB=20とする。
【0244】新規追加矩形領域の先頭の矩形番号を取り
出し、それを新たな注目矩形として、その周囲にある矩
形を計算し、上記の手順を繰り返して、グループに属す
る矩形を求める。この手順をグループに新たに加わる矩
形が無くなるまで繰り返す。なお、抽出するグループ情
報のデータ構造は以下のようになる。
【0245】グループ内の矩形数:num グループを構成する矩形番号:child 重なり矩形統合後の矩形数:overlap_num 重なり矩形統合後の矩形情報:overlap(データ
タイプは、矩形情報1btbl型) グループ内文字列の方向コード:orient グループ内の文字列数:gyou_num グループ内の文字列情報:gyou (データタイプは、矩形情報1btbl型) 次に、グループ内平均文字線太さ抽出処理を行う(ステ
ップS11)。
【0246】このグループ内平均文字線太さ抽出処理で
は、グループ内の外接矩形に対応するラベル画像のパタ
ーンに対して、輪郭追跡処理を行い、輪郭長を求める。
すなわち、グループに属する1つの外接矩形の矩形範囲
内で、その外接矩形のラベル番号に注目して、ラベル画
像上で輪郭追跡処理を行う。抽出した輪郭の長さが抽出
されると、輪郭の長さをその矩形の輪郭長の属性にセッ
トする。そして、その矩形内のパターンの面積を輪郭長
で割って、文字の線の平均的な太さを求め、その値を矩
形の属性として矩形情報に登録する。
【0247】図15は、本発明の一実施例に係わる文字
線の太さの算出方法を説明する図である。
【0248】図15(a)において、例えば、「フ」と
いうパターンが抽出されたものとすると、「フ」という
パターンに含まれる画素数を数えることにより、「フ」
というパターンの面積Sを算出する。
【0249】次に、図15(b)に示すように、「フ」
というパターンの輪郭を抽出し、この輪郭長Lを算出す
る。そして、「フ」というパターンの面積Sを輪郭長L
で割って、「フ」というパターンの平均的な太さWを求
める。
【0250】輪郭長獲得処理として、輪郭を構成する画
素の周囲の8つの画素のラベル値を時計回りの順番で調
べ、そのラベル値が輪郭を構成する画素のラベル値と一
致する画素を輪郭として抽出する方法がある。
【0251】しかし、この手法では、文字パターンだけ
なら高速であるが、背景から抽出された複雑な形状のパ
ターンについてはかなり処理時間がかかる。これは、輪
郭追跡手法自体がラベル画像の輪郭の1つ外側をチェッ
クする必要があり、ある輪郭点から次の輪郭点を探すた
めに、既に走査した画素についても何回もチェックしに
いく処理が必要となるからである。
【0252】そこで、本実施例では、1つのラベル画像
のエッジに注目して、ラベル画像の外接矩形の内部をラ
スタスキャンし、特定のラベル値以外から特定のラベル
値に変化する点をカウントするようにした。このことに
より、ラベル画像の外接矩形内の1回のラスタスキャン
の間に、ラベル画像のパターンの輪郭長を獲得すること
が可能となり、輪郭長獲得処理にかかる時間を従来の方
法に比べて5倍程度高速化することが可能となる。
【0253】図16は、本発明の一実施例に係わる輪郭
長獲得処理を示すフローチャートである。なお、処理対
象となるラベル画像のラベル値をregion、そのラ
ベル値のパターンの外接矩形の座標を(xmin,ym
in)−(xmax,ymax)、輪郭長をcoun
t、ラベル画像の画素がエッジかどうかを示すフラグを
flag(1画素前がregionの値の画素の場合、
1に設定される)、縦方向の太さが1画素のパターンを
検出するフラグをfirst_flag(横方向に1画
素幅の場合、1に設定される)とする。
【0254】図16において、まず、初期設定を行い
(ステップS31〜S34)、count=0、y=y
min、flag=0、first_flag=0、x
=xminとする。
【0255】次に、flag>0かどうかを判断し(ス
テップS35)、flag>0でない場合、カレント画
素のラベル値がregionかどうかを判断する(ステ
ップS46)。ここで、カレント画素のラベル値がre
gionでない場合、x<xmaxかどうかを判断し
(ステップS48)、x<xmaxである場合、xをイ
ンクリメントして、ステップS35に戻る。
【0256】一方、ステップS46において、カレント
画素のラベル値がregionである場合、そのカレン
ト画素は輪郭を構成するので、countをインクリメ
ントするとともに、flag=1、first_fla
g=1に設定して、ステップS48に進む(ステップS
47)。
【0257】一方、ステップS35において、flag
>0である場合、カレント画素(x、y)のラベル値が
regionかどうかを判断し(ステップS36)、カ
レント画素のラベル値がregionである場合、yが
yminまたはymaxかどうかを判断する(ステップ
S37)。ここで、yがyminまたはymaxである
場合、countをインクリメントする(ステップS3
9)。
【0258】また、ステップS37において、yがym
inでも、ymaxでもない場合、カレント画素の上か
下の画素のラベル値がregionかどうかを判断し
(ステップS38)、カレント画素の上か下の画素のラ
ベル値がregionでない場合にのみ、countを
インクリメントする(ステップS39)。
【0259】一方、ステップS36において、カレント
画素のラベル値がregionでない場合、yがymi
nまたはymaxかどうかを判断し(ステップS4
0)、yがyminまたはymaxである場合、fla
g=0とする(ステップS44)。
【0260】一方、ステップS40において、yがym
inでも、ymaxでもない場合、カレント画素の左の
画素の上の画素及び下の画素のラベル値がregion
であり(ステップS41)、かつ、first_fla
gが0である場合にのみ(ステップS42)、coun
tをインクリメントし(ステップS43)、それ以外の
場合はステップS44に進む。
【0261】次に、first_flag=0に設定し
(ステップS45)、以上の処理をxがxmaxに達す
るまで、xを1ずつインクリメントさせながら繰り返
す。
【0262】そして、xがxmaxに達すると、fla
g>0かどうかを判断し(ステップS50)、flag
>0でない場合、y<ymaxかどうかを判断する(ス
テップS55)。ここで、y<ymaxである場合、y
をインクリメントして、ステップS33に戻る。
【0263】一方、ステップS50において、flag
>0である場合、yがyminまたはymaxかどうか
を判断し(ステップS51)、yがyminまたはym
axである場合、ステップS55に進む。
【0264】一方、ステップS51において、yがym
inでも、ymaxでもない場合、カレント画素の左の
画素の上の画素及び下の画素のラベル値がregion
であり(ステップS52)、かつ、first_fla
gが0である場合にのみ(ステップS53)、coun
tをインクリメントし(ステップS54)、それ以外の
場合はステップS55に進む。
【0265】以上の処理をyがymaxに達するまで、
yを1ずつインクリメントさせながら繰り返し、yがy
maxに達すると、countをラベル値がregio
nのラベル画像の輪郭長として出力する。
【0266】なお、上述した実施例では、外接矩形内を
横方向(x方向)にラスタスキャンすることにより、輪
郭長を求める場合について説明したが、外接矩形内を縦
方向(y方向)にラスタスキャンして、輪郭長を求める
ようにしてもよい。
【0267】図17は、本発明の一実施例に係わる輪郭
長獲得方法を説明するためのパターンの具体例を示す図
である。
【0268】図17において、同一のラベル値を有する
ラベル画像88(斜線部分)が抽出され、そのラベル画
像88の外接矩形87が生成されているものとする。こ
の外接矩形の座標が(xmin,ymin)−(xma
x,ymax)で表されているものとすると、この外接
矩形の範囲内を(xmin,ymin)の座標に位置す
る画素から1ラインずつx方向にスキャンする。
【0269】ここで、図16のステップS46からステ
ップS47に進む過程でAの画素がカウントされ、ステ
ップS37からステップS39に進む過程でBの画素が
カウントされ、ステップS38からステップS39に進
む過程でCの画素がカウントされ、ステップS42から
ステップS43に進む過程でDの画素がカウントされ、
ステップS53からステップS54に進む過程でEの画
素がカウントされる。この結果、外接矩形87の範囲内
を1回だけスキャンすることにより、ラベル画像88の
輪郭を求めることが可能となり、輪郭長獲得処理の高速
化を図ることが可能となる。
【0270】次に、文字線太さによる再グループ化処理
を行う(ステップS11)。
【0271】この再グループ化処理では、グループ内の
外接矩形を対象に、外接矩形の平均文字線太さを用いて
グループ化を行い、新たなグループ情報を構築する。す
なわち、グループ内の外接矩形を対象にして、図4のス
テップS7〜S9の処理を繰り返す。ここで、ステップ
S9のグループ化の時に、ステップS9で使用した色情
報だけでなく、推定文字線太さ(=20×矩形内のパタ
ーン面積/パターンの輪郭長)も使用する。
【0272】図18は、本発明の一実施例に係わる文字
線の太さによる再グルーピング処理を説明する図であ
る。
【0273】図18において、「グループ1」という文
字列と「グループ2」という文字列が同一色で記述さ
れ、互いに近接して配置されているため、「グループ
1」という文字列と「グループ2」という文字列が同一
のグループ91にグルーピングされているものとする。
【0274】ここで、「グループ1」という文字列に含
まれる文字の太さと「グループ2」という文字列に含ま
れる文字の太さを算出し、異なる太さの文字を別々のグ
ループに分割する。この結果、「グループ1」という文
字列はグループ92にグルーピングされ、「グループ
2」という文字列はグループ93にグルーピングされ
る。
【0275】この処理により、文字パターンの近くにそ
の文字パターンの色と同一の背景パターンがあり、これ
らの背景パターンと文字パターンが同じグループに属し
ていたものを、別々のグループにしたり、文字パターン
だけからなるグループでも、フォントやサイズが異なる
ものを別々のグループにしたりすることができる。
【0276】具体的には、2つの外接矩形のうち、第1
の外接矩形の推定文字線太さthick1及び第2の外
接矩形の推定文字線太さthick2から、文字線太さ
の比thick_rateを以下のように求める。
【0277】thick_rate=max(thic
k1,thick2)/min(thick1,thi
ck2) そして、以下の条件を満足した時に、2つの外接矩形を
同じグループとして記録する。
【0278】 thick_rate<TH_THICK_RATE かつ (dist<TH_RGB または (|Rc−Ri|<delta_r かつ |Gc−Gi|<delta_g かつ |Bc−Bi|<delta_b)) ただし、TH_THICK_RATEは、例えば、2.
5とする。
【0279】この処理を元のグループ内全ての外接矩形
について行い、グループ内の新たなグルーピングを行
う。この際、1つのグループの中に1つの矩形しか属し
ていないグループは、タイトルを構成しないものとして
削除される。
【0280】また、文字線太さによる再グルーピングの
他の例として、グループ内の文字線太さの頻度分布を作
成し、その文字線太さをクラスタリングすることによ
り、文字線太さのクラスタを複数個生成する方法でもよ
い。複数のクラスタを生成する方法として、文字線太さ
の頻度分布の谷で複数のクラスタに分割する方法や、階
層的クラスタリングを適用する方法などを用いることが
できる。
【0281】具体的には、2つの外接矩形のうち、第1
の外接矩形の推定文字線太さをthick1、第2の外
接矩形の推定文字線太さをthick2とすると、以下
の条件を満足した時にこれらの2つの外接矩形を同じグ
ループとする。
【0282】thick1とthick2とが同一の文
字線太さのクラスタに所属し、かつ (dist < TH_RGB または (|Rc−Ri|<delta_r かつ |Gc−Gi|<delta_g かつ |Bc−Bi|<delta_b)) この処理を元のグループ内全ての矩形について行い、グ
ループ内の新たなグルーピングを行う。
【0283】次に、グループ内の大きな矩形削除処理を
行う(ステップS12)。
【0284】このグループ内の大きな矩形削除処理で
は、グループ内で平均的な矩形サイズを求め、そのサイ
ズを基準に極端に大きなサイズの矩形を背景などのノイ
ズとして削除する。
【0285】図19は、本発明の一実施例に係わるグル
ープ内の大きな矩形削除処理を説明する図である。
【0286】図19(a)において、外接矩形102〜
111がグループ101にグルーピングされているもの
とすると、グループ101内の各外接矩形102〜11
1の大きさを求める。ここで、外接矩形102の大きさ
が他の外接矩形103〜111の大きさに比べ、かけ離
れているものとすると、図19(b)に示すように、グ
ループ101から外接矩形102を削除し、外接矩形1
03〜111よりなるグループ112を生成する。
【0287】具体的には、以下のa)〜d)の処理を行
う。
【0288】a)グループ内の外接矩形の高さのヒスト
グラムを作成して、最大頻度値を示す矩形高さfreq
_heightを以下の方法で求める。
【0289】i)ヒストグラムにぼかし用のウィンドウ
を用いてコンボリューション演算(移動和)を行い、ヒ
ストグラムをぼかす。具体的なぼかし用ウィンドウは、
例えば、「11111」の5画素からなる。
【0290】ii)最小高さ値(具体的には、100d
piで23dot)を予め決めておき、その最小高さ値
以上で最大頻度を示す矩形高さfreq_height
を求める。
【0291】b)最大頻度値を示す矩形高さfreq_
heightが最小高さ値(具体的には、100dpi
で23dot)より小さい時は、最小高さ値を最大頻度
値を示す矩形高さfreq_heightとする。
【0292】c)大きな矩形と判定するしきい値th_
largeを、例えば、th_large=freq_
height*10とする。
【0293】d)グループ内の外接矩形で縦横サイズと
も、th_largeより小さいものだけを残して、後
はノイズとしてそのグループから削除する。
【0294】次に、グループ内の重なり矩形統合処理を
行う(ステップS13)。
【0295】このグループ内の重なり矩形統合処理で
は、グループ内の外接矩形の中で重なりがある外接矩形
について、それらの外接矩形を囲む矩形を新たに作り、
グループ情報に新たに登録する。
【0296】すなわち、グループ内の外接矩形のうち、
一部でも重なりがある外接矩形同士を統合して、それら
を囲む外接矩形にする。
【0297】図20は、本発明の一実施例に係わるグル
ープ内の重なり矩形統合処理を説明する図である。
【0298】図20(a)において、外接矩形131は
外接矩形132と重なっており、外接矩形132は外接
矩形133と部分的に重なっている。この場合、外接矩
形131〜133を統合し、外接矩形134を生成す
る。
【0299】この処理により、例えば、「画」や「関」
などのように、1つの文字が互いに分離した複数のスト
ロークからなる場合に、これらの複数のストロークから
なる1つの文字を一体的に取り扱うことができ、その後
の処理を効率的に行うことが可能となる。
【0300】また、重なり矩形統合処理を同一グループ
に属するパターンの中で行うことにより、文字領域に背
景ノイズが混在している場合においても、文字と背景ノ
イズとが統合されることを防止でき、文字の抽出精度を
向上させることが可能となる。
【0301】次に、グループ内文字列抽出処理を行う
(ステップS14)。
【0302】このグループ内文字列抽出処理では、グル
ープ内で文字列方向を推定し、その方向に対して、文字
列を抽出する。抽出した文字列の方向及び座標などの情
報はグループごとに保存する。なお、この処理をタイト
ルの抽出に用いる場合には、1つのタイトルを構成する
個々の文字は、横方向または縦方向に一列に並んでいる
ことが前提になる。
【0303】図21は、本発明の一実施例に係わるグル
ープ内文字列抽出処理を説明する図である。
【0304】図21(a)において、矩形番号1〜29
の外接矩形がグループ141にグルーピングされている
ものとすると、最も左にある矩形番号1の外接矩形か
ら、右方向に矩形番号1の外接矩形と隣接する外接矩形
があるかどうかを探す。そして、矩形番号1の外接矩形
と隣接する外接矩形として、矩形番号2の外接矩形が見
つかると、見つかった外接矩形に矩形番号1を伝番し、
見つかった外接矩形の矩形番号2を矩形番号1に変更す
る。同様にして、右方向に隣接する外接矩形があるかど
うかを探し、隣接する外接矩形が見つかると、左に隣接
する外接矩形の矩形番号を右の外接矩形に伝番する。
【0305】矩形番号1の外接矩形から右方向に隣接す
る外接矩形がなくなると、矩形番号15の外接矩形か
ら、右方向に矩形番号15の外接矩形と隣接する外接矩
形があるかどうかを探す。矩形番号15の外接矩形と隣
接する外接矩形が見つかると、見つかった外接矩形に矩
形番号15を伝番する。
【0306】以上の処理により、図21(b)に示すよ
うに、矩形番号1の外接矩形に右方向に隣接する外接矩
形に矩形番号1が付され、矩形番号15の外接矩形に右
方向に隣接する外接矩形に矩形番号15が付される。矩
形番号の伝番処理が終了すると、同一の矩形番号1が付
された外接矩形を囲む外接矩形142を生成し、同一の
矩形番号15が付された外接矩形を囲む外接矩形143
を生成する。
【0307】具体的には、以下のa)〜e)の処理を行
う。
【0308】a)グループ内の外接矩形の座標から文字
列方向を推定する。
【0309】b)外接矩形の上下左右の最も近くにある
矩形の内向き、外向きの両方向の隣接関係を求める。
【0310】c)横方向の文字列の場合、左からの隣接
関係のない矩形を開始矩形として、右に矩形がなくなる
まで、開始矩形番号を右にある矩形に伝搬していく。縦
方向も同様である。
【0311】d)左からの隣接関係がなく、左への隣接
関係がある矩形は、左の矩形番号を獲得して、それを右
へ伝搬し、隣接関係がなくなるまで繰り返す。
【0312】e)ここまでの処理をグループ内全ての矩
形について行った後に、同じ矩形番号が付いている矩形
を求め、同じ矩形番号が付いている矩形の外接矩形を文
字列矩形として抽出する。
【0313】次に、文字列内分離文字統合処理を行う
(ステップS15)。
【0314】この文字列内分離文字統合処理では、横書
きの上下分離文字統合処理(縦書きでは、左右分離文字
統合処理)を文字列矩形に適応して、分離矩形を統合し
た外接矩形に置き換える。ここでは、抽出された文字列
内の矩形に対して文字列方向と直角の方向に矩形統合を
行う。これは横書きの文字列ならば、例えば「こ」とい
う文字の上ストロークと下ストロークをそれぞれ囲む矩
形をまとめて、1つの矩形とする処理である。また、縦
書きの文字列ならば、例えば「い」という文字の右スト
ロークと左ストロークをそれぞれ囲む矩形をまとめて、
1つの矩形とする処理である。
【0315】図22は、本発明の一実施例に係わる文字
列内分離文字統合処理を説明する図である。
【0316】図22(a)において、グループ141内
で互いに横方向に隣接する外接矩形を囲む外接矩形14
2、143が生成され、外接矩形142内には、縦方向
に互いに隣接する外接矩形144、145及び縦方向に
互いに隣接する外接矩形146、147が存在し、外接
矩形143内には、縦方向に互いに隣接する外接矩形1
48、149及び縦方向に互いに隣接する外接矩形15
0、151が存在しているものとする。
【0317】この場合、図22(b)に示すように、外
接矩形144、145を囲む外接矩形152を生成し
て、外接矩形144、145を統合し、外接矩形14
6、147を囲む外接矩形153を生成して、外接矩形
146、147を統合し、外接矩形148、149を囲
む外接矩形154を生成して、外接矩形148、149
を統合し、外接矩形150、151を囲む外接矩形15
5を生成して、外接矩形150、151を統合する。
【0318】具体的には、以下のa)〜c)の処理を行
う。なお、以下の例では、横文字列の場合について説明
するが、縦文字列の場合についても同様である。
【0319】a)文字列内矩形をx座標で昇順にソート
する。
【0320】b)最初の矩形をカレント矩形として、そ
れ以降の次の矩形がカレント矩形のx座標の範囲に重な
る場合は統合し、カレント矩形のx座標の範囲も統合結
果のものに変更する。この処理を統合する矩形がなくな
るまで繰り返す。統合する矩形がなくなったら、分離統
合後の矩形として保存する。
【0321】c)統合する矩形が無くなったら、次の矩
形を新たなカレント矩形として、b)及びc)の処理を
繰り返す。
【0322】次に、グループ内の文字列サイズによる再
グループ化を行う(ステップS16)。
【0323】グループ内の文字列サイズによる再グルー
プ化処理では、グループ内の文字列情報から文字列方向
に直角のサイズに注目して、その大きさで再グループ化
を行い、その結果を新たなグループ情報に格納する。
【0324】このことにより、同色グループ内で、文字
サイズが異なる文字列を別グループにすることができ、
同時にノイズと文字列の別グループ化も可能となる。
【0325】なお、この処理をタイトルの抽出に用いる
場合には、1つのタイトルを構成する個々の文字の大き
さが揃っていることが前提になる。
【0326】図23は、本発明の一実施例に係わるグル
ープ内の文字列サイズによる再グループ化処理を説明す
る図である。
【0327】図23(a)において、グループ141内
で互いに横方向に隣接する外接矩形を囲む外接矩形14
2、143が生成されているものとすると、外接矩形1
42の高さH1及び外接矩形143の高さH2を算出す
る。そして、外接矩形142の高さH1と外接矩形14
3の高さH2の差がしきい値より大きい場合は、外接矩
形142と外接矩形143とを別々のグループにする。
【0328】具体的には、以下の条件を満たす時に、こ
れらの2つの文字列矩形は、同じグループに属するもの
として、同じグループ番号を与える。
【0329】2つの文字列矩形の高さ(横書きの場合。
縦書きなら幅)の差がしきい値より小さい、かつ、(2
つの文字列矩形が重複する、または、2つの文字列矩形
間の距離がしきい値より小さい) この処理を全てのグループで行う。
【0330】次に、グループ内で同じグループ番号の文
字列を1つのグループとする新たなグループを作成す
る。この処理は、図3のステップS9で同じグループに
なった文字サイズの異なる文字列を、別々のグループに
する働きがある。
【0331】次に、グループ内の大きな矩形削除処理を
行う(ステップS17)。
【0332】このグループ内の大きな矩形削除処理で
は、ノイズ除去のため、グループ内で平均的な矩形サイ
ズを求め、その矩形サイズを基準として極端に大きなサ
イズの矩形を再び削除する。すなわち、これまでの処理
で変化したグループに対して、図4のステップS12の
処理を再度行い、グループ内のノイズを削除する。
【0333】次に、グループ統合処理を行う(ステップ
S18)。
【0334】このグループ統合処理では、左右方向また
は上下方向に互いに近接する同色グループを統合する。
すなわち、2つのグループがほぼ同じ色で、かつ近くに
あり、グループの外接矩形が並んでいる場合に、その2
つの外接矩形を統合し、1つのグループとする。これ
は、後で行う文字矩形の並びによるグループの文字列ら
しさの判定を安定化させるために行う。
【0335】図24は、本発明の一実施例に係わるグル
ープ統合処理を説明する図である。図24(a)におい
て、グループ1の外接矩形161とグループ2の外接矩
形162が互いに横に並んでいるものとすると、外接矩
形161と外接矩形162の距離L1及び及び外接矩形
161と外接矩形162の下端同士の座標の差E1を求
める。そして、外接矩形161と外接矩形162の距離
L1及び外接矩形161と外接矩形162の下端同士の
座標の差E1が各しきい値より小さく、グループ1の代
表色とグループ2の代表色の差が所定のしきい値以内に
ある場合、外接矩形161と外接矩形162とを統合
し、外接矩形161及び外接矩形162を囲む外接矩形
163を生成する。
【0336】具体的には、2つのグループの外接矩形に
おいて、色及び下端の座標が近く、かつ、近い距離にあ
り、2つをまとめて1つの文字列とみれそうなものを1
つのグループにまとめる。ここで、2つのグループの平
均色をそれぞれ(Rg1,Gg1,Bg1)と(Rg
2,Gg2,Bg2)とすると、2つのグループのそれ
ぞれのRGB値の平均値(Rg1+Rg2,Gg1+G
g2,Bg1+Bg2)を求める。そして、そのRGB
値の平均値と解像度をキー情報としてテーブルを検索
し、テーブルから得られたRGBそれぞれの輝度差(d
elta_r,delta_g,delta_b)を同
色とみなす場合の輝度差のしきい値とする。この時、統
合の条件は、以下の通りである。
【0337】|Rg1−Rg2|<delta_r かつ |Gg1−Gg2|<delta_g かつ |Bg1−Bg2|<delta_b かつ横並びの場合、横方向の距離が固定しきい値より小
さい (ただし、縦並びの場合は、縦方向の距離が固定しきい
値より小さい) かつ横並びの場合、2つのグループの外接矩形の下端座
標の差が固定しきい値より小さい (ただし、縦並びの場合は、左端と右端同士の差が両方
とも固定しきい値よりも小さい) この処理を統合するグループがなくなるまで繰り返す。
【0338】なお、横並びの場合に、下端の座標の差の
みを考慮し、上端の座標の差を考慮しないのは、タイト
ルがアルファベットで書かれている場合などで、そのタ
イトルに大文字と小文字が混在していると、下端の座標
は揃っているが、上端の座標はその差が大きい場合があ
り、大文字と小文字とを1つのグループに統合できなく
なる場合があるからである。例えば、「Window
s」という文字列がタイトルにあり、「Wind」の部
分と「ows」の部分とが別々のグループとして抽出さ
れた場合に、上端の座標の差まで考慮すると、「Win
d」の部分と「ows」の部分とを1つのグループに統
合できなくなるからである。
【0339】次に、矩形並びによる文字らしいグループ
の抽出処理を行う(ステップS19)。
【0340】この矩形並びによる文字らしいグループの
抽出処理では、グループ内の矩形の中で、サイズまたは
形など一定の条件を満足する矩形を対象に、上端座標ま
たは下端座標のどちらかが隣りの矩形と近い場合、この
両者の矩形が並んでいると判定し、並びフラグをセット
する。そして、その一定条件を満足するグループ内の対
象矩形の中で、並んでいる矩形の数がどの程度の割合で
あるかを示す並び矩形率を求め、その並び矩形率が一定
のしきい値以上のグループを文字列と見なして抽出す
る。
【0341】図25は、本発明の一実施例に係わる矩形
並びによる文字列らしいグループの抽出処理を説明する
図である。
【0342】図25(a)において、外接矩形171〜
174及び外接矩形176〜187が入力画像から生成
され、外接矩形のグルーピングにより、外接矩形171
〜174が1つのグループとされた結果、これらの外接
矩形171〜174を囲む外接矩形175が生成されて
いる。また、外接矩形のグルーピングにより、外接矩形
176〜187が1つのグループとされた結果、これら
の外接矩形176〜187を囲む外接矩形188が生成
されている。
【0343】次に、各グループ内の外接矩形のサイズや
位置関係を調べ、横方向に並んでいる外接矩形に対して
横並びフラグ1を与え、縦方向に並んでいる外接矩形に
対して縦並びフラグ2を与える。この結果、外接矩形1
75内の外接矩形171〜174はランダムに並んでい
るので、外接矩形171〜174には、横並びフラグ1
も縦並びフラグ2も付かない。一方、外接矩形188内
の外接矩形176〜187は横一列に並んでいるので、
外接矩形176〜187には、横並びフラグ1が与えら
れる。
【0344】外接矩形171〜174及び外接矩形17
6〜187についてのフラグ処理が終了すると、フラグ
が付された矩形の割合を各グループごとに算出する。そ
して、フラグが付された矩形の割合の多いグループを文
字列として抽出し、フラグが付された矩形の割合の少な
いグループをノイズとして捨てる。
【0345】この結果、図25(b)に示すように、外
接矩形175のグループは、そのグループに属する外接
矩形171〜174に対して、フラグが1つも付されて
ないので、ノイズとして捨てられる。一方、外接矩形1
88のグループは、そのグループに属する外接矩形17
6〜187に対して、横並びフラグ1を与えられている
ので、文字列として抽出される。
【0346】具体的には、以下のa)〜e)の処理を行
う。
【0347】a)グループ内の隣接するサイズまたは形
の一定条件を満足する2つの矩形の上端座標同士または
下端座標同士の差がしきい値(高さのWID_RATE
(=0.2)倍)より小さい場合、その2つの矩形に横
並びフラグを与える。
【0348】ここで、隣接するとは、基準矩形の幅のW
ID_RATE_DIST(=0.5)倍の周囲範囲以
内に矩形があることをいう。
【0349】b)グループ内の隣接するサイズまたは形
の一定条件を満足する2つの矩形の左端座標同士または
右端座標同士の差がしきい値(幅のWID_RATE
倍)より小さい場合、その2つの矩形に縦並びフラグを
与える。
【0350】ここで、隣接するとは、基準矩形の高さの
WID_RATE_DIST倍の周囲範囲以内に矩形が
あることをいう。
【0351】c)グループ内の矩形で、横並びフラグと
縦並びフラグの数の多い方を文字列方向として採用し
て、その数を並んでいる矩形数とする。
【0352】d)グループ内の矩形の中で並んでいる矩
形の比率を、「並んでいる矩形数/グループ内のサイズ
または形の一定条件を満足する矩形の総数」として算出
する。
【0353】なお、対象とするグループ内矩形の条件
は、グループ内の矩形の最頻値を示す高さを求め、例え
ば、その3倍をlarge_rectとすると、矩形高
さが、固定サイズ(23dot,100dpiで)より
大きく、large_rectより小さいものとする。
【0354】e)並んでいる矩形の比率が一定しきい値
NUM_RATE(=0.8)より大きい場合に、その
グループを文字列らしいグループとして残し、他をノイ
ズとして捨てる。
【0355】なお、中点「・」や中棒「ー」などのタイ
トルとして用いられることがある特殊な記号を予め登録
しておき、a)〜e)の条件を満たさない場合でも、こ
のような特殊な記号をタイトルを構成するパターンとし
て残すようにしてもよい。
【0356】次に、ノイズグループの削除処理を行う
(ステップS20)。
【0357】このノイズグループの削除処理では、グル
ープ内が2つの矩形だけから構成されているグループに
対して、その形状及び座標から判断してノイズと思われ
るグループを抽出し、そのグループを削除する。すなわ
ち、グループ内の矩形数が2つのものについて、その2
つの矩形の上下端(または左右端)とも近いかどうかを
判断し、2つの矩形が並んでいると判断されるもの以外
のグループをノイズとして削除する。
【0358】図26は、本発明の一実施例に係わるノイ
ズグループの削除処理を説明する図である。
【0359】図26において、2つの外接矩形211、
212が1つのグループとして抽出され、この2つの外
接矩形211、212を囲む外接矩形213が生成され
ているものとする。この場合、外接矩形211と外接矩
形212の下端座標は揃っているが、外接矩形211と
外接矩形212の上端座標は極端に異なっているので、
これらの外接矩形211、212はノイズであると見な
して、外接矩形211、212からなるグループを文字
列らしいグループから削除する。
【0360】具体的には、以下の処理を行う。
【0361】グループ内の2つの矩形の高さの平均をh
ei,幅の平均をwidとする。しきい値を決める比率
DEL_RATE=0.1として、 (|第1の矩形の上端座標−第2の矩形の上端座標| <hei×DEL_RATE かつ |第1の矩形の下端座標−第2の矩形の下端座標| <hei×DEL_RATE) または (|第1の矩形の左端座標−第2の矩形の左端座標| <wid×DEL_RATE かつ |第1の矩形の右端座標−第2の矩形の右端座標| <wid×DEL_RATE) を満足するグループだけ残し、後はノイズとして削除す
る。
【0362】次に、文字認識によるノイズ除去処理を行
う(ステップS21)。
【0363】この文字認識によるノイズ除去処理では、
パターンの外接矩形の位置及びサイズ情報によるノイズ
除去を行った後に、グループ内のパターンを文字認識処
理し、各パターンごとの距離値をグループ内で平均す
る。その平均値が予め決めたしきい値(例えば、120
0)よりも小さい場合に、文字らしいグループとして残
し、それ以外のグループを削除する。
【0364】この処理により、抽出したグループの内部
のパターンが背景部分から抽出されたノイズだけで構成
されるグループを検出することが可能となり、明らかに
文字と見なせないパターンをタイトル候補から除外する
ことが可能となることから、タイトルの抽出精度を向上
させることが可能となる。
【0365】また、文字認識結果の距離値に従って、グ
ループ内のパターンを再グルーピングすることもでき
る。
【0366】具体的には、グループ内の全矩形内のパタ
ーンの文字認識処理を行い、第1位候補の距離値を矩形
ごとに獲得する。そして、矩形ごとの距離値の頻度分布
を作成し、その距離値をクラスタリングすることによ
り、距離値のクラスタを複数個生成する。複数のクラス
タを生成する方法として、距離値の頻度分布の谷で複数
のクラスタに分割する方法や、階層的クラスタリングを
適用する方法などを用いることができる。
【0367】2つの外接矩形のうち、第1の外接矩形の
パターンの文字認識距離値をdist1、第2の外接矩
形のパターンの文字認識距離値をdist2とすると、
これらの距離値が同じクラスタに属する時に、これらの
2つの外接矩形を同じグループに分類する。
【0368】この処理を元のグループ内全ての矩形につ
いて行い、グループ内の新たなグルーピングを行う。
【0369】次に、グループ内同色パターン抽出処理を
行う(ステップS22)。
【0370】このグループ内同色パターンの抽出処理で
は、グループの代表色をグループ内部の矩形の代表色の
平均として求める。グループの矩形の内部に相当する範
囲で、原画像を探索して、グループの代表色に近いパタ
ーンで、既に文字パターンとして抽出されているもの以
外ものを2値画像として抽出する。この抽出されたパタ
ーンに2値画像用のラベリングを行い、連結成分の外接
矩形を求め、その外接矩形の大きさが所定値より大きい
ものだけを文字パターンの一部として、そのグループに
追加する。
【0371】この処理により、これまでの処理で抜け落
ちるが、実は文字の一部であるパターン、例えば、
「ば」の濁点部分のように、文字幅情報や色ずれなどで
落されたパターンを再抽出することができる。
【0372】ここで、グループの代表色と近い色のパタ
ーンを原画像から再抽出する際に、固定しきい値を用い
て同色パターンかどうかの判断を行うと、背景色と文字
色とが近く、特に、それらの色が黒色に近い場合は、こ
の処理によって背景ノイズを大量に拾ってしまい、文字
を消してしまう場合がある。
【0373】そこで、原画像から同色パターンを再抽出
する際に、固定しきい値を用いて同色パターンかどうか
の判断を行うのではなく、文字パターンとして既に抽出
されている領域内の色の分散を考え、この分散から求め
た標準偏差をしきい値を用いることにより、同色パター
ンかどうかの判断を行う。
【0374】図27は、本発明の一実施例に係わるグル
ープ内同色パターン抽出処理を説明する図である。
【0375】図27(a)において、図3のステップS
1〜S21の処理により、「クローハル化への3つの成
功モデル」という文字列が入力画像から抽出され、これ
らの文字列を囲む外接矩形221が生成されているもの
とする。この場合、図27(b)の「ク」という文字の
濁点222及び「ハ」という文字の濁点223が欠落し
ている。
【0376】ここで、「ク」という文字の濁点222が
欠落したのは、「ク」という文字の濁点222の色と
「ク」という文字の色との差がしきい値範囲内にないた
めに、「ク」という文字の濁点222が「ク」という文
字と異なるグループにグルーピングされたためである。
【0377】また、「ハ」という文字の濁点223が欠
落したのは、「ハ」という文字の濁点223の色と
「ハ」という文字の色との差がしきい値範囲内にないた
めに、「ハ」という文字の濁点223が「ハ」という文
字と異なるグループにグルーピングされたためである。
【0378】このように、ステップS9の同色グループ
抽出処理では、抽出対象となる文字列のうち、局所的な
部分の色同士が比較されるので、抽出対象となる文字列
の色が色ずれなどで局所的に変化している場合には、文
字の一部が欠落したりする。
【0379】そこで、「ク」という文字の濁点222及
び「ハ」という文字の濁点223の再抽出を行う場合に
は、既に抽出されている「クローハル化への3つの成功
モデル」という文字列全体を考慮して、その代表色を求
め、この代表色に近い色を有するパターンを原画像から
再抽出する。すなわち、既に抽出されている文字列全体
の代表色を求め、この文字列全体の代表色と抽出対象と
なるパターンの色とを比較することにより、その文字列
の局所的な色の変化の影響を軽減することが可能とな
り、「ク」という文字の濁点222及び「ハ」という文
字の濁点223を抽出することが可能となる。
【0380】また、再抽出を行う際には、再抽出の対象
となるパターンの探索範囲を、外接矩形221の範囲に
限定する。この限定を行うことにより、例えば、原画像
からタイトルを構成する文字を抽出する場合、その文字
の探索範囲をタイトル領域のみに限定して文字の再抽出
を行うことが可能となり、抽出処理を高速化することが
可能となる。
【0381】さらに、再抽出を行う際の同色かどうかの
判断に用いるしきい値として、実験的に予め定められた
値を用いるのではなく、図27(a)で既に抽出されて
いる「クローハル化への3つの成功モデル」というパタ
ーンの色情報から算出した値を用いるようにする。
【0382】この結果、背景色と文字色とが近い場合に
おいても、背景色と文字色との微妙な色の違いを区別す
ることが可能となり、「グローバル化への3つの成功モ
デル」という文字列と近い色の背景ノイズが外接矩形2
21の範囲内に存在している場合においても、背景ノイ
ズが抽出されることを防止しながら、「ク」という文字
の濁点222及び「ハ」という文字の濁点223を抽出
することが可能となる。
【0383】なお、「グローバル化への3つの成功モデ
ル」という文字列の色と背景ノイズの色とが完全に同一
である場合には、これらのノイズが抽出されることを防
止できないが、再抽出されたパターンのうち微小なもの
をノイズとみなして除去することにより、ノイズを減ら
すことができる。
【0384】具体的には、以下の処理を行う。
【0385】a)グループ内の矩形について保存されて
いる代表色情報をグループ内の矩形全てについて平均
し、グループの代表色(Rm,Gm,Bm)を求める。
また、グループ内のRGBの分散(Vr,Vg,Vb)
を求め、その分散から、グループの標準偏差を以下の式
で求める。
【0386】dev=sqrt(sqrt(Vr*Vr
+Vg*Vg+Vb*Vb)) b)グループ内の矩形サイズの最頻度を幅と高さについ
て求め、それぞれmfw,mfhとする。その幅と高さ
が、最小矩形サイズのしきい値minsize(=2)
より大きな場合には、それぞれminsizeで置き換
える。
【0387】c)グループの外接矩形を求め、その外接
矩形の大きさの2値画像を作成する。2値画像の値は、
全て0としておく。
【0388】d)グループの範囲内で原画像の画素の色
を調べ、原画像の画素の色(R,G,B)とグループの
代表色(Rm,Gm,Bm)との関係が、 |Rm,−R|+|Gm−G|+|Bm−B|<k×dev (k=5) を満足する画素の位置を記録し、2値画像のその位置の
画素を1にする。
【0389】e)2値画像の中から、グループ内の矩形
を構成する。このグループ内の矩形から既に抽出されて
いるパターンを除去し、2値画像のパターンを、グルー
プの代表色に近い色であり、かつ、これまでの処理で漏
れていたパターンだけにする。
【0390】f)この2値画像に対して、2値画像用の
ラベリングを行い、連結領域の外接矩形を求める。
【0391】g)外接矩形の幅w及び高さhが、 w>mfw/2 かつ h>mfh/2 を満足する矩形だけを残し、他の矩形を削除する。
【0392】h)残った矩形に含まれる連結成分のパタ
ーンをグループに追加する。
【0393】次に、グループの出力順位決定処理を行う
(ステップS23)。
【0394】このグループの出力順位決定処理では、文
字列を含んでいるグループが複数抽出された場合、グル
ープの外接矩形から面積を計算して、全画像中のグルー
プの面積の大きい順にグループをソートして、このソー
トした結果を出力順序とする。
【0395】次に、2値パターン生成処理を行う(ステ
ップS24)。
【0396】この2値パターン生成処理では、グループ
を構成するパターンを文字認識できるような2値画像と
して作成する。
【0397】具体的には、以下のa)〜c)の処理を行
う。
【0398】a)グループの外接矩形サイズの2値画像
を作成し、その値を全て0に設定する。
【0399】b)グループ内の矩形のラベル番号を抽出
し、対応する矩形領域の内部でラベル画像を探索し、そ
のラベル番号の画素を抽出し、2値画像上でその座標の
画素を1とする。
【0400】c)b)の処理を全ての矩形について行
い、グループを構成するパターンを2値画像上に作成す
る。
【0401】図4のステップS3で、入力画像がフルカ
ラー画像でないと判定された場合には、クラスタリング
処理を行う(ステップS25)。
【0402】クラスタリング処理では、RGB画像の画
素をRGB空間上、またはRGB以外の色空間(HSV
等)上でクラスタリングを行い、1つのクラスタに属す
る画素だけで色ごとの画像を作成する。
【0403】ここで、フルカラー画像以外の画像につい
てクラスタリング処理を行うのは、フルカラー(例え
ば、1667万色)画像に用いたラベリング方法を、フ
ルカラー以外(例えば、256色)の画像に適応する
と、同色領域に細かい領域が多数発生し、その後の処理
時間がフルカラー画像を処理する場合に比べて大幅に増
大したり、文字パターンの抽出精度が低下したりするか
らである。
【0404】これは、例えば、256色画像は、フルカ
ラー画像を色のクラスタリングにより減色したものと考
えられ、フルカラー画像では異なった色として表現され
ている領域が、256色画像では同一色の領域として表
現されるからである。すなわち、フルカラー画像では1
667万色を区別する必要があるため、同一色とみなす
色の変動の範囲を小さくする必要があるが、256色画
像では256色を区別するだけでよく、同一色とみなす
色の変動の範囲がある程度大きくてもよい。このため、
フルカラー画像に適用されるラベリング方法を、256
色画像の適用すると、256色画像では同一色として表
現されている領域が異なった色で構成されていると判断
され、同色領域に細かい領域が多数発生することにな
る。
【0405】そこで、フルカラー画像以外の画像につい
て、画像の色パレットを対象にクラスタリング処理を行
い、そのクラスタリング結果を用いてラベリングを行う
ようにする。
【0406】また、画像の色分布をクラスタリングし、
そのクラスタリング結果を用いてラベリングを行うよう
にすることもできる。
【0407】また、フルカラー画像以外のラベリングを
行う場合に、クラスタリングと領域拡張法ラベリングを
組み合わせた手法を使用することもできる。
【0408】クラスタリング結果として、1つのクラス
タ当たり以下のような情報を得ることができる。
【0409】 ・クラスタ番号 ・クラスタに含まれる色パレットの個数 ・クラスタに含まれる元の画像の色パレット番号 ・クラスタの平均色(R,G,B) クラスタリング手法として、例えば、クラスタ中心間の
シティブロック距離を距離尺度に使った階層的クラスタ
リングを用いることができる。なお、距離の尺度を、ユ
ークリッド距離、重み付きユークリッド距離、またはマ
ハラノビス距離などにより定義することもできる。
【0410】また、クラスタ間の距離を測る方法とし
て、最短距離法、最長距離法、メジアン法、重心法、群
平均法、またはウォード法などを用いることができる。
【0411】また、クラスタリングの終了条件として、
例えば、クラスタ中心間の距離の最小値が予め定めたし
きい値より小さくなった時に、クラスタリングを終了さ
せることができる。
【0412】画像の色分布をクラスタリングする場合、
クラスタリングに使用するベクトルは、画像の色パレッ
ト(Ri,Gi,Bi)(i=1〜255など)であ
る。
【0413】この色パレットのベクトルを使用して階層
的クラスタリングを行う場合、色差の尺度としてクラス
タ間の距離を求め、クラスタ間の距離が小さいクラスタ
同士を統合する。
【0414】なお、2つの色(R1,G1,B1)、
(R2,G2,B2)の間の距離distを、シティブ
ロック距離で定義した場合、以下の式で表すことができ
る。
【0415】dist=|R1−R2|+|G1−G2
|+|B1−B2| ここで、デバイスによる色の違いの識別能力と人間によ
る色の違いの識別能力とは異なっており、例えば、色空
間上での距離値が同じ値を示す色であっても、黒(また
は白)に近い2つの色は、赤などの高彩度の2つの色な
どに比べて、人間が見た時の色の識別能力が低い。
【0416】すなわち、黒に近い2つの色は、色空間上
での距離値が離れていても、人間の目にはその2つの色
を区別できず、その2つの色が同一色に見えてしまう。
【0417】一方、赤に近い2つの色は、色空間上での
距離値がある程度近くても、人間の目にはその2つの色
を区別でき、その2つの赤色を異なった色と見ることが
できる。
【0418】そこで、クラスタリングに先立って、低彩
度色(黒、または白に近い色)の2色間の距離値を高彩
度色の2色間の距離値よりも小さくするための色変換を
行う。この色変換により、全ての輝度値の値について、
0から255までの輝度値の差分を同じ評価基準で判断
することができる。
【0419】図28は、本発明の一実施例に係わる色信
号の変換方法を説明する図である。
【0420】図28において、黒および白に近い色で
は、(R,G,B)の色空間上の色差よりも、人間が判
別する色差の方が鈍感である場合が多い。
【0421】例えば、人が色の違いを意識する時には、
黒(0,0,0)と黒に近い色(0,0,80)の色差
(=80)は、例えば、赤(255,0,0)と赤に近
い色(255,5,5)の色差(=10)と同程度の感
度である。すなわち、赤系統2つの色は、色差が10程
度しかなくても、これらの2つの色の違いを認識できる
が、黒系統の2つの色は、色差が80程度以上にならな
いと、これらの2つの色の違いを認識することができな
い。
【0422】このため、黒や白に近い場合には2色間の
色差を圧縮し、それ以外の色の場合には2色間の色差を
拡大するような色変換を行い、全ての色で色差の距離を
同等に評価可能とする。この色変換により得られた色パ
レットをクラスタリングすることにより、人が判断した
場合と同等のクラスタリング結果を得ることが可能とな
る。
【0423】なお、色変換を計算により行う場合、以下
の式を用いることができる。
【0424】Rnew={1−cos(R×π/25
5)}×255+R×4 Gnew={1−cos(G×π/255)}×255
+G×4 Bnew={1−cos(B×π/255)}×255
+B×4 また、人間の識別能力に対応した色の変換関係を実験的
に求め、この実験的に求めた色の変換関係を変換テーブ
ルに予め登録しておくようにしてもよい。
【0425】次に、クラスタリング結果を用いた色ラベ
リング処理を行う(ステップS26)。
【0426】このクラスタリング結果を用いた色ラベリ
ング処理では、色パレットのクラスタリング結果から得
られた情報を使用してカラー画像のラベリングを行う。
【0427】すなわち、フルカラー以外の画像について
は、その画像を構成する色パレットをクラスタリングを
行い、そのクラスタリング結果をラベリング処理に反映
させる。
【0428】一方、フルカラー画像を対象にクラスタリ
ングを行うと、膨大な時間がかかる。また、処理時間を
短縮するために、色空間を適当な区分に分割するなどの
疑似クラスタリングを行うと、精度が悪化する。
【0429】そこで、フルカラー画像では、クラスタリ
ングを用いたラベリングを行わず、フルカラー以外の2
56色などの少数の色数の画像のみに限定してクラスタ
リングを用いたラベリング行う。
【0430】図29は、本発明の一実施例に係わるクラ
スタリング結果を用いた色ラベリング方法を説明する図
である。
【0431】図29において、画素の色パレットのクラ
スタリングにより、色パレットのクラスタが生成され、
各画素の色パレットが属するクラスタの番号が各画素に
与えられているものとする。
【0432】例えば、パターン231、235の色が
赤、パターン232、234の色が青、パターン233
の色が黄であるものとし、赤がクラスタ番号1のクラス
タに分類され、青がクラスタ番号2のクラスタに分類さ
れ、黄がクラスタ番号3のクラスタに分類されたものと
すると、パターン231、235を構成する各画素には
クラスタ番号1が与えられ、パターン232、234を
構成する各画素にはクラスタ番号2が与えられ、パター
ン233を構成する各画素にはクラスタ番号3が与えら
れる。
【0433】クラスタ番号が各画素に与えられると、互
いに隣接する画素同士のクラスタ番号を比較し、互いに
隣接する画素のクラスタ番号が同一である場合、それら
の画素に同一のラベルを与える。
【0434】例えば、パターン231を構成する画素は
クラスタ番号1の画素で連結しているため、パターン2
31を構成する画素には、ラベル番号1が与えられる。
一方、パターン235を構成する画素のクラスタ番号も
1であるが、パターン231とパターン235とは連結
していないので、パターン235を構成する画素にはラ
ベル番号5が与えられる。
【0435】具体的には、以下の処理を行う。
【0436】まず、画素のパレット番号からクラスタ番
号を獲得する変換表を作成する。
【0437】次に、クラスタ番号に注目した色ラベリン
グ処理を行う。この色ラベリング処理では、隣り合う画
素のクラスタ番号が同じ場合に同一ラベルを与える。
【0438】すなわち、縮小画像の左上からラスタスキ
ャンを行い、ラベル付けがされていない画素に注目す
る。
【0439】そして、この未処理の画素の周囲8画素を
走査して、周囲に既にラベル付けされた画素があり、そ
の画素のクラスタ番号が注目画素のクラスタ番号と同じ
である場合に、周囲画素のラベルをカレントラベル(r
egion)として保存し、注目画素のラベルとしてr
egionを与える。
【0440】また、領域の平均色(Rm,Gm,Bm)
として、周囲のラベルの平均色に注目画素の色を加味し
た新たな平均色を求める。
【0441】それ以外の場合は、カレントラベルとし
て、今まで付けたラベル値+1のラベル値を設定し、注
目画素のラベルにもその値を付与する。この場合でも、
領域の平均色(Rm,Gm,Bm)として、注目画素の
RGB値を設定する。
【0442】どちらの場合でも、注目画素の座標値を処
理対象座標配列に保存する。
【0443】注目画素の周りに同色領域を拡張する処理
を行う。処理対象配列の中から、先頭の座標値を取り出
し、その座標の画素を注目画素とする。
【0444】注目画素の市有為8画素を走査し、未処理
の画素であり、注目画素のクラスタ番号と周囲画素のク
ラスタ番号が同一である場合、注目画素と同一ラベルを
付け、周囲画素の座標を処理対象配列に追加する。今処
理した注目画素は、処理対象配列から削除する。処理座
標のx,yの最大値、最小値を求め、それをこのラベル
領域の外接矩形として保存する。また、このラベル領域
の平均色を外接矩形の属性として保存する。
【0445】この処理を処理対象配列の内容がなくなる
まで続ける。
【0446】ラベリングの結果、ラベル画像(同一領域
は、同じラベル値が付与されている画像)と同じラベル
を持つ領域を囲む外接矩形が獲得される。
【0447】ラベリング処理の出力情報は、以下のよう
になる。
【0448】・ラベル画像:4バイト/1画素 ・外接矩形 矩形数:maxcount 内包するラベル画像のラベル番号:label 矩形左上座標:(xmin,ymin) 矩形右上座標:(xmax,ymax) 矩形内の代表色:(r,g,b) 所属するグループ番号:string_label 輪郭長:contour 図30は、本発明の一実施例に係わるパターン抽出装置
のシステム構成を示すブロック図である。
【0449】図30において、241は全体的な処理を
行う中央演算処理ユニット(CPU)、242はリード
オンリメモリ(ROM)、243はランダムアクセスメ
モリ(RAM)、244は通信インターフェイス、24
5は通信ネットワーク、246は入出力インターフェイ
ス、247は入力画像やタイトルの抽出結果などを表示
するディスプレイ、248は入力画像やタイトルの抽出
結果などを印刷するプリンタ、249はスキャナ250
またはCCD251により読み取られたデータを一時的
に格納するメモリ、250はカラー画像などを読み取る
スキャナ、251はカラー画像などを読み取るCCD、
252はキーボード、253は記憶媒体を駆動するドラ
イバ、254はハードディスク、255はICメモリカ
ード、256は磁気テープ、257はフロッピーディス
ク、258はCD−ROMやDVD−ROMなどの光デ
ィスク、259はバスである。
【0450】パターン抽出処理を行うプログラム、印刷
モデルを構築するプログラム、色差テーブルなどは、ハ
ードディスク54、ICメモリカード55、磁気テープ
56、フロッピーディスク57、光ディスク58などの
記憶媒体に格納される。そして、パターン抽出処理を行
うプログラム及び色差テーブルを、これらの記憶媒体か
らRAM243に読み出すことにより、パターン抽出処
理を行うことができる。また、パターン抽出処理を行う
プログラムなどを、ROM242に格納しておくことも
できる。また、印刷モデルを構築するプログラムを起動
させることにより、色差テーブルを作成することができ
る。
【0451】さらに、パターン抽出処理を行うプログラ
ムや色差テーブルななどを、通信インターフェイス24
4を介して通信ネットワーク245から取り出すことも
できる。通信インターフェイス244に接続される通信
ネットワーク245は、無線及び有線のいずれでもよ
く、例えば、LAN(Local Area Netw
ork)、WAN(Wide Area Networ
k)、インターネット、アナログ電話網、デジタル電話
網(ISDN:Integral Service D
igital Network)、PHS(パーソナル
ハンディシステム)、携帯電話網、衛星通信網などを用
いることができる。
【0452】CPU241は、パターン抽出処理を行う
プログラムが起動されると、スキャナ250またはCC
D251により読み取られた入力画像のラベリングを行
うしきい値を設定し、スキャナ250またはCCD25
1により読み取られた入力画像からラベル画像を生成す
る。ラベル画像が生成されると、入力画像のパターンの
各ラベルごとに、各パターンについての外接矩形を生成
する。そして、各外接矩形内の領域の色情報及び外接矩
形の幾何学情報に基づいて、各外接矩形のグルーピング
を行い、このグルーピングされた外接矩形の配置状態や
大きさなどを考慮して、タイトル領域などを抽出する。
タイトル領域が抽出されると、このタイトル領域に含ま
れているパターンを入力画像のタイトルとしてディスプ
レイ247やプリンタ248に出力したり、このタイト
ル領域に含まれるパターンの文字認識を行い、その認識
結果に基づいて、文書の自動分類や自動検索を行ったり
する。
【0453】以下、上述した処理について、実際のカラ
ー画像を例にとって説明する。なお、以下の説明に用い
るカラー画像は、フルカラー画像を例にとっているが、
フルカラー画像以外のカラー画像についても、色ラベリ
ング処理が異なる以外は同様に処理できる。
【0454】図31(a)は、入力された原画像の例を
示す図である。
【0455】図31(a)において、この原画像は、8
47×1167画素から構成され、「祝!パソコン20
年」という文字パターン301が黒色で印刷されてい
る。また、この文字パターン301の周囲には、色が黒
→オレンジ→黄にかけて少しずつ変化する背景パターン
302が存在している。ここで、図31(a)の原画像
から「祝!パソコン20年」という文字パターン301
を抽出するものとする。
【0456】図31(b)は、図31(a)のラベル画
像を示す図である。
【0457】図31(b)において、このラベル画像
は、図4のステップS5の色ラベリング処理により得ら
れたものである。この色ラベリング処理により、同色の
連結領域に対して同一ラベルが付され、同一ラベルが付
されたパターンの外接矩形が生成される。
【0458】ここで、原画像を3×3画素からなるメッ
シュ領域に分割し、これらのメッシュ領域の中の画素の
色の分散の小さいもの選択することにより、図31
(a)の原画像から均一色領域を抽出する。例えば、図
31(a)の原画像の右上の領域303や右下の領域3
04は黒一色で着色されているので、これらの領域30
3、304が原画像の均一色領域として抽出される。
【0459】原画像から均一色領域が抽出されると、こ
の均一色領域の色の分散を求め、この分散に基づいてラ
ベリングのしきい値を設定する。このしきい値をラベリ
ングの際に用いることにより、「祝!パソコン20年」
という黒色の文字パターン301が黒色の背景パターン
302で覆われているのもかかわらず、文字パターン3
01の色と背景パターン302の色との微妙な違いを区
別することができ、「祝!パソコン20年」というパタ
ーン301の輪郭を正確に縁取ったラベル画像311を
生成することができる。
【0460】また、背景パターン302の色は微妙に変
化しているため、隣接拡張法によるラベリングでは背景
パターン302の色の変動を吸収できず、微小な背景ノ
イズ312が多数生成されている。
【0461】なお、フルカラー画像の場合、色ラベリン
グ処理により得られる外接矩形の個数は数千〜数万程度
になる。
【0462】図32(a)は、図31(b)のラベル画
像から得られた注目矩形を示す図である。
【0463】図32(a)において、この注目矩形は、
図4のステップS7の注目矩形抽出処理により得られた
ものである。この注目矩形抽出処理では、図31(b)
のラベル画像から得られる外接矩形のうち、所定の範囲
内の大きさの外接矩形が注目矩形とされる。このため、
図31(b)の色ラベリング処理により得られる外接矩
形のうち、矩形番号1〜41の矩形が注目矩形として抽
出される。
【0464】この注目矩形抽出処理により、タイトルを
構成しないことが明らかな微小な背景ノイズ312など
の外接矩形を、グルーピングの際の探索範囲の基準とな
る外接矩形から除去することができ、処理を高速化する
ことが可能となる。例えば、図31(b)の状態では外
接矩形の個数が数千〜数万程度あったものが、図32
(a)の状態では外接矩形の個数を数十個に減らすこと
ができる。
【0465】図32(b)は、グループ抽出結果を示す
図である。
【0466】図32(b)において、このグループ抽出
結果は、図4のステップS9の同色グループ抽出処理に
より得られたものである。この同色グループ抽出処理
は、図31(b)のラベリング処理が終了した段階で
は、タイトルを構成する個々の文字に異なるラベルが付
されているので、タイトルを構成する「祝」、「!」、
「パ」、「ソ」、「コ」、「ン」、「2」、「0」及び
「年」という文字を1つのグループにまとめるために行
われる。
【0467】この同色グループ抽出処理により、同一の
グループにグルーピングされた外接矩形を囲む外接矩形
が生成され、矩形番号が1〜16のグループの外接矩形
が生成される。
【0468】ここで、同色グループ抽出処理では、図3
1(b)のラベル画像から得られた外接矩形のうち、図
32(a)で設定された注目矩形から所定の範囲内にあ
り、矩形の色の近いもの同士が同一のグループにグルー
ピングされる。
【0469】このため、タイトルを構成する個々の文字
に局所的な色の変動がある場合には、1つのタイトルを
構成する文字であっても、それらの文字が異なるグルー
プに分類される場合がある。例えば、図31(a)の
「祝!パソコン20年」という文字パターン301のう
ち、「コ」という文字の色と「ン」という文字の色とが
局所的に異なっているとすると、「コ」という文字と
「ン」という文字とが異なるグループに分類される。こ
のため、図32(b)では、「祝!ハソコ」というパタ
ーンと「ン20年」というパターンとが異なるグループ
に分類され、「祝!ハソコ」というパターンに対応する
グループの外接矩形321と、「ン20年」というパタ
ーンに対応するグループの外接矩形322とが生成され
る。
【0470】また、外接矩形321に対応するグループ
は「祝!ハソコ」というパターンから構成され、「祝!
パソコン20年」という文字パターン301から「ハ」
の半濁点が欠落している。これは、同色グループ抽出処
理では、図32(a)で抽出された注目矩形の色とその
周囲にある矩形の色とが比較され、注目矩形の色とその
周囲にある矩形の色との差が大きい場合には、それらの
矩形は異なるグループに分類されるためである。例え
ば、「ハ」というパターンの色と「ハ」の半濁点の色と
の差が大きい場合には、「ハ」というパターンと「ハ」
の半濁点とは異なるグループに分類され、「ハ」の半濁
点が外接矩形321のグループから欠落する。
【0471】さらに、同色グループを抽出する際のしき
い値が適切でない時にも、「ハ」の半濁点が外接矩形3
21に対応するグループから欠落する場合がある。例え
ば、同色とみなす範囲のしきい値が印刷モデルから獲得
した同色パターンの輝度差に基づいて設定されている場
合には、印刷モデルと異なる方法で印刷された画像が入
力されると、対応できなくなる。
【0472】なお、図32(a)の注目矩形から所定の
範囲内に、代表色の色の近い他の外接矩形が図31
(b)のラベル画像から見つからない場合は、その注目
矩形はグループを作らないため、その注目矩形は消滅さ
せる。
【0473】図33(a)は、図32(b)のグループ
抽出結果を文字線太さで再グループ化した結果を示す図
である。
【0474】図33(a)において、この再グループ結
果は、図4のステップS11の文字線太さによる再グル
ープ化処理により得られたものである。この処理によ
り、矩形番号が0〜12のグループの外接矩形が生成さ
れている。なお、図32(b)の外接矩形のうち、パタ
ーンの線の太さによってグループを作ることができない
ものは消滅させる。
【0475】図33(b)は、図33(a)の画像から
矩形並びによる文字列らしいグループを抽出した結果を
示す図である。
【0476】図33(b)において、この文字列らしい
グループは、図4のステップS19の矩形並びによる文
字列らしいグループの抽出処理により得られたものであ
る。この処理により、図33(a)の矩形番号が0〜1
2のグループのうち、そのグループ内の矩形がランダム
に並んでいるグループは削除され、縦方向または横方向
に矩形が規則正しく並んでいるグループだけが残され
る。この結果、矩形番号が0〜2のグループの外接矩形
341〜343が抽出される。
【0477】ここで、図33(b)の矩形番号0のグル
ープの外接矩形341は、図33(a)の矩形番号3の
グループの外接矩形331と矩形番号2のグループの外
接矩形332とを統合したものとなっている。これは、
図4のステップS19の処理が行われる前に、図4のス
テップS18のグループ統合処理が行われたためであ
る。
【0478】このグループ統合処理では、グループの統
合を行うかどうかの判断がそのグループに属する全ての
パターンの色の平均に基づいて行われる。このため、同
一タイトルに属するにもかかわらず、別々のグループに
属するとされた文字を1つのグループにまとめることが
できる。
【0479】例えば、図32(b)では、「祝!ハソ
コ」というパターンと「ン20年」というパターンとが
異なるグループに分類され、「祝!ハソコ」というパタ
ーンに対応するグループの外接矩形321と、「ン20
年」というパターンに対応するグループの外接矩形32
2とが生成されている。これは、図32(b)の同色グ
ループ抽出処理では、互いに隣接する矩形同士の色の違
いしか判断しないため、図31(a)の「祝!パソコン
20年」という文字パターン301のうち、「コ」とい
う文字の色と「ン」という文字の色とが局所的に異なっ
ているとすると、「コ」という文字と「ン」という文字
とが異なるグループに分類されるからである。
【0480】一方、図4のステップS18のグループ統
合処理では、グループの外接矩形321内の「祝!ハソ
コ」というパターン全体の色と、グループの外接矩形3
22内の「ン20年」というパターン全体の色とが比較
され、これらのグループの色が近い場合は、1つのグル
ープに統合される。このため、図31(a)の「祝!パ
ソコン20年」という文字パターン301のうち、
「コ」という文字の色と「ン」という文字の色とが局所
的に異なっている場合でも、「コ」という文字の色の変
動は「コ」という文字が属する「祝!ハソコ」というパ
ターン全体の色に吸収され、「ン」という文字の色の変
動は「ン」という文字が属する「ン20年」というパタ
ーン全体の色に吸収される。このため、「祝!ハソコ」
というパターンと「ン20年」というパターンとを1つ
のグループにまとめることが可能となる。
【0481】図34(a)は、図33(b)のグループ
の外接矩形からそのグループ内のパターンを抽出した結
果を示す図である。
【0482】図34(a)において、「祝!ハソコン2
0年」という文字パターン351とノイズパターン35
2とが抽出されている。ここで、「祝!ハソコン20
年」という文字パターン351は、図33(b)のグル
ープの外接矩形341から抽出されたものであり、ノイ
ズパターン352は、図33(b)のグループの外接矩
形342から抽出されたものである。なお、図33
(b)のグループの外接矩形343のパターンは、その
パターンについての文字認識を行った結果、ノイズと見
なされ削除されている。
【0483】ここまでの処理では、グループの外接矩形
341から抽出された文字パターン351は、「ハ」の
半濁点が「祝!パソコン20年」という文字パターン3
01から欠落したままの状態となっている。そこで、グ
ループの色に近いパターンの再抽出を行う。
【0484】図34(b)は、グループの色に近いパタ
ーンの再抽出結果を示す図である。図34(b)におい
て、このグループ内パターンは、図4のステップS22
のグループ内同色パターン抽出処理により得られたもの
である。
【0485】このグループ内同色パターン抽出処理で
は、図34(a)の「祝!ハソコン20年」という文字
パターン351については、図33(b)のグループの
外接矩形341内に存在する図31(a)の原画像のパ
ターンが探索される。
【0486】ここで、グループの外接矩形341内に存
在する文字パターン351全体の色と、図33(b)の
グループの外接矩形341内に抽出されないで残ってい
る原画像のパターンの色とを比較することにより、同色
パターンの再抽出を行う。
【0487】このため、「祝!ハソコン20年」という
文字パターン351全体の色と、「ハ」の半濁点の色と
を比較して、これらのパターンが同色かどうかの判定を
行うことが可能となり、図31(b)の同色グループ抽
出処理では抽出できなかった「ハ」の半濁点を抽出する
ことが可能となる。
【0488】また、同色パターンを再抽出する際の同色
とみなす範囲のしきい値を、既に抽出されている「祝!
ハソコン20年」という文字パターン351の色の変動
に基づいて設定する。
【0489】このため、タイトルを構成するパターンと
して既に抽出されている部分の色情報から、タイトルを
構成する残りのパターンを抽出することが可能となり、
同色パターンを抽出する際のしきい値として、抽出対象
となるパターンの色差を忠実に反映した値を用いること
が可能となり、図31(b)の同色グループ抽出処理で
は抽出できなかった「ハ」の半濁点を抽出することが可
能となる。
【0490】この結果、図34(a)の「祝!ハソコン
20年」という文字パターン351に対し、「ハ」の半
濁点を抽出することが可能となり、図31(a)の原画
像の文字パターン301に対応する文字パターン361
を抽出することが可能となる。
【0491】図35は、図31(a)の画像から抽出さ
れた第1候補のタイトルを示す図である。
【0492】図34(b)の例では、タイトル候補とし
て、2つのパターン361、362が抽出されているの
で、これらのパターン361、362に対応する外接矩
形341、342の面積を計算する。そして、面積の大
きい方のパターンをタイトルの第1候補として提示す
る。この結果、図35に示すように、図31(a)の原
画像から抽出された「祝!パソコン20年」という文字
パターン301をタイトルの第1候補として提示するこ
とができる。
【0493】
【発明の効果】以上説明したように、本発明によれば、
処理対象となるカラー画像の色数に基づいて、画像処理
を使い分けることにより、カラー画像の色数の違いに応
じた最適な画像処理を行うことが可能となり、画像処理
の精度を向上させることが可能となるとともに、画像処
理の高速化も図ることが可能となる。
【0494】また、本発明の一態様によれば、処理対象
となるカラー画像の色数に基づいて異なるラベリング方
法を用いることにより、色数の多いカラー画像の色の分
離精度を損ねることなく、色数の少ないカラー画像の同
色領域が微細な領域に分断されることを防止できる。
【0495】また、本発明の一態様によれば、フルカラ
ー画像以外のカラー画像を対象として、色パレットのク
ラスタリングを用いたラベリングを行うことにより、同
色領域の色のばらつきが大きい場合でも、同色領域を精
度良く抽出することが可能となる。また、フルカラー画
像を対象として、隣接拡張法を用いたラベリングを行う
ことにより、処理時間を短縮することが可能となるとと
もに、離れた領域の色の影響を受けることなく、同色領
域を抽出することが可能となる。
【0496】また、本発明の一態様によれば、ラベリン
グ対象となる画像の読み取り情報に基づいて、ラベリン
グのしきい値を各画像ごとに個別に設定することによ
り、各画像の色の変動を忠実に反映したしきい値を設定
することが可能となり、多種多様なカラー画像が入力さ
れた場合においても、同色領域を精度よく抽出すること
が可能となる。
【0497】また、本発明の一態様によれば、処理対象
となる入力画像の局所領域から色差情報を抽出すること
により、その入力画像の実際の色差を忠実に反映したラ
ベリングのしきい値を設定することが可能となり、多種
多様なカラー画像を対象として、同色領域を精度よく抽
出することが可能となる。
【0498】また、本発明の一態様によれば、カラー画
像を微細領域に分割し、この微細領域における色の分散
を調べることにより、様々な色が分布しているカラー画
像から同色領域を抽出することが可能となり、同色領域
の実際の色差を算出することが可能となる。
【0499】また、本発明の一態様によれば、色の分散
値が予め決められた範囲にある局所領域内の色の標準偏
差に基づいて、ラベリングの際のしきい値を決定するこ
とにより、灰色や中間色などの同色系統の色が文字と背
景とに使われている場合においても、同色系統の色が使
われている文字と背景とを区別して、文字のみを精度良
く抽出することが可能となる。
【0500】また、本発明の一態様によれば、人間の色
に対する識別特性に対応させて色変換を行うことによ
り、人間の色の識別特性に適合した同色領域の抽出が可
能となる。
【0501】また、本発明の一態様によれば、低彩度色
付近の色の色差を縮小することにより、低彩度色付近の
色の色空間上での距離が大きい場合においても、それら
の色を同色として抽出することが可能となるとともに、
高彩度色付近の色の色差を拡大することにより、高彩度
色付近の色の色空間上での距離が小さい場合において
も、それらの色を異なる色として抽出することが可能と
なり、同色と見なす色の範囲を人間の色の識別特性に適
合させることが可能となる。
【0502】また、本発明の一態様によれば、カラー画
像の色のクラスタリングを行い、同一のクラスタに属す
る色で連結している領域に同一のラベルを付すことによ
り、カラー画像の色の数を減らしてラベリングを行うこ
とが可能となり、処理を高速化することが可能となると
ともに、ラベリングのしきい値を予め定めておく必要を
なくして、同色領域の抽出精度を向上させることが可能
となる。
【0503】また、本発明の一態様によれば、カラー画
像の色成分ごとにそれぞれ独立に読み取り解像度を算出
することにより、CCDやスキャナなどの読み取り解像
度が色成分ごとに異なる場合や、カラー画像に用いられ
ている色の違いによって肉眼での分解能が異なる場合に
おいても、これらのことを考慮して同色領域を抽出する
ことが可能となり、カラー画像からの同色パターンの抽
出精度を向上させることが可能となる。
【0504】また、本発明の一態様によれば、画像が取
りうる全ての色の輝度値に対し、隣接画素間の色差の最
大値を色差テーブルに登録することにより、補間などの
演算を行うことなく、隣接画素間の色差の最大値を色差
テーブルから直接取得することが可能となり、ラベリン
グのしきい値を画像の色の輝度値ごとに高速に求めるこ
とが可能となる。
【0505】また、本発明の一態様によれば、画像を所
定の方向へ走査した際のラベル値の変化回数に基づい
て、画像内のパターンの輪郭長を算出することにより、
輪郭長の算出処理を高速化することが可能となる。
【0506】また、本発明の一態様によれば、パターン
のエッジを検出して輪郭長を算出する際に、走査方向に
連続するエッジをパターンの輪郭として検出するととも
に、1画素幅のパターンについては、輪郭が2回カウン
トされることを防止することにより、様々な形状のパタ
ーンの輪郭長を1度の走査で正確に算出することが可能
となる。
【0507】また、本発明の一態様によれば、同色グル
ープに属するパターンの文字認識を行うことにより、文
字でないパターンを抽出対象から除くことが可能とな
り、文字領域の抽出精度を向上させることが可能とな
る。
【0508】また、本発明の一態様によれば、同一グル
ープ内のパターンの太さの頻度分布を求めることによ
り、様々の太さのパターンが混在している場合において
も、同一の太さのパターンのみを同一のグループに分類
することが可能となり、タイトル領域の抽出精度を向上
させることが可能となる。
【0509】また、本発明の一態様によれば、外接矩形
同士の形状、大きさまたは位置関係がタイトル領域とし
て適切な場合には、外接矩形内のパターンの色が異なっ
ていても、同一のグループに分類することにより、タイ
トルを構成する文字に異なる色の文字が混在している場
合においても、タイトル領域を精度良く抽出することが
可能となる。
【0510】また、本発明の一態様によれば、抽出対象
のパターンではないと予め判っているものを、処理対象
から除外することにより、同色パターンの抽出精度を向
上させることが可能となる。
【0511】また、本発明の一態様によれば、L字形ま
たはコ字形のパターンを処理対象から除外することによ
り、背景の隅の部分が抽出対象の文字と同色の領域とし
て抽出された場合においても、背景の隅の部分が抽出対
象の文字と統合されることを防止することが可能とな
り、タイトル領域を精度良く抽出することが可能とな
る。
【0512】また、本発明の一態様によれば、抽出対象
として既に抽出されている領域の全体の色を考慮して、
外接矩形のグルーピングを行うことにより、外接矩形内
のパターンの色が徐々に変化する場合においても、抽出
対象となる領域の色と異なる色の領域が同一グループに
分類されることを防止することが可能となる。
【0513】また、本発明の一態様によれば、抽出され
たパターンの色情報に基づいて、同色かどうかを判定す
るしきい値を設定することにより、同一画像内におい
て、背景パターンの同色の範囲と文字パターンの同色の
範囲が異なる場合においても、文字パターンの色の変動
を忠実に反映したしきい値を設定することが可能とな
り、文字パターンのみを精度良く抽出することが可能と
なる。
【0514】また、本発明の一態様によれば、局所的に
見た時に色の変動がある場合においても、全体的に見た
時に同色となっている場合には、そのパターンを同色領
域として抽出することにより、印刷むらがある画像から
タイトルを抽出する場合などにおいても、タイトルを構
成するパターンの一部が欠落することを防止することが
可能となり、タイトルを精度良く抽出することが可能と
なる。
【図面の簡単な説明】
【図1】本発明の第1実施例に係わる画像処理装置の構
成を示すブロック図である。
【図2】本発明の第2実施例に係わる画像処理装置の構
成を示すブロック図である。
【図3】本発明の第3実施例に係わる画像処理装置の構
成を示すブロック図である。
【図4】本発明の第4実施例に係わるパターン抽出装置
の動作を示すフローチャートである。
【図5】本発明の一実施例に係わる印刷モデルの生成方
法を示す図である。
【図6】本発明の一実施例に係わる色差テーブルの構成
を示す図である。
【図7】本発明の一実施例に係わる読み取り解像度推定
方法を説明する図である。
【図8】本発明の一実施例に係わる色ラベリング処理を
説明する図である。
【図9】本発明の一実施例に係わる注目画素の周囲の8
画素を示す図である。
【図10】本発明の一実施例に係わるL字形パターンが
存在する場合の重なり統合結果を示す図である。
【図11】本発明の一実施例に係わる注目矩形の周囲の
探索範囲の設定方法を説明する図である。
【図12】本発明の一実施例に係わる注目矩形の周囲の
探索範囲にかかる矩形の抽出方法を説明する図である。
【図13】本発明の一実施例に係わる注目矩形の周囲の
探索範囲にかかる矩形情報の格納方法を説明する図であ
る。
【図14】本発明の一実施例に係わる同色グループの生
成方法を示す図である。
【図15】本発明の一実施例に係わる文字線の太さの算
出方法を説明する図である。
【図16】本発明の一実施例に係わる輪郭長獲得処理を
示すフローチャートである。
【図17】本発明の一実施例に係わる輪郭長獲得方法を
説明するためのパターンの具体例を示す図である。
【図18】本発明の一実施例に係わる文字線の太さによ
る再グルーピング処理を説明する図である。
【図19】本発明の一実施例に係わるグループ内の大き
な矩形削除処理を説明する図である。
【図20】本発明の一実施例に係わるグループ内の重な
り矩形統合処理を説明する図である。
【図21】本発明の一実施例に係わるグループ内文字列
抽出処理を説明する図である。
【図22】本発明の一実施例に係わる文字列内分離文字
統合処理を説明する図である。
【図23】本発明の一実施例に係わるグループ内の文字
列サイズによる再グループ化処理を説明する図である。
【図24】本発明の一実施例に係わるグループ統合処理
を説明する図である。
【図25】本発明の一実施例に係わる矩形並びによる文
字列らしいグループの抽出処理を説明する図である。
【図26】本発明の一実施例に係わるノイズグループの
削除処理を説明する図である。
【図27】本発明の一実施例に係わるグループ内同色パ
ターン抽出処理を説明する図である。
【図28】本発明の一実施例に係わる色信号の変換方法
を説明する図である。
【図29】本発明の一実施例に係わるクラスタリング結
果を用いた色ラベリング方法を説明する図である。
【図30】本発明の一実施例に係わるパターン抽出装置
のシステム構成を示すブロック図である。
【図31】(a)は、本発明の一実施例に係わる原画像
を示す図、(b)は、図31(a)のラベル画像を示す
図である。
【図32】(a)は、図31(b)のラベル画像に設定
された注目矩形を示す図、(b)はグループ抽出結果を
示す図である。
【図33】(a)は、図32(b)のグループ抽出結果
を文字線太さで再グループ化した結果を示す図、(b)
は、図32(a)の画像から矩形並びによる文字列らし
いグループを抽出した結果を示す図である。
【図34】(a)は、図33(b)の画像からグループ
内パターンを抽出した結果を示す図、(b)は、グルー
プ色に近いパターンの再抽出を行った結果を示す図であ
る。
【図35】図31(a)の画像から抽出された第1候補
のタイトルのパターンを示す図である。
【符号の説明】
1 入力画像 2 読み取り情報取得手段 3 同色範囲設定手段 4 ラベリング手段 5 グルーピング手段 6 グループ情報算出手段 7 色数判別手段 8 制御手段 9 第1のラベリング手段 10 第2のラベリング手段 14 画像処理装置 15 局所領域抽出手段 16 色差情報抽出手段 17 しきい値設定手段 241 CPU 242 ROM 243 RAM 244 通信インターフェース 245 通信ネットワーク 246 入出力インターフェース 247 ディスプレイ 248 プリンタ 249 メモリ 250 スキャナ 251 CCD 252 キーボード 253 ドライバ 254 ハードディスク 255 ICメモリカード 256 磁気テープ 257 フロッピーディスク 258 光ディスク 259 バス

Claims (46)

    【特許請求の範囲】
  1. 【請求項1】 第1の画像処理を行う第1の画像処理手
    段と、 第2の画像処理を行う第2の画像処理手段と、 処理対象となるカラー画像の色数に基づいて、前記第1
    の画像処理と前記第2の画像処理とを使い分ける制御手
    段とを備えることを特徴とする画像処理装置。
  2. 【請求項2】 カラー画像の色数を判別する色数判別手
    段と、 第1のラベリング方法によりラベリングを行う第1のラ
    ベリング手段と、 第2のラベリング方法によりラベリングを行う第2のラ
    ベリング手段と、 前記カラー画像の色数に基づいて、前記第1のラベリン
    グ手段または前記第2のラベリング手段にラベリングを
    行わせる制御手段とを備えることを特徴とする画像処理
    装置。
  3. 【請求項3】 前記第1のラベリング手段は、フルカラ
    ー画像以外のカラー画像を対象として、色パレットのク
    ラスタリングを用いたラベリングを行い、 前記第2のラベリング手段は、フルカラー画像を対象と
    して、隣接拡張法を用いたラベリングを行うことを特徴
    とする請求項2に記載の画像処理装置。
  4. 【請求項4】 入力画像の読み取り情報を取得する読み
    取り情報取得手段と、 前記入力画像の読み取り情報に基づいて、前記入力画像
    の同一とみなす色の範囲を設定する同色範囲設定手段
    と、 前記同色範囲設定手段で設定された色の範囲の連結画素
    に同一ラベルを付すことにより、前記入力画像のラベリ
    ングを行うラベリング手段とを備えることを特徴とする
    画像処理装置。
  5. 【請求項5】 前記入力画像の読み取り情報は、前記入
    力画像の色数、読み取り解像度、輝度値、彩度、隣接画
    素間の色差、または色の分散の少なくとも1つからなる
    ことを特徴とする請求項4に記載の画像処理装置。
  6. 【請求項6】 前記ラベリング手段は、前記入力画像の
    読み取り情報に基づいて、ラベリング方法を変更するこ
    とを特徴とする請求項4または5に記載の画像処理装
    置。
  7. 【請求項7】 前記ラベリング手段は、領域拡張法を用
    いたラベリング、または画像の色分布のクラスタリング
    を用いたラベリングを行うことを特徴とする請求項6に
    記載の画像処理装置。
  8. 【請求項8】 前記ラベリング手段は、カラー画像の類
    似色同士を同一のクラスタに分類するクラスタリング手
    段を備え、 同一のクラスタに属する色で連結している画素に同一の
    ラベルを付与することを特徴とする請求項4〜7のいず
    れか1項に記載の画像処理装置。
  9. 【請求項9】 前記読み取り情報取得手段は、 前記入力画像から局所領域を抽出する局所領域抽出手段
    と、 前記局所領域から前記入力画像の色差情報を抽出する色
    差情報抽出手段とを備え、 前記同色範囲設定手段は、前記色差情報に基づいて、前
    記入力画像のラベリングのしきい値を設定するしきい値
    設定手段を備えることを特徴とする請求項4〜8のいず
    れか1項に記載の画像処理装置。
  10. 【請求項10】 前記局所領域抽出手段は、前記入力画
    像を分割したメッシュ領域のうち、色の分散値が予め決
    められた範囲にあるメッシュ領域を抽出するメッシュ領
    域抽出手段を備え、 前記色差情報抽出手段は、前記抽出されたメッシュ領域
    内の色の標準偏差を算出する標準偏差算出手段を備え、 前記しきい値設定手段は、前記メッシュ領域ごとに求め
    られた標準偏差の平均値に基づいて、ラベリングのしき
    い値を設定することを特徴とする請求項9に記載の画像
    処理装置。
  11. 【請求項11】 前記ラベリング手段は、 同一のラベルが付与されている連結領域の平均色を算出
    する平均色算出手段と、 前記連結領域の平均色と前記連結領域に隣接する画素の
    色との間の色差を算出する色差算出手段とを備え、 前記色差が前記しきい値以下の場合に、前記画素に前記
    連結領域と同一のラベルを付与することを特徴とする請
    求項9または10に記載の画像処理装置。
  12. 【請求項12】 前記同色範囲設定手段は、第1の色に
    対する肉眼での色差の分解能と第2の色に対する肉眼で
    の色差の分解能とが一致するように、色信号の色変換を
    行う色変換手段を備えることを特徴とする請求項4〜1
    1のいずれか1項に記載の画像処理装置。
  13. 【請求項13】 前記色変換手段は、低彩度色付近の色
    の色差を縮小し、高彩度色付近の色の色差を拡大するこ
    とを特徴とする請求項12に記載の画像処理装置。
  14. 【請求項14】 前記読み取り情報取得手段は、カラー
    画像の読み取り解像度を各色成分ごとに算出する解像度
    算出手段を備え、 前記同色範囲設定手段は、各色成分ごとの読み取り解像
    度に基づいて、ラベリングのしきい値を設定することを
    特徴とする請求項4〜13のいずれか1項に記載の画像
    処理装置。
  15. 【請求項15】 前記ラベリング手段により生成された
    ラベルパターンのグルーピングを行うグルーピング手段
    を備えることを特徴とする請求項4〜14のいずれか1
    項に記載の画像処理装置。
  16. 【請求項16】 前記グルーピング手段は、特定の形状
    のパターンを設定するパターン設定手段を備え、 前記特定の形状のパターンをグルーピング対象から除外
    することを特徴とする請求項15に記載の画像処理装
    置。
  17. 【請求項17】 前記特定の形状は、L字形またはコ字
    形であることを特徴とする請求項16に記載の画像処理
    装置。
  18. 【請求項18】 前記グルーピング手段は、グルーピン
    グの対象となるパターンの探索範囲を設定する探索範囲
    設定手段を備えることを特徴とする請求項15〜17の
    いずれか1項に記載の画像処理装置。
  19. 【請求項19】 前記グルーピング手段は、前記同色範
    囲設定手段で設定された同一色の範囲のパターンを同一
    グループにグルーピングすることを特徴とする請求項1
    5〜18のいずれか1項に記載の画像処理装置。
  20. 【請求項20】 前記パターンの色は、同一ラベルが付
    されている画素の色の平均値であることを特徴とする請
    求項19に記載の画像処理装置。
  21. 【請求項21】 前記グルーピング手段は、同一ラベル
    が付されているパターンの外接矩形を生成する外接矩形
    生成手段を備え、 前記外接矩形の大きさ、形状または位置に基づいて、グ
    ルーピングを行うことを特徴とする請求項15〜20の
    いずれか1項に記載の画像処理装置。
  22. 【請求項22】 前記グルーピング手段は、 同一ラベルが付されているパターンの太さを算出する太
    さ算出手段を備え、 前記パターンの太さに基づいて、グルーピングを行うこ
    とを特徴とする請求項15〜21のいずれか1項に記載
    の画像処理装置。
  23. 【請求項23】 前記太さ算出手段は、 画像を所定の方向へ走査する走査手段と、 前記走査の際のラベル値の変化回数に基づいて、前記画
    像内のパターンの輪郭長を算出する輪郭長算出手段とを
    備えることを特徴とする請求項22に記載の画像処理装
    置。
  24. 【請求項24】 同一グループに分類されているパター
    ンの画像情報に基づいて、グループの画像情報を算出す
    るグループ情報算出手段を備え、 前記グルーピング手段は、前記グループの画像情報に基
    づいてパターンのグルーピングを行うことを特徴とする
    請求項15〜23のいずれか1項に記載の画像処理装
    置。
  25. 【請求項25】 前記グループ情報算出手段は、同一グ
    ループに分類されているパターンの色情報に基づいて、
    グループの色情報を算出する色情報算出手段を備えるこ
    とを特徴とする請求項24に記載の画像処理装置。
  26. 【請求項26】 前記グループの色情報は、同一グルー
    プに属するパターンの色の平均値であることを特徴とす
    る請求項25に記載の画像処理装置。
  27. 【請求項27】 前記グループ情報算出手段は、同一グ
    ループに分類されているパターンの色情報に基づいて、
    グルーピングのしきい値を算出することを特徴とする請
    求項25または26に記載の画像処理装置。
  28. 【請求項28】 前記グルーピング手段は、前記グルー
    プの色情報とグルーピング対象となるパターンの色情報
    との比較結果に基づいて、パターンのグルーピングを行
    うことを特徴とする請求項25〜27のいずれか1項に
    記載の画像処理装置。
  29. 【請求項29】 前記グルーピング手段は、グループの
    色情報の比較結果に基づいて、グループの統合を行うこ
    とを特徴とする請求項25〜28のいずれか1項に記載
    の画像処理装置。
  30. 【請求項30】 前記グループ情報算出手段は、 同一グループに属するパターン全体の外接矩形を生成す
    るグループ矩形生成手段と、 前記グループの外接矩形の形状、大きさ、または位置を
    算出する幾何学情報算出手段とを備え、 前記グルーピング手段は、前記グループの外接矩形の形
    状、大きさ、または位置に基づいて、グループの統合を
    行うことを特徴とする請求項24〜29のいずれか1項
    に記載の画像処理装置。
  31. 【請求項31】 前記グループ情報算出手段は、 同一グループ内のパターンの太さの頻度分布を生成する
    頻度分布生成手段と、 前記太さの頻度分布に基づいて、パターンの太さの同一
    とみなす範囲を設定する同一太さ設定手段とを備え、 前記グルーピング手段は、前記同一太さ設定手段により
    設定されたパターンの太さに基づいて、同一グループに
    属するパターンの再分類を行うことを特徴とする請求項
    24〜30のいずれか1項に記載の画像処理装置。
  32. 【請求項32】 前記グループ情報算出手段は、同一グ
    ループに属するパターンの文字認識を行う文字認識手段
    を備え、 前記グルーピング手段は、前記文字認識結果に基づい
    て、同一グループに属するパターンの再分類を行うこと
    を特徴とする請求項24〜31のいずれか1項に記載の
    画像処理装置。
  33. 【請求項33】 前記同色範囲設定手段は、同一グルー
    プに分類されているパターンの色情報に基づいて、ラベ
    リングのしきい値を算出することを特徴とする請求項2
    5〜32のいずれか1項に記載の画像処理装置。
  34. 【請求項34】 前記ラベリング手段は、グループの色
    情報と前記グループの外接矩形の範囲内の画素の色情報
    との比較結果に基づいて、前記グループに属するパター
    ンの再抽出を行うことを特徴とする請求項25〜33の
    いずれか1項に記載の画像処理装置。
  35. 【請求項35】 色の輝度値及び読み取り解像度を変数
    として、隣接画素間の色差の最大値を格納する色差テー
    ブルと、 入力画像から得られる隣接画素間の色差と前記色差テー
    ブルに格納されている色差とが最もよく一致する読み取
    り解像度を、3原色のそれぞれに対し個別に取得する解
    像度取得手段と、 前記3原色の読み取り解像度に基づいて、前記入力画像
    の読み取り解像度を算出する解像度算出手段と、 前記入力画像の読み取り解像度に対応する色差を、前記
    色差テーブルから取得する色差取得手段と、 前記色差テーブルから取得した色差に基づいて、ラベリ
    ングのしきい値を設定するしきい値設定手段と、 前記しきい値に基づいて、前記入力画像のラベリングを
    行うラベリング手段とを備えることを特徴とする画像処
    理装置。
  36. 【請求項36】 前記色差テーブルは、画像が取りうる
    全ての色の輝度値に対し、隣接画素間の色差の最大値が
    登録されたものであることを特徴とする請求項35に記
    載の画像処理装置。
  37. 【請求項37】 画像を所定の方向へ走査する走査手段
    と、 走査方向に対し、第1のラベル以外の画素から前記第1
    のラベルに変化する画素数を計数する第1の計数手段
    と、 前記走査方向に対し、前記第1のラベルが付された画素
    が2画素以上続いた後に、前記第1のラベルから前記第
    1のラベル以外の画素に変化する画素数を計数する第2
    の計数手段と、 前記第1のラベルが付された画素のうち、前記走査方向
    の隣接画素の両方が前記第1のラベルであり、かつ、前
    記走査方向と垂直方向の隣接画素の少なくとも一方が前
    記第1のラベル以外である画素数を計数する第3の計数
    手段とを備えることを特徴とする画像処理装置。
  38. 【請求項38】 予め定められた第1のしきい値と入力
    画像の色情報とを比較することにより、前記入力画像か
    ら同色領域を抽出する同色領域抽出手段と、 前記同色領域の色情報に基づいて、第2のしきい値を算
    出するしきい値算出手段と、 前記第2のしきい値と前記入力画像の色情報とを比較す
    ることにより、前記入力画像からの同色領域の再抽出を
    行う同色領域再抽出手段とを備えることを特徴とする画
    像処理装置。
  39. 【請求項39】 色に対する人間の識別特性を考慮し
    て、カラー画像から同色領域を抽出するしきい値を設定
    することを特徴とするパターン抽出方法。
  40. 【請求項40】 肉眼による分解能の低い色に対して
    は、同色とみなす色差のしきい値を大きくし、肉眼によ
    る分解能の高い色に対しては、同色とみなす色差のしき
    い値を小さくすることを特徴とする請求項39に記載の
    パターン抽出方法。
  41. 【請求項41】 入力画像から同色パターンの一部を抽
    出するステップと、 前記入力画像から抽出された同色パターンの色情報に基
    づいて、同色の範囲を定めるしきい値を設定するステッ
    プと、 前記しきい値に基づいて、前記同色パターンの残りの部
    分を抽出するステップとを備えることを特徴とするパタ
    ーン抽出方法。
  42. 【請求項42】 カラー画像の読み取り解像度を各色成
    分ごとに算出するステップと、 各色成分ごとの読み取り解像度に基づいて、前記カラー
    画像のラベリングのしきい値を設定するステップとを備
    えることを特徴とするラベリングのしきい値設定方法。
  43. 【請求項43】 画像を所定の方向へ走査するステップ
    と、 前記走査の際のラベル値の変化回数に基づいて、前記画
    像内のパターンの輪郭長を算出するステップとを備える
    ことを特徴とする輪郭長獲得方法。
  44. 【請求項44】 画像を読み取る際の色の輝度値に対応
    した隣接画素との色差の最大値を、読み取り解像度ごと
    に登録したデータ構造を備えることを特徴とするコンピ
    ュータ読み取り可能な記憶媒体。
  45. 【請求項45】 カラー画像の色数に基づいて、異なる
    ラベリング方法によりラベリングを行う機能を実行する
    プログラムを格納したコンピュータ読み取り可能な記憶
    媒体。
  46. 【請求項46】 入力画像の読み取り情報を取得するス
    テップと、 前記入力画像の読み取り情報に基づいて、前記入力画像
    のラベリングのしきい値を設定するステップと、 前記しきい値を用いることにより、前記入力画像のラベ
    リングを行うステップと、 前記ラベリングにより得られたラベルパターンのグルー
    ピングを行うステップと、 同一グループ内のパターンの画像情報に基づいて、グル
    ープの画像情報を取得するステップと、 前記グループの画像情報に基づいて、パターン抽出を行
    うステップとを実行するプログラムを格納したコンピュ
    ータ読み取り可能な記憶媒体。
JP35034298A 1998-12-09 1998-12-09 画像処理装置 Expired - Fee Related JP3748172B2 (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP35034298A JP3748172B2 (ja) 1998-12-09 1998-12-09 画像処理装置
US09/358,380 US6771813B1 (en) 1998-12-09 1999-07-21 Image processing apparatus and pattern extraction apparatus
US10/781,291 US7280688B2 (en) 1998-12-09 2004-02-19 Image processing apparatus and pattern extraction apparatus
US11/237,665 US7349571B2 (en) 1998-12-09 2005-09-29 Image processing apparatus and pattern extraction apparatus

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP35034298A JP3748172B2 (ja) 1998-12-09 1998-12-09 画像処理装置

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2005171549A Division JP4149464B2 (ja) 2005-06-10 2005-06-10 画像処理装置

Publications (2)

Publication Number Publication Date
JP2000172849A true JP2000172849A (ja) 2000-06-23
JP3748172B2 JP3748172B2 (ja) 2006-02-22

Family

ID=18409844

Family Applications (1)

Application Number Title Priority Date Filing Date
JP35034298A Expired - Fee Related JP3748172B2 (ja) 1998-12-09 1998-12-09 画像処理装置

Country Status (2)

Country Link
US (3) US6771813B1 (ja)
JP (1) JP3748172B2 (ja)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008524728A (ja) * 2004-12-21 2008-07-10 キヤノン株式会社 デジタル画像をセグメント化する方法及びコンパクトな表現の生成方法
WO2011086901A1 (ja) * 2010-01-13 2011-07-21 株式会社ニコンシステム 画像処理装置、撮像装置、および画像処理プログラム
JP2013048405A (ja) * 2011-07-22 2013-03-07 Nikon Corp 領域抽出装置、撮像装置、及び領域抽出プログラム
JP2013210702A (ja) * 2012-03-30 2013-10-10 Konica Minolta Inc 画像処理装置及び画像形成装置
JP2018060567A (ja) * 2017-11-24 2018-04-12 株式会社ニコン 画像処理装置
CN113727085A (zh) * 2021-05-31 2021-11-30 荣耀终端有限公司 一种白平衡处理方法和电子设备
JP7380295B2 (ja) 2020-02-14 2023-11-15 富士電機株式会社 飲料供給装置

Families Citing this family (72)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020001096A1 (en) * 2000-04-28 2002-01-03 Kenro Hama Image processor for detecting specified pattern
KR100374604B1 (ko) * 2000-05-31 2003-03-04 삼성전자주식회사 영상의 패턴 반복 기술 방법 및 그 영상 응집화 방법
JP4586241B2 (ja) * 2000-06-14 2010-11-24 コニカミノルタビジネステクノロジーズ株式会社 画像処理装置
US6795068B1 (en) * 2000-07-21 2004-09-21 Sony Computer Entertainment Inc. Prop input device and method for mapping an object from a two-dimensional camera image to a three-dimensional space for controlling action in a game program
JP2002183166A (ja) * 2000-12-19 2002-06-28 Nec Corp ドキュメントファイリングシステムおよび方法
EP1220182A3 (en) * 2000-12-25 2005-08-17 Matsushita Electric Industrial Co., Ltd. Image detection apparatus, program, and recording medium
JP4263416B2 (ja) * 2001-08-24 2009-05-13 株式会社日立製作所 荷電粒子顕微鏡評価システム
US7119924B2 (en) * 2001-09-28 2006-10-10 Xerox Corporation Detection and segmentation of sweeps in color graphics images
CN1271565C (zh) * 2001-10-11 2006-08-23 国际商业机器公司 颜色位图归一化
US7162077B2 (en) * 2001-10-19 2007-01-09 Sharp Laboratories Of America, Inc. Palette-based image compression method, system and data file
US6985628B2 (en) * 2002-01-07 2006-01-10 Xerox Corporation Image type classification using edge features
US6996277B2 (en) * 2002-01-07 2006-02-07 Xerox Corporation Image type classification using color discreteness features
JP3888176B2 (ja) * 2002-02-15 2007-02-28 三菱電機株式会社 色変換装置、および色変換方法
US8561167B2 (en) 2002-03-08 2013-10-15 Mcafee, Inc. Web reputation scoring
US20060015942A1 (en) 2002-03-08 2006-01-19 Ciphertrust, Inc. Systems and methods for classification of messaging entities
US8578480B2 (en) * 2002-03-08 2013-11-05 Mcafee, Inc. Systems and methods for identifying potentially malicious messages
US7176937B2 (en) * 2003-09-23 2007-02-13 Honeywell International, Inc. Methods and apparatus for displaying multiple data categories
US8133115B2 (en) 2003-10-22 2012-03-13 Sony Computer Entertainment America Llc System and method for recording and displaying a graphical path in a video game
JP4423076B2 (ja) * 2004-03-22 2010-03-03 キヤノン株式会社 認識対象切出し装置および方法
JP4441300B2 (ja) * 2004-03-25 2010-03-31 株式会社リコー 画像処理装置、画像処理方法、画像処理プログラムおよびこのプログラムを記憶した記録媒体
EP1770641A4 (en) * 2004-06-22 2008-11-12 Seiko Epson Corp COLORING ASSISTANCE SYSTEM AND PROGRAM, STORAGE MEDIUM, AND COLORING ASSISTANCE METHOD
US7561738B2 (en) * 2004-09-22 2009-07-14 Microsoft Corporation Symbol grouping and recognition in expression recognition
US20060071933A1 (en) 2004-10-06 2006-04-06 Sony Computer Entertainment Inc. Application binary interface for multi-pass shaders
US8635690B2 (en) 2004-11-05 2014-01-21 Mcafee, Inc. Reputation based message processing
JP4720529B2 (ja) * 2005-03-10 2011-07-13 富士ゼロックス株式会社 画像処理装置、画像形成装置、画像処理方法及びプログラム
US7630544B1 (en) * 2005-04-06 2009-12-08 Seiko Epson Corporation System and method for locating a character set in a digital image
KR100727935B1 (ko) * 2005-05-24 2007-06-14 삼성전자주식회사 이미지 보정 방법 및 장치
US7636126B2 (en) 2005-06-22 2009-12-22 Sony Computer Entertainment Inc. Delay matching in audio/video systems
US7539349B2 (en) * 2005-10-25 2009-05-26 Hewlett-Packard Development Company, L.P. Clear image using pixel voting
JP4555212B2 (ja) * 2005-11-10 2010-09-29 株式会社沖データ 透かし情報埋め込み装置,透かし情報埋め込み方法,およびコンピュータプログラム
JP4631749B2 (ja) * 2006-03-03 2011-02-16 富士ゼロックス株式会社 情報処理装置、および情報処理方法、並びにコンピュータ・プログラム
US7965859B2 (en) 2006-05-04 2011-06-21 Sony Computer Entertainment Inc. Lighting control of a user environment via a display device
US7880746B2 (en) 2006-05-04 2011-02-01 Sony Computer Entertainment Inc. Bandwidth management through lighting control of a user environment via a display device
US20070285685A1 (en) * 2006-06-12 2007-12-13 Kabushiki Kaisha Toshiba Image forming apparatus and image forming method
US8270709B2 (en) 2006-08-31 2012-09-18 Corel Corporation Color selection and/or matching in a color image
US8947452B1 (en) * 2006-12-07 2015-02-03 Disney Enterprises, Inc. Mechanism for displaying visual clues to stacking order during a drag and drop operation
US8207969B1 (en) * 2006-12-14 2012-06-26 Disney Enterprises, Inc. Method of abstracting a graphical object in a line art style suitable for printing and artwork-coloring
US8214497B2 (en) 2007-01-24 2012-07-03 Mcafee, Inc. Multi-dimensional reputation scoring
US8763114B2 (en) * 2007-01-24 2014-06-24 Mcafee, Inc. Detecting image spam
US7779156B2 (en) 2007-01-24 2010-08-17 Mcafee, Inc. Reputation based load balancing
JP2008236223A (ja) * 2007-03-19 2008-10-02 Kyocera Mita Corp 画像処理装置、及び画像処理プログラム
JP4993093B2 (ja) * 2007-05-31 2012-08-08 富士ゼロックス株式会社 画像処理装置および画像処理プログラム
US8014596B2 (en) * 2007-10-30 2011-09-06 Sharp Laboratories Of America, Inc. Methods and systems for background color extrapolation
US8185930B2 (en) 2007-11-06 2012-05-22 Mcafee, Inc. Adjusting filter or classification control settings
US20090125980A1 (en) * 2007-11-09 2009-05-14 Secure Computing Corporation Network rating
US8589503B2 (en) 2008-04-04 2013-11-19 Mcafee, Inc. Prioritizing network traffic
US8094917B2 (en) * 2008-04-14 2012-01-10 Primax Electronics Ltd. Method for detecting monetary banknote and performing currency type analysis operation
US20090260947A1 (en) * 2008-04-18 2009-10-22 Xu-Hua Liu Method for performing currency value analysis operation
US8085972B2 (en) * 2008-07-03 2011-12-27 Primax Electronics Ltd. Protection method for preventing hard copy of document from being released or reproduced
US7844098B2 (en) * 2008-07-21 2010-11-30 Primax Electronics Ltd. Method for performing color analysis operation on image corresponding to monetary banknote
US20100124372A1 (en) * 2008-11-12 2010-05-20 Lockheed Martin Corporation Methods and systems for identifying/accessing color related information
JP5173898B2 (ja) * 2009-03-11 2013-04-03 キヤノン株式会社 画像処理方法、画像処理装置、及びプログラム
JP2011013898A (ja) * 2009-07-01 2011-01-20 Canon Inc 画像処理装置、画像処理方法、及び、プログラム
US8406554B1 (en) * 2009-12-02 2013-03-26 Jadavpur University Image binarization based on grey membership parameters of pixels
GB2477116B (en) * 2010-01-22 2014-09-17 Frederick Warwick Michael Stentiford A method and apparatus of processing an image
US10786736B2 (en) 2010-05-11 2020-09-29 Sony Interactive Entertainment LLC Placement of user information in a game space
US8621638B2 (en) 2010-05-14 2013-12-31 Mcafee, Inc. Systems and methods for classification of messaging entities
US8600158B2 (en) 2010-11-16 2013-12-03 Hand Held Products, Inc. Method and system operative to process color image data
US8571307B2 (en) 2010-11-16 2013-10-29 Hand Held Products, Inc. Method and system operative to process monochrome image data
JP4893861B1 (ja) * 2011-03-10 2012-03-07 オムロン株式会社 文字列検知装置、画像処理装置、文字列検知方法、制御プログラムおよび記録媒体
US20120313927A1 (en) * 2011-06-09 2012-12-13 Visual Technology Services Limited Color mesh compression
US9342817B2 (en) 2011-07-07 2016-05-17 Sony Interactive Entertainment LLC Auto-creating groups for sharing photos
JP5953953B2 (ja) * 2012-06-06 2016-07-20 株式会社リコー 画像認識装置、画像認識方法及びプログラム
US10395297B1 (en) * 2012-11-13 2019-08-27 Amazon Technologies, Inc. Social media data matching
WO2015006275A1 (en) * 2013-07-09 2015-01-15 3M Innovative Properties Company Systems and methods for note content extraction and management using segmented notes
US9545582B2 (en) * 2013-08-23 2017-01-17 Evollve, Inc. Robotic activity system using color patterns
JP2015187602A (ja) * 2014-03-14 2015-10-29 株式会社リコー 測色装置、方法、及びプログラム
US10084941B2 (en) 2014-04-30 2018-09-25 Hewlett-Packard Development Company, L.P. Generating color similarity measures
US10810240B2 (en) * 2015-11-06 2020-10-20 RedShred LLC Automatically assessing structured data for decision making
US10482344B2 (en) * 2018-01-04 2019-11-19 Wipro Limited System and method for performing optical character recognition
CN110490027B (zh) * 2018-05-15 2023-06-16 触景无限科技(北京)有限公司 人脸特征提取训练方法及系统
US20230064963A1 (en) * 2021-08-25 2023-03-02 Verizon Patent And Licensing Inc. Feature Detection Methods and Systems Using Deconstructed Color Image Data

Family Cites Families (49)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62214481A (ja) * 1986-03-17 1987-09-21 Nec Corp 画質判定装置
JPS6336482A (ja) 1986-07-31 1988-02-17 Matsushita Electric Ind Co Ltd 画像の領域分割方式
US5130791A (en) * 1988-07-15 1992-07-14 Konica Corporation Color image processing apparatus
JP2885823B2 (ja) * 1989-04-11 1999-04-26 株式会社豊田中央研究所 視覚認識装置
JPH0828786B2 (ja) * 1989-12-21 1996-03-21 富士ゼロックス株式会社 画像記録装置
JPH0437963A (ja) 1990-06-01 1992-02-07 Canon Inc 画像処理装置
JP3072776B2 (ja) * 1990-12-19 2000-08-07 キヤノン株式会社 画像処理装置
US5982944A (en) * 1991-09-27 1999-11-09 E. I. Du Pont De Nemours And Company Adaptive vision system using dual thresholding
US5418865A (en) * 1992-03-20 1995-05-23 Xerox Corporation Mark sensing on a form
JPH05298443A (ja) 1992-04-20 1993-11-12 Takaoka Electric Mfg Co Ltd カラー画像領域抽出装置
US5418862A (en) * 1992-08-10 1995-05-23 United Parcel Service Of America Method and apparatus for detecting artifact corners in two-dimensional images
JPH06103371A (ja) 1992-09-18 1994-04-15 Daikin Ind Ltd カラー画像処理方法およびその装置
NL9201761A (nl) * 1992-10-12 1994-05-02 Oce Nederland Bv Werkwijze voor het aan een met een kleurenweergeefsysteem af te beelden beeldpunt toekennen van een pertinente indicatie in relatie met kleurgedrag, alsmede een kleurenweergeefsysteem ingericht voor het uitvoeren van een dergelijke werkwijze.
US6272238B1 (en) * 1992-12-28 2001-08-07 Canon Kabushiki Kaisha Character recognizing method and apparatus
JP2800633B2 (ja) * 1993-04-30 1998-09-21 富士ゼロックス株式会社 画像符号化装置
JPH0721379A (ja) 1993-06-22 1995-01-24 Matsushita Electric Ind Co Ltd 画像色領域認識装置
JP3483912B2 (ja) 1993-07-29 2004-01-06 株式会社東芝 色判別装置および色判別方法
EP1158453B1 (en) * 1993-12-10 2008-08-27 Ricoh Company, Ltd. Image extraction method and apparatus, and image recognition method and apparatus, for extracting/recognizing specific image from input image signal
US5504846A (en) * 1993-12-16 1996-04-02 International Business Machines Corporation Method and apparatus for improved area demarcation in bit mapped image derived from multi-color bit mapped image
JP3595579B2 (ja) * 1994-08-26 2004-12-02 キヤノン株式会社 画像処理装置及び画像処理方法
US5802361A (en) * 1994-09-30 1998-09-01 Apple Computer, Inc. Method and system for searching graphic images and videos
JPH08167028A (ja) 1994-12-13 1996-06-25 Toppan Printing Co Ltd 画像処理方法
DE19518930A1 (de) * 1995-05-23 1996-11-28 Siemens Ag Verfahren zur Verbindungssteuerung für interaktive Dienste
US5649021A (en) * 1995-06-07 1997-07-15 David Sarnoff Research Center, Inc. Method and system for object detection for instrument control
JPH08339421A (ja) 1995-06-13 1996-12-24 Kobe Steel Ltd 画像の文字領域決定方法
JPH096946A (ja) 1995-06-22 1997-01-10 Toshiba Corp 画像処理方法及びその装置
JP3178305B2 (ja) * 1995-06-29 2001-06-18 オムロン株式会社 画像処理方法及び装置並びにそれを搭載した複写機,スキャナ及びプリンター
JP3060902B2 (ja) * 1995-06-30 2000-07-10 オムロン株式会社 画像処理装置及び画像処理方法
US5912980A (en) * 1995-07-13 1999-06-15 Hunke; H. Martin Target acquisition and tracking
US5912994A (en) * 1995-10-27 1999-06-15 Cerulean Colorization Llc Methods for defining mask of substantially color-homogeneous regions of digitized picture stock
JPH09274660A (ja) * 1996-04-05 1997-10-21 Omron Corp 画像認識方法及び装置並びにそれを搭載した複写機及びスキャナ
JP3778229B2 (ja) * 1996-05-13 2006-05-24 富士ゼロックス株式会社 画像処理装置、画像処理方法、および画像処理システム
US5956468A (en) * 1996-07-12 1999-09-21 Seiko Epson Corporation Document segmentation system
US6088469A (en) * 1996-09-30 2000-07-11 Sony Corporation Identifying apparatus and method, position detecting apparatus and method, robot apparatus and color extracting apparatus
US6343141B1 (en) * 1996-10-08 2002-01-29 Lucent Technologies Inc. Skin area detection for video image systems
US5949905A (en) * 1996-10-23 1999-09-07 Nichani; Sanjay Model-based adaptive segmentation
US6351558B1 (en) * 1996-11-13 2002-02-26 Seiko Epson Corporation Image processing system, image processing method, and medium having an image processing control program recorded thereon
US5974228A (en) * 1997-01-28 1999-10-26 Hewlett-Packard Company Image rendition by plural-row error diffusion, for faster operation and smaller integrated circuits
US6137903A (en) * 1997-06-03 2000-10-24 Linotype-Hell Ag Color transformation system based on target color image
JP3598737B2 (ja) * 1997-06-09 2004-12-08 富士ゼロックス株式会社 カラー画像転送処理装置及び方法、カラー画像復元処理装置及び方法、並びにカラー画像転送システム
US6118787A (en) * 1997-06-27 2000-09-12 Advanced Micro Devices, Inc. Apparatus and method for regulating assigned bandwidth in high speed packet switched networks
AUPO960297A0 (en) * 1997-10-03 1997-10-30 Canon Information Systems Research Australia Pty Ltd Colour advising and selection method
JP3350422B2 (ja) * 1997-11-12 2002-11-25 京セラミタ株式会社 網点領域判定装置
JP3345350B2 (ja) * 1998-05-27 2002-11-18 富士通株式会社 文書画像認識装置、その方法、及び記録媒体
US6516100B1 (en) * 1998-10-29 2003-02-04 Sharp Laboratories Of America, Inc. Method for image characterization using color and texture statistics with embedded spatial information
US6512850B2 (en) * 1998-12-09 2003-01-28 International Business Machines Corporation Method of and apparatus for identifying subsets of interrelated image objects from a set of image objects
US6574374B1 (en) * 1999-04-14 2003-06-03 Intel Corporation Enhancing image compression performance by morphological processing
US6512845B1 (en) * 1999-07-20 2003-01-28 Canon Kabushiki Kaisha Iterative approximation of color patch area
US6529850B2 (en) * 2001-02-01 2003-03-04 Thomas Brian Wilborn Apparatus and method of velocity estimation

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008524728A (ja) * 2004-12-21 2008-07-10 キヤノン株式会社 デジタル画像をセグメント化する方法及びコンパクトな表現の生成方法
WO2011086901A1 (ja) * 2010-01-13 2011-07-21 株式会社ニコンシステム 画像処理装置、撮像装置、および画像処理プログラム
JP2013048405A (ja) * 2011-07-22 2013-03-07 Nikon Corp 領域抽出装置、撮像装置、及び領域抽出プログラム
JP2017201818A (ja) * 2011-07-22 2017-11-09 株式会社ニコン 領域抽出装置
JP2013210702A (ja) * 2012-03-30 2013-10-10 Konica Minolta Inc 画像処理装置及び画像形成装置
JP2018060567A (ja) * 2017-11-24 2018-04-12 株式会社ニコン 画像処理装置
JP7380295B2 (ja) 2020-02-14 2023-11-15 富士電機株式会社 飲料供給装置
CN113727085A (zh) * 2021-05-31 2021-11-30 荣耀终端有限公司 一种白平衡处理方法和电子设备
CN113727085B (zh) * 2021-05-31 2022-09-16 荣耀终端有限公司 一种白平衡处理方法、电子设备、芯片系统和存储介质

Also Published As

Publication number Publication date
US20060023940A1 (en) 2006-02-02
US7349571B2 (en) 2008-03-25
US7280688B2 (en) 2007-10-09
JP3748172B2 (ja) 2006-02-22
US6771813B1 (en) 2004-08-03
US20040175031A1 (en) 2004-09-09

Similar Documents

Publication Publication Date Title
JP3748172B2 (ja) 画像処理装置
JP3748164B2 (ja) パターン抽出装置
JP4764231B2 (ja) 画像処理装置、制御方法、コンピュータプログラム
JP4149464B2 (ja) 画像処理装置
US20100239166A1 (en) Character recognition device, image-reading device, computer readable medium, and character recognition method
JPH11238098A (ja) 文字列抽出装置及びパターン抽出装置
JP4275866B2 (ja) カラー画像から文字列パターンを抽出する装置および方法
JP3851742B2 (ja) 帳票処理方法及び装置
CN113971792A (zh) 交通标志牌的字符识别方法、装置、设备和存储介质
JP4211941B2 (ja) パターン抽出装置
CN113392819B (zh) 一种批量化学术图像自动分割标注装置和方法
CN114926829A (zh) 一种证件检测方法、装置、电子设备及存储介质
JP3476595B2 (ja) 画像領域分割方法、および画像2値化方法
JP2005210650A (ja) 画像処理装置
JP4507656B2 (ja) 画像処理装置
JP4228905B2 (ja) 画像処理装置及びプログラム
JP2003271973A (ja) 画像処理方法および画像処理プログラム
JP2005184404A (ja) 画像処理装置
JP4193687B2 (ja) 画像処理装置及びプログラム
JP2613211B2 (ja) 画像入力装置
JP2001043312A (ja) 文書画像処理装置
JP2003216958A (ja) 多角形検出装置、多角形検出方法及び多角形検出プログラム
JP2001143076A (ja) 画像処理装置
JP4311183B2 (ja) 画像処理装置及びプログラム
CN117011855A (zh) 一种字符串图像切割识别方法、系统和可读存储介质

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20050325

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20050412

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050610

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20051122

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20051124

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091209

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091209

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101209

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111209

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111209

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121209

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121209

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131209

Year of fee payment: 8

LAPS Cancellation because of no payment of annual fees