JPH0856287A

JPH0856287A - 画像識別装置

Info

Publication number: JPH0856287A
Application number: JP6191536A
Authority: JP
Inventors: Toshitake Hirasawa; 利勇平沢; Kunihiro Shibuya; 邦弘渋谷
Original assignee: Toshiba Corp
Current assignee: Toshiba Corp
Priority date: 1994-08-15
Filing date: 1994-08-15
Publication date: 1996-02-27

Abstract

(57)【要約】【目的】局所領域における濃度変化の少ない写真領域お
よびＹＭＣの配置から生じる網点（印刷）領域の色分布
の違いを基に、確実に文字／線画（印刷）領域と区別が
できる画像識別装置を提供する。【構成】文字／線画領域、網点領域、および、写真領域
が混在する読取対象物Ｐから、画像入力部３およびカラ
ー画像入力部４によってＲＧＢの画像データを入力す
る。ＣＰＵ９は、その入力された各画像データに対して
少なくとも２つ以上の主成分方向の分散値を求め、この
求められた各分散値から文字／線画領域、網点領域、お
よび、写真領域を識別し、その識別結果に基づき所定の
画像処理を行なう。

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】本発明は、原稿などの被読取物上
に印刷された文字／線画領域、網点領域、および写真領
域を画像処理によって識別する画像識別装置に関する。

【０００２】

【従来の技術】一般に、ハードコピーされた画像は、文
字または等高線等の線図などの線画を有する画像領域
（以下、文字／線画（印刷）領域と呼ぶ）、写真や油絵
のように連続調で濃淡を表現している領域（以下、写真
領域と呼ぶ）、および、網版の印刷物のように網点の大
小による面積階調で濃淡を表現している領域（以下、網
点（印刷）領域と呼ぶ）からなっている。

【０００３】これらの画像領域をスキャナなどの読取手
段で読取って、再び画像を表示したり記録する際には、
文字／線画領域の鮮鋭度向上に対して写真領域の滑らか
さ向上や、網点領域のモアレ除去という相反する要求に
対応する必要性から、画像処理によって各画像領域を識
別する処理技術が重要であり、特にカラー記録（カラー
表示）の際の画質向上のために必須の技術である。ま
た、この画像識別技術は、絵柄が混在した画像からの文
字抽出などにも活用できる。

【０００４】一般に、文字／線画（印刷）領域と写真領
域とを分離する方法として、ブロック内の濃度変化の大
小を利用することが多いが、文字／線画（印刷）領域と
網点（印刷）領域との分離は困難である。文字／線画
（印刷）、写真、網点（印刷）の３つの領域を分離する
方法としては、文献「網点写真の識別処理方法」（電子
情報通信学会論文誌’８７／２Ｖｏｌ．Ｊ７０−Ｂ
Ｎｏ．２）において、「ブロック分離変換法」（Ｂｌｏ
ｃｋＳｅｐａｒａｔｅＴｒａｎｓｆｏｒｍａｔｉｏ
ｎＭｅｔｈｏｄ：ＢＥＳＴ法）が提案されている。

【０００５】この方法は、対象画像をブロックに分割
し、ブロック内の濃度変化により３つの領域を分離する
方法である。その際、・写真はブロック内の濃度変化が小さい・文字／線画（印刷）および網点（印刷）はブロック内
の濃度変化が大きい・文字／線画（印刷）は濃度変化の周期が大きい・網点（印刷）は濃度変化の周期が小さいといった濃度変化の性質を利用する。以下に、その詳細
を説明する。

【０００６】（１）対象画像を（ｍ×ｎ）画素のブロッ
クに分割する。（２）ブロック内の最大濃度信号Ｄmax と最小濃度信号
Ｄmin を求め、ブロック内の最大濃度差信号△Ｄmax を
算出する。

【０００７】△Ｄmax ＝Ｄmax −Ｄmin （３）あらかじめ設定した閾値Ｔｈ１と△Ｄmax とを比
較し、以下の条件で写真領域と非写真領域（文字／線画
（印刷）および網点（印刷）領域）とを分離する。

【０００８】△Ｄmax ≦Ｔｈ１……写真領域 △Ｄmax ＞Ｔｈ１……非写真領域（４）ブロック内信号の平均信号Ｄａでブロック内の各
画素を２値化する。

【０００９】（５）ブロック内の主走査方向に連続する
画素間の０，１変化回数Ｋｈを求める。同様に、副走査
方向についても変化回数Ｋｖを求める。（６）あらかじめ設定した閾値Ｔｈ２とＫｈ，Ｋｖとを
それぞれ比較し、以下の条件で文字／線画（印刷）領域
と網点（印刷）領域とを分離する。

【００１０】Ｋｈ≧Ｔｈ２かつＫｖ≧Ｔｈ２……網
点（印刷）領域Ｋｈ＜Ｔｈ２かつＫｖ＜Ｔｈ２……文字／線画（印
刷）領域以上の手順で、文字／線画（印刷）、写真、網点（印
刷）領域を分離でき、各領域に対して適切な画像処理を
施すことが可能となる。

【００１１】

【発明が解決しようとする課題】一般に、網点（印刷）
画像は、６５〜２００線にわたる多種の線種がある。こ
のため、上述した従来の技術は、高い線数の網点につい
ては有効であるが、低い線数の網点写真の場合は文字
（線）と特徴が類似しているため、分離が困難であると
いう問題があった。

【００１２】そこで、本発明は、局所領域における濃度
変化の少ない写真領域およびＹＭＣの配置から生じる網
点（印刷）領域の色分布の違いを基に、確実に文字／線
画（印刷）領域と区別ができる画像識別装置を提供する
ことを目的とする。

【００１３】

【課題を解決するための手段】本発明の画像識別装置
は、文字／線画領域、網点領域、および写真領域が含ま
れる被読取物から複数の色成分に関するデータを収集す
る画像入力手段と、この画像入力手段によって収集され
た前記複数の色成分に関するデータに対して少なくとも
２つ以上の主成分方向の分散値を求める算出手段と、こ
の算出手段によって求められた各分散値から前記文字／
線画領域、網点領域、および写真領域をそれぞれ識別す
る識別手段と、この識別手段の識別結果に基づき所定の
画像処理を行なう画像処理手段とを具備している。

【００１４】また、本発明の画像識別装置は、文字／線
画領域、網点領域、および写真領域が含まれる被読取物
から複数の色成分に関するデータを収集する画像入力手
段と、この画像入力手段によって収集された前記複数の
色成分に関するデータに対して色成分空間における直線
方向への射影処理を行なうことにより濃度頻度分布を求
める算出手段と、この算出手段によって求められた濃度
頻度分布に基づき前記文字／線画領域、網点領域、およ
び写真領域をそれぞれ識別する識別手段と、この識別手
段の識別結果に基づき所定の画像処理を行なう画像処理
手段とを具備している。

【００１５】また、本発明の画像識別装置は、文字／線
画領域、網点領域、および写真領域が含まれる被読取物
から複数の色成分に関するデータを収集する画像入力手
段と、この画像入力手段によって収集された前記複数の
色成分に関するデータの生成頻度を求める算出手段と、
この算出手段によって求められた生成頻度の極大点を検
出する検出手段と、この検出手段で検出された極大点の
数により前記文字／線画領域、網点領域、および写真領
域をそれぞれ識別する識別手段と、この識別手段の識別
結果に基づき所定の画像処理を行なう画像処理手段とを
具備している。

【００１６】さらに、本発明の画像識別装置は、文字／
線画領域、網点領域、および写真領域が含まれる被読取
物から複数の色成分に関するデータを収集する画像入力
手段と、この画像入力手段によって収集された前記複数
の色成分に関するデータの生成頻度を求める算出手段
と、この算出手段によって求められた生成頻度に基づき
所定頻度以上を持つ色数を計数する計数手段と、この計
数手段で計数された色数により前記文字／線画領域、網
点領域、および写真領域をそれぞれ識別する識別手段
と、この識別手段の識別結果に基づき所定の画像処理を
行なう画像処理手段とを具備している。

【００１７】

【作用】本発明は、局所領域における文字／線画（印
刷）領域と網点（印刷）領域との３次元濃度頻度分布を
定量化して分離を行なうことにより、局所領域における
濃度変化の少ない写真領域およびＹＭＣの配置から生じ
る網点（印刷）領域の色分布の違いを基に、確実に文字
／線画（印刷）領域と区別ができる。

【００１８】

【実施例】以下、本発明の実施例について図面を参照し
て説明する。図１は、本実施例に係る画像識別装置の構
成を概略的に示すものである。すなわち、この画像識別
装置は、レンズなどの光学系１およびカラーラインセン
サ２からなり、読取対象物Ｐ上のカラー画像を収集して
入力する画像入力部３、カラーラインセンサ２の出力信
号をデジタル信号に変換するカラー画像入力部４、カラ
ー画像入力部４から出力される３色の各画像データをそ
れぞれ記憶する第１，第２，第３画像メモリ（フレーム
メモリ）５，６，７、第１，第２，第３画像メモリ５，
６，７に画像データを記憶するための制御を行なうメモ
リ制御部８、本装置全体の制御を司るＣＰＵ（セントラ
ル・プロセッシング・ユニット）９、第１，第２，第３
画像メモリ５，６，７に対して画像処理を行なうＣＰＵ
９の処理プログラムなどが格納されたプログラムメモリ
１０、画像処理を行なう上で識別基準となるパラメータ
などが格納されているメモリ１１、オペレータが本装置
の操作を指示するためのキーボードなどからなる入力装
置１２、画像処理の結果などを出力するためのプリンタ
およびディスプレイなどからなる出力装置１３、データ
バス１４、および、アドレスバス１５などから構成され
ている。

【００１９】ここで、識別領域となる文字／線画（印
刷）と網点（印刷）の一例を図２および図３に示す。図
２に示すような文字／線画（印刷）を含む局所領域にお
いては、Ｒ（赤），Ｇ（緑），Ｂ（青）による色の３次
元濃度分布をみると、たとえば、文字／線画（印刷）が
緑色の場合、図４に示すように（説明の都合上、２次元
に投影した濃度頻度分布を示す）、線分状に分布する。
このように、線分状に濃度頻度分布が配置されるのは、
（１）下地色の上に色インキが印刷され、混色したこと
により生じた色むら、（２）光学系１およびカラーライ
ンセンサ２のカラー画像入力系にて線と下地との境界読
取時に発生した誤差、の２つの原因が主にあげられる。
したがって、図４の例では、読取対象物Ｐの下地色から
文字／線画色への線分状の分布が存在する。

【００２０】一方、図３に示すように、網点（印刷）領
域の場合、ブラック（Ｂｋ）を除いたイエロー（Ｙ）、
マゼンダ（Ｍ）、シアン（Ｃ）の各網点ともに同一の地
点、かつ、同一の大きさで画点を形成することはないた
め、ＲＧＢによる色の３次元濃度頻度分布をみると、た
とえば、図５に示すように（説明の都合上、２次元に投
影した濃度頻度分布を示す）、複数方向に広がりを持つ
ことになる。

【００２１】また、写真領域の場合、一般に局所領域に
おける濃度変化は小さいため、たとえば、図６に示すよ
うに、ある頻度を中心に分布が集中する。本実施例の画
像識別装置では、上述したような文字／線画（印刷）部
を含む局所領域と、それ以外の非文字／線画（印刷）の
局所領域を、ＲＧＢの３次元濃度分布の違いを定量化し
て識別を行なうものである。

【００２２】以下、第１の実施例について説明する。こ
の場合、上述したＲＧＢの３次元濃度頻度分布の違い
を、主成分分析により第１〜第３主成分の分散を用いて
定量化し、文字／線画（印刷）部を含む局所領域の分離
を実現する。

【００２３】図１において、図示矢印方向に搬送される
読取対象物Ｐに対して、図示しない光源からの光が照射
される。読取対象物Ｐの表面で反射された散乱光は、光
学系１によってカラーラインセンサ２の受光面に結像さ
れる。光学系１は、たとえば、ＹＭＣいずれかのある色
インキによる網点と近傍の同色網点とを分離して読取る
ことが可能な解像度になるような倍率を持つものとす
る。たとえば、２００線の網点画像の場合には、サンプ
リング定理から４００ＤＰＩ以上の読取密度となるよう
な倍率の光学系１を配置する。

【００２４】また、カラーラインセンサ２は、たとえ
ば、Ｒ，Ｇ，Ｂ構成のＣＣＤアレイによって構成されて
いる。したがって、反射光強度の光電変換により、各色
成分の高精細の色彩データ、つまり、Ｒ，Ｇ，Ｂのアナ
ログ信号が生成される。カラーラインセンサ２の出力
は、カラー画像入力部４によってＲ，Ｇ，Ｂのデジタル
画像信号、つまり、読取対象物Ｐの全体に対するＲＧＢ
３成分の画像データに変換される。

【００２５】カラー画像入力部４の各出力は、それぞれ
メモリ制御部８の制御にしたがって第１，第２，第３画
像メモリ５，６，７に記憶される。第１，第２，第３画
像メモリ５，６，７への画像データの記憶が終了する
と、その制御がメモリ制御部８からＣＰＵ９に切換えら
れる。そして、プログラムメモリ１０に格納されている
処理プログラムにしたがって、読取対象物Ｐに記録され
ている文字／線画（印刷）領域を識別する処理が行なわ
れる。

【００２６】プログラムメモリ１０には、たとえば、図
７のフローチャートに示す処理手順が記憶されている。
まず、たとえば、入力装置１２で与えられた局所領域の
大きさ（ｍ×ｎ）を基に、図８に示すように、読取対象
物Ｐの（ａ×ｂ）画素の全画像領域（ａ×ｂ）を、（ｍ
×ｎ）画素の局所画像領域に分割したブロック数Ｎを算
出する（Ｓ１）。

【００２７】次に、局所領域の箇所を示すカウンタｉを
「０」に初期化して（Ｓ２）、カウンタｉを１つインク
リメントする（Ｓ３）。次に、ステップＳ４において、
カウンタｉが示す局所領域が文字／線画（印刷）領域、
網点写真領域、または、写真領域のうちのいずれかを識
別し、その識別結果をメモリ１１に記憶する。

【００２８】そして、カウンタｉの値がブロック総数Ｎ
と等しいか否かをチェックして、カウンタｉの値がＮよ
りも小さければ、ステップＳ３に戻り、上記した処理を
繰り返す。カウンタｉの値がＮと等しければ、メモリ１
１に記憶した読取対象物Ｐの全局所領域の識別結果を用
いて、本装置が所望する所定の画像処理を行ない、その
結果を出力装置１３によって出力し（Ｓ６）、処理を終
了する。

【００２９】ここで、ステップＳ４の局所領域の識別処
理の詳細を説明する。この識別処理手順は、たとえば、
図９に示すフローチャートのようになる。まず、ステッ
プＳ１１において、カウンタｉによって示される（ｍ×
ｎ）画素の局所領域におけるＲＧＢのカラー画像データ
を基に、ＲＧＢの３変量の分散共分散行列Ｋを求め、こ
の行列の最大固有値λ1 、すなわち、第１主成分の分散
値λ1 を算出し、同様に２番目，３番目に大きい固有
値、つまり、第２，第３主成分の分散値λ2 ，λ3 をそ
れぞれ算出する。

【００３０】以下、ステップＳ１１の処理を詳細に説明
する。まず、上記局所領域における各画素データの参照
方法としては、たとえば、ＲＧＢの画像データが第１，
第２，第３画像メモリ５，６，７にｒｓｔａｄｒ、ｇ
ｓｔａｄｒ、ｂｓｔａｄｒのスタートアドレスから
順次格納されていると、図１０に示すようなカウンタｉ
が示す（ｍ×ｎ）画素の局所領域における（ｓ，ｔ）画
素が示すＲＧＢデータの値Ｘ（ｓ，ｔ）は、ＸR （ｓ，ｔ）＝ｒｓｔａｄｒ＋［（ｉ−１）ｉｎ
ｔａ］×（ａ×ｍ）＋ｔ×（ａ×ｍ）＋［（ｉ−１）
ｍｏｄａ］×ｍ＋ｓＸG （ｓ，ｔ）＝ｇｓｔａｄｒ＋［（ｉ−１）ｉｎ
ｔａ］×（ａ×ｍ）＋ｔ×（ａ×ｍ）＋［（ｉ−１）
ｍｏｄａ］×ｍ＋ｓＸB （ｓ，ｔ）＝ｂｓｔａｄｒ＋［（ｉ−１）ｉｎ
ｔａ］×（ａ×ｍ）＋ｔ×（ａ×ｍ）＋［（ｉ−１）
ｍｏｄａ］×ｍ＋ｓとなる。

【００３１】ただし、ｘｉｎｔｙはｘをｙで割っ
たときの値の小数点以下を切り捨てた整数値を求める演
算式とする。また、ｘｍｏｄｙはｘをｙで割った
ときの値の余りの値を求める演算式とする。

【００３２】ここで、ＸR （ｓ，ｔ）、ＸG （ｓ，
ｔ）、ＸB （ｓ，ｔ）を、それぞれ順番にＸ1 （ｓ，
ｔ）、Ｘ2 （ｓ，ｔ）、Ｘ3 （ｓ，ｔ）と表記し直し、
前記した式に基づいて参照できる（ｍ×ｎ）画素の局所
領域の全画像データから、下記数１による分散共分散行
列Ｋを求める。

【００３３】

【数１】ここで、

【００３４】

【数２】である。したがって、ｋ２１＝ｋ１２、ｋ３１＝ｋ１
３、ｋ３２＝ｋ２３となる。

【００３５】このように、求まった３次の正方行列Ｋの
３つの固有値を算出することが、第１〜第３主成分の分
散値を算出することに他ならない。この正方行列Ｋの固
有値は、一般的な数値計算法、たとえば、周知のヤコビ
法、または、Ｈｏｕｓｅｈｏｌｄｅｒ法で算出すること
ができる。

【００３６】以下、ヤコビ法を用いて正方行列Ｋの固有
値を算出する例を、図１１に示すフローチャートを用い
て簡単に説明する。まず、ヤコビ法により演算を繰り返
し行なう際の収束判定条件を設定するため、あらかじめ
収束判定の定数をある小さな値εに設定しておく（Ｓ２
１）。次に、正方行列Ｋの非対角要素の最大値が存在す
る行と列の値ｐ，ｑを検索する（Ｓ２２）。この検索し
た正方行列Ｋの非対角要素の最大値ｋｐｑが収束判定の
定数εよりも小さいか否か比較を行ない（Ｓ２３）、も
しｋｐｑ≧εならば、以下に説明するステップＳ２４，
Ｓ２５の演算を施した後、ステップＳ２３に戻り、再度
比較を行ない、ｋｐｑ＜εを満たすまで上記ステップが
繰り返される。

【００３７】もし、ｋｐｑ＜εを満たしたならば、ステ
ップＳ２６において、演算結果から固有値となるｋ１
１，ｋ２２，ｋ３３の大小関係を求め、大きい方から順
にλ1，λ2 ，λ3 （λ1 ≧λ2 ≧λ3 ≧０）とする。
なお、正方行列Ｋは、非負の対象行列であるから固有値
は必ず非負の実数になる。

【００３８】以下、ステップＳ２４，Ｓ２５について説
明すると、まず、ステップＳ２４において、下記式によ
って直交変換に必要なＣＯＳθ、ＳＩＮθの値をそれぞ
れ算出する。

【００３９】ＳＩＮθ＝［（１−γ）／２］^1/2 ・ＳＩＧＮ（αβ）ＣＯＳθ＝（１−ＳＩＮ² θ）^1/2 ただし、α＝−ｋｐｑ β＝（ｋｐｐ−ｋｑｑ）／２ γ＝｜β｜・（α² ＋β² ）^1/2 次に、ステップＳ２５において、下記式に示すようにし
て直交変換して演算した結果を行列Ｋの各要素の値に置
き換える。

【００４０】ｋｐｐ←ｋｐｐ・ＣＯＳ² θ＋ｋｑｑ・Ｓ
ＩＮ² θ−２ｋｐｑ・ＳＩＮθ・ＣＯＳθ ｋｑｑ←ｋｐｐ・ＳＩＮ² θ＋ｋｑｑ・ＣＯＳ² θ＋２
ｋｐｑ・ＳＩＮθ・ＣＯＳθ ｋｐｑ←０、ｋｑｐ←０ｋｐｊ←ｋｐｊ・ＣＯＳθ−ｋｑｊ・ＳＩＮθ ｋｑｊ←ｋｐｊ・ＳＩＮθ−ｋｑｊ・ＣＯＳθ ｋｉｐ←ｋｐｉ、ｋｉｑ←ｋｐｉただし、ｊは、ｐおよびｑ以外の列の位置を指し、ｉは
ｐおよびｑ以外の行の位置を指す。

【００４１】以上のような計算手順で固有値λ1 ，λ2
，λ3 を算出できる。次に、ステップＳ１２におい
て、一般的な数値計算法で得られた正方行列Ｋの固有値
λ1 ，λ2 ，λ3 （λ1 ≧λ2 ≧λ3 ≧０）、および、
あらかじめ設定しておいた第１〜第４の判別基準値Ｔｈ
１〜Ｔｈ４（Ｔｈ２≧Ｔｈ３）を用いて、既に図４〜図
６に示した色分布形状を得ることにより、たとえば、次
に示す条件により文字／線画（印刷）領域、網点（印
刷）領域、および写真領域を判定し、その結果を例えば
０，１，２のＩＤ（ｉ）（ｉ＝１，Ｎ）値としてメモリ
１１に記憶する。

【００４２】 λ1 ＜Ｔｈ１ ……写真領域ＩＤ：２ λ1 ≧Ｔｈ１かつ λ2 ≧Ｔｈ２または λ3 ≧Ｔｈ３または λ1 ／λ2 ＜Ｔｈ４……網点（印刷）領域ＩＤ：１上記条件以外 ……文字／線画（印刷）領域ＩＤ：０ここで、ステップＳ６における、前述した識別結果を用
いた所定の画像処理について簡単に説明する。たとえ
ば、背景と混在した文字部のみを抽出することを目的と
した場合、メモリ１１に記憶された各局所領域のＩＤ
（ｉ）値を基に、ＩＤ（ｉ）≠０の領域のそれぞれＲＧ
Ｂ画像データを、たとえば、白（ｆｆｈ）の値に置き換
える。その後、ある閾値で２値化を行なうことにより、
文字部のみを抽出することができ、この結果が出力装置
１３によって出力される。

【００４３】次に、第２の実施例について説明する。こ
の場合、前記したＲＧＢの３次元濃度頻度分布の違いを
定量化するため、網点（印刷）領域を１次元濃度頻度分
布に変換した結果、３つ以上の頻度の極大点を生ずるよ
うなＲＧＢ３次元空間上の直線軸を用いて１次元濃度頻
度分布に変換を施し、その１次元頻度分布パターンが文
字／線画（印刷）領域と網点（印刷）領域において異な
ることにより、文字／線画（印刷）部を含む局所領域の
分離を実現する。

【００４４】第２の実施例のハード構成は、既に説明し
たような図１に示す第１の実施例と同様な構成で実現で
き、プログラムメモリ１０に記憶されている識別処理手
順において、図７に示したフローチャートのステップＳ
４における局所領域の識別処理が異なる。

【００４５】この識別処理手順は、たとえば、図１２に
示すフローチャートのようになる。まず、ステップＳ３
１において、前記した局所領域の位置を示すカウンタｉ
によって示される（ｍ×ｎ）画素の局所領域における全
画素の中から最大値Ｄmax 、および、最小値Ｄmin をＲ
ＧＢそれぞれについて算出する。

【００４６】次に、ＲＧＢそれぞれについて、△Ｄmax
＝Ｄmax −Ｄmin を算出し、△Ｄmax とあらかじめ設定
した閾値Ｔｈ１とを比較し、下記式によって写真領域と
文字／線画（印刷）領域および網点領域とを判定し、第
１の判定値ＩＤ１をメモリ１１に記憶する。

【００４７】 △Ｄmax ≧Ｔｈ１……文字／線画（印刷）、網点写真領域ＩＤ１：０ △Ｄmax ＜Ｔｈ１……写真領域ＩＤ１：１ただし、この際、ＲＧＢデータのうち１色でも他の色と
異なる判定結果となった場合は、△Ｄmax ≧Ｔｈ１とな
る色成分の判定結果を優先し、このときは文字／線画
（印刷）、網点写真領域とする。

【００４８】次に、ステップＳ３２では、第１の判定値
ＩＤ１の値をチェックして、もしＩＤ１が「１」ならば
処理を終了し、ＩＤ１が「０」ならば次のステップＳ３
３の処理へ進む。ステップＳ３３では、前記した局所領
域の位置を示すカウンタｉによって示される（ｍ×ｎ）
画素の局所領域におけるＲＧＢのカラー画像データの全
画素について、前記したような網点（印刷）領域を１次
元濃度頻度分布に変換した結果、３つ以上の頻度の極大
点を生ずるようなＲＧＢ３次元空間上の直線Ｌ方向へＲ
ＧＢ画素値を射影する。

【００４９】ここで、直線Ｌとして採用してはいけない
場合を説明すると、たとえば、図１３に示すように、Ｍ
（マゼンタ）とＣ（シアン）の代表色を通る直線が下地
の代表色Ｗ（ホワイト）と、図３には図示していないが
黒の代表色Ｂｋとを通る直線と垂直な場合、直線Ｌを上
記２直線と垂直な方向に採用すると、射影した結果Ｍ、
Ｗ、Ｂｋの各代表色が一点に集まり、残りのＹ（イエロ
ー）の代表色がどこに位置しようとも、３つ以上の極大
点が存在し得ない。

【００５０】このような２つ以下しか極大点が存在しな
い場合を除けば、ＲＧＢ３次元空間において、どの方向
に直線Ｌを採用してもよい。以下の説明の簡略化のた
め、たとえば、ＭとＣの代表色（Ｍｒ，Ｍｇ，Ｍｂ）、
（Ｃｒ，Ｃｇ，Ｃｂ）を通る直線を直線Ｌとした場合に
ついて説明する。局所領域内のある画素におけるＲＧＢ
値（Ｒｉ，Ｇｉ，Ｂｉ）を上記直線Ｌへ射影した点ｔの
値は、直線Ｌの原点を（Ｃｒ，Ｃｇ，Ｃｂ）に決めたと
き、下記数３のようにして得られる。

【００５１】

【数３】

【００５２】そこで、あらかじめ設定しておいた一定値
ｋ（＞１）、ｎ（ｎは１よりも大きい整数）を用いて、
まず、ｔの値をｋ倍して得られるｋ・ｔの値を求め、小
数点以下を四捨五入して得られる整数値ｈを決定し（た
だし、｜ｈ｜≦｜ｎ｜）、あらかじめ「０」に初期化さ
れていた−ｎから＋ｎまでの２ｎ＋１個の頻度分布区分
のうちで、整数値ｈの頻度分布区分に「１」を加算す
る。

【００５３】このような頻度分布の算出方法を（ｍ×
ｎ）画素の局所領域の全画素に適用する。そして、その
結果をメモリ１１に順次記憶し、それを繰り返し実行す
れば、局所領域内のカラー画像データから濃淡画像デー
タへの変換が終了する。たとえば、図４、図５のような
ＲＧＢ３次元濃度頻度分布を持つ画像データの場合、上
記直線Ｌへの変換により得られる頻度分布データは図１
４、図１４に示すようになる。

【００５４】これらの図から明らかなように、文字／線
画（印刷）領域の頻度値は原点付近に集中し、極大点は
２個であるのに対して、網点（印刷）領域は文字／線画
（印刷）領域に比べて頻度値の取り得る範囲が広く、３
つ以上の極大点を持っている。したがって、たとえば、
頻度分布の極大点の大小で比較すると、網点（印刷）領
域は文字／線画（印刷）領域に比べて必ず極大点の数が
大きくなる。この極大点の検出は以下のようにして実現
される。

【００５５】すなわち、頻度分布データをＨ（ｋ）とす
ると（ｎ≦ｋ≦ｎ）、次式Ｈｐ（ｋ）＝２×Ｈ（ｋ）−Ｈ（ｋ−１）−Ｈ（ｋ＋
１）により変換されるデータＨｐ（ｋ）について、次式Ｈｐ（ｋ）≧Ｈｐ（ｋ＋１）かつＨｐ（ｋ）＞Ｈｐ
（ｋ−１）かつＨｐ（ｋ）＞０の関係を満足するｋの分布区分が極大点時として決定さ
れる。

【００５６】したがって、ステップＳ３４において、あ
らかじめ設定した第２の閾値Ｔｈ２（たとえば「３」）
を用いて、下記式によって極大点の大小により文字／線
画（印刷）領域と網点（印刷）領域とを判別し、第２の
判定データＩＤ２をメモリ１１に記憶する。

【００５７】極大点の数≧Ｔｈ２……網点（印刷）領域ＩＤ２：１極大点の数＜Ｔｈ２……文字／線画（印刷）領域ＩＤ２：０次に、第３の実施例について説明する。この場合、前記
したＲＧＢの３次元濃度頻度分布の違いを定量化するた
め、局所領域における３次元濃度頻度分布の分布を求
め、この頻度分布の極大点を求め、極大点の数の大小関
係から、文字／線画（印刷）部を含む局所領域の分離を
実現する。

【００５８】第３の実施例のハード構成は、既に説明し
たような図１に示す第１の実施例と同様な構成で実現で
き、プログラムメモリ１０に記憶されている識別処理手
順において、図７に示したフローチャートのステップＳ
４における局所領域の識別処理が異なる。

【００５９】この識別処理手順は、たとえば、図１６に
示すフローチャートのようになる。まず、ステップＳ４
１において、前記した局所領域の位置を示すカウンタｉ
によって示される（ｍ×ｎ）画素の局所領域におけるＲ
ＧＢカラー画像データの全画素について、ＲＧＢの３変
量についての３次元出現頻度値データについてのヒスト
グラムデータＨｔ（Ｒ，Ｇ，Ｂ）を求める。

【００６０】ＲＧＢの濃度ヒストグラム作成の処理が終
了すると、このヒストグラムデータＨｔ（Ｒ，Ｇ，Ｂ）
の極大点の検出が行なわれる（Ｓ４２）。これは、図１
７に２重枠で示すような近傍点の頻度に対して極大であ
るかどうかを調べることによって実現される。すなわ
ち、次式Ｈｐ（ｉ，ｊ，ｋ）＝６×Ｈｔ（ｉ，ｊ，ｋ）−Ｈｔ
（ｉ−１，ｊ，ｋ）−Ｈｔ（ｉ，ｊ−１，ｋ）−Ｈｔ
（ｉ，ｊ，ｋ−１）−Ｈｔ（ｉ＋１，ｊ，ｋ）−Ｈｔ
（ｉ，ｊ＋１，ｋ）−Ｈｔ（ｉ，ｊ，ｋ＋１）により変換されるデータＨｐ（ｉ，ｊ，ｋ）について、
次式Ｈｐ（ｉ，ｊ，ｋ）≧Ｈｐ（ｉ＋１，ｊ，ｋ）、かつ、Ｈｐ（ｉ，ｊ，ｋ）≧Ｈｐ（ｉ，ｊ＋１，
ｋ）、かつ、Ｈｐ（ｉ，ｊ，ｋ）≧Ｈｐ（ｉ，ｊ，ｋ＋
１）、かつ、Ｈｐ（ｉ，ｊ，ｋ）＞Ｈｐ（ｉ，ｊ−１，
ｋ）、かつ、Ｈｐ（ｉ，ｊ，ｋ）＞Ｈｐ（ｉ−１，ｊ，
ｋ）、かつ、Ｈｐ（ｉ，ｊ，ｋ）＞Ｈｐ（ｉ，ｊ，ｋ−
１）、かつ、Ｈｐ（ｉ，ｊ，ｋ）＞０の関係を満足する全てのｉ，ｊ，ｋのヒストグラムデー
タＨｔ（Ｒ，Ｇ，Ｂ）が極大点５１として求められる。
なお、図１９におけるｉ，ｊ，ｋは、Ｒ，Ｇ，Ｂの各軸
にそれぞれ対応する。

【００６１】この極大点５１は、図１８に示した網点
（印刷）領域の場合には、図１９に示したように、読取
対象物Ｐの下地色Ｙ、Ｍ、Ｃ、ＹとＭとの混色、ＹとＣ
との混色、ＭとＣとの混色、ＹとＭとＣとの混色（＝Ｂ
ｋ）の最高８色の極大点が色空間上に存在することにな
る。

【００６２】一方、文字／線画（印刷）領域の場合は、
図２０に示すように、下地と線の色の２色の極大点が得
られる。また、写真領域の場合には、図２１に示すよう
に、この局所領域での濃度変化は僅かであるから極大点
は１つしか得られない。したがって、上記したように極
大点の数の大小関係を基に領域識別を判定することがで
きる。

【００６３】すなわち、ステップＳ４３において、あら
かじめ設定しておいた閾値Ｔｈ１，Ｔｈ２を用い（たと
えば、Ｔｈ１＝Ｔｈ２＝２）、下記式のような判別式を
用いて文字／線画（印刷）領域と網点（印刷）領域とを
判別でき、その判別結果のＩＤ値をメモリ１１に記憶す
る。

【００６４】極大点の数＞Ｔｈ１……網点（印刷）領域ＩＤ＝１極大点の数＜Ｔｈ２……写真領域ＩＤ＝２上記以外 ……文字／線画（印刷）領域ＩＤ＝０次に、第４の実施例について説明する。第４の実施例の
ハード構成は、既に説明したような図１に示す第１の実
施例と同様な構成で実現でき、プログラムメモリ１０に
記憶されている識別処理手順において、図７に示したフ
ローチャートのステップＳ４における局所領域の識別処
理が異なる。

【００６５】この識別処理手順は、たとえば、図２２に
示すフローチャートのようになる。まず、ステップＳ５
１において、図１６のステップＳ４１と同様に、前記し
た局所領域の位置を示すカウンタｉによって示される
（ｍ×ｎ）画素の局所領域におけるＲＧＢカラー画像デ
ータの全画素について、ヒストグラムデータＨｔ（Ｒ，
Ｇ，Ｂ）を求める。

【００６６】ＲＧＢの濃度ヒストグラム作成の処理が終
了すると、ステップＳ５２において、このヒストグラム
データＨｔ（Ｒ，Ｇ，Ｂ）を基に、あらかじめ設定して
おいた一定値Ｃ（たとえば、Ｃ＝１）を用いて、Ｈｔ（Ｒ，Ｇ，Ｂ）≧Ｃを満たすＲＧＢ３次元空間上の点の数Ｐｉｘを係数す
る。このＰｉｘは、ＲＧＢ３次元空間上の色分布の広が
り度を意味する。この結果、図２に示した文字／線画
（印刷）領域に比べて、図３に示した網点（印刷）領域
の場合には、ＲＧＢ３次元空間上の色分布の広がりが大
きいため、Ｐｉｘが大きくなる。

【００６７】一方、写真領域の場合には、図６に示した
ように、ＲＧＢ３次元空間上の色分布の広がりが、文字
／線画（印刷）領域に比べて少ないため、Ｐｉｘが小さ
くなる。したがって、ステップＳ５３において、あらか
じめ設定しておいた閾値Ｔｈ１，Ｔｈ２を用い（Ｔｈ１
＜Ｔｈ２）、下記式のような判別式を用いて文字／線画
（印刷）領域、網点（印刷）領域、および、写真領域を
判定し、その判定結果のＩＤ値をメモリ１１に記憶す
る。

【００６８】色分布の広がり度（Ｐｉｘ）＜Ｔｈ１……写真領域ＩＤ＝２色分布の広がり度（Ｐｉｘ）≧Ｔｈ２……網点（印刷）領域ＩＤ＝１上記以外 ……文字／線画（印刷）領域ＩＤ＝０なお、本発明は、前記第１〜第４の実施例に限定される
ものではない。たとえば、前記各実施例では、カラー画
像信号はＲＧＢ信号を基に処理の識別を行なっている場
合を説明したが、これに限らず、ＹＭＣあるいはＹＭＣ
Ｋの信号、あるいはＸＹＺ、Ｌ^*ａ^*ｂ^*、Ｌ^*ｕ^*ｖ^*、Ｈ
ＶＣなどの色空間を表現する信号系であればよい。

【００６９】また、前記各実施例では、画像入力部は、
読取対象物を移動させて画像を読取る構成の場合として
説明したが、逆に読取対象物を静止したまま、光学系お
よびカラーラインセンサを移動させて画像を読取っても
よい。

【００７０】また、前記各実施例では、網点写真領域を
網点印刷による場合として説明したが、これに限らず、
カラー複写機やカラープリンタなどにより、面積階調で
カラー濃度を表現する方式で記録された面積階調領域
と、文字／線画（印刷）領域とが混在した場合（たとえ
ば、文字／写真モードで記録された複写物）において
も、面積階調領域の判別条件を網点写真領域の判別条件
と同様に設定すれば、文字／線画（印刷）領域を判別で
きる。

【００７１】また、前記各実施例では、写真領域を写真
などによる場合として説明したが、これに限らず、カラ
ー複写機やカラープリンタなどにより、濃度階調でカラ
ー濃淡を表現する方式で記録された濃度階調領域と、文
字／線画（印刷）領域が混在した場合（たとえば、文字
／写真モードで記録された複写物）においても、濃淡階
調領域の判別条件を写真領域の判別条件と同様に設定す
れば、文字／線画（印刷）領域を判別できる。

【００７２】また、前記各実施例では、画像入力部にカ
ラーラインセンサを用いた場合を説明したが、これに限
らず、カラーエリアセンサ、または、モノクロライン
（エリア）センサと光学的に各色成分に分光する手段
（たとえば、プリズム）と組合わせて用いることもでき
る。この場合、３色成分以上に分光できればよい。

【００７３】また、前記各実施例では、ＲＧＢの３色成
分データを用いた場合を説明したが、これに限らず、２
色以上の色成分データを用いても、前記実施例と同様に
識別処理を行なうことができる。

【００７４】また、前記第１の実施例では、主成分分析
により、第１〜第３主成分の分散を用いる場合について
説明したが、これに限らず、２色以上の色成分データを
用いる場合、少なくとも２つ以上の主成分の分散を用い
れば、領域を判別することができる。

【００７５】また、前記第２の実施例では、網点（印
刷）領域と文字／線画（印刷）領域との判別に極大点の
数を用いた場合について説明したが、これに限らず、射
影された濃度のプロファイルの形状の違いを用いた判別
処理（たとえば、分散、取得る濃度値の数（広がり）、
プロファイルのパターンマッチングの大小関係などの組
合わせ）を用いて判別することができる。

【００７６】また、前記第３の実施例では、ＲＧＢの３
次元濃度分布を基に極大値を算出した場合について説明
したが、これに限らず、ｎ色（ｎ≧２）の色成分データ
を用いて、ｎ色のうちｋ色（ｎ≧ｋ≧２）を用いたｋ次
元の濃度頻度分布を用いれば、同様に極大値を算出で
き、領域を判別することができる。

【００７７】また、前記第４の実施例では、ＲＧＢの３
次元濃度分布を基に頻度の広がり度を算出した場合につ
いて説明したが、これに限らず、ｎ色（ｎ≧２）の色成
分データを用いて、ｎ色のうちｋ色（ｎ≧ｋ≧２）を用
いたｋ次元の濃度頻度分布を用いれば、同様に広がり度
を算出でき、領域を判別することができる。

【００７８】

【発明の効果】以上詳述したように本発明によれば、局
所領域における文字／線画（印刷）領域と網点（印刷）
領域との３次元濃度頻度分布を定量化して分離を行なう
ことにより、局所領域における濃度変化の少ない写真領
域およびＹＭＣの配置から生じる網点（印刷）領域の色
分布の違いを基に、確実に文字／線画（印刷）領域と区
別ができる画像識別装置を提供できる。

【図面の簡単な説明】

【図１】本発明の実施例にかかる画像識別装置の構成を
概略的に示すブロック図。

【図２】読取対象物における文字／線画領域の局所領域
の一例を示す図。

【図３】読取対象物における網点領域の局所領域の一例
を示す図。

【図４】読取対象物の文字／線画領域の局所領域におけ
る濃度頻度分布の一例を示す図。

【図５】読取対象物の網点領域の局所領域における濃度
頻度分布の一例を示す図。

【図６】読取対象物の写真領域の局所領域における濃度
頻度分布の一例を示す図。

【図７】読取対象物の画像データが得られた後の画像識
別の処理手順を説明するフローチャート。

【図８】読取対象物の画像データを局所領域に分割した
一例を示す図。

【図９】第１の実施例に係る局所領域の識別処理手順を
説明するフローチャート。

【図１０】局所領域における各画素のアドレスの参照例
を説明するための図。

【図１１】第１の実施例に係る分散共分散行列の固有値
を算出する処理手順を説明するフローチャート。

【図１２】第２の実施例に係る局所領域の識別処理手順
を説明するフローチャート。

【図１３】投影軸として採用してはいけない場合の一例
を示す図。

【図１４】投影軸に投影された文字／線画領域の頻度分
布の一例を示す図。

【図１５】投影軸に投影された網点領域の頻度分布の一
例を示す図。

【図１６】第３の実施例に係る局所領域の識別処理手順
を説明するフローチャート。

【図１７】頻度分布の極大点算出方法を説明するための
図。

【図１８】文字／線画領域の局所領域の一例を示す図。

【図１９】網点領域の局所領域における色空間上での極
大点分布の一例を示す図。

【図２０】文字／線画領域の局所領域の色空間上での極
大点分布の一例を示す図。

【図２１】写真領域の局所領域における色空間上での極
大点分布の一例を示す図。

【図２２】第４の実施例に係る局所領域の識別処理手順
を説明するフローチャート。

【符号の説明】

Ｐ……読取対象物１……光学系２……カラーラインセンサ３……画像入力部４……カラー画像入力部５，６，７……画像メモリ（フレームメモリ）８……メモリ制御部９……ＣＰＵ１０……プログラムメモリ１１……メモリ１２……入力装置１３……出力装置

Claims

【特許請求の範囲】

【請求項１】文字／線画領域、網点領域、および写真
領域が含まれる被読取物から複数の色成分に関するデー
タを収集する画像入力手段と、この画像入力手段によって収集された前記複数の色成分
に関するデータに対して少なくとも２つ以上の主成分方
向の分散値を求める算出手段と、この算出手段によって求められた各分散値から前記文字
／線画領域、網点領域、および写真領域をそれぞれ識別
する識別手段と、この識別手段の識別結果に基づき所定の画像処理を行な
う画像処理手段と、を具備したことを特徴とする画像識別装置。
【請求項２】文字／線画領域、網点領域、および写真
領域が含まれる被読取物から複数の色成分に関するデー
タを収集する画像入力手段と、この画像入力手段によって収集された前記複数の色成分
に関するデータに対して色成分空間における直線方向へ
の射影処理を行なうことにより濃度頻度分布を求める算
出手段と、この算出手段によって求められた濃度頻度分布に基づき
前記文字／線画領域、網点領域、および写真領域をそれ
ぞれ識別する識別手段と、この識別手段の識別結果に基づき所定の画像処理を行な
う画像処理手段と、を具備したことを特徴とする画像識別装置。
【請求項３】文字／線画領域、網点領域、および写真
領域が含まれる被読取物から複数の色成分に関するデー
タを収集する画像入力手段と、この画像入力手段によって収集された前記複数の色成分
に関するデータの生成頻度を求める算出手段と、この算出手段によって求められた生成頻度の極大点を検
出する検出手段と、この検出手段で検出された極大点の数により前記文字／
線画領域、網点領域、および写真領域をそれぞれ識別す
る識別手段と、この識別手段の識別結果に基づき所定の画像処理を行な
う画像処理手段と、を具備したことを特徴とする画像識別装置。
【請求項４】文字／線画領域、網点領域、および写真
領域が含まれる被読取物から複数の色成分に関するデー
タを収集する画像入力手段と、この画像入力手段によって収集された前記複数の色成分
に関するデータの生成頻度を求める算出手段と、この算出手段によって求められた生成頻度に基づき所定
頻度以上を持つ色数を計数する計数手段と、この計数手段で計数された色数により前記文字／線画領
域、網点領域、および写真領域をそれぞれ識別する識別
手段と、この識別手段の識別結果に基づき所定の画像処理を行な
う画像処理手段と、を具備したことを特徴とする画像識別装置。