JPH0856287A - 画像識別装置 - Google Patents

画像識別装置

Info

Publication number
JPH0856287A
JPH0856287A JP6191536A JP19153694A JPH0856287A JP H0856287 A JPH0856287 A JP H0856287A JP 6191536 A JP6191536 A JP 6191536A JP 19153694 A JP19153694 A JP 19153694A JP H0856287 A JPH0856287 A JP H0856287A
Authority
JP
Japan
Prior art keywords
area
character
line drawing
image
halftone dot
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP6191536A
Other languages
English (en)
Inventor
Toshitake Hirasawa
利勇 平沢
Kunihiro Shibuya
邦弘 渋谷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP6191536A priority Critical patent/JPH0856287A/ja
Publication of JPH0856287A publication Critical patent/JPH0856287A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Facsimile Image Signal Circuits (AREA)
  • Image Analysis (AREA)

Abstract

(57)【要約】 【目的】局所領域における濃度変化の少ない写真領域お
よびYMCの配置から生じる網点(印刷)領域の色分布
の違いを基に、確実に文字/線画(印刷)領域と区別が
できる画像識別装置を提供する。 【構成】文字/線画領域、網点領域、および、写真領域
が混在する読取対象物Pから、画像入力部3およびカラ
ー画像入力部4によってRGBの画像データを入力す
る。CPU9は、その入力された各画像データに対して
少なくとも2つ以上の主成分方向の分散値を求め、この
求められた各分散値から文字/線画領域、網点領域、お
よび、写真領域を識別し、その識別結果に基づき所定の
画像処理を行なう。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、原稿などの被読取物上
に印刷された文字/線画領域、網点領域、および写真領
域を画像処理によって識別する画像識別装置に関する。
【0002】
【従来の技術】一般に、ハードコピーされた画像は、文
字または等高線等の線図などの線画を有する画像領域
(以下、文字/線画(印刷)領域と呼ぶ)、写真や油絵
のように連続調で濃淡を表現している領域(以下、写真
領域と呼ぶ)、および、網版の印刷物のように網点の大
小による面積階調で濃淡を表現している領域(以下、網
点(印刷)領域と呼ぶ)からなっている。
【0003】これらの画像領域をスキャナなどの読取手
段で読取って、再び画像を表示したり記録する際には、
文字/線画領域の鮮鋭度向上に対して写真領域の滑らか
さ向上や、網点領域のモアレ除去という相反する要求に
対応する必要性から、画像処理によって各画像領域を識
別する処理技術が重要であり、特にカラー記録(カラー
表示)の際の画質向上のために必須の技術である。ま
た、この画像識別技術は、絵柄が混在した画像からの文
字抽出などにも活用できる。
【0004】一般に、文字/線画(印刷)領域と写真領
域とを分離する方法として、ブロック内の濃度変化の大
小を利用することが多いが、文字/線画(印刷)領域と
網点(印刷)領域との分離は困難である。文字/線画
(印刷)、写真、網点(印刷)の3つの領域を分離する
方法としては、文献「網点写真の識別処理方法」(電子
情報通信学会論文誌’87/2 Vol.J70−B
No.2)において、「ブロック分離変換法」(Blo
ck Separate Transformatio
n Method:BEST法)が提案されている。
【0005】この方法は、対象画像をブロックに分割
し、ブロック内の濃度変化により3つの領域を分離する
方法である。その際、 ・写真はブロック内の濃度変化が小さい ・文字/線画(印刷)および網点(印刷)はブロック内
の濃度変化が大きい ・文字/線画(印刷)は濃度変化の周期が大きい ・網点(印刷)は濃度変化の周期が小さい といった濃度変化の性質を利用する。以下に、その詳細
を説明する。
【0006】(1)対象画像を(m×n)画素のブロッ
クに分割する。 (2)ブロック内の最大濃度信号Dmax と最小濃度信号
Dmin を求め、ブロック内の最大濃度差信号△Dmax を
算出する。
【0007】△Dmax =Dmax −Dmin (3)あらかじめ設定した閾値Th1と△Dmax とを比
較し、以下の条件で写真領域と非写真領域(文字/線画
(印刷)および網点(印刷)領域)とを分離する。
【0008】△Dmax ≦Th1……写真領域 △Dmax >Th1……非写真領域 (4)ブロック内信号の平均信号Daでブロック内の各
画素を2値化する。
【0009】(5)ブロック内の主走査方向に連続する
画素間の0,1変化回数Khを求める。同様に、副走査
方向についても変化回数Kvを求める。 (6)あらかじめ設定した閾値Th2とKh,Kvとを
それぞれ比較し、以下の条件で文字/線画(印刷)領域
と網点(印刷)領域とを分離する。
【0010】Kh≧Th2 かつ Kv≧Th2……網
点(印刷)領域 Kh<Th2 かつ Kv<Th2……文字/線画(印
刷)領域 以上の手順で、文字/線画(印刷)、写真、網点(印
刷)領域を分離でき、各領域に対して適切な画像処理を
施すことが可能となる。
【0011】
【発明が解決しようとする課題】一般に、網点(印刷)
画像は、65〜200線にわたる多種の線種がある。こ
のため、上述した従来の技術は、高い線数の網点につい
ては有効であるが、低い線数の網点写真の場合は文字
(線)と特徴が類似しているため、分離が困難であると
いう問題があった。
【0012】そこで、本発明は、局所領域における濃度
変化の少ない写真領域およびYMCの配置から生じる網
点(印刷)領域の色分布の違いを基に、確実に文字/線
画(印刷)領域と区別ができる画像識別装置を提供する
ことを目的とする。
【0013】
【課題を解決するための手段】本発明の画像識別装置
は、文字/線画領域、網点領域、および写真領域が含ま
れる被読取物から複数の色成分に関するデータを収集す
る画像入力手段と、この画像入力手段によって収集され
た前記複数の色成分に関するデータに対して少なくとも
2つ以上の主成分方向の分散値を求める算出手段と、こ
の算出手段によって求められた各分散値から前記文字/
線画領域、網点領域、および写真領域をそれぞれ識別す
る識別手段と、この識別手段の識別結果に基づき所定の
画像処理を行なう画像処理手段とを具備している。
【0014】また、本発明の画像識別装置は、文字/線
画領域、網点領域、および写真領域が含まれる被読取物
から複数の色成分に関するデータを収集する画像入力手
段と、この画像入力手段によって収集された前記複数の
色成分に関するデータに対して色成分空間における直線
方向への射影処理を行なうことにより濃度頻度分布を求
める算出手段と、この算出手段によって求められた濃度
頻度分布に基づき前記文字/線画領域、網点領域、およ
び写真領域をそれぞれ識別する識別手段と、この識別手
段の識別結果に基づき所定の画像処理を行なう画像処理
手段とを具備している。
【0015】また、本発明の画像識別装置は、文字/線
画領域、網点領域、および写真領域が含まれる被読取物
から複数の色成分に関するデータを収集する画像入力手
段と、この画像入力手段によって収集された前記複数の
色成分に関するデータの生成頻度を求める算出手段と、
この算出手段によって求められた生成頻度の極大点を検
出する検出手段と、この検出手段で検出された極大点の
数により前記文字/線画領域、網点領域、および写真領
域をそれぞれ識別する識別手段と、この識別手段の識別
結果に基づき所定の画像処理を行なう画像処理手段とを
具備している。
【0016】さらに、本発明の画像識別装置は、文字/
線画領域、網点領域、および写真領域が含まれる被読取
物から複数の色成分に関するデータを収集する画像入力
手段と、この画像入力手段によって収集された前記複数
の色成分に関するデータの生成頻度を求める算出手段
と、この算出手段によって求められた生成頻度に基づき
所定頻度以上を持つ色数を計数する計数手段と、この計
数手段で計数された色数により前記文字/線画領域、網
点領域、および写真領域をそれぞれ識別する識別手段
と、この識別手段の識別結果に基づき所定の画像処理を
行なう画像処理手段とを具備している。
【0017】
【作用】本発明は、局所領域における文字/線画(印
刷)領域と網点(印刷)領域との3次元濃度頻度分布を
定量化して分離を行なうことにより、局所領域における
濃度変化の少ない写真領域およびYMCの配置から生じ
る網点(印刷)領域の色分布の違いを基に、確実に文字
/線画(印刷)領域と区別ができる。
【0018】
【実施例】以下、本発明の実施例について図面を参照し
て説明する。図1は、本実施例に係る画像識別装置の構
成を概略的に示すものである。すなわち、この画像識別
装置は、レンズなどの光学系1およびカラーラインセン
サ2からなり、読取対象物P上のカラー画像を収集して
入力する画像入力部3、カラーラインセンサ2の出力信
号をデジタル信号に変換するカラー画像入力部4、カラ
ー画像入力部4から出力される3色の各画像データをそ
れぞれ記憶する第1,第2,第3画像メモリ(フレーム
メモリ)5,6,7、第1,第2,第3画像メモリ5,
6,7に画像データを記憶するための制御を行なうメモ
リ制御部8、本装置全体の制御を司るCPU(セントラ
ル・プロセッシング・ユニット)9、第1,第2,第3
画像メモリ5,6,7に対して画像処理を行なうCPU
9の処理プログラムなどが格納されたプログラムメモリ
10、画像処理を行なう上で識別基準となるパラメータ
などが格納されているメモリ11、オペレータが本装置
の操作を指示するためのキーボードなどからなる入力装
置12、画像処理の結果などを出力するためのプリンタ
およびディスプレイなどからなる出力装置13、データ
バス14、および、アドレスバス15などから構成され
ている。
【0019】ここで、識別領域となる文字/線画(印
刷)と網点(印刷)の一例を図2および図3に示す。図
2に示すような文字/線画(印刷)を含む局所領域にお
いては、R(赤),G(緑),B(青)による色の3次
元濃度分布をみると、たとえば、文字/線画(印刷)が
緑色の場合、図4に示すように(説明の都合上、2次元
に投影した濃度頻度分布を示す)、線分状に分布する。
このように、線分状に濃度頻度分布が配置されるのは、
(1)下地色の上に色インキが印刷され、混色したこと
により生じた色むら、(2)光学系1およびカラーライ
ンセンサ2のカラー画像入力系にて線と下地との境界読
取時に発生した誤差、の2つの原因が主にあげられる。
したがって、図4の例では、読取対象物Pの下地色から
文字/線画色への線分状の分布が存在する。
【0020】一方、図3に示すように、網点(印刷)領
域の場合、ブラック(Bk)を除いたイエロー(Y)、
マゼンダ(M)、シアン(C)の各網点ともに同一の地
点、かつ、同一の大きさで画点を形成することはないた
め、RGBによる色の3次元濃度頻度分布をみると、た
とえば、図5に示すように(説明の都合上、2次元に投
影した濃度頻度分布を示す)、複数方向に広がりを持つ
ことになる。
【0021】また、写真領域の場合、一般に局所領域に
おける濃度変化は小さいため、たとえば、図6に示すよ
うに、ある頻度を中心に分布が集中する。本実施例の画
像識別装置では、上述したような文字/線画(印刷)部
を含む局所領域と、それ以外の非文字/線画(印刷)の
局所領域を、RGBの3次元濃度分布の違いを定量化し
て識別を行なうものである。
【0022】以下、第1の実施例について説明する。こ
の場合、上述したRGBの3次元濃度頻度分布の違い
を、主成分分析により第1〜第3主成分の分散を用いて
定量化し、文字/線画(印刷)部を含む局所領域の分離
を実現する。
【0023】図1において、図示矢印方向に搬送される
読取対象物Pに対して、図示しない光源からの光が照射
される。読取対象物Pの表面で反射された散乱光は、光
学系1によってカラーラインセンサ2の受光面に結像さ
れる。光学系1は、たとえば、YMCいずれかのある色
インキによる網点と近傍の同色網点とを分離して読取る
ことが可能な解像度になるような倍率を持つものとす
る。たとえば、200線の網点画像の場合には、サンプ
リング定理から400DPI以上の読取密度となるよう
な倍率の光学系1を配置する。
【0024】また、カラーラインセンサ2は、たとえ
ば、R,G,B構成のCCDアレイによって構成されて
いる。したがって、反射光強度の光電変換により、各色
成分の高精細の色彩データ、つまり、R,G,Bのアナ
ログ信号が生成される。カラーラインセンサ2の出力
は、カラー画像入力部4によってR,G,Bのデジタル
画像信号、つまり、読取対象物Pの全体に対するRGB
3成分の画像データに変換される。
【0025】カラー画像入力部4の各出力は、それぞれ
メモリ制御部8の制御にしたがって第1,第2,第3画
像メモリ5,6,7に記憶される。第1,第2,第3画
像メモリ5,6,7への画像データの記憶が終了する
と、その制御がメモリ制御部8からCPU9に切換えら
れる。そして、プログラムメモリ10に格納されている
処理プログラムにしたがって、読取対象物Pに記録され
ている文字/線画(印刷)領域を識別する処理が行なわ
れる。
【0026】プログラムメモリ10には、たとえば、図
7のフローチャートに示す処理手順が記憶されている。
まず、たとえば、入力装置12で与えられた局所領域の
大きさ(m×n)を基に、図8に示すように、読取対象
物Pの(a×b)画素の全画像領域(a×b)を、(m
×n)画素の局所画像領域に分割したブロック数Nを算
出する(S1)。
【0027】次に、局所領域の箇所を示すカウンタiを
「0」に初期化して(S2)、カウンタiを1つインク
リメントする(S3)。次に、ステップS4において、
カウンタiが示す局所領域が文字/線画(印刷)領域、
網点写真領域、または、写真領域のうちのいずれかを識
別し、その識別結果をメモリ11に記憶する。
【0028】そして、カウンタiの値がブロック総数N
と等しいか否かをチェックして、カウンタiの値がNよ
りも小さければ、ステップS3に戻り、上記した処理を
繰り返す。カウンタiの値がNと等しければ、メモリ1
1に記憶した読取対象物Pの全局所領域の識別結果を用
いて、本装置が所望する所定の画像処理を行ない、その
結果を出力装置13によって出力し(S6)、処理を終
了する。
【0029】ここで、ステップS4の局所領域の識別処
理の詳細を説明する。この識別処理手順は、たとえば、
図9に示すフローチャートのようになる。まず、ステッ
プS11において、カウンタiによって示される(m×
n)画素の局所領域におけるRGBのカラー画像データ
を基に、RGBの3変量の分散共分散行列Kを求め、こ
の行列の最大固有値λ1 、すなわち、第1主成分の分散
値λ1 を算出し、同様に2番目,3番目に大きい固有
値、つまり、第2,第3主成分の分散値λ2 ,λ3 をそ
れぞれ算出する。
【0030】以下、ステップS11の処理を詳細に説明
する。まず、上記局所領域における各画素データの参照
方法としては、たとえば、RGBの画像データが第1,
第2,第3画像メモリ5,6,7にr stadr、g
stadr、b stadrのスタートアドレスから
順次格納されていると、図10に示すようなカウンタi
が示す(m×n)画素の局所領域における(s,t)画
素が示すRGBデータの値X(s,t)は、 XR (s,t)=r stadr+[(i−1) in
t a]×(a×m)+t×(a×m)+[(i−1)
mod a]×m+s XG (s,t)=g stadr+[(i−1) in
t a]×(a×m)+t×(a×m)+[(i−1)
mod a]×m+s XB (s,t)=b stadr+[(i−1) in
t a]×(a×m)+t×(a×m)+[(i−1)
mod a]×m+s となる。
【0031】ただし、x int y はxをyで割っ
たときの値の小数点以下を切り捨てた整数値を求める演
算式とする。また、x mod y はxをyで割った
ときの値の余りの値を求める演算式とする。
【0032】ここで、XR (s,t)、XG (s,
t)、XB (s,t)を、それぞれ順番にX1 (s,
t)、X2 (s,t)、X3 (s,t)と表記し直し、
前記した式に基づいて参照できる(m×n)画素の局所
領域の全画像データから、下記数1による分散共分散行
列Kを求める。
【0033】
【数1】 ここで、
【0034】
【数2】 である。したがって、k21=k12、k31=k1
3、k32=k23となる。
【0035】このように、求まった3次の正方行列Kの
3つの固有値を算出することが、第1〜第3主成分の分
散値を算出することに他ならない。この正方行列Kの固
有値は、一般的な数値計算法、たとえば、周知のヤコビ
法、または、Householder法で算出すること
ができる。
【0036】以下、ヤコビ法を用いて正方行列Kの固有
値を算出する例を、図11に示すフローチャートを用い
て簡単に説明する。まず、ヤコビ法により演算を繰り返
し行なう際の収束判定条件を設定するため、あらかじめ
収束判定の定数をある小さな値εに設定しておく(S2
1)。次に、正方行列Kの非対角要素の最大値が存在す
る行と列の値p,qを検索する(S22)。この検索し
た正方行列Kの非対角要素の最大値kpqが収束判定の
定数εよりも小さいか否か比較を行ない(S23)、も
しkpq≧εならば、以下に説明するステップS24,
S25の演算を施した後、ステップS23に戻り、再度
比較を行ない、kpq<εを満たすまで上記ステップが
繰り返される。
【0037】もし、kpq<εを満たしたならば、ステ
ップS26において、演算結果から固有値となるk1
1,k22,k33の大小関係を求め、大きい方から順
にλ1,λ2 ,λ3 (λ1 ≧λ2 ≧λ3 ≧0)とする。
なお、正方行列Kは、非負の対象行列であるから固有値
は必ず非負の実数になる。
【0038】以下、ステップS24,S25について説
明すると、まず、ステップS24において、下記式によ
って直交変換に必要なCOSθ、SINθの値をそれぞ
れ算出する。
【0039】 SINθ=[(1−γ)/2]1/2 ・SIGN(αβ) COSθ=(1−SIN2 θ)1/2 ただし、α=−kpq β=(kpp−kqq)/2 γ=|β|・(α2 +β21/2 次に、ステップS25において、下記式に示すようにし
て直交変換して演算した結果を行列Kの各要素の値に置
き換える。
【0040】kpp←kpp・COS2 θ+kqq・S
IN2 θ−2kpq・SINθ・COSθ kqq←kpp・SIN2 θ+kqq・COS2 θ+2
kpq・SINθ・COSθ kpq←0、kqp←0 kpj←kpj・COSθ−kqj・SINθ kqj←kpj・SINθ−kqj・COSθ kip←kpi、kiq←kpi ただし、jは、pおよびq以外の列の位置を指し、iは
pおよびq以外の行の位置を指す。
【0041】以上のような計算手順で固有値λ1 ,λ2
,λ3 を算出できる。次に、ステップS12におい
て、一般的な数値計算法で得られた正方行列Kの固有値
λ1 ,λ2 ,λ3 (λ1 ≧λ2 ≧λ3 ≧0)、および、
あらかじめ設定しておいた第1〜第4の判別基準値Th
1〜Th4(Th2≧Th3)を用いて、既に図4〜図
6に示した色分布形状を得ることにより、たとえば、次
に示す条件により文字/線画(印刷)領域、網点(印
刷)領域、および写真領域を判定し、その結果を例えば
0,1,2のID(i)(i=1,N)値としてメモリ
11に記憶する。
【0042】 λ1 <Th1 ……写真領域 ID:2 λ1 ≧Th1 かつ λ2 ≧Th2 または λ3 ≧Th3 または λ1 /λ2 <Th4……網点(印刷)領域 ID:1 上記条件以外 ……文字/線画(印刷)領域 ID:0 ここで、ステップS6における、前述した識別結果を用
いた所定の画像処理について簡単に説明する。たとえ
ば、背景と混在した文字部のみを抽出することを目的と
した場合、メモリ11に記憶された各局所領域のID
(i)値を基に、ID(i)≠0の領域のそれぞれRG
B画像データを、たとえば、白(ffh)の値に置き換
える。その後、ある閾値で2値化を行なうことにより、
文字部のみを抽出することができ、この結果が出力装置
13によって出力される。
【0043】次に、第2の実施例について説明する。こ
の場合、前記したRGBの3次元濃度頻度分布の違いを
定量化するため、網点(印刷)領域を1次元濃度頻度分
布に変換した結果、3つ以上の頻度の極大点を生ずるよ
うなRGB3次元空間上の直線軸を用いて1次元濃度頻
度分布に変換を施し、その1次元頻度分布パターンが文
字/線画(印刷)領域と網点(印刷)領域において異な
ることにより、文字/線画(印刷)部を含む局所領域の
分離を実現する。
【0044】第2の実施例のハード構成は、既に説明し
たような図1に示す第1の実施例と同様な構成で実現で
き、プログラムメモリ10に記憶されている識別処理手
順において、図7に示したフローチャートのステップS
4における局所領域の識別処理が異なる。
【0045】この識別処理手順は、たとえば、図12に
示すフローチャートのようになる。まず、ステップS3
1において、前記した局所領域の位置を示すカウンタi
によって示される(m×n)画素の局所領域における全
画素の中から最大値Dmax 、および、最小値Dmin をR
GBそれぞれについて算出する。
【0046】次に、RGBそれぞれについて、△Dmax
=Dmax −Dmin を算出し、△Dmax とあらかじめ設定
した閾値Th1とを比較し、下記式によって写真領域と
文字/線画(印刷)領域および網点領域とを判定し、第
1の判定値ID1をメモリ11に記憶する。
【0047】 △Dmax ≧Th1……文字/線画(印刷)、網点写真領域 ID1:0 △Dmax <Th1……写真領域 ID1:1 ただし、この際、RGBデータのうち1色でも他の色と
異なる判定結果となった場合は、△Dmax ≧Th1とな
る色成分の判定結果を優先し、このときは文字/線画
(印刷)、網点写真領域とする。
【0048】次に、ステップS32では、第1の判定値
ID1の値をチェックして、もしID1が「1」ならば
処理を終了し、ID1が「0」ならば次のステップS3
3の処理へ進む。ステップS33では、前記した局所領
域の位置を示すカウンタiによって示される(m×n)
画素の局所領域におけるRGBのカラー画像データの全
画素について、前記したような網点(印刷)領域を1次
元濃度頻度分布に変換した結果、3つ以上の頻度の極大
点を生ずるようなRGB3次元空間上の直線L方向へR
GB画素値を射影する。
【0049】ここで、直線Lとして採用してはいけない
場合を説明すると、たとえば、図13に示すように、M
(マゼンタ)とC(シアン)の代表色を通る直線が下地
の代表色W(ホワイト)と、図3には図示していないが
黒の代表色Bkとを通る直線と垂直な場合、直線Lを上
記2直線と垂直な方向に採用すると、射影した結果M、
W、Bkの各代表色が一点に集まり、残りのY(イエロ
ー)の代表色がどこに位置しようとも、3つ以上の極大
点が存在し得ない。
【0050】このような2つ以下しか極大点が存在しな
い場合を除けば、RGB3次元空間において、どの方向
に直線Lを採用してもよい。以下の説明の簡略化のた
め、たとえば、MとCの代表色(Mr,Mg,Mb)、
(Cr,Cg,Cb)を通る直線を直線Lとした場合に
ついて説明する。局所領域内のある画素におけるRGB
値(Ri,Gi,Bi)を上記直線Lへ射影した点tの
値は、直線Lの原点を(Cr,Cg,Cb)に決めたと
き、下記数3のようにして得られる。
【0051】
【数3】
【0052】そこで、あらかじめ設定しておいた一定値
k(>1)、n(nは1よりも大きい整数)を用いて、
まず、tの値をk倍して得られるk・tの値を求め、小
数点以下を四捨五入して得られる整数値hを決定し(た
だし、|h|≦|n|)、あらかじめ「0」に初期化さ
れていた−nから+nまでの2n+1個の頻度分布区分
のうちで、整数値hの頻度分布区分に「1」を加算す
る。
【0053】このような頻度分布の算出方法を(m×
n)画素の局所領域の全画素に適用する。そして、その
結果をメモリ11に順次記憶し、それを繰り返し実行す
れば、局所領域内のカラー画像データから濃淡画像デー
タへの変換が終了する。たとえば、図4、図5のような
RGB3次元濃度頻度分布を持つ画像データの場合、上
記直線Lへの変換により得られる頻度分布データは図1
4、図14に示すようになる。
【0054】これらの図から明らかなように、文字/線
画(印刷)領域の頻度値は原点付近に集中し、極大点は
2個であるのに対して、網点(印刷)領域は文字/線画
(印刷)領域に比べて頻度値の取り得る範囲が広く、3
つ以上の極大点を持っている。したがって、たとえば、
頻度分布の極大点の大小で比較すると、網点(印刷)領
域は文字/線画(印刷)領域に比べて必ず極大点の数が
大きくなる。この極大点の検出は以下のようにして実現
される。
【0055】すなわち、頻度分布データをH(k)とす
ると(n≦k≦n)、次式 Hp(k)=2×H(k)−H(k−1)−H(k+
1) により変換されるデータHp(k)について、次式 Hp(k)≧Hp(k+1) かつ Hp(k)>Hp
(k−1) かつHp(k)>0 の関係を満足するkの分布区分が極大点時として決定さ
れる。
【0056】したがって、ステップS34において、あ
らかじめ設定した第2の閾値Th2(たとえば「3」)
を用いて、下記式によって極大点の大小により文字/線
画(印刷)領域と網点(印刷)領域とを判別し、第2の
判定データID2をメモリ11に記憶する。
【0057】 極大点の数≧Th2……網点(印刷)領域 ID2:1 極大点の数<Th2……文字/線画(印刷)領域 ID2:0 次に、第3の実施例について説明する。この場合、前記
したRGBの3次元濃度頻度分布の違いを定量化するた
め、局所領域における3次元濃度頻度分布の分布を求
め、この頻度分布の極大点を求め、極大点の数の大小関
係から、文字/線画(印刷)部を含む局所領域の分離を
実現する。
【0058】第3の実施例のハード構成は、既に説明し
たような図1に示す第1の実施例と同様な構成で実現で
き、プログラムメモリ10に記憶されている識別処理手
順において、図7に示したフローチャートのステップS
4における局所領域の識別処理が異なる。
【0059】この識別処理手順は、たとえば、図16に
示すフローチャートのようになる。まず、ステップS4
1において、前記した局所領域の位置を示すカウンタi
によって示される(m×n)画素の局所領域におけるR
GBカラー画像データの全画素について、RGBの3変
量についての3次元出現頻度値データについてのヒスト
グラムデータHt(R,G,B)を求める。
【0060】RGBの濃度ヒストグラム作成の処理が終
了すると、このヒストグラムデータHt(R,G,B)
の極大点の検出が行なわれる(S42)。これは、図1
7に2重枠で示すような近傍点の頻度に対して極大であ
るかどうかを調べることによって実現される。すなわ
ち、次式 Hp(i,j,k)=6×Ht(i,j,k)−Ht
(i−1,j,k)−Ht(i,j−1,k)−Ht
(i,j,k−1)−Ht(i+1,j,k)−Ht
(i,j+1,k)−Ht(i,j,k+1) により変換されるデータHp(i,j,k)について、
次式 Hp(i,j,k)≧Hp(i+1,j,k) 、かつ、Hp(i,j,k)≧Hp(i,j+1,
k)、かつ、Hp(i,j,k)≧Hp(i,j,k+
1)、かつ、Hp(i,j,k)>Hp(i,j−1,
k)、かつ、Hp(i,j,k)>Hp(i−1,j,
k)、かつ、Hp(i,j,k)>Hp(i,j,k−
1)、かつ、Hp(i,j,k)>0 の関係を満足する全てのi,j,kのヒストグラムデー
タHt(R,G,B)が極大点51として求められる。
なお、図19におけるi,j,kは、R,G,Bの各軸
にそれぞれ対応する。
【0061】この極大点51は、図18に示した網点
(印刷)領域の場合には、図19に示したように、読取
対象物Pの下地色Y、M、C、YとMとの混色、YとC
との混色、MとCとの混色、YとMとCとの混色(=B
k)の最高8色の極大点が色空間上に存在することにな
る。
【0062】一方、文字/線画(印刷)領域の場合は、
図20に示すように、下地と線の色の2色の極大点が得
られる。また、写真領域の場合には、図21に示すよう
に、この局所領域での濃度変化は僅かであるから極大点
は1つしか得られない。したがって、上記したように極
大点の数の大小関係を基に領域識別を判定することがで
きる。
【0063】すなわち、ステップS43において、あら
かじめ設定しておいた閾値Th1,Th2を用い(たと
えば、Th1=Th2=2)、下記式のような判別式を
用いて文字/線画(印刷)領域と網点(印刷)領域とを
判別でき、その判別結果のID値をメモリ11に記憶す
る。
【0064】 極大点の数>Th1……網点(印刷)領域 ID=1 極大点の数<Th2……写真領域 ID=2 上記以外 ……文字/線画(印刷)領域 ID=0 次に、第4の実施例について説明する。第4の実施例の
ハード構成は、既に説明したような図1に示す第1の実
施例と同様な構成で実現でき、プログラムメモリ10に
記憶されている識別処理手順において、図7に示したフ
ローチャートのステップS4における局所領域の識別処
理が異なる。
【0065】この識別処理手順は、たとえば、図22に
示すフローチャートのようになる。まず、ステップS5
1において、図16のステップS41と同様に、前記し
た局所領域の位置を示すカウンタiによって示される
(m×n)画素の局所領域におけるRGBカラー画像デ
ータの全画素について、ヒストグラムデータHt(R,
G,B)を求める。
【0066】RGBの濃度ヒストグラム作成の処理が終
了すると、ステップS52において、このヒストグラム
データHt(R,G,B)を基に、あらかじめ設定して
おいた一定値C(たとえば、C=1)を用いて、 Ht(R,G,B)≧C を満たすRGB3次元空間上の点の数Pixを係数す
る。このPixは、RGB3次元空間上の色分布の広が
り度を意味する。この結果、図2に示した文字/線画
(印刷)領域に比べて、図3に示した網点(印刷)領域
の場合には、RGB3次元空間上の色分布の広がりが大
きいため、Pixが大きくなる。
【0067】一方、写真領域の場合には、図6に示した
ように、RGB3次元空間上の色分布の広がりが、文字
/線画(印刷)領域に比べて少ないため、Pixが小さ
くなる。したがって、ステップS53において、あらか
じめ設定しておいた閾値Th1,Th2を用い(Th1
<Th2)、下記式のような判別式を用いて文字/線画
(印刷)領域、網点(印刷)領域、および、写真領域を
判定し、その判定結果のID値をメモリ11に記憶す
る。
【0068】 色分布の広がり度(Pix)<Th1……写真領域 ID=2 色分布の広がり度(Pix)≧Th2……網点(印刷)領域 ID=1 上記以外 ……文字/線画(印刷)領域 ID=0 なお、本発明は、前記第1〜第4の実施例に限定される
ものではない。たとえば、前記各実施例では、カラー画
像信号はRGB信号を基に処理の識別を行なっている場
合を説明したが、これに限らず、YMCあるいはYMC
Kの信号、あるいはXYZ、L***、L***、H
VCなどの色空間を表現する信号系であればよい。
【0069】また、前記各実施例では、画像入力部は、
読取対象物を移動させて画像を読取る構成の場合として
説明したが、逆に読取対象物を静止したまま、光学系お
よびカラーラインセンサを移動させて画像を読取っても
よい。
【0070】また、前記各実施例では、網点写真領域を
網点印刷による場合として説明したが、これに限らず、
カラー複写機やカラープリンタなどにより、面積階調で
カラー濃度を表現する方式で記録された面積階調領域
と、文字/線画(印刷)領域とが混在した場合(たとえ
ば、文字/写真モードで記録された複写物)において
も、面積階調領域の判別条件を網点写真領域の判別条件
と同様に設定すれば、文字/線画(印刷)領域を判別で
きる。
【0071】また、前記各実施例では、写真領域を写真
などによる場合として説明したが、これに限らず、カラ
ー複写機やカラープリンタなどにより、濃度階調でカラ
ー濃淡を表現する方式で記録された濃度階調領域と、文
字/線画(印刷)領域が混在した場合(たとえば、文字
/写真モードで記録された複写物)においても、濃淡階
調領域の判別条件を写真領域の判別条件と同様に設定す
れば、文字/線画(印刷)領域を判別できる。
【0072】また、前記各実施例では、画像入力部にカ
ラーラインセンサを用いた場合を説明したが、これに限
らず、カラーエリアセンサ、または、モノクロライン
(エリア)センサと光学的に各色成分に分光する手段
(たとえば、プリズム)と組合わせて用いることもでき
る。この場合、3色成分以上に分光できればよい。
【0073】また、前記各実施例では、RGBの3色成
分データを用いた場合を説明したが、これに限らず、2
色以上の色成分データを用いても、前記実施例と同様に
識別処理を行なうことができる。
【0074】また、前記第1の実施例では、主成分分析
により、第1〜第3主成分の分散を用いる場合について
説明したが、これに限らず、2色以上の色成分データを
用いる場合、少なくとも2つ以上の主成分の分散を用い
れば、領域を判別することができる。
【0075】また、前記第2の実施例では、網点(印
刷)領域と文字/線画(印刷)領域との判別に極大点の
数を用いた場合について説明したが、これに限らず、射
影された濃度のプロファイルの形状の違いを用いた判別
処理(たとえば、分散、取得る濃度値の数(広がり)、
プロファイルのパターンマッチングの大小関係などの組
合わせ)を用いて判別することができる。
【0076】また、前記第3の実施例では、RGBの3
次元濃度分布を基に極大値を算出した場合について説明
したが、これに限らず、n色(n≧2)の色成分データ
を用いて、n色のうちk色(n≧k≧2)を用いたk次
元の濃度頻度分布を用いれば、同様に極大値を算出で
き、領域を判別することができる。
【0077】また、前記第4の実施例では、RGBの3
次元濃度分布を基に頻度の広がり度を算出した場合につ
いて説明したが、これに限らず、n色(n≧2)の色成
分データを用いて、n色のうちk色(n≧k≧2)を用
いたk次元の濃度頻度分布を用いれば、同様に広がり度
を算出でき、領域を判別することができる。
【0078】
【発明の効果】以上詳述したように本発明によれば、局
所領域における文字/線画(印刷)領域と網点(印刷)
領域との3次元濃度頻度分布を定量化して分離を行なう
ことにより、局所領域における濃度変化の少ない写真領
域およびYMCの配置から生じる網点(印刷)領域の色
分布の違いを基に、確実に文字/線画(印刷)領域と区
別ができる画像識別装置を提供できる。
【図面の簡単な説明】
【図1】本発明の実施例にかかる画像識別装置の構成を
概略的に示すブロック図。
【図2】読取対象物における文字/線画領域の局所領域
の一例を示す図。
【図3】読取対象物における網点領域の局所領域の一例
を示す図。
【図4】読取対象物の文字/線画領域の局所領域におけ
る濃度頻度分布の一例を示す図。
【図5】読取対象物の網点領域の局所領域における濃度
頻度分布の一例を示す図。
【図6】読取対象物の写真領域の局所領域における濃度
頻度分布の一例を示す図。
【図7】読取対象物の画像データが得られた後の画像識
別の処理手順を説明するフローチャート。
【図8】読取対象物の画像データを局所領域に分割した
一例を示す図。
【図9】第1の実施例に係る局所領域の識別処理手順を
説明するフローチャート。
【図10】局所領域における各画素のアドレスの参照例
を説明するための図。
【図11】第1の実施例に係る分散共分散行列の固有値
を算出する処理手順を説明するフローチャート。
【図12】第2の実施例に係る局所領域の識別処理手順
を説明するフローチャート。
【図13】投影軸として採用してはいけない場合の一例
を示す図。
【図14】投影軸に投影された文字/線画領域の頻度分
布の一例を示す図。
【図15】投影軸に投影された網点領域の頻度分布の一
例を示す図。
【図16】第3の実施例に係る局所領域の識別処理手順
を説明するフローチャート。
【図17】頻度分布の極大点算出方法を説明するための
図。
【図18】文字/線画領域の局所領域の一例を示す図。
【図19】網点領域の局所領域における色空間上での極
大点分布の一例を示す図。
【図20】文字/線画領域の局所領域の色空間上での極
大点分布の一例を示す図。
【図21】写真領域の局所領域における色空間上での極
大点分布の一例を示す図。
【図22】第4の実施例に係る局所領域の識別処理手順
を説明するフローチャート。
【符号の説明】
P……読取対象物 1……光学系 2……カラーラインセンサ 3……画像入力部 4……カラー画像入力部 5,6,7……画像メモリ(フレームメモリ) 8……メモリ制御部 9……CPU 10……プログラムメモリ 11……メモリ 12……入力装置 13……出力装置

Claims (4)

    【特許請求の範囲】
  1. 【請求項1】 文字/線画領域、網点領域、および写真
    領域が含まれる被読取物から複数の色成分に関するデー
    タを収集する画像入力手段と、 この画像入力手段によって収集された前記複数の色成分
    に関するデータに対して少なくとも2つ以上の主成分方
    向の分散値を求める算出手段と、 この算出手段によって求められた各分散値から前記文字
    /線画領域、網点領域、および写真領域をそれぞれ識別
    する識別手段と、 この識別手段の識別結果に基づき所定の画像処理を行な
    う画像処理手段と、 を具備したことを特徴とする画像識別装置。
  2. 【請求項2】 文字/線画領域、網点領域、および写真
    領域が含まれる被読取物から複数の色成分に関するデー
    タを収集する画像入力手段と、 この画像入力手段によって収集された前記複数の色成分
    に関するデータに対して色成分空間における直線方向へ
    の射影処理を行なうことにより濃度頻度分布を求める算
    出手段と、 この算出手段によって求められた濃度頻度分布に基づき
    前記文字/線画領域、網点領域、および写真領域をそれ
    ぞれ識別する識別手段と、 この識別手段の識別結果に基づき所定の画像処理を行な
    う画像処理手段と、 を具備したことを特徴とする画像識別装置。
  3. 【請求項3】 文字/線画領域、網点領域、および写真
    領域が含まれる被読取物から複数の色成分に関するデー
    タを収集する画像入力手段と、 この画像入力手段によって収集された前記複数の色成分
    に関するデータの生成頻度を求める算出手段と、 この算出手段によって求められた生成頻度の極大点を検
    出する検出手段と、 この検出手段で検出された極大点の数により前記文字/
    線画領域、網点領域、および写真領域をそれぞれ識別す
    る識別手段と、 この識別手段の識別結果に基づき所定の画像処理を行な
    う画像処理手段と、 を具備したことを特徴とする画像識別装置。
  4. 【請求項4】 文字/線画領域、網点領域、および写真
    領域が含まれる被読取物から複数の色成分に関するデー
    タを収集する画像入力手段と、 この画像入力手段によって収集された前記複数の色成分
    に関するデータの生成頻度を求める算出手段と、 この算出手段によって求められた生成頻度に基づき所定
    頻度以上を持つ色数を計数する計数手段と、 この計数手段で計数された色数により前記文字/線画領
    域、網点領域、および写真領域をそれぞれ識別する識別
    手段と、 この識別手段の識別結果に基づき所定の画像処理を行な
    う画像処理手段と、 を具備したことを特徴とする画像識別装置。
JP6191536A 1994-08-15 1994-08-15 画像識別装置 Pending JPH0856287A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP6191536A JPH0856287A (ja) 1994-08-15 1994-08-15 画像識別装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP6191536A JPH0856287A (ja) 1994-08-15 1994-08-15 画像識別装置

Publications (1)

Publication Number Publication Date
JPH0856287A true JPH0856287A (ja) 1996-02-27

Family

ID=16276308

Family Applications (1)

Application Number Title Priority Date Filing Date
JP6191536A Pending JPH0856287A (ja) 1994-08-15 1994-08-15 画像識別装置

Country Status (1)

Country Link
JP (1) JPH0856287A (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0993179A2 (en) 1998-10-08 2000-04-12 Sharp Kabushiki Kaisha Image-processing apparatus and image-processing method
JP2002024825A (ja) * 2000-07-11 2002-01-25 Toshiba Corp 画像処理装置、画像処理方法および証明書作成装置
JP2007102610A (ja) * 2005-10-06 2007-04-19 Sanyo Electric Co Ltd 携帯電話機
US8411937B2 (en) 2007-05-31 2013-04-02 Fuji Xerox Co., Ltd. Image processing apparatus, image processing method and computer-readable medium
JP2014072750A (ja) * 2012-09-28 2014-04-21 Brother Ind Ltd 画像処理装置およびコンピュータプログラム
JP2016076079A (ja) * 2014-10-06 2016-05-12 大日本印刷株式会社 判別システム及び判別方法、判別装置及び撮像装置並びに判別装置用プログラム及び撮像装置用プログラム

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0993179A2 (en) 1998-10-08 2000-04-12 Sharp Kabushiki Kaisha Image-processing apparatus and image-processing method
US6631210B1 (en) 1998-10-08 2003-10-07 Sharp Kabushiki Kaisha Image-processing apparatus and image-processing method
JP2002024825A (ja) * 2000-07-11 2002-01-25 Toshiba Corp 画像処理装置、画像処理方法および証明書作成装置
JP2007102610A (ja) * 2005-10-06 2007-04-19 Sanyo Electric Co Ltd 携帯電話機
US8411937B2 (en) 2007-05-31 2013-04-02 Fuji Xerox Co., Ltd. Image processing apparatus, image processing method and computer-readable medium
JP2014072750A (ja) * 2012-09-28 2014-04-21 Brother Ind Ltd 画像処理装置およびコンピュータプログラム
JP2016076079A (ja) * 2014-10-06 2016-05-12 大日本印刷株式会社 判別システム及び判別方法、判別装置及び撮像装置並びに判別装置用プログラム及び撮像装置用プログラム

Similar Documents

Publication Publication Date Title
EP0899685B1 (en) Image processing apparatus for discriminating image field of original document plural times and method therefor
US7633650B2 (en) Apparatus and method for processing binary image produced by error diffusion according to character or line drawing detection
CN101094306B (zh) 图像处理装置及方法
US6873436B1 (en) Image processing device and recording medium
US6778297B1 (en) Image processing apparatus, method, and computer program product
US6049635A (en) Dotted image area detecting apparatus and dotted image area detecting method
JPH0863597A (ja) 顔抽出方法
JPH03208467A (ja) 画像処理装置の画像領域識別方式
US9407794B2 (en) Image processing apparatus and image processing system
US5930385A (en) Apparatus and method for image conversion
JP2010056691A (ja) 画像処理装置及び画像処理方法
US5684600A (en) Image processor for smoothing and differentiating periodic areas and character areas using coefficients
JPH0856287A (ja) 画像識別装置
JP2005184685A (ja) 画像処理装置、プログラムおよび記録媒体
JP4570534B2 (ja) 画像処理装置、画像形成装置、画像処理方法、及びコンピュータプログラム
JP2007116419A (ja) 原稿使用色特定方法、画像処理装置およびプログラム
WO2022019005A1 (ja) モアレ発生予測装置、モアレ発生予測システム及びモアレ発生予測方法
EP1968303A2 (en) Image forming apparatus and control method
JPH0654180A (ja) 画像領域分離装置及び画像領域分離方法
JP2000358166A (ja) 画像処理装置およびこれを搭載した画像読取装置と画像形成装置、並びに画像処理方法、および画像処理手順を記憶したコンピュータ読み取り可能な記憶媒体
JP2007274204A (ja) 画像評価装置及び画像評価方法
US7295344B2 (en) Image processing method and image processing apparatus, program and recording medium, and image forming apparatus
JPS6359272A (ja) 画像処理装置
JP3183787B2 (ja) 網点領域判定装置
KR20140063378A (ko) 화상형성장치, 화상형성방법 및 컴퓨터 판독가능 기록매체