JP2000353247A - 白黒画像情報の領域判別方法および装置 - Google Patents

白黒画像情報の領域判別方法および装置

Info

Publication number
JP2000353247A
JP2000353247A JP11166525A JP16652599A JP2000353247A JP 2000353247 A JP2000353247 A JP 2000353247A JP 11166525 A JP11166525 A JP 11166525A JP 16652599 A JP16652599 A JP 16652599A JP 2000353247 A JP2000353247 A JP 2000353247A
Authority
JP
Japan
Prior art keywords
pixel
area
character
region
pixels
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP11166525A
Other languages
English (en)
Inventor
Mitsuaki Ishidoya
光昭 石戸谷
Tadakazu Yokoyama
忠和 横山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Riso Kagaku Corp
Original Assignee
Riso Kagaku Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Riso Kagaku Corp filed Critical Riso Kagaku Corp
Priority to JP11166525A priority Critical patent/JP2000353247A/ja
Priority to EP00112602A priority patent/EP1061731A3/en
Publication of JP2000353247A publication Critical patent/JP2000353247A/ja
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/40Picture signal circuits
    • H04N1/40062Discrimination between different image types, e.g. two-tone, continuous tone

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Image Analysis (AREA)
  • Facsimile Image Signal Circuits (AREA)
  • Character Discrimination (AREA)

Abstract

(57)【要約】 【課題】 白黒原稿画像中の文字領域と写真領域とを峻
別する領域判別方法および装置において、文字内部と写
真領域とを正確に判別できるようにする。 【解決手段】 原稿画像中の情報存在領域の中から文字
内部領域と写真領域からなる平坦部領域を抽出する平坦
部判定手段32と、平坦部判定手段32により抽出され
た平坦部領域と、文字エッジ部が抽出された残りのエリ
アを合わせた総合平坦部領域内の画素が、文字内部領域
画素であるのか写真領域画素であるのかを判別する文字
内部判定手段35を設ける。文字内部判定手段35は、
総合平坦部領域内に設定された注目画素の画素値と周辺
画素の画素値との差が所定の値よりも小さく、且つ周辺
画素の少なくとも1つが文字エッジ画素若しくは文字内
部画素であり、且つ注目画素の画素値が所定の値よりも
大きいときには、注目画素を文字内部画素とし、それ以
外は写真領域画素とする。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、主走査方向と副走
査方向に多数の画素で表現された白黒画像情報の各画素
を、文字や線図等から構成される文字領域の画素と写真
領域の画素に峻別する領域判別方法および装置に関する
ものである。
【0002】
【従来の技術】近年ではスキャナの低価格化およびディ
ジタルカメラ等の出現により、多種にわたる画像取込装
置を用いて手軽に画像データを作成することができるよ
うになっている。また、事務処理機器の発展および幅広
い普及に伴い、従来までの、単純に白黒(2値)のみで
表される文字、表、線画等のみによって構成されていた
ワープロ文書等の原稿に簡単に写真画像をはめ込むこと
が可能となっている。更に、グラビア等においては網点
原稿を印刷原稿として用いることが多い。
【0003】このように、近年では、単純に白黒のみで
表されていた原稿に取って代わり、多種多様の情報を1
原稿で伝えようとすることから、主に2値で表される白
黒の文字、表、線画等と、中間調を表すことができる銀
塩写真や網点画像(写真部分のみに限らない)とが、複
雑に混在した原稿が多くなり、印刷に用いる原稿の構成
は、ますます複雑化の傾向を辿っている。
【0004】一方、プリンタや孔版印刷装置等において
印刷画像を形成する場合、文字、写真、網点等が混在し
た原稿をスキャナを用いて読み取って、主走査方向と副
走査方向に画素単位で標本化された多階調画像信号を
得、この多階調画像信号を2値化し、2値化された画像
データに基づいて2値出力することにより白黒の印刷物
を得る必要がある。
【0005】ここで、多階調画像信号を2値化する場
合、従来より、文字または線図等で構成される原稿に対
しては、単一閾値を基準に2値化する単純2値化法が一
般に用いられ、中間調を持つ写真で構成される原稿に対
しては、擬似中間調表現法等の2値化法が用いられてい
る。この擬似中間調表現法の代表的なものとしてはディ
ザ法、誤差拡散法等が知られている。
【0006】上記単一閾値を基準に2値化する単純2値
化法は、多階調画像信号を主、副走査方向にそれぞれ走
査し、予め設定した閾値を基準に、多階調画像信号で構
成される各々の画素を2値化する方法である。ディザ法
は、閾値をあるパターンで変動させてディザマトリクス
を作成し、このディザマトリクスの多階調画像信号を
主、副走査方向に走査し、画素濃度を各々の閾値を基準
に2値化することにより、記録紙上に擬似階調表現を施
す方法である。誤差拡散法は、多階調画像信号を主、副
走査方向に走査し、注目画素周辺の画素に発生する2値
化誤差を予め設定した割合で注目画素に伝搬させ、再配
置された注目画素の画像信号を2値化することにより、
記録紙上に擬似階調表現を施す方法である。
【0007】上記単純2値化法は、濃度勾配の変化が急
激な部分で黒画素を寄せ集める効果があるため、文字や
線画等のコントラストが強調されるべき画像に対しては
有効な手法であるが、写真等の濃度勾配の変化が滑らか
な、コントラストの弱い画像に対しては滑らかな濃度勾
配の変化を持つ画像情報を損わせしめるので、写真等の
画像信号の2値化には適さない。
【0008】これに対して、ディザ法や誤差拡散法によ
る擬似中間調処理を用いた2値化法は、濃度勾配の変化
の少ない領域に擬似的に滑らかな表現を施すものであ
り、写真等のコントラストの弱い画像に対して有効な手
法であるが、文字や線画等の濃度勾配の変化が急激な部
分で黒画素を集中させることを必要とするコントラスト
の強い画像では文字部分等で本来黒画素であるべき部位
に中抜けの白画素を生じさせ、文字のシャープネスを低
下し、細字の形崩れを生ずるので、文字等の画像信号の
2値化には適さない。
【0009】したがって、上述のように、文字、写真、
網点等が混在した原稿の印刷物を得ようとすれば、読み
取って得た画像信号の2値化処理においては、文書、
表、線画等で構成された主に2値で表される領域(以下
文字領域という)については、単純2値化法により2値
化を行い、銀塩写真領域や網点画像領域等の中間調を表
すことができる領域(以下纏めて中間調領域という)に
ついては、ディザ法や誤差拡散法により2値化を行うこ
とが好ましく、上述のように、各種混在した原稿を綺麗
に印刷するためには、原稿1枚分に相当する1フレーム
分の読取画像信号について、文字領域と中間調領域とを
正確に判別し、各領域毎に最適な2値化処理を行う処理
技術が必要になってくる。また、銀塩写真と網点原稿の
写真では、網点原稿の写真に網点処理等の2値化を施す
とモアレが発生しやすい等の問題があるので、銀塩写真
と網点原稿の写真の両者について、単純に同じ2値化処
理を行うことは好ましくなく、このような点からも、読
み取った原稿情報から文字、写真、網点の各領域を正確
に判別し、原稿画像の領域種別に応じた最適な2値化処
理を行うことが必要となる。
【0010】なお、孔版印刷装置においては、ドットゲ
インが大きいため、画像のつぶれが生じやすく、同じ2
値化処理を施したとすると、通常のプリンタよりも全体
的に暗い画像となって印刷出力されるために、例えば中
間調領域について単純に誤差拡散法等により2値化する
と綺麗な画像再現ができないので、原稿の領域判別だけ
でなく出力装置種別にも応じた2値化処理が必要であ
る。
【0011】原稿の領域判別を具現化する方法として
は、従来より、注目画素を囲む参照領域(ブロックサイ
ズ)毎に、周囲との急激な濃度差情報を用いた文字判定
(文字はエッジ情報のみの判定)および周期的に出現す
る網点パターン情報を用いた網点判定等の画像処理を行
うことによって領域判別を行う方法が用いられている
(例えば特開平7−322061号)。この方法は、3
×3等の小さな参照領域を、単純に1画素毎に走査して
領域判別を行う古典的な方法よりも、文字領域(特に文
字エッジ部)と写真領域との判別を正確に行うことがで
きる。
【0012】
【発明が解決しようとする課題】しかしながら、上述し
た従来の参照領域毎に走査して領域判別を行う方法は、
9×9等の比較的大きな参照領域とするほど判別の正確
さを増すことができるものである。そのため、より正確
に領域判別を行おうとすれば、膨大なメモリを要し回路
規模が大きくなってコストが高くなり、また、データ処
理のアルゴリズムが複雑となり判別処理に時間を要する
という問題がある。
【0013】また、上述した従来の参照領域毎に走査し
て領域判別を行う方法は、エッジ情報のみを用いて文字
判定を行うもので、文字幅の小さな場合には比較的判別
が容易であるが、幅の広い文字(エッジとエッジの距離
が長い)の場合には、文字内部を写真部分と誤判別する
場合がある。
【0014】更に、孔版印刷装置のようにドットゲイン
が大きい場合は、参照領域が大きくなると参照領域同士
の境目に濃度むらが発生するという問題もある。
【0015】本発明は、上記事情に鑑みてなされたもの
であり、文字内部と写真領域とを正確に判別することが
できると共に、比較的小さな参照領域を用いることも可
能ならしめる領域判別方法および装置を提供することを
目的とするものである。
【0016】
【課題を解決するための手段】本発明による白黒画像情
報の領域判別方法は、例えば参照領域毎に走査する領域
判別方法を用いて文字内部領域画素または写真領域画素
のいずれかであると判断された画素について、1画素毎
に走査して文字内部らしさを分析することにより、文字
内部領域の画素と写真領域の画素とを判別することを特
徴とするものである。
【0017】即ち、本発明による白黒画像情報の領域判
別方法は、多数の画素で表現された白黒画像情報の各画
素を、少なくとも文字内部領域画素と写真領域画素とに
峻別する白黒画像情報の領域判別方法であって、各画素
を、文字内部領域画素または写真領域画素とそれ以外の
画素とに判別し、文字内部領域画素または写真領域画素
のいずれかであると判断された画素について、各画素毎
に、該画素を注目画素とし、該注目画素および該注目画
素を囲む複数の周辺画素の各画素値に基づいて、該注目
画素の文字内部らしさ、換言すれば注目画素が文字内部
の画素であるのか写真部分の画素であるのかを分析し、
注目画素を、文字内部らしいと分析されたときには文字
内部領域画素とし、それ以外は写真領域画素とすること
を特徴とするものである。
【0018】ここで、各画素を、文字内部領域画素また
は写真領域画素とそれ以外の画素とに判別するに際して
は、上記特開平7−322061号等に記載のように、
所定の大きさの参照領域毎に走査することによって領域
判別を行う方法を用いるのが好ましい。
【0019】「文字内部領域画素または写真領域画素の
いずれかであると判断された画素について、各画素毎
に」とは、文字内部領域画素または写真領域画素と判断
された画素の全てについて、1画素毎に走査してという
意味である。
【0020】文字内部らしさの分析に際しては、注目画
素の画素値と周辺画素の各画素値との差が所定の値より
も小さく、且つ周辺画素の少なくとも1つが文字エッジ
画素若しくは文字内部領域画素であり、且つ注目画素の
画素値が所定の値よりも大きいときに、文字内部らしい
とするのが好ましい。
【0021】注目画素の画素値と周辺画素の各画素値と
の差としては、例えば注目画素と各周辺画素の画素値と
の夫々の差の最大値を用いてもよいし、或いは夫々の差
の平均値を用いてもよい。
【0022】本発明による領域判別装置は、上記領域判
別方法を実現する装置、即ち、多数の画素で表現された
白黒画像情報の各画素を、少なくとも文字内部領域画素
と写真領域画素とに峻別する領域判別手段を備えた領域
判別装置であって、領域判別手段を、各画素を、文字内
部領域画素または写真領域画素とそれ以外の画素とに判
別し、文字内部領域画素または写真領域画素のいずれか
であると判断された画素について、各画素毎に、該画素
を注目画素とし、該注目画素の画素値および該注目画素
を囲む複数の周辺画素の各画素値に基づいて、該注目画
素の文字内部らしさを分析すると共に、注目画素を、文
字内部らしいと分析したときには文字内部領域画素と
し、それ以外は写真領域画素とする文字内部分析手段を
有するものとしたことを特徴とするものである。
【0023】本発明による領域判別装置の文字内部分析
手段は、注目画素の画素値と周辺画素の各画素値との差
が所定の値よりも小さく、且つ周辺画素の少なくとも1
つが文字エッジ画素若しくは文字内部領域画素であり、
且つ注目画素の画素値が所定の値よりも大きいときに、
文字内部らしいとするものであることが好ましい。
【0024】
【発明の効果】本発明による白黒画像情報の領域判別方
法および装置によれば、文字内部領域画素または写真領
域画素のいずれかであると判断された画素について、1
画素毎に走査して、注目画素と周辺画素の各画素値に基
づいて、注目画素の文字内部らしさを分析する、換言す
れば注目画素が文字内部の画素であるのか写真部分の画
素であるのかを判別するようにしたので、幅の広い文字
の文字内部を写真部分と誤判別する虞が少なくなる。
【0025】また、文字内部であるのか写真部分である
のかを判別するようにした付加的な効果として、文字内
部領域画素または写真領域画素とそれ以外の画素とに判
別するに際して、参照領域毎に走査して領域判別を行う
従来の方法を用いた場合、参照領域のサイズを、本発明
を適用していない従来の方法より小さくしても、最終的
な領域判別の結果を精度のよいものとすることができ
る。これにより、回路規模を小さくしたり、処理アルゴ
リズムを簡易なものとすることができるようになる。
【0026】
【発明の実施の形態】以下、図面を参照して本発明の実
施の形態について詳細に説明する。図1は本発明の実施
の形態による領域判別装置の構成を示すブロック図であ
る。
【0027】図1に示すように、この領域判別装置1
は、スキャナ等を用いた画像入力部10と、注目画素設
定手段21およびエリア設定手段22からなる前処理部
20と、下地領域・情報存在領域判定手段31、平坦部
判定手段32、網点判定手段33、文字エッジ判定手段
34および文字内部判定手段35からなる領域判別部3
0と、下地・文字領域2値化手段41、網点領域2値化
手段42および写真領域2値化手段43からなる2値化
部40と、出力部50とから構成されている。
【0028】注目画素設定手段21は、画像入力部10
から入力された、主走査方向と副走査方向とに画素単位
で標本化された多階調の画素で形成された画像信号Sを
使用して、主、副の両走査方向における注目画素f1
(m1,n1),f2(m2,n2)を設定するもので
ある。なお、m1,m2は主走査方向、n1,n2は副
走査方向の画素番号である。
【0029】エリア設定手段22は、画像信号Sと注目
画素f1(m1,n1)とから、各注目画素f1(m
1,n1)毎に、主、副の両走査方向に夫々連続する複
数の画素からなる、注目画素f1(m1,n1)を中心
とする(2×i1+1)×(2×j1+1)マトリック
スのエリアF1(m1,n1)或いは注目画素f2(m
2,n2)を中心とする(2×i2+1)×(2×j2
+1)マトリックスのエリアF2(m2,n2)を設定
するものである。なお、(2×i1+1),(2×i2
+1)は主走査方向、(2×j1+1),(2×j2+
1)は副走査方向の画素数である。
【0030】下地領域・情報存在領域判定手段31は、
下地領域即ち余白領域および背景領域と、情報存在領域
即ち文書、表、線画等で構成された文字領域および写真
領域や網点画像領域からなる中間調領域とを判別するも
のである。具体的には、下地領域・情報存在領域判定手
段31は、注目画素設定手段21によって設定された注
目画素f1(m1,n1)を中心とする、エリア設定手
段22によって設定された(2×i1+1)×(2×j
1+1)マトリックスのエリアF1(m1,n1)内の
各画素の画素値(濃度値)の配置パターン或いは所定の
式にしたがって求めた特徴量を検出して、検出した配置
パターンまたは特徴量と予め想定された配置パターン等
とを比較することによって、エリアF1(m1,n1)
が原稿の下地領域であるか否か、換言すれば下地領域で
あるか情報存在領域であるかを判別するものである。
【0031】平坦部判定手段32は、下地領域・情報存
在領域判定手段31によって判別された情報存在領域の
中から文字内部領域と写真領域(両者を纏めて平坦部領
域という)とを抽出するものであり、注目画素f1(m
1,n1)を中心とするエリアF1(m1,n1)内の
全画素の画素値の内の、最大画素値Lmaxと最小画素
値Lminを求め、最大画素値Lmaxと最小画素値L
minとの差が所定の値Pよりも小さいときには、その
エリアF1(m1,n1)を平坦部領域とするものであ
る。
【0032】網点判定手段33は、下地領域・情報存在
領域判定手段31によって判別された情報存在領域の中
から網点領域を抽出するものであり、注目画素f1(m
1,n1)を中心とするエリアF1(m1,n1)内の
全画素の画素値の配置パターンを検出し、検出した配置
パターンが網点パターンに相当する場合には、そのエリ
アF1(m1,n1)を網点領域とするものである。
【0033】文字エッジ判定手段34は、下地領域・情
報存在領域判定手段31によって判別された情報存在領
域の中から文字エッジ部を抽出するものであり、注目画
素f1(m1,n1)を中心とするエリアF1(m1,
n1)内の各画素の画素値の内の、最大画素値Lmax
と最小画素値Lminを求め、最大画素値Lmaxと最
小画素値Lminとの差が所定の値Nより大きく、且
つ、注目画素f1(m1,n1)の画素値が所定の値T
H1よりも大きい場合(黒文字)若しくは注目画素f1
(m1,n1)の画素値が所定の値TH1よりも小さい
場合(中抜き文字)には、そのエリアF1(m1,n
1)を文字エッジ部とするものである。
【0034】文字内部判定手段35は、文字内部領域ま
たは写真領域のいずれかであると判断された領域(後述
する総合平坦部領域)の画素が、文字内部領域の画素で
あるのか写真領域の画素であるのかを判別するものであ
り、総合平坦部領域内に設定された注目画素f2(m
2,n2)を中心とする(2×i2+1)×(2×j2
+1)マトリックスのエリアF2(m2,n2)内の各
画素の画素値に基づいて、注目画素f2(m2,n2)
の文字内部らしさを分析し、注目画素f2(m2,n
2)が文字内部らしいと分析されたときには、注目画素
f2(m2,n2)を文字内部画素とし、それ以外は写
真領域画素とするものである。文字内部らしさの分析
は、注目画素f2(m2,n2)の画素値とエリアF2
(m2,n2)内の注目画素f2(m2,n2)を除く
画素即ち周辺画素の各画素値との差、例えば差の最大値
や差の平均値が、所定の値よりも小さく、且つ周辺画素
の少なくとも1つが文字エッジ部の画素(以下文字エッ
ジ画素という)若しくは文字内部領域の画素(文字内部
画素)であり、且つ注目画素f2(m2,n2)の画素
値が所定の値よりも大きいときに、文字内部らしいとす
る。なお、その他の判断基準を用いて文字内部らしさを
判別するようにしてもよい。
【0035】平坦部判定手段32および文字内部判定手
段35により、本発明による文字内部分析手段が構成さ
れる。
【0036】下地・文字領域2値化手段41は、下地領
域および文字領域の多階調画像信号を単純2値化法等に
より2値化するものである。
【0037】網点領域2値化手段42は、LPF(ロー
パスフイルタ)等を用いてスムージング処理を行って、
一旦網点情報をボカすスムージング処理手段42aと、
スムージング処理された画像信号に対してメディアンフ
ィルタ等を用いてエッジ強調を行うエッジ強調手段42
bを有するもので、網点領域の多階調画像信号をディザ
法(網点処理法)を用いて2値化するものである。これ
により、単純にディザ法による疑似階調表現法により2
値化する場合に較べて、モアレの発生が抑制され、綺麗
な印刷が得られるようになる。
【0038】写真領域2値化手段43は、写真領域の多
階調画像信号をディザ法や誤差拡散法等による疑似階調
表現法により2値化するものである。
【0039】出力部50は、具体的にはセレクタから構
成されており、領域判別部30から出力される各画素毎
の領域判別信号に基づいて、下地・文字領域2値化手段
41と、網点領域2値化手段42と、写真領域2値化手
段43とが各々出力する2値化信号の何れかを選択して
出力するものである。これにより出力部50より出力2
値画像信号を得ることができ、該出力2値画像信号を不
図示の印刷部に入力して印刷を行うことにより、画像入
力部10で読み取られた原稿画像に基づいて、最適な印
刷原稿を出力することができる。
【0040】なお、図1に示した接続態様から明らかな
ように、当該領域判別装置1の下地・文字領域2値化手
段41、網点領域2値化手段42および写真領域2値化
手段43は、何れも、対応する夫々の領域のみの画像信
号に対して2値化処理を行うものとして構成されておら
ず、画像入力部10によって取得された画像信号を直ち
に2値化するものとして構成され、領域判別部30から
の領域判別信号に応じて出力部50が選択出力した結果
である出力2値画像信号を得ることによって、結果的に
各領域の多階調画像信号を夫々2値化するものとして構
成されている。
【0041】なお、各2値化手段41,42,43は、
このような構成に限らず、画像入力部10によって取得
された画像信号の内、例えば下地領域および文字領域の
多階調画像信号を2値化手段41にのみ入力する等、領
域判別部30からの領域判別信号に応じて、対応する2
値化手段41,42,43にのみ入力し、対応する領域
の画像信号のみを2値化する構成としてもよい。
【0042】次に図2〜図7を参照して、本発明による
領域判別方法のアルゴリズムを詳細に説明する。
【0043】まず最初に、画像入力部10において読み
取られる混在原稿の各領域の特徴について説明する。
【0044】図2は、網点領域の画像の特徴を説明する
ための図であって、比較的濃度の薄い下地に表された比
較的濃度の濃い(例えばグレー原稿)、145線、角度
45度の網点画像の拡大図を示している。図中黒で示し
た各網点の大きさは径が約40μmであり、主走査およ
び副走査方向のピッチが160μmで、斜め方向に角度
45度で網点が配されている。図2に示したように、網
点領域の画像は、周期的に網点が出現するという特長が
あることが判る。
【0045】上述した網点判定手段33は、このような
網点領域の画像の特徴に基づいて、注目画素f1(m
1,n1)を中心とする判定対象のエリアF1(m1,
n1)が網点領域であるのか否かを判定する。
【0046】図3は、文字エッジ部の特徴を説明するた
めの図であって、図3(A)は比較的濃度の薄い下地に
記載された比較的濃度の濃い文字“あ”を示し、図3
(B)はその一部の拡大図を示している。なお、図3
(B)に示した拡大図においては、文字エッジ部を明瞭
に示すために、文字エッジ部のみを実線で示し、後述す
る文字内部に対応する部分を白抜きで示している。
【0047】図3(B)の拡大図に示したように、文字
エッジ部は、概ね下地部との濃度差が著しいという特長
があることが判る。なお、比較的濃度の濃い下地に記載
された比較的濃度の薄い、いわゆる白抜き文字の場合に
も、前述と同様に、文字エッジ部は、下地部との濃度差
が著しいということに相違はない。
【0048】上述した文字エッジ判定手段34は、この
ような文字エッジ部の特徴に基づいて、注目画素f1
(m1,n1)を中心とする判定対象のエリアF1(m
1,n1)が文字エッジ部であるのか否かを判定する。
【0049】図4は、文字内部の特徴を説明するための
図であって、図4(A)は比較的濃度の薄い下地に記載
された比較的濃度の濃い文字“え”を示し、図4(B)
はその一部の拡大図を示している。図4(B)の拡大図
に示したように、文字エッジ部で囲まれた部分即ち文字
内部は、文字エッジ部と略同一の濃度で且つ均一な濃度
分布(濃度差±数%)を呈するという特長があることが
判る。
【0050】上述した文字内部判定手段35は、このよ
うな文字内部の特徴に基づいて、平坦部領域内に設定さ
れた注目画素f2(m2,n2)が文字内部の画素であ
るのか否かを判定する、換言すれば文字内部の画素であ
るのか写真領域の画素であるのかを判別する。なお、文
字エッジ部と文字内部とを合わせることにより、文字領
域が構成されるのは言うまでもない。
【0051】次に、図5に示したフローチャートと、図
6および図7に示したマトリクスを参照して、本発明に
よる白黒画像情報の領域判別方法における判別手順につ
いて説明する。なお、図5においては、処理のステップ
番号をSTを付して示す。また、図6および図7は、全
画像データのマトリクスの一部分を示したものである。
【0052】図5のフローチャートに示した判別処理
は、1)下地領域・情報存在領域判定処理、2)平坦部
判定処理、3)網点・非網点判定処理、4)文字エッジ
部判定処理、5)文字内部判定処理(文字/写真判定処
理)の、5つの処理に大別することができる。
【0053】先ず、画像入力部10の不図示のスキャナ
によって、該スキャナにおける解像度に基づいて標本化
および量子化がなされ、多値レベルの画素値(濃度値)
をもつデジタル画像信号が、各画素毎に、図6に示すよ
うに、主走査方向および副走査方向にマトリックス上に
配列されるものとする。なお、スキャナの解像度は、サ
ンプリング定理にしたがって、少なくとも網点の出現周
期の2倍以上とする。
【0054】マトリックス上に配列された各画素を主、
副走査方向に走査し、注目画素設定手段31により注目
画素f1(m1,n1)を設定する。設定された注目画
素f1(m1,n1)を中心として、主走査方向の画素
数(2×i1+1)、副走査方向の画素数(2×j1+
1)から成る(2×i1+1)×(2×j1+1)(但
し、i1≧1,j1≧1の整数)の複数画素で構成され
る注目エリアF1(m1,n1)をエリア設定手段32
により設定する。注目画素f1(m1,n1)は、主走
査(2×i1+1)画素毎に、また副走査(2×j1+
1)画素毎に走査される。また注目エリアF1(m1,
n1)は、主、副走査方向に1エリア毎に走査される。
ここで、(2×i1+1)×(2×j1+1)として
は、具体的には5×5とする。
【0055】下地領域・情報存在領域判定手段31によ
る下地領域・情報存在領域判定処理(ST11)におい
ては、注目エリアF1(m1,n1)が下地領域である
か、否であるか、即ち文字領域、写真領域および網点画
像領域からなる情報存在領域であるかを判別するため
に、先ず注目エリアF1(m1,n1)内の各画素の画
素値(濃度値)の配置パターン或いは特徴量を検出す
る。例えば特徴量を求める場合には、所定の式に基づい
て、注目エリアF1(m1,n1)中の各画素(画素番
号=m1−i1,n1−j1、m1−i1+1,n1−
j1、・・・、m1+i1−1,n1+j1、m1+i
1,n1+j1)の画素値を予め設定されたしきい値d
と夫々比較し、条件を満たす画素の個数をカウントし、
そのカウント数をしきい値P1と比較し、特徴値を検出
する等して行う(例えば特開平7−322061号参
照)。次に、検出した配置パターンや特徴量と予め想定
された配置パターンや特徴量とを比較することによっ
て、エリアF1(m1,n1)が原稿の下地領域である
か否か、換言すれば下地領域であるか情報存在領域であ
るかを判別する。
【0056】以上の処理を、入力された全画像データ中
の各エリア分全てについて行い、各エリアが下地領域で
あるかそれ以外の情報存在領域(文字領域+写真領域+
網点画像領域)であるかの判別結果を不図示の記憶装置
に一時記憶する。
【0057】次に、平坦部判定手段32による平坦部判
定処理(ST12)においては、下地領域・情報存在領
域判定手段31によって判別された情報存在領域の中か
ら文字内部領域と写真領域からなる平坦部領域を抽出す
る。具体的には、情報存在領域と判断されたエリアにつ
いて、注目画素f1(m1,n1)を中心とする(2×
i1+1)×(2×j1+1)、即ち5×5マトリック
スの注目エリアF1(m1,n1)内の25個の全画素
の画素値L1〜L25(Lnのnは画素番号)をチェッ
クし、画素値の内の最大画素値Lmaxと最小画素値L
minを求める。求めた最大画素値Lmaxと最小画素
値Lminとの差(=Lmax−Lmin)が所定の値
Pよりも小さいときには、そのエリアF1(m1,n
1)を平坦部領域とする。例えば、画像値が0〜255
の256階調の濃度で表されるものであるとした場合、
差が10程度以下である場合には、その注目エリアF1
(m1,n1)を平坦部とみなす。
【0058】次に、網点判定手段33による網点/非網
点判定処理(ST13)においては、下地領域・情報存
在領域判定手段31によって判別された情報存在領域の
中から網点領域を抽出する。具体的には、先ず、図7
(A)に示すように、情報存在領域と判断された全エリ
アの内、ステップ12によって平坦部領域が抽出された
残りのエリアについて、該エリア内の注目エリアF1
(m1,n1)の前述した5×5の25個の画素値L1
〜L25の平均値Aveを算出する。次に、図7(B)
に示すように、算出した平均値Aveを基準として、値
(濃度)が高いか低いかによって、各画素値に対して仮
の2値化処理を施し、多階調データを0/1の2値化デ
ータに変換する。次に、2値化した0/1で構成された
25個のデータの、画素の並び方向(主走査方向および
副走査方向)における出現パターンが、予め想定された
網点パターンに対応するものか否かを判断する。例え
ば、2値化した0/1で構成された25個のデータに基
づいて、主走査方向における0/1の変化回数Hおよび
副走査方向における0/1の変化回数Vを各々算出し、
この算出した主走査方向の変化回数Hが所定の回数T1
以上で、且つ副走査方向の変化回数Vが所定の回数T2
以上である場合には、その注目エリアF1(m1,n
1)を網点部と見なす。ここで、T1,T2としては、
例えば共に6回とする。
【0059】次に文字エッジ判定手段34による文字エ
ッジ部判定処理(ST14)においては、下地領域・情
報存在領域判定手段31によって判別された情報存在領
域の中から文字エッジ部を抽出する。具体的には、図7
(C),(D)に示すように、情報存在領域と判断され
た全エリアの内、ステップ13によって網点領域が抽出
された残りのエリア、即ち非網点領域について、該エリ
ア内の注目エリアF1(m1,n1)の25個の画素値
をチェックして得た、最大画素値Lmaxと最小画素値
Lminとの差(Lmax−Lmin)が所定の値Nよ
り大きく(図7(C))、且つ、注目画素f1(m1,
n1)の画素値L13が所定の値TH1よりも大きい場
合(図7(D))黒文字のとき)若しくは注目画素f1
(m1,n1)の画素値が所定の値TH1よりも小さい
場合(中抜き文字のとき)には、その注目エリアF1
(m1,n1)を文字エッジ部と見なし、残りのエリア
を文字内部領域または写真領域のいずれかであると見な
して、ステップ12において抽出された平坦部領域に加
える。なお、この処理では、濃度変化の大きい点を見つ
けることになる。
【0060】次に、文字内部判定手段35による文字内
部判定処理(ST15)においては、ステップ12にお
いて平坦部判定手段32によって抽出された平坦部領域
と、ステップ14において文字エッジ部が抽出された残
りのエリアを合わせた総合平坦部領域が、文字内部領域
であるのか写真領域であるのかを判別する。具体的に
は、先ず、注目画素設定手段31により、総合平坦部領
域とされた全エリアについて、該エリア内に注目画素f
2(m2,n2)を設定する。設定された注目画素f2
(m2,n2)を中心として、主走査方向の画素数(2
×i2+1)、副走査方向の画素数(2×j2+1)か
ら成る(2×i2+1)×(2×j2+1)(但し、i
2≧1,j2≧1の整数)の複数画素で構成される注目
エリアF2(m2,n2)をエリア設定手段32により
設定する。なお、注目画素f2(m2,n2)は、主走
査方向および副走査方向共に、1画素毎に走査するもの
とし、これにより、注目エリアF2(m2,n2)も、
主、副走査方向に夫々1画素毎に走査されるものとす
る。ここで、(2×i2+1)×(2×j2+1)とし
ては、具体的には3×3とする。
【0061】次に、各走査毎に、(2×i2+1)×
(2×j2+1)即ち3×3マトリックスのエリアF2
(m2,n2)内の9個の各画素の画素値に基づいて、
注目画素f2(m2,n2)の文字内部らしさを分析
し、注目画素f2(m2,n2)が文字内部らしいと分
析されたときには、注目画素f2(m2,n2)を文字
内部画素とし、それ以外は写真領域画素とする。これに
より、文字内部と写真部分とを正確に判別することがで
きるようになり、従来の方法のように、幅の広い文字の
文字内部を写真部分と誤判別するという問題は生じなく
なる。
【0062】ここで、文字内部らしさの分析は、具体的
には、図7(E)〜(G)に示すように、総合平坦部領
域と判断された全エリアについて、該エリア内の注目画
素f2(m2,n2)の画素値K5と、注目画素f2
(m2,n2)を囲む3×3の注目エリアF2(m2,
n2)内の注目画素f2(m2,n2)を除く8個の周
辺画素の画素値K1,K2,・・・,K9との差(G1
=K1−K5,G2=K2−K5,・・・,G9=K9
−K5)を夫々求め、求めた差の最大値或いは差の平均
値、即ち周辺との誤差GOSAが所定の値Mよりも小さ
く(図7(E))、且つ注目画素f2(m2,n2)の
画素値K5が所定の値TH2よりも大きく(図7
(F);黒文字)若しくは小さく(中抜き文字)、且つ
周辺画素の少なくとも1つが文字エッジ画素若しくは文
字内部画素であるとき(図7(G))には文字内部らし
いとする。
【0063】上記の手順によって、情報存在領域内の各
画素が、網点部の画素であるのか、文字領域(エッジ+
内部)の画素であるのかを判定することができ、また何
れにも含まない画素が写真領域の画素と見なすことがで
き、結果として、文字、網点、写真等が混在した原稿に
おける画像情報を、下地領域、文字領域、網点領域およ
び写真領域に判別することができるようになり、特に、
従来の方法では判別が困難であった幅の広い文字の文字
内部と写真領域との峻別も確実に行うことができる。ま
た、文字内部と写真領域との峻別を行うに際して、3×
3という小さなエリアを参照領域として用いて処理を行
っており、エリアが小さい分だけ簡単なアルゴリズムや
回路構成で判定処理を実現することができる。
【0064】なお、上述した各ステップにおける判別に
際して用いたパラメータM,N,P,T1,T2,TH
1,TH2は固定されたものではなく、出力部50に接
続された不図示の印刷部の種別に応じて、値を変更・設
定してもよい。
【0065】一方、上述した領域判別処理と平行して、
多値画像データの2値化処理を行う。即ち、下地・文字
領域2値化手段41により、下地領域および文字領域の
多階調画像信号を単純2値化法等により2値化し、網点
領域2値化手段42により、網点領域の多階調画像信号
を、LPF(ローパスフイルタ)等を用いてスムージン
グ処理を行って、一旦網点情報をボカし、その後にメデ
ィアンフィルタ等を用いてエッジ強調を行って前記ボケ
を緩和した後にディザ法(網点処理法)を用いて2値化
し、写真領域の多階調画像信号をディザ法や誤差拡散法
等による疑似階調表現法により2値化する。なお、各2
値化手段41,42,43における2値化の際のパラメ
ータ値は、出力部50に接続された不図示の印刷部の種
別に応じて変更する、つまり、上記構成による領域判別
装置1を、例えば孔版印刷装置に適用する場合と、通常
のプリンタに適用する場合とでは、パラメータ値を変更
するようにする。
【0066】最後に、出力部50において、領域判別部
30から入力された各画素毎の領域判別信号に基づい
て、下地・文字領域2値化手段41と網点領域2値化手
段42と写真領域2値化手段43とが、各々出力する2
値化信号の内、領域判別信号が下地若しくは文字領域を
示しているときには下地・文字領域2値化手段41から
出力された2値化出力信号を選択し、領域判別信号が網
点領域を示しているときには網点領域2値化手段42か
ら出力された2値化出力信号を選択し、領域判別信号が
写真領域を示しているときには写真領域2値化手段43
から出力された2値化出力信号を選択して出力する。こ
れにより出力部50から判別された領域に適応する出力
2値画像信号が得られ、該出力2値画像信号を不図示の
印刷部に入力して印刷を行う。
【0067】以上説明したように、本発明による白黒画
像情報の領域判別方法および装置によれば、文字内部領
域画素または写真領域画素のいずれかであると判断され
た領域の画素について、1画素毎に走査して、注目画素
と周辺画素の各画素値に基づいて、注目画素が文字内部
の画素であるのか写真部分の画素であるのかを判別する
ようにしたので、幅の広い文字の文字内部と写真部分と
を正確に判別することができるようになる。また、副次
的効果として、参照領域毎に走査して領域判別を行う従
来の方法を用いて、下地領域と情報存在領域とを判別す
る際、参照領域を従来の方法よりも小さくしても、その
領域判別結果の精度を落とすことがなく、結果として、
参照領域が小さい分だけトータルの判定処理も極簡単な
アルゴリズムや回路構成で実現することができるように
なる。
【図面の簡単な説明】
【図1】本発明の実施の形態による領域判別装置の構成
を示すブロック図
【図2】網点領域の画像の特徴を説明するための図
【図3】文字エッジ部の特徴を説明するための図
【図4】文字内部の特徴を説明するための図
【図5】本発明による領域判別方法の処理アルゴリズム
を示すフローチャート
【図6】原稿画像の画像データを主走査方向および副走
査方向にマトリックス状に配列した例を示した図
【図7】処理アルゴリズムにおける演算例を示した図
【符号の説明】
1 領域判別装置 10 画像入力部 20 前処理部 21 注目画素設定手段 22 エリア設定手段 30 領域判別部 31 下地領域・情報存在領域判定手段 32 平坦部判定手段 33 網点判定手段 34 文字エッジ判定手段 35 文字内部判定手段 40 2値化部 41 下地・文字領域2値化手段 42 網点領域2値化手段 43 写真領域2値化手段 50 出力部
───────────────────────────────────────────────────── フロントページの続き Fターム(参考) 5C077 LL01 LL03 LL05 MP01 MP02 PP27 TT02 TT06 TT08 5L096 AA03 AA06 BA07 BA12 DA01 EA43 FA44 FA45 FA78 GA07 GA10 GA51

Claims (4)

    【特許請求の範囲】
  1. 【請求項1】 多数の画素で表現された白黒画像情報の
    各画素を、少なくとも文字内部領域画素と写真領域画素
    とに峻別する前記白黒画像情報の領域判別方法におい
    て、 前記各画素を、前記文字内部領域画素または前記写真領
    域画素とそれ以外の画素とに判別し、前記文字内部領域
    画素または写真領域画素のいずれかであると判断された
    画素について、各画素毎に、該画素を注目画素とし、該
    注目画素および該注目画素を囲む複数の周辺画素の各画
    素値に基づいて、該注目画素の文字内部らしさを分析
    し、前記注目画素を、文字内部らしいと分析されたとき
    には前記文字内部領域画素であると判別し、それ以外は
    前記写真領域画素であると判別とすることを特徴とする
    領域判別方法。
  2. 【請求項2】 前記注目画素の画素値と前記周辺画素の
    各画素値との差が所定の値よりも小さく、且つ前記周辺
    画素の少なくとも1つが文字エッジ画素若しくは文字内
    部領域画素であり、且つ前記注目画素の画素値が所定の
    値よりも大きいときに、前記文字内部らしいとすること
    を特徴とする請求項1記載の領域判別方法。
  3. 【請求項3】 多数の画素で表現された白黒画像情報の
    各画素を、少なくとも文字内部領域画素と写真領域画素
    とに峻別する領域判別手段を備えた前記白黒画像情報の
    領域判別装置において、 前記領域判別手段が、前記各画素を、前記文字内部領域
    画素または前記写真領域画素とそれ以外の画素とに判別
    し、前記文字内部領域画素または写真領域画素のいずれ
    かであると判断された画素について、各画素毎に、該画
    素を注目画素とし、該注目画素の画素値および該注目画
    素を囲む複数の周辺画素の各画素値に基づいて、該注目
    画素の文字内部らしさを分析すると共に、前記注目画素
    を、前記文字内部らしいと分析したときには前記文字内
    部領域画素とし、それ以外は前記写真領域画素とする文
    字内部分析手段を有するものであることを特徴とする領
    域判別装置。
  4. 【請求項4】 前記文字内部分析手段が、前記注目画素
    の画素値と前記周辺画素の各画素値との差が所定の値よ
    りも小さく、且つ前記周辺画素の少なくとも1つが文字
    エッジ画素若しくは文字内部領域画素であり、且つ前記
    注目画素の画素値が所定の値よりも大きいときに、前記
    文字内部らしいとするものであることを特徴とする請求
    項3記載の領域判別装置。
JP11166525A 1999-06-14 1999-06-14 白黒画像情報の領域判別方法および装置 Pending JP2000353247A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP11166525A JP2000353247A (ja) 1999-06-14 1999-06-14 白黒画像情報の領域判別方法および装置
EP00112602A EP1061731A3 (en) 1999-06-14 2000-06-14 Method of and system for distinguishing regions in black and white image information

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP11166525A JP2000353247A (ja) 1999-06-14 1999-06-14 白黒画像情報の領域判別方法および装置

Publications (1)

Publication Number Publication Date
JP2000353247A true JP2000353247A (ja) 2000-12-19

Family

ID=15832938

Family Applications (1)

Application Number Title Priority Date Filing Date
JP11166525A Pending JP2000353247A (ja) 1999-06-14 1999-06-14 白黒画像情報の領域判別方法および装置

Country Status (2)

Country Link
EP (1) EP1061731A3 (ja)
JP (1) JP2000353247A (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU2008260018C1 (en) * 2008-12-18 2011-01-20 Canon Kabushiki Kaisha Refining text extraction in colour compound documents

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07322061A (ja) * 1994-05-30 1995-12-08 Riso Kagaku Corp 文字・写真領域判別方法および装置
JP3472094B2 (ja) * 1997-08-21 2003-12-02 シャープ株式会社 領域判定装置

Also Published As

Publication number Publication date
EP1061731A3 (en) 2003-04-23
EP1061731A2 (en) 2000-12-20

Similar Documents

Publication Publication Date Title
US7633650B2 (en) Apparatus and method for processing binary image produced by error diffusion according to character or line drawing detection
JP4988624B2 (ja) 画像処理装置、画像処理方法及び記録媒体
KR100994644B1 (ko) 화상 처리 장치 및 그 방법
JP4170353B2 (ja) 画像処理方法、画像処理装置、画像読取装置、画像形成装置、プログラムおよび記録媒体
JP2001251507A (ja) 画像処理装置
US20090284801A1 (en) Image processing apparatus and image processing method
JP3088010B2 (ja) 線画分離方法および装置
US6775031B1 (en) Apparatus and method for processing images, image reading and image forming apparatuses equipped with the apparatus, and storage medium carrying programmed-data for processing images
JP3083673B2 (ja) 像域識別装置
JP3807891B2 (ja) 画像情報の領域判別方法および装置
JP2616386B2 (ja) 画像処理装置
US5995658A (en) Image processing device and image output device converting binary image into multi-valued image
JP3118469B2 (ja) 像域分離装置
JP3423665B2 (ja) 領域判別方法および装置
US6411735B1 (en) Method and apparatus for distinguishing between noisy continuous tone document types and other document types to maintain reliable image segmentation
JP2000353247A (ja) 白黒画像情報の領域判別方法および装置
JPH0775395B2 (ja) 画像処理装置
JP7413751B2 (ja) 画像処理システムおよびプログラム
JP3093235B2 (ja) 画像処理方法および装置
JPH02199588A (ja) 像域識別装置
JPH0457274B2 (ja)
JP3183788B2 (ja) 網点領域判定装置
JP2900343B2 (ja) 画像処理装置
JP3210378B2 (ja) 画像入力装置
JPH0766976A (ja) 画像処理装置

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20050519

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20050531

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20051004