JP2000353247A

JP2000353247A - 白黒画像情報の領域判別方法および装置

Info

Publication number: JP2000353247A
Application number: JP11166525A
Authority: JP
Inventors: Mitsuaki Ishidoya; 光昭石戸谷; Tadakazu Yokoyama; 忠和横山
Original assignee: Riso Kagaku Corp
Current assignee: Riso Kagaku Corp
Priority date: 1999-06-14
Filing date: 1999-06-14
Publication date: 2000-12-19
Also published as: EP1061731A2; EP1061731A3

Abstract

(57)【要約】【課題】白黒原稿画像中の文字領域と写真領域とを峻
別する領域判別方法および装置において、文字内部と写
真領域とを正確に判別できるようにする。【解決手段】原稿画像中の情報存在領域の中から文字
内部領域と写真領域からなる平坦部領域を抽出する平坦
部判定手段３２と、平坦部判定手段３２により抽出され
た平坦部領域と、文字エッジ部が抽出された残りのエリ
アを合わせた総合平坦部領域内の画素が、文字内部領域
画素であるのか写真領域画素であるのかを判別する文字
内部判定手段３５を設ける。文字内部判定手段３５は、
総合平坦部領域内に設定された注目画素の画素値と周辺
画素の画素値との差が所定の値よりも小さく、且つ周辺
画素の少なくとも１つが文字エッジ画素若しくは文字内
部画素であり、且つ注目画素の画素値が所定の値よりも
大きいときには、注目画素を文字内部画素とし、それ以
外は写真領域画素とする。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は、主走査方向と副走
査方向に多数の画素で表現された白黒画像情報の各画素
を、文字や線図等から構成される文字領域の画素と写真
領域の画素に峻別する領域判別方法および装置に関する
ものである。

【０００２】

【従来の技術】近年ではスキャナの低価格化およびディ
ジタルカメラ等の出現により、多種にわたる画像取込装
置を用いて手軽に画像データを作成することができるよ
うになっている。また、事務処理機器の発展および幅広
い普及に伴い、従来までの、単純に白黒（２値）のみで
表される文字、表、線画等のみによって構成されていた
ワープロ文書等の原稿に簡単に写真画像をはめ込むこと
が可能となっている。更に、グラビア等においては網点
原稿を印刷原稿として用いることが多い。

【０００３】このように、近年では、単純に白黒のみで
表されていた原稿に取って代わり、多種多様の情報を１
原稿で伝えようとすることから、主に２値で表される白
黒の文字、表、線画等と、中間調を表すことができる銀
塩写真や網点画像（写真部分のみに限らない）とが、複
雑に混在した原稿が多くなり、印刷に用いる原稿の構成
は、ますます複雑化の傾向を辿っている。

【０００４】一方、プリンタや孔版印刷装置等において
印刷画像を形成する場合、文字、写真、網点等が混在し
た原稿をスキャナを用いて読み取って、主走査方向と副
走査方向に画素単位で標本化された多階調画像信号を
得、この多階調画像信号を２値化し、２値化された画像
データに基づいて２値出力することにより白黒の印刷物
を得る必要がある。

【０００５】ここで、多階調画像信号を２値化する場
合、従来より、文字または線図等で構成される原稿に対
しては、単一閾値を基準に２値化する単純２値化法が一
般に用いられ、中間調を持つ写真で構成される原稿に対
しては、擬似中間調表現法等の２値化法が用いられてい
る。この擬似中間調表現法の代表的なものとしてはディ
ザ法、誤差拡散法等が知られている。

【０００６】上記単一閾値を基準に２値化する単純２値
化法は、多階調画像信号を主、副走査方向にそれぞれ走
査し、予め設定した閾値を基準に、多階調画像信号で構
成される各々の画素を２値化する方法である。ディザ法
は、閾値をあるパターンで変動させてディザマトリクス
を作成し、このディザマトリクスの多階調画像信号を
主、副走査方向に走査し、画素濃度を各々の閾値を基準
に２値化することにより、記録紙上に擬似階調表現を施
す方法である。誤差拡散法は、多階調画像信号を主、副
走査方向に走査し、注目画素周辺の画素に発生する２値
化誤差を予め設定した割合で注目画素に伝搬させ、再配
置された注目画素の画像信号を２値化することにより、
記録紙上に擬似階調表現を施す方法である。

【０００７】上記単純２値化法は、濃度勾配の変化が急
激な部分で黒画素を寄せ集める効果があるため、文字や
線画等のコントラストが強調されるべき画像に対しては
有効な手法であるが、写真等の濃度勾配の変化が滑らか
な、コントラストの弱い画像に対しては滑らかな濃度勾
配の変化を持つ画像情報を損わせしめるので、写真等の
画像信号の２値化には適さない。

【０００８】これに対して、ディザ法や誤差拡散法によ
る擬似中間調処理を用いた２値化法は、濃度勾配の変化
の少ない領域に擬似的に滑らかな表現を施すものであ
り、写真等のコントラストの弱い画像に対して有効な手
法であるが、文字や線画等の濃度勾配の変化が急激な部
分で黒画素を集中させることを必要とするコントラスト
の強い画像では文字部分等で本来黒画素であるべき部位
に中抜けの白画素を生じさせ、文字のシャープネスを低
下し、細字の形崩れを生ずるので、文字等の画像信号の
２値化には適さない。

【０００９】したがって、上述のように、文字、写真、
網点等が混在した原稿の印刷物を得ようとすれば、読み
取って得た画像信号の２値化処理においては、文書、
表、線画等で構成された主に２値で表される領域（以下
文字領域という）については、単純２値化法により２値
化を行い、銀塩写真領域や網点画像領域等の中間調を表
すことができる領域（以下纏めて中間調領域という）に
ついては、ディザ法や誤差拡散法により２値化を行うこ
とが好ましく、上述のように、各種混在した原稿を綺麗
に印刷するためには、原稿１枚分に相当する１フレーム
分の読取画像信号について、文字領域と中間調領域とを
正確に判別し、各領域毎に最適な２値化処理を行う処理
技術が必要になってくる。また、銀塩写真と網点原稿の
写真では、網点原稿の写真に網点処理等の２値化を施す
とモアレが発生しやすい等の問題があるので、銀塩写真
と網点原稿の写真の両者について、単純に同じ２値化処
理を行うことは好ましくなく、このような点からも、読
み取った原稿情報から文字、写真、網点の各領域を正確
に判別し、原稿画像の領域種別に応じた最適な２値化処
理を行うことが必要となる。

【００１０】なお、孔版印刷装置においては、ドットゲ
インが大きいため、画像のつぶれが生じやすく、同じ２
値化処理を施したとすると、通常のプリンタよりも全体
的に暗い画像となって印刷出力されるために、例えば中
間調領域について単純に誤差拡散法等により２値化する
と綺麗な画像再現ができないので、原稿の領域判別だけ
でなく出力装置種別にも応じた２値化処理が必要であ
る。

【００１１】原稿の領域判別を具現化する方法として
は、従来より、注目画素を囲む参照領域（ブロックサイ
ズ）毎に、周囲との急激な濃度差情報を用いた文字判定
（文字はエッジ情報のみの判定）および周期的に出現す
る網点パターン情報を用いた網点判定等の画像処理を行
うことによって領域判別を行う方法が用いられている
（例えば特開平７−３２２０６１号）。この方法は、３
×３等の小さな参照領域を、単純に１画素毎に走査して
領域判別を行う古典的な方法よりも、文字領域（特に文
字エッジ部）と写真領域との判別を正確に行うことがで
きる。

【００１２】

【発明が解決しようとする課題】しかしながら、上述し
た従来の参照領域毎に走査して領域判別を行う方法は、
９×９等の比較的大きな参照領域とするほど判別の正確
さを増すことができるものである。そのため、より正確
に領域判別を行おうとすれば、膨大なメモリを要し回路
規模が大きくなってコストが高くなり、また、データ処
理のアルゴリズムが複雑となり判別処理に時間を要する
という問題がある。

【００１３】また、上述した従来の参照領域毎に走査し
て領域判別を行う方法は、エッジ情報のみを用いて文字
判定を行うもので、文字幅の小さな場合には比較的判別
が容易であるが、幅の広い文字（エッジとエッジの距離
が長い）の場合には、文字内部を写真部分と誤判別する
場合がある。

【００１４】更に、孔版印刷装置のようにドットゲイン
が大きい場合は、参照領域が大きくなると参照領域同士
の境目に濃度むらが発生するという問題もある。

【００１５】本発明は、上記事情に鑑みてなされたもの
であり、文字内部と写真領域とを正確に判別することが
できると共に、比較的小さな参照領域を用いることも可
能ならしめる領域判別方法および装置を提供することを
目的とするものである。

【００１６】

【課題を解決するための手段】本発明による白黒画像情
報の領域判別方法は、例えば参照領域毎に走査する領域
判別方法を用いて文字内部領域画素または写真領域画素
のいずれかであると判断された画素について、１画素毎
に走査して文字内部らしさを分析することにより、文字
内部領域の画素と写真領域の画素とを判別することを特
徴とするものである。

【００１７】即ち、本発明による白黒画像情報の領域判
別方法は、多数の画素で表現された白黒画像情報の各画
素を、少なくとも文字内部領域画素と写真領域画素とに
峻別する白黒画像情報の領域判別方法であって、各画素
を、文字内部領域画素または写真領域画素とそれ以外の
画素とに判別し、文字内部領域画素または写真領域画素
のいずれかであると判断された画素について、各画素毎
に、該画素を注目画素とし、該注目画素および該注目画
素を囲む複数の周辺画素の各画素値に基づいて、該注目
画素の文字内部らしさ、換言すれば注目画素が文字内部
の画素であるのか写真部分の画素であるのかを分析し、
注目画素を、文字内部らしいと分析されたときには文字
内部領域画素とし、それ以外は写真領域画素とすること
を特徴とするものである。

【００１８】ここで、各画素を、文字内部領域画素また
は写真領域画素とそれ以外の画素とに判別するに際して
は、上記特開平７−３２２０６１号等に記載のように、
所定の大きさの参照領域毎に走査することによって領域
判別を行う方法を用いるのが好ましい。

【００１９】「文字内部領域画素または写真領域画素の
いずれかであると判断された画素について、各画素毎
に」とは、文字内部領域画素または写真領域画素と判断
された画素の全てについて、１画素毎に走査してという
意味である。

【００２０】文字内部らしさの分析に際しては、注目画
素の画素値と周辺画素の各画素値との差が所定の値より
も小さく、且つ周辺画素の少なくとも１つが文字エッジ
画素若しくは文字内部領域画素であり、且つ注目画素の
画素値が所定の値よりも大きいときに、文字内部らしい
とするのが好ましい。

【００２１】注目画素の画素値と周辺画素の各画素値と
の差としては、例えば注目画素と各周辺画素の画素値と
の夫々の差の最大値を用いてもよいし、或いは夫々の差
の平均値を用いてもよい。

【００２２】本発明による領域判別装置は、上記領域判
別方法を実現する装置、即ち、多数の画素で表現された
白黒画像情報の各画素を、少なくとも文字内部領域画素
と写真領域画素とに峻別する領域判別手段を備えた領域
判別装置であって、領域判別手段を、各画素を、文字内
部領域画素または写真領域画素とそれ以外の画素とに判
別し、文字内部領域画素または写真領域画素のいずれか
であると判断された画素について、各画素毎に、該画素
を注目画素とし、該注目画素の画素値および該注目画素
を囲む複数の周辺画素の各画素値に基づいて、該注目画
素の文字内部らしさを分析すると共に、注目画素を、文
字内部らしいと分析したときには文字内部領域画素と
し、それ以外は写真領域画素とする文字内部分析手段を
有するものとしたことを特徴とするものである。

【００２３】本発明による領域判別装置の文字内部分析
手段は、注目画素の画素値と周辺画素の各画素値との差
が所定の値よりも小さく、且つ周辺画素の少なくとも１
つが文字エッジ画素若しくは文字内部領域画素であり、
且つ注目画素の画素値が所定の値よりも大きいときに、
文字内部らしいとするものであることが好ましい。

【００２４】

【発明の効果】本発明による白黒画像情報の領域判別方
法および装置によれば、文字内部領域画素または写真領
域画素のいずれかであると判断された画素について、１
画素毎に走査して、注目画素と周辺画素の各画素値に基
づいて、注目画素の文字内部らしさを分析する、換言す
れば注目画素が文字内部の画素であるのか写真部分の画
素であるのかを判別するようにしたので、幅の広い文字
の文字内部を写真部分と誤判別する虞が少なくなる。

【００２５】また、文字内部であるのか写真部分である
のかを判別するようにした付加的な効果として、文字内
部領域画素または写真領域画素とそれ以外の画素とに判
別するに際して、参照領域毎に走査して領域判別を行う
従来の方法を用いた場合、参照領域のサイズを、本発明
を適用していない従来の方法より小さくしても、最終的
な領域判別の結果を精度のよいものとすることができ
る。これにより、回路規模を小さくしたり、処理アルゴ
リズムを簡易なものとすることができるようになる。

【００２６】

【発明の実施の形態】以下、図面を参照して本発明の実
施の形態について詳細に説明する。図１は本発明の実施
の形態による領域判別装置の構成を示すブロック図であ
る。

【００２７】図１に示すように、この領域判別装置１
は、スキャナ等を用いた画像入力部１０と、注目画素設
定手段２１およびエリア設定手段２２からなる前処理部
２０と、下地領域・情報存在領域判定手段３１、平坦部
判定手段３２、網点判定手段３３、文字エッジ判定手段
３４および文字内部判定手段３５からなる領域判別部３
０と、下地・文字領域２値化手段４１、網点領域２値化
手段４２および写真領域２値化手段４３からなる２値化
部４０と、出力部５０とから構成されている。

【００２８】注目画素設定手段２１は、画像入力部１０
から入力された、主走査方向と副走査方向とに画素単位
で標本化された多階調の画素で形成された画像信号Ｓを
使用して、主、副の両走査方向における注目画素ｆ１
（ｍ１，ｎ１），ｆ２（ｍ２，ｎ２）を設定するもので
ある。なお、ｍ１，ｍ２は主走査方向、ｎ１，ｎ２は副
走査方向の画素番号である。

【００２９】エリア設定手段２２は、画像信号Ｓと注目
画素ｆ１（ｍ１，ｎ１）とから、各注目画素ｆ１（ｍ
１，ｎ１）毎に、主、副の両走査方向に夫々連続する複
数の画素からなる、注目画素ｆ１（ｍ１，ｎ１）を中心
とする（２×ｉ１＋１）×（２×ｊ１＋１）マトリック
スのエリアＦ１（ｍ１，ｎ１）或いは注目画素ｆ２（ｍ
２，ｎ２）を中心とする（２×ｉ２＋１）×（２×ｊ２
＋１）マトリックスのエリアＦ２（ｍ２，ｎ２）を設定
するものである。なお、（２×ｉ１＋１），（２×ｉ２
＋１）は主走査方向、（２×ｊ１＋１），（２×ｊ２＋
１）は副走査方向の画素数である。

【００３０】下地領域・情報存在領域判定手段３１は、
下地領域即ち余白領域および背景領域と、情報存在領域
即ち文書、表、線画等で構成された文字領域および写真
領域や網点画像領域からなる中間調領域とを判別するも
のである。具体的には、下地領域・情報存在領域判定手
段３１は、注目画素設定手段２１によって設定された注
目画素ｆ１（ｍ１，ｎ１）を中心とする、エリア設定手
段２２によって設定された（２×ｉ１＋１）×（２×ｊ
１＋１）マトリックスのエリアＦ１（ｍ１，ｎ１）内の
各画素の画素値（濃度値）の配置パターン或いは所定の
式にしたがって求めた特徴量を検出して、検出した配置
パターンまたは特徴量と予め想定された配置パターン等
とを比較することによって、エリアＦ１（ｍ１，ｎ１）
が原稿の下地領域であるか否か、換言すれば下地領域で
あるか情報存在領域であるかを判別するものである。

【００３１】平坦部判定手段３２は、下地領域・情報存
在領域判定手段３１によって判別された情報存在領域の
中から文字内部領域と写真領域（両者を纏めて平坦部領
域という）とを抽出するものであり、注目画素ｆ１（ｍ
１，ｎ１）を中心とするエリアＦ１（ｍ１，ｎ１）内の
全画素の画素値の内の、最大画素値Ｌｍａｘと最小画素
値Ｌｍｉｎを求め、最大画素値Ｌｍａｘと最小画素値Ｌ
ｍｉｎとの差が所定の値Ｐよりも小さいときには、その
エリアＦ１（ｍ１，ｎ１）を平坦部領域とするものであ
る。

【００３２】網点判定手段３３は、下地領域・情報存在
領域判定手段３１によって判別された情報存在領域の中
から網点領域を抽出するものであり、注目画素ｆ１（ｍ
１，ｎ１）を中心とするエリアＦ１（ｍ１，ｎ１）内の
全画素の画素値の配置パターンを検出し、検出した配置
パターンが網点パターンに相当する場合には、そのエリ
アＦ１（ｍ１，ｎ１）を網点領域とするものである。

【００３３】文字エッジ判定手段３４は、下地領域・情
報存在領域判定手段３１によって判別された情報存在領
域の中から文字エッジ部を抽出するものであり、注目画
素ｆ１（ｍ１，ｎ１）を中心とするエリアＦ１（ｍ１，
ｎ１）内の各画素の画素値の内の、最大画素値Ｌｍａｘ
と最小画素値Ｌｍｉｎを求め、最大画素値Ｌｍａｘと最
小画素値Ｌｍｉｎとの差が所定の値Ｎより大きく、且
つ、注目画素ｆ１（ｍ１，ｎ１）の画素値が所定の値Ｔ
Ｈ１よりも大きい場合（黒文字）若しくは注目画素ｆ１
（ｍ１，ｎ１）の画素値が所定の値ＴＨ１よりも小さい
場合（中抜き文字）には、そのエリアＦ１（ｍ１，ｎ
１）を文字エッジ部とするものである。

【００３４】文字内部判定手段３５は、文字内部領域ま
たは写真領域のいずれかであると判断された領域（後述
する総合平坦部領域）の画素が、文字内部領域の画素で
あるのか写真領域の画素であるのかを判別するものであ
り、総合平坦部領域内に設定された注目画素ｆ２（ｍ
２，ｎ２）を中心とする（２×ｉ２＋１）×（２×ｊ２
＋１）マトリックスのエリアＦ２（ｍ２，ｎ２）内の各
画素の画素値に基づいて、注目画素ｆ２（ｍ２，ｎ２）
の文字内部らしさを分析し、注目画素ｆ２（ｍ２，ｎ
２）が文字内部らしいと分析されたときには、注目画素
ｆ２（ｍ２，ｎ２）を文字内部画素とし、それ以外は写
真領域画素とするものである。文字内部らしさの分析
は、注目画素ｆ２（ｍ２，ｎ２）の画素値とエリアＦ２
（ｍ２，ｎ２）内の注目画素ｆ２（ｍ２，ｎ２）を除く
画素即ち周辺画素の各画素値との差、例えば差の最大値
や差の平均値が、所定の値よりも小さく、且つ周辺画素
の少なくとも１つが文字エッジ部の画素（以下文字エッ
ジ画素という）若しくは文字内部領域の画素（文字内部
画素）であり、且つ注目画素ｆ２（ｍ２，ｎ２）の画素
値が所定の値よりも大きいときに、文字内部らしいとす
る。なお、その他の判断基準を用いて文字内部らしさを
判別するようにしてもよい。

【００３５】平坦部判定手段３２および文字内部判定手
段３５により、本発明による文字内部分析手段が構成さ
れる。

【００３６】下地・文字領域２値化手段４１は、下地領
域および文字領域の多階調画像信号を単純２値化法等に
より２値化するものである。

【００３７】網点領域２値化手段４２は、ＬＰＦ（ロー
パスフイルタ）等を用いてスムージング処理を行って、
一旦網点情報をボカすスムージング処理手段４２ａと、
スムージング処理された画像信号に対してメディアンフ
ィルタ等を用いてエッジ強調を行うエッジ強調手段４２
ｂを有するもので、網点領域の多階調画像信号をディザ
法（網点処理法）を用いて２値化するものである。これ
により、単純にディザ法による疑似階調表現法により２
値化する場合に較べて、モアレの発生が抑制され、綺麗
な印刷が得られるようになる。

【００３８】写真領域２値化手段４３は、写真領域の多
階調画像信号をディザ法や誤差拡散法等による疑似階調
表現法により２値化するものである。

【００３９】出力部５０は、具体的にはセレクタから構
成されており、領域判別部３０から出力される各画素毎
の領域判別信号に基づいて、下地・文字領域２値化手段
４１と、網点領域２値化手段４２と、写真領域２値化手
段４３とが各々出力する２値化信号の何れかを選択して
出力するものである。これにより出力部５０より出力２
値画像信号を得ることができ、該出力２値画像信号を不
図示の印刷部に入力して印刷を行うことにより、画像入
力部１０で読み取られた原稿画像に基づいて、最適な印
刷原稿を出力することができる。

【００４０】なお、図１に示した接続態様から明らかな
ように、当該領域判別装置１の下地・文字領域２値化手
段４１、網点領域２値化手段４２および写真領域２値化
手段４３は、何れも、対応する夫々の領域のみの画像信
号に対して２値化処理を行うものとして構成されておら
ず、画像入力部１０によって取得された画像信号を直ち
に２値化するものとして構成され、領域判別部３０から
の領域判別信号に応じて出力部５０が選択出力した結果
である出力２値画像信号を得ることによって、結果的に
各領域の多階調画像信号を夫々２値化するものとして構
成されている。

【００４１】なお、各２値化手段４１，４２，４３は、
このような構成に限らず、画像入力部１０によって取得
された画像信号の内、例えば下地領域および文字領域の
多階調画像信号を２値化手段４１にのみ入力する等、領
域判別部３０からの領域判別信号に応じて、対応する２
値化手段４１，４２，４３にのみ入力し、対応する領域
の画像信号のみを２値化する構成としてもよい。

【００４２】次に図２〜図７を参照して、本発明による
領域判別方法のアルゴリズムを詳細に説明する。

【００４３】まず最初に、画像入力部１０において読み
取られる混在原稿の各領域の特徴について説明する。

【００４４】図２は、網点領域の画像の特徴を説明する
ための図であって、比較的濃度の薄い下地に表された比
較的濃度の濃い（例えばグレー原稿）、１４５線、角度
４５度の網点画像の拡大図を示している。図中黒で示し
た各網点の大きさは径が約４０μｍであり、主走査およ
び副走査方向のピッチが１６０μｍで、斜め方向に角度
４５度で網点が配されている。図２に示したように、網
点領域の画像は、周期的に網点が出現するという特長が
あることが判る。

【００４５】上述した網点判定手段３３は、このような
網点領域の画像の特徴に基づいて、注目画素ｆ１（ｍ
１，ｎ１）を中心とする判定対象のエリアＦ１（ｍ１，
ｎ１）が網点領域であるのか否かを判定する。

【００４６】図３は、文字エッジ部の特徴を説明するた
めの図であって、図３（Ａ）は比較的濃度の薄い下地に
記載された比較的濃度の濃い文字“あ”を示し、図３
（Ｂ）はその一部の拡大図を示している。なお、図３
（Ｂ）に示した拡大図においては、文字エッジ部を明瞭
に示すために、文字エッジ部のみを実線で示し、後述す
る文字内部に対応する部分を白抜きで示している。

【００４７】図３（Ｂ）の拡大図に示したように、文字
エッジ部は、概ね下地部との濃度差が著しいという特長
があることが判る。なお、比較的濃度の濃い下地に記載
された比較的濃度の薄い、いわゆる白抜き文字の場合に
も、前述と同様に、文字エッジ部は、下地部との濃度差
が著しいということに相違はない。

【００４８】上述した文字エッジ判定手段３４は、この
ような文字エッジ部の特徴に基づいて、注目画素ｆ１
（ｍ１，ｎ１）を中心とする判定対象のエリアＦ１（ｍ
１，ｎ１）が文字エッジ部であるのか否かを判定する。

【００４９】図４は、文字内部の特徴を説明するための
図であって、図４（Ａ）は比較的濃度の薄い下地に記載
された比較的濃度の濃い文字“え”を示し、図４（Ｂ）
はその一部の拡大図を示している。図４（Ｂ）の拡大図
に示したように、文字エッジ部で囲まれた部分即ち文字
内部は、文字エッジ部と略同一の濃度で且つ均一な濃度
分布（濃度差±数％）を呈するという特長があることが
判る。

【００５０】上述した文字内部判定手段３５は、このよ
うな文字内部の特徴に基づいて、平坦部領域内に設定さ
れた注目画素ｆ２（ｍ２，ｎ２）が文字内部の画素であ
るのか否かを判定する、換言すれば文字内部の画素であ
るのか写真領域の画素であるのかを判別する。なお、文
字エッジ部と文字内部とを合わせることにより、文字領
域が構成されるのは言うまでもない。

【００５１】次に、図５に示したフローチャートと、図
６および図７に示したマトリクスを参照して、本発明に
よる白黒画像情報の領域判別方法における判別手順につ
いて説明する。なお、図５においては、処理のステップ
番号をＳＴを付して示す。また、図６および図７は、全
画像データのマトリクスの一部分を示したものである。

【００５２】図５のフローチャートに示した判別処理
は、１）下地領域・情報存在領域判定処理、２）平坦部
判定処理、３）網点・非網点判定処理、４）文字エッジ
部判定処理、５）文字内部判定処理（文字／写真判定処
理）の、５つの処理に大別することができる。

【００５３】先ず、画像入力部１０の不図示のスキャナ
によって、該スキャナにおける解像度に基づいて標本化
および量子化がなされ、多値レベルの画素値（濃度値）
をもつデジタル画像信号が、各画素毎に、図６に示すよ
うに、主走査方向および副走査方向にマトリックス上に
配列されるものとする。なお、スキャナの解像度は、サ
ンプリング定理にしたがって、少なくとも網点の出現周
期の２倍以上とする。

【００５４】マトリックス上に配列された各画素を主、
副走査方向に走査し、注目画素設定手段３１により注目
画素ｆ１（ｍ１，ｎ１）を設定する。設定された注目画
素ｆ１（ｍ１，ｎ１）を中心として、主走査方向の画素
数（２×ｉ１＋１）、副走査方向の画素数（２×ｊ１＋
１）から成る（２×ｉ１＋１）×（２×ｊ１＋１）（但
し、ｉ１≧１，ｊ１≧１の整数）の複数画素で構成され
る注目エリアＦ１（ｍ１，ｎ１）をエリア設定手段３２
により設定する。注目画素ｆ１（ｍ１，ｎ１）は、主走
査（２×ｉ１＋１）画素毎に、また副走査（２×ｊ１＋
１）画素毎に走査される。また注目エリアＦ１（ｍ１，
ｎ１）は、主、副走査方向に１エリア毎に走査される。
ここで、（２×ｉ１＋１）×（２×ｊ１＋１）として
は、具体的には５×５とする。

【００５５】下地領域・情報存在領域判定手段３１によ
る下地領域・情報存在領域判定処理（ＳＴ１１）におい
ては、注目エリアＦ１（ｍ１，ｎ１）が下地領域である
か、否であるか、即ち文字領域、写真領域および網点画
像領域からなる情報存在領域であるかを判別するため
に、先ず注目エリアＦ１（ｍ１，ｎ１）内の各画素の画
素値（濃度値）の配置パターン或いは特徴量を検出す
る。例えば特徴量を求める場合には、所定の式に基づい
て、注目エリアＦ１（ｍ１，ｎ１）中の各画素（画素番
号＝ｍ１−ｉ１，ｎ１−ｊ１、ｍ１−ｉ１＋１，ｎ１−
ｊ１、・・・、ｍ１＋ｉ１−１，ｎ１＋ｊ１、ｍ１＋ｉ
１，ｎ１＋ｊ１）の画素値を予め設定されたしきい値ｄ
と夫々比較し、条件を満たす画素の個数をカウントし、
そのカウント数をしきい値Ｐ1と比較し、特徴値を検出
する等して行う（例えば特開平７−３２２０６１号参
照）。次に、検出した配置パターンや特徴量と予め想定
された配置パターンや特徴量とを比較することによっ
て、エリアＦ１（ｍ１，ｎ１）が原稿の下地領域である
か否か、換言すれば下地領域であるか情報存在領域であ
るかを判別する。

【００５６】以上の処理を、入力された全画像データ中
の各エリア分全てについて行い、各エリアが下地領域で
あるかそれ以外の情報存在領域（文字領域＋写真領域＋
網点画像領域）であるかの判別結果を不図示の記憶装置
に一時記憶する。

【００５７】次に、平坦部判定手段３２による平坦部判
定処理（ＳＴ１２）においては、下地領域・情報存在領
域判定手段３１によって判別された情報存在領域の中か
ら文字内部領域と写真領域からなる平坦部領域を抽出す
る。具体的には、情報存在領域と判断されたエリアにつ
いて、注目画素ｆ１（ｍ１，ｎ１）を中心とする（２×
ｉ１＋１）×（２×ｊ１＋１）、即ち５×５マトリック
スの注目エリアＦ１（ｍ１，ｎ１）内の２５個の全画素
の画素値Ｌ１〜Ｌ２５（Ｌｎのｎは画素番号）をチェッ
クし、画素値の内の最大画素値Ｌｍａｘと最小画素値Ｌ
ｍｉｎを求める。求めた最大画素値Ｌｍａｘと最小画素
値Ｌｍｉｎとの差（＝Ｌｍａｘ−Ｌｍｉｎ）が所定の値
Ｐよりも小さいときには、そのエリアＦ１（ｍ１，ｎ
１）を平坦部領域とする。例えば、画像値が０〜２５５
の２５６階調の濃度で表されるものであるとした場合、
差が１０程度以下である場合には、その注目エリアＦ１
（ｍ１，ｎ１）を平坦部とみなす。

【００５８】次に、網点判定手段３３による網点／非網
点判定処理（ＳＴ１３）においては、下地領域・情報存
在領域判定手段３１によって判別された情報存在領域の
中から網点領域を抽出する。具体的には、先ず、図７
（Ａ）に示すように、情報存在領域と判断された全エリ
アの内、ステップ１２によって平坦部領域が抽出された
残りのエリアについて、該エリア内の注目エリアＦ１
（ｍ１，ｎ１）の前述した５×５の２５個の画素値Ｌ１
〜Ｌ２５の平均値Ａｖｅを算出する。次に、図７（Ｂ）
に示すように、算出した平均値Ａｖｅを基準として、値
（濃度）が高いか低いかによって、各画素値に対して仮
の２値化処理を施し、多階調データを０／１の２値化デ
ータに変換する。次に、２値化した０／１で構成された
２５個のデータの、画素の並び方向（主走査方向および
副走査方向）における出現パターンが、予め想定された
網点パターンに対応するものか否かを判断する。例え
ば、２値化した０／１で構成された２５個のデータに基
づいて、主走査方向における０／１の変化回数Ｈおよび
副走査方向における０／１の変化回数Ｖを各々算出し、
この算出した主走査方向の変化回数Ｈが所定の回数Ｔ１
以上で、且つ副走査方向の変化回数Ｖが所定の回数Ｔ２
以上である場合には、その注目エリアＦ１（ｍ１，ｎ
１）を網点部と見なす。ここで、Ｔ１，Ｔ２としては、
例えば共に６回とする。

【００５９】次に文字エッジ判定手段３４による文字エ
ッジ部判定処理（ＳＴ１４）においては、下地領域・情
報存在領域判定手段３１によって判別された情報存在領
域の中から文字エッジ部を抽出する。具体的には、図７
（Ｃ），（Ｄ）に示すように、情報存在領域と判断され
た全エリアの内、ステップ１３によって網点領域が抽出
された残りのエリア、即ち非網点領域について、該エリ
ア内の注目エリアＦ１（ｍ１，ｎ１）の２５個の画素値
をチェックして得た、最大画素値Ｌｍａｘと最小画素値
Ｌｍｉｎとの差（Ｌｍａｘ−Ｌｍｉｎ）が所定の値Ｎよ
り大きく（図７（Ｃ））、且つ、注目画素ｆ１（ｍ１，
ｎ１）の画素値Ｌ１３が所定の値ＴＨ１よりも大きい場
合（図７（Ｄ））黒文字のとき）若しくは注目画素ｆ１
（ｍ１，ｎ１）の画素値が所定の値ＴＨ１よりも小さい
場合（中抜き文字のとき）には、その注目エリアＦ１
（ｍ１，ｎ１）を文字エッジ部と見なし、残りのエリア
を文字内部領域または写真領域のいずれかであると見な
して、ステップ１２において抽出された平坦部領域に加
える。なお、この処理では、濃度変化の大きい点を見つ
けることになる。

【００６０】次に、文字内部判定手段３５による文字内
部判定処理（ＳＴ１５）においては、ステップ１２にお
いて平坦部判定手段３２によって抽出された平坦部領域
と、ステップ１４において文字エッジ部が抽出された残
りのエリアを合わせた総合平坦部領域が、文字内部領域
であるのか写真領域であるのかを判別する。具体的に
は、先ず、注目画素設定手段３１により、総合平坦部領
域とされた全エリアについて、該エリア内に注目画素ｆ
２（ｍ２，ｎ２）を設定する。設定された注目画素ｆ２
（ｍ２，ｎ２）を中心として、主走査方向の画素数（２
×ｉ２＋１）、副走査方向の画素数（２×ｊ２＋１）か
ら成る（２×ｉ２＋１）×（２×ｊ２＋１）（但し、ｉ
２≧１，ｊ２≧１の整数）の複数画素で構成される注目
エリアＦ２（ｍ２，ｎ２）をエリア設定手段３２により
設定する。なお、注目画素ｆ２（ｍ２，ｎ２）は、主走
査方向および副走査方向共に、１画素毎に走査するもの
とし、これにより、注目エリアＦ２（ｍ２，ｎ２）も、
主、副走査方向に夫々１画素毎に走査されるものとす
る。ここで、（２×ｉ２＋１）×（２×ｊ２＋１）とし
ては、具体的には３×３とする。

【００６１】次に、各走査毎に、（２×ｉ２＋１）×
（２×ｊ２＋１）即ち３×３マトリックスのエリアＦ２
（ｍ２，ｎ２）内の９個の各画素の画素値に基づいて、
注目画素ｆ２（ｍ２，ｎ２）の文字内部らしさを分析
し、注目画素ｆ２（ｍ２，ｎ２）が文字内部らしいと分
析されたときには、注目画素ｆ２（ｍ２，ｎ２）を文字
内部画素とし、それ以外は写真領域画素とする。これに
より、文字内部と写真部分とを正確に判別することがで
きるようになり、従来の方法のように、幅の広い文字の
文字内部を写真部分と誤判別するという問題は生じなく
なる。

【００６２】ここで、文字内部らしさの分析は、具体的
には、図７（Ｅ）〜（Ｇ）に示すように、総合平坦部領
域と判断された全エリアについて、該エリア内の注目画
素ｆ２（ｍ２，ｎ２）の画素値Ｋ５と、注目画素ｆ２
（ｍ２，ｎ２）を囲む３×３の注目エリアＦ２（ｍ２，
ｎ２）内の注目画素ｆ２（ｍ２，ｎ２）を除く８個の周
辺画素の画素値Ｋ１，Ｋ２，・・・，Ｋ９との差（Ｇ１
＝Ｋ１−Ｋ５，Ｇ２＝Ｋ２−Ｋ５，・・・，Ｇ９＝Ｋ９
−Ｋ５）を夫々求め、求めた差の最大値或いは差の平均
値、即ち周辺との誤差ＧＯＳＡが所定の値Ｍよりも小さ
く（図７（Ｅ））、且つ注目画素ｆ２（ｍ２，ｎ２）の
画素値Ｋ５が所定の値ＴＨ２よりも大きく（図７
（Ｆ）；黒文字）若しくは小さく（中抜き文字）、且つ
周辺画素の少なくとも１つが文字エッジ画素若しくは文
字内部画素であるとき（図７（Ｇ））には文字内部らし
いとする。

【００６３】上記の手順によって、情報存在領域内の各
画素が、網点部の画素であるのか、文字領域（エッジ＋
内部）の画素であるのかを判定することができ、また何
れにも含まない画素が写真領域の画素と見なすことがで
き、結果として、文字、網点、写真等が混在した原稿に
おける画像情報を、下地領域、文字領域、網点領域およ
び写真領域に判別することができるようになり、特に、
従来の方法では判別が困難であった幅の広い文字の文字
内部と写真領域との峻別も確実に行うことができる。ま
た、文字内部と写真領域との峻別を行うに際して、３×
３という小さなエリアを参照領域として用いて処理を行
っており、エリアが小さい分だけ簡単なアルゴリズムや
回路構成で判定処理を実現することができる。

【００６４】なお、上述した各ステップにおける判別に
際して用いたパラメータＭ，Ｎ，Ｐ，Ｔ１，Ｔ２，ＴＨ
１，ＴＨ２は固定されたものではなく、出力部５０に接
続された不図示の印刷部の種別に応じて、値を変更・設
定してもよい。

【００６５】一方、上述した領域判別処理と平行して、
多値画像データの２値化処理を行う。即ち、下地・文字
領域２値化手段４１により、下地領域および文字領域の
多階調画像信号を単純２値化法等により２値化し、網点
領域２値化手段４２により、網点領域の多階調画像信号
を、ＬＰＦ（ローパスフイルタ）等を用いてスムージン
グ処理を行って、一旦網点情報をボカし、その後にメデ
ィアンフィルタ等を用いてエッジ強調を行って前記ボケ
を緩和した後にディザ法（網点処理法）を用いて２値化
し、写真領域の多階調画像信号をディザ法や誤差拡散法
等による疑似階調表現法により２値化する。なお、各２
値化手段４１，４２，４３における２値化の際のパラメ
ータ値は、出力部５０に接続された不図示の印刷部の種
別に応じて変更する、つまり、上記構成による領域判別
装置１を、例えば孔版印刷装置に適用する場合と、通常
のプリンタに適用する場合とでは、パラメータ値を変更
するようにする。

【００６６】最後に、出力部５０において、領域判別部
３０から入力された各画素毎の領域判別信号に基づい
て、下地・文字領域２値化手段４１と網点領域２値化手
段４２と写真領域２値化手段４３とが、各々出力する２
値化信号の内、領域判別信号が下地若しくは文字領域を
示しているときには下地・文字領域２値化手段４１から
出力された２値化出力信号を選択し、領域判別信号が網
点領域を示しているときには網点領域２値化手段４２か
ら出力された２値化出力信号を選択し、領域判別信号が
写真領域を示しているときには写真領域２値化手段４３
から出力された２値化出力信号を選択して出力する。こ
れにより出力部５０から判別された領域に適応する出力
２値画像信号が得られ、該出力２値画像信号を不図示の
印刷部に入力して印刷を行う。

【００６７】以上説明したように、本発明による白黒画
像情報の領域判別方法および装置によれば、文字内部領
域画素または写真領域画素のいずれかであると判断され
た領域の画素について、１画素毎に走査して、注目画素
と周辺画素の各画素値に基づいて、注目画素が文字内部
の画素であるのか写真部分の画素であるのかを判別する
ようにしたので、幅の広い文字の文字内部と写真部分と
を正確に判別することができるようになる。また、副次
的効果として、参照領域毎に走査して領域判別を行う従
来の方法を用いて、下地領域と情報存在領域とを判別す
る際、参照領域を従来の方法よりも小さくしても、その
領域判別結果の精度を落とすことがなく、結果として、
参照領域が小さい分だけトータルの判定処理も極簡単な
アルゴリズムや回路構成で実現することができるように
なる。

【図面の簡単な説明】

【図１】本発明の実施の形態による領域判別装置の構成
を示すブロック図

【図２】網点領域の画像の特徴を説明するための図

【図３】文字エッジ部の特徴を説明するための図

【図４】文字内部の特徴を説明するための図

【図５】本発明による領域判別方法の処理アルゴリズム
を示すフローチャート

【図６】原稿画像の画像データを主走査方向および副走
査方向にマトリックス状に配列した例を示した図

【図７】処理アルゴリズムにおける演算例を示した図

【符号の説明】

１領域判別装置１０画像入力部２０前処理部２１注目画素設定手段２２エリア設定手段３０領域判別部３１下地領域・情報存在領域判定手段３２平坦部判定手段３３網点判定手段３４文字エッジ判定手段３５文字内部判定手段４０２値化部４１下地・文字領域２値化手段４２網点領域２値化手段４３写真領域２値化手段５０出力部

───────────────────────────────────────────────────── フロントページの続きＦターム(参考） 5C077 LL01 LL03 LL05 MP01 MP02 PP27 TT02 TT06 TT08 5L096 AA03 AA06 BA07 BA12 DA01 EA43 FA44 FA45 FA78 GA07 GA10 GA51

Claims

【特許請求の範囲】

【請求項１】多数の画素で表現された白黒画像情報の
各画素を、少なくとも文字内部領域画素と写真領域画素
とに峻別する前記白黒画像情報の領域判別方法におい
て、前記各画素を、前記文字内部領域画素または前記写真領
域画素とそれ以外の画素とに判別し、前記文字内部領域
画素または写真領域画素のいずれかであると判断された
画素について、各画素毎に、該画素を注目画素とし、該
注目画素および該注目画素を囲む複数の周辺画素の各画
素値に基づいて、該注目画素の文字内部らしさを分析
し、前記注目画素を、文字内部らしいと分析されたとき
には前記文字内部領域画素であると判別し、それ以外は
前記写真領域画素であると判別とすることを特徴とする
領域判別方法。
【請求項２】前記注目画素の画素値と前記周辺画素の
各画素値との差が所定の値よりも小さく、且つ前記周辺
画素の少なくとも１つが文字エッジ画素若しくは文字内
部領域画素であり、且つ前記注目画素の画素値が所定の
値よりも大きいときに、前記文字内部らしいとすること
を特徴とする請求項１記載の領域判別方法。
【請求項３】多数の画素で表現された白黒画像情報の
各画素を、少なくとも文字内部領域画素と写真領域画素
とに峻別する領域判別手段を備えた前記白黒画像情報の
領域判別装置において、前記領域判別手段が、前記各画素を、前記文字内部領域
画素または前記写真領域画素とそれ以外の画素とに判別
し、前記文字内部領域画素または写真領域画素のいずれ
かであると判断された画素について、各画素毎に、該画
素を注目画素とし、該注目画素の画素値および該注目画
素を囲む複数の周辺画素の各画素値に基づいて、該注目
画素の文字内部らしさを分析すると共に、前記注目画素
を、前記文字内部らしいと分析したときには前記文字内
部領域画素とし、それ以外は前記写真領域画素とする文
字内部分析手段を有するものであることを特徴とする領
域判別装置。
【請求項４】前記文字内部分析手段が、前記注目画素
の画素値と前記周辺画素の各画素値との差が所定の値よ
りも小さく、且つ前記周辺画素の少なくとも１つが文字
エッジ画素若しくは文字内部領域画素であり、且つ前記
注目画素の画素値が所定の値よりも大きいときに、前記
文字内部らしいとするものであることを特徴とする請求
項３記載の領域判別装置。