JPH09238253A - 画像処理装置及びその方法 - Google Patents
画像処理装置及びその方法Info
- Publication number
- JPH09238253A JPH09238253A JP8042847A JP4284796A JPH09238253A JP H09238253 A JPH09238253 A JP H09238253A JP 8042847 A JP8042847 A JP 8042847A JP 4284796 A JP4284796 A JP 4284796A JP H09238253 A JPH09238253 A JP H09238253A
- Authority
- JP
- Japan
- Prior art keywords
- value
- character
- histogram
- calculating
- degree
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Landscapes
- Facsimile Image Signal Circuits (AREA)
- Image Analysis (AREA)
Abstract
(57)【要約】
【課題】 文字用の2値化方法では写真画像を良好に再
現できず、写真用の2値化方法では文字領域に関して、
不必要な下地の濃度が保存されるため、OCR処理する
ことができなくなったり、圧縮した際のデータ量も必要
以上に大きくしてしまうという問題点があった。 【解決手段】 入力画像データからヒストグラムを作成
するヒストグラム作成部と、前記ヒストグラムからその
中央値を算出する中央算出部503と、前記ヒストグラ
ムにおいて前記中央値からの広がり度及び文字度を算出
する文字度算出部504と、前記中央値より黒色側の画
素数を算出する画素数算出部505と、前記文字度算出
部504からの広がり度と文字度と前記中央値算出部5
03からの中央値と前記画素数算出部505からの画素
数に応じて画像の属性が文字、写真、下地のいずれであ
るかを判定する。
現できず、写真用の2値化方法では文字領域に関して、
不必要な下地の濃度が保存されるため、OCR処理する
ことができなくなったり、圧縮した際のデータ量も必要
以上に大きくしてしまうという問題点があった。 【解決手段】 入力画像データからヒストグラムを作成
するヒストグラム作成部と、前記ヒストグラムからその
中央値を算出する中央算出部503と、前記ヒストグラ
ムにおいて前記中央値からの広がり度及び文字度を算出
する文字度算出部504と、前記中央値より黒色側の画
素数を算出する画素数算出部505と、前記文字度算出
部504からの広がり度と文字度と前記中央値算出部5
03からの中央値と前記画素数算出部505からの画素
数に応じて画像の属性が文字、写真、下地のいずれであ
るかを判定する。
Description
【0001】
【発明の属する技術分野】本発明は、入力された多値の
画像データを2値画像データに変換する画像処理装置及
びその方法に関するものである。
画像データを2値画像データに変換する画像処理装置及
びその方法に関するものである。
【0002】
【従来の技術】近年、2値画像を用いたアプリケーショ
ンとして電子ファイリングが急速に普及してきている。
電子ファイリングにて蓄積された2値画像データは、デ
ィスプレイに表示したり、プリンターに出力することは
もちろん、文字領域をOCR(光学的文字認識)ソフト
に掛けて、テキスト情報に変換したものをワープロにて
再利用したり、写真領域をそのまま、ドキュメントに張
りつけて再利用したりしている。従って、文字領域に関
しては、OCRの認識率が高くなるように、文字がつぶ
れたり、かすれたりしないような2値化が求められてい
る。
ンとして電子ファイリングが急速に普及してきている。
電子ファイリングにて蓄積された2値画像データは、デ
ィスプレイに表示したり、プリンターに出力することは
もちろん、文字領域をOCR(光学的文字認識)ソフト
に掛けて、テキスト情報に変換したものをワープロにて
再利用したり、写真領域をそのまま、ドキュメントに張
りつけて再利用したりしている。従って、文字領域に関
しては、OCRの認識率が高くなるように、文字がつぶ
れたり、かすれたりしないような2値化が求められてい
る。
【0003】また、写真領域に関しては、黒くつぶれた
り、白く飛んだりすることなく、中間調が保存されるよ
うな2値化がもとめられている。写真領域のような中間
調を多く含む領域に対して、その中間調の再現性のよい
従来の2値化として誤差拡散法が存在する。誤差拡散法
は、入力多値画像データを2値化した際の誤差を以後の
複数画素に拡散することによって、中間調を保存する方
法である。
り、白く飛んだりすることなく、中間調が保存されるよ
うな2値化がもとめられている。写真領域のような中間
調を多く含む領域に対して、その中間調の再現性のよい
従来の2値化として誤差拡散法が存在する。誤差拡散法
は、入力多値画像データを2値化した際の誤差を以後の
複数画素に拡散することによって、中間調を保存する方
法である。
【0004】
【発明が解決しようとする課題】しかしながら、文字用
2値化を文字領域と写真領域の両方を含む画像に適用し
た場合、文字領域に関しては、良好な画質が得られる
が、写真領域に関しては、入力画像の濃度が保存されな
いため、入力画像に忠実な写真画像を得ることができな
いという問題点が存在する。
2値化を文字領域と写真領域の両方を含む画像に適用し
た場合、文字領域に関しては、良好な画質が得られる
が、写真領域に関しては、入力画像の濃度が保存されな
いため、入力画像に忠実な写真画像を得ることができな
いという問題点が存在する。
【0005】一方、上記従来例の誤差拡散法を、文字領
域と写真領域の両方を含む画像に適用した場合、写真領
域に関しては、入力画像の濃度が保存され良好な写真画
像が得られるが、文字領域に関しては、不必要な下地の
濃度が保存されるため、OCR処理することができなく
なってしまうという問題点が存在する。また、不必要な
下地の濃度が保存されてしまうため、圧縮した際のデー
タ量も必要以上に大きくしてしまうという問題点が存在
する。さらに、誤差拡散法は、2値化の際の誤差を以後
の複数画素に拡散するための処理が複雑なためハードで
実現した場合は、その回路規模が大きくなってしまうと
いう問題点が存在する。
域と写真領域の両方を含む画像に適用した場合、写真領
域に関しては、入力画像の濃度が保存され良好な写真画
像が得られるが、文字領域に関しては、不必要な下地の
濃度が保存されるため、OCR処理することができなく
なってしまうという問題点が存在する。また、不必要な
下地の濃度が保存されてしまうため、圧縮した際のデー
タ量も必要以上に大きくしてしまうという問題点が存在
する。さらに、誤差拡散法は、2値化の際の誤差を以後
の複数画素に拡散するための処理が複雑なためハードで
実現した場合は、その回路規模が大きくなってしまうと
いう問題点が存在する。
【0006】本発明は上述した従来技術の欠点を除去す
るものであり、文字領域、写真領域、そして、下地領域
の領域分離を行ない、各々に適した2値化処理すること
により、下地領域は除去し、文字、写真ともに良好な2
値化画像データを得ることができる画像処理装置及びそ
の方法の提供を目的とする。
るものであり、文字領域、写真領域、そして、下地領域
の領域分離を行ない、各々に適した2値化処理すること
により、下地領域は除去し、文字、写真ともに良好な2
値化画像データを得ることができる画像処理装置及びそ
の方法の提供を目的とする。
【0007】又、写真領域用2値化方法として誤差拡散
法のように回路規模を大きくすることなく、簡単な処理
にて濃度が保存され、良好な写真画像を得ることが出来
る画像処理装置及びその方法の提供を目的とする。
法のように回路規模を大きくすることなく、簡単な処理
にて濃度が保存され、良好な写真画像を得ることが出来
る画像処理装置及びその方法の提供を目的とする。
【0008】
【課題を解決するための手段】上述した目的を達成する
ための本発明の画像処理装置は以下の構成を備える。
ための本発明の画像処理装置は以下の構成を備える。
【0009】即ち、入力画像データからヒストグラムを
作成するヒストグラム作成手段と、前記ヒストグラムか
らその中央値を算出する中央値算出手段と、前記ヒスト
グラムにおいて前記中央値からの広がり度を算出する広
がり度算出手段と、前記中央値より黒色側の画素数を算
出する画素数算出手段と、前記広がり度算出手段からの
広がり度と前記中央値算出手段からの中央値と前記画素
数算出手段からの画素数に応じて画像の属性が文字、写
真、下地のいずれであるかを判定する判定手段とを備え
る。
作成するヒストグラム作成手段と、前記ヒストグラムか
らその中央値を算出する中央値算出手段と、前記ヒスト
グラムにおいて前記中央値からの広がり度を算出する広
がり度算出手段と、前記中央値より黒色側の画素数を算
出する画素数算出手段と、前記広がり度算出手段からの
広がり度と前記中央値算出手段からの中央値と前記画素
数算出手段からの画素数に応じて画像の属性が文字、写
真、下地のいずれであるかを判定する判定手段とを備え
る。
【0010】又、複数画素の入力多値画像データを加算
し、合計値を算出する合計値算出手段と、前記合計値を
黒画素の出力画素値で除算し黒画素数を算出する黒画素
数算出手段と、前記入力多値画像データからヒストグラ
ムを作成するヒストグラム作成手段と、前記ヒストグラ
ム作成手段で作成されたヒストグラムの度数を加算する
加算手段と、前記加算手段からの加算値と前記黒画素数
算出手段からの黒画素数を比較する比較手段と、前記比
較手段の比較結果に基づき2値化閾値を決定する決定手
段とを備える。
し、合計値を算出する合計値算出手段と、前記合計値を
黒画素の出力画素値で除算し黒画素数を算出する黒画素
数算出手段と、前記入力多値画像データからヒストグラ
ムを作成するヒストグラム作成手段と、前記ヒストグラ
ム作成手段で作成されたヒストグラムの度数を加算する
加算手段と、前記加算手段からの加算値と前記黒画素数
算出手段からの黒画素数を比較する比較手段と、前記比
較手段の比較結果に基づき2値化閾値を決定する決定手
段とを備える。
【0011】又、上述した目的を達成するため本発明の
画像処理方法は、入力画像データからヒストグラムを作
成するヒストグラム作成工程と、前記ヒストグラムから
その中央値を算出する中央値算出工程と、前記ヒストグ
ラムにおいて前記中央値からの広がり度を算出する広が
り度算出工程と、前記中央値より黒色側の画素数を算出
する画素数算出工程と、前記広がり度算出工程からの広
がり度と前記中央値算出工程からの中央値と前記画素数
算出工程からの画素数に応じて画像の属性が文字、写
真、下地のいずれであるかを判定する判定工程とを有す
る。
画像処理方法は、入力画像データからヒストグラムを作
成するヒストグラム作成工程と、前記ヒストグラムから
その中央値を算出する中央値算出工程と、前記ヒストグ
ラムにおいて前記中央値からの広がり度を算出する広が
り度算出工程と、前記中央値より黒色側の画素数を算出
する画素数算出工程と、前記広がり度算出工程からの広
がり度と前記中央値算出工程からの中央値と前記画素数
算出工程からの画素数に応じて画像の属性が文字、写
真、下地のいずれであるかを判定する判定工程とを有す
る。
【0012】又、本発明の画像処理方法は複数画素の入
力多値画像データを加算し、合計値を算出する合計値算
出工程と、前記合計値を黒画素の出力画素値で除算し黒
画素数を算出する黒画素数算出工程と、前記入力多値画
像データからヒストグラムを作成するヒストグラム作成
工程と、前記ヒストグラム作成工程で作成されたヒスト
グラムの度数を加算する加算工程と、前記加算工程から
の加算値と前記黒画素数算出工程からの黒画素数を比較
する比較工程と、前記比較工程の比較結果に基づき2値
化閾値を決定する決定工程とを有する。
力多値画像データを加算し、合計値を算出する合計値算
出工程と、前記合計値を黒画素の出力画素値で除算し黒
画素数を算出する黒画素数算出工程と、前記入力多値画
像データからヒストグラムを作成するヒストグラム作成
工程と、前記ヒストグラム作成工程で作成されたヒスト
グラムの度数を加算する加算工程と、前記加算工程から
の加算値と前記黒画素数算出工程からの黒画素数を比較
する比較工程と、前記比較工程の比較結果に基づき2値
化閾値を決定する決定工程とを有する。
【0013】
【発明の実施の形態】以下、図面を参照し本発明の実施
の形態を詳細に説明する。
の形態を詳細に説明する。
【0014】図1は、本実施の形態における画像処理シ
ステムの構成を示したブロック図である。同図において
101は、多値の濃度データを得るためのスキャナ装
置、102は、得られた多値画像データを2値化するた
めの2値化装置、そして、103は、2値化されたデー
タを処理するためのコンピュータ装置である。
ステムの構成を示したブロック図である。同図において
101は、多値の濃度データを得るためのスキャナ装
置、102は、得られた多値画像データを2値化するた
めの2値化装置、そして、103は、2値化されたデー
タを処理するためのコンピュータ装置である。
【0015】ユーザーは、手元の印刷物をスキャナ装置
101を介してデジタル化し、2値化装置102により
2値化された画像データをコンピュータ装置103に格
納することができる。コンピュータ103に格納された
2値画像データは、OCR(光学的文字認識)や電子フ
ァイリング等のアプリケーションにより再利用される。
101を介してデジタル化し、2値化装置102により
2値化された画像データをコンピュータ装置103に格
納することができる。コンピュータ103に格納された
2値画像データは、OCR(光学的文字認識)や電子フ
ァイリング等のアプリケーションにより再利用される。
【0016】次に、2値化装置102について説明す
る。104は、2値化装置102をコントロールするC
PUであり、105は、CPU104の動作を規定する
プログラムが書き込まれているROMであり、106
は、CPU104が動作するために必要となるワーク用
メモリである。CPU104は、ROM105の内容に
従い、2値化装置102内の各ブロックに必要な初期値
等を設定する。
る。104は、2値化装置102をコントロールするC
PUであり、105は、CPU104の動作を規定する
プログラムが書き込まれているROMであり、106
は、CPU104が動作するために必要となるワーク用
メモリである。CPU104は、ROM105の内容に
従い、2値化装置102内の各ブロックに必要な初期値
等を設定する。
【0017】107は、スキャナ装置101からの多値
画像データが一時蓄積されるバンドメモリであり、10
8は、バンドメモリ107からの画像データのヒストグ
ラムを(64×64)ブロック単位で生成するヒストグ
ラム生成部である。109は、ヒストグラム生成部10
8からのヒストグラムデータに基づき(64×64)ブ
ロック単位で、文字、写真、下地のいずれかの属性判定
を行う。110は、文字・下地用しきい値算出部で、対
象ブロックに下地が存在する場合は、その下地を除去し
つつ、文字がつぶれたりかすれたりすることない良好な
文字品質を保つことができるしきい値を決定する。11
1は、写真用しきい値決定部であり、ヒストグラム生成
部108からのヒストグラムデータとバンドメモリ部1
07からの多値画像データを用いて、ブロック内の多値
画像データの合計値が保存されるように閾値を決定す
る。112は、MUX部であり、109からの判定結果
に基づき、文字・下地用しきい値算出部110からのt
h−cと写真用しきい値算出部111からのth−pを
選択して、スムージング部113に転送する。113
は、スムージング部であり、MUX部112からのブロ
ック単位のしきい値から2次元の線形補間により画素単
位のしきい値に変換する。114は、2値化部であり、
バンドメモリ107からの多値画像をスムージング部1
13からのしきい値で2値化して、コンピュータ装置1
03へ転送する。
画像データが一時蓄積されるバンドメモリであり、10
8は、バンドメモリ107からの画像データのヒストグ
ラムを(64×64)ブロック単位で生成するヒストグ
ラム生成部である。109は、ヒストグラム生成部10
8からのヒストグラムデータに基づき(64×64)ブ
ロック単位で、文字、写真、下地のいずれかの属性判定
を行う。110は、文字・下地用しきい値算出部で、対
象ブロックに下地が存在する場合は、その下地を除去し
つつ、文字がつぶれたりかすれたりすることない良好な
文字品質を保つことができるしきい値を決定する。11
1は、写真用しきい値決定部であり、ヒストグラム生成
部108からのヒストグラムデータとバンドメモリ部1
07からの多値画像データを用いて、ブロック内の多値
画像データの合計値が保存されるように閾値を決定す
る。112は、MUX部であり、109からの判定結果
に基づき、文字・下地用しきい値算出部110からのt
h−cと写真用しきい値算出部111からのth−pを
選択して、スムージング部113に転送する。113
は、スムージング部であり、MUX部112からのブロ
ック単位のしきい値から2次元の線形補間により画素単
位のしきい値に変換する。114は、2値化部であり、
バンドメモリ107からの多値画像をスムージング部1
13からのしきい値で2値化して、コンピュータ装置1
03へ転送する。
【0018】以下、2値化装置102の動作を詳細に図
2以降を用いて説明する。
2以降を用いて説明する。
【0019】図2は、スキャナ装置101からの(N×
M)サイズの画像データで、点線の矢印に記されるよう
なラスタ順次で画像データが出力される。本2値化装置
102では、108〜112のブロックで行なわれる処
理は、(N×M)の画像データを図2に示されるB11
〜Bnmまでの各(64×64)画素のブロック単位で
処理する。
M)サイズの画像データで、点線の矢印に記されるよう
なラスタ順次で画像データが出力される。本2値化装置
102では、108〜112のブロックで行なわれる処
理は、(N×M)の画像データを図2に示されるB11
〜Bnmまでの各(64×64)画素のブロック単位で
処理する。
【0020】(バンドメモリ部107の説明)図3は、
バンドメモリ部107の構成を示すもので、128×b
サイズのメモリである。高さ128は、処理の最小高さ
64の2倍の高さとなることを示す。また、幅bは対象
とする画像サイズの横幅以上なければならない。また、
バンドメモリ部107では、図2の点線矢印のようなラ
スター順次の画像データは、図3の矢印の点線のように
ブロック単位のラスター順次に変換して、ヒストグラム
生成部108、写真用しきい値算出部111に出力され
る。ただし、2値化部114への出力は、図2と同じラ
スター順次である。
バンドメモリ部107の構成を示すもので、128×b
サイズのメモリである。高さ128は、処理の最小高さ
64の2倍の高さとなることを示す。また、幅bは対象
とする画像サイズの横幅以上なければならない。また、
バンドメモリ部107では、図2の点線矢印のようなラ
スター順次の画像データは、図3の矢印の点線のように
ブロック単位のラスター順次に変換して、ヒストグラム
生成部108、写真用しきい値算出部111に出力され
る。ただし、2値化部114への出力は、図2と同じラ
スター順次である。
【0021】(ヒストグラム生成部108の説明)図4
は、ヒストグラム生成部108により生成されるヒスト
グラムテーブルを表す入力が8ビットの画像データの時
の例である。画像レベルの0は白を、255は黒を表
し、64×64ブロック内の0〜255までの各画像レ
ベルの度数が示されている。
は、ヒストグラム生成部108により生成されるヒスト
グラムテーブルを表す入力が8ビットの画像データの時
の例である。画像レベルの0は白を、255は黒を表
し、64×64ブロック内の0〜255までの各画像レ
ベルの度数が示されている。
【0022】(文字/写真/下地ブロック判定部109
の説明)図5は、文字/写真/下地ブロック判定部10
9の詳細ブロックを示す。501は有効minレベル検
出部、502は有効Maxレベル検出部であり、ヒスト
グラムテーブルからノイズレベルを除去し、有効なMi
n及び、Maxレベルを検出する。図6は、そのノイズ
レベルを除去し、有効なレベルを検出するブロック図で
ある。図6のレベル、度数は、ヒストグラム生成部10
8にて生成されたヒストグラムテーブルのレベル、度数
を示し、図6のブロック図が、有効Minレベル検出部
501に適用された場合は、レベルは、0からスタート
し、有効レベルが検出されるまでレベルはアップする。
また、有効Maxレベル検出部502に適用された場合
は、レベルは、255からスタートし、有効レベルが検
出されるまでレベルは、ダウンする。
の説明)図5は、文字/写真/下地ブロック判定部10
9の詳細ブロックを示す。501は有効minレベル検
出部、502は有効Maxレベル検出部であり、ヒスト
グラムテーブルからノイズレベルを除去し、有効なMi
n及び、Maxレベルを検出する。図6は、そのノイズ
レベルを除去し、有効なレベルを検出するブロック図で
ある。図6のレベル、度数は、ヒストグラム生成部10
8にて生成されたヒストグラムテーブルのレベル、度数
を示し、図6のブロック図が、有効Minレベル検出部
501に適用された場合は、レベルは、0からスタート
し、有効レベルが検出されるまでレベルはアップする。
また、有効Maxレベル検出部502に適用された場合
は、レベルは、255からスタートし、有効レベルが検
出されるまでレベルは、ダウンする。
【0023】図6のブロック図が、有効Minレベル検
出部501に適用された場合の動作を図4のヒストグラ
ムテーブルを例にして説明する。図6において、rst
−bufは、バッファ部606を初期化するための信号
で、この初期化により、バッファ部606の値は、0と
なる。また、REFは、バッファの値との比較をする値
でデフォルトは、5である。図4のように、レベル0の
時の度数は0であるため、601、602、603の出
力は、全て偽であるため、何も動作しない。
出部501に適用された場合の動作を図4のヒストグラ
ムテーブルを例にして説明する。図6において、rst
−bufは、バッファ部606を初期化するための信号
で、この初期化により、バッファ部606の値は、0と
なる。また、REFは、バッファの値との比較をする値
でデフォルトは、5である。図4のように、レベル0の
時の度数は0であるため、601、602、603の出
力は、全て偽であるため、何も動作しない。
【0024】次に、レベル1の時の度数は1であるた
め、比較部601の出力が“真”となり、バッファ60
6が+1加算部604にて、1加算された1が再びバッ
ファ部606に格納されるとともに、比較部607にて
REF、(デフォルト値は5なので、)5と大小関係が
比較され、5より小さいので比較部607の出力は偽と
なり、確定部608で有効レベルの確定は、実行されな
い。次に、レベル2の度数は、0であるため何も動作し
ない。レベル3の度数は、2であるため、比較部602
の出力が“真”となり、バッファ部606の値が、+2
加算部605にて、+2加算された3が再びバッフア部
606に格納されると共に、比較部607にて大小関係
が比較されるが、出力は’偽’となるため、有効レベル
の確定は行なわれない。レベル4の度数は、2であるた
め、比較部602の出力が“真”となり、バッファ部6
06の値が、+2加算部605にて、+2加算された5
が再びバッファ部606に格納されると共に、比較部6
07にて大小関係が比較されるが、出力は’偽’となる
ため、有効レベルの確定は行なわれない。そして、レベ
ル5の度数は1であるため、比較部601の出力が、
“真”となり、+1加算部604にて、+1加算された
6が再びバッファ部606に格納されると共にに、比較
部607にて大小関係が比較され、出力が“真”となる
ため、確定部608にて有効レベルの確定が行なわれ
る。図4のヒストグラムテーブルでは、度数3以上がな
かったが、レベルをアップしていて、度数3以上が存在
した場合には、比較部603の出力が“真”となり、そ
の時のレベルが確定部608にて、有効レベルとして確
定する。また、以上の動作をレベル255からスタート
して、レベル値をダウンしていくことにより、有効Ma
xレベルを検出することができる。
め、比較部601の出力が“真”となり、バッファ60
6が+1加算部604にて、1加算された1が再びバッ
ファ部606に格納されるとともに、比較部607にて
REF、(デフォルト値は5なので、)5と大小関係が
比較され、5より小さいので比較部607の出力は偽と
なり、確定部608で有効レベルの確定は、実行されな
い。次に、レベル2の度数は、0であるため何も動作し
ない。レベル3の度数は、2であるため、比較部602
の出力が“真”となり、バッファ部606の値が、+2
加算部605にて、+2加算された3が再びバッフア部
606に格納されると共に、比較部607にて大小関係
が比較されるが、出力は’偽’となるため、有効レベル
の確定は行なわれない。レベル4の度数は、2であるた
め、比較部602の出力が“真”となり、バッファ部6
06の値が、+2加算部605にて、+2加算された5
が再びバッファ部606に格納されると共に、比較部6
07にて大小関係が比較されるが、出力は’偽’となる
ため、有効レベルの確定は行なわれない。そして、レベ
ル5の度数は1であるため、比較部601の出力が、
“真”となり、+1加算部604にて、+1加算された
6が再びバッファ部606に格納されると共にに、比較
部607にて大小関係が比較され、出力が“真”となる
ため、確定部608にて有効レベルの確定が行なわれ
る。図4のヒストグラムテーブルでは、度数3以上がな
かったが、レベルをアップしていて、度数3以上が存在
した場合には、比較部603の出力が“真”となり、そ
の時のレベルが確定部608にて、有効レベルとして確
定する。また、以上の動作をレベル255からスタート
して、レベル値をダウンしていくことにより、有効Ma
xレベルを検出することができる。
【0025】中央値算出部503では、有効Minレベ
ル検出部501からのminと有効Maxレベル検出部
502からのmaxから、中央値cenを以下の式に基
づき算出する。
ル検出部501からのminと有効Maxレベル検出部
502からのmaxから、中央値cenを以下の式に基
づき算出する。
【0026】cen=(max−min)/2+min
【0027】そして、文字度算出部504では、レベル
の値をi、その時の度数をDiとしたとき、stjとc
hrは、次式で算出する。
の値をi、その時の度数をDiとしたとき、stjとc
hrは、次式で算出する。
【0028】
【外1】 chr=stj*255/(Max−Min) SUMは、画素数の合計数を示し、本実施の形態では、
64×64のブロック単位で処理しているため、SUM
の値は、4096となる。
64×64のブロック単位で処理しているため、SUM
の値は、4096となる。
【0029】stjは、中央値cenからの広がりを示
し、その値が小さい時は中央値付近の集中度が高く、単
一の色と考えることができる。chrは、stjを25
5/(Max−Min)で正規化したものである。ch
rは、ヒストグラムのMinからMaxまでの大きさに
影響されない、ヒストグラムの形を表す値となり、値の
大きさが大きくなればなるほど文字を特徴付けるヒスト
グラムの形となる。即ち、文字度が大きくなる。
し、その値が小さい時は中央値付近の集中度が高く、単
一の色と考えることができる。chrは、stjを25
5/(Max−Min)で正規化したものである。ch
rは、ヒストグラムのMinからMaxまでの大きさに
影響されない、ヒストグラムの形を表す値となり、値の
大きさが大きくなればなるほど文字を特徴付けるヒスト
グラムの形となる。即ち、文字度が大きくなる。
【0030】また、中央値以上の画素数の算出部505
では、中央値cenとヒストグラムテーブルから、中央
値cen以上の度数を加算していき、その合計値をBp
ixとして出力する。
では、中央値cenとヒストグラムテーブルから、中央
値cen以上の度数を加算していき、その合計値をBp
ixとして出力する。
【0031】さて、下地判定部506では、中央値算出
部503からのcenと文字度算出部504からのst
jを用いて、以下の条件で下地なのか非下地なのかを判
定する。
部503からのcenと文字度算出部504からのst
jを用いて、以下の条件で下地なのか非下地なのかを判
定する。
【0032】 下地 :cen< 128かつ stj< 100 非下地:cen>=128またはstj>=100 これは、stjが100のときは、ヒストグラムの形が
中央値に非常に集中しており、その中央値により下地が
写真かに分離することができるためである。
中央値に非常に集中しており、その中央値により下地が
写真かに分離することができるためである。
【0033】507は、文字/写真判定テーブル部であ
り、Bpix、chrの値から図7の判定テーブルにし
たがって、文字/写真を判定する。図7において、CH
R−STG1〜3は、chrの大きさにより3段階に分
けたもので、 CHR−STG1: 0以上6084未満 CHR−STG2:6084以上8100未満 CHR−STG3:8100以上 である。また、BPIX−STG1〜3は、Bpixの
大きさにより3段階に分けたもので、 BPIX−STG1: 0以上2457未満 BPIX−STG2:2457以上3686未満 BPIX−STG3:3686以上 である。これは、64×64のブロックの中の中央値よ
り黒色側に存在する画素の数を表し、ブロック内の中央
値以上の黒画素の密度を示すものである。BPIX−S
TG1からBPIX−STG3になるに従い、黒画素密
度が増してきて、BPIX−STG1は0〜60%であ
り、BPIX−STG2は60〜90%であり、BPI
X−STG3は90%以上である。
り、Bpix、chrの値から図7の判定テーブルにし
たがって、文字/写真を判定する。図7において、CH
R−STG1〜3は、chrの大きさにより3段階に分
けたもので、 CHR−STG1: 0以上6084未満 CHR−STG2:6084以上8100未満 CHR−STG3:8100以上 である。また、BPIX−STG1〜3は、Bpixの
大きさにより3段階に分けたもので、 BPIX−STG1: 0以上2457未満 BPIX−STG2:2457以上3686未満 BPIX−STG3:3686以上 である。これは、64×64のブロックの中の中央値よ
り黒色側に存在する画素の数を表し、ブロック内の中央
値以上の黒画素の密度を示すものである。BPIX−S
TG1からBPIX−STG3になるに従い、黒画素密
度が増してきて、BPIX−STG1は0〜60%であ
り、BPIX−STG2は60〜90%であり、BPI
X−STG3は90%以上である。
【0034】図7よりわかるように、黒画素の密度を示
すBpixと文字らしさを示すchrの組合せにより、
文字と写真を分離することができる。黒画素密度の最も
小さいBPIX−STG1のときは、CHR−STG1
ならば写真であるが、CHR−STG2とCHR−ST
G3ならば文字となる。これは、黒画素の密度が小さい
時は、ブロック内の文字が小細文字か写真であるため、
文字度を示すchrがCHR−STG2以上で文字と判
断することができるためである。
すBpixと文字らしさを示すchrの組合せにより、
文字と写真を分離することができる。黒画素密度の最も
小さいBPIX−STG1のときは、CHR−STG1
ならば写真であるが、CHR−STG2とCHR−ST
G3ならば文字となる。これは、黒画素の密度が小さい
時は、ブロック内の文字が小細文字か写真であるため、
文字度を示すchrがCHR−STG2以上で文字と判
断することができるためである。
【0035】又、黒画素の密度を示すBpixがBPI
X−STG2の時は、CHR−STG1、CHR−ST
G2ならば写真であり、CHR−STG3ならば文字と
なる。これは、黒画素の密度がBPIX−STG2と
は、分離する文字が太文字であり、文字度を示すchr
の値が大きいところに集中するため、CHR−STG3
の場合のみを文字とする。黒画素の密度を示すBpix
がBPIX−STG3の時は、chrの値に関係なく全
て写真とする。これは、黒画素の密度がBPIX−ST
G3ほど大きい場合は、文字であることがほとんど無い
ためである。そして、最終判定部508では、下地判定
部506からの結果stと文字/写真判定部507の結
果cpから以下の条件で最終的に文字/写真/下地を判
定する。
X−STG2の時は、CHR−STG1、CHR−ST
G2ならば写真であり、CHR−STG3ならば文字と
なる。これは、黒画素の密度がBPIX−STG2と
は、分離する文字が太文字であり、文字度を示すchr
の値が大きいところに集中するため、CHR−STG3
の場合のみを文字とする。黒画素の密度を示すBpix
がBPIX−STG3の時は、chrの値に関係なく全
て写真とする。これは、黒画素の密度がBPIX−ST
G3ほど大きい場合は、文字であることがほとんど無い
ためである。そして、最終判定部508では、下地判定
部506からの結果stと文字/写真判定部507の結
果cpから以下の条件で最終的に文字/写真/下地を判
定する。
【0036】 文字:stが非下地かつcpが文字 写真:stが非下地かつcpが写真 下地:stが下地
【0037】以上により、(64×64)ブロック単位
で文字/写真/下地を分離することができる。
で文字/写真/下地を分離することができる。
【0038】(文字・下地用しきい値算出部110の説
明)次に文字・下地用しきい値算出部110で実行され
る閾値の決定方法を説明する。ここではCPU104に
て実行されるフローチャートに基づき説明する。
明)次に文字・下地用しきい値算出部110で実行され
る閾値の決定方法を説明する。ここではCPU104に
て実行されるフローチャートに基づき説明する。
【0039】図20においては、ヒストグラム生成部1
08からのブロック単位のヒストグラムデータを用い
て、ステップS302にてしきい値を決定する。ステッ
プS302では、文字ブロック(つぶれ文字ブロック、
かすれ文字ブロック)の判別をし、入力画像の処理ブロ
ックの単位(64画素×64画素)ごとに2値化のため
の閾値決定処理を行う。ステップS303では、文字フ
ラグMFが「1」かどうかの判断(処理中のブロックが
文字ブロックかどうかの判断。詳細後述)をする。その
結果が、文字ブロックであればステップS305へ、文
字ブロックでなければステップS304へ進む。ステッ
プS304では、閾値THを下限値Lと上限値Hによる
制御を行う。つまり、ステップS302で決定された閾
値THが、下限値Lよりも小さい時は閾値THで代表さ
せ、上限値Hよりも大きいときは閾値THをHで代表さ
せるような制限処理を行う。尚、この下限値Lと上限値
Hは、画像入力装置2の特性により決定される値であ
る。ステップS305では、つぶれ文字フラグTFが
「1」かどうかの判断(処理中のブロックがつぶれ文字
ブロックかどうかの判断。詳細後述)をする。その結果
が、つぶれ文字ブロックであればステップS306へ、
つぶれ文字ブロックでなければENDへ進む。ステップ
S306では、閾値THの制限を行う。つまり、ステッ
プS302またはステップS304で決定された閾値T
Hに文字つぶれ防止用の定数TPをかけるような制限処
理を行う。ここで、定数TPは画像入力装置2の特性に
より決定される値である。このようにして、対象となる
ブロックのしきい値が最終的に決定される。
08からのブロック単位のヒストグラムデータを用い
て、ステップS302にてしきい値を決定する。ステッ
プS302では、文字ブロック(つぶれ文字ブロック、
かすれ文字ブロック)の判別をし、入力画像の処理ブロ
ックの単位(64画素×64画素)ごとに2値化のため
の閾値決定処理を行う。ステップS303では、文字フ
ラグMFが「1」かどうかの判断(処理中のブロックが
文字ブロックかどうかの判断。詳細後述)をする。その
結果が、文字ブロックであればステップS305へ、文
字ブロックでなければステップS304へ進む。ステッ
プS304では、閾値THを下限値Lと上限値Hによる
制御を行う。つまり、ステップS302で決定された閾
値THが、下限値Lよりも小さい時は閾値THで代表さ
せ、上限値Hよりも大きいときは閾値THをHで代表さ
せるような制限処理を行う。尚、この下限値Lと上限値
Hは、画像入力装置2の特性により決定される値であ
る。ステップS305では、つぶれ文字フラグTFが
「1」かどうかの判断(処理中のブロックがつぶれ文字
ブロックかどうかの判断。詳細後述)をする。その結果
が、つぶれ文字ブロックであればステップS306へ、
つぶれ文字ブロックでなければENDへ進む。ステップ
S306では、閾値THの制限を行う。つまり、ステッ
プS302またはステップS304で決定された閾値T
Hに文字つぶれ防止用の定数TPをかけるような制限処
理を行う。ここで、定数TPは画像入力装置2の特性に
より決定される値である。このようにして、対象となる
ブロックのしきい値が最終的に決定される。
【0040】《閾値決定処理》次に、上記ステップS3
02の閾値決定処理について、図21のフローチャート
を参照して詳細に説明する。
02の閾値決定処理について、図21のフローチャート
を参照して詳細に説明する。
【0041】ステップS401において、パラメータS
TART、ENDにそれぞれ「0」、「255」をセッ
トする。START、ENDはそれぞれ、後段のステッ
プS402やステップS403で求める輝度値の統計量
の始点及び終点に対応する。また、閾値決定処理ループ
回数iに「0」をセットする。
TART、ENDにそれぞれ「0」、「255」をセッ
トする。START、ENDはそれぞれ、後段のステッ
プS402やステップS403で求める輝度値の統計量
の始点及び終点に対応する。また、閾値決定処理ループ
回数iに「0」をセットする。
【0042】ステップS401ではヒストグラム生成部
108で処理ブロック(64画素×64画素)中の全画
素を用い計算された8ビット、即ち「0」から「25
5」までの各デジタル値に対する頻度(ヒストグラム)
を入力する。
108で処理ブロック(64画素×64画素)中の全画
素を用い計算された8ビット、即ち「0」から「25
5」までの各デジタル値に対する頻度(ヒストグラム)
を入力する。
【0043】ステップS402では、STARTからE
NDまでのデジタル値に対応する画素の平均値AVを算
出する。たとえば、START=0、END=255で
あれば、「0」から「255」の値を持つ画素の平均値
AVを算出し、START=0、END=109であれ
ば「0」から「109」の値を持つ画素の平均値AVを
算出する。
NDまでのデジタル値に対応する画素の平均値AVを算
出する。たとえば、START=0、END=255で
あれば、「0」から「255」の値を持つ画素の平均値
AVを算出し、START=0、END=109であれ
ば「0」から「109」の値を持つ画素の平均値AVを
算出する。
【0044】ステップS403では、STARTからE
NDまでの輝度値に対応する画素のスキュー値SKを算
出する。スキュー値とは、ヒストグラム分布の偏りを示
す統計量である。スキュー値の算出には、以下に示す
(1)式を用いる。
NDまでの輝度値に対応する画素のスキュー値SKを算
出する。スキュー値とは、ヒストグラム分布の偏りを示
す統計量である。スキュー値の算出には、以下に示す
(1)式を用いる。
【0045】 SK=(Σ(Xi−AV)^3)/D (1) ここで、Xiは画素の輝度値である。また、Dは画素全
体の分散値であり、(2)式により算出される。
体の分散値であり、(2)式により算出される。
【0046】D=Σ(Xi−AV)^2 (2)
【0047】上述した式(1)において、スキュー値は
各画素の輝度値と、その平均値との差分を3乗すること
により算出されるが、奇数乗であれば3乗に限定される
ものではない。
各画素の輝度値と、その平均値との差分を3乗すること
により算出されるが、奇数乗であれば3乗に限定される
ものではない。
【0048】ステップS404では、1つの処理ブロッ
クにおける閾値決定処理ループ回数iの判断(i=0、
つまり最初のループかどうかの判断)を行う。iが
「0」であればステップS405へ、iが「0」以外で
あればステップS406へ進む。ステップS405で
は、処理中のブロックが「文字ブロック」かどうかの画
像特徴判別を行い(詳細後述)、ステップS414へ進
む。
クにおける閾値決定処理ループ回数iの判断(i=0、
つまり最初のループかどうかの判断)を行う。iが
「0」であればステップS405へ、iが「0」以外で
あればステップS406へ進む。ステップS405で
は、処理中のブロックが「文字ブロック」かどうかの画
像特徴判別を行い(詳細後述)、ステップS414へ進
む。
【0049】ステップS406では(3)式に示す様に
ヒストグラムの偏りの大きさを判断する。
ヒストグラムの偏りの大きさを判断する。
【0050】−0.1<SKかつSK<0.1 (3) つまり、スキュー値SKの絶対値が「0.1」未満かの
判断を行う。ステップS406が真ならばステップS4
16へ、偽ならばステップS407へ進む。
判断を行う。ステップS406が真ならばステップS4
16へ、偽ならばステップS407へ進む。
【0051】ステップS407では、閾値決定処理ルー
プ回数iの判断を行い、iが「1」ならばステップS4
08へ、「1」以外ならステップS409へ進む。ステ
ップS408では、処理中のブロックが「つぶれ文字ブ
ロック」かどうかの判断と処理を行い(詳細後述)、ス
テップS409へ進む。ステップS409では、閾値決
定処理ループ回数iの判断を行い、iが「9」ならばス
テップS416へ、「9」以外ならステップS410へ
進む。ステップS410では、処理中のブロックが「か
すれ文字ブロック」かどうかの判断と処理を行い(詳細
後述)、ステップS411へ進む。ステップS411で
は、かすれ文字フラグKFが「1」かどうかの判断を
し、「1」ならばステップS416へ、「1」以外なら
ステップS412へ進む。
プ回数iの判断を行い、iが「1」ならばステップS4
08へ、「1」以外ならステップS409へ進む。ステ
ップS408では、処理中のブロックが「つぶれ文字ブ
ロック」かどうかの判断と処理を行い(詳細後述)、ス
テップS409へ進む。ステップS409では、閾値決
定処理ループ回数iの判断を行い、iが「9」ならばス
テップS416へ、「9」以外ならステップS410へ
進む。ステップS410では、処理中のブロックが「か
すれ文字ブロック」かどうかの判断と処理を行い(詳細
後述)、ステップS411へ進む。ステップS411で
は、かすれ文字フラグKFが「1」かどうかの判断を
し、「1」ならばステップS416へ、「1」以外なら
ステップS412へ進む。
【0052】ステップS412では、以下に示す(4)
式によりヒストグラムの偏りの方向を判断する。
式によりヒストグラムの偏りの方向を判断する。
【0053】SK>0 (4)
【0054】ステップS412において(4)式が真
(ヒストグラムの偏りが平均値AVよりも大きい値の範
囲にある事を意味する)ならばステップS413へ進
み、偽(ヒストグラムの偏りが平均値AVよりも小さい
値の範囲にある事を意味する)ならばステップS414
へ進む。
(ヒストグラムの偏りが平均値AVよりも大きい値の範
囲にある事を意味する)ならばステップS413へ進
み、偽(ヒストグラムの偏りが平均値AVよりも小さい
値の範囲にある事を意味する)ならばステップS414
へ進む。
【0055】ステップS413では、STARTに平均
値AVをセットし、ENDは変化させない。そして、ス
テップS415へ進む。ステップS414では、STA
RTは変化させず、ENDに平均値AVをセットする。
そして、ステップS415へ進む。ステップS415で
は、閾値決定処理ループ回数iに「1」を加え、そして
ステップS402に戻り、再びSTART値からEND
値までの平均AVを算出する。
値AVをセットし、ENDは変化させない。そして、ス
テップS415へ進む。ステップS414では、STA
RTは変化させず、ENDに平均値AVをセットする。
そして、ステップS415へ進む。ステップS415で
は、閾値決定処理ループ回数iに「1」を加え、そして
ステップS402に戻り、再びSTART値からEND
値までの平均AVを算出する。
【0056】最後に、ステップS416では平均値AV
を、2値化閾値th_cとして設定し、この閾値決定処
理を終える。
を、2値化閾値th_cとして設定し、この閾値決定処
理を終える。
【0057】以上説明したようにして本実施の形態にお
ける2値化閾値決定処理が行われるが、式(3)、
(4)で示した範囲は、これに限定されるものではな
い。
ける2値化閾値決定処理が行われるが、式(3)、
(4)で示した範囲は、これに限定されるものではな
い。
【0058】《画像特徴判別処理》では、ステップS4
05である画像特徴判別処理について、図22を用い詳
細に説明する。ステップS501では、処理中のブロッ
クが「文字ブロック」かどうかを示す、文字フラグMF
に「0」をセットする。また、閾値決定処理ループにお
ける最初のスキュー値を表わすSK 0にスキュー値S
Kをセットする(なぜなら、この画像特徴判別処理は閾
値決定処理ループにおける最初のループのみ処理が行わ
れるからである)。ステップS502では、処理中のブ
ロックが「文字ブロック」かどうかの判断を(5)式に
より行う。
05である画像特徴判別処理について、図22を用い詳
細に説明する。ステップS501では、処理中のブロッ
クが「文字ブロック」かどうかを示す、文字フラグMF
に「0」をセットする。また、閾値決定処理ループにお
ける最初のスキュー値を表わすSK 0にスキュー値S
Kをセットする(なぜなら、この画像特徴判別処理は閾
値決定処理ループにおける最初のループのみ処理が行わ
れるからである)。ステップS502では、処理中のブ
ロックが「文字ブロック」かどうかの判断を(5)式に
より行う。
【0059】SK 0<MH (5) ここで、MHは処理中のブロックが「文字ブロック」か
どうかを示す値であり、ここでは、「MH=−20.
0」とする。ステップS502において(5)式が真な
らばステップS503へ、偽ならばこの画像特徴判別処
理を終える。ステップS503では、処理中のブロック
が「文字ブロック」であることを示す、文字フラグMF
に「1」をセットし、この画像特徴判別処理を終える。
どうかを示す値であり、ここでは、「MH=−20.
0」とする。ステップS502において(5)式が真な
らばステップS503へ、偽ならばこの画像特徴判別処
理を終える。ステップS503では、処理中のブロック
が「文字ブロック」であることを示す、文字フラグMF
に「1」をセットし、この画像特徴判別処理を終える。
【0060】以上説明したようにして本実施の形態にお
ける画像特徴判別処理が行われるが、式(5)で示した
条件は、これに限定されるものではない。
ける画像特徴判別処理が行われるが、式(5)で示した
条件は、これに限定されるものではない。
【0061】《つぶれ文字処理》つぶれ文字とは1文字
の字画が多いため、つぶれてしまう文字のことである。
の字画が多いため、つぶれてしまう文字のことである。
【0062】次に、ステップS408であるつぶれ文字
処理について、図23を用い詳細に説明する。ステップ
S601では、処理中のブロックが「つぶれ文字ブロッ
ク」かどうかを示す、つぶれ文字フラグTFに「0」を
セットする。また、処理中のブロックのヒストグラムの
偏りが大きいことを示すフラグPFに「0」をセットす
る。そしてステップS602で、閾値決定処理ループに
おける最初のループのスキュー値SK 0と、処理中の
ループのスキュー値SKが共にマイナスであるかの判断
をし、共にマイナスであれば、ステップS603でフラ
グPFに「1」をセットする。ステップS604では、
文字フラグMFが「1」かどうかの判断(つまり処理中
のブロックが文字ブロックかどうかの判断)を行い、
「1」ならばステップS605へ、「1」以外ならこの
つぶれ文字処理を終える。ステップS605では、処理
中のブロックが「つぶれ文字ブロック」かどうかの判断
を(6)式により行う。
処理について、図23を用い詳細に説明する。ステップ
S601では、処理中のブロックが「つぶれ文字ブロッ
ク」かどうかを示す、つぶれ文字フラグTFに「0」を
セットする。また、処理中のブロックのヒストグラムの
偏りが大きいことを示すフラグPFに「0」をセットす
る。そしてステップS602で、閾値決定処理ループに
おける最初のループのスキュー値SK 0と、処理中の
ループのスキュー値SKが共にマイナスであるかの判断
をし、共にマイナスであれば、ステップS603でフラ
グPFに「1」をセットする。ステップS604では、
文字フラグMFが「1」かどうかの判断(つまり処理中
のブロックが文字ブロックかどうかの判断)を行い、
「1」ならばステップS605へ、「1」以外ならこの
つぶれ文字処理を終える。ステップS605では、処理
中のブロックが「つぶれ文字ブロック」かどうかの判断
を(6)式により行う。
【0063】SK 0/SK<−SR (6) ここで、−SRは処理中のブロックが「つぶれ文字ブロ
ック」かどうかを示す値であり、ここでは、「−SR=
−3.0」とする。ステップS605において(6)式
が真ならばステップS606へ、偽ならばこのつぶれ文
字処理を終える。ステップS606では、処理中のブロ
ックが「つぶれ文字ブロック」であることを示す。つぶ
れ文字フラグTFに「1」をセットし、このつぶれ文字
処理を終える。
ック」かどうかを示す値であり、ここでは、「−SR=
−3.0」とする。ステップS605において(6)式
が真ならばステップS606へ、偽ならばこのつぶれ文
字処理を終える。ステップS606では、処理中のブロ
ックが「つぶれ文字ブロック」であることを示す。つぶ
れ文字フラグTFに「1」をセットし、このつぶれ文字
処理を終える。
【0064】以上説明したようにして本実施の形態にお
ける、つぶれ文字処理が行われるが、式(6)で示した
条件は、これに限定されるものではない。
ける、つぶれ文字処理が行われるが、式(6)で示した
条件は、これに限定されるものではない。
【0065】《かすれ文字処理》かすれ文字とは、うす
くてかすれてしまう文字のことである。
くてかすれてしまう文字のことである。
【0066】さらに、ステップS410であるかすれ文
字処理について、図24を用い詳細に説明する。ステッ
プS701では、処理中のブロックが「かすれ文字ブロ
ック」かどうかを示す、かすれ文字フラグKFに「0」
をセットする。ステップS702では、文字フラグMF
が「1」かどうかの判断(処理中のブロックが文字ブロ
ックかどうかの判断)を行い、「1」ならばステップS
703へ、「1」以外ならこのかすれ文字処理を終え
る。ステップS703では、フラグPFが「1」かどう
かの判断をし、「1」ならばステップS704へ、
「1」以外ならこのかすれ文字処理を終える。ステップ
S704では、処理中のブロックが「かすれ文字ブロッ
ク」かどうかの判断を(7)式により行う。
字処理について、図24を用い詳細に説明する。ステッ
プS701では、処理中のブロックが「かすれ文字ブロ
ック」かどうかを示す、かすれ文字フラグKFに「0」
をセットする。ステップS702では、文字フラグMF
が「1」かどうかの判断(処理中のブロックが文字ブロ
ックかどうかの判断)を行い、「1」ならばステップS
703へ、「1」以外ならこのかすれ文字処理を終え
る。ステップS703では、フラグPFが「1」かどう
かの判断をし、「1」ならばステップS704へ、
「1」以外ならこのかすれ文字処理を終える。ステップ
S704では、処理中のブロックが「かすれ文字ブロッ
ク」かどうかの判断を(7)式により行う。
【0067】SK 0/SK>SR (7) ここで、SRは処理中のブロックが「かすれ文字ブロッ
ク」かどうかを示す値であり、ここでは、「SR=3.
0」とする。ステップS704において(7)式が真な
らばステップS705へ、偽ならばこのかすれ文字処理
を終える。ステップS705では、処理中のブロックが
「かすれ文字ブロック」であることを示す、かすれ文字
フラグKFに「1」をセットし、このかすれ文字処理を
終える。
ク」かどうかを示す値であり、ここでは、「SR=3.
0」とする。ステップS704において(7)式が真な
らばステップS705へ、偽ならばこのかすれ文字処理
を終える。ステップS705では、処理中のブロックが
「かすれ文字ブロック」であることを示す、かすれ文字
フラグKFに「1」をセットし、このかすれ文字処理を
終える。
【0068】以上説明したようにして本実施の形態にお
ける、かすれ文字処理が行われるが、式(7)で示した
条件は、これに限定されるものではない。
ける、かすれ文字処理が行われるが、式(7)で示した
条件は、これに限定されるものではない。
【0069】このように、対象とするブロックが文字の
場合は、かすれ文字/つぶれ文字判定をし、かすれ文字
の場合はかすれ文字用の処理を、つぶれ文字の場合はつ
ぶれ文字用に処理をすることにより、文字がかすれたり
つぶれたりすることのない2値画像を得るための2値化
閾値を算出することができる。また、本閾値決定処理ル
ープでは、1回目は必ず平均値より小さい方へ進み、そ
の後はヒストグラムの谷を見つけるようにそのループが
繰り返される。つまり、平均値より小さい領域のおける
ヒストグラムの度数の低い方へ閾値算出のループが進む
のである。対象ブロックが下地のみの場合には、ヒスト
グラムの山が一つであるため、必ずヒストグラムの左側
の度数の低いところに進んでいった結果、閾値は、その
ブロックの輝度値の最も小さい値周辺に収束する。従っ
て、結果として得られた閾値は、下地を除去することが
できる。
場合は、かすれ文字/つぶれ文字判定をし、かすれ文字
の場合はかすれ文字用の処理を、つぶれ文字の場合はつ
ぶれ文字用に処理をすることにより、文字がかすれたり
つぶれたりすることのない2値画像を得るための2値化
閾値を算出することができる。また、本閾値決定処理ル
ープでは、1回目は必ず平均値より小さい方へ進み、そ
の後はヒストグラムの谷を見つけるようにそのループが
繰り返される。つまり、平均値より小さい領域のおける
ヒストグラムの度数の低い方へ閾値算出のループが進む
のである。対象ブロックが下地のみの場合には、ヒスト
グラムの山が一つであるため、必ずヒストグラムの左側
の度数の低いところに進んでいった結果、閾値は、その
ブロックの輝度値の最も小さい値周辺に収束する。従っ
て、結果として得られた閾値は、下地を除去することが
できる。
【0070】(写真用しきい値算出部111の説明)図
8は、写真用しきい値算出部111の詳細ブロック図で
ある。図8において、701は、ブロック画像合計値算
出部であり、バンドメモリ部107からのブロック単位
のラスター順次で入力される多値画像データをブロック
単位で画像レベルの合計値を算出する。このブロック画
像合計値は、除算部702にて255で除算され、その
結果はバッファ部703に格納される。白黒の2値画像
は、白は画素レベルが0で、黒は画素レベルが255と
考えることができるため、ブロックの合計値を255で
除算することにより、そのブロックに必要な黒画素の数
を求めることができる。この黒画素をバッファ部703
に一時格納しておき、加算部704の結果であるヒスト
グラムの度数の加算値と大小関係を比較部705にて比
較する。そして、バッファ部703の必要黒画素数よ
り、加算部704の度数の合計値が大きくなったなら
ば、その時のレベルをしきい値確定部706にて、写真
用しきい値として確定し、th_pに出力する。
8は、写真用しきい値算出部111の詳細ブロック図で
ある。図8において、701は、ブロック画像合計値算
出部であり、バンドメモリ部107からのブロック単位
のラスター順次で入力される多値画像データをブロック
単位で画像レベルの合計値を算出する。このブロック画
像合計値は、除算部702にて255で除算され、その
結果はバッファ部703に格納される。白黒の2値画像
は、白は画素レベルが0で、黒は画素レベルが255と
考えることができるため、ブロックの合計値を255で
除算することにより、そのブロックに必要な黒画素の数
を求めることができる。この黒画素をバッファ部703
に一時格納しておき、加算部704の結果であるヒスト
グラムの度数の加算値と大小関係を比較部705にて比
較する。そして、バッファ部703の必要黒画素数よ
り、加算部704の度数の合計値が大きくなったなら
ば、その時のレベルをしきい値確定部706にて、写真
用しきい値として確定し、th_pに出力する。
【0071】このように対象ブロックのしきい値を決定
することにより、そのブロック内に必要な画素レベルが
保存されるため、写真のような中間調領域を多く含む画
像ブロックに対しても中間調が保存された良好な画質の
写真2値画像を得ることができる。また、この写真用2
値化方法は、上記に説明したようにシンプルな構成で実
現できるため、回路規模を小さくすることができ、コス
トをおさえることができる。
することにより、そのブロック内に必要な画素レベルが
保存されるため、写真のような中間調領域を多く含む画
像ブロックに対しても中間調が保存された良好な画質の
写真2値画像を得ることができる。また、この写真用2
値化方法は、上記に説明したようにシンプルな構成で実
現できるため、回路規模を小さくすることができ、コス
トをおさえることができる。
【0072】(MUX部112の説明)MUX部112
では、文字/写真/下地ブロック判定部109の結果の
resに従い、 ・resが文字の場合にはth_cを選択 ・resが写真の場合にはth_pを選択 ・resが下地の場合にはth_cを選択 する。選択した結果のthは、スムージング部113に
転送される。
では、文字/写真/下地ブロック判定部109の結果の
resに従い、 ・resが文字の場合にはth_cを選択 ・resが写真の場合にはth_pを選択 ・resが下地の場合にはth_cを選択 する。選択した結果のthは、スムージング部113に
転送される。
【0073】文字・下地用しきい値算出部110は、下
地が存在する場合には下地を除去し、文字に対しては、
かすれたり、つぶれたりしない高品質の文字画像を得る
ことができるしきい値を算出する。そして、写真用しき
い値算出部111は、写真に多く含まれる中間調が保存
されたり良好な写真画像が得られるしきい値を算出す
る。したがって、文字ブロックに対しては文字・下地用
2値化しきい値、写真ブロックに対しては写真用2値化
しきい値、そして、下地ブロックの場合には文字・下地
用2値化しきい値を適用して2値化することにより、下
地を除去し、文字はかすれたり、つぶれたりすることの
ない、そして、写真は、中間調が保存された高画質な2
値画像を得ることができる。
地が存在する場合には下地を除去し、文字に対しては、
かすれたり、つぶれたりしない高品質の文字画像を得る
ことができるしきい値を算出する。そして、写真用しき
い値算出部111は、写真に多く含まれる中間調が保存
されたり良好な写真画像が得られるしきい値を算出す
る。したがって、文字ブロックに対しては文字・下地用
2値化しきい値、写真ブロックに対しては写真用2値化
しきい値、そして、下地ブロックの場合には文字・下地
用2値化しきい値を適用して2値化することにより、下
地を除去し、文字はかすれたり、つぶれたりすることの
ない、そして、写真は、中間調が保存された高画質な2
値画像を得ることができる。
【0074】(スムージング部113の説明)図9は、
MUX112からの64×64ブロック単位のしきい値
が格納されるテーブルで、第1バンドのしきい値が左か
らTH11、TH12、…、TH1(m−1)、TH1
m、そして、第2バンドのしきい値が左からTH21、
TH22、…、TH2(m−1)、TH2mである。こ
の2バンド分のしきい値を用いて、スムージング処理を
実行する。実際のスムージング処理では、このように2
バンド単位でスムージング処理を行なうのであるが、説
明を簡単にするため、まず、(nブロック×mブロッ
ク)の画像データ全体でどのようなスムージング処理が
なされるか説明する。
MUX112からの64×64ブロック単位のしきい値
が格納されるテーブルで、第1バンドのしきい値が左か
らTH11、TH12、…、TH1(m−1)、TH1
m、そして、第2バンドのしきい値が左からTH21、
TH22、…、TH2(m−1)、TH2mである。こ
の2バンド分のしきい値を用いて、スムージング処理を
実行する。実際のスムージング処理では、このように2
バンド単位でスムージング処理を行なうのであるが、説
明を簡単にするため、まず、(nブロック×mブロッ
ク)の画像データ全体でどのようなスムージング処理が
なされるか説明する。
【0075】図10は、その画像データ全体に対して行
なわれるスムージング処理を説明するための図である。
図10において、細い実線は図2のブロック分けと同様
のもので、左上第1値画素を起点とした64×64のブ
ロック分けを示す。しきい値は、この細い実線で分割さ
れたブロック単位で算出されるので、そのブロックを代
表するしきい値と考えることができる。そこで、この細
い実線で分割されたブロックの中心点、即ち、太い点線
の交点がMUX部112から入力されるしきい値とし、
スムージング処理では、その新たに定義された太い点線
で分割されたブロック単位で、その4角のしきい値に基
づきその内側を画素単位で、2次元の線形補間すること
により、しきい値のスムージング処理を実行する。以
下、この太い点線で分割されたブロックをスムージング
ブロックと呼ぶ。つまり、スムージング部113では、
図10における点線で分割されたBL11、BL12、
…BL1(m−1)、BL1m、BL21、BL22、
…BLn(m−1)、BLnmを新たにスムージング処
理のためのスムージングブロックとに定義し、各ブロッ
クの交点、即ち、太い点線の交点には、図中に示してい
るようなしきい値を定義する。例えば、BL11の4角
のしきい値は、TH11、TH11、TH11、TH1
1であり、BL22の4角のしきい値は、TH11、T
H12、TH21、TH22である。そして、スムージ
ングブロックにおいて、その4角のしきい値により、2
次元の線形補間を行なう。たとえば、BL22のスムー
ジング処理は、TH11、TH12、TH21、TH2
2の4つのしきい値により2次元の線形補間がおこなわ
れる。
なわれるスムージング処理を説明するための図である。
図10において、細い実線は図2のブロック分けと同様
のもので、左上第1値画素を起点とした64×64のブ
ロック分けを示す。しきい値は、この細い実線で分割さ
れたブロック単位で算出されるので、そのブロックを代
表するしきい値と考えることができる。そこで、この細
い実線で分割されたブロックの中心点、即ち、太い点線
の交点がMUX部112から入力されるしきい値とし、
スムージング処理では、その新たに定義された太い点線
で分割されたブロック単位で、その4角のしきい値に基
づきその内側を画素単位で、2次元の線形補間すること
により、しきい値のスムージング処理を実行する。以
下、この太い点線で分割されたブロックをスムージング
ブロックと呼ぶ。つまり、スムージング部113では、
図10における点線で分割されたBL11、BL12、
…BL1(m−1)、BL1m、BL21、BL22、
…BLn(m−1)、BLnmを新たにスムージング処
理のためのスムージングブロックとに定義し、各ブロッ
クの交点、即ち、太い点線の交点には、図中に示してい
るようなしきい値を定義する。例えば、BL11の4角
のしきい値は、TH11、TH11、TH11、TH1
1であり、BL22の4角のしきい値は、TH11、T
H12、TH21、TH22である。そして、スムージ
ングブロックにおいて、その4角のしきい値により、2
次元の線形補間を行なう。たとえば、BL22のスムー
ジング処理は、TH11、TH12、TH21、TH2
2の4つのしきい値により2次元の線形補間がおこなわ
れる。
【0076】図11は、BL22のスムージング処理を
具体的に説明した図である。本スムージング処理では、
2次元の線形補間処理を行う。2次元の線形補間処理
は、垂直方向の補間を行なってから、次に、水平方向の
補間を行なう処理である。垂直方向の補間処理には、左
端の線形垂直補間処理と右端の線形垂直補間処理の2つ
が存在する。TH11とTH21からの左端の線形垂直
補間をした結果をH1i(i=1、2、…、64)と
し、TH12とTH22からの右端の線形垂直補間をし
た結果をH2i(i=1、2、…、64)とすると、H
1iとH2iの値は、 H1i=TH11+(i−1)*(TH21−TH11)/H (8) H2i=TH12+(i−1)*(TH22−TH21)/H (9) ただし、Hはスムージングブロックの高さを示す。と表
すことができる。
具体的に説明した図である。本スムージング処理では、
2次元の線形補間処理を行う。2次元の線形補間処理
は、垂直方向の補間を行なってから、次に、水平方向の
補間を行なう処理である。垂直方向の補間処理には、左
端の線形垂直補間処理と右端の線形垂直補間処理の2つ
が存在する。TH11とTH21からの左端の線形垂直
補間をした結果をH1i(i=1、2、…、64)と
し、TH12とTH22からの右端の線形垂直補間をし
た結果をH2i(i=1、2、…、64)とすると、H
1iとH2iの値は、 H1i=TH11+(i−1)*(TH21−TH11)/H (8) H2i=TH12+(i−1)*(TH22−TH21)/H (9) ただし、Hはスムージングブロックの高さを示す。と表
すことができる。
【0077】そして、iラインの水平方向補間処理がこ
の左端をH1iとし、右端をH2iとして行なわれ、各
画素毎のしきい値が導かれる。iラインの各画素のしき
い値Ti−j(iは垂直方向のライン数で、1、2、…
64、jは水平方向のライン数で、1、2、…64であ
る)は、 Ti−j=H1i+(j−1)*(H2i−H1i)/W (10) ただし、Wはスムージングブロックの幅を示す。で導き
出される。上記(8)、(9)、(10)と図11に示
したTH11=32、TH12=96、TH21=9
6、TH22=160、そして、H=64、W=64か
ら、Ti−jのしきい値を求めると図11に示されてい
るようになる。
の左端をH1iとし、右端をH2iとして行なわれ、各
画素毎のしきい値が導かれる。iラインの各画素のしき
い値Ti−j(iは垂直方向のライン数で、1、2、…
64、jは水平方向のライン数で、1、2、…64であ
る)は、 Ti−j=H1i+(j−1)*(H2i−H1i)/W (10) ただし、Wはスムージングブロックの幅を示す。で導き
出される。上記(8)、(9)、(10)と図11に示
したTH11=32、TH12=96、TH21=9
6、TH22=160、そして、H=64、W=64か
ら、Ti−jのしきい値を求めると図11に示されてい
るようになる。
【0078】さて、このスムージング処理をダブルバン
ドメモリ対応にし、そして、2値化部114の2値デー
タの出力をラスター順次で出力するため、スムージング
処理結果の画素毎のしきい値pix−thをラスター順
次で出力するための構成を示したのが図12のブロック
図である。
ドメモリ対応にし、そして、2値化部114の2値デー
タの出力をラスター順次で出力するため、スムージング
処理結果の画素毎のしきい値pix−thをラスター順
次で出力するための構成を示したのが図12のブロック
図である。
【0079】図12において、ブロックしきい値テーブ
ル部1001は、図9に示されているテーブルでMUX
部112からのブロック単位のしきい値が2バンド分格
納されているテーブルである。A、Bのバンドは、交互
に新しいしきい値が書き込まれ、2つのバンドのしきい
値を用いて垂直方向補間部1004により垂直方向の補
間処理のための加算値nxt−addが計算されて、垂
直方向加算値テーブル部1002に書き込まれる。この
垂直方向加算値は、上記(8)又は、(9)式の第2項
に相当する。水平方向補間部1003では、ブロックし
きい値テーブル部1001のA、Bバンド内、先に格納
されたバンドのしきい値と垂直方向加算値テーブル部1
002の値を加算した結果を用いて、両端のしきい値を
求め、この両端のしきい値から、上記(10)式に基づ
き水平方向の補間処理を実行する。
ル部1001は、図9に示されているテーブルでMUX
部112からのブロック単位のしきい値が2バンド分格
納されているテーブルである。A、Bのバンドは、交互
に新しいしきい値が書き込まれ、2つのバンドのしきい
値を用いて垂直方向補間部1004により垂直方向の補
間処理のための加算値nxt−addが計算されて、垂
直方向加算値テーブル部1002に書き込まれる。この
垂直方向加算値は、上記(8)又は、(9)式の第2項
に相当する。水平方向補間部1003では、ブロックし
きい値テーブル部1001のA、Bバンド内、先に格納
されたバンドのしきい値と垂直方向加算値テーブル部1
002の値を加算した結果を用いて、両端のしきい値を
求め、この両端のしきい値から、上記(10)式に基づ
き水平方向の補間処理を実行する。
【0080】次に、実際の補間処理のデータの流れを説
明する。最初の32ライン(BL11、BL12、…B
L1m)は、図10から明らかなように上側と下側のし
きい値に同じものを用いるため図9のブロックしきい値
テーブルのAバンドのしきい値TH11〜TH1mを用
いて補間処理する。図10のスムージングブロックBL
11において、第1ラインは、左上角のしきい値TH1
1と右上角のしきい値TH11から水平方向の補間処理
を水平方向補間部1003にて行なうが、左端と右端の
しきい値が同じため、TH11が繰り返される。次に、
BL12の第1ラインが、同様に左上端のTH11とT
H12を用いて水平方向補間部1003にて水平方向の
補間処理が(3)式のH1iをTH11、H2iをTH
12として行なわれる。以下同様に、BL13、BL1
4、…、BL1mまでの第1ラインの補間処理が行なわ
れ、その値pix−thは、2値化部114に転送され
る。次に、BL11の第2ラインが第1ラインと同様に
水平方向補間部1003にて補間処理されるが、左端と
右端のしきい値が同じため、TH11が繰り返される。
以下、BL12〜BL1mまでの第2ラインの補間処理
が、同スムージングブロックの第1ラインと同様に処理
される。そして、第3ラインから第32ラインまで同様
の処理が繰り返される。
明する。最初の32ライン(BL11、BL12、…B
L1m)は、図10から明らかなように上側と下側のし
きい値に同じものを用いるため図9のブロックしきい値
テーブルのAバンドのしきい値TH11〜TH1mを用
いて補間処理する。図10のスムージングブロックBL
11において、第1ラインは、左上角のしきい値TH1
1と右上角のしきい値TH11から水平方向の補間処理
を水平方向補間部1003にて行なうが、左端と右端の
しきい値が同じため、TH11が繰り返される。次に、
BL12の第1ラインが、同様に左上端のTH11とT
H12を用いて水平方向補間部1003にて水平方向の
補間処理が(3)式のH1iをTH11、H2iをTH
12として行なわれる。以下同様に、BL13、BL1
4、…、BL1mまでの第1ラインの補間処理が行なわ
れ、その値pix−thは、2値化部114に転送され
る。次に、BL11の第2ラインが第1ラインと同様に
水平方向補間部1003にて補間処理されるが、左端と
右端のしきい値が同じため、TH11が繰り返される。
以下、BL12〜BL1mまでの第2ラインの補間処理
が、同スムージングブロックの第1ラインと同様に処理
される。そして、第3ラインから第32ラインまで同様
の処理が繰り返される。
【0081】次に、BL21〜BL2mまでのスムージ
ングブロックがスムージング処理される。BL21の第
1ラインが、左上角のTH11と右上角のTH11を用
いて、水平方向補間部1003にて水平方向補間処理さ
れる。BL22の第1ラインが左上角のTH11と右上
角のTH12から水平方向補間部1003にて水平方向
補間処理される。以下同様に、BL23、BL24、
…、BL2mまでの第1ラインが各スムージングブロッ
クの左上角と右上角のしきい値から水平方向補間部10
03にて水平方向補間処理される。次に、BL21の第
2ラインは、左上角のTH11と左下角のTH21から
垂直方向補間部1004にて計算され、垂直方向加算値
テーブル部1002に格納された値Hadd1=(TH
21−TH11)/Hと左上角のTH11の加算した値
が、水平方向補間処理のための左端の値として、水平方
向補間部1003内にセットされる。また、同スムージ
ングブロックの右上角のTH12と右下角のTH22か
ら垂直方向補間部1004にて計算され、垂直方向加算
値テーブル部1002に格納された値Hadd2=(T
H22−TH12)/Hと右上角のTH12の加算した
値が、水平方向補間処理のための右端の値として、水平
方向補間部1003にセットされる。そして、水平方向
補間部1003では、前記(10)式におけるH1iと
H2iを、 H1i=TH12+Hadd1 H2i=TH12+Hadd2 ただし、iは1である。として、(10)により水平方
向の補間処理を行なう。以下同様に、BL23、BL2
4、…、BL2mまでの第2ラインの補間処理がなさ
れ、そして、第3ラインから第64ラインまでの補間処
理がなされてスムージングブロックBL21〜BL2m
までの補間処理が達成される。スムージングブロックB
L31〜BL3mまで補間処理は、ブロックしきい値テ
ーブル1001のBバントのTH21〜TH2とAバン
ドに新たに書き込まれたTH31〜TH3mを用いて、
BL21〜BL2mまでのスムージングの処理がなされ
る。以下同様に、ブロックしきい値テーブル1001の
ABバンドに交互に新しいしきい値が書き込まれ、そし
て、AB2つのバンドのしきい値を用いてスムージング
処理がBLn1、BLn2、…、BLnmまで実行さ
れ、全スムージング処理が終了する。
ングブロックがスムージング処理される。BL21の第
1ラインが、左上角のTH11と右上角のTH11を用
いて、水平方向補間部1003にて水平方向補間処理さ
れる。BL22の第1ラインが左上角のTH11と右上
角のTH12から水平方向補間部1003にて水平方向
補間処理される。以下同様に、BL23、BL24、
…、BL2mまでの第1ラインが各スムージングブロッ
クの左上角と右上角のしきい値から水平方向補間部10
03にて水平方向補間処理される。次に、BL21の第
2ラインは、左上角のTH11と左下角のTH21から
垂直方向補間部1004にて計算され、垂直方向加算値
テーブル部1002に格納された値Hadd1=(TH
21−TH11)/Hと左上角のTH11の加算した値
が、水平方向補間処理のための左端の値として、水平方
向補間部1003内にセットされる。また、同スムージ
ングブロックの右上角のTH12と右下角のTH22か
ら垂直方向補間部1004にて計算され、垂直方向加算
値テーブル部1002に格納された値Hadd2=(T
H22−TH12)/Hと右上角のTH12の加算した
値が、水平方向補間処理のための右端の値として、水平
方向補間部1003にセットされる。そして、水平方向
補間部1003では、前記(10)式におけるH1iと
H2iを、 H1i=TH12+Hadd1 H2i=TH12+Hadd2 ただし、iは1である。として、(10)により水平方
向の補間処理を行なう。以下同様に、BL23、BL2
4、…、BL2mまでの第2ラインの補間処理がなさ
れ、そして、第3ラインから第64ラインまでの補間処
理がなされてスムージングブロックBL21〜BL2m
までの補間処理が達成される。スムージングブロックB
L31〜BL3mまで補間処理は、ブロックしきい値テ
ーブル1001のBバントのTH21〜TH2とAバン
ドに新たに書き込まれたTH31〜TH3mを用いて、
BL21〜BL2mまでのスムージングの処理がなされ
る。以下同様に、ブロックしきい値テーブル1001の
ABバンドに交互に新しいしきい値が書き込まれ、そし
て、AB2つのバンドのしきい値を用いてスムージング
処理がBLn1、BLn2、…、BLnmまで実行さ
れ、全スムージング処理が終了する。
【0082】(2値化部114の説明)上記のスムージ
ング部113の説明で述べたようにスムージング部11
3からの出力pix−thでは、画素毎にラスター順次
で2値化のためのしきい値が出力されてくるので2値化
部114では、このしきい値を用いてバンドメモリ部1
07からのラスター順次の多値画像データを2値化し、
コンピュータ装置103に出力する。
ング部113の説明で述べたようにスムージング部11
3からの出力pix−thでは、画素毎にラスター順次
で2値化のためのしきい値が出力されてくるので2値化
部114では、このしきい値を用いてバンドメモリ部1
07からのラスター順次の多値画像データを2値化し、
コンピュータ装置103に出力する。
【0083】上記実施の形態では、(64×64)pi
xelsのブロック単位で処理をおこなっているが、こ
れは、64×64に限らず、(8×8)、…、(16×
16)、…、(32×32)、… 等のブロック単位で
実現してもよい。
xelsのブロック単位で処理をおこなっているが、こ
れは、64×64に限らず、(8×8)、…、(16×
16)、…、(32×32)、… 等のブロック単位で
実現してもよい。
【0084】又、スムージング部113では、スムージ
ングのための線形補間を1画素毎に行っているが、これ
は、1画素毎に限らず、2画素毎、3画素毎、…など複
数画素毎に行ってもよい。
ングのための線形補間を1画素毎に行っているが、これ
は、1画素毎に限らず、2画素毎、3画素毎、…など複
数画素毎に行ってもよい。
【0085】又、2画素毎に線形補間をする場合は、
(8)、(9)式は、以下のようになる。
(8)、(9)式は、以下のようになる。
【0086】 H1i=TH11+(i−1)*(TH21−TH11)/(H/2) (8′) H2i=TH12+(i−1)*(TH22−TH21)/(H/2) (9′) ただし、Hは、スムージングブロックの高さで、iは、
1、2、…、32となる。そして、(10)のしきい値
Ti−j(iは垂直方向のライン数で、1、2、…3
2、jは水平方向のライン数で、1、2、…32であ
る)は、 Ti−j=H1i+(j−1)*(H2i−H1i)/(W/2) (10′) ただし、Wは、スムージングブロックの幅を示す。とな
る。これにより、補間処理に必要な計算数がブロック当
たり1/4になるため、その計算時間を短くすることが
できる。
1、2、…、32となる。そして、(10)のしきい値
Ti−j(iは垂直方向のライン数で、1、2、…3
2、jは水平方向のライン数で、1、2、…32であ
る)は、 Ti−j=H1i+(j−1)*(H2i−H1i)/(W/2) (10′) ただし、Wは、スムージングブロックの幅を示す。とな
る。これにより、補間処理に必要な計算数がブロック当
たり1/4になるため、その計算時間を短くすることが
できる。
【0087】この様に、ブロック単位で求められた閾値
をスムージングすることでブロック歪みの発生も抑える
ことができ、又領域分離が誤判定した場合にも、得られ
た2値画像の極端な劣化を防止できる。
をスムージングすることでブロック歪みの発生も抑える
ことができ、又領域分離が誤判定した場合にも、得られ
た2値画像の極端な劣化を防止できる。
【0088】以上説明したように、本実施の形態によれ
ば、文字領域、写真領域、そして、下地領域の領域分離
を行なうことができる。又、写真領域用2値化処理とし
て誤差拡散法のような回路規模を大きくしてとすること
なく、簡単な処理にて濃度が保存され、良好な写真2値
画像を得ることができる。
ば、文字領域、写真領域、そして、下地領域の領域分離
を行なうことができる。又、写真領域用2値化処理とし
て誤差拡散法のような回路規模を大きくしてとすること
なく、簡単な処理にて濃度が保存され、良好な写真2値
画像を得ることができる。
【0089】又、文字領域、写真領域、下地領域の領域
分離を行ない、各領域に適した2値化処理することによ
り、下地領域は除去し、文字、写真ともに良好な2値画
像データを得ることができる。また、前記領域分離が誤
判定した場合にも、得られた2値画像が極端に劣化する
ことの無い良好な2値画像を得ることができる。
分離を行ない、各領域に適した2値化処理することによ
り、下地領域は除去し、文字、写真ともに良好な2値画
像データを得ることができる。また、前記領域分離が誤
判定した場合にも、得られた2値画像が極端に劣化する
ことの無い良好な2値画像を得ることができる。
【0090】
【発明の効果】以上説明した如く本発明によれば、文字
領域、写真領域、そして、下地領域の領域分離を行な
い、各々に適した2値化処理することにより、下地領域
は除去し、文字、写真ともに良好な2値画像データを得
ることができる。
領域、写真領域、そして、下地領域の領域分離を行な
い、各々に適した2値化処理することにより、下地領域
は除去し、文字、写真ともに良好な2値画像データを得
ることができる。
【0091】又、本発明によれば、写真領域用2値化方
法として誤差拡散法のように回路規模を大きくすること
なく、簡単な処理にて濃度が保存され、良好な写真画像
を得ることができる。
法として誤差拡散法のように回路規模を大きくすること
なく、簡単な処理にて濃度が保存され、良好な写真画像
を得ることができる。
【図1】本発明の実施の形態の特徴を最も良く表す図で
あり、スキャナ装置、コンピュータ装置と2値化装置と
の関係、2値化装置の内部構成を示した図である。
あり、スキャナ装置、コンピュータ装置と2値化装置と
の関係、2値化装置の内部構成を示した図である。
【図2】しきい値を算出するまでの処理単位となるブロ
ックを示す図である。
ックを示す図である。
【図3】バンドメモリ部が2つのバンドで構成されてい
ることを示す図であり、ブロック単位の処理をするため
の画像データのブロックラスター順次を示す図である。
ることを示す図であり、ブロック単位の処理をするため
の画像データのブロックラスター順次を示す図である。
【図4】ヒストグラム生成部108内部のヒストグラム
テーブルを示す図である。
テーブルを示す図である。
【図5】ヒストグラムデータから文字/写真/下地ブロ
ックを判定する構成を示す図である。
ックを判定する構成を示す図である。
【図6】文字/写真/下地ブロック判定部109の有効
Minレベル検出部501、又は、有効Maxレベル検
出部502の構成を示す図である。
Minレベル検出部501、又は、有効Maxレベル検
出部502の構成を示す図である。
【図7】文字/写真/下地ブロック判定部109の文字
/写真判定部507を構成するテーブルを示す図であ
る。
/写真判定部507を構成するテーブルを示す図であ
る。
【図8】写真用しきい値算出部111の構成を示す図で
ある。
ある。
【図9】ブロックしきい値テーブル1001を示すテー
ブル図である。
ブル図である。
【図10】スムージング部113にて処理されるスムー
ジング処理ブロックとその各4角のしきい値を示す図で
ある。
ジング処理ブロックとその各4角のしきい値を示す図で
ある。
【図11】スムージング処理ブロックBL22のスムー
ジング処理のためのしきい値の2次元補間処理の具体的
な値を示す図である。
ジング処理のためのしきい値の2次元補間処理の具体的
な値を示す図である。
【図12】スムージング部113の構成を示す図であ
る。
る。
【図13】スムージング部113の垂直方向加算値テー
ブル部1002を示す図である。
ブル部1002を示す図である。
【図14】文字、下地用しきい値算出部の構成を示すフ
ローチャートである。
ローチャートである。
【図15】閾値決定処理を示すフローチャートである。
【図16】画像特徴判別処理を示すフローチャートであ
る。
る。
【図17】つぶれ文字処理を示すフローチャートであ
る。
る。
【図18】かすれ文字処理を示すフローチャートであ
る。
る。
101 スキャナ装置 102 2値化装置 102 コンピュータ装置 104 CPU 105 ROM 106 RAM 107 バンドメモリ部 108 ヒストグラム生成部 109 文字/写真/下地ブロック判定部 110 文字・下地用しきい値算出部 111 写真用しきい値算出部 112 MUX部 113 スムージング部 114 2値化部 501 有効Minレベル検出部 502 有効Maxレベル検出部 503 中央値算出部 504 文字度算出部 505 中央値以上の画素数の算出部 506 下地判定部 507 文字/写真判定部 508 最終判定部
Claims (18)
- 【請求項1】 入力画像データからヒストグラムを作成
するヒストグラム作成手段と、 前記ヒストグラムからその中央値を算出する中央値算出
手段と、 前記ヒストグラムにおいて前記中央値からの広がり度を
算出する広がり度算出手段と、 前記中央値より黒色側の画素数を算出する画素数算出手
段と、 前記広がり度算出手段からの広がり度と前記中央値算出
手段からの中央値と前記画素数算出手段からの画素数に
応じて画像の属性が文字、写真、下地のいずれであるか
を判定する判定手段とを有することを特徴とする画像処
理装置。 - 【請求項2】 更に、前記ヒストグラムから最低レベル
のノイズを取り除く有効最低レベル検出手段と、前記ヒ
ストグラムから最高レベルのノイズを取り除く有効最高
レベル検出手段とを有し、前記中央値算出手段は前記有
効最低レベル検出手段からの最低値と、前記有効最高レ
ベル検出手段からの最高値から前記中央値を算出するこ
とを特徴とする請求項1記載の画像処理装置。 - 【請求項3】 前記広がり度算出手段は前記有効最低レ
ベル検出手段からの最低値と、前記有効最高レベル検出
手段からの最高値と、前記中央値算出手段からの中央値
と、前記ヒストグラムから広がり度を算出することを特
徴とする請求項2記載の画像処理装置。 - 【請求項4】 更に、前記有効最低レベル検出手段から
の最低値と、前記有効最高レベル検出手段からの最高値
と、前記中央値算出手段からの中央値と、前記ヒストグ
ラムから文字らしさの度合いを表す文字度を算出する文
字度算出手段と、前記広がり度算出手段からの広がり度
と、前記中央値とから下地を判定する下地判定手段と、
前記文字度判定手段からの文字度と、前記中央値と、前
記画素数算出手段からの画素数に応じて画像の属性が文
字、写真のいずれであるかを判定する文字写真判定手段
とを有し、前記判定手段は、前記下地判定手段及び文字
写真判定手段からの判定結果に応じて、画像の属性が文
字、写真、下地のいずれであるかを判定することを特徴
とする請求項3記載の画像処理装置。 - 【請求項5】 入力画像データからヒストグラムを作成
するヒストグラム作成工程と、 前記ヒストグラムからその中央値を算出する中央値算出
工程と、 前記ヒストグラムにおいて前記中央値からの広がり度を
算出する広がり度算出工程と、 前記中央値より黒色側の画素数を算出する画素数算出工
程と、 前記広がり度算出工程からの広がり度と前記中央値算出
工程からの中央値と前記画素数算出工程からの画素数に
応じて画像の属性が文字、写真、下地のいずれであるか
を判定する判定工程とを有することを特徴とする画像処
理方法。 - 【請求項6】 更に、前記ヒストグラムからの最低レベ
ルのノイズを取り除く有効最低レベル検出工程と、前記
ヒストグラムから最高レベルのノイズを取り除く有効最
高レベル検出工程とを有し、前記中央値算出工程は前記
有効最低レベル検出工程からの最低値と、前記有効最高
レベル検出工程からの最高値から前記中央値を算出する
ことを特徴とする請求項5記載の画像処理方法。 - 【請求項7】 前記広がり度算出工程は前記有効最低レ
ベル検出工程からの最低値と、前記有効最高レベル検出
工程からの最高値と、前記中央値算出工程からの中央値
と、前記ヒストグラムから広がり度を算出することを特
徴とする請求項6記載の画像処理方法。 - 【請求項8】 更に、前記有効最低レベル検出工程から
の最低値と、前記有効最高レベル検出工程からの最高値
と、前記中央値算出工程からの中央値と、前記ヒストグ
ラムから文字らしさの度合いを表す文字度を算出する文
字度算出工程と、前記広がり度算出工程からの広がり度
と、前記中央値とから下地を判定する下地判定工程と、
前記文字度判定工程からの文字度と、前記中央値と、前
記画素数算出工程からの画素数に応じて画像の属性が文
字、写真のいずれかであるかを判定する文字写真判定工
程とを有し、前記判定工程は、前記下地判定工程及び文
字写真判定工程からの判定結果に応じて、画像の属性が
文字、写真、下地のいずれであるかを判定することを特
徴とする請求項7記載の画像処理方法。 - 【請求項9】 複数画素の入力多値画像データを加算
し、合計値を算出する合計値算出手段と、 前記合計値を黒画素の出力画素値で除算し黒画素数を算
出する黒画素数算出手段と、 前記入力多値画像データからヒストグラムを作成するヒ
ストグラム作成手段と、 前記ヒストグラム作成手段で作成されたヒストグラムの
度数を加算する加算手段と、 前記加算手段からの加算値と前記黒画素数算出手段から
の黒画素数を比較する比較手段と、 前記比較手段の比較結果に基づき2値化閾値を決定する
決定手段とを有することを特徴とする画像処理装置。 - 【請求項10】 前記決定手段は、前記加算値が前記黒
画素数を越えた時のヒストグラムのレベルを2値化閾値
とすることを特徴とする請求項9記載の画像処理装置。 - 【請求項11】 画像を複数画素からなるブロックに分
割する分割手段を有し、前記合計値算出手段は、前記ブ
ロック内の画素の多値画像データを加算し、合計値を算
出することを特徴とする請求項9記載の画像処理装置。 - 【請求項12】 前期ヒストグラム作成手段は前記ブロ
ック内の画素の画像データからヒストグラムを作成する
ことを特徴とする請求項11記載の画像処理装置。 - 【請求項13】 前記ブロック毎の閾値からの画素毎の
閾値を算出するスムージング手段と、前記スムージング
手段からの閾値で画素毎に2値化を行う2値化手段とを
有することを特徴とする請求項11記載の画像処理装
置。 - 【請求項14】 複数画素の入力多値画像データを加算
し、合計値を算出する合計値算出工程と、 前記合計値を黒画素の出力画素値で除算し黒画素数を算
出する黒画素数算出工程と、 前記入力多値画像データからヒストグラムを作成するヒ
ストグラム作成工程と、 前記ヒストグラム作成工程で作成されたヒストグラムの
度数を加算する加算工程と、 前記加算工程からの加算値と前記黒画素数算出工程から
の黒画素数を比較する比較工程と、 前記比較工程の比較結果に基づき2値化閾値を決定する
決定工程とを有することを特徴とする画像処理方法。 - 【請求項15】 前記決定工程は、前記加算値が前記黒
画素数を越えた時のヒストグラムのレベルを2値化閾値
とすることを特徴とする請求項14記載の画像処理方
法。 - 【請求項16】 画像を複数画素からなるブロックに分
割する分割工程を有し、前記合計値算出工程は、前記ブ
ロック内の画素の多値画像データを加算し、合計値を算
出することを特徴とする請求項14記載の画像処理方
法。 - 【請求項17】 前期ヒストグラム作成工程は前記ブロ
ック内の画素の画像データからヒストグラムを作成する
ことを特徴とする請求項16記載の画像処理方法。 - 【請求項18】 前記ブロック毎の閾値から画素毎の閾
値を算出するスムージング工程と、前記スムージング工
程からの閾値で画素毎に2値化を行う2値化工程とを有
することを特徴とする請求項16記載の画像処理方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP8042847A JPH09238253A (ja) | 1996-02-29 | 1996-02-29 | 画像処理装置及びその方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP8042847A JPH09238253A (ja) | 1996-02-29 | 1996-02-29 | 画像処理装置及びその方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH09238253A true JPH09238253A (ja) | 1997-09-09 |
Family
ID=12647404
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP8042847A Withdrawn JPH09238253A (ja) | 1996-02-29 | 1996-02-29 | 画像処理装置及びその方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH09238253A (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6853755B2 (en) | 2001-03-28 | 2005-02-08 | Sharp Laboratories Of America, Inc. | Method and apparatus for adaptive compression of scanned documents |
JP2010232795A (ja) * | 2009-03-26 | 2010-10-14 | Seiko Epson Corp | 階調数低減装置、階調数低減方法 |
JP2014121016A (ja) * | 2012-12-18 | 2014-06-30 | Canon Inc | 画像処理装置および画像処理方法 |
-
1996
- 1996-02-29 JP JP8042847A patent/JPH09238253A/ja not_active Withdrawn
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6853755B2 (en) | 2001-03-28 | 2005-02-08 | Sharp Laboratories Of America, Inc. | Method and apparatus for adaptive compression of scanned documents |
JP2010232795A (ja) * | 2009-03-26 | 2010-10-14 | Seiko Epson Corp | 階調数低減装置、階調数低減方法 |
JP2014121016A (ja) * | 2012-12-18 | 2014-06-30 | Canon Inc | 画像処理装置および画像処理方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4219542B2 (ja) | 画像処理装置、画像処理方法および画像処理プログラムが格納された記録媒体 | |
US6999619B2 (en) | Processing for accurate reproduction of symbols and other high-frequency areas in a color image | |
US6587115B2 (en) | Method of an apparatus for distinguishing type of pixel | |
US8384964B2 (en) | Image processing apparatus and image processing method | |
JP4257202B2 (ja) | 画像ブロック内のエッジを検出する装置 | |
JP2008099149A (ja) | 画像処理装置、画像処理方法および画像処理プログラム | |
JP3335830B2 (ja) | 画像処理装置 | |
JP3868654B2 (ja) | 画像処理装置 | |
US20010021034A1 (en) | Image processing apparatus and method | |
JPH09238253A (ja) | 画像処理装置及びその方法 | |
JP2000013596A (ja) | 画像処理装置および方法ならびに画像処理プログラムを記録した記録媒体 | |
JP3100383B2 (ja) | 文字領域分離方法および装置 | |
JP3142279B2 (ja) | 網点領域分離装置 | |
JP3495841B2 (ja) | 画像処理装置及びその方法及びそのコンピュータプログラム製品 | |
JP2000013612A (ja) | 画像処理装置および方法ならびに画像処理プログラムを記録した記録媒体 | |
US8988732B2 (en) | Image processing apparatus and image processing method | |
JP2000276581A (ja) | 画像処理装置および画像処理方法ならびに画像処理プログラムを記録した記録媒体 | |
JP3966448B2 (ja) | 画像処理装置、画像処理方法、該方法を実行するプログラムおよび該プログラムを記録した記録媒体 | |
JP3183787B2 (ja) | 網点領域判定装置 | |
JP3045555B2 (ja) | 多階調画像情報の2値化処理方法 | |
JP7377435B2 (ja) | 画像処理装置 | |
JP2702133B2 (ja) | 画像処理方法 | |
JPH05128306A (ja) | 文章画像の属性判別方法 | |
JP3605773B2 (ja) | 画像領域判別装置 | |
JP3691175B2 (ja) | 画像処理方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A300 | Application deemed to be withdrawn because no request for examination was validly filed |
Free format text: JAPANESE INTERMEDIATE CODE: A300 Effective date: 20030506 |