JP2001251507A - 画像処理装置 - Google Patents

画像処理装置

Info

Publication number
JP2001251507A
JP2001251507A JP2000059341A JP2000059341A JP2001251507A JP 2001251507 A JP2001251507 A JP 2001251507A JP 2000059341 A JP2000059341 A JP 2000059341A JP 2000059341 A JP2000059341 A JP 2000059341A JP 2001251507 A JP2001251507 A JP 2001251507A
Authority
JP
Japan
Prior art keywords
density
image
peak
low
read
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2000059341A
Other languages
English (en)
Inventor
Nobuyasu Yamaguchi
伸康 山口
Hirotaka Chiba
広隆 千葉
Tsuguo Noda
嗣男 野田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2000059341A priority Critical patent/JP2001251507A/ja
Priority to US09/796,743 priority patent/US7298896B2/en
Publication of JP2001251507A publication Critical patent/JP2001251507A/ja
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/40Picture signal circuits
    • H04N1/40062Discrimination between different image types, e.g. two-tone, continuous tone
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/16Image preprocessing
    • G06V30/162Quantising the image signal
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Abstract

(57)【要約】 【目的】本発明は、イメージスキャナなどの画像処理装
置に関するものであり、画像種別に対応した正しい二値
化処理の実現を目的とする。 【構成】読み取られたデータに基づいて、濃度値のヒス
トグラムを生成する。そして、白黒ピーク値のレベルと
その頻度を求め、これらの関係に基づいて読み取られた
画像の種別を判別する。原稿種別が判別されたら、その
種別に適した二値化閾値の算出方法を決定し、閾値を算
出して画像の二値化処理を行う。

Description

【発明の詳細な説明】
【0001】
【発明が属する技術分野】本発明は、イメージスキャナ
やファクシミリなどの、画像処理装置に関するものであ
る。より具体的には、媒体上に記録された画像を光学的
に読み取って電気信号に変換し、情報をデジタル化して
表示・伝送を行うための画像処理装置に関する。
【0002】
【従来の技術】従来の画像読取装置では、入力する多値
画像データを閾値レベルと比較して、二値化する処理が
広く行われている。そして、二値化処理を実行するため
の様々な技術が知られている。
【0003】図13は、従来の画像読取装置の構成を示
す図面である。画像読取装置では、画像読取部に備えら
れたセンサ部を用いて、画像の読取が行われる。原稿の
読取に応じてセンサ部から出力されるアナログ信号は、
アナログ−デジタル変換部(A/D変換部)にてデジタ
ル信号に変換される。A/D変換部から出力されたデジ
タル信号(1読取ライン分)は、ラインデータ保持部に
一旦保持される。
【0004】また、A/D変換部から出力されたデジタ
ル信号は、濃度ヒストグラム生成部に転送される。濃度
ヒストグラム生成部は、読取された画像の画素毎の濃度
のヒストグラムを生成するものである。
【0005】図14は、濃度ヒストグラム部の動作を説
明するための図面である。図示左側は、センサ部により
読み取られた生の画像データを示している。図14左側
の図面のように読み取られた画像データは濃度ヒストグ
ラム部に転送され、これに基づいて図示右側のような分
布を示す濃度ヒストグラムが生成される。
【0006】従来の装置では、この濃度ヒストグラムを
用いて、画像を二値化するための閾値レベルを生成して
いた。濃度ヒストグラム情報は閾値生成部に転送され、
閾値が生成される。具体的な一例を上げると、 閾値=0.5×(白ピーク値−黒ピーク値)+黒ピーク
値 で算出される。ここで、黒ピーク値は文字部分の濃度ピ
ーク値を、白ピーク値は原稿の下地である白の部分の濃
度ピーク値を、それぞれ示すと考えられる。そこで、上
記従来例では高濃度ピークレベルと低濃度ピークレベル
の中間レベル(つまり1/2)を二値化閾値の基準値と
して設定していた。
【0007】また、図15はその他の従来例による閾値
生成を行う画像読取装置の構成を示す図である。図15
の装置と同様にA/D変換部から出力されたデジタル信
号は、シェーディング補正部に入力する。その後、図1
3の装置と同様にして閾値レベルが生成される。ただ
し、図15の例では低濃度/高濃度ピークの頻度を加味
して二値化閾値を設定している。具体的には、 最低最高濃度比率=最高濃度ピーク値/(最高濃度ピー
ク値+最低濃度ピーク値)閾値=最低最高濃度比率×
(最高濃度ピーク値−最低濃度ピーク値)+最低濃度ピ
ーク値 で算出される。
【0008】
【発明が解決しようとする課題】図13、図14の例で
は、例えば二次元コードのように黒い部分と白い部分と
の頻度の割合が大きく偏るようなものを読み取った場
合、各ピーク値の1/2の値に閾値を設定しても、2次
元コード情報が太ったり細ったりしてしまい、本来の原
稿の白黒幅を忠実に再現する二値化を行うことができな
いといった問題が生じる。
【0009】一方、図15、16の例は図13、14の
例の問題点をある程度は解消することができる。しか
し、原稿の種類のよっては黒い部分と白い部分の頻度の
割合が原稿の特性を忠実に表現していない場合もある。
そのため却って原稿本来の情報を忠実に再現する二値化
が行われないという問題が生じていた。
【0010】本発明は、このような問題点に鑑み、安定
した原稿の二値化を行うことができる画像入力装置を実
現することを目的とする。
【0011】
【課題を解決するための手段】本発明は、読み取られた
画像データの濃度ヒストグラムを生成するヒストグラム
生成手段と、濃度ヒストグラムに基づいて低濃度側のピ
ークレベルと高濃度側のピークレベルを求めるととも
に、低濃度ピークの頻度と高濃度ピークの頻度とを求め
る手段と、低濃度ピーク頻度と高濃度ピーク頻度とを対
比した結果に基づいて読み取られた画像種別を判別する
画像種別判別手段と、画像種別に対応した方法により濃
度ヒストグラムに基づき画像データを量子化する閾値レ
ベルを生成する閾値レベル生成手段と、を備えた画像処
理装置であることを特徴とする。
【0012】このような画像処理装置を用いることによ
り、読取画像に対応した閾値レベルを設定することがで
き、且つより正しい二値化処理を実行することができ
る。
【0013】特に、本発明では以前の画像読取によって
得られたピークレベルやピーク頻度を格納しておき、格
納された低濃度ピークあるいは高濃度ピークに関する情
報を用いて閾値レベルを生成する。
【0014】また、本発明は、以前の画像読取によって
得られたピークレベルやピーク頻度を格納し、今回のピ
ーク情報と格納されたピーク情報とを比較して原稿種別
を判断し、判断結果に基づいて閾値レベルを生成するこ
とを特徴としている。
【0015】また、本発明は、二値化された二値化デー
タを複数の領域に分割する手段と、分割された各領域に
ついて高濃度画素数と低濃度画素数との比率を求める手
段と、高濃度/低濃度画素数比に基づいて当該領域内の
二値画像データの種類を判別する手段と、を備えた画像
処理装置であることを特徴とする。
【0016】特に、本発明は、1ライン分の画像データ
から得られた行方向の画素濃度分布と、行毎の低濃度/
高濃度画素数率とに基づいて領域を分割し、分割された
各領域毎の画像データの種類を判別する。
【0017】
【発明の実施の形態】図1は、本発明の一実施形態によ
る画像入力装置の構成を説明する図面である。本実施形
態による画像入力装置は、図13に図示された画像入力
装置に「画像種類判別部」を加えた構成となっている。
【0018】ここで、入力した画像データの濃度は、用
紙の下地の濃度(最高濃度)と文字部分の濃度(最低濃
度)との近傍及びその間に分布する。一般に二色刷りの
テキスト原稿を読み取る場合、下地部分の中に文字部分
が一定の割合で存在しており、濃度分布ヒストグラムを
見ると下地の濃度近傍と文字の濃度近傍との2つのピー
クが存在する。ここで、テキスト原稿の場合、下地部分
に対して文字(インク)部分の面積の割合が小さいた
め、下地の濃度ピークの頻度の方が文字の濃度ピークの
頻度よりも大きくなる。また、文字と下地の境界部は、
読取装置の光学特性と下地の濃度の影響を受けて、濃度
分布がなだらかになる。そのため、濃度ヒストグラム分
布ではピーク濃度レベル間にある特性を持ちながら分布
することになる。
【0019】この特性は、原稿の種類、すなわち下地と
文字部分の面積割合や文字の線の太さなどによって特徴
的に異なっている。このため、二値化処理に際して原稿
の文字の太さを忠実に再現するためには、濃度ヒストグ
ラム分布の特徴に合わせた最適閾値レベルを決定する必
要がある。また、濃度ピークの大小は基本的には原稿の
下地と文字部分の面積割合に対応するが、文字の線の太
さや、文字ではないある種の模様やデータ形式(各種コ
ードなど)といった原稿の特徴にも大きく影響される。
更に、濃度ピークレベル自体もこれら原稿の特徴によっ
て本来のインクの濃度からずれてしまうこともある。そ
のため、原稿の特徴によるこれらの濃度分布の特性にあ
った閾値レベル決定方法を用いる必要がある。
【0020】逆に言えば、濃度ピークの大小や濃度レベ
ルの違いといった濃度ヒストグラムの特性から、原稿の
特徴、つまり原稿に印刷してあるテキストやデータ形式
の種類を判別することも可能となる。
【0021】また、文字のエッジ部分の濃度分布の特性
によって、適している二値化閾値の決定の方法は異なっ
ている。このため、原稿の文字の太さを忠実に再現する
ためには、濃度ヒストグラム分布における最低濃度と最
高濃度の割合に応じて判断された原稿種類に対応する最
適な二値化閾値を選択し、その上で二値化の処理を行え
ば良い。これにより、原稿の特性に応じた文字の太さを
忠実に反映した正しい二値化を行うことができる。
【0022】上記した「画像種類判別部」は、このよう
に入力した濃度ヒストグラムに基づいて、入力画像の種
類を判別するものである。判別された入力画像の種別に
関する情報は閾値生成部に転送される。閾値生成部で
は、画像種類判別部からの画像種類を示す情報に基づい
て、閾値決定の方法を画像種類に最も適したものに選択
する。
【0023】図2は、図1に図示された画像入力装置を
用いた二値化閾値算出の手順を説明するフローチャート
である。
【0024】画像の入力が開始されると、まず画像入力
装置では1ライン分のラインデータ読取を行う。そし
て、入力された1ライン分のラインデータは、ラインデ
ータ保持部に一時的に保存される。続いて、入力された
ラインデータ中の画素毎の濃度値に基づいて、当該ライ
ンの濃度ヒストグラムが濃度ヒストグラム生成部で生成
される。
【0025】次に、濃度ヒストグラム生成部では、ライ
ンデータ中の白黒ピークレベルを算出するとともに、白
黒ピークのそれぞれの頻度を算出する。
【0026】続いて、画像種類判別部では、濃度ヒスト
グラム生成部により算出された白黒ピークレベルと白黒
ピーク頻度から、読取対象原稿の種類を判別する。そし
て、原稿判別がなされた後、その結果が閾値生成部に転
送され、画像に最適な閾値算出方法が決定された後に閾
値が算出される。
【0027】なお、ラインデータが全て黒、あるいは全
て白であるような場合には、白ピーク値・黒ピーク値の
いずれかを求めることができない。このような場合に
は、原稿種類を判別することなく、求めることができな
い側のピーク値を予め準備した最大濃度の最大値(25
5)や最小濃度の最小値(0)と仮定して、以降の処理
を行うことになる。
【0028】図3は、具体的な原稿種類判別と最適閾値
決定方法に関して説明するための図面である。
【0029】読取原稿としては、通常のテキスト原稿
と、白黒濃度比がほぼ50:50となる特徴を有する画
像の2種類を想定する。なお、下地とインクとは全く同
一のものであるとする。
【0030】通常のテキストを読み取った場合には、下
地の白領域に対して文字の黒領域が占める割合が低いた
め、白黒ピークの頻度を比較すると、白ピーク頻度>黒
ピーク頻度となる。一方、白黒比率が1:1の原稿で
は、黒濃度領域の影響と読取装置の光学的な特性から、
読み取られた画像データでは、白ピーク頻度<黒ピーク
頻度となる。
【0031】また、白黒比率が50:50の画像データ
が記録された原稿では、白ピークレベルが本来の白濃度
(原稿の地色)よりも黒濃度側にだれたようなあ、ある
いはシフトしたような傾向を見せる。その結果、濃度ヒ
ストグラム分布の上では、テキスト白ピークレベル>画
像白ピークレベルという特徴が現れる。
【0032】このような特徴を踏まえ、白黒ピーク頻度
の大小関係から入力データを測定した領域がテキスト領
域か画像データかを判別することが可能となる。
【0033】図3に図示される通り、同じインクを用い
ているとするならば、黒ピークレベルはテキストの場合
も画像データの場合もほぼ同じレベルとなる。ただし、
記録されている原稿の種類によって、黒ピーク値の出現
頻度は異なっており、画像データの黒ピーク値の頻度の
方がテキスト原稿の黒ピーク値の頻度よりも高い。ま
た、テキストと画像データとの白レベルピークを比較す
ると、テキストの白ピーク値と比較して、画像データの
白ピーク値の方はより黒側にシフトしている。なお、図
3には比較例として、用紙の下地のみを読み取らせた例
が図示されている。このように用紙の下地のみを読み取
らせた場合には、白ピーク値はテキストの場合と比較し
て、更に図示右側にシフトしている。
【0034】読取画像がテキストの場合、検出された黒
ピーク値と白ピーク値との中間値、つまり50:50と
なるレベルを最適な二値化閾値レベルとして決定する。
これは、通常のテキストの場合には、白黒ピークレベル
を50:50で分割したレベルが最適な閾値レベルであ
ることが知られているためである。一方、読取画像が画
像データの場合、図3の例では黒ピーク値と白ピーク値
とが35:65の割合となるレベルを最適閾値レベルと
している。画像データの閾値を決定するための割合は、
実験的に求められたものであるが、画像種別や条件によ
っては上記の比率が変わる可能性もある。
【0035】図4は、その他の閾値決定方法を説明する
ための図面であり、図3に示された白黒比率が50:5
0となる画像データに関する閾値決定の方法を説明する
ものである。
【0036】上記した通り、白黒比率が50:50であ
ることが予め判っているような原稿を読み取る場合に
は、二値化画像の白黒画素比が50:50となるレベル
に閾値レベルを設定すると、より原稿の特徴に適した、
正しい二値化を行うことが期待できる。そこで、図4の
例では濃度ヒストグラムの各濃度毎の画素数(=頻度)
を求め、黒側画素数と白側画素数との比が一定(図4で
は原稿の特徴に対応させて画素数が同一)となるレベル
を閾値レベルとして決定している。これにより、二値化
後に黒となる画素の数と、白となる画素の数とを50:
50あるいはそれに近い値にすることが可能となり、画
像の特徴に適した二値化が可能となる。
【0037】図5は、濃度ヒストグラム分布から求めら
れる原稿種類に対する最適閾値レベルの他に、類推可能
な他の原稿種類に対する最適閾値レベルを決定する方法
を用いた例を説明するための図面である。
【0038】読取原稿の中には、1枚の紙面上に同一の
インクを用いて印刷した通常テキストと、上記のような
白黒画素比が50:50となる画像データとが混在して
いるものがある。このような原稿を、画像データ部分を
有効利用する目的で読み取ろうとした場合、画像データ
に適した閾値レベルを設定する必要がある。しかし、濃
度ヒストグラム用のデータをこの原稿の通常テキストが
印刷された領域で取得した場合、濃度ヒストグラム分布
は白ピーク頻度>黒ピーク頻度となっているため、画像
入力装置は読み取られた画像が通常テキストであると判
別し、白黒ピークレベル間を50:50で分割したレベ
ルを最適閾値レベルとして決定することになる。このま
まの状態で読取を行うと、本来有効利用しようとしてい
た画像データ領域では、記録された原稿の状態に最適な
二値化処理が行われない。
【0039】ここで、通常テキストと画像データとが図
3に示すような濃度ヒストグラム分布を有することが予
め判っていたとする。すなわち、画像データの白ピーク
レベルが通常テキストの白ピークレベルより常に特定の
割合で小さくなる一方、黒ピークレベルは両者で変化が
ないことが判っていれば、テキストの白ピークレベルか
ら画像の白ピークレベルを類推した上で、この類推した
白ピークレベルと実測した黒ピークレベル間を例えば3
5:65の割合で分割したレベルを画像データの最適閾
値レベルとして類推することが可能となる。図6は、そ
の他の実施形態による画像入力装置の構成を示す図面で
ある。なお、画像入力部については図示省略している。
【0040】A/D変換部から入力したデジタル画像信
号は、ラインデータ保持部に一旦保持される。そして、
ラインデータは濃度ヒストグラム生成部に転送されて濃
度ヒストグラムが生成された後、閾値生成部と画像種類
判別部に転送される。
【0041】画像種類判別部では、濃度ヒストグラム分
布に基づいて入力画像の種類を判別し、その結果を閾値
生成部に転送する。閾値生成部では、濃度ヒストグラム
分布と判別された画像種類とに基づいて閾値レベルを決
定、二値化部では閾値生成部により生成された閾値レベ
ルに基づいて、ラインデータ保持部に保持された画像デ
ータを画素毎に二値化していく。
【0042】図6に図示された画像入力装置では、測定
データ格納部が設けられてる。測定データ格納部は、以
前の読取操作時に得られた測定データなどを保存するも
のであり、より具体的には測定データ、濃度ヒストグラ
ム分布により算出されたピークレベルやピーク頻度、画
像種類、算出された閾値レベルなどを格納している。画
像の読取を行う際に、画像種類判別部での画像種類の判
別、あるいは閾値生成部での閾値レベル決定時に、測定
データ格納部に格納されている各種の情報を参照して、
画像種類の判別あるいは閾値生成を行う。
【0043】図7は、図6に図示された装置を用いた処
理を説明するための図面である。図において、実線は実
際に測定されたデータを、点線は測定データ格納部に格
納された保存データをそれぞれ示す。
【0044】図7の実線は、通常テキスト原稿の下地領
域のみを測定した結果得られた濃度ヒストグラムを示
す。この場合、測定されたデータには下地の部分に該当
する白ピークは存在するものの、通常テキストのインク
濃度に相当する黒ピークレベルが存在していない。その
ため、閾値を決定するために必要なデータが得られてい
ないことになる。この際に、検出されていない黒ピーク
レベルの代わりに、黒ピークレベルを「0」と仮定して
閾値レベルを決定することも可能である。
【0045】ただし、図3に図示される通り、実際に得
られる黒ピーク値は「0」ではないため、黒ピークレベ
ルを「0」と仮定して閾値レベルを得たとしても、これ
は実際の原稿の状態に応じた閾値レベルではない。そし
て、この閾値を用いて原稿を二値化したとしても、実際
の原稿と二値化された原稿との間の誤差が大きくなって
しまうことが予想される。また、一方のピークしか得ら
れないため、原稿種類の判別を行うことができず、読み
取られている原稿に最も適している閾値レベルを決定す
るための方法を選択することもできない。
【0046】そこで、本実施形態では、このように一方
のピークを得ることができない場合に、測定データ格納
部に保存している前回の読取時の濃度ヒストグラム分布
から得られた白黒ピークレベル情報と原稿種類情報とを
参照する。図7点線は、測定データ格納部から読み出さ
れた保存データを示している。図に図示される通り、測
定データ格納部に格納された保存データには、黒ピーク
値が存在している。従って、閾値レベルを決定するに当
たっては、読み出された保存データ中の黒ピーク値を利
用することができる。
【0047】その一方、実測の白ピークと保存データ中
の白ピークとを比較すると、両者のピークレベルはそれ
ほど値が変わらない。また、前回読取データ中には文字
が含まれており、今回読取データについては文字は含ま
れていない、という事情を考慮するのであれば、図7で
存在しているピークのレベル差は図3に図示されている
ような、黒濃度領域の影響がでたものと考えることもで
きる。従って、今回読み取った原稿と前回読み取られた
原稿とは下地が同じものである、と推測することができ
る。
【0048】そこで、図7の例では、今回測定された白
ピークレベルと、保存データの黒ピークレベルとを用い
て、最適閾値の決定を行う。これによって、測定された
データに一方のピーク値が存在しない場合であっても、
黒ピークレベルを「0」として閾値レベルを決定する場
合より、より誤差の少ない閾値レベルの決定・二値化処
理を行うことができる。
【0049】具体的にはまず、前回の保存データの白ピ
ークレベルと今回測定データの白ピークレベルとを比較
する。双方のレベル差がある範囲内であった場合には、
前回と今回の読取原稿の下地の色は同じであった可能性
が高い。そこで、前回と今回の読込原稿は同じ種類のも
のであると仮定し、保存データの黒ピークレベルと測定
データの白ピークレベルとを用いて、前回の保存データ
の原稿種類判別結果に適した最適閾値レベルの算出方法
に従って、閾値レベルを決定する。図7の例では、今回
得られた白ピークレベルと、前回得られた黒ピークレベ
ルとが50:50となるレベルを閾値レベルとして決定
している。
【0050】図8は、更にその他の画像入力装置の構成
を示す図面である。なお、図8では画像入力部や画像処
理部は図示省略している。
【0051】図8に図示された装置は、分割領域抽出部
を備えている。これは、受信した二値化画像データを、
以後の処理を行う処理単位となる小領域単位に分割抽出
するものである。分割領域抽出部は、白黒画素率算出部
に接続される。白黒画素率算出部は、読み取られた原稿
の行ごとに白黒画素率を算出する。分割領域抽出部は、
求められた行ごとの白黒画素率に基づいて、原稿を小領
域単位に分割する。
【0052】画素率データ保存部は、読取処理に従った
時系列的に前後の領域の白黒画素率データを保存するも
のである。また、二値画像種類判別部は、白黒画素率デ
ータに基づいて、注目した小領域の原稿上の画像の種類
を判別するものである。そして、判別結果格納部は、二
値画像種類判別部により判別された判別結果を格納する
ものである。
【0053】図9は、二値画像データから画像種類を判
別する例を説明する図面である。画像読取部としては、
手動走査されるハンドスキャナが用いられている。ま
た、読み取られる原稿は画像データ1領域、テキスト領
域、画像データ2領域の3つの領域に分割される。
【0054】ここで、小領域は、ハンドスキャナの走査
に従って時系列的に入力される1ラインデータを用いて
分割抽出される。この原稿を通常テキストに適した閾値
レベルによって二値化した際のライン毎の黒画素率が、
図10に図示される。
【0055】図10に図示されるように、通常テキスト
の領域では1ライン当りの黒画素率は40%以下であ
り、テキストの行の並びに応じて黒画素率が大きく変化
している。一方、画像データ領域1、2はそれぞれ、黒
画素率が50%を超えており、ライン間での黒画素率に
は大きな増減がない。
【0056】このような黒画素率の特徴を逆に利用する
ことによって、黒画素率の値とその変化の仕方を見るこ
とにより、原稿上の領域がテキスト領域であるのか、あ
るいは画像データ領域であるのかを判別することができ
るようになる。そして、領域毎に、判別された原稿種別
に対応した閾値レベルを生成して、二値化処理を実行す
る。
【0057】なお、画像データ1領域および画像データ
2領域の黒画素率は、画像データに適した閾値レベルを
用いて二値化した際には50%前後となる。しかし、図
10の例では通常テキストに適した閾値レベル値を用い
ているため、黒画素率が50%よりも大きくなってい
る。逆に、図10に図示されるような判別結果を利用し
て、画像読取部が画像データ領域にある場合にはそれに
適した閾値レベルを、また通常テキスト領域にある場合
には通常テキストに適した閾値レベルを、それぞれ選択
できるようにすることで、より正しい二値画像を得るこ
とができる。
【0058】図11は、二値画像データから画像種類を
判別するためのその他の方法を説明する図面であり、こ
こでは小領域の二次元的な配置を判別可能としている。
図11の例では、副走査方向のみならず、主走査方向
(図示画像読取部の延長方向)についても領域を分割
し、これらの領域内の黒画素率を判別して、これに基づ
いて原稿種類を判断している。
【0059】先に説明した様に、通常テキストの領域で
は黒画素率が40%以下で、テキストの行の並びに応じ
て大きく増減する。一方、画像データ1領域、画像デー
タ2領域のそれぞれについては、黒画素率は常に50%
以上あり、且つライン間の大きな増減はない。
【0060】ただし、図11に図示されたような原稿で
は、1ライン中にテキスト領域と画像領域とが混在して
いる。このような原稿で、図9、図10にて説明したよ
うな処理を行った場合、正しい二値化処理を実行できな
い可能性がある。
【0061】そこで、図11の実施形態では、1ライン
を複数の領域に分割し、分割された領域毎に、ライン毎
の黒画素率を判別し、これに基づいて二次元的な画像/
テキストの配置を判別できるようにしている。更に、各
分割領域の判定結果から、各画像データの原稿上での二
次元的な配置を判断する。
【0062】図8との装置では、白黒画素率算出部が、
上記した分割領域(図11に図示された分割領域1乃至
分割領域3)毎に白黒画素率を算出するように動作す
る。
【0063】なお、図11の例では、原稿を縦方向に3
分割している。この分割の仕方は適宜決定することがで
き、より正確に画像/テキストの配置の状況を判断した
ければ、分割する領域の数を増やせば良い。ただし、分
割する領域の数を多くし過ぎると、領域毎の画像種類判
別の処理が煩雑となり、能力の低い装置では処理に非常
に時間を要する可能性もでてくるため、領域の分割数は
適当な値が選択されることとなる。
【0064】図12は、図11のように3分割された原
稿の各領域の、ライン毎の黒画素率の様子を図示した図
面である。
【0065】図12に図示されるように、分割領域1及
び分割領域2とのL0行〜L1行の間の領域と、分割領
域2及び3のL1行〜L2行の間の領域とは、黒画素率
が50%を超えており、値の変化の幅が小さいため、こ
れらの領域は画像データ領域であると判断できる。
【0066】また、この他の領域では黒画素率が概ね4
0%以下であり、しかも行ごとの値の変化幅が非常に大
きい。そのため、これらの領域ではテキスト領域である
と判断できる。
【0067】以上のように、本実施形態では各画像デー
タの原稿上の二次元的な配置も判断することができ、よ
り確実に原稿種類に応じた閾値決定・二値化処理を行う
ことができる。
【0068】
【発明の効果】以上説明した通り、本発明によれば、濃
度ヒストグラムに基づいて下地を示す最高濃度と文字/
インク部分を示す最低濃度及びこれらの頻度を求め、こ
れに基づいて読取を行っている原稿種別を判別すること
ができる。そして、判別された原稿種別に対応した閾値
レベルを生成しているため、読取原稿に最も適した閾値
での二値化を行うことができ、より正しく二値化を行う
ことができる。
【0069】更に、本発明によれば、二値化画像の白黒
画素率から原稿種類を判別することが可能となる。
【0070】また、一つの原稿上に複数の異なる種類の
画像データが存在する場合でも、二値化処理を行ってい
る途中で読取中の原稿種別を判別でき、その都度最適な
閾値レベルを設定することができるため、正しい二値化
を行う事が可能となる。
【図面の簡単な説明】
【図1】本発明の一実施形態による画像入力装置を示す
図。
【図2】一実施形態による二値化閾値算出手順を示すフ
ローチャート。
【図3】濃度ヒストグラムと閾値決定を示す図面。
【図4】その他の濃度ヒストグラムと閾値決定を示す図
面。
【図5】実測データに基づいて閾値を類推する方法を説
明する図面。
【図6】本発明のその他の実施形態による画像入力装置
を示す図。
【図7】保存された測定データに基づく最適閾値決定を
説明する図面。
【図8】更にその他の本発明の実施形態による画像入力
装置を示す図。
【図9】画像データ領域とテキスト領域とに分割できる
原稿の読取を説明する図。
【図10】図10による読取の結果得られた画像データ
のライン毎の黒画素率の様子を示す図。
【図11】画像データ領域とテキスト領域とに分割でき
る原稿のその他の読取例を説明する図。
【図12】各分割領域におけるライン毎の黒画素率の様
子を示す図。
【図13】従来の画像入力装置を説明する図。
【図14】従来の閾値決定・二値化処理を説明する図。
【図15】その他の従来の画像入力装置を説明する図。
【図16】その他の従来例の閾値決定を説明する図。
───────────────────────────────────────────────────── フロントページの続き (72)発明者 野田 嗣男 神奈川県川崎市中原区上小田中4丁目1番 1号 富士通株式会社内 Fターム(参考) 5B047 AA01 AB01 DB01 DB06 DC04 5B057 AA11 BA24 BA30 CA02 CA08 CA16 CB02 CB06 CC03 CE12 CH11 DA08 DB09 DC23 5C077 LL19 MM18 MP05 PP27 PP28 PQ19 PQ20 PQ22 RR01 RR02 RR15 RR16 SS01

Claims (5)

    【特許請求の範囲】
  1. 【請求項1】媒体上に記録された画像を読み取る画像読
    取部からの画像データに基づいて、濃度値の分布を表す
    濃度ヒストグラムを生成するヒストグラム生成手段と、 前記生成された濃度ヒストグラムに基づいて、低濃度側
    のピークレベルと高濃度側のピークレベルを求めるとと
    もに、低濃度ピークの頻度と高濃度ピークの頻度とを求
    める手段と、 前記求められた低濃度ピーク頻度と高濃度ピーク頻度と
    を対比して、その結果に基づいて読み取られた画像種別
    を判別する画像種別判別手段と、 前記判別された画像種別に対応した方法により、前記濃
    度ヒストグラムに基づいて前記画像データを量子化する
    閾値レベルを生成する閾値レベル生成手段と、を備えた
    ことを特徴とする、画像処理装置。
  2. 【請求項2】前記画像処理装置において、 以前の画像読取によって得られた高濃度ピークレベル、
    高濃度ピーク頻度、低濃度ピークレベル、低濃度ピーク
    頻度の少なくともいずれかを格納する格納手段を備え、 今回読取された画像中に低濃度ピークあるいは高濃度ピ
    ークが存在しなかった場合、前記格納手段に格納された
    低濃度ピークあるいは高濃度ピークに関する情報を前記
    格納手段から読み出し、読み出された情報を用いて閾値
    レベルを生成することを特徴とする、請求項1記載の画
    像処理装置。
  3. 【請求項3】前記画像処理装置において、 以前の画像読取によって得られた高濃度ピークレベル、
    高濃度ピーク頻度、低濃度ピークレベル、低濃度ピーク
    頻度の少なくともいずれかを格納する格納手段と、 今回読取された低濃度/高濃度ピーク情報と、前記格納
    手段に格納された低濃度/高濃度ピーク情報とを比較
    し、比較結果に基づいて今回読取された原稿と以前読取
    された原稿とが同等のものであるか否かを判別する手段
    と、を備え、 前記判別結果に基づいて閾値レベルの生成を行うことを
    特徴とする、請求項1記載の画像処理装置。
  4. 【請求項4】媒体上から読み取られ、二値化された二値
    化データの行ごとの高濃度画素数あるいは低濃度画素数
    の比率を求める画素率算出手段と、 前記求められた高濃度/低濃度画素数比に基づいて、読
    み取られた原稿を複数の領域に分割する領域抽出手段
    と、 前記領域抽出手段により分割された領域毎に、前記画素
    数比に基づいて当該領域の原稿種別を判別する画像種類
    判別手段と、 を備えたことを特徴とする、画像処理装置。
  5. 【請求項5】前記画像処理装置において、 前記画素率算出手段は、1ライン分を複数に分割した各
    領域毎に、行ごとの高濃度画素数と低濃度画素数との比
    率を求め、 前記画像種類判別手段は、前記求められた高濃度低濃度
    画素数比に基づいて当該領域内の二値画像データの種類
    を判別するように動作することを特徴とする、請求項4
    記載の画像処理装置。
JP2000059341A 2000-03-03 2000-03-03 画像処理装置 Pending JP2001251507A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2000059341A JP2001251507A (ja) 2000-03-03 2000-03-03 画像処理装置
US09/796,743 US7298896B2 (en) 2000-03-03 2001-03-02 Image processing device for optically decoding an image recorded on a medium for digital transmission of the image information

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000059341A JP2001251507A (ja) 2000-03-03 2000-03-03 画像処理装置

Publications (1)

Publication Number Publication Date
JP2001251507A true JP2001251507A (ja) 2001-09-14

Family

ID=18579809

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000059341A Pending JP2001251507A (ja) 2000-03-03 2000-03-03 画像処理装置

Country Status (2)

Country Link
US (1) US7298896B2 (ja)
JP (1) JP2001251507A (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008252862A (ja) * 2007-03-05 2008-10-16 Ricoh Co Ltd 画像処理装置、画像処理方法及び画像処理プログラム
JP2009278363A (ja) * 2008-05-14 2009-11-26 Canon Inc 画像処理装置及び画像処理方法
US7764835B2 (en) 2003-04-15 2010-07-27 Fujitsu Limited Method and apparatus for recognizing code
KR101369394B1 (ko) * 2009-12-01 2014-03-05 후지제롯쿠스 가부시끼가이샤 화상 처리 장치, 화상 처리 프로그램을 저장하는 컴퓨터 판독 가능한 기록 매체, 및 화상 처리 방법
JP2020052731A (ja) * 2018-09-27 2020-04-02 キヤノン電子株式会社 画像処理装置、画像処理装置の制御方法、及びプログラム

Families Citing this family (33)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6643410B1 (en) * 2000-06-29 2003-11-04 Eastman Kodak Company Method of determining the extent of blocking artifacts in a digital image
US7046398B2 (en) * 2001-03-27 2006-05-16 Hewlett-Packard Development Company, L.P. Method and apparatus for dynamic adjustment of print quality
JP4278918B2 (ja) * 2002-04-19 2009-06-17 富士通株式会社 画像データ処理装置とその方法
JP2005073015A (ja) * 2003-08-26 2005-03-17 Canon Inc 画像処理装置及び画像処理方法及びコンピュータプログラム
JP4610182B2 (ja) * 2003-12-05 2011-01-12 株式会社日立ハイテクノロジーズ 走査型電子顕微鏡
US7532755B2 (en) * 2004-01-22 2009-05-12 Lexmark International, Inc. Image classification using concentration ratio
JP4621098B2 (ja) * 2005-09-14 2011-01-26 株式会社日立ハイテクノロジーズ 走査型電子顕微鏡および画像信号処理方法
FR2891382B1 (fr) * 2005-09-23 2008-04-11 Sagem Comm Procede et systeme de reproduction de documents par segmentation et amelioration selective des images et des textes
DE102006001075A1 (de) * 2006-01-09 2007-07-12 Carl Zeiss Ag Elektronische Sehhilfe und elektronisches Sehhilfeverfahren
US8014602B2 (en) * 2006-03-29 2011-09-06 Seiko Epson Corporation Backlight image determining apparatus, backlight image determining method, backlight image correction apparatus, and backlight image correction method
JP2007272622A (ja) * 2006-03-31 2007-10-18 Brother Ind Ltd 画像処理装置
US7689054B1 (en) * 2006-03-31 2010-03-30 The United States Of America As Represented By The Secretary Of The Air Force Computationally enhanced image recognition device
US7916943B2 (en) * 2006-06-02 2011-03-29 Seiko Epson Corporation Image determining apparatus, image determining method, image enhancement apparatus, and image enhancement method
US7916942B1 (en) * 2006-06-02 2011-03-29 Seiko Epson Corporation Image determining apparatus, image enhancement apparatus, backlight image enhancement apparatus, and backlight image enhancement method
JP2009239394A (ja) * 2008-03-26 2009-10-15 Seiko Epson Corp ぬりえ製造装置およびぬりえ製造方法
US20100080459A1 (en) * 2008-09-26 2010-04-01 Qualcomm Incorporated Content adaptive histogram enhancement
CN101727582B (zh) * 2008-10-22 2014-02-19 富士通株式会社 文档图像二值化方法及其装置,以及文档图像处理器
US8478053B2 (en) * 2009-07-15 2013-07-02 Nikon Corporation Image sorting apparatus
JP6031921B2 (ja) * 2012-09-28 2016-11-24 ブラザー工業株式会社 画像処理装置およびプログラム
US10582213B2 (en) 2013-10-14 2020-03-03 Microsoft Technology Licensing, Llc Features of intra block copy prediction mode for video and image coding and decoding
US10506254B2 (en) 2013-10-14 2019-12-10 Microsoft Technology Licensing, Llc Features of base color index map mode for video and image coding and decoding
WO2015054813A1 (en) 2013-10-14 2015-04-23 Microsoft Technology Licensing, Llc Encoder-side options for intra block copy prediction mode for video and image coding
US10390034B2 (en) 2014-01-03 2019-08-20 Microsoft Technology Licensing, Llc Innovations in block vector prediction and estimation of reconstructed sample values within an overlap area
EP4096221A1 (en) 2014-01-03 2022-11-30 Microsoft Technology Licensing, LLC Block vector prediction in video and image coding/decoding
US11284103B2 (en) 2014-01-17 2022-03-22 Microsoft Technology Licensing, Llc Intra block copy prediction with asymmetric partitions and encoder-side search patterns, search ranges and approaches to partitioning
US9699468B2 (en) * 2014-02-10 2017-07-04 Microsoft Technology Licensing, Llc Adaptive screen and video coding scheme
US10542274B2 (en) 2014-02-21 2020-01-21 Microsoft Technology Licensing, Llc Dictionary encoding and decoding of screen content
KR102413529B1 (ko) 2014-06-19 2022-06-24 마이크로소프트 테크놀로지 라이센싱, 엘엘씨 통합된 인트라 블록 카피 및 인터 예측 모드
WO2016049839A1 (en) 2014-09-30 2016-04-07 Microsoft Technology Licensing, Llc Rules for intra-picture prediction modes when wavefront parallel processing is enabled
CN106664405B (zh) 2015-06-09 2020-06-09 微软技术许可有限责任公司 用调色板模式对经逸出编码的像素的稳健编码/解码
JP6707825B2 (ja) * 2015-09-14 2020-06-10 富士ゼロックス株式会社 情報処理装置及びプログラム
US10986349B2 (en) 2017-12-29 2021-04-20 Microsoft Technology Licensing, Llc Constraints on locations of reference blocks for intra block copy prediction
US11776093B2 (en) * 2019-07-16 2023-10-03 University Of Florida Research Foundation, Incorporated Automatic sharpness adjustment for imaging modalities

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5280367A (en) * 1991-05-28 1994-01-18 Hewlett-Packard Company Automatic separation of text from background in scanned images of complex documents
US5179599A (en) * 1991-06-17 1993-01-12 Hewlett-Packard Company Dynamic thresholding system for documents using structural information of the documents
US5617484A (en) * 1992-09-25 1997-04-01 Olympus Optical Co., Ltd. Image binarizing apparatus
EP0807297B1 (en) * 1995-01-31 1999-09-29 United Parcel Service Of America, Inc. Method and apparatus for separating foreground from background in images containing text
JP3207067B2 (ja) * 1995-01-31 2001-09-10 株式会社東芝 画像形成装置
JPH096957A (ja) * 1995-06-23 1997-01-10 Toshiba Corp 濃度画像の2値化方法および画像2値化装置
US5751848A (en) * 1996-11-21 1998-05-12 Xerox Corporation System and method for generating and utilizing histogram data from a scanned image
JP3779400B2 (ja) * 1996-11-28 2006-05-24 株式会社東芝 画像処理方法
US6363381B1 (en) * 1998-11-03 2002-03-26 Ricoh Co., Ltd. Compressed document matching

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7764835B2 (en) 2003-04-15 2010-07-27 Fujitsu Limited Method and apparatus for recognizing code
JP2008252862A (ja) * 2007-03-05 2008-10-16 Ricoh Co Ltd 画像処理装置、画像処理方法及び画像処理プログラム
JP2009278363A (ja) * 2008-05-14 2009-11-26 Canon Inc 画像処理装置及び画像処理方法
US8384964B2 (en) 2008-05-14 2013-02-26 Canon Kabushiki Kaisha Image processing apparatus and image processing method
KR101369394B1 (ko) * 2009-12-01 2014-03-05 후지제롯쿠스 가부시끼가이샤 화상 처리 장치, 화상 처리 프로그램을 저장하는 컴퓨터 판독 가능한 기록 매체, 및 화상 처리 방법
JP2020052731A (ja) * 2018-09-27 2020-04-02 キヤノン電子株式会社 画像処理装置、画像処理装置の制御方法、及びプログラム
JP7149047B2 (ja) 2018-09-27 2022-10-06 キヤノン電子株式会社 画像処理装置、画像処理装置の制御方法、及びプログラム

Also Published As

Publication number Publication date
US7298896B2 (en) 2007-11-20
US20010036314A1 (en) 2001-11-01

Similar Documents

Publication Publication Date Title
JP2001251507A (ja) 画像処理装置
US7633650B2 (en) Apparatus and method for processing binary image produced by error diffusion according to character or line drawing detection
CN102984429B (zh) 图像处理设备和图像处理方法
US8363946B2 (en) Decoding two-dimensional code using multiple binarization thresholds
US20080137159A1 (en) Image forming apparatus and image quality improving method thereof
JP3335830B2 (ja) 画像処理装置
JPH0576223B2 (ja)
CN107800922B (zh) 图像处理装置及其控制方法和计算机可读存储介质
JP3083673B2 (ja) 像域識別装置
US6707953B1 (en) Image processing apparatus interpolating thin line included in input image data
JPH04248766A (ja) 像域分離装置
JP3966448B2 (ja) 画像処理装置、画像処理方法、該方法を実行するプログラムおよび該プログラムを記録した記録媒体
JPH10108012A (ja) 像域分離装置
JPH0993438A (ja) 画像処理装置およびその方法
JP3792402B2 (ja) 画像処理装置および2値化方法,並びに2値化方法をコンピュータに実行させるプログラムを記録した機械読み取り可能な記録媒体
JP3210378B2 (ja) 画像入力装置
JP2002290727A (ja) 画像処理方法、その装置、その記憶媒体及びそのプログラム
JP3344115B2 (ja) 画像処理装置
JP2910926B2 (ja) 最適2値化方法
JP3032238B2 (ja) 画像処理装置
JPH06103399A (ja) 画像処理装置
JP2000353247A (ja) 白黒画像情報の領域判別方法および装置
JP2015035668A (ja) 画像処理装置及びプログラム
JPH0554190A (ja) 画像処理装置
JP2001148007A (ja) 孤立点除去装置,及び画像処理装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20061218

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20080124

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080129

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080327

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20080729