JP2613211B2

JP2613211B2 - 画像入力装置

Info

Publication number: JP2613211B2
Application number: JP62116806A
Authority: JP
Inventors: 雅章藤縄; 浩道藤澤; 達也村上; 歳弘花野井
Original assignee: Hitachi Ltd
Current assignee: Hitachi Ltd
Priority date: 1987-05-15
Filing date: 1987-05-15
Publication date: 1997-05-21
Anticipated expiration: 2012-05-21
Also published as: JPS63283272A

Description

【発明の詳細な説明】〔産業上の利用分野〕本発明は文書や図面などの画像情報を電気的信号に変
換する画像入力装置に関する。

〔従来の技術〕

近年、光ディスクなどの大容量記憶装置の開発によ
り、文書や図面などを電子的に記憶し、紙によるフアイ
リング上の諸問題の解決が図られつつある。文書，図面
の情報は画像により表現されており、当然その品質が問
題となる。文書，図面の多くの場合、画像は本質的に２
値であり、ここにおける画像品質は第一に２値化方式に
依存する。

従来技術における画像入力装置では、紙の白地を基準
に画像信号を正規化した上で、標準的な２値化のための
閾値を設定していた。そのため、広範な種類の文書，図
面を入力する場合には、標準的な閾値を複数個設けてオ
ペレータに選択させているものの、十分な品質の２値画
像を得ることが難しい。実際には、一枚づつ入力した画
像をモニターデイスプレイでオペレータが確認し、十分
な画質が得られないときはオペレータが異なる最適閾値
を操作卓から選んで再入力する必要がある。普通、オペ
レータは必ずしも専門家がないので良い最適閾値を選べ
るようになるまでには、かなりの試行錯誤が必要である
のが実情である。そのため大量な文書，図面を入力する
には多大な作業が必要となつた。

一方、最適な２値化のための閾値を画像自体の濃度ヒ
ストグラムから統計的に決定する方法（従来例１）が、
たとえば文献［Otsu,N.:“A Threshold Selection Meth
od from Grey Level Histograms."IEEE Trans.SMC−9,N
o.1,Jan.1978,pp62−66］に提案されている。

また、文書，図面などを２値化した、その２値画像の
画像品質を判定する方法（従来例２）が、たとえば公開
特許公報（昭58−163075）に提案されている。

しかしながら、従来例１などの方法は、文書，図面が
幾つかの濃度レベルの集合でできている場合、最適な閾
値を求めることができない。たとえば、真つ白な用紙の
上に、古い新聞の切り貼りが貼つてある文書では、黄色
に変色した部分と印刷された文字の黒い部分があり、全
体的に画像として３つレベルがある。つまり、この文書
は３つの濃度レベルの画像の集合から構成されている。
この場合、オペレータは装置に対して「文書が３つの濃
度レベルの集合から成り立つていること」、「２つある
閾値のうちの濃度の高い閾値であること」を指定しなけ
れば、最適な閾値を求めることができない。通常、オペ
レータの指示がない場合、文書は白い背景の上に黒い文
字（またはその逆）の２つの濃度レベルからなると仮定
して最適な閾値の計算を行う。そのため、幾つかの濃度
レベルの集合でできている文書，図面の場合、従来例１
の方法は、最適な閾値を求めることができない。

また、従来例２の方法では、広範な文書，図形の最適
な２値化のための閾値を決めることができない。具体的
に、問題となる文書は、青焼の文書や変色した低品質の
文書、前記に示した多数の濃度レベルの画像の集合から
構成される文書である。モニターデイスプレイを見なが
らオペレータが行つている作業の本質は、その文書の絶
対的な画像の評価ではなく、相対的な画像の評価であ
る。つまり、オペレータは、その文書の２値化処理のた
めの閾値を変えた場合、「どの閾値で２値化処理した画
像が一番きれいであるか」という相対的な画像の評価し
ている。文書，図形を入力するとき必要となる技術は、
それぞれの文書の最良の画像品質を得ることのできる２
値化処理のための閾値を決定することである。

〔発明が解決するとする問題点〕

本発明の目的は、このような従来の欠点を補うため、
広範や文書，図面の最適な閾値を自動に設定すると共
に、並列的に文書，図形の画像品質を評価することによ
り入力のスループツトを向上させる画像入力方式を提供
することである。

〔問題を解決するための手段〕

上記目的は、それぞれの閾値で２値化したときの画像
を評価する複数の画像評価回路、および、これら複数の
評価回路から出力された評価値を用いて、最適な閾値を
演算する演算回路を設けることにより、達成される。

〔作用〕

文書，図面など２値化された画像の品質を評価する方
式について述べる。今、文書，図面は文字や線，記号な
ど２値の線図形で構成されているものとする。線図形で
は、自然画像と異なり人工的に作成されたものであり、
“線”の集合から構成されるという強い束縛をもつてい
る。

一般に、“線”という概念は、ユーグリドの原本の中
で「線は幅のない長さである」と定義される。しかし、
現実の文書，図面上の文字や線，記号を構成する“線”
は、ある幅を有している。ここで取り扱う“線”の集合
である線図形を以下のように定義する。

（１）線図形は、曲率がある値以下の弧からなる輪郭線
および輪郭線で囲まれた内部領域からなる。

（２）線図形は輪郭線の長さに対する内部領域の面積の
比率はある値以下である。

（１）の定義は線図形が滑らかな曲線から構成されて
いることを示す。線図形に汚れが生ずると、曲率の大き
な汚点（弧立点または線上のノツチ）が生ずる。線図形
にかすれが生ずると、同様に弧立点が多くなる。（１）
の定義を満たす線図形の比率を測定することにより画質
を評価することができる。

また、（１）の定義は、線図形を任意の断面で切つた
とき、常に、対向する輪郭線の要素は内部領域を挟ん
で、双対に存在することを示す。

（２）の定義は、線図形と面図形を区別するものであ
る。本来、線は面積を有しないものであり、ここで取り
扱う線図形の面積の割合は、面図形のそれと比べて小さ
いことにより、面図形と線図形の区別が可能となる。こ
の線図形の特性により、真つ白な用紙の上に、古い新聞
の切り貼りが貼つてある文書などの濃度レベルが多数あ
る文書の文字や線，記号の画質評価が可能となる。つま
り、古い新聞の背景の濃度を閾値として２値化すると、
その形状は大きな面図形となる。しかし、文字の濃度を
閾値として２値化すると、その形状は文字を構成する線
図形となる。

現実に線図形をデイジタル画像として扱う場合、前述
した線図形の定義を、別の形で定義する必要がある。デ
イジタル画像上の線図形は、ディジタル幾何学で記述で
きる［Azoriel Rosenfeld,“Digital Picture Processi
ng",by Academic Press.inc.参照］。

“線”は、デイジタルな弧（デイジタル弧）Ｓとして
定義する。デイジタル弧Ｓは、画素の系列p₀,p₁,……,p
_i,……,p_nからなり、p_iはp_i-1（０≦ｉ≦ｎ）の近傍で
あると定義される。デイジタル弧Ｓは、端点を除く任意
の画素p_iが８−近傍の意味で２つだけの近傍の画素
p_i-1,p_i+1を有する。

デイジタル弧Ｓの長さについて述べる。デイジタル弧
Ｓ＝p₀,p₁,……,p_i,……,p_nに対して、その弧に沿つて
画素p_iから画素p_jまでの変位に要するステツプ数を数え
ることでp_iからp_j間のデイジタル弧の長さを定義する。

デイジタル弧Ｓの傾きおよび曲率について述べる。デ
イジタル弧Ｓ＝p₀,p₁,……,p_i,…,p_nに対して、p_iにお
けるデイジタル弧Ｓの左方向のｋ−傾きをp_iからp_i-kへ
の方向（ここでｋ≧１）と定義する。また、デイジタル
弧Ｓの右方向のｋ−傾きをp_iからp_i+kへの方向と定義す
る。つまり、p_iからp_i+kへの方向は、p_iおよびp_i+kをＸ
−Ｙ座標系の各点としてたとき、Ｘ軸と直線p_ip_i+kのな
す角（単位deg）で表わす。

p_iにおけるデイジタル弧Ｓの曲率は、右方向および左
方向のｋ−傾き間の差として定義する。つまり、デイジ
タル弧Ｓのｋ−曲率は、ｋ−曲率＝｜左方向ｋ−傾き−右方向ｋ−傾き｜と定義する。

前に述べた線図形の定義（１），（２）をデイジタル
画像上では、以下のように定義を書き直すことができ
る。

（１）′デイジタル画像上での線図形は、ｋ−曲率があ
る値以下のデイジタル弧からなる輪郭線および輪郭線で
囲まれた内部の画素からなる。

（２）′デイジタル画像上での線図形は、デイジタル弧
からなる輪郭線の長さに対する内部の画素の比率はある
値以下である。

Ｎ画素×Ｎ画素の窓を通してデイジタル画像上の線図
形を観測したときのパターンについて考える。ここで、
（１）′の定義を束縛条件とする緩やかな弧を輪郭線と
する線図形のパターンおよび輪郭線で囲まれた内部の画
素からなる線図形のパターンを緩弧パターンと呼ぶ。

第４図は、３画素×３画素を窓とする緩弧パターンの
代表例である。ただし、ｋ−曲率は、１−曲率を使用
し、１−曲率が45゜以下の場合である。３画素×３画素
の構成で表されるパターンの総数は、2³×^３＝512通り
であるが、（１）′を満たす緩弧パターンは58通りであ
る。第４図に示した代表パターンを90゜,180゜,270゜回
転したパターンおよびそれぞれの線対称のパターンも緩
弧パターンと成りえる。

第４図の代表パターン（ａ）は、１種類，（ｂ）は、
４種類，（ｃ）は、８種類，（ｄ）は、４種類，
（ｄ′）は、４種類，（ｅ）は、８種類，（ｆ）は、１
種類，（ｇ）は、４種類，（ｈ）は、８種類，（ｉ）
は、４種類，（ｉ′）は、４種類，（ｊ）は、８種類の
緩弧パターンを有し、緩弧パターンの合計は、58通りと
なる。つまり、３画素×３画素の構成で出現可能な512
通りのパターンの内、滑らかな輪郭線からなる美しい線
図形に現れる緩弧パターンは、58通りである。この緩弧
パターンを観察することにより、文字や線，記号など２
値の線図形で構成される文書，図面の評価が可能にな
る。

滑らかなデイジタル弧からなる輪郭線の長さおよび輪
郭線で囲まれた内部の画素を抽出するため緩弧パターン
を図形的な特徴で分類する。

緩弧パターンをその中心画素の図形的特徴に着目して
分類する。デイジタル画像上で（１）′の定義を満たす
線図形は以下の４種類に分けられる。

（１）白の線図形の内部画素（２）黒の線図形の内部画素（３）白の線図形の輪郭画素（４）黒の線図形の輪郭画素ここで、黒の線図形とは、黒の画素の８−連結成分か
ら成る画素の集合である。同様に、白の線図形とは、白
の画素の８−連結成分から成る画素の集合である。内部
画素とは、線図形を構成する画素の集合の１つの画素で
あり、４−近傍のすべての画素が、内部画素それ自身と
同じ値（白:0,黒:1）を有する画素である。輪郭画素と
は、線図形を構成する画素の集合の１つの画素であり、
４−近傍の１つ以上の画素が、輪郭画素それ自身と異な
る値（白:0,黒:1）を有する画素である。

以上述べた分類により緩弧パターンを分類すると第４
図に示した。

（ａ），（ｂ）は白の線図形の内部画素、（ｆ），（ｇ）は黒の線図形の内部画素、（ｃ），（ｄ），（ｄ′），（ｅ）は白の線図形の輪
郭画素、（ｈ），（ｉ），（ｉ′），（ｊ）は黒の線図形の輪
郭画素、を中心画素とする緩弧パターンである。

緩弧パターンをその輪郭線の法線ベクトルに着目して
分類する。デイジタル弧からなる輪郭線の法線ベクトル
を定義するために、デイジタル弧の輪郭線の接線ベクト
ルについて考える。線図形の内部を左手に見て進む方向
に各輪郭画素の順序付けを行う。いま、前記のように順
序付けされた輪郭画素をp_i-k,p_i,p_i+k（Ｋ＝１）とす
る。ここで、デイジタル弧を定義したと同じように、p_i
からp_jへのベクトル_ijは、p_iおよびp_jをＸ−Ｙ座標系
の各点としたとき、Ｘ軸を基準として直線p_ip_jのなす角
度（単位deg）およびその長さ|p_ip_j|で表す。ただし、
角度はｘ軸を基準（０゜）として時計周りを正方向とす
る。輪郭画素p_iにおける接線ベクトルは、_ｔ＝（_i-k＋_i+k）/2 ただし、_i-k:p_i-kからp_iへのベクトル_i+k :p_iからp_i+kへのベクトルと定義する。輪郭画素p_iにおける法線ベクトル_ｎは接
線ベクトルと直交するので、法線ベクトル_ｎのｘ軸と
なる角∠_ｎ（法線の方向）は、∠_ｎ＝∠_ｔ＋∠Ｒただし、∠R:90deg と定義する。法線ベクトル_ｎの方向により緩弧パター
ンを分類した結果を第５図および第６図に示す。第５図
は黒の線図形に含まれる緩弧パターンを分類した図であ
り、第６図は白の線図形に含まれる緩弧パターンを分類
した図である。

緩弧パターンの個数を用いた画像の品質評価の方法に
ついて述べる。

画像の評価は、たとえば、第５図および第６図に示し
た緩弧パターンを観測することにより可能となる。

今、一定時間間隔でサンプリングされた緩弧パターン
の個数および総パターン数を以下のように定義する。

総パターン数:N_t グループ番号ｉの緩弧パターンの数:n_i ここで、特徴ある緩弧パターンの個数を以下のように
呼ぶ。

全黒パターンの個数:Nb＝n₁ 全白パターンの個数:Nw＝n₁₁ 黒内部パターンの個数:Nbi＝n₁＋n₂ 白内部パターンの個数:Nw_i＝n₁₁＋n₂₂ （１）面積率デイジタル画像上での線図形の定義より、線図形はデ
イジタル弧からなる輪郭線の長さに対する内部画素の比
率はある値以下である。この比率を面積率E_Sとすると面積率Es＝min（Nbi/Nbe,Nwi/Nwe）となる。ただし、min（x₁,x₂）はｘ＝x₁ for x₁≦x₂ ｘ＝x₂ for x₂≦x₁ とする関数を表す。

（２）双対性文字や線，記号など２値の図形は、ある領域の中で輪
郭画素の法線方向が対向するパターンの個数はほぼ等し
い。第５図における法線方向が180゜異なる、たとえ
ば、グループ番号３の緩弧パターンとグループ番号７の
緩弧パターンは対向している。対向するパターンの個数
等しさを表すパラメータとして双対率を定義する。双対
率は、双対と見る角度の大きさにより任意に定義できる
が、ここでは第５図に示したように45゜の大きさで分割
して求めた。

双対率Ep＝max（Epb,Epw）ただし、 Epb＝max（Epb₁,Epb₂,Epb₃,Epb₄） Epw＝max（Epw₁,Epw₂,Epw₃,Epw₄） Epb₁＝｛|n₃−n₇|/（n₃＋n₇）｝ Epb₂＝｛|n₄−n₈|/（n₄＋n₈）｝ Epb₃＝｛|n₅−n₉|/（n₃＋n₉）｝ Epb₄＝｛|n₆−n₁₀|/（n₃＋n₁₀）｝ Epw₁＝｛|n₁₃−n₁₇|/（n₁₃＋n₁₇）｝ Epw₂＝｛|n₁₄−n₁₈|/（n₁₄＋n₁₈）｝ Epw₃＝｛|n₁₅−n₁₉|/（n₁₅＋n₁₉）｝ Epw₄＝｛|n₁₆−n₂₀|/（n₁₆＋n₂₀）｝ max（x₁,x₂）はｘ＝x₁ for x₁≧x₂ ｘ＝x₂ for x₂＞x₁ とする関数を表す。

（３）画像の美しさ画像の美しさは、２値画素からなる図形の滑らかな輪
郭線を有る割合で評価する。この画質評価値Ωは、 Ω＝Nsmooth/Npattern で表す。ただし、 Npattern＝N_t−（n₁＋n₁₁）以上、説明した画像の評価方法により、実際の文書を
評価した結果について述べる。

第７図は、２種類の文書の画像を評価した結果であ
る。１つは雑誌であり、他の１つは、手書き文書であ
る。雑誌は活字で鮮明に印刷された活字文書であり、手
書き文書はジアゾコピーで青焼された青焼文書である。
つまり、第７図は異なつた２値化閾値で２値化した文書
の画像を緩弧パターンを観測することにより評価した結
果である。横軸は文書を２値化したときの２値化閾値で
あり、縦軸は画像の美しさで説明した画質評価値Ωであ
る。それぞれの文書とも２値化する閾値により、画質評
価値Ωは一つのピークを有する曲線を描く。文書により
画質評価値Ωが最大となる２値化閾値は異なり、その画
質評価値Ωの最大値も異なる。

第８図，第９図に画質評価の対象となつた活字文書と
青焼文書を、いろいろな２値化閾値で２値化した例を示
す。第８図，第９図の（ａ）は２値化閾値の低い場合で
あり、それぞれの文書中の文字に“細り”や“切れ”が
生じている。また、（ｃ）は２値化閾値が高い場合であ
り、それぞれの文書中に細かい“汚れ”や文字の“つぶ
れ”が生じている。（ｂ）は人間の主観的評価で最良の
画質と判断した画像である。画質評価値Ωの最大値とす
る２値化閾値とほぼ一致している。

第８図，第９図より画像の美しさで定義した画質評価
値Ωは、人間の感覚と強い相関があることがわかる。つ
まり、画質評価値Ωの最大値とする２値化閾値より、そ
の文書の最適な２値化閾値を決めることができるＮ画素×Ｎ画素の窓を通して、そのパターンを観測す
る画像の評価は、複数個の閾値ごとに時間的に並行して
行われる。また、演算回路は、それらの画像評価回路に
よつて求められた評価値を用いて最適な閾値を演算を行
う。これらの複数の画像評価回路および演算回路によつ
て、閾値の自動設定を行うと共に、並列的な画像品質の
評価処理により入力のスループツトを向上させる。

〔実施例〕

以下、本発明を、実施例にもとづいて説明する。

第１図は本発明の一実施例である画像入力装置の機能
ブロツク図である。

同装置は紙面上の画像を光学的に走査して光−電気変
換を行い多値画像データ111を出力するところの画像走
査部110、多値画像データを一時蓄積する多値画像メモ
リ200、多値画像メモリの出力を最適閾値1010にもとづ
いて２値化する２値化回路300、２値画像データ310を一
時的に蓄積する画像メモリ400、画像メモリ400に蓄えら
れた２値画像データ310の冗長性圧縮（データ圧縮）を
行い、かつ、光デイスク700に蓄えられ符号化された２
値画像データを復元する圧縮伸長回路600、２値画像デ
ータを蓄える光デイスク700、画像メモリの内容の画像
を表示するデイスプレイ500、多値画像データ111を用い
各閾値での画質の評価を行ない評価データ811,821,831,
841を出力する画質評価回路810,820,830,840、２値化の
ための閾値を記憶する閾値パラメータ記憶回路900、お
よび各閾種での評価データ811,821,831,841からその画
像の最適な２値化のための閾値を演算し最適閾値1010を
出力する最適閾値演算回路1000とから成り立つている。

処理の流れの概要を次に説明する。

入力すべき文書などの書類100を画像走査部110にセツ
トする。画像走査部110は書類100を光学的に走査して画
像データ111を出力する。画像データ111は画像の濃淡情
報を表す多値画像データ111−１（第１図には図示せ
ず）および画像を走査して得られるタイミング信号111
−２（第１図には図示せず）からなる。さらに、タイミ
ング信号は画素単位に発生する画素クロツク信号、行単
位で発生する行クロツク信号および頁単位で発生する頁
クロツク信号から構成される。

多値画像データ111は多値画像メモリ200に一時的に記
憶される。この多値画像データが一時記憶されている時
間は、次の２値化回路300で必要な最適閾値1010を計算
するのに要する処理時間である。多値画像データは最適
閾値演算回路1000で演算される最適閾値で２値化され
る。２値化された２値画像データ310は、複数頁分の容
量を有する画像メモリ400に蓄えられる。画像メモリ内
の画像はデイスプレイ500に送り、表示することができ
る。また、２値画像データは、圧縮伸長回路600を通し
て光デイスク700に蓄積される。

多値画像データ111は閾値パラメータ記憶回路900に記
憶された複数の評価閾値910を用いて、各、画像評価回
路810,820,830,840で２値化を行い、２値化された画像
データを評価する。各、画像評価回路は多値画像データ
を同時に並行して評価を行う。

最適閾値演算回路1000は、画像評価回路の評価データ
811,821,831,841を用いて最適な閾値の演算を行う。最
適閾値演算回路は評価データを用いても最適な閾値が演
算できない状況もある。その場合は、以前に演算して求
めた閾値を使用する。そのため最適閾値演算回路内に演
算して求めた閾値を格納する閾値レジスタ（図示せず）
を設ける。電源投入時、またはリセツト時、この閾値レ
ジスタには、回路内に設定された標準閾値の値が設定さ
れる。閾値レジスタの出力が最適閾値1010となる。

本発明の基本である画像評価回路810,820,830,840に
ついて詳しく述べる。

画像評価回路は同一の構成である。ただ、それぞれの
評価に使用する評価閾値910が異なる。画像評価回路の
機能ブロツク図を第２図に示す。

画像評価回路は多値画像データ111−１を２値化する
２値化回路812、２値化した２値画像データ851を一時的
に記憶するラインバッファ813、２値画像データの書き
込みアドレスを設定する書き込みアドレス回路860、ラ
インバッファ内の２値画像データを読みだすアドレスを
設定する読みだしアドレス回路861、読みだされたデー
タを格納するパターンレジスタ814,パターンレジスタの
値であるパターンコード852をアドレスするマツチング
用ROM（Read Only Memory）815、マツチング用ROMの出
力を格納する分類コードレジスタ816、分類コードレジ
スタの出力である分類コード853をアドレスする計測RAM
（Random Access Memory）817、計測用RAMの内容を読み
だし、その値に１加え、読み出した同じアドレスに格納
するための加算器818から構成される。

画像評価回路における処理の流れを説明する。

文書，図面を走査して得られる多値画像データ111−
１は２値化回路812で２値化され、デイジタル画像上の
線図形として取り扱うことができる。この２値化のため
の評価閾値910は、閾値パラメータ記憶回路900より与え
られる。２値画像データは書き込みアドレス設定回路86
0で決められたラインバッファ813のアドレスに格納され
る。ラインバッファはＮ行分の２値画像データが格納で
きる。このラインバッファはＮ画素×Ｎ画素の窓を通し
て線図形のパターンを観測するために使われる。２値画
像データは１行づつ順番にラインバッファに書き込まれ
る。しかし、ラインバッファの読みだし動作はＮ画素×
Ｎ画素分の２値画像データが一度で行われる。読みださ
れたＮ×Nbitのデータはパターンレジスタ814に格納さ
れる。Ｎ画素×Ｎ画素のパターンレジスタへの格納はタ
イミング信号111−２中の画素クロツク信号に同期して
行われる。

２値化された画像の品質を評価するためには、このＮ
×Nbitパターンを決められたグループに分類し、グルー
プごとのパターンの個数を計測する必要がある。

Ｎ＝３の場合、パターンレジスタ814に読みだされた
パターンは、第５図と第６図に示した20種類の緩弧パタ
ーンおよびそれ以外のパターンに分類できる。パターン
レジスタの値であるパターンコード852は３画素×３画
素の各画素の“1"または“0"の値を9bitの数値として表
す。マツチング用ROM815はパターンコードをアドレスと
し、クラスタリングのためのグループ番号を出力する。
第５図と第６図に示した緩弧パターンの第一項目がクラ
スタリングのためのグループ番号であり、緩弧パターン
の下に記した数字はその緩弧パターンを８進数の数値で
表したパターンコードである。ただし、緩弧パターン以
外のパターンのグループ番号は、“0"とする。グループ
番号は、タイミング信号111−２中の画素クロツク信号
に同期して、分類コードレジスタ816に出力される。

計測用RAM817および加算器818は、グループ番号に属
するパターンの個数を計測する。電源投入時，リセツト
時、またはタイミング信号111−２の頁クロツク信号で
この計測用RAMはすべて“0"にクリアされる。計測用RAM
はグループ番号をアドレスとして、その計測値が読みだ
される。計測値は加算器に導かれ＋１加算して同じアド
レスに書き込まれる。つまり、そのグループ番号に属す
るパターンの個数を計測することができる。

この計測値はそのグループ番号が検出されるごとに遂
次リアルタイムで増加する。グループ番号に対応するこ
の計測値の組が、評価閾値の評価データ841として出力
される。つまり、この評価データを一定時間間隔でサン
プリングすることにより、この時間で走査したが画像中
のそれぞれの緩弧パターンおよびそれ以外のパターンの
個数を計測することができる。

つぎに最適閾値演算回路1000の動作について述べる。

評価データ811,821,831,841を使用して、それぞれの
評価閾値910で２値化した図形の面積率，双対率の算出
および画像の美しさの評価ができる。それぞれの評価閾
値のうち、「どの評価閾値が最適な閾値であるか」の決
定法について述べる。

基本的には画像の美しさを表す画質評価値Ωが極大値
となる評価閾値を最適閾値1010とする。

しかし、真つ白の用紙の上に、古い新聞の切り抜きが
貼つてある文書などの濃度レベルが多数ある文書では、
画質評価値Ωが２つ以上の極大値を示す。

ここで、最適閾値を判定する領域内で、文字や線を表
す線図形の濃度レベルは、単一とする。真つ白の用紙，
古い新聞紙など、その他の濃度レベルは、面図形とす
る。通常のオフイスで使われる大多数の文書は、この条
件を満たしており、これは大きな制約とならない。

今、評価パタメータ記憶回路900から与えられる複数
の評価閾値910の中の評価閾値X_iに対する２値画像の面
積率をEs_i、双対率をEp_i、画質評価値をΩ_ｉとする。た
だし、１≦ｉ≦Ｍとする。

ここで、線図形を特徴づける面積率および双対率の上
限値を、_εs,_εｐとすると、最適閾値Xoptは εｓ≧Es_i εｐ≧Ep_i を満たすｉの中で、Ω_ｉを最大にするX_iである。すべて
のｉに対して εｓ≧Es_i εｐ≧Ep_i を満たすｉが存在しないとき、前回の最適閾値Xoptを使
用する。

最適閾値演算回路1000の機能ブロツク図を第３図に示
す。

最適閾値演算回路は最適閾値を格納する閾値レジスタ
1011、標準閾値を格納する標準閾値レジスタ1020、評価
でデータなどを格納するデータメモリ1030、最適閾値演
算回路を制御するCPU（中央制御装置）1040、制御用の
プログラムを格納するプログラムメモリ1050、画像評価
回路810,820,830,840からの評価データ811,821,831,841
を入力する評価データ入力回路1061,1062,1063,1064、
閾値パラメータ記憶回路900からの評価閾値を入力する
閾値入力回路1080から構成される。

最適閾値演算回路における処理の流れを説明する。

電源投入時、またはリセツト時、標準閾値レジスタ10
20に設定されている標準閾値が閾値レジスタ1011にセツ
トされる。

CPU1040は、一定時間Ｔ（行クロツク信号のＬ倍:Lは
正の整数）ごと各評価データ入力回路810,820,830,840
に評価データ811,821,831,841読み取りのデータサンプ
リング命令を出す。読み取られた評価データは、データ
メモリ1030に遂次蓄えられる。データメモリはＫ回分の
各、評価データの格納領域を有する。Ｋ＋１個目の評価
データが読み込まれると最初に読み込まれた評価データ
は消滅する。つまり、データメモリはシフトレジスタ構
造になつている。

最初の評価データを格納する領域を第１領域、２番目
の評価データを格納する領域を第２領域、同時に、Ｋ番
目の評価データを格納する領域を第Ｋ領域とする。第Ｋ
領域の評価データから第１領イの評価データを引くこと
により、この間の緩弧パターンの個数およびそれ以外の
個数を求めることができる。

この緩弧パターンの個数およびそれ以外の個数より、
前記に述べた方法で閾値入力回路1080の評価閾値を参照
して最適閾値を演算できる。この最適閾値が閾値レジス
タにセツトされる。この演算はＴ時間間隔で行う。

最後に、多値画像メモリ200に多値画像データ111が記
憶されている時間（遅延時間）について述べる。

２値化する多値画像データの前後Ｌ×K/2行分の多値
画像データを参照して最適閾値を決めるために、多値画
像メモリはＴ×K/2時間の期間多値画像データの遅延を
行う。

なお、実施例では３×３のパターンについて詳しく述
べてきたが、４×4,5×５などのパターンでも同様に評
価が可能である。

データメモリを使用せず、１頁単位に最適閾値を求め
てもよい。この場合、１頁分の多値画像メモリが必要と
なる。

２値化の手法自体１つに限られたことではない。たと
えば、空間フイルタを施して２値化することにより、光
学系のぼけを補正するなどの高度な２値化方法もある
が、これらを２値化回路300に採用してもよい。

本発明は以前に発明した画像入力方式（318,403,51
4）と組合せてもよい。

〔発明の効果〕

以上説明したごとく、本発明方式によれば従来オペレ
ータがデイスプレイで１枚づつ入力画像の品質を確認
し、不適切な場合には２値化の閾値を選択し再度入力，
走査するという必要がなくなり入力作業のスループツト
が大幅に向上する。また、真つ白の用紙の上に、古い新
聞の切り抜きが貼つてある文書など、濃度レベルが多数
ある文書でも２値化の閾値を自動的に選択することが可
能となる。

【図面の簡単な説明】

第１図は本発明の一実施例による画像入力方式が採用し
た画像入力装置の機能ブロツク図、第２図は画像評価回
路の機能ブロツク図、第３図は最適閾値演算回路の機能
ブロツク図、第４図は３画素×３画素を窓とする緩弧パ
ターンの代表例を示す図、第５図は３画素×３画素を窓
とする黒画素を中心画素とする緩弧パターンを示す図、
第６図は３画素×３画素を窓とする白画素を中心画素と
する緩弧パターンを示す図、第７図は文書画像を評価し
た結果を示す図、第８図は活字文書の例を示す図、第９
図は手書き文書の例を示す図である。 100……書類、110……画像走査部、111……多値画像デ
ータ、200……多値画像メモリ、300……２値化回路、40
0……画像メモリ、500……デイスプレイ、600……圧縮
伸長回路、700……光デイスク、811,821,831,841……評
価データ、900……閾値パラメータ記憶回路、1000……
最適閾値演算回路。

───────────────────────────────────────────────────── フロントページの続き (72)発明者花野井歳弘小田原市国府津2880番地株式会社日立製作所小田原工場内 (56)参考文献特公昭63−36035（ＪＰ，Ｂ２)

Claims

(57)【特許請求の範囲】

【請求項１】紙面を走査して上記紙面上の光学的画像を
多値画像情報に変換する画像走査手段と、上記画像走査
手段により得られた上記多値画像情報を所定の閾値に基
づいて二値化して得られる二値画像情報について、その
二値画像情報の品質を評価する複数の画像評価手段であ
って、各々の画像評価手段は、上記多値画像情報を上記所定の閾値に基づいて二値化す
る二値化手段と、上記二値化手段により得られた二値画像情報を一時的に
記憶するバッファと、所定の大きさの矩形領域であって輪郭線の曲率が所定の
大きさ以下に制限された二値の線図形を構成する特定の
パターンである緩弧パターンをあらかじめ記憶してお
き、上記バッファに記憶された上記二値画像情報から順
次切り出された上記矩形領域に相当する領域と上記緩弧
パターンとを照合する照合手段と、上記照合手段による照合結果を受けて、上記二値画像情
報中の上記緩弧パターンに該当する上記領域の個数を計
測する計測手段を有し、かつ、上記複数の画像評価手段は、相異なる前記所定の閾値を
用いて上記画像の品質の評価結果を、それぞれ出力し、上記複数の画像評価手段から出力された上記画像の品質
の評価結果に基づいて上記相異なる所定の閾値より最適
閾値を決定する最適閾値演算手段とを有する画像入力装
置。
【請求項２】特許請求の範囲第１項記載の画像入力装置
において、上記各々の画像評価手段の上記緩弧パターンについて、
上記矩形領域の中心画素が上記二値の線図形の内部画素
から輪郭画素であるか分類し、さらに上記中心画素が上
記輪郭画素である場合には上記二値の線図形の輪郭線が
上記矩形領域中に占める位置によって分類してカテゴリ
ー分けしておき、上記計測手段は上記カテゴリーごとに、該当する上記領
域の個数を計測する画像入力装置。
【請求項３】特許請求の範囲第２項記載の画像入力装置
において、上記最適閾値演算手段は、上記画像評価手段から出力された上記カテゴリーごとの
該当する領域の個数に基づいて、上記二値画像情報にお
ける線図形の輪郭線の長さに対する上記輪郭線で囲まれ
た領域の面積の比率である面積率、対向する輪郭線の状
況を表す双対率および滑らかな輪郭線の存在する割合を
表す画質評価値を演算して、上記相異なる所定の閾値より最適閾値を決定することを
特徴とする画像入力装置。