JP2613211B2 - 画像入力装置 - Google Patents
画像入力装置Info
- Publication number
- JP2613211B2 JP2613211B2 JP62116806A JP11680687A JP2613211B2 JP 2613211 B2 JP2613211 B2 JP 2613211B2 JP 62116806 A JP62116806 A JP 62116806A JP 11680687 A JP11680687 A JP 11680687A JP 2613211 B2 JP2613211 B2 JP 2613211B2
- Authority
- JP
- Japan
- Prior art keywords
- image
- evaluation
- line
- binary
- threshold value
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Landscapes
- Image Processing (AREA)
- Facsimile Image Signal Circuits (AREA)
- Image Input (AREA)
Description
【発明の詳細な説明】 〔産業上の利用分野〕 本発明は文書や図面などの画像情報を電気的信号に変
換する画像入力装置に関する。
換する画像入力装置に関する。
近年、光ディスクなどの大容量記憶装置の開発によ
り、文書や図面などを電子的に記憶し、紙によるフアイ
リング上の諸問題の解決が図られつつある。文書,図面
の情報は画像により表現されており、当然その品質が問
題となる。文書,図面の多くの場合、画像は本質的に2
値であり、ここにおける画像品質は第一に2値化方式に
依存する。
り、文書や図面などを電子的に記憶し、紙によるフアイ
リング上の諸問題の解決が図られつつある。文書,図面
の情報は画像により表現されており、当然その品質が問
題となる。文書,図面の多くの場合、画像は本質的に2
値であり、ここにおける画像品質は第一に2値化方式に
依存する。
従来技術における画像入力装置では、紙の白地を基準
に画像信号を正規化した上で、標準的な2値化のための
閾値を設定していた。そのため、広範な種類の文書,図
面を入力する場合には、標準的な閾値を複数個設けてオ
ペレータに選択させているものの、十分な品質の2値画
像を得ることが難しい。実際には、一枚づつ入力した画
像をモニターデイスプレイでオペレータが確認し、十分
な画質が得られないときはオペレータが異なる最適閾値
を操作卓から選んで再入力する必要がある。普通、オペ
レータは必ずしも専門家がないので良い最適閾値を選べ
るようになるまでには、かなりの試行錯誤が必要である
のが実情である。そのため大量な文書,図面を入力する
には多大な作業が必要となつた。
に画像信号を正規化した上で、標準的な2値化のための
閾値を設定していた。そのため、広範な種類の文書,図
面を入力する場合には、標準的な閾値を複数個設けてオ
ペレータに選択させているものの、十分な品質の2値画
像を得ることが難しい。実際には、一枚づつ入力した画
像をモニターデイスプレイでオペレータが確認し、十分
な画質が得られないときはオペレータが異なる最適閾値
を操作卓から選んで再入力する必要がある。普通、オペ
レータは必ずしも専門家がないので良い最適閾値を選べ
るようになるまでには、かなりの試行錯誤が必要である
のが実情である。そのため大量な文書,図面を入力する
には多大な作業が必要となつた。
一方、最適な2値化のための閾値を画像自体の濃度ヒ
ストグラムから統計的に決定する方法(従来例1)が、
たとえば文献[Otsu,N.:“A Threshold Selection Meth
od from Grey Level Histograms."IEEE Trans.SMC−9,N
o.1,Jan.1978,pp62−66]に提案されている。
ストグラムから統計的に決定する方法(従来例1)が、
たとえば文献[Otsu,N.:“A Threshold Selection Meth
od from Grey Level Histograms."IEEE Trans.SMC−9,N
o.1,Jan.1978,pp62−66]に提案されている。
また、文書,図面などを2値化した、その2値画像の
画像品質を判定する方法(従来例2)が、たとえば公開
特許公報(昭58−163075)に提案されている。
画像品質を判定する方法(従来例2)が、たとえば公開
特許公報(昭58−163075)に提案されている。
しかしながら、従来例1などの方法は、文書,図面が
幾つかの濃度レベルの集合でできている場合、最適な閾
値を求めることができない。たとえば、真つ白な用紙の
上に、古い新聞の切り貼りが貼つてある文書では、黄色
に変色した部分と印刷された文字の黒い部分があり、全
体的に画像として3つレベルがある。つまり、この文書
は3つの濃度レベルの画像の集合から構成されている。
この場合、オペレータは装置に対して「文書が3つの濃
度レベルの集合から成り立つていること」、「2つある
閾値のうちの濃度の高い閾値であること」を指定しなけ
れば、最適な閾値を求めることができない。通常、オペ
レータの指示がない場合、文書は白い背景の上に黒い文
字(またはその逆)の2つの濃度レベルからなると仮定
して最適な閾値の計算を行う。そのため、幾つかの濃度
レベルの集合でできている文書,図面の場合、従来例1
の方法は、最適な閾値を求めることができない。
幾つかの濃度レベルの集合でできている場合、最適な閾
値を求めることができない。たとえば、真つ白な用紙の
上に、古い新聞の切り貼りが貼つてある文書では、黄色
に変色した部分と印刷された文字の黒い部分があり、全
体的に画像として3つレベルがある。つまり、この文書
は3つの濃度レベルの画像の集合から構成されている。
この場合、オペレータは装置に対して「文書が3つの濃
度レベルの集合から成り立つていること」、「2つある
閾値のうちの濃度の高い閾値であること」を指定しなけ
れば、最適な閾値を求めることができない。通常、オペ
レータの指示がない場合、文書は白い背景の上に黒い文
字(またはその逆)の2つの濃度レベルからなると仮定
して最適な閾値の計算を行う。そのため、幾つかの濃度
レベルの集合でできている文書,図面の場合、従来例1
の方法は、最適な閾値を求めることができない。
また、従来例2の方法では、広範な文書,図形の最適
な2値化のための閾値を決めることができない。具体的
に、問題となる文書は、青焼の文書や変色した低品質の
文書、前記に示した多数の濃度レベルの画像の集合から
構成される文書である。モニターデイスプレイを見なが
らオペレータが行つている作業の本質は、その文書の絶
対的な画像の評価ではなく、相対的な画像の評価であ
る。つまり、オペレータは、その文書の2値化処理のた
めの閾値を変えた場合、「どの閾値で2値化処理した画
像が一番きれいであるか」という相対的な画像の評価し
ている。文書,図形を入力するとき必要となる技術は、
それぞれの文書の最良の画像品質を得ることのできる2
値化処理のための閾値を決定することである。
な2値化のための閾値を決めることができない。具体的
に、問題となる文書は、青焼の文書や変色した低品質の
文書、前記に示した多数の濃度レベルの画像の集合から
構成される文書である。モニターデイスプレイを見なが
らオペレータが行つている作業の本質は、その文書の絶
対的な画像の評価ではなく、相対的な画像の評価であ
る。つまり、オペレータは、その文書の2値化処理のた
めの閾値を変えた場合、「どの閾値で2値化処理した画
像が一番きれいであるか」という相対的な画像の評価し
ている。文書,図形を入力するとき必要となる技術は、
それぞれの文書の最良の画像品質を得ることのできる2
値化処理のための閾値を決定することである。
本発明の目的は、このような従来の欠点を補うため、
広範や文書,図面の最適な閾値を自動に設定すると共
に、並列的に文書,図形の画像品質を評価することによ
り入力のスループツトを向上させる画像入力方式を提供
することである。
広範や文書,図面の最適な閾値を自動に設定すると共
に、並列的に文書,図形の画像品質を評価することによ
り入力のスループツトを向上させる画像入力方式を提供
することである。
上記目的は、それぞれの閾値で2値化したときの画像
を評価する複数の画像評価回路、および、これら複数の
評価回路から出力された評価値を用いて、最適な閾値を
演算する演算回路を設けることにより、達成される。
を評価する複数の画像評価回路、および、これら複数の
評価回路から出力された評価値を用いて、最適な閾値を
演算する演算回路を設けることにより、達成される。
文書,図面など2値化された画像の品質を評価する方
式について述べる。今、文書,図面は文字や線,記号な
ど2値の線図形で構成されているものとする。線図形で
は、自然画像と異なり人工的に作成されたものであり、
“線”の集合から構成されるという強い束縛をもつてい
る。
式について述べる。今、文書,図面は文字や線,記号な
ど2値の線図形で構成されているものとする。線図形で
は、自然画像と異なり人工的に作成されたものであり、
“線”の集合から構成されるという強い束縛をもつてい
る。
一般に、“線”という概念は、ユーグリドの原本の中
で「線は幅のない長さである」と定義される。しかし、
現実の文書,図面上の文字や線,記号を構成する“線”
は、ある幅を有している。ここで取り扱う“線”の集合
である線図形を以下のように定義する。
で「線は幅のない長さである」と定義される。しかし、
現実の文書,図面上の文字や線,記号を構成する“線”
は、ある幅を有している。ここで取り扱う“線”の集合
である線図形を以下のように定義する。
(1)線図形は、曲率がある値以下の弧からなる輪郭線
および輪郭線で囲まれた内部領域からなる。
および輪郭線で囲まれた内部領域からなる。
(2)線図形は輪郭線の長さに対する内部領域の面積の
比率はある値以下である。
比率はある値以下である。
(1)の定義は線図形が滑らかな曲線から構成されて
いることを示す。線図形に汚れが生ずると、曲率の大き
な汚点(弧立点または線上のノツチ)が生ずる。線図形
にかすれが生ずると、同様に弧立点が多くなる。(1)
の定義を満たす線図形の比率を測定することにより画質
を評価することができる。
いることを示す。線図形に汚れが生ずると、曲率の大き
な汚点(弧立点または線上のノツチ)が生ずる。線図形
にかすれが生ずると、同様に弧立点が多くなる。(1)
の定義を満たす線図形の比率を測定することにより画質
を評価することができる。
また、(1)の定義は、線図形を任意の断面で切つた
とき、常に、対向する輪郭線の要素は内部領域を挟ん
で、双対に存在することを示す。
とき、常に、対向する輪郭線の要素は内部領域を挟ん
で、双対に存在することを示す。
(2)の定義は、線図形と面図形を区別するものであ
る。本来、線は面積を有しないものであり、ここで取り
扱う線図形の面積の割合は、面図形のそれと比べて小さ
いことにより、面図形と線図形の区別が可能となる。こ
の線図形の特性により、真つ白な用紙の上に、古い新聞
の切り貼りが貼つてある文書などの濃度レベルが多数あ
る文書の文字や線,記号の画質評価が可能となる。つま
り、古い新聞の背景の濃度を閾値として2値化すると、
その形状は大きな面図形となる。しかし、文字の濃度を
閾値として2値化すると、その形状は文字を構成する線
図形となる。
る。本来、線は面積を有しないものであり、ここで取り
扱う線図形の面積の割合は、面図形のそれと比べて小さ
いことにより、面図形と線図形の区別が可能となる。こ
の線図形の特性により、真つ白な用紙の上に、古い新聞
の切り貼りが貼つてある文書などの濃度レベルが多数あ
る文書の文字や線,記号の画質評価が可能となる。つま
り、古い新聞の背景の濃度を閾値として2値化すると、
その形状は大きな面図形となる。しかし、文字の濃度を
閾値として2値化すると、その形状は文字を構成する線
図形となる。
現実に線図形をデイジタル画像として扱う場合、前述
した線図形の定義を、別の形で定義する必要がある。デ
イジタル画像上の線図形は、ディジタル幾何学で記述で
きる[Azoriel Rosenfeld,“Digital Picture Processi
ng",by Academic Press.inc.参照]。
した線図形の定義を、別の形で定義する必要がある。デ
イジタル画像上の線図形は、ディジタル幾何学で記述で
きる[Azoriel Rosenfeld,“Digital Picture Processi
ng",by Academic Press.inc.参照]。
“線”は、デイジタルな弧(デイジタル弧)Sとして
定義する。デイジタル弧Sは、画素の系列p0,p1,……,p
i,……,pnからなり、piはpi-1(0≦i≦n)の近傍で
あると定義される。デイジタル弧Sは、端点を除く任意
の画素piが8−近傍の意味で2つだけの近傍の画素
pi-1,pi+1を有する。
定義する。デイジタル弧Sは、画素の系列p0,p1,……,p
i,……,pnからなり、piはpi-1(0≦i≦n)の近傍で
あると定義される。デイジタル弧Sは、端点を除く任意
の画素piが8−近傍の意味で2つだけの近傍の画素
pi-1,pi+1を有する。
デイジタル弧Sの長さについて述べる。デイジタル弧
S=p0,p1,……,pi,……,pnに対して、その弧に沿つて
画素piから画素pjまでの変位に要するステツプ数を数え
ることでpiからpj間のデイジタル弧の長さを定義する。
S=p0,p1,……,pi,……,pnに対して、その弧に沿つて
画素piから画素pjまでの変位に要するステツプ数を数え
ることでpiからpj間のデイジタル弧の長さを定義する。
デイジタル弧Sの傾きおよび曲率について述べる。デ
イジタル弧S=p0,p1,……,pi,…,pnに対して、piにお
けるデイジタル弧Sの左方向のk−傾きをpiからpi-kへ
の方向(ここでk≧1)と定義する。また、デイジタル
弧Sの右方向のk−傾きをpiからpi+kへの方向と定義す
る。つまり、piからpi+kへの方向は、piおよびpi+kをX
−Y座標系の各点としてたとき、X軸と直線pipi+kのな
す角(単位deg)で表わす。
イジタル弧S=p0,p1,……,pi,…,pnに対して、piにお
けるデイジタル弧Sの左方向のk−傾きをpiからpi-kへ
の方向(ここでk≧1)と定義する。また、デイジタル
弧Sの右方向のk−傾きをpiからpi+kへの方向と定義す
る。つまり、piからpi+kへの方向は、piおよびpi+kをX
−Y座標系の各点としてたとき、X軸と直線pipi+kのな
す角(単位deg)で表わす。
piにおけるデイジタル弧Sの曲率は、右方向および左
方向のk−傾き間の差として定義する。つまり、デイジ
タル弧Sのk−曲率は、 k−曲率=|左方向k−傾き−右方向k−傾き| と定義する。
方向のk−傾き間の差として定義する。つまり、デイジ
タル弧Sのk−曲率は、 k−曲率=|左方向k−傾き−右方向k−傾き| と定義する。
前に述べた線図形の定義(1),(2)をデイジタル
画像上では、以下のように定義を書き直すことができ
る。
画像上では、以下のように定義を書き直すことができ
る。
(1)′デイジタル画像上での線図形は、k−曲率があ
る値以下のデイジタル弧からなる輪郭線および輪郭線で
囲まれた内部の画素からなる。
る値以下のデイジタル弧からなる輪郭線および輪郭線で
囲まれた内部の画素からなる。
(2)′デイジタル画像上での線図形は、デイジタル弧
からなる輪郭線の長さに対する内部の画素の比率はある
値以下である。
からなる輪郭線の長さに対する内部の画素の比率はある
値以下である。
N画素×N画素の窓を通してデイジタル画像上の線図
形を観測したときのパターンについて考える。ここで、
(1)′の定義を束縛条件とする緩やかな弧を輪郭線と
する線図形のパターンおよび輪郭線で囲まれた内部の画
素からなる線図形のパターンを緩弧パターンと呼ぶ。
形を観測したときのパターンについて考える。ここで、
(1)′の定義を束縛条件とする緩やかな弧を輪郭線と
する線図形のパターンおよび輪郭線で囲まれた内部の画
素からなる線図形のパターンを緩弧パターンと呼ぶ。
第4図は、3画素×3画素を窓とする緩弧パターンの
代表例である。ただし、k−曲率は、1−曲率を使用
し、1−曲率が45゜以下の場合である。3画素×3画素
の構成で表されるパターンの総数は、23×3=512通り
であるが、(1)′を満たす緩弧パターンは58通りであ
る。第4図に示した代表パターンを90゜,180゜,270゜回
転したパターンおよびそれぞれの線対称のパターンも緩
弧パターンと成りえる。
代表例である。ただし、k−曲率は、1−曲率を使用
し、1−曲率が45゜以下の場合である。3画素×3画素
の構成で表されるパターンの総数は、23×3=512通り
であるが、(1)′を満たす緩弧パターンは58通りであ
る。第4図に示した代表パターンを90゜,180゜,270゜回
転したパターンおよびそれぞれの線対称のパターンも緩
弧パターンと成りえる。
第4図の代表パターン(a)は、1種類,(b)は、
4種類,(c)は、8種類,(d)は、4種類,
(d′)は、4種類,(e)は、8種類,(f)は、1
種類,(g)は、4種類,(h)は、8種類,(i)
は、4種類,(i′)は、4種類,(j)は、8種類の
緩弧パターンを有し、緩弧パターンの合計は、58通りと
なる。つまり、3画素×3画素の構成で出現可能な512
通りのパターンの内、滑らかな輪郭線からなる美しい線
図形に現れる緩弧パターンは、58通りである。この緩弧
パターンを観察することにより、文字や線,記号など2
値の線図形で構成される文書,図面の評価が可能にな
る。
4種類,(c)は、8種類,(d)は、4種類,
(d′)は、4種類,(e)は、8種類,(f)は、1
種類,(g)は、4種類,(h)は、8種類,(i)
は、4種類,(i′)は、4種類,(j)は、8種類の
緩弧パターンを有し、緩弧パターンの合計は、58通りと
なる。つまり、3画素×3画素の構成で出現可能な512
通りのパターンの内、滑らかな輪郭線からなる美しい線
図形に現れる緩弧パターンは、58通りである。この緩弧
パターンを観察することにより、文字や線,記号など2
値の線図形で構成される文書,図面の評価が可能にな
る。
滑らかなデイジタル弧からなる輪郭線の長さおよび輪
郭線で囲まれた内部の画素を抽出するため緩弧パターン
を図形的な特徴で分類する。
郭線で囲まれた内部の画素を抽出するため緩弧パターン
を図形的な特徴で分類する。
緩弧パターンをその中心画素の図形的特徴に着目して
分類する。デイジタル画像上で(1)′の定義を満たす
線図形は以下の4種類に分けられる。
分類する。デイジタル画像上で(1)′の定義を満たす
線図形は以下の4種類に分けられる。
(1)白の線図形の内部画素 (2)黒の線図形の内部画素 (3)白の線図形の輪郭画素 (4)黒の線図形の輪郭画素 ここで、黒の線図形とは、黒の画素の8−連結成分か
ら成る画素の集合である。同様に、白の線図形とは、白
の画素の8−連結成分から成る画素の集合である。内部
画素とは、線図形を構成する画素の集合の1つの画素で
あり、4−近傍のすべての画素が、内部画素それ自身と
同じ値(白:0,黒:1)を有する画素である。輪郭画素と
は、線図形を構成する画素の集合の1つの画素であり、
4−近傍の1つ以上の画素が、輪郭画素それ自身と異な
る値(白:0,黒:1)を有する画素である。
ら成る画素の集合である。同様に、白の線図形とは、白
の画素の8−連結成分から成る画素の集合である。内部
画素とは、線図形を構成する画素の集合の1つの画素で
あり、4−近傍のすべての画素が、内部画素それ自身と
同じ値(白:0,黒:1)を有する画素である。輪郭画素と
は、線図形を構成する画素の集合の1つの画素であり、
4−近傍の1つ以上の画素が、輪郭画素それ自身と異な
る値(白:0,黒:1)を有する画素である。
以上述べた分類により緩弧パターンを分類すると第4
図に示した。
図に示した。
(a),(b) は白の線図形の内部画素、 (f),(g) は黒の線図形の内部画素、 (c),(d),(d′),(e) は白の線図形の輪
郭画素、 (h),(i),(i′),(j) は黒の線図形の輪
郭画素、 を中心画素とする緩弧パターンである。
郭画素、 (h),(i),(i′),(j) は黒の線図形の輪
郭画素、 を中心画素とする緩弧パターンである。
緩弧パターンをその輪郭線の法線ベクトルに着目して
分類する。デイジタル弧からなる輪郭線の法線ベクトル
を定義するために、デイジタル弧の輪郭線の接線ベクト
ルについて考える。線図形の内部を左手に見て進む方向
に各輪郭画素の順序付けを行う。いま、前記のように順
序付けされた輪郭画素をpi-k,pi,pi+k(K=1)とす
る。ここで、デイジタル弧を定義したと同じように、pi
からpjへのベクトルijは、piおよびpjをX−Y座標系
の各点としたとき、X軸を基準として直線pipjのなす角
度(単位deg)およびその長さ|pipj|で表す。ただし、
角度はx軸を基準(0゜)として時計周りを正方向とす
る。輪郭画素piにおける接線ベクトルは、t =(i-k+i+k)/2 ただし、i-k:pi-kからpiへのベクトルi+k :piからpi+kへのベクトル と定義する。輪郭画素piにおける法線ベクトルnは接
線ベクトルと直交するので、法線ベクトルnのx軸と
なる角∠n(法線の方向)は、∠n=∠t+∠R ただし、∠R:90deg と定義する。法線ベクトルnの方向により緩弧パター
ンを分類した結果を第5図および第6図に示す。第5図
は黒の線図形に含まれる緩弧パターンを分類した図であ
り、第6図は白の線図形に含まれる緩弧パターンを分類
した図である。
分類する。デイジタル弧からなる輪郭線の法線ベクトル
を定義するために、デイジタル弧の輪郭線の接線ベクト
ルについて考える。線図形の内部を左手に見て進む方向
に各輪郭画素の順序付けを行う。いま、前記のように順
序付けされた輪郭画素をpi-k,pi,pi+k(K=1)とす
る。ここで、デイジタル弧を定義したと同じように、pi
からpjへのベクトルijは、piおよびpjをX−Y座標系
の各点としたとき、X軸を基準として直線pipjのなす角
度(単位deg)およびその長さ|pipj|で表す。ただし、
角度はx軸を基準(0゜)として時計周りを正方向とす
る。輪郭画素piにおける接線ベクトルは、t =(i-k+i+k)/2 ただし、i-k:pi-kからpiへのベクトルi+k :piからpi+kへのベクトル と定義する。輪郭画素piにおける法線ベクトルnは接
線ベクトルと直交するので、法線ベクトルnのx軸と
なる角∠n(法線の方向)は、∠n=∠t+∠R ただし、∠R:90deg と定義する。法線ベクトルnの方向により緩弧パター
ンを分類した結果を第5図および第6図に示す。第5図
は黒の線図形に含まれる緩弧パターンを分類した図であ
り、第6図は白の線図形に含まれる緩弧パターンを分類
した図である。
緩弧パターンの個数を用いた画像の品質評価の方法に
ついて述べる。
ついて述べる。
画像の評価は、たとえば、第5図および第6図に示し
た緩弧パターンを観測することにより可能となる。
た緩弧パターンを観測することにより可能となる。
今、一定時間間隔でサンプリングされた緩弧パターン
の個数および総パターン数を以下のように定義する。
の個数および総パターン数を以下のように定義する。
総パターン数:Nt グループ番号iの緩弧パターンの数:ni ここで、特徴ある緩弧パターンの個数を以下のように
呼ぶ。
呼ぶ。
全黒パターンの個数:Nb=n1 全白パターンの個数:Nw=n11 黒内部パターンの個数:Nbi=n1+n2 白内部パターンの個数:Nwi=n11+n22 (1)面積率 デイジタル画像上での線図形の定義より、線図形はデ
イジタル弧からなる輪郭線の長さに対する内部画素の比
率はある値以下である。この比率を面積率ESとすると 面積率Es=min(Nbi/Nbe,Nwi/Nwe) となる。ただし、min(x1,x2)は x=x1 for x1≦x2 x=x2 for x2≦x1 とする関数を表す。
イジタル弧からなる輪郭線の長さに対する内部画素の比
率はある値以下である。この比率を面積率ESとすると 面積率Es=min(Nbi/Nbe,Nwi/Nwe) となる。ただし、min(x1,x2)は x=x1 for x1≦x2 x=x2 for x2≦x1 とする関数を表す。
(2)双対性 文字や線,記号など2値の図形は、ある領域の中で輪
郭画素の法線方向が対向するパターンの個数はほぼ等し
い。第5図における法線方向が180゜異なる、たとえ
ば、グループ番号3の緩弧パターンとグループ番号7の
緩弧パターンは対向している。対向するパターンの個数
等しさを表すパラメータとして双対率を定義する。双対
率は、双対と見る角度の大きさにより任意に定義できる
が、ここでは第5図に示したように45゜の大きさで分割
して求めた。
郭画素の法線方向が対向するパターンの個数はほぼ等し
い。第5図における法線方向が180゜異なる、たとえ
ば、グループ番号3の緩弧パターンとグループ番号7の
緩弧パターンは対向している。対向するパターンの個数
等しさを表すパラメータとして双対率を定義する。双対
率は、双対と見る角度の大きさにより任意に定義できる
が、ここでは第5図に示したように45゜の大きさで分割
して求めた。
双対率Ep=max(Epb,Epw) ただし、 Epb=max(Epb1,Epb2,Epb3,Epb4) Epw=max(Epw1,Epw2,Epw3,Epw4) Epb1={|n3−n7|/(n3+n7)} Epb2={|n4−n8|/(n4+n8)} Epb3={|n5−n9|/(n3+n9)} Epb4={|n6−n10|/(n3+n10)} Epw1={|n13−n17|/(n13+n17)} Epw2={|n14−n18|/(n14+n18)} Epw3={|n15−n19|/(n15+n19)} Epw4={|n16−n20|/(n16+n20)} max(x1,x2)は x=x1 for x1≧x2 x=x2 for x2>x1 とする関数を表す。
(3)画像の美しさ 画像の美しさは、2値画素からなる図形の滑らかな輪
郭線を有る割合で評価する。この画質評価値Ωは、 Ω=Nsmooth/Npattern で表す。ただし、 Npattern=Nt−(n1+n11) 以上、説明した画像の評価方法により、実際の文書を
評価した結果について述べる。
郭線を有る割合で評価する。この画質評価値Ωは、 Ω=Nsmooth/Npattern で表す。ただし、 Npattern=Nt−(n1+n11) 以上、説明した画像の評価方法により、実際の文書を
評価した結果について述べる。
第7図は、2種類の文書の画像を評価した結果であ
る。1つは雑誌であり、他の1つは、手書き文書であ
る。雑誌は活字で鮮明に印刷された活字文書であり、手
書き文書はジアゾコピーで青焼された青焼文書である。
つまり、第7図は異なつた2値化閾値で2値化した文書
の画像を緩弧パターンを観測することにより評価した結
果である。横軸は文書を2値化したときの2値化閾値で
あり、縦軸は画像の美しさで説明した画質評価値Ωであ
る。それぞれの文書とも2値化する閾値により、画質評
価値Ωは一つのピークを有する曲線を描く。文書により
画質評価値Ωが最大となる2値化閾値は異なり、その画
質評価値Ωの最大値も異なる。
る。1つは雑誌であり、他の1つは、手書き文書であ
る。雑誌は活字で鮮明に印刷された活字文書であり、手
書き文書はジアゾコピーで青焼された青焼文書である。
つまり、第7図は異なつた2値化閾値で2値化した文書
の画像を緩弧パターンを観測することにより評価した結
果である。横軸は文書を2値化したときの2値化閾値で
あり、縦軸は画像の美しさで説明した画質評価値Ωであ
る。それぞれの文書とも2値化する閾値により、画質評
価値Ωは一つのピークを有する曲線を描く。文書により
画質評価値Ωが最大となる2値化閾値は異なり、その画
質評価値Ωの最大値も異なる。
第8図,第9図に画質評価の対象となつた活字文書と
青焼文書を、いろいろな2値化閾値で2値化した例を示
す。第8図,第9図の(a)は2値化閾値の低い場合で
あり、それぞれの文書中の文字に“細り”や“切れ”が
生じている。また、(c)は2値化閾値が高い場合であ
り、それぞれの文書中に細かい“汚れ”や文字の“つぶ
れ”が生じている。(b)は人間の主観的評価で最良の
画質と判断した画像である。画質評価値Ωの最大値とす
る2値化閾値とほぼ一致している。
青焼文書を、いろいろな2値化閾値で2値化した例を示
す。第8図,第9図の(a)は2値化閾値の低い場合で
あり、それぞれの文書中の文字に“細り”や“切れ”が
生じている。また、(c)は2値化閾値が高い場合であ
り、それぞれの文書中に細かい“汚れ”や文字の“つぶ
れ”が生じている。(b)は人間の主観的評価で最良の
画質と判断した画像である。画質評価値Ωの最大値とす
る2値化閾値とほぼ一致している。
第8図,第9図より画像の美しさで定義した画質評価
値Ωは、人間の感覚と強い相関があることがわかる。つ
まり、画質評価値Ωの最大値とする2値化閾値より、そ
の文書の最適な2値化閾値を決めることができる N画素×N画素の窓を通して、そのパターンを観測す
る画像の評価は、複数個の閾値ごとに時間的に並行して
行われる。また、演算回路は、それらの画像評価回路に
よつて求められた評価値を用いて最適な閾値を演算を行
う。これらの複数の画像評価回路および演算回路によつ
て、閾値の自動設定を行うと共に、並列的な画像品質の
評価処理により入力のスループツトを向上させる。
値Ωは、人間の感覚と強い相関があることがわかる。つ
まり、画質評価値Ωの最大値とする2値化閾値より、そ
の文書の最適な2値化閾値を決めることができる N画素×N画素の窓を通して、そのパターンを観測す
る画像の評価は、複数個の閾値ごとに時間的に並行して
行われる。また、演算回路は、それらの画像評価回路に
よつて求められた評価値を用いて最適な閾値を演算を行
う。これらの複数の画像評価回路および演算回路によつ
て、閾値の自動設定を行うと共に、並列的な画像品質の
評価処理により入力のスループツトを向上させる。
以下、本発明を、実施例にもとづいて説明する。
第1図は本発明の一実施例である画像入力装置の機能
ブロツク図である。
ブロツク図である。
同装置は紙面上の画像を光学的に走査して光−電気変
換を行い多値画像データ111を出力するところの画像走
査部110、多値画像データを一時蓄積する多値画像メモ
リ200、多値画像メモリの出力を最適閾値1010にもとづ
いて2値化する2値化回路300、2値画像データ310を一
時的に蓄積する画像メモリ400、画像メモリ400に蓄えら
れた2値画像データ310の冗長性圧縮(データ圧縮)を
行い、かつ、光デイスク700に蓄えられ符号化された2
値画像データを復元する圧縮伸長回路600、2値画像デ
ータを蓄える光デイスク700、画像メモリの内容の画像
を表示するデイスプレイ500、多値画像データ111を用い
各閾値での画質の評価を行ない評価データ811,821,831,
841を出力する画質評価回路810,820,830,840、2値化の
ための閾値を記憶する閾値パラメータ記憶回路900、お
よび各閾種での評価データ811,821,831,841からその画
像の最適な2値化のための閾値を演算し最適閾値1010を
出力する最適閾値演算回路1000とから成り立つている。
換を行い多値画像データ111を出力するところの画像走
査部110、多値画像データを一時蓄積する多値画像メモ
リ200、多値画像メモリの出力を最適閾値1010にもとづ
いて2値化する2値化回路300、2値画像データ310を一
時的に蓄積する画像メモリ400、画像メモリ400に蓄えら
れた2値画像データ310の冗長性圧縮(データ圧縮)を
行い、かつ、光デイスク700に蓄えられ符号化された2
値画像データを復元する圧縮伸長回路600、2値画像デ
ータを蓄える光デイスク700、画像メモリの内容の画像
を表示するデイスプレイ500、多値画像データ111を用い
各閾値での画質の評価を行ない評価データ811,821,831,
841を出力する画質評価回路810,820,830,840、2値化の
ための閾値を記憶する閾値パラメータ記憶回路900、お
よび各閾種での評価データ811,821,831,841からその画
像の最適な2値化のための閾値を演算し最適閾値1010を
出力する最適閾値演算回路1000とから成り立つている。
処理の流れの概要を次に説明する。
入力すべき文書などの書類100を画像走査部110にセツ
トする。画像走査部110は書類100を光学的に走査して画
像データ111を出力する。画像データ111は画像の濃淡情
報を表す多値画像データ111−1(第1図には図示せ
ず)および画像を走査して得られるタイミング信号111
−2(第1図には図示せず)からなる。さらに、タイミ
ング信号は画素単位に発生する画素クロツク信号、行単
位で発生する行クロツク信号および頁単位で発生する頁
クロツク信号から構成される。
トする。画像走査部110は書類100を光学的に走査して画
像データ111を出力する。画像データ111は画像の濃淡情
報を表す多値画像データ111−1(第1図には図示せ
ず)および画像を走査して得られるタイミング信号111
−2(第1図には図示せず)からなる。さらに、タイミ
ング信号は画素単位に発生する画素クロツク信号、行単
位で発生する行クロツク信号および頁単位で発生する頁
クロツク信号から構成される。
多値画像データ111は多値画像メモリ200に一時的に記
憶される。この多値画像データが一時記憶されている時
間は、次の2値化回路300で必要な最適閾値1010を計算
するのに要する処理時間である。多値画像データは最適
閾値演算回路1000で演算される最適閾値で2値化され
る。2値化された2値画像データ310は、複数頁分の容
量を有する画像メモリ400に蓄えられる。画像メモリ内
の画像はデイスプレイ500に送り、表示することができ
る。また、2値画像データは、圧縮伸長回路600を通し
て光デイスク700に蓄積される。
憶される。この多値画像データが一時記憶されている時
間は、次の2値化回路300で必要な最適閾値1010を計算
するのに要する処理時間である。多値画像データは最適
閾値演算回路1000で演算される最適閾値で2値化され
る。2値化された2値画像データ310は、複数頁分の容
量を有する画像メモリ400に蓄えられる。画像メモリ内
の画像はデイスプレイ500に送り、表示することができ
る。また、2値画像データは、圧縮伸長回路600を通し
て光デイスク700に蓄積される。
多値画像データ111は閾値パラメータ記憶回路900に記
憶された複数の評価閾値910を用いて、各、画像評価回
路810,820,830,840で2値化を行い、2値化された画像
データを評価する。各、画像評価回路は多値画像データ
を同時に並行して評価を行う。
憶された複数の評価閾値910を用いて、各、画像評価回
路810,820,830,840で2値化を行い、2値化された画像
データを評価する。各、画像評価回路は多値画像データ
を同時に並行して評価を行う。
最適閾値演算回路1000は、画像評価回路の評価データ
811,821,831,841を用いて最適な閾値の演算を行う。最
適閾値演算回路は評価データを用いても最適な閾値が演
算できない状況もある。その場合は、以前に演算して求
めた閾値を使用する。そのため最適閾値演算回路内に演
算して求めた閾値を格納する閾値レジスタ(図示せず)
を設ける。電源投入時、またはリセツト時、この閾値レ
ジスタには、回路内に設定された標準閾値の値が設定さ
れる。閾値レジスタの出力が最適閾値1010となる。
811,821,831,841を用いて最適な閾値の演算を行う。最
適閾値演算回路は評価データを用いても最適な閾値が演
算できない状況もある。その場合は、以前に演算して求
めた閾値を使用する。そのため最適閾値演算回路内に演
算して求めた閾値を格納する閾値レジスタ(図示せず)
を設ける。電源投入時、またはリセツト時、この閾値レ
ジスタには、回路内に設定された標準閾値の値が設定さ
れる。閾値レジスタの出力が最適閾値1010となる。
本発明の基本である画像評価回路810,820,830,840に
ついて詳しく述べる。
ついて詳しく述べる。
画像評価回路は同一の構成である。ただ、それぞれの
評価に使用する評価閾値910が異なる。画像評価回路の
機能ブロツク図を第2図に示す。
評価に使用する評価閾値910が異なる。画像評価回路の
機能ブロツク図を第2図に示す。
画像評価回路は多値画像データ111−1を2値化する
2値化回路812、2値化した2値画像データ851を一時的
に記憶するラインバッファ813、2値画像データの書き
込みアドレスを設定する書き込みアドレス回路860、ラ
インバッファ内の2値画像データを読みだすアドレスを
設定する読みだしアドレス回路861、読みだされたデー
タを格納するパターンレジスタ814,パターンレジスタの
値であるパターンコード852をアドレスするマツチング
用ROM(Read Only Memory)815、マツチング用ROMの出
力を格納する分類コードレジスタ816、分類コードレジ
スタの出力である分類コード853をアドレスする計測RAM
(Random Access Memory)817、計測用RAMの内容を読み
だし、その値に1加え、読み出した同じアドレスに格納
するための加算器818から構成される。
2値化回路812、2値化した2値画像データ851を一時的
に記憶するラインバッファ813、2値画像データの書き
込みアドレスを設定する書き込みアドレス回路860、ラ
インバッファ内の2値画像データを読みだすアドレスを
設定する読みだしアドレス回路861、読みだされたデー
タを格納するパターンレジスタ814,パターンレジスタの
値であるパターンコード852をアドレスするマツチング
用ROM(Read Only Memory)815、マツチング用ROMの出
力を格納する分類コードレジスタ816、分類コードレジ
スタの出力である分類コード853をアドレスする計測RAM
(Random Access Memory)817、計測用RAMの内容を読み
だし、その値に1加え、読み出した同じアドレスに格納
するための加算器818から構成される。
画像評価回路における処理の流れを説明する。
文書,図面を走査して得られる多値画像データ111−
1は2値化回路812で2値化され、デイジタル画像上の
線図形として取り扱うことができる。この2値化のため
の評価閾値910は、閾値パラメータ記憶回路900より与え
られる。2値画像データは書き込みアドレス設定回路86
0で決められたラインバッファ813のアドレスに格納され
る。ラインバッファはN行分の2値画像データが格納で
きる。このラインバッファはN画素×N画素の窓を通し
て線図形のパターンを観測するために使われる。2値画
像データは1行づつ順番にラインバッファに書き込まれ
る。しかし、ラインバッファの読みだし動作はN画素×
N画素分の2値画像データが一度で行われる。読みださ
れたN×Nbitのデータはパターンレジスタ814に格納さ
れる。N画素×N画素のパターンレジスタへの格納はタ
イミング信号111−2中の画素クロツク信号に同期して
行われる。
1は2値化回路812で2値化され、デイジタル画像上の
線図形として取り扱うことができる。この2値化のため
の評価閾値910は、閾値パラメータ記憶回路900より与え
られる。2値画像データは書き込みアドレス設定回路86
0で決められたラインバッファ813のアドレスに格納され
る。ラインバッファはN行分の2値画像データが格納で
きる。このラインバッファはN画素×N画素の窓を通し
て線図形のパターンを観測するために使われる。2値画
像データは1行づつ順番にラインバッファに書き込まれ
る。しかし、ラインバッファの読みだし動作はN画素×
N画素分の2値画像データが一度で行われる。読みださ
れたN×Nbitのデータはパターンレジスタ814に格納さ
れる。N画素×N画素のパターンレジスタへの格納はタ
イミング信号111−2中の画素クロツク信号に同期して
行われる。
2値化された画像の品質を評価するためには、このN
×Nbitパターンを決められたグループに分類し、グルー
プごとのパターンの個数を計測する必要がある。
×Nbitパターンを決められたグループに分類し、グルー
プごとのパターンの個数を計測する必要がある。
N=3の場合、パターンレジスタ814に読みだされた
パターンは、第5図と第6図に示した20種類の緩弧パタ
ーンおよびそれ以外のパターンに分類できる。パターン
レジスタの値であるパターンコード852は3画素×3画
素の各画素の“1"または“0"の値を9bitの数値として表
す。マツチング用ROM815はパターンコードをアドレスと
し、クラスタリングのためのグループ番号を出力する。
第5図と第6図に示した緩弧パターンの第一項目がクラ
スタリングのためのグループ番号であり、緩弧パターン
の下に記した数字はその緩弧パターンを8進数の数値で
表したパターンコードである。ただし、緩弧パターン以
外のパターンのグループ番号は、“0"とする。グループ
番号は、タイミング信号111−2中の画素クロツク信号
に同期して、分類コードレジスタ816に出力される。
パターンは、第5図と第6図に示した20種類の緩弧パタ
ーンおよびそれ以外のパターンに分類できる。パターン
レジスタの値であるパターンコード852は3画素×3画
素の各画素の“1"または“0"の値を9bitの数値として表
す。マツチング用ROM815はパターンコードをアドレスと
し、クラスタリングのためのグループ番号を出力する。
第5図と第6図に示した緩弧パターンの第一項目がクラ
スタリングのためのグループ番号であり、緩弧パターン
の下に記した数字はその緩弧パターンを8進数の数値で
表したパターンコードである。ただし、緩弧パターン以
外のパターンのグループ番号は、“0"とする。グループ
番号は、タイミング信号111−2中の画素クロツク信号
に同期して、分類コードレジスタ816に出力される。
計測用RAM817および加算器818は、グループ番号に属
するパターンの個数を計測する。電源投入時,リセツト
時、またはタイミング信号111−2の頁クロツク信号で
この計測用RAMはすべて“0"にクリアされる。計測用RAM
はグループ番号をアドレスとして、その計測値が読みだ
される。計測値は加算器に導かれ+1加算して同じアド
レスに書き込まれる。つまり、そのグループ番号に属す
るパターンの個数を計測することができる。
するパターンの個数を計測する。電源投入時,リセツト
時、またはタイミング信号111−2の頁クロツク信号で
この計測用RAMはすべて“0"にクリアされる。計測用RAM
はグループ番号をアドレスとして、その計測値が読みだ
される。計測値は加算器に導かれ+1加算して同じアド
レスに書き込まれる。つまり、そのグループ番号に属す
るパターンの個数を計測することができる。
この計測値はそのグループ番号が検出されるごとに遂
次リアルタイムで増加する。グループ番号に対応するこ
の計測値の組が、評価閾値の評価データ841として出力
される。つまり、この評価データを一定時間間隔でサン
プリングすることにより、この時間で走査したが画像中
のそれぞれの緩弧パターンおよびそれ以外のパターンの
個数を計測することができる。
次リアルタイムで増加する。グループ番号に対応するこ
の計測値の組が、評価閾値の評価データ841として出力
される。つまり、この評価データを一定時間間隔でサン
プリングすることにより、この時間で走査したが画像中
のそれぞれの緩弧パターンおよびそれ以外のパターンの
個数を計測することができる。
つぎに最適閾値演算回路1000の動作について述べる。
評価データ811,821,831,841を使用して、それぞれの
評価閾値910で2値化した図形の面積率,双対率の算出
および画像の美しさの評価ができる。それぞれの評価閾
値のうち、「どの評価閾値が最適な閾値であるか」の決
定法について述べる。
評価閾値910で2値化した図形の面積率,双対率の算出
および画像の美しさの評価ができる。それぞれの評価閾
値のうち、「どの評価閾値が最適な閾値であるか」の決
定法について述べる。
基本的には画像の美しさを表す画質評価値Ωが極大値
となる評価閾値を最適閾値1010とする。
となる評価閾値を最適閾値1010とする。
しかし、真つ白の用紙の上に、古い新聞の切り抜きが
貼つてある文書などの濃度レベルが多数ある文書では、
画質評価値Ωが2つ以上の極大値を示す。
貼つてある文書などの濃度レベルが多数ある文書では、
画質評価値Ωが2つ以上の極大値を示す。
ここで、最適閾値を判定する領域内で、文字や線を表
す線図形の濃度レベルは、単一とする。真つ白の用紙,
古い新聞紙など、その他の濃度レベルは、面図形とす
る。通常のオフイスで使われる大多数の文書は、この条
件を満たしており、これは大きな制約とならない。
す線図形の濃度レベルは、単一とする。真つ白の用紙,
古い新聞紙など、その他の濃度レベルは、面図形とす
る。通常のオフイスで使われる大多数の文書は、この条
件を満たしており、これは大きな制約とならない。
今、評価パタメータ記憶回路900から与えられる複数
の評価閾値910の中の評価閾値Xiに対する2値画像の面
積率をEsi、双対率をEpi、画質評価値をΩiとする。た
だし、1≦i≦Mとする。
の評価閾値910の中の評価閾値Xiに対する2値画像の面
積率をEsi、双対率をEpi、画質評価値をΩiとする。た
だし、1≦i≦Mとする。
ここで、線図形を特徴づける面積率および双対率の上
限値を、εs,εpとすると、 最適閾値Xoptは εs≧Esi εp≧Epi を満たすiの中で、Ωiを最大にするXiである。すべて
のiに対して εs≧Esi εp≧Epi を満たすiが存在しないとき、前回の最適閾値Xoptを使
用する。
限値を、εs,εpとすると、 最適閾値Xoptは εs≧Esi εp≧Epi を満たすiの中で、Ωiを最大にするXiである。すべて
のiに対して εs≧Esi εp≧Epi を満たすiが存在しないとき、前回の最適閾値Xoptを使
用する。
最適閾値演算回路1000の機能ブロツク図を第3図に示
す。
す。
最適閾値演算回路は最適閾値を格納する閾値レジスタ
1011、標準閾値を格納する標準閾値レジスタ1020、評価
でデータなどを格納するデータメモリ1030、最適閾値演
算回路を制御するCPU(中央制御装置)1040、制御用の
プログラムを格納するプログラムメモリ1050、画像評価
回路810,820,830,840からの評価データ811,821,831,841
を入力する評価データ入力回路1061,1062,1063,1064、
閾値パラメータ記憶回路900からの評価閾値を入力する
閾値入力回路1080から構成される。
1011、標準閾値を格納する標準閾値レジスタ1020、評価
でデータなどを格納するデータメモリ1030、最適閾値演
算回路を制御するCPU(中央制御装置)1040、制御用の
プログラムを格納するプログラムメモリ1050、画像評価
回路810,820,830,840からの評価データ811,821,831,841
を入力する評価データ入力回路1061,1062,1063,1064、
閾値パラメータ記憶回路900からの評価閾値を入力する
閾値入力回路1080から構成される。
最適閾値演算回路における処理の流れを説明する。
電源投入時、またはリセツト時、標準閾値レジスタ10
20に設定されている標準閾値が閾値レジスタ1011にセツ
トされる。
20に設定されている標準閾値が閾値レジスタ1011にセツ
トされる。
CPU1040は、一定時間T(行クロツク信号のL倍:Lは
正の整数)ごと各評価データ入力回路810,820,830,840
に評価データ811,821,831,841読み取りのデータサンプ
リング命令を出す。読み取られた評価データは、データ
メモリ1030に遂次蓄えられる。データメモリはK回分の
各、評価データの格納領域を有する。K+1個目の評価
データが読み込まれると最初に読み込まれた評価データ
は消滅する。つまり、データメモリはシフトレジスタ構
造になつている。
正の整数)ごと各評価データ入力回路810,820,830,840
に評価データ811,821,831,841読み取りのデータサンプ
リング命令を出す。読み取られた評価データは、データ
メモリ1030に遂次蓄えられる。データメモリはK回分の
各、評価データの格納領域を有する。K+1個目の評価
データが読み込まれると最初に読み込まれた評価データ
は消滅する。つまり、データメモリはシフトレジスタ構
造になつている。
最初の評価データを格納する領域を第1領域、2番目
の評価データを格納する領域を第2領域、同時に、K番
目の評価データを格納する領域を第K領域とする。第K
領域の評価データから第1領イの評価データを引くこと
により、この間の緩弧パターンの個数およびそれ以外の
個数を求めることができる。
の評価データを格納する領域を第2領域、同時に、K番
目の評価データを格納する領域を第K領域とする。第K
領域の評価データから第1領イの評価データを引くこと
により、この間の緩弧パターンの個数およびそれ以外の
個数を求めることができる。
この緩弧パターンの個数およびそれ以外の個数より、
前記に述べた方法で閾値入力回路1080の評価閾値を参照
して最適閾値を演算できる。この最適閾値が閾値レジス
タにセツトされる。この演算はT時間間隔で行う。
前記に述べた方法で閾値入力回路1080の評価閾値を参照
して最適閾値を演算できる。この最適閾値が閾値レジス
タにセツトされる。この演算はT時間間隔で行う。
最後に、多値画像メモリ200に多値画像データ111が記
憶されている時間(遅延時間)について述べる。
憶されている時間(遅延時間)について述べる。
2値化する多値画像データの前後L×K/2行分の多値
画像データを参照して最適閾値を決めるために、多値画
像メモリはT×K/2時間の期間多値画像データの遅延を
行う。
画像データを参照して最適閾値を決めるために、多値画
像メモリはT×K/2時間の期間多値画像データの遅延を
行う。
なお、実施例では3×3のパターンについて詳しく述
べてきたが、4×4,5×5などのパターンでも同様に評
価が可能である。
べてきたが、4×4,5×5などのパターンでも同様に評
価が可能である。
データメモリを使用せず、1頁単位に最適閾値を求め
てもよい。この場合、1頁分の多値画像メモリが必要と
なる。
てもよい。この場合、1頁分の多値画像メモリが必要と
なる。
2値化の手法自体1つに限られたことではない。たと
えば、空間フイルタを施して2値化することにより、光
学系のぼけを補正するなどの高度な2値化方法もある
が、これらを2値化回路300に採用してもよい。
えば、空間フイルタを施して2値化することにより、光
学系のぼけを補正するなどの高度な2値化方法もある
が、これらを2値化回路300に採用してもよい。
本発明は以前に発明した画像入力方式(318,403,51
4)と組合せてもよい。
4)と組合せてもよい。
以上説明したごとく、本発明方式によれば従来オペレ
ータがデイスプレイで1枚づつ入力画像の品質を確認
し、不適切な場合には2値化の閾値を選択し再度入力,
走査するという必要がなくなり入力作業のスループツト
が大幅に向上する。また、真つ白の用紙の上に、古い新
聞の切り抜きが貼つてある文書など、濃度レベルが多数
ある文書でも2値化の閾値を自動的に選択することが可
能となる。
ータがデイスプレイで1枚づつ入力画像の品質を確認
し、不適切な場合には2値化の閾値を選択し再度入力,
走査するという必要がなくなり入力作業のスループツト
が大幅に向上する。また、真つ白の用紙の上に、古い新
聞の切り抜きが貼つてある文書など、濃度レベルが多数
ある文書でも2値化の閾値を自動的に選択することが可
能となる。
第1図は本発明の一実施例による画像入力方式が採用し
た画像入力装置の機能ブロツク図、第2図は画像評価回
路の機能ブロツク図、第3図は最適閾値演算回路の機能
ブロツク図、第4図は3画素×3画素を窓とする緩弧パ
ターンの代表例を示す図、第5図は3画素×3画素を窓
とする黒画素を中心画素とする緩弧パターンを示す図、
第6図は3画素×3画素を窓とする白画素を中心画素と
する緩弧パターンを示す図、第7図は文書画像を評価し
た結果を示す図、第8図は活字文書の例を示す図、第9
図は手書き文書の例を示す図である。 100……書類、110……画像走査部、111……多値画像デ
ータ、200……多値画像メモリ、300……2値化回路、40
0……画像メモリ、500……デイスプレイ、600……圧縮
伸長回路、700……光デイスク、811,821,831,841……評
価データ、900……閾値パラメータ記憶回路、1000……
最適閾値演算回路。
た画像入力装置の機能ブロツク図、第2図は画像評価回
路の機能ブロツク図、第3図は最適閾値演算回路の機能
ブロツク図、第4図は3画素×3画素を窓とする緩弧パ
ターンの代表例を示す図、第5図は3画素×3画素を窓
とする黒画素を中心画素とする緩弧パターンを示す図、
第6図は3画素×3画素を窓とする白画素を中心画素と
する緩弧パターンを示す図、第7図は文書画像を評価し
た結果を示す図、第8図は活字文書の例を示す図、第9
図は手書き文書の例を示す図である。 100……書類、110……画像走査部、111……多値画像デ
ータ、200……多値画像メモリ、300……2値化回路、40
0……画像メモリ、500……デイスプレイ、600……圧縮
伸長回路、700……光デイスク、811,821,831,841……評
価データ、900……閾値パラメータ記憶回路、1000……
最適閾値演算回路。
───────────────────────────────────────────────────── フロントページの続き (72)発明者 花野井 歳弘 小田原市国府津2880番地 株式会社日立 製作所小田原工場内 (56)参考文献 特公 昭63−36035(JP,B2)
Claims (3)
- 【請求項1】紙面を走査して上記紙面上の光学的画像を
多値画像情報に変換する画像走査手段と、上記画像走査
手段により得られた上記多値画像情報を所定の閾値に基
づいて二値化して得られる二値画像情報について、その
二値画像情報の品質を評価する複数の画像評価手段であ
って、各々の画像評価手段は、 上記多値画像情報を上記所定の閾値に基づいて二値化す
る二値化手段と、 上記二値化手段により得られた二値画像情報を一時的に
記憶するバッファと、 所定の大きさの矩形領域であって輪郭線の曲率が所定の
大きさ以下に制限された二値の線図形を構成する特定の
パターンである緩弧パターンをあらかじめ記憶してお
き、上記バッファに記憶された上記二値画像情報から順
次切り出された上記矩形領域に相当する領域と上記緩弧
パターンとを照合する照合手段と、 上記照合手段による照合結果を受けて、上記二値画像情
報中の上記緩弧パターンに該当する上記領域の個数を計
測する計測手段を有し、かつ、 上記複数の画像評価手段は、相異なる前記所定の閾値を
用いて上記画像の品質の評価結果を、それぞれ出力し、 上記複数の画像評価手段から出力された上記画像の品質
の評価結果に基づいて上記相異なる所定の閾値より最適
閾値を決定する最適閾値演算手段とを有する画像入力装
置。 - 【請求項2】特許請求の範囲第1項記載の画像入力装置
において、 上記各々の画像評価手段の上記緩弧パターンについて、
上記矩形領域の中心画素が上記二値の線図形の内部画素
から輪郭画素であるか分類し、さらに上記中心画素が上
記輪郭画素である場合には上記二値の線図形の輪郭線が
上記矩形領域中に占める位置によって分類してカテゴリ
ー分けしておき、 上記計測手段は上記カテゴリーごとに、該当する上記領
域の個数を計測する画像入力装置。 - 【請求項3】特許請求の範囲第2項記載の画像入力装置
において、 上記最適閾値演算手段は、 上記画像評価手段から出力された上記カテゴリーごとの
該当する領域の個数に基づいて、上記二値画像情報にお
ける線図形の輪郭線の長さに対する上記輪郭線で囲まれ
た領域の面積の比率である面積率、対向する輪郭線の状
況を表す双対率および滑らかな輪郭線の存在する割合を
表す画質評価値を演算して、 上記相異なる所定の閾値より最適閾値を決定することを
特徴とする画像入力装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP62116806A JP2613211B2 (ja) | 1987-05-15 | 1987-05-15 | 画像入力装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP62116806A JP2613211B2 (ja) | 1987-05-15 | 1987-05-15 | 画像入力装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPS63283272A JPS63283272A (ja) | 1988-11-21 |
JP2613211B2 true JP2613211B2 (ja) | 1997-05-21 |
Family
ID=14696119
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP62116806A Expired - Fee Related JP2613211B2 (ja) | 1987-05-15 | 1987-05-15 | 画像入力装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2613211B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2936766B2 (ja) * | 1991-01-31 | 1999-08-23 | 日本電気株式会社 | 画像入力装置 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS5781687A (en) * | 1980-11-08 | 1982-05-21 | Fuji Electric Co Ltd | Optimum binary-coding system |
-
1987
- 1987-05-15 JP JP62116806A patent/JP2613211B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JPS63283272A (ja) | 1988-11-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3748172B2 (ja) | 画像処理装置 | |
JP3748164B2 (ja) | パターン抽出装置 | |
JP5008572B2 (ja) | 画像処理方法、画像処理装置およびコンピュータ可読媒体 | |
JP2940936B2 (ja) | 表領域識別方法 | |
Bloomberg | Multiresolution morphological approach to document image analysis | |
Jackel et al. | An application of neural net chips: Handwritten digit recognition | |
JP2002133426A (ja) | 多値画像から罫線を抽出する罫線抽出装置 | |
CN109740572A (zh) | 一种基于局部彩色纹理特征的人脸活体检测方法 | |
CN110598703B (zh) | 一种基于深度神经网络的ocr识别方法及装置 | |
CN112507782A (zh) | 文本图像的识别方法及装置 | |
JP4149464B2 (ja) | 画像処理装置 | |
JP4275866B2 (ja) | カラー画像から文字列パターンを抽出する装置および方法 | |
Chhabra et al. | Detection of horizontal lines in noisy run length encoded images: The FAST method | |
JP2005302056A (ja) | パターン抽出装置 | |
JP2613211B2 (ja) | 画像入力装置 | |
CN114926829A (zh) | 一种证件检测方法、装置、电子设备及存储介质 | |
Okun et al. | A survey of texture-based methods for document layout analysis | |
JP4116377B2 (ja) | 画像処理方法および画像処理装置 | |
JP3476595B2 (ja) | 画像領域分割方法、および画像2値化方法 | |
JPH04105186A (ja) | 自動文書入力装置 | |
EP0446630A2 (en) | Method and apparatus for segmenting characters in an amount field on a financial document | |
JP3756660B2 (ja) | 画像認識方法、装置および記録媒体 | |
JP3104355B2 (ja) | 特徴抽出装置 | |
JPS62217387A (ja) | パタ−ン識別装置 | |
JP2882912B2 (ja) | 多重解像度処理組込型ハフ変換法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
LAPS | Cancellation because of no payment of annual fees |