JPS62217387A - パタ−ン識別装置 - Google Patents
パタ−ン識別装置Info
- Publication number
- JPS62217387A JPS62217387A JP61060307A JP6030786A JPS62217387A JP S62217387 A JPS62217387 A JP S62217387A JP 61060307 A JP61060307 A JP 61060307A JP 6030786 A JP6030786 A JP 6030786A JP S62217387 A JPS62217387 A JP S62217387A
- Authority
- JP
- Japan
- Prior art keywords
- black
- image
- pixels
- bit
- counting
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000010586 diagram Methods 0.000 description 9
- 238000000034 method Methods 0.000 description 9
- 238000004458 analytical method Methods 0.000 description 5
- 238000004422 calculation algorithm Methods 0.000 description 4
- 238000007781 pre-processing Methods 0.000 description 4
- 238000000926 separation method Methods 0.000 description 4
- 238000012916 structural analysis Methods 0.000 description 4
- 230000011218 segmentation Effects 0.000 description 3
- 230000003044 adaptive effect Effects 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 238000007619 statistical method Methods 0.000 description 2
- 240000007594 Oryza sativa Species 0.000 description 1
- 235000007164 Oryza sativa Nutrition 0.000 description 1
- 239000003795 chemical substances by application Substances 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- 238000013144 data compression Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 235000009566 rice Nutrition 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
Landscapes
- Image Analysis (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
(産業上の利用分野)
本発明は、文書画像処理装置において、対象とする画像
が文書画像に特徴的なパターンのいずれに該当するかを
識別する装置に関する。
が文書画像に特徴的なパターンのいずれに該当するかを
識別する装置に関する。
(従来技術とその問題点)
近年、文書画像処理において、文書画像の構造を解析し
、文字領域、図形領域、写真領域、のように領域分離を
行ない、各分離領域について適応的な抽出、認識処理、
あるいはデータ圧縮処理を行なうことが試みられている
。このような処理において、対象とする文書画像の全体
、または注目する一部分が、文書画像に特徴的な画像パ
ターン(例えば、背景、黒、太線、細線、網点、など)
のどれに該当するか、というパターン識別処理が基本的
な前処理として必要である。
、文字領域、図形領域、写真領域、のように領域分離を
行ない、各分離領域について適応的な抽出、認識処理、
あるいはデータ圧縮処理を行なうことが試みられている
。このような処理において、対象とする文書画像の全体
、または注目する一部分が、文書画像に特徴的な画像パ
ターン(例えば、背景、黒、太線、細線、網点、など)
のどれに該当するか、というパターン識別処理が基本的
な前処理として必要である。
従来においては、本処理のためには、通常の画像処理装
置が用いられており、文書画像の構造解析は、ソフトウ
ェアに依存し、多くの画素単位走査を必要とする時間の
かかるものになっている。
置が用いられており、文書画像の構造解析は、ソフトウ
ェアに依存し、多くの画素単位走査を必要とする時間の
かかるものになっている。
たとえば、1985年6月発表の電子通信学会技術研究
報告PRL85−17、rスプリット検出法に基づくペ
ージ画像の構造解析」においては、第9図に示すような
、階層的な文書画像の領域分割アルゴリズムを採用して
いる。図において、領域分割制御の各ブロックが階層を
構成している。
報告PRL85−17、rスプリット検出法に基づくペ
ージ画像の構造解析」においては、第9図に示すような
、階層的な文書画像の領域分割アルゴリズムを採用して
いる。図において、領域分割制御の各ブロックが階層を
構成している。
各階層において、画像のある領域について垂直、または
水平方向の画素の投影を行ない、相関比を用いて領域を
分割した後、下の階層にすすみ、各分割領域に再帰的に
同じ処理をほどこす。いうまでもなく、各階層での投影
その他のソフトウェア処理時間がこの方法の問題点とな
る。
水平方向の画素の投影を行ない、相関比を用いて領域を
分割した後、下の階層にすすみ、各分割領域に再帰的に
同じ処理をほどこす。いうまでもなく、各階層での投影
その他のソフトウェア処理時間がこの方法の問題点とな
る。
一方で、文書画像構造解析を高速に行なう試みもいくつ
かなされているが、そのための装置は安価には提供され
ていない。例えば、1982年の第24回情報処理学会
全国大会3Fli−5、[並列処理による新聞紙面の適
応的構造理解」において、並列処理ハードウェアを用い
た構造解析アルゴリズムが報告された。また、1983
年発表の電子通信学会技術研究報告PRL133−62
、「3X3単位メツシュ内の濃淡パターンに基づく文書
画像領域分割方式」においては、CODセンサーからの
文書画像入力を多値の濃淡情報として処理し、領域分離
を実時間で行なおうというシミュレーションが報告され
た。しかし、これらは特殊な・・−ドウエアを必要とし
、安価に提供できなかった。
かなされているが、そのための装置は安価には提供され
ていない。例えば、1982年の第24回情報処理学会
全国大会3Fli−5、[並列処理による新聞紙面の適
応的構造理解」において、並列処理ハードウェアを用い
た構造解析アルゴリズムが報告された。また、1983
年発表の電子通信学会技術研究報告PRL133−62
、「3X3単位メツシュ内の濃淡パターンに基づく文書
画像領域分割方式」においては、CODセンサーからの
文書画像入力を多値の濃淡情報として処理し、領域分離
を実時間で行なおうというシミュレーションが報告され
た。しかし、これらは特殊な・・−ドウエアを必要とし
、安価に提供できなかった。
本発明は、従来技術のこのような問題点を解決し、文書
画像構造解析の基本となるパターン識別処理を高速にか
つ安価に実現しようとすることが目的である。
画像構造解析の基本となるパターン識別処理を高速にか
つ安価に実現しようとすることが目的である。
(問題点を解決するための手段)
前述の問題点を解決するために本発明が提供するパター
ン識別装置は、文書画像データの全体、またはある部分
領域を、黒及び白の画素の集合として格納する記憶手段
と、記憶手段からビット列を読み出し、黒゛または白の
画素数を数える画素計数手段と、同じく記憶手段からビ
ット列を読み出し、主走査線方向、及び副走査線方向の
黒または白のランの出現頻度を数えるラン計数手段と、
画素計数手段及びラン計数手段の出力に基づき、記憶手
段中の画像データの黒または白の画素の分布形状を示す
パラメタを算出する形状パラメタ決定手段と、画素計数
手段及び形状パラメタ決定手段の出力により、記憶手段
中の画像データカ瓢少なくとも黒、背景、太線、細線、
網点て表わされる文書画像に特徴的なパターンのいずれ
に該当するかを決定する識別手段とからなることを特徴
とする。
ン識別装置は、文書画像データの全体、またはある部分
領域を、黒及び白の画素の集合として格納する記憶手段
と、記憶手段からビット列を読み出し、黒゛または白の
画素数を数える画素計数手段と、同じく記憶手段からビ
ット列を読み出し、主走査線方向、及び副走査線方向の
黒または白のランの出現頻度を数えるラン計数手段と、
画素計数手段及びラン計数手段の出力に基づき、記憶手
段中の画像データの黒または白の画素の分布形状を示す
パラメタを算出する形状パラメタ決定手段と、画素計数
手段及び形状パラメタ決定手段の出力により、記憶手段
中の画像データカ瓢少なくとも黒、背景、太線、細線、
網点て表わされる文書画像に特徴的なパターンのいずれ
に該当するかを決定する識別手段とからなることを特徴
とする。
(発明の原理)
本発明は、上述の構成をとることにより従来技術の問題
点を解決した。以下に、本発明の原理を示す。
点を解決した。以下に、本発明の原理を示す。
■ 対象とする画像データは、公知のシステムを接続し
、あらかじめ記憶手段に格納しておく。
、あらかじめ記憶手段に格納しておく。
ここで、記憶手段中の画像データは、例えばN画素×N
画素のビットマツプとする。Nは1以上の整数である。
画素のビットマツプとする。Nは1以上の整数である。
このビットマツプのうち、最上位にあるNビットのビッ
ト列が画素計数手段、う/計数手段に読み込まれる。
ト列が画素計数手段、う/計数手段に読み込まれる。
■ 画素計数手段は、読み出l〜だビット列の黒または
白の画素数を数える。ラン計数手段は、各ビットごとに
横方向(主走査線方向)、たて方向(副走査線方向)の
黒または白のランを検出するフラグをたて、オンになっ
たフラグの数を数える。
白の画素数を数える。ラン計数手段は、各ビットごとに
横方向(主走査線方向)、たて方向(副走査線方向)の
黒または白のランを検出するフラグをたて、オンになっ
たフラグの数を数える。
■ 引き続き、記憶手段中で隣接していたNビットが読
み出され、2の処理を行なう。これを記憶手段中のすべ
てのビット列について繰り返す。
み出され、2の処理を行なう。これを記憶手段中のすべ
てのビット列について繰り返す。
なお、この間の黒または白の画素数、たて方向、横方向
をあわせた黒または白のう/数はそれぞれ逐次加算され
、最後に画素計数手段、ラン計数手段から出力される。
をあわせた黒または白のう/数はそれぞれ逐次加算され
、最後に画素計数手段、ラン計数手段から出力される。
■ 形状パラメタ決定手段は、出力された画素数、ラン
数から、ストローク幅というパラメタを算出する。この
パラメタは、対象とする画像の黒または白の画素の分布
形状の指標として導入するもので、実施例において詳し
く述べる。
数から、ストローク幅というパラメタを算出する。この
パラメタは、対象とする画像の黒または白の画素の分布
形状の指標として導入するもので、実施例において詳し
く述べる。
■ 識別手段は、画素数、及びその分布形状(ストロー
ク幅)というふたつのパラメタから、あらかじめ設定し
た分類規則に基づき、対象とする画像が、少なくとも背
景、黒、太線、細線、網点て表わされる文書画像に特徴
的なパターンのうちどれに属するかを決定し、結果を出
力する。
ク幅)というふたつのパラメタから、あらかじめ設定し
た分類規則に基づき、対象とする画像が、少なくとも背
景、黒、太線、細線、網点て表わされる文書画像に特徴
的なパターンのうちどれに属するかを決定し、結果を出
力する。
本発明では、画像データ走査を一回に限り、画素数、ラ
ン数という単純な特徴量を計数するため、処理が簡単で
高速に行なえる。また、識別の精度向上のためには、処
理したい画像を一括して記憶手段に入れるのでなく、画
像をブロックに分割して逐次記憶手段に入れ、各ブロッ
クのパターンを識別することが考えられる。(これを実
施例に示している。)従って、本発明は小さなハードウ
ェアで安価に装置化することが可能で、既存の画像処理
システムに、前処理部として組み込むことが容易である
。本発明を組み込んだシステムにおいて、本発明の出力
結果を、原画像のパターンの属性を保持した属性画像と
して利用することにより、効率のよい画像処理アルゴリ
ズムが実現できる。
ン数という単純な特徴量を計数するため、処理が簡単で
高速に行なえる。また、識別の精度向上のためには、処
理したい画像を一括して記憶手段に入れるのでなく、画
像をブロックに分割して逐次記憶手段に入れ、各ブロッ
クのパターンを識別することが考えられる。(これを実
施例に示している。)従って、本発明は小さなハードウ
ェアで安価に装置化することが可能で、既存の画像処理
システムに、前処理部として組み込むことが容易である
。本発明を組み込んだシステムにおいて、本発明の出力
結果を、原画像のパターンの属性を保持した属性画像と
して利用することにより、効率のよい画像処理アルゴリ
ズムが実現できる。
(実施例)
以下本発明の実施例について、図面を参考にして詳細に
説明する。第1図に、本発明によるパターン識別装置の
具体例を示す。図において、11がバッファ、12が画
素カウンター、13がビットチェッカー、14がランカ
ウンター、15が形状パラメタ決定器、16が識別器で
ある。ビットチェッカー13、ランカウンター14がラ
ン計数手段を構成する。本実施例では、バッファ11の
サイズを16xl 6とし、黒画素が1、白画素が0で
表わされるものとする。
説明する。第1図に、本発明によるパターン識別装置の
具体例を示す。図において、11がバッファ、12が画
素カウンター、13がビットチェッカー、14がランカ
ウンター、15が形状パラメタ決定器、16が識別器で
ある。ビットチェッカー13、ランカウンター14がラ
ン計数手段を構成する。本実施例では、バッファ11の
サイズを16xl 6とし、黒画素が1、白画素が0で
表わされるものとする。
まず、画素カウンター12は、バッファ11に格納され
ている画像データのうち、横方向(主走査線方向)にな
らぶ最上位16ビツトを読み出す。
ている画像データのうち、横方向(主走査線方向)にな
らぶ最上位16ビツトを読み出す。
このビット列を調べ、黒画素数を数える。
ビットチェッカー13は、バッファ11から画素カウン
ター12と同じビット列を読み出し、各ビットごとに横
方向ランフラグ、及びたて方向ランフラグを出力する。
ター12と同じビット列を読み出し、各ビットごとに横
方向ランフラグ、及びたて方向ランフラグを出力する。
(フラグは0で初期化しておく。)
横方向ランフラグは、入力されたビット列をならべてみ
て、(0,1)とならぶビットの組があった場合に、横
方向(主走査線方向)の黒ランの先頭を検出したとみて
、たてるフラグである。例えば、第2図のように構成す
る。図で明らかなように、主走査線方向にビット列をみ
るとき、ビットが(0,1)とならぶときフラグを1、
(1,0)、(1,1)、(0,0)とならぶときフラ
グを0とする。たて方向ラン7ラグは、バッファ11か
らのビット入力により、各ビット入力が0から1に変化
した場合、たて方向(副走査線方向)の黒ランの先頭を
検出したとみて、たてるフラグである。例えば、第3図
のように構成する。図で明らかなように、ビット入力に
よって、各ビットが0から1に変化したときフラグを1
とし、1から0に変化したか、状態を変えない場合は、
フラグを0とする。
て、(0,1)とならぶビットの組があった場合に、横
方向(主走査線方向)の黒ランの先頭を検出したとみて
、たてるフラグである。例えば、第2図のように構成す
る。図で明らかなように、主走査線方向にビット列をみ
るとき、ビットが(0,1)とならぶときフラグを1、
(1,0)、(1,1)、(0,0)とならぶときフラ
グを0とする。たて方向ラン7ラグは、バッファ11か
らのビット入力により、各ビット入力が0から1に変化
した場合、たて方向(副走査線方向)の黒ランの先頭を
検出したとみて、たてるフラグである。例えば、第3図
のように構成する。図で明らかなように、ビット入力に
よって、各ビットが0から1に変化したときフラグを1
とし、1から0に変化したか、状態を変えない場合は、
フラグを0とする。
ランカウンター14は、ビットチェッカー13の横方向
、たて方向の各フラグを調べ、フラグ1のものについて
、これを数える。(たて、横両方向をあわせて数える。
、たて方向の各フラグを調べ、フラグ1のものについて
、これを数える。(たて、横両方向をあわせて数える。
)
続いて、画素カウンター12、ビットチェッカー13が
、バッファ11から次の16ビツト(副走査線方向に隣
接している)を読み出し、上記と同じ計数を行なう。数
えられた黒画素数、黒ラン数は逐次加算される。さらに
、バッファ11中のビット列読み出し、計数を、すべて
のビット列について繰り返す。
、バッファ11から次の16ビツト(副走査線方向に隣
接している)を読み出し、上記と同じ計数を行なう。数
えられた黒画素数、黒ラン数は逐次加算される。さらに
、バッファ11中のビット列読み出し、計数を、すべて
のビット列について繰り返す。
以上で、−回の走査で、バッファ11中の画像データを
たて、横二方向に走査したのと同等の情報が得られた。
たて、横二方向に走査したのと同等の情報が得られた。
画素カウンター12、及びランカウンター14は、それ
ぞれ積算した黒画素数、黒ラン数を形状パラメタ決定器
15に出力する。パラメタ決定器15は、黒画素数、黒
ラン数を用いて、以下の式によって定義されるストロー
ク幅というパラメタを算出する。
ぞれ積算した黒画素数、黒ラン数を形状パラメタ決定器
15に出力する。パラメタ決定器15は、黒画素数、黒
ラン数を用いて、以下の式によって定義されるストロー
ク幅というパラメタを算出する。
ストローク幅は、対象画像内の黒画素の分布形状、特に
、ストロークパターンを検出するための簡単な指標とし
て導入したものである。分母の黒ラン数は、連結した黒
画素領域がある場合、その外周の半分を近似的に表わす
。対象とする画像がストロークで構成されるパターンで
ある場合、本パラメタは、そのストロークの幅を近似す
る。これを第4図(a)〜(C)に示す。いくつかの簡
単なストロークパターンについて、パラメタの算出例を
示した。たて、横二方向のみの特徴量で近似するため、
実際よりも細めのストローク幅が求まっている。第5図
は、新聞の記事部分をサンプルとして8本/Uの解像度
で入力し、16X16(2■×20)のサイズでブロッ
ク化し、画素数とストローク幅の分布を求めたものであ
る。横軸が黒画素数、たて軸がストローク幅である。各
ブロックは、黒画素数120以内、ストローク幅0.9
〜1.5に集中しているのがわかる。第6図は、同じ新
聞でも、太いストロークで構成される見出し部分を同様
にブロック化し、ストローク幅を求めたものである。明
らかに、記事部分より大きいストローク幅が求まり、太
線、細線を区別する簡便なパラメタであることがわかる
。第7図は、同じ新聞記事のうち、網点化された写真に
ついてストローク幅を求めたものである。写真には、ス
トローク状のパターンは現われないが、網点という特徴
的なパターンをストローク幅によりとらえることができ
る。すなわち、第7図の黒画素数100未満のブロック
において、ストローク幅カ0.7付近に集中する。これ
は、孤立したドツトパターンの多い網点写真に固有であ
り、本パラメタが、網点写真峻別の指標となりうろこと
を示す。
、ストロークパターンを検出するための簡単な指標とし
て導入したものである。分母の黒ラン数は、連結した黒
画素領域がある場合、その外周の半分を近似的に表わす
。対象とする画像がストロークで構成されるパターンで
ある場合、本パラメタは、そのストロークの幅を近似す
る。これを第4図(a)〜(C)に示す。いくつかの簡
単なストロークパターンについて、パラメタの算出例を
示した。たて、横二方向のみの特徴量で近似するため、
実際よりも細めのストローク幅が求まっている。第5図
は、新聞の記事部分をサンプルとして8本/Uの解像度
で入力し、16X16(2■×20)のサイズでブロッ
ク化し、画素数とストローク幅の分布を求めたものであ
る。横軸が黒画素数、たて軸がストローク幅である。各
ブロックは、黒画素数120以内、ストローク幅0.9
〜1.5に集中しているのがわかる。第6図は、同じ新
聞でも、太いストロークで構成される見出し部分を同様
にブロック化し、ストローク幅を求めたものである。明
らかに、記事部分より大きいストローク幅が求まり、太
線、細線を区別する簡便なパラメタであることがわかる
。第7図は、同じ新聞記事のうち、網点化された写真に
ついてストローク幅を求めたものである。写真には、ス
トローク状のパターンは現われないが、網点という特徴
的なパターンをストローク幅によりとらえることができ
る。すなわち、第7図の黒画素数100未満のブロック
において、ストローク幅カ0.7付近に集中する。これ
は、孤立したドツトパターンの多い網点写真に固有であ
り、本パラメタが、網点写真峻別の指標となりうろこと
を示す。
さて、画素カウンター12、形状パラメタ決定器I5は
、それぞれ求めた黒画素数、ストローク幅を識別器]6
に出力する。いま、新聞画像を8本/絽の解像度で入力
し、これを16X16のサイズのブロックに分割し、各
ブロックを第8図に示すようなパターンに分類したいと
すると、識別器16は、例えば次の規則により、パター
ン識別を行なうことができる。以下で、nは黒画素数を
バッファ内の全画素数でわった値(これを黒画素比とよ
ぶことにする)、mはストローク幅である。
、それぞれ求めた黒画素数、ストローク幅を識別器]6
に出力する。いま、新聞画像を8本/絽の解像度で入力
し、これを16X16のサイズのブロックに分割し、各
ブロックを第8図に示すようなパターンに分類したいと
すると、識別器16は、例えば次の規則により、パター
ン識別を行なうことができる。以下で、nは黒画素数を
バッファ内の全画素数でわった値(これを黒画素比とよ
ぶことにする)、mはストローク幅である。
n(0,04背景
n≧0.5 黒
0.04≦n (0,5かつm>x、5 太線0
.04≦n(o、sかつ0.8(m≦1.5 細
線0.04≦n(o、sかつm≦0.8 網点
黒画素比のかわりに黒画素数の絶対値を用いてもよい。
.04≦n(o、sかつ0.8(m≦1.5 細
線0.04≦n(o、sかつm≦0.8 網点
黒画素比のかわりに黒画素数の絶対値を用いてもよい。
黒画素比が0.04以上0.5未満のものについてはス
トローク幅を活用し、0.5以上のものはまとめて黒と
している。これは、ブロック内の画素のうち、過半数以
上を黒画素が占めるような黒画素の多いパターンでは、
それがストロークか、他のテクスチャパターンかの判別
がむずかしいため、黒画素数のみに注目したものである
。これはあらい識別方法にみえるが、黒画素が少ない、
多い、という単純な情報も、文書画像の領域分離処理等
では非常に重要である。もし、黒画素の多いパターンの
識別精度を高めるとすれば、画素カウンター12、ラン
カウンター14で白画素の計数を同時に行ない、パラメ
タ決定器15、識別器16で白画素、黒画素の選択を適
応的に行なうことが考えられる。こうすれば、例えば、
写真の網点パターンはより確実につかまえられる。識別
器16の識別をさらに厳密にするため、統計的な手法、
例えば判別分析法により、詳細に識別規則を定めること
もできる。
トローク幅を活用し、0.5以上のものはまとめて黒と
している。これは、ブロック内の画素のうち、過半数以
上を黒画素が占めるような黒画素の多いパターンでは、
それがストロークか、他のテクスチャパターンかの判別
がむずかしいため、黒画素数のみに注目したものである
。これはあらい識別方法にみえるが、黒画素が少ない、
多い、という単純な情報も、文書画像の領域分離処理等
では非常に重要である。もし、黒画素の多いパターンの
識別精度を高めるとすれば、画素カウンター12、ラン
カウンター14で白画素の計数を同時に行ない、パラメ
タ決定器15、識別器16で白画素、黒画素の選択を適
応的に行なうことが考えられる。こうすれば、例えば、
写真の網点パターンはより確実につかまえられる。識別
器16の識別をさらに厳密にするため、統計的な手法、
例えば判別分析法により、詳細に識別規則を定めること
もできる。
本実施例のような簡単な識別方法でも、文書画像処理に
おいて、有効な前処理とすることができる。例えば、識
別結果を用いて文書画像の領域分離処理を行なうことを
考える。まず、識別器16の出力を属性画像として記憶
する。これは、実時間に近い高速な処理である。属性画
像は、原画像に比ベデータ量が少なく、高速に走査でき
、しかも画像データの構造を大局的にとらえることがで
きる。例えば、「背景コブロックで囲まれた一群の背景
でないブロックをグループにし、外接する矩形領域を抽
出する。抽出した矩形領域に対して、−律な画素単位処
理を行なってもよい力瓢矩形領域が何であるか推定すれ
ば、効率のよい構造解析ができ、各領域に対し適応的な
処理が行なえる。
おいて、有効な前処理とすることができる。例えば、識
別結果を用いて文書画像の領域分離処理を行なうことを
考える。まず、識別器16の出力を属性画像として記憶
する。これは、実時間に近い高速な処理である。属性画
像は、原画像に比ベデータ量が少なく、高速に走査でき
、しかも画像データの構造を大局的にとらえることがで
きる。例えば、「背景コブロックで囲まれた一群の背景
でないブロックをグループにし、外接する矩形領域を抽
出する。抽出した矩形領域に対して、−律な画素単位処
理を行なってもよい力瓢矩形領域が何であるか推定すれ
ば、効率のよい構造解析ができ、各領域に対し適応的な
処理が行なえる。
推定は、例えば、文書画像の構成要素である本文、見出
し、写真、図表等における、分類した各パタ−ノの出現
頻度を用いる統計的な手法、あるいは、一般的な文書の
書式規則の適用から行なえる。
し、写真、図表等における、分類した各パタ−ノの出現
頻度を用いる統計的な手法、あるいは、一般的な文書の
書式規則の適用から行なえる。
また、文字のストロークの太さが検知できることから、
例えば、太い文字をその文書画像の検索用キー画像とし
て高速に抽出することもできる。
例えば、太い文字をその文書画像の検索用キー画像とし
て高速に抽出することもできる。
もちろん、通常サイズの文字でないなんらかのテクスチ
ャ領域(写真も含む)をその画像の検索キーとして高速
に抽出することも可能である。
ャ領域(写真も含む)をその画像の検索キーとして高速
に抽出することも可能である。
本実施例においては、画素数、及びストローク幅という
ふたつのパラメタを用いたが、このうち一方のみを利用
し、より簡略化した識別を行なうことはもちろん可能で
ある。まず、ストローク幅のみをパラメタとする場合、
画素カウンター12から識別器16への出力は用いない
。このとき、識別器16は、ストローク幅の大小のみに
注目し、識別を行なう。これだけでも、例えば文字領域
のみの文書画像において、文字部分の太線、細線を特に
識別したいときなどに有効である。
ふたつのパラメタを用いたが、このうち一方のみを利用
し、より簡略化した識別を行なうことはもちろん可能で
ある。まず、ストローク幅のみをパラメタとする場合、
画素カウンター12から識別器16への出力は用いない
。このとき、識別器16は、ストローク幅の大小のみに
注目し、識別を行なう。これだけでも、例えば文字領域
のみの文書画像において、文字部分の太線、細線を特に
識別したいときなどに有効である。
一方、画素数のみをパラメタとする場合、ビットチェッ
カー13、ランカウンター14、形状ハラメタ決定器1
5の各出力は用いない。識別器16は、画素数の大小の
みにより、例えばバッファ11内の画像について、背景
、黒、その他の領域、のように識別してやる。このよう
な簡単な識別でも、例えば黒が卓越する写真やテクスチ
ャなどを含む文書画像に対し、その領域を文字領域と識
別するために利用できる。
カー13、ランカウンター14、形状ハラメタ決定器1
5の各出力は用いない。識別器16は、画素数の大小の
みにより、例えばバッファ11内の画像について、背景
、黒、その他の領域、のように識別してやる。このよう
な簡単な識別でも、例えば黒が卓越する写真やテクスチ
ャなどを含む文書画像に対し、その領域を文字領域と識
別するために利用できる。
以上は、黒画素領域を意味のある領域として説明したが
、逆に、白画素領域が意味のある領域である場合には、
上記説明の黒画素、白画素をいれかえることにより、同
様の処理が行なえる。
、逆に、白画素領域が意味のある領域である場合には、
上記説明の黒画素、白画素をいれかえることにより、同
様の処理が行なえる。
また、本実施例においては画像の矩形領域を対象とした
力瓢多角形のような矩形でない領域、あるいは菱形のよ
うな領域を対象とすることも可能である。例えばある多
角形領域の識別を行ないたいとするとき、バッファ11
はその多角形領域に外接するようなサイズにとり、これ
にデータを書き込むとき、多角形の外部のデータを強制
的に白(白が意味のある画素なら黒)とすることで同様
な処理ができる。
力瓢多角形のような矩形でない領域、あるいは菱形のよ
うな領域を対象とすることも可能である。例えばある多
角形領域の識別を行ないたいとするとき、バッファ11
はその多角形領域に外接するようなサイズにとり、これ
にデータを書き込むとき、多角形の外部のデータを強制
的に白(白が意味のある画素なら黒)とすることで同様
な処理ができる。
上記の変化態様はすべて本発明に含まれる。
(発明の効果)
以上に述べたパター7識別装置によって、文書画像のパ
ターン識別を高速で安価に実現できる。
ターン識別を高速で安価に実現できる。
本発明を前処理部として既存の画像処理装置に組み込む
ことは容易である。本発明の出力結果を、原画像のパタ
ーンの属性を保持した属性画像として利用することによ
り、任意書式の文書画像の高速な構造解析、領域分離、
文字認識などに応用することができる。
ことは容易である。本発明の出力結果を、原画像のパタ
ーンの属性を保持した属性画像として利用することによ
り、任意書式の文書画像の高速な構造解析、領域分離、
文字認識などに応用することができる。
第1図は本発明によるパターン識別装置の一実施例のブ
ロック図、第2図は横方向ランフラグの構成例を示す図
、第3図はたて方向ランフラグの構成例を示す図、第4
図(a)〜(0)はストローク幅の計算例を示す図、第
5図は新聞の記事部分をサンプルとしたときの黒画素数
、ストローク幅の分布を示す図、第6図は新聞の見出し
文字列部分をサンプルとしたときの黒画素数、ストロー
ク幅の出現分布を示す図、第7図は新聞の網点写真をサ
ンプルとしたときの黒画素数、ストローク幅の出現分布
をしめす図、第8図は文書画像に特徴的な画像パターン
の例を示す図、第9図は従来の文書画像構造解析におい
て一般に用いられる、多くの画像データ走査をともなう
領域分割アルゴリズムの例である。 図において、11はバッファ、12は画素カウンター、
13はビットチェッカー、14はランカウンター、15
は形状パラメタ決定器、16は識別器である。 代理人 弁理士 本 庄 伸 介 ・供々@敏短省 も 第4図 S:百2 9二16◆2=1B S=60 9=16◆16=32 S=31 9=16令16.32 s =、を亙[秩 9・男、ラン籾 5・ストローク1′1′l畠 第8図 第9図
ロック図、第2図は横方向ランフラグの構成例を示す図
、第3図はたて方向ランフラグの構成例を示す図、第4
図(a)〜(0)はストローク幅の計算例を示す図、第
5図は新聞の記事部分をサンプルとしたときの黒画素数
、ストローク幅の分布を示す図、第6図は新聞の見出し
文字列部分をサンプルとしたときの黒画素数、ストロー
ク幅の出現分布を示す図、第7図は新聞の網点写真をサ
ンプルとしたときの黒画素数、ストローク幅の出現分布
をしめす図、第8図は文書画像に特徴的な画像パターン
の例を示す図、第9図は従来の文書画像構造解析におい
て一般に用いられる、多くの画像データ走査をともなう
領域分割アルゴリズムの例である。 図において、11はバッファ、12は画素カウンター、
13はビットチェッカー、14はランカウンター、15
は形状パラメタ決定器、16は識別器である。 代理人 弁理士 本 庄 伸 介 ・供々@敏短省 も 第4図 S:百2 9二16◆2=1B S=60 9=16◆16=32 S=31 9=16令16.32 s =、を亙[秩 9・男、ラン籾 5・ストローク1′1′l畠 第8図 第9図
Claims (1)
- 文書画像データの全体またはある部分領域を黒及び白の
画素の集合として格納する記憶手段と、この記憶手段か
らビット列を読み出し黒または白の画素数を数える画素
計数手段と、前記記憶手段からビット列を読み出し主走
査線方向及び副走査線方向の黒または白のランの出現頻
度を数えるラン計数手段と、前記画素計数手段及び前記
ラン計数手段の出力に基づき前記記憶手段中の画像デー
タの黒または白の画素の分布形状を示すパラメタを算出
する形状パラメタ決定手段と、前記画素計数手段及び前
記形状パラメタ決定手段の出力により前記記憶手段中の
画像データが少なくとも黒、背景、太線、細線、網点で
表わされる文書画像に特徴的なパターンのいずれに該当
するかを決定する識別手段とからなることを特徴とする
パターン識別装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP61060307A JPS62217387A (ja) | 1986-03-18 | 1986-03-18 | パタ−ン識別装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP61060307A JPS62217387A (ja) | 1986-03-18 | 1986-03-18 | パタ−ン識別装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPS62217387A true JPS62217387A (ja) | 1987-09-24 |
Family
ID=13138370
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP61060307A Pending JPS62217387A (ja) | 1986-03-18 | 1986-03-18 | パタ−ン識別装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPS62217387A (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006053786A (ja) * | 2004-08-12 | 2006-02-23 | Fuji Xerox Co Ltd | 画像処理装置 |
JP2009009289A (ja) * | 2007-06-27 | 2009-01-15 | Elpida Memory Inc | 半導体記憶装置 |
-
1986
- 1986-03-18 JP JP61060307A patent/JPS62217387A/ja active Pending
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006053786A (ja) * | 2004-08-12 | 2006-02-23 | Fuji Xerox Co Ltd | 画像処理装置 |
JP4506346B2 (ja) * | 2004-08-12 | 2010-07-21 | 富士ゼロックス株式会社 | 画像処理装置 |
JP2009009289A (ja) * | 2007-06-27 | 2009-01-15 | Elpida Memory Inc | 半導体記憶装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2940936B2 (ja) | 表領域識別方法 | |
EP1831823B1 (en) | Segmenting digital image and producing compact representation | |
Bloomberg | Multiresolution morphological approach to document image analysis | |
JP3748164B2 (ja) | パターン抽出装置 | |
JP3259993B2 (ja) | 語形測定方法及び画像信号処理方法 | |
US20030063802A1 (en) | Image processing method, apparatus and system | |
EP1081648B1 (en) | Method for processing a digital image | |
JP2006350704A (ja) | 判別器の学習方法、顔判別方法および装置並びにプログラム | |
JP2000132690A (ja) | ト―クン化によるイメ―ジ分割を用いたイメ―ジ処理方法および装置 | |
JPH05166002A (ja) | ソース画像を分析する方法 | |
Bloomberg | Multiresolution morphological analysis of document images | |
JPS62217387A (ja) | パタ−ン識別装置 | |
Okun et al. | A survey of texture-based methods for document layout analysis | |
EP0702320A1 (en) | Skew detection | |
JP4261922B2 (ja) | 文書画像処理方法、文書画像処理装置、文書画像処理プログラムおよび記憶媒体 | |
JP2832928B2 (ja) | 文字認識方法 | |
JP2613211B2 (ja) | 画像入力装置 | |
CN109271986B (zh) | 一种基于Second-Confirm的数字识别方法 | |
JP2882912B2 (ja) | 多重解像度処理組込型ハフ変換法 | |
Zhi-Gang et al. | Image segmentation considering intensity roughness and color purity | |
Hu et al. | Automatic detection and verification of text regions in news video frames | |
JPS63131287A (ja) | 文字認識方式 | |
JP3277977B2 (ja) | 文字認識方法 | |
CN118446965A (zh) | 一种蜂窝芯复合材料图像缺陷检测方法、系统、设备及介质 | |
JPH0512438A (ja) | ハフ変換による線分抽出方法 |