JPS62217387A

JPS62217387A - パタ−ン識別装置

Info

Publication number: JPS62217387A
Application number: JP61060307A
Authority: JP
Inventors: Ryuichi Ogawa; 隆一小川
Original assignee: NEC Corp
Current assignee: NEC Corp
Priority date: 1986-03-18
Filing date: 1986-03-18
Publication date: 1987-09-24

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】（産業上の利用分野）本発明は、文書画像処理装置において、対象とする画像
が文書画像に特徴的なパターンのいずれに該当するかを
識別する装置に関する。

（従来技術とその問題点）近年、文書画像処理において、文書画像の構造を解析し
、文字領域、図形領域、写真領域、のように領域分離を
行ない、各分離領域について適応的な抽出、認識処理、
あるいはデータ圧縮処理を行なうことが試みられている
。このような処理において、対象とする文書画像の全体
、または注目する一部分が、文書画像に特徴的な画像パ
ターン（例えば、背景、黒、太線、細線、網点、など）
のどれに該当するか、というパターン識別処理が基本的
な前処理として必要である。

従来においては、本処理のためには、通常の画像処理装
置が用いられており、文書画像の構造解析は、ソフトウ
ェアに依存し、多くの画素単位走査を必要とする時間の
かかるものになっている。

たとえば、１９８５年６月発表の電子通信学会技術研究
報告ＰＲＬ８５−１７、ｒスプリット検出法に基づくペ
ージ画像の構造解析」においては、第９図に示すような
、階層的な文書画像の領域分割アルゴリズムを採用して
いる。図において、領域分割制御の各ブロックが階層を
構成している。

各階層において、画像のある領域について垂直、または
水平方向の画素の投影を行ない、相関比を用いて領域を
分割した後、下の階層にすすみ、各分割領域に再帰的に
同じ処理をほどこす。いうまでもなく、各階層での投影
その他のソフトウェア処理時間がこの方法の問題点とな
る。

一方で、文書画像構造解析を高速に行なう試みもいくつ
かなされているが、そのための装置は安価には提供され
ていない。例えば、１９８２年の第２４回情報処理学会
全国大会３Ｆｌｉ−５、［並列処理による新聞紙面の適
応的構造理解」において、並列処理ハードウェアを用い
た構造解析アルゴリズムが報告された。また、１９８３
年発表の電子通信学会技術研究報告ＰＲＬ１３３−６２
、「３Ｘ３単位メツシュ内の濃淡パターンに基づく文書
画像領域分割方式」においては、ＣＯＤセンサーからの
文書画像入力を多値の濃淡情報として処理し、領域分離
を実時間で行なおうというシミュレーションが報告され
た。しかし、これらは特殊な・・−ドウエアを必要とし
、安価に提供できなかった。

本発明は、従来技術のこのような問題点を解決し、文書
画像構造解析の基本となるパターン識別処理を高速にか
つ安価に実現しようとすることが目的である。

（問題点を解決するための手段）前述の問題点を解決するために本発明が提供するパター
ン識別装置は、文書画像データの全体、またはある部分
領域を、黒及び白の画素の集合として格納する記憶手段
と、記憶手段からビット列を読み出し、黒゛または白の
画素数を数える画素計数手段と、同じく記憶手段からビ
ット列を読み出し、主走査線方向、及び副走査線方向の
黒または白のランの出現頻度を数えるラン計数手段と、
画素計数手段及びラン計数手段の出力に基づき、記憶手
段中の画像データの黒または白の画素の分布形状を示す
パラメタを算出する形状パラメタ決定手段と、画素計数
手段及び形状パラメタ決定手段の出力により、記憶手段
中の画像データカ瓢少なくとも黒、背景、太線、細線、
網点て表わされる文書画像に特徴的なパターンのいずれ
に該当するかを決定する識別手段とからなることを特徴
とする。

（発明の原理）本発明は、上述の構成をとることにより従来技術の問題
点を解決した。以下に、本発明の原理を示す。

■　対象とする画像データは、公知のシステムを接続し
、あらかじめ記憶手段に格納しておく。

ここで、記憶手段中の画像データは、例えばＮ画素×Ｎ
画素のビットマツプとする。Ｎは１以上の整数である。

このビットマツプのうち、最上位にあるＮビットのビッ
ト列が画素計数手段、う／計数手段に読み込まれる。

■　画素計数手段は、読み出ｌ〜だビット列の黒または
白の画素数を数える。ラン計数手段は、各ビットごとに
横方向（主走査線方向）、たて方向（副走査線方向）の
黒または白のランを検出するフラグをたて、オンになっ
たフラグの数を数える。

■　引き続き、記憶手段中で隣接していたＮビットが読
み出され、２の処理を行なう。これを記憶手段中のすべ
てのビット列について繰り返す。

なお、この間の黒または白の画素数、たて方向、横方向
をあわせた黒または白のう／数はそれぞれ逐次加算され
、最後に画素計数手段、ラン計数手段から出力される。

■　形状パラメタ決定手段は、出力された画素数、ラン
数から、ストローク幅というパラメタを算出する。この
パラメタは、対象とする画像の黒または白の画素の分布
形状の指標として導入するもので、実施例において詳し
く述べる。

■　識別手段は、画素数、及びその分布形状（ストロー
ク幅）というふたつのパラメタから、あらかじめ設定し
た分類規則に基づき、対象とする画像が、少なくとも背
景、黒、太線、細線、網点て表わされる文書画像に特徴
的なパターンのうちどれに属するかを決定し、結果を出
力する。

本発明では、画像データ走査を一回に限り、画素数、ラ
ン数という単純な特徴量を計数するため、処理が簡単で
高速に行なえる。また、識別の精度向上のためには、処
理したい画像を一括して記憶手段に入れるのでなく、画
像をブロックに分割して逐次記憶手段に入れ、各ブロッ
クのパターンを識別することが考えられる。（これを実
施例に示している。）従って、本発明は小さなハードウ
ェアで安価に装置化することが可能で、既存の画像処理
システムに、前処理部として組み込むことが容易である
。本発明を組み込んだシステムにおいて、本発明の出力
結果を、原画像のパターンの属性を保持した属性画像と
して利用することにより、効率のよい画像処理アルゴリ
ズムが実現できる。

（実施例）以下本発明の実施例について、図面を参考にして詳細に
説明する。第１図に、本発明によるパターン識別装置の
具体例を示す。図において、１１がバッファ、１２が画
素カウンター、１３がビットチェッカー、１４がランカ
ウンター、１５が形状パラメタ決定器、１６が識別器で
ある。ビットチェッカー１３、ランカウンター１４がラ
ン計数手段を構成する。本実施例では、バッファ１１の
サイズを１６ｘｌ　６とし、黒画素が１、白画素が０で
表わされるものとする。

まず、画素カウンター１２は、バッファ１１に格納され
ている画像データのうち、横方向（主走査線方向）にな
らぶ最上位１６ビツトを読み出す。

このビット列を調べ、黒画素数を数える。

ビットチェッカー１３は、バッファ１１から画素カウン
ター１２と同じビット列を読み出し、各ビットごとに横
方向ランフラグ、及びたて方向ランフラグを出力する。

（フラグは０で初期化しておく。）横方向ランフラグは、入力されたビット列をならべてみ
て、（０，１）とならぶビットの組があった場合に、横
方向（主走査線方向）の黒ランの先頭を検出したとみて
、たてるフラグである。例えば、第２図のように構成す
る。図で明らかなように、主走査線方向にビット列をみ
るとき、ビットが（０，１）とならぶときフラグを１、
（１，０）、（１，１）、（０，０）とならぶときフラ
グを０とする。たて方向ラン７ラグは、バッファ１１か
らのビット入力により、各ビット入力が０から１に変化
した場合、たて方向（副走査線方向）の黒ランの先頭を
検出したとみて、たてるフラグである。例えば、第３図
のように構成する。図で明らかなように、ビット入力に
よって、各ビットが０から１に変化したときフラグを１
とし、１から０に変化したか、状態を変えない場合は、
フラグを０とする。

ランカウンター１４は、ビットチェッカー１３の横方向
、たて方向の各フラグを調べ、フラグ１のものについて
、これを数える。（たて、横両方向をあわせて数える。

）続いて、画素カウンター１２、ビットチェッカー１３が
、バッファ１１から次の１６ビツト（副走査線方向に隣
接している）を読み出し、上記と同じ計数を行なう。数
えられた黒画素数、黒ラン数は逐次加算される。さらに
、バッファ１１中のビット列読み出し、計数を、すべて
のビット列について繰り返す。

以上で、−回の走査で、バッファ１１中の画像データを
たて、横二方向に走査したのと同等の情報が得られた。

画素カウンター１２、及びランカウンター１４は、それ
ぞれ積算した黒画素数、黒ラン数を形状パラメタ決定器
１５に出力する。パラメタ決定器１５は、黒画素数、黒
ラン数を用いて、以下の式によって定義されるストロー
ク幅というパラメタを算出する。

ストローク幅は、対象画像内の黒画素の分布形状、特に
、ストロークパターンを検出するための簡単な指標とし
て導入したものである。分母の黒ラン数は、連結した黒
画素領域がある場合、その外周の半分を近似的に表わす
。対象とする画像がストロークで構成されるパターンで
ある場合、本パラメタは、そのストロークの幅を近似す
る。これを第４図（ａ）〜（Ｃ）に示す。いくつかの簡
単なストロークパターンについて、パラメタの算出例を
示した。たて、横二方向のみの特徴量で近似するため、
実際よりも細めのストローク幅が求まっている。第５図
は、新聞の記事部分をサンプルとして８本／Ｕの解像度
で入力し、１６Ｘ１６（２■×２０）のサイズでブロッ
ク化し、画素数とストローク幅の分布を求めたものであ
る。横軸が黒画素数、たて軸がストローク幅である。各
ブロックは、黒画素数１２０以内、ストローク幅０．９
〜１．５に集中しているのがわかる。第６図は、同じ新
聞でも、太いストロークで構成される見出し部分を同様
にブロック化し、ストローク幅を求めたものである。明
らかに、記事部分より大きいストローク幅が求まり、太
線、細線を区別する簡便なパラメタであることがわかる
。第７図は、同じ新聞記事のうち、網点化された写真に
ついてストローク幅を求めたものである。写真には、ス
トローク状のパターンは現われないが、網点という特徴
的なパターンをストローク幅によりとらえることができ
る。すなわち、第７図の黒画素数１００未満のブロック
において、ストローク幅カ０．７付近に集中する。これ
は、孤立したドツトパターンの多い網点写真に固有であ
り、本パラメタが、網点写真峻別の指標となりうろこと
を示す。

さて、画素カウンター１２、形状パラメタ決定器Ｉ５は
、それぞれ求めた黒画素数、ストローク幅を識別器］６
に出力する。いま、新聞画像を８本／絽の解像度で入力
し、これを１６Ｘ１６のサイズのブロックに分割し、各
ブロックを第８図に示すようなパターンに分類したいと
すると、識別器１６は、例えば次の規則により、パター
ン識別を行なうことができる。以下で、ｎは黒画素数を
バッファ内の全画素数でわった値（これを黒画素比とよ
ぶことにする）、ｍはストローク幅である。

ｎ（０，０４背景ｎ≧０．５　黒０．０４≦ｎ　（０，５かつｍ＞ｘ、５　　　　太線０
．０４≦ｎ（ｏ、ｓかつ０．８（ｍ≦１．５　　　　細
線０．０４≦ｎ（ｏ、ｓかつｍ≦０．８　　　　　網点
黒画素比のかわりに黒画素数の絶対値を用いてもよい。

黒画素比が０．０４以上０．５未満のものについてはス
トローク幅を活用し、０．５以上のものはまとめて黒と
している。これは、ブロック内の画素のうち、過半数以
上を黒画素が占めるような黒画素の多いパターンでは、
それがストロークか、他のテクスチャパターンかの判別
がむずかしいため、黒画素数のみに注目したものである
。これはあらい識別方法にみえるが、黒画素が少ない、
多い、という単純な情報も、文書画像の領域分離処理等
では非常に重要である。もし、黒画素の多いパターンの
識別精度を高めるとすれば、画素カウンター１２、ラン
カウンター１４で白画素の計数を同時に行ない、パラメ
タ決定器１５、識別器１６で白画素、黒画素の選択を適
応的に行なうことが考えられる。こうすれば、例えば、
写真の網点パターンはより確実につかまえられる。識別
器１６の識別をさらに厳密にするため、統計的な手法、
例えば判別分析法により、詳細に識別規則を定めること
もできる。

本実施例のような簡単な識別方法でも、文書画像処理に
おいて、有効な前処理とすることができる。例えば、識
別結果を用いて文書画像の領域分離処理を行なうことを
考える。まず、識別器１６の出力を属性画像として記憶
する。これは、実時間に近い高速な処理である。属性画
像は、原画像に比ベデータ量が少なく、高速に走査でき
、しかも画像データの構造を大局的にとらえることがで
きる。例えば、「背景コブロックで囲まれた一群の背景
でないブロックをグループにし、外接する矩形領域を抽
出する。抽出した矩形領域に対して、−律な画素単位処
理を行なってもよい力瓢矩形領域が何であるか推定すれ
ば、効率のよい構造解析ができ、各領域に対し適応的な
処理が行なえる。

推定は、例えば、文書画像の構成要素である本文、見出
し、写真、図表等における、分類した各パタ−ノの出現
頻度を用いる統計的な手法、あるいは、一般的な文書の
書式規則の適用から行なえる。

また、文字のストロークの太さが検知できることから、
例えば、太い文字をその文書画像の検索用キー画像とし
て高速に抽出することもできる。

もちろん、通常サイズの文字でないなんらかのテクスチ
ャ領域（写真も含む）をその画像の検索キーとして高速
に抽出することも可能である。

本実施例においては、画素数、及びストローク幅という
ふたつのパラメタを用いたが、このうち一方のみを利用
し、より簡略化した識別を行なうことはもちろん可能で
ある。まず、ストローク幅のみをパラメタとする場合、
画素カウンター１２から識別器１６への出力は用いない
。このとき、識別器１６は、ストローク幅の大小のみに
注目し、識別を行なう。これだけでも、例えば文字領域
のみの文書画像において、文字部分の太線、細線を特に
識別したいときなどに有効である。

一方、画素数のみをパラメタとする場合、ビットチェッ
カー１３、ランカウンター１４、形状ハラメタ決定器１
５の各出力は用いない。識別器１６は、画素数の大小の
みにより、例えばバッファ１１内の画像について、背景
、黒、その他の領域、のように識別してやる。このよう
な簡単な識別でも、例えば黒が卓越する写真やテクスチ
ャなどを含む文書画像に対し、その領域を文字領域と識
別するために利用できる。

以上は、黒画素領域を意味のある領域として説明したが
、逆に、白画素領域が意味のある領域である場合には、
上記説明の黒画素、白画素をいれかえることにより、同
様の処理が行なえる。

また、本実施例においては画像の矩形領域を対象とした
力瓢多角形のような矩形でない領域、あるいは菱形のよ
うな領域を対象とすることも可能である。例えばある多
角形領域の識別を行ないたいとするとき、バッファ１１
はその多角形領域に外接するようなサイズにとり、これ
にデータを書き込むとき、多角形の外部のデータを強制
的に白（白が意味のある画素なら黒）とすることで同様
な処理ができる。

上記の変化態様はすべて本発明に含まれる。

（発明の効果）以上に述べたパター７識別装置によって、文書画像のパ
ターン識別を高速で安価に実現できる。

本発明を前処理部として既存の画像処理装置に組み込む
ことは容易である。本発明の出力結果を、原画像のパタ
ーンの属性を保持した属性画像として利用することによ
り、任意書式の文書画像の高速な構造解析、領域分離、
文字認識などに応用することができる。

【図面の簡単な説明】

第１図は本発明によるパターン識別装置の一実施例のブ
ロック図、第２図は横方向ランフラグの構成例を示す図
、第３図はたて方向ランフラグの構成例を示す図、第４
図（ａ）〜（０）はストローク幅の計算例を示す図、第
５図は新聞の記事部分をサンプルとしたときの黒画素数
、ストローク幅の分布を示す図、第６図は新聞の見出し
文字列部分をサンプルとしたときの黒画素数、ストロー
ク幅の出現分布を示す図、第７図は新聞の網点写真をサ
ンプルとしたときの黒画素数、ストローク幅の出現分布
をしめす図、第８図は文書画像に特徴的な画像パターン
の例を示す図、第９図は従来の文書画像構造解析におい
て一般に用いられる、多くの画像データ走査をともなう
領域分割アルゴリズムの例である。図において、１１はバッファ、１２は画素カウンター、
１３はビットチェッカー、１４はランカウンター、１５
は形状パラメタ決定器、１６は識別器である。代理人　　弁理士　　本　庄　伸　介・供々＠敏短省　　　　　　　　　も第４図Ｓ：百２９二１６◆２＝１ＢＳ＝６０９＝１６◆１６＝３２Ｓ＝３１９＝１６令１６．３２ｓ　＝、を亙［秩９・男、ラン籾５・ストローク１′１′ｌ畠第８図第９図

Claims

【特許請求の範囲】

文書画像データの全体またはある部分領域を黒及び白の
画素の集合として格納する記憶手段と、この記憶手段か
らビット列を読み出し黒または白の画素数を数える画素
計数手段と、前記記憶手段からビット列を読み出し主走
査線方向及び副走査線方向の黒または白のランの出現頻
度を数えるラン計数手段と、前記画素計数手段及び前記
ラン計数手段の出力に基づき前記記憶手段中の画像デー
タの黒または白の画素の分布形状を示すパラメタを算出
する形状パラメタ決定手段と、前記画素計数手段及び前
記形状パラメタ決定手段の出力により前記記憶手段中の
画像データが少なくとも黒、背景、太線、細線、網点で
表わされる文書画像に特徴的なパターンのいずれに該当
するかを決定する識別手段とからなることを特徴とする
パターン識別装置。