JP3045810B2

JP3045810B2 - 二値画像処理方法および装置

Info

Publication number: JP3045810B2
Application number: JP3142237A
Authority: JP
Inventors: 佐藤　　誠; 賢一道庭
Original assignee: Tokyo Keiki Inc
Current assignee: Tokyo Keiki Inc
Priority date: 1991-06-14
Filing date: 1991-06-14
Publication date: 2000-05-29
Anticipated expiration: 2015-05-29
Also published as: JPH06133170A

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】ファクシミリなどによる伝送、文
字領域・図形領域・画像領域への領域分割や文字認識等
の文書理解、データの蓄積や検索によるデータベース管
理などにおいて、文書画像をはじめとする二値画像の処
理を効率よく行なうことが情報化社会の発展にともなっ
てますます重要となってきている。本発明は二値画像デ
ータを効率よく処理するための二値画像処理装置に関す
る。

【０００２】

【従来の技術】これらの処理においては、事前にまたは
その処理の中で、“０”または“１”で表される画像の
集まりである二値画像データが、その処理に適した表現
に変換される。例えば、ファクシミリにおける伝送に
は、ＣＣＩＴＴ（国際電信電話諮問委員会）においてす
でに標準化されているＭＨ法、ＭＲ法等が用いられてい
る。これらの方法の原理は次のとおりである。文書画像
の構造は図１のように「ページ」、「フレーム」、「ブ
ロック」、「ストローク」、「ラン」、「画素」という
構成要素を用いて階層的に表現できる。例えば図２のパ
ターンは、図３の横ラン（ｘ１，ｘ２，…）に分解する
ことができ、この横ランを基礎として図２のパターンを
表現することができる。他方、図２のパターンは、図４
の縦ラン（ｙ１，ｙ２…）に分解することもでき、この
縦ランを基礎として図２のパターンを表現することもで
きる。従来技術であるＭＨ法、ＭＲ法等では、横ランに
基づいてパターンが表現されている。なお文字認識にお
いては細線化によるストローク表現等が使用されてい
る。例えば図５の（Ａ）の原パターンは（Ｂ）の細線化
パターンに変換して処理される。

【０００３】

【発明が解決しようとする課題】文書画像の多くは横ス
トロークと縦ストロークを基本として構成されている。
そして横ストロークは横ランで被覆する方が縦ランで被
覆するよりランの数が少ない。同様に縦ストロークは縦
ランで被覆する方が横ランで被覆するよりランの数が少
ない。従来技術においては、横ランまたは縦ランに基づ
いて画像が処理されているので、無用に多数のランを必
要とするという問題点がある。

【０００４】さらに、二値画像の伝送、理解、管理等の
処理を効率よく行なうためには、これらの処理を統合化
して行なうことが望ましい。このために画像の表現とし
て伝送、理解、管理等の個別の目的によらない共通の表
現方法が必要とされる。従来これらの処理は独立に扱わ
れており、画像の表現方法も目的により様々な表現が用
いられ、他の目的には利用できないという問題点があ
る。なお上記各表現を得るための手法も必ずしも十分な
ものが確立されているわけではない。例えば、細線化に
よるストローク表現では元のＴ字型がＹ字型になってし
まう等の問題がある。このような問題は画素レベル（原
画像の表現状態）から直接所望の表現に変換しているた
め、すなわち画素レベルの情報を普遍的な形で構造化し
た基本的表現を経ていないために発生すると考えられ
る。本発明はかかる問題点に鑑み、目的に依存しない共
通かつ基本的な二値画像の構造化表現（目的に応じた表
現に再変換させるにせよ、それを得るためにも必要とな
る基本的表現）を可能とする二値画像処理方法および装
置を提案することを課題とする。

【０００５】

【課題を解決するための手段】上記課題は、二値画像情
報から横ランと縦ランを求め、このラン情報を記憶し、
ｉ番目の横ランとｊ番目の縦ランが交差するときは１で
あり交差しないときは０である行列である隣接行列（ｆ
_ij）を生成し、隣接行列に対応する２部グラフの最小点
被覆を求め、導出された最小点被覆に対応する横ランと
縦ランを二値画像情報として出力することを特徴とする
二値画像処理方法、および二値画像情報から二値画像情
報から横ランと縦ランを求めこのラン情報を記憶するラ
ン検出手段と、ｉ番目の横ランとｊ番目の縦ランが交差
するときは１であり交差しないときは０である行列であ
る隣接行列（ｆ_ij）を生成する隣接行列生成手段と、隣
接行列に対応する２部グラフの最小点被覆を求める最小
点被覆導出手段と、導出された最小点被覆に対応する横
ランと縦ランを二値画像情報として出力する出力手段を
備えることを特徴とする二値画像処理装置によって解決
される。

【０００６】

【作用】本発明においては、横ランと縦ランの両方を
用いることにより最小のランの数で２値図形情報を表現
する。この表現を以下ＭＣＲ表現とよぶ。

【０００７】本発明の作用を説明するために、先ず２部
グラフと隣接行列および最小点被覆について説明する。

【０００８】「２部グラフ」とは、頂点の集合Ｖ（Ｇ）
と、辺の集合Ｅ（Ｇ）の組合わせからなるグラフＧであ
って、次の性質を有するものをいう。ｉ）Ｖ（Ｇ）は互いに素な頂点の集合Ｘ，Ｙの和集合
である。 φ＝Ｘ∩ＹＶ（Ｇ）＝Ｘ∪Ｙ ii）辺の集合Ｅ（Ｇ）は、集合Ｘの要素ｘｉと集合Ｙ
の要素ｙｊを結ぶ辺＜ｘｉ，ｙｉ＞を要素とする。

【０００９】数１は、要素ｘ１，ｘ２，ｘ３，ｘ４，ｘ
５からなる集合ｘと、要素ｙ１，ｙ２，ｙ３，ｙ４から
なる集合Ｙの和集合からなる頂点の集合Ｖ（Ｇ）と、要
素＜ｘ１，ｙ２＞、＜ｘ２，ｙ１＞、＜ｘ２，ｙ３＞、
＜ｘ３，ｙ２＞、＜ｘ３．ｙ３＞、＜ｘ３，ｙ４＞、＜
ｘ４，ｙ２＞、＜ｘ５，ｙ２＞からなる辺の集合Ｅ
（Ｇ）の組合せからなる２部グラフＧの例である。

【数１】

【００１０】２部グラフは隣接行列によって表現するこ
とができる。すなわち、集合Ｘの要素ｘｉ（ｉ＝１，
２，…，ｍ）と集合Ｙの要素ｙｊ（ｊ＝１，２，…ｎ）
が辺＜ｘｉ，ｙｊ）で結ばれている時はｆ_ij＝１、結ば
れていない時はｆ_ij＝０であるｆ_ijを行列要素とする隣
接行列Ｆによって表現することができる。例えば数１の
２部グラフは数２の（５×４）隣接グラフによって表現
することができる。

【数２】

【００１１】２部グラフＧの頂点の集合Ｖ（Ｇ）の部分
集合Ｗ（Ｗ⊂Ｖ（Ｇ））であって、２部グラブＧの辺の
集合Ｅ（Ｇ）の要素である全ての辺について、それらの
辺の端点である２つの頂点の中の少なくとも一方が部分
集合Ｗの要素であるとき、この部分集合Ｗを２部グラフ
の「点被覆」という。数１の２部グラフＧの場合、例え
ば頂点の集合Ｗ１（ｘ１，ｘ２，ｘ３，ｘ４，ｘ５）は
点被覆であり、同様に集合Ｗ２（ｘ１，ｘ２，ｘ３，ｙ
１，ｙ２）、集合Ｗ３（ｘ２，ｘ３，ｙ２）も点被覆で
ある。点被覆の中で頂点数が最小であるものを「最小点
被覆」という。数１の２部グラフの最小点被覆Ｗは、頂
点の集合（ｘ２，ｘ３，ｙ２）である。数３に、数１の
２部グラフの最小点被覆Ｗに属する頂点を黒点で示す。

【数３】数３から分るように、２部グラフの全ての辺は少なくと
も一端が最小点被覆に属する一つの頂点に終わってい
る。

【００１２】与えられた２部グラフの最小点被覆は、２
部グラフに対応する隣接行列に基づいて求めることがで
きる。隣接行列から最小点被覆を求める公知のアルゴリ
ズムとして、Hofcroft−KarpのアルゴリズムやHungaria
n 方法等がある。例えばHungarian 方法に関しては、尾
崎弘、白川功著「グラフとネットワーク理論」（コロナ
社、１９７３年）に記載されている。なお最小点被覆問
題は、一般的には最大マッチングの問題として論じられ
ている。「２部グラフのマッチング」とは、２部グラフ
の辺の部分集合Ｍ⊂Ｅであって、Ｍのどの相異なる２つ
の辺も端点を共有しないものをいう。

【００１３】次に二値図形情報は２部グラフに対応させ
ることができ、これを２部グラフの最小点被覆に対応す
る横ランと縦ランで表現できることを説明する。

【００１４】例えば図２のパターンである二値図形情報
からラン検出手段により横ラン（図３）と縦ラン（図
４）を求め、その情報を記憶する。

【００１５】この横ランと縦ランの情報に基づいて、隣
接行列生成手段において隣接行列Ｆが生成される隣接行
列Ｆの行列要素ｆ_ijは、横ランｘｉと縦ランｙｊが交叉
するとき、すなわち共通の画素を有するときｆ_ij＝１で
あり、共通の画素を有さないときｆ_ij＝１である。

【００１６】例えば図２のパターンに対応する図３の横
ランｘｉと図４の縦ランｙｊから生成される隣接行列Ｆ
は数４で与えられる。

【数４】

【００１７】二値図形情報の横ランと縦ランの交叉関係
は前に説明したように隣接行列によて表現することがで
きる。また２部グラフも隣接行列によって表現できる。
したがって二値図形情報の横ランと縦ランの交叉関係
は、隣接行列を介して２部グラフに対応させることがで
きる。対応関係は次のとおりである。各横ランは頂点の
集合Ｘに対応し、各縦ランは頂点の集合Ｙに対応する
（Ｘ∩Ｙ＝φ）。横ランｘｉと縦ランが交叉すること
は、集合Ｘの要素ｘｉと集合Ｙの要素ｙｊの間に辺が存
在することに対応して、交叉しないことは辺が存在しな
いことに対応する。

【００１８】図２のパターンの図３，４の横ラン（ｘ
１，ｘ２，…ｘ１６）と縦ラン（ｙ１，ｙ２，ｙ１２）
の交叉関係を示す数４の隣接行列に対応する２部グラブ
を数５に示す。

【数５】

【００１９】この２部グラフに対応する最小点被覆は公
知のアルゴリズムを用いて求めることができ、ｘ１，ｘ
２，ｘ３，ｘ１５，ｘ１６とｙ１，ｙ２，ｙ７，ｙ８が
最小点被覆として得ることができる。数６に数５の２部
グラフの最小点被覆に属する頂点を黒点で示す。

【数６】

【００２０】図２のパターンの各画素は、図３のいずれ
かの横ランに属すると同時に図４のいずれかの縦ランに
属し、その画素はそれが属する横ランと縦ランの共通要
素である。すなわち各画素は横ランと縦ランの交叉に対
応する。横ランと縦ランの交叉関係は２部グラフの辺に
対応するので、図２のパターンの画素は２部グラフの辺
に１：１に対応する。

【００２１】例えば図３の横ランｘ１に含まれる図２の
最上段の４つの画素は、横ランｘ１を指定するだけで表
現できる。他方図２の最上段の４つの画素は数５の辺
〈ｘ１，ｙ５〉、〈ｘ１，ｙ６>、〈ｘ１，ｙ７〉、
〈ｘ１，ｙ８〉に対応する。このことは、これらの辺の
共通の端点である数５の頂点ｘ１を指定することにより
これらの４つの画素が表現できることを意味する。した
がって、図２の全ての画素は数５の２部グラブの点被覆
を求め、この点被覆に対応する横ランと縦ランによって
表現することができる。なぜならば点被覆は、数５の全
ての辺の少なくとも一端がその集合に含まれるという性
能を有するからである。

【００２２】点被覆として最小点被覆を選ぶと、必要な
横ランと縦ランの数が最小になる。これ故、最小点被覆
導出手段で最小点被覆を求める。前に説明したように、
２部グラフと二値画像情報は隣接行列によって表現する
ことがきるので、隣接行列に基づいて最小点被覆を最小
点被覆導出手段で求める。このためのアルゴリズムは前
に説明したように公知である。

【００２３】例えば図２のパターンに対応する２部グラ
フの最小点被覆としてｘ１，ｘ２，ｘ３，ｘ１５，ｘ１
６，ｙ１，ｙ２，ｙ７，ｙ８が求められ、これに対応し
て、図３の横ランｘ１，ｘ２，ｘ３，ｘ１５，ｘ１６と
図４の縦ランｙ１，ｙ２，ｙ７，ｙ８が求められる。図
６の（Ａ），（Ｂ）はこれらの横ランと縦ランのみを図
示したもので、容易に分かるように、これらを組合わせ
ることにより図２のパターンが表現できる。図６の
（Ａ），（Ｂ）から、縦ラン被覆部と、横ラン被覆部の
各セグメントはそれぞれ縦ストローク、横ストロークに
対応しており、この表現が二値画像の基本的な構造化表
現であることが分かる。

【００２４】この最小点被覆に対応する横ランと縦ラン
に関する情報が出力手段から出力される。このようにし
て得られた横ランと縦ランの情報を用いることにより最
小のランの数で二値図形情報を表現し、このランを基礎
として図Ａのストローク、ブロック、フレーム、ページ
等の構造化表現をすることができる。

【００２５】

【実施例】本発明に係る二値画像処理装置においては、
二値画像は次のように処理される。ｉ）二値画像情報から横ランと縦ランをラン検出手段
で検出する。 ii）横ランと縦ランに関する情報から隣接行列を隣接
行列生成手段で生成する。 iii）隣接行列から最小点被覆を最小点被覆導出手段
で導出する。 iv）最小点被覆に対応する横ランと縦ランに関する情
報を出力手段から出力する。

【００２６】ラン検出手段について説明する。ランデー
タの登録のために、図７に示すように現時点での水平走
査線データと、１つ前の水平走査線データのためのライ
ンバッファnewline() とoldline() を用意する。横ラン
データの登録は、ラインバッファnewline() の黒画素成
分を調べることにより行う。縦ランデータの登録は、２
つのラインバッファを比較することにより行う。図７に
示すように、２つのラインバッファの比較により４つの
状態変化Ｉ白画素から白画素・縦ランが存在していない II 白画素から黒画素・縦ランが生成 III 黒画素から黒画素・縦ランが継続 IV 黒画素から白画素・縦ランが終了が考えられる。状態変化IIでは、新しい縦ランを登録し
始点座標を与える。状態変化IVでは、すでに登録してあ
る縦ランの終点座標を与える。

【００２７】本発明の好ましい実施例においてはラン検
出手段において矩形解析が同時に行なわれるので、次に
矩形解析について説明する。文書中に大きな表やグラフ
などがある場合、これらの部分は黒画素の連結成分の数
が一般に大きなものとなる。この部分のＭＣＲ表現を得
るには、大規模な２部グラフの最小点被覆あるいは最大
マッチングを求めることになり、処理時間が問題とな
る。そのため、ランデータを登録する前処理の段階で、
局所的に形状を判断することにより、予めＭＣＲ表現の
要素になるラン（被覆ラン）と、ならないラン（非被覆
ラン）をある程度確定できると良い。図８（ａ），
（ｂ）のような矩形を含む領域を考えることにする。こ
のとき次の定理が成り立つ。〔定理〕図８（ａ）のように上辺と下辺を境界とする縦
ｍ、横ｎ（ｍ≦ｎ）の横長の矩形を含む領域について、
横ランｈ１，ｈ２，…，ｈｍはＭＣＲ表現の被覆ラン
で、縦ランｖ１，ｖ２，…，ｖｎは被覆ランである。同
様に図４（ｂ）のように、左辺と右辺を境界とする縦
ｎ，横ｍ（ｎ≦ｍ）の縦長の矩形を含む領域について、
縦ランｖ１，ｖ２，…，ｖｍはＭＣＲ表現の被覆ラン
で、横ランｈ１，ｈ２，…，ｈｎは非被覆ランである。
この定理により図８（ａ），（ｂ）のような矩形領域を
調べることにより、前処理の段階で多くのランを被覆ラ
ン、非被覆ランに確定できる。そして、最小点被覆の対
象となる領域は、図８の斜線部で示した部分領域であ
る。これらの領域はもとの二値画像に比べてはるかに細
分化されているので、処理の高速化が期待できる。この
矩形領域の局所的処理を矩形解析と呼ぶ。図８（ａ）の
形状の矩形解析について述べる。このような形状が存在
するのは、長さｍの縦ランがｍ個以上横方向に連続して
終了した場合である。このことから状態変化IVの縦ラン
終了時に、縦ランの長さと繰り返し回数を調べることに
より、図８（ａ）の矩形領域を判断することがきる。次
に図８（ｂ）の矩形解析について述べる。この矩形領域
が存在するのは、白画素から黒画素への境界と黒画素か
ら白画素への境界のペアが幅ｍをもち、ｍ個以上縦方向
へ続いた場合である。このため、境界の縦方向の連続数
を示す配列ｂｄｅｐｔｈ（）を用意する。ｂｄｅｐｔ
ｈ（）には白画素から黒画素への境界の縦方向の連続
数、あるいは黒画素から白画素への境界の縦方向の連続
数を設定し、境界でないときには０にする。ｂｄｅｐ
ｔｈ（）は水平走査線を読み込むごとに、常に更新す
る。図９のように、ｂｄｅｐｔｈ（）の境界の対ｎ₁
とｎ₂、その間の幅ｍに対して、ｍ≦ｍｉｎ（ｎ₁，ｎ₂）が成り立つとき、この領域が図８（ｂ）の矩形領域にあ
たる。図８（ａ），（ｂ）の矩形領域が検出された場
合、該当するランを被覆ランか、非被覆ランに確定す
る。

【００２８】次に隣接行列生成手段について説明する。
ラン検出手段で検出されたラン情報の始点座標ｓｐと終
点座標ｅｐは、最初のランtop ran,次のランnext ran…
の順で、図１０のようにメモリーに記憶されている。こ
の情報に基づいて交差するランが効率より求められるよ
うに、横ランと縦ランのためにそれぞれ二つの配列が図
１１に示すように用意される。配列hran()は、横ランデ
ータの始点座標(sp)、終点座標(ep)、フラグ(fg)、およ
び同一走査線状の次のランデータの保存されている番地
を表すポインタ(np)から構成される。フラグ(fg)は、被
覆ラン、非被覆ラン、あるいはいずれにも確定していな
い未処理ランなどのランの属性を表現する。hran()は、
各水平走査線に属する最初の横ランデータのポインタを
設定する。この横ランのデータ構造により、任意の水平
走査線上のランデータを効率より取り出すことができ
る。縦ランのデータ構造も、全く同様にして２つのvran
()とvtop()により表現される。

【００２９】このようなランデータ構造を用いることに
より、交差するランは次のようにして求めることがき
る。垂直走査線ｙ上で、始点座標がｘｓ，終点座標がｘ
ｅの縦ランと交差する横ランはｘｓ≦ｘｓ≦ｘｅを満たす水平走査線ｘに対して以下の処理を繰り返すこ
とによって求められる。水平走査線ｘ上の最初の横ラン
データのポインタhtop(x) により、水平走査線ｘ上の最
初の横ランデータを参照する。この横ランデータの始点
座標ｓｐ、終点座標ｅｐがｓｐ≦ｙ≦ｅｐの条件を満たしているとき、この横ランが元の縦ランと
交差するランである。そうでないときは、ポインタＡ(n
p)により次のランを調べる。この操作を交差するランが
求められるまで続ける。交差する横ランは１つの水平走
査線に１つだけ存在するので、交差するランが見つかっ
たら、次の水平走査線の処理に移る。横ランと交差する
縦ランも、同様にして効率よく求めることができる。こ
のようにして隣接行列を求めることができる。

【００３０】次に最小点被覆導出手段について説明す
る。最小点被覆導出手段はコンピュータで形成される。
したがってここでは最小点被覆を求めるアルゴリズムの
一例について説明する。

【００３１】隣接行列生成手段で隣接行列Ｆ（Ｘ，Ｙ）
が求められているとする。〔操作１〕次の手段により、Ｆ（Ｘ，Ｙ）の各行、各列
にをたかだか１個割り当てる。ｉ）Ｉ←１として次へ移れ ii）Ｉ＜Ｐであれば次へ移れ、Ｉ＝Ｐであればiv）へ移
れ iii）Ｆ（Ｘ，Ｙ）の行Ｉにおいて１を持つ列ｊで、ま
だチェック“＊”が付されていないものがあれば、その
中の任意の列ｊを選び、（Ｉ，ｊ₀）要素の１をと
し、列ｊ₀の上端にチェックを付す。次に、Ｉ←Ｉ＋１
としてii）へもどる。このような列がなければ、Ｉ←Ｉ
＋１としてii）へもどる。 iv）Ｆ（Ｘ，Ｙ）のすべての行がを持つとき、操作は
完了。それ以外のときは列の上端のチェックをすべて消
して次の操作へ移れ。〔操作２〕を持たないＦ（Ｘ，Ｙ）の各行の右端に
“０”なるレーベルを付し、左端にチェックを付す。次
へ移れ。〔操作３〕次の手順で列の上端にチェックを、下端にレ
ーベルを付す。ｉ）左端にチェックを持つ行ｉにおいて、ｆ_ij＝１であ
る列ｊのおのおのに対して、列ｊの下端にまだレーベル
が付されていない場合にのみ、この列の上端にチェック
を付し、下端に“ｉ”なるレーベルを付ける。同様の操
作を残りのチェックを持つ各行について、順次行なう。
この操作の過程でチェックを持つ列が一つでも生じれば
次のii）へ、それ以外のときは操作５へ移れ。 ii）Ｆ（Ｘ，Ｙ）の行の左端にあるすべてのチェックを
消して操作３へもどれ。〔操作５〕下端にレーベルを持つ列でを持たないもの
があれば、次の操作に移れ。それ以外の場合操作は完了
する。〔操作６〕下端にレーベルを持つ列で、を持たないも
のを列ｊとする。列ｊには、ｆ_ij＝１でしかもその行ｉ
の右端にレーベルを持つようなものが少なくとも１個存
在する。このとき、このｆ_ij＝１を丸で囲んだとす
る。このとき、行ｉのは２個になるが、この行の右端
のレーベルがｈであるとすれば、ｆ_ij＝を１で置き換
え、更に列ｈ′の下端のレーベルがｋであるとすれば、
こんどはｆ_kh＝１をにする。このように、行と列のレ
ーベルを見ながら交互に１をに、を１にそれぞれ置
き換えてゆけば、最後に“０”をレーベルに持っていた
行の１がになる。すなわち、操作６においてが１個
だけ増加する。次に操作７へ移れ。〔操作７〕すべての行・列のチェック・レーベルを消し
て操作２へもどれ。このアルゴリズムが完了したとき、レーベルが付いてい
ない行と、レーベルが付いている列に対応する頂点が最
小点被覆となる。

【００３２】本発明に係る二値画像処理装置の解析アル
ゴリズムを要約したフローチャートを図１２に示す。二値画像データを水平操作線ごとに読み込みながら
縦ランと横ランのデータを登録し、同時に矩形解析を行
う。未処理ランがなくなるまで、との処理を繰り返
す。で検索された未処理ランと交差する未処理ランを
求め、さらにそのランと交差する未処理ランを求めると
いうように、再帰的に交差する未処理ランを求めなが
ら、隣接行列を作成する。で作成した隣接行列に対して、最小被覆ランを求
める。

【００３３】次にＣＣＩＴＴ標準原稿を本発明に係る二
値画像処理装置により処理した時の実例を示す。ＣＣＩ
ＴＴ標準原稿は、大きさが縦２３７６、横１６８０の二
値画像データである。その例を図１３に示す。この例に
ついてＭＣＲ表現を求め、その縦ラン被覆部、横ラン被
覆部をそれぞれ図１４，１５に示す。この実験結果によ
り文書画像の表を構成する縦ストローク、横ストローク
が、それぞれ縦ラン被覆部、横ラン被覆部のセグメント
として抽出されていることが分かる。文字に対してもス
トロークのはっきりしている部分は、ある程度ストロー
クと縦ラン被覆部、横ラン被覆部のセグメントとの対応
がとれていることが分かる。

【００３４】次にＭＣＲ表現の応用例として、文書画像
から表を抽出する問題を考えてみる。表を構成している
各ストロークの長さは、文字の大きさに対応して十分に
長い。このことから適当な閾値を定めて、縦ラン被覆
部、横ラン被覆部の各セグメントの形状を分析すること
により表部分の抽出を行うことができる。図１３の文書
画像から表を抽出した結果を図１６に示す。

【００３５】本発明によるＭＣＲ表現ではできるだけ少
ないランで二値画像を表現するということで、従来の一
次元横ランのみの表現に比べてランの総数は大幅に減少
し、データ圧縮効果は非常に大きいというメリットを有
する。ＣＣＩＴＴ標準のランの総数を比較した結果を表
１に示す。この結果より、横ランで表現するのに比べ、
ＭＣＲ表現の方がより少ないランで二値画像を表現する
ことができることがわかる。

【表１】

【００３６】さらに、本発明による画像表現によれば従
来の細線化によるストローク表現でうまくいかなかった
ものが正確に表現できるという効果も生じる。例えば、
従来の細線化によるストローク表現で図５の（Ａ）の細
線化パターンを求めると、図５の（Ｂ）に示すようにＴ
字型の交差部分がＹ字型になってしまう。しかしながら
本発明のＭＣＲ表現の縦ラン被覆部（図１７）と横ラン
被覆部（図１８）に対しこれらの細線化パターンを別々
に求めると、図１９，２０のパターンが得られる。そし
て、図１９と図２０の細線化パターンを結合すると、図
２１の細線化パターンが得られ、従来に比べ正確なスト
ローク表現ができることがわかる。

【００３７】

【発明の効果】本発明による画像表現の縦ラン被覆部
分、横ラン被覆部分のセグメントは、それぞれ縦ストロ
ーク、横ストロークに良く対応させることができ、階層
的表現に適し、二値画像の構造解析にも有効である。ま
た、情報圧縮効果もあり、細線化処理においても正確な
表現をすることができるという従来にない優れた効果を
有する。すなわち、本発明は、伝達、理解、管理等の目
的に依存しない共通かつ基本的な二値画像の構造化表現
を与えるものであり、これらの処理を統合化して効率よ
く行なうことに大きく貢献する。

【図面の簡単な説明】

【図１】文書画像の階層構造を示す説明図である。

【図２】二値画像のパターンの例を示す説明図である。

【図３】図２のパターンを横ランに分解した説明図であ
る。

【図４】図２のパターンを縦ランに分解した説明図であ
る。

【図５】パターンの細線化処理を示す説明図である。

【図６】図２のパターンを本発明に係る二値画像処理装
置を用いて処理した時に得られる最小点被覆に対応する
横ランと縦ランを示す説明図である。

【図７】ラン検出手段における水平走査線データのため
の２つのラインバッファのデータ格納状態の例を示すメ
モリのビット図である。

【図８】矩形領域を含むパターンの例を示す説明図であ
る。

【図９】矩形解析のための配列のデータ格納状態の例を
示す説明図である。

【図１０】ラン情報を記憶するメモリー内のメモリマッ
プである。

【図１１】ランを管理するための２つの配列の構造を示
す説明図である。

【図１２】本発明に係る二値画像処理装置の解析アルゴ
リズムを要約したフローチャートである。

【図１３】ＣＣＩＴＴ標準原稿の一例である。

【図１４】図１３の標準原稿から求めたＭＣＲ表現の縦
ラン被覆部である。

【図１５】図１３の標準原稿から求めたＭＣＲ表現の横
ラン被覆部である。

【図１６】図１３の標準原稿から表を抽出した結果であ
る。

【図１７】図５の（Ａ）のパターンのＭＣＲ表現の縦ラ
ン被覆部である。

【図１８】図５の（Ａ）のパターンのＭＣＲ表現の横ラ
ン被覆部である。

【図１９】図１７の縦ラン被覆部の細線化パターンであ
る。

【図２０】図１８の横ラン被覆部の細線化パターンであ
る。

【図２１】図１９と図２０の細線化パターンを結合した
細線化パターンである。

───────────────────────────────────────────────────── フロントページの続き (58)調査した分野(Int.Cl.⁷，ＤＢ名) H04N 1/411 G06T 9/00

Claims

(57)【特許請求の範囲】

【請求項１】二値画像情報から横ランと縦ランを求
め、このラン情報を記憶し、ｉ番目の横ランとｊ番目の
縦ランが交差するときは１であり交差しないときは０で
ある行列である隣接行列（ｆ_ij）を生成し、隣接行列に
対応する２部グラフの最小点被覆を求め、導出された最
小点被覆に対応する横ランと縦ランを二値画像情報とし
て出力することを特徴とする二値画像処理方法。
【請求項２】二値画像情報から横ランと縦ランを求め
このラン情報を記憶するラン検出手段と、ｉ番目の横ラ
ンとｊ番目の縦ランが交差するときは１であり交差しな
いときは０である行列である隣接行列（ｆ_ij）を生成す
る隣接行列生成手段と、隣接行列に対応する２部グラフ
の最小点被覆を求める最小点被覆導出手段と、導出され
た最小点被覆に対応する横ランと縦ランを二値画像情報
として出力する出力手段を備えることを特徴とする二値
画像処理装置。