JP3045810B2 - 二値画像処理方法および装置 - Google Patents

二値画像処理方法および装置

Info

Publication number
JP3045810B2
JP3045810B2 JP3142237A JP14223791A JP3045810B2 JP 3045810 B2 JP3045810 B2 JP 3045810B2 JP 3142237 A JP3142237 A JP 3142237A JP 14223791 A JP14223791 A JP 14223791A JP 3045810 B2 JP3045810 B2 JP 3045810B2
Authority
JP
Japan
Prior art keywords
run
horizontal
vertical
binary image
runs
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP3142237A
Other languages
English (en)
Other versions
JPH06133170A (ja
Inventor
佐藤  誠
賢一 道庭
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tokyo Keiki Inc
Original Assignee
Tokyo Keiki Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tokyo Keiki Inc filed Critical Tokyo Keiki Inc
Priority to JP3142237A priority Critical patent/JP3045810B2/ja
Publication of JPH06133170A publication Critical patent/JPH06133170A/ja
Application granted granted Critical
Publication of JP3045810B2 publication Critical patent/JP3045810B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Image Processing (AREA)
  • Compression Of Band Width Or Redundancy In Fax (AREA)
  • Image Analysis (AREA)

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】ファクシミリなどによる伝送、文
字領域・図形領域・画像領域への領域分割や文字認識等
の文書理解、データの蓄積や検索によるデータベース管
理などにおいて、文書画像をはじめとする二値画像の処
理を効率よく行なうことが情報化社会の発展にともなっ
てますます重要となってきている。本発明は二値画像デ
ータを効率よく処理するための二値画像処理装置に関す
る。
【0002】
【従来の技術】これらの処理においては、事前にまたは
その処理の中で、“0”または“1”で表される画像の
集まりである二値画像データが、その処理に適した表現
に変換される。例えば、ファクシミリにおける伝送に
は、CCITT(国際電信電話諮問委員会)においてす
でに標準化されているMH法、MR法等が用いられてい
る。これらの方法の原理は次のとおりである。文書画像
の構造は図1のように「ページ」、「フレーム」、「ブ
ロック」、「ストローク」、「ラン」、「画素」という
構成要素を用いて階層的に表現できる。例えば図2のパ
ターンは、図3の横ラン(x1,x2,…)に分解する
ことができ、この横ランを基礎として図2のパターンを
表現することができる。他方、図2のパターンは、図4
の縦ラン(y1,y2…)に分解することもでき、この
縦ランを基礎として図2のパターンを表現することもで
きる。従来技術であるMH法、MR法等では、横ランに
基づいてパターンが表現されている。なお文字認識にお
いては細線化によるストローク表現等が使用されてい
る。例えば図5の(A)の原パターンは(B)の細線化
パターンに変換して処理される。
【0003】
【発明が解決しようとする課題】文書画像の多くは横ス
トロークと縦ストロークを基本として構成されている。
そして横ストロークは横ランで被覆する方が縦ランで被
覆するよりランの数が少ない。同様に縦ストロークは縦
ランで被覆する方が横ランで被覆するよりランの数が少
ない。従来技術においては、横ランまたは縦ランに基づ
いて画像が処理されているので、無用に多数のランを必
要とするという問題点がある。
【0004】さらに、二値画像の伝送、理解、管理等の
処理を効率よく行なうためには、これらの処理を統合化
して行なうことが望ましい。このために画像の表現とし
て伝送、理解、管理等の個別の目的によらない共通の表
現方法が必要とされる。従来これらの処理は独立に扱わ
れており、画像の表現方法も目的により様々な表現が用
いられ、他の目的には利用できないという問題点があ
る。なお上記各表現を得るための手法も必ずしも十分な
ものが確立されているわけではない。例えば、細線化に
よるストローク表現では元のT字型がY字型になってし
まう等の問題がある。このような問題は画素レベル(原
画像の表現状態)から直接所望の表現に変換しているた
め、すなわち画素レベルの情報を普遍的な形で構造化し
た基本的表現を経ていないために発生すると考えられ
る。本発明はかかる問題点に鑑み、目的に依存しない共
通かつ基本的な二値画像の構造化表現(目的に応じた表
現に再変換させるにせよ、それを得るためにも必要とな
る基本的表現)を可能とする二値画像処理方法および装
置を提案することを課題とする。
【0005】
【課題を解決するための手段】上記課題は、二値画像情
報から横ランと縦ランを求め、このラン情報を記憶し、
i番目の横ランとj番目の縦ランが交差するときは1で
あり交差しないときは0である行列である隣接行列(f
ij)を生成し、隣接行列に対応する2部グラフの最小点
被覆を求め、導出された最小点被覆に対応する横ランと
縦ランを二値画像情報として出力することを特徴とする
二値画像処理方法、および二値画像情報から二値画像情
報から横ランと縦ランを求めこのラン情報を記憶するラ
ン検出手段と、i番目の横ランとj番目の縦ランが交差
するときは1であり交差しないときは0である行列であ
る隣接行列(fij)を生成する隣接行列生成手段と、隣
接行列に対応する2部グラフの最小点被覆を求める最小
点被覆導出手段と、導出された最小点被覆に対応する横
ランと縦ランを二値画像情報として出力する出力手段を
備えることを特徴とする二値画像処理装置によって解決
される。
【0006】
【作 用】本発明においては、横ランと縦ランの両方を
用いることにより最小のランの数で2値図形情報を表現
する。この表現を以下MCR表現とよぶ。
【0007】本発明の作用を説明するために、先ず2部
グラフと隣接行列および最小点被覆について説明する。
【0008】「2部グラフ」とは、頂点の集合V(G)
と、辺の集合E(G)の組合わせからなるグラフGであ
って、次の性質を有するものをいう。 i) V(G)は互いに素な頂点の集合X,Yの和集合
である。 φ=X∩Y V(G)=X∪Y ii) 辺の集合E(G)は、集合Xの要素xiと集合Y
の要素yjを結ぶ辺<xi,yi>を要素とする。
【0009】数1は、要素x1,x2,x3,x4,x
5からなる集合xと、要素y1,y2,y3,y4から
なる集合Yの和集合からなる頂点の集合V(G)と、要
素<x1,y2>、<x2,y1>、<x2,y3>、
<x3,y2>、<x3.y3>、<x3,y4>、<
x4,y2>、<x5,y2>からなる辺の集合E
(G)の組合せからなる2部グラフGの例である。
【数1】
【0010】2部グラフは隣接行列によって表現するこ
とができる。すなわち、集合Xの要素xi(i=1,
2,…,m)と集合Yの要素yj(j=1,2,…n)
が辺<xi,yj)で結ばれている時はfij=1、結ば
れていない時はfij=0であるfijを行列要素とする隣
接行列Fによって表現することができる。例えば数1の
2部グラフは数2の(5×4)隣接グラフによって表現
することができる。
【数2】
【0011】2部グラフGの頂点の集合V(G)の部分
集合W(W⊂V(G))であって、2部グラブGの辺の
集合E(G)の要素である全ての辺について、それらの
辺の端点である2つの頂点の中の少なくとも一方が部分
集合Wの要素であるとき、この部分集合Wを2部グラフ
の「点被覆」という。数1の2部グラフGの場合、例え
ば頂点の集合W1(x1,x2,x3,x4,x5)は
点被覆であり、同様に集合W2(x1,x2,x3,y
1,y2)、集合W3(x2,x3,y2)も点被覆で
ある。点被覆の中で頂点数が最小であるものを「最小点
被覆」という。数1の2部グラフの最小点被覆Wは、頂
点の集合(x2,x3,y2)である。数3に、数1の
2部グラフの最小点被覆Wに属する頂点を黒点で示す。
【数3】 数3から分るように、2部グラフの全ての辺は少なく
も一端最小点被覆に属する一つの頂点に終わってい
る。
【0012】与えられた2部グラフの最小点被覆は、2
部グラフに対応する隣接行列に基づいて求めることがで
きる。隣接行列から最小点被覆を求める公知のアルゴリ
ズムとして、Hofcroft−KarpのアルゴリズムやHungaria
n 方法等がある。例えばHungarian 方法に関しては、尾
崎弘、白川功著「グラフとネットワーク理論」(コロナ
社、1973年)に記載されている。なお最小点被覆問
題は、一般的には最大マッチングの問題として論じられ
ている。「2部グラフのマッチング」とは、2部グラフ
の辺の部分集合M⊂Eであって、Mのどの相異なる2つ
の辺も端点を共有しないものをいう。
【0013】次に二値図形情報は2部グラフに対応させ
ることができ、これを2部グラフの最小点被覆に対応す
る横ランと縦ランで表現できることを説明する。
【0014】例えば図2のパターンである二値図形情報
からラン検出手段により横ラン(図3)と縦ラン(図
4)を求め、その情報を記憶する。
【0015】この横ランと縦ランの情報に基づいて、隣
接行列生成手段において隣接行列Fが生成される隣接行
列Fの行列要素fijは、横ランxiと縦ランyjが交叉
するとき、すなわち共通の画素を有するときfij=1で
あり、共通の画素を有さないときfij=1である。
【0016】例えば図2のパターンに対応する図3の横
ランxiと図4の縦ランyjから生成される隣接行列F
は数4で与えられる。
【数4】
【0017】二値図形情報の横ランと縦ランの交叉関係
は前に説明したように隣接行列によて表現することがで
きる。また2部グラフも隣接行列によって表現できる。
したがって二値図形情報の横ランと縦ランの交叉関係
は、隣接行列を介して2部グラフに対応させることがで
きる。対応関係は次のとおりである。各横ランは頂点の
集合Xに対応し、各縦ランは頂点の集合Yに対応する
(X∩Y=φ)。横ランxiと縦ランが交叉すること
は、集合Xの要素xiと集合Yの要素yjの間に辺が存
在することに対応して、交叉しないことは辺が存在しな
いことに対応する。
【0018】図2のパターンの図3,4の横ラン(x
1,x2,…x16)と縦ラン(y1,y2,y12)
の交叉関係を示す数4の隣接行列に対応する2部グラブ
を数5に示す。
【数5】
【0019】この2部グラフに対応する最小点被覆は公
知のアルゴリズムを用いて求めることができ、x1,x
2,x3,x15,x16とy1,y2,y7,y8が
最小点被覆として得ることができる。数6に数5の2部
グラフの最小点被覆に属する頂点を黒点で示す。
【数6】
【0020】図2のパターンの各画素は、図3のいずれ
かの横ランに属すると同時に図4のいずれかの縦ランに
属し、その画素はそれが属する横ランと縦ランの共通要
素である。すなわち各画素は横ランと縦ランの交叉に対
応する。横ランと縦ランの交叉関係は2部グラフの辺に
対応するので、図2のパターンの画素は2部グラフの辺
に1:1に対応する。
【0021】例えば図3の横ランx1に含まれる図2の
最上段の4つの画素は、横ランx1を指定するだけで表
現できる。他方図2の最上段の4つの画素は数5の辺
〈x1,5〉、〈x1,y6>、〈x1,y7〉、
〈x1,y8〉に対応する。このことは、これらの辺の
共通の端点である数5の頂点x1を指定することにより
これらの4つの画素が表現できることを意味する。した
がって、図2の全ての画素は数5の2部グラブの点被覆
を求め、この点被覆に対応する横ランと縦ランによって
表現することができる。なぜならば点被覆は、数5の全
ての辺の少なくとも一端がその集合に含まれるという性
能を有するからである。
【0022】点被覆として最小点被覆を選ぶと、必要な
横ランと縦ランの数が最小になる。これ故、最小点被覆
導出手段で最小点被覆を求める。前に説明したように、
2部グラフと二値画像情報は隣接行列によって表現する
ことがきるので、隣接行列に基づいて最小点被覆を最小
点被覆導出手段で求める。このためのアルゴリズムは前
に説明したように公知である。
【0023】例えば図2のパターンに対応する2部グラ
フの最小点被覆としてx1,x2,x3,x15,x1
6,y1,y2,y7,y8が求められ、これに対応し
て、図3の横ランx1,x2,x3,x15,x16と
図4の縦ランy1,y2,y7,y8が求められる。図
6の(A),(B)はこれらの横ランと縦ランのみを図
示したもので、容易に分かるように、これらを組合わせ
ることにより図2のパターンが表現できる。図6の
(A),(B)から、縦ラン被覆部と、横ラン被覆部の
各セグメントはそれぞれ縦ストローク、横ストロークに
対応しており、この表現が二値画像の基本的な構造化表
現であることが分かる。
【0024】この最小点被覆に対応する横ランと縦ラン
に関する情報が出力手段から出力される。このようにし
て得られた横ランと縦ランの情報を用いることにより最
小のランの数で二値図形情報を表現し、このランを基礎
として図Aのストローク、ブロック、フレーム、ページ
等の構造化表現をすることができる。
【0025】
【実施例】本発明に係る二値画像処理装置においては、
二値画像は次のように処理される。 i) 二値画像情報から横ランと縦ランをラン検出手段
で検出する。 ii) 横ランと縦ランに関する情報から隣接行列を隣接
行列生成手段で生成する。 iii) 隣接行列から最小点被覆を最小点被覆導出手段
で導出する。 iv) 最小点被覆に対応する横ランと縦ランに関する情
報を出力手段から出力する。
【0026】ラン検出手段について説明する。ランデー
タの登録のために、図7に示すように現時点での水平走
査線データと、1つ前の水平走査線データのためのライ
ンバッファnewline() とoldline() を用意する。横ラン
データの登録は、ラインバッファnewline() の黒画素成
分を調べることにより行う。縦ランデータの登録は、2
つのラインバッファを比較することにより行う。図7に
示すように、2つのラインバッファの比較により4つの
状態変化 I 白画素から白画素 ・縦ランが存在していない II 白画素から黒画素 ・縦ランが生成 III 黒画素から黒画素 ・縦ランが継続 IV 黒画素から白画素 ・縦ランが終了 が考えられる。状態変化IIでは、新しい縦ランを登録し
始点座標を与える。状態変化IVでは、すでに登録してあ
る縦ランの終点座標を与える。
【0027】本発明の好ましい実施例においてはラン検
出手段において矩形解析が同時に行なわれるので、次に
矩形解析について説明する。文書中に大きな表やグラフ
などがある場合、これらの部分は黒画素の連結成分の数
が一般に大きなものとなる。この部分のMCR表現を得
るには、大規模な2部グラフの最小点被覆あるいは最大
マッチングを求めることになり、処理時間が問題とな
る。そのため、ランデータを登録する前処理の段階で、
局所的に形状を判断することにより、予めMCR表現の
要素になるラン(被覆ラン)と、ならないラン(非被覆
ラン)をある程度確定できると良い。図8(a),
(b)のような矩形を含む領域を考えることにする。こ
のとき次の定理が成り立つ。 〔定理〕図8(a)のように上辺と下辺を境界とする縦
m、横n(m≦n)の横長の矩形を含む領域について、
横ランh1,h2,…,hmはMCR表現の被覆ラン
で、縦ランv1,v2,…,vnは被覆ランである。同
様に図4(b)のように、左辺と右辺を境界とする縦
n,横m(n≦m)の縦長の矩形を含む領域について、
縦ランv1,v2,…,vmはMCR表現の被覆ラン
で、横ランh1,h2,…,hnは非被覆ランである。
この定理により図8(a),(b)のような矩形領域を
調べることにより、前処理の段階で多くのランを被覆ラ
ン、非被覆ランに確定できる。そして、最小点被覆の対
象となる領域は、図8の斜線部で示した部分領域であ
る。これらの領域はもとの二値画像に比べてはるかに細
分化されているので、処理の高速化が期待できる。この
矩形領域の局所的処理を矩形解析と呼ぶ。図8(a)の
形状の矩形解析について述べる。このような形状が存在
するのは、長さmの縦ランがm個以上横方向に連続して
終了した場合である。このことから状態変化IVの縦ラン
終了時に、縦ランの長さと繰り返し回数を調べることに
より、図8(a)の矩形領域を判断することがきる。次
に図8(b)の矩形解析について述べる。この矩形領域
が存在するのは、白画素から黒画素への境界と黒画素か
ら白画素への境界のペアが幅mをもち、m個以上縦方向
へ続いた場合である。このため、境界の縦方向の連続数
を示す配列b depth()を用意する。b dept
h()には白画素から黒画素への境界の縦方向の連続
数、あるいは黒画素から白画素への境界の縦方向の連続
数を設定し、境界でないときには0にする。b dep
th()は水平走査線を読み込むごとに、常に更新す
る。図9のように、b depth()の境界の対n1
とn2 、その間の幅mに対して、 m≦min(n1 ,n2 ) が成り立つとき、この領域が図8(b)の矩形領域にあ
たる。図8(a),(b)の矩形領域が検出された場
合、該当するランを被覆ランか、非被覆ランに確定す
る。
【0028】次に隣接行列生成手段について説明する。
ラン検出手段で検出されたラン情報の始点座標spと終
点座標epは、最初のランtop ran,次のランnext ran…
の順で、図10のようにメモリーに記憶されている。こ
の情報に基づいて交差するランが効率より求められるよ
うに、横ランと縦ランのためにそれぞれ二つの配列が図
11に示すように用意される。配列hran()は、横ランデ
ータの始点座標(sp)、終点座標(ep)、フラグ(fg)、およ
び同一走査線状の次のランデータの保存されている番地
を表すポインタ(np)から構成される。フラグ(fg)は、被
覆ラン、非被覆ラン、あるいはいずれにも確定していな
い未処理ランなどのランの属性を表現する。hran()は、
各水平走査線に属する最初の横ランデータのポインタを
設定する。この横ランのデータ構造により、任意の水平
走査線上のランデータを効率より取り出すことができ
る。縦ランのデータ構造も、全く同様にして2つのvran
()とvtop()により表現される。
【0029】このようなランデータ構造を用いることに
より、交差するランは次のようにして求めることがき
る。垂直走査線y上で、始点座標がxs,終点座標がx
eの縦ランと交差する横ランは xs≦xs≦xe を満たす水平走査線xに対して以下の処理を繰り返すこ
とによって求められる。水平走査線x上の最初の横ラン
データのポインタhtop(x) により、水平走査線x上の最
初の横ランデータを参照する。この横ランデータの始点
座標sp、終点座標epが sp≦y≦ep の条件を満たしているとき、この横ランが元の縦ランと
交差するランである。そうでないときは、ポインタA(n
p)により次のランを調べる。この操作を交差するランが
求められるまで続ける。交差する横ランは1つの水平走
査線に1つだけ存在するので、交差するランが見つかっ
たら、次の水平走査線の処理に移る。横ランと交差する
縦ランも、同様にして効率よく求めることができる。こ
のようにして隣接行列を求めることができる。
【0030】次に最小点被覆導出手段について説明す
る。最小点被覆導出手段はコンピュータで形成される。
したがってここでは最小点被覆を求めるアルゴリズムの
一例について説明する。
【0031】隣接行列生成手段で隣接行列F(X,Y)
が求められているとする。 〔操作1〕次の手段により、F(X,Y)の各行、各列
にをたかだか1個割り当てる。 i)I←1として次へ移れ ii)I<Pであれば次へ移れ、I=Pであればiv)へ移
れ iii)F(X,Y)の行Iにおいて1を持つ列jで、ま
だチェック“*”が付されていないものがあれば、その
中の任意の列jを選び、(I,j0 )要素の1をと
し、列j0 の上端にチェックを付す。次に、I←I+1
としてii)へもどる。このような列がなければ、I←I
+1としてii)へもどる。 iv)F(X,Y)のすべての行がを持つとき、操作は
完了。それ以外のときは列の上端のチェックをすべて消
して次の操作へ移れ。 〔操作2〕を持たないF(X,Y)の各行の右端に
“0”なるレーベルを付し、左端にチェックを付す。次
へ移れ。 〔操作3〕次の手順で列の上端にチェックを、下端にレ
ーベルを付す。 i)左端にチェックを持つ行iにおいて、fij=1であ
る列jのおのおのに対して、列jの下端にまだレーベル
が付されていない場合にのみ、この列の上端にチェック
を付し、下端に“i”なるレーベルを付ける。同様の操
作を残りのチェックを持つ各行について、順次行なう。
この操作の過程でチェックを持つ列が一つでも生じれば
次のii)へ、それ以外のときは操作5へ移れ。 ii)F(X,Y)の行の左端にあるすべてのチェックを
消して操作3へもどれ。 〔操作5〕下端にレーベルを持つ列でを持たないもの
があれば、次の操作に移れ。それ以外の場合操作は完了
する。 〔操作6〕下端にレーベルを持つ列で、を持たないも
のを列jとする。列jには、fij=1でしかもその行i
の右端にレーベルを持つようなものが少なくとも1個存
在する。このとき、このfij=1を丸で囲んだとす
る。このとき、行iのは2個になるが、この行の右端
のレーベルがhであるとすれば、fij=を1で置き換
え、更に列h′の下端のレーベルがkであるとすれば、
こんどはfkh=1をにする。このように、行と列のレ
ーベルを見ながら交互に1をに、を1にそれぞれ置
き換えてゆけば、最後に“0”をレーベルに持っていた
行の1がになる。すなわち、操作6においてが1個
だけ増加する。次に操作7へ移れ。 〔操作7〕すべての行・列のチェック・レーベルを消し
て操作2へもどれ。 このアルゴリズムが完了したとき、レーベルが付いてい
ない行と、レーベルが付いている列に対応する頂点が最
小点被覆となる。
【0032】本発明に係る二値画像処理装置の解析アル
ゴリズムを要約したフローチャートを図12に示す。 二値画像データを水平操作線ごとに読み込みながら
縦ランと横ランのデータを登録し、同時に矩形解析を行
う。 未処理ランがなくなるまで、との処理を繰り返
す。 で検索された未処理ランと交差する未処理ランを
求め、さらにそのランと交差する未処理ランを求めると
いうように、再帰的に交差する未処理ランを求めなが
ら、隣接行列を作成する。 で作成した隣接行列に対して、最小被覆ランを求
める。
【0033】次にCCITT標準原稿を本発明に係る二
値画像処理装置により処理した時の実例を示す。CCI
TT標準原稿は、大きさが縦2376、横1680の二
値画像データである。その例を図13に示す。この例に
ついてMCR表現を求め、その縦ラン被覆部、横ラン被
覆部をそれぞれ図14,15に示す。この実験結果によ
り文書画像の表を構成する縦ストローク、横ストローク
が、それぞれ縦ラン被覆部、横ラン被覆部のセグメント
として抽出されていることが分かる。文字に対してもス
トロークのはっきりしている部分は、ある程度ストロー
クと縦ラン被覆部、横ラン被覆部のセグメントとの対応
がとれていることが分かる。
【0034】次にMCR表現の応用例として、文書画像
から表を抽出する問題を考えてみる。表を構成している
各ストロークの長さは、文字の大きさに対応して十分に
長い。このことから適当な閾値を定めて、縦ラン被覆
部、横ラン被覆部の各セグメントの形状を分析すること
により表部分の抽出を行うことができる。図13の文書
画像から表を抽出した結果を図16に示す。
【0035】本発明によるMCR表現ではできるだけ少
ないランで二値画像を表現するということで、従来の一
次元横ランのみの表現に比べてランの総数は大幅に減少
し、データ圧縮効果は非常に大きいというメリットを有
する。CCITT標準のランの総数を比較した結果を表
1に示す。この結果より、横ランで表現するのに比べ、
MCR表現の方がより少ないランで二値画像を表現する
ことができることがわかる。
【表1】
【0036】さらに、本発明による画像表現によれば従
来の細線化によるストローク表現でうまくいかなかった
ものが正確に表現できるという効果も生じる。例えば、
従来の細線化によるストローク表現で図5の(A)の細
線化パターンを求めると、図5の(B)に示すようにT
字型の交差部分がY字型になってしまう。しかしながら
本発明のMCR表現の縦ラン被覆部(図17)と横ラン
被覆部(図18)に対しこれらの細線化パターンを別々
に求めると、図19,20のパターンが得られる。そし
て、図19と図20の細線化パターンを結合すると、図
21の細線化パターンが得られ、従来に比べ正確なスト
ローク表現ができることがわかる。
【0037】
【発明の効果】本発明による画像表現の縦ラン被覆部
分、横ラン被覆部分のセグメントは、それぞれ縦ストロ
ーク、横ストロークに良く対応させることができ、階層
的表現に適し、二値画像の構造解析にも有効である。ま
た、情報圧縮効果もあり、細線化処理においても正確な
表現をすることができるという従来にない優れた効果を
有する。すなわち、本発明は、伝達、理解、管理等の目
的に依存しない共通かつ基本的な二値画像の構造化表現
を与えるものであり、これらの処理を統合化して効率よ
く行なうことに大きく貢献する。
【図面の簡単な説明】
【図1】文書画像の階層構造を示す説明図である。
【図2】二値画像のパターンの例を示す説明図である。
【図3】図2のパターンを横ランに分解した説明図であ
る。
【図4】図2のパターンを縦ランに分解した説明図であ
る。
【図5】パターンの細線化処理を示す説明図である。
【図6】図2のパターンを本発明に係る二値画像処理装
置を用いて処理した時に得られる最小点被覆に対応する
横ランと縦ランを示す説明図である。
【図7】ラン検出手段における水平走査線データのため
の2つのラインバッファのデータ格納状態の例を示すメ
モリのビット図である。
【図8】矩形領域を含むパターンの例を示す説明図であ
る。
【図9】矩形解析のための配列のデータ格納状態の例を
示す説明図である。
【図10】ラン情報を記憶するメモリー内のメモリマッ
プである。
【図11】ランを管理するための2つの配列の構造を示
す説明図である。
【図12】本発明に係る二値画像処理装置の解析アルゴ
リズムを要約したフローチャートである。
【図13】CCITT標準原稿の一例である。
【図14】図13の標準原稿から求めたMCR表現の縦
ラン被覆部である。
【図15】図13の標準原稿から求めたMCR表現の横
ラン被覆部である。
【図16】図13の標準原稿から表を抽出した結果であ
る。
【図17】図5の(A)のパターンのMCR表現の縦ラ
ン被覆部である。
【図18】図5の(A)のパターンのMCR表現の横ラ
ン被覆部である。
【図19】図17の縦ラン被覆部の細線化パターンであ
る。
【図20】図18の横ラン被覆部の細線化パターンであ
る。
【図21】図19と図20の細線化パターンを結合した
細線化パターンである。
───────────────────────────────────────────────────── フロントページの続き (58)調査した分野(Int.Cl.7,DB名) H04N 1/411 G06T 9/00

Claims (2)

    (57)【特許請求の範囲】
  1. 【請求項1】 二値画像情報から横ランと縦ランを求
    め、このラン情報を記憶し、i番目の横ランとj番目の
    縦ランが交差するときは1であり交差しないときは0で
    ある行列である隣接行列(fij)を生成し、隣接行列に
    対応する2部グラフの最小点被覆を求め、導出された最
    小点被覆に対応する横ランと縦ランを二値画像情報とし
    て出力することを特徴とする二値画像処理方法。
  2. 【請求項2】 二値画像情報から横ランと縦ランを求め
    このラン情報を記憶するラン検出手段と、i番目の横ラ
    ンとj番目の縦ランが交差するときは1であり交差しな
    いときは0である行列である隣接行列(fij)を生成す
    る隣接行列生成手段と、隣接行列に対応する2部グラフ
    の最小点被覆を求める最小点被覆導出手段と、導出され
    た最小点被覆に対応する横ランと縦ランを二値画像情報
    として出力する出力手段を備えることを特徴とする二値
    画像処理装置。
JP3142237A 1991-06-14 1991-06-14 二値画像処理方法および装置 Expired - Lifetime JP3045810B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP3142237A JP3045810B2 (ja) 1991-06-14 1991-06-14 二値画像処理方法および装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3142237A JP3045810B2 (ja) 1991-06-14 1991-06-14 二値画像処理方法および装置

Publications (2)

Publication Number Publication Date
JPH06133170A JPH06133170A (ja) 1994-05-13
JP3045810B2 true JP3045810B2 (ja) 2000-05-29

Family

ID=15310625

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3142237A Expired - Lifetime JP3045810B2 (ja) 1991-06-14 1991-06-14 二値画像処理方法および装置

Country Status (1)

Country Link
JP (1) JP3045810B2 (ja)

Also Published As

Publication number Publication date
JPH06133170A (ja) 1994-05-13

Similar Documents

Publication Publication Date Title
US5452374A (en) Skew detection and correction of a document image representation
US5335290A (en) Segmentation of text, picture and lines of a document image
JP3372282B2 (ja) 2進入力イメージを縮小する方法
JP3950777B2 (ja) 画像処理方法、画像処理装置および画像処理プログラム
JPH07131641A (ja) 画像処理装置
JP2000200350A (ja) 情報処理方法及び装置
US6360006B1 (en) Color block selection
JPH0256708B2 (ja)
US7570811B2 (en) Segmenting an image via a graph
Bloomberg Multiresolution morphological analysis of document images
JP3718967B2 (ja) 画像特徴量抽出装置および方法並びに画像特徴量抽出プログラムを記録した記録媒体
JP4390523B2 (ja) 最小領域による合成画像の分割
JP3045810B2 (ja) 二値画像処理方法および装置
US6356657B1 (en) Image processing method and apparatus for discriminating an input image area or an attribute of image information in the discriminated area
JP2845107B2 (ja) 画像処理装置
JPH0656618B2 (ja) 画像情報の文字・図形分離方法
JP2945601B2 (ja) 対話型図面入力方法
JP3070801B2 (ja) 図面管理方法
EP1439485B1 (en) Segmenting a composite image via basic rectangles
EP1229497A2 (en) Run length based connected components and contour following for enhancing the performance of circled region extraction algorithm
JP3661774B2 (ja) 文字列認識方法、文字認識装置およびプログラム
Ablameyko et al. Knowledge based technique for map-drawing interpretation
JP3083609B2 (ja) 情報処理装置及びそれを用いた文字認識装置
JP2675043B2 (ja) 図面データの編集方法
JPH022189B2 (ja)