JPH04367986A - 矩形抽出方法及び矩形抽出装置 - Google Patents

矩形抽出方法及び矩形抽出装置

Info

Publication number
JPH04367986A
JPH04367986A JP3170550A JP17055091A JPH04367986A JP H04367986 A JPH04367986 A JP H04367986A JP 3170550 A JP3170550 A JP 3170550A JP 17055091 A JP17055091 A JP 17055091A JP H04367986 A JPH04367986 A JP H04367986A
Authority
JP
Japan
Prior art keywords
run
line
rectangle
runs
current line
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP3170550A
Other languages
English (en)
Inventor
Shinsuke Teramura
信介 寺村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP3170550A priority Critical patent/JPH04367986A/ja
Publication of JPH04367986A publication Critical patent/JPH04367986A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Image Analysis (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、画像処理に係り、特に
画像上の接続したラン群を囲む矩形の抽出に関する。
【0002】
【従来の技術】このような矩形抽出は、例えば文字認識
装置における文字切り出しに利用される。従来の矩形抽
出方法は、現在処理中のライン上のランデータと処理済
みの前ライン上のランデータをライン先頭側より1個ず
つ順に取り出し、ランの接続関係を調べる。現在ライン
上の着目しているランが前ライン上のランと接続してい
ない場合、着目ランのランデータを新規の矩形データと
して登録する。着目ラインが前ラインのランと接続して
いる場合、着目ランが既にある矩形に属しているかどう
か調べ、属していなければ前ライン上の接続ランの属し
ている矩形に追加し、属しているならば、その所属矩形
と前ライン上の接続ランの所属矩形とを統合するという
ものであった。
【0003】また従来、この矩形抽出の処理のための装
置は、ラン抽出部及び矩形抽出部をそれぞれ1個、1ラ
イン分のランデータを記憶するためのランデータバッフ
ァを2個備え、現在ラインのランデータがラン抽出部に
より作成されて一方のランデータバッファに格納される
と、この現在ラインのランデータと他方のランデータバ
ッファ内の前ラインのランデータに対して矩形抽出部で
、矩形抽出のためのランの接続判定、矩形の登録、矩形
へのランの追加、矩形の統合の処理を実行するという構
成であった。
【0004】
【発明が解決しようとする課題】しかし、従来の矩形抽
出方法は、現在ライン上のランと前ライン上のランとの
接している場所を探すために、両ラインのランデータを
先頭から順に調べていくので、処理対象の画像によって
は、ラン接続の判定処理の無駄が増加するという問題が
ある。
【0005】すなわち、文字列のみからなる文書の場合
、図8に模式的に示すように、同じ文字列60の部分に
おける隣接ラインL1,L2上の先頭ランは大体同じ位
置にあるため、両ラインのランデータを先頭から調べて
いけば、相互に接しているランデータが比較的短時間に
見つかる。
【0006】他方、表や図を含む文書の場合、隣接ライ
ンの先頭ランの位置が大きく離れることが少なくない。 例えば図9に模式的に示すように、文字列60及び表6
1の部分を通るラインL1と、文字列60の部分を通ら
ない次ラインL2では、先頭ランの位置が大きくずれる
ことは明らかである。
【0007】このような隣接ラインでは、ランデータの
無駄なスキャンが増え、処理時間が増加する。例えば現
在ラインL2の先頭ランが前ラインL1上の先頭ランか
ら99番目のランまで非接続で、100番目のランと接
していいる場合、現在ラインL2の先頭ランに関するラ
ン接続の判定のために99回もの無駄な比較処理を行な
わなければならない。
【0008】また、従来の矩形抽出装置の構成によれば
、1個の矩形抽出部を用いて1ライン単位の処理を行な
う関係上、画像の主走査方向の長さが大きくライン上の
ランの個数が多い場合、処理時間が増加するという問題
があった。
【0009】本発明の一般的な目的は、矩形抽出処理の
高速化を実現することである。本発明のより具体的な目
的は、隣接ラインの先頭ランの位置ずれが大きくなりや
すい表または図を含む文書画像や、1ラインあたりのラ
ンの個数が増加するサイズの大きな画像に対して、矩形
抽出を高速に行なうための方法及び装置を提供すること
にある。
【0010】
【課題を解決するための手段】請求項1ないし請求項5
の発明は、画像より抽出された現在ライン上のランと前
ライン上のランとの接続関係を調べ、現在ライン上の接
続のないランに対しては矩形として登録する処理をし、
現在ライン上の接続のあるランに対しては既登録の矩形
へ追加する処理または、その所属する矩形と、それに接
続した前ライン上のランの所属する矩形とを統合する処
理を行なうという基本的な方法において、処理の高速化
を達成するために、次のような特徴を有するものである
【0011】すなわち、請求項1の発明の特徴は、現在
ライン上の先頭ランと接続する前ライン上のライン先端
に最も近いランを、2分探索によって検索し、前ライン
上の検索したラン及びそれよりライン後端側にあるラン
についてのみ現在ライン上のランとの接続関係を調べる
ことである。
【0012】請求項2の発明の特徴は、現在ライン上の
先頭ランと前ライン上の先頭ランとが接続していない場
合に、現在ライン上の先頭ランと接続する前ライン上の
ライン先端に最も近いランを、2分探索によって検索し
、前ライン上の検索したラン及びそれよりライン後端側
にあるランについてのみ現在ライン上のランとの接続関
係を調べることである。
【0013】請求項3の発明の特徴は、現在ライン上の
先頭ランと前ライン上の先頭ランとが接続しておらず、
かつ、前ライン上の先頭ランの終点が現在ライン上の先
頭ラインよりライン先端側に存在し、かつ、前ライン上
のラン数Mと現在ライン上のラン数Nとの間に、M>N
かつ(M−N)/2>log2 Mの関係が成立する場
合に、現在ライン上の先頭ランと接続する前ライン上の
ライン先端に最も近いランを、2分探索によって検索し
、前ライン上の検索したラン及びそれよりライン後端側
にあるランについてのみ現在ライン上のランとの接続関
係を調べることである。
【0014】請求項4の発明の特徴は、矩形抽出のため
の各処理を、画像の2以上の部分領域毎に、別々の処理
装置によって並列に実行することである。
【0015】請求項5の発明の特徴は、各ライン上のラ
ンを、その始終点座標と画像の2以上の部分領域の境界
座標との比較によって部分領域別に分類し、この際、複
数の部分領域に跨るランを部分領域の境界で分割し、分
割したランを独立のランとして分類し、部分領域別に、
分類されたランに関し矩形抽出のための各処理を別々の
処理装置によって並列に実行することである。
【0016】また、請求項6の発明は、画像データを記
憶するイメージメモリ、画像の2以上の部分領域のそれ
ぞれに対応付けられた複数のランデータバッファ、前記
イメージメモリに記憶された画像データより1ライン毎
にランを抽出するラン抽出部、このラン抽出部より入力
される現在ライン上のランに関するランデータを、請求
項5記載のラン分類によって前記ランデータバッファの
1個または複数個に書き込むラン分類部、前記ランデー
タバッファの対応したものに記憶された現在ライン及び
前ラインのランデータに対し請求項5記載の矩形抽出の
ための各処理を実行する、画像の部分領域のそれぞれ毎
に設けられた2以上の矩形抽出部、及び、この矩形抽出
部により抽出された矩形のデータを記憶するための、矩
形データバッファを具備することを特徴とするものであ
る。
【0017】請求項7の発明は、請求項6の発明の装置
構成において、画像は境界座標X0を堺に第1及び第2
の部分領域に分割され、ラン分類部は、入力されるラン
データの始点座標Xs及び終点座標Xeを保持するため
の第1レジスタ及び第2レジスタ、境界座標X0を保持
するための第3レジスタ、前記第1及び第3レジスタに
保持された座標を比較しXs≦X0のときに第1のイネ
ーブル信号をオンする第1比較器、前記第2及び第3レ
ジスタに保持された座標を比較しXe>X0のときに第
2イネーブル信号をオンする第2比較器、前記第1イネ
ーブル信号のみがオンしたときに前記第2レジスタに保
持された座標を選択し、前記第1及び第2イネーブル信
号が同時にオンしたときに前記第3レジスタに保持され
た座標を選択する第1セレクタ、並びに前記第2イネー
ブル信号のみがオンしたときに前記第1レジスタに保持
された座標を選択し、前記第1及び第2イネーブル信号
が同時にオンしたときに前記第3レジスタに保持された
座標を選択する第2セレクタを具備するハードウエアで
あって、前記第1イネーブル信号がオンしたときに前記
第1レジスタに保持された座標及び前記第1セレクタに
より選択された座標がそれぞれランの始点座標及び終点
座標として前記第1部分領域に対応したランデータバッ
ファに書き込まれ、前記第2イネーブル信号がオンした
ときに前記第2セレクタにより選択された座標及び前記
第2レジスタに保持された座標がそれぞれランの始点座
標及び終点座標として前記第2部分領域に対応したラン
データバッファに書き込まれることを特徴とするもので
ある。
【0018】
【作用】ここで、現在処理中のライン(現在ライン)上
の先頭から数えてi番目のランの始点、終点の座標をX
sc(i)、Xec(i)とし、前ライン上の先頭から
数えてi番目のランの始点、終点のx座標をXsp(i
)、Xep(i)としたとき、0≦n≦N−1のnにつ
いてXep(n)<Xsc(0)が成り立つならば、ラ
ン接続の判定のためのランデータの比較は、前ライン上
のN番目までは無用である。
【0019】請求項1の発明によれば、そのようなNが
2分探索によって高速に検索され、N番目より前のラン
に関し接続関係を調べる無駄が省かれるため、図9によ
って説明したラインL1,L2のような場合に処理が効
率化し、表や図を含む文書画像等における矩形抽出を高
速化できる。
【0020】現在ライン上の先頭ランと前ライン上の先
頭ランが接している場合、前ラインの先頭より逐一、ラ
ンの接続関係を調べる必要があるが、請求項1の発明に
よれば、この場合にも2分探索が行なわれてしまい、こ
の処理の分だけ処理時間が無用に増加する。請求項2の
発明によれば、そのような処理の無駄を排除できる。
【0021】現在ラインと前ラインの先頭ランが接続し
ていないとしても、2分探索を行なわずに、前ラインの
先頭ランより接続を逐一調べたほうが処理時間が短くな
る場合もあり得る。請求項3の発明によれば、先頭ラン
より逐一接続を調べるよりも有利となるような場合に限
って、2分探索によって最初の接続ランを検索し、検索
したラン以降のランのみ接続関係を調べる処理となるた
め、従来より処理時間が増加するような事態を確実に回
避できる。
【0022】請求項4の発明によれば、画像の部分領域
毎に別々の処理装置により並列処理を行なうため、画像
の全体を対象に単一の処理装置により処理する方法に比
べ、矩形抽出を容易に高速化できる。また、1ラインあ
たりのラン数が多くなる大サイズの画像の場合にも、矩
形抽出に必要な時間を十分に短縮できる。
【0023】請求項5の発明によれば、各部分領域に対
応した処理装置は、予め部分領域別に分類されたランに
限定して処理を行なうため、分類しない場合に比べ、効
率的な処理が可能となり、処理のアルゴリズムも簡単に
できる。また、画像を分割せずにランを抽出できるため
、ラン抽出の処理や手段が複雑になることもない。
【0024】請求項6の発明によれば、請求項5の発明
の方法に従った高速の矩形抽出を実施できる。
【0025】請求項7の発明によれば、ラン分類部は、
ランの座標に基づいてランを分類する簡単なハードウエ
ア(デコーダ回路)とされるため、ラン分類を高速に行
なうことができるとともに、ソフトウエアの関与も不要
であるため、ラン分類に関連したソフトウエアのオーバ
ーヘッドも避けられる。
【0026】
【実施例】以下、図面を用い本発明の実施例を説明する
【0027】実施例1   図1は装置構成を示すブロック図である。1はスキ
ャナ等から取り込んだ画像データを記憶するイメージメ
モリ、2はイメージメモリ1より1ライン分の画像デー
タを読み込みランを抽出し、ランの始終点のx座標(X
s,Xe)を表わすランデータを作成するラン抽出部、
3と4は1ライン分のランデータを記憶するためのラン
データバッファ、5はラインバッファ3,4内のランデ
ータを参照して矩形の登録、矩形へのランの追加または
矩形の統合を行ない、矩形データバッファ6上に矩形デ
ータを生成し、あるいは矩形データを更新する矩形抽出
部である。ラン抽出部2により生成される1ラインのラ
ンデータはランデータバッファ3,4に交互に格納され
る。
【0028】全体的動作は、ラン抽出部2によって現在
ラインのランデータを作成して一方のランデータバッフ
ァ3(または4)に格納し、矩形抽出部5によって、ラ
ンデータバッファ3(または4)内の現在ラインのラン
データと、他方のランデータバッファ4(または3)内
の前ラインのランデータとの接続関係を調べ必要な矩形
登録、矩形へのラン追加、矩形の統合の処理を行ない、
矩形データメモリ6上に矩形データを得るというもので
、基本的には従来と同様である。
【0029】しかし、処理の高速化のために、矩形抽出
部5の処理内容は図2に示すように改良されている。以
下、矩形抽出部5の処理内容について説明する。
【0030】現在ライン上の先頭から数えてi番目のラ
ンの始点、終点のx座標をXsc(i)、Xec(i)
とし、前ライン上の先頭から数えてi番目のランの始点
、終点のx座標をXsp(i)、Xep(i)とする。 また前ラインのラン数をM、現在ラインのラン数をNと
する。
【0031】現在ラインのランデータがラン抽出部2に
よってランデータバッファ3(または4)に格納される
と、矩形抽出部5はまず、現在ライン上の先頭ランと前
ライン上の先頭ランのランデータを比較し、両ランが接
しているか判定する(ステップ11)。 Xsp(0)≦Xsc(0)≦Xep(0)Xsp(0
)≦xec(0)≦Xep(0)Xsc(0)≦Xsp
(0)≦Xec(0)Xsc(0)≦Xep(0)≦X
ec(0)のいずれかの条件を満たすときは、接してい
ると判定する。
【0032】先頭ラン相互が接している場合、前ライン
上の全てのランとの接続関係を考慮する必要があるため
、矩形抽出部5は従来と同様に、現在ラインと前ライン
のランデータを単純に先頭から順に比較する方法によっ
てランの接続関係を調べ、接続関係に応じ矩形の登録、
矩形へのランの追加または矩形の統合を行なう(ステッ
プ17)。
【0033】他方、先頭のランが接していない場合、X
ep(0)<Xsc(0)であるか、すなわち現在ライ
ンの先頭ランが前ラインの先頭ランより右側に存在する
かを判定する(ステップ12)。この条件が成立しない
ときには、現在ライン上の前ラインの先頭ラインより左
側のランを矩形として登録する必要があり、また前ライ
ンのランは先頭のものから全て接続関係を調べる必要が
あるため、矩形抽出部5は従来と同様の処理すなわちス
テップ17の処理を実行する。
【0034】ステップ12の条件が成立する場合、M>
N  かつ  (M−N)/2>log2 Mの条件を
判定する(ステップ13)。この条件が不成立の場合は
、ステップ17の処理を実行する。
【0035】ステップ13の条件が成立した場合、2分
探索法によって現在ライン上の先頭ランと最初に接する
前ライン上のランを高速に探索する(ステップ15)。 すなわち、0≦n≦N−1のnについてXep(n)<
Xsc(0)が成り立つならば前ライン上のN番目まで
のランデータについての比較は不要であるので、このよ
うなNを求める。具体的には、前ライン上のラン列の中
心のランの終点が現在ラインの先頭ランの始点に対し左
側にあるか右側にあるかを調べ、左側ならば前ライン上
のラン列の左半分の中心のランの終点と、また右側なら
前ライン上のラン列の中心のランの終点と、現在ライン
の先頭ランの始点との位置関係を調べるという手順を繰
り返す。
【0036】次に、このような2分探索によって求めら
れた前ラインのN番目のランから右側のランだけを対象
として、現在ライン上のランとの接続判定を行なって、
接続関係に応じた矩形登録、矩形へのランの追加、矩形
の統合の処理を実行する(ステップ16)。したがって
、前ラインと現在ラインが図9に示したラインL1とラ
インL2のような関係となった場合に、現在ラインの先
頭ランより左側にある前ライン上の多数のランとの接続
判定のための比較処理が省かれ、処理時間が減る。
【0037】なお、ステップ13の判定条件の中のM>
Nの条件は、ここでは図9に示したラインL1,L2の
ような場合を想定することにより導かれたものである。 また、log2 Mは、前ライン上のランデータを2分
探索で調べる場合の最悪値である。(M−N)/2は前
ラインと現在ラインのランの個数の差をとったもので、
これは単純に先頭からランデータを逐一比較した場合の
手間を示している。2で除したのは、前ライン上のラン
が現在ラインの先頭ランより左ある場合と現在ラインの
最後尾ランより右にある場合を考慮しているからである
。 そして、ステップ13の条件が成立しない場合は、ステ
ップ15,16の処理を選んでも処理時間の短縮効果を
期待できないか、あるいは逆効果となる虞があるため、
ランを先頭より単純に比較する方法によって処理するス
テップ17を実行するわけである。
【0038】実施例2   本実施例の基本的な処理方法は、図3に示すように
、矩形抽出を行なうべき画像を、(0,0)と(X0,
Y)を対角点座標とする部分領域A1と、(X0+1,
0)と(X,Y)を対角点座標とする部分領域A2とに
分割し、各部分領域に対応した処理部によって、矩形抽
出処理を各部分領域毎に並列的に実行するというもので
ある。ここでX0=X/2である。
【0039】図4は装置構成を示すブロック図である。 21はスキャナ等から取り込んだ画像データを記憶する
イメージメモリ、22はイメージメモリ21より1ライ
ン分の画像データを読み込みランを抽出し、ランの始終
点のx座標(Xs,Xe)を表わすランデータを作成す
るラン抽出部である。24a,24bは部分領域A1に
関する現在ラインと前ラインのランデータの記憶のため
に交互に用いられるランデータバッファ、25a,25
bは部分領域A2に関する現在ラインと前ラインのラン
データの記憶のために交互に用いられるランデータバッ
ファである。24はランデータを所属する部分領域に対
応したランデータバッファ24または25に分配し、ま
た領域境界X0を横切るランのランデータを領域境界で
2個のランに分割して各ランデータバッファ24,25
に分配するデコーダである。26は部分領域A1のラン
データに対し実施例1の矩形抽出部5と同様の矩形の登
録、ランの矩形への追加または矩形の統合の処理を実行
する矩形抽出部、27は部分領域A2のランデータに対
する同様の矩形抽出の処理を実行する矩形抽出部である
。なお、各矩形抽出部26,27は、従来と同様に現在
ラインと前ラインのランの接続関係を単純に先頭ランよ
り順に調べて処理するものでもよい。28は矩形抽出部
26,27により生成される矩形データを記憶する矩形
データバッファである。
【0040】図5はデコーダ23のアルゴリズムを示す
フロー図である。デコーダ23においては、ランデータ
として入力する現在ライン上の各ランの始終点座標(X
s,Xe)と、領域境界座標X0とを比較し(ステップ
31,32)、Xe≦X0のときは部分領域A1に属す
るランデータであるので、これをランデータバッファ2
4aまたは24bへ格納する(ステップ33)。Xe>
X0かつXs>X0のときは部分領域A2に所属のラン
データであるので、これをランデータバッファ25aま
たは25bへ格納する(ステップ34)。
【0041】以上の条件が満たされない場合は、領域境
界に跨るランであるので、これを始終点座標が(Xs,
X0)のランと(X0,Xe)のランに分割し(ステッ
プ35)、前者のランデータをランデータバッファ24
aまたは24bに、後者のランデータをランデータバッ
ファ25a,25bに、それぞれ格納する(ステップ3
6)。
【0042】このようなアルゴリズムに従ったデコード
処理を実行するためのデコーダ23の回路構成の一例を
図6に示す。レジスタ41,42にランの始終点座標X
s,Xeがそれぞれセットされ、レジスタ43に境界座
標X0がセットされる。比較器44はXs≦X0のとき
にランデータバッファ24a(または24b)に対する
イネーブル信号46をオンし、比較器45はXe<X0
のときにランデータバッファ25a(または25b)に
対するイネーブル信号47をオンする。イネーブル信号
46,47の一方だけがオンした場合、ゲート48の出
力によってセレクタ49はレジスタ42の出力を、セレ
クタ50はレジスタ41の出力を選択するように制御さ
れる。イネーブル信号46,47の両方がオンしたとき
は、セレクタ49,50はレジスタ43の出力を選択す
るようにゲート48の出力によって制御される。
【0043】かくして、図5のステップ31の比較が成
立する場合、イネーブル信号46だけがオンするため、
レジスタ41,42の出力データ、すなわちランの始終
点座標(Xs,Xe)がランデータバッファ24a(ま
たは24b)に書き込まれる。ステップ32の比較が成
立する場合は、イネーブル信号47のみがオンするため
、レジスタ41,42に保持されたランデータ(Xs,
Xe)がランデータバッファ25a(または25b)に
書き込まれる。ステップ31,32のいずれの比較も成
立しない場合、すなわちXe>X0かつXs≦X0の場
合は、イネーブル信号46,47が両方ともオンするた
め、レジスタ41,43の出力データ(Xs,X0)が
ランデータバッファ24a(または24b)に書き込ま
れ、レジスタ42,43の出力データ(X0,Xe)が
データバッファ25a(または25b)に書き込まれる
【0044】さて、矩形抽出部26,27は並列に動作
して矩形抽出のための矩形の登録、矩形へのランの登録
、矩形の統合の処理を実行するが、領域境界に跨ったラ
ンは分割されているため、その所属矩形を統合する必要
がある。そのため、矩形抽出部26は現在ラインの最後
尾のランの終点座標を記憶し、矩形抽出部27は現在ラ
インの先頭ランの始点座標を記憶しておく。そして、現
在ラインに対する矩形抽出の処理を矩形抽出部26,2
7の両方で終了した時に、記憶していた終点座標と始点
座標が領域境界座標X0と一致するか調べ、一致する場
合には、部分領域A1側の最後尾ランの所属矩形と部分
領域A2側の先頭ランの所属矩形の統合を行なう。
【0045】ここで、図7に模式的に示すように、矩形
データメモリ28には、矩形データは登録順にアドレス
の小さい側より格納され、各矩形データのポインタフィ
ールドには、その矩形データの記憶アドレスが書き込ま
れている。そこで、例えば部分境界で分割されたランの
矩形統合においては、各ランの所属する矩形データのポ
インタの値を比較し、ポインタが一致するときは統合済
みであるので何もしない。ポインタの値が不一致である
ときは、ポインタ値の小さい方(記憶アドレスの小さい
方)の矩形データの対角点座標情報を、他方の矩形デー
タの対角点座標情報によって更新し、また後者の矩形デ
ータのポインタフィールドに前者のポインタの値を書き
込むことにより矩形を統合する。
【0046】例えば、図7のアドレスadr1,adr
2に格納された矩形データが分割ランの所属矩形データ
である場合、アドレスadr1の矩形データをアドレス
adr2の矩形データによって更新し、アドレスadr
2の矩形データのポインタフィールドにadr1を書き
込むことになる。
【0047】なお、本実施例では画像を2分割したが、
3以上の部分領域に分割し、3以上の矩形抽出部により
並列処理するとも可能である。
【0048】
【発明の効果】請求項1ないし請求項5の発明によれば
、隣接ラインの先頭ランの位置ずれが大きくなりやすい
表または図を含む文書画像等の矩形抽出を高速化するこ
とができる。また、請求項2の発明によれば、現在ライ
ン上の先頭ランと前ライン上の先頭ランが接している場
合には、無用な2分探索のための処理の無駄を排除でき
るため、請求項1の発明に比べ、より確実に矩形抽出の
高速化を達成できる。請求項3の発明によれば、先頭ラ
インが接している場合のほか、接している場合であって
も、効果を期待できないか、あるいは逆効果の虞がある
ときには2分探索の処理を行なわないため、請求項1ま
たは請求項2の発明に比べて、矩形処理の高速化をより
確実に達成できる。
【0049】請求項4ないし請求項7の発明によれば、
1ラインあたりのランの個数が増加するサイズの大きな
画像の場合にも、矩形抽出の処理時間を容易に短縮でき
る。また、請求項5または請求項6の発明によれば、予
め部分領域別にランを分類してから矩形抽出の処理を実
行するため、分類しない場合に比べ、効率的な処理が可
能となり、処理のアルゴリズムも簡単にでき、またラン
抽出の処理や手段は従来と同様でよく、格別複雑になる
こともない。請求項7の発明によれば、簡単なハードウ
エア(デコーダ回路)によってランの座標に基づいて、
ラン分類を高速化することができるとともに、ラン分類
に関連したソフトウエアのオーバーヘッドも避けられる
【図面の簡単な説明】
【図1】第1の実施例の装置構成を示すブロック図であ
る。
【図2】図1中の矩形抽出部の処理フロー図である。
【図3】第2の実施例における画像の分割を示す図であ
る。
【図4】第2の実施例の装置構成を示すブロック図であ
る。
【図5】図4中のデコーダの処理アルゴリズムを示すフ
ロー図である。
【図6】図4中のデコーダの回路構成を示すブロック図
である。
【図7】矩形データの構造及び記憶状態の説明図である
【図8】前ライン及び現在ラインが文字列の部分のみを
通る場合の説明図である。
【図9】前ラインが文字列の部分と表の部分を通り、現
在ラインが表の部分だけを通る場合の説明図である。
【符号の説明】
1  イメージメモリ               
   2  ラン抽出部3  ランデータバッファ  
            4  ランデータバッファ 5  矩形抽出部                 
     6  矩形データバッファ 21  イメージメモリ              
  22  ラン抽出部 23  デコーダ(ラン分類部)        24
a  ランデータバッファ 24b  ランデータバッファ          2
5a  ランデータバッファ 25b  ランデータバッファ          2
6  矩形抽出部 27  矩形抽出部                
    28  矩形データメモリ 41  レジスタ                 
     42  レジスタ43  レジスタ    
                  44  比較器
45  比較器                  
      46  イネーブル信号 47  イネーブル信号              
  49  セレクタ50  セレクタ       
               A1  部分領域A2
  部分領域

Claims (7)

    【特許請求の範囲】
  1. 【請求項1】  画像より抽出された現在ライン上のラ
    ンと前ライン上のランとの接続関係を調べ、現在ライン
    上の接続のないランに対しては矩形として登録する処理
    をし、現在ライン上の接続のあるランに対しては既登録
    の矩形へ追加する処理または、その所属する矩形と、そ
    れに接続した前ライン上のランの所属する矩形とを統合
    する処理を行なう矩形抽出方法において、現在ライン上
    の先頭ランと接続する前ライン上のライン先端に最も近
    いランを、2分探索によって検索し、前ライン上の検索
    したラン及びそれよりライン後端側にあるランについて
    のみ現在ライン上のランとの接続関係を調べることを特
    徴とする矩形抽出方法。
  2. 【請求項2】  画像より抽出された現在ライン上のラ
    ンと前ライン上のランとの接続関係を調べ、現在ライン
    上の接続のないランに対しては矩形として登録する処理
    をし、現在ライン上の接続のあるランに対しては既登録
    の矩形へ追加する処理または、その所属する矩形と、そ
    れに接続した前ライン上のランの所属する矩形とを統合
    する処理を行なう矩形抽出方法において、現在ライン上
    の先頭ランと前ライン上の先頭ランとが接続していない
    場合に、現在ライン上の先頭ランと接続する前ライン上
    のライン先端に最も近いランを、2分探索によって検索
    し、前ライン上の検索したラン及びそれよりライン後端
    側にあるランについてのみ現在ライン上のランとの接続
    関係を調べることを特徴とする矩形抽出方法。
  3. 【請求項3】  画像より抽出された現在ライン上のラ
    ンと前ライン上のランとの接続関係を調べ、現在ライン
    上の接続のないランに対しては矩形として登録する処理
    をし、現在ライン上の接続のあるランに対しては既登録
    の矩形へ追加する処理または、その所属する矩形と、そ
    れに接続した前ライン上のランの所属する矩形とを統合
    する処理を行なう矩形抽出方法において、現在ライン上
    の先頭ランと前ライン上の先頭ランとが接続しておらず
    、かつ前ライン上の先頭ランの終点が現在ライン上の先
    頭ラインよりライン先端側に存在し、かつ前ライン上の
    ラン数Mと現在ライン上のラン数Nとの間にM>Nかつ
    (M−N)/2>log2Mの関係が成立する場合に、
    現在ライン上の先頭ランと接続する前ライン上のライン
    先端に最も近いランを、2分探索によって検索し、前ラ
    イン上の検索したラン及びそれよりライン後端側にある
    ランについてのみ現在ライン上のランとの接続関係を調
    べることを特徴とする矩形抽出方法。
  4. 【請求項4】  画像より抽出された現在ライン上のラ
    ンと前ライン上のランとの接続関係を調べ、現在ライン
    上の接続のないランに対しては矩形として登録する処理
    をし、現在ライン上の接続のあるランに対しては既登録
    の矩形へ追加する処理または、その所属する矩形と、そ
    れに接続した前ライン上のランの所属する矩形とを統合
    する処理を行なう矩形抽出方法において、矩形抽出のた
    めの前記各処理を、画像の2以上の部分領域毎に、別々
    の処理装置によって並列に実行することを特徴とする矩
    形抽出方法。
  5. 【請求項5】  画像より抽出された現在ライン上のラ
    ンと前ライン上のランとの接続関係を調べ、現在ライン
    上の接続のないランに対しては矩形として登録する処理
    をし、現在ライン上の接続のあるランに対しては既登録
    の矩形へ追加する処理または、その所属する矩形と、そ
    れに接続した前ライン上のランの所属する矩形とを統合
    する処理を行なう矩形抽出方法において、各ライン上の
    ランを、その始終点座標と画像の2以上の部分領域の境
    界座標との比較によって部分領域別に分類し、この際、
    複数の部分領域に跨るランを部分領域の境界で分割し、
    分割したランを独立のランとして分類し、部分領域別に
    、分類されたランに関し矩形抽出のための前記各処理を
    別々の処理装置によって並列に実行することを特徴とす
    る矩形抽出方法。
  6. 【請求項6】  画像データを記憶するイメージメモリ
    、画像の2以上の部分領域のそれぞれに対応付けられた
    複数のランデータバッファ、前記イメージメモリに記憶
    された画像データより1ライン毎にランを抽出するラン
    抽出部、このラン抽出部より入力される現在ライン上の
    ランに関するランデータを、請求項5記載のラン分類に
    よって前記ランデータバッファの1個または複数個に書
    き込むラン分類部、前記ランデータバッファの対応した
    ものに記憶された現在ライン及び前ラインのランデータ
    に対し請求項5記載の矩形抽出のための各処理を実行す
    る、画像の部分領域のそれぞれ毎に設けられた2以上の
    矩形抽出部、及び、この矩形抽出部により抽出された矩
    形のデータを記憶するための、矩形データバッファを具
    備する矩形抽出装置。
  7. 【請求項7】  請求項6記載の矩形抽出装置において
    、画像は境界座標X0を堺に第1及び第2の部分領域に
    分割され、ラン分類部は、入力されるランデータの始点
    座標Xs及び終点座標Xeを保持するための第1レジス
    タ及び第2レジスタ、境界座標X0を保持するための第
    3レジスタ、前記第1及び第3レジスタに保持された座
    標を比較しXs≦X0のときに第1のイネーブル信号を
    オンする第1比較器、前記第2及び第3レジスタに保持
    された座標を比較しXe>X0のときに第2イネーブル
    信号をオンする第2比較器、前記第1イネーブル信号の
    みがオンしたときに前記第2レジスタに保持された座標
    を選択し、前記第1及び第2イネーブル信号が同時にオ
    ンしたときに前記第3レジスタに保持された座標を選択
    する第1セレクタ、並びに前記第2イネーブル信号のみ
    がオンしたときに前記第1レジスタに保持された座標を
    選択し、前記第1及び第2イネーブル信号が同時にオン
    したときに前記第3レジスタに保持された座標を選択す
    る第2セレクタを具備するハードウエアであって、前記
    第1イネーブル信号がオンしたときに前記第1レジスタ
    に保持された座標及び前記第1セレクタにより選択され
    た座標がそれぞれランの始点座標及び終点座標として前
    記第1部分領域に対応したランデータバッファに書き込
    まれ、前記第2イネーブル信号がオンしたときに前記第
    2セレクタにより選択された座標及び前記第2レジスタ
    に保持された座標がそれぞれランの始点座標及び終点座
    標として前記第2部分領域に対応したランデータバッフ
    ァに書き込まれることを特徴とする矩形抽出装置。
JP3170550A 1991-06-15 1991-06-15 矩形抽出方法及び矩形抽出装置 Pending JPH04367986A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP3170550A JPH04367986A (ja) 1991-06-15 1991-06-15 矩形抽出方法及び矩形抽出装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3170550A JPH04367986A (ja) 1991-06-15 1991-06-15 矩形抽出方法及び矩形抽出装置

Publications (1)

Publication Number Publication Date
JPH04367986A true JPH04367986A (ja) 1992-12-21

Family

ID=15906955

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3170550A Pending JPH04367986A (ja) 1991-06-15 1991-06-15 矩形抽出方法及び矩形抽出装置

Country Status (1)

Country Link
JP (1) JPH04367986A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20160023856A (ko) 2013-09-20 2016-03-03 아플릭스 아이피 홀딩스 가부시키가이샤 송수신 시스템, 송신 장치, 수신 장치, 이들에서의 제어 방법 및 프로그램

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20160023856A (ko) 2013-09-20 2016-03-03 아플릭스 아이피 홀딩스 가부시키가이샤 송수신 시스템, 송신 장치, 수신 장치, 이들에서의 제어 방법 및 프로그램

Similar Documents

Publication Publication Date Title
US6175844B1 (en) Ordering groups of text in an image
US4956869A (en) Method of tracing contour and a system therefor
JP3105967B2 (ja) 文字認識方法及び装置
US4665441A (en) Method and system for line-thinning in electronic image processing
EP0173098A2 (en) Pattern outline tracking method and apparatus
JPH04367986A (ja) 矩形抽出方法及び矩形抽出装置
JP2003030654A (ja) パターン識別装置、パターン識別方法及びパターン識別用プログラム
JP4194309B2 (ja) 文書方向推定方法および文書方向推定プログラム
JPH0619962A (ja) テキスト分割装置
JP3121401B2 (ja) 認識辞書及び文字認識装置
JPS62248080A (ja) 閉図形識別装置
JP2746345B2 (ja) 文字認識の後処理方法
JP4580520B2 (ja) 文字認識方法および文字認識装置
JPH08272906A (ja) 文字認識装置
JPH0850631A (ja) 文字認識装置
JP4209511B2 (ja) 文字認識方法、文字認識装置および文字認識方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体
JPH02171977A (ja) 線分と接触した文字の切出し方法
JPS58125184A (ja) 光学的文字読取装置
JPH10269311A (ja) 帳票処理単位指定方法
JPH05298487A (ja) 英文字認識装置
JP2838556B2 (ja) 画像処理装置
JPH06259602A (ja) 候補文字抽出装置
JP2001126030A (ja) パターン認識方法及びパターン認識装置
JP2004005103A (ja) 類似文書検索装置および類似文書検索方法
JPH05174178A (ja) 文字認識方法