JP2597006B2 - 矩形座標抽出方法 - Google Patents

矩形座標抽出方法

Info

Publication number
JP2597006B2
JP2597006B2 JP1099371A JP9937189A JP2597006B2 JP 2597006 B2 JP2597006 B2 JP 2597006B2 JP 1099371 A JP1099371 A JP 1099371A JP 9937189 A JP9937189 A JP 9937189A JP 2597006 B2 JP2597006 B2 JP 2597006B2
Authority
JP
Japan
Prior art keywords
area
connection relationship
data
rectangular
coordinates
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP1099371A
Other languages
English (en)
Other versions
JPH02277185A (ja
Inventor
秀明 田中
敏昭 森田
義弘 北村
斉志 広瀬
安久 中村
尚史 斎鹿
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP1099371A priority Critical patent/JP2597006B2/ja
Priority to GB9008719A priority patent/GB2230634A/en
Priority to US07/510,895 priority patent/US5054091A/en
Publication of JPH02277185A publication Critical patent/JPH02277185A/ja
Application granted granted Critical
Publication of JP2597006B2 publication Critical patent/JP2597006B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Description

【発明の詳細な説明】 〈産業上の利用分野〉 この発明は、OCR(光学的文字読み取り装置)、FAX等
における画像処理において用いられる矩形座標抽出方法
に関する。
〈従来の技術〉 イメージスキャナより入力された2値画像から、例え
ば、文字部分のように、上下左右を白画素で分離できる
全ての黒画素領域の中から、縦横の長さがそれぞれ一定
のしきい値以内に入る黒画素領域座標(以下、矩形座標
と呼ぶ)のみを抽出する方法としては、従来、SPIDER
(Subroutine Package for Image Data Enhacement and
Recognition:工業技術院開発、画処理サブルーチンパ
ッケージ)のCLAB(黒画素連結成分のラベル付け)アル
ゴリズム等、黒画素の連結成分を走査する手法が一般的
に用いられている。
〈発明が解決しようとする課題〉 しかしながら、上記従来の黒画素の連結成分を走査す
る手法では、全ての黒画素に対して連結成分の有無を判
定する必要上処理時間が遅いという問題がある。また、
OCRでは、文字部分の抽出にラベル付けを用いた手法が
適用されているが、この場合、処理速度の問題を克服す
るため、圧縮した画像データを用いたり、専用ハードを
用いる等の工夫がなされてきた。しかし、圧縮データを
用いてラベル付けを行うと、原画像の情報損失につなが
り、特に近傍黒画素領域で接続が発生してしまい、正確
な矩形抽出が困難な場合がある。また専用ハードを用い
ると、装置価格が高くなるという問題がある。
そこで、この発明の目的は、一般的な図形処理装置を
用いて、しかも少ない処理時間で矩形座標を抽出するこ
とができる矩形座標抽出方法を提供することにある。
〈課題を解決するための手段〉 上記目的を達成するため、この発明の請求項1の矩形
座標抽出方法は、イメージスキャナより入力された白画
素と黒画素とに対応した2値画像データから、上下左右
を白画素で分離できるすべての矩形領域のうち縦横の長
さがそれぞれ所定のしきい値以内に入る矩形領域を求め
て、その矩形領域の座標を抽出する矩形座標抽出方法で
あって、上記2値画像データを画像バッファに格納し、
上記画像バッファに格納した画像データの二次元イメー
ジ上で水平の境界線によって形成される複数の領域を形
成し、上記複数の領域の画像データを順次分割画像バッ
ファにコピーし、上記分割画像バッファにコピーした画
像データについて、上記分割画像バッファのアドレス順
にバイト単位に走査して、上記黒画素を含む1バイトの
画像データを注目データとすると共に、上記注目データ
中のいずれか一つの任意に選択された上記黒画素を注目
画素とし、上記注目データと、二次元イメージ上で上に
対応する画像データとの連結関係を求め、連結関係が存
在する場合に、更にその上のデータとの連結関係を求
め、上記連結関係を求める処理を連結関係がなくなるま
で繰り返し、連結関係がある最後のデータの縦軸方向の
座標を上部座標とする一方、上記注目データと、二次元
イメージ上で下に対応する画像データとの連結関係を求
め、連結関係が存在する場合に、更にその下のデータと
の連結関係を求め、上記連結関係を求める処理を連結関
係がなくなるまで繰り返し、連結関係がある最後のデー
タの縦軸方向の座標を下部座標とし、縦方向が上記上部
座標から上記下部座標までの範囲で横方向が上記注目デ
ータを中心に左右方向に所定バイト数の範囲である領域
において、縦方向に並んだ各画素のビット情報の論理積
または論理和をとり、縦軸をその論理積または論理和の
結果とし、横軸を上記縦方向に並んだ各画素の列の位置
とするヒストグラムを求め、上記ヒストグラムを上記注
目画素の位置から左右に走査し、上記白画素に初めてぶ
つかるまでを連結関係のある領域とし、左方向の連結関
係のある最終位置を左座標、右方向の最終位置を右座標
とし、上記上部座標と下部座標との差および上記右座標
と左座標との差がそれぞれ所定値以下である場合に、上
記座標を矩形座標として抽出すると共に、上記矩形座標
内の上記黒画素を消去するようにしたことを特徴として
いる。
また、請求項2の矩形座標抽出方法は、請求項1に記
載の矩形座標抽出方法において、上記画像バッファに形
成された上記複数の領域の上下に隣接する上領域と下領
域とは互いに重複部分を有するようにし、上記複数の領
域の上記重複部分の縦の長さを上記矩形領域の縦方向の
上記所定のしきい値にして、上記上領域の非重複部分と
上記重複部分と上記下領域の非重複部分との3者にまた
がる矩形領域のないようにし、上記上領域内であって上
記下領域を形成する境界にまたがる矩形領域と上記重複
部分内の矩形領域は、上記上領域の画像データがコピー
された上記分割画像バッファから抽出し、上記重複部分
に上記上領域で抽出された矩形領域内の黒画素が存在し
ないようにした後、上記下領域の画像データを上記分割
画像バッファにコピーし、上記下領域内であって上記上
領域を形成する境界にまたがる矩形領域は、上記下領域
の画像データがコピーされた上記分割画像バッファから
抽出して、矩形領域の抽出を順次繰り返すことを特徴と
している。
〈実施例〉 以下、この発明を図示の実施例により詳細に説明す
る。
本実施例の矩形座標抽出方法は、縦方向に対しては1
バイト(8ビット)単位の連結テーブルを用いて黒画素
連結を走査し、横方向に対しては論理積または論理和を
用いたヒストグラムで黒画素連結を走査して、高速に矩
形座標を抽出するようにしたものであり、第9図に示す
ような構成の図形処理装置により実現される。
基本動作の説明 いま、本実施例における矩形座標抽出の基本動作を説
明するために、簡単のため抽出すべき矩形(黒画素)領
域はバイト境界にまたがっていないものとする。
[連結テーブル] 連結テーブルとは、縦方向に1バイト単位で何バイト
黒画素が連結関係にあるかを走査する際に利用するテー
ブルのことである。
今、注目データ(1バイト)のビット値(1画素値)
が0を黒、1を白とするとき、注目ビットが黒で、その
ビット位置の±1の範囲に黒画素があるようなデータ
(1バイト)との間に連結関係が存在すると定義する。
すなわち、 注目データとデータ1の間には連結関係が存在する。
注目データとデータ2の間には連結関係が存在しな
い。
というものである。上記の例は注目データに1つの黒ビ
ットしか存在しない場合で、複数の黒ビットが存在した
場合、どれか1つでも上記の位置関係が存在したとき連
結関係が存在するとする。
すなわち、 注目データとデータ3の間には連結関係が存在する。
となる。
これら2バイト間の連結関係が存在するとき1、存在
しないとき0として連結テーブルを作成する。
[縦方向連結関係の走査] 縦方向の連結関係の走査は、画像データで黒ビットを
含むデータ(1バイト)に対して、まずそのデータを注
目データとし、2次元イメージ上で下に対応するデータ
との連結関係を、連結テーブルを用いて評価する。もし
連結関係が存在するなら、そのデータを新たに注目デー
タとして、再び下のデータと連結関係を評価する。この
処理を連結関係がなくなるまで繰り返し、最初の注目デ
ータからの連結するバイト数を計数する。
下方向について記述したが、上方向に対しても同様に
処理する。
第1図に示すように、上記処理により求めた最初の注
目データの縦軸方向の座標を上部座標とし、最後の注目
データの座標を下部座標とする。
[横方向連結関係の走査] 一方、横方向の連結関係の走査は、連結テーブルを用
いて縦方向の連結バイト数が求まった後、最初の注目デ
ータから連結関係の保持されていた画像データまでの論
理積(0が黒、1が白のため論理積を用いる、逆なら論
理和)によるヒストグラムを求める。すなわち、上記上
部座標から下部座標までの画像データを縦方向のビット
列毎に論理積をとり、黒ビット(0)が一つでもあると
その縦の列の論理積の結果は0とし、黒ビット(0)が
なく全て白ビット(1)であるとその縦の列の論理積の
結果は1として、その論理積の結果を縦軸、上記ビット
列の位置を横軸とするヒストグラムを求めるのである。
そして、ヒストグラムを最初の注目データで求めた注目
ビット位置から左右に走査し、白(1)に初めてぶつか
るまでを連結関係のある領域とし、左方向の連結関係の
ある最終位置を左座標、右方向の最終位置を右座標とす
る。
すなわち上記第1図のデータを例に取ると、第2図に
示すようになる。この第2図において、“*”は注目ビ
ットの位置を示し、“←→”は注目ビット位置からの走
査方向を示す。また、“☆”は左方向の連結関係終了位
置(左座標)を示し、“★”は右方向の連結関係終了位
置(右座標)を示す。
そして、上記縦方向、横方向の走査で求めた座標値を
矩形座標として抽出する。
詳細な動作の説明 実際の画像データでは、抽出すべき矩形領域がバイト
境界にまたがっている場合が普通で上記基本処理では不
十分である。以下に第3図、第5図のフローチャートを
用いて本実施例の動作を詳細に説明する。
求める矩形の最大縦幅しきい値をn、最大横幅しきい
値をmとする(n,m:は随意に決定できる画素数で、本実
施例ではn=128,m=128)。
1度抽出した矩形座標の再抽出による時間ロスを防ぐ
ため、抽出された矩形内の黒画素を消去する。メモリー
容量が十分であれば、画像バッファと同じ容量の作業バ
ッファを用い、上記消去処理を行うことができるが、メ
モリー容量が少ない場合も可能なように、分割画像バッ
ファを用い、順次画像バッファ上のデータを縦方向に分
割し、分割画像バッファにコピーして、矩形抽出、消去
処理を行う。
分割画像バッファ容量は、画像バッファの横バイト数
をx(バイト)とするとき、 (n+α)×xバイト n:は矩形の最大縦幅しきい値(本実施例では128) α:は随意に決定できる画素数(本実施例では64) の大きさが必要である。
また、分割境界部の矩形も抽出するため、分割は第4
図のようにオーバーラップ部分を作り分割バッファにコ
ピーする。つまり、第4図の上領域内であって下領域を
形成する境界にまたがる矩形領域とオーバーラップ部分
内の矩形領域は、上領域の画像データがコピーされた分
割画像バッファから抽出する。その後、上記上領域で抽
出された矩形領域内の黒画素を消去し、上領域とのオー
バーラップ部分に既に抽出された矩形領域内の黒画素が
ないようにして、下領域の画像データを分割画像バッフ
ァにコピーし、下領域内であって上領域を形成する境界
にまたがる矩形領域は、上記下領域の画像データがコピ
ーされた分割画像バッファから抽出する。そして、上記
下領域を上領域にし、次に分割される領域を下領域にし
て、矩形領域の抽出を順次繰り返す。このとき、上記オ
ーバーラップ部分の縦軸は矩形の最大縦幅値nにして、
上記上領域の非オーバーラップ部分,オーバーラップ部
分および下領域の非オーバーラップ部分の3者にまたが
る矩形領域のないようにしている。このようにして、順
次分割される領域の画像データからの矩形領域の抽出を
繰り返すことによって、上下領域にまたがる矩形領域を
抽出することができる。また、オーバーラップ部分はす
でに矩形抽出、消去処理が終了しているため、実際には
分割画像バッファの対応する部分をコピーし、非オーバ
ーラップ部分のみ画像バッファからコピーする。
[分割画像バッファの管理と注目データの走査] 次に、第3図のフローから分割画像バッファの管理と
注目データの走査部分を詳細に説明する。
まず、ステップN1で分割座標(bstyn:分割開始座
標、benyn:分割終了座標、n:は分割数で画像バッファ
の縦幅と分割画像バッファの縦幅で決定される)をセッ
トする。ステップN1は初期値の設定であるので、 bstyo=0 benyo=n+α である。
次に、ステップN2で分割座標で分割される画像データ
を、画像バッファから分割画像バッファにコピーする。
そして、ステップN3で注目データ(1バイト)アドレ
スを分割画像バッファの先頭アドレスに設定する。
ステップN4で注目データを調べ、黒画素(0)が存在
するか判定する。もし全て白画素(1)ならステップN7
に行く。ステップN4で注目データ内に黒画素が存在した
なら、ステップN5で、2次元イメージ上で上にあたるデ
ータが全て白画素か判定する。
ステップN5で黒画素が存在したならステップN7に行
く。全て白画素なら、ステップN6に進み現注目データを
もとにして矩形座標の抽出を行う(この矩形座標の抽出
の処理は第5図のフローに示す)。矩形座標の抽出後、
ステップN7に進んで、現注目データアドレスが分割バッ
ファの最終アドレスであるかどうかを判定する。そし
て、最終アドレスでないならステップN8に進み、現注目
データアドレスをインクリメントした後ステップN4に戻
る。一方最終アドレスならステップN9に進んで、分割終
了かどうかを判定する。ステップN9で分割終了なら処理
を終了し、分割終了でないなら、ステップN10に進んで
次の分割座標をセットする。
次の分割座標(bsty1、beny1)は次式で求められる。
bsty1=bsty0+α beny1=beny0+α このとき、bsty1からbeny0までの間はオーバーラップ
部分で、既に処理ずみであるので、ステップN11で、対
応する部分のデータを分割画像バッファから分割画像バ
ッファにコピーし、ステップN12で非オーバーラップ部
分のbeny0からbeny1までの部分を画像バッファから分割
画像バッファにコピーし、ステップN3に戻る。
ステップN6の矩形抽出部では分割画像バッファの境界
にまたがる矩形は未処理(詳細は後述)であるので、こ
のときその矩形(黒画素領域)は接続される。
以下順次分割コピーを繰り返し、全画像データ中から
矩形座標を抽出する。
[矩形抽出部] 次に、ステップN6の矩形抽出部分を第5図のフローチ
ャートをもとに詳細に説明する。
第3図フローチャートにおけるステップN1からステッ
プN5までの処理で注目データが決定された後、第5図
(a)のステップM1で注目画素の決定を行う。この注目
画素は基本動作説明の第2図の注目画素と同じで、以後
この画素位置を中心に左右の座標位置を検索する。
次に、ステップM2でヒストグラムバッファを初期化
(全て1に)した後、ステップM3に進み、注目データか
ら下方向に連結バイト数の計数を行う。下方向に限定す
る理由は、第3図のステップN5の処理において、注目デ
ータの上のデータは全て白画素であることが保証されて
いるためである。
上記ステップM3の処理は基本動作説明における[縦方
向連結関係の走査]と全く同じである。ステップM4では
ステップM3で求められたバイト数(β)をもとに、上部
座標(ymin)、下部座標(ymax)の初期値をセットす
る。初期値の値は、注目データの2次元イメージ上の縦
軸上座標値をy1とすると、 ymin=y1 ymax=y1+β である。
そして、ステップM5において、上記で求めた上部、下
部座標をもとに論理積ヒストグラムを作成する。このヒ
ストグラムを作成する縦方向の範囲は上部座標から下部
座標までで、横方向の範囲は注目データを中心に左右h
バイト数の範囲である。このhバイト数は次式で求めら
れる。
h=(m÷8)+1 mは矩形の最大横幅のしきい値 右辺で1をたしているのはmが8で割り切れない場合の
ためで、mが8の倍数なら必要ない。
第6図にヒストグラムを求める範囲の1例を示す。こ
の第6図において、升目の一つは1バイトを表し、
“*”は注目データ(バイト)を表す。そして、mを6
4、hを8(h=m÷8)としたとき太い実線で囲まれ
る範囲61がヒストグラムを求める範囲である。
次に、ステップM6からM7に進み、上記ステップM5で作
成したヒストグラムを、第7図に示すように、注目画素
に対応する位置(*)から左方向に1画素ずつ黒画素連
結数(c1)を調べて行き(〔横方向連結関係の走査〕と
同じ)、連結関係の最終位置(☆)を左座標(xmin)と
する。そして、ステップM8からM9に進み、同様に注目画
素に対応する位置(*)から右方向に黒画素連結数(c
r)を調べて行き、連結関係の最終位置(★)を右座標
(xmax)とする。すなわち、注目画素の2次元イメージ
上の横軸上座標値をx1とすると。
xmin=x1−c1 xmax=x1+cr となる。
左右の座標が求められた後、ステップM10に進み、横
幅(xmax−xmin+1)が最大横幅しきい値mを越えてい
るか判定する。もし越えているなら、処理を終了し、越
えていないなら、ステップM11に進む。ステップM11では
下部座標(ymin)が分割画像バッファの境界であるか判
定し、境界なら処理を終了し、境界でないときはステッ
プM13に進んで、ymax+1上のデータをxminからxmaxの
範囲で走査し、全て白画素であるか判定する。そして、
第8図に示すように、ymax+1上のデータが全て白画素
なら第5図(b)のステップM16に進む。
一方、上記範囲で黒画素が発見された場合、ステップ
M13からM15に進み、その黒画素を含むデータ(バイト)
を注目データとして、下方向に連結数(γ)を計数し、
下部切り出し座標(ymax)を次式により更新し、新たな
上部、下部座標間でヒストグラムを作成した後、ステッ
プM6へ戻る。
ymax=ymax+γ ステップM16からM20までの動作は、上記ステップM11
からM15までの処理と同様の処理を上部に対して行う。
ステップM17で上部(ymin−1上のデータでxminからx
maxまでの範囲)が全て白画素であった場合、ステップM
21に進んで、縦幅(ymax−ymin+1)が矩形の最大縦幅
しきい値nを越えているか判定する。そして、越えてい
るなら処理を終了し、越えていないときには、ステップ
M22からM23に進んで、抽出した座標値を矩形座標バッフ
ァにセットし、矩形座標内の黒画素を消去した後、終了
する。
第10図は本実施例により抽出された矩形を表示したも
のである。
〈発明の効果〉 以上より明らかなように、請求項1の発明の矩形座標
抽出方法によれば、パフォーマンスの低い汎用CPUを用
いても十分実用的な処理速度が得られ、かつ原画像を用
いての矩形抽出であるので、従来例におけるような近傍
黒画素領域で接続が発生するということがなく、近傍矩
形も正確に抽出できる。更に、ロジックがハード化しや
すく、もともとラベル付けを用いた手法よりもはるかに
高速であるため、専用ハードを作成した場合の処理速度
は非常に高速となる。また、本発明は多値画像への拡張
も容易で、FAX、電子ファイリングシステム等への応用
も可能である。
また、請求項2の発明の矩形座標抽出方法によれば、
画像バッファに形成された複数の領域の上下に隣接する
上領域と下領域は互いに重複部分を有し、上領域の非重
複部分と上記重複部分と下領域の非重複部分との3者に
またがる矩形領域がないようにして、矩形領域の抽出を
順次繰り返すので、上領域内であって下領域を形成する
境界にまたがる矩形領域,上記重複部分内の矩形領域お
よび下領域であって上領域を形成する境界にまたがる矩
形領域も全て抽出することができる。
【図面の簡単な説明】
第1図はこの発明の一実施例における縦方向連結関係の
走査を説明する図、第2図は上記実施例における横方向
連結関係の走査を説明する図、第3図は上記実施例にお
ける分割画像バッファの管理と注目データの走査を示す
フローチャート、第4図は上記実施例における画像の分
割を説明する図、第5図は上記実施例における矩形座標
の抽出を示すフローチャート、第6図は上記実施例にお
けるヒストグラム抽出範囲を説明する図、第7図は上記
実施例におけるヒストグラムと左右の座標を示す図、第
8図は上記実施例における分割画像バッファと白画素の
走査範囲を示す図、第9図は上記実施例を実現するため
のハードの構成を示す図、第10図は上記実施例により抽
出された矩形を示す図である。
───────────────────────────────────────────────────── フロントページの続き (72)発明者 広瀬 斉志 大阪府大阪市阿倍野区長池町22番22号 シャープ株式会社内 (72)発明者 中村 安久 大阪府大阪市阿倍野区長池町22番22号 シャープ株式会社内 (72)発明者 斎鹿 尚史 大阪府大阪市阿倍野区長池町22番22号 シャープ株式会社内

Claims (2)

    (57)【特許請求の範囲】
  1. 【請求項1】イメージスキャナより入力された白画素と
    黒画素とに対応した2値画像データから、上下左右を白
    画素で分離できるすべての矩形領域のうち縦横の長さが
    それぞれ所定のしきい値以内に入る矩形領域を求めて、
    その矩形領域の座標を抽出する矩形座標抽出方法であっ
    て、 上記2値画像データを画像バッファに格納し、上記画像
    バッファに格納した画像データの二次元イメージ上で水
    平の境界線によって形成される複数の領域を形成し、上
    記複数の領域の画像データを順次分割画像バッファにコ
    ピーし、 上記分割画像バッファにコピーした画像データについ
    て、上記分割画像バッファのアドレス順にバイト単位に
    走査して、上記黒画素を含む1バイトの画像データを注
    目データとすると共に、上記注目データ中のいずれか一
    つの任意に選択された上記黒画素を注目画素とし、 上記注目データと、二次元イメージ上で上に対応する画
    像データとの連結関係を求め、連結関係が存在する場合
    に、更にその上のデータとの連結関係を求め、上記連結
    関係を求める処理を連結関係がなくなるまで繰り返し、
    連結関係がある最後のデータの縦軸方向の座標を上部座
    標とする一方、 上記注目データと、二次元イメージ上で下に対応する画
    像データとの連結関係を求め、連結関係が存在する場合
    に、更にその下のデータとの連結関係を求め、上記連結
    関係を求める処理を連結関係がなくなるまで繰り返し、
    連結関係がある最後のデータの縦軸方向の座標を下部座
    標とし、 縦方向が上記上部座標から上記下部座標までの範囲で横
    方向が上記注目データを中心に左右方向に所定バイト数
    の範囲である領域において、縦方向に並んだ各画素のビ
    ット情報の論理積または論理和をとり、縦軸をその論理
    積または論理和の結果とし、横軸を上記縦方向に並んだ
    各画素の列の位置とするヒストグラムを求め、 上記ヒストグラムを上記注目画素の位置から左右に走査
    し、上記白画素に初めてぶつかるまでを連結関係のある
    領域とし、左方向の連結関係のある最終位置を左座標、
    右方向の最終位置を右座標とし、 上記上部座標と下部座標との差および上記右座標と左座
    標との差がそれぞれ所定値以下である場合に、上記座標
    を矩形座標として抽出すると共に、上記矩形座標内の上
    記黒画素を消去するようにしたことを特徴とする矩形座
    標抽出方法。
  2. 【請求項2】請求項1に記載の矩形座標抽出方法におい
    て、上記画像バッファに形成された上記複数の領域の上
    下に隣接する上領域と下領域とは互いに重複部分を有す
    るようにし、上記複数の領域の上記重複部分の縦の長さ
    を上記矩形領域の縦方向の上記所定のしきい値にして、
    上記上領域の非重複部分と上記重複部分と上記下領域の
    非重複部分との3者にまたがる矩形領域のないように
    し、上記上領域内であって上記下領域を形成する境界に
    またがる矩形領域と上記重複部分内の矩形領域は、上記
    上領域の画像データがコピーされた上記分割画像バッフ
    ァから抽出し、上記重複部分に上記上領域で抽出された
    矩形領域内の黒画素が存在しないようにした後、上記下
    領域の画像データを上記分割画像バッファにコピーし、
    上記下領域内であって上記上領域を形成する境界にまた
    がる矩形領域は、上記下領域の画像データがコピーされ
    た上記分割画像バッファから抽出して、矩形領域の抽出
    を順次繰り返すことを特徴とする矩形座標抽出方法。
JP1099371A 1989-04-18 1989-04-18 矩形座標抽出方法 Expired - Lifetime JP2597006B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP1099371A JP2597006B2 (ja) 1989-04-18 1989-04-18 矩形座標抽出方法
GB9008719A GB2230634A (en) 1989-04-18 1990-04-18 Optical character recognition
US07/510,895 US5054091A (en) 1989-04-18 1990-04-18 Method for determining coordinates of circumscribed rectangular frame of each character for use in optical character reader

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1099371A JP2597006B2 (ja) 1989-04-18 1989-04-18 矩形座標抽出方法

Publications (2)

Publication Number Publication Date
JPH02277185A JPH02277185A (ja) 1990-11-13
JP2597006B2 true JP2597006B2 (ja) 1997-04-02

Family

ID=14245682

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1099371A Expired - Lifetime JP2597006B2 (ja) 1989-04-18 1989-04-18 矩形座標抽出方法

Country Status (3)

Country Link
US (1) US5054091A (ja)
JP (1) JP2597006B2 (ja)
GB (1) GB2230634A (ja)

Families Citing this family (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0461817A3 (en) * 1990-06-15 1993-11-18 American Telephone & Telegraph Image segmenting apparatus and methods
US5253305A (en) * 1991-06-25 1993-10-12 Industrial Technology Research Institute Character boundary identification method and system
US5267325A (en) * 1991-09-06 1993-11-30 Unisys Corporation Locating characters for character recognition
JP3576570B2 (ja) * 1991-11-19 2004-10-13 ゼロックス コーポレイション 比較方法
CA2077970C (en) * 1991-11-19 1999-02-23 Daniel P. Huttenlocher Optical word recognition by examination of word shape
CA2077969C (en) * 1991-11-19 1997-03-04 Daniel P. Huttenlocher Method of deriving wordshapes for subsequent comparison
US5321770A (en) * 1991-11-19 1994-06-14 Xerox Corporation Method for determining boundaries of words in text
CA2077604C (en) * 1991-11-19 1999-07-06 Todd A. Cass Method and apparatus for determining the frequency of words in a document without document image decoding
JP3253356B2 (ja) * 1992-07-06 2002-02-04 株式会社リコー 文書画像の領域識別方法
JP2576079B2 (ja) * 1992-09-29 1997-01-29 エヌ・ティ・ティ・データ通信株式会社 文字切出し方法
AU1596695A (en) * 1994-01-06 1995-08-01 Sharpened Software Inc. Method and apparatus for interpreting handwritten symbols in a computer system
KR100228618B1 (ko) * 1994-05-31 1999-11-01 아끼구사 나오유끼 연결영역의 추출장치 및 방법
JP3108979B2 (ja) * 1994-07-28 2000-11-13 セイコーエプソン株式会社 画像処理方法および画像処理装置
JPH08235310A (ja) * 1995-02-24 1996-09-13 Nec Corp 接触文字切り出し装置
JP3471578B2 (ja) 1997-08-29 2003-12-02 シャープ株式会社 行方向判定装置、画像傾き検出装置及び画像傾き補正装置
US5995661A (en) * 1997-10-08 1999-11-30 Hewlett-Packard Company Image boundary detection for a scanned image
JP2007228167A (ja) * 2006-02-22 2007-09-06 Funai Electric Co Ltd パネル型映像表示装置および液晶テレビジョン
US20090196504A1 (en) * 2008-02-04 2009-08-06 Craig Sullender Modified propagated last labeling system and method for connected components
TWI391877B (zh) * 2009-12-24 2013-04-01 Univ Nat Taiwan Science Tech 相連元件標記方法及其電腦系統
CN111881913A (zh) * 2019-07-05 2020-11-03 深圳数字生命研究院 图像识别方法及装置、存储介质和处理器

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
NL160408C (nl) * 1973-02-21 1979-10-15 Nederlanden Staat Inrichting voor het lezen van tekens, bij voorkeur van cijfers.
JPS5816217B2 (ja) * 1978-07-12 1983-03-30 工業技術院長 連結領域検出方法
SE422714B (sv) * 1979-01-16 1982-03-22 Ibm Svenska Ab Anordning med styrdator for optisk teckenlosning, vilken styrdator bl a bereknar startpunkter for identifiering av ett tecken
JPS6043555B2 (ja) * 1980-02-26 1985-09-28 株式会社トキメック 印字文字切出し装置
JPS57101986A (en) * 1980-12-17 1982-06-24 Toshiba Corp Character detecting and cutting method
US4610025A (en) * 1984-06-22 1986-09-02 Champollion Incorporated Cryptographic analysis system
JPS61248024A (ja) * 1985-04-25 1986-11-05 Canon Inc カメラの測光装置
JPS6274181A (ja) * 1985-09-27 1987-04-04 Sony Corp 文字認識装置
JPS62129023A (ja) * 1985-11-29 1987-06-11 畑中 正伸 調理台の背面立上り部における受台兼用水切板
JPH083832B2 (ja) * 1986-07-02 1996-01-17 株式会社リコー 文書画像の構造抽出方法
JPS63158678A (ja) * 1986-12-23 1988-07-01 Sharp Corp 単語間スペ−ス検出方法
JP2667435B2 (ja) * 1987-05-01 1997-10-27 株式会社リコー 領域抽出方法
GB2217498B (en) * 1988-04-18 1992-03-18 Ind Tech Res Inst Method and apparatus for automatically recognising licence plate characters
JP2822189B2 (ja) * 1988-05-19 1998-11-11 ソニー株式会社 文字認識装置及び方法

Also Published As

Publication number Publication date
GB2230634A (en) 1990-10-24
JPH02277185A (ja) 1990-11-13
GB9008719D0 (en) 1990-06-13
US5054091A (en) 1991-10-01

Similar Documents

Publication Publication Date Title
JP2597006B2 (ja) 矩形座標抽出方法
JP3878401B2 (ja) 画像処理装置、画像処理方法およびそれを記録した記録媒体
US5452374A (en) Skew detection and correction of a document image representation
US5465304A (en) Segmentation of text, picture and lines of a document image
JP3170299B2 (ja) 画像読取処理装置
US5033104A (en) Method for detecting character strings
JP2000200350A (ja) 情報処理方法及び装置
JP3062382B2 (ja) 画像処理装置及び方法
JPH0130180B2 (ja)
CN110349111B (zh) 一种包含二维码图像的矫正方法和装置
JP2846486B2 (ja) 画像入力装置
JPH0249587B2 (ja)
JPH11187231A (ja) 画像検索装置及び画像検索方法
JPH05159062A (ja) 文書認識装置
JP2587812B2 (ja) 図形抽出方法
JP2838556B2 (ja) 画像処理装置
JP2882056B2 (ja) 特定パターンの識別方法
JP2522511B2 (ja) 画像輪郭追跡ユニット
JP3037504B2 (ja) 画像処理方法及びその装置
JPH0271379A (ja) 画像処理装置
JPS61196382A (ja) 文字切出し方式
JPS63255780A (ja) デイジタル線図形の塗り潰し方法
JPH03233787A (ja) 文字画像抽出装置
JPH01320578A (ja) 論理回路図面自動入力装置
JPH01112469A (ja) 線図形の折線近似方式