JP3420864B2 - 枠抽出装置及び矩形抽出装置 - Google Patents

枠抽出装置及び矩形抽出装置

Info

Publication number
JP3420864B2
JP3420864B2 JP20325995A JP20325995A JP3420864B2 JP 3420864 B2 JP3420864 B2 JP 3420864B2 JP 20325995 A JP20325995 A JP 20325995A JP 20325995 A JP20325995 A JP 20325995A JP 3420864 B2 JP3420864 B2 JP 3420864B2
Authority
JP
Japan
Prior art keywords
straight line
line
frame
horizontal
horizontal frame
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP20325995A
Other languages
English (en)
Other versions
JPH0950527A (ja
Inventor
敦子 小原
聡 直井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP20325995A priority Critical patent/JP3420864B2/ja
Publication of JPH0950527A publication Critical patent/JPH0950527A/ja
Application granted granted Critical
Publication of JP3420864B2 publication Critical patent/JP3420864B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Description

【発明の詳細な説明】
【発明の属する技術分野】本発明は、枠抽出装置及び矩
形抽出装置に係わり、特に、手書き用文字認識装置、印
刷文字認識装置、図面認識装置等において、文字枠など
のような枠や矩形等を抽出する枠抽出装置及び矩形抽出
装置に関する
【従来の技術】近年、手書き用の入力周辺機器としてO
CRなどの手書き文字認識装置の需要が増加している。
そして、手書き文字認識装置において個々の文字の高い
認識率を実現するためには、認識の前処理である文字の
切り出し処理を正確に行うことが重要になる。これま
で、帳票などの予め文字を書く位置を指定した文書(ド
ロップアウトカラーでなく、黒枠などの罫線と文字とが
同じ色で、且つ、同じ濃度で書かれたもの)では、指定
した範囲内に文字が正確に書かれた場合は、高い確率で
文字を正確に自動認識することができた。しかしなが
ら、文字が指定した範囲を越えて指定範囲を示す枠や罫
線に文字が接触したり、枠や罫線から文字がはみ出した
場合は、著しく文字の認識率が低下する問題が生じてい
た。すなわち、現在使用されている文字認識装置では、
枠を除去する際、文字枠のわずかな傾きや凹凸に対応す
ることができず、文字枠の位置や線幅の変動により本来
の文字部分の所が欠けてしまったり、枠が残存したりす
る。これらの問題点に対応するため、本出願人は、以
前、例えば、特開平6−309498号公報や特開平7
−28937号公報に記載されているように、図42
(a)に示す一文字枠、図42(b)に示す横一行ブロ
ック枠、図42(c)に示すフリーフォーマット枠、図
42(d)(e)に示す横枠線が規則的に配置されてい
る表形式枠について、枠の位置やサイズ等のフォーマッ
ト情報の入力を必要とせずに、枠の抽出や除去を行うこ
とが可能な技術を提案した。以下、これらの技術の概要
について説明する。まず、一文字枠の抽出や除去を行う
方法では、パターンの線幅の検出を行い、そのパターン
の線幅が太い場合、図43(a)に示すように、横方向
及び縦方向にパターンの投影をとる。すなわち、パター
ンを構成する各画素の濃度を横方向及び縦方向に加算
し、加算して得られた投影値が一定閾値以上である部分
を枠とみなす。また、パターンの線幅が細い場合、図4
3(b)に示すように、パターンの端から、nラインレ
ランレングスという8連結で接続するランレングスの手
法により、規定のnラインの間で探索を行い、線の長さ
を算出する。そして、線の長さが一定閾値以上であれ
ば、その部分を枠とみなす。以上の方法で多数の枠線の
候補が出た場合には、一番外側の2本を枠とする。ま
た、横一行ブロック枠の抽出や除去を行う方法では、図
44(a)の原画像に対し、マスク処理による細線化処
理を行う。すなわち、図44(b)に示すように、原画
像におけるパターンの縦横線分を細線化し、文字と枠の
太さの差をなくす。そして、直線抽出処理により、比較
的長い直線の抽出を行う。この直線抽出処理は、隣接投
影法により行われ、ある画素の投影値にその周囲の画素
の投影値を足しあわせた結果を最終的な投影値とし、そ
の投影値が一定閾値以上である部分を直線とみなすもの
である。次に、横枠決定処理を行う。この横枠決定処理
では、上記直線抽出処理で抽出された直線を横方向(水
平方向)に探索し、途中で途切れていないかどうかを検
査する。そして、図44(c)に示すように、途切れの
ない直線を統合して長い直線を抽出する。そして、横枠
線として統合された複数の横線の中から一番長いもの
を、横枠線として選択する。次に、縦枠決定処理を行
う。この縦枠決定処理では、図44(e)に示すよう
に、線間隔が等間隔になるような縦線を枠線として選択
する。これは、図44(c)に示すように、文字が横枠
線にかかっている場合、縦線の長さだけでは枠線か文字
線分かを判断できないためである。縦線の間隔の決定
は、線間隔のヒストグラムを求め、最も頻度の高い線間
隔を枠の間隔とすることにより行う。例えば、図44
(d)において、間隔xで並んでいる縦線を縦枠とみな
し、間隔y、zの縦線を縦枠から除外する。尚、全ての
線間隔が異なっていた場合にはフリーフォーマット枠と
みなし、左右両端の縦線のみを縦枠とする。次に、枠除
去処理を行う。この枠除去処理では、図44(f)に示
すように、上述のようにして決定された縦と横の枠線の
交点を検出して,上記横枠と左右両端の縦枠で決定され
る矩形枠を一文字枠の範囲に分割する。そして、それぞ
れの分割された一文字枠の範囲内で、公知の一文字枠の
除去処理と同様な処理により枠を除去する。また、上述
した縦枠決定処理において、縦直線が左端と右端のみに
存在した場合、又は、縦直線どうしの線間隔が全て異な
っていた場合には、上記横枠と縦枠で決定される矩形を
フリーフォーマット枠と判定する。次に、図45に示す
ように、このフリーフォーマット枠をある一定長さで分
割する。そして、上述した一文字枠の抽出や除去の処理
のときと同様に、その分割した範囲内で横方向及び縦方
向にパターンの投影をとることにより、枠部分の決定を
行う。また、それぞれの分割部分がフリーフォーマット
枠の中のどこに位置するかにより、消去する枠の本数と
位置とを変化させる。例えば、その分割部分が左端な
ら、左、上、下の枠を消去し、その分割部分が右端の場
合は右、上、下の枠を消去し、その分割部分が真ん中の
場合は上、下の枠のみ消去を行う。また、表形式ブロッ
ク枠の抽出や除去を行う方法では、まず、横線抽出処理
を行う。この横線抽出処理では、上述した横一行ブロッ
ク枠の抽出や除去を行う方法で示したように、途切れの
ない直線を統合して得られた横線を連結パターンの外接
矩形サイズと比較し、その横線がある一定以上の長さで
あった場合、その横線を横枠とする。ここで、横枠が2
本得られた場合には、対象とするパターンは横1行のブ
ロック枠又はフリーフォーマット枠であり、横枠が3本
以上得られた場合には、対象とするパターンは表形式ブ
ロック枠と判定する。表形式ブロック枠の場合、横枠の
中で隣り合う2本を選択し、それらの2本の横枠を上下
の横枠とする1行のブロック枠が縦に重なっているもの
と考える。この結果、表形式ブロック枠を横1行ブロッ
ク枠と同様に扱うことが可能となる。例えば、図46
(a)(c)(e)に示す4本の横枠を有する表形式ブ
ロック枠は、図46(b)(d)(f)に示す一行目〜
三行目の横一行ブロック枠に分割される。次に、縦枠検
出処理を行う。この縦枠検出処理は、隣り合う2本の横
枠にはさまれた領域にある縦直線の中から、縦枠の検出
を行うもので、検出された縦直線を探索することによっ
て、上下の横枠に達しているか、また途中で途切れてい
ないかを調べる。そして、探索の結果、上下が共に横枠
に達して、かつ途中で途切れていない縦直線を縦枠の候
補とする。次に、この縦枠検出処理で得られた縦枠の候
補の中から縦枠を決定する縦枠決定処理を行う。この縦
枠決定処理は、縦線の並び方により以下のように処理が
異なる。まず、図46(a)に示すように、縦線が規則
的に並んでいる表である場合、縦枠の候補に残った縦直
線どうしの間隔を算出する。そして、該線間隔とその出
現頻度をヒストグラムに示し、著しく他と異なる間隔を
有する縦直線を枠の候補から除外する。そして、枠候補
から除外されなかった縦直線を縦枠と決定する。一方、
図46(c)に示すように、縦線の不規則に並んでいる
表である場合、縦枠の候補に残った縦線どうしの距離が
文字サイズと比較して極端に小さい場合、該縦線を枠の
候補から除外する。そして、枠の候補から除外されなか
った縦線を全て縦枠であると判定する。また、図46
(e)に示すように縦枠が左端と右端の2本しかないパ
ターンの場合、又は、全ての縦枠の線間隔が異なってい
るパターンの場合、これらのパターンをフリーフォーマ
ット枠と判定し、左端と右端の2本の縦直線を縦枠と決
定する。
【発明が解決しようとする課題】従来の文字認識装置に
おいて処理可能な帳票は、図42に示すような一文字
枠、ブロック枠(横一行枠またはフリーフォマット
枠)、または枠の外形が矩形状となっており横枠線が規
則的に配置されている構造を持つ表を有するものであっ
た。また、帳票の枠抽出処理で対象としていた罫線は実
線のみであり、点線を含んだ帳票に関しては処理の対象
外であった。しかし、処理可能な帳票、上記のような一
文字枠、ブロック枠、枠の外形が矩形状となっており横
枠線が規則的に配置されている構造を持つ表を有する帳
票のみでは、文字認識に利用可能な帳票の種類が限定さ
れてしまい、様々な形状の枠や表を有する一般帳票の対
応には不十分である。すなわち、例えば、図47に示す
ように、外形が矩形となっていない表を有する帳票、ま
た表の一部分にさらに細かい表構造(図47の網かけ部
分)を有する帳票のなどに対しては、従来の文字認識装
置では対応することができなかった。さらに、点線と実
線とが混在している帳票などに対しても、対応すること
ができなかった。本発明の目的は、枠の外形が矩形状と
なっていない表の枠を正確に抽出できるようにすること
である。また、点線と実線とが混在している表の枠を正
確に抽出できるようにすることである。 また、さら
に、入れ子構造を有する表の枠を正確に抽出できるよう
にすることである。 また、上記枠抽出情報を基に文字
領域を正確に抽出することができるようにすることであ
る。
【課題を解決するための手段】上述した課題を解決する
ために、請求項1の発明によれば、入力画像から、画素
の連結情報に基づいて部分パターンを抽出するパターン
抽出手段と、該パターン抽出手段により抽出された部分
パターンの中から実線または点線の直線を抽出する直線
抽出手段と、前記直線抽出手段によって抽出された横方
向の直線の中から、ある一定の長さ以上の直線を抽出し
て、該直線を横枠線の候補とする横枠線候補抽出手段
と、前記横枠線候補抽出手段によって抽出された横枠線
の候補の直線を、上部から順番に2本づつ取り出し、こ
れら2本の直線の長さを比較することにより、横枠線の
組となる2本の直線を決定する横枠決定手段と、該横枠
決定手段によって横枠線の組となることが決定された2
本の横線に、上下が共に達している縦方向の直線を縦枠
線に決定する縦枠決定手段とを備える。このことによ
り、外形が矩形状でない表から、枠を構成する4本の直
線を抽出することができる。また、請求項2の発明によ
れば、前記横枠決定手段は、前記横枠線候補として 抽出
した2本の直線がほぼ同じ長さである場合、これら2本
の直線を横枠線の組として登録する。このことにより、
外形が矩形状でない表から、ほぼ同じ長さを有する連続
する 2本の横方向の直線を表の枠を構成する横方向の直
線の組として抽出することができる。また、請求項3の
発明によれば、前記横枠決定手段は、前記横枠線の候補
として抽出した2本の直線のうち、下側の直線の方が長
い場合、これら2本の直線を横枠線の組として登録す
る。このことにより、外形が矩形状でない表から、下側
の直線の方が長い連続する2本の横方向直線を表の枠を
構成する横方向の直線の組として抽出できる。また、請
求項4の発明によれば、前記横枠決定手段は、前記横枠
線の候補として抽出した2本の横方向の上側の第1の直
線及び下側の第2の直線において、前記第1の直線より
前記第2の直線の方が短く、且つ、前記第2の直線の下
方に前記第1の直線又と同じ長さ又は前記第1の直線よ
り長い横方向の第3の直線が存在しない場合、前記第1
の直線及び前記第2の直線を、横枠線の組として登録す
る。このことにより、外形が矩形状でない表において下
側の直線の方が短い連続する2本の横方向の直線が有り
該下側の直線の下方に上側の直線と同じ長さ又はそれよ
りも長い直線が存在しない場合、前記上側の直線と前記
下側の直線を前記表の枠を構成する横枠の組として抽出
できる。また、請求項5の発明によれば、記横枠決定手
段は、前記横枠線の候補として抽出した2本の横方向の
上側の第1の直線及び下側の第2の直線において、前記
第1の直線より前記第2の直線の方が短く、且つ、前記
第2の直線の下方に前記第1の直線と同じ長さ又は前記
第1の直線より長い横方向の第3の直線が存在する場
合、前記第1の直線及び前記第3の直線を、横枠線の組
として登録する。このことにより、外形が矩形状でない
表において中間の直線が一番短い3本の横方向の直線が
存在する場合、それら 3本の中の上側の直線と下側の直
線を前記表の枠を構成する横方向の直線の組として正確
に抽出できるようになる。また、請求項6の発明によれ
ば、前記横枠決定手段は、前記横枠線の候補として抽出
した2本の横方向の上側の第1の直線及び下側の第2の
直線において、前記第1の直線に対して前記第2の直線
が右方向又は左方向に短く、且つ、前記第 2の直線の下
方に前記第1の直線と同じ長さ又は前記第1の直線より
長い横方向の第3の直線が存在しない場合、前記第1の
直線及び前記第2の直線を、横枠線の組として登録す
る。このことにより、外形が矩形状でない表から、右端
又は左端が横方向に一致しない2本横方向の直線の組を
前記表の枠を構成する横方向の直線の組として抽出でき
る。また、請求項7の発明によれば、前記横枠決定手段
は、前記横枠線の候補として抽出した2本の横方向の上
側の第1の直線及び下側の第2の直線において、前記第
1の直線に対して前記第2の直線が右方向又は左方向に
短く、且つ、前記第2の直線の下方に前記第1の直線と
同じ長さ又は前記第1の直線より長い横方向の第3の直
線が存在する場合、前記第1の直線及び前記第3の直線
を、横枠線の組として登録する。このことにより、外形
が矩形状でない表において連続する横方向の直線の右端
または左端が一致しない場合であって、上側の第1の直
線と長さが同じか又はより長い第3の直線が存在する場
合でも、前記第1の直線と前記第3の直線を前記表の枠
を構成する横方向の直線の組として抽出することができ
る。また、請求項8の発明によれば、前記横枠決定手段
は、前記横枠の候補として抽出した2本の横方向の上側
の第1の直線及び下側の第2の直線において縦方向の重
なりがない場合、前記第2の直線に代えて前記第2の直
線の下方に存在する横方向の第3の直線を、横枠線の候
補とする。このことにより、外形が矩形状でない表か
ら、前記第1の直線とは隣接していない前記第3の直線
を、前記第1の直線の組となる横枠線の候補として抽出
することができる。また、請求項9の発明によれば、
記横枠決定手段は、前記2本の横枠線の内、下側の横枠
線が右方向へ長いか又は左方向へ長い場合、前記2本の
横枠線の両方を横枠線の候補として再度枠判断処理のた
めに選択可能とする。このことにより、外形が矩形状で
ない表において、前記2本の直線と組となる横枠線をも
れなく抽出することができる。また、請求項10の発明
によれば、前記横枠決定手段は、前記2本の横枠線の長
さが異なる場合、長い方の横枠線を横枠線の候補として
再度枠判断処理のために選択可能とする。このことによ
り、外形が矩形状でない表から、前記長い方の 横枠線と
組となる横方向の直線をもれなく抽出することができ
る。また、請求項11の発明によれば、前記請求項5,
7,8,9または10記載の枠抽出装置において、前記
記横枠決定手段は、一番下の横枠を決定した後、上部に
未処理の横枠の候補が存在している場合、再び部分パタ
ーンの上部から未処理の横枠を2本づつ組として枠の候
補として抽出する。このことにより、外形が矩形状でな
い表から、枠を構成する2本の横枠の組をもれなく抽出
することが可能となる。また、請求項12の発明によれ
ば、前記直線抽出手段は、予め設定されているサイズの
部分パターンが、所定の方向にある一定の間隔で一定数
以上連続して配置されている画像を検出し、この画像を
含む範囲を点線として抽出する。このことにより、外形
が矩形状でない表から点線を抽出することができる。
た、請求項13の発明によれば、請求項12記載の枠抽
出装置において、前記直線抽出手段は、隣接する前記部
分パターン内の点と点の1間隔分だけ前記画像の端点を
伸ばした結果得られる画像を含む範囲を点線として抽出
する。このことにより、外形が矩形状でない表から枠と
なる点線を枠の候補として正確に抽出することができ
る。また、請求項14の発明によれば、前記横枠線候補
抽出手段は、前記枠の候補枠を構成する直線を正確に抽
出すの直線の長さを比較する際に用いる閾値を、前記直
線の種類により変化させる。このことにより、実線と点
線が混在している外形が矩形状でない表から、枠となる
直線をもれなく抽出できる。また、請求項15の発明に
よれば、入力画像から、画素の連結情報に基づいて部分
パターンを抽出するパターン抽出手段と、該パターン抽
出手段により抽出された部分パターンの中から実線また
は点線の直線を抽出する直線抽出手段と、前記直線抽出
手段によって抽出された横方向の直線の中から、ある一
定の長さ以上の直線を抽出して、該直線を横枠線の候補
とする横枠線候補抽出手段と、前記横枠線候補抽出手段
によって抽出された横枠線の候補の直線を、上部から順
番に2本づつ取り出し、これらの2本の直線の長さを比
較することにより組となる2本の横枠線を決定する横枠
決定手段と、前記直線抽出手段によって抽出された直線
のうち、上端及び下端が該組となる2本の横枠線に達し
ている縦方向の直線を縦 枠線に決定する縦枠決定手段
と、前記横枠決定手段によって横枠線の組となることが
決定された2本の直線と前記縦枠抽出手段によって決定
された2本の縦枠線とで囲まれた矩形範囲を抽出する矩
形表現手段とを備える。このことにより、外形が矩形上
でない表から枠を抽出することが可能となる。
〔処理1〕
まず、横枠決定部17によって横枠決定処理を行う。こ
れは、上述した横線の組を決定する方法に従って、横直
線抽出部3で検出された全ての横線について、矩形枠を
構成する2本の横線の組を決定していく処理である。こ
のとき、組となった横線を横枠とし、一番上の行から順
番に1行づつ処理していく。これにより、図33に示す
ように、まず、横直線1)と横直線2)とを2本組の横線
(組の横線)と判断し、該横直線1)と横直線2)を横枠と
する。 〔処理2〕 次に、縦枠決定部18によって縦枠決定処理を行う。こ
れは、縦直線抽出部10で検出された縦線のうち、上記
横枠決定処理によって組と判断された2本の横線に上下
とも達しているものを縦枠とする処理である。これによ
り、例えば、図34に示すように、縦直線Iと縦直線I
Vが組となっている横線に上下とも達しているので、縦
直線Iと縦直線VIとを縦枠とする。 〔処理3〕 次に、矩形表現部22によって矩形表現処理を行う。こ
れは、横枠決定部17により決定された組となっている
横枠2本と縦枠決定部18により決定された縦枠2本と
で囲まれた矩形範囲を、矩形枠として抽出するものであ
る。例えば、図35に示すように、横直線1)と縦直線I
Vと横直線2)と縦直線Iとで囲まれた範囲及び横直線1)
と縦直線VIと横直線2)と縦直線IVとで囲まれた範囲
を矩形範囲とする。 〔処理4〕 次に、入れ子構造処理部19によって入れ子処理を行
う。これは、上記矩形表現部22によって抽出された矩
形範囲内に横線が存在する場合、該矩形範囲を新たに表
とみなし、この表に対して、横枠決定処理、縦枠決定処
理及び矩形表現処理を行うものである。例えば、図36
に示すように、横直線2)と縦直線IIIと横直線4)と縦
直線Iとで囲まれた矩形範囲は入れ子状態となってお
り、その中に3個の矩形を含んでいる。このため、この
入れ子状態の矩形範囲を、横直線2)と縦直線IIIと横
直線3)と縦直線Iとで囲まれた矩形範囲、横直線3)と縦
直線IIと横直線4)と縦直線Iとで囲まれた矩形範囲及
び横直線3)と縦直線IIIと横直線4)と縦直線IIとで
囲まれた矩形範囲の3領域に分割する。以後、上述した
〔処理1〕〜〔処理4〕を、残りの横線と縦線につい
て、次の行から繰り返す。これにより、図33に示す帳
票110は、それが有する全ての矩形領域に分割され
る。ところで、図37(a)に示すように矩形で表現さ
れる点線領域を、図37(b)に示すように、さらに細
かく分割して小矩形で表現するようにしてもよい。この
とき、小矩形の長さは、例えば、上述した隣接投影法で
抽出する線分の長さと等しくなるように設定する。ま
た、既に、決定された縦枠と横枠により矩形領域を表現
した後、上述した隣接投影法により抽出される線分の位
置情報を用いて、該矩形領域内の枠領域の位置を詳細に
表現するようにしてもよい。例えば、図38(a)にお
いて破線121で示す矩形領域の位置情報と、図38
(b)おいて実線122で示す上記隣接投影法により得
られる矩形領域に統合する前の直線の位置情報とを用い
て、図38(c)において破線123で示すように上記
矩形領域内の枠領域の位置を詳細に表現するようにして
もよい。以上、説明したように、本実施例によれば、帳
票を枠で囲まれた領域に分割することができるので、様
々な形式の帳票を処理することが可能となる。ただし、
本実施例で対象となる枠領域は、矩形状のものであり、
図39に示すように矩形範囲で表現できない形状のもの
は対象外である。図40と図41に、本実施例の実験例
を示す。図40は、この実験でサンプルとして用いた帳
票140の原画像を示す図である。また、図41は、上
記帳票140を下記に示す入力パターン条件の基で処理
した結果を示す図である。 このように、本実施例によれば、不規則な構造を持ち、
実線と点線が混在している帳票であっても、該帳票から
矩形枠を正確に抽出することが可能であることが確かめ
られた。以上説明したように、本発明の一実施例による
パターン抽出装置によれば、様々な構造の表形式枠から
直線及び点線を抽出し、この抽出された直線及び点線が
枠であるかを判断し、その判断の結果得られた枠情報を
基に、文字が書かれる文字記入枠を正確に抽出すること
が可能となる。また、横直線抽出部3及び縦直線抽出部
10において、横隣接投影部4及び縦横隣接投影部11
を設け、ある行又は列の投影値に周囲の行又は列の投影
値を足し合わせた値をその行又は列の投影値とする隣接
投影法により線分を抽出するようにしたので、斜めに傾
いた直線を正確に検出することができる。また、横直線
抽出部3及び縦直線抽出部10において、横直線探索部
8及び縦直線探索部15を設け、矩形近似された直線の
最も細い部分から外側へ探索を行って直線の両端の位置
を検出することにより、直線の両端の位置を正確に検出
することが可能となる。また、横点線検出部9及び縦点
線検出部16において、全画像の一部の領域の連結情報
に基づき、部分パターンのサイズと部分パターン間の距
離より点線を抽出することにより、点線を抽出する処理
時間を短縮することが可能となる。また、点線が存在す
る部分を矩形で表現することにより、点線を矩形で近似
された実線と同様に扱うことが可能となる。また、矩形
で表現された点線部分を、図37に示すように、さらに
細かい矩形で表現することにより、点線が傾いていて
も、正確に該点線の存在する位置を表現することが可能
となる。また、矩形近似された点線を直線と同様な情報
を用いて表現することにより、点線と実線を同様に扱う
ことが可能となる。また、横枠決定部17及び矩形内の
横枠決定部20において、抽出された横方向の直線又は
点線のうち、ある一定の長さより長いものを全て横枠の
候補とすることで、枠の大きさと比較すると非常に短い
横線であっても、候補として抽出することが可能とな
る。また、横枠決定部17及び矩形内の横枠決定部20
において抽出された直線又は点線を、上から順番に2本
づつ組としながら、1行づつ横枠を決定する処理を続け
ていくことにより、外形が矩形でない枠についても枠の
抽出処理に対応することが可能となる。また、入れ子構
造処理部19により、入れ子状態の矩形をさらに小さな
矩形に分割するので、複雑な構造をもつ表であっても、
枠の抽出や文字領域の抽出が可能となる。また、横隣接
投影部4及び縦横隣接投影部11において、対象画像の
解像度に基づいて隣接投影の範囲を変化させることによ
り、直線をより正確に抽出することが可能となる。ま
た、横枠決定部17及び縦枠決定部18において、抽出
された直線または点線が枠であるかを判断する場合、枠
の候補の長さを比較する際に用いる閾値を線の種類によ
り変化させることにより、実線と点線が混在している場
合であっても正確に枠を決定することが可能となる。ま
た、横点線検出部9及び縦点線検出部16において、点
線を矩形で表現する際に、該点線の外接矩形の両端を、
点線を構成する点の1間隔分の長さだけ伸ばすことによ
り、点線の位置を、より正確に記述することが可能とな
る。また、矩形表現部22において、縦枠と横枠により
文字領域を表現する方法に加えて、隣接投影法によって
抽出された線分でより細かく文字領域の位置を表現する
ことで、文字パターンの変形を防ぐことが可能となる。
【発明の効果】以上説明したように、本発明の枠抽出装
置によれば、外形が矩形状でない表において、枠を構成
する実線又は点線の直線の長さを比較して組となる横枠
を抽出し、それらの横枠に上端と下端が接する縦枠を抽
出することにより、前記表中の矩形領域の枠を正確に抽
出することができる。 また、本発明の矩形抽出装置によ
れば、前記枠抽出装置と同様にして外形が矩形状でない
表から該表中の矩形領域の枠を抽出した後、該枠で囲ま
れる矩形範囲を決定することにより、前記表中から枠で
囲まれた矩形範囲をもれなく抽出することができる。
【図面の簡単な説明】
【図1】本発明の一実施例によるパターン抽出装置の概
略構成を示すブロック図である。
【図2】本発明の一実施例によるパターン抽出装置の連
結パターン抽出処理を示す図である。
【図3】本発明の一実施例によるパターン抽出装置のマ
スク処理により横線分を抽出する処理を示す図である。
【図4】本発明の一実施例によるパターン抽出装置のマ
スク処理の動作を示すフローチャートである。
【図5】本発明の一実施例によるパターン抽出装置のマ
スク処理を示す図である。
【図6】本発明の一実施例によるパターン抽出装置の直
線抽出処理における隣接投影法を説明する図である。
【図7】本発明の一実施例によるパターン抽出装置の直
線抽出処理における隣接投影法の動作を示すフローチャ
ートである。
【図8】本発明の一実施例によるパターン抽出装置の線
分抽出処理を示す図である。
【図9】本発明の一実施例によるパターン抽出装置の線
分検出処理の動作を示すフローチャートである。
【図10】本発明の一実施例によるパターン抽出装置の
線分統合処理を説明する図である。
【図11】本発明の一実施例によるパターン抽出装置の
線分統合処理の動作を示すフローチャートである。
【図12】本発明の一実施例によるパターン抽出装置の
直線抽出処理を示す図である。
【図13】本発明の一実施例によるパターン抽出装置の
直線探索処理を示す図である。
【図14】本発明の一実施例によるパターン抽出装置の
横直線探索処理の動作を示すフローチャートである。
【図15】本発明の一実施例によるパターン抽出装置の
横直線探索処理における検索方向を示す図である。
【図16】本発明の一実施例によるパターン抽出装置の
点線抽出処理を示す図である。
【図17】本発明の一実施例によるパターン抽出装置の
点線抽出処理を示す図である。
【図18】本発明の一実施例によるパターン抽出装置の
点線抽出処理を示す図である。
【図19】本発明の一実施例によるパターン抽出装置の
点線抽出処理を示す図である。
【図20】本発明の一実施例によるパターン抽出装置の
点線抽出処理を示す図である。
【図21】本発明の一実施例によるパターン抽出装置の
点線抽出処理の動作を示すフローチャートである。
【図22】本発明の一実施例によるパターン抽出装置の
直線及び点線抽出処理で抽出された直線及び点線を示す
図である。
【図23】本発明の一実施例によるパターン抽出装置の
矩形表現処理を示す図である。
【図24】本発明の一実施例によるパターン抽出装置の
横直線の組の決定処理の動作を示すフローチャートであ
る。
【図25】本発明の一実施例によるパターン抽出装置の
横直線の組の決定処理の動作を示すフローチャートであ
る。
【図26】本発明の一実施例によるパターン抽出装置の
横直線の組の決定処理における横直線の配置状態を示す
図である。
【図27】本発明の一実施例によるパターン抽出装置の
横線の組の決定方法を示す図である。
【図28】本発明の一実施例によるパターン抽出装置の
横線の組の決定方法を示す図である。
【図29】本発明の一実施例によるパターン抽出装置の
横線の組の決定方法を示す図である。
【図30】本発明の一実施例によるパターン抽出装置の
横線の組の決定方法を示す図である。
【図31】本発明の一実施例によるパターン抽出装置の
入れ子構造の枠の決定方法を示す図である。
【図32】本発明の一実施例によるパターン抽出装置の
縦枠決定処理及び入れ子処理の動作を示すフローチャー
トである。
【図33】本発明の一実施例によるパターン抽出装置の
横枠決定処理を示す図である。
【図34】本発明の一実施例によるパターン抽出装置の
縦枠決定処理を示す図である。
【図35】本発明の一実施例によるパターン抽出装置の
矩形範囲抽出処理を示す図である。
【図36】本発明の一実施例によるパターン抽出装置の
入れ子構造の処理を示す図である。
【図37】本発明の一実施例によるパターン抽出装置の
点線抽出処理を示す図である。
【図38】本発明の一実施例によるパターン抽出装置の
枠領域の決定方法を示す図である。
【図39】本発明の一実施例によるパターン抽出装置の
対象外とするパターンを示す図である。
【図40】本発明の一実施例によるパターン抽出処理の
原画像を示す図である。
【図41】本発明の一実施例によるパターン抽出処理の
処理後の画像を示す図である。
【図42】従来の文字認識装置で抽出可能な枠を示す図
である。
【図43】従来の文字認識装置における一文字枠の抽出
方法を示す図である。
【図44】従来の文字認識装置における横一行ブロック
枠の抽出方法を示す図である。
【図45】従来の文字認識装置におけるフリーフォーマ
ット枠の抽出方法を示す図である。
【図46】従来の文字認識装置における表形式ブロック
枠の抽出方法を示す図である。
【図47】従来の文字認識装置で抽出不可能な枠を示す
図である。
【符号の説明】
1 連結パターン抽出部 2 マスク処理部 3 横直線抽出部 4 横隣接投影部 5 横線分検出部 6 横線分統合部 7 横直線検出部 8 横直線探索部 9 横点線検出部 10 縦直線抽出部 11 縦隣接投影部 12 縦線分検出部 13 縦線分統合部 14 縦直線検出部 15 縦直線探索部 16 縦点線検出部 17 横枠決定部 18 縦枠決定部 19 入れ子構造処理部 20 矩形内の横枠決定部 21 縦枠決定部 22 矩形表現部
───────────────────────────────────────────────────── フロントページの続き (56)参考文献 特開 平7−28937(JP,A) 特開 平2−61775(JP,A) 特開 平7−14000(JP,A) 特開 平4−291478(JP,A) 特開 平6−309498(JP,A) 特開 平3−250278(JP,A) (58)調査した分野(Int.Cl.7,DB名) G06T 7/00 - 7/60 G06K 9/18 - 9/44

Claims (15)

    (57)【特許請求の範囲】
  1. 【請求項1】 入力画像から、画素の連結情報に基づい
    て部分パターンを抽出するパターン抽出手段と、 該パターン抽出手段により抽出された部分パターンの中
    から実線または点線の直線を抽出する直線抽出手段と、前記直線抽出手段によって抽出された横方向の直線の中
    から、ある一定の長さ以上の直線を抽出して、該直線を
    横枠線の候補とする横枠線候補抽出手段と、 前記横枠線候補抽出手段によって抽出された横枠線の候
    補の直線を、上部から順番に2本づつ取り出し、これら
    2本の直線の長さを比較することにより、横枠線の組と
    なる2本の直線を決定する横枠決定手段と、 該横枠決定手段によって横枠線の組となることが決定さ
    れた2本の横線に、上下が共に達している縦方向の直線
    を縦枠線に決定する縦枠決定手段と、 を備えることを特徴とする枠抽出装置。
  2. 【請求項2】 前記横枠決定手段は、 前記横枠線候補として抽出した2本の直線がほぼ同じ長
    さである場合、これら2本の直線を横枠線の組として登
    録すること、 を特徴とする請求項1記載の枠抽出装置。
  3. 【請求項3】 前記横枠決定手段は、 前記横枠線の候補として抽出した2本の直線のうち、下
    側の直線の方が長い場合、これら2本の直線を横枠線の
    組として登録すること、 を特徴とする請求項1記載の枠抽出装置。
  4. 【請求項4】 前記横枠決定手段は、 前記横枠線の候補として抽出した2本の横方向の上側の
    第1の直線及び下側の第2の直線において、前記第1の
    直線より前記第2の直線の方が短く、且つ、前記第2の
    直線の下方に前記第1の直線又と同じ長さ又は前記第1
    の直線より長い横方向の第3の直線が存在しない場合、
    前記第1の直線及び前記第2の直線を、横枠線の組とし
    て登録することを特徴とする請求項1記載の枠抽出装
    置。
  5. 【請求項5】 前記横枠決定手段は、 前記横枠線の候補として抽出した2本の横方向の上側の
    第1の直線及び下側の第2の直線において、前記第1の
    直線より前記第2の直線の方が短く、且つ、前記第2の
    直線の下方に前記第1の直線と同じ長さ又は前記第1の
    直線より長い横方向の第3の直線が存在する場合、前記
    第1の直線及び前記第3の直線を、横枠線の組として登
    録すること、 を特徴とする請求項1記載の枠抽出装置。
  6. 【請求項6】 前記横枠決定手段は、 前記横枠線の候補として抽出した2本の横方向の上側の
    第1の直線及び下側の第2の直線において、前記第1の
    直線に対して前記第2の直線が右方向又は左方向に短
    く、且つ、前記第2の直線の下方に前記第1の直線と同
    じ長さ又は前記第1の直線より長い横方向の第3の直線
    が存在しない場合、前記第1の直線及び前記第2の直線
    を、横枠線の組として登録すること、 を特徴とする請求項1記載の枠抽出装置。
  7. 【請求項7】 前記横枠決定手段は、 前記横枠線の候補として抽出した2本の横方向の上側の
    第1の直線及び下側の第2の直線において、前記第1の
    直線に対して前記第2の直線が右方向又は左方向に短
    く、且つ、前記第2の直線の下方に前記第1の直線と同
    じ長さ又は前記第1の直線より長い横方向の第3の直線
    が存在する場合、前記第1の直線及び前記第3の直線
    を、横枠線の組として登録すること、 を特徴とする請求項1記載の枠抽出装置。
  8. 【請求項8】 前記横枠決定手段は、 前記横枠の候補として抽出した2本の横方向の上側の第
    1の直線及び下側の第2の直線において縦方向の重なり
    がない場合、前記第2の直線に代えて前記第2の直線の
    下方に存在する横方向の第3の直線を、横枠線の候補と
    することを特徴とする請求項1記載の枠抽出装置。
  9. 【請求項9】 前記横枠決定手段は、 前記2本の横枠線の内、下側の横枠線が右方向へ長いか
    又は左方向へ長い場合、前記2本の横枠線の両方を横枠
    線の候補として再度枠判断処理のために選択可 能とする
    こと、 を特徴とする請求項1記載の枠抽出装置。
  10. 【請求項10】 前記横枠決定手段は、 前記2本の横枠線の長さが異なる場合、長い方の横枠線
    を横枠線の候補として再度枠判断処理のために選択可能
    とすること、 を特徴とする請求項1記載の枠抽出装置。
  11. 【請求項11】 前記横枠決定手段は、 一番下の横枠を決定した後、上部に未処理の横枠の候補
    が存在している場合、、再び部分パターンの上部から未
    処理の横枠を2本づつ組として枠の候補として抽出する
    ことを特徴とする請求項5,7,8,9または10記載
    の枠抽出装置。
  12. 【請求項12】 前記直線抽出手段は、 予め設定されているサイズの部分パターンが、所定の方
    向にある一定の間隔で一定数以上連続して配置されてい
    る画像を検出し、この画像を含む範囲を点線として抽出
    することを特徴とする請求項1記載の枠抽出装置。
  13. 【請求項13】 前記直線抽出手段は、隣接する前記部
    分パターン内の点と点の1間隔分だけ前記画像の端点を
    伸ばした結果得られる画像を含む範囲を点線として抽出
    することを特徴とする請求項12記載の枠抽出装置。
  14. 【請求項14】 前記横枠線候補抽出手段は、 前記枠の候補の直線の長さを比較する際に用いる閾値
    を、前記直線の種類により変化させることを特徴とする
    請求項1記載の枠抽出装置。
  15. 【請求項15】 入力画像から、画素の連結情報に基づ
    いて部分パターンを抽出するパターン抽出手段と、 該パターン抽出手段により抽出された部分パターンの中
    から実線または点線の直線を抽出する直線抽出手段と、 前記直線抽出手段によって抽出された横方向の直線の中
    から、ある一定の長さ以上の直線を抽出して、該直線を
    横枠線の候補とする横枠線候補抽出手段と、 前記横枠線候補抽出手段によって抽出された横枠線の候
    補の直線を、上部から順番に2本づつ取り出し、これら
    の2本の直線の長さを比較することにより組となる2本
    の横枠線を決定する横枠決定手段と、 前記直線抽出手段によって抽出された直線のうち、上端
    及び下端が該組となる2本の横枠線に達している縦方向
    の直線を縦枠線に決定する縦枠決定手段と、 前記横枠決定手段によって横枠線の組となることが決定
    された2本の直線と前記縦枠抽出手段によって決定され
    た2本の縦枠線とで囲まれた矩形範囲を抽出する矩形表
    現手段と、 を備えることを特徴とする矩形抽出装置。
JP20325995A 1995-08-09 1995-08-09 枠抽出装置及び矩形抽出装置 Expired - Fee Related JP3420864B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP20325995A JP3420864B2 (ja) 1995-08-09 1995-08-09 枠抽出装置及び矩形抽出装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP20325995A JP3420864B2 (ja) 1995-08-09 1995-08-09 枠抽出装置及び矩形抽出装置

Publications (2)

Publication Number Publication Date
JPH0950527A JPH0950527A (ja) 1997-02-18
JP3420864B2 true JP3420864B2 (ja) 2003-06-30

Family

ID=16471074

Family Applications (1)

Application Number Title Priority Date Filing Date
JP20325995A Expired - Fee Related JP3420864B2 (ja) 1995-08-09 1995-08-09 枠抽出装置及び矩形抽出装置

Country Status (1)

Country Link
JP (1) JP3420864B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11003902B2 (en) 2017-08-15 2021-05-11 Fuji Xerox Co., Ltd. Image identification apparatus and non-transitory computer readable medium

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6327387B1 (en) 1996-12-27 2001-12-04 Fujitsu Limited Apparatus and method for extracting management information from image
JP3574584B2 (ja) 1998-12-16 2004-10-06 富士通株式会社 表画像処理装置及びそのプログラム記憶媒体
JP4049560B2 (ja) 2001-08-23 2008-02-20 富士通株式会社 網点除去方法及びシステム
JP4479359B2 (ja) * 2004-06-07 2010-06-09 ソニー株式会社 画像処理装置および画像処理方法、並びにプログラム
US7627172B2 (en) * 2004-06-07 2009-12-01 Sony Corporation Image processing apparatus and method, and program
CN100578545C (zh) 2004-08-20 2010-01-06 Ip菲力股份有限公司 标记图像的生成方法和图像处理系统
JP4634250B2 (ja) * 2005-08-08 2011-02-16 Juki株式会社 矩形部品の画像認識方法及び装置
JP5340689B2 (ja) * 2008-10-14 2013-11-13 株式会社ジャストシステム データベース生成装置、データベース生成方法及びコンピュータプログラム
JP5418064B2 (ja) * 2009-08-24 2014-02-19 富士ゼロックス株式会社 画像処理装置およびプログラム
JP5563390B2 (ja) * 2010-06-30 2014-07-30 キヤノン株式会社 画像処理装置およびその制御方法、及びプログラム

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11003902B2 (en) 2017-08-15 2021-05-11 Fuji Xerox Co., Ltd. Image identification apparatus and non-transitory computer readable medium

Also Published As

Publication number Publication date
JPH0950527A (ja) 1997-02-18

Similar Documents

Publication Publication Date Title
EP0543593B1 (en) Method for determining boundaries of words in text
US4903312A (en) Character recognition with variable subdivisions of a character region
JP3696920B2 (ja) ドキュメント格納装置及び方法
EP0543594B1 (en) A method for deriving wordshapes for subsequent comparison
JP3727974B2 (ja) 画像処理装置及び方法
JP3420864B2 (ja) 枠抽出装置及び矩形抽出装置
JPH10334185A (ja) パターン抽出装置
JPH1031716A (ja) 文字行抽出方法および装置
Le et al. Automated borders detection and adaptive segmentation for binary document images
JPH0410087A (ja) 基本ライン抽出方法
JP3607753B2 (ja) 文書画像の領域分割方法および装置、並びに段組種類判別方法および装置
JP3276555B2 (ja) フォーマット認識装置及び文字読取り装置
Refaey Ruled lines detection and removal in grey level handwritten image documents
JPH02116987A (ja) 文字認識装置
JPH06187489A (ja) 文字認識装置
JPH09128480A (ja) パターン領域切り出し方式及びパターン抽出装置
JP3153439B2 (ja) 文書画像傾き検出方法
JPH117493A (ja) 文字認識処理装置
JP2003317107A (ja) 罫線抽出方法及び装置
JP4409678B2 (ja) 罫線抽出方式
JP2612383B2 (ja) 文字認識処理方式
WO2000038100A1 (en) Improved method and apparatus for deskewing images of symbols having a non-linear baseline
JP3517077B2 (ja) パターン抽出装置及びパターン領域の切り出し方法
JP6082306B2 (ja) 光学式文字認識用に画像を前処理するための方法およびシステム
JPH0721312A (ja) 文字サイズ推定装置

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20030408

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080418

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090418

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090418

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100418

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110418

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110418

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120418

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130418

Year of fee payment: 10

LAPS Cancellation because of no payment of annual fees