JPH09128480A - パターン領域切り出し方式及びパターン抽出装置 - Google Patents
パターン領域切り出し方式及びパターン抽出装置Info
- Publication number
- JPH09128480A JPH09128480A JP7282171A JP28217195A JPH09128480A JP H09128480 A JPH09128480 A JP H09128480A JP 7282171 A JP7282171 A JP 7282171A JP 28217195 A JP28217195 A JP 28217195A JP H09128480 A JPH09128480 A JP H09128480A
- Authority
- JP
- Japan
- Prior art keywords
- straight line
- pattern
- extracting
- frame
- line
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Character Input (AREA)
- Image Analysis (AREA)
Abstract
も、パターン領域を正確に抽出できるようにする。 【解決手段】 連結パターン抽出手段201により抽出
された部分パターンにおいて、ラベル付け替え手段20
2により所定の大きさ以上の部分パターンのラベルの付
け替えを行う。直線抽出手段202は、しきい値以下の
長さの空白についてパターンが存在するものとして直線
の抽出を行い、直線抽出手段202により抽出された直
線から枠抽出手段203により枠を抽出し、枠抽出手段
203により抽出された枠に基づいて、パターンの切り
出しを行う。
Description
及びパターン領域切り出し方式に関し、手書き用文字認
識装置、印刷文字認識装置、図面認識装置等において、
文字や図形や記号などのパターンの範囲を示す枠や矩形
等を抽出する場合に適用して好適なものである。
CRなどの手書き文字認識装置の需要が増加している。
そして、手書き文字認識装置において個々の文字の高い
認識率を実現するためには、認識の前処理である文字の
切り出し処理を正確に行うことが重要になる。
を指定した文書(ドロップアウトカラーでなく、黒枠な
どの罫線と文字とが同じ色で、且つ、同じ濃度で書かれ
たもの)では、指定した範囲内に文字が正確に書かれた
場合は、高い確率で文字を正確に自動認識することがで
きた。
定範囲を示す枠や罫線に文字が接触したり、枠や罫線か
ら文字がはみ出した場合は、著しく文字の認識率が低下
する問題が生じていた。すなわち、現在使用されている
文字認識装置では、枠を除去する際、文字枠のわずかな
傾きや凹凸に対応することができず、文字枠の位置や線
幅の変動により本来の文字部分の所が欠けてしまった
り、枠が残存したりする。
は、以前、例えば、特開平6−309498号公報や特
開平7−28937号公報に記載されているように、枠
の位置やサイズ等のフォーマット情報の入力を必要とせ
ずに、枠の抽出や除去を行うことが可能な技術を提案し
た。
特開平7−28937号公報に記載されている方法によ
り処理可能な帳票は、一文字枠、ブロック枠(横一行枠
またはフリーフォマット枠)、または枠の外形が矩形状
となっており横枠線が規則的に配置されている構造を持
つ表を有するものであった。また、帳票の枠抽出処理で
対象としていた罫線は実線のみであり、点線を含んだ帳
票に関しては処理の対象外であった。
記のような一文字枠、ブロック枠、枠の外形が矩形状と
なっており横枠線が規則的に配置されている構造を持つ
表を有する帳票のみでは、文字認識に利用可能な帳票の
種類が限定されてしまい、様々な形状の枠や表を有する
一般帳票の対応には不十分であった。
03259の明細書に記載されているように、例えば、
図36(a)に示す枠の外形が矩形状となっており横枠
線が規則的に配置されている構造を持つ表のほか、図3
6(b)に示すにように、外形が矩形となっていない表
を有する帳票や表の一部分にさらに細かい表構造(図3
6(b)の網かけ部分)を有する帳票、また点線と実線
とが混在している帳票などなどに対しても対応すること
が可能な技術を提案した。
細書に記載されている技術の概要について図面を参照し
ながら説明する。図37は、先願の特願平7−2032
59の明細書に記載されているパターン抽出装置の構成
を示すブロック図である。
は、連結パターン抽出部151、マスク処理部152、
横直線抽出部153、横点線検出部159、縦直線抽出
部160、縦点線検出部166、横枠決定部167、縦
枠決定部168、入れ子構造処理部169及び矩形表現
部172を備えている。
4、横線分検出部155、横線分統合部156、横直線
検出部157及び横直線探索部158を備えている。ま
た、縦直線抽出部160は、縦隣接投影部161、縦線
分検出部162、縦線分統合部163、縦直線検出部1
64及び縦直線探索部165を備えている。
の横枠決定部170及び縦枠決定部171を備えてい
る。連結パターン抽出部151は、縦、横及び斜めの8
方向のいずれかで繋がっている8連結の部分パターン
を、ラベリングにより連結パターンとして抽出する。
部151で抽出された連結パターンに対し、画像全体に
対して横長、縦長の2種類のマスクによる走査を行う。
そして、マスク内においてパターンが占める割合を算出
し、その割合がある所定値より大きければそのマスク内
を全てパターンとみなし、また該所定値以下であれば、
マスク内のパターンを削除することにより、縦横成分を
抽出する。
1は、マスク処理されたパターンを横方向及び縦方向に
複数に分割し、横方向及び縦方向に分割したそれぞれの
範囲内でパターンの隣接投影を算出し、ある一定の長さ
の線分又は直線の一部を矩形近似により検出する。ここ
で、隣接投影とは、注目行又は注目列の投影値に周囲の
行又は列の投影値を足し合わせたものである。
2は、部分パターンのマスク処理画像に対する隣接投影
値に基づいて、横方向及び縦方向におけるある一定長さ
の線分又は直線の一部を、矩形近似により検出する。
3は、横線分検出部155及び縦線分検出部162で検
出された矩形線分のうち、近隣の矩形線分同士を統合し
て長い直線とする。
4は、横線分統合部166及び縦線分統合部163にお
いて得られた直線を矩形近似し、横枠又は縦枠を構成す
る直線の候補を検出する。
5は、横直線検出部157及び縦直線検出部164で矩
形近似された横線または縦線の直線の探索を行い、横線
の場合は左右端、縦線の場合は上下端を検出する。
6は、ある一定の間隔で並んでいる小さいパターンを検
出して点線が存在するとみなし、この点線に対して上述
した直線と同様に矩形近似を行う。
の中から、各行の横枠を構成している2本の横線の組を
決定する。これは、上から順番に横線を2本抽出し、抽
出した2本の横線の長さが同じ、又は下の直線の方が長
ければ、その2本を横線の組とする。そして、抽出した
2本の横線の長さが同じ、又は下の直線の方が長いよう
にできない場合に限り、下の直線の方が短くても組にす
る。
て縦枠を決定する処理を行うもので、縦直線抽出部16
0で抽出された縦線のうち、横枠決定部167で横枠の
2本組として決定された2本の横線に上下とも達してい
るものを縦枠とする。
決定された2本組の横枠と、該2本組の横枠の上下に達
していると縦枠決定部168で決定された2本の縦枠と
で囲まれた矩形を抽出するものである。
72で抽出された第1の矩形の中から、その内部にさら
に第2の矩形を含む入れ子構造を検出し、この第1の矩
形に対して矩形内の横枠決定部170及び縦枠決定部1
71で処理を行うことにより、入れ子構造の第1の矩形
をさらに小さな第2の矩形に分割する。
ら直線及び点線を抽出し、この抽出された直線及び点線
が枠であるかを判断し、その判断の結果得られた枠情報
を基に、文字が書かれる文字記入枠を正確に抽出するこ
とが可能となる。
技術で対応可能な帳票は、枠を構成する罫線としてかす
れのない線を対象としており、図38に示すように、か
すれのある線で構成される帳票に対しては正確な処理を
行うことが困難であった。
発生し、かすれのない線のみを対象とする場合、パター
ン抽出装置の利用可能な範囲が限られてしまうため、一
般の帳票に対応するには従来の技術では不十分であっ
た。
する線にかすれが存在する場合でも、パターン領域を正
確に抽出できるようにすることである。また、本発明の
第2の目的は、矩形領域内の一部の領域に存在する入れ
子構造の枠を正確に抽出できるようにすることである。
枠を正確に抽出するため、空白の長さがしきい値以下で
ある場合、空白領域にパターンがあるものとみなして、
枠を構成する直線を抽出するものである。
の長さと位置関係を調べることにより、矩形内の一部の
領域に存在するさらに小さな矩形を抽出するものであ
る。上述した課題を解決するために、請求項1の発明に
よれば、同一直線上の第1の線分と第2の線分との間の
空白の長さがしきい値以下である場合、第1の線分と第
2の線分との間にパターンがあるものとみなして、パタ
ーン領域を決定する枠を抽出する。このことにより、枠
を構成する直線にかすれがある場合においても、枠を構
成する直線を正確に抽出することができ、パターン領域
を正確に決定することができる。
ーンの中から所定の長さ以上の第1の直線及びしきい値
以下の長さの空白を介して分離している第2の直線を抽
出する直線抽出手段と、前記直線抽出手段により抽出さ
れた直線が、枠を構成する直線であるか否かを判断する
判断手段と、前記判断手段により得られた枠を構成する
直線情報に基づいて、矩形枠を抽出する枠抽出手段とを
備える。このことにより、直線抽出手段は、枠を構成す
る直線にかすれがある場合においても、枠を構成する直
線を正確に抽出することができ、この直線抽出手段によ
り抽出された直線に基づいて矩形枠を抽出することによ
り、かすれがあるパターンから矩形枠を抽出することが
できる。
する直線情報に基づいて、第1の矩形枠を抽出する第1
の枠抽出手段と、前記第1の枠抽出手段によって抽出さ
れた第1の矩形枠内の一部の領域から第2の矩形枠を抽
出する第2の枠抽出手段とを備える。このことにより、
矩形枠の一部の領域中にさらに小さな矩形枠が存在する
表からパターンの切り出しを正確に行うことができる。
抽出手段は、第1の枠抽出手段によって抽出された第1
の矩形枠内に一定以上の長さを有する横線が存在し、且
つ前記第1の矩形枠の上辺又は下辺と前記横線との両方
に達する縦線が存在する場合、前記第1の矩形枠内から
前記横線と前記縦線とで構成される第2の矩形枠を抽出
する。このことにより、矩形枠の一部の領域中に存在す
るさらに小さな矩形枠を、文字線分と混同することなく
抽出できる。
きさ以上の第1の部分パターンと第1の部分パターンの
外接矩形範囲内に存在する第2の部分パターンとに共通
のラベルを付すラベル付け替え手段と、前記第1の部分
パターンと前記第2の部分パターンとから、所定の長さ
以上の第1の直線及びしきい値以下の長さの空白を介し
て分離している第2の直線を抽出する直線抽出手段とを
備える。このことにより、ラベル付け替え手段は、かす
れにより第1の部分パターンから分離している第2の部
分パターンを、枠を抽出するパターンの候補に付け加え
ることができ、直線抽出手段は、かすれにより分離して
いるパターンから枠を構成する直線を抽出することがで
きる。
きさ以上の第1の部分パターンと第1の部分パターンの
外接矩形範囲内に存在する第2の部分パターンとに共通
のラベルを付すラベル付け替え手段と、前記第1の部分
パターンと前記第2の部分パターンとから、所定の長さ
以上の第1の直線及びしきい値以下の長さの空白を介し
て分離している第2の直線を抽出する直線抽出手段と、
所定の間隔で並んでいる所定の大きさ以下の第3の部分
パターンからなる点線を検出する点線検出手段とを備え
る。このことにより、かすれにより分離している直線や
点線を含むパターンからパターン領域を区切る枠を抽出
することができる。
手段は、ある行又は列の投影値に、周囲の行又は列の投
影値を足し合わせた値を、その行又は列の投影値とする
隣接投影法を用いて、前記部分パターンを構成する複数
の矩形線分を検出する線分検出手段と、線分検出手段に
よって得られた複数の線分を統合し、この統合された線
分を矩形近似することにより直線を検出する直線検出手
段とを備える。このことにより、周囲の行又は列の投影
値を足し合わせた投影値により矩形近似して直線を検出
することができ、斜めに傾いた直線を正確に検出するこ
とができる。
手段は、直線検出手段により検出された直線の原画像の
パターンの最も細い部分から、しきい値以下の長さの空
白はパターンがあるものとみなして外側へ探索すること
により該パターンの両端を検出し、この検出位置を直線
の両端の位置として設定する直線探索手段をさらに備え
る。このことにより、しきい値以下の長さの空白により
分離している直線を抽出することができ、枠を構成する
直線にかすれがある場合においても、枠を構成する直線
を正確に抽出することができる。
手段は、しきい値を部分パターンの大きさに対応させて
変える。このことにより、枠を構成する分離している直
線を抽出する場合、枠を構成するパターンと間違って文
字線分を抽出することを防止することができ、枠を構成
する直線を正確に抽出することができる。
出手段は、直線検出手段により検出された直線の傾きを
検出する傾き検出手段と、直線の傾きが所定の範囲を越
える直線を枠の候補から除去する除去手段とをさらに備
える。このことにより、枠内に書かれた斜めの消し線を
枠を構成する直線として抽出することを防止することが
でき、枠を構成する直線を正確に抽出することができ
る。
出手段により検出された直線のうち、縦方向の距離が所
定の値以下の横線を統合するとともに、横方向の距離が
所定の値以下の縦線を統合する直線統合手段をさらに備
える。このことにより、より長いかすれを有する直線を
抽出することができ、入力画像の画質が悪い場合におい
ても、枠を構成する直線を正確に抽出することができ
る。
ターンから所定の長さ以上の第1の直線及びしきい値以
下の長さの空白を介して分離している第2の直線を抽出
する直線抽出手段と、第1の矩形枠を抽出する第1の枠
抽出手段と、前記第1の枠抽出手段によって抽出された
第1の矩形枠内に所定の長さ以上の横線が存在する場
合、前記横線を枠として有する第2の矩形枠を抽出する
第2の枠抽出手段とを備える。このことにより、枠を構
成する直線がかすれにより分離している場合において
も、矩形枠の一部の領域中に存在するさらに小さな矩形
枠を、文字線分と混同することなく抽出できる。
ターンから所定の長さ以上の第1の直線、第1のしきい
値以下の長さの空白を介して分離している第2の直線及
び前記第1のしきい値より小さい第2のしきい値以下の
長さの空白を介して分離している第3の直線を抽出する
直線抽出手段と、枠を構成する第1の直線、第2の直線
及び第3の直線に基づいて、第1の矩形枠を抽出する第
1の枠抽出手段と、前記第1の枠抽出手段によって抽出
された第1の矩形枠内から、前記第1の直線及び第3の
直線に基づいて、第2の矩形枠を抽出する第2の枠抽出
手段とを備える。このことにより、より長い直線からな
る第1の矩形枠を抽出する場合、かすれを許容するしき
い値を大きく設定することができ、より短い直線からな
る第2の矩形枠を抽出する場合、かすれを許容するしき
い値を小さく設定することができるため、大きな矩形枠
を正確に抽出しながら、大きな矩形枠の領域中に存在す
るより小さな矩形枠を、文字線分と混同することなく抽
出できる。
及び横方向に等間隔で区切られたパターンから所定の長
さ以上の第1の直線及びしきい値以下の長さの空白を介
して分離している第2の直線を抽出するを抽出する直線
抽出手段と、前記直線抽出手段により抽出された第1の
直線及び第2の直線のうち、同じ長さを有する第3の直
線が一定の本数以上存在する場合、所定の値以上の長さ
を有する第4の直線の長さを前記第3の直線の長さと同
一にする直線補正手段を備える。このことにより、縦方
向及び横方向に等間隔で区切られたパターンの場合、枠
を構成する直線の端の部分がかすれにより消失しても、
端の部分が消失した直線を枠を構成する直線として正確
に抽出することができ、かすれがあるパターンから矩形
枠を正確に抽出することができる。
及び横方向に等間隔で区切られたパターンから所定の長
さ以上の第1の直線及びしきい値以下の長さの空白を介
して分離している第2の直線を抽出するを抽出する直線
抽出手段と、所定の間隔で並んでいる所定の大きさ以下
の部分パターンからなる第1の点線を検出する点線抽出
手段と、前記直線抽出手段により抽出された第1の直線
及び第2の直線のうち、同じ長さを有する第3の直線が
一定の本数以上存在する場合、所定の値以上の長さを有
する第4の直線の長さを前記第3の直線の長さと同一に
する直線補正手段と、前記点線抽出手段により抽出され
た第1の点線のうち、同じ長さを有する第2の点線が一
定の本数以上存在する場合、所定の値以上の長さを有す
る第3の点線の長さを前記第2の点線の長さと同一にす
る点線補正手段ととを備える。このことにより、縦方向
及び横方向に等間隔で区切られたパターンの場合、枠を
構成する直線及び点線の端の部分がかすれにより消失し
ても、端の部分が消失した直線及び点線を枠を構成する
直線又は点線として正確に抽出することができ、かすれ
があるパターンから矩形枠を正確に抽出することができ
る。
及び横方向に等間隔で区切られたパターンから所定の長
さ以上の第1の直線及びしきい値以下の長さの空白を介
して分離している第2の直線を抽出するを抽出する直線
抽出手段と、前記直線抽出手段により抽出された第1の
直線及び第2の直線のうち、同じ長さを有する第3の直
線が一定の本数以上存在し、且つ等間隔に並んでいる場
合、前記第3の直線を矩形枠を構成する直線とみなす判
断手段とを備える。このことにより、縦方向及び横方向
に等間隔で区切られたパターンの場合、枠を構成する直
線のかすれの度合いにかかわらず、同じ長さを有し且つ
等間隔に並んでいる直線を枠を構成する直線として正確
に抽出することができ、かすれがあるパターンから矩形
枠を正確に抽出することができる。
及び横方向に等間隔で区切られたパターンから所定の長
さ以上の第1の直線及びしきい値以下の長さの空白を介
して分離している第2の直線を抽出するを抽出する直線
抽出手段と、所定の間隔で並んでいる所定の大きさ以下
の部分パターンからなる第1の点線を検出する点線抽出
手段と、前記直線抽出手段により抽出された第1の直線
及び第2の直線のうち、同じ長さを有する第3の直線が
一定の本数以上存在し、且つ等間隔に並んでいる場合、
前記第3の直線を矩形枠を構成する直線とみなす第1の
判断手段と、前記点線抽出手段により抽出された第1の
点線のうち、同じ長さを有する第2の点線が一定の本数
以上存在し、且つ等間隔に並んでいる場合、前記第2の
点線を矩形枠を構成する点線とみなす第2の判断手段と
を備える。このことにより、縦方向及び横方向に等間隔
で区切られたパターンの場合、枠を構成する直線及び点
線のかすれの度合いにかかわらず、同じ長さを有し且つ
等間隔に並んでいる直線及び点線を枠を構成する直線又
は点線として正確に抽出することができ、かすれがある
パターンから矩形枠を正確に抽出することができる。
及び横方向に等間隔で区切られたパターンから所定の長
さ以上の第1の直線及びしきい値以下の長さの空白を介
して分離している第2の直線を抽出するを抽出する直線
抽出手段と、前記直線抽出手段により抽出された第1の
直線及び第2の直線のうち、同じ長さを有し第1の間隔
で並んでいる第3の直線が一定の本数以上存在し、且つ
前記第3の直線と同じ長さを有し前記第1の間隔の整数
倍の第2の間隔を有する第4の直線が存在する場合、前
記第2の間隔内に前記第1の間隔で前記第3の直線と同
じ長さを有する第5の直線を生成する直線生成手段とを
備える。このことにより、縦方向及び横方向に等間隔で
区切られたパターンの場合、枠を構成する直線がかすれ
により消失しても、消失した直線を枠を構成する直線と
して正確に抽出することができ、かすれがあるパターン
から矩形枠を正確に抽出することができる。
及び横方向に等間隔で区切られたパターンから所定の長
さ以上の第1の直線及びしきい値以下の長さの空白を介
して分離している第2の直線を抽出するを抽出する直線
抽出手段と、所定の間隔で並んでいる所定の大きさ以下
の部分パターンからなる第1の点線を検出する点線抽出
手段と、前記直線抽出手段により抽出された第1の直線
及び第2の直線のうち、同じ長さを有し第1の間隔で並
んでいる第3の直線が一定の本数以上存在し、且つ前記
第3の直線と同じ長さを有し前記第1の間隔の整数倍の
第2の間隔を有する第4の直線が存在する場合、前記第
2の間隔内に前記第1の間隔で前記第3の直線と同じ長
さを有する第5の直線を生成する直線生成手段と、前記
点線抽出手段により抽出された第1の点線のうち、同じ
長さを有し第3の間隔で並んでいる第2の点線が一定の
本数以上存在し、且つ前記第2の点線と同じ長さを有し
前記第3の間隔の整数倍の第4の間隔を有する第3の点
線が存在する場合、前記第4の間隔の領域に前記第3の
間隔で前記第2の点線と同じ長さを有する第4の点線を
生成する点線生成手段とを備える。このことにより、縦
方向及び横方向に等間隔で区切られたパターンの場合、
枠を構成する直線及び点線がかすれにより消失しても、
消失した直線及び点線を枠を構成する直線又は点線とし
て正確に抽出することができ、かすれがあるパターンか
ら矩形枠を正確に抽出することができる。
及び横方向に等間隔で区切られたパターンから所定の長
さ以上の第1の直線及びしきい値以下の長さの空白を介
して分離している第2の直線を抽出するを抽出する直線
抽出手段と、前記直線抽出手段により抽出された第1の
直線及び第2の直線のうち、同じ長さを有し第1の間隔
で並んでいる第3の直線が一定の本数以上存在し、且つ
前記第3の直線と同じ長さを有する第4の直線が前記第
1の間隔内に存在する場合、前記第4の直線を枠の候補
から除去する直線除去手段とを備える。このことによ
り、縦方向及び横方向に等間隔で区切られたパターンの
場合、枠を構成しない直線を枠を構成する直線の候補か
ら除去することができ、枠を構成する直線のみを正確に
抽出することができるので、矩形枠を抽出する精度を上
げることができる。
及び横方向に等間隔で区切られたパターンから所定の長
さ以上の第1の直線及びしきい値以下の長さの空白を介
して分離している第2の直線を抽出するを抽出する直線
抽出手段と、所定の間隔で並んでいる所定の大きさ以下
の部分パターンからなる第1の点線を検出する点線抽出
手段と、前記直線抽出手段により抽出された第1の直線
及び第2の直線のうち、同じ長さを有し第1の間隔で並
んでいる第3の直線が一定の本数以上存在し、且つ前記
第3の直線と同じ長さを有する第4の直線が前記第1の
間隔内に存在する場合、前記第4の直線を枠の候補から
除去する直線除去手段と、前記点線抽出手段により抽出
された第1の点線のうち、同じ長さを有し第2の間隔で
並んでいる第2の点線が一定の本数以上存在し、且つ前
記第2の点線と同じ長さを有する第3の点線が前記第2
の間隔内に存在する場合、前記第3の点線を枠の候補か
ら除去する点線除去手段ととを備える。このことによ
り、縦方向及び横方向に等間隔で区切られたパターンの
場合、枠を構成しない直線及び点線を枠を構成する直線
及び点線の候補から除去することができ、枠を構成する
直線及び点線のみを正確に抽出することができるので、
矩形枠を抽出する精度を上げることができる。
ターン抽出装置の機能的な構成を、図面を参照しながら
詳細に説明する。
抽出装置の機能構成を示すブロック図である。図1にお
いて、連結パターン抽出手段200は、入力されたパタ
ーンからラベリングにより連結した部分パターンを抽出
するものである。
ン抽出手段200によりラベルが付された第1の部分パ
ターンに対して所定の位置に存在し、且つ所定のサイズ
より大きな第2の部分パターンのラベルを第1の部分パ
ターンのラベルと同一にするものである。
段201により同一のラベルを付された部分パターンの
中から、所定の長さ以上の第1の直線及びしきい値以下
の長さの空白を介して分離している第2の直線を抽出す
るものである。
直線の傾きを検出する傾き検出手段202aと傾き検出
手段202aで検出された直線の傾きが所定の範囲を越
える直線を枠の候補から除去する除去手段202bとを
備えている。
により得られた枠を構成する直線情報に基づいて、矩形
枠を抽出するものである。ここで、枠抽出手段203
は、直線抽出手段202により抽出された横直線を上か
ら順番に2本づつ組にして横枠とし、上端及び下端が横
枠に達している縦直線を縦枠とする。
存在するさらに小さな矩形枠を検出する入れ子構造検出
手段203aを備えている。この入れ子構造検出手段2
03aは、枠抽出手段203によって抽出された矩形枠
内に一定以上の長さを有する横線が存在し、且つ矩形枠
の上辺又は下辺と横線との両方に達する縦線が存在する
場合、矩形枠の中にさらに小さな矩形枠が存在すると判
断する。
段203により抽出された矩形範囲に基づいて、パター
ン領域を抽出するものである。次に、本発明の一実施例
によるパターン抽出装置の動作を説明する。
0により抽出された部分パターンから、所定の値より大
きな部分パターンを抽出することにより、枠を構成する
候補となるパターンを取り出す。
の値より大きな第1の部分パターンに対して所定の位置
に存在する第2の部分パターン、すなわち、かすれのた
めに第1の部分パターンから分離した第2の部分パター
ンのラベルを第1の部分パターンのラベルと同一にす
る。そして、枠を構成する候補となる第1の部分パター
ンの中に、第1の部分パターンから分離した第2の部分
パターンを含むようにする。
替え手段201により同一のラベルを付された部分パタ
ーンの中から、しきい値以下の長さの空白領域にはパタ
ーンが存在するものとみなして直線を抽出する。このこ
とにより、かすれのために分離している直線を枠の候補
として抽出することができる。
段202aにより検出し、直線の傾きが他の直線と異な
っている直線を枠の候補から除去する。次に、枠抽出手
段203は、直線抽出手段202により得られた枠を構
成する直線情報に基づいて、矩形枠を抽出する。そし
て、入れ子構造検出手段203aが第1の矩形枠の中に
さらに小さな第2の矩形枠が存在すると判断した場合、
第1の矩形枠から第2の矩形枠を抽出する。。
形枠により区切られたパターン領域を抽出する。次に、
本発明の第1実施例によるパターン抽出装置を、図面を
参照しながら詳細に説明する。
ン抽出装置の構成を示すブロック図である。 このパタ
ーン抽出装置は、パターンの書き込み領域が規則的な構
造を有する表だけではなく、不規則な構造を有する表に
おいても、枠を正確に抽出できるようにしたものであ
る。また、実線と点線の罫線が混在する表や、入れ子構
造を有する表、さらには枠を構成する線にかすれがある
表にも適用可能である。
数個あり、また、サイズや位置や傾きなどが分からない
枠に対して文字が書かれている(この場合、文字が枠と
接触したり、枠からはみ出していてもよい)帳票から、
枠を抽出する場合について説明する。また、対象となる
入力パターンは、極端な傾きや回転の補正が行われた後
の2値画像である。
抽出装置は、連結パターン抽出部1、マスク処理部2、
横直線抽出部3、横点線検出部9、横直線統合部10、
縦直線抽出部11、縦点線検出部17、縦直線統合部1
8、横枠決定部19、縦枠決定部20、入れ子構造処理
部21及び矩形表現部24を備えている。
分検出部5、横線分統合部6、横直線検出部7及び横直
線探索部8を備えている。また、縦直線抽出部11は、
縦隣接投影部12、縦線分検出部13、縦線分統合部1
4、縦直線検出部15及び縦直線探索部16を備えてい
る。
横枠決定部22及び縦枠決定部23を備えている。連結
パターン抽出部1は、複数の枠が配置される位置の相対
的な関係に依存することなく、各パターンを安定に抽出
するために、縦、横及び斜めの8方向のいずれかで繋が
っている8連結の部分パターンを、ラベリングにより連
結パターンとして抽出する。
ンは、文字が接触していない枠或いは枠の一部、文字が
接触している枠或いは枠の一部、枠に接触していない文
字或いは文字の一部、または枠に接触している文字のい
ずれかである。そして、これらの部分パターンを判別
し、所定のサイズより大きな連結パターンの集合を表の
候補として抽出する。
出された部分パターンのうち、一定以上の大きさを有す
る第1の部分パターンを表の候補とする。そして、第1
の部分パターンに対して所定の位置に存在し、且つ所定
のサイズより大きな第2の部分パターンのラベルを第1
の部分パターンのラベルと同一になるように変更し、こ
の第2の部分パターンを表の候補に追加する。
成するパターンが、かすれにより分離して別のパターン
として処理されることを防止するためのものである。な
お、ラベリングで得られた部分パターンのサイズが後に
必要になるので、部分パターンを矩形近似して得られる
矩形の角の座標をラベリングの処理中に算出しておく。
例を示す図である。連結パターン抽出部1は、図3
(a)に示す画像の入力パターンに対しラベリングを行
い、8連結で繋がっている各部分パターンにラベル1〜
7を付す。図3(a) において、入力パターンは1,2,
1,8,4,5の数字とかすれを有する枠からなる。
「8連結」のパターンとは、縦、横、斜めの8方向にお
いて特定画素に関してその隣接画素が存在するとき繋が
っているとし、存在しないとき繋がっていないとするこ
とにより、形成された一続き(連結)のパターンを言
う。たとえば、ラベル1は外枠を示す4辺、各辺に連結
した内枠および外枠の一辺に繋がった数字5であり、ラ
ベル2は数字1である。
が付された部分パターンを枠からなる表の候補とする。
次に、図3(b)に示すように、ラベル1が付された部
分パターンに対して所定の位置に存在し、且つ所定のサ
イズより大きなラベル5〜7が付された部分パターンの
ラベルをラベル1に変更する。
7が付された部分パターンを表の候補として取り扱うこ
とが可能となる。なお、ラベル5、ラベル6が付された
部分パターンは後の処理で表の候補から除かれる。
すフローチャートである。図4において、まず、ステッ
プS1に示すように、連結パターン抽出部1のラベリン
グ処理により、8連結で繋がっている部分パターンを抽
出してラベルを付す。
ターン抽出部1により抽出された部分パターンのうち、
一定以上の大きさを有する第1の部分パターン(A)を
枠の候補とする。
サイズより大きな第2の部分パターン(B)であって、
第2の部分パターン(B)の外接矩形の右辺XRbが第
1の部分パターン(A)の外接矩形の右辺XRaとが重
なっているか又は第2の部分パターン(B)の外接矩形
の右辺XRbが第1の部分パターン(A)の外接矩形の
右辺XRaより左側にあり、且つ第2の部分パターン
(B)の外接矩形の左辺XLbが第1の部分パターン
(A)の外接矩形の左辺XLaとが重なっているか又は
第2の部分パターン(B)の外接矩形の左辺XRbが第
1の部分パターン(A)の外接矩形の左辺XRaより右
側にあり、且つ第2の部分パターン(B)の外接矩形の
上辺YUPbが第1の部分パターン(A)の外接矩形の
上辺XUPaとが重なっているか又は第2の部分パター
ン(B)の外接矩形の上辺XUPbが第1の部分パター
ン(A)の外接矩形の上辺XUPaより下側にあり、且
つ第2の部分パターン(B)の外接矩形の下辺YBLb
が第1の部分パターン(A)の外接矩形の下辺XBLa
とが重なっているか又は第2の部分パターン(B)の外
接矩形の下辺XBLbが第1の部分パターン(A)の外
接矩形の下辺XBLaより上側にあるものを検出する。
プS3で検出された第2の部分パターン(B)のラベル
を第1の部分パターン(A)のラベルと同一にする。例
えば、図5(a)に示すように、第2の部分パターン
(B)の外接矩形31は第1の部分パターン(A)の外
接矩形30に囲まれており、ステップS3の条件を満た
すので、第2の部分パターン(B)のラベルを第1の部
分パターン(A)のラベルと同一にする。
分パターン(B)の外接矩形33は第1の部分パターン
(A)の外接矩形32からはみ出しており、ステップS
3の条件を満たさないので、第2の部分パターン(B)
のラベルの付け替えを行わない。
で抽出されたある一定の大きさを有する第1の連結パタ
ーン及び第1の連結パターンと同一ラベルに変更された
第2の連結パターンに対し、画像から極端な斜め成分を
省き、枠だけに存在する長い直線の抽出を容易にするた
めの処理を行う。
2種類のマスクによる走査を行う。そして、マスク内に
おいてパターンが占める割合を算出し、その割合がある
所定値より大きければそのマスク内を全てパターンとみ
なし、また該所定値以下であれば、マスク内のパターン
を削除することにより、縦横成分を抽出する。
の割合が所定値より大きくなった場合、それらをまとめ
て矩形範囲をつくり、その中心線を処理結果とする。ま
た、該マスク処理の結果得られる線分どうしの隙間が開
かないようにするために、マスク処理を行う範囲がお互
いに重なりを持つように設定する。なお、原画像はマス
ク処理画像とは別に記憶しておく。
指定するマスクにより横成分を抽出する場合、図6に示
すようにして原画像の処理が行われる。図6(a)は、
互いに重なり合ったマスク「1」〜「9」を示し、図6
(b)の原画像に対してこれらのマスクを用いてマスク
処理を行うことにより、図6(c)において黒丸で示さ
れた横成分の画素が抽出される。
ーチャートである。同図において、まず、ステップS1
1に示すように、連結パターン抽出部1で得られた部分
パターンの原画像全体に対して、横長及び縦長の2種類
のマスクで走査を行う。
ク内のパターンの占める割合、すなわち、マスクの面積
に対するマスク内のパターンの面積を算出し、この割合
が、所定値より大きいかどうかの判断を行う。そして、
マスク内のパターンの占める割合が所定値より小さいと
判断された場合、ステップS13に進み縦成分又は横成
分がないとして処理を終了する。
ンの占める割合が所定値より大きいと判断された場合、
ステップS14に進み、マスク内を全てパターンとみな
し、該パターンを、全て、縦成分又は横成分とする。
ップS14で得られた成分が、上下の成分又は左右の成
分と接しているかどうかの判断を行う。そして、上下の
成分又は左右の成分と接していないと判断された場合、
ステップS16に進み、ステップS14で得られた成分
を処理結果として出力する。
右の成分と接していると判断された場合、ステップS1
7に進み、互いに接している成分を統合する。そして、
ステップS18において、ステップS17で統合した成
分から矩形範囲を作成し、ステップS19において、ス
テップS18得られた矩形範囲の中心線を処理結果とし
て出力する。
(a)に示す同一のラベル1を付された部分パターンか
ら、図8(b)に示すような斜め成分が除去され線幅が
均一化されたパターン34が得られる。
マスク処理されたパターンを横方向及び縦方向に複数に
分割し、横方向及び縦方向に分割したそれぞれの範囲内
でパターンの隣接投影を算出し、ある一定の長さの線分
又は直線の一部を矩形近似により検出する。ここで、隣
接投影とは、注目行又は注目列の投影値に周囲の行又は
列の投影値を足し合わせたものである。このことによ
り、直線が傾いていて複数の行又は複数の列にわたって
いる場合においても、直線を正確に検出することができ
る。従って、隣接投影を用いることにより、ブロック枠
などの大きな枠を検出する場合、その枠が傾いていて
も、枠を構成する直線を検出することが可能である。
(i)とすると、隣接投影値P(i)は、(1)式によ
り算出することができる。 P(i)=p(i−j)+・・・+p(i)+・・・+p(i+j)(1) なお、図9に示す例は、(1)式においてj=1とおい
たものである。
部12の動作を示すフローチャートである。図10にお
いて、まず、ステップS21で、マスク処理部2で得ら
れた同一のラベルを有する部分パターンを横方向及び縦
方向に複数の部分に分割する。次に、ステップS22
で、横方向及び縦方向のそれぞれの分割範囲内で投影値
を算出する。
S22で算出されたそれぞれの投影値に周囲の投影値を
加算する。次に、ステップS24で、(1)式に基づい
て、隣接投影値P(i)を算出する。
部分パターンのマスク処理画像に対する隣接投影値に基
づいて、横方向及び縦方向におけるある一定長さの線分
又は直線の一部を、矩形近似により検出する。
部12で算出された隣接投影値と縦横それぞれの分割長
との比が所定の閾値以上である部分を直線の候補が存在
する位置とする。また、連続する複数の行又は列が所定
の閾値値以上となった場合は、それらの連続する複数の
行又は列をまとめた矩形範囲を直線の候補が存在する位
置とする。なお、この矩形近似により検出した一定長さ
の線分又は直線の一部を、以後「矩形線分」と呼ぶ。こ
の線分検出処理により、例えば、図11(a)に示すよ
うな斜めに傾いた横線40から、図11(b)に示す横
方向に分割された3つの矩形線分41が得られる。
法を用いた場合、図11(a)に示すような斜めに傾い
た直線40を検出することは不可能である。このため、
斜めに傾いた直線40を通常の投影法で検出するには、
部分パターンの分割数を増やし分割長を短くする必要が
ある。しかし、部分パターンの分割長が短くなると、文
字を構成している短い直線も多数検出され、文字と枠と
を区別することが困難になる。これに対して、隣接投影
法を用いることにより、枠を構成する比較的長い直線を
文字を構成している短い直線と区別しながら正確に検出
することができる。
部13の動作を示すフローチャートである。図12にお
いて、まず、ステップS31で、横隣接投影部4及び縦
隣接投影部12で算出された隣接投影値と縦横それぞれ
の分割長との比が所定のしきい値以上であるかどうかを
判定する。そして、隣接投影値と縦横それぞれの分割長
との比が所定のしきい値以上でないと判断された場合、
ステップS32に進み、線分が存在しないものとみな
す。
それぞれの分割長との比が所定のしきい値以上であると
判断された場合、ステップS33に進み、線分が存在す
るものとみなす。
S33で線分とみなされたパターンが、その上下に存在
する線分と接しているかどうかを判断する。そして、上
記パターンが上下に存在する線分と接していないと判断
された場合、ステップS35に進み、そのパターンを矩
形線分とする。
S33で線分とみなされたパターンがその上下に存在す
る線分と接していると判断された場合、ステップS36
に進み、上記パターンとその上下に存在する線分とを統
合する。そして、ステップS37で、ステップS36で
統合した線分を矩形線分として検出する。
横線分検出部5及び縦線分検出部13で検出された矩形
線分のうち、近隣の矩形線分同士を統合して長い直線と
するものである。例えば、図13(b)に示すように、
途中で途切れていない矩形線分x、y、zが接触してい
るか又は繋がっている場合、これらの矩形線分x、y、
zを統合して長い直線とする。また、図13(a)に示
すように、矩形線分x、yが繋がっていない場合、矩形
線分x、yの垂直方向の距離が隣接投影法において加算
する行又は列数j以内ならば、矩形線分x、y、zを統
合して長い直線とする。
部14の動作を示すフローチャートである。同図におい
て、まず、ステップS41で、横線分検出部5及び縦線
分検出部13で検出された矩形線分に対し、矩形線分同
士の距離を算出する。次に、ステップS42で、ステッ
プS41で算出された矩形線分同士の距離が、隣接投影
法において加算する行又は列数j以内であるかどうかを
判定する。そして、矩形線分同士の距離が隣接投影法に
おいて加算する行又は列数j以内でない場合、ステップ
S43に進み、矩形線分の統合を行わない。
同士の距離が隣接投影法において加算する行又は列数j
以内であると判断された場合、ステップS43に進み、
矩形線分の統合を行う。
横線分統合部6及び縦線分統合部14において得られた
直線を矩形近似し、横枠又は縦枠を構成する直線の候補
を検出する。例えば、図15(a)に示す統合された直
線42を矩形近似し、図15(b)で破線により示され
た直線43を得る。
線分の両端の座標から算出し、他の直線の傾きと比較し
て異なる傾きを有する直線を、枠の中に書かれた斜めの
消し線等、枠でない部分であるとみなし、直線の候補か
ら除く。
横直線検出部7及び縦直線検出部15で矩形近似された
横線または縦線の直線について、横線の場合は左右端、
縦線の場合は上下端を正確に検出するために、矩形近似
された直線を構成するパターンの探索を行う。ここで、
探索の進行方向にパターンのない空白領域が存在して
も、一定の画素数以下の空白領域に対してはパターンが
あるとみなして探索を行う。このことにより、かすれの
ために分離している直線からなる枠の候補を正確に検出
することができる。
矩形近似された直線44に対して、該直線44を構成す
るパターン45の検索を行う場合、一定の画素数以下の
空白領域46に対してはパターンがあるとみなして探索
を行う。そして、以後の処理において、この検索で得ら
れたパターン45の左右端を、上記矩形近似された直線
44の左右端の代わりに用いる。
ローチャートである。図17において、まず、ステップ
S51に示すように、横直線検出部7で近似した矩形範
囲内のパターンのうち、最も細い部分のX座標を算出す
る。
ップS51で算出したX座標におけるパターンの中心点
を算出する。そして、ステップS53に示すように、ス
テップS52で算出したパターンの中心点を探索の開始
点とする。ここで、探索の開始点をパターンの最も細い
部分とするのは、最も細い部分は文字である可能性が低
いため、枠となる直線の探索をより確実に行うことがで
きるからである。
右に設定する。次に、ステップS55に示すように、空
白領域の長さをカウントする変数Kの初期値を0に設定
する。
ップS53で求めた開始点をパターンの探索の現在地と
設定する。次に、ステップS57に示すように、ステッ
プS56で設定した探索の現在地が上記矩形範囲の内部
であるかどうかの判定を行い、探索の現在地が矩形範囲
の内部でない場合、ステップS66に進む。
形範囲の内部であると判定された場合、ステップS58
に進み、探索の現在地からみて探索方向隣にパターンが
あるかどうか判定する。ここで、探索の現在地からみて
探索方向隣にパターンがあるとは、図18に示すよう
に、パターン51からみて右方向隣の位置にパターン5
2が存在していることを意味している。そして、探索の
現在地からみて探索方向隣にパターン52があると判定
された場合、ステップS61に進み、探索方向隣にある
パターン52を探索の現在地とする。
みて探索方向隣にパターンがないと判定された場合、ス
テップS59に進み、探索の現在地からみて探索方向斜
め隣にパターンがあるかどうか判定する。ここで、探索
の現在地からみて探索方向斜め隣にパターンがあると
は、図18に示すように、パターン53からみて右方向
斜め隣の位置にパターン54a又はパターン54bが存
在していることを意味している。そして、探索の現在地
からみて探索方向斜め隣にパターン54a、54bがあ
ると判定された場合、ステップS63に進み、探索方向
斜め隣にあるパターン54a、54bを探索の現在地と
する。なお、探索方向斜め隣にあるパターン54a、5
4bが2つある場合はパターン54a、54bのどちら
か一方を探索の現在地とする。
みて探索方向斜め隣にパターン54a、54bがないと
判定された場合、ステップS60に進み、空白領域の長
さをカウントする変数Kがしきい値以下であるかどうか
を判定する。そして、空白領域の長さをカウントする変
数Kがしきい値以下である場合、ステップS64に進
み、探索の現在地からみて探索方向隣にありパターンを
構成しない画素を現在地とする。例えば、図16におい
て、一定の画素数以下の空白領域46に対してはパター
ンがあるとみなして探索を行う。
領域の長さをカウントする変数Kの値を1ドット増や
し、ステップS57に戻る。一方、ステップS60で空
白領域の長さをカウントする変数Kがしきい値以下でな
いと判定された場合、ステップS66に進み、探索方向
は右に設定されているかどうかを判定する。そして、探
索方向は右に設定されていない場合、処理を終了する。
ている場合、ステップS67に進み、探索方向を左に設
定する。そして、探索方向を右に設定して行った処理と
同様に、ステップS55〜ステップS65の処理を繰り
返す。ここで、探索方向を左に設定して処理を行う場
合、探索の現在地からみて探索方向隣にパターンがある
とは、図18に示すように、パターン55からみて左方
向隣の位置にパターン56が存在していることを意味し
ている。また、探索の現在地からみて探索方向斜め隣に
パターンがあるとは、図18に示すように、パターン5
7からみて左方向斜め隣の位置にパターン58a又はパ
ターン58bが存在していることを意味している。
のフローチャートの処理において、横直線検出部7で検
出されたパターンではなく縦直線検出部15で検出され
たパターンを対象とし、また、探索方向を左右から上下
に変更し、さらに、X座標をY座標に変更する以外は横
直線探索部8の動作と同様である。
の部分パターンの大きさに対応させて変化させることに
より、文字線分を枠とみなしてしまう可能性を低くする
ことができる。
所定の大きさのパターンがある一定の間隔で並んでいる
時、点線が存在するとし、この点線に対して上述した直
線と同様に矩形近似を行うものである。点線を検出した
後は実線、点線ともに、同じ直線として扱う。
部17の動作を示すフローチャートである。図19にお
いて、まず、ステップS71で、入力された画像の一部
を横方向又は縦方向に短冊状に切り出す。
で短冊状に切り出した範囲内で、ある一定の大きさの部
分パターンが存在するかどうかを判定する。そして、あ
る一定の大きさの部分パターンが存在しない場合、処理
を終了する。
の大きさの部分パターンが存在すると判定された場合、
ステップS73に進み、抽出した部分パターンを含み、
且つステップS71で用いた短冊と垂直な短冊状の画像
を入力画像から切り出す。
で切り出した短冊状の画像の内部に、ある一定の大きさ
の部分パターンが存在するかどうかを判定する。そし
て、ある一定の大きさの部分パターンが存在しない場
合、処理を終了する。
の大きさの部分パターンが存在すると判定された場合、
ステップS75に進み、上記部分パターンを抽出し、該
部分パターンが一定の間隔で並んでいるかどうか判定す
る。そして、該部分パターンが一定の間隔で並んでいな
い場合、処理を終了する。
した部分パターンが一定の間隔で並んでいると判定され
た場合、ステップS76に進み、部分パターンの存在す
る範囲を矩形で囲む。
隔分の長さだけステップS76で得られた矩形の両端を
延ばす。そして、ステップS78で、該矩形で囲まれた
範囲を点線の存在範囲とする。
は、横直線抽出部3及び縦直線抽出部11で抽出された
直線の再統合を行う。すなわち、横直線統合部10及び
縦直線統合部18は、横直線探索部8及び縦直線探索部
16による探索処理では吸収できないより大きなかすれ
の補正を行う。
ターン34から、図20(b)に示すように、横線61
〜66が横直線抽出部3により抽出される。ここで、横
線62と横線63との間のかすれ67の大きさが図17
で示したしきい値より大きい場合、横直線探索部8によ
る探索処理では吸収できないので、横線62と横線63
とに分離している。
収できないかすれ67を補正するため、横線の場合、同
じY座標上にあり、且つX方向の距離が所定値以下であ
るかどうかを調べる。
の条件を満たす場合、図20(c)に示すように、横線
62と横線63とを統合して横線72とする。この結
果、かすれ67を補正した横線71〜75を得る。
且つY方向の距離が所定値以下である直線の統合を行
う。なお、対象としている枠が不規則な枠である場合、
直線の長さや位置が様々であるため、極端に距離が離れ
た直線の統合を行わないようにする。
フローチャートである。図21において、まず、ステッ
プS81に示すように、横線分統合部6において統合さ
れた直線を2本ずつ抽出する。
ップS81で抽出された2本の直線のX方向の距離が所
定のしきい値以下であるかどうかを判定する。そして、
2本の直線のX方向の距離が所定のしきい値以下でない
場合、処理を終了する。
向の距離が所定のしきい値以下であると判定された場
合、ステップS83に進み、ステップS81で抽出され
た2本の直線のY方向の距離が所定のしきい値以下であ
るかどうかを判定する。そして、2本の直線のY方向の
距離が所定のしきい値以下でない場合、処理を終了す
る。
向の距離が所定のしきい値以下であると判定された場
合、ステップS84に進み、ステップS81で抽出され
た2本の直線を統合して1本に直線とみなす。
フローチャートである。図22において、まず、ステッ
プS91に示すように、横線分統合部14において統合
された直線を2本ずつ抽出する。
ップS91で抽出された2本の直線のY方向の距離が所
定のしきい値以下であるかどうかを判定する。そして、
2本の直線のY方向の距離が所定のしきい値以下でない
場合、処理を終了する。
向の距離が所定のしきい値以下であると判定された場
合、ステップS93に進み、ステップS91で抽出され
た2本の直線のX方向の距離が所定のしきい値以下であ
るかどうかを判定する。そして、2本の直線のX方向の
距離が所定のしきい値以下でない場合、処理を終了す
る。
向の距離が所定のしきい値以下であると判定された場
合、ステップS94に進み、ステップS91で抽出され
た2本の直線を統合して1本に直線とみなす。
出部11で抽出された直線を、横直線統合部3及び縦直
線統合部11で再統合を行うことにより、長いかすれの
ある直線の抽出を行うことができる。
基づいて、枠を検出する処理を行う。この枠検出処理
は、上述の処理により抽出された縦横の直線の中から、
枠を構成する直線を決定し、上下左右の四辺を枠で囲ま
れた矩形範囲を左上から順番に抽出することで、枠の構
造を検出するものである。
合、まず、該表80を、図23(b)に示すように、大
枠の複数の行に分割する。次に、図23(c)に示すよ
うに、該行をさらに小さい矩形に分割する。尚、この段
階で検出された矩形がさらに細い矩形に分割されている
状態を「入れ子」と呼び、この「入れ子」状態にある矩
形については新たな表とみなして、図23(d)に示す
ように該矩形をさらに小さな矩形に分割する。
中から、各行の横枠を構成している2本の横線の組を決
定する処理を実行するものである。この処理は以下のよ
うな規則に従って行われる。
(横線)の中から、上から順番に横線を2本抽出し、こ
れらを2本の横線の組の候補とする。 2)上記抽出した2本の横線が、長さが同じ、又は下の
直線の方が長ければ、その2本を、横線の組とする。こ
のとき、2本の横線の長さが異なる場合、長い方の横線
を再使用可とする。
線の方が短かければ、さらにその下の横線を横枠の候補
とし、これらの横線の長さを比較する。また、下の横線
の方が右方向又は左方向に短かければ、さらにその下の
直線を組の候補とし、これらの横線の長さを比較する。
る直線が下部に無いことが分かれば、この場合に限り、
上記上の横線とその下の横線とを組みとする。 5)一番下の横線の処理後、上部にまだ未処理の直線が
ある場合は、再び上から順に未処理の横線と再使用可の
横線とを用いて、上記1)〜4)の処理を行い、2本の
横線の組を作る。
本の横線は、以後の処理において、行などの矩形枠を構
成する横枠の組(2本組の横枠)として取り扱われる。
図24、25は、横枠決定部19における上記横線の組
みを決定する処理を示すフローチャートである。
で、横直線抽出部3で検出された横直線の中から、最上
部の2本を取り出す。次に、ステップS102で、上記
取り出した2本の横直線のうち、上側の横直線をupl
ine、下側の横直線をbllineとする。
neと直線bllineとに縦方向の重なりがあるかど
うかを判定する。そして、直線uplineと直線bl
lineとに縦方向の重なりがない場合、ステップS1
04に進み、直線bllineの下の直線を新たにbl
lineとし、この処理を直線uplineと直線bl
lineとに縦方向の重なりがあるようになるまで続け
る。
plineと直線bllineとに縦方向の重なりがあ
る場合、ステップS105に進み、直線uplineと
直線bllineとの長さが同じであるか又は直線up
lineより直線bllineの方が長いかどうかを判
定する。そして、上記条件を満足する直線upline
と直線bllineが存在する場合、ステップS108
に進み、上記直線uplineと上記直線blline
を2本の横線の組(2本組の横枠)とする。
plineと直線bllineとの長さが異なってお
り、且つ、直線uplineより直線bllineの方
が短い場合、ステップS106に進み、直線bllin
eより下方に直線uplineと長さが同じであるか又
は直線uplineより長い直線blline2が存在
するかどうかを判定する。そして、上記条件を満足する
直線bllineと直線uplineが存在する場合、
ステップS107に進み、直線bllineを直線bl
line2に変更してステップS108に進む。
neとの長さが同じであるとは、図26(a)のような
状態を示し、直線uplineより直線bllineの
方が短いとは、図26(b)のような状態を示し、直線
uplineより直線bllineの方が長いとは、図
26(c)のような状態を示す。
llineより下方に直線uplineと長さが同じで
あるか又は直線uplineより長い直線blline
2が存在しない場合、ステップS108に進み、直線u
plineと直線bllineとを2本組の横枠とす
る。
決定処理と入れ子処理を行う。次に、ステップS110
で、ステップS108で2本組の横枠とした直線upl
ineと直線bllineの長さが異なるかどうかを判
定する。そして、直線uplineと直線blline
の長さが異なる場合、ステップS111に進み、右方向
へ長い直線又は左方向に長い直線を再利用可として、ス
テップS112に進む。
に長い直線とは、図26(d)に示す直線bllin
e、図26(e)に示す直線uplineと直線bll
ineである。
plineと直線bllineとの長さが同じであると
判定された場合、ステップS112に進み、直線bll
ineより下方に直線が存在するかどうかを判定する。
そして、直線bllineより下方に直線が存在する場
合、ステップS113に進み、直線bllineとその
下の直線を抽出し、ステップS102に戻る。
llineより下方に直線が存在しないと判定された場
合、ステップS114に進み、再使用可の直線を除い
て、処理済の直線を処理対象からはずす。
理の直線が存在するかどうかを判定する。そして、未処
理の直線が存在しない場合、処理を終了する、一方、ス
テップS115において、未処理の直線が存在すると判
定された場合、ステップS116に進み、最上部から直
線を2本抽出し、ステップS102に戻る。
縦枠を決定する処理を行うもので、縦直線抽出部11で
抽出された縦線のうち、横枠決定部19で横枠の2本組
として決定された2本の横線に上下とも達しているもの
を縦枠と決定する。この縦枠の決定は、図23(b)に
示すように、横枠決定部19で横枠の2本組として決定
された横線の間隔、すなわち、一行ごとに処理を行う。
い方の直線を一時的に長い方の横線と同じ長さであると
仮定して処理を行う。矩形表現部24は、図23(c)
に示すように、横枠決定部19で決定された2本組の横
枠と縦枠決定部20で決定された該2本組の横枠の上下
に達している2本の縦枠とで囲まれた矩形を抽出するも
のである。
示すように、矩形表現部22で抽出された矩形の中か
ら、その内部にさらに矩形を含む入れ子構造の矩形を検
出し、この矩形をさらに小さな矩形に分割する。この入
れ子構造の矩形の検出は、矩形表現部24で抽出された
矩形について、その内部に、該矩形の左右の2辺に達し
ている横線が存在するか否かを調べることにより行う。
例えば、図27(a)に示すように、抽出された矩形8
1が、その内部に左右の2辺82、83に達している横
線84が存在する場合、この矩形81を入れ子構造の矩
形とみなす。
し矩形表現を行うことにより、入れ子構造内の矩形85
〜87を抽出する。また、図27(b)に示す矩形91
のように、矩形91の内部の横線92が存在し、且つ矩
形91の内部の横線92と矩形91の横枠94又は横枠
95との両方に達している縦線93が存在する場合、矩
形91の内部の一部の領域に存在する矩形96を入れ子
構造の矩形とみなす。
し矩形表現を行うことにより、入れ子構造内の矩形9
7、98を抽出する。図28は、入れ子構造処理部21
による入れ子処理を説明するフローチャートである。
示すように、ある注目矩形内にあり、ある一定以上の長
さを持つ横線を入れ子構造内の横枠とする。次に、ステ
ップS121に示すように、入れ子構造内の横枠が矩形
の左右の枠に達しているかどうか判定する。そして、入
れ子構造内の横枠が矩形の左右の枠に達している場合、
ステップS122に進み、注目矩形を新たに表とみな
す。
横枠が矩形の左右の枠に達していないと判定された場
合、ステップS123に進み、入れ子構造内の横枠と矩
形の上枠又は下枠との両方に達している縦線(A)があ
るかどうか判定する。そして、入れ子構造内の横枠と矩
形の上枠又は下枠との両方に達している縦線(A)がな
い場合、ステップS124に進み、次の矩形の処理を行
う。
横枠と矩形の上枠又は下枠との両方に達している縦線
(A)があると判定された場合、ステップS125に進
み、入れ子構造内の横枠と縦線(A)と矩形を構成する
辺とによって囲まれた矩形を新たに表とみなす。
テップS126で表とみなした範囲に対し、矩形内の横
枠及び縦枠を決定し矩形表現を行うことにより、入れ子
構造内の矩形を抽出する。
子構造処理部21によれば、矩形内に入れ子構造が存在
する場合のほか、矩形内の一部の領域に入れ子構造が存
在する場合においても、入れ子構造の枠を検出すること
ができ、様々な形状を有する帳票から文字や記号などを
正確に切り出すことができる。
囲のかすれ処理について説明する。入れ子構造を含む矩
形範囲は、全体の表の大きさと比較すると小さいので、
入れ子構造を含む矩形範囲の内部に対しては、吸収可能
なかすれの長さを他の罫線の吸収可能なかすれの長さと
比べて短くなるように設定する。このため、入れ子構造
を含む矩形範囲については、許容可能なかすれの大きさ
を設定しなおし、再度探索により直線とみなしてよいか
を確かめる処理を行う。
囲の直線において、一定の長さ以上のかすれを有する直
線を文字線分とみなして入れ子構造を含む矩形範囲の直
線候補から除くことにより、文字線分をかすれのある枠
線とみなして処理を行うことを防止できる。
験例を示す。図29は、この実験でサンプルとして用い
た帳票の原画像を示す図である。また、図30は、上記
帳票を下記に示す入力パターン条件の基で枠線抽出処理
を行ってた結果を示す図であり、図31は、図30の枠
100で囲んだ部分を拡大して表示した図である。
を行ったパターンに対し、矩形表現処理を行った結果を
示す図であり、図33は、図32の枠101で囲んだ部
分を拡大して表示した図である。
ン抽出装置によれば、不規則な構造を持ち、かすれが存
在している帳票であっても、該帳票から矩形枠を正確に
抽出することができる。
抽出装置を、図面を参照しながら詳細に説明する。本発
明の第1実施例によるパターン抽出装置は、不規則な構
造の枠と規則的な構造の枠の両方に適用できるものであ
るのに対し、本発明の第2実施例によるパターン抽出装
置は、規則的な構造の枠に適用するようにしたものであ
る。
抽出装置において、入れ子構造を構成する直線候補の検
出方法について説明する。規則的な構造の枠の場合、縦
横の直線を抽出した後、横直線の位置を調べる。そし
て、左右の端点のX座標が同一の横直線が所定の数以上
存在した場合、無条件に入れ子構造を構成する直線の候
補であるとみなす。
のX座標が同一で所定の数以上の横直線111〜116
及び横直線117〜121を、入れ子構造を構成する直
線の候補であるとみなす。そして、横直線111〜11
6及び横直線117〜121に対して横枠を決定する処
理を行い、長い方の横直線111〜116を表の横枠と
みなし、短い方の横直線117〜121を入れ子構造を
構成する直線とみなす。
抽出装置において、直線候補の生成方法について説明す
る。規則的な構造の枠の縦横の直線を抽出した後、横直
線の位置及び長さを調べる。そして、左右の端点のX座
標が同一で且つ長さが同じ横直線が所定の数以上存在し
た場合、その横直線のY座標方向での間隔を算出する。
ここで、隣接する第1の横直線と第2の横直線との間隔
dy2が、他の第3の横直線と第4の横直線との間隔d
yの整数倍である場合、第1の横直線と第2の横直線と
の間に間隔dyを有する第5の横直線を生成する。
のX座標が同一で長さが同じ横直線131〜136及び
左右の端点のX座標が同一で長さが同じ横直線137、
138、140、141を、直線の候補であるとみな
す。そして、所定の数以上の横直線137、138、1
40、141が間隔dyで規則的に並んでおり、間隔d
yの整数倍の間隔dy2を有する横直線138、140
が存在する場合、横直線138と横直線140との間に
間隔dyを有する横直線139を生成する。
さを有する所定の数以上の横直線が同一の間隔で並んで
おり、これらの横直線と異なる間隔を有する不規則な横
直線が存在する場合、この不規則な横直線を削除する。
長さを有する所定の数以上の横直線が同一の間隔で並ん
でおり、これらの横直線と同一の間隔を有し所定の長さ
以上であって長さが異なる横直線が存在する場合、この
長さが異なる横直線の長さを他の横直線と同一となるよ
うにする。
によるパターン抽出装置によれば、かすれにより直線が
消失したりした場合においても、枠を構成する直線を再
現することができ、枠の検出の精度を上げることができ
る。
かっており、縦横それぞれについて、同じ長さLを持つ
直線又は点線の候補がある一定の本数以上存在する場
合、所定の値以上の長さを持つ直線又は点線の長さを、
長さLになるように伸ばすことにより、規則的な構造を
有する表であると分かっている場合の枠の検出精度を上
げることができる。
かっており、縦横それぞれについて、同じ長さを持つ直
線又は点線の候補がある一定の本数以上存在し、且つそ
の直線又は点線が規則正しく並んでいる場合、それぞれ
の直線又は点線についてかすれ度合いを算出することな
しに枠の候補とみなすことにより、規則的な構造を有す
る表であると分かっている場合の枠の検出精度を上げる
ことができる。
かっており、縦横それぞれについて、同じ長さを持つ直
線又は点線の候補がある一定の本数以上存在し、且つそ
のほとんどの直線又は点線が規則正しく等間隔Aで並ん
でいる場合、間隔Aの整数倍の間隔Bの領域において、
直線又は点線が消えているとみなして直線又は点線の位
置を推定し、直線又は点線を生成することにより、枠を
検出する精度を上げることができる。
かっており、縦横それぞれについて、同じ長さを持つ直
線又は点線の候補がある一定の本数以上存在し、且つそ
のほとんどの直線又は点線が規則正しく等間隔Cで並ん
でいる場合において、間隔Cより小さい間隔Dを有する
直線又は点線について、隣り合う不規則な間隔を足し合
わせた結果、間隔Cと等しくなる場合、間隔Dを有する
直線又は点線は枠を構成しないとしてその直線又は点線
を消去することにより、枠を検出する精度を上げること
ができる。
よれば、第1の線分と第2の線分との間の空白をパター
ンがあるものとみなして、パターン領域を決定する枠を
抽出することにより、枠を構成する直線にかすれがある
場合においても、枠を構成する直線を正確に抽出するこ
とができ、パターン領域を正確に決定することができ
る。
以下の長さの空白を介して分離している直線を枠を構成
する直線として抽出することにより、枠を構成する直線
にかすれがある場合においても、枠を構成する直線を正
確に抽出することができ、かすれがあるパターンから矩
形枠を抽出することができる。
形枠内の一部の領域から第2の矩形枠を抽出する第2の
枠抽出手段を備えることにより、矩形枠の一部の領域中
にさらに小さな矩形枠が存在する表から、パターンの切
り出しを正確に行うことができる。
形枠内に一定以上の長さを有する横線が存在し、且つ前
記第1の矩形枠の上辺又は下辺と前記横線との両方に達
する縦線が存在する場合、第1の矩形枠から第2の矩形
枠を抽出することにより、矩形枠の一部の領域中に存在
するさらに小さな矩形枠を、文字線分と混同することな
く抽出できる。
より第1の部分パターンから分離している第2の部分パ
ターンを、枠を抽出するパターンの候補に付け加えるこ
とにより、かすれにより分離しているパターンから枠を
構成する直線を抽出することができる。
隔で並んでいる所定の大きさ以下の部分パターンを抽出
することにより、点線を含むパターンからパターン領域
を区切る枠を抽出することができる。
法を用いて、部分パターンを構成する複数の矩形線分を
検出することにより、周囲の行又は列の投影値を足し合
わせた投影値により矩形近似して直線を検出することが
でき、斜めに傾いた直線を正確に検出することができ
る。
画像のパターンの最も細い部分から、しきい値以下の長
さの空白領域にはパターンがあるものとみなして外側へ
探索することにより、しきい値以下の長さの空白により
分離している直線を抽出することができ、枠を構成する
直線にかすれがある場合においても、枠を構成する直線
を正確に抽出することができる。
するにもかかわらず分離している直線を抽出する場合、
空白をパターンがあるものとみなす際のしきい値を部分
パターンの大きさに対応させて変えることにより、枠を
構成するパターンと間違って文字線分を抽出することを
防止することができ、枠を構成する直線を正確に抽出す
ることができる。
傾きが所定の範囲を越える直線を枠の候補から除去する
ことにより、枠内に書かれた斜めの消し線を枠を構成す
る直線として抽出することを防止することができ、枠を
構成する直線を正確に抽出することができる。
の距離が所定の値以下の横線を統合するとともに、横方
向の距離が所定の値以下の縦線を統合することにより、
より長いかすれを有する直線を抽出することができ、入
力画像の画質が悪い場合においても、枠を構成する直線
を正確に抽出することができる。
介して分離している直線を含めて第1の矩形枠内に存在
する第2の矩形枠を抽出することにより、枠を構成する
直線がかすれにより分離している場合においても、矩形
枠の一部の領域中に存在するさらに小さな矩形枠を抽出
することができる。
い直線から構成される第1の矩形枠を抽出する場合、か
すれを許容するしきい値を大きく設定し、より短い直線
から構成される第2の矩形枠を抽出する場合、かすれを
許容するしきい値を小さく設定することにより、大きな
矩形枠を正確に抽出しながら、大きな矩形枠の領域中に
存在するより小さな矩形枠を、文字線分と混同すること
なく抽出できる。
及び横方向に等間隔で区切られたパターンの場合、所定
の値以上の長さを有する直線の長さを他の直線の長さと
同一にすることにより、枠を構成する直線の端の部分が
かすれにより消失しても、端の部分が消失した直線を枠
を構成する直線として正確に抽出することができ、かす
れがあるパターンから矩形枠を正確に抽出することがで
きる。
及び横方向に等間隔で区切られたパターンの場合、所定
の値以上の長さを有する直線及び点線の長さを他の直線
又は点線の長さと同一にすることにより、枠を構成する
直線及び点線の端の部分がかすれにより消失しても、端
の部分が消失した直線及び点線を枠を構成する直線又は
点線として正確に抽出することができ、かすれがあるパ
ターンから矩形枠を正確に抽出することができる。
及び横方向に等間隔で区切られたパターンの場合、同じ
長さを有する直線が一定の本数以上存在し、且つ等間隔
に並んでいる場合、この直線を矩形枠を構成する直線と
みなすことにより、枠を構成する直線のかすれの度合い
にかかわらず、枠を構成する直線を正確に抽出すること
ができ、かすれがあるパターンから矩形枠を正確に抽出
することができる。
及び横方向に等間隔で区切られたパターンの場合、同じ
長さを有する直線又は点線が一定の本数以上存在し、且
つ等間隔に並んでいる場合、この直線及び点線を矩形枠
を構成する直線及び点線とみなすことにより、枠を構成
する直線のかすれの度合いにかかわらず、枠を構成する
直線及び点線を正確に抽出することができ、かすれがあ
るパターンから矩形枠を正確に抽出することができる。
及び横方向に等間隔で区切られたパターンの場合、消失
した直線を等間隔で並ぶように再生することにより、枠
を構成する直線がかすれにより消失しても、消失した直
線を枠を構成する直線として正確に抽出することがで
き、かすれがあるパターンから矩形枠を正確に抽出する
ことができる。
及び横方向に等間隔で区切られたパターンの場合、消失
した直線及び点線を等間隔で並ぶように再生することに
より、枠を構成する直線又は点線がかすれにより消失し
ても、消失した直線及び点線を枠を構成する直線及び点
線として正確に抽出することができ、かすれがあるパタ
ーンから矩形枠を正確に抽出することができる。
及び横方向に等間隔で区切られたパターンの場合、等間
隔で並んだ直線の間に存在する直線を除去することによ
り、枠を構成しない直線を枠を構成する直線の候補から
除去することができ、枠を構成する直線のみを正確に抽
出することができるので、矩形枠を抽出する精度を上げ
ることができる。
及び横方向に等間隔で区切られたパターンの場合、等間
隔で並んだ直線又は点線の間に存在する直線及び点線を
除去することにより、枠を構成しない直線及び点線を枠
を構成する直線及び点線の候補から除去することがで
き、枠を構成する直線及び点線のみを正確に抽出するこ
とができるので、矩形枠を抽出する精度を上げることが
できる。
能構成を示すブロック図である。
概略構成を示すブロック図である。
連結パターン抽出処理を示す図である。
連結パターン抽出処理の動作を示すフローチャートであ
る。
ラベル付け替え処理を行うパターンの抽出方法を説明す
る図である。
マスク処理により横線分を抽出する処理を示す図であ
る。
マスク処理の動作を示すフローチャートである。
マスク処理を示す図である。
直線抽出処理における隣接投影法を説明する図である。
の直線抽出処理における隣接投影法の動作を示すフロー
チャートである。
の線分抽出処理を示す図である。
の線分検出処理の動作を示すフローチャートである。
の線分統合処理を説明する図である。
の線分統合処理の動作を示すフローチャートである。
の直線抽出処理を示す図である。
の直線探索処理を示す図である。
の横直線探索処理の動作を示すフローチャートである。
の横直線探索処理における検索方向を示す図である。
の点線抽出処理の動作を示すフローチャートである。
の横直線統合処理を説明する図である。
の横直線統合処理の動作を示すフローチャートである。
の縦直線統合処理の動作を示すフローチャートである。
の矩形表現処理を示す図である。
の横直線の組の決定処理の動作を示すフローチャートで
ある。
の横直線の組の決定処理の動作を示すフローチャートで
ある。
の横直線の組の決定処理における横直線の配置状態を示
す図である。
の入れ子構造の処理を説明する図である。
の入れ子構造における縦枠決定処理の動作を示すフロー
チャートである。
る原画像を示す図である。
る枠線抽出処理後の画像を示す図である。
る矩形表現処理後の画像を示す図である。
の入れ子構造における直線検出方法を示す図である。
の直線生成方法を示す図である。
す図である。
ロック図である。
示す図である。
Claims (21)
- 【請求項1】 同一直線上の第1の線分と第2の線分と
の間の空白の長さがしきい値以下である場合、前記第1
の線分と前記第2の線分との間にパターンがあるものと
みなして、パターン領域を決定する枠を抽出することを
特徴とするパターン領域切り出し方式。 - 【請求項2】 入力されたパターンから連結した部分パ
ターンを抽出する連結パターン抽出手段と、 前記連結パターン抽出手段により抽出された部分パター
ンの中から所定の長さ以上の第1の直線及びしきい値以
下の長さの空白を介して分離している第2の直線を抽出
する直線抽出手段と、 前記直線抽出手段により抽出された直線が、枠を構成す
る直線であるか否かを判断する判断手段と、 前記判断手段により得られた枠を構成する直線情報に基
づいて、矩形枠を抽出する枠抽出手段と、 前記枠抽出手段により抽出された矩形範囲に基づいて、
パターン領域を抽出するパターン切り出し手段とを備え
ることを特徴とするパターン抽出装置。 - 【請求項3】 入力されたパターンから連結した部分パ
ターンを抽出する連結パターン抽出手段と、 前記連結パターン抽出手段により抽出された部分パター
ンから直線を抽出する直線抽出手段と、 前記直線抽出手段により抽出された直線が、枠を構成す
る直線であるか否かを判断する判断手段と、 前記判断手段により得られた枠を構成する直線情報に基
づいて、第1の矩形枠を抽出する第1の枠抽出手段と、 前記第1の枠抽出手段によって抽出された第1の矩形枠
内の一部の領域から第2の矩形枠を抽出する第2の枠抽
出手段と、 前記第1の枠抽出手段及び前記第2の枠抽出手段により
抽出された矩形範囲に基づいて、パターン領域を抽出す
るパターン切り出し手段とを備えることを特徴とするパ
ターン抽出装置。 - 【請求項4】 前記第2の枠抽出手段は、前記第1の枠
抽出手段によって抽出された第1の矩形枠内に一定以上
の長さを有する横線が存在し、且つ前記第1の矩形枠の
上辺又は下辺と前記横線との両方に達する縦線が存在す
る場合、前記第1の矩形枠内から前記横線と前記縦線と
で構成される第2の矩形枠を抽出することを特徴とする
請求項3に記載のパターン抽出装置。 - 【請求項5】 入力されたパターンから連結した部分パ
ターンを抽出する連結パターン抽出手段と、 前記連結パターン抽出手段により抽出された部分パター
ンのうち、所定の大きさ以上の第1の部分パターンと第
1の部分パターンの外接矩形範囲内に存在する第2の部
分パターンとに共通のラベルを付すラベル付け替え手段
と、 前記第1の部分パターンと前記第2の部分パターンとか
ら、所定の長さ以上の第1の直線及びしきい値以下の長
さの空白を介して分離している第2の直線を抽出する直
線抽出手段と、 前記直線抽出手段により抽出された第1の直線及び第2
の直線のうち、横直線を上から順番に2本づつ組にして
横枠とする横枠決定手段と、 前記直線抽出手段により抽出された第1の直線及び第2
の直線のうち、上端及び下端が前記横枠に達している縦
直線を縦枠とする縦枠決定手段と、 前記横枠の2本と前記縦枠の2本とで囲まれた矩形範囲
を抽出する矩形表現手段と、 前記矩形表現手段により抽出された矩形範囲に基づい
て、パターン領域を抽出するパターン切り出し手段とを
備えることを特徴とするパターン抽出装置。 - 【請求項6】 入力されたパターンから連結した部分パ
ターンを抽出する連結パターン抽出手段と、 前記連結パターン抽出手段により抽出された部分パター
ンのうち、所定の大きさ以上の第1の部分パターンと第
1の部分パターンの外接矩形範囲内に存在する第2の部
分パターンとに共通のラベルを付すラベル付け替え手段
と、 前記第1の部分パターンと前記第2の部分パターンとか
ら、所定の長さ以上の第1の直線及びしきい値以下の長
さの空白を介して分離している第2の直線を抽出する直
線抽出手段と、 所定の間隔で並んでいる所定の大きさ以下の第3の部分
パターンからなる点線を検出する点線検出手段と、 前記直線抽出手段により抽出された第1の直線及び第2
の直線又は前記点線検出手段により抽出された点線のう
ち、横直線又は横点線を上から順番に2本づつ組にして
横枠とする横枠決定手段と、 前記直線抽出手段により抽出された第1の直線及び第2
の直線又は前記点線検出手段により抽出された点線のう
ち、上端及び下端が前記横枠に達している縦直線又は縦
点線を縦枠とする縦枠決定手段と、 前記横枠の2本と前記縦枠の2本とで囲まれた矩形範囲
を抽出する矩形表現手段と、 前記矩形表現手段により抽出された矩形範囲に基づい
て、パターン領域を抽出するパターン切り出し手段とを
備えることを特徴とするパターン抽出装置。 - 【請求項7】 前記直線抽出手段は、 ある行又は列の投影値に、周囲の行又は列の投影値を足
し合わせた値を、その行又は列の投影値とする隣接投影
法を用いて、前記部分パターンを構成する複数の矩形線
分を検出する線分検出手段と、 前記線分検出手段によって得られた複数の線分を統合
し、この統合された線分を矩形近似することにより直線
を検出する直線検出手段とを備えることを特徴とする請
求項2〜6のいずれか1項に記載のパターン抽出装置。 - 【請求項8】 前記直線抽出手段は、 前記直線検出手段により検出された直線の原画像のパタ
ーンの最も細い部分から、しきい値以下の長さの空白は
パターンがあるものとみなして外側へ探索することによ
り前記パターンの両端を検出し、この検出位置を直線の
両端の位置として設定する直線探索手段をさらに備える
ことを特徴とする請求項7に記載のパターン抽出装置。 - 【請求項9】 前記直線抽出手段は、前記しきい値を部
分パターンの大きさに対応させて変えることを特徴とす
る請求項8に記載のパターン抽出装置。 - 【請求項10】 前記直線抽出手段は、 前記直線検出手段により検出された直線の傾きを検出す
る傾き検出手段と、 前記直線の傾きが所定の範囲を越える直線を枠の候補か
ら除去する除去手段とをさらに備えることを特徴とする
請求項8に記載のパターン抽出装置。 - 【請求項11】 前記直線検出手段により検出された直
線のうち、縦方向の距離が所定の値以下の横線を統合す
るとともに、横方向の距離が所定の値以下の縦線を統合
する直線統合手段をさらに備えることを特徴とする請求
項2〜10のいずれか1項に記載のパターン抽出装置。 - 【請求項12】 入力されたパターンから連結した部分
パターンを抽出する連結パターン抽出手段と、 前記連結パターン抽出手段により抽出された部分パター
ンから所定の長さ以上の第1の直線及びしきい値以下の
長さの空白を介して分離している第2の直線を抽出する
直線抽出手段と、 前記直線抽出手段により抽出された直線が、枠を構成す
る直線であるか否かを判断する判断手段と、 前記判断手段により得られた枠を構成する直線情報に基
づいて、第1の矩形枠を抽出する第1の枠抽出手段と、 前記第1の枠抽出手段によって抽出された第1の矩形枠
内に所定の長さ以上の横線が存在する場合、前記横線を
枠として有する第2の矩形枠を抽出する第2の枠抽出手
段と、 前記第1の枠抽出手段及び前記第2の枠抽出手段により
抽出された矩形範囲に基づいて、パターン領域を抽出す
るパターン切り出し手段とを備えることを特徴とするパ
ターン抽出装置。 - 【請求項13】 入力されたパターンから連結した部分
パターンを抽出する連結パターン抽出手段と、 前記連結パターン抽出手段により抽出された部分パター
ンから所定の長さ以上の第1の直線、第1のしきい値以
下の長さの空白を介して分離している第2の直線及び前
記第1のしきい値より小さい第2のしきい値以下の長さ
の空白を介して分離している第3の直線を抽出する直線
抽出手段と、 前記直線抽出手段により抽出された直線が、枠を構成す
る直線であるか否かを判断する判断手段と、 前記判断手段により得られた枠を構成する第1の直線、
第2の直線及び第3の直線に基づいて、第1の矩形枠を
抽出する第1の枠抽出手段と、 前記第1の枠抽出手段によって抽出された第1の矩形枠
内から、前記第1の直線及び第3の直線に基づいて、第
2の矩形枠を抽出する第2の枠抽出手段と、 前記第1の枠抽出手段及び前記第2の枠抽出手段により
抽出された矩形範囲に基づいて、パターン領域を抽出す
るパターン切り出し手段とを備えることを特徴とするパ
ターン抽出装置。 - 【請求項14】 縦方向及び横方向に等間隔で区切られ
たパターンから、連結した部分パターンを抽出する連結
パターン抽出手段と、 前記連結パターン抽出手段により抽出された部分パター
ンの中から所定の長さ以上の第1の直線及びしきい値以
下の長さの空白を介して分離している第2の直線を抽出
する直線抽出手段と、 前記直線抽出手段により抽出された第1の直線及び第2
の直線のうち、同じ長さを有する第3の直線が一定の本
数以上存在する場合、所定の値以上の長さを有する第4
の直線の長さを前記第3の直線の長さと同一にする直線
補正手段と、 前記直線抽出手段及び前記直線補正手段より得られた直
線情報に基づいて、矩形枠を抽出する枠抽出手段と、 前記枠抽出手段により抽出された矩形範囲に基づいて、
パターン領域を抽出するパターン切り出し手段とを備え
ることを特徴とするパターン抽出装置。 - 【請求項15】 縦方向及び横方向に等間隔で区切られ
たパターンから、連結した部分パターンを抽出する連結
パターン抽出手段と、 前記連結パターン抽出手段により抽出された部分パター
ンの中から所定の長さ以上の第1の直線及びしきい値以
下の長さの空白を介して分離している第2の直線を抽出
する直線抽出手段と、 所定の間隔で並んでいる所定の大きさ以下の部分パター
ンからなる第1の点線を検出する点線抽出手段と、 前記直線抽出手段により抽出された第1の直線及び第2
の直線のうち、同じ長さを有する第3の直線が一定の本
数以上存在する場合、所定の値以上の長さを有する第4
の直線の長さを前記第3の直線の長さと同一にする直線
補正手段と、 前記点線抽出手段により抽出された第1の点線のうち、
同じ長さを有する第2の点線が一定の本数以上存在する
場合、所定の値以上の長さを有する第3の点線の長さを
前記第2の点線の長さと同一にする点線補正手段と、 前記直線抽出手段及び前記直線補正手段より得られた直
線情報と前記点線抽出手段及び前記点線補正手段より得
られた点線情報とに基づいて、矩形枠を抽出する枠抽出
手段と、 前記枠抽出手段により抽出された矩形範囲に基づいて、
パターン領域を抽出するパターン切り出し手段とを備え
ることを特徴とするパターン抽出装置。 - 【請求項16】 縦方向及び横方向に等間隔で区切られ
たパターンから、連結した部分パターンを抽出する連結
パターン抽出手段と、 前記連結パターン抽出手段により抽出された部分パター
ンの中から所定の長さ以上の第1の直線及びしきい値以
下の長さの空白を介して分離している第2の直線を抽出
する直線抽出手段と、 前記直線抽出手段により抽出された第1の直線及び第2
の直線のうち、同じ長さを有する第3の直線が一定の本
数以上存在し、且つ等間隔に並んでいる場合、前記第3
の直線を矩形枠を構成する直線とみなす判断手段と、 前記判断手段により得られた直線情報に基づいて、矩形
枠を抽出する枠抽出手段と、 前記枠抽出手段により抽出された矩形範囲に基づいて、
パターン領域を抽出するパターン切り出し手段とを備え
ることを特徴とするパターン抽出装置。 - 【請求項17】 縦方向及び横方向に等間隔で区切られ
たパターンから、連結した部分パターンを抽出する連結
パターン抽出手段と、 前記連結パターン抽出手段により抽出された部分パター
ンの中から所定の長さ以上の第1の直線及びしきい値以
下の長さの空白を介して分離している第2の直線を抽出
する直線抽出手段と、 所定の間隔で並んでいる所定の大きさ以下の部分パター
ンからなる第1の点線を検出する点線抽出手段と、 前記直線抽出手段により抽出された第1の直線及び第2
の直線のうち、同じ長さを有する第3の直線が一定の本
数以上存在し、且つ等間隔に並んでいる場合、前記第3
の直線を矩形枠を構成する直線とみなす第1の判断手段
と、 前記点線抽出手段により抽出された第1の点線のうち、
同じ長さを有する第2の点線が一定の本数以上存在し、
且つ等間隔に並んでいる場合、前記第2の点線を矩形枠
を構成する点線とみなす第2の判断手段と、 前記第2の判断手段により得られた直線情報と前記第2
の判断手段により得られた点線情報とに基づいて、矩形
枠を抽出する枠抽出手段と、 前記枠抽出手段により抽出された矩形範囲に基づいて、
パターン領域を抽出するパターン切り出し手段とを備え
ることを特徴とするパターン抽出装置。 - 【請求項18】 縦方向及び横方向に等間隔で区切られ
たパターンから、連結した部分パターンを抽出する連結
パターン抽出手段と、 前記連結パターン抽出手段により抽出された部分パター
ンの中から所定の長さ以上の第1の直線及びしきい値以
下の長さの空白を介して分離している第2の直線を抽出
する直線抽出手段と、 前記直線抽出手段により抽出された第1の直線及び第2
の直線のうち、同じ長さを有し第1の間隔で並んでいる
第3の直線が一定の本数以上存在し、且つ前記第3の直
線と同じ長さを有し前記第1の間隔の整数倍の第2の間
隔を有する第4の直線が存在する場合、前記第2の間隔
内に前記第1の間隔で前記第3の直線と同じ長さを有す
る第5の直線を生成する直線生成手段と、 前記直線抽出手段及び前記直線生成手段より得られた直
線情報に基づいて、矩形枠を抽出する枠抽出手段と、 前記枠抽出手段により抽出された矩形範囲に基づいて、
パターン領域を抽出するパターン切り出し手段とを備え
ることを特徴とするパターン抽出装置。 - 【請求項19】 縦方向及び横方向に等間隔で区切られ
たパターンから、連結した部分パターンを抽出する連結
パターン抽出手段と、 前記連結パターン抽出手段により抽出された部分パター
ンの中から所定の長さ以上の第1の直線及びしきい値以
下の長さの空白を介して分離している第2の直線を抽出
する直線抽出手段と、 所定の間隔で並んでいる所定の大きさ以下の部分パター
ンからなる第1の点線を検出する点線抽出手段と、 前記直線抽出手段により抽出された第1の直線及び第2
の直線のうち、同じ長さを有し第1の間隔で並んでいる
第3の直線が一定の本数以上存在し、且つ前記第3の直
線と同じ長さを有し前記第1の間隔の整数倍の第2の間
隔を有する第4の直線が存在する場合、前記第2の間隔
内に前記第1の間隔で前記第3の直線と同じ長さを有す
る第5の直線を生成する直線生成手段と、 前記点線抽出手段により抽出された第1の点線のうち、
同じ長さを有し第3の間隔で並んでいる第2の点線が一
定の本数以上存在し、且つ前記第2の点線と同じ長さを
有し前記第3の間隔の整数倍の第4の間隔を有する第3
の点線が存在する場合、前記第4の間隔の領域に前記第
3の間隔で前記第2の点線と同じ長さを有する第4の点
線を生成する点線生成手段と、 前記直線抽出手段及び前記直線生成手段より得られた直
線情報と前記点線抽出手段及び前記点線生成手段より得
られた点線情報とに基づいて、矩形枠を抽出する枠抽出
手段と、 前記枠抽出手段により抽出された矩形範囲に
基づいて、パターン領域を抽出するパターン切り出し手
段とを備えることを特徴とするパターン抽出装置。 - 【請求項20】 縦方向及び横方向に等間隔で区切られ
たパターンから、連結した部分パターンを抽出する連結
パターン抽出手段と、 前記連結パターン抽出手段により抽出された部分パター
ンの中から所定の長さ以上の第1の直線及びしきい値以
下の長さの空白を介して分離している第2の直線を抽出
する直線抽出手段と、 前記直線抽出手段により抽出された第1の直線及び第2
の直線のうち、同じ長さを有し第1の間隔で並んでいる
第3の直線が一定の本数以上存在し、且つ前記第3の直
線と同じ長さを有する第4の直線が前記第1の間隔内に
存在する場合、前記第4の直線を枠の候補から除去する
直線除去手段と、 前記直線抽出手段及び前記直線除去手段より得られた直
線情報に基づいて、矩形枠を抽出する枠抽出手段と、 前記枠抽出手段により抽出された矩形範囲に基づいて、
パターン領域を抽出するパターン切り出し手段とを備え
ることを特徴とするパターン抽出装置。 - 【請求項21】 縦方向及び横方向に等間隔で区切られ
たパターンから、連結した部分パターンを抽出する連結
パターン抽出手段と、 前記連結パターン抽出手段により抽出された部分パター
ンの中から所定の長さ以上の第1の直線及びしきい値以
下の長さの空白を介して分離している第2の直線を抽出
する直線抽出手段と、 所定の間隔で並んでいる所定の大きさ以下の部分パター
ンからなる第1の点線を検出する点線抽出手段と、 前記直線抽出手段により抽出された第1の直線及び第2
の直線のうち、同じ長さを有し第1の間隔で並んでいる
第3の直線が一定の本数以上存在し、且つ前記第3の直
線と同じ長さを有する第4の直線が前記第1の間隔内に
存在する場合、前記第4の直線を枠の候補から除去する
直線除去手段と、 前記点線抽出手段により抽出された第1の点線のうち、
同じ長さを有し第2の間隔で並んでいる第2の点線が一
定の本数以上存在し、且つ前記第2の点線と同じ長さを
有する第3の点線が前記第2の間隔内に存在する場合、
前記第3の点線を枠の候補から除去する点線除去手段
と、 前記直線抽出手段及び前記直線除去手段より得られた直
線情報と前記点線抽出手段及び前記点線除去手段より得
られた点線情報とに基づいて、矩形枠を抽出する枠抽出
手段と、 前記枠抽出手段により抽出された矩形範囲に基づいて、
パターン領域を抽出するパターン切り出し手段とを備え
ることを特徴とするパターン抽出装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP28217195A JP3642615B2 (ja) | 1995-10-30 | 1995-10-30 | パターン領域切り出し方式及びパターン抽出装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP28217195A JP3642615B2 (ja) | 1995-10-30 | 1995-10-30 | パターン領域切り出し方式及びパターン抽出装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH09128480A true JPH09128480A (ja) | 1997-05-16 |
JP3642615B2 JP3642615B2 (ja) | 2005-04-27 |
Family
ID=17649023
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP28217195A Expired - Fee Related JP3642615B2 (ja) | 1995-10-30 | 1995-10-30 | パターン領域切り出し方式及びパターン抽出装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3642615B2 (ja) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8587817B2 (en) | 2011-03-28 | 2013-11-19 | Fuji Xerox Co., Ltd. | Image processing apparatus, image processing method, and computer readable medium storing program |
US8634094B2 (en) | 2011-03-28 | 2014-01-21 | Fuji Xerox Co., Ltd. | Image processing apparatus, image processing method and non-transitory computer readable medium storing program |
US8867050B2 (en) | 2011-07-12 | 2014-10-21 | Fuji Xerox Co., Ltd. | Image processing apparatus, non-transitory computer readable medium storing program and image processing method for restoring a single table from a plurality of pages |
JP2014215797A (ja) * | 2013-04-25 | 2014-11-17 | 京セラドキュメントソリューションズ株式会社 | 画像処理装置、罫線判定方法、及び罫線判定プログラム |
CN115048004A (zh) * | 2022-08-16 | 2022-09-13 | 浙江大华技术股份有限公司 | 标注方法及标注装置、电子设备和计算机可读存储介质 |
-
1995
- 1995-10-30 JP JP28217195A patent/JP3642615B2/ja not_active Expired - Fee Related
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8587817B2 (en) | 2011-03-28 | 2013-11-19 | Fuji Xerox Co., Ltd. | Image processing apparatus, image processing method, and computer readable medium storing program |
US8634094B2 (en) | 2011-03-28 | 2014-01-21 | Fuji Xerox Co., Ltd. | Image processing apparatus, image processing method and non-transitory computer readable medium storing program |
US8867050B2 (en) | 2011-07-12 | 2014-10-21 | Fuji Xerox Co., Ltd. | Image processing apparatus, non-transitory computer readable medium storing program and image processing method for restoring a single table from a plurality of pages |
JP2014215797A (ja) * | 2013-04-25 | 2014-11-17 | 京セラドキュメントソリューションズ株式会社 | 画像処理装置、罫線判定方法、及び罫線判定プログラム |
CN115048004A (zh) * | 2022-08-16 | 2022-09-13 | 浙江大华技术股份有限公司 | 标注方法及标注装置、电子设备和计算机可读存储介质 |
Also Published As
Publication number | Publication date |
---|---|
JP3642615B2 (ja) | 2005-04-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2951814B2 (ja) | 画像抽出方式 | |
US6226402B1 (en) | Ruled line extracting apparatus for extracting ruled line from normal document image and method thereof | |
JP3904840B2 (ja) | 多値画像から罫線を抽出する罫線抽出装置 | |
JPH07141463A (ja) | 2値画像内の機械印刷された金額の検出方法 | |
JPH0844819A (ja) | 画像処理方法および画像処理装置 | |
JP3411472B2 (ja) | パターン抽出装置 | |
JP3420864B2 (ja) | 枠抽出装置及び矩形抽出装置 | |
JPH09128480A (ja) | パターン領域切り出し方式及びパターン抽出装置 | |
EP1296283A2 (en) | Half-tone dot elimination method and system thereof | |
JPH04270485A (ja) | 印刷文字認識装置 | |
JP2917427B2 (ja) | 図面読取装置 | |
JP2001109887A (ja) | 領域抽出方法、宛名領域抽出方法、宛名領域抽出装置、及び画像処理装置 | |
JP3517077B2 (ja) | パターン抽出装置及びパターン領域の切り出し方法 | |
JP2003196592A (ja) | 画像処理プログラム及び画像処理装置 | |
JPH09305707A (ja) | 画像抽出方式 | |
JP3534997B2 (ja) | 罫線抽出装置および方法 | |
JP4040231B2 (ja) | 文字抽出方法及び装置並びに記憶媒体 | |
JP2003317107A (ja) | 罫線抽出方法及び装置 | |
JP2009272714A (ja) | 画像処理装置、画像処理方法、プログラム及びプログラムを記録した記録媒体 | |
JP2003271973A (ja) | 画像処理方法および画像処理プログラム | |
JP4580520B2 (ja) | 文字認識方法および文字認識装置 | |
JP3635552B2 (ja) | 文字パターン切り出し装置および文字パターン切り出しプログラムを記録した記録媒体 | |
JPH10232939A (ja) | 一般の文書画像から罫線を抽出する罫線抽出装置および方法 | |
JP2002262093A (ja) | 画像処理方法及び画像処理装置及び画像処理プログラム並びに記録媒体 | |
JPH08171609A (ja) | 文字列高速抽出装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20030902 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20041224 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20050125 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080204 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090204 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090204 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100204 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110204 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110204 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120204 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130204 Year of fee payment: 8 |
|
LAPS | Cancellation because of no payment of annual fees |