JPH06309498A - 画像抽出方式 - Google Patents
画像抽出方式Info
- Publication number
- JPH06309498A JPH06309498A JP5103257A JP10325793A JPH06309498A JP H06309498 A JPH06309498 A JP H06309498A JP 5103257 A JP5103257 A JP 5103257A JP 10325793 A JP10325793 A JP 10325793A JP H06309498 A JPH06309498 A JP H06309498A
- Authority
- JP
- Japan
- Prior art keywords
- frame
- straight line
- character
- pattern
- line
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T11/00—2D [Two Dimensional] image generation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/148—Segmentation of character regions
- G06V30/155—Removing patterns interfering with the pattern to be recognised, such as ruled lines or underlines
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Multimedia (AREA)
- Character Input (AREA)
- Image Analysis (AREA)
- Facsimile Image Signal Circuits (AREA)
Abstract
記号から枠、罫線等の直線部分を正確に抽出・分離し
て、文字、図形、記号を高品位で復元すること。 【構成】 線幅の太い直線抽出部2、線幅の細い直線抽
出部3、枠検出部4は、連結パターン抽出部1において
抽出されたパターンから枠を検出する。属性付加部5
は、部分パターンに、文字(図形、記号を含む)、枠、
もしくは、文字と枠の接触パターンの属性を付け、分離
手段6は接触したパターンから枠を分離する。交点算出
部7は文字と枠との交点を算出し、算出された交点は交
点対応づけ部8により交点間が対応づけられる。補完部
9は対応づけられた交点に基づき、枠内の文字の領域を
求めて、求めた領域を補完する。連結性確認部10は抽
出された文字のパターンに対して、パターンの連結性の
確認を行い、連結性が確認されたパターンは連結パター
ン統合部11で統合され、文字が抽出される。
Description
特にOCR等の手書き文字認識装置において文字枠、罫
線等に接触した文字、図形等を抽出するための画像抽出
方式に関する。
認識装置の需要が増加している。この様な手書き文字認
識装置において個々の文字の高い認識率を実現するため
には、認識の前段階である文字の切出し処理が正確に行
われることが重要である。
文字を書く位置を予め指定された文書がある。この様な
文書では、文字を書く位置を指定した枠等がドロップ・
アウト・カラーでなく、黒枠等の罫線と文字とが同じ色
や濃度で書かれている。従って、文字が指定した範囲内
にきれいに書かれていれば比較的高い認識率で自動認識
が可能であるが、手書き文字が少しでも指定範囲を越え
て指定範囲を示す枠又は罫線に接触したりはみだしたり
すると、認識率が著しく低下するという問題が生じてい
た。
に触れている文字、図形、記号等から文字、図形、記号
等だけを正確に抽出するための画像抽出方式に関するも
のである。つまり、本発明は、手書き用文字認識装置だ
けでなく、印刷文字認識装置や図面認識装置における文
字及び記号の切出し、画像中の罫線と物体、図形や文字
との接触部分の分離等のように、直線と広い意味での図
形が重なったパターンから図形だけを切り出す際に適用
することができる画像抽出方式に関する。
字だけを切り出す技術として、特開昭63‐25187
4号公報で提案されている如き接触文字の切出し方法
や、特開平3‐233787号公報で提案されている如
き文字画像抽出方式等が知られている。
示すブロック図である。同図中、文字切出し方式は、枠
と文字との接触検出手段181と、文字と文字枠との接
触範囲を決定する接触範囲決定手段183と、矩形によ
り文字と文字枠とが重なった部分を補完する補完手段1
84とからなる。接触検出手段181には、文字枠の位
置やサイズからなる枠位置データ182が供給される。
82を予め帳票データとして格納しておく。接触検出手
段181は、枠位置データ182に基づいて、入力画像
の黒画素が文字枠の位置に接触しているか否かを調べ
る。又、接触範囲決定手段183は、入力画像が文字枠
と接触している箇所を結ぶ領域を文字枠内の文字部分と
決定し、補完手段184は、接触範囲決定手段183に
より決定された領域を文字領域であるとして矩形で塗り
つぶすことにより、文字を切出していた。
式では、文字枠の位置や線幅が予めわかっていることが
前提条件である。このため、文字の切出しの精度は、文
字枠のわずかな傾きや凹凸の影響を受けやすい。即ち、
例えば文字枠の一部が所定の位置からはみ出している場
合、このはみ出した部分を文字と認識してしまい、この
部分が雑音として残存してしまった。又、文字と文字枠
部分との不要な連結が生じてしまい、切り出した文字の
品質が極端に悪くなることもあった。更に、文字枠の位
置や線幅の変動により、本来の文字部分の箇所が欠けて
しまうこともあった。
の判定方法は、文字線分の連続性及び連結性を考慮して
おらず、局所的な矩形領域で穴埋めを行う単純な方法な
ので、切り出した文字の品質劣化は著しいものであっ
た。
文字パターンの一例を示す図である。同図中、(a)は
文字線分191と文字枠192との接触部分を示し、
(b)は同図(a)より切り出した文字の一部を示す。
持っているという前提で、文字枠192から文字線分1
91を切り出した例を示している。同図(a)の文字枠
部分において、幅が2画素分である部分192aは文字
枠部分として文字を切り出す際に除去されるが、幅が
「かすれ」等により2画素分の幅より狭い部分192b
は文字枠部分として除去されない。このため、同図
(a)から切り出された文字線分には、「かすれ」等に
より文字枠の幅が2画素分より狭い文字枠部分が文字の
一部として残り、同図(b)に示すように品質の悪い文
字線分が切り出されてしまう。
た文字の例を示す図である。上述の如く、従来方式では
文字線分の連続性及び連結性、文字の線幅、文字のサイ
ズ等を考慮していないため、同図(a)に示すように枠
を文字の一部として切り出したり、同図(b)に示すよ
うに枠が2文字に接触している場合に枠で連結された2
文字を1文字として切り出したり、同図(c)に示すよ
うに文字に付いた汚れ等を文字の一部として切り出した
りしてしまい、切り出した文字の品質低下が著しかっ
た。
るためになされたものであって、枠、罫線等の直線部分
に触れている文字、図形、記号等から枠、罫線等の直線
部分を正確に抽出及び分離して、文字、図形、記号等を
正確に切り出すことにより、枠、罫線等の直線部分に接
触した文字、図形、記号等を高品位で復元することがで
き、これらの認識率を著しく向上させることができる画
像抽出方式を提供することを目的とする。
記載の、枠もしくは罫線等の直線部分と文字、図形もし
くは記号から構成される画像から、文字、図形、記号を
抽出する画像抽出方式であって、枠もしくは罫線等の直
線部分と文字、図形もしくは記号とから構成される画像
から画素と画素が繋がっている部分パターンを抽出する
連結パターン抽出手段1と、該連結パターン抽出手段1
により抽出された部分パターンから、枠もしくは罫線等
の直線部分を抽出する直線抽出手段2,3,4と、該直
線抽出手段2,3,4,41,42,43の抽出結果に
基づき、上記部分パターンを、文字、図形もしくは罫線
等の直線部分だけのパターンと、文字、図形もしくは記
号と枠もしくは罫線等の直線部分が接触したパターンと
に分類する属性付加手段5と、文字、図形もしくは記号
と枠もしくは罫線等の直線部分が接触したパターンから
枠もしくは罫線等の直線部分を分離する分離手段6とを
有する画像抽出方式によって達成される。
矩形が分離した枠と文字、図形もしくは記号とから構成
される画像から、枠を抽出する画像抽出方式において、
画像を構成するパターンから画素と画素が繋がっている
部分パターンを抽出する連結パターン抽出手段21と、
抽出された各部分パターン毎に垂直方向と水平方向の投
影を求める手段22aと、部分パターンを矩形で近似
し、垂直方向の投影値と近似された矩形の垂直方向の長
さと、水平方向の投影値と近似された矩形の水平方向の
長さの夫々の比を求め、その比より枠を構成する直線の
候補を求める手段22bと、上記直線の候補間の距離を
算出し、枠を構成する最外郭の直線を抽出すると共に、
上記最外郭の直線に隣接する直線の候補を求め、枠の各
辺の線幅を算出する手段22c,22eと、各辺の最外
郭の直線の位置と、その線幅より枠を分離する手段22
fとを有する画像抽出方式によっても達成される。
各矩形が分離した枠と文字、図形もしくは記号とから構
成される画像から、枠を抽出する画像抽出方式におい
て、画像を構成するパターンから画素と画素が繋がって
いる部分パターンを抽出する連結パターン抽出手段21
と、部分パターンを矩形で近似し、近似された矩形を構
成する直線の両端、及び、中点等の複数の点から矩形内
部に垂線を下ろして部分パターンと接触した位置を開始
点として抽出し、抽出された開始点より、左右もしくは
上下に部分パターンに沿って探索する手段22a,22
b,22c,22dと、探索によって得られた直線の長
さと、上記近似矩形の各辺の長さの比を算出し、その比
より枠を構成する直線の候補を求める手段22eと、上
記直線の候補間の距離を算出し、枠を構成する最外郭の
直線を抽出すると共に、上記最外郭の直線に隣接する直
線の候補を求め、枠の各辺の線幅を算出する手段22d
と、各辺の最外郭の直線の位置と、その線幅より枠を分
離する手段22fとを有する画像抽出方式によっても達
成される。
各矩形が分離した枠と文字、図形もしくは記号とから構
成される画像から、枠を抽出する画像抽出方式におい
て、画像を構成するパターンから画素と画素が繋がって
いる部分パターンを抽出する連結パターン抽出手段21
と、該連結パターン抽出手段21により抽出された部分
パターンから枠を抽出する枠抽出手段2,3,4と、該
枠抽出手段2,3,4の抽出結果に基づき、上記部分パ
ターンを、文字、図形もしくは記号だけからなるパター
ンと、枠だけのパターンと、文字、図形もしくは記号と
枠が接触したパターンとに分類する属性付加手段5と、
抽出された枠のサイズ分だけ、左右、もしくは、上下の
範囲内に存在する部分パターンを抽出し、抽出した全て
の部分パターンが該属性付加手段5において、文字、図
形もしくは記号だけからなるパターンと判定されている
場合に、上記抽出された枠を文字、図形もしくは記号だ
けからなるパターンと判定し直す手段とを有する画像抽
出方式によっても達成される。
くは罫線等の直線部分と文字、図形もしくは記号とから
構成される画像から、傾きを持ったり、雑音を含んだ枠
もしくは罫線等の直線部分を抽出する画像抽出方式にお
いて、開始点の座標から傾きを考慮した垂直もしくは水
平区間を定め、その区間内で4連結或は8連結で繋がれ
たパターンを水平もしくは垂直に追跡して追跡できたパ
ターンの連続画素数を直線の長さとして換算する手段2
2dと、追跡してできたパターンをその連続画素数分の
長さを持つ直線部分として抽出する手段22fとを有す
る画像抽出方式によっても達成される。
ずつ枠で仕切られているブロック枠と、文字、図形もし
くは記号とから構成される画像から画素と画素が繋がっ
ている部分パターンを抽出する連結パターン抽出手段4
0と、該連結パターン抽出手段40により抽出された部
分パターンから直線を検出する直線抽出手段41,42
と、該直線抽出手段41,42により検出された直線か
ら枠を構成する直線を検出する枠検出手段43と、該枠
検出手段43により検出された直線を部分パターンから
分離することにより文字、図形もしくは記号を切り出す
枠分離手段44とを有し、該枠検出手段43は、部分パ
ターン中の直線がその直線と垂直、かつ、部分パターン
の中で最外郭である直線に達しているか否かによりその
直線が枠を構成する直線の候補であるか否かを判断する
第1の手段と、該第1の手段により得られた枠を構成す
る直線の候補同士の間隔に応じて枠を構成する直線を決
定する第2の手段とを備えた画像抽出方式によっても達
成される。
等の直線部分と文字、図形もしくは記号とから構成され
る画像から、枠もしくは罫線等の直線部分を確実に除去
することができ、高品質の文字、図形もしくは記号を抽
出することができる。このため、文字認識装置等におい
て、文字、図形、記号の認識率を著しく向上させること
ができる。
い線幅の太い枠を高速に、かつ、正確に抽出できる。
又、枠に接触した文字、図形もしくは記号から、それら
の一部を削り取ることなく、枠だけを正確に分離するこ
とができ、文字、図形もしくは記号を高品位に復元する
ことができる。
い枠を高速に、かつ、正確に抽出できる。又、枠に接触
した文字、図形もしくは記号から、それらの一部を削り
取ることなく、枠だけを正確に分離することができ、文
字、図形もしくは記号を高品位に復元することができ
る。
という漢字のように枠に相当する矩形部分を持つ文字の
一部を誤って枠として抽出することがなく、枠を安定し
て抽出することができる。
線をも確実に抽出することが可能となる。
ロック枠であっても、文字枠を確実に、かつ、正確に抽
出することができる。
施例を示す図である。同図中、連結パターン抽出部1
は、枠もしくは罫線等の直線部分と文字、図形もしくは
記号とから構成される画像から画素と画素が繋がってい
る部分パターンを抽出する。線幅の太い直線抽出部2
は、連結パターン抽出部1において抽出された部分パタ
ーンの投影を求めることにより部分パターン毎に連結パ
ターンのサイズの縦、横の長さに相当する線幅の太い
枠、罫線等の直線を抽出する。線幅の細い直線抽出部3
は、線幅の太い直線抽出部2で抽出されなかった枠、罫
線等の直線を抽出する。枠抽出部4は、抽出された複数
の直線から枠を構成する4辺を抽出する。つまり、枠抽
出部4は、線幅の太い直線抽出部2或は線幅の細い直線
抽出部3で抽出された直線のうち、部分パターンの最外
郭の直線を求めることにより枠を検出する。連結パター
ン属性付加部5は、連結パターンに枠、罫線等の直線が
存在するかどうかを調べ、存在しなかったら文字、図形
もしくは記号又はその一部から構成されるパターン
(ハ)の属性を付加する。又、連結パターン属性付加部
5は、枠、罫線等の直線分離後、文字、図形もしくは記
号又はその一部の部分パターンが存在するか否かに応じ
て、枠、罫線等の直線パターン(ロ)の属性、枠、罫線
等の直線に接触した文字、図形もしくは記号又はその一
部のパターン(イ)の属性を付加する。
し、それに従って連結パターンから枠、罫線等の直線を
分離する。交点算出部7は、文字、図形もしくは記号と
枠、罫線等の直線が接する交点を算出する。交点対応付
け部8は、文字、図形もしくは記号を構成する線分間の
距離、方向に基づく線分の連続性の条件等により交点間
を対応付ける。補完部9は、交点対応付け部8において
対応付けられた交点間を接続することにより、枠、罫線
等の直線内の文字、図形もしくは記号の領域を補完す
る。連結性確認部10は、補完部9において得られたパ
ターンが元々連結していたという情報を逆利用してパタ
ーンの連結性を確認する。
場合には、交点対応付け部8の処理に戻り、交点の対応
付けの条件を拡張して対応付けを行う。そして、対応付
けられた交点について、補完部9で補完を行って、連結
性確認部10で再度連結性の確認を行う。連結パターン
統合部11は、文字、図形もしくは記号又はその一部か
ら構成されるパターン(ハ)の統合を行って、文字、図
形もしくは記号を抽出すると共に、補完部9において補
完された文字、図形もしくは記号のパターンと上記パタ
ーンを統合したときのサイズを考慮して両者を統合す
る。
と文字、図形もしくは記号から構成される画像から、枠
もしくは罫線等の直線を確実に除去し、除去した部分を
正確に補完することにより、高品質の文字、図形もしく
は記号を抽出することができる。このため、文字認識装
置等において、文字、図形、記号等の認識率を著しく向
上させることができる。
施例について、図2及び図3と共に説明する。図2及び
図3は、画像抽出方式の第2実施例を示すブロック図で
ある。本実施例では、本発明が黒枠の帳票から文字を切
り出す処理に適用されている。つまり、本実施例では、
1文字枠のサイズや位置がわからない矩形で分離した文
字枠が複数個あり、その文字枠に接触或はその文字枠か
らはみ出して手書き文字が書かれた場合に、文字及び文
字枠のパターンから文字部分だけを一文字、一文字切り
出す。
連結パターン抽出部21、直線/枠抽出部22、連結パ
ターン属性付加部23、枠分離部24、文字/枠交点算
出部25、図3に示す交点対応付け部31、枠内文字補
完部32、連結性確認部33及び連結パターン統合部3
4からなる。
は、前処理を施された入力パターン信号から8連結で繋
がっているパターンをラベリングにより抽出するラベリ
ング部21aを有する。「8連結」のパターンとは、
縦、横、斜めの8方向のいずれかで繋がっているパター
ンを言う。上記ラベリングには、一般的な手法を用いる
ことができる。本実施例では、ラベリング部21aで得
られる部分パターンは、文字が接触していない枠、枠に
接触していない文字或は文字の一部、又は枠に接触して
いる文字のいずれかである。これらの部分パターンを判
別して枠に接触している文字だけに注目するために、枠
を抽出する。又、ラベリングで得られた部分パターンの
サイズが後述する処理で必要となるので、部分パターン
を矩形に近似して得られる矩形の角の座標をラベリング
の処理中に算出しておく。
枠及び線幅の細い直線/枠を抽出する。図2に示す如
く、直線/枠抽出部22は、投影部22a、直線検出部
22b、4辺検出部22c、追跡部22d、4辺検出部
22e及び枠抽出部22fを有する。
により抽出された部分パターンを水平方向及び垂直方向
に投影する。直線検出部22bは、投影部22aで得た
水平方向の投影及び垂直方向の投影から水平線及び垂直
線を検出する。4辺検出部22cは、直線検出部22b
により検出された直線からなる矩形の4辺を検出する。
追跡部22dは、直線検出部22b及び4辺検出部22
cで検出できなかった線幅の細い直線を求めるため、後
述するnランレングス手法により線を追跡する。4辺検
出部22eは、追跡部22dにより求めた線幅の細い直
線からなる矩形より4辺を検出する。枠抽出部22f
は、4辺検出部22c,22eで求めた矩形より枠を抽
出する。
す如く、連結パターン抽出部21により抽出された連結
パターンについて、直線/枠抽出部22の抽出結果に基
づいて、「枠」、「文字パターン又はその一部」及び
「枠と文字パターン又はその一部との接触パターン」の
属性を付加する属性付加部23aを有する。
パターン属性付加部23で枠或は文字と枠との接触パタ
ーンとして属性が付与された連結パターンから枠を分離
する。枠分離部24は、枠部分の辺の幅を算出する辺幅
算出部24a、枠を除去する枠除去部24b、枠を除去
したパターンについて再びラベリングを施し、面積の小
さいパターンを雑音として除去する枠雑音除去部24c
及び属性付加部24dを有する。属性付加部24dは、
連結パターン属性付加部23において属性が付与されな
かったパターンに対して、枠を除去しても残るパターン
には接触文字パターンの属性を付加し、枠を除去したら
何も残らないパターンには枠だけの属性を付加する。
く、接触文字パターンについて枠と文字との交点を算出
する算出部25aを有する。
は、文字枠を除去したことにより分離した文字パターン
について、文字と枠が接する交点を求め、文字線分間の
距離、文字線分の連続性等の条件により上記交点間を対
応付ける。交点対応付け部31は、順序対応部31a、
線幅算出部31b、距離対応部31c、連続性対応部3
1d、再対応部31e及びサイズ確認部31fを有す
る。順序対応部31aは、文字枠の外輪郭と内輪郭の交
点数が同じ場合に一対一の対応付けとして交点を順序通
りに対応付ける。線幅算出部31bは、一対一に対応付
けた線分に注目して、一つの文字線分の外輪郭と内輪郭
の夫々の交点間の距離に基づき文字線分の線幅を算出す
る。距離対応部31cは、外輪郭の交点数と内輪郭の交
点数とが異なる場合に、交点が一対多で対応するとして
交点間を距離に基づき対応付ける。連続性対応部31d
は、文字線分の連続性の条件に基づき交点間の対応をと
る。再対応部31eは、後述する連結性確認部33で連
結性が確認できなかった文字パターンについて再対応付
けを行う。サイズ確認部31fは、交点が対応付けられ
た文字パターンのサイズを確認する。
1において対応付けられた交点等を接続し、文字枠を除
去したことにより分離した文字パターンを接続する。枠
内文字補完部32は、図3に示す如く、単純補完部32
a、交差点算出部32b、交差点枠内補完部32c、交
差点枠外補完部32d及び直線補完部32eを有する。
単純補完部32aは、一対一対応の交点間を接続するこ
とにより補完する。交差点算出部32bは、一対多対応
の交点及び再対応付けられた交点について、交点におけ
る文字線分の輪郭の方向ベクトルの交差点を算出する。
交差点枠内補完部32cは、求めた交差点が枠の線幅内
の場合に交点間を接続する。交差点枠外補完部32d
は、求めた交差点が枠の線幅外の場合に交点間を接続す
る。直線補完部32eは、交差点が算出できない場合
に、文字線分を枠に沿って直線で補完する。
文字補完部32で補完された文字パターンの連結性を確
認するラベリング部33aを有する。尚、連結性確認部
33で連結性が確認できない文字パターンは、前記した
ように交点対応付け部31の再対応付け部31eで再対
応付けされる。
33で連結性が確認された文字パターン或は図2の連結
パターン属性付加部23において文字パターンの属性が
付加された文字パターンを統合する。図3に示す如く、
連結パターン統合部34は、連結パターン仮統合部34
a、サイズ確認部34b及び連結パターン統合部34c
を有する。連結パターン仮統合部34aは、連結パター
ンの仮統合を行う。サイズ確認部34bは、仮統合され
た文字パターンのサイズを確認する。連結パターン統合
部34cは、サイズ確認部34bにおいて確認されたサ
イズが適切でない場合に連結パターンを更に統合する。
について説明する。 (1)連結パターンの抽出 図2の連結パターン抽出部21には、極端な傾きや回転
の補正、雑音の除去、「かすれ」の穴埋め等の前処理が
施された入力パターンが入力される。ラベリング部21
aは、この入力パターンについて、枠の位置に関係なく
接触文字の候補を選択するため、縦、横、斜め方向の8
方向のいずれかで繋がっているパターンをラベリングに
より抽出する。この様なラベリングで得られた部分パタ
ーンは、(イ)文字が接触していない場合の枠、(ロ)
枠に接触していない文字或は文字の一部、又は(ハ)枠
に接触している文字のいずれかである。
サイズは上述の如く後の処理で必要となるので、ラベリ
ングの処理中に部分パターンを矩形に近似して得られる
矩形の角の座標を求めておく。 (2)枠の抽出 上記のように抽出された連結パターンのうち、枠に接触
している文字だけに注目するため、枠抽出部22におい
て枠を抽出する。枠を抽出する際、一般に抽出の頻度が
高く、高速に抽出を行う必要があるので、先ず線幅の太
い直線/枠を抽出し、これによって抽出できなかった場
合には次に線幅の細い直線/枠を抽出する。 (2a)線幅の太い直線/枠の抽出 枠のサイズが未知で、かつ、枠に文字が接触している場
合でも、安定に枠を抽出する必要がある。そこで、枠抽
出部22の投影部22aは、ラベリングで得られた部分
パターン毎に投影をとる。そして、直線検出部22bに
おいて、投影値と部分パターンを矩形に近似して得られ
る縦横サイズとの比を計算して、その比が所定のしきい
値以上であれば長い直線であると判断する。
ロークの場合もあるので、できるだけ最外郭の直線で矩
形らしさを満足する4辺に相当する直線を求める。
グで得られた部分パターンの水平方向の投影と垂直方向
の投影とを示す図である。同図中、ラベリングにより得
られた部分パターン41は、横方向に長さLx、縦方向
に長さLyを有する。又、部分パターンは、垂直方向の
投影42及び水平方向の投影43を有する。
列×n行、座標(i,j)の濃度値をf(i,j)、i
行目の水平方向の投影をPh (i)、j列目の垂直方向
の投影をPv (j)とすると、Ph (i)及びPv
(j)は夫々次の(1)式及び(2)式で表される。
た水平方向の投影及び垂直方向の投影について、ラベリ
ング部21aで求めた部分パターンの矩形座標の矩形の
縦横の長さLx及びLyを用いて、次の(3)式により
縦の長さLxと水平方向の投影Ph (i)との比、又、
次の(4)式により横の長さLyと垂直方向の投影Pv
(j)との比を求め、これらの比をしきい値THL と比
較する。
L 以上であれば、部分パターンが枠を構成する直線の候
補であるものとする。即ち、図4に示すように、抽出さ
れた部分パターンが矩形である場合には、その直線部分
の水平投影値Ph (i)と垂直投影値Pv (j)が最も
大きくなり、その縦横の長さLxとLyとの比も大きく
なるので、(3)式と(4)式により直線部分を判別す
ることができる。
の一実施例をより詳細に説明する図である。図5は、枠
の構成要素を示し、枠は上枠と下枠と左枠と右枠とによ
り構成されている。上枠は、線分(直線)i1及びi1
1からなる。下枠は、線分(直線)i2及びi22から
なる。左枠は、線分(直線)j1及びj11からなる。
右枠は、線分(直線)j2及びj22からなる。ラベリ
ングにより得られた部分パターンの矩形の縦横の長さを
夫々Lx,Lyとすると、投影と長さとの比が所定のし
きい値THL 以上であれば、枠を構成する線分(直線)
の候補とする。
ウェアで実現する場合のフローチャートを示す。同図
中、ステップS1〜S7は、水平線のうち上枠の候補を
検出する。ステップS11〜S17は、水平線のうち下
枠の候補を検出する。ステップS21〜S27は、垂直
線のうち左枠の候補を検出する。又、ステップS31〜
S37は、垂直線のうち右枠の候補を検出する。ここで
は、説明の便宜上、ステップS1〜S7の動作のみを説
明し、他のステップの説明は省略する。
定する。ステップS2は、[Ph (i)/Lx]<TH
L であるか否かを判定する。ステップS2の判定結果が
NOであると、ステップS3でiをインクリメントして
からステップS2へ戻る。他方、スッテップS2の判定
結果がYESであると、ステップS4はi1=iに設定
する。次に、ステップS5は[Ph (i)/Lx]≧T
HL であるか否かを判定する。ステップS5の判定結果
がYESであると、ステップS6でiをインクリメント
してからステップS5へ戻る。他方、スッテップS5の
判定結果がNOであると、ステップS7でi11=i−
1に設定、これらの動作により上枠の候補が得られる。
プS11〜S17、ステップS21〜S27及びステッ
プS31〜S37により同様にして得られる。尚、例え
ばステップS13及びS16は、iをデクリメントす
る。
より検出された水平線iの候補と垂直線jの候補の中か
ら、夫々最外郭の水平線候補i1,i2及び垂直線の候
補j1,j2に着目して、次の(5)式及び(6)式を
計算してしきい値THL'と比較する。
に説明する図であり、処理をソフトウェアで実現する場
合のフローチャートを示す。同図中、ステップS41
は、上記(5)式が成立するか否かを判定する。ステッ
プS41の判定結果がYESの場合、ステップS42は
上記(6)式が成立するか否かを判定する。ステップS
41又はS42の判定結果がNOであると、処理は追跡
部22dの処理へと進む。他方、ステップS42の判定
結果がYESの場合、ステップS43は部分パターンが
枠を構成する直線部分であるとみなして、直線部分を検
出する。
出結果に基づいて枠を抽出する。つまり、4辺検出部2
2cで直線部分が検出されるとこれに基づいて枠を抽出
し、直線部分が検出されないと他の候補に着目して上記
処理を繰り返すことにより、枠を抽出する。具体的に
は、候補が上記(5)式、(6)式を満足すれば枠を構
成する直線と見なし、満足しなければ他の候補に着目し
て上記処理を繰り返す。
めた後、その骨格線の前後に注目し、骨格線から連続し
て何本水平線の候補i或は垂直線の候補jが存在するか
を計算し、その値を各辺の線幅の基準とする。
た線幅の太い枠の一例を示す図である。同図中、抽出さ
れた枠51に対して骨格線52が得られ、各辺の線幅は
この例では2画素分である。 (2b)線幅の細い直線/枠の抽出 上記した図8(a)の線幅の太い直線/枠の抽出処理に
おいて算出できなかった部分パターンに注目して、線幅
の細い直線/枠の抽出を行う。
であり、枠53及びその骨格線54を示す。線幅の細い
枠には、同図に示す如く、線幅が1画素分程度で、か
つ、傾き等による凹凸が生じているパターンが含まれ
る。同図に示す線幅の細い枠を安定に抽出するために、
本実施例では次のようにして枠を探索する。
傾きによる凹凸が生じていても直線を検出できる「nラ
インランレングス」と名付ける直線長を定義する。
連続している画素数を計算するので、図8(b)に示す
ような凹凸が生じている長い直線では短い直線に分割さ
れてしまうが、図9に示すnラインランレングスでは、
あるnラインの間で8連結で接続するランレングスをn
ラインランレングスとして計算する。nの値は傾きの大
きさで決定し、傾きが大きければ大きい程nを大きくす
る。n=1の場合は、通常のランレングスに相当する。
凸が生じているにもかかわらず、7画素分の水平線とし
て直線を抽出することができる。
グ部21aで得られた部分パターンの矩形座標より矩形
を構成する直線の両端及び中点等の複数の点から枠の内
部に垂線を下ろして部分パターンと接触した位置を開始
点として、上記nラインランレングスにより、開始点よ
り左右或は上下方向へ部分パターンに沿って探索する。
文字がはみ出していても、安定に線幅の細い直線を求め
ることができる。
の一実施例をより詳細に説明する図であり、処理をソフ
トウェアで実現する場合のフローチャートを示す。図1
0は水平方向のnラインランレングスを求める処理を示
し、図11は垂直方向のnラインランレングスを求める
処理を示す。図10及び図11において、探索開始点を
(ii,jj)、水平線の長さをNhi、垂直線の長さ
をNvjで表すものとする。
0、i=ii、j=jjに設定する。ステップS52
は、f(i+1,j)にラベルがあるか否かを判定す
る。ステップS52の判定結果がYESであると、ステ
ップS53でNhi及びiをインクリメントしてから処
理をステップS52へ戻す。他方、ステップS52の判
定結果がNOであれば、ステップS54で(j+1)≦
jj+n/2であるか否かを判定する。ステップS54
の判定結果がYESであると、ステップS55でf(i
+1,j+1)にラベルがあるか否かを判定する。ステ
ップS55の判定結果がYESであれば、ステップS5
6でjをインクリメントしてから処理をステップS53
へ戻す。ステップS54又はS55の判定結果がNOの
場合、ステップS57で(j−1)≧jj−n/2であ
るか否かを判定する。ステップS57の判定結果がYE
Sであると、ステップS58でf(i+1,j−1)に
ラベルがあるか否かを判定する。ステップS58の判定
結果がYESであれば、ステップS59でjをデクリメ
ントしてから処理をステップS53へ戻す。ステップS
57又はS58の判定結果がNOの場合は、水平方向の
nラインランレングスを求める処理は終了する。
0、i=ii、j=jjに設定する。ステップS62
は、f(i,j+1)にラベルがあるか否かを判定す
る。ステップS62の判定結果がYESであると、ステ
ップS63でNvj及びjをインクリメントしてから処
理をステップS62へ戻す。他方、ステップS62の判
定結果がNOであれば、ステップS64で(i+1)≦
ii+n/2であるか否かを判定する。ステップS64
の判定結果がYESであると、ステップS65でf(i
+1,j+1)にラベルがあるか否かを判定する。ステ
ップS65の判定結果がYESであれば、ステップS6
6でiをインクリメントしてから処理をステップS63
へ戻す。ステップS64又はS65の判定結果がNOの
場合、ステップS67で(i−1)≧ii−n/2であ
るか否かを判定する。ステップS67の判定結果がYE
Sであると、ステップS68でf(i−1,j+1)に
ラベルがあるか否かを判定する。ステップS68の判定
結果がYESであれば、ステップS69でiをデクリメ
ントしてから処理をステップS63へ戻す。ステップS
67又はS68の判定結果がNOの場合は、垂直方向の
nラインランレングスを求める処理は終了する。
られた直線の長さを、水平線の候補iはNhi、垂直線
の候補jはNvjとする。又、ラベリング部21aで求
めた部分パターンの矩形座標の矩形の縦横の長さLx及
びLyを用いて、次の(7)式により縦の長さLxと水
平線の候補Nhiとの比、又、次の(8)式により横の
長さLyと垂直線の候補Nvjとの比を求め、これらの
比をしきい値THL と比較する。
L 以上であれば、各候補を、枠を構成する直線の候補で
あるものとする。
施例をより詳細に説明する図であり、処理をソフトウェ
アで実現する場合のフローチャートを示す。同図中、水
平線の候補iはNhi、垂直線の候補jはNvjである
ものとする。又、ラベリングの際に得られた部分パター
ンの矩形座標より、矩形の縦横の長さを夫々Lx,Ly
とする。同図(a)において、ステップS71はNhi
/Lx≧THL であるか否かを判定する。ステップS7
1の判定結果がYESであれば、ステップS72はこの
候補iが枠を構成する直線の候補として適切であると判
断する。他方、ステップS71の判定結果がNOである
と、次の水平線の候補に対して処理を開始する。又、同
図(b)において、ステップS75はNvj/Ly≧T
HL であるか否かを判定する。ステップS75の判定結
果がYESであれば、ステップS76はこの候補jが枠
を構成する直線の候補として適切であると判断する。他
方、ステップS75の判定結果がNOであると、次の垂
直線の候補に対して処理を開始する。
より検出された水平線iの候補と垂直線jの候補の中か
ら、夫々最外郭の水平線候補i1,i2及び垂直線の候
補j1,j2に着目して、次の(9)式及び(10)式
を計算してしきい値THL'と比較する。
22eの検出結果に基づいて枠を抽出する。つまり、4
辺検出部22eで直線部分が検出されるとこれに基づい
て枠を抽出し、直線部分が検出されないと他の候補に着
目して上記処理を繰り返すことにより、枠を抽出する。
具体的には、候補が上記(9)式、(10)式を満足す
れば枠を構成する直線と見なし、満足しなければ他の候
補に着目して上記処理を繰り返す。尚、線幅の基準値
は、枠抽出中に得られた最大と最小の位置座標の差とし
て求める。
出された文字枠を全画像にわたってスキャンして、連結
パターン抽出部21により抽出された部分パターンとの
マッチングをとってから新に文字枠を抽出することも可
能である。
た部分パターンを近似した矩形と抽出された文字枠との
サイズ比を算出し、算出したサイズ比が所定のしきい値
内の部分パターンだけに絞り込んで、抽出済の文字枠と
のマッチングをとってから新に文字枠を抽出することも
可能である。
右或は上下の範囲内に存在する部分パターンを抽出し、
抽出した全ての部分パターンが次に説明する属性付加手
段において文字だけからなるパターンであると判定され
ている場合に、上記抽出された文字枠を文字パターンと
判定し直す手段を設けても良い。この様な手段を設けた
場合、例えば「国」という漢字のように枠に相当する矩
形部分を持つ文字であっても、文字の一部を誤って枠と
して判定してしまうことを防ぐことができる。
出部22における枠抽出の結果に基づいて各連結パター
ンを次の(イ)〜(ハ)ように分けて、枠パターンと文
字パターン及び文字の部分パターンとに夫々枠と文字の
属性を付加する属性付加部23aを有する。 (イ)文字と枠の接触パターン (ロ)枠パターン (ハ)文字及び文字の部分パターン 尚、枠が抽出できなかったパターンは、「文字パター
ン」或は「文字パターンの一部」という属性を付加す
る。又、上記のように属性を付加されたパターンは、後
述する連結パターン統合部34で、そのパターン単独で
切り出すか、或は、文字パターンの一部と見なして他の
パターンと統合するか決められる。 (4)枠の分離 図2中、枠分離部24の辺幅算出部24aは、枠の外輪
郭の凹凸と内輪郭の凹凸を考慮して、枠抽出時に得られ
た線幅基準値+2(外輪郭にプラス1、内輪郭にプラス
1)を線幅として求め、枠抽出において算出した骨格線
或は抽出中の最大/最小の位置より枠の外輪郭と内輪郭
の座標値を決定する。
骨格線、外輪郭、内輪郭、線幅を示す図であり、「太い
線」は外輪郭、「点線」は内輪郭、「細い線」は骨格線
を示す。同図(a)は線幅の太い枠を示し、同図(b)
は線幅の細い枠を示す。辺幅算出部24aは、同図に示
すように、線幅の太い枠と線幅の細い枠について枠の外
輪郭と内輪郭の座標値を決定する。
すものとすると、上枠の外輪郭の座標が(i1,i1
1)で幅がw1であると、上枠の枠座標を(i1−1,
i11+1)、そして辺の幅をw1+2とする。又、下
枠の外輪郭の座標が(i2,i22)で幅がw2である
と、下枠の枠座標を(i2+1,i22−1)、そして
辺の幅をw2+2とする。同様にして、左枠の外輪郭の
座標が(j1,j11)で幅がw3であると、左枠の枠
座標を(j1−1,j11+1)、そして辺の幅をw3
+2とする。更に、右枠の外輪郭の座標が(j2,j2
2)で幅がw4であると、右枠の枠座標を(j2+1,
j22−1)、そして辺の幅をw4+2とする。
去部24bは、辺幅算出部24aにおいて求めた枠の外
輪郭と内輪郭の座標値により、外輪郭と内輪郭の間に存
在するパターンを除去する。
ーンに対して再びラベリングを行い、各ラベル毎に面積
が小さい等の特徴により枠の一部として残存しているパ
ターンを除去する。
加部23で属性が付加されなかったパターンに着目し
て、枠を除去してもパターンが存在しているものは接触
文字パターン或は文字の一部であることを示すパターン
の属性を付加し、枠を除去したらパターンがなくなるも
のは枠だけであることを示すパターンの属性を付加す
る。
後述するように、枠内の文字部分を補完した後、連結パ
ターン統合部34で他の接触文字パターン或は文字の一
部と統合されるか、それとも単独のパターンとするか判
断される。 (5)文字/枠交点算出 図2の文字/枠交点算出部25においては、交点算出部
25aが接触文字パターン或は文字の一部を対象とし
て、そのパターンと枠の交点を算出する。即ち、枠分離
部24において求めた外輪郭と内輪郭を使って、外輪郭
には1画素分外側の直線、内輪郭には1画素分内側の直
線を求め、その直線と接触文字パターン或は文字の一部
が交わる点で黒から白、或は、白から黒に変化する点を
求め、これを交点として抽出する。
施例をより詳細に説明する図であり、処理をソフトウェ
アで実現する場合のフローチャートを示す。この場合、
図14と同じ座標系を用いて上枠の外輪郭の外側の座標
をis1、内輪郭の内側の座標をiu1とし、下枠の外
輪郭の外側の座標をis2、内輪郭の内側の座標をiu
1とし、左枠の外輪郭の外側の座標をjs1、内輪郭の
内側の座標をju1とし、右枠の外輪郭の外側の座標を
js2、内輪郭の内側の座標をju1として、以下の処
理を行う。
する処理を示す。同図中、ステップS81は交点数Kを
K=0に設定し、ステップS82はjをjs1≦j≦j
s2に設定する。つまり、ステップS82の設定によ
り、以下のステップS83〜S89をj=js1〜js
2について行う。ステップS83は、f(is1,j)
にラベルがないか否かを判定する。f(is1,j)に
ラベルがなくステップS83の判定結果がYESである
と、ステップS84でjを増加させてから処理をステッ
プS83へ戻す。他方、ステップS83の判定結果がN
Oであれば、ステップS85で交点の左側の座標をjに
設定する。又、ステップS86は、f(is1,j)に
ラベルがあるか否かを判定する。ステップS86の判定
結果がNOであると、ステップS87でjを増加させて
から処理をステップS86へ戻す。他方、ステップS8
6の判定結果がYESであれば、ステップS88で交点
の右側の座標をjに設定する。その後、ステップS89
でKを増加させる。ステップS83〜S89をj=js
1〜js2について行った後、上枠の外輪郭と文字の交
点を算出する処理を終了する。
枠、左枠及び右枠の外輪郭と内輪郭と文字の交点の算出
は、図15と同様の処理により行えるので、本明細書で
はその図示及び説明は省略する。 (6)交点の対応付け 図3に示す交点対応付け部31では、枠を分離すること
により連続性がなくなった接触文字パターン或は文字の
一部を補完するため、枠と文字パターン或は文字の一部
の交点間の対応付けを行う。交点の対応付けとしては、
交点の一対一の対応付け、一対多の対応付け、そして後
述する連結性確認部33における連結性の確認に基づい
てフィードバックされて行われる再対応付けがある。再
対応付けについては、連結性確認部33における連結性
の確認を説明した後で説明する。
は、外輪郭の交点と内輪郭の交点の交点数が同じ場合
に、一対一の対応付けとして捉え、順序通りに交点を対
応付ける。その際、対応付けた交点間の距離を求める。
中、「白丸」は文字線分81a,81b,82a,82
bと枠部分83の交点を示している。順序付け対応にお
いては、同図に示すように、一つの文字線分に存在する
2つの交点の中点を求め、外輪郭の中点と内輪郭の中点
のX軸方向の座標値の差dk ,dk+1 、或はY軸方向の
座標値の差を求める。座標値の差が、夫々外輪郭と内輪
郭との差から求められる枠の線幅Wにαの重み付けをし
た値以下の場合、それらの交点を対応付ける。
施例をより詳細に説明する図であり、処理をソフトウェ
アで実現する場合のフローチャートを示す。交点数を
K、図16中の交点をak ,ak+1 ,a’k ,a’k+1
,bk ,bk+1 ,b’k ,b’k+1 とした場合、ステ
ップS91はk番目の交点に対して0≦k<Kに設定す
る。ステップS92は座標値の差dk をdk =(a’k
+b’k )/2−(ak +bk )/2より求める。ステ
ップS93はdk ≦W×αであるか否かを判定する。ス
テップS93の判定結果がNOであると、ステップS9
4は交点の対応はないと判断する。他方、ステップS9
3の判定結果がYESの場合は、ステップS95で交点
を対応付ける。以上のステップS92〜S95は、k=
0〜Kについて繰り返される。
算出部31bは、順序対応部31aにおいて一対一に対
応付けられた線分に着目して、一つの文字線分に存在す
る2つの交点間の距離を外輪郭と内輪郭の夫々について
算出し、その平均値をとって、文字線分の線幅を求め
る。
施例をより詳細に説明する図であり、処理をソフトウェ
アで実現する場合のフローチャートを示す。同図中、n
umは対になっている交点の数、sumは対になってい
る交点間の線幅の合計、Wavは平均線幅を表す。
m=num=0に設定する。ステップS102はk番目
の交点に対して0≦k<Kに設定する。ステップS10
3はk番目の交点に対応付けた交点が存在するか否かを
判定し、判定結果がNOであれば処理はステップS10
5へ進む。他方、ステップS103の判定結果がYES
であれば、ステップS104でnumを2増加すると共
に、sumを(bk −ak +1)(b’k −a’k +
1)増加する。ステップS103及びS104は、k=
0〜Kについて繰り返される。その後、ステップS10
5で平均線幅WavをWav=sum/numより求
め、線幅算出処理を終了する。
対応部31cは、一対多で対応する交点について、距離
対応により対応付けを行う。又、連続性対応部31d
は、一対多で対応する交点について、連続性対応により
対応付けを行う。
同図中、(a)は距離対応を取る場合、(b)は連続性
対応を取る場合、(c)は距離対応を取る場合を示す。
同図(a)から(c)に行く程、対応付ける文字線分9
1aと91b、文字線分92aと92b、93aと93
bの距離は遠くなるが、(a)〜(c)のどれか一つの
条件に適合すれば、交点の対応付けを行う。
〜91cに存在する2つの交点の中点を求め、外輪郭の
中点と、内輪郭の中点間の距離d3とd4を求める。次
に、枠94の線幅Wと比較して、d3≦W、或は、d4
≦Wを満足すれば、満足する方の交点の対応付けを行
う。又、上記条件を満足する交点が複数ある場合には、
それらすべての対応付けを行う。この様な対応付けを行
うことにより、例えば手書き文字パターン「H」、
「*」、「U」、「A」は、同図(a)に示す如く補完
される。
付けを行う場合を示し、文字線分の距離が離れていた
り、内輪郭、或は、外輪郭の文字線分の線幅が太い場合
でも、文字線分間の方向性の連続性により対応付けを行
う。連続性による対応付けにおいては、各交点における
文字線分の輪郭の傾きを算出し、その傾きから連続性を
求めることができる。しかし、方向ベクトルの算出を簡
単にするため、文字線分の輪郭に沿ってある画素だけ遡
り、その座標値と交点の座標値より方向ベクトルを求め
ることができる。
交点から枠の輪郭線に対して垂直なベクトルで代用した
例を示しており、図示の如く、交点数が少ない方の文字
線分92cの交点から伸ばした方向ベクトルと、交点数
が多い方の枠輪郭との交点の位置と求める。こうして求
めた位置が文字線分92a,92b内に属していたら、
再び、上記交点が属する文字線分の交点に着目して、そ
の交点での方向ベクトルを伸ばし、交点数が少ない方の
枠輪郭との交点位置を求め、それが同図に示すように文
字線分92cに属していたら両者を対応付ける。
ことにより、例えば手書き文字パターン「H」、
「*」、「U」は、同図(b)に示す如く補完される。
aと93bの距離が離れている場合に、距離により対応
付けを行う場合を示す。同図に示すように、外輪郭の交
点と内輪郭の交点の枠方向の距離差d5,d6を算出
し、その距離差d5とd6が例えば枠幅の半分などのあ
るしきい値より小さい場合、即ち、d5≦W/2、d6
≦W/2の条件を満足する場合に対応付けを行う。
とにより、例えば手書き文字パターン「H」、「*」
は、同図(c)に示す如く補完される。
(c)のいずれにおいても、1対2の対応付けを行って
いるが、どちらか片方だけで対応付けても良い。
応部31dの処理の一実施例をより詳細に説明する図で
あり、処理をソフトウェアで実現する場合のフローチャ
ートを示す。
枠の交点数をKとすると、k番目の交点に対して0≦k
<Kに設定する。又、ステップS111は、内枠の交点
数をK’とすると、k’番目の交点に対して0≦k’<
K’に設定する。ステップS112は、外枠の交点と内
枠の交点間の距離dを|(bk −ak +1)−(b’k
’−a’k ’+1)|に設定する。次に、ステップS
113は、d≦Wであるか否かを判定する。ステップS
113の判定結果がNOであれば、ステップS114は
ak ≦bk であるか否かを判定する。ステップS114
の判定結果がNOであれば、ステップS115はak ≦
b’k ’であるか否かを判定する。ステップS115の
判定結果がNOであれば、ステップS116はb’k'−
bk ≦W/2であるか否かを判定する。ステップS11
6の判定結果がNOであれば、ステップS117はak
−a’k ’≦W/2であるか否かを判定する。ステップ
S117の判定結果がNOであれば、ステップS118
は交点間の対応はないと判断して、処理は終了する。他
方、ステップS113〜S117の判定結果がYESで
あれば、ステップS119で交点間の対応付けが行われ
て、処理は終了する。尚、ステップS112〜S119
は、0≦k<K及び0≦k’<K’の範囲内で繰り返さ
れる。
応部31cの動作に対応しており、図19(a)の条件
に相当する。又、ステップS114及びS115は、連
続性対応部31dに対応しており、図19(b)の条件
に相当する。更に、ステップS116及びS117は、
距離対応部31cの動作に対応しており、図19(c)
の条件に相当する。
31のサイズ確認部31fは、対応付けの条件を満足し
たパターンに対して、対応付けてできるパターンのサイ
ズを求める。このサイズは、予めわかっている文字サイ
ズ又は直線/枠抽出部22で計算した枠のサイズと比較
され、比較によって得られるサイズ比が大きすぎる場合
は交点の対応付けをしないようにする。
ングして矩形に近似し、矩形近似されたパターンと文字
サイズ或は一文字枠のサイズとの比を算出して、得られ
た比が所定のしきい値を越える場合には交点の対応付け
をキャンセルする。
実施例をより詳細に説明する図であり、処理をソフトウ
ェアで実現する場合のフローチャートを示す。
AIOU≦MAXMOJIであるか否かを判定する。こ
こで、MAXMOJIは予め文字サイズがわかっている
場合の文字サイズ、又は、文字サイズがわかっていない
場合の枠抽出部22で得た枠のサイズであり、TAIO
Uは交点の対応付けの条件を満足したパターンの対応付
け後のサイズである。ステップS121の判定結果がY
ESであれば、ステップS122で交点の対応付けを行
い、処理を終了する。他方、ステップS121の判定結
果がNOであれば、ステップS123で交点の対応付け
をキャンセルし、処理を終了する。
いては、後述する。 (7)枠内文字の補完 図3に示す枠内文字補完部32においては、交点が一対
一に対応している場合と、一対多に対応している場合と
に分け、接触文字パターン或はその一部の交点間を滑ら
かに接続して、枠を分離したことにより欠けた文字部分
を補完する。
れた接触文字パターン或はその一部の交点間を滑らかに
接続する手段である。一対一の補完の場合には、基本的
には各交点間での文字線分の輪郭の方向ベクトルを算出
して、方向ベクトルに従って各交点から直線を引き、そ
の直線と直線が交わる点で文字線分を結合する。又、方
向ベクトルを算出する手間を省くため、各対応付けた交
点間を接続し補完することもできる。
あり、補完する文字線分101a,101b、枠102
及び補完された文字線分103を示す。ここでは、各対
応付けた交点間を接続し補完する場合を示している。同
図に示すように、文字線分101aと文字線分101b
の交点間を直線で接続し、その間を黒画素で埋めること
により、補完された文字線分103を得ることができ
る。
施例をより詳細に説明する図であり、処理をソフトウェ
アで実現する場合のフローチャートを示す。
22中、交点ak とa’k を結ぶ直線la及び交点bk
とb’k を結ぶ直線lb を求める。ステップS132
は、図22において、枠102より1画素分文字側の座
標c,c’について、cc をc≦cc ≦c’に設定す
る。直線laと枠102の交点をpa、直線lbと枠1
02の交点をpbとすると、ステップS134はpa≦
p≦pbに設定すると共に、f(cc ,p)を文字にす
る。尚、ステップS133及びS134は、cc がc≦
cc ≦c’の範囲内で繰り返される。
応直線の交差点算出部32bにおいて、各交点での文字
線分の輪郭の方向ベクトルを算出し、方向ベクトルに従
って各交点から直線を引き、その直線と直線が交わる交
差点を算出する。尚、方向ベクトルを算出する手間を省
くため、各対応付けた交点間を結ぶ直線で方向ベクトル
を代用することもできる。
した後、その交差点が枠内にある場合には、交差点枠内
補完部32cにより補完を行う。
あり、補完前の文字線分111a,111b,111
c、枠112及び補完された文字線分113を示す。こ
こでは、各対応付けた交点間を結ぶ直線で方向ベクトル
を代用した例を示している。対応付けた交点間を直線で
結び、その交差点が枠112内にある場合には、同図に
示すように、交点を結ぶ直線間を黒画素で埋めることに
より、文字線分を補完する。
線補完については、連結性確認部33における連結性の
確認について説明した後で、再対応付けとして説明す
る。
の処理の一実施例をより詳細に説明する図であり、処理
をソフトウェアで実現する場合のフローチャートを示
す。
対多の交点の補完であるか否かを判定する。ステップS
141の判定結果がYESの場合は、ステップS142
で図24中、各対応付けた交点間を結ぶ直線l1〜l4
を算出する。他方、ステップS141の判定結果がNO
の場合は、ステップS143で各交点での文字線分の輪
郭の方向ベクトルl1〜l4を算出する。ステップS1
42又はS143の後、ステップS144は交差点が枠
112内にあるか否かを判定する。ステップS144の
判定結果がYESの場合、ステップS145で後述する
交差点枠内補完部32cの処理へ進む。他方、ステップ
S144の判定結果がNOの場合、ステップS146で
交差点が枠112外にあるか否かを判定する。ステップ
S146の判定結果がYESであれば、ステップS14
7で後述する交差点枠外補完部32dの処理へ進む。
又、ステップS146の判定結果がNOであれば、ステ
ップS148で直線補完部32eの処理へ進む。 (8)連結性の確認及び再対応付け 連結性確認部33においては、補完した接触文字パター
ン或はその一部に対して、ラベリング部33aにおいて
再びラベリングを行い連結性を確認する。
していたパターンであるので、補完することにより、一
つのパターンとして連結性が確認できれば、次の連結パ
ターン統合部34での処理へ進む。
より連結性がうしなわれたので、再びフィードバックし
て、交点対応付け部31の再対応部31eでの交点の再
対応付けを行う。尚、連結性が確認できないパターンの
うち、交点間を結ぶ直線が枠上に存在する場合だけ、再
対応付けを行うことにより、処理時間を短縮することが
できる。
て、再対応部31eでは、対応付けられなかった交点の
中で、先ず、内輪郭に存在する交点間の対応付けを行
う。そのため、複数の内輪郭に存在する交点間の中で、
距離が近い交点間を対応付ける。対応付ける交点が一つ
しか存在しない場合には、既に対応付けた交点と対応付
ける。
外輪郭で対応付けられない交点に着目し、最も距離が近
い文字線分に対応付ける。
したように、交点対応付け部31のサイズ確認部31f
で新に生成されるパターンのサイズをチェックし、サイ
ズが確認できたら枠内文字補完部32で補完を行う。更
に、再び連結性確認部33で連結性を確認し、連結性が
確認できない場合には、上記のように再対応付けを行
う。この様な処理を連結性確認部33で確認できるま
で、繰り返して行う。
補完の例を示す図である。図26(a)は枠内文字補完
部32の交差点算出部32bにおいて算出した交差点が
枠内である交差点枠内補完の例を示し、同図(b)は交
差点が外枠である交差点枠外補完の例を示している。図
27(a)は外輪郭の外側に文字線分がない場合の直線
補完の例を示し、同図(b)は外輪郭の外側に文字線分
がある場合の直線補完の例を示している。又、図26及
び図27は、補完される文字線分121a,121b,
131a,131b,134a,134b、枠122,
132、補完された文字線分124,133,135を
示す。
差点が枠内の場合には、交差点枠内補完部32cは、図
26(a)に示すように、交差点算出部32bで算出し
た交差点と文字線分121a,121bの交点を結ぶ直
線を、文字線分121a,121bの交点を延長した直
線、及び、外輪郭で囲まれた部分を文字領域と判定し
て、文字領域を黒画素で埋めて補完された文字線分12
4を得る。
差点が枠外の場合には、交差点枠外補完部32dは、図
26(b)に示すように、文字線分121a,121b
の交点から伸ばした直線により囲まれた部分を文字領域
と判定して補完し、更に、分割された文字領域を結合す
るため、外輪郭から直線で分割した文字領域の間を文字
の線幅に相当する幅で補完し、補完された文字領域を黒
画素で埋めて文字線分124を得る。
できない場合には、直線補完部32eにおいて、図27
(a)に示すように、文字線分131a,131bの交
点を延長すると共に、延長した直線により形成される領
域を文字の線幅に相当する幅で補完して、これらの領域
を文字領域として黒画素で埋めて文字線分133を得
る。
た最も距離の近い文字線分がある場合には、図27
(b)に示すように、上記した手法により内輪郭の文字
線分を補完して、補完された文字線分134aを得た
後、外輪郭の外側の文字線分134bの交点を延長した
直線と文字線分134aで囲まれた領域を文字領域とし
て黒画素で埋めて文字線分135を得る。
対応付けが不可能な交点において、例えば、内輪郭に一
つの文字線分しかない場合には、次のように交差点枠内
補完と交差点枠外補完を行う。
図である。同図中、(a)は交差点枠外補完の例、
(b)は交差点枠内補完の例を示している。同図は、補
完される文字線分141,143及び枠142を示して
いる。
合には、図28(a)に示すように、文字線分141の
交点の延長線と枠142の外輪郭とで囲まれた領域を文
字領域として、黒画素で埋めて補完する。
側の場合には、図28(b)に示すように、文字線分1
43の交点の延長線で囲まれた領域を文字領域として、
黒画素で埋めて補完する。
例をより詳細に説明する図であり、処理をソフトウェア
で実現する場合のフローチャートを示す。
輪郭上の対応のない交点数INTを設定する。ステップ
S152は、INT>1であるか否かを判定し、判定結
果がYESであれば、ステップS153で距離の近い交
点間の対応付けを行い、処理を終了する。他方、ステッ
プS152の判定結果がNOであれば、ステップS15
4でINT=1であるか否かを判定する。ステップS1
54の判定結果がYESであれば、ステップS155で
既に対応付けた交点と対応付けを行い、処理を終了す
る。又、ステップS154の判定結果がNOであれば、
ステップS156で外輪郭上の対応のない交点の中で最
も距離の近い交点間を対応付けて、処理を終了する。
の一実施例をより詳細に説明する図であり、処理をソフ
トウェアで実現する場合のフローチャートを示す。尚、
図30及び後述する図31〜図33においては、図24
中交差点と直線l1とl2の交点を(ik ,jk )、枠
112の内輪郭の座標をin 、枠112の外輪郭の座標
をig 、文字線幅をw、枠112の外輪郭より文字線幅
w分内側の座標をig-w とする。
をin ≦i<ik に設定する。ステップS162はl
1,l2とiとの交点をPa,Pbに設定し、ステップ
S163はPがPa≦P≦Pbであればf(i,P)は
文字とする。又、ステップS162及びS163と平行
してステップS164及びS165が行われる。ステッ
プS164はl3,l4とiとの交点をPa,Pbに設
定し、ステップS165はPがPa≦P≦Pbであれば
f(i,P)は文字とする。上記ステップS162〜S
165は、in ≦i<ik の範囲内で繰り返される。
又、ステップS166は、iをik ≦i<ig に設定す
る。ステップS167はl1,l4とiとの交点をP
a,Pbに設定し、ステップS168はPがPa≦P≦
Pbであればf(i,P)は文字とする。上記ステップ
S167及びS168は、ik ≦i<ig の範囲内で繰
り返され、その後処理を終了する。
の一実施例をより詳細に説明する図であり、処理をソフ
トウェアで実現する場合のフローチャートを示す。同図
中、図30と同一ステップには同一符号を付し、その説
明は省略する。
をin ≦i<ig-w に設定し、ステップS166Aがi
をig-w ≦i<ig に設定する点を除けば、処理は図3
0の場合とほぼ同様である。
施例をより詳細に説明する図であり、処理をソフトウェ
アで実現する場合のフローチャートを示す。同図中、図
30と同一ステップには同一符号を付し、その説明は省
略する。
く、ステップS166Bがiをis ≦i<is+w に設定
する点を除けば、処理は図30の場合とほぼ同様であ
る。
図33の如きソフトウェア処理を行えば良い。同図中、
図30と同一ステップには同一符号を付し、その説明は
省略する。
く、ステップS166Cがiをis ≦i<ig に設定す
る点を除けば、処理は図30の場合とほぼ同様である。
グ部33aの処理の一実施例をより詳細に説明する図で
あり、処理をソフトウェアで実現する場合のフローチャ
ートを示す。
リングを行い、ステップS172はラベル数が1である
か否かを判定する。ステップS172の判定結果がNO
であれば、ステップS173で現パターンを候補として
保存し、ステップS174による再対応部31eでの再
対応処理へと進む。他方、ステップS172の判定結果
がYESの場合は、ステップS175による連結パター
ン統合部34での統合処理へと進む。 (9)連結パターンの統合 連結パターン統合部34においては、枠内文字補完部3
2で補完した接触文字パターンと、連結パターン属性付
加部23において属性を付加された文字パターン或はそ
の一部を統合する。
ンと属性付けした文字パターン或はその一部の一部でも
同じ文字枠に属する場合には、統合することを考えて、
連結パターン仮統合部34aにおいて統合し、両者の統
合により得られたパターンのサイズをサイズ確認部34
bで確認する。そして、そのサイズが適切であれば連結
パターン統合部34cで統合し、適切でなければ統合し
ない。
部分パターンの一部が一文字枠の内部にあれば、それら
の部分パターンを一つの文字構成要素として統合し、統
合時に統合したパターンのサイズを求めて、それと一文
字枠のサイズとのサイズ比を計算し、計算値が所定のし
きい値の範囲内か否かを判定する。そして、サイズ比が
所定のしきい値内の場合には採用したパターンをそのま
ま採用し、所定のしきい値外の場合には、統合せずに元
の部分パターン毎に文字を切り出す。
字を切り出しているので、従来において正確に切り出す
ことができなかった文字をも正確に切り出すことができ
る。
理の一実施例をより詳細に説明する図であり、処理をソ
フトウェアで実現する場合のフローチャートを示す。
した文字パターンと属性付けられた文字パターンを統合
し、ステップS182は統合した文字パターンのサイズ
を示すTOUGOUを設定する。ステップS183は、
TOUGOUが一文字枠サイズ以下であるか否かを判定
する。ステップS183の判定結果がNOであれば、ス
テップS184は統合を行わず、処理を終了する。他
方、ステップS183の判定結果がYESであれば、ス
テップS185で統合を行ってから、処理を終了する。
した文字パターンの例を示す図である。
分を本実施例により切り出した例を示す。本実施例によ
れば、同図に示すように、枠152に接触した文字線分
151を枠152を除去して、正確に切り出すことがで
きる。
ンから本実施例により文字を切り出した例を示す。図3
7(a),(b),(c)に示すように、文字に接触し
た枠、文字に接触した汚れ等を正確に除去して文字のみ
を切り出すことができる。
2値画像から本実施例により文字パターンを切り出した
例を示す。同図(b)から明らかな如く、本実施例によ
れば、同図(a)のように文字が枠に接触したり、枠か
らはみ出したりしていても、正確に文字を復元すること
ができる。
は、罫線、枠等に触れている文字、図形、記号等から罫
線、枠等の直線部分を抽出・分離して文字、図形、記号
を抽出し、罫線、枠等の直線部分を文字、図形、記号か
ら分離したことにより文字、図形、記号が欠けた部分を
補完しているので、次のような特徴1)〜16)を有す
る。
図形もしくは記号とから構成される画像から、枠もしく
は罫線等の直線を確実に除去し、除去した部分を正確に
補完することができるので、高品質の文字、図形もしく
は記号を抽出することができ、文字認識装置において、
文字、図形、記号の認識率を著しく向上させることがで
きる。又、従来のように、文字認識装置用の文字、図
形、記号等を枠内に書かなければならないという制約を
取り除くことができる。
対応付け手段にフィードバックし、再度、交点の対応付
け、文字、図形、記号の領域の補完を行うことにより、
文字、図形、記号を高品質に復元することができ、又、
連結性が確認できるまで、復元パターンの候補を適応的
に増加させることが可能となり、確実に正解のパターン
を抽出することができる。
罫線等の直線部分が接触したパターンの候補だけに対し
て連結成分を求めるようにしたり、連結性が確認できな
いパターンのうち、再対応付けを行う交点を、交点間を
結ぶ直線が枠もしくは罫線等の直線部分上にある場合に
限定するようにすることにより、処理速度を高速化する
ことができる。
報に基づき対応付けることにより、誤った交点の対応付
けをすることなく、不適切なパターンの復元を避けるこ
とができる。
間の距離、文字、図形もしくは記号を構成する部分の連
続性等を考慮して対応付けることにより、一対多に対応
する交点を確実に対応付けることができ、交点の対応漏
れによる復元パターンに欠けが生じることがなく、品質
の良いパターンを抽出することができる。
もしくは記号のサイズ、或は、枠サイズとの比を算出
し、上記比が所定のしきい値を越える場合には、交点の
対応付けをキャンセルするようにすることにより、不適
切なパターンを抽出することがなく、高品質な文字を抽
出することができる。
つの線分の交点における線分の輪郭線の傾きを求めて、
各交点を通り、輪郭線の傾きを持つ2つの直線の交差点
を求め、その交差点の位置に応じて、文字、図形もしく
は記号の領域を厳密に抽出することができ、高品質のパ
ターンを抽出することができる。
に沿って直線で補完すると共に、枠もしくは罫線等の直
線部分内の領域を、文字、図形、記号の線幅に相当する
直線で補完することにより、枠、罫線等の直線部分にお
ける文字、図形、記号のストロークが欠けている場合で
も、高品質な文字、図形もしくは記号を抽出することが
でき、又、部分的に線幅が広くなることがないので、高
品質のパターンを抽出することができる。
ば、部分パターンを統合し、統合したパターンのサイズ
を求めて、そのサイズと枠のサイズとのサイズ比により
統合したパターンを採用するか否かを決定することによ
り、不適切なパターンを抽出することがない。
字、図形、記号を構成する線分について、枠もしくは罫
線等の直線部分を構成する内側と外側の2つの輪郭の夫
々における交点候補間の距離を算出し、算出した距離の
平均値を求めることにより、文字、図形、記号を構成す
る線分の平均線幅を算出することにより、文字、図形、
記号を構成する線分の幅を正確に求めることができる。
したパターンに対して、連結成分を求め、各連結成分の
面積に基づき、枠もしくは罫線等の直線部分の一部とし
て残った雑音を除去することにより、文字、図形、記号
を構成する線分と枠の一部を対応付けて不適切なパター
ンが復元されるのを避けることができる。
て、各部分パターン毎に投影を求め、その投影値と部分
パターンの近似矩形の縦、横の長さの比に基づき、枠を
構成する直線の候補を抽出することにより、頻度の高い
線幅の太い枠を高速に、かつ、正確に抽出することがで
きると共に、枠に接触した文字、図形もしくは記号か
ら、それらの一部を削り取ることなく、枠だけを正確に
分離することができ、文字、図形もしくは記号を高品位
に復元することができる。
下に部分パターンに沿って探索し、探索によって得られ
た直線の長さと、上記近似矩形の各辺の長さの比によ
り、枠を抽出すると共に、枠の各辺の線幅を算出するこ
とにより、線幅の細い枠を正確に抽出することができ
る。
キャンして、部分パターンとのマッチングを行い、新に
枠を抽出するようにしたり、部分パターンを矩形近似
し、近似された矩形と抽出された枠とのサイズ比を算出
し、算出したサイズ比が所定のしきい値内の部分パター
ンだけに絞り込んで、抽出済の枠とのマッチングを行っ
て、新に枠を抽出することにより、抽出が困難な枠をも
抽出することが可能となる。
出された枠のサイズ分だけ、左右、もしくは、上下の範
囲内に存在する部分パターンを抽出し、抽出した全ての
部分パターンが文字、図形もしくは記号だけからなるパ
ターンと判定されている場合に、上記抽出された枠を文
字、図形もしくは記号だけからなるパターンと判定し直
すようにすることにより、例えば、「国」という漢字の
ように枠に相当する矩形部分を持つ文字の一部を枠とし
て抽出することがなく、枠を安定して抽出することがで
きる。
しくは罫線等の直線部分を抽出する際、nラインランレ
ングス法を用いて直線部分として抽出することにより、
凹凸のある直線を確実に抽出することが可能となる。
で算出された交点を図3の交点対応付け部31で対応付
ける際に、交点数が一対一の場合には、順序付け対応を
行うと、細い文字線分同士では、文字サイズの情報では
除去できず、枠に接触する隣り同士の文字まで対応付け
られてしまう。例えば、図39(a)のように「1」と
「4」が枠の両側から接触している場合、枠の交点が一
対一であるため、交点間の距離が離れていても順序良く
対応付けられてしまう。このため、処理された文字は同
図(b)に示すように、解読不能な文字となってしま
う。
認されるまでは、交点対応付け部31での交点の対応付
けが繰り返される。しかし、探索する枠の順番に応じて
異なる結果が生じ、かつ、候補の中に正解が含まれてい
ない場合もある。例えば、図40(a)の「5」が枠と
接触している画像に対して先ず左枠の連結性を求めた場
合、処理後の文字は同図(b)に示すようになってしま
う。又、右枠の連結性を先に求めた場合、処理後の文字
は同図(c)に示すようになってしまう。ところが、こ
の場合の正解は同図(d)に示す文字である。
した問題を解決し得る、本発明になる画像抽出方式の第
3実施例について、以下に説明する。図41は、第3実
施例の要部である交点対応付け部31−1を示す。他の
部分は第2実施例と同じであるので、その図示及び説明
は省略する。本実施例では、交点間を文字線分の距離及
び傾きの連続性により対応付け、枠、罫線等の線幅に応
じて距離や連続性の判定基準を適応的に変化させる。
は、距離対応部31c、連続性対応部31d、線幅算出
部31b、サイズ確認部31f、連結性仮対応部31
g、交点間距離算出部31h、優先順位展開部31i及
び連結性対応部31jからなる。距離対応部31cに
は、文字/枠交点算出部25の出力が供給される。他
方、連結性仮対応部31gには、連結性確認部33の出
力が供給される。又、サイズ確認部31f及び連結性対
応部31jの出力は、枠内文字補完部32へ供給され
る。
から文字を切り出す。つまり、文字枠のサイズや位置の
わからない文字枠に対して、接触或ははみ出して書かれ
た手書き文字から一文字一文字を切り出すものとする。
ただし、本実施例で対象となる入力パターンは、極端な
傾きや回転の補正、雑音除去及びかすれの穴埋め等の前
処理を施された2値画像である。
部31と異なり、交点の対応付け数の違いに応じた対応
付け、つまり、一対一又は一対多に応じた交点の対応付
けは行わない。その代わり、距離対応と連続性対応で交
点の対応付けを行う。以下に説明する条件1と条件3は
距離対応の交点の対応付けを行う場合であり、条件2は
連続性対応の交点の対応付けを行う場合である。条件1
から条件3に変化するにつれて対応付ける文字線分間の
距離が遠なるが、交点の対応付けは、どれか一つの条件
に適合すれば行う。
と共に説明した条件1を満足するか否かを判定する。条
件1を満足すれば、交点の対応付けを行う。又、条件1
を満足する交点が複数存在すれば、それら全ての交点の
対応付けを行う。
性対応部31dで図19(b)と共に説明した条件2を
満足するか否かを判定する。条件2を満足すれば、交点
の対応付けを行う。
に関しては、距離対応部31cで図19(c)と共に説
明した条件3を満足するか否かを判定する。条件3を満
足すれば、交点の対応付けを行う。
在する2つの交点間の距離を外輪郭と内輪郭の夫々で算
出し、その平均を求めることにより文字線分の線幅を算
出する。
満足したパターンに対して、対応付けてできるパターン
のサイズを求め、そのサイズと、予めわかっている文字
サイズ、又は、直線/枠抽出部22で計算した枠のサイ
ズと比較され、比較によって得られるサイズ比が大きす
ぎる場合は交点の対応付けをしないようにする。図16
で示したように、一つの文字線分に存在する2つの交点
の中点を求め、外輪郭の中点と内輪郭の中点のX軸方向
の座標値の差dk ,dk+1 、或はY軸方向の座標値の差
を求める。座標値の差が、夫々外輪郭と内輪郭との差か
ら求められる枠の線幅Wにαの重み付けをした値以下の
場合、それらの交点を対応付ける。
のような場合でも、処理後は同図(b)に示すようにな
り、図39と共に説明した問題は解決される。
確認できない文字パターン或はその一部に対し、交点算
出部25で算出された交点を用いて、外部から、或は、
図43の如き優先順位に応じて、連結性が保たれるよう
な交点の対応付けを行う。
の距離を算出する。例えば、図44(a)のような画像
から同図(b)に示す線分が抽出されているとすると、
各線分には連結パターン抽出部21において「イ」、
「ロ」、「ハ」の如きラベルが付けられている。図44
(b)の例では、交点間の距離はラベル「イ」と
「ロ」、「ロ」と「ハ」の間の2箇所について、夫々左
右の枠部分で算出される。この例では、ラベル「イ」と
「ロ」の間の距離は左枠部分で「3」、ラベル「ロ」と
「ハ」の間の距離は左枠部分で「4」である。同様に、
ラベル「イ」と「ロ」の間の距離は右枠部分で「4」、
ラベル「ロ」と「ハ」の間の距離は右枠部分で「2」で
ある。
位のテーブル310に従って交点の対応付けを決定す
る。この場合、優先順位展開部31iはテーブル310
に「丸」印で示されたように、距離の小さい方の交点を
対応付ける。「×」印で示される対応条件は、優先順位
に寄与しない。尚、テーブル310の対応条件の設定は
図43のものに限定されないことは言うまでもない。
1iで対応付けられた交点間を図44(c)に示すよう
に対応付ける。
場合と同様に、補完した接触文字パターン或はその一部
と、属性を付加された文字パターン或はその一部とを統
合する。
図45に示すように、文字の種類毎に優先順位を与える
ものでも良い。この場合、図46(a)に示す画像から
は、文字の種類がアルファベットであれば、同図(b)
に示す「E」が最終的に得られる。又、図47(a)に
示す画像からは、文字の種類がカタカナであれば、同図
(b)に示す「シ」が最終的に得られる。更に、図47
(a)に示す画像からは、文字の種類が数字であれば、
同図(b)に示す「7」が最終的に得られ、文字の種類
がひらがなであれば同図(c)に示す「り」が得られ
る。尚、図47(a)に示す画像からは、文字の種類が
カタカナであれば、同図(b)に示す「ワ」又は「ク」
が最終的に得られる。
一実施例をより詳細に説明する図であり、処理をソフト
ウェアで実現する場合のフローチャートを示す。
付けのない交点の数NUMを設定する。ステップS20
2は、NUM>0であるか否かを判定し、判定結果がN
Oであれば処理を終了する。他方、ステップS202の
判定結果がYESであれば、ステップS203で交点の
仮対応を行い、処理を終了する。
の一実施例をより詳細に説明する図であり、処理をソフ
トウェアで実現する場合のフローチャートを示す。
う仮対応の交点を(ak ,bk )、(ak+1 ,bk+1 )
に設定する。ステップS212は、交点間距離Lをak+
1 −bk に設定し、処理を終了する。
一実施例をより詳細に説明する図であり、処理をソフト
ウェアで実現する場合のフローチャートを示す。
順位テーブル310又は優先順位ファイルを読み込む。
ステップS222は、交点の対応付けの条件を優先順位
テーブル310に基づいて決定する。ステップS223
は優先順位が文字の種類別に決定されているか否かを判
定し、判定結果がNOであれば処理を終了する。他方、
ステップS223の判定結果がYESの場合は、ステッ
プS224で文字の種類の情報があるか否かを判定し、
判定結果がNOであれば処理を終了する。ステップS2
24の判定結果がYESであれば、ステップS225
で、文字の種類別に優先順位を設定し、処理を終了す
る。
実施例をより詳細に説明する図であり、処理をソフトウ
ェアで実現する場合のフローチャートを示す。
の種類別の対応付けか否かを判定し、判定結果がYES
であればステップS232で文字の種類を判定する。ス
テップS231の判定結果がNO場合、或は、ステップ
S232の後で、ステップS233が一番優先順位の高
い対応条件による対応付けにより文字パターンを生成す
る。ステップS234は、対応条件がM個(Mは複数)
あるか否かを判定し、判定結果がNOであれば処理を終
了する。他方、ステップS234の判定結果がYESの
場合は、ステップS235でMをデクリメントし、対応
付けにより候補の文字パターンを生成する。ステップS
235は、M−1回行われ、その後処理は終了する。
等と接触する文字を抽出する場合には、枠、罫線等の位
置、サイズ等に関するフォーマット情報及び枠、罫線等
の傾きに関する情報を予め帳票データとしてユーザが入
力しておく必要があった。この様な技術は、例えば特開
昭62−212888号公報及び特開平3−12618
6号公報等にて提案されている。
罫線等の位置やサイズに関する情報を予め入力しておく
必要はない。
図2に示す如き直線/枠抽出部22で行われる。つま
り、画像抽出の対象が一文字枠の場合、ラベリングで得
られた部分パターン毎に縦横方向の投影を取り、その投
影値の部分パターンを矩形近似して得られる縦横のサイ
ズに対する比を計算し、所定のしきい値以上であれば長
い直線と判断する。このため、枠が比較的大きく傾いた
場合には上記比が小さくなってしまい、直線が検出でき
ない。又、枠が多少傾いている場合であっても、枠が大
きい場合にはやはり上記比が小さくなってしまうため、
直線が検出できない。従って、枠、罫線等が長い場合に
は、枠、罫線等の傾きに関する情報は予めユーザにより
入力されている必要がある。
文字枠のみであったが、横に長いブロック枠等を除去対
象とする場合には、枠、罫線等の傾きや回転が予め補正
されていることが前提となっており、図2の連結パター
ン抽出部21へ入力される入力パターンは回転補正等の
前処理を施されている。このため、ユーザは枠、罫線等
の傾きに関する情報を予め枠、罫線等毎に入力しなけれ
ばならず、情報の入力に時間がかかると共に、ユーザへ
の負担も比較的大きい。
る実施例について次に説明する。図53は、本発明にな
る画像抽出方式の第4実施例を示す図であり、処理の対
象となる入力パターンは、予め極端な傾きや回転の補
正、雑音の除去、かすれの穴埋め等の前処理を施された
2値画像であるものとする。又、本実施例では便宜上黒
枠の帳票から枠を除去するものとする。つまり、文字枠
に関しては、横に細長い一行のブロック枠が複数個あ
り、又、その枠のサイズ、位置及び傾きが分からないブ
ロック枠に対して手書き文字が書かれており、文字が枠
と接触したり枠からはみ出していても枠だけを除去す
る。
ターン抽出部40と、線分検出部41と、直線検出部4
2と、枠検出部43と、枠分離部44とが設けられてい
る。連結パターン抽出部40は、枠もしくは罫線等の直
線部分と文字、図形もしくは記号とから構成される入力
パターンから画素と画素が繋がっている部分パターンを
抽出する。線分検出部41は、隣接投影により連結パタ
ーン毎に一定長さで線分又は直線の一部を検出する。直
線検出部42は、得られた複数の線分又は直線の一部を
統合して長い直線を検出する。枠検出部43は、得られ
た複数の直線の間隔等により、文字枠を構成する直線を
抽出する。枠分離部44は、枠と枠の交点によりブロッ
ク枠を一文字毎の枠に分割して夫々の枠の幅を算出し、
その幅に従って連結パターンから文字枠を分離する。
ば図2に示した文字/枠交点算出部25〜図3に示した
連結パターン統合部34までの処理が考えられる。
40aからなる。複数のブロック枠が配置される位置の
相対的な関係に依存することなく各パターンを安定に抽
出するために、ラベリング部40aでは8連結で繋がっ
ているパターンをラベリングにより抽出する。このラベ
リングにより得られた部分パターンは、文字が接触して
いない場合の枠、枠に接触していない文字或は文字の一
部、文字の接触している枠のうち、いずれかである。そ
こで、これらの部分パターンを判別して枠を抽出する。
又、ラベリングで得られた部分パターンのサイズが後で
必要となるので、部分パターンを矩形近似して得られる
矩形の角の座標をラベリングの処理中に算出しておく。
投影部41b、縦横線分検出部41c及び横線分探索部
41dからなる。
部分パターン毎に細線化処理を行う。この細線化処理
は、線幅の太さを同じにして、枠だけに存在する長い直
線を抽出し易くするために行うものであり、細線化処理
自体としては、公知の技術を使用し得る。尚、部分パタ
ーンの細線化処理前の原パターンは、細線化されたパタ
ーンとは別に記憶しておき、後述する線分の探索時と枠
分離時とに使用する。
ンを縦横複数に分割し、縦横夫々の分割範囲内で隣接投
影を算出して、ある一定の長さの線分或は直線の一部を
矩形近似により検出する。「隣接投影」とは、注目行又
は列の投影値に周囲の行又は列の投影値を足し合わせた
結果を、投影値とするものである。これにより、直線が
傾きによって複数行又は列にわたっていても、直線を検
出することができる。従って、隣接投影を用いることに
より、ブロック枠等の大きな枠で、かつ、枠が傾いてい
る場合であっても、枠を構成する直線を検出することが
可能である。例えば図54に示すようにi行の投影値を
p(i)とすると、隣接投影値P(i)は次の(11)
式に基づいて算出できる。尚、図54ではj=1であ
る。又、列の投影値も行の投影値と同様に算出可能であ
る。
細に説明する図であり、処理をソフトウェアで実現する
場合のフローチャートを示す。
パターン抽出部40で得られた部分パターンを縦方向及
び横方向の複数の部分で分割する。ステップS302
は、縦横夫々の分割範囲内で投影を算出する。ステップ
S303は、算出された夫々の投影値に周囲の投影値を
加算する。更に、ステップS304は、上記(11)式
に基づいて隣接投影値を算出する。
bで算出された隣接投影値と縦横夫々の分割長との比が
所定のしきい値以上である部分を直線の候補のある位置
とする。又、例えば図56の部分aのように、複数の行
又は列が続いて所定のしきい値以上となった場合は、そ
れらをまとめた矩形範囲に直線があるものとする。検出
された直線又は直線の一部は矩形近似されているため、
以後「矩形線分」と呼ぶ。
と、傾いている長い直線は検出不能なため、部分パター
ンの分割数を多くし、分割長を短くする必要がある。し
かし、分割長が短くなると、文字を構成している短い直
線も多数検出されてしまう。これに対し、本実施例では
上記隣接投影を用いているので、比較的長い直線をも検
出可能である。
一実施例をより詳細に説明する図であり、処理をソフト
ウェアで実現する場合のフローチャートを示す。
投影部41bで算出された隣接投影値と縦横夫々の分割
長との比が所定のしきい値以上であるか否かを判定す
る。ステップS311の判定結果がNOであれば、ステ
ップS312で線分が存在しないものと判断する。他
方、ステップS311の判定結果がYESであれば、ス
テップS313で線分が存在するものと判断する。この
場合、ステップS314はは存在すると判断された線分
が、その上下にある線分と接しているか否かを判定す
る。ステップS314の判定結果がNOであれば、ステ
ップS314は存在すると判断された線分を矩形線分と
する。他方、ステップS314の判定結果がYESであ
れば、ステップS316は存在すると判断された線分と
その上下にある線分とを統合し、ステップS317は統
合された線分を矩形線分とする。
1cで検出された矩形線分のうち、横線分が途中で切れ
ていないかどうかを確かめるための探索を行う。探索の
開始点は、矩形線分のなかで一番細い部分とする。例え
ば図58に「白丸」で示す中点等の一定の場所を開始点
とすると、同図に示す如く開始点が文字の部分であった
場合に探索が失敗する可能性が高いが、「黒丸」で示す
一番細い部分は文字である可能性が低いため、より確実
に探索を行うことができる。
実施例をより詳細に説明する図であり、処理をソフトウ
ェアで実現する場合のフローチャートを示す。
線分検出部41cで検出された矩形線分のうち、最も線
幅の細い部分を算出する。ステップS322は、算出さ
れた最も線幅の細い部分を開始点として、左右に探索を
開始する。ステップS323は探索を行い、ステップS
324は分岐点が存在するか否かを判定する。ステップ
S324の判定結果がYESであれば、ステップS32
5で分岐点を記憶する。又、ステップS324の判定結
果がNO或はステップS325の後で、ステップS32
6が矩形線分の端に達したか否か、或は、探索が失敗し
たか否かを判定する。ステップS326の判定結果がN
Oであれば、処理はステップS323へ戻る。
Sの場合は、ステップS327で探索を終了し、ステッ
プS328で分岐点を記憶したか否かを判定する。ステ
ップS328の判定結果がNOであれば、処理は後述す
るステップS333へ進む。ステップS328の判定結
果がYESであれば、ステップS329で記憶されてい
る分岐点に戻って、ステップS330で探索を行う。ス
テップS331は、矩形線分の端に達したか否か、或
は、探索が失敗したか否かを判定する。ステップS33
1の判定結果がNOであれば、処理はステップS330
へ戻る。他方、ステップS331の判定結果がYESで
あれば、ステップS232で探索を終了し、ステップS
333で探索の終了点が矩形線分の左右の端に達したか
否かを判定する。ステップS333の判定結果がNOで
あれば、ステップS334は矩形線分が横線分ではない
と判断する。又、ステップS333の判定結果がYES
であれば、ステップS335は矩形線分が横線分である
と判断する。
は、線分統合部42a、直線検出部42b、線分統合部
42c及び直線検出部42bからなる。線分統合部42
a及び直線検出部42bは、横線分に対して設けられて
おり、線分統合部42c及び直線検出部42bは縦線分
に対して設けられている。直線検出部42は、図60
(a)に示す線分y,zのように、途中で途切れていな
い矩形線分同士が接触或は繋がっていれば、これらの矩
形線分を統合して長い直線とする。更に、図60(a)
に示す線分x,yのように、矩形線分が互いに繋がって
いなくても、垂直方向の距離が上記隣接投影の際加える
行又は列数j以内であれば、これらの矩形線分を統合し
て長い直線とする。直線検出部42bは、線分統合部4
2aで統合された直線の長さと、部分パターンを近似す
る矩形の長さとの比が所定のしきい値以上であれば、横
枠を構成する直線の候補であると判断する。尚、直線検
出部42bは、図60(b)に示すように、線分統合部
42aで統合された線分xの左上の座標と線分zの右上
の座標を結んだ直線の傾きから、統合された直線の傾
き、即ち、部分パターンの傾きを求める。この部分パタ
ーンの傾きは、後述する処理において用いられる。縦線
分については、線分統合部42c及び直線検出部42b
により、検出された全ての矩形線分について、上記線分
統合部42a及び直線検出部42bと同様な処理を行
う。つまり、線分統合部42cは矩形線分の統合を行っ
て直線を検出し、直線検出部42bは検出された直線を
矩形近似して縦枠を構成する直線の候補であると判断す
る。
2a及び線分統合部42cの処理の一実施例をより詳細
に説明する図であり、処理をソフトウェアで実現する場
合のフローチャートを示す。
された矩形線分同士の距離を算出する。ステップS34
2は、算出された距離が隣接投影の際加える行又は列数
以内であるか否かを判定する。ステップS342の判定
結果がNOであれば、ステップS343で矩形線分の統
合は行わないものとする。他方、ステップS342の判
定結果がYESであれば、ステップS344は矩形線分
の統合を行う。
は、横枠検出部43a、探索部43b、線間隔算出部4
3c、ヒストグラム作成部43d及び縦枠検出部43e
からなる。横枠検出部43aは、直線検出部42の直線
検出部42bで検出された横枠を構成する直線の候補か
ら、横枠を検出する。本実施例では、横一行、かつ、一
文字ずつ等間隔の枠を持つブロック枠を対象としている
ため、得られた横方向の直線の中で最外郭のものを横枠
とする。探索部43bは、縦枠を検出するため、直線検
出部42の直線検出部42dで検出された縦枠を構成す
る直線の候補及び横枠検出部43aで検出された横枠に
基づいて、縦線分の探索を行う。具体的には、縦枠の候
補の直線が、横枠検出部43aで得られた上下の横枠ま
で達しているか、或は、途中で途切れていないかを、探
索により調べる。探索方法は、横線の場合と同様に、矩
形範囲内で一番細いところを開始点とする。探索の結
果、上下共に横枠に達している縦直線は縦枠の候補と
し、その他は文字の一部分とみなして省く。次に、線間
隔算出部43cで、縦線の候補に残った縦直線同士の間
隔を算出する。又、ヒストグラム作成部43dは、算出
された線間隔とその出現頻度をヒストグラムに示し、縦
枠検出部43eは、著しく他と異なる間隔を形成する縦
直線を縦枠の候補から除外することにより、縦枠の候補
から除外されなかった縦直線を縦枠であるものとする。
をより詳細に説明する図であり、処理をソフトウェアで
実現する場合のフローチャートを示す。同図中、図59
と実質的に同じステップには同一符号を付し、その説明
は省略する。
も細い部分を開始点として上下に探索を開始する。ステ
ップS346及びステップS351は、夫々上下の横枠
に達したか、或は、探索が失敗したか否かを判定する。
ステップS353は、探索終了点が上下の横枠に達した
か否かを判定する。ステップS353の判定結果がNO
であればステップS354は縦枠の可能性がないと判断
し、判定結果がYESであればステップS355は縦枠
の可能性があると判断する。
る。枠分離部44は、枠交点算出部44a、一文字範囲
分離部44b、投影部44c、直線検出部44d、枠探
索部44e、辺幅算出部44f、枠除去部44g及び接
触文字補完部44hとからなる。枠交点算出部44a
は、枠検出部43から得られた縦枠及び横枠から、縦枠
と横枠との交点を算出する。図63に示す例では、交点
A1,B1,A2,B2,・・・を算出する。そして、
一文字範囲分離部44bは、図63に示すように、算出
した交点を用いて(A1,A2,A3,A4)、(B
1,B2,B3,B4)、・・・という具合に、左から
一文字ずつの範囲に分離して行く。この結果、夫々の分
離部分は一文字枠と同様になる。投影部44cは、各分
離部分の投影を算出し、直線検出部44dは、得られた
投影から直線を検出する。より具体的には、直線検出部
44dは、各分離部分の各行及び列の投影値と各分離部
分を矩形近似して得た矩形との夫々の比を計算し、その
比より文字枠を構成する直線の候補を求める。枠探索部
44eは、文字枠を構成する直線の候補の中から直線間
の距離を算出し、文字枠を構成する最外郭の直線を抽出
することにより、各文字枠を探索して文字枠の位置を求
める。辺幅算出部44fは、最外郭の直線に隣接する候
補直線を求め、探索された文字枠の各辺の線幅を算出す
る。枠除去部44gは、各辺の最外郭の直線の位置及び
算出された各辺の線幅に基づいての文字枠を一つずつ除
去する。接触文字補完部44hは、文字枠が除去される
ことによって欠けてしまった文字部分を補完する。これ
により、文字枠を除去されて文字が一文字ずつ切り出さ
れて行く。
枠の上下に除去されない部分ra,rb,rc,rdが
残ってしまうこともある。そこで、上記直線検出部42
で求めた傾きが比較的大きい場合は、枠除去部44gで
の枠の除去範囲を少し多めにしても良い。
を切り出した場合の一例を説明する図である。図65
(a)は原パターンを示し、同図(b)は図53の枠分
離部44の枠除去部44gにより抽出された枠を示す。
図66(a)は枠分離部44の枠除去部44gで枠を抽
出することにより切り出された文字を示し、同図(b)
は枠分離部44の接触文字補完部44hにより補完され
た文字を示す。
は、抽出された部分パターンのうち一文字ずつ枠で仕切
られているブロック枠に対し、各部分パターンから直線
を抽出し、抽出された直線が枠であるか否かを判断し、
文字領域を残して枠線を消去するので、次のような特徴
1)〜9)を有する。
字枠だけを確実に除去することができる。
候補同士の間隔と出現頻度を示すヒストグラムを作成
し、このヒストグラムのピークから著しく離れた間隔を
形成する直線を枠のこうほから除外することで、対象と
している枠がどの様な枠であるかという情報を必要とせ
ずに枠を抽出することができる。
行又は列の投影値を加えたものを、その行又は列の投影
値とする隣接投影を用いることで、傾きのある直線の検
出が可能となる。
周囲の行又は列数を傾きによって変化させることで、確
実に直線の存在する範囲を指定することができる。
線化パターンについて隣接投影を行うことで、直線部分
を確実に検出することができる。
って探索する際、探索の開始点を文字部分でなく枠部分
とするために、矩形内のパターンが一番細いところを開
始点とすることで、確実に探索を行うことが可能とな
る。
おき、探索が失敗した場合には記憶しておいた分岐点に
戻って再び探索を行うことによって、確実に直線の探索
を行うことができる。
検出することで、長さが分からない場合でも直線の検出
を確実に行うことができる。
より、枠の除去を行う際、枠の除去幅を変化させること
が可能となり、枠の消し残し及び消しすぎを防止するこ
とができる。
明によれば、枠もしくは罫線等の直線部分と文字、図形
もしくは記号とから構成される画像から、枠もしくは罫
線等の直線部分を確実に除去することができ、高品質の
文字、図形もしくは記号を抽出することができる。この
ため、文字認識装置等において、文字、図形、記号の認
識率を著しく向上させることができる。
い線幅の太い枠を高速に、かつ、正確に抽出できる。
又、枠に接触した文字、図形もしくは記号から、それら
の一部を削り取ることなく、枠だけを正確に分離するこ
とができ、文字、図形もしくは記号を高品位に復元する
ことができる。
い枠を高速に、かつ、正確に抽出できる。又、枠に接触
した文字、図形もしくは記号から、それらの一部を削り
取ることなく、枠だけを正確に分離することができ、文
字、図形もしくは記号を高品位に復元することができ
る。
という漢字のように枠に相当する矩形部分を持つ文字の
一部を誤って枠として抽出することがなく、枠を安定し
て抽出することができる。
線をも確実に抽出することが可能となる。
ロック枠であっても、文字枠を確実に、かつ、正確に抽
出することができる。
ブロック図である。
ブロック図である。
ブロック図である。
す図である。
ートである。
ートである。
である。
る。
理を示すフローチャートである。
理を示すフローチャートである。
ャートである。
郭等を示す図である。
ある。
ャートである。
ーチャートである。
ャートである。
る。
ャートである。
チャートである。
ャートである。
するフローチャートである。
す図である。
ートである。
ローチャートである。
ローチャートである。
ャートである。
するフローチャートである。
チャートである。
ローチャートである。
す図である。
を示す図である。
ンを切り出した例を示す図である。
ある。
る図である。
すブロック図である。
る図である。
る。
の対応付けを説明する図である。
る。
切り出しを説明する図である。
しを説明する図である。
場合の文字の切り出しを説明する図である。
ーチャートである。
ローチャートである。
ーチャートである。
チャートである。
すブロック図である。
ャートである。
ーチャートである。
チャートである。
である。
フローチャートである。
トである。
る。
説明する図である。
例を示す図である。
である。
Claims (38)
- 【請求項1】 枠もしくは罫線等の直線部分と文字、図
形もしくは記号から構成される画像から、文字、図形、
記号を抽出する画像抽出方式であって、 枠もしくは罫線等の直線部分と文字、図形もしくは記号
とから構成される画像から画素と画素が繋がっている部
分パターンを抽出する連結パターン抽出手段(1)と、 該連結パターン抽出手段(1)により抽出された部分パ
ターンから、枠もしくは罫線等の直線部分を抽出する直
線抽出手段(2,3,4)と、 該直線抽出手段(2,3,4,41,42,43)の抽
出結果に基づき、上記部分パターンを、文字、図形もし
くは罫線等の直線部分だけのパターンと、文字、図形も
しくは記号と枠もしくは罫線等の直線部分が接触したパ
ターンとに分類する属性付加手段(5)と、 文字、図形もしくは記号と枠もしくは罫線等の直線部分
が接触したパターンから枠もしくは罫線等の直線部分を
分離する分離手段(6)とを有する画像抽出方式。 - 【請求項2】 文字、図形もしくは記号と枠もしくは罫
線等の直線部分が接触したパターンから、文字、図形も
しくは記号と枠もしくは罫線等の直線部分との交点を算
出する交点算出手段(7)と、 該交点算出手段(7)により算出された交点間を対応付
ける交点対応付け手段(8)と、 該交点対応付け手段(8)により対応付けられた交点に
基づき、枠もしくは罫線等の直線部分内の文字、図形も
しくは記号の領域を求めて、求めた領域を補完する補完
手段(9)とを更に有する請求項1の画像抽出方式。 - 【請求項3】 抽出された文字、図形もしくは記号のパ
ターンに対して、パターンの連結性の確認を行い、連結
性が確認されたパターンをそのまま抽出すると共に、連
結性が確認できないパターンを前記交点対応付け手段
(8)へフィードバックする連結性確認手段(10)を
更に有し、 前記交点対応付け手段(8)は、該連結性確認手段(1
0)によりフィードバックされたパターンに対して、再
び、前記交点算出手段(7)により算出された交点を用
いて交点の対応付けをする再対応付けを行い、 前記補完手段(9)は、該交点対応付け手段(8)によ
り再対応付けをされた交点に基づき、枠もしくは罫線等
の直線部分内の文字、図形もしくは記号の領域を求め
て、求めた領域を補完する請求項2の画像抽出方式。 - 【請求項4】 前記連結性確認手段(10)は、文字、
図形もしくは記号と枠もしくは罫線等の直線部分が接触
したパターンの候補だけに対してラベリングを行い、連
結成分を求める請求項3の画像抽出方式。 - 【請求項5】 前記連結性確認手段(10)は、連結性
が確認できないパターンのうち、前記交点対応付け手段
(8)で再対応付けを行う交点を、交点間を結ぶ直線が
枠もしくは罫線等の直線部分上にある場合に限定する請
求項3の画像抽出方式。 - 【請求項6】 前記交点対応付け手段(8)は、 文字、図形、記号を構成する線分と枠もしくは罫線等の
直線部分との連続する交点の中から上記線分の両端点を
抽出して交点の対応付け候補とする手段と、 枠もしくは罫線等の直線部分を構成する内側と外側の2
つの輪郭の夫々での交点の候補の点の数を計算し、候補
点の数が一致した場合に、順序通り候補点間を対応付け
て、対応付けた候補間の距離を算出する手段と、 枠もしくは罫線等の直線部分の線幅を求めてその線幅の
値を基に、候補点間の距離を調べて対応付けを確認する
手段とを備えた請求項3の画像抽出方式。 - 【請求項7】 前記交点対応付け手段(8)は、 文字、図形、記号を構成する線分と枠もしくは罫線等の
直線部分との連続する交点の中から上記線分の両端点を
抽出して交点の対応付け候補とする第1の手段と、 枠もしくは罫線等の直線部分を構成する内側と外側の2
つの輪郭の夫々での交点の候補の点の数を計算する第2
の手段と、 上記候補点の数が一致しなかった場合に、文字、図形も
しくは記号を構成する各線分の2つの交点の候補の中点
を算出すると共に、枠もしくは罫線等の直線部分を構成
する内側と外側の2つの輪郭の夫々で算出した中点間の
距離を算出する第3の手段と、 求めた中点間の距離が、枠もしくは罫線等の直線部分の
線幅の値により定まる所定のしきい値以内であれば、そ
の中点間、及び、中点を構成した交点の候補を対応付け
る第4の手段と、 該第4の手段により対応付けられなかった交点の候補に
ついて、その候補点での文字、図形もしくは記号を構成
する線分の傾き、或は、枠もしくは罫線等の直線部分と
垂直に交わる直線を求め、候補点における上記線分の傾
きに基づき、既に対応付けた交点の候補も含めて、上記
線分の連続性により候補点間を対応付ける第5の手段
と、 該第4の手段により対応付けができなかった交点の候補
について、既に対応付けた交点の候補も含めて候補点間
の最小距離を算出して、その最小距離が所定のしきい値
以下の場合に、その候補点間を対応付ける第6の手段と
を備えた請求項3の画像抽出方式。 - 【請求項8】 前記交点対応付け手段(8)は、対応付
けてできるパターンをラベリングして矩形近似し、矩形
近似されたパターンと文字、図形もしくは記号のサイ
ズ、或は、枠サイズとの比を算出し、上記比が所定のし
きい値を越える場合には、交点の対応付けをキャンセル
する請求項1〜7のうちいずれか一項の画像抽出方式。 - 【請求項9】 前記補完手段(9)は、 前記交点対応付け手段(8)で対応付けた交点間を結ぶ
直線を求め、直線の内部だけを文字、図形もしくは記号
の領域と判断する手段と、 対応付けられなかった文字、図形もしくは記号を構成す
る一つの線分の交点における上記線分の輪郭線の傾きを
求め、上記各交点を通り、求めた輪郭線の傾きを持つ2
つの直線を引いて、その直線の交差点を求める手段と、 その交差点が枠もしくは罫線等の直線部分の内部にあれ
ば、上記2直線で囲まれた範囲内だけを文字、図形もし
くは記号の領域とする手段と、 その交差点が枠もしくは罫線等の直線部分の外側にあれ
ば、上記2直線と枠もしくは罫線等の直線部分の上記交
点と反対側の外輪郭線で囲まれた範囲を文字、図形もし
くは記号の領域と判断する手段とを備えた請求項2〜8
のうちいずれか一項の画像抽出方式。 - 【請求項10】 前記補完手段(9)は、枠もしくは罫
線等の直線部分内の領域を、文字、図形、記号の線幅に
相当する直線で補完する請求項2〜9のうちいずれか一
項の画像抽出方式。 - 【請求項11】 抽出した枠の位置に基づき、部分パタ
ーンの一部が枠の内部にあるか否かを判定し、内部にあ
れば、それらの部分パターンを一つの文字、図形もしく
は記号の構成要素として統合し、統合したパターンのサ
イズを求めて、そのサイズと枠のサイズ比を求め、求め
たサイズ比が所定のしきい値の範囲内にあるか否かを判
定し、上記しきい値内であれば統合したパターンを採用
し、上記しきい値外であれば、統合せずに元の部分パタ
ーン毎抽出する連結パターン統合手段(11)を更に有
する請求項1〜10のうちいずれか一項の画像抽出方
式。 - 【請求項12】 前記交点対応付け手段(8)は、交点
が一対一に対応付けられた文字、図形、記号を構成する
線分について、枠もしくは罫線等の直線部分を構成する
内側と外側の2つの輪郭の夫々における交点候補間の距
離を算出し、算出した距離の平均値を求めることによ
り、文字、図形記号を構成する線分の平均線幅を算出す
る手段を備えた請求項2〜10のうちいずれか一項の画
像抽出方式。 - 【請求項13】 前記分離手段(6)は、枠もしくは罫
線等の直線部分と文字、図形もしくは記号が接触したパ
ターンから枠もしくは罫線等の直線部分を分離したパタ
ーンに対して、ラベリングにより連結成分を求め、各連
結成分の面積に基づき、枠もしくは罫線等の直線部分の
一部として残った雑音を除去する手段を備えた請求項1
〜10のうちいずれか一項の画像抽出方式。 - 【請求項14】 前記交点対応付け手段(8)は、 交点間を文字線分間の距離及び傾きの連続性により対応
付ける手段と、 文字線分の線幅に応じて距離や連続性の判定基準を適応
的に変化させる手段とを備えた請求項2の画像抽出方
式。 - 【請求項15】 前記交点対応付け手段(8)は、 連結性が確認できない文字パターン或はその一部に対
し、前記交点算出手段(7)で算出された交点を用い
て、少なくとも異なるラベルの交点間の距離に応じて設
定された優先順位に従って連結性が保たれるような交点
の対応付けを行う手段を備えた請求項2の画像抽出方
式。 - 【請求項16】 前記優先順位は、交点の対応条件をテ
ーブルの形式に予め設定されている請求項15の画像抽
出方式。 - 【請求項17】 前記交点対応付け手段(8)は、 連結性が確認できない文字パターン或はその一部に対
し、前記交点算出手段(7)で算出された交点を用い
て、所定の優先順位に従って連結性が保たれるような交
点の対応付けを行う手段を備えた請求項2の画像抽出方
式。 - 【請求項18】 前記優先順位は、交点の対応条件を文
字の種類に応じてテーブルの形式に予め設定されている
請求項17の画像抽出方式。 - 【請求項19】 前記直線抽出手段(41,42,4
3)は、 前記連結パターン抽出手段(1)により抽出された部分
パターンのうち、一文字ずつ枠で仕切られているブロッ
ク枠に対し、各部分パターンから直線部分を抽出する第
1の手段と、 該第1の手段により抽出された直線部分が枠であるか否
かを判断する第2の手段とを備えた請求項1の画像抽出
方式。 - 【請求項20】 前記第2の手段は、前記第1の手段に
より抽出された直線部分がその直線部分と垂直、かつ、
部分パターンの中で最外郭である直線部分に達している
か否かに応じて、その直線部分が枠の候補であるか否か
を判断する請求項19の画像抽出方式。 - 【請求項21】 矩形で各矩形が分離した枠と文字、図
形もしくは記号とから構成される画像から、枠を抽出す
る画像抽出方式において、 画像を構成するパターンから画素と画素が繋がっている
部分パターンを抽出する連結パターン抽出手段(21)
と、 抽出された各部分パターン毎に垂直方向と水平方向の投
影を求める手段(22a)と、 部分パターンを矩形で近似し、垂直方向の投影値と近似
された矩形の垂直方向の長さと、水平方向の投影値と近
似された矩形の水平方向の長さの夫々の比を求め、その
比より枠を構成する直線の候補を求める手段(22b)
と、 上記直線の候補間の距離を算出し、枠を構成する最外郭
の直線を抽出すると共に、上記最外郭の直線に隣接する
直線の候補を求め、枠の各辺の線幅を算出する手段(2
2c,22e)と、 各辺の最外郭の直線の位置と、その線幅より枠を分離す
る手段(22f)とを有する画像抽出方式。 - 【請求項22】 矩形で各矩形が分離した枠と文字、図
形もしくは記号とから構成される画像から、枠を抽出す
る画像抽出方式において、 画像を構成するパターンから画素と画素が繋がっている
部分パターンを抽出する連結パターン抽出手段(21)
と、 部分パターンを矩形で近似し、近似された矩形を構成す
る直線の両端、及び、中点等の複数の点から矩形内部に
垂線を下ろして部分パターンと接触した位置を開始点と
して抽出し、抽出された開始点より、左右もしくは上下
に部分パターンに沿って探索する手段(22a,22
b,22c,22d)と、 探索によって得られた直線の長さと、上記近似矩形の各
辺の長さの比を算出し、その比より枠を構成する直線の
候補を求める手段(22e)と、 上記直線の候補間の距離を算出し、枠を構成する最外郭
の直線を抽出すると共に、上記最外郭の直線に隣接する
直線の候補を求め、枠の各辺の線幅を算出する手段(2
2d)と、 各辺の最外郭の直線の位置と、その線幅より枠を分離す
る手段(22f)とを有する画像抽出方式。 - 【請求項23】 抽出された枠を全画像にわたってスキ
ャンして、前記連結パターン抽出手段(21)により抽
出された部分パターンとのマッチングを行い、新に枠を
抽出する手段を更に有する請求項22又は23の画像抽
出方式。 - 【請求項24】 前記連結パターン抽出手段(21)に
より抽出された部分パターンを矩形近似し、近似された
矩形と抽出された枠とのサイズ比を算出する手段と、 算出したサイズ比が所定のしきい値内の部分パターンだ
けに絞り込んで、抽出済の枠とのマッチングを行って、
新に枠を抽出する手段とを更に有する請求項23の画像
抽出方式。 - 【請求項25】 矩形で各矩形が分離した枠と文字、図
形もしくは記号とから構成される画像から、枠を抽出す
る画像抽出方式において、 画像を構成するパターンから画素と画素が繋がっている
部分パターンを抽出する連結パターン抽出手段(21)
と、 該連結パターン抽出手段(21)により抽出された部分
パターンから枠を抽出する枠抽出手段(2,3,4)
と、 該枠抽出手段(2,3,4)の抽出結果に基づき、上記
部分パターンを、文字、図形もしくは記号だけからなる
パターンと、枠だけのパターンと、文字、図形もしくは
記号と枠が接触したパターンとに分類する属性付加手段
(5)と、 抽出された枠のサイズ分だけ、左右、もしくは、上下の
範囲内に存在する部分パターンを抽出し、抽出した全て
の部分パターンが該属性付加手段(5)において、文
字、図形もしくは記号だけからなるパターンと判定され
ている場合に、上記抽出された枠を文字、図形もしくは
記号だけからなるパターンと判定し直す手段とを有する
画像抽出方式。 - 【請求項26】 枠もしくは罫線等の直線部分と文字、
図形もしくは記号とから構成される画像から、傾きを持
ったり、雑音を含んだ枠もしくは罫線等の直線部分を抽
出する画像抽出方式において、 開始点の座標から傾きを考慮した垂直もしくは水平区間
を定め、その区間内で4連結或は8連結で繋がれたパタ
ーンを水平もしくは垂直に追跡して追跡できたパターン
の連続画素数を直線の長さとして換算する手段(22
d)と、 追跡してできたパターンをその連続画素数分の長さを持
つ直線部分として抽出する手段(22f)とを有する画
像抽出方式。 - 【請求項27】 一文字ずつ枠で仕切られているブロッ
ク枠と、文字、図形もしくは記号とから構成される画像
から画素と画素が繋がっている部分パターンを抽出する
連結パターン抽出手段(40)と、 該連結パターン抽出手段(40)により抽出された部分
パターンから直線を検出する直線抽出手段(41,4
2)と、 該直線抽出手段(41,42)により検出された直線か
ら枠を構成する直線を検出する枠検出手段(43)と、 該枠検出手段(43)により検出された直線を部分パタ
ーンから分離することにより文字、図形もしくは記号を
切り出す枠分離手段(44)とを有し、 該枠検出手段(43)は、部分パターン中の直線がその
直線と垂直、かつ、部分パターンの中で最外郭である直
線に達しているか否かによりその直線が枠を構成する直
線の候補であるか否かを判断する第1の手段と、該第1
の手段により得られた枠を構成する直線の候補同士の間
隔に応じて枠を構成する直線を決定する第2の手段とを
備えた画像抽出方式。 - 【請求項28】 前記枠検出手段(43)の前記第2の
手段は、枠を構成する直線同士の間隔の出現頻度を示す
ヒストグラムを作成し、そのヒストグラムのピークから
所定の値以上離れた間隔を形成する直線を候補から除外
することにより枠を構成する直線を決定する請求項27
の画像抽出方式。 - 【請求項29】 前記枠分離手段(44)は、 前記枠検出手段(43)により検出された枠の交点を算
出する手段と、 算出された交点を用いてブロック枠を一文字毎の範囲に
分離する手段と、 分離された一文字毎の範囲の投影を得る手段と、 得られた投影から枠を構成する直線を検出する手段と、 各文字枠を探索して文字枠の位置を求める手段と、 探索された文字枠の各辺の線幅を算出する手段と、 算出された各辺の線幅に基づいての文字枠を一つずつ除
去する手段と、 文字枠が除去されることによって欠けてしまった文字部
分を補完する手段とを備えた請求項27又は28の画像
抽出方式。 - 【請求項30】 前記直線抽出手段(41,42)は、 前記連結パターン抽出手段(40)により抽出された部
分パターンから、一定長さの線分或は直線の一部を矩形
近似により検出する線分検出手段(41)と、 該線分検出手段(41)により検出さあれた矩形線分を
統合して所定長さ以上の直線を検出する直線検出手段
(42)とを備えた請求項27〜29のうちいずれか一
項の画像抽出方式。 - 【請求項31】 前記線分検出手段(41)は、ある行
又は列の投影値にその周囲の行又は列の投影値を加えた
値を上記ある行又は列の投影値とすると共に、画像の傾
きが予めわかっている場合はその傾きの大きさによって
加える行又は列の数を決定する隣接投影法を用いる請求
項30の画像抽出方式。 - 【請求項32】 前記線分検出手段(41)は、部分パ
ターンを細線化して得たパターンを隣接投影することに
より隣接投影値を得、前記直線検出手段(42)は、隣
接投影値と矩形近似した部分パターンの大きさとの比に
応じて矩形近似された直線を検出する請求項31の画像
抽出方式。 - 【請求項33】 前記線分検出手段(41)は、部分パ
ターンを縦、横複数に分割し、縦、横夫々の分割範囲内
で隣接投影を行うことで、直線を分割して複数の矩形近
似された直線を抽出する手段を備えた請求項30〜32
のうちいずれか一項の画像抽出方式。 - 【請求項34】 前記直線検出手段(42)は、前記線
分検出手段(41)により抽出された矩形内のパターン
を探索し、そのパターンの連結状態によって矩形内に直
線が存在するか否かを確認すると共に、矩形内のパター
ンが一番細いところを探索の開始点とする請求項30〜
33のうちいずれか一項の画像抽出方式。 - 【請求項35】 前記直線検出手段(42)は、 前記線分検出手段(41)により抽出された矩形内のパ
ターンを探索し、そのパターンの連結状態によって矩形
内に直線が存在するか否かを確認する手段と、 注目位置に対して探索方向に垂直なパターンへの繋がり
を調べることで分岐点があればその分岐点を記憶し、探
索が失敗した場合に記憶した分岐点に戻って再び探索を
行う手段とを備えた請求項30〜33のうちいずれか一
項の画像抽出方式。 - 【請求項36】 前記直線検出手段(42)は、前記線
分検出手段(41)で抽出した矩形同士が重なっている
か、或は、垂直方向の隣接投影の際加える行又は列の数
より離れている場合は、それらを連結することにより直
線を検出する請求項31の画像抽出方式。 - 【請求項37】 前記直線検出手段(42)は、連結さ
れた矩形範囲の両端又は中点等の複数の点を結ぶ直線の
傾きにより連結された直線の傾きを算出する手段を備え
た請求項30〜36のうちいずれか一項の画像抽出方
式。 - 【請求項38】 前記枠分離手段(44)は、 前記枠検出手段(43)により検出された枠の交点を算
出する手段と、 算出された交点を用いてブロック枠を一文字毎の範囲に
分離する手段と、 分離された一文字毎の範囲の投影を得る手段と、 得られた投影から枠を構成する直線を検出する手段と、 各文字枠を探索して文字枠の位置を求める手段と、 探索された文字枠の各辺の線幅を算出する手段と、 算出された各辺の線幅に基づいての文字枠を一つずつ除
去する手段と、 文字枠が除去されることによって欠けてしまった文字部
分を補完する手段とを備え、 該線幅を算出する手段は、前記直線検出手段(42)に
おいて算出された直線の傾きの大きさに従って線幅を変
化させる請求項37の画像抽出方式。
Priority Applications (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP5103257A JP2951814B2 (ja) | 1993-02-25 | 1993-04-28 | 画像抽出方式 |
US08/192,592 US5572602A (en) | 1993-02-25 | 1994-02-07 | Image extraction system for extracting patterns such as characters, graphics and symbols from image having frame formed by straight line portions |
KR1019940002913A KR0147318B1 (ko) | 1993-02-25 | 1994-02-18 | 화상추출시스템 |
US08/681,979 US6005976A (en) | 1993-02-25 | 1996-07-30 | Image extraction system for extracting patterns such as characters, graphics and symbols from image having frame formed by straight line portions |
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP5-36602 | 1993-02-25 | ||
JP3660293 | 1993-02-25 | ||
JP5103257A JP2951814B2 (ja) | 1993-02-25 | 1993-04-28 | 画像抽出方式 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH06309498A true JPH06309498A (ja) | 1994-11-04 |
JP2951814B2 JP2951814B2 (ja) | 1999-09-20 |
Family
ID=26375678
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP5103257A Expired - Fee Related JP2951814B2 (ja) | 1993-02-25 | 1993-04-28 | 画像抽出方式 |
Country Status (3)
Country | Link |
---|---|
US (1) | US5572602A (ja) |
JP (1) | JP2951814B2 (ja) |
KR (1) | KR0147318B1 (ja) |
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6104833A (en) * | 1996-01-09 | 2000-08-15 | Fujitsu Limited | Pattern recognizing apparatus and method |
US6320983B1 (en) | 1998-03-27 | 2001-11-20 | Fujitsu Limited | Method and apparatus for character recognition, and computer-readable recording medium with a program making a computer execute the method recorded therein |
US6434270B1 (en) | 1997-05-30 | 2002-08-13 | Fujitsu Limited | Pattern extraction apparatus |
US6778712B1 (en) | 1999-12-20 | 2004-08-17 | Fujitsu Limited | Data sheet identification device |
KR100606404B1 (ko) * | 2003-11-26 | 2006-08-02 | (주)아이미디어아이앤씨 | 컬러코드 이미지 검출 방법 및 장치 |
US7130085B2 (en) | 2001-08-23 | 2006-10-31 | Fujitsu Limited | Half-tone dot elimination method and system thereof |
US7133558B1 (en) | 1998-12-16 | 2006-11-07 | Fujitsu Limited | Device processing a table image, a memory medium storing a processing program, and a table management processing method |
US7164795B2 (en) | 2000-08-15 | 2007-01-16 | Fujitsu Limited | Apparatus for extracting ruled line from multiple-valued image |
JP2011216070A (ja) * | 2010-03-31 | 2011-10-27 | Fujitsu Ltd | 隠蔽された文字の復元方法及び画像処理装置 |
JP2012014430A (ja) * | 2010-06-30 | 2012-01-19 | Canon Inc | 画像処理装置、制御方法、及びプログラム |
WO2013154062A1 (ja) * | 2012-04-11 | 2013-10-17 | 日本電気株式会社 | 画像識別システム、画像識別方法、およびプログラム |
Families Citing this family (25)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CA2211258C (en) * | 1995-01-31 | 2000-12-26 | United Parcel Service Of America, Inc. | Method and apparatus for separating foreground from background in images containing text |
JP2761467B2 (ja) * | 1995-03-29 | 1998-06-04 | インターナショナル・ビジネス・マシーンズ・コーポレイション | 画像切り出し装置及び文字認識装置 |
US5859929A (en) * | 1995-12-01 | 1999-01-12 | United Parcel Service Of America, Inc. | System for character preserving guidelines removal in optically scanned text |
US5923782A (en) * | 1996-08-01 | 1999-07-13 | Nynex Science & Technology, Inc. | System for detecting and identifying substantially linear horizontal and vertical lines of engineering drawings |
US6266444B1 (en) * | 1996-10-11 | 2001-07-24 | Canon Kabushiki Kaisha | Character processing apparatus and method therefor |
JP3113827B2 (ja) * | 1996-11-28 | 2000-12-04 | インターナショナル・ビジネス・マシーンズ・コーポレ−ション | 矩形オブジェクトの認識方法及び認識装置 |
EP0947498B1 (en) * | 1996-12-02 | 2004-09-15 | Chisso Corporation | Optically active nitro alcohol derivatives, optically active amino alcohol derivatives, and process for preparing the same |
US6226402B1 (en) | 1996-12-20 | 2001-05-01 | Fujitsu Limited | Ruled line extracting apparatus for extracting ruled line from normal document image and method thereof |
US6295639B1 (en) | 1998-09-01 | 2001-09-25 | Aidministrator Nederland B.V. | Securely accessing a file system of a remote server computer |
US6405224B1 (en) | 1998-09-01 | 2002-06-11 | Aidministrator Nederland B.V. | Method and apparatus for HTML control |
US6289362B1 (en) * | 1998-09-01 | 2001-09-11 | Aidministrator Nederland B.V. | System and method for generating, transferring and using an annotated universal address |
DE19902681A1 (de) * | 1999-01-23 | 2000-07-27 | Lfk Gmbh | Verfahren und System zum Wiederfinden von Objekten in Bildern |
CA2362326A1 (en) * | 1999-02-11 | 2000-08-17 | Ian Woodhead | Obstruction detection system |
US6643400B1 (en) | 1999-03-31 | 2003-11-04 | Minolta Co., Ltd. | Image processing apparatus and method for recognizing specific pattern and recording medium having image processing program recorded thereon |
US6788829B1 (en) | 1999-03-31 | 2004-09-07 | Minolta Co., Ltd. | Image processing apparatus and method for recognizing specific pattern and recording medium having image processing program recorded thereon |
JP3705216B2 (ja) * | 2001-02-28 | 2005-10-12 | 日本電気株式会社 | 文字記入枠検出方法、文字記入枠検出装置及びプログラム |
JP2003016463A (ja) * | 2001-07-05 | 2003-01-17 | Toshiba Corp | 図形の輪郭の抽出方法、パターン検査方法、パターン検査装置、プログラムおよびこれを格納したコンピュータ読み取り可能な記録媒体 |
JP4118749B2 (ja) * | 2002-09-05 | 2008-07-16 | 株式会社リコー | 画像処理装置、画像処理プログラムおよび記憶媒体 |
FR2875627B1 (fr) * | 2004-09-21 | 2007-03-16 | Canon Res Ct France S A S Soc | Procede de determination d'un descripteur d'image, procede de comparaison d'images, procede de recherche d'image et dispositifs associes |
JP5098504B2 (ja) * | 2007-08-09 | 2012-12-12 | 富士通株式会社 | 文字認識プログラム、文字認識装置および文字認識方法 |
EP2460118B1 (en) * | 2009-07-30 | 2013-05-29 | OCE-Technologies B.V. | Automatic table location in documents |
KR101214772B1 (ko) * | 2010-02-26 | 2012-12-21 | 삼성전자주식회사 | 문자의 방향성을 기반으로 한 문자 인식 장치 및 방법 |
US8699780B1 (en) * | 2013-05-09 | 2014-04-15 | King Fahd University Of Petroleum And Minerals | Arabic bank check analysis and zone extraction method |
KR102226843B1 (ko) * | 2019-02-26 | 2021-03-12 | 주식회사 핀그램 | 오브젝트 검출 시스템 및 그 방법 |
US11615254B2 (en) * | 2019-11-19 | 2023-03-28 | International Business Machines Corporation | Content sharing using address generation |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4292622A (en) * | 1980-02-21 | 1981-09-29 | Hendrix Electronics, Inc. | System and method for processing horizontal line characteristics in an image |
US4377803A (en) * | 1980-07-02 | 1983-03-22 | International Business Machines Corporation | Algorithm for the segmentation of printed fixed pitch documents |
NL8502664A (nl) * | 1985-09-30 | 1987-04-16 | Philips Nv | Werkwijze voor het maken van magneetkopkernen. |
JPS62212888A (ja) * | 1986-03-14 | 1987-09-18 | Meidensha Electric Mfg Co Ltd | 図面自動読取り装置の図面枠除去方式 |
JP2822189B2 (ja) * | 1988-05-19 | 1998-11-11 | ソニー株式会社 | 文字認識装置及び方法 |
JP2940936B2 (ja) * | 1989-06-06 | 1999-08-25 | 株式会社リコー | 表領域識別方法 |
JP2581809B2 (ja) * | 1989-10-11 | 1997-02-12 | 沖電気工業株式会社 | 文字切出し装置 |
US5181261A (en) * | 1989-12-20 | 1993-01-19 | Fuji Xerox Co., Ltd. | An image processing apparatus for detecting the boundary of an object displayed in digital image |
US5191612A (en) * | 1990-03-13 | 1993-03-02 | Fujitsu Limited | Character recognition system |
-
1993
- 1993-04-28 JP JP5103257A patent/JP2951814B2/ja not_active Expired - Fee Related
-
1994
- 1994-02-07 US US08/192,592 patent/US5572602A/en not_active Expired - Lifetime
- 1994-02-18 KR KR1019940002913A patent/KR0147318B1/ko not_active IP Right Cessation
Cited By (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6335986B1 (en) | 1996-01-09 | 2002-01-01 | Fujitsu Limited | Pattern recognizing apparatus and method |
US6687401B2 (en) | 1996-01-09 | 2004-02-03 | Fujitsu Limited | Pattern recognizing apparatus and method |
US6850645B2 (en) | 1996-01-09 | 2005-02-01 | Fujitsu Limited | Pattern recognizing apparatus |
US6104833A (en) * | 1996-01-09 | 2000-08-15 | Fujitsu Limited | Pattern recognizing apparatus and method |
US6434270B1 (en) | 1997-05-30 | 2002-08-13 | Fujitsu Limited | Pattern extraction apparatus |
US6320983B1 (en) | 1998-03-27 | 2001-11-20 | Fujitsu Limited | Method and apparatus for character recognition, and computer-readable recording medium with a program making a computer execute the method recorded therein |
US7133558B1 (en) | 1998-12-16 | 2006-11-07 | Fujitsu Limited | Device processing a table image, a memory medium storing a processing program, and a table management processing method |
US6778712B1 (en) | 1999-12-20 | 2004-08-17 | Fujitsu Limited | Data sheet identification device |
US7164795B2 (en) | 2000-08-15 | 2007-01-16 | Fujitsu Limited | Apparatus for extracting ruled line from multiple-valued image |
US7440618B2 (en) | 2000-08-15 | 2008-10-21 | Fujitsu Limited | Apparatus for extracting rules line from multiple-valued image |
US7130085B2 (en) | 2001-08-23 | 2006-10-31 | Fujitsu Limited | Half-tone dot elimination method and system thereof |
KR100606404B1 (ko) * | 2003-11-26 | 2006-08-02 | (주)아이미디어아이앤씨 | 컬러코드 이미지 검출 방법 및 장치 |
JP2011216070A (ja) * | 2010-03-31 | 2011-10-27 | Fujitsu Ltd | 隠蔽された文字の復元方法及び画像処理装置 |
JP2012014430A (ja) * | 2010-06-30 | 2012-01-19 | Canon Inc | 画像処理装置、制御方法、及びプログラム |
WO2013154062A1 (ja) * | 2012-04-11 | 2013-10-17 | 日本電気株式会社 | 画像識別システム、画像識別方法、およびプログラム |
JPWO2013154062A1 (ja) * | 2012-04-11 | 2015-12-17 | 日本電気株式会社 | 画像識別システム、画像識別方法、およびプログラム |
Also Published As
Publication number | Publication date |
---|---|
KR940020253A (ko) | 1994-09-15 |
US5572602A (en) | 1996-11-05 |
JP2951814B2 (ja) | 1999-09-20 |
KR0147318B1 (ko) | 1998-09-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2951814B2 (ja) | 画像抽出方式 | |
US5583949A (en) | Apparatus and method for use in image processing | |
EP1497787B1 (en) | System and method for identifying and extracting character strings from captured image data | |
JP3042945B2 (ja) | 画像抽出装置 | |
EP2569930B1 (en) | Segmentation of a word bitmap into individual characters or glyphs during an ocr process | |
US20050238257A1 (en) | Form search apparatus and method | |
JP2002133426A (ja) | 多値画像から罫線を抽出する罫線抽出装置 | |
JPH08305796A (ja) | パターン抽出装置、パターン再認識用テーブル作成装置及びパターン認識装置 | |
US6005976A (en) | Image extraction system for extracting patterns such as characters, graphics and symbols from image having frame formed by straight line portions | |
JP3411472B2 (ja) | パターン抽出装置 | |
JP3965983B2 (ja) | 画像処理方法およびその装置 | |
JPH0950527A (ja) | 枠抽出装置及び矩形抽出装置 | |
JP4543675B2 (ja) | 文字・図形の認識方法 | |
JP4867894B2 (ja) | 画像認識装置、画像認識方法及びプログラム | |
JP4810853B2 (ja) | 文字画像切出装置、文字画像切出方法およびプログラム | |
Bai et al. | Object Boundary Encoding—a new vectorisation algorithm for engineering drawings | |
JP3299519B2 (ja) | 画像抽出装置 | |
JPH09128480A (ja) | パターン領域切り出し方式及びパターン抽出装置 | |
JP2000231602A (ja) | 特徴抽出装置 | |
JP2007026470A (ja) | パターン認識装置 | |
JP2000172782A (ja) | 画像抽出装置 | |
JPH08305794A (ja) | 宛名行抽出装置 | |
JP2755299B2 (ja) | 画像処理方法 | |
JP2002334301A (ja) | 2値イメージの特徴点抽出方法及び特徴点抽出プログラム | |
JP3517077B2 (ja) | パターン抽出装置及びパターン領域の切り出し方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 19990629 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080709 Year of fee payment: 9 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090709 Year of fee payment: 10 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100709 Year of fee payment: 11 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100709 Year of fee payment: 11 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110709 Year of fee payment: 12 |
|
LAPS | Cancellation because of no payment of annual fees |