JPH04216171A - 輪郭ベクトルの抽出方法 - Google Patents
輪郭ベクトルの抽出方法Info
- Publication number
- JPH04216171A JPH04216171A JP2402661A JP40266190A JPH04216171A JP H04216171 A JPH04216171 A JP H04216171A JP 2402661 A JP2402661 A JP 2402661A JP 40266190 A JP40266190 A JP 40266190A JP H04216171 A JPH04216171 A JP H04216171A
- Authority
- JP
- Japan
- Prior art keywords
- vector
- contour
- line width
- character
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 239000013598 vector Substances 0.000 title claims abstract description 93
- 238000000034 method Methods 0.000 title claims abstract description 10
- 239000000284 extract Substances 0.000 claims description 4
- 238000007493 shaping process Methods 0.000 abstract description 11
- 238000000605 extraction Methods 0.000 description 4
- 230000006835 compression Effects 0.000 description 3
- 238000007906 compression Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 2
- 238000002316 cosmetic surgery Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000004321 preservation Methods 0.000 description 1
- 238000012916 structural analysis Methods 0.000 description 1
Landscapes
- Image Processing (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【0001】
【産業上の利用分野】本発明は、図面から文字・図形を
光学的に読取り、その輪郭ベクトルから芯線ベクトルを
生成して文字・図形を認識するための図面自動入力装置
に係り、特に輪郭ベクトルの抽出方法に関する。
光学的に読取り、その輪郭ベクトルから芯線ベクトルを
生成して文字・図形を認識するための図面自動入力装置
に係り、特に輪郭ベクトルの抽出方法に関する。
【0002】
【従来の技術】図面自動入力装置は、図3に示す処理手
順になる。入力対象となる図面はイメージスキャナ等に
よって2値画像化する入力処理を行い(ステップS1)
、該2値画像に対して連続した画素のつながりとしての
輪郭ベクトル群の抽出とその情報圧縮になる輪郭ベクト
ル処理を行い(ステップS2)、閉じた輪郭ベクトル群
から図形線分の芯線ベクトル群を抽出する芯線ベクトル
処理を行い(ステップS3)、これらベクトル群が閉じ
た孤立要素について文字候補と図形候補(シンボル候補
とその他の線分候補)に分類する図面要素の分離を行う
(ステップS4)。この分類条件は独立要素(ベクトル
の集合体)の領域四角形の大きさにより設定したしきい
値より小さいものは文字候補、それ以外は図形候補とす
る。また、文字候補はその集合の中から文字同志の横並
び/縦並び関係から複数の文字列に分類する。さらに、
1つの文字列候補の中から文字の大きさと文字間隔を基
に1文字候補を抽出する。抽出した1文字候補はベクト
ルの集合体になる。
順になる。入力対象となる図面はイメージスキャナ等に
よって2値画像化する入力処理を行い(ステップS1)
、該2値画像に対して連続した画素のつながりとしての
輪郭ベクトル群の抽出とその情報圧縮になる輪郭ベクト
ル処理を行い(ステップS2)、閉じた輪郭ベクトル群
から図形線分の芯線ベクトル群を抽出する芯線ベクトル
処理を行い(ステップS3)、これらベクトル群が閉じ
た孤立要素について文字候補と図形候補(シンボル候補
とその他の線分候補)に分類する図面要素の分離を行う
(ステップS4)。この分類条件は独立要素(ベクトル
の集合体)の領域四角形の大きさにより設定したしきい
値より小さいものは文字候補、それ以外は図形候補とす
る。また、文字候補はその集合の中から文字同志の横並
び/縦並び関係から複数の文字列に分類する。さらに、
1つの文字列候補の中から文字の大きさと文字間隔を基
に1文字候補を抽出する。抽出した1文字候補はベクト
ルの集合体になる。
【0003】図形候補はその領域四角形の包含関係を基
にグループの細分化を施す。グループ化した図形候補単
位に属するベクトルを構造解析し、シンボル候補と線分
候補を抽出する。抽出した各シンボル候補及び線分候補
もまたベクトルの集合体になる。
にグループの細分化を施す。グループ化した図形候補単
位に属するベクトルを構造解析し、シンボル候補と線分
候補を抽出する。抽出した各シンボル候補及び線分候補
もまたベクトルの集合体になる。
【0004】分離された文字候補は各候補別にパターン
比較のための辞書と照合することで最も類似する文字を
抽出する文字認識をし(ステップS5)、同様にシンボ
ル候補について最も類似するシンボルを認識し(ステッ
プS6)、これら認識結果は文字,シンボルのコードと
して抽出される。線分候補については整形を行う線分処
理を行う(ステップS7)。
比較のための辞書と照合することで最も類似する文字を
抽出する文字認識をし(ステップS5)、同様にシンボ
ル候補について最も類似するシンボルを認識し(ステッ
プS6)、これら認識結果は文字,シンボルのコードと
して抽出される。線分候補については整形を行う線分処
理を行う(ステップS7)。
【0005】ステップS5〜S7で認識,処理された文
字及び図形データは結合・編集され(ステップS8)、
表示や印刷されるほかに図形データ処理を行うためのC
AD等のホストシステムへのデータ転送がなされる。
字及び図形データは結合・編集され(ステップS8)、
表示や印刷されるほかに図形データ処理を行うためのC
AD等のホストシステムへのデータ転送がなされる。
【0006】ここで、輪郭ベクトルの抽出には図面の背
景になる白画素と図形・文字の黒画素との境界部分を追
跡した黒画素列を求め、この黒画素列が直線近似できる
ときは複数の画素列を1つのベクトルデータとする情報
圧縮が行われる。また、他の輪郭ベクトル抽出方法とし
てラスタスキャンされた画素列のうち隣合う4画素又は
9画素から境界になる画素列として抽出する方法がある
。例えば、特開平1−25181号公報。この輪郭ベク
トル抽出方法においても情報圧縮には直線近似で行われ
る。
景になる白画素と図形・文字の黒画素との境界部分を追
跡した黒画素列を求め、この黒画素列が直線近似できる
ときは複数の画素列を1つのベクトルデータとする情報
圧縮が行われる。また、他の輪郭ベクトル抽出方法とし
てラスタスキャンされた画素列のうち隣合う4画素又は
9画素から境界になる画素列として抽出する方法がある
。例えば、特開平1−25181号公報。この輪郭ベク
トル抽出方法においても情報圧縮には直線近似で行われ
る。
【0007】
【発明が解決しようとする課題】従来の輪郭ベクトル処
理は、入力された全ての輪郭画素に対して同一の処理内
容で行われるため、ある特定の部分に対しては直線近似
時の変形が無視できない場合がある。
理は、入力された全ての輪郭画素に対して同一の処理内
容で行われるため、ある特定の部分に対しては直線近似
時の変形が無視できない場合がある。
【0008】特に図形線分の端点のようなものは、図4
に示すように、原画像Aに対する輪郭画素列Bを抽出し
、この画素列Bから情報圧縮で4つの輪郭ベクトルC1
〜C4が得られる正常なベクタライズになる場合と、画
素列Bの端部が丸みを持つ場合に線幅を求められなくな
る3つの輪郭ベクトルD1,D2,D3としてベクタラ
イズされる場合、さらには線幅情報が無くなったベクト
ルEとなる場合がある。
に示すように、原画像Aに対する輪郭画素列Bを抽出し
、この画素列Bから情報圧縮で4つの輪郭ベクトルC1
〜C4が得られる正常なベクタライズになる場合と、画
素列Bの端部が丸みを持つ場合に線幅を求められなくな
る3つの輪郭ベクトルD1,D2,D3としてベクタラ
イズされる場合、さらには線幅情報が無くなったベクト
ルEとなる場合がある。
【0009】これら(d),(e)に示すベクタライズ
処理になる場合には輪郭ベクトルの線幅情報喪失になっ
てしまい、その後の芯線ベクトル処理で芯線ベクトルデ
ータを喪失してしまい、図形認識に誤りを起こす恐れが
ある。
処理になる場合には輪郭ベクトルの線幅情報喪失になっ
てしまい、その後の芯線ベクトル処理で芯線ベクトルデ
ータを喪失してしまい、図形認識に誤りを起こす恐れが
ある。
【0010】本発明の目的は、輪郭ベクタライズ処理に
線幅情報の喪失を少なくする輪郭ベクトルの抽出方法を
提供することにある。
線幅情報の喪失を少なくする輪郭ベクトルの抽出方法を
提供することにある。
【0011】
【課題を解決するための手段】本発明は、上記課題を解
決するため、図面を2値化画像として読取り、この2値
化画像の輪郭ベクトルを抽出し、この輪郭ベクトルから
芯線ベクトルを生成して図形・文字を認識する図面自動
入力装置において、前記輪郭ベクトルデータから図形・
文字の端点を検出し、この端点が所定の線幅を持つよう
該ベクトルデータを修正することを特徴とする。
決するため、図面を2値化画像として読取り、この2値
化画像の輪郭ベクトルを抽出し、この輪郭ベクトルから
芯線ベクトルを生成して図形・文字を認識する図面自動
入力装置において、前記輪郭ベクトルデータから図形・
文字の端点を検出し、この端点が所定の線幅を持つよう
該ベクトルデータを修正することを特徴とする。
【0012】
【作用】上記構成になる本発明によれば、輪郭ベクトル
の線幅喪失を起こす恐れのある文字・図形の端点を輪郭
ベクトルデータから検出し、この端点について所定の線
幅を持つようベクトルデータを修正し、この修正した輪
郭ベクトルから芯線ベクトルを生成することで芯線ベク
トルの喪失や認識の誤りを少なくする。
の線幅喪失を起こす恐れのある文字・図形の端点を輪郭
ベクトルデータから検出し、この端点について所定の線
幅を持つようベクトルデータを修正し、この修正した輪
郭ベクトルから芯線ベクトルを生成することで芯線ベク
トルの喪失や認識の誤りを少なくする。
【0013】
【実施例】図1は本発明の一実施例を示す整形処理フロ
ーチャートである。本実施例は図3の輪郭ベクトル処理
S2での情報圧縮の後に実行されるもので、輪郭ベクト
ルデータが格納される記憶手段からグループ単位(閉じ
たベクトル群)で輪郭ベクトルデータを読出し、全ルー
プについての整形処理の終了(ステップS11)とルー
プ単位での整形処理の終了(ステップS12)をチェッ
クすることで全ベクトルデータについてその端点部分で
の整形を行う。
ーチャートである。本実施例は図3の輪郭ベクトル処理
S2での情報圧縮の後に実行されるもので、輪郭ベクト
ルデータが格納される記憶手段からグループ単位(閉じ
たベクトル群)で輪郭ベクトルデータを読出し、全ルー
プについての整形処理の終了(ステップS11)とルー
プ単位での整形処理の終了(ステップS12)をチェッ
クすることで全ベクトルデータについてその端点部分で
の整形を行う。
【0014】1つの輪郭ベクトルループについて、保存
順又は任意の輪郭ベクトルからベクトル追跡をし端点の
特徴に基づいて端点部を検索し(ステップS13)、整
形を必要とする端点か否かの判定を得る(ステップS1
4)。この端点の検出は、以下の判定条件を満足するか
否かで判定される。
順又は任意の輪郭ベクトルからベクトル追跡をし端点の
特徴に基づいて端点部を検索し(ステップS13)、整
形を必要とする端点か否かの判定を得る(ステップS1
4)。この端点の検出は、以下の判定条件を満足するか
否かで判定される。
【0015】(a)図2において輪郭ベクトルV(i)
の座標P(i)とその1つ前の輪郭ベクトルV(i−1
)の座標P(i−1)との長さL(i)があるしきい値
Ltよりも大きい。
の座標P(i)とその1つ前の輪郭ベクトルV(i−1
)の座標P(i−1)との長さL(i)があるしきい値
Ltよりも大きい。
【0016】(b)ベクトルV(i)の座標P(i)と
その1つ後のベクトルV(i+1)の座標P(i+1)
との長さL(i+1)があるしきい値Ltよりも大きい
。
その1つ後のベクトルV(i+1)の座標P(i+1)
との長さL(i+1)があるしきい値Ltよりも大きい
。
【0017】(c)3つのベクトル座標P(i−1)、
P(i)、P(i+1)のなす角度を黒地部が存在する
方向に求めた角度θ(i)があるしきい値θtよりも小
さい。
P(i)、P(i+1)のなす角度を黒地部が存在する
方向に求めた角度θ(i)があるしきい値θtよりも小
さい。
【0018】ここで、しきい値は例えばLt=8ドット
、θt=45度にされる。
、θt=45度にされる。
【0019】これら条件を満足するときに、当該端点は
整形処理を必要と判定し、端点整形処理を行う(ステッ
プS15)。この処理は図2の端点ベクトルに対して、
ベクトルV(i)からベクトルV(i+1)又はV(i
−1)に直交する方向で前後n/2ドット分ずれた位置
に基点を持つベクトルV(i)となるようデータ修正し
、図2に示すように線幅Wを生成するベクトルV(i)
にする。
整形処理を必要と判定し、端点整形処理を行う(ステッ
プS15)。この処理は図2の端点ベクトルに対して、
ベクトルV(i)からベクトルV(i+1)又はV(i
−1)に直交する方向で前後n/2ドット分ずれた位置
に基点を持つベクトルV(i)となるようデータ修正し
、図2に示すように線幅Wを生成するベクトルV(i)
にする。
【0020】端点整形処理を終えたときには次の端点を
検索するために輪郭ベクトルV(i+1)に続くベクト
ルを取出し(ステップS16)、ステップS12に戻っ
て1つのベクトルループの終了まで端点部検索に入る繰
り返しをし、1つのベクトルループについての整形処理
終了で他のベクトルループについてのベクトル読出しに
戻り、全ループの整形終了で処理を終わる。
検索するために輪郭ベクトルV(i+1)に続くベクト
ルを取出し(ステップS16)、ステップS12に戻っ
て1つのベクトルループの終了まで端点部検索に入る繰
り返しをし、1つのベクトルループについての整形処理
終了で他のベクトルループについてのベクトル読出しに
戻り、全ループの整形終了で処理を終わる。
【0021】なお、ベクトルV(i)が少しの長さ(必
要とされる線幅Wよりも小さい)ときには該ベクトルの
長さも端点の判定条件に加えることができる。
要とされる線幅Wよりも小さい)ときには該ベクトルの
長さも端点の判定条件に加えることができる。
【0022】また、図4のベクトルEでは往復する輪郭
ベクトル自体が同じ座標を持つことから端点と判別する
と共に線幅Wを持つよう1つのベクトルデータ追加とベ
クトルEを2つのベクトル(間隔W)に分離又は1つを
追加する。
ベクトル自体が同じ座標を持つことから端点と判別する
と共に線幅Wを持つよう1つのベクトルデータ追加とベ
クトルEを2つのベクトル(間隔W)に分離又は1つを
追加する。
【0023】
【発明の効果】以上のとおり、本発明によれば、輪郭ベ
クトルデータから文字・図形の端点を検出し、この端点
の輪郭ベクトルが所定の線幅を持つよう整形するため、
輪郭ベクトルの抽出に線幅喪失を無くして芯線ベクトル
の生成にも図形・文字の特徴を損なうことなく、認識を
確実にする。
クトルデータから文字・図形の端点を検出し、この端点
の輪郭ベクトルが所定の線幅を持つよう整形するため、
輪郭ベクトルの抽出に線幅喪失を無くして芯線ベクトル
の生成にも図形・文字の特徴を損なうことなく、認識を
確実にする。
【図1】本発明の一実施例を示す処理フローチャート、
【図2】実施例における整形例を示す図、
【図3】図面
自動入力装置の処理フローチャート、
自動入力装置の処理フローチャート、
【図4】図形・文
字の端点ベクトルを説明するための図。
字の端点ベクトルを説明するための図。
V(i−1)、V(i)、V(i+1)…輪郭ベクトル
。
。
Claims (1)
- 【請求項1】 図面を2値化画像として読取り、この
2値化画像の輪郭ベクトルを抽出し、この輪郭ベクトル
から芯線ベクトルを生成して図形・文字を認識する図面
自動入力装置において、前記輪郭ベクトルデータから図
形・文字の端点を検出し、この端点が所定の線幅を持つ
よう該ベクトルデータを修正することを特徴とする輪郭
ベクトルの抽出方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2402661A JPH04216171A (ja) | 1990-12-17 | 1990-12-17 | 輪郭ベクトルの抽出方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2402661A JPH04216171A (ja) | 1990-12-17 | 1990-12-17 | 輪郭ベクトルの抽出方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH04216171A true JPH04216171A (ja) | 1992-08-06 |
Family
ID=18512459
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2402661A Pending JPH04216171A (ja) | 1990-12-17 | 1990-12-17 | 輪郭ベクトルの抽出方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH04216171A (ja) |
-
1990
- 1990-12-17 JP JP2402661A patent/JPH04216171A/ja active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US5410611A (en) | Method for identifying word bounding boxes in text | |
US4813078A (en) | Character recognition apparatus | |
US5515455A (en) | System for recognizing handwritten words of cursive script | |
JPS63182793A (ja) | 文字切り出し方式 | |
US6947596B2 (en) | Character recognition method, program and recording medium | |
US20030123730A1 (en) | Document recognition system and method using vertical line adjacency graphs | |
JPH04216171A (ja) | 輪郭ベクトルの抽出方法 | |
JP2917427B2 (ja) | 図面読取装置 | |
Bushofa et al. | Segmentation and Recognition of Printed Arabic Characters. | |
JPH0877293A (ja) | 文字認識装置および文字認識用辞書作成方法 | |
Amin | Recognition of printed Arabic text using machine learning | |
JP2727755B2 (ja) | 文字列認識方法及びその装置 | |
JPH0656625B2 (ja) | 特徴抽出方式 | |
JPH08212292A (ja) | 枠線認識装置 | |
JPH0757047A (ja) | 文字切出し方式 | |
JPH03189888A (ja) | 図面読取装置における文字列の種類決定装置 | |
JPS63178380A (ja) | 文字列認識装置 | |
JPH01265378A (ja) | 欧文文字認識方式 | |
JPH02235189A (ja) | 文字認識装置 | |
JPH08202883A (ja) | 図面自動入力装置における塗り潰し図形認識方法 | |
Asimopoulos | Design and implementation of a portable omnifont reading aid for the blind | |
JPH0683890A (ja) | 図面自動入力装置における線種認識方法 | |
JPH04222057A (ja) | 図面自動入力装置の文字・図形要素認識方法 | |
JPH07220028A (ja) | 文字認識装置 | |
JPS61220081A (ja) | パタ−ン切り出し及び認識方式 |