JPH0785221A - 図面自動認識装置の文字とシンボルの分離・認識方法 - Google Patents

図面自動認識装置の文字とシンボルの分離・認識方法

Info

Publication number
JPH0785221A
JPH0785221A JP5226768A JP22676893A JPH0785221A JP H0785221 A JPH0785221 A JP H0785221A JP 5226768 A JP5226768 A JP 5226768A JP 22676893 A JP22676893 A JP 22676893A JP H0785221 A JPH0785221 A JP H0785221A
Authority
JP
Japan
Prior art keywords
character
symbol
code
recognition
vector
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP5226768A
Other languages
English (en)
Inventor
Tetsuya Yasuda
哲也 安田
Takeshi Aizawa
毅 相澤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Meidensha Corp
Meidensha Electric Manufacturing Co Ltd
Original Assignee
Meidensha Corp
Meidensha Electric Manufacturing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Meidensha Corp, Meidensha Electric Manufacturing Co Ltd filed Critical Meidensha Corp
Priority to JP5226768A priority Critical patent/JPH0785221A/ja
Publication of JPH0785221A publication Critical patent/JPH0785221A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】 【目的】 画像ベクトル化処理による図面自動認識装置
において、同程度の大きさの文字とシンボルを確実に分
離・認識する。 【構成】 画像データのベクトルの外周輪郭の大きさか
ら文字候補とシンボル等の他の候補に分離し(S1
1)、文字候補の切り出し(S12)と文字認識(S1
3)及びシンボル切り出し・認識(S14)を行うにお
いて、文字認識のための辞書には文字が持つコード範囲
外でシンボルを特定できるコードを設けておき、文字と
して認識されたシンボルはそのコードが文字範囲のもの
かシンボル範囲のものかをチェックすることで文字・シ
ンボルの置き換えを行い(S15)、文字とシンボルが
混成する文字列からシンボルを分離・認識する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、2値画像データをベク
トルデータ化して図面要素を認識する図面自動認識装置
に係り、特に文字とシンボルの分離・認識方法に関す
る。
【0002】
【従来の技術】近年、CAD(コンピュータエイディド
デザイン)の普及に伴って、図面入力装置のニーズが高
まっている。この図面入力装置は、図面や文書などの画
像をイメージスキャナ等で読み取ってCAD等で取り扱
うに適した画像データを得るためのものであり、CAD
等で取り扱うにあたっての簡便性を確保しつつデータ圧
縮を行う点が重要となる。これらの点を満足する画像処
理技術として画像ベクトル化処理が挙げられる。
【0003】画像ベクトル化処理による画像処理では、
イメージスキャナ等で読み取られた2値画像データを使
用して輪郭ベクトルを生成し、さらに芯線ベクトルを生
成する。また2値画像データから直接、細線近似ベクト
ルデータを生成する手法もある。このようにして得られ
たベクトルデータを使用して、画像を構成する要素(文
字・線分等)を分離・認識し、その認識結果を結合・編
集する。
【0004】ここで、上記の画像ベクトル化処理のうち
前者について詳細を説明する。図3は画像ベクトル化処
理と認識手順の概略を示す。また図4は処理画像の例を
示し、(a)は読み取った画像(原図)、(b)は芯線
ベクトル生成時の画像、(c)は芯線ベクトル接続後の
画像を示す。
【0005】処理図に示すように、まずイメージスキャ
ナ等から白黒に2値化された画像データを読み込み(S
1)、読み込んだ2値画像データを用いてベクトル化処
理を行う。すなわち、画像の輪郭を抽出して輪郭ベクト
ル1を生成し(S3)、さらにその輪郭ベクトルを用い
て芯線ベクトル2を生成する(S4)。
【0006】なお、芯線ベクトル2の生成において、生
成処理が終了したときに、複数の中断点3の近傍に接続
点4を設定して中断点3を接続し、所定の芯線ベクトル
2を1つに統合する。統合した芯線ベクトル2は、1つ
のセクションにまとめられて管理される。また輪郭ベク
トル1は、セクション#1〜3のように、ループごとに
セクションにまとめられて管理される。
【0007】この後、ベクトルデータを用いて画像を構
成する基本要素(文字・線分・シンボル等)を分離(S
6)して個々に認識し(S7、S8、S9)、その結果
を画像データとして出力する(S10)。
【0008】原図が低品質である場合、その2値画像デ
ータにはノイズ(線の切れ・かすれ等を含む)が含まれ
ており、その後の認識処理に悪影響を及ぼす。このよう
な理由から2値画像データやベクトルデータに対しノイ
ズ除去等を目的としてインタラクティブに編集処理を行
うことが可能となっている(S2,S5)。
【0009】ここで、文字とシンボルの分離方法には、
例えば特開平3−113688号公報で提案されてい
る。
【0010】この分離方法の概略は、図5の(a)に示
す輪郭ベクトルから(b)に示す外周輪郭ベクトルを取
り出し、その外接4角形の大きさWx,Wyを調べ、こ
の大きさから文字候補と判断した輪郭ベクトルは文字分
離認識処理に送り、シンボル候補と判断した輪郭ベクト
ルはシンボル分離認識処理に送る。
【0011】
【発明が解決しようとする課題】文字とシンボルの要素
分離の従来方法は、文字の大きさと同程度の文字以外の
孤立図形が無い場合には有効であるが、図面によっては
図6に示すように、シンボルと文字が同程度の大きさで
組み合わせて書かれているものもある。
【0012】このような図面に対する自動認識処理で
は、要素分離時に文字サイズ以下の図形を文字候補とす
るため、認識不能や誤った認識を起こしてしまう。
【0013】本発明の目的は、画像ベクトル化処理によ
る図面自動認識装置において、同程度の大きさの文字と
シンボルを確実に分離・認識する方法を提供することに
ある。
【0014】
【課題を解決するための手段】本発明は、上記の目的を
達成するために、2値画像データの輪郭を検出し、検出
した輪郭から輪郭ベクトルを生成し、該輪郭ベクトルか
ら芯線ベクトルを生成し、前記ベクトルデータから図
形、シンボル、文字等の図面候補に分離して該候補別に
認識を行う図面自動認識装置において、前記文字の認識
のための文字認識辞書には文字が持つコード範囲外でシ
ンボルを特定できるコードを設けておき、前記分離で文
字候補として分離・認識されたシンボルは前記辞書を使
った認識処理結果のコードが文字範囲のものかシンボル
範囲のものかをチェックし、このチェックでシンボル範
囲のコードをもつものは当該コードを持つシンボルの認
識結果に変更し、当該文字を認識文字から削除すること
を特徴とする。
【0015】
【作用】本発明では、文字候補に誤って分離されたシン
ボルを文字コードとは別の範囲にしたシンボルコードを
持つ辞書によって文字として認識しておき、この認識結
果のコードが文字コード範囲かシンボルコード範囲かに
よって文字とシンボルの識別を行う。これにより、外周
輪郭ベクトルが文字と同程度の大きさを持つシンボルを
文字から取り除いて認識できるようにする。
【0016】
【実施例】図1は、本発明の一実施例を示す処理フロー
である。前処理(S11)は、従来と同様に、画像入力
(S1)と輪郭抽出・ベクトル生成(S3)と芯線ベク
トル生成(S4)と要素分離(S6)及び編集処理(S
2,S5)を行う。
【0017】このうち、要素分離(6)では、セクショ
ン毎の文字とシンボルの分離にその外接4角形の大きさ
が文字の大きさの設定値内にあるときに文字候補とす
る。
【0018】この要素分離では、シンボルが文字の大き
さ以下になるときは、当該シンボルは文字候補として取
り扱われる。
【0019】文字候補とされたセクション化ベクトルデ
ータは、文字切り出し処理(S12)と文字認識処理
(S13)がなされる。
【0020】文字切り出し処理(S12)は、要素分離
によって抽出された複数の文字候補のうち同程度の大き
さを持つ文字候補を水平方向と垂直方向及び斜め方向に
検索することにより1つの文字列として抽出する。
【0021】文字認識処理(S13)は、切り出された
文字列の各文字について予め登録された文字認識辞書を
参照・比較することにより1文字ずつ認識する。この認
識結果は文字コードとして得られる。
【0022】シンボル候補として分離されたセクション
化ベクトルデータは、シンボル切り出し・認識処理(S
14)により各シンボル候補について予め登録されたシ
ンボル認識辞書を参照・比較することにより1シンボル
ずつ認識する。この認識結果はシンボルコードとして得
られる。
【0023】これまでの処理は、従来と同様にされ、文
字候補として分離されたシンボルを含む文字列は、文字
認識処理(13)結果としてシンボルの部分を除いて文
字コードとして取り出される。
【0024】ここで、本実施例では、文字列の文字認識
において、文字認識辞書には文字が持つコード範囲外で
シンボルを特定できるコードを設けておく。すなわち、
認識処理の結果となる文字コードは、その値が取り得る
範囲が決まっており、例えば、JIS第1水準文字コー
ドの場合、16進数の2120〜4F53となる。そこ
で、問題となるシンボルに対しては16進数の1〜21
1Fという、文字コードが取り得ない範囲のコードを付
加してシンボルと対応させておき、文字列の認識にシン
ボルが含まれるときにも当該シンボルを文字コードとし
て得る。
【0025】このような認識処理の後、本実施例では、
文字列からシンボルを取り除くための文字・シンボルの
置き換え処理(S15)を追加する。
【0026】この置き換え処理(S15)は、図2に示
す。同図において、置き換え処理されていない文字列が
存在するとき(S131)、かつ、各文字列について最
終文字までの置き換えがなされていないとき(S1
2)、当該文字列の最初の文字からその文字コードが
文字範囲のものかシンボル範囲のものかをチェックする
(S133)。
【0027】このチェックでシンボル範囲のコードをも
つものについては、当該文字コードをもつ文字(シンボ
ル)をシンボルの認識結果に変更する(S134)。
【0028】次いで、当該文字列のコードデータからシ
ンボルに変更したコードを削除する(S135)。
【0029】このような処理を各文字について(S13
6)、及び各文字列について(S137)実行し、文字と
して分離したシンボルを正しいシンボルとして認識す
る。この認識結果は、編集(S16)してCAD等のデ
ータとして出力される。
【0030】
【発明の効果】以上説明したように本発明によれば、文
字候補に誤って分離されたシンボルを文字コードとは別
の範囲にしたシンボルコードを持つ辞書によって文字と
して認識しておき、この認識結果のコードが文字コード
範囲かシンボルコード範囲かによって文字とシンボルの
識別を行うようにしたため、外周輪郭ベクトルが文字と
同程度の大きさを持つシンボルをそのまま文字認識処理
を行うことにより文字とシンボルを確実に分離して認識
できる効果がある。
【図面の簡単な説明】
【図1】本発明の一実施例を示す処理フロー。
【図2】図1における文字・シンボルの置き換え処理の
フロー。
【図3】図面自動認識装置の画像処理例。
【図4】画像ベクトル処理の様子。
【図5】文字の識別例。
【図6】文字とシンボルの混成例。
【符号の説明】
1…輪郭ベクトル 2…芯線ベクトル 3…中断点 4…接続点 #1、#3…セクション

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】 2値画像データの輪郭を検出し、検出し
    た輪郭から輪郭ベクトルを生成し、該輪郭ベクトルから
    芯線ベクトルを生成し、前記ベクトルデータから図形、
    シンボル、文字等の図面候補に分離して該候補別に認識
    を行う図面自動認識装置において、 前記文字の認識のための文字認識辞書には文字が持つコ
    ード範囲外でシンボルを特定できるコードを設けてお
    き、前記分離で文字候補として分離・認識されたシンボ
    ルは前記辞書を使った認識処理結果のコードが文字範囲
    のものかシンボル範囲のものかをチェックし、このチェ
    ックでシンボル範囲のコードをもつものは当該コードを
    持つシンボルの認識結果に変更し、当該文字を認識文字
    から削除することを特徴とする図面自動認識装置の文字
    とシンボルの分離・認識方法。
JP5226768A 1993-09-13 1993-09-13 図面自動認識装置の文字とシンボルの分離・認識方法 Pending JPH0785221A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP5226768A JPH0785221A (ja) 1993-09-13 1993-09-13 図面自動認識装置の文字とシンボルの分離・認識方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP5226768A JPH0785221A (ja) 1993-09-13 1993-09-13 図面自動認識装置の文字とシンボルの分離・認識方法

Publications (1)

Publication Number Publication Date
JPH0785221A true JPH0785221A (ja) 1995-03-31

Family

ID=16850314

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5226768A Pending JPH0785221A (ja) 1993-09-13 1993-09-13 図面自動認識装置の文字とシンボルの分離・認識方法

Country Status (1)

Country Link
JP (1) JPH0785221A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7545992B2 (en) 2004-07-07 2009-06-09 Canon Kabushiki Kaisha Image processing system and image processing method
US7596271B2 (en) 2004-07-07 2009-09-29 Canon Kabushiki Kaisha Image processing system and image processing method
US7640269B2 (en) 2004-07-07 2009-12-29 Canon Kabushiki Kaisha Image processing system and image processing method
US7860266B2 (en) 2004-07-07 2010-12-28 Canon Kabushiki Kaisha Image processing system and image processing method

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7545992B2 (en) 2004-07-07 2009-06-09 Canon Kabushiki Kaisha Image processing system and image processing method
US7596271B2 (en) 2004-07-07 2009-09-29 Canon Kabushiki Kaisha Image processing system and image processing method
US7640269B2 (en) 2004-07-07 2009-12-29 Canon Kabushiki Kaisha Image processing system and image processing method
US7860266B2 (en) 2004-07-07 2010-12-28 Canon Kabushiki Kaisha Image processing system and image processing method

Similar Documents

Publication Publication Date Title
JP4189506B2 (ja) 画像処理のための装置、方法及び記録媒体
JP4031210B2 (ja) 文字認識装置、文字認識方法、及び記録媒体
JPH0785221A (ja) 図面自動認識装置の文字とシンボルの分離・認識方法
JP2006072839A (ja) 画像処理方法、画像処理装置、画像処理プログラム及び記録媒体
JPH0991371A (ja) 文字表示装置
JP3140079B2 (ja) 罫線認識方法及び表処理方法
JP3197441B2 (ja) 文字認識装置
JP2002279344A (ja) 文字認識装置、文字認識方法および記録媒体
JP3591583B2 (ja) ナンバープレート認識システム及び一括辞書の作成/照合用プログラムを記録した記録媒体
JP2746345B2 (ja) 文字認識の後処理方法
KR930000034B1 (ko) 수행길이코드를 이용한 한글문자의 자소분리방법
JPH05120483A (ja) 文字認識装置
JP4766451B2 (ja) 符号化装置、画像処理装置、符号化方法及び符号化プログラム
JPH10171924A (ja) 文字認識装置
JP2995825B2 (ja) 日本語文字認識装置
JPH0773273A (ja) パターン切出しおよび認識方法とそのシステム
JPH0793544A (ja) 図面自動認識装置の寸法線認識方法
JPH06282680A (ja) 文字認識処理装置
JPH08202824A (ja) 文書画像認識装置
JPH10207985A (ja) 文字切り出し方法および文字切り出し装置
JPS617988A (ja) パタ−ン復元方式
JPH10222607A (ja) 図形要素と文字要素の分離認識方法
JPS6318483A (ja) 光学的情報入力装置用文字認識方法
JPH0792818B2 (ja) パターン切出しおよび認識方法とそのシステム
JP2000306042A (ja) 文字認識装置及び文字認識方法