JPH0586585B2 - - Google Patents

Info

Publication number
JPH0586585B2
JPH0586585B2 JP60161500A JP16150085A JPH0586585B2 JP H0586585 B2 JPH0586585 B2 JP H0586585B2 JP 60161500 A JP60161500 A JP 60161500A JP 16150085 A JP16150085 A JP 16150085A JP H0586585 B2 JPH0586585 B2 JP H0586585B2
Authority
JP
Japan
Prior art keywords
character
writing area
processing
information
type
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP60161500A
Other languages
English (en)
Other versions
JPS6222186A (ja
Inventor
Shigeyoshi Shimotsuji
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Tokyo Shibaura Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tokyo Shibaura Electric Co Ltd filed Critical Tokyo Shibaura Electric Co Ltd
Priority to JP60161500A priority Critical patent/JPS6222186A/ja
Publication of JPS6222186A publication Critical patent/JPS6222186A/ja
Publication of JPH0586585B2 publication Critical patent/JPH0586585B2/ja
Granted legal-status Critical Current

Links

Landscapes

  • Image Analysis (AREA)
  • Character Input (AREA)
  • Character Discrimination (AREA)

Description

【発明の詳細な説明】 〔発明の技術分野〕 本発明は、各種文字情報が記載された図面を処
理する図面読取り装置に関する。
〔発明の技術的背景とその問題点〕
近時、手書き図面を計算機システムに読取り入
力し、これを清書すると共にドキユメント・フア
イルする図面読取り装置が種々開発されている。
この種の装置が処理対象とする図面は、例えば
原了力プラント図面、土木建築図面、機械図面、
電気ブロツク図面、更には地図等に至るまで多種
多様に亙る。
これらの図面は、一般に線の組合せで表現され
る図形やパターンおよび接続線等からなる本来の
図面情報と、その図面情報に添書された文字列か
らなる文字情報とで構成される。文字情報は、例
えば素子名やライン名等の管理情報を表す文字
列や、コメント的な文書情報を表す文字列等か
らなる。
このような図面を読取り入力する場合、上記図
面情報を正確に読取り、これを正確に清書処理す
ることは勿論のこと、同時に図面情報に添書され
た文字列を正確に読取り認識することが望まれ
る。
そこで、従来より種々提唱されている図面処理
装置に文字認識装置を組込んで図面読取り装置を
構成し、例えばOCRによつて読取り入力された
図面の上記図面情報と文字情報とを統一的に処理
することが考えられている。
ところで、図面中に記載される文字列は、英
数字からなる文字列と、仮名漢字を含む文字列
とに大きく分類することができる。
しかしながら、現在の文字認識技術からする
と、英数字を認識することは比較的簡単である
が、仮名漢字を正確に認識するには相当大掛りな
認識処理装置を必要とする。この為、仮名漢字を
含む文字を認識し得る文字認識装置を図面処理装
置に組込むには、装置の実現性の点で問題があつ
た。
また、図面における文字列は、その記載位置、
記載の向き、文字の並び方向等が不特定であるこ
とが多い。この為、記載フオーマツトの定まらな
い文字列の各文字をそれぞれ正確に認識すること
は非常に困難であつた。
〔発明の目的〕
本発明は、このような事情を考慮してなされた
もので、その目的とするところは、図面中に記載
された文字列の文字種を識別し、この識別された
文字種に応じた認識処理を実行でき、もつて図面
の清書処理に有効に役立たせることのできる簡素
で実用性の高い図面読取り装置を提供することに
ある。
〔発明の概要〕
本発明に係る図面読取り装置は、例えばOCR
を介して読取り入力された図面画像中の図形領域
を検出して図形処理する手段と、前記図面画像中
の文字記載領域を検出する手段と、この手段によ
つて検出された文字記載領域内に複雑度が所定の
閾値より大きい文字パターンを含むか否かを計測
して上記文字記載領域内の文字列の文字種が認識
対象文字種であるか否かを識別する文字種識別手
段と、この手段によつて認識対象文字種であると
識別されたときに前記文字記載領域に対して文字
認識処理を実行する認識処理手段とを備えてい
る。
例えば複雑度の小さい英数字を認識対象文字種
とし、複雑度の大きい仮名漢字を非認識対象文字
種とすると、認識処理手段は、文字種識別手段に
おいて認識対象文字種(英数字)からなる文字列
と識別されたときにはその文字列に対する文字認
識処理を実行し、非認識対象文字種(仮名漢字)
を含む文字列と識別されたときには文字記載領域
の入力画像情報をそのまま出力したり、或いはそ
の文字記載領域を示す枠情報を出力したりする。
〔発明の効果〕
検出された文字記載領域内の文字列に複雑な文
字が含まれているか否かを調べ、複雑な文字が含
まれていないときには、その文字列の文字種が例
えば英数字等であると判定して上記文字列に対し
て文字認識処理を実行させることができ、また複
雑な文字が含まれているときには、上記文字列の
文字種が例えば漢字等であると判定して上記文字
列に対してその読取り入力画像をそのまま出力し
たり、或いはその文字記載領域の枠情報を出力す
る等して別の処理を促すことができるので、文字
認識処理の要望をある程度満足させ、同時に図面
中の文字情報に対する処理負担を軽減させて装置
の簡素化を図ることができる。
また、文字記載領域を検出し、検出された文字
記載領域内に複雑度が所定の閾値より大きい文字
パターンを含むか否かを計測して上記文字記載領
域内の文字列の文字種が認識対象文字種であるか
否かを識別するようにしているので、例えば文字
記載領域に複雑度の小さい英数字と複雑度の大き
い漢字とが混在しているような場合には、その文
字記載領域の文字種が漢字であると識別されて前
述した処理が実行されることになるので、入力図
面に対する処理制御を簡単化でき、処理時間の短
縮化に寄与できる。
〔発明の実施例〕
以下、図面を参照して本発明の一実施例につき
説明する。
第1図は実施例装置の概略構成図であり、1は
フアクシミリ、ドラムスキヤナ、ハンドスキヤナ
等からなる図面入力部である。この図面入力部1
を介して読取り入力される、例えば第2図に示す
ような図形情報および各種文字情報からなる図面
画像はフレームメモリ2に格納されて図面処理に
供される。
アドレスコントローラ3は、上記フレームメモ
リ2に格納された図面画像の2次元アドレスを管
理するものであり、このアドレス管理を受けて上
記図面画像が線図形処理プロセツセ4に読出され
る。
線図形処理プロセツサ4は、基本的には、第3
図に処理手順の一例を示すように入力図面画像か
ら図形成分の連結領域を検出し(ステツプa)、
各連結領域の大きさ等からその連結領域が図面情
報であるか、或いは文字情報であるかを判定処理
している(ステツプb)。この際、上記図形連結
成分が文字情報である場合には、その文字列に対
する外接枠を検出し、その枠内を文字記載領域と
して認定する等の処理を実行している。
テーブル処理プロセツサ5は、上記プロセツサ
4の処理結果に従つて前記入力図面画像中の図面
情報に対する図面処理を実行するものである(第
3図中、ステツプc)。この図面処理は、例えば
連結領域の各線分をベクトル解析する等してその
図形を正しく認識処理し、その図形を正規化(標
準化)して図形コード化すると共に、その図形の
図面全体における位置を確定する処理等からな
る。
このテーブル処理プロセツサ5は、前記プロセ
ツサ4から文字記載領域の情報を入力し、そこに
記載された文字列を検出している(第3図中、ス
テツプd)。そして、文字列を形成している各文
字をそれぞれ細線化処理した後(第3図中、ステ
ツプe)、それらの文字の複雑度を検出している
(第3図中、ステツプf)。この文字の複雑度は、
例えば文字のストローク数を求めたり、分岐点等
の特徴点の数を求め、その文字の大きさに対する
特徴点の密度を求める等して行われる。
このような文字の複雑度の情報を基に、文字記
載領域内に複雑度が所定の閾値より大きい文字パ
ターンを含むか否かを計測して文字記載領域内の
文字列の文字種が判定される(第3図中、ステツ
プg)。尚、この文字種の判定は、文字認識部6
が英数字を認識対象文字種としていることから、
その文字が英数字であるか、或いは仮名漢字から
なるものであるかを判定して行われる。
そして、文字種が仮名漢字であると判定された
文字記載領域の入力画像については、その座標値
と画像パターンが入力文字画像として記憶される
(第3図、ステツプh)。また文字種が英数字と判
定された文字記載領域の入力画像は文字認識部6
に与えられ、文字認識処理に供せられる(第3
図、ステツプi)。
このようにして、それぞれ処理された各領域の
情報、つまり図面領域の図形情報、文字記載領域
に記載された英数字の認識結果および文字記載領
域の仮名漢字の入力画像が統合されて出力され、
ここに入力図面画像の清書処理が完了する(第3
図中、ステツプj)。そして、上記仮名漢字文字
列に対しては、例えばキーボード入力による仮名
漢字変換処理等による対話的情報入力手段によ
り、適宜文字のコード化および清書処理が行われ
る。
ここで、上記文字列(文字記載領域)の検出処
理と、その文字種の判定処理についてさらに詳し
く説明すると、以下の通りである。
即ち、本装置では、入力図面中の文字を文字列
単位に、その文字記載領域として検出し、これを
処理するようにしている。従つてその文字列に対
する処理を非常に簡単に行うことが可能となる。
ちなみに、入力図面中から、その記載の向き、記
載の位置、文字の並びの方向が不特定な文字を1
文字ずつ正確に検出することは非常に困難であ
る。
例えば「林林」なる文字列が存在する場合、こ
れを「木」なる文字が4個連なつているのか、
「林」なる文字が2個連なつているのか等を判別
することは甚だ困難である。しかし上述したよう
に本装置では、その文字列を単位として文字記載
領域を検出するので、その検出が容易である、ま
た確実である。
一方、文字列を構成している個々の文字につい
て、その文字種を識別することは非常に大変であ
るが、その文字列中の最も複雑な文字に着目して
文字種を判定すれば、その文字列が漢字を含むも
のか否かを比較的簡単に識別することができる。
即ち、漢字の多くは複数本の縦線、横線および
斜線の交差によつて構成されている。そこで、そ
の文字列幅を基準とした長方形内における線図形
の特徴点を表す分岐点の数を計測し、その最大値
を英数字の一般的な分岐点数と比較する。具体的
には、その計測された分岐点数を所定の閾値と比
較して、その文字列が英数字であるか否かを判定
する。このよにすれば比較的簡単にその文字列の
文字種が英数字か漢字かを判定することができ
る。
このように、文字記載領域をそれぞれ処理単位
として文字認識処理するか否かを制御する本装置
によれば、文字認識処理に対する要望をある程度
満たし、しかも図面中の文字情報に対する処理負
担を大幅に軽減でき、装置の簡素化が可能とな
る。
また、特に文字記載領域を検出し、この文字記
載領域内に複雑度が所定の閾値より大きい文字パ
ターンを含むか否かを計測して上記文字記載領域
内の文字列の文字種を識別するようにしているの
で、例えば文字記載領域に英数字と漢字とが混在
しているような場合には、その文字記載領域の文
字種は漢字であると識別されて迅速に処理される
ことにより、入力図面に対する処理手続の制御を
簡単化でき、処理時間の短縮化を図ることができ
る。
尚、文字記載領域における各文字は、例えば複
数の黒画素の連結領域として検出することができ
る。従つて、例えば第4図に示すように文字パタ
ーンの各連結領域を“40”“41”〜“49”等とし
てそれぞれ求め、これらの各領域の外接枠を示す
座標値(Xa,Ya,Xb,Yb)として求める。そ
してこれらの各領域の情報を第5図に示すように
テーブル化すると共に、各領域の繋り関係をその
領域間距離が所定の閾値以下であるか否かから判
定し、その連結関係にある領域間をポインタで結
ぶようにすれば、このテーブル情報から文字を1
つづつ切出し検出することが可能となる。
このようにして文字列から切出される各文字に
ついてそれぞれ認識処理するようにすればよい。
尚、本発明は上述した実施例に限定されるもの
ではない。例えば漢字のストローク数が英数字よ
り多いことを利用して、そのストローク数から文
字種を判定しても良い。また、文字パターンを構
成する黒画素密度を計測し、局所的に画素密度の
高い箇所が検出された場合、これを漢字であると
判定するようにしても良い。
また、実施例では文字種が漢字と判定された文
字記載領域の入力画像をそのまま出力するように
しているが、その外接枠だけを出力し、この枠内
に対話的に漢字文字列を入力して図面編集するよ
うにしても良い。要するに本発明は、その要旨を
逸脱しない範囲で種々変形して実施することがで
きる。
【図面の簡単な説明】
図は本発明の一実施例を示すもので、第1図は
実施例装置の概略構成図、第2図は入力図面の例
を示す図、第3図は入力図面画像の処理手順の一
例を示す図、第4図は文字パターンの例を示す
図、第5図は文字検出の為の連結領域テーブルの
構成例を示す図である。 1……図面入力部、2……フレームメモリ、3
……アドレスコントローラ、4……線図形処理プ
ロセツサ、5……テーブル処理プロセツサ、6…
…文字認識部。

Claims (1)

    【特許請求の範囲】
  1. 1 読取り入力された図面画像中の図形領域を検
    出して図形処理する手段と、前記図面画像中の文
    字記載領域を検出する手段と、この手段によつて
    検出された文字記載領域内に複雑度が所定の閾値
    より大きい文字パターンを含むか否かを計測して
    上記文字記載領域内の文字列の文字種が認識対象
    文字種であるか否かを識別する文字種識別手段
    と、この手段によつて認識対象文字種であると識
    別されたときに前記文字記載領域に対して文字認
    識処理を実行する認識処理手段とを具備してなる
    ことを特徴とする図面読取り装置。
JP60161500A 1985-07-22 1985-07-22 図面読取り装置 Granted JPS6222186A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP60161500A JPS6222186A (ja) 1985-07-22 1985-07-22 図面読取り装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP60161500A JPS6222186A (ja) 1985-07-22 1985-07-22 図面読取り装置

Publications (2)

Publication Number Publication Date
JPS6222186A JPS6222186A (ja) 1987-01-30
JPH0586585B2 true JPH0586585B2 (ja) 1993-12-13

Family

ID=15736248

Family Applications (1)

Application Number Title Priority Date Filing Date
JP60161500A Granted JPS6222186A (ja) 1985-07-22 1985-07-22 図面読取り装置

Country Status (1)

Country Link
JP (1) JPS6222186A (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63278177A (ja) * 1987-05-08 1988-11-15 Mitsubishi Electric Corp 図面認識システム
JP2733057B2 (ja) * 1987-08-14 1998-03-30 工業技術院長 文字列成分抽出装置
JP6484436B2 (ja) * 2014-11-19 2019-03-13 日立オートモティブシステムズ株式会社 インバータ制御装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS58197581A (ja) * 1982-05-12 1983-11-17 Nec Corp 文字図形認識方法とその装置
JPS5985570A (ja) * 1982-11-08 1984-05-17 Nippon Telegr & Teleph Corp <Ntt> 情報入力方式
JPS60110089A (ja) * 1983-11-21 1985-06-15 Nec Corp 文字認識装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS58197581A (ja) * 1982-05-12 1983-11-17 Nec Corp 文字図形認識方法とその装置
JPS5985570A (ja) * 1982-11-08 1984-05-17 Nippon Telegr & Teleph Corp <Ntt> 情報入力方式
JPS60110089A (ja) * 1983-11-21 1985-06-15 Nec Corp 文字認識装置

Also Published As

Publication number Publication date
JPS6222186A (ja) 1987-01-30

Similar Documents

Publication Publication Date Title
CN110147786B (zh) 用于检测图像中的文本区域的方法、装置、设备以及介质
US5201011A (en) Method and apparatus for image hand markup detection using morphological techniques
JPH04104324A (ja) プログラム作成装置
JPH0721320A (ja) 自動スクリプト決定装置
JPH06282686A (ja) 文字認識方法
JPH0586585B2 (ja)
JP2503208B2 (ja) 名刺画像処理方法
JPS62159291A (ja) 文章入力装置
JP4648084B2 (ja) 記号認識方法及び装置
CN111476090A (zh) 水印识别方法和装置
JPH0247788B2 (ja)
JP2803736B2 (ja) 文字認識方式
JP2010258627A (ja) 画像処理装置、画像処理方法、プログラム及び記憶媒体
JP3209197B2 (ja) 文字認識装置及び文字認識プログラムを記録した記録媒体
JP2902694B2 (ja) 光学式文字読取装置
JPH0434655A (ja) 図面読取装置
JP3100825B2 (ja) 線認識方法
JPH01149184A (ja) 文字領域抽出方式
JP2972443B2 (ja) 文字認識装置
JPS63128490A (ja) 文字イメージ抽出処理装置
JPH03217993A (ja) 文字サイズ認識装置
JPS60140489A (ja) 図面認識方式
JPH0524555B2 (ja)
JPH0420506B2 (ja)
Oodaira et al. Detection of a Key String from Scene Images Using Saliency