JPH03163683A - 図面読取装置 - Google Patents

図面読取装置

Info

Publication number
JPH03163683A
JPH03163683A JP1302873A JP30287389A JPH03163683A JP H03163683 A JPH03163683 A JP H03163683A JP 1302873 A JP1302873 A JP 1302873A JP 30287389 A JP30287389 A JP 30287389A JP H03163683 A JPH03163683 A JP H03163683A
Authority
JP
Japan
Prior art keywords
character
candidate
contour
character string
candidates
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP1302873A
Other languages
English (en)
Inventor
Tomoyuki Kurita
栗田 知幸
Hitoshi Kogori
古郡 仁
Tetsuya Yasuda
哲也 安田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Meidensha Corp
Meidensha Electric Manufacturing Co Ltd
Original Assignee
Meidensha Corp
Meidensha Electric Manufacturing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Meidensha Corp, Meidensha Electric Manufacturing Co Ltd filed Critical Meidensha Corp
Priority to JP1302873A priority Critical patent/JPH03163683A/ja
Publication of JPH03163683A publication Critical patent/JPH03163683A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 A,産業上の利用分野 本発明は文字、線分、シンボル等が混在する書類や図面
から、文字データを検出してその文字の認識を行う図面
読取装置に関する。
B.発明の概要 本発明は文字、線分、シンボルが混在する書類や図面等
の被写体をラスタスキャンして得られた黒白に対応する
2値化画素データから文字データを抽出し、その文字の
認識を行う図面読取装置において、 前記2値化画素データについて輪郭ベクトル化処理を施
し、該輪郭ベクトルに外接する外接四角形データを文字
候補として求める輪郭ベクトル化処理部と、該文字候補
の外接四角形データをツリー構造で登録する登録部と、
該登録された文字候補から文字列候補を抽出する文字列
候補抽出部と、該文字列候補から文字列を抽出する文字
列抽出郎と、仮定文字幅と文字候補幅との第1偏差が、
近傍の複数の文字候補を含む幅と仮定文字幅との第2偏
差よりも大きく且つ第2偏差が所定のしきい値より小さ
いときに前記近傍の複数の文字候補を統合する機能を有
した文字切り出し部とを設けたことにより、 文字、線分、シンボルが混在するa類や図面から文字を
読み取って認識する場合、大きさや書式に限定条件を付
けることなくいかなる大きさ、書式の文字であっても容
易に且つ極めて正確に読み取ることができるとともに、
処理の簡単化を図ったものである。
C.従来の技術 文字や図形等を読み取る場合、例えば、害類や図面等の
被写体をイメージスキャナ等の人力装置でラスタスキャ
ンして黒と白の2値画像データ(人力パターン)に変換
し、この2値画像データから対象物の文字データを抽出
し、対象物の認識処理を行っている。文字、図形等が混
在する図面等に含まれる文字を認識するには、まず文字
の部分と図形をの部分を分け、さらに1文字分の情報ご
とに切り出して認識を行う必要がある。
D,発明が解決しようとする課題 ここで図面に含まれる文字は、文章のものとは異なり文
字の大きさが一定ではなく、またその書式も定まってい
ない。このため文字、線分、シンボル等が混在する書類
や図面に含まれる文字を、その書式や大きさにとらわれ
ることなく抽出して認識することは困難であった。特に
文字幅のゆらぎが大きく、分離文字の多い手書き文章等
を認識することは極めて困難であった。またそれらの処
理に時間がかかるという欠点もあった。
本発明は上記の点に鑑みてなされたものでその目的は、
書類や図面に含まれる文字がいかなる大きさ、書式であ
っても容易に且つ極めて正確に読み取ることができると
ともに処理速度を高速化した図面読取装置を提供するこ
とにある。
E.課題を解決するための手段 本発明は、文字、線分、シンボルが混在する被写体をラ
スタスキャンして得られた黒白に対応する2値化画素デ
ータから文字データを抽出し、該抽出された文字データ
と文字辞書を参照、比較して文字を認識する図面読取装
置において、前記被写体をラスタスキャンして得られた
黒白に対応する2値化画素データに基づいて、互いに隣
接した2gの黒画素を結ぶベクトルを結合して成る輪郭
ベクトルのデータを求めるとともに、該輪郭ベクトルに
外接する外接四角形データを文字候補として求める輪郭
ベクトル化処理部と、前記輪郭ベクトル化処理部で求め
られた文字候補の外接四角形データをツリー構造で登録
する登録部と、 所定の大きさに設定した文字列候補の核から検索範囲を
決定し、Wi記登録部に登録された文字候補のうち中心
座標が前記検索範囲内に存在する文字列を文字列候補と
して抽出する文字列候補抽出部と、 前記文字列候補抽出部で抽出されたデータの中から、文
字列候補核の高さhcと文字列候補内の互いに隣接する
文字候補間の距離dがd < h exk(kは定数)
なる関係にあるデータを文字列として抽出する文字列抽
出部と、 前記文字列抽出部で抽出された文字列内の文字候補の幅
と、前記hcxkの大きさに等しい幅の仮定文字幅との
第I偏差が、前記文字候補およびその近傍の文字候補を
包含する幅と前記仮定文字幅との第2偏差よりも大きく
、且つ前記第2偏差が所定のしきい値よりも小さいとき
に前記文字候補とその近傍の文字候補を統合する幅方向
統合機能と、前記文字列内の近接する複数の文字候補の
幅が重なっているときに、それら複数の文字候補を統合
する高さ方向統合機能を有し、文字列から文字を切り出
す文字切り出し部とを備え、前記文字切り出し部で切り
出された文字データに基づいて文字認識を行うことを特
徴としている。
F.作用 前記ベクトル化処理部によって外接四角形を求めると文
字、線分、ンンボルが混在する被写体(書類や図面)の
中から文字候補のデータが得られる。この文字候補の外
接四角形データはツリー構造で登録部に登録される。文
字列候補抽出部は文字列候Nli核で決まる検索範囲で
前記登録部内のデータを検索し、中心座標が検索範囲内
にある文字列を文字列候補として抽出する。前記外接四
角形データはツリー構造で登録されているので領域四角
形の近傍検索処理は軽減される。前記文字列候補の中で
、d<hc×k(dは隣接する文字候補間距離、hcは
文字列候補核の高さ、kは定数)の関係が成立するデー
タが文字列抽出部によって文字列として抽出される。す
なわち被写体の中に混在する線分やシンボルは除外され
文字列のデータのみが抽出される。次に文字切り出し部
は前記文字列から文字を切り出す。このとき文字列内の
文字候浦の幅や、その近傍の文字候浦を含む幅と仮定文
字幅との偏差に応じて所定の幅方向統合を行う。例えば
抽出された文字候補の幅が仮定文字幅よりわずかに狭く
、前記文字候補および該候補に隣接する候補を含む幅と
仮定文字幅との差が大きいとする。この場合第l偏差が
第2偏差よりも小さいのでそれら文字候補の統合は行わ
ない。
また例えば抽出された文字候補の幅か仮定文字幅よりも
極めて狭く、前記文字候浦および該候補に隣接する候補
を含む幅と仮定文字幅との差が比較的小さいとする。こ
の場合第1偏差は第2偏差よりも大きくなるが、このと
き第2偏差が所定のしきい値よりも大きければそれら文
字候補の統合は行わず、しきい値よりも小さいときのみ
統合を行う。また文字列内に高さ方向に近接する複数の
文字候補の幅が重なっている場合は、それら文字候補の
統合を行う。そして前記横方向、高さ方向に統合された
文字候補を1個の文字として切り出す。
これによって文字の大きさや書式がいかなるものであっ
ても文字として読み取ることができる。
G.実施例 以下、図面を参照しながら本発明の一実施例を説明する
。まず本発明による図面読取装置は第1図のように輪郭
ベクトル化処理部l1登録部2、文字列候補抽出部3、
文字列抽出郎4、文字切り出し部5および文字認識部6
を備えており、全体の処理の流れは第2図のように示さ
れる。すなわらまずステップS1において輪郭ベクトル
化処理部1が前処理を行い、ステップS,において登録
郎2、文字列候補抽出郎3、文字列抽出部4および文字
切り出し部5が文字切り出し処理を行い、ステップS3
において文字認識部6が文字認識処理を行う。前記輪郭
ベクトル化処理郎lが行う前処理は第3図のようなフロ
ーチャートで表される。
すなわちステップS1において画像人力処理を行い、ス
テップS,において輪郭ベクトル化処理を行い、ステッ
プS,において要素分離処理を行う。
このうち前記画像人力処理および輪郭ベクトル化処理は
例えば特願昭63−78684の特許明細書に記載され
た輪郭検出装置によって、次のようにして行う。
第4図は輪郭検出装置の構成を示す図であり、1lは輪
郭抽出部である。この輪郭抽出部11は、第5図に示す
ように書類や図面等の被写体をラスタスキャンして得ら
れた黒白に対応する2値化画素データを取り込んで、縦
横2画素×2画素の画素データをスキャンラインに沿っ
て順次に取り出し、この画素データに基づいて輪郭検出
用のコマンド列を作成して後段の輪郭解析郎12に出力
する。輪郭解析部12は前記コマンド列に基づいてテー
ブル格納部13内の輪郭要素テーブル、輪郭管理テーブ
ル及び輪郭接続テーブルの記載を更新する。また、輪郭
解析郎l2は輪郭要素テーブルと輪郭管理テーブルを使
用して!輪郭画素系列を構成する各点のうら始点からみ
て極大となる点を抽出する(巨視的処理郎31)ととも
に、この処理で抽出された連続する2点の間にある最大
距離となる点を設定したしきい値との関係からいくつか
抽出し(微視的処理部32)、この処理により抽出され
た点の輪郭ベクトルを輪郭ベクトル系列テーブル33に
記載し、この輪郭ベクトルのうち短い(ショート)ベク
トルをシタートベクトル除去部34で除去し、その記載
を更新する。
ここで輪郭要素とは互いに隣接した2個の黒画素を結ぶ
ベクトルに相当するものであり、これを結合することに
よって輪郭が構成される。そして輪郭要素テーブルとは
、第6図に示すように輪郭要素とこれら輪郭要素群より
なる輪郭とに対して各々固有の符号を付すと共に、輪郭
要素毎に、その座標及び方向と輪郭要素が所属する輪郭
の符号と輪郭要素の前後に夫々接続されている他の輪郭
要素の符号とを記載するためのものである。また輪郭管
理テーブルとは第7図に示すように輪郭毎に先端及び終
端に位置する輪郭要素の符号を記載するためのものであ
り、輪郭接続テーブルとは、第8図に示すようにラスタ
スキャン方向に並ぶ座標とその座標に前端または後端が
存在する未接続の輪郭要素の符号とその輪郭要素の未接
続端の前後端の区別とを対応させて記載するためのもの
である。また、輪郭ベクトル系列テーブルとは第9図に
示すように輪郭ベクトル系列毎に始点座標の符号を記載
するためのものである。
輪郭抽出部Ifより出力されるコマンド列は、そのとき
に取り出された2画素×2画素の画素データに係る画素
と輪郭画素との接続関係の情報、及び当該画素データの
黒白の配列パターンの情報を含む接続・パターンコード
と、当該画素データのX座標を示す座標コードとを組み
合わせてなる。
前記接続関係の一例を第10図に示すと、同図(イ)の
大枠で囲まれた2画素×2画素の画素データを取り込ん
だときには、この画素データのX座標X,,に位置する
輪郭要素の前端が接続されているという情報になる。こ
の例では、画素データの座標としては、紙面に向かって
右下に位置する画素P+の座標をとっている。また、同
図(ロ)の大枠で囲まれた画素データを取り込んだとき
には、この画素データのX座標より一つ前の座標X1−
1に位置する輪郭要素の後端か接続されているという情
報になる。なお第IO図中○印を有する枠は黒画素を示
し、○印を有しない枠は白画素を示している。そして例
えば第10図(イ)の大枠に着目すると、この場合の接
続・パターンコードは、上述の接続情報と太枠内に黒白
の配列パターンの情報とを含み、コマンド列は、この接
続パターンコードと画素P,のX座標を示す座標コード
との組み合わせとなる。なおこの座標コードについては
輪郭解析部12側にて、コマンド列の取り込みのタイミ
ングに同期して発生させることもできる。
このようにして得たコマンド列が輪郭解析郎l2に取り
込まれると次のような処理が行われる。
今第I+図の大枠の画素データに関するコマンド列が取
り込まれたとすると、接点で示す輪郭要素Cjを輪郭要
素テーブルに登録し、その方向及び座標を記入すると共
に、当該輪郭要素cjの前後に夫々接続されている他の
輪郭要素の番号を接続要素番号欄に記入する。この場合
輪郭要素cjは輪郭要素Ciの前方に位置するので、輪
郭要素Cjの欄に係る後方接続欄にCiを記入し、輪郭
要素Cjの欄に係る前方接続欄に01を記入する。
更に輪郭要素Cjの所属する輪郭の番号をこの例ではS
iを輪郭番号欄に記入する。輪郭要素の方向については
例えば8連結の場合、第12図に示すように上下.左右
,斜めの方向に対応してal〜a8が規定され、また4
連結の場合、上下,左右の4方向が規定される。そして
輪郭管理テーブルの輪郭番号Siについて、先端の輪郭
要素番号欄をCiからCjに更新すると共に、輪郭接続
テーブルにおける当該画素データのX座標について、未
接続の輪郭要素番号の前方接続の欄をCiからCjに更
新する。ところで実際の処理においては、輪郭要素Ci
に接続されるべき輪郭要素は輪91<接続テーブルによ
り明らかにされているため、輪郭要素テーブルの輪郭要
素番号Cjtmに係る前方接続欄のCjの記載は、輪郭
接続テーブルを参照して行われる。以上において所属輪
郭番号は、ラスタスキャンの進行に伴って別々に発生し
た二つの輪郭が接続されて一つの輪郭になった場合には
一方が他方に統合されて同一になる。
上記のような処理において、1輪郭画素列を構成する各
点のうち始点からみて極大となる点を抽出し、次に抽出
された接続する2点の間にある最大距離となる点を抽出
する。このように抽出された輪郭ベクトルをテーブルに
格納する。
上記のように画像人力処理および輪郭ベクトル化処理に
よって、被写体の例えば「A」という文字の人力画像は
第■3図のような輪郭ベクトルで?される。
次に文字候補の抽出を行う要素分離処理(第3図のステ
ップS.)tこついて説明する。まず前述した第9図の
輪郭ベクトル系列テーブルを使用してショートベクトル
を除去する。第14図はショートベクトル除去手段を説
明するフローチャートであり、ステップS,で第9図に
示す輪郭ベクトル系列テーブルから輪郭ベクトルの外接
四角形(第15図に示す) (X+++in+ Ymi
。)、(X■8,Y■8)の算出を行う。次にステップ
Stでdx一X man  X +mln+ d 3’
 = V waax−y1nとしきい値DXIh,DY
Lhとを比較する。ステップS,はステップS2の比較
判断部で、このステップs3で(d x>DXth) 
U (d y>DYth)を判断し、YESならステッ
プS4で輪郭ベクトルとして外?四角形という情報を作
成する。この情報の1例を第16図に外接四角形情報テ
ーブルとして示す。
前記ステップS3でNOなら第9図に示す輪郭ベクトル
系列テーブルからステップS,で同一系列のベクトルを
削除して雑音(ノイズ)を除去する。
第15図は輪郭ベクトルの外接四角形を示す説明図であ
り、この図において、X■11 + xII l n 
1y■えl yminは次のようになる。
Xmax=I’n a X (”’+ X r. ”’
)X+mln=n’l j n (”コX l.  ”
’)y■x=max(・・・,y0,・・・)Y ml
n= rn l n (・・・,y,.・・・)d X
 =X waax  X ml。
d Y = 3’ max3’ sin(d x<DX
th) n (d y<DYth)但し、DX.h,D
Y.,: Lきい値である。
上記のようにして求められた外接四角形情報(第13図
)に基づいて次のような条件で文字候補を抽出する。
条件■ Wえくしきい値且っw,<Lきい値(W.は外
接四角形のX方向長さ、w,は外接四角形のy方向長さ
) 条件■゛外周の輪郭ベクトル そして文字候補の外接四角形に完全包含される外周及び
内周の輪郭ベクトルは文字候補となった輪郭ベクトルに
リンク付けされる。
以上、第3図〜第16図のようにして前処理を行うが、
次に文字切り出し処理(第2図のステップS,)につい
て説明する。
まずこの文字切り出し処理は、前記輪郭ベクトル処理部
Iで求められた文字候補を対象に第17図のように水平
方向(ステップS+).垂直方向(ステップS,)およ
び斜め方向(ステップS.)に行われる。各方向の処理
は各々同一の内容であり、第18図に示すように文字列
候補抽出処理(ステップS,)を行った後、文字列抽出
処理(ステップSt)を行った後、文字切り出し処理(
ステップS3)を行う。
前記各ステップの処理は次のようにして行われる。まず
文字列候補抽出処理は第19図に示すように文字候補の
ツリー構造化処理(ステップS,)を行った後、文字列
候補の範囲検索処理(ステップSt)を行う。実際には
第16図のように得られた文字候補の外接四角形の中心
座標を基に空間的な2分割を繰り返す形式のツリー構造
として登録部(第1図の登録部2)に登録する。そして
文字候補のうち検索しようとする文字列の高さと同程度
の高さをもつものを文字列候補の核として第20図(a
)に示すような検索範囲に中心座標がある文字候補を前
記登録郎2の文字候補ツリーから検索する。この検索は
次のような手順で第1図の文字列候補抽出部3が行う。
■文字列核から右側に第20図(b)のような探索範囲
内の他の文字候補の中心点を検索する。
■前記■で見つかった中心点のうち、中心核より最も遠
い距離にあるものを次の探索範囲の開始点とする。そし
■で中心点が見つからない場合は右側方向の探索終わり
■左側方向について前記■.■と同様に行う。
上記の検索で見つけられたものを文字列候補とする。尚
文字列候補の核となる大きさを大きなものから数段階に
分けて設定した検索を行うことにより、大きさの異なる
文字列に対しても対応がとれる。
次に文字列抽出部4は文字列候補の中から次の条件に合
うものを文字列として抽出する。すなわち第21図に示
すように文字列候補核の高さhcと文字候補間距離dが d ( i.  j)<hcx定数  ・−( + )
なる関係にあるとき、図示文字列候補内のi.jが文字
列となる。次に文字切り出しilE5は前記抽出された
文字列から文字候補単位で文字の切り出しを行う。この
とき次の第(2)式に示す条件に合致する場合には第2
2図のステップslのように高さ方向分離文字統合を行
い、第(3)式,第(4)式に示す条件にともに合致す
る場合には第22図のステップS2のように幅方向分離
文字統合を行う。
win {xsi,xsj} ≦ (xsi  or  xsj  or  xei 
 or  xeD≦wax{xei,xej}    
     − ( 2 )(但し、xs:外接四角形の
X方向スタート座標xe・外接四角形のX方向エンド座
標)hc−k−wil>lhc−k−wiN   ++
・( 3 )hc−k−wijl<LJい値     
    ・・・ ( 4 )(但し、hc−k :仮定
文字幅 wi:文字候補iの幅 vij  :文字候補i,jを包含する外接四角形の幅
) 前記第(2)式は文字列内の文字候補i,jの幅が重な
っていることを示す条件式であり、実際の統合処理手順
は第24図のフローチャートに従って行う。例えば第2
3図(a),(b)のように高さ方向に文字候補i,J
が分離しているときに前記第(2)式の条件が成立すれ
ば、該文字候補i.jは図示(c)の如く統合される。
また、第(3)式は仮定文字幅と文字候補iの幅との差
が、仮定文字幅と文字候補l.jを含む幅との差より大
きいことを示している。第(4)式は仮定文字幅と文字
侯補i.jを含む幅との差がしきい値より小さいことを
示している。本発明では第(3).(4)式がともに成
立したときに幅方向統合処理を行うがその処理フローは
第25図に従って実行される。例えば第26図(a),
(b)のように幅方向に文字候補i,j.kが分離して
いるときに前記第(3).(4)式の条件が成立すれば
、それら文字候補は統合される。第26図(a),(b
)の場合、統合の条件としては、min{f(i,j)
、r (i, k) )=r(i,j)且つf (i,
j)<Lきい値であれば文字候補i.』を統合する。ま
た、min{f(i.j)、f (i,k))一f (
i,k)一且つf (i,k)<Lきい値であれば文字
候補i,j.kを統合する。但しf(i.j)は仮定文
字幅hc− kと文字候補i,jを含む外接四角形の幅
との偏差であり、f (i,k)は仮定文字幅hc・k
と文字候補i.kを含む外接四角形の幅との偏差である
。尚、幅方向統合の様子をまとめると第27図(a)〜
(e)の如く示される。図中f.は仮定文字幅hc−k
と文字候補iの幅との偏差である。第27図(b).(
e)からわかるように文字候補jが仮定文字幅h,・k
を超える位置に存在する場合であっても、前記偏差f(
i,j)がしきい値より小さければ文字候補iと統合す
ることができる。このため従来統合が行えなかった例え
ば文字幅のゆらぎが大きい手書き文字であっても容易に
統合することができる。
上述した文字切り出し処理(第17図、第18図)の過
程では、文字候補が文字例として確定する毎に処理済マ
ークがつき処理対象数が小さくなる。また第18図の各
処理では水平方向について説明したが、垂直方向につい
てはx.y方向が逆になる。斜め方向については所定の
煩き角度を仮定し、その角度での座標変換処理が、文字
列抽出処理、文字切り出し処理(第l8図のステップS
..S3)に含まれる。
文字認識処理(第2図のステップS.)は次のようにし
て行われる。文字認識部6は前記文字切り出し郎5で切
り出された文字と、予め文字が登録された辞書と参照、
比較し、一文字ずつ認識する。
H.発明の効果 以上のように本発明によれば輪郭ベクトル化処理部と、
登録部と、文字列候補抽出部と、文字列抽出部と、文字
切り出し部とを設けたので、文字、線分、シンボルが混
在する書類や図面から文字を読み取って認識する場合、
大きさや書式に限定条件を付けることなくいかなる大き
さ、書式の文字であっても容易に且つ性格に読み取るこ
とができる。特に文字切り出し部に幅方向統合機能を設
けたので、文字幅のゆらぎが大きい手書き文字であって
も容易に統合することができる。
また文字候補のデータはツリー構造で登録しておくので
処理の高速化か図れる。
【図面の簡単な説明】
第1図〜第27図は本発明の一実施例を示し、第I図は
全体構成のブロック図、第2図は全体のフローヂャート
、第3図は輪郭ヘクトル化処理部のフローチャート、第
4図は輪郭検出装置のブロック図、第5図はラスタスキ
ャンの様子を示す説明図、第6図は輪郭要素テーブルを
示す説明図、第7図は輪郭管理テーブルを示す説明図、
第8図は輪郭接続テーブルを示す説明図、第9図は輪郭
ベクトル系列テーブルを示す説明図、第lO図(イ),
(ロ)は、各々画素データと輪郭要素との関係を示す説
明図、第11図は輪郭要素間の接続状態を示す説明図、
第12図は輪郭要素の方向を示す説明図、第13図は輪
郭ベクトル化処理の説明図、第14図はショートベクト
ル除去手段のフローチャート、第15図は外接四角形の
説明図、第16図は外接四角形情報テーブルを示す説明
図、第!7図および第18図はともに文字切り出し処理
のフローチャート、第19図は文字列候補抽出処理のフ
ローチャート、第20図(a).(b)はともに文字列
候補抽出処理の説明図、第21図は文字列抽出処理の説
明図、第22図は文字切り出し処理のフローチャート、
第23図(a).(b),(c)は高さ方向分離文字統
合処理の説明図、第24図は高さ方向分離文字統合処理
のフローチャート、第25図は幅方向分離文字統合処理
のフローチャート、第26図(a),(b)は幅方向分
離文字統合処理の説明図、第27図(a)(b).(C
),(d).(e)は各ケース毎の幅方向分離文字統合
の様子を示す説明図である。 I・・・輪郭ベクトル化処理部、2・・・登録部、3・
・・文字列候補抽出部、4・・・文字列抽出部、5・・
・文字切り出し部、6・・・文字認識部、11・・・輪
郭抽出部、l2・・・輪郭解析部、l3・・・テーブル
格納部、3l・・・巨視的処理部、32・・・微視的処
理部、33・・・輪郭ベクトル系列テーブル、34・・
・ショートベクトル除去部。 第1図 実施例のブロック図 第2図 全体のフローチャート 第3図 輪郭ベグトMh処理部く前処理〉のフローチャート第5
図 ラスタスキャンの説明図 X 第7図 輪郭管理テーブルの説明図 第8図 輪郭接続テーブル 第9図 Iil郭ベクトル系列テーブル 第10図 N素データと輪郭平素との開係図 (イ〉 Xn−+  Xn (ロ) Xn−1 xn 第14図 第15図 第]7図 文字切り出し処理のフローチャート 文字切り出し処理のフローチャート 第19図 文字列候補抽出処理のフローチャート <a) (b) h=hc×定数 匹≦定数≦l 第21図 文字列抽出処理の説明図 文字切り出し処理のフローチャート (a) (b) (c) 第24図 高さ方向分離文字統合処理のフローチャート第25図 幅方向分離文字統合処理のフローチャート第26図

Claims (1)

    【特許請求の範囲】
  1. (1)文字、線分、シンボルが混在する被写体をラスタ
    スキャンして得られた黒白に対応する2値化画素データ
    から文字データを抽出し、該抽出された文字データと文
    字辞書を参照、比較して文字を認識する図面読取装置に
    おいて、 前記被写体をラスタスキャンして得られた黒白に対応す
    る2値化画素データに基づいて、互いに隣接した2個の
    黒画素を結ぶベクトルを結合して成る輪郭ベクトルのデ
    ータを求めるとともに、該輪郭ベクトルに外接する外接
    四角形データを文字候補として求める輪郭ベクトル化処
    理部と、前記輪郭ベクトル化処理部で求められた文字候
    補の外接四角形データをツリー構造で登録する登録部と
    、 所定の大きさに設定した文字列候補の核から検索範囲を
    決定し、前記登録部に登録された文字候補のうち中心座
    標が前記検索範囲内に存在する文字列を文字列候補とし
    て抽出する文字列候補抽出部と、 前記文字列候補抽出部で抽出されたデータの中から、文
    字列候補核の高さh_cと文字列候補内の互いに隣接す
    る文字候補間の距離dがd<h_c×k(kは定数)な
    る関係にあるデータを文字列として抽出する文字列抽出
    部と、 前記文字列抽出部で抽出された文字列内の文字候補の幅
    と、前記h_c×kの大きさに等しい幅の仮定文字幅と
    の第1偏差が、前記文字候補およびその近傍の文字候補
    を包含する幅と前記仮定文字幅との第2偏差よりも大き
    く、且つ前記第2偏差が所定のしきい値よりも小さいと
    きに前記文字候補とその近傍の文字候補を統合する幅方
    向統合機能と、前記文字例内の近接する複数の文字候補
    の幅が重なっているときに、それら複数の文字候補を統
    合する高さ方向統合機能を有し、文字列から文字を切り
    出す文字切り出し部とを備え、 前記文字切り出し部で切り出された文字データに基づい
    て文字認識を行うことを特徴とする図面読取装置。
JP1302873A 1989-11-21 1989-11-21 図面読取装置 Pending JPH03163683A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP1302873A JPH03163683A (ja) 1989-11-21 1989-11-21 図面読取装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1302873A JPH03163683A (ja) 1989-11-21 1989-11-21 図面読取装置

Publications (1)

Publication Number Publication Date
JPH03163683A true JPH03163683A (ja) 1991-07-15

Family

ID=17914132

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1302873A Pending JPH03163683A (ja) 1989-11-21 1989-11-21 図面読取装置

Country Status (1)

Country Link
JP (1) JPH03163683A (ja)

Similar Documents

Publication Publication Date Title
US5907631A (en) Document image processing method and system having function of determining body text region reading order
Cheung et al. An Arabic optical character recognition system using recognition-based segmentation
US6975762B2 (en) Ruled line extracting apparatus for extracting ruled line from normal document image and method thereof
KR970017047A (ko) 문서 화상으로부터의 타이틀 추출 장치 및 방법
JP2917427B2 (ja) 図面読取装置
JPH03163683A (ja) 図面読取装置
JP2797523B2 (ja) 図面続取装置
Mechi et al. Combining deep and ad-hoc solutions to localize text lines in ancient Arabic Document Images
JPH03189888A (ja) 図面読取装置における文字列の種類決定装置
JPH09138837A (ja) 帳票認識装置
CN110727820B (zh) 一种为图片获得标签的方法和系统
JPH0334081A (ja) 図面読取装置
JP3402755B2 (ja) 領域分割方法
JP2803735B2 (ja) 罫線を含んだ文字認識装置
JP3379327B2 (ja) 文字認識装置
JP2789622B2 (ja) 文字/図形領域判定装置
JPH03142691A (ja) 表形式文書認識方式
JPH05242294A (ja) 図面読取装置
JPH04171590A (ja) 図面読取装置
JPH08212292A (ja) 枠線認識装置
JPH03118679A (ja) 図面読取装置
JPS63157287A (ja) 文字パタ−ン抽出方法
JPH08171609A (ja) 文字列高速抽出装置
JPH05120483A (ja) 文字認識装置
JPH05189606A (ja) 文字列領域検出方法