JPH0452783A

JPH0452783A - 図面読取装置

Info

Publication number: JPH0452783A
Application number: JP2156070A
Authority: JP
Inventors: Tomoyuki Kurita; 栗田　知幸; Hitoshi Kogori; 古郡　仁
Original assignee: Meidensha Corp; Meidensha Electric Manufacturing Co Ltd
Current assignee: Meidensha Corp; Meidensha Electric Manufacturing Co Ltd
Priority date: 1990-06-14
Filing date: 1990-06-14
Publication date: 1992-02-20
Anticipated expiration: 2014-07-12
Also published as: JP2917427B2

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】Ａ、産業上の利用分野本発明は文字、線分、シンボル等が混在する書類や図面
から、文字データを検出してその文字の認識を行う図面
読取装置に関する。

Ｂ０発明の概要本発明は文字、線分、シンボルが混在する書類や図面等
の被写体をラスタスキャンして得られた黒白に対応する
２値化画素データから文字データを抽出し、その文字の
認識を行う図面読取装置において、前記２値化画素データについて輪郭ベクトル化処理を施
す輪郭ベクトル化処理部と、文字候補の外接四角形デー
タをツリー構造で登録する登録部と、該登録された文字
候補から文字列候補を抽出する文字列候補抽出部と、該
文字列候補から文字列を抽出する文字列抽出部と、前記
抽出された文字列内の文字候補と英数文字、記号の辞書
の文字との近似度合を表す評価値を求め、該評価値と予
め設定した評価値の最大値（しきい値）とを比較するこ
とによって文字列の種類を判定する機能を有した文字切
り出し部とを設けたことにより、文字、線分、シンボル
が混在する書類や図面から文字を読み取って認識する場
合、漢字と英数文字、記号とを誤って認識することを防
止するとともに、文字切り出しの誤りを防止し、いかな
る大きさ、書式の文字であっても容易に且つ極めて正確
に読み取ることができるようにし、且つ処理の簡単化を
図ったものである。

Ｃ８従来の技術文字や図形等を読み取る場合、例えば、書類や図面等の
被写体をイメージスキャナ等の人力装置でラスタスキャ
ンして黒と白の２値画像データ（入カバターン）に変換
し、この２値画像データから対象物の文字データを抽出
し、対象物の認識処理を行っている。文字、図形等が混
在する図面等に含まれる文字を認識するには、ます文字
の部分と図形の部分を分け、さらに１文字分の情報ごと
に切り出して認識を行う必要がある。

００発明か解決しようとする課題ここで図面に含まれる文字は、文章のものとは異なり文
字の大きさが一定ではなく、またその書式も定まってい
ない。このため文字、線分、シンボル等が混在する書類
や図面に含まれる文字を、その書式や大きさにとられれ
ることなく抽出して認識することは困難であった。特に
文字幅のゆらぎが大きく、分離文字の多い手書き文章等
を認識することは極めて困難であった。またそれらの処
理に時間がかかるという欠点もあった。

さらに従来のように、仮定した文字幅、文字間隔に基づ
いて文字列データから１文字分のデータを切り出す方法
においては、文字ピッチ、文字幅が一定である活字等に
はしばしば有用であるが、手書き文字等の場合は仮定さ
れた文字幅、文字間隔に根拠が薄く誤った切り出しが行
われることがある。また図面の文字においては、英数字
列が大部分であるが、漢字文字列も少数混在している場
合もある。このような図面を英数字、漢字の区別なく正
しく認識しようとすると文字切り出し部および文字認識
部において次のような誤りを生ずる。

すなわち、第３２図（ａ）のように文字列から文字を切
り出すときに誤って数字の１と２や３と４を統合してし
まう。また第３２図（ｂ）のように英字のｒＲＪを漢字
の「尺」と誤って認識してしまう。

本発明は上記の点に鑑みてなされたものでその目的は、
文字の誤認讃や誤切り出しを防いで書類や図面に含まれ
る文字がいかなる大きさ、書式であっても容易に且つ極
めて正確に読み取ることができるとともに処理速度を高
速化した図面読取装置を提供することにある。

８９課題を解決するための手段本発明は、文字、線分、シンボルが混在する被写体をラ
スタスキャンして得られた黒白に対応する２値化画素デ
ータから文字データを抽出し、該抽出された文字データ
と文字辞書を参照、比較して文字を認識する図面読取装
置において、前記被写体をラスタスキャンして得られた
黒白に対応する２値化画素データに基づいて、互いに隣
接［また２個の黒画素を結ぶベクトルを結合して成る輪
郭ベクトルのデータを求めるとともに、該輪郭ベクトル
に外接する外接四角形データを文字候補として求める輪
郭ベクトル化処理部と、前記輪郭ベクトル化処理部で求
められた文字候補の外接四角形データをツリー構造で登
録する登録部と、所定の大きさに設定した文字列候補の核から検索範囲を
決定し、前記登録部に登録された文字候補のうち中心座
標が前記検索範囲内に存在する文字列を文字列候補とし
て抽出する文字列候補抽出部と、前記文字列候補抽出部で抽出されたデータの中から、文
字列データの高さり。と文字列候補内の互いに隣接する
文字候補間の距離ｄがｄ＜ｈ。×ｋ　（ｋは定数）なる
関係にあるデータを文字列として抽出する文字列抽出部
と、前記文字列抽出部で抽出された文字列内の近接する複数
の文字候補の幅が重なっているときに、それら複数の文
字候補を統合する高さ方向統合機能と、該機能により統
合された各文字候補と、英数文字および記号の辞書とを
比較して文字認識を行い、該複数の認識結果に対応して
、前記文字候補と辞書の文字との近似度合を表す評価値
を各々求める英数文字認識機能と、前記英数文字および
記号の辞書の文字、記号に各々対応して、同一文字、記
号についての複数のサンプルと辞書の文字、記号との近
似度合を表す評価値列のうち最大値をしきい値として設
定し、−該設定されたしきい値と前記英数文字認識機能
で求められた評価値とを比較して、文字列が英数文字列
であるか否かを判定する文字列種類判定機能と、該判定
機能が英数文字列ではないと判定した文字列の文字候補
の幅と、前記ｈｃ×ｋの大きさに等しい幅の仮定文字幅
との第１偏差が、前記文字候補およびその近傍の文字候
補を包含する幅と前記仮定文字幅との第２偏差よりも大
きく、且つ前記第２偏差が所定のしきい値よりも小さい
ときに前記文字候補とその近傍の文字候補を統合する幅
方向統合機能を有し、文字列から文字を切り出す文字切
り出し部とを備え、前記文字切り出し部で切り出された
文字データに基づいて文字認識を行うことを特徴として
いる。

Ｆ６作用前記ベクトル化処理部によって外接四角形を求めると文
字、線分、シンボルが混在する被写体（書類や図面）の
中から文字候補のデータが得られる。この文字候補の外
接四角形データはツリー構造で登録部に登録される。文
字列候補抽出部は文字列候補核で決まる検索範囲で前記
登録部内のデータを検索し、中心座標が検索範囲内にあ
る文字列を文字列候補として抽出する。前記外接四角形
データはツリー構造で登録されているので領域四角形の
近傍検索処理は軽減される。前記文字列候補の中で、ｄ
＜ｈ、×ｋ　（ｄは隣接する文字候補間距離、ｈ。は文
字列候補核の高さ、ｋは定数）の関係が成立するデータ
が文字列抽出部によって文字列として抽出される。すな
わち被写体の中に混在する線分やシンボルは除外され文
字列のデータのみが抽出される。次に文字切り出し部は
前記文字列から文字を切り出す。まず文字列内に高さ方
向に近接する複数の文字候補の幅が重なっている場合は
、それら文字候補の統合を行う。そして高さ方向につい
ての統合が行われた後、各文字候補と英数文字、記号の
辞書とが比較され文字認識が行われる。そして複数の認
識結果に対応して評価値が求められる。このように求め
られた評価値は、予め設定されたしきい値と比較され、
文字列が英数文字列であるか否かの判定が行われる。判
定した結果文字列が英数文字列である場合は幅方向統合
は行わない。また文字列が英数文字ではない場合は次の
ような幅方向統合が行われる。すなわち、例えば文字候
補の幅が仮定文字幅よりわずかに狭く、前記文字候補お
よび該候補に隣接する候補を含む幅と仮定文字幅との差
が大きいとする。

この場合第１偏差が第２偏差よりも小さいのでそれら文
字候補の統合は行わない。また例えば抽出された文字候
補の幅が仮定文字幅よりも極めて狭く、前記文字候補お
よび該候補に隣接する候補を含む幅と仮定文字幅との差
が比較的小さいとする。

この場合第１偏差は第２偏差よりも大きくなるが、この
とき第２偏差が所定のしきい値よりも大きければそれら
文字候補の統合は行わず、しきい値よりも小さいときの
み統合を行う。そして前記横方向、高さ方向に統合され
た文字候補を１個の文字として切り出す。これによって
文字の大きさや書式がいかなるものであっても文字とし
て読み取ることかできる。

また英数文字と漢字の区別は確実に行われ、誤って認識
されることはない。さらに英数文字が誤って幅方向に統
合されることはない。

Ｇ、実施例以下、図面を参照し、なから本発明の一実施例を説明す
る。まず本発明による図面読取装置は第１図のように輪
郭ベクトル化処理部１、登録部２、文字列候補抽出部３
、文字列抽出部４、文字切り出し部５および文字認識部
６を備えており、全体の処理の流れは第２図のように示
される。すなわちまずステップＳ１において輪郭ベクト
ル化処理部１が前処理を行い、ステップＳ２において登
録部２、文字列候補抽出部３、文字列抽出部４および文
字切り出し部５が文字切り出し処理を行い、ステップＳ
３において文字認識部６が文字認識処理を行う。前記輪
郭ベクトル化処理部１が行う前処理は第３図のようなフ
ローチャートで表される。

すなわちステップＳ１において画像入力処理を行い、ス
テップＳ２において輪郭ベクトル化処理を行い、ステッ
プＳ、において要素分離処理を行う。

このうち前記画像入力処理および輪郭ベクトル化処理は
例えば特願昭６３−７８６８４の特許明細書に記載され
た輪郭検出装置によって、次のようにして行う。

第４図は輪郭検出装置の構成を示す図であり、１１は輪
郭抽出部である。この輪郭抽出部１１−は、第５図に示
すように書類や図面等の被写体をラスタスキャンして得
られた黒白に対応する２値化画素データを取り込んで、
縦横２画素×２画素の画素データをスキャンラインに沿
って順次に取り出し、この画素データに基づいて輪郭検
出用のコマンド列を作成して後段の輪郭解析部１２に出
力する。輪郭解析部１２は前記コマンド列に基づいてテ
ーブル格納部１３内の輪郭要素テーブル、輪郭管理テー
ブル及び輪郭接続テーブルの記載を更新する。また、輪
郭解析部１２は輪郭要素テーブルと輪郭管理テーブルを
使用［７て１輪郭画素系列を構成する各点のうち始点か
らみて極大となる点を抽出する（巨視的処理部３１）と
ともに、この処理で抽出された連続する２点の間にある
最大距離となる点を設定したしきい値との関係からいく
つか抽出しく微視的処理部３２）、この処理により抽出
された点の輪郭ベタ１ヘルを輪郭ベクトル系列テーブル
３３に記載し、この輪郭ベクトルのうち短い（ショート
・）ベクトルをショートベクトル除去部３４で除去し、
その記載を更新する。

ここで輪郭要素どは万いに隣接シ１．た２個の黒画素を
結ぶベクトルに相当するものであり、これを結合するこ
とによって輪郭が構成される。そ（、て輪郭要素テーブ
ルとは、第６図に示すように輪郭要素とこれら輪郭要素
群よりなる輪郭とに対して各々固有の符号を付すと共に
、輪郭要素毎に、その座標及び方向と輪郭要素が所属す
る輪郭の符号と輪郭要素の前後に夫々接続されている他
の輪郭要素の符号とを記載するためのものである。また
輪郭管理テーブルとは第７図に示すように輪郭毎に先端
及び終端に位置する輪郭要素の符号を記載するためのも
のであり、輪郭接続テーブルとは、第８図に示すように
ラスタスキャン方向に並ぶ座標とその座標に前端または
後端が存在する未接続の輪郭要素の符号とその輪郭要素
の未接続端の前後端の区別とを対応させて記載するため
のものである。また、輪郭ベクトル系列テーブルとは第
９図に示すように輪郭ベクトル系列毎に始点座標の符号
を記載するためのものである。

輪郭抽出部ＩＩより出力されるコマンド列は、そのとき
に取り出された２画素×２画素の画素データに係る画素
と輪郭画素との接続関係の情報、及び当該画素データの
黒白の配列パターンの情報を含む接続−パターンコード
と、当該画素データのＸ座標を示す座標コードとを組み
合わせてなる。

前記接続関係の一例を第１０図に示すと、同図（イ）の
大枠で囲まれた２画素×２画素の画素データを取り込ん
だときには、この画素データのＸ座標Ｘ、に位置する輪
郭要素の前端が接続されているという情報になる。この
例では、画素データの座標としては、紙面に向かって右
下に位置する画素Ｐ１の座標をとっている。また、同図
（ロ）の大枠で囲まれた画素データを取り込んだときに
は、この画素データのＸ座標より一つ前の座標Ｘ、−１
に位置する輪郭要素の後端が接続されているという情報
になる。なお第１０図中Ｏ印を有する枠は黒画素を示し
、○印を有しない枠は白画素を示している。そして例え
ば第１０図（イ）の大枠に着目すると、この場合の接続
・パターンコードは、上述の接続情報と大枠内に黒白の
配列パターンの情報とを含み、コマンド列は、この接続
パターンコードと画素Ｐ１のＸ座標を示す座標コードと
の組み合わせとなる。なおこの座標コードについては輪
郭解析部１２側にて、コマンド列の取り込みのタイミン
グに同期して発生させることもできる。

このようにして得たコマンド列が輪郭解析部１２に取り
込まれると次のような処理が行われる。

令弟１１図の大枠の画素データに関するコマンド列が取
り込まれたとすると、接点で示す輪郭要素Ｃｊを輪郭要
素テーブルに登録し、その方向及び座標を記入すると共
に、当該輪郭要素Ｃｊの前後に夫々接続されている他の
輪郭要素の番号を接続要素番号欄に記入する。この場合
輪郭要素Ｃｊは輪郭要素Ｃｉの前方に位置するので、輪
郭要素Ｃｊの欄に係る後方接続欄にＣｉを記入し、輪郭
要素Ｃｊの欄に係る前方接続欄にＣｉを記入する。

更に輪郭要素Ｃｊの所属する輪郭の番号をこの例ではＳ
ｉを輪郭番号欄に記入する。輪郭要素の方向については
例えば８連結の場合、第１２図に示すように上下、左右
、斜めの方向に対応してａ〜ａ８が規定され、また４連
結の場合、上下、左右の４方向が規定される。そして輪
郭管理テーブルの輪郭番号Ｓｉについて、先端の輪郭要
素番号欄をＣｉからＣｊに更新すると共に、輪郭接続テ
ーブルにおける当該画素データのＸ座標について、朱接
続の輪郭要素番号の前方接続の欄をＣｉからＣｊに更新
する。ところで実際の処理においては、輪郭要素Ｃｉに
接続されるべき輪郭要素は輪郭接続テーブルにより明ら
かにされているため、輪郭要素テーブルの輪郭要素番号
Ｃ」欄に係る前方接続側のＣｊの記載は、輪郭接続テー
ブルを参照して行われる。以上において所属輪郭番号は
、ラスタスキャンの進行に伴って別々に発生した二つの
輪郭が接続されて一つの輪郭になった場合には一方が他
方に統合されて同一になる。

上記のような処理において、１輪郭画素列を構成する各
点のうち始点からみて極大となる点を抽出し、次に抽出
された接続する２点の間にある最大距離となる点を抽出
する。このように抽出された輪郭ベクトルをテーブルに
格納する。

上記のように画像人力処理および輪郭ベクトル化処理に
よって、被写体の例えばｒＡＪという文字の入力画像は
第１３図のような輪郭ベクトルで表される。

次に文字候補の抽出を行う要素分離処理（第３図のステ
ップＳ３）について説明する。まず前述した第９図の輪
郭ベクトル系列テーブルを使用してショートベクトルを
除去する。第１４図はショートベクトル除去手段を説明
するフローチャートであり、ステップＳ１で第９図に示
す輪郭ベクトル系列テーブルから輪郭ベクトルの外接四
角形（第１５図に示す）　　（ｘ、、ｉ、、、　　ｙ。

１．）、（Ｘｌ、工。

Ｙ、、、、）の算出を行う。次にステップＳ２でｄｘ−
Ｘ、、、、−Ｘ、、ｉ、、ｄｙ＝ｙ−、、−ｙ−ｉ、と
しきい値ＤＸ、ｈ、ＤＹ、、とを比較する。ステップＳ
３はステップＳ２の比較判断部で、このステップＳ３で
（ｄ　Ｘ　＞ＤＸｔｈ）　Ｕ　（ｄ　ｙ　＞ＤＹｉｈ）
を判断し、ＹＥＳならステップＳ４で輪郭ベクトルとし
て外接四角形という情報を作成する。この情報の１例を
第１６図に外接四角形情報テーブルとして示す。

前記ステップＳ３でＮＯなら第９図に示す輪郭ベクトル
系列テーブルからステップＳ５で同一系列のベクトルを
削除して雑音（ノイズ）を除去する。

第１５図は輪郭ベクトルの外接四角形を示す説明図であ
り、この図において、Ｘ、、工、　　Ｘ、ｉ、。

ｙｍ＆Ｘｊ　　ｙｌｌｌｌｌｌは次のようになる。

ｘ　ｍ−ｘ−ｍ　ａ　ｘ　（・、ｘ　＋、・・・）ｘ、
、＋、＋−ｍ　ｉ　ｎ　Ｃ−、Ｘ；、−）ｙイー　ｘ　
＝　ｍ　ａ　ｘ　　（−・・、ｙｉ、　　・・・）ｙユ
＋、＝ｍｉｎ（・・・、　ｙ３．・・・）ｄ　Ｘ　−Ｘ
　ｍａ　ｘ　　　Ｘ　ｔｎ　＋　−ｄｙ；ｙｌｌｌｌｌ
ニーｙＩＩＩＩｌｌ（ｄ　ｘ＜ＤＸｔｈ）　ｎ　（ｄ　
ｙ　＜ＤＹｉｈ）但し、Ｄ　Ｘ　ｌｈ、　Ｄ　Ｙ　、ｈ
　：　Ｌきい値である。

上記のようにして求められた外接四角形情報（第１３図
）に基づいて次のような条件で文字候補を抽出する。

条件■　Ｗ工くしきい値且つｗ、くしきい値（Ｗｘは外
接四角形のＸ方向長さ、ｗｙは外接四角形のｙ方向長さ
）条件■　外周の輪郭ベクトルそして文字候補の外接四角形に完全包含される外周及び
内周の輪郭ベクトルは文字候補となった輪郭ベクトルに
リンク付けされる。

以上、第３図〜第１６図のようにして前処理を行うが、
次に文字切り出し処理（第２図のステップＳｚ）につい
て説明する。

まずこの文字切り出し処理は、前記輪郭ベクトル処理部
１で求められた文字候補を対象に第１７図のように水平
方向（ステップＳ１）、垂直方向（ステップＳ２）およ
び斜め方向（ステップＳ３）に行われる。各方向の処理
は各々同一の内容であり、第１８図に示すように文字列
候補抽出処理（ステップＳ、）を行った後、文字列抽出
処理（ステップＳ２）を行った後、文字切り出し処理（
ステップＳ３）を行う。

前記各ステップの処理は次のようにして行われる。まず
文字列候補抽出処理は第１９図に示すように文字候補の
ツリー構造化処理（ステップＳ＋）を行った後、文字列
候補の範囲検索処理（ステップＳ２）を行う。実際には
第１６図のように得られた文字候補の外接四角形の中心
座標を基に空間的な２分割を繰り返す形式のツリー構造
として登録部（第１図の登録部２）に登録する。そして
文字候補のうち検索しようとする文字列の高さと同程度
の高さをもつものを文字列候補の核として第２０図（ａ
）に示すような検索範囲に中心座標がある文字候補を前
記登録部２の文字候補ツリーから検索する。この検索は
次のような手順で第１図の文字列候補抽出部３が行う。

■文字列核から右側に第２０図（ｂ）のような探索範囲
内の他の文字候補の中心点を検索する。

■前記■で見つかった中心点のうち、中心核より最も遠
い距離にあるものを次の探索範囲の開始点とする。モし
て■で中心点が見つからない場合は右側方向の探索路わ
り。

■左側方向について前記■、■と同様に行う。

上記の検索で見つけられたものを文字列候補とする。尚
文字列候補の核となる大きさを大きなものから数段階に
分けて設定した検索を行うことにより、大きさの異なる
文字列に対しても対応がとれる。

次に文字列抽出部４は文字列候補の中から次の条件に合
うものを文字列として抽出する。すなわち第２１図に示
すように文字候補単位列と文字候補間距離ｄがｄ　（ｉ、　　ｊ）　＜ｈ。×定数　　・・・（１）な
る関係にあるとき、図示文字列候補内のｉ、ｊが文字列
となる。

次に文字切り出し部５は、第２２図のような手順で前記
抽出された文字列から文字候補単位で文字の切り出しを
行う。まず次の第（２）式に示す条件に合致する場合に
はステップＳ１のように高さ方向分離文字統合を行う。

ｍｉｎ　１ｘｓｉ、ｘｓｊ） ≦（ｘｓｉ　ｏｒ　ｘｓｊ　ｏｒ　ｘｅｉ　ｏｒ　ｘｅ
ｊ）≦ｗａｘ　（ｘｅｉ、　ｘｅｊ）　　　　　　　　
　・・・（２）（但し、ｘＳ：外接四角形のＸ方向スタ
ート座標Ｘｅ：外接四角形のＸ方向エンド座標）前記第
（２）式は文字列内の文字候補１＋　　Ｊの幅が重なっ
ていることを示す条件式であり、実際の統合処理手順は
第２４図のフローチャートに従って行う。例えば第２３
図（ａ）、　　（ｂ）のように高さ方向に文字候補１．
ｊが分離しているときに前記第（２）式の条件が成立す
れば、該文字候補ｉ、Ｊは図示（ｃ）の如く統合される
。次に第２２図のステップＳ２においては、前記高さ方
向統合処理された文字候補と、英数文字、記号の辞書と
が比較され、文字認識が行われる。そして第２５図（高
さ方向統合処理後の文字列）のような文字列データに対
して、第２６図に示すように認識結果とその評価値のテ
ーブルが作成される。第２６図においてデータ番号は第
２５図の各文字候補Ｃ１〜Ｃ５の番号であり、各データ
に対して辞書とのマツチング度の良いものから順次並べ
られ、それら各認識結果についての評価値もテーブル化
されている。前記評価値は、認識結果が辞書の文字にど
れくらい近いかを数値で示したもので、この評価値か小
さいほど辞書の文字に似ていることを意味する。次にス
テップＳ３においては、予め実験により第２７図のよう
に作成したしきい値テーブルど、前記英数文字認識（ス
テップＳ２）によって作成されたデータテーブル（第２
６図）とを比較し、文字列の種類を判定する。

ここでｒＡＪという文字データサンプルを漢字、英数字
を含めた辞書で認識さぜ正しく認識結果（第１位）が得
られたとき、すなわちＡという認識結果が得られたとき
の評価値をｅＡどする。しかしながら任意のＡという文
字を認識させたとき、その結果が正しくＡと認識された
としても評価値がｅＡどなるとは限らないので、数多く
のＡという文字データサンプルに対ｌ−で同じ実験を行
う。

そのときの評価値列をＥＡとすればＥ　Ａ　＝（ｅ　Ａ
１１ｌｅＡ１・・・ｅＡｊである。もし任意の文字を認
識したときの結果がｒＡＪであり、そのときの評価値が
ｅａｊａであるなら、ｅ、、、＜ｍ、ａ　ｘ　　（Ｅｄ
であればその結果は妥当であると言える。従って第２７
図に示すしきい値テーブルのｔｈＡはｔｈＡ＝ｍａＸｆ
ＥＡ）と定義する。同種の実験を文字Ｂ−Ｚ。

θ〜９．記号に対して繰り返し、しきい値テーブルの最
大値Ｅ　ｌｋを、Ｅ　＋ｂ−ｍ　ａ　ｘ　　（ｔ　ｈＡ
”　ｔ　ｈｚ。

ｔ、。〜ｔ＋＋ｇ、ｔｈ記号１〜ｔｈｇｖ。）　と定義
する。

前記文字列種類の判定は第２８図のような手順で行う。

すなわちステップｓ１では第２６図テーブル中の第１位
の認識結果の評価値の文字列平均ｅ−ｍｅａｎと第２７
図のしきい値テーブルの値の最大値Ｅ０を比較する。そ
の結果、ｅ−ｍｅａｎ＞Ｅ＋ｈ　　　　　　−（３）なる式が成
立した場合、Ｅ　ｌｈが前記実験により得られた値であ
るため、少なくとも英数字文字列ではない（すなわち漢
字列である）ということが決定できる。また、ｅ−ｍｅ
ａｎ≦Ｅ　１ｍが成り立つ場合、判定する文字が残って
いることを条件（ステップＳ２）としてステップＳ３１
　８４．　Ｓ５において個々の文字の認識結果が妥当で
あるか否かの判定を第２７図のしきい値テーブルを参照
して行う。

第２７図のしきい値テーブルはある文字の認識結果の第
１位がｒＡＪという文字コードを持つ文字であった場合
、そのときの認識の評価値はｔｈ＾以下の数値をとらな
ければならないことを示している。もしある文字の認識
結果がその結果に対応する評価値ｅに対して、ｅ＜（対応するしきい値テーブルの値）・・・（４）な
る式が成り立たない場合は、認識結果の第２位以下に対
して第（４）式の条件を満たすものがあるかを調べる。

このような判定を文字列の全文字候補に対して行い、１
文字でも第（４）式が成立しない場合は漢字文字列と決
定する。

次に第２２図のステップＳ４では、次の第（５）式、第
（６）式に示す条件にともに合致する場合には幅方向分
離文字統合を行う（漢字列のみ）。

ｈｏ・ｋ−ａｉｌ＞ｌｈ、Ｏｋ−ｗｉｊｌ　　　・・・
（５）ｈ。・ｋ−ｗｉｊｌ＜Ｌきい値　　　　　　　　
　・・・　（６）（但し、ｈ。・ｋ：仮定文字幅Ｗｉ：文字候補ｉの幅ｗｉｊ　　：文字候補ｉ、ｊを包含する外接四角形の幅
）前記第（５）式は仮定文字幅と文字候補ｉの幅との差が
、仮定文字幅と文字候補ｉ、ｊを含む幅との差より大き
いことを示している。第（６）式は仮定文字幅と文字候
補Ｉｔ　　Ｊを含む幅との差がしきい値より小さいこと
を示している。本発明では第（５）、　　（６）式がと
もに成立したときに幅方向統合処理を行うがその処理フ
ローは第２９図に従って実行される。例えば第３０図（
ａ）。

（ｂ）のように幅方向に文字候補ｉ、ｊ、ｋが分離して
いるときに前記第（５）、（６）式の条件が成立すれば
、それら文字候補は統合される。第３０図（ａ）、（ｂ
）の場合、統合の条件としては、ｍｉｎ　　（ｆ　ｃｉ
、　　ｊ）、ｆ　（ｉ、　　ｋ）ｌ　−ｆ（ｉ、　　ｊ
）且つｆ　（ｉ、　　ｊ）　＜シきい値であれば文字候
補ｉ、ｊを統合する。また、ｍｉｎ　（ｆ（ｉ、ｊ）　
、ｆ　（ｉ、ｋ）ｌ　−ｆ　（ｉ、ｋ）且つｆ　（ｉ、
　　ｋ）　＜Ｌ、きい値であれば文字候補ｉ、　　ｊ。

ｋを統合する。但しｆ　（ｉ、ｊ）は仮定文字幅り。・
ｋと文字候補Ｌ　　Ｊを含む外接四角形の幅との偏差で
あり、ｆ　（ｉ、ｋ）は仮定文字幅ｈ６にと文字候補ｔ
、　ｋを含む外接四角形の幅との偏差である。尚、幅方
向統合の様子をまとめると第３１図（ａ）〜（ｅ）の如
く示される。図中ｆ。

は仮定文字幅り。・ｋと文字候補ｉの幅との偏差である
。第３１図（ｂ）、（ｅ）かられかるように文字候補ｊ
が仮定文字幅り。・ｋを超える位置に存在する場合であ
っても、前記偏差ｆ　（ｉ、　　ｊ）、がしきい値より
小さければ文字候補ｉと統合することができる。このた
め従来統合が行えなかった例えば文字幅のゆらぎが大き
い手書き文字であっでも容易に統合することができる。

上述した文字切り出し処理（第１７図、第１８図）の過
程では、文字候補が文字例として確定する毎に処理済マ
ークがつき処理対象数が小さくなる。また第１８図の各
処理では水平方向について説明したが、垂直方向につい
てはｘ、　　ｙ方向が逆になる。斜め方向については所
定の傾き角度を仮定し、その角度での座標変換処理が、
文字列抽出処理、文字切り出し処理（第１８図のステッ
プＳ、、Ｓｌ）に含まれる。

文字認識処理（第２図のステップＳｓ）は次のようにし
て行われる。文字認識部６は前記文字切り出し部５で切
り出された文字と、予め文字が登録された辞書と参照、
比較し、−文字ずつ認識する。

Ｈ９発明の効果以上のように本発明によれば輪郭ベクトル化処理部と、
登録部と、文字列候補抽出部と、文字列抽出部と、文字
切り出し部とを設けたので、文字、線分、シンボルが混
在する書類や図面から文字を読み取って認識する場合、
大きさや書式に限定条件を付けることなくいかなる大き
さ、書式の文字であっても容易に且つ正確に読み取るこ
とができる。特に文字切り出し部に英数文字認識機能お
よび文字列種類判定機能を設けたので、英数文字列であ
るか否かを正確に判定することができる。このため例え
ば英字のｒＲＪと漢字の「尺」のように手書きでは極め
てまぎられしくなる文字でも正確に認識することができ
る。また英数文字を誤って統合してしまうことは避けら
れる。さらに文字切り出し部に幅方向統合機能を設けた
ので、文字幅のゆらぎが大きい手書き文字であっても容
易に統合することができる。

また文字候補のデータはツリー構造で登録しておくので
処理の高速化が図れる。

【図面の簡単な説明】

第１図〜第３１図は本発明の一実施例を示し、第１図は
全体構成のブロック図、第２図は全体のフローチャート
、第３図は輪郭ベクトル化処理部のフローチャート、第
４図は輪郭検出装置のブロック図、第５図はラスタスキ
ャンの様子を示す説明図、第６図は輪郭要素テーブルを
示す説明図、第７図は輪郭管理テーブルを示す説明図、
第８図は輪郭接続テーブルを示す説明図、第９図は輪郭
ベクトル系列テーブルを示す説明図、第１０図（イ）、
（ロ）は、各々画素データと輪郭要素との関係を示す説
明図、第１１図は輪郭要素間の接続状態を示す説明図、
第１２図は輪郭要素の方向を示す説明図、第１３図は輪
郭ベクトル化処理の説明図、第１４図はショートベクト
ル除去手段のフローチャート、第１５図は外接四角形の
説明図、第１６図は外接四角形情報テーブルを示す説明
図、第１７図および第１８図はともに文字切り出し処理
のフローチャート、第１９図は文字列候補抽出処理のフ
ローチャート、第２０図（ａ）、　　（ｂ）はともに文
字列候補抽出処理の説明図、第２１図は文字列抽出処理
の説明図、第２２図は文字切り出し処理のフローチャー
ト、第２３図（ａ）。（ｂ）、（ｃ）は高さ方向分離文字統合処理の説明図、
第２４図は高さ方向分離文字統合処理のフローチャート
、第２５図は高さ方向統合処理後の文字列データの説明
図、第２６図は認識結果データテーブルを示す説明図、
第２７図はしきい値テーブルを示す説明図、第２８図は
文字列種類判定処理のフローチャート、第２９図は幅方
向分離文字統合処理のフローチャート、第３０図（ａ）
。（ｂ）は幅方向分離文字統合処理の説明図、第３１図（
ａ）、　（ｂ）、　（Ｃ）、　（ｄ）、　（ｅ）は各ケ
ース毎の幅方向分離文字統合の様子を示す説明図、第３
２図（ａ）は文字切り出しの誤りの説明図、第３２図（
ｂ）は文字認識部の誤り説明図である。１・・・輪郭ベクトル化処理部、２・・・登録部、３・
・・文字列候補抽出部、４・・・文字列抽出部、５・・
・文字切り出し部、６・・・文字認識部、１１・・・輪
郭抽出部、１２・・・輪郭解析部、１３・・・テーブル
格納部、３１・・・巨視的処理部、３２・・・微視的処理部、３３・・・輪郭ベクトル系列テーブル、３４・・・ショートペクトル除去部。第３図輪郭べ外／ｌ／Ｉヒ迅瑠Ｍ（剪処理）のフローチャート
（Ｅ（第５図ラスタスキャンの説明図輪郭要素テーブルの説明図第９図輪郭ベクトル系列テーブルｌ素データと輪郭平素との１８Ｉ僅図（イ）（ロ）第７図輪郭管理テーブルの説明図第８図輪郭接続テーブル輪郭ベクトル化処理の説明図第１４図シッートベクトル除去手段のフローチャート第１７図文字切り出し処理のフローチャート第１５図第２１図文字列抽出処理の説明図第２２図文字切出し処理のフローチャート（ｂ）第２３図（ａ）（ｃ）第２４図高さ方向分離文字統合処理のフローチャート第２７図しきい値テーブルＡ〜Ｚ、０〜９．記号第２８図文字列種属判定処理のフローチャート第２９図幅方向分離文字統合処理のフローチャート第３１図幅方向分離文字統合の説明図第３０図幅方向分離文字統合処理の説明図（λ）第３２図（ａ）文字切出しの誤りの説明図文字認識部の誤りの説明図

Claims

【特許請求の範囲】

（１）文字、線分、シンボルが混在する被写体をラスタ
スキャンして得られた黒白に対応する２値化画素データ
から文字データを抽出し、該抽出された文字データと文
字辞書を参照、比較して文字を認識する図面読取装置に
おいて、前記被写体をラスタスキャンして得られた黒白に対応す
る２値化画素データに基づいて、互いに隣接した２個の
黒画素を結ぶベクトルを結合して成る輪郭ベクトルのデ
ータを求めるとともに、該輪郭ベクトルに外接する外接
四角形データを文字候補として求める輪郭ベクトル化処
理部と、前記輪郭ベクトル化処理部で求められた文字候
補の外接四角形データをツリー構造で登録する登録部と
、所定の大きさに設定した文字列候補の核から検索範囲を
決定し、前記登録部に登録された文字候補のうち中心座
標が前記検索範囲内に存在する文字列を文字列候補とし
て抽出する文字列候補抽出部と、前記文字列候補抽出部で抽出されたデータの中から、文
字列候補核の高さｈ＿ｃと文字列候補内の互いに隣接す
る文字候補間の距離ｄがｄ＜ｈ＿ｃ×ｋ（ｋは定数）な
る関係にあるデータを文字列として抽出する文字列抽出
部と、前記文字列抽出部で抽出された文字列内の近接する複数
の文字候補の幅が重なっているときに、それら複数の文
字候補を統合する高さ方向統合機能と、該機能により統
合された各文字候補と、英数文字および記号の辞書とを
比較して文字認識を行い、該複数の認識結果に対応して
、前記文字候補と辞書の文字との近似度合を表す評価値
を各々求める英数文字認識機能と、前記英数文字および
記号の辞書の文字、記号に各々対応して、同一文字、記
号についての複数のサンプルと辞書の文字、記号との近
似度合を表す評価値列のうち最大値をしきい値として設
定し、該設定されたしきい値と前記英数文字認識機能で
求められた評価値とを比較して、文字列が英数文字列で
あるか否かを判定する文字列種類判定機能と、該判定機
能が英数文字列ではないと判定した文字列の文字候補の
幅と、前記ｈ＿ｃ×ｋの大きさに等しい幅の仮定文字幅
との第１偏差が、前記文字候補およびその近傍の文字候
補を包含する幅と前記仮定文字幅との第２偏差よりも大
きく、且つ前記第２偏差が所定のしきい値よりも小さい
ときに前記文字候補とその近傍の文字候補を統合する幅
方向統合機能を有し、文字列から文字を切り出す文字切
り出し部とを備え、前記文字切り出し部で切り出された
文字データに基づいて文字認識を行うことを特徴とする
図面読取装置。