JPH0434652A - 図面入力装置 - Google Patents

図面入力装置

Info

Publication number
JPH0434652A
JPH0434652A JP2140041A JP14004190A JPH0434652A JP H0434652 A JPH0434652 A JP H0434652A JP 2140041 A JP2140041 A JP 2140041A JP 14004190 A JP14004190 A JP 14004190A JP H0434652 A JPH0434652 A JP H0434652A
Authority
JP
Japan
Prior art keywords
pattern
character
line segment
knowledge
input device
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2140041A
Other languages
English (en)
Inventor
Kaoru Suzuki
薫 鈴木
Hideo Horiuchi
秀雄 堀内
Hiroyuki Mizutani
博之 水谷
Nariyoshi Shimotsuji
下辻 成佳
Osamu Hori
修 堀
Shunji Ariyoshi
俊二 有吉
Mieko Asano
三恵子 浅野
Shuichi Tsujimoto
辻本 修一
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2140041A priority Critical patent/JPH0434652A/ja
Publication of JPH0434652A publication Critical patent/JPH0434652A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Image Analysis (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 [発明の目的] (産業上の利用分野) 本発明は画像として入力される図面中に記載された文字
や図形等のパターンを検出し、検出したパターンを認識
処理して得られるコード化情報を入力する為の図面入力
装置に関する。
(従来の技術) 近時、地図や図面等に記載された文字や図形等のパター
ンを認識処理して情報入力する為の図面入力装置が種々
開発されている。この種の図面入力装置を用いることで
、例えば手書き図面の清書化や、その図面情報の電子フ
ァイル化等が実現され、また地図上に記載された設備図
情報等の入力処理が行われる。
ところが図面上には種々のパターンが混在して、しかも
様々な形式で記載されることが多い。そこで従来−船釣
な図面入力装置にあっては、専らその認識処理を簡略化
するべく、例えば認識対象とする文字の向きを予め規定
する等して図面中の文字パターンを認識処理するように
している。この為、図面上で種々の向きに記載された文
字をそれぞれ認識するには、その都度、認識対象とする
文字の向きを規定する情報を変更しながらその認識処理
を繰り返し実行する必要があり、非常に多くの手間が掛
かった。
しかも認識対象とする文字パターンが、図面上の各種の
線分と接触しているような場合、文字パターンだけを独
立に切り出すことが困難であることから、その文字を認
識することができないと云うような不具合が生じ易かっ
た。仮にその文字についての認識結果が得られた場合で
あっても、文字パターンに接触した線分の影響により異
なった文字として認識されることが多いと云う問題があ
った。
(発明が解決しようとする課題) このように従来の図面入力装置にあっては、図面上に記
載された文字や図形等のパターンがどのような向きであ
るかを特定することができない為、これらのパターンに
対する認識手順が複雑化すると云う問題があった。しか
も図面中の各種の線分と文字や図形等のパターンが接触
しているような場合、それらのパターンに対する認識率
が大幅に低下すると云う問題があった。
本発明はこのような事情を考慮してなされたもので、そ
の目的とするところは、画像として入力された図面中の
文字や図形等のパターンを精度良く認識することのでき
る実用性の高い図面入力装置を提供することにある。
[発明の構成コ (課題を解決するための手段) 本発明は、画像として入力された図面中の所定の意味を
持つパターンを認識する図面入力装置に係り、 前記図面から線分を抽出された線分の方向に基づき、例
えば検出された線分の周囲に存在する可能性のあるパタ
ーンに対して、そのパターンの向きを限定して、前記図
面から所定の意味を持つパターンを抽出するようにした
ことを特徴とするものである。
また前記図面から線分に接触するパターンが見出された
とき、そのパターンから該線分を除去して切り出し、こ
れを上記線分除去による欠損を想定した標準パターンと
照合してパターン認識を行うようにしたり、或いはその
パターンを線分と共に切り出し、これを線分のパターン
を含む標準パターンと照合してパターン認識するように
したことを特徴とするものである。
更には図面中からパターンを切り出すに際して、予め知
識部に格納された前記所定の意味を持つパターンに関す
る知識に基づき、例えば知識に基づいて予測される位置
から、上記知識により指定されるパターン検出の手法を
用いてパターンを切り出すようにし、このパターンを前
記知識を参照してパターン認識するようにしたことを特
徴とするものである。そして前記図面から知識として記
述されてないパターンが検出されたとき、この未登録パ
ターンを新たな知識として前記知識部に加えていくよう
にしたことを特徴とするものである。
(作 用) このように構成された本発明の図面入力装置によれば、
図面から検出される線分の方向に基づいて、その線分近
傍に記載されている文字や図形の向きを特定(規定)し
ながらそのパターンに対する認識処理を進めることがで
きるので、線分の方向性を効果的に利用した精度の高い
認識処理を行うことが可能となる。つまり線分に関連し
て記載されているパターンを簡易に、且つ高性能に認識
することが可能となる。
また文字や図形のパターンが線分に接触しているような
場合には、その線分を除去してパターンの切り出しを行
い、線分除去によるパターン欠損を想定してそのパター
ンに対する認識処理が行われ、或いは線分を含んだ状態
でのパターン変形を想定してパターン認識が行われるの
で、線分に接触したパターンであっても、これを精度良
く認識することが可能となる。
また認識対象とするパターンに関する知識に基づいて、
図面中からのパターンの切り出しと、その認識処理を行
うことで、簡易にしてその認識率を効果的に高めること
が可能となる。
(実施例) 以下、図面を参照して本発明の一実施例に係る図面入力
装置ついて説明する。
第1図は実施例装置の概略的な構成を示す図であり、l
は本装置の運用に関する指示情報の入力に用いられるキ
ーボードやマウス等からなる操作部、2は本装置から種
々の情報をオペレータに提示する為のCRTデイスプレ
ィ等からなる表示部である。また3は文字や図形等のパ
ターンが記載された地図や図面等の原稿を、例えば光学
的にスキャンし、画像情報として入力する為の画像入力
部である。本装置による図面入力処理は、上記画像入力
部3から画像情報として入力された図面に対して前記操
作部1の操作と、前記表示部2による情報提示により対
話的に進められる。
しかして前記画像入力部3から入力された図面(入力画
像)は2値化処理されて線分抽出部4に与えられ、この
線分抽出部4にて上記画像中の明らかに直線であると看
做し得る強い線分と、直線と看做すには曖昧性の残る弱
い線分、および破線とがそれぞれ分離抽出される。方向
画像生成部5は上述した如く抽出された強い線分と破線
について、その周囲一定距離を該線分の方向を示すコー
ドで埋めた方向画像を生成するものであり、また領域抽
出部6は前記2値化画像から上述した強い線分と破線の
各要素を除いた画像を生成し、その画像中の近接した黒
画素を統合処理して、黒画素の連結領域からなるブロッ
クを抽出する。これらの線分抽田部4.方向画像生成部
5.領域抽8部6により、入力画像中の文字・記号等の
パターンや各種の線分を認識処理する為の必要な前処理
が実行される。
さて図形候補抽出部7は知識ベース8に格納されている
個々の図形に関する知識に基づいて、前記入力画像から
円、楕円、多角形、矢印、引出し線等の図面中に現れる
図形成分の候補を抽出するものである。また文字候補抽
出部9は、前記入力画像から文字としての可能性の高い
画像成分を文字パターン候補として抽出するものである
。この文字候補抽出部9で抽出された文字パターン候補
について、文字認識部lOは辞書部11に予め格納され
ている認識対象カテゴリの標準パターンとそれぞれ照合
し、上記文字パターン候補を認識する。
この際、文字認識部lOは文脈辞書12に格納されてい
る文脈知識に基づき、文字パターン候補の並びについて
それぞれ求められる文字コード(認識結果)の列の文字
列としての妥当性を評価し、その文字認識結果を確定す
る。
一方、推論処理部13は前記図形候補抽出部7と文字候
補抽出部9とを適宜起動して前記入力画像中の各要素の
認識結果を得る。そして推論処理部13は前記線分抽出
部4により検出された線分情報、および原稿知識ベース
14に予め格納されている認識対象とする図形や文字の
相互間の関係に関する知識に基づいて、前述した各認識
結果を総合的に評価し、これによって前記入力画像(図
面原稿)上の各要素の解釈をそれぞれ確定する。このよ
うな推論処理部13による処理により、前記図面原稿上
に存在する各文字・図形成分の最も妥当とされる解釈が
決定される。
尚、I5は前記入力画像と前記各処理における途中結果
、および最終結果や、装置の状態に関する情報等を格納
する記憶部であり、16は前記推論処理部13による解
釈結果を出力する出力部、そして17は本装置全体の動
作を制御する制御部である。
次に上述した如く構成される実施例装置の処理動作につ
いて説明する。
本装置における図面入力処理は、画像データとして入力
された図面から文字・記号や線分等の特徴を抽出するボ
トムアップ処理と、抽出された特徴を知識に基づいて解
釈するトップダウン処理とからなり、概略的には第2図
に示すような処理手続きに従って進められる。
入力画像中の文字・記号や線分等の特徴を抽出するボト
ムアップ処理について説明すると、この処理は前記画像
入力部3から、例えば光学スキャナのような画像入力手
段を用いて図面原稿を画像情報として取り込み(ステッ
プa)、その入力画像データを2値化した後(ステップ
b)、その2値化画像中の微小な孤立点をノイズとして
除去した2値画像l、を生成し、これを記憶部15に格
納することから開始される(ステップC)。
しかる後、線分抽出部4にて前記記憶部15に格納され
た2tM画像!、中の黒画素成分の輪郭を抽出して輪郭
画像1.を生成しくステップd)、例えば2分割法によ
り連続する輪郭点列を分割した部分点列を構成する各点
毎に1つのセグメントのラベル番号を与えてセグメント
画像!、を生成する(ステップe)。同時にこの線分抽
出部4にて上記各セグメントを、そのセグメントを構成
する部分輪郭点列の両端点を結ぶ線分として捕らえ、こ
れらの各線分の方向を、例えば180度をN等分して量
子化された方向コードに対応付ける。
このようにしてセグメントを代表する線分とその方向コ
ードが求められたとき、該線分の両端座標会長さ・方向
コードを、そのセグメントのラベル番号に対応付けて格
納してセグメントテーブルT、を生成する。尚、各セグ
メントの端点は、その一方の側が白画素であり、他方の
側が黒画素であることから、ここでは白画素の存在する
側を該セグメントの外側、黒画素の存在する側を該セグ
メントの内側と各々呼ぶことにする。
しかる後、前述したセグメントテーブルT、から長さL
 +b1以上のセグメントを線分輪郭候補として抽出す
る。そしてこの線分輪郭候補S。の近傍距離L1□以内
に存在する他のセグメントのうち、その方向コードが上
記線分輪郭候補S。と−致し、且つ線分輪郭候補S。と
内側を向かい合わせて存在する他の線分輪郭候補(長さ
し1,1以上のセグメント)と、方向コードに関係なく
、前記近傍距離り11.により設定された線分輪郭候補
S00近傍を出ない非線分輪郭候補(長さL +h1未
満のセグメント)とを、前記線分輪郭候補S。
が帰属すると予想される線分の輪郭の一部と看做してそ
れぞれ抽出する。そして輪郭の一部を構成する上記線分
輪郭候補S。以外の、全ての線分輪郭候補についても同
様にして上述した処理を繰り返し、これによって前記線
分の輪郭を成長させて最終的な線分の輪郭を得る。そし
てこの最終的な線分の輪郭の中心線を線分として抽出し
、該線分の両端点から前述したセグメントの方向を決定
する場合と同様にして該線分の方向コードを求める。
尚、上記近傍距離L I k□は、例えば入力図面中に
存在する線分の線幅で規定される長さの閾値として設定
される。
上述した処理によって、例えば第3図(a)に示すよう
に入力画像から線分の輪郭が抽出される。
この第3図(a)に示す線分の輪郭は、[ABC]なる
文字列とアンダーラインとが接触した状態で抽出された
例を示している。そして上記アンダーラインに帰属する
として抽出されたセグメントを、ここでは太線glで示
している。
次に上述した如く抽出された線分の輪郭追跡が行われる
。この輪郭追跡により、セグメントが連続しない箇所が
検出された場合には、その不連続な部分を補う仮想的な
セグメントの生成が行われる。この仮想的セグメントは
、新たに付されるラベル番号と共に前記セグメントテー
ブルT、に付は加えられる。この結果、前述した線分は
、セグメントと上記仮想的セグメントにより完全に囲ま
れた閉領域として求められる。そしてその線分を囲むセ
グメント(仮想的セグメントを含む)のリストが該線分
の両端位置等と共に当該線分のラベル番号に対応付けら
れて線分テーブルT1に格納される。
この際、上記仮想的セグメントを構成する点列が生成さ
れ、これらの点列に対応したセグメント画像1.上の点
に上記仮想的セグメントのラベル番号が与えられる。こ
の結果、第3図(b)に示すように接触によって欠損し
たパターン成分を補った線分の輪郭が太線32に示すよ
うに求められることになる。
また前述した如くして抽出された線分を長さり、、2以
上の強い線分と、長さLl、2未満の弱い線分とに分類
する。この長さL 1.2は、入力画像中に存在する明
らかに直線と見なされるべき線分の長さで規定される予
め定められた長さの閾値である。
ところで図面中には、破線によって示される線分も存在
する。このような破線を抽出する場合には、例えば長さ
の短い成る弱い線分lの方向に仮想的な直線りを想定し
、この直線りの両側にそれぞれ幅D lb、なる帯領域
を想定する。そしてこの帯領域中に両端点を持ち、且つ
上記直線りと方向の一致する弱い線分を前記線分pに近
いものから順次検出し、これらの検出された弱い線分の
集合を破線と看做したときの当該破線の長さが前記し1
m2以上となるものを破線で表された線分として抽出す
るようにすれば良い。但し、上述した如く検出される弱
い線分との間隔が、破線として許される間隔に基づいて
規定される閾値L+hsより広くなる場合には、その位
置にて破線の検出処理を終了させ、破線の端部とする。
以上の処理により入力画像中の実線で示される線分が、
その長さを基準として上述した強い線分と弱い線分とに
分類され、例えば引き出し線等を構成する長い線分(破
線を含む)と文字・小型図形などを構成する短い線分と
がそれぞれ分離抽出される(ステップf)。
一方、前記方向画像生成部5は前記強い線分および破線
(長い線分)の周囲の、その線分から距離D1.2の範
囲を、当該線分の方向コードで埋め、それ以外の部分を
方向性無しを示す特別なコードで埋めて方向画像I0を
生成し、この方向画像I0を前記記憶部15に格納する
(ステップg)。
この際、方向の異なる強い線分が近接して存在し、これ
に起因して複数の異なる方向コードが重複して設定され
るような画像部分が生じた場合には、これらの複数の方
向コードの和をその画像部分の値として与える。尚、前
記方向コードは1次独立な体系に設定されるので、その
和をとっても各方向を示す情報が失われることがないこ
とは云うまでもない。この実施例では、例えば180度
をN等分して量子化される方向コードの、n番目の方向
を示すコードを[2″−1]、方向性無しを示すコード
を[0]としてそのコード体系が実現される。
ところでこのような方向画像の生成は、次のような意味
を持つ。
例えば第4図(a)に示すような図面が入力された場合
、この入力画像からは例えば引き出し線を構成する線分
41や寸法線を構成する線分42が第4図(b)に示す
ように抽出され、これらの各線分41゜42の周囲領域
43.44の内部に上記各線分41.42の方向コード
がそれぞれ付与された方向画像が生成される。上記各領
域43.44の内部には文字列45゜46.47がそれ
ぞれ包含される。これらの各文字列の向きは前記方向画
像中の対応する領域43.44の方向コードをそれぞれ
調べることによって容易に知ることができる。この結果
、図面中において様々な方向に記述される引出し線や寸
法線等に付随して記述される文字列や、補助的な図形の
向きを高々1乃至致方向に限定することが可能になり、
その文字列や図形を認識するに際して著しい効果が発揮
される。
一方、前記領域抽出部8は、前記記憶部15に格納され
た2値画像1bから前述した強い線分と破線とを構成す
る画素を除去した画像1.を生成する。そしてこの画像
I bb中の黒画素について、前述した距離D r b
 i以内に近接する黒画素を統合し、これに1つのラベ
ルを与えて連結黒画素領域を示すブロックとして抽出す
る。その上で領域抽出部6は、上記ブロック間の包含関
係を評価し、包含関係にあるブロックを統合して新しい
ブロックとする。このようにして抽出されるブロックは
、前述した長さの短い弱い線分と非線分領域のみにより
構成される領域であり、1つのブロックは文字(または
文字の一部、若しくは文字列)と小型図形(円、楕円、
多角形等とその内部の記号など)、および大型図形の一
部(矢印の頭等)に対応したものとなる(ステップh)
尚、上記画像1bbを生成するに際しては、例えば前記
テーブルT、、T、や、前記セグメント画像!、を参照
して、その線分(または破線)が形成する輪郭閉領域の
内部の全てを黒画素で埋めたマスクパターンを生成する
。そして前記2値画像I、中の黒画素のうち前記マスク
パターンに重なる画素を白画素に置き換えることによっ
て強い線分と破線とを構成する画素を除去した画像11
.を容易に求めることが可能となる。このような処理を
実行することにより、前記第4図(a)に示した入力画
像に対応する処理画像1 bbが同図(C)に示すよう
に求められる。
以上のようなボトムアップ的な処理手続きにより、入力
画像中から引出し線等を示す線分と、文字・記号等を示
すブロックとがそれぞれ抽出される。
尚、上述した各処理を実行するに際しては、従来より種
々提唱されている処理方式を適宜採用することができる
。例えば線分抽出処理については、輪郭抽出やセグメン
ト化の手法を用いずとも、前述した強い線分と破線とを
それぞれ抽出可能であれば別の手法を用いることが可能
である。また前述した方向画像を生成することに代えて
、線分の周囲に設定される領域と、その線分の方向コー
ドとを対応付けて格納するテーブルを用いるようにして
も良い。更には距離D1,2までの範囲を一定のコード
で埋めることに代えて、方向毎に設定されるN枚のポテ
ンシャル画面を設定するようにしても良い。この場合、
各ポテンシャル画面は、線分からの距離に応じて定義さ
れる成る関数の値を、対応する方向コードを持つ全ての
線分について足し合わせたものとして与えられる。
つまり上述した処理は、線分の周囲に存在するパターン
に対して、その線分の方向により発生する向きに関する
拘束を上記該パターンに働かせることを意味し、その実
現手法は特に限定されない。
さて上述した認識処理が行われると、次に前記推論処理
部13により前記線分とブロックについての解釈処理が
所定の知識に基づいてトップダウン的に行われる。
このトップダウン的な線分とブロックについての解釈処
理は、基本的には前記知識に記述されるパターンの位置
の予測、即ち、仮説の生成(ステップl)、予測された
位置に予測されたパターンのあることを確認する仮説の
検証(ステップj)、検証結果に基づく上記パターン認
識結果に対する得点付け(ステップk)、と云う処理手
続きにょり実現される。
さて図面中に記載される各種のパターンに着目すると、
これらのパターンは、円、楕円、多角形。
矢印、折れ線等の基本図形パターンと、アルファベット
・数字・仮名・漢字等の文字パターンとに大きく分類で
きる。また上記基本図形パターンは、例えば大きさと形
状的特徴が一定である固定パターン、形状的特徴は一定
であるが大きさは様々である定型パターン、大きさと形
状的特徴がある幅をもって変化する可変パターンとに分
類することができる。尚、これらの各パターンが種々に
組み合わさった複合パターンも存在する。
このようなパターンの分類体系は、図面に現れる画像的
特徴に基づいてパターンを分類したものである。しかし
実際に図面を認識処理する場合には、画像的特徴として
検出される基本図形や文字列、或いは複合図形を、単独
で成る意味を持った図面の要素をなしている単位として
検出することが必要である。例えば電気図面におけるル
ープ回路や素子の記号や集積回路等、また地図における
地名や建物を表す多角形や道路等、更には機械図面にお
ける引出し線や寸法線等のように成る意味を持つ図面要
素の単位としてパターン検出を行う必要がある。
これらの所定の意味を持つ図面要素に関する知識は、例
えば図面要素モデルとして予め原稿知識ベース14に格
納されており、入力画像中の図面要素は上記図面要素モ
デルに従う前述したトップダウン的な検証処理により検
出することができる。
このトップダウン的な処理手続きを、図面中から求めら
れる引出し線を解釈する場合を例に説明する。第5図(
a)〜(e)は引出し線の代表的な例をそれぞれ示して
いる。
尚、これらの引出し線パターンは前述した複合図形とし
て定義されるものである。しがしてこれらの各引出し線
パターンには微妙な差異があるものの、2本の強い線分
が成る角度をなして連続し、一方の線分の先には成るパ
ターンをなすブロックが存在し、そのブロックは矢印の
頭を構成していると云う共通の特徴を有している。また
他方の線分の近傍には、その線分に平行にブロックが存
在し、そのブロックは一般的には文字列をなすと云う共
通の特徴を存している。
そこでこれらの引出し線パターンに共通する特徴に前述
した微妙な差異を加えて各引出し線を本構造で表現する
と、例えば第6図に示すように表現できる。第6図にお
いて51.52〜63はそれぞれノードを示しており、
これらのノード51.52〜B3はリンクにより順に、
或いは並列的に接続される。
また上記ノード51.52〜63の内、特にノード59
゜60〜63はゴールノードと称される。尚、第6図に
示す各ノード内の太線で示した線分と、網掛は表示した
文字部分は、そのノードにおいて検出されるべき特徴を
示している。
このようにして表現される木構造は、引出し線を記述し
た図面要素モデルであり、引出し線を構成する構成要素
(基本図形と文字列領域)のリスト、および構成要素間
の位置関係と方向関係の情報とを含んでいる。更にこの
図面要素モデルにおいては、引出し線を構成する構成要
素のそれぞれについて予めその構成要素に応じた得点が
設定されている。そして成る構成要素が検出された場合
には、引出し線の可能性を評任する為の評価値として、
当該構成要素の上記得点が累積的に加算されるようにな
っている。
上記各構成要素に付与される得点は、第6図に示すよう
に表現される本構造において、上側(上位)に位置する
もの程高くなるように、つまり構成要素の特徴の必要不
可欠性や、検出され易さに応じて設定されている。この
結果、あまり重要でない特徴の得点寄与度が小さく設定
され、また良く検出される重要な特徴の得点寄与度が大
きく設定されてノイズに強い検出機構が実現されるよう
になっている。
尚、このような引出し線に限らず、図面要素を検出する
為のプロセスは、上述した如く図面要素モデルとして与
えられる木構造を上から順に辿り、予測される位置に予
測される特徴(構成要素)が検出されるか否かを検証し
ながら進むと云う、所謂本探索により実現される。
ここで上記図面要素モデルの表す図面要素全体をグルー
プとして、例えば「引出し線」と云うグループとして定
義し、上記図面要素モデルの各ゴールノードまでの経路
が表す実例をタイプ、例えば第5図(a)に示す引出し
線のタイプと定義すると、グループに対する本探索によ
る図面要素を検出する為のプロセスは次のように実現さ
れる。即ち、木探索処理の途中で、その探索が続行不可
能となったとき、つまり木探索が当該モデルの途中に予
め設定されるリジェクトノード(例えば第6図に示すノ
ード54)に達しなかった場合には、当該グループが検
出されなかったと判定される。また探索が上記リジェク
トノードに達した場合には、当該探索経路が表すタイプ
が検出されたと判定し、そのタイプとそれに関与した画
像的特徴、およびその構成要素に付された得点とを対応
付けて保存する。
尚、前記リジェクトノードは、そこまでに検出された構
成要素によって当該図面要素の存在が十分立証されるノ
ードであり、例えばその時点て当該図面要素の必要不可
欠な構成要素が全て検出されているノード等として定義
される。勿論、前述したゴールノードをリジェクトノー
ドとすることも可能であることは云うまでもない。但し
、この場合には、全ての構成要素が抽出されなければ当
該図面要素が抽出されないので、前記図面要素や構成要
素に付与される得点を格別に設ける必要はない。
また第6図に示すノード57では、この例では引出し線
を構成する残る2本の線分と2つの文字列を検出するこ
とになる。しかしこのノード57にて実際に検出される
べき線分や文字列の数については、特に限定されないよ
うにし、線分や文字列が3つであっても、更には4つで
あっても検出可能にしておくことが望ましい。即ち、前
記ノード57では数の限定されない同一の特徴の検出処
理を、その特徴が検出されなくなるまで繰返すような特
別なノード、つまり冗長ノードとして定義しておく。こ
のような冗長ノードを設定可能にすることで、特徴検出
の数に限定されない様々なバリエーションを1つのノー
ドで表現することができ、図面要素モデルをコンパクト
に記述することが可能になる。
次に上述した各構成要素の検出処理について、具体的に
説明する。
基本図形パターン(固定パターン・定型パターン・可変
パターン)に関する大きさと形状的特徴の情報は前記知
識ベース8に予め格納されている。
図形候補抽出部7はこのような固定パターンと定型パタ
ーンとを前記知識ベース8に登録されている図形のテン
プレートとの重ね合わせにより抽出する。また前記可変
パターンについては、前記知識ベース8に登録されてい
る図形の構造モデルに基づいて、線分レベルでの構造解
析的な手法を導入することにより抽出する。
例えば第7図に示すような図面中から引出し線を抽出す
る場合には、先ず前述した第6図に示すような探索木に
従って、先ず1つの強い線分81を選択すると、この線
分81に成る角度をなして接続する別の強い線分82が
探索される。この2本の線分81.82により構成され
る折れ線は前述した可変パターンに属する。
しかして可変パターンの抽出は、そのパターンを構成す
る線分の集合を、線分間の連続性や位置関係、角度や長
さ等の拘束条件を手掛かりとすることにより検出される
。上記拘束条件にはそれぞれ拘束の強さを得点付けする
為の評価関数が定義されている。しかしてパターンの抽
出に際しては、評価されるべき上記拘束条件の得点を加
算し、これを正規化したものを当該パターンの一致度と
して得ることが可能となっている。この得点は、例えば
連続性に関しては近接する2線分の端点間の距離の逆数
、また位置関係については予測される位置からの偏差の
絶対値の逆数等として定義される。
次に上述した如く抽出された線分に基づいて、その周囲
に展開している他の構成要素を抽出する。
この処理は、抽出された折れ線の両端付近に存在するブ
ロックを検出し、検出されたブロックが弱い線分で構成
されているか否かを判定する。そして弱い線分で構成さ
れているブロックを選択し、前記可変パターン抽出の手
法により、矢印の頭にあたるパターン83を抽出する。
この処理は、前述した第6図におけるノード53に至る
までの探索に相当する。しかる後、線分81に隣接して
存在するブロックから文字列84が検出されてゴールノ
ード59に到達した場合、その探索結果として構成要素
81.82.83.84からなる引出し線が抽出される
ことになる。
尚、実際の図面を処理する場合には、例えば第8図に示
すようにパターンの入り組みが存在することもある。こ
のようなパターンの入り組みに対処する為には、例えば
次のようにする。
即ち、第8図において、矢印の頭91を検出するべく、
線分92の端点付近に存在するブロックを評価したとす
る。ところがそのブロックは文字列93であるから、当
然のことながらそのブロックが[矢印の頭コであると云
う認識結果は得られない。
通常ならばこの時点で探索に失敗したと看做し、他の可
能性について検証するところであるが、この線分(引出
し線)に関連した探索においては、その線分に切れが存
在する可能性を考慮して探索処理を継続する。具体的に
は線分92の延長線上で、且つ一定距離以内に存在する
線分94を検出し、この線分94の先において矢印の頭
91の検出を行うようにする。このような線分の文字等
の存在に起因する途切れを補うようにすることで、線分
の途切れや入り組みの存在に関わらず、安定した構成要
素抽出を行うことが可能になる。
ところで前記第7図に示されるパターン85は、前述し
た如く分類される固定パターンである。この固定パター
ンの抽出は、例えば前記領域抽出部6により抽出された
ブロックのうち、知識ベース8に予め登録されている固
定パターンと同程度の大きさのものを選択する。そして
そのブロック中の黒画素パターンと前述したテンプレー
トとを照合し、一致したテンプレートに、そのブロック
との間での一致度を付して出力することにより達成され
る。しかしてこの処理において、成る閾値以上の一致度
を獲得した図形が発見された場合には、そのブロックを
固定パターンであると確定すると同時に、前記閾値以上
の一致度を獲得した図形の全てを、そのブロックに対応
付けられた候補図形リストにそれぞれ登録する。
具体的には、第9図(a)に示すような前記パターン8
5についてのテンプレートを用い、その内部に文字列8
6を含むパターン85を検出する。このような文字列8
Bを含むパターン85を検出するべく、前記テンプレー
トとしては上記文字列パターンの変化に影響されること
なく、その円周パターンだけを評価することを可能とす
る為に、円周内部に不感領域(斜線部)を持つテンプレ
ートとなっている。この不感領域は円内の文字列の存在
範囲に設定され、この領域内部の画素は前述した重ね合
わせによる一致度の算出には関与しないものとなってい
る。尚、このテンプレートとしては、例えば前記文字列
パターン86のバリエーションが有限既知であるような
場合には、前記パターン85と文字列パターン8Bとを
合わせたパターンについて、複合類似度法等のような統
計的なテンプレートとすることも可能である。
一方、第7図に示すパターン87は、前述した如く分類
されるパターンの中の定型パターンである。
この定型パターンの抽出は、例えば前記領域抽出部6に
て抽出されるブロックのうち、知識ベース8に予め登録
されている定型パターンと同程度の縦横比のものを選択
する。そしてそのブロック中の黒画素パターンの大きさ
を正規化した後、正規化されたパターンと前記テンプレ
ートとを照合し、一致したテンプレートにそのブロック
との間での一致度を付けて出力することで達成される。
しかしてこの処理において、成る閾値以上の一致度を獲
得した図形が発見された場合には、そのブロックを定型
パターンであると確定する。同時に前記閾値以上の一致
度を獲得した図形の全てを、そのブロックに対応付けら
れた候補図形リストにそれぞれ登録する。
この結果、上述した如く確定されたブロックは認識確定
パターンとして登録され、孤立した円。
楕円、多角形等を含む候補図形リストと共に図形として
抽出される。また確定しなかったブロックについては、
認識不確定パターンとして登録されると同時に、前記図
形の候補とその一致度とが付与されて、必要ならば他の
可能性についての検証がなされる。尚、上述した判定に
用いられる閾値は、図形毎に予め設定されるもので、ブ
ロックがその図形であることが確実である場合の一致度
を規定する値である。また前記ブロックの大きさ、およ
びその縦横比は、例えば画像の縦横方向を辺としたとき
の、当該ブロックの外接長方形の大きさ、およびその縦
横比としてそれぞれ定義される。
尚、同一の形状を持つパターンを前述した固定パターン
と定型パターンの両方に登録しておくことも可能である
。このような場合には、図面中に様々な大きさの円が存
在するならば前記パターン85を定型パターンに、また
図面中に大きさが一定である楕円しか存在しない場合に
は前記パターン87を固定パターンとしてそれぞれ登録
するようにすれば良い。またこのような条件に関係なく
、パターンを両方に登録しておくことも可能である。
要するに、どのパターン(構成要素)をどのような手法
で抽出するかについては、例えば前記図面要素モデルに
記述しておき、そのモデルの内容によってパターンの抽
出方式を様々に選択制御するようにすれば良い。またパ
ターンの抽出方式としても、上述した3つの方式に限定
されないことは云うまでもない。
ところで一般に図面中の図形などは一定の向きに記述さ
れているとは限らず、様々な向きに記述されている。従
ってテンプレートに方向性が無い場合には、パターンの
向きに関係なく図形を抽出することが可能であるが、仮
にテンプレートに方向性がある場合には、図形パターン
とその方向が異なるテンプレートを重ね合わせても良い
一致度は得られない。その上、偽照合がなされる原因と
もなる。
そこで−船釣に、引出し線や寸法線等の強い線分の近傍
では、図形(および文字)はその線分の向きに沿って記
述されることが多いという効験に基づいて、前述したブ
ロックとテンプレートとの照合処理を行う。具体的には
ブロックが前記方向画像!。上に占める領域に現れる方
向コードの全てを求め、これらをその図形の方向候補と
する。
そして得られた各方向候補(および180度反転した方
向)に対応する回転処理を施したテンプレートとの一致
度を求めるようにする。
また当該ブロックが方向性無しの領域に存在するような
場合には、全方向(2N通りの方向)について前述した
回転処理を施したテンプレートとの一致度をそれぞれ求
めるようにする。そして最も高い一致度を得る方向を求
めて、そのときの−致度を該図形に対する一致度とする
。このような処理を実現する為には前記知識ベース8に
は、1つの図形に対して各方向コードに対応した2N個
のテンプレートが予め用意される。
尚、方向候補を評価する場合、テンプレートに対する一
致度の中で、成る閾値を越えるものが1つも発見されな
いことがある。このような場合には前述した方向候補は
全て誤りであったと解釈し、残る全ての方向についての
評価も行って最も高い一致度を得る方向を求める。そし
て最後に前記図面要素モデルに記述される構成要素が、
予測される位置に予測される方向で存在したか否かを判
定し、当該構成要素が検出されたか否かを判定するよう
にする。
この際、方向別の各図形の大きさや縦横比を評価し、当
該ブロックに大きさや縦横比が合致しない方向のテンプ
レートとの照合を行わないようにすれば、その照合時間
の短縮と偽照合の減少が図れる。また照合方向に予め優
先順位を付けておき、その優先順位の順番に従って照合
処理を進めるようにする。そして成る閾値を越える一致
度を獲得するテンプレートが発見された時点でその照合
処理を中断し、その照合結果を出力するようにすれば、
より一層の処理時間の短縮化を図ることが可能となる。
この場合、方向性のある領域における優先順位としては
、ブロックが占める方向画像中の領域における各方向コ
ードを与えられる点の数をそれぞれ計数し、計数結果の
多い方向はどその優先順位を高くするようにしておけば
良い。
尚、前述したように2N個のテンプレートを用意するこ
とに代えて、固定方向の唯一つのテンプレートを用意し
ておき、ブロック中のパターンヲ当該方向へ回転させた
パターンを算出した後、この回転処理されたパターンと
前記テンプレートとを照合するようにしても良い。この
ようにすればテンプレートを数多く用意する必要がなく
なるので、知識ベース8の必要記憶容量を削減すること
ができる。
然し乍ら、この場合にはパターンをその都度回転させる
必要があるので、照合処理時間の増加を招く。これを解
消する為には、例えば2〜方向のそれぞれに原パターン
を回転させて、共通の唯一つのテンプレートとそれぞれ
照合させるような並列的な構成のパターン回転・照合部
を新たに設けるようにすれば良い。このような並列的な
処理により、−時に入カバターンに対する各方向の回転
と照合とを行うことが可能となるので、演算処理量とし
ては変わらないものの、見掛は上の照合処理時間を短縮
することが可能となる。
また2N個のパターン回転・照合部と唯一っのテンプレ
ートを用いる代わりに、m個のパターン回転・照合部と
n個のテンプレートを用いるようにしても良い。この場
合、前記mとnについては(mx n −2N ]なる
条件が成立するように定めれば良い。また並列的な構成
のパターン回転・照合部による処理については、基本図
形に限らず文字に対しても適用可能としても良い。更に
当然のことながら、前記テンプレートとの照合に際して
、図面要素モデルに記述される各構成要素の方向を当該
図形パターンの方向として看做し、その方向への回転を
施したテンプレートと照合させるようにすれば、より一
層、その照合処理時間の短縮化を図ることが可能となる
次に第7図に示した図面における文字列84と文字列8
6とを例に、文字の認識について説明する。
ここで文字列84は前記領域抽出部6によって文字列パ
ターンを切り出されているが、文字列8Bについてはそ
の文字列を包含する円パターンと共に切り出されている
だけで、文字列パターンそのものは切り田されていない
。従って文字を認識する場合には、このような図形に包
含された文字列を切出す為の処理を行う必要がある。
この処理は、例えば前記線分抽出部4において生成され
た輪郭画像1.に基づき、パターン85゜86の第9図
(b)に示すような輪郭画像から、パターン85に基づ
く輪郭を除いた輪郭画像を第9図(c)に示すように求
めることから開始される。するとこの輪郭画像からは、
図中・印で示すような輪郭の欠損点が検出される。この
輪郭欠損点に関して、前記円パターンの輪郭で結ばれな
い部分を結ぶように仮想的輪郭点列を生成し、文字列パ
ターン86の輪郭を完全な閉輪郭として完成させる。そ
してこの閉輪郭の内部を第9図(d)に示すように文字
列パターンとして切り出す。
このようにして文字列パターンが切り出されたら、次に
その文字列パターンから個々の文字パターンを切り出す
。この処理は原則的にはラベリング処理により連続黒画
素領域を文字素として抽出し、近接する文字素を統合し
て文字パターンとすることにより実現される。この近接
を評価する為には距離に関する閾値を設定し、文字の、
L下方向の近接を評価する。そして上記閾値以内に近接
する文字素を統合して1つの文字パターンとする。
尚、前記上下方向は前記方向画像I0によって予測され
る文字列の方向によって仮定されるものである。この結
果、例えば「i」や「%」のような分離文字は1つに統
合されて抽出される。
尚、左右方向における文字素のパターン統合は基本的に
は行わない。この結果、例えば「動」のような文字は「
歪」と「力」のような2つのパターンとして抽出される
。このようにして抽出される2つのパターンは1文字で
ある可能性と、2文字である可能性とを持っているので
、この2つの可能性についてそれぞれ考慮することが必
要となる。従ってこのような場合には、例えば複数の切
り出し候補の全てに対して文字認識を行い、最後に文脈
的な整合性を評価していずれかに決定するようにすれば
良い。
また逆に、複数の文字が接触しているような文字パター
ンも存在する。このような文字パターン、例えば第9図
(d)に示すような文字パターンに対しては、その文字
パターンを構成する黒画素の文字列と垂直な方向の周辺
分布(射影成分)fを求める。そしてこの周辺分布fの
極小点をとる位置を、接触した複数の文字パターンの境
界位置であると判定する。しかる後、この該境界位置の
付近のパターンの形状を調査し、境界位置の直近の凹み
部位を当該文字列パターンの切断箇所であると判定し、
その切断箇所にて前記文字列パターンを切り分けること
によって個々の文字パターンを切り出す。
しかして信々の文字パターンが切り出されると、次には
各文字パターンを、そのパターンが帰属する可能性のあ
る文字のカテゴリーと対応付ける。
この対応付けは、例えば複合類似度法のように、統計的
に作成された標準パターンと未知パターンとの重ね合わ
せによる一致度を算出する等して行われる。この結果、
未知パターンと対応付けられる第1位から第M位までの
文字カテゴリーを、その一致度の高いものから順に当該
文字カテゴリーのコードと上記一致度と共にリスト化し
て出力する。このようにして出力されるリスト中に、カ
テゴリー毎に予め設定された成る閾値以上の一致度を獲
得した文字カテゴリーが発見された場合には、そのパタ
ーンを文字パターンであると確定すると同時に、上記閾
値以上の一致度を獲得した文字カテゴリーの全てを当該
パターンに対応付けられた候補文字リストに登録する。
尚、上述した如く確定されたパターンについては認識確
定パターンとして登録する。また確定しなかったパター
ンについては、認識不確定パターンとして登録し、同時
に前記文字カテゴリーの候補とその一致度とを付与し、
必要ならば他のパターンとしての可能性を検証する。
ところで前述した第7図に示す文字列B4の場合には、
その文字列パターンは線分81に接触しており、前記領
域抽出部6によって切り出された文字列パターンには、
前記線分81との接触部分において欠損が生じた文字パ
ターンを含むことになる。
このような欠損の成る文字パターンをそのまま通常の標
準パターンと照合した場合、認識率の低下の原因となる
ことが否めない。
そこでこのような線分と接触した文字パターンについて
は、例えば線分除去後の文字パターンより生成した欠損
付き標準パターンと照合するようにする。この欠損付き
標準パターンは、接触した線分の成分を除去したときに
生じる欠損を予測し、標準文字パターンに上記欠損処理
を施すことにより生成される。
尚、このようにして欠損部位を予め作った標準パターン
ではな(、接触する線分を含めた標準パターンを生成し
てパターン照合に用いることも可能である。但し、この
場合には線分を含めて、その文字パターンを切出すこと
が必要となる。この線分を含めた文字パターンの切出し
は、例えば文字間で線分部分を分割する等して行われる
。しかし文字間の線分の長さは一定ではなく、場合によ
っては該線分が存在しないこともあるので、例えば欠損
のある未知パターンに一定の線分パターンを付加した新
たな未知パターンを生成する。そしてこの未知パターン
と、上述した線分を含む標準パターンとを照合するよう
にすれば、線分の長さやその有無に拘ることなく効果的
にパターン照合することが可能となる。
この他にも、例えば文字認識処理が重ね合わせ法によっ
て行われ場合には、前述したような線分との接触を想定
した特別な積重パターンを用いることなく、欠損のある
未知パターンの所定の位置に線幅性の余白を付加した新
たな未知パターンを生成し、この未知パターンと通常の
標準パターンとを照合するようにすることも可能である
。このような手法は、欠損により未知パターンの大きさ
が線幅性だけ縮小した際、重ね合わせた標準パターンと
のずれに起因する認識率の低下を防ぐ為の配慮として有
効である。
また逆に欠損のある未知パターンをそのままとし、照合
されるべき標準パターンの所定の位置に線幅性の欠損を
その都度施して、その標準パターンの大きさを未知パタ
ーンに適合させることも有用である。このようにすると
、線分との接触を想定した特別な標準パターンを予め用
意する必要はなくなるので、標準パターンの格納スペー
スを小さくすることができる。尚、上記所定の位置とは
、線分が文字パターンに接触する部位であり、多(の場
合、文字の下端部分となる。
更には前述したパターン照合に先駆けて、未知パターン
列の傾きを詳細に補正し、補正されたパターン列に対す
るパターン照合を行うことでその認識精度の向上を図る
ようにしても良い。このような傾きの補正は、例えば文
字パターンの存在が予測される範囲にあるブロックを当
該文字列を構成するパターンと看做し、各ブロックの重
心を結ぶ直線を、例えばハフ変換や最小二乗法などによ
り計算し、この直線の傾きを文字列の傾きとして補正処
理を行うことによって達成される。また縦書き文字列に
対応する為には、例えばr (1) J 。
rlOJ、rlolj等のように、横に拘束された複数
文字によるパターンを1文字と看做した標準パターンを
用意し、これを用いて上記横方向に拘束された複数の文
字を一括して認識するようにすれば良い。
さて前述したようにして個々の文字パターンに対する認
識結果が得られたら、次にこれらの認識結果の文字列と
しての妥当性を評価する。例えば前述した第7図に示す
文字列パターン8Bが数字文字列であることが明らかで
あるならば、この文字列パターンに対する前述したmM
位までの認識結果の中で、数字であり、且つその一致度
が最も高いものを選択するようにすれば良い。
また第7図に示す文字列パターン84のような場合には
、例えば前述した図面要素モデルに付加されている書式
モデルに従い、この書式モデルとの整合性を評価するよ
うにすれば良い。例えば上記書式モデルから、文字列パ
ターン84がアルファベットの大文字3桁と数字4桁、
そしてアルファベットの大文字1桁とからなることが示
される場合には、文字列パターン84から求められる各
文字パターンの認識結果がこれに適合するか否かを評価
するようにすれば良い。このような書式モデルとして与
えられる知識は、構成要素特有の制約条件であるので、
構成要素毎に前記図面要素モデルに記述しておくように
すれば良い。
一方、このような認諧結果の評価法以外にも、例えば単
語のスペルであるとか文としての整合性等を評価するこ
とも可能である。このような評価の為の制約条件は一般
性の高い知識であるので前述した文脈辞書12に登録し
ておくようにすれば良い。このような文脈的整合性に対
する評価の結果、何等かの妥当のある解釈が成立した文
字列については、その解釈を認識結果として与えて登録
する。
これに対して妥当な解釈を発見することができなかった
文字列については、未知の文字列であると判定し、必要
ならば他の構成要素としての可能性を評価される。
尚、このようにして各文字パターンを予め全ての文字カ
テゴリーと照合した後に文脈的整合性を評価することに
代えて、例えば文字認識に際して、文脈情報により存在
が予測される限定されたカテゴリーの標準パターンとの
間でだけ文字パターンの照合を行うようにしても良い。
このようにすると、文字認識処理に要する時間の短縮と
、偽照合の削減とを図ることが可能となる。更には各基
本図形の標準パターンを前述した文字の標準パターンの
一部に加えておき、前記図形候補抽出部7における固定
パターンと定型パターンの抽出処理を廃して、パターン
の抽出処理を文字認識と同時に行うようにしても良い。
さて、以上のようにして図面上の全てのパターンを評価
すると、これら各パターンは次の3つのいずれかに該当
することが判明する。
■ 唯一つの図面要素に対応付けられたパターン■ 複
数の図面要素に対応付けられたパターン■ どの図面要
素にも対応付けられなかったパターン しかして■の場合には、そのパターンは当該図面要素に
帰属するものと看做す。また■の場合には、そのパター
ンの複数の図面要素への得点寄与度を相互に比較し、当
該パターンが最も大きな寄与度を与えられている図面要
素に帰属するものと着像す。尚、最も大きな寄与度を与
えられている図面要素が複数個存在する場合には、その
パターンを帰属不確定パターンとして登録し、暫定的に
最も高い得点を得ている図面要素に帰属させる。
更に■の場合には、そのパターンを帰属不明パターンと
して登録する。このパターンは登録対象とする全ての図
面要素モデルに照らしてみても、該当するパターンが前
記図面要素モデルに記述されていなかったパターンであ
り、認識済みのものと未認識のものとからなる。
ここで上記■の帰属不明パターンの内、未検証の可能性
のあるもの、つまり基本図形と文字の両方の可能性につ
いての、少なくとも一方が検証済みでないパターンにつ
いては、未検証の可能性に基づく認識結果を求める。そ
してこの認識結果のうち最も一致度の高いものを当該帰
属不明パターンの暫定的な認識結果とし、該帰属不明パ
ターンを未登録の図面要素として登録する。また上記■
の場合の処理として、パターンの帰属を当該パターンの
寄与度を用いて決定することに代えて、例えば当該パタ
ーンが対応付けられた図面要素の前述した得点を用いて
決定するようにしても良い。
具体的には、前記図面要素のうち獲得得点数の最も高い
ものにそのパターンを帰属させるようにすれば良い。
更に、前述した図面要素の抽出処理を次のようにして効
率的に行うようにすることも可能である。
即ち、今まで説明した処理方式は、図面中に現れるパタ
ーンが帰属する可能性のある図面要素を、所謂総当たり
的に求めている。この結果、上述した■のように複数の
図面要素に対応付けられるパターンが発生した。
従って、例えば図面要素モデルを格納する前記原稿知識
ベース14に、各図面要素の抽出優先順位を格納してお
き、図面要素の検出に際しては、原稿知識ベース14に
格納された優先順位の順にその帰属可能性を評価し、且
つ抽出に成功した図面要素を構成する構成要素と着像さ
れたパターンを不活性化して次回からの抽出の対象から
除外するようにする。このような工夫を施せば、前述し
た■のようなパターンが発生することがなくなり、また
パターン抽出処理が進むに従って処理対象となるパター
ンが減少してゆくので、その処理時間の短縮化を図るこ
とが可能となる。
尚、前記図面要素モデルによって拘束を与えにくい図面
要素、例えば図面中で他の図面要素とオーバーラツプさ
れて記述されるような、例えば第7!!!:lに示す文
字列88等を抽出するには、前述した帰属不明六ターン
のうち、大きさが揃っており、且つ一定方向に略々等間
隔に存在するパターン群を、例えば文字列と着像して抽
出するようにすれば良い。また前記原稿知識ベース14
に、図面要素単独の知識だけでなく、図面要素間の帰属
関係や位置関係等に関する知識、更には図面要素が原稿
中に存在する範囲等の知識を格納しておき、前述したト
ップダウン的に行われる検証処理において、これらの知
識に基づいてその可能性の絞り込みを効率的に行うよう
にしても良い。
また上述した様々な知識、具体的には前記知識ベース8
や辞書部11、文脈辞書12や原稿知識ベース14にそ
れぞれ格納される情報については一1入力される図面等
の原稿の種類に応じて適宜入れ替え可能としておけば良
い。このようにすれば各種原稿に適合した、安定で高精
度の図面入力装置として本装置を機能させることが可能
となる。或いはこのようにして知識の入れ替えをせずと
も、予め冗長な知識を格納しておき、入力原稿の種類に
応じて各知識の活性/不活性を制御可能としても良い。
この為には入力原稿の種類に応じてどの知識を活性化す
べきかを記述したメタ動議を、予め本装置に持たせてお
くようにすれば良い。
しかして入力原稿の種類を装置に知らしめる為には、使
用者の操作により該原稿の種類を指定することを可能と
する機能を持たせておけば良い。
この原稿種別の指定は、前記操作部1による入力操作で
も良いし、原稿種類の選択の範囲に関する知識に基づき
、その選択の範囲をメニュー等の形で表示部2に表示し
、これを選択することにより実現しても良い。或いは操
作による指定に代えて、自動的に原稿種類の判別を行う
ようにしても良い。
例えば入力原稿上にその原稿の種類を紀した特定部位を
設定しておき、この特定部位の情報を読取ってその原稿
の種類を判定するようにすれば良い。
この特定部位は、例えば原稿の図名を記した部位等であ
り、この場合には図名から原稿の種類を判別するように
する。尚、この特定部位に原稿の種類を特定するような
、予め定められたコード等を記述しておくようにしても
良い。
更には入力原稿に対して、最初に様々な可能性を考慮し
た文字図形の認識を試行し2、その2 :jAの結果1
:、基づいて上記原稿の種類を判別して、以後の認識を
上述した如く判別された種類に適合させて行うことでそ
の自動化を図ることも可能である。
例えば入力図面に対して文字認識して得られた文字列が
地名であればその図面を地図として、また素子名であれ
ば電気回路であると判別する。また認識した図形がトラ
ンジスタの記号であれば、これを入力図面が電子回路で
あるとして判別するようにすれば良い。この際、何を抽
出すれば原稿の種類を判別可能であるかを記述1、た知
識を持たゼておき、認識処理の試行にあたっては上記知
識に記述される文字図形の抽出だけを試みるようにする
ことで、原稿の種類判別の安定化と省力化を達成するこ
とが可能である。
ところで本装置に修正機能を組み込んでおき、この修正
機能を起動して前述した文字・図形に関する解釈結果を
適宜修正し得るようにしておくことも有用である。この
とき、全ての解釈結果を対象にして修正すべき箇所の検
出とその箇所についての修正とを行うようにすると、オ
ペレータの処理負担が著しく増大する。従って、例えば
前述した帰属不明パターンのみを修正対象とし、更にそ
ツバターン中の認識不確定パターンのみを!11正パタ
ーン候補として前記表示部2に呈示するようにする。こ
の際、表示部2に当該パターンの認識候補をリストアツ
ブしておき、前記操作部1の操作により上記リストから
当該パターンの正しい認識結果を選択するようにしてお
けば良い。ちなみに上記リストに正解が存在しない場合
には、操作部1の操作によって適宜正解を入力可能とし
ておくことは云うまでもない。このようにすれば1、修
正作業における使用者の作業負担を大幅に軽減すること
が可能となり、装置の利便性を一層向上させることが可
能となる。
尚、上述した如く呈示される要修正候補としては、例え
ば認識不確定パターンの全てとしても良い。或いは前述
した帰属不確定パターンを要修正候補とすることも可能
であり、必要に応じて様々に要修正候補の抽出条件を設
定可能であることは云うまでもない。
また上述したように要修正候補を呈示するに際しては、
例えば帰属不明パターン、帰属不確定パターン、帰属確
定パターンの順に、また認識不確定パターン、認識確定
パターンの順に、更には構成要素の獲得した一致度や図
面要素の獲得した得点の低い順に、或いは図面要素や構
成要素毎に予め設定される誤り易さの大きい順等に従っ
て修正に関する優先順位を設定しておき、この優先順位
に従って要修正候補を表示するようにすることも可能で
ある。また優先順位の決定法を適宜選択できるようにし
たり、どの程度の深さの優先順位までを処理対象とする
かを適宜指定17得るようl、ておけば、認識結果に対
する修正処理を効率的に行うことが可能となる。
また上述した修正機能のゴーつとして、1つのパターン
が修正される毎に、その修正の加えられたパターンを含
む図面要素の再解釈を自動により行う機能を備えること
も有用である。どのような機能によれば、再解釈の必要
な図面要素の鍵となる1か所だけをマニュアル的に修正
するだけで、七の修正処理の終了と同時に他の図面要素
についても修正することが可能となる。また修正可能な
↑l報とし、では前記認識結果に限定さねず15例えは
パターンの帰属関係や、必要ならば図面要素モデル等の
知識についても修正可能としても良い。
また本装置に図面要素学習機能を設けておき・、前記帰
属不明パターンを含む未登録の図面要素に関する図面要
素モデルを追加し得2−ようにするごともできる。即ち
、前記帰属不明パターンが単独、若しくは帰属不明パタ
ーン間の関係が一定である組、更には帰属不明パターン
と非帰属不明パターンとの関係が一定である組が多数現
れるようなものを検出し、これらのパターン、またはパ
ターンの組を新しい図面要素として登録するようにする
このとき、発見した新しい図面要素の候補を前記表示部
2に表示し、表示された新しい図面要素の候補のモデル
を前記操作部lの操作により完成させるようにすれば良
い。また新しい図面要素の候補を、前記操作部lからマ
ニユアル的に指示することを可能としても良いし、前述
したモデルを含めて、新しい図面要素の候補モデルを自
動的に生成するよう1;シても良い。要するに前述した
帰属不明パターンの帰属すべき図面要素を新たに登録可
能とすることにより、装置の利便性を更に向上させるこ
とが可能となる。
尚、修正や学習の対象となるパターンを表示するに際し
ては、そのパターンを他のパターンと明確に区別できる
ように、例えばパターンの表示色や明るさを変えたり、
点滅、反転等の手法を用いて識別表示するようにすれば
良い。
また表示に際しては、表示画面上に唯一つの表示領域を
設けて情報表示するようにしても良いが、表示画面を複
数の表示領域に分割し、これらの表示領域を使い分けて
各種の情報をそれぞれ表示するようにしても良い。また
選択操作が必要な場合には、表示画面上にメニューを表
示したり、そのメニューを、例えばマウスカーソルのよ
うな指示機能により選択するようにすれば良い。更に処
理ヲ望むパターン等を上記マウス等により直接的に指定
できるようにしても良い。このような表示に関する機能
は、本装置の種々の動作状態における、あらゆる場面で
必要に応じて機能させるようにすれば良いことは云うま
でもない。
尚、本発明は上述した実施例に限定されるものではない
。例えば第1図に示した実施例装置における操作部1と
表示部2とを排除して本装置を全自動な装置として実現
することも可能である。また装置の構成をそのままとし
て、全自動的に動作するモードを設けるようにしても良
い。また前述した図面要素モデルにパターンの方向に関
する記述を含まないようにし、前記図形および文字の認
識処理を、パターンの回転に左右されない方式を採用し
て実行するようにすることも可能である。
このような手法を採用すれば前述した方向画像1、を生
成する必要がなくなるので、その処理の簡略化を図るこ
とができる。
また文書解析機能を組み込むと共に、前記図面要素モデ
ルに線分と文字列による表モデル、および図・表・写真
・文字領域の配置に関するレイアウト知識を表現した文
書モデルとを加えるようにすれば、図表を含む文書の入
力に供する為の文書入力装置として機能させることが可
能となる。即ち、図形要素および文字要素については前
述した処理機能により正確に認識されるので、前記文書
理解機能にてこれらの図形要素と文字要素の配置を前記
文書モデルに基づいて解析するようにする。
そして前記文書理解機能にて各要素の位置付け、即ちそ
の要素が図・表や写真・文字行のいずれに属するか、更
には各文字行は標題・副題・要約・著者・本文・キャプ
ション・ヘッダー・フッタ−・ページ番号等のいずれに
該当するのかを推定するようにする。このような機能を
用いることにより、図面情報の入力のみならず、本装置
を文書情報入力装置として幅広く応用することが可能と
なる。尚、このとき前記原稿の種類の判別において述べ
たようにして、入力原稿が文書であるか図面であるかを
判別可能であるようにすることもできるし、使用者によ
り指定可能であるようにすることもできる。
その他、本発明はその要旨を逸脱しない範囲で種々変形
して実施することが可能である。
[発明の効果] 以上説明したように本発明によれば、図面から検出され
る線分の方向に基づいて、その線分近傍に記載されてい
る文字や図形の向きを特定(規定)しながらそのパター
ンに対する認識処理を進めることができるので、パター
ンの方向が他の図形等により限定されているような図面
情報や、線分と文字とが接触して記述されているような
図面情報を高性能に認識することができる等の実用上多
大なる効果が奏せられる。
【図面の簡単な説明】
図は本発明の一実施例に係る図面入力装置について示す
もので、第1図は実施例装置の概略構成図、第2図は実
施例装置の基本的な処理手続きの流れを示す図、第3図
は実施例装置における線分抽出の原理を示す図、第4図
は実施例装置における方向画像生成の原理とブロックの
抽出例を示す図、第5図は代表的な引出し線の例を示す
図、第6図は引出し線を抽出する為の探索木の例を示す
図、第7図および第8図はそれぞれ入力図面における引
出し線の例を示す図、第9図はテンプレートとテンプレ
ートを用いた文字列の切出しについて説明する為の図で
ある。 ■・・・操作部、2・・・表示部、3・・・画像入力部
、4−・・線分抽出部、5・・・方向画像生成部、6・
−・領域抽出部、7・・・図形候補抽出部、訃・・知識
ベース、9・・・文字候補抽出部、lO・・・文字認識
部、11・・・辞書部、12・・・文脈辞書、13・・
・推論処理部、14・・・原稿知識ベース、15・・・
記憶部、16・・・出力部。 第 図 mlll図 i’ii…’−)I + j4’ (内容[良゛史な1
2)図面の浄書(内容に変更なし) 第 図 手続補正書(方式) 平成2年9月12日

Claims (8)

    【特許請求の範囲】
  1. (1)画像として入力された図面中の所定の意味を持つ
    パターンを認識する図面入力装置において、前記図面か
    ら線分を抽出する手段と、この図面から抽出された線分
    の方向に基づいて認識対象とするパターンの向きを限定
    して前記図面から所定の意味を持つパターンを抽出する
    パターン認識手段とを具備したことを特徴とする図面入
    力装置。
  2. (2)線分の方向に基づく認識対象とするパターンの向
    きの限定は、検出された線分の周囲に存在する可能性の
    あるパターンに対して、そのパターンの向きに関する拘
    束条件を定めることにより規定されることを特徴とする
    請求項(1)に記載の図面入力装置。
  3. (3)画像として入力された図面中の所定の意味を持つ
    パターンを認識する図面入力装置において、前記図面か
    ら線分を抽出する手段と、この図面から抽出された線分
    に接触するパターンを該線分を除去して切り出す手段と
    、この手段にて切り出されたパターンを前記線分除去に
    よる欠損を想定した標準パターンと照合して認識するパ
    ターン認識手段とを具備したことを特徴とする図面入力
    装置。
  4. (4)画像として入力された図面中の所定の意味を持つ
    パターンを認識する図面入力装置において、前記図面か
    ら線分を抽出する手段と、この図面から抽出された線分
    に接触するパターンを該線分と共に切り出す手段と、こ
    の手段にて切り出されたパターンを前記線分のパターン
    を含む標準パターンと照合して認識するパターン認識手
    段とを具備したことを特徴とする図面入力装置。
  5. (5)線分に接触するパターンは、線分と分離して検出
    することが不可能なパターン候補として検出されること
    を特徴とする請求項(3)または(4)に記載の図面入
    力装置。
  6. (6)画像として入力された図面中の所定の意味を持つ
    パターンを認識する図面入力装置において、前記所定の
    意味を持つパターンに関する知識を格納した知識部と、
    前記図面の上記知識に基づいて予測される位置からパタ
    ーンを切り出す手段と、この手段にて切り出されたパタ
    ーンを前記知識を参照して認識するパターン認識手段と
    を具備したことを特徴とする図面入力装置。
  7. (7)知識に基づいて予測される位置からのパターンの
    切り出しは、上記知識により指定されるパターン検出の
    手法を用いて行われることを特徴とする請求項(6)に
    記載の図面入力装置。
  8. (8)画像として入力された図面中の所定の意味を持つ
    パターンを認識する図面入力装置において、前記所定の
    意味を持つパターンに関する知識を格納した知識部と、
    この知識に従って前記図面から所定の意味を持つパター
    ンを切り出して認識するパターン認識手段と、前記図面
    から前記知識として記述されてないパターンを未登録パ
    ターンとして検出する手段と、この未登録パターンを新
    たな知識として前記知識部に加える学習手段とを具備し
    たことを特徴とする図面入力装置。
JP2140041A 1990-05-31 1990-05-31 図面入力装置 Pending JPH0434652A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2140041A JPH0434652A (ja) 1990-05-31 1990-05-31 図面入力装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2140041A JPH0434652A (ja) 1990-05-31 1990-05-31 図面入力装置

Publications (1)

Publication Number Publication Date
JPH0434652A true JPH0434652A (ja) 1992-02-05

Family

ID=15259598

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2140041A Pending JPH0434652A (ja) 1990-05-31 1990-05-31 図面入力装置

Country Status (1)

Country Link
JP (1) JPH0434652A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011054064A (ja) * 2009-09-03 2011-03-17 Ricoh Co Ltd 画像処理装置、画像処理方法及びプログラム

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011054064A (ja) * 2009-09-03 2011-03-17 Ricoh Co Ltd 画像処理装置、画像処理方法及びプログラム

Similar Documents

Publication Publication Date Title
CN108596066B (zh) 一种基于卷积神经网络的字符识别方法
KR100658119B1 (ko) 문자 인식 장치 및 방법
US7120318B2 (en) Automatic document reading system for technical drawings
JP3294995B2 (ja) 帳票読取装置
JP3345224B2 (ja) パターン抽出装置、パターン再認識用テーブル作成装置及びパターン認識装置
JP2730665B2 (ja) 文字認識装置および方法
JP2000285190A (ja) 帳票識別方法および帳票識別装置および記憶媒体
JP2013171309A (ja) 文字切り出し方法、およびこの方法を用いた文字認識装置およびプログラム
JPH11161736A (ja) 文字認識方法
CN115311666A (zh) 图文识别方法、装置、计算机设备及存储介质
JPH0434652A (ja) 図面入力装置
JP2008084105A (ja) 文字切出方法及び文字認識装置
JP2001126010A (ja) 帳票処理装置、帳票定義作成方法、領域抽出方法及び記憶媒体
JPH11219409A (ja) 文書読取装置
JP3586949B2 (ja) 帳票認識装置
JPH0689365A (ja) 文書画像処理装置
JP3476595B2 (ja) 画像領域分割方法、および画像2値化方法
JP4810853B2 (ja) 文字画像切出装置、文字画像切出方法およびプログラム
JP2917427B2 (ja) 図面読取装置
JP2000076378A (ja) 文字認識方法
JP2000322514A (ja) パターン抽出装置及び文字切り出し装置
KR102673900B1 (ko) 표 데이터 추출 시스템 및 그 방법
JP3351062B2 (ja) 文書システム
JPH06111070A (ja) 文字認識装置
JP2972443B2 (ja) 文字認識装置