JPH06131466A - パターン認識方法および装置 - Google Patents

パターン認識方法および装置

Info

Publication number
JPH06131466A
JPH06131466A JP4282123A JP28212392A JPH06131466A JP H06131466 A JPH06131466 A JP H06131466A JP 4282123 A JP4282123 A JP 4282123A JP 28212392 A JP28212392 A JP 28212392A JP H06131466 A JPH06131466 A JP H06131466A
Authority
JP
Japan
Prior art keywords
character
line segment
character candidate
pattern recognition
candidates
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP4282123A
Other languages
English (en)
Inventor
Minoru Yamanaka
稔 山中
Nagisa Sekiguchi
なぎさ 関口
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Meidensha Corp
Meidensha Electric Manufacturing Co Ltd
Original Assignee
Meidensha Corp
Meidensha Electric Manufacturing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Meidensha Corp, Meidensha Electric Manufacturing Co Ltd filed Critical Meidensha Corp
Priority to JP4282123A priority Critical patent/JPH06131466A/ja
Publication of JPH06131466A publication Critical patent/JPH06131466A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Image Analysis (AREA)

Abstract

(57)【要約】 【目的】 傾斜した文字候補を高速かつ高精度に認識す
る技術を提供する。 【構成】 線分要素を順次検索する。線分要素の芯線ベ
クトルデータを取得する。芯線ベクトル長Lを設定しき
い値Lminと比較する。L≧Lminの線分要素を基準線分
に設定する(S2)。文字候補の矩形領域中心点から基
準線分の芯線ベクトルに垂線を下ろす。中心点と芯線ベ
クトルとの距離Dを求める。距離Dと設定しきい値D
maxとを比較する。D≧Dmaxである文字候補が1つでも
あれば、その文字候補を要素とする文字候補グループを
設定する(S3)。基準線分の芯線ベクトルの傾きθを
算出する(S5)。文字候補グループについて傾きθに
より座標変換を行う(S6)。文字候補グループから個
々の文字候補を抽出する(S7)。文字候補を文字辞書
と照合してパターン認識を行う(S8)。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】この発明は、手書き図面等の画像
から文字・図形を認識する技術に係わり、特に傾斜した
文字を高速かつ高精度に認識するものに関する。
【0002】
【従来の技術】図面自動入力装置のハードウエア構成を
図4に示す。イメージスキャナ1は手書き図面等を光学
的に読み取るものである。2値画像入力インタフェース
2はイメージスキャナ1から2値画像データを取り込む
ものである。画像メモリ3は2値画像データを格納する
ものである。画像処理プロセッサ4は2値画像データを
ベクトルデータに変換するものである。5はディスクで
あり、ディスクコントローラ6により制御される。7は
システムメモリ、8はCAD(コンピュータ・エイディ
ド・デザイン)システムやマッピングシステム等の上位
システムと通信するための上位システム接続インタフェ
ース、9はこのシステムの主制御を行うホストプロセッ
サであり、システム各部はシステムバス10を介してホ
ストプロセッサ9と接続されている。
【0003】この装置の動作概要を図5に示す。2値画
像入力インタフェース2は、イメージスキャナ1で読み
取られた2値画像データを取り込み、画像メモリ3に転
送・格納する(S1)。この後、この2値画像データを
対象として画像処理プロセッサ4が細線化方式あるいは
輪郭検出・芯線化方式による画像処理を行う。輪郭検出
・芯線化方式の場合、2値画像データから輪郭画素列を
抽出して輪郭ベクトルを生成し(S2)、さらに輪郭ベ
クトルの中心線にあたる芯線ベクトルを生成する(S
3)。輪郭ベクトルデータや芯線ベクトルデータはシス
テムメモリ7に格納される。ホストプロセッサ9は、こ
れらのベクトルデータから文字候補やシンボル候補、線
分候補といった要素を分離・抽出する(S4)。システ
ムメモリ7には文字辞書やシンボル辞書等が用意されて
おり、ホストプロセッサ9は、分離した各種要素につい
て必要により辞書を参照しながらパターン認識を行う
(S5〜7)。線分候補については、直線や円、円弧等
に近似して認識する。この後、認識したパターンデータ
を所定のフォーマットに編集して認識結果とし(S
8)、この認識結果をCADシステムに引き渡す等、各
種の出力処理を行う(S9〜11)。
【0004】上記の要素分離における文字候補の弁別で
は、図6に示すように、懸案要素の輪郭ベクトルから懸
案要素の占める矩形領域を検出し、矩形領域の各辺の大
きさをdx,dyとすると、
【0005】
【数1】Sn<dx<Sc かつ Sn<dy<Sc であるとき、懸案要素を文字候補とする。ここでSn,
Scは図面中の文字の下限しきい値・上限しきい値であ
り、Sn以下のサイズの要素はノイズとして排除され
る。この後、文字辞書に登録してある文字パターンと各
文字候補とを比較してパターン認識を行う。
【0006】ところで、図面に記載された文字は水平横
書きの文字だけとは限らず、たとえば電気回路図の信号
名や機械図の寸法表記など、傾斜した文字もある。文字
辞書には水平方向の文字パターンのみ登録されているの
が通常であるため、傾斜した文字の場合、その文字パタ
ーンを水平方向に整合させる必要がある。従来は次の2
通りの手法により、傾斜した文字に対処していた。
【0007】(1)文字候補を一定角度回転したうえで
パターン認識を行い、辞書と照合されるまで回転・パタ
ーン認識を繰り返す。
【0008】(2)複数の文字候補を文字列として認識
し、この文字列単位で傾斜を求めて座標変換により水平
方向の文字列に置換し、この後、個々の文字候補につい
てパターン認識を行う。
【0009】前者によれば認識精度は比較的良好である
が、処理時間がかかる難点があるため、処理時間の短い
後者の手法が有力である。図7,8を用いて後者の手法
を具体的に説明する。図7(a)に示すように、まず複
数の文字候補をそれらの隣接関係により文字列にグルー
プ化する。この後、各文字列について傾きを計算する。
この計算では、まず文字列を構成する各文字候補につい
て矩形領域の中心点を算出し、各中心点をサンプル点と
する。そして図8に示すように、各サンプル点を最小自
乗法で直線近似し、その直線の傾きを文字列角度θとす
る。この後、角度θを用いて文字列を座標変換し、図7
(b)に示すように水平方向の文字列に置換したうえ
で、パターン認識を行う。
【0010】
【発明が解決しようとする課題】しかしながら上記の従
来の手法によれば、図9(a)に示すように文字列の文
字数が少ない場合、あるいは図9(b)(c)に示すよ
うに文字列に大きさの異なる文字が含まれている場合、
文字列角度計算の精度が低下してパターン認識精度を劣
化させる問題点があった。
【0011】この発明は、かかる問題点に鑑み、文字候
補の傾きを修正したうえでパターン認識を行うパターン
認識技術において、処理速度を阻害することなく、パタ
ーン認識精度を向上させることを目的とする。
【0012】
【課題を解決するための手段】この発明では、かかる目
的を達成するために、画像を折れ線近似したベクトルデ
ータから文字候補や線分要素などの画像要素を分離抽出
して得られる画像要素データを対象としてパターン認識
を行う方法であって、前記文字候補については傾きを修
正したうえでパターン認識処理を行う方法において、近
接する文字候補および線分要素に対応関係を設定し、該
対応関係が設定された文字候補については、対応する線
分要素の傾きから修正角度を定めることとする。
【0013】さらに、この発明では、次の要素を備えた
パターン認識装置を提供する。
【0014】(1)画像を折れ線近似したベクトルデー
タから文字候補や線分要素などの画像要素を分離抽出し
て得られる画像要素データを格納する画像要素データ格
納手段11。
【0015】(2)線分要素の中から該要素の長さに基
づいて基準線分要素を選択する基準線分要素設定手段1
2。
【0016】(3) 該基準線分要素の近傍に位置する
文字候補を検索する文字候補検索手段13。この文字候
補検索手段13は、たとえば次の要素を有する。
【0017】A)文字候補の矩形領域中心点と基準線分
要素の芯線ベクトルとの距離を求める距離演算手段1
4。
【0018】B)距離をしきい値と比較し、該比較結果
から近傍に位置する文字候補か否かを判定する判定手段
15。
【0019】(4)検索された文字候補を要素とする文
字候補グループを生成する文字候補グループ生成手段1
6。
【0020】(5)基準線分要素の傾きを算出する傾き
演算手段17。
【0021】(6)算出された傾きに基づいて文字候補
グループの座標変換を行う座標変換手段18。
【0022】(7)座標変換後の文字候補グループから
文字候補を抽出する文字候補抽出手段19。
【0023】(8)抽出された文字候補を対象としてパ
ターン認識を行う文字パターン認識手段20。
【0024】
【作用】この発明によれば、たとえば線分要素の中から
所定の長さのものを基準線分要素として選択し、各基準
線分要素について、近傍に位置する文字候補を検索して
文字候補グループにまとめる。そして基準線分要素の傾
きを求め、この傾きに基づいて文字候補グループを座標
変換することにより、各文字候補の角度修正を一括して
行う。この後、文字候補グループから各文字候補を抽出
して個別にパターン認識を行う。
【0025】
【実施例】以下、この発明の実施例を説明する。この実
施例に係る図面自動入力装置は、文字候補のパターン認
識処理、特に文字列角度計算処理に特徴がある。この処
理機能はソフトウエア的に実現することが可能であり、
この場合、ハードウエア構成はたとえば図4に示すよう
な既存の構成で構わない。
【0026】この実施例に係る文字候補パターン認識処
理手順の概要を図2に示す。また同処理の様子を図3に
示す。この処理では、画像中の所定の線分要素を基準線
分とし、この基準線分単位で基準線分近傍の文字候補に
ついて認識処理を行う。
【0027】具体的には、まず適当な手法で線分要素を
順次検索する(S1)。そして懸案線分要素の芯線ベク
トルデータを取得し、そのベクトル長Lと設定しきい値
minとを比較する。この結果、L≧Lminの場合、懸案
線分要素を基準線分に設定する(S2)。次に、懸案基
準線分の近傍に位置する文字候補を検索してグループ化
する(S3)。文字候補の検索にあたっては、まず適当
な手法で文字候補をピックアップし、文字候補の矩形領
域中心点から基準線分の芯線ベクトルに垂線を下ろして
中心点と芯線ベクトルとの距離Dを求め、この距離Dと
設定しきい値D maxとを比較する。この結果、D≧Dmax
である場合、懸案文字候補を要素とする文字候補グルー
プを設定する。既に文字候補グループが設定されている
場合は、その要素に追加する。そして懸案基準線分に文
字候補グループが設定された場合(S4:Yes)、当
該文字候補グループのパターン認識処理に進み、文字候
補グループが設定されていない場合(S4:No)、他
の基準線分の検索に進む。
【0028】文字候補グループのパターン認識処理で
は、まず懸案基準線分の傾きθを算出する(S5)。次
に、文字候補グループを1つの文字列と見なし、傾きθ
を用いて座標変換を行う(S6)。この後、座標変換後
の文字列から文字候補を抽出し(S7)、各文字候補に
ついて文字辞書との照合によるパターン認識を行う(S
8)。以上のパターン認識処理において処理対象となら
なかった文字候補については、このパターン認識処理後
に、たとえば通常(従前)の手法によるパターン認識処
理を施すことで対処する。
【0029】
【発明の効果】以上説明したようにこの発明によれば、
線分要素近傍の文字候補をグループ化し、当該線分要素
の傾きにより座標変換を行ったうえでパターン認識を行
うこととしているので、次のような効果を奏する。
【0030】(1)文字候補をグループ化したうえで一
括して座標変換するため、各文字候補ごとに試行錯誤的
に角度を変えてパターン認識を行う手法と比較して簡素
化な手順で済み、処理の高速性が確保される。
【0031】(2)近傍の線分要素の傾きから文字候補
の角度を決定するので、文字数が少ない場合や文字サイ
ズが異なる場合でも文字候補角度の正確性が確保され、
パターン認識精度が向上する。
【図面の簡単な説明】
【図1】この発明の構成を示すブロック図。
【図2】この発明の一実施例に係る文字候補のパターン
認識手順を示すフローチャート。
【図3】文字候補の角度計算の様子を示す説明図。
【図4】図面自動入力装置のハードウエア構成を示すブ
ロック図。
【図5】図面自動入力装置の動作概要を示すフローチャ
ート。
【図6】文字候補の矩形領域の設定を示す説明図。
【図7】文字列の水平方向への変換の様子を示す説明
図。
【図8】文字列角度の計算の様子を示す説明図。
【図9】文字列角度の精度が劣化する例を示す説明図。
【符号の説明】
11…画像要素データ格納手段 12…基準線分要素設定手段 13…文字候補検索手段 14…距離演算手段 15…判定手段 16…文字候補グループ生成手段 17…傾き演算手段 18…座標変換手段 19…文字候補抽出手段 20…文字パターン認識手段

Claims (3)

    【特許請求の範囲】
  1. 【請求項1】 画像を折れ線近似したベクトルデータか
    ら文字候補や線分要素などの画像要素を分離抽出して得
    られる画像要素データを対象としてパターン認識を行う
    方法であって、前記文字候補については傾きを修正した
    うえでパターン認識処理を行う方法において、 近接する文字候補および線分要素に対応関係を設定し、
    該対応関係が設定された文字候補については、対応する
    線分要素の傾きから修正角度を定めることを特徴とする
    パターン認識方法。
  2. 【請求項2】 画像を折れ線近似したベクトルデータか
    ら文字候補や線分要素などの画像要素を分離抽出して得
    られる画像要素データを格納する画像要素データ格納手
    段と、 前記線分要素の中から該要素の長さに基づいて基準線分
    要素を選択する基準線分要素設定手段と、 該基準線分要素の近傍に位置する文字候補を検索する文
    字候補検索手段と、 検索された文字候補を要素とする文字候補グループを生
    成する文字候補グループ生成手段と、 前記基準線分要素の傾きを算出する傾き演算手段と、 該傾きに基づいて前記文字候補グループの座標変換を行
    う座標変換手段と、 座標変換後の文字候補グループから文字候補を抽出する
    文字候補抽出手段と、 抽出された文字候補を対象としてパターン認識を行う文
    字パターン認識手段とを備えたことを特徴とするパター
    ン認識装置。
  3. 【請求項3】 請求項2記載のパターン認識装置におい
    て、前記文字候補検索手段は、文字候補の矩形領域中心
    点と基準線分要素の芯線ベクトルとの距離を求める距離
    演算手段と、該距離をしきい値と比較し該比較結果から
    近傍に位置する文字候補か否かを判定する判定手段とを
    有するものであることを特徴とするパターン認識装置。
JP4282123A 1992-10-21 1992-10-21 パターン認識方法および装置 Pending JPH06131466A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP4282123A JPH06131466A (ja) 1992-10-21 1992-10-21 パターン認識方法および装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP4282123A JPH06131466A (ja) 1992-10-21 1992-10-21 パターン認識方法および装置

Publications (1)

Publication Number Publication Date
JPH06131466A true JPH06131466A (ja) 1994-05-13

Family

ID=17648427

Family Applications (1)

Application Number Title Priority Date Filing Date
JP4282123A Pending JPH06131466A (ja) 1992-10-21 1992-10-21 パターン認識方法および装置

Country Status (1)

Country Link
JP (1) JPH06131466A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008204384A (ja) * 2007-02-22 2008-09-04 Canon Inc 撮像装置、物体検出方法及び姿勢パラメータの算出方法
JP2012194932A (ja) * 2011-03-18 2012-10-11 Hitachi Ltd 文書検定システム及び文書検定方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008204384A (ja) * 2007-02-22 2008-09-04 Canon Inc 撮像装置、物体検出方法及び姿勢パラメータの算出方法
JP2012194932A (ja) * 2011-03-18 2012-10-11 Hitachi Ltd 文書検定システム及び文書検定方法

Similar Documents

Publication Publication Date Title
US4783829A (en) Pattern recognition apparatus
JPH06131466A (ja) パターン認識方法および装置
JPH0520794B2 (ja)
JPH0728935A (ja) 文書画像処理装置
JPH0589190A (ja) 図面情報のチエツク方式
JPH11126216A (ja) 図面自動入力装置
JPH10228538A (ja) 画像の端点抽出方法
JPH0773228A (ja) 図面自動認識方法
JP2972443B2 (ja) 文字認識装置
JPH06195406A (ja) 画像処理方法
JPH11120291A (ja) パタン認識システム
JP2851865B2 (ja) 文字認識装置
JPH04338889A (ja) 文字認識方法及びその装置
JP3027232B2 (ja) 文字認識装置
JPH10162104A (ja) 文字認識装置
JP2918363B2 (ja) 文字分類方法及び文字認識装置
JP3071479B2 (ja) 行間スペース検出方法
JP2974167B2 (ja) 文字の大分類認識方法
JPH05114047A (ja) 文字切り出し装置
JPH01197890A (ja) 傾斜文字の認識方式
JPH11272860A (ja) 図面自動入力装置の特殊線表示方法
JP2005346419A (ja) 文字処理方法および文字認識処理装置
JP2002157550A (ja) 文字認識装置、文字認識方法、および記録媒体
JPH06119491A (ja) 帳票理解システム
JPH07160820A (ja) 文字認識方法