JPS63111579A - 文字列対応線分抽出方式 - Google Patents

文字列対応線分抽出方式

Info

Publication number
JPS63111579A
JPS63111579A JP61257499A JP25749986A JPS63111579A JP S63111579 A JPS63111579 A JP S63111579A JP 61257499 A JP61257499 A JP 61257499A JP 25749986 A JP25749986 A JP 25749986A JP S63111579 A JPS63111579 A JP S63111579A
Authority
JP
Japan
Prior art keywords
character string
isolated
character
string
isolated area
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP61257499A
Other languages
English (en)
Other versions
JPH0636174B2 (ja
Inventor
Masashige Yamamoto
山本 正成
Yasukazu Ito
伊藤 能一
Michiko Iwasaki
岩崎 美知子
Hiroaki Harada
裕明 原田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP61257499A priority Critical patent/JPH0636174B2/ja
Publication of JPS63111579A publication Critical patent/JPS63111579A/ja
Publication of JPH0636174B2 publication Critical patent/JPH0636174B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔擾既要〕 文字列が格納されていると思われる孤立領域グループを
求め、次に孤立領域グループに対して特定の関係を持つ
線分を見つけ出す文字列対応線分抽出方式である。孤立
領域グールプに対して特定の関係を持つ線分が見つけ出
された場合には、当該線分を例えば寸法線と判定し、当
該孤立領域グループには作図ルールで指定された文字種
の文字(例えば数字)が記入されているものとして文字
認識を行う。
〔産業上の利用分野〕
本発明は、設計図面情報をコンピュータに入力する処理
の効率化を目的とした図面自動入力装置、特に図面の作
図ルールを基にして、線図形(例えば寸法vA)とそれ
に沿って書き込まれた文字情報との対応関係を取りなが
ら文字認識することを特徴とする図面自動入力装置にお
ける文字列対応線分抽出方式に関するものである。本発
明は、例えばCADシステムへの設計情報入力の効率化
を目的とした図面自動入力システムに用いる。
〔従来の技術〕
従来の図面自動入力装置は、設計図面に書かれる線分、
文字、シンボルの3要素の内、特に文字情報は別個に認
識を行なっている。
〔解決しようとする問題点〕
従来の技4Jrjでは、作図ルールで禁止されている文
字種類に対しても誤って認識することがあった。
例えば、機械図面で寸法線に沿って書かれる文字は数字
であるが、単独に文字だけを認識すると、数字“5゛を
英字“S”に誤ることがあり、周囲の情報を用いて誤り
を正すことが出来なかった。
本発明は、このような点に鑑みて創作されたものであっ
て、文字列が格納されていると思われる孤立領域グルー
プに対して特定の関係を持つ線分があるか否かを調べ、
孤立領域グループに対して特定の関係を持つ線分が見つ
け出された場合には、当該孤立領域グループには作図ル
ールで指定された文字種の文字が記入されているものと
して文字v2識を行い、これにより文字認識率の向上を
図ることを目的とする。
〔問題点を解決するための手段〕
第1図は本発明の原理図である。本発明は図面を読取装
置によって2値画像に光電変換し、その後に得られた2
値画像にベクトル化処理を施して得られるベクトル・デ
ータに対して適用される。
ベクトル・データはベクトル・データ格納部5に格納さ
れる。孤立/非孤立領域分類部6は、ベクトル・データ
格納部(5)に格納されているベクトル・データの繋が
り関係を用いて領域毎に纏め、領域のサイズにより、領
域を孤立領域/非孤立領域に分類する処理を行うもので
ある。分類結果は、孤立/非孤立領域分類結果格納部7
に格納される。
文字列抽出部8は、孤立/非孤立領域分類結果格納部7
に格納されている孤立領域群のデータにより、近隣を調
査して孤立領域を文字列単位にグループ化する処理を行
うものである。文字列抽出部8によって求められた文字
列は、文字列グループ格納部9に格納される。文字列対
応線分抽出部10は、文字列グループ格納部9に格納さ
れている文字列の傾きを検出し、文字列の傾きと線図形
の傾きの差及び文字列と線図形の距離を評価して、文字
列に対応する線分を抽出する処理を行うものである。
〔実施例〕
第2図は本発明の1実施例を示す機能ブロック図である
。同図において、1は制御装置、2は図面読取部、3は
2値画像データ格納部、4はベクトル化部、5はベクト
ル・データ格納部、6は孤立/非孤立領域分類部、7は
孤立/非孤立領域分頚結果格納部、8は文字列抽出部、
9は文字列グループ格納部、10は文字列対応線分抽出
部、11は文字列対応線分格納部、12は作図ルール&
辞書部、13は認識部、14は認識結果格納部をそれぞ
れ示している。
制御装置1は、全体の制御を行うものである。
図面読取部2は、図面の読取りを行うものである。
読取った画像データを2値化する等の処理も図面読取部
2が行う。2値画像データは、2値画像データ格納部3
に格納される。ベクトル化部4は、2値画像データ格納
部3の2値画像データをベクトル化する機能を持つ。2
値画像データのベクトル化の技術は、例えば特開昭61
−80367号公報に開示されている。ベクトル化部4
から出力されるベクトル・データは、ベクトル・データ
格納部5に格納される。孤立/非孤立領域分類部6は、
ベクトル・データ格納部5のベクトル・データを読み出
し、ベクトル・データの繋がり関係を用いて領域毎にま
とめ、各領域の縦横サイズと闇値とを比較し、各領域が
孤立領域又は非孤立領域の何れに属するかを調べる。孤
立/非孤立領域分類部6の分類結果は、孤立/非孤立領
域分類結果格納部7に格納される。文字列抽出部8は、
孤立領域群の中から作図ルールで指定された条件を満足
する孤立領域グループを取り出し、孤立領域グループの
中に文字列が格納されているものと仮定し、これを文字
列グループとして文字列グループ格納部9に格納する。
文字列対応線分抽出部10は、文字列グループ格納部9
の文字列グループ、孤立/非孤立領域分類格納部7の線
分及び作図ルール&辞書部12の作図ルールを読み出し
、文字列グループに対して特定の関係を持つ線分を抽出
し、特定の関係を満足する線分を文字列対応線分として
文字列対応線分格納部11に格納する。認識部13は、
線分、シンボル及び文字の認識を行うものである。認識
結果は、認識結果格納部14に格納される。この際、文
字列対応線分と1対1に対応する文字列グループに記入
されている文字列は、例えば数字列であるとして文字認
識を行う。
孤立/非孤立領域分類部6について更に詳細に説明する
。孤立/非孤立領域分類部6は、ベクトル・データの繋
がり関係を用いてベクトル・データを成る領域ごとにま
とめ、その領域の縦横のサイズより、下式によって孤立
/非孤立領域に分類する。
Xw及びYwはベクトルのつながり関係ごとにまとめた
領域のサイズであり、Tいは作図ルールより決められる
闇値である。
文字列抽出部8は、上記のようにして得られた孤立領域
群のデータより、近隣を調査して孤立領域を文字列単位
にグループ化する。この場合も文字列間の距離と、文字
列内の個々の文字間距離は作図ルールで決められた闇値
を用いて下記のように求める。
5tepl  :各孤立領域の中心位置を求める。
5tep2  :各孤立領域の中心位置から最短距離と
なる他の孤立領域を求める。
5tep3  :各孤立領域の中心位置間の距離の長さ
を判定する。距離が闇値より小さけれ ば同一文字列内としてグループ化し、 闇値以上であれば別文字列とする。
第3図は文字列抽出処理を説明する図である。
第3図において、aないしgは孤立領域を表し、しない
し16は各孤立領域の中心位置から近隣の孤立領域への
最短距離を表す。l、が閾値以上であればaないしdと
eないしgの2個の文字列となる。i4が闇値未満であ
ればaないしgが1つの文字列となる。次に、グループ
化された文字列単位に向きを求める。
第4図はグループ化された文字列の向きを説明する図で
ある。同図において、θは文字列の向きを表す。文字列
の傾きは、第1文字目の中心位置と、文字列内の最終文
字の中心位置とを結ぶ線分の傾きを取る。この場合、角
度を得るために、どちらかを基点とする必要がある。第
4図ではX座標の小さい座標を持つ文字の中心位置を基
点とした例を示した。文字列の向きも文字列抽出部8に
よって求められる。次に得られた文字列領域より文字列
対応線分を求める。
文字列の向きが求められた後、文字列対応線分抽出部1
0により文字列対応線分が抽出される。
第5図は文字列対応線分候補抽出を説明する図である。
同図において、θ。は文字列の傾き、L。
は対応線分候補、θ1は対応線分候補り、の傾き、2I
ないし16は対応線分候補り、と各文字の中心位置との
最短距離を表す。先ず、最初に文字列領域(内側の点線
で示される領域)を成る定められた幅だけ上下左右に太
らす。次に、その太らした領域(外側の点線で示される
領域)に接触するか又は領域内に入る非孤立領域を形成
するベクトルを抽出する。その後、抽出したベクトルの
(頃きと文字列の傾きの平行度を下記の2式で求める。
また、文字列内の個々の文字中心位置と抽出したベクト
ルとの最短距離の和を3式で求める。
−θ、〈1θ。1−1θ、l<θ、   ・・・・・・
2弐L3−Σβ7        ・・・・・・3式2
式でθ、は閾値である。3弐でnは文字列内の文字数で
ある。2式の条件式は平行度を調べており、2式を満足
しない場合は文字列対応線分としない。θ、の閾値は作
図ルールより決められる。
3式で求められるし、は文字列領域を太らした領域に接
触及び内部に位置する非孤立領域のベクトルの全てに対
して算出し記憶する。但し2式を満足するもののみにつ
いてである。
その後に、作図ルールより決められる文字列と対応線分
の位置する優先方向に従い、最適な対応線分を求める。
第6図は作図ルールからの優先順位を説明する図である
。同図に示すように、2本以上の文字列対応線分が2式
を満足し、3弐でのし、が略ぼ同じ値を取るような場合
に優先順位により1本の文字列対応線分を選択する。今
、仮に作図ルールを文字列の傾きに対して負方向に回転
した方に存在する対応線分を第1候補とするとした場合
には、同図のし、を第1候補とする。
以上のように文字列対応線分を求めることにより、対応
線分の持つ意味を文字解釈によって理解することが可能
となる。
〔発明の効果〕
以上の説明から明らかなように、本発明によれば、線分
に沿って文字情報が書かれているか否かが予め判明する
ので、その線分が何の種類なのかを線分種類識別に利用
可能であり、また、文字認識の結果、文字情報の意味解
釈によって文字列対応線分の意味が理解できる等の効果
がある。
【図面の簡単な説明】
第1図は本発明の原理図、第2図は本発明の1実施例の
ブロック図、第3図は孤立領域のグループ化を説明する
図、第4図はグループ化された文字列の向きを説明する
図、第5図は文字列対応線分候補抽出を説明する図、第
6図は作図ルールからの優先順位を説明する図である。 1・・・制御装置、2・・・図面読取部、3・・・2値
画像データ格納部、4・・・ベクトル化部、5・・・ベ
クトル・データ格納部、6・・・孤立/非孤立領域分頚
部、7・・・孤立/非孤立領域分類結果格納部、8・・
・文字列抽出部、9・・・文字列グループ格納部、10
・・・文字列対応線分抽出部、11・・・文字列対応線
分格納部、12・・・作図ルール&辞書部、13・・・
認識部、14・・・認識結果格納部。

Claims (1)

  1. 【特許請求の範囲】 図面自動入力装置における文字列対応線分抽出方式であ
    って、 ベクトル・データが格納されるベクトル・データ格納部
    (5)と、 ベクトル・データ格納部(5)に格納されているベクト
    ル・データの繋がり関係を用いて領域毎に纏め、領域の
    サイズにより、領域を孤立領域/非孤立領域に分類する
    孤立領域/非孤立領域分類部(6)と、 孤立/非孤立領域分類結果を格納する孤立/非孤立領域
    分類結果格納部(7)と、 孤立/非孤立領域分類結果格納部(7)に格納されてい
    る孤立領域群のデータにより、近隣を調査して文字列単
    位にグループ化する文字列抽出部(8)と、文字列抽出
    部(8)によって求められた文字列を格納する文字列グ
    ループ格納部(9)と、 文字列グループ格納部(9)に格納されている文字列の
    傾きを検出し、文字列の傾きと線図形の傾きの差及び文
    字列と線図形の距離を評価して、文字列に対応する線分
    を抽出する文字列対応線分抽出部(10)と を具備することを特徴とする文字列対応線分抽出方式。
JP61257499A 1986-10-29 1986-10-29 文字列対応線分抽出方式 Expired - Lifetime JPH0636174B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP61257499A JPH0636174B2 (ja) 1986-10-29 1986-10-29 文字列対応線分抽出方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP61257499A JPH0636174B2 (ja) 1986-10-29 1986-10-29 文字列対応線分抽出方式

Publications (2)

Publication Number Publication Date
JPS63111579A true JPS63111579A (ja) 1988-05-16
JPH0636174B2 JPH0636174B2 (ja) 1994-05-11

Family

ID=17307140

Family Applications (1)

Application Number Title Priority Date Filing Date
JP61257499A Expired - Lifetime JPH0636174B2 (ja) 1986-10-29 1986-10-29 文字列対応線分抽出方式

Country Status (1)

Country Link
JP (1) JPH0636174B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012103755A (ja) * 2010-11-05 2012-05-31 Ntt Docomo Inc 文字列出力装置、文字認識システム、プログラム及び文字列出力方法
JP6055065B1 (ja) * 2015-11-04 2016-12-27 アイサンテクノロジー株式会社 文字認識プログラム、文字認識装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012103755A (ja) * 2010-11-05 2012-05-31 Ntt Docomo Inc 文字列出力装置、文字認識システム、プログラム及び文字列出力方法
JP6055065B1 (ja) * 2015-11-04 2016-12-27 アイサンテクノロジー株式会社 文字認識プログラム、文字認識装置

Also Published As

Publication number Publication date
JPH0636174B2 (ja) 1994-05-11

Similar Documents

Publication Publication Date Title
US6335986B1 (en) Pattern recognizing apparatus and method
CA1299292C (en) Character recognition algorithm
EP0854434B1 (en) Ruled line extracting apparatus for extracting ruled line from normal document image and method thereof
US4926492A (en) Optical character reading apparatus and method
US5774580A (en) Document image processing method and system having function of determining body text region reading order
CA2194491C (en) Character recognition system identification of scanned and real time handwritten characters
JP3345224B2 (ja) パターン抽出装置、パターン再認識用テーブル作成装置及びパターン認識装置
JPS63182793A (ja) 文字切り出し方式
US6549662B1 (en) Method of recognizing characters
Dori et al. Segmentation and recognition of dimensioning text from engineering drawings
JPS63111579A (ja) 文字列対応線分抽出方式
JP7338159B2 (ja) 情報処理装置及びプログラム
Ramesh A generalized character recognition algorithm: a graphical approach
JPH0247788B2 (ja)
JP2917427B2 (ja) 図面読取装置
JPH11126216A (ja) 図面自動入力装置
KR930012142B1 (ko) 문서인식장치의 개별문자 절출방법
JP3344062B2 (ja) カタカナ手書き文字切り出し回路
JPH0773228A (ja) 図面自動認識方法
JP2509992B2 (ja) 分離文字の統合方式
JP2930996B2 (ja) 画像認識方法および画像認識装置
JP2619426B2 (ja) 文字パターン認識方法
JPH0514952B2 (ja)
JPS5943486A (ja) 円抽出処理方式
JP2918363B2 (ja) 文字分類方法及び文字認識装置