JPH0636174B2 - 文字列対応線分抽出方式 - Google Patents

文字列対応線分抽出方式

Info

Publication number
JPH0636174B2
JPH0636174B2 JP61257499A JP25749986A JPH0636174B2 JP H0636174 B2 JPH0636174 B2 JP H0636174B2 JP 61257499 A JP61257499 A JP 61257499A JP 25749986 A JP25749986 A JP 25749986A JP H0636174 B2 JPH0636174 B2 JP H0636174B2
Authority
JP
Japan
Prior art keywords
character string
isolated
line segment
character
storage unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP61257499A
Other languages
English (en)
Other versions
JPS63111579A (ja
Inventor
正成 山本
能一 伊藤
美知子 岩崎
裕明 原田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP61257499A priority Critical patent/JPH0636174B2/ja
Publication of JPS63111579A publication Critical patent/JPS63111579A/ja
Publication of JPH0636174B2 publication Critical patent/JPH0636174B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Description

【発明の詳細な説明】 〔概要〕 文字列が格納されていると思われる孤立領域グループを
求め、次に孤立領域グループに対して特定の関係を持つ
線分を見つけ出す文字列対応線分抽出方式である。孤立
領域グールプに対して特定の関係を持つ線分が見つけ出
された場合には、当該線分を例えば寸法線と判定し、当
該孤立領域グループには作図ルールで指定された文字種
の文字(例えば数字)が記入されているものとして文字
認識を行う。
〔産業上の利用分野〕
本発明は、設計図面情報をコンピュータに入力する処理
の効率化を目的とした図面自動入力装置、特に図面の作
図ルールを基にして、線図形(例えば寸法線)とそれに
沿って書き込まれた文字情報との対応関係を取りながら
文字認識することを特徴とする図面自動入力装置におけ
る文字列対応線分抽出方式に関するものである。本発明
は、例えばCADシステムへの設計情報入力の効率化を
目的とした図面自動入力システムに用いる。
〔従来の技術〕
従来の図面自動入力装置は、設計図面に書かれる線分、
文字、シンボルの3要素の内、特に文字情報は別個に認
識を行なっている。
〔解決しようとする問題点〕
従来の技術では、作図ルールで禁止されている文字種類
に対しても誤って認識することがあった。例えば、機械
図面で寸法線に沿って書かれる文字は数字であるが、単
独に文字だけを認識すると、数字“5”を英字“S”に
誤ることがあり、周囲の情報を用いて誤りを正すことが
出来なかった。
本発明は、このような点に鑑みて創作されたものであっ
て、文字列が格納されていると思われる孤立領域グルー
プに対して特定の関係を持つ線分があるか否かを調べ、
孤立領域グループに対して特定の関係を持つ線分が見つ
け出された場合には、当該孤立領域グループには作図ル
ールで指定された文字種の文字が記入されているものと
して文字認識を行い、これにより文字認識率の向上を図
ることを目的とする。
〔問題点を解決するための手段〕
第1図は本発明の原理図である。本発明は図面を読取装
置によって2値画像に光電変換し、その後に得られた2
値画像にベクトル化処理を施して得られるベクトル・デ
ータに対して適用される。ベクトル・データはベクトル
・データ格納部(5)に格納される。孤立/非孤立領域分
類部(6)は、ベクトル・データ格納部(5)に格納されてい
るベクトル・データの繋がり関係を用いて領域毎に纏
め、領域のサイズにより、領域を孤立領域/非孤立領域
に分類する処理を行うものである。分類結果は、孤立/
非孤立領域分類結果格納部(7)に格納される。文字列抽
出部(8)は、孤立/非孤立領域分類結果格納部(7)に格納
されている孤立領域群のデータにより、近隣を調査して
孤立領域を文字列単位にグループ化する処理を行うもの
である。文字列抽出部(8)によって求められた文字列
は、文字列グループ格納部(9)に格納される。文字列対
応線分抽出部(10)は、文字列グループ格納部(9)に格納
されている文字列の傾きを検出し、文字列の傾きと線図
形の傾きの差及び文字列と線図形の距離を評価して、文
字列に対応する線分を抽出する処理を行うものである。
〔実施例〕
第2図は本発明の1実施例を示す機能ブロック図であ
る。同図において、(1)は制御装置、(2)は図面読取部、
(3)は2値画像データ格納部、(4)はベクトル化部、(5)
はベクトル・データ格納部、(6)は孤立/非孤立領域分
類部、(7)は孤立/非孤立領域分類結果格納部、(8)は文
字列抽出部、(9)は文字列グループ格納部、(10)は文字
列対応線分抽出部、(11)は文字列対応線分格納部、(12)
は作図ルール&辞書部、(13)は認識部、(14)は認識結果
格納部をそれぞれ示している。
制御装置(1)は、全体の制御を行うものである。図面読
取部(2)は、図面の読取りを行うものである。読取った
画像データを2値化する等の処理も図面読取部2が行
う。2値画像データは、2値画像データ格納部(3)に
格納される。ベクトル化部(4)は、2値画像データ格
納部(3)の2値画像データをベクトル化する機能を持
つ。2値画像データのベクトル化の技術は、例えば特開
昭61−80367号公報に開示されている。ベクトル
化部(4)から出力されるベクトル・データは、ベクトル
・データ格納部(5)に格納される。孤立/非孤立領域分
類部(6)は、ベクトル・データ格納部(5)のベクトル・デ
ータを読み出し、ベクトル・データの繋がり関係を用い
て領域毎にまとめ、各領域の縦横サイズと閾値とを比較
し、各領域が孤立領域又は非孤立領域の何れに属するか
を調べる。孤立/非孤立領域分類部(6)の分類結果は、
孤立/非孤立領域分類結果格納部(7)に格納される。文
字列抽出部(8)は、孤立領域群の中から作図ルールで指
定された条件を満足する孤立領域グループを取り出し、
孤立領域グループの中に文字列が格納されているものと
仮定し、これを文字列グループとして文字列グループ格
納部(9)に格納する。文字列対応線分抽出部(10)は、文
字列グループ格納部(9)の文字列グループ、孤立/非孤
立領域分類格納部(7)の線分及び作図ルール&辞書部(1
2)の作図ルールを読み出し、文字列グループに対して特
定の関係を持つ線分を抽出し、特定の関係を満足する線
分を文字列対応線分として文字列対応線分格納部(11)に
格納する。認識部(13)は、線分、シンボル及び文字の認
識を行うものである。認識結果は、認識結果格納部(14)
に格納される。この際、文字列対応線分と1対1に対応
する文字列グループに記入されている文字列は、例えば
数字列とあるとして文字認識を行う。
孤立/非孤立領域分類部(6)について更に詳細に説明す
る。孤立/非孤立領域分類部(6)は、ベクトル・データ
の繋がり関係を用いてベクトル・データを或る領域ごと
にまとめ、その領域の縦横のサイズより、下式によって
孤立/非孤立領域に分類する。
及びYはベクトルのつながり関係ごとにまとめた
領域のサイズであり、Tは作図ルールより決められる
閾値である。
文字列抽出部(8)は、上記のようにして得られた孤立領
域群のデータより、近隣を調査して孤立領域を文字列単
位にグループ化する。この場合も文字列間の距離と、文
字列内の個々の文字間距離は作図ルールで決められた閾
値を用いて下記のように求める。
Step1:各孤立領域の中心位置を求める。
Step2:各孤立領域の中心位置から最短距離となる他の
孤立領域を求める。
Step3:各孤立領域の中心位置間の距離の長さを判定す
る。距離が閾値より小さければ同一文字列内としてグル
ープ化し、閾値以上であれば別文字列とする。
第3図は文字列抽出処理を説明する図である。第3図に
おいて、(a)ないし(g)は孤立領域を表し、()ない
し()は各孤立領域の中心位置から近隣の孤立領域
への最短距離を表す。()が閾値以上であれば(a)
ないし(d)と(e)ないし(g)の2個の文字列となる。(
)が閾値未満であれば(a)ないし(g)が1つの文字列と
なる。次に、グループ化された文字列単位に向きを求め
る。
第4図はグループ化された文字列の向きを説明する図で
ある。同図において、(θ)は文字列の向きを表す。文字
列の傾きは、第1文字目の中心位置と、文字列内の最終
文字の中心位置とを結ぶ線分の傾きを取る。この場合、
角度を得るために、どちらかを基点とする必要がある。
第4図ではX座標の小さい座標を持つ文字の中心位置を
基点とした例を示した。文字列の向きも文字列抽出部
(8)によって求められる。次に得られた文字列領域より
文字列対応線分を求める。
文字列の向きが求められた後、文字列対応線分抽出部(1
0)により文字列対応線分が抽出される。第5図は文字列
対応線分候補抽出を説明する図である。同図において、
0)は文字列の傾き、(L1)は対応線分候補、(θ1)は対
応線分候補(L1)の傾き、()ないし()は対応
線分候補(L1)と各文字の中心位置との最短距離を表す。
先ず、最初に文字列領域(内側の点線で示される領域)
を或る定められた幅だけ上下左右に太らす。次に、その
太らした領域(外側の点線で示される領域)に接触する
か又は領域内に入る非孤立領域を形成するベクトルを抽
出する。その後、抽出したベクトルの傾きと文字列の傾
きの平行度を下記の2式で求める。また、文字列内の個
々の文字中心位置と抽出したベクトルとの最短距離の和
を3式で求める。
2式で(θt)は閾値である。3式でnは文字列内の文字
数である。2式の条件式は平行度を調べており、2式を
満足しない場合は文字列対応線分としない。(θt)の閾
値は作図ルールより決められる。3式で求められる(Ls)
は文字列領域を太らした領域に接触及び内部に位置する
非孤立領域のベクトルの全てに対して算出し記憶する。
但し2式を満足するもののみについてである。
その後に、作図ルールより決められる文字列と対応線分
の位置する優先方向に従い、最適な対応線分を求める。
第6図は作図ルールからの優先順位を説明する図であ
る。同図に示すように、2本以上の文字列対応線分が2
式を満足し、3式での(Ls)が略ぼ同じ値を取るような場
合に優先順位により1本の文字列対応線分を選択する。
今、仮に作図ルールを文字列の傾きに対して負方向に回
転した方に存在する対応線分を第1候補とするとした場
合には、同図の(L1)を第1候補とする。
以上のように文字列対応線分を求めることにより、対応
線分の持つ意味を文字解釈によって理解することが可能
となる。
〔発明の効果〕
以上の説明から明らかなように、本発明によれば、線分
に沿って文字情報が書かれているか否かが予め判明する
ので、その線分が何の種類なのかを線分種類識別に利用
可能であり、また、文字認識の結果、文字情報の意味解
釈によって文字列対応線分の意味が理解できる等の効果
がある。
【図面の簡単な説明】
第1図は本発明の原理図、第2図は本発明の1実施例の
ブロック図、第3図は孤立領域のグループ化を説明する
図、第4図はグループ化された文字列の向きを説明する
図、第5図は文字列対応線分候補抽出を説明する図、第
6図は作図ルールからの優先順位を説明する図である。 (1)……制御装置、(2)……図面読取部、(3)……2値画
像データ格納部、(4)……ベクトル化部、(5)……ベクト
ル・データ格納部、(6)……孤立/非孤立領域分類部、
(7)……孤立/非孤立領域分類結果格納部、(8)……文字
列抽出部、(9)……文字列グループ格納部、(10)……文
字列対応線分抽出部、(11)……文字列対応線分格納部、
(12)……作図ルール&辞書部、(13)……認識部、(14)…
…認識結果格納部。

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】図面自動入力装置における文字列対応線分
    抽出方式であって、 ベクトル・データが格納されるベクトル・データ格納部
    (5)と、 ベクトル・データ格納部(5)に格納されているベクトル
    ・データの繋がり関係を用いて領域毎に纏め、領域のサ
    イズにより、領域を孤立領域/非孤立領域に分類する孤
    立領域/非孤立領域分類部(6)と、 孤立/非孤立領域分類結果を格納する孤立/非孤立領域
    分類結果格納部(7)と、 孤立/非孤立領域分類結果格納部(7)に格納されている
    孤立領域群のデータにより、近隣を調査して文字列単位
    にグループ化する文字列抽出部(8)と、 文字列抽出部(8)によって求められた文字列を格納する
    文字列グループ格納部(9)と、 文字列グループ格納部(9)に格納されている文字列の傾
    きを検出し、文字列の傾きと線図形の傾きの差及び文字
    列と線図形の距離を評価して、文字列に対応する線分を
    抽出する文字列対応線分抽出部(10)と を具備することを特徴とする文字列対応線分抽出方式。
JP61257499A 1986-10-29 1986-10-29 文字列対応線分抽出方式 Expired - Lifetime JPH0636174B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP61257499A JPH0636174B2 (ja) 1986-10-29 1986-10-29 文字列対応線分抽出方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP61257499A JPH0636174B2 (ja) 1986-10-29 1986-10-29 文字列対応線分抽出方式

Publications (2)

Publication Number Publication Date
JPS63111579A JPS63111579A (ja) 1988-05-16
JPH0636174B2 true JPH0636174B2 (ja) 1994-05-11

Family

ID=17307140

Family Applications (1)

Application Number Title Priority Date Filing Date
JP61257499A Expired - Lifetime JPH0636174B2 (ja) 1986-10-29 1986-10-29 文字列対応線分抽出方式

Country Status (1)

Country Link
JP (1) JPH0636174B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5325870B2 (ja) * 2010-11-05 2013-10-23 株式会社エヌ・ティ・ティ・ドコモ 文字列出力装置、文字認識システム、プログラム及び文字列出力方法
JP6055065B1 (ja) * 2015-11-04 2016-12-27 アイサンテクノロジー株式会社 文字認識プログラム、文字認識装置

Also Published As

Publication number Publication date
JPS63111579A (ja) 1988-05-16

Similar Documents

Publication Publication Date Title
CA2194491C (en) Character recognition system identification of scanned and real time handwritten characters
EP0054439B1 (en) Character segmentation method
JP3345224B2 (ja) パターン抽出装置、パターン再認識用テーブル作成装置及びパターン認識装置
Yamada et al. Cursive handwritten word recognition using multiple segmentation determined by contour analysis
Dori et al. Segmentation and recognition of dimensioning text from engineering drawings
KR19980086524A (ko) 패턴 추출 장치
Murase et al. Online hand-sketched figure recognition
JPH0636174B2 (ja) 文字列対応線分抽出方式
JP3957471B2 (ja) 分離文字列統合装置
Mostafa et al. Robust baseline-independent algorithms for segmentation and reconstruction of Arabic handwritten cursive script
JP2917427B2 (ja) 図面読取装置
JP3344062B2 (ja) カタカナ手書き文字切り出し回路
Gatos et al. A segmentation-free recognition technique to assist old Greek handwritten manuscript OCR
JP5630098B2 (ja) 情報処理装置およびプログラム
KR930012142B1 (ko) 문서인식장치의 개별문자 절출방법
KR100206827B1 (ko) 문자 인식을 위한 한글/영문 판별방법
CA2617416C (en) Character recognition system identification of scanned and real time handwritten characters
JPH11126216A (ja) 図面自動入力装置
JP2004030340A (ja) 帳票識別装置及びその識別方法
JP2930996B2 (ja) 画像認識方法および画像認識装置
KR940001048B1 (ko) 온라인 필기체문자인식방법
JP2925303B2 (ja) 画像処理方法及び装置
JP2619426B2 (ja) 文字パターン認識方法
JP3666903B2 (ja) 画像処理方法および装置
JP2972443B2 (ja) 文字認識装置