JPH02250193A - 図形・文字分離方式 - Google Patents

図形・文字分離方式

Info

Publication number
JPH02250193A
JPH02250193A JP1072108A JP7210889A JPH02250193A JP H02250193 A JPH02250193 A JP H02250193A JP 1072108 A JP1072108 A JP 1072108A JP 7210889 A JP7210889 A JP 7210889A JP H02250193 A JPH02250193 A JP H02250193A
Authority
JP
Japan
Prior art keywords
character
image
straight line
candidate
picture
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP1072108A
Other languages
English (en)
Inventor
Naoya Tanaka
直哉 田中
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP1072108A priority Critical patent/JPH02250193A/ja
Publication of JPH02250193A publication Critical patent/JPH02250193A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は、論理回路図等のように線図形と英数文字が混
在して存在する手書き図面から得られる画像データにお
いて、線図形要素と文字要素とを分離する図形・文字分
離方式に関する。
〔従来の技術〕
従来、この種の図形・文字分離方式は、対象とする論理
回路図で記述されている文字の種類は算用数字と英文字
とがほとんどであるため、文字種を英数文字に限定され
ていて、大部分の文字では、1文字は連続した画像で構
成されていて一つの孤立画像であり、i′や“joのよ
うに1文字が複数の孤立画像から構成されている場合で
も、主要な孤立図形は文字の大きさをほぼ表現していて
、図面中に描かれる文字の大きさもほぼ揃っているのて
、各孤立画像のX方向とX方向とのフエレ長(f、、f
y>を測定し、2つのフェレ長が予め定めておいた長さ
条件を満たすならば、文字候補であると判定している。
〔発明が解決しようとする課題〕
しかしなから、従来図形・文字分離方式では、文字要素
と線図形要素とが接触していた場合、文字要素が誤って
、線図形要素の一部として認識されてしまう欠点がある
〔課題を解決するための手段〕
本発明の図形・文字分離方式は、手書きした論理回路図
等の線図形と英数文字とが混在する図面を、直交軸座標
により座標指定され、2値の濃度レベルを有する画素の
集合よりなる2値画像に変換し、さらに前記画像を線幅
が1画素になるように細める細線化処理を行って得られ
た細線化画像から文字要素と図形要素とを分離するよう
に構成した文字・図形分離方式において、第1図の基本
精成図に示すように、2値化 細線化した画像を入力す
る画像データ入力手段1と、画像が分岐または交差して
いる特徴点を全画像中から抽出する特徴点抽出手段2と
、特徴点を中心として所定の大きさを持つ部分領域に対
してハフ変換を行うハフ変換手段3と、ハフ変換て生成
したパラメータから所定の長さを越える直線成分を抽出
する長直線成分検出手段4と、長色線成分の内、特徴点
以外の画像を前記部分領域から削除する長面線成分削除
手段5と、前記部分領域において、長面線成分削除手段
5の出力画像から孤立画像のフェレ長を測定するフェレ
長測定手段6と、文字要素候補を抽出するためにフェレ
長に設定した条件を孤立画像が満たす場合にこの孤立画
像を文字候補として出力する文字候補出力手段7とを備
えることにより構成される。
〔作用〕
以上の構成における作用を、第2図のハフ変換の説明図
および第3図の動作を説明するための図を参照して説明
すると、文字要素と線図形要素とが重なって混在してい
る部分画像は、前記の両要素が交わっている部分で、必
ず交差点か分岐点を持つ。これらを特徴点と総称すると
、特徴点の近傍の部分領域をすべて抽出すれば、部分領
域中には第3図に示すように前記の両要素が重なって存
在している部分画像を含んでいる可能性がある。
そこで前記の部分領域を以下に説明する方法によって、
すべて処理し、文字要素の候補を抽出する。
いま、第2図(a)に示すように直交座標をとると、こ
の座標において直線の式は、 1)=X’CO8θ+y・sinθ    −(1)と
表せる。ここで、ρは原点から直線に下ろした垂線の長
さ、θはこの垂線とX軸とのなす角である。また、点A
(xo、yθ)が、直線上に存在すれば、 ρ==XO−CO3θ−1−y(、・sinθ 、−、
(2)の関係が成り立つ。式(2)をρとθに関する方
程式と考え、ρ−θ空間上に表せは、第2図(1〕)に
示す1本の軌跡となる。すなわち、x−y空間上の1本
の直線はρ−θ空間上の1点に対応し、ρ−θ空間の軌
跡はx−y空間において、点A(Xo 、 310 )
を通る全ての直線群を表している。
以上がハフ変換で、ハフ変換によれは、この性質により
ρ−θ空間において軌跡が集中している点を抽出すれば
x−y空間上の直線を抽出できることがよく知られてい
る。
これを第3図の一点鎖線で囲まれる部分領域に含まれる
細線化された部分画像にあてはめると、x−y空間にお
いて長い直線部、ρ−θ空間上で、多数の点の重なりと
して表現される。文字要素と線図形要素とが重なって混
在している部分画像においては、長い直線部分が線図形
要素に対応していることが多いので、ρ−θ空間で、軌
跡が集中している領域を検出し、x−y空間の長い直線
を抽出し、第3図の部分画像から削除すれは、文字候補
を線図形から分離して抽出てきる。
〔実施例〕
次に、本発明の実施例について図面を参照して説明する
第4図は本発明の一実施例のブロック図である。
画像データ入力部11は手書きした論理回路図等の線図
形と英数文字とが混在する手書き図面をスキャナ入力し
、コンピュータのメモリに直交軸アドレスによりアドレ
ス指定して、0と1との2値の濃度レベルを有する画素
の集合よりなる2値画像データとして記憶する。メモリ
上の画像データは、フェレ長測定部12において各孤立
画像毎にそのフェレ長(fX、fy)を計測する。さら
にフェレ長測定部12の出力をもとに、文字候補・線図
形候補分離部13において、予め定めた定数f max
 + fmlnにより、以下の条件、ifX、fy<f
□8) かつ (fX>fmIl+)または(fy>fmln)を満た
す画像を文字候補とし、以下の条件、ifX>1.、)
まなは(fy>f、n、Xlを満たす画像を線図形候補
として出力する。
しかし、線図形候補として抽出された画像の中には、文
字成分が線成分と重なって描かれていたため同一の線図
形候補として抽出されている画像が含すれている可能性
がある。
文字成分と線図形成分が重なっている画像については、
文字成分と線図形成分を分離する必要があるが、文字成
分と線図形成分の重なっている部分には必ず分岐点か交
差点を持った特徴点が存在する。さらに、特徴点の近傍
の線図形成分は多くの場合、文字成分に比べて長い直線
で構成されている。そこて、特徴点抽出部14において
特徴点を抽出し、特徴点の近傍の領域に対してハフ変換
部15によりハフ変換を行い、長面線成分検出部16に
おいて、ρ−θ空間から、長い直線成分を検出し、特徴
点画素を除く長い直線成分を構成する画素値を長直線成
分削除部17てOとすることにより、画像中の文字成分
候補を線図形成分から分離することができる。部分領域
内で、文字成分候補を抽出するためには、フェレ長測定
部18て部分領域内の孤立画像のフェレ長を測定し、文
字候補出力部1つにおいて、文字候補・線図形候補分離
部13と同様の条件判断を行う。抽出された文字候補は
、文字認識部へ出力し、最終的な画像の意味決定を行う
〔発明の効果〕
以上詳細に述べたとおり本発明は、線図形と英数文字と
が混在した手書き図面において、線図形と英数文字が重
なっている場合でも、両者を分離することが可能となり
、認識率の高い図面認識システムを構成することができ
るという効果がある。
・・・長面線成分削除手段、6・・フェレ長測定手段、
7・・・文字候補出力手段。

Claims (1)

    【特許請求の範囲】
  1. 手書きした論理回路図等の線図形と英数文字とが混在す
    る図面を、直交軸座標により座標指定され、2値の濃度
    レベルを有する画素の集合よりなる2値画像に変換し、
    さらに前記画像を線幅が1画素になるように細める細線
    化処理を行って得られた細線化画像からの文字要素と図
    形要素とを分離するように構成した文字・図形分離方式
    において、2値化・細線化した画像を入力する画像デー
    タ入力手段と、画像が分岐または交差している特徴点を
    全画像中から抽出する特徴点抽出手段と、特徴点を中心
    として所定の大きさを持つ部分領域に対してハフ変換を
    行うハフ変換手段と、ハフ変換で生成したパラメータか
    ら所定の長さを越える直線成分を抽出する長直線成分検
    出手段と、長直線成分の内、特徴点以外の画像を前記部
    分領域より削除する長直線成分削除手段と、前記部分領
    域において、長直線成分削除手段の出力画像から孤立画
    像のフェレ長を測定するフェレ長測定手段と、文字要素
    候補を抽出するためにフェレ長に設定した条件を孤立画
    像が満たす場合にこの孤立画像を文字候補として出力す
    る文字候補出力手段とを備えることを特徴とする図形・
    文字分離方式。
JP1072108A 1989-03-23 1989-03-23 図形・文字分離方式 Pending JPH02250193A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP1072108A JPH02250193A (ja) 1989-03-23 1989-03-23 図形・文字分離方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1072108A JPH02250193A (ja) 1989-03-23 1989-03-23 図形・文字分離方式

Publications (1)

Publication Number Publication Date
JPH02250193A true JPH02250193A (ja) 1990-10-05

Family

ID=13479864

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1072108A Pending JPH02250193A (ja) 1989-03-23 1989-03-23 図形・文字分離方式

Country Status (1)

Country Link
JP (1) JPH02250193A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5859929A (en) * 1995-12-01 1999-01-12 United Parcel Service Of America, Inc. System for character preserving guidelines removal in optically scanned text
US6832726B2 (en) 2000-12-19 2004-12-21 Zih Corp. Barcode optical character recognition
US7311256B2 (en) 2000-12-19 2007-12-25 Zih Corp. Barcode optical character recognition
JP2012022359A (ja) * 2010-07-12 2012-02-02 Fuji Xerox Co Ltd 画像処理装置及び画像処理プログラム

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5859929A (en) * 1995-12-01 1999-01-12 United Parcel Service Of America, Inc. System for character preserving guidelines removal in optically scanned text
US6832726B2 (en) 2000-12-19 2004-12-21 Zih Corp. Barcode optical character recognition
US7311256B2 (en) 2000-12-19 2007-12-25 Zih Corp. Barcode optical character recognition
JP2012022359A (ja) * 2010-07-12 2012-02-02 Fuji Xerox Co Ltd 画像処理装置及び画像処理プログラム

Similar Documents

Publication Publication Date Title
US5033104A (en) Method for detecting character strings
JPH0757051A (ja) パターン認識装置
JPH04195692A (ja) 文書読取装置
JPH0721310A (ja) 文書認識装置
EP0809205A2 (en) Character line detecting apparatus using simplified projection information and method thereof and character recognition apparatus thereof and method thereof
JPH02306386A (ja) 文字認識装置
JPH02250193A (ja) 図形・文字分離方式
US5835625A (en) Method and apparatus for optical character recognition utilizing proportional nonpredominant color analysis
JPH0548510B2 (ja)
JPH02210586A (ja) 表領域分離装置および表領域分離方法
JPH06180771A (ja) 英文字認識装置
JPH0564396B2 (ja)
KR930012142B1 (ko) 문서인식장치의 개별문자 절출방법
JP4810995B2 (ja) 画像処理装置、方法及びプログラム
JP3666903B2 (ja) 画像処理方法および装置
JPH0658689B2 (ja) 線図形分離装置
JPH02252078A (ja) 文書の領域識別方法
JPH0586585B2 (ja)
JPH02187883A (ja) 文書読取装置
JPS58125183A (ja) 光学文字読取装置における認識不能文字表示方法
KR930005568B1 (ko) 오 추출 라인 검출 방법
JPH05114047A (ja) 文字切り出し装置
JPS628274A (ja) 図面読取装置
JPH05174179A (ja) 文書画像処理装置
JP2004013188A (ja) 帳票読取り装置および帳票読取り方法ならびプログラム