JPH0721816B2 - 文字イメージ抽出処理装置 - Google Patents

文字イメージ抽出処理装置

Info

Publication number
JPH0721816B2
JPH0721816B2 JP61275714A JP27571486A JPH0721816B2 JP H0721816 B2 JPH0721816 B2 JP H0721816B2 JP 61275714 A JP61275714 A JP 61275714A JP 27571486 A JP27571486 A JP 27571486A JP H0721816 B2 JPH0721816 B2 JP H0721816B2
Authority
JP
Japan
Prior art keywords
image
character
image information
vector
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP61275714A
Other languages
English (en)
Other versions
JPS63128490A (ja
Inventor
篤 霜山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP61275714A priority Critical patent/JPH0721816B2/ja
Publication of JPS63128490A publication Critical patent/JPS63128490A/ja
Publication of JPH0721816B2 publication Critical patent/JPH0721816B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Description

【発明の詳細な説明】 〔概要〕 文字を含む画像のイメージ情報から、文字認識等のため
に文字イメージ情報を抽出するための処理装置である。
イメージ情報を芯線化したベクトルの図形を作り、連続
したベクトルからなる所要の図形を文字部分と予定し、
その図形を囲む最小の長方形を一定幅拡張した長方形領
域内のイメージ情報から、領域外から内側へ連続して延
びるイメージ情報を消去し、消去後のイメージ情報を1
文字のイメージとする。
此の装置により、文字以外の線画等と混在する文字につ
いて、高精度の文字イメージ抽出ができる。
〔産業上の利用分野〕
本発明は、文字を含む画像のイメージ情報から、文字イ
メージ情報を抽出するための処理装置に関する。
手書きの市街地図、プラント図、回路図、プリント板パ
ターン図、機械図等を計算機で処理すれば、例えば手書
きの回路図から装置の製造及び部品の手配等に必要な情
報を自動的に作成することが可能になる。
そのような場合に、各種図面に記入された文字の図形情
報を、文字認識のために文字以外の線から分離して抽出
することが、一つの重要な処理となる。
〔従来の技術と発明が解決しようとする問題点〕
前記のような線画図面を計算機によって処理する場合に
は、通常先ずスキャナによって図面を読み取ってイメー
ジ情報を得る。
イメージ情報は、図面を覆う適当な密度の各ドットにつ
いて、例えば背景のドットを‘0'、線画、文字等のイメ
ージ部分のドットを‘1'の信号値で表した情報である。
一般に画像処理は、このイメージ情報から図形を表すベ
クトル情報を生成して、ベクトル情報について処理す
る。
このベクトル情報生成は公知のように、例えば先ずイメ
ージ情報の走査を繰り返して、いわゆるフィルタリング
処理によりイメージ部分の周縁を順次除去することによ
り、いわゆる芯線を取り出す芯線化処理を行い、次にそ
の芯線を近似するベクトルを求めることにより可能であ
る。
文字についても同様にしてベクトル情報が得られ、この
ベクトル情報によって文字認識を行うことができるが、
この方法では認識精度が十分得られないことが知られて
おり、公知の光学文字認識装置(OCR)で一般に使用さ
れるような文字イメージ情報による認識方式が望まし
い。
OCRでは、文字のある領域(例えば用紙のフォーマット
によって定まる文字位置)が定まっていて、その位置が
何らかの方法で別にOCRの処理装置に与えられ、OCRはそ
の領域には文字のみがあるものとして、一定領域内のイ
メージ情報のドットパターンと、基準パターンとの類似
性の判定処理により、文字認識を行う。
従って、前記のような図面中の任意の位置に文字が記入
されている場合には、イメージ情報の中から文字イメー
ジのみを抽出して認識処理の入力としなければ、OCR技
術によって文字認識を行うことができないので、高精度
で文字イメージを抽出する手段が必要とされている。
〔問題点を解決するための手段〕
第1図は、本発明の構成を示すブロック図である。
図において、1は画像を読み取ったイメージ情報を格納
するイメージメモリ、2はイメージメモリの情報から芯
線のベクトル情報を生成してベクトルメモリ3に出力す
るベクトル化処理部、4はベクトルメモリ3のベクトル
情報から所定の条件の連続ベクトル図形を取り出して文
字領域を設定する文字領域設定処理部、5は文字領域設
定処理部4が設定した領域ごとに、イメージメモリ1の
該当領域のイメージ情報から文字イメージを抽出するイ
メージ処理部である。
〔作用〕
ベクトル化処理部2はイメージメモリ1に格納されたイ
メージ情報から芯線化したイメージを生成し、その芯線
イメージからベクトル情報を生成してベクトルメモリ3
に格納する。
文字領域設定処理部4は、ベクトル情報を読み出して、
連続するベクトルからなる図形ごとに、その大きさ等の
所定条件を満足する図形を文字とみなし、その文字のイ
メージ情報抽出処理のための領域として、該ベクトル図
形を囲む最小の四角形を設定してイメージ処理部5に通
知する。
イメージ処理部5は、通知された各長方形領域につい
て、次の処理により文字イメージを抽出する。
即ち、先ず通知された四角形の周辺に、所定幅の領域を
拡張した四角形を設定する。
この四角形領域内のイメージ情報のうち、この領域の外
周から内側に向かって連続して延びているイメージ情報
は、文字以外の図形の一部とみなして消去する。
この消去処理を、四角形の全外周から延びるイメージ情
報について行い、残ったイメージ情報を1文字のイメー
ジ情報とする。
この装置により、図面中の文字のイメージ情報を高精度
に抽出することができ、又文字認識処理に必要な各文字
イメージの位置情報は、前記最小四角形から的確に指定
することができる。
〔実施例〕
第2図は、文字イメージ抽出処理システムの一構成例を
示すブロック図である。
処理対象の図面を、適当なスキャナ10によって走査する
ことにより、イメージ情報を読み取ってイメージ情報を
イメージメモリ11に格納する。
第3図は各処理段階の処理対象となる図形情報の一例を
示す図であり、処理対象の原図面が第3図(a)のよう
な回路図であるとし、その中の破線で囲む部分のイメー
ジを拡大したものが(b)であるとする。
第3図(b)の斜線部分は例えば信号‘1'のドット、そ
の他の部分は信号‘0'のドットからなり、各ドットは
(a)の図面上に適当に設定した直交座標のX、Y座標
で指定されている。
第2図のベクトル化処理部12は芯線化装置13及びベクト
ル化装置14からなり、芯線化装置12は、イメージ情報に
フィルタリング処理を施して、イメージの周辺を順次除
去する演算を高速に反復する公知の専用回路を主体に構
成され、この処理によって第3図(b)のイメージ情報
から、(c)のような芯線のみ残したイメージ情報を、
ワークメモリ15上に生成する。
ベクトル化装置14は、芯線のイメージ情報の各ドット間
の関係を計算して、所定の閾値内で近似する線分となる
ベクトルを順次決定する演算を高速に実行する公知の専
用回路を主体に構成され、ワークメモリ15上に生成され
た、第3図(c)のような芯線のイメージ情報から、
(d)のようなベクトル情報を生成してベクトルメモリ
16に格納する。
第3図(d)は、線上の黒点で各ベクトルの両端を示す
ものとし、それらの点は前記座標値で示される。
次にベクトルデータ処理装置17が、ベクトルメモリ16に
格納されたベクトル情報を処理し、連続するベクトルか
らなる図形を検出して、その図形ごとに以下に述べる処
理をする。第3図(d)に示すベクトル情報について
は、左の水平な線を除いた(e)に示す図形が、1つの
処理対象として検出される。
ベクトルデータ処理装置17は、第3図(e)のようなベ
クトル図形について、それを構成するベクトルの座標値
の最大、最小値から、この図形に外接する長方形30を設
定する。
この長方形について、例えば長方形30の1辺の長さが所
定値の範囲にある場合に、この図形データを文字のデー
タとみなし、以後の処理のためにワークメモリ15に、そ
の長方形30の座標値を格納する。
長方形30の大きさが所定値の範囲外の場合には、この図
形を文字以外の線画とみなし、文字イメージ抽出処理対
象から除く。
イメージデータ処理装置18は、ワークメモリ15に格納さ
れた長方形の座標データを取り出して、各長方形ごとに
以下の処理をする。
先ず、例えば長方形30に対して、その外側に所定幅(文
字の大きさが96×96ドット以下程度として、例えば16ド
ットの幅)だけ拡大した長方形31を設定し、その範囲の
イメージ情報をイメージメモリ11から第3図(f)に示
すように読み込む。
次に長方形31の各一辺から内側に所定幅(例えば32ドッ
ト幅)の長方形領域について、長方形31の外側から内側
へ連続して延びているイメージを検出して、このイメー
ジ情報を消去する。
例えば、長方形31の左辺領域32について説明すれば、第
3図(g)に示すような情報が処理されて、長方形31の
左辺33に接し、右側(即ち長方形の内側)に延びるイメ
ージ34が検出され、これを消去して(h)のようにす
る。
この処理を更に詳細に説明すると、第3図(g)を更に
拡大して示す第4図において、左辺33上のイメージから
始めて、辺に平行な線で連続するイメージの上端までの
距離(図にaとして示す)と、下端までの距離bを求
め、その右隣の線上のイメージについて上端及び下端ま
での距離c、dを求め、 a≦c且つb≧dか、 a≧c且つb≦dか、 a≧c且つa≦dか、又は b≧c且つb≦d であれば、連続しているので、左の線上のイメージ情報
を消去し、c、dを新たなa、bとし、更に右隣の線上
のイメージについて新たなc、dを求めて前記と同様に
連続性を判定する。
このようにして、連続の条件が満足される間、順次右隣
へ処理を進め、前記条件を満足しないことが検出された
ところで処理を終わる。
なお、1線上に連続するイメージが複数個ある場合に
は、2線の各連続イメージのすべての組合わせについて
前記の連続性判定を行い、すべての判定を行った結果、
何れかの組合わせで連続と判定された右線上のイメージ
のみを、以後の判定及び消去処理対象に残して、前記と
同様に処理を進める。
イメージデータ処理装置18は、以上の消去処理を長方形
31の4辺の内側に設ける各領域について実行して、該当
するイメージを消去することにより、第3図(f)から
(i)のイメージが抽出される(第3図の例では、前記
左辺領域のイメージ34のみが消去に該当する)。
なお以上のように、各辺についての処理領域に適当な幅
の制限を設けると、前記消去条件を満足するイメージ
が、この幅を越えて連続することが検出された場合に
は、文字以外の図形と判定して、文字処理対象から除外
する等の処理を行うことができる。
イメージデータ処理装置18は、要すれば第3図(i)の
イメージに外接する長方形枠35の座標を求めて、該座標
と抽出したイメージとのデータを求め文字イメージメモ
リ19に出力し、文字認識装置20は、このデータについて
通常の文字認識処理を行うことができる。
〔発明の効果〕
以上の説明から明らかなように、本発明によれば、回路
図等に混在する文字について、図面のイメージ情報か
ら、通常の文字認識装置で処理可能な文字イメージ情報
を高精度で抽出することができるので、図面の自動処理
が高度化されるという著しい工業的効果がある。
【図面の簡単な説明】
第1図は本発明の構成を示すブロック図、 第2図は本発明の実施例構成ブロック図、 第3図は図形情報の一例の説明図、 第4図は消去処理の説明図 である。 図において、 1、11はイメージメモリ、2、12はベクトル化処理部、
3、16はベクトルメモリ、4は文字領域設定処理部、5
はイメージ処理部、10はスキャナ、13は芯線化装置、14
はベクトル化装置、15はワークメモリ、17はベクトルデ
ータ処理装置、18はイメージデータ処理装置、19は文字
イメージメモリ、20は文字認識装置 を示す。

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】文字を含む画像のイメージ情報を処理する
    文字イメージ抽出処理装置であって、 該イメージを芯線化した、該芯線を表すベクトルを生成
    する手段、 該ベクトルが連続してなる所要図形を探索し、該図形ご
    とに該図形を囲む最小の四角形を設定する手段(4)、 該四角形を所定幅だけ拡張してなる四角形領域内の前記
    イメージ情報のうち、該領域の外周から内側に向かっ
    て、連続しているイメージ情報を消去する手段(5)を
    有し、 該四角形領域内の該消去後のイメージ情報を、各1文字
    のイメージ情報として抽出することを特徴する文字イメ
    ージ抽出処理装置。
JP61275714A 1986-11-19 1986-11-19 文字イメージ抽出処理装置 Expired - Lifetime JPH0721816B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP61275714A JPH0721816B2 (ja) 1986-11-19 1986-11-19 文字イメージ抽出処理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP61275714A JPH0721816B2 (ja) 1986-11-19 1986-11-19 文字イメージ抽出処理装置

Publications (2)

Publication Number Publication Date
JPS63128490A JPS63128490A (ja) 1988-06-01
JPH0721816B2 true JPH0721816B2 (ja) 1995-03-08

Family

ID=17559349

Family Applications (1)

Application Number Title Priority Date Filing Date
JP61275714A Expired - Lifetime JPH0721816B2 (ja) 1986-11-19 1986-11-19 文字イメージ抽出処理装置

Country Status (1)

Country Link
JP (1) JPH0721816B2 (ja)

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
電子通信学会情報部門全国大会(昭52年),No.173,P.173(昭52−8)

Also Published As

Publication number Publication date
JPS63128490A (ja) 1988-06-01

Similar Documents

Publication Publication Date Title
JP2002133426A (ja) 多値画像から罫線を抽出する罫線抽出装置
US6947596B2 (en) Character recognition method, program and recording medium
JPH0721816B2 (ja) 文字イメージ抽出処理装置
US7103220B2 (en) Image processing apparatus, method and program, and storage medium
JP3947173B2 (ja) 表画像処理装置、プログラム記録媒体、表画像処理方法
JP2957729B2 (ja) 行方向判定装置
JP2803736B2 (ja) 文字認識方式
JP3113217B2 (ja) 破線認識方法
JP2715930B2 (ja) 線分検出方法
JPS62134767A (ja) 記号名・線分名の自動抽出装置
JP3077929B2 (ja) 文字切出し方式
JP2929919B2 (ja) 光学文字切出し装置
JP3566738B2 (ja) 網掛け領域処理方法および網掛け領域処理装置
JP3517077B2 (ja) パターン抽出装置及びパターン領域の切り出し方法
JPH0586585B2 (ja)
JP3534997B2 (ja) 罫線抽出装置および方法
JP4878057B2 (ja) 文字認識方法,プログラム及び記録媒体
JP3037504B2 (ja) 画像処理方法及びその装置
JPH03268181A (ja) 文書読み取り装置
JP2957774B2 (ja) 行方向判定装置
JP2888885B2 (ja) 文字切出し装置
JP2501832B2 (ja) 色マ−ク領域の抽出方法
JP2963532B2 (ja) 行方向判定装置
Okun et al. Text/graphics separation for technical papers
JPH0420221B2 (ja)