JPS63128490A - 文字イメージ抽出処理装置 - Google Patents

文字イメージ抽出処理装置

Info

Publication number
JPS63128490A
JPS63128490A JP61275714A JP27571486A JPS63128490A JP S63128490 A JPS63128490 A JP S63128490A JP 61275714 A JP61275714 A JP 61275714A JP 27571486 A JP27571486 A JP 27571486A JP S63128490 A JPS63128490 A JP S63128490A
Authority
JP
Japan
Prior art keywords
image
character
image information
vector
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP61275714A
Other languages
English (en)
Other versions
JPH0721816B2 (ja
Inventor
Atsushi Shimoyama
霜山 篤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP61275714A priority Critical patent/JPH0721816B2/ja
Publication of JPS63128490A publication Critical patent/JPS63128490A/ja
Publication of JPH0721816B2 publication Critical patent/JPH0721816B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔概 要〕 文字を含む画像のイメージ情報から、文字認識等のため
に文字イメージ情報を抽出するための処理方式である。
イメージ情報を芯線化したベクトルの図形を作り、連続
したベクトルからなる所要の図形を文字部分と予定し、
その図形を囲む最小の長方形を一定幅拡張した長方形領
域内のイメージ情報から、領域外から内側へ連続して延
びるイメージ情報を消去し、消去後のイメージ情報を1
文字のイメージとする。
此の方式により、文字以外の線画等と混在する文字につ
いて、高精度の文字イメージ抽出ができる。
〔産業上の利用分野〕
本発明は、文字を含む画像のイメージ情報から、文字イ
メージ情報を抽出するための処理方式に関する。
手書きの市街地図、プラント図、回路図、プリント板パ
ターン図、機械図等を計算機で処理すれば、例えば手書
きの回路図から装置の製造及び部品の手配等に必要な情
報を自動的に作成することが可能になる。
そのような場合に、各種図面に記入された文字の図形情
報を、文字認識のために文字以外の線から分離して抽出
することが、一つの重要な処理となる。
〔従来の技術と発明が解決しようとする問題点〕前記の
ような線画図面を計算機によって処理する場合には、通
常先ずスキャナによって図面を読み取ってイメージ情報
を得る。
イメージ情報は、図面を覆う適当な密度の各ドツトにつ
いて、例えば背景のドツトを0”、線画、文字等のイメ
ージ部分のドツトを1″の信号値で表した情報である。
一般に画像処理は、このイメージ情報から図形を表すベ
クトル情報を生成して、ベクトル情報について処理する
このベクトル情報生成は公知のように、例えば先ずイメ
ージ情報の走査を繰り返して、いわゆるフィルタリング
処理によりイメージ部分の周縁を順次除去することによ
り、いわゆる芯線を取り出す芯線化処理を行い、次にそ
の芯線を近似するベクトルを求めることにより可能であ
る。
文字についても同様にしてベクトル情報が得られ、この
ベクトル情報によって文字認識を行うことができるが、
この方法では認識精度が十分得られないことが知られて
おり、公知の光学文字認識装置(OCR)で一般に使用
されるような文字イメージ情報による認識方式が望まし
い。
OCRでは、文字のある領域(例えば用紙のフォーマン
トによって定まる文字位置)が定まっていて、その位置
が何らかの方法で別にOCRの処理装置に与えられ、O
CRはその領域には文字のみがあるものとして、一定額
域内のイメージ情報のドツトパターンと、基準パターン
との類似性。
の判定処理により、文字認識を行う。
従って、前記のような図面中の任意の位置に文字が記入
されている場合には、イメージ情報の中から文字イメー
ジのみを抽出して認識処理の入力としなければ、OCR
技術によって文字認識を行うことができないので、高精
度で文字イメージを抽出する手段が必要とされている。
〔問題点を解決するための手段〕
第1図は、本発明の構成を示すブロック図である。
図において、1は画像を読み取ったイメージ情報を格納
するイメージメモリ、2はイメージメモリの情報から芯
線のベクトル情報を生成してベクトルメモリ3に出力す
るベクトル化処理部、4はベクトルメモリ3のベクトル
情報から所定の条件の連続ベクトル図形を取り出して文
字領域を設定する文字領域設定処理部、5は文字領域設
定処理部4が設定した領域ごとに、イメージメモリ1の
該当領域のイメージ情報から文字イメージを抽出するイ
メージ処理部である。
〔作 用〕
ベクトル化処理部2はイメージメモリ1に格納されたイ
メージ情報から芯線化したイメージを生成し、その芯線
イメージからベクトル情報を生成してベクトルメモリ3
に格納する。
文字領域設定処理部4は、ベクトル情報を読み出して、
連続するベクトルからなる図形ごとに、その大きさ等の
所定条件を満足する図形を文字とみなし、その文字のイ
メージ情報抽出処理のための領域として、該ベクトル図
形を囲む最小の長方形を設定してイメージ処理部5に通
知する。
イメージ処理部5は、通知された各長方形領域について
、次の処理により文字イメージを抽出する。
即ち、先ず通知された長方形の周辺に、所定幅の領域を
拡張した長方形を設定する。
この長方形領域内のイメージ情報のうち、この領域の外
周から内側に向かって連続して延びているイメージ情報
は、文字以外の図形の一部とみなして消去する。
この消去処理を、長方形の全外周から延びるイメージ情
報について行い、残ったイメージ情報を1文字のイメー
ジ情報とする。
この方式により、図面中の文字のイメージ情報を商精度
に抽出することができ、又文字認識処理に必要な各文字
イメージの位置情報は、前記最小長方形から的確に指定
することができる。
〔実施例〕
第2図は、文字イメージ抽出処理システムの一構成例を
示すブロック図である。
処理対象の図面を、適当なスキャナ10によって走査す
ることにより、イメージ情報を読み取ってイメージ情報
をイメージメモリ11に格納する。
第3図は各処理段階の処理対象となる図形情報の一例を
示す図であり、処理対象の原図面が第3図(a)のよう
な回路図であるとし、その中の破線で囲む部分のイメー
ジを拡大したものが偽)であるとする。
第3図(b)の斜線部分は例えば信号°1°のドツト、
その他の部分は信号′0゛ のドツトからなり、各ドツ
トは(a)の図面上に適当に設定した直交座標のX、Y
座標で指定されている。
第2図のベクトル化処理部12は芯線化装置13及びベ
クトル化装置14からなり、芯線化装置12は、イメー
ジ情報にフィルタリング処理を施して、イメージの周辺
を順次除去する演算を高速に反復する公知の専用回路を
主体に構成され、この処理によって第3図(b)のイメ
ージ情報から、(C)のような芯線のみ残したイメージ
情報を、ワークメモリ15上に生成する。
ベクトル化装置14は、芯線のイメージ情報の各ドツト
間の関係を計算して、所定の闇値内で近似する線分とな
るベクトルを順次決定する演算を高速に実行する公知の
専用回路を主体に構成され、ワークメモリ15上に生成
された、第3図(C)のような芯線のイメージ情報から
、(dlのようなベクトル情報を生成してベクトルメモ
リ16に格納する。
第3図(d)は、線上の黒点で各ベクトルの両端を示す
ものとし、それらの点は前記座標値で示される。
次にベクトルデータ処理装置17が、ベクトルメモリ1
6に格納されたベクトル情報を処理し、連続するベクト
ルからなる図形を検出して、その図形ごとに以下に述べ
る処理をする。第3図(d)に示すベクトル情報につい
ては、左の水平な線を除いた(e)に示す図形が、1つ
の処理対象として検出される。
ベクトルデータ処理装置17は、第3図<81のような
ベクトル図形について、それを構成するベクトルの座標
値の最大、最小値から、この図形に外接する長方形30
を設定する。
この長方形について、例えば長方形3001辺の長さが
所定値の範囲にある場合に、この図形データを文字のデ
ータとみなし、以後の処理のためにワークメモリ15に
、その長方形30の座標値を格納する。
長方形30の大きさが所定値の範囲外の場合には、この
図形を文字以外の線画とみなし、文字イメージ抽出処理
対象から除く。
イメージデータ処理装置工8は、ワークメモリ15に格
納された長方形の座標データを取り出して、各長方形ご
とに以下の処理をする。
先ず、例えば長方形30に対して、その外側に所定幅(
文字の大きさが96 X 96ドツト以下程度として、
例えば16ドツトの幅)だけ拡大した長方形31′を設
定し、その範囲のイメージ情報をイメージメモリ11か
ら第3図(f)に示すように読み込む。
次に長方形31の各−辺から内側に所定幅(例えば32
ドツト幅)の長方形領域について、長方形31の外側か
ら内側へ連続して延びているイメージを検出して、この
イメージ情報を消去する。
例えば、長方形31の左辺領域32について説明すれば
、第3図(幻に示すような情報が処理されて、長方形3
1の左辺33に接し、右側(即ち長方形の内側)に延び
るイメージ34が検出され、これを消去して(h)のよ
うにする。
この処理を更に詳細に説明すると、第3図(g)を更に
拡大して示す第4図において、左辺33上のイメージか
ら始めて、辺に並行な線で連続するイメージの上端まで
の距離(図にaとして示す)と、下端までの距離すを求
め、その右隣の線上のイメージについて上端及び下端ま
での距離c、dを求め、 a≦C且つ b≧d か、 a≧C且つ b≦d か、 a≧C且つ a≦d か、又は b≧C且つ b≦d であれば、連続しているので、左の線上のイメージ情報
を消去し、c、dを新たなa、bとし、更に右隣の線上
のイメージについて新たなc、dを求めて前記と同様に
連続性を判定する。
このようにして、連続の条件が満足される間、順次右隣
へ処理を進め、前記条件を満足しないことが検出された
ところで処理を終わる。
なお、1線上に連続するイメージが複数個ある場合には
、2線の各連続イメージのすべての組合わせについて前
記の連続性判定を行い、すべての判定を行った結果、何
れかの組合わせで連続と判定された右線上のイメージの
みを、以後の判定及び消去処理対象に残して、前記と同
様に処理を進める。
イメージデータ処理装置18は、以上の消去処理を長方
形31の4辺の内側に設ける各領域について実行して、
該当するイメージを消去することにより、第3図(f)
からTi)のイメージが抽出される(第3図の例では、
前記左辺領域のイメージ34のみが消去に該当する)。
なお以上のように、各辺についての処理領域に適当な幅
の制限を設けると、前記消去条件を満足するイメージが
、この幅を越えて連続することが検出された場合には、
文字以外の図形と判定して、文字処理対象から除外する
等の処理を行うことができる。
イメージデータ処理装置18は、要すれば第3図(1)
のイメージに外接する長方形枠35の座標を求めて、該
座標と抽出したイメージとのデータを求め文字イメージ
メモリ19に出力し、文字認識装置20は、このデータ
について通常の文字認識処理を行うことができる。
〔発明の効果〕
以上の説明から明らかなように、本発明によれば、回路
図等に混在する文字について、図面のイメージ情報から
、通常の文字認識装置で処理可能な文字イメージ情報を
高精度で抽出することができるので、図面の自動処理が
高度化されるという著しい工業的効果がある。
【図面の簡単な説明】
第1図は本発明の構成を示すブロック図、第2図は本発
明の実施例構成ブロック図、第3図は図形情報の一例の
説明図、 第4図は消去処理の説明図 である。 図において、 1.11はイメージメモリ、 2.12はベクトル化処理部、 3.16はベクトルメモリ、 4は文字領域設定処理部、 5はイメージ処理部、10はスキャナ、13は芯線化装
置、  14はベクトル化装置、15はワークメモリ、 17はベクトルデータ処理装置、 18はイメージデータ処理装置、 19は文字イメージメモリ、 20は文字認識装置 図面読み取りイメージ情報入力 本発明の構成を示すブロック図 第1図 本発明の実施例構成ブロック図 第2図 図形情報の一例の説明図

Claims (1)

  1. 【特許請求の範囲】 文字を含む画像のイメージ情報を処理するシステムにお
    いて、 該イメージを芯線化した、該芯線を表すベクトルを生成
    する手段(2)、 該ベクトルが連続してなる所要図形を探索し、該図形ご
    とに該図形を囲む最小の長方形を設定する手段(4)、 及び、該長方形を所定幅だけ拡張してなる長方形領域内
    の前記イメージ情報のうち、該領域の外周から内側に向
    かって、連続しているイメージ情報を消去する手段(5
    )を有し、 該長方形領域内の該消去後のイメージ情報を、各1文字
    のイメージ情報として抽出するように構成されているこ
    とを特徴とする文字イメージ抽出処理方式。
JP61275714A 1986-11-19 1986-11-19 文字イメージ抽出処理装置 Expired - Lifetime JPH0721816B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP61275714A JPH0721816B2 (ja) 1986-11-19 1986-11-19 文字イメージ抽出処理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP61275714A JPH0721816B2 (ja) 1986-11-19 1986-11-19 文字イメージ抽出処理装置

Publications (2)

Publication Number Publication Date
JPS63128490A true JPS63128490A (ja) 1988-06-01
JPH0721816B2 JPH0721816B2 (ja) 1995-03-08

Family

ID=17559349

Family Applications (1)

Application Number Title Priority Date Filing Date
JP61275714A Expired - Lifetime JPH0721816B2 (ja) 1986-11-19 1986-11-19 文字イメージ抽出処理装置

Country Status (1)

Country Link
JP (1) JPH0721816B2 (ja)

Also Published As

Publication number Publication date
JPH0721816B2 (ja) 1995-03-08

Similar Documents

Publication Publication Date Title
CN111507251B (zh) 试题图像中作答区域的定位方法、装置、电子设备及计算机存储介质
US5201011A (en) Method and apparatus for image hand markup detection using morphological techniques
US6411733B1 (en) Method and apparatus for separating document image object types
JP2002133426A (ja) 多値画像から罫線を抽出する罫線抽出装置
US6947596B2 (en) Character recognition method, program and recording medium
Eikvil et al. Tools for interactive map conversion and vectorization
JPS63128490A (ja) 文字イメージ抽出処理装置
JP2957729B2 (ja) 行方向判定装置
JPH0586585B2 (ja)
JP2715930B2 (ja) 線分検出方法
JP3566738B2 (ja) 網掛け領域処理方法および網掛け領域処理装置
JPH0773228A (ja) 図面自動認識方法
JP2993533B2 (ja) 情報処理装置及び文字認識装置
JP2929919B2 (ja) 光学文字切出し装置
JPS62134767A (ja) 記号名・線分名の自動抽出装置
JP3329528B2 (ja) ドキュメント読取り装置
JP3517077B2 (ja) パターン抽出装置及びパターン領域の切り出し方法
JP2755299B2 (ja) 画像処理方法
JPH03268181A (ja) 文書読み取り装置
JP3127413B2 (ja) 文字認識装置
JPH02294791A (ja) 文字パターン切り出し装置
JP2957774B2 (ja) 行方向判定装置
JP3335032B2 (ja) 画像連結成分抽出装置
JP2762476B2 (ja) 清書装置
JPH03671B2 (ja)