JPH047792A - 文字抽出装置及び方法 - Google Patents

文字抽出装置及び方法

Info

Publication number
JPH047792A
JPH047792A JP2108789A JP10878990A JPH047792A JP H047792 A JPH047792 A JP H047792A JP 2108789 A JP2108789 A JP 2108789A JP 10878990 A JP10878990 A JP 10878990A JP H047792 A JPH047792 A JP H047792A
Authority
JP
Japan
Prior art keywords
contour line
contour
image
character
range
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2108789A
Other languages
English (en)
Inventor
Yukikazu Kaburayama
蕪山 幸和
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2108789A priority Critical patent/JPH047792A/ja
Publication of JPH047792A publication Critical patent/JPH047792A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔概要〕 入力画像の中から文字の抽出を行う文字抽出装置及び方
法に関し、 外形が実際の文字に合致した文字を短時間で抽出する文
字抽出装置及び方法を提供することを目的とし、 入力画像の中から画像領域の境界を表す輪郭線を追跡し
、各輪郭線が当該輪郭線で囲まれる画像領域の内か外か
を判定し、輪郭線が外側の場合に当該輪郭線を直接又は
間接に包含する親輪郭線を調査し、各輪郭線に外接する
外接矩形の座標情報を求め、各輪郭線毎に調査結果、判
定結果、及び座標情報を含む輪郭情報を記憶し、記憶さ
れている輪郭情報のうち、前記範囲外の矩形の輪郭線に
関する輪郭情報と、前記範囲よりも大きい外接矩形をも
つ外側輪郭線により直接包含される内側輪郭線に関する
輪郭情報と、前記範囲内にある外側輪郭線に直接包含さ
れる内側輪郭線、及び当該内側輪郭線により直接又は間
接に包含される輪郭線に関する輪郭情報とを削除する構
成である。
〔産業上の利用分野〕
本発明は文字抽出装置及び方法に係り、特に、文字を抽
出しようとする画像を入力し、入力した画像の中から文
字の抽出を行う文字抽出装置及び方法に関する。
本発明は紙に描かれた図面やイメージ・データとして記
憶されている図面を計算機を利用してCADシステム等
へ入力する場合には、図面上の文字を自動的に抽出する
場合に用いるものである。
(従来の技術) 従来、第11図に示すような文字抽出装置があった。
従来例に係る文字抽出装置は画像の入力を行う画像入力
部121と、当該入力画像を細線化する入力画像細線化
部122aと、細線化した画像をベクトル化するベクト
ル化部122bと、ベクトル化された画像情報を記憶す
るベクトル情報記憶部123と、抽出しようとする文字
サイズの指定を行う文字サイズ範囲指定部124と、指
定された文字サイズ以外のサイズの削除を行う指定文字
サイズ外削除部125とを有するものである。
〔発明が解決しようとする課題〕
ところで、従来例に係る文字抽出装置にあっては、入力
画像を細線化し、細線化した後に、ベクトル化し、ベク
トルの連結した分の大きさを捉えて文字を抽出するよう
にしていた。
そのため、■細線化をするために処理時間かかかり、■
細線化をするために外形が実際の文字サイズよりも小さ
く判定されるという2つの問題点を有していた。
そこで、本発明は細線化を行うことなく、文字の抽出を
して、文字抽出の時間を短縮し、かつ、細線化をするた
めに外形が実際の文字サイズに合致した文字の抽出を行
うことかできる文字抽出装置及び方法を提供することを
目的としてなされたものである。
(課題を解決するための手段) 以上の技術的課題を解決するため、第一の発明は第1図
に示すように、画像の入力を行う画像入力部1と、抽出
すべき文字サイズの範囲を指定する文字サイズ範囲指定
部4と、指定された文字サイズ範囲外の画像を削除して
入力した画像の中から文字の抽出を行う文字抽出装置に
おいて、入力画像の中から、所定種類の画素が集合して
形成された画像領域の境界を表す輪郭線を追跡し、注目
する輪郭線が、当該輪郭線で囲まれる画像領域の内側に
ある内側輪郭線か外側にある外側輪郭線かを判定し、当
該輪郭線を直接又は間接に包含する親輪郭線を調査し、
当該輪郭線に外接する外接矩形の座標情報を求める画像
追跡部2と、各輪郭線毎に前記判定結果、調査結果及び
座標情報を含む輪郭情報を記憶する輪郭情報記憶部3と
、記憶されている輪郭情報の中から、前記範囲外の外接
矩形をもつ輪郭線に関する輪郭情報、並びに前記範囲よ
りも大きい外接矩形をもつ外側輪郭線に直接包含される
内側輪郭線に関する輪郭情報を削除する範囲外削除部5
と、記憶されている輪郭情報の中から、前記範囲内にあ
る外側輪郭線に直接包含される内側輪郭線、及び当該内
側輪郭線に直接又は間接に包含される輪郭線に関する輪
郭情報を削除する内側輪郭線削除部6とを有するもので
ある。
一方、第二の発明は第2図に示すように、文字を抽出し
ようとする画像を入力し(Sl)、入力した画像の中か
ら文字の抽出を行う文字抽出方法において、入力画像の
中から、所定種類の画素が集合して形成された画像領域
の境界を表す輪郭線を追跡し、注目する輪郭線が、当該
輪郭線で囲まれる画像領域の内側にある内側輪郭線か外
側にある外側輪郭線かを判定し、当該輪郭線が外側であ
る場合に当該輪郭線を直接又は間接に包含する親輪郭線
を調査し、各輪郭線に外接する外接矩形の座標情報を求
め(S2)、各輪郭線毎に調査結果、判定結果、及び外
接矩形の座標情報を含む輪郭情報を記憶し(S3)、記
憶されている輪郭情報の中から、前記範囲外の矩形の輪
郭線に関する輪郭情報と、前記範囲よりも大きい外接矩
形をもつ外側輪郭線により直接包含される内側輪郭線に
関する輪郭情報と、前記範囲内にある外側輪郭線に直接
包含される内側輪郭線、及び、当該内側輪郭線により直
接又は間接に包含される輪郭線に関する輪郭情報とを削
除する(S4)ものである。
〔作用〕
続いて、本発明(第−及び第二の発明)に係る文字抽出
装置の動作について説明する。
文字の抽出を行うには、ステップS1で文字の抽出を行
おうとする画像を前記画像入力部1から入力し、ステッ
プS2で前記画像追跡部2は当該入力画像の中から所定
種類の画素が集合して形成された画像領域の境界を表す
輪郭線を追跡し、当該輪郭線が当該輪郭線で囲まれた画
像領域の内側輪郭線か、外側輪郭線かの判定を行い、当
該輪郭線を直接又は間接に包含する親輪郭線を調査し、
さらに、当該画像追跡部2は当該内側輪郭線に外接する
外接矩形を演算により求める。
ここで、「所定種類の画素が集合して形成された画像領
域の境界」とは、例えば、第6図に示すように、例えば
黒の画素が集合して形成された画像領域の境界をいう。
また、「当該輪郭線がAを直接に包含する」とはAは他
の輪郭線により包含されずに、当該輪郭線にのみ包含さ
れていることであり、「当該輪郭線がAを間接に包含す
る」とは当該輪郭線が、Aが包含されている他の輪郭線
(1つに限られず)を包含していることをいう。
こうして、前記画像追跡部2により得られた閉輪郭の内
側か外側かの判定結果、調査結果、及び、前記外接矩形
の座標情報を含む輪郭情報はステップS3で前記輪郭情
報記憶部3に記憶される。
すると、ステップS4で範囲外削除部5は前記文字サイ
ズ範囲指定部4により指定された文字サイズの範囲外に
ある外接矩形をもつ輪郭線に関する輪郭情報を前記輪郭
情報記憶部3から削除する。
但し、当該文字サイズ範囲外のうち、当該範囲よりも大
きい外接矩形をもつ外側輪郭線に直接に包含される内側
輪郭線に関する輪郭情報については、当該外接矩形の大
きさ如何に拘らず当該範囲外削緑部5により削除される
。これは内側輪郭線は文字サイズ範囲内にあろうとも、
抽出しようとする文字にはなり得ないからである。
また、前記内側輪郭線削除部6は、前記記憶部3に記憶
されている各輪郭情報の中から、前記文字サイズ範囲内
の外接矩形をもつ輪郭線に直接又は間接に包含される内
側輪郭線及び当該内側輪郭線に直接又は間接に包含され
る輪郭線を削除する。これは、外側輪郭線が前記文字サ
イズ範囲内にある場合であって、文字の可能性がある場
合には、内側輪郭線が文字である可能性がないと同時に
、当該内側輪郭線に含まれる輪郭線も、文字である可能
性はないからである。
こうして、削除されずに前記記憶部3に残った輪郭線が
文字として抽出されたことになる。
〔実施例〕
続いて、本発明の実施例に係る文字抽出装置または方法
を説明する。
第3図に示すように、本装置は画像の入力を行う画像入
力部11と、抽出すべき文字サイズの範囲を指定する文
字サイズ範囲指定部14と、白と黒とを表す二値画像の
電気信号で表現された入力画像の中から、黒若しくは白
画素が集合して形成された画像領域の境界(白と黒とが
接する部分)の黒若しくは白画素を表す輪郭線を追跡し
、追跡した輪郭線が、当該輪郭線で囲まれる画像領域の
内側にある内側輪郭線か外側にある外側輪郭線かを判定
し、当該輪郭線を直接又は間接に包含する親輪郭線を調
査し、当該輪郭線に外接する外接矩形の座標情報を求め
る画像追跡部12と、少なくとも、当該画像追跡部12
により得られた判定結果(輪郭線が外側か内側か)、調
査結果(それを包含する外側の親輪郭線があるか否か)
及び外接矩形の座標情報(追跡中の輪郭線の外接矩形の
水平、垂直座標の各々の最小値、最大値)を含む輪郭情
報を記憶する輪郭情報記憶部としての輪郭テーブル13
と、当該輪郭テーブル13から指定された文字サイズ範
囲外の外接矩形をもつ輪郭線に関する輪郭情報を削除す
る指定範囲外削除機構15と、記憶されている輪郭情報
のうち指定された文字サイズ範囲の最小値より小さな外
接矩形をもつ輪郭情報を前記輪郭テーブルより削除し、
指定された前記文字サイズ範囲の最大値よりも大きな外
接矩形をもつ輪郭線及びそれか外側輪郭てあった場合当
該輪郭線に直接包含される内側輪郭線を前記輪郭テーブ
ルから削除する内側輪郭線削除部16と、当該輪郭テー
ブル13に削除されずに残った輪郭情報(抽出された文
字)を出力する出力機構17と、を有するものである。
さらに、前記画像入力部11は画像入力機構11aと、
当該入力機構11aから入力した画像を格納する画像メ
モリllbとを有し、前記文字サイズ範囲指定部14は
、抽出する文字の大きさの範囲を外接矩形の最大値及び
最小値で指示するる文字サイズ範囲指示機構14aと、
指定された文字サイズの範囲を記憶する文字サイズ記憶
装置14bとを有するものである。
また、前記画像追跡部12は同図に示すように、閉輪郭
線内外判定部12aと、親輪郭線調査部12bと、外接
矩形座標算出部12cとを有するものである。
尚、画像入力機構11a、画像追跡部12、文字サイズ
範囲指示機構14a、指定範囲外削除機構15、内側輪
郭線削除部16、及び出力機構17は前記制御部18か
らの命令より動作する。
続いて、本装置及び本方法の動作を説明する。
第4図に本実施例に係る処理流れ図を示す。
ステップSJIて前記画像入力機構11aから入力した
画像は前記画像メモリllb内に格納される。
第6図に当該画像入力部11に入力した画像の例論理回
路の一部(AND素子及びNOT素子)を示す。
ステップSJ2で、前記画像追跡部12の閉輪郭線内外
判定部12aは、第7図に示すように既知の方法で第6
図の画像から輪郭線を抽出し、追跡した閉輪郭線の中か
ら、注目する輪郭線は外側輪郭線か内側輪郭線かの判定
を行い(ステップ5J21)、当該輪郭線に対する親輪
郭線の調査を行い(ステップ5J22)、 当該輪郭線
に外接する外接矩形座標の算出を行う(ステップ5J2
3)。
ここで、内側輪郭線及び外側輪郭線とは第5図に例が示
されているように、所定種類の画素(黒画素又は白画素
)が集合して形成された画像領域の境界線であって、例
えば、第5図に示すように、黒画素の集合した画像領域
の黒画素の連なった境界線をいう。
第7図は、第6図に示した入力画像について、輪郭線の
抽出を行った結果の輪郭線を示したものてあり、同図に
示すように、1〜15の各閉輪郭線が順次追跡され、ス
テップ5J21で各輪郭線か内側輪郭線か外側輪郭線か
の判定がなされ、ステップ5J22で各輪郭線に親輪郭
線があるか否かの調査がされ、ステップ5J23で各輪
郭線毎に外接矩形を表す座標が算出されることになる。
例えば、輪郭線1は外側輪郭線であって、当該輪郭線を
包含する親輪郭線は存在せず、輪郭線2は内側輪郭線で
あって、当該輪郭線は直接輪郭線1に包含されることに
なる。
このようにして、得られた各輪郭線の番号、外接矩形の
座標、内/外の別、親輪郭番号等の各輪郭線毎の輪郭情
報はステップSJ3で前記輪郭テーブル13に格納され
る。
表1にこのようにして輪郭線1〜15について追跡され
た各輪郭情報が輪郭テーブル13に格納されている状況
を示す。
/ 表1 輪郭テーブルの内容の例 ステップ5J41で指定範囲外削除機構15は前記文字
サイズ範囲指定部14により指定された文字サイズ範囲
の最小文字サイズよりも小さな輪郭線を削除して、主と
してノイズ成分の削除を行うことになる。第8図に当該
最小文字サイズよりも小さな輪郭線(輪郭線5,8.1
2)を削除した場合の画像を示す。
次に、逆に当該文字サイズ範囲よりも大きな文字サイズ
の輪郭線を削除する。その際、当該輪郭線が外側輪郭線
であって、かつ内抜きを持つ場合には(ドーナツ状)、
当該内抜きの内側輪郭線も前記サイズ範囲に関係なく削
除する。
第9図には、前記指定範囲外削除機構15により、最大
文字サイズよりも大きな輪郭線(輪郭線1)、及び当該
輪郭線1に直接包含される輪郭線(輪郭線2,3,4.
6 )を削除した場合を示したものである。
さらに、ステップ5J42て以上の削除を行った後でも
、残っている内側輪郭線は、前記文字サイズ範囲内に入
る外側輪郭線の内側にある内側輪郭線であり、文字抽出
として必要な最外部の輪郭線には該当しないので、これ
を削除する。第10図は前記内側輪郭線削除部16によ
り当該内側輪郭線(輪郭線15)及び当該輪郭線に包含
される輪郭線を削除した場合を図示したものである。
以上の処理により前記輪郭テーブル13に残った輪郭情
報は、第10図に示すように、指定された前記文字サイ
ズ“の範囲内にあり、しかも外側の輪郭線であり、前記
出力機構17によりステラフSJ5で出力されることに
なる。
通常、ここで抽出された情報をもとに、例えば、隣接す
る文字とを連結し、「文字列」を抽出したり、または、
該当部分の二値画像を参照し、文字認識を行ったりする
ことになる。
〔発明の効果〕
以上説明したように、本発明では細線化を行うことなく
、画像領域について輪郭線を求め、当該輪郭線について
外接矩形を求め、当該輪郭線に対する親輪郭線を求め、
さらに当該輪郭線の内外の判定を行い、当該輪郭惰輻に
基づいて、不必要な輪郭情報を削除するようにして、文
字の抽出を行うようにしている。
したがって、細線化による処理時間の長期化を避け、細
線化による、外形が実際の文字と合致しないという問題
点を避け、文字の抽出を短時間に、かつ、信頼性及び再
現性良く行うことができる文字抽出装置及び方法を提供
することができることになる。
【図面の簡単な説明】
第1図は第一の発明の原理ブロック図、第2図は第二の
発明に係る原理ブロック図、第3図は実施例に係るブロ
ック図、第4図は実施例に係る処理流れ図、第5図は実
施例に係る用語説明図、第6図は実施例に係る入力画像
の一例を示す図、第7図は実施例に係る抽出輪郭を示す
図、第8図は実施例に係る最小文字サイズより小さなも
のの削除結果を示す図、第9図は実施例に係る最大文字
サイズよりも大きなもの、及びそれに直接包含される内
側輪郭線の削除結果を示す図、第10図は実施例に係る
文字抽出の結果例を示す図、及び第11図は従来例に係
る文字抽出装置を示すブロック図である。 1.11・・・画像入力部 2.12・・・画像追跡部 3 (13)・・・輪郭情報記憶部 (輪郭テーブル) 4.14・・・文字サイズ範囲指定部 5(15)・・・範囲外削除部 (指定範囲外削除機構) 6.16・・・内側輪郭線削除部

Claims (2)

    【特許請求の範囲】
  1. (1)画像の入力を行う画像入力部(1)と、抽出すべ
    き文字サイズの範囲を指定する文字サイズ範囲指定部(
    4)と、指定された文字サイズ範囲外の画像を削除して
    入力した画像の中から文字の抽出を行う文字抽出装置に
    おいて、 入力画像の中から、所定種類の画素が集合して形成され
    た画像領域の境界を表す輪郭線を追跡し、注目する輪郭
    線が、当該輪郭線で囲まれる画像領域の内側にある内側
    輪郭線か外側にある外側輪郭線かを判定し、当該輪郭線
    を直接又は間接に包含する親輪郭線を調査し、当該輪郭
    線に外接する外接矩形の座標情報を求める画像追跡部(
    2)と、 各輪郭線毎に前記判定結果、調査結果及び座標情報を含
    む輪郭情報を記憶する輪郭情報記憶部(3)と、 記憶されている輪郭情報の中から、前記範囲外の外接矩
    形をもつ輪郭線に関する輪郭情報、並びに前記範囲より
    も大きい外接矩形をもつ外側輪郭線に直接包含される内
    側輪郭線に関する輪郭情報を削除する範囲外削除部(5
    )と、 記憶されている輪郭情報の中から、前記範囲内にある外
    側輪郭線に直接包含される内側輪郭線、及び当該内側輪
    郭線に直接又は間接に包含される輪郭線に関する輪郭情
    報を削除する内側輪郭線削除部(6)とを有することを
    特徴とする文字抽出装置。
  2. (2)文字を抽出しようとする画像を入力し(S1)、
    入力した画像の中から文字の抽出を行う文字抽出方法に
    おいて、 入力画像の中から、所定種類の画素が集合して形成され
    た画像領域の境界を表す輪郭線を追跡し、注目する輪郭
    線が、当該輪郭線で囲まれる画像領域の内側にある内側
    輪郭線か外側にある外側輪郭線かを判定し、当該輪郭線
    を直接又は間接に包含する親輪郭線を調査し、各輪郭線
    に外接する外接矩形の座標情報を求め(S2)、 各輪郭線毎に調査結果、判定結果、及び外接矩形の座標
    情報を含む輪郭情報を記憶し(S3)、記憶されている
    輪郭情報の中から、前記範囲外の外接矩形をもつ輪郭線
    に関する輪郭情報と、前記範囲よりも大きい外接矩形を
    もつ外側輪郭線により直接包含される内側輪郭線に関す
    る輪郭情報と、前記範囲内にある外側輪郭線に直接包含
    される内側輪郭線、及び、当該内側輪郭線により直接又
    は間接に包含される輪郭線に関する輪郭情報とを削除す
    る(S4)ことを特徴とする文字抽出方法。
JP2108789A 1990-04-26 1990-04-26 文字抽出装置及び方法 Pending JPH047792A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2108789A JPH047792A (ja) 1990-04-26 1990-04-26 文字抽出装置及び方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2108789A JPH047792A (ja) 1990-04-26 1990-04-26 文字抽出装置及び方法

Publications (1)

Publication Number Publication Date
JPH047792A true JPH047792A (ja) 1992-01-13

Family

ID=14493523

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2108789A Pending JPH047792A (ja) 1990-04-26 1990-04-26 文字抽出装置及び方法

Country Status (1)

Country Link
JP (1) JPH047792A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08123901A (ja) * 1994-10-26 1996-05-17 Nec Corp 文字抽出装置及び該装置を用いた文字認識装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08123901A (ja) * 1994-10-26 1996-05-17 Nec Corp 文字抽出装置及び該装置を用いた文字認識装置

Similar Documents

Publication Publication Date Title
US5222158A (en) Pattern recognition apparatus
JP2007148677A (ja) 画像処理装置、画像処理方法
CN110796016A (zh) 工程图纸识别方法、电子设备及相关产品
KR100396357B1 (ko) 윤곽을 따르는 트래커를 자동적으로 결정하기 위한 방법및 그 방법을 실시하는 프로그램을 기억한 기억 매체
CN112973122A (zh) 游戏角色上妆方法、装置及电子设备
JPH047792A (ja) 文字抽出装置及び方法
CN114139496A (zh) 字体处理方法、电子设备及相关产品
JPH05225394A (ja) 文字認識システムの候補文字分類方法
JP3368511B2 (ja) 連結領域の抽出装置及び方法
JP2788804B2 (ja) 素子領域抽出方法
JPH0589190A (ja) 図面情報のチエツク方式
US20230169708A1 (en) Image and video matting
JP2803736B2 (ja) 文字認識方式
JPH07121710A (ja) 画像セグメンテーション方法及び装置
JPH11187231A (ja) 画像検索装置及び画像検索方法
JP3078038B2 (ja) 図面自動入力システム及びその方法
JP2817845B2 (ja) 図形処理装置及び方法
JP2002280800A (ja) 変換テーブルの生成方法
JP2867650B2 (ja) シンボル候補領域の検出方法
JP2001126055A (ja) 棚割り用トリミング画像作成装置
CN118247806A (zh) 数据处理方法、重识别方法、装置及电子设备
JPH043274A (ja) ベクトル本数低減処理方式
JPS6019549B2 (ja) 図形照合装置
CN117853728A (zh) 违规主体检测方法、装置、电子设备及存储介质
CN115797615A (zh) 目标对象的检测区域确定方法、装置、设备和存储介质