JP3435193B2 - 文字列の切り出し方法 - Google Patents

文字列の切り出し方法

Info

Publication number
JP3435193B2
JP3435193B2 JP23935193A JP23935193A JP3435193B2 JP 3435193 B2 JP3435193 B2 JP 3435193B2 JP 23935193 A JP23935193 A JP 23935193A JP 23935193 A JP23935193 A JP 23935193A JP 3435193 B2 JP3435193 B2 JP 3435193B2
Authority
JP
Japan
Prior art keywords
character string
character
image
knowledge
inference
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP23935193A
Other languages
English (en)
Other versions
JPH0793475A (ja
Inventor
茂 嶋田
好則 高原
徹三 今川
裕之 末永
幸治 富田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Kyushu Electric Power Co Inc
Hitachi Ltd
Original Assignee
Kyushu Electric Power Co Inc
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kyushu Electric Power Co Inc, Hitachi Ltd filed Critical Kyushu Electric Power Co Inc
Priority to JP23935193A priority Critical patent/JP3435193B2/ja
Publication of JPH0793475A publication Critical patent/JPH0793475A/ja
Application granted granted Critical
Publication of JP3435193B2 publication Critical patent/JP3435193B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は地図・図面中に書かれた
文字列の切り出し技術に係わり、特に文字が他の要素に
接触している場合に有効な文字列成分の切り出し方法に
関する。
【0002】
【従来の技術】地図・図面には、多様な記号又は図形要
素が混在して記述されており、抽出対象とする文字列成
分とその他の要素間の画像パターンの特徴の差は類似し
ている。従って地図・図面画像から切り出しの対象とす
る文字列の位置は、あらかじめ予測できない上に、文字
列成分の一部がかすれ等により欠落したり、他の要素と
の接触が起こる等の理由により、抽出の目標とする文字
列を完全に抽出するのは、極めて難しい問題となってい
る。
【0003】まず既に開発されている各種の自動入力シ
ステムで使われている文字列の切り出し方法の概要につ
いてまとめる。既に発表されている各種の自動入力シス
テムの中で代表的なものに着目すると、次のような2つ
の方式に分類することができる。即ち、形状認識を行う
前に全画像をベクトル情報に変換するベクトル化前処理
型認識方式と、データベース化に必要な要素を抽出して
層別の画像として分離する画像分離型認識方式の2つで
ある。このうちベクトル化前処理型認識方式の多くは、
細線化と連結判定アルゴリズムを基本にしているため、
ベクトル化した後の結果は、微少な角部がつぶれたり平
行部が斜めになるなど、形状が歪む場合が多い。しかも
この場合の文字列成分の切り出しのための判定基準は、
文字列を構成する各ベクトルの外接長方形の大きさを判
断する程度しかない。従って、文字列成分の範囲を自動
的に推定することは極めて難しい。一方画像分離型認識
方式の場合には各画像要素の持つ特徴に着目し、同一の
特徴を持った画像位置に同一の番号を付与するような画
像のラベリングの処理を基本にしている。従って認識対
象とする画像には、ベクトル化による形状変型等は含ま
れないため、高い精度の要素別認識が期待される。従っ
て文字列の切り出しに関してはベクトル化の形状歪みが
混入する問題はなくなる。しかし文字成分が他の要素に
接触する場合には、その文字成分が接触した要素へ混入
して分離される問題が残る。
【0004】
【発明が解決しようとする課題】本発明は、地図・図面
画像から文字列成分を自動的に分離する技術に係わり、
上記のようなベクトル化前処理型方式を用いた場合に発
生する形状歪みにより、文字列切り出し範囲が明確にな
らない問題や、画像分離型認識方式を用いた場合に、接
触文字成分が他の要素の一部として分離され、文字列切
り出し精度が向上しない問題を解決可能な高い精度の文
字列成分の切り出し方式を課題とする。
【0005】
【課題を解決するための手段】上記課題を達成するため
に、地図・図面情報の認識方式には地図・図面やドキュ
メント等の画像から独立した文字列画像成分を切り出
し、確実に分離された文字列から文字配置に関する知識
を獲得し、その知識に基づき接触文字成分の位置と範囲
とを推測して切り出し、更にその推測して切り出した範
囲内に存在するノイズ成分を除去することにより、文字
列切り出しの精度を向上させるものである。
【0006】
【作用】このような文字列知識に基づく予測切り出しに
よって、文字以外の要素との接触により切り出しが難し
かった文字成分の切り出しが可能となるため、全体の文
字列の切り出し精度が向上する。
【0007】
【実施例】以下本発明の一実施例における文字列の切り
出し方法の全体の構成について説明する。図1はその全
体の処理の構成を示すブロック図である。この図1にお
いて、100は文字列の切り出しの対象とする地図・図面
の画像ファイルで、スキャナやテレビカメラ等で光電変
換され、計算機の画像信号に変えられファイルに記憶さ
れたものであれば何でも良い。101は地図図面画像ファ
イルから文字列や家枠等の要素別候補画像及びその残り
の背景候補画像ファイルへと分離するための画像分離
部、102は文字列の候補画像を格納するためのファイ
ル、103は家枠や道路などの要素別の候補画像とその残
りの背景候補画像を格納するためのファイル、104は102
の文字列候補画像ファイルから文字列の寸法やレイアウ
ト情報を構造化させた知識として獲得する処理部、105
は104により獲得された文字列のフォントや配置に関す
る知識、106は103の要素別候補画像ファイルから再度文
字領域を探索するための処理部、107は105の文字列に関
する知識と106の探索によって得られた文字の存在方向
とを使って、切り出しが不成功の文字を推論して再度切
り出すための処理部、108は再度切り出された文字領域
からノイズ成分を除去するためのノイズ除去部、109は1
07により再度切り出された文字成分だけを、103の要素
別候補画像から消去するためのファイル調整部、110は1
03の要素別候補画像から再度切り出された文字を、102
の文字列候補ファイルへ追加合成するための処理部、11
1は上記処理過程により最終的に得られた文字列の画像
ファイル、112は文字列が完全に切り出された要素別画
像ファイルをそれぞれ示す。
【0008】以上のように構成された本実施例の文字列
の切り出し方法の処理の流れについて、以下図2に示す
ような画像例を用いて説明する。本来地図・図面内に描
かれる文字・記号成分は、他の家枠や道路等の大型の要
素とは独立して描かれることが多い。しかし図2(a)に
示されるように、両者が接近した部分はスキャナを用い
た光電変換時に発生するディジタル誤差により接触する
ことが多い。そこで文字列切り出しの1つの方法とし
て、柴山他、電気学会論文誌C 第112巻 1号 平
成4年 pp.27〜35、「プラント系統図面の自動入力方
式」に示されるように、連続した画像成分の高さと幅
(多くの場合はその外接長方形)を計測し、その値が文字
列をなす一定の範囲内にある成分を文字列候補画像とし
て分離する場合が多い。従って図2(a)に示されるよう
な文字列と他の要素とが接触する部分では、101の文字
列の切り出し処理によって接触した文字成分は他の要素
の成分として分離されるため、図2(b)に示されるよう
に、文字列の一部が欠落した状態で抽出される。そこで
107の文字領域の推論切り出し処理によって上記欠落し
た文字成分の存在位置と領域を推論し、図2(c)に示す
ように、推論位置を中心に、多少大きめの範囲の画像を
強制的に切り出す。この107の推論切り出し処理によっ
て、切り出された文字領域には図2(c)に示すように、
本来の文字成分以外に周囲にノイズ成分が付着するた
め、文字認識率が低下する。そこで図2(d)に示される
本来の文字列が備える文字の大きさまで切り出された領
域を縮小していった場合に、その領域内に含まれるノイ
ズ成分を順に除去し、最終的な文字列画像(図2(d))を
得る。
【0009】以下図1の各処理部の詳細な内容について
順に説明する。まず101の画像分離部では、100の地図・
図面の画像ファイルを対象にして文字や家枠・道路など
の各要素の特徴別に画像を分離して、文字列は102の文
字列候補ファイルへ、文字列以外の家枠・道路などの要
素は103の要素別候補画像ファイルへそれぞれ出力し格
納する。この画像分離の方法は、分離の目標とする要素
別の候補画像の数と、その要素に含まれる要素の特徴に
処理内容が大きく依存する。従って分離処理全体を覆う
処理内容の一般化は難しい。そこで本発明の対象とする
文字列成分の分離方式について説明する。地図・図面内
に記述される文字成分の種類は多様であり、地図内の文
字としては、地名・世帯主名・道路名などの活字の漢字
を用いて記述される場合が多い。一方設備図などの図面
には、設備・番号・属性値等が手書きの英数字を用いて
記述されることが多い。しかし文字列画像として分離す
る観点からみると、分離アルゴリズムは一般化が可能で
ある。即ち文字列成分は多くの場合、独立した一定の大
きさを持った塊状の特徴を持っており、画像の連結状態
を示すラベルが同一の値を持った黒画像成分が一定範囲
の大きさに分布している。従ってこのような特徴を用い
ることにより、文字列と他の線状の大型の要素とを容易
に区別することが可能である。そこでこの画像の特徴を
用いた文字列成分の分離アルゴリズムをまとめると、図
3のような処理の流れとなる。まず最初に画像内の全て
の黒画像に対して、4又は8連結をなす成分に同一の値
を与えるような、いわゆるラベリング処理を施す(ステッフ゜
301)。次にこの処理によって得られた全てのラベル値に
対し、各同一のラベル値を有する画像を対象に、連結黒
画像成分の外接長方形を計算する(ステッフ゜302)。この各外
接長方形の大きさを測定し、それが一定値以下の値をな
すかを判定する(ステッフ゜303)。上記外接長方形の大きさの
判定の結果、一定値以下の場合にはその外接長方形内部
の黒画像を切り出し、その結果を文字候補画像ファイル
に追加登録する(ステッフ゜304)。このようにして抽出された
文字列候補画像ファイル内の全ての要素に対して、互い
に隣接する外接長方形のグループを探索し、それらをマ
ージして文字列としての外接長方形及び文字列画像を求
める(ステッフ゜305)。 次に106の文字領域の探索部で行う処理内容について説
明する。既に述べたように、家枠や道路等の大型要素に
接触した文字成分は、103の要素別候補画像の一部とし
て分離される。そこでこの文字領域の探索部では、この
要素別候補画像ファイル103を対象にして、その中に存
在する文字成分の存在領域の探索を目標とする。この文
字領域の探索を行うための基本基本原理としては、次の
ような特性を用いる。即ち一般に、文字成分は他の家枠
や道路をなす要素に比べ、連結画像の特徴が3分岐点や
4分岐点などの高次の特徴位置が一定範囲内に集積して
いる傾向にある。ただしこの連結画像の特徴は、宮武
他、昭和63年電子情報通信学会春期全国大会予稿D−
237,238、「図面処理用高速ラスタベクタ変換手
法(1) ランレングス直接処理による細線化」、「図
面処理用高速ラスタベクタ変換手法(2) ランレング
ス直接処理による追跡」に示される方法などで計算可能
であるため、本実施例では説明を省略する。この文字領
域の探索アルゴリズムをまとめると、図4のような処理
の流れとなる。この段階での処理は、次段における107
の文字領域の推論切り出し部に対して、新たな文字領域
の存在可能性を示すための指標を与えることを目的と
し、文字領域としての切り出しは行わない。そしてこの
指標の計算方法としては、特徴点の複雑さ(即ち、端点:
1,屈曲点:2,3分岐点:3,4分岐点:4 等)を与えることを基
本とし、これに特徴点の集積度合いを加える。最初に10
2の文字候補ファイルの全ての要素について、文字列の
外接長方形を中心とした隣接位置に拡大領域を設定する
(ステップ401)。次に103の要素別候補画像ファイル内の
全ての要素について、上記拡大領域内に属する連結画像
に対して特徴量を計算する(ステップ402)。そしてこの
拡大領域内部に特徴点が存在するかどうかを判定し(ス
テップ404)、存在する場合には文字領域の存在確信度と
して、その特徴点の位置と特徴量(既に述べたように、
端点:1、屈曲点:2、3分岐点:3、4分岐点:4)の値をそれぞれ
記憶する(ステップ404)。この文字領域存在確信度に登
録されている全ての要素に対して順に特徴点位置に着目
し、その位置と他の特徴点位置との距離を計算する(ス
テップ405)。そしてその特徴点間の距離が一定値以下と
なるかどうかを判定し(ステップ406)、一定値以下の場
合には、文字領域の確信度が高いと判定するために、得
られている特徴量の値に一定値を加える。
【0010】次に104の文字列知識の獲得部で行う処理
内容について説明する。既に101の画像分離部で切り出
され、102の文字列の候補画像ファイルに格納されてい
る文字成分は、塊状要素の外接長方形を求めるといった
比較的単純な特徴量に基づく処理によって切り出された
画像であるため、文字列としての確信度が高いと考える
ことができる。そこでこの文字列がどのようなサイズの
文字がどの程度の間隔でどのようにレイアウトされてで
きたものかといったパラメータ値を文字列に関する知識
として獲得する方法について説明する。この文字列に関
する知識は、地図・図面の用途別に決定されるものであ
り、本発明による文字列の切り出し方式を適用する地図
・図面の種類に依存する。本発明ではこの知識をルール
ベースにより記述した実施例について図5を用いて説明
する。図5(a)は、文字列の展開方向に関する知識につ
いて説明したもので、外接長方形内に存在する独立した
成分の数を示すTNが1以上で、文字列の列数の予想値HN
が行数の予想値VNより大きい場合には、展開方向が横方
向である可能性が高く、その確信度はHNとVNとの差の値
に応じて高くなることを示している。一方図5(b)は、
横書き文字列に関する知識、及び図5(c)は縦書き文字
列に関する知識についてそれぞれ説明したもので、各文
字列の展開方向へ文字を配置する場合の文字間の距離(c
bw又はcbh)を規定するための規則を示したものである。
この場合推論のための確信度は、文字列の寸法(lh又はl
w)があらかじめ記憶された文字フォント系列の大きさ(c
hiまたはcwj)との差(α、β)が小さくなる程高くなるこ
とを示している。
【0011】一方図6は文字列が複数行をなす場合に、
それらの行がどのように配置されているかを規定するた
めのルールで、複数行の各先頭文字の位置と行数位置に
関するパラメータとの間の関係をルール表現したものを
示す。特に図6に示した場合は、複数行の文字列が横方
向に展開される場合に考えうるレイアウト形式に関する
知識を示したものである。図6(a)は、文字列の左端の
座標値(lwixs;i=1〜n)が一定の許容値(δ)以下にある場
合を示し、この条件が満足される場合にはレイアウトル
ールの判定値layoutは左揃えとなる。又図6(b)は文字
列の右端の座標値(lwjxe;j=1〜m)が一定の許容値(δ)以
下にある場合を示し、この条件が満足される場合にはレ
イアウトルールの判定値layoutは右揃えとなる。そして
これら両者の推論の確信度は、左揃え・右揃えいずれの
場合も許容値δの値が小さくなるほど確信度が高くなる
ことを示している。一方図6(c)は文字列の左右両端に
着目し、その着目行と上位の行における左右両端の座標
値の差( (lwi+1xs-lwixs)- (lwixe-lwi+1xe) )が一定の
許容値(ε)以下にある場合を示し、この条件が満足され
る場合には、レイアウトルールの判定値layoutは中央揃
えとなる。そしてこの場合の推論の確信度は許容値(ε)
の値が小さくなるほど確信度が高くなる。更に図6(d)
は文字列の各行の高さに着目し、各行の左端の字下げ量
(lwi+1xs-lwixs)と左端の字のはみ出し量(lwi+1xe-lwix
e)との差が許容値(φ)以下にある場合を示し、この条件
が満足される場合には、レイアウトルールの判定値layo
utはインデントとなる。そしてこの場合の推論の確信度
は許容値(φ)の値が小さくなるほど確信度が高くなる。
そしてこれらの文字列に関する知識は、文字列が図7に
示されるように、地図・図面のX,Y座標軸と傾いている場
合も、座標変換により正置座標系に対応させ、同様に適
用できるものとする。
【0012】以上の文字列知識の形式として、ルールベ
ースを用いた場合の具体例について示した。そこでこの
104の文字列知識の獲得部の処理内容としては、各ルー
ルベースで使用する長さの許容値に関する具体的な値
を、101の画像分離部により抽出された文字列の候補フ
ァイル(104)の解析から求め、文字列知識(105)として記
憶することにある。具体的な処理の流れは図8に示すよ
うに、102の文字列の候補ファイルに格納された文字列
の候補画像の全ての要素に対し、更にあらかじめ登録さ
れている全ての文字フォント系列に対して、外接長方形
の寸法から文字列の文字数VN,HNを計算する(Step800)。
そしてこれを文字列の展開方向に関するルールに適用し
て、文字列の展開方向dirを求める(Step801)。各dirの
値に従い、方向別に文字列に関する許容値パラメータを
求める(Step803)。そして、許容値からルール適用の確
信度を計算し(Step804)、その確信度の値が一定値以上
のルールを抽出し、文字列の展開方向に関するルール群
へ登録する(Step805)。次にこの文字列の展開方向に関
するルール群に登録されたルール全体に対して、各dir
の値で規定された方向の文字列のレイアウトに関するル
ールを適用する(Step806)。そして各ルールの適用の結
果得られる許容値パラメータの値を獲得し(Step807)、
このパラメータを用いたルール適用確信度の計算を行う
(Step808)。そして最後に得られた確信度が一定値以上
のルールを抽出し、105の文字列知識ベースへ登録す
る。
【0013】次に107の文字領域の推論切り出し部の処
理内容について説明する。この段階で得られているの
は、102の文字列の候補画像ファイルから獲得した文字
列知識(105)と、文字列以外の要素として分離された要
素別候補画像ファイルから文字領域の探索部(106)によ
って抽出された文字領域候補である。従って文字領域の
推論切り出し部では、この文字領域候補の存在する方向
が、105の文字列知識の適用によって、推論可能な方向
と矛盾しないかどうかの判定を行い、矛盾しない場合に
は、その文字列領域候補として示される方向の領域を切
り出す処理を行う。その場合既に図2で示したように、
文字領域の推論精度を向上させるため、文字列知識から
推論される領域より許容値(σ)だけより大きな範囲を切
り出す。そしてこの結果を推論文字領域として記憶す
る。この推論方法は、安信他、昭和63年度人工知能学
会全国大会予稿、pp.6-27「検索型エキスパートシステ
ムとその基本構造に関する一考察」で示されるようなル
ールに基づく前向き推論を用いればよく、推論方向は各
ルールに付随する確信度の値に従って制御される。そし
てこの107の文字領域の推論切り出し処理によって切り
出される文字列候補の画像は、図2(c)に示すように文
字の周辺に、文字以外のノイズ成分が付着する。そこで
108の文字領域のノイズ除去部では、図9に示すような
処理の流れに従ったノイズ除去処理を行う。まず推論切
り出しを行った画像の細線化及び特徴点抽出処理を行う
(Step900)。そしてこの切り出し画像を囲む外接枠(S0,S
1,S2,S3,S0)と、推論時に用いたフォントの大きさの寸
法を有する上記外接枠と相似形のリミッタ枠(SL0,SL1,S
L2,SL3,SL0)を設定する。そしてこの外接枠と接触する
黒画像成分を対象に、リミッタ枠まで白画像に変える(S
tep901)。そして更にこのリミッタ枠に接触する画像成
分を対象に、その延長上に存在する端点又は3分岐点以
上の特徴点までを白画像に変える(Step902)。そして得
られた細線化画像を一定の値だけ太らせ、最初の段階で
処理対象とした切り出し画像とのAND演算を行い、最終
的な文字列の切り出し結果を得る(Step903)。
【0014】この段階において、文字列以外の要素とし
て画像分離された要素別の候補画像ファイル(103)か
ら、文字領域の推論切り出しと、文字領域のノイズ除去
により、新たな文字列が切り出されたことになる。そこ
で109のファイル超西部では、この新たに切り出された
文字列画像成分を103の要素別候補画像ファイルから消
去し、純粋の要素別画像ファイルとなるように調整す
る。一方新たに切り出された文字列の画像は、102の文
字列の候補ファイルの内容へ追加合成し、最終的な文字
列の画像ファイル(111)を作成する。
【0015】以上109のファイル調整部と110のファイル
合成部で行われる具体的な処理内容は、UNIX システム
ラボラトリーズ社のUNIX,マイクロソフト社のMS-DOS等
の処理計算機の基本的なファイル管理システムにより実
行可能な通常のファイル処理内容なので、詳細は省略す
る。
【0016】
【発明の効果】以上の文字列の切り出し方式により、従
来は建物や道路などの別の要素として切り出されていた
文字成分が、本来の文字列の一部として切り出し可能と
なるため、文字列の認識率が格段に向上することにな
る。これによって地図・図面情報のコンピュータへの入
力のためのコストが大幅に低減する。
【図面の簡単な説明】
【図1】全体の処理の構成を示すブロック図。
【図2】文字列切り出し処理の流れを示すための例図。
【図3】文字列成分の分離アルゴリズム。
【図4】文字領域の探索アルゴリズム。
【図5】文字列の展開に関する知識。
【図6】複数文字列のレイアウト知識。
【図7】斜めに配置された文字列のレイアウト状況を示
す図。
【図8】文字列知識の獲得部の処理の流れを示す図。
【図9】ノイズ除去処理の流れを示すための例図。
【符号の説明】
100…地図・図面画像ファイル、101…画像分離部、102
…文字列の候補ファイル、103…要素別候補画像ファイ
ル、104…文字列知識の獲得部、105…文字列知識をルー
ルベースとして記憶する部分、106…文字領域の探索
部、107…文字領域の推論切り出し部、108…文字領域の
ノイズ除去部、109…ファイル調整部、110…ファイル合
成部。111…文字列の画像ファイル、112…要素別画像フ
ァイル。
───────────────────────────────────────────────────── フロントページの続き (72)発明者 高原 好則 神奈川県川崎市幸区鹿島田890番地の12 株式会社日立製作所情報システム事業 部内 (72)発明者 今川 徹三 東京都千代田区神田駿河台四丁目6番地 株式会社日立製作所内 (72)発明者 末永 裕之 福岡県福岡市中央区渡辺通2丁目1番82 号 九州電力株式会社内 (72)発明者 富田 幸治 福岡県福岡市中央区渡辺通2丁目1番82 号 九州電力株式会社内 (56)参考文献 特開 平3−282895(JP,A) 特開 平3−268181(JP,A) 特開 平1−271891(JP,A) 特開 昭55−127678(JP,A) (58)調査した分野(Int.Cl.7,DB名) G06K 9/00 - 9/76

Claims (4)

    (57)【特許請求の範囲】
  1. 【請求項1】地図・図面やドキュメント等の画像から独
    立した文字列画像成分を切り出すステップと、切り出さ
    れた上記文字列画像成分から、その文字列を構成する各
    文字の平均的な大きさと各文字の間隔、及び該文字列の
    並びに関する情報を測定するステップと、前記測定され
    た情報を予め登録された規則に適用して確信度を算出す
    るステップと、該確信度を付随させた上記規則を文字列
    知識として記憶するステップとを有し、 上記画像中に上記文字列知識に基づいた推論に矛盾しな
    い位置に文字候補を示す特徴量が存在する場合には、
    記文字列知識に従った展開方向に上記文字列の規定する
    領域よりも大きい領域をその文字候補を上記画像から抽
    出することを特徴とする文字列の切り出し方法。
  2. 【請求項2】請求項1記載の文字列切り出し方法におい
    て、 上記推論には、上記確信度に従って制御される前向き推
    論を採用することを特徴とする文字列の切り出し方法。
  3. 【請求項3】請求項1又は2に記載の文字列切り出し方
    法において、上記抽出した文字候補の範囲内に含まれる
    文字以外のノイズ成分を消去することを特徴とする文字
    列の切り出し方法。
  4. 【請求項4】請求項3記載の文字列切り出し方法におい
    て、上記範囲内に含まれる文字以外のノイズ成分を消去
    する方法として、上記範囲の外接枠に接触する黒画像の
    連結成分をたどり、上記知識に基づく文字サイズの矩形
    に連結する成分だけをノイズとして消去することを特徴
    とする文字列の切り出し方法。
JP23935193A 1993-09-27 1993-09-27 文字列の切り出し方法 Expired - Lifetime JP3435193B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP23935193A JP3435193B2 (ja) 1993-09-27 1993-09-27 文字列の切り出し方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP23935193A JP3435193B2 (ja) 1993-09-27 1993-09-27 文字列の切り出し方法

Publications (2)

Publication Number Publication Date
JPH0793475A JPH0793475A (ja) 1995-04-07
JP3435193B2 true JP3435193B2 (ja) 2003-08-11

Family

ID=17043460

Family Applications (1)

Application Number Title Priority Date Filing Date
JP23935193A Expired - Lifetime JP3435193B2 (ja) 1993-09-27 1993-09-27 文字列の切り出し方法

Country Status (1)

Country Link
JP (1) JP3435193B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7290506B2 (ja) * 2019-08-06 2023-06-13 矢崎エナジーシステム株式会社 特定文字列検知装置及び運転評価システム

Also Published As

Publication number Publication date
JPH0793475A (ja) 1995-04-07

Similar Documents

Publication Publication Date Title
EP1457917B1 (en) Apparatus and methods for converting network drawings from raster format to vector format
US6754385B2 (en) Ruled line extracting apparatus for extracting ruled line from normal document image and method thereof
US5465304A (en) Segmentation of text, picture and lines of a document image
JP2667435B2 (ja) 領域抽出方法
US5987173A (en) Interactive drawing recognition processing method and apparatus thereof
US20110043869A1 (en) Information processing system, its method and program
US7529407B2 (en) Segmenting an image via shortest cycles
US7570811B2 (en) Segmenting an image via a graph
JP2926066B2 (ja) 表認識装置
JP3435193B2 (ja) 文字列の切り出し方法
JPH06214983A (ja) 文書画像の論理構造化文書への変換方法および装置
US7336825B2 (en) Segmenting a composite image via minimum areas
Tofani et al. Segmentation of text from color map images
Ablameyko et al. A complete system for interpretation of color maps
Ablameyko et al. Interpretation of colour maps. A combination of automatic and interactive techniques
JPH03142691A (ja) 表形式文書認識方式
EP1439485B1 (en) Segmenting a composite image via basic rectangles
Olivier et al. Segmentation of complex documents multilevel images: a robust and fast text bodies-headers detection and extraction scheme
JPH0452783A (ja) 図面読取装置
JPH04260980A (ja) 図形認識装置
JP3668560B2 (ja) 線図形の認識方法および認識装置
Ablameyko et al. Knowledge based technique for map-drawing interpretation
EP1439484B1 (en) Segmenting an image via shortest cycles
JP2974167B2 (ja) 文字の大分類認識方法
KR100245337B1 (ko) 거리 영상 파일 분류 및 검색 방법 및 장치

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080530

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080530

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090530

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100530

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110530

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110530

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120530

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120530

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130530

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130530

Year of fee payment: 10

EXPY Cancellation because of completion of term