JPH07230526A - 文字読取装置 - Google Patents

文字読取装置

Info

Publication number
JPH07230526A
JPH07230526A JP6020359A JP2035994A JPH07230526A JP H07230526 A JPH07230526 A JP H07230526A JP 6020359 A JP6020359 A JP 6020359A JP 2035994 A JP2035994 A JP 2035994A JP H07230526 A JPH07230526 A JP H07230526A
Authority
JP
Japan
Prior art keywords
character
character string
recognition
straight line
point
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP6020359A
Other languages
English (en)
Other versions
JP3442847B2 (ja
Inventor
Yuzo Maruta
裕三 丸田
Hideo Kawamura
秀男 川村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Priority to JP02035994A priority Critical patent/JP3442847B2/ja
Publication of JPH07230526A publication Critical patent/JPH07230526A/ja
Application granted granted Critical
Publication of JP3442847B2 publication Critical patent/JP3442847B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Abstract

(57)【要約】 【目的】 図形・線分・記号・文字が混在する図面か
ら、簡単な操作で、所望とする文字列をコード化する。 【構成】 所望の文字列の内部または近傍を1点で指定
する座標指示手段と、指定された1点を内部に含むまた
は指定された1点の近傍にある文字列を検出する文字列
切り出し手段を設けた。 【効果】 簡単な操作で、複雑な図面からでも誤りがな
く、所望の文字列をコード化できる。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、図形・直線・記号・文
字が混在する図面・地図から、所望の文字を抽出して認
識し、文字コードに変換する文字読取装置に関わるもの
である。
【0002】
【従来の技術】手書き、またはテンプレートで書かれた
図面から文字を読み取るには、図面の2値画像の全範囲
から図形・直線などの情報を用いて個々の文字を抽出
し、認識する方法が行われている。図30は特開平3−
34081に開示されている従来の図面内の文字読取装
置を示すブロック図である。図において、501は輪郭
ベクトル化処理部、502はヒストグラム作成部、50
3は文字列抽出部、504は文字切り出し部、505は
文字認識部である。
【0003】次に動作を説明する。文字・線分・シンボ
ルが混在する図面を読み込み、読み込んだ2値化画素デ
ータに基づいて、輪郭ベクトル化処理部501は、互い
に隣接した2値の黒画素を結ぶベクトルを結合して成る
輪郭ベクトルのデータを求めるとともに、輪郭ベクトル
に外接する外接四角形データを文字候補として求める。
次にヒストグラム作成部502は、文字候補の外接四角
形を対象に、水平、垂直、斜めの各方向に関する1次元
ヒストグラムを求める。次に文字列抽出部503は、前
記ヒストグラムデータに基づいて文字列を抽出する。次
に文字切り出し部504は文字列から個々の文字を切り
出し、文字認識部505は個々の文字について文字認識
を行う。
【0004】しかしながら、図面に書かれている文字を
文字コードに変換したいという要求は、必ずしも図面上
の全範囲にわたるものとは限っていない。例えば、ある
特定の文字列についてだけ文字コードに変換したいとい
う要求がある。
【0005】ところが、従来の図面内の文字読取装置は
このような要求に対し図面の全範囲について認識を行っ
てしまうため、処理時間がかかり、また所望の文字はど
れか同定するのが面倒であった。
【0006】また、他の従来方式として、2値画像から
座標指示手段を用いて読み取りたい文字列の範囲を指定
して、その範囲内の文字を文字コードに変換する方式が
ある。図31(a)は、特開昭61−206087に開
示された従来の文書読取装置のブロック図である。図に
おいて、601は文字を含むイメージ情報が描かれてい
る用紙、602は用紙上のイメージ情報を読み取る走査
手段、605は文字認識手段、608はページ記憶手
段、609は表示手段、610は入力手段、611は制
御手段、612は文字切り出し手段である。また、図3
1(b)は従来の文書読取装置の動作を説明する説明図
である。
【0007】次に動作を説明する。用紙601を走査手
段602により走査し、用紙上のイメージ情報はページ
記憶手段608によって記憶される。また、同時にその
イメージ情報は表示手段609により表示される。使用
者は、入力手段610を使用して読取範囲を指定すれば
(図24(b)の616と617で示されるx印)、そ
の範囲内のイメージ情報から、文字切り出し手段612
により文字が切り出され、文字認識手段605により文
字が認識される。入力手段610としては、特開昭61
−206087ではキーボードによる左上点と右下点の
指定が実施例となっているが、マウスやペンのドラッグ
による指定でもよい。
【0008】しかし、上述した従来装置では、マウスま
たはペンなどでドラッグしながら、認識させたい文字列
の範囲を左上点と右下点の矩形などで設定するものであ
り、この設定が面倒であった。とくにディスプレイの画
面内文字の大きさが小さく密集している場合、この文字
列を囲む矩形の範囲設定を正確に行うことは困難であっ
た。
【0009】さらに、このような、マウスまたはペンな
どでドラッグしながら、認識範囲を設定して認識する方
法は、直線や記号などが含まれている場合には、本来直
線や記号が不要であっても一緒に認識してしまうという
問題があった。
【0010】
【発明が解決しようとする課題】本発明はこのような状
況を鑑みてなされたもので、図面や文書の特定の部分の
文字などをコードに変換したいときに、いちいち全面を
認識することなく、かつ、マウスまたはペンなどでドラ
ッグして文字列を含む認識範囲を設定するという面倒な
動作が不要な文字読取装置を提供することを目的とす
る。
【0011】本発明は、図面から、所望の文字列の文字
を認識してコード化したいとき、読み取りたい文字列の
パターンの内部または、その近傍の1点を指定するだけ
で不必要なシンボル、直線等を取り除いて所望の文字列
パターン抽出して認識処理をするとともに、認識結果を
検定することにより不必要な記号、不適切な文字を取り
除いて各文字をコード化するものである。
【0012】
【課題を解決するための手段】第1の発明に係わる文字
読取装置は、以下の要素を有するものである。 (a)文字を含むイメージ情報を取り込むイメージ取得
手段、(b)前記イメージ情報取得手段で取り込んだイ
メージ情報を表示するイメージ表示手段、(c)表示さ
れたイメージ情報上のコード化する文字の内部または、
近傍の1点を指示する座標指示手段、(d)前記座標指
示手段で指示された1点を内部に含む文字列、またはこ
の1点の近傍の文字列の領域を検出する文字列切り出し
手段、(e)前記文字列切り出し手段で検出した文字列
の領域をもとに、文字を切り出す文字切り出し手段、
(f)前記文字切り出し手段により切り出された文字パ
ターンを認識して、コード化する文字認識手段、(g)
認識した文字コードを出力装置へ出力する認識結果出力
手段。図面イメージ取得手段と、イメージ表示手段、座
標指示手段、文字列切り出し手段、文字切り出し手段、
文字認識手段を備えたものである。
【0013】第2の発明に係わる文字読取装置は、前記
文字列切り出し手段として、文字列の上端及び下端を決
定する文字列上下端決定手段を備えたものである。
【0014】第3の発明に係わる文字読取装置は、前記
文字列切り出し手段として、文字列の左端及び右端を決
定する文字列左右端決定手段とを備えたものである。
【0015】第4の発明に係わる文字読取装置は、前記
文字列上下端決定手段が以下の要素を有するものであ
る。 (a)前記座標指示手段で指定された1点を中心とし、
文字列と直交する方向に視野を広げた第1の切り出し範
囲矩形を設定する第1の切り出し範囲設定手段、(b)
この第1の切り出し範囲矩形内で、黒点の存在を検出
し、文字列の第1の上端候補点と第1の下端候補点を求
める黒点検出手段、(c)前記座標指示手段で指定され
た1点を中心とし、上端と下端はそれぞれ前記第1の上
端候補点と第1の下端候補点とし、文字列方向に視野を
広げた第2の切り出し範囲矩形を設定する第2の切り出
し範囲設定手段、(d)前記第2の切り出し範囲内で、
文字列方向と同方向の黒点のヒストグラムを生成する第
1のヒストグラム生成手段、(e)前記ヒストグラム生
成手段で生成したヒストグラムの立ち上がり変化点と立
ち下がり変化点を検出する第1のエッジ検出手段、
(f)前記立ち上がり変化点と立ち下がり変化点の組み
合わせにより、最適な組み合わせを決定する上下端組み
合わせ決定選択手段。
【0016】第5の発明に係わる文字読取装置は、前記
文字列左右端決定手段が、以下の要素を有するものであ
る。 (a)前記座標指示手段で指定された1点を中心とし、
文字列と直交する方向に視野を広げた第1の切り出し範
囲矩形を設定する第1の切り出し範囲設定手段、(b)
この第1の切り出し範囲矩形内で、黒点の存在を検出
し、文字列の第1の上端候補点と第1の下端候補点を求
める黒点検出手段、(c)前記座標指示手段で指定され
た1点を中心とし、上端と下端はそれぞれ前記第1の上
端候補点と第1の下端候補点とし、文字列方向に視野を
広げた第2の切り出し範囲矩形を設定する第2の切り出
し範囲設定手段、(d)前記第2の切り出し範囲内の上
下端を前記文字列上下端とした矩形範囲において、文字
列方向と垂直な方向に走査して得た黒点のヒストグラム
をとる第2のヒストグラム生成手段(e)ヒストグラム
の変化率があらかじめ設定したしきい値を越えるもっと
も左の位置と、ヒストグラムの変化率があらかじめ設定
したしきい値を越えるもっとも右の位置を検出する第2
のエッジ検出手段
【0017】第6の発明に係わる文字読取装置は、あら
かじめ登録された認識対象外のシンボルを検出する手段
を設け、前記文字列切り出し手段で切り出された文字列
に認識対象外のシンボルが含まれている場合に、このシ
ンボルを検出し文字列切り出し結果の左右端を修正する
文字列左右端修正手段を設けたものである。
【0018】第7の発明に係わる文字読取装置は、あら
かじめ登録された認識対象外のシンボルを検出する手段
を設け、前記文字列切り出し手段で切り出された文字列
の途中に認識対象外のシンボルが含まれている場合に、
このシンボルを検出し文字列切り出し結果から除外する
手段を設けたものである。
【0019】第8の発明に係わる文字読取装置は、直線
を検出する直線検出手段を設け、前記文字列切り出し手
段で切り出された文字列に直線が含まれている場合に、
この直線検出手段により検出した直線を避けるように文
字列切り出しの左右端を修正する直線検出による文字列
左右端修正手段を設けたものである。
【0020】第9の発明に係わる文字読取装置は、直線
検出手段により検出した直線を消去する直線消去手段を
設け、この検出した直線部分を白画素で埋め込み、直線
を消去するようにしたものである。
【0021】第10の発明に係わる文字読取装置は、前
記文字認識手段により認識した認識結果を検定して、あ
らかじめに登録された認識対象外の記号を、前記認識結
果から除外する認識結果検定手段を設けたものである。
【0022】第11の発明に係わる文字読取装置は、前
記文字認識手段により認識した認識結果の類似度があら
かじめ定めた値以下のものは、前記認識結果から除外す
る認識結果検定手段を設けたものである。
【0023】第12の発明に係わる文字読取装置は、あ
らかじめ辞書に登録されている文字パターンの幅高さ比
と前記文字認識手段により認識した文字パターンの幅高
さ比が、あらかじめ定めた範囲に入らないものは、認識
結果から除外する認識結果検定手段を設けたものであ
る。
【0024】第13の発明に係わる文字読取装置は、文
字の外接矩形の幅と高さを測定する文字外接矩形検定手
段を設け、測定した幅または高さと検出した文字列の高
さの比が所定の範囲の値である文字のみ、認識処理を行
うようにしたものである。
【0025】
【作用】第1の発明における文字読取装置においては、
マウスやペンなどの座標指示手段により、認識したい文
字列の内部またはその近傍の座標の1点を指示する。文
字列切り出し手段は、座標指示手段によって指示された
1点を内部にもつ文字列または1点が近傍にある文字列
を検出する。文字切り出し手段は、検出された文字列か
ら、個々の文字を検出する。文字認識手段は、検出され
た個々の文字を認識して文字コードに変換する。認識結
果出力手段は文字コードを出力装置に出力する。
【0026】第2の発明における文字読取装置において
は、文字列の上端と下端を決定するための文字列上下端
決定手段を設けたことを特徴とする。
【0027】第3の発明における文字読取装置において
は、文字列の左端と右端を決定するための文字列左右端
決定手段を設けたことを特徴とする。
【0028】第4の発明における文字読取装置において
は、文字列の上下端を決定するために、第1の切り出し
範囲設定手段により、座標指示手段によって指示された
1点を中心として、文字列と直交する方向に視野を広げ
た第1の切り出し範囲を設定する。次に黒点検出手段に
より、第1の切り出し範囲内で、もっとも上方にある黒
点ともっとも下方にある黒点を検出する。第2の切り出
し範囲設定手段では、もっとも上方にある黒点の位置
と、もっとも下方にある黒点の位置をそれぞれ上端と下
端とし、文字列方向に視野を広げた第2の切り出し範囲
を設定する。第1のヒストグラム生成手段では、第2の
切り出し範囲設定内で、文字列と同方向のヒストグラム
を生成する。第1のエッジ検出手段では、ヒストグラム
の立ち上がり変化点と立ち下がり変化点を検出する。上
下端組み合わせ決定手段では、立ち上がり変化点と立ち
下がり変化点を組み合わせて、文字の高さにもっとも近
い間隔をもつ組み合わせを文字列の上端および下端とす
る。
【0029】第5の発明における文字読取装置において
は、第2ヒストグラム生成手段により前記第2の切り出
し範囲内の上下端を文字列の上下端とした矩形範囲で文
字列と方向と垂直方向に走査してヒストグラムを生成
し、このヒストグラムの変化率を第2のエッジ検出手段
により検出し、文字列の左端と右端を決定する。
【0030】第6の発明における文字読取装置において
は、文字列上のシンボルを検出するシンボル検出手段を
設け、文字列上の左端または、右端にシンボルを検出し
た場合には、文字列の左右端を修正する左右端修正手段
を設けたことを特徴とする。
【0031】第7の発明における文字読取装置において
は、文字列上のシンボルを検出するシンボル検出手段を
設け、文字列上の途中にシンボルを検出した場合には、
検出したシンボルを除外する手段を設けたことを特徴と
する。
【0032】第8の発明における文字読取装置において
は、直線を検出する直線検出手段を設け、文字列上に直
線を検出した場合には、文字列の左右端を修正する文字
列修正手段を設けたことを特徴とする。
【0033】第9の発明における文字読取装置において
は、直線検出手段により検出した直線部分を白画素で埋
め込むことにより直線を消去する直線消去手段を設けた
ことを特徴とする。
【0034】第10の発明における文字読取装置におい
ては、文字認識手段の認識結果に認識対象外の記号が含
まれている場合には、この記号を除外する認識結果検定
手段を設けたことを特徴とする。
【0035】第11の発明における文字読取装置におい
ては、文字認識手段の認識結果の類似度を検定し、類似
度が所定の値以下のものは、認識結果から除外する認識
結果検定手段を設けたことを特徴とする。
【0036】第12の発明における文字読取装置におい
ては、文字コードの幅高さ比をあらかじめ認識辞書に登
録しておいて、前記文字認識手段により認識した結果、
認識結果文字コードとその幅高さ比が、認識辞書に登録
された幅高さ比との相違があらかじめ定めた範囲内に入
らないものは、前記認識結果から除外する認識結果検定
手段を設けたことを特徴とする。
【0037】第13の発明における文字読取装置におい
ては、文字切り出し手段で切り出された文字の外接矩形
の幅と高さを文字外接矩形検定手段で測定し、測定した
幅または高さと検出した文字列の高さの比が所定の範囲
の値である文字のみ、認識処理を行う。
【0038】
【実施例】
実施例1.以下、この発明の実施例を図を用いて説明す
る。図1は本発明の文字読取装置の構成を示すブロック
図である。図1において、1は図面イメージ、2は図面
イメージ1を取り込む図面イメージ取得手段、3は取り
込んだ図面イメージ1を表示画面に表示するイメージ表
示手段、4はコード化する文字列を指示する座標指示手
段、5は文字列を切り出す文字列切り出し手段、6は文
字パターンを切り出す文字切り出し手段、7は文字パタ
ーンを文字コードに変換する文字認識手段、8は文字コ
ードを出力装置に出力する認識結果出力手段である。ま
た図2〜図4は動作を説明するための図である。図にお
いて、100は図面イメージ1上の汚れ等により発生し
たゴミ(ノイズ)であり、101(x印)は座標指示手
段4で指示した指定座標である。
【0039】次に図1〜図4を用いて動作を説明する。
図面イメージ取得手段2は、図面イメージ1をイメージ
スキャナ等の既存技術を用いて取得し、イメージ表示手
段3に表示する(図2(a))。次に、作業者は表示さ
れた図面イメージ1から、所望の文字列(この場合は3
138)を座標指示手段4により1点(図2(b)の1
01)を指示する。座標指示手段4は具体的には、マウ
スやペンなどによる既知の技術で容易に構成できる。
【0040】次に文字列切り出し手段5は、図3(a)
に示すように座標指示手段4により指示された1点(1
01)を内部に含む文字列を検出する。もし、図4
(a)に示すように座標指示手段4によって指示された
1点を内部に含む文字列がない場合には、図4(b)に
示すように、指示された1点の近傍の文字列を検出す
る。
【0041】次に文字切り出し手段6は、切り出された
文字列から、各文字列のイメージを検出する(図3
(b))。文字切り出し手段6は、既存の技術であり例
えば、図5のように構成できる。図5において、901
は、周辺分布作成手段であり、902は切り出し位置決
定手段である。以下、文字切り出し手段6の動作につい
て説明する。周辺分布作成手段901は、切り出された
文字列イメージを、文字列と直交する方向に走査し、黒
点(黒画素)の数を計数して、周辺分布を作成する。こ
の周辺分布をもとに、切り出し位置決定手段902は、
周辺分布が所定のしきい値を越える領域の連続性に基づ
いて文字領域の開始点と終了点を検出する。以上の動作
により、文字を切り出すことができる(図6(a)〜
(c))。
【0042】次に、文字認識手段7は、各文字のイメー
ジを文字コードに変換する(図3(c)は、コード化さ
れた文字を表示した例である)。ここで、文字認識手段
7としては、例えば、「文字認識概論」(橋本新一郎編
著、オーム社、1982年)pp74〜pp95に示さ
れているような従来技術で容易に構成できる。図7は、
文字認識手段の構成図の例を示したものである。図にお
いて903は認識辞書であり、904はマッチング手段
である。次に、動作について説明する。認識辞書903
には、各々の文字の標準的なイメージの画素ベクトルが
格納されている。マッチング手段904では、文字切り
出し手段6によって切り出された認識対象文字のイメー
ジの画素ベクトルと辞書903に格納されている標準的
なイメージの画素ベクトルとから類似度を算出し、その
類似度の最大値を与える文字を認識結果として出力す
る。すなわち、認識対象文字のイメージの画素ベクトル
をX=(x1,x2,−−,xk)、辞書内の文字ci
の標準的なイメージの画素ベクトルをFci=(fc
1,fc2,−−−,fck)としたとき、類似度Sc
iは、 Sci=(X,Fci)/(|X|*|Fci|) で与えられる。ただし、(X,Fci) :XとFci
の内積 |X| :(X,X)なるノルム |Fci| :(Fci,Fci)なるノルムでこ
のうち、最大のSciを与える文字を認識結果とする。
【0043】次に、認識結果出力手段8は、認識した文
字コードを出力装置であるディスプレイ等の表示画面
(図示していない)などに出力する。なお、出力装置と
しては図面イメージを表示するイメージ表示手段であっ
てもよいし、ファイル等であってもよい。
【0044】次に、本発明の特徴である文字列切り出し
手段5の詳細な説明を行う。図8〜図10は文字列切り
出し手段5の具体的な構成例を示したものである。図に
おいて、11は文字列上下端決定手段、12は文字列左
右端決定手段、21は第1の切り出し範囲設定手段、2
2は黒点検出手段、23は第2の切り出し範囲設定手
段、24は第1のヒストグラム生成手段、25は第1の
エッジ検出手段、26は組み合わせによる上下端組合わ
せ決定手段、31は第2のヒストグラム生成手段、32
は第2のエッジ検出手段である。また、図11〜図13
は、文字列上下端決定手段11の動作および文字列左右
端決定手段12の動作を説明するための図である。
【0045】次に図11〜13を用いて、動作を説明す
る。座標指示手段4によって1点が指示されると、第1
の切り出し範囲設定手段21は、その1点を中心とする
矩形を第1の切り出し範囲として設定する(図11
(b))。第1の切り出し範囲は、文字列と直交する方
向に視野を広げた矩形であり、例えば、矩形幅はあらか
じめ与えられた文字の基準幅の1倍乃至3倍で、矩形高
さはあらかじめ与えられてある文字の高さの1倍乃至2
倍などと設定する。図11(b)では文字列(313
8)の上のノイズ100を含んで、第1の切り出し範囲
を設定している。
【0046】次に、黒点検出手段22は、第1の切り出
し範囲内のもっとも上方の黒点ともっとも下方の黒点を
検出し、各々を第1の切り出し範囲内における文字列の
第1の上端候補点と第1の下端候補点とする。図12
(a)では、第1の下端候補点は、正しく文字列の下端
と一致しているが、第1の上端候補点はノイズの位置で
黒点を検出しているため、文字列の上端とは一致してい
ない。
【0047】次に、第2の切り出し範囲設定手段23
は、前述した1点を中心とする第2の切り出し範囲の矩
形を設定する。第2の切り出し範囲は、文字列方向に視
野を広げた矩形であり、例えば、矩形幅は、あらかじめ
与えられてある文字幅の2倍乃至10倍と設定する(図
12(b))。第2の切り出し範囲の上下端は、前記黒
点検出手段22で検出した第1の上端候補点と第1の下
端候補点である。
【0048】次に、第1のヒストグラム生成手段24
は、図12(b)に示すように、第2の切り出し範囲内
で、文字列方向と同方向に走査して黒点の数を計数し、
ヒストグラムを生成する。
【0049】次に、第1のエッジ検出手段25は、第1
のヒストグラム生成手段24により生成されたヒストグ
ラムの変化点から、立ち上がりエッジ、立ち下がりエッ
ジを検出する(図12(b))。図12(b)に示すよ
うに、通常、エッジは複数個存在する。
【0050】このため次に、組み合わせによる上下端組
み合わせ決定手段26では、ヒストグラムの立ち上がり
エッジと立ち下がりエッジとを組み合わせ、その間隔が
あらかじめ設定されている基準文字高さにもっとも近い
組み合わせを選択し、それを文字列の上下端と定める
(図13(a))。すなわち、ある立ち上がりエッジと
立ち下がりエッジの組み合わせにおいて、文字列方向と
直交する方向(この場合は垂直方向)の距離を求め、そ
の距離が基準文字高さにもっとも近い値をとる組み合わ
せの立ち上がりエッジ・立ち下がりエッジを、文字列の
上下端を定める。図12においては、立ち上がりエッジ
a,b,cと立ち下がりエッジA,B,Cにおいて、a
−A,a−B,a−C,b−B,b−C,c−Cの組み
合わせについて(他の組み合わせは立ち上がりエッジの
方が立ち下がりエッジより下になるので除外する)垂直
方向の距離を求め、基準文字高さにもっとも近い値をと
るa−Cの組み合わせを上下端と定める。この例の場合
には、この処理により、ノイズ100の部分が切り出し
範囲から取り除かれていることが判る。
【0051】次に、第2の切り出し範囲の上下端を上記
のように求めた文字列上下端に変更して、第2のヒスト
グラム生成手段31により、文字列と垂直な方向に走査
してヒストグラムを生成する(図13(b))。
【0052】次に、ヒストグラムの変化点を求め、もっ
とも左の立ち上がり変化点を文字列の左端、もっとも右
の立ち上がり変化点を文字列の右端とする(図13
(c))。これにより、文字列の左端と右端を決定す
る。
【0053】なお、指定した1点を含む文字列が存在し
ない場合について図14〜図15を用いて説明する。図
14は、指示座標が文字列の近傍を指示した例を示して
いる。上述したのと同様の動作で、近傍の文字列を検出
する(図14(b))。すなわち、第1の切り出し範囲
内の黒点より、文字列の第1の上端候補点と第1の下端
候補点を検出し(図15(a))、第2の切り出し範囲
内において、立ち上がりエッジ・立ち下がりエッジの組
み合わせから文字列の上端と下端を決定する(図15
(b))。さらに文字列と垂直な方向に走査したヒスト
グラムより、文字列左右端を決定する。従って、指定し
た1点より作成した第1の切り出し範囲が、文字列の上
下端を含むようにかかり、かつ指定した1点より作成し
た第2の切り出し範囲が所望の文字列を完全に含んでい
れば、指定した1点が文字列の内部になくても、正しく
文字列を切り出すことができる。
【0054】実施例2.次に、本発明の他の実施例につ
いて、説明する。図16は本発明の他の実施例のブロッ
ク図を示したものであり、図1の構成に対し、シンボル
を検出した場合に文字列の左右端を修正するシンボル検
出による文字列左右端修正手段51が文字列切り出し手
段5の1部として付加されたものである。図17〜図1
8は動作を説明するための説明図である。
【0055】図17(a)に示すようなシンボルと文字
列が接触しているような場合、実施例1では誤って切り
出す可能性が高くなる(図17(b))。そこで、あら
かじめシンボルを認識辞書に登録しておいて、シンボル
検出による文字列左右端修正手段51により、誤切り出
しによる影響をなくすようにする。
【0056】次に本動作について図17〜図18を用い
て説明する。文字列切り出し手段5までの動作は実施例
1で説明したものと同一であるため、ここでは説明を省
略する。シンボル検出による文字列左右端修正手段51
は、最初にシンボル検出範囲を設ける。これは、座標指
示手段4により指示された1点を中心とした矩形で、シ
ンボルが存在すると想定されるあらかじめ設定した範囲
の矩形領域で設定する。実際には、例えば幅は文字幅の
2倍乃至10倍、高さは文字高さの1倍乃至3倍と設定
する。この幅と高さは実際に読み取ろうとする図面中の
文字列を十分含むように設定する必要があり、例えば図
面中の数字の桁数によって適当な値を設定する。
【0057】次に、シンボル検出範囲内でシンボルを検
出し、その位置を求める。
【0058】次に、文字列切り出し手段5によって検出
された文字列切り出し結果と、シンボルの位置が重なっ
ていた場合、シンボルに文字列の範囲がかからないよう
に文字列の範囲を狭くする(図17(c))。
【0059】シンボル検出には、例えば、「文字認識概
論」(橋本新一郎編著、オーム社、1982年)pp6
5〜pp71にあるようにさまざまな方法が知られてい
る。例えば、定点マッチング法によるシンボル検出は以
下に示す方法で実現できる。
【0060】シンボルとして、図18(a)に示すよう
な、一辺の長さAの正方形のシンボルを考える。シンボ
ルの代表点を(X0,Y0)とすれば、記号の黒点の位
置は(X0,Y0)を中心として確定する。そこで、黒
点のある位置を例えば8個定めることができる。図18
(a)に示す図形であれば、(X0−A/2,Y0−A
/2)、(X0,Y0−A/2)、(X0+A/2,Y
0−A/2)、(X0−A/2,Y0)、(X0+A/
2,Y0)、(X0+A/2,Y0+A/2)、(X0
+A/2,Y0+A/2)、(X0,Y0+A/2)が
黒点である(図18(a))。
【0061】そこで、シンボルの代表点(X0,Y0)
をシンボル検出範囲内で動かし、上述した黒点のある
(べき)位置に黒点があるかを検定する。すなわち、シ
ンボルが存在すれば、ある(X0,Y0)において、黒
点があるべき位置にすべて黒点が存在する。なお、実際
には、かすれや歪みなどにより、黒点が存在しない場合
もあるので、しきい値を設け、黒点のあるべき位置に実
際にある黒点の数がそのしきい値を越えたらシンボルが
存在すると判定する(図18(b))。以上のようにシ
ンボルを検出することができる。
【0062】実施例2においては、シンボルが文字列の
左端または右端に存在する場合を説明したが、シンボル
が文字列の途中にある場合にも有効である。すなわち、
シンボル検出手段によりシンボルを検出したときは、シ
ンボル部分の座標が判明するので、そのシンボル部分の
パターンを全て白画素に置き換えることにより、シンボ
ルを削除する。
【0063】実施例3.次に、本発明のさらに別の実施
例について説明する。図19は、本発明のさらに別の実
施例を示すブロック図であり、実施例2のシンボル検出
による文字列左右端修正手段51の代わりに直線検出に
よる文字列左右端修正手段52を文字列切り出し手段5
の1部として設けたものである。図20〜図23は動作
を説明するための図である。
【0064】図20(a)のように、所望の文字列の近
傍に、直線がある場合には、実施例1の文字列切り出し
は誤検出する場合があり、また、実施例2におけるシン
ボル検出による文字列左右端修正手段51によっても修
正されない(図20(b))。直線にかかって誤って文
字列切り出しをした場合は、直線部分の認識結果は
「1」または「7」になりやすい。
【0065】したがって、直線を検出し、その部分を避
けて切り出し結果領域を再度設定するような文字列左右
端修正手段を設けることにより直線を含まない切り出し
結果領域を得ることができる。
【0066】次に動作を説明する。文字列切り出し手段
5までの動作は実施例1と同じであるのでここでは省略
する。直線検出による文字列左右端修正手段52は、最
初に直線検出範囲を設定する。直線検出範囲としては、
文字列切り出し手段5によって検出された文字列の外接
矩形をそれぞれ上下左右に数画素乃至数十画素広げた範
囲を設定する。次に、直線検出範囲内で直線を検出する
(図21(a)、図22(a))。
【0067】検出した直線が、文字列切り出し結果の外
接矩形内にかかっていた場合、図21(b)に示すよう
に直線が文字列の外接矩形にかからなくなるまで文字列
左端または右端を移動して、文字列左右端を修正する。
ただし、直線が所望の文字列と重なっている場合もあ
り、その場合には文字列の左右端は修正しない(図21
(b))。直線が所望の文字列と重なっているか否か
は、例えば、文字列切り出し結果の外接矩形と、直線の
交点を求め、そこからy方向に黒点を探し、黒点があれ
ばその直線は所望の文字列と重なっており、黒点がなけ
れば重なっていないと判定する。
【0068】なお、直線の検出方法としては、例えば以
下のようにする。直線検出範囲内で文字列方向に1画素
の幅をもつ複数のスリットを設ける。次に各スリットに
ついて、黒点(1)白点(0)を調べ、1次元の配列を
作成する。1次元の配列は各スリットに対応して作成す
る。かすれを考慮して、1次元の埋め込み処理を行って
もよい(図22(b)、図23)。
【0069】次に、各スリットについて黒点のかたまり
(以下ドメインという)を検出し、その開始点と終了点
を配列に控えておく。このドメインは、直線のみを切断
したものや、文字列部分を切断したもの、さらに直線と
文字列が重なった部分を切断したものなどがある(図2
2(c))。
【0070】線幅の上限を設定し(例えば10画素)、
それ以上の幅をもつドメインを含まないスリットを上端
のスリットから探す。線幅の上限以上の幅をもつドメイ
ンを含まないスリットが見つかれば、それを上方の基準
スリットとする。同様にして下方の基準スリットを選定
する。これらの基準スリットは、直線のみを切断したス
リットである可能性が高い(図22(b))。
【0071】選択した2つの基準スリットの、それぞれ
のドメインの組み合わせについて、以下の処理を行う。
すなわち、1つの組み合わせについて、それを直線であ
ると仮定し、直線の方程式と幅を求める。さらに、基準
スリットでない他のすべてのスリットに対し、直線の方
程式の交わる部分にドメインがあるか検定する。もし、
仮定した直線が実際に直線であれば、直線と交わる部分
にドメインが存在するはずである(図22(c))。も
し、仮定した直線が実際は直線でなければ、あるスリッ
トには、直線と交わる部分にドメインは存在しない(図
22(d))。従って、仮定した直線と交わる部分にド
メインが存在しないスリットがあれば、直線ではないと
決定することができる。実際には、直線のかすれやゆが
みがあるので、仮定した直線と交わる部分にドメインが
存在しないスリットの存在が所定数以下であれば、直線
と決定する。
【0072】以上のような処理では、文字と交わった
り、接触している直線も検出できる。また、斜めの直線
も検出可能である。さらに、スリットを垂直方向にとれ
ば水平の直線も検出可能である。
【0073】実施例4.次に、さらに別の実施例につい
て説明する。図24は、本発明のさらに別の実施例を示
すブロック構成図であり、実施例3の構成に直線消去手
段53を付加したものである。図において、61は直線
消去手段である。また、図25は動作を説明するための
説明図である。
【0074】本実施例は、実施例3において検出した直
線部分のみを消去するものである。そうすれば、後の文
字認識処理において、高精度な文字認識が期待できる。
直線部分の消去にあたっては所望の文字と接触・重複し
ている部分は消去しない。
【0075】次に動作を説明する。直線検出による文字
列左右端修正手段52までは実施例3と同じであるの
で、説明を省略する。次に、直線消去手段53は、直線
検出による文字列左右端修正手段52によって修正され
た文字列の外接矩形内の各画素列について、実施例3で
求めた直線の方程式と交わる画素部分を求める。その部
分には、直線が存在することから、必ず黒点である。さ
らに、その部分からあらかじめ指定されたビット数分、
左右の画素をみて、黒点の数を計数する。直線と直線以
外のイメージが重畳している場合には、左右の画素が黒
になっている(図25(a)、図25(c))。
【0076】左右に黒点が存在し、かつそれらの数が所
定数(または指定されたビット数の一定割合)より大き
ければ、直線と他の文字部分が重なっていると判断し、
その画素列については消去しない。そうでなければ、直
線の方程式と交わる画素部分を白で埋め込む(図25
(b)、図25(d))。
【0077】以上のような処理を用いれば、直線と文字
列が重畳している場合などでも、直線による影響をなく
して文字切り出し結果の修正をすることができる。
【0078】実施例5.次に、さらに別の実施例につい
て説明する。図26は本発明のさらに別の実施例を示す
ブロック図であり実施例1の構成に対し、文字認識手段
7で認識した認識結果を検定し不合格であれば、認識結
果を認識結果出力手段8に転送しない認識結果検定手段
71を文字認識手段7の1部として付加したものであ
る。図27は、本実施例の動作を説明するための図であ
る。
【0079】次に動作について説明する。本実施例の場
合は、文字認識辞書(図示していない)にあらかじめ認
識対象でない記号などを登録しておく。文字認識手段7
までの動作は実施例1と同じなので説明は省略する。文
字認識手段7によって認識した結果、認識対象でない記
号などが認識候補文字になった場合(図27(a)〜図
27(c))、その認識結果は認識結果検定手段により
不合格とする。したがって認識結果出力手段8の出力結
果は図27(d)のように認識対象でない記号が削除さ
れて出力される。
【0080】上記の例では、認識結果が認識対象文字で
あるか否かを検定の判定基準としたが、例えば認識結果
の類似度が所定の値以上か否かということを判定基準と
してもよい。すなわち、類似度が所定の値以上の場合の
み、検定に合格とする。その場合には、認識辞書には認
識対象でない記号などを登録しておく必要はない。
【0081】また、判定基準として、認識した文字の外
接矩形の幅と高さの比と、認識結果の文字コードの幅と
高さの比を比較し、その相違が所定値以上であるか否か
という基準を採用してもよい。すなわち、相違が所定値
より小さい場合のみ、検定に合格とする。その場合に
は、あらかじめ認識辞書に文字コードの幅と高さの比の
基準値を登録しておく必要がある。例えば、「1」の幅
高さ比は3以上であると登録しておく。そして、認識辞
書に登録されている幅高さ比と、文字切り出し手段によ
って得られた文字の外接矩形の幅高さ比が一致している
かを検定し、所定範囲内で一致していなければ、検定不
合格とする。
【0082】実施例6.次に、さらに別の実施例を説明
する。図28は、本発明のさらに別の実施例のを示すブ
ロック図で、実施例1に対して、切り出された文字列を
検定し、検定に合格した文字イメージのみ、以降の文字
認識手段7に転送する文字外接矩形検定手段72を文字
認識手段7の1部として付加したものである。図29は
動作を説明するための図である。
【0083】次に、動作を説明する。図29(a)のよ
うな図面の場合、「679S」部分を座標指定すると、
文字列切り出し手段5によって、図29(b)のように
文字列切り出し結果が得られる。次に、文字切り出し手
段6により図29(c)のように各文字の外接矩形が求
まる。次に、文字外接矩形検定手段72は、各文字の外
接矩形の高さを検定し、その高さが文字列の外接矩形の
高さの所定値(例えば60%)以下であれば、検定不合
格とし、以降の認識処理にはその文字のイメージは転送
しない。図29の場合では、先頭の線分は文字列の高さ
の所定値に達していないので、以上の認識処理から除去
して、最終的に、正しい結果が認識結果出力手段8から
出力される。
【0084】上記実施例6においては、文字外接矩形検
定手段72が、各文字の外接矩形の高さを検定する例を
示したが、高さを検定するだけでは、例えば、”ー”等
の文字が検定不合格となる可能性があるので、外接矩形
の幅を検定して、外接矩形の幅が、文字列の高さに対し
て所定の範囲(例えば60%〜140%)に入るもの
は、検定合格とするようにもできる。このようにするこ
とにより、”ー”等の文字を除外せずに認識できる。
【0085】以上、実施例においては、図面上のイメー
ジ情報をイメージスキャナーで読み込む例を示したが、
イメージ情報は、通信回線を介して、あるいは、ファイ
ル装置から取り込むようにしてもよいことは、言うまで
もない。
【0086】
【発明の効果】以上のように、本発明によれば、座標指
示手段を設けたのでマウスのクリックやペンのタッチの
ような簡便な操作で図面上の所望の文字列をコード化す
ることができる。
【0087】また、文字列切り出し手段に文字列の上端
と下端を決定する文字列上下端決定手段を設けたので文
字列の上下方向の切り出しが容易になる。
【0088】また、文字列切り出し手段に文字列の左端
と右端を決定する文字列左右端決定手段を設けたので、
文字列の左右方向の切り出しが容易になる。
【0089】さらに、上下端決定手段は、文字列に垂直
方向のヒストグラムを作成し、作成したヒストグラムの
エッジを検出して、エッジの組み合せにより最適な上下
端を検出するようにしたので正確な上下端を検出できる
ようになり、図面上のノイズ等を取り除くことができ
る。
【0090】さらに、左右端決定手段は、文字列に水平
方向のヒストグラムを作成し、作成したヒストグラムの
エッジを検出して、文字列の左右端を検出できる。
【0091】また、シンボル検出手段を設けたので、シ
ンボルが所望の文字列に近接・接触している場合でも、
正しく所望の文字列のみを検出することができる。
【0092】さらに、シンボルが文字列の途中にあって
も、正しく所望の文字列のみを検出することができる。
【0093】また、直線が所望の文字列に近接・接触し
ている場合でも、正しく所望の文字列のみを検出するこ
とができる。
【0094】また、直線が所望の文字列に重畳している
場合でも、直線部分のみを消去するので、正しい文字切
り出し・文字認識を行うことができる。
【0095】また、認識結果検定手段を設けて、認識対
象でない記号が所望の文字の間にあっても所望の文字の
認識結果のみ正しく出力することができる。
【0096】また、文字の類似度を検定する認識結果検
定手段を設けて、類似度が低い場合には、認識結果を出
力しないので、信頼性の高い文字読取装置を提供するこ
とができる。
【0097】また、文字の幅高さ比を検定する認識結果
検定手段を設けて、文字の幅高さ比が所定の値と大きく
異なる場合は、認識結果を出力しないので、信頼性の高
い文字読取装置を提供することができる。
【0098】また、文字の外接矩形の高さが文字列の高
さの一定割合と大きく異なる場合は、その文字の以降の
認識処理を行わないので、信頼性の高い文字読取装置を
提供することができる。
【図面の簡単な説明】
【図1】本発明の1実施例(実施例1)の構成を示した
図。
【図2】本発明の1実施例(実施例1)の動作を説明す
る図。
【図3】本発明の1実施例(実施例1)の動作を説明す
る図。
【図4】本発明の1実施例(実施例1)の動作を説明す
る図。
【図5】公知の文字切り出し手段の構成を示す図。
【図6】公知の文字切り出し手段の動作を示す図。
【図7】公知の文字認識手段の構成を示す図。
【図8】本発明の1実施例(実施例1)の文字列検出手
段の構成を示した図。
【図9】本発明の1実施例(実施例1)の文字列上下端
決定手段の構成を示した図。
【図10】本発明の1実施例(実施例1)の文字列左右
端決定手段の構成を示した図。
【図11】本発明の1実施例(実施例1)の文字列切り
出し手段の動作を詳細に説明した図。
【図12】本発明の1実施例(実施例1)の文字列切り
出し手段の動作を詳細に説明した図。
【図13】本発明の1実施例(実施例1)の文字列切り
出し手段の動作を詳細に説明した図。
【図14】本発明の1実施例(実施例1)の文字列切り
出し手段の動作を詳細に説明した図。
【図15】本発明の1実施例(実施例1)の文字列切り
出し手段の動作を詳細に説明した図。
【図16】本発明の他の実施例(実施例2)の構成を示
した図。
【図17】本発明の他の実施例(実施例2)の文字列左
右端修正手段の動作を説明した図。
【図18】本発明の他の実施例(実施例2)におけるシ
ンボル検出方法の例を示した図。
【図19】本発明のさらに他の実施例(実施例3)の構
成を示した図。
【図20】文字列と直線が近接・重畳している図面例を
示した図。
【図21】本発明のさらに他の実施例(実施例3)の動
作を説明した図。
【図22】本発明のさらに他の実施例(実施例3)にお
ける直線検出方法の例を示した図。
【図23】本発明のさらに他の実施例(実施例3)にお
けるドットの埋め込みを示す図。
【図24】本発明のさらに他の実施例(実施例4)の構
成を示した図。
【図25】本発明のさらに他の実施例(実施例4)にお
ける直線消去の動作を説明した図。
【図26】本発明のさらに他の実施例(実施例5)の構
成を示した図。
【図27】本発明のさらに他の実施例(実施例5)の動
作を説明した。
【図28】本発明のさらに他の実施例(実施例6)の構
成を示した図。
【図29】本発明のさらに他の実施例(実施例6)の動
作を説明した図。
【図30】従来の図面内の文字読取装置の概略構成図。
【図31】従来の文字読取装置の概略構成図と動作の概
略図。
【符号の説明】
1 図面イメージ 2 図面イメージ取得手段 3 イメージ表示手段 4 座標指示手段 5 文字列切り出し手段 6 文字切り出し手段 7 文字認識手段 8 認識結果出力手段 11 文字列上下端決定手段 12 文字列左右端決定手段 21 第1の切り出し範囲設定手段 22 黒点検出手段 23 第2の切り出し範囲設定手段 24 第1のヒストグラム生成手段 25 第1のエッジ検出手段 26 組み合せによる上下端決定手段 31 第2のヒストグラム生成手段 32 第2のエッジ検出手段 51 シンボル検出による文字列左右端修正手段 52 直線検出による文字列左右端修正手段 53 直線消去手段 71 認識結果検定手段 72 文字外接矩形検定手段 100 ノイズ 101 指定座標 501 従来の文字読取装置の輪郭ベクトル化処理部 502 従来の文字読取装置のヒストグラム生成部 503 従来の文字読取装置の文字列抽出部 504 従来の文字読取装置の文字切り出し部 505 従来の文字読取装置の文字認識部 601 用紙 602 従来の文字認識装置の走査手段 605 従来の文字認識装置の文字認識手段 608 従来の文字認識装置のページ記憶手段 609 従来の文字認識装置の表示手段 610 従来の文字認識装置の入力手段 611 従来の文字認識装置の制御手段 612 従来の文字認識装置の文字切り出し手段 616 従来の文字認識装置の認識範囲設定の左上座標 617 従来の文字認識装置の認識範囲設定の右上座標 901 周辺分布作成手段 902 切り出し位置決定手段 903 認識辞書 904 マッチング手段

Claims (13)

    【特許請求の範囲】
  1. 【請求項1】 下記の要素を有する文字読取装置 (a)文字パターンを含むイメージ情報を取り込むイメ
    ージ取得手段、(b)前記イメージ取得手段で取り込ん
    だイメージ情報を表示するイメージ表示手段、(c)表
    示されたイメージ情報上のコード化する文字パターンの
    内部または、近傍の1点を指示する座標指示手段、
    (d)前記座標指示手段で指示された1点を内部に含む
    文字列、またはこの1点の近傍の文字列の領域を検出す
    る文字列切り出し手段、(e)前記文字列切り出し手段
    で検出した文字列の領域をもとに、文字パターンを切り
    出す文字切り出し手段、(f)前記文字切り出し手段に
    より切り出された文字パターンを認識して、コード化す
    る文字認識手段、(g)認識した文字コードを出力装置
    へ出力する認識結果出力手段。
  2. 【請求項2】 前記文字列切り出し手段は、文字列の上
    端及び下端を決定する文字列上下端決定手段を備えたこ
    とを特徴をする請求項1に記載の文字読取装置。
  3. 【請求項3】 前記文字列切り出し手段は、文字列の左
    端及び右端を決定する文字列左右端決定手段とを備えた
    ことを特徴をする請求項1に記載の文字読取装置。
  4. 【請求項4】 前記文字列上下端決定手段は、以下の要
    素を有することを特徴とする請求項2に記載の文字読取
    装置。 (a)前記座標指示手段で指定された1点を中心とし、
    文字列と直交する方向に視野を広げた第1の切り出し範
    囲矩形を設定する第1の切り出し範囲設定手段、(b)
    この第1の切り出し範囲矩形内で、黒点の存在を検出
    し、文字列の第1の上端候補点と第1の下端候補点を求
    める黒点検出手段、(c)前記座標指示手段で指定され
    た1点を中心とし、上端と下端はそれぞれ前記第1の上
    端候補点と第1の下端候補点とし、文字列方向に視野を
    広げた第2の切り出し範囲矩形を設定する第2の切り出
    し範囲設定手段、(d)前記第2の切り出し範囲内で、
    文字列方向と同方向の黒点のヒストグラムを生成する第
    1のヒストグラム生成手段、(e)前記第1のヒストグ
    ラム生成手段で生成したヒストグラムの立ち上がり変化
    点と立ち下がり変化点を検出する第1のエッジ検出手
    段、(f)前記立ち上がり変化点と立ち下がり変化点の
    組み合わせにより、最適な組み合わせを決定する上下端
    組み合わせ決定手段。
  5. 【請求項5】 前記文字列左右端決定手段は、下記の要
    素を有することを特徴とする請求項3に記載の文字読取
    装置 (a)前記座標指示手段で指定された1点を中心とし、
    文字列と直交する方向に視野を広げた第1の切り出し範
    囲矩形を設定する第1の切り出し範囲設定手段、(b)
    この第1の切り出し範囲矩形内で、黒点の存在を検出
    し、文字列の第1の上端候補点と第1の下端候補点を求
    める黒点検出手段、(c)前記座標指示手段で指定され
    た1点を中心とし、上端と下端はそれぞれ前記第1の上
    端候補点と第1の下端候補点とし、文字列方向に視野を
    広げた第2の切り出し範囲矩形を設定する第2の切り出
    し範囲設定手段、(d)前記第2の切り出し範囲内の上
    下端を前記文字列上下端とした矩形範囲において、文字
    列方向と垂直な方向に走査して得た黒点のヒストグラム
    をとる第2のヒストグラム生成手段(e)ヒストグラム
    の変化率があらかじめ設定したしきい値を越えるもっと
    も左の位置と、ヒストグラムの変化率があらかじめ設定
    したしきい値を越えるもっとも右の位置を検出する第2
    のエッジ検出手段
  6. 【請求項6】 あらかじめ登録された認識対象外のシン
    ボルを検出する手段を設け、前記文字列切り出し手段で
    切り出された文字列に認識対象外のシンボルが含まれて
    いる場合に、このシンボルを検出し文字列切り出し結果
    の左右端を修正する文字列左右端修正手段を設けたこと
    を特徴とする請求項1乃至5にのいずれかに記載の文字
    読取装置。
  7. 【請求項7】 あらかじめ登録された認識対象外のシン
    ボルを検出する手段を設け、前記文字列切り出し手段で
    切り出された文字列の途中に認識対象外のシンボルが含
    まれている場合に、このシンボルを検出し文字列切り出
    し結果から除外する手段を設けたことを特徴とする請求
    項1乃至6にのいずれかに記載の文字読取装置。
  8. 【請求項8】 直線を検出する直線検出手段を設け、前
    記文字列切り出し手段で切り出された文字列に直線が含
    まれている場合に、この直線検出手段により検出した直
    線を避けるように文字列切り出しの左右端を修正する直
    線検出による文字列左右端修正手段を設けたことを特徴
    とする請求項1乃至6にのいずれかに記載の文字読取装
    置。
  9. 【請求項9】 直線検出手段により検出した直線を消去
    する直線消去手段を設け、この検出した直線部分を白画
    素で埋め込み、直線を消去することを特徴とする請求項
    8に記載の文字読取装置。
  10. 【請求項10】 前記文字認識手段により認識した認識
    結果を検定して、あらかじめに登録された認識対象外の
    記号を、前記認識結果から除外する認識結果検定手段を
    設けたことを特徴とする請求項1乃至9のいずれかに記
    載の文字読取装置。
  11. 【請求項11】 前記文字認識手段により認識した認識
    結果の類似度があらかじめ定めた値以下のものは、前記
    認識結果から除外する認識結果検定手段を設けたことを
    特徴とする請求項1乃至9のいずれかに記載の文字読取
    装置。
  12. 【請求項12】 文字パターンの幅高さ比をあらかじめ
    認識辞書に登録しておいて、前記文字認識手段により認
    識した結果、認識結果の文字パターンの幅高さ比が、認
    識辞書に登録された幅高さ比との相違があらかじめ定め
    た範囲内に入らないものは、前記認識結果から除外する
    認識結果検定手段を設けたことを特徴とする請求項1乃
    至9のいずれかに記載の文字読取装置。
  13. 【請求項13】 文字の外接矩形の幅と高さを測定する
    文字外接矩形検定手段を設け、測定した幅または高さと
    検出した文字列の高さの比が所定の範囲の値である文字
    のみ、認識処理を行うことを特徴とする請求項1乃至1
    2のいずれかに記載のの文字読取装置。
JP02035994A 1994-02-17 1994-02-17 文字読取装置 Expired - Fee Related JP3442847B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP02035994A JP3442847B2 (ja) 1994-02-17 1994-02-17 文字読取装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP02035994A JP3442847B2 (ja) 1994-02-17 1994-02-17 文字読取装置

Publications (2)

Publication Number Publication Date
JPH07230526A true JPH07230526A (ja) 1995-08-29
JP3442847B2 JP3442847B2 (ja) 2003-09-02

Family

ID=12024909

Family Applications (1)

Application Number Title Priority Date Filing Date
JP02035994A Expired - Fee Related JP3442847B2 (ja) 1994-02-17 1994-02-17 文字読取装置

Country Status (1)

Country Link
JP (1) JP3442847B2 (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006119942A (ja) * 2004-10-22 2006-05-11 Hitachi Ltd 文字列領域切り出し装置
KR20110076625A (ko) * 2009-12-29 2011-07-06 삼성전자주식회사 문자 인식 영역 검출 장치 및 문자 인식 방법
JP2015210543A (ja) * 2014-04-23 2015-11-24 株式会社キーエンス 携帯型光学式読取装置、該携帯型光学式読取装置を用いる光学式読取方法、及びコンピュータプログラム
US9646218B2 (en) 2015-06-18 2017-05-09 Pfu Limited Image-processing apparatus, date identification apparatus, image-processing method, and computer program product
JP2018503201A (ja) * 2015-10-30 2018-02-01 小米科技有限責任公司Xiaomi Inc. 領域抽出方法、モデル訓練方法及び装置
JP2019036146A (ja) * 2017-08-16 2019-03-07 富士ゼロックス株式会社 画像解析装置及び画像解析プログラム

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006119942A (ja) * 2004-10-22 2006-05-11 Hitachi Ltd 文字列領域切り出し装置
KR20110076625A (ko) * 2009-12-29 2011-07-06 삼성전자주식회사 문자 인식 영역 검출 장치 및 문자 인식 방법
JP2015210543A (ja) * 2014-04-23 2015-11-24 株式会社キーエンス 携帯型光学式読取装置、該携帯型光学式読取装置を用いる光学式読取方法、及びコンピュータプログラム
US9646218B2 (en) 2015-06-18 2017-05-09 Pfu Limited Image-processing apparatus, date identification apparatus, image-processing method, and computer program product
JP2018503201A (ja) * 2015-10-30 2018-02-01 小米科技有限責任公司Xiaomi Inc. 領域抽出方法、モデル訓練方法及び装置
JP2019036146A (ja) * 2017-08-16 2019-03-07 富士ゼロックス株式会社 画像解析装置及び画像解析プログラム

Also Published As

Publication number Publication date
JP3442847B2 (ja) 2003-09-02

Similar Documents

Publication Publication Date Title
US5410611A (en) Method for identifying word bounding boxes in text
US5748809A (en) Active area identification on a machine readable form using form landmarks
US5539841A (en) Method for comparing image sections to determine similarity therebetween
US5201011A (en) Method and apparatus for image hand markup detection using morphological techniques
KR100315318B1 (ko) 비트맵이미지의처리방법및처리장치,비트맵이미지의처리를행하는이미지처리프로그램을저장한기억매체
JP3278471B2 (ja) 領域分割方法
JP2002133426A (ja) 多値画像から罫線を抽出する罫線抽出装置
EP0483343A1 (en) A polygon-based method for automatic extraction of selected text in a digitized document
JP2014153820A (ja) 文字切り出し装置及び文字切り出し方法
US6947596B2 (en) Character recognition method, program and recording medium
JP5906788B2 (ja) 文字切り出し方法、およびこの方法を用いた文字認識装置およびプログラム
CN111126266B (zh) 文本处理方法、文本处理系统、设备及介质
JP5538812B2 (ja) 画像処理装置、画像処理方法及びプログラム
JP3442847B2 (ja) 文字読取装置
JPH10171922A (ja) 罫線消去装置及び記録媒体
JP2009223612A (ja) 画像認識装置及びプログラム
JP4810853B2 (ja) 文字画像切出装置、文字画像切出方法およびプログラム
JP2004094427A (ja) 帳票画像処理装置及び該装置を実現するためのプログラム
Uchida et al. OCR fonts revisited for camera-based character recognition
JPH07220081A (ja) 画像認識装置の図形の切出し方法
JP2009193170A (ja) 文字認識装置及び文字認識方法
JP4878057B2 (ja) 文字認識方法,プログラム及び記録媒体
JP3186712B2 (ja) 文書読取装置
US20200302209A1 (en) Systems and methods for separating ligature characters in digitized document images
JP4544691B2 (ja) 文字読取装置

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080620

Year of fee payment: 5

LAPS Cancellation because of no payment of annual fees