JPH0652355A

JPH0652355A - 文字切り出し方法、並びに、文字認識装置

Info

Publication number: JPH0652355A
Application number: JP4205189A
Authority: JP
Inventors: Yukio Hamaguchi; 幸雄浜口; Takashi Nakao; 隆司中尾
Original assignee: Hitachi Engineering Co Ltd
Current assignee: Hitachi Engineering Co Ltd
Priority date: 1992-07-31
Filing date: 1992-07-31
Publication date: 1994-02-25

Abstract

(57)【要約】（修正有）【目的】刻印文字等の低品質画像、背景濃度が一定で
ない画像、文字線部と背景濃度が反転している画像に対
しても、文字領域を正確に切出す文字認識装置を提供。【構成】画像撮像装置１とそれから取り込んだデータ
に所定の処理を施し文字領域を切り出し、認識し文字コ
ードに変換出力する。電子計算機２から成る文字認識装
置において、文字領域抽出手段２２は装置１からのデー
タを取り込み領域を抽出し、背景領域濃度値算出手段２
３は文字列に平行方向の座標位置に対し上側背景領域画
素と下側背景画素から濃度値を求め、差分２乗累積算出
手段２４は文字領域の文字列に平行座標位置に対し、文
字列領域の上側と下側の濃度値を求め、差分２乗累積算
出手段２４は文字列垂直方向の差分２乗累積を算出し、
文字領域座標値決定手段１６は算出した差分２乗累積に
基づいて平行方向位置における領域を決定、文字認識手
段２７は切出された文字画像を認識・文字コード変換
す。

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】本発明は、画像認識に関し、特
に、認識対象とする文字等の画像パターンが存在する領
域を抽出する切り出し方法、並びに、それを利用した文
字認識装置に関する。

【０００２】

【従来の技術】画像認識の分野においては、与えられた
画像から、認識対象とする画像パターンが存在する領域
を抽出する処理を「切り出し処理」と呼ぶ。一般に認識
処理は、認識対象とする画像の正確な切り出しを前提と
している場合が大部分であり、文字認識においても例外
ではない。これは、文字認識装置等が例え非常に優れた
認識処理機能を有していても、切り出し処理に難があれ
ば、認識処理の利点が全く発揮されないということを意
味する。また、特に、ＦＡ（Factory Automation）分野
に利用される文字認識装置においては、撮像環境等によ
り画質の良好な画像が与えられることは稀であり、画質
の劣悪な画像から文字領域を正確に切り出すことは極め
て困難である。例えば自動車生産行程での刻印文字の認
識では、先ずＴＶカメラやＣＣＤで刻印文字を撮像する
が、撮像状態はよくない。刻印そのものがはっきりして
いなかったり、撮像位置によって反射の仕方が変わった
り、刻印文字と背景との区別がはっきりしなかったりす
るためである。

【０００３】ところで、一般に、与えられた画像から文
字領域を切り出す処理として広く使用されている手法
に、濃度ヒストグラム法がある。添付の図９は、低品質
画像（図９の（Ｂ）に示した文字列「ＮＥＲ」が低品質
画像を示している）とその濃度ヒストグラム（図９の
（Ａ））を示したものである。また、関連する公知例と
しては、電子情報通信学会論文誌Ｄ−ＩＩ、Vol.J72-D-
ＩＩNo.9（１９８９年）の第１４０７〜１４１４頁に掲
載のように、ばらつき度によるものがある。これは、文
字列領域の各行について、その前後の複数行における濃
度のばらつきの度合い（ばらつき度）を調べることによ
り、文字領域を切り出す方式である。添付の図１０は、
刻印文字を撮像して得た低品質画像（図１０の（Ｂ）の
文字列「ＮＥＲ」）と、そのばらつき度をヒストグラム
として表現したもの（図１０の（Ａ））を示している。

【０００４】上記の従来技術のうち、前者の濃度ヒスト
グラムによる方式では、微妙な濃度変化をも確実に表現
できることから、一般に、背景領域の濃度値が一定であ
る高品質画像に対しては良好な結果が得られることが多
い。このため、一連の画像からある領域を抽出しようと
するとき、この濃度ヒストグラムが用いられることが多
い。

【０００５】

【発明が解決しようとする課題】しかしながら、上記の
濃度ヒストグラムによる方式では、上記の図９に示した
ような低品質画像においては、その背景領域の濃度値が
一定ではないため、文字領域を切り出すためのしきい値
を適切に決定できないことが多い。また、この従来の方
式では、文字線部分と背景部分の濃度値が互いに反転し
ている１組の画像に対しては、その文字線部分と背景部
分を識別することが出来ず、あらかじめ文字線部分と背
景部分の濃度の関係、すなわち文字線部分の濃度が高く
かつ背景部分の濃度が低いのか、あるいはその逆である
のかを設定して置かない限り、それぞれの画像に対して
文字領域を正確に切り出すことは不可能であり、そのた
め、例えば刻印文字画像など、撮像対象物の角度や照明
角度によっては文字線部分と背景部分の濃度が互いに反
転することが頻繁に発生するものには、この方式は適用
することが出来ないという問題点があった。具体的に
は、添付の図１２の（Ｂ）及び（Ｄ）には、文字線部分
と背景部分の濃度値が互いに反転している低品質画像の
組合せと、それに対する濃度ヒストグラム（図１２の
（Ａ）及び（Ｃ））が、それぞれ、示されている。これ
らの図にも見られるように、特に低品質画像において
は、上記濃度ヒストグラムは、文字領域を正確に切り出
すための有効な情報とはなり得ないことが明かである。

【０００６】また、上記従来技術のうちの後者に示され
た濃度のばらつき度による方法では、文字列領域の各行
について、文字列に対して垂直方向の濃度のばらつき度
合いにより文字領域を切り出すため、文字列に対して垂
直方向に細長い文字に対しては必然的にばらつき度は低
くなり、そのため、細長い文字に対しての文字領域の正
確な切り出しが出来なくなるという問題がある。これを
具体的に説明すると、添付の図１１に示すように、例え
ば数字の「７」が文字列に対して垂直方向に細長い文字
であるため、ばらつき度は同じ文字列領域に含まれる他
の文字、この場合には数字の「６」や「８」に比較して
かなり小さくなってしまい、これでは、「７」の文字領
域を正確に切り出すことは不可能となる。

【０００７】そこで、本発明では、上記の従来技術にお
ける問題点を克服し、低品質画像であってもその文字領
域を正確に切り出すことの可能な文字切り出し方法、並
びに、文字認識装置を実現することを目的とする。

【０００８】

【課題を解決するための手段】上記の本発明の目的は、
本発明によれば、まず、撮像装置を用いて入力した２次
元濃淡画像から文字領域を切り出す文字切り出し方法で
あって、撮像装置からの画像データを取り込んで所定の
画像処理を施して文字列領域を抽出し、前記文字列領域
の文字列に平行方向の各平行方向座標位置に対し、前記
文字列領域の上側背景領域画素と下側背景画素から背景
領域濃度値を求め、前記文字列領域の文字列に平行方向
の各平行方向座標位置に対し、前記文字列領域の垂直方
向の全ての画素における前記背景領域濃度値との差分２
乗累積値を算出し、前記算出した各平行方向座標位置に
おける差分２乗累積値に基づいて、前記文字列領域の文
字列に平行方向座標位置における文字領域を決定する文
字切り出し方法によって達成される。

【０００９】また、上記本発明の目的を達成する他の手
段として、本発明によれば、撮像装置を用いて２次元の
濃淡画素空間に入力された文字列を含む濃淡画像から文
字領域を切り出すに際して、濃度ヒストグラム等を用い
て文字列領域を濃淡画像から抽出した後、その文字列領
域から各文字領域を切り出す文字切り出し方法におい
て、文字列に平行方向の各画素座標位置に対し、文字列
領域の上端及び下端から文字列に対し垂直にそれぞれ適
当な背景領域の連続画素を選択し、これら連続画素の濃
度値の平均値を当該平行方向座標位置における背景領域
濃度値として求め、この背景領域濃度値と当該平行方向
座標位置における文字列領域の垂直方向各画素の濃度値
との差分２乗累積値を、文字列に平行方向の各座標位置
に対して算出する文字切り出し方法が提案されている。

【００１０】さらに、本発明によれば、上記の方法ある
いは方式を利用した文字認識装置として、文字列を含む
２次元の濃淡画像データを取り込む撮像装置と、前記撮
像装置からの前記濃淡画像データから文字領域を切り出
して認識し、対応する文字コードを出力する演算装置と
を備えた文字認識装置であって、前記演算装置は、撮像
装置からの画像データを取り込んで所定の画像処理を施
して文字列領域を抽出する文字列領域抽出手段と、前記
文字列領域の文字列に平行方向の各平行方向座標位置に
対し、前記文字列領域の上側背景領域画素と下側背景画
素から背景領域濃度値を求める背景領域濃度値算出手段
と、前記文字列領域の文字列に平行方向の各平行方向座
標位置に対し、前記文字列領域の垂直方向の全ての画素
における前記背景領域濃度値との差分２乗累積値を算出
する差分２乗累積算出手段と、前記算出した各平行方向
座標位置における差分２乗累積値に基づいて、前記文字
列領域の文字列に平行方向座標位置における文字領域を
決定する文字領域座標値決定手段と、そして、前記文字
領域座標値決定手段によって切り出された文字領域の文
字画像を認識して対応する文字コードに変換する文字認
識手段とを備えた文字認識装置が提案されている。

【００１１】

【作用】すなわち、上記の本発明による構成によれば、
あらかじめ背景領域濃度値を文字列に平行方向の各座標
位置に対して求め、この値と当該平行方向座標位置に対
する文字列領域の各画素の濃度値との差分累積値を各平
行方向座標位置に対して求めることにより、背景領域濃
度が一定ではない低品質画像や、文字線部分と背景領域
部分の濃度が互いに反転している画像に対しても、文字
切り出しに有効なヒストグラムを得ることができること
により、もって、正確な文字の切り出し及び文字認識が
可能になる。

【００１２】

【実施例】以下、本発明の実施例について、添付の図面
を参照しながら詳細に説明する。まず、添付の図１に
は、本発明の実施例である文字認識装置が示されてい
る。この装置は、図にも示すように、例えばＣＣＤカメ
ラ等から成る画像撮像装置１と、前記画像撮像装置から
の画像データを処理する電子計算機２とから構成されて
いる。さらに、この電子計算機２は、その機能により、
入力された画像データを記憶するためのメモリから構成
される画像データ記憶装置２１、画像データから文字領
域を抽出する文字列領域抽出手段２２、画像データから
背景領域の濃度値を算出するための背景領域濃度値算出
手段２３、後に詳細に説明する差分２乗累積値を算出す
るための差分２乗累積値算出手段２４、算出した値をヒ
ストグラムとして表示するヒストグラム表現手段２５、
ヒストグラムに基づいて文字領域座標を決定する文字領
域座標決定手段２６、画像データと決定された文字領域
座標とから文字を認識するための文字認識手段２７、そ
して、文字認識のために使用される文字認識辞書を記憶
する文字認識辞書手段２８を備えている。撮像対象は刻
印文字であり、撮像した画像は低品質であるものとす
る。低品質とは、文字そのものがはっきり撮像できず、
さらに背景雑音が多いといった状態を云う。

【００１３】続いて、上記にその構成を説明した文字認
識装置の動作について、添付の図２乃至図４を参照しな
がら、以下に詳細に説明する。まず、図２のフローチャ
ートにおいて、画像撮像装置１から入力された画像デー
タは、電子計算機２の画像データ記憶装置２１内に記憶
される。その後、文字列領域抽出手段２２は、前記画像
データ記憶装置２１から画像データを取り出し、特に、
低品質画像については、既に一般に知られている処理で
ある、例えばガンマ補正、メディアンフィルタ、鮮鋭化
等の画像処理を施し、もって、画像の背景領域の濃度む
らを出来る限り緩和した後、濃度ヒストグラム等を用い
て文字列領域を抽出する文字列抽出処理を行う（ステッ
プ１０１）。

【００１４】次に、上記の文字列抽出手段２２による文
字列抽出処理を抽出された全文字列に対し行ったか否か
を判定し（ステップ１０２）、その結果、全文字列に対
して文字抽出処理が終了している（「Ｙｅｓ」）と判断
された場合には、上記文字認識手段２７及び文字認識辞
書手段２８により文字認識を行い（１０６）、処理を終
了する。

【００１５】一方、上記ステップ１０２により、上記文
字列抽出処理を未だ全文字列に対して行っていない
（「Ｎｏ」）場合には、次に、背景領域濃度値算出手段
２３によって、文字列領域の文字列に対して平行方向の
各座標位置の全てについてその背景濃度値を算出したか
否かを確認し（ステップ１０３）、未だ全てが終了して
いない（「Ｎｏ」）場合には、後に詳細に説明する方法
により背景領域濃度を算出し（ステップ１０４）、さら
に、背景領域濃度値と文字列領域濃度値との差分累積値
を算出し（ステップ１０５）、再び上記ステップ１０３
へ戻る。これに対し、上記ステップ１０３において、文
字列領域の文字列に対して平行方向の各座標位置の全て
についてその背景濃度値が算出されている（「Ｙｅ
ｓ」）の場合には、その処理フローは上記ステップ１０
２へ戻ることとなる。

【００１６】図３には、上記背景領域濃度算出手段２３
による背景領域濃度の算出処理の詳細が示されている。
この図において、まず、背景領域濃度値を文字列領域の
全ての平行方向座標位置（ｉ）に対して算出したか否か
を確認する（ステップ２０１）。その結果、全平行方向
座標位置に対して背景領域濃度が算出された（「Ｙｅ
ｓ」）と判定された場合には、この処理は終了する。

【００１７】一方、未だ全平行方向座標位置に対して背
景領域濃度の算出が行われていないと判定される（「Ｎ
ｏ」）場合には、まず始めに、累積値を「０」で初期化
する（ステップ２０２）。すなわち、累積値ＳＵＭ１＝
ＳＵＭ２＝０とする。次に、上側背景領域画素に対して
その濃度値を累積し、この累積値をＳＵＭ１とおき（ス
テップ２０３）、続いて、上側背景領域画素数（Ａ）を
全て終了したか否かを確認し（ステップ２０４）、あら
かじめ設定された数（Ａ）の上側背景領域画素に対して
その濃度値を累積する。同様にして、あらかじめ設定さ
れた数（Ｂ）の下側背景領域画素の全てに対しても、そ
の濃度値を累積し、これをＳＵＭ２とおく（ステップ２
０５、２０６）。

【００１８】その後、これら累積値ＳＵＭ１とＳＵＭ２
の平均値を以下の〔数１〕に従って算出し、これを水平
方向座標位置（ｉ）における背景領域濃度値ｂ（ｉ）と
設定する（ステップ２０７）。

【数１】ｂ（ｉ）＝（ＳＵＭ１＋ＳＵＭ２）／（Ａ＋Ｂ）すなわち、このｂ（ｉ）が、当該平行方向座標位置にお
ける背景領域濃度値である。

【００１９】次に、上記差分２乗累積値算出手段２４に
より、差分２乗累積値を算出する処理について、添付の
図４を参照しながら説明する。まず、差分２乗累積値算
出手段２４は、上記の背景領域濃度値と同様、文字列領
域の全平行方向座標位置に対してその差分２乗累積値算
出する。すなわち、まず始めに、文字列領域の全ての水
平方向座標位置（ｉ）に対して差分２乗累積値を求める
処理を行ったか否かを確認し（ステップ３０１）、その
結果が「Ｙｅｓ」であれば処理を終了する。

【００２０】一方、上記のステップ３０１で「Ｎｏ」で
ある場合、差分２乗累積値を０で初期化してＤＩＦ
（ｉ）＝０とおく（ステップ３０２）。次に、背景領域
濃度値算出手段２３によって求めた当該平行方向座標位
置における背景領域濃度値を設定し、文字列領域の全垂
直方向座標位置の画素に対して行ったか否かを確認し
（ステップ３０３）、「Ｙｅｓ」の場合は上記ステップ
３０１へ戻る。

【００２１】このステップ３０３で「Ｎｏ」となった場
合には、文字列領域における当該画素の濃度値、ｇ（ｉ
ｊ）を設定し（ステップ３０４）、続いて、下記の〔数
２〕

【数２】ＤＩＦ（ｉ）＝ＤＩＦ（ｉ）＋｛ｇ（ｉｊ）−ｂ（ｉ）｝² で示すように、上記で設定した背景領域濃度値との差分
の２乗を累積していくことにより（ステップ３０５）、
各垂直方向座標位置における文字列領域濃度と背景領域
濃度との差分２乗累積値を求め、再び上記のステップ３
０３へ戻る。

【００２２】以上にその処理手順を詳細に説明した本発
明の文字切り出し方法の原理の理解のために、背景領域
濃度値と差分２乗累積値の算出の一例を示しながら、以
下に、図５を用いながら、より具体的に説明する。ま
ず、図５（Ａ）は、文字画像「Ｅ」の例（実際は濃淡
画像であるが、ここでは簡単のため２値画像としてい
る）であり、上記の文字列抽出手段２２によって抽出し
た文字列領域が中央部に示されている。同図（Ｂ）は、
この文字列領域、およびその上側背景領域及び下側背景
領域の各画素の濃度値の一例を示したものである。尚、
図にも明かなように、本例では、上側背景領域画素数、
下側背景領域画素数ともに２（２行）を採用している。

【００２３】続いて、同図（Ｃ）は、各平行方向座標位
置（座標０…座標６）に対して求められた背景領域濃度
値と差分２乗累積値を、また同図（Ｄ）は、各平行方向
座標位置（座標０…座標６）において決定した差分２乗
累積値をヒストグラムとして表現したものを、それぞ
れ、示したものである。

【００２４】このとき、本発明によれば、平行方向座標
位置の座標０における背景領域濃度値ｂ(０)は次のよう
に求められる（図３に示すフローのステップ２０７を参
照）。ｂ(０)＝（１＋３＋３＋０）／（２＋２）＝１.７５

【００２５】一方、平行方向座標位置の座標０におけ
る、文字列領域の各画素の濃度値と背景領域濃度値との
差分２乗累積値をＤＩＦ(０)とすると、ＤＩＦ(０)を次
のように求める（図４のフローのステップ３０５を参
照）。ＤＩＦ(０)＝（６−１.７５）²＋（５−１.７５）²＋（４−１.７５）² ＋（５−１.７５）²＋（４−１.７５）²＋（３−１.７５）² ＝５０.８７５同様にして、平行方向座標位置の座標１、座標２、座標
３、…に対して、その背景領域濃度値ｂ（１）、ｂ
（２）、ｂ（３）…、及び差分２乗累積値ＤＩＦ
（１）、ＤＩＦ（２）、ＤＩＦ（３）…を求める。

【００２６】以上のようにして、文字列領域の全平行方
向座標位置に対して背景領域濃度値と差分２乗累積値を
求めたものが図５（Ｃ）に示され、また、この差分２乗
累積値を図１のヒストグラム表現手段２５によって、ヒ
ストグラムとして表現したものが、同図（Ｄ）である。

【００２７】次に、このヒストグラムから図１の文字領
域座標値決定手段２６によって、あらかじめ設定されて
いたしきい値から判断し、文字領域を切り出す。上記の
図５（Ｄ）に示すヒストグラムの例の場合には、平行方
向座標位置の座標２から座標５までの４画素が文字領域
とされて切り出される。

【００２８】以上の処理により、入力された濃淡画像デ
ータに含まれる全文字領域を切り出した後、文字認識手
段２７において、切り出された各文字画像と、あらかじ
め用意された文字認識辞書手段２８との照合により、文
字を認識し、文字コードに変換して出力することは既述
の通りである（図２のステップ１０６等を参照）。

【００２９】上記の本発明の文字切り出し方法及びそれ
を利用した文字切り出し装置によると、添付の図６に示
すように、例えば同図（Ｂ）に示すような撮像した刻印
文字である低品質画像に対しても、同図（Ａ）に示すよ
うな良好なヒストグラムを得ることができ、文字領域を
正確に切り出すことが出来る。また、図７に示すよう
に、文字線部分と背景領域部分の濃度値が互いに反転し
ている画像（同図（Ｂ）及び（Ｄ））に対しても、本発
明によれば同図（Ａ）及び（Ｃ）のように、良好なヒス
トグラムを得ることができる。すなわち、このことは、
本発明になる文字切り出し方法が、文字列に平行方向の
各座標位置に対する背景領域濃度値と文字列領域の各画
素との差分２乗累積値を評価することによって、文字線
部分と背景領域部分の濃度反転に対して柔軟に対応する
ことが可能であることを示すものである。

【００３０】さらに、本発明の文字切り出し方法は、文
字列に対して垂直方向に細長い文字を含む文字列に対し
ても良好なヒストグラムを得ることが出来る。添付の図
８は、文字列に対して垂直方向に細長い文字である
「７」（同図の（Ｂ））に対する本発明の背景領域濃度
値と文字列領域の各画素との差分２乗累積値によるヒス
トグラム（同図の（Ａ））を示している。これは、ばら
つき度が文字列領域の各行について、その前後の複数行
における濃度のばらつき度合いを調べるという従来の方
法に対し（図１１を参照）、本発明が、背景領域濃度値
と文字列領域の濃度値との差分累積値を用いていること
によるものであり、文字列に対して垂直方向に細長い文
字に対しても柔軟に対応し、正確な文字切り出しを行う
ことが可能であることを示すものである。尚、刻印文字
以外の低品質画像一般の認識にも本実施例は適用でき
る。

【００３１】

【発明の効果】以上説明したように、本発明の文字切り
出し方法及び方式、並びに、それを利用した文字認識装
置によれば、文字列に対し平行方向の各座標位置ごとに
背景領域濃度値を算出し、この背景領域濃度値と、文字
列領域の当該平行方向位置の各画素の濃度値との差分２
乗累積値を求めてヒストグラム表現することによって、
背景領域濃度値の変動にも柔軟に対応できることとな
り、文字領域の正確な切り出しが可能となり、そのた
め、背景領域の濃度値が一定ではない低品質画像や、文
字列に対して垂直方向に細長い文字に対しても、文字領
域を正確に切り出すことが可能になり、正確な文字認識
が可能になるという優れた効果を発揮する。

【図面の簡単な説明】

【図１】本発明の文字切り出し方法及び方式を用いた本
発明の一実施例である文字認識装置の全体構成を示すブ
ロック図である。

【図２】上記図１の文字認識装置の全体処理を示すフロ
ー図である。

【図３】上記図２に示した全体処理フローの、特に、そ
の背景領域濃度値算出処理を示すフロー図である。

【図４】上記図２に示した全体処理フローの、特に、そ
の差分２乗累積値算出処理を示すフロー図である。

【図５】本発明の原理を説明するため、具体的な文字画
像における背景領域濃度値と差分２乗累積値の関係を示
した動作説明図である。

【図６】低品質画像と、この画像から本発明の文字認識
装置により得られた濃度ヒストグラムを示す図である。

【図７】濃度値が互いに反転している低品質画像と、こ
れらの画像から本発明の文字認識装置により得られた濃
度ヒストグラムを示す図である。

【図８】文字列に垂直方向に細長い文字を含む低品質画
像と、この画像から本発明の文字認識装置により得られ
た濃度ヒストグラムを示す図である。

【図９】従来技術における低品質画像とそれから得られ
た濃度ヒストグラムの一例を示した図である。

【図１０】従来技術における低品質画像とそのばらつき
の一例を示した図である。

【図１１】従来技術における文字列に垂直方向に細長い
文字を含む低品質画像とそれから得られた濃度ヒストグ
ラムの一例を示した図である。

【図１２】従来技術における濃度値が互いに反転してい
る低品質画像と、それらから得られた濃度ヒストグラム
の一例を示した図である。

【符号の説明】

１画像撮像装置２電子計算機２１画像データ記憶装置２２文字列領域抽出手段２３背景領域濃度値算出手段２４背景領域濃度値に対する差分２乗累積値算出手段２５ヒストグラム表現手段２６文字領域座標値決定手段２７文字認識手段２８文字認識辞書手段

Claims

【特許請求の範囲】

【請求項１】撮像装置を用いて入力した２次元濃淡画
像から文字領域を切り出す文字切り出し方法において、撮像装置からの画像データを取り込んで所定の画像処理
を施して文字列領域を抽出し、前記文字列領域の文字列に平行方向の各平行方向座標位
置に対し、前記文字列領域の上側背景領域画素と下側背
景画素から背景領域濃度値を求め、前記文字列領域の文字列に平行方向の各平行方向座標位
置に対し、前記文字列領域の垂直方向の全ての画素にお
ける前記背景領域濃度値との差分２乗累積値を算出し、前記算出した各平行方向座標位置における差分２乗累積
値に基づいて、前記文字列領域の文字列に平行方向座標
位置における文字領域を決定することを特徴とする文字
切り出し方法。
【請求項２】前記請求項１において、前記背景領域濃
度値は、前記文字列領域の上側背景領域画素と下側背景
画素における濃度値の平均値により求めることを特徴と
する文字切り出し方法。
【請求項３】前記請求項１において、前記文字列領域
の文字列に平行方向座標位置における文字領域を決定す
る場合には、前記算出した各平行方向座標位置における
差分２乗累積値を所定のしきい値に比較して決定するこ
とを特徴とする文字切り出し方法。
【請求項４】撮像装置を用いて２次元の濃淡画素空間
に入力された文字列を含む濃淡画像から文字領域を切り
出すに際して、濃度ヒストグラム等を用いて文字列領域
を濃淡画像から抽出した後、その文字列領域から各文字
領域を切り出す文字切り出し方法において、文字列に平行方向の各画素座標位置に対し、文字列領域
の上端及び下端から文字列に対し垂直にそれぞれ適当な
背景領域の連続画素を選択し、これら連続画素の濃度値
の平均値を当該平行方向座標位置における背景領域濃度
値として求め、この背景領域濃度値と当該平行方向座標
位置における文字列領域の垂直方向各画素の濃度値との
差分２乗累積値を、文字列に平行方向の各座標位置に対
して算出する、ことを特徴とする文字切り出し方法。
【請求項５】前記請求項４の方法によって決定された
背景領域濃度値と文字列領域濃度値との差分２乗累積値
を用いて、しきい値を決定することにより濃淡画像を２
値画像に変換する文字切り出し方法。
【請求項６】文字列を含む２次元の濃淡画像データを
取り込む撮像装置と、前記撮像装置からの前記濃淡画像
データから文字領域を切り出して認識し、対応する文字
コードを出力する演算装置とを備えた文字認識装置であ
って、前記演算装置は、撮像装置からの画像データを取り込んで所定の画像処理
を施して文字列領域を抽出する文字列領域抽出手段と、前記文字列領域の文字列に平行方向の各平行方向座標位
置に対し、前記文字列領域の上側背景領域画素と下側背
景画素から背景領域濃度値を求める背景領域濃度値算出
手段と、前記文字列領域の文字列に平行方向の各平行方向座標位
置に対し、前記文字列領域の垂直方向の全ての画素にお
ける前記背景領域濃度値との差分２乗累積値を算出する
差分２乗累積算出手段と、前記算出した各平行方向座標位置における差分２乗累積
値に基づいて、前記文字列領域の文字列に平行方向座標
位置における文字領域を決定する文字領域座標値決定手
段と、そして、前記文字領域座標値決定手段によって切り出された文字
領域の文字画像を認識して対応する文字コードに変換す
る文字認識手段とを備えたことを特徴とする文字認識装
置。
【請求項７】前記請求項６において、前記背景領域濃
度値算出手段は、前記文字列領域の上側背景領域画素と
下側背景画素からの濃度値を平均して前記背景領域濃度
を算出することを特徴とする文字認識装置。
【請求項８】前記請求項６において、前記背景領域濃
度値算出手段は、以下の式ｂ（ｉ）＝（ＳＵＭ１＋ＳＵＭ２）／（Ａ＋Ｂ）によって前記背景領域濃度を算出し、ここで、ｂ（ｉ）は前記文字列領域の文字列に平行方向
の平行座標位置ｉにおける背景領域濃度であり、ＳＵＭ
１は前記文字列領域の上側背景領域画素の濃度の累積値
を、ＳＵＭ２は前記文字列領域の下側背景領域画素の濃
度の累積値を、Ａは前記文字列領域の上側背景領域画素
の画素数を、そして、Ｂは前記文字列領域の下側背景領
域画素の画素数を表すことを特徴とする文字認識装置。
【請求項９】前記請求項６において、前記差分２乗累
積算出手段は、以下の式ＤＩＦ（ｉ）＝ＤＩＦ（ｉ）＋｛ｇ（ｉｊ）−ｂ（ｉ）｝² により差分２乗累積値（ＤＩＦ（ｉ））を算出し、ここで、ｇ（ｉｊ）は前記文字列領域の文字列に平行方
向の平行座標位置ｉにおける各画素における濃度値であ
り、そして、ｂ（ｉ）は前記文字列領域の文字列に平行
方向の平行座標位置ｉにおける背景領域濃度値であるこ
とを特徴とする文字認識装置。
【請求項１０】前記請求項６において、さらに、前記
差分２乗累積値算出手段により算出された結果をヒスト
グラムに表現するヒストグラム表現手段を備えたことを
特徴とする文字認識装置。
【請求項１１】前記請求項１０において、前記文字領
域座標値決定手段は、ヒストグラム表現手段によってヒ
ストグラム表示された各平行方向座標位置における差分
２乗累積値を所定のしきい値に比較し、もって、前記文
字列領域の文字列に平行方向座標位置における文字領域
を決定することを特徴とする文字認識装置。
【請求項１２】前記請求項６において、前記文字列領
域抽出手段は、ガンマ補正、メディアンフィルタ、鮮鋭
化による画像処理のうちの少なくとも一つの処理を施す
画像処理手段と、濃度ヒストグラムを用いて前記文字列
領域を抽出する文字列抽出手段処理とを備えたことを特
徴とする文字認識装置。
【請求項１３】前記請求項６において、前記文字認識
手段は、さらに、切り出された文字画像を照合するため
の辞書データを記憶する文字認識辞書手段を備えている
ことを特徴とする文字認識装置。