JPH0652355A - 文字切り出し方法、並びに、文字認識装置 - Google Patents

文字切り出し方法、並びに、文字認識装置

Info

Publication number
JPH0652355A
JPH0652355A JP4205189A JP20518992A JPH0652355A JP H0652355 A JPH0652355 A JP H0652355A JP 4205189 A JP4205189 A JP 4205189A JP 20518992 A JP20518992 A JP 20518992A JP H0652355 A JPH0652355 A JP H0652355A
Authority
JP
Japan
Prior art keywords
character
area
character string
value
density
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP4205189A
Other languages
English (en)
Inventor
Yukio Hamaguchi
幸雄 浜口
Takashi Nakao
隆司 中尾
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Engineering Co Ltd
Original Assignee
Hitachi Engineering Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Engineering Co Ltd filed Critical Hitachi Engineering Co Ltd
Priority to JP4205189A priority Critical patent/JPH0652355A/ja
Publication of JPH0652355A publication Critical patent/JPH0652355A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Abstract

(57)【要約】 (修正有) 【目的】 刻印文字等の低品質画像、背景濃度が一定で
ない画像、文字線部と背景濃度が反転している画像に対
しても、文字領域を正確に切出す文字認識装置を提供。 【構成】 画像撮像装置1とそれから取り込んだデータ
に所定の処理を施し文字領域を切り出し、認識し文字コ
ードに変換出力する。電子計算機2から成る文字認識装
置において、文字領域抽出手段22は装置1からのデー
タを取り込み領域を抽出し、背景領域濃度値算出手段2
3は文字列に平行方向の座標位置に対し上側背景領域画
素と下側背景画素から濃度値を求め、差分2乗累積算出
手段24は文字領域の文字列に平行座標位置に対し、文
字列領域の上側と下側の濃度値を求め、差分2乗累積算
出手段24は文字列垂直方向の差分2乗累積を算出し、
文字領域座標値決定手段16は算出した差分2乗累積に
基づいて平行方向位置における領域を決定、文字認識手
段27は切出された文字画像を認識・文字コード変換
す。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、画像認識に関し、特
に、認識対象とする文字等の画像パターンが存在する領
域を抽出する切り出し方法、並びに、それを利用した文
字認識装置に関する。
【0002】
【従来の技術】画像認識の分野においては、与えられた
画像から、認識対象とする画像パターンが存在する領域
を抽出する処理を「切り出し処理」と呼ぶ。一般に認識
処理は、認識対象とする画像の正確な切り出しを前提と
している場合が大部分であり、文字認識においても例外
ではない。これは、文字認識装置等が例え非常に優れた
認識処理機能を有していても、切り出し処理に難があれ
ば、認識処理の利点が全く発揮されないということを意
味する。また、特に、FA(Factory Automation)分野
に利用される文字認識装置においては、撮像環境等によ
り画質の良好な画像が与えられることは稀であり、画質
の劣悪な画像から文字領域を正確に切り出すことは極め
て困難である。例えば自動車生産行程での刻印文字の認
識では、先ずTVカメラやCCDで刻印文字を撮像する
が、撮像状態はよくない。刻印そのものがはっきりして
いなかったり、撮像位置によって反射の仕方が変わった
り、刻印文字と背景との区別がはっきりしなかったりす
るためである。
【0003】ところで、一般に、与えられた画像から文
字領域を切り出す処理として広く使用されている手法
に、濃度ヒストグラム法がある。添付の図9は、低品質
画像(図9の(B)に示した文字列「NER」が低品質
画像を示している)とその濃度ヒストグラム(図9の
(A))を示したものである。また、関連する公知例と
しては、電子情報通信学会論文誌D−II、Vol.J72-D-
IINo.9(1989年)の第1407〜1414頁に掲
載のように、ばらつき度によるものがある。これは、文
字列領域の各行について、その前後の複数行における濃
度のばらつきの度合い(ばらつき度)を調べることによ
り、文字領域を切り出す方式である。添付の図10は、
刻印文字を撮像して得た低品質画像(図10の(B)の
文字列「NER」)と、そのばらつき度をヒストグラム
として表現したもの(図10の(A))を示している。
【0004】上記の従来技術のうち、前者の濃度ヒスト
グラムによる方式では、微妙な濃度変化をも確実に表現
できることから、一般に、背景領域の濃度値が一定であ
る高品質画像に対しては良好な結果が得られることが多
い。このため、一連の画像からある領域を抽出しようと
するとき、この濃度ヒストグラムが用いられることが多
い。
【0005】
【発明が解決しようとする課題】しかしながら、上記の
濃度ヒストグラムによる方式では、上記の図9に示した
ような低品質画像においては、その背景領域の濃度値が
一定ではないため、文字領域を切り出すためのしきい値
を適切に決定できないことが多い。また、この従来の方
式では、文字線部分と背景部分の濃度値が互いに反転し
ている1組の画像に対しては、その文字線部分と背景部
分を識別することが出来ず、あらかじめ文字線部分と背
景部分の濃度の関係、すなわち文字線部分の濃度が高く
かつ背景部分の濃度が低いのか、あるいはその逆である
のかを設定して置かない限り、それぞれの画像に対して
文字領域を正確に切り出すことは不可能であり、そのた
め、例えば刻印文字画像など、撮像対象物の角度や照明
角度によっては文字線部分と背景部分の濃度が互いに反
転することが頻繁に発生するものには、この方式は適用
することが出来ないという問題点があった。具体的に
は、添付の図12の(B)及び(D)には、文字線部分
と背景部分の濃度値が互いに反転している低品質画像の
組合せと、それに対する濃度ヒストグラム(図12の
(A)及び(C))が、それぞれ、示されている。これ
らの図にも見られるように、特に低品質画像において
は、上記濃度ヒストグラムは、文字領域を正確に切り出
すための有効な情報とはなり得ないことが明かである。
【0006】また、上記従来技術のうちの後者に示され
た濃度のばらつき度による方法では、文字列領域の各行
について、文字列に対して垂直方向の濃度のばらつき度
合いにより文字領域を切り出すため、文字列に対して垂
直方向に細長い文字に対しては必然的にばらつき度は低
くなり、そのため、細長い文字に対しての文字領域の正
確な切り出しが出来なくなるという問題がある。これを
具体的に説明すると、添付の図11に示すように、例え
ば数字の「7」が文字列に対して垂直方向に細長い文字
であるため、ばらつき度は同じ文字列領域に含まれる他
の文字、この場合には数字の「6」や「8」に比較して
かなり小さくなってしまい、これでは、「7」の文字領
域を正確に切り出すことは不可能となる。
【0007】そこで、本発明では、上記の従来技術にお
ける問題点を克服し、低品質画像であってもその文字領
域を正確に切り出すことの可能な文字切り出し方法、並
びに、文字認識装置を実現することを目的とする。
【0008】
【課題を解決するための手段】上記の本発明の目的は、
本発明によれば、まず、撮像装置を用いて入力した2次
元濃淡画像から文字領域を切り出す文字切り出し方法で
あって、撮像装置からの画像データを取り込んで所定の
画像処理を施して文字列領域を抽出し、前記文字列領域
の文字列に平行方向の各平行方向座標位置に対し、前記
文字列領域の上側背景領域画素と下側背景画素から背景
領域濃度値を求め、前記文字列領域の文字列に平行方向
の各平行方向座標位置に対し、前記文字列領域の垂直方
向の全ての画素における前記背景領域濃度値との差分2
乗累積値を算出し、前記算出した各平行方向座標位置に
おける差分2乗累積値に基づいて、前記文字列領域の文
字列に平行方向座標位置における文字領域を決定する文
字切り出し方法によって達成される。
【0009】また、上記本発明の目的を達成する他の手
段として、本発明によれば、撮像装置を用いて2次元の
濃淡画素空間に入力された文字列を含む濃淡画像から文
字領域を切り出すに際して、濃度ヒストグラム等を用い
て文字列領域を濃淡画像から抽出した後、その文字列領
域から各文字領域を切り出す文字切り出し方法におい
て、文字列に平行方向の各画素座標位置に対し、文字列
領域の上端及び下端から文字列に対し垂直にそれぞれ適
当な背景領域の連続画素を選択し、これら連続画素の濃
度値の平均値を当該平行方向座標位置における背景領域
濃度値として求め、この背景領域濃度値と当該平行方向
座標位置における文字列領域の垂直方向各画素の濃度値
との差分2乗累積値を、文字列に平行方向の各座標位置
に対して算出する文字切り出し方法が提案されている。
【0010】さらに、本発明によれば、上記の方法ある
いは方式を利用した文字認識装置として、文字列を含む
2次元の濃淡画像データを取り込む撮像装置と、前記撮
像装置からの前記濃淡画像データから文字領域を切り出
して認識し、対応する文字コードを出力する演算装置と
を備えた文字認識装置であって、前記演算装置は、撮像
装置からの画像データを取り込んで所定の画像処理を施
して文字列領域を抽出する文字列領域抽出手段と、前記
文字列領域の文字列に平行方向の各平行方向座標位置に
対し、前記文字列領域の上側背景領域画素と下側背景画
素から背景領域濃度値を求める背景領域濃度値算出手段
と、前記文字列領域の文字列に平行方向の各平行方向座
標位置に対し、前記文字列領域の垂直方向の全ての画素
における前記背景領域濃度値との差分2乗累積値を算出
する差分2乗累積算出手段と、前記算出した各平行方向
座標位置における差分2乗累積値に基づいて、前記文字
列領域の文字列に平行方向座標位置における文字領域を
決定する文字領域座標値決定手段と、そして、前記文字
領域座標値決定手段によって切り出された文字領域の文
字画像を認識して対応する文字コードに変換する文字認
識手段とを備えた文字認識装置が提案されている。
【0011】
【作用】すなわち、上記の本発明による構成によれば、
あらかじめ背景領域濃度値を文字列に平行方向の各座標
位置に対して求め、この値と当該平行方向座標位置に対
する文字列領域の各画素の濃度値との差分累積値を各平
行方向座標位置に対して求めることにより、背景領域濃
度が一定ではない低品質画像や、文字線部分と背景領域
部分の濃度が互いに反転している画像に対しても、文字
切り出しに有効なヒストグラムを得ることができること
により、もって、正確な文字の切り出し及び文字認識が
可能になる。
【0012】
【実施例】以下、本発明の実施例について、添付の図面
を参照しながら詳細に説明する。まず、添付の図1に
は、本発明の実施例である文字認識装置が示されてい
る。この装置は、図にも示すように、例えばCCDカメ
ラ等から成る画像撮像装置1と、前記画像撮像装置から
の画像データを処理する電子計算機2とから構成されて
いる。さらに、この電子計算機2は、その機能により、
入力された画像データを記憶するためのメモリから構成
される画像データ記憶装置21、画像データから文字領
域を抽出する文字列領域抽出手段22、画像データから
背景領域の濃度値を算出するための背景領域濃度値算出
手段23、後に詳細に説明する差分2乗累積値を算出す
るための差分2乗累積値算出手段24、算出した値をヒ
ストグラムとして表示するヒストグラム表現手段25、
ヒストグラムに基づいて文字領域座標を決定する文字領
域座標決定手段26、画像データと決定された文字領域
座標とから文字を認識するための文字認識手段27、そ
して、文字認識のために使用される文字認識辞書を記憶
する文字認識辞書手段28を備えている。撮像対象は刻
印文字であり、撮像した画像は低品質であるものとす
る。低品質とは、文字そのものがはっきり撮像できず、
さらに背景雑音が多いといった状態を云う。
【0013】続いて、上記にその構成を説明した文字認
識装置の動作について、添付の図2乃至図4を参照しな
がら、以下に詳細に説明する。まず、図2のフローチャ
ートにおいて、画像撮像装置1から入力された画像デー
タは、電子計算機2の画像データ記憶装置21内に記憶
される。その後、文字列領域抽出手段22は、前記画像
データ記憶装置21から画像データを取り出し、特に、
低品質画像については、既に一般に知られている処理で
ある、例えばガンマ補正、メディアンフィルタ、鮮鋭化
等の画像処理を施し、もって、画像の背景領域の濃度む
らを出来る限り緩和した後、濃度ヒストグラム等を用い
て文字列領域を抽出する文字列抽出処理を行う(ステッ
プ101)。
【0014】次に、上記の文字列抽出手段22による文
字列抽出処理を抽出された全文字列に対し行ったか否か
を判定し(ステップ102)、その結果、全文字列に対
して文字抽出処理が終了している(「Yes」)と判断
された場合には、上記文字認識手段27及び文字認識辞
書手段28により文字認識を行い(106)、処理を終
了する。
【0015】一方、上記ステップ102により、上記文
字列抽出処理を未だ全文字列に対して行っていない
(「No」)場合には、次に、背景領域濃度値算出手段
23によって、文字列領域の文字列に対して平行方向の
各座標位置の全てについてその背景濃度値を算出したか
否かを確認し(ステップ103)、未だ全てが終了して
いない(「No」)場合には、後に詳細に説明する方法
により背景領域濃度を算出し(ステップ104)、さら
に、背景領域濃度値と文字列領域濃度値との差分累積値
を算出し(ステップ105)、再び上記ステップ103
へ戻る。これに対し、上記ステップ103において、文
字列領域の文字列に対して平行方向の各座標位置の全て
についてその背景濃度値が算出されている(「Ye
s」)の場合には、その処理フローは上記ステップ10
2へ戻ることとなる。
【0016】図3には、上記背景領域濃度算出手段23
による背景領域濃度の算出処理の詳細が示されている。
この図において、まず、背景領域濃度値を文字列領域の
全ての平行方向座標位置(i)に対して算出したか否か
を確認する(ステップ201)。その結果、全平行方向
座標位置に対して背景領域濃度が算出された(「Ye
s」)と判定された場合には、この処理は終了する。
【0017】一方、未だ全平行方向座標位置に対して背
景領域濃度の算出が行われていないと判定される(「N
o」)場合には、まず始めに、累積値を「0」で初期化
する(ステップ202)。すなわち、累積値SUM1=
SUM2=0とする。次に、上側背景領域画素に対して
その濃度値を累積し、この累積値をSUM1とおき(ス
テップ203)、続いて、上側背景領域画素数(A)を
全て終了したか否かを確認し(ステップ204)、あら
かじめ設定された数(A)の上側背景領域画素に対して
その濃度値を累積する。同様にして、あらかじめ設定さ
れた数(B)の下側背景領域画素の全てに対しても、そ
の濃度値を累積し、これをSUM2とおく(ステップ2
05、206)。
【0018】その後、これら累積値SUM1とSUM2
の平均値を以下の〔数1〕に従って算出し、これを水平
方向座標位置(i)における背景領域濃度値b(i)と
設定する(ステップ207)。
【数1】 b(i)=(SUM1+SUM2)/(A+B) すなわち、このb(i)が、当該平行方向座標位置にお
ける背景領域濃度値である。
【0019】次に、上記差分2乗累積値算出手段24に
より、差分2乗累積値を算出する処理について、添付の
図4を参照しながら説明する。まず、差分2乗累積値算
出手段24は、上記の背景領域濃度値と同様、文字列領
域の全平行方向座標位置に対してその差分2乗累積値算
出する。すなわち、まず始めに、文字列領域の全ての水
平方向座標位置(i)に対して差分2乗累積値を求める
処理を行ったか否かを確認し(ステップ301)、その
結果が「Yes」であれば処理を終了する。
【0020】一方、上記のステップ301で「No」で
ある場合、差分2乗累積値を0で初期化してDIF
(i)=0とおく(ステップ302)。次に、背景領域
濃度値算出手段23によって求めた当該平行方向座標位
置における背景領域濃度値を設定し、文字列領域の全垂
直方向座標位置の画素に対して行ったか否かを確認し
(ステップ303)、「Yes」の場合は上記ステップ
301へ戻る。
【0021】このステップ303で「No」となった場
合には、文字列領域における当該画素の濃度値、g(i
j)を設定し(ステップ304)、続いて、下記の〔数
2〕
【数2】 DIF(i)=DIF(i)+{g(ij)−b(i)}2 で示すように、上記で設定した背景領域濃度値との差分
の2乗を累積していくことにより(ステップ305)、
各垂直方向座標位置における文字列領域濃度と背景領域
濃度との差分2乗累積値を求め、再び上記のステップ3
03へ戻る。
【0022】以上にその処理手順を詳細に説明した本発
明の文字切り出し方法の原理の理解のために、背景領域
濃度値と差分2乗累積値の算出の一例を示しながら、以
下に、図5を用いながら、より具体的に説明する。ま
ず、図5(A)は、文字画像 「E」の例(実際は濃淡
画像であるが、ここでは簡単のため2値画像としてい
る)であり、上記の文字列抽出手段22によって抽出し
た文字列領域が中央部に示されている。同図(B)は、
この文字列領域、およびその上側背景領域及び下側背景
領域の各画素の濃度値の一例を示したものである。尚、
図にも明かなように、本例では、上側背景領域画素数、
下側背景領域画素数ともに2(2行)を採用している。
【0023】続いて、同図(C)は、各平行方向座標位
置(座標0…座標6)に対して求められた背景領域濃度
値と差分2乗累積値を、また同図(D)は、各平行方向
座標位置(座標0…座標6)において決定した差分2乗
累積値をヒストグラムとして表現したものを、それぞ
れ、示したものである。
【0024】このとき、本発明によれば、平行方向座標
位置の座標0における背景領域濃度値b(0)は次のよう
に求められる(図3に示すフローのステップ207を参
照)。 b(0)=(1+3+3+0)/(2+2) =1.75
【0025】一方、平行方向座標位置の座標0におけ
る、文字列領域の各画素の濃度値と背景領域濃度値との
差分2乗累積値をDIF(0)とすると、DIF(0)を次
のように求める(図4のフローのステップ305を参
照)。 DIF(0)=(6−1.75)2+(5−1.75)2+(4−1.75)2 +(5−1.75)2+(4−1.75)2+(3−1.75)2 =50.875 同様にして、平行方向座標位置の座標1、座標2、座標
3、…に対して、その背景領域濃度値b(1)、b
(2)、b(3)…、及び差分2乗累積値DIF
(1)、DIF(2)、DIF(3)…を求める。
【0026】以上のようにして、文字列領域の全平行方
向座標位置に対して背景領域濃度値と差分2乗累積値を
求めたものが図5(C)に示され、また、この差分2乗
累積値を図1のヒストグラム表現手段25によって、ヒ
ストグラムとして表現したものが、同図(D)である。
【0027】次に、このヒストグラムから図1の文字領
域座標値決定手段26によって、あらかじめ設定されて
いたしきい値から判断し、文字領域を切り出す。上記の
図5(D)に示すヒストグラムの例の場合には、平行方
向座標位置の座標2から座標5までの4画素が文字領域
とされて切り出される。
【0028】以上の処理により、入力された濃淡画像デ
ータに含まれる全文字領域を切り出した後、文字認識手
段27において、切り出された各文字画像と、あらかじ
め用意された文字認識辞書手段28との照合により、文
字を認識し、文字コードに変換して出力することは既述
の通りである(図2のステップ106等を参照)。
【0029】上記の本発明の文字切り出し方法及びそれ
を利用した文字切り出し装置によると、添付の図6に示
すように、例えば同図(B)に示すような撮像した刻印
文字である低品質画像に対しても、同図(A)に示すよ
うな良好なヒストグラムを得ることができ、文字領域を
正確に切り出すことが出来る。また、図7に示すよう
に、文字線部分と背景領域部分の濃度値が互いに反転し
ている画像(同図(B)及び(D))に対しても、本発
明によれば同図(A)及び(C)のように、良好なヒス
トグラムを得ることができる。すなわち、このことは、
本発明になる文字切り出し方法が、文字列に平行方向の
各座標位置に対する背景領域濃度値と文字列領域の各画
素との差分2乗累積値を評価することによって、文字線
部分と背景領域部分の濃度反転に対して柔軟に対応する
ことが可能であることを示すものである。
【0030】さらに、本発明の文字切り出し方法は、文
字列に対して垂直方向に細長い文字を含む文字列に対し
ても良好なヒストグラムを得ることが出来る。添付の図
8は、文字列に対して垂直方向に細長い文字である
「7」(同図の(B))に対する本発明の背景領域濃度
値と文字列領域の各画素との差分2乗累積値によるヒス
トグラム(同図の(A))を示している。これは、ばら
つき度が文字列領域の各行について、その前後の複数行
における濃度のばらつき度合いを調べるという従来の方
法に対し(図11を参照)、本発明が、背景領域濃度値
と文字列領域の濃度値との差分累積値を用いていること
によるものであり、文字列に対して垂直方向に細長い文
字に対しても柔軟に対応し、正確な文字切り出しを行う
ことが可能であることを示すものである。尚、刻印文字
以外の低品質画像一般の認識にも本実施例は適用でき
る。
【0031】
【発明の効果】以上説明したように、本発明の文字切り
出し方法及び方式、並びに、それを利用した文字認識装
置によれば、文字列に対し平行方向の各座標位置ごとに
背景領域濃度値を算出し、この背景領域濃度値と、文字
列領域の当該平行方向位置の各画素の濃度値との差分2
乗累積値を求めてヒストグラム表現することによって、
背景領域濃度値の変動にも柔軟に対応できることとな
り、文字領域の正確な切り出しが可能となり、そのた
め、背景領域の濃度値が一定ではない低品質画像や、文
字列に対して垂直方向に細長い文字に対しても、文字領
域を正確に切り出すことが可能になり、正確な文字認識
が可能になるという優れた効果を発揮する。
【図面の簡単な説明】
【図1】本発明の文字切り出し方法及び方式を用いた本
発明の一実施例である文字認識装置の全体構成を示すブ
ロック図である。
【図2】上記図1の文字認識装置の全体処理を示すフロ
ー図である。
【図3】上記図2に示した全体処理フローの、特に、そ
の背景領域濃度値算出処理を示すフロー図である。
【図4】上記図2に示した全体処理フローの、特に、そ
の差分2乗累積値算出処理を示すフロー図である。
【図5】本発明の原理を説明するため、具体的な文字画
像における背景領域濃度値と差分2乗累積値の関係を示
した動作説明図である。
【図6】低品質画像と、この画像から本発明の文字認識
装置により得られた濃度ヒストグラムを示す図である。
【図7】濃度値が互いに反転している低品質画像と、こ
れらの画像から本発明の文字認識装置により得られた濃
度ヒストグラムを示す図である。
【図8】文字列に垂直方向に細長い文字を含む低品質画
像と、この画像から本発明の文字認識装置により得られ
た濃度ヒストグラムを示す図である。
【図9】従来技術における低品質画像とそれから得られ
た濃度ヒストグラムの一例を示した図である。
【図10】従来技術における低品質画像とそのばらつき
の一例を示した図である。
【図11】従来技術における文字列に垂直方向に細長い
文字を含む低品質画像とそれから得られた濃度ヒストグ
ラムの一例を示した図である。
【図12】従来技術における濃度値が互いに反転してい
る低品質画像と、それらから得られた濃度ヒストグラム
の一例を示した図である。
【符号の説明】
1 画像撮像装置 2 電子計算機 21 画像データ記憶装置 22 文字列領域抽出手段 23 背景領域濃度値算出手段 24 背景領域濃度値に対する差分2乗累積値算出手段 25 ヒストグラム表現手段 26 文字領域座標値決定手段 27 文字認識手段 28 文字認識辞書手段

Claims (13)

    【特許請求の範囲】
  1. 【請求項1】 撮像装置を用いて入力した2次元濃淡画
    像から文字領域を切り出す文字切り出し方法において、 撮像装置からの画像データを取り込んで所定の画像処理
    を施して文字列領域を抽出し、 前記文字列領域の文字列に平行方向の各平行方向座標位
    置に対し、前記文字列領域の上側背景領域画素と下側背
    景画素から背景領域濃度値を求め、 前記文字列領域の文字列に平行方向の各平行方向座標位
    置に対し、前記文字列領域の垂直方向の全ての画素にお
    ける前記背景領域濃度値との差分2乗累積値を算出し、 前記算出した各平行方向座標位置における差分2乗累積
    値に基づいて、前記文字列領域の文字列に平行方向座標
    位置における文字領域を決定することを特徴とする文字
    切り出し方法。
  2. 【請求項2】 前記請求項1において、前記背景領域濃
    度値は、前記文字列領域の上側背景領域画素と下側背景
    画素における濃度値の平均値により求めることを特徴と
    する文字切り出し方法。
  3. 【請求項3】 前記請求項1において、前記文字列領域
    の文字列に平行方向座標位置における文字領域を決定す
    る場合には、前記算出した各平行方向座標位置における
    差分2乗累積値を所定のしきい値に比較して決定するこ
    とを特徴とする文字切り出し方法。
  4. 【請求項4】 撮像装置を用いて2次元の濃淡画素空間
    に入力された文字列を含む濃淡画像から文字領域を切り
    出すに際して、濃度ヒストグラム等を用いて文字列領域
    を濃淡画像から抽出した後、その文字列領域から各文字
    領域を切り出す文字切り出し方法において、 文字列に平行方向の各画素座標位置に対し、文字列領域
    の上端及び下端から文字列に対し垂直にそれぞれ適当な
    背景領域の連続画素を選択し、これら連続画素の濃度値
    の平均値を当該平行方向座標位置における背景領域濃度
    値として求め、この背景領域濃度値と当該平行方向座標
    位置における文字列領域の垂直方向各画素の濃度値との
    差分2乗累積値を、文字列に平行方向の各座標位置に対
    して算出する、ことを特徴とする文字切り出し方法。
  5. 【請求項5】 前記請求項4の方法によって決定された
    背景領域濃度値と文字列領域濃度値との差分2乗累積値
    を用いて、しきい値を決定することにより濃淡画像を2
    値画像に変換する文字切り出し方法。
  6. 【請求項6】 文字列を含む2次元の濃淡画像データを
    取り込む撮像装置と、前記撮像装置からの前記濃淡画像
    データから文字領域を切り出して認識し、対応する文字
    コードを出力する演算装置とを備えた文字認識装置であ
    って、前記演算装置は、 撮像装置からの画像データを取り込んで所定の画像処理
    を施して文字列領域を抽出する文字列領域抽出手段と、 前記文字列領域の文字列に平行方向の各平行方向座標位
    置に対し、前記文字列領域の上側背景領域画素と下側背
    景画素から背景領域濃度値を求める背景領域濃度値算出
    手段と、 前記文字列領域の文字列に平行方向の各平行方向座標位
    置に対し、前記文字列領域の垂直方向の全ての画素にお
    ける前記背景領域濃度値との差分2乗累積値を算出する
    差分2乗累積算出手段と、 前記算出した各平行方向座標位置における差分2乗累積
    値に基づいて、前記文字列領域の文字列に平行方向座標
    位置における文字領域を決定する文字領域座標値決定手
    段と、そして、 前記文字領域座標値決定手段によって切り出された文字
    領域の文字画像を認識して対応する文字コードに変換す
    る文字認識手段とを備えたことを特徴とする文字認識装
    置。
  7. 【請求項7】 前記請求項6において、前記背景領域濃
    度値算出手段は、前記文字列領域の上側背景領域画素と
    下側背景画素からの濃度値を平均して前記背景領域濃度
    を算出することを特徴とする文字認識装置。
  8. 【請求項8】 前記請求項6において、前記背景領域濃
    度値算出手段は、以下の式 b(i)=(SUM1+SUM2)/(A+B) によって前記背景領域濃度を算出し、 ここで、b(i)は前記文字列領域の文字列に平行方向
    の平行座標位置iにおける背景領域濃度であり、SUM
    1は前記文字列領域の上側背景領域画素の濃度の累積値
    を、SUM2は前記文字列領域の下側背景領域画素の濃
    度の累積値を、Aは前記文字列領域の上側背景領域画素
    の画素数を、そして、Bは前記文字列領域の下側背景領
    域画素の画素数を表すことを特徴とする文字認識装置。
  9. 【請求項9】 前記請求項6において、前記差分2乗累
    積算出手段は、以下の式 DIF(i)=DIF(i)+{g(ij)−b(i)}2 により差分2乗累積値(DIF(i))を算出し、 ここで、g(ij)は前記文字列領域の文字列に平行方
    向の平行座標位置iにおける各画素における濃度値であ
    り、そして、b(i)は前記文字列領域の文字列に平行
    方向の平行座標位置iにおける背景領域濃度値であるこ
    とを特徴とする文字認識装置。
  10. 【請求項10】 前記請求項6において、さらに、前記
    差分2乗累積値算出手段により算出された結果をヒスト
    グラムに表現するヒストグラム表現手段を備えたことを
    特徴とする文字認識装置。
  11. 【請求項11】 前記請求項10において、前記文字領
    域座標値決定手段は、ヒストグラム表現手段によってヒ
    ストグラム表示された各平行方向座標位置における差分
    2乗累積値を所定のしきい値に比較し、もって、前記文
    字列領域の文字列に平行方向座標位置における文字領域
    を決定することを特徴とする文字認識装置。
  12. 【請求項12】 前記請求項6において、前記文字列領
    域抽出手段は、ガンマ補正、メディアンフィルタ、鮮鋭
    化による画像処理のうちの少なくとも一つの処理を施す
    画像処理手段と、濃度ヒストグラムを用いて前記文字列
    領域を抽出する文字列抽出手段処理とを備えたことを特
    徴とする文字認識装置。
  13. 【請求項13】 前記請求項6において、前記文字認識
    手段は、さらに、切り出された文字画像を照合するため
    の辞書データを記憶する文字認識辞書手段を備えている
    ことを特徴とする文字認識装置。
JP4205189A 1992-07-31 1992-07-31 文字切り出し方法、並びに、文字認識装置 Pending JPH0652355A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP4205189A JPH0652355A (ja) 1992-07-31 1992-07-31 文字切り出し方法、並びに、文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP4205189A JPH0652355A (ja) 1992-07-31 1992-07-31 文字切り出し方法、並びに、文字認識装置

Publications (1)

Publication Number Publication Date
JPH0652355A true JPH0652355A (ja) 1994-02-25

Family

ID=16502882

Family Applications (1)

Application Number Title Priority Date Filing Date
JP4205189A Pending JPH0652355A (ja) 1992-07-31 1992-07-31 文字切り出し方法、並びに、文字認識装置

Country Status (1)

Country Link
JP (1) JPH0652355A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8139862B2 (en) 2006-09-13 2012-03-20 Keyence Corporation Character extracting apparatus, method, and program
US8139861B2 (en) 2006-09-13 2012-03-20 Keyence Corporation Character extracting apparatus, method, and program

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8139862B2 (en) 2006-09-13 2012-03-20 Keyence Corporation Character extracting apparatus, method, and program
US8139861B2 (en) 2006-09-13 2012-03-20 Keyence Corporation Character extracting apparatus, method, and program

Similar Documents

Publication Publication Date Title
CN110046529B (zh) 二维码识别方法、装置及设备
CN110008809B (zh) 表格数据的获取方法、装置和服务器
KR101399709B1 (ko) 모델-기반 디워핑 방법 및 장치
WO2015184764A1 (zh) 行人检测方法及装置
US7457432B2 (en) Specified object detection apparatus
CN108416355B (zh) 一种基于机器视觉的工业现场生产数据的采集方法
WO2009114967A1 (zh) 基于移动扫描的图像处理方法及装置
CN112883795B (zh) 一种基于深度神经网络的表格快速自动提取方法
US10055668B2 (en) Method for the optical detection of symbols
CN113228105A (zh) 一种图像处理方法、装置和电子设备
CN111144156B (zh) 一种图像数据处理方法和相关装置
WO2023065505A1 (zh) 一种浮游生物原位观测的图像预处理方法及系统
JP2001043313A (ja) 文字切出し方法
US6983071B2 (en) Character segmentation device, character segmentation method used thereby, and program therefor
CN106951831B (zh) 一种基于深度摄像机的行人检测跟踪方法
CN116416624A (zh) 一种基于版面校正的文档电子化方法、装置以及存储介质
CN112532938B (zh) 一种基于大数据技术的视频监控系统
JPH0652355A (ja) 文字切り出し方法、並びに、文字認識装置
CN114758139A (zh) 基坑积水检测方法
CN112949423A (zh) 物体识别方法、物体识别装置及机器人
CN116798056B (zh) 表格图像定位方法、装置、设备、计算机可读存储介质
CN117291208B (zh) 一种二维码提取方法及系统
KR101312306B1 (ko) 표지판 인식장치, 표지판 인식방법, 및 이미지 인식방법
JP2590099B2 (ja) 文字読取方式
CN109117844B (zh) 一种密码确定方法和装置