JP2003346081A - 文字認識装置 - Google Patents

文字認識装置

Info

Publication number
JP2003346081A
JP2003346081A JP2002155928A JP2002155928A JP2003346081A JP 2003346081 A JP2003346081 A JP 2003346081A JP 2002155928 A JP2002155928 A JP 2002155928A JP 2002155928 A JP2002155928 A JP 2002155928A JP 2003346081 A JP2003346081 A JP 2003346081A
Authority
JP
Japan
Prior art keywords
character
pattern
hidden
area
hidden area
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2002155928A
Other languages
English (en)
Other versions
JP4228592B2 (ja
Inventor
Hiroyasu Miyahara
景泰 宮原
Yasuhiro Okada
康裕 岡田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Priority to JP2002155928A priority Critical patent/JP4228592B2/ja
Publication of JP2003346081A publication Critical patent/JP2003346081A/ja
Application granted granted Critical
Publication of JP4228592B2 publication Critical patent/JP4228592B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Character Discrimination (AREA)

Abstract

(57)【要約】 【課題】 中間色の物体に一部を隠された文
字を精度よく認識する 【解決手段】 多階調画素により表現された
隠れ領域を有する文字パターンを切り出し、この文字パ
ターンを領域分割して各領域の濃度特徴量を抽出し、前
記各領域についてその濃度特徴量に基づきその領域が前
記隠れ領域に含まれるか否かを決定する隠れ領域決定手
段と、文字認識の照合のための基準パターンを格納した
認識辞書と、前記隠れ領域に含まれる前記領域を除いた
領域について前記基準パターンと前記文字パターンとを
照合しその結果に基づき文字を出力する文字認識手段と
を備えた。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】この発明は、画像上の文字を
認識する文字認識装置に関するものであり、特に文字の
一部が隠れたものを認識する文字認識装置に関するもの
である。
【0002】
【従来の技術】図28は、例えば、特開平1−1710
82に記載の従来の文字認識装置を示す概略構成図であ
る。図において101はカメラ等の撮像装置で得たディ
ジタル画像を記憶する画像メモリ、102は文字の位置
や大きさ等の既知の文字配列情報を格納した文字配列情
報格納メモリ、103は認識対象のカテゴリに対応した
基準パターンを格納した認識辞書を記憶する辞書メモ
リ、104は画像メモリ101を走査して求めたX方向
及びY方向の周辺分布値に基づいて文字パターン(文字
を表示する領域全体を囲む最小矩形をいう)を優先して
切り出す優先文字切り出し手段、105は優先文字切り
出し手段104では切り出すことができなかった文字領
域を既に切り出した文字パターンの位置及び大きさ情報
と文字配列情報格納メモリ102の内容とから推定して
切り出す推定文字切り出し手段、106は推定文字切り
出し手段105で切り出した文字パターンから成る領域
を走査して求めたY方向の周辺分布値に基づいて文字が
欠けた又は隠れた領域を検出する欠け隠れ領域検出手
段、107は欠け隠れ領域検出手段106で検出した領
域を除外した領域において文字パターンと認識の対象と
なる文字の基準パターンとを比較して文字を認識する文
字認識手段である。
【0003】次に動作を説明する。座標系は、水平方向
をX軸に、垂直方向をY軸にとった場合で説明する。ま
ず、テレビカメラ等で撮像した画像をディジタル化して
画像メモリ101に格納する。この時、画像中の文字部
分は黒画素、地の部分は白画素となっており、文字は水
平方向に並んでいるものとする。
【0004】優先文字切り出し手段104は、画像メモ
リ101に格納された入力画像を走査し、水平ライン毎
の黒画素数を計数して周辺分布を作成した後、この周辺
分布を2値化し、Y方向に黒画素が連続する領域の両端
のY座標を求める。次に、黒画素が連続する領域毎にY
座標の対で定められる範囲の入力画像を走査し、垂直カ
ラム毎の黒画素を計数して周辺分布を求めた後、この周
辺分布を2値化し、黒画素が連続する領域の両端のX座
標を求める。以上を通じて求めたY座標の対はパターン
の上下端、X座標の対は左右端に相当する。次に、上記
Y座標の対とX座標の対を組合せて、パターンに外接す
る矩形を求め、この矩形の位置及び大きさが所定の範囲
内にある文字パターンの矩形を優先して切り出す。この
一連の切り出し処理を優先切り出しと呼ぶ。
【0005】推定文字切り出し手段105は、まず、優
先文字切り出し手段104により切り出された文字パタ
ーン矩形の位置及び大きさと文字配列情報格納メモリ1
02の内容である矩形の位置及び大きさとの比率を求
め、この比率により優先文字切り出し手段104により
切り出された文字パターン矩形の縦横長を伸縮して、そ
の結果と文字配列情報格納メモリ102内の矩形情報と
を照合する。またこの照合結果が一致しなかった文字配
列情報格納メモリ102内の矩形情報については、照合
結果が一致した他の文字パターン矩形のうち照合結果が
一致しなかった文字パターン矩形に位置的に最も近いも
のの矩形に上記比率を掛けることにより、当該矩形情報
に対応した矩形座標を推定して切り出す。この一連の切
り出し処理を推定切り出しと呼ぶ。
【0006】欠け隠れ領域検出手段106は、推定文字
切り出し手段105により切り出された矩形に対して、
同一行にあるものの領域をそれぞれ走査し、水平ライン
毎に黒画素数を計数して周辺分布を求め、この周辺分布
を所定の閾値で2値化して欠け領域と隠れ領域の境界線
のY座標を求める。閾値には、欠け検出用と隠れ検出用
の2種類があり、周辺分布値が欠け検出用閾値より小さ
いところを欠け領域、隠れ検出用閾値より大きいところ
を隠れ領域とする。
【0007】次に、文字認識手段107は、優先文字切
り出し手段104及び推定文字切り出し手段105で切
り出した文字パターンに対して、欠け隠れ領域と重なら
ないものには全ての画素値が「1」となるマスクパター
ンを生成し、それ以外のものには、上記境界線のY座標
に基づいて欠け隠れ領域と重なる画素の値を「0」、重
ならない画素の値を「1」としたマスクパターンを生成
する。次に、文字パターンとマスクパターンと辞書メモ
リ103に記憶された各カテゴリの基準パターンとを重
ね合わせることにより類似度を求める。さらに文字認識
手段107は、認識対象カテゴリから類似度の大きいカ
テゴリを候補文字とし、候補文字とその類似度から予め
定めた条件を満たすものを認識結果とする。この条件と
して、「類似度が最大となるもの」という条件を設定し
た場合は、候補文字のうち類似度が最大となるものを選
び、これを認識結果とする。
【0008】
【発明が解決しようとする課題】従来の文字認識装置は
以上のように構成されているので、白黒2階調の画像の
周辺分布から欠け・隠れ領域を検出している。その結
果、文字が真っ白の物体や真っ黒の物体で隠されている
のであれば、文字領域を正しく検出できるが、灰色の物
体で隠されている場合には、当該物体が表示された2値
画像上には、白画素や黒画素が離散的に出現する場合が
あり、周辺分布の値から隠れ領域を検出できないという
課題があった。仮に入力画像を256階調にしたとして
も、白地に黒文字のある領域と、全体が灰色の領域とで
は、周辺分布の値は同等となるため、上記の方法ではや
はり検出できない。
【0009】また、認識対象となる画像中の文字が、県
名などの限定された文字列を構成する場合、特開昭56
−145473に記載の、候補文字と類似度の組合せか
ら文字列として最良の結果を求める処理を追加すること
で、認識精度を高めることができる。しかしこの場合で
も、従来の文字認識装置では、隠れが少なく認識しやす
い文字パターンと、隠れが大きく誤認識しやすい文字パ
ターンを同等に扱っているため、隠れの大きい一部の文
字パターンの影響で正しい文字列を得られないという課
題があった。
【0010】この発明は、前記のような課題を解決する
ためになされたものであり、文字を隠している物体の濃
淡によらず、隠れ領域を正しく検出して認識を行うため
の文字認識装置を提供することを目的としている。ま
た、限定された範囲の文字列を認識する場合に、隠れの
大きい一部の文字パターンの影響を抑えて、文字列とし
ての認識結果を高精度に求める文字認識装置を提供する
ことも目的としている。
【0011】
【課題を解決するための手段】本発明に係る文字認識装
置は、多階調画素により表現された隠れ領域を有する入
力画像上の文字を認識する文字認識装置であって、前記
入力画像上の文字パターンを切り出す文字パターン切り
出し手段と、前記文字パターンから分割された分割領域
毎に濃度特徴量を抽出する領域濃度特徴量抽出手段と、
前記各分割領域についてその濃度特徴量に基づきその分
割領域が前記隠れ領域に含まれるか否かを決定する隠れ
領域決定手段と、文字認識の照合のための基準パターン
を格納した認識辞書と、前記隠れ領域に含まれる前記分
割領域を除いた領域について前記基準パターンと前記文
字パターンとを照合し認識結果を出力する文字認識手段
とを備えるものである。
【0012】また本発明に係る文字認識装置は、前記隠
れ領域決定手段が、前記分割領域ごとに最大濃度と最小
濃度の差を前記濃度特徴量として抽出し、前記隠れ領域
決定手段は、この濃度特徴量が所定値以下である場合に
前記隠れ領域に含まれると決定する構成とされたもので
ある。
【0013】また本発明に係る文字認識装置は、前記隠
れ領域決定手段が、前記濃度特徴量が前記文字パターン
から分割された全領域の最大濃度の最大値に基づいて決
定された値以下である場合に前記隠れ領域に含まれると
決定する構成とされたものである。
【0014】また本発明に係る文字認識装置は、前記隠
れ領域決定手段が、前記分割領域毎にその領域が前記隠
れ領域に含まれるか否かをその領域の濃度特徴量とその
領域に隣接する領域の濃度特徴量との変化量に基づいて
決定する構成とされたものである。
【0015】また本発明に係る文字認識装置は、前記文
字認識手段が、前記画像上の隠れ領域を含まない文字パ
ターンと前記基準パターンとして前記認識辞書が記憶す
る文字パターンの縦横比が異なる場合は、それらの縦横
比を一致させてからその基準パターンと前記画像上の隠
れ領域を有する文字との照合を行う構成とされたもので
ある。
【0016】また本発明に係る文字認識装置は、前記文
字切り出し手段は、入力画像上の複数の文字パターンの
うち隠れ領域を含まないことが予め判明している文字パ
ターンの配置情報を記憶する文字配置情報記憶手段と、
この文字配置情報に基づき隠れ領域のない文字パターン
を優先切り出しにより切り出す優先切り出し手段と、優
先切り出しにより切り出された文字パターンの形状情報
に基づき隠れ領域を含む文字パターンを切り出す推定切
り出し手段とを備える構成とされたものである。
【0017】また本発明に係る文字認識装置は、前記文
字認識手段が、前記文字パターンのうち隠れ領域の面積
の占める比率に応じて前記照合処理において用いる基準
パターンの棄却判定条件を選択する構成とされたもので
ある。
【0018】また本発明に係る文字認識装置は、前記隠
れ領域決定手段は、前記隠れ領域に含まれないと決定さ
れた前記各領域の2値化を行いさらに前記各領域が前記
隠れ領域に含まれるか否かを決定する構成とされたもの
ある。
【0019】また本発明に係る文字認識装置は、隠れ領
域を有する入力画像上の文字を認識する文字認識装置で
あって、前記入力画像上の文字パターンを切り出す文字
パターン切り出し手段と、前記文字パターンから隠れ領
域を決定する隠れ領域決定手段と、文字認識の照合のた
めの基準パターンを格納した認識辞書と、前記文字パタ
ーンに占める隠れ領域の面積比からその文字パターンの
信頼度を求める信頼度決定手段と、認識対象語リストを
記憶する文字コード列記憶手段と、前記信頼度に基づい
て選択した文字パターンを認識するとともに各文字パタ
ーンの認識結果と前記認識対象語リストとを照合しその
結果を出力する文字認識手段とを備えたものである。
【0020】また本発明に係る文字認識装置は、前記文
字切り出し手段が、リール上の文字を撮像した入力画像
から文字パターンを切り出し、前記認識対象語リスト
は、前記リール上に連続的に表示される語を含み、前記
文字認識手段は、前記文字パターンと前記認識対象語リ
ストの語との照合処理を行う構成とされたものである。
【0021】
【発明の実施の形態】実施の形態1.図1は、本発明の
実施の形態1の構成図である。図1において、1は画像
を入力する画像入力手段、2は文字の位置や大きさの情
報である文字配置情報を記憶する文字配置情報記憶手
段、3は文字配置情報を参照して入力画像から文字パタ
ーンを囲む最小矩形を検出する文字領域検出手段、4は
入力画像を部分領域に分割して部分領域毎に最大・最小
濃度を抽出する最大・最小濃度抽出手段、5は最大・最
小濃度抽出手段4の出力した最大・最小濃度から隠れ領
域の境界位置を検出する隠れ境界検出手段、6は文字領
域検出手段3の検出した文字パターンの位置及び大きさ
と隠れ境界検出手段5の検出した隠れ境界位置とに基づ
いて、文字パターンの隠れ領域を決定する隠れ領域決定
手段、7は文字の基準パターンを格納した認識辞書、8
は隠れ領域を除いて文字領域検出手段3の検出した文字
パターンと認識辞書7内の基準パターンとを照合する文
字認識手段である。
【0022】次に動作を図2により説明する。ステップ
S1において画像入力手段1は、多階調の画像を入力し
て入力画像とする。本実施の形態では、各画素の値(濃
度)が0から255までの範囲をとる256階調の白黒
画像を入力するものとし、また、完全な黒画素の濃度は
0、完全な白画素の濃度は255になるものとする。図
3は入力画像の例であって、上段に3文字、下段に4文
字の2段構成の数字が刻印された文字プレートを写した
ものであり、上段の数字は灰色の物体13により、その
一部が隠されている。
【0023】次にステップS2において文字領域検出手
段3は、入力画像から文字パターンを検出する。本実施
の形態では、入力画像を2値化して2値画像を作成し、
当該2値画像から文字パターンを検出する。画像の2値
化方法としては、例えば電子情報通信学会論文誌 Vo
l.J63−D No.4 pp349−356の「判
別および最小2乗基準に基づく自動しきい値選定法」に
記載の方法を用いて2値化閾値を算出し、濃度が2値化
閾値より大きい画素を白、2値化閾値以下の画素を黒に
する方法を用いる。また文字配置情報格納手段2は、処
理対象となる画像上に表示されている文字の位置や大き
さを予め記憶する手段であって、文字領域検出手段3
は、文字配置情報格納手段2が記憶する文字の位置や大
きさについての情報を参照しながら、2値画像に対して
従来と同様の手順による優先切り出し・推定切り出しを
行って、文字パターンを検出する。
【0024】図4は、図3の入力画像を2値化した2値
画像である。図3において、文字を隠している物体13
は全体的に灰色であるとする。図3の物体領域13を2
値化すると、図4において物体領域14のようになる。
これは図3の物体領域13を表す画素のうち、濃度がや
や大きめの画素が白、やや小さめの画素が黒となって、
全体ではまだらになるからである。このように、まだら
な2値画像の周辺分布値は、極度に大きくも小さくもな
らず、中間的な値となる。このため、従来の周辺分布を
とる方法では、この隠れ領域を検出できない。図5は、
文字領域検出手段3の文字パターン検出結果であって、
下の段の文字パターン15〜18は優先切り出しによっ
て検出したものであり、上の段の文字パターン19〜2
1は推定切り出しによって検出したものである。
【0025】ステップS3において最大・最小濃度抽出
手段4は、文字領域検出手段3が検出した文字パターン
のうち、隠れ領域を有する可能性があるものを部分領域
に分割して、各部分領域の最大濃度と最小濃度を抽出す
る。ここで、文字パターンが隠れ領域を有する可能性が
あるか否かを判定する方法としては、その文字パターン
を切り出した処理に基づく方法が考えられる。例えば、
ある文字パターンが優先切り出しによっては切り出すこ
とができず、一方、推定切り出しによって切り出すこと
ができるのであれば、この文字パターンは隠れ領域を有
する可能性がある。
【0026】本実施の形態では、最大・最小濃度抽出手
段4が部分領域分割を行う方法として、画像を水平方向
に分割する方法を用いる。例えば、図6の推定切り出し
により求めた領域22を隠れ候補領域とし、図7のよう
に図6の領域22を水平方向に分割する。最大・最小濃
度抽出手段4は、この領域22の各部分領域の濃度特徴
量として、それぞれの領域を構成する画素の濃度のう
ち、最も大きなものを最大濃度とし、最も小さな物を最
小濃度とする。図8に示す表は、最大・最小濃度抽出手
段4が図6を分割した各領域より抽出した最大濃度と最
小濃度の例である。なお図8において、部分領域の番号
が小さいものほど上部にある部分領域であることを示
す。
【0027】次にステップS4において隠れ境界検出手
段5は、最大・最小濃度抽出手段4の求めた最大・最小
濃度から、隠れ領域の境界位置を検出する。本実施の形
態において、隠れ境界検出手段5は、隠れ領域の境界位
置を検出するために、まず各部分領域における最大濃度
と最小濃度の差(以下この値のことを単純に濃度差とい
う)を算出する。続いて各部分領域について、隣接する
一方の部分領域の濃度差が所定の閾値以上であって、隣
接するもう一方の部分領域の濃度差がこの閾値未満とな
るものを検出し、この条件を満たす部分領域を隠れ境界
位置とする。一般に、文字の見えている領域では、文字
部と地の部分とのコントラスト、すなわち濃度差が一定
以上の値となり、一方、隠れを引き起こしている物体の
濃度が概ね均一である場合には、隠れ部分の濃度差は小
さくなる。この違いをとらえることで、隠れ境界を検出
できる。
【0028】図8の最大・最小濃度の例に基づき、各部
分領域の濃度差を算出すると、図9に示す値となる。図
9において、上記所定の閾値を80とし、連続する部分
領域2から9について、それぞれ隣接する部分領域間の
濃度差の変位がこの閾値を超える箇所を求めると、部分
領域3と4の間で変位が閾値以上となる。なおここで、
最も上にある部分領域1と最も下にある部分領域10に
ついては、文字パターンの上下端に対応するため、隠れ
がなくとも濃度差の小さくなるケースがあることから、
本実施の形態では、この二つの部分領域は処理対象から
除外することとしている。以上の処理によって、図9の
部分領域3と4の境界に隠れ境界が存在すると特定する
ことができる。図10は、この処理により特定した隠れ
境界を示すものであって、座標位置23が隠れ境界とな
る。
【0029】次にステップS5において、隠れ領域決定
手段6は、隠れ境界検出手段5の検出した隠れ境界位置
と、文字領域検出手段3の検出した文字パターンの矩形
位置とに基づいて、個々の文字パターンにおける隠れ領
域を決定する。これまでのステップにおいて、それぞれ
の座標が得られているので、ステップS5は数値計算に
より容易に実現できる。図11は、図5の文字パターン
検出結果と図10の隠れ境界検出結果に対する隠れ領域
決定結果を示す図であり、24〜26が文字パターン1
9〜21の隠れ領域である。
【0030】ステップS6において文字認識手段8は、
認識辞書7に格納された基準パターンと検出された文字
パターンとを照合し、文字認識を行う。例えば、従来と
同様の手順で、隠れのある領域とない領域とで値の異な
るマスクパターンを作成し、式1により各基準パターン
に対する類似度を算出して、類似度の最も大きい基準パ
ターンのカテゴリを出力する。
【0031】
【数1】
【0032】以上のように、本実施の形態によれば、隠
れを引き起こしている物体の濃度によらず、正しく隠れ
領域を検出でき、隠れのある文字を認識することができ
る。なお、本実施の形態では、入力画像を256階調と
したが、これは1024階調や16階調など、他の階調
数としても同様の方法で隠れのある文字を認識すること
ができる。
【0033】また本実施の形態では、2値化方法につい
て前記文献記載の方法を用いたが、この方法の代わりに
例えば信学技報PRMU96−46「ナンバープレート
認識装置の開発」における「2.2 プレート2値化
部」に記載の方法など、他の方法を用いることもでき
る。
【0034】また本実施の形態では、隠れ候補領域を水
平方向に長い部分領域へ分割したが、他の分割方法を採
用することも可能である。例えば隠れ境界が垂直になる
ケースでは、垂直方向に長い部分領域への分割が有効で
ある。また、部分領域の最大・最小濃度を、各部分領域
を構成する画素の濃度のうち最も大きいものと最も小さ
いものとしたが、例えばノイズ耐性を高めるため、大き
い方からN番目(Nは整数)の濃度と小さい方からN番
目の濃度としたり、大きい方と小さい方からN個ずつ抽
出した濃度をそれぞれ平均した値とするなど、他の方法
で求めることもできる。また文字認識における類似度計
算は、マスクパターンを用いる式1の方法を採用した
が、これは隠れ領域のパターンを類似度計算に反映させ
ない方法であれば、他の方法を用いることもできる。
【0035】実施の形態2.本発明の実施の形態2は、
大きく傾斜した状態で取り付けられた文字プレート上の
文字を認識できる文字認識装置に係るものである。本実
施の形態の構成は実施の形態1と同じであるため、構成
図として図1を用いる。また、本実施の形態の処理フロ
ーについても実施の形態1と同じであるため、処理フロ
ーを示す図として図2を用いる。ただし、本実施の形態
において、文字配置情報格納手段2は、文字の位置やサ
イズについての情報に加えて、隠れが発生するか否かの
情報についても文字毎に保持しているものとする。ま
た、本実施の形態において、文字領域検出手段3は、文
字配置情報格納手段2の記憶するこれらの情報を用いて
処理を行う。
【0036】ステップS2において文字領域検出手段3
は、入力画像を2値化して2値画像を作成し、文字配置
情報格納手段2の内容を参照して当該2値画像から文字
を検出する。本実施の形態において、文字配置情報格納
手段2が記憶する情報とは、入力画像上の文字が隠れ領
域を有するか否かを示すものである。例えば、自動車の
ナンバープレートの画像を取り込む場合、ナンバープレ
ート上部は自動車のバンパーやその影の影響で隠れ領域
が発生しうることは予め判明しているので、そのような
事実に基づいて文字配置情報格納手段2の記憶する情報
を構成するものとする。本実施の形態では、例えば図1
2の2段構成の文字プレートに対しては、上方の段を構
成する2文字を隠れの発生する文字とし、下方の段を構
成する3文字を隠れの発生しない文字としているものと
する。また文字配置情報格納手段2は、文字の位置とサ
イズについての情報として、隠れの発生しない下段の文
字については、従来の優先切り出しで用いている文字パ
ターンの絶対的な大きさではなく、「パターン幅の2倍
程度の間隔で水平方向に均等に並んでいる3文字」を記
憶しているものとする。
【0037】文字領域検出手段3は、図13の画像に対
して、まず文字配置情報格納手段2の記憶する情報に基
づいて、隠れの発生しない文字パターンとして27〜2
9のパターンを検出する。次に、この文字パターン27
〜29の検出位置と大きさを基準として、従来の推定切
り出しと同様の処理を行って、文字パターン30〜31
を検出する。図13のように大きく縮んだ画像を対象と
した場合、全ての文字パターンの高さが小さいため、従
来の方法における優先切り出しでは文字パターンを検出
することができないが、本実施の形態による方法によれ
ば、隠れの発生しない文字の情報を保持し、当該文字の
検出位置を基準とすることで、文字パターンの大きさが
極度に変わっても検出することができる。
【0038】次に、ステップS3において最大・最小濃
度抽出手段4は、推定切り出しにより検出された各文字
パターンについて、水平方向に長い部分領域に分割し、
最大濃度と最小濃度を抽出する。ここで、最大濃度と最
小濃度を抽出するためには、各領域内に異なる濃度の画
素が存在することが前提となる。しかし文字の形状によ
っては、部分領域全体を黒画素で満たしてしまう場合も
考えられる。例えば、本実施の形態においても、実施の
形態1と同様に水平方向に領域分割するが、そうする
と、漢字の「大」のような文字が表示されている場合に
は、部分領域によっては黒画素のみを含む場合も考えら
れる。このような場合に対応するために、本実施の形態
では各文字パターンの矩形の位置座標を2乃至3ピクセ
ル程度拡張することによって、矩形のサイズを拡大して
処理するものとする。図14は、このようにして拡張し
た文字パターン領域の例を示すものであって、同図の3
2は、図13の推定切り出しパターン31に対応した隠
れ候補領域である。図15の表33における最大濃度と
最小濃度は隠れ候補領域32からの抽出結果を示し、実
施の形態1と同様に、部分領域の番号が小さいものほど
上部にある部分領域であることを示す。
【0039】次にステップS4において、隠れ境界検出
手段5は、最大・最小濃度抽出手段4の求めた最大濃度
と最小濃度から、隠れ領域の境界位置を検出する。その
ためにはまず、各部分領域の最大濃度と最小濃度からそ
れぞれ濃度差を求めるとともに、濃度差の最大値を求
め、この濃度差の最大値から隠れ境界検出のための第一
の閾値を算出する。続いて、各部分領域の最大濃度の最
大値を求め、この値から隠れ境界検出のための第二の閾
値を算出する。次に、隣接する部分領域において、片方
の濃度差が第一の閾値以上で、他方の濃度差が第一の閾
値未満となり、かつ、当該部分領域間で最大濃度の差が
第二の閾値以上あるところを求め、この位置を隠れ境界
位置とする。なお、本実施の形態では、実施の形態1と
は異なり、最も上にある部分領域と最も下にある部分領
域も処理対象に加えるものとする。
【0040】図15の例では、濃度差の最大値は127
であり、例えば、第一の閾値を濃度差の最大値の1/2
として小数点以下を切り捨てるものとして求めると、第
一の閾値は63となる。また、最大濃度の最大値は18
2であり、例えば、第二の閾値を最大濃度の最大値の2
0%として小数点以下を切り捨てるものとして求める
と、第二の閾値は36となる。この二つの閾値を用い
て、図15の表33を参照すると、部分領域1の濃度差
が第1の閾値未満、部分領域2の濃度差が第1の閾値以
上、かつ部分領域1と部分領域2の最大濃度の差が第2
の閾値以上となり、部分領域1と部分領域2の境界位置
が隠れ境界として検出される。同時に、濃度差の小さい
部分領域1を隠れのある領域、濃度差の大きい部分領域
2から下方を隠れのない領域と判定する。
【0041】ステップS4で用いた第二の閾値は、文字
プレートの地部分が連続しているかどうかを検証するた
めのものである。文字の端の部分では、文字の濃度は地
部分の濃度に近づくが、他物体に隠されていなければ地
部分の濃度は変わらない。本実施の形態では、白地(濃
度大)に黒文字(濃度小)の例としたため、最大濃度が
地部分の濃度に該当し、最大濃度の変化を条件に加える
ことで、文字の端の部分でも隠れが発生しているかどう
かを判定できる。例えば、図14の表33における部分
領域9と10(文字の下端部分)では、第一の閾値の条
件は満足するが、第二の閾値の条件は満足しないため、
この位置を隠れ境界として誤検出することはない。
【0042】次にステップS5において、隠れ領域決定
手段6は、実施の形態1と同様の手順で、隠れ境界検出
手段5の検出した隠れ境界位置と文字領域検出手段3の
検出した文字パターンの矩形位置から各文字パターンの
隠れ領域を決定する。
【0043】続いてステップS6において、文字認識手
段8は、認識辞書7に格納された基準パターンと検出さ
れた文字パターンとを照合して文字認識を行う。本実施
の形態では、このステップの最後で認識結果の棄却判定
を行うものとし、さらに、文字パターンの隠れの程度に
応じて、棄却判定方法を切り替えるものとする。棄却条
件としては、例えば、式2と式3のどちらかが成立した
ら棄却(認識不可)とし、隠れの程度に応じて、式2と
式3の閾値を切り替える。すなわち、大きく隠れている
ものほど、式2のC1とC2を大きくし、厳しく棄却判
定を行う。これは、隠れのある文字パターンは、隠れの
ない文字パターンに比べてパターンが不安定であり、誤
認識が発生し易いためである。
【0044】
【数2】
【0045】以上のように、本実施の形態によれば、文
字プレート等が大きく傾斜した状態で取り付けられたた
めに、標準状態に比べて大きく縮んだ画像上の文字につ
いても、文字領域検出や隠れ領域検出を行うことができ
る。また、隠れ境界検出の閾値を各部分領域の最大・最
小濃度から決定するため、画像の明るさを反映させた適
正な閾値を用いることができ、明るさが変化しても正し
く隠れ境界を検出できる。また濃度差に加えて、最大濃
度の変化を条件として隠れ境界を検出することで、文字
の端の領域であっても正しく隠れ境界を検出できる。ま
た隠れの程度に応じて、棄却判定方法を切り替えること
により、隠れのある文字パターンの誤認識を抑えること
ができる。なお本実施の形態では、隠れ境界検出のため
の二つの閾値をともに計算により求めたが、どちらか一
方あるいは双方を固定値としてもよい。また、隠れ境界
検出の条件を、濃度差と最大濃度としたが、黒地に白文
字の場合は最小濃度が地部分に対応するため、濃度差と
最小濃度の組合せとすることも可能である。
【0046】また本実施の形態では、縦方向が縮んだ文
字パターンについて文字認識を行う場合について説明し
たが、横方向が縮んだ文字パターンについても同じよう
に認識することが可能である。
【0047】実施の形態3.図16は、本発明の実施の
形態3の構成図である。本実施の形態は、隠れ領域が文
字パターンの大部分を占めてしまっているために、その
文字パターン単独の処理によっては、正しい文字認識を
行うことが困難である場合に、このような文字パターン
を含む入力画像上の文字を認識する処理に関するもので
ある。
【0048】図16において、6は文字領域検出手段3
の検出した文字パターンの位置及び大きさと文字配置情
報格納手段2に格納された文字配置情報とに基づいて、
文字パターンの隠れ領域を求める隠れ領域決定手段であ
る。9は隠れ領域決定手段6の求めた隠れ領域の大きさ
に基づいて、各文字パターンの信頼度を求める信頼度決
定手段である。10は信頼度決定手段9の求めた信頼度
に基づいて、文字パターンを選択するパターン選択手段
である。11は入力画像中に出現し得る文字の組合せを
コード列(ASCIIやEBCDICコード体系等によ
る文字コード)として格納した文字列格納手段である。
12は信頼度決定手段9の求めた文字パターンの信頼度
と、文字認識手段8の出力した候補文字及び類似度と、
文字コード列格納手段11に格納された文字コード列と
に基づいて、認識結果を決定する認識結果決定手段であ
る。
【0049】次に動作を図17を用いて説明する。ステ
ップT1において、画像入力手段1は画像を入力する。
本実施の形態では、従来と同様に2値画像を処理するも
のとし、入力画像は図18に示す白黒の2値画像となっ
ているものとする。本実施の形態では、図18の上段の
文字パターン全体と、下段の文字パターン全体をそれぞ
れ一個の文字列とみなして処理を行う。
【0050】次にステップT2において、文字領域検出
手段3は、この入力画像から、文字配置情報格納手段2
に格納されている各文字の位置及び大きさの情報に基づ
いて、従来と同様の手順で優先切り出し・推定切り出し
を行い、各文字パターンを検出する。図19は文字パタ
ーン検出結果を示しており、下方の段の文字パターン3
5〜38が優先切り出しで検出されたものであって、図
18の物体34に隠されている上方の段の文字パターン
39〜41が推定切り出しで検出されたものである。
【0051】次にステップT3において、隠れ領域決定
手段6は、従来と同様に、推定切り出しによって検出さ
れた文字パターン39乃至41の領域それぞれに対し
て、水平ライン毎に黒画素数を計数して周辺分布を求
め、この周辺分布を所定の閾値で2値化して隠れ領域を
求める。図19の文字パターン39乃至41に対して
は、図20の42乃至44が隠れ領域として求められ
る。
【0052】次にステップT4において、信頼度決定手
段9は、隠れ領域決定手段6の求めた各文字パターンの
うち、隠れ領域の面積の比率に応じて、信頼度を決定す
る。一般に文字パターンにおいては、隠れ領域の面積が
占める比率が大きくなるほど、文字認識は困難となる。
そのため、基準パターンとの照合によって一致する文字
を検出できたとしても、隠れ領域が大きい場合には、そ
の検出結果の信頼性は低くなる。本実施の形態における
信頼度とは、このような関係を表現するために導入する
ものである。本実施の形態では、信頼度をA〜Eの5段
階とし、Aは隠れなし、Bは隠れ領域の面積がパターン
全体の15%未満、Cは隠れ領域の面積がパターン全体
の15%以上25%未満、Dは隠れ領域の面積がパター
ン全体の25%以上50%未満、Eは隠れ領域の面積が
パターン全体の50%以上、とする。この時、図19の
文字パターンについては、文字パターン35〜38が信
頼度A、文字パターン39が信頼度B、文字パターン4
0が信頼度D、文字パターン41の信頼度Eとなる。
【0053】次にステップT5において、信頼度検定手
段10は、信頼度決定手段9の求めた信頼度によって文
字認識を行う文字パターンを選択する。信頼度によって
は、仮に認識結果が得られたとしても、正しい認識結果
ではない場合も考えられるからである。本実施の形態で
は、信頼度検定手段10は信頼度A〜Dの文字パターン
のみを文字認識を行う文字パターンとして選択する。こ
の結果、図19において、文字パターン41については
文字認識を行わず、他の文字パターンについて文字認識
を行う。
【0054】次にステップT6において、文字認識手段
8は、信頼度検定手段10が選択した文字パターンを認
識し、それぞれ複数の候補文字と類似度を出力する。ま
た、信頼度検定手段10が選択しなかった文字パターン
については、候補文字なしとする。
【0055】次にステップT7において、認識結果決定
手段12は、信頼度検定手段10が文字認識を行うこと
と決定した文字パターンと文字コード列記憶手段11の
記憶する文字列との類似度を式3を用いて決定する。式
4においてWijは各信頼度について定められた値と
し、本実施例では、例えば信頼度Aの文字パターンは
1.0、信頼度Bは0.9、信頼度Cは0.8、信頼度
Dは0.5、信頼度Eは0.0の値を用いることとす
る。また文字コード列記憶手段11には、上方の段に出
現し得る文字列として、例えば、「春日部」や「名古
屋」など、三文字からなる文字列が複数格納されている
ものとする。式4においてNは文字列の長さであって、
本実施の形態においてはN=3とする。
【0056】
【数3】
【0057】以上のように、本実施の形態によれば、文
字列の照合を用いた補間処理によって、隠れのある文字
パターンの認識を効率的に行うことができる。すなわ
ち、隠れの程度が大きいために正確な認識が困難である
文字パターンについては、他の文字パターンの認識結果
と文字列との部分照合を行い、一致した文字列を求め、
この文字列の構成文字から認識が困難な文字パターンの
認識結果を得ることで、無駄な認識動作を回避できる。
また、隠れの程度に応じて重み付けし文字列照合を行う
ことで、誤認識する可能性の高い、隠れ量の大きな文字
パターンによる悪影響を低減できる。
【0058】なお、本実施の形態において、文字列格納
手段11は文字コード列を格納するものとしたが、文字
コード以外にも文字列に対するハッシュ値や文字列テー
ブルへのインデックス値等を用いてもよい。
【0059】実施の形態4.以下に、この発明の実施の
形態4について説明する。本実施の形態は、回転式の計
測結果表示部を有する計測機器の計測結果表示部の文字
を認識するものである。実施の形態3と同様に構成図に
ついては図16を用いる。なお本実施の形態において、
文字列格納手段11は回転式の計測結果表示部上に出現
する数字コード列を記憶するものとする。
【0060】次に動作を図により説明する。本実施の形
態の処理フローを図21に示す。ステップU1におい
て、実施の形態3と同様の手順で画像入力を行う。図2
2は、本実施の形態における入力画像の例である。続い
てステップU2において、文字領域検出手段3は、文字
配置情報格納手段2の内容を参照し、入力画像から文字
パターンを検出する。本実施の形態では、3桁の数字よ
りなる計測結果表示部の文字を認識することを目的とす
るが、回転式の計測結果表示部には、同一桁に2個の文
字パターンが出現することがあるため、入力画像に対し
て、総研出版発行「コンピュータ画像処理入門」P.7
5〜76記載のラベリングを用いて黒画素の連結成分を
パターンとして抽出し、各桁の対応位置から、パターン
の幅・高さが所定範囲内である最大2個のパターンを検
出するものとする。図23は、図22の入力画像に対す
る文字領域検出手段3の検出結果を示し、45〜46が
1桁目に対応する文字パターン、47〜48が2桁目に
対応する文字パターン、49〜50が3桁目に対応する
文字パターンである。
【0061】ステップU3において、隠れ領域決定手段
6は、文字領域検出手段2の検出した文字パターンの相
対位置とパターン幅・高さ、さらに文字配置情報格納手
段2に格納された標準文字サイズに基づいて、各文字パ
ターンの隠れ領域を決定する。例えば、文字パターン4
9については、パターン高さが標準高さより小さく、ま
た下方に別パターンがあるため、パターン領域の上部に
(標準文字高さ−パターン高さ)の隠れ領域があるもの
と見なす。なお、標準文字高さと認識辞書7内の基準パ
ターンの高さは同じ値であるものとする。
【0062】ステップU4において、信頼度決定手段9
は、隠れ領域決定手段6の求めた各文字パターンの隠れ
量に応じて、実施の形態3と同様に信頼度を決定する。
本実施の形態では、信頼度はA〜Dの4段階とし、例え
ば、Aは隠れなし、Bは隠れ領域の高さがパターン全体
の15%未満、Cは隠れ領域の高さがパターン全体の1
5%以上80%未満、Dは隠れ領域の高さがパターン全
体の80%以上とする。
【0063】ステップU5において、パターン選択手段
10は、信頼度決定手段9の求めた信頼度に基づいて文
字認識を行う文字パターンを選択する。本実施の形態で
は、各桁毎に下記のルールに従って文字パターンを選択
するものとする。 (1)信頼度Aの文字パターンがあれば、その文字パタ
ーンのみを選択する (2)信頼度Aの文字パターンがなく、かつ、信頼度B
の文字パターンがある場合、他に信頼度BかCの文字パ
ターンが検出されていれば、その文字パターンも合わせ
て二つを選択し、それ以外の場合は、信頼度Bの文字パ
ターンのみを選択する (3)信頼度AとBの文字パターンがなく、かつ、信頼
度Cの文字パターンがある場合、検出された文字パター
ン全てを選択する (4)信頼度A乃至Cの文字パターンがなく、かつ、信
頼度Dの文字パターンがある場合、検出された文字パタ
ーンが二つあれば、その二つの文字パターンを選択し、
それ以外の場合は、文字パターンの選択を行わない。
【0064】図23の場合では、文字パターン45が信
頼度B、文字パターン46が信頼度D、文字パターン4
7〜50が信頼度Cとなり、1桁目に対応して文字パタ
ーン45が、2桁目に対応して文字パターン47と48
が、3桁目に対応して文字パターン49と50が選択さ
れる。本ステップにより、各桁に表示されている文字パ
ターンのうち、各桁の数値を表す最も適切な文字パター
ンを選択し、また、各桁の数値を表す適切な文字パター
ンがない場合には、どのパターンも選択しないようにす
ることで、誤認識を事前に防止できる。
【0065】ステップU6において、文字認識手段8
は、パターン選択手段10の選択した文字パターンを対
象として、認識辞書7内の基準パターンと照合すること
により文字認識を行い、複数の候補文字と類似度を出力
する。図24は、図23の文字パターン49と基準パタ
ーンとの照合動作を示している。図24において、文字
パターン49はその上部が隠れていると判定されたた
め、基準パターンと同じサイズの矩形枠51に下詰めで
配置されている。同枠51の上部の領域52について
は、隠れ領域として処理することが可能であり、この文
字パターンと基準パターン53とを従来の手順で照合す
ることにより、基準パターン53に対する類似度が得ら
れる。なお、本実施の形態では、候補文字と類似度とし
て、類似度が大きい方から4組を選んで出力するものと
し、例えば、図22の文字パターン49と50に対する
出力としては、図24の表54と表55に示す候補文字
と類似度を出力する。
【0066】ステップU7において、認識結果決定手段
12は、パターン選択手段10がパターン選択した複数
の桁に対し、文字認識手段8の出力した候補文字及び類
似度と文字列格納手段11に格納された数字コード列と
を照合する。本実施の形態で対象としているのは、回転
式の計測結果表示部を有する計測機器の計測結果表示部
上の数字であるため、各桁において表示される文字が複
数ある場合にこの複数の文字の組合せは、図25の表5
6左側に示す10通りの組合せである。文字列格納手段
11には、この10個の数字コード列を格納しており、
認識結果決定手段12は、この10個の数字コード列の
文字列パターンそれぞれの間の類似度を求め、類似度最
大となる数字コード列を決定する。例えば、図22の2
桁目では、図24の表54と表55に対して、N=2と
した式5を用いると、表56右側の類似度が得られ、9
−0の文字コード列と決定される。
【0067】
【数4】
【0068】なお、認識結果決定手段12は、パターン
選択手段10が一つの文字パターンしか選択しなかった
桁に対しては、文字認識手段8の出力した最大類似度を
持つ候補文字を認識結果とする。
【0069】ステップU8において、認識結果決定手段
12は、パターン選択手段10の選択した文字パターン
の位置関係に基づいて各桁の認識結果を組み合わせて、
計測機器の表示内容を決定して出力する。例えば、図2
2の画像の場合、1桁目は1パターンのみ選択されて認
識結果「4」となっており、2桁目は「8−9」の文字
コード列と決定され、3桁目は「9−0」の文字コード
列と決定されているものとする。本ステップでは、ま
ず、全体の基準となるパターンとして、例えば最下位桁
で最も表示面積の大きい文字パターンを選ぶ。図22で
は、文字パターン49が最下位桁に該当する。続いて、
他の桁の文字パターンについては、この全体の基準とな
るパターンの垂直位置に近い文字パターンを選択する。
例えば図23の49は、同じ桁の50の上部に存在する
から、他の桁についても、2つの文字パターンが表示さ
れている場合には、上部の文字パターンを選択する。そ
の結果、図23の1桁目では文字パターン45、2桁目
では文字パターン47が選ばれる。最後に、全ての桁に
ついて、選んだパターンに対応する文字コードを出力す
る。図22の場合では、「489」が計測機器の表示内
容として出力される。本ステップの一連の動作により、
個々の桁の認識結果は誤っていないが、全体として誤っ
た結果を出力すること(例えば、図22の画像に対して
「499」を出力するなど)を防止できる。
【0070】以上のように、本実施の形態によれば、回
転式の計測結果表示部を有する計測機器の計測結果を正
しく認識できる。なお、本実施の形態では、パターン選
択手段10が特定の桁に対応して複数の文字パターンを
選択した場合、数字コード列照合結果だけを当該桁の認
識結果としたが、これは、例えば、個々の文字パターン
の類似度と、数字コード列としての類似度を比較し、ど
の結果を当該桁の認識結果とするか決定し直すようにす
ることもできる。
【0071】なお、本実施の形態では、回転式の計測結
果表示部に表示される数字を認識する場合について説明
したが、リールの表面に連続的に表示された複数の文字
の一部を認識する場合においても、同様に処理すること
が可能である。また、本実施の形態では、表示部に表示
される文字が数字である場合について説明をしたが、数
字以外の文字種であってもよい。またアイコンやイメー
ジなど文字以外の表示物であってもよい。この場合は、
文字列記憶手段11の代わりにイメージデータを格納す
る手段を用いたり、文字列記憶手段11にイメージデー
タの識別子を記憶させるようにすればよい。
【0072】実施の形態5.図26は、本実施の形態5
の構成図である。本実施の形態は、多階調画像と2値画
像の双方を用いて隠れ領域を検出することによって、隠
れ領域の検出を低減する文字認識装置に関するものであ
る。
【0073】次に動作を図27を用いて説明する。ステ
ップV1において、実施の形態2と同様の手順で、画像
入力手段1は画像を入力し、続いてステップV2におい
て、文字領域検出手段3は、文字配置情報格納手段2の
格納情報を参照して文字パターン検出を行い、次にステ
ップV3において、最大・最小濃度抽出手段4は、隠れ
候補領域を部分領域に分割して最大濃度と最小濃度を抽
出した後、ステップV4において、隠れ境界検出手段5
は、隠れ領域の境界位置を検出する。
【0074】ステップV5において、隠れ領域決定手段
6は隠れ領域を決定するが、本実施の形態では、実施の
形態2と同様に隠れ境界検出手段5の検出した隠れ境界
位置と文字領域検出手段3の検出した文字パターンの矩
形位置から各文字パターンの隠れ領域を決定する。その
一方で、隠れ境界検出手段5によっては隠れ領域なしと
判断した隠れ候補領域についても、さらに従来と同様の
周辺分布による隠れ領域検出処理を行って、その結果隠
れありと判定された文字パターンについて、対応する隠
れ領域を求める。
【0075】以降は実施の形態3と同様であり、ステッ
プV6において、信頼度決定手段9は、隠れ領域決定手
段6の求めた各文字パターンの隠れの程度に応じて信頼
度を決定する。続いてステップV7において、パターン
選択手段10は、信頼度決定手段9の求めた信頼度に基
づいて、文字認識を行う文字パターンを選択する。次に
ステップV8において文字認識手段8は、パターン選択
手段10が選択した文字パターンを認識して複数の候補
文字と類似度を出力し、ステップV9において、認識結
果決定手段12は、文字認識手段8の出力した候補文字
及び類似度と文字列格納手段11に格納された文字列と
を照合して、最も類似度の大きい文字列を出力する。
【0076】以上のように、本実施の形態によれば、処
理量を抑えつつ隠れのある文字を高精度に認識できる。
また、多階調画像と2値画像の双方を用いて隠れ領域を
検出することで、隠れ領域の検出漏れを低減できる。
【0077】なお、実施の形態1乃至実施の形態5で
は、認識照合を行うための検定値として類似度(基準パ
ターンと似ている度合い)を用いる構成とした。しか
し、類似度の代わりに相違度(基準パターンと似ていな
い度合い)を用いることもできる。例えば、定数から相
違度を減算した値は類似度と同等に扱うことができる。
【0078】また、実施の形態1乃至実施の形態5で
は、文字の上部が隠れる例で説明したが、隠れの位置は
下方でも、あるいは左右でもよいことはいうまでもな
い。また、実施の形態3と実施の形態4では、入力画像
を2値画像としたが、これは、多諧調の画像を入力画像
とし、当該画像を2値化して文字領域検出を行う構成と
することもできる。
【0079】
【発明の効果】本発明に係る文字認識装置は、多階調画
素により表現された文字パターンを囲む最小矩形内の領
域から濃度特徴量を抽出し、この濃度特徴量に基づいて
隠れ領域の有無を判断する構成としたので、中間的な濃
度を有する物体による隠れ領域を判断し、この隠れ領域
を考慮した文字認識を行うことが可能となる。
【0080】また本発明に係る文字認識装置は、多階調
画素により表現された文字パターンを囲む最小矩形内の
領域の最大濃度と最小濃度の差を用いて隠れ領域の有無
を判断する構成としたので、白地に黒あるいは黒字に白
で表された文字が中間的な濃度を有する物体によってそ
の一部が隠されている場合に、文字認識を行うことが可
能となる。
【0081】また本発明に係る文字認識装置は、前記領
域の最大濃度の最大値に基づいて前記濃度特徴量につい
ての閾値を決定する構成としたので、画像全体の明度や
コントラストに依存せず、文字認識を行うことが可能と
なる。
【0082】また本発明に係る文字認識装置は、前記領
域とその領域に隣接する領域との間の濃度特徴量の変化
量に基づいて隠れ領域を決定する構成としたので、濃度
が一定な物体が濃度差が一定以上以上あってコントラス
トの明確な文字部と地の部分を隠している場合に、両者
の相違を認識して文字認識を行うことが可能となる。
【0083】また本発明に係る文字認識装置は、隠れ領
域を含まない文字を囲む最小矩形と基準パターンとの縦
横比によって、隠れ領域を含む文字を囲む最小矩形を伸
縮する構成としたので、傾斜のある文字プレート上の文
字を認識することが可能となる。
【0084】また本発明に係る文字認識装置は、予め認
識対象となる画像上の文字の存在する位置に応じて、隠
れが発生しうるか否かについての情報を備え、この情報
に基づいて優先切り出し手段と、推定切り出し手段を選
択する構成としたので、文字パターンを効率的に切り出
すことが可能となる。
【0085】また本発明に係る文字認識装置は、文字パ
ターンを囲む最小矩形のうち隠れ領域の面積の占める比
率に応じて照合対象となる基準パターンの棄却判定条件
を選択する構成としたので、誤認識の発生を少なくする
ことが可能となる。
【0086】また本発明に係る文字認識装置は、多階調
画像を前提とした隠れ領域判定と2値化画像を前提とし
た隠れ領域判定を組み合わせる構成としたので、隠れ領
域の認識漏れの発生を少なくすることが可能となる。
【0087】また本発明に係る文字認識装置は、文字パ
ターンにおいて隠れ領域が占める面積に応じて信頼度を
決定し、この信頼度が低い場合には、文字認識を行わず
に、他の文字パターンの文字認識結果と予め記憶してお
いた語の組み合わせから、その文字パターンの照合結果
を求める構成としたので、隠れ領域の多い文字パターン
を有する入力画像上の文字を正しく認識することが可能
となる。
【0088】また本発明に係る文字認識装置は、前記文
字切り出し手段が、複数のリールより各桁を構成された
表示部を有する計測機器の表示部を表示する入力画像か
ら個々の文字を囲む最小矩形を切り出し、各リール上の
文字パターンが複数ある場合にはその文字パターンの関
係と認識対象語リスト、文字パターン間の類似度に基づ
いて照合処理を行う構成としたので、前記のような表示
部上の文字認識を行うことが可能となる。
【図面の簡単な説明】
【図1】 本発明の実施の形態1と実施の形態2の構成
図である。
【図2】 本発明の実施の形態1と実施の形態2の処理
フローである。
【図3】 本発明の実施の形態1の入力画像の例を示す
図である。
【図4】 本発明の実施の形態1の入力画像を2値化し
た例を示す図である。
【図5】 本発明の実施の形態1の文字パターン切り出
しの例を示す図である。
【図6】 本発明の実施の形態1の領域分割前の画像の
例を示す図である。
【図7】 本発明の実施の形態1の領域分割の例を示す
図である。
【図8】 本発明の実施の形態1の分割された各領域の
最大濃度と最小濃度を示す表である。
【図9】 本発明の実施の形態1の分割された各領域の
最大濃度と最小濃度の濃度差を示す表である。
【図10】 本発明の実施の形態1の隠れ境界の位置を
示す図である。
【図11】 本発明の実施の形態1の隠れ領域決定結果
を示す図である。
【図12】 本発明の実施の形態2の入力画像の例であ
る。
【図13】 本発明の実施の形態2の文字パターン切り
出しの例を示す図である。
【図14】 本発明の実施の形態2の切り出された文字
パターンの例を示す図である。
【図15】 本発明の実施の形態2の分割された各領域
の最大濃度と最小濃度、最大濃度と最小濃度との濃度差
を示す表である。
【図16】 本発明の実施の形態3と実施の形態4の構
成図である。
【図17】 本発明の実施の形態3の処理フローであ
る。
【図18】 本発明の実施の形態3の入力画像の例を示
す図である。
【図19】 本発明の実施の形態3の文字パターン切り
出しの例を示す図である。
【図20】 本発明の実施の形態3の隠れ領域決定結果
の例を示す図である。
【図21】 本発明の実施の形態4の処理フローであ
る。
【図22】 本発明の実施の形態4の入力画像の例を示
す図である。
【図23】 本発明の実施の形態4の文字パターン切り
出しの例を示す図である。
【図24】 本発明の実施の形態4の文字パターンと基
準パターンの照合処理を説明するための図である。
【図25】 本発明の実施の形態4の基準パターン間の
類似度の算出結果の例を示す図である。
【図26】 本発明の実施の形態5の構成図である。
【図27】 本発明の実施の形態5の処理フローであ
る。
【図28】 従来技術の構成図である。
【符号の説明】
1:画像入力手段 2:文字配置情報格納手段 3:文
字領域検出手段 4:最大・最小濃度抽出手段 5:隠れ境界検出手段
6:隠れ領域決定手段 7:認識辞書 8:文字認識手段 9:信頼度決定手段 10:信頼度検定手段 11:文字列格納手段 12:
認識結果決定手段 13:入力画像中の物体 14:入力画像中の物体を2
値化した領域 15、16、17、18、19、20、21:文字パタ
ーン 22:隠れ領域 23:隠れ領域との境界 24、25、26:文字パターン領域中の隠れ領域 27、28、29、30、31:文字パターン 32:隠れ候補領域 33:最大濃度と最小濃度、濃度差を示す表 34:隠れ領域 35、36、37、38、39、40、41:文字パタ
ーン 42、43、44:文字パターン領域中の隠れ領域 45、46、47、48、49、50:文字パターン 51:基準パターンサイズの矩形枠 52:文字パターン中の隠れ領域 53:基準パターン 54、55、56:類似度の算出例を示す表 101:画像メモリ 102:文字配列情報格納メモリ
103:辞書メモリ 104:優先文字切り出し手段 105:推定文字切り
出し手段 106:欠け隠れ領域検出手段 107:文字認識手段
───────────────────────────────────────────────────── フロントページの続き Fターム(参考) 5B029 CC21 CC26 CC29 EE06 EE08 5B064 AB02 CA08 DA20 DB06 EA08 EA19

Claims (10)

    【特許請求の範囲】
  1. 【請求項1】 多階調画素により表現された隠れ領域を
    有する入力画像上の文字を認識する文字認識装置であっ
    て、前記入力画像上の文字パターンを切り出す文字パタ
    ーン切り出し手段と、前記文字パターンから分割された
    分割領域毎に濃度特徴量を抽出する領域濃度特徴量抽出
    手段と、前記各分割領域についてその濃度特徴量に基づ
    きその分割領域が前記隠れ領域に含まれるか否かを決定
    する隠れ領域決定手段と、文字認識の照合のための基準
    パターンを格納した認識辞書と、前記隠れ領域に含まれ
    る前記分割領域を除いた領域について前記基準パターン
    と前記文字パターンとを照合し認識結果を出力する文字
    認識手段とを備えたことを特徴とする文字認識装置。
  2. 【請求項2】 前記隠れ領域決定手段は、前記分割領域
    ごとに最大濃度と最小濃度の差を前記濃度特徴量として
    抽出し、前記隠れ領域決定手段は、この濃度特徴量が所
    定値以下である場合に前記隠れ領域に含まれると決定す
    る構成とされたことを特徴とする請求項1記載の文字認
    識装置。
  3. 【請求項3】 前記隠れ領域決定手段は、前記濃度特徴
    量が前記文字パターンから分割された全領域の最大濃度
    の最大値に基づいて決定された値以下である場合に前記
    隠れ領域に含まれると決定する構成とされたことを特徴
    とする請求項1記載の文字認識装置。
  4. 【請求項4】 前記隠れ領域決定手段は、前記分割領域
    毎にその領域が前記隠れ領域に含まれるか否かをその領
    域の濃度特徴量とその領域に隣接する領域の濃度特徴量
    との変化量に基づいて決定する構成とされたことを特徴
    とする請求項1記載の文字認識装置。
  5. 【請求項5】 前記文字認識手段は、前記画像上の隠れ
    領域を含まない文字パターンと前記基準パターンとして
    前記認識辞書が記憶する文字パターンの縦横比が異なる
    場合は、それらの縦横比を一致させてからその基準パタ
    ーンと前記画像上の隠れ領域を有する文字との照合を行
    う構成とされたことを特徴とする請求項1記載の文字認
    識装置。
  6. 【請求項6】 前記文字切り出し手段は、入力画像上の
    複数の文字パターンのうち隠れ領域を含まないことが予
    め判明している文字パターンの配置情報を記憶する文字
    配置情報記憶手段と、この文字配置情報に基づき隠れ領
    域のない文字パターンを優先切り出しにより切り出す優
    先切り出し手段と、優先切り出しにより切り出された文
    字パターンの形状情報に基づき隠れ領域を含む文字パタ
    ーンを切り出す推定切り出し手段とを備える構成とされ
    たことを特徴とする請求項1記載の文字認識装置。
  7. 【請求項7】 前記文字認識手段は、前記文字パターン
    のうち隠れ領域の面積の占める比率に応じて前記照合処
    理において用いる基準パターンの棄却判定条件を選択す
    る構成とされたことを特徴とする請求項1記載の文字認
    識装置。
  8. 【請求項8】 前記隠れ領域決定手段は、前記隠れ領域
    に含まれないと決定された前記各領域の2値化を行いさ
    らに前記各領域が前記隠れ領域に含まれるか否かを決定
    する構成とされたことを特徴とする請求項1記載の文字
    認識装置。
  9. 【請求項9】 隠れ領域を有する入力画像上の文字を認
    識する文字認識装置であって、前記入力画像上の文字パ
    ターンを切り出す文字パターン切り出し手段と、前記文
    字パターンから隠れ領域を決定する隠れ領域決定手段
    と、文字認識の照合のための基準パターンを格納した認
    識辞書と、前記文字パターンに占める隠れ領域の面積比
    からその文字パターンの信頼度を求める信頼度決定手段
    と、認識対象語リストを記憶する文字コード列記憶手段
    と、前記信頼度に基づいて選択した文字パターンを認識
    するとともに各文字パターンの認識結果と前記認識対象
    語リストとを照合しその結果を出力する文字認識手段と
    を備えたことを特徴とする文字認識装置。
  10. 【請求項10】 前記文字切り出し手段は、リール上の
    文字を撮像した入力画像から文字パターンを切り出し、
    前記認識対象語リストは、前記リール上に連続的に表示
    される語を含み、前記文字認識手段は、前記文字パター
    ンと前記認識対象語リストの語との照合処理を行う構成
    とされたことを特徴とする請求項1又は請求項9のいず
    れか一に記載された文字認識装置。
JP2002155928A 2002-05-29 2002-05-29 文字認識装置 Expired - Fee Related JP4228592B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2002155928A JP4228592B2 (ja) 2002-05-29 2002-05-29 文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002155928A JP4228592B2 (ja) 2002-05-29 2002-05-29 文字認識装置

Publications (2)

Publication Number Publication Date
JP2003346081A true JP2003346081A (ja) 2003-12-05
JP4228592B2 JP4228592B2 (ja) 2009-02-25

Family

ID=29772332

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002155928A Expired - Fee Related JP4228592B2 (ja) 2002-05-29 2002-05-29 文字認識装置

Country Status (1)

Country Link
JP (1) JP4228592B2 (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7738700B2 (en) 2005-01-11 2010-06-15 Canon Kabushiki Kaisha Image processing apparatus, control method therefor, and program
JP2017116830A (ja) * 2015-12-25 2017-06-29 カシオ計算機株式会社 情報表示装置及びプログラム
JP2019082761A (ja) * 2017-10-27 2019-05-30 富士通株式会社 認識プログラム、認識方法および認識装置
JP2020024640A (ja) * 2018-08-08 2020-02-13 シャープ株式会社 書物電子化装置および書物電子化方法
JP2020027501A (ja) * 2018-08-14 2020-02-20 東芝テック株式会社 画像処理装置及び画像処理方法
CN114180432A (zh) * 2022-02-17 2022-03-15 深圳市海清视讯科技有限公司 电梯楼层的定位方法、装置、计算机设备和系统

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7738700B2 (en) 2005-01-11 2010-06-15 Canon Kabushiki Kaisha Image processing apparatus, control method therefor, and program
JP2017116830A (ja) * 2015-12-25 2017-06-29 カシオ計算機株式会社 情報表示装置及びプログラム
JP2019082761A (ja) * 2017-10-27 2019-05-30 富士通株式会社 認識プログラム、認識方法および認識装置
JP7067018B2 (ja) 2017-10-27 2022-05-16 富士通株式会社 認識プログラム、認識方法および認識装置
JP2020024640A (ja) * 2018-08-08 2020-02-13 シャープ株式会社 書物電子化装置および書物電子化方法
JP2020027501A (ja) * 2018-08-14 2020-02-20 東芝テック株式会社 画像処理装置及び画像処理方法
CN114180432A (zh) * 2022-02-17 2022-03-15 深圳市海清视讯科技有限公司 电梯楼层的定位方法、装置、计算机设备和系统

Also Published As

Publication number Publication date
JP4228592B2 (ja) 2009-02-25

Similar Documents

Publication Publication Date Title
US6674900B1 (en) Method for extracting titles from digital images
JP3359095B2 (ja) 画像処理方法及び装置
US9349062B2 (en) Character recognition method and device
US7519226B2 (en) Form search apparatus and method
US4757551A (en) Character recognition method and system capable of recognizing slant characters
JPH05233873A (ja) 領域分割方法
JP3851742B2 (ja) 帳票処理方法及び装置
JP2003346081A (ja) 文字認識装置
JPH08190690A (ja) ナンバープレート決定方法
JP3544324B2 (ja) 文字列情報抽出装置及び方法及びその方法を記録した記録媒体
US20030123730A1 (en) Document recognition system and method using vertical line adjacency graphs
Liu et al. Document image binarization based on texture analysis
JPH06180771A (ja) 英文字認識装置
JP2010257252A (ja) 画像認識装置
JP4079411B2 (ja) 画像処理方法、画像処理装置、画像処理プログラムおよび画像処理プログラムが格納されたコンピュータ読み取り可能な記憶媒体
JP2827960B2 (ja) 宛名行抽出装置
JP2861860B2 (ja) 宛名行抽出装置
JP2832928B2 (ja) 文字認識方法
JPH07160810A (ja) 文字認識装置
JP2003281469A (ja) 文書画像処理方法
JP3104355B2 (ja) 特徴抽出装置
JPS63131287A (ja) 文字認識方式
JP4439054B2 (ja) 文字認識装置及び文字枠線の検出方法
JPH07168911A (ja) 文書認識装置
JP2917394B2 (ja) 文字認識装置及び文字切り出し方法

Legal Events

Date Code Title Description
RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20040707

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050418

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20080403

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080408

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080605

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080722

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080910

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20081111

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20081124

R151 Written notification of patent or utility model registration

Ref document number: 4228592

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111212

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111212

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121212

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121212

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131212

Year of fee payment: 5

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees