JP4264332B2 - 文字認識装置、ナンバープレート認識システム - Google Patents

文字認識装置、ナンバープレート認識システム Download PDF

Info

Publication number
JP4264332B2
JP4264332B2 JP2003389550A JP2003389550A JP4264332B2 JP 4264332 B2 JP4264332 B2 JP 4264332B2 JP 2003389550 A JP2003389550 A JP 2003389550A JP 2003389550 A JP2003389550 A JP 2003389550A JP 4264332 B2 JP4264332 B2 JP 4264332B2
Authority
JP
Japan
Prior art keywords
character
image
resolution
recognition
dictionary
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP2003389550A
Other languages
English (en)
Other versions
JP2005149395A (ja
Inventor
喜一 杉本
聡 茶園
正博 井上
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Heavy Industries Ltd
Original Assignee
Mitsubishi Heavy Industries Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Heavy Industries Ltd filed Critical Mitsubishi Heavy Industries Ltd
Priority to JP2003389550A priority Critical patent/JP4264332B2/ja
Publication of JP2005149395A publication Critical patent/JP2005149395A/ja
Application granted granted Critical
Publication of JP4264332B2 publication Critical patent/JP4264332B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Landscapes

  • Character Discrimination (AREA)

Description

本発明は、車両のナンバープレートの記載内容を自動認識するのに用いて好適な文字認識装置、ナンバープレート認識システムに関する。
近年、高速道路の料金所等をはじめとして、車両のナンバープレートを自動認識する装置が多く用いられている。その用途としては、例えば、ナンバープレートの記載内容を認識することで、車両の種別等を判別するためである。
ナンバープレートの記載内容を認識するには画像処理技術を用いた文字認識手法が用いられている。
このような文字認識手法は、一般には、対象の文字画像を入力した後、文字と背景を分離するために文字線を強調し(2値化)を行い、文字であると判断できる領域を抽出する(文字切り出し処理)。文字切り出しされた領域において、文字の形状特徴(例えば輪郭線の方向特徴など)を抽出し、パターン認識により文字を認識する。
ところが、解像度の低いカメラで撮影された文字画像(低解像度画像)では、文字線部のかすれ(線の飛び)や文字穴部の潰れが発生しやすくなるため、正しく文字を認識出来ないという問題がある。このため通常は、十分な解像度を有するカメラにて文字画像を撮影することになるが、そのようなカメラは高価である。また解像度の高い画像を得るには、拡大して撮影を行うため、ひとつのカメラで撮影できる領域が小さく、道路上の全ての車両を撮影するには、カメラは複数台必要になる。その結果、システム全体のコストが高くなってしまうのである。
上記の問題を全て解決するための手段として、低解像度で撮影した文字画像を高解像度化して、文字認識をする方法がある。画像を高解像度化して文字認識する従来の手法としては、線形補間やサブピクセル処理が用いられているが、これらはいずれも元の低解像度画像をベースとした高解像度化処理である。したがって、元々失われている細部の情報は復元することは出来ないため、文字を完全に復元できるとは限らず、文字認識精度の向上にはつながりにくい。
このような情報復元の問題を解決するための方法として、事例に基づくSuper Resolution法(以下、超解像処理法と称する)がある(例えば、非特許文献1参照。)。この手法では事前に集めた高解像度画像と、それに対応する低解像度画像とを対にして記憶しておき、認識すべき低解像度の入力画像と、予め記憶した低解像度画像とを比較して最も似通っているものを選び出す。そして、選び出された低解像度画像に対応する高解像度画像を特定し、この高解像度画像を用い、文字認識のための画像処理を行う。このようにして認識すべき低解像度画像を高解像度化することで、低解像度画像で失われている細部の情報まで復元することができ、文字認識精度の向上につながる。
S. Baker & T. Kanade, "Limits on Super-Resolution and How to Break Them" IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 24, No. 9, September, 2002, pp. 1167 - 1183
しかしながら、特許文献1の手法では、入力画像と予め記憶された低解像度画像との総当りマッチング処理を行うため、記憶すべきデータ量や処理時の演算量が膨大なものとなり、高速処理することが難しい。自動車のナンバープレートを読み取る場合、おおよそ1秒以内で処理を完了する必要があり、認識精度の高さはもちろんのこと、処理速度の高さも非常に重要である。
また、特許文献1の手法では、正規化相関計算により、入力画像と予め記憶された低解像度画像のマッチング処理を行っているが、この正規化相関計算は、対象となる文字の変形や歪みに弱いという問題がある。自動車のナンバープレートを読み取る場合、例えば料金所に進入してくる車両は必ずしも一定の角度ではなく、斜めに進入してくることもある。またナンバープレートの取り付け角度が路面に対して略直角ではなく、上向きあるいは下向きに傾斜していることもある。さらには、折り曲げられていたり、事故等によって変形している場合もある。すると、入力画像における文字は変形や歪みを生じることが多く、このような場合、正規化相関計算では、高い認識精度を得るのは困難である。
本発明は、このような技術的課題に基づいてなされたもので、高い認識精度で高速に処理を行うことのできる文字認識装置、ナンバープレート認識システムを提供することを目的とする。
かかる目的のもと、本発明の文字認識装置は、複数の文字のそれぞれを所定の解像度で撮像したときの辞書画像、および複数の文字のそれぞれを辞書画像の解像度より高解像度で撮像したときの高解像度辞書画像を格納したデータベースと、データベースに格納された辞書画像から、外部から入力された文字画像にマッチする辞書画像を特定する特定処理部と、特定処理部で特定された辞書画像について、外部から入力された画像に含まれる文字の大きさと、前記画像から文字が記載されている領域の文字画像を切り出し、切り出された文字画像において背景色以外の部分の面積の前記文字画像の面積に対する占積率である充填率と、に基づき、辞書画像または辞書画像に関連付けられた高解像度辞書画像を選択し、選択された辞書画像または高解像度辞書画像に対し文字認識処理を施すことで、文字画像の文字を認識する文字認識部と、認識された文字を認識結果として出力する結果出力部と、を備えることを特徴とすることもできる。
ここで、文字認識処理に辞書画像を用いる場合は、超解像度処理を行わないことを示している。
このように、辞書画像または高解像度辞書画像を選択するには、文字認識部において、特定処理部で特定された文字画像の充填率、または文字画像に微分処理を施すことで得られる背景色と文字の部分とによる周波数に基づき選択を行うことができる。
また、文字認識部は、辞書画像または高解像度辞書画像を2値化処理し、2値化処理した画像において、輪郭線の方向ヒストグラム特徴を求め、統計的パターン認識により文字画像の文字を認識したり、辞書画像または高解像度辞書画像の輝度勾配方向のヒストグラム特徴に基づき、文字画像の文字を認識することもできる。加えて、2値化処理と輝度勾配方向のヒストグラム特徴を場合によって切り替えることもできる。すなわち、文字認識部は、辞書画像または高解像度辞書画像を2値化処理することによる文字認識の結果、候補となる文字のそれぞれに対するマハラノビス距離を求め、マハラノビス距離から文字認識の信頼度を判定し、その判定結果に基づき、2値化処理によって認識された文字を認識結果として確定するか、辞書画像または高解像度辞書画像の輝度勾配方向のヒストグラム特徴に基づいて文字認識を行うかを選択するのである。
このように、高解像度辞書画像を対象として文字認識を行う超解像度処理や、文字認識の際の手法として用いる2値化処理、輝度勾配方向のヒストグラム特徴を、必要に応じて用いることにより、負荷の高い(演算量が多い)処理を全体として削減し、必要な時のみ文字認識精度を向上させることができる。
上記したような文字認識装置は、文字画像の入力手段を問うものではなく、カメラで撮影した文字画像に限らず、文字認識装置に対して外部から入力できる文字画像であれば、その入力手段(取得手段)はいかなるものであってもよい。また、その文字画像も、いかなるものに記載されたものであってもよい。つまり、文字認識装置としては、文字認識対象をナンバープレートに限定する意図はないのである。
その一方、本発明は、通過する車両のナンバープレートを撮影するカメラと、カメラで撮影したナンバープレートの画像に基づき、ナンバープレートに記載された文字を認識する認識部と、認識部で文字を認識するため、複数の文字のそれぞれを所定の解像度で撮像したときの辞書画像、および複数の文字のそれぞれを辞書画像の解像度より高解像度で撮像したときの高解像度辞書画像を格納したデータベースと、データベースに格納された辞書画像から、カメラで撮影したナンバープレートに記載された文字画像にマッチする辞書画像を特定する特定処理部と、認識された文字を認識結果として出力する結果出力部と、を備え、認識部は、特定処理部で特定された辞書画像について、外部から入力された画像に含まれる文字の大きさと、画像から文字が記載されている領域の文字画像を切り出し、切り出された文字画像において背景色以外の部分の面積の文字画像の面積に対する占積率である充填率を算出し、文字の大きさと充填率とに基づき、当該辞書画像または当該辞書画像に関連付けられた高解像度辞書画像を選択し、選択された辞書画像または高解像度辞書画像に対し文字認識処理を施すことで、文字画像の文字を認識することを特徴とするナンバープレート認識システムとして捉えることもできる。
本発明によれば、車両のナンバープレートの記載内容の自動認識処理を、高い認識精度で高速に行うことが可能となる。
以下、添付図面に示す実施の形態に基づいてこの発明を詳細に説明する。
図1は、本実施の形態におけるナンバープレート認識システム10の構成を説明するための図である。
ナンバープレート認識システム10は、道路R上の車両のナンバープレート100を撮影すべく、道路Rの上方において、斜め下方に向けて設置されたカメラ20と、このカメラ20で撮影した画像を基に、ナンバープレート100に記載された文字の認識を行う文字認識装置30と、を備えている。
文字認識装置30は、カメラ20で撮影した画像の入力を受ける画像入力部31と、画像入力部31に入力された画像に基づき、文字認識処理を実行する認識処理部(マッチング処理部、特定処理部、文字認識部、認識部)32と、認識処理部32で認識処理を実行するにあたり必要なデータが格納されたデータベース33と、認識処理部32での認識処理結果を外部に出力する認識結果出力部(結果出力部)34と、を備えている。
図2に示すように、データベース33には、ナンバープレート100に使用される文字(数字、「−」、「・」等を含む)について、その文字をカメラ20と同等の解像度で撮影したときの画像(辞書画像:以下、低解像度辞書画像)Lと、同じ文字をカメラ20よりも高解像度で撮影したときの画像(以下、高解像度辞書画像)Hのデータが、互いに関連付けられて格納されている。そして、低解像度辞書画像Lについては、これを予め解析することで得られる、例えば、その低解像度辞書画像Lの各ピクセルの輝度値、輝度値の微分値(水平方向、垂直方向、斜め右下がり方向、斜め右上がり方向)等、文字画像の特徴量を示す指標(以下、特徴量)が、さらに関連付けてデータベース33に格納されている。
以下、認識処理部32における文字認識処理方法について説明する。
図3は、本実施の形態における文字認識処理の流れの一例を示すものである。なお、文字認識処理は、コンピュータ装置である文字認識装置30に予めインストールされたプログラムに基づき、CPU、メモリ等が協働することで機能的に発現する認識処理部32が、自動的に実行するものである。
この図3に示すように、画像入力部31に画像が入力されると、認識処理部32は、例えばナンバープレート100に対応した領域のみの画像を切り出す等、所定の前処理を実行する(ステップS101)。
そして、ナンバープレート100において、文字が記載されている領域の画像(以下、文字画像)Iを切り出す、文字切り出し処理を実行する(ステップS102)。このとき、切り出す文字画像Iの領域は、1文字毎に切り出すものとする。
そして、超解像度処理を用いた文字認識処理を実行する(ステップS103)。この文字認識処理では、正規化相関計算ではなく、2値化画像での文字形状特徴抽出によるパターンマッチング処理を用いる。
詳しくは、得られた文字画像Iについて認識処理部32にて解析し、文字画像Iの特徴量を示す指標を算出する。そして、図4に示すように、算出された文字画像Iの特徴量と、データベース33に格納された低解像度辞書画像Lの特徴量とを比較してマッチングを図り、マッチング度の最も高い低解像度辞書画像Lを特定する(ステップS111)。つまり、いわゆる超解像度処理を行うのである。
続いて、特定された低解像度辞書画像Lに関連付けられている高解像度辞書画像Hをデータベース33から呼び出し、認識処理部32にて、2値化処理する(ステップS112)。さらに、2値化処理した画像において、輪郭線の方向ヒストグラム特徴を求め、統計的パターン認識により文字を認識する(ステップS113)。
そして、文字の認識結果を確定し、これを文字認識装置30のメモリに記憶する(ステップS114)。
上記の、ステップS111〜S114の処理を、ステップS102で切り出した文字画像Iの数の分(文字数分)だけループし、個々の文字画像Iの文字を認識していく。
そして、全ての文字画像Iの認識が完了した時点で、文字認識装置30のメモリに記憶された個々の文字の認識結果から、ナンバープレート100に記載されている全ての文字の認識結果を得るのである。
得られた文字の認識結果は、必要に応じ、認識結果出力部34から外部の他の処理装置、記憶装置等に出力される。
このようにして、文字画像Iを超解像度処理し、特定された高解像度辞書画像Hを用いて文字認識することで、低解像度の文字画像Iで失われている細部の情報までを復元して、高い精度で文字認識を行うことができる。しかも、文字認識の際には、特定された高解像度辞書画像Hを用い、これを2値化処理し、輪郭線の方向ヒストグラム特徴を求めることで、変形や歪みに弱い正規化相互相関手法を用いる場合に比較し、文字の認識精度を向上させることができる。
その結果、カメラ20を従来より低解像度のものとすることも可能となり、カメラ20自体のコスとを抑えるだけでなく、カメラ20の台数自体も削減できるので、ナンバープレート認識システム10のコストを大幅に低減することが可能となる。
さて、上記ステップS103の文字認識処理においては、2値化処理を用いたが、これに代えて輝度勾配特徴を用いることもできる。
すなわち、図5に示すように、入力画像の前処理(ステップS101)、文字切り出し処理(ステップS102)を経た後の文字認識処理(ステップS103)において、図3のステップS111と同様にして文字画像Iに対する超解像度処理を行い、高解像度辞書画像Hを得る(ステップS121)。
この後、上記のように2値化処理を行うのではなく、得られた高解像度辞書画像Hの濃淡に基づく輝度勾配方向のヒストグラム特徴を得て、統計的パターン認識により文字を認識する(ステップS122)。
そして、文字の認識結果を確定し、これを文字認識装置30のメモリに記憶する(ステップS123)。
上記の、ステップS121〜S123の処理を、ステップS102で切り出した文字画像Iの数の分(文字数分)だけループし、個々の文字画像Iの文字を認識していき、全ての文字画像Iの認識が完了した時点で、文字認識装置30のメモリに記憶された個々の文字の認識結果から、ナンバープレート100に記載されている全ての文字の認識結果を得て、これを、必要に応じ、認識結果出力部34から外部の他の処理装置、記憶装置等に出力するのである。
このように、2値化処理ではなく、輝度勾配を用いることでも、図3の手法と同様の効果を得ることができる。輝度勾配を用いた場合、2値化処理よりも高い精度での文字認識が期待できる。
また、これら、2値化処理による文字認識と、輝度勾配を用いる文字認識とを組み合わせることもできる。
すなわち、図6に示すように、入力画像の前処理(ステップS101)、文字切り出し処理(ステップS102)を経た後の文字認識処理(ステップS103)において、図3のステップS111と同様にして文字画像Iに対する超解像度処理を行い、高解像度辞書画像Hを得る(ステップS131)。
続いて、得られた高解像度辞書画像Hをデータベース33から呼び出し、認識処理部32にて、2値化処理する(ステップS132)。さらに、2値化処理した画像において、輪郭線の方向ヒストグラム特徴を求め、統計的パターン認識により文字を認識する(ステップS133)。
そして、2値化処理による文字認識の結果、文字の類似度の信頼性が、予め設定したしきい値よりも高いか否かを判定する(ステップS134)。ここで、文字の類似度の信頼性が高いか否かを判定するには、マハラノビス距離を用いる。すなわち、2値化処理による文字認識の結果、文字の類似度の指標として、マハラノビス距離を求め、このマハラノビス距離が、予め設定したしきい値S1よりも高いか否かを判定するのである。
このとき、文字認識の結果、しきい値S1をクリアする文字の候補が複数ある場合、それぞれの文字に対するマハラノビス距離を比較する。この比較は、単にマハラノビス距離の小さい方を、最終的な文字認識結果(の文字)とするのではなく、マハラノビス距離の比に基づき、その比が予め設定したしきい値S2より大きいか否かで判定するのが好ましい。
具体例を挙げれば、しきい値S1が0.40であり、第一候補の文字に対するマハラノビス距離が0.25であり、第二候補の文字に対するマハラノビス距離が0.42である場合、第一候補の文字の信頼性が高いと判定するのである。第一候補の文字からして、マハラノビス距離がしきい値S1を上回っている場合、信頼性が低いと判定する。
また、第一候補の文字に対するマハラノビス距離が0.10であり、第二候補の文字に対するマハラノビス距離が0.30である場合、双方の文字がしきい値S1をクリアしているので、この場合、これらの比(0.30/0.10=3.0)がしきい値S2より大きいか否かで信頼性を判定するのである。
その結果、認識された文字の類似度の信頼性が高いと判定された場合、その文字を認識結果として確定し、これを文字認識装置30のメモリに記憶する(ステップS135)。
一方、ステップS134にて、文字の類似度の信頼性が低いと判定された場合、引き続き、図5の場合と同様、得られた高解像度辞書画像Hの濃淡に基づく輝度勾配方向のヒストグラム特徴を得て、統計的パターン認識により文字を認識する(ステップS136)。
そして、文字認識の結果、文字の類似度の信頼性が、予め設定したしきい値よりも高いか否かを、ステップS134と同様にして判定する(ステップS137)。
その結果、認識された文字の類似度の信頼性が高いと判定された場合、その文字を認識結果として確定し、これを文字認識装置30のメモリに記憶する(ステップS138)。これに対し、信頼性が低いと判定された場合は、認識した文字が不明、つまり文字認識をできなかったことを示す、不明判定を出す(ステップS139)。
上記のようにして、文字の認識結果が確定された場合、これを文字認識装置30のメモリに記憶した後、上記の、ステップS131〜S139の処理を、ステップS102で切り出した文字画像Iの数の分(文字数分)だけループし、個々の文字画像Iの文字を認識していき、全ての文字画像Iの認識が完了した時点で、文字認識装置30のメモリに記憶された個々の文字の認識結果から、ナンバープレート100に記載されている全ての文字の認識結果を得て、これを、必要に応じ、認識結果出力部34から外部の他の処理装置、記憶装置等に出力するのである。
このようにして、2値化による文字認識では信頼性の高い結果が得られないときには、より文字認識精度の高い輝度勾配特徴による文字認識処理を行うことで、より高い精度の認識結果を得ることができる。しかも、計算負荷が高い輝度勾配特徴による文字認識処理を、必要なとき、つまり2値化による文字認識では信頼性の高い結果が得られないときのみ行うことにより、処理を高速に実行することができる。
ところで、上記したような文字認識処理S103において、超解像度処理を必ずしも行わない構成とすることも可能である。
すなわち、図7に示すように、入力画像の前処理(ステップS101)、文字切り出し処理(ステップS102)を経た後の文字認識処理(ステップS103)において、まず、文字の大きさ・充填率を評価する(ステップS141)。
これには、認識処理部32において、切り出された文字画像Iにおいて、文字(と判断できる部分)の大きさを得るとともに、ナンバープレート100の背景色(日本国における場合、白、緑、黄、黒、青のいずれか)以外の部分の面積の、文字画像Iの面積に対する占積率(これを充填率とする)を計算(評価)する。
そして、文字の大きさが一定値以下であり、かつ、充填率が一定値以上であるか否かを判定する(ステップS142)。
その結果、文字の大きさが一定値以下であり、かつ、充填率が一定値以上であると判定された場合、図3のステップS111と同様にして文字画像Iに対する超解像度処理を行い、高解像度辞書画像Hを得る(ステップS143)。
続いて、得られた高解像度辞書画像Hをデータベース33から呼び出し、認識処理部32にて、2値化処理する(ステップS144)。さらに、2値化処理した画像において、輪郭線の方向ヒストグラム特徴を求め、統計的パターン認識により文字を認識する(ステップS145)。
これに対し、ステップS142にて、文字の大きさが一定値以下であり、かつ、充填率が一定値以上であるという条件を満たさないと判定された場合、つまり文字の大きさが一定値以上であるか、充填率が一定値未満であるか、文字の大きさが一定値以上で、かつ充填率が一定値未満である場合は、ステップS143の超解像度処理をスキップし、ステップS144、S145に移行し、2値化処理を行った後、ステップS145にて、2値化処理した画像における輪郭線の方向ヒストグラム特徴を求め、統計的パターン認識により文字を認識するのである。このとき、ステップS144において2値化処理する対象画像は、超解像度処理を行っていないため、文字画像Iそのもの、あるいは文字画像Iとマッチング度の高い低解像度辞書画像Lとすることができる。処理速度の面から言えば、文字画像Iそのものを対象として2値化処理するのが好ましいが、文字認識精度の面から言えば、文字画像Iとマッチング度の高い低解像度辞書画像Lを対象とするのが好ましい。
そして、文字の認識結果を確定し、これを文字認識装置30のメモリに記憶する(ステップS146)。
上記の、ステップS141〜S146の処理を、ステップS102で切り出した文字画像Iの数の分(文字数分)だけループすることで、ナンバープレート100に記載されている全ての文字の認識結果を得て、これを、必要に応じ、認識結果出力部34から外部の他の処理装置、記憶装置等に出力するのである。
このとき、ステップS144、145の文字2値化ステップ、文字認識ステップは、図5に示したような輝度勾配を用いた文字認識処理、あるいは図6に示した、必要に応じて2値化と輝度勾配を切り替える文字認識処理とすることも可能である。
このようにして、図7の例では、文字の大きさが一定値以下であり、かつ、充填率が一定値以上である場合のみ、超解像度処理を行うようにしたのである。これにより、文字が大きい場合や、充填率が低い場合には、超解像度処理を行わないことになる。充填率は、得られた文字の像がぼやけていなければ低く、また複雑な文字でなければ低くなる。つまり、大きな文字や、文字の像がはっきりしている場合、複雑ではない文字の場合には超解像度処理を行わず、処理を高速化することが可能となる。また小さな文字や、得られた文字の像がぼやけている場合、複雑な文字の場合には超解像度処理を行い、文字の認識精度を上げることができる。このようにして、処理を高速化しつつ、必要なときのみ高精度の文字認識を行うことで、高い文字認識精度を得ることが可能となる。
上記図7の例では、充填率を用い、超解像度処理を行うか否かを判定するようにしたが、これに代えて、周波数を用いることもできる。
すなわち、ステップS142に代えて、ステップS102で得られた低解像度の文字画像Iに対し、微分処理を施し、得られた微分値が、予め定めた一定値以上大きいか否かを判定し、一定値以上であると判定されたときのみ、ステップS143に進んで超解像度処理を行うのである。微分値が大きいということは、ナンバープレート100の背景色の部分と文字の部分による周波数が高く、エッジを鮮明化したい部分が多いということである。例えば、図8に示すように、ナンバープレート100の空白部分A1〜A4の部分は、背景色のみなので、微分値は小さい(ゼロに近い)。また、ナンバープレート100の、大きな文字が記載された領域A5では、文字が大きいため、周波数が低くなる。これに対し、文字が小さな領域A6〜A8では、周波数が高くなる。
したがって、用いるカメラ20の仕様等に応じ、文字が小さな領域A6〜A8、あるいは文字が小さな領域A6〜A8の中でも周波数が高い場合に超解像度処理が行われるように、しきい値(一定値)を設定するのである。
このようにしても、上記図7の場合と同様、全体としての処理量(演算量)を大幅に低減し、処理を高速化しつつ、必要なときのみ超解像度処理による高精度の文字認識を行うことで、高い文字認識精度を得ることが可能となる。
さて、上記のようにして、文字認識装置30において文字認識処理を行うわけであるが、その処理をさらに高速化するには、データベース33に格納された低解像度辞書画像L、高解像度辞書画像Hのデータ量をなるべく少なくするのが好ましい。
これにはまず、データベース33に格納するために事前に集められた低解像度辞書画像Lの特徴量(特徴パターンベクトル)の各要素の値を量子化する方法がある。例えば、特徴パターンベクトルを構成する各値がそれぞれ256階調の値を持つ場合、これを32階調程度に量子化する。そして、量子化した特徴パターンベクトルを、その低解像度辞書画像Lの特徴量としてデータベース33に格納するのである。これにより、データベース33に格納するデータ量を実質的に圧縮できる。
また、他の方法として、以下に示すようなものがある。
低解像度辞書画像Lにおける文字は、図9(a)に示すような特徴パターン(特徴的な部分の形状)に分解することができる。超解像度処理では、これら特徴パターンの種類、およびそれらの組み合わせを特定することで、文字画像Iと低解像度辞書画像Lのマッチングを行うことができる。
このような特徴パターンを、k−means法、ベクトル量子法等の手法によってクラスタリングし、図9(b)に示すように、複数のグループG1、G2、…にグループ化する。つまり特徴パターンが似ているものを同じグループに集めるのである。
そして、グループG1、G2、…のそれぞれにおいて、代表パターンP1、P2、…を決め、この代表パターンP1、P2、…に、そのグループG1、G2、…に属する全ての特徴パターンを関連付けてデータベース33に格納する。
実際に、文字認識を行う際には、図10に示すように、文字画像Iの特徴パターンと、データベース33に格納された代表パターンP1、P2、…とのマッチングを行う。そして、マッチングする代表パターン(例えば代表パターンP3)が特定されたら、続いて、この代表パターンP3に関連付けられているグループG3を特定する。そして、このグループG3に属する特徴パターンと、文字画像Iの特徴パターンとのマッチングを行い、文字画像Iに最もマッチング度の高い特徴パターンを特定するのである。
このように、文字画像Iと低解像度辞書画像Lのマッチングを行うに際し、代表パターンP1、P2、…を用いることで、従来のような総当りでのマッチングを行う必要が無くなり、マッチングに要する演算時間を大幅に短縮することが可能となる。
また、以下のような方法もある。
上記図9に示した方法と同様、低解像度辞書画像Lにおける文字の特徴パターンを、k−means法、ベクトル量子法等の手法によってクラスタリングし、図11(a)に示すように、複数のグループG1、G2、…にグループ化する。そして、グループG1、G2、…のそれぞれにおいて、代表パターンP1、P2、…を決める。
図11(b)に示すように、データベース33には、この代表パターンP1、P2、…のみを、データベース33の低解像度辞書画像Lの特徴パターンとして格納する(そのグループG1、G2、…に属する他の全ての特徴パターンはデータベース33に格納しない)。
そして、実際に文字認識を行う際には、図12に示すように、文字画像Iの特徴パターンと、図11(b)に示した、データベース33に格納された代表パターンP1、P2、…とのマッチングを行う。そして、マッチングする代表パターン(例えば代表パターンP3)が特定されたら、この代表パターンP3を、文字画像Iに最もマッチング度の高い特徴パターンとして用いるのである。
このような手法によれば、上記図9、図10に示した場合と同様、文字画像Iと低解像度辞書画像Lのマッチングを行うに際し、代表パターンP1、P2、…を用いることで、従来のような総当りでのマッチングを行う必要が無くなり、マッチングに要する演算時間を大幅に短縮することが可能となる。さらに、図9、図10に示した場合に比較し、マッチングする代表パターンを特定した後、これが属するグループを特定し、さらにそのグループに属する特徴パターンと文字画像Iの特徴パターンとのマッチングを行い、文字画像Iに最もマッチング度の高い特徴パターンを特定する必要がない。これにより、処理をさらに高速に行うことが可能となる。一方、文字認識精度の面では、代表パターンP1、P2、…をそのまま文字画像Iの特徴パターンとのマッチングに用いるので、図9、図10の手法の方が、文字認識精度が高くなる。どちらの手法を採用するかは、要求される処理速度や文字認識精度等に応じて決めればよい。
また、データベース33には、代表パターンP1、P2、…のみが格納されるため、データベース33へのデータ格納量を大幅に少なくすることも可能である。
なお、上記実施の形態で示した各構成、手法は、適宜組み合わせることが可能である。
これ以外にも、本発明の主旨を逸脱しない限り、上記実施の形態で挙げた構成を取捨選択したり、他の構成に適宜変更することが可能である。
本実施の形態におけるナンバープレート認識システムの構成を示す図である。 データベースに低解像度辞書画像と高解像度辞書画像を格納することを示す図である。 超解像度処理後、2値化処理により文字認識する場合の処理の流れを示す図である。 超解像度処理において、入力された文字画像にマッチングする高解像度辞書画像を得ることを示す図である。 超解像度処理後、輝度勾配を用いて文字認識する場合の処理の流れを示す図である。 信頼度に応じて、2値化処理を用いた文字認識と、輝度勾配を用いた文字認識を切り替える場合の処理の流れを示す図である。 条件に応じて、所定の条件を満たした場合のみ超解像度処理を行う場合の処理の流れを示す図である。 画像の周波数に関して説明するための図である。 データベースに、文字の特徴パターンをクラスタリングして格納することを示す図である。 クラスタリングして格納された特徴パターンを用い、文字認識を行うことを示す図である。 データベースに、文字の特徴パターンをクラスタリングして格納する他の例を示す図である。 クラスタリングして格納された特徴パターンを用い、文字認識を行うことを示す図である。
符号の説明
10…ナンバープレート認識システム、20…カメラ、30…文字認識装置、32…認識処理部(マッチング処理部、特定処理部、文字認識部、認識部)、33…データベース、34…認識結果出力部(結果出力部)、100…ナンバープレート、H…高解像度辞書画像、I…文字画像、L…低解像度辞書画像(辞書画像)

Claims (6)

  1. 複数の文字のそれぞれを所定の解像度で撮像したときの辞書画像、および複数の前記文字のそれぞれを前記辞書画像の解像度より高解像度で撮像したときの高解像度辞書画像を格納したデータベースと、
    前記データベースに格納された前記辞書画像から、外部から入力された文字画像にマッチする前記辞書画像を特定する特定処理部と、
    前記特定処理部で特定された前記辞書画像について、外部から入力された画像に含まれる文字の大きさと、前記画像から文字が記載されている領域の文字画像を切り出し、切り出された前記文字画像において背景色以外の部分の面積の前記文字画像の面積に対する占積率である充填率と、に基づき、当該辞書画像または当該辞書画像に関連付けられた前記高解像度辞書画像を選択し、選択された前記辞書画像または前記高解像度辞書画像に対し文字認識処理を施すことで、前記文字画像の文字を認識する文字認識部と、
    認識された前記文字を認識結果として出力する結果出力部と、
    を備えることを特徴とする文字認識装置。
  2. 前記文字認識部は、前記特定処理部で特定された前記文字画像の充填率、または前記文字画像に微分処理を施すことで得られる背景色と文字の部分とによる周波数に基づき、前記辞書画像または前記高解像度辞書画像を選択することを特徴とする請求項1に記載の文字認識装置。
  3. 前記文字認識部は、前記辞書画像または前記高解像度辞書画像を2値化処理し、2値化処理した画像において、輪郭線の方向ヒストグラム特徴を求め、統計的パターン認識により前記文字画像の文字を認識することを特徴とする請求項1または2に記載の文字認識装置。
  4. 前記文字認識部は、前記辞書画像または前記高解像度辞書画像の輝度勾配方向のヒストグラム特徴に基づき、前記文字画像の文字を認識することを特徴とする請求項1または2に記載の文字認識装置。
  5. 前記文字認識部は、前記辞書画像または前記高解像度辞書画像を2値化処理することによる文字認識の結果、候補となる文字のそれぞれに対するマハラノビス距離を求め、前記マハラノビス距離から文字認識の信頼度を判定し、その判定結果に基づき、前記2値化処理によって認識された文字を認識結果として確定するか、前記辞書画像または前記高解像度辞書画像の輝度勾配方向のヒストグラム特徴に基づいて文字認識を行うかを選択することを特徴とする請求項1または2に記載の文字認識装置。
  6. 通過する車両のナンバープレートを撮影するカメラと、
    前記カメラで撮影した前記ナンバープレートの画像に基づき、前記ナンバープレートに記載された文字を認識する認識部と、
    前記認識部で文字を認識するため、複数の文字のそれぞれを所定の解像度で撮像したときの辞書画像、および複数の前記文字のそれぞれを前記辞書画像の解像度より高解像度で撮像したときの高解像度辞書画像を格納したデータベースと、
    前記データベースに格納された前記辞書画像から、前記カメラで撮影した前記ナンバープレートに記載された文字画像にマッチする前記辞書画像を特定する特定処理部と、
    認識された前記文字を認識結果として出力する結果出力部と、を備え、
    前記認識部は、前記特定処理部で特定された前記辞書画像について、外部から入力された画像に含まれる文字の大きさと、前記画像から文字が記載されている領域の文字画像を切り出し、切り出された前記文字画像において背景色以外の部分の面積の前記文字画像の面積に対する占積率である充填率を算出し、前記文字の大きさと前記充填率とに基づき、当該辞書画像または当該辞書画像に関連付けられた前記高解像度辞書画像を選択し、選択された前記辞書画像または前記高解像度辞書画像に対し文字認識処理を施すことで、前記文字画像の文字を認識することを特徴とするナンバープレート認識システム。
JP2003389550A 2003-11-19 2003-11-19 文字認識装置、ナンバープレート認識システム Expired - Lifetime JP4264332B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2003389550A JP4264332B2 (ja) 2003-11-19 2003-11-19 文字認識装置、ナンバープレート認識システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003389550A JP4264332B2 (ja) 2003-11-19 2003-11-19 文字認識装置、ナンバープレート認識システム

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2008125045A Division JP2008251029A (ja) 2008-05-12 2008-05-12 文字認識装置、ナンバープレート認識システム

Publications (2)

Publication Number Publication Date
JP2005149395A JP2005149395A (ja) 2005-06-09
JP4264332B2 true JP4264332B2 (ja) 2009-05-13

Family

ID=34696261

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003389550A Expired - Lifetime JP4264332B2 (ja) 2003-11-19 2003-11-19 文字認識装置、ナンバープレート認識システム

Country Status (1)

Country Link
JP (1) JP4264332B2 (ja)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010108161A (ja) * 2008-10-29 2010-05-13 Pioneer Electronic Corp 画像処理装置及び方法、並びにコンピュータプログラム
CN105453132B (zh) 2013-08-15 2019-04-05 日本电气株式会社 实施图像处理的信息处理设备和图像处理方法
CN104102909B (zh) * 2014-07-23 2017-03-15 中科联合自动化科技无锡有限公司 基于多重视觉信息的车辆特征定位及匹配方法
JP6341059B2 (ja) * 2014-10-31 2018-06-13 オムロン株式会社 文字認識装置、文字認識方法、およびプログラム
JP7069927B2 (ja) * 2018-03-26 2022-05-18 株式会社デンソー 物体認識装置、及び物体認識方法
CN109447074A (zh) * 2018-09-03 2019-03-08 中国平安人寿保险股份有限公司 一种车牌识别方法及终端设备

Also Published As

Publication number Publication date
JP2005149395A (ja) 2005-06-09

Similar Documents

Publication Publication Date Title
KR102030628B1 (ko) Cnn 기반 차량 번호판 인식 방법 및 시스템
WO2019169816A1 (zh) 一种用于精细化识别车辆属性的深度神经网络及训练方法
Al-Ghaili et al. Vertical-edge-based car-license-plate detection method
CN112686812B (zh) 银行卡倾斜矫正检测方法、装置、可读存储介质和终端
CN110298376B (zh) 一种基于改进b-cnn的银行票据图像分类方法
JP2008251029A (ja) 文字認識装置、ナンバープレート認識システム
US20070058856A1 (en) Character recoginition in video data
US10275677B2 (en) Image processing apparatus, image processing method and program
US20080205764A1 (en) Information processing apparatus, method, and program
EP3915042B1 (en) Tyre sidewall imaging method
US20040086153A1 (en) Methods and systems for recognizing road signs in a digital image
Shah et al. OCR-based chassis-number recognition using artificial neural networks
CN114170418B (zh) 一种以图搜图的汽车线束连接器多特征融合图像检索方法
CN114387591A (zh) 车牌识别方法、系统、设备及存储介质
CN111723852A (zh) 针对目标检测网络的鲁棒训练方法
Yang et al. Recognizing license plates in real-time
JP4264332B2 (ja) 文字認識装置、ナンバープレート認識システム
CN112070116B (zh) 一种基于支持向量机的艺术画作自动分类系统及方法
US6694059B1 (en) Robustness enhancement and evaluation of image information extraction
US11748979B2 (en) Method for training a neural network for recognition of a character sequence and associated recognition method
Siddique et al. Development of an automatic vehicle license plate detection and recognition system for Bangladesh
Chatbri et al. An application-independent and segmentation-free approach for spotting queries in document images
CN114972540A (zh) 目标定位方法、装置、电子设备及存储介质
JP5439069B2 (ja) 文字認識装置及び文字認識方法
JP2005250786A (ja) 画像認識方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060216

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20080306

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080312

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080512

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080611

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080806

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080917

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20081117

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20090128

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20090216

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120220

Year of fee payment: 3

R151 Written notification of patent or utility model registration

Ref document number: 4264332

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120220

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120220

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130220

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140220

Year of fee payment: 5

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R371 Transfer withdrawn

Free format text: JAPANESE INTERMEDIATE CODE: R371

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

EXPY Cancellation because of completion of term