JP5419491B2 - 文字認識装置及び文字認識方法 - Google Patents

文字認識装置及び文字認識方法 Download PDF

Info

Publication number
JP5419491B2
JP5419491B2 JP2009038389A JP2009038389A JP5419491B2 JP 5419491 B2 JP5419491 B2 JP 5419491B2 JP 2009038389 A JP2009038389 A JP 2009038389A JP 2009038389 A JP2009038389 A JP 2009038389A JP 5419491 B2 JP5419491 B2 JP 5419491B2
Authority
JP
Japan
Prior art keywords
image
character
binarized
character recognition
contour line
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2009038389A
Other languages
English (en)
Other versions
JP2010191909A (ja
Inventor
喜一 杉本
健太 中尾
真由美 斎藤
拓馬 岡▲崎▼
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Heavy Industries Ltd
Original Assignee
Mitsubishi Heavy Industries Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Heavy Industries Ltd filed Critical Mitsubishi Heavy Industries Ltd
Priority to JP2009038389A priority Critical patent/JP5419491B2/ja
Publication of JP2010191909A publication Critical patent/JP2010191909A/ja
Application granted granted Critical
Publication of JP5419491B2 publication Critical patent/JP5419491B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Character Input (AREA)
  • Character Discrimination (AREA)

Description

本発明は、例えば、車両番号等の文字列を認識する文字認識装置に係り、特に、画数が多く潰れて見える文字や、輪郭線の特徴が少なく区別しにくい文字などに対しても高精度に文字の認識を行うことができる文字認識装置に関するものである。
従来、車両のナンバープレートに記載された車両番号などの記載内容を自動認識する装置が知られている。
ナンバープレートの記載内容を認識するには、画像処理技術を用いた文字認識手法が用いられている。このような文字認識手法は、一般には、対象の文字画像を入力した後、文字と背景を分離するために2値化して文字線を強調し、文字であると判断できる領域を抽出する(文字切り出し処理)。文字切り出しされた領域において、文字の形状特徴(例えば輪郭線の方向特徴量など)を抽出し、パターン認識により文字を認識する。
ところで、ナンバープレートは、その形状、大きさ、記載される文字列等が各国毎に相違し、例えば、画数が多いために潰れて見える文字(例えば、W、Mなど)や、文字輪郭線の特徴が乏しいために互いに区別するのが困難な文字(例えば、CとG、DとQと0など)が含まれたナンバープレートも散見される。このような場合には、従来の文字認識装置では、正しい認識結果が得られないことがある。
そこで、特開2004−164469号公報(特許文献1)には、文字が潰れる箇所を予め形状パターンとして記録しておき、この形状パターンから潰れを補完する技術が開示されている。
特開2004−164469号公報
しかしながら、特許文献1に記載された技術では、予め記録すべき形状パターンが多いことから、形状パターンを記憶するために大容量の記憶装置が必要となるという問題があった。
本発明は、上記問題を解決するためになされたもので、大容量の記憶装置を設けることなく、文字列に画像処理を施すことにより、文字列の潰れやボケを補完して文字輪郭線の形状を鮮明にし、文字認識精度を向上させた文字認識装置を提供することを目的とする。
上記課題を解決するために、本発明は以下の手段を採用する。
本発明は、車両のナンバープレートの文字列を撮像した画像から2値化画像を生成し、該2値化画像に基づいて文字を認識する文字認識手段と、前記2値化画像に基づいて認識することが困難であるとして予め定めた複数の文字を記憶した記憶手段と、前記2値化画像に基づいて認識された文字のうち、類似度が1位と認識された文字が前記記憶手段に記憶された文字であると判断された場合であって、前記2値化画像に基づいて認識された文字のうち、類似度が1位の文字の類似度と2位の文字の類似度とに予め設定された閾値以上の差がない場合に、前記画像及び前記2値化画像を所定の倍率に拡大して拡大画像及び拡大2値化画像を生成する拡大手段と、前記拡大画像から微分フィルタを用いて前記文字列の輪郭線を抽出した輪郭線抽出画像を生成する輪郭線抽出手段と、前記輪郭線抽出画像の輝度を反転させた反転画像を生成し、該反転画像から2値化反転画像を生成し、該2値化反転画像と前記拡大2値化画像との論理積画像を生成する論理積画像生成手段と、を備え、前記文字認識手段が、前記論理積画像から2値化論理積画像を生成し、該2値化論理積画像から所定の文字認識特徴量を抽出してマッチング処理を行うことにより文字を認識する文字認識装置を提供する。
本発明によれば、文字列を撮影した画像から生成された2値化画像に基づいて認識された文字が、記憶手段に予め記憶された文字であると判断された場合に、再度文字認識処理を行う。ここで、記憶手段には、2値化画像に基づいて認識することが困難であるとして予め定めた複数の文字が記憶されている。記憶手段に記憶された文字としては、例えば、画数が多いために潰れて見える文字(例えば、W、Mなど)や、文字輪郭線の特徴が乏しいために互いに区別するのが困難な文字(例えば、CとG、DとQと0など)などが挙げられる。すなわち、2値化画像に基づいて認識することが困難である文字について再度文字認識処理を行うことで輪郭線を鮮明として正確に文字認識を行う。
つまり、2値化画像に基づいて認識された文字が、記憶手段に予め記憶された文字である場合には、まず文字列を撮影した画像と、この画像から生成された2値化画像とを所定の倍率で拡大する。また、所定の倍率とは、後の処理で微分フィルタにより画像に含まれる文字の輪郭線を抽出する際に、より効果が出るような倍率に設定される。従って、入力される画像の文字のサイズにより異なるが、概ね、入力された画像の1.5倍以上2.0倍以下に設定されることが好ましい。この画像を拡大することで、後の輪郭線強調処理の効果をより高めることが出来る。また、後の処理で論理積画像を求めるときに、2値化された画像も同倍率で拡大されている必要があることから、ここでは、文字列を撮影した画像及びその2値化画像の双方を同倍率で拡大する。
さらに、拡大された画像に対して、微分フィルタを用いて文字列の輪郭線を抽出した輪郭線抽出画像を生成するので、輪郭線からその輝度勾配の強度や方向を把握することができる。この輪郭線抽出画像を一旦反転させて反転画像を得た上で、反転画像を2値化して2値化反転画像を生成し、先に拡大された拡大2値化画像と2値化反転画像との論理積画像を生成する。これにより、潰れやボケが生じた文字の輪郭線の形状がより鮮明となる。そして、論理積画像を2値化して2値化論理積画像を生成し、2値化論理積画像から所定の文字認識特徴量を抽出してマッチング処理を行うことにより文字を認識する。なお、ここで所定の文字認識特徴量とは、例えば、文字の輪郭線の方向特徴量や、局所領域の文字線の面積充填率などの構造特徴量があり、認識する文字に応じて特徴量を適宜選択し、選択した特徴量に基づいてマッチング処理を行うことが出来る。
このように、文字認識対象の画像を拡大して輪郭線をより強調し、より強調された輪郭線の明暗や輝度勾配に基づいて文字認識を行うので、入力された文字画像に潰れやボケが生じている場合であってもその輪郭線を鮮明に認識することができ、文字認識精度が向上する。
本発明は、車両のナンバープレートの文字列を撮像した画像から2値化画像を生成し、該2値化画像に基づいて文字を認識する文字認識手段と、前記2値化画像に基づいて認識することが困難であるとして予め定めた複数の文字を記憶した記憶手段と、前記2値化画像に基づいて認識された文字のうち、類似度が1位と認識された文字が前記記憶手段に記憶された文字であると判断された場合であって、前記2値化画像に基づいて認識された文字のうち、類似度が1位の文字の類似度と2位の文字の類似度とに予め設定された閾値以上の差がない場合に、前記画像を所定の倍率に拡大して拡大画像を生成する拡大手段と、前記拡大画像から微分フィルタを用いて前記文字列の輪郭線を抽出した輪郭線抽出画像を生成する輪郭線抽出手段と、を備え、前記文字認識手段が、前記輪郭線抽出画像から2値化輪郭線抽出画像を生成し、該2値化輪郭線抽出画像から所定の文字認識特徴量を抽出してマッチング処理を行うことにより文字を認識する文字認識装置を提供する。
本発明によれば、文字列を撮影した画像から生成された2値化画像に基づいて認識された文字が、記憶手段に予め記憶された文字であると判断された場合に、再度文字認識処理を行う。ここで、記憶手段には、2値化画像に基づいて認識することが困難であるとして予め定めた複数の文字が記憶されている。記憶手段に記憶された文字としては、例えば、画数が多いために潰れて見える文字(例えば、W、Mなど)や、文字輪郭線の特徴が乏しいために互いに区別するのが困難な文字(例えば、CとG、DとQと0など)などが挙げられる。すなわち、2値化画像に基づいて認識することが困難である文字に対して、再度文字認識処理を行うことで輪郭線を鮮明として正確に文字認識を行う。
つまり、2値化画像に基づいて認識された文字が、記憶手段に予め記憶された文字である場合には、まず文字列を撮影した画像を所定の倍率で拡大する。この画像を拡大することで、後の輪郭線強調処理の効果をより高めることが出来る。さらに、拡大された画像に対して、微分フィルタを用いて文字列の輪郭線を抽出した輪郭線抽出画像を生成するので、輪郭線からその輝度勾配の強度や方向を把握することができる。この輪郭線抽出画像を2値化して2値化論理積画像を生成し、2値化論理積画像から所定の文字認識特徴量を抽出してマッチング処理を行うことにより文字を認識する。
このように、文字認識対象の画像を拡大して輪郭線をより強調し、より強調された輪郭線の明暗や輝度勾配に基づいて文字認識を行うので、入力された文字画像に潰れやボケが生じている場合であってもその輪郭線を鮮明に認識することができ、文字認識精度が向上する。
上記文字認識装置において、前記拡大画像に対して先鋭化処理を行う先鋭化手段を備え、前記輪郭線抽出手段は、前記先鋭化手段により先鋭化された拡大画像から微分フィルタを用いて前記文字列の輪郭線を抽出した輪郭線抽出画像を生成することが好ましい。
先鋭化処理手段により拡大画像に先鋭化処理を行うことで、輪郭線抽出画像を生成した際に、輪郭線をさらに強調することができ、認識対象の文字の潰れやボケがより強い場合であっても、先鋭化によりさらに強調された輪郭線の明暗や輝度勾配に基づいて文字認識を行うので、入力された文字画像に潰れやボケが生じている場合であってもその輪郭線を鮮明に認識することができ、文字認識精度が向上する。
また、上記文字認識装置において、前記文字認識手段は、抽出する前記文字認識特徴量を異ならせ、異なる前記文字認識特徴量に基づいて複数回マッチング処理を行うことにより複数回文字を認識し、複数回の認識結果から最も認識頻度の高い文字を、最終的な認識結果として出力することが好ましい。
文字認識特徴量を異ならせて複数回の文字認識処理を実行して、複数回の文字認識処理の結果に基づいて最終的な文字認識結果を出力するので、文字認識の信頼度が高まり、文字認識精度がより向上する。
また、上記文字認識装置において、前記2値化論理積画像又は前記2値化輪郭線抽出画像から所定領域を選択する領域選択手段を備え、前記文字認識手段は、該所定領域に対してマッチング処理を行うことにより文字を認識することが好ましい。
前記2値化論理積画像又は前記2値化輪郭線抽出画像から所定領域を選択し、選択された所定領域においてマッチング処理などの文字認識処理を実行するので、文字認識処理にかかる演算量が減少するため、文字認識処理に要する時間を短縮することが出来るとともに、潰れやボケとは無関係な領域に関する文字認識特徴量の影響を受けることなく、文字認識処理が可能となるので、文字認識精度がより向上する。なお、所定の領域とは、文字の潰れやボケが生じることにより誤認識を招来させる可能性のある領域であり、例えば、CとGとで潰れやボケが生じるのは文字の右下部分であり、WとMとでは文字の中心部分となる。所定の領域に関する情報、すなわち、潰れやボケが生じやすい領域に関する情報は、予め潰れ情報として例えば記憶手段等に記憶しておくことが好ましい。
本発明は、車両のナンバープレートの文字列を撮像した画像から2値化画像を生成し、該2値化画像に基づいて文字を認識する文字認識方法であって、前記2値化画像に基づいて認識された文字のうち、類似度が1位と認識された文字が前記2値化画像に基づいて認識することが困難であるとして予め定めた複数の文字の何れかであると判断された場合であって、前記2値化画像に基づいて認識された文字のうち、類似度が1位の文字の類似度と2位の文字の類似度とに予め設定された閾値以上の差がない場合に、前記画像及び前記2値化画像を所定の倍率に拡大して拡大画像及び拡大2値化画像を生成するステップと、前記拡大画像から微分フィルタを用いて前記文字列の輪郭線を抽出した輪郭線抽出画像を生成するステップと、前記輪郭線抽出画像の輝度を反転させた反転画像を生成し、該反転画像から2値化反転画像を生成し、該2値化反転画像と前記拡大2値化画像との論理積画像を生成するステップと、前記論理積画像から2値化論理積画像を生成し、該2値化論理積画像から所定の文字認識特徴量を抽出してマッチング処理を行うことにより文字を認識するステップと、を備えたことを特徴とする文字認識方法を提供する。
本発明は、車両のナンバープレートの文字列を撮像した画像から2値化画像を生成し、該2値化画像に基づいて文字を認識する文字認識方法であって、前記2値化画像に基づいて認識された文字のうち、類似度が1位と認識された文字が前記2値化画像に基づいて認識することが困難であるとして予め定めた複数の文字の何れかであると判断された場合であって、前記2値化画像に基づいて認識された文字のうち、類似度が1位の文字の類似度と2位の文字の類似度とに予め設定された閾値以上の差がない場合に、前記画像を所定の倍率に拡大して拡大画像を生成するステップと、前記拡大画像から微分フィルタを用いて前記文字列の輪郭線を抽出した輪郭線抽出画像を生成するステップと、前記輪郭線抽出画像から2値化輪郭線抽出画像を生成し、該2値化輪郭線抽出画像から所定の文字認識特徴量を抽出してマッチング処理を行うことにより文字を認識するステップと、を備えたことを特徴とする文字認識方法を提供する。
このように、本発明によれば、文字認識対象の画像を拡大して輪郭線をより強調し、より強調された輪郭線の明暗や輝度勾配に基づいて文字認識を行うので、入力された文字画像に潰れやボケが生じている場合であってもその輪郭線を鮮明に認識することができ、文字認識精度が向上する。
本発明の第1の実施形態にかかる文字認識装置の概略構成を示すブロック図である。 本発明の第1の実施形態にかかる文字認識装置における文字認識処理の過程を示すフローチャートである。 本発明の第2の実施形態にかかる文字認識装置の概略構成を示すブロック図である。 本発明の第2の実施形態にかかる文字認識装置における文字認識処理の過程を示すフローチャートである。 本発明の第1の実施形態にかかる文字認識装置の変形例における文字認識処理の過程を示すフローチャートである。 本発明の第1の実施形態にかかる文字認識装置の変形性における文字認識処理の過程を示すフローチャートである。
以下に、本発明に係る文字認識装置の実施形態について、図面を参照して説明する。
〔第1の実施形態〕
図1は、本発明の第1の実施形態に係る文字認識装置の概略構成を示したブロック図である。
本発明における文字認識装置10は、車両のナンバープレートを撮影して画像を得るカメラ11と、カメラ11で撮影した画像の入力を受ける画像入力部12と、画像入力部12に入力された画像に基づいて文字認識処理を実行する認識処理部13と、認識処理部13での認識結果を出力する認識結果出力部14を備えている。
認識処理部13は、文字認識処理を実行するための演算を行うものであり、文字認識処理に関する各種演算処理を実行するCPU(中央演算処理装置)21、文字認識処理にかかるプログラム等を記憶する読み出し専用のメモリであるROM(Read Only Memory)22、CPU21の作業領域として機能する読み書き自在のメモリであるRAM(Random Access Memory)23、及び文字認識処理にかかるプログラムに基づく文字認識処理を実行するに際して必要となる種々のデータが格納された記憶装置24を備えている。
また、認識処理部13は、文字認識手段としての文字認識部25、拡大手段としての拡大部26、輪郭線抽出手段としての輪郭線抽出部27、及び論理積画像生成手段としての論理積画像生成部28を備えている。
文字認識部25は、画像入力部12により入力された画像から2値化画像を生成し、2値化画像に基づいて、この画像に含まれる文字を認識するとともに、後述する論理積画像生成部29により生成された論理積画像から2値化論理積画像を生成し、この2値化論理積画像から所定の文字認識特徴量を抽出してマッチング処理を行うことにより文字を認識する。ここで、所定の文字認識特徴量とは、例えば、文字の輪郭線の方向特徴量や、局所領域の文字線の面積充填率などの構造特徴量があり、認識する文字に応じて特徴量を適宜選択し、選択した特徴量に基づいてマッチング処理を行うことが出来る。
拡大部26は、CPU21により、文字認識部25により認識された文字が、所定の文字であると判断された場合に、この文字を含む画像と、この画像を2値化することにより得られた2値化画像を所定の倍率に拡大する。ここで、所定の文字とは、例えば、画数が多いために潰れて見える文字(例えば、W、Mなど)や、文字輪郭線の特徴が乏しいために互いに区別するのが困難な文字(例えば、CとG、DとQと0など)などであり、予め記憶装置24に記憶されている。また、所定の倍率とは、後述する輪郭線抽出部27において微分フィルタにより画像に含まれる文字の輪郭線を抽出する際に、より効果が出るような倍率に設定される。従って、入力される画像の文字のサイズにより異なるが、概ね、入力された画像の1.5倍以上2.0倍以下に設定されることが好ましい。
輪郭線抽出部27は、画像入力部12により入力され、拡大部26で拡大された画像に対して、Sobel微分などの1次微分フィルタを用いて画像の空間1次微分を計算し、画像に含まれる文字の輪郭線を抽出する(輪郭線強調処理)。また、輪郭線強調処理がなされた画像に対して、非極大輪郭画素を抑制することで輪郭線を細線化する(輪郭線細線化処理)。このように、輪郭線強調処理及び輪郭線細線化処理をすることで輪郭線抽出画像を生成する。
論理積画像生成部28は、まず輪郭線抽出画像の輝度を反転させた反転画像を生成し、反転画像から2値化反転画像を生成し、この2値化反転画像と拡大2値化画像との論理積画像を生成する。
文字認識部25、拡大部26、輪郭線抽出部27、及び論理積画像生成部28は、いずれもCPU21が所定のROM22に格納された処理プログラムをRAM23に展開し、展開したプログラムを実行することによって実現される処理部であり、その処理については後述する。
以下、本実施形態における文字認識処理について図2を参照して説明する。図2は、本実施形態における文字認識処理の過程を示すフローチャートである。
図2に示すように、カメラ11で撮影されたナンバープレートの画像は認識処理部13に入力され、本実施形態における文字認識処理が開始される。すなわち、入力された画像を文字認識部25により2値化して2値化画像が生成され、ステップS100において、2値化画像に基づいて文字認識処理が行われる。すなわち、ステップS100では、文字認識部25が、2値化画像よって強調された文字線に基づいて、文字であると判断できる領域を抽出し(文字切り出し処理)、切り出された領域において、文字認識特徴量として文字の形状特徴(例えば、輪郭線の方向特徴や構造特徴など)を抽出し、マッチング処理、すなわち、認識対象の文字と予め備えられたパターンとの比較によりその類似度を判定して文字を認識する。
続いて次のステップS101では、ステップS100の認識結果に基づいて、類似度が1位、すなわち、類似度合いが最も高い文字が、上述した画数が多いために潰れて見える文字(例えば、W、Mなど)や、文字輪郭線の特徴が乏しいために互いに区別するのが困難な文字(例えば、CとG、DとQと0など)などの所定の文字に該当するか否かを判定する。この結果、所定の文字に該当すると判断された場合には次のステップS102に進み、ステップS102で、類似度が高い順に1位の文字と2位の文字とをさらに比較する。類似度が1位の文字の類似度と2位の文字が近い、すなわち、類似度が1位の文字の類似度と2位の文字の類似度とに予め設定された閾値以上の差がない場合には、ステップS103に進む。なお、ステップS101において、認識結果の文字が所定の文字に該当しないと判断された場合、及びステップS102において類似度が1位の文字と類似度が2の文字とに差があると判定された場合には、ステップS103以降の処理を行わずに本ルーチンを終了する。
ステップS103では、拡大部26が、入力された画像と、この画像を2値化して得られた2値化画像を所定の倍率に拡大して、拡大画像と拡大2値化画像を生成する。次のステップS104では、輪郭線抽出部27が、ステップS103で拡大された拡大画像に対して、Sobelフィルタ等の微分フィルタにより画像データの空間1次微分を計算し、画像データの中の文字の輪郭線を抽出する(輪郭線強調処理)。さらに、輪郭線抽出部27は、ステップS105で、ステップS104において輪郭線強調処理がなされた画像に対して、非極大輪郭画素を抑制することで輪郭線を細線化する(輪郭線細線化処理)。このように、輪郭線強調処理及び輪郭線細線化処理をすることで輪郭線抽出画像を生成する。
すなわち、輪郭線抽出部27が、ステップS104で輪郭線強調処理がなされた画像に対して、水平方向に勾配がある画素を抽出して輪郭線の方向を算出し(垂直エッジ画像生成)、輪郭線に垂直な方向で輪郭線輝度値がピーク値となる点(極大点)を探索し、これを真の輪郭線上の点として抽出する。また同様に、ステップS104で輪郭線強調処理がなされた画像データに対して、垂直方向に勾配がある画素を抽出して輪郭線の方向を算出し(水平エッジ画像生成)、輪郭線に垂直な方向で輪郭線輝度値がピーク値となる点(極大点)を探索し、これを真の輪郭線上の点として抽出する。
続いて、ステップS106では、論理積画像生成部28が、輪郭線抽出画像に対して輝度を反転させて反転画像を生成し、さらにこの反転画像を2値化することにより2値化反転画像を生成する。そして、この2値化反転画像と拡大2値化画像との論理積を算出して論理積画像を生成する。
ステップS107では、文字認識部25が、ステップS106で得られた論理積画像を2値化することにより2値化論理積画像を生成し、2値化画像よって強調された2値化論理積画像の文字線に基づいて、文字であると判断できる領域を抽出し(文字切り出し処理)、切り出された領域において、文字認識特徴量として文字の形状特徴(例えば、輪郭線の方向特徴や構造特徴など)を抽出し、マッチング処理、すなわち、認識対象の文字と予め備えられたパターンとの比較によりその類似度を判定して文字を認識する。そして、類似度が最も高いとされた文字を認識結果として認識結果出力部14へ出力し、本ルーチンを終了する。
このように、文字認識対象の画像を拡大して輪郭線をより強調し、より強調された輪郭線の明暗や輝度勾配に基づいて文字認識を行うので、入力された文字画像に潰れやボケが生じている場合であってもその輪郭線を鮮明に認識することができ、文字認識精度が向上する。
〔第2の実施形態〕
次に、本発明の第2の実施形態について、図3を用いて説明する。
本実施形態の文字認識処理が上述した第1の実施形態と異なる点は、図3に示すように、論理積画像生成部を設けない点にある。すなわち、本実施形態の文字認識装置は、論理積画像を生成せずに、輪郭線抽出画像から2値化輪郭線抽出画像を生成し、この2値化輪郭線抽出画像に基づいて文字を認識する。以下、本実施形態の文字認識処理について、第1の実施形態と共通する点については説明を省略し、異なる点について説明する。
本実施形態の文字認識装置30の認識処理部は、図3に示すように、文字認識手段としての文字認識部25、拡大手段としての拡大部26、及び輪郭線抽出手段としての輪郭線抽出部27を備えている。
文字認識部25は、画像入力部12により入力された画像から2値化画像を生成し、2値化画像に基づいて、この画像に含まれる文字を認識するとともに、輪郭線抽出部27により生成された輪郭線抽出画像から2値化輪郭線抽出画像を生成し、この2値化輪郭線抽出画像から所定の文字認識特徴量を抽出してマッチング処理を行うことにより文字を認識する。
以下、本実施形態における文字認識処理について図4を参照して説明する。図4は、本実施形態における文字認識処理の過程を示すフローチャートである。
図4に示すように、カメラ11で撮影されたナンバープレートの画像は認識処理部13に入力され、本実施形態における文字認識処理が開始される。すなわち、入力された画像を文字認識部25により2値化して2値化画像が生成され、ステップS200において、2値化画像に基づいて文字認識処理が行われる。すなわち、ステップS200では、文字認識部25が、2値化画像よって強調された文字線に基づいて、文字であると判断できる領域を抽出し(文字切り出し処理)、切り出された領域において、文字認識特徴量として文字の形状特徴(例えば、輪郭線の方向特徴や構造特徴など)を抽出し、マッチング処理、すなわち、認識対象の文字と予め備えられたパターンとの比較によりその類似度を判定して文字を認識する。
続いて次のステップS201では、ステップS200の認識結果に基づいて、類似度が1位、すなわち、類似度合いが最も高い文字が、上述した画数が多いために潰れて見える文字(例えば、W、Mなど)や、文字輪郭線の特徴が乏しいために互いに区別するのが困難な文字(例えば、CとG、DとQと0など)などの所定の文字に該当するか否かを判定する。この結果、所定の文字に該当すると判断された場合には次のステップS202に進み、ステップS202で、類似度が高い順に1位の文字と2位の文字とをさらに比較する。類似度が1位の文字の類似度と2位の文字が近い、すなわち、類似度が1位の文字の類似度と2位の文字の類似度とに予め設定された閾値以上の差がない場合には、ステップS203に進む。なお、ステップS201において、認識結果の文字が所定の文字に該当しないと判断された場合、及びステップS202において類似度が1位の文字と類似度が2の文字とに差があると判定された場合には、ステップS203以降の処理を行わずに本ルーチンを終了する。
ステップS203では、拡大部26が、入力された画像と、この画像を2値化して得られた2値化画像を所定の倍率に拡大して、拡大画像と拡大2値化画像を生成する。次のステップS204では、輪郭線抽出部27が、ステップS203で拡大された拡大画像に対して、Sobelフィルタ等の微分フィルタにより画像データの空間1次微分を計算し、画像データの中の文字の輪郭線を抽出する(輪郭線強調処理)。さらに、輪郭線抽出部27は、ステップS205で、ステップS204において輪郭線強調処理がなされた画像に対して、非極大輪郭画素を抑制することで輪郭線を細線化する(輪郭線細線化処理)。このように、輪郭線強調処理及び輪郭線細線化処理をすることで輪郭線抽出画像を生成する。
すなわち、輪郭線抽出部27が、ステップS204で輪郭線強調処理がなされた画像に対して、水平方向に勾配がある画素を抽出して輪郭線の方向を算出し(垂直エッジ画像生成)、輪郭線に垂直な方向で輪郭線輝度値がピーク値となる点(極大点)を探索し、これを真の輪郭線上の点として抽出する。また同様に、ステップS204で輪郭線強調処理がなされた画像データに対して、垂直方向に勾配がある画素を抽出して輪郭線の方向を算出し(水平エッジ画像生成)、輪郭線に垂直な方向で輪郭線輝度値がピーク値となる点(極大点)を探索し、これを真の輪郭線上の点として抽出する。
続いて、ステップS206では、文字認識部25が輪郭線抽出画像を2値化することにより2値化輪郭線抽出画像を生成する。
ステップS207では、文字認識部25が、ステップS206で得られた2値化輪郭線抽出画像の文字線に基づいて、文字であると判断できる領域を抽出し(文字切り出し処理)、切り出された領域において、文字認識特徴量として文字の形状特徴(例えば、輪郭線の方向特徴や構造特徴など)を抽出し、マッチング処理、すなわち、認識対象の文字と予め備えられたパターンとの比較によりその類似度を判定して文字を認識する。そして、類似度が最も高いとあされた文字を認識結果として認識結果出力部14へ出力し、本ルーチンを終了する。
このように、文字認識対象の画像を拡大して輪郭線をより強調し、より強調された輪郭線の明暗や輝度勾配に基づいて文字認識を行うので、入力された文字画像に潰れやボケが生じている場合であってもその輪郭線を鮮明に認識することができ、文字認識精度が向上する。
なお、上述した第1の実施形態及び第2の実施形態の文字認識装置において、輪郭線抽出部27による輪郭線抽出画像の生成に先立って、拡大画像に対してアンシャープマスキング処理などの先鋭化処理を行う先鋭化処理手段(図示せず)を設けることもできる。先鋭化処理手段により拡大画像に先鋭化処理を行うことで、輪郭線抽出画像を生成した際に、輪郭線をさらに強調することができ、認識対象の文字の潰れやボケがより強い場合であっても、先鋭化によりさらに強調された輪郭線の明暗や輝度勾配に基づいて文字認識を行うので、入力された文字画像に潰れやボケが生じている場合であってもその輪郭線を鮮明に認識することができ、文字認識精度が向上する。
また、文字の潰れやボケが生じることにより誤認識を招来させる可能性のある領域は、その文字によってある程度定められる。例えば、CとGとで潰れやボケが生じるのは文字の右下部分であり、WとMとでは文字の中心部分となる。このため、予めこれらの所定の文字において潰れやボケが生じやすい領域に関する情報を潰れ情報として記憶手段24等に記憶しておき、この潰れ情報に基づいて潰れやボケの生じる領域を選択する領域選択手段(図示せず)を設けることが出来る。
図5は、第1の実施形態にかかる文字認識装置の変形例であって、領域選択手段を設けた文字認識装置にかかる文字認識処理の過程を示すフローチャートである。論理積画像の生成までの処理は、上述した図2のフローチャートにおけるステップS100からステップS106の処理と同様であるので説明を省略する。
図5に示すように、文字認識装置は、論理積画像を生成した後に、ステップS300で、図示しない領域選択手段により、潰れ情報に基づいて、認識対象の文字の潰れやボケが生じやすい領域を選択する。次のステップS301では、文字認識部25が、ステップS300で選択された領域内においてのみ、文字認識の基礎となる文字認識特徴量を抽出する。ステップS302では、文字認識部25が、先に抽出された文字認識特徴量に基づいて、選択された領域にのみ2値化やマッチング処理等の上記した文字認識処理を実行すればよい。第2の実施形態の文字認識装置においては、文字認識処理による輪郭線抽出画像の2値化に先立って、輪郭線抽出画像から所定の領域を選択し、選択された領域について上記したステップS301及びステップS302の文字認識処理を実行すればよい。
このようにすることで、文字認識処理にかかる演算量が減少するため、文字認識処理に要する時間を短縮することが出来るとともに、潰れやボケとは無関係な領域に関する文字認識特徴量の影響を受けることなく、文字認識処理が可能となるので、文字認識精度がより向上する。
上記した、先鋭化手段及び領域選択手段もCPU21が所定のROM22に格納された処理プログラムをRAM23に展開し、展開したプログラムを実行することによって実現される処理部として機能する。
さらに、図6に示すように、文字認識手段は、論理積画像の生成後又は輪郭線抽出画像の生成後に、これらの画像から抽出する前記文字認識特徴量を異ならせ、異なる前記文字認識特徴量に基づいて複数回マッチング処理を行うことにより複数回文字を認識し、複数回の認識結果から最も認識頻度の高い文字を、最終的な認識結果として出力することもできる。
図6は、第1の実施形態にかかる文字認識装置の変形例にかかる文字認識処理の過程を示すフローチャートである。論理積画像の生成までの処理は、上述した図2のフローチャートにおけるステップS100からステップS106の処理と同様であるので説明を省略する。
図6に示すように、文字認識装置は、論理積画像を生成した後に、ステップS401、S501、S601で夫々、認識対象の文字から異なる文字認識特徴量を抽出する。すなわち、ステップS401では、輪郭線方向頻度を、ステップS501では、構造特徴を、ステップS601では、その他の文字認識特徴量を夫々抽出する。次のステップS402、S502、S602では、夫々の文字認識特徴量に基づいてマッチング処理を行うことにより文字を認識する。これらの処理は、平行して行ってもよく、順次行ってもよい。そして、ステップS403で、先のステップにおける認識結果に基づいて、最も類似度が高い文字、すなわち、最も認識頻度の高い文字を認識結果として、認識結果出力部14へ出力し本ルーチンを終了する。第2の実施形態の文字認識装置においては、文字認識処理による輪郭線抽出画像から異なる文字認識特徴量を抽出し、抽出された文字認識特徴量に基づいて夫々文字認識処理を実行すればよい。
このように、文字認識特徴量を異ならせて複数回の文字認識処理を実行して、複数回の文字認識処理の結果に基づいて最終的な文字認識結果を出力するので、文字認識の信頼度が高まり、文字認識精度がより向上する。
10 文字認識装置
11 カメラ
12 画像入力部
13 認識処理部
14 認識結果出力部
25 文字認識部
26 拡大部
27 輪郭線抽出部
28 論理積画像生成部
30 文字認識装置

Claims (7)

  1. 車両のナンバープレートの文字列を撮像した画像から2値化画像を生成し、該2値化画像に基づいて文字を認識する文字認識手段と、
    前記2値化画像に基づいて認識することが困難であるとして予め定めた複数の文字を記憶した記憶手段と、
    前記2値化画像に基づいて認識された文字のうち、類似度が1位と認識された文字が前記記憶手段に記憶された文字であると判断された場合であって、前記2値化画像に基づいて認識された文字のうち、類似度が1位の文字の類似度と2位の文字の類似度とに予め設定された閾値以上の差がない場合に、前記画像及び前記2値化画像を所定の倍率に拡大して拡大画像及び拡大2値化画像を生成する拡大手段と、
    前記拡大画像から微分フィルタを用いて前記文字列の輪郭線を抽出した輪郭線抽出画像を生成する輪郭線抽出手段と、
    前記輪郭線抽出画像の輝度を反転させた反転画像を生成し、該反転画像から2値化反転画像を生成し、該2値化反転画像と前記拡大2値化画像との論理積画像を生成する論理積画像生成手段と、を備え、
    前記文字認識手段が、前記論理積画像から2値化論理積画像を生成し、該2値化論理積画像から所定の文字認識特徴量を抽出してマッチング処理を行うことにより文字を認識する文字認識装置。
  2. 車両のナンバープレートの文字列を撮像した画像から2値化画像を生成し、該2値化画像に基づいて文字を認識する文字認識手段と、
    前記2値化画像に基づいて認識することが困難であるとして予め定めた複数の文字を記憶した記憶手段と、
    前記2値化画像に基づいて認識された文字のうち、類似度が1位と認識された文字が前記記憶手段に記憶された文字であると判断された場合であって、前記2値化画像に基づいて認識された文字のうち、類似度が1位の文字の類似度と2位の文字の類似度とに予め設定された閾値以上の差がない場合に、前記画像を所定の倍率に拡大して拡大画像を生成する拡大手段と、
    前記拡大画像から微分フィルタを用いて前記文字列の輪郭線を抽出した輪郭線抽出画像を生成する輪郭線抽出手段と、を備え、
    前記文字認識手段が、前記輪郭線抽出画像から2値化輪郭線抽出画像を生成し、該2値化輪郭線抽出画像から所定の文字認識特徴量を抽出してマッチング処理を行うことにより文字を認識する文字認識装置。
  3. 前記拡大画像に対して先鋭化処理を行う先鋭化手段を備え、
    前記輪郭線抽出手段は、前記先鋭化手段により先鋭化された拡大画像から微分フィルタを用いて前記文字列の輪郭線を抽出した輪郭線抽出画像を生成することを特徴とする請求項1又は請求項2に記載の文字認識装置。
  4. 前記文字認識手段は、抽出する前記文字認識特徴量を異ならせ、異なる前記文字認識特徴量に基づいて複数回マッチング処理を行うことにより複数回文字を認識し、複数回の認識結果から最も認識頻度の高い文字を、最終的な認識結果として出力することを特徴とする請求項1乃至請求項3の何れか1項に記載の文字認識装置。
  5. 前記2値化論理積画像又は前記2値化輪郭線抽出画像から所定領域を選択する領域選択手段を備え、
    前記文字認識手段は、該所定領域に対してマッチング処理を行うことにより文字を認識することを特徴とする請求項1乃至請求項4の何れか1項に記載の文字認識装置。
  6. 車両のナンバープレートの文字列を撮像した画像から2値化画像を生成し、該2値化画像に基づいて文字を認識する文字認識方法であって、
    前記2値化画像に基づいて認識された文字のうち、類似度が1位と認識された文字が前記2値化画像に基づいて認識することが困難であるとして予め定めた複数の文字の何れかであると判断された場合であって、前記2値化画像に基づいて認識された文字のうち、類似度が1位の文字の類似度と2位の文字の類似度とに予め設定された閾値以上の差がない場合に、前記画像及び前記2値化画像を所定の倍率に拡大して拡大画像及び拡大2値化画像を生成するステップと、
    前記拡大画像から微分フィルタを用いて前記文字列の輪郭線を抽出した輪郭線抽出画像を生成するステップと、
    前記輪郭線抽出画像の輝度を反転させた反転画像を生成し、該反転画像から2値化反転画像を生成し、該2値化反転画像と前記拡大2値化画像との論理積画像を生成するステップと、
    前記論理積画像から2値化論理積画像を生成し、該2値化論理積画像から所定の文字認識特徴量を抽出してマッチング処理を行うことにより文字を認識するステップと、
    を備えたことを特徴とする文字認識方法。
  7. 車両のナンバープレートの文字列を撮像した画像から2値化画像を生成し、該2値化画像に基づいて文字を認識する文字認識方法であって、
    前記2値化画像に基づいて認識された文字のうち、類似度が1位と認識された文字が前記2値化画像に基づいて認識することが困難であるとして予め定めた複数の文字の何れかであると判断された場合であって、前記2値化画像に基づいて認識された文字のうち、類似度が1位の文字の類似度と2位の文字の類似度とに予め設定された閾値以上の差がない場合に、前記画像を所定の倍率に拡大して拡大画像を生成するステップと、
    前記拡大画像から微分フィルタを用いて前記文字列の輪郭線を抽出した輪郭線抽出画像を生成するステップと、
    前記輪郭線抽出画像から2値化輪郭線抽出画像を生成し、該2値化輪郭線抽出画像から所定の文字認識特徴量を抽出してマッチング処理を行うことにより文字を認識するステップと、
    を備えたことを特徴とする文字認識方法。
JP2009038389A 2009-02-20 2009-02-20 文字認識装置及び文字認識方法 Active JP5419491B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2009038389A JP5419491B2 (ja) 2009-02-20 2009-02-20 文字認識装置及び文字認識方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009038389A JP5419491B2 (ja) 2009-02-20 2009-02-20 文字認識装置及び文字認識方法

Publications (2)

Publication Number Publication Date
JP2010191909A JP2010191909A (ja) 2010-09-02
JP5419491B2 true JP5419491B2 (ja) 2014-02-19

Family

ID=42817855

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009038389A Active JP5419491B2 (ja) 2009-02-20 2009-02-20 文字認識装置及び文字認識方法

Country Status (1)

Country Link
JP (1) JP5419491B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109766890B (zh) 2013-06-03 2020-11-06 支付宝(中国)网络技术有限公司 信息识别方法、设备和系统

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0358759U (ja) * 1989-10-06 1991-06-07
US5351314A (en) * 1991-10-04 1994-09-27 Canon Information Systems, Inc. Method and apparatus for image enhancement using intensity dependent spread filtering
JP3599413B2 (ja) * 1995-04-14 2004-12-08 株式会社ルネサステクノロジ 解像度変換装置および解像度変換方法
JPH08305795A (ja) * 1995-04-28 1996-11-22 Nippon Steel Corp 文字認識方法
JPH1115919A (ja) * 1997-06-25 1999-01-22 Toshiba Corp 文字認識装置、文字認識方法及び文字を認識するためのプログラムを記録した媒体
JP3815934B2 (ja) * 1999-12-24 2006-08-30 富士通株式会社 手書き文字認識装置および方法
JP2003281470A (ja) * 2002-03-26 2003-10-03 Toshiba Corp 文字認識装置及び文字認識方法
JP2004078366A (ja) * 2002-08-12 2004-03-11 Ricoh Co Ltd 文字認識装置、文字認識方法、およびその方法をコンピュータに実行させるプログラム
JP2007299144A (ja) * 2006-04-28 2007-11-15 Mitsubishi Heavy Ind Ltd ロゴ判別装置および方法ならびにプログラム

Also Published As

Publication number Publication date
JP2010191909A (ja) 2010-09-02

Similar Documents

Publication Publication Date Title
CN110414507B (zh) 车牌识别方法、装置、计算机设备和存储介质
US11282185B2 (en) Information processing device, information processing method, and storage medium
CN110008809B (zh) 表格数据的获取方法、装置和服务器
JP4926116B2 (ja) 画像検査装置
JP5775225B2 (ja) マルチレイヤ連結成分をヒストグラムと共に用いるテキスト検出
US9275030B1 (en) Horizontal and vertical line detection and removal for document images
CN114529459B (zh) 一种对图像边缘进行增强处理的方法和系统及介质
JP7026165B2 (ja) テキスト認識方法及びテキスト認識装置、電子設備、記憶媒体
JP4518139B2 (ja) 画像処理装置
CN105469027A (zh) 针对文档图像的水平和垂直线检测和移除
JP2011139366A (ja) 画像処理装置、画像処理方法、及びプログラム
JP2010218420A (ja) 文字認識装置、画像読取装置、およびプログラム
CN112801232A (zh) 一种应用于处方录入的扫描识别方法及系统
JP2008251029A (ja) 文字認識装置、ナンバープレート認識システム
EP3955207A1 (en) Object detection device
CN114863431A (zh) 一种文本检测方法、装置及设备
JP5010627B2 (ja) 文字認識装置及び文字認識方法
CN112926695A (zh) 基于模板匹配的图像识别方法和系统
CN110826360A (zh) Ocr图像预处理与文字识别
JP5419491B2 (ja) 文字認識装置及び文字認識方法
CN117132503A (zh) 一种图像局部高亮区域修复方法、系统、设备及存储介质
JP2016053763A (ja) 画像処理装置、画像処理方法及びプログラム
CN112418220A (zh) 一种单字检测方法、装置、设备及介质
CN111612005A (zh) 文字检测方法及装置
JP5385372B2 (ja) 文字認識装置及び文字認識方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20110914

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20120531

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120612

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120810

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130205

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130405

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20130514

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130814

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20130930

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20131022

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20131119

R151 Written notification of patent or utility model registration

Ref document number: 5419491

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350