JP5010627B2 - 文字認識装置及び文字認識方法 - Google Patents

文字認識装置及び文字認識方法 Download PDF

Info

Publication number
JP5010627B2
JP5010627B2 JP2009036455A JP2009036455A JP5010627B2 JP 5010627 B2 JP5010627 B2 JP 5010627B2 JP 2009036455 A JP2009036455 A JP 2009036455A JP 2009036455 A JP2009036455 A JP 2009036455A JP 5010627 B2 JP5010627 B2 JP 5010627B2
Authority
JP
Japan
Prior art keywords
pixel
character
sign
character recognition
image data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2009036455A
Other languages
English (en)
Other versions
JP2010191767A (ja
Inventor
喜一 杉本
健太 中尾
真由美 斎藤
拓馬 岡▲崎▼
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Heavy Industries Ltd
Original Assignee
Mitsubishi Heavy Industries Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Heavy Industries Ltd filed Critical Mitsubishi Heavy Industries Ltd
Priority to JP2009036455A priority Critical patent/JP5010627B2/ja
Publication of JP2010191767A publication Critical patent/JP2010191767A/ja
Application granted granted Critical
Publication of JP5010627B2 publication Critical patent/JP5010627B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Character Input (AREA)

Description

本発明は、例えば、車両番号等の文字列を認識する文字認識装置に係り、特に、隣り合う文字の間隔が狭い場合などにも高精度に文字の切り出しを行うことができる文字認識装置に関するものである。
従来、車両のナンバープレートに記載された車両番号などの記載内容を自動認識する装置が知られている。
ナンバープレートの記載内容を認識するには、画像処理技術を用いた文字認識手法が用いられている。このような文字認識手法は、一般には、対象の文字画像を入力した後、文字と背景を分離するために文字線を強調し(2値化)、文字であると判断できる領域を抽出する(文字切り出し処理)。文字切り出しされた領域において、文字の形状特徴(例えば輪郭線の方向特徴など)を抽出し、パターン認識により文字を認識する。
ところで、ナンバープレートは、その形状、大きさ、記載される文字列等が各国毎に相違し、例えば、文字と文字とが近接し文字同士が連結して見えたり、ナンバープレートを車両に取り付けているボルトなどの周辺構造物と文字とが近接して文字と周辺構造物とが連結して見えるようなナンバープレートも散見される。このような場合には、従来の文字認識装置では、正しい文字の切り出し処理を行うことができず、正しい認識結果が得られないこととなる。
そこで、特許文献1には、2値化された画像データの輪郭プロファイルを利用して、記載される文字列が日英混在する文書である際にも認識精度を維持する技術が開示されている。
特開2001−22885号公報
しかしながら、特許文献1に記載された技術では、認識対象の文字列の垂直方向に文字や周辺構造物が近接して、文字同士又は文字と周辺構造物とが連結して見える場合には、連結箇所を特定するのが難しく、文字の連結箇所を正しく分離できないために文字認識の精度が低下するという問題があった。
本発明は、上記問題を解決するためになされたもので、水平方向及び垂直方向のいずれにおいても文字の連結点を特定して正しく分離し、文字認識精度を向上させた文字認識装置を提供することを目的とする。
上記課題を解決するために、本発明は以下の手段を採用する。
本発明は、文字列を撮像した画像データの該文字列を分割して該文字列に含まれる文字を個々に認識する文字認識装置であって、前記画像データから微分フィルタを用いて前記文字列の輪郭線を抽出する輪郭線抽出手段と、前記抽出された輪郭線のうち垂直輪郭線及び水平輪郭線を構成する各画素について、前記微分フィルタによる微分値の符号を算出する符号算出手段と、前記符号が算出された画素から1つの画素を注目画素として選択し、該注目画素を含む第1の領域を前記画像データから順次抽出し、前記第1の領域に含まれる画素について、前記符号算出手段により算出された符号に基づいて、前記注目画素の符号と異符号を示す画素があるか否かを判定し、前記画像データから抽出された第1の領域のうち異符号を示す画素があると判定された第1の領域の数を算出する符号変化算出手段と、異符号を示す画素があると判定された前記第1の領域を、前記注目画素が+符号を示す領域と注目画素が−符号を示す領域とに分別し、分別した結果、より数の少ない領域を前記文字列の分割点とする分割点決定手段と、を備えたことを特徴とする文字認識装置を提供する。
本発明によれば、画像データから微分フィルタを用いて前記文字列の輪郭線を抽出し、この輪郭線のうち垂直輪郭線及び水平輪郭線を構成する各画素について、前記微分フィルタによる微分値の符号を算出するので、垂直輪郭線及び水平輪郭線の双方について輝度勾配を把握することができる。そして、符号が算出された画素から1つの画素を注目画素として選択し、該注目画素を含む第1の領域を画像データから順次抽出する。すなわち、画像データの最上段から順に、符号が算出された画素のうち1つの画素を注目画素として選択し、注目画素を基準とする第1の領域を抽出する。ここで、第1の領域は、認識対象の文字の大きさ、太さ等に基づいて定められ、認識対象の文字が、例えば、車両のナンバープレートに記載される文字であった場合には4〜5画素程度の領域に定めることが好ましい。そして、この第1の領域に含まれる画素について、先に算出された符号に基づいて、注目画素の符号と異符号を示す画素があるか否かを判定し、前記画像データから抽出された第1の領域のうち異符号を示す画素があると判定された第1の領域の数を算出する。この処理を画像データ全体から順次抽出された第1の領域全てに対して行う。このようにすることで、第1の領域内において、注目画素に対する符号の変化を把握することができ、この算出結果に基づいて前記第1の領域の明暗を判定することができる。明暗の判定に際しては、符号を示す画素があると判定された前記第1の領域を、前記注目画素がプラスの領域と注目画素がマイナスの領域とに分別し、分別した結果、より数の少ない領域を前記文字列の分割点とする。すなわち、注目画素が+符号であるのに対し領域内に画素に−符号の画素がある領域と、注目画素が−符号であるのに対し領域内に+符号の画素がある領域との数を比較し、より多い領域が文字線を捉えた領域であり、少ない領域が背景を捉えた領域として文字列の分割点となる。
このように、輪郭線の垂直方向及び水平方向の双方の勾配に基づいて文字認識対象画素の明暗を判定するので、文字同士の連結箇所や文字とナンバープレートを固定するボルトなどの周辺構造物との連結箇所を正しく特定でき、連結部分を正しく分割できる。これにより、文字認識精度が向上する。
上記文字認識装置は、前記分割点の位置を予め推定し、前記画像データから前記推定された分割点の位置を含む第2の領域を定める領域選定手段を備え、前記分割点決定手段は、前記第2の領域において文字列の分割点を決定することとしてもよい。
分割点の位置を予め推定し、画像データから推定された分割点の位置を含む第2の領域を定めるので、選定された領域内でのみ文字認識処理を実行すればよく、文字認識処理に要する時間を短縮することができるとともに、分割点の誤検出を抑制することができる。
上記文字認識装置は、前記分割点を水平軸方向に投影した投票空間に投票することにより、射影投票された周辺分布からなる得票分布を生成する投票手段を備え、前記分割点決定手段は、前記得票分布から、水平方向の得票値が所定閾値以上となる場合に、該水平方向の得票値に対する垂直方向の得票値を真の分割点としてもよい。
分割点を水平軸方向に投影した投票空間に投票することにより、射影投票された周辺分布からなる得票分布を生成し、得票分布から、水平方向の得票値が所定閾値以上となる場合に、水平方向の得票値に対する垂直方向の得票値を真の分割点とするので、文字列を含む画像データにおいて、文字同士や文字と周辺構造物がぴったり接している場合などの連結箇所が多い場合にも分割漏れが発生してしまうことを防止でき、文字認識精度が向上する。
上記文字認識装置は、前記文字の大きさにかかる文字情報を予め記憶した記憶手段を備え、前記分割点決定手段は、前記文字情報と前記分割点とを比較して前記文字情報で示される文字の大きさに最も近い分割点を真の分割点としてもよい。
記憶手段に予め文字の大きさにかかる文字情報を記憶し、文字情報と分割点とを比較して文字情報で示される文字の大きさに最も近い分割点を真の分割点とするので、文字の輪郭線の輝度勾配にかかる情報及び文字の大きさにかかる情報に基づいて分割点を決定するので、文字認識精度が向上する。
本発明は、文字列を撮像した画像データの該文字列を分割し、該文字列に含まれる文字を個々に認識する文字認識方法であって、前記画像データから微分フィルタを用いて前記文字列の輪郭線を抽出するステップと、前記抽出された輪郭線のうち垂直輪郭線及び水平輪郭線を構成する各画素について、前記微分フィルタによる微分値の符号を算出するステップと、前記符号が算出された画素から1つの画素を注目画素として選択し、該注目画素を含む第1の領域を前記画像データから順次抽出し、前記第1の領域に含まれる画素について、前記符号算出手段により算出された符号に基づいて、前記注目画素の符号と異符号を示す画素があるか否かを判定し、前記画像データから抽出された第1の領域のうち異符号を示す画素があると判定された第1の領域の数を算出するステップと、異符号を示す画素があると判定された前記第1の領域を、前記注目画素が+符号を示す領域と注目画素が−符号を示す領域とに分別し、分別した結果、より数の少ない領域を前記文字列の分割点とするステップと、を備えたことを特徴とする文字認識方法を提供する。
このように、本発明によれば、水平方向及び垂直方向のいずれにおいても文字の連結点を正しく特定できるので、この連結点を正しく分離し、文字認識精度を向上させることができる。
本発明の第1の実施形態にかかる文字認識装置の概略構成を示すブロック図である。 本発明の第1の実施形態にかかる文字認識装置における文字認識処理の過程を示すフローチャートである。 文字認識処理の過程を示した説明図であり、(a)は、撮影された文字列、(b)は輪郭線強調処理がなされた文字列、(c)は、文字列の垂直エッジ画像、(d)は、文字列の水平エッジ画像を夫々示す。 図3(c)のA部分の拡大図であり、本発明の文字認識処理において、符号を算出する場合の説明図である。 本発明の第2の実施形態にかかる文字認識処理の過程を示すフローチャートである。 本発明の第3の実施形態にかかる文字認識処理の過程を示すフローチャートである。
以下に、本発明に係る文字認識装置の実施形態について、図面を参照して説明する。
〔第1の実施形態〕
図1は、本発明の第1の実施形態に係る文字認識装置の概略構成を示したブロック図である。
本発明における文字認識装置10は、車両のナンバープレートを撮影して画像データを得るカメラ11と、カメラ11で撮影した画像データの入力を受ける画像入力部12と、画像入力部12に入力された画像データに基づいて文字認識処理を実行する認識処理部13と、認識処理部13での認識結果を出力する認識結果出力部14を備えている。
認識処理部13は、文字認識処理を実行するための演算を行うものであり、文字認識処理に関する各種演算処理を実行するCPU(中央演算処理装置)21、文字認識処理にかかるプログラム等を記憶する読み出し専用のメモリであるROM(Read Only Memory)22、CPU21の作業領域として機能する読み書き自在のメモリであるRAM(Random Access Memory)23、及び文字認識処理にかかるプログラムに基づく文字認識処理を実行するに際して必要となる種々のデータが格納された記憶装置24を備えている。
また、認識処理部13は、輪郭線抽出手段として輪郭線抽出部25、符号算出手段としての符号算出部26、符号変化算出手段としての符号変化算出部27、及び分割点を決定する分割点決定手段としての分割点決定部28を備えている。
輪郭線抽出部25は、画像入力部12により入力された画像データに対して、Sobel微分などの1次微分フィルタを用いて画像データの空間1次微分を計算し、画像データの中の文字の輪郭線を抽出する(輪郭線強調処理)。また、輪郭線強調処理がなされた画像データに対して、非極大輪郭画素を抑制することで輪郭線を細線化する(輪郭線細線化処理)。符号算出部26は、輪郭線抽出処理及び輪郭線細線化処理がなされた画像データが入力され、処理後の画像データに対し、垂直輪郭線及び水平輪郭線を構成する画素、すなわち、左右方向または上下方向に勾配がある画素について輪郭線の微分値の符号(+または−)を求める。符号変化算出部27は、符号算出部26により算出された符号に基づいて、画像データから文字の太さに相当する第一の領域としての局所領域を抽出し、この局所領域における画素の微分値の符号の変化を算出する。分割点決定部28は、符号変化算出部27により算出された符号の変化に基づいて、ナンバープレートの背景色に対して文字の明暗を判定し、文字の明暗と反対の符号変化をしている局所領域の中心を求め、この中心を分割点として算出する。輪郭線抽出部25、符号算出部26、符号変化算出部27、及び分割点決定部28は、いずれもCPU21が所定のROM22に格納された処理プログラムをRAM23に展開し、展開したプログラムを実行することによって実現される処理部であり、その処理については後述する。
以下、本実施形態における文字認識処理について図2、図3を参照して説明する。図2は、本実施形態における文字認識処理の過程を示すフローチャートである。
図2に示すように、カメラ11で撮影されたナンバープレートの画像は、図3(a)に示す画像データとして画像入力部12に入力され、認識処理部13は、ステップS101及びステップS102で所定の処理を行う。すなわち、ステップS101では、輪郭線抽出部25が、入力された画像データに対して、Sobelフィルタ等の微分フィルタにより画像データの空間1次微分を計算し、図3(b)に示すように、画像データの中の文字の輪郭線を抽出する(輪郭線強調処理)。また、ステップS102では、ステップS101において輪郭線強調処理がなされた画像データに対して、輪郭線抽出部25が、非極大輪郭画素を抑制することで輪郭線を細線化する(輪郭線細線化処理)。
すなわち、図3(c)に示すように、ステップS101で輪郭線強調処理がなされた画像データに対して、水平方向に勾配がある画素を抽出して輪郭線の方向を算出し(垂直エッジ画像生成)、輪郭線に垂直な方向で輪郭線輝度値がピーク値となる点(極大点)を探索し、これを真の輪郭線上の点として抽出する。また同様に、図3(d)に示すように、ステップS101で輪郭線強調処理がなされた画像データに対して、垂直方向に勾配がある画素を抽出して輪郭線の方向を算出し(水平エッジ画像生成)、輪郭線に垂直な方向で輪郭線輝度値がピーク値となる点(極大点)を探索し、これを真の輪郭線上の点として抽出する。
続いて、ステップS103では、輪郭線強調処理及び輪郭線細線化処理がなされた画像データに対して、認識処理部13の符号算出部26が、水平方向または垂直方向に勾配がある画素について輪郭線の微分値の符号を求める。より具体的には、符号算出部26は、輪郭線強調処理及び輪郭線細線化処理がなされた画像データのうち、抽出された輪郭線の各画素について輪郭線の勾配方向に注目し、水平方向に勾配がある画素、すなわち、垂直輪郭線について微分フィルタの垂直輪郭線の微分値の符号を算出する。同様に、垂直方向に勾配がある画素、すなわち、水平輪郭線について微分フィルタの水平輪郭線の微分値の符号を算出する。ここで図4は、図3(c)のA部分の拡大図であり、符号を算出する場合の例を示している。
ステップS104では、符号変化算出部27が、ステップS103で算出した各画素における微分値の符号に基づいて、注目画素を中心として文字の太さに相当する局所領域を抽出し、この局所領域に含まれる画素の符号を注目画素の符号と比較して変化しているか否かを算出する。具体的には、まず、ステップS103で微分値の符号が算出された画像データに対して、左上方の画素から右方向に1行づつ順次スキャンして微分値が算出されている画素を抽出する。そして、スキャンした1行に含まれる画素のうち、微分値が算出されている画素を注目画素として、この注目画素から右方向に文字太さ相当の画素からなる所定の局所領域を抽出する。続いて、この局所領域の中で注目画素と反対の符号の画素があるかを検索して、注目画素と反対の符号を示す画素がある場合には、注目画素に対して符号が変化している画素がある領域として、その画素の座標と符号変化の方向の情報(注目画素+符号に対して−符号、又は注目画素−符号に対して+符号)とを記憶する。この処理をスキャンされた1行に亘って行い、この1行に対する処理が終了したら、次の行の処理を開始する。上記処理を1行毎に順次行うことで、画像データ全体に対して処理が終わるまで繰り返す。
そして、算出された符号の変化から、注目画素に対して符号が変化している画素がある領域数を、符号変化の方向の情報毎に算出する。すなわち、注目画素が+符号であった場合の−符号へ変化している画素がある領域と、注目画素が−符号であった場合の+符号へ変化している画素がある領域の数をそれぞれ算出する。
なお、ここで、文字太さ相当とは、4〜5画素程度に相当する領域であることが多く、局所領域の範囲は、認識対象のナンバープレートに記載される文字の大きさ、太さ等を考慮して定められたデータとして予め記憶装置24に記憶しておく。また、水平方向の分割点を算出する場合には、水平方向で局所領域を定めて符号の変化を算出し、垂直方向の分割点を算出する場合には垂直方向で局所領域を定めて符号の変化を算出する。
ステップS105では、分割点決定部28が、ステップS103での算出結果から局所領域の背景に対する明暗、すなわち、局所領域が文字線部分にかかる領域であるか、背景部分にかかる領域であるかを判定する。具体的には、注目画素+符号に対して−符号へ変化している画素がある領域数と、注目画素−に対して+へ変化している画素がある領域数とを比較してのより多い方の局所領域について文字線部を捉えた局所領域と判定する。例えば、注目画素+符号に対して−符号へ変化している画素がある領域数よりも、注目画素−符号に対して+符号へ変化している画素がある領域数が多い場合には、注目画素−符号に対して+符号へ変化している画素がある領域を文字線部分とし、注目画素+符号に対して−符号へ変化している画素がある領域を背景部分と判定する。
そして、次のステップS106において、分割点決定部28により、局所領域内で分割点を決定する。具体的には、分割点決定部28は、ステップS105で判定された文字線部分にかかる局所領域と背景部分にかかる局所領域との判定結果、及び、ステップS104で算出した局所領域内の注目画素に対して符号が変化している画素の座標と符号変化の方向の情報とに基づいて、背景部分と判定された局所領域を全て抽出する。そして、抽出された局所領域の中心画素を分割点と決定する。
分割点が決定されると、ナンバープレートに記載された文字が分離され、分離された1文字領域に対して、2値化、ラベリング等の処理により切り出した個々の文字画像に対して文字認識処理がなされる。全ての文字領域について所定の文字認識処理が終了すると、認識結果が認識結果出力部14へ出力され、文字認識処理が終了する。
このように、本実施形態によれば、輪郭線の垂直方向及び水平方向の双方の輝度勾配に基づいて文字認識対象画素の明暗を判定するので、文字同士の連結箇所や文字とナンバープレートを固定するボルトなどの周辺構造物との連結箇所を正しく特定でき、連結部分を正しく分割できる。これにより、文字認識精度が向上する。
なお、文字同士や文字と周辺構造物との連結が生じる可能性のある箇所は、認識対象のナンバープレートによってある程度定められる。このため、図示しない領域選定手段により、文字の大きさにかかる情報などを利用して予め分割点の位置を推定し、推定された位置を含む領域について分割点を探索する領域と定める。そして、このようにすることで、定められた領域内でのみ上記した処理を実行すればよく、文字認識処理に要する時間を短縮することができるとともに、分割点の誤検出を抑制することができる。領域選定手段によって、入力画像データから探索対象の領域を定めるための処理は、任意のタイミングで行うことができ、例えば、注目画素の明暗判定に先立って行うことも、また、輪郭線強調処理に先立って行うこともできる。また、分割点を探索する領域は、文字認識処理の都度演算して選定してもよいが、予め記憶手段などに定めておき、領域選定手段によって記憶手段から読み出すこともできる。領域選定手段もCPU21が所定のROM22に格納された処理プログラムをRAM23に展開し、展開したプログラムを実行することによって実現される処理部として機能する。
〔第2の実施形態〕
次に、本発明の第2の実施形態について、図5を用いて説明する。
本実施形態の文字認識処理が上述した第1の実施形態と異なる点は、第1の実施形態における分割点の算出処理を実行した後に、ここで求めた分割点を分割候補点とし、分割候補点の水平軸(x軸)への射影投票を行い、分割点が多く投票されている座標については、そのx座標のすべてのy座標を分割点として算出するという処理を加えた点である。以下、本実施形態の文字認識処理について、第1の実施形態と共通する点については説明を省略し、異なる点について説明する。
図5は、本実施形態における文字認識処理の過程を示すフローチャートである。図5に示すように、ステップS201〜ステップS206で、カメラ11で撮影されたナンバープレートの画像は、図3(a)に示す画像データとして画像入力部12に入力され、認識処理部13により、上述した第1の実施形態における文字認識処理と同様にして、局注目画素+符号に対して−符号へ変化している画素がある領域数と、注目画素−符号に対して+符号へ変化している画素がある領域数のより少ないほうを分割候補点として抽出する。
ステップS207では、図示しない投票手段が、ステップS206で算出された分割候補点を水平方向(x軸方向)に投影した投票空間に投票することにより、射影投票された周辺分布からなる得票分布を生成する。ステップS208では、生成された得票分布から、得票が所定閾値以上となるx座標を算出し次のステップへ進む。なお、所定閾値としては、最高得票値又は全得票値の平均値が予め定められた固定値以上である場合に、最高得票値に予め定めた任意の比率を乗じて求めた値や、先験情報により予め定められる文字の参照高さに予め定めた任意の比率を乗じて求めた値等を用いることができる。ステップS209では、先のステップS208で算出された全てのx座標について、そのx座標の全てのy座標を算出し、このy座標を分割点として定め、このルーチンを終了する。
分割点が決定されると、ナンバープレートに記載された文字が分離され、分離された1文字領域に対して、2値化、ラベリング等の処理により切り出した個々の文字画像に対して文字認識処理がなされる。全ての文字領域について所定の文字認識処理が終了すると、認識結果が認識結果出力部14へ出力され、文字認識処理が終了する。
このように、本実施形態によれば、輪郭線の垂直方向及び水平方向の双方の輝度勾配に基づいて文字認識対象画素の明暗を判定するので、文字同士の連結箇所や文字とナンバープレートを固定するボルトなどの周辺構造物との連結箇所を正しく特定でき、連結部分を正しく分割できる。特に、射影投票を行うことで、文字同士や文字と周辺構造物がぴったり接している場合などの連結箇所が多い場合にも分割漏れが発生してしまうことを防止でき、文字認識精度が向上する。
〔第3の実施形態〕
続いて、本発明の第3の実施形態について、図6を用いて説明する。
本実施形態の文字認識処理が上述した第1の実施形態及び第2の実施形態と異なる点は、第1の実施形態及び第2の実施形態における分割点の算出処理を実行した後に、認識対象の文字の大きさの先験情報を用いて分割点をさらに絞り込み、絞り込んだ領域にて文字認識処理を行い、最もマッチング度が高い領域を文字の分割点として確定する点である。第1及び第2の実施形態と共通する点については説明を省略し、異なる点について説明する。
図6は、本実施形態における文字認識処理の過程を示すフローチャートである。図6に示すように、上述した第1の実施形態もしくは第2の実施形態に従って算出された分割点と、文字の大きさにかかる情報である文字情報とが認識処理部13に入力され、文字認識処理がスタートする。なお、文字情報は、認識対象のナンバープレートに基づいて予め定められた情報であり、この文字情報を例えば記憶装置24に記憶しておく。
ステップS301では、記憶装置24から入力された文字情報に基づいて、分割候補点を絞り込む。すなわち、文字情報と先のステップで算出された全ての分割点とを比較して、文字情報で示される文字の大きさに最も近い分割候補点を抽出する。次のステップS302では、抽出された分割候補点において2値化、ラベリング等の処理により個々の文字画像に対しての文字認識処理を実行する。次のステップS303では、先のステップS302で文字認識処理された文字を文字情報と比較し、最もマッチング度が高い分割候補点の組み合わせを算出する。
ステップS304では、上記したステップS302〜S303の処理が、ステップS301で絞り込まれた分割候補点の全てに対して実行されたか否かを判定し、実行されていないと判定された場合には、ステップS302に戻り、ステップS302及びS303の処理を繰り返す。ステップS304で、ステップS302〜S303の処理が、ステップS301で絞り込まれた分割候補点の全てに対して実行されたと判定された場合には、算出された全ての分割候補点の組み合わせを採用して、文字の分割点を確定し、本ルーチンを終了する。なお、本ルーチンの終了後、文字の認識結果をより確実にするために、再度、2値化、ラベリング等の処理により切り出した個々の文字画像に対して文字認識処理を行うことも可能である。なお、この場合には、先に行った文字認識処理とは異なるパラメータを用いることが好ましい。
このように、本実施形態によれば、文字の輪郭線の輝度勾配にかかる情報に加えて、文字の大きさ、文字マッチング結果にかかる情報に基づいて文字の分割点を決定する。ので、より精度よく文字の分割点が定まり、文字認識精度が向上する。
10 文字認識装置
11 カメラ
12 画像入力部
13 認識処理部
14 認識結果出力部
25 輪郭線抽出部
26 符号算出部
27 符号変化算出部
28 分割点決定部

Claims (5)

  1. 文字列を撮像した画像データの該文字列を分割して該文字列に含まれる文字を個々に認識する文字認識装置であって、
    前記画像データから微分フィルタを用いて前記文字列の輪郭線を抽出する輪郭線抽出手段と、
    前記抽出された輪郭線のうち垂直輪郭線及び水平輪郭線を構成する各画素について、前記微分フィルタによる微分値の符号を算出する符号算出手段と、
    前記符号が算出された画素から1つの画素を注目画素として選択し、該注目画素を含む第1の領域を前記画像データから順次抽出し、前記第1の領域に含まれる画素について、前記符号算出手段により算出された符号に基づいて、前記注目画素の符号と異符号を示す画素があるか否かを判定し、前記画像データから抽出された第1の領域のうち異符号を示す画素があると判定された第1の領域の数を算出する符号変化算出手段と、
    異符号を示す画素があると判定された前記第1の領域を、前記注目画素が+符号を示す領域と注目画素が−符号を示す領域とに分別し、分別した結果、より数の少ない領域を前記文字列の分割点とする分割点決定手段と、
    を備えたことを特徴とする文字認識装置。
  2. 前記分割点の位置を予め推定し、前記画像データから前記推定された分割点の位置を含む第2の領域を定める領域選定手段を備え、
    前記分割点決定手段は、前記第2の領域において文字列の分割点を決定することを特徴とする請求項1に記載の文字認識装置。
  3. 前記分割点を水平軸方向に投影した投票空間に投票することにより、射影投票された周辺分布からなる得票分布を生成する投票手段を備え、
    前記分割点決定手段は、前記得票分布から、水平方向の得票値が所定閾値以上となる場合に、該水平方向の得票値に対する垂直方向の得票値を真の分割点とする、
    ことを特徴とする請求項1又は請求項2に記載の文字認識装置。
  4. 前記文字の大きさにかかる文字情報を予め記憶した記憶手段を備え、
    前記分割点決定手段は、前記文字情報と前記分割点とを比較して前記文字情報で示される文字の大きさに最も近い分割点を真の分割点とする、
    ことを特徴とする請求項1乃至請求項3の何れか1項に記載の文字認識装置。
  5. 文字列を撮像した画像データの該文字列を分割し、該文字列に含まれる文字を個々に認識する文字認識方法であって、
    前記画像データから微分フィルタを用いて前記文字列の輪郭線を抽出するステップと、
    前記抽出された輪郭線のうち垂直輪郭線及び水平輪郭線を構成する各画素について、前記微分フィルタによる微分値の符号を算出するステップと、
    前記符号が算出された画素から1つの画素を注目画素として選択し、該注目画素を含む第1の領域を前記画像データから順次抽出し、前記第1の領域に含まれる画素について、前記符号算出手段により算出された符号に基づいて、前記注目画素の符号と異符号を示す画素があるか否かを判定し、前記画像データから抽出された第1の領域のうち異符号を示す画素があると判定された第1の領域の数を算出するステップと、
    異符号を示す画素があると判定された前記第1の領域を、前記注目画素が+符号を示す領域と注目画素が−符号を示す領域とに分別し、分別した結果、より数の少ない領域を前記文字列の分割点とするステップと、
    を備えたことを特徴とする文字認識方法。
JP2009036455A 2009-02-19 2009-02-19 文字認識装置及び文字認識方法 Active JP5010627B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2009036455A JP5010627B2 (ja) 2009-02-19 2009-02-19 文字認識装置及び文字認識方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009036455A JP5010627B2 (ja) 2009-02-19 2009-02-19 文字認識装置及び文字認識方法

Publications (2)

Publication Number Publication Date
JP2010191767A JP2010191767A (ja) 2010-09-02
JP5010627B2 true JP5010627B2 (ja) 2012-08-29

Family

ID=42817735

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009036455A Active JP5010627B2 (ja) 2009-02-19 2009-02-19 文字認識装置及び文字認識方法

Country Status (1)

Country Link
JP (1) JP5010627B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104200210A (zh) * 2014-08-12 2014-12-10 合肥工业大学 一种基于部件的车牌字符分割方法

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102810155B (zh) * 2011-05-31 2015-04-15 富士通株式会社 用于从图像中提取文本笔划图像的方法和装置
CN112001393B (zh) * 2020-07-06 2024-02-02 西安电子科技大学 一种特定字符识别fpga实现方法、系统、存储介质及应用
CN112749694B (zh) * 2021-01-20 2024-05-21 中科云谷科技有限公司 用于识别图像方向、识别铭牌文字的方法及装置

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2520104B2 (ja) * 1985-07-23 1996-07-31 株式会社クボタ 自動走行作業車用の境界検出装置
JP3779741B2 (ja) * 1994-07-15 2006-05-31 松下電工株式会社 文字画像の2値化方法
JPH08305795A (ja) * 1995-04-28 1996-11-22 Nippon Steel Corp 文字認識方法
JPH113421A (ja) * 1997-06-11 1999-01-06 Meidensha Corp 線分の検出方法
JP3890840B2 (ja) * 1999-12-22 2007-03-07 富士通株式会社 画像処理装置、画像処理方法、及び画像処理プログラムを記録した、コンピュータ読み取り可能な記録媒体

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104200210A (zh) * 2014-08-12 2014-12-10 合肥工业大学 一种基于部件的车牌字符分割方法
CN104200210B (zh) * 2014-08-12 2018-11-06 合肥工业大学 一种基于部件的车牌字符分割方法

Also Published As

Publication number Publication date
JP2010191767A (ja) 2010-09-02

Similar Documents

Publication Publication Date Title
CN111028213B (zh) 图像缺陷检测方法、装置、电子设备及存储介质
CN108364010B (zh) 一种车牌识别方法、装置、设备及计算机可读存储介质
CN110414507B (zh) 车牌识别方法、装置、计算机设备和存储介质
US8059868B2 (en) License plate recognition apparatus, license plate recognition method, and computer-readable storage medium
KR101617681B1 (ko) 히스토그램들을 갖는 다중 층 연결 요소들을 사용하는 텍스트 검출
CN108986152B (zh) 一种基于差分图像的异物检测方法及装置
JP4901676B2 (ja) ナンバープレート情報処理装置及びナンバープレート情報処理方法
JP2008286725A (ja) 人物検出装置および方法
CN110751154B (zh) 一种基于像素级分割的复杂环境多形状文本检测方法
JP2000132688A (ja) 顔パーツ検出方法及びその装置
JP6177541B2 (ja) 文字認識装置、文字認識方法及びプログラム
JP5010627B2 (ja) 文字認識装置及び文字認識方法
JP2008251029A (ja) 文字認識装置、ナンバープレート認識システム
JP5100688B2 (ja) 対象物検出装置及びプログラム
US20180158203A1 (en) Object detection device and object detection method
CN114693917A (zh) 一种应用于招牌照识别的数据增强方法
EP3955207A1 (en) Object detection device
JP5201184B2 (ja) 画像処理装置及びプログラム
CN111354038A (zh) 锚定物检测方法及装置、电子设备及存储介质
CN109074646B (zh) 图像识别装置以及图像识别程序
JP2016053763A (ja) 画像処理装置、画像処理方法及びプログラム
JP5439069B2 (ja) 文字認識装置及び文字認識方法
US9792675B1 (en) Object recognition using morphologically-processed images
Siddique et al. Development of an automatic vehicle license plate detection and recognition system for Bangladesh
CN113744200B (zh) 一种摄像头脏污检测方法、装置及设备

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20110914

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20120426

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120508

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120601

R151 Written notification of patent or utility model registration

Ref document number: 5010627

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150608

Year of fee payment: 3

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R371 Transfer withdrawn

Free format text: JAPANESE INTERMEDIATE CODE: R371

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350