JP2006309402A - Character string recognition method, number plate recognition method and device - Google Patents
Character string recognition method, number plate recognition method and device Download PDFInfo
- Publication number
- JP2006309402A JP2006309402A JP2005129585A JP2005129585A JP2006309402A JP 2006309402 A JP2006309402 A JP 2006309402A JP 2005129585 A JP2005129585 A JP 2005129585A JP 2005129585 A JP2005129585 A JP 2005129585A JP 2006309402 A JP2006309402 A JP 2006309402A
- Authority
- JP
- Japan
- Prior art keywords
- character
- candidate
- image
- region
- recognition
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Images
Abstract
Description
本発明は、文字列認識方法、及びそれを行うための装置に関しており、特に、ナンバープレートの小文字列の認識に特に適した文字列認識方法、及び装置に関する。 The present invention relates to a character string recognition method and an apparatus for performing the method, and more particularly, to a character string recognition method and apparatus particularly suitable for recognition of a lowercase character string of a license plate.
撮像装置によって撮像された画像から文字を認識する文字認識は、様々な分野で応用されている。ナンバープレートに記載された文字を認識するナンバープレート認識は、文字認識の典型的な応用の一つである。 Character recognition for recognizing characters from an image captured by an imaging device is applied in various fields. License plate recognition for recognizing characters written on a license plate is one of typical applications of character recognition.
最も典型的な文字列認識方法は、撮像画像を2値化して2値化画像を生成し、その2値化画像とテンプレートとのイメージマッチングによって文字を認識する方法である。 The most typical character string recognition method is a method in which a captured image is binarized to generate a binarized image, and a character is recognized by image matching between the binarized image and a template.
この文字列認識方法の一つの問題点は、撮像画像のコントラストが低い場合に、文字を誤って認識しやすいことである。撮像画像を撮像する際に充分な光量が得られない場合、例えば、撮像装置に照明装置が設けられていない場合、撮像画像のコントラストが低下することがある。撮像画像のコントラストが低いと、2値化により文字線と背景を分離するための閾値を決定することが困難になるため、2値化画像から文字を構成する線が欠落したり、或いは、本来は分離されるべき2本の線が2値化画像において連結したりする。線の不所望な欠落や連結は、文字の誤認識の原因となる。 One problem with this character string recognition method is that when a captured image has a low contrast, characters are easily recognized by mistake. When a sufficient amount of light cannot be obtained when capturing a captured image, for example, when an illumination device is not provided in the imaging device, the contrast of the captured image may be reduced. If the contrast of the captured image is low, it is difficult to determine a threshold value for separating the character line and the background by binarization. Therefore, the line constituting the character is missing from the binarized image, or originally The two lines to be separated are connected in the binarized image. Undesirable missing or connected lines cause misrecognition of characters.
このような背景から、2値化処理を行わずに文字認識を行う技術の検討が行われている。例えば、特開平8−147414号公報(特許文献1)及び特開2003−147414号公報(特許文献2)は、いずれも、画像データから正規化相互相関処理を用いて文字位置の検出及び文字認識を行う技術を開示している。詳細には、特許文献1に開示された文字認識技術は、文字列を構成する個々の文字位置を画像の全体について正規化相互相関法及びDPマッチングを行うことによって推定している。一方、特許文献2に開示された文字認識技術では、1文字ごとに正規化相互相関法を用いて位置検出を行い、その検出された位置を基準に次の文字位置を検出する方法を採用している。
From such a background, a technique for performing character recognition without performing binarization processing has been studied. For example, JP-A-8-147414 (Patent Document 1) and JP-A-2003-147414 (Patent Document 2) both detect character positions and recognize characters using normalized cross-correlation processing from image data. The technology to perform is disclosed. Specifically, the character recognition technique disclosed in
2値化処理を行わずに文字認識を行う技術の一つの課題は、文字認識に必要なデータ処理量の低減と、文字列の多様性への対応の向上とを両立させることである。例えば、特許文献1に開示された技術では、正規化相互相関法に加えてDPマッチングを採用することにより、文字数が不定もしくは不明な撮像画像の文字位置を検出している。しかし、画像の全体について正規化相互相関法及びDPマッチングを行うため、文字認識に必要なデータ処理量が大きい。一方、特許文献2に開示された技術は、正規化相互相関法が行われる範囲が小さく、データ処理量の低減が可能である。しかしながら、特許文献2に開示された技術は、文字数が定まっている撮像画像にしか適用できない(例えば、特許文献2の段落〔0006〕参照)。
One problem of the technology for performing character recognition without performing binarization processing is to achieve both a reduction in the amount of data processing necessary for character recognition and an improvement in handling character string diversity. For example, in the technique disclosed in
文字列の多様性に対応できないこと、特に、文字数が可変である文字列の文字認識ができないことは、ナンバープレート認識、特にナンバープレートの小文字列の文字認識においては特に問題である;小文字列とは、車両の本拠の運輸支局又は自動車検査登録事務所を表示する文字である陸支コード(例えば、「神戸」、「品川」)と、自動車の種別及び用途を示す車種コード(例えば、「33」、「55」「501」)とから構成される文字列である。車種コードは2桁又は3桁の分類番号から構成されており、従って、ナンバープレートの小文字列の文字数は不定である。従って、文字列の文字数が一定であることを必要とする文字認識技術は、ナンバープレートの小文字列の認識には適用できない。 The inability to deal with the diversity of character strings, especially the inability to recognize characters with variable number of characters, is particularly problematic in license plate recognition, especially in lower-case character plate recognition of license plates; Is a land branch code (for example, “Kobe” or “Shinagawa”) which is a character for displaying a vehicle-based transportation branch office or automobile inspection registration office, and a vehicle type code (for example, “33” ”,“ 55 ”,“ 501 ”). The vehicle type code is composed of a 2-digit or 3-digit classification number, and therefore, the number of characters in the lower-case letter plate of the license plate is indefinite. Therefore, the character recognition technique that requires that the number of characters in the character string is constant cannot be applied to the recognition of the lowercase character string in the license plate.
このような背景から、文字認識に必要なデータ処理量の低減と文字列の多様性への対処とを両立させることができる文字認識技術の提供が求められている。 Against this background, there is a need to provide a character recognition technology that can simultaneously reduce the amount of data processing required for character recognition and cope with the diversity of character strings.
本発明の目的は、コントラストが低い撮像画像に対応できる一方で、文字認識に必要なデータ処理量の低減と文字列の多様性への対処とを両立させることができる文字認識技術を提供することにある。 An object of the present invention is to provide a character recognition technology that can cope with a low-contrast captured image while simultaneously reducing the amount of data processing necessary for character recognition and dealing with the diversity of character strings. It is in.
上記の目的を達成するために、本発明は、以下に述べられる手段を採用する。その手段を構成する技術的事項の記述には、[特許請求の範囲]の記載と[発明を実施するための最良の形態]の記載との対応関係を明らかにするために、[発明を実施するための最良の形態]で使用される番号・符号が付加されている。但し、付加された番号・符号は、[特許請求の範囲]に記載されている発明の技術的範囲を限定的に解釈するために用いてはならない。 In order to achieve the above object, the present invention employs the means described below. In the description of technical matters constituting the means, in order to clarify the correspondence between the description of [Claims] and the description of [Best Mode for Carrying Out the Invention] Number / symbol used in the best mode for doing this is added. However, the added number / symbol should not be used to limit the technical scope of the invention described in [Claims].
本発明による文字列認識方法は、
(A)それぞれに一の文字が写されている複数の文字領域(14〜16)を含んで構成される文字列画像(11)の全体について、前記文字領域(14〜16)の境界の候補である文字切り出し位置候補(18、25)を定めるステップと、
(B)前記文字切り出し位置候補(18、25)を前記複数の文字領域(14〜16)の境界に対応付けて前記複数の文字領域(14〜16)の候補である文字候補領域(21〜24)を決定し、前記文字候補領域(21〜24)の組み合わせとして表現される領域配置候補を決定するステップと、
(C)前記文字候補領域(21〜24)のそれぞれについて画像認識を行い、前記画像認識の結果に基づいて、前記領域配置候補のうちから最適領域配置候補を選択するステップと、
(D)前記最適領域配置候補に対応する前記文字候補領域(21〜24)について前記(C)ステップの画像認識において認識された文字からなる文字列を、認識結果文字列として出力するステップ
とを具備する。
A character string recognition method according to the present invention includes:
(A) With respect to the whole character string image (11) including a plurality of character regions (14 to 16) in which one character is copied, candidates for boundaries of the character regions (14 to 16) Determining character extraction position candidates (18, 25) that are:
(B) Character candidate regions (21 to 21) that are candidates for the plurality of character regions (14 to 16) by associating the character cutout position candidates (18, 25) with boundaries of the plurality of character regions (14 to 16). 24) and determining a region arrangement candidate expressed as a combination of the character candidate regions (21 to 24);
(C) performing image recognition for each of the character candidate areas (21 to 24), and selecting an optimal area arrangement candidate from the area arrangement candidates based on the result of the image recognition;
(D) outputting a character string made up of characters recognized in the image recognition in step (C) as the recognition result character string for the character candidate regions (21 to 24) corresponding to the optimal region arrangement candidate. It has.
本発明による文字列認識方法では、文字列画像の全体ではなく、文字切り出し位置候補(18、25)から決定される文字候補領域(21〜24)について文字認識が行われるため、文字認識に必要なデータ処理量を低減させることができる。その一方で、本発明による文字列認識方法では、文字候補領域(21〜24)の組み合わせである領域配置候補から選択された最適領域配置候補に対応する文字列が認識結果として出力されるため、文字数が可変である文字列の文字認識が実現できる。このような文字列認識方法は、ナンバープレートの小文字列の認識に特に有効である。 In the character string recognition method according to the present invention, character recognition is performed not on the entire character string image but on the character candidate areas (21 to 24) determined from the character cutout position candidates (18, 25). The amount of data processing can be reduced. On the other hand, in the character string recognition method according to the present invention, since the character string corresponding to the optimal area arrangement candidate selected from the area arrangement candidates that are combinations of the character candidate areas (21 to 24) is output as the recognition result, Character recognition of a character string having a variable number of characters can be realized. Such a character string recognition method is particularly effective for the recognition of the lowercase character string in the license plate.
前記文字切り出し位置候補(18、25)は、最も典型的には、前記文字列画像の各画素の輝度から決定される。また、前記文字切り出し位置候補(18、25)は、前記文字列画像の微分画像から決定されることも可能である。 The character cutout position candidates (18, 25) are most typically determined from the luminance of each pixel of the character string image. The character cutout position candidates (18, 25) may be determined from a differential image of the character string image.
前記(C)ステップは、
(C1)前記文字切り出し位置候補(18、25)によって定められる前記文字候補領域(21〜24)のそれぞれの幅を算出するステップと、
(C2)前記文字切り出し位置候補(18、25)によって定められる前記文字候補領域(21〜24)のそれぞれについて、前記文字候補領域(21〜24)の画像と、予め用意されたテンプレート画像との相違度を算出するステップと、
(C3)前記文字候補領域(21〜24)の幅、及び前記相違度に基づいて文字らしさ評価値を算出するステップ
とを備え、前記最適領域配置候補は、前記文字らしさ評価値に基づいて決定されることが好ましい。文字候補領域(21〜24)の幅から文字らしさ評価値を算出し、その文字らしさ評価値から最適領域配置候補を選択することは、簡便な処理で、正しい最適領域配置候補を選択するために有効である。
The step (C) includes:
(C1) calculating a width of each of the character candidate regions (21 to 24) defined by the character cutout position candidates (18, 25);
(C2) For each of the character candidate areas (21-24) defined by the character cutout position candidates (18, 25), an image of the character candidate areas (21-24) and a template image prepared in advance Calculating the dissimilarity;
(C3) calculating a character likelihood evaluation value based on the width of the character candidate region (21 to 24) and the degree of difference, and determining the optimal region arrangement candidate based on the character likelihood evaluation value It is preferred that To calculate the character likelihood evaluation value from the width of the character candidate area (21 to 24) and select the optimum area arrangement candidate from the character likelihood evaluation value, in order to select the correct optimum area arrangement candidate with simple processing It is valid.
前記(C)ステップは、更に、
(C4)前記文字切り出し位置候補(18、25)によって定められる前記文字候補領域(21〜24)の、隣接する2つの文字候補領域(21〜24)の隙間の幅を算出するステップと、
(C5)前記2つの文字候補領域(21〜24)の隙間の幅に基づいて、隙間らしさ評価値を算出するステップ
を備え、前記最適領域配置候補は、前記隙間らしさ評価値に基づいて決定されることも好ましい。
The step (C) further includes:
(C4) calculating a width of a gap between two adjacent character candidate regions (21 to 24) of the character candidate regions (21 to 24) defined by the character cutout position candidates (18 and 25);
(C5) comprising a step of calculating a clearance likelihood evaluation value based on a width of a gap between the two character candidate regions (21 to 24), wherein the optimum region arrangement candidate is determined based on the clearance likelihood evaluation value. It is also preferable.
本発明の他の観点において、本発明によるナンバープレート認識方法は、
(E)ナンバープレートの小文字列が写されている小文字列画像(11)の全体について、それぞれに前記小文字列の一の文字が写されている文字領域(14〜16)の境界の候補である文字切り出し位置候補(18、25)を定めるステップと、
(F)前記文字切り出し位置候補(18、25)を前記複数の文字領域(14〜16)の境界に対応付けて前記複数の文字領域(14〜16)の候補である文字候補領域(21〜24)を決定し、前記文字候補領域(21〜24)の組み合わせとして表現される領域配置候補を決定するステップと、
(G)前記文字候補領域(21〜24)のそれぞれについて画像認識を行い、前記画像認識の結果に基づいて、前記領域配置候補のうちから最適領域配置候補を選択するステップと、
(H)前記最適領域配置候補に対応する前記文字候補領域(21〜24)について前記(G)ステップの画像認識において認識された文字からなる文字列を、認識結果の少なくとも一部として出力するステップ
とを具備する。
In another aspect of the present invention, a license plate recognition method according to the present invention comprises:
(E) The entire lowercase character string image (11) in which the lowercase character string of the license plate is copied is a candidate for the boundary of the character region (14-16) in which one character of the lowercase character string is copied. Determining character cutout position candidates (18, 25);
(F) Associating the character cut-out position candidates (18, 25) with the boundaries of the plurality of character regions (14-16), character candidate regions (21-21) that are candidates for the plurality of character regions (14-16) 24) and determining a region arrangement candidate expressed as a combination of the character candidate regions (21 to 24);
(G) performing image recognition for each of the character candidate areas (21 to 24), and selecting an optimal area arrangement candidate from the area arrangement candidates based on the result of the image recognition;
(H) A step of outputting, as at least a part of a recognition result, a character string made up of characters recognized in the image recognition in the step (G) for the character candidate regions (21 to 24) corresponding to the optimum region arrangement candidates. It comprises.
一実施形態では、当該ナンバープレート認識方法は、
更に、
(I)前記文字切り出し位置候補(18、25)から前記小文字列の陸支コードが写されている陸支コード領域を決定するステップと、
(J)前記小文字列画像(11)のうち前記陸支コード領域以外の領域に、車種コード領域を決定するステップ
とを具備し、前記領域配置候補は、前記車種コード領域について定められた車種コード領域配置候補である。
In one embodiment, the license plate recognition method comprises:
Furthermore,
(I) determining a land support code area in which the land support code in the lower case string is copied from the character cutout position candidates (18, 25);
(J) including a step of determining a vehicle type code region in a region other than the land support code region in the lower case sequence image (11), wherein the region arrangement candidate is a vehicle type code determined for the vehicle type code region. It is a region arrangement candidate.
この場合、前記(I)ステップは、
(I1)前記文字切り出し位置候補(18、25)を境界とし、前記小文字列画像(11)の端に接し、且つ、所定範囲の幅を有する領域を陸支コード候補領域として定めるステップと、
(I2)前記陸支コード候補領域のそれぞれについて画像認識を行い、前記画像認識の結果に基づいて前記陸支コード候補領域のうちから陸支コードが写されている陸支コード領域を決定するステップ
とを備え、前記陸支コード領域として決定された前記陸支コード候補領域について認識された陸支コードが、前記認識結果の一部として出力され得る。
In this case, the step (I)
(I1) defining a region having a predetermined range of width as a land support code candidate region, with the character cutout position candidate (18, 25) as a boundary, touching an end of the lowercase character string image (11), and
(I2) performing image recognition for each of the land support code candidate areas, and determining a land support code area in which the land support code is copied from the land support code candidate areas based on the result of the image recognition The land support code recognized for the land support code candidate region determined as the land support code region can be output as a part of the recognition result.
他の実施形態では、前記(G)ステップの前記画像認識では、前記小文字列の最も左に位置する文字に対応する前記文字候補領域(21〜24)については陸支コードのテンプレート画像が使用され、それ以外の文字に対応する前記文字候補領域(21〜24)については数字のテンプレート画像が使用され、前記認識結果は、前記ナンバープレートの陸支コードの認識結果と前記ナンバープレートの車種コードの認識結果とを含む。 In another embodiment, in the image recognition in the step (G), a land code template image is used for the character candidate region (21 to 24) corresponding to the leftmost character in the lowercase character string. Numeral template images are used for the character candidate areas (21 to 24) corresponding to the other characters, and the recognition result includes the recognition result of the land plate code of the license plate and the vehicle type code of the license plate. Including recognition results.
また、前記(G)ステップにおいて前記文字候補領域(21〜24)のうちの或る文字候補領域について行われた前記画像認識によって「1」という認識結果が得られた場合には、前記或る文字候補領域の周囲を含む拡大領域について再度の画像認識が行われ、前記拡大領域について「1」以外の認識結果が得られた場合には、前記或る文字候補領域を含む領域配置候補は、前記最適領域配置候補として選択されないことが好ましい。 If the recognition result “1” is obtained by the image recognition performed for a certain character candidate region in the character candidate regions (21 to 24) in the step (G), the certain When the image recognition is performed again for the enlarged region including the periphery of the character candidate region and a recognition result other than “1” is obtained for the enlarged region, the region arrangement candidate including the certain character candidate region is It is preferable that the optimal region arrangement candidate is not selected.
前記文字候補領域(21〜24)が矩形である場合、前記文字切り出し位置候補(18、25)は、前記文字候補領域(21〜24)の左端及び右端を決定する横方向文字切り出し位置候補(18)と、前記文字候補領域(21〜24)の上端及び下端を決定する縦方向文字切り出し位置候補(25)とを備えることが好ましい。 When the character candidate area (21-24) is a rectangle, the character cutout position candidates (18, 25) are the horizontal character cutout position candidates (18, 25) that determine the left and right ends of the character candidate areas (21-24). 18) and vertical character cutout position candidates (25) for determining the upper and lower ends of the character candidate areas (21 to 24).
また、前記(E)ステップは、
(E1) 前記小文字列画像(11)を上側部分と下側部分とに区分するステップと、
(E2) 前記下側部分の画像から前記文字切り出し位置候補(18)を決定するステップ
とを備えることが好ましい。このような処理手順によれば、小文字列画像(11)に写り得るビスの影響を排除することができる。
In addition, the step (E)
(E1) dividing the lowercase sequence image (11) into an upper part and a lower part;
(E2) It is preferable to include the step of determining the character cutout position candidate (18) from the image of the lower part. According to such a processing procedure, it is possible to eliminate the influence of screws that may appear in the lowercase string image (11).
本発明の更に他の観点において、本発明の文字列認識装置は、それぞれに一の文字が写されている複数の文字領域を含んで構成される文字列画像を取得する撮像装置(1)と、前記文字列画像の文字認識を行う画像処理装置(2)とを備えている。前記画像処理装置(2)は、下記ステップ群:
(A)文字列画像の全体について、前記文字領域の境界の候補である文字切り出し位置候補(18、25)を定めるステップ、
(B)前記文字切り出し位置候補(18、25)を前記複数の文字領域の境界に対応付けて前記複数の文字領域の候補である文字候補領域(21〜24)を決定し、前記文字候補領域(21〜24)の組み合わせとして表現される領域配置候補を決定するステップ、
(C)前記文字候補領域(21〜24)のそれぞれについて画像認識を行い、前記画像認識の結果に基づいて、前記領域配置候補のうちから最適領域配置候補を選択するステップ、及び
(D)前記最適領域配置候補に対応する前記文字候補領域(21〜24)について前記(C)ステップの画像認識において認識された文字からなる文字列を、認識結果文字列として出力するステップ
とを実行するように構成されている。
In still another aspect of the present invention, a character string recognition device according to the present invention includes an imaging device (1) that acquires a character string image including a plurality of character regions in which one character is copied. And an image processing device (2) for performing character recognition of the character string image. The image processing apparatus (2) includes the following steps:
(A) A step of determining character cutout position candidates (18, 25) that are candidates for the boundary of the character region for the entire character string image;
(B) The character candidate regions (21 to 24) which are candidates for the plurality of character regions are determined by associating the character cutout position candidates (18, 25) with boundaries of the plurality of character regions, and the character candidate regions Determining a region arrangement candidate expressed as a combination of (21-24);
(C) performing image recognition for each of the character candidate regions (21 to 24), and selecting an optimum region arrangement candidate from the region arrangement candidates based on the result of the image recognition; and (D) Executing a step of outputting a character string made up of characters recognized in the image recognition in the step (C) as a recognition result character string for the character candidate regions (21 to 24) corresponding to the optimum region arrangement candidate. It is configured.
本発明の更に他の観点において、本発明のナンバープレート認識装置は、ナンバープレートの撮像画像を取得する撮像装置(1)と、前記撮像画像から前記ナンバープレートの文字認識を行うための画像処理装置(2)とを備えている。前記画像処理装置(2)は、下記ステップ群:
(K)前記撮像画像から、前記ナンバープレートの小文字列が写されている小文字列画像(11)を切り出すステップ、
(E)’前記小文字列画像(11)の全体について、それぞれに前記小文字列の一の文字が写されている文字領域の境界の候補である文字切り出し位置候補(18、25)を定めるステップ、
(F)前記文字切り出し位置候補(18、25)を前記複数の文字領域の境界に対応付けて前記複数の文字領域の候補である文字候補領域(21〜24)を決定し、前記文字候補領域(21〜24)の組み合わせとして表現される領域配置候補を決定するステップと、
(G)前記文字候補領域(21〜24)のそれぞれについて画像認識を行い、前記画像認識の結果に基づいて、前記領域配置候補のうちから最適領域配置候補を選択するステップ、及び
(H)前記最適領域配置候補に対応する前記文字候補領域(21〜24)について前記(G)ステップの画像認識において認識された文字からなる文字列を、認識結果の少なくとも一部として出力するステップ
を実行するように構成されている。
In still another aspect of the present invention, a license plate recognition device according to the present invention includes an imaging device (1) that acquires a captured image of a license plate, and an image processing device that performs character recognition of the license plate from the captured image. (2). The image processing apparatus (2) includes the following steps:
(K) a step of cutting out a lowercase string image (11) in which the lowercase string of the license plate is copied from the captured image;
(E) ′ determining a character cutout position candidate (18, 25) that is a candidate for a boundary of a character region in which one character of the lowercase character sequence is copied for each of the lowercase character sequence image (11);
(F) associating the character cutout position candidates (18, 25) with boundaries of the plurality of character regions to determine character candidate regions (21 to 24) that are candidates for the plurality of character regions; Determining a region arrangement candidate expressed as a combination of (21-24);
(G) performing image recognition for each of the character candidate areas (21 to 24), and selecting an optimum area arrangement candidate from the area arrangement candidates based on the result of the image recognition; and (H) the above Executing a step of outputting a character string made up of characters recognized in the image recognition in the step (G) as at least a part of the recognition result for the character candidate regions (21 to 24) corresponding to the optimum region arrangement candidate. It is configured.
本発明によれば、コントラストが低い撮像画像に対応できる一方で、文字認識に必要なデータ処理量の低減と文字列の多様性への対処とを両立させることができる文字認識技術を提供できる。 According to the present invention, it is possible to provide a character recognition technology that can cope with a captured image with low contrast, while at the same time reducing both the amount of data processing required for character recognition and dealing with the diversity of character strings.
第1 第1の実施形態:
1.概略
図1は、本発明の第1の実施形態に係るナンバープレート認識装置10の構成を示している。ナンバープレート認識装置10は、撮像装置1と、画像処理装置2とを備えている。撮像装置1は、車両のナンバープレートを撮像し、ナンバープレート画像を得る。画像処理装置2は、そのナンバープレート画像に対してナンバープレート認識を行う。
First Embodiment:
1. Outline FIG. 1 shows a configuration of a license
画像処理装置2は、記憶装置3と、演算装置4と、撮像装置1に接続されたインターフェース5とを備えている。記憶装置3には、ナンバープレート認識プログラム6と、陸支コード用テンプレート7と、車種コード用テンプレート8と、用途コード用テンプレート9aと、一連番号用テンプレート9bとが格納されている。
The
ナンバープレート認識プログラム6は、ナンバープレート認識を行うアルゴリズムを記述しており、ナンバープレート認識は、演算装置4がナンバープレート認識プログラム6を実行することによって行われる。
The license
陸支コード用テンプレート7には、陸支コードのテンプレート画像と、各テンプレート画像の陸支コードクラスを示す情報(即ち、各テンプレート画像が、どの陸支コードに対応しているかを示す情報)とが対応付けて格納されている。後述されるように、ナンバープレートに記述されている陸支コードの文字認識は、陸支コード用テンプレート7を用いたパターン認識によって行われる。
The
車種コード用テンプレート8には、車種コードを構成する数字のテンプレート画像と、各テンプレートの文字クラスを示す情報(即ち、各テンプレート画像が、どの数字に対応しているかを示す情報)とが対応付けて格納されている。後述されるように、ナンバープレートに記述されている車種コードの文字認識は、車種コード用テンプレート8を用いたパターン認識によって行われる。
The vehicle
用途コード用テンプレート9aには、用途コード(即ち、事業用かどうかの別などを表示するかな文字及び英文字)のテンプレート画像と、各テンプレート画像の用途コードクラスを示す情報(即ち、各テンプレート画像が、どの用途コードに対応しているかを示す情報)とが対応付けて格納されている。ナンバープレートに記述されている用途コードの文字認識は用途コード用テンプレート9bを用いたパターン認識によって行われる。
The
一連番号用テンプレート9bには、一連番号を構成する数字のテンプレート画像と、各テンプレート画像の文字クラスを示す情報(即ち、各テンプレート画像が、どの数字に対応しているかを示す情報)とが対応付けて格納されている。ナンバープレートに記述されている一連番号の文字認識は一連番号用テンプレート9bを用いたパターン認識によって行われる。
Corresponding to the template for
図2は、画像処理装置2が行うナンバープレート認識の処理を示すフローチャートである。撮像装置1からナンバープレート画像を取得すると(ステップS01)、画像処理装置2は、取得したナンバープレート画像から小文字列画像と大文字列画像を分離する(ステップS02);ここで小文字列画像とは、上述の小文字列が写されている画像であり、大文字列画像とは、用途コードと一連番号とが写されている画像である。図3は、ナンバープレート画像と、小文字列画像の例を示している。小文字列画像及び大文字列画像は、いずれも、濃淡画像(grayscale image)であり、2値化画像ではない。続いて、小文字列画像、及び大文字列画像のそれぞれについて文字認識が行われ、ナンバープレートに記載された文字が認識される(ステップS03、S04)。ナンバープレートに記載された文字の文字認識は、濃淡画像である小文字列画像、及び大文字列画像から正規化相互相関等によって行われる。本実施の形態の文字認識では、濃淡画像から2値化画像は生成されない。
FIG. 2 is a flowchart showing a license plate recognition process performed by the
本実施の形態の主題は、小文字列画像の文字認識の最適化である。以下では、小文字列画像について文字認識を行う処理について詳細に説明される。 The subject of this embodiment is optimization of character recognition of lowercase sequence images. Below, the process which performs character recognition about a small letter sequence image is demonstrated in detail.
本実施の形態における文字認識の最終的な目標は、図4に示されているように、
(1)小文字列画像11に陸支コード領域12と車種コード領域13を最適に規定した上で、更に車種コード領域13をそれぞれに1つの数字が存在する2つ又は3つの文字領域:第1文字領域14、第2文字領域15、第3文字領域16に最適に区分すること、及び
(2)文字認識により、陸支コード領域12に記載されている陸支コードと、車種コード領域13に記載されている車種コード(即ち、第1文字領域14、第2文字領域15、第3文字領域16に記載されている数字からなる数字列)を取得すること
の2つである。図4には、車種コード領域13が3つの文字領域で構成されている場合が図示されているが、車種コード領域13は、2つの文字領域で構成され得ることに留意されたい。
The final goal of character recognition in this embodiment is as shown in FIG.
(1) The land
小文字列画像11、陸支コード領域12と車種コード領域13の境界、及び、文字領域14の境界は、文字切り出し位置17と呼ばれる。従って、上記の目標(1)は、小文字列画像11に適正な文字切り出し位置17を設定する、と言い換えることができる。以下では、上記の2つの目標を達成するための手順が詳細に説明される。
The lower
図5は、第1の実施形態における小文字列画像11の文字認識のアルゴリズムを示すフローチャートである。小文字列画像11の文字認識の処理手順は、概略的には、文字切り出し位置候補の抽出(ステップS11)と、陸支コードの認識(ステップS12)と、車種コードの認識(ステップS13)とで構成される。以下では、これらの処理が詳細に説明される。
FIG. 5 is a flowchart showing an algorithm for character recognition of the
2.文字切り出し位置候補の抽出
図6Aを参照して、小文字列画像11の文字認識では、まず、文字切り出し位置候補18が抽出される(ステップS11)。文字切り出し位置候補18とは、小文字列画像11に規定されるべき文字切り出し位置17の候補である。小文字列画像11が横方向(x軸方向)に長い本実施の形態では、横方向の文字切り出し位置候補18が規定される。各文字切り出し位置候補18は、小文字列画像11の縦方向(y軸方向)に延伸するように規定されている。
2. Extraction of Character Cutout Position Candidate With reference to FIG. 6A, in character recognition of the lowercase
文字切り出し位置候補18は、小文字列画像11から直接に、又は、小文字列画像11の微分画像から決定される。詳細には、小文字列画像11の画素の輝度データの値(即ち、輝度値)から、小文字列画像11の背景に該当すると推定される部分が決定され、小文字列画像11の両端、及び、小文字列画像11の背景と推定される部分に文字切り出し位置候補18が定められる。また、輝度データの値の代わりに、小文字列画像11の微分画像が文字切り出し位置候補18の抽出に使用され得る。この場合、小文字列画像11の各画素の輝度データから小文字列画像11の微分画像が算出され、その微分画像から小文字列画像11の背景と推定される部分が特定される。この場合にも、小文字列画像11の両端、及びその背景に該当する部分に文字切り出し位置候補18が定められる。
The character
より具体的には、ナンバープレートの塗色が何らかの手段によって既知である場合には、例えば、下記のような手順で文字切り出し位置候補18の抽出が行われ得る。まず、小文字列画像11の縦方向の輝度射影が算出される。縦方向の輝度射影とは、小文字列画像11を構成する画素列のそれぞれについて算出された輝度値の和である;ここで画素列とは、縦方向に1列に並べられた画素の列のことである。座標xに位置する画素列の輝度射影F(x)は、
F(x)=Σσ(x,y),
で算出される。ここでσ(x,y)は、小文字列画像11の座標(x,y)に位置する画素の輝度(又は階調)であり、Σは、小文字列画像11のy座標の全範囲についての和を表している。
More specifically, when the paint color of the license plate is known by some means, for example, the character
F (x) = Σσ (x, y),
Is calculated by Here, σ (x, y) is the luminance (or gradation) of the pixel located at the coordinates (x, y) of the
ナンバープレートの塗色が、背景より文字の輝度が高くなるような色である場合(例えば、ナンバープレートの塗色が白や黄である場合)には、輝度射影F(x)が極小となる位置、及び、輝度射影F(x)が所定の広さよりも広い範囲に渡って閾値より小さい場合には当該範囲において輝度射影F(x)が立ち上がる位置(図6Aでは、「川」と「1」の間の変化が大きい箇所)が、文字切り出し位置候補18として抽出される。
When the license plate paint color is such that the brightness of the characters is higher than the background (for example, when the license plate paint color is white or yellow), the brightness projection F (x) is minimized. When the position and the brightness projection F (x) are smaller than the threshold over a range wider than a predetermined area, the position where the brightness projection F (x) rises in the range (“river” and “1” in FIG. 6A). ”Is extracted as a character
一方、図6Bに示されているように、ナンバープレートの塗色が、背景より文字の輝度が高くなるような色である場合(例えば、ナンバープレートの塗色が緑や黒である場合)には、輝度射影F(x)が極大となる位置、及び、輝度射影F(x)が所定の広さよりも広い範囲に渡って閾値より大きい場合には当該範囲において輝度射影F(x)が立ち下がる位置が、文字切り出し位置候補18として抽出される。
On the other hand, as shown in FIG. 6B, when the license plate paint color is such that the brightness of the characters is higher than the background (for example, the license plate paint color is green or black). If the luminance projection F (x) is larger than the threshold over a position where the luminance projection F (x) is maximum, and the luminance projection F (x) is larger than a predetermined area, the luminance projection F (x) rises in that range. The lowering position is extracted as the character
一方、ナンバープレートの塗色が未知である場合には、例えば、下記のような手順で文字切り出し位置候補18の抽出が行われ得る。まず、小文字列画像11の微分処理が行われ、各画素についてx方向、y方向の微分値の和が求められる。更に、各画素列についてのx方向、y方向の微分値の総和である微分値射影が求められる。その微分値射影が、上記の輝度射影の代わりに使用されて上記と同様の処理が行われ、これにより、文字切り出し位置候補18が抽出される。
On the other hand, when the paint color of the license plate is unknown, the character
文字切り出し位置候補18の抽出において考慮されるべきことは、小文字列画像11は、ナンバープレートの上部から切り出されるため、小文字列画像11にはナンバープレートを車体に固定するビスが写り得ることである。ビスは、文字切り出し位置候補18の適切な抽出を妨げ得る。
What should be considered in the extraction of the character
ビスの影響を排除するためには、図6Cに示されているように、小文字列画像11のうち、ビスが写っていない下側の部分から文字切り出し位置候補18が決定されることが好ましい。より具体的には、小文字列画像11が、ビスが写っている上側部分11aと、写っていない下側部分11bとに区分される。その下側部分について上述と同様の処理が行われ、文字切り出し位置候補18が抽出される。これにより、ビスの影響を排除し、文字切り出し位置候補18を適切に抽出することが可能になる。
In order to eliminate the influence of screws, as shown in FIG. 6C, it is preferable that the character
3.陸支コードの認識
図5に示されているように、文字切り出し位置候補18の抽出に続いて、陸支コードの認識が行われる(ステップS12)。
3. Recognition of Land Support Code As shown in FIG. 5, the land support code is recognized following the extraction of the character cutout position candidate 18 (step S12).
陸支コードの認識処理では、まず、陸支コード候補領域の設定が行われる(ステップS12−1)。陸支コード候補領域とは、陸支コード領域12の候補である。図7に示されているように、陸支コード候補領域19の左の境界は、小文字列画像11の左端で固定されており、右の境界は、ステップS11において抽出された文字切り出し位置候補18から選択される。ただし、陸支コード候補領域19は、横方向の幅WR(即ち、小文字列画像11の左端から、対応する文字切り出し位置候補18までの距離)が、下記の条件を満足するように決定される:
h・kmin_R<WR<h・kmax_R, ・・・(1)
ここで、hは、小文字列画像11の高さであり、kmin_R,kmax_Rは、所定のパラメータである。このような陸支コード候補領域19の決定方法は、陸支コード領域12の縦横比が、ある一定の範囲に収まることを基礎としている。陸支コード領域12の縦横比として想定できないような縦横比を有する陸支コード候補領域19は設定されない。図7の例では、4つの陸支コード候補領域191乃至194が設定されている。
In the land support code recognition process, first, a land support code candidate area is set (step S12-1). The land support code candidate area is a candidate for the land
h · k min — R <W R <h · k max — R , (1)
Here, h is the height of the lower
陸支コード候補領域19の設定に続いて、図5に示されているように、陸支コード領域12の決定及び陸支コードの認識が行われる(ステップS12−2)。より具体的には、図8に示されているように、陸支コード候補領域19の画像のそれぞれについて陸支コード用テンプレート7に格納されたテンプレート画像を用いたパターン認識が行われ、最近接クラス(即ち、最も相違度Sが小さくなる陸支コードクラス)、及び、その相違度Sが算出される。陸支コード候補領域19のうち、最も相違度が小さくなるものが陸支コード領域12として決定され、その陸支コード候補領域19について決定された最近接クラスが最終的に求めるべき陸支コードとして決定される。図7の例では、最も相違度Sを小さくする陸支コード候補領域194が、陸支コード領域12として決定され、その陸支コード候補領域194に対応する最近接クラス「品川」が最終的に求めるべき陸支コードと決定される。
Following the setting of the land support
陸支コードは、一般に複数の文字で構成されるが、本実施の形態の画像処理装置2は、陸支コードを全体として1つの文字として取り扱うことに留意されたい。本実施の形態でいう「1文字」とは、1つのテンプレート画像に写されている図形を意味している。
Although the land support code is generally composed of a plurality of characters, it should be noted that the
4.車種コードの認識
図5に示されているように、陸支コードの認識の後、車種コードの認識が行われる(ステップS13)。
4). Recognition of vehicle type code As shown in FIG. 5, after the land code is recognized, the vehicle type code is recognized (step S13).
車種コードの認識は、まず、車種コード領域13を決定することで開始される(ステップS13−1)。図9に示されているように、車種コード領域13は、陸支コードの認識処理において決定された陸支コード領域12から決定される。より具体的には、陸支コード領域12からの距離が所定の範囲にある一の文字切り出し位置候補18が、車種コード領域13の左端として決定され、小文字列画像11の右端が車種コード領域13の右端として決定される。
The recognition of the vehicle type code is first started by determining the vehicle type code area 13 (step S13-1). As shown in FIG. 9, the vehicle
続いて、決定された車種コード領域13に対して車種コード領域配置候補が設定される(ステップS13−2)。車種コード領域配置候補とは、車種コード領域13における文字領域14〜16の配置の候補である。車種コードが2文字又は3文字から構成されることから、2文字の車種コードに対応する車種コード領域配置候補と、3文字の車種コードに対応する車種コード領域配置候補の2種類が決定される。図10に示されているように、3文字の車種コードに対応する車種コード領域配置候補は、第1文字候補領域21、第2文字候補領域22及び第3文字候補領域23の組み合わせで表現される。ここで、第1文字候補領域21とは、車種コードの第1文字目が存在する第1文字領域14の候補であり、第2文字候補領域22とは、車種コードの第2文字目が存在する第2文字領域15の候補であり、第3文字候補領域23とは、車種コードの第3文字目が存在する第3文字領域16の候補である。文字候補領域21〜23の両端は、2つの文字切り出し位置候補18によって規定される。同様に、2文字の車種コードに対応する車種コード領域配置候補は、第1文字候補領域21及び第2文字候補領域22の組み合わせで表現される。
Subsequently, a vehicle type code area arrangement candidate is set for the determined vehicle type code area 13 (step S13-2). The vehicle type code area arrangement candidate is a candidate for arrangement of the
車種コード領域配置候補の決定は、具体的には、文字切り出し位置候補18を、第1文字候補領域21、第2文字候補領域22、第3文字候補領域23の始点(左端)及び終点(右端)に対応付けることによって行われる。一例として、図10に示されているように、車種コード領域13の位置”1”〜”6”に対して6つの文字切り出し位置候補181〜186が存在する場合を考える。例えば、ある車種コード領域配置候補では、文字切り出し位置候補181、182が、それぞれ、第1文字候補領域21の始点(左端)及び終点(右端)にそれぞれ対応付けられ、文字切り出し位置候補182、183が第2文字候補領域22の始点及び終点にそれぞれ対応付けられ、文字切り出し位置候補183、184が、第3文字候補領域23の始点及び終点にそれぞれ対応付けられる。他の車種コード領域配置候補では、図11に示されているように、異なる対応付けが行われる。図11の例では、文字切り出し位置候補181、182が、それぞれ、第1文字候補領域21の始点(左端)及び終点(右端)にそれぞれ対応付けられ、文字切り出し位置候補183、184が第2文字候補領域22の始点及び終点にそれぞれ対応付けられ、文字切り出し位置候補185、186が、第3文字候補領域23の始点及び終点にそれぞれ対応付けられる。
Specifically, the determination of the vehicle type code area arrangement candidate is performed by setting the character
ただし、車種コード領域配置候補は、それに含まれる第1文字候補領域21、第2文字候補領域22及び第3文字候補領域23それぞれの幅W1、W2,W3が、いずれも最小文字幅Wmin_N以上、最大文字幅Wmax_N以下であるように決定される。ここで、最小文字幅Wmin_N、最大文字幅Wmax_Nは、下記式で表される定数である:
Wmin_N=h×kmin_N, ・・・(2a)
Wmax_N=h×kmax_N, ・・・(2b)
ここで、hは、小文字列画像11の高さであり、kmin_N、kmax_Nは、所定のパラメータである。このような文字候補領域21〜23の組み合わせの決定方法は、車種コードとなり得る文字(即ち、数字)の縦横比が、ある一定の範囲に収まることを基礎としている。車種コードを構成する文字の縦横比として想定できないような縦横比を有する文字候補領域を含む車種コード領域配置候補は設定されない。これは、車種コード領域配置候補の数を減らし、これによって演算量を減らすために有効である。
However, the vehicle type code area arrangement candidates include the width W 1 , W 2 , and W 3 of the first
W min — N = h × k min — N , (2a)
W max — N = h × k max — N , (2b)
Here, h is the height of the
例えば、図12に示されているように、幅を考慮しなければ、5つの文字候補領域が第1文字候補領域として設定され得る;しかし、上記の幅の制限により、始点が位置”1”であり終点が位置”2”である文字候補領域(1)、及び始点が位置”1”であり終点が位置”3”である文字候補領域(2)のみが、第1文字候補領域21として許容される。
For example, as shown in FIG. 12, if the width is not considered, five character candidate regions can be set as the first character candidate regions; however, the start point is located at the position “1” due to the above width limitation. And the character candidate region (1) whose end point is the position “2” and the character candidate region (2) whose start point is the position “1” and whose end point is the position “3” are the first
加えて、車種コード領域配置候補は、それに含まれる文字候補領域21〜23の全てについて、第i文字候補領域の左端が、車種コード領域13の左端からの距離が(i−1)×Wmin_N以上の位置にあり、第i文字候補領域の右端が、車種コード領域13の左端からの距離がi×Wmax_N以下の位置にあるように決定される。例えば、図13に示されているように、第2文字候補領域22は、車種コード領域13の左端からの距離がWmin_N以上である位置にその左端が位置しており、距離が2×Wmax_N以下である位置にその右端が位置するように決定される。これは、第1文字候補領域21、第2文字候補領域22及び第3文字候補領域23のいずれか一つでもが妥当でない位置に存在するような車種コード領域配置候補を排除するためである。
In addition, the vehicle type code region arrangement candidate is such that, for all of the
例えば、図12の例では、これらの条件を満足するように車種コード領域配置候補が決定されると、文字候補領域(1)、(2)が第1文字候補領域21として、文字候補領域(3)〜(6)が第2文字候補領域22として、文字候補領域(5)〜(9)が第3文字候補領域23として決定されることになる。車種コード領域配置候補は、このようにして決められた第1文字候補領域21、第2文字候補領域22及び第3文字候補領域23の組み合わせである。
For example, in the example of FIG. 12, when the vehicle type code area arrangement candidate is determined so as to satisfy these conditions, the character candidate areas (1) and (2) are set as the first
続いて、図5に示されているように、車種コード領域配置候補のそれぞれについて、評価値φstringが算出される(ステップS13−3)。車種コード領域配置候補の評価値φstringは、各文字候補領域の「文字らしさ」を表す文字らしさ評価値φcharと、隣接する文字候補領域の間の「隙間らしさ」を表す隙間らしさ評価値φgapの総和で表される。文字らしさ評価値φcharは、対応する文字候補領域の画像が「文字らしい」ほど増大し、「文字らしくない」ほど減少する値である。一方、隙間らしさ評価値φgapは、隣接する2つ文字候補領域の間の領域が「隙間らしくない」(例えば、隙間としては狭すぎる、又は広すぎる)ほど減少される値である。より具体的には、3文字の車種コードに対応している車種コード領域配置候補の評価値φstringは、下記式:
φstring=φ1 char+φ12 gap+φ2 char+φ23 gap+φ3 char,・・・(3a)
によって算出される。ここで、φi charは、第i文字候補領域の文字らしさ評価値であり、φij gapは、第i文字候補領域と第j文字候補領域とについて算出された隙間らしさ評価値である。一方、2文字の車種コードに対応している車種コード領域配置候補の評価値φstringは、下記式:
φstring=φ1 char+φ12 gap+φ2 char,・・・(3b)
によって算出される。
Subsequently, as illustrated in FIG. 5, the evaluation value φ string is calculated for each of the vehicle type code area arrangement candidates (step S13-3). The evaluation value φ string of the vehicle type code region arrangement candidate is a character likelihood evaluation value φ char representing “character character” of each character candidate region and a character likelihood evaluation value φ representing “gap character” between adjacent character candidate regions. It is expressed as the sum of gaps . The character-likeness evaluation value φ char is a value that increases as the image of the corresponding character candidate region “looks like a character” and decreases as “not like a character”. On the other hand, the gap-likeness evaluation value φgap is a value that decreases as the area between two adjacent character candidate areas is “not like a gap” (for example, too narrow or too wide as a gap). More specifically, evaluation value phi string models coding region arrangement candidates that correspond to the three letter models code is represented by the following formula:
φ string = φ 1 char + φ 12 gap + φ 2 char + φ 23 gap + φ 3 char , (3a)
Is calculated by Here, φ i char is a character likelihood evaluation value of the i-th character candidate area, and φ ij gap is a gap likelihood evaluation value calculated for the i-th character candidate area and the j-th character candidate area. On the other hand, the evaluation value φ string of the vehicle type code area arrangement candidate corresponding to the 2-character vehicle type code is expressed by the following formula:
φ string = φ 1 char + φ 12 gap + φ 2 char , (3b)
Is calculated by
第i文字候補領域の文字らしさ評価値φi charの算出は、下記の3つの手順で行われる:まず、第i文字候補領域の画像について文字認識が行われ、最近接文字クラス、及び、その相違度Siが算出される。例えば、図14に示されているように、第1文字候補領域21の左端が文字切り出し位置候補181、右端が文字切り出し位置候補182である場合、第1文字候補領域21には、「1」の文字が完全な状態で含まれる。このような場合、最近接文字クラスとして「1」が選択され、更に、小さな相違度が与えられる。一方、第1文字候補領域21の左端が文字切り出し位置候補181、右端が文字切り出し位置候補183である場合には、第1文字候補領域21には「1」の文字及び「8」の文字の左半分が含まれる。このような場合には、最近接文字クラスとして不適切なクラスが選択され、大きな相違度が与えられる。
The character likelihood evaluation value φ i char of the i-th character candidate region is calculated in the following three steps: First, character recognition is performed on the image of the i-th character candidate region, the closest character class, and The dissimilarity S i is calculated. For example, as illustrated in FIG. 14, when the left end of the first
更に、第i文字候補領域の文字幅減点値Pi charが算出される。文字幅減点値Pi charとは、第i文字候補領域の幅Wiが、文字が存在する文字領域の幅として妥当でない場合に増大される数値であり、具体的には、下記式:
Pi char=c1(Wmin_char−Wi), (Wi<Wmin_charの場合)・・・(4a)
Pi char=c2(Wi−Wmax_char), (Wmax_char<Wiの場合)・・・(4b)
Pi char=0, (Wmin_char≦Wi≦Wmax_charの場合)・・・(4c)
で定められる。ここで、c1,c2は、重みパラメータであり、Wmin_char、Wmax_charは、それぞれ、「文字らしい」画像が含まれている文字候補領域の幅の下限値、及び上限値を表すパラメータであり、下記式で決定される:
Wmin_char=h・kmin_char,
Wmax_char=h・kmax_char,
ただし、hは、小文字列画像の高さであり、kmin_char、kmax_charは、所定の定数である。このような文字幅減点値Pi charの決定方法は、文字領域14〜16の縦横比が、ある一定の範囲に収まることを基礎としている。文字領域14〜16の縦横比として想定できないような縦横比を有する文字候補領域は設定されない。
Further, a character width deduction point P i char of the i-th character candidate area is calculated. The character width deduction value P i char is a numerical value that is increased when the width W i of the i-th character candidate region is not valid as the width of the character region in which the character exists, and specifically, the following formula:
P i char = c 1 (W min — char −W i ), (W i <W min — char ) (4a)
P i char = c 2 (W i −W max_char ), (in the case of W max_char <W i ) (4b)
P i char = 0, (the case of W min_char ≦ W i ≦ W max_char ) ··· (4c)
Determined by Here, c 1 and c 2 are weight parameters, and W min_char and W max_char are parameters respectively indicating a lower limit value and an upper limit value of the width of a character candidate area including a “character-like” image. Yes, determined by:
W min_char = h · k min_char ,
W max_char = h · k max_char ,
However, h is the height of the lowercase string image, k min_char, k max_char is a predetermined constant. Such a method for determining the character width deduction point P i char is based on the fact that the aspect ratio of the
図15を参照して、第i文字候補領域の幅Wiが、Wmin_char以上Wmax_char以下である場合には、文字幅減点値Pi charは0である。一方、第i文字候補領域の幅WiがWmin_charよりも小さい場合には第i文字候補領域の画像が文字らしくないと判断され、文字幅減点値Pi charがWmin_charと幅Wiとの差に応じて増大される。同様に、第i文字候補領域の幅Wiが、Wmax_charよりも大きい場合には第i文字候補領域の画像が文字らしくないと判断され、文字幅減点値Pi charが幅WiとWmax_charとの差に応じて増大される。 Referring to FIG. 15, when the width W i of the i-th character candidate region is not less than W min_char and not more than W max_char , the character width deduction point P i char is 0. On the other hand, if the width W i of the i-th character candidate region is smaller than W min_char , it is determined that the image of the i-th character candidate region does not look like a character, and the character width deduction point P i char is set to W min_char and the width W i . It is increased in accordance with the difference. Similarly, if the width W i of the i-th character candidate area is larger than W max_char , it is determined that the image of the i-th character candidate area does not look like a character, and the character width deduction point P i char is set to the widths W i and W Increased according to the difference from max_char .
文字らしさ評価値φi charは、最小相違度Siが増大するほど、また、文字幅減点値Pi charが増大するほど小さくなるように決定される。例えば、文字らしさ評価値φi charは、下記式:
φi char=C−Si−Pi char, ・・・(5)
によって算出され得る。ここでCは、定数である。式(5)から理解されるように、文字らしさ評価値φi charは、第i文字候補領域の幅Wiを加味した値になる。相違度のみならず第i文字候補領域の幅Wiを用いて文字らしさ評価値φi charを算出することは、第i文字候補領域の「文字らしさ」を簡便に、且つ、適切に評価するために有効である。
The character likelihood evaluation value φ i char is determined so as to decrease as the minimum dissimilarity S i increases and as the character width deduction point P i char increases. For example, the character-likeness evaluation value φ i char is expressed by the following formula:
φ i char = C−S i −P i char , (5)
Can be calculated by: Here, C is a constant. As understood from the equation (5), the character likelihood evaluation value φ i char is a value in consideration of the width W i of the i-th character candidate region. Calculating the character-likeness evaluation value φ i char using not only the degree of difference but also the width W i of the i-th character candidate region simply and appropriately evaluates the “character-likeness” of the i-th character candidate region. It is effective for.
文字らしさ評価値φi charの算出の際に起こり得る一つの問題は、「0」、「8」等の数字の中間に文字切り出し位置候補18が存在し、その結果、文字候補領域の画像として「0」、「8」等の数字が縦に半分に切断された画像が存在しうることである。このような画像は、図16に示されているように、最近接文字クラスが「1」であると誤って認識され、且つ、その相違度が小さくなる可能性がある。このような事態を回避するためには、文字らしさ評価値φi charの算出のときに行われる第i文字候補領域の文字認識の手順は、図17に示されているようなフローで行われることが好適である。
One problem that may occur when calculating the character-likeness evaluation value φ i char is that the character
まず、車種コード用テンプレート8を用いて第i文字候補領域の文字認識が行われ、最近接クラスと最小相違度Siとが取得される(ステップS21)。文字認識によって得られた最近接クラスが「1」である場合には(ステップS22)、当該第i文字候補領域を左右に数画素広げた領域が設定され(ステップS23)、設定されたその領域について、車種コード用テンプレート8を用いて再度に文字認識が行われる(ステップS24)。これは、図17から理解されるように、第i文字候補領域を左右に数画素広げた領域を使用することにより、第i文字候補領域が本当に「1」を含んでいるのか、或いは、「0」、「8」等の数字が縦に半分に切断された画像を含んでいるのかを判別できるからである。ステップS24で得られた最近接文字クラスが再度に「1」であった場合には(ステップS25)、ステップS21において得られた最小相違度Siが採用され、文字らしさ評価値φi charの算出が行われる。一方、ステップS24で得られた最近接クラスが「1」でない場合には当該第i文字候補領域を含む車種コード領域配置候補が無効化される(ステップS26)。より具体的には、ステップS24で得られた最近接クラスが「1」でない場合には第i文字候補領域の最小相違度Siが、非常に大きな所定の数に書き換えられる。これにより、文字らしさ評価値φi charが小さくなり、当該第i文字候補領域を含む車種コード領域配置候補の評価値φstringが小さくなる。これにより、当該第i文字候補領域を含む車種コード領域配置候補が無効化され(即ち、当該車種コード領域配置候補が最適な車種コード領域配置候補として選択されなくなり)、誤った文字認識が行われる確率を減らすことができる。
First, character recognition of the i-th character candidate area is performed using the vehicle
一方、第i文字候補領域と第j文字候補領域との隙間の隙間らしさ評価値φij gapは、図18に示されているように、第i文字候補領域と第j文字候補領域との隙間の幅Wij gapに依存する隙間減点値Pij gapから算出される。隙間減点値Pij gapとは、第i文字候補領域と第j文字候補領域との隙間の幅Wij gapが、隙間として妥当でない場合に増大される数値であり、具体的には、下記式:
Pij gap=cgap(Wmin_gap−Wij gap),
(Wij gap<Wmin_gapの場合)・・・(6a)
Pij gap=cgap(Wi−Wmax_char),
(Wmax_gap<Wij gapの場合)・・・(6b)
Pij gap=0, (Wmin_gap≦Wij gap≦Wmax_gapの場合)・・・(6c)
で定められる。ここで、cgapは、所定のパラメータであり、また、Wmin_gap、Wmax_gapは、それぞれ、「文字らしい」画像が含まれている文字候補領域の幅の下限値、及び上限値を表すパラメータであり、下記式によって定められる:
Wmin_gap=h・kmin_gap,
Wmax_gap=h・kmax_gap,
ただし、hは、小文字列画像の高さであり、kmin_gap、kmax_gapは、所定の定数である。このような隙間らしさ評価値φij gapの決定方法は、文字領域14〜16の間の隙間の縦横比が、ある一定の範囲に収まることを基礎としている。文字領域14〜16の隙間の縦横比として想定できないような縦横比を有する隙間がある場合には、隙間減点値Pij gapが増大される。
On the other hand, the gap-likeness evaluation value φ ij gap between the i-th character candidate area and the j-th character candidate area is, as shown in FIG. 18, a gap between the i-th character candidate area and the j-th character candidate area. It is calculated from the gap deduction point value P ij gap depending on the width W ij gap of. The gap deduction value P ij gap is a numerical value that is increased when the width W ij gap of the gap between the i-th character candidate area and the j-th character candidate area is not valid as a gap. :
P ij gap = c gap (W min —gap −W ij gap ),
(W ij gap <W min_gap ) (6a)
P ij gap = c gap (W i −W max_char ),
(In the case of W max_gap <W ij gap) ··· (6b)
P ij gap = 0, (when W min_gap ≦ W ij gap ≦ W max_gap ) (6c)
Determined by Here, c gap is a predetermined parameter, and W min_gap and W max_gap are parameters respectively indicating a lower limit value and an upper limit value of the width of the character candidate area including the “character-like” image. Yes, determined by the following formula:
W min_gap = h · k min_gap ,
W max_gap = h · k max_gap ,
However, h is the height of the lowercase string image, k min_gap, k max_gap is a predetermined constant. Such a method of determining the evaluation value φ ij gap of the gap is based on the fact that the aspect ratio of the gap between the
隙間らしさ評価値φij gapは、隙間減点値Pij gapが増大するほど小さくなるように決定される。例えば、隙間らしさ評価値φij gapは、下記式:
φij gap=−Pij gap, ・・・(7)
によって算出され得る。式(7)から理解されるように、隙間らしさ評価値φij gapは、第i文字候補領域と第j文字候補領域との隙間の幅Wij gapに依存する値である。隙間の幅Wij gapを用いて隙間らしさ評価値φij gapを算出することは、第i文字候補領域と第j文字候補領域との隙間の「隙間らしさ」を簡便に、且つ、適切に評価するために有効である。
The gap likelihood evaluation value φ ij gap is determined so as to decrease as the gap deduction point value P ij gap increases. For example, the clearance likelihood evaluation value φ ij gap is given by the following formula:
φ ij gap = −P ij gap , (7)
Can be calculated by: As understood from the equation (7), the gap likelihood evaluation value φ ij gap is a value depending on the width W ij gap of the gap between the i-th character candidate region and the j-th character candidate region. The calculation of the gap likelihood evaluation value φ ij gap using the gap width W ij gap easily and appropriately evaluates the “gap likelihood” of the gap between the i-th character candidate area and the j-th character candidate area. It is effective to do.
以上の手順により、文字らしさ評価値φi charと隙間らしさ評価値φij gapとが算出され、更に式(3a)(3b)を用いて評価値φstringが算出された後、算出された評価値φstringから、3文字の車種コードに対応する車種コード領域配置候補のうちで最適な車種コード領域配置候補と、2文字の車種コードに対応する車種コード領域配置候補のうちで最適な車種コード領域配置候補とが決定される(ステップS13−4)。式(3a)から算出された評価値φstringを最も大きくする車種コード領域配置候補が、3文字の車種コードに対応する車種コード領域配置候補のうちで最適な車種コード領域配置候補であると決定される。同様に、式(3b)から算出された評価値φstringを最も大きくする車種コード領域配置候補が、2文字の車種コードに対応する車種コード領域配置候補のうちで最適な車種コード領域配置候補であると決定される。 By the above procedure, the character likelihood evaluation value φ i char and the gap likelihood evaluation value φ ij gap are calculated, and further, the evaluation value φ string is calculated using the equations (3a) and (3b), and then the calculated evaluation is calculated. From the value φ string , the optimal vehicle type code area arrangement candidate among the vehicle type code area arrangement candidates corresponding to the 3-character vehicle type code and the optimal vehicle type code among the vehicle type code area arrangement candidates corresponding to the 2-character vehicle type code A region arrangement candidate is determined (step S13-4). The vehicle type code area arrangement candidate that maximizes the evaluation value φ string calculated from the equation (3a) is determined to be the optimum vehicle type code area arrangement candidate among the vehicle type code area arrangement candidates corresponding to the three-character vehicle type code. Is done. Similarly, the vehicle type code region arrangement candidate that maximizes the evaluation value φ string calculated from the expression (3b) is the optimum vehicle type code region arrangement candidate among the vehicle type code region arrangement candidates corresponding to the two-character vehicle type code. Determined to be.
全ての車種コード領域配置候補について個別に評価値φstringを算出し、算出された評価値φstringから(2文字の車種コード、及び3文字の車種コードのそれぞれについて)最適な車種コード領域配置候補を選択することは、可能ではあるが演算量を過剰に増大させ得る。車種コード領域配置候補の評価値を算出するために必要な演算量を小さくするためには、最適な車種コード領域配置候補の決定にDPマッチングが採用されることが好ましい。DPマッチングを採用することにより、演算の重複を避け、少ない演算量で車種コード領域配置候補の評価値φstringを算出することができる。 The evaluation value φ string is calculated individually for all the vehicle type code area arrangement candidates, and the optimal vehicle type code area arrangement candidate (for each of the two-character vehicle code and the three-character vehicle code) is calculated from the calculated evaluation value φ string. However, it is possible to excessively increase the calculation amount. In order to reduce the amount of calculation required for calculating the evaluation value of the vehicle type code area arrangement candidate, it is preferable to employ DP matching for determining the optimal vehicle type code area arrangement candidate. By adopting DP matching, it is possible to avoid the duplication of calculation and calculate the evaluation value φ string of the vehicle type code area arrangement candidate with a small calculation amount.
図10(及び図11)を参照して、本実施の形態のDPマッチングでは、車種コード領域配置候補(即ち、文字切り出し位置候補181〜186と第1〜第3文字候補領域21〜23との対応付け)が、文字切り出し位置候補18に対応するA軸と、第1〜第3文字候補領域21〜23の始点及び終点に対応するB軸とからなる座標系上に展開された対応グラフとして表現される。A軸上の要素a1〜a6は、車種コード領域13に属する文字切り出し位置候補181〜186に対応しており、B軸上の要素b1〜b6は、第1文字候補領域21、第2文字候補領域22及び第3文字候補領域23の始点及び終点に対応している;A軸上の要素ajの数は、車種コード領域13に属する文字切り出し位置候補18の数に合わせて調節されることに留意されたい。各対応グラフは、原点(a1,b1)から座標(aend,b4)までの経路(2文字の車種コードに対応する場合)、又は、原点(a1,b1)から座標(aend,b6)までの経路である;ここで、aendは、対応グラフの終点のA軸上の要素であり、第2文字候補領域22又は第3文字候補領域23の終点として選ばれた文字切り出し位置候補18に対応する要素である。
Referring to FIG. 10 (and FIG. 11), in the DP matching according to the present embodiment, vehicle type code region arrangement candidates (that is, character cut-out
原点(a1,b1)から座標(aj,bi)までの対応グラフに対応する車種コード領域配置候補の評価値φstringの最大値をΦ(aj,bi)と表すものとすれば、
Φ(aj,bi)=MAX(ak,bp)[Φ(ak,bp)
+φ(i)(ak,bp,aj,bi)],・・・(8)
が成立する。ここで、bpは、biの一つ前の要素であり、
bp=bi−1, ・・・(9)
である。また、MAX(ak,bp)[X(ak,bp)]は、ak、bpを変化させたときのX(ak,bp)の最大値を表す。更に、φ(i)(ak,bp,aj,bi)は、
(α)iが奇数のとき、要素ak,ajに対応する文字切り出し位置候補の間に形成される隙間の隙間らしさ評価値φgapであり、
(β)iが偶数のとき、要素ak,ajに対応する文字切り出し位置候補の間の文字候補領域の文字らしさ評価値φcharである。
また、bi=b1のときには、特別に、Φ=0と決定される。
Φ (a j , b i ) = MAX (a k , b p ) [Φ (a k , b p )
+ Φ (i) (a k , b p , a j , b i )], (8)
Is established. Here, b p is the previous element of the b i,
b p = b i−1 , (9)
It is. MAX (a k , b p ) [X (a k , b p )] represents the maximum value of X (a k , b p ) when a k and b p are changed. Furthermore, φ (i) (a k , b p , a j , b i ) is
(Α) When i is an odd number, a gap likelihood evaluation value φ gap of a gap formed between character cutout position candidates corresponding to the elements a k and a j ,
(Β) When i is an even number, the character likelihood evaluation value φ char of the character candidate area between the character cutout position candidates corresponding to the elements a k and a j .
Further, when b i = b 1 , it is determined that Φ = 0.
このΦ(aj,bi)は、biの漸化式となっているため、座標(a1,b1)(即ち、原点)からスタートして座標(a6,b6)まで、順次にΦ(aj,bi)を決定することができる。加えて、Φ(aj,bi)を決定するとき、Φ(ak,bp)+φ(i)(ak,bp,aj,bi)を最大にする座標(ak,bp)が、座標(aj,bi)と対応付けられて保存される。具体的には、座標(aj,bi)から座標(ak,bp)へのポインタが記憶装置に保存される。 Since this Φ (a j , b i ) is a recurrence formula of b i , starting from the coordinates (a 1 , b 1 ) (that is, the origin) to the coordinates (a 6 , b 6 ), Φ (a j , b i ) can be determined sequentially. In addition, when Φ (a j , b i ) is determined, the coordinates (a k , b p ) + φ (i) (a k , b p , a j , b i ) that maximize Φ (a k , b p ) + φ (i) b p ) is stored in association with the coordinates (a j , b i ). Specifically, a pointer from the coordinates (a j , b i ) to the coordinates (a k , b p ) is stored in the storage device.
このような方法によって、上述の処理によって決定された車種コード領域配置候補に対応するj,iの組み合わせのそれぞれについてΦ(aj,bi)が算出される。算出されたΦ(aj,bi)を用いて、下記の方法により、最適な対応グラフ、即ち、最適な車種コード領域配置候補が、2文字の車種コード、3文字の車種コードのそれぞれについて決定される。2文字の車種コードに対応する対応グラフの決定では、まず、Φ(ak,b4)の最大値が求められ、Φ(ak,b4)を最大にする対応グラフが、最適な対応グラフとして選択される。Φ(ak,b4)を最大にする対応グラフは、上述のポインタから決定可能である。同様に、3文字の車種コードに対応する最適な対応グラフの決定では、まず、Φ(ak,b6)の最大値が求められ、Φ(ak,b6)を最大にする対応グラフが、最適な対応グラフとして選択される。Φ(ak,b6)を最大にする対応グラフは、上述のポインタから決定可能である。 By such a method, Φ (a j , b i ) is calculated for each combination of j and i corresponding to the vehicle type code area arrangement candidate determined by the above-described processing. Using the calculated Φ (a j , b i ), an optimal correspondence graph, that is, an optimal vehicle type code area arrangement candidate is obtained for each of the 2-character vehicle type code and the 3-character vehicle type code by the following method. It is determined. In the determination of the corresponding graph corresponding to two-letter models code, first, Φ (a k, b 4 ) the maximum value of is determined, the corresponding graph [Phi the (a k, b 4) to the maximum, optimum response Selected as a graph. The correspondence graph that maximizes Φ (a k , b 4 ) can be determined from the pointers described above. Similarly, in the determination of the optimal response graph corresponding to the three letter models code, first, Φ (a k, b 6 ) the maximum value of is determined, the corresponding graph to maximize [Phi the (a k, b 6) Is selected as the optimal correspondence graph. The correspondence graph that maximizes Φ (a k , b 6 ) can be determined from the pointers described above.
図5に示されているように、3文字の車種コードについての最適な車種コード領域配置候補と、2文字の車種コードについての最適の車種コード領域配置候補とが決定された後、車種コード領域13の文字数、即ち、いずれの車種コード領域配置候補が最適であるかが最終的に決定される(ステップS13−5)。 As shown in FIG. 5, after the optimal vehicle type code area arrangement candidate for the 3-character vehicle type code and the optimal vehicle type code area arrangement candidate for the 2-character vehicle code are determined, the vehicle type code area The number of characters of 13, that is, which vehicle type code area arrangement candidate is optimal is finally determined (step S13-5).
ステップS13−5における最適な車種コード領域配置候補の決定では、まず、文字の車種コードについての最適な車種コード領域配置候補と、2文字の車種コードについての最適の車種コード領域配置候補とのそれぞれが、有効であるかが判定される。具体的には、2つの車種コード領域配置候補について下記の4つの項目がチェックされ、いずれか一つでも該当する場合には、当該車種コード領域配置候補が無効であると判断される。 In the determination of the optimal vehicle type code area arrangement candidate in step S13-5, first, each of the optimal vehicle type code area arrangement candidate for the character vehicle type code and the optimal vehicle type code area arrangement candidate for the 2-character vehicle type code, respectively. Is determined to be valid. Specifically, the following four items are checked for two vehicle type code area arrangement candidates, and if any one of them corresponds, it is determined that the vehicle type code area arrangement candidate is invalid.
(1)極端に文字らしさ評価値が小さい文字候補領域が存在する
図19Aを参照して、第1文字候補領域21、第2文字候補領域22、及び存在する場合には第3文字候補領域23に、極端に文字らしさ評価値φcharが小さいものが含まれている場合には、当該車種コード領域配置候補が無効であると判定される。具体的には、第i文字候補領域の文字らしさ評価値φi charの文字らしさ平均値φmean_charに対する比率が所定値よりも小さい場合、第i文字候補領域の文字らしさ評価値φi charが極端に小さいと判断され、対応する車種コード領域配置候補が無効であると判定される;平均値φmean_charとは、下記式で定義される値である:
より具体的には、下記式が成立する場合に、第i文字候補領域の文字らしさ評価値φi charが極端に小さいと判断される:
φi char<α・φmean_char, ・・・(11)
ここで、αは、1より小さい所定のパラメータである。図19の例では、第2文字候補領域22の文字らしさ評価値φi charが極端に小さいため、当該車種コード領域配置候補が無効であると判定される。
More specifically, it is determined that the character-likeness evaluation value φ i char of the i-th character candidate region is extremely small when the following formula is satisfied:
φ i char <α · φ mean_char , (11)
Here, α is a predetermined parameter smaller than 1. In the example of FIG. 19, since the character likelihood evaluation value φ i char of the second
(2)文字幅のバランスが悪い
図19Bを参照して、第1文字候補領域21、第2文字候補領域22、及び存在する場合には第3文字候補領域23の文字幅のバランスが悪い場合には、当該車種コード領域配置候補が無効であると判定される。文字幅のバランスは、文字幅(即ち、文字候補領域の幅)の最大値と、文字幅の最小値との比率に基づいて判断される。より具体的には、2文字の車種コードに対応している車種コード配置候補については、下記条件を満足する場合に文字幅のバランスが悪いと判断される:
WMAX/WMIN>β, ・・・(12a)
WMAX=max(W1,W2), ・・・(12b)
WMIN=min(W1,W2), ・・・(12c)
ここでWiは、第i文字候補領域の幅であり、βは、1より大きい所定のパラメータである。
(2) Poor character width balance Referring to FIG. 19B, character width of first
W MAX / W MIN > β, (12a)
W MAX = max (W 1 , W 2 ), (12b)
W MIN = min (W 1 , W 2 ), (12c)
Here, Wi is the width of the i-th character candidate region, and β is a predetermined parameter larger than 1.
同様に、3文字の車種コードに対応している車種コード配置候補については、下記条件を満足する場合に文字幅のバランスが悪いと判断される:
WMAX/WMIN>β, ・・・(12d)
WMAX=max(W1,W2,W3), ・・・(12e)
WMIN=min(W1,W2,W3). ・・・(12f)
Similarly, for the vehicle type code arrangement candidate corresponding to the 3-character vehicle type code, it is determined that the balance of the character width is bad when the following conditions are satisfied:
W MAX / W MIN > β, ... (12d)
W MAX = max (W 1 , W 2 , W 3 ), (12e)
W MIN = min (W 1 , W 2 , W 3 ). ... (12f)
例えば、図19Bの例では、第1文字候補領域21の幅が第2文字候補領域22の幅と比べて極端に狭く、文字幅のバランスが悪いと判断される。
For example, in the example of FIG. 19B, it is determined that the width of the first
(3)文字幅に比べて極端に大きい隙間が存在する
図19Cを参照して、ある一対の文字候補領域の間の隙間が、各文字候補領域の文字幅と比較して極端に大きい場合には、当該車種コード領域配置候補が無効であると判定される。文字幅と隙間の幅のバランスは、隙間の幅の最大値と、文字幅の最小値との比率に基づいて判断される。
(3) An extremely large gap exists compared to the character width Referring to FIG. 19C, when the gap between a pair of character candidate areas is extremely large compared to the character width of each character candidate area Is determined that the vehicle type code area arrangement candidate is invalid. The balance between the character width and the gap width is determined based on the ratio between the maximum gap width value and the minimum character width value.
より具体的には、2文字の車種コードに対応している車種コード配置候補については、下記条件を満足する場合に文字幅のバランスが悪いと判断される:
W12 gap/WMIN>γ, ・・・(13a)
WMIN=min(W1,W2), ・・・(13b)
ここで、W12 gapは、第1文字候補領域21と第2文字候補領域22との間の隙間の幅であり、γは、所定のパラメータである。2文字の車種コードに対応している車種コード配置候補については、隙間は1つしかないことに留意されたい。
More specifically, a vehicle type code arrangement candidate corresponding to a two-character vehicle type code is determined to have a poor character width balance when the following conditions are satisfied:
W 12 gap / W MIN > γ, (13a)
W MIN = min (W 1 , W 2 ), (13b)
Here, W 12 gap is the width of the gap between the first
一方、3文字の車種コードに対応している車種コード配置候補については、下記条件を満足する場合に文字幅のバランスが悪いと判断される:
WG_MAX/WMIN>γ, ・・・(13c)
WG_MAX=max(W12 gap,W23 gap), ・・・(13d)
WMIN=min(W1,W2,W3), ・・・(13e)
ここで、Wij gapは、第i文字候補領域と第j文字候補領域の間の隙間の幅である。
On the other hand, for vehicle type code arrangement candidates corresponding to the 3-character vehicle type code, it is determined that the balance of the character width is poor when the following conditions are satisfied:
W G — MAX / W MIN > γ, (13c)
W G_MAX = max (W 12 gap ,
W MIN = min (W 1 , W 2 , W 3 ), (13e)
Here, W ij gap is the width of the gap between the i-th character candidate region and the j-th character candidate region.
例えば図19Cの例では、第1文字候補領域21と第2文字候補領域22の間の隙間が、第1文字候補領域21の幅W1(=WMIN)と比して極端に大きいと判断される。
For example, in the example of FIG. 19C, it is determined that the gap between the first
(4)隙間の領域に、文字らしさ評価値の大きい画像が存在する
図19Dを参照して、ある一対の文字候補領域の間の隙間に、文字らしい画像が存在する場合には、当該車種コード領域配置候補が無効であると判定される。まず、文字候補領域の間の隙間のそれぞれについて、文字候補領域と同様の処理によって文字らしさ評価値が算出される。隙間の文字らしさ評価値が、上述の文字らしさ平均値φmean_charと対比できる程度に大きい場合には、当該車種コード領域配置候補が無効であると判定される。より具体的には、第i文字候補領域と第j文字候補領域との間の隙間が、下記式を成立させる場合には、当該隙間の領域に文字らしさの大きい画像が存在すると判断される:
φij gap_char>δ・φmean_char, ・・・(14)
ここで、φij gap_charは、第i文字候補領域と第j文字候補領域との間の隙間について算出された文字らしさ評価値であり、δは、所定のパラメータである。
(4) An image with a large character-likeness evaluation value exists in the gap area Referring to FIG. 19D, if an image that seems to be a character exists in a gap between a pair of character candidate areas, the vehicle type code It is determined that the region arrangement candidate is invalid. First, for each of the gaps between character candidate areas, a character likelihood evaluation value is calculated by the same processing as that for the character candidate areas. When the character likelihood evaluation value of the gap is large enough to be compared with the above-described character likelihood average value φ mean_char , it is determined that the vehicle type code area arrangement candidate is invalid. More specifically, when the gap between the i-th character candidate area and the j-th character candidate area satisfies the following expression, it is determined that an image having a high character character exists in the gap area:
φ ij gap_char > δ · φ mean_char , (14)
Here, φ ij gap_char is a character likelihood evaluation value calculated for the gap between the i-th character candidate region and the j-th character candidate region, and δ is a predetermined parameter.
上記の4項目のチェックの結果、3文字の車種コードについての最適な車種コード領域配置候補と、2文字の車種コードについての最適の車種コード領域配置候補のうちの一方のみが有効であると判断された場合、有効である車種コード領域配置候補が最終的に最適な車種コード領域配置候補であると判断される。 As a result of checking the above four items, it is determined that only one of the optimal vehicle type code area arrangement candidate for the 3-character vehicle type code and the optimal vehicle type code area arrangement candidate for the 2-character vehicle type code is valid. If it is determined, the effective vehicle type code area arrangement candidate is finally determined to be the optimum vehicle type code area arrangement candidate.
両方の車種コード領域配置候補が無効であると判断された場合には、車種コード領域13の文字認識が失敗したと判断される。
When it is determined that both the vehicle type code area arrangement candidates are invalid, it is determined that the character recognition of the vehicle
両方の車種コード領域配置候補が有効であると判断された場合、図20に示されているように、上述の文字らしさ平均値φmean_charが大きい車種コード領域配置候補が、最終的に最適な車種コード領域配置候補であると判断される。例えば、図23の例では、文字らしさ平均値φmean_charが大きい、2文字の車種コードの最適な車種コード領域配置候補が最終的に最適な車種コード領域配置候補であると判断される。 If it is determined that both the vehicle type code area arrangement candidates are valid, as shown in FIG. 20, the above-described vehicle type code area arrangement candidate having a large character-like average value φ mean_char is finally the optimum vehicle type. It is determined that it is a code area arrangement candidate. For example, in the example of FIG. 23, it is determined that the optimal vehicle type code area arrangement candidate of the two-character vehicle type code having a large character- like average value φ mean_char is finally the optimal vehicle type code area arrangement candidate.
最終的に決定された車種コード領域配置候補の各文字候補領域について認識された数字からなる数字列が、最終的に求めるべき車種コードとして決定され、最終的に最適と決定された車種コード領域配置候補に含まれる文字候補領域の数が、車種コード領域13の文字数として決定される。
A numeric string consisting of the numbers recognized for each character candidate area of the finally determined vehicle type code area arrangement candidate is determined as the vehicle code to be finally obtained, and finally the vehicle type code area arrangement determined to be optimal The number of character candidate areas included in the candidates is determined as the number of characters in the vehicle
以上に説明された本実施の形態の車種コードの認識のアルゴリズムの一つの利点は、文字認識に必要なデータ処理量を低減できることである。これは、主として、車種コード領域13の全体ではなく、文字切り出し位置候補18から決定される第1文字領域候補21〜第3文字領域候補23についてのみ文字認識が行われることによって達成されている。このとき、DPマッチングを採用すれば、更に少ない演算量で最適な車種コード領域配置を決定し、各文字の文字認識を行うことができる。
One advantage of the vehicle type code recognition algorithm of the present embodiment described above is that the amount of data processing required for character recognition can be reduced. This is mainly achieved by performing character recognition only on the first
もう一つの利点は、認識対象が、2文字の車種コードと、3文字の車種コードのいずれであっても、適切に車種コードの文字認識が行えることである。この利点は、車種コード領域13の全体に渡って抽出された文字切り出し位置候補18を境界とする第1文字領域候補21〜第3文字領域候補23が決定され、それらの組み合わせである車種コード領域配置候補のうちの最適な車種コード領域配置候補に対応する文字列が認識結果として出力されることによって得られている。
Another advantage is that the character recognition of the vehicle type code can be appropriately performed regardless of whether the recognition target is a two-character vehicle type code or a three-character vehicle type code. This advantage is that the first
このように、本実施形態の車種コードの認識のアルゴリズムでは、車種コードの文字認識に必要なデータ処理量の低減と文字列の多様性への対処とを両立させることができる。 As described above, the vehicle type code recognition algorithm according to the present embodiment can achieve both reduction in the amount of data processing necessary for character recognition of the vehicle type code and coping with the diversity of character strings.
第2 第2の実施形態
図21は、第2の実施形態における小文字列画像11の文字認識のアルゴリズムを示すフローチャートである。第2の実施形態のアルゴリズムと、第1の実施形態のアルゴリズムとの最も重要な相違は、第2の実施形態では陸支コードの認識と車種コードの認識とが同時的に行われる点である;第1の実施形態のように、陸支コード領域12の決定及び陸支コードの認識の後に、車種コード領域13の決定及び車種コードの認識が行われるのではない。
Second Second Embodiment FIG. 21 is a flowchart showing an algorithm for character recognition of the
より具体的には、まず、文字切り出し位置候補18が抽出される(ステップS31)。文字切り出し位置候補18の抽出の手順は、第1の実施形態で説明されたとおりである。図22に示されているように、以下の説明では、11本の文字切り出し位置候補181〜1811が決定されたとして説明が行われる。
More specifically, first, the character
続いて、小文字列画像11の全体に対して領域配置候補が設定される(ステップS32)。領域配置候補とは、小文字列画像11における陸支コード領域12、第1文字領域14、第2文字領域15、及び第3文字領域16の配置の候補である。ただし、本実施の形態では、陸支コード領域12は、一つの文字領域として扱われる;即ち、本実施の形態では、小文字列画像11が3つ又は4つの文字領域を含むとして小文字列画像11の文字認識が行われる。既述のように、画像処理装置2の内部では、陸支コードが一つの文字として扱われていることに留意されたい。
Subsequently, region arrangement candidates are set for the entire lowercase character string image 11 (step S32). The region arrangement candidate is a candidate for arrangement of the
車種コードが2文字又は3文字から構成されることから、2文字の車種コードに対応する領域配置候補と、3文字の車種コードに対応する領域配置候補の2種類が決定される。図22に示されているように、3文字の車種コードに対応する領域配置候補は、第1〜第4文字候補領域21〜24の組み合わせで表現される。本実施の形態では、第1文字候補領域21とは、小文字列画像11の第1文字目が存在する文字領域の候補、即ち、陸支コード領域12の候補であり、第2文字候補領域22は、車種コードの第1文字目が存在する第1文字領域14の候補であり、第3文字候補領域23とは、車種コードの第2文字目が存在する第2文字領域15の候補であり、第4文字候補領域24とは、車種コードの第3文字目が存在する第3文字領域16の候補である。文字候補領域21〜24の両端は、2つの文字切り出し位置候補18によって規定される。同様に、2文字の車種コードに対応する車種コード領域配置候補は、第1文字候補領域21、第2文字候補領域22及び第3文字候補領域23の組み合わせで表現される。
Since the vehicle type code is composed of two or three characters, two types of region arrangement candidates corresponding to the two-character vehicle type code and region arrangement candidates corresponding to the three-character vehicle type code are determined. As shown in FIG. 22, the region arrangement candidate corresponding to the three-character vehicle type code is expressed by a combination of the first to fourth
領域配置候補の設定は、具体的には、文字切り出し位置候補18を、文字候補領域21〜24の始点(左端)及び終点(右端)に対応付けることによって行われる。一例として、図22に示されているように、車種コード領域13の位置”1”〜”11”に対して11本の文字切り出し位置候補181〜1811が存在する場合を考える。例えば、ある領域配置候補では、文字切り出し位置候補181、185が、それぞれ、第1文字候補領域21の始点(左端)及び終点(右端)にそれぞれ対応付けられ、文字切り出し位置候補186、187が第2文字候補領域22の始点及び終点にそれぞれ対応付けられる。更に、文字切り出し位置候補187、188が、第3文字候補領域23の始点及び終点にそれぞれ対応付けられ、文字切り出し位置候補188、189が、第4文字候補領域24の始点及び終点にそれぞれ対応付けられる。他の領域配置候補では、異なる対応付けが行われる。
Specifically, the region arrangement candidate is set by associating the character
ただし、第1の実施形態と同様に、文字領域の幅として妥当でない幅を有するような文字候補領域を含むような領域配置候補は設定されない。詳細には、陸支コード領域12に対応する第1文字候補領域21は、式(1)を満足するように決定され、残りの文字候補領域22〜24は、式(2a)、(2b)を満足するように決定される。これは、領域配置候補の数を減らし、もって演算量を減らすために有効である。
However, as in the first embodiment, an area arrangement candidate that includes a character candidate area that has an invalid width as the width of the character area is not set. Specifically, the first
図21に戻り、領域配置候補の設定に続いて、各領域配分候補の評価値φstringが算出される(S34)。各領域配分候補の評価値φstringの算出の手順は、(1)文字認識が行われる文字領域候補の数が異なること、(2)第1文字候補領域21の文字認識には、車種コード用テンプレート8ではなく陸支コード用テンプレート7が使用されること、(3)文字幅減点値Pi charの算出に使用されるパラメータ:Wmin_char及びWmax_charが、第1文字候補領域21と残りの文字候補領域22〜24とで異なることを除けば、第1の実施形態で行われる車種コード領域配分候補の評価値φstringの算出の手順と同様である。
Returning to FIG. 21, following the setting of the region arrangement candidates, the evaluation value φ string of each region distribution candidate is calculated (S34). The procedure for calculating the evaluation value φ string of each area allocation candidate is as follows: (1) the number of character area candidates to be recognized is different, and (2) the character recognition of the first
更に、2文字の車種コードと3文字の車種コードのそれぞれについて最適な領域配分候補が決定され(ステップS34)、それら2つの領域配分候補から車種コードの文字数、即ち、最適な領域配分候補が最終的に決定される(ステップS35)。最終的に最適な領域配分候補として決定された領域配分候補に対応する陸支コード、車種コード、及び文字数が、認識結果として出力される。 Further, the optimum region allocation candidate is determined for each of the 2-character vehicle type code and the 3-character vehicle type code (step S34), and the number of characters of the vehicle type code, that is, the optimal region allocation candidate is finally determined from these two region allocation candidates. (Step S35). The land code, the vehicle type code, and the number of characters corresponding to the area allocation candidate finally determined as the optimum area allocation candidate are output as the recognition result.
第2の実施形態で使用される文字認識のアルゴリズムは、第1の実施形態の文字認識のアルゴリズムと比べて演算量は多いものの、文字認識精度を高めることができる。第1の実施形態では、陸支コードの位置(即ち、陸支コード領域12)を最適に決定できなかった場合に、車種コードの文字認識の精度が低下してしまう。一方、第2の実施形態では、小文字列画像11の全体として最適に陸支コード領域12及び文字領域14〜16を決定できるため、文字認識精度を高めることができる。
Although the character recognition algorithm used in the second embodiment has a larger amount of computation than the character recognition algorithm of the first embodiment, it can increase the character recognition accuracy. In the first embodiment, when the position of the land support code (that is, the land support code area 12) cannot be determined optimally, the accuracy of character recognition of the vehicle type code is lowered. On the other hand, in the second embodiment, since the
第3 第3の実施形態
第3の実施形態では、図23に示されているように、横方向の文字切り出し位置候補18に加えて、縦方向の文字切り出し位置候補25が抽出され、これらの切り出し位置候補18、25から、陸支コード候補領域19と、第1乃至第3文字候補領域21〜23が決定される。横方向及び縦方向の切り出し位置候補18、25を、明確に区別するために、以下では、横方向の文字切り出し位置候補を横方向文字切り出し位置候補18と、縦方向の文字切り出し位置候補を縦方向文字切り出し位置候補25と呼ぶことにする。第3の実施形態における文字認識のフローは、概略的には、図5に示されているフローと同様であるが、縦方向文字切り出し位置候補25が抽出されることに伴い、各ステップで行われる処理が変更される。
Third Embodiment In the third embodiment, as shown in FIG. 23, in addition to the character
具体的には、文字切り出し位置候補の抽出の処理(ステップS11)では、横方向文字切り出し位置候補18に加えて縦方向文字切り出し位置候補25が抽出される。図24は、本実施形態における文字切り出し位置候補の抽出の処理手順を示す概念図である。まず、第1の実施形態と同様の手順により、横方向文字切り出し位置候補18が抽出される。続いて、隣接する横方向文字切り出し位置候補18の組のそれぞれについて、隣接する横方向文字切り出し位置候補18に挟まれた領域の横方向の輝度射影が算出される。ある領域の横方向の輝度射影とは、当該領域に位置する画素の行のそれぞれについて算出された輝度値の和である;ここで画素行とは、横方向に1列に並べられた画素の行のことである。座標xに位置する画素行の輝度射影F(y)は、
F(y)=Σσ(x,y),
で算出される。ここでσ(x,y)は、当該領域の座標(x,y)に位置する画素の輝度(又は階調)であり、Σは、当該領域のx座標の全範囲についての和を表している。続いて、横方向の輝度射影F(y)が極小になる位置が検出される。更に、横方向の輝度射影F(y)が極小になる位置のうち、例えば、上下1ヶ所ずつ合計2ヶ所、並びに小文字列画像11の上端と下端が、縦方向文字切り出し位置候補25として抽出される。
Specifically, in the process of extracting character cutout position candidates (step S11), in addition to the horizontal character
F (y) = Σσ (x, y),
Is calculated by Here, σ (x, y) is the luminance (or gradation) of the pixel located at the coordinate (x, y) of the region, and Σ represents the sum of the entire range of the x coordinate of the region. Yes. Subsequently, a position where the horizontal luminance projection F (y) is minimized is detected. Further, out of the positions where the luminance projection F (y) in the horizontal direction is minimized, for example, a total of two positions one by one at the top and bottom, and the upper end and the lower end of the lowercase
図5に示されているように、文字切り出し位置候補の抽出に続いて、陸支コード候補領域19の設定が行われる(ステップS12−1)。図25A乃至25Eは、本実施形態における陸支コード候補領域19の決定の手順を示す概念図である。図25Aを参照して、陸支コード候補領域19の決定では、まず、2つの横方向文字切り出し位置候補18が選択され、これにより陸支コード候補領域19の始点(左端)及び終点(右端)の位置xL、xRが決定される。
As shown in FIG. 5, following the extraction of the character cutout position candidates, the land
続いて、左側の横方向文字切り出し位置候補18(即ち、始点xLに対応する横方向文字切り出し位置候補18)に接しており、且つ、小文字列画像11の下端よりも上端に近い縦方向文字切り出し位置候補25が選択され、左側の横方向文字切り出し位置候補18と選択された縦方向文字切り出し位置候補25との接点が、陸支コード候補領域19の左上の頂点として選択される;選択された左上の頂点は、図25Aでは丸で示されている。
Subsequently, the left lateral character segmentation position candidate 18 (i.e., lateral character
更に、右側の横方向文字切り出し位置候補18(即ち、終点xRに対応する横方向文字切り出し位置候補18)に接しており、且つ、小文字列画像11の上端よりも下端に近い縦方向文字切り出し位置候補25が選択され、右側の横方向文字切り出し位置候補18と選択された縦方向文字切り出し位置候補25との接点が、陸支コード候補領域19の右下の頂点として選択される;選択された右下の頂点は、図25Aでは、逆三角で示されている。
Furthermore, the right lateral character segmentation position candidate 18 (i.e., lateral character
選択された左上及び右下の頂点で規定される矩形領域が、陸支コード候補領域19として設定される。許容される2つの横方向文字切り出し位置候補18の組み合わせ、及び、横方向文字切り出し位置候補18の各組み合わせについて許容される縦方向文字切り出し位置候補25の全てについて、陸支コード候補領域19が設定される。例えば、図25B乃至25Eに図示されている4種類の陸支コード候補領域19も設定され得る。
A rectangular area defined by the selected upper left and lower right vertices is set as the land support
陸支コード候補領域19の設定の後、陸支コード候補領域19のそれぞれについて文字認識が行われる(ステップS12−2)。最適な陸支コード候補領域19が陸支コード領域12として決定され、最適な陸支コード候補領域19について認識された陸支コードが、認識結果として出力される。
After the land support
続いて、陸支コード領域12の位置から、車種コード領域13が決定され(S13−1)、その車種コード領域13について車種コード配分候補が設定される(S13−2)。図26に示されているように、一の車種コード配分候補は、第1の実施形態と同様に、3つの文字候補領域21〜23によって表される。第1〜第3文字候補領域21〜23は、車種コード領域13に属する横方向文字切り出し位置候補18及び縦方向文字切り出し位置候補25を、第1〜第3文字候補領域21〜23の左端、右端、上端、及び下端に対応付けることによって設定される。文字候補領域21〜23のそれぞれの左端及び右端は、一対の横方向文字切り出し位置候補18によって決定され、上端及び下端は一対の縦方向文字切り出し位置候補25によって決定される。
Subsequently, a vehicle
更に、各車種コード配分候補について評価値φstringが算出され(ステップS13−4)、2文字の車種コード及び3文字の車種コードのそれぞれについて最適な車種コード配分候補が決定される(ステップS13−5)。評価値φstringの算出方法は、第1の実施形態と同様である。 Further, an evaluation value φ string is calculated for each vehicle type code distribution candidate (step S13-4), and an optimal vehicle type code distribution candidate is determined for each of the two-character vehicle type code and the three-character vehicle type code (step S13-). 5). The calculation method of the evaluation value φ string is the same as that of the first embodiment.
更に、第1の実施形態と同様の手順により、2文字の車種コード及び3文字の車種コードの最適な車種コード配分候補のうちの一方が、最適な車種コード配分候補と決定される(ステップS13−3)。最終的に決定された車種コード領域配置候補の各文字候補領域について認識された数字からなる数字列が、最終的に求めるべき車種コードとして決定され、最終的に最適と決定された車種コード領域配置候補に含まれる文字候補領域の数が、車種コード領域13の文字数として決定される。
Further, according to the same procedure as in the first embodiment, one of the optimal vehicle type code distribution candidates of the 2-character vehicle type code and the 3-character vehicle type code is determined as the optimal vehicle type code distribution candidate (step S13). -3). A numeric string consisting of the numbers recognized for each character candidate area of the finally determined vehicle type code area arrangement candidate is determined as the vehicle code to be finally obtained, and finally the vehicle type code area arrangement determined to be optimal The number of character candidate areas included in the candidates is determined as the number of characters in the vehicle
本実施形態では、横方向文字切り出し位置候補18に加え、縦方向文字切り出し位置候補25が第1〜第3文字候補領域21〜23の設定に使用されるため、車種コード配分候補の数が増加する。車種コード配分候補の数の増加は、データ処理量を増加させるために好ましくない。
In the present embodiment, in addition to the horizontal character
車種コード配分候補の数の増加によるデータ処理量の増加を抑制するためには、第1の実施形態と同様に、DPマッチングが使用されることが好適である。図26を参照して、本実施の形態のDPマッチングでは、車種コード領域配置候補(即ち、横方向文字切り出し位置候補18及び縦方向文字切り出し位置候補25と第1〜第3文字候補領域21〜23との対応付け)が、横方向文字切り出し位置候補18に対応するA軸と、第1〜第3文字候補領域21〜23の始点及び終点に対応するB軸と、縦方向文字切り出し位置候補25に対応するC軸からなる3次元座標系上に展開された対応グラフとして表現される。図26の例では、A軸上の要素a1〜a4は、横方向文字切り出し位置候補181〜184に対応しており、B軸上の要素b1〜b6は、第1文字候補領域21、第2文字候補領域22及び第3文字候補領域23の始点及び終点に対応しており、C軸上の要素c1〜c6は、縦方向文字切り出し位置候補251〜256に対応している。A軸上の要素aj、及びC軸上の要素cmの数は、車種コード領域13に属する縦方向文字切り出し位置候補18及び縦方向文字切り出し位置候補25の数に合わせて調節されることに留意されたい。各対応グラフは、原点(a1,b1,cstart)から座標(aend,b4,cend)までの経路(2文字の車種コードに対応する場合)、又は、原点(a1,b1,cstart)から座標(aend,b6,cend)までの経路である;ここで、cstartは、対応グラフの始点のC軸上の要素であり、aend,cendは、対応グラフの終点のA軸、C軸上の要素であり、第2文字候補領域22又は第3文字候補領域23の終点として選ばれた横方向文字切り出し位置候補18及び縦方向文字切り出し位置候補25に対応する要素である。
In order to suppress an increase in the amount of data processing due to an increase in the number of vehicle type code distribution candidates, it is preferable to use DP matching as in the first embodiment. Referring to FIG. 26, in the DP matching according to the present embodiment, vehicle type code area arrangement candidates (that is, horizontal character
対応グラフが3次元座標上で表されることに対応して、式(8)を用いた評価値φstringの算出方法も、3次元に拡張される。具体的には、
対応グラフの始点(a1,b1,cstart)から座標(aj,bi,cn)までの対応グラフに対応する車種コード領域配置候補の評価値φstringの最大値をΦ(aj,bi,cn)と表すものとすれば、
Φ(aj,bi,cn)=MAX(ak,bp,cm)[Φ(ak,bp,cm)
+φ(i)(ak,bp,cm,aj,bi,cn)],・・・(8)’
が成立する。ここで、bpは、biの一つ前の要素であり、
bp=bi−1, ・・・(9)
である。また、MAX(ak,bp,cm)[X(ak,bp,cm)]は、ak、bp、cmを変化させたときのX(ak,bp,cm)の最大値を表す。更に、φ(i)(ak,bp,cm,aj,bi,cn)は、
(α)iが奇数のとき、要素(ak,cm)に対応する文字切り出し位置候補と、(aj,cn)に対応する文字切り出し位置候補の間に形成される隙間の隙間らしさ評価値φgapであり、
(β)iが偶数のとき、要素(ak,cm)に対応する文字切り出し位置候補と、(aj,cn)に対応する文字切り出し位置候補の間に形成される文字候補領域の文字らしさ評価値φcharである。
また、bi=b1のときには、特別に、Φ=0と決定される。
Corresponding to the correspondence graph being represented on three-dimensional coordinates, the method of calculating the evaluation value φs string using the equation (8) is also expanded to three dimensions. In particular,
The maximum value of the evaluation value φ string of the vehicle type code area arrangement candidate corresponding to the correspondence graph from the start point (a 1 , b 1 , c start ) of the correspondence graph to the coordinates (a j , b i , c n ) is represented by Φ (a j , b i , c n )
Φ (a j , b i , c n ) = MAX (a k , b p , c m ) [Φ (a k , b p , c m )
+ Φ (i) (a k , b p , c m , a j , b i , c n )]], (8) ′
Is established. Here, b p is the previous element of the b i,
b p = b i−1 , (9)
It is. Furthermore, MAX (a k, b p , c m) [X (a k, b p, c m)] is, a k, b p, c m X (a k when changing the, b p, c m ) represents the maximum value. Further, φ (i) (a k , b p, c m, a j, b i, c n) is
(Α) When i is an odd number, the gap likelihood formed between the character cutout position candidate corresponding to the element (a k , c m ) and the character cutout position candidate corresponding to (a j , c n ) Evaluation value φ gap
(Β) When i is an even number, a character candidate region formed between a character cutout position candidate corresponding to the element (a k , c m ) and a character cutout position candidate corresponding to (a j , c n ) Characteristic evaluation value φ char .
Further, when b i = b 1 , it is determined that Φ = 0.
このΦ(aj,bi,cn)は、biの漸化式となっているため、座標(a1,b1,cstart)(即ち、対応グラフの始点)からスタートして座標(a6,b6,cend)まで、順次にΦ(aj,bi,cn)を決定することができる。加えて、Φ(aj,bi,cn)を決定するとき、Φ(ak,bp,cm)+φ(i)(ak,bp,cm,aj,bi,cn)を最大にする座標(ak,bp,cm)が、座標(aj,bi)と対応付けられて保存される。具体的には、座標(aj,bi,cn)から座標(ak,bp,cm)へのポインタが記憶装置に保存される。 Since Φ (a j , b i , c n ) is a recurrence formula of b i , the coordinates start from the coordinates (a 1 , b 1 , c start ) (that is, the start point of the corresponding graph). Up to (a 6 , b 6 , c end ), Φ (a j , b i , c n ) can be sequentially determined. In addition, when determining Φ (a j , b i , c n ), Φ (a k , b p , c m ) + φ (i) (a k , b p , cm , a j , b i , Coordinates (a k , b p , c m ) that maximize c n ) are stored in association with the coordinates (a j , b i ). Specifically, pointers from the coordinates (a j , b i , c n ) to the coordinates (a k , b p , c m ) are stored in the storage device.
このような方法によって、車種コード領域配置候補に対応するj,i,nの組み合わせのそれぞれについてΦ(aj,bi,cn)が算出される。算出されたΦ(aj,bi,cn)を用いて、下記の方法により、最適な対応グラフ、即ち、最適な車種コード領域配置候補が、2文字の車種コード、3文字の車種コードのそれぞれについて決定される。2文字の車種コードに対応する対応グラフの決定では、まず、Φ(ak,b4,cend)の最大値が求められ、Φ(ak,b4,cend)を最大にする対応グラフが、最適な対応グラフとして選択される。Φ(ak,b4,cend)を最大にする対応グラフは、上述のポインタから決定可能である。同様に、3文字の車種コードに対応する最適な対応グラフの決定では、まず、Φ(ak,b6,cend)の最大値が求められ、Φ(ak,b6,cend)を最大にする対応グラフが、最適な対応グラフとして選択される。Φ(ak,b6,cend)を最大にする対応グラフは、上述のポインタから決定可能である。 By such a method, Φ (a j , b i , c n ) is calculated for each combination of j, i, n corresponding to the vehicle type code area arrangement candidate. Using the calculated Φ (a j , b i , c n ), an optimal correspondence graph, that is, an optimal vehicle type code area arrangement candidate is a 2-character vehicle type code, a 3-character vehicle type code, by the following method. For each of them. In the determination of the corresponding graph corresponding to two-letter models code, first, [Phi maximum value of (a k, b 4, c end) is obtained, corresponding to [Phi the (a k, b 4, c end) to the maximum The graph is selected as the optimal correspondence graph. A correspondence graph that maximizes Φ (a k , b 4 , c end ) can be determined from the pointers described above. Similarly, in the determination of the optimal response graph corresponding to the three letter models code, first, [Phi maximum value of (a k, b 6, c end) is obtained, Φ (a k, b 6 , c end) The corresponding graph that maximizes is selected as the optimal corresponding graph. The correspondence graph that maximizes Φ (a k , b 6 , c end ) can be determined from the pointers described above.
第3の実施形態による文字認識の処理方法では、横方向文字切り出し位置に加え、縦方向文字切り出し位置が設定されるため、文字が少し傾いている場合や、文字の上下に隙間がある場合にも、正しく文字候補領域を設定することが可能である。 In the character recognition processing method according to the third embodiment, since the vertical character cutout position is set in addition to the horizontal character cutout position, the character is slightly tilted or there is a gap above and below the character. Also, it is possible to set the character candidate area correctly.
以上には、本発明の実施形態が詳細に説明されているが、本発明は、実施形態に記載のものに限定して解釈されてはならない。本発明は、ナンバープレート認識に特に好適であるが、適切なテンプレート画像を使用することにより他の文字列の認識にも使用できることは自明的であろう。 Although the embodiments of the present invention have been described in detail above, the present invention should not be construed as being limited to those described in the embodiments. Although the present invention is particularly suitable for license plate recognition, it will be obvious that it can also be used for recognition of other character strings by using appropriate template images.
1:撮像装置
2:画像処理装置
3:記憶装置
4:演算装置
5:インターフェース
6:ナンバープレート認識プログラム
7:陸支コード用テンプレート
8:車種コード用テンプレート
10:ナンバープレート認識装置
11:小文字列画像
12:陸支コード領域
13:車種コード領域
14:第1文字領域(文字領域)
15:第2文字領域
16:第3文字領域
17:文字切り出し位置
18、181、182、183、185:文字切り出し位置候補(横方向文字切り出し位置候補)
19、191、194:陸支コード候補領域
21:第1文字候補領域(文字候補領域)
22:第2文字候補領域
23:第3文字候補領域
24:第4文字候補領域
25:縦方向文字切り出し位置候補
1: Image pickup device 2: Image processing device 3: Storage device 4: Computing device 5: Interface 6: License plate recognition program 7: Land code template 8: Vehicle type code template 10: License plate recognition device 11: Lower case image 12: Land support code area 13: Vehicle type code area 14: First character area (character area)
15: 2nd character area 16: 3rd character area 17: Character cut-out
19, 19 1 , 19 4 : Land support code candidate area 21: First character candidate area (character candidate area)
22: Second character candidate area 23: Third character candidate area 24: Fourth character candidate area 25: Vertical character cutout position candidate
Claims (16)
(B)前記文字切り出し位置候補を前記複数の文字領域の境界に対応付けて前記複数の文字領域の候補である文字候補領域を決定し、前記文字候補領域の組み合わせとして表現される領域配置候補を決定するステップと、
(C)前記文字候補領域のそれぞれについて画像認識を行い、前記画像認識の結果に基づいて、前記領域配置候補のうちから最適領域配置候補を選択するステップと、
(D)前記最適領域配置候補に対応する前記文字候補領域について前記(C)ステップの画像認識において認識された文字からなる文字列を、認識結果文字列として出力するステップ
とを具備する
文字列認識方法。 (A) determining a character cutout position candidate that is a candidate for the boundary of the character region for the entire character string image including a plurality of character regions in which one character is copied;
(B) A character candidate region that is a candidate for the plurality of character regions is determined by associating the character cut-out position candidates with boundaries of the plurality of character regions, and region arrangement candidates expressed as combinations of the character candidate regions are determined. The steps to decide;
(C) performing image recognition for each of the character candidate regions, and selecting an optimal region placement candidate from the region placement candidates based on the result of the image recognition;
(D) A step of outputting a character string made up of characters recognized in the image recognition in the step (C) for the character candidate region corresponding to the optimal region arrangement candidate as a recognition result character string. Method.
前記文字切り出し位置候補は、前記文字列画像の各画素の輝度から決定される
文字列認識方法。 The character string recognition method according to claim 1,
The character cutout recognition method is a character string recognition method in which the character cutout position candidate is determined from the luminance of each pixel of the character string image.
前記文字切り出し位置候補は、前記文字列画像の微分画像から決定される
文字列認識方法。 The character string recognition method according to claim 1,
The character cutout position candidate is determined from a differential image of the character string image.
前記(C)ステップは、
(C1)前記文字切り出し位置候補によって定められる前記文字候補領域のそれぞれの幅を算出するステップと、
(C2)前記文字切り出し位置候補によって定められる前記文字候補領域のそれぞれについて、前記文字候補領域の画像と、予め用意されたテンプレート画像との相違度を算出するステップと、
(C3)前記文字候補領域の幅、及び前記相違度に基づいて文字らしさ評価値を算出するステップ
とを備え、
前記最適領域配置候補は、前記文字らしさ評価値に基づいて決定される
文字列認識方法。 The character string recognition method according to claim 1,
The step (C) includes:
(C1) calculating a width of each of the character candidate areas defined by the character cutout position candidates;
(C2) calculating a difference between the image of the character candidate area and a template image prepared in advance for each of the character candidate areas defined by the character cutout position candidates;
(C3) calculating a character-likeness evaluation value based on the width of the character candidate region and the degree of difference,
The optimum region arrangement candidate is a character string recognition method that is determined based on the character likelihood evaluation value.
前記(C)ステップは、更に、
(C4)前記文字切り出し位置候補によって定められる前記文字候補領域の、隣接する2つの文字候補領域の隙間の幅を算出するステップと、
(C5)前記2つの文字候補領域の隙間の幅に基づいて、隙間らしさ評価値を算出するステップ
を備え、
前記最適領域配置候補は、前記隙間らしさ評価値に基づいて決定される
文字列認識方法。 The character string recognition method according to claim 1,
The step (C) further includes:
(C4) calculating a width of a gap between two adjacent character candidate areas of the character candidate area defined by the character cutout position candidates;
(C5) comprising a step of calculating a clearance likelihood evaluation value based on the width of the gap between the two character candidate regions,
The optimum region arrangement candidate is a character string recognition method that is determined based on the gap likelihood evaluation value.
(F)前記文字切り出し位置候補を前記複数の文字領域の境界に対応付けて前記複数の文字領域の候補である文字候補領域を決定し、前記文字候補領域の組み合わせとして表現される領域配置候補を決定するステップと、
(G)前記文字候補領域のそれぞれについて画像認識を行い、前記画像認識の結果に基づいて、前記領域配置候補のうちから最適領域配置候補を選択するステップと、
(H)前記最適領域配置候補に対応する前記文字候補領域について前記(G)ステップの画像認識において認識された文字からなる文字列を、認識結果の少なくとも一部として出力するステップ
とを具備する
ナンバープレート認識方法。 (E) determining a character extraction position candidate that is a candidate for a boundary of a character region in which one character of the lowercase character string is copied for each of the lowercase character string images in which the lowercase character string of the license plate is copied; ,
(F) associating the character cutout position candidates with the boundaries of the plurality of character regions, determining character candidate regions that are candidates for the plurality of character regions, and determining region arrangement candidates expressed as combinations of the character candidate regions The steps to decide;
(G) performing image recognition for each of the character candidate regions, and selecting an optimal region placement candidate from the region placement candidates based on the result of the image recognition;
(H) a step of outputting, as at least part of a recognition result, a character string made up of characters recognized in the image recognition in the step (G) for the character candidate region corresponding to the optimum region arrangement candidate. Plate recognition method.
更に、
(I)前記文字切り出し位置候補から前記小文字列の陸支コードが写されている陸支コード領域を決定するステップと、
(J)前記小文字列画像のうち前記陸支コード領域以外の領域に、車種コード領域を決定するステップ
とを具備し、
前記領域配置候補は、前記車種コード領域について定められた車種コード領域配置候補である
ナンバープレート認識方法。 The license plate recognition method according to claim 6,
Furthermore,
(I) determining a land code area where a land code of the lowercase character string is copied from the character cutout position candidates;
(J) determining a vehicle type code area in an area other than the land support code area in the lower case sequence image,
The region arrangement candidate is a vehicle type code region arrangement candidate defined for the vehicle type code region.
前記(G)ステップは、
(G1)前記文字切り出し位置候補によって定められる前記文字候補領域のそれぞれの幅を算出するステップと、
(G2)前記文字切り出し位置候補によって定められる前記文字候補領域のそれぞれについて、前記文字候補領域の画像と、予め用意されたテンプレート画像との相違度を算出するステップと、
(G3)前記文字候補領域の幅、及び前記相違度に基づいて文字らしさ評価値を算出するステップ
とを備え、
前記最適領域配置候補は、前記文字らしさ評価値に基づいて決定される
文字列認識方法。 The character string recognition method according to claim 7,
The step (G) includes:
(G1) calculating a width of each of the character candidate areas defined by the character cutout position candidates;
(G2) calculating a difference between the image of the character candidate area and a template image prepared in advance for each of the character candidate areas defined by the character cutout position candidates;
(G3) calculating a character likelihood evaluation value based on the width of the character candidate region and the degree of difference,
The optimum region arrangement candidate is a character string recognition method that is determined based on the character likelihood evaluation value.
前記(G)ステップは、更に、
(G4)前記文字切り出し位置候補によって定められる前記文字候補領域の、隣接する2つの文字候補領域の隙間の幅を算出するステップと、
(G5)前記2つの文字候補領域の隙間の幅に基づいて、隙間らしさ評価値を算出するステップ
を備え、
前記最適領域配置候補は、前記隙間らしさ評価値に基づいて決定される
文字列認識方法。 The character string recognition method according to claim 8,
The step (G) further includes:
(G4) calculating a width of a gap between two adjacent character candidate areas of the character candidate area defined by the character cutout position candidates;
(G5) comprising a step of calculating a clearance likelihood evaluation value based on the width of the gap between the two character candidate regions,
The optimum region arrangement candidate is a character string recognition method that is determined based on the gap likelihood evaluation value.
前記(I)ステップは、
(I1)前記文字切り出し位置候補を境界とし、前記小文字列画像の端に接し、且つ、所定範囲の幅を有する領域を陸支コード候補領域として定めるステップと、
(I2)前記陸支コード候補領域のそれぞれについて画像認識を行い、前記画像認識の結果に基づいて前記陸支コード候補領域のうちから陸支コードが写されている陸支コード領域を決定するステップ
とを備え、
前記陸支コード領域として決定された前記陸支コード候補領域について認識された陸支コードが、前記認識結果の一部として出力される
ナンバープレート認識方法。 The license plate recognition method according to claim 7,
The step (I) includes:
(I1) a step of defining an area having a predetermined range of width as a land support code candidate area with the character cutout position candidate as a boundary, in contact with an end of the lowercase character string image, and
(I2) performing image recognition for each of the land support code candidate areas, and determining a land support code area in which the land support code is copied from the land support code candidate areas based on the result of the image recognition And
A license plate recognition method in which a land support code recognized for the land support code candidate region determined as the land support code region is output as a part of the recognition result.
前記(G)ステップの前記画像認識では、前記小文字列の最も左に位置する文字に対応する前記文字候補領域については陸支コードのテンプレート画像が使用され、それ以外の文字に対応する前記文字候補領域については数字のテンプレート画像が使用され、
前記認識結果は、前記ナンバープレートの陸支コードの認識結果と前記ナンバープレートの車種コードの認識結果とを含む
ナンバープレート認識方法。 The license plate recognition method according to claim 6,
In the image recognition in the step (G), a land code code template image is used for the character candidate region corresponding to the leftmost character in the lowercase character string, and the character candidates corresponding to other characters are used. A number template image is used for the area,
The recognition result includes a recognition result of a land code of the license plate and a recognition result of a vehicle type code of the license plate.
前記(G)ステップにおいて前記文字候補領域のうちの或る文字候補領域について行われた前記画像認識によって「1」という認識結果が得られた場合には、前記或る文字候補領域の周囲を含む拡大領域について再度の画像認識が行われ、前記拡大領域について「1」以外の認識結果が得られた場合には、前記或る文字候補領域を含む領域配置候補は、前記最適領域配置候補として選択されない
ナンバープレート認識方法。 The license plate recognition method according to claim 6,
When the recognition result of “1” is obtained by the image recognition performed for a certain character candidate region in the character candidate region in the step (G), the surroundings of the certain character candidate region are included. When image recognition is performed again for the enlarged area and a recognition result other than “1” is obtained for the enlarged area, the area arrangement candidate including the certain character candidate area is selected as the optimum area arrangement candidate. No. License plate recognition method.
前記文字候補領域は、矩形であり、
前記文字切り出し位置候補は、
前記文字候補領域の左端及び右端を決定する横方向文字切り出し位置候補と、
前記文字候補領域の上端及び下端を決定する縦方向文字切り出し位置候補
とを備える
ナンバープレート認識方法。 The license plate recognition method according to claim 6,
The character candidate area is a rectangle,
The character cutout position candidates are
A horizontal character cutout position candidate for determining the left end and the right end of the character candidate area;
A license plate recognition method comprising: a vertical character cutout position candidate for determining an upper end and a lower end of the character candidate region.
前記(E)ステップは、
(E1) 前記小文字列画像を上側部分と下側部分とに区分するステップと、
(E2) 前記下側部分の画像から前記文字切り出し位置候補を決定するステップ
とを備える
ナンバープレート認識方法。 The license plate recognition method according to claim 6,
The step (E)
(E1) dividing the lower-case string image into an upper part and a lower part;
(E2) A license plate recognition method comprising: determining the character cutout position candidates from the image of the lower part.
前記文字列画像の文字認識を行う画像処理装置
とを備え、
前記画像処理装置は、下記ステップ群:
(A)文字列画像の全体について、前記文字領域の境界の候補である文字切り出し位置候補を定めるステップ、
(B)前記文字切り出し位置候補を前記複数の文字領域の境界に対応付けて前記複数の文字領域の候補である文字候補領域を決定し、前記文字候補領域の組み合わせとして表現される領域配置候補を決定するステップ、
(C)前記文字候補領域のそれぞれについて画像認識を行い、前記画像認識の結果に基づいて、前記領域配置候補のうちから最適領域配置候補を選択するステップ、及び
(D)前記最適領域配置候補に対応する前記文字候補領域について前記(C)ステップの画像認識において認識された文字からなる文字列を、認識結果文字列として出力するステップ
を実行するように構成された
文字列認識装置。 An imaging device for acquiring a character string image including a plurality of character regions each of which one character is copied;
An image processing device that performs character recognition of the character string image,
The image processing apparatus includes the following steps:
(A) a step of determining a character cutout position candidate that is a candidate for the boundary of the character region for the entire character string image;
(B) A character candidate region that is a candidate for the plurality of character regions is determined by associating the character cut-out position candidates with boundaries of the plurality of character regions, and region arrangement candidates expressed as combinations of the character candidate regions are determined. Steps to determine,
(C) performing image recognition for each of the character candidate areas, and selecting an optimum area arrangement candidate from the area arrangement candidates based on the result of the image recognition; and (D) selecting the optimum area arrangement candidate A character string recognition device configured to execute a step of outputting, as a recognition result character string, a character string composed of characters recognized in the image recognition in step (C) for the corresponding character candidate region.
前記撮像画像から前記ナンバープレートの文字認識を行うための画像処理装置
とを備え、
前記画像処理装置は、下記ステップ群:
(K)前記撮像画像から、前記ナンバープレートの小文字列が写されている小文字列画像を切り出すステップ、
(E)’前記小文字列画像の全体について、それぞれに前記小文字列の一の文字が写されている文字領域の境界の候補である文字切り出し位置候補を定めるステップ、
(F)前記文字切り出し位置候補を前記複数の文字領域の境界に対応付けて前記複数の文字領域の候補である文字候補領域を決定し、前記文字候補領域の組み合わせとして表現される領域配置候補を決定するステップ、
(G)前記文字候補領域のそれぞれについて画像認識を行い、前記画像認識の結果に基づいて、前記領域配置候補のうちから最適領域配置候補を選択するステップ、及び
(H)前記最適領域配置候補に対応する前記文字候補領域について前記(F)ステップの画像認識において認識された文字からなる文字列を、認識結果の少なくとも一部として出力するステップ
を実行するように構成された
ナンバープレート認識装置。 An imaging device for obtaining a captured image of a license plate;
An image processing device for performing character recognition of the license plate from the captured image,
The image processing apparatus includes the following steps:
(K) a step of cutting out from the captured image a lower case sequence image in which a lower case sequence of the license plate is copied;
(E) 'determining a character cutout position candidate that is a candidate for a boundary of a character region in which one character of the lowercase character string is copied for each of the lowercase character string images;
(F) associating the character cutout position candidates with the boundaries of the plurality of character regions, determining character candidate regions that are candidates for the plurality of character regions, and determining region arrangement candidates expressed as combinations of the character candidate regions Steps to determine,
(G) performing image recognition for each of the character candidate areas, and selecting an optimum area arrangement candidate from the area arrangement candidates based on the result of the image recognition; and (H) selecting the optimum area arrangement candidate. A license plate recognition device configured to execute a step of outputting, as at least a part of a recognition result, a character string made up of characters recognized in the image recognition of step (F) for the corresponding character candidate region.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005129585A JP2006309402A (en) | 2005-04-27 | 2005-04-27 | Character string recognition method, number plate recognition method and device |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005129585A JP2006309402A (en) | 2005-04-27 | 2005-04-27 | Character string recognition method, number plate recognition method and device |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2006309402A true JP2006309402A (en) | 2006-11-09 |
Family
ID=37476233
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005129585A Withdrawn JP2006309402A (en) | 2005-04-27 | 2005-04-27 | Character string recognition method, number plate recognition method and device |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2006309402A (en) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010020622A (en) * | 2008-07-11 | 2010-01-28 | Panasonic Corp | Image processor and image processing method |
US8509571B2 (en) | 2008-06-11 | 2013-08-13 | Panasonic Corporation | Pattern recognition apparatus, pattern recognition method, image processing apparatus, and image processing method |
JP2013222461A (en) * | 2012-04-17 | 2013-10-28 | Xerox Corp | Secure cropping of license plate images |
CN109087368A (en) * | 2018-06-14 | 2018-12-25 | 阿里巴巴集团控股有限公司 | A kind of character string graphic method and device |
-
2005
- 2005-04-27 JP JP2005129585A patent/JP2006309402A/en not_active Withdrawn
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8509571B2 (en) | 2008-06-11 | 2013-08-13 | Panasonic Corporation | Pattern recognition apparatus, pattern recognition method, image processing apparatus, and image processing method |
US8620094B2 (en) | 2008-06-11 | 2013-12-31 | Panasonic Corporation | Pattern recognition apparatus, pattern recogntion method, image processing apparatus, and image processing method |
JP2010020622A (en) * | 2008-07-11 | 2010-01-28 | Panasonic Corp | Image processor and image processing method |
JP2013222461A (en) * | 2012-04-17 | 2013-10-28 | Xerox Corp | Secure cropping of license plate images |
CN109087368A (en) * | 2018-06-14 | 2018-12-25 | 阿里巴巴集团控股有限公司 | A kind of character string graphic method and device |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8457403B2 (en) | Method of detecting and correcting digital images of books in the book spine area | |
JP4966893B2 (en) | Matching degree calculation device and method, program | |
JP2002133426A (en) | Ruled line extracting device for extracting ruled line from multiple image | |
US8254690B2 (en) | Information processing apparatus, information processing method, and program | |
JP6177541B2 (en) | Character recognition device, character recognition method and program | |
WO2007063705A1 (en) | Pattern recognition apparatus, pattern recognition method, and pattern recognition program | |
JP4764903B2 (en) | Method and image processing apparatus for detecting line structure from text map | |
EP2782065B1 (en) | Image-processing device removing encircling lines for identifying sub-regions of image | |
JP4901229B2 (en) | Red-eye detection method, apparatus, and program | |
JP6110174B2 (en) | Image detection apparatus, control program, and image detection method | |
JP4062987B2 (en) | Image area dividing method, image area dividing apparatus, and image area dividing program | |
JP2006309402A (en) | Character string recognition method, number plate recognition method and device | |
Fernández-Caballero et al. | Display text segmentation after learning best-fitted OCR binarization parameters | |
JP2010211460A (en) | Device for creating identification model, object detection device, and program for creating identification model | |
US20230316697A1 (en) | Association method, association system, and non-transitory computer-readable storage medium | |
JP2898562B2 (en) | License plate determination method | |
JP2011022938A (en) | Character recognition device, character recognition program and character recognition method | |
JP4658714B2 (en) | Method, apparatus, program, and storage medium for detecting line in image | |
JP6144892B2 (en) | Image processing apparatus, image processing method, and program | |
JP2005250786A (en) | Image recognition method | |
JPH09305707A (en) | Image extracting system | |
WO2023013546A1 (en) | Computer program, generation device, and generation method | |
JP5145862B2 (en) | Image processing program and image processing apparatus | |
JP2009272714A (en) | Image processing apparatus, image processing method, program, and recording medium with the program stored | |
JP3551004B2 (en) | Ruled line extraction method and device |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A300 | Application deemed to be withdrawn because no request for examination was validly filed |
Free format text: JAPANESE INTERMEDIATE CODE: A300 Effective date: 20080701 |