JP2014164529A - Character recognition device, character recognition method, and program - Google Patents

Character recognition device, character recognition method, and program Download PDF

Info

Publication number
JP2014164529A
JP2014164529A JP2013035160A JP2013035160A JP2014164529A JP 2014164529 A JP2014164529 A JP 2014164529A JP 2013035160 A JP2013035160 A JP 2013035160A JP 2013035160 A JP2013035160 A JP 2013035160A JP 2014164529 A JP2014164529 A JP 2014164529A
Authority
JP
Japan
Prior art keywords
character
character recognition
evaluation value
recognition
recognition result
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2013035160A
Other languages
Japanese (ja)
Other versions
JP6173715B2 (en
Inventor
Yohei Kojima
洋平 小島
Mayumi Saito
真由美 斎藤
Kiichi Sugimoto
喜一 杉本
Takuma Okazaki
拓馬 岡▲崎▼
Kenta Nakao
健太 中尾
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Heavy Industries Ltd
Original Assignee
Mitsubishi Heavy Industries Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Heavy Industries Ltd filed Critical Mitsubishi Heavy Industries Ltd
Priority to JP2013035160A priority Critical patent/JP6173715B2/en
Priority to SG11201506566YA priority patent/SG11201506566YA/en
Priority to PCT/JP2013/079119 priority patent/WO2014129016A1/en
Priority to MYPI2015702772A priority patent/MY179506A/en
Publication of JP2014164529A publication Critical patent/JP2014164529A/en
Application granted granted Critical
Publication of JP6173715B2 publication Critical patent/JP6173715B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/158Segmentation of character regions using character size, text spacings or pitch estimation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Abstract

PROBLEM TO BE SOLVED: To achieve both the improvement in accuracy of character recognition and the reduction of computational complexity when performing character recognition processing on a grayscale image.SOLUTION: A character recognition device is provided which performs character recognition on a grayscale image including a character string comprising characters arrayed in a specific direction. The character recognition device first recognizes Ncharacters (Nis a prescribed value equal to or larger than 2) in order from an end of the character string. In character recognition for the Ncharacters, a plurality of character areas having various character area sizes are set in respective positions of the grayscale image, and character recognition results and evaluation values are calculated for respective character areas. Character recognition results of the Ncharacters and the most suitable character area size are determined on the basis of the calculated evaluation values. In character recognition of remaining characters, the character recognition device sets a character area having the most suitable character area size to respective positions of the gray scale image to perform character recognition processing.

Description

本発明は、文字認識装置、文字認識方法及びプログラムに関し、特に、グレースケール画像に対して文字認識を行うための文字認識装置、文字認識方法及びプログラムに関する。   The present invention relates to a character recognition device, a character recognition method, and a program, and more particularly, to a character recognition device, a character recognition method, and a program for performing character recognition on a grayscale image.

撮像装置によって撮像された撮像画像について文字認識を行う技術は、ナンバープレート認識を始めとして、様々な用途に応用されている。撮像画像に対する文字認識では、一般的に、撮像画像から2値化画像を生成する処理が行われ、更に、該2値化画像について文字認識処理が行われる。このような技術は、例えば、特許文献1(特開2006−338578号公報)に開示されている。   A technique for performing character recognition on a picked-up image picked up by an image pickup apparatus has been applied to various uses including license plate recognition. In character recognition for a captured image, generally, processing for generating a binarized image from the captured image is performed, and character recognition processing is further performed for the binarized image. Such a technique is disclosed in, for example, Japanese Patent Application Laid-Open No. 2006-338578.

撮像画像から2値化画像を生成し、該2値化画像に対して文字認識処理を行う技術の一つの問題は、撮像画像の画質が悪いと良好な2値化画像が得られないことである。例えば近年のナンバープレート認識装置においては、撮像装置の低コスト化に伴い、低光量、低解像度での撮像が行われる。光量が低下すると、影が発生し、更にS/N比が低下することに伴って輝度分布が不均一になる。加えて、解像度が低下すると、撮像画像における文字特徴量が劣化してしまう。このような状況では、現状の2値化処理によっては、文字が崩れた2値化画像が生成され(例えば、文字線が消失した2値化画像が生成され)、文字認識の精度が低下してしまう。高画質の撮像画像を撮像できる撮像装置を用いれば、このような問題は回避できるが、高画質の撮像画像を撮像できる撮像装置は、一般に高価であり、コストの低減の点で不利である。   One problem with the technique of generating a binarized image from a captured image and performing character recognition processing on the binarized image is that a good binarized image cannot be obtained if the image quality of the captured image is poor. is there. For example, in recent license plate recognition apparatuses, imaging with low light quantity and low resolution is performed in accordance with the cost reduction of the imaging apparatus. When the amount of light decreases, shadows occur, and the luminance distribution becomes non-uniform as the S / N ratio decreases. In addition, when the resolution is lowered, the character feature amount in the captured image is deteriorated. In such a situation, depending on the current binarization processing, a binarized image in which characters are broken is generated (for example, a binarized image in which character lines are lost) is generated, and the accuracy of character recognition decreases. End up. Such a problem can be avoided by using an imaging device that can capture a high-quality captured image, but an imaging device that can capture a high-quality captured image is generally expensive and disadvantageous in terms of cost reduction.

撮像画像の画質が悪いと良好な2値化画像が得られないという問題に対処するために、発明者らは、2値化を行わずに文字認識処理を行う技術、即ち、グレースケール画像(濃淡画像)に対して文字認識処理を行う技術について検討している。グレースケール画像に対する文字認識処理は、例えば、特許文献2(特開2008−251029号公報)及び非特許文献1(澤和宏他「こう配特徴ベクトルと変動吸収共分散行列による手書き漢字認識の高精度化」,電子情報通信学会論文誌D-II,Vol.J82-D-II,No.11)に開示されている。特許文献2は、文字認識処理において、超解像処理法によって高解像度画像を得ることで、文字認識精度を向上させる技術を開示している。また、非特許文献1は、グレースケール画像から得られる輝度勾配等の特徴量を用いた統計的パターン認識により、文字クラスの識別を行う技術を開示している。   In order to cope with the problem that a good binarized image cannot be obtained if the image quality of the captured image is poor, the inventors have performed a character recognition process without binarization, that is, a grayscale image ( We are investigating a technique for performing character recognition processing on grayscale images. For example, Patent Document 2 (Japanese Patent Laid-Open No. 2008-251029) and Non-Patent Document 1 (Kawahiro Sawa et al. “High accuracy of handwritten Kanji recognition using gradient feature vector and variable absorption covariance matrix”. ”, Journal of the Institute of Electronics, Information and Communication Engineers, D-II, Vol. J82-D-II, No. 11). Patent Document 2 discloses a technique for improving character recognition accuracy by obtaining a high-resolution image by a super-resolution processing method in character recognition processing. Non-Patent Document 1 discloses a technique for identifying a character class by statistical pattern recognition using a feature quantity such as a luminance gradient obtained from a grayscale image.

グレースケール画像に対する文字認識処理においては、文字認識の精度の向上と演算量の低減とを同時に実現させることが好ましい。しかしながら、発明者の検討によれば、上記の従来技術には改良の余地がある。   In character recognition processing for a grayscale image, it is preferable to simultaneously improve the accuracy of character recognition and reduce the amount of calculation. However, according to the inventor's study, there is room for improvement in the above-described prior art.

特開2006−338578号公報JP 2006-338578 A 特開2008−251029号公報JP 2008-251029 A

澤和宏他「こう配特徴ベクトルと変動吸収共分散行列による手書き漢字認識の高精度化」,電子情報通信学会論文誌D-II,Vol.J82-D-II,No.11Kazuhiro Sawa et al. "High accuracy of handwritten Kanji recognition using gradient feature vector and variable absorption covariance matrix", IEICE Transactions D-II, Vol.J82-D-II, No.11

したがって、本発明の目的は、グレースケール画像に対する文字認識処理において、文字認識の精度の向上と演算量の低減とを同時に実現させるための技術を提供することにある。   Accordingly, an object of the present invention is to provide a technique for simultaneously improving the accuracy of character recognition and reducing the amount of calculation in character recognition processing for a grayscale image.

本発明の一の観点では、特定方向に並んだ文字で構成される文字列が映されたグレースケール画像について文字認識を行う文字認識装置が提供される。文字認識装置は、文字列のうち、第1端からN個(Nは、2以上の所定値)は、の文字である第1文字について文字認識を行う第1文字認識手段と、文字列の第1端からN個以外の文字である第2文字について文字認識を行う第2文字認識手段とを具備する。第1文字認識手段は、第1文字についての文字認識において、様々な文字領域サイズの複数の第1文字領域をグレースケール画像の各位置に設定し、複数の第1文字領域のそれぞれについて文字認識処理を行って文字認識結果と評価値とを算出し、算出された評価値に基づいて、第1文字の文字認識結果と、最適な文字領域のサイズである第1最適文字領域サイズとを決定する。第2文字認識手段は、第1最適文字領域サイズを有する複数の第2文字領域をグレースケール画像の各位置に設定し、複数の第2文字領域のそれぞれについて文字認識処理を行って文字認識結果と評価値とを算出し、且つ、複数の第2文字領域のそれぞれについて算出された文字認識結果と評価値に基づいて、第2文字の文字認識結果を決定する。 In one aspect of the present invention, a character recognition device is provided that performs character recognition on a grayscale image in which a character string composed of characters arranged in a specific direction is displayed. Character recognition apparatus, among the strings, N C-number (N C is 2 or more predetermined value) from the first end includes a first character recognition means for performing character recognition for the first character is a character, character Second character recognition means for performing character recognition on a second character, other than N C characters, from the first end of the column. In the character recognition for the first character, the first character recognition means sets a plurality of first character regions having various character region sizes at respective positions in the gray scale image, and performs character recognition for each of the plurality of first character regions. Processing is performed to calculate a character recognition result and an evaluation value, and based on the calculated evaluation value, a character recognition result of the first character and a first optimum character area size that is an optimum character area size are determined. To do. The second character recognition means sets a plurality of second character areas having the first optimum character area size at each position of the gray scale image, performs character recognition processing for each of the plurality of second character areas, and performs a character recognition result. And the evaluation value, and the character recognition result of the second character is determined based on the character recognition result and the evaluation value calculated for each of the plurality of second character regions.

このとき、第1文字認識手段は、評価値に基づいて、第1文字のそれぞれの文字位置を決定すると共に、決定された文字位置から最適な文字間隔である最適文字間サイズを決定し、第2文字認識手段は、最適文字間サイズに応じて複数の第2文字領域の位置を設定することが好ましい。   At this time, the first character recognizing means determines each character position of the first character based on the evaluation value, determines an optimal character size that is an optimal character spacing from the determined character position, The two-character recognition means preferably sets the positions of the plurality of second character areas according to the optimum inter-character size.

一実施形態では、第1文字認識手段は、複数の第1文字領域の各位置について得られる文字認識結果について、評価値に基づいて順位づけを行う。第1文字認識手段は、文字領域サイズのそれぞれについて、複数の第1文字領域の各位置について得られる文字認識結果であって順位が1位である文字認識結果のうちから評価値が高いm個(mは、Nよりも大きい所定数)を抽出すると共にm個の文字認識結果の評価値の平均値である第1平均値を算出し、第1文字認識手段は、第1平均値が最も高い文字領域サイズを最適文字領域サイズと決定することが好ましい。 In one embodiment, the first character recognition unit ranks the character recognition results obtained for each position of the plurality of first character regions based on the evaluation value. First character recognition means, for each character area size, ranking a character recognition results obtained for each position of the plurality of first character region has a higher evaluation value from among the character recognition result is one of m C 1 (m C is a predetermined number greater than N C ) is extracted, and a first average value that is an average value of evaluation values of m C character recognition results is calculated. It is preferable to determine the character region size having the highest average value as the optimum character region size.

この場合、第1文字認識手段は、文字領域サイズのそれぞれについて、m個の文字認識結果の評価値に対応する輝度値を有する画素が、m個の文字認識結果にそれぞれに対応する文字領域の位置に位置している画像である評価値−輝度値変換プロット画像を生成すると共に評価値−輝度値変換プロット画像に対して2値化処理を行って2値化画像を生成することが好ましい。第1文字認識手段は、2値化画像に対してラベリング処理を行って同一色である連続した画素の集合のそれぞれにラベルを付与し、ラベルのそれぞれについて、ラベルに属する画素に対応する文字認識結果の評価値の平均値である第2平均値を算出し、第1文字認識手段は、第2平均値が高いラベルから順に、各ラベルのそれぞれの重心位置と他のラベルとの重心位置との間の距離を算出し、他のラベルの重心位置との距離が所定の閾値以下になるような重心位置を有する場合に各ラベルを排除する処理をN個のラベルが残されるまで繰り返して行う。また、第1文字認識手段は、残存してN個のラベルのそれぞれについて、それぞれに属する画素のうち、対応する文字認識得結果の評価値が最も高い画素を選定し、評価値が最も高い画素の位置を第1文字の文字位置として決定し、決定された文字位置から最適な文字間隔である最適文字間サイズを決定する。第2文字認識手段は、最適文字間サイズに応じて複数の第2文字領域の位置を設定する。 In this case, for each character area size, the first character recognizing means includes pixels having luminance values corresponding to the evaluation values of m C character recognition results, corresponding to the m C character recognition results. An evaluation value-luminance value conversion plot image, which is an image located at a region position, is generated and a binarization process is performed on the evaluation value-luminance value conversion plot image to generate a binarized image. preferable. The first character recognition means performs a labeling process on the binarized image to give a label to each set of continuous pixels having the same color, and for each label, character recognition corresponding to a pixel belonging to the label A second average value that is an average value of the evaluation values of the results is calculated, and the first character recognizing unit sequentially calculates the centroid position of each label and the centroid position of other labels in order from the label having the second highest average value. The process of removing each label is repeated until N C labels are left when the distance between the labels is calculated and the center of gravity has a center of gravity such that the distance from the center of gravity of another label is equal to or less than a predetermined threshold. Do. The first character recognizing means selects, for each of the remaining N C labels, the pixel having the highest evaluation value of the corresponding character recognition result as the pixel belonging to each of the N labels, and has the highest evaluation value The pixel position is determined as the character position of the first character, and the optimal character size, which is the optimal character spacing, is determined from the determined character position. The second character recognition means sets the positions of the plurality of second character areas according to the optimum inter-character size.

一実施形態では、文字認識装置が、更に、文字列のうち、第1端と反対側の第2端からN個は、の文字である第3文字について文字認識を行う第3文字認識手段と、文字列の第2端からN個は、の文字以外の文字である第4文字について文字認識を行う第4文字認識手段と、最終文字認識結果決定手段とを具備していてもよい。第3文字認識手段は、第3文字についての文字認識において、様々な文字領域サイズの複数の第3文字領域をグレースケール画像の各位置に設定し、複数の第3文字領域のそれぞれについて文字認識処理を行って文字認識結果と評価値とを算出し、算出された評価値に基づいて、第3文字の文字認識結果と、最適な文字領域のサイズである第2最適文字領域サイズとを決定する。第4文字認識手段は、第2最適文字領域サイズを有する複数の第4文字領域のグレースケール画像の各位置に設定し、複数の第4文字領域のそれぞれについて文字認識処理を行って文字認識結果と評価値とを算出し、且つ、算出された評価値に基づいて、第4文字の文字認識結果を決定する。最終文字認識結果決定手段は、第1文字認識手段及び第2文字認識手段によって得られた文字列の特定文字の文字認識結果が、第3文字認識手段及び第4文字認識手段によって得られた特定文字の文字認識結果と一致する場合、一致する文字認識結果を特定文字の最終的な文字認識結果として決定する。一致しない場合、最終文字認識結果決定手段は、第1文字認識手段及び第2文字認識手段によって得られた特定文字の文字認識結果と、第3文字認識手段及び第4文字認識手段によって得られた特定文字の文字認識結果とのうち評価値が高い方の文字認識結果を、特定文字の最終的な文字認識結果として決定する。 In one embodiment, the character recognition device further includes third character recognition means for performing character recognition on the third character that is N C characters from the second end opposite to the first end of the character string. N C characters from the second end of the character string may include a fourth character recognition unit that performs character recognition on a fourth character that is a character other than the character, and a final character recognition result determination unit. . In the character recognition for the third character, the third character recognition means sets a plurality of third character areas having various character area sizes at respective positions in the gray scale image, and performs character recognition for each of the plurality of third character areas. Processing is performed to calculate a character recognition result and an evaluation value, and based on the calculated evaluation value, a character recognition result for the third character and a second optimum character area size that is an optimum character area size are determined. To do. The fourth character recognition means sets each position of the gray scale image of the plurality of fourth character areas having the second optimum character area size, performs character recognition processing for each of the plurality of fourth character areas, and performs a character recognition result. And the evaluation value, and the character recognition result of the fourth character is determined based on the calculated evaluation value. The final character recognition result determining means is a method in which the character recognition result of the specific character of the character string obtained by the first character recognition means and the second character recognition means is obtained by the third character recognition means and the fourth character recognition means. When the character recognition result matches the character recognition result, the matching character recognition result is determined as the final character recognition result of the specific character. If they do not match, the final character recognition result determination means is obtained by the character recognition result of the specific character obtained by the first character recognition means and the second character recognition means, and by the third character recognition means and the fourth character recognition means. The character recognition result having the higher evaluation value among the character recognition results of the specific character is determined as the final character recognition result of the specific character.

一実施形態では、第1文字認識手段が、類似文字を登録した類似文字データを記憶する記憶手段を備え、複数の第1文字領域のそれぞれについて文字認識処理を行って得られた文字認識結果のうち類似文字に一致する文字認識結果及びその評価値を用いずに最適文字領域サイズを決定する。   In one embodiment, the first character recognition means includes storage means for storing similar character data in which similar characters are registered, and a character recognition result obtained by performing character recognition processing for each of the plurality of first character areas. Of these, the optimum character area size is determined without using the character recognition result matching the similar character and its evaluation value.

本発明の他の観点では、特定方向に並んだ文字で構成される文字列が映されたグレースケール画像について文字認識を行う文字認識装置が提供される。当該文字認識装置は、文字列のうち、端からN個(Nは、2以上の所定値)は、の文字である第1文字について文字認識を行う第1文字認識手段と、文字列の端からN個以外の文字である第2文字について文字認識を行う第2文字認識手段とを具備する。第1文字認識手段は、第1文字についての文字認識において、様々な文字領域サイズの複数の第1文字領域をグレースケール画像の各位置に設定し、複数の第1文字領域のそれぞれについて文字認識処理を行って文字認識結果と評価値とを算出し、算出された評価値に基づいて、第1文字の文字認識結果と第1文字のそれぞれの文字位置を決定すると共に、決定された文字位置から最適な文字間隔である最適文字間サイズを決定する。第2文字認識手段は、最適文字間サイズに応じて複数の第2文字領域をグレースケール画像の各位置に設定し、複数の第2文字領域のそれぞれについて文字認識処理を行って文字認識結果と評価値とを算出し、且つ、複数の第2文字領域のそれぞれについて算出された文字認識結果と評価値に基づいて、第2文字の文字認識結果を決定する。 In another aspect of the present invention, there is provided a character recognition device that performs character recognition on a grayscale image on which a character string composed of characters arranged in a specific direction is displayed. The character recognition apparatus, in the character string, N C-number (N C is 2 or more predetermined value) from the edge includes a first character recognition means for performing character recognition for the first character is a character of the string Second character recognition means for performing character recognition on the second character, which is a character other than N C characters, from the end of. In the character recognition for the first character, the first character recognition means sets a plurality of first character regions having various character region sizes at respective positions in the gray scale image, and performs character recognition for each of the plurality of first character regions. A character recognition result and an evaluation value are calculated by performing processing, and the character recognition result of the first character and each character position of the first character are determined based on the calculated evaluation value, and the determined character position To determine the optimum character spacing, which is the optimum character spacing. The second character recognition means sets a plurality of second character areas at each position of the grayscale image according to the optimum inter-character size, performs character recognition processing for each of the plurality of second character areas, The evaluation value is calculated, and the character recognition result of the second character is determined based on the character recognition result and the evaluation value calculated for each of the plurality of second character regions.

本発明の更に他の観点では、特定方向に並んだ文字で構成される文字列が映されたグレースケール画像について文字認識を行う文字認識方法が提供される。当該文字認識方法は、文字列のうち、端からN個(Nは、2以上の所定値)は、の文字である第1文字について文字認識を行うステップと、文字列の端からN個以外の文字である第2文字について文字認識を行うステップとを具備する。第1文字についての文字認識においては、様々な文字領域サイズの複数の第1文字領域をグレースケール画像の各位置に設定し、複数の第1文字領域のそれぞれについて文字認識処理を行って文字認識結果と評価値とを算出し、算出された評価値に基づいて、第1文字の文字認識結果と、最適な文字領域のサイズである第1最適文字領域サイズとを決定する。第2文字についての文字認識においては、第1最適文字領域サイズを有する複数の第2文字領域をグレースケール画像の各位置に設定し、複数の第2文字領域のそれぞれについて文字認識処理を行って文字認識結果と評価値とを算出し、且つ、複数の第2文字領域のそれぞれについて算出された文字認識結果と評価値に基づいて、第2文字の文字認識結果を決定する。 In still another aspect of the present invention, there is provided a character recognition method for performing character recognition on a grayscale image in which a character string composed of characters arranged in a specific direction is displayed. The character recognition method, in the character string, N C-number (N C is 2 or more predetermined value) from the edge includes the step of performing character recognition for the first character is a letter, N from the end of the string Performing character recognition for a second character other than C characters. In character recognition for the first character, a plurality of first character regions having various character region sizes are set at respective positions in the gray scale image, and character recognition processing is performed for each of the plurality of first character regions. A result and an evaluation value are calculated, and based on the calculated evaluation value, a character recognition result of the first character and a first optimum character area size which is an optimum character area size are determined. In character recognition for the second character, a plurality of second character areas having a first optimum character area size are set at each position of the grayscale image, and character recognition processing is performed for each of the plurality of second character areas. The character recognition result and the evaluation value are calculated, and the character recognition result of the second character is determined based on the character recognition result and the evaluation value calculated for each of the plurality of second character areas.

本発明の更に他の観点では、特定方向に並んだ文字で構成される文字列が映されたグレースケール画像について文字認識を行う文字認識方法が提供される。当該文字認識方法は、文字列のうち、端からN個(Nは、2以上の所定値)は、の文字である第1文字について文字認識を行うステップと、文字列の端からN個以外の文字である第2文字について文字認識を行うステップとを具備する。第1文字についての文字認識においては、第1文字についての文字認識において、様々な文字領域サイズの複数の第1文字領域をグレースケール画像の各位置に設定し、複数の第1文字領域のそれぞれについて文字認識処理を行って文字認識結果と評価値とを算出し、算出された評価値に基づいて、第1文字の文字認識結果と第1文字のそれぞれの文字位置を決定すると共に、決定された文字位置から最適な文字間隔である最適文字間サイズを決定する。第2文字についての文字認識においては、最適文字間サイズに応じて複数の第2文字領域をグレースケール画像の各位置に設定し、複数の第2文字領域のそれぞれについて文字認識処理を行って文字認識結果と評価値とを算出し、且つ、複数の第2文字領域のそれぞれについて算出された文字認識結果と評価値に基づいて、第2文字の文字認識結果を決定する。 In still another aspect of the present invention, there is provided a character recognition method for performing character recognition on a grayscale image in which a character string composed of characters arranged in a specific direction is displayed. The character recognition method, among the strings, N C-number (N C is 2 or more predetermined value) from the end includes the step of performing character recognition for the first character is a letter, N from the end of the string Performing character recognition for a second character other than C characters. In character recognition for the first character, in character recognition for the first character, a plurality of first character areas of various character area sizes are set at respective positions in the grayscale image, and each of the plurality of first character areas is set. Character recognition processing and an evaluation value are calculated with respect to the character recognition result, and the character recognition result of the first character and each character position of the first character are determined and determined based on the calculated evaluation value. The optimum character spacing, which is the optimum character spacing, is determined from the determined character position. In character recognition for the second character, a plurality of second character areas are set at respective positions in the grayscale image in accordance with the optimum inter-character size, and character recognition processing is performed for each of the plurality of second character areas. The recognition result and the evaluation value are calculated, and the character recognition result of the second character is determined based on the character recognition result and the evaluation value calculated for each of the plurality of second character areas.

本発明の更に他の観点では、特定方向に並んだ文字で構成される文字列が映されたグレースケール画像について文字認識を演算装置に行わせるプログラムが提供される。当該プログラムは、文字列のうち、端からN個(Nは、2以上の所定値)は、の文字である第1文字について文字認識を行うステップと、文字列の端からN個以外の文字である第2文字について文字認識を行うステップとを演算装置に実行させる。第1文字についての文字認識においては、様々な文字領域サイズの複数の第1文字領域をグレースケール画像の各位置に設定し、複数の第1文字領域のそれぞれについて文字認識処理を行って文字認識結果と評価値とを算出し、算出された評価値に基づいて、第1文字の文字認識結果と、最適な文字領域のサイズである第1最適文字領域サイズとを決定する。第2文字についての文字認識においては、第1最適文字領域サイズを有する複数の第2文字領域をグレースケール画像の各位置に設定し、複数の第2文字領域のそれぞれについて文字認識処理を行って文字認識結果と評価値とを算出し、且つ、複数の第2文字領域のそれぞれについて算出された文字認識結果と評価値に基づいて、第2文字の文字認識結果を決定する。 In still another aspect of the present invention, there is provided a program that causes an arithmetic device to perform character recognition on a grayscale image on which a character string composed of characters arranged in a specific direction is displayed. The program includes a step of performing character recognition for the first character that is N C characters from the end (N C is a predetermined value of 2 or more), and N C characters from the end of the character string. And a step of performing character recognition on the second character that is a character other than the above. In character recognition for the first character, a plurality of first character regions having various character region sizes are set at respective positions in the gray scale image, and character recognition processing is performed for each of the plurality of first character regions. A result and an evaluation value are calculated, and based on the calculated evaluation value, a character recognition result of the first character and a first optimum character area size which is an optimum character area size are determined. In character recognition for the second character, a plurality of second character areas having a first optimum character area size are set at each position of the grayscale image, and character recognition processing is performed for each of the plurality of second character areas. The character recognition result and the evaluation value are calculated, and the character recognition result of the second character is determined based on the character recognition result and the evaluation value calculated for each of the plurality of second character areas.

本発明の更に他の観点では、特定方向に並んだ文字で構成される文字列が映されたグレースケール画像について文字認識を演算装置に行わせるプログラムが提供される。当該プログラムは、文字列のうち、端からN個(Nは、2以上の所定値)は、の文字である第1文字について文字認識を行うステップと、文字列の端からN個以外の文字である第2文字について文字認識を行うステップとを演算装置に実行させる。第1文字についての文字認識においては、第1文字についての文字認識において、様々な文字領域サイズの複数の第1文字領域をグレースケール画像の各位置に設定し、複数の第1文字領域のそれぞれについて文字認識処理を行って文字認識結果と評価値とを算出し、算出された評価値に基づいて、第1文字の文字認識結果と第1文字のそれぞれの文字位置を決定すると共に、決定された文字位置から最適な文字間隔である最適文字間サイズを決定する。第2文字についての文字認識においては、最適文字間サイズに応じて複数の第2文字領域をグレースケール画像の各位置に設定し、複数の第2文字領域のそれぞれについて文字認識処理を行って文字認識結果と評価値とを算出し、且つ、複数の第2文字領域のそれぞれについて算出された文字認識結果と評価値に基づいて、第2文字の文字認識結果を決定する。 In still another aspect of the present invention, there is provided a program that causes an arithmetic device to perform character recognition on a grayscale image on which a character string composed of characters arranged in a specific direction is displayed. The program includes a step of performing character recognition for the first character that is N C characters from the end (N C is a predetermined value of 2 or more), and N C characters from the end of the character string. And a step of performing character recognition on the second character that is a character other than the above. In character recognition for the first character, in character recognition for the first character, a plurality of first character areas of various character area sizes are set at respective positions in the grayscale image, and each of the plurality of first character areas is set. Character recognition processing and an evaluation value are calculated with respect to the character recognition result, and the character recognition result of the first character and each character position of the first character are determined and determined based on the calculated evaluation value. The optimum character spacing, which is the optimum character spacing, is determined from the determined character position. In character recognition for the second character, a plurality of second character areas are set at respective positions in the grayscale image in accordance with the optimum inter-character size, and character recognition processing is performed for each of the plurality of second character areas. The recognition result and the evaluation value are calculated, and the character recognition result of the second character is determined based on the character recognition result and the evaluation value calculated for each of the plurality of second character areas.

本発明によれば、グレースケール画像に対して文字認識処理を行う際に、文字認識の精度の向上と演算量の低減とを同時に実現させることができる。   According to the present invention, when character recognition processing is performed on a grayscale image, it is possible to simultaneously improve the accuracy of character recognition and reduce the amount of calculation.

本発明の一実施形態における文字認識装置の構成を示すブロック図である。It is a block diagram which shows the structure of the character recognition apparatus in one Embodiment of this invention. 本実施形態において文字認識処理が行われるプレート領域画像の例を示す概念図である。It is a conceptual diagram which shows the example of the plate area | region image in which character recognition processing is performed in this embodiment. 本実施形態の文字認識方法の概要を示すフローチャートである。It is a flowchart which shows the outline | summary of the character recognition method of this embodiment. 本実施形態においてプレート領域画像に設定される文字領域、及び、該文字領域の位置の定義を示す図である。It is a figure which shows the definition of the character area set to a plate area image in this embodiment, and the position of this character area. 本実施形態の文字認識方法における、一方の端からN文字についての処理を示すフローチャートである。It is a flowchart which shows the process about NC character from one end in the character recognition method of this embodiment. 領域位置(i,j)についての文字認識処理の内容を概念的に示す図である。It is a figure which shows notionally the content of the character recognition process about area | region position (i, j). 本実施形態のステップS15において行われる、領域サイズ#kについて行われるデータ処理の内容を概念的に示す図である。It is a figure which shows notionally the content of the data processing performed about area | region size #k performed in step S15 of this embodiment. 本実施形態において生成される、評価値−輝度値変換プロット画像を概念的に示す図である。It is a figure which shows notionally the evaluation value-luminance value conversion plot image produced | generated in this embodiment. 本実施形態の文字領域サイズ決定処理において使用される、領域サイズ#kについて得られた評価値の平均値μのリストである。It is a list of average values μ k of evaluation values obtained for a region size #k used in the character region size determination process of the present embodiment. 本実施形態における、文字位置及び文字間サイズを決定する処理を示す図である。It is a figure which shows the process which determines the character position and the size between characters in this embodiment. 一方の端からN+1文字目について行われる文字認識処理の例を示す概念図である。It is a conceptual diagram showing an example of the character recognition process performed for N C +1 th character from one end.

図1は、本発明の一実施形態における文字認識装置1の構成を示すブロック図である。本実施形態では、文字認識装置1が、ナンバープレート認識に用いられる。即ち、文字認識装置1は、外部から供給されたプレート領域画像データ21に対して文字認識処理を行ってプレート認識データ22を生成する。ここで、プレート領域画像データ21とは、プレート領域画像、即ち、ナンバープレート(自動車登録番号標又は車両番号標)が映された画像の画像データであり、例えば、車両を撮影した撮像画像から、ナンバープレートに対応する部分を切り出す画像処理によって得られる。プレート領域画像データ21は、グレースケール画像の画像データであることに留意されたい。また、プレート認識データ22とは、文字認識処理によって得られた文字認識結果(即ち、認識された文字)を示すデータである。   FIG. 1 is a block diagram showing a configuration of a character recognition device 1 according to an embodiment of the present invention. In the present embodiment, the character recognition device 1 is used for license plate recognition. In other words, the character recognition device 1 performs character recognition processing on the plate area image data 21 supplied from the outside to generate plate recognition data 22. Here, the plate area image data 21 is image data of a plate area image, that is, an image in which a license plate (automobile registration number mark or vehicle number mark) is projected. For example, from a captured image obtained by photographing a vehicle, It is obtained by image processing that cuts out a portion corresponding to the license plate. It should be noted that the plate area image data 21 is grayscale image data. The plate recognition data 22 is data indicating a character recognition result (that is, a recognized character) obtained by the character recognition process.

文字認識装置1は、画像処理IC(integrated circuit)2と、外部インターフェース3と、外部記憶装置4と、メモリ5と、ROM(read only memory)6とを備えている。外部インターフェース3は、外部から受け取ったプレート領域画像データ21を、画像処理IC2に供給する。外部記憶装置4は、文字認識装置1における文字認識処理において生成されるデータを保存する。外部記憶装置4に保存されるデータは、プレート認識データ22を含んでいる。メモリ5は、画像処理IC2による演算処理のワーキングエリアとして使用される。ROM6は、画像処理IC2によって実行されるプログラムを保存している。ROM6に記憶されているプログラムは、文字認識処理を実行するためのプログラムである文字認識ソフトウェア6aを含んでいる。   The character recognition device 1 includes an image processing IC (integrated circuit) 2, an external interface 3, an external storage device 4, a memory 5, and a ROM (read only memory) 6. The external interface 3 supplies the plate area image data 21 received from the outside to the image processing IC 2. The external storage device 4 stores data generated in the character recognition process in the character recognition device 1. Data stored in the external storage device 4 includes plate recognition data 22. The memory 5 is used as a working area for arithmetic processing by the image processing IC 2. The ROM 6 stores a program executed by the image processing IC 2. The program stored in the ROM 6 includes character recognition software 6a that is a program for executing character recognition processing.

画像処理IC2は、演算モジュール11と、画像入力インターフェース12と、データ入出力インターフェース13と、メモリコントローラ14と、ROMコントローラ15とを備えている。演算モジュール11と、画像入力インターフェース12と、データ入出力インターフェース13と、メモリコントローラ14と、ROMコントローラ15とは、内部バス16によって接続されている。演算モジュール11は、メモリ5をワーキングエリアとして使用しながら文字認識ソフトウェア6aを実行して、プレート領域画像データ21に対する文字認識処理を行う。画像入力インターフェース12は、画像処理IC2にプレート領域画像データ21を入力するために用いられるインターフェースである。データ入出力インターフェース13は、外部記憶装置4へのアクセスを行うためのインターフェースである。メモリコントローラ14は、メモリ5へのアクセスを行うためのインターフェースである。また、ROMコントローラ15は、ROM6へのアクセスを行うためのインターフェースである。   The image processing IC 2 includes an arithmetic module 11, an image input interface 12, a data input / output interface 13, a memory controller 14, and a ROM controller 15. The arithmetic module 11, the image input interface 12, the data input / output interface 13, the memory controller 14, and the ROM controller 15 are connected by an internal bus 16. The arithmetic module 11 executes the character recognition software 6 a while using the memory 5 as a working area, and performs character recognition processing on the plate area image data 21. The image input interface 12 is an interface used for inputting the plate area image data 21 to the image processing IC 2. The data input / output interface 13 is an interface for accessing the external storage device 4. The memory controller 14 is an interface for accessing the memory 5. The ROM controller 15 is an interface for accessing the ROM 6.

以下に述べられる文字認識方法の各処理は、図1に示されているハードウェアを用いて実行される。以下では、本実施形態の文字認識方法について、詳細に説明する。   Each process of the character recognition method described below is executed using the hardware shown in FIG. Below, the character recognition method of this embodiment is demonstrated in detail.

図2は、本実施形態の文字認識方法において文字認識処理が行われるプレート領域画像データ21の画像、即ち、プレート領域画像の例を図示している。本実施形態では、プレート領域画像は、グレースケール画像であり、車両を撮影して得られる車両撮像画像から、ナンバープレートに対応する部分を切り出すことによって得られる。以下における説明では、プレート領域画像に定められたxy座標系を用いて説明を行う。ここで、x軸はプレート領域画像の文字幅方向(横方向)に規定され、y軸はプレート領域画像の文字高さ方向(縦方向)に規定される。本実施形態の文字認識方法は、プレート領域画像において、各文字のサイズがほぼ同じであるということを前提としている。このような前提は、例えばナンバープレート認識を行う場合には妥当である。   FIG. 2 illustrates an example of an image of plate area image data 21 on which character recognition processing is performed in the character recognition method of the present embodiment, that is, an example of a plate area image. In the present embodiment, the plate region image is a grayscale image, and is obtained by cutting out a portion corresponding to a license plate from a vehicle captured image obtained by photographing a vehicle. In the following description, description will be made using the xy coordinate system defined for the plate region image. Here, the x axis is defined in the character width direction (horizontal direction) of the plate area image, and the y axis is defined in the character height direction (vertical direction) of the plate area image. The character recognition method of the present embodiment is based on the premise that the size of each character is substantially the same in the plate area image. Such a premise is appropriate for license plate recognition, for example.

図3は、本実施形態における文字認識方法の概略を示すフローチャートである。上述の文字認識ソフトウェア6aは、この文字認識方法を実行するためのプログラムコード群である。   FIG. 3 is a flowchart showing an outline of the character recognition method in this embodiment. The character recognition software 6a described above is a program code group for executing this character recognition method.

本実施形態の文字認識方法では、まず、一方の端からN個の文字について文字認識処理が行われる(ステップS01)。ここで、Nは、指定の文字数である。図2のプレート領域画像は、ステップS01において左端の3個の文字について文字認識処理を行う例を示している。 In the character recognition method of the present embodiment, first, character recognition processing is performed for N C characters from one end (step S01). Here, N C is the designated number of characters. The plate area image in FIG. 2 shows an example in which character recognition processing is performed on the leftmost three characters in step S01.

ステップS01における文字認識処理においては、様々なサイズの文字領域がプレート領域画像の各位置に設定され、設定された文字領域のそれぞれについて文字認識処理が行われる。ここで、文字領域とは、各文字が存在すると考えられる領域のことである。図4は、文字領域の例を示す図であり、本実施形態では、文字領域31が矩形(即ち、(正方形を含む)長方形)であり、各文字領域31の位置は、文字領域31の中心、即ち、対角線32の交点33として定義される。更に、文字認識処理において算出された評価値に基づいて、最適な文字認識結果(即ち、認識された文字)、最適な文字領域の位置及びサイズが探索される。   In the character recognition process in step S01, character areas of various sizes are set at each position of the plate area image, and the character recognition process is performed for each of the set character areas. Here, the character area is an area where each character is considered to exist. FIG. 4 is a diagram illustrating an example of a character area. In the present embodiment, the character area 31 is a rectangle (that is, a rectangle (including a square)), and the position of each character area 31 is the center of the character area 31. That is, it is defined as the intersection 33 of the diagonal lines 32. Furthermore, based on the evaluation value calculated in the character recognition process, the optimum character recognition result (ie, the recognized character) and the optimum position and size of the character region are searched.

続いて、ステップS01におけるN個の文字についての文字認識処理で得られた情報を用いて、残りの文字についての文字認識処理が行われる(ステップS02)。ステップS02では、ステップS01における文字認識処理で得られた文字領域の大きさ、及び、文字間隔に関する情報が利用される。本実施形態の文字認識方法は、このような手法によってステップS02の文字認識処理における探索範囲を低減させ、文字認識の精度の向上と演算量の低減とを同時に実現させるものである。以下、各ステップにおける処理について詳細に説明する。 Subsequently, the character recognition process for the remaining characters is performed using the information obtained in the character recognition process for the N C characters in step S01 (step S02). In step S02, information on the size of the character region and the character spacing obtained by the character recognition process in step S01 is used. The character recognition method of the present embodiment reduces the search range in the character recognition process in step S02 by such a method, and simultaneously improves the accuracy of character recognition and reduces the amount of calculation. Hereinafter, the process in each step will be described in detail.

図5は、ステップS01における、N個の文字についての文字認識処理の詳細を示すフローチャートである。ステップS01における処理では、概略的には、初期設定(ステップS11)が行われた後、様々なサイズの文字領域が様々な位置に設定され、設定された文字領域のそれぞれについて文字認識処理が行われる(ステップS12〜S15)。更に、文字認識処理において算出される評価値に基づいて、最適な文字領域サイズ、文字位置、文字間サイズ(文字間隔)、及び、最適な文字認識結果が決定される(ステップS16〜S18)。以下では、ステップS01におけるN個の文字についての文字認識処理について詳細に説明する。 FIG. 5 is a flowchart showing details of the character recognition processing for N C characters in step S01. In the process in step S01, generally, after initial setting (step S11), character areas of various sizes are set at various positions, and character recognition processing is performed for each of the set character areas. (Steps S12 to S15). Furthermore, based on the evaluation value calculated in the character recognition process, the optimum character area size, character position, character spacing (character spacing), and optimum character recognition result are determined (steps S16 to S18). Hereinafter, the character recognition process for N C characters in step S01 will be described in detail.

ステップS11では、文字領域初期サイズと、文字領域サイズ増分(x方向増分及びy方向増分)と、文字領域サイズの最大値(x方向最大値及びy方向最大値)、及び、文字領域のシフト量とが定義される。文字領域初期サイズとは、最初に設定される文字領域のサイズであり、当該文字領域のx方向におけるサイズ(即ち、文字領域の幅)と、y方向におけるサイズ(即ち、文字領域の高さ)とを含んでいる。文字領域サイズ増分とは、最適な文字領域の探索において文字領域のサイズを変更する際の増分であり、x方向増分とy方向増分とを含んでいる。文字領域サイズ最大値とは、最適な文字領域の探索において文字領域のサイズを変更する際のサイズの最大値であり、x方向最大値とy方向最大値とを含んでいる。文字領域のシフト量は、最適な文字領域の探索において文字領域の位置を変更する際の文字領域の位置の変化量の指定値であり、x方向シフト量とy方向シフト量とを含んでいる。これらの初期設定は、車両撮像画像におけるプレート領域画像の位置に応じて決定される。   In step S11, the character area initial size, the character area size increment (increase in the x direction and the y direction), the maximum value of the character area size (the maximum value in the x direction and the maximum value in the y direction), and the shift amount of the character area And are defined. The initial character area size is the size of the character area initially set. The size of the character area in the x direction (that is, the width of the character area) and the size in the y direction (that is, the height of the character area). Including. The character area size increment is an increment when the size of the character area is changed in the search for the optimum character area, and includes an x-direction increment and a y-direction increment. The maximum character area size is the maximum size when changing the size of the character area in the search for the optimal character area, and includes the maximum value in the x direction and the maximum value in the y direction. The shift amount of the character area is a designated value of the change amount of the character area when the position of the character area is changed in the search for the optimum character area, and includes the x-direction shift amount and the y-direction shift amount. . These initial settings are determined according to the position of the plate region image in the vehicle captured image.

ステップS12〜S15の処理は、可能な領域サイズの数と同じ数だけ繰り返して行われる。まず、文字領域のサイズが設定される(ステップS12)。初回の処理では、文字領域のサイズが、初期設定として定義された文字領域初期サイズに設定される。一方、2回目以降の処理では、文字領域初期サイズをx方向増分及びy方向増分に応じて変化させたサイズが文字領域のサイズとして選択される。ステップS12で設定された文字領域のサイズを、以下では、領域サイズ#kという。kは、領域サイズを表わすインデックスである。   The processes in steps S12 to S15 are repeated as many times as the number of possible area sizes. First, the size of the character area is set (step S12). In the first process, the size of the character area is set to the character area initial size defined as the initial setting. On the other hand, in the second and subsequent processing, a size obtained by changing the initial size of the character region in accordance with the x-direction increment and the y-direction increment is selected as the size of the character region. The size of the character area set in step S12 is hereinafter referred to as area size #k. k is an index representing the region size.

更に、文字領域の位置が設定される(ステップS13)。ステップS13で設定された位置を、以下では、領域位置(i,j)という。ここで、iは、x軸方向の位置を表すインデックスであり、jは、y軸方向の位置を表すインデックスである。上述のように、本実施形態では、文字領域が矩形であり、該文字領域の位置が文字領域の中心として定義される。初回のステップS13の処理では、文字領域の位置は、所定の処理開始位置に設定される。プレート領域画像においては、左からNc個の文字が存在する位置、特に、最も左側に位置する文字の位置が、ある程度の範囲で想定可能であるから、処理開始位置は、想定される位置の範囲に応じて適宜に決めておけばよい。2回目以降の処理では、初期設定に含まれる文字領域のシフト量に応じて文字領域の位置を変更して文字領域の位置が設定される。   Further, the position of the character area is set (step S13). Hereinafter, the position set in step S13 is referred to as a region position (i, j). Here, i is an index representing a position in the x-axis direction, and j is an index representing a position in the y-axis direction. As described above, in this embodiment, the character area is rectangular, and the position of the character area is defined as the center of the character area. In the first process of step S13, the position of the character area is set to a predetermined process start position. In the plate region image, since the position where Nc characters exist from the left, in particular, the position of the leftmost character can be assumed within a certain range, the processing start position is the range of the assumed position. It may be determined appropriately according to the situation. In the second and subsequent processing, the position of the character area is set by changing the position of the character area in accordance with the shift amount of the character area included in the initial setting.

更に、ステップS13で位置が決定された文字領域について、文字認識処理が行われる(ステップS14)。ステップS13において文字領域の位置が領域位置(i,j)に決定された場合、ステップS14における文字認識処理では、領域位置(i,j)の文字領域についての文字認識結果(即ち、認識された文字)と、その評価値が得られる。更に、領域位置(i,j)の文字領域についての文字認識結果について評価値に基づいて順位づけが行われる。ステップS14における文字認識処理の具体的なアルゴリズムとしては、例えば、上述の非特許文献1に開示されているようなアルゴリズムを用いても良い。   Further, a character recognition process is performed for the character region whose position is determined in step S13 (step S14). When the position of the character area is determined to be the area position (i, j) in step S13, the character recognition result in the character area at the area position (i, j) in the character recognition process in step S14 (that is, recognized) Character) and its evaluation value. Furthermore, the character recognition results for the character region at the region position (i, j) are ranked based on the evaluation value. As a specific algorithm for the character recognition process in step S14, for example, an algorithm as disclosed in Non-Patent Document 1 described above may be used.

図6は、ステップS14における文字認識処理の具体例を示す図である。図2のプレート領域画像の文字認識処理を例にとると、左端の文字については、例えば、評価値が0.911である文字“S”が1位の文字認識結果として得られ、評価値が0.566である文字“2”が2位の文字認識結果として得られる。ここで、評価値は、0から1.0の範囲の値であり、文字認識処理において文字テンプレートとの一致度が高いほど、1.0二近い値となるとする。   FIG. 6 is a diagram showing a specific example of the character recognition process in step S14. Taking the character recognition processing of the plate area image of FIG. 2 as an example, for the leftmost character, for example, the character “S” with an evaluation value of 0.911 is obtained as the first character recognition result, and the evaluation value is The character “2” which is 0.566 is obtained as the second character recognition result. Here, the evaluation value is a value in the range of 0 to 1.0, and it is assumed that the higher the matching degree with the character template in the character recognition process, the closer to 1.0.

ステップS13、S14の処理は、文字領域の位置を変更しながら繰り返して行われる。ステップS13、S14の処理の繰り返しは、許容される文字領域の位置の範囲の全てについての文字認識処理が完了するまで行われる。プレート領域画像においては、左からNc個の文字が存在する位置がある程度想定可能であるから、許容される文字領域の位置の範囲は、想定される位置に応じて適宜に決めておけばよい。   Steps S13 and S14 are repeated while changing the position of the character area. The processes in steps S13 and S14 are repeated until the character recognition process is completed for all of the allowable character area positions. In the plate area image, a position where Nc characters are present from the left can be assumed to some extent. Therefore, the allowable range of the character area position may be appropriately determined according to the assumed position.

ステップS12で設定された領域サイズ#kについて、文字領域の許容される位置の全てについての文字認識処理が完了すると、評価値が上位の文字領域について、以下に述べられるデータ処理が行われる(ステップS15)。   When the character recognition processing is completed for all the allowable positions of the character area for the area size #k set in step S12, the data processing described below is performed for the character area with the higher evaluation value (step S12). S15).

ステップS15では、まず、図7に図示されているように、各領域位置(i,j)について、順位が1位である文字認識結果及び評価値が選択される。更に、順位が1位である全ての領域位置の文字認識結果のうちから、評価値が上位のm個の文字認識結果及び評価値が抽出される。更に、抽出された上位のm個の文字認識結果の評価値の平均値μが算出される。ここで、kは、領域サイズを表わすインデックスであり、μは、領域サイズ#kに対応して算出された上位のm個の文字認識結果の評価値の平均値を表わしている。 In step S15, first, as shown in FIG. 7, for each region position (i, j), the character recognition result and evaluation value having the first rank are selected. Further, from the character recognition results of all the region positions having the first rank, m C character recognition results and evaluation values having higher evaluation values are extracted. Further, an average value μ k of the evaluation values of the extracted upper m C character recognition results is calculated. Here, k is an index representing the region size, and μ k represents an average value of the evaluation values of the upper m C character recognition results calculated corresponding to the region size #k.

更に、領域サイズ#kに対応して算出された上位のm個(mは、所定値)の文字認識結果の評価値から、図8に示されている評価値−輝度値変換プロット画像が生成される。ここで、評価値−輝度値変換プロット画像とは、順位が1位である全ての領域位置の文字認識結果のうち評価値が上位のm個の文字認識結果のそれぞれについて、該文字認識結果の領域位置(i,j)に対応する画素が、該文字認識結果の評価値に対応する輝度値を有するとして生成された画像である。結果として、m個の画素について非零の輝度値が与えられることになる。他の画素は、輝度値が0に設定される。なお、所定値mは、Nよりも大きいように適宜に決定された値であり、Nの数倍(例えば、5倍)程度の値が所定値mとしてあらかじめ設定される。 Further, from the evaluation values of the upper m C (m C is a predetermined value) character recognition results calculated corresponding to the region size #k, the evaluation value-luminance value conversion plot image shown in FIG. Is generated. Here, the evaluation value-luminance value conversion plot image is the character recognition result for each of the m C character recognition results having the highest evaluation value among the character recognition results of all the region positions having the first rank. The pixel corresponding to the region position (i, j) is an image generated as having a luminance value corresponding to the evaluation value of the character recognition result. As a result, a non-zero luminance value is given for m C pixels. The brightness value of other pixels is set to 0. The predetermined value m C is a value that is appropriately determined to be larger than N C , and a value that is several times (for example, five times) N C is preset as the predetermined value m C.

図8には、評価値−輝度値変換プロット画像の例が図示されている。図8において、領域サイズ#kに対応する評価値−輝度値変換プロット画像は、符号24−kで図示されている。ここで、nは、可能な領域サイズの数である。後述のように、評価値−輝度値変換プロット画像は、文字位置の決定、及び、文字間サイズの決定に使用される。 FIG. 8 shows an example of an evaluation value-luminance value conversion plot image. In FIG. 8, the evaluation value-luminance value conversion plot image corresponding to the region size #k is indicated by reference numeral 24-k. Here, n S is the number of possible region sizes. As will be described later, the evaluation value-luminance value conversion plot image is used to determine the character position and the character size.

文字領域サイズを更新しながら、上記のステップS12〜S15の処理が繰り返して行われる。このとき、ステップS12においては、文字領域サイズから、直前の処理で用いられた文字領域サイズをx方向増分及びy方向増分に基づいて変更しながら文字領域サイズが設定される。また、ステップS15が各領域サイズについて行われるから、その結果、図9に図示されているように、各領域サイズ#kに対して評価値の平均値μが得られることになる。 While updating the character area size, the processes in steps S12 to S15 are repeated. At this time, in step S12, the character area size is set while changing the character area size used in the immediately preceding process from the character area size based on the x-direction increment and the y-direction increment. Further, since step S15 is performed for each region size, as a result, as shown in FIG. 9, an average evaluation value μ k is obtained for each region size #k.

可能な全ての文字領域サイズについて、ステップS12〜S15の処理が行われた後、文字領域サイズ決定処理が行われる(ステップS16)。ステップS16では、ステップS15で算出された平均値μのうち最も高いものに対応する領域サイズが、最終的に文字領域サイズとして採用される。後述されるように、ステップS16で採用された文字領域サイズは、N+1文字目以降の文字認識処理に使用される。 After all the possible character area sizes are processed in steps S12 to S15, a character area size determination process is performed (step S16). In step S16, the highest corresponding area size to those of the average value mu k calculated in step S15 is finally employed as the character area size. As will be described later, the character area size employed in step S16 is used for character recognition processing for the N C +1 and subsequent characters.

続いて、各文字の文字位置、及び、文字間サイズが決定される(ステップS17)。ここで、本実施形態では、各文字の文字位置は、当該文字に対応する文字領域の中心として定義され、更に、文字間サイズは、隣接する文字の文字位置の間の間隔として定義される。   Subsequently, the character position of each character and the inter-character size are determined (step S17). Here, in the present embodiment, the character position of each character is defined as the center of the character area corresponding to the character, and the inter-character size is defined as an interval between character positions of adjacent characters.

図10は、ステップS17における文字位置及び文字間サイズの決定の手順を示す概念図である。まず、ステップS16で採用された文字領域サイズに対応する評価値−輝度値変換プロット画像が選択される(ステップS21)。ステップS16で採用された文字領域サイズが領域サイズ#kである場合、評価値−輝度値変換プロット画像24−kが選択されることになる。   FIG. 10 is a conceptual diagram showing a procedure for determining the character position and the inter-character size in step S17. First, an evaluation value-luminance value conversion plot image corresponding to the character area size employed in step S16 is selected (step S21). When the character area size adopted in step S16 is the area size #k, the evaluation value-luminance value conversion plot image 24-k is selected.

更に、選択された評価値−輝度値変換プロット画像に対し、所定の輝度閾値で2値化する2値化処理が行われ、更に、2値化処理で得られた画像(2値化画像)に対してラベリング処理が行われる(ステップS22)。ラベリング処理とは、2値化画像について、同一色(白又は黒)である連続した画素に同一ラベルを割り振る処理のことである。本実施形態では、評価値−輝度値変換プロット画像のうち、輝度値が当該輝度閾値より高い画素が「白」の画素であり、そうでない画素が「黒」の画素であるとして2値化処理が行われ、更に、連続する「白」の画素の集合に対して同一ラベルが与えられる。図10では、ステップS22において、4つのラベル#1〜#4が与えられる例が図示されている。   Further, the selected evaluation value-luminance value conversion plot image is subjected to a binarization process for binarization with a predetermined luminance threshold, and an image obtained by the binarization process (binarized image). Is subjected to a labeling process (step S22). The labeling process is a process for assigning the same label to consecutive pixels of the same color (white or black) for the binarized image. In the present embodiment, in the evaluation value-luminance value conversion plot image, binarization processing is performed assuming that pixels whose luminance value is higher than the luminance threshold value are “white” pixels, and other pixels are “black” pixels. In addition, the same label is given to a set of consecutive “white” pixels. FIG. 10 illustrates an example in which four labels # 1 to # 4 are given in step S22.

ステップS22において決定されたラベルの数が、ステップS01で文字認識処理の対象となる文字の数(即ち、指定文字数N)よりも多い場合、文字位置として不適切なラベルの排除が行われる(ステップS23)。ステップS23では、まず、各ラベル#Lについて、評価値の平均値μが算出される。各ラベルに属する各画素の輝度値は、当該画素の位置にある文字領域の文字認識結果の評価値に対応しており、ラベル#Lに属する画素に対応する評価値の平均値がμとして算出される。更に、各ラベル#Lの重心位置が算出される。各ラベル#Lは、1又は複数の画素で構成されるから、各ラベル#Lの重心位置は、該ラベル#Lに属する画素の位置から算出される。 If the number of labels determined in step S22 is greater than the number of characters to be subjected to character recognition processing in step S01 (that is, the designated number of characters N C ), labels that are inappropriate as character positions are eliminated ( Step S23). In step S23, firstly, for each label #L, average mu L of the evaluation value is calculated. The luminance value of each pixel belonging to each label corresponds to the evaluation value of the character recognition result of the character area at the position of the pixel, and the average value of the evaluation values corresponding to the pixels belonging to the label #L is μ L Calculated. Further, the barycentric position of each label #L is calculated. Since each label #L is composed of one or a plurality of pixels, the barycentric position of each label #L is calculated from the positions of the pixels belonging to the label #L.

更に、平均値μが高いラベルから順に、各ラベルの重心位置と他のラベルとの重心位置との間の距離を算出し、他のラベルの重心位置との距離が所定の閾値DTH以下になるような重心位置を有する場合に当該ラベルを排除する処理が、指定文字数Nと同数のラベルが残されるまで繰り返して行われる。この処理により、各ラベルが、左端からN個の文字のそれぞれに対応づけられることになる。 Furthermore, in order from the higher average value mu L label, calculates the distance between the gravity center position between the position of the center of gravity and the other labels in each label, the distance between the center of gravity of the other labels is equal to or less than a predetermined threshold D TH process to eliminate the label if it has a center of gravity position such that is repeatedly performed until the same number of labels and specified number N C is left. By this processing, each label is associated with each of the N C characters from the left end.

更に、各ラベルの画素のうち、対応する文字認識結果の評価値が最も高い画素が選定され、評価値が最も高い文字認識結果の画素の位置が、各文字の文字位置として決定される(ステップS24)。ここで、本実施形態では、各文字の文字位置は、対応する文字領域の中心の位置として定義されることに留意されたい。   Further, among the pixels of each label, the pixel having the highest evaluation value of the corresponding character recognition result is selected, and the position of the pixel of the character recognition result having the highest evaluation value is determined as the character position of each character (step) S24). Here, it should be noted that in this embodiment, the character position of each character is defined as the center position of the corresponding character area.

更に、隣接する文字位置のx軸方向の距離が算出され、算出された距離に基づいて、文字間サイズ(即ち、文字間隔)が決定される。隣接する文字位置のx軸方向の距離が複数存在する場合、該複数の距離を演算することで文字間サイズが決定される。例えば、算出された該複数の距離の平均値を文字間サイズとしてもよい。後述されるように、ステップS24で決定された文字間サイズが、N+1文字目以降の文字認識処理に使用される。 Further, the distance between adjacent character positions in the x-axis direction is calculated, and the inter-character size (that is, the character spacing) is determined based on the calculated distance. When there are a plurality of distances in the x-axis direction between adjacent character positions, the inter-character size is determined by calculating the plurality of distances. For example, the calculated average value of the plurality of distances may be used as the inter-character size. As will be described later, the inter-character size determined in step S24 is used for the character recognition processing for the N C +1 and subsequent characters.

更に、ステップS17で決定された各文字の文字位置に位置し、且つ、ステップS16で決定された文字領域サイズを有する文字領域についての文字認識結果が、各文字の文字認識結果として選択される(ステップS18)。   Furthermore, the character recognition result for the character region located at the character position of each character determined in step S17 and having the character region size determined in step S16 is selected as the character recognition result for each character ( Step S18).

以上の手順により、左側からN文字の文字認識結果が得られると共に、最適な文字領域サイズ(即ち、ステップS16で決定された文字領域サイズ)、及び、最適な文字間サイズ(即ち、ステップS17で決定された文字間サイズ)が得られることになる。 By the above procedure, along with the character recognition results of N C character from the left side is obtained, the optimal character area size (i.e., character region size determined in step S16), and and, among the optimum character size (i.e., step S17 The inter-character size determined in (1) is obtained.

ステップS02:
続いて、残りの文字(本実施形態では、左側からN+1文字目以降の文字)について文字認識処理が行われる。残りの文字の文字認識処理においては、上述の処理で得られた最適な文字領域サイズ及び文字間サイズが用いられ、これにより、文字認識処理における探索範囲の低減が図られる。
Step S02:
Subsequently, character recognition processing is performed on the remaining characters (in this embodiment, the characters after the N C +1 character from the left). In the character recognition processing for the remaining characters, the optimum character area size and inter-character size obtained in the above-described processing are used, thereby reducing the search range in the character recognition processing.

図11は、N+1文字目の文字認識処理を説明する図である。N+1文字目の処理では、N文字目の文字位置(上述のステップS17で決定されている)から、上述の処理で得られた最適な文字間サイズDだけx軸方向にずれた位置に、N+1文字目の文字位置の基準位置が決定される。更に、その位置を基準位置及びその周辺の範囲で逐次に変化させながら文字領域を設定し、設定された各文字領域について文字認識処理が行われる。このとき、設定される文字領域の基準サイズ(幅及び高さ)としては、上述の処理で得られた最適な文字領域サイズが使用される。図11では、最適な文字領域サイズのうち、x方向のサイズ(即ち、幅)が記号“W”で示されており、y方向のサイズ(即ち、高さ)が記号“H”で示されている。この文字認識処理において設定される文字領域についても、幅及び高さが、基準サイズの幅及び高さ及びその周辺の範囲で逐次に変化させながら設定される。更に、文字認識処理において算出される評価値が最も高い文字認識結果(即ち、認識された文字)及び文字領域の位置が、N+1文字目の文字認識結果及び文字位置として決定される。 FIG. 11 is a diagram for explaining the character recognition process of the N C +1 character. In the process of the N C +1 character, the character position (determined in step S17 described above) shifted from the character position of the N C character in the x-axis direction by the optimum inter-character size D X obtained in the above process. As the position, the reference position of the character position of the N C +1 character is determined. Further, the character area is set while sequentially changing the position between the reference position and the surrounding area, and character recognition processing is performed for each set character area. At this time, as the reference size (width and height) of the character area to be set, the optimum character area size obtained by the above processing is used. In FIG. 11, among the optimum character region sizes, the size in the x direction (ie, width) is indicated by the symbol “W”, and the size in the y direction (ie, height) is indicated by the symbol “H”. ing. The width and height of the character area set in the character recognition process are set while sequentially changing the width and height of the reference size and the surrounding area. Further, the character recognition result (that is, the recognized character) having the highest evaluation value calculated in the character recognition process and the position of the character area are determined as the character recognition result and the character position of the N C +1 character.

更に、左側からN+2文字目以降の文字についても、同様にして処理が行われる。N+1文字目の文字位置(上述の処理で決定されている)から、文字間サイズDだけx軸方向にずれた位置に、N+2文字目の文字位置の基準位置が決定される。更に、文字領域を、該文字領域の位置を基準位置及びその周辺の範囲で逐次に変化させながら、且つ、該文字領域の幅及び高さを、基準サイズの幅及び高さ及びその周辺の範囲で逐次に変化させながら設定して、設定された各文字領域について文字認識処理が行われる。更に、文字認識処理において算出される評価値が最も高い文字認識結果(即ち、認識された文字)及び文字領域の位置が、N+2文字目の文字認識結果及び文字位置として決定される。以下、全ての文字について文字認識処理が完了するまで同様の処理が繰り返して行われる。 Furthermore, the same processing is performed for the characters after the N C + 2nd character from the left side. The reference position of the character position of the N C +2 character is determined at a position shifted in the x-axis direction by the inter-character size D X from the character position of the N C +1 character (determined by the above-described processing). . Further, the character area is sequentially changed by changing the position of the character area between the reference position and the surrounding area, and the width and height of the character area are changed to the width and height of the reference size and the surrounding area. The character recognition process is performed for each set character area. Further, the character recognition result (that is, the recognized character) and the character area position having the highest evaluation value calculated in the character recognition process are determined as the character recognition result and the character position of the N C + 2nd character. Thereafter, the same processing is repeated until the character recognition processing is completed for all characters.

ここで、プレート領域画像に映されるナンバープレートに複数の種類があることが想定される場合には、上述の処理で得られた文字間サイズの情報によってナンバープレートの種類を特定し、N+1文字目以降の文字認識処理において、特定されたナンバープレートの種類に応じた処理を行っても良い。例えば、特定の類似した文字への対策処理などを行ってもよい。 Here, when it is assumed that there are a plurality of types of license plates displayed in the plate region image, the type of the license plate is specified by the information on the inter-character size obtained by the above processing, and N C In the character recognition processing for the + 1st character and after, processing corresponding to the specified type of license plate may be performed. For example, a countermeasure process for a specific similar character may be performed.

以上に説明された、本実施形態による文字認識方法では、プレート領域画像に対する2値化処理を行わずに文字認識処理が行われる。このため、2値化処理に伴う問題を回避することができる。例えば、プレート領域画像に輝度が不均一な部分があっても文字認識が可能である。加えて、本実施形態の文字認識方法では、端からN文字の文字認識処理において得られる文字領域サイズ、及び、文字間サイズの情報を用いて残りの文字の文字認識処理が行われるため、該残りの文字の文字認識処理における探索範囲を低減することができる。 In the character recognition method according to the present embodiment described above, the character recognition process is performed without performing the binarization process on the plate area image. For this reason, the problem accompanying a binarization process can be avoided. For example, character recognition is possible even if the plate area image has a non-uniform luminance portion. In addition, in the character recognition method of the present embodiment, the character recognition process for the remaining characters is performed using the information on the character area size and the inter-character size obtained in the character recognition process for the NC character from the end. The search range in the character recognition process for the remaining characters can be reduced.

なお、上記の実施形態では、端からN文字の文字認識処理において得られる文字領域サイズ、及び、文字間サイズの両方の情報を用いて残りの文字の文字認識処理が行われるが、文字領域サイズ又は文字間サイズの一方のみの情報を用いて残りの文字の文字認識処理が行ってもよい。この場合でも、探索範囲を低減する効果は得られる。 In the above embodiment, the character recognition process for the remaining characters is performed using both the character area size and the inter-character size information obtained in the character recognition process for the NC character from the end. The character recognition processing for the remaining characters may be performed using only one of the size and the size between characters. Even in this case, the effect of reducing the search range can be obtained.

また、上述の実施形態では、左側の文字から順に文字認識処理が行われているが、順序は逆であってもよい。例えば、右側の文字から順に文字認識処理が行われても良い。また、上下方向に文字が並んでいる場合には、上側の文字から順に文字認識処理が行われても良く、逆に、下側の文字から順に文字認識処理が行われても良い。   Further, in the above-described embodiment, the character recognition processing is performed in order from the left character, but the order may be reversed. For example, character recognition processing may be performed in order from the right character. When the characters are arranged in the vertical direction, the character recognition process may be performed in order from the upper character, and conversely, the character recognition process may be performed in order from the lower character.

更に、互いに逆方向の順で上述の文字認識処理を2回行い、その文字認識処理で得られた文字認識結果を比較してもよい。この場合、ある文字の文字認識結果が異なる場合には、評価値が高い文字認識結果を、当該文字の最終的な文字認識結果として選択しても良い。   Furthermore, the character recognition processing described above may be performed twice in the order opposite to each other, and the character recognition results obtained by the character recognition processing may be compared. In this case, when a character recognition result of a certain character is different, a character recognition result having a high evaluation value may be selected as a final character recognition result of the character.

一変形例では、まず、上述の実施形態と同様に、左側の文字から順に文字認識処理を行うことで、各文字の文字認識結果及び評価値を得る。更に、右側の文字から順に文字認識処理を行うことで、各文字の文字認識結果及び評価値を得る。より具体的には、まず、右側のN文字についてステップS01と同様の処理を行って、当該N文字の文字認識結果及び評価値を得た後、残りの文字についてステップS02と同様の処理を行い、当該残りの文字の文字認識結果及び評価値を得る。この場合、当該残りの文字については、右側の文字から順に文字認識結果及び評価値を得る。その後、左側の文字から順に文字認識処理を行って得られた文字認識結果と、右側の文字から順に文字認識処理を行って得られた文字認識結果とが比較される。文字認識結果が同一である文字については、該同一の文字認識結果が、当該文字の最終的な文字認識結果として選択される。一方、文字認識結果が異なる文字については、評価値が高い文字認識結果が、当該文字の最終的な文字認識結果として選択される。 In a modification, first, as in the above-described embodiment, the character recognition process and the evaluation value of each character are obtained by performing the character recognition processing in order from the left character. Furthermore, the character recognition process and the evaluation value of each character are obtained by performing the character recognition processing in order from the right character. More specifically, first, the right N C characters by performing the same process as in step S01, after obtaining the character recognition result and the evaluation value of the N C characters, similarly to step S02 for the remaining characters The character recognition result and evaluation value of the remaining characters are obtained. In this case, for the remaining characters, a character recognition result and an evaluation value are obtained in order from the right character. Thereafter, the character recognition result obtained by performing the character recognition processing in order from the left character is compared with the character recognition result obtained by performing the character recognition processing in order from the right character. For characters having the same character recognition result, the same character recognition result is selected as the final character recognition result of the character. On the other hand, for characters having different character recognition results, a character recognition result having a high evaluation value is selected as the final character recognition result of the character.

このような手法によれば、影などがプレートの一部に発生している場合に、影のない領域(結果として評価値の高い領域)の結果をもとに、文字領域サイズや文字間隔サイズを決定することができるため、認識精度を向上させることができる。   According to such a method, when shadows or the like are generated on a part of the plate, the character area size and the character interval size are determined based on the result of the area without the shadow (resulting in the high evaluation value). Therefore, the recognition accuracy can be improved.

本実施形態の他の変形例としては、誤認識が発生しやすい文字(類似文字)が分かっている場合においては、文字認識結果として類似文字が得られた場合に、その文字認識結果及び評価値を用いずに文字領域サイズを決定してもよい。類似文字の例としては、たとえば、Bと8、Dと0、7とZ等が挙げられる。   As another modification of the present embodiment, when a character (similar character) that is likely to be erroneously recognized is known, when the similar character is obtained as the character recognition result, the character recognition result and the evaluation value The character area size may be determined without using. Examples of similar characters include B and 8, D and 0, 7 and Z, and the like.

例えば、ステップS15における、各領域位置(i,j)について順位が1位である文字認識結果及び評価値を選択し、更に、順位が1位である全ての領域位置の文字認識結果のうちから評価値が上位のm個の文字認識結果及び評価値を抽出する処理を行う場合に、類似文字である文字認識結果を除いてm個の文字認識結果及び評価値が抽出されてもよい。この場合、平均値μは、類似文字である文字認識結果を除いて、上位のm個の文字認識結果の評価値の平均値として算出される。このとき、類似文字のリストは、適宜の記憶手段(例えば、外部記憶装置4)に記憶しておけばよい。 For example, in step S15, the character recognition result and the evaluation value that are ranked first for each region position (i, j) are selected, and further, from among the character recognition results of all the region positions that are ranked first. If the evaluation value is carried out a process of extracting m C-number of the character recognition result of the upper and evaluation value, the character recognition result and the evaluation values of m C-number except for character recognition result is similar characters may be extracted . In this case, the average value μ k is calculated as the average value of the evaluation values of the upper m C character recognition results, excluding the character recognition results of similar characters. At this time, the list of similar characters may be stored in an appropriate storage unit (for example, the external storage device 4).

以上には、本発明の実施形態が具体的に述べられているが、本発明は上記の実施形態には限定されない。本発明が、様々な変更と共に実施可能であることは、当業者には自明的であろう。例えば、上述では、本発明がナンバープレート認識(ナンバープレートに記載された文字の認識)に適用された実施形態が記載されているが、本発明は、グレースケール画像である撮像画像に対する文字認識一般に適用可能である。   Although the embodiment of the present invention has been specifically described above, the present invention is not limited to the above embodiment. It will be apparent to those skilled in the art that the present invention can be implemented with various modifications. For example, in the above description, an embodiment in which the present invention is applied to license plate recognition (recognition of characters written on a license plate) is described. However, the present invention generally recognizes character recognition for captured images that are grayscale images. Applicable.

1 :文字認識装置
2 :画像処理IC
3 :外部インターフェース
4 :外部記憶装置
5 :メモリ
6 :ROM
6a :文字認識ソフトウェア
11 :演算モジュール
12 :画像入力インターフェース
13 :データ入出力インターフェース
14 :メモリコントローラ
15 :ROMコントローラ
16 :内部バス
21 :プレート領域画像データ
22 :プレート認識データ
31 :文字領域
32 :対角線
33 :交点
1: Character recognition device 2: Image processing IC
3: External interface 4: External storage device 5: Memory 6: ROM
6a: Character recognition software 11: Arithmetic module 12: Image input interface 13: Data input / output interface 14: Memory controller 15: ROM controller 16: Internal bus 21: Plate area image data 22: Plate recognition data 31: Character area 32: Diagonal line 33: Intersection

本発明の一の観点では、特定方向に並んだ文字で構成される文字列が映されたグレースケール画像について文字認識を行う文字認識装置が提供される。文字認識装置は、文字列のうち、第1端からN個(Nは、2以上の所定値)文字である第1文字について文字認識を行う第1文字認識手段と、文字列の第1端からN個以外の文字である第2文字について文字認識を行う第2文字認識手段とを具備する。第1文字認識手段は、第1文字についての文字認識において、様々な文字領域サイズの複数の第1文字領域をグレースケール画像の各位置に設定し、複数の第1文字領域のそれぞれについて文字認識処理を行って文字認識結果と評価値とを算出し、算出された評価値に基づいて、第1文字の文字認識結果と、最適な文字領域のサイズである第1最適文字領域サイズとを決定する。第2文字認識手段は、第1最適文字領域サイズを有する複数の第2文字領域をグレースケール画像の各位置に設定し、複数の第2文字領域のそれぞれについて文字認識処理を行って文字認識結果と評価値とを算出し、且つ、複数の第2文字領域のそれぞれについて算出された文字認識結果と評価値に基づいて、第2文字の文字認識結果を決定する。 In one aspect of the present invention, a character recognition device is provided that performs character recognition on a grayscale image in which a character string composed of characters arranged in a specific direction is displayed. Character recognition apparatus, among the strings, N C-number from the first end (N C is 2 or more predetermined value) for the first character is a character of the first character recognition means for performing character recognition, the character string And second character recognition means for performing character recognition on a second character which is a character other than N C characters from the first end. In the character recognition for the first character, the first character recognition means sets a plurality of first character regions having various character region sizes at respective positions in the gray scale image, and performs character recognition for each of the plurality of first character regions. Processing is performed to calculate a character recognition result and an evaluation value, and based on the calculated evaluation value, a character recognition result of the first character and a first optimum character area size that is an optimum character area size are determined. To do. The second character recognition means sets a plurality of second character areas having the first optimum character area size at each position of the gray scale image, performs character recognition processing for each of the plurality of second character areas, and performs a character recognition result. And the evaluation value, and the character recognition result of the second character is determined based on the character recognition result and the evaluation value calculated for each of the plurality of second character regions.

この場合、第1文字認識手段は、文字領域サイズのそれぞれについて、m個の文字認識結果の評価値に対応する輝度値を有する画素が、m個の文字認識結果にそれぞれに対応する文字領域の位置に位置している画像である評価値−輝度値変換プロット画像を生成すると共に評価値−輝度値変換プロット画像に対して2値化処理を行って2値化画像を生成することが好ましい。第1文字認識手段は、2値化画像に対してラベリング処理を行って同一色である連続した画素の集合のそれぞれにラベルを付与し、ラベルのそれぞれについて、ラベルに属する画素に対応する文字認識結果の評価値の平均値である第2平均値を算出し、第1文字認識手段は、第2平均値が高いラベルから順に、各ラベルのそれぞれの重心位置と他のラベルとの重心位置との間の距離を算出し、他のラベルの重心位置との距離が所定の閾値以下になるような重心位置を有する場合に各ラベルを排除する処理をN個のラベルが残されるまで繰り返して行う。また、第1文字認識手段は、残存する個のラベルのそれぞれについて、それぞれに属する画素のうち、対応する文字認識果の評価値が最も高い画素を選定し、評価値が最も高い画素の位置を第1文字の文字位置として決定し、決定された文字位置から最適な文字間隔である最適文字間サイズを決定する。
第2文字認識手段は、最適文字間サイズに応じて複数の第2文字領域の位置を設定する。
In this case, for each character area size, the first character recognizing means includes pixels having luminance values corresponding to the evaluation values of m C character recognition results, corresponding to the m C character recognition results. An evaluation value-luminance value conversion plot image, which is an image located at a region position, is generated and a binarization process is performed on the evaluation value-luminance value conversion plot image to generate a binarized image. preferable. The first character recognition means performs a labeling process on the binarized image to give a label to each set of continuous pixels having the same color, and for each label, character recognition corresponding to a pixel belonging to the label A second average value that is an average value of the evaluation values of the results is calculated, and the first character recognizing unit sequentially calculates the centroid position of each label and the centroid position of other labels in order from the label having the second highest average value. The process of removing each label is repeated until N C labels are left when the distance between the labels is calculated and the center of gravity has a center of gravity such that the distance from the center of gravity of another label is equal to or less than a predetermined threshold. Do. The first character recognition means, for each of the N C-number of labels remaining, among the pixels belonging to each selects the highest pixel evaluation value of the corresponding character recognition result is the highest pixel evaluation value Is determined as the character position of the first character, and the optimal inter-character size, which is the optimal character spacing, is determined from the determined character position.
The second character recognition means sets the positions of the plurality of second character areas according to the optimum inter-character size.

一実施形態では、文字認識装置が、更に、文字列のうち、第1端と反対側の第2端からN文字である第3文字について文字認識を行う第3文字認識手段と、文字列の第2端からN文字以外の文字である第4文字について文字認識を行う第4文字認識手段と、最終文字認識結果決定手段とを具備していてもよい。第3文字認識手段は、第3文字についての文字認識において、様々な文字領域サイズの複数の第3文字領域をグレースケール画像の各位置に設定し、複数の第3文字領域のそれぞれについて文字認識処理を行って文字認識結果と評価値とを算出し、算出された評価値に基づいて、第3文字の文字認識結果と、最適な文字領域のサイズである第2最適文字領域サイズとを決定する。第4文字認識手段は、第2最適文字領域サイズを有する複数の第4文字領域のグレースケール画像の各位置に設定し、複数の第4文字領域のそれぞれについて文字認識処理を行って文字認識結果と評価値とを算出し、且つ、算出された評価値に基づいて、第4文字の文字認識結果を決定する。最終文字認識結果決定手段は、第1文字認識手段及び第2文字認識手段によって得られた文字列の特定文字の文字認識結果が、第3文字認識手段及び第4文字認識手段によって得られた特定文字の文字認識結果と一致する場合、一致する文字認識結果を特定文字の最終的な文字認識結果として決定する。一致しない場合、最終文字認識結果決定手段は、第1文字認識手段及び第2文字認識手段によって得られた特定文字の文字認識結果と、第3文字認識手段及び第4文字認識手段によって得られた特定文字の文字認識結果とのうち評価値が高い方の文字認識結果を、特定文字の最終的な文字認識結果として決定する。 In one embodiment, the character recognition device, further in the character string, and a third character recognition means for performing character recognition for the third character is a N C-number of characters from the opposite side of the second end and the first end, A fourth character recognition unit that performs character recognition on a fourth character that is a character other than N C characters from the second end of the character string, and a final character recognition result determination unit may be included. In the character recognition for the third character, the third character recognition means sets a plurality of third character areas having various character area sizes at respective positions in the gray scale image, and performs character recognition for each of the plurality of third character areas. Processing is performed to calculate a character recognition result and an evaluation value, and based on the calculated evaluation value, a character recognition result for the third character and a second optimum character area size that is an optimum character area size are determined. To do. The fourth character recognition means sets each position of the gray scale image of the plurality of fourth character areas having the second optimum character area size, performs character recognition processing for each of the plurality of fourth character areas, and performs a character recognition result. And the evaluation value, and the character recognition result of the fourth character is determined based on the calculated evaluation value. The final character recognition result determining means is a method in which the character recognition result of the specific character of the character string obtained by the first character recognition means and the second character recognition means is obtained by the third character recognition means and the fourth character recognition means. When the character recognition result matches the character recognition result, the matching character recognition result is determined as the final character recognition result of the specific character. If they do not match, the final character recognition result determination means is obtained by the character recognition result of the specific character obtained by the first character recognition means and the second character recognition means, and by the third character recognition means and the fourth character recognition means. The character recognition result having the higher evaluation value among the character recognition results of the specific character is determined as the final character recognition result of the specific character.

本発明の他の観点では、特定方向に並んだ文字で構成される文字列が映されたグレースケール画像について文字認識を行う文字認識装置が提供される。当該文字認識装置は、文字列のうち、端からN個(Nは、2以上の所定値)文字である第1文字について文字認識を行う第1文字認識手段と、文字列の端からN個以外の文字である第2文字について文字認識を行う第2文字認識手段とを具備する。第1文字認識手段は、第1文字についての文字認識において、様々な文字領域サイズの複数の第1文字領域をグレースケール画像の各位置に設定し、複数の第1文字領域のそれぞれについて文字認識処理を行って文字認識結果と評価値とを算出し、算出された評価値に基づいて、第1文字の文字認識結果と第1文字のそれぞれの文字位置を決定すると共に、決定された文字位置から最適な文字間隔である最適文字間サイズを決定する。第2文字認識手段は、最適文字間サイズに応じて複数の第2文字領域をグレースケール画像の各位置に設定し、複数の第2文字領域のそれぞれについて文字認識処理を行って文字認識結果と評価値とを算出し、且つ、複数の第2文字領域のそれぞれについて算出された文字認識結果と評価値に基づいて、第2文字の文字認識結果を決定する。 In another aspect of the present invention, there is provided a character recognition device that performs character recognition on a grayscale image on which a character string composed of characters arranged in a specific direction is displayed. The character recognition apparatus, in the character string, N C-number (N C is 2 or more predetermined value) from the end and the first character recognition means for performing character recognition for the first character is a character, an end character string To a second character recognition means for performing character recognition on the second character which is a character other than N C characters. In the character recognition for the first character, the first character recognition means sets a plurality of first character regions having various character region sizes at respective positions in the gray scale image, and performs character recognition for each of the plurality of first character regions. A character recognition result and an evaluation value are calculated by performing processing, and the character recognition result of the first character and each character position of the first character are determined based on the calculated evaluation value, and the determined character position To determine the optimum character spacing, which is the optimum character spacing. The second character recognition means sets a plurality of second character areas at each position of the grayscale image according to the optimum inter-character size, performs character recognition processing for each of the plurality of second character areas, The evaluation value is calculated, and the character recognition result of the second character is determined based on the character recognition result and the evaluation value calculated for each of the plurality of second character regions.

本発明の更に他の観点では、特定方向に並んだ文字で構成される文字列が映されたグレースケール画像について文字認識を行う文字認識方法が提供される。当該文字認識方法は、文字列のうち、端からN個(Nは、2以上の所定値)文字である第1文字について文字認識を行うステップと、文字列の端からN個以外の文字である第2文字について文字認識を行うステップとを具備する。第1文字についての文字認識においては、様々な文字領域サイズの複数の第1文字領域をグレースケール画像の各位置に設定し、複数の第1文字領域のそれぞれについて文字認識処理を行って文字認識結果と評価値とを算出し、算出された評価値に基づいて、第1文字の文字認識結果と、最適な文字領域のサイズである第1最適文字領域サイズとを決定する。第2文字についての文字認識においては、第1最適文字領域サイズを有する複数の第2文字領域をグレースケール画像の各位置に設定し、複数の第2文字領域のそれぞれについて文字認識処理を行って文字認識結果と評価値とを算出し、且つ、複数の第2文字領域のそれぞれについて算出された文字認識結果と評価値に基づいて、第2文字の文字認識結果を決定する。 In still another aspect of the present invention, there is provided a character recognition method for performing character recognition on a grayscale image in which a character string composed of characters arranged in a specific direction is displayed. The character recognition method, in the character string, N C-number (N C is 2 or more predetermined value) from the end and performing character recognition for the first character is a character of, N C-number from the end of the string Recognizing a second character that is not a character. In character recognition for the first character, a plurality of first character regions having various character region sizes are set at respective positions in the gray scale image, and character recognition processing is performed for each of the plurality of first character regions. A result and an evaluation value are calculated, and based on the calculated evaluation value, a character recognition result of the first character and a first optimum character area size which is an optimum character area size are determined. In character recognition for the second character, a plurality of second character areas having a first optimum character area size are set at each position of the grayscale image, and character recognition processing is performed for each of the plurality of second character areas. The character recognition result and the evaluation value are calculated, and the character recognition result of the second character is determined based on the character recognition result and the evaluation value calculated for each of the plurality of second character areas.

本発明の更に他の観点では、特定方向に並んだ文字で構成される文字列が映されたグレースケール画像について文字認識を行う文字認識方法が提供される。当該文字認識方法は、文字列のうち、端からN個(Nは、2以上の所定値)文字である第1文字について文字認識を行うステップと、文字列の端からN個以外の文字である第2文字について文字認識を行うステップとを具備する。第1文字についての文字認識においては、第1文字についての文字認識において、様々な文字領域サイズの複数の第1文字領域をグレースケール画像の各位置に設定し、複数の第1文字領域のそれぞれについて文字認識処理を行って文字認識結果と評価値とを算出し、算出された評価値に基づいて、第1文字の文字認識結果と第1文字のそれぞれの文字位置を決定すると共に、決定された文字位置から最適な文字間隔である最適文字間サイズを決定する。第2文字についての文字認識においては、最適文字間サイズに応じて複数の第2文字領域をグレースケール画像の各位置に設定し、複数の第2文字領域のそれぞれについて文字認識処理を行って文字認識結果と評価値とを算出し、且つ、複数の第2文字領域のそれぞれについて算出された文字認識結果と評価値に基づいて、第2文字の文字認識結果を決定する。 In still another aspect of the present invention, there is provided a character recognition method for performing character recognition on a grayscale image in which a character string composed of characters arranged in a specific direction is displayed. The character recognition method, in the character string, N C-number (N C is 2 or more predetermined value) from the end and performing character recognition for the first character is a character of, N C-number from the end of the string Recognizing a second character that is not a character. In character recognition for the first character, in character recognition for the first character, a plurality of first character areas of various character area sizes are set at respective positions in the grayscale image, and each of the plurality of first character areas is set. Character recognition processing and an evaluation value are calculated with respect to the character recognition result, and the character recognition result of the first character and each character position of the first character are determined and determined based on the calculated evaluation value. The optimum character spacing, which is the optimum character spacing, is determined from the determined character position. In character recognition for the second character, a plurality of second character areas are set at respective positions in the grayscale image in accordance with the optimum inter-character size, and character recognition processing is performed for each of the plurality of second character areas. The recognition result and the evaluation value are calculated, and the character recognition result of the second character is determined based on the character recognition result and the evaluation value calculated for each of the plurality of second character areas.

本発明の更に他の観点では、特定方向に並んだ文字で構成される文字列が映されたグレースケール画像について文字認識を演算装置に行わせるプログラムが提供される。当該プログラムは、文字列のうち、端からN個(Nは、2以上の所定値)文字である第1文字について文字認識を行うステップと、文字列の端からN個以外の文字である第2文字について文字認識を行うステップとを演算装置に実行させる。第1文字についての文字認識においては、様々な文字領域サイズの複数の第1文字領域をグレースケール画像の各位置に設定し、複数の第1文字領域のそれぞれについて文字認識処理を行って文字認識結果と評価値とを算出し、算出された評価値に基づいて、第1文字の文字認識結果と、最適な文字領域のサイズである第1最適文字領域サイズとを決定する。第2文字についての文字認識においては、第1最適文字領域サイズを有する複数の第2文字領域をグレースケール画像の各位置に設定し、複数の第2文字領域のそれぞれについて文字認識処理を行って文字認識結果と評価値とを算出し、且つ、複数の第2文字領域のそれぞれについて算出された文字認識結果と評価値に基づいて、第2文字の文字認識結果を決定する。 In still another aspect of the present invention, there is provided a program that causes an arithmetic device to perform character recognition on a grayscale image on which a character string composed of characters arranged in a specific direction is displayed. The program, in the character string, N C-number (N C is 2 or more predetermined value) from the end and performing character recognition for the first character is a character, from the end of the character string other than N C atoms And causing the arithmetic unit to execute character recognition for the second character, which is a character. In character recognition for the first character, a plurality of first character regions having various character region sizes are set at respective positions in the gray scale image, and character recognition processing is performed for each of the plurality of first character regions. A result and an evaluation value are calculated, and based on the calculated evaluation value, a character recognition result of the first character and a first optimum character area size which is an optimum character area size are determined. In character recognition for the second character, a plurality of second character areas having a first optimum character area size are set at each position of the grayscale image, and character recognition processing is performed for each of the plurality of second character areas. The character recognition result and the evaluation value are calculated, and the character recognition result of the second character is determined based on the character recognition result and the evaluation value calculated for each of the plurality of second character areas.

本発明の更に他の観点では、特定方向に並んだ文字で構成される文字列が映されたグレースケール画像について文字認識を演算装置に行わせるプログラムが提供される。当該プログラムは、文字列のうち、端からN個(Nは、2以上の所定値)文字である第1文字について文字認識を行うステップと、文字列の端からN個以外の文字である第2文字について文字認識を行うステップとを演算装置に実行させる。第1文字についての文字認識においては、第1文字についての文字認識において、様々な文字領域サイズの複数の第1文字領域をグレースケール画像の各位置に設定し、複数の第1文字領域のそれぞれについて文字認識処理を行って文字認識結果と評価値とを算出し、算出された評価値に基づいて、第1文字の文字認識結果と第1文字のそれぞれの文字位置を決定すると共に、決定された文字位置から最適な文字間隔である最適文字間サイズを決定する。第2文字についての文字認識においては、最適文字間サイズに応じて複数の第2文字領域をグレースケール画像の各位置に設定し、複数の第2文字領域のそれぞれについて文字認識処理を行って文字認識結果と評価値とを算出し、且つ、複数の第2文字領域のそれぞれについて算出された文字認識結果と評価値に基づいて、第2文字の文字認識結果を決定する。

In still another aspect of the present invention, there is provided a program that causes an arithmetic device to perform character recognition on a grayscale image on which a character string composed of characters arranged in a specific direction is displayed. The program, in the character string, N C-number (N C is 2 or more predetermined value) from the end and performing character recognition for the first character is a character, from the end of the character string other than N C atoms And causing the arithmetic unit to execute character recognition for the second character, which is a character. In character recognition for the first character, in character recognition for the first character, a plurality of first character areas of various character area sizes are set at respective positions in the grayscale image, and each of the plurality of first character areas is set. Character recognition processing and an evaluation value are calculated with respect to the character recognition result, and the character recognition result of the first character and each character position of the first character are determined and determined based on the calculated evaluation value. The optimum character spacing, which is the optimum character spacing, is determined from the determined character position. In character recognition for the second character, a plurality of second character areas are set at respective positions in the grayscale image in accordance with the optimum inter-character size, and character recognition processing is performed for each of the plurality of second character areas. The recognition result and the evaluation value are calculated, and the character recognition result of the second character is determined based on the character recognition result and the evaluation value calculated for each of the plurality of second character areas.

Claims (11)

特定方向に並んだ文字で構成される文字列が映されたグレースケール画像について文字認識を行う文字認識装置であって、
前記文字列のうち、第1端からN個(Nは、2以上の所定値)は、の文字である第1文字について文字認識を行う第1文字認識手段と、
前記第1文字以外の文字である第2文字について文字認識を行う第2文字認識手段
とを具備し、
前記第1文字認識手段は、前記第1文字についての文字認識において、様々な文字領域サイズの複数の第1文字領域を前記グレースケール画像の各位置に設定し、前記複数の第1文字領域のそれぞれについて文字認識処理を行って文字認識結果と評価値とを算出し、算出された前記評価値に基づいて、前記第1文字の文字認識結果を決定すると共に、前記様々な文字領域サイズのうちから最適な文字領域のサイズである第1最適文字領域サイズとを決定し、
前記第2文字認識手段は、前記第1最適文字領域サイズを有する複数の第2文字領域を前記グレースケール画像の各位置に設定し、前記複数の第2文字領域のそれぞれについて文字認識処理を行って文字認識結果と評価値とを算出し、且つ、前記複数の第2文字領域のそれぞれについて算出された前記文字認識結果と前記評価値に基づいて、前記第2文字の文字認識結果を決定する
文字認識装置。
A character recognition device that performs character recognition on a grayscale image in which a character string composed of characters arranged in a specific direction is displayed,
Among the character strings, N C-number (N C is 2 or more predetermined value) from the first end includes a first character recognition means for performing character recognition for the first character is a character,
Second character recognition means for performing character recognition for a second character that is a character other than the first character,
In the character recognition for the first character, the first character recognition means sets a plurality of first character areas of various character area sizes at respective positions of the gray scale image, and sets the first character areas of the plurality of first character areas. Character recognition processing and evaluation values are calculated by performing character recognition processing for each, and the character recognition result of the first character is determined based on the calculated evaluation values, and among the various character area sizes 1st optimal character area size which is the size of the optimal character area is determined from
The second character recognition means sets a plurality of second character regions having the first optimum character region size at each position of the gray scale image, and performs character recognition processing for each of the plurality of second character regions. The character recognition result and the evaluation value are calculated, and the character recognition result of the second character is determined based on the character recognition result and the evaluation value calculated for each of the plurality of second character regions. Character recognition device.
請求項1に記載の文字認識装置であって、
前記第1文字認識手段は、前記評価値に基づいて、前記第1文字のそれぞれの文字位置を決定すると共に、決定された前記文字位置から最適な文字間隔である最適文字間サイズを決定し、
前記第2文字認識手段は、前記最適文字間サイズに応じて前記複数の第2文字領域の位置を設定する
文字認識装置。
The character recognition device according to claim 1,
The first character recognition means determines each character position of the first character based on the evaluation value, and determines an optimal character size that is an optimal character spacing from the determined character position,
The character recognition device, wherein the second character recognition means sets the positions of the plurality of second character areas according to the optimum inter-character size.
請求項1に記載の文字認識装置であって、
前記第1文字認識手段は、前記複数の第1文字領域の各位置について得られる文字認識結果について、前記評価値に基づいて順位づけを行い、
前記第1文字認識手段は、前記文字領域サイズのそれぞれについて、前記複数の第1文字領域の各位置について得られる文字認識結果であって順位が1位である文字認識結果のうちから評価値が高いm個(mCは、Nよりも大きい所定数)を抽出すると共に前記m個の文字認識結果の評価値の平均値である第1平均値を算出し、
前記第1文字認識手段は、前記第1平均値が最も高い文字領域サイズを前記最適文字領域サイズと決定する
文字認識装置。
The character recognition device according to claim 1,
The first character recognition means ranks the character recognition results obtained for each position of the plurality of first character areas based on the evaluation value;
The first character recognizing means has an evaluation value from among character recognition results obtained for each position of the plurality of first character regions and ranked first for each of the character region sizes. Extracting high m C pieces ( mC is a predetermined number larger than N C ) and calculating a first average value that is an average value of evaluation values of the m C character recognition results;
The first character recognizing means determines a character area size having the highest first average value as the optimum character area size.
請求項3に記載の文字認識装置であって、
前記第1文字認識手段は、前記文字領域サイズのそれぞれについて、前記m個の文字認識結果の評価値に対応する輝度値を有する画素が、前記m個の文字認識結果にそれぞれに対応する文字領域の位置に位置している画像である評価値−輝度値変換プロット画像を生成すると共に前記評価値−輝度値変換プロット画像に対して2値化処理を行って2値化画像を生成し、
前記第1文字認識手段は、前記2値化画像に対してラベリング処理を行って同一色である連続した画素の集合のそれぞれにラベルを付与し、前記ラベルのそれぞれについて、前記ラベルに属する画素に対応する文字認識結果の評価値の平均値である第2平均値を算出し、
前記第1文字認識手段は、前記第2平均値が高いラベルから順に、各ラベルのそれぞれの重心位置と他のラベルとの重心位置との間の距離を算出し、他のラベルの重心位置との距離が所定の閾値以下になるような重心位置を有する場合に前記各ラベルを排除する処理をN個のラベルが残されるまで繰り返して行い、
前記第1文字認識手段は、残存して前記N個のラベルのそれぞれについて、それぞれに属する画素のうち、対応する文字認識得結果の評価値が最も高い画素を選定し、評価値が最も高い画素の位置を前記第1文字の文字位置として決定し、決定された前記文字位置から最適な文字間隔である最適文字間サイズを決定し、
前記第2文字認識手段は、前記最適文字間サイズに応じて前記複数の第2文字領域の位置を設定する
文字認識装置。
The character recognition device according to claim 3,
First the character recognition means, for each of the character area size, pixels having a luminance value corresponding to the evaluation value of the m C-number of the character recognition result corresponds to each of the m C-number of the character recognition result An evaluation value-luminance value conversion plot image, which is an image located at the position of the character area, is generated, and a binarization process is performed on the evaluation value-luminance value conversion plot image to generate a binary image. ,
The first character recognition means performs a labeling process on the binarized image to give a label to each set of continuous pixels having the same color, and assigns a label to each pixel belonging to the label. Calculating a second average value that is an average value of the evaluation values of the corresponding character recognition results;
The first character recognition means calculates the distance between each barycentric position of each label and the barycentric position of the other label in order from the label having the second average higher value, and the barycentric position of the other label. When the center of gravity position is such that the distance is equal to or less than a predetermined threshold, the process of removing each label is repeated until N C labels are left,
The first character recognizing means selects, for each of the remaining N C labels, a pixel having the highest evaluation value of the corresponding character recognition result as a pixel belonging to each of the N C labels, and having the highest evaluation value A pixel position is determined as the character position of the first character, and an optimal character size that is an optimal character spacing is determined from the determined character position;
The character recognition device, wherein the second character recognition means sets the positions of the plurality of second character areas according to the optimum inter-character size.
請求項1乃至4のいずれかに記載の文字認識装置であって、
前記文字列のうち、前記第1端と反対側の第2端からN個は、の文字である第3文字について文字認識を行う第3文字認識手段と、
前記文字列の前記第2端からN個は、の文字以外の文字である第4文字について文字認識を行う第4文字認識手段と、
最終文字認識結果決定手段
とを更に具備し、
前記第3文字認識手段は、前記第3文字についての文字認識において、様々な文字領域サイズの複数の第3文字領域を前記グレースケール画像の各位置に設定し、前記複数の第3文字領域のそれぞれについて文字認識処理を行って文字認識結果と評価値とを算出し、算出された前記評価値に基づいて、前記第3文字の文字認識結果と、最適な文字領域のサイズである第2最適文字領域サイズとを決定し、
前記第4文字認識手段は、前記第2最適文字領域サイズを有する複数の第4文字領域の前記グレースケール画像の各位置に設定し、前記複数の第4文字領域のそれぞれについて文字認識処理を行って文字認識結果と評価値とを算出し、且つ、算出された前記評価値に基づいて、前記第4文字の文字認識結果を決定し、
前記最終文字認識結果決定手段は、前記第1文字認識手段及び前記第2文字認識手段によって得られた前記文字列の特定文字の文字認識結果が、前記第3文字認識手段及び前記第4文字認識手段によって得られた前記特定文字の文字認識結果と一致する場合、一致する前記文字認識結果を前記特定文字の最終的な文字認識結果として決定し、一致しない場合、前記第1文字認識手段及び前記第2文字認識手段によって得られた前記特定文字の文字認識結果と、前記第3文字認識手段及び前記第4文字認識手段によって得られた前記特定文字の文字認識結果とのうち評価値が高い方の文字認識結果を、前記特定文字の最終的な文字認識結果として決定する
文字認識装置。
The character recognition device according to any one of claims 1 to 4,
Among the character string, the N C-number from the second end opposite the first end, and a third character recognition means for performing character recognition for the third character is a character,
N C-number from the second end of the string, and the fourth character recognition means for performing character recognition fourth character is a character other than the characters,
A final character recognition result determining means;
In the character recognition for the third character, the third character recognition means sets a plurality of third character regions having various character region sizes at respective positions in the gray scale image, and Character recognition processing and an evaluation value are calculated by performing character recognition processing for each, and based on the calculated evaluation value, the character recognition result of the third character and the second optimum that is the size of the optimum character area Determine the character area size,
The fourth character recognition means sets each position of the plurality of fourth character areas having the second optimum character area size in the gray scale image, and performs character recognition processing for each of the plurality of fourth character areas. Calculating the character recognition result and the evaluation value, and determining the character recognition result of the fourth character based on the calculated evaluation value,
The final character recognition result determination means is configured to obtain a character recognition result of a specific character of the character string obtained by the first character recognition means and the second character recognition means as the third character recognition means and the fourth character recognition. If the character recognition result of the specific character obtained by the means matches, the matching character recognition result is determined as the final character recognition result of the specific character, and if the character recognition result does not match, the first character recognition means and the One having a higher evaluation value among the character recognition result of the specific character obtained by the second character recognition unit and the character recognition result of the specific character obtained by the third character recognition unit and the fourth character recognition unit A character recognition apparatus that determines a character recognition result of the character recognition result as a final character recognition result of the specific character.
請求項1乃至4のいずれかに記載の文字認識装置であって、
前記第1文字認識手段は、類似文字を登録した類似文字データを記憶する記憶手段を備え、
前記第1文字認識手段は、前記複数の第1文字領域のそれぞれについて文字認識処理を行って得られた文字認識結果のうち前記類似文字に一致する文字認識結果及びその評価値を用いずに前記最適文字領域サイズを決定する
文字認識装置。
The character recognition device according to any one of claims 1 to 4,
The first character recognizing means includes storage means for storing similar character data in which similar characters are registered,
The first character recognizing means uses the character recognition result that matches the similar character among the character recognition results obtained by performing the character recognition processing for each of the plurality of first character regions and the evaluation value without using the character recognition result and the evaluation value thereof. A character recognition device that determines the optimal character area size.
特定方向に並んだ文字で構成される文字列が映されたグレースケール画像について文字認識を行う文字認識装置であって、
前記文字列のうち、端からN個(Nは、2以上の所定値)は、の文字である第1文字について文字認識を行う第1文字認識手段と、
前記第1文字以外の文字である第2文字について文字認識を行う第2文字認識手段
とを具備し、
前記第1文字認識手段は、前記第1文字についての文字認識において、様々な文字領域サイズの複数の第1文字領域を前記グレースケール画像の各位置に設定し、前記複数の第1文字領域のそれぞれについて文字認識処理を行って文字認識結果と評価値とを算出し、算出された前記評価値に基づいて、前記第1文字の文字認識結果と前記第1文字のそれぞれの文字位置を決定すると共に、決定された前記文字位置から最適な文字間隔である最適文字間サイズを決定し、
前記第2文字認識手段は、前記最適文字間サイズに応じて複数の第2文字領域を前記グレースケール画像の各位置に設定し、前記複数の第2文字領域のそれぞれについて文字認識処理を行って文字認識結果と評価値とを算出し、且つ、前記複数の第2文字領域のそれぞれについて算出された前記文字認識結果と前記評価値に基づいて、前記第2文字の文字認識結果を決定する
文字認識装置。
A character recognition device that performs character recognition on a grayscale image in which a character string composed of characters arranged in a specific direction is displayed,
Among the character strings, N C-number from the end (N C is 2 or more predetermined value), a first character recognition means for performing character recognition for the first character is a character,
Second character recognition means for performing character recognition for a second character that is a character other than the first character,
In the character recognition for the first character, the first character recognition means sets a plurality of first character areas of various character area sizes at respective positions of the gray scale image, and sets the first character areas of the plurality of first character areas. Character recognition processing and an evaluation value are calculated for each of them, and a character recognition result of the first character and a character position of the first character are determined based on the calculated evaluation value. And determining the optimum inter-character size that is the optimum character spacing from the determined character position,
The second character recognition means sets a plurality of second character areas at each position of the gray scale image according to the optimum inter-character size, and performs character recognition processing for each of the plurality of second character areas. A character that calculates a character recognition result and an evaluation value, and determines a character recognition result of the second character based on the character recognition result and the evaluation value calculated for each of the plurality of second character regions Recognition device.
特定方向に並んだ文字で構成される文字列が映されたグレースケール画像について文字認識を行う文字認識方法であって、
前記文字列のうち、端からN個(Nは、2以上の所定値)は、の文字である第1文字について文字認識を行うステップと、
前記第1文字以外の文字である第2文字について文字認識を行うステップ
とを具備し、
前記第1文字についての文字認識においては、様々な文字領域サイズの複数の第1文字領域を前記グレースケール画像の各位置に設定し、前記複数の第1文字領域のそれぞれについて文字認識処理を行って文字認識結果と評価値とを算出し、算出された前記評価値に基づいて、前記第1文字の文字認識結果を決定すると共に、前記様々な文字領域サイズのうちから最適な文字領域のサイズである第1最適文字領域サイズとを決定し、
前記第2文字についての文字認識においては、前記第1最適文字領域サイズを有する複数の第2文字領域を前記グレースケール画像の各位置に設定し、前記複数の第2文字領域のそれぞれについて文字認識処理を行って文字認識結果と評価値とを算出し、且つ、前記複数の第2文字領域のそれぞれについて算出された前記文字認識結果と前記評価値に基づいて、前記第2文字の文字認識結果を決定する
文字認識方法。
A character recognition method for performing character recognition on a grayscale image in which a character string composed of characters arranged in a specific direction is displayed,
Among the character strings, N C-number from the end (N C is 2 or more predetermined value), the step of performing character recognition for the first character is a character,
Performing character recognition for a second character that is a character other than the first character,
In character recognition for the first character, a plurality of first character regions having various character region sizes are set at respective positions in the gray scale image, and character recognition processing is performed for each of the plurality of first character regions. And calculating a character recognition result and an evaluation value, determining a character recognition result of the first character based on the calculated evaluation value, and selecting an optimum character area size from the various character area sizes. And determine the first optimum character area size,
In character recognition for the second character, a plurality of second character areas having the first optimum character area size are set at respective positions in the grayscale image, and character recognition is performed for each of the plurality of second character areas. A character recognition result and an evaluation value are calculated by performing processing, and a character recognition result of the second character is calculated based on the character recognition result and the evaluation value calculated for each of the plurality of second character regions. Determine the character recognition method.
特定方向に並んだ文字で構成される文字列が映されたグレースケール画像について文字認識を行う文字認識方法であって、
前記文字列のうち、端からN個(Nは、2以上の所定値)は、の文字である第1文字について文字認識を行うステップと、
前記第1文字以外の文字である第2文字について文字認識を行うステップ
とを具備し、
前記第1文字についての文字認識においては、前記第1文字についての文字認識において、様々な文字領域サイズの複数の第1文字領域を前記グレースケール画像の各位置に設定し、前記複数の第1文字領域のそれぞれについて文字認識処理を行って文字認識結果と評価値とを算出し、算出された前記評価値に基づいて、前記第1文字の文字認識結果と前記第1文字のそれぞれの文字位置を決定すると共に、決定された前記文字位置から最適な文字間隔である最適文字間サイズを決定し、
前記第2文字についての文字認識においては、前記最適文字間サイズに応じて複数の第2文字領域を前記グレースケール画像の各位置に設定し、前記複数の第2文字領域のそれぞれについて文字認識処理を行って文字認識結果と評価値とを算出し、且つ、前記複数の第2文字領域のそれぞれについて算出された前記文字認識結果と前記評価値に基づいて、前記第2文字の文字認識結果を決定する
文字認識方法。
A character recognition method for performing character recognition on a grayscale image in which a character string composed of characters arranged in a specific direction is displayed,
Among the character strings, N C-number from the end (N C is 2 or more predetermined value), the step of performing character recognition for the first character is a character,
Performing character recognition for a second character that is a character other than the first character,
In character recognition for the first character, in character recognition for the first character, a plurality of first character regions of various character region sizes are set at each position of the grayscale image, and the plurality of first characters Character recognition processing is performed for each character region to calculate a character recognition result and an evaluation value, and based on the calculated evaluation value, the character recognition result of the first character and the character position of the first character And determining an optimal inter-character size that is an optimal character spacing from the determined character position,
In character recognition for the second character, a plurality of second character areas are set at each position of the gray scale image according to the optimum inter-character size, and character recognition processing is performed for each of the plurality of second character areas. The character recognition result and the evaluation value are calculated, and the character recognition result of the second character is calculated based on the character recognition result and the evaluation value calculated for each of the plurality of second character regions. Determine the character recognition method.
特定方向に並んだ文字で構成される文字列が映されたグレースケール画像について文字認識を演算装置に行わせるプログラムであって、
前記文字列のうち、端からN個(Nは、2以上の所定値)は、の文字である第1文字について文字認識を行うステップと、
前記第1文字以外の文字である第2文字について文字認識を行うステップ
とを前記演算装置に実行させ、
前記第1文字についての文字認識においては、様々な文字領域サイズの複数の第1文字領域を前記グレースケール画像の各位置に設定し、前記複数の第1文字領域のそれぞれについて文字認識処理を行って文字認識結果と評価値とを算出し、算出された前記評価値に基づいて、前記第1文字の文字認識結果を決定すると共に、前記様々な文字領域サイズのうちから最適な文字領域のサイズである第1最適文字領域サイズとを決定し、
前記第2文字についての文字認識においては、前記第1最適文字領域サイズを有する複数の第2文字領域を前記グレースケール画像の各位置に設定し、前記複数の第2文字領域のそれぞれについて文字認識処理を行って文字認識結果と評価値とを算出し、且つ、前記複数の第2文字領域のそれぞれについて算出された前記文字認識結果と前記評価値に基づいて、前記第2文字の文字認識結果を決定する
プログラム。
A program that causes a computing device to perform character recognition on a grayscale image in which a character string composed of characters arranged in a specific direction is displayed,
Among the character strings, N C-number from the end (N C is 2 or more predetermined value), the step of performing character recognition for the first character is a character,
Performing the character recognition on the second character, which is a character other than the first character,
In character recognition for the first character, a plurality of first character regions having various character region sizes are set at respective positions in the gray scale image, and character recognition processing is performed for each of the plurality of first character regions. And calculating a character recognition result and an evaluation value, determining a character recognition result of the first character based on the calculated evaluation value, and selecting an optimum character area size from the various character area sizes. And determine the first optimum character area size,
In character recognition for the second character, a plurality of second character areas having the first optimum character area size are set at respective positions in the grayscale image, and character recognition is performed for each of the plurality of second character areas. A character recognition result and an evaluation value are calculated by performing processing, and a character recognition result of the second character is calculated based on the character recognition result and the evaluation value calculated for each of the plurality of second character regions. Determine the program.
特定方向に並んだ文字で構成される文字列が映されたグレースケール画像について文字認識を演算装置に行わせるプログラムであって、
前記文字列のうち、端からN個(Nは、2以上の所定値)は、の文字である第1文字について文字認識を行うステップと、
前記第1文字以外の文字である第2文字について文字認識を行うステップ
とを前記演算装置に実行させ、
前記第1文字についての文字認識においては、前記第1文字についての文字認識において、様々な文字領域サイズの複数の第1文字領域を前記グレースケール画像の各位置に設定し、前記複数の第1文字領域のそれぞれについて文字認識処理を行って文字認識結果と評価値とを算出し、算出された前記評価値に基づいて、前記第1文字の文字認識結果と前記第1文字のそれぞれの文字位置を決定すると共に、決定された前記文字位置から最適な文字間隔である最適文字間サイズを決定し、
前記第2文字についての文字認識においては、前記最適文字間サイズに応じて複数の第2文字領域を前記グレースケール画像の各位置に設定し、前記複数の第2文字領域のそれぞれについて文字認識処理を行って文字認識結果と評価値とを算出し、且つ、前記複数の第2文字領域のそれぞれについて算出された前記文字認識結果と前記評価値に基づいて、前記第2文字の文字認識結果を決定する
プログラム。
A program that causes a computing device to perform character recognition on a grayscale image in which a character string composed of characters arranged in a specific direction is displayed,
Among the character strings, N C-number from the end (N C is 2 or more predetermined value), the step of performing character recognition for the first character is a character,
Performing the character recognition on the second character, which is a character other than the first character,
In character recognition for the first character, in character recognition for the first character, a plurality of first character regions of various character region sizes are set at each position of the grayscale image, and the plurality of first characters Character recognition processing is performed for each character region to calculate a character recognition result and an evaluation value, and based on the calculated evaluation value, the character recognition result of the first character and the character position of the first character And determining an optimal inter-character size that is an optimal character spacing from the determined character position,
In character recognition for the second character, a plurality of second character areas are set at each position of the gray scale image according to the optimum inter-character size, and character recognition processing is performed for each of the plurality of second character areas. The character recognition result and the evaluation value are calculated, and the character recognition result of the second character is calculated based on the character recognition result and the evaluation value calculated for each of the plurality of second character regions. Deciding program.
JP2013035160A 2013-02-25 2013-02-25 Character recognition device, character recognition method and program Active JP6173715B2 (en)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP2013035160A JP6173715B2 (en) 2013-02-25 2013-02-25 Character recognition device, character recognition method and program
SG11201506566YA SG11201506566YA (en) 2013-02-25 2013-10-28 Character recognition apparatus, character recognition method, and recording medium
PCT/JP2013/079119 WO2014129016A1 (en) 2013-02-25 2013-10-28 Character recognition device, character recognition method, and recording medium
MYPI2015702772A MY179506A (en) 2013-02-25 2013-10-28 Character recognition apparatus, character recognition method, and recording medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013035160A JP6173715B2 (en) 2013-02-25 2013-02-25 Character recognition device, character recognition method and program

Publications (2)

Publication Number Publication Date
JP2014164529A true JP2014164529A (en) 2014-09-08
JP6173715B2 JP6173715B2 (en) 2017-08-02

Family

ID=51390833

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013035160A Active JP6173715B2 (en) 2013-02-25 2013-02-25 Character recognition device, character recognition method and program

Country Status (4)

Country Link
JP (1) JP6173715B2 (en)
MY (1) MY179506A (en)
SG (1) SG11201506566YA (en)
WO (1) WO2014129016A1 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2021093225A (en) * 2021-03-19 2021-06-17 キヤノン株式会社 Information processing device, program, and information processing method

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06215293A (en) * 1993-01-19 1994-08-05 Hitachi Ltd Device for recognizing vehicle number
JP2007188512A (en) * 2000-09-29 2007-07-26 Japan Science & Technology Agency Character recognizing method, character recognizing program and computer readable recording medium recorded with character recognizing program
JP2011018175A (en) * 2009-07-08 2011-01-27 Mitsubishi Heavy Ind Ltd Character recognition apparatus and character recognition method

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09282417A (en) * 1996-04-18 1997-10-31 Matsushita Electric Ind Co Ltd Character recognition device

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06215293A (en) * 1993-01-19 1994-08-05 Hitachi Ltd Device for recognizing vehicle number
JP2007188512A (en) * 2000-09-29 2007-07-26 Japan Science & Technology Agency Character recognizing method, character recognizing program and computer readable recording medium recorded with character recognizing program
JP2011018175A (en) * 2009-07-08 2011-01-27 Mitsubishi Heavy Ind Ltd Character recognition apparatus and character recognition method

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2021093225A (en) * 2021-03-19 2021-06-17 キヤノン株式会社 Information processing device, program, and information processing method

Also Published As

Publication number Publication date
SG11201506566YA (en) 2015-09-29
WO2014129016A1 (en) 2014-08-28
JP6173715B2 (en) 2017-08-02
MY179506A (en) 2020-11-09

Similar Documents

Publication Publication Date Title
CN104361312B (en) A kind of method and apparatus that character recognition is carried out to image
US8340433B2 (en) Image processing apparatus, electronic medium, and image processing method
JP2014089626A (en) Image detection device and control program and image detection method
JP6177541B2 (en) Character recognition device, character recognition method and program
US8300937B2 (en) Image segmentation method and system based on region features of pixels
CN104239909A (en) Method and device for recognizing images
CN110738203A (en) Method and device for outputting field structuralization and computer readable storage medium
US7715632B2 (en) Apparatus and method for recognizing an image
CN105761256B (en) The sub-pixel edge straight line acquisition methods and device of image
CN110009615A (en) The detection method and detection device of image angle point
JP2010117981A (en) Face detector
JP2007025902A (en) Image processor and image processing method
CN111709428A (en) Method and device for identifying key point positions in image, electronic equipment and medium
JP6173715B2 (en) Character recognition device, character recognition method and program
CN116976372A (en) Picture identification method, device, equipment and medium based on square reference code
JP6432179B2 (en) Document file generation apparatus and document file generation method
JP6786973B2 (en) Image analyzer
JP5051671B2 (en) Information processing apparatus, information processing method, and program
JP3172498B2 (en) Image recognition feature value extraction method and apparatus, storage medium for storing image analysis program
CN110705568B (en) Optimization method for image feature point extraction
JP7201211B2 (en) Object detection method and object detection device
CN109492685B (en) Target object visual detection method for symmetric characteristics
JP6373729B2 (en) Program, image processing apparatus and image processing method
JP2011018175A (en) Character recognition apparatus and character recognition method
JP4394692B2 (en) Graphic reading apparatus and method, and program thereof

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20160223

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A712

Effective date: 20160324

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20170328

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170523

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20170607

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20170705

R150 Certificate of patent or registration of utility model

Ref document number: 6173715

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350