JP2012230482A - Evaluation image processing apparatus and evaluation image processing method - Google Patents

Evaluation image processing apparatus and evaluation image processing method Download PDF

Info

Publication number
JP2012230482A
JP2012230482A JP2011097220A JP2011097220A JP2012230482A JP 2012230482 A JP2012230482 A JP 2012230482A JP 2011097220 A JP2011097220 A JP 2011097220A JP 2011097220 A JP2011097220 A JP 2011097220A JP 2012230482 A JP2012230482 A JP 2012230482A
Authority
JP
Japan
Prior art keywords
evaluation
evaluation image
character recognition
calculated
image processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2011097220A
Other languages
Japanese (ja)
Inventor
Atsushi Iwasaki
淳 岩崎
Tetsuo Sumiya
哲夫 住谷
Takafumi Yamazoe
隆文 山添
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NTT Docomo Inc
Original Assignee
NTT Docomo Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NTT Docomo Inc filed Critical NTT Docomo Inc
Priority to JP2011097220A priority Critical patent/JP2012230482A/en
Publication of JP2012230482A publication Critical patent/JP2012230482A/en
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

PROBLEM TO BE SOLVED: To provide an evaluation image processing apparatus and an evaluation image processing method capable of simply performing a character recognition type performance evaluation by using a uniquely digitized character recognition type evaluation index.SOLUTION: A character recognition processing part 11 performs character recognition for an evaluation image inputted from an evaluation image input part 10 in accordance with a character recognition method specified by an operator and calculates a certainty factor of a recognition result in each character. An average certainty factor calculation part 12 calculates an evaluation value of the evaluation image based on the calculated certainty factors. Although an average value of the certainty factors is calculated as the evaluation value of the evaluation image, calculation of a total value of certainty factors e.g. can be also adopted. An evaluation index classification part 13 classifies the evaluation image based on the calculated evaluation value. An evaluation index output part 14 displays the classified evaluation image and its classification level.

Description

本発明は、文字認識方式の性能を把握・評価する評価画像処理装置及び評価画像処理方法に関する。   The present invention relates to an evaluation image processing apparatus and an evaluation image processing method for grasping and evaluating the performance of a character recognition method.

これまで文字認識は、スキャナから取り込んだ文書をコンピュータで読み取る方法や、もしくは例えば食品の製造過程で専用の工業製品でパッケージなど読み取る方法により行われていた。   Until now, character recognition has been performed by a method of reading a document taken from a scanner by a computer or a method of reading a package or the like by a dedicated industrial product in a food manufacturing process, for example.

昨今、カメラ付き携帯電話の普及によりカメラから取り込んだ画像から文字を認識させるニーズが高まっている。この場合、文書のように白紙の上に文字が書かれている場合だけでなく、情景写真や風景写真に文字が書かれていることもあり、これらから文字を認識する技術も検討されている。   Recently, with the spread of camera-equipped mobile phones, there is an increasing need to recognize characters from images captured from cameras. In this case, not only when characters are written on a blank sheet as in a document, but also characters may be written on a scene photo or landscape photo, and techniques for recognizing characters from these are also being considered. .

情景写真や風景写真中の文字を認識する際には、スキャナから取り込んだ文書をコンピュータで読み取る等の従来の文字認識方式に比べ、その精度が低くなる傾向があり、文字認識方式の性能を評価することで、評価結果を基に文字認識方式の性能向上を図ることが重要となる。文字認識方式の性能評価方法としては、以下の非特許文献1の方法が知られている。   When recognizing characters in a scene or landscape photo, the accuracy tends to be lower than conventional character recognition methods such as reading a document imported from a scanner on a computer, and the performance of the character recognition method is evaluated. Thus, it is important to improve the performance of the character recognition method based on the evaluation result. As a performance evaluation method of the character recognition method, the method of Non-Patent Document 1 below is known.

ICDAR 2003 robust readingcompetitions: entries, results, and future directions (IJDAR(2005) 7: 105-122)ICDAR 2003 robust readingcompetitions: entries, results, and future directions (IJDAR (2005) 7: 105-122)

非特許文献1の技術においては、性能を評価するためのする文字のテストセットの複雑度を3つに分けて分析している。この3つはテキスト位置把握、文字認識、および単語認識である。しかしながら、この方式を用いると複雑度の評価指標が3つに分かれているため、その方法自体、扱いが困難であるという問題点がある。   In the technique of Non-Patent Document 1, the complexity of a test set of characters for evaluating performance is divided into three and analyzed. These three are text position recognition, character recognition, and word recognition. However, when this method is used, since the complexity evaluation index is divided into three, the method itself has a problem that it is difficult to handle.

そこで、本発明は、一意に数値化された文字認識方式の評価指標を用いて簡単に文字認識方式の性能評価を行うことができる評価画像処理装置および評価画像処理方法を提供することを目的とする。   Accordingly, an object of the present invention is to provide an evaluation image processing apparatus and an evaluation image processing method capable of easily performing performance evaluation of a character recognition method using a uniquely quantified evaluation index of the character recognition method. To do.

そこで、上述の問題を解決するために、本発明の評価画像処理装置は、文字認識方式の評価を行う評価画像処理装置において、評価画像を入力する入力手段と、前記入力手段により入力された前記評価画像に対して文字認識を行い、一文字ごとに認識結果に対する確信度を算出する文字認識処理手段と、前記文字認識処理手段により算出された確信度に基づいて、前記評価画像の評価値を算出する評価値算出手段と、を備えている。   Therefore, in order to solve the above-described problem, an evaluation image processing apparatus of the present invention is an evaluation image processing apparatus that performs evaluation of a character recognition method, an input unit that inputs an evaluation image, and the input that is input by the input unit. Character recognition processing is performed on the evaluation image, and the evaluation value of the evaluation image is calculated based on the character recognition processing means for calculating the certainty for the recognition result for each character and the certainty calculated by the character recognition processing means. Evaluation value calculating means.

また、本発明の評価画像処理方法は、文字認識方式の評価を行う評価画像処理装置の評価画像処理方法において、評価画像を入力する入力ステップと、前記入力ステップにより入力された前記評価画像に対して文字認識を行い、一文字ごとに認識結果に対する確信度を算出する文字認識処理ステップと、前記文字認識処理ステップにより算出された確信度に基づいて、前記評価画像の評価値を算出する評価値算出ステップと、を備えている。   The evaluation image processing method of the present invention is an evaluation image processing method of an evaluation image processing apparatus that evaluates a character recognition method. An input step of inputting an evaluation image, and the evaluation image input by the input step A character recognition processing step that performs character recognition and calculates a certainty factor for the recognition result for each character, and an evaluation value calculation that calculates an evaluation value of the evaluation image based on the certainty factor calculated by the character recognition processing step And steps.

この発明によれば、入力された前記評価画像に対して文字認識を行い、一文字ごとに認識結果に対する確信度を算出し、算出された確信度に基づいて、評価画像の評価値を算出し、算出された評価値に基づいて評価画像を分類する。これにより、これにより一意の数値化された指標を用いて評価することが可能となり、簡単な処理で評価画像の評価を行うことができる。   According to this invention, character recognition is performed on the input evaluation image, a certainty factor for the recognition result is calculated for each character, an evaluation value of the evaluation image is calculated based on the calculated certainty factor, The evaluation images are classified based on the calculated evaluation value. Thereby, it becomes possible to evaluate using a unique numerical index, and the evaluation image can be evaluated by a simple process.

また、本発明の評価画像処理装置において、前記評価値算出手段は、前記文字認識処理手段により算出された、前記評価画像における全ての文字の確信度から一文字あたりの確信度の平均値を評価値として算出するようにしてもよい。   In the evaluation image processing apparatus of the present invention, the evaluation value calculation means calculates an average value of the certainty factor per character from the certainty factors of all the characters in the evaluation image, which is calculated by the character recognition processing means. May be calculated as

この発明によれば、確信度の平均値を評価値として算出することで、評価画像の評価を適正に行うことができる。   According to this invention, the evaluation image can be properly evaluated by calculating the average value of the certainty factor as the evaluation value.

また、本発明の評価画像処理装置において、前記評価値算出手段は、前記文字認識処理手段により算出された、前記評価画像における全て若しくは予め定めた個数の文字の確信度の合計値を評価値として算出するようにしてもよい。   In the evaluation image processing apparatus of the present invention, the evaluation value calculation means uses a total value of certainty factors of all or a predetermined number of characters in the evaluation image calculated by the character recognition processing means as an evaluation value. You may make it calculate.

この発明によれば、確信度の合計値を評価値として算出することで、評価画像の評価を行うことができる。なお、この場合、評価対象の個数が同数程度である場合、他の評価画像と比較する上では、適正な評価とすることができる。   According to this invention, the evaluation image can be evaluated by calculating the total value of the certainty factors as the evaluation value. In this case, when the number of evaluation objects is about the same, an appropriate evaluation can be made in comparison with other evaluation images.

また、本発明の評価画像処理装置は、前記評価値算出手段により算出された評価値に基づいて前記評価画像を分類する評価画像分類手段をさらに備える。   The evaluation image processing apparatus of the present invention further includes an evaluation image classification unit that classifies the evaluation image based on the evaluation value calculated by the evaluation value calculation unit.

この発明によれば、評価値に基づいて評価画像を分類することができる。この分類を複数にした場合、さまざまな角度から評価することができる。例えば、ある文字認識方式は、多数の文字を含んだ画像の認識に適したものであるとか、別の文字認識方式は、少ない文字を含んだ画像については、高速に認識処理をすることができるなど、文字認識方式の性能の把握および認識特性の把握をすることができる。よって、性能向上に必要となる機能強化部分を容易に把握することができる。   According to the present invention, the evaluation images can be classified based on the evaluation value. When this classification is made plural, it can be evaluated from various angles. For example, a certain character recognition method is suitable for recognizing an image including a large number of characters, and another character recognition method can perform high-speed recognition processing on an image including a small number of characters. For example, it is possible to grasp the performance of the character recognition method and the recognition characteristics. Therefore, it is possible to easily grasp the function-enhanced portion necessary for performance improvement.

本発明によれば、一意の数値化された指標を用いて評価することが可能となり、より簡単な評価指標を用いて評価画像を評価することができる。   According to the present invention, evaluation can be performed using a unique numerical index, and an evaluation image can be evaluated using a simpler evaluation index.

文字認識方式を評価するための評価画像処理装置100の機能構成を示すブロック図である。It is a block diagram which shows the function structure of the evaluation image processing apparatus 100 for evaluating a character recognition system. 評価画像処理装置100のハードウェア構成図である。2 is a hardware configuration diagram of an evaluation image processing apparatus 100. FIG. 文字認識処理を行う際におけるテンプレート画像と評価画像とを比較する模式図である。It is a schematic diagram which compares the template image and evaluation image in performing a character recognition process. レベルと平均確信度との対応テーブルを示す説明図である。It is explanatory drawing which shows the correspondence table of a level and average reliability. 評価画像処理装置100の処理を示すフローチャートである。3 is a flowchart showing processing of an evaluation image processing apparatus 100. 評価画像処理装置100が評価・分類した評価画像の具体例およびその確信度を示す説明図である。It is explanatory drawing which shows the specific example of the evaluation image evaluated and classified by the evaluation image processing apparatus 100, and its certainty factor.

添付図面を参照しながら本発明の実施形態を説明する。可能な場合には、同一の部分には同一の符号を付して、重複する説明を省略する。   Embodiments of the present invention will be described with reference to the accompanying drawings. Where possible, the same parts are denoted by the same reference numerals, and redundant description is omitted.

本発明の実施形態に係る文字認識方式を評価・分類する評価画像処理装置100は、入力された評価画像から評価指標となる平均確信度を算出し、その平均確信度により評価画像を分類するものである。   An evaluation image processing apparatus 100 that evaluates and classifies a character recognition method according to an embodiment of the present invention calculates an average certainty factor that serves as an evaluation index from an input evaluation image, and classifies the evaluation image based on the average certainty factor It is.

図1は、文字認識方式を評価するための評価画像処理装置100の機能構成を示すブロック図である。評価画像処理装置1は、図1に示すように、評価画像入力部10(入力手段)、文字認識処理部11(文字認識処理手段)、平均確信度算出部12(評価値算出手段)、評価画像分類部13(評価画像分類手段)、および評価指標出力部14を備える。   FIG. 1 is a block diagram showing a functional configuration of an evaluation image processing apparatus 100 for evaluating a character recognition method. As shown in FIG. 1, the evaluation image processing apparatus 1 includes an evaluation image input unit 10 (input unit), a character recognition processing unit 11 (character recognition processing unit), an average certainty calculation unit 12 (evaluation value calculation unit), an evaluation An image classification unit 13 (evaluation image classification means) and an evaluation index output unit 14 are provided.

図2は、評価画像処理装置100のハードウェア構成図である。図1に示される評価画像処理装置100は、物理的には、図2に示すように、CPU1、主記憶装置であるRAM2及びROM3、入力デバイスであるキーボード及びマウス等の入力装置4、ディスプレイ等の出力装置5、ネットワークカード等のデータ送受信デバイスである通信モジュール6、半導体メモリ等の補助記憶装置7などを含むコンピュータシステムとして構成されている。図1において説明した各機能は、図2に示すCPU1、RAM2等のハードウェア上に所定のコンピュータソフトウェアを読み込ませることにより、CPU1の制御のもとで入力装置4、出力装置5、通信モジュール6を動作させるとともに、RAM2や補助記憶装置7におけるデータの読み出し及び書き込みを行うことで実現される。以下、図1に示す機能ブロックに基づいて、各機能ブロックを説明する。   FIG. 2 is a hardware configuration diagram of the evaluation image processing apparatus 100. As shown in FIG. 2, the evaluation image processing apparatus 100 shown in FIG. 1 physically includes a CPU 1, a RAM 2 and a ROM 3 as main storage devices, an input device 4 such as a keyboard and a mouse as input devices, a display, and the like. Output device 5, a communication module 6 that is a data transmission / reception device such as a network card, an auxiliary storage device 7 such as a semiconductor memory, and the like. Each function described in FIG. 1 has the input device 4, the output device 5, and the communication module 6 under the control of the CPU 1 by reading predetermined computer software on the hardware such as the CPU 1 and the RAM 2 shown in FIG. This is realized by reading and writing data in the RAM 2 and the auxiliary storage device 7. Hereinafter, each functional block will be described based on the functional blocks shown in FIG.

評価画像入力部10は、文字認識方式を評価するためのテスト画像である評価画像を入力する部分である。例えば、スキャナやカメラであり、評価画像として情景写真や風景写真などを取り込むための手段である。   The evaluation image input unit 10 is a part for inputting an evaluation image that is a test image for evaluating the character recognition method. For example, it is a scanner or a camera, and is a means for capturing a scene photo or landscape photo as an evaluation image.

文字認識処理部11は、評価画像入力部10により入力された評価画像に対して、複数設定されている文字認識方式(文字認識エンジン)からオペレータにより指定された文字認識方式に基づいた文字認識処理を行い、その認識結果に対する確信度を算出する部分である。この文字認識処理部11は、オペレータの指示に基づいて一の文字認識方式を決定し、その文字認識方式に従って文字認識処理を行う。なお、この文字認識処理部11は、複数の文字認識方式が設定され、評価対象となる一の文字認識方式を選択するようにしてもよいし、または文字認識方式を評価するたびに、文字認識方式を設定・記憶するようにしてもよい。   The character recognition processing unit 11 performs character recognition processing based on a character recognition method designated by an operator from a plurality of character recognition methods (character recognition engines) set for the evaluation image input by the evaluation image input unit 10. This is a part for calculating the certainty factor for the recognition result. The character recognition processing unit 11 determines one character recognition method based on an instruction from the operator, and performs character recognition processing according to the character recognition method. The character recognition processing unit 11 may be configured to select a single character recognition method to be evaluated and set a plurality of character recognition methods, or to evaluate a character recognition method each time the character recognition method is evaluated. A method may be set and stored.

指定された文字認識方式に従って文字認識処理されて得られた確信度は、文字認識処理の結果から得られた文字データの確からしさを表す指標であり、例えば文字認識を行う際にテンプレートとして使用するテンプレート画像と評価画像を比較することで求めることができる。   The certainty obtained by performing the character recognition processing according to the designated character recognition method is an index representing the certainty of the character data obtained from the result of the character recognition processing, and is used as a template when performing character recognition, for example. It can be obtained by comparing the template image and the evaluation image.

図3は、文字認識処理を行う際におけるテンプレート画像と評価画像とを比較する模式図である。まず、文字認識処理において抽出した文字領域Mについて(図3(a))、画像の二値化処理を行い、文字部分の画素の値を「1」と、それ以外の部分の画素の値を「0」とする。次に、文字領域を複数のブロックに分割する(図3(b))。その後、分割した各ブロックにおいて画素値を合算する処理を行い、テンプレート画像に対する合算値をSoriginalと、評価画像に対する合算値をSnoisyとする(図3(c))。図3(c)の例では、Soriginal=25、Snoizy=12と算出されている。算出したSoriginalと、Snoisyとの差分を算出し、それに基づいた平均二乗誤差(MSE)を算出し、それを確信度として算出することができる(式(1)参照)。式(1)におけるnは、分割したブロックの数である。確信度は、評価対象部分となる分割領域ごとの平均二乗誤差を合計したものに基づいて定められる。なお、平均二乗誤差は、平均誤差や平均平方誤差と称される場合がある。
FIG. 3 is a schematic diagram for comparing a template image and an evaluation image when performing character recognition processing. First, with respect to the character region M extracted in the character recognition process (FIG. 3A), the binarization process of the image is performed. “0”. Next, the character area is divided into a plurality of blocks (FIG. 3B). Thereafter, a process of adding the pixel values in each divided block is performed, and the sum value for the template image is Soriginal and the sum value for the evaluation image is Snoisy (FIG. 3C). In the example of FIG. 3C, Soriginal = 25 and Snoizy = 12. A difference between the calculated Soriginal and Snoisy is calculated, a mean square error (MSE) based on the difference is calculated, and it can be calculated as a certainty factor (see Expression (1)). N in the formula (1) is the number of divided blocks. The certainty factor is determined on the basis of the sum of the mean square errors for each of the divided regions to be evaluated. Note that the mean square error may be referred to as an average error or an average square error.

また、式(2)に示されるとおり、二乗平均平方根誤差RMSE (root mean squared error)を確信度として算出してもよい。なお、二乗平均平方根誤差は、平均2乗平方根誤差、平均二乗誤差、平均2乗誤差平方根、平方根平均二乗誤差、誤差の標準偏差、などと称される場合がある。
Further, as shown in Equation (2), a root mean squared error (RMSE) may be calculated as the certainty factor. The root mean square error may be referred to as a mean square square error, a mean square error, a mean square error square root, a square root mean square error, a standard deviation of errors, and the like.

平均確信度算出部12は、文字認識処理部11により算出された確信度からその一文字あたりの平均値である平均確信度を算出する部分である。すなわち、平均確信度算出部12は、文字認識処理部11において認識された文字若しくは文字と扱われて認識された対象部分の認識数を計数しておき、算出した全確信度の合計値を認識数で除算することにより、平均確信度を算出する。この平均確信度は、評価画像にどれだけ活字文字を含んでいる可能性があるか示す数値である。この数値を用いて評価画像の複雑度を判定することができる。   The average certainty calculation unit 12 is a part that calculates an average certainty that is an average value per character from the certainty calculated by the character recognition processing unit 11. That is, the average certainty calculation unit 12 counts the number of recognitions of characters recognized as characters or characters recognized by the character recognition processing unit 11 and recognizes the total value of all the calculated certainty factors. The average confidence is calculated by dividing by a number. This average certainty is a numerical value indicating how much type characters may be included in the evaluation image. The complexity of the evaluation image can be determined using this numerical value.

なお、平均確信度算出部12にかえて、評価値算出部として、評価画像において認識対象とされた文字の全てもしくは上位N個の確信度の合計値を評価値として算出するようにしてもよい。認識対象数を同程度とする評価画像を選択した場合若しくは上位N個のように認識対象数を同程度にした場合、他の評価画像と比較する上では、平均確信度と同等に扱うことができる。   Note that instead of the average certainty factor calculation unit 12, the evaluation value calculation unit may calculate all the characters that are the recognition targets in the evaluation image or the total value of the top N certainty factors as the evaluation value. . When evaluation images with the same number of recognition targets are selected, or when the number of recognition targets is the same, such as the top N, when compared with other evaluation images, it can be treated as equivalent to the average confidence. it can.

評価画像分類部13は、平均確信度算出部12により算出された平均確信度に基づいて評価画像の分類を行う部分である。評価画像分類部13は、図4に示すようなレベルと平均確信度との対応テーブルを保持しており、評価画像分類部13は、平均確信度算出部12により算出された平均確信度が、対応テーブルにおけるどのレベルに分類されるか判断して、分類する。図4における対応テーブルは、レベルを8段階に区分したものである。   The evaluation image classifying unit 13 is a part that classifies evaluation images based on the average certainty factor calculated by the average certainty factor calculating unit 12. The evaluation image classification unit 13 holds a correspondence table between levels and average certainty as shown in FIG. 4, and the evaluation image classification unit 13 has the average certainty calculated by the average certainty calculation unit 12. It is classified by determining which level in the correspondence table is classified. The correspondence table in FIG. 4 is a table in which levels are divided into 8 levels.

評価指標出力部14は、分類結果(レベル)と評価画像とを対応付けて出力する部分である。例えば、評価指標出力部14はディスプレイ等であって、分類結果と評価画像とを対応付けて表示する。   The evaluation index output unit 14 is a part that outputs a classification result (level) and an evaluation image in association with each other. For example, the evaluation index output unit 14 is a display or the like, and displays the classification result and the evaluation image in association with each other.

以上のとおり、本実施形態の評価画像処理装置100は、評価画像を文字認識処理して得られた確信度に基づいて、評価画像のレベルを分類することができる。   As described above, the evaluation image processing apparatus 100 according to the present embodiment can classify the level of the evaluation image based on the certainty factor obtained by character recognition processing of the evaluation image.

つぎに、評価画像処理装置100の動作について、説明する。図5は、評価画像処理装置100の処理を示す評価画像処理方法のフローチャートである。まず、評価画像入力部10により文字を含む評価画像が入力される(S21)。そして、文字認識処理部11により、複数設定されている文字認識方式のうち、オペレータにより指定された文字認識方式に従って、入力した評価画像に対して、文字認識処理が行われる(S22)。   Next, the operation of the evaluation image processing apparatus 100 will be described. FIG. 5 is a flowchart of the evaluation image processing method showing the processing of the evaluation image processing apparatus 100. First, an evaluation image including characters is input by the evaluation image input unit 10 (S21). Then, the character recognition processing unit 11 performs character recognition processing on the input evaluation image according to the character recognition method designated by the operator among the plurality of character recognition methods set (S22).

文字認識処理部11により文字認識処理が行われると、その認識結果から得られた各文字に対して、文字認識処理部11により文字認識結果の確信度が算出される(S23)。そして、平均確信度算出部12により、評価画像中で得られた全ての文字に対する確信度の一文字あたりの平均値が算出され、得られた平均値は評価画像の平均確信度とされる(S24)。平均確信度が算出されると、評価画像分類部13により、平均確信度を基に、評価画像の分類が行われる(S25)。   When the character recognition processing is performed by the character recognition processing unit 11, the certainty factor of the character recognition result is calculated by the character recognition processing unit 11 for each character obtained from the recognition result (S23). And the average certainty calculation part 12 calculates the average value per character of the certainty factor for all the characters obtained in the evaluation image, and the obtained average value is set as the average certainty factor of the evaluation image (S24). ). When the average certainty factor is calculated, the evaluation image classifying unit 13 classifies the evaluation image based on the average certainty factor (S25).

このような処理により、評価画像処理装置100において、評価画像の分類処理を行うことができる。図6に、本実施形態における評価画像処理装置100が評価・分類した評価画像の具体例およびその確信度を示す。図6(a)に示されるとおり、この評価画像には、ある風景画像に「飲用水」と読める看板が写っている。本実施形態における評価画像処理装置100が、このような評価画像の分類処理を行うと、図6(b)に示されるような、抽出文字ごとに確信度が得られる。この評価画像では、抽出文字として、“、”や“(”さらに“●”などの、人の目にはこのような文字を評価画像中には認識できないものも抽出文字として抽出され、確信度が算出されている。この評価画像処理装置100は、このように抽出文字として抽出されたものの平均確信度を算出することにより、この評価画像の分類を行うことができる。この図6(b)の確信度に基づいた平均確信度を図4の対応テーブルに当てはめてみると、平均確信度は、(1+2+1+・・・3+7)/16=1.94
となり、この評価画像はレベル2と分類することができる。
By such processing, the evaluation image processing apparatus 100 can perform evaluation image classification processing. FIG. 6 shows a specific example of an evaluation image evaluated and classified by the evaluation image processing apparatus 100 according to the present embodiment and its certainty factor. As shown in FIG. 6 (a), this evaluation image includes a signboard that reads “drinking water” in a certain landscape image. When the evaluation image processing apparatus 100 according to the present embodiment performs such evaluation image classification processing, a certainty factor is obtained for each extracted character as shown in FIG. In this evaluation image, characters that cannot be recognized in the human eye such as “,” and “(” and “●” are also extracted as extracted characters. The evaluation image processing apparatus 100 can classify the evaluation images by calculating the average certainty of the extracted characters as described above, as shown in FIG. When the average certainty factor based on the certainty factor is applied to the correspondence table of FIG. 4, the average certainty factor is (1 + 2 + 1 +... 3 + 7) /16=1.94.
Thus, this evaluation image can be classified as level 2.

そして、このような分類結果を基に、文字認識方式の評価を行うことができる。例えば、分類したレベルごとに評価画像を一定数ずつ抽出し、抽出した評価画像を当該分類ごとに文字認識精度を評価するといった利用方法が想定される。   The character recognition method can be evaluated based on the classification result. For example, it is assumed that a certain number of evaluation images are extracted for each classified level, and the extracted evaluation images are evaluated for character recognition accuracy for each classification.

つぎに、本実施形態の評価画像処理装置100の作用効果について説明する。本実施形態の評価画像処理装置100において、評価画像入力部10から入力された評価画像に対して、文字認識処理部11がオペレータにより指定された文字認識方式に従って文字認識を行い、一文字ごとに認識結果に対する確信度を算出する。そして、平均確信度算出部12は、算出された確信度に基づいて、評価画像の評価値を算出する。本実施形態では、評価画像の評価値として、確信度の平均値を算出しているが、これに限るものではなく、例えば確信度の合計値を算出するようにしてもよい。そして、評価指標出力部13は、算出された評価値に基づいて評価画像を分類する。そして、評価指標出力部14は、分類した評価画像およびその分類レベルを表示する。これにより、これにより一意の数値化された指標を用いて評価することが可能となる。   Next, operational effects of the evaluation image processing apparatus 100 of the present embodiment will be described. In the evaluation image processing apparatus 100 of this embodiment, the character recognition processing unit 11 performs character recognition on the evaluation image input from the evaluation image input unit 10 according to the character recognition method designated by the operator, and recognizes each character. Calculate confidence for the result. Then, the average certainty calculation unit 12 calculates an evaluation value of the evaluation image based on the calculated certainty factor. In the present embodiment, the average value of the certainty factor is calculated as the evaluation value of the evaluation image, but the present invention is not limited to this. For example, a total value of the certainty factor may be calculated. Then, the evaluation index output unit 13 classifies the evaluation images based on the calculated evaluation value. Then, the evaluation index output unit 14 displays the classified evaluation image and its classification level. Thereby, it becomes possible to evaluate using a unique numerical index.

なお、評価値に基づいて評価画像を複数のレベルに分類することで、さまざまな角度から評価することができる。例えば、ある文字認識方式は、多数の文字を含んだ画像の認識に適したものであるとか、別の文字認識方式は、少ない文字を含んだ画像については、拘束に認識処理をすることができるなど、文字認識方式の性能の把握および認識特性の把握をすることができる。よって、性能向上に必要となる機能強化部分を容易に把握することができる。   In addition, it can evaluate from various angles by classifying an evaluation image into a plurality of levels based on an evaluation value. For example, a certain character recognition method is suitable for recognizing an image including a large number of characters, and another character recognition method can perform a recognition process with respect to an image including a small number of characters. For example, it is possible to grasp the performance of the character recognition method and the recognition characteristics. Therefore, it is possible to easily grasp the function-enhanced portion necessary for performance improvement.

10…評価画像入力部、11…文字認識処理部、12…平均確信度算出部、13…評価画像分類部、14…評価指標出力部、100…評価画像処理装置。
DESCRIPTION OF SYMBOLS 10 ... Evaluation image input part, 11 ... Character recognition process part, 12 ... Average reliability calculation part, 13 ... Evaluation image classification part, 14 ... Evaluation index output part, 100 ... Evaluation image processing apparatus.

Claims (5)

文字認識方式の評価を行う評価画像処理装置において、
評価画像を入力する入力手段と、
前記入力手段により入力された前記評価画像に対して文字認識を行い、一文字ごとに認識結果に対する確信度を算出する文字認識処理手段と、
前記文字認識処理手段により算出された確信度に基づいて、前記評価画像の評価値を算出する評価値算出手段と、
を備える評価画像処理装置。
In an evaluation image processing apparatus that evaluates a character recognition method,
An input means for inputting an evaluation image;
Character recognition processing means for performing character recognition on the evaluation image input by the input means, and calculating a certainty factor for a recognition result for each character;
Evaluation value calculation means for calculating an evaluation value of the evaluation image based on the certainty factor calculated by the character recognition processing means;
An evaluation image processing apparatus comprising:
前記評価値算出手段は、
前記文字認識処理手段により算出された、前記評価画像における全ての文字の確信度から一文字あたりの確信度の平均値を評価値として算出する
ことを特徴とする請求項1に記載の評価画像処理装置。
The evaluation value calculation means includes
2. The evaluation image processing apparatus according to claim 1, wherein an average value of the certainty factor per character is calculated as an evaluation value from the certainty factor of all characters in the evaluation image calculated by the character recognition processing unit. .
前記評価値算出手段は、
前記文字認識処理手段により算出された、前記評価画像における全て若しくは予め定めた個数の文字の確信度の合計値を評価値として算出する
ことを特徴とする請求項1に記載の評価画像処理装置。
The evaluation value calculation means includes
2. The evaluation image processing apparatus according to claim 1, wherein a total value of certainty factors of all or a predetermined number of characters in the evaluation image calculated by the character recognition processing unit is calculated as an evaluation value.
前記評価値算出手段により算出された評価値に基づいて前記評価画像を分類する評価画像分類手段をさらに備える評価画像処理装置。   An evaluation image processing apparatus further comprising an evaluation image classification unit that classifies the evaluation image based on the evaluation value calculated by the evaluation value calculation unit. 文字認識方式の評価を行う評価画像処理装置の評価画像処理方法において、
評価画像を入力する入力ステップと、
前記入力ステップにより入力された前記評価画像に対して文字認識を行い、一文字ごとに認識結果に対する確信度を算出する文字認識処理ステップと、
前記文字認識処理ステップにより算出された確信度に基づいて、前記評価画像の評価値を算出する評価値算出ステップと、
を備える評価画像処理方法。
In the evaluation image processing method of the evaluation image processing apparatus for evaluating the character recognition method,
An input step for inputting an evaluation image;
Character recognition is performed on the evaluation image input by the input step, and a character recognition processing step of calculating a certainty factor for the recognition result for each character;
An evaluation value calculating step for calculating an evaluation value of the evaluation image based on the certainty factor calculated by the character recognition processing step;
An evaluation image processing method comprising:
JP2011097220A 2011-04-25 2011-04-25 Evaluation image processing apparatus and evaluation image processing method Pending JP2012230482A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2011097220A JP2012230482A (en) 2011-04-25 2011-04-25 Evaluation image processing apparatus and evaluation image processing method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2011097220A JP2012230482A (en) 2011-04-25 2011-04-25 Evaluation image processing apparatus and evaluation image processing method

Publications (1)

Publication Number Publication Date
JP2012230482A true JP2012230482A (en) 2012-11-22

Family

ID=47431992

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011097220A Pending JP2012230482A (en) 2011-04-25 2011-04-25 Evaluation image processing apparatus and evaluation image processing method

Country Status (1)

Country Link
JP (1) JP2012230482A (en)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000353215A (en) * 1999-06-11 2000-12-19 Nec Corp Character recognition device and recording medium where character recognizing program is recorded
JP2001265811A (en) * 2000-03-22 2001-09-28 Toshiba Corp System and method for image retrieval
JP2007086954A (en) * 2005-09-21 2007-04-05 Fuji Xerox Co Ltd Character recognition processing device, character recognition processing method, and computer program

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000353215A (en) * 1999-06-11 2000-12-19 Nec Corp Character recognition device and recording medium where character recognizing program is recorded
JP2001265811A (en) * 2000-03-22 2001-09-28 Toshiba Corp System and method for image retrieval
JP2007086954A (en) * 2005-09-21 2007-04-05 Fuji Xerox Co Ltd Character recognition processing device, character recognition processing method, and computer program

Similar Documents

Publication Publication Date Title
US11710293B2 (en) Target detection method and apparatus, computer-readable storage medium, and computer device
US10896349B2 (en) Text detection method and apparatus, and storage medium
CN110348294B (en) Method and device for positioning chart in PDF document and computer equipment
WO2020192433A1 (en) Multi-language text detection and recognition method and device
US8792722B2 (en) Hand gesture detection
US20190073553A1 (en) Region proposal for image regions that include objects of interest using feature maps from multiple layers of a convolutional neural network model
CN109448007B (en) Image processing method, image processing apparatus, and storage medium
WO2019179295A1 (en) Facial recognition method and device
WO2021047484A1 (en) Text recognition method and terminal device
CN113657274B (en) Table generation method and device, electronic equipment and storage medium
CN109389105B (en) Multitask-based iris detection and visual angle classification method
JP2021135993A (en) Text recognition method, text recognition apparatus, electronic device, and storage medium
US20160098615A1 (en) Apparatus and method for producing image processing filter
CN111985469B (en) Method and device for recognizing characters in image and electronic equipment
JP2018206252A (en) Image processing system, evaluation model construction method, image processing method, and program
CN112861842A (en) Case text recognition method based on OCR and electronic equipment
CN113011413A (en) Method, device and system for processing handwritten image based on smart pen and storage medium
JP2019220014A (en) Image analyzing apparatus, image analyzing method and program
CN115861400A (en) Target object detection method, training method and device and electronic equipment
JP6341059B2 (en) Character recognition device, character recognition method, and program
WO2015031350A1 (en) Systems and methods for memory utilization for object detection
US9378428B2 (en) Incomplete patterns
US20230048495A1 (en) Method and platform of generating document, electronic device and storage medium
JP2012230482A (en) Evaluation image processing apparatus and evaluation image processing method
JP2015184743A (en) Image processor and object recognition method

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20140224

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20141028

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20141104

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20141225

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20150519