JP2019159374A - Information processing apparatus and program - Google Patents
Information processing apparatus and program Download PDFInfo
- Publication number
- JP2019159374A JP2019159374A JP2018040657A JP2018040657A JP2019159374A JP 2019159374 A JP2019159374 A JP 2019159374A JP 2018040657 A JP2018040657 A JP 2018040657A JP 2018040657 A JP2018040657 A JP 2018040657A JP 2019159374 A JP2019159374 A JP 2019159374A
- Authority
- JP
- Japan
- Prior art keywords
- determination
- section
- accuracy
- post
- input
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000010365 information processing Effects 0.000 title claims description 24
- 238000012545 processing Methods 0.000 claims abstract description 91
- 238000012805 post-processing Methods 0.000 claims description 120
- 238000000034 method Methods 0.000 claims description 82
- 238000004364 calculation method Methods 0.000 claims description 47
- 230000001186 cumulative effect Effects 0.000 claims description 19
- 238000009825 accumulation Methods 0.000 claims description 4
- 238000012015 optical character recognition Methods 0.000 description 65
- 238000000926 separation method Methods 0.000 description 6
- 230000007423 decrease Effects 0.000 description 4
- FFBHFFJDDLITSX-UHFFFAOYSA-N benzyl N-[2-hydroxy-4-(3-oxomorpholin-4-yl)phenyl]carbamate Chemical compound OC1=C(NC(=O)OCC2=CC=CC=C2)C=CC(=C1)N1CCOCC1=O FFBHFFJDDLITSX-UHFFFAOYSA-N 0.000 description 3
- 238000000605 extraction Methods 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 230000004044 response Effects 0.000 description 3
- 241000282412 Homo Species 0.000 description 2
- 238000013479 data entry Methods 0.000 description 2
- 230000003247 decreasing effect Effects 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 230000010354 integration Effects 0.000 description 2
- 238000012795 verification Methods 0.000 description 2
- 230000001174 ascending effect Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
Images
Landscapes
- Character Discrimination (AREA)
Abstract
Description
本発明は、情報処理装置及びプログラムに関する。 The present invention relates to an information processing apparatus and a program.
特許文献1に開示された方法は、入力された帳票上の画像に対し文字認識を行ない、その文字認識結果としての類似度を得て、この得られた類似度とあらかじめ登録された当該文字認識に要求する確信度とを比較し、この比較の結果に基づき文字認識結果に対し人手によるベリファイ処理を必要としない出力を行なうか、あるいは、上記比較の結果に基づき文字認識結果に対し文字認識候補の選択肢を提示して人手によるベリファイ処理を促す出力を行なうか、あるいは、上記比較の結果に基づき文字認識結果に対し人手による新規入力および確定を提示して手入力処理を促す出力を行なう。
The method disclosed in
特許文献2に開示された文字認識装置は、手書き入力された文字の座標点列を認識して認識候補文字群を出力する文字認識手段と、文字認識手段より出力される判定対象認識候補文字群の信頼度を算出するための特徴量として、手書き入力された文字の座標点列の平均筆記速度を算出する特徴抽出手段と、特徴抽出手段からの特徴量と、サンプルデータの統計的傾向とに基づいて、判定対象認識候補文字群の信頼度を算出する信頼度算出手段と、信頼度算出手段からの信頼度に基づいて判定対象認識候補文字群の後処理を制御する後処理制御手段とを有する。
A character recognition device disclosed in
特許文献3に開示された方法は、入力された文書画像から論理要素を抽出し、抽出された論理要素が文字列領域であるかを識別し、識別された文字列領域を文字認識し、認識結果の確信度がしきい値以上であるときテキストとして表示し、しきい値未満であるとき部分画像として表示する。 The method disclosed in Patent Document 3 extracts a logical element from an input document image, identifies whether the extracted logical element is a character string area, recognizes the identified character string area, and recognizes the character string area. When the certainty of the result is greater than or equal to the threshold, it is displayed as text, and when it is less than the threshold, it is displayed as a partial image.
特許文献4に開示された情報処理装置の分類手段は、文字認識対象を3種類のいずれかに分類し、抽出手段は、前記分類手段によって第1の種類に分類された場合に、前記文字認識対象の文字認識結果を抽出し、第1の制御手段は、前記分類手段によって第2の種類に分類された場合に、前記文字認識対象の文字認識結果を抽出し、該文字認識対象を人手で入力させるように制御し、第2の制御手段は、前記分類手段によって第3の種類に分類された場合に、前記文字認識対象を複数人の人手で入力させるように制御する。 The classification unit of the information processing apparatus disclosed in Patent Document 4 classifies the character recognition target into one of three types, and the extraction unit recognizes the character recognition when the classification unit classifies the first type. The character recognition result of the target is extracted, and the first control means extracts the character recognition result of the character recognition target when it is classified into the second type by the classification means, and manually selects the character recognition target. The second control unit controls the character recognition target to be input manually by a plurality of persons when the classification unit classifies the third type.
特許文献5〜10には、文字認識の認識確度についての様々な算出方式が示されている。 Patent Documents 5 to 10 show various calculation methods for the recognition accuracy of character recognition.
入力に対して判定を行い、複数の後段処理のうち、判定結果の判定確度に属する区間に対応する後段処理にその判定結果を処理させるシステムでは、それら区間を区切る閾値を設定する必要がある。それら閾値は、蓄積されている過去の判定結果の情報を反映したものであることが望まれる。しかし、そのような閾値を定める装置や方法は従来提案されていない。 In a system that performs a determination on an input and causes a subsequent process corresponding to a section belonging to the determination accuracy of the determination result to process the determination result among a plurality of subsequent processes, it is necessary to set a threshold value that divides the sections. It is desirable that these threshold values reflect information on accumulated past determination results. However, no device or method for determining such a threshold value has been proposed.
請求項1に係る発明は、入力に対して判定を行う判定手段と、前記入力に対する前記判定手段の判定確度を算出する算出手段と、前記判定手段の判定結果に対して後段処理を行うことで前記入力に対する出力を生成可能であり、前記出力の生成における前記判定手段の判定結果に対する依存度合いが互いに異なる複数の後段処理手段であって、前記判定確度が取り得る範囲を1以上の閾値で区切った区間ごとに対してそれぞれ対応づけられた複数の後段処理手段と、前記算出手段が算出した判定確度が属する区間に対応する前記後段処理手段に、前記入力に対する出力の生成を行わせるように制御する制御手段と、を含む判定システムのために、前記判定確度についての前記区間を区切る閾値を決定する情報処理装置であって、前記判定手段に対する過去の入力の各々について、当該入力に対する前記判定確度と、当該入力に対する前記判定手段の判定結果が正解か不正解かを示す正誤情報との組の集合を取得する取得手段と、前記取得手段が取得した前記集合を用いて、判定確度が高い区間から順に、当該区間に属する前記組の集合から求められる前記判定手段の正解率が、その区間に対応する前記判定手段の目標正解率を満たすよう当該区間を規定する前記閾値を決定する決定手段と、を含む情報処理装置である。
The invention according to
請求項2に係る発明は、前記各区間に対応する前記判定手段の目標認識率は、前記判定確度が高い区間ほど高い値であり、前記決定手段は、前記目標認識率が高い区間から順に、各区間を規定する前記閾値を決定する、請求項1に記載の情報処理装置である。
In the invention according to
請求項3に係る発明は、前記判定確度が高い区間に対応する前記後段処理手段ほど、前記判定結果を用いて前記出力を生成するための方法としてコストがより低い方法を用いており、前記決定手段は、前記コストが低い区間から順に、各区間を規定する前記閾値を決定する、請求項1又は2に記載の情報処理装置である。
The invention according to claim 3 uses a method with a lower cost as a method for generating the output using the determination result as the post-processing unit corresponding to the section having the higher determination accuracy. The information processing apparatus according to
請求項4に係る発明は、前記判定確度が最も高い区間に対応する前記後段処理手段は、前記判定手段の判定結果をそのまま前記出力とするものであり、前記判定確度が最も高い区間に対応する前記後段処理手段についての前記目標正解率として、前記判定システムに対して設定された目標正解率を用いる、請求項1〜3のいずれか1項に記載の情報処理装置である。
According to a fourth aspect of the present invention, the subsequent processing means corresponding to the section with the highest determination accuracy uses the determination result of the determination means as it is as the output, and corresponds to the section with the highest determination accuracy. The information processing apparatus according to any one of
請求項5に係る発明は、前記複数の後段処理手段には、前記判定手段の判定結果を用いずに前記入力に対する出力を生成する第2種の後段処理手段が含まれ、前記第2種の後段処理手段は、前記区間のうち判定確度が最も低い区間に対応付けられる、請求項1〜4のいずれか1項に記載の情報処理装置である。
In the invention according to claim 5, the plurality of post-processing units include a second type post-processing unit that generates an output for the input without using a determination result of the determination unit, and the second type 5. The information processing apparatus according to
請求項6に係る発明は、前記第2種の後段処理手段に対応する前記目標正解率は0である、請求項5に記載の情報処理装置である。 The invention according to claim 6 is the information processing apparatus according to claim 5, wherein the target correct answer rate corresponding to the second-stage post-processing means is zero.
請求項7に係る発明は、前記複数の後段処理手段は、前記判定手段の判定結果をそのまま前記出力とする第1の後段処理手段と、前記判定手段の判定結果を用いずに前記入力に対する人による判定結果に基づき前記出力を生成する第2の後段処理手段と、前記判定手段の判定結果と前記入力に対する人による判定結果との突き合わせにより前記出力を生成する第3の後段処理手段と、からなり、前記第1の後段処理手段についての前記目標正解率として、前記判定システムに対して設定された目標正解率を用い、前記第2の後段処理手段についての前記目標正解率として0を用い、前記第3の後段処理手段についての前記目標正解率を、前記人の正解率と前記判定手段の正解率とから求める、請求項1〜3のいずれか1項に記載の情報処理装置である。
According to a seventh aspect of the present invention, the plurality of post-processing units include a first post-processing unit that uses the determination result of the determination unit as it is as the output, and a person for the input without using the determination result of the determination unit. Second post-processing means for generating the output based on the determination result by the third post-processing means for generating the output by matching the determination result of the determination means and the determination result by the person with respect to the input, And using the target accuracy rate set for the determination system as the target accuracy rate for the first post-processing means, and using 0 as the target accuracy rate for the second post-processing means, The information processing device according to any one of
請求項8に係る発明は、前記取得手段は、判定確度と正誤情報との組の代わりに、判定確度と、判定確度の最大値から当該判定確度までの範囲内の各判定確度に対応する前記正誤情報の累積結果の情報と、の組を取得し、前記決定手段は、前記各判定確度に対応する前記累積結果の情報を用いて、前記閾値を決定しようとする区間の正解率を求める、請求項1〜7のいずれか1項に記載の情報処理装置である。 The invention according to claim 8 is characterized in that the acquisition means corresponds to each determination accuracy within a range from the maximum value of the determination accuracy to the determination accuracy, instead of a set of determination accuracy and correctness information. A set of correct and incorrect information cumulative result information is acquired, and the determination means uses the cumulative result information corresponding to each of the determination accuracy to obtain a correct answer rate of a section in which the threshold is to be determined. It is an information processing apparatus of any one of Claims 1-7.
請求項9に係る発明は、入力に対して判定を行う判定手段と、前記入力に対する前記判定手段の判定確度を算出する算出手段と、前記判定手段の判定結果に対して後段処理を行うことで前記入力に対する出力を生成可能であり、前記出力の生成における前記判定手段の判定結果に対する依存度合いが互いに異なる複数の後段処理手段であって、前記判定確度が取り得る範囲を1以上の閾値で区切った区間ごとに対してそれぞれ対応づけられた複数の後段処理手段と、前記算出手段が算出した判定確度が属する区間に対応する前記後段処理手段に、前記入力に対する出力の生成を行わせるように制御する制御手段と、を含む判定システムのために、前記判定確度についての前記区間を区切る閾値を決定する情報処理装置としてコンピュータを機能させるためのプログラムであって、前記コンピュータを、前記判定手段に対する過去の入力の各々について、当該入力に対する前記判定確度と、当該入力に対する前記判定手段の判定結果が正解か不正解かを示す正誤情報との組の集合を取得する取得手段、前記取得手段が取得した前記集合を用いて、判定確度が高い区間から順に、当該区間に属する前記組の集合から求められる前記判定手段の正解率が、その区間に対応する前記判定手段の目標正解率を満たすよう当該区間を規定する前記閾値を決定する決定手段、として機能させるためのプログラムである。 The invention according to claim 9 includes: a determination unit that performs determination on an input; a calculation unit that calculates a determination accuracy of the determination unit with respect to the input; and a subsequent process on the determination result of the determination unit. A plurality of post-processing units capable of generating an output in response to the input and having different degrees of dependence on the determination result of the determination unit in generating the output, wherein the possible range of the determination accuracy is divided by one or more threshold values; A plurality of post-processing units associated with each section, and the post-processing unit corresponding to the section to which the determination accuracy calculated by the calculation unit belongs is controlled to generate an output for the input. A computer as an information processing apparatus for determining a threshold for dividing the section with respect to the determination accuracy. Correct information indicating whether the determination accuracy for the input and the determination result of the determination unit for the input are correct or incorrect for each of the past inputs to the determination unit Using the set acquired by the acquisition means, the accuracy rate of the determination means obtained from the set of sets belonging to the section in order from the section with the highest determination accuracy, It is a program for functioning as a determination unit that determines the threshold value that defines the section so as to satisfy the target accuracy rate of the determination unit corresponding to the section.
請求項10に係る発明は、入力に対して判定を行う判定手段と、前記入力に対する前記判定手段の判定確度を算出する算出手段と、前記判定手段の判定結果に対して後段処理を行うことで前記入力に対する出力を生成可能であり、前記出力の生成における前記判定手段の判定結果に対する依存度合いが互いに異なる複数の後段処理手段であって、前記判定確度が取り得る範囲を1以上の閾値で区切った区間ごとに対してそれぞれ対応づけられた複数の後段処理手段と、前記算出手段が算出した判定確度が属する区間に対応する前記後段処理手段に、前記入力に対する出力の生成を行わせるように制御する制御手段と、前記判定手段に対する過去の入力の各々について、当該入力に対する前記判定確度と、当該入力に対する前記判定手段の判定結果が正解か不正解かを示す正誤情報との組の集合を取得する取得手段と、前記取得手段が取得した前記集合を用いて、判定確度が高い区間から順に、当該区間に属する前記組の集合から求められる前記判定手段の正解率が、その区間に対応する前記判定手段の目標正解率を満たすよう当該区間を規定する前記閾値を決定する決定手段と、を含む情報処理装置である。 According to a tenth aspect of the present invention, there is provided: a determination unit that performs determination on an input; a calculation unit that calculates a determination accuracy of the determination unit with respect to the input; and a subsequent process on the determination result of the determination unit. A plurality of post-processing units capable of generating an output in response to the input and having different degrees of dependence on the determination result of the determination unit in generating the output, wherein the possible range of the determination accuracy is divided by one or more threshold values; A plurality of post-processing units associated with each section, and the post-processing unit corresponding to the section to which the determination accuracy calculated by the calculation unit belongs is controlled to generate an output for the input. Control means, and for each past input to the determination means, the determination accuracy for the input and the determination means determination for the input An acquisition unit that acquires a set of correct / incorrect information indicating whether the result is correct or incorrect, and the set acquired by the acquisition unit, in order from the interval with the highest determination accuracy, Determining means for determining the threshold value defining the section so that a correct answer rate of the determining means obtained from the set satisfies a target correct answer rate of the determining means corresponding to the section;
請求項11に係る発明は、コンピュータを、入力に対して判定を行う判定手段、前記入力に対する前記判定手段の判定確度を算出する算出手段、前記判定手段の判定結果に対して後段処理を行うことで前記入力に対する出力を生成可能であり、前記出力の生成における前記判定手段の判定結果に対する依存度合いが互いに異なる複数の後段処理手段であって、前記判定確度が取り得る範囲を1以上の閾値で区切った区間ごとに対してそれぞれ対応づけられた複数の後段処理手段、前記算出手段が算出した判定確度が属する区間に対応する前記後段処理手段に、前記入力に対する出力の生成を行わせるように制御する制御手段、前記判定手段に対する過去の入力の各々について、当該入力に対する前記判定確度と、当該入力に対する前記判定手段の判定結果が正解か不正解かを示す正誤情報との組の集合を取得する取得手段、前記取得手段が取得した前記集合を用いて、判定確度が高い区間から順に、当該区間に属する前記組の集合から求められる前記判定手段の正解率が、その区間に対応する前記判定手段の目標正解率を満たすよう当該区間を規定する前記閾値を決定する決定手段、として機能させるためのプログラムである。 According to an eleventh aspect of the present invention, the computer performs determination processing for the input, determination means for calculating the determination accuracy of the determination means for the input, and post-processing for the determination result of the determination means. Can generate an output for the input, and a plurality of subsequent processing units having different degrees of dependency on the determination result of the determination unit in the generation of the output, and the range that the determination accuracy can take is a threshold value of 1 or more Control so that a plurality of subsequent processing means associated with each divided section, and the subsequent processing means corresponding to the section to which the determination accuracy calculated by the calculation means belongs, generate output for the input. For each of past inputs to the control means and the determination means, the determination accuracy for the input and the determination means for the input Acquisition means for acquiring a set of correct and incorrect information indicating whether the determination result is correct or incorrect, and using the set acquired by the acquisition means, the sets belonging to the section in descending order of determination accuracy This is a program for functioning as a determination unit that determines the threshold value that defines the section so that the accuracy rate of the determination unit obtained from the set satisfies the target accuracy rate of the determination unit corresponding to the section.
請求項1、2、4、5、6、9、10又は11に係る発明によれば、複数の後段処理に対応する、認識確度についての複数の区間を区切る閾値として、蓄積されている過去の判定結果の情報を反映した閾値を決定することができる。 According to the first, second, fourth, fifth, sixth, ninth, tenth, or eleventh aspects of the present invention, the accumulated past values are used as threshold values that delimit a plurality of sections for recognition accuracy corresponding to a plurality of subsequent processes. A threshold value reflecting the information of the determination result can be determined.
請求項3に係る発明によれば、この発明を用いない場合と比べて、判定システム全体としての判定のためのコストを低減することができる。 According to the invention which concerns on Claim 3, the cost for the determination as the whole determination system can be reduced compared with the case where this invention is not used.
請求項7に係る発明によれば、各区間の目標正解率を自動的に決定することができる。 According to the invention which concerns on Claim 7, the target correct answer rate of each area can be determined automatically.
請求項8に係る発明によれば、閾値を決定する際に正誤情報の累積結果の情報を算出しなくてよい。 According to the eighth aspect of the present invention, it is not necessary to calculate information on the accumulation result of correct / incorrect information when determining the threshold value.
図1に、本発明に係る情報処理装置の一実施形態である閾値設定処理装置20と、これを用いる判定システムの例を示す。
FIG. 1 shows an example of a threshold
この判定システムは、入力される画像データ(「入力画像データ」)に含まれる文字列を、OCR10とN個の後段処理部18−1、18−2、・・・、18−N(Nは2以上の整数。以下、相互に区別の必要がない場合は後段処理部18と総称)により判定する。
This determination system converts a character string included in input image data (“input image data”) into
OCR10は、入力画像データに対して公知のOCR(光学文字認識)処理を行うことで、その入力画像データ内に含まれる文字列を認識する。OCR10は、入力画像データから認識した文字列を示すテキストコードと認識確度との組を出力する。認識確度は、認識結果のテキストコードがその入力画像データに含まれる文字列(手書きの場合もある)を正しく表している確からしさを示す度合いである。認識確度が高いほど、認識結果のテキストコードが正解である(すなわち入力画像データ中の文字列を正しく表している)可能性が高い。認識結果が正解である可能性を以下では、認識率又は正解率と呼ぶ。OCR10は、入力画像データについての異なる複数の認識結果を、認識確度が高い順に、認識確度と対応付けて出力してもよい。なお、OCR10が文字認識を行う単位(すなわち認識結果を出力する単位)は、特に限定されず、例えば、文字単位、行又は列(横書き又は縦書き)単位、ページ単位、文書単位等のいずれであってもよい。
The
なお、OCR10が用いる文字認識の手法や認識確度の算出方法は特に限定されず、特許文献5〜10に例示したものを始めとする従来手法や今後開発される手法のうちいずれを用いてもよい。
The character recognition method used by the
N個の後段処理部18の各々は、原則的には、OCR10による認識結果のテキストコードを受け取り、そのテキストコードと、0個以上の他の手段による入力画像データ中の文字列の認識結果とを用いて、当該後段処理部18の最終的な文字認識結果を決定する。例えば、OCR10の認識結果と、「他の手段」の認識結果の中から、所定の(すなわち予め定められた)規則に従って、1つの認識結果を選択して最終的な文字認識結果として出力する。「他の手段」として何を用いる(他の手段を用いない場合もある)かや、出力する認識結果を選択するための規則は、後段処理部18ごとに定められている。後段処理部18が文字認識に用いる「他の手段」としては、人、本システムの外部にある文字認識サービス等がある。この外部の文字認識サービスとしては、例えば平均的な認識率(正解率)がOCR10より高いと期待されるが、利用のためにコストがかかる(OCR10の利用コストが0とみなせる場合)か、又は利用コストがOCR10よりも高いものを用いる。なお、N個の後段処理部18の中には、OCR10の認識結果をまったく用いないものが含まれていてもよい。
Each of the
N個の後段処理部18には、1、2、3、・・・、Nの順に順序が規定されており、この順序の番号の数字が大きいほどに、OCR10への依存度が高い。より厳密には、順序番号が大きくなるに従ってOCR10への依存度が単調増加する。また、順序番号が大きい後段処理部18ほど、当該後段処理部18の処理に必要なコスト(最終的に金額に換算される費用のこと)が低い。より厳密には、順序番号が大きくなるにつれて、処理のコストが単調減少する。
The order is defined in the order of 1, 2, 3,..., N in the
例えば、順序が最後の後段処理部18−N(以下煩雑さを避けるため後段処理部18−Kのことを「後段処理K」とも呼ぶ。Kは1からNまでの整数)として、後述する図8の「後段処理3」のように、OCR10の文字認識結果のテキストコードをそのまま最終的な文字認識結果として出力するものを用いてもよい。この例の後段処理Nは、最終的な文字認識結果の決定のためにOCR10の認識結果のみを用い、「他の手段」は用いないため、OCR10への依存度はいわば100%である。また、この例の後段処理Nは、OCR10以外に文字認識を担当する手段を用いないので、OCR10以外の文字認識のための追加のコストは0である。
For example, a later-described post-processing unit 18-N (hereinafter, the post-processing unit 18-K is also referred to as “post-processing K” in order to avoid complexity, where K is an integer from 1 to N) is described later. As in “Post-processing 3” in FIG. 8, a text code that is a character recognition result of the
また、順序が最初の後段処理部18−1(「後段処理1」)は、OCR10の認識結果を用いず、1以上の「他の手段」の文字認識結果のみから最終的な認識結果を決定するものであってもよい。この例の後段処理NのOCR10への依存度はいわば0%である。後段処理Nとしては、後述する図8の「後段処理1」のように、2人が入力画像データを見て認識し、入力した文字列同士が一致した場合にはその文字列を最終的な認識結果とし、一致しなかった場合には別の人による文字認識の結果を最終的な認識結果とするものを用いてもよい。この場合、最小でも2人、最大では3人の人を要するため、処理のための所要コストは高い。
Further, the first-stage post-processing unit 18-1 ("
また、例えば、後述する図8に例示した「後段処理2」のように、OCR10の認識結果と、第1の人が同じ入力画像データを見て入力した認識結果の文字列とが一致する場合にはその認識結果を最終的な認識結果として採用し、一致しない場合には第2の人がその同じ入力画像データを見て入力した認識結果を最終的な認識結果として採用する後段処理部18(後段処理Aと呼ぶ)を用いてもよい。この後段処理AのOCR10への依存度及びコストは、前に例示したOCR10の認識結果をそのまま最終的な認識結果に採用する後段処理Nと、前述のOCR10をまったく用いない後段処理部1との間になる。
Also, for example, when the recognition result of the
また、後段処理部18の1つとして、例えば、前述の後段処理Aにおいて第1の人の代わりに外部のより高度な(そしてより高コストな)文字認識システムを用いるもの(後段処理Bと呼ぶ)を用いてもよい。この後段処理部18は、OCR10の認識結果と外部の文字認識システムの認識結果とが一致する場合にはその認識結果を最終的な認識結果として採用し、一致しない場合には人が同じ入力画像データを見て入力した認識結果を最終的な認識結果として採用する。後段処理Bは、OCR10の認識結果を後段処理Aと同じ方法で用いるので、後段処理BのOCR10への依存度は、後段処理Aのそれと同等であるとみなしてよい。一般に、人にかかるコストは、コンピュータによる文字認識システムのコストよりも高いので、後段処理Bは後段処理Aよりもコストが低い。このため、この後段処理Bの順番は後段処理Aよりも後の順番(数字が大きい)となる。
Further, as one of the
また、例えば、入力画像データとOCR10の認識結果とを人に提示し、その人がOCR10の認識結果が正しいと判断した場合にはその旨を示す簡単な入力(例えば正解ボタンの押下)を受け付け、誤っていると判断した場合にはその人の認識結果の文字列の入力を最終的な認識結果として受け付ける後段処理部18(後段処理Cと呼ぶ)を用いてもよい。この後段処理Cは、「他の手段」をまったく用いない上述の後段処理Nの例よりは高コストであるが、上述した後段処理AやBより低コストである(「他の手段」が1人の人だけなので)。また、後段処理AやBよりもOCR10以外に最終的な認識結果の決定に関与する手段が少ないという意味で、OCR10への依存度は後段処理AやBよりも高いといえる。したがって、後段処理Cの順番は、「他の手段」をまったく用いない上述の後段処理Nの例と、後段処理Aとの間である。
In addition, for example, when the input image data and the recognition result of the
また、この後段処理Cのバリエーションとして、OCR10が同じ入力画像データから認識した複数の認識結果候補を認識確度の高い順にいくつか人に提示し、それら候補の中に正解があればその人は単にその正解を選ぶという簡単な操作を行い、正解がなければその人が認識した文字列を入力するという後段処理Dを用いてもよい。後段処理Dは、人の入力の手間が少なくなる分、時間あたりに処理できる数が増えるため、時間あたりのコストは後段処理Cよりも低くなると期待される。このため、後段処理Dは後段処理Cより順番が後になる。
Further, as a variation of the post-processing C, a plurality of recognition result candidates recognized by the
本実施形態では、OCR10が求める認識確度をN個の区間に分け、N個の後段処理部18に対して、順位の順に1つずつ区間を対応付ける。すなわち、順位が高い後段処理部18ほど、高い認識確度の区間が対応付けられる。そして、判定システムは、入力画像データについての最終的な文字認識結果を検定するために、これらN個の順位付けされた後段処理部18のうち、OCR10が出力したその入力画像データについての認識確度が属する区間に対応付けられた後段処理部18を選択し、動作させる。選択されていない後段処理部18は動作させない。
In the present embodiment, the recognition accuracy required by the
図1に示す閾値DB14は、これらN個の区間を区切る(N−1)個の閾値を保持する。閾値比較処理部12は、OCR10が、出力する認識結果のテキストコードについて求めた認識確度を、それら(N−1)個の閾値と比較し、その認識結果がN個の区間のいずれに属するかを判定する。この判定の結果は、その区間を示す1からNまでのいずれかの番号であり、この番号はその区間に対応する後段処理部18を特定する情報として機能する。分離処理部16は、閾値比較処理部12が出力する区間番号を受け取り、N個の後段処理部18のうち、その区間番号に対応する後段処理部18を選択的に有効化する。有効化された後段処理部18は、入力される情報(OCR10の認識結果、入力画像データ等)を用いて、その入力画像データに対する最終的な文字認識結果を決定して出力する。他の後段処理部18は動作しない。統合処理部19は、N個の後段処理部18のうち、閾値比較処理部12から得た区間番号に対応する後段処理部18の出力を、その入力画像データに対するこの判定システムの文字認識結果として出力する。統合処理部19は、他の後段処理部18の出力は(仮にあったとしても)破棄する。
The
閾値DB14に保持される閾値群は、閾値設定処理装置20により設定される。閾値設定処理装置20は、多数の学習用データを処理することで(N−1)個の閾値を決定する。学習用データとしては、図2に例示するように、過去にOCR10が行ったM回(非常に多い回数)の文字認識の各々についての、認識確度の値と、その文字認識の結果が正解、誤りのいずれであったかを示す正誤情報とのペアを用いる。認識確度の値は、OCR10が出力した値を記録しておけばよい。また、正誤情報は、その文字認識の結果が正解であるか誤りであるかを示す二値の値である。以下の説明では、正誤情報は、正解の場合に「1」、誤りの場合に「0」となる情報とする。あくまで一例であるが、OCR10の認識結果の正誤を人が確認し、正誤情報を入力すればよい。
The threshold value group held in the
閾値設定処理装置20が行う閾値設定処理のポイントは以下である。
(1)認識確度と正誤情報のペアを相当数、学習用データとして入力する。
(2)後段処理1〜Nの各々に、その後段処理部18が用いる認識結果のテキストコードに求められる目標認識率を設定する。後段処理のNの数字が大きいほど、目標認識率は高く設定する。
(3)後段処理Nから順に後段処理1に向かって、各後段処理K(1≦K≦N)の目標認識率を達成できる閾値を算出していく。
The points of threshold setting processing performed by the threshold
(1) A considerable number of pairs of recognition accuracy and correct / incorrect information are input as learning data.
(2) The target recognition rate required for the text code of the recognition result used by the
(3) From the subsequent process N to the
閾値設定処理装置20は、学習用データ入力部22、累積データ算出部24、目標認識率設定部26、閾値算出部28を含む。
The threshold
学習用データ入力部22は、M個の学習用データ(認識確度と正誤情報のペア)を入力し、それらM個の学習用データを認識確度の順にソートする。
The learning
累積データ算出部24は、ソートした学習用データを用いて、1番目の学習用データから各順番の学習用データまでの間の累積正解数を算出する。詳細は後述する。
The accumulated
目標認識率設定部26は、後段処理1〜Nのそれぞれに対して目標認識率を設定する。後段処理Kの目標認識率は、その後段処理Kが満たすべき認識率である。一つの例では、この設定は、ユーザが行う。また、後述する図8の例では、目標認識率を自動設定できる。
The target recognition
閾値算出部28は、累積データ算出部24が算出した累積正解数と、目標認識率設定部が設定した各後段処理の目標認識率に基づいて、各後段処理に対応する認識確度の区間を区切る(N−1)個の閾値を算出する。
Based on the cumulative number of correct answers calculated by the cumulative
閾値算出部28が行う閾値算出の方法を、図4〜図7を参照して説明する。
A threshold value calculation method performed by the threshold
認識確度Xの取り得る範囲をN個の区間に区分するには、(N−1)個の閾値を決定する必要がある。ここで設定するN個の閾値を、T1,T2,・・・・,TN-1とする。認識確度Xの取り得る範囲は0から1までの実数としても、一般性は失われないので、以下の例ではそのように規定する。また、区間(後段処理)の番号をKとする。 In order to divide the possible range of the recognition accuracy X into N sections, it is necessary to determine (N−1) threshold values. The N threshold values set here are T 1 , T 2 ,..., T N−1 . Even if the recognition accuracy X can be a real number from 0 to 1, the generality is not lost, so in the following example, it is defined as such. In addition, the number of the section (the subsequent process) is K.
閾値算出部28は、図4に例示する閾値算出手順を実行する。この手順では、まず閾値の両端をT0=0、TN=1に設定し、閾値インデクスJKの初期値J0を0に設定する(S10)。この例では、TK=Xjとなるときのインデクスjを、j=JN-Kと表す。つまり、以下に説明する手順は、閾値TKを求めるために、閾値インデクスJN-Kを求めるアルゴリズムと捉えることができる。なお、Xjは、j番目の学習用データの認識確度である。ただし1≦j≦M。また後述するようにi>jならばXi≦Xjとなるようにソートされているとする。
The
次に、各区間Kについての目標認識率YKを設定する(S12)。この目標認識率YKは、当該区間Kに対応する後段処理KのためにOCR10が達成すべき目標となる認識率(すなわち文字認識の正解率)である。ここでは、区間Kの番号が大きくなるほど、目標認識率YKは高くなるように設定する。その理由は以下の通りである。
Next, a target recognition rate Y K for each section K is set (S12). The target recognition rate Y K is a recognition rate (that is, a correct recognition rate of character recognition) that is a target that the
すなわち、図1に例示した判定システムは、入力画像データに対して後段処理1〜Nのいずれかを選択し、その選択された後段処理Kがその入力画像データに含まれる文字列についての、当該判定システムとしての最終的な認識結果を出力する。判定システム全体として要求される一定の認識率を満たす(すなわちそれ以上の認識率を平均として出す)必要があるので、選択された後段処理Kはその一定の認識率を満たす必要がある。後段処理Kは、OCR10の認識結果を他の手段による認識結果と組み合わせることで、後段処理Kとしての認識結果を求める。ここで、前述のように、番号Kが大きくなるほど、OCR10の認識結果に対する後段処理Kの依存度は高くなる。したがって、後段処理Kとしての認識率が判定システムに要求される認識率を満たすようにするには、Kが大きくなるほど、OCR10の認識率が高くする必要がある。このため、OCR10の目標認識率YKは、Kが大きくなるほど高くなるように設定する。
That is, the determination system illustrated in FIG. 1 selects any one of the post-processing 1 to N for the input image data, and the selected post-processing K regarding the character string included in the input image data The final recognition result as a judgment system is output. Since it is necessary to satisfy a certain recognition rate required for the entire determination system (that is, to obtain a higher recognition rate as an average), the selected post-processing K needs to satisfy the certain recognition rate. The post-stage process K obtains the recognition result as the post-stage process K by combining the recognition result of the
S12での目標認識率YKの設定は、例えばユーザが行う。また、目標認識率YKを自動的に算出する例を後で説明する。 The user sets the target recognition rate Y K in S12, for example. An example of automatically calculating the target recognition rate Y K will be described later.
次に、閾値算出部28は、学習用データを認識確度の降順にソートする(S14)。前述のように個々の学習用データは、認識確度Xと正誤情報Fのペアである。そして、認識確度Xの降順にソートした学習用データ群では、i>jならばXi≦Xjという関係が成り立つ。すなわち、インデクスjの値が大きくなるにつれて、学習用データj内の認識確度Xjは単調減少する。予め学習用データを認識確度でソートしておくことによって、後述する累積正解数S(i)の算出が高速になる。また、予め累積正解数S(i)を算出しておくことによって、閾値算出処理が高速になる(毎回所望の後段処理に入る学習用データ数を加算する必要がなくなる)。
Next, the threshold
このソートの後の、各学習用データj内の認識確度Xj、閾値インデクスJK及び閾値TKと、各区間(後段処理)Kとの関係を、図5に模式的に示す。図5に示すように、後段処理Kが適用される区間Kは、認識確度XがTK-1以上TK未満の区間である。この区間Kに設定された目標認識率の値がYKである。各学習用データjの認識確度Xjは、インデクスjが大きくなるにつれて値が小さくなる。学習用データの個数をMとすると、XMが学習用データの集合の中での認識確度の最小値である。また、定義より、j= JN-Kであるときの認識確度Xjが、閾値TKとなる。 FIG. 5 schematically shows the relationship between the recognition accuracy X j , the threshold index J K and the threshold T K in each learning data j, and each section (post-stage processing) K after this sorting. As shown in FIG. 5, the section K to which the post-stage processing K is applied is a section in which the recognition accuracy X is T K−1 or more and less than T K. The value of the target recognition rate set in this section K is Y K. Recognition accuracy X j of each learning data j is the value as the index j is increased is reduced. When the number of learning data is M, X M is the minimum value of the recognition accuracy in the learning data set. From the definition, the recognition accuracy X j when j = J NK is the threshold value T K.
図4の手順では、図5に示すように、K=Nから順にKが小さくなる方向に閾値TKを決定していくが、これは言い換えれば、閾値インデクスJmを、mが0から大きくなる向きに決定していくことでもある。 In the procedure of FIG. 4, as shown in FIG. 5, the threshold value T K is determined in the direction of decreasing K from K = N. In other words, the threshold index J m is increased from 0 to m. It is also determined to become the direction.
図4の手順の説明に戻る。S14の後、閾値算出部28は、インデクスiごとに、図示の式(1)を用いて、累積正解数S(i)を計算する(S16)。すなわち、累積正解数S(i)は、各学習用データj内の正誤情報Fj(正解の場合1、不正解の場合0)を、jが1からiまで総和したものである。
Returning to the description of the procedure in FIG. After S14, the threshold
次に閾値算出部28は、閾値TKのインデクスKをN(=後段処理の総数)に初期化する(S18)。
Next the
次に、閾値算出部28は、閾値TK-1を決定するための処理を実行する(S20)。最初のループで処理する区間Nは、上限の閾値TNは1に決められており、S20ではその区間Nの下限の閾値TN-1を決定する。S20の処理の詳細な例は、後で図7を参照して説明する。
Next, the threshold
閾値TK-1の決定が終わると、閾値算出部28は、インデクスKを1減らし(S22)、その結果Kが1に到達したかどうかを判定する(S24)。Kが1でない場合(すなわちKが2以上である場合)は、まだすべての閾値の決定が完了していないので、S20に戻って閾値TK-1の決定を行う。Kが1に到達した場合、求めるべきすべての閾値T1〜TN-1の決定が完了したことを意味するので、図4の処理は終了する。
When the determination of the threshold value T K-1 is finished, the threshold
次に、図7を参照して、閾値TK-1を決定するための処理(S20)の詳細な手順を例示する。 Next, with reference to FIG. 7, a detailed procedure of the process (S20) for determining the threshold value T K-1 is illustrated.
この手順を開始する時点では、閾値TN,TN-1,TN-2,・・・,TKは決定済みである。 At the start of this procedure, the thresholds T N , T N−1 , T N−2 ,..., T K have been determined.
この手順では、まず閾値算出部28は、累積正解数S(j)のインデクスjをM(すなわち学習用データの総数)に初期化する(S202)。
In this procedure, the threshold
次に閾値算出部28は、図示の式(2)が成立するか否かを判定する(S204)。図5を参照して説明すると、S(JN-K)は、認識確度の最大値X1を含む学習用データ内の正誤情報F1から、既に決定済みの閾値TKの閾値インデクスJN-K(=j(K)とする)に対応する認識確度Xj(K)を含む学習用データ内の正誤情報Fj(K)までの総和である。一方、S(j)は、正誤情報F1から、閾値インデクスJN-Kよりも大きいインデクスjに対応する正誤情報Fjまでの総和である。これらの差(S(j)−S(JN-K))は、JN-Kからjまでの区間の正解の総数であり、これを(j−JN-K)で除すると、その区間でのOCR10の正解率が得られる。
Next, the threshold
この正解率が現在の閾値決定処理の対象である区間Kの目標認識率YK以上であれば、JN-Kからjまでの区間は、その区間Kについての目標認識率の条件を満たしている(S204の判定結果がYes)。この場合閾値算出部28は、このときのjに対応する認識確度Xjを、その区間Kの認識確度の下限を規定する閾値TK-1として採用する(S206)。また、このとき、そのjをその閾値TK-1に対応する閾値インデクスJN-K+1として記憶する。
If this accuracy rate is equal to or higher than the target recognition rate Y K of the section K that is the target of the current threshold determination process, the section from J NK to j satisfies the target recognition rate condition for that section K ( The determination result of S204 is Yes). In this case, the threshold
S204の判定結果がNoの場合、閾値算出部28は、インデクスjを1減らし(S208)、減らした結果の新たなインデクスjが区間Kの上限に対応する閾値インデクスJN-Kに達したかどうかを判定する(S210)。この判定の結果がNoの場合、閾値算出部28は、S204に戻り、その新たなインデクスjについて式(2)を評価する。
If S204 the determination result is No, the threshold
式(2)の評価は、最大値Mから順にインデクスjを1ずつ減らしながら(S208)繰り返し行われ、jがJN-Kに達すると(S210の判定結果がYes)、区間Kに入り得る認識確度Xが存在しないということになる。この場合、閾値算出部28は、その区間Kに対応する後段処理Kを無効化する(S212)。すなわち、この閾値設定処理で設定された閾値群を用いて判定システムが実行する実際の入力画像データについての判定処理では、その後段処理Kは用いられない。
The evaluation of Expression (2) is repeatedly performed while decreasing the index j by 1 in order from the maximum value M (S208). When j reaches J NK (the determination result in S210 is Yes), the recognition accuracy that can enter the section K. This means that X does not exist. In this case, the
このように、図7の手順では、最大値Mから順にインデクスjが小さくなる方向に評価を進めるので、この手順により決定される区間Kは、目標認識率YKを満たす最大幅の区間となる。図4の手順は、対応する認識確度X(別の観点では対応する目標認識率YK)が高い区間Kから順にその区間Kの区切り(下限の閾値TK-1)を決定していくので、認識確度Xが高い区間Kから順に目標認識率YKを満たす最大幅の区間が確保されていくことになる。例えば、図6の例では、まず、対応する認識確度が最も高い後段処理Nの区間Nが目標認識率YNを満たす範囲で最大幅となるように区間Nの下限の閾値TN-1が決定され、次に区間(N−1)が目標認識率YN-1を満たす範囲で最大幅となるように閾値TN-2が決定される。このような決定処理が、対応する認識確度が最低の区間1の上限の閾値(すなわちの区間2の下限の閾値)T1を決定するところまで繰り返される。
In this way, in the procedure of FIG. 7, the evaluation proceeds in the direction in which the index j decreases in order from the maximum value M, so the section K determined by this procedure is the section of the maximum width that satisfies the target recognition rate Y K. . The procedure of FIG. 4 determines the section K (lower threshold T K-1 ) in order from the section K in which the corresponding recognition accuracy X (corresponding target recognition rate Y K in another viewpoint) is high. The sections with the maximum width satisfying the target recognition rate Y K are secured in order from the section K with the highest recognition accuracy X. For example, in the example of FIG. 6, first, the lower limit threshold value T N−1 of the section N is set so that the section N of the subsequent processing N with the highest recognition accuracy has a maximum width in a range satisfying the target recognition rate Y N. Next, the threshold value T N−2 is determined so that the section (N−1) has the maximum width in a range satisfying the target recognition rate Y N−1 . Such determination process, the corresponding recognition accuracy is repeated until it is determined (lower threshold i.e. the section 2) T 1 upper threshold of
認識確度(又は目標認識率YK)が高い区間Kに対応する後段処理Kほど、OCR10への依存度が高い、すなわちOCR10よりコストが掛かる1以上の「他の手段」への依存度が低いので、図4の手順では、コストが低い後段処理Kから順に、目標認識率YKを満たす最大幅の区間が確保されていくので、入力画像データの処理時にコストが低い後段処理Kが選ばれやすくなり、判定システム全体としての処理コストが低減される(与えられた学習用データ群のもとでは理論上コストが最小化される)。
The later processing K corresponding to the section K having a higher recognition accuracy (or target recognition rate Y K ) has a higher dependency on the
以上、本実施形態の閾値設定処理装置20の構成及び動作について説明した。次に、図8を参照して、具体的な後段処理部18を3つ(後段処理1〜3)備える判定システムの具体例に即して、各後段処理部18に対応する区間の目標認識率を自動的に決定する例を示す。
Heretofore, the configuration and operation of the threshold
図8には、この具体例の判定システムのうちの後段処理部18−1、18−2、18−3と、それに対して認識結果を供給するOCR10と、分離処理部16とを示す。図8には、更にその判定システムに対して人の操作者による入力画像データを提供する人手入力装置30−1、30−2、30−3(相互に区別する必要がない場合は人手入力装置30と総称)を示す。
FIG. 8 shows the post-processing units 18-1, 18-2, and 18-3, the
人手入力装置30は、文字認識の対象となる入力画像データを画面に表示し、人である操作者からその入力画像データに含まれる文字列の認識結果の入力を受け付け、受け付けた認識結果の文字列を、後段処理部18−1、18−2、18−3に送信する。人手入力装置30は、例えば、判定システムに対してインターネットを介して接続された、各操作者のパーソナルコンピュータ上のアプリケーションソフトウエアである。 The manual input device 30 displays input image data to be character-recognized on a screen, accepts input of a recognition result of a character string included in the input image data from an operator who is a person, and receives characters of the received recognition result The column is transmitted to the subsequent processing units 18-1, 18-2, and 18-3. The manual input device 30 is, for example, application software on each operator's personal computer connected to the determination system via the Internet.
後段処理部18−3(後段処理3)は、3つの後段処理部18のうち認識確度(別の観点では目標認識率)が最も高い区間に対応するものであり、この例ではOCR10の認識結果を受け取り、その認識結果をそのまま自分の認識結果として出力する。
The post-processing unit 18-3 (post-processing 3) corresponds to a section having the highest recognition accuracy (target recognition rate in another viewpoint) among the three
後段処理部18−2(後段処理2)は、3つの後段処理部18のうち認識確度が真ん中の区間に対応するものである。後段処理部18−2には、OCR10の認識結果に加え、人手入力装置30−1及び30−2から各操作者の認識結果の文字列が入力される。後段処理部18−2は、OCR10の求めた認識確度に応じて分離処理部16から選択されると、人手入力装置30−1に対して入力画像データを供給し、人手入力装置30−1の操作者がその入力画像データの認識結果として入力した文字列(テキストコード)を取得する。そして、OCR10から得た認識結果と人手入力装置30−1から得た認識結果とを突き合わせ、それら両者が一致する場合には、その一致する認識結果を当該後段処理部18−2の認識結果として出力する。一方、それら両者が不一致の場合は、後段処理部18−2は、別の人手入力装置30−2に対してその入力画像データを供給し、人手入力装置30−2の操作者がその入力画像データの認識結果として入力した文字列を取得し、その文字列を後段処理部18−2の認識結果として出力する。この場合、人手入力装置30−2の操作者は、人手入力装置30−1の操作者よりも入力画像データ内の文字列の認識の正確さが高いと想定される人(例えば過去の成績がよい人)としてもよい。
The post-stage processing unit 18-2 (post-stage process 2) corresponds to the section in which the recognition accuracy is the middle of the three
後段処理部18−3(後段処理3)は、3つの後段処理部18のうち認識確度が最低の区間に対応するものである。後段処理部18−3は、OCR10の認識結果を用いず、人手入力装置30−1、30−2、30−3に対して各々の操作者が入力した認識結果を用いて、後段処理部18−2と同様の処理を行う。すなわち、後段処理部18−3は、OCR10の求めた認識確度に応じて分離処理部16から選択されると、人手入力装置30−1及び30−3に対して入力画像データを供給し、人手入力装置30−1及び30−3の各々の操作者がその入力画像データの認識結果として入力した文字列を取得する。そして、それら2つの人手入力装置30−1及び30−3から得た認識結果同士を突き合わせ、それら両者が一致する場合には、その一致する認識結果を当該後段処理部18−3の認識結果として出力する。一方、それら両者が不一致の場合、後段処理部18−2は、別の人手入力装置30−2に対してその入力画像データを供給し、人手入力装置30−2の操作者がその入力画像データの認識結果として入力した文字列を取得し、その文字列を後段処理部18−2の認識結果として出力する。この場合、人手入力装置30−2の操作者は、人手入力装置30−1及び30−3の各々の操作者よりも入力画像データ内の文字列の認識の正確さが高いと想定される人としてもよい。
The post-stage processing unit 18-3 (post-stage process 3) corresponds to a section having the lowest recognition accuracy among the three
このような3つの後段処理部18−1、18−2、18−3に対応付けられる認識確度の3つの区間1、2、3は、2つの閾値T1及びT2に(T1<T2)より区切られる。分離処理部16は、OCR10出力する認識確度XがT1未満であれば後段処理部18−1を選択し、T1以上T2未満であれば後段処理部18−2を選択し、T2以上であれば後段処理部18−3を選択する。
The three
閾値設定処理装置20は、3つの後段処理部18−1、18−2、18−3に対応する区間1(T1>X)、区間2(T2>X≧T1)、区間3(X≧T2)の各々に対応するOCR10の目標認識率Y1、Y2、Y3を次のようにして計算する。
The threshold
まず、判定システムの目標認識率(つまり判定システムの最終的な出力の正解率の目標値)をRとする。後段処理部18−1は、OCR10の認識結果をまったく用いないので、OCR10の認識率は0でもよい。そこで、閾値設定処理装置20は、目標認識率Y1=0とする。後段処理部18−1自体は、人手入力装置30−1、30−2、30−3の各々の操作者を適切に選ぶことで判定システムの目標認識率Rを満たす。
First, let R be the target recognition rate of the determination system (that is, the target value of the correct answer rate of the final output of the determination system). Since the post-processing unit 18-1 does not use the recognition result of the
一方、後段処理部18−3は、OCR10の認識結果をそのまま自身の出力として使うので、目標認識率Y3=Rである。
On the other hand, since the post-processing unit 18-3 uses the recognition result of the
残る後段処理部18−2については、以下のようにしてOCR10の目標認識率Y2を算出する。 For the remaining post-processing unit 18-2, the target recognition rate Y2 of the OCR 10 is calculated as follows.
まず、人がデータエントリ(すなわち入力画像データに含まれる文字列を認識し、人手入力装置30に入力する処理)するときのエラー率をλとする。言い換えれば、人のデータエントリの正解率(認識率)は、(1−λ)である。一方、OCR10の認識結果のエラー率をωとする。すなわち、OCR10の正解率(認識率)は(1−ω)である。後段処理部18−2によるOCR10と人の認識結果の突き合わせ処理のエラー率の概算値はλωとなる。後段処理部18−2が判定システムの目標認識率Rを満たす必要があることを考え合わせると、
λω=(1−R)
が成り立つ。したがって、後段処理部18−2が選ばれる場合のOCR10の目標認識率Y2は(1−ω)に等しいと考えてよいので、最終的にY2は、既知である人のエラー率λと判定システムの目標認識率Rから次のように計算される。
Y2=1−ω=1−(1−R)/λ
First, let λ be an error rate when a person performs data entry (that is, processing for recognizing a character string included in input image data and inputting it to the manual input device 30). In other words, the correct answer rate (recognition rate) of the human data entry is (1−λ). On the other hand, the error rate of the recognition result of the
λω = (1-R)
Holds. Therefore, since the target recognition rate Y 2 of the
Y 2 = 1−ω = 1− (1-R) / λ
閾値設定処理装置20は、この式に従って閾値Y2を計算すればよい。
The
以上に説明した実施形態は、本発明の具現化のあくまで一例に過ぎない。 The embodiment described above is merely an example of realization of the present invention.
以上の例では、閾値の決定において累積正解数S(j)を用いたが、この代わりに累積エラー数を用いてもよい。エラー数は、Fj=0の学習用データの数である。また、累積正解数S(j)(またはエラー数)の代わりに、累積正解数をサンプル数で割った累積正解率(認識率)を用いても、累積正解数を用いる場合と同様の処理が可能である。また、各区間Kがその上限または下限の閾値TK又はTK-1を含むか否かは、上に例示したものに限らず、適宜定めればよい。 In the above example, the cumulative number of correct answers S (j) is used in determining the threshold value, but the cumulative number of errors may be used instead. The number of errors is the number of learning data with F j = 0. Even if the cumulative correct answer rate (recognition rate) obtained by dividing the cumulative correct answer number by the number of samples is used instead of the cumulative correct answer number S (j) (or error number), the same processing as in the case of using the cumulative correct answer number is performed. Is possible. Whether each section K includes the upper limit or lower limit threshold value T K or T K-1 is not limited to the above example, and may be determined as appropriate.
また、上記実施形態では、閾値設定処理装置20には、認識確度Xと正誤情報Fのペアである学習用データが入力されたが、これは一例に過ぎない。この代わりに、正誤情報Fを、対応する認識確度Xの小さい順又は大きい順に注目する認識確度Xjまで累積することで得られる累積結果の情報を予め計算しておき、その情報とその認識確度Xjとのペアを学習用データとして閾値設定処理装置20に入力してもよい。ここで累積結果の情報としては、上述した累積正解数、累積エラー数、累積正解率、累積エラー率等のいずれを用いてもよい。
In the above-described embodiment, learning data that is a pair of recognition accuracy X and correct / incorrect information F is input to the threshold
また、上記実施形態では、判定システムは、入力画像データ中の文字列を認識するものであったが、文字認識以外にも、入力されたデータの内容を判定してその判定結果を出力する判定システム全般に、上記実施形態の手法が適用可能である。すなわち、本発明の適用対象となる判定システムは、入力されたデータの内容を判定する一次判定手段(OCR10に相当)と、その一次判定手段の判定結果と0以上の他の判定手段(例えば人間や一次判定手段より高精度だが高コストの判定手段)の判定結果を組み合わせてそのデータの内容の判定結果を求める複数の後段処理部とを含むものでよい。この判定システム、一次判定手段の判定結果についての判定確度(文字認識の場合の認識確度に相当)を求める手段を有し、この判定確度に応じて、複数の後段処理部のいずれを用いるかを決定する。すなわち、各後段処理部には、それぞれ異なる判定確度の区間が対応付けられ、一次判定手段の判定の判定確度が属する区間に対応する後段処理部が選択的に動作する。 In the above embodiment, the determination system recognizes a character string in input image data. However, in addition to character recognition, the determination system determines the content of input data and outputs the determination result. The method of the above embodiment can be applied to the entire system. That is, the determination system to which the present invention is applied includes a primary determination means (corresponding to OCR10) for determining the content of input data, a determination result of the primary determination means, and zero or more other determination means (for example, humans). And a plurality of subsequent processing units that obtain the determination result of the content of the data by combining the determination results of the determination means of higher accuracy but higher cost than the primary determination means. This determination system has means for obtaining determination accuracy (corresponding to recognition accuracy in the case of character recognition) for the determination result of the primary determination means, and which of the plurality of subsequent processing units is used according to this determination accuracy. decide. That is, each post-processing unit is associated with a section with different determination accuracy, and the post-processing unit corresponding to the section to which the determination accuracy of the determination by the primary determination unit belongs selectively operates.
以上に例示した判定システム及び閾値設定処理装置20は、一つの例ではハードウエアの論理回路として構成可能である。また、別の例として、判定システム及び閾値設定処理装置20は、例えば、内蔵されるコンピュータにそれらシステムまたは装置内の各機能モジュールの機能を表すプログラムを実行させることにより実現してもよい。ここで、コンピュータは、例えば、ハードウエアとして、CPU等のプロセッサ、ランダムアクセスメモリ(RAM)およびリードオンリメモリ(ROM)等のメモリ(一次記憶)、HDD(ハードディスクドライブ)を制御するHDDコントローラ、各種I/O(入出力)インタフェース、ローカルエリアネットワークなどのネットワークとの接続のための制御を行うネットワークインタフェース等が、たとえばバスを介して接続された回路構成を有する。また、そのバスに対し、例えばI/Oインタフェース経由で、CDやDVDなどの可搬型ディスク記録媒体に対する読み取り及び/又は書き込みのためのディスクドライブ、フラッシュメモリなどの各種規格の可搬型の不揮発性記録媒体に対する読み取り及び/又は書き込みのためのメモリリーダライタ、などが接続されてもよい。上に例示した各機能モジュールの処理内容が記述されたプログラムがCDやDVD等の記録媒体を経由して、又はネットワーク等の通信手段経由で、ハードディスクドライブ等の固定記憶装置に保存され、コンピュータにインストールされる。固定記憶装置に記憶されたプログラムがRAMに読み出されCPU等のプロセッサにより実行されることにより、上に例示した機能モジュール群が実現される。また、判定システム及び閾値設定処理装置20は、ソフトウエアとハードウエアの組合せで構成されてもよい。
The determination system and the threshold
10 OCR、12 閾値比較処理部、14 閾値DB、16 分離処理部、18 後段処理部、19 統合処理部、20 閾値設定処理装置、22 学習用データ入力部、24 累積データ算出部、26 目標認識率設定部、28 閾値算出部、30 人手入力装置。
10 OCR, 12 Threshold comparison processing unit, 14 Threshold DB, 16 Separation processing unit, 18 Subsequent processing unit, 19 Integration processing unit, 20 Threshold setting processing device, 22 Learning data input unit, 24 Cumulative data calculation unit, 26 Target recognition Rate setting unit, 28 threshold calculation unit, 30 manual input device.
Claims (11)
前記入力に対する前記判定手段の判定確度を算出する算出手段と、
前記判定手段の判定結果に対して後段処理を行うことで前記入力に対する出力を生成可能であり、前記出力の生成における前記判定手段の判定結果に対する依存度合いが互いに異なる複数の後段処理手段であって、前記判定確度が取り得る範囲を1以上の閾値で区切った区間ごとに対してそれぞれ対応づけられた複数の後段処理手段と、
前記算出手段が算出した判定確度が属する区間に対応する前記後段処理手段に、前記入力に対する出力の生成を行わせるように制御する制御手段と、
を含む判定システムのために、前記判定確度についての前記区間を区切る閾値を決定する情報処理装置であって、
前記判定手段に対する過去の入力の各々について、当該入力に対する前記判定確度と、当該入力に対する前記判定手段の判定結果が正解か不正解かを示す正誤情報との組の集合を取得する取得手段と、
前記取得手段が取得した前記集合を用いて、判定確度が高い区間から順に、当該区間に属する前記組の集合から求められる前記判定手段の正解率が、その区間に対応する前記判定手段の目標正解率を満たすよう当該区間を規定する前記閾値を決定する決定手段と、
を含む情報処理装置。 A determination means for determining the input;
Calculation means for calculating the determination accuracy of the determination means for the input;
A plurality of post-processing units that can generate an output for the input by performing post-processing on the determination result of the determination unit, and have different degrees of dependence on the determination result of the determination unit in the generation of the output. A plurality of subsequent processing means respectively associated with each section obtained by dividing the range that the determination accuracy can take with one or more threshold values;
Control means for controlling the subsequent processing means corresponding to the section to which the determination accuracy calculated by the calculation means belongs to generate an output for the input;
An information processing apparatus that determines a threshold value that divides the section for the determination accuracy, for a determination system including:
For each past input to the determination means, an acquisition means for acquiring a set of the determination accuracy for the input and correct / incorrect information indicating whether the determination result of the determination means for the input is correct or incorrect;
Using the set acquired by the acquisition means, the correct answer rate of the determination means obtained from the set of sets belonging to the section in order from the section with the highest determination accuracy is the target correct answer of the determination means corresponding to the section. Determining means for determining the threshold value defining the section so as to satisfy the rate;
An information processing apparatus including:
前記決定手段は、前記目標認識率が高い区間から順に、各区間を規定する前記閾値を決定する、請求項1に記載の情報処理装置。 The target recognition rate of the determination means corresponding to each section is a higher value as the section has a higher determination accuracy.
The information processing apparatus according to claim 1, wherein the determination unit determines the threshold value that defines each section in order from the section having the highest target recognition rate.
前記決定手段は、前記コストが低い区間から順に、各区間を規定する前記閾値を決定する、請求項1又は2に記載の情報処理装置。 The later stage processing means corresponding to the section with higher determination accuracy uses a method with a lower cost as a method for generating the output using the determination result,
The information processing apparatus according to claim 1, wherein the determination unit determines the threshold value that defines each section in order from the section having the lowest cost.
前記判定確度が最も高い区間に対応する前記後段処理手段についての前記目標正解率として、前記判定システムに対して設定された目標正解率を用いる、請求項1〜3のいずれか1項に記載の情報処理装置。 The post-processing unit corresponding to the section with the highest determination accuracy is the output of the determination result of the determination unit as it is,
The target accuracy rate set for the determination system is used as the target accuracy rate for the post-processing unit corresponding to the section with the highest determination accuracy. Information processing device.
前記第1の後段処理手段についての前記目標正解率として、前記判定システムに対して設定された目標正解率を用い、前記第2の後段処理手段についての前記目標正解率として0を用い、前記第3の後段処理手段についての前記目標正解率を、前記人の正解率と前記判定手段の正解率とから求める、請求項1〜3のいずれか1項に記載の情報処理装置。 The plurality of post-processing units output the output based on a first post-processing unit that uses the determination result of the determination unit as it is as the output, and a determination result by a person with respect to the input without using the determination result of the determination unit. A second post-processing unit for generating, and a third post-processing unit for generating the output by matching the determination result of the determination unit and the determination result by the person with respect to the input,
The target accuracy rate set for the determination system is used as the target accuracy rate for the first post-processing means, and 0 is used as the target accuracy rate for the second post-processing means. The information processing apparatus according to any one of claims 1 to 3, wherein the target correct answer rate for three subsequent processing means is obtained from the correct answer rate of the person and the correct answer rate of the determination means.
前記決定手段は、前記各判定確度に対応する前記累積結果の情報を用いて、前記閾値を決定しようとする区間の正解率を求める、請求項1〜7のいずれか1項に記載の情報処理装置。 The acquisition means, instead of a set of determination accuracy and correct / incorrect information, includes determination accuracy, and information on the accumulation result of the correct / incorrect information corresponding to each determination accuracy within a range from the maximum value of the determination accuracy to the determination accuracy. Get a pair of,
8. The information processing according to claim 1, wherein the determining unit obtains a correct answer rate of a section in which the threshold is to be determined using information on the cumulative result corresponding to each determination accuracy. apparatus.
前記入力に対する前記判定手段の判定確度を算出する算出手段と、
前記判定手段の判定結果に対して後段処理を行うことで前記入力に対する出力を生成可能であり、前記出力の生成における前記判定手段の判定結果に対する依存度合いが互いに異なる複数の後段処理手段であって、前記判定確度が取り得る範囲を1以上の閾値で区切った区間ごとに対してそれぞれ対応づけられた複数の後段処理手段と、
前記算出手段が算出した判定確度が属する区間に対応する前記後段処理手段に、前記入力に対する出力の生成を行わせるように制御する制御手段と、
を含む判定システムのために、前記判定確度についての前記区間を区切る閾値を決定する情報処理装置としてコンピュータを機能させるためのプログラムであって、前記コンピュータを、
前記判定手段に対する過去の入力の各々について、当該入力に対する前記判定確度と、当該入力に対する前記判定手段の判定結果が正解か不正解かを示す正誤情報との組の集合を取得する取得手段、
前記取得手段が取得した前記集合を用いて、判定確度が高い区間から順に、当該区間に属する前記組の集合から求められる前記判定手段の正解率が、その区間に対応する前記判定手段の目標正解率を満たすよう当該区間を規定する前記閾値を決定する決定手段、
として機能させるためのプログラム。 A determination means for determining the input;
Calculation means for calculating the determination accuracy of the determination means for the input;
A plurality of post-processing units that can generate an output for the input by performing post-processing on the determination result of the determination unit, and have different degrees of dependence on the determination result of the determination unit in the generation of the output. A plurality of subsequent processing means respectively associated with each section obtained by dividing the range that the determination accuracy can take with one or more threshold values;
Control means for controlling the subsequent processing means corresponding to the section to which the determination accuracy calculated by the calculation means belongs to generate an output for the input;
For a determination system including:
For each past input to the determination means, an acquisition means for acquiring a set of the determination accuracy for the input and correct / incorrect information indicating whether the determination result of the determination means for the input is correct or incorrect;
Using the set acquired by the acquisition means, the correct answer rate of the determination means obtained from the set of sets belonging to the section in order from the section with the highest determination accuracy is the target correct answer of the determination means corresponding to the section. Determining means for determining the threshold value defining the section so as to satisfy the rate;
Program to function as.
前記入力に対する前記判定手段の判定確度を算出する算出手段と、
前記判定手段の判定結果に対して後段処理を行うことで前記入力に対する出力を生成可能であり、前記出力の生成における前記判定手段の判定結果に対する依存度合いが互いに異なる複数の後段処理手段であって、前記判定確度が取り得る範囲を1以上の閾値で区切った区間ごとに対してそれぞれ対応づけられた複数の後段処理手段と、
前記算出手段が算出した判定確度が属する区間に対応する前記後段処理手段に、前記入力に対する出力の生成を行わせるように制御する制御手段と、
前記判定手段に対する過去の入力の各々について、当該入力に対する前記判定確度と、当該入力に対する前記判定手段の判定結果が正解か不正解かを示す正誤情報との組の集合を取得する取得手段と、
前記取得手段が取得した前記集合を用いて、判定確度が高い区間から順に、当該区間に属する前記組の集合から求められる前記判定手段の正解率が、その区間に対応する前記判定手段の目標正解率を満たすよう当該区間を規定する前記閾値を決定する決定手段と、
を含む情報処理装置。 A determination means for determining the input;
Calculation means for calculating the determination accuracy of the determination means for the input;
A plurality of post-processing units that can generate an output for the input by performing post-processing on the determination result of the determination unit, and have different degrees of dependence on the determination result of the determination unit in the generation of the output. A plurality of subsequent processing means respectively associated with each section obtained by dividing the range that the determination accuracy can take with one or more threshold values;
Control means for controlling the subsequent processing means corresponding to the section to which the determination accuracy calculated by the calculation means belongs to generate an output for the input;
For each past input to the determination means, an acquisition means for acquiring a set of the determination accuracy for the input and correct / incorrect information indicating whether the determination result of the determination means for the input is correct or incorrect;
Using the set acquired by the acquisition means, the correct answer rate of the determination means obtained from the set of sets belonging to the section in order from the section with the highest determination accuracy is the target correct answer of the determination means corresponding to the section. Determining means for determining the threshold value defining the section so as to satisfy the rate;
An information processing apparatus including:
入力に対して判定を行う判定手段、
前記入力に対する前記判定手段の判定確度を算出する算出手段、
前記判定手段の判定結果に対して後段処理を行うことで前記入力に対する出力を生成可能であり、前記出力の生成における前記判定手段の判定結果に対する依存度合いが互いに異なる複数の後段処理手段であって、前記判定確度が取り得る範囲を1以上の閾値で区切った区間ごとに対してそれぞれ対応づけられた複数の後段処理手段、
前記算出手段が算出した判定確度が属する区間に対応する前記後段処理手段に、前記入力に対する出力の生成を行わせるように制御する制御手段、
前記判定手段に対する過去の入力の各々について、当該入力に対する前記判定確度と、当該入力に対する前記判定手段の判定結果が正解か不正解かを示す正誤情報との組の集合を取得する取得手段、
前記取得手段が取得した前記集合を用いて、判定確度が高い区間から順に、当該区間に属する前記組の集合から求められる前記判定手段の正解率が、その区間に対応する前記判定手段の目標正解率を満たすよう当該区間を規定する前記閾値を決定する決定手段、
として機能させるためのプログラム。
Computer
A determination means for determining the input;
Calculation means for calculating the determination accuracy of the determination means for the input;
A plurality of post-processing units that can generate an output for the input by performing post-processing on the determination result of the determination unit, and have different degrees of dependence on the determination result of the determination unit in the generation of the output. A plurality of subsequent processing means associated with each section obtained by dividing the range that the determination accuracy can take by one or more threshold values,
Control means for controlling the post-processing means corresponding to the section to which the determination accuracy calculated by the calculation means belongs to generate an output for the input;
For each past input to the determination means, an acquisition means for acquiring a set of the determination accuracy for the input and correct / incorrect information indicating whether the determination result of the determination means for the input is correct or incorrect;
Using the set acquired by the acquisition means, the correct answer rate of the determination means obtained from the set of sets belonging to the section in order from the section with the highest determination accuracy is the target correct answer of the determination means corresponding to the section. Determining means for determining the threshold value defining the section so as to satisfy the rate;
Program to function as.
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018040657A JP2019159374A (en) | 2018-03-07 | 2018-03-07 | Information processing apparatus and program |
US16/100,556 US20190279041A1 (en) | 2018-03-07 | 2018-08-10 | Information processing apparatus |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018040657A JP2019159374A (en) | 2018-03-07 | 2018-03-07 | Information processing apparatus and program |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2019159374A true JP2019159374A (en) | 2019-09-19 |
Family
ID=67992587
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018040657A Pending JP2019159374A (en) | 2018-03-07 | 2018-03-07 | Information processing apparatus and program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2019159374A (en) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7184411B1 (en) | 2022-06-20 | 2022-12-06 | 健彦 深山 | Character Recognition Program Evaluation Method, Character Recognition Program Evaluation System, and Method of Manufacturing Teacher Data for Character Recognition Program |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003296661A (en) * | 2002-03-29 | 2003-10-17 | Sanyo Electric Co Ltd | Character recognition device, character recognition method, its execution program and recording medium recording it |
JP2004046315A (en) * | 2002-07-09 | 2004-02-12 | Canon Inc | Device and method for recognizing character, program and storage medium |
JP2016212812A (en) * | 2015-05-14 | 2016-12-15 | 富士ゼロックス株式会社 | Information processor and information processing program |
-
2018
- 2018-03-07 JP JP2018040657A patent/JP2019159374A/en active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003296661A (en) * | 2002-03-29 | 2003-10-17 | Sanyo Electric Co Ltd | Character recognition device, character recognition method, its execution program and recording medium recording it |
JP2004046315A (en) * | 2002-07-09 | 2004-02-12 | Canon Inc | Device and method for recognizing character, program and storage medium |
JP2016212812A (en) * | 2015-05-14 | 2016-12-15 | 富士ゼロックス株式会社 | Information processor and information processing program |
Non-Patent Citations (2)
Title |
---|
SHUNICHI KIMURA ET AL.: ""A Man-Machine Cooperating System Based on the Generalized Reject Model"", 2017 14TH IAPR INTERNATIONAL CONFERENCE ON DOCUMENT ANALYSIS AND RECOGNITION (ICDAR), JPN6022005927, 9 November 2017 (2017-11-09), US, pages 1324 - 1329, XP033307951, ISSN: 0004909032, DOI: 10.1109/ICDAR.2017.218 * |
相澤 康雄: ""OCR入力の目検工数を大幅削減する仕組み"", 月刊自動認識, vol. 27, no. 4, JPN6022005929, 10 April 2014 (2014-04-10), JP, pages 30 - 34, ISSN: 0004705595 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7184411B1 (en) | 2022-06-20 | 2022-12-06 | 健彦 深山 | Character Recognition Program Evaluation Method, Character Recognition Program Evaluation System, and Method of Manufacturing Teacher Data for Character Recognition Program |
JP2024000290A (en) * | 2022-06-20 | 2024-01-05 | 健彦 深山 | Evaluation method for character recognition program, evaluation system for character recognition program, and method for creating teacher data of character recognition program |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112084383B (en) | Knowledge graph-based information recommendation method, device, equipment and storage medium | |
US11562147B2 (en) | Unified vision and dialogue transformer with BERT | |
CN108959246B (en) | Answer selection method and device based on improved attention mechanism and electronic equipment | |
JP6955580B2 (en) | Document summary automatic extraction method, equipment, computer equipment and storage media | |
CN107836000B (en) | Improved artificial neural network method and electronic device for language modeling and prediction | |
US9002101B2 (en) | Recognition device, recognition method, and computer program product | |
CN107004140B (en) | Text recognition method and computer program product | |
CN107229627B (en) | Text processing method and device and computing equipment | |
JP2021182398A (en) | Event prediction device and program for event prediction | |
US10755028B2 (en) | Analysis method and analysis device | |
CN112329476A (en) | Text error correction method and device, equipment and storage medium | |
US11580362B2 (en) | Learning apparatus, generation apparatus, classification apparatus, learning method, and non-transitory computer readable storage medium | |
CN110298024A (en) | Detection method, device and the storage medium of security files | |
CN111651594A (en) | Case classification method and medium based on key value memory network | |
JP2019204214A (en) | Learning device, learning method, program and estimation device | |
US20140257810A1 (en) | Pattern classifier device, pattern classifying method, computer program product, learning device, and learning method | |
JP2019159374A (en) | Information processing apparatus and program | |
CN115039144A (en) | Mathematical detection in handwriting | |
JP7206605B2 (en) | Information processing equipment | |
JP2010272004A (en) | Discriminating apparatus, discrimination method, and computer program | |
CN110909546B (en) | Text data processing method, device, equipment and medium | |
JP7338265B2 (en) | Information processing device and program | |
US20190279041A1 (en) | Information processing apparatus | |
KR102215259B1 (en) | Method of analyzing relationships of words or documents by subject and device implementing the same | |
JP7395396B2 (en) | Information processing device, information processing method and program |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210226 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20220210 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220215 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220418 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220510 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20221101 |