JP7206605B2 - Information processing equipment - Google Patents
Information processing equipment Download PDFInfo
- Publication number
- JP7206605B2 JP7206605B2 JP2018053024A JP2018053024A JP7206605B2 JP 7206605 B2 JP7206605 B2 JP 7206605B2 JP 2018053024 A JP2018053024 A JP 2018053024A JP 2018053024 A JP2018053024 A JP 2018053024A JP 7206605 B2 JP7206605 B2 JP 7206605B2
- Authority
- JP
- Japan
- Prior art keywords
- recognition
- accuracy
- range
- accuracy rate
- recognition result
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Character Discrimination (AREA)
Description
本発明は、情報処理装置に関する。 The present invention relates to an information processing device.
特許文献1に開示された方法は、入力された帳票上の画像に対し文字認識を行ない、その文字認識結果としての類似度を得て、この得られた類似度とあらかじめ登録された当該文字認識に要求する確信度とを比較し、この比較の結果に基づき文字認識結果に対し人手によるベリファイ処理を必要としない出力を行なうか、あるいは、上記比較の結果に基づき文字認識結果に対し文字認識候補の選択肢を提示して人手によるベリファイ処理を促す出力を行なうか、あるいは、上記比較の結果に基づき文字認識結果に対し人手による新規入力および確定を提示して手入力処理を促す出力を行なう。
The method disclosed in
特許文献2に開示された方法は、旧版の文字認識ソフトウェアから新版の文字認識ソフトウェアに変更するに際し、旧版ソフトウェアから新版ソフトウェアへの移行時における期間、実システムにおいて、新版及び旧版の双方のソフトウェアにより文字の認識を行う。その結果、新版及び旧版双方のソフトウェアの認識精度に関する情報を統計的に収集し、両者の認識精度を比較する。そして新版の精度が旧版の精度よりも高い場合に、新版ソフトウェアの導入を確定するようにするものである。一方、旧版ソフトウェアの認識精度の方が良かった場合には、新版ソフトウェアへの全面的な変更は行わず、旧版及び新版双方のソフトウェアの良い所を用いて並行的に運用することもできる。 In the method disclosed in Patent Document 2, when changing from the old version of the character recognition software to the new version of the character recognition software, during the transition from the old version of the software to the new version of the software, both the new version and the old version of the software are used in the actual system. Recognize characters. As a result, information on the recognition accuracy of both the new version and the old version of the software is statistically collected, and the recognition accuracy of both is compared. Then, when the accuracy of the new version is higher than the accuracy of the old version, the introduction of the new version software is decided. On the other hand, if the recognition accuracy of the old version software is better, it is possible to operate in parallel using the good points of both the old and new versions without completely changing to the new version software.
特許文献3に開示された方法は、入力原稿より文字情報をOCRで読み取り、認識処理部で認識処理する。オペレータによって入力原稿上の文字情報をキーボードよりキー入力させ、キー入力された文字データと文字認識された認識データとをCPUで比較し、誤りの可能性があるキー入力データの部分をCRT15にて異常表示させることで、ベリファイ入力を行う構成とする。たとえばキー入力された文字データが入力原稿と一致し、認識データに誤りがあると判断される文字データ、および認識データだけでなくキー入力された文字データにも誤りがあると判断される文字データを反転(しろ抜き)により異常表示し、入力ミスの可能性が高い入力データを自動的に検出できる。 In the method disclosed in Patent Document 3, character information is read from an input document by OCR, and recognition processing is performed by a recognition processing unit. The operator inputs the character information on the input document from the keyboard, and the CPU compares the key-inputted character data with the character-recognized recognition data. The configuration is such that verify input is performed by displaying an abnormality. For example, character data that is judged to have an error in the recognition data because the character data entered with the key matches the input document, and character data that is judged to have an error in not only the recognition data but also the character data entered with the key. is displayed as an error by inverting (whitening out), and input data with a high possibility of input error can be automatically detected.
特許文献4に開示された装置は、データの記入されたフォーム(帳票)を電子画像フォームとして読み取る画像読取手段と、読み取った電子画像フォームを性質の異なる、すなわち、誤認識を共通にしない或いは共通にすることの少ない2種類(以上)のOCRエンジンでOCR認識するOCR認識手段と、認識結果が一致した文字は自動的にデータベースへ保存し、一致しない文字及び一致してもいずれか一方のOCRエンジンの認識の信頼性の低い文字は確認修正後にデータベースへ保存するデータベース保存手段と、を備える。 The apparatus disclosed in Patent Document 4 has an image reading means for reading a form (form) in which data is entered as an electronic image form, and a read electronic image form having different properties, i.e., misrecognition is not common or OCR recognition means that performs OCR recognition with two (or more) OCR engines that are rarely used, and characters whose recognition results match are automatically stored in the database, and even if they match, characters that do not match OCR and database storage means for storing characters with low engine recognition reliability in a database after confirmation and correction.
特許文献5に開示された情報処理装置の分類手段は、文字認識対象を3種類のいずれかに分類し、抽出手段は、前記分類手段によって第1の種類に分類された場合に、前記文字認識対象の文字認識結果を抽出し、第1の制御手段は、前記分類手段によって第2の種類に分類された場合に、前記文字認識対象の文字認識結果を抽出し、該文字認識対象を人手で入力させるように制御し、第2の制御手段は、前記分類手段によって第3の種類に分類された場合に、前記文字認識対象を複数人の人手で入力させるように制御する。 The classification means of the information processing apparatus disclosed in Patent Document 5 classifies a character recognition object into one of three types, and the extraction means performs the character recognition when the character recognition target is classified into the first type by the classification means. extracting a target character recognition result, and extracting the character recognition result of the character recognition target when the classification means classifies the character recognition target into the second type, and extracting the character recognition target manually. The second control means controls to manually input the character recognition target by a plurality of persons when the character recognition target is classified into the third type by the classification means.
特許文献6~11には、文字認識の認識確度についての様々な算出方式が示されている。 Patent Documents 6 to 11 disclose various calculation methods for the recognition accuracy of character recognition.
判定手段により入力を判定する場合において、その判定手段の判定の正解率を求めるには、例えば、各入力についての判定手段による判定結果を、より判定精度が高い方法(例えば人間によるチェック)で正解か否か判定し、それら入力の全てに対する正解の判定結果の割合を求める方法がある。しかし、その判定精度の高い方法での判定は、判定手段の判定よりも高コストである。そうでなければ、判定手段の代わりにその判定精度の高い方法を最初から用いればよいからである。したがって、全入力について、その方法による判定を行うのは、コスト的な負担が大きい。 In the case of judging an input by a judging means, in order to obtain the accuracy rate of the judgment of the judging means, for example, the judging result of the judging means for each input is judged by a method with higher judging accuracy (for example, a human check). There is a method of judging whether or not the input is correct, and calculating the proportion of correct judgment results for all of those inputs. However, the determination by the method with high determination accuracy is more expensive than the determination by the determination means. Otherwise, a method with high determination accuracy should be used instead of the determination means from the beginning. Therefore, it is costly to make determinations using this method for all inputs.
本発明は、すべての入力について判定手段の判定結果の正解不正解を別の方法で判定することでその判定手段の正解率を求める方式よりも、より低いコストでその判定手段の正解率を求めることを目的とする。 The present invention obtains the correct answer rate of the judging means at a lower cost than the method of obtaining the correct answer rate of the judging means by judging the correct/wrong answer of the judging result of the judging means for all inputs by a different method. for the purpose.
請求項1に係る発明は、入力についての文字認識を実行し、前記文字認識の認識結果と認識確度とを出力する認識手段と、前記認識結果が正解か誤りかを確認し、認識結果が正解の場合はその認識結果を採用し、誤りの場合に前記入力についての正しい認識結果を求め、求めた認識結果を採用する確認手段と、前記認識確度が閾値以上である入力については前記確認手段を介在させずに前記認識手段の認識結果を出力し、閾値未満であれば前記確認手段が採用した認識結果を出力する制御を行う出力制御手段と、前記認識確度が前記閾値未満の範囲のうちの第1範囲内である入力のうち前記確認手段で正解と確認されたものの比率を、前記第1範囲における前記認識手段の正解率として算出する正解率算出手段と、前記第1範囲における前記正解率に基づき、前記閾値以上の範囲のうちの第2範囲における前記認識手段の正解率を推定する推定手段と、を含む情報処理装置である。
The invention according to
請求項2に係る発明は、前記第1範囲は、所定基準に従い決まる0より大きい値から前記閾値までの範囲である、請求項1に記載の情報処理装置である。
The invention according to claim 2 is the information processing apparatus according to
請求項3に係る発明は、前記推定手段は、前記正解率算出手段が算出した前記正解率が前記第1範囲における前記認識確度の第1の代表値に対応するものであるとし、前記第2範囲における前記認識確度の第2の代表値に対応する正解率を、前記第1の代表値に対応する正解率と、前記認識確度が取り得る最大値における所定の最大正解率と、の間の線形補間により推定する、請求項1又は2に記載の情報処理装置である。
In the invention according to claim 3, the estimation means is configured such that the accuracy rate calculated by the accuracy rate calculation means corresponds to a first representative value of the recognition accuracy in the first range, and the second The accuracy rate corresponding to the second representative value of the recognition accuracy in the range is set between the accuracy rate corresponding to the first representative value and a predetermined maximum accuracy rate at the maximum value that the recognition accuracy can take. 3. The information processing apparatus according to
請求項4に係る発明は、前記正解率算出手段は、前記認識確度が前記閾値未満である複数の範囲についてそれぞれ前記正解率を求め、前記推定手段は、前記複数の範囲の各々の前記正解率の前記認識確度に応じた変化の傾向に基づき、前記第2範囲における前記正解率を推定する、請求項1又は2に記載の情報処理装置である。
In the invention according to claim 4, the accuracy rate calculation means obtains the accuracy rate for each of a plurality of ranges in which the recognition accuracy is less than the threshold value, and the estimation means calculates the accuracy rate for each of the plurality of ranges. 3. The information processing apparatus according to
請求項5に係る発明は、前記正解率算出手段は、前記認識確度が前記閾値未満である複数の範囲についてそれぞれ前記正解率を求め、前記推定手段は、前記複数の範囲の各々の前記正解率と前記認識確度との関係から、前記認識確度に対応する前記正解率を求める関数を推定し、推定した関数を用いて前記第2範囲における前記正解率を推定する、請求項1又は2に記載の情報処理装置である。 In the invention according to claim 5, the accuracy rate calculation means obtains the accuracy rate for each of a plurality of ranges in which the recognition accuracy is less than the threshold value, and the estimation means calculates the accuracy rate for each of the plurality of ranges. and the recognition accuracy, estimating a function for obtaining the accuracy rate corresponding to the recognition accuracy, and estimating the accuracy rate in the second range using the estimated function. is an information processing device.
請求項6に係る発明は、前記推定手段は、前記認識確度の発生頻度の分布から前記認識確度の確率密度関数を求め、前記確率密度関数を用いて前記第2範囲における前記正解率を推定する請求項1に記載の情報処理装置である。
In the invention according to claim 6, the estimation means obtains a probability density function of the recognition accuracy from the distribution of occurrence frequencies of the recognition accuracy, and estimates the accuracy rate in the second range using the probability density function. An information processing apparatus according to
請求項7に係る発明は、コンピュータを、入力についての文字認識を実行し、前記文字認識の認識結果と認識確度とを出力する認識手段、前記認識結果が正解か誤りかを確認し、認識結果が正解の場合はその認識結果を採用し、誤りの場合に前記入力についての正しい認識結果を求め、求めた認識結果を採用する確認手段、前記認識確度が閾値以上である入力については前記確認手段を介在させずに前記認識手段の認識結果を出力し、閾値未満であれば前記確認手段が採用した認識結果を出力する制御を行う出力制御手段、前記認識確度が前記閾値未満の範囲のうちの第1範囲内である入力のうち前記確認手段で正解と確認されたものの比率を、前記第1範囲における前記認識手段の正解率として算出する正解率算出手段、前記第1範囲における前記正解率に基づき、前記閾値以上の範囲のうちの第2範囲における前記認識手段の正解率を推定する推定手段、として機能させるためのプログラムである。 According to a seventh aspect of the present invention, a computer comprises recognition means for executing character recognition on an input, outputting the recognition result and recognition accuracy of the character recognition , confirming whether the recognition result is correct or wrong, and If the input is correct, the recognition result is adopted; if the input is incorrect, the correct recognition result for the input is obtained and the obtained recognition result is adopted ; Output control means for controlling to output the recognition result of the recognition means without intervening, and to output the recognition result adopted by the confirmation means if the recognition accuracy is less than the threshold; accuracy rate calculation means for calculating a ratio of inputs within a first range that are confirmed as correct by the confirmation means as an accuracy rate of the recognition means in the first range; Based on this, the program functions as estimation means for estimating the accuracy rate of the recognition means in a second range out of the range equal to or greater than the threshold value.
請求項1、3又は7に係る発明によれば、すべての入力について判定手段の判定結果の正解不正解を別の方法で判定することでその判定手段の正解率を求める方式よりも、より低いコストでその判定手段の正解率を求めることができる。
According to the invention according to
請求項2に係る発明によれば、0から閾値までの全範囲についての正解率を算出してこれに基づいて第2範囲の正解率を推定する場合よりも、より妥当性が高い第2範囲の正解率を推定することができる。 According to the invention according to claim 2, the second range having higher validity than the case of calculating the accuracy rate for the entire range from 0 to the threshold value and estimating the accuracy rate of the second range based on this accuracy rate can be estimated.
請求項4、5又は6に係る発明によれば、第2範囲の正解率を線形補間により推定する場合よりも、より妥当性が高い正解率を推定することができる。 According to the fourth, fifth or sixth aspect of the present invention, it is possible to estimate an accuracy rate with higher validity than in the case of estimating the accuracy rate in the second range by linear interpolation.
図1に、本発明に係る情報処理装置の一実施形態例を示す。 FIG. 1 shows an embodiment of an information processing apparatus according to the present invention.
この情報処理装置は、入力される画像データ(「入力画像データ」)に含まれる文字列を、OCR10と確認処理部18により判定する。
This information processing apparatus determines a character string included in input image data (“input image data”) using an
OCR10は、認識処理部12と認識確度算出部14を備える。認識処理部12は、入力画像データに対して公知のOCR(光学文字認識)処理を行うことで、その入力画像データ内に含まれる文字列を認識する。認識処理部12は、認識した文字列を示すテキストコードを出力する。認識確度算出部14は、入力画像データから認識したテキストコードについての認識確度を算出する。認識確度は、認識結果のテキストコードがその入力画像データに含まれる文字列(手書きの場合もある)を正しく表している確からしさを示す度合いである。認識確度が高いほど、認識結果のテキストコードが正解である(すなわち入力画像データ中の文字列を正しく表している)可能性が高い。認識結果が正解である可能性を以下では、認識率又は正解率と呼ぶ。OCR10は、入力画像データについての異なる複数の認識結果を、認識確度が高い順に、認識確度と対応付けて出力してもよい。なお、OCR10が文字認識を行う単位(すなわち認識結果を出力する単位)は、特に限定されず、例えば、文字単位、行又は列(横書き又は縦書き)単位、帳票の欄単位、ページ単位、文書単位等のいずれであってもよい。
The
なお,OCR10が用いる文字認識の手法や認識確度の算出方法は特に限定されず、特許文献6~11に例示したものを初めとする従来手法や今後開発される手法のうちいずれを用いてもよい。
The method of character recognition used by the
選択部16は、認識処理部12の文字認識結果(テキストコード)について認識確度算出部14が算出した認識確度に基づいて、文字認識結果の出力の制御を行う。すなわち、選択部16は、認識確度がある閾値以上であれば、その文字認識結果を情報処理装置自体の最終的な文字認識結果として出力する。認識確度が閾値以上であれば、認識処理部12の認識が正確であると信頼するのである。
The
一方、認識確度がその閾値未満であれば、選択部16は、その文字認識結果とこれに対応する入力画像データとを確認処理部18に渡し、その文字認識結果が正しいかどうか確認する処理を実行する。
On the other hand, if the recognition accuracy is less than the threshold, the
一つの例では、確認処理部18は、人間である確認担当者に、その入力画像データと文字認識結果を提示し、その文字認識結果が入力画像データ内の文字列として正しいかどうか確認させる。確認担当者は、この情報処理装置に対してインターネット等のネットワークを介して接続された端末を操作しているものであってもよく、この場合確認処理部18は、入力画像データと文字認識結果を表示した画面情報(例えばウェブページ)をその端末に送り、その画面情報に対する確認担当者の入力を受け付ける。確認担当者は、正しいと判断した場合はその旨を示す入力を確認処理部18に対して行い、これに応じ確認処理部18は、選択部16から受け取った文字認識結果を情報処理装置自体の最終的な文字認識結果として出力する。またこのとき確認処理部18は、認識処理部12の文字認識結果が正解である旨を示す確認結果情報を蓄積部20に蓄積する。
In one example, the
また確認担当者は、選択部16から受け取った文字認識結果が入力画像データ内の文字列として正しくないと判断した場合は、その文字認識結果を修正するための入力を確認処理部18に行う。これに応じて確認処理部18は、修正後の文字認識結果を、情報処理装置自体の最終的な文字認識結果として出力する。またこのとき確認処理部18は、認識処理部12の文字認識結果が不正解である旨を示す確認結果情報を蓄積部20に蓄積する。
When the person in charge of confirmation determines that the character recognition result received from the
以上では、OCR10の文字認識結果の確認を人間が行う場合を例示したが、この他に、例えばOCR10よりも正確ではあるが文字認識のためのコストが高い別のOCR(例えば、情報処理装置の利用者とは別の運営主体が運営するインターネット上の有料の高精度OCRサービス)を用いて確認を行ってもよい。この場合、確認処理部18は、入力画像データをその別のOCRに認識させて認識結果を受け取り、受け取った認識結果を当該情報処理装置自体の最終的な文字認識結果として出力する。また、確認処理部18は、選択部16から受け取った認識処理部12の文字認識結果と、別のOCRから受け取ったその認識結果とを比較し、両者が一致する場合には、認識処理部12の文字認識結果が正解である旨を示す確認結果情報を、両者が不一致の場合は不正解である旨を示す確認結果情報を、蓄積部20に蓄積する。
In the above, the case where a human confirms the character recognition result of the
このように、確認処理部18は、認識処理部12の文字認識結果の正解・不正解を示す確認結果情報を蓄積部20に蓄積する。ここで、認識処理部12の文字認識結果について確認処理部18による正解・不正解の判定が行われるのは、その文字認識結果に対応する認識確度が閾値未満である場合である。したがって、蓄積部20に蓄積される確認結果情報は、認識確度がその閾値未満である文字認識結果についての正解・不正解の判定結果である。
In this manner, the
低確度域正解率算出部22は、蓄積部20に蓄積されている確認結果情報群、すなわち認識確度が閾値未満である文字認識結果についての正解・不正解の情報に基づいて、低確度域すなわち閾値未満の認識確度範囲についての、認識処理部12の正解率を算出する。例えば、この正解率は、正解率算出の対象とする確認結果情報の総数で、そのうちの正解を示す確認結果情報の数を割ることで算出すればよい。
The low-accuracy region accuracy
高確度域正解率推定部24は、低確度域正解率算出部22が算出した低確度域の正解率に基づき、高確度域すなわち閾値以上の認識確度範囲についての認識処理部12の正解率を推定する。以下、高確度域正解率推定部24が行う推定の例を説明する。
The high-accuracy area accuracy
第1の例を、図2を参照して説明する。 A first example will be described with reference to FIG.
認識確度を0から1までの実数値とし、低確度域の代表値をU、高確度域の代表値をVとする。各領域の代表値として、その領域の中央値を用いる場合、選択部16が用いる閾値をTとすると、U=T/2、V=(T+1)/2である。図2の例では、認識確度が1のときの正解率(認識率)が1であり、低確度域正解率算出部22が算出した低確度域の正解率αが低確度域の代表値Uでの正解率であるとして、高確度域の代表値Vでの正解率δを線形補間により推定する。すなわち、高確度域正解率推定部24は、次の式(1)を用いて正解率δを求める。
以上では、低確度域及び高確度域の代表値U及びVとして、それら各領域自体の中央値を用いたが、これは一例に過ぎない。この代わりに、それら各領域における認識確度の度数分布(あるいは、これから求めた確率密度関数)の代表値をU及びVとして用いてもよい。すなわち、認識確度算出部14が各入力画像データについて求めた認識確度を蓄積しておき、この蓄積した情報を用いて、認識確度の区間ごとに当該区間に属する認識確度の度数(発生頻度)を求め、これにより生成できる度数の分布(ヒストグラム)から高確度域及び低確度域の代表値を求めればよい。なお、蓄積部20には低確度域の情報しか蓄積されないので、全範囲の認識確度の分布を得るためには、これとは別に認識確度算出部14の出力を蓄積しておく。度数分布の代表値としては、例えば、平均値、中央値、最頻値を用いてもよい。
In the above, as the representative values U and V of the low-accuracy region and the high-accuracy region, the median values of the respective regions themselves are used, but this is only an example. Alternatively, U and V may be representative values of the frequency distribution of recognition accuracy (or the probability density function obtained from this) in each region. That is, the recognition
また認識確度の確率密度関数p(x)を用い、次式(2)を用いて、平均値としての代表値U及びVを求めてもよい。
ここで、確率密度関数p(x)は次のように求めればよい。 Here, the probability density function p(x) can be obtained as follows.
すなわち、図3に示すように、まず認識確度xを複数の区間に分割する。区間の数をZ個とし、区間の幅をWとする。各区間のインデクスをkとする。kは1以上Z以下の整数である。区間kの中央の値(すなわち区間の下限と上限を足して2で割った値)を区間代表値xkとする。認識確度算出部14が各入力画像データについて求めた認識確度を蓄積しておき、この蓄積した情報から、各区間kに入る認識確度の発生頻度(度数)Ykを求める。入力画像データの個数(すなわち認識確度の個数)をN個とすると、区間代表値における確率密度値p(x)は、次式で求められる。
p(xk)=Yk/NW
That is, as shown in FIG. 3, the recognition accuracy x is first divided into a plurality of intervals. Let Z be the number of sections and W be the width of the section. Let the index of each interval be k. k is an integer of 1 or more and Z or less. The central value of interval k (that is, the value obtained by adding the lower limit and upper limit of the interval and dividing by 2) is defined as the interval representative value x k . The recognition
p( xk)=Yk / NW
これは離散的な確率密度関数である。これを公知の補間法で補間して連続関数としたものを確率密度関数p(x)として用いてもよい。 This is a discrete probability density function. A continuous function obtained by interpolating this by a known interpolation method may be used as the probability density function p(x).
図2を用いて説明した高確度域正解率推定部24の推定方法を改良したものを、図4を参照して次に説明する。
An improved estimation method of the high-precision range
図2の例では、低確度域全体における正解率を用いて高確度域における正解率を算出した。しかし、認識確度が非常に低い領域での正解率は、高確度域での正解率に対する関連性が低い。そこで、この改良方法では、低確度域全体ではなく、そのうちの閾値Tに近い領域のみについての正解率に基づいて高確度域の正解率を推定する。 In the example of FIG. 2, the accuracy rate in the high-accuracy area is calculated using the accuracy rate in the entire low-accuracy area. However, the accuracy rate in the region where the recognition accuracy is very low has little relevance to the accuracy rate in the high accuracy region. Therefore, in this improved method, the accuracy rate of the high-accuracy area is estimated based on the accuracy rate of only the area close to the threshold value T, not the entire low-accuracy area.
すなわち、1<S<Tを満たす領域下限値Sをあらかじめ定めておき、低確度域正解率算出部22は、蓄積部20に蓄積された確認結果情報のうち認識確度xがS≦x≦Tを満たすもののみから正解率αを計算する。Sの値の定め方は特に限定されない。例えば、閾値Tに対して1未満の固定の割合となる値をSとして定めておいてもよい。また、蓄積部20内のデータ(確認結果情報)を、認識確度xの値が閾値Tから小さくなる方向に順に選んでいき、選んだデータの個数が、閾値T以下のデータの総数のうちの所定割合になったときの認識確度xを下限値Sとしてもよい。
That is, a region lower limit value S that satisfies 1<S<T is determined in advance, and the low-accuracy region accuracy
高確度域正解率推定部24は、認識確度がSからTまでの領域において認識確度の代表値Uを上記実施形態と同様の方法で求める。そして、その領域の正解率αがその代表値Uでの値であるとして、上記式(1)を用いて高確度域の正解率δを計算する。
The high-accuracy region accuracy
この改良方法では、低確度域のうちの高確度域に近い領域の正解率から高確度域の正解率を推定するので、低確度域全域の正解率から推定するよりも、高確度域の正解率がより正確に推定できる。 In this improved method, the accuracy rate of the high-accuracy area is estimated from the accuracy rate of the area close to the high-accuracy area among the low-accuracy areas. rate can be estimated more accurately.
図5を参照して、更なる変形例を説明する。 A further modification will be described with reference to FIG.
この変形例では、低確度域正解率算出部22は、図5に示すように、低確度域をN個(Nは2以上の整数)の小領域に分割し、小領域ごとに、蓄積部20に蓄積されたその小領域に属する認識確度に対応する確認結果情報から正解率を計算する。図5の例では、低確度域を4つの小領域に分割しているが、これは一例に過ぎない。そして、低確度域正解率算出部22は、小領域の正解率αをその小領域の代表値x(例えば小領域の上限と下限の中央の確度)における正解率(図5中ではX印で示す)とする。
In this modification, as shown in FIG. 5, the low-accuracy region correct
高確度域正解率推定部24は、正解率αが認識確度xの関数α(x)となるとの仮定の下、多項式近似や曲線フィッティング等の公知の手法により関数α(x)を推定する。そして、この関数α(x)を用いて、次式(3)により高確度域の正解率δを推定する。
また、高確度域正解率推定部24は、式(3)の代わりに次の式(4)を用いて高確度域の正解率δを推定してもよい。
式(4)においてp(x)は、上述の確率密度関数p(x)である。逆に言えば、式(3)は、確率密度関数p(x)が一様分布であると仮定した場合の式である。 In Equation (4), p(x) is the probability density function p(x) described above. Conversely, Equation (3) is an equation when it is assumed that the probability density function p(x) has a uniform distribution.
また、式(3)または(4)は、高確度域、すなわち認識確度xが閾値Tから1までの範囲全体についての正解率を求めるものである。これを一般化し、高確度域正解率推定部24は、高確度域内のT1≦x≦T2(ただしT≦T1<T2)の範囲についての正解率を次の式(5)により推定してもよい。
図6を参照して、更なる変形例を説明する。 A further modification will be described with reference to FIG.
図6には、この変形例の情報処理装置のうち、確認処理部18の内部構成の例と、蓄積部20、低確度域正解率算出部22及び高確度域正解率推定部24を示している。この変形例の情報処理装置は、図1に示すのと同様のOCR10及び選択部16を更に備えている。
FIG. 6 shows an example of the internal configuration of the
入力画像データに対して認識確度算出部14が算出した認識確度が閾値未満である場合、選択部16は、確認処理部18に対して処理の実行を指示する。このとき選択部16は、その入力画像データと、その入力画像データに対する認識処理部12の文字認識結果とを確認処理部18に入力する。文字認識結果は突合部184に渡され、入力画像データは人手入力部182に渡される。
If the recognition accuracy calculated by the recognition
人手入力部182は、渡された入力画像データが示す画像を人である入力者に提示し、その入力者がその画像から読み取った文字列の入力を受け付ける。人手入力部182は、人間を文字認識エンジンとした文字認識部と捉えることができる。文字認識を行う入力者は、この情報処理装置に対してインターネット等のネットワークを介してリモートの位置にいてもよく、この場合人手入力部182は、入力者が操作する端末に対してネットワーク経由で入力画像データが示す画像を例えばウェブページの形で提供し、それに対してユーザが入力した認識結果の文字列をネットワーク経由で受け取る。人手入力部182が入力者から受け取った文字列は、突合部184に入力される。
The
突合部(X)184は、OCR10の認識処理部12の文字認識結果と、人手入力部182が入力者から受け取った文字列とを突き合わせて(すなわち照合して)、両者が合致(すなわち一致)するか否(非合致)かを判定する。両者が合致する場合、突合部184は、その合致した判定結果を当該情報処理装置の最終的な文字認識結果として出力する。両者が非合致の場合、突合部184は、人手入力部186に処理を実行させる。また突合部184は、その突き合わせの結果である突合結果(すなわち「合致」か「非合致」かを示す値)Xを、蓄積部20へと蓄積する。突合結果Xの値は、合致が非合致かを示す二値の値である。以下では、一例として、計算の便宜のために、突合結果Xの値は合致の場合は「1」、非合致の場合は「0」とする(後述する突合部188A及び188Bの場合も同様)。蓄積部20に蓄積する突合結果Xには、入力画像データの識別情報i(例えば各入力データに順に付与される通し番号)が対応付けられており、どの入力画像データに対応する突合結果であるかが識別可能となっている。
The matching unit (X) 184 matches (matches) the character recognition result of the
人手入力部186は、突合部184からの上記非合致の場合のトリガを受けると、入力画像データの示す画像を人手入力部182の入力者は別の第2の入力者に提示し、第2の入力者がその画像から読み取った文字列の入力を受け付ける。そして、第2の入力者から人手入力部186が受け付けた文字列が、入力画像データに対する当該情報処理装置の最終的な文字認識結果として出力される。
When the
人手入力部186は、OCR10及び人手入力部182と並行に、同じ入力画像データについて常に第2の入力者からの文字列の入力を受け付ける処理を行ってもよいが、この処理を突合部184の判定結果が非合致の場合にのみ行うようにしてもよい。これにより、人手入力部186の処理のためのコスト(例えば第2の入力者のためのコスト)が低減される。
In parallel with the
OCR10、人手入力部182、突合部184、及び人手入力部186が、低確度域、すなわち認識確度が閾値未満の領域についての、入力画像データに対する文字認識を担う認識機構である。
The
一方、以下に説明する突合部188A及び188B、蓄積部20及び低確度域正解率算出部22は、上記認識機構が行った判定の結果を多数蓄積し、蓄積した情報に基づいて、低確度域におけるOCR10及び人手入力部182の正解率をそれぞれ計算する。更に低確度域についての上記認識機構の正解率を計算してもよい。
On the other hand, the matching
すなわち、まず突合部188Aは、OCR10の文字認識結果と人手入力部186が受け付けた文字列とを突き合わせ、その突き合わせの結果(突合結果A)を、入力画像データの識別情報iと対応付けて蓄積部20に蓄積する。突合部188Bは、人手入力部182の判定結果と人手入力部186の判定結果を突き合わせ、その突き合わせの結果(突合結果B)を、入力画像データの識別情報iと対応付けて蓄積部20に蓄積する。
That is, first, the
蓄積部20には、入力データiごとに、突合部184、188A、188Bによる3つの突合結果Xi、Ai、Biが蓄積される。
The
低確度域正解率算出部22は、蓄積部20に蓄積されている突合結果Xi、Ai、Biを用いて、OCR10、人手入力部182、及び上記認識機構の低確度域での正解率を算出する。
The low-accuracy region correct
低確度域正解率算出部22による正解率の算出方法を説明する。まず、OCR12aの正解率αと、人手入力部182の正解率βの算出方法を説明する。
A method of calculating the accuracy rate by the low-probability region accuracy
この算出方法は、以下の2つの前提(a)、(b)及び(c)に基づいて正解率α及びβを計算する。
(a)突合部184の突合結果Xが「合致」の場合、OCR10及び人手入力部182の認識結果は共に正解である。
(b)突合部188Aの突合結果Aが「合致」の場合、OCR10の認識結果が正解である。
(c)突合部188Bの突合結果Bが「合致」の場合、人手入力部182が受け付けた入力者の入力正解である。
This calculation method calculates accuracy rates α and β based on the following two premises (a), (b) and (c).
(a) If the matching result X of the
(b) If the matching result A of the
(c) If the matching result B of the
すなわち、ここでは、OCRの認識結果は、人手入力部182又は人手入力部186に入力された文字列と合致する場合に正解であり、人手入力部182に入力された文字列は、OCR10の認識結果又は人手入力部186に入力された文字列と合致する場合に正解であるとみなして、正解率α及びβを求める。これらの前提に基づいて、低確度域正解率算出部22は、次式(6)に従って正解率α及びβを算出する。
ここで、iは入力画像データの識別情報である通し番号であり、Nは入力データの総数である。また「P|Q」は、P又はQが1であれば値が1となり、P及びQの両方が0であれば値が0となる演算である。 Here, i is a serial number that is identification information of input image data, and N is the total number of input data. Also, "P|Q" is an operation that gives a value of 1 if P or Q is 1, and gives a value of 0 if both P and Q are 0.
なお、突合部184の突合結果が「合致」の場合、人手入力部186に判定を行わせないようにしてもよい。この場合、人手入力部186の判定結果が得られないので、これを用いる突合部188A及び188Bの突合結果は共に「0」となるようにしてもよい。このようにした場合、低確度域正解率算出部22は、上述の式(6)の代わりに、次の式(7)により正解率を計算してもよい。
次に、この情報処理装置の低確度域についての認識機構(すなわちOCR10、人手入力部182、突合部184及び人手入力部186からなる部分)の正解率γを求める処理について説明する。ここでは、人手入力部182と人手入力部186と同じ特性を持つものとする。すなわち、人手入力部182と人手入力部186は、統計的に見て正解率が等しいとみなす。
Next, the processing for obtaining the accuracy rate γ of the recognition mechanism (that is, the portion comprising the
OCR10及び人手入力部182の低確度域における正解率α及びβは、上述の方法で既に計算済みであるとする。この例では、上述の通り、人手入力部186は、入力データの数が十分多い場合、人手入力部182と同じ正解率αを持つとみなすことができる。したがって、低確度域正解率算出部22は、正解率γを次式により計算することができる。
γ=αβ+(1-αβ)α
Assume that the accuracy rates α and β in the low-accuracy region of the
γ=αβ+(1−αβ)α
より詳しく説明すると、判定機構全体としての正解となるケースは、(a)OCR10の認識結果が正解、かつ、人手入力部182が受け付けた入力が正解となるケースと、(b)これ以外かつ人手入力部186が正解となるケースの2つである。(a)のケースが生じる確率はαβ、(b)のケースが生じる確率は、上記(a)以外の確率(1-αβ)と人手入力部186が正解となる確率αの積(1-αβ)αなので、(a)と(b)の確率の和が最終的な正解率γとなる。
More specifically, the cases where the judgment mechanism as a whole is correct are (a) cases where the recognition result of the
高確度域正解率推定部24は、低確度域正解率算出部が算出したOCR10の低確度域における正解率αを用いて、上述の実施形態又は各変形例に示した方法で、OCR10の高確度域(すなわち認識確度が閾値以上)での正解率を推定する。また、このシステム全体の正解率を推定する場合には、低確度域の正解率として上述のγを用い、このγから述の実施形態又は各変形例に示した方法で、高確度域におけるシステム全体の正解率を推定してもよい。
The high-accuracy area accuracy
図6に例示した確認処理部18は、OCR10の文字認識結果を一人の人が確認する(すなわちその一人の人の認識結果を必ず正解とする)方式よりも、低確度域における文字認識結果(すなわち確認処理部18の出力)の正確さを高くすることができ、ひいては低確度域におけるOCR10の正解率の正確さを高めることができる。
The
図6の例では、OCR10の文字認識結果を人により確認したが、人以外の手段で確認してもよい。人以外の確認手段としては、例えばOCR10よりも文字認識の正解率が高いと期待される文字認識システムを用いてもよい。この文字認識システムの利用コストが高く、OCR10で十分な正解率が見込める場合にはその文字認識システムを利用しないことでコスト削減を図るといった目的で、この仕組みは利用できる。
In the example of FIG. 6, the character recognition result of the
以上に説明した実施形態及び変形例は、いずれも、入力画像データ中の文字列を認識するものであったが、上記実施形態及び変形例の手法は、文字認識に限らず、入力されたデータの内容を判定してその判定結果を出力する情報処理装置全般に適用可能である。すなわち、入力されたデータの内容を判定する判定手段(その一例がOCR10)の判定の確度、すなわちその判定の結果が正解である可能性の高さの度合い、が閾値以上であればその判定手段の判定結果をそのまま出力し、閾値未満であればその判定結果を別の手段で確認し、誤りの場合は修正するシステムにおいて、確度が閾値以上の範囲における判定手段の正解率を求めるのに、上記実施形態及び変形例の方式が適用可能である。 Both the embodiments and modifications described above recognize character strings in input image data. can be applied to general information processing apparatuses that determine the content of and output the determination result. That is, if the accuracy of determination of determination means (an example of which is an OCR 10) that determines the content of input data, that is, the degree of likelihood that the determination result is correct, is greater than or equal to a threshold value, the determination means In a system that outputs the judgment result as it is, if it is less than the threshold, the judgment result is confirmed by another means, and if it is an error, it is corrected. The methods of the above embodiments and modifications are applicable.
以上に例示した情報処理装置は、一つの例ではハードウェアの論理回路として構成可能である。また、別の例として、この情報処理装置は、例えば、内蔵されるコンピュータにそれらシステムまたは装置内の各機能モジュールの機能を表すプログラムを実行させることにより実現してもよい。ここで、コンピュータは、例えば、ハードウェアとして、CPU等のプロセッサ、ランダムアクセスメモリ(RAM)およびリードオンリメモリ(ROM)等のメモリ(一次記憶)、HDD(ハードディスクドライブ)を制御するHDDコントローラ、各種I/O(入出力)インタフェース、ローカルエリアネットワークなどのネットワークとの接続のための制御を行うネットワークインタフェース等が、たとえばバスを介して接続された回路構成を有する。また、そのバスに対し、例えばI/Oインタフェース経由で、CDやDVDなどの可搬型ディスク記録媒体に対する読み取り及び/又は書き込みのためのディスクドライブ、フラッシュメモリなどの各種規格の可搬型の不揮発性記録媒体に対する読み取り及び/又は書き込みのためのメモリリーダライタ、などが接続されてもよい。上に例示した各機能モジュールの処理内容が記述されたプログラムがCDやDVD等の記録媒体を経由して、又はネットワーク等の通信手段経由で、ハードディスクドライブ等の固定記憶装置に保存され、コンピュータにインストールされる。固定記憶装置に記憶されたプログラムがRAMに読み出されCPU等のプロセッサにより実行されることにより、上に例示した機能モジュール群が実現される。また、情報処理装置は、ソフトウェアとハードウェアの組合せで構成されてもよい。 The information processing apparatus exemplified above can be configured as a logic circuit of hardware in one example. As another example, the information processing apparatus may be implemented by causing a built-in computer to execute a program representing the function of each functional module in the system or apparatus. Here, the computer includes, for example, hardware such as a processor such as a CPU, memory (primary storage) such as random access memory (RAM) and read only memory (ROM), HDD controller for controlling HDD (hard disk drive), various It has a circuit configuration in which an I/O (input/output) interface, a network interface for controlling connection with a network such as a local area network, and the like are connected via a bus, for example. Also, for the bus, for example, via an I/O interface, a disk drive for reading from and/or writing to a portable disk recording medium such as a CD or a DVD, a portable nonvolatile recording medium of various standards such as a flash memory, etc. A memory reader/writer for reading from and/or writing to the medium, etc., may also be connected. A program in which the processing contents of each functional module exemplified above is described is stored in a fixed storage device such as a hard disk drive via a recording medium such as a CD or DVD or via a communication means such as a network. Installed. A program stored in a fixed storage device is read out to a RAM and executed by a processor such as a CPU to implement the functional module group illustrated above. Also, the information processing apparatus may be configured by a combination of software and hardware.
10 OCR、12 認識処理部、14 認識確度算出部、16 選択部、18 確認処理部、20 蓄積部、22 低確度域正解率算出部、24 高確度域正解率推定部、182,186 人手入力部、184,188A,188B 突合部。
10 OCR, 12 recognition processing unit, 14 recognition accuracy calculation unit, 16 selection unit, 18 confirmation processing unit, 20 accumulation unit, 22 low-accuracy area accuracy calculation unit, 24 high-accuracy area accuracy estimation unit, 182, 186 manual input Part, 184, 188A, 188B Abutment.
Claims (7)
前記認識結果が正解か誤りかを確認し、認識結果が正解の場合はその認識結果を採用し、誤りの場合に前記入力についての正しい認識結果を求め、求めた認識結果を採用する確認手段と、
前記認識確度が閾値以上である入力については前記確認手段を介在させずに前記認識手段の認識結果を出力し、閾値未満であれば前記確認手段が採用した認識結果を出力する制御を行う出力制御手段と、
前記認識確度が前記閾値未満の範囲のうちの第1範囲内である入力のうち前記確認手段で正解と確認されたものの比率を、前記第1範囲における前記認識手段の正解率として算出する正解率算出手段と、
前記第1範囲における前記正解率に基づき、前記閾値以上の範囲のうちの第2範囲における前記認識手段の正解率を推定する推定手段と、
を含む情報処理装置。 recognition means for performing character recognition on an input and outputting the recognition results and recognition accuracy of the character recognition;
confirming means for confirming whether the recognition result is correct or incorrect, adopting the recognition result if the recognition result is correct, obtaining the correct recognition result for the input if the recognition result is incorrect, and adopting the obtained recognition result; ,
Output control for outputting the recognition result of the recognition means without intervening the confirmation means for the input whose recognition accuracy is equal to or higher than the threshold, and outputting the recognition result adopted by the confirmation means if the recognition accuracy is less than the threshold. means and
A correct answer rate for calculating a ratio of inputs confirmed as correct answers by the confirmation means among inputs whose recognition accuracy is within a first range of the range less than the threshold, as a correct answer rate of the recognition means in the first range. calculating means;
an estimation means for estimating the accuracy rate of the recognition means in a second range out of the range equal to or greater than the threshold based on the accuracy rate in the first range;
Information processing equipment including.
前記推定手段は、前記複数の範囲の各々の前記正解率の前記認識確度に応じた変化の傾向に基づき、前記第2範囲における前記正解率を推定する、請求項1又は2に記載の情報処理装置。 The accuracy rate calculation means obtains the accuracy rate for each of a plurality of ranges in which the recognition accuracy is less than the threshold;
3. The information processing according to claim 1, wherein said estimation means estimates said accuracy rate in said second range based on a tendency of change of said accuracy rate in each of said plurality of ranges according to said recognition accuracy. Device.
前記推定手段は、前記複数の範囲の各々の前記正解率と前記認識確度との関係から、前記認識確度に対応する前記正解率を求める関数を推定し、推定した関数を用いて前記第2範囲における前記正解率を推定する、請求項1又は2に記載の情報処理装置。 The accuracy rate calculation means obtains the accuracy rate for each of a plurality of ranges in which the recognition accuracy is less than the threshold;
The estimation means estimates a function for obtaining the accuracy rate corresponding to the recognition accuracy from the relationship between the accuracy rate and the recognition accuracy for each of the plurality of ranges, and uses the estimated function to determine the second range. 3. The information processing apparatus according to claim 1, wherein the accuracy rate in is estimated.
入力についての文字認識を実行し、前記文字認識の認識結果と認識確度とを出力する認識手段、
前記認識結果が正解か誤りかを確認し、認識結果が正解の場合はその認識結果を採用し、誤りの場合に前記入力についての正しい認識結果を求め、求めた認識結果を採用する確認手段、
前記認識確度が閾値以上である入力については前記確認手段を介在させずに前記認識手段の認識結果を出力し、閾値未満であれば前記確認手段が採用した認識結果を出力する制御を行う出力制御手段、
前記認識確度が前記閾値未満の範囲のうちの第1範囲内である入力のうち前記確認手段で正解と確認されたものの比率を、前記第1範囲における前記認識手段の正解率として算出する正解率算出手段、
前記第1範囲における前記正解率に基づき、前記閾値以上の範囲のうちの第2範囲における前記認識手段の正解率を推定する推定手段、
として機能させるためのプログラム。 the computer,
recognition means for performing character recognition on an input and outputting the recognition result and recognition accuracy of the character recognition;
Confirmation means for confirming whether the recognition result is correct or incorrect, adopting the recognition result if the recognition result is correct, obtaining the correct recognition result for the input if the recognition result is incorrect, and adopting the obtained recognition result;
Output control for outputting the recognition result of the recognition means without intervening the confirmation means for the input whose recognition accuracy is equal to or higher than the threshold, and outputting the recognition result adopted by the confirmation means if the recognition accuracy is less than the threshold. means,
A correct answer rate for calculating a ratio of inputs confirmed as correct answers by the confirmation means among inputs whose recognition accuracy is within a first range of the range less than the threshold, as a correct answer rate of the recognition means in the first range. calculating means;
Estimation means for estimating the accuracy rate of the recognition means in a second range out of the range equal to or greater than the threshold based on the accuracy rate in the first range;
A program to function as
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018053024A JP7206605B2 (en) | 2018-03-20 | 2018-03-20 | Information processing equipment |
US16/100,556 US20190279041A1 (en) | 2018-03-07 | 2018-08-10 | Information processing apparatus |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018053024A JP7206605B2 (en) | 2018-03-20 | 2018-03-20 | Information processing equipment |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2019164687A JP2019164687A (en) | 2019-09-26 |
JP7206605B2 true JP7206605B2 (en) | 2023-01-18 |
Family
ID=68066194
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018053024A Active JP7206605B2 (en) | 2018-03-07 | 2018-03-20 | Information processing equipment |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP7206605B2 (en) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116569225B (en) * | 2020-08-24 | 2024-04-30 | 三菱电机楼宇解决方案株式会社 | Document image recognition system |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003346080A (en) | 2002-05-22 | 2003-12-05 | Toshiba Corp | Character recognition method |
JP2010073201A (en) | 2008-08-20 | 2010-04-02 | Hammock:Kk | Ocr system |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH08263587A (en) * | 1995-03-20 | 1996-10-11 | Matsushita Electric Ind Co Ltd | Method and device for document input |
JP3761937B2 (en) * | 1995-09-18 | 2006-03-29 | キヤノン株式会社 | Pattern recognition method and apparatus, and computer control apparatus |
-
2018
- 2018-03-20 JP JP2018053024A patent/JP7206605B2/en active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003346080A (en) | 2002-05-22 | 2003-12-05 | Toshiba Corp | Character recognition method |
JP2010073201A (en) | 2008-08-20 | 2010-04-02 | Hammock:Kk | Ocr system |
Also Published As
Publication number | Publication date |
---|---|
JP2019164687A (en) | 2019-09-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US5974163A (en) | Fingerprint classification system | |
US7646893B2 (en) | Biometric information apparatus narrowing biometric information of registered users used when authorizing a candidate based on features extracted from the biometric information of the candidate | |
US7046829B2 (en) | Fingerprint verification | |
US9385868B2 (en) | Methods and systems for testing performance of biometric authentication systems | |
EP2657884A2 (en) | Identifying multimedia objects based on multimedia fingerprint | |
US20080273767A1 (en) | Iterative print matching method and system | |
JP6892606B2 (en) | Positioning device, position identification method and computer program | |
US20070292005A1 (en) | Method and apparatus for adaptive hierarchical processing of print images | |
JP7206605B2 (en) | Information processing equipment | |
AU753499B2 (en) | Character recognition method, character recognition apparatus and recording medium on which a character recognition program is recorded | |
CN112232206B (en) | Face recognition method and face recognition platform based on big data and artificial intelligence | |
US20210044864A1 (en) | Method and apparatus for identifying video content based on biometric features of characters | |
Neto et al. | PIC-Score: Probabilistic Interpretable Comparison Score for Optimal Matching Confidence in Single-and Multi-Biometric Face Recognition | |
Israilovich et al. | MECHANISMS FOR OPTIMIZATION OF DETECTION AND CORRECTION OF ERRORS IN COMPUTER TEXT PROCESSING SYSTEMS | |
CN117150395A (en) | Model training and intention recognition method and device, electronic equipment and storage medium | |
US20190279041A1 (en) | Information processing apparatus | |
CN115731583A (en) | Finger vein-based finger recognition method and device, electronic device and storage medium | |
JP7147208B2 (en) | Information processing device and program | |
JP6988828B2 (en) | Collation processing device, collation processing method, and collation processing program | |
CN112085526A (en) | Information matching method and device based on user group, computer equipment and storage medium | |
JP2019159374A (en) | Information processing apparatus and program | |
CN111708988A (en) | Infringement video identification method and device, electronic equipment and storage medium | |
CN111985519B (en) | Text similarity quantification method, equipment and system | |
JP3421200B2 (en) | Character recognition method and device | |
US20210192317A1 (en) | Information processing device, information processing method, and program |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210226 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20220221 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220308 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220428 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220920 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20221117 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20221206 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20221219 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7206605 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |