JP2019215747A - 情報処理装置及びプログラム - Google Patents
情報処理装置及びプログラム Download PDFInfo
- Publication number
- JP2019215747A JP2019215747A JP2018113013A JP2018113013A JP2019215747A JP 2019215747 A JP2019215747 A JP 2019215747A JP 2018113013 A JP2018113013 A JP 2018113013A JP 2018113013 A JP2018113013 A JP 2018113013A JP 2019215747 A JP2019215747 A JP 2019215747A
- Authority
- JP
- Japan
- Prior art keywords
- unit
- determination result
- determination
- input
- receiving
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/74—Image or video pattern matching; Proximity measures in feature spaces
- G06V10/75—Organisation of the matching processes, e.g. simultaneous or sequential comparisons of image or video features; Coarse-fine approaches, e.g. multi-scale approaches; using context analysis; Selection of dictionaries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2413—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N7/00—Computing arrangements based on specific mathematical models
- G06N7/01—Probabilistic graphical models, e.g. probabilistic networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/22—Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/98—Detection or correction of errors, e.g. by rescanning the pattern or by human intervention; Evaluation of the quality of the acquired patterns
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/19—Recognition using electronic means
- G06V30/191—Design or setup of recognition systems or techniques; Extraction of features in feature space; Clustering techniques; Blind source separation
- G06V30/19167—Active pattern learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Data Mining & Analysis (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Multimedia (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Databases & Information Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Computing Systems (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- General Health & Medical Sciences (AREA)
- Probability & Statistics with Applications (AREA)
- Algebra (AREA)
- Computational Mathematics (AREA)
- Mathematical Analysis (AREA)
- Mathematical Optimization (AREA)
- Pure & Applied Mathematics (AREA)
- Mathematical Physics (AREA)
- Quality & Reliability (AREA)
- Collating Specific Patterns (AREA)
- Image Analysis (AREA)
- Character Discrimination (AREA)
Abstract
【課題】自動判定の確度で第1突合処理と第2突合処理を使い分ける方式と比べて、人手による判定の工数を低減できる方式を提供する。【解決手段】文字認識器12による入力画像の認識処理の確度の値によらず、その文字認識器12による認識結果と、キー入力部14が受け取ったAさんによるその入力画像の認識結果とを第1突合部16で突合する。この突合の結果、それら2つの認識結果同士が合致した場合は、その合致した認識結果を装置の最終的な認識結果として出力する。それら2つの認識結果同士が非合致の場合は、キー入力部14及び22が受け取った2人の認識結果を用いて最終的な認識結果を決定する。【選択図】図1
Description
本発明は、情報処理装置及びプログラムに関する。
紙帳票に手書き記入または印刷された文字列をデジタルデータ化するデータ入力システムがある。データ入力システムは、帳票中を人間が読み取ってキー入力する方式、光学文字認識(OCR)技術を用いた文字認識器により帳票中の画像に対して文字認識処理を行う方式、あるいはこれらの組合せにより帳票中の文字列をデジタル化する。
文字認識器は、実行した認識処理の処理結果がどの程度信頼できるかを示す度合いを出力する機能を持つことが多い。この度合いは認識の確度と呼ばれる。
文字認識器以外にも、入力画像に対して何らかの自動判定を行う手段はあり、そのような自動判定手段の中には、実行した判定の確度を出力するものがある。
特許文献1に開示された方法は、入力された帳票上の画像に対し文字認識を行ない、その文字認識結果としての類似度を得て、この得られた類似度とあらかじめ登録された当該文字認識に要求する確信度とを比較し、この比較の結果に基づき文字認識結果に対し人手によるベリファイ処理を必要としない出力を行なうか、あるいは、上記比較の結果に基づき文字認識結果に対し文字認識候補の選択肢を提示して人手によるベリファイ処理を促す出力を行なうか、あるいは、上記比較の結果に基づき文字認識結果に対し人手による新規入力および確定を提示して手入力処理を促す出力を行なう。
特許文献2に開示された文字認識装置は、手書き入力された文字の座標点列を認識して認識候補文字群を出力する文字認識手段と、文字認識手段より出力される判定対象認識候補文字群の信頼度を算出するための特徴量として、手書き入力された文字の座標点列の平均筆記速度を算出する特徴抽出手段と、特徴抽出手段からの特徴量と、サンプルデータの統計的傾向とに基づいて、判定対象認識候補文字群の信頼度を算出する信頼度算出手段と、信頼度算出手段からの信頼度に基づいて判定対象認識候補文字群の後処理を制御する後処理制御手段とを有する。
特許文献3に開示された方法は、入力された文書画像から論理要素を抽出し、抽出された論理要素が文字列領域であるかを識別し、識別された文字列領域を文字認識し、認識結果の確信度がしきい値以上であるときテキストとして表示し、しきい値未満であるとき部分画像として表示する。
特許文献1に開示された情報処理装置の分類手段は、文字認識対象を3種類のいずれかに分類し、抽出手段は、前記分類手段によって第1の種類に分類された場合に、前記文字認識対象の文字認識結果を抽出し、第1の制御手段は、前記分類手段によって第2の種類に分類された場合に、前記文字認識対象の文字認識結果を抽出し、該文字認識対象を人手で入力させるように制御し、第2の制御手段は、前記分類手段によって第3の種類に分類された場合に、前記文字認識対象を複数人の人手で入力させるように制御する。
特許文献2には、人手によるデータ入力システムに、OCRによる文字認識器を組み合わせたシステムが開示されている。
特許文献3には、OCRの認識結果と認識の確度とを組み合わせた処理を行う例が示されている。
特許文献4〜9には、文字認識の認識確度についての様々な算出方式が示されている。
文字認識器等の自動判定の結果をそのままシステムの最終出力とする場合をいったん考慮から除き、自動判定と人間の判定の結果同士を突合する第1突合処理と、異なる二人の判定の結果同士を突合する第2突合処理とを、自動判定の確度に応じて使い分ける場合を考える。この場合、確度が相対的に高い範囲にある入力は第1突合処理に振り分けられ、相対的に低い範囲にある入力は第2突合処理に振り分けられる。
ここで、確度が低いために第2突合処理に振り分けられる場合の中には、自動判定の結果が正解である場合も存在する。これは確度が推定値であるための誤差に起因する。自動判定の結果が正解であるにもかかわらず、確度が低いために第2突合処理に振り分けられてしまった場合、自動判定の結果が利用されず、その代わりに1人分の判定のコストが無駄にかかってしまう。このように、自動判定の確度で第1突合処理と第2突合処理を使い分ける方式には、人手による判定の工数が余計に係ってしまう場合がある。
本発明は、自動判定の確度で第1突合処理と第2突合処理を使い分ける方式と比べて、人手による判定の工数を低減できる方式を提供する。
請求項1に係る発明は、入力情報に対して判定を行って判定結果を出力する判定手段と、前記入力情報に対する第1の人による判定結果の入力を受け付ける第1受付手段と、前記入力情報に対する第2の人による判定結果の入力を受け付ける第2受付手段と、前記入力情報に対する第3の人による判定結果の入力を受け付け、当該判定結果を最終的な出力として出力する第3受付手段と、前記判定手段が出力した判定結果と前記第1受付手段が受け付けた判定結果とを突合し、それら判定結果同士が合致する場合に当該合致する判定結果を最終的な出力として出力する第1突合手段と、前記第1受付手段が受け付けた判定結果と前記第2受付手段が受け付けた判定結果とを突合し、それら判定結果同士が合致する場合に、当該合致する判定結果を最終的な出力として出力する第2突合手段と、前記入力情報が入力された場合に、前記判定手段、前記第1受付手段及び前記第1突合手段を動作させ、前記第1突合手段による突合において前記判定手段による前記判定結果と前記第1受付手段が受け付けた前記判定結果とが合致しない場合、更に、前記第2受付手段及び前記第2突合手段からなる組と、前記第3受付手段と、のうちの一方を選択的に動作させるよう制御する制御手段と、を含む情報処理装置である。
請求項2に係る発明は、入力情報に対する前記判定手段の判定確度を算出する手段を更に含み、前記制御手段は、前記第1突合手段による突合において前記判定手段による前記判定結果と前記第1受付手段が受け付けた前記判定結果とが合致しない場合、前記判定確度が第1閾値以上であれば前記第3受付手段を動作させ、前記判定確度が前記第1閾値未満であれば前記第2受付手段及び前記第2突合手段を動作させる、ことを特徴とする請求項1に記載の情報処理装置である。
請求項3に係る発明は、前記制御手段は、前記判定確度が前記第1閾値より大きい第2閾値以上である場合は前記判定手段の判定結果を最終的な出力とし、前記判定確度が前記第2閾値未満である場合は、前記判定手段、前記第1受付手段及び前記第1突合手段を動作させ、前記第1突合手段による突合において前記判定手段による前記判定結果と前記第1受付手段が受け付けた前記判定結果とが合致しない場合には、前記判定確度が前記第2閾値未満かつ前記第1閾値以上であれば前記第3受付手段を動作させ、前記判定確度が前記第1閾値未満であれば前記第2受付手段及び前記第2突合手段を動作させる制御を行う、ことを特徴とする請求項2に記載の情報処理装置である。
請求項4に係る発明は、コンピュータを、入力情報に対して判定を行って判定結果を出力する判定手段、前記入力情報に対する第1の人による判定結果の入力を受け付ける第1受付手段、前記入力情報に対する第2の人による判定結果の入力を受け付ける第2受付手段、前記入力情報に対する第3の人による判定結果の入力を受け付け、当該判定結果を最終的な出力として出力する第3受付手段、前記判定手段が出力した判定結果と前記第1受付手段が受け付けた判定結果とを突合し、それら判定結果同士が合致する場合に当該合致する判定結果を最終的な出力として出力する第1突合手段、前記第1受付手段が受け付けた判定結果と前記第2受付手段が受け付けた判定結果とを突合し、それら判定結果同士が合致する場合に、当該合致する判定結果を最終的な出力として出力する第2突合手段、前記入力情報が入力された場合に、前記判定手段、前記第1受付手段及び前記第1突合手段を動作させ、前記第1突合手段による突合において前記判定手段による前記判定結果と前記第1受付手段が受け付けた前記判定結果とが合致しない場合、更に、前記第2受付手段及び前記第2突合手段からなる組と、前記第3受付手段と、のうちの一方を選択的に動作させるよう制御する制御手段、として機能させるためのプログラムである。
請求項5に係る発明は、入力情報に対して判定を行って判定結果を出力する判定手段と、前記入力情報に対する第1の人による判定結果の入力を受け付ける第1受付手段と、前記入力情報に対する第2の人による判定結果の入力を受け付ける第2受付手段と、前記判定手段が出力した判定結果と前記第1受付手段が受け付けた判定結果とを突合し、それら判定結果同士が合致する場合に当該合致する判定結果を最終的な出力として出力する第1突合手段と、前記第1受付手段が受け付けた判定結果と前記第2受付手段が受け付けた判定結果とを突合し、それら判定結果同士が合致する場合に、当該合致する判定結果を最終的な出力として出力する第2突合手段と、前記入力情報が入力された場合に前記判定手段、前記第1受付手段及び前記第1突合手段を動作させ、前記第1突合手段による突合において、前記判定手段による前記判定結果と前記第1受付手段が受け付けた前記判定結果とが合致しない場合に、前記第2受付手段及び前記第2突合手段を更に動作させる制御を行う制御手段と、を含む情報処理装置である。
請求項6に係る発明は、前記入力情報に対する第3の人による判定結果の入力を受け付け、当該判定結果を最終的な出力として出力する第3受付手段、を更に含み、前記制御手段は、前記第2突合手段による突合において、前記第1受付手段が受け付けた前記判定結果と前記第2受付手段が受け付けた前記判定結果とが合致しない場合に、前記第2受付手段が受け付けた前記判定結果を最終的な出力として出力する処理と、前記第3受付手段を動作させる処理と、を選択的に実行する、請求項5に記載の情報処理装置である。
請求項7に係る発明は、前記入力情報に対する第3の人による判定結果の入力を受け付け、当該判定結果を最終的な出力として出力する第3受付手段、を更に含み、前記制御手段は、前記第2突合手段による突合において、前記第1受付手段が受け付けた前記判定結果と前記第2受付手段が受け付けた前記判定結果とが合致しない場合に、前記第3受付手段を動作させる、請求項5に記載の情報処理装置である。
請求項8に係る発明は、コンピュータを、入力情報に対して判定を行って判定結果を出力する判定手段、前記入力情報に対する第1の人による判定結果の入力を受け付ける第1受付手段、前記入力情報に対する第2の人による判定結果の入力を受け付ける第2受付手段、前記判定手段が出力した判定結果と前記第1受付手段が受け付けた判定結果とを突合し、それら判定結果同士が合致する場合に当該合致する判定結果を最終的な出力として出力する第1突合手段、前記第1受付手段が受け付けた判定結果と前記第2受付手段が受け付けた判定結果とを突合し、それら判定結果同士が合致する場合に、当該合致する判定結果を最終的な出力として出力する第2突合手段、前記入力情報が入力された場合に前記判定手段、前記第1受付手段及び前記第1突合手段を動作させ、前記第1突合手段による突合において、前記判定手段による前記判定結果と前記第1受付手段が受け付けた前記判定結果とが合致しない場合に、前記第2受付手段及び前記第2突合手段を更に動作させる制御を行う制御手段、として機能させるためのプログラムである。
請求項1、2、4、5又は8に係る発明によれば、自動判定の確度で第1突合処理と第2突合処理を使い分ける方式と比べて、人手による判定の工数を低減できる。
請求項3に係る発明によれば、判定手段の判定確度が第2閾値以上であってもその判定手段の判定結果を人間の判定結果と突合する場合と比べて、人手による判定の工数を低減できる。
請求項6又は7に係る発明によれば、第1突合手段による突合の結果が非合致の場合に前記第2受付手段及び前記第2突合手段を動作させるか、別の人の判定結果を受け取るかを選択的に実行する方式よりも、人手による判定の工数を低減することができる。
本実施形態を説明する前に、本実施形態の比較対象となる既存のデータ入力システムの仕組みについて、図6を参照して説明する。
このシステムには、文字列が記載された画像が入力画像として入力される。文字列分類器60は、内蔵する文字認識器62によりその入力画像に対して文字認識を行い、そのとき文字認識器が出力する認識確度Pを用いて、その入力画像の分類を行う。認識確度は、文字認識器62の認識結果のテキストコードがその入力画像に含まれる文字列(手書きの場合もある)を正しく表している確からしさを示す度合いである。認識確度が高いほど、認識結果のテキストコードが正解である(すなわち入力画像中の文字列を正しく表している)蓋然性が高い。ある閾値T1を設定し、認識確度Pがその閾値T1より高いとき(P>T1)は、このシステムは、文字認識器62の認識結果をそのままこのシステムの最終的な認識結果として出力する。これは、図6中に符号Xで示しているパス(処理経路)である。なお、図6には、文字認識器62が3つ表示されているが、これらはすべて同じ1つの文字認識器を示している。図6では、文字列分類器60の分類により分かれる3つのパスでの処理を分かりやすくするために、それらパスでそれぞれ用いられる処理要素をすべて図示した。このため、同一の文字認識器62が複数表示される形となっている。
またこのシステムではT1より低いある閾値T2を設定し、認識確度PがT2以下であるとき(P≦T2)は、パスZに進む。パスZでは、二人のオペレータ(Bさん、Cさん)がその入力画像を読んで認識した文字列をキー入力し、それら入力をシステムのキー入力部72及び74が受け取る。そして、それらBさん、Cさんの入力結果(テキストデータ)を第2突合部76で突合(突き合わせ)し、この突合で両者が合致(一致)すれば、その合致した入力結果を本システムの最終的な認識結果として出力する。その突合でそれら両者が非合致であれば、B、C両名とは別のEさんにその入力画像が示す文字列の入力を求め、その入力をキー入力部78により受け取る。そして、そのEさんの入力を本システムの最終的な認識結果として出力する。
また、認識確度Pが中くらい、すなわちT2≦P<T1の場合は、パスYに進みAさんによる入力画像の認識結果のキー入力をキー入力部64で受け付ける。そして、文字認識器62の認識結果とAさんのキー入力結果を第1突合部66で突合する。突合の結果それら両者が合致すれば、その合致した認識結果をシステムの最終的な認識結果として出力する。両者が非合致(不一致)であれば、Aさんとは別のDさんにその入力画像が示す文字列の入力を求め、その入力をキー入力部68により受け取る。そして、そのDさんの入力を本システムの最終的な認識結果として出力する。
このように、入力画像はX、Y、Zの3つのパスのいずれかにより認識され、入力画像中に含まれる文字列コード”ABC”が得られる。
なお、この仕組みでは、人間の入力者としてA〜Eさんの5人を示しているが、別々の5人が必ずしも必要なわけではない。AさんとDさんは別人、BさんとCさんとEさんとは別人、という条件を満たすならば、5人よりも少なくてもよい。
このように既存システムは、文字認識器62の認識確度が低くなるほど、文字認識器62の認識結果の信頼性が低くなるため、より人間の関与を強くする方式を採っている。
ここで、認識確度はあくまで文字認識器62が行った文字認識の信頼性の推定値にすぎないので、誤差が含まれる。例えば認識確度Pが下の閾値T2以下となると、そのシステムではパスZに進み、文字認識器62の認識結果は用いずに人間の入力のみでデータエントリを行う。しかし、認識確度Pはあくまで推定値なので、認識確度PがT2以下であっても、文字認識器62の認識結果が正解している場合がままある。この場合、文字認識器62の認識結果を用いずその代わりに人間一人の入力を用いるパスZの方式は、人間による入力コストが無駄にかかっていることとなる。
そこで、本実施形態では、文字認識器の認識結果が正解しているにもかかわらずその認識結果がデータ入力に用いられないことによる無駄をなるべく減らす仕組みを提案する。
図1にこの実施形態のデータ入力システムにおける処理の仕組みを示す。図1は、上述の既存システム(図6)との対比で本実施形態の特徴を説明するためのものである。ただし、図1に示した仕組みは、図6の既存例におけるパスY及びZの部分(図6中で破線で囲んだ部分600)に対する改善を示すものであり、パスXは考慮に入れていない。したがって、図1の仕組みにパスXを追加した仕組みも考えられる(これについては後で説明する)。また、図1の仕組みは、文字認識器の認識結果のみをシステムの最終出力とはせず、文字認識器の認識結果は必ず人の認識結果と突合することとしたシステムと捉えてもよい。
このシステムでは、文字認識器12とキー入力部14と第1突合部16とからなる組を文字列分類器10として用いる。すなわち、パスY(特にパスY1)とパスZとの振り分けを、文字認識器12の認識結果と人間の認識結果との突合結果に基づいて行う。人間による文字認識は、一般にOCR技術を用いた文字認識器よりもはるかに認識精度が高いので、両者の認識結果が合致(一致)すれば、それら認識結果は正解である蓋然性が非常に高い。逆に、利用者が非合致であれば、文字認識器が誤っている蓋然性が高い。図1には、文字列分類器10として、破線のブロックと実線のブロックの2つが示されているが、これらは同じ1つのものである。
すなわち、このシステムでは、入力画像を必ず文字認識器12と一人の人間(仮にAさんとする)に提示し、文字認識器12によるその入力画像の文字認識結果を得ると共に、その入力画像に対するAさんの認識結果をキー入力部14にて受け取る。そして、それら両者の認識結果を第1突合部16で突合し、この突合の結果それら両者の一致(合致)が見られた場合には、その一致した認識結果を本システムの最終的に認識結果として出力する(図中のパスY1)。
一方、第1突合部16の突合で、文字認識器12の認識結果とキー入力部14に入力されたAさんの認識結果が不一致(非合致)の場合は、以降の処理を所定の基準に従って図示のパスY2又はパスZに割り振る。
図1に示す仕組みのポイントは、パスY(特にY1)とパスZとの間の割り振り(分類)の基準に文字認識器12の認識確度Pを用いず、その代わりに第1突合部16の突合結果を用いた点にある。すなわち、図1の仕組みでは、認識確度Pが非常に低い(P≦T2)場合でも、第1突合部16の突合で文字認識器12の認識結果とAさんの認識結果とが一致していれば、その一致した認識結果を最終出力する。すなわち、認識確度Pが低くても、文字認識器12の認識結果が正しい場合には、人間の入力は一人分で済む。これに対し、図6に示した既存システムでは、認識確度Pが非常に低い場合、文字認識器の認識結果を用いずに、必ず二人の人の認識結果を突合するので、図1の仕組みよりも人手の工数が余計にかかる。このように、図1の仕組みでは、図6の既存システムでは認識確度に応じてパスZ(人間二人必要)に割り振っていた入力画像の一部をパスY(人間は一人でよい)に割り振ることで、人手工数の削減がなされる。
また、図1の仕組みでは、文字列分類器10の役割のために、少なくとも一人の人(Aさん)の認識結果の入力を必ず受け付けることとしているので、この一人の入力をパスZで突合する二人の認識結果のうちの一つとして流用する。すなわち、第2突合部24は、キー入力部14が受け取ったAさんの認識結果と、キー入力部22が受け取ったAさんとは別のBさんの認識結果とを突合する。そして、第2突合部24は、その突合処理でAさんとBさんの認識結果が合致した場合には、その認識結果をシステムの最終的な処理結果として出力する。AさんとBさんの認識結果が第2突合部24で非合致であった場合は、AさんともBさんとも異なるDさんによるその入力画像の認識結果をキー入力部26で受け取り、そのDさんの認識結果をシステムの最終的な認識結果として出力する。
以上では、第1突合部16で非合致となった場合の、パスY2とパスZとの間での認識処理の割り振り(分類)については説明しなかったが、これにはいくつかの方式がある。一つの例は、その入力画像に対する文字認識器12の認識確度Pを用いて割り振りを行う方式であり、これは図6の既存システムの考え方に似ている。すなわち、この方式では、文字列分類器10は、認識確度Pがある閾値T2より大きい場合には認識処理をパスY2に割り振り、認識確度PがT2以下の場合は認識処理をパスZに割り振る。パスY2では、Aさんとは異なるCさんのその入力画像に対する認識結果をキー入力部18により受け取り、この認識結果をシステムの最終的な認識結果として出力する。
このように文字認識器12の認識確度Pに基づいてパスの割り振りを行うことが有効な理由は以下の通りである。
まず「前提」として、図6の既存誌システムではパスX、Y、Zへの割り振りを決定する閾値T1、T2を、人と文字認識器62の出力を含めた最終的な認識精度が所定の精度以上となるように設定しているとする。すなわち、これら閾値は、第2突合部76の突合が非合致となった場合のDさんやEさんの誤入力率も勘案して決められている。
図1のシステムで、第1突合部16にて文字認識器とAさんの認識結果同士の突合結果が非合致となった場合を考える。
まず、第1突合部16の突合結果が非合致の場合に全てパスY2に進むとしたケースを取り上げる。パスY2では、Cさんの入力がそのままシステムの最終出力となる。このとき、文字認識器の認識精度は人一人分より悪いので、Cさんが入力する割合がパスZよりも多くなる。Cさんの誤入力率が存在しているので、全てパスZに行ったとき(すなわち人のダブルエントリ時)よりも、最終的な入力精度が悪くなる。
次に、第1突合部16の突合結果が非合致の場合に全てパスZに行くケースを考える。このとき、文字認識器12の認識精度が人のシングルエントリより良い場合(すなわちパスYで済む場合)も、パスZに行くことになるので、所定の精度を実現する工数を必要以上に要することになる。
上記2つのケースを考えると、所定の精度を実現するように、上記2つのケース(すなわち、全部パスY2に行くケースと全部パスZに行くケース)の中間の割合で、パスY2とパスZとにパスを振り分けるところに最適解が存在することになる。最適解は、最終的な入力精度を所定の精度以上にするという条件下で、できるだけパスY2が多くなるように配分するケースである。
上述した「前提」より、認識確度PがパスYへ振り分ける範囲の値である場合(すなわち認識確度P>T2の場合)、閾値T2はパスYの精度が所定の精度以上になるように設定されている。したがって、文字認識器12とAさんの認識結果同士の突合の結果が非合致となった場合に、認識確度P>T2のときにパスY2に配分することで、最終的な入力精度を所定の精度以上にすることができる。
このように、システム全体として所定の精度を達成するには、既存システム(図6)でパスYとZとの間での振り分けに用いた閾値T2を、パスY2とZとの振り分けにもちいればよいことが分かる。
ただし、パスY2もパスZも文字認識器12の認識結果を用いないことからも分かるように、パスY2とパスZとの振り分けを文字認識器12の認識確度Pと閾値T2との比較に基づき行うことは、技術的にみて本質的なことではない。上に例示した認識確度Pと閾値T2との比較に基づく振り分けと同じ割合でパスY2もパスZとの間で振り分けができるのであれば、別の方法を用いてもよい。
例えば上に例示した認識確度Pと閾値T2との比較に基づき振り分ける方式でのパスY2とパスZとの振り分けの割合が統計的に分かるのであれば、その割合が達成されるようそれら両者間の振り分けを行えばよい。これには、例えば、第1突合部16で非合致と判定された入力画像をある程度の数になるまでいったん蓄積しておき、その蓄積した入力画像を、パスY2とパスZにその割合で振り分ければよい。また別の方法として、パスY2とパスZとの間の振り分けがその割合となるように、第1突合部16で非合致と判定されるごとに乱数を用いて振り分けを行ってもよい。
また、認識確度Pと閾値T2との比較に基づく場合と同じ割合で振り分けを行う代わりに、ユーザが予め定めた割合でパスY2とZの振り分けを行ってもよい。
また、システム全体の誤り率の目標値を達成する振り分け方式として、次の方式を用いてもよい。
すなわち、この方式では、パスY2のCさんの誤り率がαであるとし、パスZ全体の場合の誤り率をβとする。また、図1のシステムに入力される(すなわちパスYかZのいずれかに進む)入力画像の総数をNとする(あるいは、入力の数がN個溜まった時点で振り分けを行うとする)。ここで入力画像の数とは、認識する文字列の数、あるいは、認識する文字枠の数などを考える。またここでは、第1突合部16、第2突合部24の突合で合致した認識結果には誤りが無いと仮定する。
入力画像の総数Nの中で、第1突合部16の突合結果が非合致となる認識結果の個数がM個であるとする。またシステム全体の最終的な誤り率の目標値をγとする。この場合、システム全体の最終の誤り個数の目標値は最大でγN個となる。
ここで、第1突合部16の突合結果が非合致となる認識結果M個のうち、パスY2に配分される数をQ個とする。Cさんの誤り率がαなので、パスY2の誤り数はαQとなる。第1突合部16の突合結果が合致の場合は全て正解とカウントされるので、パスY1とY2をあわせたパスY全体の誤り数もαQである。またパスZ全体の誤り率はβなので、パスZ全体の誤り数はβ(M−Q)となる。
システム全体での誤り率を目標値γ以下とするには、次の関係式が成り立てばよい
αQ+β(M−Q)≦γN ・・・(1)
この式(1)をQについて解くと以下のようになる。
Q≦(γN−βM)/(α−β) ・・・(2)
式(2)を満たすよう、第1突合部16の突合結果が非合致となったM個のうちパスY2に振り分ける入力画像の数を制御することで、システム全体の目標認識率が達成される。なお、式(2)でQが右辺と等しくなる場合が、システム全体の人手工数が最小となる最適解である。
次に、図1の方式を実現する装置構成の一例を、図2を参照して説明する。図2に示す例は、パスY2とZの振り分けを文字認識器12の認識確度Pに基づき行う場合の例である。
その装置構成では、まず認識対象である入力画像が、文字認識器12とAさんの端末とに入力される。文字認識器12は、その入力画像に対して文字認識処理を実行し、これにより得られた認識結果Rと認識確度Pを第1突合部16に渡す。文字認識器12が行う文字認識の手法や認識確度の算出方法は特に限定されず、特許文献4〜9に例示したものを初めとする従来手法や今後開発される手法のうちいずれを用いてもよい。
またAさんの端末は、図2に示した装置と例えばインターネットを介して接続されているものでよく、この場合、入力画像を表示したり、その入力画像の認識結果の入力を受け付けたりする機構は、例えばウェブサービスの形でキー入力部14からその端末に提供される。Aさんは、端末に表示された入力画像を認識し、その入力画像が示す文字列を端末のキーボードから入力する。キー入力部14は、Aさんが入力した文字列データをその端末から受け取り、第1突合部16に渡す。
第1突合部16は、文字認識器12の認識結果RとAさんの入力した文字列とを突合する。この突合処理でそれら両者が合致した場合、その認識結果R(これはAさんの認識結果でもある)を、この装置の最終的な認識結果として出力する。また、突合処理でそれら両者が非合致であった場合、第1突合部16は、振り分け処理部17に、今回の認識対象の入力画像の識別情報、その入力画像に対するAさんの入力データ、及び認識確度Pを渡して、処理の振り分けを依頼する。
振り分け処理部17は、認識確度Pが予め設定された閾値T2より大きい場合、処理をパスY2に振り分ける。すなわち、振り分け処理部17は、文字列分類器10の分類機能を担う。
図2の例では、振り分け処理部17は、認識確度Pが閾値T2より大きい場合、パスY2を選択し、キー入力部18に入力画像の識別情報を渡す。キー入力部18は、予め登録されているCさんの端末にその識別情報に対応する入力画像を提供し、これに対してCさんが入力した文字列のデータを受け取り、そのデータをその入力画像に対する本システムの最終的な認識結果として出力する。
また振り分け処理部17は、認識確度Pが閾値T2以下の場合は、パスZを選択し、キー入力部22に入力画像の識別情報を渡すと共に、第2突合部24にAさんの入力データを渡す。キー入力部22は、予め登録されているBさんの端末にその識別情報に対応する入力画像を提供し、これに対してBさんが入力した文字列データを受け取り、そのデータを第2突合部24に渡す。第2突合部24は、Aさんの入力データとBさんの入力データを突合し、その結果両者が合致していれば、その合致した入力データをその入力画像に対する本システムの最終的な認識結果として出力する。一方、第2突合部24の突合で両者が非合致であった場合、キー入力部26が、Aさん及びBさんのいずれとも異なる予め登録されたDさんの端末にその識別情報に対応する入力画像を提供し、これに対してDさんが入力した文字列のデータを受け取り、そのデータを本システムの最終的な認識結果として出力する。
図2の例では、振り分け処理部17は後段のパスの振り分けを認識確度Pに対する閾値処理に基づき行ったが、上述したように認識確度Pを用いずにある割合でパスの振り分けを行ってもよい。
次に図3を参照して、図2の装置構成の変形例を説明する。
上述した図2の例において、キー入力部18に登録されたCさんの満たすべき条件はAさんと異なる人であるということであり、キー入力部22に登録されたBさんの満たすべき条件は、Aさんと異なる(かつDさんとも異なる)人であるということである。したがって、BさんとCさんが同一人であっても、それら条件は満たされる。図3の変形例は、BさんとCさんを同一人とした場合に採用可能な、簡略化された装置構成の例である。
以下、図3の例において、図2の例と異なる部分を説明する。この例では、第1突合部16は、自分が行った突合結果が非合致の場合、第2突合部24にAさんの入力データを渡すと共に、キー入力部22Aに入力画像の識別情報を渡す。キー入力部22Aは、予め登録されているBさんの端末にその識別情報に対応する入力画像を提供し、これに対してBさんが入力した文字列のデータ(このデータは図2の例でのCさんの入力データも兼ねる)を受け取る。キー入力部22Aは、そのデータを第2突合部24に渡す。
第2突合部24は、第1突合部16から受け取ったAさんの入力データと、キー入力部22Aから受け取ったBさんの入力データとを突合する。この突合の結果、それら両者の入力データが合致した場合、その合致した入力データがこのシステムの最終的な認識結果として出力される。一方、その突合の結果が非合致であった場合、第2突合部24は、入力画像の識別情報及びBさんの入力データ(必要ならば更に認識確度P)を振り分け処理部17Aに渡す。
振り分け処理部17Aは、後段のパスY2とパスZの振り分けを行う。この振り分けは、図2の例と同様認識確度Pに基づいて行ってもよいし、上述したようにある割合を満たすように行ってもよい。例えば認識確度Pに基づき振り分ける場合は、認識確度Pが閾値T2より大きければパスY2を選択し、Bさんの入力データ(これは図2の例のCさんの入力データに該当)を最終的な認識結果として出力し(パスY2)、認識確度Pが閾値T2以下であれば、キー入力部26でDさんの入力データを受け取り、この入力データを最終的な認識結果として出力する(パスZ)。
図3の例では、第1突合部16の突合結果が非合致の場合、必ず第2突合部24で入力データの突合が行われるので、2回の突合を行う分、入力データが正しいかどうかより正確に判定でき、パスZに進む数が減る可能性がある。パスZに進む数が減れば、その分Dさんの入力のためのコストが削減される。
次に、図4を参照して、更なる変形例を説明する。図4の例は、図2の例からパスY2をなくし、第1突合部16の突合結果が非合致の場合に必ずパスZに進むこととした構成である。
以下、図4の例において、図2の例と異なる部分を説明する。この例では、第1突合部16は、自分が行った突合結果が非合致の場合、第2突合部24にAさんの入力データを渡すと共に、キー入力部22に入力画像の識別情報を渡す。キー入力部22は、予め登録されているBさんの端末にその識別情報に対応する入力画像を提供し、これに対してBさんが入力した文字列のデータを受け取る。キー入力部22は、そのデータを第2突合部24に渡す。
第2突合部24は、第1突合部16から受け取ったAさんの入力データと、キー入力部22から受け取ったBさんの入力データとを突合する。この突合の結果、それら両者の入力データが合致した場合、その合致した入力データがこのシステムの最終的な認識結果として出力される。一方、その突合の結果が非合致であった場合、第2突合部24は、キー入力部26に入力画像の識別情報を渡す。キー入力部26は、Aさん及びBさんのいずれとも異なる予め登録されたDさんの端末にその識別情報に対応する入力画像を提供し、これに対してDさんが入力した文字列のデータを受け取り、そのデータを本システムの最終的な認識結果として出力する。
上述した図2の例でのCさん及びDさんの入力は、他の認識結果との突合を経ることなく、そのままシステムの最終的な認識結果として出力される。このためCさん及びDさんの入力のシステム全体の認識率(正解率)に与える影響は、AさんやBさん(これらの入力は、他の認識結果と突合される)より高い。システム全体の認識率の目標値を達成するためには、Cさん及びDさんは、AさんやBさんより時間を掛けて慎重に入力を行うか、あるいはAさんやBさんより熟練度が高い人である必要がある。このように、CさんやDさんの入力コストは、AさんやBさんより高いといえる。
図4の例では、第1突合部16の突合結果が非合致の場合、Cさんが入力するパス(パスY2)を省いたが、その代わりに必ずBさんが入力することとなる。この場合でも、Bさんの入力コストはCさんのそれより低いので、システム全体の人手入力コストは図2の例より低くなる。
次に、図5を参照して、更なる変形例を説明する。図5の例は、図2の例に対して、図6の既存システムにおけるパスXに対応する構成、すなわち振り分け処理部13を追加したものである。
図5の例では、文字認識器12が出力した認識結果Rと認識確度Pは、振り分け処理部13に入力される。振り分け処理部13は、受け取った認識確度Pが閾値T1(ただしT1>T2)より大きい場合、文字認識器12の認識結果Rをシステムの最終的な認識結果として出力する。また、振り分け処理部13は、認識確度Pが閾値T1以下である場合、その認識結果Rを第1突合部16に入力する。第1突合部16以降の処理の流れ及びそのための装置構成は、図2に示したものと同じである。
このように、図1及び図2に示した構成は、認識確度Pが非常に高い範囲では文字認識器12の認識結果をそのまま最終的な出力とする装置構成にも適用可能である。
以上、本発明の実施形態及びその変形例について説明したが、これら実施形態及び変形例はあくまで例示的なものにすぎず、本発明の範囲内で様々な変更が可能である。
例えば、以上に説明した実施形態及び変形例は、いずれも、入力画像中の文字列を認識するものであったが、上記実施形態及び変形例の手法は、文字認識に限らず、入力されたデータの内容を判定してその判定結果を出力する情報処理装置又はシステム全般に適用可能である。すなわち、入力されたデータの内容に対して、機械の判定手段(その一例が文字認識器12)及び人間が何らかの判定を行い、それら判定手段及び人間の判定の結果を総合して装置またはシステム全体の判定結果を決定するもの一般に、上記実施形態及び変形例の手法は適用可能である。
以上に例示した実施形態及び変形例の装置又はシステムは、一つの例ではハードウエアの論理回路として構成可能である。また、別の例として、実施形態及び変形例の装置又はシステムは、例えば、内蔵されるコンピュータにそれらシステムまたは装置内の各機能モジュールの機能を表すプログラムを実行させることにより実現してもよい。ここで、コンピュータは、例えば、ハードウエアとして、CPU等のプロセッサ、ランダムアクセスメモリ(RAM)およびリードオンリメモリ(ROM)等のメモリ(一次記憶)、HDD(ハードディスクドライブ)を制御するHDDコントローラ、各種I/O(入出力)インタフェース、ローカルエリアネットワークなどのネットワークとの接続のための制御を行うネットワークインタフェース等が、たとえばバスを介して接続された回路構成を有する。また、そのバスに対し、例えばI/Oインタフェース経由で、CDやDVDなどの可搬型ディスク記録媒体に対する読み取り及び/又は書き込みのためのディスクドライブ、フラッシュメモリなどの各種規格の可搬型の不揮発性記録媒体に対する読み取り及び/又は書き込みのためのメモリリーダライタ、などが接続されてもよい。上に例示した各機能モジュールの処理内容が記述されたプログラムがCDやDVD等の記録媒体を経由して、又はネットワーク等の通信手段経由で、ハードディスクドライブ等の固定記憶装置に保存され、コンピュータにインストールされる。固定記憶装置に記憶されたプログラムがRAMに読み出されCPU等のプロセッサにより実行されることにより、上に例示した機能モジュール群が実現される。また、実施形態及び変形例の装置又はシステムは、ソフトウエアとハードウエアの組合せで構成されてもよい。
10 文字列分類器、12 文字認識器、13,17,17A 振り分け処理部、14,18,22,22A,26 キー入力部、16 第1突合部、24 第2突合部、60 文字列分類器、62 文字認識器、64,72,74,78 キー入力部、66 第1突合部、76 第2突合部。
Claims (8)
- 入力情報に対して判定を行って判定結果を出力する判定手段と、
前記入力情報に対する第1の人による判定結果の入力を受け付ける第1受付手段と、
前記入力情報に対する第2の人による判定結果の入力を受け付ける第2受付手段と、
前記入力情報に対する第3の人による判定結果の入力を受け付け、当該判定結果を最終的な出力として出力する第3受付手段と、
前記判定手段が出力した判定結果と前記第1受付手段が受け付けた判定結果とを突合し、それら判定結果同士が合致する場合に当該合致する判定結果を最終的な出力として出力する第1突合手段と、
前記第1受付手段が受け付けた判定結果と前記第2受付手段が受け付けた判定結果とを突合し、それら判定結果同士が合致する場合に、当該合致する判定結果を最終的な出力として出力する第2突合手段と、
前記入力情報が入力された場合に、前記判定手段、前記第1受付手段及び前記第1突合手段を動作させ、前記第1突合手段による突合において前記判定手段による前記判定結果と前記第1受付手段が受け付けた前記判定結果とが合致しない場合、更に、前記第2受付手段及び前記第2突合手段からなる組と、前記第3受付手段と、のうちの一方を選択的に動作させるよう制御する制御手段と、
を含む情報処理装置。 - 入力情報に対する前記判定手段の判定確度を算出する手段を更に含み、
前記制御手段は、前記第1突合手段による突合において前記判定手段による前記判定結果と前記第1受付手段が受け付けた前記判定結果とが合致しない場合、前記判定確度が第1閾値以上であれば前記第3受付手段を動作させ、前記判定確度が前記第1閾値未満であれば前記第2受付手段及び前記第2突合手段を動作させる、ことを特徴とする請求項1に記載の情報処理装置。 - 前記制御手段は、
前記判定確度が前記第1閾値より大きい第2閾値以上である場合は前記判定手段の判定結果を最終的な出力とし、
前記判定確度が前記第2閾値未満である場合は、前記判定手段、前記第1受付手段及び前記第1突合手段を動作させ、
前記第1突合手段による突合において前記判定手段による前記判定結果と前記第1受付手段が受け付けた前記判定結果とが合致しない場合には、前記判定確度が前記第2閾値未満かつ前記第1閾値以上であれば前記第3受付手段を動作させ、前記判定確度が前記第1閾値未満であれば前記第2受付手段及び前記第2突合手段を動作させる制御を行う、
ことを特徴とする請求項2に記載の情報処理装置。 - コンピュータを、
入力情報に対して判定を行って判定結果を出力する判定手段、
前記入力情報に対する第1の人による判定結果の入力を受け付ける第1受付手段、
前記入力情報に対する第2の人による判定結果の入力を受け付ける第2受付手段、
前記入力情報に対する第3の人による判定結果の入力を受け付け、当該判定結果を最終的な出力として出力する第3受付手段、
前記判定手段が出力した判定結果と前記第1受付手段が受け付けた判定結果とを突合し、それら判定結果同士が合致する場合に当該合致する判定結果を最終的な出力として出力する第1突合手段、
前記第1受付手段が受け付けた判定結果と前記第2受付手段が受け付けた判定結果とを突合し、それら判定結果同士が合致する場合に、当該合致する判定結果を最終的な出力として出力する第2突合手段、
前記入力情報が入力された場合に、前記判定手段、前記第1受付手段及び前記第1突合手段を動作させ、前記第1突合手段による突合において前記判定手段による前記判定結果と前記第1受付手段が受け付けた前記判定結果とが合致しない場合、更に、前記第2受付手段及び前記第2突合手段からなる組と、前記第3受付手段と、のうちの一方を選択的に動作させるよう制御する制御手段、
として機能させるためのプログラム。 - 入力情報に対して判定を行って判定結果を出力する判定手段と、
前記入力情報に対する第1の人による判定結果の入力を受け付ける第1受付手段と、
前記入力情報に対する第2の人による判定結果の入力を受け付ける第2受付手段と、
前記判定手段が出力した判定結果と前記第1受付手段が受け付けた判定結果とを突合し、それら判定結果同士が合致する場合に当該合致する判定結果を最終的な出力として出力する第1突合手段と、
前記第1受付手段が受け付けた判定結果と前記第2受付手段が受け付けた判定結果とを突合し、それら判定結果同士が合致する場合に、当該合致する判定結果を最終的な出力として出力する第2突合手段と、
前記入力情報が入力された場合に前記判定手段、前記第1受付手段及び前記第1突合手段を動作させ、前記第1突合手段による突合において、前記判定手段による前記判定結果と前記第1受付手段が受け付けた前記判定結果とが合致しない場合に、前記第2受付手段及び前記第2突合手段を更に動作させる制御を行う制御手段と、
を含む情報処理装置。 - 前記入力情報に対する第3の人による判定結果の入力を受け付け、当該判定結果を最終的な出力として出力する第3受付手段、を更に含み、
前記制御手段は、前記第2突合手段による突合において、前記第1受付手段が受け付けた前記判定結果と前記第2受付手段が受け付けた前記判定結果とが合致しない場合に、前記第2受付手段が受け付けた前記判定結果を最終的な出力として出力する処理と、前記第3受付手段を動作させる処理と、を選択的に実行する、請求項5に記載の情報処理装置。 - 前記入力情報に対する第3の人による判定結果の入力を受け付け、当該判定結果を最終的な出力として出力する第3受付手段、を更に含み、
前記制御手段は、前記第2突合手段による突合において、前記第1受付手段が受け付けた前記判定結果と前記第2受付手段が受け付けた前記判定結果とが合致しない場合に、前記第3受付手段を動作させる、請求項5に記載の情報処理装置。 - コンピュータを、
入力情報に対して判定を行って判定結果を出力する判定手段、
前記入力情報に対する第1の人による判定結果の入力を受け付ける第1受付手段、
前記入力情報に対する第2の人による判定結果の入力を受け付ける第2受付手段、
前記判定手段が出力した判定結果と前記第1受付手段が受け付けた判定結果とを突合し、それら判定結果同士が合致する場合に当該合致する判定結果を最終的な出力として出力する第1突合手段、
前記第1受付手段が受け付けた判定結果と前記第2受付手段が受け付けた判定結果とを突合し、それら判定結果同士が合致する場合に、当該合致する判定結果を最終的な出力として出力する第2突合手段、
前記入力情報が入力された場合に前記判定手段、前記第1受付手段及び前記第1突合手段を動作させ、前記第1突合手段による突合において、前記判定手段による前記判定結果と前記第1受付手段が受け付けた前記判定結果とが合致しない場合に、前記第2受付手段及び前記第2突合手段を更に動作させる制御を行う制御手段、
として機能させるためのプログラム。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018113013A JP2019215747A (ja) | 2018-06-13 | 2018-06-13 | 情報処理装置及びプログラム |
US16/159,259 US10817756B2 (en) | 2018-06-13 | 2018-10-12 | Information processing apparatus and non-transitory computer readable medium |
CN201811546887.9A CN110598683B (zh) | 2018-06-13 | 2018-12-18 | 信息处理装置、信息处理方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018113013A JP2019215747A (ja) | 2018-06-13 | 2018-06-13 | 情報処理装置及びプログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2019215747A true JP2019215747A (ja) | 2019-12-19 |
Family
ID=68840076
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018113013A Pending JP2019215747A (ja) | 2018-06-13 | 2018-06-13 | 情報処理装置及びプログラム |
Country Status (3)
Country | Link |
---|---|
US (1) | US10817756B2 (ja) |
JP (1) | JP2019215747A (ja) |
CN (1) | CN110598683B (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11558539B2 (en) * | 2019-03-13 | 2023-01-17 | Smart Supervision System LLC | Systems and methods of detecting and identifying an object |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2016212812A (ja) * | 2015-05-14 | 2016-12-15 | 富士ゼロックス株式会社 | 情報処理装置及び情報処理プログラム |
Family Cites Families (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0772906B2 (ja) | 1991-07-10 | 1995-08-02 | 富士ゼロックス株式会社 | 文書認識装置 |
JPH0540853A (ja) | 1991-08-06 | 1993-02-19 | Oki Electric Ind Co Ltd | 文字認識結果の後処理方式 |
JPH05290169A (ja) | 1992-04-07 | 1993-11-05 | Yamatake Honeywell Co Ltd | ファジィパターン認識装置 |
US5455872A (en) * | 1993-04-26 | 1995-10-03 | International Business Machines Corporation | System and method for enhanced character recogngition accuracy by adaptive probability weighting |
JPH08101880A (ja) | 1994-09-30 | 1996-04-16 | Ricoh Co Ltd | 文字認識装置 |
JP3469375B2 (ja) | 1995-11-13 | 2003-11-25 | 株式会社リコー | 認識結果の確信度決定方法及び文字認識装置 |
JP2983897B2 (ja) | 1996-03-19 | 1999-11-29 | 三洋電機株式会社 | 認識結果の評価方法および認識装置 |
JPH11110488A (ja) * | 1997-10-02 | 1999-04-23 | Ricoh Co Ltd | 文字認識方法および記録媒体 |
JP2008020506A (ja) | 2006-07-11 | 2008-01-31 | Fuji Xerox Co Ltd | 画像処理装置および画像処理プログラム |
JP4743065B2 (ja) * | 2006-09-27 | 2011-08-10 | ブラザー工業株式会社 | 画像認識装置、複写装置及び画像認識方法 |
WO2009013818A1 (ja) * | 2007-07-25 | 2009-01-29 | Fujitsu Limited | 文字認識処理方法及び装置 |
JP4362528B2 (ja) * | 2007-09-10 | 2009-11-11 | シャープ株式会社 | 画像照合装置、画像照合方法、画像データ出力処理装置、プログラム、及び記録媒体 |
JP4982587B2 (ja) | 2010-05-07 | 2012-07-25 | 株式会社東芝 | データエントリシステムおよびデータエントリ方法 |
JP2012003407A (ja) * | 2010-06-15 | 2012-01-05 | Sony Corp | 情報処理装置、同一性判定システム、同一性判定方法およびコンピュータプログラム |
JP2013101501A (ja) * | 2011-11-08 | 2013-05-23 | Sharp Corp | 照合装置、照合装置の制御方法、入力装置、試験システム、制御プログラム、および記録媒体 |
JP6361387B2 (ja) * | 2014-09-05 | 2018-07-25 | オムロン株式会社 | 識別装置および識別装置の制御方法 |
-
2018
- 2018-06-13 JP JP2018113013A patent/JP2019215747A/ja active Pending
- 2018-10-12 US US16/159,259 patent/US10817756B2/en active Active
- 2018-12-18 CN CN201811546887.9A patent/CN110598683B/zh active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2016212812A (ja) * | 2015-05-14 | 2016-12-15 | 富士ゼロックス株式会社 | 情報処理装置及び情報処理プログラム |
Also Published As
Publication number | Publication date |
---|---|
US20190385008A1 (en) | 2019-12-19 |
CN110598683B (zh) | 2023-08-08 |
US10817756B2 (en) | 2020-10-27 |
CN110598683A (zh) | 2019-12-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US6738519B1 (en) | Character recognition apparatus | |
US20110243445A1 (en) | Detecting position of word breaks in a textual line image | |
US7136526B2 (en) | Character string recognition apparatus, character string recognizing method, and storage medium therefor | |
US20040117192A1 (en) | System and method for reading addresses in more than one language | |
US8170290B2 (en) | Method for checking an imprint and imprint checking device | |
US6038343A (en) | Character recognition method and apparatus using writer-specific reference vectors generated during character-recognition processing | |
JP2019215747A (ja) | 情報処理装置及びプログラム | |
US9811726B2 (en) | Chinese, Japanese, or Korean language detection | |
CN111476073B (zh) | 信息处理装置、记录媒体及信息处理方法 | |
CN111476240B (zh) | 信息处理装置、记录媒体及信息处理方法 | |
JP2019164687A (ja) | 情報処理装置 | |
US20230419701A1 (en) | Method, System and Apparatus for Processing Candidate Strings Detected in an Image | |
JP6801741B2 (ja) | 情報処理装置及び情報処理プログラム | |
US20240046680A1 (en) | Machine learning (ml)-based system and method for correcting image data | |
JP7147208B2 (ja) | 情報処理装置及びプログラム | |
JP2018060474A (ja) | 地名抽出プログラム、地名抽出装置および地名抽出方法 | |
KR20170032565A (ko) | 우편번호 오인식 진단 장치 및 방법 | |
JP3788703B2 (ja) | 投票用紙計数仕分け装置および投票用紙計数仕分け装置のプリセット装置およびその方法並びに投票用紙計数仕分け装置のプリセットプログラムを記録した媒体 | |
JP2023170853A (ja) | 学習装置、文字認識システム、学習方法、及びプログラム | |
JP2000207491A (ja) | 文字列読取方法及び装置 | |
CN116311321A (zh) | 一种基于ocr自动识别的双录作业模式识别方法 | |
JPH1011541A (ja) | 文字認識装置 | |
JP2002074262A (ja) | 認識文字修正方法 | |
JP2002150222A (ja) | 文字認識方法 | |
JP2004258950A (ja) | 文字認識方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210524 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20220421 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220517 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20221115 |