JP2021068202A

JP2021068202A - 情報処理装置及びプログラム

Info

Publication number: JP2021068202A
Application number: JP2019193249A
Authority: JP
Inventors: 木村　俊一; Shunichi Kimura; 俊一木村; 越　裕; Yutaka Koshi; 裕越; 関野　雅則; Masanori Sekino; 雅則関野; 久保田　聡; Satoshi Kubota; 聡久保田
Original assignee: Fuji Xerox Co Ltd
Current assignee: Fujifilm Business Innovation Corp
Priority date: 2019-10-24
Filing date: 2019-10-24
Publication date: 2021-04-30
Also published as: US20210124991A1; US11537812B2; CN112712083A

Abstract

【課題】２つの認識器の認識結果が合致した場合でも、認識確度が低い場合は、その合致した認識結果が正解でない場合が少なくなく、装置の正解率が下がる可能性がある。【解決手段】突合部１０は、２つのＯＣＲ１及び２による入力画像データ５０に対するＯＣＲ結果１及び２を突合する。突合にて、ＯＣＲ結果１と２が合致したことが分かった場合、突合部１０は、ＯＣＲ１からＯＣＲ結果１に対応づけて取得した認識確度１を閾値比較部１２に渡す。閾値比較部１２は、認識確度１を所定の閾値１と比較する。後段処理部１６は、認識確度１が閾値１より大きければ、ＯＣＲ結果１を最終結果として出力し、そうでなければＯＣＲ結果１をリジェクトする。【選択図】図１

Description

本発明は、情報処理装置及びプログラムに関する。

対象データを第１の認識器と第２の認識器に認識させ、それら２つの認識器の認識結果同士を突合し、両者が合致した場合にはその合致した認識結果を最終的なものとして出力とし、両者が合致しなかった場合には、人が介入して確認作業や修正作業を行うことにより最終的な認識結果として出力する装置がある。

特許文献１に記載された装置は、データの記入されたフォーム（帳票）を電子画像フォームとして読み取る画像読取手段と、読み取った電子画像フォームを性質の異なる、すなわち、誤認識を共通にしない或いは共通にすることの少ない２種類（以上）のＯＣＲエンジンでＯＣＲ認識するＯＣＲ認識手段と、認識結果が一致した文字は自動的にデータベースへ保存し、一致しない文字及び一致してもいずれか一方のＯＣＲエンジンの認識の信頼性の低い文字は確認修正後にデータベースへ保存するデータベース保存手段と、を備える。

また、紙帳票に手書き記入または印刷された文字列をデジタルデータ化するデータ入力システムがある。データ入力システムは、帳票中を人間が読み取ってキー入力する方式、光学文字認識（ＯＣＲ）技術を用いた文字認識器により帳票中の画像に対して文字認識処理を行う方式、あるいはこれらの組合せにより帳票中の文字列をデジタル化する。

文字認識器は、実行した認識処理の処理結果がどの程度信頼できるかを示す度合いを出力する機能を持つことが多い。この度合いは認識の確度又は確信度（以下、認識確度、又は単に、確度、という）と呼ばれる。

文字認識器以外にも、入力画像に対して何らかの自動判定を行う手段はあり、そのような自動判定手段の中には、実行した判定の確度を出力するものがある。

特許文献２に開示された方法は、入力された帳票上の画像に対し文字認識を行ない、その文字認識結果としての類似度を得て、この得られた類似度とあらかじめ登録された当該文字認識に要求する確信度とを比較し、この比較の結果に基づき文字認識結果に対し人手によるベリファイ処理を必要としない出力を行なうか、あるいは、上記比較の結果に基づき文字認識結果に対し文字認識候補の選択肢を提示して人手によるベリファイ処理を促す出力を行なうか、あるいは、上記比較の結果に基づき文字認識結果に対し人手による新規入力および確定を提示して手入力処理を促す出力を行なう。

また、認識器の確度を用いる従来技術として、更に特許文献３及び４がある。

また、複数の認識器の突合を用いて認識を制御する従来技術として、更に特許文献５がある。

特開２０１０−０７３２０１号公報特開２０１６−２１２８１２号公報特開２０００−２５９８４７号公報特開２００３−３４６０８０号公報特開２００１−０８４３３６号公報

１つの対象画像を２つの認識器で認識した結果が合致した場合でも、認識した結果の認識確度が低い場合は、その合致した認識結果を出力した出力結果は人が確認した場合である正解とは異なる場合があり、認識器の認識結果を正解と認めてよいかがわからない。その場合に全ての出力結果を人が確認すればよいが、人の作業量が増えてしまう。
このため、本発明では、人の作業量を抑制しつつ、情報処理装置が出力する出力結果の正解を増加させることを目的とする。

請求項１に係る発明は、プロセッサを備え、前記プロセッサは、第１の認識器から、対象データに対する第１の認識結果及び第１の認識確度を取得し、第２の認識器から、前記対象データに対する第２の認識結果及び第２の認識確度を取得し、前記第１の認識結果と前記第２の認識結果との突合を実行し、前記突合の結果、前記第１の認識結果と前記第２の認識結果とが合致した場合に第１制御を実行し、前記第１制御は、前記第１の認識確度及び前記第２の認識確度の少なくとも一方に基づいて、合致した認識結果に対して第１の処理と第２の処理のいずれかを実行して処理結果を出力する処理であり、前記第１の処理のために必要な人の作業量は、前記第２の処理のために必要な人の作業量よりも少ないことを特徴とする、情報処理装置である。

請求項２に係る発明は、前記第１制御では、前記第１の認識確度が閾値より高い場合には、合致した前記認識結果に対して前記第１の処理を実行し、前記第１の認識確度が前記閾値以下の場合には、合致した前記認識結果に対して前記第２の処理を実行する、
請求項１に記載の情報処理装置である。

請求項３に係る発明は、前記プロセッサは、更に、前記突合を実行する前に、前記第１の認識確度が、前記閾値より高い第２の閾値よりも高い場合には、前記第１の認識結果に対して前記第１の処理を実行し、前記突合は、前記第１の認識確度が前記第２の閾値以下の場合に実行される、請求項２に記載の情報処理装置である。

請求項４に係る発明は、前記第１制御では、前記第１の認識確度が第３の閾値より高く且つ前記第２の認識確度が第４の閾値より高い場合には、合致した前記認識結果に対して前記第１の処理を実行し、前記第１の認識確度が第３の閾値以下又は前記第２の認識確度が第４の閾値以下の場合には、合致した前記認識結果に対して前記第２の処理を実行する、請求項１に記載の情報処理装置である。

請求項５に係る発明は、前記第３の閾値は、前記第１制御において前記第２の認識確度を用いない場合において、合致した認識結果に対して前記第１の処理と前記第２の処理のいずれを実行するかの制御に用いる前記第１の認識確度についての前記閾値、よりも低い、請求項４に記載の情報処理装置である。

請求項６に係る発明は、前記突合の結果、前記第１の認識結果と前記第２の認識結果とが合致しなかった場合に第２制御を実行し、前記第２制御は、前記第１の認識確度が前記閾値より高い第２の閾値より高い場合には、前記第１の認識結果に対して前記第１の処理を実行し、前記第１の認識確度が前記第２の閾値以下の場合には、前記第１の認識結果に対して前記第２の処理を実行する制御である、請求項２、４又は５に記載の情報処理装置である。

請求項７に係る発明は、前記第１制御では、合致した認識結果に対して前記第１の処理と前記第２の処理のいずれを実行するかを、前記第１の認識確度と前記第２の認識確度の両方に基づいて制御する、請求項１に記載の情報処理装置である。

請求項８に係る発明は、前記プロセッサは、更に、前記突合を実行する前に、前記第１の認識確度が、第５の閾値よりも高い場合には、前記第１の認識結果に対して前記第１の処理を実行し、前記突合を実行する前に、前記第２の認識確度が、第６の閾値よりも高い場合には、前記第２の認識結果に対して前記第１の処理を実行し、前記突合は、前記第１の認識確度が前記第５の閾値以下であり且つ前記第２の認識確度が前記第６の閾値以下の場合に実行される、請求項７に記載の情報処理装置である。

請求項９に係る発明は、前記プロセッサは、更にｋ＝３からｋ＝Ｎ（Ｎは３以上の整数）までの各ｋについて、第ｋの認識器から、前記対象データに対する第ｋの認識結果及び第ｋの認識確度を取得し、前記突合では、ｋ＝１からｋ＝Ｎまでの各ｋについての前記第ｋの認識結果同士の突合を実行し、前記突合の結果、ｋ＝１からｋ＝Ｎまでの各ｋについての前記第ｋの認識結果のすべてが合致した場合に、前記第１制御に代えて第３制御を実行し、前記第３制御は、ｋ＝１からｋ＝Ｎまでの各ｋについての前記第ｋの認識確度のうちの少なくとも一つに基づいて、合致した認識結果に対して第１の処理と第２の処理のいずれかを実行して処理結果を出力することである、請求項１に記載の情報処理装置である。

請求項１０に係る発明は、コンピュータに、第１の認識器から、対象データに対する第１の認識結果及び第１の認識確度を取得し、第２の認識器から、前記対象データに対する第２の認識結果及び第２の認識確度を取得し、前記第１の認識結果と前記第２の認識結果との突合を実行し、前記突合の結果、前記第１の認識結果と前記第２の認識結果とが合致した場合に第１制御を実行する、処理を実行させるためのプログラムであって、前記第１制御は、前記第１の認識確度及び前記第２の認識確度の少なくとも一方に基づいて、合致した認識結果に対して第１の処理と第２の処理のいずれかを実行して処理結果を出力、することであり、前記第１の処理のために必要な人の作業量は、前記第２の処理のために必要な人の作業量よりも少ない、ことを特徴とするプログラムである

請求項１、２又は１０に係る発明によれば、２つの認識器の認識結果が合致すればその認識結果を正解として採用する方式と比べて、人の作業量を抑制しつつ、情報処理装置が出力する出力結果の正解を増加させることができる。

請求項３又は８に係る発明によれば、出力結果の正解が低減しないようにしつつも、突合を行う頻度を少なくすることができる。

請求項４、５又は７に係る発明によれば、第１制御において第１の認識確度と閾値との比較で第１の処理と第２の処理のいずれを実行するかを制御する方式よりも、人間の作業量が少ない第１の処理が選ばれる可能性を高くすることができる。

請求項６に係る発明によれば、合致しなかった場合に必ず第２の処理を実行する方式よりも、人間の作業量を減らすことができる。

請求項９に係る発明によれば、Ｎ個の認識器の認識結果が合致すればその認識結果を採用する方式と比べて、の作業量を抑制しつつ、情報処理装置が出力する出力結果の正解を増加させることができる。

実施形態のシステム構成を例示する図である。システムの主要な情報処理を実行するコンピュータのハードウエア構成を例示する図である。システムの処理手順を例示する図である。システムの処理手順の別の例を示す図である。システムにより得られる効果を説明するための図である。突合結果が合致の場合に確度１と２の両方について閾値比較を行う処理手順を例示する図である。図６の処理手順により得られる効果を説明するための図である。確度１と２の両方について閾値比較を行う例における閾値曲線を例示する図である。確度１と２の両方について閾値比較を行う例の処理手順を例示する図である。１点で交わる線分からなる折れ線状の閾値曲線を例示する図である。システムの処理手順の別の例を示す図である。３つのＯＣＲのＯＣＲ結果同士の突合結果ごとに用意される閾値曲面を説明するための図である。３つのＯＣＲを用いるシステムの処理手順の一例を示す図である。３つのＯＣＲを用いるシステムの処理手順の別の例を示す図である。Ｎ個のＯＣＲを用いるシステムを例示する図である。Ｎ個のＯＣＲを用いるシステムにおいて、１以上のＯＣＲからなるグループを２値の識別コードで表す方式を説明するための図である。Ｎ個のＯＣＲを用いるシステムの処理手順の一例を示す図である。閾値設定のためのＵＩ画面の例を模式的に示す図である。

＜２つＯＣＲを用いる実施形態＞
図１に、データ入力システムの一実施形態を説明する。

このシステムでは、１つの対象画像に対する２つ文字認識器の認識結果が合致したとしても、直ちにその認識結果をシステムの最終的な出力として採用することはしない。それら２つのうち少なくとも一方の認識確度が条件を満たすかどうか確認し、満たした場合にはじめてその合致した認識結果をシステムの最終的な出力として採用する。

このシステムでは、文字認識の対象である入力画像データ５０が２つの文字認識器、すなわちＯＣＲ１とＯＣＲ２、に入力される。ＯＣＲ１及びＯＣＲ２は、互いに異なる特性の文字認識処理を実行する。すなわち、ＯＣＲ１とＯＣＲ２とは、例えば、使用する文字認識のプログラムが互いに異なっていたり、文字認識の学習に用いた学習データ集合が互いに異なっていたりする。ＯＣＲ１と２とに十分大きい数のサンプル画像群を処理させた場合、サンプル画像群に対するＯＣＲ結果の正解（すなわち正認識）と不正解（すなわち誤認識）の分布は、ＯＣＲ１と２とで異なる。

ＯＣＲ１は、入力画像データ５０に対して文字認識処理を行い、その結果であるＯＣＲ結果１と、そのＯＣＲ結果１についての認識の確度である認識確度１（以下「確度１」とも表記する）と、を出力する。ＯＣＲ結果１は、典型的には、その入力画像データ５０から認識した文字列を示すテキストデータである。ＯＣＲ２は、同じ入力画像データ５０に対して文字認識処理を行い、ＯＣＲ結果２と、そのＯＣＲ結果２についての認識確度２と、を出力する。

図１のシステムでは、一例としてＯＣＲ１と２のうち、前者が基準ＯＣＲとして選択されているものとする。基準ＯＣＲは、ＯＣＲ１と２のうち、入力画像データ５０に対する文字認識に適していると想定されている方である。基準ＯＣＲは、例えば固定的に定められていてもよい。例えば、ＯＣＲ１が十分な利用実績があり認識正解率が全般的に高いことが分かっている主として用いるものであり、ＯＣＲ２が未だ利用実績が少ない補助用のものであるため、前者が固定的に基準に定められている場合がその一例である。また、入力画像データ５０についての既知の属性に応じて基準ＯＣＲを選択することも考えられる。例えば、ＯＣＲ１が氏名の認識用に最適化されたものであり、ＯＣＲ２が住所の認識用に最適化されたものである場合において、入力画像データ５０が氏名を示していることが分かっている場合には、ＯＣＲ１が基準ＯＣＲに選ばれる。なお、入力画像データ５０の属性は、１ページの画像中でのその入力画像データ５０の位置等から判別可能な場合がある。例えば、ある帳票の画像のうち、氏名欄として既知である範囲を切り出した画像が入力画像データ５０である場合、その入力画像データ５０の属性は氏名であることが分かる。ここでいう「正解率」とは、システムが最終的な認識結果として出力した情報の全体の数に対する、出力した情報が本当に正しかった和の割合のことである。

突合部１０は、ＯＣＲ結果１とＯＣＲ結果２の突合処理を行う。この突合処理では、ＯＣＲ結果１の文字列とＯＣＲ結果２の文字列とを比較（すなわち突合）し、それら両者が合致（すなわち文字列同士が一致）するか否（すなわち非合致）かを判定する。両者が合致した場合、突合部１０は、確度１を閾値比較部１２に出力する。両者が非合致の場合、突合部１０は、確度1を、閾値比較部１２とは別の閾値比較部１４に出力する。

閾値比較部１２は、確度１を予め定めた閾値１と比較し、確度１が閾値１より大きいか否かを示す比較結果を出力する。

閾値比較部１４は、確度１を閾値２と比較し、確度１が閾値２より大きいか否かを示す比較結果を出力する。ここで、閾値２は、閾値１より大きい、予め定めた閾値である。

後段処理部１６は、基準ＯＣＲの処理結果であるＯＣＲ結果１と、閾値比較部１２の比較結果を受け取る。そして、後段処理部１６は、受け取った比較結果が、確度１が閾値１より大きいことを示すものである場合、ＯＣＲ結果１を、このシステムの最終的な認識結果として出力する。これに対し、受け取った比較結果が、確度１が閾値１以下であることを示す場合には、後段処理部１６は、ＯＣＲ結果１をリジェクトする。リジェクトとは、対象のＯＣＲ結果（この場合はＯＣＲ結果１）を不採用とする処理である。ＯＣＲ結果１をリジェクトした場合、システムは、入力画像データ５０に対するシステムとしての認識結果を求めるために、人間の作業者に介入を求める。作業者の介入によりシステムの最終的な認識結果を求める方式は、特に限定されない。作業者の介入方式の１つが、確認したり修正したりする「確認・修正」の処理である。「確認・修正」の処理では、作業者の端末の画面に入力画像データ５０とＯＣＲ結果１とを表示し、作業者がそれら両者を見比べて、ＯＣＲ結果１が正しいかどうか確認し、正しければ正しいと確認したことを示す情報を入力する。正しくなければ、作業者は、ＯＣＲ結果１の間違っている部分を修正するための入力を行う。このような「確認・修正」の作業により確認または修正された処理結果を、システムの最終的な認識結果の出力とする。

後段処理部１８は、基準ＯＣＲの処理結果であるＯＣＲ結果１と、閾値比較部１４の比較結果を受け取る。そして、後段処理部１８は、受け取った比較結果が、確度１が閾値２より大きいことを示すものである場合、ＯＣＲ結果１を、このシステムの最終的な認識結果として出力する。これに対し、受け取った比較結果が、確度１が閾値２以下であることを示す場合には、後段処理部１８は、ＯＣＲ結果１をリジェクトし、「確認・修正」の処理を行い、最終的な認識結果として出力する。また、後段処理部１６または１８において、リジェクトとした場合に「認識・修正」の処理を行わず「認識できなかった」ことを示す情報を出力するようにしてもよい。

図１に示したシステムの主要部は、一つの例では、コンピュータを用いて実現される。

このコンピュータは、例えば、図２に示すように、ハードウエアとして、プロセッサ１０２、ランダムアクセスメモリ（ＲＡＭ）等のメモリ（主記憶装置）１０４、フラッシュメモリやＳＳＤ（ソリッドステートドライブ）、ＨＤＤ（ハードディスクドライブ）等の補助記憶装置１０６を制御するコントローラ、各種の入出力装置１０８とのインタフェース、ローカルエリアネットワークなどのネットワークとの接続のための制御を行うネットワークインタフェース１１０等が、例えばバス１１２等のデータ伝送路を介して接続された回路構成を有する。突合部１０、閾値比較部１２及び１４，並びに後段処理部１６及び１８の機能を規定するプログラム群が、ネットワーク等を経由してコンピュータにインストールされ、補助記憶装置１０６に保存される。補助記憶装置１０６に保存されたそれらプログラム群が、プロセッサ１０２によりメモリ１０４を用いて実行されることにより、それら各部の機能が実現される。

ここでプロセッサ１０２とは広義的なプロセッサを指し、汎用的なプロセッサ（例えばＣＰＵ：ＣｅｎｔｒａｌＰｒｏｃｅｓｓｉｎｇＵｎｉｔ、等）や、専用のプロセッサ（例えばＧＰＵ：ＧｒａｐｈｉｃｓＰｒｏｃｅｓｓｉｎｇＵｎｉｔ、ＡＳＩＣ：ＡｐｐｌｉｃａｔｉｏｎＳｐｅｃｉｆｉｃＩｎｔｅｇｒａｔｅｄＣｉｒｃｕｉｔ、ＦＰＧＡ：ＦｉｅｌｄＰｒｏｇｒａｍｍａｂｌｅＧａｔｅＡｒｒａｙ、プログラマブル論理デバイス、等）を含むものである。

また、プロセッサ１０２の動作は、１つのプロセッサ１０２によってなすのみでなく、物理的に離れた位置に存在する複数のプロセッサ１０２が協働してなすものであってもよい。また、プログラム実行時のプロセッサ１０２の各動作は、以下の実施形態において説明する順序のみに限定されるものではなく、適宜に変更してもよい。

図１のシステム構成のうち、突合部１０、閾値比較部１２及び１４、後段処理部１６及び１８は、プロセッサ１０２がそれら各部の機能を表すプログラムを実行することにより実現される。ＯＣＲ１及び２は、そのプロセッサ１０２が各々の文字認識処理を表すプログラムを実行することにより実現してもよいし、プロセッサ１０２の外部のＯＣＲシステムとして実現されたものであってもよい。

図３に、図１のシステムの処理を実行するプロセッサ１０２の処理手順を例示する。この手順では、プロセッサ１０２は、まずＯＣＲ１及び２から、入力画像データ５０に対するＯＣＲ結果１及び２を取得すると共に、ＯＣＲ１から確度１を取得する（Ｓ１０）。次にプロセッサ１０２は、ＯＣＲ結果１と２を突合し（Ｓ１２）、突合の結果が合致、非合致のいずれであるかを判定する（Ｓ１４）。突合結果が合致の場合、プロセッサ１０２は、確度１を閾値１と比較する（Ｓ１６）。そして、プロセッサ１０２は、比較の結果、確度１が閾値１より高ければ、第１処理を実行し（Ｓ１８）、そうでなければ第２処理を実行する（Ｓ２０）。また、Ｓ１４で突合結果が非合致であれば、プロセッサ１０２は、確度１を閾値１より高い閾値２と比較し（Ｓ２２）、確度１が閾値２より高ければ、第１処理を実行し（Ｓ１８）、そうでなければ第２処理を実行する（Ｓ２０）。

第１処理は、第２処理よりも、人間の作業者の作業量が相対的に少ない処理である。例えば、図１に例示した、ＯＣＲ結果１を人間の作業者の介入無くそのまま最終的な処理結果として採用する処理が第１処理の例であり、ＯＣＲ結果をリジェクトして作業者による「確認・修正」を受ける処理が第２処理の例である。

第１処理の別の例としては、作業者にＯＣＲ結果１の確認のみを求める処理がある。この処理では、プロセッサ１０２は、作業者の端末の画面上に入力画像データ５０とＯＣＲ結果１とを表示し、ＯＣＲ結果１が正しいかどうかの確認結果の入力を作業者に求める。また、作業者による「確認・修正」に代わる第２処理の別の例としては、作業者に入力画像データ５０を提示し、入力画像データ５０に含まれる文字列のテキストデータを作業者に入力させる処理がある。

第１処理は、必要とする人間の作業量が第２処理と同じ程度か、または、第２処理よりも少ない。このため、ＯＣＲ結果１と２との合致や確度１が閾値より高いという特定の条件が満たされる場合に第１処理を選択することで、認識結果の正解率を確保しつつも、人間の作業量が抑えられる。

図３に例示した手順と同様の結果が得られる別の手順を、図４に例示する。図４の手順は、突合処理（Ｓ１２）の前に、確度１と閾値２との比較（Ｓ２２）を実行することにより、ＯＣＲ２の認識処理を省略できる場合を作り出す。

この手順では、プロセッサ１０２は、まずＯＣＲ１から入力画像データ５０に対するＯＣＲ結果１と確度１を取得する（Ｓ１０ａ）。この時点では、ＯＣＲ２は、入力画像データ５０に対する文字認識を実行していなくてよい。次にプロセッサ１０２は、確度１が閾値２より高いか否かを判定する（Ｓ２２）。Ｓ２２の判定結果がＹｅｓの場合、プロセッサ１０２は、第１処理を実行する（Ｓ１８）。

Ｓ２２の判定結果がＮｏの場合、プロセッサ１０２は、ＯＣＲ２に入力画像データ５０に対する文字認識を実行させてＯＣＲ結果２を取得する（Ｓ１０ｂ）。次にプロセッサ１０２は、ＯＣＲ結果１と２とを突合し（Ｓ１２）、その突合の結果が合致、非合致のいずれであるかを判定する（Ｓ１４）。突合結果が合致の場合、プロセッサ１０２は、確度１を閾値１と比較する（Ｓ１６）。そして、プロセッサ１０２は、比較の結果、確度１が閾値１より高ければ、第１処理を実行し（Ｓ１８）、そうでなければ第２処理を実行する（Ｓ２０）。一方、Ｓ１４で非合致と判定した場合は、プロセッサ１０２は、第２処理を実行する（Ｓ２０）。

図４の手順では、Ｓ２２の判定結果がＹｅｓとなった場合、ＯＣＲ結果２は不要なので、ＯＣＲ２は文字認識を行わないままでよい。したがって、ＯＣＲ２をプロセッサ１０２の処理により実現している場合は、ＯＣＲ２が文字認識を行わない分だけプロセッサ１０２の負荷が低減される。また、ＯＣＲ２として外部のＯＣＲサービスを用いている場合は、その外部サービスを利用しない分だけ、システム全体の処理量や処理に要する人的または物理的な費用が下がる。

以上、図１〜図４を用いて説明したシステム又は処理手順では、ＯＣＲ結果１と２との突合結果が合致の場合でも、更に確度１が閾値１より高いという条件を満たして初めて、その合致したＯＣＲ結果をシステムの最終的な認識結果として採用する。したがって、信頼性が低い（すなわち確度が低い）ＯＣＲ結果同士が偶然合致したことにより最終的な認識結果として採用されてしまうという事態が防がれる。

また、図１のシステムでは、ＯＣＲ結果１と２の突合結果が非合致の場合でも、ただちにそれらＯＣＲ結果をリジェクトすることはしない。この場合、システムは、確度１が、上述した合致の場合よりも厳しい条件である、確度１が閾値１より高い閾値２より高いこと、を満たすかどうか調べ、満たせば、ＯＣＲ結果１を最終的な処理結果として採用する。このように、非合致の場合でも、ＯＣＲ結果１の確度１が非常に高ければＯＣＲ結果１を採用するのである。これにより、非合致ならば直ちにＯＣＲ結果をリジェクトする従来方式よりも、人間の介入による作業工数が低減される。

単一のＯＣＲを用い、そのＯＣＲが求めたＯＣＲ結果についての確度が閾値より高い場合、そのＯＣＲ結果を採用する方式は従来も存在する。しかし、この従来方式は、単独のＯＣＲによるＯＣＲ結果に対して適用されるものである。このときに用いられる閾値は、かなり高い値である。これに対して、図１のシステムの閾値比較部１４が用いる閾値１は、ＯＣＲ結果１と２が合致した場合に適用されるものであり、従来方式の閾値よりも低い値としてもよい。異なる認識方式で求められた２つのＯＣＲ結果が一致していることで、ＯＣＲ結果１が正解である可能性がある程度高いものと考えられるので、最終的な採否を判定する閾値１がある程度低くても、従来方式と同程度の正解率が達成される。

一方、閾値２としては従来方式で用いた閾値と同じ値を用いれば、従来方式と同程度の正解率が実現される。

このことを、図５を参照して説明する。図５に示すグラフ（ａ）は、単一のＯＣＲを用いる従来方式において、多数の入力画像についてのＯＣＲ結果のうち正認識であったものの頻度分布と、誤認識であったものの頻度分布を示す。横軸は確度である。グラフ（ａ）から分かるように、確度がある程度以上高いと誤認識はほぼ無くなるが、確度がある程度低い範囲の中には、正認識と誤認識とが混在する区間がある。このような分布では、ＯＣＲの正解率（すなわち全体に対する正認識の率）を従来方式と同程度以上とするには、図中に示す閾値Ａを採用する必要がある。

これに対し、図５に示すグラフ（ｂ）は、図１〜図４を用いて説明したシステムでの、多数の入力画像について得られた正認識と誤認識の頻度分布を示す。この頻度分布は、ＯＣＲ結果１と２の突合の結果が合致である場合についての、確度を横軸とした場合の、正認識の頻度分布と誤認識の頻度分布である。グラフ（ｂ）は突合結果が合致の場合についてのものなので、正認識の割合が合致と非合致の両方を含む一般的な場合よりも高くなる。その結果、従来方式と同程度以上の正解率を得るためには、従来方式の閾値Ａよりも低い閾値Ｂで十分となる。低い閾値を用いた分だけ、非リジェクトとなるＯＣＲ結果（すなわち人間の作業量が少ない第１処理が適用されるＯＣＲ結果）が多くなり、人間の作業量が削減される。すなわち、突合結果が合致したケースについては、人間の作業量の削減が見込まれる。

一方、突合結果が非合致の場合の閾値２として、従来方式と閾値Ａと同程度の値を用いれば、従来方式と同程度の正解率が期待される。この非合致の場合に必要となる人間の作業量は、従来方式と同程度と見込まれる。

したがって、合致と非合致の両方を総合した場合、本実施形態のシステムは、合致の場合の作業量削減の分だけ、従来方式よりも人間の作業量が少なくて済む。
＜合致の場合に確度１及び２を考慮する例＞

図６を参照して、図３の処理手順の変形例を説明する。図６の処理手順のうち、図３の処理手順のステップと同様の処理を表すステップには、同一符号を付して、重複した説明は省略する。

図６の処理手順では、Ｓ１４でＯＣＲ結果１と２とが合致したと判定した場合、プロセッサ１０２は、確度１を閾値１−１と比較する（Ｓ２４）と共に、確度２を閾値１-２と比較する（Ｓ２６）。そして、プロセッサ１０２は、Ｓ２４及びＳ２６の判定結果が共にＹｅｓの場合に第１処理を実行し（Ｓ１８）、Ｓ２４及びＳ２６の判定結果のいずれか一方でもＮｏであれば第２処理を実行する（Ｓ２０）。

図３の処理手順ではＯＣＲ結果１と２が合致した場合に確度１のみを検査していた。これに対して、図６の処理手順では同様の場合に確度１と２の両方を検査し、それら両方が対応する閾値１−１及び閾値１−２より高い場合にのみ、第１処理（Ｓ１８）を選択する。このため、閾値１−１は、図３の処理手順で確度１と比較していた閾値１よりも低い値でよい。

図６の処理手順では、図３の処理手順の閾値１より低い閾値１−１を用いることにより、非リジェクトとなるＯＣＲ結果が少なくなり、ひいては人間の作業量が低減される。このことを、図７を参照して説明する。

図７は、多数のサンプル入力画像をそれぞれＯＣＲ１及び２で認識させたときのＯＣＲ結果の散布図５００を示し、縦軸は確度１、横軸は確度２である。確度１は上に行くほど高い値であり、確度２は左に行くほど高い値である。濃色の菱形のプロット５０２は正認識のサンプルを示し、淡色の正方形及び三角形のプロット５０４及び５０６は誤認識のサンプルを示す。

図７に示す分布では、確度１のみを用いて正解率を１００％とするには、確度１が図示の閾値１より高くなる必要がある。これに対して、確度１と２の両方を用いる場合、確度１が図示の閾値１−１より高く、且つ確度２が閾値１−２より高ければ、正解率１００％となる。確度１が閾値１より高い範囲と、確度１が閾値１−１より高く且つ確度２が閾値１−２より高い範囲とを比較した場合、後者の範囲の方が、内包する正認識のプロット５０２の数が多い。したがって、後者の方が、人間の作業量が相対的に少ない第１処理が適用されるＯＣＲ結果の数が多い分だけ、システム全体として必要となる人間の作業量が少なくなる。

なお、図６の処理手順についても、図３の処理手順の場合と同様、突合の前にＳ２２を実行する変形例（図４参照）と同様の変形例が考えられる。
＜確度１と２の両方を用いる例＞

次に、合致と非合致の両方で、確度１と２の両方を用いる処理手順の例を説明する。

この手順では、図８に例示する閾値曲線２０１及び２０２を用いる。図８の（ａ）及び（ｂ）は、横軸に確度１、縦軸に確度２をとった２次元の座標空間を示す。閾値曲線２０１及び２０２は、その２次元空間における閾値を示す曲線である。

閾値曲線２０１は、ＯＣＲ結果１と２の突合結果が合致の場合に用いる閾値曲線である。ＯＣＲ結果に対する確度１と２の組が示す座標が閾値曲線２０１以下の位置にある場合、そのＯＣＲ結果はリジェクトされる（すなわち第２処理が適用される）。逆にその座標が閾値曲線２０１より上にある場合には、そのＯＣＲ結果は非リジェクトとなる、すなわち、そのＯＣＲ結果に対して第１処理が適用される。

閾値曲線２０２は、ＯＣＲ結果１と２の突合結果が非合致の場合に用いる閾値曲線である。確度１と２からなる座標と閾値曲線２０２との上限関係と、対応するＯＣＲ結果のリジェクト・非リジェクトの関係は、閾値曲線２０１の場合と同様である。

非合致の場合に用いる閾値曲線２０２は、合致の場合に用いる閾値曲線２０１よりも上に位置する。すなわち、非合致の場合の方が、合致の場合よりも、ＯＣＲ結果に対して第１処理が適用されるために必要な確度は高くなる。

図９に、この例におけるプロセッサの処理手順を例示する。図９の手順では、プロセッサ１０２は、まず、ＯＣＲ１からＯＣＲ結果１と確度１を、ＯＣＲ２からＯＣＲ結果２と確度２を、それぞれ取得する（Ｓ１０ｃ）。次にプロセッサ１０２は、ＯＣＲ結果１と２とを突合し（Ｓ１２）、両者が合致したか否かを判定する（Ｓ１４）。Ｓ１４の判定結果がＹｅｓの場合、プロセッサ１０２は補助記憶装置１０６に記憶されている閾値曲線１（すなわち図８の閾値曲線２０１）を選択する（Ｓ３０）。一方、Ｓ１４の判定結果がＮｏの場合、プロセッサ１０２は補助記憶装置１０６に記憶されている閾値曲線２（図８の閾値曲線２０２）を選択する（Ｓ３２）。次に、プロセッサ１０２は、Ｓ１０ｃで取得した確度１と２の組が示す座標（確度１，確度２）が、先に選択した閾値曲線より上に位置するか否かを判定する（Ｓ３４）。その座標と座標原点（すなわち確度１＝０且つ確度２＝０の点）とを結ぶ線分が閾値曲線と交わる場合、その座標は閾値曲線より上に位置し、そうでない場合はその座標はその閾値曲線以下の位置にある。

Ｓ３４の判定結果がＹｅｓの場合、プロセッサ１０２はＯＣＲ結果に対して第１処理を適用し（Ｓ１８ａ）、そうでない場合はＯＣＲ結果に対して第２処理を適用する（Ｓ２０ａ）。ここで、ＯＣＲ１及び２のうちの一方が基準ＯＣＲに選択されている場合は、Ｓ１８ａ及びＳ２０ａでは、基準ＯＣＲのＯＣＲ結果を第１処理及び第２処理の対象とすればよい。また、基準ＯＣＲを定めない場合には、ＯＣＲ結果１と２が非合致であれば、Ｓ１８ａ及びＳ２０ａでは、ＯＣＲ結果１と２のうち、対応する確度１と２のうち相対的に高い方に対応するＯＣＲ結果を処理対象としてもよい。

確度１と２の組が示す座標と閾値曲線との比較により非リジェクトと判定され第１処理が適用されるか、リジェクトと判定され第２処理が適用されることにより、図１及び図３の例よりも、非リジェクトとなるケースが多くなる。このことは、人間の作業量の低減に繋がる。

なお、閾値曲線といった場合の「曲線」は、数学的な意味での曲線である。したがって、閾値曲線は、直線であってもよいし、折れ線であってもよい。例えば、図１０に例示する閾値曲線２０３は、確度１＝閾値１の直線分と、確度２＝閾値２の直線分とからなる。
＜確度１と２の両方を用いる第２の例＞

次に、合致と非合致の両方で、確度１と２の両方を用いる処理手順の第２の例を、図１１を参照して説明する。

図１１の手順では、Ｔ１−１、Ｔ１−２、Ｔ２−１、Ｔ２−２という４つの閾値を用いる。Ｔ１−１とＴ１−２は共に確度１についての閾値であり、Ｔ１−１はＴ１−２より大きい。一方、Ｔ２−１とＴ２−２は共に確度２についての閾値であり、Ｔ２−１はＴ２−２より大きい。

この手順では、プロセッサ１０２は、まず、ＯＣＲ１からＯＣＲ結果１と確度１を、ＯＣＲ２からＯＣＲ結果２と確度２を、それぞれ取得する（Ｓ１０ｃ）。次にプロセッサ１０２は、確度１がＴ１−１より高いか否かを判定する（Ｓ４０）。Ｓ４０の判定結果がＹｅｓの場合、プロセッサ１０２は、ＯＣＲ結果１に対して第１処理を実行する（Ｓ４２）。図示例では、第１処理は、対象であるＯＣＲ結果をそのままシステムの最終的な認識結果として出力する処理である。Ｓ４０の判定結果がＮｏの場合、プロセッサ１０２は、確度２がＴ２−１より高いか否かを判定する（Ｓ４４）。Ｓ４の判定結果がＹｅｓの場合、プロセッサ１０２は、ＯＣＲ結果２に対して第１処理を実行する（Ｓ４６）。Ｓ４０及びＳ４２と、Ｓ４４及びＳ４６とのどちらを先に実行するかは、ＯＣＲ１と２のどちらを重視するかによる。図１１の例は、ＯＣＲ１を重視する場合の例である。

Ｓ４４の判定結果がＮｏの場合、プロセッサ１０２は、確度１がＴ１−２より高いか否かを判定し（Ｓ４８）、この判定結果がＹｅｓの場合、Ｓ５２の処理に進む。Ｓ４８の判定結果がＮｏの場合、プロセッサ１０２は、確度２がＴ２−２より高いか否かを判定し（Ｓ５０）、この判定結果がＹｅｓの場合、Ｓ５２の処理に進む。

Ｓ４８及びＳ５０の判定結果がともにＮｏの場合、プロセッサ１０２は、ＯＣＲ結果１及び２に対して第２処理（例えばリジェクト）を適用する（Ｓ５８）。この場合、例えば、人間による「確認・修正」処理を求める。

一方、Ｓ５２では、プロセッサ１０２はＯＣＲ結果１と２を突合し、続くＳ５４でプロセッサ１０２はその突合の結果が合致か非合致かを判定する。この突合にてそれら両者が合致した場合、プロセッサ１０２は、合致したＯＣＲ結果に対して第１処理（例えばそのＯＣＲ結果をシステムの最終的な認識結果として出力）を実行する（Ｓ５６）。Ｓ５４で突合結果が非合致と判定した場合、プロセッサ１０２は、合致したＯＣＲ結果に対して第２処理（例えばリジェクト）を適用する（Ｓ５８）。

なお、図１１の手順では、Ｓ１０ｃにて、ＯＣＲ１からＯＣＲ結果１等を取得するのと同時にＯＣＲ２からＯＣＲ結果２等を取得したが、ＯＣＲ２からのＯＣＲ結果２等の取得は、Ｓ４０の判定結果がＮｏとなった後、Ｓ４４の判定を実行する前の時点まで繰り下げてもよい。

図１１の手順では、第１処理と第２処理のいずれを選択するかを確度１又は２のうちの一方と閾値との比較のみに基づいて決める方式、よりも、第１処理が適用される割合が高くなる。
＜３つのＯＣＲを用いる例＞

上述の図８及び図９を用いて説明した例は、２つのＯＣＲの確度の組が表す２次元座標が閾値曲線の上下のいずれに位置するかにより、ＯＣＲ結果に対して第１処理及び第２処理のいずれを適用するかを判定した。これに対し、以下では、３つのＯＣＲを用いるシステムを例示する。３つのＯＣＲは、互いに異なる文字認識処理を実行するものである。

図示は省略するが、この例のシステムは、３つのＯＣＲ、すなわちＯＣＲ１、ＯＣＲ２及びＯＣＲ３を有する。ＯＣＲ３は、入力画像データ５０に対してＯＣＲ処理を実行することにより、ＯＣＲ結果３及び確度３を求めて出力する。ＯＣＲ１及び２については、上述の例と同様である。

確度１、２及び３をそれぞれ座標軸とする３次元空間内に、閾値曲面が規定できる。また、同じ入力画像データ５０に対応する確度１、２及び３の組は、その３次元空間内の１つの３次元座標を表す。この例ではその３次元座標が閾値曲面の上下のいずれに位置するかにより、ＯＣＲ結果に対して第１処理及び第２処理のいずれを適用するかを判定する。

また、この例では、ＯＣＲ結果１〜３を突合し、その突合の結果に応じて閾値曲面を選択する。例えば、突合の結果、ＯＣＲ結果１〜３が互いに合致する場合（すなわちＯＣＲ結果１＝ＯＣＲ結果２＝ＯＣＲ結果３の場合）には、図１２の分図（Ａ）に示す閾値曲面２１０Ａを選択する。図では表現できないが、閾値曲面２１０Ａは、その３次元空間内の０≦確度１≦１、０≦確度２≦１、且つ０≦確度３≦１である範囲内の曲面である。また、ＯＣＲ結果１＝ＯＣＲ結果２≠ＯＣＲ結果３の場合は図１２の分図（Ｂ）に示す閾値曲面２１０Ｂを、ＯＣＲ結果１≠ＯＣＲ結果２＝ＯＣＲ結果３の場合は図１２の分図（Ｃ）に示す閾値曲面２１０Ｃを、ＯＣＲ結果２≠ＯＣＲ結果３＝ＯＣＲ結果１＝の場合は図１２の分図（Ｄ）に示す閾値曲面２１０Ｄを、それぞれ選択する。分図（Ｂ）〜（Ｄ）は、合致した２つのＯＣＲ結果に対応する２つの確度の座標軸からなる平面に対して閾値曲面を射影した状態を示している。またＯＣＲ結果１〜３が全て非合致（すなわちどの２つを取っても合致しない）場合は、図１２の分図（Ｅ）に示す閾値曲面２１０Ｅを選択する。

閾値曲面２１０Ａは、閾値曲面２１０Ｂ、Ｃ及びＤのいずれよりも上に位置する。すなわち、閾値曲面２１０Ａ上のどの点をついてもその点とその３次元空間の原点を結ぶ線分は閾値曲面２１０Ｂ、Ｃ及びＤと交わるが、閾値曲面２１０Ｂ、Ｃ又はＤ上のどの点についてもその点とその原点を結ぶ線分は閾値曲面２１０Ａと交わらない。また、閾値曲面２１０Ｂ、Ｃ及びＤは、閾値曲面２１０Ｅよりも上に位置する。当然、閾値曲面２１０Ａは閾値曲面３１０Ｅよりも上にある。

図１３に、この例の処理手順を例示する。この手順では、まずプロセッサ１０２は、ＯＣＲ１〜３からＯＣＲ結果１〜３及び確度１〜３を取得する（Ｓ１００ｃ）。次にプロセッサ１０２は、ＯＣＲ結果１〜３を突合する（Ｓ１０２）。プロセッサ１０２は、その突合の結果、ＯＣＲ結果１〜３の全てが互いに合致したか否かを判定し（Ｓ１０４）、この判定の結果がＹｅｓの場合は、補助記憶装置１０６に記憶されている閾値曲線２１０Ａ（図１２参照）を選択する（Ｓ１０６）。Ｓ１０４の判定結果がＮｏの場合、プロセッサ１０２は、ＯＣＲ結果１と２が合致したか否かを判定し（Ｓ１０８）、この判定の結果がＹｅｓの場合は、補助記憶装置１０６に記憶されている閾値曲線２１０Ｂを選択する（Ｓ１１０）。Ｓ１０８の判定結果がＮｏの場合、プロセッサ１０２は、ＯＣＲ結果２と３が合致したか否かを判定し（Ｓ１１２）、この判定の結果がＹｅｓの場合は、補助記憶装置１０６に記憶されている閾値曲線２１０Ｃを選択する（Ｓ１１４）。Ｓ１１２の判定結果がＮｏの場合、プロセッサ１０２は、ＯＣＲ結果３と１が合致したか否かを判定し（Ｓ１１６）、この判定の結果がＹｅｓの場合は、補助記憶装置１０６に記憶されている閾値曲線２１０Ｄを選択する（Ｓ１１８）。Ｓ１１６の判定結果がＮｏの場合は、ＯＣＲ結果１〜３が全て非合致である。この場合、プロセッサ１０２は、補助記憶装置１０６に記憶されている閾値曲線２１０Ｅを選択する（Ｓ１２０）。Ｓ１０６、Ｓ１１０、Ｓ１１４、Ｓ１１８又はＳ１２０の後、プロセッサ１０２は、Ｓ１２２の処理を実行する。Ｓ１１２では、プロセッサ１０２は、確度１〜３の組が表す３次元座標が、Ｓ１０６、Ｓ１１０、Ｓ１１４、Ｓ１１８又はＳ１２０で選択された閾値曲線より上に位置するか否かを判定する。そしてプロセッサ１０２は、Ｓ１２２の判定の結果がＹｅｓの場合は第１処理を実行し（Ｓ１２４）、Ｎｏの場合はその第１処理より人間の作業量が多い第２処理を実行する（Ｓ１２６）。第１処理は、例えば、対象とするＯＣＲ結果をシステムの最終的な認識結果として出力する処理である。また、第２処理は、例えば、人間の作業者からＯＣＲ結果の「確認・修正」を受ける処理である。

Ｓ１０４、Ｓ１０８、Ｓ１１２又はＳ１１６の判定結果がＹｅｓであった場合、Ｓ１２４及びＳ１２６では、合致したＯＣＲ結果を対象として第１処理及び第２処理を行えばよい。また、Ｓ１１６の判定結果がＮｏの場合は、あらかじめ選ばれている基準のＯＣＲのＯＣＲ結果、又は確度１〜３のうち最も高い確度に対応するＯＣＲ結果、を対象として第１処理及び第２処理を行えばよい。

この例で用いる閾値曲面は、数学的な意味での曲面である。したがって、閾値曲面が平面である場合もあり得る。
＜３つのＯＣＲを用いる第２の例＞

次に、３つのＯＣＲを用いる第２の例を、図１４を参照して説明する。

図１４に示す手順では、まずプロセッサ１０２は、ＯＣＲ１〜３からＯＣＲ結果１〜３及び確度１〜３を取得する（Ｓ１００ｃ）。次にプロセッサ１０２は、確度１、２、３の順に、確度１、２、３が、それぞれに対応する予め定められた閾値Ｔ１−１、Ｔ２−１、Ｔ３−１より高いかどうかを判定する（Ｓ１５０）。対応する閾値よりも高い確度が見つかった時点で、Ｓ１５０の判定結果はＹｅｓとなり、Ｓ１５２に進む。例えば、確度１が閾値Ｔ１−１より高ければ、Ｓ１５０の判定結果はＹｅｓとなり、確度２及び３については閾値との比較は行わず、Ｓ１５２に進む。Ｓ１５２では、対応する閾値よりも高い確度に対応するＯＣＲ結果に対して第１処理（例えばそのＯＣＲ結果をシステムの認識結果として出力する処理）を実行する。この例は、ＯＣＲ１を最も重視し、その次にＯＣＲ２を重視し、ＯＣＲ３は最も重視しない場合のものである。

確度１、２、３のすべてが、それぞれ、対応する閾値Ｔ１−１、Ｔ２−１、Ｔ３−１以下であれば、Ｓ１５０の判定結果がＮｏとなる。この場合、プロセッサ１０２は、確度１が閾値Ｔ１−１２より高いこと、又は確度２が閾値Ｔ２−１２より高いこと、の少なくとも一方が成立するか判定する（Ｓ１５４）。Ｔ１−１２は、上述したＴ１−１より低い予め定められた値であり、Ｔ２−１２は、上述したＴ２−１より低い予め定められた値である。Ｓ１５４の判定の結果がＹｅｓであれば、プロセッサ１０２はＯＣＲ結果１と２を突合し（Ｓ１５６）、両者が合致したか否かを判定する（Ｓ１７０）。合致した場合、プロセッサ１０２は、合致したＯＣＲ結果を対象として第１処理（例えばそのＯＣＲ結果を出力する処理）を実行し（Ｓ１７２）、非合致の場合は、第２処理（例えば合致したＯＣＲ結果に対して作業者の「確認・修正」を受ける処理）を実行する（Ｓ１７４）。

Ｓ１５４の判定結果がＮｏの場合、プロセッサ１０２は、確度１が閾値Ｔ１−１３より高いこと、又は確度３が閾値Ｔ３−１３より高いこと、の少なくとも一方が成立するか判定する（Ｓ１５８）。Ｔ１−１３は、上述したＴ１−１より低い予め定められた値であり、Ｔ３−１３は、上述したＴ３−１より低い予め定められた値である。Ｓ１５８の判定の結果がＹｅｓであれば、プロセッサ１０２はＯＣＲ結果１と３を突合し（Ｓ１６０）、その後Ｓ１７０〜Ｓ１７４の処理を実行する。

Ｓ１５８の判定結果がＮｏの場合、プロセッサ１０２は、確度２が閾値Ｔ２−２３より高いこと、又は確度３が閾値Ｔ３−２３より高いこと、の少なくとも一方が成立するか判定する（Ｓ１６２）。Ｔ２−２３は、上述したＴ２−１より低い予め定められた値であり、Ｔ３−２３は、上述したＴ３−１より低い予め定められた値である。Ｓ１６２の判定の結果がＹｅｓであれば、プロセッサ１０２はＯＣＲ結果２と３を突合し（Ｓ１６４）、その後Ｓ１７０〜Ｓ１７４の処理を実行する。

Ｓ１６２の判定結果がＮｏの場合、プロセッサ１０２は、確度１が閾値Ｔ１−１２３より高いこと、確度２が閾値Ｔ２−１２３より高いこと、又は確度３が閾値Ｔ３−１２３より高いこと、の少なくとも１つが成立するか判定する（Ｓ１６６）。Ｔ１−１２３は、上述したＴ１−１、Ｔ１−１２、及びＴ１−１３のいずれよりも低い、予め定められた値である。Ｔ２−１２３は、上述したＴ２−１、Ｔ２−１２、及びＴ２−２３のいずれよりも低い、予め定められた値である。またＴ３−１２３は、上述したＴ３−１、Ｔ３−１３、及びＴ３−２３のいずれよりも低い、予め定められた値である。Ｓ１６６の判定の結果がＹｅｓであれば、プロセッサ１０２はＯＣＲ結果１〜３を突合し（Ｓ１６８）、ＯＣＲ結果１〜３の全てが互いに合致したか否かを判定する（Ｓ１７０）。そして、Ｓ１７０の判定結果がＹｅｓであればＳ１７２を、ＮｏであればＳ１７５を実行する。

Ｓ１６６の判定結果がＮｏの場合は、プロセッサ１０２は、第２処理（例えばＯＣＲ結果を作業者に提示して、「確認・修正」を求める処理）を実行する（Ｓ１７４）。この第２処理は、例えば、最も重視されるＯＣＲ１のＯＣＲ結果１を対象として行えばよい。また別の例として、第２処理は、確度１〜３のうち最も高い確度に対応するＯＣＲ結果を対象として行ってもよい。
＜Ｎ個のＯＣＲを用いる例＞

以上、２つのＯＣＲを用いるシステム、及び３つのＯＣＲを用いるシステムの例を説明してきた。次に、より一般的にＮ個のＯＣＲを用いるシステムの例を説明する。Ｎは２以上の整数である。Ｎ個のＯＣＲは、互いに異なる文字認識処理を実行するものである。

図１５に、このシステムの構成を例示する。このシステムは、入力画像データ５０を、Ｎ個のＯＣＲ１、ＯＣＲ２、ＯＣＲ３、・・・、ＯＣＲ（Ｎ−１）、ＯＣＲＮに処理させる。突合部２０は、それらＮ個のＯＣＲから、それぞれＯＣＲ結果と確度とを取得し、それらＯＣＲ結果同士を突合する。閾値選択部２２は、突合部２０の突合結果に従って閾値（例えば後述する閾値超曲面）を選択する。閾値比較部２４は、Ｎ個のＯＣＲから得た確度と、閾値選択部２２が選択した閾値とを比較し、その比較の結果に基づいて、第１処理及び第２処理のいずれを実行するかを選択する。図示例では、第１処理は、Ｎ個のＯＣＲから得たＯＣＲ結果のうち所定の基準に従って選ばれたＯＣＲ結果を、システムの最終的な認識結果として出力する処理である。また、第２処理では、「確認・修正」部２６が、同様に選ばれたＯＣＲ結果を人間の作業者に提示し、確認及び修正を受ける。作業者により確認又は修正を受けた後のＯＣＲ結果が、システムの最終的な認識結果として出力される。

ここで、閾値選択部２２は、Ｎ個のＯＣＲの中から、所定の基準に従って、対象とするＯＣＲグループ（以下「対象グループ」という）を選択する。

この選択に用いる所定の基準は、例えば、同じＯＣＲ結果を出力したＯＣＲからなるグループのうち、当該グループに属するＯＣＲの数が最大のものを対象グループに選択する、というものである。例えば、ＯＣＲ結果Ａを出力したＯＣＲが４つあり、ＯＣＲ結果Ｂを出力したＯＣＲが２つあり、その他のＯＣＲは互いに異なるＯＣＲ結果を出力したとすると、ＯＣＲ結果Ａを出力した４つのＯＣＲからなるグループが対象グループに選ばれる。なお、グループに属するＯＣＲの数が最大のものが複数ある場合は、例えばそれらグループのうち、予め定められた優先順位が最も高いＯＣＲを含むグループを対象グループに選べばよい。

また、別の例として、Ｎ個のＯＣＲの中から選ばれた基準のＯＣＲと同じＯＣＲ結果を出力したＯＣＲからなるグループを対象グループに選ぶという基準を用いてもよい。

選ばれた対象グループに含まれるＯＣＲのことを、採用されたＯＣＲと呼ぶ。言い換えれば、Ｎ個のＯＣＲの中からその所定の基準に従って採用したＯＣＲの集合が、対象グループである。

閾値選択部２２は、Ｎ個のＯＣＲのうちの１以上のＯＣＲからなる全てのグループについて、そのグループに対応する閾値情報を記憶している。これら各グループに対応する閾値情報は、補助記憶装置１０６に記憶されている。例えば、図１６に示すように、Ｎ個のＯＣＲにそれぞれ通し番号を割り振り、それら各ＯＣＲの番号に対応づけて、そのＯＣＲが対象グループに採用されたか否かを１（採用）と０（非採用）とで表すとする。このようにしてできるＮビットの二値コードは、個々のグループを一意に識別する識別コードとなる。補助記憶装置１０６には、例えばこの識別コードに対応付けて、閾値情報を記憶しておく。

閾値情報としては、例えば、Ｎ個のＯＣＲが出力する確度１、２、・・・、Ｎをそれぞれ座標成分とするＮ次元空間における超曲面である、閾値超曲面を用いる。Ｎが２の場合の閾値超曲面は２次元平面内の曲線であり、Ｎが３の場合の閾値超曲面は３次元空間内の曲面である。

ここで、グループに属するＯＣＲの数ｎが小さいほど、そのグループに対応する閾値超曲面はＮ次元空間内で上に位置する。例えば、ＯＣＲ１と２のＯＣＲ結果のみが合致する組合せ（すなわちＯＣＲ１と２〜なるグループ）に対応する閾値超曲面は、ＯＣＲ１，２，３のＯＣＲ結果が合致する組合せに対応する閾値超曲面よりも上に位置する。これにより、合致するＯＣＲ結果の数が少ないほど、そのＯＣＲ結果に第１処理が適用されるための条件、すなわち閾値超曲面が示す閾値、が厳しいものとなる。

閾値選択部２２は、補助記憶装置１０６から、さきに選択した対象グループに対応する閾値情報（例えば閾値超曲面）を読み出し、閾値比較部２４に渡す。

閾値比較部２４は、その閾値情報を用いて、Ｎ個のＯＣＲから取得したＮ個の確度の組が閾値より高いか否かを判定する。具体的な例では、それらＮ個の確度の組が示すＮ次元座標が、対象グループに対応する閾値超曲面より上に位置するか否かを判定する。そして閾値比較部２４は、この判定の結果がＹｅｓならば第１処理を選択し、そうでなければ第２処理を選択する。

図１７を参照して、この例におけるプロセッサ１０２の処理手順の一例を説明する。この例では、プロセッサ１０２は、まずＮ個のＯＣＲ１〜ＮからＯＣＲ結果１〜Ｎ及び確度１〜Ｎを取得する（Ｓ１００ｄ）。次にプロセッサ１０２は、ＯＣＲ結果１〜Ｎを突合し（Ｓ１４０）、その突合の結果に基づき、所定の基準に従って対象グループを判定する（Ｓ１４１）。更にプロセッサ１０２は、その判定グループに対応する閾値超曲面を選択し（Ｓ１４２）、確度１〜Ｎが表すＮ次元座標がその閾値超曲面より上に位置するか否かを判定する（Ｓ１４４）。例えば、そのＮ次元座標と座標原点とを結ぶ線分がその閾値超曲面と交われば、そのＮ次元座標はその閾値超曲面より上に有ると判定される。プロセッサ１０２は、Ｓ１４４の判定結果がＹｅｓであれば、その対象グループに対応する合致したＯＣＲ結果に対して第１処理を適用し（Ｓ１４６）、そうでなければ第２処理を適用する（Ｓ１４８）。

以上に説明したＮ個のＯＣＲを用いるシステムでは、ＯＣＲ結果の全てが合致した場合でも、直ちにそのＯＣＲ結果を採用することとはせず、更にそれらＯＣＲの確度が閾値の条件を満たしてはじめてそのＯＣＲ結果を採用する。したがって、誤ったＯＣＲ結果同士が偶然合致した結果、最終的な認識結果として採用されてしまう、という事態が生じにくくなる。
＜閾値設定＞

本実施形態のシステムは、判定に用いる閾値の設定をユーザから受け付けるＵＩ（ユーザインタフェース）画面を提供していてもよい。

図１８に、このＵＩ画面６００を例示する。このＵＩ画面６００は、図６に例示した手順で用いる閾値１−１、閾値１−２、閾値２を設定するためのものである。

このＵＩ画面６００は、図７に例示したのと同様の散布図５００を表示する。この散布図５００上で、確度１に対する閾値１−１及び閾値２と、確度２に対する閾値１−２の設定を受け付ける。閾値１−１及び閾値２は、それぞれ散布図５００を横切る水平な線で示され、閾値１−２は散布図５００と交わる縦方向の線として示される。閾値１−１の入力欄６０２、閾値１−２の入力欄６０４、閾値２の入力欄６０６に対して、ユーザはそれぞれ閾値の値を入力する。散布図５００上に示される各閾値の線は、それら入力欄６０２〜６０６内の閾値に応じた位置に表示される。

またＵＩ画面６００内には、認識率表示欄６１０と割合表示欄６２０とが示される。認識率表示欄６１０には、ユーザが設定した閾値群により実現される認識率が示される。この認識率は、図６の手順において第１処理（Ｓ１８）を実行した場合の認識率すなわち正解率である。この例では第１処理はＯＣＲ結果１をシステムの最終的な認識結果として出力するものとする。この場合に表示される認識率は、設定された閾値群のもとで、Ｓ２４及びＳ２６の判定結果が共にＹｅｓとなるサンプル画像群、及びＳ２２の判定結果がＹｅｓとなるサンプル画像群の総数のうち、対応するＯＣＲ結果１が正認識であるものの割合である。また、割合表示欄６２０は、サンプル画像の総数のうち、設定された閾値群のもとで第１処理（Ｓ１８）が適用されるものの割合を表示する。この割合が高い程、必要な人間の作業量が少なくなる。ユーザは、各閾値をそれぞれ変えながら、認識率表示欄６１０及び割合表示欄６２０に表示される値を確認し、所望の性能が得られる閾値の組合せを決定する。
＜次元圧縮＞

以上の例では、Ｎ個の確度からなるＮ次元空間上で閾値処理を行っていたが、そのＮ次元の空間をより次元数の少ない空間に圧縮してから閾値処理を行ってもよい。

例えば、ＯＣＲ１と２の２つを用いるシステムにおいて、

Ｘ＝ｍｉｎ（確度１，確度２）

となるＸを求め、Ｘが閾値より高いか否かにより、リジェクトか非リジェクトか、すなわち第２処理を選択するか第１処理を選択するか、を判定してもよい。この例は２次元を１次元に圧縮する例である。

より一般化すると、ｕ＜Ｎ（ｕは２以上の整数）とし、ある関数ｆｕｎｃを用いて

（ｘ１，ｘ２，・・・、ｘｕ）＝ｆｕｎｃ（確度１，確度２，・・・，確度Ｎ）

となるｕ次元のベクトル（ｘ１，ｘ２，・・・、ｘｕ）を求める。そして、ｕ次元空間内に規定された閾値超曲面とベクトル（ｘ１，ｘ２，・・・、ｘｕ）との位置関係に基づき、リジェクトか非リジェクトかを判定する。

以上に説明した実施形態はあくまで例示的なものにすぎない。本発明の範囲内で、様々な変形が可能である。

＜補遺＞
以上に説明した実施形態は、例えば以下に列挙する技術的な構成を示している。
［構成（１）］
プロセッサを備え、
前記プロセッサは、
第１の認識器から、対象データに対する第１の認識結果及び第１の認識確度を取得し、
第２の認識器から、前記対象データに対する第２の認識結果及び第２の認識確度を取得し、
前記第１の認識結果と前記第２の認識結果との突合を実行し、
前記突合の結果、前記第１の認識結果と前記第２の認識結果とが合致した場合に第１制御を実行し、
前記第１制御は、前記第１の認識確度及び前記第２の認識確度の少なくとも一方に基づいて、合致した認識結果に対して第１の処理と第２の処理のいずれかを実行して処理結果を出力する処理であり、
前記第１の処理のために必要な人の作業量は、前記第２の処理のために必要な人の作業量よりも少ないことを特徴とする、
情報処理装置。

［構成（２）］
前記第１の認識器及び前記第２の認識器のうち前記第１の認識器が基準の認識器として選ばれている場合に、
前記第１制御では、前記第１の認識確度が閾値より高い場合には、合致した前記認識結果に対して前記第１の処理を実行し、前記第１の認識確度が前記閾値以下の場合には、合致した前記認識結果に対して前記第２の処理を実行する、
構成（１）に記載の情報処理装置。

［構成（３）］
前記プロセッサは、更に、
前記突合を実行する前に、前記第１の認識確度が、前記閾値より高い第２の閾値よりも高い場合には、前記第１の認識結果に対して前記第１の処理を実行し、
前記突合は、前記第１の認識確度が前記第２の閾値以下の場合に実行される、
構成（２）に記載の情報処理装置。

［構成（４）］
前記第１制御では、前記第１の認識確度が第３の閾値より高く且つ前記第２の認識確度が第４の閾値より高い場合には、合致した前記認識結果に対して前記第１の処理を実行し、前記第１の認識確度が第３の閾値以下又は前記第２の認識確度が第４の閾値以下の場合には、合致した前記認識結果に対して前記第２の処理を実行する、
構成（１）に記載の情報処理装置。

［構成（５）］
前記第３の閾値は、前記第１制御において前記第２の認識確度を用いない場合において、合致した認識結果に対して前記第１の処理と前記第２の処理のいずれを実行するかの制御に用いる前記第１の認識確度についての閾値、よりも低い、
構成（４）に記載の情報処理装置。

［構成（６）］
前記突合の結果、前記第１の認識結果と前記第２の認識結果とが合致しなかった場合に第２制御を実行し、
前記第２制御は、前記第１の認識確度が前記閾値より高い第２の閾値より高い場合には、前記第１の認識結果に対して前記第１の処理を実行し、前記第１の認識確度が前記第２の閾値以下の場合には、前記第１の認識結果に対して前記第２の処理を実行する制御である、
構成（２）、（４）又は（５）に記載の情報処理装置。

［構成（７）］
前記第１制御では、合致した認識結果に対して前記第１の処理と前記第２の処理のいずれを実行するかを、前記第１の認識確度と前記第２の認識確度の両方に基づいて制御する、
構成（１）に記載の情報処理装置。

［構成（８）］
前記プロセッサは、更に、
前記突合を実行する前に、前記第１の認識確度が、第５の閾値よりも高い場合には、前記第１の認識結果に対して前記第１の処理を実行し、
前記突合を実行する前に、前記第２の認識確度が、第６の閾値よりも高い場合には、前記第２の認識結果に対して前記第１の処理を実行し、
前記突合は、前記第１の認識確度が前記第５の閾値以下であり且つ前記第２の認識確度が前記第６の閾値以下の場合に実行される、
構成（７）に記載の情報処理装置。

［構成（９）］
第１座標軸が前記第１の認識確度を表し第２座標軸が前記第２の認識確度を表す２次元空間、の中に閾値曲線が規定され、
前記第１制御では、前記対象データについて前記第１の認識器及び前記第２の認識器から取得した前記第１の認識確度及び前記第２の認識確度をそれぞれ座標成分とする前記２次元空間内での座標が、前記閾値曲線より上に位置する場合には、合致した前記認識結果に対して前記第１の処理を実行し、前記座標が前記閾値曲線上又は前記閾値曲線より下に位置する場合には、合致した前記認識結果に対して前記第２の処理を実行する、
構成（７）に記載の情報処理装置。

［構成（１０）］
前記突合の結果、前記第１の認識結果と前記第２の認識結果とが合致しなかった場合に第２制御を実行し、
前記第２制御は、前記座標が第２閾値曲線より上に位置する場合には、前記第１の認識結果又は前記第２の認識結果に対して前記第１の処理を実行し、前記座標が前記第２閾値曲線上又は前記第２閾値曲線より下に位置する場合には、前記第１の認識結果又は前記第２の認識結果に対して前記第２の処理を実行する制御であり、
前記第２閾値曲線は、前記第１制御に用いられる前記閾値曲線より前記２次元空間内で上に位置する、
構成（８）に記載の情報処理装置。

［構成（１１）］
前記第２の制御において前記第１の処理又は前記第２の処理の対象とする認識結果は、前記第１の認識確度及び前記第２の認識確度のうちの高い方に対応する認識結果である、構成（１０）に記載の情報処理装置。

［構成（１２）］
前記プロセッサは、更に
第３の認識器から、前記対象データに対する第３の認識結果及び第３の認識確度を取得し、
前記突合では、前記第１の認識結果と前記第２の認識結果と前記第３の認識結果と、の突合を実行し、
前記突合の結果、前記第１の認識結果と前記第２の認識結果と前記第３の認識結果とのすべてが合致した場合に、前記第１制御に代えて第３制御を実行し、
前記第３制御は、前記第１の認識確度と前記第２の認識確度と前記第３の認識確度とのうちの少なくとも一つに基づいて、合致した認識結果に対して前記第１の処理と前記第２の処理のいずれかを実行して処理結果を出力することである、
構成（１）に記載の情報処理装置。

［構成（１３）］
第１座標軸が前記第１の認識確度を表し第２座標軸が前記第２の認識確度を表し第３座標軸が前記第３の認識確度を表す３次元空間、の中に閾値曲面が規定され、
前記第３制御では、前記対象データについて前記第１の認識器及び前記第２の認識器及び前記第３の認識器から取得した前記第１の認識確度及び前記第２の認識確度及び前記第３の認識確度に対応する前記３次元空間内での座標が、前記閾値曲面より上に位置する場合には、合致した前記認識結果を出力し、前記座標が前記閾値曲面上又は前記閾値曲面より下に位置する場合には、合致した前記認識結果を出力しない、
構成（１２）に記載の情報処理装置。

［構成（１４）］
前記突合の結果、前記第１の認識結果と前記第２の認識結果と前記第３の認識結果とのうち２つが合致し、残りの１つがそれら２つと合致しなかった場合に第４制御を実行し、
前記第４制御は、前記座標が第２閾値曲面より上に位置する場合には、合致した前記認識結果を出力し、前記座標が前記第２閾値曲面上又は前記第２閾値曲面より下に位置する場合には、合致した前記認識結果を出力しない制御であり、
前記第２閾値曲面は、前記第１制御に用いられる前記閾値曲面より前記３次元空間内で上に位置する、
構成（１３）に記載の情報処理装置。

［構成（１５）］
前記突合の結果、前記第１の認識結果と前記第２の認識結果と前記第３の認識結果とのうちどの２つが合致したかに応じて、前記第２閾値曲面として異なる曲面を用いる、
構成（１４）に記載の情報処理装置。

［構成（１６）］
前記突合の結果、前記第１の認識結果と前記第２の認識結果と前記第３の認識結果とのうちのどの２つも合致しなかった場合に第５制御を実行し、
前記第５制御は、前記座標が第３閾値曲面より上に位置する場合には、合致した前記認識結果を出力し、前記座標が前記第３閾値曲面上又は前記第２閾値曲面より下に位置する場合には、合致した前記認識結果を出力しない制御であり、
前記第３閾値曲面は、前記第２閾値曲面より前記３次元空間内で上に位置する、
構成（１４）又は（１５）に記載の情報処理装置。

［構成（１７）］
前記プロセッサは、更に
ｋ＝３からｋ＝Ｎ（Ｎは３以上の整数）までの各ｋについて、第ｋの認識器から、前記対象データに対する第ｋの認識結果及び第ｋの認識確度を取得し、
前記突合では、ｋ＝１からｋ＝Ｎまでの各ｋについての前記第ｋの認識結果同士の突合を実行し、
前記突合の結果、ｋ＝１からｋ＝Ｎまでの各ｋについての前記第ｋの認識結果のすべてが合致した場合に、前記第１制御に代えて第３制御を実行し、
前記第３制御は、ｋ＝１からｋ＝Ｎまでの各ｋについての前記第ｋの認識確度のうちの少なくとも一つに基づいて、合致した認識結果に対して第１の処理と第２の処理のいずれかを実行して処理結果を出力することである、
構成（１）に記載の情報処理装置。

［構成（１８）］
ｋ＝１からｋ＝Ｎまでの各ｋについて第ｋ座標軸が前記第ｋの認識確度をそれぞれ表すＮ次元空間、の中に閾値超曲面が規定され、
前記第３制御では、ｋ＝１からｋ＝Ｎまでの各ｋについての前記第ｋの認識確度をそれぞれ座標成分とするＮ次元座標が、前記閾値超曲面より上に位置する場合には、合致した前記認識結果に対して前記第１の処理を実行し、前記Ｎ次元座標が前記閾値超曲面上又は前記閾値超曲面より下に位置する場合には、合致した前記認識結果に対して前記第２の処理を実行する、
構成（１７）に記載の情報処理装置。

［構成（１９）］
ｎ＝１からＮまでの各ｎについて、ｎ個の前記認識器からなるグループごとに前記閾値超曲面が規定されており、
前記プロセッサは、
前記突合の結果、互いに合致した認識結果を出力した１以上の前記認識器からなるグループの中から所定の基準に従って対象グループを選択し、前記Ｎ次元座標が前記対象グループに対して規定された前記閾値超曲面より上に位置する場合には、前記対象グループ内で合致した前記認識結果に対して前記第１の処理を実行し、前記Ｎ次元座標が前記閾値超曲面上又は前記閾値超曲面より下に位置する場合には、前記対象グループ内で合致した前記認識結果に対して前記第２の処理を実行する、
ことを特徴とする構成（１８）に記載の情報処理装置。

［構成（２０）］
前記所定の基準は、互いに合致した認識結果を出力した１以上の前記認識器からなるグループのうち、当該グループに属する前記認識器の数が最大であるグループを前記対象グループに選択するという基準である、
構成（１９）に記載の情報処理装置。

［構成（２１）］
前記ｎ個の前記認識器からなるグループごとに規定された前記閾値超曲面は、前記ｎが小さいほど前記Ｎ次元空間において上に位置する、
構成（１９）又は（２０）に記載の情報処理装置。

１０，２０突合部、１２，１４，２４閾値比較部、１６，１８後段処理部、２２閾値選択部、２６確認修正部、５０入力画像データ、１０２プロセッサ、１０４メモリ、１０６補助記憶装置、１０８入出力装置、１１０ネットワークインタフェース、１１２バス。

Claims

プロセッサを備え、
前記プロセッサは、
第１の認識器から、対象データに対する第１の認識結果及び第１の認識確度を取得し、
第２の認識器から、前記対象データに対する第２の認識結果及び第２の認識確度を取得し、
前記第１の認識結果と前記第２の認識結果との突合を実行し、
前記突合の結果、前記第１の認識結果と前記第２の認識結果とが合致した場合に第１制御を実行し、
前記第１制御は、前記第１の認識確度及び前記第２の認識確度の少なくとも一方に基づいて、合致した認識結果に対して第１の処理と第２の処理のいずれかを実行して処理結果を出力する処理であり、
前記第１の処理のために必要な人の作業量は、前記第２の処理のために必要な人の作業量よりも少ないことを特徴とする、
情報処理装置。
前記第１制御では、前記第１の認識確度が閾値より高い場合には、合致した前記認識結果に対して前記第１の処理を実行し、前記第１の認識確度が前記閾値以下の場合には、合致した前記認識結果に対して前記第２の処理を実行する、
請求項１に記載の情報処理装置。
前記プロセッサは、更に、
前記突合を実行する前に、前記第１の認識確度が、前記閾値より高い第２の閾値よりも高い場合には、前記第１の認識結果に対して前記第１の処理を実行し、
前記突合は、前記第１の認識確度が前記第２の閾値以下の場合に実行される、
請求項２に記載の情報処理装置。
前記第１制御では、前記第１の認識確度が第３の閾値より高く且つ前記第２の認識確度が第４の閾値より高い場合には、合致した前記認識結果に対して前記第１の処理を実行し、前記第１の認識確度が第３の閾値以下又は前記第２の認識確度が第４の閾値以下の場合には、合致した前記認識結果に対して前記第２の処理を実行する、
請求項１に記載の情報処理装置。
前記第３の閾値は、前記第１制御において前記第２の認識確度を用いない場合において、合致した認識結果に対して前記第１の処理と前記第２の処理のいずれを実行するかの制御に用いる前記第１の認識確度についての前記閾値、よりも低い、
請求項４に記載の情報処理装置。
前記突合の結果、前記第１の認識結果と前記第２の認識結果とが合致しなかった場合に第２制御を実行し、
前記第２制御は、前記第１の認識確度が前記閾値より高い第２の閾値より高い場合には、前記第１の認識結果に対して前記第１の処理を実行し、
前記第１の認識確度が前記第２の閾値以下の場合には、前記第１の認識結果に対して前記第２の処理を実行する制御である、
請求項２、４又は５に記載の情報処理装置。
前記第１制御では、合致した認識結果に対して前記第１の処理と前記第２の処理のいずれを実行するかを、前記第１の認識確度と前記第２の認識確度の両方に基づいて制御する、
請求項１に記載の情報処理装置。
前記プロセッサは、更に、
前記突合を実行する前に、前記第１の認識確度が、第５の閾値よりも高い場合には、前記第１の認識結果に対して前記第１の処理を実行し、
前記突合を実行する前に、前記第２の認識確度が、第６の閾値よりも高い場合には、前記第２の認識結果に対して前記第１の処理を実行し、
前記突合は、前記第１の認識確度が前記第５の閾値以下であり且つ前記第２の認識確度が前記第６の閾値以下の場合に実行される、
請求項７に記載の情報処理装置。
前記プロセッサは、更に
ｋ＝３からｋ＝Ｎ（Ｎは３以上の整数）までの各ｋについて、第ｋの認識器から、前記対象データに対する第ｋの認識結果及び第ｋの認識確度を取得し、
前記突合では、ｋ＝１からｋ＝Ｎまでの各ｋについての前記第ｋの認識結果同士の突合を実行し、
前記突合の結果、ｋ＝１からｋ＝Ｎまでの各ｋについての前記第ｋの認識結果のすべてが合致した場合に、前記第１制御に代えて第３制御を実行し、
前記第３制御は、ｋ＝１からｋ＝Ｎまでの各ｋについての前記第ｋの認識確度のうちの少なくとも一つに基づいて、合致した認識結果に対して第１の処理と第２の処理のいずれかを実行して処理結果を出力することである、
請求項１に記載の情報処理装置。
コンピュータに、
第１の認識器から、対象データに対する第１の認識結果及び第１の認識確度を取得し、
第２の認識器から、前記対象データに対する第２の認識結果及び第２の認識確度を取得し、
前記第１の認識結果と前記第２の認識結果との突合を実行し、
前記突合の結果、前記第１の認識結果と前記第２の認識結果とが合致した場合に第１制御を実行する、
処理を実行させるためのプログラムであって、
前記第１制御は、前記第１の認識確度及び前記第２の認識確度の少なくとも一方に基づいて、合致した認識結果に対して第１の処理と第２の処理のいずれかを実行して処理結果を出力、することであり、
前記第１の処理のために必要な人の作業量は、前記第２の処理のために必要な人の作業量よりも少ない、ことを特徴とするプログラム。