JP2010049413A - 情報処理装置、制御方法、及びプログラム - Google Patents

情報処理装置、制御方法、及びプログラム Download PDF

Info

Publication number
JP2010049413A
JP2010049413A JP2008212036A JP2008212036A JP2010049413A JP 2010049413 A JP2010049413 A JP 2010049413A JP 2008212036 A JP2008212036 A JP 2008212036A JP 2008212036 A JP2008212036 A JP 2008212036A JP 2010049413 A JP2010049413 A JP 2010049413A
Authority
JP
Japan
Prior art keywords
recognition
image
image recognition
unit
evaluation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2008212036A
Other languages
English (en)
Other versions
JP5116608B2 (ja
Inventor
Gaho Hashiguchi
賀保 橋口
Kinya Osa
欣也 大佐
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2008212036A priority Critical patent/JP5116608B2/ja
Priority to US12/543,768 priority patent/US8559728B2/en
Publication of JP2010049413A publication Critical patent/JP2010049413A/ja
Application granted granted Critical
Publication of JP5116608B2 publication Critical patent/JP5116608B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/94Hardware or software architectures specially adapted for image or video understanding
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/98Detection or correction of errors, e.g. by rescanning the pattern or by human intervention; Evaluation of the quality of the acquired patterns
    • G06V10/987Detection or correction of errors, e.g. by rescanning the pattern or by human intervention; Evaluation of the quality of the acquired patterns with the intervention of an operator

Abstract

【課題】複数の画像認識手段の中から利用者にとって認識目的に適合する画像認識手段を選択することを可能とする。
【解決手段】テスト端末101は、評価条件設定部205、評価部207を備える。画像認識サーバ111〜113は、各々画像認識部を備える。利用者がテスト端末101に、テストデータを入力し、期待する認識結果に関する情報と判定条件を評価条件として入力すると、評価条件設定部205は評価条件を設定し、テストデータ送信制御部202はテストデータを各画像認識部に送信する。各画像認識部から返信される画像認識処理された認識結果を受信し、認識結果蓄積部208に認識結果を保存する。評価部207は認識結果蓄積部208に保存された認識結果を評価条件に従い評価し、評価条件に適合する認識結果を返信した画像認識部を選択する。
【選択図】図2

Description

本発明は、画像の認識結果を評価する情報処理装置、制御方法、及びプログラムに関する。
従来、例えば撮影した画像などの画像認識(被写体である人物の顔等の判別)を行う画像認識装置がある。一般的に複数の異なる画像認識装置の各々の機能を比較すると、認識対象が同じ場合でも、認識対象の画像の画質/解像度/サイズ/向き等の諸条件で得意や不得意がある。即ち、各々の画像認識装置の認識精度が認識対象によって異なるため、各々の画像認識装置により得られる認識結果は異なる。そのため、認識対象の画像と認識目的に応じて、認識精度が異なる複数の画像認識装置から認識目的に適合する画像認識装置を選択する必要がある。
上記の点から、認識目的に適合する画像認識装置を選択する手法に関する技術が提案されている(例えば、特許文献1参照)。特許文献1記載の技術は、文書画像認識システムにおける入力画像の分析結果に応じて、複数の異なる画像(文字)認識装置から認識目的に適合する画像(文字)認識装置を選択する手法である。入力画像の分析においては、入力画像が表形式の画像か、或いは文書形式の画像か、或いは何ポイントの文字かを調べている。
特開2002−279348号公報
しかしながら、特許文献1に例示されるような画像認識システムでは、管理装置が予め複数の画像認識装置の特性を把握している必要がある。そのため、画像認識装置の学習やバージョンアップによって認識精度や特性が変わった場合に、管理装置では認識精度や特性に追従することが難しい。また、管理装置側で予め複数の画像認識装置の特性を把握していたとしても、実際に利用者が使用する認識対象の画像や条件に即した特性であるとは限らない。これらの点は、複数の画像認識装置から認識目的に適合する画像認識装置を選択することを一層難しくさせているという課題がある。
本発明の目的は、複数の画像認識手段の中から利用者にとって認識目的に適合する画像認識手段を選択することを可能とした情報処理装置、制御方法、及びプログラムを提供することにある。
上述の目的を達成するために、本発明は、画像に含まれる認識対象を検出する認識処理を行う複数の画像認識手段にテスト用の画像データを送出する送出手段と、前記複数の画像認識手段から各々得られる複数の認識結果を比較するための評価条件を設定する設定手段と、前記複数の画像認識手段から各々得られる複数の認識結果から、前記設定手段により設定された前記評価条件に適合する認識結果を得た画像認識手段を選択する評価手段と、を備えることを特徴とする。
本発明によれば、複数の画像認識手段から各々得られる複数の認識結果から評価条件に適合する認識結果を得た画像認識手段を選択する。これにより、複数の画像認識手段の中から利用者にとって認識目的に適合する画像認識手段を選択することが可能となる。
以下、本発明の実施の形態を図面に基づいて説明する。
図1は、本発明の実施の形態に係る画像認識システムの構成例を示す概念図である。
図1において、画像認識システムは、テスト端末101、画像認識サーバ1・111、画像認識サーバ2・112、画像認識サーバ3・113をネットワーク102を介して通信可能に接続した構成を有する。以後、画像認識サーバ1・111、画像認識サーバ2・112、画像認識サーバ3・113を、それぞれ、画像認識サーバ111、画像認識サーバ112、画像認識サーバ113と表記する。
本実施の形態では、画像認識サーバを3台設置した場合を例に挙げるものとするが、画像認識サーバの設置台数は適宜変更可能である。また、テスト端末101、画像認識サーバ111〜113は、複数のネットワークに接続される構成でも構わない。この場合、テスト端末101、画像認識サーバ111〜113は、通信相手を特定して通信できればよい。また、ネットワーク102は、LAN或いはWANのようなIP(Internet Protocol)通信網を想定しているが、専用の通信網等、映像や音声を通信するために十分な回線が確保できればどのような通信媒体でも構わない。
テスト端末101は、例えば情報処理装置として構成されており、ネットワーク102を介して画像認識サーバ111〜113との間で通信を行う。テスト端末101は、画像認識サーバ111〜113に対しテストデータを送信して認識結果を取得する機能、テストデータの認識結果を評価するための評価条件を設定する機能、設定した評価条件に基づいてテストデータの認識結果を評価する機能を有する。
画像認識サーバ111〜113は、テスト端末101から送信されるテストデータである画像データ(例えば動画(映像)データ或いは静止画データ)に含まれる認識対象の認識及び弁別を行う。画像認識サーバ111〜113は、画像データが人物を撮影した写真を示す画像データの場合は、人物の顔の検出、顔の弁別、男女の判別、年齢の判別を行う画像認識サービスを利用者に提供する。尚、画像データは文字画像データでもよく、画像認識サーバ111〜113は文字認識サービスを提供するサーバであってもよい。
本実施の形態では、上記のように認識対象画像として例えば人物の撮影画像(写真)を想定しており、撮影画像に対して画像認識を行う。また、本実施の形態では、画像認識サーバ111〜113は各々特性が異なる画像認識アルゴリズムを有する場合を例に挙げ説明する。例えば同じ顔検出であっても、正面画像のみに対応した顔検出、横向き画像でも認識できる顔検出、顔が小さくしか写っていない画像に対応した顔検出、低解像度の画像に対応する顔検出のように特性が異なるものがありうる。本実施の形態では、このような特性が異なる場合にも画像認識が可能である。
図2は、画像認識システムのテスト端末及び画像認識サーバの詳細構成を示すブロック図である。尚、図2に示す構成は、本発明の送出手段、設定手段、評価手段、指定手段を実現するための一例である。また、図3(a)は、テスト画像、図3(b)は、期待する認識結果、図3(c)、図3(d)、図3(e)、図3(f)は、各々の画像認識部の認識結果を示す図である。
図2において、テスト端末101は、テストデータ入力部201、テストデータ送信制御部202、通信部203、入力部204、評価条件設定部205、表示部206、評価部207、認識結果蓄積部208を備えている。画像認識サーバ111には、通信部211、画像認識部1・212が実装されている。画像認識サーバ112には、通信部221、画像認識部2・222、画像認識部3・223が実装されている。画像認識サーバ113には、通信部231、画像認識部4・232が実装されている。
テスト端末101の通信部203は、ネットワーク102を介して画像認識サーバ111〜113との間でデータの送受信を行う。画像認識サーバ111〜113の各々の通信部は、ネットワーク102を介してテスト端末101との間でデータの送受信を行う。画像認識サーバ111〜113の各々の画像認識部は、画像に含まれる認識対象を検出(認識、弁別、判別を含む)する認識処理を行う。以後、画像認識部1・212、画像認識部2・222、画像認識部3・223、画像認識部4・232を、それぞれ、画像認識部212、画像認識部222、画像認識部223、画像認識部232と表記する。
テスト端末101において、テストデータ入力部201は、利用者がテスト用の画像データ(テストデータ)を入力する際に用いる。テストデータ入力部201は、入力されたテストデータをテストデータ送信制御部202に出力する。テストデータ送信制御部202(送出手段)は、テストデータを通信部203及びネットワーク102を介して画像認識サーバ111〜113に送信する。評価条件設定部205(設定手段)は、画像認識サーバ111〜113による画像の認識結果を評価するための評価条件を利用者からの入力に基づき設定するものであり、設定した評価条件を評価部207に出力する。
入力部204は、利用者が表示部206に表示された画像に対して操作(例えば人物の顔位置を囲む等の操作)や、テストデータの認識結果に対する評価条件の入力を行うためのユーザインタフェース(例えばマウスやキーボード)である。入力部204(指定手段)は、利用者の操作に対応する情報や、入力された評価条件を評価条件設定部205に出力する。認識結果蓄積部208は、画像認識サーバ111〜113からネットワーク102及び通信部203を介して送信されてくる認識結果を蓄積する。
評価部207(評価手段)は、認識結果蓄積部208に蓄積された認識結果を、評価条件設定部205により設定された評価条件に基づき評価し、その評価結果を表示部206に出力する。換言すれば、評価部207は、複数の画像認識部から各々得られる複数の認識結果から評価条件に適合する認識結果を得た画像認識部を選択する。表示部206は、利用者が評価条件を設定するためのGUI(Graphical User Interface)の表示、評価結果の表示などを行う。尚、テスト端末101に装備されているCPU(不図示)は、制御プログラムに基づき後述の図4のフローチャートに示す処理を実行する。
「評価条件」とは、利用者が画像認識サーバ111〜113の各々の画像認識部に期待する認識結果と、実際の認識結果と期待する認識結果を比較するための判定条件と、を組み合わせたものである。「期待する認識結果」とは、各々の画像認識部の画像認識処理で得られる認識結果に対して、利用者が期待する結果である。各々の画像認識部から認識結果として検出位置をテスト端末101に返信する場合、検出位置の例としては図3(b)に示すものがある。図3(b)に示す期待する認識結果310では、利用者が期待する認識対象(人物の顔位置)が矩形部で範囲指定されている。
本実施の形態では、認識対象を範囲指定する形状として矩形を例に挙げているが、楕円形、円形、或いは認識対象に合わせた形状など、任意の形状を用いてよい。即ち、検出位置がどの範囲に属するものであるかを判断できる範囲指定が可能であればよい。例えば人物の顔が並ぶ集合写真では、範囲指定する形状を、矩形よりも円形、円形よりも物体形状とした方が精度高く評価できる。また、一般的に形状が複雑になると指定範囲内と判断するための計算やデータ量が増えるため、利用者の要求に応じて形状を決めた方がよい。
「判定条件」とは、上記の通り、期待する認識結果と実際の認識結果とを比較するための条件である。例えば期待する認識結果として検出位置が矩形で範囲指定されている場合、画像認識部から送信された検出位置が指定範囲の内側か外側かを調べて数えた結果、指定範囲の内側を検出した数が最も多い画像認識部を画像認識に適すると判定する。また、他の例としては以下の方法が考えられる。ある指定範囲の内側に検出位置が2個以上検出された場合は、その指定範囲内の検出数を1個としてカウントし、指定範囲の内側を検出した数が最も多い画像認識部を画像認識に適すると判定する。
次に、上記構成を有する本実施の形態の画像認識システムの動作を図2及び図3を参照しながら説明する。
最初に、利用者は画像認識サーバ111〜113の各々の画像認識部に認識させるテスト用の画像データ(テストデータ)を準備し、テスト端末101のテストデータ入力部201から入力する。更に、テストデータの認識結果に対する評価条件を入力部204から入力し、評価条件設定部205に設定する。本実施の形態では、図3(a)に示すテスト画像300をテストデータとして準備したものとする。テスト画像300は、手前に4人と奥に3人の人物が映っており更に背景も含む写真画像である。
利用者が評価条件設定部205に設定した評価条件は、期待する認識結果としてテスト画像300中の例えば手前の4人の人物の顔だけを検出することとする。また、判定条件は、期待する認識結果(顔位置)の他に顔を誤検出しないこととする。そこで、利用者は期待する認識結果の情報を作成するため、表示部206に表示されたテスト画像300を見ながら(図3(a))、入力部204(マウス)を用いて期待する認識結果(顔位置)を矩形で囲む操作を行う(図3(b))。
次に、利用者は評価条件設定部205で実際の認識結果と期待する認識結果とを比較するための判定条件を、入力部204を用いて設定する。判定条件としては以下の例が考えられる。評価部207は、例えば人物の顔位置が期待する認識結果310において矩形の指定範囲内で検出されている場合はカウント値を上げ、期待する認識結果310において矩形の指定範囲外で検出されている場合はカウント値を下げる計算を行う。評価部207は、カウント値が最も多い認識結果を送信してきた画像認識部を画像認識に適すると判断する。
認識対象の認識結果が矩形の指定範囲内で検出されたと判定する方法としては以下の方法が考えられる。例えば認識対象の認識結果が点座標で表現される場合で且つ点座標が矩形の指定範囲内に存在する場合に、認識結果が矩形の指定範囲内であると判定する方法がある。また、例えば認識対象の認識結果が矩形である場合で且つ実際の認識結果の矩形と期待する認識結果の矩形の重なりが一定以上ある場合に、認識結果が矩形の指定範囲内であると判定する方法もある。
判定条件を設定する方法としては以下の方法が考えられる。例えば予め用意されている複数の判定条件のリストから利用者が入力部204を用いて所望の判定条件を選択することで、判定条件を設定する方法がある。また、例えば判定条件を詳細に記述したプログラムを作成することで、判定条件を設定する方法がある。判定条件は、画像の認識結果を定量的に評価できればどのような手段でも構わない。
評価条件は、評価条件設定部205から評価部207に伝えられる。評価部207は、画像認識サーバ111〜113の各々の画像認識部から認識結果が送信されてくるのを待つことになる。評価条件設定部205で評価条件の設定が完了した後、テストデータ送信制御部202は、テスト画像300を通信部203及びネットワーク102を介して複数の画像認識サーバの各々の画像認識部に送信する。テスト端末101からテスト画像300を受信した各々の画像認識部は、画像認識処理を実行し、得られた認識結果を各々の通信部及びネットワーク102を介してテスト端末101に返信する。
テスト端末101は、各々の画像認識部から返信された認識結果を認識結果蓄積部208に蓄積する。この場合、画像認識部212はテスト画像300に対して図3(c)の認識結果320(顔位置)を検出したものとする。同様に、画像認識部222は図3(d)の認識結果330、画像認識部223は図3(e)の認識結果340、画像認識部232は図3(f)の認識結果350を各々検出したものとする。評価部207は、各々の認識結果320、330、340、350で示す矩形と、期待する認識結果310の矩形とが重なっている場合、矩形の指定範囲内の検出であると判定している。
まず、図3(c)の認識結果320では、手前の4人の人物の顔を矩形内に検出できているが背景を顔として誤検出してしまっている。また、図3(d)の認識結果330では、人物の顔の大小に関わらず顔が全て検出されている。また、図3(e)の認識結果340では、人物の一定サイズ以上の大きい顔だけが検出(手前の4人の人物の顔のみが検出)されている。また、図3(f)の認識結果350では、人物の一定サイズ以下の小さい顔だけが検出(後方の3人の人物の顔のみが検出)されている。
画像認識サーバ111〜113の各々の画像認識部から返信される認識結果は以下のように評価されるとする。即ち、評価部207により期待する認識結果310を基に指定された矩形(指定範囲)内の顔検出であればカウント値を1上げ、指定された矩形(指定範囲)外の顔検出であればカウント値を1下げる手法で評価されるとする。
認識結果320では、指定された矩形内が4箇所全て検出されているが、指定された矩形ではない矩形(家屋)も1箇所検出されているためカウント値は3となる。また、認識結果330では、指定された矩形内が4箇所全て検出されているが、指定された矩形ではない矩形(後方の人物の顔)も3箇所検出されているためカウント値は1となる。また、認識結果340では、指定された矩形内が4箇所全て検出されており指定された矩形ではない矩形の検出はないためカウント値は4となる。また、認識結果350では、指定された矩形内は検出されず、指定された矩形ではない矩形(後方の人物の顔)のみ3箇所検出されているためカウント値は−3となる。
評価部207は、認識結果320〜認識結果350について計算した上記カウント値に基づき、認識結果320〜認識結果350の中で認識結果340が評価条件に最も合致していると判定する。評価部207は、判定した評価結果に基づいた表示を行うよう表示部206に指示する。これにより、表示部206には、評価部207による評価結果が表示される。
以上、画像認識システムのテスト端末101及び画像認識サーバ111〜113の各々の画像認識部の動作について図2及び図3に基づき説明したが、更に、テスト端末101で行う処理の流れについて図4のフローチャートに基づき説明する。
図4は、テスト端末101における認識結果評価処理を示すフローチャートである。
図4において、利用者がテスト端末101のテストデータ入力部201からテストデータを入力すると、テストデータ入力部201は、テストデータをテストデータ送信制御部202に出力する(ステップS401)。次に、利用者が入力部204から期待する認識結果に関する情報と判定条件(認識結果と期待する認識結果とを比較する条件)を、評価条件として入力すると、入力部204は、評価条件を評価条件設定部205に出力する。これにより、評価条件設定部205は、利用者から入力された評価条件を設定する(ステップS402)。
次に、テストデータ送信制御部202は、テストデータを通信部203及びネットワーク102を介して画像認識サーバ111〜113の各々の画像認識部に対して送信する(ステップS403)。次に、通信部203は、各々の画像認識部からネットワーク102を介して返信される画像認識処理された認識結果を受信し、認識結果蓄積部208は、受信した認識結果を保存する(ステップS404)。次に、評価部207は、認識結果蓄積部208に保存されている認識結果をステップ402で設定した評価条件に従って評価し、評価条件に適合する認識結果を返信した画像認識部を選択する(ステップS405)。
本実施の形態では、利用者がテストデータと評価条件を準備し作成する場合を例に挙げているが、これに限定されるものではない。画像認識システムの提供者側が予め複数のテストデータのパターンを作成して利用者に提供してもよい。この場合、利用者が画像認識させたい入力画像と似ているテストデータを予め用意された複数のテストデータから選択するようにしてもよい。また、画像認識システムの提供者側が入力画像と似ているテストデータを選択する手段を類似画像の検索技術を使用してテスト端末101に自動的に送信してもよい。
また、テストデータ送信制御部202によるテストデータの送信は、評価条件設定部205で評価条件の設定が完了した後でなくてもよい。また、画像認識部による画像認識処理中に評価条件設定部205で評価条件を設定することも可能である。また、評価条件の設定中に画像認識部からテスト端末101に出力された認識結果は、評価条件の設定が完了するまで画像認識部または評価部207で一時的に蓄えておいてもよい。
以上説明したように、本実施の形態によれば、複数の画像認識部の特性を熟知していない場合でも評価条件に適合する画像認識部を選択することができるようになる。特に、画像認識部の誤検出を減らすために画像認識アルゴリズムが改良された場合や、学習等で認識精度や認識処理の速度が時々刻々と変化している場合であっても、最新の複数の画像認識部の中から評価条件に適合する画像認識部を選択することができる。
即ち、複数の画像認識部にテストデータを送信すると共に各々の画像認識部から返信された認識結果を、指定された評価条件により評価することで、複数の画像認識部を比較し、最も評価の高い画像認識部を選択する。これにより、複数の画像認識部の中から利用者にとって評価条件に適合する、即ち、認識目的に適合する画像認識部を選択することが可能となる。
〔他の実施の形態〕
上記実施の形態では、テスト端末にネットワークにより複数の画像認識サーバを接続し、テスト端末がテストデータ及び評価条件の作成を行うと共に各々の画像認識部からの認識結果を評価条件を基に評価する構成を例に挙げたが、これに限定されるものではない。単一の装置がテスト端末の機能と複数の画像認識部の機能を備え、単一の装置においてテストデータ及び評価条件の作成と画像認識処理と認識結果の評価を行う構成としてもよい。本変形例においても上記実施の形態と同様の効果を得ることができる。
上記実施の形態では、複数の画像認識部を設置した構成を例に挙げたが、これに限定されるものではない。複数の認識結果を得ることが可能な単一の画像認識部を設置し、画像認識部のパラメータの設定を切り替える構成としてもよい。パラメータの設定とは、例えば人物の顔として大人と子供を区別して検出する際などに検出条件を細かくする設定である。この場合も画像認識部が複数設置されている場合と同様にテスト端末からテストデータを画像認識部に送信して複数の認識結果を得ることができる。そして、複数の認識結果から評価条件に適合する認識結果を選択する。
この手法では1つの画像認識部のパラメータ設定を切り替える毎にテストデータを送信する必要がある。尚、パラメータ設定の切り替えにより特性が変わる画像認識部と切り替えがない画像認識部は混在していてもよいし、パラメータ設定の異なる画像認識部が並列に処理できるように複数存在していてもよい。本変形例においても上記実施の形態と同様の効果を得ることができる。
また、本発明の目的は、以下の処理を実行することによって達成される。即ち、上述した実施形態の機能を実現するソフトウェアのプログラムコードを記録した記憶媒体を、システム或いは装置に供給し、そのシステム或いは装置のコンピュータ(又はCPUやMPU等)が記憶媒体に格納されたプログラムコードを読み出す処理である。
この場合、記憶媒体から読み出されたプログラムコード自体が前述した実施の形態の機能を実現することになり、そのプログラムコード及び該プログラムコードを記憶した記憶媒体は本発明を構成することになる。
また、プログラムコードを供給するための記憶媒体としては、次のものを用いることができる。例えば、フロッピー(登録商標)ディスク、ハードディスク、光磁気ディスク、CD−ROM、CD−R、CD−RW、DVD−ROM、DVD−RAM、DVD−RW、DVD+RW、磁気テープ、不揮発性のメモリカード、ROM等である。または、プログラムコードをネットワークを介してダウンロードしてもよい。
また、コンピュータが読み出したプログラムコードを実行することによって、上記実施の形態の機能が実現される場合も本発明に含まれる。加えて、そのプログラムコードの指示に基づき、コンピュータ上で稼動しているOS(オペレーティングシステム)等が実際の処理の一部または全部を行い、その処理により前述した実施形態の機能が実現される場合も含まれる。
更に、前述した実施形態の機能が以下の処理によって実現される場合も本発明に含まれる。即ち、記憶媒体から読み出されたプログラムコードが、コンピュータに挿入された機能拡張ボードやコンピュータに接続された機能拡張ユニットに備わるメモリに書き込まれる。その後、そのプログラムコードの指示に基づき、その機能拡張ボードや機能拡張ユニットに備わるCPU等が実際の処理の一部または全部を行う場合である。
本発明の実施の形態に係る画像認識システムの構成例を示す概念図である。 画像認識システムのテスト端末及び画像認識サーバの詳細構成を示すブロック図である。 (a)は、テスト画像、(b)は、期待する認識結果、(c)、(d)、(e)、(f)は、各々の画像認識部の認識結果を示す図である。 テスト端末における認識結果評価処理を示すフローチャートである。
符号の説明
101 テスト端末
102 ネットワーク
111、112、113 画像認識サーバ
201 テストデータ入力部
202 テストデータ送信制御部
203、211、221、231 通信部
204 入力部
205 評価条件設定部
206 表示部
207 評価部
208 認識結果蓄積部
212 画像認識部1
222 画像認識部2
223 画像認識部3
232 画像認識部4
300 テスト画像
310 期待する認識結果
320 画像認識部1の認識結果
330 画像認識部2の認識結果
340 画像認識部3の認識結果
350 画像認識部4の認識結果

Claims (8)

  1. 画像に含まれる認識対象を検出する認識処理を行う複数の画像認識手段にテスト用の画像データを送出する送出手段と、
    前記複数の画像認識手段から各々得られる複数の認識結果を比較するための評価条件を設定する設定手段と、
    前記複数の画像認識手段から各々得られる複数の認識結果から、前記設定手段により設定された前記評価条件に適合する認識結果を得た画像認識手段を選択する評価手段と、
    を備えることを特徴とする情報処理装置。
  2. 画像に含まれる認識対象を検出する認識処理を行うと共に複数の認識結果を得ることが可能な画像認識手段にテスト用の画像データを送出する送出手段と、
    前記画像認識手段から得られる複数の認識結果を比較するための評価条件を設定する設定手段と、
    前記画像認識手段から得られる複数の認識結果から、前記設定手段により設定された前記評価条件に適合する認識結果を得た画像認識手段を選択する評価手段と、
    を備えることを特徴とする情報処理装置。
  3. 前記設定手段により設定する評価条件は、利用者が期待する認識結果と、実際の認識結果と前記期待する認識結果を比較するための判定条件と、から構成されることを特徴とする請求項1又は2記載の情報処理装置。
  4. 前記期待する認識結果に含まれる認識対象を任意の形状を用いて範囲指定する指定手段を更に備えることを特徴とする請求項3記載の情報処理装置。
  5. 前記指定手段により前記認識対象を範囲指定する際に用いる形状は、矩形、楕円形、円形、前記認識対象に合わせた形状のいずれかを含むことを特徴とする請求項4記載の情報処理装置。
  6. 前記画像認識手段は、前記情報処理装置に対しネットワークを介して通信可能に接続される構成、前記情報処理装置に装備される構成のいずれかであることを特徴とする請求項1又は2記載の情報処理装置。
  7. 情報処理装置の制御方法において、
    画像に含まれる認識対象を検出する認識処理を行う複数の画像認識手段にテスト用の画像データを送出する送出ステップと、
    前記複数の画像認識手段から各々得られる複数の認識結果を比較するための評価条件を設定する設定ステップと、
    前記複数の画像認識手段から各々得られる複数の認識結果から、前記設定ステップにより設定された前記評価条件に適合する認識結果を得た画像認識手段を選択する評価ステップと、を有することを特徴とする制御方法。
  8. 請求項7記載の情報処理装置の制御方法をコンピュータに実行させるためのコンピュータで読み取り可能なプログラム。
JP2008212036A 2008-08-20 2008-08-20 情報処理装置、制御方法、及びプログラム Active JP5116608B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2008212036A JP5116608B2 (ja) 2008-08-20 2008-08-20 情報処理装置、制御方法、及びプログラム
US12/543,768 US8559728B2 (en) 2008-08-20 2009-08-19 Image processing apparatus and image processing method for evaluating a plurality of image recognition processing units

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008212036A JP5116608B2 (ja) 2008-08-20 2008-08-20 情報処理装置、制御方法、及びプログラム

Publications (2)

Publication Number Publication Date
JP2010049413A true JP2010049413A (ja) 2010-03-04
JP5116608B2 JP5116608B2 (ja) 2013-01-09

Family

ID=41696460

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008212036A Active JP5116608B2 (ja) 2008-08-20 2008-08-20 情報処理装置、制御方法、及びプログラム

Country Status (2)

Country Link
US (1) US8559728B2 (ja)
JP (1) JP5116608B2 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013065118A (ja) * 2011-09-15 2013-04-11 Toshiba Corp 顔認識装置、及び顔認識方法
US9098760B2 (en) 2011-09-15 2015-08-04 Kabushiki Kaisha Toshiba Face recognizing apparatus and face recognizing method
JP2020144504A (ja) * 2019-03-05 2020-09-10 株式会社日立製作所 分析支援装置、および、分析支援方法

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5235585B2 (ja) * 2008-10-01 2013-07-10 キヤノン株式会社 画像認識装置、制御方法、及びプログラム
US9389774B2 (en) * 2010-12-01 2016-07-12 Sony Corporation Display processing apparatus for performing image magnification based on face detection
US9626599B2 (en) * 2012-04-09 2017-04-18 GM Global Technology Operations LLC Reconfigurable clear path detection system
US9495606B2 (en) 2014-02-28 2016-11-15 Ricoh Co., Ltd. Method for product recognition from multiple images
KR102474244B1 (ko) * 2015-11-20 2022-12-06 삼성전자주식회사 영상 표시 장치 및 그 동작방법
WO2017104272A1 (ja) * 2015-12-18 2017-06-22 ソニー株式会社 情報処理装置、情報処理方法、及びプログラム
CN113268870B (zh) * 2021-05-19 2022-06-28 北京航空航天大学 一种基于蒙特卡洛的室外环境条件下图像识别可靠性评估方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002279348A (ja) * 2001-03-21 2002-09-27 Ricoh Co Ltd 文書入力代行方法、文書入力代行用のコンピュータプログラム及び文書入力代行装置
JP2007086954A (ja) * 2005-09-21 2007-04-05 Fuji Xerox Co Ltd 文字認識処理装置、および文字認識処理方法、並びにコンピュータ・プログラム

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5475770A (en) * 1990-09-24 1995-12-12 Cgk Computer Gesellschaft Konstanz Mbh Parallel recognition of document images with a time-elapsed processing abortion to improve overall throughput
JPH07154096A (ja) * 1993-11-26 1995-06-16 Sanyo Electric Co Ltd 部品装着装置
JPH1139430A (ja) * 1997-07-22 1999-02-12 Ricoh Co Ltd 文字認識装置
JP2001313820A (ja) * 2000-04-27 2001-11-09 Fuji Xerox Co Ltd 画像処理装置、画像処理方法、記憶媒体
JP3919617B2 (ja) * 2002-07-09 2007-05-30 キヤノン株式会社 文字認識装置および文字認識方法、プログラムおよび記憶媒体
JP3966461B2 (ja) * 2002-08-09 2007-08-29 株式会社リコー 電子カメラ装置
JP4977368B2 (ja) * 2005-12-28 2012-07-18 富士通株式会社 媒体処理装置,媒体処理方法,媒体処理システム,及び媒体処理プログラムを記録したコンピュータ読取可能な記録媒体
US8538171B2 (en) * 2008-03-28 2013-09-17 Honeywell International Inc. Method and system for object detection in images utilizing adaptive scanning

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002279348A (ja) * 2001-03-21 2002-09-27 Ricoh Co Ltd 文書入力代行方法、文書入力代行用のコンピュータプログラム及び文書入力代行装置
JP2007086954A (ja) * 2005-09-21 2007-04-05 Fuji Xerox Co Ltd 文字認識処理装置、および文字認識処理方法、並びにコンピュータ・プログラム

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013065118A (ja) * 2011-09-15 2013-04-11 Toshiba Corp 顔認識装置、及び顔認識方法
US9098760B2 (en) 2011-09-15 2015-08-04 Kabushiki Kaisha Toshiba Face recognizing apparatus and face recognizing method
JP2020144504A (ja) * 2019-03-05 2020-09-10 株式会社日立製作所 分析支援装置、および、分析支援方法
JP7175800B2 (ja) 2019-03-05 2022-11-21 株式会社日立製作所 分析支援装置、および、分析支援方法

Also Published As

Publication number Publication date
US20100046840A1 (en) 2010-02-25
US8559728B2 (en) 2013-10-15
JP5116608B2 (ja) 2013-01-09

Similar Documents

Publication Publication Date Title
JP5116608B2 (ja) 情報処理装置、制御方法、及びプログラム
US11087222B2 (en) Providing intelligent storage location suggestions
JP6446971B2 (ja) データ処理装置、データ処理方法、及び、コンピュータ・プログラム
US9420239B2 (en) Apparatus for playing back recorded video images related to event, and method thereof
EP4060607A1 (en) Information processing device, information processing method, and program
EP3989104A1 (en) Facial feature extraction model training method and apparatus, facial feature extraction method and apparatus, device, and storage medium
US10013408B2 (en) Information processing apparatus, information processing method, and computer readable medium
JP2007028555A (ja) カメラシステム,情報処理装置,情報処理方法,およびコンピュータプログラム
CN105975550B (zh) 一种智能设备的题目搜索方法和装置
JP2005316973A (ja) 赤目検出装置および方法並びにプログラム
WO2017110111A1 (ja) 端末装置、診断システム、診断方法およびプログラム
US20220261527A1 (en) Information processing apparatus and non-transitory computer readable medium
CN110554831A (zh) 操作同步方法、装置、设备及存储介质
JP4074988B2 (ja) 情報処理装置、通信処理装置、および方法、並びにコンピュータ・プログラム
JP2018081630A (ja) 検索装置、検索方法およびプログラム
CN109068150A (zh) 一种视频的精彩画面提取方法、终端及计算机可读介质
CN103501410A (zh) 拍摄的提醒方法、装置及检测模式的生成方法、装置
JP6914724B2 (ja) 情報処理装置、情報処理方法及びプログラム
US11527091B2 (en) Analyzing apparatus, control method, and program
US20120260151A1 (en) Information Processing Apparatus, Information Processing Method, Program, Server, and Information Processing System
CN109218620B (zh) 基于环境亮度的拍照方法、装置、存储介质及移动终端
JP2021111228A (ja) 学習装置、学習方法、及びプログラム
US20170277722A1 (en) Search service providing apparatus, system, method, and computer program
JP2008009938A (ja) 動画像データ処理装置、動画像データ処理方法、動画像データ処理プログラム、およびこれを記録した記録媒体
EP3438987A1 (en) Tool that analyzes image data and generates and displays a confidence indicator along with a cancer score

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20110810

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20120601

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120611

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120807

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120918

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20121016

R151 Written notification of patent or utility model registration

Ref document number: 5116608

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20151026

Year of fee payment: 3