JP7379059B2 - 中間サーバ装置、情報処理装置、通信方法 - Google Patents

中間サーバ装置、情報処理装置、通信方法 Download PDF

Info

Publication number
JP7379059B2
JP7379059B2 JP2019182452A JP2019182452A JP7379059B2 JP 7379059 B2 JP7379059 B2 JP 7379059B2 JP 2019182452 A JP2019182452 A JP 2019182452A JP 2019182452 A JP2019182452 A JP 2019182452A JP 7379059 B2 JP7379059 B2 JP 7379059B2
Authority
JP
Japan
Prior art keywords
subject
information
metadata
image
camera
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2019182452A
Other languages
English (en)
Other versions
JP2021060630A (ja
Inventor
里奈 羅
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2019182452A priority Critical patent/JP7379059B2/ja
Priority to US17/033,030 priority patent/US11775579B2/en
Publication of JP2021060630A publication Critical patent/JP2021060630A/ja
Application granted granted Critical
Publication of JP7379059B2 publication Critical patent/JP7379059B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/5866Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using information manually generated, e.g. tags, keywords, comments, manually generated location and time information
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/50Network services
    • H04L67/56Provisioning of proxy services
    • H04L67/567Integrating service provisioning from a plurality of service providers

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Library & Information Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Information Transfer Between Computers (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Studio Devices (AREA)

Description

本発明は、画像の被写体認識を行うサーバ装置と通信を行い、被写体認識の結果に基づいて画像のメタデータに被写体情報を付与する技術に関する。
近年、機械学習を中心としたAI技術の開発が盛んに行われている。例えば、カメラで撮影した画像に含まれる被写体の情報(例えば、人物名、物体名、性別、年齢など)を自動で認識する技術の開発が進められている。このような被写体認識の技術を個人・企業向けに提供するクラウドサービスが複数存在する。
被写体認識を行うクラウドサービスを利用して、カメラで撮影した画像にメタデータとして被写体情報を付与することが考えられる。しかし、被写体認識を行うクラウドサービスは各社特徴があり、同じ画像に対して被写体認識させたとしても、必ずしも同じ被写体認識結果が返ってくるとは限らない。例えば、「リンゴ、バナナ、ブドウ」が写った画像に対して、A社では「リンゴ、バナナ」と返すが、B社では「バナナ、ブドウ」と返すことがある。
特許文献1は、複数のサービスから得られる情報をまとめて1つの情報としてクライアントに送信する技術を開示している。これを、上述したような被写体認識を行うクラウドサービスを利用した被写体情報のメタデータ付与に適応と、A社およびB社の結果を論理和で統合することで、「バナナ、リンゴ、ブドウ」という信頼性の高い被写体認識結果を得ることが出来る。
特開2014-206794号公報
しかしながら、複数のクラウドサービスでの被写体認識の結果を統合する場合、全てのクラウドサービスから被写体認識結果を受信するまでメタデータを付与できないという課題がある。そのため、被写体認識結果を出力するまでの時間が長いクラウドサービスがあると、カメラでメタデータを利用可能になるまでに時間がかかる。一方、クラウドサービスから被写体認識結果を受信する度にメタデータの付与を行えば、カメラの処理負荷(CPU/メモリ使用率、メディアアクセス、電力消費など)が高くなる。
そこで本発明では、被写体認識を行うクラウドサービスを複数用いてメタデータの付与を行う場合、ユーザの設定や機器の状態に応じて、メタデータ付与を行うタイミングを制御する。
本発明の1実施態様は、画像の被写体認識を行う複数のサーバ装置に、クライアント端末から取得した画像を送信して被写体認識を要求する中間サーバ装置であって、各サーバ装置から被写体認識の結果を受信する受信手段と、受信した被写体認識の結果に基づいて、画像のメタデータに付与する被写体情報を前記クライアント端末に送信する送信手段と、制御手段と、を備え、制御手段は、前記画像とともに取得した前記クライアント端末の状態を示す情報に基づいて、送信手段が、被写体認識の結果ごとに被写体情報を送信するか、被写体認識の結果を統合して被写体情報を送信するか、を切り替えるように制御することを特徴とする中間サーバ装置である。
本発明によれば、被写体認識を行うクラウドサービスを複数利用した場合に、全ての認識結果が揃ってからメタデータを付与することでカメラの処理負荷低減を優先するか、得られた認識結果に基づき順次メタデータを付与することでメタデータを利用可能になるまでの時間短縮を優先するかを、状況に応じて切り替える。
第1の実施形態における中間サーバ、カメラ、画像認識サーバの各ブロック図である。 第1の実施形態におけるカメラにて表示されるGUIの一例を示す概念図である。 第1の実施形態における中間サーバ、カメラ、画像認識サーバのメタデータ付与手順の概要を説明するためのシーケンス図である。 第1の実施形態における中間サーバの動作を示すフローチャートである。 第1の実施形態におけるカメラの動作を示すフローチャートである。 第2の実施形態におけるカメラ、画像認識サーバの各ブロック図である。 第2の実施形態におけるカメラ、画像認識サーバのメタデータ付与手順の概要を説明するためのシーケンス図である。 第2の実施形態におけるカメラの動作を示すフローチャートである。
以下、本発明の実施形態を、図面を参照しながら詳細に説明する。
(第1の実施形態)
<各装置の構成>
図1は、第1の実施形態におけるシステム全体の構成を表すブロック図である。本実施形態におけるシステムは、中間サーバA100、クライアント端末であるカメラB100、画像認識のクラウドサービスを提供する画像認識サーバC100、インターネットD100、によって構成される。図1には、画像認識サーバは1つだけ記載されているが、中間サーバA100が通信する画像認識サーバは2つ以上の複数である。
まず、中間サーバA100について説明する。
サーバ装置はそれぞれ単一のコンピュータ装置で実現してもよいし、必要に応じた複数のコンピュータ装置に各機能を分散して実現するようにしてもよい。複数のコンピュータ装置で構成される場合は、互いに通信可能なようにLAN(Local Area Network)などで接続されている。
制御部A101は、例えばCPU(Central Processing Unit)であり、サーバ装置A100全体を制御する。制御部A101は、所定の条件に従い、画像認識サーバC100からの画像認識結果をカメラB100に順次送信するかまとめて送信するかを決定するプログラムを含む。なお、制御部A101が装置全体を制御する代わりに、複数のハードウェアが処理を分担することで、装置全体を制御してもよい。
ROM(Read Only Memory)A102は、書き換え可能な不揮発性メモリであり、OS(Operating System)などのプログラムや外部装置から供給されるプログラムを保持する。
RAM(Random Access Memory)A103は、揮発性メモリであり、プログラムやデータを一時記憶する。
記憶部A104は、中間サーバA100に設置されたHDD(ハードディスクドライブ)、フラッシュメモリで構成されるSSD(ソリッドステートドライブ)、ハードディスクとフラッシュメモリを併用したハイブリッドドライブやメモリカードなどである。
操作部A105は、ユーザの操作を受け付け、入力された情報を制御部A101に通知する処理部である。
通信部A106は、有線通信を実現するための通信ユニットである。通信部A106は、有線通信のためのハードウェアと有線信号を処理するための通信コントローラから構成され、IEEE802.3系規格に従った有線通信を実現する。制御部A101は、通信部A106を制御し、インターネットD100を介して、カメラB100や画像認識サーバC100との通信を実現する。
内部バスA107はA101~A106の各ブロックを通信可能に接続する。
以上が、中間サーバA100の説明である。
次に、カメラB100について説明する。
制御部B101は、例えば一つまたは複数のCPUやMPUやGPU等のプロセッサであり、カメラB100全体を制御する。また、制御部B101は、撮像部B106から取り込んだ静止画に対し画像処理を施す。なお、制御部B101が装置全体を制御する代わりに、複数のハードウェアが処理を分担することで、装置全体を制御してもよい。
ROM B102は、書き換え可能な不揮発性メモリであり、OSなどのプログラムや外部装置から供給されるプログラムを保持する。
RAM B103は、揮発性メモリであり、プログラムや撮影された画像データ、通信データなどを一時記憶する。
記憶部B104は、デジタルカメラB100に着脱可能なメモリカードである。記憶部B104は撮像部B106によって生成された画像データを記憶する。
操作部B105は、ユーザの操作を受け付け、入力された情報を制御部B101に通知する処理部である。操作部B105は、タッチパネル、ボタンスイッチ、十字キー等によって構成される。
撮像部B106は、撮像レンズ、絞り、シャッター、CMOSセンサ等の撮像素子、およびA/D変換器等で構成され、撮像レンズを介して入力されるアナログ信号をデジタルデータに変換して画像データを取得する。
表示部B107は、ユーザに機器の動作状態など、各種のメッセージを通知するための処理部である。表示部B107は、液晶パネルやLED等によって構成される。
通信部B108は、無線通信を実現するための通信ユニットである。通信部B108は、無線通信のためのアンテナと無線信号を処理するための通信コントローラから構成される。通信部B108は、例えば第5世代移動通信システム規格に従った無線通信を実現する。制御部B101は、通信部B108を制御し、インターネットD100を介して、中間サーバA100との通信を実現する。
内部バスB109はB101~B108の各ブロックを通信可能に接続する。
以上が、カメラB100の説明である。
次に、画像認識サーバC100について説明する。
制御部C101は、例えば一つまたは複数のCPUやMPUやGPU等のプロセッサであり、画像認識サーバC100全体を制御する。なお、制御部C101が装置全体を制御する代わりに、複数のハードウェアが処理を分担することで、装置全体を制御してもよい。
また制御部C101は、通信部C106によって受信した画像データを元に画像認識を行う。
ROM C102は、書き換え可能な不揮発性メモリであり、OSなどのプログラムや外部装置から供給されるプログラムを保持する。
RAM C103は、揮発性メモリであり、プログラムや画像データ、通信データなどを一時記憶する。
記憶部C104は、画像認識サーバC100に設置されたHDD(ハードディスクドライブ)、フラッシュメモリで構成されるSSD(ソリッドステートドライブ)、ハードディスクとフラッシュメモリを併用したハイブリッドドライブやメモリカードなどである。操作部C105は、ユーザの操作を受け付け、入力された情報を制御部C101に通知する処理部である。
通信部C106は、有線通信を実現するための通信ユニットである。通信部C106は、有線通信のためのハードウェアと有線信号を処理するための通信コントローラから構成され、IEEE802.3系規格に従った有線通信を実現する。制御部C101は、通信部C106を制御し、インターネットD100を介して、中間サーバA100との通信を実現する。
内部バスC107はC101~C106の各ブロックを通信可能に接続する。
図2は、本実施形態におけるシステムを実現するために、カメラB100に表示されるGUIの一例である。制御部B101は、ユーザの操作に応じて、サムネイル一覧画面200aおよび検索画面200b、検索結果画面200cを、表示部B107に表示する。
サムネイル一覧画面200aは、カメラB100が記憶する撮影画像のサムネイル一覧である。制御部B101は、操作部B105を介して、撮影画像のサムネイル一覧を表示する旨の操作を受け付けたと判定した場合に、サムネイル一覧画面200aを表示部B107に表示する。
メタデータ付与完了表示201aは、その表示を付与した画像について、メタデータ付与が完了したことを示すアイコンである。
メタデータ付与未完了表示202aは、例えば、進捗インジケータやプログレスバー、リングカーソルなどであり、その表示を付与した画像について、メタデータ付与が完了していないことを示すアイコンである。
メタデータ付与進捗表示203aは、例えば、パーセンテージであり、その表示を付与した画像について、メタデータ付与の進捗状況を示すものである。
検索画面200bは、撮影画像に付与されたメタデータを用いて、カメラB100が記憶する撮影画像から所望の画像を画像検索するための画面である。
メタデータ種類選択タブ201bは、検索可能なメタデータの種類を示すものである。図2の場合、メタデータ種類選択タブ201bとして、被写体の人物、被写体の動作、被写体の物体、被写体の感情が用意されている。なお、これは一例であって、他の項目手もよい。制御部B101は、操作部B105を介してメタデータ種類選択タブ201bの押下を受け付けると、押下されたタブに対応するメタデータ選択項目202bを表示部B107に表示する。
メタデータ選択項目202bは、検索に用いるメタデータの項目を示すものである。メタデータ未選択表示203bは、検索に用いるためのメタデータ項目が未選択状態であることを示すものである。メタデータ選択表示204bは、検索に用いるためのメタデータ項目が選択状態であることを示すものである。検索開始ボタン205bは、検索開始するためのボタンである。検索キャンセルボタン206bは、検索をキャンセルするためのボタンである。
検索結果画面200cは、メタデータを用いた検索結果として検索条件に該当する画像のサムネイル一覧を表示する画面である。制御部B101は、操作部B105を介して、検索開始ボタン205bが押下されたと判定した場合に、記憶する撮影画像から検索を行って、検索結果画面200cを表示部B107に表示する。
検索結果画面200cは、メタデータ付与を行っている途中の画像も表示してもよく、メタデータ付与未完了表示201cは、サムネイル画像に対するメタデータ付与が未完了であることを示している。
<システムの概要>
図3を参照して、本実施形態におけるシステムの処理シーケンスを説明する。画像認識サーバC310と画像認識サーバC320は、図1に記載する画像認識サーバC100と同様の構成を有する。図3は、一例として、中間サーバA100が、画像認識サーバC310と画像認識サーバC320から画像認識結果を受信するまでの各時間について、前者より後者の方が長い場合の処理シーケンスを示すものである。
S301において、カメラB100は操作部B105を介して撮影要求を受け付ける。
S302において、カメラB100は撮像部B106により静止画を撮影する。
S303において、カメラB100はS302で撮影した静止画からサムネイル表示用の縮小画像を生成する。
S304において、カメラB100は中間サーバA100に画像認識要求を送信する。カメラB100は、前記画像認識要求に、S303で生成した縮小画像とカメラの状態情報(カメラB100のバッテリー残量やカメラB100のユーザ設定情報、カメラB100の動作状態に関する情報等)を含める。
ユーザ設定情報は、カメラB100のユーザが設定した情報であって、中間サーバA100が画像認識応答を順次送信するか、あるいは画像認識結果をまとめて返すか、に関する情報を含む。例えば、カメラB100のユーザがメタデータの利用を急ぐ場合は、画像認識応答を順次送信するようカメラに設定することが考えられる。一方、画像認識応答が順次送信されるとカメラB100と中間サーバA100の間の通信の回数が増えることでカメラの消費電力が増える可能性がある。そこで、ユーザがカメラの消費電力を抑えるために画像認識結果をまとめて返すようカメラに設定することも考えられる。このように、ユーザが指定して画像認識応答の送信方法を切り替えることが可能である。
カメラの動作状態に関する情報は、カメラが撮影動作中であるか否かの情報を含む。カメラが撮影動作中である場合に画像認識応答が順次送信されるとカメラB100と中間サーバA100の間の通信の回数が増えることで、カメラB100の撮影動作の処理性能が低下することが考えられる。従って、カメラB100が撮影動作中は画像認識結果をまとめて返す方が望ましい。このように、カメラB100の動作状態に応じて画像認識応答の送信方法を切り替えることが可能である。
S305において、中間サーバA100は、画像認識サーバC310および画像認識サーバC320に画像認識要求をそれぞれ送信する。中間サーバA100は、前記画像認識要求にS304で受信した縮小画像を含める。
S306において、画像認識サーバC310および画像認識サーバC320は、S305で受信した画像認識要求に含まれる縮小画像に基づいて、画像内の人物、動作、物体、感情などの画像認識を行う。
S307において、カメラB100は操作部B105を介して撮影画像のサムネイル一覧表示要求を受け付ける。
S308において、カメラB100は表示部B107にサムネイル一覧画面200aを表示する。カメラB100は、S304で画像認識要求を送信した画像に対して、メタデータ付与未完了表示202aおよびメタデータ付与進捗表示203aを重畳表示する。この時のメタデータ付与進捗表示203aは、0%である。
S309において、画像認識サーバC310はS306の画像認識を完了すると、中間サーバA100に画像認識応答を送信する。画像認識サーバC310は前記画像認識応答に、被写体(人物名、動作名、物体名など)および被写体ごとの信頼度を含める。
中間サーバA100はS309で画像認識応答を受信すると、中間サーバA100がカメラB100に画像認識応答を順次送信する(以下、順次応答)か、画像認識結果をまとめて返す(以下、一括応答)か、を判定する。
中間サーバA100は、下記のいずれかに合致した場合は順次応答すると判定する。
・S304で受信した画像認識要求に含まれるカメラのバッテリー残量が所定値より多い場合
・S304で受信した画像認識要求に含まれるカメラのユーザ設定が順次応答を要求するものである場合
・S304で受信した画像認識要求に含まれるカメラの動作状態に関する情報が、カメラが撮影動作中ではないことを示す場合
・中間サーバA100の処理負荷(CPU/メモリ使用率など)が所定値より低い場合
・順次応答フラグが有効である場合(詳細はS323およびS330の説明で述べる)
一方、中間サーバA100は、上記のいずれにも合致しない場合は、順次応答せずに一括応答すると判定する。
S310において、中間サーバA100はカメラB100に画像認識応答を送信する。中間サーバA100は前記画像認識応答に、S309で受信した被写体および被写体ごとの信頼度、メタデータ付与進捗情報(S305で送信した画像認識要求の総数のうち画像認識応答が返ってきた数をパーセンテージで示したもの)を含める。この時の前記メタデータ付与進捗情報は50%である。
S311において、カメラB100はS302で撮影したオリジナルの撮影画像に対して、S310で受信した画像認識応答の情報(被写体および被写体ごとの信頼度、メタデータ付与進捗情報)をメタデータとして関連付けて記憶部B104に記憶する(メタデータ付与)。
S312において、カメラB100はS311のメタデータ付与に応じて、S308で表示部B107に表示したサムネイル一覧画面200aを更新する。カメラB100は、S308で表示したサムネイル一覧画面200a中のメタデータ付与進捗表示203aの値をS311で付与したメタデータに含まれるメタデータ付与進捗情報の値(50%)に更新し表示する。
S313において、中間サーバA100はS309で受信した画像認識応答の情報をRAM A103に一時保存する。
S314において、画像認識サーバC320はS306の画像認識を完了すると、中間サーバA100に画像認識応答を送信する。画像認識サーバC320は前記画像認識応答に、被写体および被写体ごとの信頼度を含める。
S315において、中間サーバA100はS313で一時保存した情報とS314で受信した画像認識応答の情報を統合(マージ)する。中間サーバA100は、S313で一時保存した情報とS314で受信した画像認識応答の情報で被写体が異なる場合、各情報の論理和をマージ結果とする。例えば、S313で一時保存した情報が「こうじ」(信頼度85%)、S314で受信した情報が「たけし」(信頼度60%)であった場合、中間サーバA100は「こうじ(信頼度85%)かつ、たけし(信頼度60%)」をマージ結果とする。中間サーバA100は、S313で一時保存した情報とS314で受信した画像認識応答の情報で被写体が同一で信頼度が異なる場合、各情報の前記被写体と各信頼度の平均値をマージ結果とする。例えば、S313で一時保存した情報がこうじ(信頼度85%)、S314で受信した情報がこうじ(信頼度90%)であった場合、中間サーバA100は「こうじ(信頼度87.5%)」をマージ結果とする。
S316において、中間サーバA100はカメラB100に画像認識応答を送信する。中間サーバA100は前記画像認識応答に、S315でマージした情報に含まれる被写体および被写体ごとの信頼度、メタデータ付与進捗情報を含める。この時の前記メタデータ付与進捗情報は100%である。
S317において、カメラB100はS302で撮影したオリジナルの撮影画像に対して、S315で受信した画像認識応答の情報(被写体および被写体ごとの信頼度、メタデータ付与進捗情報)を被写体情報のメタデータとして関連付けて記憶部B104に記憶する(メタデータ更新)。
S318において、カメラB100はS317のメタデータ更新に応じて、S308で表示部B107に表示したサムネイル一覧画面200aを更新する。カメラB100は、S317で更新したメタデータに含まれるメタデータ付与進捗情報が100%であるため、S308で表示したサムネイル一覧画面200a中のメタデータ付与未完了表示202aとメタデータ付与進捗表示203aを削除し、メタデータ付与完了表示201aを重畳表示する。
S319において、中間サーバA100はS313で一時保存した情報を削除する。
次に、カメラB100が検索開始要求を受け付けた場合について説明する。なお、先述と同様の処理については、同一の番号を付与して説明を省略する。
S320において、カメラB100は操作部B105を介して検索要求を受け付ける。
S321において、カメラB100は表示部B107に検索画面200bを表示する。
S322において、カメラB100は中間サーバA100に順次応答要求を送信する。
S323において、中間サーバA100は順次応答フラグを有効化し、RAM A103に記憶する。
S324において、カメラB100は操作部B105を介して検索開始要求を受け付ける。カメラB100は操作部B105を介して検索開始ボタン205bが押下されたことを検索開始要求と判断する。
S325において、カメラB100はS324で選択されたメタデータ項目に関連付けられた画像を記憶部B104から検索し、表示部B107に検索結果画面200cとして表示する。
S326において、カメラB100はS311で付与したメタデータに含まれる被写体がS324で検索条件として選択されたメタデータに合致している場合、検索結果画面200cを更新する。カメラB100は、検索結果画面200CにS302で撮影したオリジナル画像を追加して表示し、メタデータ付与未完了表示202aおよびメタデータ付与進捗表示203aを重畳表示する。この時の前記メタデータ付与進捗表示203aは50%である。
S327において、カメラB100は、S317で更新したメタデータに含まれる被写体がS324で検索条件として選択されたメタデータに合致している場合、検索結果画面200cを更新する。カメラB100は、S317で更新したメタデータに含まれるメタデータ付与進捗情報が100%であるため、S326で表示した検索結果画面200c中のメタデータ付与未完了表示202aとメタデータ付与進捗表示203aを削除し、メタデータ付与完了表示201aを重畳表示する。
次に、カメラB100が検索開始要求を受け付けた後に検索中止操作を受け付けた場合について説明する。なお、先述と同様の処理については、同一の番号を付与して説明を省略する。
S328において、カメラB100は操作部B105を介して検索中止要求を受け付ける。カメラB100は操作部B105を介して検索キャンセルボタン206bが押下されたことを検索中止要求と判断する。
S329において、カメラB100は中間サーバA100に順次応答中止要求を送信する。
S330において、中間サーバA100は順次応答フラグを無効化し、RAM A103に記憶する。
以上のように、本実施形態の中間サーバA100は、ユーザの設定や機器の状態に応じて、順次メタデータを付与するか、全ての認識結果が揃ってから統合してメタデータを付与するかを切り替える。これにより、各装置の処理負荷が低い、あるいは、ユーザがメタデータ利用を急ぐ場合にはメタデータを利用可能になるまでの時間短縮を優先し、そうでない場合には各装置の処理負荷低減を優先することができる。
<各装置の動作>
上記の動作を実現するための中間サーバA100およびカメラB100の詳細な動作について、図4および図5を参照しながら説明する。
図4は、本実施形態の中間サーバA100の動作を示すフローチャートである。なお、本フローチャートに示す処理は、制御部A101が入力信号やプログラムに従い、中間サーバA100の各部を制御することにより実現される。
S401において、制御部A101は通信部A106を介してカメラB100から画像認識要求を受信したか判定する。制御部A101は、前記画像認識要求を受信したと判定した場合、S402の処理に移行し、そうでない場合S401の処理を繰り返す。
S402において、制御部A101は通信部A106を介して1台以上の画像認識サーバC100に画像認識要求を送信する。制御部A101は、前記画像認識要求にS401で受信した縮小画像を含める。本ステップは図3におけるS305の処理に相当する。
S403において、制御部A101は通信部A106を介して画像認識サーバC100から画像認識応答を受信したか判定する。制御部A101は、前記画像認識応答を受信したと判定した場合S404の処理に移行し、そうでない場合S409処理に移行する。
S404において、制御部A101は後述のS414で記憶した画像認識応答が存在するか判定する。制御部A101は、前記画像認識応答が存在したと判定した場合S404の処理に移行し、そうでない場合S406の処理に移行する。
S405において、制御部A101は後述のS414で一時保存した情報とS403で受信した画像認識結果の情報を統合(マージ)する。制御部A101は、S414で一時保存した情報とS403で受信した画像認識応答の情報で被写体が異なる場合、各情報の論理和をマージ結果とする。例えば、S414で一時保存した情報がこうじ(信頼度85%)、S403で受信した情報がたけし(信頼度60%)であった場合、制御部A101は「こうじ(信頼度85%)かつ、たけし(信頼度60%)」をマージ結果とする。制御部A101は、S414で一時保存した情報とS403で受信した画像認識応答の情報で被写体が同一で信頼度が異なる場合、各情報の前記被写体と各信頼度の平均値をマージ結果とする。例えば、S414で一時保存した情報がこうじ(信頼度85%)、S403で受信した情報がこうじ(信頼度90%)であった場合、制御部A101は「こうじ(信頼度87.5%)」をマージ結果とする。本ステップは図3におけるS314の処理に相当する。
S406において、制御部A101はS403において全ての画像認識サーバC100から画像認識応答を受信したか判定する。制御部A101は、S403において全ての画像認識サーバC100から画像認識応答を受信したと判定した場合S407の処理に移行し、そうでない場合S413の処理に移行する。
S407において、制御部A101は通信部A106を介してカメラB100に画像認識応答を送信する。制御部A101は、前記画像認識応答にS403で受信した画像認識応答の情報もしくはS405でマージした情報を含める。本ステップは図3におけるS310およびS316の処理に相当する。
S408において、制御部A101は後述のS414でRAM A103に一時保存した情報を削除する。本ステップは図3におけるS319の処理に相当する。
S409において、制御部A101は通信部A106を介してカメラB100から順次応答要求を受信したか判定する。制御部A101は前記順次応答要求を受信したと判定した場合S410の処理に移行し、そうでない場合S411の処理に移行する。
S410において、制御部A101は順次応答フラグを有効化しRAM A103に記憶する。本ステップは図3におけるS323の処理に相当する。
S411において、制御部A101は通信部A106を介してカメラB100から順次応答中止要求を受信したか判定する。制御部A101は前記順次応答中止要求を受信したと判定した場合S412の処理に移行し、そうでない場合S403の処理に移行する。
S412において、制御部A101は順次応答フラグを無効化しRAM A103に記憶する。本ステップは図3におけるS330の処理に相当する。
S413において、制御部A101は通信部A106を介してカメラB100に順次応答するか一括応答するか判定する。制御部A101は順次応答すると判定した場合S414の処理に移行し、そうでない場合S415の処理に移行する。制御部A101は、下記のいずれかに合致した場合に順次応答すると判定する。
・S401で受信した画像認識要求に含まれるカメラのバッテリー残量が所定値より多い場合
・S401で受信した画像認識要求に含まれるカメラのユーザ設定が順次応答を要求するものである場合
・S401で受信した画像認識要求に含まれるカメラの動作状態に関する情報が、カメラが撮影動作中ではないことを示す場合
・中間サーバA100の処理負荷(CPU/メモリ使用率など)が所定値より低い場合
・順次応答フラグが有効である場合
一方、制御部A101は、上記のいずれにも合致しない場合は、順次応答せずに一括応答すると判定する。S414において、制御部A101はS403で受信した画像認識応答の情報もしくはS405でマージした情報をRAM A103に記憶する。本ステップは図3におけるS313の処理に相当する。
以上が、本実施形態の中間サーバA100の動作を示すフローチャートの説明である。
以上のように、本実施形態の中間サーバA100は、ユーザの設定や機器の状態に応じて、順次メタデータを付与するか、全ての認識結果が揃ってから統合してメタデータを付与するかを切り替える。これにより、各装置の処理負荷が低い、あるいは、ユーザがメタデータ利用を急ぐ場合にはメタデータを利用可能になるまでの時間短縮を優先し、そうでない場合には各装置の処理負荷低減を優先することができる。
図5は、本実施形態のカメラB100の動作を示すフローチャートである。なお、本フローチャートに示す処理は、カメラB100に制御部B101が入力信号やプログラムに従い、カメラB100の各部を制御することにより実現される。
S501において、制御部B101は操作部B105を介して撮影操作を受け付けたか判定する。制御部B101は撮影操作を受け付けたと判定した場合S502の処理に移行し、そうでない場合S505の処理に移行する。
S502において、制御部B101は撮像部B106により静止画を撮影する。本ステップは図3におけるS302の処理に相当する。
S503において、制御部B101は前記撮影処理で得た画像データから縮小画像を生成する。本ステップは図3におけるS303の処理に相当する。
S504において、制御部B101は通信部B108を介して中間サーバA100に画像認識要求を送信する。制御部B101は、前記画像認識要求にS503で生成した縮小画像とカメラの状態情報を含める。本ステップは図3におけるS304の処理に相当する。
S505において、制御部B101は通信部B108を介して中間サーバA100から画像認識応答を受信したか判定する。制御部B101は前記画像認識応答を受信したと判定した場合S506の処理に移行し、そうでない場合S512の処理に移行する。
S506において、制御部B101はS502で撮影したオリジナル画像に対して、S505で受信した画像認識応答の情報(被写体および被写体ごとの信頼度、メタデータ付与進捗情報)をメタデータとして関連付けて記憶部B104に記憶する。本ステップは図3におけるS311およびS317の処理に相当する。
S507において、制御部B101は表示部B107にサムネイル一覧画面200aを表示中であるか判定する。制御部B101は、表示部B107にサムネイル一覧画面200aを表示中であると判定した場合S508の処理に移行し、そうでない場合S520の処理に移行する。
S508において、制御部B101は表示部B107に表示したサムネイル一覧画面200aを更新する。制御部B101はS506で付与したメタデータに含まれるメタデータ付与進捗情報が100%であった場合、サムネイル一覧画面200a中のメタデータ付与未完了表示202aおよびメタデータ付与進捗表示203aを削除し、メタデータ付与完了表示201aを重畳表示する。制御部B101は、S506で付与したメタデータに含まれるメタデータ付与進捗情報が100%でない場合、サムネイル一覧画面200a中のメタデータ付与進捗表示203aの値を前記メタデータ付与進捗情報の値に更新し表示する。本ステップは図3におけるS318の処理に相当する。
S509において、制御部B101はS502で撮影したオリジナル画像撮影のメタデータ付与が完了したか判定する。制御部B101は、S506で付与したメタデータに含まれるメタデータ付与進捗情報が100%であった場合にメタデータ付与が完了したと判定する。制御部B101は、メタデータ付与が完了したと判定した場合処理を終了し、そうでない場合S505に移行する。
S510において、制御部B101は操作部B105を介してサムネイル一覧表示要求を受け付けたか判定する。制御部B101は、操作部B105を介してサムネイル一覧表示要求を受け付けたと判定した場合S511の処理に移行し、そうでない場合S512の処理に移行する。
S511において、制御部B101は表示部B107にサムネイル一覧画面200aを表示する。本ステップは図3におけるS308の処理に相当する。
S512において、制御部B101は操作部B105を介して検索要求を受け付けたか判定する。制御部B101は、操作部B105を介して検索要求を受け付けたと判定した場合S513の処理に移行し、そうでない場合はS505の処理に移行する。
S513において、制御部B101は表示部B107に検索画面200bを表示する。本ステップは図3におけるS321の処理に相当する。
S514において、制御部B101は通信部B108を介して中間サーバA100に順次応答要求を送信する。本ステップは図3におけるS322の処理に相当する。
S515において、制御部B101は操作部B105を介して検索開始要求を受け付けたか判定する。制御部B101は、操作部B105を介して検索開始要求を受け付けたと判定した場合S516の処理に移行し、そうでない場合S517の処理に移行する。制御部B101は操作部B105を介して検索開始ボタン205bが押下されたことを検索開始要求と判断する。
S516において、制御部B101はS515で選択されたメタデータ項目に関連付けられた画像を記憶部B104から検索し、表示部B107に検索結果画面200cを表示する。本ステップは図3におけるS325の処理に相当する。
S517において、制御部B101は操作部B105を介して検索中止要求を受け付けたか判定する。制御部B101は、操作部B105を介して検索中止要求を受け付けたと判定した場合S518の処理に移行し、そうでない場合S515の処理に移行する。制御部B101は操作部B105を介して検索キャンセルボタン206bが押下されたことを検索中止要求と判断する。
S518において、制御部B101は通信部B108を介して中間サーバA00に順次応答中止要求を送信する。本ステップは図3におけるS330の処理に相当する。
S519において、制御部B101は表示部B107にサムネイル一覧画面200aを表示する。本ステップは図3におけるS308の処理に相当する。
S520において、制御部B101は表示部B107に検索結果画面200cが表示中であるか判定する。制御部B101は、表示部B107に検索結果画面200cが表示中であると判定した場合S521の処理に移行し、そうでない場合S509に移行する。
S521において、制御部B101はS506で付与したメタデータに含まれる被写体がS515で検索条件として選択されたメタデータ項目に合致しているか判定する。制御部B101は、前記メタデータに含まれる被写体が前記検索条件に合致していると判定した場合S522の処理に移行し、そうでない場合S509の処理に移行する。
S522において、制御部B101は表示部B107に表示中の検索結果画面200cを更新する。制御部B101は、前記画面にS502で撮影したオリジナル画像を表示していない場合、前記画面に前記画像を追加して表示する。この時、制御部B101はS506で付与したメタデータに含まれるメタデータ進捗情報が100%でない場合、S502で撮影したオリジナル画像にメタデータ付与未完了表示202aおよびメタデータ付与進捗表示203a、メタデータ未完了表示201cを重畳表示する。一方、前記メタデータ進捗情報が100%の場合、制御部B101は、メタデータ付与未完了表示202aとメタデータ付与進捗表示203aを削除し、メタデータ付与完了表示201aを重畳表示する本ステップは図3におけるS326およびS327の処理に相当する。
以上が、本実施形態のカメラB100の動作を示すフローチャートの説明である。
以上のように、本実施形態のカメラB100では中間サーバA100に順次応答するか一括応答するか判定するために必要な情報を送信する。これにより、中間サーバA100は順次応答するか一括応答するかを適切に判定できる。
(第2の実施形態)
第1の実施形態では、カメラと中間サーバと画像認識サーバから構成されるシステムについて説明した。第2の実施形態では、情報処理装置であるカメラと画像認識のクラウドサービスを提供する画像認識サーバで構成されるシステムについて説明する。なお、本実施形態では、第1の実施形態と異なる点についてのみ詳細に説明し、第1の実施形態と同様の内容については、説明を割愛する。
<システム構成>
図7は、本実施形態におけるシステム全体の構成を表すブロック図である。本実施形態におけるシステムは、カメラB100、画像認識サーバC100、インターネットD100、によって構成される。本実施形態では、画像認識サーバは1つのみ記載するが、カメラB100と通信する画像認識サーバは2つ以上の構成でもよい。
制御部B101は、所定の条件に従い、画像認識サーバC100から受信した画像認識結果に基づいて順次メタデータ付与を行うか、画像認識サーバC100から受信した画像認識結果を統合してメタデータ付与をするかを決定する。通信部B108は、インターネットD100を介して1つ以上の画像認識サーバC100との通信を実現する。また、通信部C106も同様に、インターネットを介してカメラB100と通信する。
<システムの概要>
本実施形態における処理の処理シーケンスに関して、図7を参照しながら説明する。第1の実施形態と同様の処理に関しては説明を割愛する。
S701において、カメラB100は画像認識サーバC310および画像認識サーバC320にそれぞれ画像認識要求を送信する。カメラB100は、前記画像認識要求にS303で生成した縮小画像を含める。
S702において、画像認識サーバC310および画像認識サーバC320はS701で受信した画像認識要求に含まれる縮小画像から人物・動作・物体などの画像認識を行う。
S703において、画像認識サーバC310はS702の画像認識を完了すると、カメラB100に画像認識応答を送信する。画像認識サーバC310は前記画像認識応答に、被写体および被写体ごとの信頼度を含める。
カメラB100はS703で画像認識応答を受信すると、順次メタデータを付与する(以下、順次付与)か、画像認識結果をまとめてからメタデータを付与する(以下、一括付与)か、を判定する。カメラB100は、下記のいずれかに合致した場合に順次応答すると判定する。
・カメラB100のバッテリー残量が所定値より多い場合
・カメラB100のユーザ設定が順次付与を要求するものであった場合
・カメラB100の処理負荷(CPU/メモリ使用率、メディアアクセスなど)が所定値より低い場合
・カメラB100が撮影動作中ではない場合
・順次付与フラグが有効である場合(詳細はS712およびS715の説明で述べる)
一方、カメラB100は、上記のいずれにも合致しない場合は順次付与しない(一括付与する)と判定する。
S704において、カメラB100はS302で撮影したオリジナル画像に対して、S703で受信した画像認識応答の情報とメタデータ進捗情報(S701で送信した画像認識要求の総数のうち画像認識応答が返ってきた数をパーセンテージで示したもの)をメタデータとして関連付けて記憶部B104に記憶する(メタデータ付与)。
S705において、カメラB100はS704のメタデータ付与に応じて、S308で表示部B107に表示したサムネイル一覧画面200aを更新する。カメラB100は、S308で表示したサムネイル一覧画面200a中のメタデータ付与進捗表示203aの値をS704で付与したメタデータに含まれるメタデータ付与進捗情報の値(50%)に更新し表示する。
S706において、カメラB100はS703で受信した画像認識応答の情報をRAM B103に一時保存する。
S707において、画像認識サーバC320はS702の画像認識を完了すると、カメラB100に画像認識応答を送信する。画像認識サーバC320は前記画像認識応答に、被写体および被写体ごとの信頼度を含める。
S708において、カメラB100はS706で一時保存した情報とS707で受信した画像認識応答の情報をマージする。マージの例は、第1の実施形態と同様であるため、説明を割愛する。
S709において、カメラB100はS302で撮影したオリジナル画像に対して、S708でマージした情報を被写体情報のメタデータとして関連付けて記憶部B104に記憶する(メタデータ更新)。
S710において、カメラB100はS709のメタデータ更新に応じて、S308で表示部B107に表示したサムネイル一覧画面200aを更新する。カメラB100は、S709で更新したメタデータに含まれるメタデータ付与進捗情報が100%であるため、S308で表示したサムネイル一覧画面200a中のメタデータ付与未完了表示202aとメタデータ付与進捗表示203aを削除し、メタデータ付与完了表示201aを重畳表示する。
S711において、カメラB100はS706で一時保存した情報を削除する。
次に、カメラB100が検索開始要求を受け付けた場合について説明する。なお、先述と同様の処理については、同一の番号を付与して説明を省略する。
S712において、カメラB100は順次付与フラグを有効化し、RAM B103に記憶する。
S713において、カメラB100はS311で付与したメタデータに含まれる被写体がS324で検索条件として選択されたメタデータ項目に合致している場合、検索結果画面200cを更新する。カメラB100は、前記画面にS302で撮影したオリジナル画像を、検索結果画面200cに追加して表示し、メタデータ付与未完了表示202aおよびメタデータ付与進捗表示203aを重畳表示する。この時の前記メタデータ付与進捗表示203aは50%である。
S714において、カメラB100は、S709で更新したメタデータに含まれる被写体がS324で検索条件として選択されたメタデータに合致している場合、検索結果画面200cを更新する。カメラB100は、S709で更新したメタデータに含まれるメタデータ付与進捗情報が100%であるため、S313で表示した検索結果画面200c中のメタデータ付与未完了表示202aとメタデータ付与進捗表示203aを削除し、メタデータ付与完了表示201aを重畳表示する。
次に、カメラB100が検索開始要求を受け付けた後に検索中止操作を受け付けた場合について説明する。なお、先述と同様の処理については同一の番号を付与し、説明を省略する。
S715において、カメラB100は順次付与フラグを無効化し、RAM B103に記憶する。
以上のように、本実施形態のカメラB100は、ユーザの設定や機器の状態に応じて、順次メタデータを付与するか、全ての認識結果が揃ってからメタデータを付与するかを切り替える。これにより、カメラB100の処理負荷が低い、あるいは、ユーザがメタデータ利用を急ぐ場合にはメタデータを利用可能になるまでの時間短縮を優先し、そうでない場合にはカメラB100の処理負荷低減を優先することができる。
<各装置の動作>
図8は、本実施形態のカメラB100の動作を示すフローチャートである。なお、フローチャートに示す処理は、カメラB100に制御部B101が入力信号やプログラムに従い、カメラB100の各部を制御することにより実現される。
S801において、制御部B101は通信部B108を介して画像認識サーバC310および画像認識サーバC320にそれぞれ画像認識要求を送信する。制御部B101は、前記画像認識要求にS503で生成した縮小画像を含める。本ステップは図7におけるS701の処理に相当する。
S802において、制御部B101は通信部B108を介して画像認識サーバC310および画像認識サーバC320から画像認識応答を受信したか判定する。制御部B101は、通信部B108を介して画像認識応答を受信したと判定した場合S803の処理に移行し、そうでない場合S811の処理に移行する。
S803において、制御部B101は後述のS825で記憶した画像認識応答が存在するかどうか判定する。制御部B101は後述のS825で記憶した画像認識応答が存在した場合S804の処理に移行し、そうでない場合S805の処理に移行する。
S804において、制御部B101は後述のS825で記憶した画像認識応答とS802で受信した画像認識応答をマージする。マージの例はS405と同様のため説明を割愛する。本ステップは図7におけるS708の処理に相当する。
S805において、制御部B101は順次付与するか一括付与するか判定する。制御部B101は順次付与すると判定した場合S806の処理に移行し、そうでない場合S821の処理に移行する。カメラB100は、下記のいずれかに合致した場合に順次付与すると判定する。
・カメラB100のバッテリー残量が所定値より多い場合
・カメラB100のユーザ設定が順次応答を要求するものである場合
・カメラB100の処理負荷(CPU/メモリ使用率、メディアアクセスなど)が所定値より低い場合
・カメラB100が撮影動作中ではない場合
・順次付与フラグが有効である場合(詳細はS815およびS819の説明で述べる)
一方、カメラB100は、上記のいずれにも合致しない場合は順次付与しない(一括付与する)と判定する。
S806において、制御部B101はS502で撮影したオリジナル画像に対して、S805の処理を行った場合S805でマージした画像認識応答をメタデータとして関連付けて記憶部B104に記憶(メタデータ更新)し、そうでない場合S802で受信した画像認識応答をメタデータとして関連付けて記憶部B104に記憶する(メタデータ付与)。本ステップは図7におけるS704およびS709の処理に相当する。
S807において、表示部B107にサムネイル一覧画面200aが表示中であるか判定する。制御部B101は、表示部B107にサムネイル一覧画面200aが表示中であると判定した場合S808に移行し、そうでない場合S822の処理に移行する。
S808において、制御部B101は表示部B107に表示したサムネイル一覧画面200aを更新する。制御部B101は、S806で付与したメタデータに含まれるメタデータ付与進捗情報が100%であった場合、サムネイル一覧画面200a中のメタデータ付与未完了表示202aおよびメタデータ付与進捗表示203aを削除し、メタデータ付与完了表示201aを重畳表示する。制御部B101は、S806で付与したメタデータに含まれるメタデータ付与進捗情報が100%でない場合、サムネイル一覧画面200a中のメタデータ付与進捗表示203aの値を前記メタデータ付与進捗情報の値に更新し表示する。本ステップは図7におけるS705および710の処理に相当する。
S809において、制御部B101はS802において全ての画像認識サーバから画像認識応答を受信したか判定する。制御部B101は、S802において全ての画像認識サーバから画像認識応答を受信したと判定した場合S810の処理に移行し、そうでない場合S825の処理に移行する。
S810において、制御部B101は後述のS825でRAM B103に一時保存した情報を削除する。
S811において、制御部B101は操作部B105を介してサムネイル一覧表示要求を受け付けたか判定する。制御部B101は、操作部B105を介してサムネイル一覧表示要求を受け付けたと判定した場合S812の処理に移行し、そうでない場合S813の処理に移行する。
S812において、制御部B101は表示部B107にサムネイル一覧画面200aを表示する。本ステップは図7におけるS308の処理に相当する。
S813において、制御部B101は操作部B105を介して検索要求を受け付けたか判定する。制御部B101は、操作部B105を介して検索要求を受け付けたと判定した場合S814の処理に移行し、そうでない場合はS802の処理に移行する。
S814において、制御部B101は表示部B107に検索画面200bを表示する。本ステップは図7におけるS321の処理に相当する。
S815において、制御部B101は順次付与フラグを有効化し、RAM B103に記憶する。本ステップは図7におけるS712の処理に相当する。
S816において、制御部B101は操作部B105を介して検索開始要求を受け付けたか判定する。制御部B101は、操作部B105を介して検索開始要求を受け付けたと判定した場合S817の処理に移行し、そうでない場合S818の処理に移行する。制御部B101は操作部B105を介して検索開始ボタン205bが押下されたことを検索開始要求と判断する。
S817において、制御部B101は表示部B107に検索結果画面200cを表示しS802の処理に移行する。本ステップは図7におけるS325の処理に相当する。
S818において、制御部B101は操作部B105を介して検索中止要求を受け付けたか判定する。制御部B101は、操作部B105を介して検索中止要求を受け付けたと判定した場合S819の処理に移行し、そうでない場合S816の処理に移行する。制御部B101は操作部B105を介して検索キャンセルボタン206bが押下されたことを検索中止要求と判断する。
S819において、制御部B101は順次付与フラグを無効化し、RAM B103に記憶する。本ステップは図7におけるS715の処理に相当する。
S820において、制御部B101は表示部B107にサムネイル一覧画面200aを表示する。本ステップは図7におけるS308の処理に相当する。
S821において、制御部B101はS802において全ての画像認識サーバから画像認識応答を受信したか判定する。制御部B101は、S802において全ての画像認識サーバから画像認識応答を受信したと判定した場合S806の処理に移行し、そうでない場合S825の処理に移行する。
S822において、制御部B101は表示部B107に検索結果画面200cが表示中であるか判定する。制御部B101は、表示部B107に検索結果画面200cが表示中であると判定した場合S823の処理に移行し、そうでない場合S809に移行する。
S823において、制御部B101はS806で付与したメタデータに含まれる被写体がS816で検索条件として選択されたメタデータ項目に合致しているか判定する。制御部B101は、前記メタデータに含まれる被写体が前記検索条件に合致していると判定した場合S824の処理に移行し、そうでない場合S802の処理に移行する。
S824において、制御部B101は表示部B107に表示中の検索結果画面200cを更新する。制御部B101は、前記画面にS502で撮影したオリジナル画像を表示していない場合、前記画面に前記画像を追加して表示する。この時、制御部B101はS506で付与したメタデータに含まれるメタデータ進捗情報が100%でない場合、S502で撮影したオリジナル画像にメタデータ付与未完了表示202aおよびメタデータ付与進捗表示203a、メタデータ未完了表示201cを重畳表示する。一方、前記メタデータ進捗情報が100%の場合、制御部B101は、メタデータ付与未完了表示202aとメタデータ付与進捗表示203aを削除し、メタデータ付与完了表示201aを重畳表示する本ステップは図3におけるS713およびS714の処理に相当する。
S825において、制御部B101はS802で受信した画像認識応答の情報もしくはS805でマージした情報をRAM B103に記憶する。本ステップは図7におけるS706の処理に相当する。
以上が、本実施形態のカメラB100の動作を示すフローチャートの説明である。
以上のように、本実施形態のカメラB100は、ユーザの設定や機器の状態に応じて、順次メタデータを付与するか、全ての認識結果が揃ってから統合してメタデータを付与するかを切り替える。これにより、カメラB100の処理負荷が低い、あるいは、ユーザがメタデータ利用を急ぐ場合にはメタデータを利用可能になるまでの時間短縮を優先し、そうでない場合にはカメラB100の処理負荷低減を優先することができる。
(その他の実施形態)
上述の実施形態におけるカメラは、撮影画像を複数表示する場合を例に説明したが、単一表示と複数表示とで表示内容を変える構成でも良い。すなわち、単一表示の場合はメタデータ付与未完了表示202aおよびメタデータ付与進捗表示203aを重畳表示し、複数表示の場合はメタデータ付与未完了表示202aのみを重畳表示する構成でも良い。
本発明は、以下の処理を実行することによっても実現される。即ち、上述した実施形態の機能を実現するソフトウェア(プログラム)をネットワーク又は各種記憶媒体を介してシステム或いは装置に供給し、そのシステム或いは装置のコンピュータ(又はCPUやMPU等)がプログラムコードを読み出して実行する処理である。この場合、そのプログラム、および当該プログラムを記憶した記憶媒体は本発明を構成することになる。
A100 中間サーバ
B100 カメラ
C100 画像認識サーバ
D100 インターネット

Claims (6)

  1. 画像の被写体認識を行う複数のサーバ装置に、クライアント端末から取得した画像を送信して被写体認識を要求する中間サーバ装置であって、
    各サーバ装置から被写体認識の結果を受信する受信手段と、
    受信した被写体認識の結果に基づいて、前記画像のメタデータに付与する被写体情報を前記クライアント端末に送信する送信手段と、
    制御手段と、を備え、
    前記制御手段は、前記画像とともに取得した前記クライアント端末の状態を示す情報に基づいて、前記送信手段が、被写体認識の結果ごとに被写体情報を送信するか、被写体認識の結果を統合して被写体情報を送信するか、を切り替えるように制御することを特徴とする中間サーバ装置。
  2. 前記制御手段は、前記画像とともに取得した前記クライアント端末の状態が、前記クライアント端末が画像検索を要求されたことに基づく情報を含む場合は、被写体認識の結果ごとに被写体情報を送信するように制御することを特徴とする請求項に記載の中間サーバ装置。
  3. 前記被写体情報は、認識した被写体の信頼度を含むことを特徴とする請求項1または2に記載の中間サーバ装置。
  4. 画像の被写体認識を行う複数のサーバ装置に、情報処理装置の状態と画像を送信して被写体認識を要求する前記情報処理装置であって、
    各サーバ装置から被写体認識の結果を受信する受信手段と、
    受信した被写体認識の結果に基づいて、前記画像のメタデータに被写体情報を付与する付与手段と、
    制御手段と、を備え、
    前記制御手段は、前記画像とともに送信した前記情報処理装置の状態に基づき、被写体認識の結果ごとに被写体情報を付与するか、被写体認識の結果を統合して被写体情報を付与するか、を切り替えるように制御することを特徴とする情報処理装置。
  5. 撮像手段を備え、
    前記制御手段は、前記撮像手段が撮影動作中であることに基づく情報を前記画像とともに前記複数のサーバ装置に送信した場合は、被写体認識の結果を統合して被写体情報を付与するように制御することを特徴とする請求項に記載の情報処理装置。
  6. 通信装置の制御方法であって、
    前記通信装置が画像の被写体認識を行う複数のサーバ装置に、クライアント端末から取得した画像を送信して被写体認識を要求するステップと、
    前記通信装置が各サーバ装置から被写体認識の結果を受信するステップと
    前記通信装置が受信した被写体認識の結果に基づいて、前記画像のメタデータに付与する被写体情報を前記クライアント端末に送信するステップとを有し
    前記通信装置が前記被写体情報の送信において、前記画像とともに取得した前記クライアント端末の状態を示す情報に基づいて、被写体認識の結果ごとに被写体情報を送信するか、被写体認識の結果を統合して被写体情報を送信するか、を切り替えるように制御することを特徴とする通信装置の制御方法。
JP2019182452A 2019-10-02 2019-10-02 中間サーバ装置、情報処理装置、通信方法 Active JP7379059B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2019182452A JP7379059B2 (ja) 2019-10-02 2019-10-02 中間サーバ装置、情報処理装置、通信方法
US17/033,030 US11775579B2 (en) 2019-10-02 2020-09-25 Server apparatus, information processing apparatus, and communication method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2019182452A JP7379059B2 (ja) 2019-10-02 2019-10-02 中間サーバ装置、情報処理装置、通信方法

Publications (2)

Publication Number Publication Date
JP2021060630A JP2021060630A (ja) 2021-04-15
JP7379059B2 true JP7379059B2 (ja) 2023-11-14

Family

ID=75275143

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019182452A Active JP7379059B2 (ja) 2019-10-02 2019-10-02 中間サーバ装置、情報処理装置、通信方法

Country Status (2)

Country Link
US (1) US11775579B2 (ja)
JP (1) JP7379059B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20220198028A1 (en) * 2020-12-17 2022-06-23 The Toronto-Dominion Bank Secure resolution of email-based queries involving confidential third-party data

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006309600A (ja) 2005-04-28 2006-11-09 Olympus Corp 検索システム
JP2012518238A (ja) 2009-02-18 2012-08-09 エーナイン・ドット・コム インコーポレイテッド 画像マッチングのための方法およびシステム
WO2012111252A1 (ja) 2011-02-17 2012-08-23 日本電気株式会社 情報処理装置
JP2013501976A (ja) 2009-08-07 2013-01-17 グーグル インコーポレイテッド 視覚クエリの複数の領域についての検索結果を提示するためのユーザインターフェイス
JP2016517599A (ja) 2013-03-15 2016-06-16 ロバート ハドック, 知識への1段階アクセスを提供する適応ユーザインターフェースを有する知的インターネットシステム
JP2018181081A (ja) 2017-04-18 2018-11-15 日本電信電話株式会社 画像認識エンジン連携装置およびプログラム

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5693638B2 (ja) 2013-04-10 2015-04-01 株式会社クラフト Xmlタグ等の分割・結合機能を備える通信中継システム
US20180107660A1 (en) * 2014-06-27 2018-04-19 Amazon Technologies, Inc. System, method and apparatus for organizing photographs stored on a mobile computing device
CN107291560A (zh) * 2016-03-31 2017-10-24 北京三星通信技术研究有限公司 一种智能设备的内容确定方法和装置
US10990495B1 (en) * 2019-04-15 2021-04-27 Snap Inc. Selectively enabling features based on rules
US20210006624A1 (en) * 2019-07-03 2021-01-07 Chargifi Limited Systems and Methods for Activating Functionality

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006309600A (ja) 2005-04-28 2006-11-09 Olympus Corp 検索システム
JP2012518238A (ja) 2009-02-18 2012-08-09 エーナイン・ドット・コム インコーポレイテッド 画像マッチングのための方法およびシステム
JP2013501976A (ja) 2009-08-07 2013-01-17 グーグル インコーポレイテッド 視覚クエリの複数の領域についての検索結果を提示するためのユーザインターフェイス
WO2012111252A1 (ja) 2011-02-17 2012-08-23 日本電気株式会社 情報処理装置
JP2016517599A (ja) 2013-03-15 2016-06-16 ロバート ハドック, 知識への1段階アクセスを提供する適応ユーザインターフェースを有する知的インターネットシステム
JP2018181081A (ja) 2017-04-18 2018-11-15 日本電信電話株式会社 画像認識エンジン連携装置およびプログラム

Also Published As

Publication number Publication date
US20210103612A1 (en) 2021-04-08
JP2021060630A (ja) 2021-04-15
US11775579B2 (en) 2023-10-03

Similar Documents

Publication Publication Date Title
EP3754592B1 (en) Image acquisition device and method of controlling the same
JP6439806B2 (ja) ロボット装置及びプログラム
JP7379059B2 (ja) 中間サーバ装置、情報処理装置、通信方法
JP7453772B2 (ja) 情報処理装置及びその制御方法、撮像装置システム、プログラム
JP7286333B2 (ja) 情報処理装置、情報処理装置の制御方法およびプログラム
CN109391771B (zh) 摄像装置、通信装置、其控制方法和存储介质
CN110278589A (zh) 通信装置、数据传输装置及其控制方法和存储介质
JP2021009439A (ja) 画像処理システム及びプログラム。
JP6023577B2 (ja) 撮像装置、撮像装置の制御方法及びプログラム
JP2014175724A (ja) 撮像操作端末、撮像システム、ソフトウェア抽出及びプログラム
JP2020071721A (ja) 電子機器、その制御方法、およびそのプログラム
KR100965875B1 (ko) 능동적 전송이 수행되는 디지털 카메라의 제어 방법
CN107079109A (zh) 相机快门控制方法、装置及系统
JP7341690B2 (ja) 情報処理装置、方法、及びプログラム
JP2019101783A (ja) 情報処理装置及び方法
KR102289194B1 (ko) 서버 및 그것의 동작 방법
CN109085944A (zh) 数据处理方法、装置以及移动终端
JP2019020772A (ja) 被写体情報表示システム、画像処理装置の制御方法及びプログラム
JP2017055366A (ja) 通信装置、通信装置の制御方法、プログラム
JP2024006237A (ja) 画像管理装置、制御方法、及びプログラム
CN108924429B (zh) 一种预览画面显示方法、预览画面显示装置及终端设备
JP2018005270A (ja) 電子機器とその制御方法、プログラム、記憶媒体及び情報処理システム
JP2007213607A (ja) 画像処理装置および記録媒体
JP2018006957A (ja) 画像記録装置、画像記録装置の制御方法及びプログラム
JP2005032163A (ja) 顔照合システム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20220927

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20230724

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20230801

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230922

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20231003

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20231101

R151 Written notification of patent or utility model registration

Ref document number: 7379059

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151