JP7286333B2 - 情報処理装置、情報処理装置の制御方法およびプログラム - Google Patents

情報処理装置、情報処理装置の制御方法およびプログラム Download PDF

Info

Publication number
JP7286333B2
JP7286333B2 JP2019019862A JP2019019862A JP7286333B2 JP 7286333 B2 JP7286333 B2 JP 7286333B2 JP 2019019862 A JP2019019862 A JP 2019019862A JP 2019019862 A JP2019019862 A JP 2019019862A JP 7286333 B2 JP7286333 B2 JP 7286333B2
Authority
JP
Japan
Prior art keywords
information processing
external device
image data
inference model
analysis result
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2019019862A
Other languages
English (en)
Other versions
JP2020126535A (ja
Inventor
博敬 小田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2019019862A priority Critical patent/JP7286333B2/ja
Priority to US16/782,152 priority patent/US11403841B2/en
Publication of JP2020126535A publication Critical patent/JP2020126535A/ja
Application granted granted Critical
Publication of JP7286333B2 publication Critical patent/JP7286333B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • G06N20/20Ensemble learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/24765Rule-based classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/285Selection of pattern recognition techniques, e.g. of classifiers in a multi-classifier system
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/29Graphical models, e.g. Bayesian networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/04Inference or reasoning models
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/764Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
    • G06V10/765Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects using rules for classification or partitioning the feature space
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/87Arrangements for image or video recognition or understanding using pattern recognition or machine learning using selection of the recognition techniques, e.g. of a classifier in a multiple classifier system
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/94Hardware or software architectures specially adapted for image or video understanding
    • G06V10/95Hardware or software architectures specially adapted for image or video understanding structured as a network, e.g. client-server architectures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/10Terrestrial scenes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/70Labelling scene content, e.g. deriving syntactic or semantic representations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks

Description

本発明は、画像データの解析を行う情報処理装置、情報処理装置の制御方法およびプログラムに関する。
デジタルカメラや携帯端末等の情報処理装置が、クラウドサーバ等と連携して、画像データの解析を行う技術が用いられている。関連する技術として、例えば、特許文献1の技術が提案されている。特許文献1の技術では、サーバが、エッジデバイスの各々により認識されることが予想されるオブジェクトのサブセットを識別する。サーバは、対応する複数の画像のサブセットを含む各エッジデバイスについて、縮小オブジェクト認識データベースを生成する。各エッジデバイスは、複数のデバイスイベントを監視し、デバイスイベントに応答して、対応する縮小オブジェクト認識データベースを用いてオブジェクト認識を実行する。
特開2017-54491号公報
画像解析処理において、画像データの学習を行い、学習結果に基づいて推論モデルを構築することで、画像データの解析を行う手法がある。画像データの学習や推論モデルの構築を行うためには、情報処理装置に高い処理能力が要求される。また、画像データの解析の精度向上を図るためには、学習時間がかかるため、より高い処理能力が情報処理装置に要求される。この点、デジタルカメラや携帯端末等のように処理能力が限られている情報処理装置の場合、上記の要求に対応することは難しい。そこで、画像データの学習や推論モデルに基づく画像データの解析は、高い処理能力を有する外部装置(クラウドサーバ等)が行い、デジタルカメラや携帯端末等の情報処理装置は、外部装置からの解析結果を取得することが考えられる。しかしながら、上記の構成では、ネットワークが切断されていると、情報処理装置と外部装置との間の通信ができないため、情報処理装置は、画像データの解析結果を取得できない。
本発明の目的は、外部装置との通信ができない状態でも画像データの解析結果を取得できる情報処理装置、情報処理装置の制御方法およびプログラムを提供することにある。
上記目的を達成するために、本発明の情報処理装置は、外部装置と通信可能な情報処理装置であって、前記外部装置との通信ができない場合、前記外部装置の第1の推論モデルより精度が低い第2の推論モデルを用いて、画像データを解析して第2の解析結果を取得する解析手段と、前記外部装置との通信ができる場合、前記画像データを前記外部装置に送信する送信手段と、前記送信手段により前記外部装置へ送信された画像データが前記第1の推論モデルを用いて解析された第1の解析結果を前記外部装置から取得する取得手段と、前記画像データを前記第1の解析結果および前記第2の解析結果のうち少なくとも一方と関連付けて記録する記録手段と、前記外部装置との通信状態を検出する検出手段と、を備え、前記送信手段は、前記外部装置との通信ができない状態から前記外部装置との通信ができる状態へ変化した場合、前記記録手段に記録された複数の画像データのうち、前記第1の解析結果が記録されていない画像データを前記外部装置へ送信することを特徴とする。
本発明によれば、外部装置との通信ができない状態でも画像データの解析結果を取得できる。
本実施形態のシステムの構成例を示す図である。 本実施形態の情報処理装置の機能ブロック図である。 表示部に表示される画面例を示す図である。 画像解析によるオブジェクト認識の粒度を示す図である。 オンライン状態にあるときの画像解析の方法を示す図である。 オフライン状態にあるときの画像解析の方法を示す図である。 管理テーブルの一例を示す図である。 本実施形態の処理の流れを示すフローチャートである。 詳細識別結果の更新の処理の流れを示すフローチャートである。
以下、本発明の各実施の形態について図面を参照しながら詳細に説明する。しかしながら、以下の各実施の形態に記載されている構成はあくまで例示に過ぎず、本発明の範囲は各実施の形態に記載されている構成によって限定されることはない。
以下、図面を参照して実施形態について説明する。図1は、本実施形態のシステム101の構成例を示す図である。システム101では、情報処理装置102と画像解析サーバ103との間は、ネットワーク104を介して接続されている。情報処理装置102は、例えば、デジタルカメラやスマートデバイス、携帯端末等のデバイスである。情報処理装置102は、撮像機能を有する。例えば、情報処理装置102は、撮像機能および通信機能を有するスマートフォンであってよい。画像解析サーバ103は、画像データの解析を行う外部装置である。画像解析サーバ103は、例えば、クラウドサーバ等であってよい。画像解析サーバ103は、情報処理装置102より高い処理能力を有する。
情報処理装置102は、ネットワーク104での情報転送が可能な標準プロトコルを有する。情報処理装置102は、HTTP等のプロトコルを用いて画像解析サーバ103にアクセスする。情報処理装置102は、画像データまたは画像データの一部を含む情報(XML等の記述言語で作成された情報)を画像解析サーバ103に送信し、HTMLやXML等の記述言語で作成された情報を取得して解析する。情報処理装置102は、解析した情報に基づいて、被写体の種類や名称のタグ付けや表示等の補助を行うことができる。情報処理装置102は、撮影モードの選択等のための撮影処理のデータの一部、あるいは撮影した画像データの処理データの一部として利用することができる。
実施形態では、情報処理装置102は、ネットワーク104を介して、画像解析サーバ103と通信を行う際に、画像解析を行うための情報を暗号化するものとする。暗号化の手法には、例えば、SSL等が適用できる。また、画像解析サーバ103は、許可された情報処理装置102との間でのみ、画像解析を行うための情報を送受信できるように構成されているものとする。上述した暗号化等の制限は必須ではない。情報処理装置102と画像解析サーバ103との間は、常に通信可能に接続されているとは限らない。例えば、情報処理装置102の使用環境によって、通信状態が変化し得る。情報処理装置102は、ネットワーク104に接続できる場合もあり、ネットワーク104から切断された状態となる場合もある。情報処理装置102がネットワーク104から切断された状態になると、情報処理装置102は画像解析サーバ103と通信不能になる。
図2は、本実施形態の情報処理装置102の機能ブロック図である。本実施形態の情報処理装置102は、撮像機能を有する。情報処理装置102は、上述したように、デジタルカメラ等の撮像装置であってもよい。ただし、情報処理装置102は、双眼鏡や望遠鏡等の機能を有しておらず、ファインダーや画面等に画像データの解析結果を表示する装置であってもよい。図2において、撮像レンズ201は、フォーカスレンズ等を含むレンズである。撮像レンズ201は、フォーカスレンズ以外のレンズを含んでいてもよい。シャッター202は、絞り機能を有する。撮像手段としての撮像部203は、光学像を電気信号に変換するCCDやCMOS素子等で構成される。A/D変換器204は、撮像部203から出力されるアナログ信号をデジタル信号に変換する。図2では、A/D変換器204は「A/D」として示されている。バリア205は、撮像レンズ201等を覆うことにより、撮像レンズ201、シャッター202および撮像部203を含む撮像系の汚れや破損を防止する。
画像処理部206は、A/D変換器204からの画像データまたはメモリ制御部207からの画像データに対して、画像処理を施す。当該画像処理としては、所定の画素補間や縮小といったリサイズ処理や色変換処理がある。画像処理部206は、撮像された画像データを用いて所定の演算処理を行い、システム制御部208が演算結果に基づいて露光制御および測距制御を行う。A/D変換器204から出力された画像データは、画像処理部206およびメモリ制御部207を介して、またはメモリ制御部207のみを介してメモリ209に書き込まれる。メモリ209は、撮像部203から得られ、且つA/D変換器204によりデジタルデータに変換された画像データや、表示部210に表示するための画像データを記憶する。メモリ209は、所定枚数の静止画像データや所定時間の動画像データおよび音声を格納するのに十分な記憶容量を有している。メモリ209は、画像表示用のメモリ(ビデオメモリ)も兼ねている。メモリ209は、各種の情報を記憶する。
D/A変換器211は、メモリ209に記憶されている画像表示用の画像データをアナログ信号に変換して表示部210に出力する。図2において、D/A変換器は、「D/A」として示される。メモリ209に書き込まれた表示用の画像データは、D/A変換器211を介して表示部210により表示される。表示部210はLCD等の表示器上に、D/A変換器211からのアナログ信号に応じた表示を行う。不揮発性メモリ212は、電気的に消去および記録が可能なメモリであり、例えばEEPROMなどが用いられる。不揮発性メモリ212には、システム制御部208が実行する制御プログラムや当該制御プログラムの動作用の定数等が記憶される。
システム制御部208は、情報処理装置102全体を制御する。システム制御部208は、解析手段、取得手段、検出手段および表示制御手段に対応する。システム制御部208は、例えば、CPUである。システムメモリ213は、例えばRAMである。システムメモリ213には、システム制御部208の動作用の定数や変数、不揮発性メモリ212から読み出したプログラム等が展開される。CPUとしてのシステム制御部208が、システムメモリ213に展開されたプログラムを実行することで、情報処理装置102の各処理が実現される。
モード切替スイッチ214、シャッターボタン215および操作部217は、システム制御部208に各種の動作指示を入力するための操作手段である。モード切替スイッチ214は、システム制御部208の動作モードを静止画記録モード、動画記録モードまたは再生モードの何れかに切り替える。動作モードには上記以外のモードがあってもよい。シャッターボタン215に対して、撮影準備指示(所謂半押し)がされると、第1シャッタースイッチがONとなり、第1シャッタースイッチ信号SW1が発生する。シャッターボタン215に対して、撮影指示(所謂全押し)がされると、第2シャッタースイッチがONとなり、第2シャッタースイッチ信号SW2が発生する。
システム制御部208は、第2シャッタースイッチ信号SW2により撮像部203からの信号読み出しから記録媒体225に画像データを書き込むまでの一連の撮影処理の動作を開始する。操作部217の各操作部材は、表示部210に表示される種々の機能アイコンが選択操作されることなどにより、場面ごとに適宜機能が割り当てられ各種機能ボタンとして機能する。機能ボタンとしては、例えば、確認ボタンや終了ボタン、戻るボタン、画像送りボタン、ジャンプボタン、絞込みボタン、属性変更ボタン等がある。例えば、メニューボタンが押されると、各種の設定可能なメニュー画面が表示部210に表示される。ユーザは表示部210に表示されたメニュー画面と、4方向ボタンやSETボタンとを用いて直感的に各種設定を行うことができる。
操作部217は、コントローラホイール218およびコントローラリング219を有する。コントローラホイール218は、回転操作可能な操作部材であり、方向ボタンと共に選択項目を指示する際に使用される。システム制御部208は、例えば、パルス信号に基づいて情報処理装置102の各構成部を制御する。システム制御部208は、上記パルス信号によってコントローラホイール218が回転操作された角度や回転数等を判定することができる。コントローラホイール218は、回転操作が検出できる任意の操作部材を適用できる。コントローラリング219は、操作部217に含まれる回転操作部材であり、レンズ鏡筒周りで光軸を中心として回転する操作が可能である。例えば、コントローラリング219に対して操作がされると、回転量(操作量)に応じた電気的なパルス信号が発生する。また、操作部217に含まれるコントローラリング219の機能切替ボタンが押されると、コントローラリング219に割り当てる機能を変更可能なメニュー画面が表示部210に表示される。コントローラリング219およびコントローラホイール218は、通常モード項目の選択や値の変更に用いられる。
電源スイッチ220は、電源オンと電源オフとを切り替えるためのスイッチである。電源制御部221は、電池検出回路、DC-DCコンバータ、通電するブロックを切り替えるスイッチ回路等により構成される。電源制御部221は、例えば、電池の装着の有無や電池の種類、電池残量の検出を行う。また、電源制御部221は、検出結果およびシステム制御部208の指示に基づいてDC-DCコンバータを制御し、必要な電圧を必要な期間、記録媒体225を含む各構成部へ供給する。電源部222は、アルカリ電池やリチウム電池等の一次電池やNiCd電池やNiMH電池、Li電池等の二次電池、ACアダプター等により構成される。
通信部223は、記録媒体225に記録されている画像データを外部装置に送信する。通信部223は、送信手段に対応する。インタフェース224は、記録媒体225が着脱可能に接続されるインタフェースである。図2では、インタフェースは「I/F」と表記される。記録媒体225には、半導体メモリや磁気ディスク等を適用できる。ネットワークI/F226は、システム制御部208の制御により、ネットワーク104を介して通信を行うネットワークインタフェースである。ネットワークI/F226を介した通信により、情報処理装置102は、ネットワーク104を介して、画像解析サーバ103と通信を行うことができる。通信部223とネットワークI/F226とは一体の構成であってもよい。
図3は、表示部210に表示される画面例を示す図である。図3の画面例において、表示部210には、オブジェクト303およびオブジェクト304が表示されている。各オブジェクトは、例えば、画像データに含まれる被写体である。図3のオブジェクト303は、「車」である。オブジェクト304は、「人」である。オブジェクトの種類や数等は、図3の例には限定されない。表示部210には、オブジェクト303の領域として判定された画像領域305、およびオブジェクト304の領域として判定された画像領域306が表示されている。表示部210には、オブジェクト303の属性を示すタグ307およびオブジェクト304の属性を示すタグ308が表示されている。タグは、属性情報に対応する。図3は、画像領域305、画像領域306、タグ307およびタグ308が表示されている例を示しているが、各画像領域は、表示部210に表示されなくてもよい。また、オブジェクトの属性は、タグ以外の形式で表示されてもよい。
図4は、画像解析によるオブジェクト認識の粒度を示す図である。タグ401は、図3のオブジェクト303が画像解析された結果、最も粗い粒度として推論された属性を示す。タグ401は、オブジェクト303が「自動車」という物体として推論されていることを示す。タグ402は、オブジェクト303が画像解析された結果、中程度の粒度として推論された属性を示す。タグ402は、オブジェクト303が「自動車」であり、その車種が「セダン」であると推論されていることを示す。タグ403は、オブジェクト303が画像解析された結果、最も詳細な粒度として推論された属性を示す。タグ403は、オブジェクト303の色や模様、付属物等から「タクシー」という特定の用途で使用される自動車であると推論されていることを示す。
同様に、タグ404は、オブジェクト304の画像解析の結果、最も粗い粒度として、オブジェクト304の属性が「人間」であると推論されたことを示す。タグ405は、オブジェクト304の画像解析の結果、中程度の粒度として、オブジェクト304は、性別が「男性」であると推論されたことを示す。タグ406は、オブジェクト304の画像解析の結果、最も詳細な粒度として、オブジェクト304の年齢の推論により、オブジェクト304の属性が「成人」であることを示している。図3の例では、粒度が3段階の例を示したが、段階数は3段階には限定されない。
上述した粒度が高くなるに応じて、オブジェクトの推論精度が高くなる。つまり、上述した粒度が最も粗い場合、オブジェクトの推論精度が最も低い。一方、上述した粒度が最も細かい場合、オブジェクトの推論精度が最も高い。オブジェクトの推論は、推論モデルに基づいて行われる。推論モデルは、例えば、機械学習により生成される学習済みモデルである。粗い粒度でのオブジェクトの推論は、学習量が少ない推論モデルを使用しても可能であり、処理能力が低い装置でも実現可能である。一方、詳細な粒度でのオブジェクトの推論は、学習量が多い推論モデルを使用することが必要であり、且つ高い処理能力を有する装置が必要になる。学習量が多い推論モデルは、例えば、大量のデータを入力とした機械学習を行うことにより得ることができる。情報処理装置102の処理能力が低い場合、詳細な粒度でのオブジェクトの推論は難しい。この場合、情報処理装置102は、画像解析サーバ103に、推論処理の要求を出力し、画像解析サーバ103が行った推論処理の結果を含む解析結果(第1の解析結果)を取得する。これにより、処理能力が低い情報処理装置でも、詳細な粒度でのオブジェクトの推論結果を取得することができる。
図5は、オンライン状態にあるときの画像解析の方法を示す図である。オンライン状態は、情報処理装置102と画像解析サーバ103とがネットワーク104を介して通信可能な通信状態であり、通信が確立されていることを示す。図5に示されるように、情報処理装置102は、簡易的な推論モデルである簡易推論モデル502と、簡易推論モデルに基づいて簡易的な推論処理を行う簡易推論コンポーネント503を有する。簡易推論モデル502は、第2の推論モデルに対応する。簡易推論モデル502および簡易推論コンポーネント503の機能は、システム制御部208がプログラムを実行することで、実現される。情報処理装置102はネットワーク104と接続されている状態(オンライン状態)において、画像解析サーバ103と通信を行う。簡易推論モデル502は、例えば、システムメモリ213に記憶される。この場合、システムメモリ213は、記憶手段に対応する。
画像解析サーバ103は、詳細推論モデル507を構築するための学習コンポーネント506、詳細推論モデル507および推論処理を行う詳細推論コンポーネント508を有する。詳細推論モデル507は、第1の推論モデルに対応する。詳細推論モデル507は、簡易推論モデル502より精度の高い推論モデル(高性能な推論モデル)である。画像解析サーバ103は、CPU、RAMおよびROMを有しており、ROMに格納されたプログラムがRAMに展開され、CPUがRAMに展開されたプログラムを実行する。これにより、学習コンポーネント506、詳細推論モデル507および詳細推論コンポーネント508の機能が実現されてもよい。
情報処理装置102は、撮像部203から取得した画像データ509を、ネットワーク104を介して、画像解析サーバ103に送信する。情報処理装置102は、画像データ509とともに、簡易推論モデル502を用いて解析された解析結果(第2の解析結果)を画像解析サーバ103に送信してもよい。画像解析サーバ103は、受信した画像データ509を詳細推論コンポーネント508に入力して、推論処理を実行する。画像解析サーバ103は、上記の推論処理により、画像データ509に含まれるオブジェクトを認識し、オブジェクトの属性を判定する。画像解析サーバ103は、認識したオブジェクトおよび属性の情報を含む解析結果を情報処理装置102に送信する。画像解析サーバ103は、高い処理能力を有する。また、画像解析サーバ103は、常時稼働による処理時間が確保できるため、より高精度な詳細推論モデル507を構築できる。そのため、画像解析サーバ103は、最も詳細な粒度での画像データの解析結果を得ることができる。画像解析サーバ103の詳細推論モデル507は、十分な学習量に基づいて構築される推論モデルである。一方、簡易推論モデル502の学習量は、詳細推論モデル507の学習量より少ない。このため、簡易推論モデル502を用いた推論の精度は、詳細推論モデル507を用いた推論の精度より低い。
情報処理装置102は、画像解析サーバ103から受信した解析結果をメモリ209に記憶し、表示部210に出力する。これにより、解析結果が表示部210に表示される。情報処理装置102が、画像解析サーバ103から解析結果を受信した場合、情報処理装置102の簡易推論モデル502および簡易推論コンポーネント503は使用されない。画像解析サーバ103の学習コンポーネント506は、外部のコンピュータ等から任意のタイミングで学習データとしての画像データを取得することができる。学習データとしては、画像解析サーバ103が取得した画像データの他、ネットワーク104上に公開されている画像データ、あるいは情報処理装置102から送信された画像データ509等も含まれる。学習コンポーネント506は、例えば、上記の各種の画像データを入力とした機械学習を行い、学習結果として、解析の粒度ごとに詳細推論モデル507を構築する。学習コンポーネント506は、推論モデルを構築する機能に対応する。画像解析サーバ103の学習コンポーネント506は、詳細推論モデル507を構築するとともに、詳細推論モデル507の一部である粒度の粗い簡易推論モデル502を構築してもよい。
図5において、画像解析サーバ103は、学習コンポーネント506を有しているが、学習コンポーネント506は、画像解析サーバ103とは異なる別途の装置が有していてもよい。この場合、画像解析サーバ103は、別途の装置が有する学習コンポーネント506により最新の詳細推論モデル507を常に取得するように構成されていてもよい。また、情報処理装置102と画像解析サーバ103とが通信可能に接続されている場合(オンライン状態である場合)、画像解析サーバ103は、最新の詳細推論モデル507の一部の粒度の粗い簡易推論モデルを情報処理装置102に送信する。これにより、情報処理装置102は、自身が記憶していた簡易推論モデル502を、最新の簡易推論モデルに更新する。
図6は、オフライン状態にあるときの画像解析の方法を示す図である。オフライン状態は、情報処理装置102がネットワーク104に接続できない状態であり、情報処理装置102は画像解析サーバ103との通信が切断されて、通信不可能な通信状態である。この場合、情報処理装置102は、ネットワーク104を介して、画像解析サーバ103と通信することができない。オフライン状態(通信が切断された状態)は、情報処理装置102と画像解析サーバ103との間の通信が完全に切断された状態だけでなく、本実施形態の処理を正常に行えない程度に不安定な通信状態であってもよい。図6の簡易推論モデル602および簡易推論コンポーネント603は、図5の簡易推論モデル502および簡易推論コンポーネント503に対応する。簡易推論モデル602は、上述したように、オンライン状態のときに、最新の簡易推論モデルに更新される。簡易推論コンポーネント603は、簡易推論モデル602に基づいて、簡易的な推論処理を行う。情報処理装置102は、撮像部203から取得した画像データ604を簡易推論コンポーネント603に入力する。簡易推論コンポーネント603は、簡易推論モデル602を用いて推論処理を実行し、画像データ604に含まれるオブジェクトを認識し、認識されたオブジェクトの属性を判定することで、解析結果(第2の解析結果)を得る。簡易推論コンポーネント603は、解析結果をメモリ209に記憶するとともに、表示部210に表示する。これにより、通信状態がオフライン状態であっても、情報処理装置102は、簡易推論コンポーネント603により、簡易的な画像解析を行うことができる。
情報処理装置102は、オフライン時に簡易的な推論処理によるオブジェクトの認識を行った後、オンライン状態になった際に、簡易的に認識されたオブジェクトおよび属性を含む解析結果を、画像データとともに画像解析サーバ103に送信してもよい。画像解析サーバ103は、受信した解析結果を詳細推論モデル507に反映する。つまり、詳細推論コンポーネント508は、オフライン状態の間における簡易推論モデル602を用いた画像データの解析結果が反映された詳細推論モデル507を用いて、詳細な粒度の解析を行うことができる。これにより、詳細推論コンポーネント508による推論処理の時間の短縮化が図れる。
図7は、管理テーブルの一例を示す図である。管理テーブルで管理される情報は、テーブル形式とは異なる態様で管理されてもよい。管理テーブルは、例えば、画像データごとに作成され、システム制御部208により、記録手段としてのメモリ209に記憶される。管理テーブルは、管理番号701、領域702、簡易推論結果703および詳細推論結果704の項目を有する。すなわち、画像データが簡易推論結果703および詳細推論結果704と関連付けてメモリ209に記憶される。なお、各レコードは、管理テーブルと対応する画像データを一意に特定するための識別子や画像データの保存場所を示すファイルパスの項目も有していてもよい。管理番号701は、画像データの解析の結果、認識されたオブジェクトを管理する番号を示す。領域702は、認識されたオブジェクトが画像データに占める領域の座標情報を示す。簡易推論結果703は、情報処理装置102の簡易推論コンポーネント603が簡易推論モデル602を用いて画像データを解析した際のオブジェクトの属性の推論結果を示す。詳細推論結果704は、画像解析サーバ103の詳細推論コンポーネント508が詳細推論モデル507を用いて画像データを解析した際のオブジェクトの属性の推論結果を示す。レコード705は、管理番号「1」に対応するレコードであり、レコード706は、管理番号「2」に対応するレコードである。
レコード705は、図3のオブジェクト303の領域として切り出した画像領域305についての管理情報である。レコード705の簡易推論結果703は、「自動車」であることを示している。簡易推論結果703は、オフライン状態における情報処理装置102の簡易推論コンポーネント603による簡易的な推論結果であり、図4に示されるような粗い粒度の属性である「自動車」であることを示している。レコード705の詳細推論結果704は、「タクシー」であることを示している。詳細推論結果704は、オンライン状態において画像解析サーバ103から取得した詳細な粒度の推論結果である。従って、詳細推論結果704は、図4に示されるような詳細な粒度の属性である「タクシー」であることを示している。
レコード706の簡易推論結果703は、簡易的な推論結果である粗い粒度の属性である「人間」であることを示している。レコード706の詳細推論結果704は、詳細な推論結果である詳細な粒度の属性である「男性・成人」であることを示している。図7は、管理テーブルが2つのレコードである例を示しているが、推論処理が行われてオブジェクトが認識されるごとに、管理テーブルのレコードの数は増える。図7の管理テーブルの例は、簡易推論結果703と詳細推論結果704との両者を含むが、何れか一方のみを含む構成であってもよい。
図8は、本実施形態の処理の流れを示すフローチャートである。システム制御部208は、画像データを取得する(S801)。撮像部203から受けたアナログの画像データが、A/D変換器204(変換器)でデジタルの画像データに変換される。そして、画像処理部206が画像データに対して画像処理を施す。画像処理が施された画像データがシステム制御部208に入力されることで、S801の処理が行われる。S801の処理の後、S802以降の処理が行われる。S802以降の処理は、システム制御部208が画像データを取得したタイミングではなく、例えば、一定時間ごとに行われてもよい。
システム制御部208は、情報処理装置102がオンライン状態であるかを判定する(S802)。システム制御部208は、ネットワークI/F226の状態を確認して、情報処理装置102がネットワーク104に接続されているかを検出することで、S802の判定処理を行ってもよい。S802でNOと判定された場合、通信状態は、オフライン状態である。この場合、システム制御部208は、S801で取得した画像データを、図6で示される簡易推論コンポーネント603に入力する(S803)。簡易推論コンポーネント603は、図6で示される情報処理装置102の簡易推論モデル602を用いて、入力された画像データの解析を行い、オブジェクトおよび属性を推論する(S804)。
S802でYESと判定された場合、通信状態はオンライン状態である。この場合、システム制御部208は、S801で取得された画像データを、ネットワーク104を介して、画像解析サーバ103に送信する制御を行う(S805)。画像解析サーバ103は、情報処理装置102から受信した画像データを詳細推論コンポーネント508に入力する(S806)。画像解析サーバ103の詳細推論コンポーネント508は、詳細推論モデル507を用いて画像データを解析する。そして、画像解析サーバ103は、詳細推論モデル507を用いて解析されたオブジェクトおよび属性を含む解析結果を情報処理装置102に送信する(S807)。情報処理装置102は、画像解析サーバ103が送信した解析結果を受信する(S808)。情報処理装置102は、オンライン状態か否かを検出して、画像解析サーバ103に問い合わせを行って解析結果を得る処理と、情報処理装置102の内部で行う処理とを逐次的に行ってもよいし、並列的に行ってもよい。
S804では、システム制御部208は、自身の簡易推論モデル602が解析した解析結果を取得する。簡易推論モデル602による解析結果は、粒度の粗い解析結果である。一方、画像解析サーバ103から取得した解析結果は、詳細な粒度の解析結果である。システム制御部208は、上述した図7の管理テーブルに、オブジェクトごとのレコードを追加する(S809)。この際、システム制御部208は、追加したレコードに対して管理番号を記録してもよい。システム制御部208は、追加されたレコードに、オブジェクトに関する情報を記録する(S810)。S804の処理が行われた際には、粒度が粗い解析結果が簡易推論結果703に記録される。S808の処理が行われた際には、システム制御部208は、画像解析サーバ103から取得した解析結果を詳細推論結果704に記録する。
システム制御部208は、画像データに含まれる全てのオブジェクトが認識されたかを判定する(S811)。S811でNOと判定された場合、フローは、S802に移行する。S811でYESと判定された場合、システム制御部208は、画像データとともにオブジェクト、領域およびタグを表示部210に表示させる(S812)。システム制御部208は、S812の処理を行う際、画像データのメタデータとしてタグの情報をメモリ209に記憶してもよい。システム制御部208は、オブジェクトの解析結果に基づいて、撮影モードの選択や撮影結果の送信等の後工程の処理を行ってもよい。
図9は、詳細識別結果の更新の処理の流れを示すフローチャートである。システム制御部208は、ネットワークI/F226の状態変化を検出したかを判定する(S901)。ネットワークI/F226の状態変化は、オンライン状態からオフライン状態への変化またはオフライン状態からオンライン状態への変化の何れかである。S901でNOの場合、フローは、S901に戻る。S901でYESの場合、システム制御部208は、検出された通信状態の変化が、オフライン状態からオンライン状態への変化であるかを判定する(S902)。S902でYESと判定された場合、システム制御部208は、管理テーブルを参照して、簡易推論結果703は記録されているが、詳細推論結果704が記録されていないレコードがあるかを判定する(S903)。S903でYESと判定された場合、システム制御部208は、該当するレコードの画像データを取得し、画像解析サーバ103に送信する制御を行う(S904)。これにより、情報処理装置102から画像解析サーバ103に画像データが送信される。システム制御部208は、上記画像データとともに簡易推論結果703を画像解析サーバ103に送信する制御を行ってもよい。
画像解析サーバ103は、受信した画像データを詳細推論コンポーネント508に入力する(S905)。詳細推論コンポーネント508は、詳細推論モデル507に画像データを入力して、画像解析を行う。画像解析サーバ103は、解析結果を情報処理装置102に送信する(S906)。上述したように、情報処理装置102が、画像データとともに簡易推論結果703を送信した場合、詳細推論モデル507に簡易推論結果703が反映される。詳細推論コンポーネント508は、簡易推論結果703が反映された詳細推論モデル507を用いて、解析を行ってもよい。情報処理装置102は、画像解析サーバ103が送信した解析結果を受信する(S907)。システム制御部208は、受信した解析結果から詳細推論結果を更新する(S908)。
S902でNOと判定された場合、およびS903でNOと判定された場合、S904~S908の処理は実施されない。以上の処理により、管理テーブルのレコードには、オフライン状態で処理された簡易推論結果だけでなく、詳細推論結果も記録されるため、管理テーブルの詳細推論結果が更新される。管理テーブルに複数のレコードが記録されている場合、全てのレコードについて、S904~S908の処理が実行される。上述したように、情報処理装置102は、オンライン状態か否かを検出して、画像解析サーバ103に問い合わせを行って解析結果を得る処理と、情報処理装置102の内部で行う処理とを逐次的に行ってもよいし、並列的に行ってもよい。また、システム制御部208は、オブジェクトの解析結果に基づいて、撮影モードの選択や撮影結果の送信等の後工程の処理を行ってもよい。
以上、本発明の好ましい実施の形態について説明したが、本発明は上述した各実施の形態に限定されず、その要旨の範囲内で種々の変形及び変更が可能である。本発明は、上述の各実施の形態の1以上の機能を実現するプログラムを、ネットワークや記憶媒体を介してシステムや装置に供給し、そのシステム又は装置のコンピュータの1つ以上のプロセッサーがプログラムを読み出して実行する処理でも実現可能である。また、本発明は、1以上の機能を実現する回路(例えば、ASIC)によっても実現可能である。
101 システム
102 情報処理装置
103 画像解析サーバ
104 ネットワーク
203 撮像部
208 システム制御部
209 メモリ
210 表示部
502 簡易推論モデル
507 詳細推論モデル

Claims (10)

  1. 外部装置と通信可能な情報処理装置であって、
    前記外部装置との通信ができない場合、前記外部装置の第1の推論モデルより精度が低い第2の推論モデルを用いて、画像データを解析して第2の解析結果を取得する解析手段と、
    前記外部装置との通信ができる場合、前記画像データを前記外部装置に送信する送信手段と、
    前記送信手段により前記外部装置へ送信された画像データが前記第1の推論モデルを用いて解析された第1の解析結果を前記外部装置から取得する取得手段と、
    前記画像データを前記第1の解析結果および前記第2の解析結果のうち少なくとも一方と関連付けて記録する記録手段と、
    前記外部装置との通信状態を検出する検出手段と、を備え、
    前記送信手段は、前記外部装置との通信ができない状態から前記外部装置との通信ができる状態へ変化した場合、前記記録手段に記録された複数の画像データのうち、前記第1の解析結果が記録されていない画像データを前記外部装置へ送信することを特徴とする情報処理装置。
  2. 前記送信手段は、前記画像データとともに前記第2の解析結果を前記外部装置に送信することを特徴とする請求項に記載の情報処理装置。
  3. 前記第1の推論モデルおよび前記第2の推論モデルを用いて行われる解析による解析結果は、前記画像データに含まれるオブジェクトの属性情報を含み、
    前記第2の解析結果に含まれる属性情報の粒度は、前記第1の解析結果に含まれる属性情報の粒度より粗いことを特徴とする請求項1又は2に記載の情報処理装置。
  4. 前記第1の解析結果または前記第2の解析結果を表示するよう制御を行う表示制御手段、をさらに備えることを特徴とする請求項1乃至のうち何れか1項に記載の情報処理装置。
  5. 前記第2の推論モデルの学習量は、前記第1の推論モデルの学習量より少ないことを特徴とする請求項1乃至のうち何れか1項に記載の情報処理装置。
  6. 前記情報処理装置は前記第2の推論モデルを構築する機能を有しておらず、前記外部装置は前記第1の推論モデルを構築する機能を有していることを特徴とする請求項1乃至のうち何れか1項に記載の情報処理装置。
  7. 前記第2の推論モデルを記憶する記憶手段をさらに備え、
    前記記憶手段は、前記外部装置から最新の第2の推論モデルを受信した場合、前記記憶手段に記憶していた前記第2の推論モデルを、受信した前記最新の第2の推論モデルに更新することを特徴とする請求項1乃至のうち何れか1項に記載の情報処理装置。
  8. レンズ、前記レンズを介して取得された光学像を電気信号に変換する撮像部、前記電気信号をデジタル信号に変換する変換器およびデジタル信号に対して画像処理を施して前記画像データを出力する画像処理部、をさらに備えることを特徴とする請求項1乃至のうち何れか1項に記載の情報処理装置。
  9. 外部装置と通信可能な情報処理装置が実行する情報処理装置の制御方法であって、
    前記外部装置との通信ができない場合、前記外部装置の第1の推論モデルより精度が低い第2の推論モデルを用いて、画像データを解析して第2の解析結果を取得する解析工程と、
    前記外部装置との通信ができる場合、前記画像データを前記外部装置に送信する送信工程と、
    前記外部装置へ送信された画像データが前記第1の推論モデルを用いて解析された第1の解析結果を前記外部装置から取得する取得工程
    前記画像データを前記第1の解析結果および前記第2の解析結果のうち少なくとも一方と関連付けて記録する記録工程と、
    前記外部装置との通信状態を検出する検出工程と、を備え
    前記送信工程は、前記外部装置との通信ができない状態から前記外部装置との通信ができる状態へ変化した場合、前記記録工程に記録された複数の画像データのうち、前記第1の解析結果が記録されていない画像データを前記外部装置へ送信することを特徴とする情報処理装置の制御方法。
  10. コンピュータを請求項1乃至のうち何れか1項に記載の情報処理装置の各手段として機能させるプログラム。
JP2019019862A 2019-02-06 2019-02-06 情報処理装置、情報処理装置の制御方法およびプログラム Active JP7286333B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2019019862A JP7286333B2 (ja) 2019-02-06 2019-02-06 情報処理装置、情報処理装置の制御方法およびプログラム
US16/782,152 US11403841B2 (en) 2019-02-06 2020-02-05 Information processing apparatus for analyzing image data, control method for the same, and storage medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2019019862A JP7286333B2 (ja) 2019-02-06 2019-02-06 情報処理装置、情報処理装置の制御方法およびプログラム

Publications (2)

Publication Number Publication Date
JP2020126535A JP2020126535A (ja) 2020-08-20
JP7286333B2 true JP7286333B2 (ja) 2023-06-05

Family

ID=71837522

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019019862A Active JP7286333B2 (ja) 2019-02-06 2019-02-06 情報処理装置、情報処理装置の制御方法およびプログラム

Country Status (2)

Country Link
US (1) US11403841B2 (ja)
JP (1) JP7286333B2 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11321618B2 (en) * 2018-04-25 2022-05-03 Om Digital Solutions Corporation Learning device, image pickup apparatus, image processing device, learning method, non-transient computer-readable recording medium for recording learning program, display control method and inference model manufacturing method
JP7308902B2 (ja) * 2021-10-29 2023-07-14 日機装株式会社 気流シミュレーション端末装置、及び気流シミュレーション方法
WO2023149174A1 (ja) * 2022-02-02 2023-08-10 ソニーグループ株式会社 情報処理装置、情報処理方法及びプログラム

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016174289A (ja) 2015-03-17 2016-09-29 大日本印刷株式会社 サーバ装置、動画データ再生方法、及びプログラム
JP2017084320A (ja) 2015-03-06 2017-05-18 パナソニックIpマネジメント株式会社 学習方法およびプログラム
JP2018125777A (ja) 2017-02-02 2018-08-09 パナソニックIpマネジメント株式会社 撮像装置、学習サーバ、撮像システム

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9740951B2 (en) 2015-09-11 2017-08-22 Intel Corporation Technologies for object recognition for internet-of-things edge devices
US20200242154A1 (en) * 2019-01-24 2020-07-30 Olympus Corporation Image file generating device and image file generating method
JP2021009439A (ja) * 2019-06-28 2021-01-28 キヤノン株式会社 画像処理システム及びプログラム。

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017084320A (ja) 2015-03-06 2017-05-18 パナソニックIpマネジメント株式会社 学習方法およびプログラム
JP2016174289A (ja) 2015-03-17 2016-09-29 大日本印刷株式会社 サーバ装置、動画データ再生方法、及びプログラム
JP2018125777A (ja) 2017-02-02 2018-08-09 パナソニックIpマネジメント株式会社 撮像装置、学習サーバ、撮像システム

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Teddy Mantoro, et al.,Optical Character Recognition (OCR) Performance in Server-Based Mobile Environment,2013 International Conference on Advanced Computer Science Applications and Technologies,2013年,https://ieeexplore.ieee.org/document/6836618

Also Published As

Publication number Publication date
US11403841B2 (en) 2022-08-02
US20200250451A1 (en) 2020-08-06
JP2020126535A (ja) 2020-08-20

Similar Documents

Publication Publication Date Title
JP7286333B2 (ja) 情報処理装置、情報処理装置の制御方法およびプログラム
US20200311474A1 (en) Image file generating device and image file generating method
US10588008B2 (en) Control apparatus, control system, and method for controlling control apparatus
CN102891958A (zh) 一种具有姿势指导功能的数码相机
EP3873086A2 (en) Image capturing apparatus, device, control method, and program
US11696020B2 (en) Electronic apparatus, image capture apparatus, method for controlling the same, and storage medium
US11170520B2 (en) Image processing apparatus for analyzing an image to detect an object within the image
JP2015002543A (ja) 機器管理装置および通信機器およびそれらの制御方法およびプログラム
US9774554B2 (en) Device management system, device management apparatus, communication device, and control methods therefor, and storage medium
JP2018007082A (ja) 画像再生装置およびその制御方法およびプログラム
US11775579B2 (en) Server apparatus, information processing apparatus, and communication method
US20220027607A1 (en) Electronic device improved in object detection performance, image capturing apparatus, method of controlling electronic device, and storage medium
JP2019046145A (ja) システム、撮像装置、情報処理装置、制御方法、及び、プログラム
JP7166951B2 (ja) 学習依頼装置、学習装置、推論モデル利用装置、推論モデル利用方法、推論モデル利用プログラム及び撮像装置
JP6355520B2 (ja) サーバ装置及びその制御方法、システム、プログラム、並びに記憶媒体
JP2019101783A (ja) 情報処理装置及び方法
US9247419B2 (en) Communication apparatus, information processing apparatus, control methods therefor, and system
JP6537406B2 (ja) 画像処理システム
US20230196708A1 (en) Image processing apparatus and method for controlling the same, and non-transitory computer-readable storage medium
WO2024014293A1 (ja) 送信装置、受信装置、情報処理方法
US20230260299A1 (en) Image processing apparatus, image processing method, image capturing apparatus, and storage medium
US20220277537A1 (en) Apparatus, image apparatus, method for apparatus, and storage medium
JP7400248B2 (ja) 移動体
JP5921830B2 (ja) 情報提供システム、情報提供システムにおける情報提供方法および情報提供プログラム
US20230360368A1 (en) Image processing apparatus and method, and image capturing apparatus

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20220203

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20230209

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20230221

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230307

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230425

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230524

R151 Written notification of patent or utility model registration

Ref document number: 7286333

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151