JP2021119446A - 情報処理装置、情報処理方法及びプログラム - Google Patents
情報処理装置、情報処理方法及びプログラム Download PDFInfo
- Publication number
- JP2021119446A JP2021119446A JP2020013359A JP2020013359A JP2021119446A JP 2021119446 A JP2021119446 A JP 2021119446A JP 2020013359 A JP2020013359 A JP 2020013359A JP 2020013359 A JP2020013359 A JP 2020013359A JP 2021119446 A JP2021119446 A JP 2021119446A
- Authority
- JP
- Japan
- Prior art keywords
- image data
- file
- image
- association information
- association
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Processing Or Creating Images (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
【課題】関連付けのある複数の画像データを対応付けて管理する。【解決手段】情報処理装置は、複数の画像データ間の関連付けの有無を判定する判定手段と、前記判定手段の判定結果に基づいて複数の画像データ間の関連付け情報を作成する作成手段と、前記判定手段の判定結果に応じて前記関連付け情報が作成された前記複数のデータに対応付ける画像ファイルを選択する選択手段と、を備える。【選択図】 図1
Description
本発明は、情報処理装置、情報処理方法及びプログラムに関する。
従来、主にH.265で符号化した静止画像を格納するHEIF(High Efficiency Image File Format)と呼ばれる、ISO/IEC23008−12で国際標準化されているファイルフォーマットが存在する。HEIFでは、単一の静止画像のみならず、複数の静止画像又は画像シーケンス(バースト撮影された連続撮影画像、等)を1つのファイルに格納することが可能である。また、HEIFでは、メタデータを含む規範的な構造を定めており、メタデータと画像を関連付けする方法、特定の形式のメタデータの構成について定めている。これにより、派生画像(derived image)と呼ばれるような、複数の静止画像で構成される1つのイメージ表現を、メタデータに記述することも可能になっている。特許文献1には、HEIFにおいて動的に派生イメージを格納、生成する技術が記載されている。
また、従来、デジタルカメラやスマートフォン等の撮影機能を持つ機器において、バースト撮影、ブラケット撮影、ライブフォト撮影(静止画+動画)等の1回の撮影操作により生成される複数の撮影画像データを、1つのファイルに保存することが可能であった。この際のファイル形式として、HEIF等が用いられている。そして、複数の撮影画像ファイルに対して、撮影日や位置情報等の所定の条件でフィルタリングして抽出した画像だけを閲覧することや、まとめて処理することが可能であった。また、フォトストレージサービス等において、アップロードされた多数のファイルの画像を自動的に解析して、何らかの相関がある画像を含むファイル同士をグループ化して提示することも行われている。
しかしながら、特許文献1に開示された技術では、撮影画像データを扱う情報処理装置において、複数の撮影画像データの中で、機器を所有するユーザにとって有意な関連付けがある画像データを1つの画像ファイルに保存することが出来なかった。
本発明は上述の課題に鑑みて成されたものであり、関連付けのある複数の画像データを対応付けて管理することを目的とする。
上記の課題を解決するため、本発明に係る情報処理装置のある態様によれば、複数の画像データ間の関連付けの有無を判定する判定手段と、前記判定手段の判定結果に基づいて複数の画像データ間の関連付け情報を作成する作成手段と、前記判定手段の判定結果に基づいて前記関連付け情報が作成された前記複数の画像データに対応付ける画像ファイルを選択する選択手段と、を備える情報処理装置が提供される。
本発明によれば、関連付けのある複数の画像データを対応付けて管理することができる。
以下、添付図面を参照して、本発明を実施するための実施形態について詳細に説明する。なお、以下に説明する各実施形態は、本発明の実現手段としての一例であり、本発明が適用される装置の構成や各種条件によって適宜修正または変更されるべきものであり、本発明は、以下の各実施形態に必ずしも限定されるものではない。また、各実施形態で説明されている特徴の組み合わせの全てが本発明の解決手段に必須のものとは限らない。
(実施形態1)
以下、本発明の実施形態として、複数の画像データを関連付けて画像ファイルとして格納する画像ファイル作成装置を例として説明する。なお、この画像ファイル作成装置は、画像ファイルの作成及び編集を行うことができるようになっている。
以下、本発明の実施形態として、複数の画像データを関連付けて画像ファイルとして格納する画像ファイル作成装置を例として説明する。なお、この画像ファイル作成装置は、画像ファイルの作成及び編集を行うことができるようになっている。
図1は、実施形態1の画像ファイル作成装置1の構成例を示すブロック図である。画像ファイル作成装置1は、撮像装置の一例であり、例えば、カメラ、スマートフォン、タブレット端末などである。
この画像ファイル作成装置1は、システムバス11に接続されたCPU12、システムプログラム実行時の一時記憶装置であるRAM13、システムプログラムが格納される不揮発性記憶装置であるROM14を備えている。なお、CPUは、Central Processing Unitの略であり、RAMは、Random Access Memoryの略であり、ROMは、Read Only Memoryの略である。システムプログラムやアプリケーションプログラムは、ROM14からRAM13に読み込まれ、CPU12によって実行される。また、この画像ファイル作成装置1は、符号化処理部15、撮像処理部16、表示部17、位置測定部18、通信制御部19、画像解析処理部10を備えている。システムバス11は、図1の各ブロック間でデータを伝達する。CPU12は、例えばROM14に格納されているプログラムを実行することにより、画像ファイル作成装置1全体の動作を制御する。また、RAM13は、撮影画像データの出力バッファ、画像ファイルの作成処理の入出力データバッファとしても使用される。ROM14は、画像ファイル作成装置1のユーザ設定データ、画像ファイル等の保存にも使用される。符号化処理部15は、H.265(HEVC)、H.264(AVC)、JPEG等の動画や静止画のビデオコーデックである。符号化処理部15は、画像ファイル作成装置1が扱う静止画や動画のデータの符号化および復号化の処理を実行する。
この画像ファイル作成装置1は、システムバス11に接続されたCPU12、システムプログラム実行時の一時記憶装置であるRAM13、システムプログラムが格納される不揮発性記憶装置であるROM14を備えている。なお、CPUは、Central Processing Unitの略であり、RAMは、Random Access Memoryの略であり、ROMは、Read Only Memoryの略である。システムプログラムやアプリケーションプログラムは、ROM14からRAM13に読み込まれ、CPU12によって実行される。また、この画像ファイル作成装置1は、符号化処理部15、撮像処理部16、表示部17、位置測定部18、通信制御部19、画像解析処理部10を備えている。システムバス11は、図1の各ブロック間でデータを伝達する。CPU12は、例えばROM14に格納されているプログラムを実行することにより、画像ファイル作成装置1全体の動作を制御する。また、RAM13は、撮影画像データの出力バッファ、画像ファイルの作成処理の入出力データバッファとしても使用される。ROM14は、画像ファイル作成装置1のユーザ設定データ、画像ファイル等の保存にも使用される。符号化処理部15は、H.265(HEVC)、H.264(AVC)、JPEG等の動画や静止画のビデオコーデックである。符号化処理部15は、画像ファイル作成装置1が扱う静止画や動画のデータの符号化および復号化の処理を実行する。
撮像処理部16は、レンズ群16a、CCD制御部16b、画像処理部16cを備えている。レンズ群16aは、例えば被写体像を光学的にCCD(光電変換素子)等の撮像素子に結像させるための複数枚のレンズで構成されている。CCD制御部16bは、CCDに転送クロック信号やシャッター信号を供給するためのタイミングジェネレータ、CCDの出力信号のノイズ除去やゲイン処理を行うための回路、さらに、アナログ信号をデジタル信号に変換するためのA/D変換回路等を備えている。また、画像処理部16cは、CCD制御部16bより出力されたデジタル信号に、ガンマ変換、色空間変換、また、ホワイトバランス、露出補正等の画像処理を行い、符号化処理部15による符号化が可能なデジタル画像信号データとしてRAM13へ出力する。
表示部17は、画像ファイル作成装置1のアプリケーションの画面等を表示するものであり、例えば液晶ディスプレイ装置である。また、表示部17が画面タッチセンサを備え、ユーザがGUIによるアプリケーションの操作を行うことが可能な構成としてもよい。また、表示部17は、画像ファイル作成装置1を操作するためのボタンやスイッチ等の物理的なインタフェースを備えていてもよい。位置測定部18は、画像ファイル作成装置1の地理的な位置情報を生成する処理を実行する。この位置測定部18は、少なくとも測位衛星の送信信号を受信して地球上の位置を計測するGPS(Global Positioning System)の機能を備えており、地球上の緯度・経度の情報を得ることが可能である。通信制御部19は、ネットワークに接続して伝送フレームの送受信を行うネットワークインタフェースである。通信制御部19には、例えば、有線LAN(Local Area Network)の物理インタフェース(PHY)および伝送メディア制御処理(MAC)部等が含まれる。あるいは、画像ファイル作成装置1が無線LANに接続可能な場合、通信制御部19には、IEEE802.11a/b/g/n/ac等の無線LAN制御を実行するコントローラ、RF(Radio Frequency)回路、アンテナ等が含まれる。
画像解析処理部10は、撮像処理部16が出力する撮影画像データや、符号化処理部15が画像ファイルに含まれる符号化データを復号して生成される画像データ等を解析する。画像解析処理部10は、画像フレーム内に写っている人物や物体を検出する。人物を検出した場合はその人物を特定する人物識別情報を生成する。物体の場合はその物体の種類を示す物体識別情報を生成する。画像データの解析により生成された人物識別情報や物体認識情報は、画像データと一緒にCPU12で実行するアプリケーションが利用可能である。
本実施形態の画像ファイル作成装置1は、撮像処理部16と符号化処理部15から出力される撮影画像の符号化データ(画像データ)のファイル(画像ファイル)を作成する。具体的には、例えば複数の画像データ間の関連付けの有無を判定し、判定結果に基づいて複数の画像データ間の関連付け情報を作成し、判定結果に基づいて関連付け情報が作成された複数の画像データに対応付ける画像ファイルを選択する。
以下、本実施形態の説明のために、画像ファイルの例として複数の撮影画像データを含むHEIFファイルを作成する例について説明する。
図2は、従来のスマートフォン等の写真撮影において、H.265で符号化された画像データを格納するHEIF形式の画像ファイルを生成する処理の例を示している。
図2では、撮影操作の時刻t1、t2、t3、t4、t5において、それぞれHEIFファイル21、22、23、24、25を作成することを示している。つまり、t5の撮影までで合計5個のHEIFファイルが作られる。各HEIFファイルは、複数の画像を含んでもよく、例えば図2のHEIFファイル23は、P3からP5の3個の撮影画像データを含んでいる。また、HEIFファイル25は、P7とP8の2個の撮影画像データを含んでいる。これらのHEIFファイル23、25は、例えばバースト撮影を行った場合等、1回の撮影操作において複数の撮影画像データを含むHEIFファイルを作成する場合を示している。
以下、本実施形態の説明のために、画像ファイルの例として複数の撮影画像データを含むHEIFファイルを作成する例について説明する。
図2は、従来のスマートフォン等の写真撮影において、H.265で符号化された画像データを格納するHEIF形式の画像ファイルを生成する処理の例を示している。
図2では、撮影操作の時刻t1、t2、t3、t4、t5において、それぞれHEIFファイル21、22、23、24、25を作成することを示している。つまり、t5の撮影までで合計5個のHEIFファイルが作られる。各HEIFファイルは、複数の画像を含んでもよく、例えば図2のHEIFファイル23は、P3からP5の3個の撮影画像データを含んでいる。また、HEIFファイル25は、P7とP8の2個の撮影画像データを含んでいる。これらのHEIFファイル23、25は、例えばバースト撮影を行った場合等、1回の撮影操作において複数の撮影画像データを含むHEIFファイルを作成する場合を示している。
図3は、本実施形態の画像ファイル作成装置1における画像ファイルを作成する処理の例を示している。
本実施形態では、図2のt1からt5と同様の撮影操作を実行すると、1つの画像ファイルだけが作成され得ることを示している。最初のt1の撮影では1個の撮影画像データP1を含むHEIFファイル31が新規に作成される。次のt2では、HEIFファイル31は、HEIFファイル31にP2の撮影画像データを追加したHEIFファイル32に更新される。次のt3では、HEIFファイル32は、HEIFファイル32にP3からP5の撮影画像データを追加したHEIFファイル33に更新される。t4とt5における撮影でも同様であり、t4ではHEIFファイル34に更新され、t5ではHEIFファイル35に更新される。つまり、この例では、t1からt5の撮影操作の度に、1つのHEIFファイルに撮影画像データを追加している。
本実施形態では、図2のt1からt5と同様の撮影操作を実行すると、1つの画像ファイルだけが作成され得ることを示している。最初のt1の撮影では1個の撮影画像データP1を含むHEIFファイル31が新規に作成される。次のt2では、HEIFファイル31は、HEIFファイル31にP2の撮影画像データを追加したHEIFファイル32に更新される。次のt3では、HEIFファイル32は、HEIFファイル32にP3からP5の撮影画像データを追加したHEIFファイル33に更新される。t4とt5における撮影でも同様であり、t4ではHEIFファイル34に更新され、t5ではHEIFファイル35に更新される。つまり、この例では、t1からt5の撮影操作の度に、1つのHEIFファイルに撮影画像データを追加している。
本実施形態では、図3のt1からt5の撮影操作により、各回の撮影画像データが最終的に1つのHEIFファイルに含まれる結果となり得ることは、撮影画像間に関連付けがあったことに起因する。本実施形態では、撮影画像データ間に関連付けがあることが判定される。図3は、1個の撮影画像データが他の1個以上の画像データに関連付けがあり、直接あるいは間接的に他の全ての撮影画像データと関連付けが生じる結果となったため、1つのHEIFファイルに格納される結果となったことを示している。本実施形態における関連付けの判定とは、各撮影画像の解析結果や撮影条件等を関連付け情報として導出して且つ識別可能に管理しておくことにより、画像間で同じ関連付け情報を持つかどうかを調べる(判定する)ことである。
以下、図3におけるP1からP8までの撮影画像データの関連付け情報について図4を用いて説明する。
図4は、P1からP8までの撮影画像データ(41)と、各撮影データから導出される関連付け情報について表形式で表した関連付け情報40の例を示している。
この関連付け情報40は、日付(42)、場所(43)、撮影シーン(44)、人物認識(45)、物体認識(46)の関連付け情報のタイプ(項目)を含んでいる。ここで、日付(42)は撮影時刻を「新規の画像ファイルを作成」示し、場所(43)は撮影を行った場所を示している。シーン(44)は、撮影時に設定した撮影シーンの情報であってもよいし、画像解析処理部10が画像を解析した撮影シーンを検出した結果であってもよい。人物認識(45)は、画像解析処理部10による撮影画像の解析結果であり、画像内に写っている人物(個人)が誰であるか示す識別情報を含んでいる。また、人物認識(45)は、画像内で複数の人物を検出して識別された場合には、各人に対応した関連付け情報を含んでいる。物体認識(46)は、画像解析処理部10による撮影画像の解析結果であり、画像内に写っているオブジェクトの種類が何であるかを示す関連付け情報を含んでいる。また、物体認識(46)は、画像内から複数の物体が認識された場合、それぞれの物体に対応する関連付け情報を含んでいる。
図4は、P1からP8までの撮影画像データ(41)と、各撮影データから導出される関連付け情報について表形式で表した関連付け情報40の例を示している。
この関連付け情報40は、日付(42)、場所(43)、撮影シーン(44)、人物認識(45)、物体認識(46)の関連付け情報のタイプ(項目)を含んでいる。ここで、日付(42)は撮影時刻を「新規の画像ファイルを作成」示し、場所(43)は撮影を行った場所を示している。シーン(44)は、撮影時に設定した撮影シーンの情報であってもよいし、画像解析処理部10が画像を解析した撮影シーンを検出した結果であってもよい。人物認識(45)は、画像解析処理部10による撮影画像の解析結果であり、画像内に写っている人物(個人)が誰であるか示す識別情報を含んでいる。また、人物認識(45)は、画像内で複数の人物を検出して識別された場合には、各人に対応した関連付け情報を含んでいる。物体認識(46)は、画像解析処理部10による撮影画像の解析結果であり、画像内に写っているオブジェクトの種類が何であるかを示す関連付け情報を含んでいる。また、物体認識(46)は、画像内から複数の物体が認識された場合、それぞれの物体に対応する関連付け情報を含んでいる。
この関連付け情報40では、例えば、P1の撮影画像データは、日付タイプのt1、場所タイプの東京、シーンタイプの風景、物体認識タイプの電車の4つの関連付け情報を持つことを示している。また、P6の撮影画像データは、日付タイプのt4、場所タイプの北海道、人物認識タイプのC、物体認識タイプの牛、物体認識タイプの馬、物体認識タイプの風車の6個の関連付け情報を持つことを示している。
なお、画像データが持つ関連付け情報のタイプは、図4で示すタイプに限定されない。また、画像データが物体識別情報として持つオブジェクトの種類や詳細レベルは、図4の例に限定されない。また、1つのオブジェクトから抽出する関連付け情報の種類の数についても、図4の例に限定されない。例えば1つのオブジェクトが同時に複数の物体として認識されてもよい。また、1つの画像データから検出して識別する人物や物体の数も特に限定されない。
なお、画像データが持つ関連付け情報のタイプは、図4で示すタイプに限定されない。また、画像データが物体識別情報として持つオブジェクトの種類や詳細レベルは、図4の例に限定されない。また、1つのオブジェクトから抽出する関連付け情報の種類の数についても、図4の例に限定されない。例えば1つのオブジェクトが同時に複数の物体として認識されてもよい。また、1つの画像データから検出して識別する人物や物体の数も特に限定されない。
図2のt1からt5の撮影操作で撮影されたP1からP8の撮影画像データは、図4の関連付け情報の例に基づき、図3のように1つのHEIFファイル35に纏められて保存される。例えばt2の撮影画像データのP2は、P1と同じ物体識別情報である“電車”を持つため、P1が格納されたHEIFファイル31に格納されてHEIFファイル32となる。t3の撮影画像データであるP3、P4、P5は、P2と同じ人物識別情報である“B”を持つ。このためP3、P4、P5は、P2が含まれるHEIFファイル32に格納されてHEIFファイル33となる。この結果、P1からP5は同じHEIFファイル33に格納される。また、t4の撮影画像P6は、P3、P4、P5と同じ人物識別情報である“C”を持つため、同じHEIFファイル33に格納されてHEIFファイル34となる。最後のt5の撮影画像P7、P8はP6と同じ場所である関連付け情報”北海道”を持つため、同じHEIFファイル34に格納されてHEIFファイル35となる。このように、本実施形態では、関連付け情報のいずれかのタイプで同じ情報を持つ画像データを同じファイルに格納される。
以上、本実施形態における複数の撮影画像データを含むHEIFファイル(画像ファイル)を作成する処理の例を説明した。
以上、本実施形態における複数の撮影画像データを含むHEIFファイル(画像ファイル)を作成する処理の例を説明した。
図5は、本実施形態における撮影画像データと既存画像ファイルとの関連付けの有無を判定する処理の例を示している。図5の判定処理は、主にCPU12と画像解析処理部10が実行する。なお、画像ファイルはHEIFファイルを例にして説明する。
画像ファイル作成装置1の撮影操作により、撮像処理部16がデジタル画像信号の撮影画像データを出力すると、CPU12は、判定処理を開始する(S1)。
CPU12は、まず、S2において、撮影画像データを解析して関連付け情報を導出する。S2では、CPU12は、撮影時刻、撮影時のシーン設定、および位置測定部18で計測された測位情報から、撮影時の日付、場所、撮影シーンの関連付け情報を生成する。さらに、画像解析処理部10が撮影画像データを解析して、人物や物体を検出して人物認識情報や物体認識情報を生成する。これにより、図4のP2を撮影画像データの例にすると、日付、場所、人物認識、物体認識の関連付け情報が導出され、シーンの関連付け情報が導出されなかったことになる。なお、S2において導出する関連付け情報のタイプを予め選択可能にしておいてもよい。
画像ファイル作成装置1の撮影操作により、撮像処理部16がデジタル画像信号の撮影画像データを出力すると、CPU12は、判定処理を開始する(S1)。
CPU12は、まず、S2において、撮影画像データを解析して関連付け情報を導出する。S2では、CPU12は、撮影時刻、撮影時のシーン設定、および位置測定部18で計測された測位情報から、撮影時の日付、場所、撮影シーンの関連付け情報を生成する。さらに、画像解析処理部10が撮影画像データを解析して、人物や物体を検出して人物認識情報や物体認識情報を生成する。これにより、図4のP2を撮影画像データの例にすると、日付、場所、人物認識、物体認識の関連付け情報が導出され、シーンの関連付け情報が導出されなかったことになる。なお、S2において導出する関連付け情報のタイプを予め選択可能にしておいてもよい。
続くS3では、CPU12は、S2において1つ以上の関連付け情報を導出できたかどうかを判定する。もし関連付け情報が少なくとも1つ導出できたならばS4に進み、そうでなければS6に進む。
次のS4では、画像ファイル作成装置1で既に保存しているHEIFファイルの中に、S2で導出した関連付け情報と同じ関連付け情報を持つファイルがあるかどうかを検索(判定)する。HEIFファイルが同じ関連付け情報を持つという意味は、HEIFファイルに同じタイプと同じ識別情報を含む関連付け情報が格納されているということである。図4のP2の撮影画像データを例にすると、S2の処理で日付、場所、人物認識、物体認識の関連付け情報が導出される。さらに、S4の処理で、同じ日付や同じ場所の関連付け情報として持つ画像ファイルや、人物識別情報に“B”を含む画像ファイルや、物体識別情報に“電車”が含まれる画像ファイルが検索される。なお、この検索の結果として、複数のHEIFファイルが検索されてもよい。S4の検索の結果、同じ関連付け情報を持つ既存画像ファイルが検索された場合はS5に進み、そうでなければS6に進む。
次のS4では、画像ファイル作成装置1で既に保存しているHEIFファイルの中に、S2で導出した関連付け情報と同じ関連付け情報を持つファイルがあるかどうかを検索(判定)する。HEIFファイルが同じ関連付け情報を持つという意味は、HEIFファイルに同じタイプと同じ識別情報を含む関連付け情報が格納されているということである。図4のP2の撮影画像データを例にすると、S2の処理で日付、場所、人物認識、物体認識の関連付け情報が導出される。さらに、S4の処理で、同じ日付や同じ場所の関連付け情報として持つ画像ファイルや、人物識別情報に“B”を含む画像ファイルや、物体識別情報に“電車”が含まれる画像ファイルが検索される。なお、この検索の結果として、複数のHEIFファイルが検索されてもよい。S4の検索の結果、同じ関連付け情報を持つ既存画像ファイルが検索された場合はS5に進み、そうでなければS6に進む。
S5では、CPU12は、判定結果を撮影画像データが既存の画像ファイルとの関連付けがあるとし、S7に進んで処理を終了する。一方、S6では、CPU12は、判定結果を撮影画像データが既存の画像ファイルとの関連付けが無いとし、S7に進んで処理を終了する。なお、画像ファイル作成装置1内に既存の画像ファイルが無かった場合は、CPU12は、S4からS6に進み、既存画像ファイルの画像との関連付けなしという判定結果とする。
以上の処理により、本実施形態では、有意な関連付けがある画像データを1つの画像ファイルに対応付けて管理することができる。
以上の処理により、本実施形態では、有意な関連付けがある画像データを1つの画像ファイルに対応付けて管理することができる。
図6は、本実施形態における撮影画像データを格納する画像ファイルを作成する処理の例を示している。図5の判定処理は、主にCPU12が実行する。なお、画像ファイルはHEIFファイルを例にして説明する。
撮像処理部16が新たな撮影画像データを生成すると、CPU12は、処理を開始する(S11)。
CPU12は、まず、S12において、撮影画像データと既存の画像ファイル(既存画像ファイル)との関連付けの有無を判定する処理を実行する。S12の処理は図5を用いて説明した上述の判定処理である。S12の判定処理の後、CPU12は、S13において、既存の画像ファイルとの関連付けの有無を判定する。CPU12は、既存の画像ファイルとの関連付けがあると判定した場合はS14に進み、そうでなければS19に進む。
撮像処理部16が新たな撮影画像データを生成すると、CPU12は、処理を開始する(S11)。
CPU12は、まず、S12において、撮影画像データと既存の画像ファイル(既存画像ファイル)との関連付けの有無を判定する処理を実行する。S12の処理は図5を用いて説明した上述の判定処理である。S12の判定処理の後、CPU12は、S13において、既存の画像ファイルとの関連付けの有無を判定する。CPU12は、既存の画像ファイルとの関連付けがあると判定した場合はS14に進み、そうでなければS19に進む。
S14からS18までの処理は、同じ関連付け情報があったすべての既存ファイルを対象として実行するループ処理である。CPU12は、まず、S14において、撮影画像データを同じ関係付け情報がある既存の画像ファイルに追加して格納する。なお、このとき、撮影画像データを符号化処理部15で符号化してから符号化データを画像ファイルに格納する。
次のS15で、CPU12は、この画像ファイルが持つ同じ関連付け情報のグループに、格納した撮影画像データを登録する。この関連付け情報のグループについては後述する。続くS16で、CPU12は、撮影画像データから導出した関連付け情報の中で、この画像ファイルには含まれていない他の関連付け情報があるかを判定する。他の関連付け情報があれば、CPU12は、S17に進み、なければS18に進む。S17では、CPU12は、S16で確認した他の関連付け情報をこの画像ファイルに追加して格納する。そして、CPU12は、追加格納した関連付け情報のグループに現在の撮影画像データを登録し、S18へ進む。S18では、CPU12は、現在の撮影画像データから導出された同じ関連付け情報を持つ他の画像ファイルがあるかを調べる(判定する)。他の画像ファイルにも同じ関連付け情報があるときは、CPU12は、S14に戻り、S14からS17の処理を他の画像ファイルに対しても実行する。S18において、同じ関連付け情報を持つ他の画像ファイルがなければ、CPU12は、S22に進んで処理を終了する。
次のS15で、CPU12は、この画像ファイルが持つ同じ関連付け情報のグループに、格納した撮影画像データを登録する。この関連付け情報のグループについては後述する。続くS16で、CPU12は、撮影画像データから導出した関連付け情報の中で、この画像ファイルには含まれていない他の関連付け情報があるかを判定する。他の関連付け情報があれば、CPU12は、S17に進み、なければS18に進む。S17では、CPU12は、S16で確認した他の関連付け情報をこの画像ファイルに追加して格納する。そして、CPU12は、追加格納した関連付け情報のグループに現在の撮影画像データを登録し、S18へ進む。S18では、CPU12は、現在の撮影画像データから導出された同じ関連付け情報を持つ他の画像ファイルがあるかを調べる(判定する)。他の画像ファイルにも同じ関連付け情報があるときは、CPU12は、S14に戻り、S14からS17の処理を他の画像ファイルに対しても実行する。S18において、同じ関連付け情報を持つ他の画像ファイルがなければ、CPU12は、S22に進んで処理を終了する。
上述のS13の分岐処理においてS19に進んだ場合には、撮影画像データと同じ関連付け情報を持つ画像ファイルがなかったことになる。このため、CPU12は、S19において、新規の画像ファイルを作成し、現在の撮影画像データを符号化したデータを格納する。続くS20において、CPU12は、現在の撮影画像データからS12の判定処理で1以上の関連付け情報が導出されたかどうかを判定し、導出していた場合にはS21に進む。導出されていなければ、CPU12は、S22に進んで処理を終了する。S21では、CPU12は、現在の撮影画像データから導出したすべての関連付け情報を新規画像ファイルに格納し、そのグループに撮影画像データを登録する。この後、CPU12は、S22に進んで処理を終了する。
以上の処理により、本実施形態では、有意な関連付けがある画像データを1つの画像ファイルとして管理することができる。これにより、複数の撮影画像データの中から互いに関連付けされる画像を1つの画像ファイルとして保存することができるようになる。例えば撮影時に、自動的に、撮影した画像を、関連付けがある他の画像と同じ画像ファイルに保存することで、撮影画像ファイルの整理や、所望の条件の画像を検索して表示する等の操作や処理を効率化することができる。
以上の処理により、本実施形態では、有意な関連付けがある画像データを1つの画像ファイルとして管理することができる。これにより、複数の撮影画像データの中から互いに関連付けされる画像を1つの画像ファイルとして保存することができるようになる。例えば撮影時に、自動的に、撮影した画像を、関連付けがある他の画像と同じ画像ファイルに保存することで、撮影画像ファイルの整理や、所望の条件の画像を検索して表示する等の操作や処理を効率化することができる。
なお、画像ファイル作成装置1のユーザが、撮影操作の事前に、S17でファイルに追加格納する他の関連付け情報やS21で新規作成した画像ファイルに格納する関連付け情報を個別に指定可能にしたり、格納する条件を設定可能にしてもよい。例えば、格納する関連付け情報のタイプを選択可能にしたり、格納する人物認識の関連付け情報を指定したりすることが考えられる。これにより、例えば日付タイプの関連付け情報を格納するように設定すれば、同じ日付の撮影画像を必ず1つのHEFIファイルにすることが可能になる。また、ある人物を識別する関連付け情報のみ指定することにより、同じ人物が写っている撮影画像データを1つのHEIFファイルに格納することが可能になる。
以下、撮影画像データの符号化データを格納する画像ファイルのファイル形式について、図7から図10を参照して説明する。
まず、図9を参照する。図9は、本実施形態のHEIFファイルの内部構造の例を示す図である。
HEIFでは、ファイルに格納する画像を画像アイテム(image item)として区別する。画像アイテムにはファイル内で重複しないIDを付与し、IDで識別や参照が可能になっている。
まず、図9を参照する。図9は、本実施形態のHEIFファイルの内部構造の例を示す図である。
HEIFでは、ファイルに格納する画像を画像アイテム(image item)として区別する。画像アイテムにはファイル内で重複しないIDを付与し、IDで識別や参照が可能になっている。
このHEIFファイル70は、FileTypeBox(ftyp)71、格納された画像アイテムおよびその符号化データに関するメタデータの格納領域に相当するMetaDataBox(meta)72を含んでいる。また、このHEIFファイル70は、符号化データを格納領域に相当するMediaDataBox(mdat)80を含んでいる。
meta72には、メタデータを解釈するためのハンドラを指定するHandlerBox(hdlr)73と、HEIFファイルが格納する画像アイテムの中から代表画像のアイテムIDを指定するPrimaryItemBox(pitm)74が含まれる。また、meta72には、格納された画像アイテムの符号化データのファイル内の格納位置を指定するItemLocationBox(iloc)75が含まれる。また、meta72には、格納する画像およびその符号化データをファイル内で識別するためのアイテムID及びHEVC符号化画像であることを示すアイテムタイプの情報を格納するItemInformationBox(iinf)76が含まれる。また、meta72には、格納する画像の属性情報を格納するItemProperteisBox(iprp)77が含まれる。このiprp77には、HEVC符号化データの復号化に必要なパラメータセットのエントリや、画像の幅や高さを示すエントリが含まれており、さらにファイルに格納された各画像アイテムがどのエントリを参照するか指定する情報も含まれる。
meta72には、メタデータを解釈するためのハンドラを指定するHandlerBox(hdlr)73と、HEIFファイルが格納する画像アイテムの中から代表画像のアイテムIDを指定するPrimaryItemBox(pitm)74が含まれる。また、meta72には、格納された画像アイテムの符号化データのファイル内の格納位置を指定するItemLocationBox(iloc)75が含まれる。また、meta72には、格納する画像およびその符号化データをファイル内で識別するためのアイテムID及びHEVC符号化画像であることを示すアイテムタイプの情報を格納するItemInformationBox(iinf)76が含まれる。また、meta72には、格納する画像の属性情報を格納するItemProperteisBox(iprp)77が含まれる。このiprp77には、HEVC符号化データの復号化に必要なパラメータセットのエントリや、画像の幅や高さを示すエントリが含まれており、さらにファイルに格納された各画像アイテムがどのエントリを参照するか指定する情報も含まれる。
また、mdat80には、各画像のHEVC符号化データ81、82、83が格納されるが、各画像アイテムがどの符号化データに対応するのかをiloc75で参照することが可能である。これらのBox71、72、80は、HEIF標準仕様、およびISOベースメディアファイルフォーマット(ISOBMFF:ISO Base Media File Format)標準仕様のISO/IEC14496−12に準拠している。本実施形態では、さらにHEIFファイルに画像データの関連付け情報を格納するために、meta72に、CorrelateEntityToGroupBox(cegr)78を含んでいる。
図7は、本実施形態におけるHEIFファイル内のcegrのデータフォーマットの例を示す図である。
本実施形態のcegr51は、HEIFで定義されるEntityToGroupBox55を拡張した形式である。
cegr51のデータフォーマットにおいて、correlate_group_typeフィールド52は、関連付け情報のタイプを示す32ビットのコード値である。また、correlate_group_idフィールド53は、関連付け情報のタイプにおいて重複しない32ビットの識別子である。図8は、correlate_group_typeフィールド52に設定するコード値の一例61を示している。例えば、コード値3はPlace(場所)、コード値5はPerson Recognition(人物認識)の関連付け情報であることを示している。なお、関連付け情報のタイプ毎に必ず異なるコード値が定義されるようにする。
本実施形態のcegr51は、HEIFで定義されるEntityToGroupBox55を拡張した形式である。
cegr51のデータフォーマットにおいて、correlate_group_typeフィールド52は、関連付け情報のタイプを示す32ビットのコード値である。また、correlate_group_idフィールド53は、関連付け情報のタイプにおいて重複しない32ビットの識別子である。図8は、correlate_group_typeフィールド52に設定するコード値の一例61を示している。例えば、コード値3はPlace(場所)、コード値5はPerson Recognition(人物認識)の関連付け情報であることを示している。なお、関連付け情報のタイプ毎に必ず異なるコード値が定義されるようにする。
また、cegr51は、UTF−8でエンコードされた可読文字列で関連付け情報の名前および説明を付与するcorrelate_group_nameフィールド54aとcorrelate_group_descriptionのフィールド54bを含む。ただし、この2つのフィールド54a、54bの使用は任意とし、各々付与しない場合には空文字列になるように1バイトのNULL(0x00)をセットする。また、上述したように、cegr51は、EntityToGroupBox55の形式を拡張したものである。このため、cegr51は、図7のEntityToGroupBox55の各フィールド56、57、58も含むものである。EntityToGroupBox55は、HEIFファイル内の各アイテムおよびアイテムグループ等を一意に識別するためのIDである32ビットのgroup_idフィールド56を含んでいる。また、EntityToGroupBox55は、当該グループに含まれるアイテムの数を示すnum_entities_in_groupフィールド57を含んでいる。また、EntityToGroupBox55は、当該グループに含まれるアイテムのID(32ビット値)が列挙されるentity_idリスト58を含んでいる。
図10は、cegrの具体例を示す図である。
cegr91は、図4の物体認識(46)タイプの“電車”の関連付け情報を記述した例である。このcegr91では、関連付け情報のタイプを図8のコード値61に従い、correlate_group_typeが6となっている。図4では“電車”を関連付け情報として持つ撮影画像データがP1、P2であるのでnum_entities_in_groupが2、entity_idリストにP1、P2を示すアイテムIDが記述される。また、cegr92は、図4の人物認識(45)タイプの“A”の関連付け情報をcegrに記述した例である。cegr92のcorrelate_group_typeは、図8のコード値61に従って5である。図4では“A”を関連付け情報として持つ撮影画像データがP3、P4、P5であるのでnum_entities_in_groupが3、entity_idリストにP3、P4、P5を示すアイテムIDが記述される。同様に、cegr93は、図4の人物認識(45)タイプの“C”の関連付け情報をcegrに記述した例である。cegr93のcorrelate_group_typeは5である。図4では“C”を関連付け情報として持つ撮影画像データがP3、P4、P5、P6であるのでnum_entities_in_groupは4、entity_idリストにP3、P4、P5、P6を示すアイテムIDが記述される。
cegr91は、図4の物体認識(46)タイプの“電車”の関連付け情報を記述した例である。このcegr91では、関連付け情報のタイプを図8のコード値61に従い、correlate_group_typeが6となっている。図4では“電車”を関連付け情報として持つ撮影画像データがP1、P2であるのでnum_entities_in_groupが2、entity_idリストにP1、P2を示すアイテムIDが記述される。また、cegr92は、図4の人物認識(45)タイプの“A”の関連付け情報をcegrに記述した例である。cegr92のcorrelate_group_typeは、図8のコード値61に従って5である。図4では“A”を関連付け情報として持つ撮影画像データがP3、P4、P5であるのでnum_entities_in_groupが3、entity_idリストにP3、P4、P5を示すアイテムIDが記述される。同様に、cegr93は、図4の人物認識(45)タイプの“C”の関連付け情報をcegrに記述した例である。cegr93のcorrelate_group_typeは5である。図4では“C”を関連付け情報として持つ撮影画像データがP3、P4、P5、P6であるのでnum_entities_in_groupは4、entity_idリストにP3、P4、P5、P6を示すアイテムIDが記述される。
以上、撮影画像の符号化データを格納する画像ファイルのファイル形式について説明した。前述した図6のS17やS21の撮影画像データから導出した関連付け情報に画像ファイルに格納する処理は、HEIFファイルに関連付け情報をcegrの形式でデータを格納する。また、S15、S17、S21において関連付け情報のグループに撮影画像データを登録する処理は、entity_id58に画像アイテムIDを追加することである。図3や図4のP1からP8の撮影画像データは、その符号化データをHEIFファイルに格納するときに、ファイル内で重複しない32ビットの画像アイテムIDを割り当てることになる。
また、図5のS4の処理について説明したように、同じ関連付け情報を持つ既存の画像ファイルの検索は、撮影画像データから導出した関連付け情報と同じタイプの関連付け情報があり、その関連付け情報に同じ識別情報が含まれるファイルを検索することであった。これは、撮影画像データからcorrelate_group_typeとcorrelate_group_idのフィールドの組を導出し、一致するフィールド値の組を持つcegrが含まれる既存のHEIFファイルを検索することである。
(変形例)
以上、本発明の好ましい実施形態について説明したが、本発明はこれらの実施形態に限定されず、その要旨の範囲内で種々の変形及び変更が可能である。また、本発明は、例えば、システム、装置、方法、プログラム若しくは記録媒体(記憶媒体)等としての実施態様をとることが可能である。具体的には、複数の機器(例えば、ホストコンピュータ、インタフェース機器、撮像装置、webアプリケーション等)から構成されるシステムに適用してもよいし、また、一つの機器からなる装置に適用してもよい。例えば図1では、画像ファイル生成装置1に撮像処理部16が含まれる構成としているが、撮像処理部16を別の装置(撮像部)として構成してもよい。この場合、撮像部が撮像した画像データを、例えばパーソナルコンピュータ等で構成される画像ファイル生成装置1に送信(提供)し、画像ファイル生成装置1が画像データを処理する情報処理装置として機能する。
以上、本発明の好ましい実施形態について説明したが、本発明はこれらの実施形態に限定されず、その要旨の範囲内で種々の変形及び変更が可能である。また、本発明は、例えば、システム、装置、方法、プログラム若しくは記録媒体(記憶媒体)等としての実施態様をとることが可能である。具体的には、複数の機器(例えば、ホストコンピュータ、インタフェース機器、撮像装置、webアプリケーション等)から構成されるシステムに適用してもよいし、また、一つの機器からなる装置に適用してもよい。例えば図1では、画像ファイル生成装置1に撮像処理部16が含まれる構成としているが、撮像処理部16を別の装置(撮像部)として構成してもよい。この場合、撮像部が撮像した画像データを、例えばパーソナルコンピュータ等で構成される画像ファイル生成装置1に送信(提供)し、画像ファイル生成装置1が画像データを処理する情報処理装置として機能する。
上述の実施形態では、画像ファイル作成装置1が、撮影画像データから関連付け情報を導出し、同じ関連付け情報を含む画像ファイルに、撮影画像の符号化データを格納するという画像ファイル作成方法について説明した。当然であるが、図2のように従来通りの画像ファイル作成装置撮影操作毎に画像ファイルを作成する処理と同時に実行することも可能である。また、HEIFファイル(画像ファイル)に関連付け情報と画像データのファイル名等の参照情報(図9のftyp71、meta72に相当)を格納しておき、画像データ自体(図9のmdat80に相当)は別のファイルとしてもよい。この場合でも、有意な関連付けがある画像データを1つの画像ファイル(管理情報)に対応付けて管理することができる。
本発明は、上述の実施形態の1以上の機能を実現するプログラムを、ネットワーク又は記憶媒体を介してシステム又は装置に供給し、そのシステム又は装置のコンピュータにおける1つ以上のプロセッサがプログラムを読出し実行する処理でも実現可能である。また、1以上の機能を実現する回路(例えば、ASIC)によっても実現可能である。ASICはApplication Specific Integrated Circuitの略である。
1…画像ファイル作成装置、10…画像解析処理部、11…システムバス、12…CPU、13…RAM、14…ROM、15…符号化処理部、16…撮像処理部、17…表示部、18…位置測定処理部、19…通信制御部
Claims (12)
- 複数の画像データ間の関連付けの有無を判定する判定手段と、
前記判定手段の判定結果に基づいて複数の画像データ間の関連付け情報を作成する作成手段と、
前記判定手段の判定結果に基づいて前記関連付け情報が作成された前記複数の画像データに対応付ける画像ファイルを選択する選択手段と、
を備えることを特徴とする情報処理装置。 - 前記作成手段は、前記複数の画像データから1以上の関連付け情報を作成する、
ことを特徴とする請求項1記載の情報処理装置。 - 前記選択手段により選択された画像ファイルに、前記関連付け情報が作成された前記複数の画像データを格納する格納手段を、さらに備えることを特徴とする請求項1または請求項2に記載の情報処理装置。
- 新たな画像データを取得する取得手段を、さらに備え、
前記判定手段は、前記取得手段が取得した新たな画像データと前記複数の画像データとの関連付けの有無を判定する、
ことを特徴とする請求項1から請求項3のいずれか1項に記載の情報処理装置。 - 前記作成手段は、
前記取得手段が新たに取得した画像データについて1以上の関連付け情報を作成し、
前記判定手段は、
前記作成手段が、前記新たに取得した画像データについて作成した前記1以上の関連付け情報の少なくとも1つが、既存の前記画像ファイルに含まれる関連付け情報と一致するか否かに基づいて前記複数の画像データ間の関連付けの有無を判定する、
ことを特徴とする請求項1から請求項4のいずれか1項に記載の情報処理装置。 - 前記選択手段は、
前記作成手段が、前記新たに取得した画像データについて作成した関連付け情報のうち、前記選択した前記画像ファイルに含まれていない関連付け情報を、当該画像ファイルに対応付ける、
ことを特徴とする請求項5に記載の情報処理装置。 - 前記選択手段は、
前記作成手段が、前記新たに取得した画像データについて作成した関連付け情報と一致する関連付け情報が、前記既存の画像ファイルに無かった場合、前記新たに取得した画像データに新たな画像ファイルを対応付ける、
ことを特徴とする請求項5または請求項6に記載の情報処理装置。 - 前記関連付け情報に、関連付けの種類および識別子の情報を含む、ことを特徴とする請求項1から請求項7のいずれか1項に記載の情報処理装置。
- 前記画像ファイルの作成および編集を行う作成手段を、さらに備えることを特徴とする請求項1から請求項8のいずれか1項に記載の情報処理装置。
- 被写体を撮像して前記画像データを出力する撮像手段をさらに備えることを特徴とする請求項1から請求項9のいずれか1項に記載の情報処理装置。
- 複数の画像データ間の関連付けの有無を判定するステップと、
前記判定結果に基づいて複数の画像データ間の関連付け情報を作成するステップと、
前記判定結果に基づいて前記関連付け情報が作成された前記複数の画像データに対応付ける画像ファイルを選択するステップと、
を有することを特徴とする情報処理方法。 - コンピュータを、請求項1から請求項9のいずれか1項に記載の情報処理装置の各手段として機能させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020013359A JP2021119446A (ja) | 2020-01-30 | 2020-01-30 | 情報処理装置、情報処理方法及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020013359A JP2021119446A (ja) | 2020-01-30 | 2020-01-30 | 情報処理装置、情報処理方法及びプログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2021119446A true JP2021119446A (ja) | 2021-08-12 |
Family
ID=77195465
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020013359A Pending JP2021119446A (ja) | 2020-01-30 | 2020-01-30 | 情報処理装置、情報処理方法及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2021119446A (ja) |
-
2020
- 2020-01-30 JP JP2020013359A patent/JP2021119446A/ja active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101508372B1 (ko) | 콘텐츠 관리 장치, 콘텐츠 관리 방법, 네트워크 시스템 및 프로그램이 기록된 컴퓨터 판독가능 기록 매체 | |
JP5438376B2 (ja) | 撮像装置及びその制御方法 | |
JP7307840B2 (ja) | 1以上の画像をカプセル化したファイルを生成するための方法及び装置 | |
JP2006344215A (ja) | デジタル画像のコレクションの組み立て方法 | |
US11523062B2 (en) | Image capture apparatus and method for controlling the same | |
JP2008165700A (ja) | 画像処理装置、電子機器、画像処理システム、画像処理方法、および、プログラム | |
US20120050561A1 (en) | Image processing apparatus, control method thereof, and program | |
KR101503409B1 (ko) | 파일 처리 장치, 파일 처리 방법, 및 기억 매체 | |
WO2020260014A1 (en) | Method and apparatus for encapsulating panorama images in a file | |
JP2014082705A (ja) | 撮影機器 | |
JP2009021992A (ja) | 撮像装置及び画像検索方法 | |
CN105721810B (zh) | 一种图像压缩存储方法及装置 | |
JP2011211625A (ja) | 送信装置及び方法、並びにプログラム | |
US11157546B2 (en) | Information processing apparatus, control method, and storage medium | |
JP2021119446A (ja) | 情報処理装置、情報処理方法及びプログラム | |
JP2005295030A (ja) | 地図情報表示システム | |
JP2006101156A (ja) | 情報処理装置及び情報処理プログラム | |
WO2020066607A1 (ja) | 画像データ格納装置、画像データ格納方法、及び、プログラム | |
JP2003110844A (ja) | 画像処理装置及びその制御方法並びにコンピュータプログラム及び記録媒体 | |
US9710927B2 (en) | Method and apparatus for determining data enabling generation of a user profile | |
JP2022063739A (ja) | 画像処理装置、画像処理方法 | |
JP2007288409A (ja) | 画像データ分類機能を備えた撮像装置およびプログラム | |
JP2022109138A (ja) | 情報処理装置、情報処理方法、及びプログラム | |
JP4947046B2 (ja) | コンテンツ管理装置、コンテンツ管理方法、および、当該方法をコンピュータに実行させるためのプログラム、並びに、ネットワークシステム | |
KR101623494B1 (ko) | 사진 파일 관리 장치 및 방법 |