JP2022109138A - 情報処理装置、情報処理方法、及びプログラム - Google Patents
情報処理装置、情報処理方法、及びプログラム Download PDFInfo
- Publication number
- JP2022109138A JP2022109138A JP2021004498A JP2021004498A JP2022109138A JP 2022109138 A JP2022109138 A JP 2022109138A JP 2021004498 A JP2021004498 A JP 2021004498A JP 2021004498 A JP2021004498 A JP 2021004498A JP 2022109138 A JP2022109138 A JP 2022109138A
- Authority
- JP
- Japan
- Prior art keywords
- images
- image
- information
- image data
- file
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Television Signal Processing For Recording (AREA)
- Studio Devices (AREA)
Abstract
【課題】時間連続的に表示する画像データの表示順と表示時間とを効率的な方法で記述するHEIF方式のファイルを作成する。【解決手段】ISO/IEC23008Part12で定義されるHEIFフォーマットに従った、複数の画像を含む画像ファイルを作成する。複数の画像の表示順、及び、複数の画像それぞれの表示される時間の長さを設定する。設定に従い、複数の画像の表示順を示す情報、複数の画像それぞれの表示される時間の長さの情報、及び、複数の画像から、HEIFフォーマットに従った画像ファイルを作成する。備えることを特徴とする【選択図】図3
Description
本発明は、情報処理装置、情報処理方法、及びプログラムに関する。
近年、カメラやスマートフォンなどの画像生成装置は様々な機能を有しており、撮像画像に関する多くの情報を生成可能になっている。HEIF(High Efficiency Image File Format)のファイルは、撮像時の被写体やシーンを識別する情報又は撮像設定情報などの、各種の画像データに関する情報をメタデータとして、画像データと一緒にファイルに格納することができる。特許文献1には、HEIFに準拠した画像ファイルに派生画像を格納することが記載されている。
一方で、複数の画像を順番に切り替えながら表示するスライドショー機能を有するアプリケーションにおいて、HEIF方式のファイルでは、ファイル内に格納される複数の静止画それぞれについて表示順及び表示時間を適切に記述することが困難であった。
本発明は、時間連続的に表示する画像データの表示順と表示時間とを効率的な方法で記述するHEIF方式のファイルを作成することを目的とする。
本発明の目的を達成するために、例えば、一実施形態に係る情報処理装置は以下の構成を備える。すなわち、ISO/IEC23008Part12で定義されるHEIFフォーマットに従った、複数の画像を含む画像ファイルを作成する情報処理装置であって、前記複数の画像の表示順、及び、前記複数の画像それぞれの表示される時間の長さを設定する設定手段と、前記設定手段による設定に従い、前記複数の画像の表示順を示す情報、前記複数の画像それぞれの表示される時間の長さの情報、及び、前記複数の画像から、前記HEIFフォーマットに従った画像ファイルを作成する作成手段と、備えることを特徴とする。
時間連続的に表示する画像データの表示順と表示時間とを効率的な方法で記述するHEIF方式のファイルを作成する。
以下、添付図面を参照して実施形態を詳しく説明する。なお、以下の実施形態は特許請求の範囲に係る発明を限定するものではない。実施形態には複数の特徴が記載されているが、これらの複数の特徴の全てが発明に必須のものとは限らず、また、複数の特徴は任意に組み合わせられてもよい。さらに、添付図面においては、同一若しくは同様の構成に同一の参照番号を付し、重複した説明は省略する。
[実施形態1]
MPEG(Moving Pictures Experts Group)では、単一の静止画像、複数の静止画像、又は画像シーケンス(静止画像のバースト等)を1つのファイルに格納することのできる規格を開発している。以下、本実施形態において処理が行われる静止画像及びその符号化されたデータを「画像データ」と表現する。そのような規格であるHEIFは、画像と画像シーケンスとの交換、編集、及び表示を可能とする。HEIFフォーマットは、ISOベースメディアファイルフォーマット(ISOBMFF:ISO Base Media File Format)で定められるツールを元に拡張された格納フォーマットである。また、HEIFは、ISO/IEC23008Part12において「Image File Format」という名称で標準化が進行している。HEIFはメタデータを含む規範的な構造を定めており、メタデータと画像データとを関連付ける方法や、特定の形式のメタデータの構成について定めることができる。また、本実施形態においては画像データがHEVC(High Efficiency Video Codec)で符号化され、後述する図5におけるmdat511に格納され、meta502に格納された各メタデータと関連付けられる。なお、本実施形態に係るHEIFファイルに格納される画像データはHEVCで符号化されているものとして説明を行う。以下、「画像ファイル」との記載はHEIFファイルを指すものとする。HEIFファイルの拡張子は、例えばheif、heic、又はavciである。
MPEG(Moving Pictures Experts Group)では、単一の静止画像、複数の静止画像、又は画像シーケンス(静止画像のバースト等)を1つのファイルに格納することのできる規格を開発している。以下、本実施形態において処理が行われる静止画像及びその符号化されたデータを「画像データ」と表現する。そのような規格であるHEIFは、画像と画像シーケンスとの交換、編集、及び表示を可能とする。HEIFフォーマットは、ISOベースメディアファイルフォーマット(ISOBMFF:ISO Base Media File Format)で定められるツールを元に拡張された格納フォーマットである。また、HEIFは、ISO/IEC23008Part12において「Image File Format」という名称で標準化が進行している。HEIFはメタデータを含む規範的な構造を定めており、メタデータと画像データとを関連付ける方法や、特定の形式のメタデータの構成について定めることができる。また、本実施形態においては画像データがHEVC(High Efficiency Video Codec)で符号化され、後述する図5におけるmdat511に格納され、meta502に格納された各メタデータと関連付けられる。なお、本実施形態に係るHEIFファイルに格納される画像データはHEVCで符号化されているものとして説明を行う。以下、「画像ファイル」との記載はHEIFファイルを指すものとする。HEIFファイルの拡張子は、例えばheif、heic、又はavciである。
[ハードウェア構成]
図1は、本実施形態に係る情報処理装置のハードウェア構成の一例を示すブロック図である。情報処理装置100は、システムバス101、CPU102、RAM103、ROM104、処理部105、処理部106、処理部107、表示部108、ユーザインタフェース(UI)部109、及び通信制御部110を備える。システムバス101はこれらの各機能部を接続し、データの伝達を行う。ROM104はシステムプログラムとアプリケーションプログラムとを格納し、それらはRAM103によって読み出され、CPU102によって実行される。また、RAM103は、後述する処理における画像ファイルの作成処理のデータバッファ、又は画像ファイルに格納するうデータの出力先としても機能する。
図1は、本実施形態に係る情報処理装置のハードウェア構成の一例を示すブロック図である。情報処理装置100は、システムバス101、CPU102、RAM103、ROM104、処理部105、処理部106、処理部107、表示部108、ユーザインタフェース(UI)部109、及び通信制御部110を備える。システムバス101はこれらの各機能部を接続し、データの伝達を行う。ROM104はシステムプログラムとアプリケーションプログラムとを格納し、それらはRAM103によって読み出され、CPU102によって実行される。また、RAM103は、後述する処理における画像ファイルの作成処理のデータバッファ、又は画像ファイルに格納するうデータの出力先としても機能する。
CPU102は情報処理装置100の制御部であり、ROM104に格納されるプログラムを実行する。CPU102は、OS(オペレーティングシステム)、ドライバ、又はアプリケーションなどを実行することができる。CPU102は、例えばUI部109を介したユーザ入力に応じて、処理部105~107における処理を実行してもよく、表示部108への表示制御を行ってもよく、通信制御部110への通信指示を行ってもよい。
処理部105は、画像データの符号化処理及び復号処理を行う。処理部105は例えば、H.265(HEVC)、H.264(AVC)、若しくはJPEGなどの画像データの符号化及び復号処理を行うビデオコーデックである。本実施形態において処理対象となる画像データは予め格納されているものとして説明を行うが、情報処理装置100が撮像部(不図示)を備えて画像データを取得してもよく、外部の装置から画像データを取得してもよい。また、外部の装置から符号化済みの画像データを取得し、処理部105による符号化処理が省略されてもよい。画像データの符号化処理及び復号処理はどのように行われてもよいが、本実施形態においては公知の処理が用いられるため詳細な説明は省略する。本実施形態において処理部105が行う処理については図2及び図3を参照して後述する。
処理部106は画像データに格納されるメタデータの解析処理を行う。また、処理部106は、画像データに関する情報を生成してメタデータとして画像ファイル内に格納し、所定のファイルフォーマット(本実施形態においてはHEIF)に準拠した、複数の画像データを含む画像ファイルを作成する。本実施形態においては、処理部106は、処理部105から符号化データに関するパラメータ情報の取得を行い、4文字の識別コードを付したメタデータとして画像ファイル内に格納する処理を実行する。処理部106が行う処理については図5を参照して後述する。
情報処理装置100が作成する画像ファイルは、複数の画像データを格納し、スライドショーの機能を有するアプリケーションにおいて参照された場合に、格納する画像データを順番に表示する。そのために、本実施形態に係る処理部106は、複数の画像データと、その画像データそれぞれに対する表示順及び表示時間を示す情報とを画像ファイル内に格納する。そのために、画像ファイル内のオブジェクト構成は図5に示されるように作成される。なお、スライドショーとは、複数の画像を時間連続的に表示していく機能のことを指すものとする。
処理部107は、処理部105及び106による処理の対象となる画像データを選択する。処理部107は、例えば複数の画像データ群の内から、後述する図2に示される処理の対象となる画像データを選択してもよい。また例えば処理部107は、図2に示される処理の対象として選択された画像データの内から、図3に示される処理の対象となる画像データをさらに選択してもよい。本実施形態においては、処理部107は、RAM103及びROM104に格納された画像データの内から図2に示される処理の対象となる画像データを選択するものとする。
表示部108は、例えば液晶ディスプレイなどの、情報処理装置100のアプリケーションを表示する画面である。表示部108は、例えば画面タッチセンサを備え、GUIを介したユーザによるアプリケーション操作を可能にしてもよい。UI部109は、例えばボタン又はスイッチなどの物理的な操作用インタフェースであり、ユーザ操作を取得して情報処理装置100を動作させる。
通信制御部110は、ネットワークに接続して伝送フレームの送受信を行うネットワークインタフェースである。通信制御部110は、例えば有線LANのイーサネット(登録商標)のPHY及びMAC(伝送メディア制御処理を行うデバイス)であってもよい。また、情報処理装置100が無線LANに接続可能である場合に通信制御部110は、IEEE802、若しくは11a/b/g/n/acなどの無線LAN制御を実行するコントローラ、RF回路、又はアンテナを含むことができる。
以下、本実施形態に係る情報処理装置100が作成する画像ファイルと、処理部105及び106が行う処理とについて、図5を参照して説明を行う。図5は、本実施形態に係る画像ファイル作成処理によって作成されるHEIF形式の画像ファイル内部のオブジェクト構造を示している。図5に示される画像ファイルは、ユーザ操作に応じて情報処理装置100の各処理部が動作することによって作成される。HEIFファイル500(以下、単にファイル500と記載する)は識別子によって識別される複数のボックスによって構成されており、ボックスとしてftyp501、meta502、mdat511を含んでいる。以下、画像ファイルに含まれる各ボックスは、そのボックスの識別子となる4文字によって(上述のftyp501のように)表されるものとする。また、例えば画像データを識別するためのアイテムIDなどの同一のメタデータが複数のボックス内に含まれていてもよい。
ftyp(FileTypeBox)501はファイル500の種類を識別するための、brandと呼ばれる4文字の識別子を有する。ftyp501は、ファイル500を表すための識別子として、例えばmif1、msf1、heic、heix、hevc、又はhevxなどのbrandを有していてもよい。
meta(MetaDataBox)502はメタデータを格納するボックスであり、メディアデータの符号化に関する情報と、その画像ファイルへの格納方法に関する情報と、などの情報を格納する。meta502は、内部にhdlr503、pitm504、iloc505、iinf506、iref507、及びiprp508の各ボックスを含んでいる。処理部106は、これらのボックスいずれかに格納されるメタデータを設定し、対応するボックス内に格納する。
hdlr(HandlerReferenceBox)503は、meta502内に含まれるコンテンツの構造及びフォーマットを識別するためのハンドラタイプの情報を格納する。本実施形態においては、hdlr503のハンドラタイプとして‘pict’という4文字の識別コードが指定される。
pitm(PrimaryItemBox)504は主要画像アイテム情報のメタデータを格納する。主要画像アイテム情報とは、ファイル500に含まれる画像データのうちの代表となる画像データに関する情報であり、例えばその代表となる画像データを指定するアイテムID(識別情報)である。ここで代表となる画像データは、表示部108上でファイル500のサムネイル画像として表示されるなど、所望の表現のために使用することができる。
iloc(ItemLocationBox)505は、ファイル500内の画像及びその符号化データなどの各アイテムのID(すなわち、各画像の識別情報)及び格納場所(ロケーション)を示す情報を格納する。情報処理装置100が行う各処理においては、ファイル500内で定義されたアイテムのデータがどこに存在するかを示す情報は、iloc505を参照することにより取得することができる。iinf(ItemInformationBox)506はファイル500内の画像データの画像アイテム情報を格納する。画像アイテム情報とは、ファイル500内の各アイテムのIDと、そのアイテムの種別(ここでは、HEVCで符号化された画像であること)を示すアイテムタイプと、アイテムの名称と、を示す情報である。
iref(ItemReferenceBox)507は、ファイル500内の画像データの画像参照情報を格納する。画像参照情報とは、ファイル500内の参照関係にあるアイテムの、どのような参照が行われるのかなどアイテム間の関連付けに関する情報である。本実施形態においては、画像参照情報は、スライドショーで表示する画像データを指定するための情報である。本実施形態においては、iref507は、画像参照情報として、派生画像(Derived Image)として格納されるスライドショーのアイテムIDから参照される画像データのアイテムIDをリスト形式で格納する。ここで格納されるアイテムIDのリストは、後述するステップS302で決定する表示順に応じたリスト形式でユーザに記載される。また、処理部106は、例えば画像ファイル内に格納している画像データの内に、撮像画像とそのサムネイル画像のような関連性を有する画像データが含まれている場合に、それらの関連付けを示す情報をiref507に格納してもよい。処理部106は、例えば後述するステップS212においてスライドショーの設定が格納されないと判定された場合に、そのような関連性を有する画像の関連付けを示す情報をiref507に格納することができる。iref507では、画像参照情報に、そのデータが派生画像であることを示す‘dimg’の識別コードが付与される。図12には、本実施形態に係る情報処理装置100が作成する画像ファイル内部の記述の一例が示されている。図12の1201には、スライドショーにおいて表示される画像を表示される順序で羅列するリストを備えた‘dimg’がiref507に格納されている。
一般にHEIF方式のファイルにおける派生画像とは、回転、グリッド、又はオーバーレイの情報に基づいて、編集の度に作成されファイル内に格納される編集履歴のデータである。一方で本実施形態においては、スライドショーにおいて表示される画像データが格納されるデータ(スライドショー)が、派生画像として画像ファイル内に格納される。以下、派生画像とはそのようなスライドショーを指すものとして説明を行う。
iprp(ItemPropertyBox)508は、ファイル500内の画像データの画像属性情報を格納する。そのために、iprp508は、ipco509、ipma510、及びidat516の各ボックスを含んでいる。画像属性情報とは、画像の幅及び高さ、並びに色コンポーネントの個数及びビット長など、画像データの表示に関する情報である。ipco(ImagePropertyContainerBox)509は、HEVCのパラメータのセットを示す情報と、画像データの幅及び高さを示す情報と、を格納する。ipma(ItemPropertyAssociationBox)510は、ipco509に格納されている情報とアイテムIDとの関連付けを示す情報を格納する。図12においては、ipco509で画像データの幅及び高さを示す‘hvcC’と‘ispe’とが定義され、ipma510内にそれらのパラメータと画像データとの関連付けを示す情報が格納されている(1202)。idat(ItemDataBox)511はスライドショーの派生画像記述情報を格納するが、idatに格納される情報については図3及び図4を参照して後述する。
mdat(MediaDataBox)511は符号化した画像データを格納する。本実施形態においては、処理部105が、処理対象となる画像データをHEVCで符号化し、mdat511へと格納する。ここで処理対象となる画像データは、RAM103及びROM104に格納されたデータのうちからのユーザの選択を取得部107が取得することによって決定される(後述するステップS202)。
[画像ファイル作成処理]
本実施形態に係る情報処理装置が行う画像ファイル作成処理の流れについて、図2~図5を参照して説明を行う。
本実施形態に係る情報処理装置が行う画像ファイル作成処理の流れについて、図2~図5を参照して説明を行う。
図2は、本実施形態に係る情報処理装置が行う画像ファイル作成処理の一例を示すフローチャートである。本実施形態においては、HEIFファイルフォーマットに従って、1つ以上の静止画像を格納する画像ファイルが作成される。図2に示される処理は、画像ファイルを作成するためのユーザ操作に応じて開始される。また、図2に示される各処理は、処理部105、処理部106、及び処理部107によって実行されるものとして説明を行うが、各処理がCPU102によって行われる形式であってもよい。本実施形態においては、ユーザがUI部109を介して表示部108上に表示されている画像データに関する操作を行うことにより、以下に説明する各処理が進行するものとして説明を行う。
ステップS201で処理が開始される。ステップS202で処理部107は、RAM103又はROM104に格納されている画像データの中から、画像ファイルに格納する画像データを選択する。本実施形態においては、ここで選択される画像データは、静止画像が1つ格納されたHEIFファイルであってもよく、静止画像のファイル(JPEGなど)であってもよい。また、画像データとして選択されるこのデータは静止画像であればよく、例えばファイルとしては格納されていないデータであってもよい。本実施形態においては、画像データの一覧の中から、画像ファイルに格納する画像をユーザが選択する。
ステップS203で処理部107は、ステップS202で選択した画像データがHEIFファイルであるか否かを判定する。HEIFファイルであれば処理はステップS207へと進み、そうでなければ処理はステップS204へと進む。以下、ステップS202で選択した画像データを単に「選択した画像データ」と呼ぶ。
ステップS204で処理部105は、選択した画像データが符号化されている場合には、その画像データを復号する。選択した画像データが静止画像のファイルである場合には、処理部105はそのファイル内の画像の符号化データを復号する。ステップS205で処理部105は、復号した画像データを解析してその画像データの属性情報を取得する。本実施形態においては、属性情報は、画像の幅及び高さ、並びに色コンポーネントの個数及びビット長など、画像の構造に関する情報であり特にこれらに限定はされない。ステップS206で処理部105は、ステップS204で復号した画像データをHEVCで符号化し、処理をステップS207へと進める。
ステップS207で処理部106は、ステップS202で選択した画像データのパラメータのセットを取得する。処理部106は、選択した画像データがHEIFファイルでなかった場合には、ステップS206で符号化したHEVCファイルの復号処理に必要なパラメータを取得する。ここで取得されるパラメータは、例えばビデオパラメータセット(VPS)、シーケンスパラメータセット(SPS)、ピクチャパラメータセット(PPS)である。また処理部106は、選択した画像データがHEIFファイルであった場合には、HEIFファイル内の画像データから同様にパラメータを取得する。
ステップS208で処理部105は、HEVCの符号化データを、後述する図5のMediaDataBox(mdat)511に格納する符号化データの1つとしてRAM103上の出力バッファに格納する。ステップS203において、ステップS202で選択した画像データがHEIFファイルであると判定された場合には、処理部105は選択したHEIFファイル内のHEVC符号化データを同様に格納する。
ステップS209で処理部106は、ステップS202で選択した画像データに関するメタデータを作成しバッファに格納する。ステップS209では、処理部106が作成するメタデータは、画像データの画像アイテム情報及び画像属性情報であり、それぞれiinf506及びiprp508(ipco509及びipma510)にステップS214で格納される。本実施形態では、ipco509は、ステップS207で取得したHEVCのパラメータのセットを示す情報と、選択した画像の幅及び高さを示す情報とを格納する。また本実施形態では、ipma510は、上述のようにipco509に格納されている情報とアイテムIDとの関連付けを示す情報を格納する。この時点では、これらの画像属性情報のデータは、meta502に格納されるメタデータの一部として、RAM103上の出力バッファに格納しておく。
ステップS210でCPU102は、ステップS202で選択した画像データの他に格納する画像データがないかを確認する。他に格納する画像データがある場合には処理がステップS202に戻り、そうでない場合には処理はステップS211へと進む。本実施形態においては、処理部106は、ユーザが選択した画像が全て処理されているかどうかを確認する。
ステップS211でCPU102は、選択した画像データを格納する画像ファイルがスライドショーの設定を格納するか否かを判定する。格納する場合には処理がステップS212へと進み、そうでない場合には処理はステップS213へと進む。ステップS212ではスライドショーのメタデータが作成されるが、ここで行われる処理は図3を参照して後述する。ステップS212に次いで処理はステップS213へと進む。本実施形態においては、作成する画像ファイルにスライドショーの設定を格納するか否かのGUI(不図示)が表示部108上に表示され、そのGUI上でのユーザの入力に基づいてステップS211における判定が行われる。
ステップS213で処理部106は、ステップS202で選択した画像の内から、この画像ファイルの代表となる画像を決定し、主要画像アイテム情報のメタデータを作成する。ここで作成されるメタデータは単純に代表とする画像データのアイテムIDを指定するものであり、pitm504に格納される。この時点では、作成したメタデータはRAM103上の出力バッファに格納しておく。本実施形態においては、表示部108上にステップS202で選択した画像の一覧が表示され、ユーザがその内から代表となる画像を選択するが、例えばステップS202における選択の際に代表となる画像も併せて選択されていてもよい。
ステップS214で処理部106は、ftyp501及びhdlr503に格納するメタデータを作成する。本実施形態においては上述のように、hdlr503に指定されるmeta502のハンドラタイプは‘pict’である。次いで処理部106は、ftyp501及びhdlr503に格納するメタデータと、RAM103に格納しておいたメタデータと、mdatに格納しておいた符号化データとを結合し、図5に示すような構造の画像ファイルを生成する。ステップS215で処理が終了する。なお、ステップS214で生成される画像ファイルは、CPU102によってRAM103からROM104に書き込まれて格納される。
なお、ステップS211において画像ファイルがスライドショーの設定を格納しないと判定された場合には、ステップS212(後述するステップ305)におけるiref507に格納されるメタデータの作成処理が行われない。このような場合処理部106は、格納する画像データの中の、例えば撮像画像とそのサムネイル画像とのような関連性のある画像データを関連付ける情報を作成し、iref507に格納することができる。このような処理によれば、スライドショーの設定を作成して画像ファイルに格納しない場合であっても、最終的に作成される画像ファイルのiref507に画像参照情報のメタデータを格納することができる。
[スライドショーのメタデータ作成処理]
ステップS212で行われるスライドショーのメタデータの作成処理について、図3~図5を参照して説明を行う。本実施形態では、複数の画像データを表示するスライドショーが派生画像として画像ファイルに格納される。図3は、本実施形態に係る情報処理装置100が行うスライドショーのメタデータの作成処理の一例を示すフローチャートである。
ステップS212で行われるスライドショーのメタデータの作成処理について、図3~図5を参照して説明を行う。本実施形態では、複数の画像データを表示するスライドショーが派生画像として画像ファイルに格納される。図3は、本実施形態に係る情報処理装置100が行うスライドショーのメタデータの作成処理の一例を示すフローチャートである。
ステップS301で処理が開始される。ステップS302で処理部107は、画像ファイルに格納する画像データの内から、スライドショーで表示する1つ以上の画像データを選択し、それぞれの表示順を決定する。ステップS303で処理部107は、ステップS302で選択した画像データの表示時間を決定する。処理部107は、選択した画像データそれぞれに対して表示時間を決定してもよく、全ての画像データに対して一律に表示時間を決定してもよい。本実施形態においては、画像データの表示順及び表示時間は、表示部108上に表示される画像データの一覧に対してユーザが選択と入力とをすることによって決定される。なお、これらの表示順及び表示時間は、ユーザが情報処理装置100上で動作するアプリケーションを使用して予め設定しておく構成であってもよい。
ステップS304で処理部106は、選択された画像について、派生画像アイテム情報を作成する。派生画像アイテム情報はiinf506に格納される。派生画像アイテム情報とは、スライドショーのアイテムIDとして作成される画像アイテム情報であり、ステップS209の画像アイテム情報と同様に作成される。ステップS304で作成される派生画像アイテム情報が指定するアイテムIDは、ステップS209で作成された画像アイテム情報が指定するアイテムIDとは重複しないように作成される。また、派生画像アイテム情報においては、アイテムタイプとして、スライドショーであることを示す‘slid’が指定される(図12における1203)。ステップS305で処理部106は、上述したような画像参照情報を作成する。画像参照情報はiref507に格納される。
ステップS306で処理部106は、ステップS302及びステップS303で決定した情報に基づいて、選択された画像について派生画像記述情報を設定する。派生画像記述情報はidat516に格納される。派生画像記述情報は、スライドショーにおける画像データの表示順と表示する時間の長さとを設定する情報である。図4は、本実施形態において設定される派生画像記述情報を示すフォーマットの一例である。図4に示されるように、画像データの表示時間は、全画像データにおいて一律に設定されるdurationパラメータ401として記載されてもよく、画像データごとに設定されるdurationパラメータ402として記載されてもよい。表示時間が画像データごとに設定される場合には、durationパラメータのリストに、スライドショーにおいて画像データが表示される順番に時間を指定する。表示時間として設定される時間の単位は時間を指定できるのであれば特に限定されず、例えば秒又はミリ秒であってもよい。
ステップS307で処理部106は、派生画像属性情報を設定する。派生画像属性情報はiprp508に格納される。派生画像属性情報は、スライドショーの表示に関わる情報である。本実施形態においては、派生画像属性情報は、例えばスライドショーを表示するスクリーンの幅及び高さを示す情報であるが特にその内容は限定はされず、また必ずしも設定されなくともよい。派生画像属性情報が設定されない場合には、処理はそのままステップS308へと進んで終了する。派生画像属性情報が設定される場合には、ステップS209における画像属性情報の生成及び格納処理と同様に、派生画像属性情報及びその情報とアイテムIDとの関連付けを示す情報がipco509とipma510とに格納される。次いでステップS308で処理は終了し、ステップS213へと移行する。派生画像属性情報は自動で読み込まれてもよく、ユーザの入力に基づいて取得されてもよい。
なお、ステップS304~ステップS307で作成されたメタデータは、meta502の対応するボックスに格納されるメタデータの一部としてRAM103上の出力バッファに格納され、ステップS214においてmeta502内に格納される。また、ステップS213において代表とする画像データのアイテムIDを指定する際に、処理部106は、ステップS304で作成されたアイテムIDを用いて指定を行ってもよい。
図13は、本実施形態に係る画像ファイルの作成処理において、表示部108上に表示されるGUIの一例である。GUI1301には、ステップS202~S210でメタデータを出力バッファに格納された画像データの一覧が表示され、図3に示される各処理におけるユーザ操作を受け付ける入力フォームが表示されている。図13の例では、画像データの一覧として画像に対応するサムネイル1302~1307が表示されており、これらのうちから画像ファイルに格納される画像データがユーザによって選択され、さらに表示順と表示時間が決定される。図13の例では、各画像の下部に表示される、画像に対応した枠1308などのチェックボックスがチェックされることによって画像ファイルに格納される画像データが選択され、ユーザによって画像1302、1304、及び1305が選択されている。さらにユーザは、選択した画像に対して、各画像の上部に表示される、画像に対応した枠1309及び1310の入力フレームに、画像それぞれの表示順と表示時間とを入力する。図13の例では、枠1309には表示順が、枠1310には表示時間が入力される。すなわち、画像1302、1304、1305の順番に、それぞれ2秒、1秒、2秒間表示するようユーザによって入力がなされている。情報処理装置100は、ステップS302及びS303においてこれらの入力を受け付け、ユーザが決定ボタン1311を操作することに応じて画像データそれぞれの表示順及び表示時間が決定される。次いで処理部106は、ステップS304~S305で選択された画像について設定を行い、ステップS307で枠1309及び枠1310に基づいて派生画像記述情報を設定する。また、ステップS202における画像データの選択処理も同様のGUI上で行われるものとするが、異なるGUIが表示されてユーザの選択を受け付けてもよい。
ユーザ操作を受け付けるGUIは、ユーザが各画像を選択して表示順と表示時間とを決定できるのであれば、特に図13に示されるようには限定はされない。例えば、枠1308ではなく画像のサムネイル自体を選択し、選択した画像の枠を強調表示する形式であってもよい。また例えば、枠1309及び枠1310のような枠は常時表示せず、選択した画像についてのみ表示する、又は選択した画像に関する表示順及び表示時間を入力するための別ウィンドウを表示する形式であってもよい。表示時間が一律に設定される場合には、共通の時間を設定するために別の入力枠が備えられていてもよい。
なお、本実施形態に係るファイル500は、ボックスとしてftyp501、meta502、及びmdat511を含み、静止画像を扱うものとして説明を行った。しかしながら扱う画像データはこれには限定されず、例えばファイル500がmoovボックス(MovieBox)(不図示)を更に含み、mdat511に動画のデータを追加で格納してもよい。moovは動画のデータに関するメタデータを格納するボックスであり、一般的なファイルの作成処理によって作成される。
このような構成によれば、複数の画像データを表示するスライドショーの情報をmetaの中に格納した画像ファイルを作成することができる。したがって、ユーザが任意の複数の画像を選択してそれらの表示順及び表示時間を決定するスライドショーの設定を有するHEIFフォーマットに従った画像ファイルの作成を効率的に行うことができる。
[実施形態2]
実施形態2に係る情報処理装置は、実施形態1と同様にスライドショーを格納する画像ファイルを作成するが、スライドショーにおいて表示される画像データをグループ化する情報を画像ファイル内に格納する。そのために、本実施形態に係る情報処理装置は、図1の情報処理装置100と同様の構成を有し、ステップS212における処理の内容を除いて図2に示されるフローチャートの処理と同様の処理を行うため、重複する説明は省略する。
実施形態2に係る情報処理装置は、実施形態1と同様にスライドショーを格納する画像ファイルを作成するが、スライドショーにおいて表示される画像データをグループ化する情報を画像ファイル内に格納する。そのために、本実施形態に係る情報処理装置は、図1の情報処理装置100と同様の構成を有し、ステップS212における処理の内容を除いて図2に示されるフローチャートの処理と同様の処理を行うため、重複する説明は省略する。
図9は、本実施形態に係る画像ファイル作成処理によって作成されるHEIFフォーマットの画像ファイル内部のオブジェクト構造を示している。図9においては、idat516が含まれず、ボックスとして新たにgrpl(GroupListBox)901を含んでいることを除き図5におけるファイル500と同様の構成を有する。
grpl901はmeta502に含まれるボックスであり、スライドショーで表示する画像データをグループ化する情報902を格納する。情報902は処理部106によって作成され、grpl901に格納されるメタデータである。本実施形態においては、grpl901は、情報902として、図7に示されるフォーマットであるSlideshowGroupBoxの形式のデータを作成及び格納する。SlideshowGroupBoxのグループタイプは‘slid’であり、スライドショーにおいて表示されるアイテムのグループであることを示す。図7において、group_id701はグループを識別するグループIDを示し、num_entries_in_group702はグループに含むアイテムの個数を指定する。また、グループ内の画像データのスライドショーにおける表示時間は一律に設定されてもよく、画像データごとに設定されてもよい。表示時間が画像データごとに設定される場合には、図7の703に示される箇所に、画像データが表示される順番に表示時間が指定される。表示時間が一律に設定される場合には、表示時間が図7のdurationパラメータ704として記載される。
図6は、本実施形態に係るステップS212におけるスライドショーのメタデータの作成処理の一例を示すフローチャートである。ステップS601で処理が開始される。ステップS602及びステップS603においては、処理部107は、実施形態1のステップS302及びステップS303と同様に、スライドショーで表示する画像データを選択し、それぞれの表示順と表示時間とを決定する。
ステップS604で処理部106は、スライドショーで表示する画像データをグループ化する情報を作成し、そのメタデータをRAM103上の出力バッファに格納する。ステップS605で処理部106は、スライドショーで表示する画像データそれぞれの表示時間が一定であるか否かを判定する。一定である場合には処理はステップS606へと進み、一定でない場合には処理がステップS607へと進む。ステップS606で処理部106は、ステップS604で作成したSlideshowGroupBoxのデータのdurationパラメータ704を設定し、処理がステップS608へと進んで終了する。
ステップS607で処理部106は、グループ画像属性情報を設定する。グループ画像属性情報はiprp508に格納される。グループ画像属性情報は、グループに含まれる画像のスライドショーによる表示に関わる情報である。例えば、処理部106は、画像データそれぞれの表示時間を示すデータを作成し、ipco509に格納する。図8は、ここで作成される画像データそれぞれの表示時間を示すデータの一例である。図8に示すImageDurationPropertyは、表示時間を設定するためのパラメータを有するデータ形式である。図8に示されるImageDurationPropertyでは、表示時間はimage_durationパラメータ801として記載される。処理部106は、表示する画像データそれぞれに対応する(画像データと同数の)ImageDurationPropertyを作成し、ipco509へと格納する。また、処理部106は、画像データそれぞれの表示時間を指定するために、作成したImageDurationPropertyに画像データのアイテムIDを関連付ける情報を作成し、ipma510に格納する。ステップS607で作成されたグループ画像属性情報のメタデータはRAM103上に出力しておき、ステップS214で各ボックスに格納される。ステップS607の処理の後、処理はステップS608へと進んで終了する。
このような処理によれば、実施形態1においてはスライドショーのアイテムIDとして作成された派生画像アイテム情報が省略される。また、このような処理によれば、実施形態1のステップS307における派生画像属性情報は作成されず、代わってグループ画像属性情報がiprp508の各ボックスに格納される。
[実施形態3]
実施形態3に係る情報処理装置は、実施形態1と同様にスライドショーを格納する画像ファイルを作成するが、スライドショーにおいて表示される画像データを指定する情報を、主要画像アイテム情報のメタデータとしてpitm504に格納する。そのために、本実施形態に係る情報処理装置は、図1の情報処理装置100と同様の構成を有し、ステップS212及びステップS213における処理の内容を除いて図2に示されるフローチャートの処理と同様の処理を行うため、重複する説明は省略する。また、本実施形態においては、実施形態1の図5に示されるファイル500と同様のオブジェクト構成を有する画像ファイルが作成される。さらに、上述のようにpitm504には、スライドショーで表示される複数の画像データを指定する情報が主要画像アイテム情報のメタデータとして格納される。
実施形態3に係る情報処理装置は、実施形態1と同様にスライドショーを格納する画像ファイルを作成するが、スライドショーにおいて表示される画像データを指定する情報を、主要画像アイテム情報のメタデータとしてpitm504に格納する。そのために、本実施形態に係る情報処理装置は、図1の情報処理装置100と同様の構成を有し、ステップS212及びステップS213における処理の内容を除いて図2に示されるフローチャートの処理と同様の処理を行うため、重複する説明は省略する。また、本実施形態においては、実施形態1の図5に示されるファイル500と同様のオブジェクト構成を有する画像ファイルが作成される。さらに、上述のようにpitm504には、スライドショーで表示される複数の画像データを指定する情報が主要画像アイテム情報のメタデータとして格納される。
図10は、一般的なpitmのボックスフォーマットの一例である。本実施形態に係る処理部106は、図10に示されるpitmの仕様を拡張し、図11に示されるデータフォーマットのメタデータを作成する。図11に示されるような記載によれば、主要画像アイテム情報として、複数の画像データを指定することができるようになる。
本実施形態に係る処理部106は、ステップS303~S307の間の任意のタイミングで行われるステップS309(不図示)で、主要画像アイテム情報として複数の画像データを指定するための、画像データに付与されるアイテムIDのリストを作成する。本実施形態に係るステップS213で処理部106は、ステップS309で作成したリストに基づいて、図11に示される1101の箇所にリストの順番通りにアイテムIDを格納し、格納したアイテムIDの個数をitem_countパラメータにセットする。また、本実施形態においては画像データそれぞれの表示時間は個別に設定されるが、例えば実施形態2のステップS607と同様に、画像データごとに対応するImageDurationPropertyが作成及び格納されてもよい。
複数の画像データを表示するスライドショーの情報をpitmの中に格納した画像ファイルを作成することができる。したがって、ユーザが任意の複数の画像を選択してそれらの表示順及び表示時間を決定するスライドショーの設定を有するHEIFフォーマットに従った画像ファイルの作成を効率的に行うことができる。
(その他の実施例)
本発明は、上述の実施形態の1以上の機能を実現するプログラムを、ネットワーク又は記憶媒体を介してシステム又は装置に供給し、そのシステム又は装置のコンピュータにおける1つ以上のプロセッサがプログラムを読出し実行する処理でも実現可能である。また、1以上の機能を実現する回路(例えば、ASIC)によっても実現可能である。
本発明は、上述の実施形態の1以上の機能を実現するプログラムを、ネットワーク又は記憶媒体を介してシステム又は装置に供給し、そのシステム又は装置のコンピュータにおける1つ以上のプロセッサがプログラムを読出し実行する処理でも実現可能である。また、1以上の機能を実現する回路(例えば、ASIC)によっても実現可能である。
発明は上記実施形態に制限されるものではなく、発明の精神及び範囲から離脱することなく、様々な変更及び変形が可能である。従って、発明の範囲を公にするために請求項を添付する。
100:情報処理装置、101:システムバス、102:CPU、103:RAM、104:ROM、105:処理部、106:処理部、107:処理部、108:表示部、109:UI部、110:通信制御部
Claims (11)
- ISO/IEC23008Part12で定義されるHEIFフォーマットに従った、複数の画像を含む画像ファイルを作成する情報処理装置であって、
前記複数の画像の表示順、及び、前記複数の画像それぞれの表示される時間の長さを設定する設定手段と、
前記設定手段による設定に従い、前記複数の画像の表示順を示す情報、前記複数の画像それぞれの表示される時間の長さの情報、及び、前記複数の画像から、前記HEIFフォーマットに従った画像ファイルを作成する作成手段と、
備えることを特徴とする、情報処理装置。 - 前記複数の画像は、前記画像ファイル内に派生画像として含まれることを特徴とする、請求項1に記載の情報処理装置。
- 前記設定手段は、前記複数の画像の表示順を示す情報と、前記複数の画像それぞれの表示される時間の長さの情報と、を前記派生画像に関する情報として設定することを特徴とする、請求項2に記載の情報処理装置。
- 前記設定手段は、前記複数の画像をグループ化する情報をさらに設定し、
前記複数の画像の表示順を、前記複数の画像のグループ化される順番として設定することを特徴とする、請求項1乃至3の何れか一項に記載の情報処理装置。 - 前記設定手段は、前記複数の画像それぞれの表示される時間の長さの情報を、前記画像ファイルのItemPropertyBoxの中に格納することを特徴とする、請求項4に記載の情報処理装置。
- 前記設定手段は、前記複数の画像の表示順を示す情報を、前記画像ファイルのPrimaryItemBoxの中に格納することを特徴とする、請求項1乃至5の何れか一項に記載の情報処理装置。
- 前記複数の画像それぞれの表示される時間の長さが、前記複数の画像ごとに設定されることを特徴とする、請求項1乃至6の何れか一項に記載の情報処理装置。
- 前記複数の画像それぞれの表示される時間の長さが、前記複数の画像に対して一律に設定されることを特徴とする、請求項1乃至7の何れか一項に記載の情報処理装置。
- 前記複数の画像が、スライドショーの機能を有するアプリケーションによって時間連続的に表示されることを特徴とする、請求項1乃至8の何れか一項に記載の情報処理装置。
- ISO/IEC23008Part12で定義されるHEIFフォーマットに従った、複数の画像を含む画像ファイルを作成する情報処理方法であって、
前記複数の画像の表示順、及び、前記複数の画像それぞれの表示される時間の長さを設定する工程と、
前記複数の画像の表示順を示す情報、前記複数の画像それぞれの表示される時間の長さの情報、及び、前記複数の画像から、前記HEIFフォーマットに従った画像ファイルを作成する工程と、
備えることを特徴とする、情報処理方法。 - コンピュータを、請求項1乃至9の何れか一項に記載の情報処理装置の各手段として機能させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2021004498A JP2022109138A (ja) | 2021-01-14 | 2021-01-14 | 情報処理装置、情報処理方法、及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2021004498A JP2022109138A (ja) | 2021-01-14 | 2021-01-14 | 情報処理装置、情報処理方法、及びプログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2022109138A true JP2022109138A (ja) | 2022-07-27 |
Family
ID=82557023
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021004498A Pending JP2022109138A (ja) | 2021-01-14 | 2021-01-14 | 情報処理装置、情報処理方法、及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2022109138A (ja) |
-
2021
- 2021-01-14 JP JP2021004498A patent/JP2022109138A/ja active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6708649B2 (ja) | 画像データのカプセル化 | |
JP4341656B2 (ja) | コンテンツ管理装置、ウェブサーバ、ネットワークシステム、コンテンツ管理方法、コンテンツ情報管理方法およびプログラム | |
JP2023068006A (ja) | 撮像装置、及び、撮像装置の制御方法 | |
JP2020098499A (ja) | 画像ファイル生成装置、画像ファイル生成方法、及びプログラム | |
CN105659581B (zh) | 摄像设备、摄像系统和用于控制摄像设备的方法 | |
KR20120034153A (ko) | 기록 장치 및 기록 방법 | |
US11157546B2 (en) | Information processing apparatus, control method, and storage medium | |
JP2022109138A (ja) | 情報処理装置、情報処理方法、及びプログラム | |
US20210382931A1 (en) | Information processing apparatus, control method of information processing apparatus, and non-transitory computer-readable storage medium | |
JP7457506B2 (ja) | 画像ファイル生成装置、画像ファイル生成方法、画像ファイル再生装置、画像ファイル再生方法、及びプログラム | |
US20040054721A1 (en) | Visual media viewing system and method | |
JP7267703B2 (ja) | 画像データ格納装置、画像データ格納方法、及び、プログラム | |
JP6226650B2 (ja) | 画像閲覧システム、画像記録装置及び画像閲覧装置 | |
KR20220108063A (ko) | 데이터 처리 장치, 데이터 처리 방법, 및 프로그램 | |
US20240095387A1 (en) | Image processing apparatus, image processing method, and non-transitory computer-readable storage medium | |
WO2021002165A1 (ja) | 画像ファイル作成装置、画像ファイル作成方法、及びプログラム | |
US20230140152A1 (en) | Image processing apparatus, image capturing apparatus, control method, and storage medium | |
JP2022136864A (ja) | 情報処理装置、情報処理方法、及びプログラム | |
EP4221191A1 (en) | Media file generation device, media file playback device, media file generation method, media file playback method, program, and recording medium | |
JP2023010008A (ja) | 情報処理装置、情報処理方法、及びプログラム | |
JP2023112456A (ja) | 情報処理装置、情報処理方法およびプログラム | |
CN112312199B (zh) | 一种图像处理方法、装置及设备 | |
JP2007053744A (ja) | 画像表示システム | |
KR100487330B1 (ko) | 디지털 비디오의 썸네일 영상 생성 장치 | |
JP2003018524A (ja) | 画像処理装置及び画像処理プログラム |