JP2004289598A - 電子アルバム作成装置、電子アルバム作成方法及びプログラム - Google Patents
電子アルバム作成装置、電子アルバム作成方法及びプログラム Download PDFInfo
- Publication number
- JP2004289598A JP2004289598A JP2003080364A JP2003080364A JP2004289598A JP 2004289598 A JP2004289598 A JP 2004289598A JP 2003080364 A JP2003080364 A JP 2003080364A JP 2003080364 A JP2003080364 A JP 2003080364A JP 2004289598 A JP2004289598 A JP 2004289598A
- Authority
- JP
- Japan
- Prior art keywords
- data
- scene description
- format
- electronic album
- scene
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Images
Landscapes
- Information Transfer Between Computers (AREA)
- Television Signal Processing For Recording (AREA)
- Editing Of Facsimile Originals (AREA)
Abstract
【課題】電子アルバムを、作成する側にとっての負担が少なく、配布しやすい形式で作成することが可能なマルチメディア電子アルバム作成装置およびその制御方法および記憶媒体を提供する。
【解決手段】データ処理部116はシーンを構成するオブジェクトの空間的配置と時間的配置とを記述したシーン記述テンプレートを保持し、オブジェクトの1つである画像データをAVデータ入力部103より入力し、シーン記述テンプレートのプレースホルダーに画像データの位置情報を設定することによりシーン記述データを生成し、シーン記述データと前記画像データとを多重化する。
【選択図】 図1
【解決手段】データ処理部116はシーンを構成するオブジェクトの空間的配置と時間的配置とを記述したシーン記述テンプレートを保持し、オブジェクトの1つである画像データをAVデータ入力部103より入力し、シーン記述テンプレートのプレースホルダーに画像データの位置情報を設定することによりシーン記述データを生成し、シーン記述データと前記画像データとを多重化する。
【選択図】 図1
Description
【0001】
【発明の属する技術分野】
本発明は、画像データを用いた電子アルバム作成装置、電子アルバム作成方法及びプログラムに関するものである。
【0002】
【従来の技術】
写真やビデオ映像、音声などを、デジタル形式のデータとして記録し、再生するための機器が広く流通するようになってきた。そうした背景から、利用者がデジタルカメラなどの機器で撮影したデジタル画像を、電子メールやインターネット上のサーバを介して交換するといったことが日常的に行われるようになった。
【0003】
その背景には、情報符号化技術、圧縮技術等の情報処理技術の発達に加えて、デジタルデータをあまねく機器間で交換出来るようデータの記録形式を汎用的な標準規格として定めるといった標準化活動が行われてきたことが大きな功績を果たしていると言えるだろう。
【0004】
例えば、静止画像の領域では、JPEG(ISO/IEC 10918,“Digital Compression and Coding of Continuous−tone Still Images”)、PNG(World Wide Web Consortium, Portable Network Graphics)、動画形式ではMPEG−1 Video(ISO/IEC 11172−2,“Information technology− Coding of moving pictures and associated audio for digital storagemedia at up to about 1.5 Mbit/s−Part2:Video”)、MPEG−2 Video(ISO/IEC 13818−2,ITU−T H.262,“Generic coding of moving and associated audio information−Part2:Video”)、MPEG−4 Video(ISO/IEC 14496−2,“Information technology−Generic coding of audio−visual objects−Part2:Visual”)、上述のJPEGを動画表現に応用したMotion JPEGなどがある。
【0005】
音声形式では、MPEG−1 Audio(ISO/IEC 11172−3,“Information technology−Coding of moving pictures and associated audio for digital storagemedia at up to about 1.5 Mbit/s−Part3:Audio”)の一種であるMP3(MPEG−1 Audio Layer 3)、AAC(ISO/IEC 11172−7,Information technology−Generic coding of moving pictures and associated audio information−Part 7:Advanced Audio Coding(AAC))などがある。
【0006】
上記をはじめとする様々な規格に対応する多くの機器が流通することによって、利用者の間で映像・音声がデジタル化されたAVデータを容易に交換出来るようになった。
【0007】
通常、これらのAVデータを入出力する機器では、それぞれの機器で記録単位とするデータは何らかのファイルシステム上のファイルとして作成される。その記録単位は、例えばデジタルスチルカメラであれば一枚の画像となるし、動画、音声の場合は記録開始時から終了時までの内容となる。
【0008】
これらのAVデータを記録したファイルは、単独で利用されることもあるが、異なる種類の複数のデータファイルが一覧出来るように作成されたデータと併用することで、あたかも銀塩写真をアルバムに整理して見るような利用方法もごく普通に行われている。以下、このように複数のAVデータが集約されたいわゆる電子形式のデータを、銀塩写真のアルバムにならって、電子アルバムと記述する。
【0009】
電子アルバムの典型的な例が、良く知られるHTML(Hypertext Markup Language)などのマークアップ言語で記述される文書である。HTMLでは、アルバムに含めるAVデータファイルのURL(Uniform Resource Locator)のようなアドレスを示す「アドレス情報」と、そのAVデータが画面上に表示される位置等のような「空間的配置」情報を記述することが出来る。HTMLを用いて記述された文書は、HTMLを解釈可能なブラウザで閲覧することで、記述されている空間的配置どおりにAVデータがレイアウトされた電子アルバムとして観賞することが出来る。
【0010】
HTMLは、テキスト形式で記述されているため編集作業が容易であるという点や、事実上の標準規格であり、インターネットにアクセスすることが出来るほとんどの機器にHTMLを解釈できるブラウザ・ソフトウェアが標準搭載されているため、特定のアルバム再生アプリケーションを使用しなくても閲覧が可能であるといった点から、広く一般的に利用されている。
【0011】
こういった電子アルバムの作成・編集を簡単に行うための方法については、これまでに多くの公知の提案がなされている。その代表的なものが、表示位置などの空間的情報をあらかじめ定義したテンプレートを用いてデジタル画像を配置するといったものである(例えば、特許文献1参照)。
【0012】
また、入力画像に応じて適切なテンプレートを自動選択するもの(例えば、特許文献2参照)や、テンプレートの記述内容に応じて入力画像の配置を自動的に調節するもの(例えば、特許文献3参照)などの提案もなされている。アルバムに取り込まれるデータの形式も、静止画像に加えて、動画などを用いるようにする提案もされている(例えば、特許文献4参照)。また、デジタルカメラから直接HTML形式のアルバムを生成するといった提案もされている(例えば、特許文献5参照)。
【0013】
現在までに、上記のようなテンプレートを用いた方法によって、電子アルバムを簡単な操作で作成することが出来る多くのアプリケーション・ソフトウェアが発売・公開されてきた。これらのソフトウェアのいくつかは、アルバムをそのアプリケーション固有のデータ形式で出力する機能に加え、より一般的な環境で閲覧出来るようアルバムをHTMLなどの標準形式で出力する機能もサポートされている。
【0014】
【特許文献1】
特開平09−190546号公報
【特許文献2】
特開平10−293856号公報
【特許文献3】
特開平11−353466号公報
【特許文献4】
特開2000−172673号公報
【特許文献5】
特開2000−357169号公報
【0015】
【発明が解決しようとする課題】
しかしながら、このような電子・アルバムを作成する際には、不便な点もある。
【0016】
第一に、複雑な表現が可能になったことによって、アルバムを記述する側にも記述方法に関する多くの知識と、記述作業に関するより多くの手間が必要となり、作成する側に負担が強いられる。HTMLにおける空間表現に加えて、時間的表現やインタラクティブな表現に関しても記述しなければならないため、アルバムの作成者が鑑賞に堪えうるアルバムを完成させるまでにはより多くの時間が必要になってしまうこともある。
【0017】
例えば、表現内容を確認しながら試行錯誤でアルバムを記述していく場合、HTMLの場合は、AVデータが正しい位置に配置されているかどうかという空間的要素のみに着目して作業を行えばよいのに対して、時間的要素やインタラクティブな要素が加わると、それだけ試行錯誤の回数が増加してしまい、作成にかかる時間も増大してしまうであろう。それは、手作業で記述するにしても、何らかの編集ツールを用いて作成するにしても同じである。
【0018】
また、記述すべき情報の種類も多くなるため、作成者が記述内容を直接書き換える場合には、その内容に関する知識を習得するまでにはより多くの時間が必要となる。何らかの編集ツールを用いる場合でも、同様にツールで提供される編集操作を習得する時間が要求されるし、加えて、ツール自体も複雑で大きなものになってしまい、入力や表示のためのインターフェースや使用可能な記憶装置などのリソースが限られている機器では実現不可能なものとなってしまう恐れがあるため、別途PC等の機器を併用して作業を行なうコストを作成者に強いることになりかねない。
【0019】
第二に、HTMLなどの記述フォーマットを用いる場合、AVデータの実体は別ファイルとして存在し、URLなどのアドレス情報によって外部データを参照するという特性ゆえに、アルバム自体が取り扱いにくいものとなってしまうという問題がある。
【0020】
周知の通り、URLを用いて外部ファイルを参照する場合は、URLが示す位置に参照されるファイルが存在しなければ正しく参照することは出来ない。したがって、作成されたアルバムを配布するような場合には、参照される全てのファイルが欠落することなく、かつ、ファイル群の構造が正しく保たれていることが保証された状態で配布されなければならない。
【0021】
URLを利用した外部参照は、参照されるデータの内容を変更するような場合でも参照する側の内容を変更する必要がないという点では優れているが、現実に多くのWebページで、ハイパーリンクの参照先が存在しないケースが見受けられることからも、取り扱いにはそれ相当の注意を要することは想像に難くない。
【0022】
また、配布手段によっては、ファイル構造が正しく保たれないか、あるいは注意を必要とするケースも存在する。例えば、アルバムを構成するファイル群を電子メールの添付ファイルとして配布する場合、受信側で添付ファイルが格納される位置はアルバムに記述されたURLとは必ずしも一致しないため、配布されたアルバムは正しく表現されるとは限らない。また、アルバムをインターネット上のサーバに配置して公開する場合は、FTP(File Transfer Protocol)などの転送手段を用いてファイル群をサーバ上に転送する際に、転送先のサーバ上で正しいファイル構造が再現されるよう注意深く転送しなければならない。
【0023】
このように、ネットワークを介してアルバムデータを伝送、配布するケースでは、正しく再生できることが保証されないか、あるいは、正しく再生できるようにするために配布する側に負担をかけてしまうという問題がある。
【0024】
以上述べたような問題が存在することにより、従来の手法によれば、表現力が高く配布しやすい電子アルバムを作成することは、作成者にとって負担が大きいものであった。
【0025】
本発明は、上記の課題に鑑みてなされたものであり、電子アルバムを、作成する側にとっての負担が少なく、配布しやすい形式で作成することが可能な電子アルバム作成装置、電子アルバム作成方法及びプログラムを提供するものである。
【0026】
【課題を解決するための手段】
上記の目的を達成するために、本発明における電子アルバム作成装置は、シーンを構成するオブジェクトの空間的配置と時間的配置とを記述したシーン記述テンプレートを保持する保持手段と、前記オブジェクトの1つである画像データを入力する入力手段と、前記シーン記述テンプレートのプレースホルダーに前記画像データの位置情報を設定することによりシーン記述データを生成する生成手段と、前記シーン記述データと前記画像データとを多重化する多重化手段とを有することを特徴とする。
【0027】
また、上記の目的を達成するために、本発明における電子アルバム作成方法は、シーンを構成するオブジェクトの空間的配置と時間的配置とを記述したシーン記述テンプレートを保持する保持工程と、前記オブジェクトの1つである画像データを入力する入力工程と、前記シーン記述テンプレートのプレースホルダーに前記画像データの位置情報を設定することによりシーン記述データを生成する生成工程と、前記シーン記述データと前記画像データとを多重化する多重化工程とを有することを特徴とする。
【0028】
【発明の実施の形態】
以下、本発明の実施の形態について、図面を参照しながら詳細に説明する。
【0029】
図1は、本発明の電子アルバム作成装置の実施形態のシステム構成を示すブロック図である。なお、このシステム構成は本発明を実現するために取りえるひとつの構成例に過ぎない。本発明の意義を充足する限りにおいては、システムの各構成部は任意に再編、統合、分離、再配置出来るものとする。さらに、各構成部の制御方法は、ソフトウェア、ハードウェアの何れの手段によって実現されても良いものとする。
【0030】
図1における実施形態において、電子アルバム作成装置の利用者による各種操作はユーザ操作101として、ユーザ操作入力部102を介することによって入力される。AVデータ入力部103は、静止画像や動画像、音声などを入力し、デジタル形式のAVデータとして装置内部に取り込むためのものである。
【0031】
シーン記述テンプレート104は、電子アルバムを構成するシーンに含まれるAVデータの空間的、時間的配置およびその挙動のみが記述されているデータである。シーン記述テンプレート104にはAVデータ106の実際の位置を示すアドレス情報は一切含まず、のちに作成されるシーン記述データのテンプレートとして用いられる。
【0032】
シーンエディタ105は、上述のシーン記述テンプレート104とAVデータ106とを合成し、合成された結果を編集してシーン記述データ107として出力する。シーン記述テンプレート104で記述される内容は、AVデータのアドレス情報が欠落しているため、最終的に作成されるシーンの内容とは必ずしも一致するものではない。シーンエディタ105はシーン記述テンプレート104で欠落しているAVデータ106のアドレス情報を補完し、完全なシーンの内容が記述されたデータを作成するためのモジュールである。また、シーンエディタ105は、AVデータ106をシーン記述テンプレート104にどのように配置するかを指定するため、あるいはシーンに対するその他編集処理を行うため、ユーザ操作入力部102から入力されるユーザ操作101を受け取る場合もある。
【0033】
シーン記述エンコーダ108は、シーン記述データ107の内容をいわゆる「オブジェクトベース符号化」形式におけるシーン記述に対応する形式に符号化し、結果としてシーン記述ストリーム110を出力する。同様に、AVエンコーダ109は、シーン記述エンコーダ108と同様にAVデータ106の内容をオブジェクトベース符号化形式におけるAVデータに対応する形式に符号化し、AVストリーム111を出力する。
【0034】
なお、シーン記述エンコーダ108およびAVエンコーダ109では、符号化処理に加えて、データ形式の変換、あるいは付加情報の符号化処理なども並行して行われる場合がある。一例を挙げれば、前者は入力されたデータが出力されるオブジェクトベース符号化形式ではサポートされない形式であるような場合や、圧縮が不十分あるいは圧縮されていないような場合、もしくは入力データの品質がよくないような場合に、適切な再符号化や再圧縮、品質改善のためのデータ処理などを行うといった処理に相当する。後者は、複数のAVデータが同期して再生するための同期情報を付与するといった処理が典型例であろう。
【0035】
マルチプレクサ112は、オブジェクトベース符号化形式で符号化されたシーン記述ストリーム110およびAVストリーム111を多重化し、両者が統合された単一のアルバムデータ113を出力する。このアルバムデータ113は、最終的に配布対象となる電子アルバムを示すものである。
【0036】
表示部114は、上述の各構成部によって行われた操作や処理の内容、データの内容を利用者に対して表示するためのものである。通信部115は、何らかの通信手段を介して、装置の外部からユーザ操作101を入力したり、図中の各種データを入力あるいは外部に出力するために用いられる。データ処理部116は、少なくとも、CPU、テンプレートを保持しておくメモリ、ソフトウェアを保持しておくROM、アルバムデータを保持しておく大容量記憶媒体、例えばハードディスクを有しているものである。
【0037】
なお、図1において、データ処理部116が、本発明で示される電子アルバムを構成するために最低限必要な構成部となっている。言い換えれば、ユーザ操作101、ユーザ操作入力部102、AVデータ入力部103、表示部114、通信部115は、全ての実施形態において必ずしも存在するとは限らない。
【0038】
続いて、本発明の特徴について簡単に述べる。
【0039】
本発明では、本来のシーン記述のデータから、参照されるAVデータの実体を示すアドレス情報を除いたデータをシーン記述テンプレート104としてあらかじめ用意しておく。
【0040】
そして、そのシーン記述テンプレート104中のAVデータの情報を示す部分に、実際のAVデータのアドレス情報を補完したシーン記述データ107を生成し、AVデータ106とともに多重化して、単一のアルバムデータ113を生成することを特徴としている。
【0041】
このように、シーン記述データおよびAVデータを、最終的に単一の多重化ファイルにアーカイブすることにより、シーン記述のフォーマットがURLなどによる外部参照を行うようなフォーマットであっても、データ同士の参照関係が損なわれることなく安全・確実に伝送・配布することが出来る電子アルバムを生成することが可能になる。
【0042】
以下、本発明の実施の形態について、いくつか具体例を挙げて説明する。
【0043】
(実施の形態1)
図1のシステム構成をよりわかりやすく示すため、現実の装置への適用例として、図1のシステム構成を適用して実装されたデジタルカメラの実施例を図2に示す。
【0044】
図2のレンズ201、マイクロフォン202は、それぞれ映像、音声を入力するための部分で、AVデータ入力部103に相当する。レンズ201およびマイクロフォン202からの入力は内部的にデジタルデータに変換され保存されると仮定する。
【0045】
シャッターボタン203、メニューボタン204、キーパッド205はユーザ操作入力部102に相当する。各ボタンが押された時の動作として、メニューボタン204には利用者が行うことが出来る操作内容を列記するメニュー画面の出力、キーパッド205には画面上で利用者が行うことが出来る操作を選択する領域の移動、シャッターボタン203には、映像および音声の記録操作に加え、画面上で選択された操作の決定といった動作が割り当てられていると仮定する。
【0046】
ディスプレイ206は表示部114に相当し、撮影された映像等の内容やメニュー画面、電子アルバムを編集するための操作画面などが表示されるものとする。
【0047】
カードスロット207は、外部とデジタルデータの交換を行うため、データが記録された揮発性メモリーカード等の装置の着脱を行うためのものである。通信ポート208も同じく外部とのデータ入出力を行うための通信手段を提供するインターフェースである。通信ポート208で提供される通信方式は、USB(Universal Serial Bus)のような有線通信であっても、Bluetoothのような無線通信であっても良い。また、カードスロット207には、PHSカードのような通信装置を装着してデータ通信を行う形態もありえる。ゆえに、広義ではカードスロット207、通信ポート208のいずれも通信部115に相当すると言える。
【0048】
図2記載のカメラは、撮影した映像、音声を電子アルバムとして編集するための簡易アプリケーションが搭載されており、作成されるアルバムデータ113はファイルとしてカードスロット207、通信ポート208等を介して取得可能であると仮定する。
【0049】
なお、本実施の形態で用いられるオブジェクトベース符号化形式は、ISO(International Organization for Standardization)により標準規格化されているMPEG−4(ISO/IEC 14496)を用いるものとして説明を行う。
【0050】
すなわち、シーン記述ストリーム110は、MPEG−4 Systems(ISO/IEC 14496−1)によって規格化されたMPEG−4におけるシーン記述形式であるBIFS(Binary Format for Scene)形式のストリームデータとなる。このBIFSは、三次元空間の記述形式として知られるVRML (ISO/IEC CD 14772−The Virtual Reality Modiling Language)を拡張したものとして規定されており、伝送や記録が効率的に行えるようにバイナリ形式で符号化されるといった特徴を持つフォーマットである。
【0051】
VRMLおよびBIFSでは、HTMLで記述されるような「空間的配置」情報の記述に加えて、AVデータが表示あるいは消去されるタイミングを記述したり、時間の経過に応じて表示位置などの属性を変化させたりといった時間的な情報の記述が可能になっている。以下、このような時間的な情報を、前述の空間的配置という表現に対応させ、「時間的配置」と表す。
【0052】
また、VRMLおよびBIFSでは、画面上に配置されているAVデータが、マウスなどのポインティング・デバイスで選択された時にどのような動作を行うかといった「挙動」を記述することも仕様の一部としてサポートされている。
【0053】
その他、VRMLが提供する三次元空間表現やベクターグラフィックによる図形表現などのより高度な空間表現も提供されている。
【0054】
これらの機能を用いて、AVデータの「空間的配置」、「時間的配置」、および「挙動」が定義されたシーンの情報を電子アルバムに記述することで、AVデータがアルバム上で表示位置を変えながら動いたり、閲覧者がアルバム上のAVデータを選択するとそのAVデータが動き出すといったような、より豊かでインタラクティブなアルバムを表現することが出来る。
【0055】
本実施の形態では、上記の機能を活用して、多彩な表現を持ったアルバムを作成する場合を例にとって説明していく。
【0056】
また、出力されるアルバムデータ113は、MPEG−4 Systems(ISO/IEC 14496−1)におけるファイル形式として規格化されているMP4フォーマットであるものとしている。このMP4フォーマットでは、シーン記述データと参照されるAVデータとを多重化してひとつのファイルとして記録するための方法についても規格化されており、本実施の形態ではこの多重化方法にしたがってアルバムデータ113を生成するものとする。
【0057】
このアルバムデータ113は、最終的に他の機器に伝送・配布されるものであるため、多くの機器で正しく表示出来るよう、標準フォーマットやそれに準ずる一般的なフォーマットで出力されることが望ましい。本実施の形態で用いられているMP4フォーマットは、国際標準規格として定められたフォーマットである。本明細書の作成時点では、Apple Computer社のQuickTime Player(登録商標)やNTTドコモ社の移動体通信サービスであるFOMA(登録商標)に対応した動画再生機能付きの機器でサポートされており、今後さらに普及することが見込まれている。
【0058】
続いて、本実施の形態の電子アルバム作成装置で作成することが出来るアルバムの一例を図3に示す。
【0059】
図3の301で示される領域全体が電子アルバムである。その内部には静止画像を表示する領域302、303、304が配置されており、それぞれの領域には静止画ファイルphoto1.jpg、photo2.jpg、photo3.jpgの内容が表示される。その背後には、アルバムの台紙を表現した静止画ファイルbook.jpgの内容が領域301全体に背景画像として表示されている。このような形で、それぞれの静止画の「空間的配置」情報がアルバムに記述されているものとする。
【0060】
さらに、このアルバムには、領域302、303、304を何らかのポインティングデバイスを用いて画面上で選択すると、「それぞれの領域に表示されている内容が、現在表示されている位置から、領域305の位置に移動して拡大表示され、のちに、元の位置に縮小しながら移動する」といった「挙動」が記述されているものとする。
【0061】
また、選択された内容は、0.5秒間で大きさ、位置を変化させながら領域305に移動し、領域305に4秒間表示された後、再び0.5秒間で縮小しながら元の位置に戻るといった時間軸をともなうアニメーション表示を行うよう、拡大・縮小時の動作の「時間的配置」が記述されている。
【0062】
このように、アルバムには表示されるデータの「挙動」および「時間的配置」も定義されているものとする。
【0063】
図3のアルバムの内容は、図4〜図6に示されるシーン記述で表現することが出来る。図4〜図6は、図3で示されるシーンの内容をBIFSに相当する形式で記述したものであり、図4の次に図5が続き、図5の次に図6が続く。BIFSはバイナリ形式のデータであるため実際の符号化データはこういったテキスト形式では記録されないが、BIFSはVRMLを元にした形式であるため、図4〜図6ではVRMLの記法を元にしたテキスト形式で表現している。
【0064】
VRMLのようなテキスト形式のフォーマットは、人間が解釈することを前提として、英単語や恣意的な記号などを用いて表現内容を言語として記述するようになっているため、これらのフォーマットを用いて記述された内容は、テキストエディタなどの一般的なツールを用いて容易に編集することが可能である。それに対し、BIFSのようなバイナリ形式のフォーマットは、テキスト形式と比較して小さなサイズとなるので、効率的に伝送や記録が行える。
【0065】
したがって、本実施の形態では、シーン記述テンプレート104およびシーン記述データ107はデザイナーがテンプレートを容易に作成、編集できるようにVRMLに基づくテキスト形式の表現で記述し、シーン記述ストリーム110は最終的なアルバムのフォーマットであるMP4で規定される仕様に基づき、バイナリ形式のBIFSデータとして記録するものとしている。
【0066】
以下、このシーン記述の要点についてのみ簡単に説明する。なお、記述内容を詳細に渡って説明することは本発明を説明するためには不要と思われるため省略する。
【0067】
図4〜図6のシーン記述では、それぞれの画像はURLを用いて参照されている。その内容をShapeと呼ばれるオブジェクトの形状を記述するノード内で、ImageTextureと呼ばれるノードを用いて、Bitmapと呼ばれる図形オブジェクトに貼り付けることを指示している。さらに、貼り付けられたオブジェクトを拡大、縮小するための倍率scale、所定の座標位置に配置するためのtranslationと呼ばれる属性値によって表示時のサイズ、位置が指定されている。
【0068】
なお、VRMLでは画面の中心を原点とするいわゆる三次元ワールド座標が用いられているため、座標系は通常の二次元座標とは異なっている。その上で、各画像ファイルの大きさが640×480ピクセルの場合、表示結果は図3のレイアウトと一致する。
【0069】
加えて、ポインティングデバイスによる選択操作を検出し、イベントを発生させるセンサーオブジェクトTouchSensor、拡大・縮小が行われる間の計5秒間のオブジェクトの位置および表示倍率の変化を定義するPositionInterpolator2D、5秒間の間に周期的にタイマーイベントを発生させるタイマーオブジェクトTimeSensor、そして、TimeSensorやTouchSensorから発生したイベントを、PositionInterpolator2DおよびBitmapオブジェクトなどのオブジェクトへ受け渡すルートを定義するROUTEノードによって、図3で示されるシーンが表現されることになる。
【0070】
このROUTEによるオブジェクトの連携動作を簡単に説明する。例えばこのシーン記述では、”photo1.jpg”の静止画を選択すると、その静止画オブジェクトPICT1に対して設定されているセンサーオブジェクトSENSOR1が「オブジェクトを選択された」というイベントを検知すると、そのタイミングで、PICT1の大きさ、位置のアニメーション表示を管理するためのタイマーオブジェクトTIMER1のタイマーを開始させるという連携動作が定義されているが、この両者の関連は、図6の”ROUTE SENSOR1.touchTime TO TIMER1.startTime”という形で記述される。
【0071】
同様にして、TIMER1のタイマーが開始されたら、一定間隔毎に位置、大きさを示す数値を変化させるオブジェクトであるINT1、SCALE1オブジェクトにイベントが通知される。
【0072】
このINT1、SCALE1オブジェクトには、時間に応じた数値の変化量が定義されており、タイマーからイベントが通知されたら、通知された時間に対応する数値をそれぞれPICT1の位置、表示倍率に設定する。
【0073】
以上のように、オブジェクト間の関連を記述しておき、実行時にオブジェクト間が連携動作を行うことによって、図3のように動きのあるアルバムを表現することができる。
【0074】
図4〜図6で示されるように、電子アルバムを作成するためには、多くの属性や時間軸に伴う動き情報、オブジェクトを連携動作させるための情報が記述されなければならない。アルバムを作成する側にとっては、編集時にこれらの情報を逐一設定していくのは、人間であれツールであれ非常に負担が大きなものである。
【0075】
そこで、本発明では、参照されるAVデータの実体を示すアドレス情報を除いたシーン記述のデータをテンプレートとして用意しておき、アドレス情報の部分のみを編集するといったきわめて単純化された編集機能を提供することによって、作成する側の負荷を軽減するようにしている。
【0076】
図7は、本発明の根幹をなすシーン記述の編集処理の内容を図説するものである。
【0077】
シーン記述テンプレート104は、外部参照されるべきAVデータのアドレス情報、すなわちURLが記述されていない状態で作成され、作成装置にあらかじめ供給される。そして、シーンエディタ105は入力されたシーン記述テンプレート104の内容に対して、参照されるAVデータ106(図7の場合、”photo1.jpg”)のURLを埋め込む処理を行って、結果をシーン記述データ107として出力している。
【0078】
上記の処理が、図3のアルバムを扱う場合にシーンエディタ105において行われる際に表示される画面の例を図8に示す。なお、この例では、図3のアルバムの領域302、303、304に記述されるべきURLを含まないシーン記述テンプレート104が、あらかじめ供給されているものと仮定する。
【0079】
シーンエディタ105は、入力されたシーン記述テンプレート104を解析し、外部データを参照するよう記述されているにも関わらずURLが定義されていない部分を検出すると、そのノードは、シーンエディタ105での編集処理時にAVデータが指定される場所である「プレースホルダー」であると解釈し、未定義のAVデータの代わりに何らかの内容を代替表示する。
【0080】
図8の例では、編集操作を行う利用者に対してプレースホルダーの位置にAVデータの指定するよう促す内容を示す画像ファイル801を表示している。そして、利用者の操作によってプレースホルダーの位置にAVデータが指定されたら、指定されたAVデータの内容を表示し、同時に、内部的にプレースホルダーに該当するノードに、指定されたURL情報を設定するといった処理が行われる。
【0081】
引き続き、シーンエディタ105の処理の流れを図9を用いて順を追って説明し、さらに、その他の図を用いて、図9の各ステップの実行時にどのような画面表示が行われるかを例示していく。
【0082】
なお、本発明は画面およびインターフェースに関するものではないので、どのようなインターフェースが用いられても良いものとする。
【0083】
まず、図9は、シーンエディタ105で行われるシーン記述データ作成処理の手順を示すフローチャートである。
【0084】
ステップS901は、シーンエディタ105が処理するシーン記述テンプレート104を選択する。
【0085】
本実施の形態では、メニューボタン203が押下された時に、図10に示されるようなメニュー画面を表示することで、どのような機能を実行するかを利用者に選択させるようにしている。図10は、処理選択メニュー画面のイメージである。図10では、利用者が次に実行するアクションを画面上の選択領域1001で示しているが、選択領域1001を「テンプレートを選択」の位置にあわせて決定すると、図11に示されるようなテンプレートの選択画面が表示される。図11は、テンプレート選択画面のイメージである。図11では、領域1101に使用可能なテンプレートが縮小表示され、領域1102には、選択領域1103によって選択されたテンプレートが拡大表示される。そして、利用者によって選択内容が決定されると、次のステップに進む。
【0086】
ステップS902は、ステップS901で選択されたシーン記述テンプレート104を読み込んで、内容を解析し、シーン記述に含まれるプレースホルダーの位置を検出する。
【0087】
本実施の形態では、図7のシーン記述テンプレート104で示されるような「URLの部分が空のShapeノード」をプレースホルダーとみなすものとしている。プレースホルダーが検出されたら、その位置等の情報を取得し、図8ような初期レイアウトのアルバムを表示する。その際、シーン記述中に含まれるURLは有効ではないため、無効なURLに対しては図8で示されるような代替表示を行うなどの手段で、有効でないURLが使用されていることによる異常な表示や動作が行われることを回避する処理が行われることが望まれる。
【0088】
ステップS903は、ステップS902で検出されたプレースホルダーの位置に配置するAVデータを選択する。
【0089】
本実施の形態では、図12が示すような編集画面を用いて、利用者にAVデータを選択させるものとする。図12は、アルバム編集画面のイメージである。図12の領域1201には、作成装置から参照することの出来るAVデータやその属性情報が表示され、領域1202にはステップS901で選択されたシーン記述テンプレートで表されるレイアウトが表示される。また、ステップS902で検出されたプレースホルダーは、領域1202上の選択領域1003で選択することが可能であるとする。
【0090】
利用者はまず、領域1202上でAVデータを指定するプレースホルダーを選択すると、利用者が操作可能なアクティブな選択領域は、選択領域1203から選択領域1204に変わる。そして、利用者は領域1201上で選択領域1204を操作することで、AVデータを選択する。この選択領域1203および選択領域1204によって、どのAVデータをどのプレースホルダーに配置するかを設定する。
【0091】
AVデータが決定されると、選択領域1203が示すプレースホルダーの位置に選択領域1204で示されるAVデータが貼り付けられて表示される。
【0092】
ステップS904は、ステップS903で指定されたプレースホルダーが、シーン記述テンプレート104のどの位置に対応するかを特定する。
【0093】
ステップS905は、選択されたプレースホルダーに対応するシーン記述の内容をチェックし、選択されたAVデータとシーン記述で指定されているデータ形式が一致しているかチェックを行う。
【0094】
本実施の形態では、プレースホルダーの位置のオブジェクトはいずれも静止画の内容をオブジェクトに貼り付けることを指示するImageTextureノードを用いてURLを指定している。すなわち、プレースホルダーに貼り付けられるAVデータは静止画でなければならず、動画、音声を指定することは出来ない。したがって、ステップS905では指定されたAVデータのデータ形式とシーン記述が指定するデータ形式との比較を行い、データ形式が正しいかどうかチェックを行っている。
【0095】
なお、AVデータ形式をチェックするには、データの内容を解析してフォーマットを特定する方法と、ファイル名の拡張子などからフォーマットを推定する方法の二通りが考えられるが、いずれの方法が用いられても良い。
【0096】
ステップS906は、ステップS905においてデータ形式が一致しなかった場合は、AVデータを貼り付けることが出来ない旨を利用者に通知するエラー処理を実行し、ステップS903に戻る。
【0097】
エラー処理がどのように行われるかはシステムの仕様によって異なるためここでは規定しないが、画面表示を行う場合は何らかのエラーメッセージを表示するか、あるいは何も行わないといった処理が一般的であると考えられる。
【0098】
ステップS907は、ステップS905においてデータ形式が一致した場合は、選択されたAVデータのURLをシーン記述テンプレートのプレースホルダーの位置に設定する。
【0099】
また、本実施の形態では、AVデータが設定されたことを示すため、プレースホルダーの位置に選択されたAVデータの内容を表示する処理も行っている。
【0100】
ステップS908は、編集処理を継続するかどうかをチェックする。継続する場合はステップS903に戻り、編集処理を終了する場合はステップS909に移る。
【0101】
本実施の形態では、図10のメニュー画面で「アルバムを保存」を選択することで、ステップS909の処理に移行する。
【0102】
ステップS909は、ステップS907でURL情報が書き換えられたシーン記述データの内容を、シーン記述データ107として出力する。
【0103】
本実施の形態では、図7のシーン記述データ107で示されるように、シーン記述テンプレートには設定されていなかったURLが埋められた形のシーン記述データが出力されるものとする。また、プレースホルダーにAVデータが指定されずにシーン記述データ107の出力を行う場合には、URLが設定されていない状態のままとなり後続の処理が正しく動作しない恐れがあるため、本実施の形態ではそのようなAVデータが設定されていないプレースホルダーの位置には、図8の801で示すような代替ファイルのURLを設定するものとしている。
【0104】
以上ステップS901〜ステップS909の処理によって、シーンエディタ105によってシーン記述テンプレート104とAVデータ106が合成され、シーン記述データ107が作成される。
【0105】
なお、本発明を用いて映像データと同様に音声データを扱う必要がある際には、注意しなければならない点がある。音声データは、その性質によりデータの内容を画面上に表示することが出来ないため、上述の静止画ファイルの場合と同じようにプレースホルダーの位置にデータが貼り付けられたことをAVデータの内容を表示することで表現することが出来ない。また、映像が貼り付けられたオブジェクトは画面上で選択することが可能だが、音声が貼り付けられたオブジェクトは、何らかの可視形態を伴うオブジェクトと併用されなければ選択することは出来ない。
【0106】
図13は、電子アルバムに音声データを用いる際の対処法を示すものである。
【0107】
図13の領域1301、1302、1303は、音声データのプレースホルダーを示す領域であり、音声データが未設定の場合は、代替表示として画像ファイル1305の内容が表示される。そして、音声データ1306がプレースホルダーの位置に設定されたら、音声データが設定されていることを示す画像を表示するようにすることが望ましい。そのためには、実際には音声データが貼り付けられたオブジェクトは、編集画面上では可視オブジェクトとして表示するといった例外的な処理が実装されている必要がある。図13の例では、領域1301に音声データが設定されたら、画像ファイル1307を表示している。
【0108】
また、音声が貼り付けられたオブジェクトを選択させる場合には、何らかの選択可能な可視オブジェクトを併用し、可視オブジェクトが選択されたら音声オブジェクトも選択されるように記述されたシーン記述テンプレートが必要になる。図13は、領域1304に静止画のプレースホルダーを配置し、領域1304の静止画が選択されたら、それと連動して領域1301に設定された音声データが再生されるように関連を定義することを示している。こういった関連の定義は、BIFSの場合は上述のROUTEノードによって記述することが可能である。
【0109】
以上、具体的な実施の形態を例にとって、本発明の基本的な原理について説明してきた。
【0110】
(実施の形態2)
実施の形態2として、実施の形態1で説明を行ったものとは別のシーン記述テンプレートを用いてアルバムを作成する場合を例にとって説明を行う。
【0111】
図14は、本実施の形態の説明に用いる電子アルバムを示すものである。このアルバムのシーン記述は、図17〜図20に示し、図17の次に図18、図19、図20の順に続く。
【0112】
この電子アルバムのシーン記述では、領域1401の内部に、ファイルphoto1.jpg、photo2.jpg、photo3.jpgが表示される領域1402、1403、1404、および、背景画像として表示される静止画ファイルbg.jpgが配置されている。また、領域1402、1403、1404を画面上で選択すると、「それぞれの領域の表示内容が、領域1405の位置に移動して拡大表示される」といった挙動が記述されている。
【0113】
さらに、領域1402、1403、1404にはそれぞれ、「画面上から下に移動し、表示位置がアルバムの領域外になったら表示位置を画面の上端に戻す」といった挙動も記述されている。
【0114】
この移動動作について、領域1402の場合を例にとって、図15を用いて簡単に説明しておく。図15は、アルバム中のオブジェクトが自律的に動き回る電子アルバムの表示イメージを示す図である。
【0115】
領域1402は、初期状態では座標(210,300)の位置に表示されているが、時間の経過に応じて位置を少しずつ変化していく。そして、20秒後に元の位置に戻り、再度同じ動作を繰り返すという動きが記述されている。その動き方の詳細は、下記の通りである、
【0116】
(1)動作開始の直後から19秒後までの間に、(210,300)から(210,−360)の位置に移動。
(2)19秒後から19.02秒後までの間に、(210,−360)から(600,−360)の位置に移動。
(3)19.02秒後から19.2秒後までの間に、(600,−360)から(600,360)の位置に移動。
(4)19.2秒後から19.22秒後までの間に、(600,360)から(210,360)の位置に移動。
(5)19.22秒後から20秒後までの間に、(210,360)から(210,300)の位置に移動。
【0117】
上記(1)〜(5)の動作が、20秒間隔で繰り返し実行されるよう定義されている。定義の詳細に関しては、図17〜図20のシーン記述の内容を参照されたい。
【0118】
図16は、図14の電子アルバム中の再生時のイメージを示す図である。図16(a)、図16(b)、図16(c)の順で再生中の時間経過を表し、表示部114には、領域1401内が表示されるので、図16(b)のときは、1404は表示されていないこととなる。時間的配置の遷移が領域1402、1403、1404に上述したように定義されていることによって、このアルバムが再生されると、図16で示されるように、3枚の静止画が上から下にスクロールしているように動き、それによって、フィルムが流れているような表示が行われる。
【0119】
以上のように、図14の電子アルバムは、図3のものと空間的配置はほぼ同じであるが、アルバム上のオブジェクトがそれぞれ自律的に動き回るという点で、図3のものとは内容は大きく異なっている。しかし、図14の電子アルバムを作成する時の利用者の編集操作は、図3のアルバムを作成する場合に行われる操作とまったく同じものとなる。
【0120】
すなわち、本発明の電子アルバム作成方法を適用すれば、定義されている挙動や時間的配置が異なっている複数のシーン記述テンプレートに対しても、利用者はプレースホルダーにAVデータを指定するといった統一された操作のみでアルバム作成が可能になる。
【0121】
(実施の形態3)
シーン記述テンプレート104のプレースホルダーの位置は、図7で示されるような「空のURLを設定する」以外の方法で記述することが可能である。
【0122】
図21は、シーン記述テンプレート107の記述例である。図21(a)では、シーン記述中に「PLACEHOLDER」で始まるキーワードを設定することによって、そのキーワードが存在するノードがプレースホルダーであることを示す例である。
【0123】
記述中のDEFは、あるノードに対して利用者が任意に定義した名前を設定するためのVRMLの予約語であり、この例はShapeノードに対して「PLACEHOLDER_1」という名前を設定していることを表している。なお、VRMLでは、DEFで設定される名前はファイル内で一意でなければならないため、この例では名前の一意性を確保するために「_1」という接尾句を付与している。
【0124】
図21(b)では、図21(a)と同様の手法を用いて、さらに貼り付けることが可能なデータ形式を特定するために「IMAGE」というキーワードを設定している。実装形態によっては、このようなキーワードを設定することによって、図9のステップS905で行われるデータ形式のチェックが簡単に行える場合があるかもしれない。その他、システムの仕様によって任意の情報を示すデータがキーワードとして追加されても良い。また、キーワードの表現もどのようなものが用いられても良い。
【0125】
このように、シーン記述中に「プレースホルダーであることを示す何らかの情報」を許容される文法の範囲で記述することによってプレースホルダーの位置を指定しても良い。
【0126】
(実施の形態4)
シーン記述データ107に埋め込まれるアドレス情報は、図7で示されるようにURLでなくとも、AVデータの位置を特定することが可能な情報である限りは、どのようなものでも利用可能である。
【0127】
図22では、シーン記述データ107にAVデータの位置を示す情報としてURLの代わりに一意な番号を指定する例を示した。この例では、外部参照されるAVデータ106を特定する情報として、ファイル名”photo1.jpg”ではなく、番号”1”がシーン記述データ107に設定されている。
【0128】
この番号”1”は、ファイル”photo1.jpg”に関連付けられて発番された番号で、関連テーブル2201によって両者の関連が記述されている。この関連テーブル2201はシーン記述データ107からAVデータ106を特定する際に、シーン記述中の番号に対応するファイル名を参照することによって可能である。なお、この関連テーブル2201は、シーン記述データ107の一部として作成されても、シーン記述データとは別のデータとして作成されても良い。
【0129】
このように、AVデータのアドレス情報はデータの位置を特定するという目的が満たせるものであれば、任意の形式で設定することが可能である。
【0130】
(実施の形態5)
図9のステップS901におけるテンプレートの選択処理では、利用者にテンプレートを選択させるのではなく、テンプレートが自動的に選択されるような形態も考えられる。
【0131】
例えば、ステップS901には、記録されているAVデータのファイル数あるいはデータ形式に応じて、適切なプレースホルダーの数あるいはデータ形式が定義されたテンプレートを選択するといった機能を持たせることによって、選択を自動化させることも可能である。
【0132】
あるいは、常に同じテンプレートを使用するようにするといった形態も、広義の自動選択を行う形態として考えられる。
【0133】
(実施の形態6)
テンプレート選択と同様に、図9のステップS903におけるAVデータの選択処理も、利用者に選択させるのではなく、AVデータを自動選択する形態もありえる。
【0134】
例えば、ステップS903の選択処理として、AVデータの作成日付順にシーン記述中のプレースホルダーに無条件に配置するといった方法によってAVデータを自動的にテンプレートに割り当てるといった処理を行うことも可能である。この形態によれば、いわゆるインデックスプリントのような表現形態を実現するアルバムを利用者の操作を用いずとも作成することが出来る。
【0135】
または、プレースホルダーが一つのみ記述されたテンプレートを用いて、AVデータが入力されたら常に唯一のプレースホルダーにAVデータを割り当てるといった形態も、広義の自動選択を行う形態として考えられる。この形態を実施する場合は、実施の形態5のテンプレート自動選択機能を併用して、AVデータのデータ形式と一致するテンプレートを自動選択する機能を提供することが好ましい。
【0136】
(実施の形態7)
図9のステップS908における編集操作の続行を選択する処理も、利用者の選択に基づいて行うのではなく、自動的に行う形態も考えられる。
【0137】
例えば、実施の形態6で示したような、常に唯一のプレースホルダーにAVデータが自動的に割り当てられる形態においては、AVデータが割り当てられた時点で編集処理は終了したと解釈出来るため、ステップS908では無条件にステップS909のシーン記述データ作成処理に進むものとして処理できる。
【0138】
なお、以上述べた実施の形態5〜7のいずれにも該当する形態の場合は、シーン編集のためのユーザ操作は一切必要なくなるため、ユーザ操作101およびユーザ操作入力部102は不要となる。
【0139】
なお、アルバムのデータ形式にMP4フォーマットを用いる場合は、データ交換の際の相互運用性を高めるために、MP4フォーマットの基礎となる仕様を策定したApple Computer社をなどの多くの企業からなる業界団体であるISMA(Internet Streaming Media Alliance)によって定められた、ネットワーク上でいわゆるストリーミングを行うことを前提に最適化されたフォーマットを基本としてデータを作成すると効果的であると思われる。しかし、本明細書の執筆時点でISMAによって標準として定められているMP4のフォーマット仕様 ISMA V1.0(“Internet Streaming Media Alliance Implementation Specification Version 1.0”)では、シーン記述として、MPEG−4 Video形式の動画データ、およびMPEG−4 Audio形式の音声データがそれぞれ一つのみがシーン領域全体に配置されているだけの極めて単純なBIFSデータのみを許可している。
【0140】
そのため、本発明の構成は、撮像と同時にISMA V1.0に準拠したMP4形式ファイルを自動的に作成するといった目的にも適用可能である。
【0141】
なお、ISMAの将来の仕様では、より複雑なシーン記述がサポートされると思われる。しかしその場合でも、本発明のシステム構成に従えば、シーン編集部分に限っては、複雑なシーン記述がサポートされた場合であっても基本構成を大幅に変更することなく対応可能である。
【0142】
(実施の形態8)
電子アルバム作成装置に供給されるシーン記述テンプレート104のデータ形式は、図4〜図6および図7で示されるようなVRMLに基づく形式以外のものも考えられる。
【0143】
ひとつの有力な形態として、シーン記述テンプレートをXML形式で記述するといった形態が考えられる。特に、MPEG−4においては、XMT(eXtensible MPEG−4 Textual Format)と呼ばれる、BIFSをXML形式で記述するためのデータ形式がISO/IEC 14496−1の拡張規格として定められている。このXMTをシーン記述テンプレートとして用いることにより、BIFSと完全に一致する表現を、標準規格として定められたテキスト形式によって記述、編集することが可能になる。
【0144】
(実施の形態10)
アルバムデータ113のデータ形式および符号化形式は、MPEG−4に限らず、AVデータおよびその配置・挙動を記述し、多重化することが可能な形態であれば、どのような形式であっても良い。
【0145】
具体例を挙げれば、Macromedia社によって仕様が定められ、現在パーソナル・コンピュータを中心に多くの処理系でサポートされているマルチメディアデータ形式である”Flash”(登録商標)を用いるといった形態が考えられる。
【0146】
Flashは、国際標準規格ではないものの、BIFSと同様に、イベント処理などのインタラクティブな表現を記述することが可能であり、BIFSに類似するシーン記述機能を持ったフォーマットとしては、現状ではむしろMPEG−4よりも普及している。また、Flashのデータの内容は、拡張子”.swf”のファイルとしてMP4フォーマットと同様に多重化することが可能である。このswfファイルフォーマットも、ISMAで定められるようにストリーミング配信に最適化されている。以上の特性から、Flashは本発明に適用するには好適なフォーマットであると言えよう。
【0147】
ただし、Flashの場合は、シーン記述テンプレート104の記述に用いることができるような標準的なテキスト形式のフォーマットは定義されていない。したがって、Flash形式でサポートされる表現をテキスト形式で記述することが可能なデータ形式を何らかの形で定義し、その形式でテンプレートを記述しなければならない。
【0148】
(実施の形態11)
シーン記述テンプレート104は、テンプレートの一部を構成するAVデータ106がある場合は、シーン記述テンプレート104の一部として同時に供給されても良い。例えば、図3における背景画像book.jpgなどは、テンプレートの一部として供給されるのが適切であろう。
【0149】
また、シーン記述テンプレート104とAVデータ106といった複数のファイルを一度に供給する際には、容易に供給できるようにするため、シーン記述テンプレート104および構成ファイル群をZIP、LZHといったアーカイブファイル形式の単一ファイルとして、まとめて供給するといった形態も考えられる。
【0150】
ただし、この場合アーカイブファイル中に含まれるファイルを参照、更新するためには、シーンエディタ105はアーカイブファイルを解凍し、個々のファイルにアクセスするための手段を備えていなければならない。
【0151】
(実施の形態12)
図1に示される各構成部は、必ずしも同一の装置内に存在するとは限らない。本発明は、図23のように、構成部が複数の装置に配置され、各装置が通信手段を用いて連携することによって実現されても良い。図23は、本発明を複数の装置によって実施される場合の構成例である。
【0152】
図23において、2301はデジタルカメラ、2302はパーソナルコンピュータ、2303はインターネット上のサーバを示している。このような機器構成で、例えばデジタルカメラ2301ではAVデータ入力部102に相当する機能のみを提供し、その他の機能はすべてパーソナルコンピュータ2302で提供されるといった形態も考えられる。
【0153】
この形態によれば、デジタルカメラ2301には撮像手段およびパーソナルコンピュータ2302との通信手段のみを備えたごく一般的なデジタルカメラの機能を備えたもので充分であること、また、編集処理や符号化処理などの負荷が大きい処理は、概して処理速度や使用できる資源の制約が少ないパーソナルコンピュータ2302上で行えることから、最も現実的な形態のひとつであると言えよう。
【0154】
また、デジタルカメラ2301およびパーソナルコンピュータ2302は、通信手段を介してサーバ2303からシーン記述テンプレート104をダウンロードしたり、アルバムデータ113をアップロードするといった形態も考えられる。一般的には、サーバ2303との通信はパーソナルコンピュータ2302によって行う形態がより現実的であると考えられる。
【0155】
しかし、デジタルカメラ2301がインターネット・プロトコルを用いてサーバ2303と通信を行うという形態も非現実的というわけではない。本明細の執筆時点でも、CCDカメラで撮影した画像を電子メールで送付することが可能な携帯電話端末も広く流通していることから、現実のシステムに充分適用可能な形態であると言えるだろう。
【0156】
(その他の実施形態)
AVデータ入力部103は、デジタルカメラ、スキャナ等を構成する撮像装置、あるいはマイクロフォンなどの集音装置の形態をとる場合が一般的であるが、AVデータがデジタルデータの形式で入力する形態も考えられる。その場合は、AVデータ入力部103は単純に入力されたデータを保持するための機能のみが提供される。
【0157】
AVデータ106は静止画や動画、音声等の他に、ベクター・グラフィックなどが含まれる形態も考えられる。また、別のアルバムがAVデータとして入力される形態もありえる。
【0158】
なお、BIFSを用いてシーン記述を行う場合、別のアルバムはinlineと呼ばれるノードを用いてURLによって参照可能であるため、他のAVデータ形式同様にシーン記述テンプレートで使用することが可能である。また、上記実施の形態では、拡大表示や縮小表示などオブジェクトの大きさを変える挙動について説明したが、ほかに、例えば、オブジェクトの色や形を変える形態もあり得る。
【0159】
また、上記の各種処理を行うソフトウェアは、CD−ROM、フロッピー(登録商標)ディスクなどの記録媒体を介して提供される形態となっていても、ネットワーク等の通信媒体を介して提供される形態となっていても、必要に応じてメモリー、ハードディスク等の記憶装置上にコピーして利用できるような形態となっていても良い。
【0160】
また、上記実施形態では、ネットワークを構成するハードウェア等が含まれるものの、各処理部は実際はソフトウェアで実現できるものである。即ち、本発明の目的は、上述した実施の形態の機能を実現するソフトウェアのプログラムコードを記録した記憶媒体(または、記録媒体)を、システムあるいは装置に供給し、そのシステムあるいは装置のコンピュータ(または、CPUやMPU)が、記憶媒体に格納されたプログラムコードを読み出し、実行することによっても達成されることは言うまでもない。この場合、記憶媒体から読み出されたプログラムコード自体が、上述した実施の形態の機能を実現することになり、そのプログラムコードを記憶した記憶媒体が本発明を構成することになる。
【0161】
また、コンピュータが読み出したプログラムコードを実行することにより、上述した実施の形態の機能が実現されるだけでなく、そのプログラムコードの指示に基づき、コンピュータ上で稼働しているオペレーティングシステム(OS)等が、実際の処理の一部または全部を行い、その処理によって、上述した実施の形態の機能が実現される場合も含まれることは言うまでもない。
【0162】
さらに、記憶媒体から読み出されたプログラムコードが、コンピュータに挿入された機能拡張カードやコンピュータに接続された機能拡張ユニットに備わるメモリに書き込まれた後、そのプログラムコードの指示に基づき、その機能拡張カードや機能拡張ユニットに備わるCPU等が、実際の処理の一部または全部を行い、その処理によって、上述した実施の形態の機能が実現される場合も含まれることは言うまでもない。
【0163】
また、従来の方法ではシーン記述データからAVデータが正しく参照されるよう、アルバム作成者は注意深くアルバムの配布を行わなければならなかったが、この上記実施の形態で提供されるような電子作成方法を用いることで、シーン記述データ107およびAVデータ106は、多重化され、最終的にアルバムデータ113として単一のファイルとして出力される。それによって、アルバムを安全かつ容易に伝送・配布するとことが可能となる。
【0164】
また、上記実施の形態の電子作成方法を用いることで、アルバム作成者はオブジェクトの動きなどの複雑な記述を一切行うことなく、AVデータを選択し、プレースホルダーを指定するといった、きわめてシンプルな2つの操作の繰り返しのみで、表現豊かな電子アルバムを簡単に作成することが可能となる。
【0165】
オブジェクトの動き、とりわけ時間に応じた属性の変化をともなう動きを指定することは、図4〜図6が示す通り複雑でわかりにくいものである。仮に、アルバム作成アプリケーションで、動きの詳細を設定することが可能な設定画面などの手段が提供されていたとしても、使いこなすことは簡単ではないと思われる。しかし、上記実施の形態の方法では、オブジェクトの動きに関する編集操作はまったく必要としないため、編集作業の習得や編集作業自体にかかる負荷を軽減することが出来る。
【0166】
また、オブジェクトの挙動や時間的配置情報もあらかじめテンプレートに組み込んでおくことによって、それらの情報を設定、変更するための機能を編集モジュールで提供する必要がなくなるため、編集モジュールの実装を簡素なものにすることが出来る。上記実施の形態の編集モジュールは、AVデータのアドレス情報に対してのみデータの編集処理を組みこめば済むため、サイズが小さく、少ない資源で動作させることが可能な編集モジュールが実現できる。この点は、携帯端末やデジタルカメラ等のように、メモリ容量や入力インターフェース、表示デバイスなど使用出来る資源に制約のある環境に対して編集モジュールを実装する場合には、とりわけ有効であろう。
【0167】
無論、パーソナル・コンピュータのように資源に余裕のある環境では、必ずしも上記実施の形態で述べているような形態に固執する必要はなく、環境に応じた実装を行っても良い。例えば、マウスを利用できる場合は、プレースホルダーの位置にAVデータを指定する操作などは、AVデータを示すアイコンをプレースホルダーにドラッグ・アンド・ドロップするといった方法で実現する方が適切であろう。
【0168】
また、シーン記述テンプレートが図4〜図6などで示されるVRML形式のようにテキスト形式で表現されていれば、利用者にテンプレートを提供するデザイナーは、テキストエディタなどの一般的なツールを用いてテンプレートを作成することが出来るため、特殊なデザインツールを準備し、提供する必要がなくなる。
【0169】
上記実施の形態ではVRMLのような既存の記述言語を用いてテンプレートを記述しているため、一般的に流通しているVRMLビューアを用いれば、特別な符号化処理を行わなくても表示内容を確認することが可能である。
【0170】
また、電子アルバムは標準規格であるMP4フォーマットとして出力されるため、特定のアルバム再生用アプリケーションによらずとも広範囲の機器で閲覧、再生することが出来るようになっている。この点は、インターネットを介して不特定の閲覧者にアルバムを配布するようなケースでは特に有効である。
【0171】
【発明の効果】
以上のように、本発明によれば、電子アルバムを、作成する側にとっての負担が少なく、かつ、配布しやすい形式で作成することが可能となる。
【図面の簡単な説明】
【図1】本発明による電子アルバム作成装置の構成例を示す図である。
【図2】本発明の一実施形態であるデジタルカメラの構成例を示す図である。
【図3】電子アルバムの表示イメージを示す図である。
【図4】図3の電子アルバムをBIFSのテキスト表現形式で記述した例を示す図である。
【図5】図3の電子アルバムをBIFSのテキスト表現形式で記述した例を示す図である。
【図6】図3の電子アルバムをBIFSのテキスト表現形式で記述した例を示す図である。
【図7】本発明のシーンエディタ105で行われる、シーン記述テンプレート104とAVデータ106のアドレス情報を元にしたシーン記述データ作成処理の概略を示す図である。
【図8】図3の電子アルバムにAVデータが指定される前後の表示イメージを示す図である。
【図9】シーンエディタ105で行われるシーン記述データ作成処理の手順を示すフローチャートである。
【図10】処理選択メニュー画面のイメージを示す図である。
【図11】テンプレート選択画面のイメージを示す図である。
【図12】アルバム編集画面のイメージを示す図である。
【図13】電子アルバムに音声データが用いられる際の注意点を説明するための図である。
【図14】アルバム中のオブジェクトが自律的に動き回る電子アルバムの表示イメージを示す図である。
【図15】図14の電子アルバム中のオブジェクトの動きを説明するための図である。
【図16】図14の電子アルバム中の再生時のイメージを示す図である。
【図17】図14の電子アルバムをBIFSのテキスト表現形式で記述した例を示す図である。
【図18】図14の電子アルバムをBIFSのテキスト表現形式で記述した例を示す図である。
【図19】図14の電子アルバムをBIFSのテキスト表現形式で記述した例を示す図である。
【図20】図14の電子アルバムをBIFSのテキスト表現形式で記述した例を示す図である。
【図21】シーン記述テンプレート107の記述例を示す図である。
【図22】URLに対応する値をアドレス情報として用いた場合の、シーン記述テンプレート107の記述例を示す図である。
【図23】本発明を複数の装置によって実施される場合の構成例を示す図である。
【発明の属する技術分野】
本発明は、画像データを用いた電子アルバム作成装置、電子アルバム作成方法及びプログラムに関するものである。
【0002】
【従来の技術】
写真やビデオ映像、音声などを、デジタル形式のデータとして記録し、再生するための機器が広く流通するようになってきた。そうした背景から、利用者がデジタルカメラなどの機器で撮影したデジタル画像を、電子メールやインターネット上のサーバを介して交換するといったことが日常的に行われるようになった。
【0003】
その背景には、情報符号化技術、圧縮技術等の情報処理技術の発達に加えて、デジタルデータをあまねく機器間で交換出来るようデータの記録形式を汎用的な標準規格として定めるといった標準化活動が行われてきたことが大きな功績を果たしていると言えるだろう。
【0004】
例えば、静止画像の領域では、JPEG(ISO/IEC 10918,“Digital Compression and Coding of Continuous−tone Still Images”)、PNG(World Wide Web Consortium, Portable Network Graphics)、動画形式ではMPEG−1 Video(ISO/IEC 11172−2,“Information technology− Coding of moving pictures and associated audio for digital storagemedia at up to about 1.5 Mbit/s−Part2:Video”)、MPEG−2 Video(ISO/IEC 13818−2,ITU−T H.262,“Generic coding of moving and associated audio information−Part2:Video”)、MPEG−4 Video(ISO/IEC 14496−2,“Information technology−Generic coding of audio−visual objects−Part2:Visual”)、上述のJPEGを動画表現に応用したMotion JPEGなどがある。
【0005】
音声形式では、MPEG−1 Audio(ISO/IEC 11172−3,“Information technology−Coding of moving pictures and associated audio for digital storagemedia at up to about 1.5 Mbit/s−Part3:Audio”)の一種であるMP3(MPEG−1 Audio Layer 3)、AAC(ISO/IEC 11172−7,Information technology−Generic coding of moving pictures and associated audio information−Part 7:Advanced Audio Coding(AAC))などがある。
【0006】
上記をはじめとする様々な規格に対応する多くの機器が流通することによって、利用者の間で映像・音声がデジタル化されたAVデータを容易に交換出来るようになった。
【0007】
通常、これらのAVデータを入出力する機器では、それぞれの機器で記録単位とするデータは何らかのファイルシステム上のファイルとして作成される。その記録単位は、例えばデジタルスチルカメラであれば一枚の画像となるし、動画、音声の場合は記録開始時から終了時までの内容となる。
【0008】
これらのAVデータを記録したファイルは、単独で利用されることもあるが、異なる種類の複数のデータファイルが一覧出来るように作成されたデータと併用することで、あたかも銀塩写真をアルバムに整理して見るような利用方法もごく普通に行われている。以下、このように複数のAVデータが集約されたいわゆる電子形式のデータを、銀塩写真のアルバムにならって、電子アルバムと記述する。
【0009】
電子アルバムの典型的な例が、良く知られるHTML(Hypertext Markup Language)などのマークアップ言語で記述される文書である。HTMLでは、アルバムに含めるAVデータファイルのURL(Uniform Resource Locator)のようなアドレスを示す「アドレス情報」と、そのAVデータが画面上に表示される位置等のような「空間的配置」情報を記述することが出来る。HTMLを用いて記述された文書は、HTMLを解釈可能なブラウザで閲覧することで、記述されている空間的配置どおりにAVデータがレイアウトされた電子アルバムとして観賞することが出来る。
【0010】
HTMLは、テキスト形式で記述されているため編集作業が容易であるという点や、事実上の標準規格であり、インターネットにアクセスすることが出来るほとんどの機器にHTMLを解釈できるブラウザ・ソフトウェアが標準搭載されているため、特定のアルバム再生アプリケーションを使用しなくても閲覧が可能であるといった点から、広く一般的に利用されている。
【0011】
こういった電子アルバムの作成・編集を簡単に行うための方法については、これまでに多くの公知の提案がなされている。その代表的なものが、表示位置などの空間的情報をあらかじめ定義したテンプレートを用いてデジタル画像を配置するといったものである(例えば、特許文献1参照)。
【0012】
また、入力画像に応じて適切なテンプレートを自動選択するもの(例えば、特許文献2参照)や、テンプレートの記述内容に応じて入力画像の配置を自動的に調節するもの(例えば、特許文献3参照)などの提案もなされている。アルバムに取り込まれるデータの形式も、静止画像に加えて、動画などを用いるようにする提案もされている(例えば、特許文献4参照)。また、デジタルカメラから直接HTML形式のアルバムを生成するといった提案もされている(例えば、特許文献5参照)。
【0013】
現在までに、上記のようなテンプレートを用いた方法によって、電子アルバムを簡単な操作で作成することが出来る多くのアプリケーション・ソフトウェアが発売・公開されてきた。これらのソフトウェアのいくつかは、アルバムをそのアプリケーション固有のデータ形式で出力する機能に加え、より一般的な環境で閲覧出来るようアルバムをHTMLなどの標準形式で出力する機能もサポートされている。
【0014】
【特許文献1】
特開平09−190546号公報
【特許文献2】
特開平10−293856号公報
【特許文献3】
特開平11−353466号公報
【特許文献4】
特開2000−172673号公報
【特許文献5】
特開2000−357169号公報
【0015】
【発明が解決しようとする課題】
しかしながら、このような電子・アルバムを作成する際には、不便な点もある。
【0016】
第一に、複雑な表現が可能になったことによって、アルバムを記述する側にも記述方法に関する多くの知識と、記述作業に関するより多くの手間が必要となり、作成する側に負担が強いられる。HTMLにおける空間表現に加えて、時間的表現やインタラクティブな表現に関しても記述しなければならないため、アルバムの作成者が鑑賞に堪えうるアルバムを完成させるまでにはより多くの時間が必要になってしまうこともある。
【0017】
例えば、表現内容を確認しながら試行錯誤でアルバムを記述していく場合、HTMLの場合は、AVデータが正しい位置に配置されているかどうかという空間的要素のみに着目して作業を行えばよいのに対して、時間的要素やインタラクティブな要素が加わると、それだけ試行錯誤の回数が増加してしまい、作成にかかる時間も増大してしまうであろう。それは、手作業で記述するにしても、何らかの編集ツールを用いて作成するにしても同じである。
【0018】
また、記述すべき情報の種類も多くなるため、作成者が記述内容を直接書き換える場合には、その内容に関する知識を習得するまでにはより多くの時間が必要となる。何らかの編集ツールを用いる場合でも、同様にツールで提供される編集操作を習得する時間が要求されるし、加えて、ツール自体も複雑で大きなものになってしまい、入力や表示のためのインターフェースや使用可能な記憶装置などのリソースが限られている機器では実現不可能なものとなってしまう恐れがあるため、別途PC等の機器を併用して作業を行なうコストを作成者に強いることになりかねない。
【0019】
第二に、HTMLなどの記述フォーマットを用いる場合、AVデータの実体は別ファイルとして存在し、URLなどのアドレス情報によって外部データを参照するという特性ゆえに、アルバム自体が取り扱いにくいものとなってしまうという問題がある。
【0020】
周知の通り、URLを用いて外部ファイルを参照する場合は、URLが示す位置に参照されるファイルが存在しなければ正しく参照することは出来ない。したがって、作成されたアルバムを配布するような場合には、参照される全てのファイルが欠落することなく、かつ、ファイル群の構造が正しく保たれていることが保証された状態で配布されなければならない。
【0021】
URLを利用した外部参照は、参照されるデータの内容を変更するような場合でも参照する側の内容を変更する必要がないという点では優れているが、現実に多くのWebページで、ハイパーリンクの参照先が存在しないケースが見受けられることからも、取り扱いにはそれ相当の注意を要することは想像に難くない。
【0022】
また、配布手段によっては、ファイル構造が正しく保たれないか、あるいは注意を必要とするケースも存在する。例えば、アルバムを構成するファイル群を電子メールの添付ファイルとして配布する場合、受信側で添付ファイルが格納される位置はアルバムに記述されたURLとは必ずしも一致しないため、配布されたアルバムは正しく表現されるとは限らない。また、アルバムをインターネット上のサーバに配置して公開する場合は、FTP(File Transfer Protocol)などの転送手段を用いてファイル群をサーバ上に転送する際に、転送先のサーバ上で正しいファイル構造が再現されるよう注意深く転送しなければならない。
【0023】
このように、ネットワークを介してアルバムデータを伝送、配布するケースでは、正しく再生できることが保証されないか、あるいは、正しく再生できるようにするために配布する側に負担をかけてしまうという問題がある。
【0024】
以上述べたような問題が存在することにより、従来の手法によれば、表現力が高く配布しやすい電子アルバムを作成することは、作成者にとって負担が大きいものであった。
【0025】
本発明は、上記の課題に鑑みてなされたものであり、電子アルバムを、作成する側にとっての負担が少なく、配布しやすい形式で作成することが可能な電子アルバム作成装置、電子アルバム作成方法及びプログラムを提供するものである。
【0026】
【課題を解決するための手段】
上記の目的を達成するために、本発明における電子アルバム作成装置は、シーンを構成するオブジェクトの空間的配置と時間的配置とを記述したシーン記述テンプレートを保持する保持手段と、前記オブジェクトの1つである画像データを入力する入力手段と、前記シーン記述テンプレートのプレースホルダーに前記画像データの位置情報を設定することによりシーン記述データを生成する生成手段と、前記シーン記述データと前記画像データとを多重化する多重化手段とを有することを特徴とする。
【0027】
また、上記の目的を達成するために、本発明における電子アルバム作成方法は、シーンを構成するオブジェクトの空間的配置と時間的配置とを記述したシーン記述テンプレートを保持する保持工程と、前記オブジェクトの1つである画像データを入力する入力工程と、前記シーン記述テンプレートのプレースホルダーに前記画像データの位置情報を設定することによりシーン記述データを生成する生成工程と、前記シーン記述データと前記画像データとを多重化する多重化工程とを有することを特徴とする。
【0028】
【発明の実施の形態】
以下、本発明の実施の形態について、図面を参照しながら詳細に説明する。
【0029】
図1は、本発明の電子アルバム作成装置の実施形態のシステム構成を示すブロック図である。なお、このシステム構成は本発明を実現するために取りえるひとつの構成例に過ぎない。本発明の意義を充足する限りにおいては、システムの各構成部は任意に再編、統合、分離、再配置出来るものとする。さらに、各構成部の制御方法は、ソフトウェア、ハードウェアの何れの手段によって実現されても良いものとする。
【0030】
図1における実施形態において、電子アルバム作成装置の利用者による各種操作はユーザ操作101として、ユーザ操作入力部102を介することによって入力される。AVデータ入力部103は、静止画像や動画像、音声などを入力し、デジタル形式のAVデータとして装置内部に取り込むためのものである。
【0031】
シーン記述テンプレート104は、電子アルバムを構成するシーンに含まれるAVデータの空間的、時間的配置およびその挙動のみが記述されているデータである。シーン記述テンプレート104にはAVデータ106の実際の位置を示すアドレス情報は一切含まず、のちに作成されるシーン記述データのテンプレートとして用いられる。
【0032】
シーンエディタ105は、上述のシーン記述テンプレート104とAVデータ106とを合成し、合成された結果を編集してシーン記述データ107として出力する。シーン記述テンプレート104で記述される内容は、AVデータのアドレス情報が欠落しているため、最終的に作成されるシーンの内容とは必ずしも一致するものではない。シーンエディタ105はシーン記述テンプレート104で欠落しているAVデータ106のアドレス情報を補完し、完全なシーンの内容が記述されたデータを作成するためのモジュールである。また、シーンエディタ105は、AVデータ106をシーン記述テンプレート104にどのように配置するかを指定するため、あるいはシーンに対するその他編集処理を行うため、ユーザ操作入力部102から入力されるユーザ操作101を受け取る場合もある。
【0033】
シーン記述エンコーダ108は、シーン記述データ107の内容をいわゆる「オブジェクトベース符号化」形式におけるシーン記述に対応する形式に符号化し、結果としてシーン記述ストリーム110を出力する。同様に、AVエンコーダ109は、シーン記述エンコーダ108と同様にAVデータ106の内容をオブジェクトベース符号化形式におけるAVデータに対応する形式に符号化し、AVストリーム111を出力する。
【0034】
なお、シーン記述エンコーダ108およびAVエンコーダ109では、符号化処理に加えて、データ形式の変換、あるいは付加情報の符号化処理なども並行して行われる場合がある。一例を挙げれば、前者は入力されたデータが出力されるオブジェクトベース符号化形式ではサポートされない形式であるような場合や、圧縮が不十分あるいは圧縮されていないような場合、もしくは入力データの品質がよくないような場合に、適切な再符号化や再圧縮、品質改善のためのデータ処理などを行うといった処理に相当する。後者は、複数のAVデータが同期して再生するための同期情報を付与するといった処理が典型例であろう。
【0035】
マルチプレクサ112は、オブジェクトベース符号化形式で符号化されたシーン記述ストリーム110およびAVストリーム111を多重化し、両者が統合された単一のアルバムデータ113を出力する。このアルバムデータ113は、最終的に配布対象となる電子アルバムを示すものである。
【0036】
表示部114は、上述の各構成部によって行われた操作や処理の内容、データの内容を利用者に対して表示するためのものである。通信部115は、何らかの通信手段を介して、装置の外部からユーザ操作101を入力したり、図中の各種データを入力あるいは外部に出力するために用いられる。データ処理部116は、少なくとも、CPU、テンプレートを保持しておくメモリ、ソフトウェアを保持しておくROM、アルバムデータを保持しておく大容量記憶媒体、例えばハードディスクを有しているものである。
【0037】
なお、図1において、データ処理部116が、本発明で示される電子アルバムを構成するために最低限必要な構成部となっている。言い換えれば、ユーザ操作101、ユーザ操作入力部102、AVデータ入力部103、表示部114、通信部115は、全ての実施形態において必ずしも存在するとは限らない。
【0038】
続いて、本発明の特徴について簡単に述べる。
【0039】
本発明では、本来のシーン記述のデータから、参照されるAVデータの実体を示すアドレス情報を除いたデータをシーン記述テンプレート104としてあらかじめ用意しておく。
【0040】
そして、そのシーン記述テンプレート104中のAVデータの情報を示す部分に、実際のAVデータのアドレス情報を補完したシーン記述データ107を生成し、AVデータ106とともに多重化して、単一のアルバムデータ113を生成することを特徴としている。
【0041】
このように、シーン記述データおよびAVデータを、最終的に単一の多重化ファイルにアーカイブすることにより、シーン記述のフォーマットがURLなどによる外部参照を行うようなフォーマットであっても、データ同士の参照関係が損なわれることなく安全・確実に伝送・配布することが出来る電子アルバムを生成することが可能になる。
【0042】
以下、本発明の実施の形態について、いくつか具体例を挙げて説明する。
【0043】
(実施の形態1)
図1のシステム構成をよりわかりやすく示すため、現実の装置への適用例として、図1のシステム構成を適用して実装されたデジタルカメラの実施例を図2に示す。
【0044】
図2のレンズ201、マイクロフォン202は、それぞれ映像、音声を入力するための部分で、AVデータ入力部103に相当する。レンズ201およびマイクロフォン202からの入力は内部的にデジタルデータに変換され保存されると仮定する。
【0045】
シャッターボタン203、メニューボタン204、キーパッド205はユーザ操作入力部102に相当する。各ボタンが押された時の動作として、メニューボタン204には利用者が行うことが出来る操作内容を列記するメニュー画面の出力、キーパッド205には画面上で利用者が行うことが出来る操作を選択する領域の移動、シャッターボタン203には、映像および音声の記録操作に加え、画面上で選択された操作の決定といった動作が割り当てられていると仮定する。
【0046】
ディスプレイ206は表示部114に相当し、撮影された映像等の内容やメニュー画面、電子アルバムを編集するための操作画面などが表示されるものとする。
【0047】
カードスロット207は、外部とデジタルデータの交換を行うため、データが記録された揮発性メモリーカード等の装置の着脱を行うためのものである。通信ポート208も同じく外部とのデータ入出力を行うための通信手段を提供するインターフェースである。通信ポート208で提供される通信方式は、USB(Universal Serial Bus)のような有線通信であっても、Bluetoothのような無線通信であっても良い。また、カードスロット207には、PHSカードのような通信装置を装着してデータ通信を行う形態もありえる。ゆえに、広義ではカードスロット207、通信ポート208のいずれも通信部115に相当すると言える。
【0048】
図2記載のカメラは、撮影した映像、音声を電子アルバムとして編集するための簡易アプリケーションが搭載されており、作成されるアルバムデータ113はファイルとしてカードスロット207、通信ポート208等を介して取得可能であると仮定する。
【0049】
なお、本実施の形態で用いられるオブジェクトベース符号化形式は、ISO(International Organization for Standardization)により標準規格化されているMPEG−4(ISO/IEC 14496)を用いるものとして説明を行う。
【0050】
すなわち、シーン記述ストリーム110は、MPEG−4 Systems(ISO/IEC 14496−1)によって規格化されたMPEG−4におけるシーン記述形式であるBIFS(Binary Format for Scene)形式のストリームデータとなる。このBIFSは、三次元空間の記述形式として知られるVRML (ISO/IEC CD 14772−The Virtual Reality Modiling Language)を拡張したものとして規定されており、伝送や記録が効率的に行えるようにバイナリ形式で符号化されるといった特徴を持つフォーマットである。
【0051】
VRMLおよびBIFSでは、HTMLで記述されるような「空間的配置」情報の記述に加えて、AVデータが表示あるいは消去されるタイミングを記述したり、時間の経過に応じて表示位置などの属性を変化させたりといった時間的な情報の記述が可能になっている。以下、このような時間的な情報を、前述の空間的配置という表現に対応させ、「時間的配置」と表す。
【0052】
また、VRMLおよびBIFSでは、画面上に配置されているAVデータが、マウスなどのポインティング・デバイスで選択された時にどのような動作を行うかといった「挙動」を記述することも仕様の一部としてサポートされている。
【0053】
その他、VRMLが提供する三次元空間表現やベクターグラフィックによる図形表現などのより高度な空間表現も提供されている。
【0054】
これらの機能を用いて、AVデータの「空間的配置」、「時間的配置」、および「挙動」が定義されたシーンの情報を電子アルバムに記述することで、AVデータがアルバム上で表示位置を変えながら動いたり、閲覧者がアルバム上のAVデータを選択するとそのAVデータが動き出すといったような、より豊かでインタラクティブなアルバムを表現することが出来る。
【0055】
本実施の形態では、上記の機能を活用して、多彩な表現を持ったアルバムを作成する場合を例にとって説明していく。
【0056】
また、出力されるアルバムデータ113は、MPEG−4 Systems(ISO/IEC 14496−1)におけるファイル形式として規格化されているMP4フォーマットであるものとしている。このMP4フォーマットでは、シーン記述データと参照されるAVデータとを多重化してひとつのファイルとして記録するための方法についても規格化されており、本実施の形態ではこの多重化方法にしたがってアルバムデータ113を生成するものとする。
【0057】
このアルバムデータ113は、最終的に他の機器に伝送・配布されるものであるため、多くの機器で正しく表示出来るよう、標準フォーマットやそれに準ずる一般的なフォーマットで出力されることが望ましい。本実施の形態で用いられているMP4フォーマットは、国際標準規格として定められたフォーマットである。本明細書の作成時点では、Apple Computer社のQuickTime Player(登録商標)やNTTドコモ社の移動体通信サービスであるFOMA(登録商標)に対応した動画再生機能付きの機器でサポートされており、今後さらに普及することが見込まれている。
【0058】
続いて、本実施の形態の電子アルバム作成装置で作成することが出来るアルバムの一例を図3に示す。
【0059】
図3の301で示される領域全体が電子アルバムである。その内部には静止画像を表示する領域302、303、304が配置されており、それぞれの領域には静止画ファイルphoto1.jpg、photo2.jpg、photo3.jpgの内容が表示される。その背後には、アルバムの台紙を表現した静止画ファイルbook.jpgの内容が領域301全体に背景画像として表示されている。このような形で、それぞれの静止画の「空間的配置」情報がアルバムに記述されているものとする。
【0060】
さらに、このアルバムには、領域302、303、304を何らかのポインティングデバイスを用いて画面上で選択すると、「それぞれの領域に表示されている内容が、現在表示されている位置から、領域305の位置に移動して拡大表示され、のちに、元の位置に縮小しながら移動する」といった「挙動」が記述されているものとする。
【0061】
また、選択された内容は、0.5秒間で大きさ、位置を変化させながら領域305に移動し、領域305に4秒間表示された後、再び0.5秒間で縮小しながら元の位置に戻るといった時間軸をともなうアニメーション表示を行うよう、拡大・縮小時の動作の「時間的配置」が記述されている。
【0062】
このように、アルバムには表示されるデータの「挙動」および「時間的配置」も定義されているものとする。
【0063】
図3のアルバムの内容は、図4〜図6に示されるシーン記述で表現することが出来る。図4〜図6は、図3で示されるシーンの内容をBIFSに相当する形式で記述したものであり、図4の次に図5が続き、図5の次に図6が続く。BIFSはバイナリ形式のデータであるため実際の符号化データはこういったテキスト形式では記録されないが、BIFSはVRMLを元にした形式であるため、図4〜図6ではVRMLの記法を元にしたテキスト形式で表現している。
【0064】
VRMLのようなテキスト形式のフォーマットは、人間が解釈することを前提として、英単語や恣意的な記号などを用いて表現内容を言語として記述するようになっているため、これらのフォーマットを用いて記述された内容は、テキストエディタなどの一般的なツールを用いて容易に編集することが可能である。それに対し、BIFSのようなバイナリ形式のフォーマットは、テキスト形式と比較して小さなサイズとなるので、効率的に伝送や記録が行える。
【0065】
したがって、本実施の形態では、シーン記述テンプレート104およびシーン記述データ107はデザイナーがテンプレートを容易に作成、編集できるようにVRMLに基づくテキスト形式の表現で記述し、シーン記述ストリーム110は最終的なアルバムのフォーマットであるMP4で規定される仕様に基づき、バイナリ形式のBIFSデータとして記録するものとしている。
【0066】
以下、このシーン記述の要点についてのみ簡単に説明する。なお、記述内容を詳細に渡って説明することは本発明を説明するためには不要と思われるため省略する。
【0067】
図4〜図6のシーン記述では、それぞれの画像はURLを用いて参照されている。その内容をShapeと呼ばれるオブジェクトの形状を記述するノード内で、ImageTextureと呼ばれるノードを用いて、Bitmapと呼ばれる図形オブジェクトに貼り付けることを指示している。さらに、貼り付けられたオブジェクトを拡大、縮小するための倍率scale、所定の座標位置に配置するためのtranslationと呼ばれる属性値によって表示時のサイズ、位置が指定されている。
【0068】
なお、VRMLでは画面の中心を原点とするいわゆる三次元ワールド座標が用いられているため、座標系は通常の二次元座標とは異なっている。その上で、各画像ファイルの大きさが640×480ピクセルの場合、表示結果は図3のレイアウトと一致する。
【0069】
加えて、ポインティングデバイスによる選択操作を検出し、イベントを発生させるセンサーオブジェクトTouchSensor、拡大・縮小が行われる間の計5秒間のオブジェクトの位置および表示倍率の変化を定義するPositionInterpolator2D、5秒間の間に周期的にタイマーイベントを発生させるタイマーオブジェクトTimeSensor、そして、TimeSensorやTouchSensorから発生したイベントを、PositionInterpolator2DおよびBitmapオブジェクトなどのオブジェクトへ受け渡すルートを定義するROUTEノードによって、図3で示されるシーンが表現されることになる。
【0070】
このROUTEによるオブジェクトの連携動作を簡単に説明する。例えばこのシーン記述では、”photo1.jpg”の静止画を選択すると、その静止画オブジェクトPICT1に対して設定されているセンサーオブジェクトSENSOR1が「オブジェクトを選択された」というイベントを検知すると、そのタイミングで、PICT1の大きさ、位置のアニメーション表示を管理するためのタイマーオブジェクトTIMER1のタイマーを開始させるという連携動作が定義されているが、この両者の関連は、図6の”ROUTE SENSOR1.touchTime TO TIMER1.startTime”という形で記述される。
【0071】
同様にして、TIMER1のタイマーが開始されたら、一定間隔毎に位置、大きさを示す数値を変化させるオブジェクトであるINT1、SCALE1オブジェクトにイベントが通知される。
【0072】
このINT1、SCALE1オブジェクトには、時間に応じた数値の変化量が定義されており、タイマーからイベントが通知されたら、通知された時間に対応する数値をそれぞれPICT1の位置、表示倍率に設定する。
【0073】
以上のように、オブジェクト間の関連を記述しておき、実行時にオブジェクト間が連携動作を行うことによって、図3のように動きのあるアルバムを表現することができる。
【0074】
図4〜図6で示されるように、電子アルバムを作成するためには、多くの属性や時間軸に伴う動き情報、オブジェクトを連携動作させるための情報が記述されなければならない。アルバムを作成する側にとっては、編集時にこれらの情報を逐一設定していくのは、人間であれツールであれ非常に負担が大きなものである。
【0075】
そこで、本発明では、参照されるAVデータの実体を示すアドレス情報を除いたシーン記述のデータをテンプレートとして用意しておき、アドレス情報の部分のみを編集するといったきわめて単純化された編集機能を提供することによって、作成する側の負荷を軽減するようにしている。
【0076】
図7は、本発明の根幹をなすシーン記述の編集処理の内容を図説するものである。
【0077】
シーン記述テンプレート104は、外部参照されるべきAVデータのアドレス情報、すなわちURLが記述されていない状態で作成され、作成装置にあらかじめ供給される。そして、シーンエディタ105は入力されたシーン記述テンプレート104の内容に対して、参照されるAVデータ106(図7の場合、”photo1.jpg”)のURLを埋め込む処理を行って、結果をシーン記述データ107として出力している。
【0078】
上記の処理が、図3のアルバムを扱う場合にシーンエディタ105において行われる際に表示される画面の例を図8に示す。なお、この例では、図3のアルバムの領域302、303、304に記述されるべきURLを含まないシーン記述テンプレート104が、あらかじめ供給されているものと仮定する。
【0079】
シーンエディタ105は、入力されたシーン記述テンプレート104を解析し、外部データを参照するよう記述されているにも関わらずURLが定義されていない部分を検出すると、そのノードは、シーンエディタ105での編集処理時にAVデータが指定される場所である「プレースホルダー」であると解釈し、未定義のAVデータの代わりに何らかの内容を代替表示する。
【0080】
図8の例では、編集操作を行う利用者に対してプレースホルダーの位置にAVデータの指定するよう促す内容を示す画像ファイル801を表示している。そして、利用者の操作によってプレースホルダーの位置にAVデータが指定されたら、指定されたAVデータの内容を表示し、同時に、内部的にプレースホルダーに該当するノードに、指定されたURL情報を設定するといった処理が行われる。
【0081】
引き続き、シーンエディタ105の処理の流れを図9を用いて順を追って説明し、さらに、その他の図を用いて、図9の各ステップの実行時にどのような画面表示が行われるかを例示していく。
【0082】
なお、本発明は画面およびインターフェースに関するものではないので、どのようなインターフェースが用いられても良いものとする。
【0083】
まず、図9は、シーンエディタ105で行われるシーン記述データ作成処理の手順を示すフローチャートである。
【0084】
ステップS901は、シーンエディタ105が処理するシーン記述テンプレート104を選択する。
【0085】
本実施の形態では、メニューボタン203が押下された時に、図10に示されるようなメニュー画面を表示することで、どのような機能を実行するかを利用者に選択させるようにしている。図10は、処理選択メニュー画面のイメージである。図10では、利用者が次に実行するアクションを画面上の選択領域1001で示しているが、選択領域1001を「テンプレートを選択」の位置にあわせて決定すると、図11に示されるようなテンプレートの選択画面が表示される。図11は、テンプレート選択画面のイメージである。図11では、領域1101に使用可能なテンプレートが縮小表示され、領域1102には、選択領域1103によって選択されたテンプレートが拡大表示される。そして、利用者によって選択内容が決定されると、次のステップに進む。
【0086】
ステップS902は、ステップS901で選択されたシーン記述テンプレート104を読み込んで、内容を解析し、シーン記述に含まれるプレースホルダーの位置を検出する。
【0087】
本実施の形態では、図7のシーン記述テンプレート104で示されるような「URLの部分が空のShapeノード」をプレースホルダーとみなすものとしている。プレースホルダーが検出されたら、その位置等の情報を取得し、図8ような初期レイアウトのアルバムを表示する。その際、シーン記述中に含まれるURLは有効ではないため、無効なURLに対しては図8で示されるような代替表示を行うなどの手段で、有効でないURLが使用されていることによる異常な表示や動作が行われることを回避する処理が行われることが望まれる。
【0088】
ステップS903は、ステップS902で検出されたプレースホルダーの位置に配置するAVデータを選択する。
【0089】
本実施の形態では、図12が示すような編集画面を用いて、利用者にAVデータを選択させるものとする。図12は、アルバム編集画面のイメージである。図12の領域1201には、作成装置から参照することの出来るAVデータやその属性情報が表示され、領域1202にはステップS901で選択されたシーン記述テンプレートで表されるレイアウトが表示される。また、ステップS902で検出されたプレースホルダーは、領域1202上の選択領域1003で選択することが可能であるとする。
【0090】
利用者はまず、領域1202上でAVデータを指定するプレースホルダーを選択すると、利用者が操作可能なアクティブな選択領域は、選択領域1203から選択領域1204に変わる。そして、利用者は領域1201上で選択領域1204を操作することで、AVデータを選択する。この選択領域1203および選択領域1204によって、どのAVデータをどのプレースホルダーに配置するかを設定する。
【0091】
AVデータが決定されると、選択領域1203が示すプレースホルダーの位置に選択領域1204で示されるAVデータが貼り付けられて表示される。
【0092】
ステップS904は、ステップS903で指定されたプレースホルダーが、シーン記述テンプレート104のどの位置に対応するかを特定する。
【0093】
ステップS905は、選択されたプレースホルダーに対応するシーン記述の内容をチェックし、選択されたAVデータとシーン記述で指定されているデータ形式が一致しているかチェックを行う。
【0094】
本実施の形態では、プレースホルダーの位置のオブジェクトはいずれも静止画の内容をオブジェクトに貼り付けることを指示するImageTextureノードを用いてURLを指定している。すなわち、プレースホルダーに貼り付けられるAVデータは静止画でなければならず、動画、音声を指定することは出来ない。したがって、ステップS905では指定されたAVデータのデータ形式とシーン記述が指定するデータ形式との比較を行い、データ形式が正しいかどうかチェックを行っている。
【0095】
なお、AVデータ形式をチェックするには、データの内容を解析してフォーマットを特定する方法と、ファイル名の拡張子などからフォーマットを推定する方法の二通りが考えられるが、いずれの方法が用いられても良い。
【0096】
ステップS906は、ステップS905においてデータ形式が一致しなかった場合は、AVデータを貼り付けることが出来ない旨を利用者に通知するエラー処理を実行し、ステップS903に戻る。
【0097】
エラー処理がどのように行われるかはシステムの仕様によって異なるためここでは規定しないが、画面表示を行う場合は何らかのエラーメッセージを表示するか、あるいは何も行わないといった処理が一般的であると考えられる。
【0098】
ステップS907は、ステップS905においてデータ形式が一致した場合は、選択されたAVデータのURLをシーン記述テンプレートのプレースホルダーの位置に設定する。
【0099】
また、本実施の形態では、AVデータが設定されたことを示すため、プレースホルダーの位置に選択されたAVデータの内容を表示する処理も行っている。
【0100】
ステップS908は、編集処理を継続するかどうかをチェックする。継続する場合はステップS903に戻り、編集処理を終了する場合はステップS909に移る。
【0101】
本実施の形態では、図10のメニュー画面で「アルバムを保存」を選択することで、ステップS909の処理に移行する。
【0102】
ステップS909は、ステップS907でURL情報が書き換えられたシーン記述データの内容を、シーン記述データ107として出力する。
【0103】
本実施の形態では、図7のシーン記述データ107で示されるように、シーン記述テンプレートには設定されていなかったURLが埋められた形のシーン記述データが出力されるものとする。また、プレースホルダーにAVデータが指定されずにシーン記述データ107の出力を行う場合には、URLが設定されていない状態のままとなり後続の処理が正しく動作しない恐れがあるため、本実施の形態ではそのようなAVデータが設定されていないプレースホルダーの位置には、図8の801で示すような代替ファイルのURLを設定するものとしている。
【0104】
以上ステップS901〜ステップS909の処理によって、シーンエディタ105によってシーン記述テンプレート104とAVデータ106が合成され、シーン記述データ107が作成される。
【0105】
なお、本発明を用いて映像データと同様に音声データを扱う必要がある際には、注意しなければならない点がある。音声データは、その性質によりデータの内容を画面上に表示することが出来ないため、上述の静止画ファイルの場合と同じようにプレースホルダーの位置にデータが貼り付けられたことをAVデータの内容を表示することで表現することが出来ない。また、映像が貼り付けられたオブジェクトは画面上で選択することが可能だが、音声が貼り付けられたオブジェクトは、何らかの可視形態を伴うオブジェクトと併用されなければ選択することは出来ない。
【0106】
図13は、電子アルバムに音声データを用いる際の対処法を示すものである。
【0107】
図13の領域1301、1302、1303は、音声データのプレースホルダーを示す領域であり、音声データが未設定の場合は、代替表示として画像ファイル1305の内容が表示される。そして、音声データ1306がプレースホルダーの位置に設定されたら、音声データが設定されていることを示す画像を表示するようにすることが望ましい。そのためには、実際には音声データが貼り付けられたオブジェクトは、編集画面上では可視オブジェクトとして表示するといった例外的な処理が実装されている必要がある。図13の例では、領域1301に音声データが設定されたら、画像ファイル1307を表示している。
【0108】
また、音声が貼り付けられたオブジェクトを選択させる場合には、何らかの選択可能な可視オブジェクトを併用し、可視オブジェクトが選択されたら音声オブジェクトも選択されるように記述されたシーン記述テンプレートが必要になる。図13は、領域1304に静止画のプレースホルダーを配置し、領域1304の静止画が選択されたら、それと連動して領域1301に設定された音声データが再生されるように関連を定義することを示している。こういった関連の定義は、BIFSの場合は上述のROUTEノードによって記述することが可能である。
【0109】
以上、具体的な実施の形態を例にとって、本発明の基本的な原理について説明してきた。
【0110】
(実施の形態2)
実施の形態2として、実施の形態1で説明を行ったものとは別のシーン記述テンプレートを用いてアルバムを作成する場合を例にとって説明を行う。
【0111】
図14は、本実施の形態の説明に用いる電子アルバムを示すものである。このアルバムのシーン記述は、図17〜図20に示し、図17の次に図18、図19、図20の順に続く。
【0112】
この電子アルバムのシーン記述では、領域1401の内部に、ファイルphoto1.jpg、photo2.jpg、photo3.jpgが表示される領域1402、1403、1404、および、背景画像として表示される静止画ファイルbg.jpgが配置されている。また、領域1402、1403、1404を画面上で選択すると、「それぞれの領域の表示内容が、領域1405の位置に移動して拡大表示される」といった挙動が記述されている。
【0113】
さらに、領域1402、1403、1404にはそれぞれ、「画面上から下に移動し、表示位置がアルバムの領域外になったら表示位置を画面の上端に戻す」といった挙動も記述されている。
【0114】
この移動動作について、領域1402の場合を例にとって、図15を用いて簡単に説明しておく。図15は、アルバム中のオブジェクトが自律的に動き回る電子アルバムの表示イメージを示す図である。
【0115】
領域1402は、初期状態では座標(210,300)の位置に表示されているが、時間の経過に応じて位置を少しずつ変化していく。そして、20秒後に元の位置に戻り、再度同じ動作を繰り返すという動きが記述されている。その動き方の詳細は、下記の通りである、
【0116】
(1)動作開始の直後から19秒後までの間に、(210,300)から(210,−360)の位置に移動。
(2)19秒後から19.02秒後までの間に、(210,−360)から(600,−360)の位置に移動。
(3)19.02秒後から19.2秒後までの間に、(600,−360)から(600,360)の位置に移動。
(4)19.2秒後から19.22秒後までの間に、(600,360)から(210,360)の位置に移動。
(5)19.22秒後から20秒後までの間に、(210,360)から(210,300)の位置に移動。
【0117】
上記(1)〜(5)の動作が、20秒間隔で繰り返し実行されるよう定義されている。定義の詳細に関しては、図17〜図20のシーン記述の内容を参照されたい。
【0118】
図16は、図14の電子アルバム中の再生時のイメージを示す図である。図16(a)、図16(b)、図16(c)の順で再生中の時間経過を表し、表示部114には、領域1401内が表示されるので、図16(b)のときは、1404は表示されていないこととなる。時間的配置の遷移が領域1402、1403、1404に上述したように定義されていることによって、このアルバムが再生されると、図16で示されるように、3枚の静止画が上から下にスクロールしているように動き、それによって、フィルムが流れているような表示が行われる。
【0119】
以上のように、図14の電子アルバムは、図3のものと空間的配置はほぼ同じであるが、アルバム上のオブジェクトがそれぞれ自律的に動き回るという点で、図3のものとは内容は大きく異なっている。しかし、図14の電子アルバムを作成する時の利用者の編集操作は、図3のアルバムを作成する場合に行われる操作とまったく同じものとなる。
【0120】
すなわち、本発明の電子アルバム作成方法を適用すれば、定義されている挙動や時間的配置が異なっている複数のシーン記述テンプレートに対しても、利用者はプレースホルダーにAVデータを指定するといった統一された操作のみでアルバム作成が可能になる。
【0121】
(実施の形態3)
シーン記述テンプレート104のプレースホルダーの位置は、図7で示されるような「空のURLを設定する」以外の方法で記述することが可能である。
【0122】
図21は、シーン記述テンプレート107の記述例である。図21(a)では、シーン記述中に「PLACEHOLDER」で始まるキーワードを設定することによって、そのキーワードが存在するノードがプレースホルダーであることを示す例である。
【0123】
記述中のDEFは、あるノードに対して利用者が任意に定義した名前を設定するためのVRMLの予約語であり、この例はShapeノードに対して「PLACEHOLDER_1」という名前を設定していることを表している。なお、VRMLでは、DEFで設定される名前はファイル内で一意でなければならないため、この例では名前の一意性を確保するために「_1」という接尾句を付与している。
【0124】
図21(b)では、図21(a)と同様の手法を用いて、さらに貼り付けることが可能なデータ形式を特定するために「IMAGE」というキーワードを設定している。実装形態によっては、このようなキーワードを設定することによって、図9のステップS905で行われるデータ形式のチェックが簡単に行える場合があるかもしれない。その他、システムの仕様によって任意の情報を示すデータがキーワードとして追加されても良い。また、キーワードの表現もどのようなものが用いられても良い。
【0125】
このように、シーン記述中に「プレースホルダーであることを示す何らかの情報」を許容される文法の範囲で記述することによってプレースホルダーの位置を指定しても良い。
【0126】
(実施の形態4)
シーン記述データ107に埋め込まれるアドレス情報は、図7で示されるようにURLでなくとも、AVデータの位置を特定することが可能な情報である限りは、どのようなものでも利用可能である。
【0127】
図22では、シーン記述データ107にAVデータの位置を示す情報としてURLの代わりに一意な番号を指定する例を示した。この例では、外部参照されるAVデータ106を特定する情報として、ファイル名”photo1.jpg”ではなく、番号”1”がシーン記述データ107に設定されている。
【0128】
この番号”1”は、ファイル”photo1.jpg”に関連付けられて発番された番号で、関連テーブル2201によって両者の関連が記述されている。この関連テーブル2201はシーン記述データ107からAVデータ106を特定する際に、シーン記述中の番号に対応するファイル名を参照することによって可能である。なお、この関連テーブル2201は、シーン記述データ107の一部として作成されても、シーン記述データとは別のデータとして作成されても良い。
【0129】
このように、AVデータのアドレス情報はデータの位置を特定するという目的が満たせるものであれば、任意の形式で設定することが可能である。
【0130】
(実施の形態5)
図9のステップS901におけるテンプレートの選択処理では、利用者にテンプレートを選択させるのではなく、テンプレートが自動的に選択されるような形態も考えられる。
【0131】
例えば、ステップS901には、記録されているAVデータのファイル数あるいはデータ形式に応じて、適切なプレースホルダーの数あるいはデータ形式が定義されたテンプレートを選択するといった機能を持たせることによって、選択を自動化させることも可能である。
【0132】
あるいは、常に同じテンプレートを使用するようにするといった形態も、広義の自動選択を行う形態として考えられる。
【0133】
(実施の形態6)
テンプレート選択と同様に、図9のステップS903におけるAVデータの選択処理も、利用者に選択させるのではなく、AVデータを自動選択する形態もありえる。
【0134】
例えば、ステップS903の選択処理として、AVデータの作成日付順にシーン記述中のプレースホルダーに無条件に配置するといった方法によってAVデータを自動的にテンプレートに割り当てるといった処理を行うことも可能である。この形態によれば、いわゆるインデックスプリントのような表現形態を実現するアルバムを利用者の操作を用いずとも作成することが出来る。
【0135】
または、プレースホルダーが一つのみ記述されたテンプレートを用いて、AVデータが入力されたら常に唯一のプレースホルダーにAVデータを割り当てるといった形態も、広義の自動選択を行う形態として考えられる。この形態を実施する場合は、実施の形態5のテンプレート自動選択機能を併用して、AVデータのデータ形式と一致するテンプレートを自動選択する機能を提供することが好ましい。
【0136】
(実施の形態7)
図9のステップS908における編集操作の続行を選択する処理も、利用者の選択に基づいて行うのではなく、自動的に行う形態も考えられる。
【0137】
例えば、実施の形態6で示したような、常に唯一のプレースホルダーにAVデータが自動的に割り当てられる形態においては、AVデータが割り当てられた時点で編集処理は終了したと解釈出来るため、ステップS908では無条件にステップS909のシーン記述データ作成処理に進むものとして処理できる。
【0138】
なお、以上述べた実施の形態5〜7のいずれにも該当する形態の場合は、シーン編集のためのユーザ操作は一切必要なくなるため、ユーザ操作101およびユーザ操作入力部102は不要となる。
【0139】
なお、アルバムのデータ形式にMP4フォーマットを用いる場合は、データ交換の際の相互運用性を高めるために、MP4フォーマットの基礎となる仕様を策定したApple Computer社をなどの多くの企業からなる業界団体であるISMA(Internet Streaming Media Alliance)によって定められた、ネットワーク上でいわゆるストリーミングを行うことを前提に最適化されたフォーマットを基本としてデータを作成すると効果的であると思われる。しかし、本明細書の執筆時点でISMAによって標準として定められているMP4のフォーマット仕様 ISMA V1.0(“Internet Streaming Media Alliance Implementation Specification Version 1.0”)では、シーン記述として、MPEG−4 Video形式の動画データ、およびMPEG−4 Audio形式の音声データがそれぞれ一つのみがシーン領域全体に配置されているだけの極めて単純なBIFSデータのみを許可している。
【0140】
そのため、本発明の構成は、撮像と同時にISMA V1.0に準拠したMP4形式ファイルを自動的に作成するといった目的にも適用可能である。
【0141】
なお、ISMAの将来の仕様では、より複雑なシーン記述がサポートされると思われる。しかしその場合でも、本発明のシステム構成に従えば、シーン編集部分に限っては、複雑なシーン記述がサポートされた場合であっても基本構成を大幅に変更することなく対応可能である。
【0142】
(実施の形態8)
電子アルバム作成装置に供給されるシーン記述テンプレート104のデータ形式は、図4〜図6および図7で示されるようなVRMLに基づく形式以外のものも考えられる。
【0143】
ひとつの有力な形態として、シーン記述テンプレートをXML形式で記述するといった形態が考えられる。特に、MPEG−4においては、XMT(eXtensible MPEG−4 Textual Format)と呼ばれる、BIFSをXML形式で記述するためのデータ形式がISO/IEC 14496−1の拡張規格として定められている。このXMTをシーン記述テンプレートとして用いることにより、BIFSと完全に一致する表現を、標準規格として定められたテキスト形式によって記述、編集することが可能になる。
【0144】
(実施の形態10)
アルバムデータ113のデータ形式および符号化形式は、MPEG−4に限らず、AVデータおよびその配置・挙動を記述し、多重化することが可能な形態であれば、どのような形式であっても良い。
【0145】
具体例を挙げれば、Macromedia社によって仕様が定められ、現在パーソナル・コンピュータを中心に多くの処理系でサポートされているマルチメディアデータ形式である”Flash”(登録商標)を用いるといった形態が考えられる。
【0146】
Flashは、国際標準規格ではないものの、BIFSと同様に、イベント処理などのインタラクティブな表現を記述することが可能であり、BIFSに類似するシーン記述機能を持ったフォーマットとしては、現状ではむしろMPEG−4よりも普及している。また、Flashのデータの内容は、拡張子”.swf”のファイルとしてMP4フォーマットと同様に多重化することが可能である。このswfファイルフォーマットも、ISMAで定められるようにストリーミング配信に最適化されている。以上の特性から、Flashは本発明に適用するには好適なフォーマットであると言えよう。
【0147】
ただし、Flashの場合は、シーン記述テンプレート104の記述に用いることができるような標準的なテキスト形式のフォーマットは定義されていない。したがって、Flash形式でサポートされる表現をテキスト形式で記述することが可能なデータ形式を何らかの形で定義し、その形式でテンプレートを記述しなければならない。
【0148】
(実施の形態11)
シーン記述テンプレート104は、テンプレートの一部を構成するAVデータ106がある場合は、シーン記述テンプレート104の一部として同時に供給されても良い。例えば、図3における背景画像book.jpgなどは、テンプレートの一部として供給されるのが適切であろう。
【0149】
また、シーン記述テンプレート104とAVデータ106といった複数のファイルを一度に供給する際には、容易に供給できるようにするため、シーン記述テンプレート104および構成ファイル群をZIP、LZHといったアーカイブファイル形式の単一ファイルとして、まとめて供給するといった形態も考えられる。
【0150】
ただし、この場合アーカイブファイル中に含まれるファイルを参照、更新するためには、シーンエディタ105はアーカイブファイルを解凍し、個々のファイルにアクセスするための手段を備えていなければならない。
【0151】
(実施の形態12)
図1に示される各構成部は、必ずしも同一の装置内に存在するとは限らない。本発明は、図23のように、構成部が複数の装置に配置され、各装置が通信手段を用いて連携することによって実現されても良い。図23は、本発明を複数の装置によって実施される場合の構成例である。
【0152】
図23において、2301はデジタルカメラ、2302はパーソナルコンピュータ、2303はインターネット上のサーバを示している。このような機器構成で、例えばデジタルカメラ2301ではAVデータ入力部102に相当する機能のみを提供し、その他の機能はすべてパーソナルコンピュータ2302で提供されるといった形態も考えられる。
【0153】
この形態によれば、デジタルカメラ2301には撮像手段およびパーソナルコンピュータ2302との通信手段のみを備えたごく一般的なデジタルカメラの機能を備えたもので充分であること、また、編集処理や符号化処理などの負荷が大きい処理は、概して処理速度や使用できる資源の制約が少ないパーソナルコンピュータ2302上で行えることから、最も現実的な形態のひとつであると言えよう。
【0154】
また、デジタルカメラ2301およびパーソナルコンピュータ2302は、通信手段を介してサーバ2303からシーン記述テンプレート104をダウンロードしたり、アルバムデータ113をアップロードするといった形態も考えられる。一般的には、サーバ2303との通信はパーソナルコンピュータ2302によって行う形態がより現実的であると考えられる。
【0155】
しかし、デジタルカメラ2301がインターネット・プロトコルを用いてサーバ2303と通信を行うという形態も非現実的というわけではない。本明細の執筆時点でも、CCDカメラで撮影した画像を電子メールで送付することが可能な携帯電話端末も広く流通していることから、現実のシステムに充分適用可能な形態であると言えるだろう。
【0156】
(その他の実施形態)
AVデータ入力部103は、デジタルカメラ、スキャナ等を構成する撮像装置、あるいはマイクロフォンなどの集音装置の形態をとる場合が一般的であるが、AVデータがデジタルデータの形式で入力する形態も考えられる。その場合は、AVデータ入力部103は単純に入力されたデータを保持するための機能のみが提供される。
【0157】
AVデータ106は静止画や動画、音声等の他に、ベクター・グラフィックなどが含まれる形態も考えられる。また、別のアルバムがAVデータとして入力される形態もありえる。
【0158】
なお、BIFSを用いてシーン記述を行う場合、別のアルバムはinlineと呼ばれるノードを用いてURLによって参照可能であるため、他のAVデータ形式同様にシーン記述テンプレートで使用することが可能である。また、上記実施の形態では、拡大表示や縮小表示などオブジェクトの大きさを変える挙動について説明したが、ほかに、例えば、オブジェクトの色や形を変える形態もあり得る。
【0159】
また、上記の各種処理を行うソフトウェアは、CD−ROM、フロッピー(登録商標)ディスクなどの記録媒体を介して提供される形態となっていても、ネットワーク等の通信媒体を介して提供される形態となっていても、必要に応じてメモリー、ハードディスク等の記憶装置上にコピーして利用できるような形態となっていても良い。
【0160】
また、上記実施形態では、ネットワークを構成するハードウェア等が含まれるものの、各処理部は実際はソフトウェアで実現できるものである。即ち、本発明の目的は、上述した実施の形態の機能を実現するソフトウェアのプログラムコードを記録した記憶媒体(または、記録媒体)を、システムあるいは装置に供給し、そのシステムあるいは装置のコンピュータ(または、CPUやMPU)が、記憶媒体に格納されたプログラムコードを読み出し、実行することによっても達成されることは言うまでもない。この場合、記憶媒体から読み出されたプログラムコード自体が、上述した実施の形態の機能を実現することになり、そのプログラムコードを記憶した記憶媒体が本発明を構成することになる。
【0161】
また、コンピュータが読み出したプログラムコードを実行することにより、上述した実施の形態の機能が実現されるだけでなく、そのプログラムコードの指示に基づき、コンピュータ上で稼働しているオペレーティングシステム(OS)等が、実際の処理の一部または全部を行い、その処理によって、上述した実施の形態の機能が実現される場合も含まれることは言うまでもない。
【0162】
さらに、記憶媒体から読み出されたプログラムコードが、コンピュータに挿入された機能拡張カードやコンピュータに接続された機能拡張ユニットに備わるメモリに書き込まれた後、そのプログラムコードの指示に基づき、その機能拡張カードや機能拡張ユニットに備わるCPU等が、実際の処理の一部または全部を行い、その処理によって、上述した実施の形態の機能が実現される場合も含まれることは言うまでもない。
【0163】
また、従来の方法ではシーン記述データからAVデータが正しく参照されるよう、アルバム作成者は注意深くアルバムの配布を行わなければならなかったが、この上記実施の形態で提供されるような電子作成方法を用いることで、シーン記述データ107およびAVデータ106は、多重化され、最終的にアルバムデータ113として単一のファイルとして出力される。それによって、アルバムを安全かつ容易に伝送・配布するとことが可能となる。
【0164】
また、上記実施の形態の電子作成方法を用いることで、アルバム作成者はオブジェクトの動きなどの複雑な記述を一切行うことなく、AVデータを選択し、プレースホルダーを指定するといった、きわめてシンプルな2つの操作の繰り返しのみで、表現豊かな電子アルバムを簡単に作成することが可能となる。
【0165】
オブジェクトの動き、とりわけ時間に応じた属性の変化をともなう動きを指定することは、図4〜図6が示す通り複雑でわかりにくいものである。仮に、アルバム作成アプリケーションで、動きの詳細を設定することが可能な設定画面などの手段が提供されていたとしても、使いこなすことは簡単ではないと思われる。しかし、上記実施の形態の方法では、オブジェクトの動きに関する編集操作はまったく必要としないため、編集作業の習得や編集作業自体にかかる負荷を軽減することが出来る。
【0166】
また、オブジェクトの挙動や時間的配置情報もあらかじめテンプレートに組み込んでおくことによって、それらの情報を設定、変更するための機能を編集モジュールで提供する必要がなくなるため、編集モジュールの実装を簡素なものにすることが出来る。上記実施の形態の編集モジュールは、AVデータのアドレス情報に対してのみデータの編集処理を組みこめば済むため、サイズが小さく、少ない資源で動作させることが可能な編集モジュールが実現できる。この点は、携帯端末やデジタルカメラ等のように、メモリ容量や入力インターフェース、表示デバイスなど使用出来る資源に制約のある環境に対して編集モジュールを実装する場合には、とりわけ有効であろう。
【0167】
無論、パーソナル・コンピュータのように資源に余裕のある環境では、必ずしも上記実施の形態で述べているような形態に固執する必要はなく、環境に応じた実装を行っても良い。例えば、マウスを利用できる場合は、プレースホルダーの位置にAVデータを指定する操作などは、AVデータを示すアイコンをプレースホルダーにドラッグ・アンド・ドロップするといった方法で実現する方が適切であろう。
【0168】
また、シーン記述テンプレートが図4〜図6などで示されるVRML形式のようにテキスト形式で表現されていれば、利用者にテンプレートを提供するデザイナーは、テキストエディタなどの一般的なツールを用いてテンプレートを作成することが出来るため、特殊なデザインツールを準備し、提供する必要がなくなる。
【0169】
上記実施の形態ではVRMLのような既存の記述言語を用いてテンプレートを記述しているため、一般的に流通しているVRMLビューアを用いれば、特別な符号化処理を行わなくても表示内容を確認することが可能である。
【0170】
また、電子アルバムは標準規格であるMP4フォーマットとして出力されるため、特定のアルバム再生用アプリケーションによらずとも広範囲の機器で閲覧、再生することが出来るようになっている。この点は、インターネットを介して不特定の閲覧者にアルバムを配布するようなケースでは特に有効である。
【0171】
【発明の効果】
以上のように、本発明によれば、電子アルバムを、作成する側にとっての負担が少なく、かつ、配布しやすい形式で作成することが可能となる。
【図面の簡単な説明】
【図1】本発明による電子アルバム作成装置の構成例を示す図である。
【図2】本発明の一実施形態であるデジタルカメラの構成例を示す図である。
【図3】電子アルバムの表示イメージを示す図である。
【図4】図3の電子アルバムをBIFSのテキスト表現形式で記述した例を示す図である。
【図5】図3の電子アルバムをBIFSのテキスト表現形式で記述した例を示す図である。
【図6】図3の電子アルバムをBIFSのテキスト表現形式で記述した例を示す図である。
【図7】本発明のシーンエディタ105で行われる、シーン記述テンプレート104とAVデータ106のアドレス情報を元にしたシーン記述データ作成処理の概略を示す図である。
【図8】図3の電子アルバムにAVデータが指定される前後の表示イメージを示す図である。
【図9】シーンエディタ105で行われるシーン記述データ作成処理の手順を示すフローチャートである。
【図10】処理選択メニュー画面のイメージを示す図である。
【図11】テンプレート選択画面のイメージを示す図である。
【図12】アルバム編集画面のイメージを示す図である。
【図13】電子アルバムに音声データが用いられる際の注意点を説明するための図である。
【図14】アルバム中のオブジェクトが自律的に動き回る電子アルバムの表示イメージを示す図である。
【図15】図14の電子アルバム中のオブジェクトの動きを説明するための図である。
【図16】図14の電子アルバム中の再生時のイメージを示す図である。
【図17】図14の電子アルバムをBIFSのテキスト表現形式で記述した例を示す図である。
【図18】図14の電子アルバムをBIFSのテキスト表現形式で記述した例を示す図である。
【図19】図14の電子アルバムをBIFSのテキスト表現形式で記述した例を示す図である。
【図20】図14の電子アルバムをBIFSのテキスト表現形式で記述した例を示す図である。
【図21】シーン記述テンプレート107の記述例を示す図である。
【図22】URLに対応する値をアドレス情報として用いた場合の、シーン記述テンプレート107の記述例を示す図である。
【図23】本発明を複数の装置によって実施される場合の構成例を示す図である。
Claims (10)
- シーンを構成するオブジェクトの空間的配置と時間的配置とを記述したシーン記述テンプレートを保持する保持手段と、
前記オブジェクトの1つである画像データを入力する入力手段と、
前記シーン記述テンプレートのプレースホルダーに前記画像データの位置情報を設定することによりシーン記述データを生成する生成手段と、
前記シーン記述データと前記画像データとを多重化する多重化手段とを有することを特徴とする電子アルバム作成装置。 - 前記シーン記述テンプレートは、オブジェクトの大きさ、色、形の少なくともいずれか1つを変えることが記述されていることを特徴とする請求項1に記載の電子アルバム作成装置。
- 前記シーン記述は、VRML、BIFSのテキスト表現、XMT(eXtensible MPEG−4 Textual Format)のいずれかの形式であって、前記多重化手段は、MP4ファイル形式で多重化することを特徴とする請求項1又は請求項2に記載の電子アルバム作成装置。
- 前記シーン記述は、Macromedia Flash(登録商標)で表現可能なシーン構成を記述するテキスト形式データであって、前記多重化手段は、Macromedia Flashファイル形式で多重化することを特徴とする請求項1又は請求項2に電子アルバム作成装置。
- 前記生成手段は、前記プレースホルダーを検出する検出手段を備え、前記検出手段によって検出された個所に前記画像データの位置情報を設定することを特徴とする請求項1〜4のいずれか1項に記載の電子アルバム作成装置。
- 前記入力手段は、前記オブジェクトの1つとして音声データを入力し、前記生成手段は、前記シーン記述テンプレートのプレースホルダーに前記音声データの位置情報を設定することによりシーン記述データを生成し、前記プレースホルダーに前記音声データの位置情報を設定されたことを示すための画像データを表示することを特徴とする請求項1〜5のいずれか1項に記載の電子アルバム作成装置。
- シーンを構成するオブジェクトの空間的配置と時間的配置とを記述したシーン記述テンプレートを保持する保持工程と、
前記オブジェクトの1つである画像データを入力する入力工程と、
前記シーン記述テンプレートのプレースホルダーに前記画像データの位置情報を設定することによりシーン記述データを生成する生成工程と、
前記シーン記述データと前記画像データとを多重化する多重化工程とを有することを特徴とする電子アルバム作成方法。 - 前記シーン記述テンプレートは、オブジェクトの大きさ、色、形の少なくともいずれか1つを変えることが記述されていることを特徴とする請求項7に記載の電子アルバム作成方法。
- 前記シーン記述は、VRML、BIFSのテキスト表現、XMT(eXtensible MPEG−4 Textual Format)のいずれかの形式であって、前記多重化工程は、MP4ファイル形式で多重化することを特徴とする請求項8又は請求項9に記載の電子アルバム作成方法。
- 請求項7〜9のいずれか1項に記載の電子アルバム作成方法を実行するコンピュータプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003080364A JP2004289598A (ja) | 2003-03-24 | 2003-03-24 | 電子アルバム作成装置、電子アルバム作成方法及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003080364A JP2004289598A (ja) | 2003-03-24 | 2003-03-24 | 電子アルバム作成装置、電子アルバム作成方法及びプログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2004289598A true JP2004289598A (ja) | 2004-10-14 |
Family
ID=33294242
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2003080364A Withdrawn JP2004289598A (ja) | 2003-03-24 | 2003-03-24 | 電子アルバム作成装置、電子アルバム作成方法及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2004289598A (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007011452A (ja) * | 2005-06-28 | 2007-01-18 | Sony Corp | プログラム、データ処理方法、データ処理装置、オーディオ再生装置 |
US9361714B2 (en) | 2013-08-05 | 2016-06-07 | Globalfoundries Inc. | Enhanced video description |
-
2003
- 2003-03-24 JP JP2003080364A patent/JP2004289598A/ja not_active Withdrawn
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007011452A (ja) * | 2005-06-28 | 2007-01-18 | Sony Corp | プログラム、データ処理方法、データ処理装置、オーディオ再生装置 |
US9361714B2 (en) | 2013-08-05 | 2016-06-07 | Globalfoundries Inc. | Enhanced video description |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4159248B2 (ja) | 階層的データ構造管理システム及び階層的データ構造管理方法 | |
JP4430882B2 (ja) | 複合メディアコンテンツの変換装置及び変換方法並びに複合メディアコンテンツ変換プログラム | |
JP2007025959A (ja) | マルチメディアデータ処理装置、マルチメディアデータ処理方法及びマルチメディアデータ処理プログラム | |
US20140006921A1 (en) | Annotating digital documents using temporal and positional modes | |
KR100803580B1 (ko) | 동기 멀티미디어 통합언어 포맷을 이용한 전자 음악 배급서비스 시스템 및 그 방법 | |
CN104216691A (zh) | 一种创建应用的方法及装置 | |
CN114450966A (zh) | 用于异构沉浸式媒体的表示和流式传输的数据模型 | |
TWI571757B (zh) | 網頁編輯系統及方法與內儲網頁編輯程式之電腦程式產品 | |
US9721321B1 (en) | Automated interactive dynamic audio/visual performance with integrated data assembly system and methods | |
KR20170040148A (ko) | 네트워크를 통한 컨텐츠 제공 방법 및 장치, 컨텐츠 수신 방법 및 장치 | |
JP4142382B2 (ja) | コンテンツ作成システム及びコンテンツ作成方法 | |
JP4514671B2 (ja) | コンテンツ編集装置、コンピュータ読み取り可能なプログラム及びそれを記録した記録媒体 | |
KR20120000595A (ko) | 멀티플랫폼에서 구동되는 온라인 멀티미디어 콘텐츠 제작툴 제공 방법 및 시스템 | |
JP4129162B2 (ja) | コンテンツ作成実演システム及びコンテンツ作成実演方法 | |
JP2004289598A (ja) | 電子アルバム作成装置、電子アルバム作成方法及びプログラム | |
US20080281859A1 (en) | Data Generating Device, Data Generation Method, and System | |
JP2006048465A (ja) | コンテンツ生成システム、プログラム及び記録媒体 | |
KR20130065866A (ko) | 기록 편찬시스템 및 이를 이용한 공정 방법 | |
KR101056753B1 (ko) | 고해상도 이미지의 딥인딥 편집을 이용한 콘텐츠 저작 서비스 제공시스템 | |
JP4608627B2 (ja) | 統合的製品設計支援システム | |
JP2005196613A (ja) | 情報処理装置および情報処理方法、情報処理システム、記録媒体、並びに、プログラム | |
KR102711306B1 (ko) | 콘텐츠 공유 서비스 장치 및 그 장치의 구동방법 | |
JP6746238B2 (ja) | Vrコンテンツ生成装置及びvrコンテンツ生成方法 | |
US8649666B2 (en) | Apparatus and method for generating moving image and apparatus and method for reproducing moving image | |
KR20130123306A (ko) | 디지털 교과서의 개별 편집이 가능한 서비스 시스템과 사용자 단말 및 이의 편집 방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A300 | Application deemed to be withdrawn because no request for examination was validly filed |
Free format text: JAPANESE INTERMEDIATE CODE: A300 Effective date: 20060606 |