JP2010507140A

JP2010507140A - パーソナライズドスライドショー生成

Info

Publication number: JP2010507140A
Application number: JP2009532421A
Authority: JP
Inventors: パンウー，; ジアンファン，
Original assignee: Hewlett Packard Development Co LP
Current assignee: Hewlett Packard Development Co LP
Priority date: 2006-10-11
Filing date: 2007-10-11
Publication date: 2010-03-04
Also published as: WO2008045523A3; WO2008045523A2; GB0906011D0; GB2455942B; CN101523392B; GB2455942A; US7987423B2; US20080092050A1; CN101523392A

Abstract

パーソナライズドスライドショー生成システム２００は、スクリプト生成器２１０と、パーソナライズドスライドショー生成エンジン２１５とで構成される。スクリプト生成器２１０は、画像に関連付けられるユーザ対話を用いて対話スクリプトを生成するように構成される。パーソナライズドスライドショー生成エンジン２１５は、スクリプト生成器に結合されると共に、画像及び対話スクリプトを利用してパーソナライズドスライドショー２２５を生成するように構成される。

Description

本技術の実施の形態は、複数の画像からスライドショーを生成することに関する。より具体的には、本技術の実施の形態は、１つ又は複数のデジタル画像からパーソナライズドスライドショーを生成することに関する。

スライドショーは、従来から、画像を閲覧する一般的な方法であった。これはフィルム画像にも当てはまり、さらにデジタル画像にも当てはまる。デジタル画像に関して、１つ又は複数のデジタル画像からスライドショーを作成する多くの方法が存在する。

たとえば、１つの直接的な方法は、画像ビューアプログラムがコンピュータ又は他の電子デバイスによって使用されるために記憶されているデジタル画像のフォルダにアクセスするのを許可することである。それによって、画像ビューアプログラムは、フォルダ内のデジタル画像のそれぞれを開き、表示装置上に表示することができる。この方法の欠点は、画像が有意義なズーム又はパンを行わずに「そのまま」単純に表示されるため、その提示が月並みで、パーソナライズされていないことである。さらに別の方法は、自動スライドショー生成プログラムを使用することである。自動スライドショー生成プログラムは、複数のデジタル画像内の「目立っている」コンテンツも自動的に決定し、次に、複数の画像のこれらの「目立っている」部分をスライドショーで表示する。これによって、画像コンテンツに関していくらかのズーム又はパンを可能にすることができるが、「目立っている」と見なされるコンテンツが閲覧者に対して何らかの個人的な重要性を有しているという保証は一切ない。したがって、これらの方法のいずれにおいても、画像は、典型的には、閲覧者に対して個人的な重要性を有するように画像コンテンツを強調することなく、閲覧のために表示される。

現在、ユーザがスライドショーを真にパーソナライズすることを望む場合、かなりの時間、努力、及び、１つ又は複数の画像をスライドショーで表示するのに所望されるようにフォーマットするためのグラフィックスユーティリティ又は画像閲覧ユーティリティに関する経験が必要とされる。典型的には、多岐にわたるメニュー及び編集ウィンドウを使用して、この形態のスライドショーの手動生成が達成される。どれだけ熟練した人であろうと、これは画像と対話するプロセスとしてあまり自然ではない。

さらに、この手動の方法は、非常にパーソナライズされた結果を与えるが、時間がかかり、典型的には、画像を切り取ること等によって画像コンテンツを編集することを必要とする。画像を編集することの欠点は、画像が編集されるとき、元の画像が永久に変更されるか、又はそうでなければ、その画像が現れるスライドショー毎に画像の各変更されたコピーを記憶するために記憶空間が使用されることである。したがって、たとえば家族の何人かの構成員が一群の画像から別個のパーソナライズドスライドショーを生成するとき、各パーソナライズドスライドショーを記憶するために、かなりの量の記憶空間が消費される場合がある。これによって、デバイス上の、スライドショーが記憶される装置上の制限された記憶空間が急速に消費される可能性がある。

デジタルカメラ、及び、パーソナルコンピュータのような強力な閲覧装置の使用の急速な増加と共に、デジタル画像を魅力的な方法で表示する需要がますます広まってきている。スライドショーは、デジタル画像を表示すると共にこの需要を満たす、１つの方法である。しかし、上述したように、デジタル画像からスライドショーを作成する現在の方法は、パーソナライズされていないか、又はそうでなければ、多大な時間、努力、トレーニング、若しくは各パーソナライズドスライドショーを記憶するための追加の記憶容量を必要とする等の幾つかの欠点を有する。

本明細書に組み込まれてその一部を成す添付図面は、パーソナライズドスライドショー生成のための本技術の実施形態を示し、本明細書と共に以下に考察する原理を説明する役割を果たす。

本技術の実施形態に従って使用される一例のコンピュータシステムの図である。本技術の一実施形態による、パーソナライズドスライドショー生成のためのシステムのブロック図である。本技術の一実施形態による、パーソナライズドスライドショーを生成する方法のフローチャートである。本技術の一実施形態による、デジタル画像との対話例を示す図である。本技術の一実施形態による、対話スクリプトを生成する方法のフローチャートである。

本明細書内で参照される図面は、特記されない限り、一定の縮尺で描かれているものとして理解されるべきではない。

これより、その例が添付図面に示されるパーソナライズドスライドショー生成のための本技術の実施形態を詳細に参照する。本技術は様々な実施形態と併せて説明されるが、本技術をこれらの実施形態に限定することは意図されていないことが理解されよう。逆に、提示される技術は、添付の特許請求の範囲によって規定される様々な実施形態の精神及び範囲内に含むことができる代替形態、変更形態、及び均等物を包含するように意図される。さらに、以下の詳細な説明では、本技術の完全な理解を提供するために、多くの特定の詳細が記される。しかし、本技術は、これらの特定の詳細なしで実行することができる。他の事例では、本技術の諸態様を不必要に曖昧にしないように、既知の方法、手順、構成要素、及び回路は詳細に説明されていない。

以下の考察から明白であるものとして別段に特記されない限り、この詳細な説明全体を通じて、「用いる」、「利用する」、「フィルタリングする」、「変換する」、「受信する」、「生成する」、「提供する」、「受信する」、「提示する」、「記録する」、「処理する」、「出力する」等のような用語を利用する考察は、コンピュータシステム（図１のコンピュータ１００等）又は同様の電子計算装置の動作及びプロセスを指すことが理解される。コンピュータシステム又は同様の電子計算装置は、コンピュータシステムのレジスタ及びメモリ内の物理（電子）量として表されるデータを操作し、コンピュータシステムメモリ、レジスタ、若しくは他のこのような情報記憶装置、伝送装置、又は表示装置内の物理量として同様に表される他のデータに変換する。本技術は、たとえば、光コンピュータ、及び仮想コンピュータのような他のコンピュータシステムの使用にもよく適している。さらに、本技術の実施形態では、ステップのうちの１つ又は複数を手動で実行することができることを理解されたい。

［コンピュータシステム環境例］
ここで図１を参照すると、本技術の部分は、たとえば、コンピュータシステムのコンピュータ使用可能媒体内に常駐するコンピュータ可読且つコンピュータ実行可能な命令で構成される。すなわち、図１は、本技術の以下に考察する実施形態の実施に使用することができるコンピュータの種類の一例を示す。図１は、本技術の実施形態に従って使用される一例のコンピュータシステム１００を示す。図１のシステム１００が例示にすぎず、本技術が、汎用ネットワークコンピュータシステム、埋め込みコンピュータシステム、光コンピュータシステム、仮想コンピュータシステム、サーバ装置、クライアント装置、様々な中間装置／ノード、独立型コンピュータシステム、デジタルカメラ、マルチメディアコンソール、マルチメディア手持ち式装置等を含む多くの異なるコンピュータシステム上又はそれらのコンピュータシステム内で動作することができることが理解される。図１に示すように、図１のコンピュータシステム１００は、たとえば、フロッピー（登録商標）ディスク、及びコンパクトディスク等のような、当該コンピュータシステムに結合されている周辺コンピュータ可読媒体１０２を有するように良好に適合される。

図１のシステム１００は、情報を通信するためのアドレス／データバス１０４と、バス１０４に結合される、情報及び命令を処理するプロセッサ１０６Ａとを備える。図１に示すように、システム１００は、複数のプロセッサ１０６Ａ、１０６Ｂ、及び１０６Ｃが存在するマルチプロセッサ環境にもよく適している。逆に、システム１００は、たとえば、プロセッサ１０６Ａのような単一のプロセッサを有することにもよく適している。プロセッサ１０６Ａ、１０６Ｂ、及び１０６Ｃは、様々な種類のマイクロプロセッサのうちのいずれであってもよい。システム１００は、バス１０４に結合される、プロセッサ１０６Ａ、１０６Ｂ、及び１０６Ｃのための情報及び命令を記憶するコンピュータ使用可能揮発性メモリ１０８、たとえばランダムアクセスメモリ（ＲＡＭ）のようなデータ記憶機能も備える。システム１００は、バス１０４に結合される、プロセッサ１０６Ａ、１０６Ｂ、及び１０６Ｃのための静的な情報及び命令を記憶するコンピュータ使用可能不揮発性メモリ１１０、たとえば読み取り専用メモリ（ＲＯＭ）も含む。システム１００内には、バス１０４に結合される、情報及び命令を記憶するデータ記憶ユニット１１２（たとえば、磁気ディスク又は光ディスク及びディスクドライブ）も存在する。システム１００は、バス１０４に結合される、プロセッサ１０６Ａ、又はプロセッサ１０６Ａ、１０６Ｂ、及び１０６Ｃに情報及びコマンド選択を伝えるための、英数字キー及び機能キーを含むオプションの英数字入力装置１１４も備える。システム１００は、バス１０４に結合される、プロセッサ１０６Ａ、又はプロセッサ１０６Ａ、１０６Ｂ、及び１０６Ｃにユーザ入力情報及びコマンド選択を伝えるオプションのカーソル制御装置１１６も備える。本実施形態のシステム１００は、バス１０４に結合される、情報を表示するオプションの表示装置１１８も備える。

図１をさらに参照すると、オプションの表示装置１１８は、液晶装置、陰極線管、プラズマディスプレイ装置、又は、ユーザが認識可能なグラフィック画像、及び／若しくはシンボル、若しくは英数字文字の作成に適した他の表示装置とすることができる。オプションのカーソル制御装置１１６は、コンピュータユーザが、表示装置１１８の表示画面上での可視シンボル（カーソル）の移動を、動的にシグナル伝達することができるようにする。所与の方向への移動又は変位様式をシグナリングすることが可能なトラックボール、マウス、タッチパッド、ジョイスティック、マルチメディア遠隔制御装置上の方向キー及び入力キー、又は英数字入力装置１１４上の特殊キーを含む、カーソル制御装置１１６の多くの実施態様が当該技術分野において既知である。代替的に、特殊キー及びキーシーケンスコマンドを使用して英数字入力装置１１４からの入力を介して、カーソルを方向付け且つ／又はアクティブ化することができることが理解されよう。システム１００は、たとえば、ボイスコマンドのような他の手段、又は手の動きの解釈によって方向付けされるカーソルを有することにもよく適している。

図１のシステム１００は、声又は音楽のような音声入力を受信することを可能にする、マイクロフォン又は音声入力ジャックのような音声入力装置１１９もオプションで備える。たとえば、一実施形態では、声の入力は音声入力装置１１９を解して受信され、プロセッサ１０６Ａ上で実行されているアプリケーション１２４によって処理され、次にデータ記憶ユニット１１２にデジタルで記憶される。システム１００は、システム１００を外部エンティティに結合する入出力装置１２０も備える。たとえば、一実施形態では、入出力装置１２０は、システム１００と、インターネット等であるがこれに制限されない外部ネットワークとの間で有線又は無線の通信を可能にするモデムである。

図１をさらに参照して、システム１００の他の様々な構成要素を示す。具体的には、オペレーティングシステム１２２、アプリケーション１２４、モジュール１２６、及びデータ１２８は、存在する場合、典型的には、コンピュータ使用可能揮発性メモリ１０８、たとえばランダムアクセスメモリ（ＲＡＭ）、及びデータ記憶ユニット１１２の１つ又は幾つかの組み合わせ内に常駐するものとして示される。一実施形態では、本技術は、たとえば、ＲＡＭ１０８内のメモリロケーション及び／又はデータ記憶ユニット１１２内のメモリエリアにアプリケーション１２４又はモジュール１２６として記憶される。

［パーソナライズドスライドショー生成のための本技術の全体的な説明］
［概説］
パーソナライズドスライドショー生成のための本技術によって、ユーザは、１つ又は複数のデジタル画像（本明細書では１つ又は複数の「画像」と呼ばれる）とのユーザの対話によってパーソナライズされたスライドショーを作成することが可能になる。パーソナライズドスライドショー生成のための本方法及びシステムは、提示される１つ又は複数の画像とのユーザ対話を受信し、これらの対話を使用して対話スクリプトを生成する。ユーザ対話の一例は、たとえば、ユーザ対話装置を利用するユーザから受信される、提示される画像の個人的に興味深い部分にパン又はズームインするための視覚対話のような、視覚表示対話である。ユーザ対話の別の例は、たとえば、音声入力装置を利用しているユーザから受信される、提示される画像のムードを設定するための音楽を記録するか、提示される画像に示されているものに関する言葉による説明を記録するか、又は、提示される画像の、ユーザがパン若しくはズームした部分に示されているものに関して言葉による説明を記録するための音声対話のような、提示される画像に関連付けられる音声対話である。ユーザ対話のさらに別の例は、視覚表示対話が発生する時刻に基づいて受信されるか、音声対話が発生する時刻に基づいて受信されるか、又は、ユーザが、別の画像と比較しての１つの画像、若しくは画像の別の部分と比較しての画像の一部分を閲覧し且つ／若しくはそれらと対話する時間の長さに関連付けられて受信される時間ベースの対話のような、時間ベースの対話である。

対話スクリプトにおいて、ユーザ対話は、当該ユーザ対話が生成されたときに提示された画像に関連付けられる。次に、パーソナライズドスライドショー生成器は、対話スクリプトを対話先の１つ又は複数の画像と併せて利用して、当該１つ又は複数の画像からスライドショーを反復して生成する。このようにして、スライドショーは、スライドショー内で表示される１つ又は複数の画像とのユーザの以前の対話に従ってパーソナライズされる。さらに、スライドショースクリプト及び関連付けられる１つ又は複数の画像から、同じパーソナライズドスライドショーを反復して生成することができる。

スライドショースクリプトは、関連付けられる１つ又は複数の画像とは別個のエンティティとして記憶可能である。これは、特定の画像又は画像セットから、スライドーショーの各バージョンに関して当該１つ若しくは複数の画像、又はそれらの変更バージョンを保存することなく、複数のスライドショーを生成することができることを意味する。結果として、スライドショーを記憶する従来の技法と比較して、記憶空間のかなりの節約が達成される。

［パーソナライズドスライドショー生成のためのシステム例］
図２は、本技術の一実施形態による、パーソナライズドスライドショー生成のための一例のシステム２００のブロック図である。システム２００は、受信されるユーザ対話から対話スクリプトを生成すること、及び、次にその対話スクリプトを、当該対話スクリプトに関連付けられる１つ又は複数の画像と統合することによって、パーソナライズドスライドショーを生成する。図示されるように、システム２００は、オプションの画像プレゼンタ２０５と、スクリプト生成器２１０と、パーソナライズドスライドショー生成エンジン２１５と、オプションのスライドショーレコーダ２２０とで構成される。

オプションの画像プレゼンタ２０５は、表示装置１１８のような表示装置上で閲覧するためにデジタル画像ファイルを開くのに使用される画像ビューアである。これは、たとえば、何らかの自動化された順序（ファイル名による等）で実行するか、又は、たとえば、ユーザが自由に選択するためにサムネイル画像のセットを提供することによって実行する等の、多数の既知の方法で実行することができる。

図示されるように、画像プレゼンタ２０５は、画像記憶装置２４０、１つ又は複数のユーザ対話装置２４５、及びスクリプト生成器２１０と結合される。画像プレゼンタ２０５は、ユーザが閲覧するために、デジタル画像操作の技術分野において既知の様式で、画像記憶装置２４０からの１つ又は複数の画像を復号し、表示装置１１８上等に提示する。画像プレゼンタ２０５は、システム２００の動作に必要な機能を提供する。したがって、幾つかの実施形態において、画像プレゼンタ２０５が、システム２００の統合された部分として含まれる。

しかし、画像プレゼンタ２０５をシステム２００内に含めることは、スクリプト生成器２１０のようなシステム２００の構成要素が、システム２００の外部にある画像プレゼンタ２０５と連動するように構成される実施形態におけるオプションである。たとえば、一実施形態では、システム２００は、コンピュータシステム１００上で実行されるアプリケーション１２４として実装される。そのような一実施形態では、画像プレゼンタ２０５は、オペレーションシステム１２２の常駐部分として、又は別のアプリケーション１２４として、システム２００の外部にあり、スクリプト生成器２１０は、外部の画像プレゼンタ２０５と結合するように構成される。そのような外部画像プレゼンタ２０５の一例は、ＭｉｃｒｏｓｏｆｔＷｉｎｄｏｗｓ（登録商標）ＸＰオペレーティングシステムに付属のＰｉｃｔｕｒｅａｎｄＦａｘＶｉｅｗｅｒである。通常、画像プレゼンタ２０５は、システム２００の内部にあろうと、又は外部にあろうと、表示のためのデジタル画像を画像記憶装置２４０から取り出す。

様々な実施形態において、画像記憶装置２４０は、フラッシュメモリカード、ネットワーク評価済みの記憶領域、データ記憶ユニット１１２、周辺コンピュータ読取り可能媒体１０２、又は他の同様の記憶領域若しくはそのような記憶領域の組み合わせのような記憶場所である。

一実施形態では、スクリプト生成器２１０は画像に関連付けられるユーザ対話を用いて対話スクリプトを生成するように構成される。図２に示すように、スクリプト生成器２１０は、対話捕捉器２１２と、オプションの対話プロセッサ２１３とを備える。スクリプト生成器２１０は、１つ又は複数のユーザ対話装置２４５、画像プレゼンタ２０５、及びパーソナライズドスライドショー生成エンジン２１５と結合される。

本技術の実施形態に関して、ユーザ対話装置２４５は、ユーザが提示される画像と対話するのに利用することができる任意の入力装置を備える。したがって、たとえば、一実施形態ではユーザ対話装置２４５は、カーソル制御装置１１６のようなカーソル制御装置を備える。同様に一実施形態では、対話装置２４５は、音声入力装置１１９のような音声入力装置を備える。

スクリプト生成器２１０によって対話スクリプト内に記録される対話は、画像プレゼンタ２０５によって、たとえば表示装置１１８上に提示されている画像を、閲覧、評価すると共に、その画像と対話しているユーザの主観的な対話である。画像が対話のためにユーザに提示される様式は、利用される画像プレゼンタ２０５の性質及び機能によって決まる。たとえば一実施形態では、画像プレゼンタ２０５は、ユーザに対し、たとえばデジタル画像ファイルのフォルダから順次提示する等で、画像を一度に自動的に提示する。一実施形態では、画像プレゼンタ２０５によって、ユーザは、たとえば、ユーザが対話することを所望するサムネイル画像又は特定のデジタル画像ファイルを選択して開くこと等によって、画像を閲覧すると共にその画像と対話する順序を選択することが可能になる。図２に示すように、スクリプト生成器２１０は、対話捕捉器２１２と、オプションの対話プロセッサ２１３とで構成される。

一実施形態では、対話捕捉器２１２は、１つ又は複数のユーザ対話装置からの１つ又は複数のユーザ対話を受信するためにアクセス可能である対話インタフェースを提供するように構成される。たとえば、一実施形態では、対話捕捉器２１２は画像プレゼンタ２０５と協働して、画像プレゼンタ２０５によって提示されている画像に関連付けられる、選択可能なボタンのセット、アイコン、制御可能なカーソルのようなユーザインタフェースを表示する。そのような実施形態において、対話捕捉器２１２は、ユーザが、カーソル制御装置１１６のようなユーザ対話装置２４５を用いて、カーソルを操作するか、又は選択可能なアイコン若しくはボタンを選択することによって、提示される画像と対話することを可能にする機能を提供する。たとえば、一実施形態では、カーソル制御装置１１６はマルチメディア遠隔制御装置であり、一方で別の実施形態では、カーソル制御装置１１６は、コンピュータマウス又は他の幾つかのカーソル制御手段である。

カーソル制御装置１１６が、たとえば、２つのボタン（左及び右）と、スクロールホイールとを有するコンピュータマウスである一実施形態を考察する。そのような１つの実施形態では、ユーザは、左ボタンを押下したままで、制御可能なカーソルを、提示される画像の、ユーザにとって個人的な興味を引く部分に動かすことによって、提示される画像の部分にパンする。これは、提示される画像に関連付けられる視覚表示対話の一例である。同様に、そのような１つの実施形態において、右ボタンを押下することによって、ユーザは記録機能を有効にすることができ、それによって、音声入力装置１１９のような対話装置２４５が有効にされ、現在ユーザに提示されている画像の会話による説明のような、音声入力が受信される。これは、提示される画像に関連付けられる音声対話の一例である。同様に、そのような実施形態において、ユーザは、スクロールホイールを一方向に転がすことによってカーソルを中心とする画像の部分上にズームインすることができ、同様に逆方向にスクロールホイールを回転させることによってズームアウトすることができる。これは、提示される画像に関連付けられる視覚表示対話の別の例である。したがって、画像は画像プレゼンタ２０５によってユーザに提示されている間に、対話捕捉器２１２は、提示される画像との１つ又は複数のユーザ対話を捕捉及び受信するための１つ又は複数のユーザ対話装置２４５の使用を有効にする手段を提供する。

一実施形態では、スクリプト生成器２１０は、提示される１つ又は複数の画像との、受信されるユーザ対話（複数可）から対話スクリプトを生成する。たとえば、ユーザ対話装置２４５がカーソル制御装置１１６である一実施形態では、スクリプト生成器２１０は、提示される画像に対するカーソル制御装置１１９の位置的移動を記録する。たとえば、マウスの、パン及びズームに関連付けられる位置的移動を記録することによって、提示される画像に関連付けられるユーザの視覚表示対話の対話スクリプトが提供される。同様に、ユーザによって生成されると共に画像又は画像の部分に関連付けられる音又は会話による説明を記録することによって、提示される画像又はその部分に関連付けられるユーザの音声対話の対話スクリプトが提供される。

同様に、一実施形態では、各記録される対話はまた、その対話が受信された時に関連付けられる時間ラベルでタグ付けもされる。これは、たとえば、対話に関連付けられるシステムクロック時刻を受信及び記録すること等によって、多岐にわたる方式で行うことができる。一実施形態では、このような時間ベースの対話によって、対話スクリプトに記録されている対話を、ユーザによって対話が行われたのと同じ時間フレーム内で再生することが可能になる。別の実施形態では、このような時間ベースの対話によって、対話スクリプト内の対話の部分を、ユーザが画像プレゼンタ２０５によって提示される画像との元の対話又は一連の対話を生み出すのにかかった実際の時間に比例して何倍かにスケールアップ又はスケールダウンされた時間フレーム内で再生することが可能になる。

一実施形態では、オプションの対話プロセッサ２１３は、対話捕捉器２１２によって捕捉される幾つかの対話又は全ての対話を後処理するように構成される。一実施形態では、対話プロセッサ２１３は、対話捕捉器２１２によって対話が捕捉された後であるが、捕捉された対話がスクリプト生成器２１０によって記録される前に、処理を実行する。別の実施形態では、対話プロセッサ２１３の機能は、パーソナライズドスライドショー生成エンジン２１５に含まれ、既に対話スクリプト内に組み込まれている対話を処理するのに使用される。

一例として、一実施形態では、対話プロセッサ２１３は、捕捉された位置入力を、望ましくないジッターを当該位置入力から除去するフィルタリングメカニズムを通じて平滑化する。そのような１つの実施形態では、たとえば、提示される画像の１つの部分から提示される画像の別の部分にパンする等の、提示される画像に関連付けられる視覚表示対話を提供するとき、ユーザの手がわずかに震える場合がある。対話捕捉器２１２によって捕捉されると、このパン経路はわずかにぶれる場合があり、たとえば、平坦な経路から、所々でいくつかのピクセルが変化する場合がある。したがって、一実施形態では、対話プロセッサは、このわずかにぶれている経路を、スクリプト生成器２１０によって対話スクリプト内に記録される平坦なパン経路にフィルタリングする。

対話プロセッサ２１３は、生の対話入力又は対話スクリプト内に記録されている対話に対する他の多くの種類の対話処理も実行することができることが理解される。たとえば、一実施形態では、対話プロセッサ２１３は、表示されているカーソルの、画像の特定の部分の上での滞留時間を測定し、このような測定時間を使用して、提示される画像の様々な部分の、ユーザに対する相対的な個人的関連度を測る。一実施形態では、そのような相対的な個人的関連度を使用して、画像又は画像の部分を表示する時間の長さを決定する。そのような表示時間情報は、提示される画像に関連付けられる時間ベースの対話も含む。一実施形態では、そのように導出される表示時間情報は、画像（又はその一部）に関連付けられ、スクリプト生成器２１０によって対話スクリプト内に記録される。次に、パーソナライズドスライドショー生成エンジン２１５は、対話スクリプト内に記憶されているこの表示時間情報を利用して、当該対話スクリプトを使用して生成される後続のパーソナライズドスライドショーの間、関連付けられる画像（又はその部分）の表示時間を制御する。

パーソナライズドスライドショー生成エンジン２１５は、スクリプト生成器２１０、及び画像記憶装置２４０に結合される。一実施形態では、パーソナライズドスライドショー生成エンジン２１５は、対話スクリプト及びその対話に関連付けられる１つ又は複数の画像を利用してパーソナライズドスライドショーを生成するように構成される。パーソナライズドスライドショー生成エンジン２１５は、対話スクリプトを、当該スクリプト内の命令に関連付けられる各画像と統合して、スライドショーを作成する。この統合の１つの利点は、再現性である。たとえば、ユーザは、休暇旅行からの画像セットと一度対話することによって、対話スクリプトを作成することができる。パーソナライズドスライドショー生成エンジン２１５は、対話スクリプトを画像と統合して、同じパーソナライズドスライドショーを、ユーザがそれを閲覧するか又は流すことを所望する回数だけ再生することができる。同様に、別のユーザは同じ画像と対話することによって別個の対話スクリプトを作成することができる。その結果、この別個のスクリプトは、同じ画像セットから第２のパーソナライズドスライドショーを生成するのに使用可能である。

対話スクリプトは、画像又はその変形バージョンを含むのではなく、その代わり特定のユーザ対話又はユーザ対話のセットに関連付けられる各画像が記憶されている場所を示す位置情報を含むことが理解される。したがって、パーソナライズドスライドショー生成エンジン２１５は、要求されるときに画像を画像記憶装置２４０との結合を介して取り出すことによって、対話スクリプトからのユーザ対話（複数可）を、対話先の１つ又は複数の画像と統合する。パーソナライズドスライドショー生成エンジン２１５は、対話スクリプト内に記憶されると共に１つ又は複数の命令に関連付けられる画像位置情報に従って、パーソナライズドスライドショー内の各画像にアクセスし、当該画像を取り出す。これによって、特定の画像又は画像セットのための複数の対話スクリプトが、すべてのスライドショーに関して画像又は画像の変形バージョンを記憶する従来の手段によって生成される場合のこのような画像の複数のスライドショーの消費量より、著しく少なく消費することが可能になる。

対話スクリプトの記憶装置は、対話先の画像とは別個に、パーソナライズドスライドショーが、多岐にわたる場所に保存されると共にそこからアクセスされる画像で構成されることも可能にする。たとえば、一実施形態では、パーソナライズドスライドショー生成エンジン２１５は、デジタルカメラのフラッシュメモリカードからのスライドショーの第１の画像を取り出し、第２の画像をコンピュータのハードディスクドライブから取り出し、第３の画像を第１のコンピュータとネットワーク接続されている第２のコンピュータのディスクドライブから取り出し、第４の画像をインターネットウェブページから取り出す。

一実施形態では、パーソナライズドスライドショー生成エンジン２１５は、生成されたパーソナライズドスライドショー２２５を、表示装置１１８又は同様の表示装置のようなビデオ表示装置に出力する。別の実施形態では、パーソナライズドスライドショーは、パーソナライズドスライドショー生成器２１５からオプションのスライドショーレコーダ２２０に結合される。

一実施形態では、オプションのスライドショーレコーダ２２０は、受信されたパーソナライズドスライドショーをビデオファイルとして記録するように構成される。たとえば、一実施形態では、スライドショーレコーダ２２０は、パーソナライズドスライドショーを、動画エキスパートグループ（ＭＰＥＧ）と互換性のあるビデオファイルフォーマットで、ビデオファイルとして記録する。これによって、パーソナライズドスライドショー生成エンジン２１５に対するアクセスを有しないか、対話スクリプトによって参照されるデジタル画像の画像ファイルを有しないか、又はいずれも有しない装置が、パーソナライズドスライドショーを再生することが可能になる。さらに、スライドショーレコーダ２２０は、パーソナライズドスライドショーを、コンパクトディスク又はデジタル多用途ディスク等に保存すると共にその後別の人と共有することができるフォーマットで記憶する、好都合な手段を提供する。同様に、スライドショーレコーダ２２０は、パーソナライズドスライドショーを、簡単に電子メールで送信することができるか、又は他の方法でネットワークを介して別の場所、人、若しくは装置と共有することができるフォーマットで記憶する、好都合な手段を提供する。

［動作方法例］
以下の考察は、実施形態例の説明を通じて本技術の動作を詳細に説明する。図３及び図６を参照すると、フローチャート３００及び６００は、それぞれ本技術の様々な実施形態によって使用されるステップ例を示している。フローチャート３００及び６００は、様々な実施形態において、コンピュータ読取り可能且つコンピュータ実行可能な命令の制御下にあるプロセッサによって実行されるプロセスを含む。コンピュータ読取り可能且つコンピュータ実行可能な命令は、たとえば、図１のコンピュータ使用可能揮発性メモリ１０８、コンピュータ使用可能不揮発性メモリ１１０、及び／又はデータ記憶装置１１２のようなデータ記憶装置機能内に存在する。コンピュータ読取り可能且つコンピュータ実行可能な命令は、たとえば、図１のプロセッサ１０６Ａ並びに／又はプロセッサ１０６Ａ、１０６Ｂ、及び１０６Ｃを制御するか又は当該プロセッサと協働するのに使用される。フローチャート３００及び６００には特定のステップが開示されるが、これらのステップは例である。すなわち、実施形態は、フローチャート３００及び６００に記載される他の様々なステップ又はそれらのステップの変形形態を実行するのによく適している。フローチャート３００及び６００内のステップは、提示されるものと異なる順序で実行されてもよく、フローチャート３００及び６００内のステップの全てが実行されなくてもよいことが理解される。

［対話スクリプトの生成］
図３は、本技術の実施形態による、対話スクリプトを生成する方法のフローチャート３００である。フローチャート３００の説明は、図１、図２、及び図４に示される要素を参照することによって容易になる。

一実施形態では、フローチャート３００の３１０において、本方法は位置インタフェース装置からのユーザ対話を受信するためにアクセス可能な位置的対話インタフェースを提供し、当該位置的対話インタフェースは、画像の提示と同時に利用可能である。提示される技術では、位置的インタフェースを提供することは、たとえば、ユーザが、画像表示装置上に表示される画像に関して使用及び制御するのに利用可能な、制御可能なカーソル及び／又は選択可能なアイコン若しくはボタンのような、位置的対話インタフェースを作成することを含む。いくつかの実施形態では、これは、システム２００の外部又は内部にある画像プレゼンタ２０５と協働するための位置的インタフェースを構成し、それによって、画像プレゼンタ２０５によって提示される画像に関連して制御可能なカーソルを操作するユーザ対話を、対話捕捉器２１２が受信及び捕捉できるようにすることを含む。このような位置的インタフェースの一実施形態は、図４の要素によって示される。

図４は、本技術の一実施形態による、デジタル画像４００との対話例を示す図である。図４では、デジタル画像４００が、画像プレゼンタ２０５によって表示装置１１８上に表示されている。画像４００は、父親４０７並びに２人の子供４０５及び４０６の表示を含む。子供４０６は、玩具の自転車４０８を握って表示されている。画像４００は、本明細書において例として示されるが、表示装置１１８上に表示されるデジタル画像を表すことが理解される。

図４において、対話捕捉２１２は、制御可能なカーソル４５０の形態で位置的対話インタフェースを提供している。一実施形態では、制御可能なカーソル４５０は、カーソル制御装置１１６のような位置的インタフェース装置である、ユーザ対話装置２４５の使用を通じて、画像４００に関して操作可能である。たとえば、対話捕捉器２１２は、画像４００の上に制御可能なカーソル４５０を重ね、それによってユーザが当該制御可能なカーソル４５０で、カーソル制御装置１１６を使用することによって操作することができるようにする。そのような操作に応答して、視覚表示対話、音声対話、及び／又は時間ベースの対話のようなユーザ対話は、対話捕捉器２１２によって受信される。

限定ではなく例示の目的で、一実施形態では、対話捕捉器２１２によって提供される位置的対話インタフェースは、ユーザ対話を位置的ユーザ対話装置２４５から受信する。位置的ユーザ対話装置２４５は、スクロールホイールを有する２ボタンコンピュータマウスの形態のカーソル制御装置１１６を備える。このような例において、視覚表示対話、音声対話、及び／又は時間ベースの対話の形態のユーザ対話は、コンピュータマウスのユーザ操作に応答して、対話捕捉器２１２によって受信される。たとえば、視覚表示対話は、ユーザが、コンピュータマウスを利用して制御可能なカーソル４５０を領域４１５の中心に位置決めし、続いてスクロールホイールをスクロールして領域４１５上にズームインするときに、対話捕捉器２１２によって受信され、それによって、画像４００の、領域４１５によって表される部分が表示装置１１８のディスプレイ内にセンタリングされると共に、当該ディスプレイ上で拡大される。

一実施形態では、対話捕捉器２１２は、たとえば、この視覚表示対話の発生に関連付けられる時刻の形態で、時間ベースの対話も受信する。この時間ベースの対話は、視覚表示対話に関連付けられる時間タグの形態とすることができる。

この例を続けると、一実施形態では、ユーザは、コンピュータマウスの右ボタンをクリックすると共にそれを保持して、音声入力装置１１９のような音声ユーザ対話装置を介して記録機能を有効にする。次に、ユーザはたとえば、「これらは私の２人の息子、ジェフ及びクリフである。」と言い、次に右マウスボタンを離して記録機能を無効にする。ユーザインタフェース２１２は、受信される音声対話を、現在表示装置１１８のディスプレイ上に表示されている画像４００又はその部分（領域４１５等）と関連付ける。一実施形態では、対話捕捉器２１２は音声対話に関連付けられる時間タグのような時間ベースの入力も受信する。

別の実施形態では、対話捕捉器２１２は、位置的対話インタフェースの部分として、「音声記録」ボタン４０４のような選択可能なボタン及び／又はアイコンをさらに提供する。そのような実施形態では、制御可能なカーソル４５０は、また、表示装置１１８の表示領域内に表示される、そのように提供されるボタン及び／又はアイコンを選択するように操作可能である。そのような一実施形態では、ユーザは、制御可能なカーソル４５０を音声記録ボタン４０４上に位置決めし、次に、たとえば右マウスボタンをクリックして音声入力を有効又は無効にすることによって、記録機能を有効又は無効にする。たとえば、音声記録ボタン４０４がクリックされて音声記録が有効になると、対話捕捉器２１２は、音声対話を、音声入力装置１１９のような対話装置２４５からの入力として受信する。ユーザインタフェース２１２は、受信される音声対話を、現在表示装置１１８のディスプレイ上に提示されている画像４００又はその部分（領域４１５等）と関連付ける。一実施形態では、対話捕捉器２１２は、音声対話に関連付けられる時間タグのような時間ベースの入力も受信する。

上述した例を続けると、領域４１５にズームした後、次に、ユーザはマウスを左クリックすると共に、制御可能なカーソル４５０を領域４１６の中心に再位置決めすることができ、次に、スクロールホイールをスクロールして領域４１６上にズームする。この動作に応答して、対話捕捉器２１２は、領域４１５の中心から領域４１６の中心へ位置的にパンし、次にズームして領域４１６を拡大する、視覚表示対話を受信する。一実施形態では、これらの視覚表示対話のそれぞれに併せて時間ベースの対話も受信される。同様に、ユーザは次にマウスを右クリックして、ズームされている領域４１６に現在表示されている玩具の自転車４０８に言及して「これはジェフの玩具の自転車である」と言うことができる。このように、対話捕捉器２１２は、音声対話、「これはジェフの玩具の自転車である」を受信すると共に、一実施形態では、この音声対話に関連付けられる時間ベースの入力を受信する。

上述した例を続けると、領域４１６にズームした後、次に、ユーザは、ズームアウトして画像４００の全体の表示に戻り、マウスの左ボタンをクリックすると共に、制御可能なカーソル４５０を領域４１７の中心に再位置決めし、次に、スクロールホイールをスクロールして領域４１７上にズームすることができる。これらの動作に応答して、対話捕捉器２１２は、領域４１６から位置的にズームアウトし、領域４１６の中心から領域４１７の中心へパンし、次にズームして領域４１７を拡大する視覚表示対話を受信する。一実施形態では、これらの視覚表示対話のそれぞれに併せて時間ベースの対話も受信される。同様に、ユーザは次にマウスを右クリックして、ズームされている領域４１７として現在表示されている、子供４０６及び父親４０７の動作に言及して「私の息子クリフは私の腕の中に飛び込もうとしている」と言うことができる。このように、対話捕捉器２１２は、音声対話、「私の息子クリフは私の腕の中に飛び込もうとしている」を受信すると共に、一実施形態では、この音声対話に関連付けられる時間ベースの入力を受信する。

一実施形態では、フローチャート３００の３２０において、本方法は対話スクリプトを生成する。対話スクリプトは、提示される画像とのユーザ対話に基づいてパーソナライズドスライドショーを生成するための命令を含む。対話スクリプト及びそれに含まれる命令は、スクリプト生成器２１０によって、対話捕捉器２１２によって受信されるユーザ対話から生成される。一実施形態では、受信されるユーザ対話は、いかなる中間処理も行わずに、対話スクリプト内に命令として直接記録される。一方、別の実施形態では、受信される対話のうちの幾つか又は全ては、対話スクリプト内に命令として記録される前に、対話プロセッサ２１３によって処理される。そのような処理の、上記で記載した一例は、フィルタリングである。たとえば、領域４１５にズームインするための、受信される視覚表示対話は、領域４１５上にズームすることに関連付けられる、ズーム率のような位置情報を、対話スクリプト内に命令として記録する前に、対話プロセッサ２１３によってフィルタリングされて位置的ジッターが除去される。

画像４００に関連付けられる前の例を続けると、領域４１５上へのズームのような視覚表示対話が、たとえば位置情報として対話スクリプト内に記録される。この位置情報は、パーソナライズドスライドショー生成エンジン２１５が、ユーザ対話（領域４１５へのズームイン等）をパーソナライズドスライドショーの形態で再作成するために従う命令としての役割を果たす。一実施形態では、これは、画像４００の画素に関して、領域４１５の中心のｘ−ｙ二次元位置情報を記憶すること、また、領域４１５に関連付けられる、ズーム率のような第三次元（ｚ次元）の位置情報を記録することも含む。

同様に、一実施形態では、これは、領域４１５上へのズームに関連付けられる時間タグのような、対話捕捉器２１２によって受信される時間ベースの対話を記録することをさらに含む。たとえば、一実施形態では、ズームが（たとえば、システム１００のクロック装置によれば）１：０５：５９ｐｍに発生した場合、スクリプト生成器２１０はこの時刻から生成される時間タグを対話スクリプト内に記録する。このようにズームの位置情報及び時間タグ情報は、領域４１５に関連付けられると共に、スクリプト生成器２１０によって、対話スクリプト内に命令として記録される。

同様に、対話捕捉器２１２によって受信される、「これらは私の２人の息子、ジェフ及びクリフである」のような音声対話も、スクリプト生成器２１０によって対話スクリプト内に記憶される。一実施形態では、たとえば音声対話の受信の開始時に、時間ベースの対話も受信され、スクリプト生成器２１０によって、対話スクリプト内に命令として記憶される。たとえば、音声対話に関連付けられる時間ベースの対話は、時間タグ１：０６：０３ｐｍを含むことができ、当該タグは対話スクリプト内に記憶されると共に、音声対話、「これらは私の２人の息子、ジェフ及びクリフである」に関連付けられる。

同様に、この例において、対話捕捉器２１２は、領域４１６の中心へのパンに関連付けられる時間タグのような時間ベースの対話を受信する。たとえば、一実施形態では、パンが（たとえば、システム１００のクロック装置によれば）１：０６：１０ｐｍに発生した場合、スクリプト生成器２１０はこの時間ベースの情報から時間タグ命令を生成すると共に、この時間タグ命令を対話スクリプト内に記録する。パンの位置情報及び時間タグ情報は、領域４１６に関連付けられると共にスクリプト生成器２１０によって、対話スクリプト内に命令として記録される。

一実施形態では、対話スクリプトを生成することは、視覚表示対話及び／又は音声対話に関連付けられる、位置命令のような他の命令の再生を同期させるための命令を含む対話スクリプトを生成することを含む。これによって、パーソナライズドスライドショー生成エンジン２１５が、ユーザ対話から生成される命令であって、このような対話がパーソナライズドスライドショーと併せて適切な時刻に再作成される、命令を再生することが可能になる。上述した時間タグのような一連の時間タグは、パーソナライズドスライドショー生成エンジン２１５が、対話スクリプト内の特定の動作をいつ開始又は実行するかを決定するのに使用する命令として機能する。

たとえば、そのような時間タグは、どれだけ速く領域４１５にズームインするか、どれだけ長く領域４１５上にズームし続けるか、又は対話スクリプト内に記憶されると共に領域４１５に関連付けられる音声対話をいつ再生するかに関する命令を提供する。このように、上記の例で説明したように、対話スクリプト内に記録されている時間タグ命令に基づいて、パーソナライズドスライドショー生成エンジン２１５は、時刻Ｔに領域４１５上にズームするための命令を有する。さらに、４秒後（Ｔ＋４秒）に、パーソナライズドスライドショー生成エンジン２１５は、受信される音声対話、「これらは私の２人の息子、ジェフ及びクリフである」の再生を開始するための命令（時間タグを介する）を有する。

そのようなユーザ対話及びスクリプト生成シーケンスは、画像プレゼンタ２０５によって提示される画像毎に繰り返される。各提示される画像に関して、スクリプト生成器２１０は受信されるユーザ情報を対話スクリプト内に記録する。そのような画像が、画像プレゼンタ２０５によって自動的に提示される一実施形態では、ユーザ入力が、たとえば５秒のような所定の時間内に一切受信されない場合、ウォッチドッグタイマが時間切れになる。そのような一実施形態では、スクリプト生成器２１０は、対話スクリプト内に、時間切れの画像に関連するユーザ対話情報を一切記録しない。一実施形態では、そのような時間切れの画像は、パーソナライズドスライドショー生成エンジン２１５によって生成されるパーソナライズドスライドショーにおいて、所定の時間の間しか表示されない。一例では、たとえばマウスボタンをダブルクリックすることのような特定のユーザ対話入力によって画像がスキップされ、その画像に関連付けられる情報は、スクリプト生成器２１０によって対話スクリプト内に一切記録されない。したがって、対話スクリプトから結果として生成されるパーソナライズドスライドショーは、スキップされた画像を表示しない。

［パーソナライズドスライドショー生成］
図５は、本技術の一実施形態による、パーソナライズドスライドショーを生成する方法のフローチャート５００である。フローチャート５００の説明は、図１、図２、及び図４に示される要素を参照することによって容易になる。

一実施形態では、フローチャート５００の５１０において、本方法は１つ又は複数の画像に関連付けられる１つ又は複数のユーザ対話を受信する。フローチャート３００の３１０に関連して上記で説明したように、且つ本明細書において画像４００を参照して例として示されるように、本方法は、対話捕捉器２１２が、画像プレゼンタ２０５によって提示される１つのデジタル画像（若しくは複数のデジタル画像）又はその部分に関連付けられる、視覚表示対話、音声対話、又は時間ベースの対話のような１つ又は複数のユーザ対話を受信することを含む。

一実施形態では、フローチャート３００の要素３１０に関連して上記で説明したように、そのようなユーザ対話は、ユーザに提供されると共にユーザ対話装置２４５からのユーザ対話を受信するためにアクセス可能な対話インタフェースに応答して受信される。上述したように、そのような位置的対話インタフェースは、画像４００のような各提示される画像の提示と同時に利用可能である。一実施形態では、図４に示すように、そのような位置的対話インタフェースは、制御可能なカーソル４５０、及び／又は、「音声記録」ボタン４０４のような１つ若しくは複数の選択可能なボタン若しくはアイコンを備える。一実施形態では、ユーザ対話装置２４５は、マイクロフォンのような音声入力装置１１９を備える。一実施形態では、ユーザ対話装置２４５は、マウス、ジョイスティック、トラックボール、マルチメディア遠隔制御装置、又は他のカーソル制御手段のような、カーソル制御装置１１６を備える。

一実施形態では、フローチャート５００の５２０において、本方法は１つ又は複数のユーザ対話から対話スクリプトを生成する。対話スクリプトの生成は、フローチャート３００の要素３２０に関して本明細書で提供された説明と一致する。このように、スクリプト生成器２１０は、対話捕捉器２１２によって受信される１つ又は複数のユーザ対話を利用して対話スクリプトを生成する。

本明細書で上述したように、一実施形態では、対話スクリプトは、画像プレゼンタ２０５によって提示される１つ又は複数の画像に関連付けられる視覚表示対話から生成されるスクリプト命令を含む。図４の画像４００に関連して提供された例に従って、そのような１つの視覚表示対話から生成される対話スクリプト命令は、領域４１５上にズームするための位置的命令を含む。この位置的命令は、ユーザが制御可能なカーソル４５０を領域４１５にセンタリングし、次にカーソル制御装置１１６を操作して領域４１５上にズームインしたときに、対話捕捉器２１２によって受信される視覚表示対話から生成される。

一実施形態では、受信される視覚表示対話は、位置的ジッターを除去するために対話プロセッサ２１３によって処理される。たとえば、領域４１５から領域４１６にパンするという視覚表示対話は、対話捕捉器２１２によって受信される。一実施形態では、このパン経路は、ユーザから受信される、ぶれているパン入力が、平滑な位置的パン命令に変換されるようにフィルタリングされ、次にそのパン経路は、スクリプト生成器２１０によって対話スクリプト内に記録される。

本明細書で上述したように、一実施形態では、対話スクリプトは、画像プレゼンタ２０５によって提示される１つ又は複数の画像に関連付けられる音声対話から生成されるスクリプト命令を含む。図４の画像４００に関連して提供された例に従って、そのような受信される１つの音声対話から生成される対話スクリプト命令は、ズームされている領域４１５に関連してユーザから受信される音声対話から生成される、記録されている音声対話、「これらは私の２人の息子、ジェフ及びクリフである」を再生するための命令を含む。

本明細書で上述したように、一実施形態では、対話スクリプトは、画像プレゼンタ２０５によって提示される１つ又は複数の画像に関連付けられる時間ベースの対話から生成されるスクリプト命令を含む。図４の画像４００に関連して提供された例に従って、そのような時間ベースの対話から生成される対話スクリプト命令は、領域４１５上にズームするという視覚表示対話に関連付けられる時間タグ命令と、記録されている音声対話、「これらは私の２人の息子、ジェフ及びクリフである」の再生に関連付けられる時間命令と、領域４１６の中心にパンするという視覚表示対話に関連付けられる時間タグ命令とを含む。一実施形態では、パーソナライズドスライドショー生成エンジン２１５は、これらの命令を解釈実行して、画像４００の領域４１５へズームインした４秒後に記録されている音声の再生を開始し、次に、その記録されている音声対話の再生の７秒後に領域４１６の中心にパンする。

一実施形態では、フローチャート５００の５３０において、本方法は、１つ又は複数の画像及び対話スクリプトを利用してパーソナライズドスライドショーを生成する。一実施形態では、パーソナライズドスライドショー生成エンジン２１５は、対話スクリプト内の１つ又は複数の命令に関連付けられる１つのデジタル画像（又は複数のデジタル画像）を取り出すことによってこれを達成する。各デジタル画像は画像記憶装置２４０から取り出され、次にパーソナライズドスライドショー（又は、対話スクリプトが２つ以上の画像に関連付けられる命令を含む場合、パーソナライズドスライドショーの一部分）を作成するために、対話スクリプト内の、当該画像に関連付けられる命令と統合される。一実施形態では、パーソナライズドスライドショーを生成することは、パーソナライズドスライドショー生成エンジン２１５が、表示装置１１８のような表示装置上に、統合された画像（複数可）及びスクリプト命令（複数可）を、パーソナライズドスライドショー２２５として出力することを含む。

図４の画像４００、並びに領域４１５、４１６、及び４１７を参照して本明細書で説明されるユーザ対話を考察する。この例に従って、一実施形態では、パーソナライズドスライドショー生成エンジン２１５は、画像４００を、画像４００との対話から生成される対話スクリプトと共に統合して、パーソナライズドスライドショー２２５を生成する。たとえば、そのようなパーソナライズドスライドショーは、画像４００を表示することによって開始する。次に、領域４１５がズームインされる。解説、「これらは私の２人の息子、Jジェフ及びクリフである」が流れる。次に、表示は領域４１６上にズームインする。解説、「これはジェフの玩具の自転車である」が流れる。次に表示はパンし、領域４１７にズームする。解説、「私の息子クリフは私の腕の中に飛び込もうとしている」が流れる。画像４００が対話スクリプトによって記述される唯一の画像である一実施形態では、スライドショーは終了する。対話スクリプトによって他の画像が記述される一実施形態では、スライドショーは、対話スクリプトに従って同様のパーソナライズされた形態でこれらの画像のそれぞれを提示することによって継続する。

一実施形態では、パーソナライズドスライドショーを生成することは、パーソナライズドスライドショー生成エンジン２１５が、統合された画像（複数可）及びスクリプト命令（複数可）を、パーソナライズドスライドショー生成画像２１５の出力をビデオファイルとして記録するオプションのスライドショーレコーダ２２０に出力することを含む。たとえば、一実施形態では、スライドショーレコーダ２２０は、パーソナライズドスライドショー生成器の出力を、ＭｏｔｉｏｎＰｉｃｔｕｒｅＥｘｐｅｒｔｓＧｒｏｕｐと互換性のあるビデオファイルとして記録し、当該ビデオファイルは、パーソナライズドスライドショー２２５として後に再生するために、たとえばハードディスクドライブに保存することもできるし、コンパクトディスク又はデジタルバーチャルディスクのような持ち運び可能媒体に記憶することもできる。

本技術の主題は、構造的特徴及び／又は方法論的動作に固有の言葉で説明されたが、添付の特許請求の範囲で規定される主題は、必ずしも上述した特定の特徴又は動作に限定されないことを理解されたい。そうではなく、上述した特定の特徴及び動作は、特許請求の範囲を実施する例示的な形態として開示される。

Claims

画像に関連付けられるユーザ対話を受信し（５１０）、
前記ユーザ対話から対話スクリプトを生成し（５２０）、
パーソナライズドスライドショーを生成するために、前記画像及び前記対話スクリプトを利用すること（５３０）を含むことを特徴とするパーソナライズドスライドショーを生成する方法（５００）。
ユーザ対話装置から前記ユーザ対話を受信するためにアクセス可能な位置的対話インタフェースを設けることをさらに含み、
前記位置的対話インタフェースは、前記画像の提示と同時に利用可能であることを特徴とする請求項１に記載の方法（５００）。
位置的ジッターを除去するために、前記視覚表示対話をフィルタリングすることによって前記視覚表示対話を処理することをさらに含むことを特徴とする請求項１に記載の方法（５００）。
パーソナライズドスライドショーを生成するために、前記画像及び前記対話スクリプトを利用すること（５３０）は、前記パーソナライズドスライドショーを表示装置に出力することをさらに含むことを特徴とする請求項１に記載の方法（５００）。
前記パーソナライズドスライドショーをビデオファイルとして記録することをさらに含むことを特徴とする請求項１に記載の方法（５００）。
前記ユーザ対話から対話スクリプトを生成すること（５２０）は、
前記画像に関連付けられる視覚表示対話から対話スクリプト命令を生成し、
前記画像に関連付けられる音声対話から対話スクリプト命令を生成し、
前記画像に関連付けられる時間ベースの対話から対話スクリプト命令を生成することを含むことを特徴とする請求項１に記載の方法（５００）。
画像の提示と同時に利用可能である位置的インタフェース装置から、ユーザ対話を受信するためにアクセス可能な位置的対話インタフェースを設け（３１０）、
前記提示される画像との前記ユーザ対話に基づいてパーソナライズドスライドショーを生成するための命令を含む前記対話スクリプトを生成することを含むことを特徴とする対話スクリプトを生成する方法（３００）。
前記位置的インタフェースからユーザ対話を受信するためにアクセス可能な位置的対話インタフェースを設けること（３１０）は、前記提示される画像との視覚表示対話を受信するためにアクセス可能な位置的インタフェースを設けることを含むことを特徴とする請求項７に記載の方法（３００）。
前記位置的インタフェースからユーザ対話を受信するためにアクセス可能な位置的対話インタフェースを設けること（３１０）は、前記提示される画像との時間ベースの対話を受信するためにアクセス可能な位置的インタフェースを設けることを含むことを特徴とする請求項７に記載の方法（３００）。
前記対話スクリプトを生成すること（３２０）は、音声対話の再生を、前記パーソナライズドスライドショーと関連して同期させるための命令を含む前記対話スクリプトを生成することをさらに含むことを特徴とする請求項７に記載の方法（３００）。