JP2010507140A - パーソナライズドスライドショー生成 - Google Patents
パーソナライズドスライドショー生成 Download PDFInfo
- Publication number
- JP2010507140A JP2010507140A JP2009532421A JP2009532421A JP2010507140A JP 2010507140 A JP2010507140 A JP 2010507140A JP 2009532421 A JP2009532421 A JP 2009532421A JP 2009532421 A JP2009532421 A JP 2009532421A JP 2010507140 A JP2010507140 A JP 2010507140A
- Authority
- JP
- Japan
- Prior art keywords
- interaction
- image
- script
- slide show
- user
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/40—Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/40—Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
- G06F16/48—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/489—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using time information
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/40—Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
- G06F16/43—Querying
- G06F16/435—Filtering based on additional data, e.g. user or group profiles
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/40—Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
- G06F16/43—Querying
- G06F16/438—Presentation of query results
- G06F16/4387—Presentation of query results by the use of playlists
- G06F16/4393—Multimedia presentations, e.g. slide shows, multimedia albums
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Multimedia (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Library & Information Science (AREA)
- User Interface Of Digital Computer (AREA)
- Processing Or Creating Images (AREA)
- Television Signal Processing For Recording (AREA)
Abstract
パーソナライズドスライドショー生成システム200は、スクリプト生成器210と、パーソナライズドスライドショー生成エンジン215とで構成される。スクリプト生成器210は、画像に関連付けられるユーザ対話を用いて対話スクリプトを生成するように構成される。パーソナライズドスライドショー生成エンジン215は、スクリプト生成器に結合されると共に、画像及び対話スクリプトを利用してパーソナライズドスライドショー225を生成するように構成される。
Description
本技術の実施の形態は、複数の画像からスライドショーを生成することに関する。より具体的には、本技術の実施の形態は、1つ又は複数のデジタル画像からパーソナライズドスライドショーを生成することに関する。
スライドショーは、従来から、画像を閲覧する一般的な方法であった。これはフィルム画像にも当てはまり、さらにデジタル画像にも当てはまる。デジタル画像に関して、1つ又は複数のデジタル画像からスライドショーを作成する多くの方法が存在する。
たとえば、1つの直接的な方法は、画像ビューアプログラムがコンピュータ又は他の電子デバイスによって使用されるために記憶されているデジタル画像のフォルダにアクセスするのを許可することである。それによって、画像ビューアプログラムは、フォルダ内のデジタル画像のそれぞれを開き、表示装置上に表示することができる。この方法の欠点は、画像が有意義なズーム又はパンを行わずに「そのまま」単純に表示されるため、その提示が月並みで、パーソナライズされていないことである。さらに別の方法は、自動スライドショー生成プログラムを使用することである。自動スライドショー生成プログラムは、複数のデジタル画像内の「目立っている」コンテンツも自動的に決定し、次に、複数の画像のこれらの「目立っている」部分をスライドショーで表示する。これによって、画像コンテンツに関していくらかのズーム又はパンを可能にすることができるが、「目立っている」と見なされるコンテンツが閲覧者に対して何らかの個人的な重要性を有しているという保証は一切ない。したがって、これらの方法のいずれにおいても、画像は、典型的には、閲覧者に対して個人的な重要性を有するように画像コンテンツを強調することなく、閲覧のために表示される。
現在、ユーザがスライドショーを真にパーソナライズすることを望む場合、かなりの時間、努力、及び、1つ又は複数の画像をスライドショーで表示するのに所望されるようにフォーマットするためのグラフィックスユーティリティ又は画像閲覧ユーティリティに関する経験が必要とされる。典型的には、多岐にわたるメニュー及び編集ウィンドウを使用して、この形態のスライドショーの手動生成が達成される。どれだけ熟練した人であろうと、これは画像と対話するプロセスとしてあまり自然ではない。
さらに、この手動の方法は、非常にパーソナライズされた結果を与えるが、時間がかかり、典型的には、画像を切り取ること等によって画像コンテンツを編集することを必要とする。画像を編集することの欠点は、画像が編集されるとき、元の画像が永久に変更されるか、又はそうでなければ、その画像が現れるスライドショー毎に画像の各変更されたコピーを記憶するために記憶空間が使用されることである。したがって、たとえば家族の何人かの構成員が一群の画像から別個のパーソナライズドスライドショーを生成するとき、各パーソナライズドスライドショーを記憶するために、かなりの量の記憶空間が消費される場合がある。これによって、デバイス上の、スライドショーが記憶される装置上の制限された記憶空間が急速に消費される可能性がある。
デジタルカメラ、及び、パーソナルコンピュータのような強力な閲覧装置の使用の急速な増加と共に、デジタル画像を魅力的な方法で表示する需要がますます広まってきている。スライドショーは、デジタル画像を表示すると共にこの需要を満たす、1つの方法である。しかし、上述したように、デジタル画像からスライドショーを作成する現在の方法は、パーソナライズされていないか、又はそうでなければ、多大な時間、努力、トレーニング、若しくは各パーソナライズドスライドショーを記憶するための追加の記憶容量を必要とする等の幾つかの欠点を有する。
本明細書に組み込まれてその一部を成す添付図面は、パーソナライズドスライドショー生成のための本技術の実施形態を示し、本明細書と共に以下に考察する原理を説明する役割を果たす。
本明細書内で参照される図面は、特記されない限り、一定の縮尺で描かれているものとして理解されるべきではない。
これより、その例が添付図面に示されるパーソナライズドスライドショー生成のための本技術の実施形態を詳細に参照する。本技術は様々な実施形態と併せて説明されるが、本技術をこれらの実施形態に限定することは意図されていないことが理解されよう。逆に、提示される技術は、添付の特許請求の範囲によって規定される様々な実施形態の精神及び範囲内に含むことができる代替形態、変更形態、及び均等物を包含するように意図される。さらに、以下の詳細な説明では、本技術の完全な理解を提供するために、多くの特定の詳細が記される。しかし、本技術は、これらの特定の詳細なしで実行することができる。他の事例では、本技術の諸態様を不必要に曖昧にしないように、既知の方法、手順、構成要素、及び回路は詳細に説明されていない。
以下の考察から明白であるものとして別段に特記されない限り、この詳細な説明全体を通じて、「用いる」、「利用する」、「フィルタリングする」、「変換する」、「受信する」、「生成する」、「提供する」、「受信する」、「提示する」、「記録する」、「処理する」、「出力する」等のような用語を利用する考察は、コンピュータシステム(図1のコンピュータ100等)又は同様の電子計算装置の動作及びプロセスを指すことが理解される。コンピュータシステム又は同様の電子計算装置は、コンピュータシステムのレジスタ及びメモリ内の物理(電子)量として表されるデータを操作し、コンピュータシステムメモリ、レジスタ、若しくは他のこのような情報記憶装置、伝送装置、又は表示装置内の物理量として同様に表される他のデータに変換する。本技術は、たとえば、光コンピュータ、及び仮想コンピュータのような他のコンピュータシステムの使用にもよく適している。さらに、本技術の実施形態では、ステップのうちの1つ又は複数を手動で実行することができることを理解されたい。
[コンピュータシステム環境例]
ここで図1を参照すると、本技術の部分は、たとえば、コンピュータシステムのコンピュータ使用可能媒体内に常駐するコンピュータ可読且つコンピュータ実行可能な命令で構成される。すなわち、図1は、本技術の以下に考察する実施形態の実施に使用することができるコンピュータの種類の一例を示す。図1は、本技術の実施形態に従って使用される一例のコンピュータシステム100を示す。図1のシステム100が例示にすぎず、本技術が、汎用ネットワークコンピュータシステム、埋め込みコンピュータシステム、光コンピュータシステム、仮想コンピュータシステム、サーバ装置、クライアント装置、様々な中間装置/ノード、独立型コンピュータシステム、デジタルカメラ、マルチメディアコンソール、マルチメディア手持ち式装置等を含む多くの異なるコンピュータシステム上又はそれらのコンピュータシステム内で動作することができることが理解される。図1に示すように、図1のコンピュータシステム100は、たとえば、フロッピー(登録商標)ディスク、及びコンパクトディスク等のような、当該コンピュータシステムに結合されている周辺コンピュータ可読媒体102を有するように良好に適合される。
ここで図1を参照すると、本技術の部分は、たとえば、コンピュータシステムのコンピュータ使用可能媒体内に常駐するコンピュータ可読且つコンピュータ実行可能な命令で構成される。すなわち、図1は、本技術の以下に考察する実施形態の実施に使用することができるコンピュータの種類の一例を示す。図1は、本技術の実施形態に従って使用される一例のコンピュータシステム100を示す。図1のシステム100が例示にすぎず、本技術が、汎用ネットワークコンピュータシステム、埋め込みコンピュータシステム、光コンピュータシステム、仮想コンピュータシステム、サーバ装置、クライアント装置、様々な中間装置/ノード、独立型コンピュータシステム、デジタルカメラ、マルチメディアコンソール、マルチメディア手持ち式装置等を含む多くの異なるコンピュータシステム上又はそれらのコンピュータシステム内で動作することができることが理解される。図1に示すように、図1のコンピュータシステム100は、たとえば、フロッピー(登録商標)ディスク、及びコンパクトディスク等のような、当該コンピュータシステムに結合されている周辺コンピュータ可読媒体102を有するように良好に適合される。
図1のシステム100は、情報を通信するためのアドレス/データバス104と、バス104に結合される、情報及び命令を処理するプロセッサ106Aとを備える。図1に示すように、システム100は、複数のプロセッサ106A、106B、及び106Cが存在するマルチプロセッサ環境にもよく適している。逆に、システム100は、たとえば、プロセッサ106Aのような単一のプロセッサを有することにもよく適している。プロセッサ106A、106B、及び106Cは、様々な種類のマイクロプロセッサのうちのいずれであってもよい。システム100は、バス104に結合される、プロセッサ106A、106B、及び106Cのための情報及び命令を記憶するコンピュータ使用可能揮発性メモリ108、たとえばランダムアクセスメモリ(RAM)のようなデータ記憶機能も備える。システム100は、バス104に結合される、プロセッサ106A、106B、及び106Cのための静的な情報及び命令を記憶するコンピュータ使用可能不揮発性メモリ110、たとえば読み取り専用メモリ(ROM)も含む。システム100内には、バス104に結合される、情報及び命令を記憶するデータ記憶ユニット112(たとえば、磁気ディスク又は光ディスク及びディスクドライブ)も存在する。システム100は、バス104に結合される、プロセッサ106A、又はプロセッサ106A、106B、及び106Cに情報及びコマンド選択を伝えるための、英数字キー及び機能キーを含むオプションの英数字入力装置114も備える。システム100は、バス104に結合される、プロセッサ106A、又はプロセッサ106A、106B、及び106Cにユーザ入力情報及びコマンド選択を伝えるオプションのカーソル制御装置116も備える。本実施形態のシステム100は、バス104に結合される、情報を表示するオプションの表示装置118も備える。
図1をさらに参照すると、オプションの表示装置118は、液晶装置、陰極線管、プラズマディスプレイ装置、又は、ユーザが認識可能なグラフィック画像、及び/若しくはシンボル、若しくは英数字文字の作成に適した他の表示装置とすることができる。オプションのカーソル制御装置116は、コンピュータユーザが、表示装置118の表示画面上での可視シンボル(カーソル)の移動を、動的にシグナル伝達することができるようにする。所与の方向への移動又は変位様式をシグナリングすることが可能なトラックボール、マウス、タッチパッド、ジョイスティック、マルチメディア遠隔制御装置上の方向キー及び入力キー、又は英数字入力装置114上の特殊キーを含む、カーソル制御装置116の多くの実施態様が当該技術分野において既知である。代替的に、特殊キー及びキーシーケンスコマンドを使用して英数字入力装置114からの入力を介して、カーソルを方向付け且つ/又はアクティブ化することができることが理解されよう。システム100は、たとえば、ボイスコマンドのような他の手段、又は手の動きの解釈によって方向付けされるカーソルを有することにもよく適している。
図1のシステム100は、声又は音楽のような音声入力を受信することを可能にする、マイクロフォン又は音声入力ジャックのような音声入力装置119もオプションで備える。たとえば、一実施形態では、声の入力は音声入力装置119を解して受信され、プロセッサ106A上で実行されているアプリケーション124によって処理され、次にデータ記憶ユニット112にデジタルで記憶される。システム100は、システム100を外部エンティティに結合する入出力装置120も備える。たとえば、一実施形態では、入出力装置120は、システム100と、インターネット等であるがこれに制限されない外部ネットワークとの間で有線又は無線の通信を可能にするモデムである。
図1をさらに参照して、システム100の他の様々な構成要素を示す。具体的には、オペレーティングシステム122、アプリケーション124、モジュール126、及びデータ128は、存在する場合、典型的には、コンピュータ使用可能揮発性メモリ108、たとえばランダムアクセスメモリ(RAM)、及びデータ記憶ユニット112の1つ又は幾つかの組み合わせ内に常駐するものとして示される。一実施形態では、本技術は、たとえば、RAM108内のメモリロケーション及び/又はデータ記憶ユニット112内のメモリエリアにアプリケーション124又はモジュール126として記憶される。
[パーソナライズドスライドショー生成のための本技術の全体的な説明]
[概説]
パーソナライズドスライドショー生成のための本技術によって、ユーザは、1つ又は複数のデジタル画像(本明細書では1つ又は複数の「画像」と呼ばれる)とのユーザの対話によってパーソナライズされたスライドショーを作成することが可能になる。パーソナライズドスライドショー生成のための本方法及びシステムは、提示される1つ又は複数の画像とのユーザ対話を受信し、これらの対話を使用して対話スクリプトを生成する。ユーザ対話の一例は、たとえば、ユーザ対話装置を利用するユーザから受信される、提示される画像の個人的に興味深い部分にパン又はズームインするための視覚対話のような、視覚表示対話である。ユーザ対話の別の例は、たとえば、音声入力装置を利用しているユーザから受信される、提示される画像のムードを設定するための音楽を記録するか、提示される画像に示されているものに関する言葉による説明を記録するか、又は、提示される画像の、ユーザがパン若しくはズームした部分に示されているものに関して言葉による説明を記録するための音声対話のような、提示される画像に関連付けられる音声対話である。ユーザ対話のさらに別の例は、視覚表示対話が発生する時刻に基づいて受信されるか、音声対話が発生する時刻に基づいて受信されるか、又は、ユーザが、別の画像と比較しての1つの画像、若しくは画像の別の部分と比較しての画像の一部分を閲覧し且つ/若しくはそれらと対話する時間の長さに関連付けられて受信される時間ベースの対話のような、時間ベースの対話である。
[概説]
パーソナライズドスライドショー生成のための本技術によって、ユーザは、1つ又は複数のデジタル画像(本明細書では1つ又は複数の「画像」と呼ばれる)とのユーザの対話によってパーソナライズされたスライドショーを作成することが可能になる。パーソナライズドスライドショー生成のための本方法及びシステムは、提示される1つ又は複数の画像とのユーザ対話を受信し、これらの対話を使用して対話スクリプトを生成する。ユーザ対話の一例は、たとえば、ユーザ対話装置を利用するユーザから受信される、提示される画像の個人的に興味深い部分にパン又はズームインするための視覚対話のような、視覚表示対話である。ユーザ対話の別の例は、たとえば、音声入力装置を利用しているユーザから受信される、提示される画像のムードを設定するための音楽を記録するか、提示される画像に示されているものに関する言葉による説明を記録するか、又は、提示される画像の、ユーザがパン若しくはズームした部分に示されているものに関して言葉による説明を記録するための音声対話のような、提示される画像に関連付けられる音声対話である。ユーザ対話のさらに別の例は、視覚表示対話が発生する時刻に基づいて受信されるか、音声対話が発生する時刻に基づいて受信されるか、又は、ユーザが、別の画像と比較しての1つの画像、若しくは画像の別の部分と比較しての画像の一部分を閲覧し且つ/若しくはそれらと対話する時間の長さに関連付けられて受信される時間ベースの対話のような、時間ベースの対話である。
対話スクリプトにおいて、ユーザ対話は、当該ユーザ対話が生成されたときに提示された画像に関連付けられる。次に、パーソナライズドスライドショー生成器は、対話スクリプトを対話先の1つ又は複数の画像と併せて利用して、当該1つ又は複数の画像からスライドショーを反復して生成する。このようにして、スライドショーは、スライドショー内で表示される1つ又は複数の画像とのユーザの以前の対話に従ってパーソナライズされる。さらに、スライドショースクリプト及び関連付けられる1つ又は複数の画像から、同じパーソナライズドスライドショーを反復して生成することができる。
スライドショースクリプトは、関連付けられる1つ又は複数の画像とは別個のエンティティとして記憶可能である。これは、特定の画像又は画像セットから、スライドーショーの各バージョンに関して当該1つ若しくは複数の画像、又はそれらの変更バージョンを保存することなく、複数のスライドショーを生成することができることを意味する。結果として、スライドショーを記憶する従来の技法と比較して、記憶空間のかなりの節約が達成される。
[パーソナライズドスライドショー生成のためのシステム例]
図2は、本技術の一実施形態による、パーソナライズドスライドショー生成のための一例のシステム200のブロック図である。システム200は、受信されるユーザ対話から対話スクリプトを生成すること、及び、次にその対話スクリプトを、当該対話スクリプトに関連付けられる1つ又は複数の画像と統合することによって、パーソナライズドスライドショーを生成する。図示されるように、システム200は、オプションの画像プレゼンタ205と、スクリプト生成器210と、パーソナライズドスライドショー生成エンジン215と、オプションのスライドショーレコーダ220とで構成される。
図2は、本技術の一実施形態による、パーソナライズドスライドショー生成のための一例のシステム200のブロック図である。システム200は、受信されるユーザ対話から対話スクリプトを生成すること、及び、次にその対話スクリプトを、当該対話スクリプトに関連付けられる1つ又は複数の画像と統合することによって、パーソナライズドスライドショーを生成する。図示されるように、システム200は、オプションの画像プレゼンタ205と、スクリプト生成器210と、パーソナライズドスライドショー生成エンジン215と、オプションのスライドショーレコーダ220とで構成される。
オプションの画像プレゼンタ205は、表示装置118のような表示装置上で閲覧するためにデジタル画像ファイルを開くのに使用される画像ビューアである。これは、たとえば、何らかの自動化された順序(ファイル名による等)で実行するか、又は、たとえば、ユーザが自由に選択するためにサムネイル画像のセットを提供することによって実行する等の、多数の既知の方法で実行することができる。
図示されるように、画像プレゼンタ205は、画像記憶装置240、1つ又は複数のユーザ対話装置245、及びスクリプト生成器210と結合される。画像プレゼンタ205は、ユーザが閲覧するために、デジタル画像操作の技術分野において既知の様式で、画像記憶装置240からの1つ又は複数の画像を復号し、表示装置118上等に提示する。画像プレゼンタ205は、システム200の動作に必要な機能を提供する。したがって、幾つかの実施形態において、画像プレゼンタ205が、システム200の統合された部分として含まれる。
しかし、画像プレゼンタ205をシステム200内に含めることは、スクリプト生成器210のようなシステム200の構成要素が、システム200の外部にある画像プレゼンタ205と連動するように構成される実施形態におけるオプションである。たとえば、一実施形態では、システム200は、コンピュータシステム100上で実行されるアプリケーション124として実装される。そのような一実施形態では、画像プレゼンタ205は、オペレーションシステム122の常駐部分として、又は別のアプリケーション124として、システム200の外部にあり、スクリプト生成器210は、外部の画像プレゼンタ205と結合するように構成される。そのような外部画像プレゼンタ205の一例は、Microsoft Windows(登録商標) XPオペレーティングシステムに付属のPicture and Fax Viewerである。通常、画像プレゼンタ205は、システム200の内部にあろうと、又は外部にあろうと、表示のためのデジタル画像を画像記憶装置240から取り出す。
様々な実施形態において、画像記憶装置240は、フラッシュメモリカード、ネットワーク評価済みの記憶領域、データ記憶ユニット112、周辺コンピュータ読取り可能媒体102、又は他の同様の記憶領域若しくはそのような記憶領域の組み合わせのような記憶場所である。
一実施形態では、スクリプト生成器210は画像に関連付けられるユーザ対話を用いて対話スクリプトを生成するように構成される。図2に示すように、スクリプト生成器210は、対話捕捉器212と、オプションの対話プロセッサ213とを備える。スクリプト生成器210は、1つ又は複数のユーザ対話装置245、画像プレゼンタ205、及びパーソナライズドスライドショー生成エンジン215と結合される。
本技術の実施形態に関して、ユーザ対話装置245は、ユーザが提示される画像と対話するのに利用することができる任意の入力装置を備える。したがって、たとえば、一実施形態ではユーザ対話装置245は、カーソル制御装置116のようなカーソル制御装置を備える。同様に一実施形態では、対話装置245は、音声入力装置119のような音声入力装置を備える。
スクリプト生成器210によって対話スクリプト内に記録される対話は、画像プレゼンタ205によって、たとえば表示装置118上に提示されている画像を、閲覧、評価すると共に、その画像と対話しているユーザの主観的な対話である。画像が対話のためにユーザに提示される様式は、利用される画像プレゼンタ205の性質及び機能によって決まる。たとえば一実施形態では、画像プレゼンタ205は、ユーザに対し、たとえばデジタル画像ファイルのフォルダから順次提示する等で、画像を一度に自動的に提示する。一実施形態では、画像プレゼンタ205によって、ユーザは、たとえば、ユーザが対話することを所望するサムネイル画像又は特定のデジタル画像ファイルを選択して開くこと等によって、画像を閲覧すると共にその画像と対話する順序を選択することが可能になる。図2に示すように、スクリプト生成器210は、対話捕捉器212と、オプションの対話プロセッサ213とで構成される。
一実施形態では、対話捕捉器212は、1つ又は複数のユーザ対話装置からの1つ又は複数のユーザ対話を受信するためにアクセス可能である対話インタフェースを提供するように構成される。たとえば、一実施形態では、対話捕捉器212は画像プレゼンタ205と協働して、画像プレゼンタ205によって提示されている画像に関連付けられる、選択可能なボタンのセット、アイコン、制御可能なカーソルのようなユーザインタフェースを表示する。そのような実施形態において、対話捕捉器212は、ユーザが、カーソル制御装置116のようなユーザ対話装置245を用いて、カーソルを操作するか、又は選択可能なアイコン若しくはボタンを選択することによって、提示される画像と対話することを可能にする機能を提供する。たとえば、一実施形態では、カーソル制御装置116はマルチメディア遠隔制御装置であり、一方で別の実施形態では、カーソル制御装置116は、コンピュータマウス又は他の幾つかのカーソル制御手段である。
カーソル制御装置116が、たとえば、2つのボタン(左及び右)と、スクロールホイールとを有するコンピュータマウスである一実施形態を考察する。そのような1つの実施形態では、ユーザは、左ボタンを押下したままで、制御可能なカーソルを、提示される画像の、ユーザにとって個人的な興味を引く部分に動かすことによって、提示される画像の部分にパンする。これは、提示される画像に関連付けられる視覚表示対話の一例である。同様に、そのような1つの実施形態において、右ボタンを押下することによって、ユーザは記録機能を有効にすることができ、それによって、音声入力装置119のような対話装置245が有効にされ、現在ユーザに提示されている画像の会話による説明のような、音声入力が受信される。これは、提示される画像に関連付けられる音声対話の一例である。同様に、そのような実施形態において、ユーザは、スクロールホイールを一方向に転がすことによってカーソルを中心とする画像の部分上にズームインすることができ、同様に逆方向にスクロールホイールを回転させることによってズームアウトすることができる。これは、提示される画像に関連付けられる視覚表示対話の別の例である。したがって、画像は画像プレゼンタ205によってユーザに提示されている間に、対話捕捉器212は、提示される画像との1つ又は複数のユーザ対話を捕捉及び受信するための1つ又は複数のユーザ対話装置245の使用を有効にする手段を提供する。
一実施形態では、スクリプト生成器210は、提示される1つ又は複数の画像との、受信されるユーザ対話(複数可)から対話スクリプトを生成する。たとえば、ユーザ対話装置245がカーソル制御装置116である一実施形態では、スクリプト生成器210は、提示される画像に対するカーソル制御装置119の位置的移動を記録する。たとえば、マウスの、パン及びズームに関連付けられる位置的移動を記録することによって、提示される画像に関連付けられるユーザの視覚表示対話の対話スクリプトが提供される。同様に、ユーザによって生成されると共に画像又は画像の部分に関連付けられる音又は会話による説明を記録することによって、提示される画像又はその部分に関連付けられるユーザの音声対話の対話スクリプトが提供される。
同様に、一実施形態では、各記録される対話はまた、その対話が受信された時に関連付けられる時間ラベルでタグ付けもされる。これは、たとえば、対話に関連付けられるシステムクロック時刻を受信及び記録すること等によって、多岐にわたる方式で行うことができる。一実施形態では、このような時間ベースの対話によって、対話スクリプトに記録されている対話を、ユーザによって対話が行われたのと同じ時間フレーム内で再生することが可能になる。別の実施形態では、このような時間ベースの対話によって、対話スクリプト内の対話の部分を、ユーザが画像プレゼンタ205によって提示される画像との元の対話又は一連の対話を生み出すのにかかった実際の時間に比例して何倍かにスケールアップ又はスケールダウンされた時間フレーム内で再生することが可能になる。
一実施形態では、オプションの対話プロセッサ213は、対話捕捉器212によって捕捉される幾つかの対話又は全ての対話を後処理するように構成される。一実施形態では、対話プロセッサ213は、対話捕捉器212によって対話が捕捉された後であるが、捕捉された対話がスクリプト生成器210によって記録される前に、処理を実行する。別の実施形態では、対話プロセッサ213の機能は、パーソナライズドスライドショー生成エンジン215に含まれ、既に対話スクリプト内に組み込まれている対話を処理するのに使用される。
一例として、一実施形態では、対話プロセッサ213は、捕捉された位置入力を、望ましくないジッターを当該位置入力から除去するフィルタリングメカニズムを通じて平滑化する。そのような1つの実施形態では、たとえば、提示される画像の1つの部分から提示される画像の別の部分にパンする等の、提示される画像に関連付けられる視覚表示対話を提供するとき、ユーザの手がわずかに震える場合がある。対話捕捉器212によって捕捉されると、このパン経路はわずかにぶれる場合があり、たとえば、平坦な経路から、所々でいくつかのピクセルが変化する場合がある。したがって、一実施形態では、対話プロセッサは、このわずかにぶれている経路を、スクリプト生成器210によって対話スクリプト内に記録される平坦なパン経路にフィルタリングする。
対話プロセッサ213は、生の対話入力又は対話スクリプト内に記録されている対話に対する他の多くの種類の対話処理も実行することができることが理解される。たとえば、一実施形態では、対話プロセッサ213は、表示されているカーソルの、画像の特定の部分の上での滞留時間を測定し、このような測定時間を使用して、提示される画像の様々な部分の、ユーザに対する相対的な個人的関連度を測る。一実施形態では、そのような相対的な個人的関連度を使用して、画像又は画像の部分を表示する時間の長さを決定する。そのような表示時間情報は、提示される画像に関連付けられる時間ベースの対話も含む。一実施形態では、そのように導出される表示時間情報は、画像(又はその一部)に関連付けられ、スクリプト生成器210によって対話スクリプト内に記録される。次に、パーソナライズドスライドショー生成エンジン215は、対話スクリプト内に記憶されているこの表示時間情報を利用して、当該対話スクリプトを使用して生成される後続のパーソナライズドスライドショーの間、関連付けられる画像(又はその部分)の表示時間を制御する。
パーソナライズドスライドショー生成エンジン215は、スクリプト生成器210、及び画像記憶装置240に結合される。一実施形態では、パーソナライズドスライドショー生成エンジン215は、対話スクリプト及びその対話に関連付けられる1つ又は複数の画像を利用してパーソナライズドスライドショーを生成するように構成される。パーソナライズドスライドショー生成エンジン215は、対話スクリプトを、当該スクリプト内の命令に関連付けられる各画像と統合して、スライドショーを作成する。この統合の1つの利点は、再現性である。たとえば、ユーザは、休暇旅行からの画像セットと一度対話することによって、対話スクリプトを作成することができる。パーソナライズドスライドショー生成エンジン215は、対話スクリプトを画像と統合して、同じパーソナライズドスライドショーを、ユーザがそれを閲覧するか又は流すことを所望する回数だけ再生することができる。同様に、別のユーザは同じ画像と対話することによって別個の対話スクリプトを作成することができる。その結果、この別個のスクリプトは、同じ画像セットから第2のパーソナライズドスライドショーを生成するのに使用可能である。
対話スクリプトは、画像又はその変形バージョンを含むのではなく、その代わり特定のユーザ対話又はユーザ対話のセットに関連付けられる各画像が記憶されている場所を示す位置情報を含むことが理解される。したがって、パーソナライズドスライドショー生成エンジン215は、要求されるときに画像を画像記憶装置240との結合を介して取り出すことによって、対話スクリプトからのユーザ対話(複数可)を、対話先の1つ又は複数の画像と統合する。パーソナライズドスライドショー生成エンジン215は、対話スクリプト内に記憶されると共に1つ又は複数の命令に関連付けられる画像位置情報に従って、パーソナライズドスライドショー内の各画像にアクセスし、当該画像を取り出す。これによって、特定の画像又は画像セットのための複数の対話スクリプトが、すべてのスライドショーに関して画像又は画像の変形バージョンを記憶する従来の手段によって生成される場合のこのような画像の複数のスライドショーの消費量より、著しく少なく消費することが可能になる。
対話スクリプトの記憶装置は、対話先の画像とは別個に、パーソナライズドスライドショーが、多岐にわたる場所に保存されると共にそこからアクセスされる画像で構成されることも可能にする。たとえば、一実施形態では、パーソナライズドスライドショー生成エンジン215は、デジタルカメラのフラッシュメモリカードからのスライドショーの第1の画像を取り出し、第2の画像をコンピュータのハードディスクドライブから取り出し、第3の画像を第1のコンピュータとネットワーク接続されている第2のコンピュータのディスクドライブから取り出し、第4の画像をインターネットウェブページから取り出す。
一実施形態では、パーソナライズドスライドショー生成エンジン215は、生成されたパーソナライズドスライドショー225を、表示装置118又は同様の表示装置のようなビデオ表示装置に出力する。別の実施形態では、パーソナライズドスライドショーは、パーソナライズドスライドショー生成器215からオプションのスライドショーレコーダ220に結合される。
一実施形態では、オプションのスライドショーレコーダ220は、受信されたパーソナライズドスライドショーをビデオファイルとして記録するように構成される。たとえば、一実施形態では、スライドショーレコーダ220は、パーソナライズドスライドショーを、動画エキスパートグループ(MPEG)と互換性のあるビデオファイルフォーマットで、ビデオファイルとして記録する。これによって、パーソナライズドスライドショー生成エンジン215に対するアクセスを有しないか、対話スクリプトによって参照されるデジタル画像の画像ファイルを有しないか、又はいずれも有しない装置が、パーソナライズドスライドショーを再生することが可能になる。さらに、スライドショーレコーダ220は、パーソナライズドスライドショーを、コンパクトディスク又はデジタル多用途ディスク等に保存すると共にその後別の人と共有することができるフォーマットで記憶する、好都合な手段を提供する。同様に、スライドショーレコーダ220は、パーソナライズドスライドショーを、簡単に電子メールで送信することができるか、又は他の方法でネットワークを介して別の場所、人、若しくは装置と共有することができるフォーマットで記憶する、好都合な手段を提供する。
[動作方法例]
以下の考察は、実施形態例の説明を通じて本技術の動作を詳細に説明する。図3及び図6を参照すると、フローチャート300及び600は、それぞれ本技術の様々な実施形態によって使用されるステップ例を示している。フローチャート300及び600は、様々な実施形態において、コンピュータ読取り可能且つコンピュータ実行可能な命令の制御下にあるプロセッサによって実行されるプロセスを含む。コンピュータ読取り可能且つコンピュータ実行可能な命令は、たとえば、図1のコンピュータ使用可能揮発性メモリ108、コンピュータ使用可能不揮発性メモリ110、及び/又はデータ記憶装置112のようなデータ記憶装置機能内に存在する。コンピュータ読取り可能且つコンピュータ実行可能な命令は、たとえば、図1のプロセッサ106A並びに/又はプロセッサ106A、106B、及び106Cを制御するか又は当該プロセッサと協働するのに使用される。フローチャート300及び600には特定のステップが開示されるが、これらのステップは例である。すなわち、実施形態は、フローチャート300及び600に記載される他の様々なステップ又はそれらのステップの変形形態を実行するのによく適している。フローチャート300及び600内のステップは、提示されるものと異なる順序で実行されてもよく、フローチャート300及び600内のステップの全てが実行されなくてもよいことが理解される。
以下の考察は、実施形態例の説明を通じて本技術の動作を詳細に説明する。図3及び図6を参照すると、フローチャート300及び600は、それぞれ本技術の様々な実施形態によって使用されるステップ例を示している。フローチャート300及び600は、様々な実施形態において、コンピュータ読取り可能且つコンピュータ実行可能な命令の制御下にあるプロセッサによって実行されるプロセスを含む。コンピュータ読取り可能且つコンピュータ実行可能な命令は、たとえば、図1のコンピュータ使用可能揮発性メモリ108、コンピュータ使用可能不揮発性メモリ110、及び/又はデータ記憶装置112のようなデータ記憶装置機能内に存在する。コンピュータ読取り可能且つコンピュータ実行可能な命令は、たとえば、図1のプロセッサ106A並びに/又はプロセッサ106A、106B、及び106Cを制御するか又は当該プロセッサと協働するのに使用される。フローチャート300及び600には特定のステップが開示されるが、これらのステップは例である。すなわち、実施形態は、フローチャート300及び600に記載される他の様々なステップ又はそれらのステップの変形形態を実行するのによく適している。フローチャート300及び600内のステップは、提示されるものと異なる順序で実行されてもよく、フローチャート300及び600内のステップの全てが実行されなくてもよいことが理解される。
[対話スクリプトの生成]
図3は、本技術の実施形態による、対話スクリプトを生成する方法のフローチャート300である。フローチャート300の説明は、図1、図2、及び図4に示される要素を参照することによって容易になる。
図3は、本技術の実施形態による、対話スクリプトを生成する方法のフローチャート300である。フローチャート300の説明は、図1、図2、及び図4に示される要素を参照することによって容易になる。
一実施形態では、フローチャート300の310において、本方法は位置インタフェース装置からのユーザ対話を受信するためにアクセス可能な位置的対話インタフェースを提供し、当該位置的対話インタフェースは、画像の提示と同時に利用可能である。提示される技術では、位置的インタフェースを提供することは、たとえば、ユーザが、画像表示装置上に表示される画像に関して使用及び制御するのに利用可能な、制御可能なカーソル及び/又は選択可能なアイコン若しくはボタンのような、位置的対話インタフェースを作成することを含む。いくつかの実施形態では、これは、システム200の外部又は内部にある画像プレゼンタ205と協働するための位置的インタフェースを構成し、それによって、画像プレゼンタ205によって提示される画像に関連して制御可能なカーソルを操作するユーザ対話を、対話捕捉器212が受信及び捕捉できるようにすることを含む。このような位置的インタフェースの一実施形態は、図4の要素によって示される。
図4は、本技術の一実施形態による、デジタル画像400との対話例を示す図である。図4では、デジタル画像400が、画像プレゼンタ205によって表示装置118上に表示されている。画像400は、父親407並びに2人の子供405及び406の表示を含む。子供406は、玩具の自転車408を握って表示されている。画像400は、本明細書において例として示されるが、表示装置118上に表示されるデジタル画像を表すことが理解される。
図4において、対話捕捉212は、制御可能なカーソル450の形態で位置的対話インタフェースを提供している。一実施形態では、制御可能なカーソル450は、カーソル制御装置116のような位置的インタフェース装置である、ユーザ対話装置245の使用を通じて、画像400に関して操作可能である。たとえば、対話捕捉器212は、画像400の上に制御可能なカーソル450を重ね、それによってユーザが当該制御可能なカーソル450で、カーソル制御装置116を使用することによって操作することができるようにする。そのような操作に応答して、視覚表示対話、音声対話、及び/又は時間ベースの対話のようなユーザ対話は、対話捕捉器212によって受信される。
限定ではなく例示の目的で、一実施形態では、対話捕捉器212によって提供される位置的対話インタフェースは、ユーザ対話を位置的ユーザ対話装置245から受信する。位置的ユーザ対話装置245は、スクロールホイールを有する2ボタンコンピュータマウスの形態のカーソル制御装置116を備える。このような例において、視覚表示対話、音声対話、及び/又は時間ベースの対話の形態のユーザ対話は、コンピュータマウスのユーザ操作に応答して、対話捕捉器212によって受信される。たとえば、視覚表示対話は、ユーザが、コンピュータマウスを利用して制御可能なカーソル450を領域415の中心に位置決めし、続いてスクロールホイールをスクロールして領域415上にズームインするときに、対話捕捉器212によって受信され、それによって、画像400の、領域415によって表される部分が表示装置118のディスプレイ内にセンタリングされると共に、当該ディスプレイ上で拡大される。
一実施形態では、対話捕捉器212は、たとえば、この視覚表示対話の発生に関連付けられる時刻の形態で、時間ベースの対話も受信する。この時間ベースの対話は、視覚表示対話に関連付けられる時間タグの形態とすることができる。
この例を続けると、一実施形態では、ユーザは、コンピュータマウスの右ボタンをクリックすると共にそれを保持して、音声入力装置119のような音声ユーザ対話装置を介して記録機能を有効にする。次に、ユーザはたとえば、「これらは私の2人の息子、ジェフ及びクリフである。」と言い、次に右マウスボタンを離して記録機能を無効にする。ユーザインタフェース212は、受信される音声対話を、現在表示装置118のディスプレイ上に表示されている画像400又はその部分(領域415等)と関連付ける。一実施形態では、対話捕捉器212は音声対話に関連付けられる時間タグのような時間ベースの入力も受信する。
別の実施形態では、対話捕捉器212は、位置的対話インタフェースの部分として、「音声記録」ボタン404のような選択可能なボタン及び/又はアイコンをさらに提供する。そのような実施形態では、制御可能なカーソル450は、また、表示装置118の表示領域内に表示される、そのように提供されるボタン及び/又はアイコンを選択するように操作可能である。そのような一実施形態では、ユーザは、制御可能なカーソル450を音声記録ボタン404上に位置決めし、次に、たとえば右マウスボタンをクリックして音声入力を有効又は無効にすることによって、記録機能を有効又は無効にする。たとえば、音声記録ボタン404がクリックされて音声記録が有効になると、対話捕捉器212は、音声対話を、音声入力装置119のような対話装置245からの入力として受信する。ユーザインタフェース212は、受信される音声対話を、現在表示装置118のディスプレイ上に提示されている画像400又はその部分(領域415等)と関連付ける。一実施形態では、対話捕捉器212は、音声対話に関連付けられる時間タグのような時間ベースの入力も受信する。
上述した例を続けると、領域415にズームした後、次に、ユーザはマウスを左クリックすると共に、制御可能なカーソル450を領域416の中心に再位置決めすることができ、次に、スクロールホイールをスクロールして領域416上にズームする。この動作に応答して、対話捕捉器212は、領域415の中心から領域416の中心へ位置的にパンし、次にズームして領域416を拡大する、視覚表示対話を受信する。一実施形態では、これらの視覚表示対話のそれぞれに併せて時間ベースの対話も受信される。同様に、ユーザは次にマウスを右クリックして、ズームされている領域416に現在表示されている玩具の自転車408に言及して「これはジェフの玩具の自転車である」と言うことができる。このように、対話捕捉器212は、音声対話、「これはジェフの玩具の自転車である」を受信すると共に、一実施形態では、この音声対話に関連付けられる時間ベースの入力を受信する。
上述した例を続けると、領域416にズームした後、次に、ユーザは、ズームアウトして画像400の全体の表示に戻り、マウスの左ボタンをクリックすると共に、制御可能なカーソル450を領域417の中心に再位置決めし、次に、スクロールホイールをスクロールして領域417上にズームすることができる。これらの動作に応答して、対話捕捉器212は、領域416から位置的にズームアウトし、領域416の中心から領域417の中心へパンし、次にズームして領域417を拡大する視覚表示対話を受信する。一実施形態では、これらの視覚表示対話のそれぞれに併せて時間ベースの対話も受信される。同様に、ユーザは次にマウスを右クリックして、ズームされている領域417として現在表示されている、子供406及び父親407の動作に言及して「私の息子クリフは私の腕の中に飛び込もうとしている」と言うことができる。このように、対話捕捉器212は、音声対話、「私の息子クリフは私の腕の中に飛び込もうとしている」を受信すると共に、一実施形態では、この音声対話に関連付けられる時間ベースの入力を受信する。
一実施形態では、フローチャート300の320において、本方法は対話スクリプトを生成する。対話スクリプトは、提示される画像とのユーザ対話に基づいてパーソナライズドスライドショーを生成するための命令を含む。対話スクリプト及びそれに含まれる命令は、スクリプト生成器210によって、対話捕捉器212によって受信されるユーザ対話から生成される。一実施形態では、受信されるユーザ対話は、いかなる中間処理も行わずに、対話スクリプト内に命令として直接記録される。一方、別の実施形態では、受信される対話のうちの幾つか又は全ては、対話スクリプト内に命令として記録される前に、対話プロセッサ213によって処理される。そのような処理の、上記で記載した一例は、フィルタリングである。たとえば、領域415にズームインするための、受信される視覚表示対話は、領域415上にズームすることに関連付けられる、ズーム率のような位置情報を、対話スクリプト内に命令として記録する前に、対話プロセッサ213によってフィルタリングされて位置的ジッターが除去される。
画像400に関連付けられる前の例を続けると、領域415上へのズームのような視覚表示対話が、たとえば位置情報として対話スクリプト内に記録される。この位置情報は、パーソナライズドスライドショー生成エンジン215が、ユーザ対話(領域415へのズームイン等)をパーソナライズドスライドショーの形態で再作成するために従う命令としての役割を果たす。一実施形態では、これは、画像400の画素に関して、領域415の中心のx−y二次元位置情報を記憶すること、また、領域415に関連付けられる、ズーム率のような第三次元(z次元)の位置情報を記録することも含む。
同様に、一実施形態では、これは、領域415上へのズームに関連付けられる時間タグのような、対話捕捉器212によって受信される時間ベースの対話を記録することをさらに含む。たとえば、一実施形態では、ズームが(たとえば、システム100のクロック装置によれば)1:05:59pmに発生した場合、スクリプト生成器210はこの時刻から生成される時間タグを対話スクリプト内に記録する。このようにズームの位置情報及び時間タグ情報は、領域415に関連付けられると共に、スクリプト生成器210によって、対話スクリプト内に命令として記録される。
同様に、対話捕捉器212によって受信される、「これらは私の2人の息子、ジェフ及びクリフである」のような音声対話も、スクリプト生成器210によって対話スクリプト内に記憶される。一実施形態では、たとえば音声対話の受信の開始時に、時間ベースの対話も受信され、スクリプト生成器210によって、対話スクリプト内に命令として記憶される。たとえば、音声対話に関連付けられる時間ベースの対話は、時間タグ1:06:03pmを含むことができ、当該タグは対話スクリプト内に記憶されると共に、音声対話、「これらは私の2人の息子、ジェフ及びクリフである」に関連付けられる。
同様に、この例において、対話捕捉器212は、領域416の中心へのパンに関連付けられる時間タグのような時間ベースの対話を受信する。たとえば、一実施形態では、パンが(たとえば、システム100のクロック装置によれば)1:06:10pmに発生した場合、スクリプト生成器210はこの時間ベースの情報から時間タグ命令を生成すると共に、この時間タグ命令を対話スクリプト内に記録する。パンの位置情報及び時間タグ情報は、領域416に関連付けられると共にスクリプト生成器210によって、対話スクリプト内に命令として記録される。
一実施形態では、対話スクリプトを生成することは、視覚表示対話及び/又は音声対話に関連付けられる、位置命令のような他の命令の再生を同期させるための命令を含む対話スクリプトを生成することを含む。これによって、パーソナライズドスライドショー生成エンジン215が、ユーザ対話から生成される命令であって、このような対話がパーソナライズドスライドショーと併せて適切な時刻に再作成される、命令を再生することが可能になる。上述した時間タグのような一連の時間タグは、パーソナライズドスライドショー生成エンジン215が、対話スクリプト内の特定の動作をいつ開始又は実行するかを決定するのに使用する命令として機能する。
たとえば、そのような時間タグは、どれだけ速く領域415にズームインするか、どれだけ長く領域415上にズームし続けるか、又は対話スクリプト内に記憶されると共に領域415に関連付けられる音声対話をいつ再生するかに関する命令を提供する。このように、上記の例で説明したように、対話スクリプト内に記録されている時間タグ命令に基づいて、パーソナライズドスライドショー生成エンジン215は、時刻Tに領域415上にズームするための命令を有する。さらに、4秒後(T+4秒)に、パーソナライズドスライドショー生成エンジン215は、受信される音声対話、「これらは私の2人の息子、ジェフ及びクリフである」の再生を開始するための命令(時間タグを介する)を有する。
そのようなユーザ対話及びスクリプト生成シーケンスは、画像プレゼンタ205によって提示される画像毎に繰り返される。各提示される画像に関して、スクリプト生成器210は受信されるユーザ情報を対話スクリプト内に記録する。そのような画像が、画像プレゼンタ205によって自動的に提示される一実施形態では、ユーザ入力が、たとえば5秒のような所定の時間内に一切受信されない場合、ウォッチドッグタイマが時間切れになる。そのような一実施形態では、スクリプト生成器210は、対話スクリプト内に、時間切れの画像に関連するユーザ対話情報を一切記録しない。一実施形態では、そのような時間切れの画像は、パーソナライズドスライドショー生成エンジン215によって生成されるパーソナライズドスライドショーにおいて、所定の時間の間しか表示されない。一例では、たとえばマウスボタンをダブルクリックすることのような特定のユーザ対話入力によって画像がスキップされ、その画像に関連付けられる情報は、スクリプト生成器210によって対話スクリプト内に一切記録されない。したがって、対話スクリプトから結果として生成されるパーソナライズドスライドショーは、スキップされた画像を表示しない。
[パーソナライズドスライドショー生成]
図5は、本技術の一実施形態による、パーソナライズドスライドショーを生成する方法のフローチャート500である。フローチャート500の説明は、図1、図2、及び図4に示される要素を参照することによって容易になる。
図5は、本技術の一実施形態による、パーソナライズドスライドショーを生成する方法のフローチャート500である。フローチャート500の説明は、図1、図2、及び図4に示される要素を参照することによって容易になる。
一実施形態では、フローチャート500の510において、本方法は1つ又は複数の画像に関連付けられる1つ又は複数のユーザ対話を受信する。フローチャート300の310に関連して上記で説明したように、且つ本明細書において画像400を参照して例として示されるように、本方法は、対話捕捉器212が、画像プレゼンタ205によって提示される1つのデジタル画像(若しくは複数のデジタル画像)又はその部分に関連付けられる、視覚表示対話、音声対話、又は時間ベースの対話のような1つ又は複数のユーザ対話を受信することを含む。
一実施形態では、フローチャート300の要素310に関連して上記で説明したように、そのようなユーザ対話は、ユーザに提供されると共にユーザ対話装置245からのユーザ対話を受信するためにアクセス可能な対話インタフェースに応答して受信される。上述したように、そのような位置的対話インタフェースは、画像400のような各提示される画像の提示と同時に利用可能である。一実施形態では、図4に示すように、そのような位置的対話インタフェースは、制御可能なカーソル450、及び/又は、「音声記録」ボタン404のような1つ若しくは複数の選択可能なボタン若しくはアイコンを備える。一実施形態では、ユーザ対話装置245は、マイクロフォンのような音声入力装置119を備える。一実施形態では、ユーザ対話装置245は、マウス、ジョイスティック、トラックボール、マルチメディア遠隔制御装置、又は他のカーソル制御手段のような、カーソル制御装置116を備える。
一実施形態では、フローチャート500の520において、本方法は1つ又は複数のユーザ対話から対話スクリプトを生成する。対話スクリプトの生成は、フローチャート300の要素320に関して本明細書で提供された説明と一致する。このように、スクリプト生成器210は、対話捕捉器212によって受信される1つ又は複数のユーザ対話を利用して対話スクリプトを生成する。
本明細書で上述したように、一実施形態では、対話スクリプトは、画像プレゼンタ205によって提示される1つ又は複数の画像に関連付けられる視覚表示対話から生成されるスクリプト命令を含む。図4の画像400に関連して提供された例に従って、そのような1つの視覚表示対話から生成される対話スクリプト命令は、領域415上にズームするための位置的命令を含む。この位置的命令は、ユーザが制御可能なカーソル450を領域415にセンタリングし、次にカーソル制御装置116を操作して領域415上にズームインしたときに、対話捕捉器212によって受信される視覚表示対話から生成される。
一実施形態では、受信される視覚表示対話は、位置的ジッターを除去するために対話プロセッサ213によって処理される。たとえば、領域415から領域416にパンするという視覚表示対話は、対話捕捉器212によって受信される。一実施形態では、このパン経路は、ユーザから受信される、ぶれているパン入力が、平滑な位置的パン命令に変換されるようにフィルタリングされ、次にそのパン経路は、スクリプト生成器210によって対話スクリプト内に記録される。
本明細書で上述したように、一実施形態では、対話スクリプトは、画像プレゼンタ205によって提示される1つ又は複数の画像に関連付けられる音声対話から生成されるスクリプト命令を含む。図4の画像400に関連して提供された例に従って、そのような受信される1つの音声対話から生成される対話スクリプト命令は、ズームされている領域415に関連してユーザから受信される音声対話から生成される、記録されている音声対話、「これらは私の2人の息子、ジェフ及びクリフである」を再生するための命令を含む。
本明細書で上述したように、一実施形態では、対話スクリプトは、画像プレゼンタ205によって提示される1つ又は複数の画像に関連付けられる時間ベースの対話から生成されるスクリプト命令を含む。図4の画像400に関連して提供された例に従って、そのような時間ベースの対話から生成される対話スクリプト命令は、領域415上にズームするという視覚表示対話に関連付けられる時間タグ命令と、記録されている音声対話、「これらは私の2人の息子、ジェフ及びクリフである」の再生に関連付けられる時間命令と、領域416の中心にパンするという視覚表示対話に関連付けられる時間タグ命令とを含む。一実施形態では、パーソナライズドスライドショー生成エンジン215は、これらの命令を解釈実行して、画像400の領域415へズームインした4秒後に記録されている音声の再生を開始し、次に、その記録されている音声対話の再生の7秒後に領域416の中心にパンする。
一実施形態では、フローチャート500の530において、本方法は、1つ又は複数の画像及び対話スクリプトを利用してパーソナライズドスライドショーを生成する。一実施形態では、パーソナライズドスライドショー生成エンジン215は、対話スクリプト内の1つ又は複数の命令に関連付けられる1つのデジタル画像(又は複数のデジタル画像)を取り出すことによってこれを達成する。各デジタル画像は画像記憶装置240から取り出され、次にパーソナライズドスライドショー(又は、対話スクリプトが2つ以上の画像に関連付けられる命令を含む場合、パーソナライズドスライドショーの一部分)を作成するために、対話スクリプト内の、当該画像に関連付けられる命令と統合される。一実施形態では、パーソナライズドスライドショーを生成することは、パーソナライズドスライドショー生成エンジン215が、表示装置118のような表示装置上に、統合された画像(複数可)及びスクリプト命令(複数可)を、パーソナライズドスライドショー225として出力することを含む。
図4の画像400、並びに領域415、416、及び417を参照して本明細書で説明されるユーザ対話を考察する。この例に従って、一実施形態では、パーソナライズドスライドショー生成エンジン215は、画像400を、画像400との対話から生成される対話スクリプトと共に統合して、パーソナライズドスライドショー225を生成する。たとえば、そのようなパーソナライズドスライドショーは、画像400を表示することによって開始する。次に、領域415がズームインされる。解説、「これらは私の2人の息子、Jジェフ及びクリフである」が流れる。次に、表示は領域416上にズームインする。解説、「これはジェフの玩具の自転車である」が流れる。次に表示はパンし、領域417にズームする。解説、「私の息子クリフは私の腕の中に飛び込もうとしている」が流れる。画像400が対話スクリプトによって記述される唯一の画像である一実施形態では、スライドショーは終了する。対話スクリプトによって他の画像が記述される一実施形態では、スライドショーは、対話スクリプトに従って同様のパーソナライズされた形態でこれらの画像のそれぞれを提示することによって継続する。
一実施形態では、パーソナライズドスライドショーを生成することは、パーソナライズドスライドショー生成エンジン215が、統合された画像(複数可)及びスクリプト命令(複数可)を、パーソナライズドスライドショー生成画像215の出力をビデオファイルとして記録するオプションのスライドショーレコーダ220に出力することを含む。たとえば、一実施形態では、スライドショーレコーダ220は、パーソナライズドスライドショー生成器の出力を、Motion Picture Experts Groupと互換性のあるビデオファイルとして記録し、当該ビデオファイルは、パーソナライズドスライドショー225として後に再生するために、たとえばハードディスクドライブに保存することもできるし、コンパクトディスク又はデジタルバーチャルディスクのような持ち運び可能媒体に記憶することもできる。
本技術の主題は、構造的特徴及び/又は方法論的動作に固有の言葉で説明されたが、添付の特許請求の範囲で規定される主題は、必ずしも上述した特定の特徴又は動作に限定されないことを理解されたい。そうではなく、上述した特定の特徴及び動作は、特許請求の範囲を実施する例示的な形態として開示される。
Claims (10)
- 画像に関連付けられるユーザ対話を受信し(510)、
前記ユーザ対話から対話スクリプトを生成し(520)、
パーソナライズドスライドショーを生成するために、前記画像及び前記対話スクリプトを利用すること(530)を含むことを特徴とするパーソナライズドスライドショーを生成する方法(500)。 - ユーザ対話装置から前記ユーザ対話を受信するためにアクセス可能な位置的対話インタフェースを設けることをさらに含み、
前記位置的対話インタフェースは、前記画像の提示と同時に利用可能であることを特徴とする請求項1に記載の方法(500)。 - 位置的ジッターを除去するために、前記視覚表示対話をフィルタリングすることによって前記視覚表示対話を処理することをさらに含むことを特徴とする請求項1に記載の方法(500)。
- パーソナライズドスライドショーを生成するために、前記画像及び前記対話スクリプトを利用すること(530)は、前記パーソナライズドスライドショーを表示装置に出力することをさらに含むことを特徴とする請求項1に記載の方法(500)。
- 前記パーソナライズドスライドショーをビデオファイルとして記録することをさらに含むことを特徴とする請求項1に記載の方法(500)。
- 前記ユーザ対話から対話スクリプトを生成すること(520)は、
前記画像に関連付けられる視覚表示対話から対話スクリプト命令を生成し、
前記画像に関連付けられる音声対話から対話スクリプト命令を生成し、
前記画像に関連付けられる時間ベースの対話から対話スクリプト命令を生成することを含むことを特徴とする請求項1に記載の方法(500)。 - 画像の提示と同時に利用可能である位置的インタフェース装置から、ユーザ対話を受信するためにアクセス可能な位置的対話インタフェースを設け(310)、
前記提示される画像との前記ユーザ対話に基づいてパーソナライズドスライドショーを生成するための命令を含む前記対話スクリプトを生成することを含むことを特徴とする対話スクリプトを生成する方法(300)。 - 前記位置的インタフェースからユーザ対話を受信するためにアクセス可能な位置的対話インタフェースを設けること(310)は、前記提示される画像との視覚表示対話を受信するためにアクセス可能な位置的インタフェースを設けることを含むことを特徴とする請求項7に記載の方法(300)。
- 前記位置的インタフェースからユーザ対話を受信するためにアクセス可能な位置的対話インタフェースを設けること(310)は、前記提示される画像との時間ベースの対話を受信するためにアクセス可能な位置的インタフェースを設けることを含むことを特徴とする請求項7に記載の方法(300)。
- 前記対話スクリプトを生成すること(320)は、音声対話の再生を、前記パーソナライズドスライドショーと関連して同期させるための命令を含む前記対話スクリプトを生成することをさらに含むことを特徴とする請求項7に記載の方法(300)。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US11/546,623 US7987423B2 (en) | 2006-10-11 | 2006-10-11 | Personalized slide show generation |
PCT/US2007/021771 WO2008045523A2 (en) | 2006-10-11 | 2007-10-11 | Personalized slide show generation |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2010507140A true JP2010507140A (ja) | 2010-03-04 |
Family
ID=39271265
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009532421A Pending JP2010507140A (ja) | 2006-10-11 | 2007-10-11 | パーソナライズドスライドショー生成 |
Country Status (5)
Country | Link |
---|---|
US (1) | US7987423B2 (ja) |
JP (1) | JP2010507140A (ja) |
CN (1) | CN101523392B (ja) |
GB (1) | GB2455942B (ja) |
WO (1) | WO2008045523A2 (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2018085018A (ja) * | 2016-11-25 | 2018-05-31 | エニーシステム株式会社 | 情報提供装置、情報提供方法および情報提供プログラム |
JP2018165993A (ja) * | 2018-07-03 | 2018-10-25 | エニーシステム株式会社 | 情報提供装置、情報提供方法および情報提供プログラム |
Families Citing this family (23)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3987025B2 (ja) * | 2002-12-12 | 2007-10-03 | シャープ株式会社 | マルチメディアデータ処理装置およびマルチメディアデータ処理プログラム |
US20080104516A1 (en) * | 2006-10-25 | 2008-05-01 | Ulead Systems, Inc. | System and method for editing slideshow |
JP4183003B2 (ja) * | 2006-11-09 | 2008-11-19 | ソニー株式会社 | 情報処理装置、情報処理方法、およびプログラム |
US8583165B2 (en) * | 2007-02-20 | 2013-11-12 | Bindu Rama Rao | System for cartoon creation and distribution to mobile devices |
JP5003377B2 (ja) * | 2007-09-21 | 2012-08-15 | パナソニック株式会社 | 電子機器におけるマークの位置あわせ方法 |
US20090307602A1 (en) * | 2008-06-06 | 2009-12-10 | Life In Focus, Llc | Systems and methods for creating and sharing a presentation |
US7721209B2 (en) * | 2008-09-08 | 2010-05-18 | Apple Inc. | Object-aware transitions |
JP5317630B2 (ja) * | 2008-11-07 | 2013-10-16 | キヤノン株式会社 | 画像配信装置、方法及びプログラム |
WO2011090467A1 (en) * | 2009-12-28 | 2011-07-28 | Hillcrest Laboratories Inc. | Tv internet browser |
US8701002B2 (en) * | 2011-04-19 | 2014-04-15 | Autodesk, Inc. | Hierarchical display and navigation of document revision histories |
US8874525B2 (en) | 2011-04-19 | 2014-10-28 | Autodesk, Inc. | Hierarchical display and navigation of document revision histories |
US9721324B2 (en) * | 2011-09-10 | 2017-08-01 | Microsoft Technology Licensing, Llc | Thumbnail zoom |
US9658687B2 (en) | 2011-09-30 | 2017-05-23 | Microsoft Technology Licensing, Llc | Visual focus-based control of coupled displays |
CN102572356B (zh) | 2012-01-16 | 2014-09-03 | 华为技术有限公司 | 记录会议的方法和会议系统 |
US20130323706A1 (en) * | 2012-06-05 | 2013-12-05 | Saad Ul Haq | Electronic performance management system for educational quality enhancement using time interactive presentation slides |
CN103384346B (zh) * | 2012-12-28 | 2016-09-28 | 深圳海联讯科技股份有限公司 | 一种ppt文件处理的方法及装置 |
US9626068B2 (en) * | 2013-06-06 | 2017-04-18 | Microsoft Technology Licensing, Llc | Automated system for organizing presentation slides |
WO2015030745A1 (en) * | 2013-08-28 | 2015-03-05 | Hewlett-Packard Development Company, L.P. | Managing presentations |
US9646654B2 (en) * | 2013-09-23 | 2017-05-09 | Darius Vahdat Pajouh | Synchronization of events and audio or video content during recording and playback of multimedia content items |
CN108040043A (zh) * | 2017-12-06 | 2018-05-15 | 中国地质大学(武汉) | 一种幻灯片权限控制播放新方法 |
CN108334540B (zh) * | 2017-12-15 | 2020-11-10 | 深圳市腾讯计算机系统有限公司 | 媒体信息的展示方法和装置、存储介质、电子装置 |
CN111831187B (zh) * | 2019-04-19 | 2024-03-26 | 珠海金山办公软件有限公司 | 一种演示文稿放映时长修改方法、装置及电子设备 |
US11029819B2 (en) * | 2019-05-23 | 2021-06-08 | Microsoft Technology Licensing, Llc | Systems and methods for semi-automated data transformation and presentation of content through adapted user interface |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH05274419A (ja) * | 1991-07-12 | 1993-10-22 | Matsushita Electric Ind Co Ltd | 情報提示装置及び提示情報作成装置 |
JPH0981769A (ja) * | 1995-09-14 | 1997-03-28 | Hitachi Ltd | アニメーション作成システム |
JP2005527996A (ja) * | 2001-09-13 | 2005-09-15 | ヒューレット・パッカード・カンパニー | プレゼンテーションを記録するためのシステム |
JP2005533398A (ja) * | 2001-09-13 | 2005-11-04 | ヒューレット・パッカード・カンパニー | リアルタイムスライドプレゼンテーションのマルチメディアデータオブジェクト、ならびにマルチメディアデータオブジェクトを記録し閲覧するシステムおよび方法 |
Family Cites Families (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5886744A (en) * | 1995-09-08 | 1999-03-23 | Intel Corporation | Method and apparatus for filtering jitter from motion estimation video data |
US5838313A (en) * | 1995-11-20 | 1998-11-17 | Siemens Corporate Research, Inc. | Multimedia-based reporting system with recording and playback of dynamic annotation |
US6396500B1 (en) * | 1999-03-18 | 2002-05-28 | Microsoft Corporation | Method and system for generating and displaying a slide show with animations and transitions in a browser |
US6369835B1 (en) * | 1999-05-18 | 2002-04-09 | Microsoft Corporation | Method and system for generating a movie file from a slide show presentation |
US6532023B1 (en) * | 1999-08-12 | 2003-03-11 | International Business Machines Corporation | Recording selected applet events of a user interaction sequence |
US20020019845A1 (en) * | 2000-06-16 | 2002-02-14 | Hariton Nicholas T. | Method and system for distributed scripting of presentations |
US6834371B1 (en) * | 2000-08-31 | 2004-12-21 | Interactive Video Technologies, Inc. | System and method for controlling synchronization of a time-based presentation and its associated assets |
US20050039129A1 (en) * | 2001-01-16 | 2005-02-17 | Chris Paul | Presentation management system and method |
US20040027370A1 (en) * | 2001-02-15 | 2004-02-12 | Denny Jaeger | Graphic user interface and method for creating slide shows |
US6595781B2 (en) * | 2001-06-20 | 2003-07-22 | Aspen Research | Method and apparatus for the production and integrated delivery of educational content in digital form |
US20040201610A1 (en) * | 2001-11-13 | 2004-10-14 | Rosen Robert E. | Video player and authoring tool for presentions with tangential content |
US20040091232A1 (en) * | 2002-05-31 | 2004-05-13 | Appling Thomas C. | Method and apparatus for effecting a presentation |
US7383509B2 (en) * | 2002-09-13 | 2008-06-03 | Fuji Xerox Co., Ltd. | Automatic generation of multimedia presentation |
KR20050117826A (ko) * | 2004-06-11 | 2005-12-15 | 삼성전자주식회사 | 디지털 오디오 방송에서 인터랙티브 정보를 포함하는슬라이드 쇼 제공방법, 처리장치 및 dab 수신장치 |
US7358962B2 (en) * | 2004-06-15 | 2008-04-15 | Microsoft Corporation | Manipulating association of data with a physical object |
US7505051B2 (en) * | 2004-12-16 | 2009-03-17 | Corel Tw Corp. | Method for generating a slide show of an image |
US8826136B2 (en) * | 2005-06-27 | 2014-09-02 | Core Wireless Licensing S.A.R.L. | System and method for enabling collaborative media stream editing |
US20070016549A1 (en) * | 2005-07-18 | 2007-01-18 | Eastman Kodak Company | Method system, and digital media for controlling how digital assets are to be presented in a playback device |
US8201073B2 (en) * | 2005-08-15 | 2012-06-12 | Disney Enterprises, Inc. | System and method for automating the creation of customized multimedia content |
-
2006
- 2006-10-11 US US11/546,623 patent/US7987423B2/en not_active Expired - Fee Related
-
2007
- 2007-10-11 WO PCT/US2007/021771 patent/WO2008045523A2/en active Application Filing
- 2007-10-11 GB GB0906011A patent/GB2455942B/en not_active Expired - Fee Related
- 2007-10-11 CN CN2007800381868A patent/CN101523392B/zh not_active Expired - Fee Related
- 2007-10-11 JP JP2009532421A patent/JP2010507140A/ja active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH05274419A (ja) * | 1991-07-12 | 1993-10-22 | Matsushita Electric Ind Co Ltd | 情報提示装置及び提示情報作成装置 |
JPH0981769A (ja) * | 1995-09-14 | 1997-03-28 | Hitachi Ltd | アニメーション作成システム |
JP2005527996A (ja) * | 2001-09-13 | 2005-09-15 | ヒューレット・パッカード・カンパニー | プレゼンテーションを記録するためのシステム |
JP2005533398A (ja) * | 2001-09-13 | 2005-11-04 | ヒューレット・パッカード・カンパニー | リアルタイムスライドプレゼンテーションのマルチメディアデータオブジェクト、ならびにマルチメディアデータオブジェクトを記録し閲覧するシステムおよび方法 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2018085018A (ja) * | 2016-11-25 | 2018-05-31 | エニーシステム株式会社 | 情報提供装置、情報提供方法および情報提供プログラム |
JP2018165993A (ja) * | 2018-07-03 | 2018-10-25 | エニーシステム株式会社 | 情報提供装置、情報提供方法および情報提供プログラム |
Also Published As
Publication number | Publication date |
---|---|
WO2008045523A3 (en) | 2008-06-19 |
WO2008045523A2 (en) | 2008-04-17 |
GB0906011D0 (en) | 2009-05-20 |
GB2455942B (en) | 2011-11-02 |
CN101523392B (zh) | 2012-09-05 |
GB2455942A (en) | 2009-07-01 |
US7987423B2 (en) | 2011-07-26 |
US20080092050A1 (en) | 2008-04-17 |
CN101523392A (zh) | 2009-09-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7987423B2 (en) | Personalized slide show generation | |
US20230022781A1 (en) | User interfaces for viewing and accessing content on an electronic device | |
CN112073649B (zh) | 多媒体数据的处理方法、生成方法及相关设备 | |
US7194701B2 (en) | Video thumbnail | |
WO2020029526A1 (zh) | 视频特效添加方法、装置、终端设备及存储介质 | |
US8566301B2 (en) | Document revisions in a collaborative computing environment | |
JP6102588B2 (ja) | 情報処理装置、情報処理方法およびプログラム | |
JP5189978B2 (ja) | メディアユーザインタフェーススタートメニュー | |
CN112165632B (zh) | 视频处理方法、装置及设备 | |
US8745520B2 (en) | User interface including a preview | |
US20100318939A1 (en) | Method for providing list of contents and multimedia apparatus applying the same | |
US8811797B2 (en) | Switching between time order and popularity order sending of video segments | |
KR102339205B1 (ko) | 가상 장면 디스플레이 방법 및 디바이스, 및 저장 매체 | |
JP2008141746A (ja) | 動画再生システム及び方法 | |
CN112653920B (zh) | 视频处理方法、装置、设备及存储介质 | |
US20090164883A1 (en) | Multi-Source Web Clips | |
US11558666B2 (en) | Method, apparatus, and non-transitory computer readable record medium for providing content based on user reaction related to video | |
US20070016864A1 (en) | System and method for enriching memories and enhancing emotions around specific personal events in the form of images, illustrations, audio, video and/or data | |
JP2007267356A (ja) | ファイル管理プログラム、サムネイル画像表示方法および動画再生装置 | |
CN111787391A (zh) | 一种信息卡片展示方法、装置、设备及存储介质 | |
WO2022194070A1 (zh) | 应用程序的视频处理方法和电子设备 | |
JP6117621B2 (ja) | 情報処理装置、情報処理方法及び情報処理プログラム | |
CN103534732B (zh) | 再现装置、再现方法以及电视机 | |
JP2008090526A (ja) | 会議情報保存装置、システム、会議情報表示装置及びプログラム | |
RU2791980C2 (ru) | Способ и устройство для исполнения объекта на дисплее |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110531 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110810 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20111018 |