JP2009105901A - ビデオ合成を表示するための方法 - Google Patents

ビデオ合成を表示するための方法 Download PDF

Info

Publication number
JP2009105901A
JP2009105901A JP2008283738A JP2008283738A JP2009105901A JP 2009105901 A JP2009105901 A JP 2009105901A JP 2008283738 A JP2008283738 A JP 2008283738A JP 2008283738 A JP2008283738 A JP 2008283738A JP 2009105901 A JP2009105901 A JP 2009105901A
Authority
JP
Japan
Prior art keywords
video
video composition
user
composition
cliplet
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2008283738A
Other languages
English (en)
Inventor
Kentaro Toyama
トヤマ ケンタロー
Andreas Soupliotis
スープリオティス アンドレアス
Sheldon Fisher
フィッシャー シェルドン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Microsoft Corp
Original Assignee
Microsoft Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Microsoft Corp filed Critical Microsoft Corp
Publication of JP2009105901A publication Critical patent/JP2009105901A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/02Editing, e.g. varying the order of information signals recorded on, or reproduced from, record carriers
    • G11B27/031Electronic editing of digitised analogue information signals, e.g. audio or video signals
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • G11B27/34Indicating arrangements 

Abstract

【課題】ビデオ合成オーサリングシステムから生成されたビデオ合成を表示する方法およびビデオ合成とインタラクトするためのユーザインターフェースを提供すること。
【解決手段】ビデオ合成オーサリングシステム200はマルチメディア要素を含むデータ要素を提供し、そのレイアウトはビデオ合成ユーザインターフェース280に表示される。システム200はデータ要素を入力することによって動作し、システム200によって判断された必要な如何なるデータ要素も自動的に選択される。次いで、暫定ビデオ合成結果がユーザの見直しのために生成される。ユーザはその暫定ビデオ合成結果のどのような部分をも変更するための洗練および変更を行うことができる。ユーザがその暫定ビデオ合成結果に満足すると、その変更を含む最終ビデオ合成が生成される。最終ビデオ合成はビデオ合成ユーザインターフェース280を使用して提示される。
【選択図】図2

Description

本発明は、一般に、ビデオを表示するためのコンピュータユーザインターフェースに関し、より詳細には、ビデオ合成オーサリングシステムから生成された短い区分のビデオ(またはビデオ「クリップレット(cliplets)」)を含むビデオ合成を表示しそれとインタラクトするためのシステムおよび方法に関する。
家庭用ビデオカメラ(またはカムコーダ)は、アマチュアビデオ撮影家に人気のあるデバイスである。ビデオカメラは、メモリデバイスにディジタルビデオを格納するディジタルカメラ、または磁気ビデオテープにビデオフィルムを格納するアナログビデオカメラであり得る。アナログビデオカメラによって記録されたビデオフィルム(footage)を、周知の技術を使用してディジタル化されたフォーマットに変換できる。ディジタルビデオは、ビデオカメラによって記録されたデータを編集し操作するために(パーソナルコンピュータなどの)計算デバイス上を動作するソフトウェアを使用して処理できる。
従来のホームディジタルビデオのパラダイムでは、良いビデオを撮影し、退屈なビデオ編集を行い、次いで、編集した映画を含む単一の大きなビデオを出力することをユーザに期待する。しかし、このパラダイムの1つの問題に、たとえ専門家が撮影したものであろうとも、生ビデオフィルムを編集することが困難であり退屈であることがある。専門の訓練を受けた専門のエディタがハイエンド編集ツールを使用しても、生ビデオを持続時間がたった数分の最終バージョンに編集するのに1時間かかる場合がある。さらに、ほとんどの生ビデオフィルムは退屈であり、何時間も生ビデオに懸命に取り組むことは極めて退屈な作業であり、特にアマチュアにとってはなおさらである。
さらに別の問題に、アマチュア用の現在のビデオ編集ソフトウェアが専門家用編集システムを真似ていることがある。このことにより、平均的な消費者がソフトウェアを使用するのが困難になる傾向が生じる。現在のビデオ編集ソフトウェアのユーザインターフェースは、一般に、ユーザに生ビデオフィルムの1つのビューを提供する。ユーザに時間方位(temporal orientation)を与えるために、タイムラインがフィルムに平行して入れられる。タイムラインは、ビデオ1トラック、ビデオ2トラック、オーディオ1トラックなどの、いくつかの異なる「トラック」を含むことができる。ユーザインターフェースは、再生、早送り、巻戻しボタンなど、VCRと同様の制御機能を含む。これらのボタンを使用して、ユーザが、制御機能を使用してフィルム全体を行ったり来たりさせることにより、ビデオフィルムをブラウズする。ビデオフィルムをブラウズするこのプロセスを、「スクラビング」と呼ぶ。
ビデオフィルム内のカットの場所を決めるよう編集する場合に、生ビデオフィルムのスクラビングが使用される。スクラビングを使用するこの編集プロセスは、必ず手動で行わなければならない退屈で繰返しの多い時間のかかる作業である。
このような状況にもかかわらず、アマチュアビデオ撮影家が、長い未編集の生ビデオフィルムからきれいで短いビデオ合成を製作することをしばしば所望する。ビデオ合成は、たとえば、生ビデオフィルムの最も興味深い区分を含む「ハイライト」ビデオであり得る。しかし、平均的な消費者にとっては、ビデオを編集し、編集ソフトウェアを使用してビデオ合成を製作するプロセスは、困難で厄介な作業である。
したがって、複数のビューのビデオ合成を提供するコンピュータユーザインターフェースが求められている。さらに、見た目に美しい配列でビデオ合成を表示し、ユーザにビデオ合成とインタラクトできるようにするコンピュータユーザインターフェースも求められている。
本明細書に開示した本発明は、ビデオ合成を表示しそれとインタラクトするためのコンピュータユーザインターフェースを有する。ビデオ合成は、音楽、テキスト、写真などのマルチメディア要素の2次元配列またはコラージュを含む。さらに、ビデオ合成は、(ビデオクリップレットなどの)ビデオマルチメディア要素がともにつながれ連続的に再生される(ソースビデオのハイライトビデオなどの)単一の表示ウィンドウを含む。ビデオ合成ユーザインターフェースは、より長いビデオまたはビデオの集合を分割することによって作成された(ビデオクリップレットまたは「クリップレット」と呼ぶ)極めて短い区分のディジタルビデオを含むビデオ合成を表示できる。一般に、ビデオクリップレットは、持続時間が約5秒から10秒であると予想されるが、実際にはどのような長さもあり得る。ビデオ合成ユーザインターフェースにより、ユーザが、ビデオ合成を表示し、ビデオ合成のデザインを変更し、(テキスト、タイトル、背景音楽などの)マルチメディア要素を追加できる。
ビデオ合成ユーザインターフェースは、マルチメディア要素を含むビデオ合成を表示することが可能である。これらのマルチメディア要素には、たとえば、ビデオ、ディジタル写真、アイコン、他の任意のタイプのグラフィカル要素が含まれる。さらに、これらのマルチメディア要素には、ビデオクリップレットも含まれる。長いビデオではなく、非常に短い持続時間のビデオであるクリップレットを操作の主要単位として使用することにより、従来のホームビデオ編集ソフトウェアの諸問題が克服される。クリップレットを用いてビデオ合成を編集し作成するということは、1つ1つが予めカットされているということであり、ビデオの操作とは、長く退屈なひと続きのビデオではなく短い区分のビデオを使用するということである。さらに、ビデオ合成オーサリングシステムを用いて実施すると、ユーザは、ビデオ合成を作成する場合にどれだけ多くのまたはどれだけ少ないインタラクションも有することができる。ユーザによってインタラクティブに提供されたものではない情報が、システムによりインテリジェントに提供される。
一般に、ビデオ合成ユーザインターフェースは、見た目に美しいレイアウトのビデオ合成を提供する。ビデオ合成は、1組のビデオクリップレット、ビデオ、背景音楽、背景写真、クリップアート、テキスト記述、タイトルなどを含むマルチメディア要素を含む。
ビデオ合成のフォームは、たとえば、2次元コラージュ、単一の映画、またはフォトアルバムスタイルのハイパーテキスト「ブック」であり得る。ビデオ合成を表示するためのビデオ合成ユーザインターフェースは、背景エリアとその背景エリア全体に複数のビデオウィンドウとを表示することを含む。ビデオウィンドウのそれぞれが、ビデオ、ディジタル写真、ビデオクリップレット、アイコン、他の任意のタイプのグラフィカル要素などのマルチメディア要素を含む。ビデオウィンドウを満たすまたは取り込むためのマルチメディアコンテンツの選択が、ビデオ合成オーサリングシステムによって行われる。ビデオ合成ユーザインターフェースは、ユーザにビデオ合成を向上させ、より心地良いビデオ合成を表示する経験を持つことを可能にする、テキスト注釈、電子メール機能、タイトルエリア、キャストおよびクレジットリスト生成、クリップレットのドラッグアンドドロップ機能などの機能を提供する。
請求項に記載の発明は、コンピュータシステムにおいてビデオクリップレットを含むビデオ合成を表示するための方法であって、背景ピクチャを表示するために背景エリアを提供する第1のステップと、ビデオクリップレットを含む複数のビデオウィンドウを提供する第2のステップと、前記ビデオクリップレットのいずれかを再生するための前記複数のビデオウィンドウより一般に大きい主要ビデオウィンドウを提供する第3のステップと、前記複数のビデオウィンドウの少なくとも1つのビデオウィンドウ内でテキスト注釈を表示する第4のステップと、を備えていることを特徴とする。
請求項に記載の発明は、請求項に記載のビデオ合成を表示するための方法において、ビデオ合成オーサリングシステムを使用して前記ビデオ合成を生成するステップを備えていることを特徴とする。
請求項に記載の発明は、請求項に記載のビデオ合成を表示するための方法において、前記ビデオクリップレットの現在位置から当該ビデオクリップレットの最後までを再生する前記主要ビデオウィンドウ内に、「ここから再生」機能を備えていることを特徴とする。
請求項に記載の発明は、請求項に記載のビデオ合成を表示するための方法において、前記ビデオ合成はクリップレットコラージュであることを特徴とする。
請求項に記載の発明は、請求項に記載のビデオ合成を表示するための方法において、電子メール機能を備え、当該電子メール機能はユーザが前記ビデオ合成を電子メールできるようにする前記ビデオ合成上に表示されるものであることを特徴とする。
請求項に記載の発明は、請求項に記載のビデオ合成を表示するための方法において、前記ビデオ合成はビデオポストカードであることを特徴とする。
請求項に記載の発明は、請求項に記載のビデオ合成を表示するための方法において、前記ビデオ合成はハイライトビデオであり、当該ハイライトビデオは、前記クリップレットのそれぞれを前記複数のビデオウィンドウと連鎖させ、前記主要ビデオウィンドウ内で再生することによって生成されるものであることを特徴とする。
請求項に記載の発明は、請求項に記載のビデオ合成を表示するための方法において、前記ビデオ合成のために背景音楽を提供するステップを備えていることを特徴とする。
本発明は、本発明の態様を例示した以下の説明および添付図面を参照することによりさらに理解できるであろう。例示として本発明の原理を示した添付図面とともに以下の本発明の詳細な説明から、他の特徴および利点も自明となろう。
次に、図面を参照することとするが、図面全体を通して同様の参照番号が対応する部分を表す。
以下の本発明の記述においては、その一部を形成し本発明が実行できる具体的な例の例示として示した添付図面を参照する。本発明の範囲から逸脱することなく、他の実施形態が利用でき構造上の変更を行うことができることを理解されたい。
1.ビデオクリップレットについての導入
本明細書に記述するビデオ合成ユーザインターフェースは、ビデオクリップレットを含むことのできるビデオ合成を表示しそれとインタラクトするためのシステムおよび方法を含む。一般に、ビデオクリップレット(または「クリップレット」)は、より長い単位のビデオ(またはソースビデオ)を切り分けることによって作成された、極端に短い区分のディジタルビデオである。クリップレットの持続時間は、ユーザにより手動でまたは自動的に判断されるハード的またはソフト的な制約によって制限される。一般に、ビデオクリップレットは、持続時間が約5秒から10秒であると予想されるが、実際はどのような長さもあり得る。
クリップレットの考え方は、従来、ショット境界と考えられていたものを二次的に考慮するだけで、より長い集合のビデオから意味のある短い区分のビデオを抽出することである。したがって、クリップレットは、(サウンドバイトを検出することを試みるなどの)オーディオキューまたは(ズームインされたクローズアップを検出することを試みるなどの)ビデオキューなどの従来型ではない他のキューに基づくことができる。さらに、クリップレットはオーバラップできる。クリップレットが、全ソースビデオのすべてをカバーしないことがある。つまり、実に退屈で面白くない区間のソースビデオが全部排除されていることがあるということである。これらのすべてのことから、それぞれのクリップレットをセマンティックに意味のある部分のビデオにするという目標が達成される。
以下の特徴は、クリップレットをビデオの他の区分から区別する。第1に、生成の前に、時間制約(すなわち、クリップレット長に対する制約)が決められる。この制約は、ハード的に上下限のフォームをとることがあるか、またはソースビデオ全体の平均クリップレット長、サブショット境界の頻度、クリップレット長の分散、オーディオまたはビデオの局部的な特徴などの他の要因を考慮するソフト的な制約であることがある。第2に、クリップレットが必ずしも独立したビデオである必要はない。クリップレットは、クリップレットを抽出するためのディジタル化ソースビデオのカットすべき場所を表す1対の開始および停止ポイント、またはビデオの部分列の他の表示であり得る。第3に、クリップレットは、見る人が(サウンドバイトなどの)単一の短い事象と考えるものを含むセマンティックに意味のある部分のビデオである。クリップレットは、クリップレットをより大きいソースビデオから分離させる単一の主題または共通スレッドを有する。
より長いソースビデオと比較して比較的短い長さのクリップレットにより、クリップレットをビデオではなくディジタル写真のように操作できる。ビデオクリップレットにより、操作し格納するのが厄介な大きいビデオからのシフトが可能となる。クリップレットは、長くつまらないビデオではなく短い刺激的な区分のビデオに注目する。消費者は、ほんの少しの興味深いシーンしか含まない長いビデオを何時間も見つめていると退屈する傾向がある。消費者は、早送りボタンを絶えず使用し続けるのではなく、クリップレットにより長いソースビデオの「核心」である興味深いシーンを抽出できる。
クリップレットはまた、大きいビデオと比べて、操作し格納するのが容易である。サイズが大きいためにビデオをアップロードし共用することに対するユーザの抵抗が、ディジタル化ソースビデオからクリップレットを生成することによって最小限に押さえられる。クリップレットにより、マルチメガバイトまたはマルチギガバイトのビデオが回避される。当然ながら、クリップレットはより長い単位のビデオより小さい。したがって、メモリ、記憶装置、処理パワー、帯域幅または人の注意力には限界があるために、大きいビデオ上では実際的でないオペレーションが、クリップレットで容易に行うことができる。サイズが小さいために、クリップレットはより短いアップロード時間を有し、それにより大きいビデオと比べて、帯域幅への需要が少なくて済み、小さいディスク空間しか必要とせず、一般に管理が容易である。
ディジタル写真に適用されるほとんどのオペレーションが、ビデオクリップレットのためのアナログを有する。サイズが小さいために、ビデオクリップレットは、サムネイルを使用してブラウズされ、タイムスタンプおよびグロスピクセル統計によって編成され、ドキュメントにカットアンドペーストされ、容易に電子メールを介して送信できる。理論上、これらのオペレーションのほとんどが既にビデオのために存在しているが、実際には、その能力が消費者によって使用されることはめったにない。なぜなら、代表的なホームビデオは余りにも大きく長く退屈であるからである。大きいビデオを処理することができない画像処理およびコンピュータ視覚アルゴリズムを、容易にクリップレットで使用できる。画像安定化、カラー修正、パノラマ作成、3次元深さの識別、フェース認識、個人追跡などの技術が、リアルタイムでクリップレットで使用できる。
図1は、ディジタル化ソースビデオおよびビデオフレームとの関連でビデオクリップレットのコンセプトを示す図である。長さまたは持続時間Tのディジタルソースビデオ100が、複数のビデオフレーム105を有する。図1に示されるように、ディジタルソースビデオ100は、複数のクリップレット(C1)からC(N)に分割される。これらのクリップレットは、可変長であり得る。
上記に説明したように、これらのクリップレットC(1)からC(N)のそれぞれが、ディジタルソースビデオ100のセマンティックに意味のある部分である。場合によっては、複数のクリップレットが、時間的にオーバラップし、したがって同じビデオフレームを共用する。図1を参照すると、クリップレットC(4)は長さT(4)を有し、クリップレットC(5)は長さT(5)を有する。たとえT(4)がT(5)より小さくても、クリップレットC(4)およびC(5)は時間的にオーバラップする。さらに、クリップレットC(4)およびC(5)は、参照番号110によって示されたビデオフレームを共用する。
2.概要
ビデオ合成コンピュータインターフェースは、ビデオ合成を表示しそれとのインタラクションを可能にする。ビデオ合成は、ビデオクリップレットと、ビデオ、ディジタル写真、アイコン、他のタイプのグラフィカル要素などの他のタイプのマルチメディア要素とのどのような組合せをも有することができる。ビデオ合成ユーザインターフェースは、ビデオ合成オーサリングシステム内で実施できる。システムは、たとえば、1組のクリップレット、ビデオ、クリップレットを含む1組のディレクトリ、クリップレットへのリンクなどのデータ要素を含む。システムの出力は、クリップレットおよび音楽、テキスト、写真などの他のマルチメディア要素を含むことのできる見た目に美しいレイアウトまたは合成である。ビデオ合成出力は、合成を作成するために、ともにもたらされるマルチメディア要素のコラージュと考えることができる。「コラージュ」という文言は、より大きい合成を作成するために、より小さい要素が、時間的に空間的にまたはその両方において、ともにまとめられたものを想定することを意味する。例示として、スクリーン上に表示された2次元レイアウトのクリップレットがコラージュであり、したがって、次々とスクリーン上で再生されるいくつかのクリップレットから合成された単一の映画である。ビデオ合成ユーザインターフェースは、マルチメディア要素のコラージュを表示し、それとのインタラクションを可能にする。
図2は、本発明によるビデオ合成ユーザインターフェースを組み込んだビデオ合成オーサリングシステムの典型例の概観を示すブロック図である。一般にシステム200は、初期情報を入力し、マルチメディア要素を含むビデオ合成を出力する。ビデオ合成は、ビデオ合成ユーザインターフェースを使用してユーザに表示される。具体的には、ビデオ合成オーサリングシステム200は、データ要素210を入力する。データ要素は、マルチメディア要素、パラメータ情報、記述情報を含む。例示として、マルチメディア要素が、1組のビデオクリップレット、ビデオ、背景音楽、背景写真、クリップアート、テキスト記述、タイトルなどを含む。さらに、パラメータ情報が、ビデオ合成のパラメータを記述し、たとえば、その合成のサイズおよびビデオ合成内のそれぞれのビデオの持続時間を有する。さらに、記述情報は、たとえば、クリップレットまたはビデオについての時間および位置情報と、その合成の所望のスタイルまたはムードの記述を有する。ユーザ入力220を使用して、入力として使用されるデータ要素210の間のすべてのまたは任意の量を選択するかあるいは全く選択しないことができる。このユーザ入力220は、破線で示されているように、任意のプロセスである。ユーザ入力220が受け取られなかった場合は、システム200はデータ要素210を自動的に選択する。
ビデオ合成オーサリングシステム200は、ビデオ合成内でデータ要素を選択し要素210のレイアウトを設計するための、要素選択およびレイアウトモジュール230を有する。要素選択およびレイアウトモジュール230は、ユーザ入力220において、ユーザによって選択されたこれらのデータ要素を使用する。ユーザ入力220がない場合には、要素選択およびレイアウトモジュール230は、使用すべきデータ要素210を自動的に選択する。ユーザ入力220があった場合には、要素選択およびレイアウトモジュール230は、ユーザによって選択されたデータ要素210を使用する。ビデオ合成を完了するために必要であるがユーザによって指定されなかったどのようなデータ要素210も、要素選択およびレイアウトモジュール230によって自動的に選択されて、ユーザの選択を補完するかまたは補足する。
ユーザの出力の選択に従って(または使用可能なユーザ入力220がない場合または限られている場合は自動的に選択されて)、要素選択およびレイアウトモジュール230は、自動レイアウトアルゴリズムを、選択したデータ要素210をレイアウトするのに適用する。データ要素210の自動レイアウトが、制約およびユーザ入力220においてユーザによって指定された要求を考慮しつつ、見た目に美しい方式で生じる。これらの制約は、ユーザによって指定される明示的なものであるか、または(モニタの表示サイズなどの)ハードウェア制限に基づく黙示的なものであり得る。要素選択およびレイアウトモジュール230からの出力は、暫定ビデオ合成結果240である。この時点で、要素選択およびレイアウトモジュール230は、選択したデータ要素を含む暫定ビデオ合成および暫定レイアウトを生成している。
ビデオ合成オーサリングシステム200は、暫定ビデオ合成結果240をユーザに提示し、ユーザがユーザの好まない要素を変更し洗練できるようにするための反復洗練モジュール250を含む。具体的には、反復洗練モジュール250は、ユーザの見直し260のために暫定ビデオ合成結果240をユーザに提示する。ユーザの見直し260は、破線で示してあるように任意のプロセスである。ユーザの見直し260が生じない場合は、ビデオ合成オーサリングシステム200は、暫定ビデオ合成結果240を最終出力として出力する。
ユーザの見直し260の間、ユーザは、暫定ビデオ合成結果240を見、自分には許容できない部分を判断することができる。たとえば、反復洗練モジュール250により、ユーザは、パラメータを変更し、異なるクリップレットを合成内に手動でドラッグアンドドロップし、テキストバブルをクリップレットに追加し、移動しているオブジェクトを追跡するための追跡アルゴリズムを使用して、あるクリップレットをクロップすることができる。変更は、反復洗練モジュール250によって行われ、その洗練を含む更新された暫定ビデオ合成結果240がユーザに提示される。いったんユーザが現在の暫定ビデオ合成結果240に満足すると、オーサリングプロセスは終了し、終了したビデオ合成270が出力される。
終了したビデオ合成270は、ビデオ合成ユーザインターフェース280を介してユーザに表示される。終了したビデオ合成270を表示するとともに、ビデオ合成ユーザインターフェース280により、ビデオ合成270とのユーザインタラクションが可能になる。ビデオ合成ユーザインターフェース280は、モニタ290上に表示される。終了したビデオ合成270の出力フォームは、たとえば、2次元コラージュ、単一の映画、またはフォトアルバムスタイルのハイパーテキスト「ブック」であり得る。出力フォームは、ユーザによって選択でき、またはユーザ選択がない場合は、システム200によって自動的に選択できる。
3.オペレーティング環境の例
本発明によるビデオ合成ユーザインターフェース280は、計算環境内で動作するよう設計されている。以下の説明の目的は、本発明を実施できる適切な計算環境の簡単で一般的な記述を提供するためである。
図3は、本発明を実施するのに適切な計算装置を示すブロック図である。必要とされるものではないが、本発明をコンピュータによって実行されるプログラムモジュールなどのコンピュータ実行可能命令の一般的な状況下で記述する。一般に、プログラムモジュールには、特定のタスクを行うかまたは特定の抽象データタイプを実施するルーチン、プログラム、オブジェクト、構成要素、データ構造などが含まれる。さらに、本発明が、パーソナルコンピュータ、サーバコンピュータ、ハンドヘルドデバイス、マルチプロセッサシステム、マイクロプロセッサベースのまたはプログラマブルの大衆消費電子製品、ネットワークPC、ミニコンピュータ、メインフレームコンピュータなどを含むさまざまなコンピュータシステム構成とともに実行できることは、当業者なら理解されるであろう。本発明はまた、タスクが通信ネットワークを介してリンクされたリモート処理デバイスによって行われる分散型計算環境内でも実行できる。分散型計算環境においては、プログラムモジュールを、記憶装置デバイスを含むローカルコンピュータ記憶媒体とリモートコンピュータ記憶媒体の両方に置くことができる。
図3を参照すると、本発明を実施するためのシステムの例に、汎用計算デバイス300が含まれている。具体的には、計算デバイス300は、処理ユニット302、システムメモリ304、システムメモリ304を含むさまざまなシステム構成要素を処理ユニット302に結合するシステムバス306を備える。システムバス306は、さまざまなバスアーキテクチャのいずれかを使用する、メモリバスまたはメモリコントローラ、周辺バス、ローカルバスを含むいくつかのタイプのバス構造のどのようなものでも良い。システムメモリは、読出専用メモリ(ROM)310およびランダムアクセスメモリ(RAM)312を含む。基本入出力システム(BIOS)314が、スタートアップ中などに計算デバイス300内の要素間で情報を転送する助けとなる基本ルーチンを含み、ROM310内に格納される。計算デバイス300は、さらに、ハードディスクから読み取り、かつ、そこへ書き込むハードディスクドライブ316(図示せず)、取り外し可能磁気ディスク320から読み取りかつそこへ書き込む磁気ディスクドライブ318、CD−ROMなどの取り外し可能光学ディスク324から読み取りかつそこへ書き込む光学ディスクドライブ322、または他の光学媒体を備える。ハードディスクドライブ316、磁気ディスクドライブ318、光学ディスクドライブ322は、それぞれ、ハードディスクドライブインターフェース326、磁気ディスクドライブインターフェース328、光学ディスクドライブインターフェース330によりシステムバス306に接続される。それらのドライブおよびそれらに関連するコンピュータ読取り可能媒体は、計算デバイス300のための、コンピュータ読取り可能命令、データ構造、プログラムモジュール、および他のデータの不揮発性記憶装置を提供する。
本明細書に記述した環境の例では、ハードディスク、取り外し可能磁気ディスク320、取り外し可能光学ディスク324を用いるが、磁気カセット、フラッシュメモリカード、ディジタルビデオディスク、ベルヌーイカートリッジ、ランダムアクセスメモリ(RAM)、読出専用メモリ(ROM)などの、コンピュータからアクセス可能なデータを格納できる他のタイプのコンピュータ読取り可能媒体も、オペレーティング環境の例において使用できることを、当業者なら理解されるであろう。
いくつかのプログラムモジュールが、オペレーティングシステム332、1つまたは複数のアプリケーションプログラム334、他のプログラムモジュール336(ビデオ合成オーサリングシステム200などの)、プログラムデータ338を含む、ハードディスク、磁気ディスク320、光学ディスク324、ROM310またはRAM312に格納できる。ユーザ(図示せず)が、キーボード340およびポインティングデバイス342(マウスなど)などの入力デバイスを介してコマンドおよび情報を計算デバイス300内に入力できる。その上、カメラ343(ビデオカメラなどの)を、たとえば、マイクロホン、ジョイスティック、ゲームパッド、衛星放送用パラボラアンテナ、スキャナなどを含む他の入力デバイス(図示せず)と同様に、計算デバイス300に接続できる。これらの他の入力デバイスは、しばしば、システムバス306に結合されたシリアルポートインターフェース344を介して処理ユニット302に接続されるが、パラレルポート、ゲームポートまたはユニバーサルシリアルバス(USB)などの他のインターフェースによっても接続できる。モニタ290(または他のタイプの表示デバイス)もまた、ビデオアダプタ348などのインターフェースを介して、システムバス306に接続される。モニタ290に加えて、パーソナルコンピュータなどの計算デバイスが、一般に、スピーカやプリンタなどの他の周辺出力デバイス(図示せず)を含む。
計算デバイス300は、リモートコンピュータ350などの1つまたは複数のリモートコンピュータへの論理接続を使用してネットワークされた環境内で動作できる。リモートコンピュータ350は、別のパーソナルコンピュータ、サーバ、ルータ、ネットワークPC、ピアデバイス、または他の共通ネットワークノードであり得、図3には記憶装置デバイス352のみが例示してあるが、一般に、計算デバイス300について上記に記述した要素の多くまたはすべてを含む。図3に示した論理接続は、ローカルエリアネットワーク(LAN)354およびワイドエリアネットワーク(WAN)356を有する。このようなネットワーキング環境は、オフィス、全社的なコンピュータネットワーク、イントラネット、インターネットにおいて一般的である。
LANネットワーキング環境内で使用された場合は、計算デバイス300は、ネットワークインターフェースまたはアダプタ358を介してローカルネットワーク354に接続される。WANネットワーキング環境で使用された場合は、計算デバイス300は、一般に、インターネットなどのワイドエリアネットワーク356を介して通信を確立するためのモデム360または他の手段を備える。モデム360は、内部も外部もあり得るが、シリアルポートインターフェース344を介してシステムバス306に接続される。ネットワークされた環境において、計算デバイス300について示したプログラムモジュールまたはその部分を、リモート記憶装置デバイス352内に格納できる。示されているネットワーク接続は一例であり、コンピュータ間の通信リンクを確立する他の手段も使用できることが理解されよう。
4.ビデオ合成ユーザインターフェース
本発明によるビデオ合成ユーザインターフェース280は、マルチメディア要素の見た目に美しいコラージュでユーザにビデオ合成を表示する。さらに、ビデオ合成ユーザインターフェース280は、コラージュとインタラクトするための機能をユーザに提供する。
図4は、本発明によるビデオ合成ユーザインターフェース280の概観を示す図である。一般に、ビデオ合成が見た目に美しい方式でユーザインターフェース280を使用して表示され、したがってユーザが合成とインタラクトできるようになる。具体的には、ビデオ合成ユーザインターフェース280は、背景写真またはビデオを含む背景エリア400を含む。この背景エリア400は、ビデオ合成を提示するための心地良いバックドロップを提供する。ビデオ合成ユーザインターフェース280は、2次元配列でビデオおよびビデオクリップレットを表示する複数のビデオウィンドウ、410、415、420、425、430を含む。ビデオウィンドウは、そのビデオ合成がユーザにとって視覚的に引きつけられるような見た目に美しい方式で背景エリア400の前面に配列される。この配列は、厳密な行列配列以外での配列を含むことができる。
ビデオウィンドウ、410、415、420、425、430は、ビデオおよびビデオクリップレットを含むマルチメディア要素のどのような組合せをも有する。さらに、ビデオ合成ユーザインターフェース280により、ユーザがテキスト注釈440を追加できる。これらのテキスト注釈440は、そのビデオウィンドウのコンテンツを記述するための記述的、コミカルまたは他の使用のテキストであり得る。図4に示されているように、ビデオウィンドウ420がテキスト注釈440を含む。しかし、ビデオウィンドウ、410、415、420、425、430および背景エリア400のいずれもが、テキスト注釈440を含むことができることに留意されたい。
主要ビデオウィンドウ450が、ビデオ合成ユーザインターフェース280内に提供されて、その中のビデオまたはビデオクリップレットの再生を可能にする。ビデオウィンドウ450は、ビデオおよびクリップレットが表示できる、より大きくより集中型の表示空間を提供する。ドラッグアンドドロップ機能を使用して、ユーザが、ビデオウィンドウ、410、415、420、425、430のいずれかの(ビデオクリップレットなどの)コンテンツを主要ビデオウィンドウ450内にドラッグアンドドロップできる。また、主要ビデオウィンドウにより、テキスト注釈440を主要ビデオウィンドウ450に追加することもできる。「ここから再生(Play from Here)」機能460により、ユーザが、主要ビデオウィンドウ450内にビデオまたはクリップレットを入れ、ビデオまたはクリップレット内の現在の位置から最後までビデオまたはクリップレットを再生できる。
ビデオ合成ユーザインターフェースはまた、ドラッグアンドドロップ機能も含む。上述したように、この機能により、ユーザが、(マウスなどの)ポインティングデバイスを使用して、ビデオウィンドウ、410、415、420、425、430のコンテンツをドラッグし、これらのコンテンツを主要ビデオウィンドウ450内にドロップできる。さらに、ユーザは、ビデオウィンドウコンテンツを「ここから再生」機能460にドラッグアンドドロップでき、コンテンツは、ビデオの現在の位置から再生する。ドラッグアンドドロップ機能を使用して、ユーザにとって心地良い配列でビデオウィンドウ、410、415、420、425、430を移動することもできる。
ビデオ合成ユーザインターフェース280はまた、ユーザに誰がビデオ合成内にいるか及び誰がその製作の責任者であるかのリストをインタラクティブに生成できるようにするキャストおよびクレジットリスト機能470も含む。さらに、ビデオ合成ユーザインターフェース280には、ユーザに、ビデオ合成のためのタイトルをインタラクティブに入力し、そのタイトルをユーザの選んだ場所に表示させることを可能にするタイトルエリア480を含む。
ビデオ合成ユーザインターフェース280により、ビデオクリップレットをクリップレット重要性評定によって分類できる。以下に詳細に説明するように、クリップレット重要性評定は、クリップレットに関連しそれについて使用可能な、どのような情報にも基づくことができる。これらの評定は、たとえば、フェース検出カテゴリおよびズームカテゴリなどの重要性評定カテゴリ内にまとめることができる。クリプレットは、最良から最悪への順序でまたは他の所望のランキング方式で分類し、ビデオ合成ユーザインターフェース280上に表示できる。
(ビデオ合成出力)
ビデオ合成ユーザインターフェース280は、さまざまな出力フォーマットでビデオ合成を表示できる。これらのフォーマットには、以下のものが含まれる。
(クリップレットコラージュ)
このフォーマットにおいては、ビデオ合成は、複数のビデオウィンドウ、410、415、420、425、430内にビデオクリップレットを含むクリップレットコラージュである。したがって、クリップレットがビデオウィンドウ、410、415、420、425、430のそれぞれの中に含まれる。ユーザが、クリップレットをクリックすることにより、それぞれのクリップレットをウィンドウ内で再生できる。さらに、ドラッグアンドドロップ機能を使用して、ユーザはユーザインターフェース280内で所望のままにクリップレットを再配列できる。
(自動ハイライトビデオ)
ビデオ合成ユーザインターフェース280は、複数のビデオウィンドウ、410、415、420、425、430のそれぞれによって作成された単一のビデオを表示し、それとのインタラクションを可能にできる。言い換えれば、単一のハイライトビデオが、主要ビデオウィンドウ450内で再生される。ハイライトビデオは、(クリップレットなどの)ビデオウィンドウのマルチメディアコンテンツのそれぞれをつなげることによって生成される。つなぐ順序は、システムによって自動的に選択するか、またはユーザがドラッグアンドドロップ機能を使用して選択できる。フェードなどの選択されたクリップレット間の興味深い遷移(transition)が、ユーザまたはシステムによって選択できる。これは、ユーザ側での作業をほとんど必要としない楽しいハイライトビデオである。
(ビデオポストカード)
ビデオ合成ユーザインターフェース280は、ビデオポストカードが作成されるようにビデオ合成全体を電子メールで送信できるようにする電子メール機能490を含むことができる。たとえば、電子メールの受信者は、その電子メールを開け、ビデオウィンドウ、410、415、420、425、430および主要ビデオウィンドウ450のそれぞれをクリックして、そのウィンドウ内でクリップレットを再生できる。これは、ビデオを体験するための新しい方式である。
5.実施例およびオペレーションの詳細
図5は、図4に示されるビデオ合成ユーザインターフェースの実施例を示す図である。この実施例はビデオ合成ユーザインターフェース280が実施できる1つの方式であるにすぎないことに留意されたい。図5に示されているように、ビデオ合成ユーザインターフェース280は、背景ピクチャ540の上に複数のウィンドウ、510、515、520、525、530、535を含むクリップレットコラージュビデオ合成500を表示している。複数のウィンドウ、510、515、520、525、530、535のそれぞれが、クリップレットを含む。この例では、クリップレットコラージュビデオ合成500は、ハワイで撮られたビデオから合成され、したがってハワイの主題を有する。背景ピクチャ540は夕日であり、クリップレットはそのバケーションからの画像を含む。
クリップレットコラージュビデオ合成500はまた、「ハワイ2002」というタイトル550も含む。テキスト注釈560が、ビデオウィンドウ535に追加されている。主要ビデオウィンドウ570が、海岸に横たわるハワイのモンクアザラシのクリップレットを含む。テキスト注釈560が主要ビデオウィンドウ570に追加されて、主要ビデオウィンドウ570内のクリップレットに情報および重要性を追加する。クリップレットコラージュビデオ合成500にはまた、ハワイ音楽を含むオーディオファイルも含まれる。
(ビデオ合成オーサリングシステム)
図6は、図2に示されるビデオ合成オーサリングシステム200のオペレーションを示す一般的な流れ図である。一般に、ビデオ合成オーサリングシステム200は、(ビデオ、クリップレット、サウンドなどの)マルチメディア要素を含む見た目に美しいレイアウトのデータ要素を提供する。このレイアウトは、ビデオ合成ユーザインターフェース280を使用して、見る人に表示される。具体的には、ビデオ合成オーサリングシステム200は、データ要素を入力する(ボックス600)ことによって動作する。これらのデータ要素は、上述したように、マルチメディア要素、パラメータ情報、記述情報を含む。
欠落しているが(システム200によって判断された)必要などのようなデータ要素も、自動的に選択される(ボックス610)。したがって、ユーザがビデオ合成をオーサリングするために必要なデータ要素を全く指定しなかったり、またはそのすべてより少ないデータ要素を指定した場合は、欠落しているデータ要素は、システム200によって自動的に選ばれる。次いで、暫定ビデオ合成結果が、ユーザの見直しのために生成される(ボックス620)。ユーザは、その暫定ビデオ合成結果のどのような部分をも変更するための洗練および変更を行うことができる(ボックス630)。いったんユーザがその暫定ビデオ合成結果に満足すると、その変更を含む最終ビデオ合成が生成される。最終ビデオ合成は、ビデオ合成ユーザインターフェース280を使用して提示される(ボックス640)。
(要素選択およびレイアウトモジュール)
図7は、図2に示される要素選択およびレイアウトモジュール230のオペレーションの詳細を示す詳細な流れ図である。要素選択およびレイアウトモジュール230は、データ要素を選択し、ビデオ合成とともに要素のレイアウトを設計する。データ要素の選択は、ユーザ指定された命令、モジュール230により自動的に生成された選択、またはその両方の組み合わせによって生じる。
要素選択およびレイアウトモジュール230のオペレーションは、ユーザがデータ要素を選択することを欲するかどうかを判断する(ボックス710)ことによって開始する(ボックス700)。ユーザは、データ要素のすべてを選択する、データ要素のどれをも選択しない、またはユーザ選択と自動選択の組み合わせを選択する能力を有する。ユーザがデータ要素を選択することを決定した場合は、選択されたデータ要素はモジュール230に入力される(ボックス720)。そうでない場合は、オペレーションは、ユーザ選択されたデータ要素を入力することをスキップする。
次いで、モジュール230は、必要だがユーザによって指定されていないかまたは選択されていない、欠落しているデータ要素を自動的に選択し取得する(ボックス730)。モジュール230は、ユーザ入力の量に従って、必要なデータ要素間のすべてを選択、どれも選択しない、あるいは任意の量を自動的に選択できる。いったんデータ要素が選択されると、ユーザがデータ要素のレイアウトを指定することを欲するかどうかが判断される(ボックス740)。欲する場合には、指定された要素レイアウトは、ユーザからの入力として受信される(ボックス750)。欲しない場合には、このプロセスがスキップされる。
次いで、ユーザによって指定されたレイアウトを有さない要素のレイアウトが自動的に行われる(ボックス760)。繰り返すが、自動的に判断されたレイアウトを有するデータ要素の数は、どれだけの入力をユーザが提供するかを示す関数である。ユーザ入力がほとんどまたは全く提供されない場合は、モジュール230は、選択されたデータ要素のすべてまたはほとんどのためのレイアウトを自動的に指定する。他方、データ要素のためのレイアウトのすべてまたはほとんどがユーザによって指定された場合は、モジュール230は、データ要素のためのレイアウトをほとんどまたは全く自動的に判断しない。いったんデータ要素のレイアウトが判断されると、ビデオ合成が、出力として送信される(ボックス770)。
(要素選択およびレイアウトモジュールの機能)
要素選択およびレイアウトモジュール230は、ビデオ合成をオーサリングすることを可能にする、ある機能を有する。特定の機能には、以下のようなものがある。
(クリップレット重要性評定)
ビデオ合成オーサリングシステム200がクリップレットを使用した場合、クリップレットは、そのクリップレットについての情報を提供するための使用可能な処理技術に基づいてそれらに割り当てられる重要性評定を有することができる。たとえば、フェース検出技術が使用可能である場合は、それぞれの個々のクリップレットを処理して、フェースを検出できる。クリップレットがフェースを含むかどうかなどのこの処理から得られた情報は、それぞれの個々のクリップレットとともに格納される。この情報に基づいて、それぞれのクリップレットのためのフェース検出の重要性評定が判断できる。重要性評定は、ビデオフレーム毎ではなく、クリップレット毎に関連付けられる。しかし、評定プロセスで使用される特徴の計算をフレーム毎に行い、後に使用するためにクリップレット評定プロセス中に格納できる。
クリップレット評定は、クリップレットに関連しそれのために使用可能などのような情報にも基づくことができる。このクリップレット評定情報は、サブショット境界検出に関して上述したように、タイムスタンプ、ロケーションスタンプ、オーディオ信号、ビデオ信号、情報および分析のすべてを有する。クリップレット評定情報は、クリップレットについての情報を提供するために使用可能などのような技術をも利用できる。これには、音声認識、スピーカ認識、フェース検出、ズーム検出、パン(pan)検出、任意のタイプのオーディオ分析または認識、任意のタイプのビデオ分析または認識も含まれる。これらの技術のどれかを使用して、個々のクリップレットのための重要性評定を生成できる。例示として、重要性評定がフェースを検出する場合には、フェースを含むクリップレットがフェースを含まないクリップレットと比べてより高い重要性評定を有し、かつ、フェースを含むクリップレットの中では、より大きい割合の時間、カメラに面しているフェースを含むものにより高い評定がなされることがある。別の例として、重要性評定がクローズアップについてである場合は、ズーミング事象の直後のクリップレットが、他のクリップレットより高い重要性評定を有する。
クリップレット重要性評定は、多次元であり得る。たとえば、クリップレットが、「オーディオ活動レベル」のための評定および「視覚活動レベル」および「フェースの発生」のための別個の評定を有することがある。評定は、絶対数値でも良いし、またはクリップレット間の相対的な順序付け(またはランキング)でも良い。例示として、評定がオーディオに基づいてクリップレットに割り当てられると想定する。このことを、すべての周知のクリップレット全体にわたって正規化されたオーディオパワー信号内の分散を計算することによって行うことができる。視覚を使用するクリップレット評定の別の例では、カメラのズームまたはパンが検出され、より高い評定が、ズームまたはパン事象の直後のクリップレットに割り当てられると想定する。クリップレット評定のさらに別の例では、持続時間を使用して、評定をx秒の持続時間の中心にあるガウス形に比例させる。ここで、xはユーザの好みまたは期待値に基づくことができる。
(自動空間適応)
ビデオ合成オーサリングシステム200の出力は、クリップレットのコラージュを含むビデオ合成を有する。コラージュは複数のウィンドウを有し、それぞれのウィンドウ内にはマルチメディア要素が含まれる。ウィンドウのサイズに従って、心地良いまたは見た目に美しいレイアウトを維持しながら、クリップレットが動き回り、使用可能な空間内に適合することを試みるようにクリップレットのコラージュを適用できる。この空間適応は、要素選択およびレイアウトモジュール230によって自動的に行われる。
(クリップレットコラージュコンテンツの自動選択)
ユーザが懸命に作業することを欲しない場合は、ビデオ合成オーサリングシステム200は、クリップレットを自動的に選択して、ユーザの好みに基づいてまたはランダムに、ビデオ合成コラージュのウィンドウを取り込む。
例示として、ビデオ合成オーサリングシステム200は、ブランクである複数のウィンドウを作成できる。次いで、以下のアルゴリズムの1つまたは複数を使用することによりウィンドウを自動的に満たすことができる。自動選択ための1つのアルゴリズムが、重要性評定に基づくことができる。たとえば、カテゴリ内のトップのNクリップレットは、それぞれのカテゴリから判断され且つ選ばれ、ウィンドウのそれぞれの中に自動的に入れることができる。これらのカテゴリは、たとえば、オーディオ評定カテゴリ内に興味深いオーディオを、フェース評定カテゴリ内に興味深いフェースを、ズーム評定カテゴリ内にクローズアップを含むことができる。何が「トップ」を構成するのかについての基準は、カテゴリによる。たとえば、ズームカテゴリにおいては、クローズアップを含むクリップレットは、そのカテゴリ内の「トップ」であると考えられよう。
自動選択のための別のアルゴリズムを、時間制約とともに重要性評定で使用できる。仮に、カテゴリ内のトップのNクリップレットのうちの、2つのクリップレットが時間的に近い場合は、モジュール230は、その2つのクリップレットは同じシーンからのものであるとみなす。多様性を提供するために、1方のクリップレットを選び他方を廃棄する。
別のアルゴリズムは、それぞれのカテゴリ内のトップのクリップレットからランダムな選択を行うことである。たとえば、それぞれのカテゴリ内のトップのNクリップレットのみを取るのではなく、このアルゴリズムは、カテゴリからトップのM数のクリップレットを指示し(ここでM>N)、Mの使用可能なクリップレットからNクリップレットをランダムに選択する。この方式により、多様性が出力ビデオ合成内で維持される。
(使用統計)
要素選択およびレイアウトモジュール230はまた、使用統計に基づいてビデオ合成コラージュを選択し取り込むこともできる。使用統計は、クリップレット使用の頻度を追跡する。これらの結果はユーザに表示できる。ユーザが要素選択およびレイアウトモジュール230を介してクリップレットとインタラクトすると、使用統計が計算される。
ユーザがクリップレットを見たり選択したりするたび毎に、そのクリップレットのための使用評定が上がる。使用統計は、ユーザがどのタイプまたはどのカテゴリのクリップレットを好むかを指定するようユーザに明示的に尋ねる必要を軽減するタイプのクリップレット重要性評定である。時間が経つにつれて、使用統計は、どのクリップレットがユーザにとって興味深いかを判断するのに、より正確になる。
使用統計が、他のクリップレット重要性評定と相互に関係する場合がある。この相関関係を使用して、使用評定および何がユーザにとって興味深いかに基づいて、重要性評定およびクリップレット評定プロセスを徐々に調整し訓練できる。例示として、ユーザが多くの興味深いオーディオを有するクリップレットを常に一貫して見ている場合は、オーディオ重要性評定がそのユーザにとって重要であることを導き出すことができる。したがって、ユーザが高いオーディオ重要性評定を有するクリップレットを好み、興味を持っていると判断できる。使用統計を重要性評定と相互に関係させることにより、徐々にシステム200は、ユーザの好みを「学習する」。たとえば、ビデオ合成コラージュのウィンドウを取り込むためにクリップレットを選択する場合に、この知識を使用できる。
(ビデオ合成出力スタイル選択)
要素選択およびレイアウトモジュール230により、ユーザが、ビデオ合成の出力スタイルを選択できる。選択されたスタイルに従って、モジュール230は、選択されたスタイルに従ってデータ要素を選択し配列する。たとえば、ユーザが「ロマンチックな」スタイルを選択した場合は、モジュール230は、ソフトな音楽を選択し、速いアクションのないビデオ要素を選び、遅い動きを追加し、ロマンチックな主題をキープする際にビデオ要素をややぼかす。
(反復洗練モジュール)
図8は、図2に示される反復洗練モジュール250のオペレーションの詳細を示す詳細な流れ図である。反復洗練モジュール250は、暫定ビデオ合成結果をユーザに提示する。ユーザがその結果を好んだ場合は、暫定ビデオ合成結果は変更を加えず、ビデオ合成出力として送信される。ユーザがその結果を好まなかった場合は、反復洗練モジュール250により、ユーザは、そのユーザが許容できないデータ要素またはそのレイアウトに変更を加え洗練することができる。
反復洗練モジュール250のオペレーションは、ユーザが暫定ビデオ合成結果を見ることを欲するかどうかを判断する(ボックス810)ことによって行われる(ボックス800)。欲する場合は、モジュール250は、暫定ビデオ合成結果をユーザに提示する(ボックス820)。欲しない場合は、暫定ビデオ合成結果は、完了したビデオ合成と考えられる。次いで、ユーザが暫定ビデオ合成結果に変更を加えることを欲するかどうかの判断がなされる(ボックス830)。ユーザが変更を加えることを欲した場合は、モジュール250により、ユーザは、その変更を入力し、次いで指定されたこれらの変更を行う(ボックス840)ことができる。次いで、更新された暫定ビデオ合成結果が、ユーザに提示される(ボックス820)。この反復プロセスは、ユーザが暫定ビデオ合成結果に満足するまで続行する。ユーザが変更を加えることを欲しない場合は、暫定ビデオ合成結果は、完了したビデオ合成としての出力として送信される(ボックス850)。
(反復洗練モジュールの機能)
反復洗練モジュール250は、ビデオ合成をオーサリングできるようにする、ある機能を有する。その特定の機能には、以下のようなものがある。
(ドラッグアンドドロップ洗練)
反復洗練モジュール250は、ビデオ合成の要素を修正し、追加し、または削除するようなドラッグアンドドロップ機能を提供する。このドラッグアンドドロップ機能により、ユーザが、所望のクリップレットをビデオ合成内の所望の位置にドラッグアンドドロップできる。
(クリップレット境界の洗練)
クリップレットの開始および終了ポイント(または編集ポイント)が既に決まっていたとしても、ユーザがそれらに満足しないことがある。反復洗練モジュール250により、ユーザは、クリップレットをそれと時間的に近いものとマージすることにより、クリップレットを長くすることができる。このことは、入力デバイスを使用して、第1のクリップレットが第2のクリップレットとマージして、新しい第3のクリップレットが作成されるように、少なくとも2つのビデオクリップレットをマージすることによって達成される。第3のクリップレットは、第1および第2のクリップレットを組み合せた持続時間である。このことにより、ユーザが、クリップレットを長くし、それと時間的に近いもののうちのどのようなものにも組み合せることができるが、スクラビングを必要とする。
ユーザがまだクリップレットの編集ポイントに不満である場合は、反復洗練モジュール250は、ユーザが開始または終了ポイントを延長または縮小することのできる機能を有する。スクラビングを回避するために、ユーザは、システムに1つまたは2つの新しい編集ポイントを自動的に見つけ出させるオプションを有する。入力デバイスを介して、ユーザは、反復洗練モジュール250がクリップレットのための他の開始および終了ポイントの可能性を提示することを要求できる。
(タイトルおよびクレジット生成)
タイトルおよびクレジット生成には、ユーザが、ビデオ合成コラージュのキャストおよび誰がビデオフィルムに寄与したかを入力することが必要となる。次いで、反復洗練モジュール250は、クレジットおよびキャストリストを生成する。それより少しのユーザ入力が所望された場合は、モジュール250は、フェース認識技術を使用して、ひとびとの名前を「学習する」ことができる。このことは、ユーザに一度個人の名前を入力させ、次いでモジュール250が、その後これらのひとびとを自動的に認識し、キャストリストを自動的に作成できるようにすることによって生じる。
(テキスト注釈)
ユーザ入力またはシステム200によって自動的に、テキストをビデオ合成に追加できる。テキストを使用して、ビデオ合成に注釈を付け、記述し、または補完することができる。反復洗練モジュール250は、テキスト注釈を追加し、ビデオ合成上のどこにテキストが置かれているかを判断するための機能をユーザに提供する。さらに、ユーザが選ぶことのできるさまざまなテキストスタイルおよびサイズが使用可能である。
本発明についての上記の記述は、例示および説明の目的で提示したものである。開示した厳密な形式は本発明を限定するよう意図したものではない。上記の教示に照らして、多くの修正形態および変形形態が可能である。本発明の範囲は、発明の詳細な説明によって限定されるものではなく、むしろ本明細書の頭記の特許請求の範囲によって限定されるものである。
ソースビデオおよびビデオフレームと関連してビデオクリップレットのコンセプトを示す図である。 本発明によるビデオ合成ユーザインターフェースを組み込んだビデオ合成オーサリングシステムの例の概要を示すブロック図である。 本発明を実施するのに適切な計算装置を示すブロック図である。 本発明によるビデオ合成ユーザインターフェースの概観を示す図である。 図4に示されるビデオ合成ユーザインターフェースの実施例を示す図である。 図2に示されるビデオ合成オーサリングシステムのオペレーションを示す一般的な流れ図である。 図2に示される要素選択およびレイアウトモジュールのオペレーションの詳細を示す詳細な流れ図である。 図2に示される反復洗練モジュールのオペレーションの詳細を示す詳細な流れ図である。
符号の説明
200 ビデオ合成オーサリングシステム
210 データ要素
270 ビデオ合成
280 ビデオ合成ユーザインターフェース
290 モニタ
400 背景エリア
410、415、420、425、430 ビデオウィンドウ、
440 テキスト注釈
460 「ここから再生」機能
470 キャストおよびクレジットリスト機能
480 タイトルエリア
490 電子メール機能
500 クリップレットコラージュビデオ合成
510、515、520、525、530、535 ウィンドウ
540 背景ピクチャ
550 タイトル
560 テキスト注釈
570 主要ビデオウィンドウ

Claims (8)

  1. コンピュータシステムにおいてビデオクリップレットを含むビデオ合成を表示するための方法であって、
    背景ピクチャを表示するために背景エリアを提供する第1のステップと、
    ビデオクリップレットを含む複数のビデオウィンドウを提供する第2のステップと、
    前記ビデオクリップレットのいずれかを再生するための前記複数のビデオウィンドウより一般に大きい主要ビデオウィンドウを提供する第3のステップと、
    前記複数のビデオウィンドウの少なくとも1つのビデオウィンドウ内でテキスト注釈を表示する第4のステップと、を備えていることを特徴とするビデオ合成を表示するための方法。
  2. ビデオ合成オーサリングシステムを使用して前記ビデオ合成を生成するステップを備えていることを特徴とする請求項に記載のビデオ合成を表示するための方法。
  3. 前記ビデオクリップレットの現在位置から当該ビデオクリップレットの最後までを再生する前記主要ビデオウィンドウ内に、「ここから再生」機能を備えていることを特徴とする請求項に記載のビデオ合成を表示するための方法。
  4. 前記ビデオ合成はクリップレットコラージュであることを特徴とする請求項に記載のビデオ合成を表示するための方法。
  5. 電子メール機能を備え、当該電子メール機能はユーザが前記ビデオ合成を電子メールできるようにする前記ビデオ合成上に表示されるものであることを特徴とする請求項に記載のビデオ合成を表示するための方法。
  6. 前記ビデオ合成はビデオポストカードであることを特徴とする請求項に記載のビデオ合成を表示するための方法。
  7. 前記ビデオ合成はハイライトビデオであり、当該ハイライトビデオは、前記クリップレットのそれぞれを前記複数のビデオウィンドウと連鎖させ、前記主要ビデオウィンドウ内で再生することによって生成されるものであることを特徴とする請求項に記載のビデオ合成を表示するための方法。
  8. 前記ビデオ合成のために背景音楽を提供するステップを備えていることを特徴とする請求項に記載のビデオ合成を表示するための方法。
JP2008283738A 2002-06-19 2008-11-04 ビデオ合成を表示するための方法 Pending JP2009105901A (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US10/177,882 US20030237091A1 (en) 2002-06-19 2002-06-19 Computer user interface for viewing video compositions generated from a video composition authoring system using video cliplets

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2003171358A Division JP2004048735A (ja) 2002-06-19 2003-06-16 ビデオ合成を表示するための方法およびグラフィカルユーザインターフェース

Publications (1)

Publication Number Publication Date
JP2009105901A true JP2009105901A (ja) 2009-05-14

Family

ID=29717875

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2003171358A Pending JP2004048735A (ja) 2002-06-19 2003-06-16 ビデオ合成を表示するための方法およびグラフィカルユーザインターフェース
JP2008283738A Pending JP2009105901A (ja) 2002-06-19 2008-11-04 ビデオ合成を表示するための方法

Family Applications Before (1)

Application Number Title Priority Date Filing Date
JP2003171358A Pending JP2004048735A (ja) 2002-06-19 2003-06-16 ビデオ合成を表示するための方法およびグラフィカルユーザインターフェース

Country Status (3)

Country Link
US (1) US20030237091A1 (ja)
EP (1) EP1376582A3 (ja)
JP (2) JP2004048735A (ja)

Families Citing this family (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU2003250418A1 (en) * 2002-09-09 2004-03-29 Koninklijke Philips Electronics N.V. A data network, user terminal and method for providing recommendations
US7054888B2 (en) * 2002-10-16 2006-05-30 Microsoft Corporation Optimizing media player memory during rendering
US7668842B2 (en) 2002-10-16 2010-02-23 Microsoft Corporation Playlist structure for large playlists
US8737810B2 (en) * 2002-11-15 2014-05-27 Thomson Licensing Method and apparatus for cropping of subtitle elements
US7245971B2 (en) 2004-04-21 2007-07-17 Pacesetter, Inc. System and method for applying therapy during hyperpnea phase of periodic breathing using an implantable medical device
US20060064719A1 (en) * 2004-09-17 2006-03-23 Youden John J Simultaneous video input display and selection system and method
US7752548B2 (en) * 2004-10-29 2010-07-06 Microsoft Corporation Features such as titles, transitions, and/or effects which vary according to positions
US7640552B2 (en) * 2004-10-29 2009-12-29 Microsoft Corporation Multimedia filter resilience
WO2006089433A1 (en) 2005-02-28 2006-08-31 James Monro Productions Inc. Method and apparatus for editing media
US7450124B2 (en) * 2005-03-18 2008-11-11 Microsoft Corporation Generating 2D transitions using a 3D model
US7639873B2 (en) * 2005-07-28 2009-12-29 Microsoft Corporation Robust shot detection in a video
US7739599B2 (en) * 2005-09-23 2010-06-15 Microsoft Corporation Automatic capturing and editing of a video
US7644364B2 (en) * 2005-10-14 2010-01-05 Microsoft Corporation Photo and video collage effects
US20100287473A1 (en) * 2006-01-17 2010-11-11 Arthur Recesso Video analysis tool systems and methods
WO2007091510A1 (ja) * 2006-02-07 2007-08-16 The Tokyo Electric Power Company, Incorporated コンテンツ配信システム
US8849945B1 (en) 2006-03-28 2014-09-30 Amazon Technologies, Inc. Annotating content with interactive objects for transactions
US10380231B2 (en) * 2006-05-24 2019-08-13 International Business Machines Corporation System and method for dynamic organization of information sets
US7945142B2 (en) * 2006-06-15 2011-05-17 Microsoft Corporation Audio/visual editing tool
US20090003712A1 (en) * 2007-06-28 2009-01-01 Microsoft Corporation Video Collage Presentation
US20110060803A1 (en) * 2009-04-23 2011-03-10 Microsoft Corporation Message Notification Campaigns
US8713451B2 (en) * 2009-04-23 2014-04-29 Microsoft Corporation Late loading rich media
US20100274628A1 (en) * 2009-04-23 2010-10-28 Microsoft Corporation Advertisement coordination
US9271035B2 (en) 2011-04-12 2016-02-23 Microsoft Technology Licensing, Llc Detecting key roles and their relationships from video
US9449645B2 (en) 2013-07-03 2016-09-20 Salutations 365 LLC Video compilation greeting system and method
TWI536770B (zh) * 2014-09-01 2016-06-01 鴻海精密工業股份有限公司 視訊信件終端、視訊信件伺服器及其發送視訊信件的方法
CN109561240B (zh) 2017-09-24 2023-02-17 福希特公司 用于生成媒体资产的系统和方法
CN115529378A (zh) * 2022-02-28 2022-12-27 荣耀终端有限公司 一种视频处理方法及相关装置

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05103008A (ja) * 1991-10-07 1993-04-23 Fuji Xerox Co Ltd 電子メール機能を有するワークステーシヨン装置
JPH08234956A (ja) * 1995-02-28 1996-09-13 Canon Inc データ表示方法及びそのシステム
JPH08255171A (ja) * 1995-03-16 1996-10-01 Toshiba Corp 情報処理装置
JP2002057981A (ja) * 2000-04-13 2002-02-22 Fuji Xerox Co Ltd データストリームにアクセスするインタフェース、データストリームへのアクセス用検索の形成方法、データストリームアクセス方法及びノートからビデオにアクセスするためのデバイス
JP2003513538A (ja) * 1999-10-22 2003-04-08 アクティブスカイ,インコーポレイテッド オブジェクト指向ビデオシステム

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6553178B2 (en) * 1992-02-07 2003-04-22 Max Abecassis Advertisement subsidized video-on-demand system
US5404316A (en) * 1992-08-03 1995-04-04 Spectra Group Ltd., Inc. Desktop digital video processing system
US5758257A (en) * 1994-11-29 1998-05-26 Herz; Frederick System and method for scheduling broadcast of and access to video programs and other data using customer profiles
US5966121A (en) * 1995-10-12 1999-10-12 Andersen Consulting Llp Interactive hypervideo editing system and interface
US20020120925A1 (en) * 2000-03-28 2002-08-29 Logan James D. Audio and video program recording, editing and playback systems using metadata
US6195458B1 (en) * 1997-07-29 2001-02-27 Eastman Kodak Company Method for content-based temporal segmentation of video
US6816172B1 (en) * 1997-09-29 2004-11-09 Intel Corporation Graphical user interace with multimedia identifiers
US5956026A (en) * 1997-12-19 1999-09-21 Sharp Laboratories Of America, Inc. Method for hierarchical summarization and browsing of digital video
US6223213B1 (en) * 1998-07-31 2001-04-24 Webtv Networks, Inc. Browser-based email system with user interface for audio/video capture
US6847778B1 (en) * 1999-03-30 2005-01-25 Tivo, Inc. Multimedia visual progress indication system
US6571255B1 (en) * 1999-04-16 2003-05-27 Robert Gonsalves Modification of media with common attributes on a digital nonlinear editing system
US6792615B1 (en) * 1999-05-19 2004-09-14 New Horizons Telecasting, Inc. Encapsulated, streaming media automation and distribution system
US20020013817A1 (en) * 2000-07-07 2002-01-31 Collins Thomas M. Method and apparatus for distributing of e-mail to multiple recipients
US6888999B2 (en) * 2001-03-16 2005-05-03 Magix Ag Method of remixing digital information
US6931201B2 (en) * 2001-07-31 2005-08-16 Hewlett-Packard Development Company, L.P. Video indexing using high quality sound

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05103008A (ja) * 1991-10-07 1993-04-23 Fuji Xerox Co Ltd 電子メール機能を有するワークステーシヨン装置
JPH08234956A (ja) * 1995-02-28 1996-09-13 Canon Inc データ表示方法及びそのシステム
JPH08255171A (ja) * 1995-03-16 1996-10-01 Toshiba Corp 情報処理装置
JP2003513538A (ja) * 1999-10-22 2003-04-08 アクティブスカイ,インコーポレイテッド オブジェクト指向ビデオシステム
JP2002057981A (ja) * 2000-04-13 2002-02-22 Fuji Xerox Co Ltd データストリームにアクセスするインタフェース、データストリームへのアクセス用検索の形成方法、データストリームアクセス方法及びノートからビデオにアクセスするためのデバイス

Also Published As

Publication number Publication date
US20030237091A1 (en) 2003-12-25
EP1376582A2 (en) 2004-01-02
EP1376582A3 (en) 2004-10-13
JP2004048735A (ja) 2004-02-12

Similar Documents

Publication Publication Date Title
JP2009105901A (ja) ビデオ合成を表示するための方法
US7222300B2 (en) System and method for automatically authoring video compositions using video cliplets
US9032297B2 (en) Web based video editing
US8249426B2 (en) Method of automatically editing media recordings
JP5091086B2 (ja) ビデオの短いセグメントを表示するための方法及びグラフィカルユーザインタフェース
US7248778B1 (en) Automated video editing system and method
CN103702039B (zh) 图像编辑装置和图像编辑方法
US8180826B2 (en) Media sharing and authoring on the web
US20100169786A1 (en) system, method, and apparatus for visual browsing, deep tagging, and synchronized commenting
US20100220197A1 (en) Assisted Video Creation Utilizing a Camera
US20070239788A1 (en) Topic specific generation and editing of media assets
US20110107369A1 (en) System and method for enabling social browsing of networked time-based media
US20100274820A1 (en) System and method for autogeneration of long term media data from networked time-based media
US7398004B1 (en) Software methods for authoring multimedia content to be written to optical media
US7610554B2 (en) Template-based multimedia capturing
JP3942471B2 (ja) データ編集方法、データ編集装置、データ記録装置および記録媒体
JP3797158B2 (ja) 映像編集方法および映像編集装置、並びに映像編集を行なうためのコンピュータプログラムを記録した記録媒体
Niikura et al. Valbum: Album-oriented video storyboard for editing and viewing video
KR20000049993A (ko) 각종 출장 촬영에 따른 웹멀티미디어 앨범 제작방법
Chavez The Photographer's Introduction to Video in Lightroom 4 and Photoshop CS6
Grisetti et al. Adobe Premiere Elements 2 in a Snap
Droblas et al. ADOBE PREMIER PRO 2 BIBLE (With CD)
KR20070054146A (ko) 미디어 레코딩의 자동 에디팅 방법

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20111128

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20111206

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20120427