JP2013536969A - コミュニティベースのメタデータを提供するための方法および装置 - Google Patents

コミュニティベースのメタデータを提供するための方法および装置 Download PDF

Info

Publication number
JP2013536969A
JP2013536969A JP2013527349A JP2013527349A JP2013536969A JP 2013536969 A JP2013536969 A JP 2013536969A JP 2013527349 A JP2013527349 A JP 2013527349A JP 2013527349 A JP2013527349 A JP 2013527349A JP 2013536969 A JP2013536969 A JP 2013536969A
Authority
JP
Japan
Prior art keywords
metadata
media program
user
frame
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2013527349A
Other languages
English (en)
Other versions
JP5868978B2 (ja
JP2013536969A5 (ja
Inventor
ワン、ジビン
リアオ、ユペン
Original Assignee
フル・エルエルシー
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by フル・エルエルシー filed Critical フル・エルエルシー
Publication of JP2013536969A publication Critical patent/JP2013536969A/ja
Publication of JP2013536969A5 publication Critical patent/JP2013536969A5/ja
Application granted granted Critical
Publication of JP5868978B2 publication Critical patent/JP5868978B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/78Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/7867Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using information manually generated, e.g. tags, keywords, comments, title and artist information, manually generated time, location and usage information, user ratings
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/23Updating
    • G06F16/2365Ensuring data consistency and integrity

Abstract

コミュニティベースのメタデータを提供する方法および装置を開示する。1つ実施形態では、方法は、メディアプログラムのフレーム中のオブジェクトを検出するステップと、検出したオブジェクトを有するメディアプログラムのフレームを含む第1のデータを、ユーザへの提示のためにディスプレイデバイスに送信するステップと、識別したオブジェクトに関係付けられている、ユーザに入力されたメタデータを含む第2のデータを受信するステップと、オブジェクトをメディアプログラムの近似のフレームにわたって追跡するステップと、メディアプログラムの近似のフレームの少なくとも1つにおけるオブジェクトに、入力されたメタデータを関係付けるステップと、関係付けた入力メタデータを記憶するステップとを含む。
【選択図】図1

Description

関連出願に対する相互参照
本出願は、Zhibing Wang氏らにより、2009年2月19日に出願され、“サーチパラメータサムネイルを含むプログラムガイドを提供する方法および装置”と題する米国特許出願シリアル番号12/389,249の一部継続出願(CIP)であり、本出願は、ここでの参照によりここに組み込まれている。
発明の背景
[1.発明の分野]
本発明は、ユーザへのストリーミングメディアを提供するシステムおよび方法に関連し、より詳細には、コミュニティベースのメタデータを提供するシステムおよび方法に関連する。
[2.関連発明の説明]
メディアプログラムの普及および再生は、過去10年間において相当な変化を経験してきた。以前は、メディアプログラムは、アナログブロードキャスト(従来の、衛星またはケーブル)により、または、映画館へのフィルムの普及のいずれかにより、広まった。
これらの従来の普及および再生手段は、デジタル技術の出現の後にも使用されている。しかしながら、デジタル技術は、メディアプログラムの普及および再生に深く影響した。
第1に、デジタル技術は、デジタルビデオレコーダ(DVR)の使用を可能にした。機能において標準アナログビデオカセットレコーダ(VCR)に類似する一方で、DVRは、ライブポーズ、1つのプログラムを録画しつつ別のプログラムを再生する能力、電子プログラムガイドのDVR機能との統合(これにより、メディアプログラムの録画をだいぶ前にスケジューリングすることが可能になる)を含む、多数の追加の有用な機能を提供する。
第2に、技術はまた、インターネットを介してのメディアプログラムの普及および再生を可能にし、高速インターネットアクセス(例えば、DSL、ファイバ、衛星)による発達した信号処理およびますます増える世帯とともに、この普及および再生の方法は、従来の手段と競合するものとなった。インターネットを介したメディアプログラムの普及は、単純なダウンロード、プログレッシブダウンロードおよびストリーミングのうちのいずれかにより起きるだろう。
プログレッシブダウンロードに対して、メディアプログラムを含むメディアファイルは、ダイアルアップ、DSL、ADSL、ケーブル、T1を使用するインターネット、または、他の高速インターネット接続を介してダウンロードされる。単純なダウンロードは、任意の都合のよい順序でメディアファイルのバイトをダウンロードする一方で、プログレッシブダウンロードは、ファイルの始まりにおけるバイトをダウンロードし、最後のバイトまで、シーケンシャルに、かつ、連続的にファイルのダウンロードを継続する。プログレッシブダインロードの間の任意の特定の時間において、ファイルのうちの一部分は、再生に対して即時に利用可能ではない。いくつかの状況では、メディアプレイヤーが再生を開始する前にファイル全体が初めにダウンロードされなければならない。他の状況では、メディアプレイヤーは、いったんファイルの始まりのうちの十分なものがダウンロードされると再生を開始することできるが、メディアプレイヤーは、再生が起こすことができる前に、再生のいくつかの形態をサポートするために十分な情報をダウンロードしなければならない。再生は、しばし、低速なインターネット接続により遅らされ、とぎれとぎれであることも多く、および/または、ほんの数秒後に停止する高い可能性を含む。ダウンロードされたマテリアルはその後、エンドユーザコンピュータ上に記憶される。
ストリーミングはメディアプレイヤーに継続的にメディアコンテンツを配信し、メディア再生は同時に起こる。エンドユーザは、コンテンツプロバイダによる配信の際に、即時にメディアを再生することが可能である。従来のストリーミング技術は、単一のプロバイダがデータのストリームを1組のエンドユーザに配信することから始まる。単一のストリームを大きなオーディエンスに配信するためには、高帯域幅および中央処理ユニット(CPU)パワーが必要とされ、プロバイダに必要とされる帯域幅は、エンドユーザの数が増加するにつれて増加する。
プログレッシブダウンロードとは異なり、ストリーミングメディアは、オンデマンドまたはライブで配信される。プログレッシブダウンロードは、ファイル全体をダウンロードすること、または、ファイル全体のうちの始まりにおいて再生を開始するのに十分なものをダウンロードすることを必要とするが、ストリーミングは、ファイルの内の任意のポイントにおける即時の再生を可能にする。エンドユーザは、メディアファイルを通してスキップし、メディアファイル中の任意のポイントで再生を開始、または、再生を変更してもよい。したがって、エンドユーザは、ファイルが漸進的にダウンロードされるのを待つ必要がない。典型的に、ストリーミングメディアは、典型的に高帯域幅特性を持つ少数の専用のサーバから配信される。
オンデマンドストリーミングメディアサービスは、メディアプログラムのブロードスペクトルを、ユーザに対して即時の視聴に対して利用可能にすることができる。オンデマンドストリーミングメディアサービスを提供する際の課題のうちの1つは、ユーザが視聴したいメディアプログラムをユーザが効率的に選択することを可能にするインターフェースをユーザに提供することである。ブロードキャストテレビの黄金時代では、少数のチャネルが利用可能であったし、ユーザにとって、単純に各チャンネルをチェックし、または、印刷されたガイドを参照することは単純な問題であった。衛星またはケーブルテレビの出現は、このようなチャンネルの数を倍増させ、印刷されたスケジュールに類似するプログラムガイドを提供した。しかしながら、チャンネルの数は、依然として比較的制限されていた。DVRの記憶容量は、単純な階層的なメニューインターフェースにより、ユーザが、録画されたプログラムへのアクセスを簡単に、かつ、速く獲得できるようなものである。しかしながら、ストリーミングビデオのケースでは、利用可能なメディアプログラムの数は、実質的に無限である。これは、非常に大多数のメディアプログラムについての有用なプログラム情報をどのように提供するかという極めて本質的な問題を提起する。
ユーザに、利用可能なメディアプログラムについての情報を提供する1つの方法は、メディアプログラムに関係付けられているメタデータを利用することである。このようなメタデータは、メディアプログラムの発信元、俳優、ジャンル(ドラマ、コメディー)、対象年齢層、および/または、メディアプログラムの1つ以上のサムネイル(メディアプログラムの小さなスチルビデオフレーム)のような、ファクタを含んでもよい。このメタデータは、その後、関心のメディアプログラムをサーチする際にユーザを支援し、または、ユーザが関心のメディアプログラムを都合良く見つけることができるように、メディアプログラムを編成するメディアプログラムの普及者(disseminator)を支援するために使用できる。
特定の出演者(例えば、俳優または女優)を含むメディアプログラムのサーチへの典型的な応答は、このようなプログラムのテキストリストとともに他の関連する情報を提供することである。リストは、メディアプログラムのフレームのサムネイルも含んでいるかもしれず、または、含まないかもしれない。このようなサムネイルは、典型的に、(メディアプログラムのタイトルを示している)タイトルページ、または、ランダムに選択されたメディアプログラムのフレームである。
しかしながら、メディアプログラムに対するサーチに応答するときに、プログラムのタイトル、または、ランダムに選択されたフレームを示すサムネイルは、ユーザに有用な情報を提供しない。このような事例における、はるかに有用なものは、提供されたサーチパラメータに関連するサムネイルを提供することである。例えば、ユーザが、特定の俳優を含むメディアプログラムをサーチする場合に、プログラムガイドが、その出演者の描写を含むサムネイルを提示することが望ましい。また、プログラムガイドが、出演者の描写を含む動的に生成されるビデオクリップを提示することも望ましい。
さらに、しばしば、ユーザは、特定のプログラムを見つけることのみならず、特定のプログラムからのシーン中のオブジェクトにも関心がある。例えば、ユーザは、特定の俳優が特定のシーンで演じられているメディアプログラムを見つけることに興味があるかもしれない。
メディアプログラムサーチは、GOOGLE(登録商標)およびYOUTUBE(登録商標)から利用可能なもののような、現在のシステム中で提供されている。このようなシステムは、キーワードサーチを可能にし、サーチされたキーワードの画像を含むかもしれないメディアプログラムを識別するメディアプログラムメタデータをサーチする。しかしながら、サーチに応答して提供された各ビデオに対して、提供されるサムネイルは、サーチパラメータまたはそれらの値に関わらず、同じである。例えば、女優のMeg Ryanに対するサーチは、多数のサムネイルを送り返すかもしれず、それぞれは、Meg Ryanが描写されているメディアプログラム(および、それらのうちの多くは短いクリップのみ)を表す。しかしながら、各メディアプログラムファイルに対して提示されるサムネイルは、提供されたサーチパラメータに関わらず同じである。この理由は、各メディアプログラムファイルは、“Meg Ryan”というタームを有するメタデータを含む(Meg Ryanが、メディアプログラムファイルのうちの少なくとも一部において描写されていることを示している)かもしれない一方で、メディアプログラムファイルの(彼女がフレーム中に描写されていることを示している)個々のフレームに関係付けられているメタデータは存在せず、メディアプログラムファイルに対するメタデータも、Meg Ryanが描写されているフレームを示さないからである。
例えば、従来技術では、特定のメディアプログラムファイル“When_Harry_Met_Sally”は、メディアプログラム中に現れる俳優を説明するメタデータを含んでもよく、それらの俳優は、“Meg Ryan”および“Billy Crystal”を含んでもよい。メディアプログラムファイル“When_Harry_Met_Sally”はまた、女優Meg Ryanを描写するビデオフレームのうちの1つのサムネイル画像に関係付けられてもよい。このようなケースでは、ユーザが、値として“Meg Ryan”を含む“出演者”というサーチパラメータを使用するキーワードサーチを実行するときに、メディアプログラムファイル“When_Harry_Met_Sally”は、女優Meg Ryanを描写するビデオフレームのサムネイルとともに提示されてもよい。しかしながら、もしユーザが、値“Billy Crystal”を含む“出演者”というサーチパラメータを使用するキーワードサーチを実行するとしたならば、ユーザは、同じプログラムファイル“When_Harry_Met_Sally”を提示されるだろうが、関係付けられているサムネイルは、依然として、同じビデオフレーム(すなわち、Meg Ryanのものであり、Billy Crystalのものではない)を描写するだろう。ユーザはまた、異なるメディアプログラムファイル(例えば、関係付けられているサムネイルがBilly Crystalを描写する、“When_Harry_Met_Sally”の別のメディアプログラムファイル)を提示されるかもしれないが、同じメディアプログラムファイルに関係付けられているサムネイルは、依然として、Billy Crystalではなく、Meg Ryanを描写するだろう。したがって、ユーザは、特定のメディアプログラムファイルに対して提示されるサムネイルがサーチパラメータの値に依存する、“サーチアウェア”または“サーチレスポンシブ”サムネイルを提示されない。
メディアプログラムファイルのランダムに選択されたフレームは、関心のメディアプログラムについてのわずかな情報を提供する、または、情報を提供しないかもしれず、そのコンテンツを誤って提示するかもしれない。サムネイルはまた、一般的な普及に対して適切ではない画像(例えば、アダルトビデオ)を含むかもしれない。メディアプログラムファイルのサーチタームアウェアサムネイルを提供する方法および装置が必要とされている。
サーチタームアウェアサムネイルの供給は、メディアプログラムに関係付けられているメタデータの容量を実質的に増加させることができる。例えば、メディアプログラムは、おそらく、10人の著名な出演者のキャストを含んでもよく、メタデータにとってそのように示すことは、かなり取るに足らないことである。しかしながら、メディアプログラムの大多数のフレームに関係付けられているメタデータを含むことが望ましいとき、メタデータを生成させるタスク、および、メタデータを各フレームと関係付けるタスクは、非常に面倒になり得る。さらに、多くの事例では、いずれのメタデータが、視聴者にとっての関心のものであるか、または、どのメタデータがそうでないかは明らかではない。例えば、特定のメディアプログラムは、出演者が有名になる前に取り組んだ脇役またはエキストラ役の中に、出演者を含むかもしれない。この種の情報は、メタデータがリリースされるときに、出演者がその時点では著名な出演者ではなかったことから、通常、メタデータの一部にはならないだろう。しかしながら、メタデータプログラムのリリースの後、その出演者における高いレベルの関心が出るかもしれない。さらに、いくつかのケースでは、メディアプログラムは、視聴者にとって面白いエラーを含む。いくつかのエラーは、メディアプログラムの製作者ではなく、視聴者により発見されることが多い。
ユーザが、メディアプログラムの関係付けられているフレームに伝播できる、メディアプログラム中に描写されているオブジェクトについてのメタデータを提供することを可能にする方法および装置が必要とされている。本発明は、その需要を満たす。
上述した要求を取り扱うために、コミュニティベースのメタデータを提供するための方法および装置が開示されている。1つの態様では、方法は、メディアプログラムのフレーム中のオブジェクトを検出するステップと、検出したオブジェクトを含むメディアプログラムのフレームを含む第1のデータを、ユーザへの提示のためにディスプレイデバイスに送信するステップと、識別したオブジェクトに関係付けられている、ユーザに入力されたメタデータを含む第2のデータを受信するステップと、オブジェクトをメディアプログラムの近似のフレームにわたって追跡するステップと、入力されたメタデータをメディアプログラムの近似のフレームのうちの少なくとも1つの中のオブジェクトと関係付けるステップと、関係付けた入力メタデータを記憶するステップとを含む。別の態様では、発明は、メディアプログラムのフレーム中のオブジェクトを検出し、オブジェクトをメディアプログラムの近似のフレームにわたって追跡するメディアプログラムアナライザと、検出したオブジェクトを含むメディアプログラムのフレームを含む第1のデータを、ユーザへの提示のためにディスプレイデバイスに送信し、識別したオブジェクトに関係付けられている、ユーザに入力されたメタデータを含む第2のデータを受信する通信モジュールと、入力されたメタデータをメディアプログラムの近似のフレームのうちの少なくとも1つの中のオブジェクトと関係付け、関係付けた入力メタデータを記憶するデータベースとを具備する装置により明らかになる。
これから図面を参照し、図中では、同一の参照番号が、全体を通して対応する部分を表す。
図1は、例示的なメディアプログラムシステムを図示しているダイヤグラムである。 図2は、本発明を実現するために使用することできる例示的なコンピュータシステムを図示している。 図3Aは、1つの実施形態を実施するために使用できる例示的なプロセスのステップを図示しているダイヤグラムである。 図3Bは、1つの実施形態を実施するために使用できる例示的なプロセスのステップを図示しているダイヤグラムである。 図4Aは、複数のビデオフレームに対してメタデータを開発するために使用できる例示的な方法のステップを図示しているダイヤグラムである。 図4Bは、複数のビデオフレームに対してメタデータを開発するために使用できる例示的な方法のステップを図示しているダイヤグラムである。 図4Cは、複数のビデオフレームに対してメタデータを開発するために使用できる例示的な方法のステップを図示しているダイヤグラムである。 図4Dは、複数のビデオフレームに対してメタデータを開発するために使用できる例示的な方法のステップを図示しているダイヤグラムである。 図4Eは、複数のビデオフレームに対してメタデータを開発するために使用できる例示的な方法のステップを図示しているダイヤグラムである。 図4Fは、複数のビデオフレームに対してメタデータを開発するために使用できる例示的な方法のステップを図示しているダイヤグラムである。 図5は、図4中で図示されているプロセスのステップをさらに図示しているダイヤグラムである。 図6Aは、ユーザのサーチ要求に応答する、サムネイルおよび/またはビデオクリップと、サムネイル/ビデオクリップのメタデータとの動的な生成を描写するダイヤグラムである。 図6Bは、ユーザのサーチ要求に応答する、サムネイルおよび/またはビデオクリップと、サムネイル/ビデオクリップのメタデータとの動的な生成を描写するダイヤグラムである。
好ましい実施形態の詳細な説明
以下の説明では、付随する図面に対して参照が行われ、付随する図面は、説明の一部を形成し、本発明の事例、いくつかの実施形態として示されている。他の実施形態を利用することもでき、本開示の範囲から逸脱することなく、構造的な変更を行うことができることは理解されるだろう。
図1は、例示的なメディアプログラムシステム100を図示しているダイヤグラムである。図示されている実施形態では、システム100は、インターネットのような通信ネットワーク104に通信可能に結合されている、1つ以上のメディアプログラムソース120A、120Bを備えており、それぞれは、1つ以上のソースメディアプログラムデータベース124A、124Bに通信可能に結合されている、1つ以上のソースビデオサーバ122A、122Bを備えている。メディアプログラムシステム100はさらに、通信ネットワーク104に通信可能に結合されており、1つ以上のプロバイダビデオサーバ112、および、プロバイダメディアプログラムデータベース114を含むメディアプログラムプロバイダ110を備えている。メディアプログラムプロバイダ110は、メディアプログラムを分析して、以下にさらに説明するように、オブジェクトを識別および追跡するメディアプログラムアナライザと、他のエンティティと通信する通信モジュール136とを備えていてもよい。1つの実施形態では、メディアプログラムプロバイダ110は、ビデオオンデマンドおよび/またはストリーミングメディアプログラムプロバイダである。
メディアプログラムシステム100は、メディアプログラムプロバイダ110から直接的にメディアプログラムをユーザコンピュータ102にストリーミングしてもよく、または、メディアプログラムプロバイダ110は、メディアプログラム自体ではなく、メディアプログラムソース120Aおよび120Bから利用可能なメディアプログラム(これは、代わりに、メディアプログラムソース120により提供される)へのインターフェースを提供する、ポータルとして動作してもよい。ディスプレイデバイス102は、デスクトップまたはラップトップコンピュータ、パーソナルデータアシスタント(PDA)、セルフォン、IPOD(登録商標)、IPHONE(登録商標)、IPAD(登録商標)、あるいは、類似する処理および表示能力を持つ任意のデバイスのような、ユーザコンピュータを含んでもよい。以下では、ディスプレイデバイス102は、代わりに、ユーザコンピュータと呼ばれてもよい。
第1のケースでは、メディアプログラムプロバイダは、メディアプログラムソース120(www.fox.comまたはwww.nbc.comのような)からのメディアプログラムを認可し、このようなプログラムに対するメタデータも同様に提供される。このようなメタデータは、典型的に、適正であり(例えば、これは、他のソースからの情報により補足される必要がない)、使用のために、メディアプログラムプロバイダのデータベース114から取り出すことができる。
第2のケース(例えば、ダイレクトストリーミングが認可されないとき)では、メディアプログラムは、メディアプログラムソース120のサーバからユーザのコンピュータ102に直接的にストリーミングされる。メディアプログラムが、メディアプログラムサーバ120から直接的にストリーミングされるとき、メディアプログラムサーバ120により提供されるメタデータは十分でないケースが多い。このようなケースでは、補足のメタデータが、独立的なメディアプログラムソース130(www.tv.comまたはwww.imdb.comのような)、または、他の第3者ソースから取得されてもよい。この状況では、メディアプログラムプロバイダ110の役割は、利用可能なメディアプログラムのリストと、このようなプログラムを見つけ、それらを視聴するためにサーチするインターフェースとをユーザに提供するポータルの役割である。
メディアプログラムおよびメタデータは、通信ネットワーク104を介して、または、補助的な(および/または専用の)通信リンク134を通して、ウェブクロールすること(例えば、ワールドワイドウェブを方法的な、自動化された方法でブラウズする、プログラムおよび自動スクリプトを使用すること)により、取得されてもよい。
コンピュータ102を使用して、遠隔ユーザ132は、メディアプログラム(ビデオオンデマンドおよび/またはストリーミングビデオサービスを含む)を取得するために、および、プロバイダメディアプログラムデータベース114をサーチして、関心のメディアプログラムを見つけるメディアプログラムプロバイダ110と通信できる。
図2は、ユーザコンピュータ102およびデータベース114、124を含む、本発明のエレメントを実現させるために使用することが可能な例示的なコンピュータシステム202を図示している。コンピュータ202は、汎用ハードウェアプロセッサ204Aおよび/または特殊用途ハードウェアプロセッサ204B(以下では、代わりに、集合的にプロセッサ204と呼ばれる)、あるいは、ランダムアクセスメモリ(RAM)のようなメモリ206を備える。コンピュータ202は、キーボード214、マウスデバイス216およびプリンタ228のような、入力/出力(I/O)デバイスを含む、他のデバイスに結合されていてもよい。
1つの実施形態では、コンピュータ202は、オペレーティングシステム208の制御の下で、コンピュータプログラム210により規定された命令を実行する汎用プロセッサ204Aにより動作する。コンピュータプログラム210および/またはオペレーティングシステム208は、メモリ206中に記憶されてもよく、ユーザおよび/または他のデバイスとインターフェースして、入力およびコマンドを受け入れ、そのような入力およびコマンド、ならびに、コンピュータプログラム210およびオペレーティングシステム208により規定された命令に基づいて、出力および結果を提供してもよい。
出力/結果は、ディスプレイ222上に提示され、あるいは、提示またはさらなる処理もしくはアクションのために、別のデバイスに提供されてもよい。1つの実施形態では、ディスプレイ222は、別々に取り扱い可能な複数の液晶を有する液晶ディスプレイ(LCD)を含む。ディスプレイ222の各液晶は、入力およびコマンドに対する、コンピュータプログラム210および/またはオペレーティングシステム208の命令のアプリケーションから、プロセッサ204により生成されたデータまたは情報に応答して、ディスプレイ上の画像の一部を形成するために、不透明または半透明状態に変化する。画像は、グラフィカルユーザインターフェース(GUI)モジュール218Aを通して提供されてもよい。GUIモジュール218Aは、別個のモジュールとして描写されているが、GUI機能を実行する命令は、オペレーティングシステム208、コンピュータプログラム210中に内在していてもよく、または、分配されていてもよく、あるいは、特殊用途メモリまたはプロセッサにより実現されてもよい。
コンピュータプログラム110命令にしたがって、コンピュータ202により実行される動作のいくつかまたはすべては、特殊用途プロセッサ204Bにおいて実現されてもよい。この実施形態では、コンピュータプログラム210命令のいくつかまたはすべては、特殊用途プロセッサ204B内の、あるいは、メモリ206中の、リードオンリーメモリ(ROM)、プログラマブルリードオンリーメモリ(PROM)またはフラッシュメモリ中に記憶されているファームウェア命令を介して、実現されてもよい。特殊用途プロセッサ204Bはまた、本発明を実現させる動作のいくつかまたはすべてを実行するための回路設計を通して、ハードワイヤードであってもよい。さらに、特殊用途プロセッサ204Bは、ハイブリッドプロセッサであってもよく、ハイブリッドプロセッサは、機能のサブセットを実行する専用回路と、コンピュータプログラム命令に応答することのような、より一般的な機能を実行する他の回路とを備える。1つ実施形態では、特殊用途プロセッサは、特定用途向け集積回路(ASIC)である。
コンピュータ202はまた、プロセッサ204に読取可能なコードに解釈される、COBOL、C++、FORTRAN、または、他の言語のような、プログラミング言語中にアプリケーションプログラム210を書き込むことを可能にするコンパイラ212を実現してもよい。完了の後、アプリケーションまたはコンピュータプログラム210は、I/Oデバイスから許容されたデータ、および、コンピュータ202のメモリ206中に記憶されているデータに、コンパイラ212を使用して生成された関係および論理を使用して、アクセスし、操作する。
コンピュータ202はまた、モデム、衛星リンク、イーサネット(登録商標)カード、または、他のコンピュータからの入力を受け入れ、出力を他のコンピュータに提供する他のデバイスのような、外部通信デバイスをオプションとして備えている。
1つの実施形態では、オペレーティングシステム208、コンピュータプログラム210およびコンパイラ212を実現させる命令は、ジップドライブ、フロッピー(登録商標)ディスクドライブ224、ハードドライブ、CD−ROMドライブ、テープドライブ等のような、1つ以上の固定または取り外し可能なデータ記憶デバイスを含み得る、コンピュータ読取可能媒体、例えば、データ記憶デバイス220中で明白に具現化されている。さらに、オペレーティングシステム208およびコンピュータプログラム210は、コンピュータプログラム命令からなる。コンピュータプログラム命令は、コンピュータ202により、アクセスされ、読み込まれ、実行されるときに、現行の発明を実現および/または使用し、または、命令のプログラムをメモリ中にロードするために必要なステップをコンピュータ202に実行させ、したがって、ここに説明した方法のステップを実行する特別にプログラミングされたコンピュータとして、コンピュータを動作させる特別用途データ構造を生成する。コンピュータプログラム210および/または動作命令はまた、メモリ206および/またはデータ通信デバイス230中に明白に具現化されてもよく、これにより、コンピュータプログラムプロダクトまたは製造品を本発明にしたがったものにする。したがって、ここで使用する“製造品”、“プログラム記憶デバイス”および“コンピュータプログラムプロダクト”という用語は、任意のコンピュータ読取可能デバイスまたは媒体からアクセス可能なコンピュータプログラムを含むことを意図している。
もちろん、当業者は、上記のコンポーネントの任意の組み合わせ、あるいは、任意の数の異なるコンポーネント、周辺機器および他のデバイスが、コンピュータ202とともに使用されてもよいことを認識するだろう。
図3Aは、本発明の1つの実施形態を実施するために使用できる例示的なプロセスのステップを図示しているダイヤグラムである。上述したように、メディアプログラムプロバイダ110は、メディアプログラムのソース、および、メディアプログラムを説明するメタデータであってもよく、あるいは、メディアプログラムプロバイダ110は、メディアプログラムソース120、または、独立的なメディアプログラムメタデータソース130から、メディアプログラムおよび/またはメディアプログラムについてのメタデータを取得してもよい。ブロック302では、メディアプログラムは、メディアプログラムソース120からメディアプログラムプロバイダ110に送信される。メディアプログラムは、複数のフレームを含み、各フレームは、一緒にメディアプログラムを含む画像のうちの1つを提供する。
メディアプログラムに加えて、メディアプログラムソース120はまた、メディアプログラムについてのメタデータを送信してもよい。このようなメタデータは、メディアプログラム自体についての一般的なメタデータ、および/または、メディアプログラム中に描写されているオブジェクトを説明するオブジェクトメタデータを含んでもよい。メディアプログラムおよび/またはメタデータは、ブロック304中に示されているように、メディアプログラムプロバイダ110により受信される。ブロック306中に示されているように、メディアプログラムプロバイダ110はまた、独立的なメディアプログラムメタデータプロバイダ130からのオブジェクトメタデータを含む、メディアプログラムについてのメタデータを取得する。ブロック302および306は、メディアプログラムプロバイダ110が、図3Aおよび3B中に描写されている残りの動作を完了させるために必要なメディアプログラムおよび任意のメタデータを既に有しているケースでは、それらが実行される必要がないことを示すように点線化されている。メディアプログラムは、単純なダウンロード、プログレッシブダウンロード、または、上述したストリーミング技術を使用して、メディアプログラムソース120からメディアプログラムプロバイダ110に送信されてもよい。
ブロック308では、メディアプログラムの複数のフレームが、オブジェクトを描写する少なくとも1つのビデオフレームを識別するためにサーチされる。オブジェクトは、出演者、建物、または、メディアプログラムのフレームのうちの少なくとも1つ中に視覚的に描写される任意のオブジェクトであってもよい。プログレッシブダウンロードまたはストリーミングにより、メディアプログラムソース120からメディアプログラムが取得されるケースでは、サーチングステップは、ビデオデータが受信されるときに、メディアプログラムプロバイダ110により達成されてもよい。
1つの実施形態では、サーチングステップは、メディアプログラムソース120または独立的なメディアプログラムメタデータソース130から取得されたオブジェクトメタデータ中に識別されるオブジェクトのうちの1つ以上のものに対して実行される。この動作は、以下に説明される図4に関してさらに説明されているように達成することができる。
ブロック310中で示されているように、メタデータは、識別されたビデオフレームに対して生成される。1つの実施形態では、メタデータは、オブジェクトおよびオブジェクトが見つかるフレームを識別するメディアプログラムメタデータである(例えば、object(s) = <object name(s)>、frame(s) = <frame number(s)>)。別の実施形態では、メタデータは、フレームに関係付けられており(これが、フレームメタデータ)、サムネイルメタデータを生成するために使用される。いずれのケースでも、フレームは、フレーム番号により、メディアプログラムにおける経過時間により、または、フレームを識別する類似した手段により、識別することができる。メタデータ(メディアプログラム全体、または、メタデータの個々のフレームに関係付けられているかに関わらず)は、サムネイルに対するメタデータ(識別された個々のフレームのうちの1つから生成される)を生成させるために使用することができる。
ブロック312中に示されているように、識別されたメタデータは、その後、メディアプログラムデータベース114中のメディアプログラムに関係付けられる。1つ以上の実施形態では、メディアプログラムは、メディアプログラム中に描写されているオブジェクト、および、オブジェクトを描写するフレームのフレーム番号を説明するメタデータに関係付けられている。例えば、映画は、映画の中でキャラクターを演じる出演者を説明するメタデータに関係付けられてもよい。このケースでは、ビデオフレームは、出演者が描写されているフレームに対してサーチされ、出演者および出演者が描写されているフレームを識別するメタデータが生成され、メディアプログラムに関係付けられる。このプロセスは、メタデータ中で識別されるすべてのオブジェクトに対して(例えば、すべての出演者に対して)反復することができる。
上述したように、ブロック310中で説明した動作を実行すること、すなわち、複数のビデオフレームに対するメタデータを生成することは、困難であることがある。本発明は、オブジェクト検出および追跡機能とともに、視聴しているコミュニティからのメタデータ入力を有益に使用して、このメタデータの生成、および、メタデータと適切なフレームもしくはビデオクリップとの関係付けにおいて支援する。
図4A〜4Fは、複数のビデオフレームに対してメタデータを開発するために使用できる例示的な方法のステップを図示しているダイヤグラムであり、図5は、プロセスのステップをさらに図示しているダイヤグラムである。メディアプログラム502のうちの複数のビデオフレーム504は、メディアプログラムから抽出される。1つの実施形態では、抽出されたビデオフレームは、直前のビデオフレームから固定の時間またはフレーム間隔だけ離されている。例えば、毎10番目のビデオフレームが抽出されてもよい。
初めに、図4Aに目を向けると、ブロック402中に示されているように、オブジェクト検出は、抽出された複数のビデオフレーム上で実行され、関心のオブジェクトを描写するフレームを識別する。例えば、1つの実施形態では、あるアルゴリズムは、人間の顔を検出するために使用され、認識されるオブジェクトは、出演者の顔を含む。示されている例では、毎10番目のビデオフレーム504が、メディアプログラム502から抽出された。顔は、ビデオフレーム0001、0011、...、0101(第1の出演者の顔520の描写を含む)、フレーム3431、3441、...、3521(第2の出演者の顔522の描写を含む)、および、フレーム3531、3541、...、4241(第1の出演者の顔520および第2の出演者の顔522の双方の描写を含む)の中で検出された。
ブロック404では、検出されたオブジェクトを含むメディアプログラムの1つ以上のフレームを含む第1のデータは、ユーザ132への提示のために、ディスプレイデバイス102に送信される。
1つの実施形態では、第1のデータは、メディアプログラム(メディアプログラムの動画を一緒に提示する複数のフレームを含む)を含む。図4B中で示されているように、このデータは、ディスプレイデバイス102上で実行するメディアプログラムプレイヤーにおいて再生されてもよい。別の実施形態では、図4C中に示されているように、第1のデータは、メディアプログラムサーチまたはプログラムガイドに応答して提示される1つ以上のサムネイルを含む。
図4Bは、ユーザコンピュータ102により実現され、ディスプレイ222上に提示されているメディアプログラムプレイヤー(MPP)448の1つの実施形態を提示する例示的なユーザインターフェース422を図示しているダイヤグラムである。図示されている実施形態では、MPP448は、ブラウザ423中に提示されている。ブラウザ423は、ユーザが、関心のウェブサイトのユニフォームリソースロケータ(URL)を入力してもよいアドレスボックス424を有してもよい。ブラウザ423はまた、サーチボックス426中にキーワードを受け入れ、サーチボタン428の選択の際に、サーチ要求に応答するサーチ結果とともにウェブページをユーザに提供してもよい。さらに、ブラウザ423上に提示されている情報は、アンシエータ446により制御430を選択して、制御430をスクロールバー432にそって移動させることにより、スクロールバー432を使用することにより、観覧されてもよい。
1つの実施形態では、MPP448は、メディアプログラムがユーザに対して再生されるビューウィンドウ434と、メディアプログラムの再生をユーザにより制御できるようにする複数の制御436A〜436F(以下では、代わりに、制御436と呼ばれる)を含む。制御436は、メディアプログラムの再生を停止するために使用される停止制御436Cと、メディアプログラムの再生を開始または再開するために使用される再生制御436Fと、メディアプログラムの再生を一時停止するために使用される一時停止制御436Bとを含む。制御436はまた、ユーザがメディアプログラムを通して早送りすることを可能にする早送り制御436Eと、ユーザが次のシーンへ、または、次のメディアプログラムへスキップすることを可能にするフォワードスキップ制御416Dとを含む。1つの実施形態では、次のシーンへのスキップは、スキップ制御436Dを瞬間的に選択することにより選択できる一方で、次のメディアプログラムへのスキップは、スキップ制御436Dを選択してホールドすることにより実行できる。異なるシーンは、いずれのフレームが新たなシーンを開始するかを示すマーカーの使用により、または、各シーン中の最初のフレームに対するフレームを識別するメディアプログラムメタデータの使用により、メディアプログラム中で識別できる。スキップ制御436Aはまた、スキップ制御436Dと同じ方法で、前のメディアプログラムまたはシーンへスキップすることを可能にする。
1つの実施形態では、MPP448は、ビューウィンドウ414中に、およその表示されたメディアプログラムが表示されるプログレスバー442を含んでもよい。メディアプログラムがMPP448に漸進的にダウンロードされる場合、プログレスバー422はまた、メディアプログラムのうちのどのくらいがユーザコンピュータ102に送信され、バッファされたか、したがって、メディアプログラムのうちのどのくらいが、シークプレビューに対して視聴可能かを示すメディアバッファプログレスインジケータ440を含んでもよい。ストリーミングビデオは、ユーザがメディアプログラムの異なる部分へのアクセスをバッファせずに(例えば、メディアサーバ110に送信される制御信号の使用を通して)取得できるため、メディアバッファプログレスインジケータ440は必要でない。
制御438は、MPP448により現在描写されているフレームの一時的な位置を示す。ユーザは、制御438を選択して、制御438をプログレスバー442にそって異なる位置に移動させることにより、制御438操作を介して、メディアプログラムの任意の部分をリプレイするようにMPP448に命令してもよい。プログレスバー442の一番左の位置は、メディアプログラムの始まりに近い一時的な位置を示している一方、一番右の位置は、メディアプログラムの終わりに近い一時的な位置を示す。図4Bは、メディアプログラム中のオブジェクト450の表示を示す。
1つの実施形態では、メディアプログラムの描写フレームは、検出されたオブジェクトの概要説明、例えば、図4B中に示されている標線454を示す。標線454は、オブジェクト450を囲んでもよく、または、およそオブジェクト450でもよい。
図4Dは、検出されたオブジェクトを含むメディアプログラムフレームの再生を図示している別のダイヤグラムである。この実施形態では、ユーザは、出演者としてHarrison Fordを含むメディアプログラムを見つけようと施行して、メタデータサーチを送信している。これは、例えば、サーチボックスに“Harrison Ford”を入力することにより達成できる。サーチ結果は、ディスプレイデバイス102に送信され、サムネイル452A〜452L(以下では、代わりに、サムネイル452と呼ばれる)として提示されている1つ以上のフレームを含んでもよい。フレームは、検出されたオブジェクト450A〜450I(以下では、代わりに、オブジェクト450と呼ばれる)と、標線(以下では、代わりに、標線454と呼ばれる)とを含んでいる。フレームは、Harrison Fordに対するクエリに応答して提示されたが、検出されたオブジェクト450は、Harrison Fordを提示する必要はないことに留意すべきである。代わりに、検出されたオブジェクト450は、他のオブジェクトであってもよい。
1つ実施形態では、フレーム452のうちの任意のものは、検出された複数のオブジェクトを描写する。しかしながら、別の実施形態では、ディスプレイデバイスに提供するように選択されたフレーム452は、1つの検出されたオブジェクトのみが存在するフレームである。
図4Aに戻ると、ブロック406中で示されているように、識別されたオブジェクトに関係付けられている、ユーザに入力されたメタデータを含む第2のデータが受信される。
ユーザに入力されたメタデータは、検出されたオブジェクトを識別するデータ、または、オブジェクトについての任意のデータであってもよい。例えば、オブジェクトが出演者である場合、出演者のウェブサイトへのユニフォームリソースロケータ(URL)が入力されてもよく、出演者がキャストメンバーである他のメディアプログラム、または、出演者についての半端なファクタが入力されてもよい。
ボックス408では、オブジェクトは、メディアプログラムの近似のフレームにわたって追跡される。言い換えると、メディアプログラム中のオブジェクトは、典型的に、複数の近接するフレーム中で描写されることから、検出されたものは、1つのフレームから次のフレームへ追跡されてもよい。典型的に、オブジェクトが近接するフレーム間で移動した距離、および、オブジェクトのフレームからフレームへの出現における変化は、フレームにわたってオブジェクトを簡単に追跡することを可能にする。
ブロック410では、ユーザに対して表示されたフレームに関して入力されたメタデータは、ユーザに対して表示されたフレームに近似する1つ以上のフレーム中の同じオブジェクトに関係付けられる。この方法では、ユーザに入力されたメタデータは、複数のフレームにわたって伝播される。典型的に、オブジェクトは、画像のグループ(GOP)にわたって簡単に追跡できる。
ブロック412では、入力された、関係付けられているデータは、後の使用のために記憶される。
図4Cは、ユーザがオブジェクトメタデータを入力するように促されている1つの実施形態を図示しているダイヤグラムである。ブロック458では、検出されたオブジェクトのユーザ選択を含む第3のデータが、ディスプレイデバイス102から受信される。1つの実施形態では、これは、ポインティングデバイスを使用して、オブジェクト454にわたってアンシエータ446をホバリングさせる、または、アンシエータを使用してオブジェクト450を選択するユーザによって実現できる。ブロック460では、検出されたオブジェクトに関係付けられているメタデータのユーザ入力に対する、ディスプレイデバイス102へのインターフェースを含む第4のデータが送信される。
図4Eは、ユーザインターフェース460の1つの実施形態を示しているダイヤグラムである。ユーザインターフェースは、オブジェクトを識別するユーザ入力を受け入れるテキストボックス462を含む。1つ実施形態では、ユーザインターフェース460はまた、第2のデータに関係付けられている仮定のメタデータを含む。例えば、前もって入力されたデータが、オブジェクトがHarrison Fordであるかもしれないことを示す場合、ユーザインターフェース460は、その仮定のデータを含めることができる。ユーザインターフェース460はまた、この仮定のデータの確定、例えば、図4E中で提供される、はい/いいえの選択を含んでもよい。
図4Fは、サムネイル実施形態におけるユーザインターフェースのアプリケーションを図示しているダイヤグラムである。
1つの実施形態では、ユーザに入力されたメタデータは、それが、データベース中に永久的に記憶される前に検証されて、他のユーザに提供される。これは、ユーザに入力されたメタデータと他のユーザに入力されたメタデータとを比較して、ユーザに入力されたメタデータを比較に基づいて検証することにより達成されてもよい。例えば、ユーザに入力されたデータは、ユーザに入力されたコメントの十分な数または割合が、オブジェクトに関係付けられたメタデータに関して一致するまで、使用されないかもしれない。識別された俳優のケースでは、ユーザに入力されたデータは、最低5人の異なるユーザが、オブジェクトを識別するデータを提供し、80%より多くのユーザデータがオブジェクトの識別に関して一致するまで、オブジェクトと(少なくとも永久的には)関係付けられないかもしれない。
図5中に示されている例では、オブジェクトは、ビデオフレーム0001中で第1の出演者の顔520として識別されており、顔は、フレーム0002、0011、...0101への追跡できることから、そのオブジェクトを出演者の顔として識別するメタデータは、フレーム0002、0011、...0101に伝播される。また、オブジェクトは、フレーム3434中で第2の出演者の顔522として識別されており、フレーム3434に関して入力された任意のメタデータは、追跡機能を使用して、フレーム3431に対する後ろに、および、フレーム4241に対する前に、伝播することができる。
ユーザのサーチが、オブジェクトが描写されているビデオクリップ(静的なサムネイルの代わりに)を取り出す、以下に説明されているさらなる実施形態では、オブジェクトが複数のシーケンシャルなフレーム中で描写されている場合、オブジェクトを描写する最初および最後のフレームに対する識別子に気付くことができる。
1つの実施形態では、メディアプログラム中に描写されているオブジェクト、および、それらがどこ(例えば、いずれのフレーム)に描写されているかを識別する情報は、増大するメディアプログラムメタデータ530として記憶される。この実施形態では、メタデータは、個々のフレームの代わりに、メディアプログラムに関係付けられており、ユーザがメディアプログラム502中のオブジェクトに対してサーチするとき、オブジェクトが描写されているフレームを示すメタデータが取り出され、サムネイルが、そのフレームから生成され、ユーザに提示される。ビデオクリップが提示されている実施形態では、メタデータは、オブジェクトが描写されている最初および最初のフレームを示してもよく、サムネイルまたはビデオクリップ(場合によっては、サムネイルサイズの)が生成され、ユーザに提示される。1つの実施形態では、ビデオクリップは、ポインタをサムネイルにわたって転がすことによりアクティブ化される。別の実施形態では、ビデオクリップは、それがダウンロードされると直ぐにアクティブ化されるが、ポインタがサムネイルにわたって転がされない限り、または、そうでなければ、ビデオクリップが選択されない限り、オーディオは再生されない。これにより、複数のソースからのオーディオを混乱させることなく、複数のビデオクリップを描写することが可能になる。
他の態様では、メタデータは、オブジェクトが描写されているフレームに関係付けられているか、または、そのフレームから生成されるサムネイルに関係付けられている。例えば、1つ以上のサムネイル550、554は、オブジェクト(それぞれ、520および522)を描写しているフレームから生成されてもよく、それらのフレームを説明しているサムネイルメタデータ(それぞれ、552および556)が生成され、サムネイルメタデータは、メディアプログラム502に関係付けられている。このようなメタデータは、フレーム番号と、フレーム中に描写されているオブジェクトを識別する情報とを含めることができる。この実施形態では、ユーザが、メディアプログラム中のオブジェクトをサーチするとき、関連するサムネイルデータもサーチされ、サーチしたオブジェクトを描写するサムネイルがユーザに提示される。または、メディアプログラムのフレーム502中に描写されたオブジェクトを説明するメタデータは、単純に、フレーム502に(フレームから生成されたサムネイルの代わりに)関係付けられていてもよい。この実施形態では、ユーザは、メディアプログラム中のオブジェクトをサーチするとき、フレームメタデータは、オブジェクトを描写するフレームを見つけるためにサーチされる。サムネイルは、その後、見つかったフレームから生成させることができる。
またさらに別の実施形態では、メタデータは、必ずしも、オブジェクトを説明せず、むしろ、位置またはシーンを説明することができる。
図3Bは、ユーザが、関心のオブジェクトを描写するメディアプログラムフレーム504を識別するメタデータをサーチすることを可能にするために使用できる例示的な方法のステップを図示しているダイヤグラムである。ブロック320では、サーチ要求またはサーチクエリが、ユーザコンピュータ102から送信される。サーチ要求は、値を有するサーチパラメータを含んでもよい。サーチパラメータは、キーワード、オブジェクト名またはシーンであってもよい。ブロック322中に示されているように、サーチ要求は、メディアプログラムプロバイダ110により受信および受け入れられる。ブロック324では、メディアプログラムデータベース114が、サーチパラメータ値に対してサーチされる。ブロック326では、パラメータ値により説明されるオブジェクトを描写するとともに、サーチに対して応答するサムネイルが生成される(これらが前もって生成されない実施形態において)、または、取り出される(これらが前もって生成される実施形態において)。ブロック328中に示されているように、結果は、プログラムガイド中に、または、その後ユーザコンピュータ102に送信される他のインターフェース中に含まれている。ブロック330中に示されているように、ユーザコンピュータ102は、プログラムガイドを受信し、ユーザに対してサムネイルを表示する。
ブロック332に示されているように、ユーザは、その後、サムネイルを選択してもよい。ブロック334中に示されているように、選択されたサムネイルを識別するメッセージ、または、関係付けられているメディアプログラムが、メディアプログラムプロバイダ110に提供され、これは、サムネイルに関係付けられているメディアプログラムを取り出す。ブロック336中に示されているように、ユーザコンピュータ102は、選択されたメディアプログラムを受信し表示する。
メディアプログラム自体が、メディアプログラムプロバイダによってストリーミングされず、むしろ、メディアプログラムソース120のうちの1つによりストリーミングされる実施形態では、サムネイルの選択は、再生されることになるサムネイルまたはメディアプログラムを識別するメッセージをメディアプログラムソース120に送信し、メディアプログラムは、代わりに、メディアプログラムソース120により提供される。この事例では、メディアプログラムは、メディアプログラムソース120により提供されるが、メディアプログラムを表示しているウィンドウは、メディアプログラムプロバイダ110により供給されるウィンドウ中に組み込まれていてもよく、したがって、メディアプログラムがメディアプログラムプロバイダ110またはメディアプログラムソース120からストリーミングされるかに関わらず、ユーザインターフェースに同じ見た目および特徴を提供する。
ブロック324中で説明されている動作は、多数の方法で実現されてもよい。1つの実施形態では、メディアプログラムメタデータ530は、サーチパラメータ値が、オブジェクトを描写する情報と一致するか否かを決定するためにサーチされる。サーチパラメータ値が、オブジェクトを描写するメディアプログラムメタデータ530と一致する場合、見つかった値に関係付けられているフレームが決定され、後に表示のためにユーザコンピュータ102に送信されるサムネイルを生成させるために使用される。例えば、サーチパラメータが出演者であり、サーチパラメータ値が“Meg Ryan”である場合、メディアプログラムデータベース114は、値“Meg Ryan”に対してサーチされる。図3Aに関して上述した動作の理由で、メディアプログラムデータベース114は、“Meg Ryan”に対する一致する入力と、彼女の肖像を描写する画像をどのフレームで見つけることができるかを示す、関係付けられているフレーム番号とを含む。
別の実施形態では、メディアプログラムデータベース530は、サムネイルまたはフレームメタデータを含み、メディアプログラムデータベース530は、サーチパラメータ値を含む入力(オブジェクト説明のような)を見つけるためにサーチされる。例えば、ユーザ132がサーチ値として“Meg Ryan”を入力した場合、メディアプログラムデータベース114は、メディアプログラムメタデータ530が入力“Meg Ryan”を含むか否かを決定するためにサーチされる。その場合、“Meg Ryan”入力に関係付けられているサムネイルは、メディアプログラムデータベース530から取り出され、表示のために、ユーザコンピュータ102に送信される。
典型的に、メディアプログラム502は、複数のシーンを含み、出演者および他のオブジェクトは、1つより多いシーンの中で描写されてもよい。1つの実施形態では、メディアプログラムデータベース114は、シーンと、各シーンの最初および最後のフレームとを識別するメディアプログラムメタデータ530を含む。図5中で例が示されている。この実施形態では、所望のオブジェクトを描写しているフレーム番号が、シーンの各々に対して提示されている。例えば、メディアプログラムメタデータは、以下のように整理された情報を含んでもよい。
Figure 2013536969
この実施形態では、ユーザはまた、関心のオブジェクトのみではなく、関心のシーンも同様に指定する(例えば、“Meg Ryan and Diner”)というサーチクエリを入力してもよい。このケースでは、Meg Ryanが、映画の夕食のシーン中のフレーム3876中に描写されていることから、メディアプログラムデータベースは、そのフレームを使用して、サムネイルを生成して送り返す。
当業者は、本発明の範囲から逸脱することなく、この構成に対して多くの修正を行うことができることを認識するだろう。例えば、当業者は、本発明とともに、上記のコンポーネントの任意の組み合わせ、あるいは、任意の数の異なるコンポーネント、周辺機器、および、他のデバイスを使用できることを認識するだろう。
結論
これは、本発明の好ましい実施形態の説明を結論付ける。本発明の好ましい実施形態の前述は、例示および説明の目的のために提示されている。これは、排他的であること、または、開示した厳格な形態に本発明を限定することを意図していない。上記の教示を踏まえて、多くの修正および変更が可能である。本発明の範囲は、この詳細な説明によってではなく、むしろ、ここに付随する特許請求の範囲により限定されることを意図している。上記の仕様、例示およびデータは、本発明の構成の製造および使用の完全な説明を提供する。本発明の多くの実施形態は、本発明の精神および範囲から逸脱することなく構成することができることから、本発明は、これ以下に付随する特許請求の範囲内に属する。

Claims (42)

  1. メディアプログラムに関係付けられているメタデータを取得する方法において、
    メディアプログラムのフレーム中のオブジェクトを検出するステップと、
    前記検出したオブジェクトを有する前記メディアプログラムの前記フレームを含む第1のデータを、ユーザへの提示のためにディスプレイデバイスに送信するステップと、
    前記識別したオブジェクトに関係付けられている、ユーザに入力されたメタデータを含む第2のデータを受信するステップと、
    前記オブジェクトを前記メディアプログラムの近似のフレームにわたって追跡するステップと、
    前記入力されたメタデータを前記メディアプログラムの前記近似のフレームのうちの少なくとも1つの中の前記オブジェクトと関係付けるステップと、
    前記関係付けた入力メタデータを記憶するステップとを含む方法。
  2. 前記識別したオブジェクトに関係付けられている、ユーザに入力されたメタデータを含む第2のデータを受信するステップは、
    前記検出したオブジェクトのユーザ選択を含む第3のデータを、前記ディスプレイデバイスから受信するステップと、
    前記検出したオブジェクトに関係付けられているメタデータのユーザ入力に対する、前記ディスプレイデバイスへのインターフェースを含む第4のデータを送信するステップとを含む請求項1記載の方法。
  3. 前記第4のデータは、第2のユーザにより入力された前記識別したオブジェクトに関係付けられているメタデータを含む請求項2記載の方法。
  4. 前記第4のデータは、前記識別したオブジェクトに関係付けられている仮定のメタデータを含み、前記第2のデータは、前記仮定のメタデータの組み合わせを含む請求項2記載の方法。
  5. 前記フレームは、前記検出したオブジェクトの描写を含む請求項1記載の方法。
  6. 前記描写は、前記オブジェクトに近似の標線を含む請求項5記載の方法。
  7. 前記第1のデータは、前記送信したフレームを含む複数のフレームを含み、前記複数のフレームは、ともに前記メディアプログラムの動画を提示する請求項1記載の方法。
  8. 前記フレームは、1つの検出されたオブジェクトのみを含むサムネイルである請求項1記載の方法。
  9. 前記サムネイルは、メタデータサーチに応答して送信され、前記フレームは、前記1つの検出したオブジェクトを含み、追加の検出したオブジェクトは含まないように選択される請求項8記載の方法。
  10. 前記メタデータは、前記メディアプログラム中に描写されている出演者をサーチする請求項9記載の方法。
  11. 前記受信した第2のデータは、前記検出したオブジェクトを識別する、ユーザに入力されたメタデータを含む請求項1記載の方法。
  12. 前記オブジェクトは、前記メディアプログラム中に描写されている出演者であり、前記入力されたメタデータは、前記出演者を識別する請求項1記載の方法。
  13. 前記メタデータを記憶する前に、前記メタデータを検証するステップをさらに含む請求項1記載の方法。
  14. 前記ユーザに入力されたメタデータを検証するステップは、
    前記ユーザに入力されたメタデータを他のユーザに入力されたメタデータと比較するステップと、
    前記比較に基づいて、前記ユーザに入力されたメタデータを検証するステップとを含む請求項1記載の方法。
  15. メディアプログラムに関係付けられているメタデータを取得するための装置において、
    メディアプログラムのフレーム中のオブジェクトを検出し、前記オブジェクトを前記メディアプログラムの近似のフレームにわたって追跡するメディアプログラムアナライザと、
    前記検出したオブジェクトを有する前記メディアプログラムの前記フレームを含む第1のデータを、ユーザへの提示のためにディスプレイデバイスに送信し、前記識別したオブジェクトに関係付けられている、ユーザに入力されたメタデータを含む第2のデータを受信する通信モジュールと、
    前記入力されたメタデータを前記メディアプログラムの前記近似のフレームのうちの少なくとも1つの中の前記オブジェクトと関係付け、関係付けた入力メタデータを記憶するデータベースとを具備する装置。
  16. 前記通信モジュールはさらに、前記検出したオブジェクトのユーザ選択を含む第3のデータを、前記ディスプレイデバイスから受信し、前記検出したオブジェクトに関係付けられているメタデータのユーザ入力に対する、前記ディスプレイデバイスへのインターフェースを含む第4のデータを送信する請求項15記載の装置。
  17. 前記第4のデータは、第2のユーザにより入力された前記識別したオブジェクトに関係付けられているメタデータを含む請求項16記載の装置。
  18. 前記第4のデータは、前記識別したオブジェクトに関係付けられている仮定のメタデータを含み、前記第2のデータは、前記仮定のメタデータの組み合わせを含む請求項16記載の装置。
  19. 前記フレームは、前記検出したオブジェクトの描写を含む請求項15記載の装置。
  20. 前記描写は、前記オブジェクトに近似の標線を含む請求項19記載の装置。
  21. 前記第1のデータは、前記送信したフレームを含む複数のフレームを含み、前記複数のフレームは、ともに前記メディアプログラムの動画を提示する請求項15記載の装置。
  22. 前記フレームは、1つの検出されたオブジェクトのみを含むサムネイルである請求項15記載の装置。
  23. 前記サムネイルは、メタデータサーチに応答して送信され、前記フレームは、前記1つの検出したオブジェクトを含み、追加の検出したオブジェクトは含まないように選択される請求項22記載の装置。
  24. 前記メタデータは、前記メディアプログラム中に描写されている出演者をサーチする請求項23記載の装置。
  25. 前記受信した第2のデータは、前記検出したオブジェクトを識別する、ユーザに入力されたメタデータを含む請求項15記載の装置。
  26. 前記オブジェクトは、前記メディアプログラム中に描写されている出演者であり、前記入力されたメタデータは、前記出演者を識別する請求項15記載の装置。
  27. 前記データベースは、前記メタデータを記憶する前に、前記メタデータを検証する請求項15記載の装置。
  28. 前記データベースは、前記ユーザに入力されたメタデータを他のユーザに入力されたメタデータと比較し、前記比較に基づいて、前記ユーザに入力されたメタデータを検証する請求項15記載の装置。
  29. メディアプログラムに関係付けられているメタデータを取得するための装置において、
    メディアプログラムのフレーム中のオブジェクトを検出する手段と、
    前記検出したオブジェクトを有する前記メディアプログラムの前記フレームを含む第1のデータを、ユーザへの提示のためにディスプレイデバイスに送信する手段と、
    前記識別したオブジェクトに関係付けられている、ユーザに入力されたメタデータを含む第2のデータを受信する手段と、
    前記オブジェクトを前記メディアプログラムの近似のフレームにわたって追跡する手段と、
    前記入力されたメタデータを前記メディアプログラムの前記近似のフレームのうちの少なくとも1つの中の前記オブジェクトと関係付ける手段と、
    前記関係付けた入力メタデータを記憶する手段とを具備する装置。
  30. 前記識別したオブジェクトに関係付けられている、ユーザに入力されたメタデータを含む第2のデータを受信するステップは、
    前記検出したオブジェクトのユーザ選択を含む第3のデータを、前記ディスプレイデバイスから受信する手段と、
    前記検出したオブジェクトに関係付けられているメタデータのユーザ入力に対する、前記ディスプレイデバイスへのインターフェースを含む第4のデータを送信する手段とを含む請求項29記載の装置。
  31. 前記第4のデータは、第2のユーザにより入力された前記識別したオブジェクトに関係付けられているメタデータを含む請求項30記載の装置。
  32. 前記第4のデータは、前記識別したオブジェクトに関係付けられている仮定のメタデータを含み、前記第2のデータは、前記仮定のメタデータの組み合わせを含む請求項30記載の装置。
  33. 前記フレームは、前記検出したオブジェクトの描写を含む請求項29記載の装置。
  34. 前記描写は、前記オブジェクトに近似の標線を含む請求項33記載の装置。
  35. 前記第1のデータは、前記送信したフレームを含む複数のフレームを含み、前記複数のフレームは、ともに前記メディアプログラムの動画を提示する請求項29記載の装置。
  36. 前記フレームは、1つの検出されたオブジェクトのみを含むサムネイルである請求項29記載の装置。
  37. 前記サムネイルは、メタデータサーチに応答して送信され、前記フレームは、前記1つの検出したオブジェクトを含み、追加の検出したオブジェクトは含まないように選択される請求項36記載の装置。
  38. 前記メタデータは、前記メディアプログラム中に描写されている出演者をサーチする請求項37記載の装置。
  39. 前記受信した第2のデータは、前記検出したオブジェクトを識別する、ユーザに入力されたメタデータを含む請求項29記載の装置。
  40. 前記オブジェクトは、前記メディアプログラム中に描写されている出演者であり、前記入力されたメタデータは、前記出演者を識別する請求項29記載の装置。
  41. 前記メタデータを記憶する前に、前記メタデータを検証するステップをさらに具備する請求項29記載の装置。
  42. 前記ユーザに入力されたメタデータを検証するステップは、
    前記ユーザに入力されたメタデータを他のユーザに入力されたメタデータと比較する手段と、
    前記比較に基づいて、前記ユーザに入力されたメタデータを検証する手段とを備える請求項29記載の装置。
JP2013527349A 2010-09-03 2011-09-02 コミュニティベースのメタデータを提供するための方法および装置 Active JP5868978B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US12/875,775 2010-09-03
US12/875,775 US8527537B2 (en) 2009-02-19 2010-09-03 Method and apparatus for providing community-based metadata
PCT/US2011/050402 WO2012031242A1 (en) 2010-09-03 2011-09-02 Method and apparatus for providing community-based metadata

Publications (3)

Publication Number Publication Date
JP2013536969A true JP2013536969A (ja) 2013-09-26
JP2013536969A5 JP2013536969A5 (ja) 2016-01-14
JP5868978B2 JP5868978B2 (ja) 2016-02-24

Family

ID=45773292

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013527349A Active JP5868978B2 (ja) 2010-09-03 2011-09-02 コミュニティベースのメタデータを提供するための方法および装置

Country Status (3)

Country Link
US (2) US8527537B2 (ja)
JP (1) JP5868978B2 (ja)
WO (1) WO2012031242A1 (ja)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8527537B2 (en) 2009-02-19 2013-09-03 Hulu, LLC Method and apparatus for providing community-based metadata
US9436685B2 (en) 2010-12-23 2016-09-06 Microsoft Technology Licensing, Llc Techniques for electronic aggregation of information
US9679404B2 (en) 2010-12-23 2017-06-13 Microsoft Technology Licensing, Llc Techniques for dynamic layout of presentation tiles on a grid
US20120166953A1 (en) * 2010-12-23 2012-06-28 Microsoft Corporation Techniques for electronic aggregation of information
US20120170914A1 (en) * 2011-01-04 2012-07-05 Sony Dadc Us Inc. Logging events in media files
US9715485B2 (en) 2011-03-28 2017-07-25 Microsoft Technology Licensing, Llc Techniques for electronic aggregation of information
US9357242B2 (en) 2011-06-10 2016-05-31 Tata Consultancy Services Limited Method and system for automatic tagging in television using crowd sourcing technique
US9294712B2 (en) * 2013-03-20 2016-03-22 Google Inc. Interpolated video tagging
US9665241B2 (en) * 2014-06-30 2017-05-30 Verizon Patent And Licensing Inc. Media content search systems and methods

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005222329A (ja) * 2004-02-05 2005-08-18 Ntt Communications Kk メタデータ付与装置、メタデータ付与方法およびメタデータ付与プログラム
JP2010183253A (ja) * 2009-02-04 2010-08-19 Nikon Corp 情報表示装置および情報表示プログラム
US20100218228A1 (en) * 2009-02-20 2010-08-26 Walter Edward A System and method for processing image objects in video data

Family Cites Families (44)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5761655A (en) * 1990-06-06 1998-06-02 Alphatronix, Inc. Image file storage and retrieval system
US5544352A (en) * 1993-06-14 1996-08-06 Libertech, Inc. Method and apparatus for indexing, searching and displaying data
US20060280437A1 (en) * 1999-01-27 2006-12-14 Gotuit Media Corp Methods and apparatus for vending and delivering the content of disk recordings
US20040268386A1 (en) * 2002-06-08 2004-12-30 Gotuit Video, Inc. Virtual DVD library
US20040255330A1 (en) * 2000-03-28 2004-12-16 Gotuit Audio, Inc. CD and DVD players
US5892536A (en) * 1996-10-03 1999-04-06 Personal Audio Systems and methods for computer enhanced broadcast monitoring
US7058376B2 (en) * 1999-01-27 2006-06-06 Logan James D Radio receiving, recording and playback system
US6931451B1 (en) * 1996-10-03 2005-08-16 Gotuit Media Corp. Systems and methods for modifying broadcast programming
US6088455A (en) * 1997-01-07 2000-07-11 Logan; James D. Methods and apparatus for selectively reproducing segments of broadcast programming
US7055166B1 (en) * 1996-10-03 2006-05-30 Gotuit Media Corp. Apparatus and methods for broadcast monitoring
US5986692A (en) * 1996-10-03 1999-11-16 Logan; James D. Systems and methods for computer enhanced broadcast monitoring
US6912327B1 (en) * 1999-01-28 2005-06-28 Kabushiki Kaisha Toshiba Imagine information describing method, video retrieval method, video reproducing method, and video reproducing apparatus
AU4066300A (en) 1999-03-29 2000-10-16 Gotuit Media, Inc. Electronic music and program storage, recognition, management and playback system
US20040255336A1 (en) * 1999-03-30 2004-12-16 Gotuit Video, Inc. Methods and apparatus for simultaneous program viewing
US20040255340A1 (en) * 2000-03-28 2004-12-16 Gotuit Audio, Inc. Methods and apparatus for playing different programs to different listeners using a compact disk player
US20040255334A1 (en) * 2000-03-28 2004-12-16 Gotuit Audio, Inc. Methods and apparatus for seamlessly changing volumes during playback using a compact disk changer
US20060015925A1 (en) * 2000-03-28 2006-01-19 Gotuit Media Corp Sales presentation video on demand system
US7059261B2 (en) * 2004-01-21 2006-06-13 Ncl Corporation Wastewater ballast system and method
WO2002008948A2 (en) * 2000-07-24 2002-01-31 Vivcom, Inc. System and method for indexing, searching, identifying, and editing portions of electronic multimedia files
WO2002019147A1 (en) * 2000-08-28 2002-03-07 Emotion, Inc. Method and apparatus for digital media management, retrieval, and collaboration
US6760042B2 (en) * 2000-09-15 2004-07-06 International Business Machines Corporation System and method of processing MPEG streams for storyboard and rights metadata insertion
US20050005308A1 (en) * 2002-01-29 2005-01-06 Gotuit Video, Inc. Methods and apparatus for recording and replaying sports broadcasts
DE20115470U1 (de) * 2001-09-19 2003-02-27 Cameron Gmbh Druckreduziervorrichtung
US20040233233A1 (en) * 2003-05-21 2004-11-25 Salkind Carole T. System and method for embedding interactive items in video and playing same in an interactive environment
CA2532583A1 (en) 2003-06-24 2005-01-13 Ntech Properties, Inc. Method, system and apparatus for information delivery
US20050044561A1 (en) 2003-08-20 2005-02-24 Gotuit Audio, Inc. Methods and apparatus for identifying program segments by detecting duplicate signal patterns
WO2006120768A1 (ja) * 2005-05-11 2006-11-16 Sharp Kabushiki Kaisha 映像再生制限方法及び映像再生装置
WO2007030621A1 (en) 2005-09-08 2007-03-15 Gotuit Media Corp. On demand fantasy sports game enhanced with recorded real sports broadcasts
US10324899B2 (en) * 2005-11-07 2019-06-18 Nokia Technologies Oy Methods for characterizing content item groups
US8024343B2 (en) * 2006-04-07 2011-09-20 Eastman Kodak Company Identifying unique objects in multiple image collections
WO2007130472A2 (en) 2006-05-01 2007-11-15 Gotuit Media Corporation Methods and systems for providing media assets over a network
JP5087867B2 (ja) * 2006-07-04 2012-12-05 ソニー株式会社 情報処理装置および方法、並びにプログラム
US8196045B2 (en) * 2006-10-05 2012-06-05 Blinkx Uk Limited Various methods and apparatus for moving thumbnails with metadata
GB0622823D0 (en) 2006-11-15 2006-12-27 British Broadcasting Corp Accessing content
WO2008091912A2 (en) * 2007-01-22 2008-07-31 Syracuse University Distributed video content management and sharing systems
US20080209066A1 (en) * 2007-01-24 2008-08-28 Spio Mary A Method and apparatus for providing continuous playback of media programs at a remote end user computer
US8631440B2 (en) * 2007-04-30 2014-01-14 Google Inc. Program guide user interface
US9553947B2 (en) * 2007-07-18 2017-01-24 Google Inc. Embedded video playlists
US7937400B2 (en) * 2007-10-07 2011-05-03 International Business Machines Corporation Dynamic distribution of content
WO2010033642A2 (en) * 2008-09-16 2010-03-25 Realnetworks, Inc. Systems and methods for video/multimedia rendering, composition, and user-interactivity
US8239359B2 (en) * 2008-09-23 2012-08-07 Disney Enterprises, Inc. System and method for visual search in a video media player
US8140463B2 (en) * 2008-10-19 2012-03-20 Eduworks Corporation Automated metadata generation of learning and knowledge objects
US8782709B2 (en) 2009-02-19 2014-07-15 Hulu, LLC Method and apparatus for providing a program guide having search parameter aware thumbnails
US8527537B2 (en) 2009-02-19 2013-09-03 Hulu, LLC Method and apparatus for providing community-based metadata

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005222329A (ja) * 2004-02-05 2005-08-18 Ntt Communications Kk メタデータ付与装置、メタデータ付与方法およびメタデータ付与プログラム
JP2010183253A (ja) * 2009-02-04 2010-08-19 Nikon Corp 情報表示装置および情報表示プログラム
US20100218228A1 (en) * 2009-02-20 2010-08-26 Walter Edward A System and method for processing image objects in video data

Also Published As

Publication number Publication date
JP5868978B2 (ja) 2016-02-24
US8527537B2 (en) 2013-09-03
WO2012031242A1 (en) 2012-03-08
US8805866B2 (en) 2014-08-12
US20130325819A1 (en) 2013-12-05
US20100332527A1 (en) 2010-12-30

Similar Documents

Publication Publication Date Title
JP5868978B2 (ja) コミュニティベースのメタデータを提供するための方法および装置
US10121514B2 (en) Video preview based browsing user interface
US8862691B2 (en) Media aggregation and presentation
JP5619621B2 (ja) 双方向メディアガイダンスアプリケーションの画面に表示するメディア資産を選択するためのシステムおよび方法
US8332414B2 (en) Method and system for prefetching internet content for video recorders
US8782709B2 (en) Method and apparatus for providing a program guide having search parameter aware thumbnails
US20100037149A1 (en) Annotating Media Content Items
US20090222849A1 (en) Audiovisual Censoring
US20110173194A1 (en) Implicit user interest marks in media content
US11659231B2 (en) Apparatus, systems and methods for media mosaic management
JP2013535733A (ja) 検索のためのキーワードの取得
US20230269433A1 (en) System and method for providing a list of video-on-demand programs
US20140372424A1 (en) Method and system for searching video scenes
WO2008087742A1 (ja) 動画再生システム、情報端末装置および情報表示方法
JP5343658B2 (ja) 録画再生装置及びコンテンツ検索プログラム
US20120254906A1 (en) Movie recommendation system and movie recommendation method
TWI554090B (zh) 產生多媒體影音摘要的系統與方法
TWI497959B (zh) Scene extraction and playback system, method and its recording media
JP2008099012A (ja) コンテンツ再生システム及びコンテンツ蓄積システム
US20190182517A1 (en) Providing Enrichment Data That is a Video Segment

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140902

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20140902

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20150731

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20150804

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20151029

A524 Written submission of copy of amendment under article 19 pct

Free format text: JAPANESE INTERMEDIATE CODE: A524

Effective date: 20151029

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20151208

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20160106

R150 Certificate of patent or registration of utility model

Ref document number: 5868978

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250