JP5038607B2 - スマートメディアコンテンツサムネイル抽出のシステムおよび方法 - Google Patents

スマートメディアコンテンツサムネイル抽出のシステムおよび方法 Download PDF

Info

Publication number
JP5038607B2
JP5038607B2 JP2005224585A JP2005224585A JP5038607B2 JP 5038607 B2 JP5038607 B2 JP 5038607B2 JP 2005224585 A JP2005224585 A JP 2005224585A JP 2005224585 A JP2005224585 A JP 2005224585A JP 5038607 B2 JP5038607 B2 JP 5038607B2
Authority
JP
Japan
Prior art keywords
shots
shot
key frame
objectively
representative
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2005224585A
Other languages
English (en)
Other versions
JP2006054872A (ja
Inventor
リン ビン
チャン ホン−チャン
マ ウェイ−イン
ゾウ シンリー
マ ユー−フェイ
コング チケ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Microsoft Corp
Original Assignee
Microsoft Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Microsoft Corp filed Critical Microsoft Corp
Publication of JP2006054872A publication Critical patent/JP2006054872A/ja
Application granted granted Critical
Publication of JP5038607B2 publication Critical patent/JP5038607B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • G11B27/19Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier
    • G11B27/28Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/74Browsing; Visualisation therefor
    • G06F16/743Browsing; Visualisation therefor a collection of video files or sequences
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/78Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/783Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/7837Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using objects detected or recognised in the video content
    • G06F16/784Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using objects detected or recognised in the video content the detected or recognised objects being people
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/78Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/783Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/7847Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using low-level visual features of the video content
    • G06F16/785Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using low-level visual features of the video content using colour or luminescence
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/40Scenes; Scene-specific elements in video content
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Library & Information Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Television Signal Processing For Recording (AREA)
  • Management Or Editing Of Information On Record Carriers (AREA)

Description

本発明は、一般にビデオレンダリングに関し、特に、ビデオデータから導出されるサムネイルを生成し、提示する方法に関する。
ホームエンターテイメント技術の収束に伴って、音楽、映画、写真、TV、ビデオ、ゲームなどの多数の様々な形態のコンテンツを記憶する装置の数が増えている。デジタルビデオレコーダ(DVR)、ゲーム機、およびエンターテイメント用に設定された(entertainment−configured)コンピュータ(例えば、Microsoft Corporation社のWindows(登録商標)XP Media Centerオペレーティングシステムが動作するコンピュータ)などの装置は、ユーザが多数の様々な形態のコンテンツを記録し、管理し、再生することを可能にする。セットトップボックスなどの低機能の装置でさえ、複数のタイプのコンテンツを記録するように設計することができる。
そのような装置は、より多くのコンテンツを記憶し、より多くの機能を提供するように構成されているので、結合力があり(cohesive)、理解でき、ユーザフレンドリな形で、様々な形態の記録されたコンテンツを提示する能力が、依然課題であり続ける。これは、可能な対話および興味を持たれたオブジェクトの識別の視覚化に関するユーザの体験を活用するように設計されたグラフィカルユーザインターフェース(GUI)ベースのコンピューティング装置について特にそうである。例えば、それぞれのイメージファイルのコンテンツを表すためのGUI内の小さいアイコンの使用は、一般に、複数のイメージファイルにまたがるユーザのブラウジング体験を大幅に容易にするであろう。このシナリオでは、小さいアイコンが、各イメージファイルのコンテンツのビジュアル表現を提示することができ、したがって、ユーザは、興味のあるイメージを探すためにイメージファイルを1つずつ開く必要はない。
上記に鑑みて、ビデオファイルにビジュアルメディアが含まれるので、ビデオファイルとのユーザ対話は、ビデオコンテンツを実質的に代表する高品質サムネイルをユーザに提示できる場合に、質を高められる。残念ながら、単一のイメージファイルの代表的主題を識別することが比較的簡単であるのと比較して、ビデオファイルの代表的イメージを識別することは、かなり問題がある。これの理由の1つは、ビデオデータに固有の特性に起因する。ビデオデータは、時系列ベースであり、通常は、多数のイメージフレーム、おそらく数十万個のイメージフレームから構成されている。そのような大量のイメージフレームから、ビデオデータシーケンス全体の主題を表すのにサムネイルとしてどの特定のイメージフレームを使用すべきかを判定するのは、実質的に困難である。ビデオサムネイル生成の従来の技術は、この問題を克服していない。
例えば、既存のビデオサムネイル生成技術の1つでは、ビデオのコンテンツの代表的サムネイルとして、ビデオデータシーケンスの最初のフレームを使用する。残念ながら、ビデオデータの最初のフレームは、しばしば、黒のフレームであるか、意味のないプレパディングデータを含む場合がある。代表的でない黒または低いイメージ品質のサムネイルは、ユーザをいらいらさせ、ユーザがビデオファイル(記録されたメディアコンテンツ140を含む)を素早くブラウズすることを困難にする。したがって、この従来の技術は、ビデオデータシーケンスを代表するイメージフレームの選択をもたらす可能性が低く、実質的に制限されている。ビデオデータのサムネイルを生成するもう1つの既知の技術では、サムネイルのためにビデオのデータシーケンスから1フレームをランダムに選択する。そのようなランダム選択は、ビデオの実際のコンテンツに関する客観的な判断基準を考慮に入れていない。その結果、任意に選択されたフレームは、例えば意味のない主題、低品質の主題、コマーシャル主題、ノイズの多い主題、および/または全般的に代表的でない主題を含む、任意の、しばしば期待されないコンテンツを表す。
したがって、従来のビデオサムネイル生成技術は、通常、ビデオ主題の意味のあるサムネイルをもたらさない。したがって、ビデオのコンテンツを代表するビデオデータシーケンスのイメージフレームを突き止めるためのより客観的な判断基準を適用する必要がある。そのようなイメージフレームから生成されたサムネイルの提示は、エンドユーザが、ビデオの主題が興味のあるものであるかどうかをより正確に判断することを可能にするであろう。
スマートメディアコンテンツサムネイル抽出(smart media content thumbnail extraction)のシステムおよび方法を説明する。一態様では、番組メタデータが、記録されたビデオコンテンツから生成される。番組メタデータには、1つまたは複数の対応するショットからの1つまたは複数のキーフレームが含まれる。客観的に代表的なキーフレームが、ショット持続時間および複数のショットにまたがるキーフレームコンテンツの出現の頻度の関数として、キーフレームの間から識別される。客観的に代表的なキーフレームは、記録されたビデオコンテンツを代表するイメージフレームである。サムネイルが、客観的に代表的なキーフレームから作成される。
図面では、構成要素参照番号の左端の桁が、その構成要素が最初に現れる特定の図面を識別する。
概要
スマートメディアコンテンツサムネイル抽出の次のシステムおよび方法は、複数の客観的判断基準を使用して、ビデオのコンテンツを実質的に代表する高品質ビデオデータシーケンスのイメージフレームを識別し抽出する。次に、この抽出されたイメージフレームを使用して、視覚的に説明的であり、記録されたビデオデータシーケンスを実質的に代表するサムネイルを生成する。例えば、ビデオデータシーケンスからの実質的に最も代表的なイメージフレームは、高いイメージ品質(例えば、特にカラフルであり、黒フレームでない、または客観的に平凡を超えるフレーム)であり、コントラストがよく(例えば、ぼけていない)、コマーシャルセッションの一部でなく、ビデオデータの主題に適当である場合に主要な人の顔および/または主要なオブジェクトを含む。生成されたサムネイルイメージを、ユーザインターフェースで提示して、視聴者がTV番組などの記録されたビデオデータの間でブラウズし、特定の記録されたビデオを選択するのを助ける。
例示的なシステム
必須ではないが、スマートメディアコンテンツサムネイル抽出のシステムおよび方法を、パーソナルコンピュータによって実行されるコンピュータ実行可能命令(プログラムモジュール)の一般的なコンテキストで説明する。プログラムモジュールには、一般的に、特定のタスクを実行するか特定の抽象データ型を実装するルーチン、プログラム、オブジェクト、コンポーネント、データ構造などが含まれる。このシステムおよび方法を、前述のコンテキストで説明するが、以下に説明する作用および動作は、ハードウェアで実施することもできる。
例示のために、スマートメディアコンテンツサムネイル抽出のシステムおよび方法は、放送TV網、対話型TV網、ケーブル網、およびウェブ対応TV網などのテレビジョンベースのシステムを含むオーディオおよび/またはグラフィックスのエンターテイメントシステムおよび情報システムを対象とする。説明されるシステムおよび方法の諸態様は、任意の数のエンターテイメントシステムおよび情報システムで、および任意の数およびタイプのクライアント装置内で実施することができる。
図1に、スマートメディアコンテンツサムネイル抽出のシステムおよび方法を部分的にまたは完全に実施できる例示的なアーキテクチャ100を示す。システム100には、クライアント装置102、ディスプレイ104(例えば、テレビジョン、モニタなど)、および1つまたは複数のコンテンツプロバイダ106が含まれる。コンテンツプロバイダ106は、映画、TV番組、コマーシャル、音楽などのオンデマンドのおよび/または放送されるメディアコンテンツ108、ならびに類似するオーディオコンテンツ、ビデオコンテンツ、および/またはイメージコンテンツの配布を制御する。コンテンツプロバイダ106は、衛星オペレータ、ネットワークテレビジョンオペレータ、ケーブルオペレータ、ウェブベースコンテンツプロバイダなどを代表する。
クライアント装置102は、コンテンツプロバイダ106によって配布されるメディアコンテンツ108を受信し、かつ/または記憶する。具体的に言うと、クライアント装置102は、コンテンツプロバイダ106によって放送または別の方法で送信されたTV番組を受信し、記録するように構成されている。TV番組の例には、ニュース、ホームコメディ、コメディ、TV映画、インフォマーシャル、トークショー、スポーツイベントなどが含まれる。クライアント装置102は、スタンドアロンパーソナルコンピューティング装置、TV対応コンピューティング装置、コンピュータベースのメディアサーバ、セットトップボックス、衛星放送受信器、ハードディスク付きTVレコーダ、デジタルビデオレコーダ(DVR)、ゲーム機、情報機器などを含むいろいろな形で実施することができる。
アーキテクチャ100の例示的な実施形態では、クライアント装置102は、衛星通信、無線通信、ケーブル伝送などの様々な伝送媒体110を介して、ならびに/あるいはネットワーク上(例えばインターネットまたはイントラネット)のファイル転送プロトコルおよび/またはデータパケット通信などさまざまな他の伝送媒体を介して、メディアコンテンツ108を受信する。クライアント装置102に、1つまたは複数のメディアコンテンツ入力112が含まれ、このメディアコンテンツ入力112には、テレビジョン信号を受信するために様々な周波数またはチャンネルに同調できるチューナおよび/またはインターネットプロトコル(IP)ベースのネットワークを介してメディアコンテンツのストリームがそれを介して受け取られるIP入力を含めることができる。
クライアント装置102に、1つまたは複数のプロセッサ114も含まれ、このプロセッサ114は、様々な命令を処理して、クライアント装置102の動作を制御し、クライアント装置に記憶されたアプリケーションを実行し、他の電子装置およびコンピューティング装置と通信する。プロセッサ114に、さらに、メディアコンテンツおよび番組データを受信し、処理し、デコードするコンテンツプロセッサを含めることができる。クライアント装置102は、ディスプレイ104または、オーディオデータおよびビデオデータを処理し、かつ/または表示し、あるいは別の方法でレンダリングする他の装置にオーディオデータおよびビデオデータを供給するオーディオ/ビデオ出力116も備える。ビデオ信号およびオーディオ信号を、RF(ラジオ周波数)リンク、Sビデオリンク、コンポジットビデオリンク、コンポーネントビデオリンク、アナログオーディオ接続、または他の類似する通信リンクを介してクライアント装置102からディスプレイ104に通信することができる。
クライアント装置102は、揮発性メモリおよび不揮発性メモリの両方を含む、様々なタイプのメモリコンポーネントを備えている。この例では、クライアント装置102が、記録媒体120およびキャッシュ122を有する。記録媒体120は、ハードディスクドライブ、RAIDシステム、記録可能および/または書換可能ディスクなどの様々な不揮発性記憶媒体を使用していろいろな形で実施することができる。キャッシュ122は、例えば、クライアント装置102でのデータ処理中のより高速なアクセスのためにランダムアクセスメモリ(RAM)として実施することができる。図示されていないが、クライアント装置に、さらに、1つまたは複数のデータメモリコンポーネントならびにアプリケーションを記憶するプログラムメモリを含めることができる。
1つまたは複数のアプリケーションプログラムを、プログラムメモリに記憶し、プロセッサ114によって実行することができる。図1に示された代表的なアプリケーションに、サムネイルジェネレータ130、ユーザインターフェース(UI)アプリケーション132、電子番組ガイド(EPG)アプリケーション134、およびDVRおよび再生アプリケーション136が含まれる。オペレーティングシステム(図3に図示)も、記憶装置内で維持し、プロセッサ114で実行することができる。
DVRおよび再生アプリケーション136は、コンテンツプロバイダ106から受信したメディアコンテンツを記録媒体120に記録する。記録されたメディアコンテンツ140には、例えば、視聴者が後で見るために記録したTV番組が含まれる。DVRおよび再生アプリケーション136は、ディスプレイ104での、記録されたメディアコンテンツ140の再生も容易にする。
UIアプリケーション132は、ユーザが、記録されたメディアコンテンツ140をブラウズし、選択することを可能にする。この実施例で、UIアプリケーション132は、記録媒体120に記憶されたメディアコンテンツ140を識別し、ある方法でメディアコンテンツ140を処理するオプションを提供する対話型グラフィカルUIスクリーンをサポートする。例えば、UIスクリーンは、様々な記録されたコンテンツ(例えば、オーディオ、静止画、ビデオ、TV番組など)へのナビゲーションを可能にし、最近記録されたコンテンツをリスト化し、または特定のコンテンツに関する詳細情報を提供することを可能にすることができる。1つの例示的なUIスクリーン142が、ディスプレイ104に示されている。このUIスクリーン142に、最も最近に記録されたメディアコンテンツ140が示されている。
EPGアプリケーション134は、ディスプレイ104で提示される番組ガイドを生成する。番組ガイドには、いつ特定のコンテンツが視聴のために放送されるか、どのチャネルでそのコンテンツが放送されるかを示すスケジュールが含まれる。EPGアプリケーション134は、視聴者が、番組ガイドをナビゲートし、放送される番組、記録された番組、ビデオオンデマンドの番組および映画、対話型ゲームセレクション、および視聴者が興味を持つ他のメディアアクセス情報またはコンテンツを突き止めることを可能にする。EPGデータ144が、コンテンツプロバイダ106からダウンロードされ、記録媒体120に記憶され、そこで、番組ガイドに投入するためにEPGアプリケーション134によってアクセスされる。
サムネイルジェネレータ130は、記録されたメディアコンテンツ(ビデオデータ)140を代表するサムネイルイメージ150を作成し、サムネイルイメージ150をキャッシュ122に記憶する。サムネイルイメージまたは単に「サムネイル」は、実際のビデオコンテンツ(記録されたメディアコンテンツ140)から導出され、UIアプリケーション132および/またはEPGアプリケーション134によって、記録されたメディアコンテンツ140をUIスクリーンで視覚的に表すのに使用される。サムネイル150をキャッシュ122に記憶することによって、サムネイル150が、適切なUIスクリーンに投入するための即座の取り出しに使用可能になる。サムネイル150を、その代わりにまたはそれに加えて、記録媒体120などの他のメモリに記憶することができる。
図1では、UIスクリーン142に、記録媒体120に記憶された記録されたメディアコンテンツ140から作成された6つのサムネイルイメージ152が示されている。サムネイルは、関連するTV番組からの代表的なビデオフレームを示し、その結果、視聴者が、記憶された番組を示されたサムネイルに視覚的に関連付けるようになる。視聴者は、リモートコントロールハンドセット154などの入力装置を使用してスクリーン142をナビゲートして、どのTV番組が記録媒体120に記録されているかを確認する手段としてサムネイルの間でブラウズすることができる。ハンドセット154を用いて、視聴者は、サムネイルを選択して、クライアント装置102(例えば、DVRおよび再生アプリケーション136などのコンピュータプログラムアプリケーション)に、選択されたサムネイル150に関連付けられた記録されたメディアコンテンツ140を再生させることができる。
一実施形態で、サムネイルジェネレータ130は、TV番組が記録されつつあるときに2つのサムネイルを作成するように構成される。一時的サムネイルは、TV番組が最初に記録を開始するときに導出される。一実施例で、一時的サムネイルは、TV番組の開始部分から抽出されたビデオフレームから導出される。例えば、サムネイルジェネレータ130は、TV番組の最初の空白でないビデオフレームを選択し、このビデオフレームから、一時的サムネイルが導出される。このような方法で、サムネイルイメージが、数秒以内に生成され、TV番組の記録が始まるや否や、UIスクリーンでの即座の表示に使用可能になる。
永久的サムネイル150は、その後、記録されたメディアコンテンツ140がより多く記録されたときに生成される。議論のために、永久的サムネイルを、別のサムネイルによって置換することができ、したがって、これは、このように永久的でない。永久的サムネイルは、スマートメディアコンテンツサムネイル抽出技術に従って、ビデオデータの分析およびモデリングに基づいて生成される。これらの技術は、記録されたメディアコンテンツ140の、一時的サムネイル150を生成するのに使用されるビデオデータの量と比較してより大きい部分の分析に依存する。これらのスマートメディアコンテンツサムネイル抽出動作は、コンテンツを実質的に代表し、暗くなく、ぼけておらず、ノイズがなく、コマーシャルコンテンツからなっていないイメージフレームを、記録されたメディアコンテンツ140から選択する。一実施例で、永久的サムネイルは、所定の量のコンテンツ140が記録された後(例えば、15分、30分など)または番組全体が記録された後に生成される。
サムネイルジェネレータ130は、次の動作を実行して永久的サムネイル150を生成する。サムネイルジェネレータ130は、まず、記録されたメディアコンテンツ140から番組メタデータ156を作る。番組メタデータ156には、記録されたメディアコンテンツ140(ビデオ)のショット境界、ショットキーフレーム、およびショットにコマーシャルコンテンツが含まれるかどうかの表示が含まれる。ショットは、特定のセマンティクス、コヒーレントなカメラモーション、および一貫した外観を有する短いビデオクリップである。ショット境界は、ショットの開始イメージフレーム境界または終了イメージフレーム境界を識別する。ショット境界は、サブショット、キーフレームなど、番組メタデータ156の他の態様を識別するのに使用される。サムネイルジェネレータ130は、番組メタデータ156を分析して、ショット持続時間、ショットコンテンツ反復頻度、およびコンテンツ品質の関数として代表的なイメージフレームを識別する。
具体的に言うと、サムネイルジェネレータ130は、複数の可能なショット境界検出技術の1つを使用して、記録されたメディアコンテンツ140をそれぞれのショット(基本セマンティック単位)に分解する。次に、サムネイルジェネレータ130は、カメラモーションの関数として各ショットをサブショットにセグメント化する。ショットの関連するサブショットごとに、サムネイルジェネレータ130は、他のサブショットと比較して実質的に低いモーション強度を有する、持続時間において最長のキーフレームを順次選択する。モーション強度は、次のように定義される。
Figure 0005038607
ここで、dxi,jおよびdyi,jは、それぞれx軸およびy軸に沿った動きベクトルの2つの成分であり、MおよびNは、それぞれ動きベクトル場の幅および高さを表す。
この実施例では、コマーシャルコンテンツを含むキーフレームが、ビデオデータシーケンスの代表的イメージフレーム(すなわち、永久的サムネイル150の候補)として選択されないことを保証するために、サムネイルジェネレータ130が、1つまたは複数の既知のコマーシャルコンテンツ検出動作を実施して、ショットにコマーシャルコンテンツが含まれるかどうかを判定する。コマーシャルコンテンツ検出の結果に基づいて、サムネイルジェネレータ130は、ショットの各キーフレームまたは各ショットにインディケーション(例えばフラグ)を用いてタグを付けて、ショットにコマーシャルコンテンツが含まれるかどうかを示す。
非常に短いショットは、重要でなく、コマーシャルコンテンツを含む可能性が最も高いと考えられる。重要なショットは、統計的に、詳細を提示するものであり、比較的長い持続時間があると判定される。低いイメージ品質のキーフレーム(例えば、黒、雑音が多い、パディングされたフレームなど)を含むショットは、記録されたメディアコンテンツ140の実質的な表現に有用でないと考えられる。この判断基準に鑑みて、サムネイルジェネレータ130は、ショットをフィルタリングして、(a)持続時間が十分に長くない、(b)コマーシャルコンテンツを含む、および/または(c)イメージ品質のある閾値を満足しないキーフレームを含むショットを番組メタデータ156から除去する。
この実施形態で、閾値イメージ品質(良さ「G」)は、次のように決定される彩度およびコントラストの関数である。
G=αC+βσ (2)
式(2)では、Cが、カラーヒストグラムエントロピによって定義される彩度の尺度であり、σが、カラーヒストグラムの標準偏差として計算されたコントラストの尺度であり、αおよびβが、彩度とコントラストの重みであり、α+β=1(α>0,β>0)である。コマーシャルプロパティにフラグが立てられている場合に、コマーシャルとしてマークされたすべてのキーフレームも、このステップでフィルタリングされ除去される。
この時点で、番組メタデータ156に、実質的に重要な客観的に判定された高いイメージ品質のキーフレームが含まれる。各残りのキーフレームは、永久的サムネイル150としての選択の候補である。サムネイルジェネレータ130は、監視されない方法で、外観の類似性に基づいて残りのキーフレームを複数のグループにクラスタ化する。この実施形態では、クラスタ化実行のための外観表現が、50次元カラー相関曲線に基づいている。相関曲線は、効果的に、色のグローバル分布およびローカル空間相関を記述し、外観および形状の大きい変化をロバストに許容する。イメージIおよびmビン(bins)を有するそのヒストグラムhを与えられれば、Iの相関曲線は、color(i,j)∈[0,m−1]、距離k∈[1,d]について、
Figure 0005038607
と定義される。
類似性尺度が、外観ベースのクラスタ化のもう1つの要素である。この実施例では、2つのベクトルの間のコサインを、類似性尺度として採用する。例えば、γaおよびγbが、2つのベクトルまたは相関曲線を表すものとすると、類似性は、
Figure 0005038607
として計算される。
この時点で、原理的に、最大のクラスタに含まれるキーフレームのどれであっても、類似する外観に起因して、TV/ビデオサムネイルとして使用され得る。しかし、キーフレームに含まれる情報の観点からは、キーフレームの間に大きい変動がある。ユーザは、1つまたは複数の主要な正面の顔または主オブジェクトを有するサムネイル150を好むかもしれない。というのは、人間の顔または特定のオブジェクトが、通常、例えば単純なシーンまたは雑然としたシーンを表すイメージフレームと比較して、より多くのセマンティクスを伝えるからである。そのような好みを考慮に入れるために、サムネイルジェネレータ130は、顔検出技術を使用して、最大のクラスタのキーフレームから顔を検索する。人間の顔が、いずれかの候補キーフレームで識別された場合に、最大の顔領域を有するキーフレームが、記録されたメディアコンテンツ140の永久的サムネイル150として選択される。
人間の顔が候補キーフレームで識別されない場合には、サムネイルジェネレータ130は、注目度検出動作を実施して、キーフレームから主要なオブジェクトを探す。このシナリオでは、最大のオブジェクト領域を有するキーフレームが、永久的サムネイル150(すなわち「サムネイル150」)として選択される。
TV番組から作成される一時的なまたは永久的なサムネイル150は、静的または動的とすることができる。静的サムネイルには、ビデオコンテンツから生成された静止画が含まれる。動的サムネイルは、サムネイルがアニメ化されて見えるように連続的なループで再生される、ビデオコンテンツから生成された複数のイメージからなる。
一時的なおよび永久的なサムネイル150は、対応する記録されたメディアコンテンツ140に関連してキャッシュ122に記憶され、その結果、UIアプリケーション132および/またはEPGアプリケーション134が、特定のTV番組に関する情報を表示するときに、対応するサムネイルが、キャッシュ122から取り出され、UIスクリーンに提示される。サムネイルをTV番組に関連付ける1つの方法は、プログラムメモリまたはデータメモリなどのメモリに記憶されたデータ構造体を介することである。
例示的な手順
図2に、スマートメディアコンテンツサムネイル抽出の例示的な手順200を示す。説明のために、この手順の動作を、図1の特徴に関して説明する(すべての符号は、コンポーネントが最初に導入された図面の番号から始まる)。ブロック202で、サムネイルジェネレータモジュール130が、記録されたメディアコンテンツ140から番組メタデータ156を生成する。上で説明したように、これは、記録されたメディアコンテンツ140をショットの組に分解することによって達成される。次に、これらのショットを、さらに、カメラモーション判断基準に従ってサブショットにセグメント化して、各ショットの候補キーフレームを突き止める。ブロック204で、サムネイルジェネレータモジュール130が、ショット持続時間、コマーシャルコンテンツ、および/またはイメージフレーム品質などの複数のショット資格付与判断基準に基づいてショットをフィルタリングする。ブロック206で、サムネイルジェネレータモジュール130が、ショットの外観に基づいて、残りのショット(ブロック204の動作によるフィルタリングで除去されなかったショット)をクラスタ化する。ブロック208で、サムネイルジェネレータモジュール130が、最大のクラスタに人間の顔を有するキーフレームが含まれるかどうかを判定する。顔を有する場合には、手順200はブロック210に継続され、候補キーフレームを、顔の領域(Facial Area)に従ってランク付けする。ブロック212で、サムネイルジェネレータモジュール130が、最大の顔領域を有すると判定されたキーフレームから永久的サムネイル150を生成する。
ブロック214で、サムネイルジェネレータモジュール130は、永久的サムネイル150をキャッシングする。ブロック216で、サムネイルジェネレータモジュール130が、記録されたメディアコンテンツ140の識別子としてサムネイル150を表示する。
サムネイルジェネレータモジュール130が最大のクラスタに人間の顔を有するキーフレームが含まれるかどうかを判定するブロック208で、人間の顔が存在しない場合に、手順200は、ブロック218に継続される。ブロック218で、サムネイルジェネレータモジュール130は、イメージ注目度分析動作によって識別される関心を向けられる領域の関数として候補キーフレームをランク付けする。ブロック220で、サムネイルジェネレータモジュール130が、最高の実質的に関心を向けられる領域のランク付けを有するキーフレームから永久的サムネイル150を生成する。手順200の動作は、上で説明したようにブロック214に継続される。
例示的なオペレーティング環境
図3に、スマートメディアコンテンツサムネイル抽出を提供する図1のアーキテクチャ100および図2の手順200を完全にまたは部分的に実施できる適切なコンピューティング環境300の例を示す。したがって、このコンピューティング環境300の諸態様を、図1および2の例示的なコンポーネントおよび動作に関して説明する。コンポーネントまたは動作(手続きブロック)の左端の桁は、そのコンポーネント/動作が初めて現れた特定の図を識別する。例示的なコンピューティング環境300は、適切なコンピューティング環境の一例にすぎず、本明細書に記載のシステムおよび方法の使用または機能の範囲に関する限定を示唆することを意図したものではない。また、コンピューティング環境300を、コンピューティング環境300に示されたコンポーネントのいずれかまたはその組合せに対する依存性または要件を有するものと解釈してはならない。
本明細書に記載の方法およびシステムは、多数の他の汎用または専用のコンピューティングシステム環境または構成と共に使用できる。使用に適し得る周知のコンピューティングシステム、コンピューティング環境、および/またはコンピューティング構成の例として、パーソナルコンピュータ、サーバコンピュータ、マルチプロセッサシステム、マイクロプロセッサベースのシステム、ネットワークPC、ミニコンピュータ、メインフレームコンピュータ、上記のシステムまたは装置のいずれかを含む分散コンピューティング環境などが挙げられるが、これらに限定はされない。このフレームワークのコンパクト版またはサブセット版を、ハンドヘルドコンピュータまたは他のコンピューティング装置などの制限されたリソースのクライアント装置102で実施することもできる。本発明は、通信ネットワークを介してリンクされたリモート処理装置によってタスクが実行される分散コンピューティング環境でも実施される。分散コンピューティング環境では、プログラムモジュールを、ローカルとリモートの両方のメモリ記憶装置に置くことができる。
図3を参照すると、システム300に、コンピュータ310の形態の汎用コンピューティング装置が含まれる。コンピュータ310のコンポーネントに、処理装置320、システムメモリ330、およびシステムメモリを含む様々なシステムコンポーネントを処理装置320に結合するシステムバス321が含まれるが、これらに限定されない。システムバス321は、内部バスの例示的実施形態であり、メモリバスまたはメモリコントローラ、周辺バス、および様々なバスアーキテクチャのいずれかを使用するローカルバスを含むいくつかのタイプのバス構造のいずれかとすることができる。限定ではなく例として、そのようなアーキテクチャに、インダストリースタンダードアーキテクチャ(ISA)バス、マイクロチャネルアーキテクチャ(MCA)バス、エンハンスドISA(EISA)バス、ビデオエレクトロニクススタンダードアソシエーション(VESA)ローカルバス、およびメザニンバスまたはPCIバスとも称するペリフェラルコンポーネントインターコネクト(PCI)バスを含めることができる。
コンピュータ310に、通常、様々なコンピュータ可読媒体が含まれる。コンピュータ可読媒体は、コンピュータ310によってアクセスでき、揮発性媒体および不揮発性媒体、リムーバブル媒体および非リムーバブル媒体の両方を含む使用可能な媒体のいずれかとすることができる。限定ではなく例として、コンピュータ可読媒体に、コンピュータ記憶媒体および通信媒体を含めることができる。コンピュータ記憶媒体に、コンピュータ可読命令、データ構造、プログラムモジュール、または他のデータなどの情報を記憶する任意の方法または技術で実施された、揮発性および不揮発性、リムーバブルおよび非リムーバブルの媒体が含まれる。コンピュータ記憶媒体に、RAM、ROM、EEPROM、フラッシュメモリ、および他のメモリテクノロジ、CD−ROM、デジタル多用途ディスク(DVD)、または他の光ディスクストレージ、磁気カセット、磁気テープ、磁気ディスクストレージ、または他の磁気記憶装置、あるいは所望の情報の記憶に使用でき、コンピュータ310によってアクセスできる他のすべての媒体が含まれるが、これらに限定されない。
通信媒体は、通常、搬送波または他のトランスポート機構などの変調されたデータ信号中にコンピュータ可読命令、データ構造、プログラムモジュール、または他のデータを具現化するものであり、通信媒体には、すべての情報伝達媒体が含まれる。用語「変調されたデータ信号」は、信号内で情報を符号化する形でその特性の1つまたは複数を設定または変更された信号を意味する。限定ではなく例として、通信媒体には、有線ネットワークまたは直接配線接続などの有線媒体と、音響、RF、赤外線、および他の無線媒体などの無線媒体が含まれる。上記のいずれかの組合せも、コンピュータ可読媒体の範囲に含めるべきである。
システムメモリ330に、読出し専用メモリ(ROM)331およびランダムアクセスメモリ(RAM)332などの揮発性メモリおよび/または不揮発性メモリの形態のコンピュータ記憶媒体が含まれる。起動中などにコンピュータ310内の要素の間での情報の転送を助ける基本ルーチンを含む基本入出力システム333(BIOS)が、通常、ROM 331に記憶される。
RAM 332には、通常は、処理装置320から即座にアクセス可能、かつ/または処理装置320によって現在操作中のデータおよび/またはプログラムモジュールが含まれる。限定ではなく例として、図3に、オペレーティングシステム334、アプリケーションプログラム335、他のプログラムモジュール336、およびプログラムデータ337を示す。一実施例では、アプリケーションプログラム335に、サムネイルジェネレータ(エクストラクタ)モジュール130(図1)が含まれる。プログラムデータ337には、例えば、記録されたメディアコンテンツ140、番組メタデータ156が含まれ、この番組メタデータ156には、例えば、抽出されたショット、サブショット、ショット境界表示(shot−boundary indication)、キーフレーム、キーフレームイメージ品質尺度(例えば、良さ尺度)、ショットクラスタ、外観表現尺度、類似性尺度、キーフレームランキング値、注目度値(例えば、関心を向けられる領域(面積))、中間計算、およびショット持続時間の閾値などの他のデータが含まれる。
コンピュータ310に、他のリムーバブル/非リムーバブル、揮発性/不揮発性のコンピュータ記憶媒体も含めることができる。例としてのみ、図3に、非リムーバブル不揮発性磁気媒体から読み取るかこれに書き込むハードディスクドライブ341、リムーバブル不揮発性磁気ディスク352から読み取るかこれに書き込む磁気ディスクドライブ351、CD−ROMまたは他の光媒体などのリムーバブル不揮発性光ディスク356から読み取るかこれに書き込む光ディスクドライブ355を示す。例示的なオペレーティング環境で使用できる他のリムーバブル/非リムーバブル、揮発性/不揮発性のコンピュータ記憶媒体には、磁気テープカセット、フラッシュメモリカード、デジタル多用途ディスク、デジタルビデオテープ、ソリッドステートRAM、ソリッドステートROMなどが含まれるが、これに限定されない。ハードディスクドライブ341は、通常は、インターフェース340などの非リムーバブルメモリインターフェースを介してシステムバス321に接続され、磁気ディスクドライブ351および光ディスクドライブ355は、通常、インターフェース350などのリムーバブルメモリインターフェースによってシステムバス321に接続される。
上で説明し、図3に示したドライブおよびそれに関連するコンピュータ記憶媒体は、コンピュータ可読命令、データ構造、プログラムモジュール、および他のデータの記憶をコンピュータ310に提供する。図3では、例えば、ハードディスクドライブ341が、オペレーティングシステム344、アプリケーションプログラム345、他のプログラムモジュール346、およびプログラムデータ347を記憶するものとして図示されている。これらのコンポーネントを、オペレーティングシステム334、アプリケーションプログラム335、他のプログラムモジュール336、およびプログラムデータ337と同一のものまたは異なるもののいずれかとすることができることに留意されたい。オペレーティングシステム344、アプリケーションプログラム345、他のプログラムモジュール346、およびプログラムデータ347は、少なくとも異なるコピーであることを示すためにここでは、異なる符号を与えられている。
ユーザは、キーボード362および、一般にマウス、トラックボール、またはタッチパッドと称するポインティングデバイス361などの入力装置を介してコンピュータ310にコマンドおよびユーザオーディオポリシーデータなどの情報を入力することができる。他の入力装置(図示せず)には、マイクロホン(オーディオキャプチャ)オーディオ装置、ジョイスティック、ゲームパッド、衛星パラボラアンテナ、スキャナなどを含めることができる。これらおよび他の入力装置は、しばしば、システムバス321に結合されたユーザ入力インターフェース360を介して処理装置320に接続されるが、パラレルポート、ゲームポート、ユニバーサルシリアルバス(USB)、IEEE 1394 AV/Cバス、PCIバス、および/または類似物などの他のインターフェースおよびバス構造によって接続することもできる。
モニタ391または他のタイプのディスプレイ装置も、ビデオインターフェース390などのインターフェースを介してシステムバス321に接続される。モニタのほかに、コンピュータに、オーディオ装置397およびプリンタ396など、出力周辺装置インターフェース395を介して接続できる他の周辺出力装置も含めることができる。この実施例では、入力周辺装置インターフェース394および出力周辺装置インターフェース395のそれぞれが、オーディオコーデックの動作をカプセル化する。
コンピュータ310は、リモートコンピュータ380などの1つまたは複数のリモートコンピュータへの論理接続を使用して、ネットワーク化された環境で動作することができる。リモートコンピュータ380は、パーソナルコンピュータ、サーバ、ルータ、ネットワークPC、ピアデバイス、または他の一般的なネットワークノードとすることができ、その特定の実装形態に応じて、上でコンピュータ310に関して説明した構成要素の多くまたはすべてを含めることができるが、図3には、メモリ記憶装置381だけを示した。図3に示された論理接続に、ローカルエリアネットワーク(LAN)371および広域ネットワーク(WAN)373が含まれるが、他のネットワークも含めることができる。そのようなネットワーキング環境は、オフィス、会社全体のコンピュータネットワーク、イントラネット、およびインターネットで一般的なものである。
LANネットワーキング環境で使用されるときに、コンピュータ310は、ネットワークインターフェースまたはネットワークアダプタ370を介してLAN 371に接続される。WANネットワーキング環境で使用されるときに、コンピュータ310には、通常、インターネットなどのWAN 373を介する通信を確立するモデム372または他の手段が含まれる。モデム372は、内蔵または外付けとすることができるが、ユーザ入力インターフェース360または他の適当な機構を介してシステムバス321に接続することができる。ネットワーク化された環境では、コンピュータ310に関して示されたプログラムモジュールまたはその一部を、リモートメモリ記憶装置に記憶することができる。限定ではなく例として、図3に、メモリデバイス381に常駐するものとしてリモートアプリケーションプログラム385を示す。図示のネットワーク接続は例示的であり、コンピュータ間の通信リンクを確立する他の手段を使用することもできる。
結論
スマートメディアコンテンツサムネイル抽出(生成)のシステムおよび方法を、構造的特徴および/または方法論的動作もしくは作用に固有の言葉で説明したが、添付の特許請求の範囲で規定される実施例が、必ずしも、説明した特定の特徴または作用に限定されないことを理解されたい。むしろ、特定の特徴および作用は、請求される主題を実施する例示的な形態として開示されたものである。
スマートメディアコンテンツサムネイル抽出のシステムおよび方法を部分的にまたは完全に実施できる例示的なアーキテクチャ100を示す図である。 スマートメディアコンテンツサムネイル抽出の例示的な手順を示す図である。 スマートメディアコンテンツサムネイル抽出を提供する図1のアーキテクチャおよび図2の手順を完全にまたは部分的に実施できる適切なコンピューティング環境の例を示す図である。
符号の説明
102 クライアント装置
106 コンテンツプロバイダ
108 オンデマンドで放送されるメディアコンテンツ
112 メディアコンテンツ入力(例えばチューナ)
114 プロセッサ
116 オーディオ/ビデオ出力
120 記録媒体
122 キャッシュ
130 サムネイルジェネレータ
132 UIアプリケーション
134 EPGアプリケーション
136 DVRおよび再生アプリケーション
140 記録されたメディアコンテンツ(例えばTV番組)
144 EPGデータ
150 サムネイル
156 メタデータ


Claims (23)

  1. 記録されたビデオコンテンツから番組メタデータを生成するステップであって、前記番組メタデータは、1つまたは複数の対応するショットからの1つまたは複数のキーフレームを含むステップと、
    ショット持続時間および複数のショットにまたがるキーフレームコンテンツの出現の頻度の関数として前記キーフレームから客観的に代表的なキーフレームを識別するステップであって、前記客観的に代表的なキーフレームは、前記記録されたビデオコンテンツを代表するイメージフレームであるステップと、
    前記客観的に代表的なキーフレームからサムネイルを作成するステップと、
    を備え、
    前記識別するステップが、
    外観表現に基づいて前記ショットをクラスタ化して、1つまたは複数のクラスタを生成するステップと、
    生成された前記クラスタのうちで、より大きいクラスタが人間の顔を含むかどうかにしたがって、前記客観的に代表的なキーフレームを選択するステップと
    を含むことを特徴とする方法。
  2. 前記記録されたビデオコンテンツは、記録されたテレビ番組であることを特徴とする、請求項1に記載の方法。
  3. 前記生成するステップは、さらに、
    前記記録されたビデオコンテンツを複数のショットに分解するステップと、
    前記複数のショットのそれぞれからサブショットの組を導出するステップと、
    前記サブショットの組ごとに、前記キーフレームのそれぞれのキーフレームを識別するステップと
    を含むことを特徴とする、請求項1に記載の方法。
  4. 前記識別するステップは、さらに、低いモーション強度のさらなる関数として前記客観的に代表的なキーフレームを選択するステップを含むことを特徴とする、請求項1に記載の方法。
  5. 前記識別するステップは、さらに、
    前記ショットのうちのショットごとに、
    (a)前記ショットは前記ショットの他のものと比較して短い持続時間または長い持続時間のどちらであるかを判定し、(b)前記ショットのキーフレームは客観的に高いイメージ品質であるかどうかを評価し、(c)前記ショットはコマーシャルコンテンツを表すかどうかを検出するステップ
    を含み、前記判定、評価および検出に鑑みて、短い持続時間のショット、客観的に低いイメージ品質のショット、またはコマーシャルコンテンツを含むショットを前記番組メタデータから除去することを特徴とする、請求項1に記載の方法。
  6. 前記識別するステップは、さらに、生成された前記クラスタのうちで、より大きいクラスタに関連するキーフレームが人間の顔を含む場合に、前記客観的に代表的なキーフレームとして最大の顔領域を有するキーフレームを選択するステップを含むことを特徴とする、請求項1に記載の方法。
  7. 前記識別するステップは、さらに、
    生成された前記クラスタのうちで最大のクラスタに関連するキーフレームが人間の顔を含まない場合に、前記客観的に代表的なキーフレームとして、客観的に判定された高い注目度ランキングの関心を向けられる領域を有するキーフレームを選択するステップ
    を備えることを特徴とする、請求項1に記載の方法。
  8. 前記記録されたビデオコンテンツの代表的識別子として前記サムネイルを提示するステップをさらに含むことを特徴とする、請求項1に記載の方法。
  9. 請求項1〜8のうちのいずれか1つに記載の方法をコンピュータに実行させるためのコンピュータ実行可能命令を記録したコンピュータ可読記録媒体。
  10. プロセッサと、前記プロセッサに結合されたメモリとを備えたコンピューティング装置であって、
    前記メモリは、プロセッサによって実行可能な
    記録されたビデオコンテンツから番組メタデータを生成するコンピュータプログラム命令であって、前記番組メタデータは、1つまたは複数の対応するショットからの1つまたは複数のキーフレームを含む、コンピュータプログラム命令と、
    ショット持続時間および複数のショットにまたがるキーフレームコンテンツの出現の頻度の関数として前記キーフレームから客観的に代表的なキーフレームを識別するコンピュータプログラム命令であって、前記客観的に代表的なキーフレームは、前記記録されたビデオコンテンツを代表するイメージフレームである、コンピュータプログラム命令と、
    前記客観的に代表的なキーフレームからサムネイルを作成するコンピュータプログラム命令と
    を備え、
    前記識別するコンピュータプログラム命令が、さらに、
    外観表現に基づいて前記ショットをクラスタ化して、1つまたは複数のクラスタを生成する命令と、
    生成された前記クラスタのうちで、より大きいクラスタが人間の顔を含むかどうかにしたがって、前記客観的に代表的なキーフレームを選択する命令と
    を含むことを特徴とするコンピューティング装置
  11. 前記記録されたビデオコンテンツは、記録されたテレビ番組であることを特徴とする、請求項10に記載のコンピューティング装置
  12. 生成する前記コンピュータプログラム命令は、さらに、
    前記記録されたビデオコンテンツを複数のショットに分解する命令と、
    前記複数のショットのそれぞれからサブショットの組を導出する命令と、
    サブショットの組ごとに、前記キーフレームのそれぞれのキーフレームを識別する命令と
    を含むことを特徴とする、請求項10に記載のコンピューティング装置
  13. 識別する前記コンピュータプログラム命令は、さらに、低いモーション強度のさらなる関数として前記客観的に代表的なキーフレームを選択する命令を含むことを特徴とする、請求項10に記載のコンピューティング装置
  14. 識別する前記コンピュータプログラム命令は、さらに、
    前記ショットのうちのショットごとに、
    (a)前記ショットは前記ショットの他のものと比較して短い持続時間または長い持続時間のどちらであるかを判定する命令と、
    (b)前記ショットのキーフレームは客観的に高いイメージ品質であるかどうかを評価する命令と、
    (c)前記ショットはコマーシャルコンテンツを表すかどうかを検出する命令と、
    を含み、前記判定、評価、および検出に鑑みて、短い持続時間のショット、客観的に低いイメージ品質のショット、またはコマーシャルコンテンツを含むショットを前記番組メタデータから除去することを特徴とする、請求項10に記載のコンピューティング装置
  15. 識別する前記コンピュータプログラム命令は、さらに、
    生成された前記クラスタのうちで最大のクラスタに関連するキーフレームが人間の顔を含む場合に、前記客観的に代表的なキーフレームとして最大の顔領域を有するキーフレームを選択する命令
    を含むことを特徴とする、請求項10に記載のコンピューティング装置
  16. 識別する前記コンピュータプログラム命令は、さらに、
    生成された前記クラスタのうちで最大のクラスタに関連するキーフレームが人間の顔を含まない場合に、前記客観的に代表的なキーフレームとして、客観的に判定された高い注目度ランキングの関心を向けられる領域を有するキーフレームを選択する命令
    を含むことを特徴とする、請求項10に記載のコンピューティング装置
  17. 前記コンピュータプログラム命令は、さらに、前記記録されたビデオコンテンツの代表的識別子として前記サムネイルを提示する命令を備えることを特徴とする、請求項10に記載のコンピューティング装置。
  18. 記録されたビデオコンテンツから番組メタデータを生成する生成手段であって、前記番組メタデータは、1つまたは複数の対応するショットからの1つまたは複数のキーフレームを含む、生成手段と、
    ショット持続時間および複数のショットにまたがるキーフレームコンテンツの出現の頻度の関数として前記キーフレームから客観的に代表的なキーフレームを識別する識別手段であって、前記客観的に代表的なキーフレームは、前記記録されたビデオコンテンツを代表するイメージフレームである、識別手段と
    前記客観的に代表的なキーフレームからサムネイルを生成する、生成手段と、
    を備え、前記識別手段が、さらに、
    外観表現に基づいて前記ショットをクラスタ化して、1つまたは複数のクラスタを生成する、クラスタ化手段と、
    生成された前記クラスタのうちで、より大きいクラスタが人間の顔を含むかどうかにしたがって、前記客観的に代表的なキーフレームを選択する、選択手段と
    を含むことを特徴とするコンピューティング装置。
  19. 前記生成手段は、さらに、
    前記記録されたビデオコンテンツを複数のショットに分解する分解手段と、
    前記複数のショットのそれぞれからサブショットの組を導出する導出手段と、
    サブショットの組ごとに、前記キーフレームのそれぞれのキーフレームを識別する識別手段と
    を含むことを特徴とする、請求項18に記載のコンピューティング装置。
  20. 前記識別手段は、さらに、
    前記ショットのショットごとに、
    (a)前記ショットは前記ショットの他のものと比較して短い持続時間または長い持続時間のどちらであるかを判定する判定手段と、
    (b)前記ショットのキーフレームは客観的に高いイメージ品質であるかどうかを評価する評価手段と、
    (c)前記ショットはコマーシャルコンテンツを表すかどうかを検出する検出手段と
    を備え、前記判定手段、評価手段、および検出手段に鑑みて、短い持続時間のショット、客観的に低いイメージ品質のショット、またはコマーシャルコンテンツを含むショットを前記番組メタデータから除去することを特徴とする、請求項18に記載のコンピューティング装置。
  21. 前記識別手段は、さらに、
    生成された前記クラスタのうちで最大のクラスタに関連するキーフレームが人間の顔を含む場合に、前記客観的に代表的なキーフレームとして最大の顔領域を有するキーフレームを選択する選択手段
    を含むことを特徴とする、請求項18に記載のコンピューティング装置。
  22. 前記識別手段は、さらに、
    生成された前記クラスタのうちで最大のクラスタに関連するキーフレームが人間の顔を含まない場合に、前記客観的に代表的なキーフレームとして、客観的に判定された高い注目度ランキングの関心を向けられる領域を有するキーフレームを選択する選択手段
    を含むことを特徴とする、請求項18に記載のコンピューティング装置。
  23. 前記記録されたビデオコンテンツの代表的識別子として前記サムネイルを提示する提示手段をさらに備えることを特徴とする、請求項18に記載のコンピューティング装置。
JP2005224585A 2004-08-02 2005-08-02 スマートメディアコンテンツサムネイル抽出のシステムおよび方法 Expired - Fee Related JP5038607B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US10/910,803 2004-08-02
US10/910,803 US7986372B2 (en) 2004-08-02 2004-08-02 Systems and methods for smart media content thumbnail extraction

Publications (2)

Publication Number Publication Date
JP2006054872A JP2006054872A (ja) 2006-02-23
JP5038607B2 true JP5038607B2 (ja) 2012-10-03

Family

ID=35311835

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005224585A Expired - Fee Related JP5038607B2 (ja) 2004-08-02 2005-08-02 スマートメディアコンテンツサムネイル抽出のシステムおよび方法

Country Status (3)

Country Link
US (1) US7986372B2 (ja)
EP (1) EP1624391A3 (ja)
JP (1) JP5038607B2 (ja)

Families Citing this family (81)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006295350A (ja) * 2005-04-07 2006-10-26 Sony Corp 撮像装置及び撮像結果の処理方法
KR100735327B1 (ko) * 2005-11-11 2007-07-04 삼성전자주식회사 디지털 방송 수신 단말기의 배경 화면 디스플레이 방법
JP4730775B2 (ja) * 2005-12-14 2011-07-20 株式会社リコー 画像処理装置
JP2007189473A (ja) * 2006-01-13 2007-07-26 Hitachi Ltd 動画再生装置
US8639028B2 (en) * 2006-03-30 2014-01-28 Adobe Systems Incorporated Automatic stacking based on time proximity and visual similarity
US20070237225A1 (en) * 2006-03-30 2007-10-11 Eastman Kodak Company Method for enabling preview of video files
KR100706404B1 (ko) * 2006-05-12 2007-04-10 주식회사 팬택 이동 통신 단말기에서 동영상 파일 관리 방법
US20070266322A1 (en) * 2006-05-12 2007-11-15 Tretter Daniel R Video browsing user interface
US7826712B2 (en) * 2006-08-29 2010-11-02 Echostar Technologies Corporation Method and apparatus for receiving, storing, and presenting multimedia programming without indexing prior to storage
US20080066107A1 (en) 2006-09-12 2008-03-13 Google Inc. Using Viewing Signals in Targeted Video Advertising
US7711193B2 (en) * 2006-11-07 2010-05-04 Aol Inc. Recognizing blank and nearly blank images
US8671346B2 (en) * 2007-02-09 2014-03-11 Microsoft Corporation Smart video thumbnail
US8667532B2 (en) 2007-04-18 2014-03-04 Google Inc. Content recognition for targeting video advertisements
US20080306999A1 (en) * 2007-06-08 2008-12-11 Finger Brienne M Systems and processes for presenting informational content
KR101396341B1 (ko) * 2007-06-22 2014-05-26 삼성전자주식회사 동영상 촬영 모드가 수행되는 디지털 영상 처리 장치의제어 방법, 및 이 방법을 채용한 디지털 영상 처리 장치
US8433611B2 (en) * 2007-06-27 2013-04-30 Google Inc. Selection of advertisements for placement with content
US8503523B2 (en) * 2007-06-29 2013-08-06 Microsoft Corporation Forming a representation of a video item and use thereof
US9064024B2 (en) 2007-08-21 2015-06-23 Google Inc. Bundle generation
EP2034487B1 (en) * 2007-09-04 2018-04-25 Samsung Electronics Co., Ltd. Method and system for generating thumbnails for video files
KR20090050577A (ko) * 2007-11-16 2009-05-20 삼성전자주식회사 멀티미디어 컨텐츠를 표시 및 재생하는 사용자인터페이스및 그 장치와 제어방법
US20090158157A1 (en) * 2007-12-14 2009-06-18 Microsoft Corporation Previewing recorded programs using thumbnails
US9824372B1 (en) 2008-02-11 2017-11-21 Google Llc Associating advertisements with videos
JP5271015B2 (ja) * 2008-09-17 2013-08-21 キヤノン株式会社 画像処理装置、画像処理方法及びプログラム
US8969029B2 (en) * 2008-10-17 2015-03-03 3M Innovative Properties Company Biological sterilization indicator, system, and methods of using same
DE102008037497A1 (de) 2008-10-30 2010-05-06 Continental Reifen Deutschland Gmbh Fahrzeugluftreifen
US8495074B2 (en) * 2008-12-30 2013-07-23 Apple Inc. Effects application based on object clustering
US9152300B2 (en) 2008-12-31 2015-10-06 Tivo Inc. Methods and techniques for adaptive search
US10158823B2 (en) * 2008-12-31 2018-12-18 Tivo Solutions Inc. Methods and techniques for adaptive search
US8386935B2 (en) * 2009-05-06 2013-02-26 Yahoo! Inc. Content summary and segment creation
US8249365B1 (en) 2009-09-04 2012-08-21 Adobe Systems Incorporated Methods and apparatus for directional texture generation using sample-based texture synthesis
US8619098B2 (en) * 2009-09-18 2013-12-31 Adobe Systems Incorporated Methods and apparatuses for generating co-salient thumbnails for digital images
US8599219B2 (en) 2009-09-18 2013-12-03 Adobe Systems Incorporated Methods and apparatuses for generating thumbnail summaries for image collections
US9152708B1 (en) 2009-12-14 2015-10-06 Google Inc. Target-video specific co-watched video clusters
US20110191679A1 (en) * 2010-02-02 2011-08-04 Futurewei Technologies, Inc. System and Method for Online Media Preview
US10116902B2 (en) * 2010-02-26 2018-10-30 Comcast Cable Communications, Llc Program segmentation of linear transmission
US9171578B2 (en) 2010-08-06 2015-10-27 Futurewei Technologies, Inc. Video skimming methods and systems
US8621351B2 (en) * 2010-08-31 2013-12-31 Blackberry Limited Methods and electronic devices for selecting and displaying thumbnails
EP2619983A4 (en) * 2010-09-20 2015-05-06 Nokia Corp IDENTIFYING A KEY IMAGE FRAME FROM A VIDEO SEQUENCE
SG185147A1 (en) 2011-04-08 2012-11-29 Creative Tech Ltd A method, system and electronic device for at least one of efficient graphic processing and salient based learning
JP2012256105A (ja) * 2011-06-07 2012-12-27 Sony Corp 表示装置、オブジェクト表示方法、及びプログラム
US9204175B2 (en) * 2011-08-03 2015-12-01 Microsoft Technology Licensing, Llc Providing partial file stream for generating thumbnail
US8861868B2 (en) 2011-08-29 2014-10-14 Adobe-Systems Incorporated Patch-based synthesis techniques
EP2734931A4 (en) * 2011-09-27 2015-04-01 Hewlett Packard Development Co POLLING VISUAL MEDIA
US11314405B2 (en) * 2011-10-14 2022-04-26 Autodesk, Inc. Real-time scrubbing of online videos
US20140157096A1 (en) * 2012-12-05 2014-06-05 International Business Machines Corporation Selecting video thumbnail based on surrounding context
US8983150B2 (en) 2012-12-17 2015-03-17 Adobe Systems Incorporated Photo importance determination
US8897556B2 (en) 2012-12-17 2014-11-25 Adobe Systems Incorporated Photo chapters organization
KR101468917B1 (ko) * 2013-01-24 2014-12-04 서울대학교병원 (분사무소) 전자의무기록 시스템 기반 데이터 표시 방법 및 장치
EP2782055A1 (en) * 2013-03-18 2014-09-24 Optimal Medicine Ltd Personalised medicine system displaying a timeline of clinical patient information
CN108831511B (zh) 2013-07-30 2020-10-23 杜比实验室特许公司 用于使用场景稳定元数据的系统、方法、设备和存储介质
US9154761B2 (en) 2013-08-19 2015-10-06 Google Inc. Content-based video segmentation
EP2890108A1 (en) * 2013-12-27 2015-07-01 Thomson Licensing Method for sorting a group of images of a database and method for color correcting an image, corresponding devices, computer program and non-transitory computer-readable medium
KR20160011532A (ko) * 2014-07-22 2016-02-01 삼성전자주식회사 동영상 표시 방법 및 장치
CN105335045A (zh) * 2014-08-12 2016-02-17 富泰华工业(深圳)有限公司 变更桌面图标的方法及系统
US10291597B2 (en) 2014-08-14 2019-05-14 Cisco Technology, Inc. Sharing resources across multiple devices in online meetings
US10034038B2 (en) 2014-09-10 2018-07-24 Cisco Technology, Inc. Video channel selection
CN104244024B (zh) * 2014-09-26 2018-05-08 北京金山安全软件有限公司 一种视频封面生成方法、装置及终端
US10542126B2 (en) 2014-12-22 2020-01-21 Cisco Technology, Inc. Offline virtual participation in an online conference meeting
US10521472B2 (en) * 2015-02-27 2019-12-31 Realnetworks, Inc. Composing media stories method and system
US9948786B2 (en) 2015-04-17 2018-04-17 Cisco Technology, Inc. Handling conferences using highly-distributed agents
US9998772B2 (en) * 2015-07-28 2018-06-12 Google Llc Methods, systems, and media for presenting media content items belonging to a media content group
CN105704570B (zh) * 2016-03-08 2019-05-07 上海小蚁科技有限公司 用于产生视频的一个或多个预览帧的方法和装置
US10592867B2 (en) 2016-11-11 2020-03-17 Cisco Technology, Inc. In-meeting graphical user interface display using calendar information and system
US10516707B2 (en) 2016-12-15 2019-12-24 Cisco Technology, Inc. Initiating a conferencing meeting using a conference room device
US10068616B2 (en) 2017-01-11 2018-09-04 Disney Enterprises, Inc. Thumbnail generation for video
US10440073B2 (en) 2017-04-11 2019-10-08 Cisco Technology, Inc. User interface for proximity based teleconference transfer
US10375125B2 (en) 2017-04-27 2019-08-06 Cisco Technology, Inc. Automatically joining devices to a video conference
US10375474B2 (en) 2017-06-12 2019-08-06 Cisco Technology, Inc. Hybrid horn microphone
US10477148B2 (en) 2017-06-23 2019-11-12 Cisco Technology, Inc. Speaker anticipation
US10516709B2 (en) 2017-06-29 2019-12-24 Cisco Technology, Inc. Files automatically shared at conference initiation
CN107197321A (zh) * 2017-06-30 2017-09-22 武汉斗鱼网络科技有限公司 直播内容录制方法、装置及服务器
US10706391B2 (en) 2017-07-13 2020-07-07 Cisco Technology, Inc. Protecting scheduled meeting in physical room
US10091348B1 (en) 2017-07-25 2018-10-02 Cisco Technology, Inc. Predictive model for voice/video over IP calls
US10769207B2 (en) 2017-08-17 2020-09-08 Opentv, Inc. Multimedia focalization
CN111753642B (zh) * 2020-05-09 2024-02-20 三生万物(北京)人工智能技术有限公司 一种确定关键帧的方法及装置
US11461535B2 (en) 2020-05-27 2022-10-04 Bank Of America Corporation Video buffering for interactive videos using a markup language
US11237708B2 (en) 2020-05-27 2022-02-01 Bank Of America Corporation Video previews for interactive videos using a markup language
CN112383830A (zh) * 2020-11-06 2021-02-19 北京小米移动软件有限公司 视频封面确定方法及装置、存储介质
CN112822394B (zh) * 2020-12-30 2024-03-26 维沃移动通信(杭州)有限公司 显示控制方法、装置、电子设备及可读存储介质
CN115914775A (zh) * 2022-11-21 2023-04-04 北京奇艺世纪科技有限公司 一种封面确定方法、装置、电子设备及存储介质
CN116386119A (zh) * 2023-05-09 2023-07-04 北京维艾狄尔信息科技有限公司 基于健身步道的身份识别方法、系统、终端及存储介质

Family Cites Families (146)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5442633A (en) * 1992-07-08 1995-08-15 International Business Machines Corporation Shortcut network layer routing for mobile hosts
KR100215586B1 (ko) 1992-11-09 1999-08-16 모리시타 요이찌 다이제스트 화상 자동생성 장치 및 다이제스트 화상 자동생성 방법
US5333091B2 (en) * 1993-01-08 1996-12-17 Arthur D Little Enterprises Method and apparatus for controlling a videotape player to automatically scan past recorded commercial messages
US20020100052A1 (en) * 1999-01-06 2002-07-25 Daniels John J. Methods for enabling near video-on-demand and video-on-request services using digital video recorders
US5530963A (en) * 1993-12-16 1996-06-25 International Business Machines Corporation Method and system for maintaining routing between mobile workstations and selected network workstation using routing table within each router device in the network
JP2765674B2 (ja) * 1993-12-16 1998-06-18 インターナショナル・ビジネス・マシーンズ・コーポレイション データ供給装置
US5642294A (en) * 1993-12-17 1997-06-24 Nippon Telegraph And Telephone Corporation Method and apparatus for video cut detection
US5710560A (en) 1994-04-25 1998-01-20 The Regents Of The University Of California Method and apparatus for enhancing visual perception of display lights, warning lights and the like, and of stimuli used in testing for ocular disease
US6661468B2 (en) 1994-05-20 2003-12-09 United Video Properties, Inc. Electronic television program guide schedule system and method
DE69428293T2 (de) * 1994-07-21 2002-06-27 Toshiba Kawasaki Kk Gerät zur bildidentifizierung
US5497430A (en) * 1994-11-07 1996-03-05 Physical Optics Corporation Method and apparatus for image recognition using invariant feature signals
US5659685A (en) * 1994-12-13 1997-08-19 Microsoft Corporation Method and apparatus for maintaining network communications on a computer capable of connecting to a WAN and LAN
US5821945A (en) * 1995-02-03 1998-10-13 The Trustees Of Princeton University Method and apparatus for video browsing based on content and structure
US5625877A (en) * 1995-03-15 1997-04-29 International Business Machines Corporation Wireless variable bandwidth air-link system
US5774593A (en) * 1995-07-24 1998-06-30 University Of Washington Automatic scene decomposition and optimization of MPEG compressed video
JP3461980B2 (ja) * 1995-08-25 2003-10-27 株式会社東芝 高速描画方法および装置
JPH09130732A (ja) * 1995-11-01 1997-05-16 Matsushita Electric Ind Co Ltd シーンチェンジ検出方法および動画像編集装置
US5835163A (en) * 1995-12-21 1998-11-10 Siemens Corporate Research, Inc. Apparatus for detecting a cut in a video
US5884056A (en) * 1995-12-28 1999-03-16 International Business Machines Corporation Method and system for video browsing on the world wide web
US5778137A (en) * 1995-12-28 1998-07-07 Sun Microsystems, Inc. Videostream management system
US5911008A (en) * 1996-04-30 1999-06-08 Nippon Telegraph And Telephone Corporation Scheme for detecting shot boundaries in compressed video data using inter-frame/inter-field prediction coding and intra-frame/intra-field coding
US5920360A (en) * 1996-06-07 1999-07-06 Electronic Data Systems Corporation Method and system for detecting fade transitions in a video signal
US5959697A (en) * 1996-06-07 1999-09-28 Electronic Data Systems Corporation Method and system for detecting dissolve transitions in a video signal
US6292589B1 (en) * 1996-06-21 2001-09-18 Compaq Computer Corporation Method for choosing rate control parameters in motion-compensated transform-based picture coding scheme using non-parametric technique
TW303555B (en) * 1996-08-08 1997-04-21 Ind Tech Res Inst Digital data detecting method
US5751378A (en) * 1996-09-27 1998-05-12 General Instrument Corporation Scene change detector for digital video
US7055166B1 (en) * 1996-10-03 2006-05-30 Gotuit Media Corp. Apparatus and methods for broadcast monitoring
US6956573B1 (en) * 1996-11-15 2005-10-18 Sarnoff Corporation Method and apparatus for efficiently representing storing and accessing video information
US5966126A (en) * 1996-12-23 1999-10-12 Szabo; Andrew J. Graphic user interface for database system
US5901245A (en) * 1997-01-23 1999-05-04 Eastman Kodak Company Method and system for detection and characterization of open space in digital images
US6075926A (en) * 1997-04-21 2000-06-13 Hewlett-Packard Company Computerized method for improving data resolution
FR2762405B1 (fr) 1997-04-21 1999-06-25 Rochaix Neyron Ets Monture de lunette
US6137544A (en) * 1997-06-02 2000-10-24 Philips Electronics North America Corporation Significant scene detection and frame filtering for a visual indexing system
US6020901A (en) * 1997-06-30 2000-02-01 Sun Microsystems, Inc. Fast frame buffer system architecture for video display system
US6232974B1 (en) * 1997-07-30 2001-05-15 Microsoft Corporation Decision-theoretic regulation for allocating computational resources among components of multimedia content to improve fidelity
US5983273A (en) * 1997-09-16 1999-11-09 Webtv Networks, Inc. Method and apparatus for providing physical security for a user account and providing access to the user's environment and preferences
US6353824B1 (en) * 1997-11-18 2002-03-05 Apple Computer, Inc. Method for dynamic presentation of the contents topically rich capsule overviews corresponding to the plurality of documents, resolving co-referentiality in document segments
US6166735A (en) 1997-12-03 2000-12-26 International Business Machines Corporation Video story board user interface for selective downloading and displaying of desired portions of remote-stored video data objects
US5956026A (en) * 1997-12-19 1999-09-21 Sharp Laboratories Of America, Inc. Method for hierarchical summarization and browsing of digital video
US5990980A (en) * 1997-12-23 1999-11-23 Sarnoff Corporation Detection of transitions in video sequences
US6182133B1 (en) 1998-02-06 2001-01-30 Microsoft Corporation Method and apparatus for display of information prefetching and cache status having variable visual indication based on a period of time since prefetching
US6421675B1 (en) 1998-03-16 2002-07-16 S. L. I. Systems, Inc. Search engine
AUPP340798A0 (en) * 1998-05-07 1998-05-28 Canon Kabushiki Kaisha Automated video interpretation system
US6631403B1 (en) * 1998-05-11 2003-10-07 At&T Corp. Architecture and application programming interfaces for Java-enabled MPEG-4 (MPEG-J) systems
US6072496A (en) 1998-06-08 2000-06-06 Microsoft Corporation Method and system for capturing and representing 3D geometry, color and shading of facial expressions and other animated objects
US6307550B1 (en) * 1998-06-11 2001-10-23 Presenter.Com, Inc. Extracting photographic images from video
US6100941A (en) * 1998-07-28 2000-08-08 U.S. Philips Corporation Apparatus and method for locating a commercial disposed within a video data stream
US6714909B1 (en) * 1998-08-13 2004-03-30 At&T Corp. System and method for automated multimedia content indexing and retrieval
US6721454B1 (en) * 1998-10-09 2004-04-13 Sharp Laboratories Of America, Inc. Method for automatic extraction of semantically significant events from video
US6389168B2 (en) * 1998-10-13 2002-05-14 Hewlett Packard Co Object-based parsing and indexing of compressed video streams
JP4382288B2 (ja) 1998-11-06 2009-12-09 ザ トゥルスティーズ オブ コロンビア ユニバーシティ イン ザ シティ オブニュー ヨーク 画像記述システムおよび方法
US6408128B1 (en) * 1998-11-12 2002-06-18 Max Abecassis Replaying with supplementary information a segment of a video
US20020073218A1 (en) * 1998-12-23 2002-06-13 Bill J. Aspromonte Stream device management system for multimedia clients in a broadcast network architecture
US6473778B1 (en) * 1998-12-24 2002-10-29 At&T Corporation Generating hypermedia documents from transcriptions of television programs using parallel text alignment
US6282317B1 (en) * 1998-12-31 2001-08-28 Eastman Kodak Company Method for automatic determination of main subjects in photographic images
US6622134B1 (en) * 1999-01-05 2003-09-16 International Business Machines Corporation Method of constructing data classifiers and classifiers constructed according to the method
US6658059B1 (en) 1999-01-15 2003-12-02 Digital Video Express, L.P. Motion field modeling and estimation using motion transform
US6298145B1 (en) * 1999-01-19 2001-10-02 Hewlett-Packard Company Extracting image frames suitable for printing and visual presentation from the compressed image data
EP1066595B1 (en) 1999-01-29 2010-09-08 LG Electronics, Inc. Method of searching or browsing multimedia data and data structure
US6236395B1 (en) * 1999-02-01 2001-05-22 Sharp Laboratories Of America, Inc. Audiovisual information management system
SG92628A1 (en) * 1999-02-13 2002-11-19 Newstakes Inc A method and apparatus for converting video to multiple mark-up-language presentations
US6462754B1 (en) * 1999-02-22 2002-10-08 Siemens Corporate Research, Inc. Method and apparatus for authoring and linking video documents
US6404925B1 (en) 1999-03-11 2002-06-11 Fuji Xerox Co., Ltd. Methods and apparatuses for segmenting an audio-visual recording using image similarity searching and audio speaker recognition
US6449251B1 (en) * 1999-04-02 2002-09-10 Nortel Networks Limited Packet mapper for dynamic data packet prioritization
US6581096B1 (en) * 1999-06-24 2003-06-17 Microsoft Corporation Scalable computing system for managing dynamic communities in multiple tier computing system
US6332163B1 (en) 1999-09-01 2001-12-18 Accenture, Llp Method for providing communication services over a computer network system
GB2356080A (en) 1999-11-05 2001-05-09 Sony Uk Ltd Generation system for audio, video or a combination thereof where metadata is generated and stored or recorded with the audio/video signal
GB9926321D0 (en) 1999-11-05 2000-01-12 Sony Uk Ltd Recording and accessing metadata
JP2001167110A (ja) * 1999-12-08 2001-06-22 Matsushita Electric Ind Co Ltd 画像検索方法及びその装置
KR100694028B1 (ko) * 2000-01-25 2007-03-12 삼성전자주식회사 멀티미디어 파일 작성용 저작장치 및 방법
JP4732660B2 (ja) * 2000-02-17 2011-07-27 ブリティッシュ・テレコミュニケーションズ・パブリック・リミテッド・カンパニー ビジュアルアテンションシステム
US6792144B1 (en) * 2000-03-03 2004-09-14 Koninklijke Philips Electronics N.V. System and method for locating an object in an image using models
AU2001245801A1 (en) 2000-03-16 2001-09-24 Poly Vista, Inc. A system and method for analyzing a query and generating results and related questions
US7072984B1 (en) * 2000-04-26 2006-07-04 Novarra, Inc. System and method for accessing customized information over the internet using a browser for a plurality of electronic devices
JP4253139B2 (ja) 2000-06-30 2009-04-08 株式会社東芝 フレーム情報記述方法、フレーム情報生成装置及び方法、映像再生装置及び方法並びに記録媒体
EP1168840A3 (en) 2000-06-30 2003-12-17 Kabushiki Kaisha Toshiba Method and apparatus for special video reproduction modes
US20040125877A1 (en) * 2000-07-17 2004-07-01 Shin-Fu Chang Method and system for indexing and content-based adaptive streaming of digital video content
US6807361B1 (en) * 2000-07-18 2004-10-19 Fuji Xerox Co., Ltd. Interactive custom video creation system
JP4326679B2 (ja) * 2000-07-19 2009-09-09 リンテック株式会社 ハードコートフィルム
WO2002008948A2 (en) * 2000-07-24 2002-01-31 Vivcom, Inc. System and method for indexing, searching, identifying, and editing portions of electronic multimedia files
KR20020009089A (ko) 2000-07-24 2002-02-01 구본광 인터넷을 이용한 사진 편집 서비스 방법
US20040128317A1 (en) * 2000-07-24 2004-07-01 Sanghoon Sull Methods and apparatuses for viewing, browsing, navigating and bookmarking videos and displaying images
US20020157116A1 (en) 2000-07-28 2002-10-24 Koninklijke Philips Electronics N.V. Context and content based information processing for multimedia segmentation and indexing
US6711587B1 (en) * 2000-09-05 2004-03-23 Hewlett-Packard Development Company, L.P. Keyframe selection to represent a video
DE60129390T2 (de) 2000-09-27 2008-04-10 Victor Company of Japan, Ltd., Yokohama Informationsaufzeichnungs- und -wiedergabevorrichtung
US7325199B1 (en) * 2000-10-04 2008-01-29 Apple Inc. Integrated time line for editing
US7069310B1 (en) * 2000-11-10 2006-06-27 Trio Systems, Llc System and method for creating and posting media lists for purposes of subsequent playback
US7062705B1 (en) * 2000-11-20 2006-06-13 Cisco Technology, Inc. Techniques for forming electronic documents comprising multiple information types
US7174512B2 (en) * 2000-12-01 2007-02-06 Thomson Licensing S.A. Portal for a communications system
GB0029880D0 (en) 2000-12-07 2001-01-24 Sony Uk Ltd Video and audio information processing
US6670963B2 (en) 2001-01-17 2003-12-30 Tektronix, Inc. Visual attention model
JP4536940B2 (ja) * 2001-01-26 2010-09-01 キヤノン株式会社 画像処理装置、画像処理方法、記憶媒体、及びコンピュータプログラム
US6898323B2 (en) 2001-02-15 2005-05-24 Ricoh Company, Ltd. Memory usage scheme for performing wavelet processing
US20020116533A1 (en) * 2001-02-20 2002-08-22 Holliman Matthew J. System for providing a multimedia peer-to-peer computing platform
US20020166123A1 (en) 2001-03-02 2002-11-07 Microsoft Corporation Enhanced television services for digital video recording and playback
US6892193B2 (en) * 2001-05-10 2005-05-10 International Business Machines Corporation Method and apparatus for inducing classifiers for multimedia based on unified representation of features reflecting disparate modalities
US6643665B2 (en) 2001-05-10 2003-11-04 Hewlett-Packard Development Company, Lp. System for setting image intent using markup language structures
CN100380441C (zh) * 2001-05-11 2008-04-09 皇家菲利浦电子有限公司 检测给定类型节目的方法和设备、无声检测器和接收器
US6870956B2 (en) 2001-06-14 2005-03-22 Microsoft Corporation Method and apparatus for shot detection
GB0116877D0 (en) * 2001-07-10 2001-09-05 Hewlett Packard Co Intelligent feature selection and pan zoom control
FR2833131B1 (fr) * 2001-11-30 2004-02-13 Eastman Kodak Co Procede et systeme pour obtimiser l'affichage d'un sujet d'interet dans une image numerique
JP2003189205A (ja) * 2001-12-14 2003-07-04 Pioneer Electronic Corp 番組表表示装置及び番組表の表示方法
KR100411437B1 (ko) * 2001-12-28 2003-12-18 엘지전자 주식회사 지능형 뉴스 비디오 브라우징 시스템
US7095907B1 (en) * 2002-01-10 2006-08-22 Ricoh Co., Ltd. Content and display device dependent creation of smaller representation of images
JP2003216653A (ja) * 2002-01-23 2003-07-31 Fuji Photo Film Co Ltd プログラム、画像管理装置、及び画像管理方法
US7333712B2 (en) * 2002-02-14 2008-02-19 Koninklijke Philips Electronics N.V. Visual summary for scanning forwards and backwards in video content
JP4150951B2 (ja) 2002-02-19 2008-09-17 ソニー株式会社 動画配信システム、動画配信装置および方法、並びにプログラム
US20040071083A1 (en) * 2002-02-22 2004-04-15 Koninklijke Philips Electronics N.V. Method for streaming fine granular scalability coded video over an IP network
US7035435B2 (en) 2002-05-07 2006-04-25 Hewlett-Packard Development Company, L.P. Scalable video summarization and navigation system and method
US7065707B2 (en) * 2002-06-24 2006-06-20 Microsoft Corporation Segmenting and indexing web pages using function-based object models
US7698276B2 (en) * 2002-06-26 2010-04-13 Microsoft Corporation Framework for providing a subscription based notification system
US20040001106A1 (en) * 2002-06-26 2004-01-01 John Deutscher System and process for creating an interactive presentation employing multi-media components
FR2842057B1 (fr) * 2002-07-05 2005-10-28 Canon Kk Procede et dispositif de traitement de donnees dans un reseau de communication
US20040040041A1 (en) 2002-08-22 2004-02-26 Microsoft Corporation Interactive applications for stored video playback
US7054888B2 (en) 2002-10-16 2006-05-30 Microsoft Corporation Optimizing media player memory during rendering
US7136874B2 (en) * 2002-10-16 2006-11-14 Microsoft Corporation Adaptive menu system for media players
US7043477B2 (en) 2002-10-16 2006-05-09 Microsoft Corporation Navigating media content via groups within a playlist
US7127120B2 (en) * 2002-11-01 2006-10-24 Microsoft Corporation Systems and methods for automatically editing a video
US7116716B2 (en) * 2002-11-01 2006-10-03 Microsoft Corporation Systems and methods for generating a motion attention model
US7274741B2 (en) * 2002-11-01 2007-09-25 Microsoft Corporation Systems and methods for generating a comprehensive user attention model
KR100448882B1 (ko) 2002-11-14 2004-09-18 한국전자통신연구원 양안식 멀티미디어 컨텐츠 저작 장치 및 그 방법
US7546544B1 (en) 2003-01-06 2009-06-09 Apple Inc. Method and apparatus for creating multimedia presentations
JP4241066B2 (ja) * 2003-01-29 2009-03-18 キヤノン株式会社 予約装置およびその制御方法
US7260261B2 (en) * 2003-02-20 2007-08-21 Microsoft Corporation Systems and methods for enhanced image adaptation
WO2004097599A2 (en) 2003-04-28 2004-11-11 Sony Pictures Entertainment Inc. Rich media publishing
US7577750B2 (en) 2003-05-23 2009-08-18 Microsoft Corporation Systems and methods for peer-to-peer collaboration to enhance multimedia streaming
US7739715B2 (en) 2003-06-24 2010-06-15 Microsoft Corporation Variable play speed control for media streams
WO2005017899A1 (en) * 2003-08-18 2005-02-24 Koninklijke Philips Electronics N.V. Video abstracting
US7352952B2 (en) * 2003-10-16 2008-04-01 Magix Ag System and method for improved video editing
US7519274B2 (en) * 2003-12-08 2009-04-14 Divx, Inc. File format for multiple track digital data
US7296168B2 (en) 2003-12-13 2007-11-13 Texas Instruments Incorporated Method and apparatus to minimize power and ground bounce in a logic device
US7860005B2 (en) * 2004-01-30 2010-12-28 Hewlett-Packard Development Company, L.P. Methods and systems that use information about a frame of video data to make a decision about sending the frame
US7420973B2 (en) * 2004-02-09 2008-09-02 Redback Networks Inc. Context selection in a network element through subscriber flow switching
US10417298B2 (en) * 2004-12-02 2019-09-17 Insignio Technologies, Inc. Personalized content processing and delivery system and media
US7802188B2 (en) 2004-05-13 2010-09-21 Hewlett-Packard Development Company, L.P. Method and apparatus for identifying selected portions of a video stream
US20050262439A1 (en) 2004-05-20 2005-11-24 Neil Cameron Automatic web publishing
US20060026529A1 (en) * 2004-07-07 2006-02-02 Paulsen Chett B Media cue cards for scene-based instruction and production in multimedia
US20060023748A1 (en) 2004-07-09 2006-02-02 Chandhok Ravinder P System for layering content for scheduled delivery in a data network
US20060074754A1 (en) 2004-09-22 2006-04-06 Takeshi Toyohara System and method of creating and managing digital content offers
TW200615789A (en) * 2004-11-15 2006-05-16 Inst Information Industry System and method for establishing an education web page template
US7633887B2 (en) * 2005-01-21 2009-12-15 Panwar Shivendra S On demand peer-to-peer video streaming with multiple description coding
US20060190435A1 (en) * 2005-02-24 2006-08-24 International Business Machines Corporation Document retrieval using behavioral attributes
US7689617B2 (en) * 2005-02-25 2010-03-30 Prashant Parikh Dynamic learning for navigation systems
US9558498B2 (en) 2005-07-29 2017-01-31 Excalibur Ip, Llc System and method for advertisement management
US7660581B2 (en) 2005-09-14 2010-02-09 Jumptap, Inc. Managing sponsored content based on usage history
US20080065751A1 (en) * 2006-09-08 2008-03-13 International Business Machines Corporation Method and computer program product for assigning ad-hoc groups

Also Published As

Publication number Publication date
EP1624391A3 (en) 2006-03-15
JP2006054872A (ja) 2006-02-23
EP1624391A2 (en) 2006-02-08
US7986372B2 (en) 2011-07-26
US20060026524A1 (en) 2006-02-02

Similar Documents

Publication Publication Date Title
JP5038607B2 (ja) スマートメディアコンテンツサムネイル抽出のシステムおよび方法
US9053754B2 (en) Thumbnail generation and presentation for recorded TV programs
US9378286B2 (en) Implicit user interest marks in media content
US9009750B2 (en) Post processing video to identify interests based on clustered user interactions
US10129515B2 (en) Display control device, recording control device, and display control method
KR101608396B1 (ko) 이질적 컨텐트 소스들의 링크
US11630862B2 (en) Multimedia focalization
WO2006126391A1 (ja) コンテンツ処理装置及びコンテンツ処理方法、並びにコンピュータ・プログラム
JP5079817B2 (ja) サマリ及びレポートを既に含んでいるオーディオビジュアル文書について新たなサマリを作成する方法及び該方法を使用する受信機
JP2013536969A (ja) コミュニティベースのメタデータを提供するための方法および装置
US12022170B2 (en) Personalized screencaps for trickplay slider
KR20060102639A (ko) 동영상 재생 시스템 및 방법
JP2009159437A (ja) 情報処理装置、情報処理方法及びプログラム
JP5266981B2 (ja) 電子機器、情報処理方法及びプログラム
US20140189769A1 (en) Information management device, server, and control method
JP2008099012A (ja) コンテンツ再生システム及びコンテンツ蓄積システム
JP2008504639A (ja) マルチメディアデータの記録装置およびマルチメディアデータの記録方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080801

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20090901

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20091008

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20110829

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110901

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20111201

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120223

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120521

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120607

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120706

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150713

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees