JP2008042895A - 複数のビデオをクラスタ化するための方法、装置、システム、及びプログラム - Google Patents
複数のビデオをクラスタ化するための方法、装置、システム、及びプログラム Download PDFInfo
- Publication number
- JP2008042895A JP2008042895A JP2007170049A JP2007170049A JP2008042895A JP 2008042895 A JP2008042895 A JP 2008042895A JP 2007170049 A JP2007170049 A JP 2007170049A JP 2007170049 A JP2007170049 A JP 2007170049A JP 2008042895 A JP2008042895 A JP 2008042895A
- Authority
- JP
- Japan
- Prior art keywords
- video
- cluster
- videos
- representative
- clusters
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/70—Information retrieval; Database structures therefor; File system structures therefor of video data
- G06F16/74—Browsing; Visualisation therefor
- G06F16/743—Browsing; Visualisation therefor a collection of video files or sequences
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/40—Scenes; Scene-specific elements in video content
- G06V20/41—Higher-level, semantic clustering, classification or understanding of video scenes, e.g. detection, labelling or Markovian modelling of sport events or news items
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/70—Information retrieval; Database structures therefor; File system structures therefor of video data
- G06F16/71—Indexing; Data structures therefor; Storage structures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/70—Information retrieval; Database structures therefor; File system structures therefor of video data
- G06F16/73—Querying
- G06F16/738—Presentation of query results
- G06F16/739—Presentation of query results in form of a video summary, e.g. the video summary being a video sequence, a composite still image or having synthesized frames
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Multimedia (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- Software Systems (AREA)
- Computational Linguistics (AREA)
- Human Computer Interaction (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Indexing, Searching, Synchronizing, And The Amount Of Synchronization Travel Of Record Carriers (AREA)
Abstract
【解決手段】本発明はビデオクリップの階層的クラスタ化により、ユーザが関心対象のビデオクリップのサブグループを順次識別できるようにする。本発明の方法では、個々のビデオ及びクラスタ内の低レベルのクラスタから代表ビデオクリップを選択することにより、各クラスタの内容に関するビデオ要約を生成する。リンクが、より一般的な高レベルのクラスタとこれらが含む要素との間に設けられ、この結果ユーザには、閲覧又は検索エンジンにより返されるビデオのセットの上位レベルから後続の各クラスタのレベルに続いて、ビデオの関連部分及び次のより低レベルのクラスタの関連部分に関するビデオ要約が提示される。ユーザは所望のビデオ又はより低レベルのクラスタへとナビゲーションリンクを辿ることができる。
【選択図】図2
Description
E. Bertino, J. Fan, E. Ferrari, M. -S. Hacid, A. K. Elmagarmid, X. Zhu 著、「ビデオデータベースシステムにおける階層的アクセス制御モデル(A hierarchical access control model for video database system)」ACM Transactions on Information Systems, 21(2), pp.155-191, 2003 C. -W. Ngo,T. -C. Pong, H. -J. Zhang 著「ビデオショットのクラスタ化および検索(On clustering and retrieval of video shots)」ACM Multimedia '01, pp.51-60
(a)複数のビデオから、各ビデオセグメントが前記ビデオの連続するサブシーケンスである1つ以上のビデオセグメントを選択し、
(b)1つ以上の属性を選択し、
(c)前記1つ以上の属性に基づいて前記1つ以上のビデオセグメントについて1つ以上の距離基準を生成し、
(d)前記1つ以上の距離基準に基づいて1つ以上の階層的クラスタ(hierarchical cluster)を生成し、
(e)各クラスタから前記1つ以上のビデオセグメントの1つ以上のビデオサブセットを選択することであって、第1ビデオサブセットが第1クラスタから選択され、第2ビデオサブセットが第2クラスタから選択され、
(f)前記選択された1つ以上のサブセットを結合することによりハイパービデオを生成することであって、ナビゲーションリンクが、前記第1クラスタと前記第2クラスタとの間の階層的リンクに基づいて前記第2ビデオサブセットと前記第1ビデオサブセットとを結合すること、を含むことを特徴とする。
ステップ(e)および(f)がさらに、
ビデオセグメントの一部である、1つ以上の代表ビデオクリップを選択することであって、各代表ビデオクリップが前記クラスタ内に存在し、第1の代表ビデオクリップは前記第1クラスタから選択され、第2の代表ビデオクリップは前記第2クラスタから選択され、
前記選択された1つ以上の代表ビデオクリップを結合することによりハイパービデオを生成することであって、ナビゲーションリンクが、前記第1のクラスタと前記第2のクラスタと間の階層的リンクに基づいて、前記第1の代表ビデオクリップを第2の代表ビデオクリップに結合すること、を含むことを特徴とする。
(g)1つ以上の検索基準を選択し、
(h)前記1つ以上の検索基準に基づいて前記複数のビデオの1回以上の検索を実行し、
(i)検索結果に基づいてステップ(a)に定義されている包含すべきビデオセグメントを選択すること、をさらに含むことを特徴とする。
(g)1つ以上の検索基準を選択し、
(h)前記1つ以上の検索基準に基づいて前記複数のビデオの1回以上の検索を実行し、
(i)前記検索結果に基づいてステップ(d)における階層的クラスタを取り除く(Pruning)こと、をさらに含むことを特徴とする。
(a)複数のビデオから、各ビデオセグメントが前記ビデオの連続するサブシーケンスである1つ以上のビデオセグメントを選択する手段と、
(b)1つ以上の属性を選択する手段と、
(c)前記1つ以上の属性に基づいて前記1つ以上のビデオセグメントについて1つ以上の距離基準を生成する手段と、
(d)前記1つ以上の距離基準に基づいて1つ以上の階層的クラスタを生成する手段と、
(e)各クラスタから前記1つ以上のビデオセグメントの1つ以上のビデオサブセットを選択する手段であって、第1ビデオサブセットが第1クラスタから選択され、第2ビデオサブセットが第2クラスタから選択される手段と、
(f)前記選択された1つ以上のサブセットの結合によりハイパービデオを作成する手段であって、ナビゲーションリンクが、前記第1クラスタと前記第2クラスタと間の階層的リンクに基づいて前記第1ビデオサブセットを前記第2ビデオサブセットに結合する手段と、を備えることを特徴とする。
a)1つ以上のパラメータのセットを指定し、前記1つ以上のパラメータのセットをソースコードに転送し、前記ソースコードを一連のタスクにコンパイルすることにより、ユーザが複数のビデオをクラスタ化することができる、1つ以上のプロセッサと
b)媒体上に格納された命令を含む機械可読媒体であって、前記命令は1つ以上のプロセスにより処理されると、システムに、1つ以上のパラメータのセットを指定し、1つ以上のパラメータのセットをソースコードに転送し、前記ソースコードを一連のタスクにコンパイルすることにより、ユーザが複数のビデオをクラスタ化することを実行させる、機械可読媒体と、を備えることを特徴とする。
(a)前記複数のビデオの少なくとも一部を選択して、前記ビデオセグメントが前記ビデオの連続するサブシーケンスである1つ以上のビデオセグメントを生成し、
(b)1つ以上の属性を選択し、
(c)前記1つ以上の属性に基づいて前記1つ以上のビデオセグメントについて1つ以上の距離基準を生成し、
(d)前記1つ以上の距離基準に基づいて1つ以上の階層的クラスタを生成し、
(e)各クラスタから前記1つ以上のビデオセグメントの1つ以上のビデオサブセットを選択することであって、第1ビデオサブセットが第1クラスタから選択され、第2ビデオサブセットが第2クラスタから選択され、
(f)前記選択された1つ以上のビデオサブセットを結合することによりハイパービデオを作成することであって、ナビゲーションリンクが、前記第1クラスタと前記第2クラスタと間の階層的なリンクに基づいて前記第1ビデオサブセットを前記第2ビデオサブセットに結合すること、を実行させることを特徴とする。
本発明が提案するこの態様は、ビデオクリップまたはビデオ全体をクラスタ化して有効なグループ分けを作成する方法を説明する。本発明のさまざまな実施形態においては、各種のクラスタ化アルゴリズムを利用できる。本発明の一実施形態においては、トップダウン式の階層的K平均法クラスタ化が使用できる。本発明の別の実施形態では、ボトムアップ式の集積的クラスタ化を使用して、ビデオを有効なグループ分けに分類(ソート)できる。クラスタ化アルゴリズムにおける距離基準は、ビデオの日付および長さ、ビデオの平均ショット長さ、平均色成分、クローズドキャプション(字幕)またはトランスクリプション(音声転写)からの関連するテキスト、著者、プロデューサ、俳優、キャラクターといった人物に付帯するメタデータ、場所、ジャンル、キーワードおよび注記を含む、ビデオ属性の組み合わせに基づくことができる。ビデオが問合せの結果である場合、その結果もまた関連性に基づいてクラスタ化されることができる。テキストベース(転写またはメタデータのいずれかに基づく)のクラスタ化が最良の結果を生成すると予測されるが、検出された顔のような他の属性も有効な結果を生成しうる。
K平均法アルゴリズムは、その中心が最も近いクラスタに各点を割当てる。中心はクラスタ内のすべての点の平均である(すなわち、中心の座標はクラスタ内のすべての点にわたる別個の各次元の算術平均である)。K平均法アルゴリズムはトップダウン式である。本発明の一実施形態では、標準的階層K平均法クラスタ化を用いてビデオのクラスタツリーを生成できる。本発明の一実施形態では、各ビデオクリップまたはビデオは、ユークリッド空間における特徴ベクトル(feature vector)によって表すことができ、ビデオクリップまたはビデオの間の距離は単に、空間における特徴ベクトル間の距離であると想定される。例えば、本発明の一実施形態においては、ビデオがジャンルによりグループ分けされる場合、特徴ベクトルはビデオの平均カラーヒストグラム、ビデオの長さおよび平均ショット長さから構成されることができ、距離は特徴ベクトル間の分散重み付きユークリッド距離である。別の例としては、関連するテキストに基づいたビデオクリップのクラスタ化がある。この場合には、ビデオクリップの特徴は項目ベクトル(term vector)であり、距離はコサイン距離であってよい。
1)各サブクラスタの平均を、ルートクラスタの平均のランダムオフセットとなるよう設定する。
2)各ビデオを、サブクラスタ平均までのビデオの距離に基づいて最近傍のサブクラスタに割当てることにより、標準K平均法クラスタ化を実行する。
3)新しい要素(ビデオ)を包含することでサブクラスタの平均を更新する。
集積的クラスタ化アルゴリズムは、クラスタを漸進的に結合することにより個々の要素から階層を構築する。集積的クラスタ化アルゴリズムはボトムアップ式である。本発明の一実施形態では、各ビデオクリップまたはビデオそれ自体がクラスタとされる。次に、2つの最近傍のクラスタを単一のクラスタに順次に結合する。本発明のさまざまな実施形態においては、クラスタ間の距離は、クラスタ内のビデオ間の最小、最大または平均距離として定義できる。本発明の一実施形態では、より緊密にグループ分けされたクラスタを得るために、最大距離が用いられうる。階層的クラスタ化は、最小の結合クラスタを生成する2つのクラスタを結合することにより実行できる。最初は、各画像が自身のクラスタを表す。ツリー内のノードの高さは結合クラスタの直径(要素の最大ペアワイズ距離)を表す。クラスタはクラスタの中心に最も近い要素により表される。ツリー内のビデオセグメントは時間順ではないことに注意されたい。アルゴリズムは、クラスタが1つになると、終了する。本発明の一実施形態では、集積的クラスタ化は特徴ベクトルを必要とせず、距離基準のみを必要とする。このような距離基準は、付帯されるテキスト(例えば、ビデオクラスタの項目ベクトル間のコサイン差)に基づくか、または、視覚的属性およびメタデータ属性(例えば、共通の俳優の数と結合されたビデオクリップの平均ヒストグラム間のカラーヒストグラム差)に基づいている。
本発明のさまざまな実施形態においては、1つ以上の代表的なビデオクリップまたはビデオを選択して、ハイパービデオ内のクラスタの内容を示すことができる。本発明の一実施形態では単一の代表ビデオクリップまたはビデオが選択されるが、容易にアルゴリズムを更新して対象クラスタ内のサブクラスタの複数の代表ビデオを選択することにより任意の数の代表ビデオを選択することもできる。本発明の一実施形態において、K平均法アルゴリズムでは、クラスタの代表ビデオは、クラスタの平均に最も近いビデオとして定義される。本発明の一実施形態において、集積的クラスタ化アルゴリズムでは、クラスタの代表ビデオは、クラスタ内の他のビデオまでの距離の和が最小であるビデオである。
例えば、ユーザが「ジャガー(Jaguar)」を検索した場合、多数のビデオまたはビデオクリップを見出されうる。ビデオまたはビデオクリップは、猫、車、および家庭用電子製品にクラスタ化されうる。車に関するクラスタはさらに、車の販売店、メンテナンスおよびおもちゃの自動車に細分されうる。家庭用電子製品に関するクラスタはさらに、Mac OS 10.2(Jaguar)、IBM家庭用電気製品およびAtari Jaguar、Motorola社の家庭用電化製品に細分されている可能性がある。
クラスタツリーを閲覧するために使用されるハイパービデオを作成するためには、すべての非終端クラスタ(非終端クラスタは、単一のビデオクリップまたはビデオではない少なくとも1つのサブクラスタを有する)はN個のサブクラスタを有する必要がある。K平均法クラスタ化アルゴリズムを用いると、Nは、クラスタ化アルゴリズムを再帰的に適用する場合にクラスタの数として指定される。集積的階層クラスタ化アルゴリズムでは、二進数のクラスタツリーを再帰的に枝刈りして、各クラスタに対してN個のサブクラスタを見出す。結果として得られるクラスタはサイズでは均衡していないが、各クラスタは少なくとも1つのビデオクリップまたはビデオを含むことになる。
これらの技術はさらに、ビデオコレクションへの問合せの結果から生じるクラスタ化ビデオを閲覧するために用いることができる。問合せに基づいてハイパービデオを生成するのに2つの方法がある。第1の方法は、最初に問合せが実行され、その後に関連ビデオがクラスタ化され、ハイパービデオが生成されることを想定している。第2の方法は、最初にビデオコレクション全体を使用してクラスタツリーを生成する。このとき、問合せを用いてクラスタツリーの枝刈りをして、問合せに関連しないすべてのサブツリーを削除する。この後に、ハイパービデオが枝刈りされたツリーから生成される。この場合、クラスタの代表ビデオは、すべてのサブクラスタが含まれているとは限らないため、短くなる。
Claims (20)
- 複数のビデオをクラスタ化する方法であって、
(a)複数のビデオから、各ビデオセグメントが前記ビデオの連続するサブシーケンスである1つ以上のビデオセグメントを選択し、
(b)1つ以上の属性を選択し、
(c)前記1つ以上の属性に基づいて前記1つ以上のビデオセグメントについて1つ以上の距離基準を生成し、
(d)前記1つ以上の距離基準に基づいて1つ以上の階層的クラスタを生成し、
(e)各クラスタから前記1つ以上のビデオセグメントの1つ以上のビデオサブセットを選択することであって、第1ビデオサブセットが第1クラスタから選択され、第2ビデオサブセットが第2クラスタから選択され、
(f)前記選択された1つ以上のサブセットを結合することによりハイパービデオを生成することであって、ナビゲーションリンクが、前記第1クラスタと前記第2クラスタとの間の階層的リンクに基づいて前記第2ビデオサブセットと前記第1ビデオサブセットとを結合すること、
を含む方法。 - ステップ(e)および(f)がさらに、
ビデオセグメントの一部である、1つ以上の代表ビデオクリップを選択することであって、各代表ビデオクリップが前記クラスタ内に存在し、第1の代表ビデオクリップは前記第1クラスタから選択され、第2の代表ビデオクリップは前記第2クラスタから選択され、
前記選択された1つ以上の代表ビデオクリップを結合することによりハイパービデオを生成することであって、ナビゲーションリンクが、前記第1のクラスタと前記第2のクラスタと間の階層的リンクに基づいて、前記第1の代表ビデオクリップを第2の代表ビデオクリップに結合すること、
を含む請求項1に記載の方法。 - (g)1つ以上の検索基準を選択し、
(h)前記1つ以上の検索基準に基づいて前記複数のビデオの1回以上の検索を実行し、
(i)検索結果に基づいてステップ(a)に定義されている包含すべきビデオセグメントを選択すること、
をさらに含む、請求項1に記載の方法。 - 1つ以上の前記検索基準が関連性スコアであり、包含のために選択される前記ビデオセグメントが、前記関連性スコアに基づいて1つ以上の検索において探索される、請求項3に記載の方法。
- (g)1つ以上の検索基準を選択し、
(h)前記1つ以上の検索基準に基づいて前記複数のビデオの1回以上の検索を実行し、
(i)前記検索結果に基づいてステップ(d)における階層的クラスタを取り除くこと、
をさらに含む、請求項1に記載の方法。 - 1つ以上の前記検索基準は関連性スコアであり、前記クラスタの前記取り除くことは、前記関連性のスコアに基づいて検索されなかったビデオセグメントの削除に相当する、請求項5に記載の方法。
- ステップ(a)において、1つ以上の前記属性が、前記ビデオの日付、前記ビデオセグメントの長さ、前記代表クリップの長さ、平均のショット長さ、色組成の平均、技術的な品質、問合せの関連性、字幕、字幕に関連するテキスト、字幕からの関連テキストの転写、代表クリップ内での検索項目の出現、代表クリップ近辺での検索項目の出現、著者、プロデューサ、検出される顔、物体の運動、俳優、キャラクター、場所、ジャンル、キーワード、注記または人工のメタデータから成るグループから選択される、請求項1に記載の方法。
- 前記階層的クラスタが、それぞれが最大N個のサブクラスタを有する複数のクラスタで形成される、請求項1に記載の方法。
- ステップ(c)において、前記距離基準が、項目ベクトルによりビデオセグメントを表現することにより生成される、請求項1に記載の方法。
- ステップ(d)において、前記1つ以上の階層的クラスタがK平均法クラスタ化アルゴリズムを用いて生成される、請求項1に記載の方法。
- ステップ(d)において、各ビデオ距離基準がユークリッド空間において特徴ベクトルによりビデオセグメントを表現することにより生成される、請求項10に記載の方法。
- ステップ(d)において、サブクラスタの数Nが前記クラスタ化アルゴリズムの再帰的な適用により生成される、請求項10に記載の方法。
- ステップ(d)において、前記階層的クラスタが集積的クラスタ化アルゴリズムを用いる二進数クラスタツリーである、請求項1に記載の方法。
- ステップ(d)において、Nが二進数クラスタツリー内のクラスタのサブツリーの数であり、Nはツリーを切断することにより決定される、請求項13に記載の方法。
- ビデオセグメント間の前記1つ以上の距離基準が空間における特徴ベクトル間の1つ以上の距離である、請求項1に記載の方法。
- ビデオセグメント間の前記1つ以上の距離基準が空間における項目ベクトル間の1つ以上のコサイン距離である、請求項1に記載の方法。
- 前記クラスタの距離基準が最小距離、最大距離および平均距離から成る前記グループから選択される、請求項13に記載の方法。
- 複数のビデオをクラスタ化する装置であって、
(a)複数のビデオから、各ビデオセグメントが前記ビデオの連続するサブシーケンスである1つ以上のビデオセグメントを選択する手段と、
(b)1つ以上の属性を選択する手段と、
(c)前記1つ以上の属性に基づいて前記1つ以上のビデオセグメントについて1つ以上の距離基準を生成する手段と、
(d)前記1つ以上の距離基準に基づいて1つ以上の階層的クラスタを生成する手段と、
(e)各クラスタから前記1つ以上のビデオセグメントの1つ以上のビデオサブセットを選択する手段であって、第1ビデオサブセットが第1クラスタから選択され、第2ビデオサブセットが第2クラスタから選択される手段と、
(f)前記選択された1つ以上のサブセットの結合によりハイパービデオを作成する手段であって、ナビゲーションリンクが、前記第1クラスタと前記第2クラスタと間の階層的リンクに基づいて前記第1ビデオサブセットを前記第2ビデオサブセットに結合する手段と、
を備えた装置。 - 請求項18に記載の装置により複数のビデオをクラスタ化するシステムであって、
a)1つ以上のパラメータのセットを指定し、前記1つ以上のパラメータのセットをソースコードに転送し、前記ソースコードを一連のタスクにコンパイルすることにより、ユーザが複数のビデオをクラスタ化することができる、1つ以上のプロセッサと
b)媒体上に格納された命令を含む機械可読媒体であって、前記命令は1つ以上のプロセスにより処理されると、システムに、1つ以上のパラメータのセットを指定し、1つ以上のパラメータのセットをソースコードに転送し、前記ソースコードを一連のタスクにコンパイルすることにより、ユーザが複数のビデオをクラスタ化することを実行させる、機械可読媒体と、
を備えた、システム。 - システムにより複数のビデオをクラスタ化するための命令を有するプログラムであって、前記命令は前記システムのプロセッサで実行されることにより、前記システムに、
(a)前記複数のビデオの少なくとも一部を選択して、前記ビデオセグメントが前記ビデオの連続するサブシーケンスである1つ以上のビデオセグメントを生成し、
(b)1つ以上の属性を選択し、
(c)前記1つ以上の属性に基づいて前記1つ以上のビデオセグメントについて1つ以上の距離基準を生成し、
(d)前記1つ以上の距離基準に基づいて1つ以上の階層的クラスタを生成し、
(e)各クラスタから前記1つ以上のビデオセグメントの1つ以上のビデオサブセットを選択することであって、第1ビデオサブセットが第1クラスタから選択され、第2ビデオサブセットが第2クラスタから選択され、
(f)前記選択された1つ以上のビデオサブセットを結合することによりハイパービデオを作成することであって、ナビゲーションリンクが、前記第1クラスタと前記第2クラスタと間の階層的なリンクに基づいて前記第1ビデオサブセットを前記第2ビデオサブセットに結合すること、を実行させる、
プログラム。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US11/498,686 US20080127270A1 (en) | 2006-08-02 | 2006-08-02 | Browsing video collections using hypervideo summaries derived from hierarchical clustering |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2008042895A true JP2008042895A (ja) | 2008-02-21 |
Family
ID=39177354
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007170049A Pending JP2008042895A (ja) | 2006-08-02 | 2007-06-28 | 複数のビデオをクラスタ化するための方法、装置、システム、及びプログラム |
Country Status (2)
Country | Link |
---|---|
US (1) | US20080127270A1 (ja) |
JP (1) | JP2008042895A (ja) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010028184A (ja) * | 2008-02-04 | 2010-02-04 | Fuji Xerox Co Ltd | 映像ナビゲーション方法、映像ナビゲーションシステム、及び映像ナビゲーションプログラム |
US8352985B2 (en) | 2008-04-23 | 2013-01-08 | Samsung Electronics Co., Ltd. | Method of storing and displaying broadcast contents and apparatus therefor |
KR20140041557A (ko) * | 2011-06-17 | 2014-04-04 | 마이크로소프트 코포레이션 | 미디어 세트의 계층적인, 줌 가능한 프레젠테이션 |
JP2017062761A (ja) * | 2015-09-22 | 2017-03-30 | 富士ゼロックス株式会社 | ハイパービデオの再生プランを可視化する方法、システム及びプログラム |
CN111741331A (zh) * | 2020-08-07 | 2020-10-02 | 北京美摄网络科技有限公司 | 一种视频片段处理方法、装置、存储介质及设备 |
Families Citing this family (42)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100771244B1 (ko) * | 2006-06-12 | 2007-10-29 | 삼성전자주식회사 | 동영상 데이터 처리 방법 및 장치 |
US8276098B2 (en) | 2006-12-22 | 2012-09-25 | Apple Inc. | Interactive image thumbnails |
US7954065B2 (en) * | 2006-12-22 | 2011-05-31 | Apple Inc. | Two-dimensional timeline display of media items |
US9142253B2 (en) * | 2006-12-22 | 2015-09-22 | Apple Inc. | Associating keywords to media |
US20080288869A1 (en) * | 2006-12-22 | 2008-11-20 | Apple Inc. | Boolean Search User Interface |
US8280877B2 (en) * | 2007-02-22 | 2012-10-02 | Microsoft Corporation | Diverse topic phrase extraction |
DE102007063635A1 (de) * | 2007-03-22 | 2009-04-02 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Verfahren zur zeitlichen Segmentierung eines Videos in Videobildfolgen und zur Auswahl von Keyframes für das Auffinden von Bildinhalten unter Einbeziehung einer Subshot-Detektion |
US20090007178A1 (en) * | 2007-06-12 | 2009-01-01 | Your Truman Show, Inc. | Video-Based Networking System with a Video-Link Navigator |
US20090070321A1 (en) * | 2007-09-11 | 2009-03-12 | Alexander Apartsin | User search interface |
US20090100093A1 (en) * | 2007-10-16 | 2009-04-16 | Nokia Corporation | Apparatus, system, method and computer program product for previewing media files |
US20090249427A1 (en) * | 2008-03-25 | 2009-10-01 | Fuji Xerox Co., Ltd. | System, method and computer program product for interacting with unaltered media |
US8239359B2 (en) * | 2008-09-23 | 2012-08-07 | Disney Enterprises, Inc. | System and method for visual search in a video media player |
KR20100095777A (ko) * | 2009-02-23 | 2010-09-01 | 삼성전자주식회사 | 전자기기에서 컨텐츠의 썸네일 추출 방법 및 장치 |
US8566315B1 (en) * | 2009-03-09 | 2013-10-22 | Google Inc. | Sequenced video segment mix |
US20110214147A1 (en) * | 2010-02-22 | 2011-09-01 | Kashyap Ashwin S | Method for determining content for a personal channel |
US9185326B2 (en) | 2010-06-11 | 2015-11-10 | Disney Enterprises, Inc. | System and method enabling visual filtering of content |
US9171578B2 (en) | 2010-08-06 | 2015-10-27 | Futurewei Technologies, Inc. | Video skimming methods and systems |
US8712930B1 (en) | 2010-08-09 | 2014-04-29 | Google Inc. | Encoding digital content based on models for predicting similarity between exemplars |
US8726161B2 (en) * | 2010-10-19 | 2014-05-13 | Apple Inc. | Visual presentation composition |
US8689269B2 (en) * | 2011-01-27 | 2014-04-01 | Netflix, Inc. | Insertion points for streaming video autoplay |
US8515193B1 (en) | 2011-04-08 | 2013-08-20 | Google Inc. | Image compression using exemplar dictionary based on hierarchical clustering |
US9262518B2 (en) * | 2011-05-04 | 2016-02-16 | Yahoo! Inc. | Dynamically determining the relatedness of web objects |
US9179201B2 (en) | 2011-08-26 | 2015-11-03 | Cyberlink Corp. | Systems and methods of detecting significant faces in video streams |
US9552124B2 (en) | 2012-04-27 | 2017-01-24 | Mobitv, Inc. | Character based search and discovery of media content |
EP2690879B1 (en) * | 2012-07-23 | 2016-09-07 | LG Electronics, Inc. | Mobile terminal and method for controlling of the same |
US20140181668A1 (en) * | 2012-12-20 | 2014-06-26 | International Business Machines Corporation | Visual summarization of video for quick understanding |
US9110988B1 (en) * | 2013-03-14 | 2015-08-18 | Google Inc. | Methods, systems, and media for aggregating and presenting multiple videos of an event |
US9021526B1 (en) * | 2013-05-03 | 2015-04-28 | Amazon Technologies, Inc. | Video navigation preview |
US10187674B2 (en) * | 2013-06-12 | 2019-01-22 | Netflix, Inc. | Targeted promotion of original titles |
US10623821B2 (en) * | 2013-09-10 | 2020-04-14 | Tivo Solutions Inc. | Method and apparatus for creating and sharing customized multimedia segments |
US10248864B2 (en) * | 2015-09-14 | 2019-04-02 | Disney Enterprises, Inc. | Systems and methods for contextual video shot aggregation |
US10223447B2 (en) * | 2017-08-02 | 2019-03-05 | Spotify Ab | Playlist trailer |
EP3786945B1 (en) | 2018-04-12 | 2023-07-19 | Spotify AB | Voice-based authentication |
US10289915B1 (en) * | 2018-06-05 | 2019-05-14 | Eight Plus Ventures, LLC | Manufacture of image inventories |
US10938568B2 (en) | 2018-06-05 | 2021-03-02 | Eight Plus Ventures, LLC | Image inventory production |
US10296729B1 (en) | 2018-08-23 | 2019-05-21 | Eight Plus Ventures, LLC | Manufacture of inventories of image products |
US10606888B2 (en) | 2018-06-05 | 2020-03-31 | Eight Plus Ventures, LLC | Image inventory production |
US10467391B1 (en) | 2018-08-23 | 2019-11-05 | Eight Plus Ventures, LLC | Manufacture of secure printed image inventories |
US10565358B1 (en) | 2019-09-16 | 2020-02-18 | Eight Plus Ventures, LLC | Image chain of title management |
CN111178415A (zh) * | 2019-12-21 | 2020-05-19 | 厦门快商通科技股份有限公司 | 一种基于bert的意图数据层次聚类方法及系统 |
US11210596B1 (en) | 2020-11-06 | 2021-12-28 | issuerPixel Inc. a Nevada C. Corp | Self-building hierarchically indexed multimedia database |
US20220321972A1 (en) * | 2021-03-31 | 2022-10-06 | Rovi Guides, Inc. | Transmitting content based on genre information |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003069924A (ja) * | 2001-08-09 | 2003-03-07 | Eastman Kodak Co | ビデオセグメントの確率的マージングによるビデオ構造化方法 |
JP2004194095A (ja) * | 2002-12-12 | 2004-07-08 | Sony Corp | 画像処理装置および方法、記録媒体、並びにプログラム |
JP2005025744A (ja) * | 2003-07-02 | 2005-01-27 | Fuji Xerox Co Ltd | マルチレベルビデオサマリを自動的に生成する方法、システム、及び、コンピュータ・プログラム製品 |
Family Cites Families (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5894320A (en) * | 1996-05-29 | 1999-04-13 | General Instrument Corporation | Multi-channel television system with viewer-selectable video and audio |
US6195458B1 (en) * | 1997-07-29 | 2001-02-27 | Eastman Kodak Company | Method for content-based temporal segmentation of video |
US6807361B1 (en) * | 2000-07-18 | 2004-10-19 | Fuji Xerox Co., Ltd. | Interactive custom video creation system |
US7546143B2 (en) * | 2001-12-18 | 2009-06-09 | Fuji Xerox Co., Ltd. | Multi-channel quiet calls |
AU2003201799A1 (en) * | 2002-01-16 | 2003-07-30 | Elucidon Ab | Information data retrieval, where the data is organized in terms, documents and document corpora |
US7068723B2 (en) * | 2002-02-28 | 2006-06-27 | Fuji Xerox Co., Ltd. | Method for automatically producing optimal summaries of linear media |
US7149974B2 (en) * | 2002-04-03 | 2006-12-12 | Fuji Xerox Co., Ltd. | Reduced representations of video sequences |
US7555718B2 (en) * | 2004-11-12 | 2009-06-30 | Fuji Xerox Co., Ltd. | System and method for presenting video search results |
US7440947B2 (en) * | 2004-11-12 | 2008-10-21 | Fuji Xerox Co., Ltd. | System and method for identifying query-relevant keywords in documents with latent semantic analysis |
US8201073B2 (en) * | 2005-08-15 | 2012-06-12 | Disney Enterprises, Inc. | System and method for automating the creation of customized multimedia content |
US20070212023A1 (en) * | 2005-12-13 | 2007-09-13 | Honeywell International Inc. | Video filtering system |
US20070133385A1 (en) * | 2005-12-14 | 2007-06-14 | Microsoft Corporation | Reverse ID class inference via auto-grouping |
-
2006
- 2006-08-02 US US11/498,686 patent/US20080127270A1/en not_active Abandoned
-
2007
- 2007-06-28 JP JP2007170049A patent/JP2008042895A/ja active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003069924A (ja) * | 2001-08-09 | 2003-03-07 | Eastman Kodak Co | ビデオセグメントの確率的マージングによるビデオ構造化方法 |
JP2004194095A (ja) * | 2002-12-12 | 2004-07-08 | Sony Corp | 画像処理装置および方法、記録媒体、並びにプログラム |
JP2005025744A (ja) * | 2003-07-02 | 2005-01-27 | Fuji Xerox Co Ltd | マルチレベルビデオサマリを自動的に生成する方法、システム、及び、コンピュータ・プログラム製品 |
Non-Patent Citations (1)
Title |
---|
JPN6011059986; Yihong Gong, Xin Liu: 'Summeriging Video by Minimizing Visual Content Redundancies' 2001 IEEE International Conference on Multimedia and Exposition , 2001 * |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010028184A (ja) * | 2008-02-04 | 2010-02-04 | Fuji Xerox Co Ltd | 映像ナビゲーション方法、映像ナビゲーションシステム、及び映像ナビゲーションプログラム |
US8352985B2 (en) | 2008-04-23 | 2013-01-08 | Samsung Electronics Co., Ltd. | Method of storing and displaying broadcast contents and apparatus therefor |
KR20140041557A (ko) * | 2011-06-17 | 2014-04-04 | 마이크로소프트 코포레이션 | 미디어 세트의 계층적인, 줌 가능한 프레젠테이션 |
KR101939425B1 (ko) * | 2011-06-17 | 2019-01-16 | 마이크로소프트 테크놀로지 라이센싱, 엘엘씨 | 미디어 세트의 계층적인, 줌 가능한 프레젠테이션 기법 |
US10928972B2 (en) | 2011-06-17 | 2021-02-23 | Microsoft Technology Licensing, Llc | Hierarchical, zoomable presentations of media sets |
JP2017062761A (ja) * | 2015-09-22 | 2017-03-30 | 富士ゼロックス株式会社 | ハイパービデオの再生プランを可視化する方法、システム及びプログラム |
CN111741331A (zh) * | 2020-08-07 | 2020-10-02 | 北京美摄网络科技有限公司 | 一种视频片段处理方法、装置、存储介质及设备 |
CN111741331B (zh) * | 2020-08-07 | 2020-12-22 | 北京美摄网络科技有限公司 | 一种视频片段处理方法、装置、存储介质及设备 |
Also Published As
Publication number | Publication date |
---|---|
US20080127270A1 (en) | 2008-05-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2008042895A (ja) | 複数のビデオをクラスタ化するための方法、装置、システム、及びプログラム | |
Zhu et al. | Video data mining: Semantic indexing and event detection from the association perspective | |
JP4569955B2 (ja) | 情報格納及び検索方法 | |
US7502780B2 (en) | Information storage and retrieval | |
US10445359B2 (en) | Method and system for classifying media content | |
US7707162B2 (en) | Method and apparatus for classifying multimedia artifacts using ontology selection and semantic classification | |
Asghar et al. | Video indexing: a survey | |
WO2012020667A1 (ja) | 情報処理装置、情報処理方法、及び、プログラム | |
US20040107221A1 (en) | Information storage and retrieval | |
Zhang | Semantic-based visual information retrieval | |
JP2005122690A (ja) | 情報処理 | |
JP2008276768A (ja) | 情報検索装置及び方法 | |
JP7395377B2 (ja) | コンテンツ検索方法、装置、機器、および記憶媒体 | |
US20040107195A1 (en) | Information storage and retrieval | |
Priya et al. | A comprehensive review of significant researches on content based indexing and retrieval of visual information | |
Tommasi et al. | Beyond metadata: searching your archive based on its audio-visual content | |
Feng et al. | Multiple style exploration for story unit segmentation of broadcast news video | |
Rautiainen et al. | Analysing the performance of visual, concept and text features in content-based video retrieval | |
Rathod et al. | Review on event retrieval in soccer video | |
Luo et al. | Integrating multi-modal content analysis and hyperbolic visualization for large-scale news video retrieval and exploration | |
Hentschel et al. | Open up cultural heritage in video archives with mediaglobe | |
KR20040054308A (ko) | 뉴스 비디오의 개별기사 군집화 방법 및 뉴스 브라우징방법 | |
Marques et al. | Issues in Designing Contemporary Video Database Systems. | |
Lili | Hidden markov model for content-based video retrieval | |
JP2009217436A (ja) | 協調的分類装置及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20100520 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20111107 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20111115 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120110 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20121002 |