JP4580183B2 - 視覚的に代表するビデオサムネイルの生成 - Google Patents

視覚的に代表するビデオサムネイルの生成 Download PDF

Info

Publication number
JP4580183B2
JP4580183B2 JP2004109416A JP2004109416A JP4580183B2 JP 4580183 B2 JP4580183 B2 JP 4580183B2 JP 2004109416 A JP2004109416 A JP 2004109416A JP 2004109416 A JP2004109416 A JP 2004109416A JP 4580183 B2 JP4580183 B2 JP 4580183B2
Authority
JP
Japan
Prior art keywords
frame
video
goodness
calculating
entropy
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2004109416A
Other languages
English (en)
Other versions
JP2005328105A5 (ja
JP2005328105A (ja
Inventor
ドン ツァン
イージン ワォン
ホン−ジァン ツァン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Microsoft Corp
Original Assignee
Microsoft Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Microsoft Corp filed Critical Microsoft Corp
Publication of JP2005328105A publication Critical patent/JP2005328105A/ja
Publication of JP2005328105A5 publication Critical patent/JP2005328105A5/ja
Application granted granted Critical
Publication of JP4580183B2 publication Critical patent/JP4580183B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/73Querying
    • G06F16/738Presentation of query results
    • G06F16/739Presentation of query results in form of a video summary, e.g. the video summary being a video sequence, a composite still image or having synthesized frames
    • EFIXED CONSTRUCTIONS
    • E03WATER SUPPLY; SEWERAGE
    • E03DWATER-CLOSETS OR URINALS WITH FLUSHING DEVICES; FLUSHING VALVES THEREFOR
    • E03D9/00Sanitary or other accessories for lavatories ; Devices for cleaning or disinfecting the toilet room or the toilet bowl; Devices for eliminating smells
    • E03D9/08Devices in the bowl producing upwardly-directed sprays; Modifications of the bowl for use with such devices ; Bidets; Combinations of bowls with urinals or bidets; Hot-air or other devices mounted in or on the bowl, urinal or bidet for cleaning or disinfecting
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/28Determining representative reference patterns, e.g. by averaging or distorting; Generating dictionaries
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • G06V10/772Determining representative reference patterns, e.g. averaging or distorting patterns; Generating dictionaries
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/40Scenes; Scene-specific elements in video content
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • G11B27/102Programmed access in sequence to addressed parts of tracks of operating record carriers
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • G11B27/19Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier
    • G11B27/28Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Engineering & Computer Science (AREA)
  • Public Health (AREA)
  • Evolutionary Computation (AREA)
  • Computing Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • Medical Informatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computational Linguistics (AREA)
  • Molecular Biology (AREA)
  • Epidemiology (AREA)
  • Hydrology & Water Resources (AREA)
  • Water Supply & Treatment (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Television Signal Processing For Recording (AREA)

Description

本開示は一般に、ビデオ表示技術に関し、より詳細には、ビデオシーケンスの突出した(salient)コンテンツを表すビデオサムネイルを生成することに関する。
マルチメディアコンピューティング技術およびネットワーク化通信の急速な進歩により、ディジタルライブラリに記憶されるディジタルマルチメディア(例えばビデオ、オーディオ、静止画)の量は劇的に増加している。しかし、このようなマルチメディアデータ、特にビデオにアクセスする方法は、このようなマルチメディアの量の増加についてきていない。従来のテキストベースの文書用の検索システムでは、文書情報を素早く概観するために文書代用物(例えばキーワードや要約)を閲覧することができ、これは、関係のない文書をフィルタにかけて除いて、関心のある文書をさらに検討するのに役立つ。
しかし、ビデオ独特の特性のせいで、従来の代用物およびテキスト指向の閲覧機構は、ビデオデータにアクセスするにはそれほど有用ではない。ビデオデータが伝えるビデオおよびオーディオ情報は、その時間空間表現、および単純にそのボリュームにより、言葉だけでは十分に記述し尽くせない。したがって、ビデオ「要約(abstracr)」(すなわちビデオシーケンスから抽出した代表的な静止画像)を使用することは、コンテンツベースでビデオデータを閲覧したりビデオデータにアクセスしたりするのを容易にする方法として、非常に重要である。
現在のビデオコンテンツ閲覧/アクセス方法は、ショット境界を検出し、ビデオ要約または概要として使用するためのキーフレームをビデオシーケンスから抽出することを含む。1つのビデオショットは、単一のカメラから録画されたビデオフレームの連続的なシーケンスである。ビデオショットは、ビデオシーケンスの構成単位を形成する。ショット境界検出の目的は、ビデオシーケンスを、キーフレームを抽出することのできる複数のビデオショットにセグメント化することである。キーフレームは、ショットの突出したコンテンツのサムネイル表現を提供するビデオフレームである。キーフレームを使用することで、ビデオ索引付けで必要とされるデータの量が削減され、ビデオコンテンツを構成および閲覧する方法がもたらされる。
キーフレーム抽出は、多大な労力が費やされる重要なトピックであり続けている。キーフレーム抽出にしばしば用いられる容易な技法の1つは、各ビデオショットの第1フレームをそのショットのキーフレームとして選択することである。この技法は、計算コストは低いが、通常はビデオショットについての突出した視覚コンテンツを効果的に取り込むことができない。他のキーフレーム抽出技法は、色特徴やビデオフレーム間の動きなどの様々な視覚基準を使用および分析することを含む。このような技法は、突出した視覚コンテンツの取込みを改善することができるが、計算コストが高い傾向がある。このように、キーフレーム抽出技法は、向上してきたものの、計算コストが非常に高いことや突出した視覚コンテンツをビデオデータから効果的に取り込めないことを含めて、欠点を被り続けている。
加えて、キーフレームを抽出するためのこのような従来技法は、ビデオシーケンス全体を代表するように意図されたキーフレームを決定することはない。そうではなく、このような技法は、ビデオシーケンス内の特定のビデオショットを代表するように意図されたキーフレームを決定する。
したがって、様々なビデオデータをコンテンツベースで閲覧するのを容易にする方式で、ビデオシーケンスの突出したコンテンツを正確に描く、ビデオシーケンス全体を表す方法が必要とされている。
ビデオシーケンスの突出したコンテンツを視覚的に表すビデオフレームを識別することによってビデオシーケンスに対するビデオサムネイルを生成するための、システムおよび方法を開示する。ビデオサムネイルアルゴリズムが、ビデオフレームについてのヒストグラムエントロピーとヒストグラム標準偏差との重み付き組合せに応じて、フレーム良好度(frame goodness measure)を計算する。ビデオシーケンス内の様々なフレームのフレーム良好度を比較することに基づいて、特定のフレームをビデオサムネイルとして選択する。
一実施形態では、ビデオシーケンス中の各ビデオフレームのフレーム良好度を計算する。フレーム良好度の計算は、フレームのヒストグラムを計算することを含む。次いで、ヒストグラムについてエントロピーおよび標準偏差を計算する。次いで、エントロピーと標準偏差との重み付き組合せとしてフレーム良好度を計算する。各ビデオフレームのフレーム良好度を相互に比較して、どのビデオフレームが最も突出しているかを決定する。最高値のフレーム良好度を有するフレームを、ビデオサムネイルとして選択する。
別の実施形態では、ビデオシーケンスを時間的にセグメント化し、ビデオシーケンスの特定のセグメント内(例えばビデオシーケンスの最初、中間、または最後)のフレームのフレーム良好度を計算する。この特定のビデオセグメントについて、局所的な最高フレーム良好度を決定する。次いで、局所的な最高フレーム良好度に関連するビデオフレームを、このビデオシーケンスのビデオサムネイルとして選択する。
別の実施形態では、ビデオシーケンスをビデオショットにセグメント化し、各ショット内のフレームのフレーム良好度を計算する。各ビデオショットについて、局所的な最高フレーム良好度を決定する。最高値の局所的な最高フレーム良好度に関連するビデオフレームとして、このビデオシーケンスに対するビデオサムネイルを選択する。
各図面を通して、同じコンポーネントおよび機構を参照するのには同じ参照番号を使用する。
概要
以下の考察は、ビデオファイル内またはビデオシーケンス内のビデオフレームから、突出したコンテンツリッチなビデオサムネイルを識別するためのシステムおよび方法を対象とする。本主題について、法定要件を満たすように具体的に述べる。ただし、この記述自体は、開示する本主題の範囲を限定するものではない。そうではなくこの記述は、特許請求する本主題を他の方法で実施して、この文書に述べる要素に類似する異なる要素または組合せ要素を他の現在または将来の技術と共に含めることができることを企図して記述するものである。
本明細書に述べるシステムおよび方法は、ビデオサムネイルとして使用される突出したビデオフレームをビデオシーケンスから識別するためのサムネイル識別アルゴリズムを実施する。ビデオサムネイルの識別は、フレーム良好度に基づく。このアルゴリズムは、フレームの色ヒストグラムを計算し、次いで、色ヒストグラムのエントロピーおよび標準偏差を計算する。フレーム良好度は、エントロピーと標準偏差との重み付き組合せである。ビデオシーケンスで最大値の良好度を有するビデオフレームを、ビデオシーケンスに対するビデオサムネイルとして決定する。開示するシステムおよび方法の利点には、ビデオファイルのコンテンツを正確に代表するビデオサムネイルを生成することが含まれる。
例示的な環境
図1および2に、ビデオファイルに対するビデオサムネイルを識別するのに適した例示的な環境を示す。図1の例示的な環境100は、コンピュータ102と、1つまたは複数のビデオ入力ソース104を含む。
ビデオ入力ソース104は、ビデオコンテンツをコンピュータ102に転送することのできる任意のタイプのデバイスまたは通信ネットワークとすることができ、例えば、携帯記憶媒体104(1)(例えば磁気ディスク、メディアカード、光ディスク)、ビデオ録画デバイス104(2)、または、インターネット、企業ネットワーク、家庭ネットワークなどのネットワーク104(3)が含まれる。
ビデオ録画デバイス104(2)は、ライブモーションビデオおよびオーディオを例えばVCRやTVによって、またコンピュータ102などのパーソナルコンピュータによって後で再生するために録画することのできる様々なディジタル録画デバイスのいずれかとすることができる。ビデオ録画デバイス104(2)は通常、i.LINK(IEEE1394)またはFireWireディジタルインタフェースを使用して直接コンピュータに接続させることができ、それによりビデオコンテンツはコンピュータ102上で直接編集することができる。
コンピュータ102は、様々なソース104からビデオコンテンツを受け取って、このビデオコンテンツを例えばメディアプレーヤで再生するために操作することが概して可能な、様々なコンピューティングデバイスとして実現することができる。他の場合では、コンピュータ102は通常、電子メール、カレンダリング、タスク構成、ワードプロセッシング、ウェブ閲覧など、一般的なコンピューティング機能を実施することができる。この実施形態では、コンピュータ102は、Microsoft(登録商標)から発売のWindows(登録商標)ブランドのオペレーティングシステムなど、オープンプラットフォームオペレーティングシステムを実行する。コンピュータ102は、例えばデスクトップコンピュータ、サーバコンピュータ、ラップトップコンピュータ、またはその他の形のパーソナルコンピュータ(PC)として実現することができる。コンピュータ102の例示的な一実装形態については、図13に関して後でより詳細に述べる。
図3の実施形態に関して後でより詳細に論じるが、コンピュータ102は一般に、ビデオコンテンツソース104からビデオシーケンスまたはファイル(すなわちビデオコンテンツ)を受け取り、ビデオシーケンス全体をほぼ代表する視覚コンテンツを有するビデオサムネイルとして使用するのに適したビデオフレームを、ビデオシーケンス内で識別するように構成されている。
図2の例示的な環境200は、スタンドアロンなビデオ録画デバイス202を含む。ビデオ録画デバイス202は、図1のビデオ録画デバイス104(2)とほぼ同じようにして構成されたものとすることができる。したがって、ビデオ録画デバイス202は通常、i.LINK(IEEE1394)またはFireWireディジタルインタフェースを使用して直接コンピュータに接続させることができる。ただし、図2のスタンドアロンなビデオ録画デバイス202は、このようなデバイスが一般に、取り込んだビデオシーケンスから、ビデオシーケンス全体をほぼ代表する視覚コンテンツを有するビデオサムネイルとして使用するのに適したビデオフレームを識別するように構成できること(コンピュータ102のように)を例示するものである。
例示的な実施形態
図3は、図1の環境100で実現することのできるコンピュータ102およびビデオ入力ソース104のブロック図表現である。コンピュータ102は、デスクトップPCやラップトップPCなどのPC(パーソナルコンピュータ)として実現される。ビデオ入力ソース104は、光ディスク104(1)として実現される。
PC102は、プロセッサ300、揮発性メモリ302(すなわちRAM)、および不揮発性メモリ304(例えばROM、ハードディスク、フロッピー(登録商標)ディスク、CD−ROMなど)を備える。不揮発性メモリ304は一般に、コンピュータ/プロセッサ可読命令、データ構造、プログラムモジュール、およびその他のデータの記憶域をPC102に提供する。PC102は通常、不揮発性メモリ304に記憶されてプロセッサ(CPU)300上で実行される様々なアプリケーションプログラム(アプリケーション)306を実装する。このようなアプリケーション306には、例えばワードプロセッサ、表計算、ブラウザ、マルチメディアプレーヤ、イラストレータ、コンピュータ援用設計ツールなどを実施するソフトウェアプログラムを含めることができる。PC102の例示的な一実装形態については、図13に関して後でより詳細に述べる。
アプリケーション306に加えて、PC102は、ビデオサムネイルアルゴリズム308も実装する。図3では、プロセッサ300上で実行可能な別個のスタンドアロンソフトウェアアプリケーションとして示してあるが、ビデオサムネイルアルゴリズム308は、より高次のアプリケーション306の一機能として実装してもよい。このようなアプリケーション306には、限定しないが通常、ブラウザ、ビデオソフトウェア編集製品、VCR制御システム、MPEGリッパアプリケーションなどを含めることができる。
一実施形態では、ビデオサムネイルアルゴリズム308は、ビデオ入力デバイス104(例えば光ディスク104(1))から受け取った、図4に示すビデオシーケンス400などのビデオコンテンツ310を分析し、ビデオシーケンス400から、ビデオシーケンス400全体のコンテンツをほぼ代表する突出したビデオサムネイルとしてビデオフレーム402を識別(すなわち抽出)するように構成されている。ビデオサムネイルを識別するための計算を実施するプロセスで、ビデオサムネイルアルゴリズム308は、サムネイルアルゴリズム情報312を生成および使用する。ビデオコンテンツ310およびサムネイルアルゴリズム情報312は不揮発性メモリ304中にあるものとして示すが、これらの全部または一部は、さらに揮発性メモリ302中にもある場合があることに留意されたい。
図4は、ビデオシーケンス400を示す高レベル図である。ビデオシーケンス400は、任意の数のフレーム402(N)(1からN)を表し、これらのフレームはビデオコンテンツ310の全長を表す。ビデオシーケンス400の下に、特定のビデオフレーム402(N−R)が示してあるが、このビデオフレームは、ビデオシーケンス400全体の突出したコンテンツを表すビデオサムネイルとしてビデオサムネイルアルゴリズム308(図3)によって選択されたビデオフレームを表す。
再び図3の実施形態を参照するが、ビデオサムネイルアルゴリズム308は、ビデオシーケンス400中の各フレームのフレーム良好度を計算することにより、ビデオサムネイルを決定する。フレーム良好度は、所与のビデオフレームがビデオシーケンス400全体の突出したコンテンツを視覚的に表す程度の尺度を表す。したがってフレーム良好度は、ビデオシーケンス400全体を表すためのビデオサムネイルとして最も代表的で視覚的に満足のいくビデオフレーム402を抽出する方法を表す。
ビデオフレーム402のフレーム良好度を計算するために、ビデオサムネイルアルゴリズム308はまず、ビデオフレームの色ヒストグラムに対して2つの計算(すなわちエントロピーおよび標準偏差)を行う。色ヒストグラムは、画像のピクセルの統計的表現を提供する重要かつ周知の画像分析ツールである。この統計的表現は、画像中にどの色ピクセルがあり、各色のピクセルが画像中にいくつあるかを示す。色ヒストグラムは棒グラフとして表すことができ、横軸上の各エントリは、そのピクセルが有する可能性のある色の1つである。
順番は必須ではないが、ビデオサムネイルアルゴリズム308がビデオフレームの色ヒストグラムに対して実施する第1の計算は、エントロピー計算である。エントロピーは、確率変数の不確定性の尺度である。離散確率変数をXとし、Xの可能な結果の集合をxとする。確率変数Xの確率質量関数(probability mass function)はp(x)である。したがって、Xのエントロピーは以下の式で定義される。
Figure 0004580183
色データポイント(ピクセル)の確率が一様分布しているとき、結果は不確定であり、エントロピーは最大である。より具体的には、カラー画像(すなわちビデオフレーム402)中に最大数の色値があり、これらの色が一様分布している場合は、画像のエントロピーは最大化される。このような画像は、最もカラフルな画像と考えられる。加えて、このような画像は通常、色のより少ない他の画像よりも優れた視覚効果を含む。
しかし、画像中の色データポイント(ピクセル)が非常に歪んだ確率質量関数を有するときは、結果は小さい結果集合に入る傾向があり、したがって結果はより確実であり(すなわち不確定性が低い)、エントロピーは低い。したがって、画像(すなわちビデオフレーム402)中に最小数の色値(例えば1色だけ)がある場合は、画像のエントロピーは最小化される。色値が1つしかないカラー画像の場合、画像ヒストグラムのエントロピーは0である。このような画像は通常、色のより多い他の画像よりも悪い視覚効果を含む。このように、ビデオフレーム402の色ヒストグラムのエントロピーは、フレーム良好性の尺度の第1部分として有用である。
やはり順番は必須ではないが、ビデオサムネイルアルゴリズム308がビデオフレームの色ヒストグラムに対して実施する第2の計算は、標準偏差計算である。色ヒストグラムの標準偏差は、画像ヒストグラム中の色の拡散の尺度であり、以下のように定義される。
Figure 0004580183
画像ヒストグラムの標準偏差は、画像の色範囲を示す。画像中の色値の範囲が広いほど、画像のコントラストは高い。より高いコントラストの画像は、人間の視覚系にとって、より低いコントラストの画像よりも視覚的に興味をひく傾向がある。このように、ビデオフレーム402の色ヒストグラムの標準偏差は、フレーム良好性の尺度の第2部分として有用である。
一般に、よりカラフルなビデオフレーム(すなわち色ヒストグラムのエントロピーがより高い)およびより高コントラストのビデオフレーム(すなわち色ヒストグラムの標準偏差がより高い)は、視覚的に好まれるフレームである。したがってフレーム良好度は、以下のように、ビデオフレームの色ヒストグラムのエントロピーと標準偏差との組合せとして定義することができる。
Figure 0004580183
さらに、式(5)を使用してフレーム良好性を計算する前に、「Entropy」と「SD」の両方を、式(6)を使用して[0,1]の範囲に正規化することに留意されたい。したがってフレーム良好度は、色ヒストグラムのエントロピーと標準偏差との重み付き組合せであり、それにより、望むならどちらかを強調することができる。
Gの値が大きいほど、ビデオフレームの視覚品質は優れている。したがって再び図4を参照すると、ビデオシーケンス400中の各フレームのフレーム良好度を計算することに加えて、ビデオサムネイルアルゴリズム308はまた、フレーム良好度を相互に比較して、どれが最大値かを決定する。次いでビデオサムネイルアルゴリズム308は、計算されたフレーム良好度が最高であるビデオフレーム(例えば402(N−R))を、ビデオシーケンス400のコンテンツを視覚的によく表すビデオサムネイルとして選択する。
上述のフレーム良好度を様々な方式で使用して、ビデオシーケンスに対する代表的なビデオサムネイルとしてビデオフレームを決定することができる。例えば、図4に関して上述したように、ビデオサムネイルアルゴリズム308の一実施形態では、ビデオシーケンス400中の各フレームのフレーム良好度を計算し、次いですべてのフレーム良好度を比較して、計算されたフレーム良好性の値が最も高いフレームを突き止めることによって、ビデオサムネイルを決定する。以下、フレーム良好度をビデオシーケンスに適用することに関する他の例を図5〜7に関して論じる。
別の実施形態では、ビデオサムネイルアルゴリズム308は、フレーム良好度を個々のビデオフレームに適用する前に、ビデオシーケンス500(図5)をセグメント化する。図5に示す一実施形態では、ビデオサムネイルアルゴリズム308は、ビデオシーケンスを時間的にセグメント化した後で、ビデオシーケンス500の特定セグメント内のビデオフレームにフレーム良好度を適用する。ビデオシーケンス500は、最初のビデオフレームセグメント502と、中間ビデオフレームセグメント504と、最後のビデオフレームセグメント506とに時間的にセグメント化されている。各セグメントは通常、そのセグメントの時間長に対応するいくつかのフレームを有する。例えば、1秒あたり30個のフレームを有するビデオシーケンスの10秒セグメントは、そのセグメント中に300個のフレームを有することになる。図5に示す時間的セグメント化は限定としてではなく例として示すものであることに留意されたい。したがって、任意の方式のビデオシーケンスセグメント化が可能であり、セグメント内の個々のビデオフレームにフレーム良好度を適用するのを容易にするために有用とすることができる。
フレーム良好度は、任意の時間的セグメント(例えば最初のビデオフレームセグメント502、中間ビデオフレームセグメント504、最後のビデオフレームセグメント506)中のビデオフレームに適用することができるが、図5では、ビデオサムネイルアルゴリズム308が最初のビデオフレームセグメント502からのビデオフレームにフレーム良好度を適用する場合を示す。この場合、ビデオサムネイルアルゴリズム308は、最初のビデオフレームセグメント502からのフレーム良好度を相互に比較して、最初のビデオフレームセグメント502に関連する局所的な最高フレーム良好度を決定する。最初のフレームセグメント502内で最高のフレーム良好度(すなわち局所的な最高)を有するものとして、ビデオフレーム508が図示されている。したがって、ビデオフレーム508を、ビデオシーケンス500を最もよく表すビデオサムネイルとして選択(すなわち抽出)する。ほとんどの場合、特定の時間的セグメント(例えば502、504、506)内のビデオフレームのフレーム良好度を計算し比較することによってビデオサムネイルの検索を特定の時間的セグメントに限定しても、得られるビデオサムネイル508の視覚品質は、ビデオシーケンス500全体にわたるすべてのフレームのフレーム良好度を計算し比較することによって普通なら得られるであろうビデオサムネイルの品質よりも大きく低下することはない。
別の実施形態では、ビデオサムネイルアルゴリズム308は、フレーム良好度を個々のビデオフレームに適用する前に、ビデオシーケンス600(図6)をビデオショットにセグメント化する。ビデオショットは、ビデオシーケンス中の切れ目のないフレームシーケンスまたはフレームセグメントであり、しばしばビデオの構成単位を定義する。例えば図6には、典型的なビデオショット602、604、606、608が示されており、それぞれはビデオシーケンス600からのいくつかのビデオフレームを含む。ビデオショット602、604、606、608は、ビデオシーケンス600を構成する。ビデオショットは、いずれかの特定のビデオコンテンツを表すことができる。ほとんどのビデオショットでは、ビデオコンテンツ中のしきい値偏差によって区別することのできる境界が定義されている。現在、ビデオサムネイルアルゴリズム308によって実施することのできる様々な効果的なショット境界検出技法が存在する。しかし、このような検出技法は一般に当業者には周知であり、したがってさらに詳細には論じない。
図6の実施形態では、ビデオサムネイルアルゴリズム308は一般に、各ビデオショット(例えば602、604、606、608)の局所的な最高フレーム良好度を決定し、次いで様々なビデオショットからの局所的な最高良好度を比較して、ビデオシーケンス600全体の大域的な最高良好度を決定する。大域的な最高良好度は、ビデオシーケンス600からのどのビデオフレームがビデオシーケンス600全体を視覚的に最も代表するかを示し、したがって、ビデオサムネイルアルゴリズム308がシーケンス600全体に対するビデオサムネイルとしてどのビデオフレームを選択(すなわち抽出)するかを示す。
図7に別の実施形態を示すが、この実施形態では、ビデオサムネイルアルゴリズム308は、ビデオフレーム700をブロック702に分割し、ビデオフレーム700内の各ブロック702の良好度を計算する。ビデオフレーム700の全体的な良好度は、最小値のブロック良好度として決定される。したがって、ビデオフレーム700中でブロック702(1)が最高のブロック良好度を有し、ブロック702(2)が最低のブロック良好度を有する場合、ビデオフレーム700の良好度は、最低値のブロック702(2)について計算された良好度として決定される。この技法は、個別のビデオフレーム700の良好度が常に、少なくともビデオフレーム700内のいずれかのブロック702の最低良好度と同じくらい良好であることを保証する。この技法は、上述の各実施形態に適用可能である。すなわち、上述の実施形態でフレーム良好度を決定するときは、ビデオフレーム中の複数のブロックから最低ブロック良好度を選択することに基づいて決定することができる。
ブロック良好度の計算は、上述のフレーム良好度の計算と概して同じである。上述のように、フレーム良好度は、所与のフレームについて、まずフレームの色ヒストグラムのエントロピーと、フレームの色ヒストグラムの標準偏差とを計算し、次いでエントロピーと標準偏差とを組み合わせることによって計算する。図7は、ビデオサムネイルアルゴリズム308がどのように所与のビデオフレーム700を複数のブロック702に分割し、次いでフレームの各ブロック702に対してエントロピー、標準偏差、および良好度の計算を実施するかを示している。次いでビデオサムネイルアルゴリズム308は、最小値のブロック良好度を、ビデオフレーム700の全体的なフレーム良好度として選択する。
図8は、図2の環境200で実現することのできるスタンドアロンなビデオ録画デバイス202のブロック図表現である。ビデオ録画デバイス202は、図1のビデオ録画デバイス104(2)とほぼ同じようにして構成されたものとすることができる。図8のブロック図表現は、図2のビデオ録画デバイス202が一般に、コンピュータ102に関して上述した方式で、ビデオサムネイルの視覚コンテンツがビデオシーケンス全体をほぼ代表するように、ビデオシーケンスからビデオサムネイルを識別するよう構成できること(コンピュータ102のように)を例示するものである。したがって、ビデオ録画デバイス202は、本開示のシステムおよび方法を実現することのできる別の例示的な環境である。
図8を参照すると、ビデオ録画デバイス202は一般に、プロセッサ(CPU)800、揮発性メモリ802(すなわちRAM)、および不揮発性メモリ804(例えばROM)を備える。ビデオ録画デバイス202はまた一般に、携帯記憶媒体機能(図示せず)、および/または、録画したビデオコンテンツを転送するのを可能にするためのi.LINK(IEEE1394)やFireWireディジタルインタフェースなどのディジタルインタフェース(図示せず)も備える。不揮発性メモリ804にはオペレーティングシステムソフトウェア806が記憶され、オペレーティングシステムソフトウェア806は、ビデオキャプチャコンポーネント808など、様々な機能およびビデオコンポーネントを制御するようにプロセッサ800上で実行可能である。ビデオキャプチャコンポーネント808は、集束レンズ(focusing lens)、電荷結合素子(CCD)、アナログディジタル変換器など、通常のビデオコンポーネントを備える。オペレーティングシステムソフトウェア806は一般に、ユーザ制御インタフェース810を介して入力されたユーザ入力に応答して、視覚情報を受け取ったり、この情報を電子信号に変換したり、これをビデオコンテンツ310として記憶したりする機能を実施する。ビューファインダ812は一般に、インタフェース810を介して制御されたビデオコンテンツ310およびその他の情報をユーザが見ることができるようにする。ビデオ録画デバイス202の一般的な動作および機能は周知である。
ビデオ録画デバイス202上のビデオサムネイルアルゴリズム308は、コンピュータ102に関して上述したのと同様の方式で機能するように構成されている。したがって、図4〜7に関する上述した説明は、ビデオ録画デバイス202にも等しく適用可能である。したがって、ビデオ録画デバイス202の通常の動作によってビデオコンテンツ310が録画されると、ビデオサムネイルアルゴリズム308は、録画されたビデオシーケンス(すなわちビデオファイル)を視覚的に代表するビデオサムネイルを決定するように動作する。計算およびその他のアルゴリズム情報は、サムネイルアルゴリズム情報312として一時的に記憶される。ビデオサムネイルアルゴリズム308によって生成されたビデオサムネイルは、ビューファインダ812を介して見る/閲覧することができ、ユーザ制御インタフェース810を介して操作することができる。
例示的な方法
次に、主に図9、10、11、12の流れ図を参照しながら、ビデオシーケンスを代表する突出したコンテンツリッチなビデオサムネイルを識別するための例示的な方法について述べる。これらの方法は一般に、図3〜8に関して上述した例示的な実施形態に適用される。述べる方法の要素は、例えば、プロセッサ可読媒体上に定義されたプロセッサ可読命令を実行することを含めて、任意の適切な手段で実施することができる。
本明細書では、「プロセッサ可読媒体」は、プロセッサによって使用または実行される命令を収録、記憶、通信、伝搬、または搬送することのできる任意の手段とすることができる。プロセッサ可読媒体は、限定しないが、電子、磁気、光学、電磁、赤外線、または半導体の、システム、装置、デバイス、または伝搬媒体とすることができる。プロセッサ可読媒体のより具体的な例としてはとりわけ、1つまたは複数のワイヤを有する電気接続、携帯コンピュータディスケット、ランダムアクセスメモリ(RAM)、読出し専用メモリ(ROM)、消去可能プログラム可能な読出し専用メモリ(EPROMまたはフラッシュメモリ)、光ファイバ、携帯コンパクトディスク読出し専用メモリ(CDROM)が含まれる。
図9に、ビデオシーケンス全体の突出したコンテンツを視覚的に表すビデオサムネイルを識別するための例示的な方法900を示す。ブロック902で、ビデオシーケンスからのビデオフレームに対して色ヒストグラムを計算する。ビデオシーケンスは、コンピュータが様々なビデオソース(例えば携帯記憶媒体、ネットワーク接続、ビデオカメラ)から受け取ったビデオコンテンツ、またはビデオ録画デバイスが録画したビデオコンテンツとすることができる。したがって、方法900で論じる計算は、コンピュータ、ビデオ録画デバイス、または任意の同様のデバイス上で実施することができる。ブロック904で、上述した式(1)および(2)に従って、色ヒストグラムのエントロピーを計算する。ブロック906で、上述した式(3)および(4)に従って、色ヒストグラムの標準偏差を計算する。ブロック908で、フレーム良好度を計算する。フレームのフレーム良好度は、上述した式(5)および(6)に従って、エントロピーと標準偏差との重み付き組合せとして計算する。
ブロック910で、ビデオシーケンス中の他のビデオフレームについて、同様に他のフレーム良好度を計算する。ブロック912で、計算されたすべてのフレーム良好度から、最高フレーム良好度を識別する。ブロック914で、最大値のフレーム良好度に対応するビデオフレームを、ビデオシーケンス全体の突出したコンテンツを視覚的に表すビデオサムネイルとして選択する。
図10に、ビデオシーケンス中のビデオフレームの良好度を計算するための代替方法1000を示す。ブロック1002で、ビデオフレームをさらに複数のブロックに分割する。ブロックの数は、例えば16×16のブロックグループがビデオフレームを構成するのを含めて、任意の適切な数とすることができる。ブロック1004で、ブロックグループ中の各ブロック良好度を計算する。ブロック良好度は、フレーム良好度に関して上述したのと同じ方式で(すなわち同じ式を使用して)計算するが、例外として、計算はビデオフレーム全体ではなくビデオフレームの一部だけに適用する。各ブロックの良好度を計算した後、ブロック1006に示すように最低ブロック良好度を決定する。ブロック1008で、最低ブロック良好度を、ビデオフレームの全体的な良好度として選択する。
図11に、ビデオシーケンス全体の突出したコンテンツを視覚的に表すビデオサムネイルを識別するための代替の例示的方法1100を示す。ブロック1102で、ビデオシーケンスを時間的にセグメント化する。ビデオシーケンスは任意の基準で時間的にセグメント化することができ、例えば、最初、中間、最後のセグメントにセグメント化することができる。ブロック1104で、ビデオシーケンスの特定セグメント内のフレームについてフレーム良好度を計算する。良好度は、上述したように、フレームのヒストグラムエントロピーおよびヒストグラム標準偏差に基づいて計算される。ブロック1106で、特定セグメントの局所的な最高良好度を決定する。ブロック1108で、局所的な最高良好度に関連するフレームとして、ビデオサムネイルを選択する。
図12に、ビデオシーケンス全体の突出したコンテンツを視覚的に表すビデオサムネイルを識別するための別の代替の例示的方法1200を示す。ブロック1202で、ビデオシーケンスをビデオショットにセグメント化する。ブロック1204で、第1のビデオショット内のビデオフレームに対して色ヒストグラムを計算する。ブロック1206で、上述した式(1)および(2)に従って、色ヒストグラムのエントロピーを計算する。ブロック1208で、上述した式(3)および(4)に従って、色ヒストグラムの標準偏差を計算する。ブロック1210で、フレーム良好度を計算する。フレームのフレーム良好度は、上述した式(5)および(6)に従って、エントロピーと標準偏差との重み付き組合せとして計算する。
方法1200のブロック1212で、第1のビデオショット内の他のビデオフレームについて、他のフレーム良好度を計算する。次いでブロック1214で、第1のビデオショットの局所的な最高良好度を決定する。ブロック1216で、第1のビデオショットと同様にして、他のビデオショットについても他の局所的な最高フレーム良好度を計算する。ブロック1218で、局所的な最高フレーム良好度が最高値であるビデオフレームを、ビデオシーケンス全体の突出したコンテンツを視覚的に表すビデオサムネイルフレームとして選択する。
1つまたは複数の方法を、流れ図と、流れ図のブロックに関連するテキストとによって開示したが、これらのブロックは必ずしも提示したとおりの順番で実施する必要はなく、他の順番でも同様の利点をもたらすことを理解されたい。さらに、これらの方法は排他的ではなく、単独でまたは相互に組み合わせて実施することができる。
例示的なコンピュータ
図13に、コンピュータ102を実現するのに使用することのできる適したコンピューティング環境1300の例を示す。以下の考察から明白になるであろうが、コンピュータ102は任意の種類の汎用または専用コンピューティングプラットフォームを表すものであり、これは、ビデオサムネイルアルゴリズム308が備わったとき、図3に関して上述した第1の例示的な実施形態に従って、開示している本教示を実施する。図3のコンテキストでは、ビデオサムネイルアルゴリズム308をソフトウェアアプリケーションとして示しているが、コンピュータ102は別法として、ビデオサムネイルアルゴリズム308のハードウェア実装をサポートすることもできることを理解されたい。これに関し、ビデオサムネイルアルゴリズム308の記述を別にすれば、コンピュータ102に関する以下の記述は単に例示であり、より多いまたは少ない機能のコンピュータを適切に代用することもできる。
例えばコンピュータ102は、コンピュータ、パーソナルコンピュータ、サーバコンピュータ、ハンドヘルドデバイスまたはラップトップデバイス、携帯通信デバイス、マルチプロセッサシステム、マイクロプロセッサシステム、マイクロプロセッサベースのシステム、消費者電子デバイス、VCR、ビデオメディアプレーヤ、ビデオオンデマンドデバイス、およびその他の関連デバイスなど、ビデオ視聴が可能な任意のビデオ監視デバイスとして実現することができる。
コンピューティング環境1300は、コンピュータ1302の形の汎用コンピューティングシステムを含む。コンピュータ1302のコンポーネントには、限定しないが、1つまたは複数のプロセッサまたは処理ユニット1304と、システムメモリ1306と、プロセッサ1304を含めた様々なシステムコンポーネントをシステムメモリ1306に結合するシステムバス1308とを含めることができる。
システムバス1308は、様々なバスアーキテクチャのいずれかを用いた、メモリバスまたはメモリコントローラ、周辺バス、AGP(accelerated graphics port)、プロセッサバスまたはローカルバスを含めて、いくつかのタイプのバス構造の任意の1つまたは複数を表す。例えばこのようなアーキテクチャには、ISA(Industry Standard Architecture)バス、MCA(Micro Channel Architecture)バス、EISA(Enhanced ISA)バス、VESA(Video Electronics Standards Association)ローカルバス、およびメザニンバスとも呼ばれるPCI(Peripheral Component Interconnects)バスを含めることができる。
コンピュータ1302は通常、様々なコンピュータ可読媒体を備える。このような媒体は、コンピュータ1302からアクセス可能な任意の利用可能な媒体とすることができ、揮発性と不揮発性との、取外し可能と取外し不可能との両方の媒体が含まれる。システムメモリ1306は、ランダムアクセスメモリ(RAM)1310などの揮発性メモリ、および/または、読出し専用メモリ(ROM)1312などの不揮発性メモリの形のコンピュータ可読媒体を含む。ROM1312には、起動中などにコンピュータ1302内の要素間で情報を転送するのを助ける基本ルーチンを含むBIOS(basic input/output system)1314が記憶されている。RAM1310は通常、処理ユニット1304がすぐにアクセス可能な、かつ/または処理ユニット1304が現在作用している、データおよび/またはプログラムモジュールを含む。
コンピュータ1302は、その他の取外し可能/取外し不可能、揮発性/不揮発性コンピュータ記憶媒体を備えることもできる。例えば図13には、取外し不可能かつ不揮発性の磁気媒体(図示せず)に対して読み書きするためのハードディスクドライブ1316と、取外し可能かつ不揮発性の磁気ディスク1320(例えば「フロッピー(登録商標)ディスク」)に対して読み書きするための磁気ディスクドライブ1318と、CD−ROMやDVD−ROMやその他の光媒体など取外し可能かつ不揮発性の光ディスク1324に対して読み書きするための光ディスクドライブ1322を示す。ハードディスクドライブ1316、磁気ディスクドライブ1318、および光ディスクドライブ1322はそれぞれ、1つまたは複数のデータ媒体インタフェース1326によってシステムバス1308に接続される。あるいは、ハードディスクドライブ1316、磁気ディスクドライブ1318、および光ディスクドライブ1322は、SCSIインタフェース(図示せず)によってシステムバス1308に接続されてもよい。
各ディスクドライブおよびそれらに関連するコンピュータ可読媒体は、コンピュータ可読命令、データ構造、プログラムモジュール、およびその他のデータの不揮発性記憶域をコンピュータ1302に提供する。この例では、ハードディスク1316が有する磁気媒体、取外し可能な磁気ディスク1320、および取外し可能な光ディスク1324が示してあるが、磁気カセットまたは他の磁気記憶デバイス、フラッシュメモリカード、CD−ROM、ディジタル多用途ディスク(DVD)または他の光記憶装置、ランダムアクセスメモリ(RAM)、読出し専用メモリ(ROM)、電気的消去可能プログラム可能な読出し専用メモリ(EEPROM)など、コンピュータからアクセス可能なデータを記憶することのできる他のタイプのコンピュータ可読媒体も、この例示的なコンピューティングシステムおよび環境を実現するのに利用することができることを理解されたい。
ハードディスク1316が有する磁気媒体、磁気ディスク1320、光ディスク1324、ROM1312、および/またはRAM1310には、任意の数のプログラムモジュールを記憶することができる。例えばこれらには、オペレーティングシステム1326、1つまたは複数のアプリケーションプログラム1328、その他のプログラムモジュール1330、およびプログラムデータ1332が含まれる。このようなオペレーティングシステム1326、1つまたは複数のアプリケーションプログラム1328、その他のプログラムモジュール1330、およびプログラムデータ1332(またはこれらの何らかの組合せ)はそれぞれ、ユーザネットワークアクセス情報のためのキャッシュ方式の一実施形態を含むものとすることができる。
コンピュータ1302は、通信媒体として識別される様々なコンピュータ/プロセッサ可読媒体を備えることができる。通信媒体は通常、搬送波やその他のトランスポート機構などの変調データ信号中に、コンピュータ可読命令、データ構造、プログラムモジュール、またはその他のデータを組み入れたものであり、任意の情報送達媒体が含まれる。「変調データ信号」という語は、情報が信号中に符号化される形で1つまたは複数の特性が設定または変更される信号を意味する。限定ではなく例として、通信媒体には、配線式ネットワークや直接配線式接続などの配線式媒体と、音響、無線周波、赤外線、その他の無線媒体などの無線媒体とが含まれる。以上の任意の組合せもコンピュータ可読媒体の範囲に含めるべきである。
ユーザは、キーボード1334やポインティングデバイス1336(例えば「マウス」)などの入力デバイスを介して、コンピュータシステム1302にコマンドおよび情報を入力することができる。その他の入力デバイス1338(具体的には図示せず)には、マイクロホン、ジョイスティック、ゲームパッド、衛星受信アンテナ、シリアルポート、スキャナ、および/またはその他を含めることができる。これらおよび他の入力デバイスは、システムバス1308に結合された入出力インタフェース1340を介して処理ユニット1304に接続されるが、パラレルポート、ゲームポート、ユニバーサルシリアルバス(USB)など、他のインタフェースおよびバス構造で接続されてもよい。
モニタ1342または他のタイプの表示デバイスも、ビデオアダプタ1344などのインタフェースを介してシステムバス1308に接続することができる。モニタ1342に加えて、その他の出力周辺デバイスには、スピーカ(図示せず)やプリンタ1346などのコンポーネントを含めることができ、これらは入出力インタフェース1340を介してコンピュータ1302に接続することができる。
コンピュータ1302は、リモートコンピューティングデバイス1348など1つまたは複数のリモートコンピュータへの論理接続を用いて、ネットワーク化された環境で動作することができる。例えば、リモートコンピューティングデバイス1348は、パーソナルコンピュータ、携帯コンピュータ、サーバ、ルータ、ネットワークコンピュータ、ピアデバイス、またはその他の一般的なネットワークノードなどとすることができる。リモートコンピューティングデバイス1348は、コンピュータシステム1302に関して本明細書に述べた要素および機能の多くまたはすべてを備えることのできる携帯コンピュータとして示す。
コンピュータ1302とリモートコンピュータ1348との間の論理接続を、ローカルエリアネットワーク(LAN)1350および一般的なワイドエリアネットワーク(WAN)1352として示す。このようなネットワーキング環境は、オフィス、企業全体のコンピュータネットワーク、イントラネット、およびインターネットでよくみられるものである。コンピュータ1302は、LANネットワーキング環境で実現されるときは、ネットワークインタフェースまたはアダプタ1354を介してローカルエリアネットワーク1350に接続される。WANネットワーキング環境で実現されるとき、コンピュータ1302は通常、ワイドエリアネットワーク1352を介した通信を確立するためのモデム1356または他の手段を備える。モデム1356は、コンピュータ1302に内蔵でも外付けでもよく、入出力インタフェース1340または他の適切な機構を介してシステムバス1308に接続することができる。図示のネットワーク接続は例示的なものであり、コンピュータ1302と1348との間に通信リンクを確立する他の手段を採用することもできることを理解されたい。
コンピューティング環境1300で示すようなネットワーク化された環境では、コンピュータ1302に関して示すプログラムモジュールまたはその一部を、リモートのメモリ記憶デバイスに記憶することができる。例えば、リモートアプリケーションプログラム1358が、リモートコンピュータ1348のメモリデバイス上にある。アプリケーションプログラム、およびオペレーティングシステムなどその他の実行可能プログラムコンポーネントは、ここでは説明のために個別のブロックとして示してある。ただし、このようなプログラムおよびコンポーネントは、様々な時点でコンピュータシステム1302の種々の記憶コンポーネント中にあり、コンピュータのデータプロセッサによって実行されることを理解されたい。
結び
本発明を構造上の特徴および/または方法上の動作に特定の言葉で述べたが、添付の特許請求の範囲に定義する本発明は、述べた具体的な特徴または動作に必ずしも限定されないことを理解されたい。そうではなく、これらの具体的な特徴および動作は、特許請求される本発明を実施する例示的な形として開示するものである。
ビデオファイルに対するビデオサムネイルを識別するのに適した例示的な環境を示す図である。 ビデオファイルに対するビデオサムネイルを識別するのに適した例示的な環境を示す図である。 図1の環境で実現することのできるコンピュータおよびビデオ入力ソースのブロック図である。 ビデオシーケンスの高レベル図である。 フレーム良好度を適用する前にビデオシーケンスを時間的にセグメント化するビデオサムネイルアルゴリズムの一実施形態を示す図である。 ビデオシーケンスからの多数のビデオフレームをそれぞれが含む典型的なビデオショットを示す図である。 ブロックに分割されたビデオフレームを示す図である。 図2の環境で実現することのできるスタンドアロンなビデオ録画デバイスのブロック図である。 ビデオシーケンスを代表する突出したコンテンツリッチなビデオサムネイルを識別するための例示的な方法を示す流れ図である。 ビデオシーケンスを代表する突出したコンテンツリッチなビデオサムネイルを識別するための例示的な方法を示す流れ図である。 ビデオシーケンスを代表する突出したコンテンツリッチなビデオサムネイルを識別するための例示的な方法を示す流れ図である。 ビデオシーケンスを代表する突出したコンテンツリッチなビデオサムネイルを識別するための例示的な方法を示す流れ図である。 コンピュータを実現するのに使用することのできる適したコンピューティング環境の例を示す図である。
符号の説明
102 コンピュータ
104 ビデオ入力ソース
104(1) 携帯記憶媒体
104(2) ビデオ録画デバイス
104(3) ネットワーク
202 スタンドアロンビデオ録画デバイス
300 CPU
302 揮発性メモリ
304 不揮発性メモリ
306 アプリケーションプログラム
308 ビデオサムネイルアルゴリズム
310 ビデオコンテンツ
312 サムネイルアルゴリズム情報
400 ビデオシーケンス
402(N) ビデオフレーム
402(N−R) ビデオフレーム
500 ビデオシーケンス
502 最初のビデオフレームセグメント
504 中間ビデオフレームセグメント
506 最後のビデオフレームセグメント
508 ビデオフレーム
600 ビデオシーケンス
602 ビデオショット1
604 ビデオショット2
606 ビデオショット3
608 ビデオショットN
700 ビデオフレーム
702 ブロック
702(1) ブロック
702(2) ブロック
800 CPU
802 揮発性メモリ
804 不揮発性メモリ
806 オペレーティングシステムソフトウェア
808 ビデオキャプチャコンポーネント
810 ユーザ制御インタフェース
812 ビューファインダ
1300 適したコンピューティング環境
1302 コンピュータ
1304 処理ユニット
1306 システムメモリ
1308 システムバス
1310 ランダムアクセスメモリ(RAM)
1312 読出し専用メモリ(ROM)
1314 BIOS
1316 ハードディスクドライブ
1318 磁気ディスクドライブ
1320 磁気ディスク
1322 光ディスクドライブ
1324 光ディスク
1326 オペレーティングシステム
1326 データ媒体インタフェース
1328 アプリケーションプログラム
1330 その他のプログラムモジュール
1332 プログラムデータ
1334 キーボード
1336 ポインティングデバイス
1338 その他のデバイス
1340 入出力インタフェース
1342 モニタ
1344 ビデオアダプタ
1346 プリンタ
1348 リモートコンピューティングデバイス
1350 ローカルエリアネットワーク(LAN)
1352 ワイドエリアネットワーク(WAN)
1354 ネットワークインタフェースまたはアダプタ
1356 モデム
1358 リモートアプリケーションプログラム

Claims (27)

  1. プロセッサによって実行可能なコンピュータプログラム命令を含むタンジブルコンピュータ可読記録媒体であって、
    前記コンピュータプログラム命令は、プロセッサに、
    ビデオシーケンスを受け取ること、
    ヒストグラムエントロピーおよびヒストグラム標準偏差から前記ビデオシーケンス内のフレームのフレーム良好度を計算すること、および
    ユーザがビデオデータを閲覧するために、前記フレーム良好度に基づいた視覚的に表すサムネイルをユーザに表示することを実現させるプログラムであり、
    前記フレーム良好度を計算するためのコンピュータプログラム命令は、プロセッサに、
    色ヒストグラムを計算すること、
    前記色ヒストグラムのエントロピーを計算すること、
    前記色ヒストグラムの標準偏差を計算すること、および
    前記エントロピーと前記標準偏差との重み付き組合せとして前記良好度を計算するための命令を含むことを特徴とするコンピュータ可読記録媒体。
  2. 前記フレーム良好度から最高良好度を決定することを実施するように構成されたプロセッサ実行可能命令をさらに含むことを特徴とする請求項1に記載のコンピュータ可読記録媒体。
  3. 前記コンピュータプログラム命令は、前記最高良好度に対応するフレームからビデオサムネイルを生成するための命令をさらに含むことを特徴とする請求項2に記載のコンピュータ可読記録媒体。
  4. プロセッサによって実行可能なコンピュータプログラム命令を含むタンジブルコンピュータ可読記録媒体であって、
    前記コンピュータプログラム命令は、プロセッサに、
    ビデオシーケンスを受け取ること、
    ヒストグラムエントロピーおよびヒストグラム標準偏差から前記ビデオシーケンス内のフレームのフレーム良好度を計算すること、および
    ユーザがビデオデータを閲覧するために、前記フレーム良好度に基づいた視覚的に表すサムネイルをユーザに表示することを実現させるプログラムであり、
    前記フレーム良好度を計算するためのコンピュータプログラム命令は、
    フレームをさらに複数のブロックに分割すること、
    各ブロックの色ヒストグラムを計算すること、
    前記色ヒストグラムのエントロピーを計算すること、
    前記色ヒストグラムの標準偏差を計算すること、
    前記エントロピーと前記標準偏差との重み付き組合せとして各ブロックのブロック良好度を計算すること、
    計算した各ブロックのブロック良好度から最低ブロック良好度を決定すること、および
    前記最低ブロック良好度を前記フレームのフレーム良好度として選択するための命令を含むことを特徴とするコンピュータ可読記録媒体。
  5. プロセッサによって実行可能なコンピュータプログラム命令を含むタンジブルコンピュータ可読記録媒体であって、
    前記コンピュータプログラム命令は、プロセッサに、
    ビデオシーケンスを時間的にセグメント化すること、
    前記セグメント化したビデオシーケンス中の特定の時間的セグメント内の複数のビデオフレームの色ヒストグラムをそれぞれ計算すること、
    前記各色ヒストグラムのエントロピーをそれぞれ計算すること、
    前記各色ヒストグラムの標準偏差をそれぞれ計算すること、
    前記エントロピーと前記標準偏差との重み付き組合わせとしてフレーム良好度を各ビデオフレーム毎に計算すること
    前記計算した各ビデオフレームのフレーム良好度から最のフレーム良好度を選択すること、および
    ユーザがビデオデータを閲覧するために、前記選択された最高のフレーム良好度に基づいた視覚的に表すサムネイルをユーザに表示することを実現させるプログラムであることを特徴とするコンピュータ可読記録媒体。
  6. 前記コンピュータプログラム命令は、前記選択された最高のフレーム良好度に関連するフレームからビデオサムネイルを生成するための命令をさらに含むことを特徴とする請求項5に記載のコンピュータ可読記録媒体。
  7. フレーム良好度は前記特定の時間的セグメント内のn番目のフレームごとに計算され、nは1以上であることを特徴とする請求項に記載のコンピュータ可読記録媒体。
  8. 各フレーム良好度はヒストグラムエントロピーとヒストグラム標準偏差との重み付き組合せであることを特徴とする請求項に記載のコンピュータ可読記録媒体。
  9. 前記特定の時間的セグメントは、
    前記ビデオシーケンスの最初の時間的セグメントと、
    前記ビデオシーケンスの中間の時間的セグメントと、
    前記ビデオシーケンスの最後の時間的セグメントとから選択されることを特徴とする請求項5に記載のコンピュータ可読記録媒体。
  10. プロセッサによって実行可能なコンピュータプログラム命令を含むタンジブルコンピュータ可読記録媒体であって、
    前記コンピュータプログラム命令は、プロセッサに、
    ビデオシーケンスを複数のビデオショットにセグメント化すること、
    第1のビデオショット中のビデオフレームの色ヒストグラムを計算すること、
    前記色ヒストグラムのエントロピーを計算すること、
    前記色ヒストグラムの標準偏差を計算すること、
    前記エントロピーと前記標準偏差との重み付き組合せとしてフレーム良好度を計算すること、および
    ユーザがビデオデータを閲覧するために、前記フレーム良好度に基づいた視覚的に表すサムネイルをユーザに表示することを実現させるプログラムであることを特徴とするコンピュータ可読記録媒体。
  11. 前記コンピュータプログラム命令は、
    前記第1のビデオショット中の他のビデオフレームについて他のフレーム良好度を計算すること、および
    フレーム良好度を比較することによって前記第1のビデオショットの局所的な最高フレーム良好度を決定することを実施するための命令をさらに含むことを特徴とする請求項1に記載のコンピュータ可読記録媒体。
  12. 前記コンピュータプログラム命令は、
    前記ビデオシーケンス中の他のビデオショットについて他の局所的な最高フレーム良好度を計算すること、および
    局所的な最高フレーム良好度を比較することによって前記ビデオシーケンスに対するサムネイルビデオフレームを決定するための命令をさらに含むことを特徴とする請求項1に記載のコンピュータ可読記録媒体。
  13. 前記決定するためのコンピュータプログラム命令はさらに、
    最大値の局所的最高フレーム良好度を識別すること、および
    前記最大値の局所的最高フレーム良好度に対応するビデオフレームを前記サムネイルビデオフレームとして選択するための命令を含むことを特徴とする請求項1に記載のコンピュータ可読記録媒体。
  14. プロセッサによって実行可能なコンピュータプログラム命令を含むタンジブルコンピュータ可読記録媒体であって、
    前記コンピュータプログラム命令は、プロセッサに、
    ビデオシーケンスを複数のショットにセグメント化すること、
    前記複数のショットのそれぞれからフレームを選択すること、
    選択された各フレームごとに、色ヒストグラムを計算すること、
    前記各色ヒストグラムのエントロピーをそれぞれ計算すること、
    前記各色ヒストグラムの標準偏差をそれぞれ計算すること、
    前記エントロピーと前記標準偏差との重み付き組合せとしてフレーム良好度を前記選択したフレーム毎に計算すること、および
    前記フレーム良好度に応じて、前記選択されたフレームからサムネイルフレームを決定することを実現させるプログラムであり、
    前記サムネイルフレームは、ユーザがビデオデータを閲覧するのを容易にさせるための、ユーザへの表示であることを特徴とするコンピュータ可読記録媒体。
  15. 前記決定するためのコンピュータプログラム命令はさらに、
    前記フレーム良好度から最高フレーム良好度を識別すること、および
    前記最高フレーム良好度に関連するフレームとして前記サムネイルフレームを決定するための命令をさらに含むことを特徴とする請求項1に記載のコンピュータ可読記録媒体。
  16. 前記セグメント化するためのコンピュータプログラム命令はさらに、ショット境界検出を実施するための命令を含むことを特徴とする請求項1に記載のコンピュータ可読記録媒体。
  17. ビデオシーケンス中のビデオフレームの色ヒストグラムを計算すること、
    前記色ヒストグラムのエントロピーを計算すること、
    前記色ヒストグラムの標準偏差を計算すること、および
    前記エントロピーと前記標準偏差との重み付き組合せとしてフレーム良好度を計算すること、および
    ユーザがビデオデータを閲覧するために、前記フレーム良好度に基づいた視覚的に表すサムネイルをユーザに表示すること
    を含むことを特徴とするコンピュータで実施される方法。
  18. 前記ビデオシーケンス中の他のビデオフレームについて他のフレーム良好度を計算すること、および
    フレーム良好度を比較することによって前記ビデオシーケンスに対するサムネイルビデオフレームを決定することをさらに含むことを特徴とする請求項17に記載の方法。
  19. 前記決定することはさらに、
    最高フレーム良好度を識別すること、および
    前記最高フレーム良好度に対応するビデオフレームを前記サムネイルビデオフレームとして選択することを含むことを特徴とする請求項18に記載の方法。
  20. ビデオシーケンスを時間的にセグメント化すること、
    前記セグメント化したビデオシーケンス中の特定の時間的セグメント内の複数のビデオフレームの色ヒストグラムをそれぞれ計算すること、
    前記各色ヒストグラムのエントロピーをそれぞれ計算すること、
    前記各色ヒストグラムの標準偏差をそれぞれ計算すること、
    前記エントロピーと前記標準偏差との重み付き組合せとしてフレーム良好度を各ビデオフレーム毎に計算すること、
    前記計算した各ビデオフレームのフレーム良好度から最のフレーム良好度を選択すること、および
    ユーザがビデオデータを閲覧するために、前記選択した最高のフレーム良好度に基づいた視覚的に表すサムネイルをユーザに表示すること
    を含むことを特徴とするコンピュータで実施される方法。
  21. 前記選択した最高のフレーム良好度に関連するフレームからビデオサムネイルを生成することをさらに含むことを特徴とする請求項2に記載の方法。
  22. ビデオシーケンスを複数のショットにセグメント化すること、
    前記複数のショットのそれぞれからフレームを選択すること、
    選択された各フレームごとに、色ヒストグラムを計算すること、
    前記各色ヒストグラムのエントロピーをそれぞれ計算すること、
    前記各色ヒストグラムの標準偏差をそれぞれ計算すること、
    前記エントロピーと前記標準偏差との重み付き組合せとしてフレーム良好度を前記選択したフレーム毎に計算すること、
    前記フレーム良好度に応じて、前記選択されたフレームからサムネイルフレームを決定すること、および
    前記ユーザがビデオデータを閲覧するための前記サムネイルフレームを表示することを含むことを特徴とするコンピュータで実施される方法。
  23. 前記決定することはさらに、
    前記フレーム良好度から最高フレーム良好度を識別すること、および
    前記最高フレーム良好度に関連するフレームとして前記サムネイルフレームを決定することを含むことを特徴とする請求項22に記載の方法。
  24. ビデオシーケンス中のビデオフレームの色ヒストグラムを計算する手段と、
    前記色ヒストグラムのエントロピーを計算する手段と、
    前記色ヒストグラムの標準偏差を計算する手段と、
    前記エントロピーと前記標準偏差との重み付き組合せとしてフレーム良好度を計算する手段と、
    ユーザがビデオデータを閲覧するために、前記フレーム良好度に基づいた視覚的に表すサムネイルをユーザに表示する手段と
    を備えることを特徴とするビデオ録画デバイス。
  25. ビデオシーケンス中のビデオフレームの色ヒストグラムを計算する手段と、
    前記色ヒストグラムのエントロピーを計算する手段と、
    前記色ヒストグラムの標準偏差を計算する手段と、
    前記エントロピーと前記標準偏差との重み付き組合せとしてフレーム良好度を計算する手段と、
    ユーザがビデオデータを閲覧するために、前記フレーム良好度に基づいた視覚的に表すサムネイルをユーザに表示する手段と
    を備えることを特徴とするコンピュータ。
  26. ビデオシーケンスを時間的にセグメント化する手段と、
    前記セグメント化したビデオシーケンス中の特定の時間的セグメント内の複数のビデオフレームの色ヒストグラムをそれぞれ計算する手段と、
    前記各色ヒストグラムのエントロピーをそれぞれ計算する手段と、
    前記各色ヒストグラムの標準偏差をそれぞれ計算する手段と、
    前記エントロピーと前記標準偏差との重み付き組合せとしてフレーム良好度を各ビデオフレーム毎に計算する手段と、
    前記計算した各ビデオフレームのフレーム良好度から最高のフレーム良好度を選択する手段と、
    ユーザがビデオデータを閲覧するために、前記選択した最高のフレーム良好度に基づいた視覚的に表すサムネイルをユーザに表示する手段と
    を備えることを特徴とするコンピュータ。
  27. ビデオシーケンスを複数のショットにセグメント化する手段と、
    前記複数のショットのそれぞれからフレームを選択する手段と、
    選択された各フレームごとに、色ヒストグラムを計算する手段と、
    前記各色ヒストグラムのエントロピーをそれぞれ計算する手段と、
    前記各色ヒストグラムの標準偏差をそれぞれ計算する手段と、
    前記エントロピーと前記標準偏差との重み付き組合せとしてフレーム良好度を前記選択したフレーム毎に計算する手段と、
    前記フレーム良好度に応じて、前記選択されたフレームからサムネイルフレームを決定する手段と、
    前記ユーザがビデオデータを閲覧するための前記サムネイルフレームを表示する手段と
    を備えることを特徴とするコンピュータ。
JP2004109416A 2003-04-01 2004-04-01 視覚的に代表するビデオサムネイルの生成 Expired - Fee Related JP4580183B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US10/405,971 US7212666B2 (en) 2003-04-01 2003-04-01 Generating visually representative video thumbnails

Publications (3)

Publication Number Publication Date
JP2005328105A JP2005328105A (ja) 2005-11-24
JP2005328105A5 JP2005328105A5 (ja) 2007-05-24
JP4580183B2 true JP4580183B2 (ja) 2010-11-10

Family

ID=32850631

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004109416A Expired - Fee Related JP4580183B2 (ja) 2003-04-01 2004-04-01 視覚的に代表するビデオサムネイルの生成

Country Status (5)

Country Link
US (1) US7212666B2 (ja)
EP (1) EP1465196B1 (ja)
JP (1) JP4580183B2 (ja)
KR (1) KR101015365B1 (ja)
CN (1) CN1538351B (ja)

Families Citing this family (61)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050058431A1 (en) * 2003-09-12 2005-03-17 Charles Jia Generating animated image file from video data file frames
JP4230402B2 (ja) * 2004-03-31 2009-02-25 パイオニア株式会社 サムネイル画像抽出方法、装置、プログラム
JP4438994B2 (ja) * 2004-09-30 2010-03-24 ソニー株式会社 動画像データの編集装置および動画像データの編集方法
KR101114110B1 (ko) * 2005-02-01 2012-02-21 엘지전자 주식회사 압축률을 이용한 애니메이션 파일의 썸네일 생성 방법
JP4588642B2 (ja) * 2005-03-15 2010-12-01 富士フイルム株式会社 アルバム作成装置、アルバム作成方法、及びプログラム
US8787967B2 (en) 2005-08-23 2014-07-22 Sony Corporation Communication terminals with pull-based digital information distribution capability and pull-based methods for digital information distribution
GB2432064B (en) * 2005-10-31 2011-01-19 Hewlett Packard Development Co Method of triggering a detector to detect a moving feature within a video stream
US8032840B2 (en) 2006-01-10 2011-10-04 Nokia Corporation Apparatus, method and computer program product for generating a thumbnail representation of a video sequence
US8316081B2 (en) 2006-04-13 2012-11-20 Domingo Enterprises, Llc Portable media player enabled to obtain previews of a user's media collection
US7603434B2 (en) * 2006-04-13 2009-10-13 Domingo Enterprises, Llc Central system providing previews of a user's media collection to a portable media player
US20070245378A1 (en) * 2006-04-13 2007-10-18 Concert Technology Corporation User system providing previews to an associated portable media player
KR100706404B1 (ko) * 2006-05-12 2007-04-10 주식회사 팬택 이동 통신 단말기에서 동영상 파일 관리 방법
US9142253B2 (en) * 2006-12-22 2015-09-22 Apple Inc. Associating keywords to media
US20080288869A1 (en) * 2006-12-22 2008-11-20 Apple Inc. Boolean Search User Interface
US8276098B2 (en) 2006-12-22 2012-09-25 Apple Inc. Interactive image thumbnails
KR20080065044A (ko) * 2007-01-08 2008-07-11 삼성전자주식회사 썸네일 생성 장치 및 방법
US8671346B2 (en) * 2007-02-09 2014-03-11 Microsoft Corporation Smart video thumbnail
US20090158157A1 (en) * 2007-12-14 2009-06-18 Microsoft Corporation Previewing recorded programs using thumbnails
KR101071015B1 (ko) * 2007-12-27 2011-10-06 삼성메디슨 주식회사 초음파 진단 장치 및 영상 디스플레이 방법
KR100916854B1 (ko) * 2008-01-29 2009-09-14 주식회사 다음커뮤니케이션 썸네일 생성 시스템 및 생성 방법
KR100911059B1 (ko) * 2008-01-29 2009-08-06 주식회사 다음커뮤니케이션 썸네일 생성 시스템 및 생성 방법
KR100917926B1 (ko) * 2008-01-29 2009-09-16 주식회사 다음커뮤니케이션 썸네일 생성 시스템 및 생성 방법
US8422731B2 (en) * 2008-09-10 2013-04-16 Yahoo! Inc. System, method, and apparatus for video fingerprinting
JP2011130279A (ja) * 2009-12-18 2011-06-30 Sony Corp コンテンツ提供サーバ、コンテンツ再生装置、コンテンツ提供方法、コンテンツ再生方法、プログラムおよびコンテンツ提供システム
US8988458B2 (en) * 2010-04-13 2015-03-24 At&T Intellectual Property I, L.P. System and method for generating media thumbscapes
FR2959037A1 (fr) * 2010-04-14 2011-10-21 Orange Vallee Procede de creation d'une sequence media par groupes coherents de fichiers medias
US8605221B2 (en) * 2010-05-25 2013-12-10 Intellectual Ventures Fund 83 Llc Determining key video snippets using selection criteria to form a video summary
US8786597B2 (en) 2010-06-30 2014-07-22 International Business Machines Corporation Management of a history of a meeting
WO2012014129A2 (en) * 2010-07-26 2012-02-02 Koninklijke Philips Electronics N.V. Determining representative images for a video
EP2416320B1 (en) * 2010-08-03 2014-03-12 BlackBerry Limited Representing video content
US9171578B2 (en) * 2010-08-06 2015-10-27 Futurewei Technologies, Inc. Video skimming methods and systems
US8798400B2 (en) * 2010-10-21 2014-08-05 International Business Machines Corporation Using near-duplicate video frames to analyze, classify, track, and visualize evolution and fitness of videos
US8687941B2 (en) 2010-10-29 2014-04-01 International Business Machines Corporation Automatic static video summarization
US8971651B2 (en) 2010-11-08 2015-03-03 Sony Corporation Videolens media engine
US8938393B2 (en) 2011-06-28 2015-01-20 Sony Corporation Extended videolens media engine for audio recognition
CN102332001B (zh) * 2011-07-26 2013-06-26 深圳万兴信息科技股份有限公司 一种视频缩略图生成方法及装置
US11314405B2 (en) * 2011-10-14 2022-04-26 Autodesk, Inc. Real-time scrubbing of online videos
KR20130134546A (ko) * 2012-05-31 2013-12-10 삼성전자주식회사 동영상의 섬네일 이미지 생성 방법 및 그 전자 장치
US8914452B2 (en) 2012-05-31 2014-12-16 International Business Machines Corporation Automatically generating a personalized digest of meetings
KR101323369B1 (ko) * 2012-09-21 2013-10-30 한양대학교 에리카산학협력단 영상 프레임 군집화 장치 및 방법
US20140157096A1 (en) * 2012-12-05 2014-06-05 International Business Machines Corporation Selecting video thumbnail based on surrounding context
EP2801919A1 (en) * 2013-05-10 2014-11-12 LG Electronics, Inc. Mobile terminal and controlling method thereof
KR102185131B1 (ko) * 2014-03-27 2020-12-01 삼성전자주식회사 썸네일 생성 방법 및 그 전자 장치
KR102217186B1 (ko) * 2014-04-11 2021-02-19 삼성전자주식회사 요약 컨텐츠 서비스를 위한 방송 수신 장치 및 방법
US9398326B2 (en) 2014-06-11 2016-07-19 Arris Enterprises, Inc. Selection of thumbnails for video segments
KR102340196B1 (ko) * 2014-10-16 2021-12-16 삼성전자주식회사 동영상 처리 장치 및 방법
US9466001B1 (en) * 2015-04-07 2016-10-11 Toshiba Tec Kabushiki Kaisha Image processing apparatus and computer-readable storage medium
US10140259B2 (en) * 2016-04-28 2018-11-27 Wipro Limited Method and system for dynamically generating multimedia content file
CN105893631B (zh) * 2016-05-31 2020-10-16 努比亚技术有限公司 一种视频缩略图的获取方法、装置及终端
US10108861B2 (en) 2016-09-20 2018-10-23 Motorola Solutions, Inc. Systems and methods of providing content differentiation between thumbnails
US10068616B2 (en) 2017-01-11 2018-09-04 Disney Enterprises, Inc. Thumbnail generation for video
AU2018271424A1 (en) 2017-12-13 2019-06-27 Playable Pty Ltd System and Method for Algorithmic Editing of Video Content
KR102061104B1 (ko) * 2018-03-13 2019-12-31 한국도로공사 개별문자 신뢰도를 통한 차량번호판 인식 시스템 및 그 동작 방법
US11080532B2 (en) * 2019-01-16 2021-08-03 Mediatek Inc. Highlight processing method using human pose based triggering scheme and associated system
CN110392306B (zh) * 2019-07-29 2021-11-05 腾讯科技(深圳)有限公司 一种数据处理方法以及设备
CN112445921B (zh) * 2019-08-28 2024-10-15 华为技术有限公司 摘要生成方法和装置
CN110856037B (zh) * 2019-11-22 2021-06-22 北京金山云网络技术有限公司 一种视频封面确定方法、装置、电子设备及可读存储介质
CN112437343B (zh) * 2020-05-15 2021-09-17 上海哔哩哔哩科技有限公司 基于浏览器的封面生成方法和系统
CN112954450B (zh) * 2021-02-02 2022-06-17 北京字跳网络技术有限公司 视频处理方法、装置、电子设备和存储介质
CN114915831B (zh) * 2022-04-19 2024-08-09 秦皇岛泰和安科技有限公司 预览图确定方法、装置、终端设备及存储介质
CN117812440B (zh) * 2024-02-28 2024-06-04 南昌理工学院 一种监控视频摘要生成方法、系统、计算机及存储介质

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR960012475B1 (ko) * 1994-01-18 1996-09-20 대우전자 주식회사 디지탈 오디오 부호화장치의 채널별 비트 할당 장치
US5635982A (en) 1994-06-27 1997-06-03 Zhang; Hong J. System for automatic video segmentation and key frame extraction for video sequences having both sharp and gradual transitions
AU698055B2 (en) * 1994-07-14 1998-10-22 Johnson-Grace Company Method and apparatus for compressing images
US5881176A (en) * 1994-09-21 1999-03-09 Ricoh Corporation Compression and decompression with wavelet style and binary style including quantization by device-dependent parser
CN1108023C (zh) * 1995-01-27 2003-05-07 大宇电子株式会社 自适应数字音频编码装置及其一种位分配方法
US5835163A (en) * 1995-12-21 1998-11-10 Siemens Corporate Research, Inc. Apparatus for detecting a cut in a video
US5956026A (en) * 1997-12-19 1999-09-21 Sharp Laboratories Of America, Inc. Method for hierarchical summarization and browsing of digital video
US6970602B1 (en) * 1998-10-06 2005-11-29 International Business Machines Corporation Method and apparatus for transcoding multimedia using content analysis
JP2001197405A (ja) * 2000-01-14 2001-07-19 Sharp Corp インデックス画像作成装置および方法
JP2002027411A (ja) 2000-07-13 2002-01-25 Sony Corp 映像信号記録装置および方法、映像信号再生装置および方法、並びに記録媒体
JP4431923B2 (ja) * 2000-07-13 2010-03-17 ソニー株式会社 映像信号記録再生装置および方法、並びに記録媒体
US20020133486A1 (en) * 2001-03-15 2002-09-19 Kddi Corporation Video retrieval and browsing apparatus, video retrieval, browsing and editing apparatus, and recording medium

Also Published As

Publication number Publication date
US7212666B2 (en) 2007-05-01
KR101015365B1 (ko) 2011-02-16
US20040197071A1 (en) 2004-10-07
CN1538351B (zh) 2010-06-09
EP1465196A1 (en) 2004-10-06
EP1465196B1 (en) 2013-10-16
CN1538351A (zh) 2004-10-20
JP2005328105A (ja) 2005-11-24
KR20040088351A (ko) 2004-10-16

Similar Documents

Publication Publication Date Title
JP4580183B2 (ja) 視覚的に代表するビデオサムネイルの生成
CN111327945B (zh) 用于分割视频的方法和装置
CN114041165B (zh) 一种视频相似检测的方法、装置及设备
CN101281540B (zh) 用于处理信息的设备、方法和计算机程序
US8467610B2 (en) Video summarization using sparse basis function combination
US9953222B2 (en) Selecting and presenting representative frames for video previews
US8818038B2 (en) Method and system for video indexing and video synopsis
US8467611B2 (en) Video key-frame extraction using bi-level sparsity
CN101443849B (zh) 视频浏览用户界面
US8687941B2 (en) Automatic static video summarization
US8238718B2 (en) System and method for automatically generating video cliplets from digital video
JP5091086B2 (ja) ビデオの短いセグメントを表示するための方法及びグラフィカルユーザインタフェース
CN112990191A (zh) 一种基于字幕视频的镜头边界检测与关键帧提取方法
US20070030391A1 (en) Apparatus, medium, and method segmenting video sequences based on topic
JP2015536094A (ja) ビデオシーン検出
US7263660B2 (en) System and method for producing a video skim
US20040181545A1 (en) Generating and rendering annotated video files
CN103984778B (zh) 一种视频检索方法及系统
JP3323842B2 (ja) 映像の要約方法及び装置
JP2005115952A (ja) キーフレーム識別選択方法、この方法をコンピュータに実行させるプログラム、およびキーフレーム識別選択システム
US20070061727A1 (en) Adaptive key frame extraction from video data
JP2006217046A (ja) 映像インデックス画像生成装置及び映像のインデックス画像を生成するプログラム
KR101573482B1 (ko) 프레임 클러스터링을 이용한 광고 삽입 장치 및 방법
KR101174176B1 (ko) 동영상 샘플링 방법 및 시스템
Zargham et al. Dynamic presentation of synchronised photo streams

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070402

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070402

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20100426

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100430

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100729

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100820

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100827

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130903

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees