JP3667262B2 - ビデオスキミング方法及び装置 - Google Patents
ビデオスキミング方法及び装置 Download PDFInfo
- Publication number
- JP3667262B2 JP3667262B2 JP2001247788A JP2001247788A JP3667262B2 JP 3667262 B2 JP3667262 B2 JP 3667262B2 JP 2001247788 A JP2001247788 A JP 2001247788A JP 2001247788 A JP2001247788 A JP 2001247788A JP 3667262 B2 JP3667262 B2 JP 3667262B2
- Authority
- JP
- Japan
- Prior art keywords
- shot
- video
- scene
- skimming
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B27/00—Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
- G11B27/005—Reproducing at a different information rate from the information rate of recording
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/70—Information retrieval; Database structures therefor; File system structures therefor of video data
- G06F16/73—Querying
- G06F16/738—Presentation of query results
- G06F16/739—Presentation of query results in form of a video summary, e.g. the video summary being a video sequence, a composite still image or having synthesized frames
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/70—Information retrieval; Database structures therefor; File system structures therefor of video data
- G06F16/78—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/783—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
- G06F16/7834—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using audio features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/70—Information retrieval; Database structures therefor; File system structures therefor of video data
- G06F16/78—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/783—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
- G06F16/7847—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using low-level visual features of the video content
- G06F16/786—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using low-level visual features of the video content using motion, e.g. object motion or camera motion
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B27/00—Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
- G11B27/02—Editing, e.g. varying the order of information signals recorded on, or reproduced from, record carriers
- G11B27/031—Electronic editing of digitised analogue information signals, e.g. audio or video signals
- G11B27/034—Electronic editing of digitised analogue information signals, e.g. audio or video signals on discs
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B27/00—Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
- G11B27/10—Indexing; Addressing; Timing or synchronising; Measuring tape travel
- G11B27/11—Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information not detectable on the record carrier
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B27/00—Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
- G11B27/10—Indexing; Addressing; Timing or synchronising; Measuring tape travel
- G11B27/19—Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier
- G11B27/28—Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording
Description
【発明の属する技術分野】
本発明は、マルチメディアの検索とブラウジングのためのシステムに関し、特に、ビデオコンテンツの構造的情報の中から、実際にビデオの内容展開による意味のある話の単位構造を基にして、ビデオの全体内容に対する要約的な理解と、ユーザー(使用者)が所望する部分への速い移動を可能にしたビデオスキミングシステムに関する。
【0002】
【従来の技術】
記録媒体の発達とマルチメディアコンテンツの製作が容易になることに伴い、一般人が毎日接するようになるメディアの量が非常に膨大になってきた。マルチメディアコンテンツが膨大になるに連れて、ユーザーが所望するデータを選別してくれる自動化システムに対する要求が発生し、これを解決するための方策に対する研究が活発に進められている。特に、デジタル技術が発達したことによってビデオコンテンツはデジタル形態で保存され流通される傾向になっており、デジタル放送が大衆化されればこのようなメディアのデジタル化は更に加速化されるであろう。
【0003】
このようなデジタルビデオコンテンツに対して、あるユーザーはニュースからスポーツ関連ニュースだけを視聴することを希望する場合があり、他の視聴者はニュースから証券関連ニュースだけを希望する場合がある。また、あるユーザーはショー番組で特定の人物が出演する場面だけを視聴したいということもある。このような様々なユーザーの要求を満たすために多様な研究が活発に行われている。
【0004】
また、ユーザーは制限された時間内にビデオコンテンツの全体の内容を把握したいということもある。このような要求を満たすのが「ハイライト」である。一般に、ハイライトとは、ビデオコンテンツで重要な場面を集めて新たに構成したコンテンツと理解されている。「スポーツハイライト」、「映画予告篇」、「ヘッドラインニュース」などを通じて「ハイライト」に接することができる。しかし、ビデオコンテンツでハイライトを抽出することは、現在の技術で自動化することは非常に難しい。従って、ほとんど人間の手動作業に依存することが普通である。先に言及したように、メディアの量が爆発的に増加するに連れて、全てのビデオコンテンツに対してハイライトを手動で提供することは、多大な人力を要するので、ほとんど不可能である。従って、ユーザーに速い時間内に大体の内容を理解させることができる自動化システムが必要である。
【0005】
デジタル技術が発達するに連れて、ビデオコンテンツでユーザーが所望の位置へ移動しようとする時にキーフレーム(key frame)を用いる方法がある。キーフレームを利用したビデオ要約を用いれば、ユーザーは所望の部分へ速く移動することができるという長所がある。しかし、キーフレームを用いてユーザーが所望の個所を容易に探すためには、多数のキーフレームが必要であり、制限されたディスプレイ空間に多数のキーフレームをディスプレイするのは難しいため、ユーザーに多くの選択作業を強いることになり非常に不便である。また、キーフレームを利用した方法では、一般に全体のビデオの内容を理解し難いという短所がある。
【0006】
最近、デジタルビデオで所望の場面を探すための用途に用いる多様なビデオインデックシング技術が研究されている。特定人が出た場面だけを見ることを望むユーザーのために、ビデオの中から人が出てくる場面を探し出し、その人が誰であるかを認識する過程を通じて人物の登場に対する情報をインデックシングしたり、映画やスポーツなどで主要場面を抽出しこれをインデックシングする等の研究が行われている。しかし、ビデオはそのジャンルが非常に多様でジャンル別にインデックシングされるべきデータが非常に異なっており、現在の技術ではユーザーに意味のある情報を高いレベルの正確度をもって抽出することができる自動化システムの具現は非常に難しいこととされている。
【0007】
一方、アナログビデオとは異なり、デジタルビデオでは早送り/巻き戻し機能を遂行するにあたって、画質の低下を防止することができる。
【0008】
デジタルビデオで一般に用いられる高速再生の方法は、単位時間当りデコーディングするフレーム数を増やし、その中の一部分だけをディスプレイしたり一定部分をスキップしつつフレームをデコーディングしてディスプレイする方法が用いられる。
【0009】
【発明が解決しようとする課題】
しかし、単位時間当りデコーディングするフレーム数を増やす方法は端末装置の性能によって最大速度が影響を受けるという短所があるので、一般にデジタルビデオの早送り/巻き戻しにおいては、一定部分をスキップしつつフレームをデコーディングしてディスプレイする方法を用いる。デジタルビデオでの早送り/巻き戻し技術は既存の技術中で、制限された時間内に全体の内容を把握しようとしたり所望の位置へ移動しようとするユーザーの要求に対応するための最も合理的な代案であるが、一定部分をスキップするにあたって、ほとんど時間的に一定の間隔を用いるのでユーザーは自身が所望する部分の場面を逃したり、重要でない部分が相対的に多く再生されるという短所がある。
【0010】
【課題を解決するための手段】
本発明のビデオスキミング方法は、ビデオストリームに対するショットセグメンテーションによる構造的情報として物理的な編集単位である個別ショットの区間を認識する段階と、その認識された個別ショットの区間内で特定の一部分を該当ショットに対する内容を反映する再生すべきビデオ情報として選択する段階と、それぞれの個別ショット毎に選択されたビデオ情報を連続して再生する段階とを含んでいることをその特徴とする。
【0011】
個別ショットの区間を認識した後に、再生するショットとスキップするショットを決定するショット選定段階をさらに含むことが望ましい。
【0012】
ビデオストリームに対する構造的情報は、論理的なストーリの単位であるシーン情報と、物理的な編集単位であるショット情報とが、時間的な技術情報(開始位置と持続時間または開始位置と終了位置)と共に表示されたものである。ショットの特性に対する技術情報も同時に含ませることが望ましい。
【0013】
ショット選定段階では、特性の類似したショットの中から、一部分をスキップし、残りの一部分のショットだけをスキミングのために用いるために選定することによって、類似した特性を有するショットが反復的に再生されるのを最小にすることができる。
【0014】
類似したショットの中から再生に利用するショットを選定するにあたって、シーンの後半部に位置したショットであればあるほど、選択のための高い加重値を付与する方式でスキミングに用いるショットを選定することが望ましい。
【0015】
それぞれのショットを代表する再生すべき部分(セグメント)は、該当ショットの前部分、後部分、中間部分、前部分と後部分を同時に用い、前記それぞれのショットを代表する再生すべき部分(セグメント)の長さは、各ショットで同一の長さに選択して再生することをその特徴とする。
【0016】
それぞれのショットで再生する部分として選定されたセグメントの長さが該当ショットの長さよりも大きくなるように計算された場合、個別ショットで再生する部分の長さを該当ショットの長さ以下に減らすことが望ましい。
【0017】
それぞれのショットを代表する再生すべき部分(セグメント)の長さは、個別ショット内のイメージ的/モーション的/オーディオ的類似性の平均値に基づいて、類似度が高ければ再生する長さを減らし、類似度が低ければ該当ショットで再生する長さを増やすようにすることが望ましい。
【0018】
シーンを代表するショット内のイメージ的/モーション的/オーディオ的類似性は、ショット内での時間的位置が異なるフレーム、動きベクトル、オーディオデータの類似性である。
【0019】
それぞれのショット内で再生されるセグメントの再生速度は可変的に制御することができるようにする。
【0020】
単位時間当りデコーディングされるフレーム数を正常な場合よりも高くして再生速度を正常速度よりも速く再生したり、再生する区間内のフレーム全てをデコーディングせずに、中途の幾つかのフレームずつスキップして再生することによって、再生区間を高速再生するようにしても良い。
【0021】
スキップを利用した高速スキミングをMPEGのようなフレーム間圧縮を用いるコーディングスキムを利用したビデオストリームに適用した時に、デコーディングするフレームは、他のフレームのデコーディングなしに該当フレームだけデコーディングしてフレームデータをえているIフレームを利用する。
【0022】
また、本発明によるビデオスキミング装置は、マルチメディアデータとしてデジタルビデオデータの検索とブラウジングが成されるために、ビデオスキミングのためのユーザー命令を入力するユーザーインターフェイス手段と、ユーザーインターフェイス手段で入力されたユーザー命令に従って該当ビデオファイルをビデオコンテンツに対する構造的情報に基づいてスキミング処理する制御手段と、制御手段にデジタルビデオデータと該当ビデオに対するインデックス情報としてビデオコンテンツに対する構造的情報を提供するためのビデオ情報ファイルと、制御手段によりスキミング処理されたビデオが再生されるディスプレイ手段とを含んでいることをその特徴とする。
【0023】
ビデオコンテンツに対する構造的情報は、論理的なストーリの単位であるシーン情報を基にし、シーンの構成要素である物理的な編集単位であるショット情報から該当シーンを代表して再生されるショットを含むことが望ましい。
【0024】
ビデオコンテンツに対する構造的情報は、該当シーンを代表して再生されるショット内で再生するセグメントをさらに含むことが望ましい。
【0025】
ユーザーインターフェイス手段は、ビデオスキミングの程度として要約レベルを指定する手段や、ビデオスキミングの時の再生区間の倍速を指定する手段を含み、ビデオスキミングが行われる時にビデオの要約レベルや再生倍速を選択することができることが望ましい。
【0026】
制御手段は、ユーザーの入力または基本設定を用いてスキミング条件に応じてインデックスファイルからショットセグメンテーション情報及びショットクラスタリング情報と関連したビデオインデックス情報を読取り、ビデオスキミングの条件に合うように再生するセグメントを計算して関連したメディアファイルで該当セグメントを連続的に再生し、ディスプレイ手段で出力する。
【0027】
【発明の実施の形態】
デジタルビデオ技術の発達とイメージ/ビデオ認識技術の発達によってユーザーは所望のビデオを所望の時点で所望の部分だけを検索してブラウジングすることができるようになった。
【0028】
非線形的なビデオブラウジングと検索のために最も基本になる技術は、ショットセグメンテーション技法とショットクラスタリング技法であり、この2種類の技術はビデオを分析するにあたって最も核心になる技術である。従って、今まで多くの研究がショットセグメンテーションに集中されており、ショットクラスタリング技術に対する研究が始まりつつである傾向にある。
【0029】
多様な研究結果を土台とすればショットセグメンテーションは自動化することができ、ほとんどのアルゴリズムは90%以上の高い正確度をもって具現されることができる。
【0030】
また、ショットクラスタリング技術も、特徴的なイベントを検出したり一般的なショットの特性を用いてプログラムのジャンルに合うように技術を適用することによって、高いレベルの正確度をもって自動化されるようになった。
【0031】
一般にビデオコンテンツは論理的に幾つかのストーリの単位に分けられる。このようなストーリの単位を一般に事件構造(イベント)またはシーンと称する。銃撃戦場面とか、対話場面などがこれに該当する。このようなシーンは幾つかのサブシーンまたはショットの連結で構成されている。
【0032】
ショットとは、途中の妨害なしに一つのカメラから得られた一連のビデオフレームを意味する。これはビデオを分析したり構成する最も基本になる単位である。
【0033】
一般にビデオは数多くのショットの連結で構成される。ショットセグメンテーションビデオとは、それぞれの個別ショットに分割する技法を意味し、ショットクラスタリングは、ビデオコンテンツをそれぞれの個別ショットとその特性に基づいてショットを論理的なシーン単位に再構成することによってビデオコンテンツの論理的なストーリを検出する過程を意味する。
【0034】
前記したようになされた本発明のビデオコンテンツの構造的情報であるシーンとショット情報を利用したビデオスキミングシステムを添付した図面を参照してさらに詳細に説明する。
【0035】
図1はショットセグメンテーション過程とショットクラスタリング過程を図式化したものである。一般に多くのショットセグメンテーションアルゴリズムは、同一のショット内ではイメージ的/モーション的/オーディオ的類似性が存在し、二つの異なるショット間にはイメージ的/モーション的/オーディオ的比類似性が計測される特性に基づいて実施され、且つショットクラスタリングは類似した特性を有するショットが一定の時間内に再び検出されることがあるという特徴に基づいて実施される。
【0036】
一般にビデオハイライトはビデオストリームの内容展開において、意味上重要なセグメントを選択し、このセグメントを連続的に再生する方法である。
【0037】
しかし、様々なビデオコンテンツに対して、内容展開においいて、意味上重要なセグメントを選択することは自動化することが非常に難しい。
【0038】
ところで、ショットセグメンテーション情報をビデオスキミングに利用することとすると、全てのビデオに存在するショットを基準にしてショットの一定の部分だけを再生し残りの部分はスキップする方法を通じて元のストリームより短い長さを再生するようにするスキミング方法を駆使することができる。このようなスキミング方法は、ショットセグメンテーション技術が自動化可能であるため、完全自動化システムを構築することができるという長所があり、一般的なデジタルビデオに対する早送り/巻き戻しから発生する、重要でない場面が長く再生されるとか、重要な場面を逃す、という問題を減らすことができるという長所がある。
【0039】
図2はショットセグメンテーション情報を利用したビデオスキミング方法を要約した図である。
図2において灰色で表示された部分は、ショットセグメンテーション情報を利用したスキミング方法で再生される部分を示したもので、残りの部分はスキップする部分を示したものである。
【0040】
しかし、ショットセグメンテーション情報だけをビデオスキミングに用いる場合にはビデオコンテンツに存在する論理的なストーリであるシーン情報を用いないため、対話場面などのような特定事件の区間では反復的なショットが再生され続くという短所がある。
【0041】
図3は対話場面が長く連結されるシーンにおけるショットの配列構造を図式化したものである。図3でそれぞれのショットはショットセグメンテーション過程を通じて検出されたショットの特性に基づいて英語大文字A、B、C、Dで表現した。
【0042】
つまり、図3で表現した対話場面は登場人物1と登場人物2が交互にクローズアップされて話を展開していくシーンで、多くのショットから構成されている。
【0043】
しかし、ショットセグメンテーション情報だけをビデオスキミングに用いるのでは、対話場面内部の各ショットの一部分を全て再生するので、ユーザーには二人が対話をするという情報以外に、特に他の情報が追加に提供できないにも関わらず、このシーンが長く再生されるという短所がある。
【0044】
本発明では、ビデオコンテンツの構造的情報としてシーン情報と共にショット情報を考慮してビデオスキミングを遂行することによって、前記したような短所を克服している。
【0045】
つまり、本発明では全てのビデオに存在するシーンにおいてそのシーンを構成しているショットの中から、再生するショットとスキップするショットをまず選び出し、再生するショットに対してはそのショットを構成しているセグメント情報中のショットの一定部分(セグメント)だけを再生し、残りの部分はスキップする方法を通じて、元来のビデオストリームより短い長さを再生するようにするスキミング方法とその装置を提案している。
【0046】
多様な研究結果によれば、ビデオコンテンツで銃撃場面、対話場面などの特定のイベントを検出できるようになり、それに基づいて、映画やドラマのようなコンテンツのシーン検出が可能であり、これを通じて目次(ToC:Table of Content)形態のインデックス構造を自動に生成することができることが知られている。
【0047】
図4は一般的なビデオコンテンツに対するストーリの単位を検出する過程を図式化したものである。
【0048】
図3と同様に、それぞれのショットはショットセグメンテーション過程によって検出されたショットの特性に基づいて英語大文字で表現した。ドラマや映画の対話場面があるシーン内部のショット展開構造では、ほとんどA、B、A、B、…のような特徴的なパターンが現れる。図4では一定の周期以内に特性の類似したショットの集まりが検出されると、該当区間を一つのシーンとして決定する過程を示す。図4でシーン1はショットの特徴値がA、B、Cであるショットからなっているシーンである。ショット1の三番目のB以降に一定の時間の間ショットの特徴値がA、B、Cであるショットが存在しないので、ショット1の三番目の終了時点をシーン1の終了時点として一つのシーンを検出する。図4のシーン2はショットの特徴値がF、H、Eであるショットからなっているシーンであり、このシーンの最後のショット以降に一定の時間の間ショットの特徴値であるF、H、Eが存在しないので、最後のEをシーン2の終了時点として検出することができる。
【0049】
このようなショットの検出方法以外にも、人の顔部分を自動的に検出し、検出された人が誰であるかを顔認識する過程を通してより正確な対話場面の検出が可能である。このような方式は一般的なドラマや映画によく適用される方式である。
【0050】
本発明は、前述したように、ビデオコンテンツに対する構造的情報であるシーンとショット情報を用いてビデオスキミングを具現し、シーンを構成している個別ショットの中から、再生するショットをどのように選定するのか、再生するショットとして選定されたショット内で再生される部分とスキッピングする部分をどのように選定するのか、再生される部分の再生長さはどのように選定するのか、且つ再生区間内での再生方法はどのようにするのかを考慮する。
【0051】
まず、図5は本発明のビデオスキミング方法を要約した図である。
図5ではショットセグメンテーションとショットクラスタリング過程を通じてインデックスされたビデオコンテンツの構造的情報を用いる。図5では構造的情報を利用したビデオスキミングの時に再生のために選択されたショットを灰色で表示し、スキップされるショットを白色で表示した。つまり、構造的情報を利用したビデオスキミングのために、システムは先ず各シーンに対して、再生されるショットを決定し、個別ショットに対する再生方法を編集する。
【0052】
図5ではシーン1の各ショットの中から反復的なショットを再生しないために類似したショットの中から特徴的な場面だけを一回ずつだけ再生するようにした例である。
【0053】
本発明でビデオストリームに存在するそれぞれのシーンに対して、シーンの構成要素であるショットの中から再生するショットとスキップするショットを決定するショット選定は以下のように行われる。
【0054】
一つのシーンに多数の類似した特性のショットが存在する場合に代表的なショットを選定する方法は、特別な加重値の条件なしに選定してスキミングに用いたとしても、大体のシーンの内容を伝達することができる。しかし、一般的なドラマや映画のようなストーリでは一つのシーンの後半部により多くの情報が表現される場合がほとんどである。言い換えれば、導入部分は結末部分よりもその重要性が一般に落ちる。従って、類似したショットがシーン内に数回登場する時に、スキミングで再生するショットを選定する段階ではシーンの後半部にあるショットを再生するショットとして選定することが、同じ長さのスキミング方法でユーザーにより多くの情報を提供することができる。
【0055】
図6はシーンの前半部からスキミングで再生するショットを選定する方法(図6の(a))とシーンの後半部から再生するショットを選定する方法(図6の(b))を示したものである。
【0056】
図6の(a)、(b)は共に一つのシーンで類似したショットが存在する場合、一つのショットだけをスキミングのために選定する例であり、従って、図6の(a)ではA、B、Cのそれぞれのショット特性を有するショットの中から最初に出るショットを再生するショットとして選定し、図6の(b)ではA、B、Cのそれぞれのショット特性を有するショットの中から最後に出るショットを再生するショットとして選定した。一般には、図6の(b)の方法が図6の(a)の方法よりも一層ユーザーの満足度が高く現れる。
【0057】
次に、各ショット内で再生される部分とスキップピングする部分を選定する方法について説明する。
【0058】
ビデオコンテンツの構造的情報を利用したスキミングでは先程選定されたショットを連続的に再生することによって、ビデオコンテンツに対する要約を提供することができる。しかし、一般にショット全体を再生するビデオスキミング方式は要約のレベルが非常に低く、ユーザーは一般にショットの一部だけを視聴しても全体の内容を理解することができる。ビデオコンテンツの構造的情報を利用したビデオスキミングで再生のために選択されたショットから再生される部分を選定する方法は、無条件にショットの前部分を選択したり後部分または中間部分を選択することができる。図7はショットの前部分、後部分、中間部分または前/後部分を同時に用いてビデオスキミングを行う方式で再生される部分とスキップされる部分を示した図である。
【0059】
しかし、ビデオのジャンルによって差異はあるが、実験の結果は、該当ショットの前部分をスキップし後部分を再生することが一般にユーザーの満足度が高く現れる。その理由は一般にショットの結末部分(例:サッカーのゴールイン場面など)がショットの内容を用いるにあたって導入や展開部分よりもさらに重要であり、ニュースのような番組で段階的な図表説明等の方法を用いる場合、ショットの前部分では内容の一部が表現され、最後部分で全体の内容が表現されるためである。
【0060】
しかし、ビデオのジャンルによってはショットの前部分が一般に重要なこともあるが、その一例として、問題分析などを主にする教育放送などが挙げられる。このような放送では、ショットの前部分にどのような問題を扱うかに対する情報があり、その以降は問題分析が長く続くため、所望の部分を再生するためにはショットの前部分を再生することが後部分を再生することよりもユーザーにより多くの情報を提供することができる。
【0061】
従って、本発明ではビデオのコンテンツの性格に応じてショット内で再生する位置を異なるように選定することができ、同じショット内でも前部分、中間部分、後部分を混用してスキミングを具現することができる。
【0062】
次に、本発明で再生される長さを選定する方法について説明する。
各ショットで再生される長さを選定する方法は選定された全てのショットに対して同一の長さのセグメントを再生する部分として選定する方法と、ショットの特性を用いて各ショット毎に再生する長さを異なるように選定する方法とに分けることができる。
【0063】
この時に用いるショットの特性は一つのショット内での平均的なイメージ的/モーション的/オーディオ的類似性に基づくことができる。つまり、一つのショット内でイメージ的/モーション的/オーディオ的類似性が大きければ大きいほど場面が単調なものであると判断することができるので、このような場面についてはスキップを多くし、ショット内でイメージ的/モーション的/オーディオ的類似性が小さければ内容が複雑な場面であると判断することができるので、このような場面についてはスキップを少なくする方式を用い、再生される単位セグメントの長さを内容に応じて動的に調整することができる。
【0064】
この方法はショットの時間的な長さに依存せずに、内容が複雑な部分は少なくスキップし、内容が単調な部分は多くスキップする。したがって、選定された全てのショットに対して同一の長さのセグメントを再生する方法よりユーザーの理解度が高いレベルのビデオスキミングを提供することができる。
【0065】
図8はショット内でイメージ的/モーション的/オーディオ的類似性に基づいた再生及びスキップを行う長さの選定方法の一例を示したものである。
【0066】
図8のグラフで、横軸は時間を示し、縦軸はショット内でのイメージ的/モーション的/オーディオ的非類似性を測定して累積させた値である。このような非類似性データは、一般にショットセグメンテーションアルゴリズムで抽出可能なショット特性を示すデータである。
【0067】
非類似度の一例として、隣接したフレームまたは一定の間隔で離れたフレーム間のカラーヒストグラムの差異が挙げられる。
【0068】
図8では、ショットAとショットBは長さが相似しているが、ショットAの平均変化率よりショットBの平均変化率が大きいので、ショットAでよりもショットBでより多くの部分を再生する状況を表現した。
【0069】
このように再生区間を設定するにあたって、ショットの長さを考慮しないと該当ショットの長さよりも再生する区間の長さが大きくなるエラー状況(ショットの長さが非常に短い場合)が発生することがあるので、本発明のスキミング方法では、単位区間の長さが該当ショットより大きくなる場合には例外的に該当ショットの全体を再生区間に選定したり該当ショットの長さを考慮して一部分を再生区間として選定することができる。
【0070】
次に、ビデオコンテンツに対する構造的情報として前記したようにシーンとそのシーン内の再生するショット内での再生区間内での再生方法について説明する。
【0071】
本発明によるビデオスキミングは順方向だけでなく逆方向に対しても適用が可能である。
【0072】
それぞれのショット内で再生する区間に選定されたセグメントを連続的に再生すればユーザーは全体の内容を理解しながらも短時間にコンテンツに対する概要情報を得ることができ、所望の位置を探索するにあたって別途のものが必要でない。
【0073】
本発明のビデオスキミング方法で、それぞれのショット内で再生する区間として選定されたセグメントを再生する方法は、大きく2つに分けることができる。
【0074】
第1は、正常再生方法と同様な方法で各セグメントを再生する方法であり、第2は、再生区間内の一部のフレームだけをデコーディングし、区間内で再びスキップピングを用いて再生する方法である。
【0075】
正常再生方法は非常に一般的であるので具体的な説明を省略し、再生区間内で一部のフレームだけをデコーディングして区間内でスキップピングを利用した再生方法を説明する。
【0076】
再生区間内で一部のフレームだけをデコーディングして区間内でスキップピングを利用した再生方法は、高速スキミングを実現するための方法である。この時ディスプレイされるフレームは時間的に一定の間隔だけ離れたフレームを指定することができる。MPEGのようなフレーム間圧縮を用いる方法ではフレーム間依存性のないIフレームを指定することができる。
【0077】
図9は再生区間内でスキップピングを利用した高速スキミング方法の一例を図式化したものである。このような方法を用いるとユーザーは実際に多くの情報を得ながら高速でビデオファイルを再生する効果を経験することができる。
【0078】
以上説明したように、本発明のビデオコンテンツの構造的情報を利用したビデオスキミング方法は二段階でセグメントを指定することがその特徴であり、図10はこのような本発明のビデオコンテンツの構造的情報を利用したビデオスキミング方法を要約した図である。
【0079】
ビデオスキミングが要求されると、システムはビデオコンテンツに対するショット及びシーン情報を含んだビデオコンテンツの構造的情報が保存されたインデックスファイルがロードされる。システムは各シーンに対して、どのショットを再生するのか、どのショットをスキップするのかを決定し(ショット選定段階)、ビデオスキミングのために選定された各ショットに対して、再生するセグメントとスキップするセグメントを決定し(セグメント指定段階)、二段階の編集過程を通じて再生するセグメントを連続的に再生装置で出力する。
【0080】
図10では第1段階のショット選定段階を経て再生するショットを灰色で表示し、選定されたショットで一部分だけ(セグメント)を再生し残りの部分をスキップすることができることを図式化した。
【0081】
図11はビデオスキミングのための本発明のスキミング装置の実施形態を示したものである。
【0082】
図11に示すように、本発明のビデオスキミング装置は、ビデオスキミングの程度とスキミングで用いた倍速などのユーザー命令を入力するためのユーザーインターフェイス部101と、ユーザーインターフェイス部101に入力されたユーザー命令に従って該当ビデオファイルをショット及びシーンに対するインデックシング情報に基づいてスキミング処理する主制御部102と、主制御部102にデジタルビデオストリーム情報を提供するメディアファイル103と、メディアファイルに該当する構造的情報としてシーン及びショットに対するインデックシング情報を提供するインデックスファイル104と、主制御部102によりスキミング処理されたビデオが再生されるディスプレイ装置部105とを含んでいる。
【0083】
図11の本発明のビデオスキミングシステムでインデックスファイル104はメディアファイル103に含ませることができる。ディスプレイ装置部105はビデオストリームをディスプレイするモニター、スピーカー等の出力装置であり、ユーザーインターフェイス部101はユーザーの入力を受け入れるキーボード、マウス、リモコン、ボタンなどの入力手段を意味する。
【0084】
メディアファイル103は(オーディオをも含めた)ビデオデータが保存されたファイルであり、インデックスファイル104はショットクラスタリング及びショットセグメンテーション情報が含まれたビデオに対するインデックス情報が保存されたファイルである。
【0085】
ユーザーはユーザーインターフェイス部101を用いてビデオスキミングを要求する。
ビデオスキミングを要求する時には要約のレベル(スキミングの程度)を指定することができ、スキミングで用いる倍速を指定することができる。つまり、ユーザーは全体のビデオを何分内に圧縮して視聴するかをユーザーインターフェイス部101を用いて指定し、主制御部102はユーザーの入力に対応してメディアファイル103とそれによるインデックスファイル102の情報からどのショットのどの部分をスキミングのために再生するのか、各セグメントは何倍速で再生するのかを決定する。このような過程が終わると、主制御部102はメディアファイル103をデコーディングして該当フレームをディスプレイ装置部105にディスプレイすることによって、ユーザーにビデオスキミング機能を提供する。
【0086】
【発明の効果】
前述したように、本発明はデジタルビデオ環境で制限された時間内に全体の内容を把握しようとしたり所望の位置へ移動しようとするユーザーの要求に同時に対応するビデオスキミング方法を提案した。
【0087】
本発明は既存のビデオスキミングで発生し得る問題点である、重要でない部分が相対的に多く再生されたりユーザーが実際に所望する場面を逃したりする確率を最小にして、対話場面や特定場面が交互に繰り返される場面が再生され続く確率を最小化した。
【0088】
本発明のビデオスキミング方式は所望の位置へ移動しようとするユーザーの要求に対してユーザー入力の必要性を最小化させることができる。
【0089】
本発明のビデオスキミング機能を用いると、ユーザーは短時間内に全体の内容を把握することができ、全体の内容を把握するにあたって重要な部分を逃すことなく、鬱陶しい部分を簡単に過ぎることができるという長所がある。
【0090】
また、ユーザーは所望の位置へ移動しようとする時にも本発明のビデオスキミングを用いることができ、これはキーフレームを利用した方式よりユーザーの入力要求が非常に小さいという長所がある。
【0091】
結局、本発明はビデオハイライト再生のような用途に利用することができ、各ショットの再生する区間を再生するにあたって高速再生方式と一緒に用いるとユーザーの入力要求を最小化し、所望の場面を迅速に探索する機能として活用することができる。
【図面の簡単な説明】
【図1】 ショットセグメンテーションとクラスタリングの概念を説明するための図。
【図2】 ショットセグメンテーション情報を利用したビデオスキミング方法の概念を説明するための図。
【図3】 対話場面シーンのショット展開方式の例を示した図。
【図4】 ショット特性を利用したシーン検出方法の例を示した図。
【図5】 構造的情報を利用したスキミングで再生するショットとスキップするショットの選定方法の例を示した図。
【図6】 シーン内部でショットの位置と反復情報を考慮したスキップするショットと再生するショットの選定方法を説明するための図。
【図7】 ショット内でスキップする部分と再生する部分の選定方法を説明するための図。
【図8】 ショットの非類似度特性を利用した動的な単位再生長さ選定方法の例を示した図。
【図9】 スキッピングを利用した高速スキミング方法を説明するための図。
【図10】 ビデオコンテンツの構造的情報を利用したスキミング方法を説明するための図。
【図11】 ビデオコンテンツの構造的情報を利用したビデオスキミングのためのシステム構成の例を示した図。
【符号の説明】
101 ユーザーインターフェイス部
102 主制御部
103 メディアファイル
104 インデックスファイル
105 ディスプレイ装置部
Claims (16)
- ビデオストリームに対するショットセグメンテーションによる構造的情報として物理的な編集単位である個別ショットの区間を認識する段階と、
前記認識された個別ショットの区間内で特定の一部分を該当ショットに対する内容を反映する再生すべきビデオ情報に選択する段階と、
それぞれの個別ショット毎に選択された前記ビデオ情報を連続して再生する段階と
を含み、さらに、前記個別ショットの区間を認識した後に、シーンを構成する各ショットの中で特性の類似したショットを再生すべきショットとして決定するショット選定段階を含み、前記ショット選定段階では、特性の類似したショットの中から再生に利用されるショットを選定するにあたって、前記シーンの後半部に位置したショットを選定することを特徴とするビデオスキミング方法。 - 前記ビデオストリームに対する構造的情報は、論理的なストーリの単位であるシーン情報と、物理的な編集単位であるショット情報とが、開始位置と持続時間または開始位置と終了位置のような時間的な技術情報と共に表示され、そこにショットの特性値を表す情報がさらに含まれていることを特徴とする請求項1に記載のビデオスキミング方法。
- 前記それぞれのショットを代表する再生すべき部分であるセグメントは、該当ショットの前部分、後部分、中間部分、前部分と後部分を同時に用いることを特徴とする請求項1に記載のビデオスキミング方法。
- 前記それぞれのショットを代表する再生すべき部分であるセグメントの長さは、各ショットで同一の長さに選択して再生することを特徴とする請求項1に記載のビデオスキミング方法。
- 前記ショット選定段階により選定された個別ショットの長さが短い場合、この個別ショットの全体を再生区間として選択することを特徴とする請求項1に記載のビデオスキミング方法。
- 前記それぞれのショットを代表する再生すべき部分であるセグメントの長さは、個別ショット内のイメージ的/モーション的/オーディオ的類似性の平均値に基づいて、類似度が高ければ再生する長さを減らし、類似度が低ければ該当ショットで再生する長さを増やすことを特徴とする請求項1に記載のビデオスキミング方法。
- 前記シーンを代表するショット内のイメージ的/モーション的/オーディオ的類似性は、ショット内での時間的位置が異なるフレーム、動きベクトル、オーディオデータの類似性であることを特徴とする請求項6に記載のビデオスキミング方法。
- 前記それぞれのショットで再生する部分として選定されたセグメントの長さが該当ショットの長さよりも大きくなるように計算された場合、個別ショットで再生する部分の長さを該当ショットの長さ以下に減らすことを特徴とする請求項6に記載のビデオスキミング方法。
- 前記それぞれのショット内で再生されるセグメントの再生速度を制御できることを特徴とする請求項1に記載のビデオスキミング方法。
- 前記再生する区間内のフレーム全てをデコーディングせずに、中途の幾つかのフレームずつスキップして再生することによって、前記再生区間を高速再生することを特徴とする請求項9に記載のビデオスキミング方法。
- 前記スキップを利用した高速スキミングをMPEGのようなフレーム間圧縮を用いるコーディングスキムを利用したビデオストリームに適用した時に、デコーディングするフレームは、他のフレームのデコーディングなしに該当フレームだけデコーディングしてフレームデータを得ることができるIフレームであることを特徴とする請求項10に記載のビデオスキミング方法。
- マルチメディアデータとしてデジタルビデオデータの検索とブラウジングが行われるために、ビデオスキミングのためのユーザー命令を入力するユーザーインターフェイス手段と、
前記ユーザーインターフェイス手段で入力されたユーザー命令に従って該当ビデオファイルをビデオコンテンツのシーンとショット情報を示す構造的情報に基づいてスキミング処理する制御手段と、
前記制御手段にデジタルビデオデータと該当ビデオに対するインデックス情報としてビデオコンテンツの前記構造的情報を提供するビデオ情報ファイルと、
前記制御手段によりスキミング処理されたビデオが再生されるディスプレイ手段と
を含み、前記制御手段は、ビデオ情報ファイルから提供されたビデオコンテンツの構造的情報に基づき、個別ショットの区間を認識するとともに、シーンを構成する各ショットの中で特性の類似したショットを再生すべきショットとして選定し、かつ特性の類似したショットの中から再生に利用されるショットを選定するにあたっては、前記シーンの後半部に位置したショットを選定することを特徴とするビデオスキミング装置。 - 前記ビデオコンテンツの構造的情報は、論理的な話の単位であるシーン情報を基にし、シーンの構成要素である物理的な編集単位であるショット情報から前記該当シーンを代表して再生されるショットを含むことを特徴とする請求項12に記載のビデオスキミング装置。
- 前記ビデオコンテンツの構造的情報は、前記該当シーンを代表して再生されるショット内で再生するセグメントをさらに含むことを特徴とする請求項13に記載のビデオスキミング装置。
- 前記ユーザーインターフェイス手段は、ビデオスキミングの程度を表す要約レベルを指定する手段と、ビデオスキミングの時の再生区間の倍速を指定する手段とを含み、ビデオスキミングが行われる時にビデオコンテンツの前記要約レベル及び再生倍速を選択することができることを特徴とする請求項12に記載のビデオスキミング装置。
- デジタルビデオデータ、ビデオコンテンツの論理的な話の単位構造であるシーン情報、ビデオコンテンツの物理的な編集単位であるショット情報を保存する保存手段と、
ビデオスキミングのために前記ビデオデータに該当する前記シーン情報を基にして特定のシーンを代表するショット情報を検出する検出手段と、
前記検出されたショット内で再生するセグメントとスキップするセグメントを選定する手段と、
前記選定された再生すべきセグメントを前記保存手段で連続的に読取って再生する手段と
を含み、前記検出手段は、シーンを構成する各ショットの中で特性の類似したショットを再生すべきショット情報として検出するとともに、特性の類似したショットの中から再生に利用されるショットを検出するにあたっては、前記シーンの後半部に位置したショットを特定のシーンを代表するショット情報として検出することを特徴とするビデオスキミング装置。
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR10-2000-0048036A KR100370249B1 (ko) | 2000-08-19 | 2000-08-19 | 샷 세그멘테이션 정보를 이용한 비디오 스키밍 시스템 |
KR2000-48036 | 2000-09-22 | ||
KR2000-55886 | 2000-09-22 | ||
KR1020000055886A KR20020023063A (ko) | 2000-09-22 | 2000-09-22 | 비디오 콘텐트의 구조적 정보를 이용한 비디오 스키밍방법과 장치 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2002125174A JP2002125174A (ja) | 2002-04-26 |
JP3667262B2 true JP3667262B2 (ja) | 2005-07-06 |
Family
ID=26638320
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2001247788A Expired - Fee Related JP3667262B2 (ja) | 2000-08-19 | 2001-08-17 | ビデオスキミング方法及び装置 |
Country Status (3)
Country | Link |
---|---|
US (1) | US6964021B2 (ja) |
EP (1) | EP1182584A3 (ja) |
JP (1) | JP3667262B2 (ja) |
Families Citing this family (66)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6965645B2 (en) * | 2001-09-25 | 2005-11-15 | Microsoft Corporation | Content-based characterization of video frame sequences |
US7415670B2 (en) * | 2001-11-19 | 2008-08-19 | Ricoh Co., Ltd. | Printer with audio/video localization |
US7424129B2 (en) * | 2001-11-19 | 2008-09-09 | Ricoh Company, Ltd | Printing system with embedded audio/video content recognition and processing |
US7747655B2 (en) | 2001-11-19 | 2010-06-29 | Ricoh Co. Ltd. | Printable representations for time-based media |
US7861169B2 (en) | 2001-11-19 | 2010-12-28 | Ricoh Co. Ltd. | Multimedia print driver dialog interfaces |
US20040130635A1 (en) * | 2002-10-09 | 2004-07-08 | Canon Kabushiki Kaisha | Image processing apparatus and image processing method |
US6963378B2 (en) * | 2002-11-01 | 2005-11-08 | Motorola, Inc. | Method and apparatus for reduction of visual content |
KR100609154B1 (ko) * | 2003-05-23 | 2006-08-02 | 엘지전자 주식회사 | 비디오 콘텐츠 재생 방법 및 장치 |
KR100708337B1 (ko) * | 2003-06-27 | 2007-04-17 | 주식회사 케이티 | 퍼지 기반 oc―svm을 이용한 동영상 자동 요약 장치및 방법 |
WO2005001836A2 (en) * | 2003-06-30 | 2005-01-06 | Koninklijke Philips Electronics, N.V. | Clip based trick modes |
US7275159B2 (en) * | 2003-08-11 | 2007-09-25 | Ricoh Company, Ltd. | Multimedia output device having embedded encryption functionality |
KR100991619B1 (ko) * | 2003-09-17 | 2010-11-04 | 엘지전자 주식회사 | 내용 기반 트릭 플레이를 위한 방송 서비스 방법 및 시스템 |
US7440126B2 (en) * | 2003-09-25 | 2008-10-21 | Ricoh Co., Ltd | Printer with document-triggered processing |
US7528977B2 (en) * | 2003-09-25 | 2009-05-05 | Ricoh Co., Ltd. | Printer with hardware and software interfaces for peripheral devices |
US7511846B2 (en) * | 2003-09-25 | 2009-03-31 | Ricoh Co., Ltd. | Printer having embedded functionality for printing time-based media |
US20050071746A1 (en) * | 2003-09-25 | 2005-03-31 | Hart Peter E. | Networked printer with hardware and software interfaces for peripheral devices |
US8077341B2 (en) * | 2003-09-25 | 2011-12-13 | Ricoh Co., Ltd. | Printer with audio or video receiver, recorder, and real-time content-based processing logic |
US7508535B2 (en) * | 2003-09-25 | 2009-03-24 | Ricoh Co., Ltd. | Stand alone multimedia printer with user interface for allocating processing |
US7528976B2 (en) * | 2003-09-25 | 2009-05-05 | Ricoh Co., Ltd. | Stand alone printer with hardware/software interfaces for sharing multimedia processing |
US7864352B2 (en) | 2003-09-25 | 2011-01-04 | Ricoh Co. Ltd. | Printer with multimedia server |
JP2005108230A (ja) | 2003-09-25 | 2005-04-21 | Ricoh Co Ltd | オーディオ/ビデオコンテンツ認識・処理機能内蔵印刷システム |
EP1531474A1 (en) | 2003-11-14 | 2005-05-18 | Sony International (Europe) GmbH | Video signal playback apparatus and method |
EP1538536A1 (en) * | 2003-12-05 | 2005-06-08 | Sony International (Europe) GmbH | Visualization and control techniques for multimedia digital content |
US7603615B2 (en) * | 2004-03-30 | 2009-10-13 | Ricoh Co., Ltd. | Multimedia projector-printer |
US8274666B2 (en) | 2004-03-30 | 2012-09-25 | Ricoh Co., Ltd. | Projector/printer for displaying or printing of documents |
JP4297010B2 (ja) | 2004-08-13 | 2009-07-15 | ソニー株式会社 | 情報処理装置および情報処理方法、並びに、プログラム |
KR101265348B1 (ko) * | 2004-12-17 | 2013-05-20 | 톰슨 라이센싱 | 멀티미디어 데이터의 시간-시프트 재생 장치 및 방법 |
US7526725B2 (en) * | 2005-04-08 | 2009-04-28 | Mitsubishi Electric Research Laboratories, Inc. | Context aware video conversion method and playback system |
US20070033632A1 (en) * | 2005-07-19 | 2007-02-08 | March Networks Corporation | Temporal data previewing system |
KR100716291B1 (ko) * | 2005-07-27 | 2007-05-09 | 삼성전자주식회사 | 영상재생장치와 그 제어방법 및 pvr |
BRPI0613902A2 (pt) * | 2005-07-27 | 2016-11-22 | Koninkl Philips Electronics Nv | método para organizar e para fornecer um resumo de apresentação de multimídia, e, aparelho para fornecer um resumo de uma apresentação de multimídia |
EP1913773A4 (en) * | 2005-08-10 | 2012-12-26 | Thomson Licensing | SYSTEM AND METHOD FOR CONTROLLING DIGITAL CINEMA CONTENT |
KR100718351B1 (ko) | 2005-09-28 | 2007-05-14 | 주식회사 팬택 | 동영상 파일의 요약 재생 시스템 및 이를 탑재한 이동통신단말기 |
US20070101264A1 (en) * | 2005-11-01 | 2007-05-03 | Microsoft Corporation | Position-and length-sensitive video timeline behavior |
WO2007055445A1 (en) * | 2005-11-11 | 2007-05-18 | Daegu Gyeongbuk Institute Of Science And Technology | A pre-viewing method of multiple movies or movie-clips in multimedia apparatus |
EP1806919A1 (en) * | 2006-01-05 | 2007-07-11 | Alcatel Lucent | Media delivery system with content-based trick play mode |
KR101187787B1 (ko) * | 2006-02-18 | 2012-10-05 | 삼성전자주식회사 | 키 프레임을 이용하여 동영상을 검색하는 방법 및 장치 |
US7796860B2 (en) * | 2006-02-23 | 2010-09-14 | Mitsubishi Electric Research Laboratories, Inc. | Method and system for playing back videos at speeds adapted to content |
US8392183B2 (en) | 2006-04-25 | 2013-03-05 | Frank Elmo Weber | Character-based automated media summarization |
AU2006252142B2 (en) * | 2006-12-20 | 2009-11-26 | Canon Kabushiki Kaisha | Video rate determination |
US8345769B1 (en) * | 2007-04-10 | 2013-01-01 | Nvidia Corporation | Real-time video segmentation on a GPU for scene and take indexing |
US8358381B1 (en) | 2007-04-10 | 2013-01-22 | Nvidia Corporation | Real-time video segmentation on a GPU for scene and take indexing |
US20080269924A1 (en) * | 2007-04-30 | 2008-10-30 | Huang Chen-Hsiu | Method of summarizing sports video and apparatus thereof |
KR20080098735A (ko) * | 2007-05-07 | 2008-11-12 | 삼성전자주식회사 | 고속 영상 재생방법 및 이를 적용한 영상재생장치 |
JP2009044423A (ja) * | 2007-08-08 | 2009-02-26 | Univ Of Electro-Communications | シーン検出システム及びシーン検出方法 |
JP4656199B2 (ja) * | 2008-07-22 | 2011-03-23 | カシオ計算機株式会社 | 画像処理装置、サムネイル動画作成方法及びサムネイル動画作成プログラム |
US8209609B2 (en) * | 2008-12-23 | 2012-06-26 | Intel Corporation | Audio-visual search and browse interface (AVSBI) |
US8620077B1 (en) * | 2009-01-26 | 2013-12-31 | Google Inc. | Spatio-temporal segmentation for video |
CN102461165A (zh) * | 2009-06-24 | 2012-05-16 | 德耳塔维德约股份有限公司 | 用于动态视频电子节目指南的系统和方法 |
US9171578B2 (en) | 2010-08-06 | 2015-10-27 | Futurewei Technologies, Inc. | Video skimming methods and systems |
CN103210651B (zh) | 2010-11-15 | 2016-11-09 | 华为技术有限公司 | 用于视频概要的方法和系统 |
WO2012136880A1 (en) * | 2011-04-06 | 2012-10-11 | Nokia Corporation | Method, apparatus and computer program product for managing media content |
CN103001925B (zh) * | 2011-09-08 | 2018-05-08 | 百度在线网络技术(北京)有限公司 | 基于统计来确定多媒体数据的播放跳转信息的方法和设备 |
US9414038B2 (en) | 2012-10-16 | 2016-08-09 | Amanjyot Singh JOHAR | Creating time lapse video in real-time |
JP2014106637A (ja) * | 2012-11-26 | 2014-06-09 | Sony Corp | 情報処理装置および方法、並びにプログラム |
CN103377294B (zh) * | 2013-07-07 | 2016-07-13 | 浙江大学 | 一种基于色彩分布分析的视频摘要内容提取方法 |
US9508390B2 (en) * | 2013-07-12 | 2016-11-29 | Apple Inc. | Trick play in digital video streaming |
US10664687B2 (en) | 2014-06-12 | 2020-05-26 | Microsoft Technology Licensing, Llc | Rule-based video importance analysis |
US9521470B2 (en) * | 2014-06-13 | 2016-12-13 | Hulu, LLC | Video delivery system configured to seek in a video using different modes |
EP3151243B1 (en) * | 2015-09-29 | 2021-11-24 | Nokia Technologies Oy | Accessing a video segment |
US10284774B2 (en) * | 2015-12-25 | 2019-05-07 | Olympus Corporation | Information terminal apparatus, image pickup apparatus, image-information processing system, and image-information processing method for controlling time-lapse imaging |
KR20170098079A (ko) * | 2016-02-19 | 2017-08-29 | 삼성전자주식회사 | 전자 장치 및 전자 장치에서의 비디오 녹화 방법 |
CN107547922B (zh) * | 2016-10-28 | 2019-12-17 | 腾讯科技(深圳)有限公司 | 信息处理方法、装置、系统及计算机可读存储介质 |
CN109819338B (zh) | 2019-02-22 | 2021-09-14 | 影石创新科技股份有限公司 | 一种视频自动剪辑方法、装置及便携式终端 |
US11824653B2 (en) | 2021-12-17 | 2023-11-21 | Lenovo (Singapore) Pte. Ltd. | Radio access network configuration for video approximate semantic communications |
US11917206B2 (en) | 2021-12-17 | 2024-02-27 | Lenovo (Singapore) Pte. Ltd. | Video codec aware radio access network configuration and unequal error protection coding |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5521841A (en) * | 1994-03-31 | 1996-05-28 | Siemens Corporate Research, Inc. | Browsing contents of a given video sequence |
US5664227A (en) * | 1994-10-14 | 1997-09-02 | Carnegie Mellon University | System and method for skimming digital audio/video data |
US6188396B1 (en) * | 1996-03-29 | 2001-02-13 | International Business Machines Corp. | Synchronizing multimedia parts with reference to absolute time, relative time, and event time |
US5956026A (en) * | 1997-12-19 | 1999-09-21 | Sharp Laboratories Of America, Inc. | Method for hierarchical summarization and browsing of digital video |
US6331859B1 (en) * | 1999-04-06 | 2001-12-18 | Sharp Laboratories Of America, Inc. | Video skimming system utilizing the vector rank filter |
US6549643B1 (en) * | 1999-11-30 | 2003-04-15 | Siemens Corporate Research, Inc. | System and method for selecting key-frames of video data |
US6642940B1 (en) * | 2000-03-03 | 2003-11-04 | Massachusetts Institute Of Technology | Management of properties for hyperlinked video |
-
2001
- 2001-08-17 JP JP2001247788A patent/JP3667262B2/ja not_active Expired - Fee Related
- 2001-08-17 US US09/932,713 patent/US6964021B2/en not_active Expired - Fee Related
- 2001-08-17 EP EP01119953A patent/EP1182584A3/en not_active Ceased
Also Published As
Publication number | Publication date |
---|---|
US20020051010A1 (en) | 2002-05-02 |
US6964021B2 (en) | 2005-11-08 |
EP1182584A3 (en) | 2005-12-28 |
EP1182584A2 (en) | 2002-02-27 |
JP2002125174A (ja) | 2002-04-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3667262B2 (ja) | ビデオスキミング方法及び装置 | |
US6222532B1 (en) | Method and device for navigating through video matter by means of displaying a plurality of key-frames in parallel | |
KR100411437B1 (ko) | 지능형 뉴스 비디오 브라우징 시스템 | |
US7362949B2 (en) | Intelligent video system | |
US7362950B2 (en) | Method and apparatus for controlling reproduction of video contents | |
JP5322550B2 (ja) | 番組推奨装置 | |
JP4905103B2 (ja) | 動画再生装置 | |
KR100564893B1 (ko) | 프레임정보 기술방법 및 그 장치, 프레임정보 생성방법 및 그 장치, 특수재생방법 및 그 장치, 특수재생 제어정보 생성장치 및 컴퓨터 독출가능한 기록매체 | |
JP4364190B2 (ja) | マルチメディアデータストリームの非線形的再生制御方法及びその装置 | |
JP4683281B2 (ja) | 再生システム、再生装置、再生方法、情報処理装置、情報処理方法、およびプログラム | |
JP4253139B2 (ja) | フレーム情報記述方法、フレーム情報生成装置及び方法、映像再生装置及び方法並びに記録媒体 | |
WO1998034182A2 (en) | A method and device for navigating through video matter by means of displaying a plurality of key-frames in parallel | |
JPH0993588A (ja) | 動画像処理方法 | |
JP2009124298A (ja) | 符号化映像再生装置及び符号化映像再生方法 | |
US20060041908A1 (en) | Method and apparatus for dynamic search of video contents | |
JPH11220689A (ja) | 映像ソフト処理装置及び同処理プログラム記録記憶媒体 | |
US20050028213A1 (en) | System and method for user-friendly fast forward and backward preview of video | |
KR100552248B1 (ko) | 복수의키-프레임들병렬디스플레이에의해비디오재료를통해네비게이팅하는방법및장치 | |
JP2002281433A (ja) | 動画像検索閲覧編集装置および記録媒体 | |
JP2010246000A (ja) | 映像サーチ再生装置 | |
KR20020074328A (ko) | 키프레임을 이용한 동영상 재생방법 및 그 장치 | |
KR100370249B1 (ko) | 샷 세그멘테이션 정보를 이용한 비디오 스키밍 시스템 | |
KR20020023063A (ko) | 비디오 콘텐트의 구조적 정보를 이용한 비디오 스키밍방법과 장치 | |
JP2005167456A (ja) | Avコンテンツ興趣特徴抽出方法及びavコンテンツ興趣特徴抽出装置 | |
KR100438302B1 (ko) | 비디오 스키밍 방법 및 장치 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20040921 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20040928 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20041217 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20050322 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20050405 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090415 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090415 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100415 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110415 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120415 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120415 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130415 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130415 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140415 Year of fee payment: 9 |
|
LAPS | Cancellation because of no payment of annual fees |