JP4320141B2 - 要約映像生成のための方法とシステム - Google Patents
要約映像生成のための方法とシステム Download PDFInfo
- Publication number
- JP4320141B2 JP4320141B2 JP2001504689A JP2001504689A JP4320141B2 JP 4320141 B2 JP4320141 B2 JP 4320141B2 JP 2001504689 A JP2001504689 A JP 2001504689A JP 2001504689 A JP2001504689 A JP 2001504689A JP 4320141 B2 JP4320141 B2 JP 4320141B2
- Authority
- JP
- Japan
- Prior art keywords
- feature points
- frame
- video signal
- new
- lost
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims description 27
- 230000033001 locomotion Effects 0.000 claims description 30
- 238000005259 measurement Methods 0.000 claims description 18
- 230000008859 change Effects 0.000 claims description 15
- 238000000605 extraction Methods 0.000 description 15
- 238000001514 detection method Methods 0.000 description 10
- 238000012545 processing Methods 0.000 description 7
- 238000010586 diagram Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 230000004044 response Effects 0.000 description 3
- 230000008901 benefit Effects 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000008033 biological extinction Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000006855 networking Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
- 230000009012 visual motion Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/20—Analysis of motion
- G06T7/246—Analysis of motion using feature-based methods, e.g. the tracking of corners or segments
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Television Signal Processing For Recording (AREA)
- Image Analysis (AREA)
- Studio Circuits (AREA)
- Studio Devices (AREA)
Description
(技術分野)
本発明は映像の要約方法とシステムに関し、特にキーフレームの抽出とショットの境界検出に関する。
【0002】
(本発明の背景と従来技術)
近年のパーソナルコンピューティングや通信の進歩によって、ハンドヘルドコンピュータ、パーソナルデジタル支援(PDAs)、スマートフォン、車載コンピュータ装置、およびコンピュータのような装置の新しい分野を創成し、ユーザがより情報を利用できるようになっている。
【0003】
セルラー電話、PDA、およびハンドヘルドコンピュータを含む、多くの製造業者はこれらの装置の機能性を高めており、該装置はカレンダー、アドレス帳、ページング装置、広域位置情報装置、旅行および地図用ツール、イーメールクライアント、およびウェブブラウザとして働く機能を有するに至っている。結果として、これらの装置へあらゆる種類の情報を提供することに関連して多くの新しいビジネスが形成されている。しかしながら、これらの多くの装置には、ディスプレイの大きさ、記憶装置、処理能力、およびネットワークアクセスに関して性能の限界があるため、これらの装置を用いて情報へアクセス、保存、処理するアプリケーションを開発する余地がある。
【0004】
これら開発と同時に、保存、収集、およびネットワーク接続の技術の利点は、大量で豊富なマルチメディアコンテンツを扱うことができる点である。結果として、使用される豊富な内容と顧客の装置のアクセスおよび処理能力との間の格差を広げることになる。
【0005】
この観点では、キーフレームに基づく映像要約と呼ばれる技術が映像情報の管理と伝送に効果的である。この描画法は、C.Christopoulos et al.,”MPEG7アプリケーション:内容再利用とメディア変換による自在アクセス”,Seoul,Korea,1999年5月,ISO/IEC/JTC1/SC29/WG11 M4433,に、顧客装置へ映像データを適合させることが記載されている。
【0006】
音声−映像素材に対するキーフレーム抽出は顧客のバンド幅や計算能力に適合させることができる。例えば、低バンド幅または低容量の顧客は配信される情報に音声情報のみかまたは、いくつかのキーフレームに音声を結合させたものを要求するかもしれない。高バンド幅と高い計算能率を有する顧客はAV素材全てを要求できる。他の応用例はデジタル映像の高速閲覧である。一定間隔での映像フレームの飛び越しは映像の閲覧時間を短縮する。
【0007】
以後以下の定義を使用する。
【0008】
ショット
ショットは、単一の連続動作において1つのカメラで撮影したフレームのシーケンスとして定義する。J.Monaco,”How to read a film”,Oxford Press,1981を参照。
ショット境界
ショット間には多数の異なるタイプの境界がある。カットは単一のフレーム内の急激なショットの変化である。フェードは明るさが次第に暗くなる(フェードアウト)かまたは次第に明るくなる(フェードイン)ような明るさの勾配的変化である。ある画像が他の画像へ合成されて移り変わるフレームでは、第1のショットの映像が減光し、第2のショットの映像が増光するとき消滅が発生する。一掃は、第2のショットのピクセルが、フレームの左端のラインのような規則的な形状で、第1のショットと置き換わる時に発生する。
キーフレーム
キーフレームは各ショットの内部に定義される。それらは、キーフレームは、少ない数のフレームで、いくつかの主観的または客観的な計測による最も関連のあるショット情報を表す。
【0009】
従来の映像要約は2つの段階から成り、
1.ショット境界検出。
2.キーフレーム抽出。
である。
【0010】
色、動き、形のような多くのフレームの属性が映像要約に用いられる。映像要約のショット境界検出の標準的なアルゴリズムはヒストグラムに基づいている。ヒストグラムに基づく技術が安定で効果的であることが文献、A.Smeulders and R.Jain,”画像データベースとマルチメディア検索”,Singapore,1988、およびJ.S.Boreczky, and L.A.Rowe,”映像ショット境界検出技術の比較”,画像と映像データベースの保存と検索4,Proc.of IS&T/SPIE 1996 Int’l Symp. On Elec.Imaging:Science and Technology, San Jose, CA, 1996年2月、に記載されている。
【0011】
このように2つの画像のカラーヒストグラムが計算される。もし2つのヒストグラム間のユークリッド距離が特定の閾値以上である場合、ショット境界が仮定される。しかしながら、動きに関する情報は使用されない。ゆえに、この技術はカメラまたは被写体が動く状況では弱点を有している。
【0012】
さらに、キーフレームは要約映像を生成するために異なるショットから抽出されなければならない。従来のキーフレーム抽出アルゴリズムは例えば、Wayne Wolf,”動作解析によるキーフレーム抽出”,in proceedings,ICASSP96,に記載されている。視覚的な動作の流れはショット内の局所的な最小の動きを識別するために使用される。これらの局所的な最小の動きはキーフレームに対応して判定される。W.Xiong,and J.C.M.Lee,and R.H.Ma,”ショット分割とキーフレーム抽出による自動映像データ構築”,Machine Vision and Applications,vol.10,no.2,pp.51-65,1997,によると、シーク−アンド−スプレッドアルゴリズムは前のキーフレームを次のキーフレーム抽出の参考として使用する。R.L.Lagendijk,and A.Hanjalic,and M.Ceccarelli,and M.Soletic,and E.Persoon,”SMASHシステム内の視覚的な検索”,Proceedings of IEEE ICIP 97,pp.671-674,1997,においても、シーク−アンド−スプレッドアルゴリズムが各ショットへ割り当てるキーフレームの数と位置を計算するために使用される。2つのフレーム間の動作はヒストグラム差分を用いて計算する。この方法の1つの利点は、キーフレームの数を事前に定めることができる。
【0013】
(要旨)
本発明の目的はショット境界検出とキーフレーム抽出のための方法とシステムを提供することである。該システムと方法は映像要約およびカメラと被写体の動きに対応することができる。
【0014】
上記の目的と他の目的は、特徴点のリストを生成するキーフレーム抽出方法とシステムによって達成される。該リストは映像シーケンスの連続するフレーム間の個々の特徴点の履歴を保存する。
【0015】
2つの連続するフレーム間で多くの新しい特徴点がリストに加えられたとき、または多くの特徴点がリストから削除されたとき、ショット境界が決定される。キーフレームとしては、2つの境界ショットの間から、特徴点のリストにおいてリストに追加または削除される特徴点がほとんどないか全くない状態のフレームが抽出される。
【0016】
画像そして/またはカメラの動きにおいて、映像シーケンスの動きからキーフレームを抽出する方法を用いることができる。該キーフレーム抽出アルゴリズムはより不安定なカメラの動きに対応できる。
【0017】
(詳細な記載)
図1aおよび1bに、第1の好適な実施例によるショット境界検出のアルゴリズムにおける、1反復間の実行ステップのフローチャートを示した。
【0018】
図1aに示すように、最初にブロック101において最初のフレームを入力し、最初のフレームの特徴点を抽出し、次のフレームの特徴点を予測するための入力として用いる。次に、ブロック103において、次のフレームの特徴点を計算して予測する。さらに、ブロック105において次のフレームを入力し、ブロック107で該フレームの特徴点を抽出し、ブロック101で同じ特徴点の抽出アルゴリズムを用いる。
【0019】
このような、隅の点に対応する特徴点の抽出アルゴリズムは文献に多数記載されている。例えば、B.Lucas and T.Kanade,”立体視を用いたインタレーティブ画像位置あわせ技術”,in proc.7th Int.Joint Conf.on Artificial Intelligence,1981,pp.674-679 にこのような方法の1つが記載されている。また、S.K.Bhattacharjee,”エンドストップウェーブレットを用いた特徴点の検出”,submitted to IEEE Trans.On Image Processing 1999,を使用することが出来る。
【0020】
次に、ブロック109において、推定された特徴点とブロック107内で抽出された特徴点間のデータを関連づける。特徴点のリストの更新はブロック111内で行われる。さらに、特徴点のリスト上における推定された各特徴点の更新はブロック113内で行われる。最後に、アルゴリズムはブロック103へ戻り、次のフレームを、現在の推定された特徴点と次のフレームの特徴点間のデータを関連づけるために、ブロック105内で入力する。
【0021】
図1aのアルゴリズムはブロック111内では、特徴点のリストの更新をするときはいつもショット境界が発生しているかどうかを検査する。このショット境界検出処理は図1bに示した。このようにして、最初のブロック131において更新リストを入力する。現在の特徴点のリストと以前の特徴点のリストの比較はブロック133内で実行される。
【0022】
もし以前の特徴点のリストから失われた特徴点の数が、またはもし現時の特徴点のリスト内の新しい特徴点の数が、所定の閾値より大きい場合、ブロック135へ処理は移り、現在のフレームはショット境界であると表示する。
【0023】
処理はブロック131へ戻り、もし、一方で、ブロック133内で現在のフレームがショット境界と対応しないことが決定されると処理はブロック131へ直接戻る。
【0024】
図2に、記載した図1aおよびbを結合させた、ショット境界検出処理を用いてキーフレーム抽出のアルゴリズムの1回の反復のブロック図を示した。時間kにおけるフレームはP個の特徴点の集合として以下のように表される。
【数1】
上式は、
*動的要素:位置(x,y)および以下に表される速度
【数2】
*測光要素:ガボール反応のような(f1,f2,f3,・・・)。
を含む。ここで、時間k(またはフレームk)での特定の特徴点を表す変数nの特徴点の数は時間の関数である。
【0025】
測光要素は、入力として画像の明るさを用いて計算する、ガボール応答またはガウシアン微分応答のような一般的なフィルタ応答である。J.Malik,and P.Perona,”初期の機構による前注意的構成識別法”,J.Opt.Soc.Am.,vol.7,no.5,pp.923-932,1990年5月を参照。ここで記載したアルゴリズム内の測光要素の使用することは、特徴点の抽出において縮尺や回転に対する感度を改良する。しかしこれは必須の要件ではない。
【0026】
特徴ベクトル
【数3】
は状態ベクトルと称する。その要素は、将来の軌道を予測するために、特徴点nの現在および過去の履歴を要約する。
【0027】
特徴点は隅の点のような有効な構成数を含む点に対応する。このような点は相対的に追跡が容易である。
【0028】
図2を参照して、特徴点抽出段階での最初のブロック201は、時間k+1でn番目の測定ベクトルとして定義されるベクトル、
【数4】
はn=1,2,・・・Pとして計算される。
【0029】
次に、ブロック203内の測定予測段階では、式
【数5】
は最後のフレームkの状態ベクトル
【数6】
が予測されることで推定される。A.Gelb,”最適推定の応用”,MIT Press,1974に記載されているカルマンフィルタは推定アルゴリズムとして使用できる。
【0030】
次に、ブロック205で、予測された測定
【数7】
と、抽出された測定
【数8】
との間の対応は、特徴点のリストの更新によって実行される。
【0031】
式
【数9】
は、時間k+1までの特徴点のn番目のリストである。Y.Bar-Shalom, and T.E.Fortmann,”追跡とデータのかかわり”Academic Press,1988に記載されている近隣フィルタは、特徴点のリストの更新のためにデータの関連付けのために使用できる。推定された測定ベクトル
【数10】
最後のフレームkからの特徴点のリストZn(k)、および現在のフレームk+1による測定ベクトル
【数11】
は、データ関連付けの段階で入力として使用される。特徴点の数Pは時間と共に変化することは特筆すべきである。これは、各データ関連付け周期は特徴点の開始も含み、特徴点の終了だけでなく特徴点の維持も含む。
【0032】
異なる型の特徴点の処理の定義を以下に説明する。
1.特徴点の開始:新しい特徴点が抽出されたときに新しい特徴点を生成する。
2.特徴点の終了:特徴点がもはや抽出されないときに特徴点を削除する。
3.特徴点の管理:対応する特徴点が抽出された時に特徴点を更新する。
【0033】
最後に、多くの特徴点が同時に終了(例えば、切断、フェードイン、分解または一掃の状況)または開始(例えば、切断、フェードイン、分解または一掃の状況)したとき、フレームはフレームはショット境界であると判断する。
【0034】
さらに、ショット境界を検出するために特徴点内の変化の比率に対する動作の測定が定義される。そのような測定は以下に動作変化と称する。この動作測定は連続するフレーム間の終了または開始特徴点に数に依存する。該測定は、例えば比率として計算される終了および開始特徴点間の最大値として定義する。該開始特徴点の比率は、現在のフレーム内で、新しい特徴点の数を特徴点の数全体で割って求められる。終了特徴点の比率は、以前のフレーム内で、削除された特徴点の数を特徴点の数全体で割って求められる。
【0035】
適切な閾値が設定され、もし終了および開始特徴点間の最大値が閾値より大きいとき、ショット境界が発生したと判断される。動作変化の他の定義も当然可能である。
【0036】
図4に連続するフレームk(537)、k+1(540)、k+2(541)、k+3(542)の集合内の検出した特徴点を示した。フレームk+1(540)内でフレームk(537)からのほとんどの特徴点が検出されている。
【0037】
その間、最初のフレームの数個の点が消滅し、少数の点が現れる。フレームk+3(542)で、ほとんどの特徴点が失われている。ゆえにこれはショット境界(省略)に相当すると判断される。ショットは最も重要な情報内容で連続する静的な状態の集合を構成する。動作変化のピークに相当する2つの状態の遷移は図3に示した。図3では、時間(またはフレーム)の関数としての動作変化を示している。該静的な状態、すなわち、動作変化の小さい平坦な部分が検出され、キーフレームの抽出に用いられる。
【0038】
再び図4を参照してに示すように、フレームk+1(540)では、フレームk(537)からのほとんどの特徴点が検出されている。その間、最初のフレームの数個の点が消滅し、少数の点が現れる。よって、フレームk+1はキーフレームとして適切である。
【0039】
一度、上で記載したアルゴリズムを用いてショット境界が検出されると、ショット境界間の1つまたはいくつかの極小値がキーフレームとして抽出される。動作変化により現れる極小値は一定である。よって、それ自体極小値であるフレームを抽出する必要はない。しかし、どんなフレームも、動作変化が一定で良い結果をもたらす訳ではない。しかしながら、ショット境界間の動作変化の極小値に対応するフレームは良い結果をもたらす。
【0040】
したがって、例えば、映画監督は2つの場面を結合するのにカメラの動き(カメラを回したりズーム撮影)を用いる。AとB2人の俳優が静止した背景の前で互いに会話をしている場合を仮定すると、俳優Aが話すとカメラは彼に焦点を当てる。これは長時間に渡る低動作に相当する(抽出した特徴点の主要な変化がない)。俳優Bが話し出すと、カメラは彼の方へ向く。このとき、カメラは俳優Bで停止し、動作レベルは再び低くなる。キーフレームは低動作フレームから選択される、すなわち、図3の平坦な部分である。
【0041】
圧縮された画像を使用するときはより速いアルゴリズムを用いる。しかしながら、マルチターゲット追跡を実行するために圧縮された範囲に使用できる情報には限界がある。妥協により映像シーケンスのI−フレームのみ検出することができる。該I−フレームはここで記載した要約映像アルゴリズムに対して使用される。
【0042】
この選択は3つの要素によって実行される。第1はI−フレームが、例えば12フレームごとに頻繁に現れる。このフレーム副サンプリングは最後のショットの5から23秒間である。D.Colla,and G.Ghoma,”テレビ放送における画像の動作特性”,IEEE Trans.Communications,vol.26,pp.1201-1206,1976.参照。第2は、ここで記載したアルゴリズムは、2つの連続するフレーム間の大きな動きを取り扱うことができる。第3に、または他の形式で像をフォーマットできるJPEG、I−フレームは、(B−,P−フレーム)のような映像シーケンス内の他のフレームを独立に受け入れられる。
【図面の簡単な説明】
本発明を、対応する図を用いてより詳細に説明する。
【図1】 図1aおよび1bはショット境界検出のアルゴリズムのフローチャートである。
【図2】 図2は、連続する映像フレーム内の特徴点の追跡用の機器の基本ブロックを示したブロック図である。
【図3】 図3はショット内の動きの変化を示した図である。
【図4】 図4は特徴点を検出した連続するフレームの集合を示した。
Claims (25)
- 映像信号からキーフレームを抽出する方法であって、映像信号内のフレームから特徴点を抽出し、連続するフレーム間の特徴点を追跡し、連続するフレーム間の新しいまたは失った特徴点の数を測定し、新しいまたは失った特徴点の数が所定の閾値を超えたときに、映像信号内のショット境界であると判定し、新しいまたは失った特徴点の数が所定の基準と合致する2つのショット境界間に位置しているフレームを、キーフレームとして選択することを特徴とする方法。
- 新しいまたは失った特徴点の数が前記所定の閾値を超え、特徴点の変化率を示す動作測定が最大値を有するフレームとして映像信号内のショット境界が判定されることを特徴とする請求項1記載の方法。
- 前記動作測定がそのフレームに対して終了する特徴点の数またはそのフレームに対して開始する特徴点の数であることを特徴とする請求項2記載の方法。
- 該キーフレームとして、映像信号内の連続する複数のフレームを通じて新しいまたは失った特徴点の数が一定であるフレームが選択されることを特徴とする請求項1ないし3のいずれかに記載の方法。
- キーフレームが、新しい特徴点または失った特徴点の数が2つのショット境界間の極小値に相当するフレームとしてまたは新しい特徴点または失った特徴点が所定のしきい値以下となるフレームとして選択されることを特徴とする請求項1ないし3のいずれかに記載の方法。
- 映像信号がI−フレームを有する圧縮された映像信号であり、I−フレームはショット境界の判定およびキーフレームの選択をするための入力フレームとして、符号化され用いられることを特徴とする請求項1ないし5のいずれかに記載の方法。
- 映像信号のフレーム内の特徴点は、映像信号の運動要素と測光要素の両方を用いて抽出されることを特徴とする請求項1ないし6のいずれかに記載の方法。
- 映像信号内のショット境界を検出する方法であって、映像信号内のフレームから特徴点を抽出し、連続するフレーム間の特徴点を追跡し、連続するフレーム間の新しいまたは失った特徴点の数を測定し、新しいまたは失った特徴点の数が所定の閾値以上であれば、それが映像信号内のショット境界であると判定することを特徴とする方法。
- 新しいまたは失った特徴点の数が前記所定の閾値を超え、特徴点の変化率を示す動作測定が最大値を有するフレームとして映像信号内のショット境界が判定されることを特徴とする請求項8記載の方法。
- 前記動作測定がそのフレームに対して終了する特徴点の数またはそのフレームに対して開始する特徴点の数であることを特徴とする請求項9記載の方法。
- 映像信号のフレーム内の特徴点は運動要素と測光要素の両方を用いて抽出されることを特徴とする請求項8ないし10のいずれかに記載の方法。
- 映像信号がI−フレームを有する圧縮された映像信号であり、I−フレームはショット境界の判定およびキーフレームの選択をするための入力フレームとして符号化され用いられることを特徴とする請求項8ないし11のいずれかに記載の方法。
- 映像信号からキーフレームを抽出する装置であって、連続するフレーム間の新しいまたは失った特徴点の数を測定する手段と、新しいまたは失った特徴点の数が所定の閾値以上の時映像信号内のショット境界を判定する手段と、新しいまたは失った特徴点の数が所定の基準と合致する2つのショット境界に位置するフレームをキーフレームとして選択する手段を有することを特徴とする装置。
- 映像信号のショット境界を判定する手段が、新しいまたは失った特徴点の数が前記所定の閾値以上であり、特徴点の変化率を示す動作測定が最大値を有するフレームとして映像信号内のショット境界が判定されるように構成されたことを特徴とする請求項13記載の装置。
- ショット境界を判定する手段がそのフレームに対しての終了する特徴点の数またはそのフレームに対して開始する特徴点の数として動作測定を計算するように構成されことを特徴とする請求項14記載の装置。
- 新しいまたは失った特徴点の数が映像信号内の連続する多数のフレームで一定であるフレームをキーフレームとして選択する手段を有することを特徴とする請求項13ないし15のいずれかに記載の装置。
- 新しいまたは失った特徴点の数が2つのショット境界間の極小値に対応するか、または、新しいまたは失った特徴点の数が所定の閾値以下であるフレームとしてキーフレームを選択する手段を有することを特徴とする請求項13ないし15のいずれかに記載の装置。
- 映像信号がI−フレームを有する圧縮された映像信号であり、I−フレームだけを復号化し、ショット境界の判定およびキーフレームの選択をするための入力フレームとしてI−フレームを用いる手段を有することを特徴とする請求項13ないし17のいずれかに記載の装置。
- 映像信号のフレーム内の特徴点を運動要素と測光要素の両方を用いて抽出する装置を有することを特徴とする請求項13ないし18のいずれかに記載の方法。
- 映像信号内のショット境界を検出する装置であって、連続するフレーム間の新しいまたは失った特徴点の数を測定する手段と、新しいまたは失った特徴点が所定の閾値以上の時、映像信号内のショット境界であると判定する手段を具備することを特徴とする装置。
- 映像信号のショット境界を判定する手段が、新しいまたは失った特徴点の数が前記所定の閾値以上であり、特徴点の変化率を示す動作測定が最大値を有するフレームとして映像信号内のショット境界が判定されるように構成されたことを特徴とする請求項20記載の装置。
- ショット境界を判定する手段がそのフレームに対しての終了する特徴点の数またはそのフレームに対して開始する特徴点の数として動作測定を計算するように構成されことを特徴とする請求項21記載の装置。
- 映像信号のフレーム内の特徴点を、映像信号の運動要素と測光要素の両方を用いて抽出する手段を有することを特徴とする請求項20ないし22のいずれかにに記載の装置。
- 映像信号がI―フレームを有する圧縮された映像信号であり、I−フレームだけを復号化し、ショット境界の判定をするための入力フレームとしてI−フレームを用いる手段を有することを特徴とする請求項20ないし23のいずれかに記載の装置。
- 請求項13ないし24の何れかに記載の装置を具備する映像要約システム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
SE9902328A SE9902328A0 (sv) | 1999-06-18 | 1999-06-18 | Förfarande och system för att alstra sammanfattad video |
SE9902328-5 | 1999-06-18 | ||
PCT/SE2000/001178 WO2000079800A1 (en) | 1999-06-18 | 2000-06-07 | A method and a system for generating summarized video |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2003502957A JP2003502957A (ja) | 2003-01-21 |
JP4320141B2 true JP4320141B2 (ja) | 2009-08-26 |
Family
ID=20416155
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2001504689A Expired - Fee Related JP4320141B2 (ja) | 1999-06-18 | 2000-06-07 | 要約映像生成のための方法とシステム |
Country Status (9)
Country | Link |
---|---|
US (1) | US6690725B1 (ja) |
EP (1) | EP1210826B1 (ja) |
JP (1) | JP4320141B2 (ja) |
CN (1) | CN1213610C (ja) |
AU (1) | AU771922B2 (ja) |
CA (1) | CA2375862A1 (ja) |
DE (1) | DE60039611D1 (ja) |
SE (1) | SE9902328A0 (ja) |
WO (1) | WO2000079800A1 (ja) |
Families Citing this family (40)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20020051077A1 (en) * | 2000-07-19 | 2002-05-02 | Shih-Ping Liou | Videoabstracts: a system for generating video summaries |
GB2394851A (en) | 2002-10-30 | 2004-05-05 | Hewlett Packard Co | A camera having a user operable control for producing a saliency signal representative of a user's interest in a scene being imaged |
US7143352B2 (en) * | 2002-11-01 | 2006-11-28 | Mitsubishi Electric Research Laboratories, Inc | Blind summarization of video content |
US7177470B2 (en) * | 2002-11-13 | 2007-02-13 | Koninklijke Philips Electronics N. V. | Method of and system for detecting uniform color segments |
FR2848321B1 (fr) * | 2002-12-04 | 2005-02-25 | Eads Systems & Defence Electro | Procede pour detecter des cibles ponctuelles et systeme de veille mettant en oeuvre ce procede de detection de cibles |
WO2004075537A1 (en) * | 2003-02-21 | 2004-09-02 | Koninklijke Philips Electronics N.V. | Shot-cut detection |
KR100708337B1 (ko) * | 2003-06-27 | 2007-04-17 | 주식회사 케이티 | 퍼지 기반 oc―svm을 이용한 동영상 자동 요약 장치및 방법 |
US7409108B2 (en) * | 2003-09-22 | 2008-08-05 | Siemens Medical Solutions Usa, Inc. | Method and system for hybrid rigid registration of 2D/3D medical images |
US7372991B2 (en) * | 2003-09-26 | 2008-05-13 | Seiko Epson Corporation | Method and apparatus for summarizing and indexing the contents of an audio-visual presentation |
WO2005091050A1 (en) * | 2004-03-12 | 2005-09-29 | Koninklijke Philips Electronics N.V. | Multiview display device |
US20070058614A1 (en) * | 2004-06-30 | 2007-03-15 | Plotky Jon S | Bandwidth utilization for video mail |
US7551234B2 (en) * | 2005-07-28 | 2009-06-23 | Seiko Epson Corporation | Method and apparatus for estimating shot boundaries in a digital video sequence |
US20100005485A1 (en) * | 2005-12-19 | 2010-01-07 | Agency For Science, Technology And Research | Annotation of video footage and personalised video generation |
KR100780057B1 (ko) | 2006-04-25 | 2007-11-29 | 삼성전자주식회사 | 동영상 그레쥬얼 샷 변환 장치 및 그 방법 |
US8392183B2 (en) | 2006-04-25 | 2013-03-05 | Frank Elmo Weber | Character-based automated media summarization |
JP4881766B2 (ja) * | 2007-03-06 | 2012-02-22 | パナソニック株式会社 | カメラ間連結関係情報生成装置 |
DE102007013811A1 (de) * | 2007-03-22 | 2008-09-25 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Verfahren zur zeitlichen Segmentierung eines Videos in Videobildfolgen und zur Auswahl von Keyframes für das Auffinden von Bildinhalten unter Einbeziehung einer Subshot-Detektion |
CN100594713C (zh) * | 2008-04-21 | 2010-03-17 | 中国科学院计算技术研究所 | 一种产生视频大纲的方法和系统 |
WO2009154597A1 (en) * | 2008-06-19 | 2009-12-23 | Thomson Licensing | Adaptive video key frame selection |
JP4623199B2 (ja) * | 2008-10-27 | 2011-02-02 | ソニー株式会社 | 画像処理装置、画像処理方法およびプログラム |
CN101887439B (zh) * | 2009-05-13 | 2014-04-02 | 富士通株式会社 | 生成视频摘要的方法、装置、包含该装置的图像处理系统 |
US8345990B2 (en) * | 2009-08-03 | 2013-01-01 | Indian Institute Of Technology Bombay | System for creating a capsule representation of an instructional video |
JP5394296B2 (ja) * | 2010-03-25 | 2014-01-22 | 富士フイルム株式会社 | 撮像装置及び画像処理方法 |
JP5537285B2 (ja) * | 2010-06-28 | 2014-07-02 | 日本放送協会 | 要約映像生成装置及び要約映像生成プログラム |
US8786597B2 (en) | 2010-06-30 | 2014-07-22 | International Business Machines Corporation | Management of a history of a meeting |
US9171578B2 (en) * | 2010-08-06 | 2015-10-27 | Futurewei Technologies, Inc. | Video skimming methods and systems |
CN102375816B (zh) * | 2010-08-10 | 2016-04-20 | 中国科学院自动化研究所 | 一种在线视频浓缩装置、系统及方法 |
US8687941B2 (en) | 2010-10-29 | 2014-04-01 | International Business Machines Corporation | Automatic static video summarization |
US8914452B2 (en) | 2012-05-31 | 2014-12-16 | International Business Machines Corporation | Automatically generating a personalized digest of meetings |
US9378768B2 (en) * | 2013-06-10 | 2016-06-28 | Htc Corporation | Methods and systems for media file management |
US10075680B2 (en) | 2013-06-27 | 2018-09-11 | Stmicroelectronics S.R.L. | Video-surveillance method, corresponding system, and computer program product |
JP2015046758A (ja) * | 2013-08-28 | 2015-03-12 | ソニー株式会社 | 情報処理装置、情報処理方法及びプログラム |
US10664687B2 (en) | 2014-06-12 | 2020-05-26 | Microsoft Technology Licensing, Llc | Rule-based video importance analysis |
CN105592315A (zh) * | 2015-12-16 | 2016-05-18 | 深圳大学 | 基于视频时空属性的视频特征冗余信息压缩方法及系统 |
US10192584B1 (en) | 2017-07-23 | 2019-01-29 | International Business Machines Corporation | Cognitive dynamic video summarization using cognitive analysis enriched feature set |
AU2018271424A1 (en) | 2017-12-13 | 2019-06-27 | Playable Pty Ltd | System and Method for Algorithmic Editing of Video Content |
CN109104609B (zh) * | 2018-09-12 | 2020-10-30 | 浙江工业大学 | 一种融合hevc压缩域和像素域的镜头边界检测方法 |
CN112560776A (zh) * | 2020-12-25 | 2021-03-26 | 福建海电运维科技有限责任公司 | 一种基于图像识别的智能风机定检方法及系统 |
CN112770116B (zh) * | 2020-12-31 | 2021-12-07 | 西安邮电大学 | 用视频压缩编码信息提取视频关键帧的方法 |
CN113267773B (zh) * | 2021-04-14 | 2023-02-21 | 北京航空航天大学 | 一种基于毫米波雷达的室内人员准确检测和精确定位方法 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5635982A (en) * | 1994-06-27 | 1997-06-03 | Zhang; Hong J. | System for automatic video segmentation and key frame extraction for video sequences having both sharp and gradual transitions |
US5767922A (en) * | 1996-04-05 | 1998-06-16 | Cornell Research Foundation, Inc. | Apparatus and process for detecting scene breaks in a sequence of video frames |
US6366699B1 (en) * | 1997-12-04 | 2002-04-02 | Nippon Telegraph And Telephone Corporation | Scheme for extractions and recognitions of telop characters from video data |
US5956026A (en) * | 1997-12-19 | 1999-09-21 | Sharp Laboratories Of America, Inc. | Method for hierarchical summarization and browsing of digital video |
US6404925B1 (en) * | 1999-03-11 | 2002-06-11 | Fuji Xerox Co., Ltd. | Methods and apparatuses for segmenting an audio-visual recording using image similarity searching and audio speaker recognition |
-
1999
- 1999-06-18 SE SE9902328A patent/SE9902328A0/sv not_active Application Discontinuation
-
2000
- 2000-06-07 CN CNB008089310A patent/CN1213610C/zh not_active Expired - Fee Related
- 2000-06-07 AU AU55831/00A patent/AU771922B2/en not_active Ceased
- 2000-06-07 EP EP00941070A patent/EP1210826B1/en not_active Expired - Lifetime
- 2000-06-07 JP JP2001504689A patent/JP4320141B2/ja not_active Expired - Fee Related
- 2000-06-07 DE DE60039611T patent/DE60039611D1/de not_active Expired - Lifetime
- 2000-06-07 CA CA002375862A patent/CA2375862A1/en not_active Abandoned
- 2000-06-07 WO PCT/SE2000/001178 patent/WO2000079800A1/en active IP Right Grant
- 2000-06-15 US US09/593,819 patent/US6690725B1/en not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
EP1210826B1 (en) | 2008-07-23 |
JP2003502957A (ja) | 2003-01-21 |
US6690725B1 (en) | 2004-02-10 |
CN1213610C (zh) | 2005-08-03 |
AU5583100A (en) | 2001-01-09 |
SE9902328A0 (sv) | 2000-12-19 |
CA2375862A1 (en) | 2000-12-28 |
CN1365574A (zh) | 2002-08-21 |
DE60039611D1 (de) | 2008-09-04 |
SE9902328L (ja) | 1900-01-01 |
AU771922B2 (en) | 2004-04-08 |
WO2000079800A1 (en) | 2000-12-28 |
SE9902328D0 (sv) | 1999-06-18 |
EP1210826A1 (en) | 2002-06-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4320141B2 (ja) | 要約映像生成のための方法とシステム | |
US7046731B2 (en) | Extracting key frames from a video sequence | |
KR100673282B1 (ko) | 비디오/오디오 신호 처리 방법 및 비디오/오디오 신호처리 장치 | |
US7469010B2 (en) | Extracting key frames from a video sequence | |
US5767922A (en) | Apparatus and process for detecting scene breaks in a sequence of video frames | |
US6259828B1 (en) | Sprite-based video coding system with automatic segmentation integrated into coding and sprite building processes | |
KR101456652B1 (ko) | 비디오 인덱싱 및 비디오 시놉시스 방법 및 시스템 | |
KR100729660B1 (ko) | 장면 전환 길이를 이용한 디지털 비디오 인식 시스템 및 방법 | |
JP2008518331A (ja) | リアルタイムビデオ動き解析を通じたビデオコンテンツ理解 | |
JP2006510072A (ja) | 一様なカラーセグメントを検出するための方法及びシステム | |
Kopf et al. | Algorithms for video retargeting | |
JP2002536746A (ja) | 動画シーケンスを表す記述子とその記述子を使用する画像検索システム | |
Jin et al. | Network video summarization based on key frame extraction via superpixel segmentation | |
Kim et al. | Visual rhythm and shot verification | |
Porter et al. | A shortest path representation for video summarisation | |
Zhu et al. | Automatic scene detection for advanced story retrieval | |
Choi et al. | A framework for automatic static and dynamic video thumbnail extraction | |
KR100287559B1 (ko) | 동영상내에서의 장면 전환 검출 간격 최적화 방법 및 그 장치 | |
Lew et al. | Video indexing and understanding | |
EP1752891A2 (en) | Method and apparatus for establishing and browsing a hierarchical video camera motion transition graph. | |
AU762791B2 (en) | Extracting key frames from a video sequence | |
Wang et al. | Video data management using a seeded region growing technique | |
Zhu et al. | Content-based dynamic 3d mosaics | |
Ren et al. | Knowledge-based segmentation and semantic contents extraction from MPEG videos | |
Jeon | Enhanced Video Coding based on Video Analysis and |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20070426 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20080930 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20090105 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20090113 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20090323 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20090519 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20090601 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120605 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 Ref document number: 4320141 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120605 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130605 Year of fee payment: 4 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |