JP3951556B2 - 選択されたクラスタからキーフレームを選択する方法 - Google Patents
選択されたクラスタからキーフレームを選択する方法 Download PDFInfo
- Publication number
- JP3951556B2 JP3951556B2 JP2000153911A JP2000153911A JP3951556B2 JP 3951556 B2 JP3951556 B2 JP 3951556B2 JP 2000153911 A JP2000153911 A JP 2000153911A JP 2000153911 A JP2000153911 A JP 2000153911A JP 3951556 B2 JP3951556 B2 JP 3951556B2
- Authority
- JP
- Japan
- Prior art keywords
- frames
- frame
- cluster
- key
- keyframes
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/70—Information retrieval; Database structures therefor; File system structures therefor of video data
- G06F16/78—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/783—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
- G06F16/7847—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using low-level visual features of the video content
- G06F16/785—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using low-level visual features of the video content using colour or luminescence
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/40—Scenes; Scene-specific elements in video content
- G06V20/46—Extracting features or characteristics from the video content, e.g. video fingerprints, representative shots or key frames
- G06V20/47—Detecting features for summarising video content
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N5/00—Details of television systems
- H04N5/14—Picture signal circuitry for video frequency region
- H04N5/147—Scene change detection
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Library & Information Science (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Image Analysis (AREA)
Description
【発明の属する技術分野】
本発明は、ビデオ画像処理の分野に関する。本発明は、特定の内容を自動的に配置する目的でビデオ画像を処理する分野に関する。詳細には、本発明はビデオの可視内容を表示するか又は要約するために用いられるビデオからのキーフレームの選択に関し、キーフレームは様々な目的のためにキーフレームを利用する各種のアプリケーションのうちの何れか1つによって用いられることができる。
【0002】
【従来の技術】
録画されたミーティング又は発表などのビデオの集積を検討する際、ユーザはこれらのドキュメントの概要にのみ関心をもつことが多い。FXパロアルト研究所(FX Palo Alto Laboratory)では、週1度のスタッフミーティング及び他のセミナーや発表が数個のビデオカメラが装備された会議室において催される。全ての公式のミーティングと大抵の発表がビデオテープに録画され、MPEGコード化され、社内イントラネットを介してスタッフに利用可能とされる。これらのビデオは総計約3時間/週に達し、150時間以上のビデオがデータベース中に存在する。適切なビデオファイルとビデオの関心のある部分とを見つけ出すのは困難なことが多い。ミーティング及びビデオ会議において成された決定の永久的な記録としてビデオが何度も用いられるため、関連する情報を含む部分又はむしろ決定が成されたミーティングを配置することがより重要となる。ユーザが特定のビデオの経過部分を迅速に配置することを助長し、ビデオの可視概要をユーザに提供することが望ましい。
【0003】
キーフレームは、個々のビデオを区別するため、ビデオを要約するため、及びビデオにアクセスポイントを備えるために用いられる。適切なキーフレームはビデオの選択を助長し、記載事項が視覚的に一層注意をひくようにする。しかしながら、ビデオ全体を最もよく表す単一のフレームを決定することは困難である。単一のキーフレームに基いてビデオを区別することもまた困難であるため、多数のキーフレームを備えることが望ましい。上記から明白であるように、ビデオクリップ全体を詳述する1セットのキーフレームを決定する必要性がある。
【0004】
大抵の関連技術が、映画、TVコメディ、及びニュース番組などの専門的に製作された資料に適用された。その技術はビデオをショット毎に分け、次にそれらのショットに対応するキーフレームを見出すことに専念した。この技術の成果は本発明の方法のアプリケーションに直接適用可能ではない。第1に、ビデオテープに録画されたミーティングや発表は特別な様式で製作され、そのため、確立された製作技法に依存するのは妥当ではない。第2に、各ショットから1つ以上のキーフレームを用いることは、多数のアプリケーションに必要とされるよりもたくさんのキーフレームを生じる。
【0005】
文献に述べられる従来システムの多くは、各々の検知されたショットに一定数のキーフレームを用いる。いくつかのシステムは、各ショットの最初のフレムをキーフレームとして用いる。その他のシステムは、2つのキーフレーム、すなわち、各ショットの最初と最後のフレーム、によってショットを表す。他のシステムは、各ショット内のフレームにクラスタリングを行う。最大クラスタの中央に最も近接したフレームがそのショットのキーフレームとして選択される。いくつかのシステムは、カメラの動作によるショットを表す合成画像を生成する。
【0006】
他の従来システムは、より関心のある可視内容を有するショットを表すためによりたくさんのキーフレームを用いる。いくつかのシステムは、ビデオをショットのセグメントに分け、各ショットの最初の鮮明なフレームをキーフレームとして選択する。その前のキーフレームとは十分に異なるそのショット中の他のフレームは、同様にキーフレームとして選定される。
【0007】
キーフレームの数を削減する1つの方法は、重複を取り除くことである。ある従来アプローチは、各ビデオショットに1つのキーフレームを選択する。次に、これらのキーフレームは可視類似性と時間間隔に基いてクラスタ化される。それらの目的は、ビデオの構成を決定するためにショットをグループ化することであるため、時間規定は、時間的に離れて生ずるキーフレームが一緒にグループ化されることを防ぐために用いられる。
【0008】
従来システムは、ビデオを同じ長さの間隔部分に分け、最初と最後のフレームとの間で最も大きな相違を有する間隔部分を決定する。それらの(最初と最後のフレームとの間で最も大きな相違を有する)間隔からは全てのフレームが保持されるが、各々の残りの間隔からは2フレームのみが保持される。プロセスは、所望の数又はそれ以下の数のフレームが残されるまで繰り返される。このアプローチは、かなり局部的な類似性のみを考慮し、フレームの分布又は最小間隔に制限を適用することができない。
【0009】
従来システムは、更に、ショットの境界を無視して均等に離間されたキーフレームを用いる、ビデオシーケンスの代替的描写を提供する。
【0010】
従来システムは、必要数の代表キーフレームを抽出する目的を満たさない。存在するシステムは、キーフレームの数を限定する制御を提供するだけか、又は真の代表フレームを見つけるのに適切なジョブを実行しないか、のいずれかである。加えて、他のシステムはキーフレームの分布とスペーシング(間隔)に時間規定を適用しない。
【0011】
従来の均等に間隔をあけられたキーフレームは、ビデオ内容の十分な記載を提供しない。従って、上記から明白であるように、ビデオ内容の十分な記載を提供するキーフレーム選択方法の必要性が存在する。
【0012】
デジタル化された多数のビデオを含む集積にアクセスする際、適切なビデオファイルと関心のあるビデオ部分との両方を見つけ出すのは従来の方法では困難である。ビデオへのアクセスを提供するために多種のアプリケーションにおいてキーフレームが用いられる。しかしながら、大抵の従来のアルゴリズム(手法)は時間を考慮しない。また、大抵の従来のキーフレーム選択のアプローチは、ショット毎に1つ又は数個のキーフレームを選択する前に、まずビデオをショットに分ける。時間規定はキーフレームを空間的に時間の尺度に位置合わせするため、本発明に従って、選択されたビデオフレーム上に時間規定が定められる。本発明に従って、候補フレームの選択は明示的な事前のショットセグメンテーション(ショットの分割)を何も必要としない。代わりに、実際のショット境界数よりも大幅に多数の候補境界が決定され、それらの境界の前後のフレームが選択される。本発明の方法は、重要なキーフレームを逃さずに、ショット中の有意な変化に快進的に対処する。ほとんどの従来のキーフレーム選択のアルゴリズムは、1ショット毎に少なくとも1つのキーフレームを選択するが、本発明に従った方法は、リクエストされた数のキーフレームだけを戻すことにより、ショット数よりも大幅に少数のキーフレームを選択する。本発明に従った方法は、階層クラスタリング法を用いて候補フレームからキーフレームを選択する。
【0013】
画像の類似性に基いたキーフレームの選択方法は、様々な時間規定に応じる可変数のキーフレームを生成する。階層クラスタリングアプローチは、リクエストされたキーフレームの数だけのクラスタを決定する。時間規定は、各クラスタからどの代表フレームがキーフレームとして選択されるかを決定する。スライド画像や人々のクローズアップなどの特徴の検知は、フレームのクラスタリングを変更して所望の特徴を有するキーフレームを強調するために用いられる。
【0014】
【発明が解決しようとする課題】
本発明は、互いに異なるキーフレームを決定し、ビデオ全体に関する適切な描写を提供する方法を含む。キーフレームは、ビデオを互いに識別し、ビデオを要約し、また、ビデオへのアクセスポイントを提供するために用いられる。本発明の方法は、ビデオ中のフレームをクラスタ化し、各クラスタから代表フレームを選択することにより、何れかの数のキーフレームを決定する。時間規定は数個のクラスタをフィルタリングして、クラスタの代表フレームを決定するために用いられる。ビデオの集積をブラウジング(走査検索)するアプリケーションは、スキミング(ざっと試写すること)を支援し、可視の要約を提供するためにキーフレームを利用する。
【0015】
【課題を解決するための手段】
本発明では、候補フレーム選択の方法は所定の固定された定期間隔においてソースビデオのソースフレームをサンプリングすることを含む。固定された定期間隔はビデオのタイプによる関数であるのが好ましく、約0.2〜0.5秒の範囲内であるのが好ましい。フレームの差異は、各々のサンプリングされたフレームに関して計算され、そのサンプリングされたフレームと前回サンプリングされたフレームとの差異を示す。最大のフレーム差異は候補の境界を表し、N個までの候補フレームを得るために、N/2番目の最大候補境界の前後のフレームが候補フレームとして選択される。任意で、フレームのクラスメンバーシップに従って間隔基準が変更される。フレームのクラスメンバーシップは、任意で画像クラス統計モデルから統計的に計算される。
【0016】
キーフレームを選択する方法は、階層群クラスタリングアルゴリズムを用いてすべての候補フレームを階層2分木にクラスタ化することを含む。まず、全てのフレームは単一フレームのクラスタであると考えられる。あらゆる2つのフレーム(2つのクラスタの各々から1つずつのフレームが選択される)間の最小の対間隔を有する2つのクラスタがより大きなクラスタの2つの成分クラスタとなる。クラスタリングは、単一のルートクラスタが全ての候補フレームを含むまで連続して行われる。任意で、2つのクラスタのメンバの対間隔は、画像クラス統計モデルから統計的に決定されるのが好ましいメンバのクラスメンバーシップに従って変更される。
【0017】
キーフレームが抽出されるM個のクラスタを選択する方法はクラスタの階層2分木の(M−1)個の最大クラスタを分割することを含む。クラスタの大きさは、クラスタに含まれる全てのサブクラスタ内のフレームの数によって決定される。任意で、少なくとも最小時間の中断されないフレームのシーケンスを少なくとも1つ有さないクラスタがフィルタリングされて取り除かれる。像の歪みなどのビデオの人為的誤差を表しがちであるため、単一のフレームを表すクラスタはフィルタリングされて取り除かれるのが好ましい。
【0018】
ビデオの全ての部分のキーフレームの包含を保障し、キーフレーム間の少なくとも最小離間距離を保障することを試みるために、キーフレームを選択する方法は時間規定を適用する。ソースビデオの時間は、等時間間隔に分けられる。間隔部分がキーフレームを有さない場合、少なくとも2つのキーフレームを有するその他の全ての間隔がキーフレーム数の多い順に調べられ、キーフレームを1つも有さない間隔部分内にメンバを有するクラスタ内にキーフレームを見つけようとする。このようなキーフレームが見つかると、メンバはキーフレームとしてクラスタに置き換えられ、それによりキーフレームの分布を広げる。キーフレームの最小離間距離を補償するために、あらゆる2つのキーフレーム間の最小時間が決定される。この最小時間が最小時間の閾値未満である場合、2つの異なるキーフレームが属する2つのクラスタのうちの1つ又は両方から他のキーフレームを見出す試みがなされる。代用を見つけることができない場合、異なるキーフレームのうちの1つが削除される。
【0019】
従って、ビデオ中の全てのフレームの適切な描写を提供する可変数のキーフレームが本発明に従って決定される。本発明に従って、階層クラスタリングが実行され、各クラスタから単一のフレームが選択される。代替案において、ユーザ又はアプリケーションによってより多数又はより少数のキーフレームが求められる場合、本発明に従ってクラスタの数は容易に増加又は減少される。本発明に従って、時間規定は好適でないクラスタをフィルタリングして取り除き、各クラスタ用に代表フレームを選択するために用いられる。キーフレームが時間的に互いに近接しすぎることを防ぐために、本発明は時間規定を用いる。
【0020】
本発明の第1の態様は、ソースビデオのソースフレームからキーフレーム選択のための候補フレームを選択する方法であって、複数のサンプリングされたフレームの各々について、該サンプリングされたフレームと前にサンプリングされたフレームとのフレーム差異を計算するステップと、最大フレーム差異に対応するサンプリングされたフレームを候補フレームとして選択するステップと、を含む、候補フレームを選択する方法である。
【0021】
本発明の第2の態様は、本発明の第1の態様において、前記計算するステップの前に、所定の固定された周期間隔で前記ソースビデオのソースフレームをサンプリングして、複数のサンプルフレームを抽出するステップを更に含む方法である。
【0022】
本発明の第3の態様は、本発明の第2の態様において、サンプルフレームを選択する前記ステップが、N/2番目の最大フレーム差異の前後にサンプリングされたフレームを前記候補フレームとして選択することを特徴とする方法である。
【0023】
本発明の第4の態様は、本発明の第2の態様において、前記フレーム差異が、所定の画像の種類に属すると決定される2つのフレームを得るために変更される方法である。
【0024】
本発明の第5の態様は、本発明の第4の態様において、前記フレーム差異が、信頼評点の利用によって前記所定の画像の種類に属すると決定される2つのフレームを得るために軽減される方法である。信頼評点は、検知された特徴と、統計モデルによる評点の計算を表す。
【0025】
本発明の第6の態様は、本発明の第2の態様において、2つのフレームのうちの少なくとも1つが前記所定の画像の種類に属すると決定される際に、前記フレーム差異が増大される方法である。
【0026】
本発明の第7の態様は、本発明の第2の態様において、前記サンプルフレームを選択するステップが、N個の候補フレームが選択されるまでの最大フレーム差異の前後にサンプリングされたフレームを選択することを含む方法である。
【0027】
本発明の第8の態様は、本発明の第7の態様において、N/2は、前記ソースビデオ中のショット境界の予想される数よりも大幅に大きい方法である。
【0028】
本発明の第9の態様は、(a)最大クラスタをその2つの成分クラスタに分割するステップと、(b)前記ステップ(a)で実行された前記分割からM個未満のクラスタが得られたか否かを決定するステップと、(c)前記ステップ(b)が、前記ステップ(a)で実行された前記分割からM個未満のクラスタが得られたと決定した場合、前記ステップ(a)に戻るステップと、を含むキーフレームが抽出されるM個のクラスタを階層2分木から選択する方法である。
【0029】
本発明の第10の態様は、本発明の第9の態様において、前記ステップ(a)と前記ステップ(b)との間に、少なくとも最小閾値所要時間の中断されないフレームのシーケンスを少なくとも1つ有さないクラスタをフィルタリングして取り除くステップ(d)を更に有する方法である。
【0030】
本発明の第11の態様は、本発明の第10の態様において、前記最小閾値所要時間がソース資料の型から起来する方法である。
【0031】
本発明の第12の態様は、本発明の第9の態様において、前記ステップ(a)と(b)との間に、単一フレームのみを有するクラスタをフィルタリングして取り除くステップ(e)を更に有する方法である。
【0032】
本発明の第13の態様は、(a)前記ソースビデオから複数の候補フレームを選択するステップと、(b)前記候補フレームの各々をそれ自身の対応するクラスタに割り当てるステップと、(c)2つの成分クラスタを含むクラスタを形成するステップと、(d)単一のクラスタが全ての候補フレームを含む場合、前記ステップ(c)に戻るステップと、(e)前記ステップ(c)及び前記ステップ(d)によって形成される、候補フレームの階層2分木からM個のクラスタを選択するステップと、(f)前記ステップ(e)で選択されたM個のクラスタの各々から1つのキーフレームを抽出するステップと、を有する、ソースビデオからM個のキーフレームを選択する方法である。
【0033】
本発明の第14の態様は、本発明の第13の態様において、前記ステップ(c)の2つの成分クラスタは、1つのフレームが2つの成分クラスタの各々から得られるあらゆる2つのフレーム間に最下位最大対間隔を有する2つのクラスタである方法である。
【0034】
本発明の第15の態様は、本発明の第14の態様において、所定の画像の種類に属すると決定される2つのフレームを得るために前記対間隔が変更される方法である。
【0035】
本発明の第16の態様は、本発明の第15の態様において、信頼評点の利用により、前記所定の画像の種類に属すると決定される2つのフレームには、前記対間隔が縮小される方法である。
【0036】
本発明の第17の態様は、本発明の第14の態様において、前記2つのフレームのうちの少なくとも1つが前記所定の画像の種類に属すると決定される際、前記対間隔が拡長される方法である。
【0037】
本発明の第18の態様は、(a)各選択されたクラスタについて、他の選択されたクラスタのメンバによって中断されないメンバの最長シーケンスを決定するステップと、(b)各選択されたクラスタについて、メンバの最長シーケンスの中央に最も近接したフレームを前記選択されたクラスタのキーフレームとして選択するステップと、を有する、選択されたクラスタからキーフレームを選択する方法である。
【0038】
本発明の第19の態様は、本発明の第18の態様において、(c)ソースビデオの所要時間を等しい所要時間の間隔に分割するステップと、(d)等しい所要時間の間隔の各々について、選択されたキーフレームの数を数えるステップと、(e)選択されたキーフレームを得るために、等しい所要時間の間隔を調査するステップと、(f)前記ステップ(e)が、等しい所要時間の間隔が選択されたキーフレームを全く有さないと決定した際、選択されたキーフレームを全く有さない等しい所要時間の間隔中にメンバを有する選択されたクラスタからキーフレームを得るために、少なくとも2つのキーフレームを有する他の等しい所要時間の間隔を降順のキーフレーム計数順序で調査するステップと、(g)前記ステップ(f)が、前記選択されたキーフレームを全く有さない等しい所要時間の間隔中にメンバを見出した場合、前記選択されたキーフレームを全く有さない等しい所要時間の間隔中にメンバを有する前記選択されたクラスタから前記キーフレームを除去するステップと、(h)前記ステップ(f)が、前記選択されたキーフレームを全く有さない等しい所要時間の間隔中にメンバを見出した場合、前記選択されたキーフレームを全く有さない前記等しい所要時間の間隔中のメンバを、前記選択されたキーフレームを全く有さない前記等しい所要時間の間隔のキーフレームとして選択するステップと、(i)全ての等しい所要時間の間隔に前記ステップ(e)が実行されていない場合、前記ステップ(e)に戻るステップと、を更に有する、方法である。
【0039】
本発明の第20の態様は、本発明の第18の態様において、(j)2つのキーフレーム間の最小時間を見出すステップと、(k)2つのキーフレーム間の前記最小時間をキーフレーム離間間隔の最小時間閾値と比較するステップと、(l)前記ステップ(k)が、2つのキーフレーム間の前記最小時間が前記キーフレーム離間間隔の最小閾値未満であると決定する場合、前記2つのキーフレームが属する対応する2つのクラスタについて、フレームが少なくとも前記最小時間閾値によって離間されていると認められるまで、まず、一方のクラスタの、次に他方のクラスタの、及び最終的に同時に両方のクラスタの他のメンバを選択することを試みるステップと、を更に有する方法である。
【0040】
本発明の第21の態様は、本発明の第20の態様において、(m)前記ステップ(l)が、少なくとも前記最小時間閾値によって離間されているフレームを見出さない場合、前記2つのキーフレームのうちの1つを除去するステップと、(n)前記ステップ(l)が実行される場合、ステップ(j)に戻るステップと、を更に有する方法である。
【0041】
キーフレーム抽出機構を用いるアプリケーションは、ビデオテープに録画されたスタッフミーティングや発表の集積にユーザがアクセスすることを可能にする。キーフレームのスキミングインターフェースは、適切なビデオを見つけ出し、その概要を得る作業を大幅に単純化する。本発明のこれら及び他の態様、特徴、及び利点は、発明の実施の形態において完全に説明される図から明白となるであろう。図中では、同様のステップが同様の参照番号によって示される。図は、発明の実施の形態において、記述様式でより綿密に説明される。
【0042】
【発明の実施の形態】
ビデオへのアクセスを提供するための様々な手段において、キーフレームが用いられる。しかしながら、ビデオクリップ全体を適切に説明する1セットのキーフレームを決定することは難しい。加えて、いくつかのアプリケーションは、キーフレームの厳密な数、時間中のキーフレームの最小間隔、時間全体にわたる均等な分布などの付加的な必要条件を確立する。本発明は、ビデオクリップ全体を要約する1セットのキーフレームを抽出すると共に異なる時間規定に従う方法を含む。ショットの数よりも大幅に多数又は大幅に少数のキーフレームを供給する能力とクラスタリングと共に時間規定を利用することは、共に本発明の新たな態様である。
【0043】
図1は、本発明に従った方法を実施するために好適な汎用コンピュータシステム100を示す。汎用コンピュータ100は少なくともマイクロプロセッサ104を含む。この汎用コンピュータは、ランダムアクセスメモリ102、ROM103、キーボード107、及びモデム108を更に含む。汎用コンピュータ100の全ての構成要素は、様々な構成要素間でデータを移送するために共通バス101によって任意で互いに連結される。バス101は一般的にデータ、アドレス、及び制御信号を含む。図1に示される汎用コンピュータ100は、汎用コンピュータ100の全ての構成要素を互いに連結する単一のデータバス101を具備するが、汎用コンピュータ100の様々な構成要素を接続する単一の通信バス101でなくてはならないという必要条件はない。例えば、マイクロプロセッサ104、RAM102、及びROM103は、代わりにデータバスによって互いに連結されると共に、ハードディスク105、モデム108、キーボード107、ディスプレイモニタ106、及びネットワークインターフェース109は第2のデータバス(図示されず)によって互いに接続される。この場合、第1のデータバス101と第2のデータバス(図示されず)は、双方向バスインターフェース(図示されず)によってリンクされる。あるいは、マイクロプロセッサ104及びRAM102などのいくつかの構成要素は、第1のデータバス101及び第2のデータバス(図示されず)の両方に接続され、第1のデータバスと第2のデータバスとの間の通信はマイクロプロセッサ104とRAM102とを介して起こる。ネットワークインターフェース109は、例えば、イーサネット接続を用いて任意のローカルエリアネットワーク(LAN)への通信能力を備える。モデム108は、コンピュータ100が任意で電話システムを介して通信することを可能とする。本発明の方法は、図1に示される100のようなあらゆる汎用コンピュータシステム上で実行可能であるが、このコンピュータシステムが本発明の方法を実行することができる唯一のシステムであると限定されないことは明らかである。
【0044】
2つのアプリケーションがキーフレーム抽出を利用する。第1のアプリケーションは、マウスによって操作されるタイムラインに沿って抽出されたキーフレームの位置を配置する。マウスがタイムライン上を移動する際、マウスによって移動するポインタの位置に最も近接したキーフレームが表示される(図2参照)。アプリケーションはキーフレームが全時間にわたり実際に均等に分布されることを要求するため、ビデオクリップの全ての部分と関連するキーフレームがある。また、アプリケーションは、スキミングを容易にするために、ビデオクリップの長さに依存し、ビデオのショットの数によって決定されない若干数のキーフレームを要する。
【0045】
第2のアプリケーションは、表示を印刷に好適にするために、時間の尺度に付随する全てのキーフレームを同時に表示する(図3参照)。第1のアプリケーションの全ての制限に加え、このアプリケーションはキーフレームが互いに近接しすぎるべきでないという制限を更に有し、そのため、キーフレームは互いにオーバーラップせずに適切な位置に表示される。
【0046】
本発明は、互いに異なるキーフレームを決定する方法を含み、ビデオ全体の適切な描写を提供する。本発明は、階層クラスタリングと時間規定を用いてキーフレームを選択する新規の技術を説明する。同様のフレームがクラスタであるため、各クラスタから1つのフレームを選択することにより、種々のキーフレームが決定される。図4に示されるように、キーフレームを決定する際に、いくつかのステップが実行される。
【0047】
第1に、階層クラスタリングアルゴリズムへの入力として用いられる多数の候補フレームがステップ401において決定される。均等に間隔を置いて配置されたフレームを選択することは、妥当な時間数でクラスタの階層を計算するには多すぎるフレームを戻すか、又は間隔が大きすぎて重要な詳細が頻繁に欠落されるフレーム間の間隔を用いるかのいずれかである。代わりに、本発明に従って互いが既に全く異なるフレームの集積が、用いられる。この集積は、画像を比較して大きな差違を示す隣接するフレームの対を全て収集することにより確定される。比較評点用に一定の閾値をセットするよりもむしろ、それらの隣接フレームとは非常に異なる一定数のフレームが、本発明に従って決定される。
【0048】
次に、本発明に従って、ステップ402において、選択された候補が階層群クラスタリング法によってクラスタ化される。いくつかのクラスタが時間規定を用いてフィルタリングされて取り除かれる。その後、ステップ403において、所望のキーフレームの数に等しい若干数のクラスタが選択される。ステップ404において、本発明に従って、いくつかの時間規定に最も見合うメンバが各クラスタから選択される。本発明に従ったこのような制限は、ビデオの長さ全体にわたるキーフレームの比較的均等な分布とキーフレーム間の最小間隔を必要とする。
【0049】
クローズアップ又はスライド画像などのキーフレームのある種類の強調を変更するために、クラスタリングアルゴリズムによって用いられる間隔機能が本発明に従って変更される。さほど所望されない画像間の間隔を本発明に従って削減することは、さほど所望されない画像が同様のクラスタ中で終結し、そのため、キーフレームのセットの中に少数表示される確度を上昇させる。本発明に従って所望の画像間の間隔を増加させることは、その逆の効果を有する。
【0050】
[候補フレームの選択]
キーフレームの候補を単に一定の間隔でサンプリングするよりも種々のショット又はカメラの配向からそれらを選択するのが望ましい。図5に示されるように、従来、等間隔フレームの集積において、大した変化のない長いシーンがひどく強調される。他のフレームと非常に類似したフレームは、おそらく同じクラスタに終結するであろうため、それらはキーフレームの選択にあまり寄与しない。同時に、非常に短いショットからのフレームは等間隔選択によって省かれるか又は省略される。
【0051】
クラスタリングアルゴリズムの時間の複雑さは、候補の数に関してO(n3)〜O(n4)で、そのため、ただ候補の総数を増加させるよりもむしろ有望な候補を選択することが重要である。図6に示されるようにビデオ中のフレームの階層クラスタリングは、より優れた結果を生じる。選択されたフレームはミーティングに関する適切な説明を提供する。
【0052】
あいにく、クラスタリングは計算上負荷の高い操作で、そのため、ビデオ中の全てのフレームをクラスタ化しようとすることは可能でない。時間の制限を克服するために、互いに異なるキーフレームの候補が本発明に従って収集される。必要とされる候補の最小数は、ビデオ中の変化の量と、以下に述べられる時間規定によってフィルタリングされて取り除かれるであろうクラスタの数とに依存する。各候補境界には、境界の前後のフレームが候補として選択される。1時間のビデオに、1,000個の候補が通常であるが、それよりも多数の候補でもそのアルゴリズムの性能には悪影響を及ぼさず、そのランタイムに悪影響を及ぼすのみである。他のフレームに非常に類似したフレームは、おそらく同じクラスタに終結するであろうため、それらはキーフレームの選択にあまり寄与しない。画像を比較して大きな差違を示す隣接するフレームの全ての対が、本発明に従って集められる。対の片方よりもむしろそれらの両方を含むことは、ビデオのシーケンスが経時的に非常に漸次的に変化する状況を示す。一定の閾値を選択するよりもむしろ、それらの隣接フレームと非常に異なるN個のフレームを有するバッファを保持する。ビデオがバッファの大きさよりも少数のサンプルを含む場合、全てのサンプリングされたフレームがクラスタ化される。そうでなければ、最も有望なもののみが考慮される。
【0053】
従来、ショットの境界が決定され、各ショットから1つ以上のキーフレームが選択される。図7は、図4のステップ401において用いられる本発明に従った候補フレームの選択方法を示す。従来のアプローチと対比すると、本発明に従って、フェードとディゾルブの概要を見て、ステップ701において処理されようとしているフレームの数を減らすため、毎秒2〜5回フレームがサンプリングされる。ステップ702において、サンプリングされたフレームの各々と以前にサンプリングされたフレームとの差異が、全てのサンプリングされたフレームについて、様々な間隔基準のうちのいずれか1つを用いて計算される。録画されたミーティングは2フレーム/秒で処理されるが、TVコマーシャルなどのペースの速い(1秒毎のフレーム数が多い)資料のサンプリング値域は最高位にある。本発明に従った方法において、N個の候補を選択するために、後続のフレーム間でN/2番目の最大間隔(最大差異)が決定され、ステップ703において候補境界として用いられる。N/2は、ソース資料において予期されるショット境界の数よりも大幅に大きいため、本発明に従った方法は、ショット毎に3つまでのフレームを用いる通常のアプローチよりも多数の候補を考究する。ビデオのシーケンス(進行)が非常に漸進的にしかしながら一定に変化し、そのため、そのシーケンスの最初と最後のフレームとに有意な差異がある場合に対処するために候補境界の前後のフレームが共に候補フレームのセットに含まれる。
【0054】
異なるフレーム間の境界は、ショット境界である可能性があるため、本発明に従った方法は暗示的にショットセグメンテーションを実行すると考えられる。平均のショット時間は、資料の混合物において5秒で、そのため、ユーザは約720ショット境界/時間を予想することができる。永久保存(録画)されたミーティングを含む資料のショット境界数はそれよりもかなり少ない。長さ1時間に至るビデオに1300個の候補の使用が、優れた成果を随伴して用いられた。全ての候補フレームが決定されると、図4のステップ402において、本発明に従ってクラスタ化される。
【0055】
[フレームのクラスタリング]
キーフレームの選択に関する本発明の目的は、互いに異なる1セットのキーフレームを決定すること、及びビデオの全てのフレームの適切な描写を提供することである。クラスタリングは同様のフレームを結合し、そのため、各クラスタから1つのフレームを選択することが本発明の目的を満たす。更に、より多数又は少数キーフレームが必要とされる場合、ユーザ又はアプリケーションは、単純に本発明に従ってクラスタの数を増加又は減少させるのみである。
【0056】
フレームを比較するため、多種の一般的な画像比較方法が本発明に従って代替的に用いられる。画像の理想的な比較は、人間の知覚と同様の結果を招く、すなわち、異なると知覚される画像は比較機能から高評点を得ると共に、同様の画像は低評点を得るであろう。画像比較への種々のアプローチは、異なる利点を有する。画素毎の比較は、動きに敏感であるが、その他の点では画像の差異を分類するのに非常に優れている。画素の輝度の比較のみで通常は十分である。わずかな全体的な明るさの変化に対する不変性を得るために、全ての画素の輝度の平均値と標準偏差とを決定することにより、輝度が標準化されるべきである。各画素について、画素値から平均値が減算され、標準偏差によって割算される。画像中の全体的な差異を検知するにはヒストグラムベースのアプローチが非常に適している。画像をいくつかの領域(例えば、3×3グリッド)に分割し、各領域のヒストグラムを計算することは、対象物の大きな動きの影響を低下させる。実験は、ヒストグラムにおいて利用するビンが多すぎると、偽陽性を過剰に発生させる、すなわち、人間の判断では一見同様であるのに画像が異なると考えられる、ことを示した。比較をノイズに対して一層影響を受けにくくするために、平滑なヒストグラムが用いられた。このようなヒストグラムにおいて、各ビンはその内容の一部を隣接するビンに放出する。カラー効果を可能とするために、Y(輝度)にビン8つを、また、U及びV(彩度)にビン4つずつを有するYUV色空間において3次元のヒストグラムが用いられた。画素様式の比較についてと全く同様に、ヒストグラムを形成する前に輝度を標準化するのが有益である。ヒストグラムの比較に関する種々の方法(交差、絶対差の合計、X2検定(CHI square))が、ほぼ同一の結果をもたらした。X2検定は、均等な色の画像(例えばVCRにより背景として生成される)に関して、他の方法よりもはるかに優れた成果を果たした。ヒストグラムベースの比較技法に対する本発明に従った制限は全くないが、本発明の好ましい実施形態において、画像を比較するためにヒストグラム技法が用いられる。画像における全体的な差異を検知するのにヒストグラムベースのアプローチは非常に適している。比較が一層ノイズに対して影響を受けにくくするために、平滑なヒストグラムが用いられた。ヒストグラムの比較にX2検定間隔が用いられるという本発明に従った制限はないが、ヒストグラムを比較するのにX2(X2検定)間隔が用いられるのが好ましい。
【0057】
M個のキーフレームを抽出するために、本発明に従って、資料はM個のクラスタに分割される。このアプローチはクラスタの大きさに適切な閾値を選択することについての問題を回避する。フレームは、ステップ402において階層群クラスタリング法の完全リンク法を用いてクラスタ化されるのが好ましい。小さく、密集した境界のクラスタがその方法の特性である。あいにく、その時間の複雑性は単一リンクなどの他の階層クラスタリング法のものよりも高い。本発明に従って、わずかに異なる結果を随伴する他のクラスタリング法が同様に用いられる。図8は、階層クラスタリングが、最小の結合されたクラスタを作成する2つのクラスタを結合することにより、実行されることを示す。
【0058】
図9は、本発明に従った好ましい階層クラスタリング法を示す。ステップ901に示されるように、まず、各画像はそれ自身のクラスタを表示する。この方法は、クラスタ相互の類似性を決定するために、2つのクラスタ中のフレーム間の最大対間隔を用いる。ステップ902において、2つのサブクラスタの各々から1つのフレームが得られたあらゆる2つのフレーム間の最下位最大対間隔を有する2つのサブクラスタを含むクラスタが形成される。ステップ903において、全ての候補フレームが図8に示されるC1のような単一のルートクラスタに集塊されたか否かが決定される。ツリーの高度又はノードは、結合されたクラスタの直径(2つのサブクラスタのメンバの最大対間隔)を表す。クラスタはクラスタの中心に最も近接したメンバフレームによって表される。ツリー中のフレームは時間的順序ではないことが留意されたい。時間中のフレームの位置は、全ての画像の上部左のフレーム番号によって示唆される(30フレーム/秒)。示される例において、クラスタC1及至C4は5個のキーフレームと分割クラスタの直接の子(図8の太線部分参照)とを抽出するために分割される。
【0059】
非常に均一なソース資料において、画像間隔が狭いならば、同様にクラスタも小さい。多種のシーンを有する資料において、全ての適切なキーフレームが抽出されるのではなく、アプリケーションが要請するだけの数のキーフレームを抽出することがより重要であると考えられる。一般的に、アプリケーションは要請されるキーフレームの数をビデオの合計の長さに基づかせる。図2に示されるアプリケーションは、毎時20個のキーフレームを用いる。
【0060】
[クラスタのフィルタリングアウト(クラスタをフィルタリングして取り除くこと)]
上位M個のクラスタを決定するために、図4のステップ403において最大の(M−1)個のクラスタが分割される。図10において示される例において、クラスタ1、2、及び3は分割され、4つのクラスタ(i1、4、5、及び11)に帰着する。図11は、図4のステップ403に示されるような、本発明に従ってキーフレームが抽出されるであろうクラスタの選択方法を示す。ステップ1101において、最大のクラスタが2つのサブクラスタに分割される。ステップ1102において、少なくとも閾値最小所要時間の中断されないフレームのシーケンスを少なくとも1つ有さないクラスタがフィルタリングされ、取り除かれる。ステップ1103において、M個のクラスタ全てが既に選択されたか否かが決定される。
【0061】
単一の画像のみを含むクラスタはスイッチング(切返し)の歪み又は他のタイプのノイズなどのビデオの人為的誤差を表すことが多い。このような人為的誤差を有するフレームは、キーフレームとして望ましくなく、そのため、ステップ1102において、本発明に従って、対応するクラスタをフィルタリングして取り除くために時間規定が用いられる。一般に、ビデオの人為的誤差及び他の重要でない事象がキーフレームとして用いられていないことを確かめるために、クラスタは最小所要時間の中断されないフレームのシーケンスを少なくとも1つ表すべきである。所要時間の閾値は、ソース資料に依る。より多数のキーフレームが要請される際、制限が緩和されなければならないため、毎時のキーフレームの数は最小所要時間にも影響を及ぼす。種々のソース資料を用いたテストにおいて、キーフレーム間の平均時間の3%を閾値として用いることが好結果を招くことが確認された。例えば、平均して5分(300秒)毎に1つのキーフレームがある場合、各クラスタは、中断されないフレームの9秒のシーケンスを少なくとも1つ有さなければならない。ミーティングのビデオ録画には、10秒の閾値が好結果を導いた。映画やTV番組には、それよりも短い3秒の閾値がより適している。TVコマーシャルは、それよりもいっそう短い1秒の閾値を要する。ステップ1102において、閾値の所要時間を超えた中断されないフレームのシーケンスを少なくとも1つ含まないクラスタがフィルタリングされて取り除かれる。図10に示される例において、i1のみを含むクラスタがフィルタリングされて取り除かれる。M個と同数の選択されたクラスタが戻されるため、より多数のクラスタが最初に選択される必要がある。図10の例において、クラスタi2と7を加えてクラスタ4が同様に分割される。i2のみを含むクラスタが同様にフィルタリングされて取り除かれ、そのため、クラスタ5がクラスタ6及び8を加えて分割される必要がある。これは、クラスタの最終セット、6、7、8、及び11を導く。
【0062】
種々のソース資料には異なる継続時間が割り当てられる。カメラの切替えに起因するビデオのシンクロ現象を表示するフレームを有するクラスタをフィルタリングして取り除くのに、最低2秒の長さで十分であった。このフィルタリングアプローチは候補の数に鋭敏である。1時間のビデオで、1,000個の候補に代わって、200個のみの候補を用いることは、いくつかのクラスタがフィルタ条件を満たすのに十分な数のフレームを含まないため、選択されたキーフレームの品質を顕著に低下させた。候補の数が500個と1,000個とで、品質の変化は非常に少なかった。
【0063】
[クラスタから代表フレームを選択するための時間規定の適用]
図4のステップ404において、時間規定に最も適切なメンバがキーフレームとして各フレームから選択される。このような制限は、いくつかのアプリケーションに備えて、ビデオの長さ全体にわたる比較的一様な分布と、キーフレーム間の最小間隔を必要とする。図12、13、及び14は、本発明に従った時間規定の適用とクラスタからのキーフレームの選択を示す。
【0064】
いくつかの方法は、時間全体にわたり全く一様でなく分布され、また、時には時間中で互いに非常に近接したキーフレームを生じる。キーフレームはアプリケーションのタイムラインに付帯されることが意図されるため、それらを時間全体にわたって散布させるのが望ましい。アプリケーションはビデオの初めから終わりまでのスキミングを援助し、そのため、キーフレームが半ば均等に分布されることが望ましい。キーフレームが時間中に互いに近接しすぎる場合、それは望ましくない。これらの制限は、本発明に従った、クラスタからの代表フレームの適切な選択により定められる。同じクラスタのメンバは、互いに適度に類似しているのが好ましく、そのため、何れのメンバもクラスタの描写とされることができる。これらの制限は、各クラスタからのキーフレームの選択に対して時間規定を適用するための余地を残す。
【0065】
通常、メンバフレームを含むクラスタはビデオの所要時間全体に散布される。ビデオの適切な要約を与えるためにクラスタが統括する1期間から代表フレームを選択するのが望ましい。そのために、ステップ1201において、他の選択されたクラスタのメンバによって中断されない、各々の選択されたクラスタのメンバの最長シーケンスが決定される。ステップ1202において、そのシーケンスの中央に最も近接したフレームが選択される。本発明に従ったこのフレームの選択は、代表フレームと他のクラスタからの何れかのフレームとの間の時間の間隔を最大化し、そのため、キーフレームが互いに近接しすぎない傾向にあるという付加された利益を有する。
【0066】
図10において、画像はそれらの時間的順序で番号を付けられる。クラスタ7は、画像i3、i6、i7を有する唯一の不連続なクラスタである。i6及びi7は最長のシーケンスを表し、両画像はシーケンスの中央から同じ間隔を有する。クラスタ6は、i10、i11、及びi12を含み、そのため、i11が代表フレームとして選択される。
【0067】
ステップ1203において、ソースクリップの合計所要時間が等しい所要時間の間隔に分割される。要請されたキーフレームの数よりも少ない間隔数である必要がある。要請されたキーフレームの半分の数を用いることが好結果を招く。ステップ1204において、その間隔において選択されたキーフレームの数が、各間隔について数えられる。
【0068】
上述の選択法の適用は、キーフレーム間に大きなギャップが全くないことを補償するわけではない。キーフレームの半ば均等な分布を確実にするために、ステップ1203において、ソースクリップの合計所要時間は、各々が少なくとも1つのキーフレームを含むべきである等しい所要時間間隔に分割される。要請されたキーフレームの半分の数の間隔を用いることが好結果を招く。従って、これは本発明に関する制限ではないが、要請されたキーフレームの半分が好ましい間隔の数なのである。
【0069】
図13において、テスト1211は、間隔がその中にキーフレームを有するかどうかを決定する。キーフレームを含まない間隔について、キーフレームは以下のように決定される。ステップ1212において、少なくとも2つのキーフレームを含む全ての間隔が降順のキーフレーム計数順序で調べられる。ステップ1212において、間隔中の各キーフレームについて、対応するクラスタがキーフレームを有さない間隔中にもメンバを有するかが調べられる。このようなメンバが見つかった場合、そのメンバは、ステップ1214においてキーフレームとして用いられ、ステップ1213において以前に選択されたキーフレームは除去される。調査される間隔が更にある場合、テスト1215は残存する間隔について上記のステップを反復する。例えば、フレームi5、i7、i9、及びi11が初期のキーフレームとして選択される。ソースクリップが3つの間隔に分割され、全ての画像が互いに同様の時間間隔を有する場合、第1の間隔は全くキーフレームを含まず、第3の間隔は3つのキーフレームを含む。クラスタ7は、第1の間隔中のフレームも有する第3の間隔中に表される唯一のクラスタである。従って、i7はi3によって置換される。
【0070】
いくつかのアプリケーションはキーフレーム間に最小間隔を要求する。例えば、全てのキーフレームを適切な位置のタイムラインに付帯させるため、又は、キーフレームを介したスキミングを向上させるため、などが挙げられる。図14は、キーフレーム間の最小の許容可能な離間距離を保障する本発明に従った方法を示す。ステップ1221においてキーフレーム間の最小時間の閾値が決定された後、本発明に従って以下の方法が適用される。まず、ステップ1222において、あらゆる2つの選択されたキーフレーム間の最小時間が決定される。その時間が要求された閾値時間よりも長い場合、テスト1223が、方法が終了したことを示唆する。あらゆる2つの選択されたキーフレーム間の最小時間が最小時間の閾値よりも短い場合、ステップ1224において、キーフレームが属する2つのクラスタについて、本方法は、最小間隔の必要条件に応じたフレームが見つかるまで、まず一方のクラスタについて、次に他方のクラスタについて、及び最終的に同時に両方のクラスタについて、他のメンバを選択しようと試みる。このようなクラスタメンバが見つからない場合、ステップ1225は、選択されたキーフレームの数を減らし、2つの矛盾するフレームのうちの1つを除去する。上記ステップ1222及至1225は、全てのフレームが制限を満たすまで反復される。
【0071】
例として、この方法は、図15の上部に示される5つの選択されたキーフレームに、2分(3600フレーム)の最小間隔の必要条件と共に適用される。フレーム23745と23835は90フレーム離れているのみである。両方とも単一のフレームのみを含むクラスタから生来するため、代替物は全く取得できない。フレーム23835がドロップされ、本方法は4つのキーフレームによって継続される。フレーム27678と29361との間の間隔は1683フレームである。フレーム29361の置換えにフレーム75を選択することは、全ての他方のキーフレームへの間隔を最大化する。ここで、いずれか2つのキーフレームの最小間隔は3933フレームで、方法は終了する。図15の下部は得られたキーフレームを示す。
【0072】
[ビデオの特徴の強調]
数種の画像がキーフレームとして好ましい。例えば、人々のクローズアップは長いショットよりも優れた情報を提供しがちである。加えて、スライドの画像はビデオの画像よりも更に互いに異なることが多い。その傾向が確認されないままである場合、キーフレームのセットは多量のスライド画像によって占められる。従って、選択されたキーフレームのセットにおいて、人々のクローズアップなどの画像の割合を増加させ、スライド画像の割合を減少させるのが望ましい。
【0073】
ある一定の種類のキーフレームを強調するか又は強調しないために、本発明に従い、比較の評点がクラスメンバーシップ(種類の帰属関係)に依って変更される。信頼評点は、検知された特徴と、統計モデルによるこのような評点の計算を表す。1つの例はマイクロソフトパワーポイントスライドの検知である。図16は、スライドの存在の確度をタイムラインに沿ったグレースケールのプロットとして示す。このようなスライドは、互いにかなり異なることが多く、そのため、それらは選択されたキーフレームのセットを支配しうる。この影響を回避し、その種類の画像を強調しないために、特徴信頼度が共に閾値β(例えば、0.5)を上回る場合、2つの画像の間隔基準は、特徴信頼度の積のα倍の係数によって減少される。特徴が強調される必要がある場合、代わりに、特徴の種類に属さない全てのものの強調をやめることによって、すなわち、否定された信頼度を用いることにより、同様のアプローチが取られる。
【0074】
【式1】
ここで、conf(a)は画像aの特徴信頼度を示し、dist(a,b)は画像a,bの間隔基準を示すものである。
【0075】
本発明に従った間隔関数の操作は、クラスタリング作用を操作するのに十分で、そのため、あまり望ましくない画像は一緒にクラスタ化されがちである。録画(永久保存)されたミーティングの集積のために、本発明に従ったこのアプローチはキーフレーム中に備えられるスライド画像の数をスライド描写毎に1つ又は2つに減少させた。
【0076】
[キーフレームのアプリケーション]
ミーティング及び他の出来事のデジタル化されたビデオの大きな集積へのアクセスを容易にするために、ウェブベースのビデオディレクトリブラウザがビデオのディレクトリの一覧表を表す(図16参照)。ビデオはディレクトリの内容(例えば、スタッフミーティング、セミナーの発表、会議のレポート)によって構成され、各ディレクトリ内の日付によってソートされる。ビデオ上をクリックすることより、ビューワが開かれ再生される。標準ウェブブラウザ及びMPEGファイルフォーマットの利用は、付加的なソフトウェア又はプラグインを必要とせずにほぼ全ての可能性のあるユーザのビデオ記録への随時のアクセスを可能にする。ビデオへのアクセスを容易にするために、キーフレームを選択するための上述の方法に従ってキーフレームが定められる。
【0077】
各ビデオディレクトリの一覧表は、所望のビデオの認識を助長し、及びビデオにアクセスポイントを定めるために、代表フレームによって向上される。適切に選択されたキーフレームは、ビデオの選択を助長し、一覧表をよりいっそう視覚的に興味をそそるようにする。単一のキーフレームに基づいてビデオを識別するのは困難であるため、本発明に従って多数のキーフレームが定められる。まず、ビデオデータアドミニストレータによって選択されたキーフレームがキーフレームウィンドウに表示される(図17参照)。キーフレームの位置は、キーフレームに隣接するマウスセンシティブ(マウスによって操作される)のタイムスケールに沿った青の三角形でマークされる。マウスがタイムライン上を移動する(図17において手のカーソルとして示される)際、親指のマークがタイムライン上の位置を示し、マウスの位置に最も近接したキーフレームが表示され、そのキーフレームの三角形が赤に変わる。この方法は、1度に単一のキーフレームのみを示し、画面の空間を保存すると共に、単純なマウスの動作を介しての他のフレームのアクセスを可能にする。このインターフェースは、ビデオの内容の適切な印象を提供する非常に迅速なスキミングを援助する。タイムスケール上のあらゆる場所をクリックすることにより、ビデオが開かれ、対応する時間のビデオ再生が開始される。この方法において、複数のキーフレームを用いることは、ビデオの前後関係及び時系的構造の知識をユーザに与える。
【0078】
キーフレームの数はズームイン又はズームアウトすることによって変更される。ズーミングは画面上のタイムスケールの幅を変更させる。画面上のキーフレーム間の平均間隔は同様のままであるため、タイムスケールの幅を増幅させることは、付随するキーフレームの数も増加させる(図17参照)。
【0079】
本発明はその好ましい実施形態に関して説明されたが、その実施形態は限定としてではなく実施例として表される。本発明の精神及び範囲から逸脱せずに様々な付加及び変形が成されうることが理解されるべきである。従って、全てのこのような付加物及び変形例は、添付の請求の範囲に詳述されるような本発明の精神及び範囲によって見出されると考えられる。
【図面の簡単な説明】
【図1】本発明に従った方法を実行するために好適な汎用コンピュータの構成を示す略図である。
【図2】本発明に従った方法の実行に起因するキーフレームを利用するアプリケーションの表示例を示す。
【図3】本発明に従った方法の実行に起因するキーフレームを利用するもう1つのアプリケーションの表示例を示す。
【図4】本発明に従った、ソースビデオからキーフレームを選択する方法におけるステップを示す高レベルフローチャートである。
【図5】ソースビデオから固定された定期間隔で得られた等間隔キーフレームの集積を示す。
【図6】ソースビデオ中のフレームの階層クラスタリングから得られるキーフレームの集積を示す。
【図7】本発明に従ったクラスタリングの前に、候補フレームの選択において実行されるステップを示すフローチャートである。
【図8】本発明に従った候補フレームの階層クラスタリングとキーフレームの抽出に因るクラスタの選択の結果を示す2分木である。
【図9】本発明に従った候補フレームのクラスタリングにおいて実行されるステップを示すフローチャートである。
【図10】本発明に従った候補フレームの階層クラスタリングの結果を示すもう1つの2分木である。
【図11】本発明に従って、キーフレームが抽出されるクラスタの選択を示すフローチャートである。
【図12】本発明に従って、他の選択されたクラスタのメンバによって中断されないクラスタメンバの最長のシーケンスの中央に最も近接したフレームを各々の選択されたクラスタのキーフレームとして選択するために、時間規定を適用する方法を示すフローチャートである。
【図13】本発明に従って、何れのキーフレームも有さない大きなギャップを発生させないよう、ソースビデオの全ての部分にわたる十分なキーフレームの包含を可能にすることを試みるために時間規定を適用する方法を示すフローチャートである。
【図14】本発明に従って、少なくともキーフレーム間の最小時間の離間距離を補償するために時間規定を適用する方法を示すフローチャートである。
【図15】本発明に従って、少なくともキーフレーム間の最小時間の離間距離を補償するための図14に示される方法の実行前と実行後のキーフレームとそれらの位置を示す。
【図16】ビデオのディレクトリ一覧表を表すウェブベースのビデオディレクトリブラウザを示す。
【図17】図16に示されるウェブベースのビデオディレクトリブラウザの用法を示す。
【符号の説明】
102 RAM
103 ROM
104 マイクロプロセッサ
105 ハードディスク
106 ディスプレイモニタ
107 キーボード
108 モデム
109 ネットワークインターフェース
Claims (3)
- プロセッサと、
記憶手段と、
を備えたシステムにおいて、選択されたクラスタからキーフレームを選択する方法であって、
前記プロセッサが、
(a)前記記憶手段に記憶されている選択されたクラスタの各々について、他の選択されたクラスタのメンバによって中断されないメンバの最長シーケンスを決定し、
(b)各選択されたクラスタについて、メンバの最長シーケンスの中央に最も近接したフレームを前記選択されたクラスタのキーフレームとして選択して前記記憶手段に記憶し、
(c)ソースビデオの所要時間を等しい所要時間の間隔に分割し、
(d)等しい所要時間の間隔の各々について、選択されたキーフレームの数を数え、
(e)選択されたキーフレームを得るために、等しい所要時間の間隔を調査し、
(f)前記(e)が、等しい所要時間の間隔が選択されたキーフレームを全く有さないと決定した際、選択されたキーフレームを全く有さない等しい所要時間の間隔中にメンバを有する選択されたクラスタからキーフレームを得るために、少なくとも2つのキーフレームを有する他の等しい所要時間の間隔を降順のキーフレーム計数順序で調査し、
(g)前記(f)が、前記選択されたキーフレームを全く有さない等しい所要時間の間隔中にメンバを見出した場合、前記選択されたキーフレームを全く有さない等しい所要時間の間隔中にメンバを有する前記選択されたクラスタから前記キーフレームを除去し、
(h)前記(f)が、前記選択されたキーフレームを全く有さない等しい所要時間の間隔中にメンバを見出した場合、前記選択されたキーフレームを全く有さない前記等しい所要時間の間隔中のメンバを、前記選択されたキーフレームを全く有さない前記等しい所要時間の間隔のキーフレームとして選択して前記記憶手段に記憶し、
(i)全ての等しい所要時間の間隔に前記(e)が実行されていない場合、前記(e)に戻る、
選択されたクラスタからキーフレームを選択する方法。 - (j)2つのキーフレーム間の最小時間を見出し、
(k)2つのキーフレーム間の前記最小時間をキーフレーム離間間隔の最小時間閾値と比較し、
(l)前記(k)が、2つのキーフレーム間の前記最小時間が前記キーフレーム離間間隔の最小閾値未満であると決定する場合、前記2つのキーフレームが属する対応する2つのクラスタについて、フレームが少なくとも前記最小時間閾値によって離間されていると認められるまで、まず、一方のクラスタの、次に他方のクラスタの、及び最終的に同時に両方のクラスタの他のメンバを選択することを試みる、
ことを更に含む、請求項1に記載の方法。 - (m)前記(l)が、少なくとも前記最小時間閾値によって離間されているフレームを見出さない場合、前記2つのキーフレームのうちの1つを除去し、
(n)前記(l)が実行される場合、(j)に戻る、
ことを更に含む、請求項2に記載の方法。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US09/322,842 US6807306B1 (en) | 1999-05-28 | 1999-05-28 | Time-constrained keyframe selection method |
US322842 | 1999-05-28 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2001022792A JP2001022792A (ja) | 2001-01-26 |
JP3951556B2 true JP3951556B2 (ja) | 2007-08-01 |
Family
ID=23256672
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2000153911A Expired - Fee Related JP3951556B2 (ja) | 1999-05-28 | 2000-05-25 | 選択されたクラスタからキーフレームを選択する方法 |
Country Status (2)
Country | Link |
---|---|
US (1) | US6807306B1 (ja) |
JP (1) | JP3951556B2 (ja) |
Families Citing this family (86)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7184100B1 (en) * | 1999-03-24 | 2007-02-27 | Mate - Media Access Technologies Ltd. | Method of selecting key-frames from a video sequence |
US7016540B1 (en) * | 1999-11-24 | 2006-03-21 | Nec Corporation | Method and system for segmentation, classification, and summarization of video images |
US6925602B1 (en) * | 2000-03-20 | 2005-08-02 | Intel Corporation | Facilitating access to digital video |
KR20020059706A (ko) * | 2000-09-08 | 2002-07-13 | 요트.게.아. 롤페즈 | 저장 매체상에 저장된 정보 신호를 재생하는 장치 |
US8872979B2 (en) * | 2002-05-21 | 2014-10-28 | Avaya Inc. | Combined-media scene tracking for audio-video summarization |
US7383508B2 (en) * | 2002-06-19 | 2008-06-03 | Microsoft Corporation | Computer user interface for interacting with video cliplets generated from digital video |
US7242809B2 (en) * | 2003-06-25 | 2007-07-10 | Microsoft Corporation | Digital video segmentation and dynamic segment labeling |
JP4047264B2 (ja) * | 2003-09-30 | 2008-02-13 | 株式会社東芝 | 動画像処理装置、動画像処理方法および動画像処理プログラム |
US7778469B2 (en) * | 2003-10-03 | 2010-08-17 | Fuji Xerox Co., Ltd. | Methods and systems for discriminative keyframe selection |
US8472792B2 (en) | 2003-12-08 | 2013-06-25 | Divx, Llc | Multimedia distribution system |
US7519274B2 (en) | 2003-12-08 | 2009-04-14 | Divx, Inc. | File format for multiple track digital data |
TWI247212B (en) * | 2004-07-13 | 2006-01-11 | Avermedia Tech Inc | Method for searching image differences in recorded video data of surveillance system |
US7752548B2 (en) * | 2004-10-29 | 2010-07-06 | Microsoft Corporation | Features such as titles, transitions, and/or effects which vary according to positions |
JP2006165824A (ja) * | 2004-12-03 | 2006-06-22 | Fuji Xerox Co Ltd | 画像表示プログラム、画像表示方法及び画像表示装置 |
KR100652703B1 (ko) * | 2004-12-08 | 2006-12-01 | 엘지전자 주식회사 | 휴대단말기의 동영상 검색장치 및 방법 |
GB2421135A (en) * | 2004-12-09 | 2006-06-14 | Sony Uk Ltd | User resizable video display of catalogue entries |
JP4778253B2 (ja) * | 2005-03-29 | 2011-09-21 | 株式会社日立製作所 | コンテンツ情報表示装置 |
US7526725B2 (en) * | 2005-04-08 | 2009-04-28 | Mitsubishi Electric Research Laboratories, Inc. | Context aware video conversion method and playback system |
US20060271855A1 (en) * | 2005-05-27 | 2006-11-30 | Microsoft Corporation | Operating system shell management of video files |
US20070030396A1 (en) * | 2005-08-05 | 2007-02-08 | Hui Zhou | Method and apparatus for generating a panorama from a sequence of video frames |
US8233708B2 (en) * | 2005-08-17 | 2012-07-31 | Panasonic Corporation | Video scene classification device and video scene classification method |
GB2430596A (en) * | 2005-09-22 | 2007-03-28 | Jfdi Engineering Ltd | An image stream search tool |
US7739599B2 (en) * | 2005-09-23 | 2010-06-15 | Microsoft Corporation | Automatic capturing and editing of a video |
US8818916B2 (en) * | 2005-10-26 | 2014-08-26 | Cortica, Ltd. | System and method for linking multimedia data elements to web pages |
US8326775B2 (en) * | 2005-10-26 | 2012-12-04 | Cortica Ltd. | Signature generation for multimedia deep-content-classification by a large-scale matching system and method thereof |
EP1999883A4 (en) | 2006-03-14 | 2013-03-06 | Divx Llc | FEDERATED DIGITAL RIGHTS MANAGEMENT SYSTEM COMPRISING CONFIDENCE SYSTEMS |
US7860343B2 (en) * | 2006-04-10 | 2010-12-28 | Nokia Corporation | Constructing image panorama using frame selection |
US7945142B2 (en) * | 2006-06-15 | 2011-05-17 | Microsoft Corporation | Audio/visual editing tool |
US7869658B2 (en) * | 2006-10-06 | 2011-01-11 | Eastman Kodak Company | Representative image selection based on hierarchical clustering |
JP2008113301A (ja) * | 2006-10-31 | 2008-05-15 | Hitachi Ltd | ビデオ送信装置及びビデオ送信方法 |
US8793577B2 (en) * | 2007-01-11 | 2014-07-29 | Koninklijke Philips N.V. | Method and apparatus for providing an undo/redo mechanism |
JP5060224B2 (ja) * | 2007-09-12 | 2012-10-31 | 株式会社東芝 | 信号処理装置及びその方法 |
AU2007231756B2 (en) * | 2007-10-30 | 2011-04-07 | Canon Kabushiki Kaisha | A method of segmenting videos into a hierachy of segments |
EP2223232A4 (en) | 2007-11-16 | 2015-02-25 | Sonic Ip Inc | Hierarchical and reduced index structures for multimedia files |
US8997161B2 (en) | 2008-01-02 | 2015-03-31 | Sonic Ip, Inc. | Application enhancement tracks |
US8386942B2 (en) * | 2008-04-14 | 2013-02-26 | Disney Enterprises, Inc. | System and method for providing digital multimedia presentations |
JPWO2009145071A1 (ja) * | 2008-05-28 | 2011-10-06 | 国立大学法人 東京大学 | 運動データベース構造、および当該運動データベース構造のための運動データ正規化方法、並びに当該運動データベース構造を用いた検索装置及び方法 |
US8150169B2 (en) * | 2008-09-16 | 2012-04-03 | Viewdle Inc. | System and method for object clustering and identification in video |
US8510303B2 (en) | 2009-01-07 | 2013-08-13 | Divx, Llc | Singular, collective and automated creation of a media guide for online content |
US8184913B2 (en) * | 2009-04-01 | 2012-05-22 | Microsoft Corporation | Clustering videos by location |
US9565479B2 (en) * | 2009-08-10 | 2017-02-07 | Sling Media Pvt Ltd. | Methods and apparatus for seeking within a media stream using scene detection |
US8280158B2 (en) * | 2009-10-05 | 2012-10-02 | Fuji Xerox Co., Ltd. | Systems and methods for indexing presentation videos |
CN101727949B (zh) * | 2009-10-31 | 2011-12-07 | 华为技术有限公司 | 定位播放视频的装置、方法及系统 |
CA2782825C (en) | 2009-12-04 | 2016-04-26 | Divx, Llc | Elementary bitstream cryptographic material transport systems and methods |
JP5522790B2 (ja) * | 2010-07-16 | 2014-06-18 | 日本放送協会 | テンプレート画像生成装置およびテンプレート画像生成プログラム |
CN102402536A (zh) * | 2010-09-13 | 2012-04-04 | 索尼公司 | 从视频中提取关键帧的方法和设备 |
US9247312B2 (en) | 2011-01-05 | 2016-01-26 | Sonic Ip, Inc. | Systems and methods for encoding source media in matroska container files for adaptive bitrate streaming using hypertext transfer protocol |
US8818171B2 (en) | 2011-08-30 | 2014-08-26 | Kourosh Soroushian | Systems and methods for encoding alternative streams of video for playback on playback devices having predetermined display aspect ratios and network connection maximum data rates |
US9467708B2 (en) | 2011-08-30 | 2016-10-11 | Sonic Ip, Inc. | Selection of resolutions for seamless resolution switching of multimedia content |
KR102163151B1 (ko) | 2011-08-30 | 2020-10-08 | 디빅스, 엘엘씨 | 복수의 최대 비트레이트 레벨들을 사용하여 인코딩된 비디오를 인코딩하고 스트리밍하기 위한 시스템들 및 방법들 |
US8909922B2 (en) | 2011-09-01 | 2014-12-09 | Sonic Ip, Inc. | Systems and methods for playing back alternative streams of protected content protected using common cryptographic information |
US8964977B2 (en) | 2011-09-01 | 2015-02-24 | Sonic Ip, Inc. | Systems and methods for saving encoded media streamed using adaptive bitrate streaming |
US11314405B2 (en) * | 2011-10-14 | 2022-04-26 | Autodesk, Inc. | Real-time scrubbing of online videos |
CN107967115A (zh) * | 2011-12-31 | 2018-04-27 | 诺基亚技术有限公司 | 使元素被显示 |
US20130179199A1 (en) | 2012-01-06 | 2013-07-11 | Rovi Corp. | Systems and methods for granting access to digital content using electronic tickets and ticket tokens |
US9201964B2 (en) * | 2012-01-23 | 2015-12-01 | Microsoft Technology Licensing, Llc | Identifying related entities |
EP2642487A1 (en) * | 2012-03-23 | 2013-09-25 | Thomson Licensing | Personalized multigranularity video segmenting |
US9197685B2 (en) | 2012-06-28 | 2015-11-24 | Sonic Ip, Inc. | Systems and methods for fast video startup using trick play streams |
US9143812B2 (en) | 2012-06-29 | 2015-09-22 | Sonic Ip, Inc. | Adaptive streaming of multimedia |
US10452715B2 (en) | 2012-06-30 | 2019-10-22 | Divx, Llc | Systems and methods for compressing geotagged video |
WO2014015110A1 (en) | 2012-07-18 | 2014-01-23 | Verimatrix, Inc. | Systems and methods for rapid content switching to provide a linear tv experience using streaming content distribution |
US9336302B1 (en) | 2012-07-20 | 2016-05-10 | Zuci Realty Llc | Insight and algorithmic clustering for automated synthesis |
US8914836B2 (en) | 2012-09-28 | 2014-12-16 | Sonic Ip, Inc. | Systems, methods, and computer program products for load adaptive streaming |
US8997254B2 (en) | 2012-09-28 | 2015-03-31 | Sonic Ip, Inc. | Systems and methods for fast startup streaming of encrypted multimedia content |
US9264475B2 (en) | 2012-12-31 | 2016-02-16 | Sonic Ip, Inc. | Use of objective quality measures of streamed content to reduce streaming bandwidth |
US9191457B2 (en) | 2012-12-31 | 2015-11-17 | Sonic Ip, Inc. | Systems, methods, and media for controlling delivery of content |
US9313510B2 (en) | 2012-12-31 | 2016-04-12 | Sonic Ip, Inc. | Use of objective quality measures of streamed content to reduce streaming bandwidth |
US9906785B2 (en) | 2013-03-15 | 2018-02-27 | Sonic Ip, Inc. | Systems, methods, and media for transcoding video data according to encoding parameters indicated by received metadata |
US10397292B2 (en) | 2013-03-15 | 2019-08-27 | Divx, Llc | Systems, methods, and media for delivery of content |
US9344517B2 (en) | 2013-03-28 | 2016-05-17 | Sonic Ip, Inc. | Downloading and adaptive streaming of multimedia content to a device with cache assist |
US9247317B2 (en) | 2013-05-30 | 2016-01-26 | Sonic Ip, Inc. | Content streaming with client device trick play index |
US9094737B2 (en) | 2013-05-30 | 2015-07-28 | Sonic Ip, Inc. | Network video streaming with trick play based on separate trick play files |
US9967305B2 (en) | 2013-06-28 | 2018-05-08 | Divx, Llc | Systems, methods, and media for streaming media content |
US9343112B2 (en) | 2013-10-31 | 2016-05-17 | Sonic Ip, Inc. | Systems and methods for supplementing content from a server |
US9866878B2 (en) | 2014-04-05 | 2018-01-09 | Sonic Ip, Inc. | Systems and methods for encoding and playing back video at different frame rates using enhancement layers |
US20170092334A1 (en) * | 2015-09-25 | 2017-03-30 | Kabushiki Kaisha Toshiba | Electronic device and method for visualizing audio data |
CN105677739B (zh) * | 2015-12-29 | 2019-04-30 | 东方网力科技股份有限公司 | 一种视频索引设置方法和装置 |
US10075292B2 (en) | 2016-03-30 | 2018-09-11 | Divx, Llc | Systems and methods for quick start-up of playback |
US10148989B2 (en) | 2016-06-15 | 2018-12-04 | Divx, Llc | Systems and methods for encoding video content |
US11205103B2 (en) | 2016-12-09 | 2021-12-21 | The Research Foundation for the State University | Semisupervised autoencoder for sentiment analysis |
US10498795B2 (en) | 2017-02-17 | 2019-12-03 | Divx, Llc | Systems and methods for adaptive switching between multiple content delivery networks during adaptive bitrate streaming |
CN110096945B (zh) * | 2019-02-28 | 2021-05-14 | 中国地质大学(武汉) | 基于机器学习的室内监控视频关键帧实时提取方法 |
CN111586412B (zh) * | 2020-05-06 | 2022-07-26 | 华为技术有限公司 | 高清视频处理方法、主设备、从设备和芯片系统 |
CN112016437B (zh) * | 2020-08-26 | 2023-02-10 | 中国科学院重庆绿色智能技术研究院 | 一种基于人脸视频关键帧的活体检测方法 |
CN116634144A (zh) * | 2022-02-10 | 2023-08-22 | 华为技术有限公司 | 视频传输方法及装置 |
CN116824463B (zh) * | 2023-08-31 | 2023-12-19 | 江西啄木蜂科技有限公司 | 视频的关键帧提取方法、计算机可读存储介质及电子设备 |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5513306A (en) * | 1990-08-09 | 1996-04-30 | Apple Computer, Inc. | Temporal event viewing and editing system |
US5635982A (en) * | 1994-06-27 | 1997-06-03 | Zhang; Hong J. | System for automatic video segmentation and key frame extraction for video sequences having both sharp and gradual transitions |
US5708767A (en) * | 1995-02-03 | 1998-01-13 | The Trustees Of Princeton University | Method and apparatus for video browsing based on content and structure |
JPH09130732A (ja) * | 1995-11-01 | 1997-05-16 | Matsushita Electric Ind Co Ltd | シーンチェンジ検出方法および動画像編集装置 |
US5832182A (en) * | 1996-04-24 | 1998-11-03 | Wisconsin Alumni Research Foundation | Method and system for data clustering for very large databases |
KR100194923B1 (ko) * | 1996-06-21 | 1999-06-15 | 윤종용 | 동영상 정보 검색장치 및 방법 |
US6125229A (en) * | 1997-06-02 | 2000-09-26 | Philips Electronics North America Corporation | Visual indexing system |
US6195458B1 (en) * | 1997-07-29 | 2001-02-27 | Eastman Kodak Company | Method for content-based temporal segmentation of video |
US5956026A (en) * | 1997-12-19 | 1999-09-21 | Sharp Laboratories Of America, Inc. | Method for hierarchical summarization and browsing of digital video |
-
1999
- 1999-05-28 US US09/322,842 patent/US6807306B1/en not_active Expired - Lifetime
-
2000
- 2000-05-25 JP JP2000153911A patent/JP3951556B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
US6807306B1 (en) | 2004-10-19 |
JP2001022792A (ja) | 2001-01-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3951556B2 (ja) | 選択されたクラスタからキーフレームを選択する方法 | |
Girgensohn et al. | Time-constrained keyframe selection technique | |
US8818038B2 (en) | Method and system for video indexing and video synopsis | |
JP4426966B2 (ja) | スケーラブルなビデオ要約およびナビゲーションのシステムおよび方法 | |
US8620037B2 (en) | Human image retrieval system | |
US5821945A (en) | Method and apparatus for video browsing based on content and structure | |
EP0729117B1 (en) | Method and apparatus for detecting a point of change in moving images | |
US5708767A (en) | Method and apparatus for video browsing based on content and structure | |
US8316301B2 (en) | Apparatus, medium, and method segmenting video sequences based on topic | |
US7020351B1 (en) | Method and apparatus for enhancing and indexing video and audio signals | |
JP5005154B2 (ja) | 記憶媒体上に記憶された情報信号を再生する装置 | |
Srinivasan et al. | " What is in that video anyway?": In Search of Better Browsing | |
WO2001028238A2 (en) | Method and apparatus for enhancing and indexing video and audio signals | |
JP2005243035A (ja) | アンカーショット決定方法及び決定装置 | |
Zhang | Content-based video browsing and retrieval | |
JP2006081021A (ja) | 電子アルバム表示システム、電子アルバム表示方法、電子アルバム表示プログラム、画像分類装置、画像分類方法、及び画像分類プログラム | |
KR101536930B1 (ko) | 동영상을 요약하는 방법 및 동영상 요약기, 그리고 이를 이용한 동영상 만화 정보 서비스 방법 | |
WO1999005865A1 (en) | Content-based video access | |
KR20050033075A (ko) | 비디오 이미지들의 시퀀스에서 콘텐트 속성을 검출하는 유닛 및 방법 | |
Zhu et al. | Automatic scene detection for advanced story retrieval | |
GB2387710A (en) | Digital video editing | |
JP3802964B2 (ja) | 映像編集システムおよび動画像分割方法 | |
Das et al. | A New Hybrid Approach to Video Organization for Content-Based Indexing. | |
Aggarwal et al. | Automated Navigation System for News Videos: A Survey | |
KR20230070585A (ko) | 동영상에서 주역 및 배경인물 감지 방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20040126 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20070109 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20070308 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20070403 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20070416 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110511 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110511 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120511 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130511 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130511 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140511 Year of fee payment: 7 |
|
LAPS | Cancellation because of no payment of annual fees |