JP2001527344A - ビデオーケンスにおける転換の検出 - Google Patents
ビデオーケンスにおける転換の検出Info
- Publication number
- JP2001527344A JP2001527344A JP2000526044A JP2000526044A JP2001527344A JP 2001527344 A JP2001527344 A JP 2001527344A JP 2000526044 A JP2000526044 A JP 2000526044A JP 2000526044 A JP2000526044 A JP 2000526044A JP 2001527344 A JP2001527344 A JP 2001527344A
- Authority
- JP
- Japan
- Prior art keywords
- frame
- fdm
- frames
- threshold
- value
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N5/00—Details of television systems
- H04N5/14—Picture signal circuitry for video frequency region
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N5/00—Details of television systems
- H04N5/14—Picture signal circuitry for video frequency region
- H04N5/147—Scene change detection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/40—Scenes; Scene-specific elements in video content
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/142—Detection of scene cut or scene change
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/179—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a scene or a shot
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/60—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/85—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
- H04N19/87—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression involving scene cut or scene change detection in combination with video compression
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B27/00—Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
- G11B27/10—Indexing; Addressing; Timing or synchronising; Measuring tape travel
- G11B27/19—Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier
- G11B27/28—Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Image Analysis (AREA)
- Television Signal Processing For Recording (AREA)
- Picture Signal Circuits (AREA)
- Processing Of Color Television Signals (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Testing, Inspecting, Measuring Of Stereoscopic Televisions And Televisions (AREA)
Abstract
Description
けるカット、ワイプ(wipe)、ディゾルブ(dissolve)等の転換の検出に関する
。
明の少なくとも一部の一定の権利を有する。
ピクセルのアレイにより表され、各画素は、1つ以上の異なる成分により表され
る。例えば、単色のグレースケール画像では、各画素は、その値が画素の明暗度
に相当する成分により表される。RGBカラーフォーマットでは、各画素は、レ
ッド成分、グリーン成分、及びブルー成分により表される。同様に、YUVカラ
ーフォーマットでは、各画素は、明暗度(又は輝度)成分Yと2つの色(又は色
度)成分UとVにより表される。このカラーフォーマットの24ビットバージョ
ンでは、各画素成分は8ビットの値により表される。
で構成されており、所定ショットのフレームは、同じ基本場面に対応する。ショ
ットは、1つのカメラからの途切れのないフレームのシーケンスである。現在、
デジタルビデオをその構成ショットへ分解することへの大きな関心がある。これ
は、ビデオ材の急速に高まる入手性と、ビデオデータベースに対してインデック
スを生成する必要性とにより駆り立てられている。解析は、ビデオの編集及び圧
縮に対しても有用である。
ビデオフレームに対応するヒストグラムを分析することである。フレームのヒス
トグラムは、ビデオデータのフレームに対する成分値の分布を表す。例えば、3
2ビンのヒストグラムは、24ビットYUVカラーフォーマットで表されるビデ
オフレームの8ビットY成分に対して生成でき、ここで、第1のビンは、フレー
ムで幾つの画素が0と7を含んで0と7間のY値を有するかを示し、第2のビン
は、幾つの画素が8と15を含んで8と15間のY値を有するかを示し、以下同
様であって、最後の第32のビンは、幾つの画素が248と255を含んで24
8と255間のY値を有するかを示す。
。例えば、3次元(3D)ヒストグラムが、YUVデータに対してY成分の4つ
の最上位桁(MSB)及びUとV成分の3つのMSBを使用して生成でき、ここ
で、3Dヒストグラムでの各ビンは、Yの同じ4つのMSB、Uの同じ3つのM
SB、及びVの同じ3つのMSBを有するフレームでの画素数に相当する。
、所定ショット内のフレームに対するヒストグラムが、普通には、異なる場面に
対応するショットでのフレームに対するヒストグラムよりも、より類似している
ことである。その場合、デジタルビデオをその構成ショットへ分解する1つの方
法は、ビデオシーケンスにおけるフレームに対して生成されたヒストグラムを比
較することによりショット間の転換を捜すことである。一般的に、類似のヒスト
グラムを持つフレームは、非類似のヒストグラムを持つフレームより同じ場面に
対応する見込みが高い。
する測定基準を使用して、数学的に表すことができる。1つの可能な非類似性測
度Dabs(m,n)は、2つのフレームmとnに対して対応するヒストグラムの ビン値間の差の絶対値の総和に相当し、以下の式(1)により表すことができる
。 (1) Dabs(m,n)≡Σi|hi(m)−hi(n)| ここで、hi(m)はフレームmに対応するヒストグラムのi番目ビンの値であ り、hi(n)はフレームnに対応するヒストグラムのi番目ビンの値である。 別の可能な非類似性測度Dsq(m,n)は、対応するヒストグラムのビン値間の
差の2乗の総和に相当し、以下の式(2)により表すことができる。 (2) Dsq(m,n)≡Σi|hi(m)−hi(n)|2 これらの非類似性測度の各々は、2つのフレーム間の差、即ち非類似性、の数字
表示を提供する。
後のフレームは、第2のショットの最初のフレームに直接続く。そのようにな突
然の転換は、ビデオシーケンスにおける各対の引続くフレーム間のヒストグラム
の差を解析して、そのヒストグラムの差がビデオシーケンスでのカットに相当す
る規定の(及び普通には、経験的に生成された)閾値を超える対の引続くフレー
ムを識別することにより高い信頼性をもって検出できる。
ンスでの漸進的な転換は、引続くフレームに基づくヒストグラムの差を使用して
充分な信頼性を持ち検出することができない。ディゾルブは、第2のショットの
画素値が第1のショットの画素値を、数多くの転換フレームにわたり漸次置換え
る、2つのショット間の転換であり、そこでは、転換フレームの個々の画素は、
2つの異なるショットに対応する画素を混合することにより生成される。混合さ
れる画素Pbは、以下の式(3)により定義できる。 (3) Pb ≡(1−f) * P1+f * P2 0≦f≦1 ここで、P1は第1のショットに対応する画素であり、 P2は第2のショットに 対応する画素であり、fは混合割合である。ディゾルブが1つの転換フレームか
ら次へ進行すると、混合割合fは増加する。その場合、第1のショットからの画
素の影響は混合過程で徐々に小さくなる一方で、第2のショットからの画素の影
響が増大し、転換の終りには、各画素は全て第2のショットからの画素に該当す
る。
、最後に画像は全て1つの色になる転換である。例えば、ブラックへのフェード
では、画素の明暗度即ち輝度が、画像が全てブラックになるまで漸次低減する。
フェードは、第2のショットがソリッド色に相当するディゾルブの特定の種類と
みなすことができる。
ームにわたり漸次置換える転換であり、ここで、転換フレームの個々の画素は、
第1のショットか又は第2のショットのいずれかから画素値を選択することによ
り生成される。ワイプが1つの転換フレームから次へ進むと、第1のショットか
ら選択される画素値の数が減少する一方で、第2のショットからの画素値の数が
増加して、転換の終りには、画素の全てが第2のショットからになる。
定義されるようにな非類似性測度により測定されるようにな、引続く転換フレー
ム間のヒストグラムの差は、所定のショット内の引続くフレーム間のヒストグラ
ムの差と著しく違わないかもしれない。その場合、引続くフレームに基づくヒス
トグラムの差を使用することは、ビデオシーケンスにおいて漸進的な転換を検出
するための信頼性のある測度を提供しないであろう。
切り (Automatic partitioning of full-motion video)」Multimedia Systems,
Vol. 1, No. 1, pp. 10-28 (1993) が、2つの閾値を持つ2重比較法を提案する
。この方法は、最初に隣接フレーム間の非類似性を評価し、2つの閾値の低い方
を使用して、漸進的な転換の可能性のある開始フレームを指示する。次に、それ
は、D(s+k−1,s+k)がこの低い方の閾値を超える、各フレームs+k
に対するD(s,s+k)を評価する。漸進的転換は、D(s,s+k)が2つ
の閾値の高い方(即ち、突然の転換のために使用されるものに類似である)を超
える場合を識別する。隣接フレーム間の変化を許容する幾つかの改良にも関らず
、この方法は、モーションによって混乱させられる。カメラモーションはモーシ
ョン解析により識別できるが、物体のモーションの影響は、非常に困難である。
ressed Video)」IEEE Transactions on Circuit and Systems for Video Techno
logy, Vol. 5, No. 6, pp. 533-544 (1995) は、D(n−w,n)を全てのnに
対して評価することにより転換を検出し、ここで、固定のタイミングウインドウ
wが、転換におけるフレームの数より著しく大きいように選定される。この方法
は、モーションに耐えるが、予測される転換の長さの情報を必要とする。
(Scene change detection and content-based sampling of video sequences) 」 Digital Video Compression: Algorithms and Technologies 1995, Proc. SP
IE 2419, pp. 2-13 (1995) は、再帰時間形 (recursive temporal) フィルタを D(n−w,n)へ適用する、ここでwは1を超えてもよい。彼の解析は、順序
統計 (order statistics) とモーションインジケータを含む。
ンスにおいてディゾルブ領域を検出し圧縮すること (Detecting and Compressin
g Dissolve Regions in Video Sequences with a DVI Multimedia Image Compre
ssion Algotithm)」 Proceedings of IEEE International Symposium on Circui
ts and Systems, May 3-6, 1993, Chicago, IL, pp. 13-16, は、ディゾルブを 識別するために画素値の分散を使用する。この方法もモーションに耐えるが、ワ
イプのようにな他の種類の漸進的な転換へ適合するように見えない。
めのスキームに向けられる。本発明は、ディゾルブやワイプ等の漸進的な転換と
同様に、カットのようにな突然の転換の検出に使用することができる。その場合
、本発明は、ビデオシーケンスをその構成ショットへ分解することにおける有用
なツールであることができる。
インドウサイズにより分離されたビデオシーケンスでの複数の対のフレームの各
々に対して生成され、ここで、FDM値は、正味の非類似性測度と累積の非類似
性測度との比である。FDM値は解析されて、ビデオシーケンスにおける転換を
識別する。
されたビデオシーケンスでの複数の対のフレームの各々に対して生成される。第
1の閾値条件がFDM値へ適用されて、該当する対のフレームが転換に該当する
かを決定する。第1の閾値条件が満足される場合、次に、第2の閾値条件が1つ
以上の他のFDM値へ適用されて、転換の開始と終了フレームを識別する。
ズによりビデオシーケンスにおいて分離された対のフレームに対してフレーム非
類似性測度(FDM)を生成することにより解析される。FDMの値が第1の閾
値条件を満足する場合、次に、該当する対のフレームは、ビデオシーケンスでの
2つの引続くショット間の転換の一部分であると(少なくとも、暫定的に)識別
される。その転換の開始と終了でのフレームは、次に、FDM値へ第2の閾値条
件を適用することにより識別される。
は、転換が完了した直後のフレームとして定義される。即ち、開始フレームは、
第1のショットからだけで生成される最後のフレームであり、終了フレームは、
第2のショットからだけで生成される最初のフレームである。開始と終了フレー
ムとの間が転換フレームであり、それは、第1と第2のショットの両方から生成
される。
のフレームmとnに対して以下の式(4)により定義される。 (4) R(m,n)≡Dnet(m,n)/Dcum(m,n) ここで、Dnet(m,n)は、フレームmとnとの間の正味の非類似性であり、 Dcum(m,n)は、フレームmとnとの間の累積の非類似性である。
る。γ=2の場合、正味の非類似性Dnet(m,n)は、フレームmとnに対応 するヒストグラムの該当するビン値間の差の2乗の総和であると言うことができ
る。
とができる。
る転換を検出するための処理のフロー図を示す。図1の処理は、式(4)で定義
されたフレーム非類似性測度R(m,n)を使用して、転換はFDMデータでの
ピークとして現れる、ビデオシーケンスにおけるショット間の転換を識別する。
第1の閾値条件が適用されて、FDM値が規定された閾値を超えるか否かを決定
することにより、可能性のあるピークを識別する。次に、第2の閾値条件が適用
されて、FDMが規定されたより低い閾値より下回るか否かを決定することによ
りピークの境界(即ち、転換の開始と終了フレーム)を識別する。図1の処理は
、ディゾルブやワイプ等の漸進的な転換と同様に、カットのようにな突然の転換
の両方を識別するように設計されている。
れるビデオシーケンスでの各対のフレームに対して式(4)のフレーム非類似性
測度(FDM)の生成で始まる(図1のステップ102)。換言すると、ビデオ
シーケンスが「左」から「右」へ進行し、時間が通常のXYグラフのX軸に沿い
プロットされる場合、フレームnがタイミングウインドウの右側にあるフレーム
である場合、フレームm=(n〜w)は、タイミングウインドウの左側にあるフ
レームである。
適用される場合、処理の残りは、フィルタリングされたFDMデータへ適用され
る。そうでない場合、元のFDMデータが使用される。
、それにより、FDMデータでのピークの境界が識別できる(ステップ106)
。ノイズは、好ましくは、FDMデータを小さな値の方向へバイアスして、次に
バイアスされたデータをフィルタリングすることにより特徴付けられる。実施の
形態の1つでは、バイアスすることは、バイアス関数 bias(R) の適用を含み、 ここで、bias(R) = tanh(2R)/2 であり、フィルタリングすることは、exp[-(d/b
)2] の形のガウスフィルタリング関数 (Gaussian filtering function) の適用 を含み、ここで、dはフィルタリングされたフレームからのフレームの数であり
、bは規定の定数(例えば、40)である。
シーケンスでのショット間の転換を識別する。このデータ解析は、ビデオシーケ
ンスの始まりでのフレームで始まり、ビデオシーケンスの終りでのフレームまで
データを走査する処理ループである。図2は、図1の処理のこの解析フェーズに
対応する疑似コードの一覧を提示する。
ラメータの初期化で始まり(図2での行16参照)、ここでT1とT2は、第1と
第2の閾値の値であり、M1とM2は、第1と第2の閾値の乗数である。図2に示
す特定のパラメータ値は、異なる既知のビデオシーケンスを試験することにより
経験的に引出された典型的な値である。
対向端での対のフレームに基づいているので、タイミングウインドウの右側での
フレームを指示する現在のフレーム指示子(ポインタ)nは、wへ初期化され(
図1でのステップ108、及び図2での行17)、ここで、フレームシーケンス
での最初のフレームはフレーム0であると仮定する。
が適用されて、現在のフレームnがビデオシーケンスでの2つのショット間の転
換に該当するかを決定する(図1でのステップ110)。図2での行20による
と、現在のフレームnに対するFDM値が2つの値、即ち(a)第1の閾値の値
T1と(b)第1の閾値乗数M1と現在のフレームnでのノイズレベルとの積、の
最大より大きい場合、この第1の閾値条件は満足される。固定タイミングウイン
ドウサイズwが使用されたので、式(4)のFDM値R(m,n)は、R(n−
w,n)であり、nがタイミングウインドウの右側でのフレームを規定する場合
、それはR(n)とも表せることに注意されたい。
と終了フレームを識別するように解析される(図1でのステップ112)。これ
は、(1)第2の閾値条件を満足する最初のフレームsを現在のフレームnの左
で捜すようにビデオシーケンスにおいて左へ走査すること(図2での行21)、
及び(2)第2の閾値条件を満足する最初のフレームe'を現在のフレームnの 右で捜すようにビデオシーケンスにおいて右へ走査すること(図2での行22)
により完遂される。行21と22によると、フレームmに対するFDM値が2つ
の値、即ち(a)第2の閾値の値T2と(b)第2の閾値乗数M2とフレームmで
のノイズレベルとの積、の最大より小さい場合、この第2の閾値条件は満足され
る。
e'に直接続くフレームに等しく設定される(図1でのステップ114、及び図 2での行23)。フレームe'は、第2のショットへの転換の完了直後のタイミ ングウインドウの右側でのフレームに該当する。先に記載の定義によると、終了
フレームは、第2のショットからだけで生成される最初のフレームである。その
場合、転換に対する終了フレームは、実際に、タイミングウインドウの左側での
フレームである。従って、終了フレームeは、フレームe'に対するフレーム数 からタイミングウインドウサイズwを減算することにより識別される(図2の行
24参照)。
されたフレーム(e)が、転換の開始として識別されたフレーム(s)の右に無
いと判明する場合、検出された転換は却下される(図1でのステップ116、及
び図2での行25)。このステップは、タイミングウインドウサイズwより短い
時間の期間で場面に現れる、カメラのフラッシュ、又は非常に近接した物体のよ
うにな他の変則、により引起されるかもしれないFDMデータでの短期間ノイズ
を弁別する。そのようにな変則のフレームが検出される場合、式(6)のDcum への寄与を排除することによりそれを無視することが有利であろう。
転換に対する、それぞれ開始と終了フレームとして決定される(図1でのステッ
プ118、及び図2での行26)。次に、図1の処理は、ステップ108へ戻り
、第1の閾値条件の次の適用のために現在のフレーム指示子nを更新する。図2
の行18〜19、23、及び28は、ビデオシーケンスでの進行を実行するブッ
クキーピング(簿記)のステップである。
フレームに対するFDM値の例示セットを示す。この例示の目的のために、FD
Mデータにおけるノイズは充分に低く、それにより、選定された第1と第2の閾
値の値、それぞれT1=0.50とT2=0.25は、第1と第2の閾値条件が満
足されるか否かを常に決定すると仮定する。FDM値は、タイミングウインドウ
サイズ6を使用して生成されるとも仮定する。これは、例えば、フレームn=1
1に対するフレーム非類似性測度R(n)は、フレーム11とフレーム(n−6
)即ち5との間の差を特徴付けることを意味する。
n=6(タイミングウインドウサイズが6であるので)で始まる。処理は、第1
の閾値条件をFDMデータへ適用して左から右へ、フレームn=14に対するR
(n)が第1の閾値の値T1=0.50を超えることを決定するまで、継続する 。処理でのこの点で、FDMデータは、フレームn=14から両方向に走査され
て、第2の閾値条件を満足するフレームn=14の左への最初のフレーム(即ち
、フレームs=9)を見出し、第2の閾値条件を満足するフレームn=14の右
への最初のフレーム(即ち、フレームe'=30)を見出す。フレームe'は、転
換が完了した後にタイミングウインドウの右側に該当するので、フレームe=e
'−w=30−6=24が、転換の終了フレームとして識別される。
ムが無い、カットのようにな突然の転換を検出することでも有効である。これを
、ビデオシーケンスにおいてフレーム20と21との間で起るカットに対応する
FDM値の例示セットを示す図4において実証する、ここで、フレーム20は、
フレーム0〜20に対応する第1のショットの最後のフレームであり、フレーム
21は、フレーム21〜36に対応する第2のショットの最初のフレームである
。説明の目的のために、第1のショットでの各フレームは、単一の静止画像に対
応すると仮定され、第2のショットでの各フレームは、別の単一の静止画像に対
応すると仮定される。タイミングウインドウサイズw=6であるとする。
からn=20に対するフレーム非類似性測度R(n)は、全てゼロである。正味
の非類似性Dnetがゼロの場合、累積の非類似性Dcumもゼロであっても、フレー
ム非類似性測度R(n)は、ゼロであると定義される。R(n=20)は、タイ
ミングウインドウサイズ6に対するフレーム20とフレーム14との間の差を表
すことに注意されたい。フレームn=21は、第2のショットの最初のフレーム
であるので、R(n=21)は、第2のショットのフレーム21と第1のショッ
トのフレーム15との間の差に相当する。その場合、フレーム非類似性測度R(
n=21)は、ゼロではないであろう。同様に、R(n=22)は、第2のショ
ットのフレーム22と第1のショットのフレーム16との間の差に相当し、等々
フレームn=26まで同様であり、ここで、R(n=26)は、第2のショット
のフレーム26と第1のショットのフレーム20との間の差に相当する。しかし
、フレームn=27で、フレーム27と21は、共に第2のショットからである
ので、R(n=27)はゼロであろう。第2のショット内のフレームを比較して
いるので、同じことが、図4の残りのFDM値に対して真である。
閾値条件を満足する最初のフレームとして識別されるであろう。次に、フレーム
s=20とe'=27が、第2の閾値条件を満足する、それぞれフレームn=2 1の左と右への最初のフレームとして識別されるであろう。6のタイミングウイ
ンドウサイズに対してe'=27を調整すると、フレームs=20とフレームe =21は、第1と第2のショット間の転換に対して、それぞれ開始と終了フレー
ムとして正しく識別される。
する実験結果を示す。3つの50フレーム試験シーケンスを、MPEG4シーケ
ンス Stefan(クラスC)と Foreman(クラスB)から生成した。これらの試験 シーケンスは、全て同じ Stefan の15フレームで始まり(フレーム0〜14)
、同じ Foreman の15フレームで終わる(フレーム35〜49)。それらは、 20転換フレーム(フレーム15〜34)をどのように生成したかで異なる。3
つの試験シーケンスを、3つの異なる種類の漸進的転換、即ちリニアワイプ(lin
W)、2次元ワイプ(quad W)、及びリニアディゾルブ(lin D)、に基づき生成した
。
たり直線的に増大するワイプである。普通のリニアワイプは、第1のショットか
ら選択された画素から、第2のショットから選択された画素を分離するワイプの
端が、左から右へ転換フレームを横切り一定の速度で移動する垂直の線であるワ
イプである。図5(A)〜(C)の試験シーケンス lin W を、左から右への垂 直のワイプで Stefan を Foreman で置換えることにより生成した。
わたり2次元で増大するワイプである。普通の2次元ワイプは、ワイプ端が方形
を画成して、ここで、方形内の画素が第2のショットから選択され、方形の外側
の画素が第1のショットから選択されて、方形の高さと巾両方が一定の速度で転
換フレームにわたり増加するワイプである。図5(A)〜(C)の試験シーケン
ス quad W を、Stefan の真中で増大する方形領域において Foreman に置換える
ことにより生成した。
ームにわたり変化するディゾルブである。 図5(A)〜(C)の試験シーケン
ス lin D を、fを均一な速度でフレーム14でf=0からフレーム35でf= 1まで変化させることにより生成した。
、式(5)でのγ=2であり、それにより、ビデオシーケンスでの各フレームは
、ビデオシーケンスでの最初のフレーム(即ち、フレーム0)と比較する。図5
(B)はγ=4に対するR(0,n)を示し、図5(C)はγ=2と固定のタイ
ミングウインドウサイズ5に対するR(n−5,n)を示す。各々の場合、FD
Mの計算は、Yデータの4MSBとU及びVデータ両方の3MSBから生成され
た3Dヒストグラムに基づいた。γ=2に対する図5(A)での結果とγ=4に
対する図5(B)での結果との間の最も劇的な差は、ワイプ(lin W と quad W )に対する応答が、2桁増大して、それが、シーケンスの始まりで、ディゾルブ
(lin D) に対する応答も一緒に、応答を完全に圧倒する (swamp) ことである。
れたMPEG−1である352Wx240H画像の30,001フレームのビデ
オシーケンスへ適用した結果を示す。図6(A)〜(C)の各々では、グラフの
上部は、γ=2とタイミングウインドウサイズの6に対する式(4)のフレーム
非類似性測度R(n−6,n)をプロットし、グラフの下部は、両データセット
が同じグラフ上に明確に観察できるように適用された−50の負のスケーリング
係数を持つ式(2)の引続くフレームの非類似性測度Dsq(n−1,n)をプロ
ットする。これらの結果の全ては、図5(A)〜(C)に対して使用されたのと
同じ種類の3Dヒストグラムを使用して生成した。
ロットする。図6(B)はフレーム2500〜5000に対する結果の引伸ばし
を示し、図6(C)はフレーム27000〜29000に対する結果の引伸ばし
を示す。図6(B)と6(C)の下半分における文字は、次の種類の手動で観測
した転換の位置と種類を示す。W=ワイプ、F=フェード、D=ディゾルブ、及
びC=カット。非類似性測度Dsq(n−1,n)は、大多数のワイプに対して殆
ど応答を有せず、式(2)の引続くフレームの非類似性測度は充分な信頼性を持
ちワイプを識別する見込がないであろうことを示すことに注意されたい。
れたイベントに対する転換比を示す。転換比は、図1及び図2の処理中に識別さ
れた転換の開始と終了フレームに対するフレーム非類似性測度R(s,e)とし
て定義される。FDMデータにおけるノイズレベルは、図6(B)と6(C)で
平滑な曲線により示す。
トであろうと、大多数の転換を識別することに成功し、少しだけの虚偽の否定(
即ち、実際の転換を見落とす)と虚偽の実在(即ち、転換でないのを転換と識別
する)を持つ。幾つかの明白なピークを拾い上げていない。図1及び図2のアル
ゴリズムは、非常に狭いピークをノイズとみなし、ここで、ピークの巾は、ピー
クの境界を決定する第2の閾値条件におけるT2やM2等の、一定のパラメータに
対して選定される値に依存する。
ウインドウサイズwの6を使用して生成された対応するFDMデータと同等か、
又はそれより大きい。これは、wより長いワイプに対して予測される。
FDMデータにおけるピークの範囲は、スケールされていないDsq(n−1,n
)データのそれよりはるかに小さい。これは、閾値の選定を容易にすることにな
る。
非類似性Dcum(m,n)は、Dcum(m,n)=|Dcum(0,n)−Dcum(0
,m)|の関係に基づき容易に生成できる。
値を規定された閾値の値と比較することにより検出される。本発明は、虚偽の実
在を弁別する追加の条件を使用して補強するすることができる。例えば、転換比
R(s,e)は、虚偽の実在を検出するように、規定された閾値と比較できる。
別の可能性は、虚偽の実在を検出するように、FDM曲線の下で規定された最小
の領域を有する転換を要求することであろう。更に別の可能性は、転換の開始と
終了フレーム間の正味の非類似性であるDnet(s,e)へ閾値を適用すること であろう。
応する開始と終了フレームを識別する特定の解析スキームを適用する。図1及び
図2のアルゴリズムは、2回通過の解析であり、それは、ビデオシーケンス全体
がメモリに蓄積されている状況に特に適している。当業者は、ピークがFDMデ
ータへ異なる解析スキームを適用することにより検出及び/又は識別できること
を理解するであろう。
必ずしも蓄積せず、各フレームが遭遇されるに従いデータが解析される状況に適
する1回通過の解析を使用して実行できる。図7は、可能な1回通過の解析のた
めの疑似コードを示す。この1回通過の解析は、図1及び図2の2回通過の解析
と類似であるが同一ではない。例えば、1回通過の解析では、可能性の転換は、
高い方の閾値でなく2つの閾値の低い方により提起される。加えて、ノイズは少
し異なって計算され、メディアンフィルタは無く、及び、閾値定数は少し異なる
。
る。noTrans(即ち、現在の状態は転換を指示しない)、possibleTrans(即ち、
現在の状態は可能性の転換を指示する)、及び probableTrans(即ち、現在の状
態は有望な転換を指示する)。ビデオシーケンスにおいてフレームが遭遇される
に従い、関数 Analyze(n) が、各現在のフレームnへ適用される、ここで、nの
初期値は、規定のタイミングウインドウサイズwより大きいか等しいと仮定され
る。関数 Analyze(n) は、図7の行1〜5で定義され初期化されるグローバル変
数に依頼する。現在フレームに対するフレーム非類似性測度Rを計算し(行10
)、ノイズレベルを特徴付けるように再帰形フィルタを適用し(行12〜13)
、及び、低い方と高い方の閾値(tLとtH)を生成(行15〜16)した後に
、関数 Analyze(n) は、1つ前のフレームの後のマシンの状態に依存して適切な
処理を実行する。
在のフレームに対するFDMのRが低い方の閾値tLより大きい場合(行20)
、可能性の転換の最初のフレームが1つ前のフレーム(n−1)に設定され(行
21)、状態は possibleTrans へ変更される(行22)。FDMが更に高い方 の閾値tHより大きい場合(行24)、状態は直ちに probableTrans へ変更さ れ(行25)、高い方の閾値に対する最初と最後の両フレームは現在のフレーム
nへ初期化される(行26)。そうでない場合、状態は noTrans に留まる。
は、現在のフレームに対するFDMのRが低い方の閾値tLより低いか等しい場
合(行30)、状態は noTrans へ変更される(行30)。これは、FDM値が 低い方の閾値を超えたが、しかし、高い方の閾値に決して達することなく低い方
の閾値以内へ戻った状況に相当する。そうでなく、FDMが高い方の閾値tHよ
り大きい場合(行31)、状態は probableTrans へ変更され(行32)、高い 方の閾値に対する最初と最後の両フレームは現在のフレームnへ初期化される(
行33)。そうでない場合、状態は possibleTrans に留まる。
は、現在のフレームに対するFDMのRが低い方の閾値tLより大きい場合(行
37)、Rが更に高い方の閾値tHより大きい場合(行38)、転換での最後の
フレームは現在のフレームnへ更新され(行38)、そうでない場合現在のフレ
ームnに対する処理は終了される(行39)。そうでなく、Rが低い方の閾値t
Lより小さいか等しい場合、転換は終了する。その場合、状態は noTrans へ変 更され(行41)、上方と下方のピークの終りは、タイミングウインドウサイズ
に対して調整される(行42〜43)。ピークが狭過ぎる場合(行44)、転換
は却下される。そうでない場合、転換は Analyze(n) 関数により報告される(行
45)。行44での狭いピークに対する試験は、2回通過の解析の対応する試験
より複雑であり、可能性の転換の開始と終了をより対称的に処理するように試み
る。
面間の漸進的な転換から場面内での対象のモーションを区別するために、フレー
ムは、副フレームへ分割でき、各副フレームが別々に解析される。対象のモーシ
ョンは、副フレームの幾つかだけに出現すると思われる一方で、転換は、全てで
はないにしても、大多数の副フレームで明白である筈である。
うに設計されたが、ショット間の突然の転換(即ち、カット)又はカメラのモー
ション(例えば、パン)でさえ検出することにも使用できる。パンは、特にパン
が結果として著しい場面変更となる場合、ショット内の漸進的な転換の1種とみ
なされ得る。例えば、ビデオのインデックス付けの中に、ショット間の転換と同
様にショット内のパンを検出できるユーティリティがあってもよい。代替として
、パンは、パンのフレーム間の全体のグローバルモーションを検出するようにモ
ーション解析を使用することによりショット間の転換から弁別できる。
加することは、無規則な活動の影響を低減し、図5(A)と5(B)に示すよう
に、他の漸進的な転換に対してワイプの影響を増大させる。しかし、アルゴリズ
ムの安定性も低下させるかもしれない。γ=1も有用であることに注意されたい
。その場合、FDM値は1を決して超えないであろうとはいえ、それは、他の場
合より転換で依然はるかに大きい傾向である。タイミングウインドウサイズを変
更することは、短時間尺度で系統的に現れる無規則なモーションの弁別を助ける
ことになる。
の値は、特定のビデオシーケンスに対するFDMデータにおけるノイズレベルに
影響することができる。例えば、一定の周期性を持つ符号化スキームでは、符号
化周期の整数倍に基づきタイミングウインドウサイズを選定することは、より少
ないノイズを生じることができる。
性測度の比である。フレーム非類似性測度の代替のバージョンも使用できる。例
えば、非類似性測度は、フレームのヒストグラムでなく、フレーム間の画素から
画素への差(例えば、差の2乗の総和、又は絶対値差の総和)に基づくことがで
きる。
本発明は、フロッピーディスケット、CD−ROM,ハードドライブ、又はマシ
ンが読み得るいずれか他の記憶媒体、等の有形の媒体内に実現されるプログラム
コードの形態でも具現化でき、プログラムコードが、コンピュータのようになマ
シンへロードされ、マシンにより実行される場合、マシンは、本発明を実施する
ための装置となる。本発明は、例えば、記憶媒体に蓄積されるか否かに関らず、
マシンへロードされ、マシンにより実行される、又は、電線又は電気ケーブル上
で、光ファイバを通し、又は電磁波を介する等の、伝送媒体上で伝送されるプロ
グラムコードの形態でも具現化でき、プログラムコードが、コンピュータのよう
になマシンへロードされ、マシンにより実行される場合、マシンは、本発明を実
施するための装置となる。汎用プロセッサ上で実行される場合、プログラムコー
ド部分はプロセッサと組合せて、特定のロジック回路に類似で動作する独特の装
置を提供する。
成における種々の変更は、以下の特許請求の範囲に表示された発明の原理と範囲
から逸脱することなく、当業者にはなされ得ることが更に理解されるであろう。
の範囲、及び添付の図面からより充分に明らかになるであろう。
検出するための処理のフロー図を示す。
に対するフレーム非類似性測度(FDM)値の例示セットを示す。
示す。
す。
。
Claims (10)
- 【請求項1】 ビデオシーケンスにおいて転換を識別するための方法であっ
て、 (a)タイミングウインドウサイズにより分離される前記ビデオシーケンスでの
複数の対のフレームの各々に対してフレーム非類似性測度(FDM)値を生成す
るステップであって、前記FDM値は、正味の非類似性測度と累積の非類似性測
度の比であるステップと、 (b)前記ビデオシーケンスでの転換を識別するように前記FDM値を解析する
ステップと、 を含む方法。 - 【請求項2】 各対のフレームmとnに対して、前記FDM値が、前記対の
フレームmとnに該当する2つ以上のフレームに対するヒストグラムから生成さ
れる、 請求項1の方法。 - 【請求項3】 前記正味の非類似性測度Dnet(m,n)が、 Dnet(m,n)≡Σi|hi(m)−hi(n)|γ により定義され、 hi(m)はフレームmに対応するヒストグラムのi番目のビン (bin) であり
、 hi(n)はフレームnに対応するヒストグラムのi番目のビンであり、 γは規定されるパラメータであり、 前記累積の非類似性測度Dcum(m,n)が、 Dcum(m,n)≡Σn-1 k=mDnet(k,k+1)により定義される、 請求項1の方法。 - 【請求項4】 更に、前記ビデオシーケンスにおける短期間の変則を弁別す
るように、各識別された転換に対する開始と終了フレームの前記ビデオシーケン
スでの相対位置を比較するステップを含む、 請求項1の方法。 - 【請求項5】 ステップ(b)は、 (1)前記対応する対のフレームでのフレームが、転換に該当するかを決定する
ようにFDM値へ第1の閾値条件を適用するステップと、 (2)前記第1の閾値条件が満足される場合、前記転換に対する開始と終了フレ
ームを識別するように、1つ以上の他のFDM値へ第2の閾値条件を適用するス
テップと、を含む、 請求項1の方法。 - 【請求項6】 更に、前記ビデオシーケンスに対する前記FDM値における
ノイズを特徴付けるステップを含み、前記第1と第2の閾値条件は、前記ノイズ
の関数である、 請求項5の方法。 - 【請求項7】 フレームnに対する前記FDM値が、第1の閾値の値T1、 及び第1の閾値乗数M1とフレームnに対する前記ノイズとの積、の最大を超え る場合、前記第1の閾値条件が満足され、 フレームmに対する前記FDM値が、第2の閾値の値T2、及び第2の閾値乗数 M2とフレームmに対する前記ノイズとの積、の最大を下回る場合、前記第2の 閾値条件が満足される、 請求項6の方法。
- 【請求項8】 FDM値が、第1の閾値レベルより大きい場合、前記第1の
閾値条件が満足され、 FDM値が、第2の閾値レベルより小さい場合、前記第2の閾値条件が満足さ
れる、 請求項5の方法。 - 【請求項9】 前記第1の閾値条件は、前記FDM値におけるピークを識別
することに使用され、 前記第2の閾値条件は、前記ピークに対する境界を決定することに使用される
、 請求項5の方法。 - 【請求項10】 前記ステップ(b)は、 (1)前記対応する対のフレームでのフレームが、可能性の転換に対する開始フ
レームに該当するか否かを決定するように、FDM値へ第1の閾値条件を適用す
るステップと、 (2)前記第1の閾値条件が満足される場合、前記可能性の転換が有望な転換で
あるか否かを決定するように、1つ以上の他のFDM値へ第2の閾値条件を適用
するステップと、 (3)前記第2の閾値条件が満足される場合、前記有望な転換に対する終了フレ
ームを決定するように、1つ以上の他のFDM値へ前記第1の閾値条件を適用す
るステップと、を含む、 請求項1の方法。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US6877497P | 1997-12-23 | 1997-12-23 | |
US60/068,774 | 1997-12-23 | ||
US09/086,373 | 1998-05-28 | ||
US09/086,373 US5990980A (en) | 1997-12-23 | 1998-05-28 | Detection of transitions in video sequences |
PCT/US1998/027281 WO1999033261A1 (en) | 1997-12-23 | 1998-12-22 | Detection of transitions in video sequences |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2001527344A true JP2001527344A (ja) | 2001-12-25 |
JP4335440B2 JP4335440B2 (ja) | 2009-09-30 |
Family
ID=26749359
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2000526044A Expired - Lifetime JP4335440B2 (ja) | 1997-12-23 | 1998-12-22 | ビデオーケンスにおける転換の検出 |
Country Status (8)
Country | Link |
---|---|
US (1) | US5990980A (ja) |
EP (1) | EP1048169B1 (ja) |
JP (1) | JP4335440B2 (ja) |
KR (1) | KR100591470B1 (ja) |
AU (1) | AU2008799A (ja) |
CA (1) | CA2311662C (ja) |
DE (1) | DE69841656D1 (ja) |
WO (1) | WO1999033261A1 (ja) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005190473A (ja) * | 2003-12-05 | 2005-07-14 | Sharp Corp | 光源モデル推定のためのシステムおよび方法 |
JP2010015588A (ja) * | 2009-08-27 | 2010-01-21 | Kddi R & D Laboratories Inc | 動画像データの分類装置 |
US8055063B2 (en) | 2003-09-30 | 2011-11-08 | Sharp Laboratories Of America, Inc. | Methods and systems for improving robustness of color balance correction |
JP2014087070A (ja) * | 2012-10-25 | 2014-05-12 | Tektronix Inc | ビデオ検出器及びシーン変更検出方法 |
Families Citing this family (82)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6393054B1 (en) * | 1998-04-20 | 2002-05-21 | Hewlett-Packard Company | System and method for automatically detecting shot boundary and key frame from a compressed video data |
DE69936620T2 (de) * | 1998-09-28 | 2008-05-21 | Matsushita Electric Industrial Co., Ltd., Kadoma | Verfahren und Vorrichtung zum Segmentieren von Handgebärden |
US6449392B1 (en) * | 1999-01-14 | 2002-09-10 | Mitsubishi Electric Research Laboratories, Inc. | Methods of scene change detection and fade detection for indexing of video sequences |
US6493042B1 (en) * | 1999-03-18 | 2002-12-10 | Xerox Corporation | Feature based hierarchical video segmentation |
US7092620B1 (en) | 1999-08-05 | 2006-08-15 | Hewlett-Packard Development Company, L.P. | Converting analog video data into digital form |
US6636220B1 (en) * | 2000-01-05 | 2003-10-21 | Microsoft Corporation | Video-based rendering |
US8028314B1 (en) | 2000-05-26 | 2011-09-27 | Sharp Laboratories Of America, Inc. | Audiovisual information management system |
US6611268B1 (en) * | 2000-05-30 | 2003-08-26 | Microsoft Corporation | System and process for generating 3D video textures using video-based rendering techniques |
US6600491B1 (en) * | 2000-05-30 | 2003-07-29 | Microsoft Corporation | Video-based rendering with user-controlled movement |
US8020183B2 (en) | 2000-09-14 | 2011-09-13 | Sharp Laboratories Of America, Inc. | Audiovisual management system |
AUPR133700A0 (en) * | 2000-11-09 | 2000-11-30 | Mediaware Solutions Pty Ltd | Transition templates for compressed digital video and method of generating same |
US20030038796A1 (en) | 2001-02-15 | 2003-02-27 | Van Beek Petrus J.L. | Segmentation metadata for audio-visual content |
US7904814B2 (en) | 2001-04-19 | 2011-03-08 | Sharp Laboratories Of America, Inc. | System for presenting audio-video content |
US7143354B2 (en) | 2001-06-04 | 2006-11-28 | Sharp Laboratories Of America, Inc. | Summarization of baseball video content |
US7499077B2 (en) | 2001-06-04 | 2009-03-03 | Sharp Laboratories Of America, Inc. | Summarization of football video content |
US6870956B2 (en) * | 2001-06-14 | 2005-03-22 | Microsoft Corporation | Method and apparatus for shot detection |
US7203620B2 (en) | 2001-07-03 | 2007-04-10 | Sharp Laboratories Of America, Inc. | Summarization of video content |
US7474698B2 (en) | 2001-10-19 | 2009-01-06 | Sharp Laboratories Of America, Inc. | Identification of replay segments |
US7120873B2 (en) | 2002-01-28 | 2006-10-10 | Sharp Laboratories Of America, Inc. | Summarization of sumo video content |
US7053967B2 (en) | 2002-05-23 | 2006-05-30 | Planar Systems, Inc. | Light sensitive display |
WO2003073159A1 (en) | 2002-02-20 | 2003-09-04 | Planar Systems, Inc. | Light sensitive display |
US7023503B2 (en) | 2002-02-20 | 2006-04-04 | Planar Systems, Inc. | Image sensor with photosensitive thin film transistors |
US7009663B2 (en) | 2003-12-17 | 2006-03-07 | Planar Systems, Inc. | Integrated optical light sensitive active matrix liquid crystal display |
US8214741B2 (en) | 2002-03-19 | 2012-07-03 | Sharp Laboratories Of America, Inc. | Synchronization of video and data |
US6928407B2 (en) * | 2002-03-29 | 2005-08-09 | International Business Machines Corporation | System and method for the automatic discovery of salient segments in speech transcripts |
US6985623B2 (en) * | 2002-06-10 | 2006-01-10 | Pts Corporation | Scene change detection by segmentation analysis |
GB0215624D0 (en) * | 2002-07-05 | 2002-08-14 | Colthurst James R | Razor head |
KR20050030955A (ko) * | 2002-07-24 | 2005-03-31 | 코닌클리케 필립스 일렉트로닉스 엔.브이. | 디지털 비디오 신호를 엔코딩하는 방법 및 엔코더 |
US7657836B2 (en) | 2002-07-25 | 2010-02-02 | Sharp Laboratories Of America, Inc. | Summarization of soccer video content |
US7657907B2 (en) | 2002-09-30 | 2010-02-02 | Sharp Laboratories Of America, Inc. | Automatic user profiling |
JP4036328B2 (ja) * | 2002-09-30 | 2008-01-23 | 株式会社Kddi研究所 | 動画像データのシーン分類装置 |
US7116716B2 (en) * | 2002-11-01 | 2006-10-03 | Microsoft Corporation | Systems and methods for generating a motion attention model |
US20040088723A1 (en) * | 2002-11-01 | 2004-05-06 | Yu-Fei Ma | Systems and methods for generating a video summary |
US7127120B2 (en) * | 2002-11-01 | 2006-10-24 | Microsoft Corporation | Systems and methods for automatically editing a video |
US7274741B2 (en) * | 2002-11-01 | 2007-09-25 | Microsoft Corporation | Systems and methods for generating a comprehensive user attention model |
US7164798B2 (en) * | 2003-02-18 | 2007-01-16 | Microsoft Corporation | Learning-based automatic commercial content detection |
US7260261B2 (en) | 2003-02-20 | 2007-08-21 | Microsoft Corporation | Systems and methods for enhanced image adaptation |
US20080084374A1 (en) | 2003-02-20 | 2008-04-10 | Planar Systems, Inc. | Light sensitive display |
CN1543096A (zh) * | 2003-04-30 | 2004-11-03 | ���µ�����ҵ��ʽ���� | 自动检测电视广告的装置及其方法 |
US7400761B2 (en) * | 2003-09-30 | 2008-07-15 | Microsoft Corporation | Contrast-based image attention analysis framework |
US7471827B2 (en) * | 2003-10-16 | 2008-12-30 | Microsoft Corporation | Automatic browsing path generation to present image areas with high attention value as a function of space and time |
US20050123886A1 (en) * | 2003-11-26 | 2005-06-09 | Xian-Sheng Hua | Systems and methods for personalized karaoke |
US8356317B2 (en) | 2004-03-04 | 2013-01-15 | Sharp Laboratories Of America, Inc. | Presence based technology |
US8949899B2 (en) | 2005-03-04 | 2015-02-03 | Sharp Laboratories Of America, Inc. | Collaborative recommendation system |
US7594245B2 (en) | 2004-03-04 | 2009-09-22 | Sharp Laboratories Of America, Inc. | Networked video devices |
JP4424590B2 (ja) * | 2004-03-05 | 2010-03-03 | 株式会社Kddi研究所 | スポーツ映像の分類装置 |
US7773139B2 (en) | 2004-04-16 | 2010-08-10 | Apple Inc. | Image sensor with photosensitive thin film transistors |
US9053754B2 (en) | 2004-07-28 | 2015-06-09 | Microsoft Technology Licensing, Llc | Thumbnail generation and presentation for recorded TV programs |
US7986372B2 (en) * | 2004-08-02 | 2011-07-26 | Microsoft Corporation | Systems and methods for smart media content thumbnail extraction |
US7880815B2 (en) * | 2005-01-10 | 2011-02-01 | Mavs Lab, Inc. | Method for detecting and eliminating flash scene in digital video |
US7548936B2 (en) | 2005-01-12 | 2009-06-16 | Microsoft Corporation | Systems and methods to present web image search results for effective image browsing |
US7713175B2 (en) * | 2005-04-07 | 2010-05-11 | Monaghan Michael J | Infant activity systems |
US7639873B2 (en) * | 2005-07-28 | 2009-12-29 | Microsoft Corporation | Robust shot detection in a video |
US7551234B2 (en) * | 2005-07-28 | 2009-06-23 | Seiko Epson Corporation | Method and apparatus for estimating shot boundaries in a digital video sequence |
US20070112811A1 (en) * | 2005-10-20 | 2007-05-17 | Microsoft Corporation | Architecture for scalable video coding applications |
US8180826B2 (en) * | 2005-10-31 | 2012-05-15 | Microsoft Corporation | Media sharing and authoring on the web |
US7599918B2 (en) | 2005-12-29 | 2009-10-06 | Microsoft Corporation | Dynamic search with implicit user intention mining |
US8689253B2 (en) | 2006-03-03 | 2014-04-01 | Sharp Laboratories Of America, Inc. | Method and system for configuring media-playing sets |
US7945142B2 (en) * | 2006-06-15 | 2011-05-17 | Microsoft Corporation | Audio/visual editing tool |
US7921116B2 (en) | 2006-06-16 | 2011-04-05 | Microsoft Corporation | Highly meaningful multimedia metadata creation and associations |
EP1914994A1 (en) * | 2006-10-17 | 2008-04-23 | Mitsubishi Electric Information Technology Centre Europe B.V. | Detection of gradual transitions in video sequences |
US7721209B2 (en) * | 2008-09-08 | 2010-05-18 | Apple Inc. | Object-aware transitions |
US20100119142A1 (en) * | 2008-11-11 | 2010-05-13 | Sean Miceli | Monitoring Multiple Similar Objects Using Image Templates |
EP2216983A1 (en) | 2009-02-05 | 2010-08-11 | Mitsubishi Electric R&D Centre Europe B.V. | Detection of wipe transitions in video |
US9310923B2 (en) | 2010-12-03 | 2016-04-12 | Apple Inc. | Input device for touch sensitive devices |
US8638320B2 (en) | 2011-06-22 | 2014-01-28 | Apple Inc. | Stylus orientation detection |
US8928635B2 (en) | 2011-06-22 | 2015-01-06 | Apple Inc. | Active stylus |
US9329703B2 (en) | 2011-06-22 | 2016-05-03 | Apple Inc. | Intelligent stylus |
US9824296B2 (en) * | 2011-11-10 | 2017-11-21 | Canon Kabushiki Kaisha | Event detection apparatus and event detection method |
US8897554B2 (en) | 2011-12-13 | 2014-11-25 | The Nielsen Company (Us), Llc | Video comparison using color histograms |
US8897553B2 (en) | 2011-12-13 | 2014-11-25 | The Nielsen Company (Us), Llc | Image comparison using color histograms |
US8750613B2 (en) | 2011-12-13 | 2014-06-10 | The Nielsen Company (Us), Llc | Detecting objects in images using color histograms |
US9652090B2 (en) | 2012-07-27 | 2017-05-16 | Apple Inc. | Device for digital communication through capacitive coupling |
US9176604B2 (en) | 2012-07-27 | 2015-11-03 | Apple Inc. | Stylus device |
US9557845B2 (en) | 2012-07-27 | 2017-01-31 | Apple Inc. | Input device for and method of communication with capacitive devices through frequency variation |
US10048775B2 (en) | 2013-03-14 | 2018-08-14 | Apple Inc. | Stylus detection and demodulation |
US8891021B2 (en) | 2013-03-15 | 2014-11-18 | General Instrument Corporation | System and method of detecting strobe using temporal window |
US9195892B2 (en) | 2013-03-15 | 2015-11-24 | Arris Technology, Inc. | System for and method of detecting strobe using spatial features in video frames |
US10845901B2 (en) | 2013-07-31 | 2020-11-24 | Apple Inc. | Touch controller architecture |
US10867635B2 (en) | 2013-11-11 | 2020-12-15 | Vimeo, Inc. | Method and system for generation of a variant video production from an edited video production |
US10061449B2 (en) | 2014-12-04 | 2018-08-28 | Apple Inc. | Coarse scan and targeted active mode scan for touch and stylus |
US10474277B2 (en) | 2016-05-31 | 2019-11-12 | Apple Inc. | Position-based stylus communication |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0759108A (ja) * | 1993-08-10 | 1995-03-03 | Kokusai Denshin Denwa Co Ltd <Kdd> | 動画像のカット画面検出方法 |
JPH07193818A (ja) * | 1993-12-27 | 1995-07-28 | Sony Corp | 画像処理方法および画像処理装置 |
JPH07193718A (ja) * | 1993-12-24 | 1995-07-28 | Nec Corp | レーザプリンタの画像信号制御装置 |
JPH08102938A (ja) * | 1994-09-30 | 1996-04-16 | Sony Corp | 画像符号化装置 |
JPH08214210A (ja) * | 1993-12-17 | 1996-08-20 | Nippon Telegr & Teleph Corp <Ntt> | 映像カット点検出方法及び装置 |
JPH08227462A (ja) * | 1995-02-21 | 1996-09-03 | Hitachi Ltd | 動画像の変化点検出方法及び装置 |
JPH08237549A (ja) * | 1994-06-27 | 1996-09-13 | Natl Univ Of Singapore | 自動ビデオ区分とキーフレーム抽出用システム |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3036287B2 (ja) * | 1992-12-15 | 2000-04-24 | 富士ゼロックス株式会社 | 動画像シーン検出装置 |
US5642294A (en) * | 1993-12-17 | 1997-06-24 | Nippon Telegraph And Telephone Corporation | Method and apparatus for video cut detection |
US5521841A (en) * | 1994-03-31 | 1996-05-28 | Siemens Corporate Research, Inc. | Browsing contents of a given video sequence |
US5708767A (en) * | 1995-02-03 | 1998-01-13 | The Trustees Of Princeton University | Method and apparatus for video browsing based on content and structure |
JPH09130732A (ja) * | 1995-11-01 | 1997-05-16 | Matsushita Electric Ind Co Ltd | シーンチェンジ検出方法および動画像編集装置 |
US5835163A (en) * | 1995-12-21 | 1998-11-10 | Siemens Corporate Research, Inc. | Apparatus for detecting a cut in a video |
US5767922A (en) * | 1996-04-05 | 1998-06-16 | Cornell Research Foundation, Inc. | Apparatus and process for detecting scene breaks in a sequence of video frames |
US5920360A (en) * | 1996-06-07 | 1999-07-06 | Electronic Data Systems Corporation | Method and system for detecting fade transitions in a video signal |
TW303555B (en) * | 1996-08-08 | 1997-04-21 | Ind Tech Res Inst | Digital data detecting method |
US5751378A (en) * | 1996-09-27 | 1998-05-12 | General Instrument Corporation | Scene change detector for digital video |
-
1998
- 1998-05-28 US US09/086,373 patent/US5990980A/en not_active Expired - Lifetime
- 1998-12-22 WO PCT/US1998/027281 patent/WO1999033261A1/en active IP Right Grant
- 1998-12-22 EP EP98964857A patent/EP1048169B1/en not_active Expired - Lifetime
- 1998-12-22 CA CA002311662A patent/CA2311662C/en not_active Expired - Lifetime
- 1998-12-22 JP JP2000526044A patent/JP4335440B2/ja not_active Expired - Lifetime
- 1998-12-22 AU AU20087/99A patent/AU2008799A/en not_active Abandoned
- 1998-12-22 DE DE69841656T patent/DE69841656D1/de not_active Expired - Lifetime
- 1998-12-22 KR KR1020007007061A patent/KR100591470B1/ko not_active IP Right Cessation
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0759108A (ja) * | 1993-08-10 | 1995-03-03 | Kokusai Denshin Denwa Co Ltd <Kdd> | 動画像のカット画面検出方法 |
JPH08214210A (ja) * | 1993-12-17 | 1996-08-20 | Nippon Telegr & Teleph Corp <Ntt> | 映像カット点検出方法及び装置 |
JPH07193718A (ja) * | 1993-12-24 | 1995-07-28 | Nec Corp | レーザプリンタの画像信号制御装置 |
JPH07193818A (ja) * | 1993-12-27 | 1995-07-28 | Sony Corp | 画像処理方法および画像処理装置 |
JPH08237549A (ja) * | 1994-06-27 | 1996-09-13 | Natl Univ Of Singapore | 自動ビデオ区分とキーフレーム抽出用システム |
JPH08102938A (ja) * | 1994-09-30 | 1996-04-16 | Sony Corp | 画像符号化装置 |
JPH08227462A (ja) * | 1995-02-21 | 1996-09-03 | Hitachi Ltd | 動画像の変化点検出方法及び装置 |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8055063B2 (en) | 2003-09-30 | 2011-11-08 | Sharp Laboratories Of America, Inc. | Methods and systems for improving robustness of color balance correction |
JP2005190473A (ja) * | 2003-12-05 | 2005-07-14 | Sharp Corp | 光源モデル推定のためのシステムおよび方法 |
JP2010015588A (ja) * | 2009-08-27 | 2010-01-21 | Kddi R & D Laboratories Inc | 動画像データの分類装置 |
JP2014087070A (ja) * | 2012-10-25 | 2014-05-12 | Tektronix Inc | ビデオ検出器及びシーン変更検出方法 |
Also Published As
Publication number | Publication date |
---|---|
EP1048169A1 (en) | 2000-11-02 |
JP4335440B2 (ja) | 2009-09-30 |
US5990980A (en) | 1999-11-23 |
CA2311662A1 (en) | 1999-07-01 |
CA2311662C (en) | 2008-05-13 |
EP1048169B1 (en) | 2010-05-05 |
WO1999033261A1 (en) | 1999-07-01 |
AU2008799A (en) | 1999-07-12 |
EP1048169A4 (en) | 2004-08-11 |
KR100591470B1 (ko) | 2006-06-20 |
DE69841656D1 (de) | 2010-06-17 |
KR20010033552A (ko) | 2001-04-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2001527344A (ja) | ビデオーケンスにおける転換の検出 | |
US6493042B1 (en) | Feature based hierarchical video segmentation | |
US8818037B2 (en) | Video scene detection | |
US8379154B2 (en) | Key-frame extraction from video | |
EP0729117B1 (en) | Method and apparatus for detecting a point of change in moving images | |
US7123769B2 (en) | Shot boundary detection | |
US6535254B1 (en) | Method and device for noise reduction | |
EP2224357A1 (en) | Video segmentation | |
JP2006510072A (ja) | 一様なカラーセグメントを検出するための方法及びシステム | |
EP1132812B1 (en) | Method of detecting dissolve/fade in mpeg-compressed video environment | |
CN106937114B (zh) | 用于对视频场景切换进行检测的方法和装置 | |
JP2005328105A (ja) | 視覚的に代表するビデオサムネイルの生成 | |
JP2010507155A (ja) | ビデオシーケンス内の漸進的遷移の検出 | |
CN100553285C (zh) | 电子水印嵌入装置及其嵌入方法 | |
EP0940033B1 (en) | Method of processing a video stream | |
US6995805B1 (en) | Method and system for scene change detection | |
Fernando et al. | Fade-in and fade-out detection in video sequences using histograms | |
JPH0837621A (ja) | 場面カットの検出方法 | |
EP1402463A1 (en) | Automatic natural content detection in video information | |
US8150167B2 (en) | Method of image analysis of an image in a sequence of images to determine a cross-fade measure | |
CN114449362B (zh) | 视频封面的选取方法、装置、设备及存储介质 | |
JP3358692B2 (ja) | 映像ブロック分類方法及び装置 | |
WO2004075537A1 (en) | Shot-cut detection | |
CN108737814B (zh) | 一种基于动态模式分解的视频镜头检测方法 | |
JP3569391B2 (ja) | 文字出現フレーム抽出装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A711 Effective date: 20050622 |
|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20050622 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20050704 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20051201 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20081020 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20081104 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20090202 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20090303 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20090521 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20090616 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20090625 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120703 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120703 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130703 Year of fee payment: 4 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
EXPY | Cancellation because of completion of term |