JP2006518960A - ショット切れ目検出 - Google Patents

ショット切れ目検出 Download PDF

Info

Publication number
JP2006518960A
JP2006518960A JP2006502589A JP2006502589A JP2006518960A JP 2006518960 A JP2006518960 A JP 2006518960A JP 2006502589 A JP2006502589 A JP 2006502589A JP 2006502589 A JP2006502589 A JP 2006502589A JP 2006518960 A JP2006518960 A JP 2006518960A
Authority
JP
Japan
Prior art keywords
segments
segment
image
pair
value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2006502589A
Other languages
English (en)
Inventor
ファビアン イー エルンスト
ヤン エイ ディー ネスヴァドバ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Koninklijke Philips NV
Original Assignee
Koninklijke Philips Electronics NV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Koninklijke Philips Electronics NV filed Critical Koninklijke Philips Electronics NV
Publication of JP2006518960A publication Critical patent/JP2006518960A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/14Picture signal circuitry for video frequency region
    • H04N5/147Scene change detection
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/83Generation or processing of protective or descriptive data associated with content; Content structuring
    • H04N21/845Structuring of content, e.g. decomposing content into time segments
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Signal Processing (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Image Analysis (AREA)
  • Picture Signal Circuits (AREA)

Abstract

セグメンテーションによって決定される第1のセグメントのセット(
【数71】
Figure 2006518960

【数72】
Figure 2006518960

【数73】
Figure 2006518960

及び
【数74】
Figure 2006518960

)及び第2のセグメントのセット(
【数75】
Figure 2006518960

【数76】
Figure 2006518960

【数77】
Figure 2006518960

及び
【数78】
Figure 2006518960

)に基づいてビデオ画像のシーケンスにおいてショット切れ目を検出する方法は、前記第1のセグメントのセット(
【数79】
Figure 2006518960

【数80】
Figure 2006518960

【数81】
Figure 2006518960

及び
【数82】
Figure 2006518960

)に基づいて第3のセグメントのセット(
【数83】
Figure 2006518960

【数84】
Figure 2006518960

【数85】
Figure 2006518960

及び
【数86】
Figure 2006518960

)を作成するステップと、セグメントの各対が、前記第3のセグメントのセットのセグメント(
【数87】
Figure 2006518960

)のうちの1つと、前記第2のセグメントのセットのセグメント(
【数88】
Figure 2006518960

)のうちの1つとを有するセグメントの各々の対の間の重なりを表わす多くの値(Aij)に基づいて整合性測度C(n−1,n)を計算するステップと、所定のしきい値(T)と前記整合性測度(C(n−1,n))を比較し、前記整合性測度(C(n−1,n))が前記所定のしきい値(T)未満である場合には前記ショット切れ目が検出されると決定するステップとを有する。

Description

本発明は、ビデオ画像のシーケンスにおいてショット切れ目(shot-cut)を検出する方法に関する。
更に、本発明は、ビデオ画像のシーケンスにおいてショット切れ目を検出するためのショット切れ目検出器に関する。
更に、本発明は、
−ビデオ画像のシーケンスに対応する信号を受け取るための受け取り手段と、
−前記ビデオ画像のシーケンスにおいてショット切れ目を検出するためのショット切れ目検出器と、
−前記ショット切れ目検出器によって制御される画像処理ユニットとを有する画像処理装置に関する。
更に、本発明は、コンピュータ装置によってロードされるべきコンピュータプログラム製品であって、ビデオ画像のシーケンスにおいてショット切れ目を検出するための命令を有するコンピュータプログラム製品に関する。
利用可能なデジタルビデオコンテンツの増大のために、索引付け、ビデオ・オン・デマンド、デジタルライブラリ及びコンテンツ分析などの高レベルのアプリケーションは、完全なビデオシーケンスを多数のシーン及び/又はショット(shot)に分割することを必要とする。シーンは、1つ又は多数のショットを有する。ショットの取得中、カメラは静止する、又は随意に、同じシーンの画像を取得しながら継続的に動く。ショット切れ目検出器は、ショットの境界を示すよう構成される。他のビデオ処理アプリケーションもまた、ショット切れ目の検出から多大な恩恵を受けることができ、例えば、
−ビデオ圧縮、即ち、例えばMPEG規格に従う符号化又は復号化においては、ショット切れ目を知ることにより、ショットの各先頭フレームがIフレーム(参照フレーム)として符号化されることが可能であり、
−シーン分類、即ち、例えばスポーツの試合又は映画又はアニメといったビデオコンテンツのタイプの決定においては、適切なショット切れ目の検出が、ショット又はシーンに基づく分析におけるノイズの発生を防止し、
−2Dから3Dへのコンテンツの変換においては、セグメンテーション及びカメラキャリブレーション/奥行き(camera calibration/depth)推定プロセスがショット切れ目後に再始動されるであろう。
文献においては、様々なタイプのショット切れ目検出器が発表されている。例えば、"Fast scene change detection using direct feature extraction from MPEG compressed video", by S.W. Lee et al., in IEEE Transactions on Multimedia, 2: 240-254, 2000及び"A robust scene-change detection method for video segmentation", by C.L. Huang , in IEEE Transactions on Circuits and Systems for Video Technology, 11:1281-1288, 2001である。既知のショット切れ目検出器は、例えばカラーヒストグラム、画素値差、動きベクトルといった該検出器が用いる特徴に従って、又は該検出器が非圧縮ドメイン用に設計されているか、若しくは圧縮(MPEG)ドメイン用に設計されているかに従って分類され得る。
多くのショット切れ目検出器は、ビデオシーケンスにおける位置であって、その位置の前の画像のセットと、その位置の後の画像のセットとの間に大きな相違点がある位置を見つけるために、多数の画像の統計量(statistical measure)の比較に依存する。この統計量は、例えば画素ベースの画像差といった局所的な基準、又は例えばカラーヒストグラムの比較といった大域的な基準のいずれかに基づき得る。最近、フェード(fading)などの緩やかな遷移を検出することにも、より注意が払われている。例えば、"A unified approach to scene change detection in uncompressed and compressed video", by W.A.C. Fernando et al, in IEEE Transactions on Consumer
Electronics, 46:769-779, 2001を参照されたい。
画素ベースのショット切れ目検出器は、該検出器は、ノイズに弱く、動いているオブジェクト又はカメラの動きのいずれかに起因する動きを取り扱うのが難しいという不利な点を持つ。他方、ヒストグラムベースの大域的なショット切れ目検出器は、よりロバストであるが、画像内のデータの空間分布を無視する。
本発明の目的は、相対的にロバストである冒頭の段落に記載されている種類のショット切れ目を検出する方法を提供することにある。
本発明のこの目的は、第1画像及び第2画像を有するビデオ画像のシーケンスにおいてショット切れ目を検出する方法であって、前記第1画像が、セグメンテーションによって決定される第1のセグメントのセットを有し、前記第2画像が、セグメンテーションによって決定される第2のセグメントのセットを有する方法が、
−前記第2画像のために前記第1のセグメントのセットに基づいて第3のセグメントのセットを作成するステップと、
−セグメントの各対が、前記第3のセグメントのセットのセグメントのうちの1つと、前記第2のセグメントのセットのセグメントのうちの1つとを有するセグメントの各々の対の間の重なりを表わす多くの値に基づいて整合性測度(consistency measure)を計算するステップと、
−所定のしきい値と前記整合性測度を比較し、前記整合性測度が前記所定のしきい値未満である場合には前記ショット切れ目が検出されると決定する(establish)ステップとを有することで達成される。
ショット切れ目を検出する既知の方法との違いは、演繹的に既知な画素のグループの代わりに、画像のセグメントが、互いと比較されることにある。換言すると、本発明による方法においては、前記セグメントがセグメンテーションによって決定されることから、前記画像のコンテンツに関連するセグメントが互いと比較される。それは、本発明による方法においては、前記整合性測度が、前記画像内の幾何学的構造、即ち、オブジェクトの表示の比較に基づくことを意味する。前記第1画像内に表わされているオブジェクトと、前記第2画像内に表わされているオブジェクトとの間に相対的に強い関係があるように見える場合には、前記第1画像と前記第2画像とが同じショットに属する可能性は相対的に高い。しかしながら、前記第1画像内に表わされているオブジェクトと、前記第2画像内に表わされているオブジェクトとの間に相対的に弱い関係があるように見える場合には、前記第1画像と前記第2画像とが同じショットに属する可能性は相対的に低く、従って、前記第1画像と前記第2画像とは異なるショットに属する。それは、前記第1画像と前記第2画像との間にショット切れ目があることを意味する。
好ましくは、前記第3のセグメントのセットの作成は、前記第1のセグメントのセットの各々のセグメントのために推定される動きベクトルに基づいて行なわれる。本発明によるこの実施例の利点は、相対的に大きい動きを持つ画像シーケンスに対してロバストであることにある。
本発明による方法の実施例においては、前記セグメントの各々の対の間の重なりを表わす値の第1の値が、前記第2のセグメントのセットのセグメントのうちの第1セグメントに属し、前記第3のセグメントのセットのセグメントのうちの第1セグメントに属する画素の数を数えることによって計算される。本発明によるこの実施例の利点は、2つのセグメントに属する画素を数えることは相対的に容易であることにある。
数えるのに代わる変形例は、前記2つのセグメントに属する画素のために重み係数が利用されるものである。前記第1画像及び/又は前記第2画像の画素値から導き出される重み係数を利用することによってロバストさが高められる。
重み係数が利用される本発明による方法の実施例においては、前記セグメントの各々の対の間の重なりを表わす値の第1の値が、重み付けされた値の累積によって計算され、前記重み付けされた値の第1の値は、前記第2のセグメントのセットのセグメントのうちの第1セグメントの第1画素の第1輝度値と、前記第1画像の第2画素の第2輝度値との間の差に関し、前記第1画素は、前記第3のセグメントのセットのセグメントのうちの第1セグメントにも属する。前記第1画素と前記第2画素とは、互いに等しい座標を持つかもしれないが、好ましくは、前記第1画素と前記第2画素とは、同じシーンポイント(scene point)に対応していると推定される。換言すると、前記第1画素と前記第2画素との間の関係を表わす動きベクトルがある。
重み係数が利用される本発明による画像処理装置の別の実施例においては、前記セグメントの各々の対の間の重なりを表わす値の第1の値が、重み付けされた値の累積によって計算され、前記重み付けされた値の第1の値は、前記第2のセグメントのセットのセグメントのうちの第1セグメントの第1画素の第1明度(first color value)と、前記第1画像の第2画素の第2明度との間の差に関し、前記第1画素は、前記第3のセグメントのセットのセグメントのうちの第1セグメントにも属する。前記第1画素と前記第2画素とは、互いに等しい座標を持つかもしれないが、好ましくは、前記第1画素と前記第2画素とは、同じシーンポイントに対応していると推定される。換言すると、前記第1画素と前記第2画素との間の関係を表わす動きベクトルがある。
本発明による方法の実施例は、各々の重なりを表わす値に基づいて、セグメントの対のセットからセグメントの対を選択することによって、前記セグメントの各々の対を決定するステップを有する。前記整合性測度は、対応している可能性が最も高いセグメントの対に基づく。対応しているということは、同じセグメントを有するセグメントの他の対と比較して重なりの量が相対的に多いことを意味する。それは、前記整合性測度を計算するのに利用されるセグメントの対は、より大きな、セグメントのありうる対のセットから選択されなければならないことを意味する。
本発明による方法の実施例においては、前記第3のセグメントのセットのセグメントのうちの第1セグメントと、前記第2のセグメントのセットのセグメントのうちの第1セグメントとを有する、前記セグメントの対のセットのうちの第1の対は、対応する重なりの値が、
−各々が、前記第3のセグメントのセットのセグメントのうちの前記第1セグメントと、前記第2のセグメントのセットのセグメントのうちの前記第1セグメントではない他のセグメントとを有するセグメントの他の対に対応する他の重なりの値より大きく、
−各々が、前記第2のセグメントのセットのセグメントのうちの前記第1セグメントと、前記第3のセグメントのセットのセグメントのうちの前記第1セグメントではない他のセグメントとを有するセグメントの他の対に対応する他の重なりの値より大きい場合に選択される。
本発明によるこの実施例の利点は、セグメントの関連する対しか用いられないことにある。セグメントの関連しない対は、合計に対しては無視される。
本発明による方法の実施例においては、前記所定のしきい値が、前記第1のセグメントのセットのセグメントの数に基づく。セグメントの数が増加する場合には、前記セグメントの大きさは当然縮小するであろう。これは、良好な一致を見いだせる可能性が低い前記セグメントのまわりのより多くの境界領域をもたらすであろう。セグメントの数の増大は、重なりの可能性の低下をもたらすであろう。この知識は、前記ショット切れ目のための前記所定のしきい値を、セグメントの数、即ち、セグメントの平均的な大きさに依存させるのに利用される。
本発明による方法の実施例においては、前記所定のしきい値が、前記動きベクトルに基づく。動きの量が多い場合には、オクルージョン(occlusion)の平均的な大きさも相対的に大きい。オクルージョンは、重なりの割合を低減させる。なぜなら、当然、一致は見つからないからである。その他に、動きの増大は、正しい動き推定のより低い確率をもたらすであろう。
他の例においては、前記所定のしきい値は、テクスチャ(texture)の量、即ち、平均一様性に基づく。前記テクスチャは、前記画像をセグメントに分けるのに用いられる。ぼやけたテクスチャは、前記整合性測度を低減させるであろう不安定なセグメンテーションをもたらすであろう。前記ショット切れ目検出器の前記所定のしきい値は、テクスチャ/一様性に依存し得る。
本発明の他の目的は、相対的にロバストである冒頭の段落に記載されている種類のショット切れ目検出器を提供することにある。
この目的は、第1画像及び第2画像を有するビデオ画像のシーケンスにおいてショット切れ目を検出するためのショット切れ目検出器であって、前記第1画像が、セグメンテーションによって決定される第1のセグメントのセットを有し、前記第2画像が、セグメンテーションによって決定される第2のセグメントのセットを有するショット切れ目検出器が、
−前記第2画像のために前記第1のセグメントのセットに基づいて第3のセグメントのセットを作成するための作成手段と、
−セグメントの各対が、前記第3のセグメントのセットのセグメントのうちの1つと、前記第2のセグメントのセットのセグメントのうちの1つとを有するセグメントの各々の対の間の重なりを表わす多くの値に基づいて整合性測度を計算するための計算手段と、
−所定のしきい値と前記整合性測度を比較し、前記整合性測度が前記所定のしきい値未満である場合には前記ショット切れ目が検出されると決定するための比較手段とを有することで達成される。
本発明の他の目的は、相対的にロバストである冒頭の段落に記載されている種類のショット切れ目検出器を有する画像処理装置を提供することにある。
この目的は、第1画像及び第2画像を有するビデオ画像のシーケンスにおいてショット切れ目を検出するためのショット切れ目検出器であって、前記第1画像が、セグメンテーションによって決定される第1のセグメントのセットを有し、前記第2画像が、セグメンテーションによって決定される第2のセグメントのセットを有するショット切れ目検出器が、
−前記第2画像のために前記第1のセグメントのセットに基づいて第3のセグメントのセットを作成するための作成手段と、
−セグメントの各対が、前記第3のセグメントのセットのセグメントのうちの1つと、前記第2のセグメントのセットのセグメントのうちの1つとを有するセグメントの各々の対の間の重なりを表わす多くの値に基づいて整合性測度を計算するための計算手段と、
−所定のしきい値と前記整合性測度を比較し、前記整合性測度が前記所定のしきい値未満である場合には前記ショット切れ目が検出されると決定するための比較手段とを有することで達成される。
本発明による画像処理装置の実施例においては、前記画像処理ユニットが、ビデオ圧縮を行なうよう構成される。本発明による画像処理装置の別の実施例においては、前記画像処理ユニットが、シーン分類を行なうよう構成される。
本発明の他の目的は、相対的にロバストである冒頭の段落に記載されている種類のコンピュータプログラム製品を提供することにある。
この目的は、第1画像及び第2画像を有するビデオ画像のシーケンスにおいてショット切れ目を検出するためのコンピュータプログラム製品であって、前記第1画像が、セグメンテーションによって決定される第1のセグメントのセットを有し、前記第2画像が、セグメンテーションによって決定される第2のセグメントのセットを有するコンピュータプログラム製品が、ロードされた後に、処理手段に、
−前記第2画像のために前記第1のセグメントのセットに基づいて第3のセグメントのセットを作成すること、
−セグメントの各対が、前記第3のセグメントのセットのセグメントのうちの1つと、前記第2のセグメントのセットのセグメントのうちの1つとを有するセグメントの各々の対の間の重なりを表わす多くの値に基づいて整合性測度を計算すること、及び
−所定のしきい値と前記整合性測度を比較し、前記整合性測度が前記所定のしきい値未満である場合には前記ショット切れ目が検出されると決定することを実行するための機能を与えることで達成される。
前記方法の修正例及び変形例は、記載されている前記ショット切れ目検出器、前記画像処理装置及び前記コンピュータプログラム製品の修正例及び変形例に対応し得る。
添付図面を参照して、下記の実施例に関して、本発明による方法、ショット切れ目検出器、画像処理装置及びコンピュータプログラム製品のこれら及び他の特徴を、説明し、明らかにする。
これらの図を通して、同じ参照符号は同様の部分を示すのに用いられる。
図1は、第1のセグメントのセット
Figure 2006518960
Figure 2006518960
Figure 2006518960
及び
Figure 2006518960
を備える第1画像n−1と、第2のセグメントのセット
Figure 2006518960
Figure 2006518960
Figure 2006518960
及び
Figure 2006518960
を備える第2画像nとを概略的に示している。第2画像nは、第3のセグメントのセット
Figure 2006518960
Figure 2006518960
Figure 2006518960
及び
Figure 2006518960
も有する。第3のセグメントのセットのセグメント
Figure 2006518960
Figure 2006518960
Figure 2006518960
及び
Figure 2006518960
は、各々、セグメント
Figure 2006518960
Figure 2006518960
Figure 2006518960
及び
Figure 2006518960
に基づく。それは、例えば
Figure 2006518960
及び
Figure 2006518960
といった対応するセグメントが、各々の画像n−1及びnの対応する画素を有することを意味するかもしれない。この場合には、第3のセットのセグメントは、第1のセットのセグメントの第2画像への直接的な射影(direct projection)として理解され得る。他の例においては、2つの対応するセグメントは、等しい大きさ及び形状を持つが、対応する画素を有さない。その場合には、第3のセグメントのセグメントは、第1のセットの射影されたセグメントに基づき、それは、第1のセットのそのセグメントのために推定された動きベクトルを表わすベクトルでシフトされる。
画像n−1は、ビデオ画像のシーケンスにおける前又は次の画像nであり得ることに注意されたい。
図2は、本発明によるショット切れ目検出器200を概略的に示している。ショット切れ目検出器200は、セグメンテーションによって見出されるセグメントに基づいてビデオ画像のシーケンスにおいてショット切れ目を検出するよう構成される。セグメンテーションは、ショット切れ目検出器の一部であるセグメンテーションユニット(図示せず)によって行なわれてもよい。他の例においては、セグメンテーションは外部で行なわれ、セグメントはショット切れ目検出器の入力コネクタ208において供給される。セグメントは、セグメントの輪郭の記述によって表わされ得る。他の例においては、セグメントは行列によって表わされる。第1のセグメントのセットは、ビデオ画像のシーケンスの第1画像に対応し、第2のセグメントのセットは、ビデオ画像のシーケンスの第2画像に対応する。
ショット切れ目検出器200は、
−第2画像のために、第1のセグメントのセット
Figure 2006518960
Figure 2006518960
Figure 2006518960
及び
Figure 2006518960
に基づいて、第3のセグメントのセット
Figure 2006518960
Figure 2006518960
Figure 2006518960
及び
Figure 2006518960
を作成するためのセット作成器202であって、セグメントの作成が、第1のセットのセグメントの直接的な射影に基づくことができ、好ましくは、前記作成が、第1のセットのセグメントのために推定され、入力コネクタ216によって供給される動きベクトルにも基づくセット作成器202と、
−セグメントの各対が、第3のセグメントのセットのセグメント
Figure 2006518960
のうちの1つと、第2のセグメントのセットのセグメント
Figure 2006518960
のうちの1つとを有するセグメントの各々の対の間の重なりを表わす多くの値Aijに基づいて整合性測度C(n−1,n)を計算するための整合性測度計算ユニット204と、
−所定のしきい値Tと整合性測度C(n−1,n)を比較し、整合性測度C(n−1,n)が所定のしきい値T未満である場合には、出力コネクタ210において、ショット切れ目が検出されると決定するための比較ユニット206であって、所定のしきい値Tが入力コネクタ212によって供給される比較ユニット206とを有する。
セット作成器202、整合性測度計算ユニット204及び比較ユニット206は1つのプロセッサを用いて実施されてもよい。通常、これらの機能はソフトウェアプログラム製品の制御の下で実行される。通常、実行中、ソフトウェアプログラム製品は、RAMのようなメモリにロードされ、そこから実行される。プログラムは、ROM、ハードディスク又は磁気的及び/若しくは光学的記憶装置のようなバックグラウンドメモリからロードされてもよく、又はインターネットのようなネットワークを介してロードされてもよい。随意に、特定用途向け集積回路が、開示されている機能を供給する。
ショット切れ目検出器200の動作は、以下に例を用いて説明されている。現在の画像nの1つのセグメント
Figure 2006518960
と、前の画像n−1のセグメント
Figure 2006518960
から導き出される1つのセグメント
Figure 2006518960
とから成るセグメントの各対のために、重なりを表わす値Aijが計算される。これは、式1において明示されているように、セグメント
Figure 2006518960

Figure 2006518960
との両方に属する画像nの座標
Figure 2006518960
を持つ画素を数えることによって行なわれる。
Figure 2006518960
両方のセグメントのセット、即ち、各々、第2のセグメントのセット及び第3のセグメントのセットの全てのセグメント
Figure 2006518960
及び
Figure 2006518960
に対してこれが行われる場合に、行列Aが決まる。行列Aの要素は、表わす各々の値Aijに対応する。この行列Aから、所謂対応するセグメントが選択される。それは、セグメントのセット全体からセグメントの特定の対が選択されることを意味する。第3のセグメントのセットのセグメント
Figure 2006518960
のうちの第1セグメントと、第2のセグメントのセットのセグメント
Figure 2006518960
のうちの第1セグメントとを有するセグメントの特定の対は、対応する重なりを表わす値Aijが、
−各々が、第3のセグメントのセットのセグメントのうちの第1セグメントと、第2のセグメントのセットのセグメントのうちの第1セグメントではない他のセグメントとを有するセグメントの他の対に対応する他の重なりの値より大きく、
−各々が、第2のセグメントのセットのセグメントのうちの第1セグメントと、第3のセグメントのセットのセグメントのうちの第1セグメントではない他のセグメントとを有するセグメントの他の対に対応する他の重なりの値より大きい場合に、選択される。
換言すると、Aijが列iと行jとの両方において最大の要素である場合に、セグメントは対応すると呼ばれる。これは、
Figure 2006518960

Figure 2006518960
上に重なる最大のセグメントであり、
Figure 2006518960

Figure 2006518960
上に重なる最大のセグメントであることを意味する。
整合性測度C(n−1,n)は、セグメントの選択された対に対応する重なりを表わす値の合計によって計算される。例えば、表1参照。
表1:セグメントの各々の対の間の重なりを表わす実例値
Figure 2006518960
以下の対応するセグメントの対、即ち、
Figure 2006518960
Figure 2006518960
及び
Figure 2006518960
が選択されるように思える。各々の重なりの値は、A21=300、A33=400及びA44=65である。例えば
Figure 2006518960
及び
Figure 2006518960
といった幾つかのセグメントは全く選択されないことに注意されたい。それは、対応するセグメントが見つからなかったことを意味する。
整合性測度C(n−1,n)は、対応するセグメントの対の重なりの値の合計によって計算される。従って、C(n−1,n)は765(=300+400+65)に等しい。
好ましくは、画素数N∈n、即ち画像nの画素数による除算によって正規化整合性測度
Figure 2006518960
が計算される。
Figure 2006518960
正規化整合性測度
Figure 2006518960
の値は[0,1]の範囲内である。
正規化整合性測度
Figure 2006518960
の値は、ショット切れ目を検出するために所定のしきい値Tと比較され、
Figure 2006518960
<Tの場合には、画像n−1とnとの間にショット切れ目がある。Tの典型的な値は0.4である。
別の実施例においては、所定のしきい値Tは、固定されず、画像対ごとに異なる。この浮動的な所定のしきい値T(n)は、整合性測度の移動平均に基づくことができ、現在の整合性測度の値がその平均を著しく下回る場合にショット切れ目が検出される。各検出ショット切れ目の後で、移動平均はリセットされる。
ショット切れ目の決定的なパラメータは、画像中の全画素数と比較しての画像n−1のセグメントと画像nのセグメントとの相対的な重なりである。画像n−1及び画像nのマッチング画素の数が増加させられ得る場合には重なりは増大する。動き推定及び補償は、より良いマッチング結果を得るための可能な改善である。動き補償は、画像n−1及び画像nのセグメントのマッチングの前に行なわれる。それは、第3のセグメントのセットのセグメントが、第1のセグメントのセットのセグメントと、これらのセグメントの各々の動きベクトルとに基づくことを意味する。これは、マッチング結果における動きの影響を低減する。従って、動き推定及び補償が利用される場合、ロバストさは高められる。
本発明による別の実施例においては、重なりを表わす値は、画像n−1及びnの画素の値に基づく。それは、前記値が画素ごとの重み係数
Figure 2006518960
の合計によって計算されることを意味する。
Figure 2006518960
重み係数
Figure 2006518960
の例は、式4乃至7によって与えられる。
Figure 2006518960
又は
Figure 2006518960
Figure 2006518960
は、画像nにおいて座標
Figure 2006518960
を持つ画素の輝度値であり、
Figure 2006518960
は、動きベクトルに基づく
Figure 2006518960
の推定座標である。
Figure 2006518960
又は
Figure 2006518960
Figure 2006518960
は、画像nにおいて座標
Figure 2006518960
を持つ画素の明度である。
輝度値又は明度は入力コネクタ214によって供給される。
随意に、2つの輝度値又は明度の間の最大差に関する値で、重なりを表わす計算値を除算することによって、付加的な正規化が行なわれる。
セグメンテーションがビデオエンコーダにおいて行なわれる場合には、整合性測度はビデオエンコーダによっても計算され得る。その場合、圧縮されたストリームにも整合性測度の表示が挿入され得る(フレームごとに0と1との間の1つの値、それ故、例えば、フレームごとに8ビットの追加ビットで十分であろう)。符号化側においては所定のしきい値についての決定がなされる必要がないことに注意されたい。このアプローチでは、圧縮されたストリームを受け取るよう設計されている装置により、圧縮ドメインにおいてショット切れ目検出が行なわれ得る。
図3は、本発明に基づいて、音楽ビデオクリップの画像番号の関数として計算される整合性測度を概略的に示している。x軸は、画像(フレーム)番号を表わし、y軸は整合性測度を表わす。所定のしきい値T=0.4を利用することによって、ショット切れ目が検出され得る。ビデオシーケンス中のショット切れ目の実際の数は相対的に多い可能性があることに注意されたい。720枚の画像を有するこのビデオ材料の例においては、30個のショット切れ目がある。
図4は、本発明による画像処理装置400を概略的に示している。画像処理装置400は、
−入力画像を表わす信号を受け取るための受け取り手段402と、
−図2と関連して記載されているようなショット切れ目検出器200と、
−ショット切れ目検出器によって制御される画像処理ユニット406と、
−画像処理ユニット406の出力画像を表示するための表示装置408とを有する。
信号は、アンテナ又はケーブルを介して受け取られるブロードキャスト信号であってもよいが、VCR(Video Cassette Recorder)又はDVD(Digital Versatile Disk)のような記憶装置からの信号であってもよい。信号は、入力コネクタ410において供給される。画像処理装置400は、例えばTVであってもよい。他の例においては、画像処理装置400は、随意の表示装置408を含まないが、表示装置を有する装置に出力画像を供給する。その場合、画像処理装置400は、例えば、セットトップボックス、衛星受信機、VCRプレーヤ、DVDプレーヤ又はレコーダであってもよい。随意に、画像処理装置400は、例えば光ディスクといった取り外し可能な媒体における記憶のための手段又はハードディスクのうような記憶手段を有する。画像処理装置400はまた、映画スタジオ又はブロードキャスタによって利用されるシステムであってもよい。
画像処理ユニット406は、以下のタイプの画像処理、即ち、
−ビデオ圧縮、即ち、例えばMPEG規格に従う符号化又は復号、
−デインターレーシング(de-interlacing)(インターレーシングは、奇数番号をつけられた画像線又は偶数番号をつけられた画像線を交互に伝送するための一般的なビデオブロードキャストプロシージャであり、デインターレーシングは、フルの垂直解像度を復元しようとする、即ち、各画像のために奇数線と偶数線とを同時に利用可能にしようとする)、
−画像レート変換(元の入力画像の連続から出力画像のより大きい連続が計算され、出力画像が時間的に2つの元の入力画像の間に配置される)、及び
−時間的なノイズの低減(これは、空間的・時間的なノイズの低減をもたらす空間的な処理も含むことが出来る)のうちの1つ以上をサポートし得る。
全てのこれらのタイプの画像処理にとって、入ってくるビデオ画像のシーケンスをサブシーケンスに分割することは適切である。なぜなら、これらのタイプの画像処理において関連しない画像を組み合わせることはアーチファクトをもたらし得るからである。
本発明による方法及び検出器はビデオシーケンスにおいて異なるタイプのショット切れ目を検出するのに利用され得ることに注意されたい。これらのショット切れ目は、鮮明な切れ目(hard cut)を含むが、緩やかな切れ目(soft-cut)、即ち、所謂ワイプ、フェードイン、フェードアウト又はディゾルブも含む。それは、例えば、第1ショットの画像と、第2ショットの画像とが部分的に混合されることを意味する。
上記の実施例は、本発明を限定するものではなく、説明するものであり、当業者は、添付されている特許請求の範囲の範囲から外れない別の実施例を設計することが出来るであろうことに注意されたい。特許請求の範囲においては、括弧内に配置されている如何なる参照符号も特許請求の範囲を限定するものとして解釈されるべきではない。「有する」という文言は、請求項において列挙されていない要素又はステップの存在を除外しない。要素の単数形表記は、このような要素の複数の存在を除外しない。本発明は、幾つかの別個の素子を有するハードウェア、及び適当にプログラムされたコンピュータによって実施され得る。幾つかの手段を列挙する装置クレームにおいて、これらの手段の幾つかはハードウェアの同一アイテムによって実施され得る。
第1のセグメントのセットを備える第1画像と、第2のセグメントのセット及び第3のセグメントのセットを備える第2画像とを概略的に示す。 本発明によるショット切れ目検出器を概略的に示す。 本発明に従って、音楽ビデオクリップの画像数の関数として計算されている整合性測度を概略的に示す。 本発明による画像処理装置を概略的に示す。

Claims (14)

  1. 第1画像及び第2画像を有するビデオ画像のシーケンスにおいてショット切れ目を検出する方法であり、前記第1画像が、セグメンテーションによって決定される第1のセグメントのセットを有し、前記第2画像が、セグメンテーションによって決定される第2のセグメントのセットを有する方法であって、
    −前記第2画像のために前記第1のセグメントのセットに基づいて第3のセグメントのセットを作成するステップと、
    −セグメントの各対が、前記第3のセグメントのセットのセグメントのうちの1つと、前記第2のセグメントのセットのセグメントのうちの1つとを有するセグメントの各々の対の間の重なりを表わす多くの値に基づいて整合性測度を計算するステップと、
    −所定のしきい値と前記整合性測度を比較し、前記整合性測度が前記所定のしきい値未満である場合には前記ショット切れ目が検出されると決定するステップとを有する方法。
  2. 前記第3のセグメントのセットの作成が、前記第1のセグメントのセットの各々のセグメントのために推定される動きベクトルに基づいて行なわれることを特徴とする請求項1に記載の方法。
  3. 前記セグメントの各々の対の間の重なりを表わす値の第1の値が、前記第2のセグメントのセットのセグメントのうちの第1セグメントに属し、前記第3のセグメントのセットのセグメントのうちの第1セグメントに属する画素の数を数えることによって計算されることを特徴とする請求項1に記載の方法。
  4. 前記セグメントの各々の対の間の重なりを表わす値の第1の値が、重み付けされた値の累積によって計算され、前記重み付けされた値の第1の値が、前記第2のセグメントのセットのセグメントのうちの第1セグメントの第1画素の第1輝度値と、前記第1画像の第2画素の第2輝度値との間の差に関し、前記第1画素が、前記第3のセグメントのセットのセグメントのうちの第1セグメントにも属することを特徴とする請求項1に記載の方法。
  5. 前記セグメントの各々の対の間の重なりを表わす値の第1の値が、重み付けされた値の累積によって計算され、前記重み付けされた値の第1の値が、前記第2のセグメントのセットのセグメントのうちの第1セグメントの第1画素の第1明度と、前記第1画像の第2画素の第2明度との間の差に関し、前記第1画素が、前記第3のセグメントのセットのセグメントのうちの第1セグメントにも属することを特徴とする請求項1に記載の方法。
  6. 各々の重なりを表わす値に基づいて、セグメントの対のセットからセグメントの対を選択することによって、前記セグメントの各々の対を決定するステップを有することを特徴とする請求項1に記載の方法。
  7. 前記第3のセグメントのセットのセグメントのうちの第1セグメントと、前記第2のセグメントのセットのセグメントのうちの第1セグメントとを有する、前記セグメントの対のセットのうちの第1の対が、対応する重なりの値が、
    −各々が、前記第3のセグメントのセットのセグメントのうちの前記第1セグメントと、前記第2のセグメントのセットのセグメントのうちの前記第1セグメントではない他のセグメントとを有するセグメントの他の対に対応する他の重なりの値より大きく、
    −各々が、前記第2のセグメントのセットのセグメントのうちの前記第1セグメントと、前記第3のセグメントのセットのセグメントのうちの前記第1セグメントではない他のセグメントとを有するセグメントの他の対に対応する他の重なりの値より大きい場合に選択されることを特徴とする請求項6に記載の方法。
  8. 前記所定のしきい値が、前記第1のセグメントのセットのセグメントの数に基づくことを特徴とする請求項1に記載の方法。
  9. 前記所定のしきい値が、前記動きベクトルに基づくことを特徴とする請求項2に記載の方法。
  10. 第1画像及び第2画像を有するビデオ画像のシーケンスにおいてショット切れ目を検出するためのショット切れ目検出器であり、前記第1画像が、セグメンテーションによって決定される第1のセグメントのセットを有し、前記第2画像が、セグメンテーションによって決定される第2のセグメントのセットを有するショット切れ目検出器であって、
    −前記第2画像のために前記第1のセグメントのセットに基づいて第3のセグメントのセットを作成するための作成手段と、
    −セグメントの各対が、前記第3のセグメントのセットのセグメントのうちの1つと、前記第2のセグメントのセットのセグメントのうちの1つとを有するセグメントの各々の対の間の重なりを表わす多くの値に基づいて整合性測度を計算するための計算手段と、
    −所定のしきい値と前記整合性測度を比較し、前記整合性測度が前記所定のしきい値未満である場合には前記ショット切れ目が検出されると決定するための比較手段とを有するショット切れ目検出器。
  11. −ビデオ画像のシーケンスに対応する信号を受け取るための受け取り手段と、
    −請求項1に記載されているように前記ビデオ画像のシーケンスにおいてショット切れ目を検出するためのショット切れ目検出器と、
    −前記ショット切れ目検出器によって制御される画像処理ユニットとを有する画像処理装置。
  12. 前記画像処理ユニットが、ビデオ圧縮を行なうよう構成されることを特徴とする請求項11に記載の画像処理装置。
  13. 前記画像処理ユニットが、シーン分類を行なうよう構成されることを特徴とする請求項11に記載の画像処理装置。
  14. コンピュータ装置によってロードされるコンピュータプログラムであり、第1画像及び第2画像を有するビデオ画像のシーケンスにおいてショット切れ目を検出するための命令を有し、前記第1画像が、セグメンテーションによって決定される第1のセグメントのセットを有し、前記第2画像が、セグメンテーションによって決定される第2のセグメントのセットを有し、前記コンピュータ装置が、処理手段とメモリとを有するコンピュータプログラムであって、ロードされた後に、前記処理手段に、
    −前記第2画像のために前記第1のセグメントのセットに基づいて第3のセグメントのセットを作成すること、
    −セグメントの各対が、前記第3のセグメントのセットのセグメントのうちの1つと、前記第2のセグメントのセットのセグメントのうちの1つとを有するセグメントの各々の対の間の重なりを表わす多くの値に基づいて整合性測度を計算すること、及び
    −所定のしきい値と前記整合性測度を比較し、前記整合性測度が前記所定のしきい値未満である場合には前記ショット切れ目が検出されると決定することを実行するための機能を与えるコンピュータプログラム。
JP2006502589A 2003-02-21 2004-02-13 ショット切れ目検出 Pending JP2006518960A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
EP03100419 2003-02-21
PCT/IB2004/050111 WO2004075537A1 (en) 2003-02-21 2004-02-13 Shot-cut detection

Publications (1)

Publication Number Publication Date
JP2006518960A true JP2006518960A (ja) 2006-08-17

Family

ID=32892967

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006502589A Pending JP2006518960A (ja) 2003-02-21 2004-02-13 ショット切れ目検出

Country Status (6)

Country Link
US (1) US20060268181A1 (ja)
EP (1) EP1597914A1 (ja)
JP (1) JP2006518960A (ja)
KR (1) KR20050102126A (ja)
CN (1) CN1754382A (ja)
WO (1) WO2004075537A1 (ja)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2413990C2 (ru) 2005-05-19 2011-03-10 Конинклейке Филипс Электроникс Н.В. Способ и устройство для обнаружения границ элемента контента
CN100417201C (zh) * 2005-08-17 2008-09-03 智辉研发股份有限公司 检测新闻主播的影音特征以将电视新闻分段的方法
CN101192861B (zh) * 2006-12-01 2011-11-16 华为技术有限公司 网络中调整数据速率的方法、装置及通信系统
US8588514B2 (en) * 2007-05-11 2013-11-19 Koninklijke Philips N.V. Method, apparatus and system for processing depth-related information
CN101175214B (zh) * 2007-11-15 2010-09-08 北京大学 一种从广播数据流中实时检测广告的方法及设备
US20110122224A1 (en) * 2009-11-20 2011-05-26 Wang-He Lou Adaptive compression of background image (acbi) based on segmentation of three dimentional objects
TR201819457T4 (tr) 2011-06-22 2019-01-21 Koninklijke Philips Nv Bir sunum ekranı için bir sinyal oluşturmak üzere yöntem ve cihaz.
CN111079527B (zh) * 2019-11-07 2023-06-06 北京航空航天大学 一种基于3d残差网络的镜头边界检测方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08102938A (ja) * 1994-09-30 1996-04-16 Sony Corp 画像符号化装置
US5767922A (en) * 1996-04-05 1998-06-16 Cornell Research Foundation, Inc. Apparatus and process for detecting scene breaks in a sequence of video frames
JPH10215436A (ja) * 1997-01-30 1998-08-11 Sony Corp 記録再生装置および方法、並びに記録媒体
JP2002077723A (ja) * 2000-09-01 2002-03-15 Minolta Co Ltd 動画像処理装置、動画像処理方法および記録媒体
JP2003502957A (ja) * 1999-06-18 2003-01-21 テレフォンアクチーボラゲット エル エム エリクソン(パブル) 要約映像生成のための方法とシステム

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5635982A (en) * 1994-06-27 1997-06-03 Zhang; Hong J. System for automatic video segmentation and key frame extraction for video sequences having both sharp and gradual transitions
JP3932631B2 (ja) * 1997-03-21 2007-06-20 松下電器産業株式会社 圧縮動画像データカット検出装置
KR100327103B1 (ko) * 1998-06-03 2002-09-17 한국전자통신연구원 사용자의조력및물체추적에의한영상객체분할방법
KR100289054B1 (ko) * 1998-11-17 2001-05-02 정선종 매크로블록 단위 영역 분할 및 배경 모자이크구성방법
KR100380229B1 (ko) * 2000-07-19 2003-04-16 엘지전자 주식회사 엠펙(MPEG) 압축 비디오 환경에서 매크로 블록의 시공간상의 분포를 이용한 와이프(Wipe) 및 특수 편집 효과 검출 방법
JP2002281505A (ja) * 2001-03-16 2002-09-27 Toshiba Corp 動画像圧縮装置、同装置のカット検出用データ作成方法およびカット位置データ作成方法ならびにカット検出装置および同装置のカット検出方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08102938A (ja) * 1994-09-30 1996-04-16 Sony Corp 画像符号化装置
US5767922A (en) * 1996-04-05 1998-06-16 Cornell Research Foundation, Inc. Apparatus and process for detecting scene breaks in a sequence of video frames
JPH10215436A (ja) * 1997-01-30 1998-08-11 Sony Corp 記録再生装置および方法、並びに記録媒体
JP2003502957A (ja) * 1999-06-18 2003-01-21 テレフォンアクチーボラゲット エル エム エリクソン(パブル) 要約映像生成のための方法とシステム
JP2002077723A (ja) * 2000-09-01 2002-03-15 Minolta Co Ltd 動画像処理装置、動画像処理方法および記録媒体

Also Published As

Publication number Publication date
EP1597914A1 (en) 2005-11-23
CN1754382A (zh) 2006-03-29
WO2004075537A1 (en) 2004-09-02
US20060268181A1 (en) 2006-11-30
KR20050102126A (ko) 2005-10-25

Similar Documents

Publication Publication Date Title
US6940910B2 (en) Method of detecting dissolve/fade in MPEG-compressed video environment
US7519230B2 (en) Background motion vector detection
JP2006512029A (ja) セグメントベース動き推定
JP2006510072A (ja) 一様なカラーセグメントを検出するための方法及びシステム
US20060209957A1 (en) Motion sequence pattern detection
Yi et al. Fast pixel-based video scene change detection
US20070092111A1 (en) Motion vector field re-timing
JP2010507155A (ja) ビデオシーケンス内の漸進的遷移の検出
US20050180506A1 (en) Unit for and method of estimating a current motion vector
US7382899B2 (en) System and method for segmenting
US20050226462A1 (en) Unit for and method of estimating a motion vector
US8509303B2 (en) Video descriptor generation device
US8611423B2 (en) Determination of optimal frame types in video encoding
JP2009533887A (ja) 動きベクトル場修正装置及び方法
US20090180670A1 (en) Blocker image identification apparatus and method
JP2006518960A (ja) ショット切れ目検出
US20050163355A1 (en) Method and unit for estimating a motion vector of a group of pixels
US8102915B2 (en) Motion vector fields refinement to track small fast moving objects
JP2007501561A (ja) ブロックアーティファクトの検出
JP2006215655A (ja) 動きベクトル検出方法、動きベクトル検出装置、動きベクトル検出プログラム及びプログラム記録媒体
US20060158513A1 (en) Recognizing film and video occurring in parallel in television fields
JP4225503B2 (ja) 動画像のカット点検出装置
JPH10224741A (ja) 動画像のカット点検出方法
Lavigne et al. Automatic Video Zooming for Sport Team Video Broadcasting on Smart Phones.
JP4662169B2 (ja) プログラム、検出方法、及び検出装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070209

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20091110

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20100408