JP2013539255A - 映像の代表画像の決定 - Google Patents

映像の代表画像の決定 Download PDF

Info

Publication number
JP2013539255A
JP2013539255A JP2013521264A JP2013521264A JP2013539255A JP 2013539255 A JP2013539255 A JP 2013539255A JP 2013521264 A JP2013521264 A JP 2013521264A JP 2013521264 A JP2013521264 A JP 2013521264A JP 2013539255 A JP2013539255 A JP 2013539255A
Authority
JP
Japan
Prior art keywords
image
shot
video
representative image
images
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2013521264A
Other languages
English (en)
Other versions
JP5746765B2 (ja
Inventor
アンドレ ペテルス,マルク
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Koninklijke Philips NV
Original Assignee
Koninklijke Philips NV
Koninklijke Philips Electronics NV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Koninklijke Philips NV, Koninklijke Philips Electronics NV filed Critical Koninklijke Philips NV
Publication of JP2013539255A publication Critical patent/JP2013539255A/ja
Application granted granted Critical
Publication of JP5746765B2 publication Critical patent/JP5746765B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/74Browsing; Visualisation therefor
    • G06F16/743Browsing; Visualisation therefor a collection of video files or sequences
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • G11B27/19Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier
    • G11B27/28Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/40Scenes; Scene-specific elements in video content

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Human Computer Interaction (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Image Analysis (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Studio Devices (AREA)
  • Television Signal Processing For Recording (AREA)

Abstract

ビデオは少なくとも1つのショットSHを含み、ショットは特定の位置から見たシーンを表す画像の系列である。ショットを通して一様に分散される選択された画像の連続的な系列を取得するように、画像はショットから選択される。予め定義された類似性のテストに適合する選択された画像の少なくとも1つの連続的なサブ系列SB1,SB2及びSB3が識別される。予め定義された類似性のテストに適合する選択された画像の最長の連続的なサブ系列SB2と時間的に一致するショットの連続する部分SPから画像が選択される。選択された画像は、ショットの代表画像を構成する。

Description

本発明は、ある映像における少なくとも1つのショットの代表画像を決定する方法に関する。本方法は、例えば映画、ブロードキャストビデオ記録、又はパーソナルビデオ記録のような比較的大型のビデオエンティティで特定の映像部分を発見することにおいてユーザを支援するために使用される。
本発明の他の態様は、映像をブラウジングする方法、映像の集合において映像をサーチする方法、ビデオプロセッサ、記録媒体及びコンピュータプログラムに関する。
ある映像の代表的な画像を決定することは、様々な目的に役立つ。例えば代表画像は、関心のある特定部分を発見するように、ある映像をブラウジングすることにおいてユーザを支援する。例えば関心のある部分は、特定のイベントに関し、この特定のイベントは、ユーザが家族又は友人に見せるのを望むイベントである。別の例として、関心のある部分は、ユーザが映像を視聴することから中断されたポイントに対応する。映像のそれぞれの部分の概観は、それぞれの部分のそれぞれの代表的な画像を含む。係る視覚に基づく概観は、一般に、関心のある特定部分をユーザが便利に発見するのを可能にする。代表的な画像は、映像の集合において特定の映像を発見することにおいてユーザを支援する。ある映像の代表画像を決定する様々な技術が提案されている。これらの技術のなかには、代表画像を構成する比較的な多くのアクションを含む場面から画像を選択する。
Image Processing(ICIP’98)の国際会議,Volume1,1998,pp.866の会報で公表されたZhuang Y等による“Adaptive Key Fame Extraction Using Unsupervised Clustering”と題された文献は、教師なしクラスタリング(unsupervised clustering)に基づくキーフレームの抽出のアルゴリズムを記載している。Nを整数として、N個のフレームを含むビデオショットは、ショット境界検出アルゴリズムから得られる。ビデオショットのN個のフレームは、Mを整数としてM個のクラスタに分類される。それぞれのクラスタは、新たな画像がクラスタに加わるときに計算し直される必要がある重心を有する。考慮中のフレームについて、類似性の速度は、そのフレームとそれぞれのクラスタの重心との間で計算される。新たなクラスタは、そのフレームについてこの用に計算された全ての類似性の速度がある閾値を下回る場合に、考慮中のフレームについて作成される。さもなければ、考慮中のフレームは、既に存在するクラスタ、類似性の速度が最も高い値を有するクラスタに割り当てられる。閾値のパラメータが高くなると、取得されることとなるクラスタの数Mが多くなる。ひとたびクラスタが形成されると、クラスタの平均サイズである、N/Mよりも大きいサイズを有するそれぞれのクラスタから、キーフレームが抽出される。あるクラスタのキーフレームは、クラスタの重心に最も近いフレームである。
比較的高速及び効果的なやり方で映像の代表画像を決定するのを可能にするソリューションが必要とされている。
本発明の態様によれば、映像における少なくとも1つのショットの代表画像を決定する方法が提供され、あるショットは、特定の位置から見たあるシーンを表す画像の連続的な系列である。本方法は、あるショットを通して一様に分散される連続的な選択された画像の系列を得るように、前記ショットから画像が選択されるショットサンプリングステップ、予め定義された類似性のテストに適合する選択された画像の少なくとも1つの連続的なサブ系列が識別される、安定なショット部分の識別ステップ、予め定義された類似性のテストに適合する最長の連続する選択された画像のサブ系列と時間的に一致するショットの連続的な部分から画像が選択される、代表画像の指定ステップ。
これに応じて、画像のコンテンツの観点で比較的安定であるショットの最長の連続する部分が代表画像を与える。代表画像は、従って比較的長い視聴時間を有するコンテンツの一部から効果的に取得される。結果として、ユーザが代表画像をショットと関連付けする比較的高い可能性が存在する。さらには、代表画像は、代表画像が取得されるショットの一部の安定さのため、比較的良好な品質となる。
本発明の別の利点は、以下の態様に関する。本発明に係る代表画像の決定は、比較的少ない画像の比較で達成される。例えば、その画像をもう1つの画像のみと比較することで、考慮中の画像の類似性のテストが実行される。これは、上述された文献で記載されるアルゴリズムとは対照的であり、上記文献のアルゴリズムは、それぞれのクラスタについて画像の比較及び更にはクラスタの重心の計算し直しを必要とする。画像の比較は、一般に計算が集中し、従って比較的遅い。従って、本発明は、そのようにすることに係わる画像の比較の低減された数のおかげで、代表画像が比較的高速に決定されるのを可能にする。
本発明の実現は、個別のパラグラフで記載される、以下の更なる特徴の1以上を有効にも含む。これらの更なる特徴は、比較的高速及び効果的なやり方で、ある映像の代表画像を決定することにそれぞれ寄与する。
安定なショット部分の識別ステップでは、以下の一連のステップがそれぞれの選択された画像について有利にも実行される。選択された画像の少なくとも1つの画像の特性(image property)が、選択された画像の差の測度を決定するように、予め定義されたスキームに従って別の選択された画像の特性と比較される差の測度を決定するステップ。選択された画像が、選択された画像の差の測度がある閾値を下回るか否かに依存して、類似度のテストに適合する連続する選択された画像のサブ系列に属するか、属さないとして分類される差の測度を評価するステップ。
予め定義されたスキームは、選択された画像が直接に隣接する選択された画像と比較されることを定義する。
予め定義されたスキームは、直前に先行する選択された画像が類似性のテストに適合する連続する選択された画像のサブ系列に属する場合に、選択された画像はこの連続する選択された画像のサブ系列を開始する選択された画像と比較されることを定義する。係るスキームは、画像のコンテンツが連続するサブ系列を通して緩やかにではあるが、確実に変化する意味で、連続するサブ系列における画像のコンテンツの緩やかな「ドリフト」を回避するのを可能にする。係る緩やかなドリフトは、予め定義されたスキームが、選択された画像が直接に隣接している選択された画像のみと比較されることを提供するときに生じる場合がある。
差の測度を決定するステップにおいて、それぞれの画像の特性の差は、差のメトリックに有利にも結合され、差のメトリックは、差の測度を構成し、それぞれの画像の特性の差は、選択された画像のそれぞれの画像の特性を、少なくとも1つの他の選択された画像の特性と比較することで得られる。
ショットサンプリングステップでは、1つの画像は、Nを1よりも大きい整数として、それぞれ一連のN個の連続する画像のうちから選択される。この更なる特徴をもつ実現において、あるショットの全ての画像が選択されるものよりも計算上の労力が少ない。実際に、Nはサブサンプリングファクタを表す。Nが大きくなると、計算上の労力が少なくなる。しかし、Nが大きくなると、あるショットにおける最長の安定な部分が識別される精度が低くなる。これら2つの態様間の適切なトレードオフを発見することができる。
代表画像を指定するステップでは、代表画像について長さの指示が有利にも提供され、長さの指示は、代表画像が選択されるショットの連続する部分によりカバーされる時間間隔を表す。
本方法は、あるショットが、そのショットと比較したときに、ショットの類似性のテストに適合する少なくとも1つの他のショットに関連されるショットの関連付けステップ。ショットの代表画像の長さの指示が、ショットに関連されているそれぞれの他のショットのそえぞれの代表画像のそれぞれの長さの指示を加えることでアップグレードされる長さの指示をアップグレードするステップ。これらの更なる特性は、ある映像で2以上の代替の一連の類似のショットが生じるときに、代表画像を決定するために使用される。例えば、ビデオ部分が、2人の人物A,Bの間の会話を表す場合があり、それによって、誰が話しているかに依存して、人物Aのショットと人物Bのショットが交互に生じる。実際に、ビデオ部分は、人物Aの単一ショットと人物Bの単一ショットとを含むことが考慮され、人物Aの単一ショットと人物Bの単一ショットは、数回にわたり交換される。
本発明の別の態様によれば、ある映像をブラウジングする方法は、映像に含まれるそれぞれのショットについて決定されているそれぞれの代表画像、及びそれぞれの代表画像のそれぞれの長さの指示を利用する。本方法は、映像におけるそれぞれのセクションが定義され、それにより後続のステップが映像におけるそれぞれのセクションについて実行されるセクションを定義するステップ。あるセクションにおけるそれぞれのショットのそれぞれの代表画像のそれぞれの長さの指示が比較され、それによりそのセクションの代表画像を構成するように、最長の長さの指示を有する代表画像が選択される代表画像を選択するステップ。
本方法は、映像におけるそれぞれのセクションのそれぞれの代表画像を含むナビゲーションスクリーンが生成され、それによりそれぞれの代表画像がそれぞれのセクションに関連するそれぞれの選択可能な領域に含まれるナビゲーションイネーブルステップを有利にも含む。
本発明の更に別の態様によれば、ある映像の代表画像を決定する方法は、映像に含まれるそれぞれのショットについて決定されたそれぞれの代表画像と、それぞれの代表画像のそれぞれの長さの指示とを利用する。本方法は、それぞれの代表画像のそれぞれの長さの指示が比較され、それにより映像の代表画像を構成するように最長の長さの指示を有する代表画像が選択される代表画像の選択ステップ。
本発明の更に別の態様によれば、映像の集合においてある映像をサーチする方法は、その集合におけるそれぞれの映像について選択されているそれぞれの代表画像を利用する。サーチ基準に適合するその集合におけるそれぞれの映像が識別されるサーチステップ。サーチ基準に適合するそれぞれの映像のうち、それぞれの代表画像が画像の類似性のテストに適合するそれぞれの映像が識別されるサーチ結果の処理ステップ。画像の類似性のテストに適合するそれぞれの代表画像が単一のサーチ結果アイテムとして一緒に示される。
添付図面を参照して、詳細な説明は、更なる特性と同様に先に概説された本発明を例示するものである。
ある映像に含まれるそれぞれショットのそれぞれの代表画像を決定可能アビデオプロセッサを例示する機能ブロック図である。 ビデオプロセッサが実行する様々な動作を例示する概念図である。 ビデオプロセッサの一部を形成する、安定なショット部分を識別するモジュールを例示する機能ダイアグラムである。 安定なショット部分を識別するモジュールが実行する様々な動作を例示する概念図である。 ビデオプロセッサが生成した結果を使用する、ビデオブラウザを例示する機能ダイアグラムである。 代表画像を選択するモジュールが実行する様々な動作を例示する概念図である。 それぞれのセクションのそれぞれの代表画像を含むナビゲーションスクリーンを例示する概念図である。 代表画像を選択するモジュールが生成した結果を使用する、ビデオサーチエンジンを例示する機能ダイアグラムである。
図1は、ビデオプロセッサVPRを機能的に例示する。ビデオプロセッサVPRは、様々な機能モジュールである、ショットの検出モジュールSHD、ショットサンプリングモジュールSHS、安定なショット部分を識別するモジュールSPI、及び代表画像を指定するモジュールRIDを含む。ビデオプロセッサVPRは、データストレージアレンジメントDSAに結合されており、DSAでは、映像VDが少なくとも部分的且つ一時的に記憶される。映像処理の結果は、図1に例示されるように、映像VDと関連してデータストレージアレンジメントDSAに記憶される。ビデオプロセッサVPRは、例えばビデオサーバ、パーソナルマルチメディア装置又はパーソナル通信装置の一部を形成する場合がある。
上述された機能モジュールは、例えば命令実行装置にロードされている命令のセットによりそれぞれ実現される場合がある。係るソフトウェアに基づく実現では、命令のセットは、以下に記載される関与する機能モジュールが実行する動作を定義する。この点で、図1は、本方法を少なくとも部分的に表していると考えられ、それによりある機能モジュール、又は機能モジュールの組み合わせは本方法のあるステップを表していると考えることができる。例えば、ショットサンプリングモジュールSHSは、ショットサンプリングステップを表していると考えられ、安定なショット部分を識別するモジュールSPIは、安定な部分を識別するステップを表していると考えることができる。同じことが他の機能モジュールにも当てはまり、他の図を参照して以下に記載される。
ビデオプロセッサVPRは、以下のように基本的に動作する。ショット検出モジュールSHDは、映像VDに含まれる様々なショットSHを検出する。あるショットは、特定の位置から見たシーンを表す画像の連続する系列である。ショット検出モジュールSHDは、従来のやり方で動作する。例えば、ショット検出モジュールSHDは、映像VDにおけるショットカットを検出する。比較的短い一連の連続する画像における比較的重要な変化は、ショットカットを特徴付けする。ショットカットは、例えばフェージングのような特定の効果を含む。適切なアルゴリズムを適用し、適切なショットカット検出アルゴリズムを適用することで、十分に信頼することができるやり方でショットカットを検出することができる。このテーマに関する十分な文献が存在する。あるショットは、2つの連続するショットカットの間に典型的に含まれ、第一のショットカットは、ショットの開始をマークし、第二のショットカットは、ショットの終了をマークする。ショット検出モジュールSHDは、ショットカットマーカSCを提供し、ショットカットマーカSCは、映像VDをそれぞれのショットSHに効果的に分割する。ショットカットマーカSCは、映像VDに関連して記憶される。
ショットカットマーカSHSは、代表画像が決定される必要があるショットを選択する。次いで、ショットサンプリングモジュールSHSは、ショットを通して一様に分散される選択されたSIの連続的な系列を取得するように、そのショットから画像を選択する。例えば、ショットサンプリングモジュールSHSは、Nを1よりも大きい整数として、ショットにおけるそれぞれ一連のN個の連続する画像のうちから1つの画像を選択する。これは、サンプリングレートをNに等しいとして、ビデオサブサンプリングプロセスである。選択された画像SIの連続的な系列は、ビデオVDの画像レートよりもN倍低い画像レートを有する。選択された画像SIの連続的な系列は、例えばデータストレージアレンジメントDSAに一時的に記憶される。
安定なショット部分を識別するモジュールは、予め定義された類似性のテストに適合する選択された画像の1以上の連続的なサブ系列SBを識別する。この類似性のテストは、ショットカット検出について典型的に使用されるテストよりも典型的に厳しい。さもなければ、安定なショット部分を識別するモジュールSPIは、予め定義された類似性のテストに適合する1つの連続的なサブ系列に属するとして、ショットの全ての選択された画像をシステマティックに識別する。予め定義された類似性のテストは、例えば輝度、色度、テクスチャ、エッジのような画像の特性に基づいている。これは、以下に更に詳細に説明される。
安定なショット部分を識別するモジュールSPIは、サブ系列マーカSMの形式で出力を提供する。サブ系列マーカSMは、予め定義された類似性のテストに適合するとして識別された選択された画像の1以上の連続的なサブ系列SBを示す。例えば、サブ系列マーカは、サブ系列の開始をマークするか又はサブ系列の終了をマークする選択された画像のシリアルナンバーを示す。最低のシリアルナンバーを有するサブ系列マーカは、第一のサブ系列の開始を典型的に示す。1を有するが、最低のシリアルナンバーを有するサブ系列マーカは、第一のサブ系列の終了を典型的に示す、等である。これは単なる例である。シリアルナンバーの代わりに時間の指示を使用することができる。どんな場合でも、サブ系列マーカSMは、識別された選択された画像の連続的なサブ系列SBに関する位置情報及び長さ情報を提供する。
代表画像を指定するモジュールRIDは、予め定義された類似性のテストに適合する選択された画像の最長の連続的なサブ系列を決定する。選択された画像の最長の連続的なサブ系列は、サブ系列マーカSMに基づいて決定され、サブ系列マーカは、安定なショット部分の識別モジュールSPIが提供する。例えば、代表画像の指定モジュールRIDは、予め定義された類似性のテストに適合する選択された画像SIのそれぞれのサブ系列の範囲を定めるサブ系列マーカSMのそれぞれのペア間のそれぞれの距離を比較することで、最長の連続的なサブ系列を決定する。最長の距離は、最長の連続的なサブ系列を示す。
代表画像を指定するモジュールRIDは、選択された画像の上述された最長の連続的なサブ系列と時間的に一致するショットの連続的な部分から画像を選択する。このように選択された画像は、ショットの代表画像RIを構成する。代表画像を指定するモジュールRIDは、代表画像の識別子IRの形式で出力を提供する。代表画像の識別子IRは、代表画像RIが属するショットと同様に、映像VDにおける代表画像RIを固有に指定する。
代表画像を指定するモジュールRIDは、代表画像RIの長さの指示LIを更に提供する。長さの指示LIは、代表画像RIが選択されるショットの連続的な部分によりカバーされる時間間隔を表す。長さの指示LIは、代表画像の識別子IRに含まれる。
代表画像を指定するモジュールRIDは、予め定義された類似性のテストに適合する選択された画像の最長のサブ系列を示すサブ系列マーカSMに基づいて、長さの指示LIを決定する。例えば、サブ系列マーカSMが、識別されたサブ系列の範囲を定める選択されたフレームのシリアルナンバーの形式であると仮定する。その場合、最長のサブ系列を示すサブ系列マーカSM間の差は、最長のサブ系列に含まれる選択されたフレームの数に対応する。ショットサンプリングモジュールSHSが一定のサンプリングレートを適用する場合、この選択されたフレームの数は、長さの指示LIを構成する。選択されたフレームの数は、選択されたフレームの系列のフレームレートで除算される。従って、最長のサブ系列の期間が得られ、長さの指示LIを構成する。
図1に例示されるビデオプロセッサVPRは、上述されたやり方で映像VDに含まれるそれぞれのショットSHのそれぞれの代表画像RIを決定する。これを受けて、ショットサンプリングモジュールSHSは、映像VDにおけるそれぞれのショットSHを連続的に選択する。次いで、ショットサンプリングモジュールSHS、安定なショット部分を識別するモジュールSPI、及び代表画像を指定するモジュールRIDは、現在選択されたショットについて上述された動作を実行する。従って、ビデオプロセッサVPRは、それぞれの代表画像RIを効果的に示す、それぞれのショットSHについてそれぞれの代表画像の識別子IRを提供する。ビデオプロセッサVPRは、それぞれの代表画像RIについてそれぞれの長さの指示LIを更に提供する。それぞれの代表画像の識別子IRは、それぞれの長さの指示LIと同様に、映像VDと、映像VDにおけるそれぞれのショットSHを識別するそれぞれのショットカットマーカSCとに関連して記憶される。全てのこのデータは、図1に例示されるデータストレージアレンジメントDSAに一緒に記憶される。代替的に、データは、映像VDに関連するデータの異なるタイプ間のリンクの幾つかの形式が存在するという条件で、異なるストレージアレンジメントに記憶される場合がある。
図2は、ショットサンプリングモジュールSHS、安定なショット部分を識別するモジュールSPI、及びそれぞれの画像を指定するモジュールRIDが実行する様々な動作を概念的に例示する。図2は、2つの連続するショットカットマーカSCi,SCi+1間に含まれるショットSHを表す上側水平セクションを含む。比較的小さい垂直ラインは、ショットSH内の画像を表す。画像は、時間Tを表す水平軸に一様に配置される。図2は、ショットからの選択された画像SIが比較的小さい垂直ラインにより表される類似の水平軸を有する下側の水平セクションを含む。図2に例示されるように、ショットにおけるそれぞれ一連の4つの連続する画像のうちから1つの画像が選択される。図2の下側の水平セクションで表される選択された画像SIは、1から12までで番号付けされる。
選択された画像2及び3は、類似性のテストに適合する第一の連続的な選択された画像のサブ系列SB1を構成する。第一の連続するサブ系列SB1は、2つの選択された画像の長さL1を有する。選択された画像5,6,7及び8は、類似性のテストに適合する第二の連続的な選択された画像のサブ系列SB2を構成する。第二の連続的なサブ系列SB2は、4つの選択された画像の長さL2を有する。選択された画像9,10及び11は、類似性のテストに適合する第三の連続的な選択された画像のサブ系列SB3を構成する。第三の連続的なサブ系列は、3つの選択された画像の長さL3を有する。
図2の上側水平セクションでは、ショットSHの連続した安定な部分SPは示される。この連続した安定した部分SPは、予め定義された類似性のテストに適合する選択された画像の最長の連続的なサブ系列である、選択された画像の第二の連続的なサブ系列SB2と時間的に一致する。従って、連続した安定な部分SPは、ショットSHの最長の安定な部分を構成する。この文脈において、用語「安定」とは、画像のコンテンツの安定度を示し、連続した安定な部分SPは、比較的長い期間について比較的スタティックである。
ショットの最長の安定した部分である、図2に示されるショットの連続した安定な部分SPから画像が選択される。ショットの連続した安定な部分SPから選択された画像は、関連しているショットの代表画像RIを構成する。原理上、選択された画像は、ショットの連続した安定な部分SPにおける画像である。これは、ショットの連続した安定な部分SPは比較的スタティックであるためであり、この連続した安定な部分に含まれる画像は互いに比較的類似していることを意味する。さもなければ、第二のサブ系列SB2を構成する選択された画像5,6,7及び8は、類似性のテストに適合しない。図2において、代表画像RIであるように選択された画像は、連続する安定な部分SPの中心にある。これは単なる例である。第一の画像又は最後の画像のような連続した安定した部分SPの他の画像が、代表画像RIを構成するように選択される場合もある。代表画像RIは、ランダムに選択される。
代表画像RIは、比較的良好な品質からなる。これは、画像のコンテンツの観点で比較的安定であるショットの一部から代表画像RIが選択されるからである。例えば、画像は符号化されている場合、符号化の損失は、図2に示されたショットの連続した安定した部分SPにおいて比較的適度である。これは、その部分における画像が比較的類似しているからである。例えば、動き予測及び量子化を含めて、MPEG規格に従って画像が符号化されていると仮定する。その場合、図2に示される連続した安定した部分SPにおける画像の動き予測は、比較的正確である。比較的小さい残差が存在する。さらに、連続した安定な部分SPにおける画像は、適度な程度の量子化を典型的に受ける。
図3は、安定なショット部分を識別するモジュールSPIの実現を機能的に例示する。この実現は、簡単さのため、安定なショット部分を識別するモジュールSPIと呼ばれる。安定なショット部分を識別するモジュールSPIは、様々な機能モジュールである、画像の特性を決定するモジュールIPD、画像の特性を比較するモジュールIPC、閾値と比較するモジュールTHC、及びサブ系列を識別するモジュールSBIを含む。ソフトウェアに基づいた実現について、図3は、少なくとも部分的に本方法を表すものとして考えることができ、それにより機能モジュール、又は機能モジュールのセットが本方法のステップとして考えられる。
図3に例示される安定なショット部分を識別するモジュールSPIは、基本的に以下のように動作する。画像の特性を決定するモジュールIPDは、選択された画像の少なくとも1つの画像の特性を決定する。画像の特性を決定するモジュールIPDは、それぞれ選択された画像SIについて、画像の特性のそれぞれのセットIPを提供する。ある画像の特性のセットIPは、例えば輝度ヒストグラム、色度ヒストグラム、テクスチャ情報及びエッジ情報を含む。画像の特性は、MPEG7として知られる規格で定義された情報の形式をとる場合がある。
画像の特性を比較するモジュールIPCは、予め定義されたスキームSCHに従って、考慮中の選択された画像の特性のセットIPを、別の選択された画像の画像の特性のセットと比較する。例えば予め定義されたスキームSCHは、考慮中の選択された画像が、考慮中の選択された画像に直前で先行する選択された画像と画像の特性の観点で比較されることを提供する。別の例として、予め定義されたスキームSCHは、考慮中の画像に直前で先行する選択された画像が類似性のテストに適合する連続的な選択された画像のサブ系列に属すること、といったケースに当てはまるか否かをはじめに検証する。考慮中の画像は、先に定義されたケースが当てはまる場合、この連続的な選択された画像のサブ系列を開始する選択された画像と画像の特性IPの観点で比較される。
予め定義されたスキームSCHについて、画像の特性を比較するモジュールIPCは、考慮中の選択された画像について画像の特性の差のセットを決定する。画像の特性の差のセットは、予め定義されたスキームSCHに従って行われた画像の特性の比較から得られる。画像の特性を比較するモジュールIPCは、考慮中の選択された画像の画像の特性の差を差のメトリックDMに結合し、差のメトリックは、1次元の差の測度を構成する。画像の特性を比較するモジュールIPCは、それぞれ選択された画像SIについてそれぞれの差のメトリックDMを提供する。選択された画像の差のメトリックDMは、選択された画像が、予め定義されたスキームSCHに従って選択された画像が比較される1以上の他の選択された画像に比較的類似している場合に、比較的低い値を有する。逆に、差のメトリックDMは、予め定義されたスキームSCHに従って比較された画像が比較的異なる場合に、比較的高い値を有する。
閾値を比較するモジュールTHCは、画像の特性を比較するモジュールIPCが提供するそれぞれの差のメトリックDMを、ある閾値THと比較する。この比較は、それぞれ選択された画像SIについてそれぞれ類似性の判定SDを提供する。選択された画像の類似性の判定SDは、選択された画像の差のメトリックDMが閾値TH以下である場合に正である。さもなければ、類似性の判定SDは負である。実際に、類似性の判定SDは、画像の特性の観点で選択された画像が比較された1以上の他の選択された画像に関して、考慮される選択された画像が十分に類似しているか否かを示す。別の言い方をすれば、類似性の判定SDは、比較された選択された画像が予め定義された類似性のテストに適合するか否かを示す。
サブ系列を識別するモジュールSBIは、閾値と比較するモジュールTHCが提供した、それぞれの類似性の判定SDに基づいて、予め定義された類似性のテストに適合する選択された画像の1以上のサブ系列SBを識別する。正の類似性の判定が負の類似性の判定に従うものと仮定する。その場合、正の類似性の判定は、類似性のテストに適合する選択された画像のサブ系列の開始をマークする。サブ系列は、正の類似性の判定が基づく選択された画像を少なくとも含む。さらに、更なる正の類似性の判定が上述された正の類似性の判定に従うと仮定する。その場合、サブ系列は、いわば長期に及び、この更なる正の類似性の判定が基づいている選択された画像を更に含む。サブ系列は、負の類似性の判定が生じるまで、長期に及び続ける。次いで、負の類似性の判定は、選択された画像のサブ系列の終了をマークする。新たな正の類似性の判定は、選択された画像の新たなサブ系列の開始をマークする。
閾値THは、いわば差のメトリクスDMを類似性の判定SDに変換するために使用されるものであり、重要なパラメータである。閾値THは、予め定義された類似性のテストの重大度を表す。閾値THが余りに高い場合、選択された画像のサブ系列SBが滅多に識別されないか、全く識別されない。逆に、閾値THが余りに低い場合、全ての選択されたショットの画像は、ショット全体をカバーする単一のサブ系列に属しているとして識別される。閾値THの適切なレベルは、例えば経験に基づくやり方で決定される場合がある。
サブ系列を識別するモジュールSBIは、図1に例示される安定なショット部分を識別するモジュールSPIの出力に対応する出力を提供する。すなわち、サブ系列を識別するモジュールSBIは、予め定義された類似性のテストに適合するとして識別された、1以上の連続的な選択された画像のサブ系列SBを示すサブ系列マーカSMを提供する。サブ系列マーカSMは、識別された連続的な選択された画像のサブ系列SBに関する位置情報及び長さ情報を提供する。
図4は、安定なショット部分を識別するモジュールSPIが実行する様々な動作を概念的に例示する。図4は、図2にも例示される、ショットの選択された画像SIを表す上側の水平セクションを含む。すなわち、図4の上側の水平セクションは、図2の下側の水平セクションと対応する。選択された画像SIは、1から12までで番号付けされており、時間Tを表す水平方向の軸に一様に配置される。図4は、それぞれのメトリクスDMが示される中央の水平セクションを含む。図4は、それぞれの類似性の判定SDが示される下側の水平方向セクションを更に有する。
図4は、予め定義されたスキームSCHが、考慮中の選択された画像が直前に先行する選択された画像と比較されることを与える例を示す。図4では、僅かに湾曲された矢印は、これらの画像の比較を例示する。選択された画像2が考慮中であると仮定する。その場合、選択された画像2は、画像の特性の観点で、選択された画像2と比較される。この比較により、差のメトリックDM2が得られる。差のメトリックDM2は、いわば負の類似性の判定(−)に変換する。これは、差のメトリックDM2が上述された閾値THを超えるためである。選択された画像3が考慮中であると仮定する。その場合、選択された画像3は、画像の特性の観点で、選択された画像2と比較される。この比較により差のメトリックDM3が得られ、差のメトリックDM3は、正の類似性の判定(+)に変換する。これは、差のメトリックDM3が閾値TH以下であるためである。
図4は、類似性の判定における負から正への遷移が予め定義された類似性の基準に適合する選択された画像のサブ系列SBの開始をマークすることを例示する。類似性の判定における正から負の遷移は、サブ系列SBの終了をマークする。サブ系列は、1以上の連続するの正の類似性の判定が基づいた選択された画像を含む。例えば、差のメトリックDM3は、正の類似性の判定(+)に変換するものであり、差のメトリックDM2により先行され、差のメトリック2は、負の類似性の判定(−)に変換する。これは、選択された画像の第一のサブ系列SB1の開始をマークする。差のメトリックDM3は、差のメトリックDM4により後続され、差のメトリックは、負の類似性の判定(−)に変換する。これは、第一のサブ系列SB1の終了をマークする。差のメトリックDM3は、選択された画像2及び3に基づいており、第一のサブ系列SB1を形成する。
別の例として、差のメトリックDM6は、負の類似性の判定(+)に変換するものであり、差のメトリックDM5により先行され、差のメトリックDM5は、負の類似性の判定(−)に変換する。これは、選択された画像の第二のサブ系列SB2の開始をマークする。差のメトリックDM6は、差のメトリックDM7及びDM8により後続され、これらはそれぞれ、正の類似性の判定(+)に同様に変換する。第二のサブ系列SB2は、そのまま継続する。差のメトリックDM9は、負の類似性の判定(−)に変換する。これは、第二のサブ系列SB2の終了をマークする。3つの連続した差のメトリックDM6,DM7及びDM8が存在し、これら3つの差のメトリックは、連続した正の類似性の判定(+)に変換する。これら3つの差のメトリックDM6,DM7及びDM8は、選択された画像5,6,7及び8に基づいており、これらは連続して生じており、従って第二のサブ系列SB2を形成する。
図5は、ビデオブラウザVBRを例示する。ビデオブラウザVBRは、セクション定義モジュールSDF、代表画像の選択モジュールRIS及びナビゲーションイネーブルモジュールNAVを含む。これら更なる機能モジュールは、例えば図1に例示されるビデオプロセッサVPRに含まれる。代替的に、図5に例示される機能モジュールは、別のビデオプロセッサに含まれる。何れの場合においても、ソフトウェアに基づく実現について、図3は、少なくとも部分的に本方法を表現するとして考えることができ、それにより機能モジュール又は機能モジュールの組み合わせは、本方法のステップとして考えられる。
図5に例示されるビデオブラウザVBRは、図1に例示されたビデオプロセッサVPRが提供した結果を使用する。これらの結果は、ビデオVDにおけるそれぞれのショットSHについて決定されたそれぞれの代表画像RIを含む。結果は、それぞれの代表画像のそれぞれの長さの指示LIを更に含む。上述されたように、これらの結果は、それぞれの代表画像を効果的に示す、それぞれのショットSHのぞれぞれの代表画像の識別子IRの形式である。それぞれの長さの指示LIは、それぞれの代表画像の識別子IRに含むことができる。全てのこのデータは、図1に例示されるアレンジメントに対応するデータストレージアレンジメントDSAに記憶されるか、又はデータが転送される別のデータストレージアレンジメントに記憶される。
ビデオブラウザVBRは、基本的に以下のように動作する。セクションを定義するモジュールSDFは、映像VDにおいてそれぞれのセクションSEを定義するのを可能にする。例えば、映像VDは、所与の長さのそれぞれ連続する時間間隔をカバーするそれぞれのセクションSEに効果的に分割される。更なる例として、映像VDは、それぞれ10分の時間間隔に分割することができる。係る分割は、例えば映像VDが映画又はブロードキャスト記録である場合に適切である。セクションを定義するモジュールSDFは、特定のセクションを様々なサブセクションに小分割する。例えば、特定の10分の時間間隔は、それぞれ1分の時間間隔に小分割される。
映像VDが個人の記録を含む場合、それぞれのセクションSEは、記録の日時に基づいて定義される。例えば、互いの後に手短かに行われた記録は、間違いなく相関し、従ってあるセクションにグループ分けされる。同じ日に行われた記録もあるセクションにグループ分けすることができる。これらの記録は、例えば誕生日、結婚、又は特定の目的地を訪れる日帰り旅行のような特定のイベントに関する。連続する日で行われた記録もあるセクションにグループ分けすることができる。例えば記録は、旅行に関する場合がある。これらの例は、セクションが記録の日時に基づいて異なる階層レベルで定義されることを示す。
代表画像を選択するモジュールRISは、あるセクションSEにおけるそれぞれのショットSHのそれぞれの代表画像の長さの指示LIを取得する。代表画像を選択するモジュールRISは、最長の長さの指示LIk=MAXを決定するように、これらそれぞれの長さの指示を比較する。代表画像を選択するモジュールRISは、この最長の長さの指示LIを有する代表画像RIkを選択する。この選択された代表画像RIkは、セクションの代表画像RISEを構成する。代表画像を選択するモジュールRISは、定義された映像VDのそれぞれのセクションについてそれぞれの代表画像を定義する。
図6は、代表画像を選択するモジュールが実行する動作を例示する。図6は、映像VDにおける特定のセクションSEを表す上側の水平セクションを有する。この特定のセクションSEは、異なる長さの4つのそれぞれのショットSH1〜SH4を含む。これら4つのそれぞれのショットSH1〜SH4は、4つのそれぞれの代表画像RI1〜RI4を有する。4つのそれぞれの代表画像RI1〜RI4は、4つのそれぞれの長さの指示LI1〜LI4を有する。これは、図6の下側の水平セクションで示される。ショットSH3はセクションSEにおける4つのそれぞれのショットSH1〜SH4のなかで最長ではないが、ショットSH3の代表画像RI3は、最長の長さの指示LI3=5を有する。しかし、ショットSH3は、予め定義された類似性のテストに適合する選択された画像の連続的なサブ系列を有しており、この連続的なサブ系列は、他の3つのショットSH1,SH2及びSH4の何れかにおける任意の他の連続的なサブ系列よりも長い。別の言い方をすれば、ショットSH3は、4つのそれぞれのショットSH1〜SH4において識別された安定なビデオ部分のうちで最長の安定なビデオ部分を含む。結果的に、ショットSH3の代表画像RI3は、最長の長さの指示LI3=5であり、従ってセクションSEの代表画像RISEを構成するように選択される。
代表画像を選択するモジュールRISは、ショットを関連付けするモジュールSAM及び長さの指示をアップグレードするモジュールLIUを任意に含む。これらのモジュールは、2以上の交互する一連の類似のショットをもつ、あるビデオセクションにおいて代表画像を選択するために使用される。あるビデオセクションは、2人の人物A及びB間の会話を表し、それにより人物Aのショット及び人物Bのショットは、誰が話しているかに依存して交互に生じる。実際に、ビデオセクションは、人物Aの単一のショット及び人物Bの単一のショットを含み、これらのショットは、数回にわたり入れ替えられる。
ショットを関連付けするモジュールSAMは、あるショットを別のショットと比較して、あるショットと他のショットが予め定義されたショットの類似性のテストに適合するか否かを検証する。ショットの類似性のテストは、画像の類似性のテストが基づいている画像の特性と同じ画像の特性に基づいており、この画像の特性は、図1〜4を参照して上述されたように、選択された画像の連続的なサブ系列を識別するために使用される。図3を参照して、画像の特性を決定するモジュールIPDは、決定された画像の特性IPのそれぞれのセットを記憶する。次いで、ショットを関連付けするモジュールSAMは、これらの結果を使用して、2つのショットが予め定義されたショットの類似性のテストに適合しているか否かを判定する。2つのショットが予め定義された類似性のテストに適合している場合、ショットを関連付けするモジュールSAMは、2つのショットを互いに関連付けする。同様にやり方で、ショットを関連付けするモジュールSAMは、なお更なるショットを互いに関連する2つのショットと関連付けする。
長さの指示をアップグレードするモジュールLIUは、少なくとも1つの他のショットと関連付けされたショットの代表画像RIの長さの指示LIをアップグレードする。すなわち、長さの指示LIは、この指示LIに、ショットに関連するそれぞれの他のショットのそれぞれの代表画像のそれぞれの長さの指示を加えることでアップグレードされる。更には、単一の代表画像は、互いに関連されるそれぞれのショットについて保持される。この単一の代表画像は、上述されたようにアップグレードされた長さの指示を有する。長さの指示がアップグレードされた場合、代表画像を選択するモジュールRISは、このアップグレードされた長さの指示を考慮してセクションの代表画像RISEを決定する。
ナビゲーションイネーブルモジュールNAVは、映像VDにおけるそれぞれのセクションについて選択されたそれぞれの代表画像RIを含むナビゲーションスクリーンNVSを生成する。ナビゲーションスクリーンNVSでは、それぞれの代表画像RIは、映像VDにおけるそれぞれのセクションと関連されるそれぞれの領域に含まれる。それぞれの領域は、代表画像に加えて、テクスチャ情報を更に含む場合がある。テクスチャ情報は、例えば特定の時間間隔、又は記録の日時、或いはこれらの両者を示す。何れの場合であっても、特定のセクションは、特定のセクションと関連される領域であって、その代表画像を含む領域を選択することで選択可能である。この選択は、例えばナビゲーションスクリーン上のポインタ及びコンピュータマウスにより達成される。セクションを定義するモジュールSDFは、この選択されたセクションを、代表画像を選択するモジュールRISが上述されたやり方で代表画像を決定するそれぞれのサブセクションに分割する。
図7は、ナビゲーションスクリーンNVSを例示する。この例では、ナビゲーションスクリーンは、映像VDにおける5つのそれぞれのセクションSE1〜SE5を表す。5つのそれぞれのセクションSE1〜SE5は、上述されたように選択された5つの代表画像RISE1〜RISE5により表される。5つの代表画像RISE1〜RISE5は、5つのそれぞれのセクションSE1〜SE5に関連する5つのそれぞれの領域AE1〜AE2に含まれる。例では、セクションSE3が選択され、これによりこのセクションに関連する領域AE3がハイライト表示される。
図6に例示される代表画像を選択するモジュールRISは、映像VD全体について代表画像RIを選択する役割を果たす。そのようにするため、代表画像を選択するモジュールRISは、上述された動作に類似の動作を実行する。すなわち、代表画像を選択するモジュールRISは、映像VD全体におけるそれぞれのショットSHのそれぞれの代表画像RIについてそれぞれの長さの指示LIを取得する。代表画像を選択するモジュールRISは、これらのそれぞれの長さの指示LIを比較して、最長の長さの指示を決定する。次いで、代表画像を選択するモジュールRISは、この最長の長さの指示を有する代表画像を選択する。この選択された代表画像は、映像全体について代表画像を構成する。
図8は、ビデオサーチエンジンVSEを例示する。ビデオサーチエンジンVSEは、サーチモジュールSRCH、サーチ結果を処理するモジュールSRP、及びサーチ結果を指示するモジュールSRIを含む。ビデオサーチエンジンVSEは、映像の集合VDCに通信可能に結合される。それぞれの代表画像RIVD_1〜RIVD_Nは、先のパラグラフで記載されたように、集合におけるそれぞれの映像VD_1〜VD_Nについて選択される。
ビデオサーチエンジンVSEは、基本的に以下のように動作する。サーチモジュールSRCHは、サーチ基準CTを受信し、これに応じて、サーチ基準CTに適合する集合におけるそれぞれの映像を識別する。サーチ結果を処理するモジュールSRPは、サーチ基準CTに適合するそれぞれの映像のうち、画像の類似性のテストにそれぞれの代表画像が適合するそれぞれの映像を識別する。この画像の類似性のテストは、1以上の画像の特性に基づいており、その場合、図3で例示された画像の特性を比較するモジュールIPCに関して、上述された動作を含む。画像の類似性のテストは、比較的厳密である。少なくとも部分的に同じであるそれぞれの映像が識別された場合、これらそれぞれの映像の代表画像は、比較的類似しているか、更には同じである。これは、上述されたように、十分に類似していることが分かっている画像の最長のサブ系列から代表画像が選択されているためである。
サーチ結果を指示するモジュールSRIは、単一のサーチ結果のアイテムとして一緒に、画像の類似性のテストにそれぞれの代表画像が適合するそれぞれの映像を指示する。単一のサーチ結果アイテムとして指示されたそれぞれの映像は、典型的に少なくとも部分的に、同一である。単一のサーチ結果のアイテムとして少なくとも部分的に同一であるそれぞれの映像を指示することは、サーチ結果を理解及び評価することにおいてユーザを支援する。
添付図面を参照して上述された詳細な説明は、特許請求の範囲で定義された、本発明及び更なる特徴の例示である。本発明は様々な異なるやり方で実現することができる。これを例示するため、多くの代替が簡単に示される。
本発明は、ビデオコンテンツの代表画像の指示に関連する様々なタイプの製品又は方法におうて利用するために適用される。例えば、本発明は、ホームシネマ装置のようなビデオコンテンツを処理可能な何れかのタイプの家電装置において利用するために使用される。また、本発明は、何れかのタイプの装置における汎用プロセッサにより実行可能なソフトウェアプログラムの形式である。
例えば図1に例示されるビデオプロセッサVPRは、ビデオをダウンロードすることができるビデオサーバに一部を形成する。次いで、クライアント端末は、ビデオサーバからビデオを、ビデオサーバが生成したショットカットマーカ及び代表画像識別子と共にダウンロードする。図3で例示されるビデオブラウザVBRは、代表画像の識別子、特にこれらの識別子に含まれる長さの指示に基づいて便利なブラウジングを可能にするように、クライアント端末の一部を形成する。
ショットを通して一様に分散された選択された画像の連続的なサブ系列を取得するように、あるショットから画像を選択する様々な方法が存在する。サブサンプリングは、有利ではあるが必須ではない。原理的に、あるショットの全ての画像が選択される。サブサンプリングが選択された場合、選択された画像は、正確に等間隔で配置される必要はない。例えば、選択された画像は、僅かな不規則さを示す時間グリッド上に配置される場合がある。
予め定義された類似性のテストに適合する連続的な選択された画像のサブ系列を識別する様々なやり方が存在する。例えば、第一のフェーズにおいて全ての画像を分析し、第二のフェーズにおいて、予め定義された類似性のテストを受けることができる画像分析の結果を取得することも可能である。更には、選択された画像を互いに比較する様々な異なるスキームが存在する。例えば、選択された画像は、予め定義された類似性のテストに適合することが分かっている更に先行する選択された画像と同様に、直前に先行する選択された画像と比較される。しかし、係るアプローチは、先に記載されたアプローチよりも計算が集中する。さらに、予め定義された類似性のテストはそれぞれの画像の特性についてそれぞれの差のメトリクスを決定することを含む。その場合、それぞれの閾値は、それぞれ部分的な類似性の判定を行うため、それぞれの差のメトリクスについて定義される。それぞれの部分的な類似性の判定は、例えばAND関数により全体の類似性の判定に効果的にグループ分けされる。
予め定義された類似性のテストに適合する選択された画像の最長の連続的なサブ系列と時間的に一致するショットの連続する安定な部分のうち、そのショットの代表画像を選択する様々なやり方が存在する。代表画像は、最長の連続するサブ系列における選択された画像のうちの1つである。また、代表画像は、2つの係る選択された画像間で一時的に配置される画像である場合がある。何れかの特定の選択スキームが使用される場合がある。これは、予め定義された類似性のテストに適合する選択された画像の最長の連続的なサブ系列と時間的に一致するショットの連続した安定な部分において、画像は比較的類似しているためである。原理的に、最長の連続的なサブ系列と時間的に一致するショットの連続的な安定な部分からランダムに選択される場合もある。
用語「画像」は、広義の意味で理解されるべきである。この用語は、視覚的な情報を表す任意のデータのタイプを包含する。例えば、この用語は、例えばピクチャ、フレーム及びフィールドのような他の用語と交換可能である。
一般に、本発明を実現する様々なやり方が存在し、それにより異なる実現は異なるトポロジーを有する場合がある。所与のトポロジーにおいて、単一のモジュールは、幾つかの機能を実行するか、幾つかのモジュールは、単一の機能を一緒に実行する。この観点で、図面は非常に図式的である。例えば、図3を参照して、画像の特性を決定するモジュールIPD及び画像の特性を比較するモジュールIPCは、単一のソフトウェアモジュールの一部を形成する。
ハードウェア、ソフトウェア又はこれらの両者により実現される様々な機能が存在する。ソフトウェアに基づく実現の記載は、ハードウェアに基づく実現を排除するものではなく、逆に、ハードウェアに基づく実現の記載は、ソフトウェアに基づく実現の記載を排除するものではない。1以上の専用回路と同様に1以上の適切にプログラムされたプロセッサを有するハイブリッドの実現も可能である。例えば、図面を参照して上述された様々な機能は、1以上の専用回路により実現され、それにより特定の回路トポロジーは、特定の機能を定義する。
命令のセット、すなわちソフトウェアを記憶及び配信する様々なやり方が存在し、このソフトウェアは、本発明に従って代表画像を識別するのを可能にする。例えば、ソフトウェアは、例えば磁気ディスク、光ディスク又はメモリ回路のような適切な媒体で記憶される。ソフトウェアが記憶される媒体は、個別の製品として又はソフトウェアを実行する別の製品と共に供給される。係る媒体は、ソフトウェアが実行されるのを可能にする製品の一部である場合がある。また、ソフトウェアは、有線、無線、又はハイブリッドである、通信ネットワークを介して配信される場合もある。例えばソフトウェアは、インターネットを介して配信される場合がある。ソフトウェアは、サーバによりダウンロードされるために利用可能にされる。ダウンロードは、支払いを受ける場合がある。
上述された記載は、添付図面を参照した詳細な説明は、本発明の限定ではなく例示であることを示している。特許請求の範囲に含まれる様々な代替が存在する。請求項における参照符号は、請求項を限定するものとして解釈されるべきではない。単語「備える“comprising”」は、請求項で列挙されたエレメント又はステップ以外のエレメント又はステップの存在を排除するものではない。エレメント又はステップに先行する単語“a”又は“an”は、複数の係るエレメント又はステップの存在を排除するものではない。それぞれの従属の請求項がそれぞれの更なる特徴を定義する事実は、請求項で反映された特徴以外の更なる特徴の組み合わせを排除するものではない。
本発明の態様によれば、映像における少なくとも1つのショットの代表画像を決定する方法が提供され、あるショットは、特定の位置から見たあるシーンを表す画像の連続的な系列である。本方法は、あるショットを通して一様に分散される連続的な選択された画像の系列を得るように、前記ショットから画像が選択されるショットサンプリングステップ、予め定義された類似性のテストに適合する選択された画像の少なくとも1つの連続的なサブ系列識別する安定なショット部分の識別ステップ、予め定義された類似性のテストに適合する最長の連続する選択された画像のサブ系列と時間的に一致するショットの連続的な部分から画像が選択される、代表画像の指定ステップ。
安定なショット部分の識別ステップでは、以下の一連のステップがそれぞれの選択された画像について有利にも実行される。選択された画像の少なくとも1つの画像の特性(image property)が、選択された画像の差の測度を決定するように別の選択された画像の特性と比較される差の測度を決定するステップ。選択された画像が、選択された画像の差の測度がある閾値を下回るか否かに依存して、類似度のテストに適合する連続する選択された画像のサブ系列に属するか、属さないとして分類される差の測度を評価するステップ。
択された画像直接に隣接する選択された画像と比較される場合がある
前に先行する選択された画像が類似性のテストに適合する連続する選択された画像のサブ系列に属する場合に、選択された画像はこの連続する選択された画像のサブ系列を開始する選択された画像と比較される場合がある。係るスキームは、画像のコンテンツが連続するサブ系列を通して緩やかにではあるが、確実に変化する意味で、連続するサブ系列における画像のコンテンツの緩やかな「ドリフト」を回避するのを可能にする。係る緩やかなドリフトは選択された画像が直接に隣接している選択された画像のみと比較されるときに生じる場合がある。

Claims (15)

  1. ある映像における少なくとも1つのショットの代表画像を決定する方法であって、
    前記ショットは、特定の位置から見たあるシーンを表す連続的な画像の系列であり、
    当該方法は、
    前記ショットを通して一様に分散された連続的な選択された画像の系列を取得するために画像が選択される、ショットサンプリングステップと、
    予め定義された類似性のテストに適合する少なくとも1つの連続的な選択された画像のサブ系列が識別される、安定なショット部分の識別ステップと、
    選択された画像が前記ショットの代表画像を構成するように、前記予め定義された類似性のテストに適合する最長の連続的な選択された画像のサブ系列と時間的に一致するショットの連続する部分から画像が選択される、代表画像の指定ステップと、
    を含む方法。
  2. 前記安定なショット部分の識別ステップにおいて、それぞれの選択された画像について、以下の一連のステップである、
    選択された画像の差の測度を決定するように、前記選択された画像の少なくとも1つの画像の特性が予め定義されたシーンに従って別の選択された画像の特性と比較される、差の測度の決定ステップと、
    前記選択された画像の差の測度がある閾値を下回るか否かに依存して、前記選択された画像が、前記類似性のテストに適合する連続的な選択された画像のサブ系列に属するとして分類される、差の測度の評価ステップと、
    を実行する、請求項1記載の方法。
  3. 前記予め定義されたスキームは、前記選択された画像が直接隣接している選択された画像と比較されることを定義する、
    請求項2記載の方法。
  4. 前記予め定義されたスキームは、直前に先行する選択された画像が前記類似性のテストに適合する連続的な選択された画像のサブ系列に属する場合に、前記選択された画像は、この連続的な選択された画像のサブ系列を開始する選択された画像と比較される、
    請求項2記載の方法。
  5. 前記差の測度の決定ステップにおいて、それぞれの画像の特性の差は差のメトリックに結合され、前記差のメトリックは、差の測度を構成し、前記それぞれの画像の特性の差は、前記選択された画像のそれぞれの画像の特性を少なくとも1つの他の選択された画像の特性と比較することで得られる、
    請求項2記載の方法。
  6. 前記ショットサンプリングステップでは、Nを1よりも大きい整数として、それぞれの一連のN個の連続した画像のうちから1つの画像が選択される、
    請求項1記載の方法。
  7. 前記代表画像の決定ステップでは、前記代表画像について長さの指示が提供され、前記長さの指示は、前記代表画像が選択された前記ショットの連続した部分によりカバーされる時間間隔を表す、
    請求項1記載の方法。
  8. あるショットが、少なくとも1つのショットと比較されたときに、ショットの類似性のテストに適合する前記少なくとも1つの他のショットと関連付けされる、ショットの関連付けステップと、
    前記ショットの前記代表画像の前記長さの指示が、前記ショットに関連付けされたそれぞれの他のショットのそれぞれの代表画像のそれぞれの長さの指示と加算されることでアップグレードされる、長さの指示のアップグレードステップと、
    を含む請求項7記載の方法。
  9. 映像をブラウジングする方法であって、
    当該方法は、請求項記載の方法を実行することで得られた結果を使用し、前記結果は、前記映像に含まれるそれぞれのショットについて決定されるそれぞれの代表画像、及び前記それぞれの代表画像についてのそれぞれの長さの指示を含み、
    当該方法は、
    前記映像におけるそれぞれのセクションが定義される、セクションの定義ステップと、
    前記映像におけるそれぞれのセクションについて、
    セクションにおけるそれぞれのショットのそれぞれの代表画像についてそれぞれの長さの指示が比較され、前記セクションの代表画像を構成するために最長の長さの指示を有する代表画像が選択される、代表画像の選択ステップ、
    が実行される、方法。
  10. 前記ビデオにおけるそれぞれのセクションについてそれぞれの代表画像が選択され、
    当該方法は、
    前記ビデオにおけるそれぞれのセクションについて前記それぞれの代表画像を含むナビゲーションスクリーンが生成される、ナビジェーションイネーブルステップと、前記それぞれの代表画像は、前記それぞれのセクションと関連されるそれぞれの選択可能な領域に含まれる、
    請求項9記載のビデオをブラウジングする方法。
  11. 請求項7記載の方法を実行することで得られた結果を使用する、ビデオの代表画像を決定する方法であって、
    前記結果は、前記映像に含まれるそれぞれのショットについて決定されるそれぞれの代表画像、及び前記それぞれの代表画像についてのそれぞれの長さの指示を含み、
    前記それぞれの代表画像のそれぞれの長さの指示が比較され、前記映像の代表画像を構成するように、最長の長さの指示を有する代表画像が選択される、代表画像の選択ステップを含む、ビデオの代表画像を決定する方法。
  12. 映像の集合において映像をサーチする方法であって、
    当該方法は、請求項11記載の方法を実行することで得られる結果を使用し、
    前記結果は、前記集合におけるそれぞれの映像のそれぞれの代表画像を含み、
    当該方法は、
    サーチ基準に適合する前記集合におけるそれぞれの映像が識別される、サーチステップと、
    前記サーチ基準に適合する前記それぞれの映像のうち、前記それぞれの代表画像が画像の類似性のテストに適合するそれぞれの映像が識別される、サーチ結果の処理ステップと、
    前記それぞれの代表画像が前記画像の類似性のテストに適合するそれぞれの映像が、単一のサーチ結果のアイテムとして一緒に指示される、サーチ表示ステップと、
    を含む映像の集合において映像をサーチする方法。
  13. 映像における少なくとも1つのショットの代表画像を決定するビデオプロセッサであって、
    前記ショットは、特定の位置から見たあるシーンを表す連続的な画像の系列であり、
    あるショットを通して一様に分散される連続的な選択された画像の系列を取得するように、前記ショットから画像を選択するショットサンプリングモジュールと、
    予め定義された類似性のテストに適合する選択された画像の少なくとも1つの連続的なサブ系列を識別する安定なショット部分の識別モジュールと、
    前記予め定義された類似性のテストに適合する選択された画像の最長の連続的なサブ系列と時間的に一致する前記ショットの連続する部分から画像を選択する、代表画像の指示モジュールとを備え、選択された画像は、前記ショットの代表画像を構成する、
    ビデオプロセッサ。
  14. 請求項7記載の方法を実行することで得られた結果が記憶される記憶媒体であって、
    前記結果は、前記映像に含まれるそれぞれのショットについて決定されたそれぞれの代表画像、及び前記それぞれの代表画像についてのそれぞれの長さの指示を含む、
    記憶媒体。
  15. 命令のセットを実行可能なプロセッサに、請求項1記載の方法を実行させる命令のセットを含むコンピュータプログラム。
JP2013521264A 2010-07-26 2011-07-21 映像の代表画像の決定 Expired - Fee Related JP5746765B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP10170773 2010-07-26
EP10170773.5 2010-07-26
PCT/IB2011/053252 WO2012014129A2 (en) 2010-07-26 2011-07-21 Determining representative images for a video

Publications (2)

Publication Number Publication Date
JP2013539255A true JP2013539255A (ja) 2013-10-17
JP5746765B2 JP5746765B2 (ja) 2015-07-08

Family

ID=44674830

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013521264A Expired - Fee Related JP5746765B2 (ja) 2010-07-26 2011-07-21 映像の代表画像の決定

Country Status (7)

Country Link
US (1) US9135509B2 (ja)
EP (1) EP2599083B1 (ja)
JP (1) JP5746765B2 (ja)
KR (1) KR20130036765A (ja)
CN (1) CN103003880B (ja)
RU (1) RU2591656C2 (ja)
WO (1) WO2012014129A2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109816650B (zh) * 2019-01-24 2022-11-25 强联智创(北京)科技有限公司 一种基于二维dsa图像的目标区域识别方法及其系统
CN111918130A (zh) * 2020-08-11 2020-11-10 北京达佳互联信息技术有限公司 视频封面确定方法、装置、电子设备及存储介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07288840A (ja) * 1994-04-18 1995-10-31 Matsushita Electric Ind Co Ltd 映像変化点検出方法
WO2007114241A1 (ja) * 2006-03-29 2007-10-11 Pioneer Corporation 映像処理装置

Family Cites Families (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5635982A (en) 1994-06-27 1997-06-03 Zhang; Hong J. System for automatic video segmentation and key frame extraction for video sequences having both sharp and gradual transitions
US5805733A (en) * 1994-12-12 1998-09-08 Apple Computer, Inc. Method and system for detecting scenes and summarizing video sequences
JPH08202849A (ja) 1995-01-25 1996-08-09 Murata Mfg Co Ltd 静止・移動物体の検出処理装置
US6098082A (en) * 1996-07-15 2000-08-01 At&T Corp Method for automatically providing a compressed rendition of a video program in a format suitable for electronic searching and retrieval
FR2756399B1 (fr) * 1996-11-28 1999-06-25 Thomson Multimedia Sa Procede et dispositif de compression video pour images de synthese
US6496228B1 (en) * 1997-06-02 2002-12-17 Koninklijke Philips Electronics N.V. Significant scene detection and frame filtering for a visual indexing system using dynamic thresholds
US6119123A (en) 1997-12-02 2000-09-12 U.S. Philips Corporation Apparatus and method for optimizing keyframe and blob retrieval and storage
US6782049B1 (en) 1999-01-29 2004-08-24 Hewlett-Packard Development Company, L.P. System for selecting a keyframe to represent a video
US6549643B1 (en) 1999-11-30 2003-04-15 Siemens Corporate Research, Inc. System and method for selecting key-frames of video data
AUPQ558000A0 (en) * 2000-02-11 2000-03-09 Lynch Management Group Pty Ltd Cd smart card
US20030219232A1 (en) * 2001-10-01 2003-11-27 Shu Lin System and method for identifying data on a storage medium
US7212666B2 (en) * 2003-04-01 2007-05-01 Microsoft Corporation Generating visually representative video thumbnails
JP4166707B2 (ja) 2004-01-20 2008-10-15 パイオニア株式会社 映像内容認識装置、録画装置、映像内容認識方法、録画方法、映像内容認識プログラム、および録画プログラム
BRPI0513242A (pt) * 2004-07-13 2008-04-29 Koninkl Philips Electronics Nv métodos de compressão de imagem escalonável espacial e snr e de decodificar dados de imagem codificados escalonáveis espaciais e snr, uso de dados de imagem codificados, dispositivos de compressão e de descompressão de imagem escalonável espacial e snr, receptor de dados de imagem, dispositivo de exibição de imagem, e, produto de programa de computação
WO2008092131A2 (en) * 2007-01-25 2008-07-31 Skyfire Labs, Inc. Mobile device user interface for remote interaction
US8077930B2 (en) * 2007-04-13 2011-12-13 Atg Advanced Swiss Technology Group Ag Method for recognizing content in an image sequence
EP2048871B1 (en) * 2007-10-09 2011-08-31 Tektronix International Sales GmbH Image evaluation
EP2114079B2 (en) * 2008-05-02 2018-01-24 Psytechnics Ltd Method and apparatus for aligning signals
US8868569B2 (en) * 2010-02-24 2014-10-21 Yahoo! Inc. Methods for detecting and removing duplicates in video search results

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07288840A (ja) * 1994-04-18 1995-10-31 Matsushita Electric Ind Co Ltd 映像変化点検出方法
WO2007114241A1 (ja) * 2006-03-29 2007-10-11 Pioneer Corporation 映像処理装置

Also Published As

Publication number Publication date
WO2012014129A3 (en) 2012-05-18
EP2599083B1 (en) 2016-01-27
EP2599083A2 (en) 2013-06-05
US9135509B2 (en) 2015-09-15
CN103003880B (zh) 2016-10-19
RU2591656C2 (ru) 2016-07-20
WO2012014129A2 (en) 2012-02-02
RU2013108227A (ru) 2014-09-10
JP5746765B2 (ja) 2015-07-08
KR20130036765A (ko) 2013-04-12
CN103003880A (zh) 2013-03-27
US20130121586A1 (en) 2013-05-16

Similar Documents

Publication Publication Date Title
JP4201454B2 (ja) 動画要約生成方法及び動画要約生成装置
CN106557545B (zh) 视频检索方法和装置
US20130336590A1 (en) Method and apparatus for generating a visual story board in real time
JP5711387B2 (ja) 映像を比較する方法および装置
JP5878238B2 (ja) 映像を比較するための方法および装置
JP5097280B2 (ja) 画像及び画像群を表現、比較及び検索する方法及び装置、プログラム、コンピュータ読み取り可能な記憶媒体
US8068678B2 (en) Electronic apparatus and image processing method
WO2007129246A1 (en) Method of updating a video summary by user relevance feedback
JP6557592B2 (ja) 映像シーン分割装置及び映像シーン分割プログラム
JP5685324B2 (ja) 映像を比較する方法および装置
JP2006092559A (ja) 少なくとも1つの画像及び画像群を表現する方法、画像又は画像群の表現、画像及び/又は画像群を比較する方法、画像又は画像群を符号化する方法、画像又は画像シーケンスを復号する方法、符号化されたデータの使用、画像又は画像群を表現する装置、画像及び/又は画像群を比較する装置、コンピュータプログラム、システム、及びコンピュータ読み取り可能な記憶媒体
EP2620882A2 (en) Multimedia data recording method and apparatus for automatically generating/updating metadata
CN110505513A (zh) 一种视频截图方法、装置、电子设备及存储介质
KR100896336B1 (ko) 영상 정보 기반의 동영상 연관 검색 시스템 및 방법
US20210158071A1 (en) Match determination device, match determination method, storage medium
JP2010505176A (ja) サマリ生成方法
JP2009087113A (ja) 情報処理装置および方法、プログラム、並びに記録媒体
JP2006217046A (ja) 映像インデックス画像生成装置及び映像のインデックス画像を生成するプログラム
JP5746765B2 (ja) 映像の代表画像の決定
Wang et al. Real-time summarization of user-generated videos based on semantic recognition
JP2010186307A (ja) 動画コンテンツ識別装置および動画コンテンツ識別方法
JP2014139733A (ja) 情報処理装置および方法、並びにプログラム
KR100930529B1 (ko) 비디오 식별을 통한 유해 동영상 검열 시스템 및 방법
KR101138873B1 (ko) 인물 db 등록사진 수 축소 방법 및 장치
KR101929546B1 (ko) 영상 품질 기반 중복 파일 관리 시스템 및 방법

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20140718

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20150210

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20150217

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20150318

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20150414

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20150508

R150 Certificate of patent or registration of utility model

Ref document number: 5746765

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees