JP5334771B2 - 広告クリップをビデオ系列に挿入する方法、及び対応する装置 - Google Patents

広告クリップをビデオ系列に挿入する方法、及び対応する装置 Download PDF

Info

Publication number
JP5334771B2
JP5334771B2 JP2009213544A JP2009213544A JP5334771B2 JP 5334771 B2 JP5334771 B2 JP 5334771B2 JP 2009213544 A JP2009213544 A JP 2009213544A JP 2009213544 A JP2009213544 A JP 2009213544A JP 5334771 B2 JP5334771 B2 JP 5334771B2
Authority
JP
Japan
Prior art keywords
clip
saliency
advertisement
saliency map
points
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2009213544A
Other languages
English (en)
Other versions
JP2010093798A (ja
Inventor
ル ムール オリヴィエ
ニナッシ アレクサンドル
アルバン ファブリチェ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Thomson Licensing SAS
Original Assignee
Thomson Licensing SAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Thomson Licensing SAS filed Critical Thomson Licensing SAS
Publication of JP2010093798A publication Critical patent/JP2010093798A/ja
Application granted granted Critical
Publication of JP5334771B2 publication Critical patent/JP5334771B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/02Editing, e.g. varying the order of information signals recorded on, or reproduced from, record carriers
    • G11B27/031Electronic editing of digitised analogue information signals, e.g. audio or video signals
    • G11B27/036Insert-editing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/234Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs
    • H04N21/23418Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving operations for analysing video streams, e.g. detecting features or characteristics
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/234Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs
    • H04N21/23424Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving splicing one content stream with another content stream, e.g. for inserting or substituting an advertisement
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/44Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs
    • H04N21/44016Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving splicing one content stream with another content stream, e.g. for substituting a video clip
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/81Monomedia components thereof
    • H04N21/812Monomedia components thereof involving advertisement data
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/83Generation or processing of protective or descriptive data associated with content; Content structuring
    • H04N21/845Structuring of content, e.g. decomposing content into time segments
    • H04N21/8455Structuring of content, e.g. decomposing content into time segments involving pointers to the content, e.g. pointers to the I-frames of the video stream

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Television Signal Processing For Recording (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Description

本発明は、クリップ又は広告シーケンスの、ビデオ・ピクチャ系列への挿入に関する。
インターネットを介したビデオ・コンテンツ配信の出現により、広告は、ヤフー(商標)、グーグル(商標)やマイクロソフト(商標)などの当該分野の当事者によって、成長の主要要因として考えられている。種々のツールがこの目的で、観客に不便をかけることを避けながらビデオにおける挿入広告の視覚的な影響を増加させるために開発されている。
特に、マイクロソフト(商標)は、「VideoSense: a contextual video advertising system, Proceedings of the 15th international conference on Multimedia, pp 463−464,2007」と題する文書に記載されたVideoSenseと呼ばれるツールを開発している。 このツールは、広告クリップをビデオ系列に挿入するために作成されており、その目的は、ビデオ系列に適切なクリップを選択し、ビデオ系列の最初及び最後のみならず、ビデオ中の主たる時点にこれを挿入することである。挿入する対象のクリップを選択するために、色、動き、又は音のリズムのタイプの低位パラメータがクリップ及び系列から抽出され、次いで、互いに比較され、その場合に選択されるクリップは、ビデオ系列のものに最も近い低位パラメータを有するものである。クリップ又は系列に関連付けされ、クリップ又は系列に含まれるテキスト情報又はビデオ・コンテンツの放送業者又は広告主によって供給されるタイトルなどの更なる情報も、系列に挿入する対象のクリップを選択するために使用される。選択されると、クリップは、系列の特定の点において挿入され、特に、非連続性が高く、魅力度が低い、系列の点(例えば、動きを全く含まないシーン又はショットの最後)において挿入される。
選択されたクリップはしたがって、一般にショットの切り換え後に配置される。選択されたクリップのビデオ・コンテンツは、挿入される系列のコンテンツに関係するが、観客によるクリップの認識に対する前述のショット切り換えの影響は無視される。実際に、ショット切り換え後の凝視ゾーンの時間的延長に関する、いくつかの研究により、(特に、O. Le Meur、P. Le Callet及びD. Barbaによる「Predicting visual fixations on video based on low−level visual features Vision Research, Vol. 47/19 pp 2483−2498, Sept. 2007」と題する文書において)みられる現象は考慮に入れられない。前述の研究の結果は、観客が、ショット切り換え前に凝視していた領域を、ショット切り換え後の約200ms乃至300msの時間、凝視し続けるというものである。よって、観客が見る領域は、現時点において表示されているピクチャでなく、先行して表示されたピクチャに依存する。この現象は図1に示す。ビデオ・系列によって表す図の上部分におけるピクチャの行は、時間間隔100msだけ、互いに離間した7個のピクチャを有する。ショット切り換えが、系列の第3のピクチャと第4のピクチャとの間で生じている。図の下部分におけるピクチャの行は、観客が凝視するピクチャ領域を白のドットで示す。観客は、6番目のピクチャの終わりに(すなわち、ショット切り換えの2ピクチャ後に)自分の凝視を移動させているに過ぎない。この時間的延長は、種々の要因(特に、知覚の動作を再初期化するために生体的に必要な時間、驚きの効果、時間マスキング)に起因する。50Hzのビデオの場合、この時間的延長は、ショット切り換え後の約15ピクチャの間、持続する。
広告の関心領域が、ショット切り換え前のビデオ系列のものと同じ時点で配置されていない場合、広告のコンテンツはしたがって、観客によって直ちに認識されるものでなく、よって、観客に対する顧客の視覚的な影響は削減される。広告が含むメッセージは、直接的に認識されるものでない。
本発明の一目的は、ビデオ系列に挿入される広告クリップの視覚的な影響を最適化することである。
この目的で、挿入する対象の広告クリップの選択プロセスにおいて、ビデオ系列のピクチャの関心領域と広告クリップの関心領域との間に連続性が存在しているようにビデオ系列の関心領域及び広告クリップの関心領域を挿入することができるようにすることが提案されている。クリップのコンテンツは観客によって、よりすばやく認識される。
したがって、本発明は、ビデオ系列と呼ばれるビデオ・ピクチャ系列の2つのピクチャ間で、挿入点と呼ばれる点において広告クリップを挿入することが意図されたピクチャを処理する方法であって、
挿入点前の、ビデオ系列の顕著性を表す顕著性マップを生成する工程と、
顕著性マップを、広告クリップの組の広告クリップ毎に生成する工程と、
ビデオ系列の顕著性マップと広告クリップの顕著性マップとの間の類似度の度合いを広告クリップの組の広告クリップ毎に求める工程であって、上記類似度の度合いは、両方のマップ上の顕著性ゾーンの位置間の比較を表す工程と、
広告クリップの組のうちで、最高の類似度の度合いを有する広告クリップを選択する工程と、
選択された広告クリップを挿入点においてビデオ系列に挿入する工程とを含む方法に関する。
よって、挿入された広告クリップは、ビデオ系列と広告クリップとの間の顕著性における最善の連続性を挿入点のレベルで供給するものである。
特定の実施例によれば、挿入点は、ビデオ系列におけるショット切り換えに対応する、ビデオ系列の点である。
特定の実施例によれば、挿入点前のビデオ系列の顕著性を表す顕著性マップは、挿入点に先行する、ビデオ系列の最後のn個のピクチャの顕著性マップから生成され、nは1以上50以下である。例えば、50Hzビデオの場合、挿入点前のビデオ系列の最後の15個のピクチャの顕著性マップの平均をとる。
一実施例によれば、広告クリップの顕著性マップは、広告クリップの最初のp個のピクチャの顕著性マップから生成され、pは1以上50以下である。例えば、50Hzのビデオの場合、クリップの最初の15の顕著性マップの平均がとられる。
したがって、広告クリップの最初及び挿入点前のビデオ系列の最後のピクチャ間の顕著性の点で連続性をもたらすクリップが選択される。
特定の実施例によれば、広告クリップの類似度の度合いは、ビデオ系列の顕著性マップと広告クリップの顕著性マップとの間の相関係数を算出することによって求められ、類似度の度合いはよって、算出された相関係数に比例する。
本発明の方法の別の特定の実施例によれば、広告クリップの類似度の度合いは、ビデオ系列の顕著性マップと広告クリップの顕著性マップとの間のクルバック・ライブラー・ダイバージェンスを算出することによって求められ、類似度の度合いはよって、算出されるダイバージェンスに反比例する。
別の特定の実施例によれば、広告クリップの類似度の度合いを求めるために、
最大顕著点と呼ばれる、マップのN個の最も顕著な点を、広告クリップの顕著性マップ及びビデオ・ピクチャの顕著性マップから選択する工程であって、上記点は、少なくともm個の点だけ、互いに離間し、最も顕著なものから最も顕著でないものに配列され、Nは1以上である工程と、
ピクチャの顕著性マップのN個の最大顕著点毎に、広告クリップの顕著性マップの同じ順序の最大顕著点と、上記点との間のユークリッド距離を求める工程と、
求められたN個のユークリッド距離の平均を算出する工程であって、類似度の度合いが、算出された平均に反比例する工程とを含む工程が行われる。
この実施例では、ユ―クリッド距離は、同じ順序の最大顕著点間で求められ、上記点の顕著性値は、類似度の度合いを求めるうえである程度、考慮に入れられる。
変形の実施例によれば、N個の最大の顕著点は、配列されない。この実施例では、広告クリップの類似度の度合いを求める方法は、
最大顕著点と呼ばれる、マップのN個の最も顕著な点を、広告クリップの顕著性マップ及びビデオ・ピクチャの顕著性マップから選択する工程であって、上記点は、少なくともm個の点だけ、互いに離間し、Nは1以上である工程と、
ビデオ・ピクチャの顕著性マップのN個の最大顕著点毎に、広告クリップの顕著性マップの最も近い最大顕著点と、上記点との間のユークリッド距離を求める工程と、
求められたN個のユークリッド距離の平均を算出する工程であって、類似度の度合いが、よって、算出された平均と反比例する工程とを含む。
前述の最後の2つの実施例では、顕著性マップにおいて少なくともm個の点だけ、離間しているN個の最大顕著点の選択は以下のように行われる。
a)最大顕著性を有する点が顕著性マップから選択される。
b)検出点を中心とした半径Rのゾーンに属する点は全て、抑制され、Rはm個の点に等しい。
c)工程a)及びb)は、N個の最大顕著点が得られるまで、顕著性マップの抑制されていない点について繰り返される。
本発明は、ビデオ系列と呼ばれるビデオ・ピクチャ系列の、挿入点と呼ばれる点において広告クリップを挿入することが意図されたピクチャを処理する装置であって、
挿入点前のビデオ系列の顕著性を表す顕著性マップ、及び広告クリップの組の広告クリップ毎の顕著性マップを生成する手段と、
ビデオ系列の顕著性マップと広告クリップの顕著性マップとの間の類似度の度合いを広告クリップの組の広告クリップ毎に求める手段と
広告クリップの組のうちで、最高の類似度の度合いを有する広告クリップを選択する手段と、
選択された広告クリップを挿入点においてビデオ系列に挿入する手段とを備える装置にも関する。
特定の実施例によれば、装置は更に、ビデオ系列におけるショット切り換えを検出する手段を更に備え、選択された広告クリップはよって、このショット切り換えに対応するビデオ系列の点において挿入される。
ビデオ系列におけるショット切り換え後の時間的延長という現象を示す前述の図である。 本発明の方法を示す機能図である。 本発明の方法の工程を示すフローチャートである。 第1の実施例による、広告クリップの顕著性マップとビデオ系列の顕著性マップとの類似度の度合いを求める方法を示す図である。 別の実施例による、広告クリップの顕著性マップとビデオ系列の顕著性マップとの類似度の度合いを求める方法を示す図である。 本発明の方法を実現することができる装置を示す概略図である。
添付図面を参照すれば、本発明の現在の好ましい特定のいくつかの実施例の以下の詳細な説明的な記載において、本発明がより理解され、他の目的、詳細、特徴及び利点がより明らかになるであろう。
以下明細書では、広告クリップは、広告又はロゴを表示する一連の静止画又は動画を表すものとし、挿入点は、広告クリップが挿入される、ビデオ系列の2つのピクチャ間の点を表すものとする。
本発明によれば、所定の広告クリップの組のうちの広告クリップの関心領域、及び挿入点前のビデオ系列の最後のピクチャの関心領域が求められ、挿入点前のビデオ系列の最後のピクチャのものに空間的に最も近い関心領域を有する広告クリップが選択される。この挿入点は、予め決定されるか、オペレータにより、方法の最初に手作業で規定されるか、方法の最初において同時に規定され得る。
挿入点は、効果的には、ビデオ系列における広告クリップの急な出現によって観客が不便になるか、又は動揺しないようにショット切り換えに対応するビデオ系列の点である。
図2は、挿入点(広告クリップが挿入されるビデオ系列の点)がショット切り換えに対応する本発明の方法の機能図である。本発明によれば、広告クリップの所定の組の広告クリップの関心領域、及び挿入点前のビデオ系列の最後のピクチャの関心領域が求められ、ショット切り換え前のビデオ系列の最後のピクチャのものに空間的に最も近い関心領域を有する広告クリップが選択される。このショット切り換えの場所は、ビデオ系列に関連付けられたメタデータに含まれるか、又は方法の最初において規定され得る。上記ショット切り換えは、例えば、Z. Cernekova、 I. Pitas及びC. Nikouによる「Information Theory−Based Shot Cut/Fade Detection and Video Summarization, IEEE transactions on circuits and systems for video technology, Vol. 16, no. 1, January 2006」と題する文書に開示されたものなどのアルゴリズムによって自動的に検出されるか、又はオペレータにより、手作業で選択され得る。
図3は、特に、本発明の方法の工程を示す。第1の工程E1によれば、挿入点前のビデオ系列の顕著性を表す顕著性マップが生成される。この顕著性マップは例えば、挿入点前の系列の最後のピクチャの顕著性マップであるか、又は、挿入点前の系列の最後のn個のピクチャの顕著性マップの平均である。顕著性マップを生成する方法は当業者が完全に分かっている。前述の方法は例えば、欧州特許出願第1 544 792号明細書に記載されている。前述のマップは、特定の顕著性値を有する点とビデオ・ピクチャの各画素を関連付ける。点の顕著性値が高いほど、関連付けられた画素の関心は大きくなり、この画素が観客の関心を強く引く度合いが大きくなる。点の顕著性値は例えば、0以上255以下(8ビット)である。
工程E2によれば、顕著性マップは、クリップの組の広告クリップそれぞれについて生成される。この顕著性マップは効果的には、広告クリップの最初のピクチャから(例えば、最初のp個のピクチャ)から規定される。クリップの顕著性マップは例えば、このクリップの最初のp個のピクチャの顕著性マップの平均である。
次の工程(E3と表される)によれば、広告クリップ毎に、ビデオ系列の顕著性マップと広告クリップの顕著性マップとの間で類似度の度合いが求められる。
前述の類似度の度合いは、種々のやり方で求めることが可能である。
第1の実施例によれば、工程E3は、ビデオ系列の顕著性マップと広告クリップの顕著性マップとの間の相関係数を、広告クリップ毎に算出する工程を含み、類似度の度合いはよって、算出された相関係数に比例する。
第2の実施例によれば、工程E3は、ビデオ系列の顕著性マップと広告クリップの顕著性マップとの間のクルバック・レイブラー・ダイバージェンス(Kullback−Leibler divergence)を、広告クリップ毎に算出する工程を含み、類似度の度合いはよって、算出されたダインバージェンスに比例する。
第3の特定の実施例では、工程E3は、
(a)ビデオ系列の顕著性マップにおいて、かつ、広告クリップの顕著性マップにおいて、マップの最も顕著なN個の最大顕著点と呼ばれる点を選択し、上記点は、少なくともm個の点だけ、互いに離間し、最も顕著な点から最も顕著でない点まで配列され、これを達成するために、まず、顕著性マップにおける最大顕著性を有する点が選択され、次いで、検出された点を取り囲むm個の点のゾーンが抑制され、顕著性マップの最も抑制されていない点のうちで、最大顕著性を有する点が次いで検出され、この最大顕著点を中心としたm個の点に等しい半径Rに属する点全てが抑制され、N個の最大顕著点が得られるまで繰り返され、N個の点がよって、ビデオ系列の顕著性マップにおいて得られ、N個の点が広告クリップの顕著性マップにおいて得られるサブ工程と、
(b)ビデオ・ピクチャの顕著性マップのN個の最大顕著点毎に、広告クリップの顕著性マップの同じ順序の最大顕著点と、上記点との間のユークリッド距離が次いで求められるサブ工程と、
(c)先行して算出されたN個のユークリッド距離の平均が算出され、考慮に入れられた広告クリップの類似度の度合いはよって、算出された平均と反比例するサブ工程と
を広告クリップ毎に行う。
工程E3のこの実施例は、3つの広告クリップについて図4で示す。この図では、最大顕著点3点(N=3)が、ビデオ系列Vにおいて識別されており、PV1、PV2及びPV3と表し、S(PV1)>S(PV2)>S(PV3)であり、ここで、S(P)は点Pの顕著性値を表す。更に、PA1、PA2及びPA3は、広告クリップAの3つの最大顕著点を表し、S(PA1)>S(PA2)>S(PA3)である。同様に、PB1、PB2及びPB3は、広告クリップBの3つの最大顕著点を表し、S(PB1)>S(PB2)>S(PB3)である。最後に、PC1、PC2及びPC3は、広告クリップCの3つの最大顕著点を表し、S(PC1)>S(PC2)>S(PC3)である。
この図では、工程E3は、同じ順序の点間のユークリッド距離dの、クリップ毎の算出(すなわち、d(PVi,PAi)、d(PVi,PBi)及びd(PVi,PCi)、i∈[1…3])を含み、3つの算出距離の平均をクリップ毎に算出し、それら毎の類似度の度合いを推論するにあたり、この度合いは、算出された平均に反比例する。類似度の度合いは例えば、算出された平均の逆数である。
第3の実施例の変形である一実施例では、選択された最大顕著点は配列されない。よって、工程E3は広告クリップ毎に、
(a)ビデオ系列の顕著性マップにおいて、かつ、広告クリップの顕著性マップにおいて、マップの最も顕著なN個の点が選択され、上記点は、少なくともmだけ、互いに離間し、先行する実施例と同様に、まず、顕著性マップにおける最大顕著性を有する点が選択され、次いで、検出された点を取り囲むm個の点のゾーンが抑制され、顕著性マップの抑制されていない点のうちで、最大顕著性を有する点が次いで検出され、この最大顕著点を中心としたm個の点に等しい半径Rに属する点全てが抑制され、N個の最大顕著点が得られるまでこの動作が繰り返され、N個の点がよって、ビデオ系列の顕著性マップにおいて得られ、N個の点が広告クリップの顕著性マップにおいて得られるサブ工程と、
(b)ビデオ・ピクチャの顕著性マップのN個の最大顕著点毎に、広告クリップの顕著性マップの最も近い最大顕著点と、上記点との間のユークリッド距離が次いで求められるサブ工程と、
(c)先行して算出されたN個のユークリッド距離の平均が算出され、考慮に入れられた広告クリップの類似度の度合いはよって、算出された平均と反比例するサブ工程とを行うことを含む。
この変形実施例は、3つの広告クリップについて図5に示す。この図は、図4について規定された最大顕著点を使用する。この実施例によれば、ビデオ系列の点Pvi毎に、各クリップの最大顕著点それぞれとのそのユークリッド距離dが算出され、最小距離のみが維持される。例えば、図5では、クリップA毎に、点PA2が点PV1に最も近く、点PA2が点PV2に最も近く、点PA1が点PV3に最も近い。よって、クリップAについて、距離d(PV1,PA2)、d(PV2,PA2)及びd(PV3,PA1)の平均が算出される。このようにして、もう一度図5を参照することにより、クリップBについて、距離d(PV1,PB3)、d(PV2,PB3)及びd(PV3,PB3)の平均が算出され、クリップCについて、距離d(PV1,PC1)、d(PV2,PC2)及びd(PV3,PC3)の平均が算出される。前述から、算出された平均に反比例する、類似度の度合いがよって、3つのクリップ毎に推論される。類似度の度合いは例えば、算出された平均の逆数である。
当然、ビデオ系列の顕著性マップと広告クリップの顕著性マップとの間の類似度を算出することを可能にする他の方法は何れも、工程E3を実現するために使用することが可能である。
図3をもう一度参照すれば、E4と表す次の工程は、類似度の最高の度合いを有するクリップを広告クリップ全てから選択する工程を含む。
最後に、選択された広告クリップが、工程E5において、ビデオ系列の挿入点においてビデオ系列に挿入される。方法の最後に、広告クリップが挿入された拡充ビデオ系列が得られる。
当然、挿入する対象の広告クリップの選択は、より複雑であり、他の選択処理と組み合わせることが可能である。広告クリップの組に含まれるクリップは、挿入されたビデオ系列の意味論的内容に対するその意味論的内容に応じて既に予め選択されていることがあり得る。例えば、クリップの第1の事前選択は、ビデオ系列のテーマ、あるいは、ビデオ系列に含まれたテキスト及び/又はオブジェクトのテーマに応じて、あるいは、観客のプロファイルに応じて行われていることがあり得る。
本発明は、上記方法を実現する、図6中で100と表すピクチャを処理する装置にも関する。この図では、図示されたモジュールは、物理的に区別可能な装置に対応していても対応していなくてもよい機能的装置である。例えば、前述のモジュール又はその一部は、単一の構成部分に集約するか、又は同じソフトウェアの機能を構成することが可能である。逆に、一部のモジュールが、別個の物理エンティティを含み得る。装置の重要な構成要素のみを図6に示す。装置100は特に、ランダム・アクセス・メモリ110(RAM若しくは同様な構成部分)と、リードオンリ・メモリ120(ハード・ディスク若しくは同様な構成部分)と、マイクロプロセッサや同様な構成部分などの処理装置130と、入出力インタフェース140と、場合によっては、マンマシン・インタフェース150とを含む。前述の構成要素は、互いにアドレス及びデータ・バス160によって接続される。リードオンリ・メモリは、本発明による方法の工程E1乃至E5を実現するアルゴリズムを含む。装置が、その中に広告クリップを挿入する対象のビデオ系列内の切り換えを検出する役目を担っている場合、メモリは、ショット切り換えを検出するためのアルゴリズムも含む。電源を入れると、処理装置130は、前述のアルゴリズムの命令をロードし、実行する。ランダム・アクセス・メモリ110は特に、装置の電源を入れる役目を担う、処理装置130のオペレーティング・プログラムを含み、処理する対象のビデオ系列、及びこのビデオ系列に挿入する対象の広告クリップを含む。入出力インタフェース140の機能は、入力信号(ビデオ系列及び広告クリップ)を受信し、広告クリップが挿入された拡充ビデオ系列を出力することである。場合によっては、オペレータは、マンマシン・インタフェース160により、広告クリップが挿入されるショット切り換えを選択する。拡充ビデオ系列は、ランダム・アクセス・メモリに記憶され、次いで、将来の処理が考えられるという見方でアーカイブされるようリードオンリ・メモリに転送される。
本発明は別々の特定の実施例に関して説明してきたが、これは決して限定でなく、本発明の範囲内に収まる場合、本願記載の手段の技術上の均等物、及びその組合せ全てを含むということは明らかである。特に、広告クリップは、ショット切り換えでないビデオ系列の点において挿入することが可能である。クリップは例えば、ビデオ系列に伴う、メタデータ内で規定されたシーケンスの特定の点において挿入することが可能である。場合によっては、等時間間隔で系列に挿入することも可能である。
110 RAM
120 ROM
130 処理装置
140 I/O
150 インタフェース

Claims (11)

  1. ビデオ系列と呼ばれるビデオ・ピクチャ系列の2つのピクチャ間で、挿入点と呼ばれる点において広告クリップを挿入することが意図されたピクチャを処理する方法であって、
    挿入点前の前記ビデオ系列の顕著性を表す顕著性マップを生成する工程と、
    顕著性マップを、広告クリップの組の広告クリップ毎に生成する工程と、
    前記ビデオ系列の顕著性マップと前記広告クリップの顕著性マップとの間の類似度の度合いを前記広告クリップの組の広告クリップ毎に求める工程であって、前記類似度の度合いは、両方のマップ上の顕著性ゾーンの位置間の比較を表す工程と、
    前記広告クリップの組のうちで、最高の類似度の度合いを有する広告クリップを選択する工程と、
    前記選択された広告クリップを前記挿入点において前記広告クリップに挿入する工程とを含む方法。
  2. 請求項1記載の方法であって、前記挿入点は、前記ビデオ系列におけるショット切り換えに対応する、前記ビデオ系列の点である方法。
  3. 請求項1又は2に記載の方法であって、前記ビデオ系列の顕著性を表す顕著性マップが前記挿入点に先行するビデオ系列の最後のn個のピクチャの顕著性マップから生成され、nは1と50との間に含まれる方法。
  4. 請求項1乃至3のうちの何れか一項に記載の方法であって、広告クリップの顕著性マップは前記広告クリップの最初のp個のピクチャの顕著性マップから生成され、pは1から50までの間に含まれる方法。
  5. 請求項1乃至4のうちの何れか一項に記載の方法であって、広告クリップの類似度の度合いを求めるために、前記ビデオ系列の顕著性マップと前記広告クリップの顕著性マップとの間の相関係数が算出され、前記類似度の度合いは、よって、前記算出された相関係数に比例する方法。
  6. 請求項1乃至4のうちの何れか一項に記載の方法であって、広告クリップの類似度の度合いを求めるために、前記ビデオ系列の顕著性マップと前記広告クリップの顕著性マップとの間のクルバックレイブラー・ダイバージェンスが算出され、前記類似度の度合いは、よって、前記算出されたダイバージェンスに反比例する方法。
  7. 請求項1乃至4のうちの何れか一項に記載の方法であって、広告クリップの類似度の度合いを求めるために、
    最大顕著点と呼ばれる、マップのN個の最も顕著な点を、前記広告クリップの顕著性マップ及び前記ビデオ・ピクチャの顕著性マップから選択する工程であって、前記点は、少なくともm個の点だけ、互いに離間し、最も顕著なものから最も顕著でないものに配列され、Nは1以上である工程と、
    前記ビデオ・ピクチャの顕著性マップのN個の最大顕著点毎に、前記広告クリップの顕著性マップの同じ順序の最大顕著点、及び前記点間のユークリッド距離を求める工程と、
    求められたN個のユークリッド距離の平均を算出する工程であって、前記広告クリップの類似度の度合いはよって、前記算出された平均と反比例する工程が行われる方法。
  8. 請求項1乃至4のうちの何れか一項に記載の方法であって、広告クリップの類似度の度合いを求めるために、
    最大顕著点と呼ばれる、マップのN個の最も顕著な点を、前記広告クリップの顕著性マップ及び前記ビデオ・ピクチャの顕著性マップから選択する工程であって、前記点は、少なくともm個の点だけ、互いに離間し、Nは1以上である工程と、
    前記ビデオ・ピクチャの顕著性マップのN個の最大顕著点毎に、前記広告クリップの顕著性マップにおいて最も近い最大顕著点と、前記点との間のユークリッド距離を求める工程と、
    求められたN個のユークリッド距離の平均を算出する工程であって、前記広告クリップの類似度の度合いは、前記算出された平均に反比例する工程が行われる方法。
  9. 請求項7又は8に記載の方法であって、顕著性マップにおいて少なくともm個の点だけ離間したN個の最大顕著点を選択するために、
    a)最大顕著性を有する点が前記顕著性マップから選択される工程と、
    b)検出点を中心とした半径Rのゾーンに属する点は全て、抑制され、Rはm個の点に等しい工程と、
    c)工程a)及びb)が、N個の最大顕著性点が得られるまで、前記顕著性マップの抑制されていない点について繰り返される工程が行われる方法。
  10. ビデオ系列と呼ばれるビデオ・ピクチャ系列の2つのピクチャ間で、挿入点と呼ばれる点において広告クリップを挿入することが意図されたピクチャを処理する装置であって、
    前記挿入点前のビデオ系列の顕著性を表す顕著性マップ、及び広告クリップの組の広告クリップ毎の顕著性マップを生成する手段と、
    前記ビデオ系列の顕著性マップと前記広告クリップの顕著性マップとの間の類似度の度合いを前記広告クリップの組の広告クリップ毎に求める手段と、
    前記広告クリップの組のうちで、最高の類似度を有する広告クリップを選択する手段と、
    前記選択された広告クリップを前記挿入点において前記ビデオ系列に挿入する手段とを備える装置。
  11. 請求項10記載の装置であって、前記ビデオ系列におけるショット切り換えを検出する手段を更に備え、前記選択された広告クリップはよって、このショット切り換えに対応するビデオ系列の点において挿入される装置。
JP2009213544A 2008-10-07 2009-09-15 広告クリップをビデオ系列に挿入する方法、及び対応する装置 Expired - Fee Related JP5334771B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
FR0856779 2008-10-07
FR0856779 2008-10-07

Publications (2)

Publication Number Publication Date
JP2010093798A JP2010093798A (ja) 2010-04-22
JP5334771B2 true JP5334771B2 (ja) 2013-11-06

Family

ID=40566117

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009213544A Expired - Fee Related JP5334771B2 (ja) 2008-10-07 2009-09-15 広告クリップをビデオ系列に挿入する方法、及び対応する装置

Country Status (4)

Country Link
US (1) US8813119B2 (ja)
EP (1) EP2175654A1 (ja)
JP (1) JP5334771B2 (ja)
CN (1) CN101714155B (ja)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8369686B2 (en) * 2009-09-30 2013-02-05 Microsoft Corporation Intelligent overlay for video advertising
US8723960B2 (en) 2010-07-02 2014-05-13 Thomson Licensing Method for measuring video quality using a reference, and apparatus for measuring video quality using a reference
CN102137291B (zh) * 2010-09-25 2013-11-06 华为技术有限公司 一种广告选择方法及一种互联网协议电视iptv平台
US9734867B2 (en) * 2011-03-22 2017-08-15 Futurewei Technologies, Inc. Media processing devices for detecting and ranking insertion points in media, and methods thereof
CN103024479B (zh) * 2012-12-17 2016-03-02 深圳先进技术研究院 视频内容中自适应投放广告的方法及系统
EP2876890A1 (en) 2013-11-21 2015-05-27 Thomson Licensing Method and apparatus for frame accurate synchronization of video streams
CN108810596B (zh) * 2017-04-27 2021-12-14 腾讯科技(深圳)有限公司 一种视频编辑方法、装置及终端
CN109640172B (zh) * 2018-12-10 2021-02-05 深圳市方直科技股份有限公司 一种在动画中插入视频片段的方法及装置
CN113949828B (zh) * 2021-10-18 2024-04-30 北京达佳互联信息技术有限公司 视频剪辑方法、装置、电子设备及存储介质

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001308857A (ja) * 2000-04-24 2001-11-02 Mitsubishi Electric Corp 情報配信システム、情報配信方法およびその方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体
US20020154833A1 (en) * 2001-03-08 2002-10-24 Christof Koch Computation of intrinsic perceptual saliency in visual environments, and applications
US7136875B2 (en) * 2002-09-24 2006-11-14 Google, Inc. Serving advertisements based on content
US20050149968A1 (en) * 2003-03-07 2005-07-07 Richard Konig Ending advertisement insertion
JP2007512735A (ja) * 2003-11-17 2007-05-17 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 周辺の番組コンテンツに基づいた、ビデオ・ストリームへのコマーシャルの挿入
EP1544792A1 (en) 2003-12-18 2005-06-22 Thomson Licensing S.A. Device and method for creating a saliency map of an image
CN1595970A (zh) 2004-06-22 2005-03-16 威盛电子股份有限公司 根据开始/结束片段特定画面检测广告片段的方法及系统
US9554093B2 (en) * 2006-02-27 2017-01-24 Microsoft Technology Licensing, Llc Automatically inserting advertisements into source video content playback streams
US8832140B2 (en) * 2007-06-26 2014-09-09 Oracle Otc Subsidiary Llc System and method for measuring the quality of document sets

Also Published As

Publication number Publication date
CN101714155B (zh) 2014-04-09
JP2010093798A (ja) 2010-04-22
US20100199300A1 (en) 2010-08-05
CN101714155A (zh) 2010-05-26
US8813119B2 (en) 2014-08-19
EP2175654A1 (en) 2010-04-14

Similar Documents

Publication Publication Date Title
JP5334771B2 (ja) 広告クリップをビデオ系列に挿入する方法、及び対応する装置
EP1225518B1 (en) Apparatus and method for generating object-labelled images in a video sequence
US8379154B2 (en) Key-frame extraction from video
CA2651464C (en) Method and apparatus for caption production
US9078048B1 (en) Finding and populating spatial ad surfaces in video
US20070127773A1 (en) Image processing apparatus
EP1182584A2 (en) Method and apparatus for video skimming
US20090103888A1 (en) Electronic apparatus, content categorizing method, and program therefor
EP2819096A1 (en) Method and apparatus for inserting a virtual object in a video
CN112740713A (zh) 用于提供多媒体内容中的关键时刻的方法及其电子设备
EP1518417A1 (en) Method and system for white balancing images using facial color as a reference signal
US20110268426A1 (en) Video editing apparatus and video editing method
US11853357B2 (en) Method and system for dynamically analyzing, modifying, and distributing digital images and video
US20130325963A1 (en) Information processing device, information processing method, and program
JP2004364234A (ja) 放送番組内容メニュー作成装置及び方法
JP2017182628A (ja) 拡張現実ユーザインタフェース適用装置および制御方法
EP1321897A2 (en) Method for extracting object region
KR101569929B1 (ko) 시청각 콘텐트의 인지 복잡도를 뷰어 관심 레벨로 조정하기 위한 장치 및 방법
JPH0965287A (ja) 動画像の特徴場面検出方法及び装置
US20210289266A1 (en) Video playing method and apparatus
CN108600864B (zh) 一种电影预告生成方法及装置
JP4906615B2 (ja) ピッチショット検出システム、参照ピッチショット画像選定装置及び参照ピッチショット画像選定プログラム
CN109889738A (zh) 一种交互式视频处理方法及装置
Vendrig et al. Evaluation of logical story unit segmentation in video sequences
JP4930364B2 (ja) 映像文字検出方法、装置、およびプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20120702

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20130716

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130723

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130730

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees