JP2014059875A - 画像内のロゴの存在を検出する装置、及び方法 - Google Patents

画像内のロゴの存在を検出する装置、及び方法 Download PDF

Info

Publication number
JP2014059875A
JP2014059875A JP2013191886A JP2013191886A JP2014059875A JP 2014059875 A JP2014059875 A JP 2014059875A JP 2013191886 A JP2013191886 A JP 2013191886A JP 2013191886 A JP2013191886 A JP 2013191886A JP 2014059875 A JP2014059875 A JP 2014059875A
Authority
JP
Japan
Prior art keywords
logo
candidate
current
current image
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2013191886A
Other languages
English (en)
Other versions
JP2014059875A5 (ja
Inventor
Q Huynh-Thu Thai
キュー ハイン−トゥ タイ
Urban Fabrice
アーバン ファブリス
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Thomson Licensing SAS
Original Assignee
Thomson Licensing SAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Thomson Licensing SAS filed Critical Thomson Licensing SAS
Publication of JP2014059875A publication Critical patent/JP2014059875A/ja
Publication of JP2014059875A5 publication Critical patent/JP2014059875A5/ja
Withdrawn legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/40Scenes; Scene-specific elements in video content
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2218/00Aspects of pattern recognition specially adapted for signal processing
    • G06F2218/08Feature extraction
    • G06F2218/10Feature extraction by analysing the shape of a waveform, e.g. extracting parameters relating to peaks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V2201/00Indexing scheme relating to image or video recognition or understanding
    • G06V2201/09Recognition of logos

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Image Analysis (AREA)
  • Auxiliary Devices For Music (AREA)

Abstract

【課題】画像シーケンスのうちのある画像におけるロゴの存在を検出する。
【解決手段】本願発明に係る方法は、現在の画像における現在の候補ロゴ境界形状と、及び現在の画像に先行する画像における先行の候補ロゴ境界形状と、を決定するステップと、少なくとも1つの条件が満たされた場合に現在の画像におけるロゴの存在を検出するステップであって、当該条件が、現在の候補ロゴ境界形状、及び先行の候補ロゴ境界形状の中心の間の距離が第1の閾値より小さいか、又は現在の候補ロゴ境界形状、及び先行の候補ロゴ境界形状の間の重なり部分が第2の閾値より大きい、又は現在の候補ロゴ境界形状、及び現在の画像の、特性ピークの周辺にある領域を特定するための特性マスクの間の重なり部分が第3の閾値よりも大きい、ことである、検出するステップと、を含む。
【選択図】図1

Description

本発明は、画像処理に関する。特に、本発明は、画像シーケンスのうちのある画像におけるロゴの存在を検出する方法、及びその装置に関する。本方法はさらに、より正確にロゴ(つまりその位置)を決定することができる。
画像におけるロゴ検出は、あらゆるアプリケーションに関し注目されている。例えば、再標的画像においてロゴ部分を含むことを避けるために、このような検出が、再標的装置で用いられる。その他のアプリケーションは、ロゴが画像から取り除かれることを要求する。例えば、初めにTVチャンネル(例えばスポーツの試合)で放送される番組は、同一チャンネル上のキャッチアップ・モードで後にアクセスすることができ、又はハイライトに関して別のTVチャンネルに売られることができる。前者の場合、TVチャンネルのロゴは、通常取り除かれて、番組がキャッチアップ・モードであることを表示する特定のロゴに置き換えられる。後者の場合、第1のTVチャンネルのロゴは、第2のTVチャンネルに表示される前に取り除かれる。
2012年1月6日に発行された特許文献1により、特性情報のみを用いて画像におけるロゴを検出することが知られている。より正確には、ロゴは、特性情報に基づいて、画像内の探索領域において大まかに検出される。探索領域は例えば、画像の4つの角である。この解決法では、全体のビデオ・セグメントが処理される間にロゴの制約が存在するようにして統計的に不透明なロゴの最も簡単な場合のみが取り扱われる。さらに、この解決法は、ロゴが画像内において最大の視覚的特性領域ではないとき、例えばハイ・コントラストのオブジェクトが画像内に存在するとき、機能しない。
一方、非特許文献1により、各画像間で統計的エッジの累計に基づいてロゴを検出することが知られている。より正確には、この方法に従うと、N画像間でエッジが検出される。これらエッジは、次にこれらN画像間で累計される。Nが十分に多ければ、累計されたエッジはロゴを検出するための良い情報となる。しかし、再標的アプリケーションのようなリアルタイム・アプリケーションでは、Nは、ロゴ検出のための関連情報を得るには十分多くは無い。
欧州特許出願第2141658号明細書 欧州特許1695288号明細書
Ozay等、"Automatic TV logo detection and classification in broadcast videos"、EUSIPCO 2009
本発明の目的は、従来技術の少なくとも1つの不利益を克服することである。この目的を達成するために、本発明は、ビデオの現在の画像におけるロゴの存在を検出する方法に関し、当該方法は、
現在の画像における現在の候補ロゴ境界形状と、及び現在の画像に先行する画像における先行の候補ロゴ境界形状と、を決定するステップと、
少なくとも1つの条件が満たされた場合に現在の画像におけるロゴの存在を検出するステップであって、当該条件が、
現在の候補ロゴ境界形状、及び先行の候補ロゴ境界形状の中心の間の距離が第1の閾値より小さいか、又は現在の候補ロゴ境界形状、及び先行の候補ロゴ境界形状の間の重なり部分が第2の閾値より大きい、または
現在の候補ロゴ境界形状、及び現在の画像の、特性ピークの周辺にある領域を特定するための特性マスクの間の重なり部分が第3の閾値よりも大きい、
ことである、検出するステップと、
を含む。
従って、ロゴ検出は、より強固である。
特定の特徴によれば、候補ロゴ境界形状は、候補ロゴ境界ボックスである。
有利には、ロゴの存在がビデオの現在の画像について検出されるごとに信頼度がN増加し、及び他方、信頼度が正のときにロゴの存在が現在の画像について最終的に検出されて、信頼度がN減少する。これにより、ビデオの間にロゴが現れ、及び消滅するような状況を取り扱うことができる。
特定の特徴によれば、N=1である。
別の特徴によれば、各連続の検出、又は非検出がなされた後に、Nの値が増加する。
別の実施形態によれば、ロゴの存在が現在の画像について検出されるとき、現在の画像におけるロゴは、次に従って決定される:現在の候補ロゴ境界ボックスが特性ピークを含むかどうかを確認し、この確認が肯定の場合、現在の候補ロゴ境界ボックスをロゴ候補境界ボックスのリストに加え、このリストがM候補ロゴ境界ボックスを含むとき、候補ロゴ境界ボックスのリストから現在の画像におけるロゴが計算され、他方、現在の画像におけるロゴが、現在の候補ロゴ境界ボックスである。ロゴの局在は、従ってビデオにおいて安定し、正確である。
特定の特徴によれば、Mは10に等しい
本願発明の別の態様によれば、現在の候補ロゴ境界ボックスを決定するステップは、
a)少なくとも1つの検索領域における検出窓の各画像についてエッジ・マップを計算することであって、検出窓が、現在の画像、及び現在の画時に先行するP画像を有する、計算することと、
b)累計エッジ・マップに画像間のエッジ・マップを合計し、累計エッジ・マップを2値化することと、
c)2値化した累計エッジ・マップをフィルタリングして、フィルタリングされたエッジ・マップにすることと、
d)フィルタリングされたエッジ・マップを2値化して、ブロブのマップにすることと、
e)フィルタリングされたエッジ・マップにおいて最高値である画素値を含むブロブの間で、フィルタリングされたエッジ・マップにおける画素値の最大値の合計を含むブロブを選択することと、
f)選択されたブロブの境界となる、候補境界ボックスであるボックスを決定することと、
を含む。
ロゴが透明、又は半透明のとき、候補境界ボックスの決定において、ステップa)からf)が役に立つ。
有利には、検出窓がk画像分スライドされて、スライドされた検出窓上でステップa)からf)が繰り返されて、スライドされた検出窓の1つの画像についてロゴを検出し、次の画像が呼び出される。
本願発明の別の態様によれば、少なくとも1つの検索領域は、現在の画像の4つの角、並びに上部水平バナー及び底部水平バナーを含む。
本願発明は、さらに、ビデオの現在の画像におけるロゴの存在を検出する装置に関連し、当該装置は、
現在の画像における現在の候補ロゴ形状、及び現在の画像に先行する画像における先行の候補ロゴ形状を決定する手段と、
少なくとも1つの条件が満たされた場合に現在の画像におけるロゴの存在を検出する手段であって、当該条件が、
現在の候補ロゴ境界形状、及び先行の候補ロゴ境界形状の中心の間の距離が第1の閾値より小さいか、又は現在の候補ロゴ境界形状、及び先行の候補ロゴ境界形状の間の重なり部分が第2の閾値より大きい、または
現在の候補ロゴ境界形状、及び現在の画像の、およそ特性ピークにある領域を特定するための特性マスクの間の重なり部分が第3の閾値よりも大きい、
ことである、検出する手段と、
を備える。
特定の特徴によれば、候補ロゴ境界形状は、候補ロゴ境界ボックスである。
有利には、当該装置は、ロゴの存在がビデオの現在の画像について検出されるごとに信頼度がN増加し、及び他方、信頼度が正のときにロゴの存在が現在の画像について最終的に検出されて、信頼度がN減少する、手段をさらに備える。
特定の特徴によれば、Nは1に等しい。
特定の特徴によれば、各連続の検出、又は非検出がなされた後に、Nの値が増加する。
本願発明の別の態様によれば、当該装置は、ロゴの存在が検出されたときに、現在の画像におけるロゴを決定する手段を備え、ロゴを決定する手段は、現在の候補ロゴ境界ボックスが特性ピークを有するかを確認し、確認が肯定の場合にロゴ候補境界ボックスのリストに現在の候補ロゴ境界ボックスを加え、当該リストがM候補ロゴ境界ボックスを含むとき、現在の画像におけるロゴが候補ロゴ境界ボックスのリストから計算され、他方のとき、現在の画像におけるロゴが、現在の候補ロゴ境界ボックスである。
特定の特徴によれば、Mは10に等しい。
本発明の他の特徴、及び利点は、その実施形態のいくつかの以下の記載で見られ、この記載は、次の図面と関連してなされる。
本発明の第1の実施形態に係るビデオにおけるロゴの存在を検出する方法のフローチャートである。 本発明の第1の実施形態に係る方法の詳細なフローチャートである。 本発明の第1の実施形態に係る方法の詳細なフローチャートである。 本発明に係る時間的コヒーレンスを示す図である。 本発明の第2の実施形態に係るビデオにおけるロゴの存在を検出する方法のフローチャートである。 本発明の第2の実施形態に係る方法の詳細なフローチャートである。 本発明の第2の実施形態に係る方法の詳細なフローチャートである。 本発明の第2の実施形態に係る方法の詳細なフローチャートである。 本発明に係る候補ロゴ境界ボックスを決定する方法のフローチャートである。 本発明に係る候補ロゴ境界ボックスを決定する方法の第1の詳細なフローチャートである。 本発明に係る候補ロゴ境界ボックスを決定する方法の第2の詳細なフローチャートである。 本発明に係る特性マスクを決定する方法のフローチャートである。 ビデオにおけるロゴの存在を検出する装置を示す図である。
本発明は、ビデオ内のロゴの存在を検出する方法に関する。ロゴは、任意の形状からなる。マップは、輝度又はクロミナンス以外の情報、例えば特性情報、階調度情報、等が、画素と関連付けられる画像である。
図1は、本発明の第1の実施形態に係るロゴの存在を検出する方法のフローチャートを表す。
ステップ10において、候補ロゴ境界ボックスが、現在の画像I(t)において決定され、及びこの現在の画像に先行する画像I(t-1)において別の候補ロゴ境界ボックスが決定される。本発明は、候補ロゴ境界ボックスが決定される方法によって限定されるものではない。第1の例では、候補ロゴ境界ボックスが、オペレーターにより手動で決定される。変形例では、図9を参照して説明されるような画像処理方法に従って候補ロゴ境界ボックスが決定される。候補ロゴ境界ボックスは、ロゴであると決定される可能性のある、画像内の領域の境界ボックスを表している。領域の境界ボックスは、この領域を含む最小の矩形である。
変形例では、候補ロゴ境界ボックスは、任意の形状について中心を決定できる場合、この任意の形状で置き換えられる。一例として、この任意の形状は、円、三角形、ひし形、四角形である。その結果、ステップ10において、候補ロゴ境界形状が、現在の画像I(t)において決定され、及びこの現在の画像に先行する画像I(t-1)において別の候補ロゴ境界形状が決定される。この候補ロゴ境界形状は、ロゴであると決定される可能性のある、画像内の領域の形状を表している。
ステップ12において、候補ロゴ境界ボックスに基づき、及び現在の画像I(t)の特性マスクに更に基づいて、2つのスコアが計算される。本発明は、特性マスクが決定される方法によって限定されるものではない。特性マスクは、特性ピークを特定する画像である。第1の例として、特性マスクは、特性マップを閾値化することにより得られる。特性マスクは、従って、最大突出画素が第1の値(例えば値255)を有し、その他の画素の全てが別の値(例えば値0)を有するような2値化画像である。特性マップは、特性値が画像の各ピクセルと関連付けられる画像である。特性値は、画素の視覚的な重要性を表す。より視覚的に注意を引く画素は、より高い特性値を有する。特性マップは、従って、画像において視覚的に注目の領域を特定できるようにすることができる。通常、特性マップは、視覚システムのモデル化に基づいて決定される。このような視覚注目モデルは、特許文献2として2005年6月30日に発行されたEP特許出願04804828.4において特許されている。変形例によれば、図12を参照して説明されるような画像処理方法に従って、特性マスクが決定される。
本実施形態によれば、両方のスコア値は、2値である。スコア1は、図2に示すように、現在の画像、及び先行する画像について候補ロゴ境界ボックスに関する情報を用いることにより計算される。ステップ120で、現在の候補ロゴ境界ボックスの中心が計算される。ステップ122で、先行の候補ロゴ境界ボックスの中心が計算される。ステップ124で、両方の中心間の空間距離が計算される。例えば、この空間距離は、(x-x’)*(x-x’)+(y-y’)*(y-y’)の平方根を用いて計算される。ここで、(x,y)、及び(x’,y’)は、現在及び先行の候補ロゴ境界ボックスそれぞれの中心座標である。ステップ126で、この差が、閾値THRESHOLD_BB_CENTROIDと比較される。ステップ128で、2つの候補ロゴ境界ボックスが比較され、両方の候補ロゴ境界ボックスの間で十分な重なり部分があるかどうかを確認する。十分な重なり部分がある場合、又はステップ124で計算された差がTHRESHOLD_BB_CENTROIDより小さい場合、スコア1=1となり、それ以外の場合、スコア1=0となる。スコア1=1のとき、これは、候補ロゴ境界ボックスの中心が、連続する画像間で大きく変化していないことを意味する。共通する画素の数が閾値よりも大きい場合、2つの候補ロゴ境界ボックス間の重なり部分が十分にある。例えば、候補ロゴ境界ボックス間に存在する重なり部分を決定するために閾値1が用いられる。しかし、この閾値は、より高い値に有利に設定することが可能であり、重なり部分のテストに対して厳格な制限を設けることができる。
スコア2は、図3に示すようにして計算される。ステップ130で、現在の候補ロゴ境界ボックスが、現在の特性マスクと比較されて、それら両方の間で十分な重なり部分があるかどうかを確認する。重なり部分が十分な場合、スコア2=1となり、それ以外の場合、スコア2=0となる。共通する画素の数が閾値よりも大きい場合、2つの候補ロゴ境界ボックス間の重なり部分が十分にある。2つの候補ロゴ境界ボックス間で共通する画素の数、及び特性マスクが閾値よりも大きい場合、重なり部分が十分にある。この閾値は、ステップ128で用いられるものと同一である。
ステップ16において、ステップ12で計算されたスコア値に基づいて、ロゴの存在が検出される。スコア1=1、又はスコア2=1の場合、現在の画像においてロゴの存在が検出され、それ以外の場合、ロゴは検出されない。変形例によれば、図1の方法は、ロゴの存在の検出を確認するためのステップ14をさらに備える。
選択的ステップ14において、図4に示すように、ロゴの存在についての最終決定がされる前に時間的コヒーレンスが確認される。ロゴの存在についての初期の一時的決定が、スコア1及びスコア2の値に基づいてされる。より正確には、スコア1=1、又はスコア2=1の場合、現在の画像においてロゴの存在が検出され、そうでなければ、ロゴは検出されない。しかし、最終決定が時間的コヒーレンスの統合の後にされる。時間的コヒーレンスは、次の原則に基づく。
1)現在の画像について初期の一時的決定が、肯定的答えをもたらす場合(スコア1又はスコア2が1に等しいため、ロゴが検出されている)、現在の画像に関する検出結果が真の検出であるか又は偽の肯定であるかどうかを決定するために、過去の決定履歴に対して決定が確認される。
2)現在の画像について初期の一時的決定が、否定的答えをもたらす場合(ロゴが検出されていない)、現在の画像に関する検出結果が真の否定であるか又は偽の否定であるかどうかを決定するために、過去の決定履歴に対して決定が確認される。
この目的のために信頼度が計算される。この信頼度は、現在の画像についてロゴの存在が検出されるたびにNだけ増加し、他方であればNだけ減少し、信頼度が正のときに現在の画像についてロゴの存在が最終的に決定される。信頼度がヌル(null)のまま、又は負である限り、最終決定は、「ロゴが存在しない」となる。例えば、N=1。
変形例によれば、ロゴの存在の各検出が連続してされるとき、存在信頼度は、より早く増加する(例えば、N=2)。非検出のそれぞれが連続してなされるとき、存在信頼度は、より早く減少する。
図5は、本願発明の第2の実施形態に係るロゴの存在の検出方法のフローチャートを示す。ここで、第1の実施形態に係る方法のステップと同じステップは、図5において同一の参照番号により特定される。
第1の実施形態のステップ12を置き換えるステップ13において、スコア1及びスコア2に加えて、第3のスコアが計算される。スコア1及びスコア2は、ステップ12のように計算される。スコア3は、図6に示すようにして計算される。ステップ132で、視覚特性のピークが、現在の候補ロゴ境界ボックス内に存在するかどうかが確認される。特性ピークが存在する場合にスコア3=1となり、存在しない場合にスコア3=0となる。このスコアを用いることにより、決定そのものを操るよりも、他のテストで得られる検出決定に対する信頼性を増すことができる。これは、ロゴがしばしば、常時ではないが視覚的に目立っているということの観察に基づいている。
ステップ15において、リファレンス境界ボックスが、図7に示すように現在の画像について計算される。リファレンス境界ボックスは、ロゴの存在、及び位置の信頼性に関する情報を一時的に記憶することによって計算される。これは、ロゴの大きさ、及び位置が一連の画像に渡り同一のままであるべきであるという発想に基づいている(ロゴがビデオにおいて後に消滅、又は再登場するとしても)。
ひとたび、候補境界ボックスが現在の画像について見つけられれば、スコア3の値がステップ70で用いられる。
1)スコア3=1の場合:ロゴの存在について、より高い信頼性があり、ステップ72で、現在の候補ロゴ境界ボックスがリファレンス・リストに加えられる。
2)スコア3=0の場合:現在の画像の候補境界ボックスが、前の画像のうちの1つに十分に類似しているとき、ステップ74で類似連続候補ロゴ境界ボックスのカウンター(SimilarBBConsecCount)を増加することによって、時間的類似性の原理が適用される。2つの候補境界ボックス間の類似性を決定するために、2つの境界ボックスの最上左の角と、最下右の角とへの座標が比較される。一方の最上左の角と、他方の最下右の角との間で計算される両方の空間距離が閾値よりも小さい場合、境界ボックスは類似するであろうと考えられる。例えば、閾値は、5ピクセルのように設定される。次に、カウンター値が、ステップ76で、閾値THRESHOLDと比較される。SimilarBBConsecCount > THRESHOLD の場合、現在の候補ロゴ境界ボックスが、ステップ72で、リファレンス・リストに加えられる。一方、現在の候補境界ボックスと、前の候補境界ボックスとの間で非類似であることが見出された場合、ステップ78でカウンターがゼロにリセットされる。
ステップ80で、SizeListの値によって示される、リファレンス・リストに存在する候補境界ボックスの数が、閾値REFERENCE_BUFFER_SIZEと比較される。REFERENCE_BUFFER_SIZEは例えば、10に等しい。リファレンス・リストにおける候補境界ボックスの数がREFERENCE_BUFFER_SIZEに到達したときに、ロゴが高い信頼性で十分な回数検出されたことが決定されると、リファレンス境界ボックスが計算される。ひとたびリファレンス境界ボックスが計算されると、毎回新しい候補ロゴ境界ボックスが全てのテストを通過させてロゴの存在の検出をもたらし、リファレンス境界ボックスの座標が、現在の候補ロゴ境界ボックスの座標の代わりに用いられる。ReferenceBoundingBoxが計算されており、その後の処理で再度計算する必要が無いことを示すフラグconf_position_flagが1にセットされる。変形例によれば、ReferenceBoundingBoxは、後の処理で再計算される。この場合、フラグconf_position_flagを1に設定する必要はない。
リファレンス境界ボックスの座標は、最上左の角、及び最下右の角のX、Y座標をソートし、リストの値の1つ、例えば3番目の値を選択することにより、リストから計算される。理想的なシナリオでは、リファレンス・リストにおける境界ボックスは、非常に類似しており、結果物のリファレンス境界ボックスはまた、リストの境界ボックスに非常に類似するであろう(3番目の値が1番目の値に類似しうるので)。一方、リファレンス・リストにおける境界ボックスが全く異なる場合、次にこのアプローチでは、リストの境界ボックス間で非常に重なり合う領域を選択することとなる。リファレンス境界ボックスを計算する別の方法では、リファレンス・リストにおける境界ボックスの座標のヒストグラムを計算して、各座標についてピーク値を検討することとなる。
ステップ17において、ロゴの存在に関する最終決定が、図8に示すようになされる。ロゴの検出についての初期の一時的決定は、スコア1及びスコア2の値に基づく。しかし、ロゴの存在についての最終決定は、時間的コヒーレンスの統合の後に行う。リファレンス境界ボックスが計算される場合、次に、ロゴの存在についての決定がポジティブであるときは、リファレンス境界ボックスの情報が、現在の候補ロゴ境界ボックスの情報を無効にする。一方、現在の境界ボックスの情報が用いられる。ひとたび、リファレンス境界ボックスが計算されると、ロゴが後に検出されたときにビデオの残りの画像において、同じリファレンス境界ボックスが用いられる。変形例によれば、新しいリファレンス境界ボックスが、画像I(t)の後の画像において計算される。
図9、10、11は、候補ロゴ境界ボックスを決定するための方法のフローチャートを示す。ステップ92において、エッジ検出器、例えばSobelエッジ検出器が、現在の画像、及び現在の画像に先行する画像(ACCU_LENGTH-1)に適用される。変形例によれば、エッジ検出器は、画像の探索領域、例えば画像の4つの角、又は上部及び底部の水平バナーにのみ適用される。変形例によれば、より堅牢で精密な検出器、例えばCannyエッジ検出器が用いられる。より堅牢で精密な検出器を用いることにより、半透明のロゴやソフト・エッジのロゴについて、エッジ検出を改善する。
ステップ94において、Sobelエッジ検出器の出力であるエッジの2値化マップが、累計エッジ・マップに総計される。累計エッジ・マップは、累計エッジ・マップにおける最大合計値MaxEdgeValueに等しい値の画素のみを考慮することにより、2値化される。変形例によれば、例えばK=0.8のK*ACCU_LENGTH以上の値の画素が考慮される。選択ステップ95において、2値化した累計エッジ・マップにおけるヌルではない画素の数が、閾値LOGO_MINIMUM_EDGE_PTSと比較される。この閾値より小さい場合、時間的コヒーレンスが確認され(選択ステップ14)、そうでなければ、ステップ96に進む。
ステップ96において、2値化した累計エッジ・マップは、平均フィルターでフィルタリングされ、フィルタリングされた画像の位置が特定される。
ステップ98において、フィルタリングされた画像が2値化されて、時間的累計静的エッジのブロブ(blob)表示領域が生成される。
ステップ100において、ブロブが処理される。より正確には、フィルタリングされた画像においてピーク値を含むブロブが特定される。それぞれ特定されたブロブについて、フィルタリングされた画像における対応画素の値の合計が計算される。合計値が最高のブロブが、次に選択される。選択されたブロブの境界を示す矩形ボックスが、候補ロゴ境界ボックスである。変形例によれば、選択されたブロブの境界を示す矩形ボックスの表面、高さ、及び幅が、ステップ102において閾値と比較される。それらのうちの1つが閾値よりも小さい場合、矩形ボックスは、破棄される。
図12は、現在の画像について特性マップから特性マスクを決定するための方法のフローチャートを示す。ステップ1200において、グレースケール空間特性マップにおける最大値が決定される。ステップ1202において、最大値が、閾値SALIENCY_PEAK_MINと比較される。この最大値が、この閾値よりも小さい場合、特性情報を用いるためにはとても弱いものであると判断される。他方、ステップ1204で、特性マスクが構築される。2値画像SaliencyMask1が構築される。2値画像SaliencyMask1は、特性空間マップにおける最大値に等しいこれらの画素の位置を示すものである。第1の特性マスクにおいてそれぞれアクティブにした位置の周りのNEIGH画素の近隣を考慮する第2の特性マスクの構築が可能になる。スコア2及びスコア3を計算するために、両方の特性マスクを用いることができる。変形例により、最高特性値NB_SALIENCY_TOP_VALUESが、ステップ1206で考慮される。SaliencyMask1は、スコア3を計算するために優先的に用いられる。SaliencyMask2は、スコア2を計算するために用いられる。
図13は、特定かつ非限定の実施形態に係るロゴ検出器2の例示的アーキテクチャを示す。ロゴ検出器は、例えば、タブレット、携帯電話、又はPDAに搭載されます。ロゴ検出器2はデータがアドレスバス24により互いにリンクされる以下の要素を含む。(i)マイクロプロセッサー21(すなわちCPU)、例えばDSP(すなわちデジタルシグナルプロセッサー)。(ii)ROM22(すなわちRead Only Memory)。(iii)RAM23(すなわちRandom Access Memory)。(iv)1又は複数の入力/出力インターフェース25、例えばキーボードやマウス。(v)バッテリー26。
図13の各要素は、当業者によく知られているものであり、さらなる開示は必要ではないであろう。ロゴ検出器2は、処理画像を表示するスクリーンのような表示手段を含むことができる。前述のメモリーのそれぞれにおいて、本明細書で使われる単語<<register>>は、小容量(又は数ビット)の領域、又は非常に大きな領域(例えばプログラム全体、又は大容量の受信若しくは復号データ)に対応することができる。本願発明に係る処理方法のアルゴリズムは、ROM22に記憶される。RAM23は、レジスターに、CPU21により実行され、かつ起動後にアップロードされる処理装置2のプログラムを含む。起動したときに、CPU21は、RAMにプログラムをアップロードし、対応する命令を実行する。処理されることとなる画像は、入力/出力インターフェース25のうちの1つで受信される。
変形例によれば、本発明と互換性のあるロゴ検出器2が、単にハードウェアの実現に従って実装され、例えば、専用コンポーネント(例えば、ASIC(Application Specific Integrated Circuit)、FPGA(Field-Programmable Gate Array)、VLSI(Very Large Scale Integration)、装置に搭載されるあらゆる電子コンポーネント、又はハードウェア要素とソフトウェア要素との混合形態)の形態で実装される。
スコア値(スコア1、スコア2、スコア3)は、2値である必要は無い。代わりに確率値とすることができる。実際、2値を用いることにより、これらのスコアが用いられる異なるステップでの決定が困難なこともある。代わりに確率値を用いることにより、決定の際に特定の信頼度を与え、あいまいな論理アプローチを用いてこれらのスコアが用いられる異なるステップでの決定をすることができる。

Claims (18)

  1. ビデオの現在の画像のロゴの存在を検出する方法であって、当該方法は、
    前記現在の画像における現在の候補ロゴ境界形状と、前記現在の画像に先行する画像における先行の候補ロゴ境界形状と、を決定するステップ(10)と、
    少なくとも1つの条件(12)が満たされた場合に前記現在の画像におけるロゴの前記存在を検出するステップ(16)であって、当該条件が、
    前記現在の候補ロゴ境界形状、及び前記先行の候補ロゴ境界形状の中心の間の距離が第1の閾値より小さいか、又は前記現在の候補ロゴ境界形状、及び前記先行の候補ロゴ境界形状の間の重なり部分が第2の閾値より大きい、
    前記現在の候補ロゴ境界形状、及び前記現在の画像の、特性ピークの周辺にある領域を特定するための特性マスクの間の重なり部分が第3の閾値よりも大きい、
    ことである、前記検出するステップと、
    を含む、前記方法。
  2. 前記候補ロゴ境界形状は、候補ロゴ境界ボックスである、請求項1に記載の方法。
  3. ロゴの前記存在が前記ビデオの現在の画像について検出されるごとに信頼度がN増加し(14)、及び他方の場合にN減少し、前記信頼度が正のときに、ロゴの前記存在が前記現在の画像について最終的に検出される、請求項2に記載の方法。
  4. Nが1に等しい、請求項3に記載の方法。
  5. 各連続の検出、又は非検出がなされた後に、Nの前記値が増加する、請求項3に記載の方法。
  6. ロゴの前記存在が前記現在の画像について検出されたときに、前記現在の画像における前記ロゴが、
    前記現在の候補ロゴ境界ボックスが特性ピークを含むかを確認し、前記確認が肯定の場合に、前記現在の候補ロゴ境界ボックスをロゴ候補境界ボックスのリストに加え、候補ロゴ境界ボックスのリストがM候補ロゴ境界ボックスを含むとき、前記現在の画像における前記ロゴが候補ロゴ境界ボックスの前記リストから計算される境界ボックスであり、他の場合に前記現在の画像における前記ロゴが前記現在の候補ロゴ境界ボックスである、請求項2から5のうちのいずれか1項に記載の方法。
  7. Mが10に等しい、請求項6に記載の方法。
  8. 前記現在の候補ロゴ境界ボックスを決定するステップは、
    a)少なくとも1つの検索領域における検出窓の各画像についてエッジ・マップを計算することであって、前記検出窓が、現在の画像及び前記現在の画時に先行するP画像を有する、前記計算すること(92)と、
    b)累計エッジ・マップに画像間のエッジ・マップを合計し、前記累計エッジ・マップを2値化すること(94)と、
    c)前記2値化した累計エッジ・マップをフィルタリングして(96)、フィルタリングされたエッジ・マップにすることと、
    d)前記フィルタリングされたエッジ・マップを2値化して(98)、ブロブのマップにすることと、
    e)前記フィルタリングされたエッジ・マップにおいて最高値である画素値を含む前記ブロブの間で、前記フィルタリングされたエッジ・マップにおける画素値の最大値の合計を含むブロブを選択すること(100)と、
    f)前記選択されたブロブの境界となる、前記候補境界ボックスであるボックスを決定することと、
    を含む、請求項2から7のうちのいずれか1項に記載の方法。
  9. 前記検出窓は、k画像分スライドされ、前記a)からf)までのステップは、前記スライドされた検出窓上で繰り返されて前記スライドされた検出窓の1つの画像についてロゴが検出され、次の画像が呼び出される、請求項8に記載の方法。
  10. 前記少なくとも1つの探索領域は、前記現在の画像の前記4つの角と、上部と底部の水平バナーを含む、請求項8又は9に記載の方法。
  11. ビデオの現在の画像におけるロゴの存在を検出する装置であって、
    前記現在の画像における現在の候補ロゴ形状、及び前記現在の画像に先行する画像における先行の候補ロゴ形状を決定する手段(21,22,23,24,25,26)と、
    少なくとも1つの条件(21,22,23,24,25,26)が満たされた場合に前記現在の画像におけるロゴの前記存在を検出する手段(21,22,23,24,25,26)であって、当該条件が、
    前記現在の候補ロゴ境界形状、及び前記先行の候補ロゴ境界形状の中心の間の距離が第1の閾値より小さいか、又は前記現在の候補ロゴ境界形状、及び前記先行の候補ロゴ境界形状の間の重なり部分が第2の閾値より大きい、
    前記現在の候補ロゴ境界形状、及び前記現在の画像の、特性ピークの周辺にある領域を特定するための特性マスクの間の重なり部分が第3の閾値よりも大きい、
    ことである、前記検出する手段と、
    を備える、前記装置。
  12. 前記候補ロゴ境界形状は、候補ロゴ境界ボックスである、請求項11に記載の装置。
  13. ロゴの前記存在が前記ビデオの現在の画像について検出されるごとに信頼度がN増加し、他の場合にN減少する手段であって、前記信頼度が正のときに、ロゴの前記存在が前記現在の画像について最終的に検出される、手段をさらに備える、請求項12に記載の装置。
  14. Nが1に等しい、請求項13に記載の装置。
  15. 各連続の検出、又は非検出がなされた後に、Nの前記値が増加する、請求項13に記載の装置。
  16. 前記ロゴの前記存在が前記現在の画像について検出されたときに、前記現在の画像におけるロゴを決定する手段を備え、
    ロゴを決定する前記手段は、前記現在の候補ロゴ境界ボックスが特性ピークを含むかを確認し、前記確認が肯定の場合に、前記現在の候補ロゴ境界ボックスをロゴ候補境界ボックスのリストに加え、前記リストがM候補ロゴ境界ボックスを含むとき、前記現在の画像における前記ロゴが候補ロゴ境界ボックスの前記リストから計算される境界ボックスであり、他の場合に前記現在の画像における前記ロゴが前記現在の候補ロゴ境界ボックスである、請求項12から15のうちのいずれか1項に記載の装置。
  17. Mが10に等しい、請求項16に記載の装置。
  18. 請求項1から10のうちのいずれか1項による前記方法のステップを実行するためのプログラムコードの命令を含むコンピュータープログラム製品であって、前記プログラムがコンピューター上で実行される、前記コンピュータープログラム製品。
JP2013191886A 2012-09-17 2013-09-17 画像内のロゴの存在を検出する装置、及び方法 Withdrawn JP2014059875A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
EP12306113.7A EP2709038A1 (en) 2012-09-17 2012-09-17 Device and method for detecting the presence of a logo in a picture
EP12306113.7 2012-09-17

Publications (2)

Publication Number Publication Date
JP2014059875A true JP2014059875A (ja) 2014-04-03
JP2014059875A5 JP2014059875A5 (ja) 2016-11-04

Family

ID=47115668

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013191886A Withdrawn JP2014059875A (ja) 2012-09-17 2013-09-17 画像内のロゴの存在を検出する装置、及び方法

Country Status (6)

Country Link
US (1) US9311533B2 (ja)
EP (2) EP2709038A1 (ja)
JP (1) JP2014059875A (ja)
KR (1) KR20140036990A (ja)
CN (1) CN103761527A (ja)
TW (1) TW201413600A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7470645B2 (ja) 2019-12-12 2024-04-18 ベイド ユーエスエー インコーポレイテッド オブジェクト検出モデルを組み合わせるための方法、デバイス、およびシステム

Families Citing this family (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9721185B2 (en) * 2015-01-13 2017-08-01 Arris Enterprises Llc Automatic detection of logos in video sequences
CN104918107B (zh) * 2015-05-29 2018-11-02 小米科技有限责任公司 视频文件的标识处理方法及装置
US10007863B1 (en) 2015-06-05 2018-06-26 Gracenote, Inc. Logo recognition in images and videos
US20170148170A1 (en) * 2015-11-24 2017-05-25 Le Holdings (Beijing) Co., Ltd. Image processing method and apparatus
US9875548B2 (en) * 2015-12-18 2018-01-23 Ricoh Co., Ltd. Candidate list generation
WO2017192457A1 (en) 2016-05-02 2017-11-09 Focal Systems, Inc. Expedited checkout system through portable checkout units
US10169657B2 (en) * 2016-07-18 2019-01-01 Samsung Electronics Co., Ltd. Method of extracting logo mask from video stream having logo
WO2018144650A1 (en) 2017-01-31 2018-08-09 Focal Systems, Inc. Automated checkout system through mobile shopping units
CA3063176A1 (en) 2017-05-12 2018-11-15 Focal Systems, Inc. Automatic labeling of products via expedited checkout system
DE102017212426A1 (de) * 2017-07-20 2019-01-24 Robert Bosch Gmbh Verfahren und Vorrichtung zum Reduzieren einer Anzahl von Detektionskandidaten eines Objekterkennungsverfahrens
CN107730518B (zh) * 2017-09-30 2021-06-01 惠州华阳通用电子有限公司 一种基于fpga的canny算法阈值获取方法及装置
CN110490868B (zh) * 2019-08-23 2023-05-30 陈�峰 一种基于计算机视觉玉米穗粒数的无损计数方法
CN112541934B (zh) * 2019-09-20 2024-02-27 百度在线网络技术(北京)有限公司 一种图像处理方法及装置
CN111010606B (zh) * 2019-12-12 2022-02-15 北京金山云网络技术有限公司 视频处理方法和装置
US11755948B2 (en) * 2019-12-18 2023-09-12 Google Llc Attribution and generation of saliency visualizations for machine-learning models
US11783587B2 (en) * 2020-03-04 2023-10-10 Nec Corporation Deep learning tattoo match system based
CN111695540B (zh) * 2020-06-17 2023-05-30 北京字节跳动网络技术有限公司 视频边框识别方法及裁剪方法、装置、电子设备及介质
US11544509B2 (en) 2020-06-30 2023-01-03 Nielsen Consumer Llc Methods, systems, articles of manufacture, and apparatus to classify labels based on images using artificial intelligence
CN111629215B (zh) * 2020-07-30 2020-11-10 晶晨半导体(上海)股份有限公司 检测视频静态标识的方法及电子设备和存储介质

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE3632529A1 (de) 1986-09-25 1988-04-07 Basf Ag Verfahren zur herstellung von aldehyden und/oder ketonen durch umsetzung von epoxiden
EP1544792A1 (en) 2003-12-18 2005-06-22 Thomson Licensing S.A. Device and method for creating a saliency map of an image
US7599558B2 (en) * 2005-08-24 2009-10-06 Mavs Lab. Inc. Logo processing methods and circuits
JP2007299144A (ja) 2006-04-28 2007-11-15 Mitsubishi Heavy Ind Ltd ロゴ判別装置および方法ならびにプログラム
US8493510B2 (en) * 2006-12-12 2013-07-23 Time Warner Inc. Method and apparatus for concealing portions of a video screen
FR2929736A1 (fr) * 2008-04-02 2009-10-09 Thomson Licensing Sas Procede de detection de changement de scene dans une sequence d'images video.
US8374436B2 (en) * 2008-06-30 2013-02-12 Thomson Licensing Method for detecting layout areas in a video image and method for generating an image of reduced size using the detection method
EP2141658B1 (en) 2008-06-30 2013-05-01 Thomson Licensing Method for detecting layout areas in a video image and method for generating a reduced size image using the detection method
US20100189368A1 (en) * 2009-01-23 2010-07-29 Affine Systems, Inc. Determining video ownership without the use of fingerprinting or watermarks
US8175413B1 (en) * 2009-03-05 2012-05-08 Google Inc. Video identification through detection of proprietary rights logos in media

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7470645B2 (ja) 2019-12-12 2024-04-18 ベイド ユーエスエー インコーポレイテッド オブジェクト検出モデルを組み合わせるための方法、デバイス、およびシステム

Also Published As

Publication number Publication date
EP2709038A1 (en) 2014-03-19
US20140079321A1 (en) 2014-03-20
EP2709039A1 (en) 2014-03-19
CN103761527A (zh) 2014-04-30
TW201413600A (zh) 2014-04-01
KR20140036990A (ko) 2014-03-26
US9311533B2 (en) 2016-04-12

Similar Documents

Publication Publication Date Title
JP2014059875A (ja) 画像内のロゴの存在を検出する装置、及び方法
CN108009543B (zh) 一种车牌识别方法及装置
JP2014059875A5 (ja)
CN109389121B (zh) 一种基于深度学习的铭牌识别方法及系统
US8805077B2 (en) Subject region detecting apparatus
JP6240199B2 (ja) 画像における対象物の識別方法及び装置
CN111340752A (zh) 屏幕的检测方法、装置、电子设备及计算机可读存储介质
US10217083B2 (en) Apparatus, method, and program for managing articles
US8355079B2 (en) Temporally consistent caption detection on videos using a 3D spatiotemporal method
CN109446061B (zh) 一种页面检测方法、计算机可读存储介质及终端设备
US10748023B2 (en) Region-of-interest detection apparatus, region-of-interest detection method, and recording medium
US8442327B2 (en) Application of classifiers to sub-sampled integral images for detecting faces in images
CN108875531B (zh) 人脸检测方法、装置、系统及计算机存储介质
US8649612B1 (en) Parallelizing cascaded face detection
CN109948521B (zh) 图像纠偏方法和装置、设备及存储介质
CN111325717B (zh) 手机缺陷位置识别方法及设备
CN110443242B (zh) 读数框检测方法、目标识别模型训练方法及相关装置
US11741683B2 (en) Apparatus for processing labeled data to be used in learning of discriminator, method of controlling the apparatus, and non-transitory computer-readable recording medium
WO2018058573A1 (zh) 对象检测方法、对象检测装置以及电子设备
JP5027201B2 (ja) テロップ文字領域検出方法,テロップ文字領域検出装置およびテロップ文字領域検出プログラム
JPWO2014033885A1 (ja) 画像処理装置、画像処理方法および画像処理プログラム
CN115423795A (zh) 静帧检测方法、电子设备及存储介质
CN113221742B (zh) 视频分屏线确定方法、装置、电子设备、介质和程序产品
JP2016081472A (ja) 画像処理装置、画像処理方法及びプログラム
KR101015646B1 (ko) 얼굴검출장치 및 이를 이용한 얼굴검출방법

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160915

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20160915

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20161202

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20161202

A761 Written withdrawal of application

Free format text: JAPANESE INTERMEDIATE CODE: A761

Effective date: 20170119