JP2016054490A - カメラ対応装置を用いた背景シーンにおけるビデオディスプレイからのビデオ信号の検出、インデックス作成、及び比較のための装置、システム、方法、及び媒体 - Google Patents

カメラ対応装置を用いた背景シーンにおけるビデオディスプレイからのビデオ信号の検出、インデックス作成、及び比較のための装置、システム、方法、及び媒体 Download PDF

Info

Publication number
JP2016054490A
JP2016054490A JP2015204198A JP2015204198A JP2016054490A JP 2016054490 A JP2016054490 A JP 2016054490A JP 2015204198 A JP2015204198 A JP 2015204198A JP 2015204198 A JP2015204198 A JP 2015204198A JP 2016054490 A JP2016054490 A JP 2016054490A
Authority
JP
Japan
Prior art keywords
code
compact
video
real
metadata
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2015204198A
Other languages
English (en)
Inventor
アムセレム,デヴィッド
Amselem David
ハヴァ,ユヴァル
Hava Yuval
シャヴィット,アディ
Shavit Adi
シャヴィット,ダナ
Dana Shavit
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
TVTAK Ltd
Original Assignee
TVTAK Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by TVTAK Ltd filed Critical TVTAK Ltd
Publication of JP2016054490A publication Critical patent/JP2016054490A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/44Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs
    • H04N21/44008Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving operations for analysing video streams, e.g. detecting features or characteristics in the video stream
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/40Scenes; Scene-specific elements in video content
    • G06V20/46Extracting features or characteristics from the video content, e.g. video fingerprints, representative shots or key frames
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/26Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/60Control of cameras or camera modules

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Signal Processing (AREA)
  • Image Analysis (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Closed-Circuit Television Systems (AREA)
  • Studio Devices (AREA)
  • Television Signal Processing For Recording (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】カメラ対応装置を用いた、背景シーンにおけるビデオディスプレイからのビデオ信号の検出、インデックス作成及び比較のための方法を提供する。【解決手段】カメラ対応(CEN)装置184をビデオ信号面181に向け、CEN装置上で、背景シーン182におけるビデオ信号面の位置を検出し、検出されたビデオ信号面から少なくとも1つのフレームを抽出し、少なくとも1つの抽出されたフレームから少なくとも1つの画像を取得し、少なくとも1つの画像から少なくとも1つのコンパクト符号を算出し、少なくとも1つのコンパクト符号をデータベースに記憶されている少なくとも1つの記憶されたコンパクト符号と比較し、少なくとも1つのコンパクト符号と少なくとも1つの記憶されたコンパクト符号との間に少なくとも1つの一致が発見されたか否かを判定し、一致が検出されたことを通知する。【選択図】図9

Description

[関連出願の相互参照]
本特許出願は、2011年3月31日に出願された米国特許仮出願第61/469,875号の優先権を主張し、その総体が参照により本明細書に組み込まれる。
本発明は、カメラ対応装置を用いた、背景シーンにおけるビデオディスプレイからのビデオ信号の検出、インデックス作成、及び比較のための装置、システム、方法、及び媒体に関する。
対話型マルチメディア、ソーシャルネットワーキングの出現、及びカメラ対応スマートフォンや他のモバイル機器が広く普及するのに伴い、電子機器の消費者は、テクノロジーを利用して自身の日常の体験を知人(友人、血縁者、仕事上の仲間等)と共有するための新たな方法を探し求めてきた。ツイートやブログは、マルチユーザ・オンラインゲームやフォーラムと同様に、こうした方法の一例である。
こうした動向に対応するため、デジタルコンテンツの提供者及びモバイル機器の製造業者は、統合プラットフォームを、従来のメディア(音楽、ラジオ、及びテレビジョン等)の流通及びアクセスに結び付けるための手段を探してきた。テレビ放映されるコンテンツの分野においては、ユーザの視聴の好みを予定に組み込むためのオンラインTVガイド及びインターフェースが一般的となっている。しかしながら、装置がユーザの視聴しているものを知るためには、ユーザによるキーボード又はタッチパネルによる入力が必要であるという点により、個人のTV視聴活動を共有することは今もなお制限されている。
カメラ対応装置を用いた、背景シーンにおけるビデオディスプレイからのビデオ信号の検出、インデックス作成、及び比較のための装置、システム、方法、及び媒体を得ることは、望ましいことである。とりわけ、そのようなシステム、方法、及び媒体は、上述の制限を解消するものであろう。
本発明の目的は、カメラ対応装置を用いた背景シーンにおけるビデオディスプレイからのビデオ信号の検出、インデックス作成、及び比較のための装置、システム、方法、及び媒体を提供することにある。
明確を期するために、以下、一部の用語を、本明細書における使用のために特に定義する。本明細書において、「ビデオ」という用語は、進行中のシーンを表す一連の静止画の電子的な処理及び再構成の技術を指すために用いられる。本明細書において、「ビデオ信号」という用語は、テレビ受像機、コンピュータスクリーン、ビデオモニター/ディスプレイ、又は、例えば会議室におけるプレゼンテーション、教室における教育、ホームシアターにおける鑑賞、及び他のライブイベントなどにおける、ビデオプロジェクターを使用するプロジェクションスクリーン上に提示されるビデオを指すために用いられる。
本明細書において、「背景シーン」という用語は、カメラ対応(CEN)装置によってキャプチャされた画像(又は一連の画像)に含まれる任意の視覚要素を指すために用いられる。例えば、公園の画像の背景シーンには、ベンチ、ブランコ、噴水、人々、芝生、及び雲、並びに電話機、携帯ゲーム機、携帯メディア機器が含まれうる。
本明細書において、「ビデオ信号カメラキャプチャ」及び「VSCC」という用語は、リアルタイムで背景シーンにおけるビデオ信号を表示する検出面(detected surface)を指すために用いられる。例えば、ビデオ信号カメラキャプチャは、リビングルーム、会議室、又は屋外空間の背景シーンから得られうるものであり、この中では、ビデオディスプレイは、ビデオディスプレイ上のビデオ信号の表示された面を検出するためのシーンの一要素である、
本明細書において、「システム」という一般用語は、CEN又は他の装置上で(全部又は一部が)実行される、又は、例えばバックオフィスシステム若しくはクラウドベースサービスなどの遠隔システム上で(全部又は一部が)実行される、ソフトウェア(例えば、処理又は方法の実行)、ファームウェア、ハードウェアを含む、本発明の任意の実装を指すために用いられる。
更に、本明細書において、「例示的」という言葉は、実施形態及び/又は実装の例を指すために用いられ、必ずしもより望ましい使用例を伝えることを意図してはいないことに留意されたい。同様に、本明細書において、「好適」という言葉は、想定される各種の実施形態及び/又は実装からの一例を指すために用いられるものであって、必ずしもより望ましい使用例を伝えることを意図してはいない。したがって、上述より、本明細書において「例示的」及び「好適」は、多様な実施形態及び/又は実装に適用されうることが理解される。
本発明の実施形態は、CEN装置のユーザが、ただ装置のカメラをテレビ受像機又はビデオディスプレイに向けることによって、自身が視聴しているビデオ番組を伝えることを可能とする。本システムは、とりわけ、どのようなチャンネル、番組が視聴されているか、及びどのような種類の番組(テーマ別コンテンツ、プロモーション、又は広告など)が視聴されているかを数秒の間に検出し、文脈的な関連のあるコンテンツ及びサービスをユーザの装置に送信する。
本発明の一部の実施形態は、ユーザが、彼らの視聴活動及びコンテンツに対するコメントをソーシャルネットワーク上で共有することを可能とする。こうした実施形態は、CEN装置によってキャプチャされた背景シーン中のビデオ信号面から画像を抽出して、自動でクロップされた画像の取得を可能とする。使用の一例として、本発明の一部の実施形態は、同じ又は別の番組コンテンツを視聴している他者との共有のために、ユーザが自動でクロップされた画像に対してテキストによるコメントを付加することを可能とする。更なる実施形態は、ユーザが、彼らが視聴している特定の番組に対して他のユーザが投稿した全てのコメントを見ることを可能とする。他の実施形態においては、ユーザは、他のユーザとの共有のために、番組に対する自身の感情を象徴するアイコンを添付することができる。
追加的な実施形態において、ユーザは、そのユーザが視聴している特定の番組又はチャンネルに対して他のユーザが投稿した全てのコメントを見ることが可能である。一部の実装において、本システムは、特定のテレビ番組に関連するコメントの自動検索及び集約を実行し、最も関連する、及び関心を引くコメントを選択し、選択されたコメントをユーザに表示する。
本発明の一部の実施形態は、リアルタイムの視聴統計をユーザに提供する。例えば、こうした実施形態において、本システムは、TVの視聴者に対して、その地域で視聴可能な各チャンネルを視聴している本システムのユーザの割合をいつでも提供することができる。視聴率は、円グラフ又は他のグラフ表現として提示されることが可能であり、ユーザは、例えば「全てのユーザ」、「ソーシャルネットワークを通して繋がったフレンド」又は「類似のプロフィールを有する他のユーザ」を選択することによって、その割合にフィルターにかけることが可能である。
更なる実施形態において、本システムは、視聴されている番組において以前にどんなことが起こったかの(例えば、数フレーズの)簡潔な概要を装置上に表示する。一部の実施形態において、この概要は、次のようなやり方で生成される。
1.以下のa及び/又はbを介して番組のオーディオ・トラックの複写(transcription)をリアルタイムで自動的に検索する。
a.テレビ放送のデジタル・ストリームに組み込まれたサブタイトルのキャプチャ
b.以下のi及び/又はiiを含む、テレビ局のオーディオ・トラックの分析
i.話者の特定及び分類
ii.番組において話されたことのリアルタイム複写のための、スピーチ・トゥ・テキスト処理のためのオーディオ・トラックの分析、及び/又は、
2.複写からの、コンテンツの要約のために最も重要なコンテンツ断片の抽出のための、(参照コーパスにおける全般的な分布に照らした、文中の各単語の相対的重要性の判断のための)統計的分析及び言語モデルの使用。
本発明の他の実施形態は、放送されている番組のコンテンツから自動的に生成される、文脈に即した「クイズ」又は「投票」を可能とする。こうした実施形態の好適な実装において、ユーザは、番組が放送されている間にキャプチャされた複写から自動的に生成されるクイズ又は投票に参加することができる。使用の一例として、本システムは、番組のリアルタイム複写から関連する短い文を選び出し、ユーザがその短い文の発言者である番組の登場人物を当てる必要のあるクイズを作り出す。別の使用例は、ユーザが、番組の任意の登場人物の独白又は会話に評価を与え、及び/又は、感情の属性を持ったアイコンを添付して、ソーシャルネットワーク上でその評価を共有することを含む。
本発明の他の実施形態は、CEN装置上に表示された放送コンテンツ上に重ね合わされた(又はこれに近接して提示された)関連コンテンツのリアルタイム・オーバーレイを作り出すことによる、拡張現実の一様式を可能とする。例えば、番組が放送されている間に、TV番組を視聴している視聴者に対して、番組の詳細、人物の配役、クリック可能なバナー、役者の詳細、及び番組の拡張となる他の追加要素が提示されうる。こうした拡張現実オーバーレイは、放送に対応して時間と共に変化する。
本発明の他の実施形態は、TV広告の認識を可能とし、装置に即時のコールトゥアクションのためのオプションを提供する。こうした実施形態の好適な実装において、本システムは、放送されているコマーシャルをリアルタイムで特定し、装置上でユーザにコールトゥアクションのサービスを提供する。こうしたコールトゥアクション・サービスの例は、以下のものを含む。
1.ユーザに「クリック・アンド・コール」、詳細な連絡先の登録、又は追加情報を受け取るためのEメールの送信の能力を提供する、同じ広告主からのオファー。
2.ユーザにクリック・アンド・コール、詳細な連絡先の登録、又は追加情報を受け取るためのEメールの送信の能力を提供するコマーシャルで宣伝された製品又は製品カテゴリーを提示する、他の企業からのオファー。
3.ユーザの装置の位置の特定に基づき視聴者個人向けに設定された、上記サービスの地域限定オファー。
4.コマーシャルで宣伝された広告主、製品、又は製品カテゴリーに関連するプロモーション、クーポン、及び/又は電子商取引のオファーの装置上でのオファーの検索。
5.団体割引を受けるための、同じ製品又は製品カテゴリーを探す他のユーザとの共同購入の繋がり。
6.ユーザ・プロフィール、時刻、位置、並びにユーザ及び/又は装置によって提供されるその他の文脈的情報に対してコールトゥアクション・サービスがマップされた使用統計。
本発明の他の実施形態は、VSCC配信のトリガーとなる、動き反応カメラキャプチャ(Action−Response Camera−Capture)(ARCC)を可能とする。ARCCは、装置に対する関連コンテンツの配信のトリガーとして用いられるVSCCに対する(装置のセンサーの変化に基づく)ユーザの反応又は応答を含む。例えば、CEN装置は、VSCCを介して画像を検出する。ゲームの一部として、ユーザは、配信される次のコンテンツを始動させるために、課題の遂行を求められる。遂行される課題の例としては、装置のタッチスクリーンのタップ、加速度計、ジャイロスコープ、又は他の動作センサーを有する装置のシェイク、選挙における投票、及びクイズへの回答が含まれる。装置がビデオ信号面の特定領域に向けられる必要がある場合、又は装置がビデオ配信コンテンツ内の特定のオブジェクト(例えば、顔、形状及び色、ロゴ)を検出する必要がある場合にも、同様のプロセスが適用される。
本発明の実施形態は、例えば、16:9又は4:3の幾何学的な比などといった、ビデオ信号面(又はスクリーン・フレーム)の特有の識別子を利用する。本発明の実施形態は、高速なVSCC検出の実行が可能であり、これがリアルタイム実装を可能とする。更なる実施形態は、ビデオ信号面を有する背景シーンのキャプチャの間の、ユーザによるCEN装置の揺動又は移動に起因する画像のジッタを、キャプチャ安定化処理を介して補正することが可能である。
したがって、本発明によれば、背景シーンからビデオ信号カメラキャプチャ(VSCC)を取得するための方法であって、(a)カメラ対応(CEN)装置をビデオ信号面に向けるステップと、(b)装置前記CEN装置で、前記背景シーンにおける前記ビデオ信号面の位置を検出するステップと、(c)前記検出されたビデオ信号面から少なくとも1つのフレームを抽出するステップと、を含む方法が初めて提供される。
好適には、本方法は、(d)装置前記CEN装置で、前記検出されたビデオ信号面の少なくとも1つの図形標識を表示するステップを更に含む。
好適には、本方法は、(d)前記抽出するステップ中に、少なくとも1つのフレームの少なくとも1つの個別のカラー画像を、それぞれが個別の閾値を有する少なくとも2つの個別のチャネルに分割するステップと、(e)前のフレームによる前のチャネル及び前の閾値が、少なくとも1つの四角形を検出することに成功したか否かを判定するステップと、(f)前記判定するステップが成功であった場合、ステップ(h)にスキップするステップと、(g)個別の新たな閾値を有する少なくとも1つの代替の個別チャネルを選択するステップであって、少なくとも1つの代替の個別チャネルが、少なくとも1つの新たな個別チャネルか、又は個別の異なる閾値を有する前記前のチャネルである、選択するステップと、(h)前記前のチャネル及び前記前の閾値を用いて、又は少なくとも1つの代替の個別チャネル及び前記個別の閾値を用いて、少なくとも2つのチャネルのうちの1つにおいて、少なくとも1つの四角形を検出するステップと、(i)前記少なくとも1つの四角形を検出するステップが成功であった場合、どのチャネルが成功であったかの指標、及び個別の成功した閾値を記憶するステップと、(j)前記少なくとも1つの四角形を検出するステップが失敗であった場合、前記(g)〜(i)のステップを反復するステップと、(k)検出された四角形の各々の個別座標を提供するステップと、を更に含む。
最も好適には、前記少なくとも1つの四角形を検出するステップは、(i)前記カラー画像の中から、少なくとも1つの連結成分を検出するステップと、(ii)少なくとも1つの連結成分の輪郭を、少なくとも1つの第1ポリゴンで近似するステップと、(iii)少なくとも1つの第1ポリゴンが凸四角形であるか否かを判定するステップと、(iv)少なくとも1つの第1ポリゴンが凸四角形である場合に、前記記憶するステップへと進むステップと、(v)少なくとも1つの第1ポリゴンが凸四角形ではない場合に、少なくとも1つの連結成分の凸包を探し出すステップと、(vi)凸包の各々を、少なくとも1つの第2ポリゴンで近似するステップと、(vii)前記記憶するステップへと進むステップと、を含む。
最も好適には、前記判定するステップは、最初の一致が発見されると終了する。
好適には、本方法は、(d)少なくとも1つの抽出されたフレームから、少なくとも1つの画像を取得するステップと、(e)少なくとも1つの画像から、少なくとも1つのコンパクト符号(signature)を算出するステップと、(f)少なくとも1つのコンパクト符号を、データベース中の少なくとも1つの記憶されたコンパクト符号と比較するステップと、(g)少なくとも1つのコンパクト符号と少なくとも1つの記憶されたコンパクト符号との間に少なくとも1つの一致が発見されたか否かを判定するステップと、を更に含む。
最も好適には、前記判定するステップは、最初の一致が発見されると終了する。
最も好適には、本方法は、(i)前記比較するステップ及び前記判定するステップの実行のために、前記データベースを前記CEN装置に記憶させるステップを更に含む。
最も好適には、少なくとも1つの一致を提供するために、前記比較するステップ及び前記判定するステップは、少なくとも1つのコンパクト符号をリモート・エンティティに転送することによって実行される。
好適には、本方法は、(d)少なくとも2つの抽出されたフレームからビデオを生成するステップと、(e)前記ビデオから、少なくとも1つのコンパクト・ビデオ符号を算出するステップと、(f)少なくとも1つのコンパクト・ビデオ符号を、データベース中の少なくとも1つの記憶された符号と比較するステップと、(g)少なくとも1つのコンパクト・ビデオ符号と少なくとも1つの記憶された符号との間に少なくとも1つの一致が発見されたか否かを判定するステップと、を更に含む。
好適には、本方法は、(d)少なくとも1つのフレームが少なくとも1つのカラー画像であるか否かを判定するステップと、(e)少なくとも1つのフレームが少なくとも1つのカラー画像ではない場合に、初期化するステップにスキップするステップと、(f)少なくとも1つのフレームが少なくとも1つのカラー画像である場合に、少なくとも1つのカラー画像を少なくとも1つのグレースケール画像に変換するステップと、(g)少なくとも1つのグレースケール画像のために、少なくとも1つの初期値が空の符号列を初期化するステップと、(h)少なくとも1つのグレースケール画像に少なくとも1つのスケール・レベル「L」を設定するステップと、(i)少なくとも1つのグレースケール画像を、少なくとも1つの部分画像を含む、少なくとも1つのL×Lの矩形区画に分割するステップと、(j)少なくとも1つの部分画像に対する少なくとも1つの画像符号列を生成するステップと、(k)少なくとも1つの画像符号列を、少なくとも1つの初期値が空の符号列に加えるステップと、(l)少なくとも1つのスケール・レベルLの全ての値について、前記ステップ(h)〜(j)を反復するステップと、(m)少なくとも1つのスケール・レベルLの最大スケール・レベルにおいて処理を行い、完全な符号列を提供するステップと、を更に含む。
好適には、前記少なくとも1つの画像符号列を生成するステップは、(i)少なくとも1つの部分画像の左半分における左ピクセル総和が、少なくとも1つの部分画像の右半分における右ピクセル総和よりも小さいか否かを判定するステップと、(ii)前記左総和が前記右総和よりも小さい場合に、少なくとも1つの画像符号列に1ビットを加えるステップと、(iii)前記左総和が前記右総和よりも大きい又は等しい場合に、少なくとも1つの画像符号列に0ビットを加えるステップと、(iv)少なくとも1つの部分画像の上半分における個別の上ピクセル総和、及び少なくとも1つの部分画像の上半分における個別の下ピクセル総和のそれぞれについて、前記ステップ(i)〜(iii)を反復するステップと、(v)少なくとも1つの部分画像の左上4分の1及び右下4分の1における個別の第1の対角ピクセル総和、並びに少なくとも1つの部分画像の右上4分の1及び左下4分の1における個別の第2の対角ピクセル総和のそれぞれについて、前記ステップ(i)〜(iii)を反復するステップと、(vi)少なくとも1つの部分画像の中央水平部における個別の中央水平部ピクセル総和、並びに少なくとも1つの部分画像の左水平部及び右水平部における個別の側面水平部ピクセル総和のそれぞれについて、前記ステップ(i)〜(iii)を反復するステップと、(vii)少なくとも1つの区画の中央垂直部における個別の中央垂直部ピクセル総和、並びに少なくとも1つの区画の上部垂直3分の1及び下部垂直部における個別の側面垂直部ピクセル総和のそれぞれについて、前記ステップ(i)〜(iii)を反復するステップと、を含む。
好適には、本方法は、(d)前記抽出するステップ中に、少なくとも1つのフレームから少なくとも1つのグレースケール・フレームを取得するステップと、(e)少なくとも2つの垂直端部セグメント及び少なくとも1つの水平端部セグメント、又は少なくとも1つの垂直端部セグメント及び少なくとも2つの水平端部セグメントを検出するステップと、(f)前記垂直端部セグメントから、画像中心の上側に1つの終点を、及び画像中心の下側に1つの終点を有するセグメントのみを選択するステップと、(g)少なくとも1つの選択された垂直セグメントを黒色画像上に描画するステップと、(h)前記垂直端部セグメントからセグメントを選択するステップとは無関係に、前記水平端部セグメントから、画像中心の左側に1つの終点を、及び画像中心の右側に1つの終点を有するセグメントのみを選択するステップと、(i)少なくとも1つの選択された水平セグメントを前記黒色画像上に描画するステップと、(j)少なくとも1つの選択された垂直セグメントと少なくとも1つの選択された水平セグメントを接続するために、前記黒色画像に対して形態学的拡張を実行するステップと、(k)前記黒色画像から少なくとも1つの四角形を抽出するステップと、を更に含む。
最も好適には、前記黒色画像から少なくとも1つの四角形を抽出するステップは、(i)前記黒色画像の中から、少なくとも1つの連結成分を検出するステップと、(ii)少なくとも1つの連結成分の各々の輪郭を、少なくとも1つの第1ポリゴンで近似するステップと、(iii)少なくとも1つの第1ポリゴンが凸四角形であるか否かを判定するステップと、(iv)少なくとも1つの第1ポリゴンが凸四角形である場合に、少なくとも1つの第1ポリゴンを記憶するステップと、(v)少なくとも1つの第1ポリゴンが凸四角形ではない場合に、少なくとも1つの連結成分の凸包を探し出すステップと、(vi)凸包の各々を、少なくとも1つの第2ポリゴンで近似するステップと、(vii)少なくとも1つの第2ポリゴンが凸四角形であるか否かを判定するステップと、(viii)少なくとも1つの第2ポリゴンが凸四角形である場合に、少なくとも1つの第2ポリゴンを記憶するステップと、(ix)少なくとも1つの第2ポリゴンが凸四角形ではない場合に、(x)少なくとも1つの第2ポリゴンが三角形であるか否かを判定するステップと、(xi)少なくとも1つの第2ポリゴンが三角形である場合に、前記三角形の1つの角が90度に近いものであるか否かを判定するステップと、(xii)前記角が90度に近いものである場合に、前記三角形の斜辺の中点が前記黒色画像の画像中心に近いものであるか否かを判定するステップと、(xiii)前記斜辺の中点が前記画像中心に近いものである場合に、四角形を完成させるために、少なくとも1つの第2ポリゴンに第4の点を付加するステップと、(xiv)検出された四角形の各々の個別座標を提供するステップと、を含む。
本発明によれば、背景シーンからのビデオ信号カメラキャプチャ(VSCC)のVSCC符号を、ビデオストリームから生成され遠隔サーバ上に存在するリアルタイム符号と比較するための方法であって、(a)前記ビデオストリームから関連メタデータを抽出するステップと、(b)前記ビデオストリームに対応する関連ソース・メタデータを、前記ビデオストリーム以外の少なくとも1つの情報源から取得するステップと、(c)前記ビデオストリームから、少なくとも1つのコンパクト・サーバ符号を算出するステップと、(d)少なくとも1つのコンパクト・サーバ符号をデータベース中に記憶させるステップと、を含む方法が初めて提供される。
好適には、前記記憶させるステップは、少なくとも1つのコンパクト・サーバ符号を、前記関連メタデータ及び/又は前記関連ソース・メタデータと共に前記データベース中に記憶させることを含む。
好適には、本方法は、(e)少なくとも1つのコンパクト・クライアント符号を有するクライアント要求を受信したときに、少なくとも1つのコンパクト・クライアント符号を、前記データベース中の少なくとも1つの記憶されたコンパクト・サーバ符号と比較するステップと、(f)少なくとも1つのコンパクト・クライアント符号と少なくとも1つの記憶されたコンパクト・サーバ符号との間に少なくとも1つの一致が発見されたか否かを判定するステップと、(g)少なくとも1つの一致を提供することにより、前記クライアント要求に応じるステップと、を更に含む。
好適には、前記関連メタデータ及び/又は前記関連ソース・メタデータは、ビデオコンテンツ・チャネル、ビデオコンテンツ番組、番組の形式、番組の詳細、キャストの詳細、サブタイトル、関連広告、関連プロモーション、視聴者活動、視聴者コメント、視聴者評価、視聴の統計、クイズ用のコンテンツ、投票用のコンテンツ、及びコールトゥアクション用のコンテンツからなる群から選択される。
本発明によれば、背景シーンからビデオ信号カメラキャプチャ(VSCC)を取得するための装置であって、(a)前記装置上で、背景シーンにおけるビデオ信号面の位置を検出するためのカメラモジュールと、(b)処理モジュールであって、(i)前記検出されたビデオ信号面から少なくとも1つのフレームを抽出し、(ii)少なくとも1つの抽出されたフレームから少なくとも1つの画像を取得し、(iii)少なくとも1つの画像から少なくとも1つのコンパクト符号を算出するための処理モジュールと、を備える装置が初めて提供される。
本発明によれば、背景シーンからビデオ信号カメラキャプチャ(VSCC)を取得するためのシステムであって、(a)少なくとも1つのコンパクト・クライアント符号を有する少なくとも1つのクライアント要求を受信するためのサーバ・プロセッサと、(b)コンパクト・ビデオ・プロバイダ符号を生成するためのコンパクト符号ジェネレータと、(c)メタデータ・プロバイダからのメタデータを割り当てるためのメタデータ割り当てモジュールと、(d)前記コンパクト・ビデオ・プロバイダ符号を記憶するためのビデオ・インデックス・リポジトリと、(e)少なくとも1つのコンパクト・クライアント符号を、前記ビデオ・インデックス・リポジトリ内の少なくとも1つの記憶されたコンパクト・ビデオ・プロバイダ符号と比較するためのリアルタイム・コンパレータと、(f)少なくとも1つのコンパクト・クライアント符号と少なくとも1つの記憶されたコンパクト・ビデオ・プロバイダ符号との間に少なくとも1つの一致が発見されたか否かを判定するための分析モジュールと、(g)少なくとも1つの一致を提供することにより前記クライアント要求に応じるための要求実現モジュールと、を備える装置が初めて提供される。
本発明によれば、非一時的なコンピュータ可読媒体であって、前記非一時的なコンピュータ可読媒体上に実装されたコンピュータ可読コードが、(a)カメラ対応(CEN)装置上で、背景シーンにおけるビデオ信号面の位置を検出するためのプログラムコードと、(b)前記検出されたビデオ信号面から少なくとも1つのフレームを抽出するためのプログラムコードと、(c)少なくとも1つの抽出されたフレームから少なくとも1つの画像を取得するためのプログラムコードと、(d)少なくとも1つの画像から少なくとも1つのコンパクト符号を算出するためのプログラムコードと、を備える、非一時的なコンピュータ可読媒体が初めて提供される。
本発明によれば、非一時的なコンピュータ可読媒体であって、前記非一時的なコンピュータ可読媒体上に実装されたコンピュータ可読コードが、(a)少なくとも1つのコンパクト・クライアント符号を有する少なくとも1つのクライアント要求を受信するためのプログラムコードと、(b)コンパクト・ビデオ・プロバイダ符号を生成するためのプログラムコードと、(c)メタデータ・プロバイダからのメタデータを割り当てるためのプログラムコードと、(d)前記コンパクト・ビデオ・プロバイダ符号を記憶するためのプログラムコードと、(e)少なくとも1つのコンパクト・クライアント符号を、前記ビデオ・インデックス・リポジトリ内の少なくとも1つの記憶されたコンパクト・ビデオ・プロバイダ符号と比較するためのプログラムコードと、(f)少なくとも1つのコンパクト・クライアント符号と少なくとも1つの記憶されたコンパクト・ビデオ・プロバイダ符号との間に少なくとも1つの一致が発見されたか否かを判定するためのプログラムコードと、(g)少なくとも1つの一致を提供することにより前記クライアント要求に応じるためのプログラムコードと、を備える、非一時的なコンピュータ可読媒体が初めて提供される。
これらの実施形態、及び更なる実施形態は、以下の詳細な説明及び実施例によって明らかとなるであろう。
本発明は、例示のみを目的として、以下の通りの添付図面を参照して本明細書において説明される。
本発明の好適な実施形態に係る、背景シーンからビデオ信号カメラキャプチャ(VSCC)を取得するための主要処理ステップの簡略化されたフローチャートである。 本発明の好適な実施形態に係る、カメラ対応(CEN)装置上でVSCCのコンパクト画像符号を算出するための主要処理ステップの簡略化されたフローチャートである。 本発明の好適な実施形態に係る、CEN装置上でVSCCのコンパクト・ビデオ符号を算出するための主要処理ステップの簡略化されたフローチャートである。 本発明の好適な実施形態に係る、CEN装置上でVSCCの符号を他の符号と比較するための主要処理ステップの簡略化されたフローチャートである。 本発明の好適な実施形態に係る、VSCCの符号を遠隔サーバ内のビデオストリームのためにリアルタイムで生成された一群のコンパクト符号と比較するための主要処理ステップの簡略化されたフローチャートである。 本発明の好適な実施形態に係る、バックオフィス比較を実行するための主要処理ステップの簡略化されたフローチャートである。 本発明の好適な実施形態に係る、テレビ受像機又はビデオディスプレイからビデオ信号面を検出するための主要処理ステップの簡略化されたフローチャートである。 本発明の好適な実施形態に係る、テレビ受像機又はビデオディスプレイから四角形を検出するための主要処理ステップの簡略化されたフローチャートである。 本発明の好適な実施形態に係る、背景シーンからVSCCを取得するためのシステム・アーキテクチャの簡略化された概念図である。 本発明の好適な実施形態に係る、画像からコンパクト符号を生成するための主要処理ステップの簡略化されたフローチャートである。 本発明の好適な実施形態に係る、部分画像からコンパクト符号を生成するための主要処理ステップの簡略化されたフローチャートである。 本発明の別の実施形態に係る、テレビ受像機又はビデオディスプレイからビデオ信号面を検出するための主要処理ステップの簡略化されたフローチャートである。 本発明の別の実施形態に係る、テレビ受像機又はビデオディスプレイから四角形を検出するための主要処理ステップの簡略化されたフローチャートである。
本発明は、カメラ対応装置を用いた、背景シーンにおけるビデオディスプレイからのビデオ信号の検出、インデックス作成、及び比較のための装置、システム、方法、及び媒体に関する。本発明による、このような装置、方法、及び媒体の原理及び作用は、添付の詳細な説明及び図面を参照することでより理解されよう。
以下、図面を参照すると、図1は、本発明の好適な実施形態に係る、背景シーンからビデオ信号カメラキャプチャ(VSCC)を取得するための主要処理ステップの簡略化されたフローチャートである。この処理は、ユーザが、ビデオ信号を有する面が存在する背景シーン(例えば、部屋又は空間)に対してCEN装置を向けるところから開始する(ステップ2)。CEN装置は、ビデオ信号を有する面を含む空間をキャプチャする。システムは、カメラキャプチャ出力から、ビデオ信号面の位置を検出する(ステップ4)。
次いでシステムは、システムがカメラキャプチャ出力の範囲内でビデオ信号を検出したことをユーザに通知するために、検出されたビデオ信号面の上に図形標識を表示する(ステップ6)。システムは、検出されたビデオ信号面からビデオ信号のフレームを抽出する(ステップ8)。抽出されたフレームから、システムは、適正サイズにクロップされた固定画像を生成することができる。その後、この抽出されたフレームは更なる処理のために使用されることが可能である(ステップ10)。
図2は、本発明の好適な実施形態に係る、CEN装置上でVSCCのコンパクト画像符号を算出するための主要処理ステップの簡略化されたフローチャートである。この処理は、図1のVSCC処理において説明されたとおり、システムがCEN装置(例えば、スマートフォン、タブレットPC、及び他の種類のカメラを有する装置)を用いてビデオ信号面を検出及び抽出するところから開始する。システムが抽出されたフレームを生成すると、そのフレームから画像を取得することが可能となる(ステップ20)。システムは画像の視覚的特徴からコンパクト符号を局所的に(すなわち、CEN装置内で)算出し、(元の画像よりもファイルサイズが遥かに小さい)コンパクト符号でビデオを表現する(ステップ22)。
こうしたコンパクト符号を生成するための例示的実施形態は、図10及び図11を参照して説明される。かかる実施形態において、符号の比較は、よく知られたビット列の間のハミング距離(すなわち、2つのビット列の間における異なるビットの数)を用いて実行される。ハミング距離が大きいほど、ビット列間の一致は悪くなる。
ビデオ信号面のコンパクト符号は、表現されたビデオコンテンツを説明すること、インデックスを付けること、特定すること、提示すること、比較すること、及び/又は他のビデオ又はビジュアルコンテンツと一致させることを可能とする。次いで、システムはそのコンパクト符号を(局所的に、又は遠隔で利用可能な)データベース内の符号と比較する(ステップ24)。
システムは、一致する符号を検索する(ステップ26)。一致が検出された場合、装置上で実行中のアプリケーションへの通知がトリガされる(ステップ28)。一致が検出されない場合、抽出されたフレームから新たな画像を取得するために、処理がステップ20へと戻される。
多様な候補が生成されるフレームにおいて、符号は候補の各々について算出されうるものであり、マッチングは全ての候補符号に対して実行されることに留意されたい。符号の比較も同様に、ビデオ信号面から算出されたフィンガープリント符号の各々を、データベース内に記憶された全ての符号と比較することによって実行されることが可能である。これが、データベース内の符号の数と共に線形に増大するマッチング時間をもたらす。本発明の別の実装において、欲張り法によるマッチングスキームが、非常に優れた結果をもたらす。かかるスキームにおいては、十分に近接した一致が発見されると、それ以上の符号の比較は行われない。
図3は、本発明の好適な実施形態に係る、CEN装置上でVSCCのコンパクト・ビデオ符号を算出するための主要処理ステップの簡略化されたフローチャートである。この処理は、システムが図1のVSCC処理によって生成された抽出フレームからビデオを生成することから開始する(ステップ30)。システムは、生成されたビデオからコンパクト・ビデオ符号を局所的に算出し、(生成されたビデオよりもファイルサイズが遥かに小さい)コンパクト・ビデオ符号でビデオを表現する(ステップ32)。
次いで、システムは、そのコンパクト・ビデオ符号を(局所的に、又は遠隔で利用可能な)データベース内の符号と比較する(ステップ34)。システムは、一致する符号を検索する(ステップ36)。一致が検出された場合、装置上で実行中のアプリケーションへの通知がトリガされる(ステップ38)。一致が検出されない場合、新たな抽出フレームのセットからビデオを生成するために、処理がステップ30へと戻される。
多様な候補が生成されるフレームにおいて、符号は候補の各々について算出されうるものであり、マッチングは全ての候補符号に対して実行される。符合の比較も同様に、ビデオ信号面から算出されたフィンガープリント符号の各々を、データベース内に記憶された全ての符号と比較することによって実行されることが可能である。これが、データベース内の符号の数と共に線形に増大するマッチング時間をもたらす。本発明の別の実装において、欲張り法によるマッチングスキームが、非常に優れた結果をもたらす。かかるスキームにおいては、十分に近接した一致が発見されると、それ以上の符号の比較は行われない。
図4は、本発明の好適な実施形態に係る、CEN装置上でVSCCの符号を他の符号と比較するための主要処理ステップの簡略化されたフローチャートである。この処理は、システムがCEN装置上でコンパクト符号を記憶することから開始する(ステップ40)。システムは、図1のVSCC処理において説明されたとおり、CEN装置を用いてビデオ信号面を検出し、抽出する(ステップ42)。システムは、図3のビデオ符号の処理において説明されたとおり、コンパクト・ビデオ符号を算出する(ステップ44)。
システムは、最近生成されたコンパクト・ビデオ符号を、装置上に局所的に記憶された他のコンパクト・ビデオ符号と比較する(ステップ46)。システムは、一致する符号を検索する(ステップ48)。一致が発見された場合、装置上で実行中のアプリケーションへの通知がトリガされる(ステップ50)。選択的に、リスト内の符号一致からのメタデータが検索される(ステップ52)。一致が検出されない場合、処理がステップ42へと戻される。
多様な候補が生成されるフレームにおいて、符号は候補の各々について算出されうるものであり、マッチングは全ての候補符号に対して実行される。符合の比較も同様に、ビデオ信号面から算出されたフィンガープリント符号の各々を、データベース内に記憶された全ての符号と比較することによって実行されることが可能である。これが、データベース内の符号の数と共に線形に増大するマッチング時間をもたらす。本発明の別の実装において、欲張り法によるマッチングスキームが、非常に優れた結果をもたらす。かかるスキームにおいては、十分に近接した一致が発見されると、それ以上の符号の比較は行われない。
図5は、本発明の好適な実施形態に係る、VSCCの符号を、遠隔サーバ内のビデオストリームのためにリアルタイムで生成された一群のコンパクト符号と比較するための主要処理ステップの簡略化されたフローチャートである。この処理ステップの説明において、例示的なビデオストリームとしてTV配信が用いられる。この処理は、TV配信(又は他のビデオストリーム)を取得することによって開始する(ステップ60)。システムは、TV配信から関連メタデータを抽出する(ステップ62)。次いで、システムは、TV配信に対応する関連メタデータを他の情報源から抽出する(ステップ64)。
例えば、こうした関連メタデータは、電子番組ガイド、時間、番組のタイトル、サムネイル画像、番組の詳細、サブタイトル、ビデオ配信の視覚的及び音声的コンテンツにおけるオブジェクトの検出(例えば、顔、ビデオ内に表示される文章、特定のオブジェクト、製品表示、ロゴ、キーワード、プロモーション、コマーシャル、及びジングル)を含むことが可能である。
TV配信からフィンガープリント符号が算出され(ステップ66)、選択的に、そのフィンガープリント符号に関連メタデータが追加される(ステップ68)。その後、フィンガープリント符号は関連メタデータと共にデータベース内に記憶される(ステップ70)。その後、システムは、この処理をステップ62に戻って繰り返す。
図6は、本発明の好適な実施形態に係る、バックオフィス比較を実行するための主要処理ステップの簡略化されたフローチャートである。システムは、はじめに、ビデオ配信から(例えば、デジタルビデオ・テレビ放送、ケーブルTV,衛星TV,オンライン・ストリーミング・チャンネル、DVD,又は任意の他のビデオ源から)ビデオ信号を受信する。この処理は、システムが比較のためのクライアントからの要求を受信することから開始する(ステップ80)。
次いで、システムは、(図3の処理を介して)装置上で生成されたコンパクト・ビデオ符号を、(図5の処理を介して)関連メタデータを含むビデオ配信から算出されたフィンガープリント符号と共に算出する(ステップ84)。システムは装置に対してメタデータを送信し、要求からの符号がデータベース内の符号と比較される(ステップ86)。システムは一致する符号を検索する(ステップ88)。一致が発見された場合、フィンガープリント符号に対応する関連メタデータがクライアントに送信される(ステップ90)。一致が発見されない場合、「一致なし」の通知メッセージがクライアントに送信される(ステップ92)。
図7は、本発明の好適な実施形態に係る、テレビ受像機又はビデオディスプレイからビデオ信号面を検出するための主要処理ステップの簡略化されたフローチャートである。図7は、ビデオ信号面の検出及び抽出のための例示的な実施形態を表す。同じ結果を得るために他のアプローチが実装されうることに留意されたい。
この処理は、システムが、図1のVSCC処理において説明されたとおり、CEN装置を用いてビデオ信号面を検出及び抽出することから開始する(ステップ100)。カラー画像は複数チャネルに分割される(ステップ102)。システムは、前のフレームに対する検出が成功であったかどうかを判定する(ステップ104)。検出が成功ではなかった場合、新たなチャネル及び閾値が選択される(ステップ106)。システムは、フレーム内で四角形の検出を試み(ステップ108)、四角形が検出されたか否かを確認する(ステップ110)。ステップ108における四角形の抽出は、1つ以上の候補四角形を生成しうることに留意されたい。
四角形が検出されない場合、システムは、新たなチャネル及び閾値を選択するかどうかを決定する(ステップ112)。システムは、ステップ106へと戻るか、又は「四角形は発見されず」のメッセージを返す(ステップ114)。ステップ104におけるフレーム検出が成功であった場合、システムは、前のフレームから記憶されたチャネル及び閾値を使用し(ステップ116)、処理はステップ108へと続く。ステップ110において四角形が検出された場合、システムは、成功したチャネル及び閾値を記憶し(ステップ118)、四角形の座標を返す(ステップ120)。
図8は、本発明の好適な実施形態に係る、テレビ受像機又はビデオディスプレイから四角形を検出するための主要処理ステップの簡略化されたフローチャートである。図8は、四角形の検出のための例示的な実施形態を表す。同様の結果を得るために他のアプローチが実装されうることに留意されたい。図12及び図13は、TV又はビデオディスプレイに対応する四角形の抽出のための別の実施形態を提供する。
図8の処理は、システムが選択されたカラー・チャネル「C」及び閾値「T」を取得することから開始する(ステップ130)。チャネルCは閾値Tで閾値処理され(ステップ132)、得られた二値画像における連結成分(例えば、画像処理の文献で用いられるような、接触し隣接する前景ピクセルのクラスター)が検出される(ステップ134)。次いで、全ての連結成分が反復して処理され(ステップ136)、各連結成分の輪郭がポリゴンで近似される(ステップ138)。ステップ138は、1つ以上の候補ポリゴンを生成しうる。
次いで、システムは、ポリゴンが凸四角形であるか否かを判定する(ステップ140)。ポリゴンが凸四角形ではない場合、システムは、連結成分の(計算幾何学で用いられるような)凸包を探し出し(ステップ142)、その凸包をポリゴンで近似する(ステップ144)。システムは、そのポリゴンが凸四角形であるか否かを確認する(ステップ146)。そのポリゴンが凸四角形ではない場合、システムは、処理ループの中に連結成分が残っているか否かを確認する(ステップ148)。処理ループ中に連結成分が残っている場合、処理はステップ138へと戻る。
ステップ140又はステップ146において、ポリゴンが凸四角形である場合、システムは、検出された四角形を記憶し(ステップ150)、「欲張り法」(すなわち、最初に検出された凸四角形のみの検索)がアクティブであるかどうかを判定する(ステップ152)。欲張り法がアクティブではない場合、処理はステップ148へと続く。欲張り法がアクティブである場合、又はステップ148において処理ループ中に連結成分が残っていない場合、システムは、任意の発見された四角形の座標を返す(ステップ154)。
図9は、本発明の好適な実施形態に係る、背景シーンからVSCCを取得するためのシステム・アーキテクチャの簡略化された概念図である。放送局160(例えば、TV、ケーブル、及び衛星)は、バックオフィスシステム166に対して、送信信号A及びBのそれぞれを介して、ビデオ配信162(例えば、DVB−T、ATSC、及びTV)及びメタデータ164(例えば、電子番組ガイド、及びサブタイトル)を伝送する。バックオフィスシステム166は、コンパクト符号を算出及び記憶するためのコンパクト符号ジェネレータ168、関連メタデータを割り当てるためのメタデータ割り当てモジュール170、種々のデータベース(例えば、番組インデックス・データベース174、アド・インデックス・データベース176、及び視聴者/ビネット・インデックス・データベース178)を有するビデオ・インデックス・リポジトリ172、及び、リアルタイム・コンパレータ180を含む。ビネットとは、映画の予告編などの短いビデオクリップである。
背景シーン182におけるビデオディスプレイ181は、放送局160のコンテンツを表示する。CEN装置184は、送信信号Cを介して、ビデオディスプレイ181を含む背景シーン182をキャプチャする。CEN装置184は、表示されたコンテンツを検出し、コンテンツからフレームを抽出し、フレームのコンパクト符号を算出する。その後、CEN装置184は、送信信号Dを介して、コンパクト符号をリアルタイム・コンパレータ180に送信する。
図9における、ビデオディスプレイ181及びCEN装置184のディスプレイの拡大図は、コンテンツのキャプチャされた画像をフレームへと処理するためにビデオディスプレイ181から検出され、CEN装置184上の背景シーン182から抽出された四角形186を示す。次いで、リアルタイム・コンパレータ180が割り当てられた関連メタデータをCEN装置184に伝送し、この関連メタデータは、画像と結合されて、ソーシャルネットワークにおいてユーザの知人と共有されることが可能である。
図10は、本発明の好適な実施形態に係る、画像からコンパクト符号を生成するための主要処理ステップの簡略化されたフローチャートである。この処理は、システムがCEN装置からフレームを取得し(ステップ190)、そのフレームがカラー画像であるか否かを判定することから開始する(ステップ192)。フレームがカラー画像である場合、システムはそのフレームをグレースケール画像に変換する(ステップ194)。そのフレームがカラー画像ではない場合、又はフレームをグレースケール画像へと変換した後、システムは空の符号列「S」を初期化する(ステップ196)。
次いで、システムは、スケール・レベル「L」を1に設定し(ステップ198)、画像をL×Lの矩形部分画像に分割し(ステップ200)、全ての部分画像を反復的に処理し(ステップ202)、部分画像の各々に対して符号列「K」を生成し(ステップ204)、SにKを付加する(ステップ206)。次いで、システムは、処理ループの中に部分画像が残っているか否かを判定する(ステップ208)。処理ループ中に部分画像が残っている場合、処理はステップ204へと戻る。処理ループ中に部分画像が残っていない場合、システムは、Lが使用のための最大スケール・レベルに等しいかどうかを確認する(ステップ210)。Lが最大スケール・レベルに等しいものではない場合、システムは、Lに1を加え(ステップ212)、ステップ200に戻る。Lが最大スケール・レベルに等しい場合、システムは、完全な符号列Sを返す(ステップ214)。
使用のための最大スケール・レベルは、入力画像の解像度及びキャプチャの際に関心を引かれた細部の量に基づいて選択されることが可能である。一部の例示的な実装においては、最大スケール・レベルが6のときに非常に優れた結果が得られた。
(図5に関して説明されたように)フィンガープリント符号が遠隔サーバに送信されるときは常に、フィンガープリント符号は送信の前に符号化されうることに留意されたい。この符号化は所望のプラットフォームに応じて決まり、様々な利点をもたらす。一例として、図10に関して説明されたようなビットの二進列の場合を考える。可能な送信符号化は、圧縮、文字列表現(縮小された文字セット、例えばANSI ASCIIの128文字中の64又は85文字を用いるものであり、人間に解読可能かつプラットフォーム独立の形式でコンパクトに表現されうる)、又はXML若しくはJSONなどのテキストベースのデータ形式を含みうるが、これらに限定されるものではない。また、テキストベースのデータ形式の場合、その文字符号化は、選択された形式に特有の特殊文字を回避しうる。選択的に、プラットフォーム依存又はプラットフォーム独立のいずれかでありうる二進符号化も用いられうる。
図11は、本発明の好適な実施形態に係る、部分画像からコンパクト符号を生成するための主要処理ステップの簡略化されたフローチャートである。この処理は、システムが部分画像領域を取得し(ステップ220)、空の符号列「K」を初期化することから開始する(ステップ222)。次いで、システムは、左半分のピクセル総和が右半分のピクセル総和よりも小さいかどうかを判定する(ステップ224)。
左半分のピクセル総和が右半分のピクセル総和よりも小さいものではない場合、システムはKに0ビットを付加し(ステップ226)、ステップ230へと続く。左半分のピクセル総和が右半分のピクセル総和よりも小さい場合、システムはKに1ビットを付加し(ステップ228)、ステップ230へと続く。
次いで、システムは、上半分のピクセル総和が下半分のピクセル総和よりも小さいかどうかを判定する(ステップ230)。上半分のピクセル総和が下半分のピクセル総和よりも小さいものではない場合、システムはKに0ビットを付加し(ステップ232)、ステップ236へと続く。上半分のピクセル総和が下半分のピクセル総和よりも小さい場合、システムはKに1ビットを付加し(ステップ234)、ステップ236へと続く。
次いで、システムは、左上4分の1及び右下4分の1のピクセル総和が右上4分の1及び左下4分の1のピクセル総和よりも小さいかどうかを判定する(ステップ236)。左上4分の1及び右下4分の1のピクセル総和が右上4分の1及び左下4分の1のピクセル総和よりも小さいものではない場合、システムはKに0ビットを付加し(ステップ238)、ステップ242へと続く。左上4分の1及び右下4分の1のピクセル総和が右上4分の1及び左下4分の1のピクセル総和よりも小さい場合、システムはKに1ビットを付加し(ステップ240)、ステップ242へと続く。
次いで、システムは、水平3分の1の中央部のピクセル総和が水平3分の1の左部及び右部のピクセル総和よりも小さいかどうかを判定する(ステップ242)。水平3分の1の中央部のピクセル総和が水平3分の1の左部及び右部のピクセル総和よりも小さいものではない場合、システムはKに0ビットを付加し(ステップ244)、ステップ248へと続く。水平3分の1の中央部のピクセル総和が水平3分の1の左部及び右部のピクセル総和よりも小さい場合、システムはKに1ビットを付加し〈ステップ246〉、ステップ248へと続く。
次いで、システムは、垂直3分の1の中央部のピクセル総和が垂直3分の1の上部及び下部のピクセル総和よりも小さいかどうかを判定する(ステップ248)。垂直3分の1の中央部のピクセル総和が垂直3分の1の上部及び下部のピクセル総和よりも小さいものではない場合、システムはKに0ビットを付加し(ステップ250)、ステップ254へと続く。垂直3分の1の中央部のピクセル総和が垂直3分の1の上部及び下部のピクセル総和よりも小さい場合、システムはKに1ビットを付加し(ステップ252)、二進ビット列である符号列Kを返す(ステップ254)。
図12は、本発明の好適な実施形態に係る、テレビ受像機又はビデオディスプレイからビデオ信号面を検出するための主要処理ステップの簡略化されたフローチャートである。この処理は、システムが装置からグレースケール・フレームを取得し(ステップ260)、垂直端部セグメント(ステップ262)及び水平端部セグメント(ステップ264)を検出することから開始する。ステップ262及びステップ264、並びに後続の接続処理ステップは、(どれか1つが最初に実行されるように)連続的に、又は同時に実行されることが可能である。
次いで、システムは、画像中心の上側及び下側に1つずつの終点を有する垂直端部セグメントのみを選択し(ステップ266)、画像中心の左側及び右側に1つずつの終点を有する水平端部セグメントのみを選択する(ステップ268)。次いで、システムは、選択された垂直セグメントを黒色画像「I」上に描画し(ステップ270)、選択された水平セグメントを画像I上に描画する(ステップ272)。次いで、システムは、セグメントの線を接続するために形態学的拡張を実行し(ステップ274)、四角形を抽出する(ステップ276)。ステップ276は、1つ以上の候補四角形を生成しうる。ステップ276の四角形抽出のための詳細な処理フローは、以下に図13に関連して説明される。
図13は、本発明の別の実施形態に係る、テレビ受像機又はビデオディスプレイから四角形を検出するための主要処理ステップの簡略化されたフローチャートである。この処理は、システムが、図12に関連して説明された選択された端部と共に二値画像を取得することから開始する(ステップ280)。システムは、この二値画像中の連結成分を検出し(ステップ282)、全ての連結成分を反復的に処理し(ステップ284)、連結成分の輪郭をポリゴンで近似する(ステップ286)。ステップ286は、1つ以上の候補ポリゴンを生成しうる。
次いで、システムは、ポリゴンが凸四角形であるかどうかを判定する(ステップ288)。ポリゴンが凸四角形である場合、処理はステップ304へと続く。ポリゴンが凸四角形ではない場合、システムは各連結成分の輪郭の凸包を探し出し(ステップ290)、その凸包をポリゴンで近似する(ステップ292)。
次いで、システムは、そのポリゴンが凸四角形であるかどうかを判定する(ステップ294)。そのポリゴンが凸四角形である場合、処理はステップ304へと続く。そのポリゴンが凸四角形ではない場合、システムはそのポリゴンが三角形であるかどうかを判定する(ステップ296)。そのポリゴンが三角形ではない場合、処理はステップ306へと続く。そのポリゴンが三角形である場合、システムは、角のうちの1つが90度に近いものであるかどうかを判定する(ステップ298)。90度に近い角がない場合、処理はステップ306へと続く。
角の1つが90度に近いものである場合、システムは、斜辺の中点が画像中心に近いものであるかどうかを判定する(ステップ300)。斜辺の中点が画像中心に近いものではない場合、処理はステップ306へと続く。斜辺の中点が画像中心に近いものである場合、システムは、四角形(例えば、平行四辺形)を完成させるために第4の点を付加し(ステップ302)、検出された四角形を記憶する(ステップ304)。
次いで、システムは、処理ループの中に連結成分が残っているかどうかを判定する(ステップ306)。処理ループ中に連結成分が残っている場合、処理はステップ286へと戻る。処理ループ中に連結成分が残っていない場合、システムは任意の発見された四角形の座標を返す(ステップ308)。
本発明の一部の実装において、サブリニア・マッチングを提供することが可能である。ツリー型のデータ構造は、対数時間検索及びマッチングを提供可能である。二進ビット列符号の場合、文献に説明されるような適切な候補(例えば、ハミング距離及びメトリック・ツリー(オンライン資料Wikipediaの「Metric_tree」の下のリストを参照されたい))を用いて距離メトリックが実装されることが可能である。他の実装においては、カバー・ツリー・データ構造が非常に優れた結果をもたらした(オンライン資料Wikipediaの「Cover_tree」の下のリストの、−Alina Beygelzimer, Sham Kakade, and John Langford, Cover Trees for Nearest Neighbor, ICML 2006を参照されたい)。
限られた数の実施形態に関連して本発明が説明されたが、本発明の多くの変形、修正、及び他の応用が行われうることが理解されよう。

Claims (9)

  1. リアルタイムビデオストリーム内のコンテンツ認識の方法であって、前記方法が、
    (a)前記リアルタイムビデオストリームから関連メタデータを抽出するステップと、
    (b)前記リアルタイムビデオストリームに対応する他のソース・メタデータを、前記リアルタイムビデオストリーム以外の源から取得するステップと、
    (c)前記リアルタイムビデオストリームからフィンガープリント符号を算出するステップと、
    (d)前記フィンガープリント符号並びに対応する関連メタデータ及びソース・メタデータをデータベース中に記憶させるステップと、
    (e)前記リアルタイムビデオストリームを装置上で受信するステップと、
    (f)コンパクト・フィンガープリント符号を前記装置上で算出するステップと、
    (g)前記装置からのコンパクト・ビデオ符号を、前記データベース上に記憶されたフィンガープリント符号と比較するステップと、
    (h)前記コンパクト・ビデオ符号と記憶されたフィンガープリント符号との間に一致が発見されるときに、前記関連メタデータ及びソース・メタデータを前記装置に伝送するステップと、
    を含む、方法。
  2. 前記関連メタデータが、電子番組ガイド、番組のタイトル、サムネイル画像、番組の詳細、サブタイトル、ビデオコンテンツ内で検出されたオブジェクト及びオーディオコンテンツ内で検出されたオブジェクトからなる群から選択される、請求項1に記載の方法。
  3. 前記ビデオコンテンツ内で検出されたオブジェクトが、顔、表示された文章、表示された物理オブジェクト、製品表示、ロゴ、キーワード、プロモーション及びコマーシャルを含む、請求項2に記載の方法。
  4. 前記関連メタデータ及びソース・メタデータからの前記リアルタイムビデオストリームに関する識別情報を表示するステップをさらに含む、請求項1に記載の方法。
  5. 文脈的に関連するコンテンツを前記装置に配信するステップをさらに含む、請求項1に記載の方法。
  6. 文脈的に関連するサービスを前記装置に配信するステップをさらに含む、請求項1に記載の方法。
  7. リアルタイムビデオストリーム内のコンテンツを識別するためのシステムであって、前記システムが、
    (a)コンパクト・ビデオ符号をユーザ装置から受信するためのプロセッサと、
    (b)前記コンパクト・ビデオ符号及び関連するメタデータを記憶させるためのデータベースと、
    (c)前記コンパクト・ビデオ符号を、前記データベース上に記憶されたビデオ符号と比較するためのコンパレータと、
    (d)前記コンパクト・ビデオ符号と前記データベース上に記憶されたビデオ符号との間に一致が発見されるときに、前記関連するメタデータを前記ユーザ装置に伝送するための伝送器と、
    を備える、システム。
  8. 前記ユーザ装置が、
    (a)前記リアルタイムビデオストリームに関する画像データを受信するためのカメラモジュールと、
    (b)コンパクト符号を生成するためのコンパクト符号ジェネレータと、
    (c)前記コンパクト符号を前記プロセッサに伝送するための伝送器と、
    (d)データを前記プロセッサから受信するための受信器と、
    を備える、請求項7に記載のシステム。
  9. 前記ユーザ装置が、前記プロセッサから受信されたデータの関数として、文脈的に関連する情報をユーザに表示するためのディスプレイを有する、請求項7に記載のシステム。
JP2015204198A 2011-03-31 2015-10-16 カメラ対応装置を用いた背景シーンにおけるビデオディスプレイからのビデオ信号の検出、インデックス作成、及び比較のための装置、システム、方法、及び媒体 Pending JP2016054490A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US201161469875P 2011-03-31 2011-03-31
US61/469,875 2011-03-31

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2014501803A Division JP2014512128A (ja) 2011-03-31 2012-04-01 カメラ対応装置を用いた背景シーンにおけるビデオディスプレイからのビデオ信号の検出、インデックス作成、及び比較のための装置、システム、方法、及び媒体

Publications (1)

Publication Number Publication Date
JP2016054490A true JP2016054490A (ja) 2016-04-14

Family

ID=46932009

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2014501803A Pending JP2014512128A (ja) 2011-03-31 2012-04-01 カメラ対応装置を用いた背景シーンにおけるビデオディスプレイからのビデオ信号の検出、インデックス作成、及び比較のための装置、システム、方法、及び媒体
JP2015204198A Pending JP2016054490A (ja) 2011-03-31 2015-10-16 カメラ対応装置を用いた背景シーンにおけるビデオディスプレイからのビデオ信号の検出、インデックス作成、及び比較のための装置、システム、方法、及び媒体

Family Applications Before (1)

Application Number Title Priority Date Filing Date
JP2014501803A Pending JP2014512128A (ja) 2011-03-31 2012-04-01 カメラ対応装置を用いた背景シーンにおけるビデオディスプレイからのビデオ信号の検出、インデックス作成、及び比較のための装置、システム、方法、及び媒体

Country Status (6)

Country Link
US (3) US9602870B2 (ja)
EP (1) EP2691919A4 (ja)
JP (2) JP2014512128A (ja)
KR (1) KR20140043070A (ja)
CN (1) CN103797494A (ja)
WO (1) WO2012131653A2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6304847B1 (ja) * 2017-04-28 2018-04-04 株式会社コナミデジタルエンタテインメント サーバ装置、及びそれに用いられるコンピュータプログラム

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014512128A (ja) * 2011-03-31 2014-05-19 ティーヴィータック リミテッド カメラ対応装置を用いた背景シーンにおけるビデオディスプレイからのビデオ信号の検出、インデックス作成、及び比較のための装置、システム、方法、及び媒体
US9515904B2 (en) * 2011-06-21 2016-12-06 The Nielsen Company (Us), Llc Monitoring streaming media content
US9165188B2 (en) 2012-01-12 2015-10-20 Kofax, Inc. Systems and methods for mobile image capture and processing
US20130276012A1 (en) * 2012-04-11 2013-10-17 2Nd Screen Limited Method, Apparatus and Computer Program for Triggering an Event
JP5999582B2 (ja) * 2012-10-11 2016-09-28 カシオ計算機株式会社 情報出力装置及びプログラム
US10127636B2 (en) 2013-09-27 2018-11-13 Kofax, Inc. Content-based detection and three dimensional geometric reconstruction of objects in image and video data
US10075484B1 (en) * 2014-03-13 2018-09-11 Issuu, Inc. Sharable clips for digital publications
US9613448B1 (en) 2014-03-14 2017-04-04 Google Inc. Augmented display of information in a device view of a display screen
US9531999B2 (en) 2014-04-14 2016-12-27 Ricoh Co., Ltd. Real-time smart display detection system
US9760788B2 (en) * 2014-10-30 2017-09-12 Kofax, Inc. Mobile document detection and orientation based on reference object characteristics
US10242285B2 (en) 2015-07-20 2019-03-26 Kofax, Inc. Iterative recognition-guided thresholding and data extraction
US10467465B2 (en) 2015-07-20 2019-11-05 Kofax, Inc. Range and/or polarity-based thresholding for improved data extraction
US9749685B2 (en) 2015-07-23 2017-08-29 Echostar Technologies L.L.C. Apparatus, systems and methods for accessing information based on an image presented on a display
US10511892B2 (en) * 2016-12-30 2019-12-17 DISH Technologies L.L.C. Systems and methods for facilitating content discovery based on augmented context
WO2018203351A1 (en) * 2017-05-05 2018-11-08 Vidhi Techinnovation Opportunities Network Private Limited A method and system for extraction of event data from user devices
US10803350B2 (en) 2017-11-30 2020-10-13 Kofax, Inc. Object detection and image cropping using a multi-detector approach

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006285654A (ja) * 2005-03-31 2006-10-19 Dainippon Printing Co Ltd 商品情報検索システム

Family Cites Families (32)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5436653A (en) * 1992-04-30 1995-07-25 The Arbitron Company Method and system for recognition of broadcast segments
DE69635101T2 (de) * 1995-11-01 2006-06-01 Canon K.K. Verfahren zur Extraktion von Gegenständen und dieses Verfahren verwendendes Bildaufnahmegerät
US7421723B2 (en) 1999-01-07 2008-09-02 Nielsen Media Research, Inc. Detection of media links in broadcast signals
JP2000285654A (ja) 1999-03-31 2000-10-13 Sony Corp データ記録装置及びデータの記録方法
US6469749B1 (en) 1999-10-13 2002-10-22 Koninklijke Philips Electronics N.V. Automatic signature-based spotting, learning and extracting of commercials and other video content
JP3884226B2 (ja) 2000-10-10 2007-02-21 オリンパス株式会社 撮像システム
US20030107592A1 (en) * 2001-12-11 2003-06-12 Koninklijke Philips Electronics N.V. System and method for retrieving information related to persons in video programs
JP4349004B2 (ja) * 2003-06-16 2009-10-21 日本電気株式会社 テレビ受像機検出装置および方法
JP2006085654A (ja) 2004-09-14 2006-03-30 Bizmax:Kk 短期就労者・パート・アルバイトのカードシステム
CN101010695A (zh) * 2005-06-30 2007-08-01 奥林巴斯株式会社 检索系统和检索方法
JP2009505477A (ja) * 2005-08-12 2009-02-05 エヌエックスピー ビー ヴィ ディジタル画像安定化のための方法及びシステム
JP2007049584A (ja) 2005-08-12 2007-02-22 Casio Comput Co Ltd 宣伝支援システム及びプログラム
WO2007053112A1 (en) 2005-11-07 2007-05-10 Agency For Science, Technology And Research Repeat clip identification in video data
US20070136741A1 (en) 2005-12-09 2007-06-14 Keith Stattenfield Methods and systems for processing content
US20080066098A1 (en) 2006-08-25 2008-03-13 Skyclix, Inc. Phone-based targeted advertisement delivery
US8174555B2 (en) * 2007-05-30 2012-05-08 Eastman Kodak Company Portable video communication system
US8253770B2 (en) 2007-05-31 2012-08-28 Eastman Kodak Company Residential video communication system
US8676273B1 (en) * 2007-08-24 2014-03-18 Iwao Fujisaki Communication device
US20090083781A1 (en) * 2007-09-21 2009-03-26 Microsoft Corporation Intelligent Video Player
GB2460844B (en) 2008-06-10 2012-06-06 Half Minute Media Ltd Automatic detection of repeating video sequences
CN101299269A (zh) * 2008-06-13 2008-11-05 北京中星微电子有限公司 静止场景的标定方法及装置
EP2332328A4 (en) 2008-08-18 2012-07-04 Ipharro Media Gmbh PROVIDING ADDITIONAL INFORMATION
US20100302376A1 (en) * 2009-05-27 2010-12-02 Pierre Benoit Boulanger System and method for high-quality real-time foreground/background separation in tele-conferencing using self-registered color/infrared input images and closed-form natural image matting techniques
JP5314521B2 (ja) * 2009-07-22 2013-10-16 共同印刷株式会社 画像処理システム及び画像処理方法
US20110067066A1 (en) 2009-09-14 2011-03-17 Barton James M Multifunction Multimedia Device
CN101840422A (zh) 2010-04-09 2010-09-22 江苏东大金智建筑智能化系统工程有限公司 基于目标特征和报警行为的智能视频检索系统和方法
EP2569721A4 (en) * 2010-05-14 2013-11-27 Datalogic Adc Inc SYSTEMS AND METHODS FOR OBJECT DETECTION USING A LARGE DATABASE
US8332429B2 (en) * 2010-06-22 2012-12-11 Xerox Corporation Photography assistant and method for assisting a user in photographing landmarks and scenes
US8781152B2 (en) * 2010-08-05 2014-07-15 Brian Momeyer Identifying visual media content captured by camera-enabled mobile device
JP2014512128A (ja) * 2011-03-31 2014-05-19 ティーヴィータック リミテッド カメラ対応装置を用いた背景シーンにおけるビデオディスプレイからのビデオ信号の検出、インデックス作成、及び比較のための装置、システム、方法、及び媒体
GB201307116D0 (en) * 2013-04-18 2013-05-29 Mbda Uk Ltd Imaging apparatus and method
US10116884B2 (en) * 2015-04-05 2018-10-30 Hema Imaging Llc Systems and approaches for thermal imaging

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006285654A (ja) * 2005-03-31 2006-10-19 Dainippon Printing Co Ltd 商品情報検索システム

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6304847B1 (ja) * 2017-04-28 2018-04-04 株式会社コナミデジタルエンタテインメント サーバ装置、及びそれに用いられるコンピュータプログラム
WO2018198945A1 (ja) * 2017-04-28 2018-11-01 株式会社コナミデジタルエンタテインメント サーバ装置、及びそれに用いられるコンピュータプログラム

Also Published As

Publication number Publication date
WO2012131653A3 (en) 2012-11-29
US20170150210A1 (en) 2017-05-25
US9860593B2 (en) 2018-01-02
EP2691919A4 (en) 2015-04-15
EP2691919A2 (en) 2014-02-05
CN103797494A (zh) 2014-05-14
US9602870B2 (en) 2017-03-21
US20140020005A1 (en) 2014-01-16
JP2014512128A (ja) 2014-05-19
WO2012131653A2 (en) 2012-10-04
KR20140043070A (ko) 2014-04-08
US20180077452A1 (en) 2018-03-15

Similar Documents

Publication Publication Date Title
US9860593B2 (en) Devices, systems, methods, and media for detecting, indexing, and comparing video signals from a video display in a background scene using a camera-enabled device
US10375451B2 (en) Detection of common media segments
US9723335B2 (en) Serving objects to be inserted to videos and tracking usage statistics thereof
CN107846561B (zh) 确定和显示上下文定向内容的方法及系统
US20120072936A1 (en) Automatic Customized Advertisement Generation System
US11659255B2 (en) Detection of common media segments
KR102246305B1 (ko) 증강 미디어 서비스 제공 방법, 장치 및 시스템
US20150227780A1 (en) Method and apparatus for determining identity and programing based on image features
US10726443B2 (en) Deep product placement
KR101895846B1 (ko) 소셜 네트워킹 툴들과의 텔레비전 기반 상호작용의 용이화
US20150199995A1 (en) Modular content generation, modification, and delivery system
US9648357B2 (en) Method and device for providing a video stream for an object of interest
KR101221540B1 (ko) 인터랙티브 미디어 매핑 시스템 및 그 방법
US11979645B1 (en) Dynamic code integration within network-delivered media
KR101380963B1 (ko) 관련 정보 제공 시스템 및 제공 방법

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20160913

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20170418