JP2013525916A - コンテンツ検出、検索、および、情報集約によるオンラインビデオの充実 - Google Patents

コンテンツ検出、検索、および、情報集約によるオンラインビデオの充実 Download PDF

Info

Publication number
JP2013525916A
JP2013525916A JP2013507976A JP2013507976A JP2013525916A JP 2013525916 A JP2013525916 A JP 2013525916A JP 2013507976 A JP2013507976 A JP 2013507976A JP 2013507976 A JP2013507976 A JP 2013507976A JP 2013525916 A JP2013525916 A JP 2013525916A
Authority
JP
Japan
Prior art keywords
additional information
online video
feature
features
text
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2013507976A
Other languages
English (en)
Other versions
JP2013525916A5 (ja
JP5781601B2 (ja
Inventor
メイ タオ
ファ シーアン−シェン
リー シペン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Microsoft Corp
Original Assignee
Microsoft Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Microsoft Corp filed Critical Microsoft Corp
Publication of JP2013525916A publication Critical patent/JP2013525916A/ja
Publication of JP2013525916A5 publication Critical patent/JP2013525916A5/ja
Application granted granted Critical
Publication of JP5781601B2 publication Critical patent/JP5781601B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/40Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/73Querying
    • G06F16/735Filtering based on additional data, e.g. user or group profiles
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/40Scenes; Scene-specific elements in video content
    • G06V20/46Extracting features or characteristics from the video content, e.g. video fingerprints, representative shots or key frames
    • G06V20/47Detecting features for summarising video content
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/40Scenes; Scene-specific elements in video content
    • G06V20/49Segmenting video sequences, i.e. computational techniques such as parsing or cutting the sequence, low-level clustering or determining units such as shots or scenes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/45Management operations performed by the client for facilitating the reception of or the interaction with the content or administrating data related to the end-user or to the client device itself, e.g. learning user preferences for recommending movies, resolving scheduling conflicts
    • H04N21/462Content or additional data management, e.g. creating a master electronic program guide from data received from the Internet and a Head-end, controlling the complexity of a video stream by scaling the resolution or bit-rate based on the client capabilities
    • H04N21/4622Retrieving content or additional data from different sources, e.g. from a broadcast channel and the Internet
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/472End-user interface for requesting content, additional data or services; End-user interface for interacting with content, e.g. for content reservation or setting reminders, for requesting event notification, for manipulating displayed content
    • H04N21/4722End-user interface for requesting content, additional data or services; End-user interface for interacting with content, e.g. for content reservation or setting reminders, for requesting event notification, for manipulating displayed content for requesting additional data associated with the content

Abstract

多くのインターネットユーザは、オンラインビデオを通してコンテンツを視聴する。例えば、ユーザは、映画、テレビ番組、音楽ビデオ、および/または、ホームメイドビデオを視聴する場合がある。オンラインビデオを視聴しているユーザに追加情報を提供することは、有利であると思われる。残念なことに、現在の技術の多くでは、外部ソースからオンラインビデオに関する追加情報を提供できないと思われる。従って、オンラインビデオに関連する追加情報セットを決定するための1つまたは複数のシステムおよび/または技術を本明細書で開示する。詳細には、視覚的特徴、テキスト特徴、音声的特徴、および/または他の特徴を、オンラインビデオ(例えば、オンラインビデオのオリジナルコンテンツおよび/または埋め込み広告)から抽出してよい。抽出した特徴を用いることによって、抽出した特徴をデータベースのコンテンツとマッチさせて、追加情報(例えば、画像、広告)を決定してよい。追加情報は、オンラインビデオを視聴しているユーザに提示してよい。

Description

本発明は、オンラインビデオに関する追加情報セットを決定する方法、及び、システムに関する。
インターネットを閲覧するとき、ユーザは、オンラインビデオを通して様々なコンテンツと対話する。例えば、ユーザは、映画の全編、広告、携帯電話で撮ったホームビデオ、テレビ番組、および他のコンテンツを視聴する場合がある。ユーザは、ホストウェブサイトを通してオンラインビデオを視聴するだけではなく、オンラインビデオをアップロードして他のユーザと共有する場合もある。オンラインビデオは、ユーザのインターネット体験において不可欠な役割を果たすので、広告や関連するサービス(例えば、ニュース、天気、近くの交通情報など)の追加情報を、オンラインビデオに組み込んで、ユーザのインターネット体験を充実させてもよい。残念なことに、現在の技術においては、オンラインビデオのオリジナルコンテンツ、または、埋め込みコンテンツに無関係な追加情報が提供される場合がある。無関係な追加情報はユーザの興味をひかないので、ユーザはその情報を無視することが多い。
この概要は、概念の中から選ばれたものを簡略化した形で紹介するために提供され、発明を実施するための形態において以下でさらに説明する。この概要は、特許を請求する主題の主な要素や不可欠な特徴を特定するためのものではない。また、特許を請求する主題の範囲を限定するためのものでもない。
特に、本明細書では、オンラインビデオに関する追加情報セットを決定するための、1つまたは複数のシステムおよび/または技術を開示する。追加情報セットは、画像、テキスト、音声、ビデオなどの任意のデジタルコンテンツまたはそれらの組み合わせを含んでよいことは理解されよう。一例においては、追加情報セットは、ビデオ広告であってよい。別の例においては、追加情報セットは、ウェブページにリンクするURLを伴う画像のセットであってよい。
一実施形態において、オンラインビデオを受信してよい。オンラインビデオは、オリジナルコンテンツおよび/またはオーバーレイ広告などの埋め込みコンテンツを含んでよいことは理解されよう。オンラインビデオから特徴セットを抽出してよい。特徴セットは、テキスト特徴(例えば、埋め込みテキスト)、視覚的特徴(例えば、テクスチャ、SIFT記述子など)、音声的特徴、および/またはオンラインビデオの他の記述データを含んでよい。追加情報セットは、特徴セットに基づいて決められてよい。例えば、特徴セットを用いてデータベース(例えば、広告データベース)に対してマルチモーダル関連マッチングアルゴリズムを実行し、追加情報セットを決定してよい。一例においては、追加情報セットを、オンラインビデオを視聴しているユーザに提示してよい。別の例においては、追加情報セットを、後に利用するために保存してよい。
別の実施形態において、解析コンポーネントは、オンラインビデオを解析して、そのオンラインビデオのフレームシーケンスを含む1つまたは複数のセグメントに分けるように構成してよい。解析コンポーネントは、セグメントごとに、セグメントのフレームシーケンスを代表する1つまたは複数のキーフレームを抽出してよい。セグメント全体は不必要な量の情報を含んでいる場合があるので、セグメントを代表する1つまたは複数のキーフレームを抽出する。特徴抽出コンポーネントは、各セグメントの1つまたは複数のキーフレームから特徴セットを抽出するように構成してよい。特徴セットは、オンラインビデオに関するテキスト、視覚、音声および/または他の特徴を含んでよい。情報抽出コンポーネントは、特徴セットを用いてデータベースに対してマルチモーダル関連マッチングアルゴリズムを実行して、追加情報セットを決定するように構成してよい。提示コンポーネントは、追加情報セットを提示するように構成してよい。一例においては、追加情報セットは、オンラインビデオを提供しているブラウザ内に提示してよい。別の例においては、追加情報セットは、オンラインビデオにオーバーレイして提示してよい。別の例においては、追加情報セットは、オンラインビデオを提供しているメディアプレーヤのスキン内に提示してよい。様々な異なる提示モードは、特許を請求する主題の範囲に含まれるものとする。
前述および関連する目的を達成するために、下記の記載および添付の図面によって、一部の例示的態様および実装例を述べる。これらは、1つまたは複数の態様を採用する様々な方法の一部を示したものに過ぎない。この開示内容の他の態様、利点、および新規の特徴は、次の発明を実施するための形態を添付の図面と共に検討すると明らかになる。
オンラインビデオに関する追加情報セットを決定する例示の方法を示すフローチャートである。 オンラインビデオに関する追加情報セットを決定するための例示のシステムを示すコンポーネントブロック図である。 オンラインビデオに関する追加情報セットを決定するための例示のシステムを示すコンポーネントブロック図である。 ウェブ閲覧環境内に提供されるオンラインビデオの視覚的特徴を検出する例を示す図である。 オンラインビデオの視覚的特徴および/またはテキスト特徴を検出する例を示す図である。 オンラインビデオから抽出した特徴セットに基づいて追加情報セットを決定する情報抽出コンポーネントの例を示す図である。 オンラインビデオを視聴しているユーザに追加情報を提示する例を示す図である。 オンラインビデオを視聴しているユーザに追加情報を提示する例を示す図である。 オンラインビデオを視聴しているユーザに追加情報を提示する例を示す図である。 本明細書に記載された規定の1つまたは複数を具現するように構成されたプロセッサ実行可能命令を含むことができる例示のコンピュータ可読媒体を示す図である。 本明細書に記載の規定の1つまたは複数を実装してよい例示のコンピュータ環境を示す図である。
特許を請求する主題について図面を参照して記載している。図中、類似の参照番号は類似の要素を指す。下記に、特許を請求する主題を十分に理解してもらうために、説明目的で具体的な詳細を多く記載する。しかしながら、特許を請求する主題は、この具体的な詳細なしで実践してもよいことは明らかである。他の例においては、構造および装置は、特許を請求する主題の記載を容易にするために、ブロック図の形で表している。
今日、インターネットコンテンツのかなりの部分が、オンラインビデオの形式である。例えば、テレビ番組を、ユーザが視聴するオンラインビデオとして流すことができる。オンラインビデオと共に追加の関連情報を提供することは、有利であると思われる。例えば、ユーザが、車のプロモーションビデオを含むオンラインビデオを見ている場合、オンラインビデオのコンテンツが車に関すると判断すると有用であると思われる。検出した車という特徴を用いて、車に関する追加情報(例えば、車のウェブサイトへのURL)をユーザに提供して、ユーザ体験を充実させてよい。
残念なことに、現在の技術では、オンラインビデオの特徴、および/または、オンラインビデオ内の埋め込みコンテンツの特徴を検出できない場合がある。さらに、現在の技術では、検出された埋め込みコンテンツの特徴を用いて、埋め込みコンテンツに関連する追加情報を求めて外部ソースを検索しないと思われる。すなわち、現在の技術では、オンラインビデオ、および/またはオンラインビデオ内の埋め込みコンテンツのコンテンツ製作者以外のソースが生成した追加情報を求めて、広告データベースなどの外部データベースを検索しないと思われる。
従って、オンラインビデオに関連する追加情報セットを決定するための1つまたは複数のシステムおよび/または技術を、本明細書において提供する。詳細には、オンラインビデオの特徴を、オリジナルコンテンツ、および/またはオンラインビデオの埋め込みコンテンツ(例えば、広告)から抽出してよい。特徴を広告データベースなどのデータベースに対する検索基準として用いて、オンラインビデオに関連する追加情報を決定してよい。ユーザは閲覧時間を使ってそのオンラインビデオを見ることを選択したのだから、ユーザはそのオンラインビデオのコンテンツに興味があると、理解してよい。このように、オンラインビデオおよび/またはユーザの興味に関連のある追加情報をユーザに提供することによって、ユーザ体験を充実させてよい。
オンラインビデオに関連する追加情報セットを決定する一実施形態を、例示の方法100として、図1に示す。方法100は、ステップ102から始まる。ステップ104において、オンラインビデオを受信してよい。オンラインビデオは、オリジナルコンテンツおよび/または、オーバーレイ広告などの追加の埋め込みコンテンツを含んでよい。オンラインビデオの受信は、オンラインビデオのコンテンツへのアクセスを得ること(例えば、ユーザがウェブブラウザまたはメディアプレーヤを用いてオンラインビデオを視聴しながら、オンラインビデオのリアルタイムデータストリームにアクセスすること、オンラインビデオのコピーを保存したものにアクセスすること、オンラインビデオを提供するソースにオンラインビデオをリクエストすること、オンラインビデオを表示するブラウザを通してオンラインビデオにアクセスすること)として、相互動作してよいことは、理解されよう。
ステップ106において、特徴セットをオンラインビデオから抽出してよい。特徴セットはテキスト特徴、視覚的特徴、および/または音声的特徴の少なくとも1つを含んでよい。一例においては、OCRテキスト認識技術などの1つまたは複数のテキスト特徴抽出技術を用いて、テキスト特徴(例えば、重ね合わせテキスト)を抽出してよい。別の例においては、スケール不変特徴変換などの1つまたは複数の視覚的特徴抽出技術によって、視覚的特徴(例えば、色ヒストグラム、テクスチャ、SIFT記述子)を抽出してよい。一例においては、複数の特徴を、特徴セット(例えば、特徴セットとして二つのテキスト特徴、特徴セットとして1つのテキスト特徴と二つの音声的特徴、100の視覚的・テキスト特徴と30のテキスト特徴、など)として抽出してよいことは、理解されよう。
ステップ108において、追加情報セットを特徴セットに基づいて決定してよい。一例においては、特徴セットを用いて、マルチモーダル関連マッチングアルゴリズムをデータベースに対して実行してよい。詳細には、マルチモーダル関連マッチングアルゴリズムは、特徴セット内の特徴と、データベース内の、広告、画像、ビデオなどの追加情報の特徴とをマッチさせてよい。例えば、特徴セットは、車の視覚的特徴と、「タイヤ」という単語のテキスト特徴を含んでよい。マルチモーダル関連マッチングアルゴリズムは、車の視覚的特徴および/またはタイヤというテキスト特徴と、車および/またはタイヤに関する画像、ビデオ、ウェブページURL、および/または他のコンテンツとのマッチングを試みてよい。オンラインビデオに関連する追加情報セットは、マッチングされた内容に基づいて決定してよい。追加情報セットは、ディスプレイに提示してよい。例えば、追加情報セットは、オンラインビデオにオーバーレイされて、または、オンラインビデオ内に組み込まれて、提示されてよい。ステップ110において、方法100は終了する。
オンラインビデオに関連する追加情報セットを決定する一実施形態を、図2に例示の方法200で示す。方法200は、ステップ202から始まる。ステップ204において、オンラインビデオを受信してよい。ステップ206において、オンラインビデオを解析して、フレームシーケンスを含む1つまたは複数のセグメントに分けてよい。オンラインビデオをセグメント化して解析し、特徴を特定し、抽出できる管理可能なセグメントにしてよい。セグメント化に役立つように、二つの連続したフレーム間の大きな視覚的相違に基づいて、境界を決定してよい。さらに、セグメントは、例えば、プロモーションコンテンツ(例えば、埋め込みプロモーションコンテンツ)またはプログラムコンテンツ(例えば、オンラインビデオのオリジナルコンテンツ)として設計してよい。
オンラインビデオから利用する情報の量をさらに減少させるために、ステップ208において、1つまたは複数のキーフレームをセグメント毎に抽出してよい。キーフレームは、セグメントのフレームシーケンスを代表するセグメント内のフレームであってよい。例えば、真ん中のフレーム、または、所定の閾値を超えるビデオ品質を有するフレームを、キーフレームとして選択してよい。キーフレームの選択によって、オンラインビデオから利用される不必要なデータおよび/または冗長データの量を減少させる。
ステップ210において、特徴セットを各セグメントの1つまたは複数のキーフレームから抽出してよい。一例においては、特徴セットは、1つまたは複数のテキスト特徴および/または1つまたは複数の視覚的特徴を含んでよい。ステップ212において、1つまたは複数のテキスト特徴を用いて、データベースに対してテキストベースの検索アルゴリズムを行って、候補追加情報の第1のリストを決定してよい。例えば、テキスト特徴をキーワードとして用いて、マッチするキーワードを含むコンテンツを探してデータベースを検索してよい。ステップ214において、1つまたは複数の視覚的特徴を用いて、データベースに対して視覚ベースの検索アルゴリズムを行い、候補追加情報の第2のリストを決定してよい。例えば、視覚的特徴を、マッチする視覚的特徴を含むデータベース内のコンテンツとマッチさせてよい。
ステップ216において、第1のリストおよび第2のリストの線形結合を行い、候補追加情報セットを生成してよい。例えば、候補追加情報セットは、オンラインビデオの特徴にマッチする画像、URL、ビデオ、広告、および/または他のコンテンツを含んでよい。追加情報セットとして、候補追加情報セットまたはその一部を用いてよいことは理解されよう。一例においては、追加情報セットとして、候補追加情報セットを用いてよい。別の例においては、候補追加情報セットから所定の数の候補を選択して、追加情報セットを生成してよい。候補追加情報セットは、追加情報として用いてよい大量のコンテンツを含む場合があるので、所定の数の候補コンテンツを選択してよい。すなわち、候補追加情報セットは、オンラインビデオより長いタイムフレームにわたる広告ビデオの組み合わせを含む場合がある。一例においては、オンラインビデオと関連性が高い1つまたは複数の候補を選択してよい。追加情報セットを集めてビデオにしてよく、そのビデオを、オンラインビデオを視聴しているユーザに提示してよい。ステップ218において、方法は終了する。
図3は、オンラインビデオ302に関連する追加情報セット314を決定するように構成されたシステム300の例を示す。システム300は、解析コンポーネント304、特徴抽出コンポーネント308、情報抽出コンポーネント312、および/または、提示コンポーネント316を含んでよい。システム300は、データベース320を利用してよい。データベース320は、テキスト、URL、画像、ビデオ、音声、および/または他のデジタル形式等の形式のデジタルコンテンツ(追加情報の潜在的候補)(例えば、広告ビデオ、プロモーション画像またはテキスト、ウェブページにリンクするURL、クーポンデータ、顧客の意見、非プロモーションコンテンツなど)を含んでよい。
解析コンポーネント304は、オンラインビデオ302を解析して、オンラインビデオ302のフレームシーケンスを含む1つまたは複数のセグメントに分けるように構成してよい。解析コンポーネント304は、1つまたは複数のセグメントからキーフレーム306を抽出するように構成してよい。詳細には、解析コンポーネント304は、セグメントのフレームシーケンスを代表する1つまたは複数のキーフレームを抽出してよい。
特徴抽出コンポーネント308は、キーフレーム306から特徴セット310を抽出するように構成してよい。特徴セット310は、テキスト特徴、視覚的特徴、および/または音声的特徴の少なくとも1つを含んでよい。一例においては、特徴抽出コンポーネント308は、テキスト認識コンポーネント、視覚認識コンポーネント、および/または音声認識コンポーネントを含んでよい。テキスト認識コンポーネントは、OCRテキスト認識技術および/または他のテキスト認識技術を用いて、1つまたは複数のテキスト特徴を抽出するように構成してよい。視覚認識コンポーネントは、スケール不変特徴変換および/または他の視覚認識技術を用いて、1つまたは複数の視覚的特徴を抽出するように構成してよい。音声認識コンポーネントは、1つまたは複数の音声認識技術を用いて、1つまたは複数の音声的特徴を抽出するように構成してよい。様々な異なる視覚、テキスト、および音声認識技術は、特許を請求する主題の範囲に含まれるものとする。
情報抽出コンポーネント312は、特徴セット310を用いてデータベース320に対してマルチモーダル関連マッチングアルゴリズムを実行し、追加情報セット314を決定するよう構成してよい。一例においては、マルチモーダル関連マッチングアルゴリズムは、テキスト特徴を用いてデータベース320に対してテキストベースの検索アルゴリズムを行って、第1のリストの候補追加情報を決定してよい。マルチモーダル関連マッチングアルゴリズムは、視覚的特徴を用いてデータベース320に対して、視覚ベースの検索アルゴリズムを行い、第2のリストの候補追加情報を決定してよい。マルチモーダル関連マッチングアルゴリズムは、第1のリストおよび第2のリストの線形結合を行って、追加情報セット314を生成してよい。情報抽出コンポーネント312は、追加情報セット314を集めてビデオにするように構成してよい。
一例においては、提示コンポーネント316は、追加情報セット314を提示するように構成してよい。別の例においては、提示コンポーネント316は、ウェブ閲覧環境318でオンラインビデオ302を視聴しているユーザにビデオを提示するように構成してよい。
図4は、ウェブ閲覧環境が提供するオンラインビデオ404の視覚的特徴を検出する例400を示す。オンラインビデオ404は、ウェブブラウザ、ウェブブラウザのメディアプレーヤプラグイン、ウェブブラウザと別個のメディアプレーヤ、および/または他のオンラインビデオ再生装置によって表示されるウェブページ内に提供されてよいことは理解されよう。視覚的特徴は、オンラインビデオ404内で検出されてよい、および/または特徴セットの一部として抽出されてよい。例えば、雲412、太陽410、木402、車406、タイヤ408、および/または他の視覚的特徴は、検出および/または抽出されてよい。抽出された視覚的特徴に関する追加情報は、決定されてよい、および/または、オンラインビデオ404を視聴しているユーザに提示されてよい。一例においては、太陽410、雲412および/または木402に基づいて、休暇に関する追加情報を提示してよい。別の例においては、車406および/または木408に基づいて、車の評価に関する追加情報を提示してよい。このように、ユーザが興味を持つと思われる追加の関連情報をユーザに提示することができるので、ユーザ体験を充実させると思われる。
図5は、オンラインビデオ504の視覚的特徴および/またはテキスト特徴を検出する例500を示す。視覚的特徴は、オンラインビデオ504内で検出してよく、および/または、特徴セットとして抽出してもよい。例えば、車508、タイヤ510および/または道502を、検出および/または抽出してよい。テキスト特徴は、オンラインビデオ504内で検出してよく、および/または、特徴セットの一部として抽出してよい。例えば、埋め込みテキスト506「自動車メーカーのウェブサイトを訪問して、新車に試乗・・・」またはその一部を、検出および/または抽出してよい。文字、単語、語句、文および/または他の単語の論理グループをテキスト特徴として検出してよいことは理解されよう。すなわち、埋め込みテキスト506を解析して、1つまたは複数の特徴(例えば、試乗、自動車メーカーなど)に分けてよい。視覚的特徴および/またはテキスト特徴を用いて、オンラインビデオ504を視聴しているユーザに追加情報を提示してよい。例えば、自動車メーカーが提供するウェブサイトへのURLの追加情報を、車508の視覚的特徴および/または自動車メーカーというテキスト特徴に基づいて提示してよい。
図6は、オンラインビデオから抽出した特徴セット604に基づいて追加情報セット608を決定する情報抽出コンポーネント602の例600を示す。一例においては、情報抽出コンポーネント602は、視覚的特徴(車、木、太陽、雲、道など)、テキスト特徴(車、乗る、自動車メーカー、ウェブサイトなど)、音声的特徴(車のエンジン音、話し言葉など)、および/または他の特徴をオンラインビデオから抽出したと思われる。情報抽出コンポーネント602は、特徴セット604を用いて、データベース606から追加情報セット608を決定してよい。データベース606は、追加情報として決定され得る無数のコンテンツ(例えば、画像、URL、広告、ビデオ、音声)を含んでよいことは理解されよう。
データベース606内のコンテンツの中には、特徴セット604内の特徴の1つまたは複数とマッチするコンテンツ(例えば、追加情報セット608)もあれば、特徴セット604内の特徴とはマッチしないコンテンツ(例えば、関連性のないコンテンツ610)もあってよいことは理解されよう。このように、オンラインビデオに関連する追加情報(例えば、特徴セット604内の特徴とマッチするデータベース606内のコンテンツ)は、データベース606内で決定してよい。例えば、追加情報セット608は、車の画像、自動車メーカーのウェブサイトのURL、休暇の広告、カーレースのビデオ、および/または特徴セット604にマッチする他のコンテンツを含んでよい。関連のないコンテンツ610は、特徴セット604には関連しないので、追加情報セット608から取り除いてよい。例えば、溝の取り付け方に関するテキスト記述は、車、木、雲、道などの視覚的特徴、および/または車、乗る、自動車メーカー、ウェブサイトなどのテキスト特徴には、マッチしないと思われる。
図7は、オンラインビデオ702を視聴しているユーザに追加情報704を提示する例700を示す。一例においては、車に関連する特徴セットがオンラインビデオ702から抽出されたと思われる。車に関連する特徴セットを用いて、カーレースビデオの追加情報704を決定したと思われる。一例においては、追加情報704を、例えば、ウェブ閲覧環境内のビデオとしてユーザに提示してもよい。別の例においては、追加情報704は、ウェブ閲覧環境とは別個のメディアプレーヤ内のビデオとして提示してよい。様々な異なる提示モードは、特許を請求する主題の範囲内に含まれるものとする。
図8は、オンラインビデオを視聴しているユーザに追加情報802を提示する例800を示す。一例においては、車に関連する特徴セットが、オンラインビデオから抽出されたと思われる。車に関連する特徴セットを用いて、カーレースビデオの追加情報802を決定したと思われる。一例においては、カーレースビデオの追加情報802をオンラインビデオにオーバーレイして提示してよい。
図9は、オンラインビデオ902を視聴しているユーザに追加情報904を提示する例900を示す。一例においては、休暇に関連する特徴セットが、オンラインビデオ902から抽出されたと思われる。休暇に関連する特徴セットを用いて、休暇の広告の追加情報904(例えば、休暇に関する広告を提供するウェブサイトとURLを合わせた休暇の画像)を決定したと思われる。一例においては、休暇の広告の追加情報904は、オンラインビデオ902を視聴しているユーザに提示されてよい。このように、豊富な追加情報によってユーザ体験を充実させる。追加情報は、例えば、オンラインビデオ902のホストの外部のソースから集めてよい。
さらに別の実施形態は、本明細書に提示の技術の1つまたは複数を実施するように構成されたプロセッサ実行可能命令を含むコンピュータ可読媒体に関する。このようにして考案された例示のコンピュータ可読媒体を、図10に示す。図10において、実施形態1000は、コンピュータ可読媒体1016(例えば、CD−R、DVD−R、またはハードディスクドライブのプラッタ)を含み、その上にコンピュータ可読データ1014が符号化されている。このコンピュータ可読データ1014は、本明細書に記載の原理の1つまたは複数に従って動作するように構成されたコンピュータ命令セット1012を含む。このような実施形態1000においては、プロセッサ実行可能コンピュータ命令1012は、例えば、図1の例示の方法100および図2の例示の方法200などの方法1010を実行するよう構成されてよい。別のこのような実施形態においては、プロセッサ実行可能命令1012を、例えば、図3の例示のシステム300などのシステムを実装するように構成してよい。本明細書に提示の技術に従って動作するように構成された多くのこのようなコンピュータ可読媒体は、当業者が想到し得るものである。
発明の主題を、構造的特徴および/または方法論的行為に特有の言葉で記載したが、添付の請求項に規定する主題は、上記の具体的特徴または行為に必ずしも限定されないことは理解されたい。上記の具体的特徴または行為は、請求項を実施するための例示の形で開示したものである。
本願において、「コンポーネント」「モジュール」「システム」「インタフェース」などの用語は、一般的に、ハードウェア、ハードウェアとソフトウェアの組み合わせ、ソフトウェア、または、実行中のソフトウェアなどのコンピュータ関連の実体を指すものとする。例えば、コンポーネントは、プロセッサ上で実行するプロセス、プロセッサ、オブジェクト、実行ファイル、実行スレッド、プログラム、および/またはコンピュータであってよいが、これらに限られない。例を挙げると、制御装置上で実行するアプリケーションと制御装置は両方とも、コンポーネントであり得る。1つまたは複数のコンポーネントが、プロセスおよび/または実行スレッド内に常駐してよく、コンポーネントは、1つのコンピュータ上に存在してもよく、および/または、複数のコンピュータ間で分散されてもよい。
さらに、特許を請求する主題は、標準的なプログラミングおよび/またはエンジニアリング技術を用いて、コンピュータが開示の主題を実施するのを制御するソフトウェア、ファームウェア、ハードウェア、またはそれらの任意の組み合わせを生産するための方法、装置、または製品として実装される。本明細書で使用される「製品」という用語は、コンピュータ読み取り可能な任意の装置、搬送装置、または媒体からアクセス可能なコンピュータプログラムを包含するものとする。特許を請求する主題の範囲または精神を逸脱することなく、この構成に多くの変更を行ってよいことは、当業者には理解されよう。
図11および下記は、本明細書に記載の規定の1つまたは複数の実施形態を行うのに適切なコンピュータ環境を簡単に、一般的に記載したものである。図11の動作環境は、適切な動作環境のほんの一例であり、動作環境の使用および機能の範囲に関していかなる制限をも示唆するものではない。例示のコンピュータ装置は、パーソナルコンピュータ、サーバコンピュータ、ハンドヘルドまたはラップトップ装置、モバイル装置(携帯電話、パーソナルデジタルアシスタント(PDA)、メディアプレーヤなど)、マルチプロセッサシステム、消費者家電、ミニコンピュータ、メインフレームコンピュータ、上記システムまたは装置の任意の物を含む分散コンピュータ環境などを含むが、これらに限定されない。
必須ではないが、実施形態は、1つまたは複数のコンピュータ装置が「コンピュータ可読命令」を実行しているという一般的な状況で記載されている。コンピュータ可読命令は、コンピュータ可読媒体を介して配信されてよい(下記に記載)。コンピュータ可読命令は、特定のタスクを実行し、特定の抽象データ型を実施する、機能、オブジェクト、API(Application Programming Interfaces)、データ構造などのプログラムモジュールとして実装されてよい。典型的には、コンピュータ可読命令の機能は、様々な環境において、要求通りに、組み合わせ、分散させてよい。
図11は、本明細書に記載された1つまたは複数の実施形態を実施するように構成されたコンピュータ装置1112を備えるシステム1110の例を示す。一構成において、コンピュータ装置1112は、少なくとも1つの処理部1116とメモリ1118を含む。コンピュータ装置の具体的な構成および種類に応じて、メモリ1118は、揮発性(例えばRAMなど)、不揮発性(例えば、ROM、フラッシュメモリなど)、またはその二つの組み合わせであってよい。この構成については、図11に点線1114で示す。
他の実施形態において、装置1112は、追加の特徴および/または機能を含んでよい。例えば、装置1112は、(例えば、取り外し可能、および/または取り外し不可能な)追加の記憶装置も含んでよい。追加の記憶装置は、磁気記憶装置、光学式記憶装置などを含むがそれらに限定されない。このような追加の記憶装置は、記憶装置1120として図11に示されている。一実施形態においては、本明細書に記載の1つまたは複数の実施形態を実施するためのコンピュータ可読命令は、記憶装置1120に記憶されてよい。記憶装置1120は、オペレーティングシステム、アプリケーションプログラムなどを実施するための他のコンピュータ可読命令も記憶してよい。コンピュータ可読命令は、例えば、処理部1116が実行するために、メモリ1118にロードされてよい。
本明細書で用いられる「コンピュータ可読媒体」という用語は、コンピュータ記憶媒体を含む。コンピュータ記憶媒体は、コンピュータ可読命令または他のデータなどの情報を記憶するための任意の方法または技術で実装される、揮発性および不揮発性、取り外し可能および取り外し不可能な媒体を含む。メモリ1118および記憶装置1120は、コンピュータ記憶媒体の例である。コンピュータ記憶媒体は、所望の情報を記憶するのに使用することができ、かつ、装置1112がアクセス可能な、RAM、ROM、EEPROM、フラッシュメモリまたは他のメモリ技術、CD−ROM、デジタル多用途ディスク(DVD)または他の光学式記憶装置、磁気カセット、磁気テープ、磁気ディスク記憶装置または他の磁気記憶装置、または他の任意の媒体を含むが、これらに限定されない。任意のこのようなコンピュータ記憶媒体は、装置1112の一部であってよい。
装置1112は、装置1112が他の装置と通信できるようにする通信接続1126(単数または複数)も含んでよい。通信接続1126(単数または複数)は、コンピュータ装置1112を他のコンピュータ装置に接続するための、モデム、NIC(Network Interface Card)、統合ネットワークインタフェース、無線周波数送信機/受信機、赤外線ポート、USB接続、または他のインタフェースを含むが、これらに限定されない。通信接続1126(単数または複数)は、有線接続または無線接続を含んでよい。通信接続1126(単数または複数)は、通信媒体を送信および/または受信してよい。
「コンピュータ可読媒体」という用語は、通信媒体を含んでよい。通信媒体は、典型的には、コンピュータ可読命令または他のデータを、搬送波や他の搬送機構などの「変調データ信号」の形にし、任意の情報伝達媒体を含む。「変調データ信号」という用語は、信号に情報を符号化するように信号の特性の1つまたは複数を設定または変更した信号を含んでよい。
装置1112は、キーボード、マウス、ペン、音声入力装置、タッチ入力装置、赤外線カメラ、ビデオ入力装置、および/または任意の他の入力装置などの入力装置1124(単数または複数)を含んでよい。1つまたは複数の装置、スピーカ、プリンタ、および/または任意の他の出力装置などの出力装置1122(単数または複数)も、装置1112に含まれてよい。入力装置1124(単数または複数)および出力装置1122(単数または複数)は、有線接続、無線接続、またはそれらの任意の組み合わせを介して装置1112に接続されてよい。一実施形態においては、別のコンピュータ装置の入力装置または出力装置を、コンピュータ装置1112の入力装置1124(単数または複数)または出力装置1122(単数または複数)として用いてよい。
コンピュータ装置1112のコンポーネントは、バスなどの様々な相互接続によって接続されてよい。このような相互接続は、PCIエクスプレス、USB(Universal Serial Bus)、ファイアウェア(IEEE1394)、光バス構造などの周辺コンポーネント相互接続(PCI)を含んでよい。別の実施形態においては、コンピュータ装置1112のコンポーネントは、ネットワークによって相互接続されてよい。例えば、メモリ1118は、ネットワークによって相互に接続された異なる物理的場所に配置された複数の物理的メモリユニットから構成されてよい。
コンピュータ可読命令の記憶に利用される記憶装置はネットワーク上に分散されていてよいことは、当業者には理解されよう。例えば、ネットワーク1128を介してアクセス可能なコンピュータ装置1130は、本明細書に記載の1つまたは複数の実施形態を実施するためのコンピュータ可読命令を記憶してよい。コンピュータ装置1112は、コンピュータ装置1130にアクセスし、コンピュータ可読命令の一部または全てを実行するためにダウンロードしてよい。あるいは、コンピュータ装置1112は、コンピュータ可読命令の一部を必要に応じてダウンロードし、一部の命令をコンピュータ装置1112で実行し、一部の命令をコンピュータ装置1130で実行してよい。
実施形態の様々な操作を本明細書に記載している。一実施形態においては、記載の操作の1つまたは複数が、1つまたは複数のコンピュータ可読媒体に記憶されたコンピュータ可読命令を構成してよく、その命令をコンピュータ装置が実行すると、コンピュータ装置は、記載の操作を実行する。操作の一部または全てを記載している順序は、これらの操作が必ずこの順序で行われることを示唆しているとして解釈されるべきではない。別の順序でも、この記載の利点を有することは、当業者には理解されよう。さらに、必ずしもすべての操作が、本明細書に記載の各実施形態に存在するわけではないことも理解されよう。
さらに、「例示の」という用語は、本明細書では、例、実例または例証を意味する。「例示の」として本明細書に記載の態様または設計が、他の態様または設計よりも有利であると必ずしも解釈するべきではない。正しくは、「例示の」という言葉は、概念を具体的に表すために用いられるものとされる。本願において用いられている、用語「または」は、排他的な意味ではなく包含的な意味で用いられるものとする。すなわち、別段の記載がない限り、または、文脈から明らかでない限り、「XはAまたはBを採用する」は、自然な包含的な置き換えのいずれかも意味する。すなわち、XはAを採用する、XはBを採用する、または、XがAとBの両方を採用する場合、上記実例のいずれにおいても「XはAまたはBを採用する」を満たすことになる。また、この明細書および請求項で使用されている冠詞「a」および「an」は、別段の記載がない限り、または、文脈から単数を指すことが明らかでない限り、一般的に「1つまたは複数の」を意味すると解釈される。
また、この開示は、1つまたは複数の実装形態について示し、記載しているが、この明細書および添付の図面を読み、理解すると、同等の変更および修正に当業者は想到するであろう。この開示は、そのような変更および修正の全てを含み、添付の請求項の範囲によってのみ限定される。具体的に、上記コンポーネント(例えば、要素、リソース等)によって実行される様々な機能に関しては、そのようなコンポーネントを記載するのに使用する用語は、別段の記載がない限り、本明細書に記載の例示の開示された実装形態の機能を実行する開示の構造とは構造的に同等でなくても、(例えば、機能的に同等な)記載のコンポーネントの特定の機能を実行する任意のコンポーネントに該当するものとする。また、開示内容の特定の特徴は、複数の実装形態のほんの一つに関して開示されているが、このような特徴は、必要に応じて、また、任意の所与のまたは特定の適用に対して所望され有利なように、他の実装形態の1つまたは複数の他の特徴と組み合わせてよい。さらに、「含む」「有した」「有する」「と共に」の用語、またはそれらの活用形は、発明を実施するための形態または請求項のいずれかで用いられている範囲において、「包含する」という用語と同じように包含的な意味で用いるものとする。

Claims (13)

  1. オンラインビデオに関する追加情報セットを決定する方法であって、
    オンラインビデオを受信するステップと、
    テキスト特徴、視覚的特徴、および、音声的特徴のうちの少なくとも1つを含む特徴セットを、前記オンラインビデオから抽出するステップと、
    前記特徴セットに基づいて、追加情報を決定するステップと、
    を含む方法。
  2. 前記追加情報セットをディスプレイに提示するステップを含む、請求項1に記載の方法。
  3. 前記提示するステップは、
    前記追加情報セットをビデオとして提示するステップと、
    前記追加情報セットを動画として提示するステップと、
    前記追加情報セットを画像として提示するステップと、
    前記追加情報セットをテキストとして提示するステップとのうち、少なくとも1つを含む、請求項2に記載の方法。
  4. 前記抽出するステップは、OCRテキスト認識技術を用いてテキスト特徴を抽出するステップを含む、請求項1に記載の方法。
  5. 前記抽出するステップは、スケール不変特徴変換を用いて、視覚的特徴を抽出するステップを含む、請求項1に記載の方法。
  6. 前記視覚的特徴は、
    色ヒストグラム、
    テクスチャ、および、
    SIFT記述子のうちの少なくとも1つを含む、請求項1に記載の方法。
  7. 前記決定するステップは、前記特徴セットを用いて、データベースに対してマルチモーダル関連マッチングアルゴリズムを実行して、前記追加情報セットを決定するステップを含む、請求項1に記載の方法。
  8. オンラインビデオに関連する追加情報セットを決定するシステムであって、
    オンラインビデオを解析してフレームシーケンスを含む1つまたは複数のセグメントに分け、
    セグメントごとに、セグメントのフレームシーケンスを代表する1つまたは複数のキーフレームを抽出するように構成された解析コンポーネントと、
    テキスト特徴、視覚的特徴、音声的特徴の少なくとも1つを含む特徴セットを各セグメントの前記1つまたは複数のキーフレームから抽出するように構成された特徴抽出コンポーネントと、
    前記特徴セットを用いてデータベースに対してマルチモーダル関連マッチングアルゴリズムを実行して、追加情報セットを決定するように構成された情報抽出コンポーネントと、
    を含むシステム。
  9. 前記情報抽出コンポーネントは、前記追加情報セットを集めてビデオにするように構成された、請求項8に記載のシステム。
  10. 前記オンラインビデオを視聴しているユーザに前記ビデオを提示するように構成した提示コンポーネントを含む、請求項9に記載のシステム。
  11. 前記追加情報セットを提示するように構成した提示コンポーネントを含む、請求項8に記載のシステム。
  12. 前記特徴抽出コンポーネントは、
    OCRテキスト認識技術を用いて1つまたは複数のテキスト特徴を抽出するように構成されたテキスト認識コンポーネントと、
    スケール不変特徴変換を用いて1つまたは複数の視覚的特徴を抽出するように構成された視覚認識コンポーネントと、
    1つまたは複数の音声的特徴を抽出するように構成された音声認識コンポーネントと、を含む、請求項8に記載のシステム。
  13. 前記マルチモーダル関連マッチングアルゴリズムは、
    前記1つまたは複数のテキスト特徴を用いて、前記データベースに対してテキストベースの検索アルゴリズムを実行して候補追加情報の第1のリストを決定し、
    前記1つまたは複数の視覚的特徴を用いて前記データベースに対して、視覚的特徴マッチングアルゴリズムを実行して、候補追加情報の第2のリストを決定し、
    前記第1のリストおよび前記第2のリストを線形結合して、前記追加情報セットを生成するように構成された、請求項8に記載のシステム。
JP2013507976A 2010-04-26 2011-04-04 コンテンツ検出、検索、および、情報集約によるオンラインビデオの充実 Expired - Fee Related JP5781601B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US12/767,114 US9443147B2 (en) 2010-04-26 2010-04-26 Enriching online videos by content detection, searching, and information aggregation
US12/767,114 2010-04-26
PCT/US2011/031046 WO2011139448A2 (en) 2010-04-26 2011-04-04 Enriching online videos by content detection, searching, and information aggregation

Publications (3)

Publication Number Publication Date
JP2013525916A true JP2013525916A (ja) 2013-06-20
JP2013525916A5 JP2013525916A5 (ja) 2014-04-24
JP5781601B2 JP5781601B2 (ja) 2015-09-24

Family

ID=44816695

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013507976A Expired - Fee Related JP5781601B2 (ja) 2010-04-26 2011-04-04 コンテンツ検出、検索、および、情報集約によるオンラインビデオの充実

Country Status (6)

Country Link
US (2) US9443147B2 (ja)
EP (1) EP2564372A4 (ja)
JP (1) JP5781601B2 (ja)
CN (1) CN102884538B (ja)
CA (1) CA2794680A1 (ja)
WO (1) WO2011139448A2 (ja)

Families Citing this family (29)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9443147B2 (en) * 2010-04-26 2016-09-13 Microsoft Technology Licensing, Llc Enriching online videos by content detection, searching, and information aggregation
US9069850B2 (en) * 2011-11-08 2015-06-30 Comcast Cable Communications, Llc Content descriptor
US8620021B2 (en) 2012-03-29 2013-12-31 Digimarc Corporation Image-related methods and arrangements
CN102760169A (zh) * 2012-06-13 2012-10-31 天脉聚源(北京)传媒科技有限公司 一种电视直播流中的广告段检测方法
US8578407B1 (en) 2012-07-10 2013-11-05 Joao Redol Real time automated unobtrusive ancilliary information insertion into a video
US9143823B2 (en) * 2012-10-01 2015-09-22 Google Inc. Providing suggestions for optimizing videos to video owners
US8805123B2 (en) 2012-10-09 2014-08-12 Samsung Electronics Co., Ltd. System and method for video recognition based on visual image matching
CN103873925B (zh) * 2012-12-13 2017-07-25 联想(北京)有限公司 视频处理设备和方法
CN103024479B (zh) * 2012-12-17 2016-03-02 深圳先进技术研究院 视频内容中自适应投放广告的方法及系统
CN103440248A (zh) * 2013-07-22 2013-12-11 西南交通大学 基于动态关联规则的网络视频事件挖掘框架
CA2924764C (en) * 2013-10-21 2020-03-10 Microsoft Technology Licensing, Llc Mobile video search
US10002191B2 (en) 2013-12-31 2018-06-19 Google Llc Methods, systems, and media for generating search results based on contextual information
US9456237B2 (en) * 2013-12-31 2016-09-27 Google Inc. Methods, systems, and media for presenting supplemental information corresponding to on-demand media content
US9832353B2 (en) 2014-01-31 2017-11-28 Digimarc Corporation Methods for encoding, decoding and interpreting auxiliary data in media signals
US9904441B2 (en) 2014-07-29 2018-02-27 Echostar Technologies L.L.C. Methods and systems for providing additional content
US11165596B2 (en) * 2014-11-04 2021-11-02 Tmrw Foundation Ip S. À R.L. System and method for inviting users to participate in activities based on interactive recordings
CN104754367A (zh) * 2015-04-07 2015-07-01 腾讯科技(北京)有限公司 一种多媒体信息处理方法及设备
US11128918B2 (en) 2015-06-11 2021-09-21 Google Llc Methods, systems, and media for aggregating and presenting content relevant to a particular video game
CN106713973A (zh) * 2015-07-13 2017-05-24 中兴通讯股份有限公司 搜索节目的方法及装置
CN107180055A (zh) * 2016-03-11 2017-09-19 阿里巴巴集团控股有限公司 业务对象的展示方法及装置
CN106205621A (zh) * 2016-07-28 2016-12-07 北京小米移动软件有限公司 关键词确定方法及装置
CN106658196A (zh) * 2017-01-11 2017-05-10 北京小度互娱科技有限公司 基于视频内嵌字幕来嵌入广告的方法及装置
KR20180131856A (ko) * 2017-06-01 2018-12-11 에스케이플래닛 주식회사 배송 물품 정보 제공 방법 및 이를 위한 장치
CN108491524A (zh) 2018-03-27 2018-09-04 深圳创维-Rgb电子有限公司 视频推送方法、装置及计算机可读存储介质
US10638206B1 (en) 2019-01-28 2020-04-28 International Business Machines Corporation Video annotation based on social media trends
US11836181B2 (en) 2019-05-22 2023-12-05 SalesTing, Inc. Content summarization leveraging systems and processes for key moment identification and extraction
US10984065B1 (en) 2019-09-30 2021-04-20 International Business Machines Corporation Accessing embedded web links in real-time
CN113573097A (zh) * 2020-04-29 2021-10-29 北京达佳互联信息技术有限公司 视频推荐方法、装置、服务器及存储介质
US20220321970A1 (en) * 2021-03-03 2022-10-06 Voodle, Inc. Dynamic Real-Time Audio-Visual Search Result Assembly

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20010004739A1 (en) * 1999-09-27 2001-06-21 Shunichi Sekiguchi Image retrieval system and image retrieval method
JP2001337984A (ja) * 2000-05-30 2001-12-07 Sony Communication Network Corp 広告システム、広告装置及び広告方法
JP2003283968A (ja) * 2002-03-26 2003-10-03 Fujitsu Ltd 動画像内容表示装置
JP2003330935A (ja) * 2002-05-15 2003-11-21 Toshiba Corp マルチモーダル情報システム及びマルチモーダル情報検索方法
WO2006028213A1 (ja) * 2004-09-11 2006-03-16 Yoshikuni Tamura 広告・情報配信システム
JP2008146490A (ja) * 2006-12-12 2008-06-26 Yahoo Japan Corp 情報提供装置、情報提供方法、及びコンピュータプログラム
US20080201361A1 (en) * 2007-02-16 2008-08-21 Alexander Castro Targeted insertion of an audio - video advertising into a multimedia object
JP2008269628A (ja) * 1999-09-27 2008-11-06 Mitsubishi Electric Corp 画像検索システムおよび画像検索方法
JP2009038481A (ja) * 2007-07-31 2009-02-19 Sharp Corp データ送信装置、受信装置、データ送受信方法、プログラム及び記録媒体
JP2009087106A (ja) * 2007-09-30 2009-04-23 Sannetto:Kk インターネット情報提供サービスシステム

Family Cites Families (99)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5600366A (en) * 1995-03-22 1997-02-04 Npb Partners, Ltd. Methods and apparatus for digital advertisement insertion in video programming
US20030212996A1 (en) * 1996-02-08 2003-11-13 Wolzien Thomas R. System for interconnection of audio program data transmitted by radio to remote vehicle or individual with GPS location
US5873080A (en) * 1996-09-20 1999-02-16 International Business Machines Corporation Using multiple search engines to search multimedia data
US6177931B1 (en) 1996-12-19 2001-01-23 Index Systems, Inc. Systems and methods for displaying and recording control interface with television programs, video, advertising information and program scheduling information
US6571054B1 (en) * 1997-11-10 2003-05-27 Nippon Telegraph And Telephone Corporation Method for creating and utilizing electronic image book and recording medium having recorded therein a program for implementing the method
US6363380B1 (en) * 1998-01-13 2002-03-26 U.S. Philips Corporation Multimedia computer system with story segmentation capability and operating program therefor including finite automation video parser
US6175829B1 (en) * 1998-04-22 2001-01-16 Nec Usa, Inc. Method and apparatus for facilitating query reformulation
US6704930B1 (en) * 1999-04-20 2004-03-09 Expanse Networks, Inc. Advertisement insertion techniques for digital video streams
US7356830B1 (en) * 1999-07-09 2008-04-08 Koninklijke Philips Electronics N.V. Method and apparatus for linking a video segment to another segment or information source
US20020026353A1 (en) 1999-12-22 2002-02-28 Marc Porat System and method of providing purchase information to consumers relating to advertisements displaying the product
US20020051077A1 (en) * 2000-07-19 2002-05-02 Shih-Ping Liou Videoabstracts: a system for generating video summaries
US9171851B2 (en) * 2000-08-08 2015-10-27 The Directv Group, Inc. One click web records
US8010988B2 (en) * 2000-09-14 2011-08-30 Cox Ingemar J Using features extracted from an audio and/or video work to obtain information about the work
CA2319979A1 (en) * 2000-09-18 2002-03-18 Bruce Frederic Michael Warren Method and system for producing enhanced story packages
US7143353B2 (en) * 2001-03-30 2006-11-28 Koninklijke Philips Electronics, N.V. Streaming video bookmarks
US7793326B2 (en) * 2001-08-03 2010-09-07 Comcast Ip Holdings I, Llc Video and digital multimedia aggregator
US20030117428A1 (en) * 2001-12-20 2003-06-26 Koninklijke Philips Electronics N.V. Visual summary of audio-visual program features
US7293275B1 (en) * 2002-02-08 2007-11-06 Microsoft Corporation Enhanced video content information associated with video programs
US7136875B2 (en) * 2002-09-24 2006-11-14 Google, Inc. Serving advertisements based on content
US20030233655A1 (en) 2002-06-18 2003-12-18 Koninklijke Philips Electronics N.V. Method and apparatus for an adaptive stereotypical profile for recommending items representing a user's interests
US7349477B2 (en) * 2002-07-10 2008-03-25 Mitsubishi Electric Research Laboratories, Inc. Audio-assisted video segmentation and summarization
US7164798B2 (en) 2003-02-18 2007-01-16 Microsoft Corporation Learning-based automatic commercial content detection
US8140965B2 (en) * 2003-02-28 2012-03-20 Google, Inc. Identifying related information given content and/or presenting related information in association with content-related advertisements
US20050038814A1 (en) * 2003-08-13 2005-02-17 International Business Machines Corporation Method, apparatus, and program for cross-linking information sources using multiple modalities
US20060020597A1 (en) * 2003-11-26 2006-01-26 Yesvideo, Inc. Use of image similarity in summarizing a collection of visual images
US7707039B2 (en) * 2004-02-15 2010-04-27 Exbiblio B.V. Automatic modification of web pages
KR100590537B1 (ko) * 2004-02-18 2006-06-15 삼성전자주식회사 복수 영상의 요약 방법 및 장치
GB0406512D0 (en) * 2004-03-23 2004-04-28 British Telecomm Method and system for semantically segmenting scenes of a video sequence
US20050228849A1 (en) * 2004-03-24 2005-10-13 Tong Zhang Intelligent key-frame extraction from a video
US20050267820A1 (en) 2004-06-01 2005-12-01 Zhiliang Zheng System, method and computer program product for finding customer orientated advertisements
US20070107022A1 (en) * 2004-06-08 2007-05-10 Lawrence Bradley R Iii Methods and apparatus to verify consumption of programming content
SG119229A1 (en) 2004-07-30 2006-02-28 Agency Science Tech & Res Method and apparatus for insertion of additional content into video
KR20070087067A (ko) 2004-12-13 2007-08-27 코닌클리케 필립스 일렉트로닉스 엔.브이. 수집된 미디어 컨텐트와의 유사성들에 따라 광고를전달하는 시스템 및 방법
US20060177114A1 (en) * 2005-02-09 2006-08-10 Trongtum Tongdee Medical digital asset management system and method
CA2600733A1 (en) * 2005-03-10 2006-09-21 Portalvideo, Inc. Video editing method and apparatus
US7421455B2 (en) * 2006-02-27 2008-09-02 Microsoft Corporation Video search and services
WO2007113458A1 (en) * 2006-03-30 2007-10-11 British Telecommunications Public Limited Company Video abstraction
WO2007115224A2 (en) * 2006-03-30 2007-10-11 Sri International Method and apparatus for annotating media streams
US20070255755A1 (en) * 2006-05-01 2007-11-01 Yahoo! Inc. Video search engine using joint categorization of video clips and queries based on multiple modalities
US20080065580A1 (en) * 2006-09-11 2008-03-13 Microsoft Corporation Unified user work environment for surfacing cross document relationships and componentized functionality
CN101021855B (zh) 2006-10-11 2010-04-07 北京新岸线网络技术有限公司 基于内容的视频检索系统
US20080109851A1 (en) 2006-10-23 2008-05-08 Ashley Heather Method and system for providing interactive video
US7986842B2 (en) * 2006-11-10 2011-07-26 Fuji Xerox Co., Ltd. Collective media annotation using undirected random field models
US8776107B2 (en) 2006-11-27 2014-07-08 Sony Corporation System and method for internet TV and broadcast advertisements
US20080178242A1 (en) * 2006-12-05 2008-07-24 Crackle, Inc. Video sharing platform providing for downloading of content to portable devices
US20080159383A1 (en) * 2006-12-27 2008-07-03 Yahoo! Inc. Tagboard for video tagging
JP5143747B2 (ja) * 2006-12-28 2013-02-13 シャープ株式会社 広告配信システム、広告配信サーバ、広告配信方法、プログラム及び記録媒体
US20080189736A1 (en) * 2007-02-07 2008-08-07 Sbc Knowledge Ventures L.P. System and method for displaying information related to a television signal
US20080270344A1 (en) * 2007-04-30 2008-10-30 Yurick Steven J Rich media content search engine
US8744337B2 (en) * 2007-06-18 2014-06-03 Qualcomm Incorporated Apparatus and methods of enhancing radio programming
US20090006208A1 (en) * 2007-06-26 2009-01-01 Ranjit Singh Grewal Display of Video with Tagged Advertising
US8433611B2 (en) * 2007-06-27 2013-04-30 Google Inc. Selection of advertisements for placement with content
US20090006368A1 (en) * 2007-06-29 2009-01-01 Microsoft Corporation Automatic Video Recommendation
US20090037262A1 (en) * 2007-07-30 2009-02-05 Yahoo! Inc. System for contextual matching of videos with advertisements
US8588583B2 (en) * 2007-08-22 2013-11-19 Adobe Systems Incorporated Systems and methods for interactive video frame selection
US20090094113A1 (en) * 2007-09-07 2009-04-09 Digitalsmiths Corporation Systems and Methods For Using Video Metadata to Associate Advertisements Therewith
US20110145068A1 (en) * 2007-09-17 2011-06-16 King Martin T Associating rendered advertisements with digital content
US8654255B2 (en) 2007-09-20 2014-02-18 Microsoft Corporation Advertisement insertion points detection for online video advertising
US8428360B2 (en) * 2007-11-01 2013-04-23 International Business Machines Corporation System and method for real-time new event detection on video streams
US8001561B2 (en) * 2007-11-20 2011-08-16 Samsung Electronics Co., Ltd. System and method for automatically rating video content
JP2009130529A (ja) * 2007-11-21 2009-06-11 Nippon Telegr & Teleph Corp <Ntt> 広告映像再生方法及び装置及びプログラム
KR100851435B1 (ko) * 2007-11-28 2008-08-11 (주)올라웍스 디지털 컨텐츠에 포함된 로고 정보에 기반한 정보 제공방법 및 시스템
US20090150784A1 (en) * 2007-12-07 2009-06-11 Microsoft Corporation User interface for previewing video items
US8156001B1 (en) * 2007-12-28 2012-04-10 Google Inc. Facilitating bidding on images
WO2009101623A2 (en) * 2008-02-13 2009-08-20 Innovid Inc. Inserting interactive objects into video content
US8676030B2 (en) * 2008-04-15 2014-03-18 Shlomo Selim Rakib Methods and systems for interacting with viewers of video content
US8763024B2 (en) * 2008-04-23 2014-06-24 At&T Intellectual Property I, Lp Systems and methods for searching based on information in commercials
US20090282016A1 (en) * 2008-05-07 2009-11-12 Yahoo! Inc. Systems and Methods for Building a Prediction Model to Predict a Degree of Relevance Between Digital Ads and a Search Query or Webpage Content
US8311390B2 (en) * 2008-05-14 2012-11-13 Digitalsmiths, Inc. Systems and methods for identifying pre-inserted and/or potential advertisement breaks in a video sequence
US20090313127A1 (en) * 2008-06-11 2009-12-17 Yahoo! Inc. System and method for using contextual sections of web page content for serving advertisements in online advertising
CN101616264B (zh) 2008-06-27 2011-03-30 中国科学院自动化研究所 新闻视频编目方法及系统
US8477246B2 (en) * 2008-07-11 2013-07-02 The Board Of Trustees Of The Leland Stanford Junior University Systems, methods and devices for augmenting video content
WO2010006334A1 (en) * 2008-07-11 2010-01-14 Videosurf, Inc. Apparatus and software system for and method of performing a visual-relevance-rank subsequent search
KR100926123B1 (ko) 2008-07-21 2009-11-11 강민수 디지털 콘텐츠에 포함된 텍스트 콘텐츠를 이용한 광고 방법
US20100023966A1 (en) * 2008-07-22 2010-01-28 At&T Labs System and method for contextual adaptive advertising
DE102008044635A1 (de) * 2008-07-22 2010-02-04 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Bereitstellen einer Fernsehsequenz
US8380564B2 (en) 2008-07-30 2013-02-19 At&T Intellectual Property I, Lp System and method for internet protocol television product placement data
KR100969790B1 (ko) * 2008-09-02 2010-07-15 엘지전자 주식회사 이동단말기 및 그 컨텐츠 합성방법
US20100077289A1 (en) * 2008-09-08 2010-03-25 Eastman Kodak Company Method and Interface for Indexing Related Media From Multiple Sources
US20100077435A1 (en) * 2008-09-24 2010-03-25 Concert Technology System and method for smart trick mode display
US8195038B2 (en) * 2008-10-24 2012-06-05 At&T Intellectual Property I, L.P. Brief and high-interest video summary generation
US8570376B1 (en) * 2008-11-19 2013-10-29 Videomining Corporation Method and system for efficient sampling of videos using spatiotemporal constraints for statistical behavior analysis
US20100145971A1 (en) * 2008-12-08 2010-06-10 Motorola, Inc. Method and apparatus for generating a multimedia-based query
KR20100095924A (ko) * 2009-02-23 2010-09-01 삼성전자주식회사 동영상의 상황정보를 반영한 광고 키워드 추출 방법 및 장치
US20100223132A1 (en) * 2009-02-27 2010-09-02 The Go Daddy Group, Inc. Embedding advertisements offering available, dynamic-content-relevant domain names in online video
US20100223113A1 (en) * 2009-02-27 2010-09-02 The Go Daddy Group, Inc. Systems for embedding advertisements offering available, dynamic-content-relevant domain names in online video
US8213725B2 (en) * 2009-03-20 2012-07-03 Eastman Kodak Company Semantic event detection using cross-domain knowledge
KR101550886B1 (ko) * 2009-03-27 2015-09-08 삼성전자 주식회사 동영상 콘텐츠에 대한 부가 정보 생성 장치 및 방법
CN102395991A (zh) * 2009-04-13 2012-03-28 恩斯沃尔斯有限责任公司 用于提供运动的图像广告的方法和装置
US8595781B2 (en) * 2009-05-29 2013-11-26 Cognitive Media Networks, Inc. Methods for identifying video segments and displaying contextual targeted content on a connected television
US20100306023A1 (en) * 2009-05-29 2010-12-02 Adobe Systems Incorporated Systems and Methods of Selecting Advertisements Using a Local User Profile
US20100312608A1 (en) * 2009-06-05 2010-12-09 Microsoft Corporation Content advertisements for video
US8068677B2 (en) * 2009-08-25 2011-11-29 Satyam Computer Services Limited System and method for hierarchical image processing
US20110085728A1 (en) * 2009-10-08 2011-04-14 Yuli Gao Detecting near duplicate images
US20110087553A1 (en) * 2009-10-14 2011-04-14 Yahoo! Inc. Bitrate preview for video objects
US10043193B2 (en) * 2010-01-20 2018-08-07 Excalibur Ip, Llc Image content based advertisement system
KR101667232B1 (ko) * 2010-04-12 2016-10-19 삼성전자주식회사 의미기반 검색 장치 및 그 방법과, 의미기반 메타데이터 제공 서버 및 그 동작 방법
US9443147B2 (en) * 2010-04-26 2016-09-13 Microsoft Technology Licensing, Llc Enriching online videos by content detection, searching, and information aggregation
US8898713B1 (en) * 2010-08-31 2014-11-25 Amazon Technologies, Inc. Content aggregation and presentation

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20010004739A1 (en) * 1999-09-27 2001-06-21 Shunichi Sekiguchi Image retrieval system and image retrieval method
JP2008269628A (ja) * 1999-09-27 2008-11-06 Mitsubishi Electric Corp 画像検索システムおよび画像検索方法
JP2001337984A (ja) * 2000-05-30 2001-12-07 Sony Communication Network Corp 広告システム、広告装置及び広告方法
JP2003283968A (ja) * 2002-03-26 2003-10-03 Fujitsu Ltd 動画像内容表示装置
JP2003330935A (ja) * 2002-05-15 2003-11-21 Toshiba Corp マルチモーダル情報システム及びマルチモーダル情報検索方法
WO2006028213A1 (ja) * 2004-09-11 2006-03-16 Yoshikuni Tamura 広告・情報配信システム
JP2008146490A (ja) * 2006-12-12 2008-06-26 Yahoo Japan Corp 情報提供装置、情報提供方法、及びコンピュータプログラム
US20080201361A1 (en) * 2007-02-16 2008-08-21 Alexander Castro Targeted insertion of an audio - video advertising into a multimedia object
JP2009038481A (ja) * 2007-07-31 2009-02-19 Sharp Corp データ送信装置、受信装置、データ送受信方法、プログラム及び記録媒体
JP2009087106A (ja) * 2007-09-30 2009-04-23 Sannetto:Kk インターネット情報提供サービスシステム

Also Published As

Publication number Publication date
WO2011139448A3 (en) 2012-02-16
US20160358025A1 (en) 2016-12-08
US20110264700A1 (en) 2011-10-27
WO2011139448A2 (en) 2011-11-10
CA2794680A1 (en) 2011-11-10
CN102884538B (zh) 2016-11-16
JP5781601B2 (ja) 2015-09-24
US9443147B2 (en) 2016-09-13
CN102884538A (zh) 2013-01-16
EP2564372A4 (en) 2017-04-12
EP2564372A2 (en) 2013-03-06

Similar Documents

Publication Publication Date Title
JP5781601B2 (ja) コンテンツ検出、検索、および、情報集約によるオンラインビデオの充実
US20230306057A1 (en) Relevance-Based Image Selection
CN108009228B (zh) 一种内容标签的设置方法、装置及存储介质
CN106921891B (zh) 一种视频特征信息的展示方法和装置
US9148619B2 (en) Music soundtrack recommendation engine for videos
US9652785B2 (en) System and method for matching advertisements to multimedia content elements
AU2011326430B2 (en) Learning tags for video annotation using latent subtags
US9355330B2 (en) In-video product annotation with web information mining
CN110134931B (zh) 媒介标题生成方法、装置、电子设备及可读介质
CN109558513B (zh) 一种内容推荐方法、装置、终端及存储介质
US20170255625A1 (en) Computer-implemented method for providing multimedia content and device
CN106326386B (zh) 搜索结果的展示方法和装置
CN111178056A (zh) 基于深度学习的文案生成方法、装置及电子设备
CN111723235B (zh) 音乐内容识别方法、装置及设备
CN113407775B (zh) 视频搜索方法、装置及电子设备
Sihag et al. A data-driven approach for finding requirements relevant feedback from tiktok and youtube
US20200257724A1 (en) Methods, devices, and storage media for content retrieval
Feng et al. Multiple style exploration for story unit segmentation of broadcast news video
Stein et al. From raw data to semantically enriched hyperlinking: Recent advances in the LinkedTV analysis workflow
CN113486212A (zh) 搜索推荐信息的生成和展示方法、装置、设备及存储介质
Varma et al. Video Indexing System Based on Multimodal Information Extraction Using Combination of ASR and OCR
WO2017106850A1 (en) Biasing scrubber for digital content
Kim et al. Multi-Modal Deep Learning based Metadata Extensions for Video Clipping.
CN117350307A (zh) 基于上下文的评论翻译
Shen et al. Video archaeology: understanding video manipulation history

Legal Events

Date Code Title Description
RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20130712

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20130719

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140307

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20140307

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20141106

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20141125

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20150225

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A711

Effective date: 20150523

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20150616

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20150715

R150 Certificate of patent or registration of utility model

Ref document number: 5781601

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees