JP2013529331A - 表示中のテレビジョン・コンテンツのための自動画像発見および推薦 - Google Patents

表示中のテレビジョン・コンテンツのための自動画像発見および推薦 Download PDF

Info

Publication number
JP2013529331A
JP2013529331A JP2013507952A JP2013507952A JP2013529331A JP 2013529331 A JP2013529331 A JP 2013529331A JP 2013507952 A JP2013507952 A JP 2013507952A JP 2013507952 A JP2013507952 A JP 2013507952A JP 2013529331 A JP2013529331 A JP 2013529331A
Authority
JP
Japan
Prior art keywords
topic
image
content
images
displayed content
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2013507952A
Other languages
English (en)
Inventor
リー,デカイ
カシュヤプ,アシュウィン
キム,ジョン・ウク
パドヒヤヴィーティル,アジス・コダカテリ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Thomson Licensing SAS
Original Assignee
Thomson Licensing SAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Thomson Licensing SAS filed Critical Thomson Licensing SAS
Publication of JP2013529331A publication Critical patent/JP2013529331A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/45Management operations performed by the client for facilitating the reception of or the interaction with the content or administrating data related to the end-user or to the client device itself, e.g. learning user preferences for recommending movies, resolving scheduling conflicts
    • H04N21/466Learning process for intelligent management, e.g. learning user preferences for recommending movies
    • H04N21/4668Learning process for intelligent management, e.g. learning user preferences for recommending movies for recommending content, e.g. movies
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/44Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream, rendering scenes according to MPEG-4 scene graphs
    • H04N21/44008Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream, rendering scenes according to MPEG-4 scene graphs involving operations for analysing video streams, e.g. detecting features or characteristics in the video stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/442Monitoring of processes or resources, e.g. detecting the failure of a recording device, monitoring the downstream bandwidth, the number of times a movie has been viewed, the storage space available from the internal hard disk
    • H04N21/44213Monitoring of end-user related data
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/44Receiver circuitry for the reception of television signals according to analogue transmission standards
    • H04N5/445Receiver circuitry for the reception of television signals according to analogue transmission standards for displaying additional information

Abstract

関係した画像を自動的に発見して推薦することのできる方法およびシステムが提供される。同じページ上に現れるまたは同じ写真家によって撮影された画像を画像発見のために使う。本システムは、画像をフィルタリングするために意味的な関連性を使うこともできる。画像のランク付けおよび写真家のランク付けのために感情分析が使われることもできる。

Description

関連出願への相互参照
本願は、ここに参照によってその全体において組み込まれる、2010年4月30日に出願された米国仮出願第61/343,547号の利益を主張する。
技術分野
本発明は、推薦システムに、より詳細には、現在試聴されているコンテンツのクローズド・キャプションに基づいて画像を発見および推薦することに関する。
テレビジョンはマス・メディアである。同じチャンネルについて、すべての視聴者が同じ番組のシーケンスを受ける。ユーザーが現在の番組に関係した異なる情報を選択するオプションは、ほとんどあるいは全くない。チャンネルを選択した後は、ユーザーは受動的になる。ユーザー対話はチャンネルを変更すること、電子番組ガイド(EPG: electronic program guide)を表示することなどに限定される。いくつかの番組について、ユーザーは関係した情報を取得したがる。たとえば、旅行チャンネルを見ているとき、多くの人は関連した画像を見たがる。
本発明は、関係した画像を自動的に発見して推薦することのできるシステムを開示する。
本発明は、同じページ上に現れるまたは同じ写真家によって撮影された画像を画像発見のために使う。本システムは、画像をフィルタリングするための意味的な関連性を使うこともできる。画像のランク付けおよび写真家のランク付けのために感情分析が使われることもできる。
ある実施形態によれば、表示されているコンテンツのための自動的な画像発見を実行する方法が提供される。本方法は、表示されているコンテンツのトピックを検出し、検出されたトピックに基づいて問い合わせ用語を抽出し、問い合わせ用語に基づいて画像を発見し、一つまたは複数の発見画像を表示する段階を含む。
もう一つの実施形態によれば、表示されているコンテンツのための自動的な画像発見を実行するシステムが提供される。本システムは、トピック検出モジュール、キーワード抽出モジュール、画像発見モジュールおよびコントローラを含む。トピック検出モジュールは、表示されているコンテンツのトピックを検出するよう構成される。キーワード抽出モジュールは、表示されているコンテンツのトピックから問い合わせ用語を抽出するよう構成される。画像発見モジュールは、問い合わせ用語に基づいて画像を発見するよう構成され、コントローラは、トピック検出モジュール、キーワード抽出モジュールおよび画像発見モジュールを制御するよう構成される。
本願の原理のこれらおよびその他の側面、特徴および利点は、付属の図面との関連で読まれるべき例示的な実施形態の以下の詳細な説明から明白となるであろう。
本願の原理は、以下の例示的な図面に基づいてよりよく理解されうる。
家庭またはエンド・ユーザーにコンテンツを送達するシステムのある実施形態のブロック図である。 メディア・サーバー、オンライン・ソーシャル・ネットワークおよびメディアを消費するための消費装置の配置を提示するシステムのブロック図である。 セットトップボックス/デジタル・ビデオ・レコーダーのある実施形態のブロック図である。 あるビデオ資産についてトピックが変わったかどうかを判定するフローチャートのための方法を示す図である。 図4の機能を実行することを受け取るための構成のブロック図である。 返された画像を放送されているビデオとともに表示するある実施形態を示す図である。
本願の原理は、向き付けられた推薦システム、より詳細には、現在試聴されているコンテンツのクローズド・キャプションに基づいて画像を発見および推薦することである。
ここで、本稿で明示的に記載や図示がされていなくても、本発明を具現し、その精神および範囲に含まれるさまざまな構成を当業者が考案できるであろうことは理解されるであろう。
本稿に記載されるあらゆる例および条件付きの言辞は、読者が、本発明および当該技術を進歩させる発明者によって寄与される概念を理解するのを支援するという教育目的のために意図されているのであって、そのような個別的に記載されている例および条件に限定することなく解釈されるものである。
さらに、本発明の原理、側面および実施形態ならびにその個別的な例を記載する本稿におけるあらゆる陳述は、その構造的および機能的な等価物の両方を包含することが意図されている。さらに、そのような等価物は、現在知られている等価物および将来開発される等価物、すなわち構造にかかわりなく同じ機能を実行する任意の開発された要素の両方を含むことが意図されている。
よって、たとえば、当業者は、本稿に呈示されるブロック図が本発明を具現する例示的な回路の概念図を表すものであることを理解するであろう。同様に、フローチャート、流れ図、状態遷移図、擬似コードなどはいずれも、コンピュータ可読媒体において実質的に表現され、コンピュータまたはプロセッサによって実行されうるさまざまなプロセスを表すことが理解されるであろう。これはそのようなコンピュータまたはプロセッサが明示的に示されているかどうかにはよらない。
図面に示されるさまざまな要素の機能は、専用ハードウェアの使用を通じて提供されても、適切なソフトウェアとの関連でソフトウェアを実行することのできるハードウェアの使用を通じて提供されてもよい。プロセッサによって提供されるとき、機能は単一の専用プロセッサによって、単一の共有されるプロセッサによって、あるいは一部が共有されていてもよい複数の個別プロセッサによって提供されうる。さらに、用語「プロセッサ」または「コントローラ」の明示的な使用は、ソフトウェアを実行することのできるハードウェアのみを指すものと解釈されるべきではなく、暗黙的に、限定なしに、デジタル信号プロセッサ(「DSP」)ハードウェア、ソフトウェアを記憶するための読み出し専用メモリ(「ROM」)、ランダム・アクセス・メモリ(「RAM」)および不揮発性記憶装置を含みうる。
従来のものおよび/またはカスタムのものを含め他のハードウェアも含まれてもよい。同様に、図面に示されるスイッチがあったとしても、それは単に概念的なものである。その機能はプログラム論理の動作を通じて、専用論理を通じて、プログラム制御と専用論理の相互作用を通じて、あるいはさらに手動で実行されてもよい。特定の技法は、コンテキストからより個別に理解されるように実装者によって選択可能である。
本願の請求項では、特定の機能を実行する手段として表現されたいかなる要素も、その機能を実行するいかなる仕方をも、たとえばa)その機能を実行する回路素子の組み合わせまたはb)任意の形の、したがってファームウェア、マイクロコードなどを含むソフトウェアを、当該機能を実行するためにそのソフトウェアを実行するための適切な回路と組み合わせたものを包含することが意図されている。そのような請求項によって定義される本発明は、前記さまざまな記載される手段によって提供される機能性が請求項が記載する仕方で組み合わされ、一緒にされるという事実にある。よって、これらの機能性を提供できる任意の手段が本願で示されている手段と等価であると見なされる。
明細書における本発明の「一つの実施形態」または「ある実施形態」またはその変形への言及は、その実施形態との関連で記載されている特定の特徴、構造、特性などが本発明の少なくとも一つの実施形態に含まれることを意味する。よって、本明細書を通じた随所に現れる「一つの実施形態では」または「ある実施形態では」といった句やそれらの何らかの変形の出現は、必ずしもみな同じ実施形態を指すのではない。
図1を参照するに、家庭またはエンド・ユーザーにコンテンツを送達するシステム100のある実施形態のブロック図が示されている。コンテンツは、映画スタジオまたはプロダクション会社のようなコンテンツ源102から発する。コンテンツは、二つの形のうちの少なくとも一つにおいて供給されることができる。一つの形は、コンテンツの放送される形であることができる。放送されるコンテンツは放送アフィリエート・マネージャ104に提供される。放送アフィリエート・マネージャは典型的には全国的な放送サービスであり、アメリカン・ブロードキャスティング・カンパニー(ABC: American Broadcasting Company)、ナショナル・ブロードキャスティング・カンパニー(NBC: National Broadcasting Company)、コロンビア・ブロードキャスティング・システム(CBS: Columbia Broadcasting System)といったものである。放送アフィリエート・マネージャはコンテンツを収集し、記憶することができ、送達ネットワーク1(106)として示される送達ネットワークを通じたコンテンツの送達をスケジューリングすることができる。送達ネットワーク1(106)は、全国的なセンターから一つまたは複数の地方もしくは地域のセンターへの衛星リンク送信を含むことができる。送達ネットワーク1(106)はまた、空中無線放送、衛星放送、ケーブル放送を通じてまたはIPを介して外部ネットワークからなどで、ローカルな送達システムを使うローカルなコンテンツ送達を含むこともできる。ローカルに送達されるコンテンツは、ユーザーの家庭にあるユーザーのセットトップボックス/デジタル・ビデオ・レコーダー(DVR: digital video recorder)108に提供され、そこで、コンテンツはその後、ユーザーによって検索可能な、利用可能なコンテンツのボディ内に含められる。
第二の形のコンテンツは、特殊コンテンツと称される。特殊コンテンツは、プレミアム試聴、ペイパービューまたは通常なら放送アフィリエート・マネージャに提供されない他のコンテンツとして送達されるコンテンツを含むことができる。多くの場合、特殊コンテンツは、ユーザーによって要求されたコンテンツであることができる。特殊コンテンツはコンテンツ・マネージャ110に送達されることができる。コンテンツ・マネージャ110は、たとえばコンテンツ・プロバイダー、放送サービスまたは送達ネットワーク・サービスと連携したインターネット・ウェブサイトのようなサービス・プロバイダーであることができる。コンテンツ・マネージャ110はまた、インターネット・コンテンツを送達システム中に組み込むこともでき、あるいは、ただユーザーのセットトップボックス/デジタル・ビデオ・レコーダー108にまだ送達されていないコンテンツが検索できるよう、明示的に検索中に組み込むこともできる。コンテンツ・マネージャ110はコンテンツをユーザーのセットトップボックス/デジタル・ビデオ・レコーダー108に別個の送達ネットワーク、送達ネットワーク2(112)を通じて送達できる。送達ネットワーク2(112)は高速ブロードバンド・インターネット型の通信システムを含むことができる。放送アフィリエート・マネージャ104からのコンテンツが送達ネットワーク2(112)の全部または諸部分を使って送達されることもでき、コンテンツ・マネージャ110からのコンテンツが送達ネットワーク1(106)の全部または諸部分を使って送達されることもできることを注意しておくことが重要である。さらに、ユーザーは、必ずしもコンテンツをコンテンツ・マネージャ110によって管理してもらうことなく、コンテンツを、送達ネットワーク2(112)を介してインターネットから直接取得することもできる。さらに、検索の範囲は、利用可能なコンテンツを越えて、将来放送されるまたは利用可能にされることのできるコンテンツまで広がる。
セットトップボックス/デジタル・ビデオ・レコーダー108は送達ネットワーク1および送達ネットワーク2の一方または両方から種々の型のコンテンツを受信できる。セットトップボックス/デジタル・ビデオ・レコーダー108はコンテンツを処理し、ユーザー選好およびコマンドに基づいてコンテンツの分離を提供する。セットトップボックス/デジタル・ビデオ・レコーダーは、オーディオおよびビデオ・コンテンツを記録および再生するための、ハードドライブまたは光学式ディスク・ドライブのような記憶装置を含むこともできる。セットトップボックス/デジタル・ビデオ・レコーダー108の動作のさらなる詳細および記憶されたコンテンツの再生に関連する機能は図3との関係で後述する。処理されたコンテンツは表示装置114に与えられる。表示装置114は通常の2D型のディスプレイであることもできるし、あるいはまた高度な3Dディスプレイであることもできる。無線電話、PDA、コンピュータ、ゲーム・プラットフォーム、リモコン、マルチメディア・プレーヤーなどといった表示機能をもつ他の装置が本開示の教示を用いることもでき、本開示の範囲内と考えられることは理解しておくべきである。
送達ネットワーク2は、ソーシャル・ネットワーキング機能を提供するウェブサイトまたはサーバーを表すオンライン・ソーシャル・ネットワーク116に結合される。たとえば、セットトップボックス108を操作するユーザーはオンライン・ソーシャル・ネットワーク116にアクセスでき、それにより、他のユーザーからの電子メッセージにアクセスし、コンテンツ選択のために他のユーザーによってなされる推薦をチェックし、他のユーザーによってポストされた写真を見、「インターネット・コンテンツ」パスを通じて利用可能な他のウェブサイトを参照する。
オンライン・ソーシャル・ネットワーク・サーバー116はコンテンツ・マネージャ110とも接続でき、両要素間で情報が交換できる。コンテンツ・マネージャ110を介してセットトップボックス108上で見るために選択されているメディアは、この接続から、オンライン・ソーシャル・ネットワーキング116のための電子メッセージにおいて参照されることができる。このメッセージは、セットトップボックス108でそのメディアを閲覧している消費ユーザーの状態情報にポストされることができる。すなわち、セットトップボックス108を使っているユーザーは、特定のメディア資産の<<ASSETID>>〔アセットID〕、<ASSETTYPE>>〔アセット型〕および<<LOCATION>>〔位置〕といった情報を示すコマンドがコンテンツ・マネージャ110から発されることを指示することができる。該情報は、ユーザーを識別するために使われる特定のフィールド<<USERNAME>>〔ユーザー名〕によって識別される特定のユーザーについて<<SERVICE ID>>〔サービスID〕においてリストされたオンライン・ソーシャル・ネットワーキング・サーバー116へのメッセージ内であることができる。識別子は、電子メール・アドレス、ハッシュ、英数字列などであることができる。
コンテンツ・マネージャ110はこの情報を、<<SERVICE ID>>内にリストされる示されたソーシャル・ネットワーキング・サーバー116に送る。&USERNAMEのための電子メッセージは、ユーザーの状態情報にポストされたメディア資産の<<ASSETID>>、<ASSETTYPE>>および<<LOCATION>>に適合する情報をもつ。ソーシャル・ネットワーキング・サーバー116にアクセスできる他のユーザーは、消費ユーザーがどのメディアを閲覧したかを見るために消費ユーザーの状態情報を読むことができる。
そのようなフィールドの情報の例を以下に挙げる。
Figure 2013529331
Figure 2013529331
メディア資産〔アセット〕という用語は(表3について下記で述べるように)、ビデオ・ベースのメディア、オーディオ・ベースのメディア、テレビ番組、映画、対話的サービス、ビデオ・ゲーム、HTMLベースのウェブ・ページ、ビデオ・オン・デマンド、オーディオ/ビデオ放送、ラジオ番組、広告、ポッドキャストなどであることができる。
Figure 2013529331
Figure 2013529331
図2は、メディア・サーバー、オンライン・ソーシャル・ネットワークおよびメディアを消費するための消費装置の配置を呈示するシステム200のブロック図を呈示している。メディア・サーバー210、215、225および230はメディアが記憶されるメディア・サーバーを表す。そのようなメディア・サーバーはハードドライブ、複数のハードドライブ、サーバー・ファーム、ディスク・ベースの記憶装置およびブロードバンド・ネットワークを通じたメディアの送達のために使用される他の型の大容量記憶装置であることができる。
メディア・サーバー210および215はコンテンツ・マネージャ110によって制御される。同様に、メディア・サーバー225および230はコンテンツ・マネージャ235によって制御される。メディア・サーバー上のコンテンツにアクセスするために、STB 108、パーソナル・コンピュータ260、テーブル270および電話280のような消費装置を操作するユーザーはそのようなコンテンツについて有料の加入資格をもつことができる。加入資格は、コンテンツ・マネージャ235との協定を通じて管理されることができる。たとえば、コンテンツ・マネージャ235はサービス・プロバイダーであることができ、STB 108を操作するユーザーは、映画チャンネルからの番組への、およびブロードバンド・ネットワーク250を通じてユーザーに音楽が送信されることができる音楽加入サービスへの加入資格をもつ。コンテンツ・マネージャ235は、STB 108に送達されるコンテンツの記憶および送達を管理する。同様に、パーソナル・コンピュータ260、タブレット270および電話280などといった他の装置については他の加入が存在できる。コンテンツ・マネージャ205および235を通じて利用可能な加入資格は重なりがあってもよいことを注意しておく。たとえば、ディズニーのような特定の映画スタジオに適合するコンテンツは両方のコンテンツ・マネージャを通じて利用可能であってもよい。同様に、両コンテンツ・マネージャ205および235は、利用可能なコンテンツにおいて違いがあってもよく、たとえば、コンテンツ・マネージャ205はESPNからのスポーツ番組を有することができ、一方、コンテンツ・マネージャ235はフォックススポーツからのコンテンツを利用可能にする。コンテンツ・マネージャ205および235は、NETFLIX、HULUなどといったコンテンツ・プロバイダーであることもできる。これらは、そのようなコンテンツ・プロバイダーにユーザーが加入する場合にメディア資産を提供する。そのような型のコンテンツ・プロバイダーについての代替名は用語、オーバー・ザ・トップ(over the top)サービス・プロバイダー(OTT)である。別のサービスの「上で」(on top of)送達されることができるからである。たとえば、図1を考えると、コンテンツ・マネージャ110はセットトップボックス108を操作しているユーザーにインターネット・アクセスを提供する。(図2におけるような)コンテンツ・マネージャ205/235からのオーバー・ザ・トップ・サービスは、コンテンツ源102などから「インターネット・コンテンツ」接続を通じて送達されることができる。
加入は、コンテンツ・マネージャ205、235によってコンテンツが許諾されることができる唯一の方法ではない。コンテンツ・マネージャがアクセスされるコンテンツについていかなる料金も課さない場合には、一部のコンテンツは、コンテンツ・マネージャ205、235を通じて自由にアクセスできる。コンテンツ・マネージャ205、235はまた、固定期間(時間数)の閲覧について単一料金でビデオ・オン・デマンドのように送達される他のコンテンツについても課金することができる。コンテンツは、購入され、STB 108、パーソナル・コンピュータ260、タブレット270などのような、コンテンツ・マネージャ205、235からコンテンツが受信されるユーザーの装置に記憶されることができる。コンテンツ・マネージャ205、235についての他の購入、レンタルおよび加入オプションも利用できる。
オンライン・ソーシャル・サーバー240、245は、ブロードバンド・ネットワーク250を通じて通信するオンライン・ソーシャル・ネットワークを運営するサーバーを表す。STB 108、パーソナル・コンピュータ260、タブレット270および電話280のような消費装置を操作するユーザーは、該装置を通じてオンライン・ソーシャル・サーバー240、245と、および他のユーザーと対話できる。実装されることのできるソーシャル・ネットワークのための一つの特徴は、異なる型の装置(PC、電話、タブレット、STB)を使っているユーザーがソーシャル・ネットワークを通じて互いと通信できるということである。たとえば、第一のユーザーおよび第二のユーザーがいずれも同じソーシャル・ネットワークを使っている場合、第一のユーザーが電話280を使い、一方、第二のユーザーがパーソナル・コンピュータ260を使っていたとしても、第一のユーザーは第二のユーザーのアカウントにメッセージをポストすることができる。ブロードバンド・ネットワーク250、パーソナル・コンピュータ260、タブレット270および電話280は、当技術分野において知られている用語である。たとえば、電話280はインターネット機能および音声通信に従事する能力をもつ携帯装置であることができる。
ここで図3に目を転じると、消費装置の一例として、セットトップボックス/デジタル・ビデオ・レコーダー300のコアのある実施形態のブロック図が示されている。示された装置300は、表示装置114を含む他のシステムに組み込まれることもできる。いずれの場合も、システムの完全な動作に必要ないくつかのコンポーネントは、当業者にはよく知られているので、簡潔のため示していない。
図3に示した装置300において、コンテンツは、入力信号受信器302において受領される。入力信号受信器302は、空中、ケーブル、衛星、イーサネット(登録商標)、ファイバーおよび電話線ネットワークを含むいくつかの可能なネットワークの一つを通じて提供される信号を受信し、復調し、復号するために使われるいくつかの既知の受信器回路の一つであることができる。入力信号受信器302において、制御インターフェース(図示せず)を通じて与えられるユーザー入力に基づいて、所望される入力信号が選択され、取り出されることができる。復号された出力信号は入力ストリーム・プロセッサ304に与えられる。入力ストリーム・プロセッサ304は最終的な信号選択および処理を実行し、そのコンテンツ・ストリームについてのオーディオ・コンテンツからビデオ・コンテンツの分離を含む。オーディオ・コンテンツは、圧縮されたデジタル信号のような受信されたフォーマットからアナログ波形信号への変換のためにオーディオ・プロセッサ306に提供される。アナログ波形信号はオーディオ・インターフェース308に、さらに表示装置114またはオーディオ・アンプ(図示せず)に与えられる。あるいはまた、オーディオ・インターフェース308はデジタル信号を、高精細度マルチメディア・インターフェース(HDMI: High-Definition Multimedia Interface)ケーブルまたはソニー/フィリップス・デジタル相互接続フォーマット(Sony/Philips Digital Interconnect Format)のような代わりのオーディオ・インターフェースを使って、オーディオ出力装置または表示装置に与えることができる。オーディオ・プロセッサ306は、オーディオ信号の記憶のための任意の必要な変換をも実行する。
入力ストリーム・プロセッサ304からのビデオ出力はビデオ・プロセッサ310に与えられる。ビデオ信号はいくつかのフォーマットの一つであることができる。ビデオ・プロセッサ310は、必然的に、入力信号フォーマットに基づくビデオ・コンテンツの変換を提供する。ビデオ・プロセッサ310はまた、ビデオ信号の記憶のための任意の必要な変換をも実行する。
記憶装置312は入力において受領されたオーディオおよびビデオ・コンテンツを記憶する。記憶装置312は、コントローラ314の制御のもとで、またユーザー・インターフェース316から受領されるコマンド、たとえば早送り(FF: fast-forward)および巻き戻し(Rew: rewind)のようなナビゲーション命令に基づいて、コンテンツののちの取得および再生を許容する。記憶装置312はハードディスク・ドライブ、静的ランダム・アクセス・メモリもしくは動的ランダム・アクセス・メモリのような一つまたは複数の大容量の統合された電子メモリであることができ、あるいはコンパクト・ディスク・ドライブまたはデジタル・ビデオ・ディスク・ドライブのような交換可能な光ディスク記憶システムであることもできる。ある実施形態では、記憶装置312は外付けで、本システム内に存在しなくてもよい。
入力にまたは記憶装置312に由来する、ビデオ・プロセッサ310からの変換されたビデオ信号は、ディスプレイ・インターフェース318に与えられる。ディスプレイ・インターフェース318はさらに、上記の型の表示装置に表示信号を提供する。ディスプレイ・インターフェース318は、赤緑青(RGB)のようなアナログ信号インターフェースであることができ、あるいは高精細度マルチメディア・インターフェース(HDMI)のようなデジタル・インターフェースであることができる。ディスプレイ・インターフェース318は、のちにより詳細に述べるように、三次元配列において検索結果を呈示するためのさまざまな画面を生成することが理解される。
コントローラ314はバスを介して、入力ストリーム・プロセッサ302、オーディオ・プロセッサ306、ビデオ・プロセッサ310、記憶装置312およびユーザー・インターフェース316を含む装置300のコンポーネントのいくつかに相互接続される。コントローラ314は、入力ストリーム信号を記憶装置上での記憶のためまたは表示のための信号に変換するための変換プロセスを管理する。コントローラ314は、記憶されたコンテンツの取り出しおよび再生をも管理する。さらに、後述するように、コントローラ314は、記憶されている、または上記の送達ネットワークを介して送達されるべきコンテンツの検索を実行する。コントローラ314はさらに、コントローラ214のための情報および命令コードを記憶する制御メモリ320(たとえば、ランダム・アクセス・メモリ、静的RAM、動的RAM、読み出し専用メモリ、プログラム可能型ROM、フラッシュ・メモリ、EPROM、EEPROMなどを含む揮発性もしくは不揮発性メモリ)に結合される。さらに、メモリの実装は、単一メモリ・デバイスまたは代替的に二つ以上のメモリ回路が一緒に接続されて共有または共通メモリを形成したものといったいくつかの可能な実施形態を含むことができる。さらに、メモリは、バス通信回路の一部のような他の回路と一緒に、より大きな回路の中に含められることができる。
効果的に操作するために、本開示のユーザー・インターフェース316はディスプレイのあたりでカーソルを動かす入力装置を用いる。カーソルがコンテンツの上を通過する際、コンテンツが拡大される。ある実施形態では、入力装置は、ジャイロスコープまたは加速度計のような何らかの形の動き検出を備えるリモコンであり、ユーザーがカーソルを画面または表示に関して自由に動かせるようにする。もう一つの実施形態では、入力装置はタッチパッドまたはタッチ感応性デバイスの形の、パッド上、画面上でのユーザーの動きを追跡するコントローラである。もう一つの実施形態では、入力装置は、方向ボタンをもつ伝統的なリモコンであることができる。
図4は、メディア資産に関連付けられたトピックを取得するための方法400を記載している。本方法はステップ405で始まる。本方法は、メディア資産に関連付けられた補助情報からキーワードを抽出することによって始まる(ステップ410)。しかしながら、他のキーワード抽出技法とは異なり、これはこの方法の最終的な処理ではない。一つのアプローチは、(セットトップボックス108中、コンテンツ・マネージャ205/235中などの)ビデオ・メディア資産と一緒に伝送されるEIA-608/EIA-708形式のクローズド・キャプション情報を処理するまたは読み込むクローズド・キャプション・プロセッサを使うことができる。クローズド・キャプション・プロセッサは、捕捉されたクローズド・キャプション・データをASCIIテキスト・ストリームとして出力するデータ・スライサーを有することができる。
異なる放送源が異なる仕方で構成されることができることを注意しておく。クローズド・キャプションおよび他の型の補助情報は、データ・ストリームがどのように構成されるかに依存して関心対象データを抽出するよう構成されることができる。たとえば、ATSC形式を使う米国での放送のためにフォーマットされたMPEG-2トランスポート・ストリームは、ヨーロッパでDVB-T送信のために使われるデジタル・ストリームとは異なり、日本で使われるARIBベースの送信とも異なる。
ステップ415では、このステップは、出力されたテキスト・ストリームが段階的に処理されて一連のキーワードを生成することで始まり、それらのキーワードがトピックにマッピングされる。すなわち、出力されたテキスト・ストリームは一連のセンテンスにフォーマットされる。
〈キーワード抽出〉
ある実施形態では、二つの型のキーワードに焦点が置かれる。名前のあるエンティティおよび有意な、単一語または複数語の句である。各センテンスについて、名前のあるエンティティ認識がまず使われて、すべての名前のあるエンティティ、たとえば人の名前、場所名などが同定される。しかしながら、クローズド・キャプションには、たとえば「彼」「彼女」「彼ら」などの代名詞もある。そこで、名前解決が適用されて、代名詞を、それが指す、名前のあるエンティティの全名に解決する。次いで、クローズド・キャプション・センテンスの(名前のあるエンティティ以外の)全nグラムについて、有意な句を見出すための辞書としてウィキペディアのようなデータベースが使用できる。1を超える長さの候補句それぞれについて、その先頭か末尾がストップワードであったら、それが除去される。ウィキペディアの使用は、ある種の無意味な句、たとえば「is a」「this is」を消去できる。
〈表層形態の解決〉
多くの句は種々の形をもつ。たとえば、「leaf cutter ant」「leaf cutter ants」「leaf-cutter ant」「leaf-cutter ants」〔ハキリアリ〕はみな同じものを指す。これらの句のいずれかが候補であるならば、正しい形が見出される必要がある。この問題を解決するために、ウィキペディアのようなデータベースのリダイレクト・ページが使用できる。ウィキペディアでは、「leaf cutter ant」「leaf cutter ants」「leaf-cutter ant」「leaf-cutter ants」はみな「leafcutter ant」というタイトルの単一のページにリダイレクトされる。ある句を与えられたとき、候補句としてすべてのリダイレクト・ページ・タイトルおよびターゲット・ページ・タイトルが使用できる。
〈追加的なストップワード・リスト〉
学術的ストップワード・リストおよび一般サービス・リストとして知られる、ストップワードの二つのリストも使用できる。これらの用語は、あまりに一般的であり、そのため有意な画像を位置発見するために使用できない句を除去するために、既存のストップワードのリストと組み合わされることができる。
〈データベース属性に基づくキーワードの選択〉
各データベース項目にはいくつかの属性が関連付けられることができる。たとえば、各ウィキペディア記事には次の属性が関連付けられることができる:ページにはいってくるリンクの数、出ていくリンクの数、一般性、曖昧さの数、ウィキペディア・コーパスにおいて記事タイトルが現れる総回数、それがリンクとして現れる回数など。
具体的な用語の大半について、属性の大半の値は、あまりに一般的と考えられた用語の値に比べて非常に小さいことが観察された。よって、具体的なまたは有意な用語の集合が使われ、その属性値が閾値を設定するために選ばれる。すると、この閾値内にはいらなかった特徴値をもつ用語はノイズ用語と考えられ、無視される。閾値より低い特徴値をもつ用語から、フィルタリングされたnグラム辞書が生成される。このフィルタリングされたnグラムは、クローズド・キャプションを処理し、クローズド・キャプションされたセンテンス中で有意な用語を見出すために使われる。
〈カテゴリーに基づくキーワードの選択〉
候補句〔候補フレーズ〕があるカテゴリー、たとえば「動物」にはいるとき、さらなるフィルタリングが実行できる。ワードネット(Wordnet)パッケージに対して徹底的な調査が実行された。ある単語、たとえば「python」〔ニシキヘビ〕がこのパッケージに与えられる場合、英語における単語「python」についてのあらゆる可能な意味が返される。よって、pythonについて、可能な意味は「reptile、reptilian、programming language」〔爬虫類、爬虫動物、プログラミング言語〕である。次いで、これらの意味が、一致を求めてコンテキスト用語と比較されることができる。
ある実施形態では、ウィキペディア・アプローチがワードネット・アプローチと組み合わされる。よって、いったんクローズド・キャプション化されたセンテンスが得られたら、その行が処理され、nグラムが見出され、それらのnグラムが検査されてそれらのnグラムがウィキペディア・コーパスに属するかどうかおよびそれらのnグラムがワードネット・コーパスに属するかどうかが判定される。このアプローチの試験において、クローズド・キャプション中の有意な用語の大半を取得することにおいてかなりの成功が達成できた。この方法に関する一つの問題は、ワードネットは単語についての意味しか与えず、キーフレーズについての意味は与えないという点であった。よって、たとえば、「blue whale」〔シロナガスクジラ〕はキーフレーズなので、意味が得られない。この問題に対する解決策は、キーフレーズの最後の用語のみを取り、ワードネットにおいてその意味を調べることによって見出された。よって、ワードネットにおいて「whale」〔クジラ〕の意味の検索が実行される場合、それが現在のコンテキストに属することが識別でき、よって「blue whale」が避けられることはない。
〈センテンス構造に基づくキーワードの選択〉
クローズド・キャプションにおける多くのセンテンスについて、主題フレーズは非常に重要である。よって、依存性解析器(dependency parser)を使ってセンテンスのヘッドを見出すことができ、センテンスのヘッドも候補フレーズであれば、センテンスのヘッドがより高い優先度を与えられることができる。
〈意味的関連性に基づくキーワードの選択〉
名前のあるエンティティ、用語フレーズは、現在のテレビ番組に直接関係しない種々のトピックを表すことがありうる。よって、どの用語フレーズがより関連しているかを判定することが必要である。いくつかのセンテンスを処理したのち、意味的関連性を使って、すべての用語が一緒にクラスター化される。次いで、最大の密度をもつクラスターが決定される。このクラスター内の用語は、関連画像問い合わせのために使用できる。
ステップ420では、キーワードはさらに処理される。それは、ある種のキーワードを特定のトピックに関連付ける所定のシソーラス・データベースを使って、抽出されたキーワードを(問い合わせ用語としての)一連のトピックにマッピングすることによる。このデータベースは、トピックの限られたセレクションが定義されており(特定の人々、主題など)、キーワードを特定の主題に対してマッピングするよう試みる比較器を使って、さまざまなキーワードがそのようなトピックに関連付けられるところでセットアップできる。たとえば、シソーラス・データベース(ワードネットおよびヤフー・オープンディレクトリー・プロジェクトのような)が、お金、株、市場といったキーワードがトピック「金融」に関連付けられているところでセットアップされることができる。同様に、米国大統領、第44代大統領、オバマ大統領、バラク・オバマのようなキーワードはトピック「バラク・オバマ」に関連付けられる。他のトピックは、トピック決定についてのこのまたは同様なアプローチを使って、キーワードから決定できる。これを行うもう一つの方法は、コンテンツがトピックに基づいてカテゴリー化されている、ウィキペディアまたは同様の知識ベースを使うことができる。ウィキペディアにおいて関連付けられたトピックをもつキーワードが与えられると、シソーラス・データベースを生成する目的のために、上述したようなキーワードのトピックへのマッピングを得ることができる。
ひとたび各センテンスについてそのようなトピックが決定されたら、そのようなセンテンスは、<topic_1:weight_1;topic_2;weight_2,…,topic_n,:weightN,ne_1,ne_2,…,ne_m>の形に表現できる。
topic_iはセンテンス中のキーワードに基づいて識別されるトピックであり、weight_iは対応する関連性であり、ne_iはセンテンス中で認識される名前のあるエンティティである。名前のあるエンティティは、センテンス中の人々、場所または他の固有名詞を参照する。これらは文法解析を使って認識できる。
いくつかのエンティティが頻繁に言及されるが、「he,she,they〔彼、彼女、彼ら〕」のような代名詞の使用を通じて間接的に挙げられることがありうる。各センテンスが別個に解析される場合には、そのような代名詞は算入されない。そのような単語はストップワード・リストに含まれるからである。単語「you〔あなた〕」は、それが頻繁に使われるので特別な場合である。名前解決の使用が、用語「you」を、前/現在のセンテンスで言及された特定のキーワード/トピックに割り当てる助けとなる。そうではなく、特定の用語に参照付けられない場合には、「you」は無視される。この問題を解決するため、名前解決は、ストップワード除去の前に行われることができる。
いくつかのセンテンスが同じセットのトピックを論じており、同じセットの名前のあるエンティティに言及する場合、一連のセンテンスの「現在トピック」が現在言及されているとの想定がなされる。新たな一組のセンテンスにおいて新たなトピックに言及される場合、新たなトピックが扱われていると想定される。ビデオ番組の過程でトピックは頻繁に変わることが予期される。
これらの同じ原理は、典型的にはユーザーによって「申し込み」され、ユーザーの装置によって受信されるリアリー・シンプル・シンジケーション(RSS: Really Simple Syndication)フィードの受領に適用されることもできる。これらのフィードは典型的にはテキストおよび関連するタグを表し、フィードから関連するトピックを見出すために本キーワード抽出プロセスを使うことができる。RSSフィードは関連する検索結果を返すために、後述するアプローチを使って解析されることができる。重要なことに、放送およびRSSフィード両方の使用は、本明細書に挙げられているアプローチを使うことによって、同時にできる。
〈トピック変化検出〉
現在のテレビ・トピックが終わって新しいトピックが始まるとき、新しいトピックに基づいて関連する画像が取得できるよう、この変化が検出される必要がある。この変化を検出できないと、古い問い合わせ結果と新しいトピックとの間にミスマッチが生じ、視聴者を混乱させる。早まった検出は不要な処理を招くことになりうる。
現在のトピックが終わって(405)新しいトピックが始まるとき、そのような変化は、ある時間期間にわたるキーワードのベクトルを使って検出される。たとえば、ニュース放送では、スポーツ、政治、気象などといった多くのトピックが論じられる。先に述べたように、各センテンスはトピック重みのリスト(ベクトルと称される)として表現される。連続するセンテンスの(あるいはまた固定数の単語を含む二つの窓の間での)類似性を比較することが可能である。ベクトルを比較するためには、余弦類似性またはジャカール指数(Jaccard index)を使うなど、多くの既知の類似性指標がある。そのようなベクトルの生成から、用語が比較でき、類似性が実行され、それによりそのようなベクトル間の相違が記録される。これらの比較はある時間期間にわたって実行される。そのような比較はトピックからトピックへとどのくらいの変化が起こるかを決定する助けになる。それにより、所定の閾値を決定することができる。使用される技法に依存する「相違」指標がその閾値を超えたらトピックが変化した可能性が高いのである。
このアプローチの一例として、現在のセンテンスが、依存性解析器を使って、現在トピックと突き合わせて検査される。依存性解析器は所与のセンテンスを処理し、該センテンスの文法構造を決定する。これらは、与えられたセンテンスに正確にタグ付けし、処理するために、機械学習技法を用いる高度に洗練されたアルゴリズムである。これは、英語に固有の多くの曖昧さのため、英語にとっては特にやっかいな問題である。第一に、センテンス中に代名詞があるかどうかを確認する検査が実行される。もしあれば、エンティティ解決ステップが実行されて、現在センテンスにおいてどのエンティティが言及されているかが決定される。代名詞が使われていない場合および新たなトピックが見出されない場合には、現在センテンスは前のセンテンスと同じトピックについてであると想定される。たとえば、「he/she/they/his/her」が現在センテンスにある場合、そのような用語は前のセンテンスからのエンティティを指している可能性が高い。そのような代名詞の用法は現在センテンスに、前のセンテンスと同じトピックに言及させることが想定できる。同様に、後続センテンスについて、該センテンス中での代名詞の使用は前のセンテンスと同じトピックを示すことが想定できる。
現在トピックについて、最も確からしいトピックおよび最も頻繁に言及されるエンティティが保持される。すると、トピックとエンティティの共起が、トピックの変化を検出するために使用できる。具体的には、少なくとも一つのトピックおよびそのために認識される一つのエンティティがある場合にセンテンスが使用される。ある数の連続したセンテンスについてその<topic_1,topic_2,…,topic_n,ne_1,ne_2,…,ne_m>が現在のトピックおよびエンティティをカバーしない場合に、トピックが変更される。大きな数を選ぶことは、より正確なトピック変更の検出を与えうるが、遅延が増大するという代償を伴う。試験のためには数3が選ばれた。
トピック間の変更(ステップ405)は、連続するセンテンスのベクトルの間に変化があるときに認知される。ここで、二つのベクトル間の相違は著しい差によって変動する。そのような相違はさまざまな実施形態において変更されることができるが、(相違における)大きな数はトピック変化の検出においてはより正確になることができるが、大きな数を使うことは、トピックの検出のより長い遅延を与える。ステップ425では、この新しいトピックをもって新しい問い合わせが提出されることができる。
〈画像発見〉
意味のある用語を抽出したのち、意味のある用語は、画像貯蔵サイト、たとえばFlickrに問い合わせしてこれらの用語でタグ付けされた画像を取得するために使用できる(ステップ430)。しかしながら、問い合わせ結果はしばしば、現在の番組に関係しないいくつかの画像を含む。現在のコンテキストに関連しない画像を除去するための一つの解決策は、結果画像のタグが現在のコンテキストに属するかどうかを検査することである。各番組について、それに関係する最も一般的な用語であるコンテキスト用語のリストが生成される。たとえば、自然、野生生物、風景および動物界のような諸コンテキストについて用語リストが生成されることができる。よって、ひとたびキーフレーズでタグ付けされた画像が得られたら、画像のタグのいずれかが現在のコンテキストまたはコンテキスト用語のリストにマッチするかどうかを検査することができる。マッチが見出された画像のみが関係した画像のリストに加えられる。
この問い合わせアプローチは、マッチする用語で明示的にタグ付けされている画像を与えるだけである。他の用語に関係する画像は取得できない。画像発見のために共起アプローチを使うことができる。直観的には、いくつかの画像が同じトピックを論じる同じページ内に一緒に現れるか、非常に似通った主題について同じ写真家によって撮影されたものであるならば、それらは関係している。ユーザーがその一つを好めば、他の画像が異なる用語を使ってタグ付けされているとしても、ユーザーは他の画像も好む可能性が高い。画像発見ステップは、現在のテレビ番組に関係する可能性のあるすべての画像候補を見出す。
各ウェブ文書はベクトルとして表現される:(ウェブ・ページについては、通例、ノイズとなるデータ、たとえば広告テキストを除去することが必要である)
D=<IMG1,TXT1,IMG2,TXT2,…IMGn,TXTn>
この文書の純粋なテキスト表現は
Dtxt=<TXT1,TXT2,…,TXTn>
となる。
IMGiはページ中に埋め込まれた画像であるところ、TXTiはこの画像の対応するテキスト記述である。画像の記述はその周囲のテキスト、たとえば同じHTMLエレメント(div)内のテキストであることができる。また、この画像に割り当てられたタグであることもできる。画像が、この画像のより大きなバージョンを示す別のページにリンクしている場合、新しいページのタイトルおよびテキストも画像記述として扱われる。
同様に、各写真家の写真コレクションは
Pu=<IMG1,TXT1,IMG2,TXT2,…IMGn,TXTn>
と表現される。
IMGiは写真家uによって撮影された画像であるところ、TXTi(1≦i≦n)はこの画像の対応するテキスト記述である。
この写真家の純粋なテキスト表現は
Pu,txt=<TXT1,TXT2,…,TXTn>
と表現される。
用語抽出段が用語ベクトル<T1 T2 … Tk>を抽出するとする。これらの抽出された用語はウェブ・ページおよび写真家コレクションのテキスト表現を問い合わせするために使われることができる。ウェブ・ページに含まれるまたは同じ写真家によって撮影された結果として得られる画像が候補として選ばれる。
〈画像推薦〉
画像発見ステップは、同じページ内に共起する、または同じ写真家によって撮影されたすべての画像を発見する。しかしながら、いくつかの共起するまたは同じ写真家に撮られた画像は、現在のテレビ番組とは全く異なるトピックについてであることがある。これらの画像が推薦されるとしたら、ユーザーは戸惑いかねない。したがって、関係しない画像は除去される。
各候補画像について、そのテキスト記述が現在のコンテキストと比較される。意味的関連性が、現在のテレビ・クローズド・キャプションと画像記述との間の関連性を測るために使用できる。次いで、ステップ440で、すべての画像が、現在のコンテキストとの意味的距離に従ってランク付けされる。意味的に関係した画像が上位にランク付けされる。
上位にランク付けされる画像は現在のテレビ・コンテキストに意味的に関係している。しかしながら、それらの画像は、画像品質、視覚効果、解像度などのため、ユーザーにとっては関心の度合いが異なることがある。したがって、意味的に関係した画像がすべてユーザーにとって関心があるものではない。よって、ステップ440は、これら意味的に関連する画像のさらなるランク付けを含む。
第一のランク付けアプローチは、意味的に関係した画像のそれぞれについて、レギュラー・ユーザーによってなされたコメントを使うことである。画像についてのコメントの数はしばしば画像の人気の高さを示す。より多くのコメントが画像についているほど、興味深いものであることがある。これは、大半のコメントが肯定的である場合に特に真である。最も単純なアプローチは、画像をランク付けするためにコメントの数を使うというものである。しかしながら、コメントの大半が否定的なものである場合には、満足のいくランク付けは達成できない。各コメントの方向性を考慮に入れる必要がある。各コメントについて、そのユーザーが肯定的であるか否定的であるかを見出すために、感情分析を使うことができる。人気のある画像は何百ものコメントがついている可能性が高く、一方、人気のない画像は高々数コメントしかついていないことがありうる。構成設定可能な数、たとえば100が評価を測るための閾値として指定されることができる。肯定的な評価だけが計数され、スコアは0から1までの間の範囲に制限される。それは次式によって定義される。
Figure 2013529331
もう一つのランク付けアプローチは、写真家の平均的な評価を使うことである。写真家の評価が高いほど、ユーザーがその写真家の他の画像を好む可能性が高くなる。写真家の評価は、その写真家が撮影した画像すべてを平均することによって計算されることができる。
ウェブサイトがユーザー・コメントを許可していないため、あるいはアップロードされたばかりで多くのユーザーの目に触れていないために、いくつかの画像が既知の写真家をもたず、コメントをもたないことがありうる。第三のランク付けアプローチは、画像色ヒストグラム分布を使うことである。人間の目は色の変化に対してより敏感だからである。第一に、人気のある画像のグループが選出され、その色ヒストグラム情報が抽出される。次いで、これらの画像の過半数の共通の属性が見出される。新たに発見された画像について、その共通属性からの距離が計算される。次いで、最も類似した画像が推薦のために選択される。
〈多様化〉
現在のコンテキストにマッチする上位N個の画像が互いにきわめて似通っている可能性がある。たいていのユーザーは、単一の型よりは多様な画像を好む。結果を多様にするため、ステップ450において、画像は、互いとの類似性に基づいてクラスター分類され、各クラスターからの最高ランクの画像が推薦される。画像のクラスター分類は記述テキストを使ってできる。それにより、非常に似通った記述をもつ画像は同じクラスターに入れられる。
〈パフォーマンスの考慮〉
画像のランク付けは、データ・セット全体に対する膨大な処理を必要とする。しかしながら、いくつかの特徴は頻繁には変化しない。たとえば、プロの写真家がすでに高く評価されている場合、その評価は、毎回再計算することなく、キャッシュすることができる。ある写真がすでに多くのコメント、たとえば100を超えるコメントにより高く評価されている場合、その評価もキャッシュされることができる。さらに、新たにアップロードされた写真または新しい写真家については、その評価が定期的に更新され、結果がキャッシュされることができる
次いで、ステップ460において、選択された代表画像がユーザーに対して呈示される。この時点で、図4に描かれた方法は終了する(ステップ470)。
図5は、上記の方法を実行するために使用できるコンポーネントの簡略化された構成のブロック図500を描いている。これらのコンポーネントは、コントローラ510およびメモリ515、ディスプレイ・インターフェース520、通信インターフェース530、キーワード抽出モジュール540、トピック変化検出モジュール550および画像発見モジュール560および画像推薦モジュール570を含む。これらのそれぞれについて下記でより詳細に論じる。
コントローラ510は他のすべてのコンポーネントと通信しており、他のコンポーネントを制御するはたらきをする。コントローラ510は、図3に関して述べたのと同じコントローラ314、コントローラ314のサブセットまたは全く別個のコントローラであることができる。
メモリ515は、コントローラ510によって使用されるデータや他のコンポーネントを制御するためにコントローラ510によって実行されるコードを記憶するよう構成される。メモリ510は図3に関して述べたのと同じメモリ320、メモリ320のサブセットまたは全く別個のメモリであることができる。
ディスプレイ・インターフェース520はユーザーへの画像推薦の出力を扱う。よって、それは、図4のステップ460の実行に関わる。ディスプレイ・インターフェース520は、図3に関して述べたのと同じディスプレイ・インターフェース316、ディスプレイ・インターフェース316のサブセットまたは全く別個のディスプレイ・インターフェースであることができる。
通信インターフェース530は、コントローラの、インターネットおよびユーザーとの通信を扱う。通信インターフェース530は、図3に関して述べた入力信号受信器302またはユーザー・インターフェース316、両者の組み合わせ、いずれかのサブセットまたは全く別個の通信インターフェースであることができる。
キーワード抽出モジュール540は、図4のステップ420および425との関連で述べた機能を実行する。キーワード抽出モジュール540はソフトウェア、ハードウェアまたは両者の組み合わせで実装できる。
トピック変化検出モジュール550は、図4のステップ410および415との関連で述べた機能を実行する。トピック変化検出モジュール550はソフトウェア、ハードウェアまたは両者の組み合わせで実装できる。
画像発見モジュール560は、図4のステップ430との関連で述べた機能を実行する。画像発見モジュール560はソフトウェア、ハードウェアまたは両者の組み合わせで実装できる。
画像推薦モジュール570は、図4のステップ440および450との関連で述べた機能を実行する。画像推薦モジュール570はソフトウェア、ハードウェアまたは両者の組み合わせで実装できる。
図6は、表示されている番組620のトピックに関係した、発見された画像610を表示する例示的な画面キャプチャ600を描いている。この実施例では、画像610は、複数の見出された関連画像の画像クラスターの代表画像である。画面キャプチャ600に見られるように、表示されている番組620は、ゴルフ選手タイガー・ウッズについてのCNNリポートである。よって、推薦される見出された画像610はゴルフ関係のものである。
本願の原理のこれらおよびその他の特徴および利点は、本稿の教示に基づいて当業者には容易に見きわめられるであろう。本願の原理の教示はハードウェア、ソフトウェア、ファームウェア、特殊目的プロセッサまたはそれらの組み合わせのさまざまな形で実装されうることは理解しておくべきである。
最も好ましくは、本願の原理の教示はハードウェアおよびソフトウェアの組み合わせとして実装される。さらに、ソフトウェアは、プログラム記憶ユニット上に具体的に具現されたアプリケーション・プログラムとして実装されてもよい。該アプリケーション・プログラムはいかなる好適なアーキテクチャを有する機械にアップロードされ、該機械によって実行されてもよい。好ましくは、前記機械は、一つまたは複数の中央処理ユニット(「CPU」)、ランダム・アクセス・メモリ(「RAM」)および入出力(「I/O」)インターフェースといったハードウェアをもつコンピュータ・プラットフォーム上で実装される。前記コンピュータ・プラットフォームはまた、オペレーティング・システムおよびマイクロ命令コードをも含みうる。本稿に記載されたさまざまなプロセスおよび機能はマイクロ命令コードの一部もしくはアプリケーション・プログラムの一部またはそれらの任意の組み合わせであってよく、CPUによって実行されてよい。さらに、追加的なデータ記憶ユニットおよび印刷ユニットといったさまざまな他の周辺ユニットがコンピュータ・プラットフォームに接続されていてもよい。
付属の図面に描かれている構成システム・コンポーネントおよび方法のいくつかは好ましくはソフトウェアにおいて実装されるので、システム・コンポーネントまたはプロセス機能ブロックの間の実際の接続は、本願の原理がプログラムされる仕方に依存して異なることがありうる。本稿の教示を与えられれば、当業者は、本願の原理のこれらおよび同様の実装または構成を考えることができるであろう。
本稿では例示的な実施形態が付属の図面を参照して記載されてきたが、本願の原理はそうした厳密な実施形態に限定されるものではなく、当業者は本願の原理の範囲や精神から外れることなくそれにさまざまな変更および修正を実施しうることは理解されるものである。そのようなすべての変更および修正は付属の請求項に記載される本願の原理の範囲内に含まれることが意図されている。

Claims (14)

  1. 表示されているコンテンツのための自動的な画像発見を実行する方法であって:
    表示されているコンテンツのトピックを検出する段階と;
    検出されたトピックに基づいて問い合わせ用語を抽出する段階と;
    前記問い合わせ用語に基づいて画像を発見する段階と;
    一つまたは複数の発見された画像を表示する段階とを含む、
    方法。
  2. トピックが変化したかどうかを検出する段階と;
    前記問い合わせ用語を更新する段階とをさらに含む、
    請求項1記載の方法。
  3. 表示されているコンテンツのトピックを検出する前記段階が:
    表示されているコンテンツに備わるクローズド・キャプションを処理することを含む、
    請求項1記載の方法。
  4. 検出されたトピックに基づいて問い合わせ用語を抽出する前記段階が:
    名前を挙げられているエンティティおよび有意な句に基づいてキーワードを抽出することを含む、
    請求項1記載の方法。
  5. キーワード抽出が:
    カテゴリーに基づいてキーワードを選択すること;
    センテンス構造に基づいてキーワードを選択すること;および
    意味的関連性に基づいてキーワードを選択すること、
    のうちの一つまたは複数を含む、請求項4記載の方法。
  6. キーワード抽出が:
    有意な句を判別するためにデータベースを参照することを含む、
    請求項4記載の方法。
  7. 検出されたトピックに基づいて問い合わせ用語を抽出する前記段階が:
    ある候補句について表層形態を解決することを含む、
    請求項1記載の方法。
  8. 発見された画像を、トピックとの関連性に基づいてランク付けする段階をさらに含む、
    請求項1記載の方法。
  9. 前記問い合わせ用語に基づいて画像を発見する前記段階が:
    オンライン画像データベースを検索することを含む、
    請求項1記載の方法。
  10. 関係した画像をクラスター化する段階と;
    各クラスターについて代表画像を選択する段階とをさらに含む、
    請求項1記載の方法。
  11. 表示されているコンテンツのための自動的な画像発見を実行するシステムであって:
    表示されているコンテンツのトピックを検出するよう構成されているトピック検出モジュールと;
    検出されたトピックから問い合わせ用語を抽出するよう構成されているキーワード抽出モジュールと;
    問い合わせ用語に基づいて画像を発見するよう構成されている画像発見モジュールと;
    前記トピック検出モジュール、キーワード抽出モジュールおよび画像発見モジュールを制御するよう構成されているコントローラとを有する、
    システム。
  12. 発見された画像の一つまたは複数を表示するために構成されているディスプレイ・インターフェースをさらに有する、請求項11記載のシステム。
  13. 前記コントローラのためのデータおよび命令を記憶するよう構成されているメモリと;
    前記コントローラにインターネットおよびユーザーとのインターフェースをもたせるよう構成されている通信インターフェースとをさらに有する、
    請求項11記載のシステム。
  14. コンピュータ可読プログラムを有するコンピュータ使用可能媒体を有するコンピュータ・プログラム・プロダクトであって、前記コンピュータ可読プログラムは、コンピュータ上で実行されたときに、該コンピュータに:
    表示されているコンテンツのための自動的な画像発見を実行することを含む方法段階を実行させるものであって、該方法段階は:
    表示されているコンテンツのトピックを検出する段階と;
    検出されたトピックに基づいて問い合わせ用語を抽出する段階と;
    前記問い合わせ用語に基づいて画像を発見する段階と;
    一つまたは複数の発見された画像を表示する段階とを含む、
    コンピュータ・プログラム・プロダクト。
JP2013507952A 2010-04-30 2011-04-29 表示中のテレビジョン・コンテンツのための自動画像発見および推薦 Pending JP2013529331A (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US34354710P 2010-04-30 2010-04-30
US61/343,547 2010-04-30
PCT/US2011/000762 WO2011136855A1 (en) 2010-04-30 2011-04-29 Automatic image discovery and recommendation for displayed television content

Publications (1)

Publication Number Publication Date
JP2013529331A true JP2013529331A (ja) 2013-07-18

Family

ID=44343797

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013507952A Pending JP2013529331A (ja) 2010-04-30 2011-04-29 表示中のテレビジョン・コンテンツのための自動画像発見および推薦

Country Status (7)

Country Link
US (1) US20130007057A1 (ja)
EP (1) EP2564331A1 (ja)
JP (1) JP2013529331A (ja)
KR (1) KR20130083829A (ja)
CN (1) CN102884524A (ja)
BR (1) BR112012026750A2 (ja)
WO (1) WO2011136855A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101491628B1 (ko) 2013-07-30 2015-02-12 성균관대학교산학협력단 블로그에서 대중의 감성 변화에 영향을 미치는 키워드 추출 방법, 장치 및 시스템

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9443518B1 (en) * 2011-08-31 2016-09-13 Google Inc. Text transcript generation from a communication session
US9319372B2 (en) * 2012-04-13 2016-04-19 RTReporter BV Social feed trend visualization
US8612211B1 (en) 2012-09-10 2013-12-17 Google Inc. Speech recognition and summarization
US9268861B2 (en) * 2013-08-19 2016-02-23 Yahoo! Inc. Method and system for recommending relevant web content to second screen application users
CN104639993A (zh) * 2013-11-06 2015-05-20 株式会社Ntt都科摩 视频节目推荐方法及其服务器
US9749701B2 (en) 2014-04-17 2017-08-29 Microsoft Technology Licensing, Llc Intelligent routing of notifications to grouped devices
WO2016153510A1 (en) 2015-03-26 2016-09-29 Hewlett-Packard Development Company, L.P. Image selection based on text topic and image explanatory value
US10785180B2 (en) * 2015-06-11 2020-09-22 Oath Inc. Content summation
US10191899B2 (en) * 2016-06-06 2019-01-29 Comigo Ltd. System and method for understanding text using a translation of the text
US20180039854A1 (en) * 2016-08-02 2018-02-08 Google Inc. Personalized image collections
US10789298B2 (en) 2016-11-16 2020-09-29 International Business Machines Corporation Specialist keywords recommendations in semantic space
US20180189521A1 (en) 2017-01-05 2018-07-05 Microsoft Technology Licensing, Llc Analyzing data to determine an upload account
KR101871828B1 (ko) * 2017-07-03 2018-06-28 (주)망고플레이트 온라인 콘텐츠의 대표 이미지 선정 장치 및 방법

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11345340A (ja) * 1998-04-22 1999-12-14 Nec Corp 画像分類方法、画像問い合わせ方法、画像分類装置、画像問い合わせ装置
JP2002358323A (ja) * 2001-03-30 2002-12-13 Just Syst Corp 検索要求文生成装置、検索結果提示装置、検索要求文生成方法、検索結果提示方法、検索要求文生成プログラム、検索結果提示プログラム、データ検索装置、データ検索方法、及びデータ検索プログラム
WO2005027092A1 (ja) * 2003-09-08 2005-03-24 Nec Corporation 文書作成閲覧方法、文書作成閲覧装置、文書作成閲覧ロボットおよび文書作成閲覧プログラム
JP2008061120A (ja) * 2006-09-01 2008-03-13 Sony Corp 再生装置、検索方法、およびプログラム
JP2009146013A (ja) * 2007-12-12 2009-07-02 Fujifilm Corp コンテンツ検索方法及び装置並びにプログラム
JP2009157460A (ja) * 2007-12-25 2009-07-16 Hitachi Ltd 情報提示装置及び方法
JP2010066870A (ja) * 2008-09-09 2010-03-25 Toshiba Corp 情報推薦装置および情報推薦方法

Family Cites Families (31)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5809471A (en) * 1996-03-07 1998-09-15 Ibm Corporation Retrieval of additional information not found in interactive TV or telephony signal by application using dynamically extracted vocabulary
US6363380B1 (en) * 1998-01-13 2002-03-26 U.S. Philips Corporation Multimedia computer system with story segmentation capability and operating program therefor including finite automation video parser
US20010003214A1 (en) * 1999-07-15 2001-06-07 Vijnan Shastri Method and apparatus for utilizing closed captioned (CC) text keywords or phrases for the purpose of automated searching of network-based resources for interactive links to universal resource locators (URL's)
US7490092B2 (en) * 2000-07-06 2009-02-10 Streamsage, Inc. Method and system for indexing and searching timed media information based upon relevance intervals
US20030208755A1 (en) * 2002-05-01 2003-11-06 Koninklijke Philips Electronics N.V. Conversational content recommender
US7386542B2 (en) * 2004-08-30 2008-06-10 The Mitre Corporation Personalized broadcast news navigator
WO2007017887A1 (en) * 2005-08-10 2007-02-15 Hewlett-Packard Development Company, L.P. Delivering specific contents to specific recipients using broadcast networks
US8185543B1 (en) * 2004-11-10 2012-05-22 Google Inc. Video image-based querying for video content
US7657126B2 (en) * 2005-05-09 2010-02-02 Like.Com System and method for search portions of objects in images and features thereof
US8392415B2 (en) * 2005-12-12 2013-03-05 Canon Information Systems Research Australia Pty. Ltd. Clustering of content items
US7421455B2 (en) * 2006-02-27 2008-09-02 Microsoft Corporation Video search and services
US20080235209A1 (en) * 2007-03-20 2008-09-25 Samsung Electronics Co., Ltd. Method and apparatus for search result snippet analysis for query expansion and result filtering
US20070265999A1 (en) * 2006-05-15 2007-11-15 Einat Amitay Search Performance and User Interaction Monitoring of Search Engines
US8589973B2 (en) * 2006-09-14 2013-11-19 At&T Intellectual Property I, L.P. Peer to peer media distribution system and method
WO2008043082A2 (en) * 2006-10-05 2008-04-10 Splunk Inc. Time series search engine
US20080098433A1 (en) * 2006-10-23 2008-04-24 Hardacker Robert L User managed internet links from TV
US20080177708A1 (en) * 2006-11-01 2008-07-24 Koollage, Inc. System and method for providing persistent, dynamic, navigable and collaborative multi-media information packages
US9076148B2 (en) * 2006-12-22 2015-07-07 Yahoo! Inc. Dynamic pricing models for digital content
US20080276266A1 (en) * 2007-04-18 2008-11-06 Google Inc. Characterizing content for identification of advertising
US20080313146A1 (en) * 2007-06-15 2008-12-18 Microsoft Corporation Content search service, finding content, and prefetching for thin client
WO2009029956A2 (en) * 2007-08-31 2009-03-05 Jacked, Inc. User generated content
KR101348598B1 (ko) * 2007-12-21 2014-01-07 삼성전자주식회사 디지털 티비 방송 제공 시스템과 디지털 티비 및 그 제어방법
KR101392273B1 (ko) * 2008-01-07 2014-05-08 삼성전자주식회사 키워드 제공 방법 및 이를 적용한 영상기기
JP5371083B2 (ja) * 2008-09-16 2013-12-18 Kddi株式会社 顔識別特徴量登録装置、顔識別特徴量登録方法、顔識別特徴量登録プログラム及び記録媒体
US9049477B2 (en) * 2008-11-13 2015-06-02 At&T Intellectual Property I, Lp Apparatus and method for managing media content
US8713016B2 (en) * 2008-12-24 2014-04-29 Comcast Interactive Media, Llc Method and apparatus for organizing segments of media assets and determining relevance of segments to a query
US8539359B2 (en) * 2009-02-11 2013-09-17 Jeffrey A. Rapaport Social network driven indexing system for instantly clustering people with concurrent focus on same topic into on-topic chat rooms and/or for generating on-topic search results tailored to user preferences regarding topic
US20100306235A1 (en) * 2009-05-28 2010-12-02 Yahoo! Inc. Real-Time Detection of Emerging Web Search Queries
US20110082880A1 (en) * 2009-10-07 2011-04-07 Verizon Patent And Licensing, Inc. System for and method of searching content
US8489600B2 (en) * 2010-02-23 2013-07-16 Nokia Corporation Method and apparatus for segmenting and summarizing media content
US10692093B2 (en) * 2010-04-16 2020-06-23 Microsoft Technology Licensing, Llc Social home page

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11345340A (ja) * 1998-04-22 1999-12-14 Nec Corp 画像分類方法、画像問い合わせ方法、画像分類装置、画像問い合わせ装置
JP2002358323A (ja) * 2001-03-30 2002-12-13 Just Syst Corp 検索要求文生成装置、検索結果提示装置、検索要求文生成方法、検索結果提示方法、検索要求文生成プログラム、検索結果提示プログラム、データ検索装置、データ検索方法、及びデータ検索プログラム
WO2005027092A1 (ja) * 2003-09-08 2005-03-24 Nec Corporation 文書作成閲覧方法、文書作成閲覧装置、文書作成閲覧ロボットおよび文書作成閲覧プログラム
JP2008061120A (ja) * 2006-09-01 2008-03-13 Sony Corp 再生装置、検索方法、およびプログラム
JP2009146013A (ja) * 2007-12-12 2009-07-02 Fujifilm Corp コンテンツ検索方法及び装置並びにプログラム
JP2009157460A (ja) * 2007-12-25 2009-07-16 Hitachi Ltd 情報提示装置及び方法
JP2010066870A (ja) * 2008-09-09 2010-03-25 Toshiba Corp 情報推薦装置および情報推薦方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
CSNG200700721005; 岡本 昌之: '映像ブックマーク検索における字幕からの検索キーワード推定' 情報処理学会研究報告 第2007巻,第41号, 20070511, p.35-42, 社団法人情報処理学会 *
CSNH200800011005; 小山 誠: 'クローズドキャプションを利用したテレビ番組の話題分割技術' 東芝レビュー 第63巻,第1号, 20080101, p.72-73, 株式会社東芝 *
JPN6015005937; 小山 誠: 'クローズドキャプションを利用したテレビ番組の話題分割技術' 東芝レビュー 第63巻,第1号, 20080101, p.72-73, 株式会社東芝 *
JPN6015005938; 岡本 昌之: '映像ブックマーク検索における字幕からの検索キーワード推定' 情報処理学会研究報告 第2007巻,第41号, 20070511, p.35-42, 社団法人情報処理学会 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101491628B1 (ko) 2013-07-30 2015-02-12 성균관대학교산학협력단 블로그에서 대중의 감성 변화에 영향을 미치는 키워드 추출 방법, 장치 및 시스템

Also Published As

Publication number Publication date
BR112012026750A2 (pt) 2016-07-12
WO2011136855A1 (en) 2011-11-03
US20130007057A1 (en) 2013-01-03
KR20130083829A (ko) 2013-07-23
EP2564331A1 (en) 2013-03-06
CN102884524A (zh) 2013-01-16

Similar Documents

Publication Publication Date Title
JP2013529331A (ja) 表示中のテレビジョン・コンテンツのための自動画像発見および推薦
US11197036B2 (en) Multimedia stream analysis and retrieval
CN106331778B (zh) 视频推荐方法和装置
US8115869B2 (en) Method and system for extracting relevant information from content metadata
US20170366828A1 (en) Processing and delivery of segmented video
US9253511B2 (en) Systems and methods for performing multi-modal video datastream segmentation
US9008489B2 (en) Keyword-tagging of scenes of interest within video content
US8209724B2 (en) Method and system for providing access to information of potential interest to a user
KR102212355B1 (ko) 현재 재생되는 텔레비젼 프로그램들과 연관된 인터넷-액세스가능 컨텐츠의 식별 및 제시
US10504039B2 (en) Short message classification for video delivery service and normalization
US20150189343A1 (en) Dynamic media segment pricing
KR20210054491A (ko) 검색, 추천, 및 발견을 촉진하기 위해 머신-학습 추출물들 및 시맨틱 그래프들을 이용하여 구조화된 데이터를 생성하는 방법들 및 시스템들
US10652592B2 (en) Named entity disambiguation for providing TV content enrichment
US20130291019A1 (en) Self-learning methods, entity relations, remote control, and other features for real-time processing, storage, indexing, and delivery of segmented video
US20160014482A1 (en) Systems and Methods for Generating Video Summary Sequences From One or More Video Segments
US9286385B2 (en) Method and system for providing access to information of potential interest to a user
JP6429382B2 (ja) コンテンツ推薦装置、及びプログラム
JP5894149B2 (ja) Top−k処理を活用した意味の充実
KR20030007727A (ko) 자동 비디오 리트리버 제니
US20120323900A1 (en) Method for processing auxilary information for topic generation
Sumiyoshi et al. CurioView: TV recommendations related to content being viewed
JP2010218385A (ja) コンテンツ検索装置及びコンピュータプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20140428

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20150209

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20150217

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20150513

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20151020