JP6408551B2 - メディアコンテンツに対応する携帯型コンテンツを提供するための方法、システム、および記録媒体 - Google Patents

メディアコンテンツに対応する携帯型コンテンツを提供するための方法、システム、および記録媒体 Download PDF

Info

Publication number
JP6408551B2
JP6408551B2 JP2016501451A JP2016501451A JP6408551B2 JP 6408551 B2 JP6408551 B2 JP 6408551B2 JP 2016501451 A JP2016501451 A JP 2016501451A JP 2016501451 A JP2016501451 A JP 2016501451A JP 6408551 B2 JP6408551 B2 JP 6408551B2
Authority
JP
Japan
Prior art keywords
program
images
user
procedure
channel
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2016501451A
Other languages
English (en)
Other versions
JP2016521390A (ja
Inventor
オズタスケント、アント
ボロビッチ、ヤロスラブ
シングルトン、デイビッド
ドレイソン、ティンボ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Google LLC
Original Assignee
Google LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Google LLC filed Critical Google LLC
Publication of JP2016521390A publication Critical patent/JP2016521390A/ja
Application granted granted Critical
Publication of JP6408551B2 publication Critical patent/JP6408551B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/482End-user interface for program selection
    • H04N21/4828End-user interface for program selection for searching program descriptors
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/41Structure of client; Structure of client peripherals
    • H04N21/414Specialised client platforms, e.g. receiver in car or embedded in a mobile appliance
    • H04N21/41407Specialised client platforms, e.g. receiver in car or embedded in a mobile appliance embedded in a portable device, e.g. video client on a mobile phone, PDA, laptop
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/439Processing of audio elementary streams
    • H04N21/4394Processing of audio elementary streams involving operations for analysing the audio stream, e.g. detecting features or characteristics in audio streams
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/44Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs
    • H04N21/44008Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving operations for analysing video streams, e.g. detecting features or characteristics in the video stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/472End-user interface for requesting content, additional data or services; End-user interface for interacting with content, e.g. for content reservation or setting reminders, for requesting event notification, for manipulating displayed content
    • H04N21/47217End-user interface for requesting content, additional data or services; End-user interface for interacting with content, e.g. for content reservation or setting reminders, for requesting event notification, for manipulating displayed content for controlling playback functions for recorded or on-demand content, e.g. using progress bars, mode or play-point indicators or bookmarks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/472End-user interface for requesting content, additional data or services; End-user interface for interacting with content, e.g. for content reservation or setting reminders, for requesting event notification, for manipulating displayed content
    • H04N21/4722End-user interface for requesting content, additional data or services; End-user interface for interacting with content, e.g. for content reservation or setting reminders, for requesting event notification, for manipulating displayed content for requesting additional data associated with the content
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/472End-user interface for requesting content, additional data or services; End-user interface for interacting with content, e.g. for content reservation or setting reminders, for requesting event notification, for manipulating displayed content
    • H04N21/4722End-user interface for requesting content, additional data or services; End-user interface for interacting with content, e.g. for content reservation or setting reminders, for requesting event notification, for manipulating displayed content for requesting additional data associated with the content
    • H04N21/4725End-user interface for requesting content, additional data or services; End-user interface for interacting with content, e.g. for content reservation or setting reminders, for requesting event notification, for manipulating displayed content for requesting additional data associated with the content using interactive regions of the image, e.g. hot spots
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/60Network structure or processes for video distribution between server and client or between remote clients; Control signalling between clients, server and network components; Transmission of management data between server and client, e.g. sending from server to client commands for recording incoming content stream; Communication details between server and client 
    • H04N21/65Transmission of management data between client and server
    • H04N21/658Transmission by the client directed to the server
    • H04N21/6582Data stored in the client, e.g. viewing habits, hardware capabilities, credit card number
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/81Monomedia components thereof
    • H04N21/8126Monomedia components thereof involving additional data, e.g. news, sports, stocks, weather forecasts
    • H04N21/8133Monomedia components thereof involving additional data, e.g. news, sports, stocks, weather forecasts specifically related to the content, e.g. biography of the actors in a movie, detailed information about an article seen in a video program

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Human Computer Interaction (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Television Signal Processing For Recording (AREA)

Description

開示された主題は、メディアコンテンツに対応する携帯型コンテンツを提供するための方法、システム、および記録媒体に関する。
テレビ番組を見ている間、視聴者は、しばしばテレビ番組に関する情報に関心がある。たとえば視聴者は、映画で見られる俳優についての、またはドキュメンタリーの中で示される場所についての追加情報を検索したくなるかもしれない。
検索エンジンは、視聴者がインターネット上でウェブページ、画像、ビデオコンテンツ、および音声コンテンツを含むリソースを検索することを可能にする。典型的な検索エンジンは、検索語を入力するためのウェブページを提供するが、そこでは検索語は視聴者によって入力される。特別な検索語に対して処理された検索結果は、視聴者に提供される。その上、携帯装置の出現によって、携帯型検索エンジンの使用が増加した。たとえば携帯装置を使用して、視聴者は、テレビ番組を見ている間に検索を実施し、かつインターネットコンテンツを拾い読みしてもよい。
米国特許出願公開第2013/047178号明細書
しかしながら、テキストベースの検索エンジンは、このユーザに対しては多少制限されるかもしれない。1つの例において、そこではユーザは映画の中の特別な俳優の名前を知り、かつその特別な俳優についての追加情報を獲得したいのであるが、ユーザは、その映画の題名を見つけ(たとえば番組ガイドから、オンラインテレビ案内ウェブサイトから、印刷されたガイドから、など)、かつそれを携帯型検索エンジンに入力することでその映画に対する検索を行うことによって、この情報の獲得を試みるかもしれない。ユーザは、その後、その映画に関する情報を含むウェブページ(たとえば映画およびテレビ番組に関する情報を含むオンラインウェブページ)を見つけるために、検索結果をクリックし、ウェブページにアクセスし、かつ特別な俳優に関する情報を見つけるためにウェブページを検索する。もしユーザがウェブページ上でその俳優を見つけることができれば、ユーザは、その特別な俳優に関するウェブサイト上の別のページにアクセスし、かつその特別な俳優についての所望の情報を見つけるために、このページにざっと目を通す。これはユーザにとって時間のかかる手続きである。その上これはユーザが、テレビ番組の重要な部分を見逃す、またはこの手続きを介してそのような情報を獲得するためにテレビ番組を中断させる原因となるかもしれない。
従って、メディアコンテンツに対応する携帯型コンテンツを提示するための仕組みが望まれる。
メディアコンテンツに対応する携帯型コンテンツを提示するための方法、システムおよび媒体が提供される。
開示された主題のいくつかの実施例に従って、メディアコンテンツに関する情報を提供するための方法が提供され、この方法は、ハードウェアプロセッサが、テレビ番組を提供しているチャンネルを決定する手順と、ハードウェアプロセッサが、テレビ番組に関する複数の画像が提示されることを引き起こす手順であって、前記複数の画像は、チャンネルおよび時間パラメータに基づき選択される、手順と、ハードウェアプロセッサが、複数の画像からの、ユーザによる1つの画像の選択を受信する手順と、ハードウェアプロセッサが、1つ以上の画像認識技術を用いて、選択された画像の中で1つのエンティティ(実体)を識別する手順と、ハードウェアプロセッサが、識別されたエンティティに少なくとも部分的に基づき検索クエリを生成する手順と、ハードウェアプロセッサが、生成された検索クエリへの応答を示す複数の検索結果を獲得する手順と、ハードウェアプロセッサが、ユーザによる画像の選択を受信する手順に呼応して、複数の検索結果のうちの少なくとも1つが提示されることを引き起こす手順と、を備える。
開示された主題のいくつかの実施例に従って、メディアコンテンツに関する情報を提供するためのシステムが提供され、このシステムは、ハードウェアプロセッサを備え、前記ハードウェアプロセッサは、テレビ番組を提供しているチャンネルを決定し、テレビ番組に関する複数の画像であって、前記複数の画像はチャンネルおよび時間パラメータに基づき選択され、前記複数の画像が提示されることを引き起こし、複数の画像からの、ユーザによる1つの画像の選択を受信し、1つ以上の画像認識技術を使用して、選択された画像の中で1つのエンティティを識別し、識別されたエンティティに少なくとも部分的に基づき、検索クエリを生成し、生成された検索クエリへの応答を示す複数の検索結果を獲得し、かつユーザによる画像の選択を受信する手順に呼応して、複数の検索結果のうちの少なくとも1つが、携帯装置に提示されることを引き起こす、ように構成される。
開示された主題のいくつかの実施例に従って、非一時的なコンピュータ可読媒体が提供され、前記非一時的なコンピュータ可読媒体はコンピュータ実行可能な命令を含み、前記コンピュータ実行可能な命令は、プロセッサによって実行される場合、前記プロセッサが、メディアコンテンツに関する情報を提供するための方法を実施することを引き起こす。本方法は、テレビ番組を提供しているチャンネルを決定する手順と、テレビ番組に関する複数の画像が提示されることを引き起こす手順であって、前記複数の画像は、チャンネルおよび時間パラメータに基づき選択される、手順と、複数の画像からの、ユーザによる1つの画像の選択を受信する手順と、1つ以上の画像認識技術を使用して、選択された画像の中で1つのエンティティを識別する手順と、識別されたエンティティに少なくとも部分的に基づき、検索クエリを生成する手順と、生成された検索クエリへの応答を示す複数の検索結果を獲得する手順と、ユーザによる画像の選択を受信する手順に呼応して、複数の検索結果のうちの少なくとも1つが、携帯装置に提示されることを引き起こす手順と、を備える。
開示された主題のいくつかの実施例に従って、メディアコンテンツに関する情報を提供するためのシステムが提供される。本システムは、テレビ番組を提供しているチャンネルを決定するための手段と、テレビ番組に関する複数の画像が提示されることを引き起こすための手段であって、前記複数の画像は、チャンネルおよび時間パラメータに基づき選択される、手段と、複数の画像からの、ユーザによる1つの画像の選択を受信するための手段と、1つ以上の画像認識手段を使用して、選択された画像の中で1つのエンティティを識別するための手段と、識別されたエンティティに少なくとも部分的に基づき、検索クエリを生成するための手段と、生成された検索クエリへの応答を示す複数の検索結果を獲得するための手段と、ユーザによる画像の選択を受信する手順に呼応して、複数の検索結果のうちの少なくとも1つが、携帯装置に提示されることを引き起こすための手段と、を備える。
いくつかの実施例において、本システムは、テレビ番組に対応する音声データを携帯装置から受信するための手段をさらに備え、そこではチャンネルは、受信された音声データに基づき決定される。
いくつかの実施例において、本システムは、音声データの音声指紋を獲得するための手段をさらに備える。
いくつかの実施例において、本システムは、受信された音声データから音声指紋を生成するための手段をさらに備える。
いくつかの実施例において、本システムは、複数のテレビチャンネルの各々から、音声ストリームを抽出するための手段と、複数のテレビチャンネルの各々に対して、前記複数のテレビチャンネルの1つに対応する、抽出された音声ストリームのうちの少なくとも一部分から、少なくとも1つの音声指紋を生成するための手段と、チャンネルによって索引付けされたデータベースに、少なくとも1つの音声指紋を格納するための手段と、をさらに備える。
いくつかの実施例において、本システムは、音声指紋を、少なくとも1つの格納された音声指紋と比較するための手段と、比較に基づき、テレビ番組を識別するための手段と、をさらに備える。
いくつかの実施例において、本システムは、複数のテレビチャンネルの各々から、複数の番組画像を抽出するための手段と、チャンネルおよび時間によって索引付けされたデータベースに、複数の番組画像を格納するための手段と、をさらに備える。
いくつかの実施例において、本システムは、複数の画像を獲得するために、決定されたチャンネルおよび時間パラメータを使用するための手段をさらに備え、そこでは複数の画像は、複数の抽出された番組画像の部分集合である。
いくつかの実施例において、本システムは、選択された画像の中で、ユーザによる関心領域の第2選択を受信するための手段と、1つ以上の画像認識技術を使用して、関心領域の中で問題のエンティティを識別するための手段と、をさらに備える。
いくつかの実施例において、本システムは、顔認識技術を使用して、選択された画像の中で複数の顔を検出するための手段と、携帯装置を促して、複数の検出された顔から1つの顔を選択させる手段と、選択された顔に関連付けられたエンティティを識別するための手段と、をさらに備える。
いくつかの実施例において、本システムは、決定されたチャンネルおよび時間パラメータに基づき、テレビ番組を決定するための案内データにアクセスするための手段と、テレビ番組に関する番組情報を受信するための手段と、受信された番組情報を使用して、選択された画像の中で問題のエンティティを識別するための手段と、をさらに備える。
次の図面に関連して考察される場合、開示された主題の様々な目的、特徴および利点は、開示された主題の、次の詳細な説明を参照することによって、より十分に正しく認識され得る。図面の中で、同様な参照符号は、同様な要素と見なされる。
開示された主題のいくつかの実施例に従い、メディアコンテンツに基づき検索結果を提示するためのプロセスの実例を示す図。 開示された主題のいくつかの実施例に従い、音声データに基づきチャンネルおよび他の番組情報を決定し、かつ音声データに関連付けられたスクリーンショットを送信するためのプロセスの実例を示す図。 開示された主題のいくつかの実施例に従い、クライアントアプリケーションのユーザによって選択された画像から識別されたエンティティを含む検索クエリを生成するためのプロセスの実例を示す図。 開示された主題のいくつかの実施例に従い、テレビ番組のようなメディアコンテンツを提供している装置と、クライントアプリケーションを開始するにあたり、前記テレビ番組に関する複数の画像を提供する携帯装置と、画像を選択するためのインターフェースと、画像に中で識別されたエンティティに関する検索結果と、の実例を示す図。 開示された主題のいくつかの実施例に従い、メディアコンテンツに対応する、検索結果のようなコンテンツを提供するために、本明細書で説明される仕組みを実施するのに適した例証的システムの概略図。 開示された主題のいくつかの実施例に従って使用され得る、図5のサーバおよびコンピューティング装置の1つの詳細な例を示す図。
開示された主題のいくつかの実施例に従って、メディアコンテンツに対応する携帯型コンテンツを提示するための仕組みが提供される。
いくつかの実施例ではこれらの仕組みは、1つ以上の番組に関する音声データまたは他の任意の適切なメディアデータを受信することが可能である。たとえば携帯装置上でクライアントアプリケーションを起動することに呼応して、これらの仕組みは、チャンネル検出モードに入ることが可能であるが、このチャンネル検出モードは、音声入力装置(たとえばマイクロフォン)を作動させることと、表示装置上に現在提示されているテレビ番組に対応する音声データを取り込むこととを含む。より多くの特別な例において、音声指紋または他の任意の適切なデジタル表現は、受信された音声データから生成されることが可能であり、そこでは音声指紋は、音声データの同じ部分または類似部分を識別するために使用され得る。
音声データを受信する手順に呼応して、本仕組みは、テレビ番組を提供しているチャンネルを識別することが可能である。たとえば音声データおよび/または音声指紋を受信するにあたり、本仕組みは、チャンネルを識別するために、他の格納された表現(たとえば他の音声指紋、他の音声データなど)に対して音声データを比較することが可能である。
注意されるべきことであるが、いくつかの実施例では音声データは取り込まれないかもしれない。たとえばチャンネル検出モードは、メディア再生装置(これは携帯装置に接続される)が現在調整されているチャンネルを検出するために、クライアントアプリケーションを使用して、チャンネルを識別する手順を含むことが可能である。別の例では、携帯装置が、赤外線符号または符号系列のような符号を、メディア再生装置に送信するための送信器を含む場合、チャンネル検出モードは、携帯装置のユーザが選択した最後のチャンネルを決定することによってチャンネルを識別する手順を含むことが可能である。この例では、携帯装置およびユーザ入力装置(たとえば遠隔制御器)が、通信ネットワークを介して接続される場合、チャンネル検出モードは、ユーザが選択した最後のチャンネルに対するクエリをユーザ入力装置に送信することによってチャンネルを識別する手順を含むことが可能である。さらに別の例では、クライアントアプリケーションは、携帯装置のユーザに選択のためのチャンネルのリストを提示することが可能である。この例では、クライアントアプリケーションによって、携帯装置のユーザは、自分がメディア再生装置(これは、携帯装置に接続されてもよく、またはそうでなくともよい)上で見ている特別なチャンネルを指し示すことが可能である。
音声データまたは他の任意の適切な番組情報に関連付けられたチャンネル情報を使用して、本仕組みは、番組に関する複数の画像を獲得することが可能である。たとえばこれらの仕組みは、スクリーンショット閲覧モードに入ることが可能であり、このモードは、画像(たとえば番組コンテンツのスクリーンショット)のデータベースにアクセスし、かつ識別されたチャンネルおよび時間パラメータ(たとえば最後のN分)に対応する複数の画像を獲得する手順を含む。画像は、その後、クライアントアプリケーションに逆送信されることが可能であり、前記クライアントアプリケーションは、自身のユーザによる再検討および選択のために、携帯装置上で実行される。この例では、クライアントアプリケーションは、ユーザに複数の画像を提示できるが、これら複数の画像は、特別な時間期間内にチャンネルによって提示される場面を含む。
ユーザによって画像の1つが選択されることを受信する手順に呼応して、本仕組みは、検索クエリを生成することが可能である。たとえば選択された画像を受信する手順に呼応して、これらの仕組みは結果表示モードに入ることが可能であり、前記結果表示モードは、選択された画像(たとえば人、場所、目印、対象物など)の中で1つのエンティティを識別し、かつ識別されたエンティティに少なくとも部分的に基づき検索クエリを生成する手順を含む。より特別な例では、本仕組みは、1つ以上の画像認識技術(たとえば画像認識、光学特性認識、顔認識など)を使用して、選択された画像の中で1つ以上のエンティティを識別することが可能である。別のより特別な例では、本仕組みは、選択された画像の中で関心領域を受信することが可能であり、かつ1つ以上のエンティティが、関心領域の中で識別され得る。関心領域は、たとえば特別な顔、特別な目印などを含む、ユーザによって定義された領域を含むことが可能である。
検索クエリを生成するにあたり、本仕組みは、識別されたエンティティを含む検索クエリへの応答を示す検索結果を獲得するための検索を実施することが可能である。検索結果は、たとえば検索クエリの中の用語への応答を示すウェブページに関連付けられたユニフォーム・リソース・ロケータ(URL)を含むことが可能である。いくつかの実施例では本仕組みは、検索結果のうちの少なくとも1つを選択して、ユーザに提示するために、クライアントアプリケーションに送信することが可能である。いくつかの実施例では本仕組みは、ユーザに提示するために、検索結果の全てをクライアントアプリケーションに送信することが可能である。代わりに、本仕組みは、携帯装置上で実行される適切なウェブ閲覧アプリケーション上で、選択された検索結果(たとえば最上位の検索結果)に関連付けられたページを自動的に開くことが可能である。注意されるべきことであるが、回答のような任意の適切なコンテンツが、携帯装置に提供されることが可能であり、前記回答には、エンティティ情報、要約されたエンティティ情報、識別されたエンティティに対応する一組のリンク、識別されたエンティティに対応するニュース情報などが含まれる。
注意されるべきことであるが、本明細書で説明される実施例は、一般にテレビ番組に対応する携帯型コンテンツを提供することに関するものの、これは単に例証的である。テレビ番組は、ライブの放送メディアコンテンツであり得るが、その一方で、本仕組みは、記録されたコンテンツ、ネット配信動画番組コンテンツなどに対応する携帯型コンテンツを提供するために実施されることが可能である。
これらの仕組みは、様々なアプリケーションで使用され得る。たとえばこれらの仕組みは、表示装置上に提示されたメディアコンテンツと対話する機会を、携帯装置のユーザに提供するために使用され得る。別の例では、これらの仕組みは、テキストベースの検索クエリを検索エンジンに入力することなく、提示されたメディアコンテンツに関連付けられた追加情報を、携帯装置のユーザに提供するために使用され得る。さらに別の例では、本明細書で説明される仕組みを実施するクライアントアプリケーションを起動することに呼応して、スクリーンショットおよびその後のエンティティに関連した情報が、ユーザに自動的に提示され得る。
図1に注意を向けると、メディアコンテンツに基づき検索結果を提示するためのプロセスの実例100が、開示された主題のいくつかの実施例に従って示されている。ステップS105では、コンピューティング装置は、メディアコンテンツに基づき検索結果を提示するクライアントアプリケーションを読み込むことが可能である。コンピューティング装置は、携帯装置であり得る(たとえば携帯電話、スマートフォン、タブレットコンピューティング装置、ウェアラブルコンピューティング装置など)。
注意されるべきことであるが、メディアコンテンツは、様々なソースから1つ以上の番組を含むことが可能であるが、それらは、無線ネットワークで放送される番組、ケーブルテレビプロバイダによって放送される番組、電話テレビプロバイダによって放送される番組、衛星テレビプロバイダによって放送される番組、オンデマンド番組、ネット配信動画番組、インターネットコンテンツ、ストリーム番組、録画番組などのようなものである。
ステップS110では、いったんクライアントアプリケーションが読み込まれると、クライアントアプリケーションはチャンネル検出モードに入るが、チャンネル検出モードは、現在提示されているテレビ番組の音声サンプルを獲得することによって始まることが可能である。たとえばクライアントアプリケーションは、マイクロフォンのような、コンピューティング装置に結合された音声入力装置を作動させることが可能である。そこでは音声入力装置は、提示されたテレビ番組に関連付けられた音声サンプルまたは他の任意の適切な音声データを取り込み、かつ記録する。別の例では、クライアントアプリケーションは、ユーザの指示を受信して、音声マッチングサービスに送信するための音声データを格納することが可能である。
いくつかの実施例ではクライアントアプリケーションは、音声入力装置を作動させることが可能であり、前記音声入力装置は、その周囲から音声を取り込み、かつ適切なフィルタ作用および/または他の音声増強作用を使用して、提示されたテレビ番組に関連付けられた音声指紋またはフィルタ作用で処理された音声データを抽出する。たとえば音声サンプルの無音部分は、音声サンプルのファイルサイズを減少させるために除去され得る。別の例では、歪みを持つ音声サンプルの部分は、音声サンプルのファイルサイズを減少させるために除去され得る。さらに別の例では、音声サンプルのうちの少なくとも1つの部分が、ある一定の品質を有する音声データを含んでいないと決定することに呼応して、クライアントアプリケーションは、自身のユーザを促して、別の音声サンプルを記録させることが可能である。
いくつかの実施例ではコンピューティング装置上で実行されるクライアントアプリケーションは、ステップS215で、任意の適切な音声指紋技術を使用して、音声サンプルの音声指紋を生成することが可能である。音声指紋は、受信された音声サンプルから生成されたデジタル表現であり得るが、ここで音声指紋は、音声データの同じ部分または類似部分を識別するために使用され得る。代わりに、クライアントアプリケーションは、テレビ番組に関連付けられた音声サンプルを、音声指紋を生成する検索システムに送信することが可能である。
ステップS120では、クライアントアプリケーションは、解析のために、獲得された音声サンプルおよび/または音声指紋を送信することが可能である。たとえばクライアントアプリケーションを起動し、かつ音声入力装置を作動させるにあたり、クライアントアプリケーションは、音声サンプルおよび/または音声指紋を、マッチングサービス(たとえば音声指紋マッチサービス)にアクセスする検索システムに自動的にストリームで送ることが可能である。上述のように、クライアントアプリケーションは、音声サンプルを検索システムにストリームで送ることが可能であるが、ここで検索システムは、音声サンプルに対応する音声指紋を生成し、かつ解析のために、その音声指紋を音声指紋マッチサービスに送信する。
いくつかの実施例では追加情報が、音声サンプルと一緒に送信され得るが、追加情報とは、クライアント装置情報、ユーザプロファイル情報、場所情報、ユーザ嗜好、タイミング情報、およびテレビ番組の音声サンプルに関連付けられた検索クエリを生成するために使用され得る他の情報、のようなものである。
注意されるべきことであるが、クライアントアプリケーション(または本明細書で説明される他の仕組み)が特別なユーザについての情報を収集するという内容の、本明細書で説明される実施例においては、クライアントアプリケーションが特別なユーザについての情報を収集するかどうか、および/または収集されたユーザ情報がクライアントアプリケーションによっていかに使用されるかを制御する機会が、ユーザに提供され得る。ユーザについての情報例には、ユーザの関心、およびユーザを識別する情報(たとえばユーザプロファイル、ユーザ証明書、装置識別など)が含まれ得る。加えてユーザについてのある情報は、それが格納されて個人情報が削除される前に、局所的に格納され(たとえば共有されない)、暗号化され、かつ/または1つ以上の方法で処理され得る。たとえばクライアントアプリケーションは、特別なユーザに対して、ユーザ嗜好および/またはユーザの関心を、匿名のユーザ識別子(たとえばユーザの名前、ユーザのユーザ名および/またはパスワード、ユーザのEメイルアドレス等に関連付けられないユーザ識別子)を用いて格納することが可能である。これらの技術を使用して、ユーザについてどんな情報が収集されるか、および/またはその情報がクライアントアプリケーションによっていかに使用されるかに対して、ユーザは制御することが可能である。
図2に注意を向けると、ステップS205で音声サンプルおよび/または他の追加情報をクライアントアプリケーションから受信するにあたり、受信された音声サンプルの音声指紋は、ステップS210で生成され得る。再び、音声指紋が、クライアントアプリケーションまたは他の任意の適切なアプリケーションによって生成され、かつ解析のために、検索システムに送信され得る。
ステップS215では、検索システムは、生成された音声指紋を複数の音声指紋と比較することが可能である。たとえばクライアントアプリケーションからの音声サンプルに関連付けられた、生成された音声指紋は、格納された音声指紋の部分集合に対して比較されることが可能である。より特別な例では、検索システムは、データベース、または複数の音声指紋を含む他の適切な格納装置にアクセスし、かつ場所情報、ユーザ嗜好、およびクライアントアプリケーションから受信された他の情報に基づき、音声指紋の部分集合に対して、複数の音声指紋をフィルタ作用で処理することが可能である。この例では、受信された場所情報に関連付けられた音声指紋だけが、生成された音声指紋と比較するために使用され得る。別の例では、データベースまたは格納装置からの特別な音声指紋は、人気チャンネル、より新しい音声指紋、一般的にマッチした音声指紋などに関連付けられた音声指紋のような他の音声指紋よりも前に、比較のために使用され得る。
いくつかの実施例では検索システムは、たとえば複数のソース(たとえば複数のチャンネル)からの信号を受信し、かつ処理する取込モジュールを含むことが可能である。これらの取込モジュールは、各チャンネルに対して、特別な時間間隔で(たとえば2秒または3秒ごとに)ビデオスクリーンショットを取り込み、かつ/または特別な時間間隔で音声データから音声指紋を生成することが可能である。概して言えば、これらの取込モジュールは、複数のコンテンツソースからのメディアコンテンツを監視し、かつビデオスクリーンショット、音声指紋、および/または他の任意の適切なコンテンツ識別子を生成することが可能である。より具体的には、これらの取込モジュールは、生成されたビデオスクリーンショット、音声指紋、および他のコンテンツ識別子を格納装置に格納することが可能である。たとえば取込モジュールは、放送されたテレビコンテンツを提供するチャンネルを監視し、かつ生成された音声指紋を、チャンネルおよび時間によって索引付けされるデータベースに格納することが可能である。
注意されるべきことであるが、いくつかの実施例ではデータベースの中でチャンネルおよび時間によって索引付けされた、生成されたビデオスクリーンショット、音声指紋、および他のコンテンツ識別子は、所定の時間後に廃棄され得る。たとえばビデオスクリーンショットが、特別な時間ウィンドウの外側の時間に関連付けられると決定することに呼応して、検索システムまたは他の任意の適切な構成要素は、データベースからビデオスクリーンショットを除去することが可能である。
ステップS220では、マッチが見つかるかどうかが決定され得る。もしマッチする音声指紋が見つからない場合、検索システムはステップS205に戻り、かつクライアントアプリケーションから、追加の音声サンプルを受信するために待機することが可能である。加えてまたは代わりに、検索システムは、ユーザがクライアントアプリケーションを再開し、別の音声サンプルを送信し、かつ/または特別な情報(たとえばチャンネル番号、サービスプロバイダ情報、番組タイトルなどのような番組情報)を入力する、または確かめることを要請するメッセージをクライアントアプリケーションに送信することが可能である。
ステップS220で音声指紋マッチを識別することに呼応して、検索システムは、マッチした音声指紋に関連付けられるチャンネル、または他の任意の適切なコンテンツ識別子を識別することが可能である。たとえばマッチする音声指紋は、チャンネル(たとえばチャンネルX)に関連付けられることが可能であり、かつ検索システムは、その関連付けを使用して、クライアントアプリケーションのユーザが、そのチャンネル上で提供されるテレビ番組を見ていることを決定する。別の例では、検索システムは、チャンネルが識別されたという通知を、クライアントアプリケーションに送信することが可能である。この通知は、たとえば検索システムが、受信された音声サンプルおよび/または識別されたチャンネルから、首尾よくチャンネルを識別したという指示を含むことが可能である。
注意されるべきことであるが、いくつかの実施例ではクライアントアプリケーションは、音声情報を取り込むことなく、または音声指紋を使用することなく(たとえば図1のステップS110〜S120、および図2のステップS205〜S220)、チャンネル検出モードを始めることが可能である。
いくつかの実施例では検索システムは、メディア再生装置(これは携帯装置に接続される)が現在調整されているチャンネルを検出することによって、チャンネルを識別する手順を含むことが可能である。たとえば検索システムは、どの装置が携帯装置に接続されるかを決定するために、クエリを携帯装置に送信することが可能である。テレビ装置またはセットトップボックスのようなメディア再生装置が携帯装置に接続されることを決定する手順に呼応して、検索システムは、メディア再生装置が現在調整されているチャンネルを決定するために、クライアントアプリケーションに命令して、メディア再生装置と通信させることが可能である。代わりに、遠隔制御器のようなユーザ入力装置が携帯装置に接続されることを決定する手順に呼応して、検索システムは、調整されていた最後のチャンネルまたは以前のチャンネルを決定するために、クライアントアプリケーションに命令して、ユーザ入力装置と通信させることが可能である。
より特別な例では、携帯装置上で実行されるクライアントアプリケーションは、第2スクリーンアプリケーションを含むことが可能であるか、または携帯装置上にインストールされている第2スクリーンアプリケーションと通信することが可能である。第2スクリーンアプリケーションによって、たとえば携帯装置または他の第2スクリーン装置のユーザは、テレビ装置またはセットトップボックスのようなメディア再生装置に転送されたコンテンツを提供されることが可能になる。クライアントアプリケーションは、メディア再生装置が第2スクリーン装置上で提示しているチャンネルを決定するために、第2スクリーンアプリケーションを使用することが可能である。
別のより特別な例では、携帯装置上で実行されるクライアントアプリケーションは、遠隔制御アプリケーションを含むことが可能であるか、または携帯装置上にインストールされている遠隔制御アプリケーションと通信することが可能である。遠隔制御アプリケーションは、たとえば携帯装置が、メディア再生装置を制御するためのコマンドを発行することを可能にし(たとえばチャンネル上昇、チャンネル下降など)、これに呼応して、携帯装置に接続された赤外線送信器に命令して、対応する赤外線符号をメディア再生装置に送信させる。クライアントアプリケーションは、調整されていた最後のチャンネルまたは以前のチャンネルを決定するために、遠隔制御アプリケーションを使用することが可能である。
いくつかの実施例ではクライアントアプリケーションは、携帯装置のユーザに選択のためのチャンネルのリストを提供することが可能である。この例では、検索システムは、ユーザが現在、メディア再生装置(これは、携帯装置に接続されていてもよいし、そうでなくてもよい)上で見ている特別なチャンネル、または他の任意の適切なコンテンツ識別子を受信することが可能である。
いくつかの実施例ではクライアントアプリケーションは、スクリーンショット閲覧モードに入ることが可能であるが、このモードは、ステップS230で、識別されたチャンネルに対応する画像に対する要請を送信することによって始まることが可能である。たとえばクライアントアプリケーションは、ビデオスクリーンショットのような画像に対する要請、識別されたチャンネルに対する要請、および特別な時間間隔(たとえば識別されたチャンネルによって提供される最後のN分からのスクリーンショット)に対する要請を、検索システムに自動的に送信することが可能である。上述のように、検索システムは、1つ以上のデータベースまたは他の適切な格納装置を含むことが可能であり、これらは、格納されたビデオスクリーンショット、および複数のソースによって提供されるメディアコンテンツから取り込まれた他の画像を含む。
これに呼応して、検索システムは、識別されたチャンネルおよびステップS235での与えられた時間間隔に基づき、アクセスされたデータベースから、複数のスクリーンショットまたは他の画像を引き出すことが可能である。たとえば検索システムは、特別なチャンネル上で提供される番組の5分に対応する複数のスクリーンショットを受信することが可能である。
ステップS240では、複数のスクリーンショットおよび他の画像は、ユーザに提示するために、クライアントアプリケーションに送信され得る。
戻って図1を参照すると、テレビ番組に関連付けられた複数の画像は、ステップS125でユーザに提示され得る。たとえばクライアントアプリケーションは、ユーザが異なる画像(たとえばスクリーンショット)をスクロールすることを可能にするが、ここでユーザは、コンピューティング装置上を垂直に、または水平にスクロールすることが可能である。別な例では、クライアントアプリケーションは、複数の画像の全てをユーザに提供することが可能であり、ここでユーザは、特別な画像を左右移動し、かつ徐々に拡大することが可能である。
複数の画像を受信し、かつユーザに提示することに呼応して、クライアントアプリケーションは、ステップS130ではユーザを促して、複数の画像から1つの画像を選択させることが可能である。たとえばクライアントアプリケーションは、ユーザが何時、1つの画像の上に強調表示領域を配置し、かつコンピューティング装置上の適切なボタンを押圧したかを検出することが可能である。別の例では、コンピューティング装置がタッチスクリーンを有する携帯装置である場合、クライアントアプリケーションは、タッチスクリーン上での1回以上のタップ、連続接触を維持した状態での接触点の移動のような、タッチスクリーンとの接触に応答することが可能である。
いくつかの実施例ではステップS130でのユーザによる画像の選択を受信する手順に呼応して、ステップS135では、クライアントアプリケーションは、ユーザを促して、選択された画像の中で関心領域を選択させることが可能である。たとえばコンピューティング装置がタッチスクリーンを有する携帯装置である場合、クライアントアプリケーションは、ユーザが、選択された画像の中で特定の関心領域上を1回以上タップすることを要請できる。より特別な例では、クライアントアプリケーションは、選択された画像を解析し、かつ選択された画像を1つ以上の小区分に分割することが可能である(たとえば識別された対象物に基づき)。
より特別な実施例では、クライアントアプリケーションは、顔認識技術を使用して、選択された画像の中で1つ以上の顔を検出することが可能である。これに呼応して、クライアントアプリケーションは、検出された顔の1つを選択する機会をユーザに提供する。たとえばユーザは、選択された画像の中で関心のある俳優の顔を選択することが可能である。選択された顔は、更なる画像解析およびクエリ生成のために、使用され得る。加えてまたは代わりに、クライアントアプリケーションは、対象物認識技術を使用して、選択された画像の中で1つ以上の対象物を検出することが可能である。これは、選択された画像の中で、品目、目印および/または場所を識別する手順を含むことが可能である。同様に、クライアントアプリケーションは、検出された対象物の1つを選択する機会を、ユーザに提供することが可能であるが、これは、更なる解析およびクエリ生成のために使用され得る。
ステップS140では、クライアントアプリケーションは、ユーザ選択を検索サーバに送信する結果表示モードに入ることが可能であるが、前記ユーザ選択は、選択された画像、選択された関心領域、選択された顔、選択された対象物および/または画像の他の任意の適切な部分を含むことが可能である。
図3に注意を向けると、ステップS305での、選択された画像および/または画像の他の任意の適切な部分を受信する手順に呼応して、検索システムは、1つ以上の画像認識技術を使用して、選択された画像の中で1つのエンティティを識別することが可能である。たとえばエンティティとしては、人、場所、出来事、対象物、動物、ロゴ、特性、特徴、またはテレビ番組に関連する他の任意の適切なエンティティが含まれ得る。これらのエンティティは、様々な方法で、テレビ番組に関連付けられ得る。たとえば人または目印の画像は、番組に関連付けられたビデオ信号に含まれ得る。
1つの特別な例では、テレビ番組に関連付けられたエンティティは、顔認識技術に基づき識別され得るが、この顔認識技術は、番組に関連付けられる、選択された画像に含まれる俳優および女優のような人々を識別するための技術である。別の例では、テレビ番組に関連付けられたエンティティは、画像認識技術に基づき識別され得るが、この画像認識技術は、番組に関連付けられる、選択された画像に含まれる目印を識別するための技術である。さらに別の例では、テレビ番組に関連付けられたエンティティは、光学特性認識技術に基づき認識され得るが、この光学特性認識技術は、番組に関連付けられる、選択された画像に含まれるキーワードを識別するための技術である。
いくつかの実施例では検索システムは、選択された画像の中のエンティティを識別するための追加情報を提供するために、案内データを獲得することが可能である。たとえば検索システムは、電子番組ガイドデータのような案内データを使用して、識別されたチャンネル上で提供されるテレビ番組の俳優、女優および/または配役メンバーのリストを獲得することが可能である。そのような案内データは、選択された画像と一緒に提供され得るが、ここで検索システムは、選択された画像の中で1つのエンティティを識別するために、1つ以上の画像認識技術を使用することが可能である。案内データは、たとえば誤検知をフィルタ作用で処理するために使用されることが可能であり、これによって、エンティティ識別精度が改善される。識別されたエンティティは、画像認識モジュールから検索システムへ逆送信され得る。
いくつかの実施例ではエンティティを識別するにあたり、ステップS315において検索システムは、検索クエリを生成することが可能である。そのような検索クエリは、識別されたエンティティおよび/または識別されたエンティティに関する情報を含むことが可能である。たとえば検索システムは、検索エンジンに送信するための、識別されたエンティティの名前を含む検索クエリを生成することが可能である。いくつかの実施例では検索クエリはまた、検索システムおよび/またはクライアントアプリケーションによって以前に獲得されたコンテンツ情報を含むことが可能である。
ステップS320では、検索システムは、検索を実施することが可能である。いくつかの実施例では検索システムは、生成された検索クエリを検索エンジンに送信することによって、検索を実施することが可能であり、前記検索エンジンは、その後、検索を実行することが可能である。いくつかの実施例では検索システムは、生成された検索クエリへの応答を示す検索結果に対して様々なコンテンツソースを検索するために、検索アプリケーション・プログラミング・インターフェース(API)を使用することが可能である。生成された検索クエリへの応答を示す検索結果は、ステップS325で獲得され得る。
いくつかの実施例では検索システムは、任意の適切な取り組み方法を使用して、1つ以上の検索結果を選択することが可能である。たとえば検索システムは、最も一般的な検索結果(たとえば最上位格付けの検索結果)を選択することが可能であり、これによって、最も妥当な検索結果などを選択する。
代わりに、1つ以上の検索結果を選択する代わりに、検索システムは、ユーザに提示するために、検索結果の全てをクライアントアプリケーションに送信することが可能である。これによって、ユーザは、検索結果にざっと目を通すとともに、画像から所望のエンティティに関する追加情報を獲得するために、適切な検索結果を選択することが可能になる。
いくつかの実施例では検索システムは、1つ以上の基準を使用して、検索結果を格付けすることが可能である。たとえば検索システムは、ニュース関連の検索結果は商業関連の検索結果よりも加重が大きいという具合に、検索結果の各々に対して加重値を割り当てることが可能である。別の例では、検索システムは、クライアントアプリケーションのユーザが、ユーザ嗜好を設定したと決定することが可能であり、そのユーザ嗜好とは、ニュース関連の検索結果または特別なウェブサイトからのページを好んで受信することを示すものである。この例では、検索システムは、そのようなユーザ嗜好に基づき、検索結果を自動的にフィルタ作用で処理することが可能である。
ステップS330では、ユーザに提示するために、1つ以上の検索結果が、クライアントアプリケーションに送信され得る。戻って図1を参照すると、クライアントアプリケーションは、その後、選択された画像および/または関心領域に関連付けられた1つ以上の検索結果を受信し、かつこれらをユーザに提示することが可能である。たとえば画像を選択することに呼応して、クライアントアプリケーションは、ユーザに検索結果を提供し、かつ今度はユーザが、選択された画像の中の識別されたエンティティについての追加情報に対して、検索結果を選択することが可能である。別の例では、クライアントアプリケーションは、ウェブ閲覧アプリケーションにおいて、検索結果に関連付けられるページを読み込むことが可能である。即ち、クライアントアプリケーションを読み込み、かつ関心のある画像を選択することに呼応して、クライアントアプリケーションは、選択された画像の中で識別されたエンティティに関する情報を含むページを、ユーザに提供することが可能である。
注意されるべきことであるが、いくつかの実施例ではクライアントアプリケーションは、提示されているテレビ番組に関する、音声サンプルまたは他の任意の適切な音声データを、検索システムに連続的かつ/または周期的に送信することが可能である。これに呼応して、クライアントアプリケーションは、選択のために、および画像の1つを選択するにあたっての検索結果のために、更新された画像を備えることが可能である。より具体的には、更新された音声サンプルおよび最近選択された画像に対応する検索結果は、連続的かつ/または周期的にクライアントアプリケーションに戻され、かつクライアントアプリケーションに関連付けられたグラフィカル・ユーザ・インターフェース上に表示され得る(たとえば検索結果に関連付けられたURLを読み込むウェブ閲覧アプリケーション)。
注意されるべきことであるが、いくつかの実施例ではクライアントアプリケーションは、クライアントアプリケーションのユーザが調整されているチャンネルを、識別することを継続できる。たとえば1つのチャンネルから別のチャンネルへ変更することに呼応して、クライアントアプリケーションは、更新された音声サンプルを受信し、かつ更新された音声サンプルに基づき、チャンネルを識別することが可能である。別の例では、クライアントアプリケーションは、第2スクリーンアプリケーションまたは遠隔制御アプリケーションにアクセスし(たとえば所定の時間に)、かつ調整されてきた最後のチャンネルを識別することを継続できる。
図4は、開示された主題のいくつかの実施例に従う、テレビ装置400およびコンピューティング装置410に実例を示す。ここでテレビ装置400は、テレビ番組または他の適切なメディアコンテンツを表示し、コンピューティング装置410は、画像を選択するための、関心領域を選択するための、および/または識別されたエンティティに関するコンテンツを提示するための複数のインターフェースを表示する。図示されるように、テレビ装置400は、表示装置上にテレビ番組405(または他の適切なメディアコンテンツ)を表示することが可能である。
テレビ装置400上で提供されるテレビ番組405に対応する音声サンプルを送信することに呼応して(たとえば生成された音声指紋)、コンピューティング装置410は、音声サンプルに対応するチャンネルを決定するために、音声サンプルを処理することが可能である。上述のように、これは、生成された音声指紋を、複数のチャンネルから音声データを取り込むことによって生成され、かつ音声指紋データベースに格納される音声指紋と比較する手順を含む。マッチする音声指紋は、音声サンプルに関連付けられたチャンネルを識別するために使用されることが可能であり、かつ今度は、そのチャンネルが、テレビ番組(複数を含む)に関する複数の画像を引き出すために、画像(たとえばビデオスクリーンショット)のデータベースの中で識別子として使用され得る。さらに上述のように、チャンネルは、他の適切な取り組み方法を使用して識別され得るが、ここで適切な取り組み方法とは、第2スクリーンアプリケーションまたは遠隔制御アプリケーションと通信することによって、これまで調整されていた最後のチャンネルを決定するようなものである。チャンネルはまた、選択可能なチャンネル識別子のリストを有する携帯装置のユーザを促し、かつユーザよって選択されたチャンネルを受信することによって、識別され得る。
上述のように、第2スクリーン装置のようなコンピューティング装置410は、テレビ装置400に結合され得る(たとえばテレビ装置400と通信状態にある)、またはセットトップボックスまたはデジタルメディア受信器のような装置に結合され得るが、これらの装置は、プログラム405がテレビ装置400上に提示されることを引き起こす。いくつかの実施例ではコンピューティング装置410はスタンドアロン装置であり得るが、このスタンドアロン装置は、テレビ装置400に結合されない、またはプログラム405がテレビ装置400上に提示されることを引き起こす装置に結合されない(たとえば携帯電話またはタブレットコンピュータのような第2スクリーン装置が、検索サーバと通信状態にある)。さらに上述のように、コンピューティング装置410は、エンティティに関連するコンテンツまたは他の関連したコンテンツをユーザに提示するのに適した任意のコンピューティング装置であり得るが、ここで任意のコンピューティング装置とは、スマートフォン、タブレットコンピュータ、ウェアラブルコンピュータ、ヘッドアップ表示装置、ラップトップコンピュータ、パーソナルコンピュータ(PC)、スマートテレビなどのようなものである。
図示されるように、複数の画像415および420は、クライアントアプリケーションに関連付けられたグラフィカル・ユーザ・インターフェース上でユーザに提示される。注意されるべきことであるが、画像は任意の適切な方法、たとえばスクロール可能な画像のリスト(そこでは、画像は一度に提示される)で提示されることが可能であり、複数の画像は、コンピューティング装置410の表示のサイズなどに基づき、一度に提示され得る。たとえばコンピューティング装置が、タブレットコンピューティング装置のような大きな表示装置を有する第2スクリーン装置である場合、複数の画像は、グラフィカル・ユーザ・インターフェースの中で表示され得る。別の例では、コンピューティング装置がスマートフォンである場合、1つの画像は一度に提示されることが可能であり、かつユーザは、別の画像に誘導するための選択肢を備えることが可能である(たとえばタッチスクリーン上で1つ以上のしぐさを使用する、スマートフォン上で適切なボタンを押圧する、など)。
いくつかの実施例ではクライアントアプリケーションは、複数の画像から1つの画像が、ユーザによって選択されたことを指し示すことが可能である。たとえば図4に示されるように、強調領域415が、ユーザ選択を指し示すために、選択された画像の周りに配置され得る。別の例では、クライアントアプリケーションは、タッチスクリーンの上で指を滑らせるしぐさ、またはユーザによるボタン押圧のような、強調画像の選択を指し示すための第2アクションを待つことが可能である。
いくつかの実施例では画像を選択することに呼応して、クライアントアプリケーションは、ユーザが選択された画像に関する更なる情報を提供することを要請できる。たとえば図4に示されるように、画像415(たとえば特別な時間でのテレビ番組のスクリーンショット)を選択することに呼応して、クライアントアプリケーションは、ユーザが関心領域430を選択することを要請できる。たとえば関心領域430は、ユーザによって描かれた自由形状領域であり得る。別の例では、画像認識技術(たとえば顔認識技術を使用した顔、対象物認識技術を使用した対象物など)を実施するにあたり、複数の領域が、クライアントアプリケーションによって提示され得る。これらの例では、クライアントアプリケーションは、ユーザが、選択された画像と一緒に、検索システムに逆送信するための関心領域を選択することを要請できる。これは、たとえば検索システムが、所望のエンティティ(たとえば俳優、女優、目印、対象物など)に対して検索クエリを生成するのを容易にすることが可能である。
いくつかの実施例ではクライアントアプリケーションはまた、選択された画像または選択された関心領域に関する補足的選択肢を、ユーザに提供することが可能である。たとえば図4に示されるように、クライアントアプリケーションは、ユーザに選択肢435を提供することが可能である。選択肢435は、ユーザが、選択された画像および/または選択された関心領域と一緒に、検索システムに逆送信するための質問事項を選択することを要請できる。図示されるように、質問事項には、「誰の」(たとえば誰が選択された画像の中にいるか)、「何を」(たとえば選択された画像に示された対象物または目印は何か)、および「何処で」(たとえば選択された画像におけるこの場面は何処で起こるか)が含まれる。これはまた、検索システムが、所望のエンティティに対して検索クエリ(たとえば選択された画像における俳優対目印)を生成するのを容易にすることが可能である。
さらに図4に示されるように、検索システムに適切な情報を送信することに呼応して(たとえば選択された画像、選択された関心領域、質問事項など)、検索クエリが、選択された画像の中の識別されたエンティティを用いて生成され、かつ1つ以上の検索結果440が、ユーザに提示され得る。この特別な例では、検索結果440は、クライアントアプリケーションに関連付けられたグラフィカル・ユーザ・インターフェース上で表示される(たとえば検索結果に関連付けられたURLを読み込むウェブ閲覧アプリケーション)。より具体的には、画像415内の関心領域430におけるエンティティ(たとえば俳優)を識別することに呼応して、俳優の映画作品目録ページが、クライアントアプリケーションのユーザに自動的に表示され得る。
図5に注意を向けると、システムの一般化された概略図の実例500が、開示された主題のいくつかの実施例に従って示されており、このシステム上では、携帯型コンテンツを提示するための仕組みは、メディアコンテンツに基づく。例示されるように、システム500は、1つ以上のコンピューティング装置510を含むことが可能である。コンピューティング装置510は、1つ以上の通信リンク508を介して、通信ネットワーク506に接続されることが可能であり、通信ネットワーク506は、通信リンク504を介して、サーバ502にリンクされ得る。いくつかの実施例ではコンピューティング装置510およびサーバ502は、通信リンク512を介して、1つ以上のコンテンツソース514にリンクされ得る。
システム500は、1つ以上のサーバ502を含むことが可能である。サーバ502は、検索アプリケーションへのアクセスを提供するための任意の適切なサーバであり得るが、ここで任意の適切なサーバとは、プロセッサ、コンピュータ、データプロセッシング装置、またはそのような装置の任意の適切な組み合わせである。たとえば検索アプリケーションは、複数のバックエンド構成要素および複数のフロントエンド構成要素、および/またはインターフェースに分散され得る。より特別な例では、データ収集およびデータ配布のようなバックエンド構成要素は、1つ以上のサーバ502上で実施され得る。
いくつかの実施例ではユーザインターフェースおよび/またはチャンネル識別特徴のような、検索アプリケーション(または検索アプリケーションの一部分)のフロントエンド構成要素は、1つ以上のコンピューティング装置510上で実施され得る。
いくつかの実施例ではコンピューティング装置510およびサーバ502の各々は、コンピュータのような多目的の装置、またはクライアント、サーバなどのような特殊目的の装置のいずれかであり得る。これらの多目的の装置または特殊目的の装置のいずれかは、ハードウェアプロセッサ(これは、マイクロプロセッサ、デジタル信号プロセッサ、コントローラなどであり得る)、メモリ、通信インターフェース、表示コントローラ、入力装置などのような、任意の適切な構成要素を含み得る。たとえばコンピューティング装置510は、スマートフォン、タブレットコンピュータ、ウェアラブルコンピュータ、スマートテレビ、セットトップボックス、デジタルメディア受信器、ゲーム機、パーソナルコンピュータ、ラップトップコンピュータ、携帯情報端末(PDA)、家庭娯楽システム、他の任意の適切なコンピューティング装置、またはこれらの任意の適切な組み合わせとして実施され得る。
たとえばいくつかの実施例では番組は、スマートテレビ、セットトップボックス、デジタルメディア受信器などのような、第1コンピューティング装置510を使用して提示され得、かつ補足的コンテンツは、タブレットコンピュータ、スマートフォン、ウェアラブルコンピュータ、PDAなどのような、第2コンピューティング装置510を使用して提示され得る。
いくつかの実施例ではコンテンツソース(複数を含む)514は、ケーブル(または電話)テレビコンテンツソース、衛星テレビコンテンツソース、オンデマンド番組コンテンツソース、ネット配信動画番組コンテンツソース、インターネットコンテンツソース、ストリーミング番組コンテンツソース、他の任意の適切なコンテンツソース、またはこれらの適切な組み合わせのような、任意の適切なコンテンツソースであり得る。
いくつかの実施例では通信ネットワーク506は、任意の適切なコンピュータネットワークまたはそのようなネットワークの組み合わせであり得るが、前記任意の適切なコンピュータネットワークには、インターネット、イントラネット、ワイド・エリア・ネットワーク(WAN)、ローカル・エリア・ネットワーク(LAN),無線ネットワーク、デジタル加入者線(DSL)ネットワーク、フレーム・リレー・ネットワーク、非同期転送モード(ATM)ネットワーク、仮想プライベートネットワーク(VPN)などが含まれる。通信リンク504、508および512は、コンピューティング装置510、サーバ502および/またはコンテンツソース(複数を含む)514の間でデータを伝達するのに適切な任意の通信リンクであり得るが、前記任意の通信リンクとは、ネットワークリンク、ダイアルアップリンク、無線リンク、ハードワイヤリンク、他の任意の適切な通信リンク、またはそのようなリンクの任意の適切な組み合わせのようなものである。コンピューティング装置510によって、本明細書で説明される技術を使用することが可能になり、またこれらの技術によって、本仕組みの特徴を利用することが可能になる。コンピューティング装置510、サーバ502およびコンテンツソース(複数を含む)514は、任意の適切な場所に位置することが可能である。
いくつかの実施例ではサーバ502は、1つ以上のモジュール520〜532および/またはデータベース540〜542を含むことが可能である。これらのモジュールおよびデータベースは、検索アプリケーションの様々な機能を実施するために、および/またはメディアコンテンツ情報に基づき検索結果を生成し、かつ検索結果を提示するための仕組みを容易にするために、相互に接続され得る。
いくつかの実施例ではフロントエンドサーバモジュール520は、たとえば図1〜図3に関連して上で説明されたように、対話型コンテンツを生成するためのプロセスを実施することが可能である。たとえばフロントエンドサーバは、コンピューティング装置510上で実行されるクライアントアプリケーションと、取込モジュール522、音声マッチングモジュール542、スクリーンショット閲覧モジュール526および検索モジュール532のような他のサーバモジュールとの間で、プロキシサーバとして振舞うことが可能である。
いくつかの実施例では取込モジュール522は、たとえば図1に関連して上で説明されたように、ビデオデータ、音声データ、電子番組ガイドデータ、メタデータなどのような、番組またはチャンネルに関連するメディアデータを受信することが可能である。加えてまたは代わりに、取込モジュール522は、たとえば図1に関連して説明されたように、コンテンツソースから提供されたコンテンツから、様々なメディアデータを抽出することが可能である。そのような抽出されたメディアデータは、たとえば音声指紋、サブタイトル、ビデオスクリーンショットなどを含むことが可能である。この情報は、たとえばデータベース(図示せず)に格納され得るが、これは、チャンネルを識別すること、スクリーンショットを獲得すること、および/または様々な他の動作において、フロントエンドサーバ520上で実行される検索アプリケーションによって使用されるためである。
いくつかの実施例では音声マッチングモジュール524は、取込モジュール522から、番組に対する音声指紋データを受信し、かつ指紋データベース542に格納された音声指紋データに対して、受信された音声指紋データを比較することが可能である。この指紋データベースは、たとえば上述のように、チャンネルを識別するために使用され、これによって、ユーザに提示されている番組を決定することが可能である。
いくつかの実施例ではスクリーンショット閲覧モジュール526は、識別されたチャンネルに基づき、1つ以上の画像を抽出することが可能である。たとえば識別されたチャンネルに基づき、スクリーンショット閲覧モジュール526は、そのチャンネルに関連付けられた特別な時間ウィンドウに対応する画像を引き出すことが可能である。ユーザによる画像の選択を受信することに呼応して、スクリーンショット閲覧モジュール526は、画像から1つ以上のエンティティを抽出しかつ識別するために、キーワード抽出モジュール528または他の任意の適切なモジュールを使用することが可能である。加えてスクリーンショット閲覧モジュール526は認識モジュール530を含むことが可能であるが、認識モジュール530は、顔認識技術、画像認識技術、光学特性認識技術などのような、1つ以上の認識技術を実施するように構成される。
いくつかの実施例ではキーワード抽出モジュール528は、図1に関連して上で説明されたようなエンティティを抽出することが可能である。たとえばキーワード抽出モジュール528は、人、場所、出来事、対象物、動物、ロゴ、または他の適切なエンティティと同一であることを抽出できる。加えてまたは代わりに、キーワード抽出モジュール528は、認識モジュール530を使用してエンティティを識別できるが、認識モジュール530は、たとえば画像の中である人と同一であることを決定するために、ビデオスクリーンショットの顔画像からの情報を、既知の顔情報のデータベース(たとえば既知である個人の顔情報)と比較することが可能である。同様に、認識モジュール530は、たとえば画像の中の対象物と同一であることを決定するために、ビルディング、彫像、製品パッケージ、電子装置、果物、および野菜、または他の任意の適切な対象物のような対象物の画像からの情報を、既知の対象物情報のデータベースと比較することが可能である。上述のように、任意の適切な認識技術は、キーワード抽出モジュール528および/またはスクリーンショット閲覧モジュール526による、番組に関連したデータからのエンティティ識別を容易にするために、認識モジュール530によって使用され得る。
いくつかの実施例ではフロントエンドモジュールは、検索モジュール532にアクセスすることが可能である。検索モジュール532は、たとえば選択された画像の中の識別されたエンティティに基づき、検索クエリを生成し、かつ検索クエリへの応答を示す検索結果を獲得するために、検索を実施することが可能である。より特別な例では、識別されたエンティティは、検索モジュール532に送信されることが可能であり、検索モジュール532は、識別されたエンティティ情報だけでなく、識別されたチャンネルに関連付けられたコンテンツに関連する、1つ以上の検索クエリを構築する。いったん関連する検索クエリが生成されると、検索クエリは適切な検索エンジンに提供されることが可能であり、前記検索エンジンは、検索クエリへの応答を示す、1つ以上のリポジトリおよび索引を検索する。いくつかの実施例では検索エンジンは一般的な検索エンジンであり得、これは、たとえば検索アプリケーション・プログラミング・インターフェース(API)を使用して、検索モジュール532によってアクセスされる。代わりに、検索エンジンは、フロントエンドサーバ520によって、またはシステム500の他の任意の構成要素によって独占的に使用される検索エンジンであり得る。
上述のように、いくつかの実施例では検索結果は、クライアントアプリケーションのユーザに基づき、フィルタ作用で処理される、かつ/または個人化されることが可能である。たとえば検索結果は、ユーザ検索履歴、以前のユーザ対話選択、ユーザ設定、ユーザプロファイル、クライアント装置のタイプ、ユーザの場所、および/または他のユーザ情報に基づき、除去される、かつ/または保持されることが可能である。検索結果は、フロントエンドサーバ520に提供されることが可能であり、フロントエンドサーバ520は、コンピューティング装置510上で実行されるクライアントアプリケーションに結果を送り返すのに適したフォーマットに、検索結果を生成する。たとえば検索結果は、ハイパーテキストマークアップ言語(HTML)コンテンツとしてフォーマットされることが可能であり、このコンテンツは、コンピューティング装置510上のウェブ閲覧アプリケーションが、検索結果を表示することを可能にする(たとえば関連付けられたウェブページを読み込むことによって)。別の例では、検索結果は、これらがコンピューティング装置510上で実行されるクライアントアプリケーションの中で表示され得るように、フォーマットされることが可能である。即ち、クライアントアプリケーションを読み込み、かつ関心のある画像を選択することに呼応して、クライアントアプリケーションは、メディアコンテンツに対応する検索結果を表示することが可能である。
いくつかの実施例では電子番組ガイド(EPG)データベースのような案内データ540がアクセスされ得る。たとえばフロントエンドサーバモジュール520は、識別されたチャンネルまたは識別された番組に関連する番組情報を獲得するために、案内データ540にアクセスし、かつエンティティ、検索結果などをフィルタ作用で処理するために、番組情報を使用することが可能である。注意されるべきことであるが、いくつかの実施例では案内データ540は、たとえばコンテンツソース(複数も含む)514から提供され得る。
注意されるべきことであるが、モジュール520〜532およびデータベース540〜542は、サーバ502に含まれるものとして示されているものの、これらのモジュールおよび/またはデータベースは、様々な組み合わせにおいて、異なるサーバに設けられることが可能である。たとえば検索モジュール532は第1サーバ上に設けられ、かつモジュール520〜530は第2サーバ上に設けられることが可能である。別の例として、各モジュールは、異なるサーバ上に設けられることが可能である。注意されるべきことであるが、これらは単に例であり、かつ説明されたモジュールは、任意の適切な方法で編成されることが可能である。
さらに注意されるべきことであるが、モジュール520〜532は、検索アプリケーションの一部分として含まれることが可能であり、各アプリケーションは、別個のアプリケーションであり得るか、または他の任意の適切なアプリケーションの一部であり得る。
図6は、開示された主題のいくつかの実施例に従う、ハードウェアの例600を図示しており、このハードウェアは、図5に描かれたサーバ502およびコンピューティング装置510の1つを実施するために使用され得る。図6を参照すると、コンピューティング装置510は、ハードウェアプロセッサ612と、表示装置614と、入力装置616と、メモリ618とを含むことが可能であり、これらは、相互に接続され得る。いくつかの実施例ではメモリ618は、ハードウェアプロセッサ612を制御するためのコンピュータプログラムを格納する目的で、(非一時的なコンピュータ可読媒体のような)格納装置を含むことが可能である。
ハードウェアプロセッサ612は、表示装置614上にコンテンツを提示するためのコンピュータプログラム、および/またはユーザがクライアントアプリケーションと対話し、かつ通信リンク508を通してデータを送受信することを可能にするインターフェースを使用することが可能である。さらに注意されるべきことであるが、通信リンク508または他の任意の通信リンクを通して受信されたデータは、任意の適切なソースから受信され得る。いくつかの実施例ではハードウェアプロセッサ612は、通信リンク508または他の任意の通信リンクを通して、たとえば送信器、受信器、送受信器、トランシーバ、または他の任意の適切な通信装置を使用することで、データを送受信することが可能である。入力装置616は、コンピュータキーボード、マウス、トラックボール、キーパッド、遠隔制御器、他の任意の適切な入力装置、またはこれらの適切な組み合わせであり得る。加えてまたは代わりに、入力装置616は、(たとえば指、スタイラスなどを使用して)入力を受信できるタッチスクリーン表示装置614を含むことが可能である。
サーバ502は、ハードウェアプロセッサ622と、表示装置624と、入力装置626と、メモリ628とを含むことが可能であり、これらは相互に接続され得る。いくつかの実施例ではメモリ628は、通信リンク504を通して、または他のリンクを通して受信されるデータを格納するための格納装置を含むことが可能であり、かつプロセッサ622は、たとえばコンピューティング装置510の一人以上のユーザによって送信されるコマンドおよび値を受信することが可能である。格納装置は、ハードウェアプロセッサ622を制御するためのサーバプログラムをさらに含むことが可能である。
メディアコンテンツに基づき、検索結果および他のコンテンツを提供するための、本明細書で説明された仕組みは、コンピューティング装置510および/またはサーバ502において、ソフトウェア、ファームウェア、ハードウェア、またはこれらの任意の適切な組み合わせとして実施され得る。
いくつかの実施例ではサーバ602は、1つのサーバとして実施されるか、または任意の適切な数のサーバとして分散されることが可能である。たとえば複数のサーバ502は、信頼性を、アプリケーションの機能を、および/またはサーバがコンピューティング装置510と通信できる速度を増加させるために、様々な場所で実施されることが可能である。
いくつかの実施例ではクライアントアプリケーションは、アプリケーションプログラムインターフェース(図示せず)を含むことが可能であり、かつ/またはコンピューティング装置510のメモリ618および/またはサーバ502のメモリ628に常駐することが可能である。加えてまたは代わりに、グラフィカル・ユーザ・インターフェース(「GUI」)は、コンピューティング装置510に分散されることが可能であり、コンピューティング装置510は、ユーザが、たとえばサーバ502に常駐しているクライアントアプリケーションと対話することを可能にする。
いくつかの実施例ではアプリケーションは、クライアント側ソフトウェア、サーバ側ソフトウェア、ハードウェア、ファームウェア、またはこれらの任意の適切な組み合わせを含むことが可能である。たとえばアプリケーションは、コンピュータプログラムを包含することが可能であり、このコンピュータプログラムは、1つ以上のプロセッサがコンテンツ生成アプリケーションを実行することを引き起こす。別の例として、アプリケーション(複数を含む)は、アプリケーション(複数を含む)を実行するコンピューティング装置510および/またはサーバ502によって認識可能なプログラミング言語で書かれたコンピュータプログラムを包含することが可能である(たとえばJava(登録商標)、C、Objective−C、C++、C#、Javascript(登録商標)、Visual Basic、HTML、XML、ColdFusion、他の任意の適切な取り組み、またはこれらの任意の適切な組み合わせのような、プログラミング言語で書かれたプログラム)。
いくつかの実施例ではアプリケーションは、1つ以上のウェブページまたはウェブページ部分を包含することが可能である(たとえばハイパーテキストマークアップ言語(「HTML」)、ダイナミックハイパーテキストマークアップ言語(「DHTML」)、拡張マークアップ言語(「XML」)、JavaServer Pages(「JSP」)、Active Server Pages(「ASP」)、ColdFusion、または他の任意の取り組み、のような任意の適切な符号化を介して)。
従って、メディアコンテンツに対応する携帯型コンテンツを提示するための方法、システムおよび媒体が提供される。
いくつかの実施例では任意の適切なコンピュータ可読媒体が、本明細書で説明された機能および/またはプロセスを実施するための命令を格納する目的で、使用されることが可能である。たとえばいくつかの実施例ではコンピュータ可読媒体は、一時的または非一時的であり得る。たとえば非一時的なコンピュータ可読媒体は、(ハードディスク、フロッピーディスク(登録商標)などのような)磁気媒体、(コンパクトディスク、デジタルビデオディスク、ブルーレイディスクなどのような)光媒体、(フラッシュメモリ、電気的にプログラム可能な再生専用メモリ(EPROM)、電気的に消去可能でプログラム可能な再生専用メモリ(EEPROM)などのような)半導体メモリ、つかの間のものではなく、または伝送中にいかなる外見上の耐久性を欠くことがない任意の適切な媒体、および/または任意の適切な有形媒体のような媒体を含むことが可能である。別の例では、一時的なコンピュータ可読媒体は、電線、導線、光ファイバ、回路、任意の適切な媒体におけるネットワーク上で、信号を含むことが可能であり、ここで任意の適切な媒体とは、つかの間のものではなく、かつ伝送中にいかなる外見上の耐久性を欠くことがない、かつ/または適切な有形の媒体である。
理解されるべきことであるが、図1〜図3のプロセスの上記手順は、図に示されかつ説明された順番および系列に限定されない、任意の順番または系列で実行される、または実施されることが可能である。さらに、図1〜図3のプロセスの上記手順のいくつかは、実質的に同時に実行される、または実施されることが可能であり、そこでは、待機時間および処理時間を削減するために、適切にまたは平行して実行される。
注意されるべきことであるが、本明細書で使用されたように、用語「仕組み」は、ハードウェア、ソフトウェア、ファームウェア、またはこれらの任意の適切な組み合わせを包含することが可能である。
本発明は、前述の例証的実施例において説明され、かつ例証されてきたが、理解されることは、本開示は単に例として開示されたものであり、かつ本発明を実施する上での詳細においては、次に続く請求項によってのみ制限される本発明の精神および範囲から外れることなく、多数の変更がなされ得る、ということである。開示された実施例の特徴は、様々な方法で組み合わされ、かつ再整理されることが可能である。

Claims (27)

  1. メディアコンテンツに関する情報を提供するための方法であって、前記方法は、
    ハードウェアプロセッサが、テレビ番組を提供しているチャンネルを決定する手順と、
    前記ハードウェアプロセッサが、前記テレビ番組に関する複数の画像が提示されることを引き起こす手順であって、前記複数の画像は前記チャンネルおよび時間パラメータに基づき選択される、手順と、
    前記ハードウェアプロセッサが、前記複数の画像からの、ユーザによる画像の選択を受信する手順と、
    前記ハードウェアプロセッサが、テレビ番組に関する番組情報を受信する手順であって、前記番組情報は前記テレビ番組に映る一人以上の人についての情報を含む、手順と、
    前記ハードウェアプロセッサが、携帯装置に複数の質問事項を提示させる手順と、
    前記ハードウェアプロセッサが、前記複数の質問事項からのユーザによる質問事項の選択を受信する手順であって、ユーザによる前記質問事項の選択は、識別されるエンティティが人であることを示す、手順と、
    選択された前記画像の中で、ユーザによる関心領域の選択を受信する手順と、
    ユーザによる前記質問事項の選択とユーザによる前記関心領域の選択との受信に応じて、前記ハードウェアプロセッサが、前記テレビ番組に映る一人以上の人に基づき1つ以上の認識技術を用いることによって、前記選択された関心領域の中の人のエンティティを識別する手順と、
    前記ハードウェアプロセッサが、前記識別された人のエンティティに少なくとも部分的に基づき、検索クエリを生成する手順と、
    前記ハードウェアプロセッサが、前記生成された検索クエリへの応答を示す複数の検索結果を獲得する手順と、
    前記ハードウェアプロセッサが、前記ユーザによる前記画像の選択を受信する手順に呼応して、前記複数の検索結果のうちの少なくとも1つが携帯装置に提示されることを引き起こす手順と
    を備える、方法。
  2. 前記方法はさらに、前記携帯装置から、テレビ番組に対応する音声データを受信する手順を含み、
    前記チャンネルは、前記受信された音声データに基づき決定される、
    請求項1記載の方法。
  3. 前記音声データを受信する手順はさらに、前記音声データの音声指紋を獲得する手順を備える、
    請求項2記載の方法。
  4. 前記方法はさらに、
    複数のテレビチャンネルの各々から、音声ストリームを抽出する手順と、
    前記複数のテレビチャンネルの各々に対して、前記複数のテレビチャンネルの1つに対応する前記抽出された音声ストリームのうちの少なくとも一部分から、少なくとも1つの音声指紋を生成する手順と、
    前記少なくとも1つの音声指紋を、チャンネルによって索引付けされたデータベースに格納する手順と
    を備える、請求項3記載の方法。
  5. 前記方法はさらに、
    前記音声指紋を、前記少なくとも1つの格納された音声指紋と比較する手順と、
    前記比較に基づき、前記テレビ番組を識別する手順と
    を備える、請求項4記載の方法。
  6. 前記方法はさらに、
    複数のテレビチャンネルの各々から、複数の番組画像を抽出する手順と、
    前記複数の番組画像を、チャンネルおよび時間によって索引付けされたデータベースに格納する手順と
    を備える、請求項1記載の方法。
  7. 前記テレビ番組に関する前記複数の画像は、前記複数の画像を獲得するために前記決定されたチャンネルおよび前記時間パラメータを使用することによって提示され、
    前記複数の画像は、前記複数の抽出された番組画像の部分集合である、
    請求項6記載の方法。
  8. 前記方法はさらに、
    顔認識技術を使用して、前記選択された画像の中で複数の顔を検出する手順と、
    前記携帯装置を促して、前記複数の検出された顔から1つの顔を選択させる手順と、
    前記選択された顔に関連付けられた前記エンティティを識別する手順と
    を備える、請求項記載の方法。
  9. 前記方法はさらに、
    前記決定されたチャンネルおよび前記時間パラメータに基づき、前記テレビ番組を決定するために、案内データにアクセスする手
    備える、請求項記載の方法。
  10. メディアコンテンツに関する情報を提供するためにハードウェアプロセッサを備えるシステムであって、前記ハードウェアプロセッサは、
    テレビ番組を提供しているチャンネルを決定し、
    前記テレビ番組に関する複数の画像であって、前記複数の画像は前記チャンネルおよび時間パラメータに基づき選択され、前記複数の画像が携帯装置によって提示されることを引き起こし、
    前記複数の画像からの、ユーザによる画像の選択を受信し、
    テレビ番組に関する番組情報を受信し、前記番組情報は前記テレビ番組に映る一人以上の人についての情報を含み、
    前記携帯装置に複数の質問事項を提示させ、
    前記複数の質問事項からのユーザによる質問事項の選択を受信し、ユーザによる前記質問事項の選択は、識別されるエンティティが人であることを示し、
    選択された前記画像の中で、ユーザによる関心領域の選択を受信し、
    ユーザによる前記質問事項の選択とユーザによる前記関心領域の選択との受信に応じて、前記テレビ番組に映る一人以上の人に基づき1つ以上の認識技術を使用して、前記選択された関心領域の中でのエンティティを識別し、
    前記識別されたエンティティに少なくとも部分的に基づき、検索クエリを生成し、
    前記生成された検索クエリへの応答を示す複数の検索結果を獲得し、
    前記ユーザによる前記画像の選択を受信することに呼応して、前記複数の検索結果のうちの少なくとも1つが携帯装置に提示されることを引き起こす
    ように構成される、システム。
  11. 前記ハードウェアプロセッサはさらに、前記携帯装置から、テレビ番組に対応する音声データを受信するように構成され、
    前記チャンネルは、前記受信された音声データに基づき決定される、
    請求項10記載のシステム。
  12. 前記ハードウェアプロセッサはさらに、前記音声データの音声指紋を獲得するように構成される、
    請求項11記載のシステム。
  13. 前記ハードウェアプロセッサはさらに、
    複数のテレビチャンネルの各々から音声ストリームを抽出し、
    前記複数のテレビチャンネルの各々に対して、前記複数のテレビチャンネルの1つに対応する前記抽出された音声ストリームのうちの少なくとも一部分から、少なくとも1つの音声指紋を生成し、
    前記少なくとも1つの音声指紋を、チャンネルによって索引付けされたデータベースに格納する
    ように構成される、請求項12記載のシステム。
  14. 前記ハードウェアプロセッサはさらに、
    前記音声指紋を、前記少なくとも1つの格納された音声指紋と比較し、
    前記比較に基づき、前記テレビ番組を識別する
    ように構成される、請求項13記載のシステム。
  15. 前記ハードウェアプロセッサはさらに、
    複数のテレビチャンネルの各々から、複数の番組画像を抽出し、
    前記複数の番組画像を、チャンネルおよび時間によって索引付けされたデータベースに格納する
    ように構成される、請求項10記載のシステム。
  16. 前記ハードウェアプロセッサはさらに、前記複数の画像を獲得するために、前記決定されたチャンネルおよび前記時間パラメータを使用するように構成され、
    前記複数の画像は、前記複数の抽出された番組画像の部分集合である、
    請求項15記載のシステム。
  17. 前記ハードウェアプロセッサはさらに、
    顔認識技術を使用して、前記選択された画像の中で複数の顔を検出し、
    前記携帯装置を促して、前記複数の検出された顔から1つの顔を選択させ、
    前記選択された顔に関連付けられた前記エンティティを識別する
    ように構成される、請求項10記載のシステム。
  18. 前記ハードウェアプロセッサはさらに、
    前記決定されたチャンネルおよび前記時間パラメータに基づき、前記テレビ番組を決定するために案内データにアクセスする
    よう構成される、請求項10記載のシステム。
  19. ハードウェアプロセッサを備えるコンピュータに以下の手順を実行させるためのプログラムを記録したコンピュータ読取可能な記録媒体であって、前記プログラムはメディアコンテンツに関する情報を提供するための方法を前記コンピュータに実行させることを引き起こし、前記プログラムは、
    テレビ番組を提供しているチャンネルを決定する手順と、
    前記テレビ番組に関する複数の画像が携帯装置によって提示されることを引き起こす手順であって、前記複数の画像は、前記チャンネルおよび時間パラメータに基づき選択される、手順と、
    前記複数の画像からの、ユーザによる画像の選択を受信する手順と、
    前記ハードウェアプロセッサが、テレビ番組に関する番組情報を受信する手順であって、前記番組情報は前記テレビ番組に映る一人以上の人についての情報を含む、手順と、
    前記ハードウェアプロセッサが、携帯装置に複数の質問事項を提示させる手順と、
    前記ハードウェアプロセッサが、前記複数の質問事項からのユーザによる質問事項の選択を受信する手順であって、ユーザによる前記質問事項の選択は、識別されるエンティティが人であることを示す、手順と、
    選択された前記画像の中で、ユーザによる関心領域の選択を受信する手順と、
    ユーザによる前記質問事項の選択とユーザによる前記関心領域の選択との受信に応じて、前記テレビ番組に映る一人以上の人に基づき1つ以上の認識技術を使用して、前記選択された関心領域の中で人のエンティティを識別する手順と、
    前記識別された人のエンティティに少なくとも部分的に基づき、検索クエリを生成する手順と、
    前記生成された検索クエリへの応答を示す複数の検索結果を獲得する手順と、
    前記ユーザによる前記画像の選択を受信する手順に呼応して、前記複数の検索結果のうちの少なくとも1つが、携帯装置に提示されることを引き起こす手順と
    を前記コンピュータに実行させる、記録媒体。
  20. 前記プログラムはさらに、前記携帯装置から、テレビ番組に対応する音声データを受信する手順を前記コンピュータに実行させ、
    前記チャンネルは、前記受信された音声データに基づき決定される、
    請求項19記載の記録媒体。
  21. 前記プログラムはさらに、前記音声データの音声指紋を獲得する手順を前記コンピュータに実行させる、
    請求項20記載の記録媒体。
  22. 前記プログラムはさらに、
    複数のテレビチャンネルの各々から音声ストリームを抽出する手順と、
    前記複数のテレビチャンネルの各々に対して、前記複数のテレビチャンネルの1つに対応する前記抽出された音声ストリームのうちの少なくとも一部分から、少なくとも1つの音声指紋を生成する手順と、
    前記少なくとも1つの音声指紋を、チャンネルによって索引付けされたデータベースに格納する手順と
    を前記コンピュータに実行させる、請求項21記載の記録媒体。
  23. 前記プログラムはさらに、
    前記音声指紋を、前記少なくとも1つの格納された音声指紋と比較する手順と、
    前記比較に基づき、前記テレビ番組を識別する手順と
    を前記コンピュータに実行させる、請求項22記載の記録媒体。
  24. 前記プログラムはさらに、
    複数のテレビチャンネルの各々から、複数の番組画像を抽出する手順と、
    前記複数の番組画像を、チャンネルおよび時間によって索引付けされたデータベースに格納する手順と
    を前記コンピュータに実行させる、請求項19記載の記録媒体。
  25. 前記プログラムはさらに、前記複数の画像を獲得するために、前記決定されたチャンネルおよび前記時間パラメータを使用する手順を前記コンピュータに実行させ、
    前記複数の画像は、前記複数の抽出された番組画像の部分集合である、
    請求項24記載の記録媒体。
  26. 前記プログラムはさらに、
    顔認識技術を使用して、前記選択された画像の中で複数の顔を検出する手順と、
    前記携帯装置を促して、前記複数の検出された顔から1つの顔を選択させる手順と、
    前記選択された顔に関連付けられた前記エンティティを識別する手順と
    を前記コンピュータに実行させる、請求項19記載の記録媒体。
  27. 前記プログラムはさらに、
    前記決定されたチャンネルおよび前記時間パラメータに基づき、前記テレビ番組を決定するために、案内データにアクセスする手順と、
    前記テレビ番組に関する番組情報を受信する手順と、
    前記受信された番組情報を使用して、前記選択された画像の中で前記エンティティを識別する手順と
    を前記コンピュータに実行させる、請求項19記載の記録媒体。
JP2016501451A 2013-03-14 2014-03-12 メディアコンテンツに対応する携帯型コンテンツを提供するための方法、システム、および記録媒体 Active JP6408551B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US13/827,413 2013-03-14
US13/827,413 US9247309B2 (en) 2013-03-14 2013-03-14 Methods, systems, and media for presenting mobile content corresponding to media content
PCT/US2014/024255 WO2014159578A1 (en) 2013-03-14 2014-03-12 Methods, systems, and media for presenting mobile content corresponding to media content

Publications (2)

Publication Number Publication Date
JP2016521390A JP2016521390A (ja) 2016-07-21
JP6408551B2 true JP6408551B2 (ja) 2018-10-17

Family

ID=50771560

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016501451A Active JP6408551B2 (ja) 2013-03-14 2014-03-12 メディアコンテンツに対応する携帯型コンテンツを提供するための方法、システム、および記録媒体

Country Status (7)

Country Link
US (3) US9247309B2 (ja)
EP (1) EP2973037A1 (ja)
JP (1) JP6408551B2 (ja)
KR (1) KR102128115B1 (ja)
CN (1) CN105122242A (ja)
CA (1) CA2908549C (ja)
WO (1) WO2014159578A1 (ja)

Families Citing this family (120)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9318108B2 (en) 2010-01-18 2016-04-19 Apple Inc. Intelligent automated assistant
US8977255B2 (en) 2007-04-03 2015-03-10 Apple Inc. Method and system for operating a multi-function portable electronic device using voice-activation
US8676904B2 (en) 2008-10-02 2014-03-18 Apple Inc. Electronic devices with voice command and contextual data processing capabilities
US10706373B2 (en) 2011-06-03 2020-07-07 Apple Inc. Performing actions associated with task items that represent tasks to perform
US10417037B2 (en) 2012-05-15 2019-09-17 Apple Inc. Systems and methods for integrating third party services with a digital assistant
US9948998B1 (en) * 2012-11-01 2018-04-17 Google Llc Providing content related to a selected channel for presentation to a user via a client device
BR112015018905B1 (pt) 2013-02-07 2022-02-22 Apple Inc Método de operação de recurso de ativação por voz, mídia de armazenamento legível por computador e dispositivo eletrônico
US10652394B2 (en) 2013-03-14 2020-05-12 Apple Inc. System and method for processing voicemail
US10748529B1 (en) 2013-03-15 2020-08-18 Apple Inc. Voice activated device for use with a voice-based digital assistant
KR20140133351A (ko) * 2013-05-10 2014-11-19 삼성전자주식회사 원격 제어 장치, 디스플레이 장치 및 이들의 제어 방법
US10191964B2 (en) * 2013-05-30 2019-01-29 Microsoft Technology Licensing, Llc Automatic isolation and selection of screenshots from an electronic content repository
US10176167B2 (en) 2013-06-09 2019-01-08 Apple Inc. System and method for inferring user intent from speech inputs
WO2015047297A1 (en) * 2013-09-27 2015-04-02 Hewlett-Packard Development Company, L.P. Device for identifying digital content
KR20150072209A (ko) * 2013-12-19 2015-06-29 한국전자통신연구원 멀티스크린 기반 콘텐츠 제공방법, 수신방법 및 그 시스템
US20170134806A1 (en) * 2014-04-24 2017-05-11 Axwave Inc. Selecting content based on media detected in environment
US9584236B2 (en) 2014-05-16 2017-02-28 Alphonso Inc. Efficient apparatus and method for audio signature generation using motion
US9715875B2 (en) 2014-05-30 2017-07-25 Apple Inc. Reducing the need for manual start/end-pointing and trigger phrases
US10170123B2 (en) 2014-05-30 2019-01-01 Apple Inc. Intelligent assistant for home automation
TWI566107B (zh) 2014-05-30 2017-01-11 蘋果公司 用於處理多部分語音命令之方法、非暫時性電腦可讀儲存媒體及電子裝置
CN104023251B (zh) * 2014-06-13 2015-08-19 腾讯科技(深圳)有限公司 基于视频的互动方法和系统
US9338493B2 (en) 2014-06-30 2016-05-10 Apple Inc. Intelligent automated assistant for TV user interactions
US9798708B1 (en) 2014-07-11 2017-10-24 Google Inc. Annotating relevant content in a screen capture image
US9965559B2 (en) 2014-08-21 2018-05-08 Google Llc Providing automatic actions for mobile onscreen content
US9684826B2 (en) 2014-08-28 2017-06-20 Retailmenot, Inc. Reducing the search space for recognition of objects in an image based on wireless signals
US9606716B2 (en) * 2014-10-24 2017-03-28 Google Inc. Drag-and-drop on a mobile device
US9992307B2 (en) 2015-02-03 2018-06-05 Google Llc Interoperability of discovery and connection protocols between client devices and first screen devices
US9886953B2 (en) 2015-03-08 2018-02-06 Apple Inc. Virtual assistant activation
US10204104B2 (en) * 2015-04-14 2019-02-12 Google Llc Methods, systems, and media for processing queries relating to presented media content
US9703541B2 (en) 2015-04-28 2017-07-11 Google Inc. Entity action suggestion on a mobile device
US10200824B2 (en) 2015-05-27 2019-02-05 Apple Inc. Systems and methods for proactively identifying and surfacing relevant content on a touch-sensitive device
US9516377B1 (en) * 2015-06-12 2016-12-06 Sorenson Media, Inc. Detecting channel change in automatic content recognition fingerprint matching
US9704020B2 (en) 2015-06-16 2017-07-11 Microsoft Technology Licensing, Llc Automatic recognition of entities in media-captured events
EP3343941A1 (en) * 2015-06-26 2018-07-04 Rovi Guides, Inc. Systems and methods for automatic formatting of images for media assets based on user profile
US10628009B2 (en) 2015-06-26 2020-04-21 Rovi Guides, Inc. Systems and methods for automatic formatting of images for media assets based on user profile
US20160378747A1 (en) 2015-06-29 2016-12-29 Apple Inc. Virtual assistant for media playback
US9913056B2 (en) 2015-08-06 2018-03-06 Dolby Laboratories Licensing Corporation System and method to enhance speakers connected to devices with microphones
US10747498B2 (en) 2015-09-08 2020-08-18 Apple Inc. Zero latency digital assistant
US10671428B2 (en) 2015-09-08 2020-06-02 Apple Inc. Distributed personal assistant
US10740384B2 (en) 2015-09-08 2020-08-11 Apple Inc. Intelligent automated assistant for media search and playback
US10331312B2 (en) 2015-09-08 2019-06-25 Apple Inc. Intelligent automated assistant in a media environment
US10970646B2 (en) 2015-10-01 2021-04-06 Google Llc Action suggestions for user-selected content
US10178527B2 (en) 2015-10-22 2019-01-08 Google Llc Personalized entity repository
US10691473B2 (en) 2015-11-06 2020-06-23 Apple Inc. Intelligent automated assistant in a messaging environment
US10956666B2 (en) 2015-11-09 2021-03-23 Apple Inc. Unconventional virtual assistant interactions
US10055390B2 (en) 2015-11-18 2018-08-21 Google Llc Simulated hyperlinks on a mobile device based on user intent and a centered selection of text
CN106973322A (zh) 2015-12-09 2017-07-21 财团法人工业技术研究院 多媒体内容跨屏幕同步装置与方法以及播放装置与伺服器
US10223066B2 (en) 2015-12-23 2019-03-05 Apple Inc. Proactive assistance based on dialog communication between devices
KR102102453B1 (ko) * 2016-01-08 2020-04-20 주식회사 아이플래테아 시청률 산출 서버, 시청률 산출 방법, 및 시청률 산출 리모트 장치
US10409970B2 (en) * 2016-02-22 2019-09-10 Nice Ltd. System and method for resolving user identification
US9924222B2 (en) 2016-02-29 2018-03-20 Gracenote, Inc. Media channel identification with multi-match detection and disambiguation based on location
US9930406B2 (en) * 2016-02-29 2018-03-27 Gracenote, Inc. Media channel identification with video multi-match detection and disambiguation based on audio fingerprint
US10063918B2 (en) 2016-02-29 2018-08-28 Gracenote, Inc. Media channel identification with multi-match detection and disambiguation based on single-match
US9921800B2 (en) * 2016-05-25 2018-03-20 Google Llc Methods, systems and media for controlling audio output
US10586535B2 (en) 2016-06-10 2020-03-10 Apple Inc. Intelligent digital assistant in a multi-tasking environment
DK179343B1 (en) * 2016-06-11 2018-05-14 Apple Inc Intelligent task discovery
DK201670540A1 (en) 2016-06-11 2018-01-08 Apple Inc Application integration with a digital assistant
DK179415B1 (en) 2016-06-11 2018-06-14 Apple Inc Intelligent device arbitration and control
US10575055B2 (en) * 2016-07-11 2020-02-25 Sony Corporation Using automatic content recognition (ACR) to weight search results for audio video display device (AVDD)
JP6232632B1 (ja) * 2016-08-09 2017-11-22 パロニム株式会社 動画再生プログラム、動画再生装置、動画再生方法、動画配信システム及びメタデータ作成方法
CN106254892B (zh) * 2016-08-09 2019-04-26 北海爱飞数码科技有限公司 基于电视机和互联网的交互系统
US20180310066A1 (en) * 2016-08-09 2018-10-25 Paronym Inc. Moving image reproduction device, moving image reproduction method, moving image distribution system, storage medium with moving image reproduction program stored therein
US20180101540A1 (en) * 2016-10-10 2018-04-12 Facebook, Inc. Diversifying Media Search Results on Online Social Networks
US10535005B1 (en) 2016-10-26 2020-01-14 Google Llc Providing contextual actions for mobile onscreen content
US10345998B2 (en) * 2016-11-10 2019-07-09 Google Llc Recommending different song recording versions based on a particular song recording version
CN108124167A (zh) * 2016-11-30 2018-06-05 阿里巴巴集团控股有限公司 一种播放处理方法、装置和设备
US10528251B2 (en) * 2016-12-13 2020-01-07 International Business Machines Corporation Alternate video summarization
US11237696B2 (en) 2016-12-19 2022-02-01 Google Llc Smart assist for repeated actions
KR20180079762A (ko) * 2017-01-02 2018-07-11 삼성전자주식회사 컨텐트에 관한 정보를 제공하는 방법 및 디바이스
KR20180081390A (ko) * 2017-01-06 2018-07-16 삼성전자주식회사 전자 장치 및 그 동작방법
CN110178116B (zh) * 2017-01-17 2022-08-16 谷歌有限责任公司 辅助截屏
US20180213290A1 (en) * 2017-01-20 2018-07-26 Essential Products, Inc. Contextual user interface based on media playback
US10359993B2 (en) 2017-01-20 2019-07-23 Essential Products, Inc. Contextual user interface based on environment
US10166465B2 (en) 2017-01-20 2019-01-01 Essential Products, Inc. Contextual user interface based on video game playback
DK180048B1 (en) 2017-05-11 2020-02-04 Apple Inc. MAINTAINING THE DATA PROTECTION OF PERSONAL INFORMATION
US10726832B2 (en) 2017-05-11 2020-07-28 Apple Inc. Maintaining privacy of personal information
DK179496B1 (en) 2017-05-12 2019-01-15 Apple Inc. USER-SPECIFIC Acoustic Models
DK179745B1 (en) 2017-05-12 2019-05-01 Apple Inc. SYNCHRONIZATION AND TASK DELEGATION OF A DIGITAL ASSISTANT
DK201770427A1 (en) 2017-05-12 2018-12-20 Apple Inc. LOW-LATENCY INTELLIGENT AUTOMATED ASSISTANT
US20180336275A1 (en) 2017-05-16 2018-11-22 Apple Inc. Intelligent automated assistant for media exploration
US20180336892A1 (en) 2017-05-16 2018-11-22 Apple Inc. Detecting a trigger of a digital assistant
CN107396176A (zh) * 2017-07-18 2017-11-24 青岛海信电器股份有限公司 音视频文件的播放方法及装置
WO2019054999A1 (en) * 2017-09-13 2019-03-21 Google Llc EFFICIENT AUGMENTATION OF IMAGES WITH RELATED CONTENT
CN110741366B (zh) * 2017-10-03 2023-12-01 谷歌有限责任公司 跨越多个设备协调音频查询的并行处理
JP6463826B1 (ja) * 2017-11-27 2019-02-06 株式会社ドワンゴ 動画配信サーバ、動画配信方法及び動画配信プログラム
US11762902B2 (en) 2017-12-12 2023-09-19 Google Llc Providing a video preview of search results
EP3729294A1 (en) * 2017-12-22 2020-10-28 Google LLC Image selection suggestions
US20190253751A1 (en) * 2018-02-13 2019-08-15 Perfect Corp. Systems and Methods for Providing Product Information During a Live Broadcast
US10796157B2 (en) * 2018-03-13 2020-10-06 Mediatek Inc. Hierarchical object detection and selection
US10818288B2 (en) 2018-03-26 2020-10-27 Apple Inc. Natural assistant interaction
US10928918B2 (en) 2018-05-07 2021-02-23 Apple Inc. Raise to speak
US11145294B2 (en) 2018-05-07 2021-10-12 Apple Inc. Intelligent automated assistant for delivering content from user experiences
US10892996B2 (en) 2018-06-01 2021-01-12 Apple Inc. Variable latency device coordination
DK179822B1 (da) 2018-06-01 2019-07-12 Apple Inc. Voice interaction at a primary device to access call functionality of a companion device
DK180639B1 (en) 2018-06-01 2021-11-04 Apple Inc DISABILITY OF ATTENTION-ATTENTIVE VIRTUAL ASSISTANT
US11055346B2 (en) * 2018-08-03 2021-07-06 Gracenote, Inc. Tagging an image with audio-related metadata
US11462215B2 (en) 2018-09-28 2022-10-04 Apple Inc. Multi-modal inputs for voice commands
CN109525877B (zh) * 2018-10-18 2021-04-20 百度在线网络技术(北京)有限公司 基于视频的信息获取方法和装置
US11348573B2 (en) 2019-03-18 2022-05-31 Apple Inc. Multimodality in digital assistant systems
US11307752B2 (en) 2019-05-06 2022-04-19 Apple Inc. User configurable task triggers
DK201970509A1 (en) 2019-05-06 2021-01-15 Apple Inc Spoken notifications
US11140099B2 (en) 2019-05-21 2021-10-05 Apple Inc. Providing message response suggestions
DK180129B1 (en) 2019-05-31 2020-06-02 Apple Inc. USER ACTIVITY SHORTCUT SUGGESTIONS
DK201970511A1 (en) 2019-05-31 2021-02-15 Apple Inc Voice identification in digital assistant systems
US11468890B2 (en) 2019-06-01 2022-10-11 Apple Inc. Methods and user interfaces for voice-based control of electronic devices
US11418835B2 (en) * 2019-06-07 2022-08-16 Roku, Inc. Content-modification system with technical characteristic-based selection feature
US10477287B1 (en) 2019-06-18 2019-11-12 Neal C. Fairbanks Method for providing additional information associated with an object visually present in media content
US11202109B2 (en) 2019-07-19 2021-12-14 Roku, Inc. Method and system for use of network affiliation as basis to determine channel rendered by content presentation device
US11722729B2 (en) 2019-07-19 2023-08-08 Roku, Inc. Method and system for use of earlier and/or later single-match as basis to disambiguate channel multi-match with non-matching programs
CN112565892B (zh) * 2019-09-26 2022-12-27 聚好看科技股份有限公司 一种影视节目角色的识别方法及相关设备
US11556596B2 (en) 2019-12-31 2023-01-17 Spotify Ab Systems and methods for determining descriptors for media content items
US11281710B2 (en) * 2020-03-20 2022-03-22 Spotify Ab Systems and methods for selecting images for a media item
US11061543B1 (en) 2020-05-11 2021-07-13 Apple Inc. Providing relevant data items based on context
US11183193B1 (en) 2020-05-11 2021-11-23 Apple Inc. Digital assistant hardware abstraction
US11755276B2 (en) 2020-05-12 2023-09-12 Apple Inc. Reducing description length based on confidence
US11490204B2 (en) 2020-07-20 2022-11-01 Apple Inc. Multi-device audio adjustment coordination
US11438683B2 (en) 2020-07-21 2022-09-06 Apple Inc. User identification using headphones
US11882334B2 (en) * 2020-07-24 2024-01-23 Dish Network Technologies India Private Limited Automated user-responsive video content
US11956518B2 (en) 2020-11-23 2024-04-09 Clicktivated Video, Inc. System and method for creating interactive elements for objects contemporaneously displayed in live video
CN113343005A (zh) * 2021-05-17 2021-09-03 北京百度网讯科技有限公司 搜索方法、装置、电子设备以及可读存储介质
TR2021016527A2 (tr) * 2021-10-22 2021-11-22 Siskon Enduestriyel Otomasyon Sistemleri Sanayi Ve Ticaret Anonim Sirketi Ekrandaki̇ ki̇şi̇leri̇n ki̇mli̇ği̇ni̇ tespi̇t etmek i̇çi̇n bi̇r yüz tanima si̇stemi̇

Family Cites Families (68)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001216309A (ja) * 2000-01-31 2001-08-10 Keio Gijuku 対象物特定装置及びカメラ
US8205223B2 (en) * 2000-04-12 2012-06-19 Lg Electronics Inc. Method and video device for accessing information
US6636237B1 (en) 2000-07-31 2003-10-21 James H. Murray Method for creating and synchronizing links to objects in a video
US20020147984A1 (en) 2000-11-07 2002-10-10 Tomsen Mai-Lan System and method for pre-caching supplemental content related to a television broadcast using unprompted, context-sensitive querying
US20060129908A1 (en) 2003-01-28 2006-06-15 Markel Steven O On-content streaming media enhancement
CN1735162A (zh) * 2004-08-12 2006-02-15 上海乐金广电电子有限公司 电视节目指南信息的osd生成器及其生成方法
KR101194706B1 (ko) * 2004-11-04 2012-10-29 코닌클리케 필립스 일렉트로닉스 엔.브이. Tv 추천기들을 위한 주연 배우 정보의 통합
US8185543B1 (en) * 2004-11-10 2012-05-22 Google Inc. Video image-based querying for video content
KR20060077988A (ko) * 2004-12-30 2006-07-05 삼성전자주식회사 멀티미디어 통신 시스템에서 컨텍스트 추출 및 이를 통한정보 제공 시스템 및 방법
KR20070100975A (ko) 2005-01-14 2007-10-15 코닌클리케 필립스 일렉트로닉스 엔.브이. 가상 비디오 채널을 구성하는 방법 및 시스템
JP2006270869A (ja) * 2005-03-25 2006-10-05 Dainippon Printing Co Ltd 関連情報取得システム、管理装置、関連情報取得方法、関連情報送信プログラム。
US8064516B2 (en) 2005-06-02 2011-11-22 Broadcom Corporation Text recognition during video compression
KR100686827B1 (ko) * 2005-07-11 2007-02-26 삼성에스디아이 주식회사 리튬 이차전지
JP2007058532A (ja) * 2005-08-24 2007-03-08 Sony Corp 情報処理システム、情報処理装置および方法、プログラム、並びに、記録媒体
US7991770B2 (en) * 2005-11-29 2011-08-02 Google Inc. Detecting repeating content in broadcast media
US20070136773A1 (en) 2005-12-14 2007-06-14 O'neil Douglas Systems and methods for providing television services using implicit content to indicate the availability of additional content
US8296808B2 (en) * 2006-10-23 2012-10-23 Sony Corporation Metadata from image recognition
US8861898B2 (en) * 2007-03-16 2014-10-14 Sony Corporation Content image search
CA2897227C (en) 2007-12-31 2017-01-10 Applied Recognition Inc. Method, system, and computer program for identification and sharing of digital images with face signatures
US8301618B2 (en) * 2008-02-26 2012-10-30 Microsoft Corporation Techniques to consume content and metadata
CN101981574B (zh) * 2008-03-31 2013-06-12 杜比实验室特许公司 分布式媒体指纹储存库
US9113214B2 (en) 2008-05-03 2015-08-18 Cinsay, Inc. Method and system for generation and playback of supplemented videos
US8929657B2 (en) 2008-08-22 2015-01-06 KyongHee Yi System and method for indexing object in image
US8239359B2 (en) 2008-09-23 2012-08-07 Disney Enterprises, Inc. System and method for visual search in a video media player
US20100121973A1 (en) 2008-11-12 2010-05-13 Yuliya Lobacheva Augmentation of streaming media
US20120311623A1 (en) * 2008-11-14 2012-12-06 Digimarc Corp. Methods and systems for obtaining still images corresponding to video
JP5386161B2 (ja) * 2008-12-05 2014-01-15 ソフトバンクモバイル株式会社 情報提供システム
JP5189481B2 (ja) 2008-12-26 2013-04-24 Kddi株式会社 映像関連情報提示装置、映像関連情報提示システムおよび映像関連情報提示装置の制御プログラム
JP2010200170A (ja) * 2009-02-26 2010-09-09 Nec Corp 画像情報提供システム、画像情報提供方法、および画像情報提供プログラム
US9135277B2 (en) * 2009-08-07 2015-09-15 Google Inc. Architecture for responding to a visual query
US9191726B2 (en) 2009-09-30 2015-11-17 Disney Enterprises, Inc. System and method for providing media content enhancement
US8463100B2 (en) 2009-11-05 2013-06-11 Cosmo Research Company Limited System and method for identifying, providing, and presenting content on a mobile device
US8301596B2 (en) 2010-01-15 2012-10-30 Hulu Llc Method and apparatus for providing supplemental video content for third party websites
KR101562588B1 (ko) * 2010-01-26 2015-10-23 엘지전자 주식회사 정보 제공 장치 및 그 방법
US20110243449A1 (en) 2010-03-31 2011-10-06 Nokia Corporation Method and apparatus for object identification within a media file using device identification
US8560583B2 (en) 2010-04-01 2013-10-15 Sony Computer Entertainment Inc. Media fingerprinting for social networking
US9264785B2 (en) 2010-04-01 2016-02-16 Sony Computer Entertainment Inc. Media fingerprinting for content determination and retrieval
KR101123370B1 (ko) * 2010-05-14 2012-03-23 주식회사 코리아퍼스텍 휴대단말용 객체기반 콘텐츠 제공방법 및 장치
US9015139B2 (en) 2010-05-14 2015-04-21 Rovi Guides, Inc. Systems and methods for performing a search based on a media content snapshot image
US8694533B2 (en) 2010-05-19 2014-04-08 Google Inc. Presenting mobile content based on programming context
CN101883230A (zh) * 2010-05-31 2010-11-10 中山大学 一种数字电视演员检索方法及系统
RU2013108254A (ru) 2010-07-26 2014-09-10 Конинклейке Филипс Электроникс Н.В. Получение ключевых слов для поиска
WO2012047532A1 (en) 2010-09-28 2012-04-12 International Business Machines Corporation Providing answers to questions using hypothesis pruning
US20120096499A1 (en) * 2010-10-19 2012-04-19 Charles Dasher Apparatus and method for facilitating video-on-demand catalog search and content distribution
US9241195B2 (en) * 2010-11-05 2016-01-19 Verizon Patent And Licensing Inc. Searching recorded or viewed content
US10070201B2 (en) 2010-12-23 2018-09-04 DISH Technologies L.L.C. Recognition of images within a video based on a stored representation
US9424471B2 (en) * 2011-03-01 2016-08-23 Sony Corporation Enhanced information for viewer-selected video object
US20120240144A1 (en) 2011-03-17 2012-09-20 Anthony Rose Content provision
US20140033239A1 (en) * 2011-04-11 2014-01-30 Peng Wang Next generation television with content shifting and interactive selectability
US9075875B1 (en) 2011-05-13 2015-07-07 Google Inc. System and method for recommending television programs based on user search queries
JP2013016030A (ja) * 2011-07-04 2013-01-24 Mitsubishi Electric Corp 番組再生装置および番組再生方法
JP6029264B2 (ja) * 2011-07-07 2016-11-24 富士ゼロックス株式会社 転写装置及び画像形成装置
US20130036442A1 (en) * 2011-08-05 2013-02-07 Qualcomm Incorporated System and method for visual selection of elements in video content
US20110289532A1 (en) * 2011-08-08 2011-11-24 Lei Yu System and method for interactive second screen
KR101995425B1 (ko) 2011-08-21 2019-07-02 엘지전자 주식회사 영상 표시 장치, 단말 장치 및 그 동작 방법
US9317571B2 (en) 2011-08-26 2016-04-19 Google Inc. Third party content provider integrations
US9049496B2 (en) 2011-09-01 2015-06-02 Gracenote, Inc. Media source identification
WO2013040533A1 (en) 2011-09-16 2013-03-21 Umami Co. Second screen interactive platform
US9098533B2 (en) 2011-10-03 2015-08-04 Microsoft Technology Licensing, Llc Voice directed context sensitive visual search
KR101952170B1 (ko) * 2011-10-24 2019-02-26 엘지전자 주식회사 검색 방법을 채용한 휴대 전자 기기
US9866915B2 (en) 2011-11-28 2018-01-09 Excalibur Ip, Llc Context relevant interactive television
US9596515B2 (en) 2012-01-04 2017-03-14 Google Inc. Systems and methods of image searching
KR20130081595A (ko) * 2012-01-09 2013-07-17 삼성전자주식회사 디스플레이 장치, 원격 제어 장치 및 그 검색 방법
CN102868934B (zh) * 2012-08-01 2016-06-29 青岛海信传媒网络技术有限公司 基于智能电视的视频对象信息检索方法及装置
US8484017B1 (en) 2012-09-10 2013-07-09 Google Inc. Identifying media content
CN102833617B (zh) * 2012-09-20 2016-03-23 北京酷云互动科技有限公司 一种同步显示多媒体节目附属信息的方法、系统及终端
US20140255003A1 (en) 2013-03-05 2014-09-11 Google Inc. Surfacing information about items mentioned or presented in a film in association with viewing the film
US9384217B2 (en) 2013-03-11 2016-07-05 Arris Enterprises, Inc. Telestration system for command processing

Also Published As

Publication number Publication date
CN105122242A (zh) 2015-12-02
KR20150127238A (ko) 2015-11-16
KR102128115B1 (ko) 2020-06-29
US9609391B2 (en) 2017-03-28
EP2973037A1 (en) 2016-01-20
CA2908549C (en) 2021-05-25
WO2014159578A1 (en) 2014-10-02
JP2016521390A (ja) 2016-07-21
US20140282660A1 (en) 2014-09-18
US9247309B2 (en) 2016-01-26
CA2908549A1 (en) 2014-10-02
US20160156986A1 (en) 2016-06-02
US20170155964A1 (en) 2017-06-01

Similar Documents

Publication Publication Date Title
JP6408551B2 (ja) メディアコンテンツに対応する携帯型コンテンツを提供するための方法、システム、および記録媒体
US11743557B2 (en) Methods, systems, and media for presenting supplemental content relating to media content based on state information that indicates a subsequent visit to the content interface
US10992993B2 (en) Methods, systems, and media for presenting supplemental information corresponding to on-demand media content
US11941041B2 (en) Methods, systems, and media for presenting news items corresponding to media content
US10333767B2 (en) Methods, systems, and media for media transmission and management
EP3417382B1 (en) Methods, systems, and media for storing information associated with content presented on a media presentation device

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20170309

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20180223

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20180313

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20180606

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20180828

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20180920

R150 Certificate of patent or registration of utility model

Ref document number: 6408551

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: R3D02

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250