JP7127131B2 - 音声データおよびメディア消費データに基づいてユーザを識別するためのシステムおよび方法 - Google Patents

音声データおよびメディア消費データに基づいてユーザを識別するためのシステムおよび方法 Download PDF

Info

Publication number
JP7127131B2
JP7127131B2 JP2020535629A JP2020535629A JP7127131B2 JP 7127131 B2 JP7127131 B2 JP 7127131B2 JP 2020535629 A JP2020535629 A JP 2020535629A JP 2020535629 A JP2020535629 A JP 2020535629A JP 7127131 B2 JP7127131 B2 JP 7127131B2
Authority
JP
Japan
Prior art keywords
user
users
media guidance
demographics
media
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2020535629A
Other languages
English (en)
Other versions
JP2021516356A (ja
Inventor
ショーン マシューズ,
ベンジャミン エイチ. モーガン,
ケビン ビー. レンハート,
Original Assignee
ロヴィ ガイズ, インコーポレイテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ロヴィ ガイズ, インコーポレイテッド filed Critical ロヴィ ガイズ, インコーポレイテッド
Publication of JP2021516356A publication Critical patent/JP2021516356A/ja
Application granted granted Critical
Publication of JP7127131B2 publication Critical patent/JP7127131B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification
    • G10L17/06Decision making techniques; Pattern matching strategies
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/242Query formulation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/248Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/14Speech classification or search using statistical models, e.g. Hidden Markov Models [HMMs]
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification
    • G10L17/02Preprocessing operations, e.g. segment selection; Pattern representation or modelling, e.g. based on linear discriminant analysis [LDA] or principal components; Feature selection or extraction
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification
    • G10L17/04Training, enrolment or model building
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification
    • G10L17/22Interactive procedures; Man-machine interfaces
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04HBROADCAST COMMUNICATION
    • H04H60/00Arrangements for broadcast applications with a direct linking to broadcast information or broadcast space-time; Broadcast-related systems
    • H04H60/35Arrangements for identifying or recognising characteristics with a direct linkage to broadcast information or to broadcast space-time, e.g. for identifying broadcast stations or for identifying users
    • H04H60/45Arrangements for identifying or recognising characteristics with a direct linkage to broadcast information or to broadcast space-time, e.g. for identifying broadcast stations or for identifying users for identifying users
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04HBROADCAST COMMUNICATION
    • H04H60/00Arrangements for broadcast applications with a direct linking to broadcast information or broadcast space-time; Broadcast-related systems
    • H04H60/61Arrangements for services using the result of monitoring, identification or recognition covered by groups H04H60/29-H04H60/54
    • H04H60/65Arrangements for services using the result of monitoring, identification or recognition covered by groups H04H60/29-H04H60/54 for using the result on users' side

Description

各家庭内のメディア消費デバイスの数は、過去数年にわたって劇的に増加してきた。より多くのユーザが家庭内の種々のデバイスからメディアを消費しているとき、ユーザがコンテンツを消費するために使用しているデバイスかかわらず、各ユーザが消費しているコンテンツを識別することが有用であり得る。現在のシステムがこの問題を解決する1つの方法は、ユーザがコンテンツを要求する音声コマンドを話すとき、音声認識を有効にすることによる。音声コマンドを受信すると、現在のシステムは、音声コマンドから抽出されるようなユーザの声紋を前に記憶された声紋と比較し、合致を取得する。しかしながら、このプロセスは、声紋を比較するために使用され得る声紋が記憶されていないとき、失敗する。
したがって、システムおよび方法が、音声データおよびメディア消費データに基づいてユーザを識別するために本明細書に開示される。メディアガイドアプリケーションが、音声データおよびメディア消費データに基づいてユーザを識別することに関連して説明されるアクションを実施するために、使用され得る。メディアガイドアプリケーションは、ユーザの入力から音声シグネチャを生成し、そのシグネチャに基づいて、ユーザのいくつかの人口統計特性(例えば、年齢、性別、および他の好適な特性)を識別し得る。メディアガイドアプリケーションは、ユーザの家庭に関連付けられたユーザのためのユーザデータを読み出し、ユーザのうちのコマンドを話したユーザを識別しようとし得る。複数のユーザが人口統計特性に基づいて識別される場合、メディアガイドアプリケーションは、コマンドのコンテンツ(例えば、要求されるメディアのタイプ)を使用し、ユーザを識別し得る。
例えば、家庭は、夫と、妻と、2人の子供とを含み得、2人の子供の両方は、息子であり、1人が9歳でもう1人が15歳である。息子のうちの1人が、PG-13映画である映画「Avatar」のためのコマンドを話し得る。応答して、メディアガイドアプリケーションは、子供の音声を分析し、子供が6歳~16歳の男性であることを決定し得る。メディアガイドアプリケーションは、家庭のユーザ情報を取得し、その情報に基づいて、(例えば、両親がおそらく16歳より年長であるので)第1の子供または第2の子供のいずれかがコマンドを話したことを決定し得る。メディアガイドアプリケーションは、コマンドを話した子供を決定するために、要求されるメディアアセットとして「Avatar」を識別し得る。メディアガイドアプリケーションは、映画「Avatar」の特性を各子供の好ましいメディア特性(例えば、彼らのそれぞれのプロファイルから取得される)と比較し、その情報に基づいて、年長の子供がコマンドを話した者であることを決定し得る。
いくつかの側面において、メディアガイドアプリケーションは、音声データおよびメディア消費データに基づいてユーザを識別するために、以下のアクションを実施し得る。メディアガイドアプリケーションは、ユーザから受信された音声コマンドから音声シグネチャを生成し得る。例えば、メディアガイドアプリケーションは、口頭によるコマンド「Avatarを再生して」を受信し得る。コマンドの受信時、メディアガイドアプリケーションは、ユーザのための音声シグネチャ(例えば、人口統計情報検出を可能にする音声入力の部分)を生成し得る。
メディアガイドアプリケーションは、音声シグネチャを分析し、発話者の人口統計特性を識別し得る。具体的に、メディアガイドアプリケーションは、音声シグネチャから、ユーザに関連付けられた複数の音声特性を決定し得、複数の音声特性は、複数の人口統計に対応する。例えば、メディアガイドアプリケーションは、音声シグネチャから、発話者が6~14歳であり、発話者が男性であることを決定し得る。
メディアガイドアプリケーションは、家庭(例えば、ユーザの口頭による入力を受信したデバイスの家庭)内のユーザのユーザ情報を取得しようとし得る。具体的に、メディアガイドアプリケーションは、ユーザの家庭に関連付けられたユーザ情報のための要求を伝送し得る。例えば、メディアガイドアプリケーションは、ユーザ情報のための家庭識別子を含む要求を伝送し得る。
ユーザ情報のための要求に応答して、メディアガイドアプリケーションは、要求されるような家庭情報を受信し得る。具体的に、メディアガイドアプリケーションは、ユーザ情報を受信し得、ユーザ情報は、家庭内の各ユーザのそれぞれの人口統計情報を含む。例えば、メディアガイドアプリケーションは、家庭が4人のユーザを含むことを示す情報を受信し得る。すなわち、可能なユーザは、46歳の男性と、44歳の女性と、8歳および14歳の追加の2人の男性とを含み得る。
メディアガイドアプリケーションは、音声シグネチャから抽出される人口統計情報を受信された人口統計家庭情報と比較し得る。具体的に、メディアガイドアプリケーションは、複数の人口統計をユーザ情報内の人口統計情報と比較し得る。例えば、メディアガイドアプリケーションは、音声シグネチャの性別(例えば、男性)を可能なユーザの性別と比較し、女性が合致しないことを決定し得る。メディアガイドアプリケーションは、ユーザの年齢を音声シグネチャから抽出されるような年齢層と比較し得る。
比較の結果として、メディアガイドアプリケーションは、音声シグネチャに合致し得る複数のユーザを識別し得る。具体的に、メディアガイドアプリケーションは、比較することに基づいて、2人以上のユーザに関連付けられた人口統計情報が複数の人口統計に合致することを決定し得る。例えば、メディアガイドアプリケーションは、2人の息子のみが基準を満たす家庭の構成員であることを決定し得る。
複数の身元を合致させることに応答して、メディアガイドアプリケーションは、コマンドのコンテンツを使用し、発話者であるユーザを識別し得る。具体的に、メディアガイドアプリケーションは、2人以上のユーザに関連付けられた人口統計情報が複数の人口統計に合致することを決定することに応答して、以下のアクションを実施し得る。メディアガイドアプリケーションは、音声コマンドがメディアアセット(例えば、映画「Avatar」)のための要求を含むことを決定し、メディアアセットに関連付けられたメタデータを複数の人口統計に合致する2人以上のユーザの各々にとって関心があるメディアアセットに関連付けられたメタデータと比較し得る。例えば、メディアガイドアプリケーションは、息子の各々のプロファイルを読み出し、プロファイルの各々におけるデータを映画「Avatar」に関連付けられたメタデータと比較し得る。
メディアガイドアプリケーションは、比較に基づいて、最も可能性の高い発話者を識別し得る。具体的に、メディアガイドアプリケーションは、メディアアセットに関連付けられたメタデータを複数の人口統計に合致する2人以上のユーザの各々にとって関心があるメディアアセットに関連付けられたメタデータと比較することに基づいて、2人以上のユーザのうちの第1のユーザが最良合致を構成することを決定し得る。例えば、メディアガイドアプリケーションは、年長の息子の(14歳の)プロファイルにおけるデータが、年少の息子のプロファイルより映画「Avatar」のメタデータに関してより良好に合致していることを決定し得る。
メディアガイドアプリケーションは、あるタイプのインジケータを表示のために生成し、発話者が識別されたことを視聴者に知らせ得る。具体的に、メディアガイドアプリケーションは、第1のユーザが最良合致であることを決定することに応答して、ユーザが識別されたという指示を表示のために生成し得る。例えば、メディアガイドアプリケーションは、ユーザの写真のアイコン、ユーザのアバタのアイコン、ユーザの名前、または別の好適なインジケータを表示のために生成し得る。
いくつかの実施形態において、メディアガイドアプリケーションは、以下のアクションを講じることによって、ユーザの家庭に関連付けられたユーザ情報のための要求を伝送し得る。メディアガイドアプリケーションは、音声コマンドを受信したユーザデバイスのための識別文字列を読み出し得る。具体的に、メディアガイドアプリケーションは、音声コマンドが受信されるユーザ機器デバイスに関連付けられた識別文字列を決定し得る。例えば、メディアガイドアプリケーションは、デバイスのシリアル番号を表す英数字列を読み出し得る。
メディアガイドアプリケーションは、識別文字列を使用し、家庭情報のためのクエリを構築し得る。具体的に、メディアガイドアプリケーションは、家庭ユーザ情報のためのクエリを生成し得、クエリは、識別文字列を含む。例えば、メディアガイドアプリケーションは、デバイスのシリアル番号を表す英数字列を使用して、データベース検索クエリを生成し得る。
メディアガイドアプリケーションは、生成されたクエリを適切な情報を記憶しているサーバに伝送し得る。具体的に、メディアガイドアプリケーションは、クエリをユーザの家庭に関連付けられたユーザ情報を記憶している遠隔サーバに伝送し得る。例えば、ユーザの家庭に関連付けられたユーザ情報は、遠隔場所におけるデータベースサーバ上に記憶され得る。メディアガイドアプリケーションは、インターネットを経由してクエリを伝送し得る。
いくつかの実施形態において、メディアガイドアプリケーションは、ユーザ情報を受信すると、データ構造にユーザ情報を記憶し得る。データ構造は、複数のエントリを含み得、複数のエントリは、家庭内の各ユーザのためのエントリを含む。例えば、メディアガイドアプリケーションは、テーブルとしてデータ構造を記憶し得、テーブルは、各エントリのための行を含む。メディアガイドアプリケーションは、各エントリのための複数のフィールドを記憶し得、複数のフィールドは、それぞれのユーザに関連付けられた人口統計情報の各項目のためのフィールドを含む。例えば、テーブルは、年齢(例えば、14)および性別(例えば、男性)のためのフィールドを含むエントリを含み得る。
いくつかの実施形態において、メディアガイドアプリケーションは、複数の人口統計をユーザ情報内の人口統計情報と比較するとき、以下のアクションを実施し得る。メディアガイドアプリケーションは、複数のエントリから第1のエントリを読み出し得る。例えば、メディアガイドアプリケーションは、年齢フィールドが14の値を有し、性別フィールドが男性の値を有する上記の例示されたエントリを読み出し得る。
メディアガイドアプリケーションは、受信された人口統計情報を音声コマンドから抽出される人口統計と比較し得る。具体的に、メディアガイドアプリケーションは、複数の人口統計のうちの各人口統計を2人以上のユーザのうちの第1のユーザの対応する人口統計に関連付けられたフィールドのコンテンツと比較し得る。例えば、メディアガイドアプリケーションは、音声コマンドから抽出される年齢層(例えば、6~14)を受信されたエントリの年齢フィールド(例えば、14)と比較し得る。メディアガイドアプリケーションは、音声コマンドから抽出される年齢層も他のエントリの年齢フィールド(すなわち、家庭内の他のユーザの年齢)と比較し得る。
メディアガイドアプリケーションは、人口統計比較に基づいて、合致するユーザを識別し得る。具体的に、メディアガイドアプリケーションは、複数の人口統計のうちの各人口統計を2人以上のユーザのうちの第1のユーザの対応する人口統計に関連付けられたフィールドのコンテンツと比較することに基づいて、第1のユーザに関連付けられた人口統計に合致する複数の人口統計からの人口統計情報の組を生成し得る。例えば、メディアガイドアプリケーションは、第1のユーザ(例えば、14歳の男性)および第2のユーザ(例えば、8歳の男性)を含む組を生成し得る。
いくつかの実施形態において、メディアガイドアプリケーションは、2人以上のユーザに関連付けられた人口統計情報が複数の人口統計に合致することを決定するとき、以下のアクションを実施し得る。メディアガイドアプリケーションは、複数の人口統計に合致する第1のユーザに関連付けられた人口統計情報の量を複数の人口統計に合致する他のユーザに関連付けられた人口統計情報の量と比較し得る。例えば、メディアガイドアプリケーションは、各テーブルエントリに関して、音声コマンドからの人口統計情報に合致するフィールドの数を他のテーブルエントリにおける合致するフィールドの数と比較し得る。
メディアガイドアプリケーションは、合致する人口統計情報の複数の組を識別し得る。具体的に、メディアガイドアプリケーションは、複数の人口統計に合致する第1のユーザに関連付けられた人口統計情報の量を複数の人口統計に合致する他のユーザに関連付けられた人口統計情報の量と比較することに基づいて、合致する人口統計情報の最高量を伴う2人以上のユーザを識別し得る。例えば、メディアガイドアプリケーションは、息子に関する2つのエントリが、合致する情報の最高量を構成することを決定し得る。
いくつかの実施形態において、メディアガイドアプリケーションは、メディアアセットに関連付けられたメタデータを複数の人口統計に合致する2人以上のユーザの各々にとって関心があるメディアアセットに関連付けられたメタデータと比較するとき、以下のアクションを実施し得る。
メディアガイドアプリケーションは、複数のユーザプロファイルを受信し得、複数のユーザプロファイルにおける各ユーザプロファイルは、2人以上のユーザのうちのユーザに対応し、各ユーザプロファイルは、2人以上のユーザのうちのそれぞれのユーザが好むメディアアセットに対応する複数の特性を含む。例えば、メディアガイドアプリケーションは、識別された各ユーザのためのユーザプロファイルを読み出し得る。ユーザプロファイルは、ユーザが好むコンテンツのタイプを示す情報を含み得る。
メディアガイドアプリケーションは、ユーザのプロファイルに基づいて、ユーザのうちの音声コマンドに合致する人口統計情報に基づいて前に識別されたユーザを決定し得る。具体的に、メディアガイドアプリケーションは、メディアアセットに関連付けられたメタデータを対応するユーザが好むメディアアセットの特性と比較し得る。例えば、メディアガイドアプリケーションは、映画「Avatar」のメタデータを対応するユーザのプロファイルに記憶されたユーザの選好と比較し得る。
メディアガイドアプリケーションは、比較に基づいて、各ユーザのプロファイルに関して、メディアアセットのメタデータに合致する特性の量を識別し得る。具体的に、メディアガイドアプリケーションは、メディアアセットに関連付けられたメタデータを対応するユーザが好むメディアアセットの特性と比較することに基づいて、2人以上のユーザのうちの各ユーザのために、合致する特性の量を決定し得る。例えば、14歳のプロファイルが、ペアレンタルガイダンス評価レベル(例えば、PG-13)およびジャンル(例えば、アクション・アドベンチャ)に合致し得る一方、7歳のプロファイルは、ジャンルのみに合致し得る。
いくつかの実施形態において、メディアガイドアプリケーションは、2人以上のユーザから、合致するメタデータの最高量を伴う者を決定するとき、以下のアクションを実施し得る。メディアガイドアプリケーションは、複数の特性のうちの各特性に関連付けられた重みを読み出し得る。例えば、ジャンル特性は、ペアレンタルガイダンス評価(例えば、PG-13)特性より高い重みを有し得る。
メディアガイドアプリケーションは、対応する重みを各特性に適用し、最良合致を決定し得る。具体的に、メディアガイドアプリケーションは、各特性のためのそれぞれの重みを使用して、2人以上のユーザのうちの各ユーザのために、合致する特性の量を計算し得る。例えば、ジャンルのための重みが、0.75であり得る一方、ペアレンタルガイダンス評価のための重みは、0.25であり得る。メディアガイドアプリケーションは、これらの重みを特性に適用することによって、合致する特性の最終量を決定し得る。
メディアガイドアプリケーションは、合致する特性の最高量を伴う合致するユーザを選択し得る。例えば、14歳が1.00の最終合致スコア(例えば、0.75のジャンルを加えた0.25のペアレンタルガイダンス評価)を有し、7歳が0.75の合致スコア(例えば、0.75のジャンル)を有する場合、メディアガイドアプリケーションは、音声コマンドの発話者として14歳を選択し得る。いくつかの実施形態において、メディアガイドアプリケーションは、コマンドコンテンツ合致に加えて、またはその代わりに、コマンドのコンテキストを使用し得る。例えば、メディアガイドアプリケーションは、コマンドに関連付けられた時刻を使用し得る。コマンドが、子供のうちの1人が託児所にいるが、第2の子供がすでに学校を出ている時間の間に(例えば、午後4時に)話される場合、メディアガイドアプリケーションは、発話者として第2の子供を識別し得る。メディアガイドアプリケーションは、識別のために他のコンテキストデータを使用し得る。メディアガイドアプリケーションは、季節、月、曜日、および他の好適なコンテキストを使用し得る。
いくつかの実施形態において、メディアガイドアプリケーションは、ユーザが識別されたという指示を表示のために生成するとき、以下のアクションを講じ得る。メディアガイドアプリケーションは、記憶装置からユーザのプロファイルを読み出し得る。例えば、メディアガイドアプリケーションは、セットトップボックスまたは遠隔サーバからユーザ設定を読み出し得る。
メディアガイドアプリケーションは、ユーザのプロファイルに基づいて、ユーザがアバタを選択したことを決定し得る。例えば、ユーザのプロファイルは、ユーザが好むアバタの識別を含み得る。メディアガイドアプリケーションは、メディアアセットの一部にオーバーレイされるアバタを表示のために生成し得る。例えば、ユーザのアバタは、画面上に表示され得る映画「Avatar」のキャラクタの写真であり得る。
いくつかの実施形態において、メディアガイドアプリケーションは、ユーザに関連付けられた全てのデバイスにおいて音声シグネチャを記憶し得る。例えば、ユーザは、(例えば、家庭の複数の部屋内の)複数のセットトップボックスに加えて、電子タブレットを有し得る。メディアガイドアプリケーションは、後に使用するために音声シグネチャをデバイスの全てに伝送し得る。
いくつかの実施形態において、メディアガイドアプリケーションは、音声シグネチャでユーザのプロファイルを更新し得る。具体的に、メディアガイドアプリケーションは、ユーザの音声プロファイルに音声シグネチャおよびメディアアセットの指示を記憶し、後続の音声コマンドを検出すると、後続の音声コマンドに関連付けられた後続の音声シグネチャが音声シグネチャに合致することを決定し得る。メディアガイドアプリケーションは、ユーザの音声プロファイルに後続の音声コマンドのコンテンツを記憶し得る。例えば、メディアガイドアプリケーションは、14歳の息子に属するものとして識別される音声シグネチャを記憶し得、14歳の息子が別の音声コマンド(例えば、terminatorを再生して)を入力するとき、メディアガイドアプリケーションは、そのメディアコンテンツの指示をユーザのプロファイルに追加し得る。
いくつかの実施形態において、メディアガイドアプリケーションは、家庭の一員ではないユーザを識別していることもある。例えば、家庭内のユーザの訪問している親戚または友人が、メディアガイドアプリケーションによって実行されるべきコマンドを話していることもある。メディアガイドアプリケーションは、家庭の一員ではないユーザを識別するために、家庭内の全てのユーザが前に識別されているかどうかを決定し得る。例えば、メディアガイドアプリケーションは、家庭が4人のユーザ(2人の親および2人の子供)を有し、4人のユーザがすでに前に識別されている場合、新しいユーザが訪問者であることを決定し得る。しかしながら、家庭の全てのユーザが識別されていない場合、メディアガイドアプリケーションは、決定において使用の頻度を使用し得る。例えば、コマンドを話しているユーザがシステムの頻繁なユーザではなかった(例えば、初めての発話者または2回目の発話者)場合、メディアガイドアプリケーションは、ユーザが家庭の一員ではない(例えば、訪問者)ことを決定し得る。対照的に、ユーザが頻繁に(例えば、20回以上)システムを使用していた場合、メディアガイドアプリケーションは、ユーザが家庭の一員であることを決定し得る。
ユーザが家庭の一員ではない場合、メディアガイドアプリケーションは、ユーザのためのゲストプロファイルを設定し得る。いくつかの実施形態において、メディアガイドアプリケーションは、識別のためにユーザの証明情報を入力するようにユーザに求めるか、または、人口統計情報を入力するようにユーザに求め得る。さらにいくつかの実施形態において、メディアガイドアプリケーションは、訪問者を識別する他の方法を使用しようとし得る。例えば、メディアガイドアプリケーションは、人口統計データに関して訪問者の音声を分析し、家庭の構成員に関連付けられたプロファイル(例えば、ソーシャルメディアプロファイル)を使用し、訪問者を識別しようとし得る。例えば、訪問者は、ソーシャルメディア上で家庭の構成員と関係があり得る祖父であり得る。メディアガイドアプリケーションは、その情報を使用し、個人を識別し得る。
いくつかの実施形態において、メディアガイドアプリケーションは、ユーザのための完全なプロファイルを生成するために、人口統計情報とともに音声コマンドを使用し得る。例えば、メディアガイドアプリケーションは、ユーザからコマンドを受信し、その音声コマンドに基づいてユーザを識別し得る。具体的に、メディアガイドアプリケーションは、メディアガイドアプリケーションに記憶されるユーザに関連付けられた音声サンプルを音声コマンドと比較し、ユーザを識別し得る。メディアガイドアプリケーションは、遠隔場所から家庭のユーザに関連付けられた人口統計情報を読み出し、音声コマンドから抽出される人口統計情報を受信された人口統計情報と比較し得る。メディアガイドアプリケーションは、比較に基づいて、ユーザを識別し得る。メディアガイドアプリケーションは、ユーザのプロファイルを可能な限り完全にするために、遠隔サーバから受信される人口統計情報をユーザのプロファイルにコピーし得る。
本願明細書は、例えば、以下の項目も提供する。
(項目1)
音声データおよびメディア消費データに基づいてユーザを識別する方法であって、前記方法は、
ユーザから受信された音声コマンドから音声シグネチャを生成することと、
前記音声シグネチャに基づいて、前記ユーザに関連付けられた複数の音声特性を識別することであって、前記複数の音声特性の各々は、前記ユーザに関連付けられた人口統計データに対応する、ことと、
前記複数の人口統計を家庭に関連付けられた複数のユーザに関連付けられた複数のプロファイルのうちの各プロファイルにおける人口統計情報と比較することと、
前記比較することに基づいて、前記複数のプロファイルにおける2つ以上のプロファイルが前記複数の人口統計に合致することを決定することと、
前記複数のプロファイルにおける2つ以上のプロファイルが前記複数の人口統計に合致することを決定することに応答して、前記2つ以上のプロファイルからの前記音声コマンドのコンテンツに基づいて、前記ユーザのプロファイルを識別することと、
前記ユーザが識別されたことを示す指示を表示のために生成することと
を含む、方法。
(項目2)
音声データおよびメディア消費データに基づいてユーザを識別する方法であって、前記方法は、
ユーザから受信された音声コマンドから音声シグネチャを生成することと、
前記音声シグネチャから、前記ユーザに関連付けられた複数の音声特性を決定することであって、前記複数の音声特性は、複数の人口統計に対応する、ことと、
前記ユーザの家庭に関連付けられたユーザ情報のための要求を伝送することと、
前記ユーザ情報を受信することであって、前記ユーザ情報は、前記家庭内の各ユーザのそれぞれの人口統計情報を備えている、ことと、
前記複数の人口統計を前記ユーザ情報内の人口統計情報と比較することと、
前記比較することに基づいて、2人以上のユーザに関連付けられた人口統計情報が前記複数の人口統計に合致することを決定することと、
2人以上のユーザに関連付けられた前記人口統計情報が前記複数の人口統計に合致することを決定することに応答して、
前記音声コマンドがメディアアセットのための要求を備えていることを決定することと、
前記メディアアセットに関連付けられたメタデータを前記複数の人口統計に合致する前記2人以上のユーザの各々にとって関心があるメディアアセットに関連付けられたメタデータと比較することと、
前記メディアアセットに関連付けられた前記メタデータを前記複数の人口統計に合致する前記2人以上のユーザの各々にとって関心がある前記メディアアセットに関連付けられた前記メタデータと比較することに基づいて、前記2人以上のユーザのうちの第1のユーザが最良合致を構成することを決定することと、
前記第1のユーザが前記最良合致であることを決定することに応答して、前記ユーザが識別されたという指示を表示のために生成することと
を含む、方法。
(項目3)
前記ユーザの前記家庭に関連付けられたユーザ情報のための前記要求を伝送することは、
前記音声コマンドが受信されるユーザ機器デバイスに関連付けられた識別文字列を決定することと、
前記家庭ユーザ情報のためのクエリを生成することであって、前記クエリは、前記識別文字列を備えている、ことと、
前記クエリを前記ユーザの前記家庭に関連付けられた前記ユーザ情報を記憶している遠隔サーバに伝送することと
を含む、項目2に記載の方法。
(項目4)
前記ユーザ情報を受信することは、データ構造に前記ユーザ情報を記憶することをさらに含み、前記データ構造は、
複数のエントリであって、前記複数のエントリは、前記家庭内の各ユーザのためのエントリを備えている、複数のエントリと、
各エントリのための複数のフィールドであって、前記複数のフィールドは、それぞれのユーザに関連付けられた人口統計情報の各項目のためのフィールドを備えている、複数のフィールドと
を備えている、項目3に記載の方法。
(項目5)
前記複数の人口統計を前記ユーザ情報内の前記人口統計情報と比較することは、
前記複数のエントリから第1のエントリを読み出すことと、
前記複数の人口統計のうちの各人口統計を前記2人以上のユーザのうちの第1のユーザの対応する人口統計に関連付けられたフィールドのコンテンツと比較することと、
前記複数の人口統計のうちの各人口統計を前記2人以上のユーザのうちの前記第1のユーザの対応する人口統計に関連付けられた前記フィールドのコンテンツと比較することに基づいて、前記第1のユーザに関連付けられた人口統計に合致する前記複数の人口統計からの人口統計情報の組を生成することと
を含む、項目4に記載の方法。
(項目6)
前記2人以上のユーザに関連付けられた人口統計情報が前記複数の人口統計に合致することを決定することは、
前記複数の人口統計に合致する前記第1のユーザに関連付けられた人口統計情報の量を前記複数の人口統計に合致する他のユーザに関連付けられた人口統計情報の量と比較することと、
前記複数の人口統計に合致する前記第1のユーザに関連付けられた人口統計情報の量を前記複数の人口統計に合致する他のユーザに関連付けられた人口統計情報の量と比較することに基づいて、合致する人口統計情報の最高量を伴う2人以上のユーザを識別することと
を含む、項目5に記載の方法。
(項目7)
前記メディアアセットに関連付けられたメタデータを前記複数の人口統計に合致する前記2人以上のユーザの各々にとって関心があるメディアアセットに関連付けられたメタデータと比較することは、
複数のユーザプロファイルを受信することであって、前記複数のユーザプロファイルにおける各ユーザプロファイルは、前記2人以上のユーザのうちのユーザに対応し、各ユーザプロファイルは、前記2人以上のユーザのうちのそれぞれのユーザが好むメディアアセットに対応する複数の特性を備えている、ことと、
前記メディアアセットに関連付けられた前記メタデータを前記対応するユーザが好むメディアアセットの特性と比較することと、
前記メディアアセットに関連付けられた前記メタデータを前記対応するユーザが好むメディアアセットの特性と比較することに基づいて、前記2人以上のユーザのうちの各ユーザのために、合致する特性の量を決定することと
を含む、項目2に記載の方法。
(項目8)
前記2人以上のユーザから、合致するメタデータの最高量を伴う者を決定することは、
前記複数の特性のうちの各特性に関連付けられた重みを読み出すことと、
各特性のためのそれぞれの重みを使用して、前記2人以上のユーザのうちの各ユーザのために、合致する特性の量を計算することと、
合致する特性の最高量を伴う合致するユーザを選択することと
を含む、項目7に記載の方法。
(項目9)
前記ユーザが識別されたという前記指示を表示のために生成することは、
記憶装置から前記ユーザのプロファイルを読み出すことと、
前記ユーザの前記プロファイルに基づいて、前記ユーザがアバタを選択したことを決定することと、
前記メディアアセットの一部にオーバーレイされる前記アバタを表示のために生成することと
を含む、項目2に記載の方法。
(項目10)
前記ユーザに関連付けられた全てのデバイスにおいて前記音声シグネチャを記憶することをさらに含む、項目2に記載の方法。
(項目11)
前記ユーザの音声プロファイルに前記音声シグネチャおよび前記メディアアセットの指示を記憶することと、
後続の音声コマンドを検出することと、
前記後続の音声コマンドに関連付けられた後続の音声シグネチャが前記音声シグネチャに合致することを決定することと、
前記ユーザの前記音声プロファイルに前記後続の音声コマンドのコンテンツを記憶することと
をさらに含む、項目2に記載の方法。
(項目12)
音声データおよびメディア消費データに基づいてユーザを識別するためのシステムであって、前記システムは、
通信回路と、
制御回路と
を備え、
前記制御回路は、
ユーザから受信された音声コマンドから音声シグネチャを生成することと、
前記音声シグネチャから、前記ユーザに関連付けられた複数の音声特性を決定することであって、前記複数の音声特性は、複数の人口統計に対応している、ことと、
前記通信回路を使用して、前記ユーザの家庭に関連付けられたユーザ情報のための要求を伝送することと、
前記通信回路を使用して、前記ユーザ情報を受信することであって、前記ユーザ情報は、前記家庭内の各ユーザのそれぞれの人口統計情報を備えている、ことと、
前記複数の人口統計を前記ユーザ情報内の人口統計情報と比較することと、
前記比較することに基づいて、2人以上のユーザに関連付けられた人口統計情報が前記複数の人口統計に合致することを決定することと、
2人以上のユーザに関連付けられた前記人口統計情報が前記複数の人口統計に合致することを決定することに応答して、
前記音声コマンドがメディアアセットのための要求を備えていることを決定することと、
前記メディアアセットに関連付けられたメタデータを前記複数の人口統計に合致する前記2人以上のユーザの各々にとって関心があるメディアアセットに関連付けられたメタデータと比較することと、
前記メディアアセットに関連付けられた前記メタデータを前記複数の人口統計に合致する前記2人以上のユーザの各々にとって関心がある前記メディアアセットに関連付けられた前記メタデータと比較することに基づいて、前記2人以上のユーザのうちの第1のユーザが最良合致を構成することを決定することと、
前記第1のユーザが前記最良合致であることを決定することに応答して、前記ユーザが識別されたという指示を表示のために生成することと
を行うように構成されている、システム。
(項目13)
前記制御回路は、前記ユーザの前記家庭に関連付けられたユーザ情報のための前記要求を伝送するとき、
前記音声コマンドが受信されるユーザ機器デバイスに関連付けられた識別文字列を決定することと、
前記家庭ユーザ情報のためのクエリを生成することであって、前記クエリは、前記識別文字列を備えている、ことと、
前記クエリを前記ユーザの前記家庭に関連付けられた前記ユーザ情報を記憶している遠隔サーバに伝送することと
を行うようにさらに構成されている、項目12に記載のシステム。
(項目14)
前記制御回路は、前記ユーザ情報を受信するとき、データ構造に前記ユーザ情報を記憶するようにさらに構成され、前記データ構造は、
複数のエントリであって、前記複数のエントリは、前記家庭内の各ユーザのためのエントリを備えている、複数のエントリと、
各エントリのための複数のフィールドであって、前記複数のフィールドは、それぞれのユーザに関連付けられた人口統計情報の各項目のためのフィールドを備えている、複数のフィールドと
を備えている、項目13に記載のシステム。
(項目15)
前記制御回路は、前記複数の人口統計を前記ユーザ情報内の前記人口統計情報と比較するとき、
前記複数のエントリから第1のエントリを読み出すことと、
前記複数の人口統計のうちの各人口統計を前記2人以上のユーザのうちの第1のユーザの対応する人口統計に関連付けられたフィールドのコンテンツと比較することと、
前記複数の人口統計のうちの各人口統計を前記2人以上のユーザのうちの前記第1のユーザの対応する人口統計に関連付けられた前記フィールドのコンテンツと比較することに基づいて、前記第1のユーザに関連付けられた人口統計に合致する前記複数の人口統計からの人口統計情報の組を生成することと
を行うようにさらに構成されている、項目14に記載のシステム。
(項目16)
前記制御回路は、前記2人以上のユーザに関連付けられた人口統計情報が前記複数の人口統計に合致することを決定するとき、
前記複数の人口統計に合致する前記第1のユーザに関連付けられた人口統計情報の量を前記複数の人口統計に合致する他のユーザに関連付けられた人口統計情報の量と比較することと、
前記複数の人口統計に合致する前記第1のユーザに関連付けられた人口統計情報の量を前記複数の人口統計に合致する他のユーザに関連付けられた人口統計情報の量と比較することに基づいて、合致する人口統計情報の最高量を伴う2人以上のユーザを識別することと
を行うようにさらに構成されている、項目15に記載のシステム。
(項目17)
前記制御回路は、前記メディアアセットに関連付けられたメタデータを前記複数の人口統計に合致する前記2人以上のユーザの各々にとって関心があるメディアアセットに関連付けられた前記メタデータと比較するとき、
複数のユーザプロファイルを受信することであって、前記複数のユーザプロファイルにおける各ユーザプロファイルは、前記2人以上のユーザのうちのユーザに対応し、各ユーザプロファイルは、前記2人以上のユーザのうちのそれぞれのユーザが好むメディアアセットに対応する複数の特性を備えている、ことと、
前記メディアアセットに関連付けられた前記メタデータを前記対応するユーザが好むメディアアセットの特性と比較することと、
前記メディアアセットに関連付けられた前記メタデータを前記対応するユーザが好むメディアアセットの特性と比較することに基づいて、前記2人以上のユーザのうちの各ユーザのために、合致する特性の量を決定することと
を行うようにさらに構成されている、項目12に記載のシステム。
(項目18)
前記制御回路は、前記2人以上のユーザから、合致するメタデータの最高量を伴う者を決定するとき、
前記複数の特性のうちの各特性に関連付けられた重みを読み出すことと、
各特性のためのそれぞれの重みを使用して、前記2人以上のユーザのうちの各ユーザのために、合致する特性の量を計算することと、
合致する特性の最高量を伴う合致するユーザを選択することと
を行うようにさらに構成されている、項目17に記載のシステム。
(項目19)
前記制御回路は、前記ユーザが識別されたという前記指示を表示のために生成するとき、
記憶装置から前記ユーザのプロファイルを読み出すことと、
前記ユーザの前記プロファイルに基づいて、前記ユーザがアバタを選択したことを決定することと、
前記メディアアセットの一部にオーバーレイされる前記アバタを表示のために生成することと
を行うようにさらに構成されている、項目12に記載のシステム。
(項目20)
前記制御回路は、前記ユーザに関連付けられた全てのデバイスにおいて前記音声シグネチャを記憶するようにさらに構成されている、項目12に記載のシステム。
(項目21)
前記制御回路は、
前記ユーザの音声プロファイルに前記音声シグネチャおよび前記メディアアセットの指示を記憶することと、
後続の音声コマンドを検出することと、
前記後続の音声コマンドに関連付けられた後続の音声シグネチャが前記音声シグネチャに合致することを決定することと、
前記ユーザの前記音声プロファイルに前記後続の音声コマンドのコンテンツを記憶することと
を行うようにさらに構成されている、項目12に記載のシステム。
(項目22)
音声データおよびメディア消費データに基づいてユーザを識別するためのシステムであって、前記システムは、
ユーザから受信された音声コマンドから音声シグネチャを生成する手段と、
前記音声シグネチャから、前記ユーザに関連付けられた複数の音声特性を決定する手段であって、前記複数の音声特性は、複数の人口統計に対応する、手段と、
前記ユーザの家庭に関連付けられたユーザ情報のための要求を伝送する手段と、
前記ユーザ情報を受信する手段であって、前記ユーザ情報は、前記家庭内の各ユーザのそれぞれの人口統計情報を備えている、手段と、
前記複数の人口統計を前記ユーザ情報内の人口統計情報と比較する手段と、
前記比較することに基づいて、2人以上のユーザに関連付けられた人口統計情報が前記複数の人口統計に合致することを決定する手段と、
2人以上のユーザに関連付けられた前記人口統計情報が前記複数の人口統計に合致することを決定することに応答して、
前記音声コマンドがメディアアセットのための要求を備えていることを決定することと、
前記メディアアセットに関連付けられたメタデータを前記複数の人口統計に合致する前記2人以上のユーザの各々にとって関心があるメディアアセットに関連付けられたメタデータと比較することと、
前記メディアアセットに関連付けられた前記メタデータを前記複数の人口統計に合致する前記2人以上のユーザの各々にとって関心がある前記メディアアセットに関連付けられた前記メタデータと比較することに基づいて、前記2人以上のユーザのうちの第1のユーザが最良合致を構成することを決定することと、
前記第1のユーザが前記最良合致であることを決定することに応答して、前記ユーザが識別されたという指示を表示のために生成することと
を行う手段と
を備えている、システム。
(項目23)
前記ユーザの前記家庭に関連付けられたユーザ情報のための前記要求を伝送する前記手段は、
前記音声コマンドが受信されるユーザ機器デバイスに関連付けられた識別文字列を決定する手段と、
前記家庭ユーザ情報のためのクエリを生成する手段であって、前記クエリは、前記識別文字列を備えている、手段と、
前記クエリを前記ユーザの前記家庭に関連付けられた前記ユーザ情報を記憶している遠隔サーバに伝送する手段と
を備えている、項目22に記載のシステム。
(項目24)
前記ユーザ情報を受信する前記手段は、データ構造に前記ユーザ情報を記憶する手段をさらに備え、前記データ構造は、
複数のエントリであって、前記複数のエントリは、前記家庭内の各ユーザのためのエントリを備えている、複数のエントリと、
各エントリのための複数のフィールドであって、前記複数のフィールドは、それぞれのユーザに関連付けられた人口統計情報の各項目のためのフィールドを備えている、複数のフィールドと
を備えている、項目23に記載のシステム。
(項目25)
前記複数の人口統計を前記ユーザ情報内の前記人口統計情報と比較する前記手段は、
前記複数のエントリから第1のエントリを読み出す手段と、
前記複数の人口統計のうちの各人口統計を前記2人以上のユーザのうちの第1のユーザの対応する人口統計に関連付けられたフィールドのコンテンツと比較する手段と、
前記複数の人口統計のうちの各人口統計を前記2人以上のユーザのうちの前記第1のユーザの対応する人口統計に関連付けられた前記フィールドのコンテンツと比較することに基づいて、前記第1のユーザに関連付けられた人口統計に合致する前記複数の人口統計からの人口統計情報の組を生成する手段と
を備えている、項目24に記載のシステム。
(項目26)
前記2人以上のユーザに関連付けられた人口統計情報が前記複数の人口統計に合致することを決定する前記手段は、
前記複数の人口統計に合致する前記第1のユーザに関連付けられた人口統計情報の量を前記複数の人口統計に合致する他のユーザに関連付けられた人口統計情報の量と比較する手段と、
前記複数の人口統計に合致する前記第1のユーザに関連付けられた人口統計情報の量を前記複数の人口統計に合致する他のユーザに関連付けられた人口統計情報の量と比較することに基づいて、合致する人口統計情報の最高量を伴う2人以上のユーザを識別する手段と
を備えている、項目25に記載のシステム。
(項目27)
前記メディアアセットに関連付けられたメタデータを前記複数の人口統計に合致する前記2人以上のユーザの各々にとって関心があるメディアアセットに関連付けられた前記メタデータと比較する前記手段は、
複数のユーザプロファイルを受信する手段であって、前記複数のユーザプロファイルにおける各ユーザプロファイルは、前記2人以上のユーザのうちのユーザに対応し、各ユーザプロファイルは、前記2人以上のユーザのうちのそれぞれのユーザが好むメディアアセットに対応する複数の特性を備えている、手段と、
前記メディアアセットに関連付けられた前記メタデータを前記対応するユーザが好むメディアアセットの特性と比較する手段と、
前記メディアアセットに関連付けられた前記メタデータを前記対応するユーザが好むメディアアセットの特性と比較することに基づいて、前記2人以上のユーザのうちの各ユーザのために、合致する特性の量を決定する手段と
を備えている、項目22に記載のシステム。
(項目28)
前記2人以上のユーザから、合致するメタデータの最高量を伴う者を決定する前記手段は、
前記複数の特性のうちの各特性に関連付けられた重みを読み出す手段と、
各特性のためのそれぞれの重みを使用して、前記2人以上のユーザのうちの各ユーザのために、合致する特性の量を計算する手段と、
合致する特性の最高量を伴う合致するユーザを選択する手段と
を備えている、項目27に記載のシステム。
(項目29)
前記ユーザが識別されたという前記指示を表示のために生成する前記手段は、
記憶装置から前記ユーザのプロファイルを読み出す手段と、
前記ユーザの前記プロファイルに基づいて、前記ユーザがアバタを選択したことを決定する手段と、
前記メディアアセットの一部にオーバーレイされる前記アバタを表示のために生成する手段と
を備えている、項目22に記載のシステム。
(項目30)
前記ユーザに関連付けられた全てのデバイスにおいて前記音声シグネチャを記憶する手段をさらに備えている、項目22に記載のシステム。
(項目31)
前記ユーザの音声プロファイルに前記音声シグネチャおよび前記メディアアセットの指示を記憶する手段と、
後続の音声コマンドを検出する手段と、
前記後続の音声コマンドに関連付けられた後続の音声シグネチャが前記音声シグネチャに合致することを決定する手段と、
前記ユーザの前記音声プロファイルに前記後続の音声コマンドのコンテンツを記憶する手段と
をさらに備えている、項目22に記載のシステム。
(項目32)
音声データおよびメディア消費データに基づいてユーザを識別するためのエンコードされた非一過性のコンピュータ読み取り可能な命令を備えている非一過性のコンピュータ読み取り可能な媒体であって、前記命令は、
ユーザから受信された音声コマンドから音声シグネチャを生成するための命令と、
前記音声シグネチャから、前記ユーザに関連付けられた複数の音声特性を決定するための命令であって、前記複数の音声特性は、複数の人口統計に対応する、命令と、
前記ユーザの家庭に関連付けられたユーザ情報のための要求を伝送するための命令と、
前記ユーザ情報を受信するための命令であって、前記ユーザ情報は、前記家庭内の各ユーザのそれぞれの人口統計情報を備えている、命令と、
前記複数の人口統計を前記ユーザ情報内の人口統計情報と比較するための命令と、
前記比較することに基づいて、2人以上のユーザに関連付けられた人口統計情報が前記複数の人口統計に合致することを決定するための命令と、
2人以上のユーザに関連付けられた前記人口統計情報が前記複数の人口統計に合致することを決定することに応答して、
前記音声コマンドがメディアアセットのための要求を備えていることを決定することと、
前記メディアアセットに関連付けられたメタデータを前記複数の人口統計に合致する前記2人以上のユーザの各々にとって関心があるメディアアセットに関連付けられたメタデータと比較することと、
前記メディアアセットに関連付けられた前記メタデータを前記複数の人口統計に合致する前記2人以上のユーザの各々にとって関心がある前記メディアアセットに関連付けられた前記メタデータと比較することに基づいて、前記2人以上のユーザのうちの第1のユーザが最良合致を構成することを決定することと、
前記第1のユーザが前記最良合致であることを決定することに応答して、前記ユーザが識別されたという指示を表示のために生成することと
を行うための命令と
を備えている、非一過性のコンピュータ読み取り可能な媒体。
(項目33)
前記ユーザの前記家庭に関連付けられたユーザ情報のための前記要求を伝送するための前記命令は、
前記音声コマンドが受信されるユーザ機器デバイスに関連付けられた識別文字列を決定するための命令と、
前記家庭ユーザ情報のためのクエリを生成するための命令であって、前記クエリは、前記識別文字列を備えている、命令と、
前記クエリを前記ユーザの前記家庭に関連付けられた前記ユーザ情報を記憶している遠隔サーバに伝送するための命令と
を備えている、項目32に記載の非一過性の機械読み取り可能な媒体。
(項目34)
前記ユーザ情報を受信するための前記命令は、データ構造に前記ユーザ情報を記憶するための命令をさらに備え、前記データ構造は、
複数のエントリであって、前記複数のエントリは、前記家庭内の各ユーザのためのエントリを備えている、複数のエントリと、
各エントリのための複数のフィールドであって、前記複数のフィールドは、それぞれのユーザに関連付けられた人口統計情報の各項目のためのフィールドを備えている、複数のフィールドと
を備えている、項目33に記載の非一過性の機械読み取り可能な媒体。
(項目35)
前記複数の人口統計を前記ユーザ情報内の前記人口統計情報と比較するための前記命令は、
前記複数のエントリから第1のエントリを読み出すための命令と、
前記複数の人口統計のうちの各人口統計を前記2人以上のユーザのうちの第1のユーザの対応する人口統計に関連付けられたフィールドのコンテンツと比較するための命令と、
前記複数の人口統計のうちの各人口統計を前記2人以上のユーザのうちの前記第1のユーザの対応する人口統計に関連付けられた前記フィールドのコンテンツと比較することに基づいて、前記第1のユーザに関連付けられた人口統計に合致する前記複数の人口統計からの人口統計情報の組を生成するための命令と
を備えている、項目34に記載の非一過性の機械読み取り可能な媒体。
(項目36)
前記2人以上のユーザに関連付けられた人口統計情報が前記複数の人口統計に合致することを決定するための前記命令は、
前記複数の人口統計に合致する前記第1のユーザに関連付けられた人口統計情報の量を前記複数の人口統計に合致する他のユーザに関連付けられた人口統計情報の量と比較するための命令と、
前記複数の人口統計に合致する前記第1のユーザに関連付けられた人口統計情報の量を前記複数の人口統計に合致する他のユーザに関連付けられた人口統計情報の量と比較することに基づいて、合致する人口統計情報の最高量を伴う2人以上のユーザを識別するための命令と
を備えている、項目35に記載の非一過性の機械読み取り可能な媒体。
(項目37)
前記メディアアセットに関連付けられたメタデータを前記複数の人口統計に合致する前記2人以上のユーザの各々にとって関心があるメディアアセットに関連付けられた前記メタデータと比較するための前記命令は、
複数のユーザプロファイルを受信するための命令であって、前記複数のユーザプロファイルにおける各ユーザプロファイルは、前記2人以上のユーザのうちのユーザに対応し、各ユーザプロファイルは、前記2人以上のユーザのうちのそれぞれのユーザが好むメディアアセットに対応する複数の特性を備えている、命令と、
前記メディアアセットに関連付けられた前記メタデータを前記対応するユーザが好むメディアアセットの特性と比較するための命令と、
前記メディアアセットに関連付けられた前記メタデータを前記対応するユーザが好むメディアアセットの特性と比較することに基づいて、前記2人以上のユーザのうちの各ユーザのために、合致する特性の量を決定するための命令と
を備えている、項目32に記載の非一過性の機械読み取り可能な媒体。
(項目38)
前記2人以上のユーザから、合致するメタデータの最高量を伴う者を決定するための前記命令は、
前記複数の特性のうちの各特性に関連付けられた重みを読み出すための命令と、
各特性のためのそれぞれの重みを使用して、前記2人以上のユーザのうちの各ユーザのために、合致する特性の量を計算するための命令と、
合致する特性の最高量を伴う合致するユーザを選択するための命令と
を備えている、項目37に記載の非一過性の機械読み取り可能な媒体。
(項目39)
前記ユーザが識別されたという前記指示を表示のために生成するための前記命令は、
記憶装置から前記ユーザのプロファイルを読み出すための命令と、
前記ユーザの前記プロファイルに基づいて、前記ユーザがアバタを選択したことを決定するための命令と、
前記メディアアセットの一部にオーバーレイされる前記アバタを表示のために生成するための命令と
を備えている、項目32に記載の非一過性の機械読み取り可能な媒体。
(項目40)
前記ユーザに関連付けられた全てのデバイスにおいて前記音声シグネチャを記憶するための命令をさらに備えている、項目32に記載の非一過性の機械読み取り可能な媒体。
(項目41)
前記ユーザの音声プロファイルに前記音声シグネチャおよび前記メディアアセットの指示を記憶するための命令と、
後続の音声コマンドを検出するための命令と、
前記後続の音声コマンドに関連付けられた後続の音声シグネチャが前記音声シグネチャに合致することを決定するための命令と、
前記ユーザの前記音声プロファイルに前記後続の音声コマンドのコンテンツを記憶するための命令と
をさらに備えている、項目32に記載の非一過性の機械読み取り可能な媒体。
(項目42)
音声データおよびメディア消費データに基づいてユーザを識別する方法であって、前記方法は、
制御回路を使用して、ユーザから受信された音声コマンドから音声シグネチャを生成することと、
前記制御回路を使用して、前記音声シグネチャから、前記ユーザに関連付けられた複数の音声特性を決定することであって、前記複数の音声特性は、複数の人口統計に対応する、ことと、
通信回路を使用して、前記ユーザの家庭に関連付けられたユーザ情報のための要求を伝送することと、
前記通信回路を使用して、前記ユーザ情報を受信することであって、前記ユーザ情報は、
前記家庭内の各ユーザのそれぞれの人口統計情報を備えている、ことと、
前記制御回路を使用して、前記複数の人口統計を前記ユーザ情報内の人口統計情報と比較することと、
前記制御回路を使用して、前記比較することに基づいて、2人以上のユーザに関連付けられた人口統計情報が前記複数の人口統計に合致することを決定することと、
2人以上のユーザに関連付けられた前記人口統計情報が前記複数の人口統計に合致することを決定することに応答して、
前記制御回路を使用して、前記音声コマンドがメディアアセットのための要求を備えていることを決定することと、
前記制御回路を使用して、前記メディアアセットに関連付けられたメタデータを前記複数の人口統計に合致する前記2人以上のユーザの各々にとって関心があるメディアアセットに関連付けられたメタデータと比較することと、
前記制御回路を使用して、前記メディアアセットに関連付けられた前記メタデータを前記複数の人口統計に合致する前記2人以上のユーザの各々にとって関心がある前記メディアアセットに関連付けられた前記メタデータと比較することに基づいて、前記2人以上のユーザのうちの第1のユーザが最良合致を構成することを決定することと、
前記第1のユーザが前記最良合致であることを決定することに応答して、前記制御回路を使用して、前記ユーザが識別されたという指示を表示のために生成することと
を含む、方法。
(項目43)
前記ユーザの前記家庭に関連付けられたユーザ情報のための前記要求を伝送することは、
前記音声コマンドが受信されるユーザ機器デバイスに関連付けられた識別文字列を決定することと、
前記家庭ユーザ情報のためのクエリを生成することであって、前記クエリは、前記識別文字列を備えている、ことと、
前記クエリを前記ユーザの前記家庭に関連付けられた前記ユーザ情報を記憶している遠隔サーバに伝送することと
を含む、項目42に記載の方法。
(項目44)
前記ユーザ情報を受信することは、データ構造に前記ユーザ情報を記憶することをさらに含み、前記データ構造は、
複数のエントリであって、前記複数のエントリは、前記家庭内の各ユーザのためのエントリを備えている、複数のエントリと、
各エントリのための複数のフィールドであって、前記複数のフィールドは、それぞれのユーザに関連付けられた人口統計情報の各項目のためのフィールドを備えている、複数のフィールドと
を備えている、項目43に記載の方法。
(項目45)
前記複数の人口統計を前記ユーザ情報内の前記人口統計情報と比較することは、
前記複数のエントリから第1のエントリを読み出すことと、
前記複数の人口統計のうちの各人口統計を前記2人以上のユーザのうちの第1のユーザの対応する人口統計に関連付けられたフィールドのコンテンツと比較することと、
前記複数の人口統計のうちの各人口統計を前記2人以上のユーザのうちの前記第1のユーザの対応する人口統計に関連付けられた前記フィールドのコンテンツと比較することに基づいて、前記第1のユーザに関連付けられた人口統計に合致する前記複数の人口統計からの人口統計情報の組を生成することと
を含む、項目44に記載の方法。
(項目46)
前記2人以上のユーザに関連付けられた人口統計情報が前記複数の人口統計に合致することを決定することは、
前記複数の人口統計に合致する前記第1のユーザに関連付けられた人口統計情報の量を前記複数の人口統計に合致する他のユーザに関連付けられた人口統計情報の量と比較することと、
前記複数の人口統計に合致する前記第1のユーザに関連付けられた人口統計情報の量を前記複数の人口統計に合致する他のユーザに関連付けられた人口統計情報の量と比較することに基づいて、合致する人口統計情報の最高量を伴う2人以上のユーザを識別することと
を含む、項目45に記載の方法。
(項目47)
前記メディアアセットに関連付けられたメタデータを前記複数の人口統計に合致する前記2人以上のユーザの各々にとって関心があるメディアアセットに関連付けられた前記メタデータと比較することは、
複数のユーザプロファイルを受信することであって、前記複数のユーザプロファイルにおける各ユーザプロファイルは、前記2人以上のユーザのうちのユーザに対応し、各ユーザプロファイルは、前記2人以上のユーザのうちのそれぞれのユーザが好むメディアアセットに対応する複数の特性を備えている、ことと、
前記メディアアセットに関連付けられた前記メタデータを前記対応するユーザが好むメディアアセットの特性と比較することと、
前記メディアアセットに関連付けられた前記メタデータを前記対応するユーザが好むメディアアセットの特性と比較することに基づいて、前記2人以上のユーザのうちの各ユーザのために、合致する特性の量を決定することと
を含む、項目42-46のいずれかに記載の方法。
(項目48)
前記2人以上のユーザから、合致するメタデータの最高量を伴う者を決定することは、
前記複数の特性のうちの各特性に関連付けられた重みを読み出すことと、
各特性のためのそれぞれの重みを使用して、前記2人以上のユーザのうちの各ユーザのために、合致する特性の量を計算することと、
合致する特性の最高量を伴う合致するユーザを選択することと
を含む、項目47に記載の方法。
(項目49)
前記ユーザが識別されたという前記指示を表示のために生成することは、
記憶装置から前記ユーザのプロファイルを読み出すことと、
前記ユーザの前記プロファイルに基づいて、前記ユーザがアバタを選択したことを決定することと、
前記メディアアセットの一部にオーバーレイされる前記アバタを表示のために生成することと
を含む、項目42-48のいずれかに記載の方法。
(項目50)
前記ユーザに関連付けられた全てのデバイスにおいて前記音声シグネチャを記憶することをさらに含む、項目42-49のいずれかに記載の方法。
(項目51)
前記ユーザの音声プロファイルに前記音声シグネチャおよび前記メディアアセットの指示を記憶することと、
後続の音声コマンドを検出することと、
前記後続の音声コマンドに関連付けられた後続の音声シグネチャが前記音声シグネチャに合致することを決定することと、
前記ユーザの前記音声プロファイルに前記後続の音声コマンドのコンテンツを記憶することと
をさらに含む、項目42-50のいずれかに記載の方法。
本開示の上記および他の目的および利点は、同様の参照文字が全体を通して同様の部分を指す添付の図面と併せて考慮される以下の発明を実施するための形態の検討から明白であろう。
図1は、本開示のいくつかの実施形態による、音声シグネチャから抽出される人口統計情報と、家庭内のユーザの人口統計データとを含むデータ構造の例証的例を示す。
図2は、本開示のいくつかの実施形態による、メディアコンテンツにアクセスする際に使用するための表示画面の例証的例を示す。
図3は、本開示のいくつかの実施形態による、メディアコンテンツにアクセスする際に使用するための表示画面の別の例証的例を示す。
図4は、本開示のいくつかの実施形態による、例証的ユーザ機器デバイスのブロック図である。
図5は、本開示のいくつかの実施形態による、例証的メディアシステムのブロック図である。
図6は、本開示のいくつかの実施形態による、音声データおよびメディア消費データに基づいてユーザを識別するための例証的アクションのフローチャートである。
図7は、本開示のいくつかの実施形態による、音声データおよびメディア消費データに基づいてユーザを識別するための例証的アクションの別のフローチャートである。
図8は、本開示のいくつかの実施形態による、2人以上のユーザに関連付けられた人口統計情報が複数の人口統計に合致することを決定するための例証的アクションのフローチャートである。
図9は、本開示のいくつかの実施形態による、音声シグネチャをユーザに合致させるための例証的アクションのフローチャートである。
システムおよび方法が、音声データおよびメディア消費データに基づいてユーザを識別するために本明細書に開示される。いくつかの実施形態において、メディアガイドアプリケーションは、ユーザの入力から音声シグネチャを生成し、そのシグネチャに基づいて、ユーザのいくつかの人口統計特性(例えば、年齢、性別、および他の好適な特性)を識別し得る。メディアガイドアプリケーションは、ユーザの家庭に関連付けられたユーザのためのユーザデータを読み出し、ユーザのうちのコマンドを話したものを識別しようとし得る。複数のユーザが人口統計特性に基づいて識別される場合、メディアガイドアプリケーションは、音声コマンドのコンテンツ(例えば、要求されるメディアのタイプ)を使用し、ユーザを識別し得る。
いくつかの実施形態において、メディアガイドアプリケーションは、音声データおよびメディア消費データに基づいてユーザを識別するために、以下のアクションを実施し得る。メディアガイドアプリケーションは、ユーザから受信された音声コマンドから音声シグネチャを生成し得る。例えば、メディアガイドアプリケーションは、ユーザから口頭によるコマンドを受信し得る。コマンドの受信時、メディアガイドアプリケーションは、ユーザのための音声シグネチャ(例えば、人口統計情報検出を可能にする音声入力の部分)を生成し得る。
メディアガイドアプリケーションは、音声シグネチャを分析し、発話者の人口統計特性を識別し得る。具体的に、メディアガイドアプリケーションは、音声シグネチャから、ユーザに関連付けられた複数の音声特性を決定し得、複数の音声特性は、複数の人口統計に対応する。例えば、メディアガイドアプリケーションは、特定の性別および年齢層に関連付けられた特定の特性に関して音声シグネチャを分析し得る。メディアガイドアプリケーションは、データ構造に(例えば、データ構造100に)その情報を記憶し得る。図1のデータ構造100は、複数のフィールドタイプ102を含み得る。フィールドタイプ102は、音声シグネチャを表す2進または16進データを含み得る音声シグネチャフィールドを含み得る。音声シグネチャが別の好適なタイプのデータとして記憶され得ることを留意されたい。フィールド102は、性別フィールド、年齢層フィールド、および他の好適な人口統計フィールドも含み得る。いくつかの実施形態において、データ構造100は、音声コマンドに関連付けられたコンテキストフィールドを含み得る。例えば、コマンドの日付/時間、コマンドが話された場所、ならびに他の好適なコンテキストデータ。データ構造100は、複数のエントリ104を含み得る。各エントリ104は、音声シグネチャから抽出される人口統計データ(例えば、性別値、年齢層値、および他の好適な人口統計データ値)を含み得る。データ構造100および120が、他の人口統計データのための別個のフィールドを含み得、1つの人口統計データタイプが、1つのフィールドに対応することに留意されたい。
メディアガイドアプリケーションは、家庭(例えば、ユーザの口頭による入力を受信したデバイスの家庭)内のユーザのユーザ情報を取得しようとし得る。具体的に、メディアガイドアプリケーションは、ユーザの家庭に関連付けられたユーザ情報のための要求を伝送し得る。例えば、メディアガイドアプリケーションは、ユーザ情報のための家庭識別子を含む要求を伝送し得る。
ユーザ情報のための要求に応答して、メディアガイドアプリケーションは、家庭情報を受信し得る。具体的に、メディアガイドアプリケーションは、ユーザ情報を受信し得、ユーザ情報は、家庭内の各ユーザのそれぞれの人口統計情報を含む。例えば、メディアガイドアプリケーションは、いくつかのエントリを含むデータ構造を受信し得、各エントリは、家庭の一員のためのものである。図1のデータ構造120は、そのようなデータ構造の例証的例としての役割を果たし得る。フィールドタイプ122は、ユーザIDフィールド(例えば、英数字列、数字、または16進数)、性別フィールド、および年齢フィールドを含み得る。このデータ構造における年齢フィールドは、具体的な数字であることに留意されたい。いくつかの実施形態において、年齢フィールドは、年齢の代わりに、ユーザの生年月日を含み得る。他の人口統計データも、データ構造に記憶され得る。データ構造120は、各フィールドタイプのためのフィールド値を有するエントリ124を含み得る。例えば、ユーザ1が、ユーザID値であり得、男性が、性別であり得、16が、具体的ユーザの年齢であり得る。複数のエントリ124が、データ構造に記憶され得る。
メディアガイドアプリケーションは、音声シグネチャから抽出される人口統計情報を受信された人口統計家庭情報と比較し得る。具体的に、メディアガイドアプリケーションは、複数の人口統計をユーザ情報内の人口統計情報と比較し得る。例えば、メディアガイドアプリケーションは、エントリ104における性別値をエントリ124における性別値と比較し得る。同じ比較が、年齢フィールドおよび他の人口統計フィールドに関して行われ得る。
比較の結果として、メディアガイドアプリケーションは、音声シグネチャに合致し得る複数のユーザを識別し得る。具体的に、メディアガイドアプリケーションは、比較することに基づいて、2人以上のユーザに関連付けられた人口統計情報が複数の人口統計に合致することを決定し得る。例えば、メディアガイドアプリケーションは、2つのエントリ124がエントリ104に合致することを決定し得る。
複数の身元を合致させることに応答して、メディアガイドアプリケーションは、コマンドのコンテンツを使用し、発話者であるユーザを識別し得る。具体的に、メディアガイドアプリケーションは、2人以上のユーザに関連付けられた人口統計情報が複数の人口統計に合致することを決定することに応答して、以下のアクションを実施し得る。メディアガイドアプリケーションは、(例えば、音声コマンドに基づいて発話認識アルゴリズムを実行することによって)音声コマンドがメディアアセットのための要求を含むことを決定し、メディアアセットに関連付けられたメタデータを複数の人口統計に合致する2人以上のユーザの各々にとって関心があるメディアアセットに関連付けられたメタデータと比較し得る。例えば、メディアガイドアプリケーションは、各合致するユーザのためのプロファイルを読み出し得る。プロファイルは、音声コマンドが受信されたデバイスのメモリに、および/または、遠隔サーバに記憶され得る。各プロファイルは、ユーザの選好(例えば、好ましいジャンル、好ましいペアレンタルガイダンス評価、お気に入りの俳優、お気に入りの映画、または別の好適な選好)を示すデータを含み得る。
メディアガイドアプリケーションは、比較に基づいて、最も可能性の高い発話者を識別し得る。具体的に、メディアガイドアプリケーションは、メディアアセットに関連付けられたメタデータを複数の人口統計に合致する2人以上のユーザの各々にとって関心があるメディアアセットに関連付けられたメタデータと比較することに基づいて、2人以上のユーザのうちの第1のユーザが最良合致を構成することを決定し得る。例えば、メディアガイドアプリケーションは、例えば、第1のプロファイルが、アクション・アドベンチャジャンルに関する選好を表す一方、第2のプロファイルが、子供向けのコメディに関する選好を表すので、第1のプロファイルにおけるデータが、第2のプロファイルにおけるデータよりメディアアセットのメタデータに関してより良好な合致であることを決定し得る。
メディアガイドアプリケーションは、あるタイプのインジケータを表示のために生成し、発話者が識別されたことを視聴者に知らせ得る。具体的に、メディアガイドアプリケーションは、第1のユーザが最良合致であることを決定することに応答して、ユーザが識別されたという指示を表示のために生成し得る。例えば、メディアガイドアプリケーションは、ユーザの写真のアイコン、ユーザのアバタのアイコン、ユーザの名前、または別の好適なインジケータを表示のために生成し得る。
いくつかの実施形態において、メディアガイドアプリケーションは、以下のアクションを講じることによって、ユーザの家庭に関連付けられたユーザ情報のための要求を伝送し得る。メディアガイドアプリケーションは、音声コマンドを受信したユーザデバイスのための識別文字列を読み出し得る。具体的に、メディアガイドアプリケーションは、音声コマンドが受信されるユーザ機器デバイスに関連付けられた識別文字列を決定し得る。例えば、メディアガイドアプリケーションは、デバイスのシリアル番号を表す英数字列を読み出し得る。
メディアガイドアプリケーションは、識別文字列を使用し、家庭情報に関するクエリを構築し得る。具体的に、メディアガイドアプリケーションは、家庭ユーザ情報のためのクエリを生成し得、クエリは、識別文字列を含む。例えば、メディアガイドアプリケーションは、デバイスのシリアル番号を表す英数字列を使用して、データベース検索クエリを生成し得る。
メディアガイドアプリケーションは、生成されたクエリを適切な情報を記憶するサーバに伝送し得る。具体的に、メディアガイドアプリケーションは、クエリをユーザの家庭に関連付けられたユーザ情報を記憶している遠隔サーバに伝送し得る。例えば、ユーザの家庭に関連付けられたユーザ情報は、遠隔場所におけるデータベースサーバ上に記憶され得る。メディアガイドアプリケーションは、インターネットを経由してクエリを伝送し得る。
いくつかの実施形態において、メディアガイドアプリケーションは、ユーザ情報を受信すると、データ構造にユーザ情報を記憶し得る。データ構造は、複数のエントリを含み得、複数のエントリは、家庭内の各ユーザのためのエントリを含む。例えば、メディアガイドアプリケーションは、テーブルとしてデータ構造を記憶し得、テーブルは、各エントリのための行を含む。メディアガイドアプリケーションは、各エントリのための複数のフィールドを記憶し得、複数のフィールドは、それぞれのユーザに関連付けられた人口統計情報の各項目のためのフィールドを含む。例えば、テーブルは、年齢および性別のためのフィールドを含むエントリ(例えば、エントリ124)を含み得る。
いくつかの実施形態において、メディアガイドアプリケーションは、複数の人口統計をユーザ情報内の人口統計情報と比較するとき、以下のアクションを実施し得る。メディアガイドアプリケーションは、複数のエントリから第1のエントリを読み出し得る。例えば、ディアガイドアプリケーションは、メモリから第1のエントリ、すなわち、エントリ124を読み出し得る。
メディアガイドアプリケーションは、受信された人口統計情報を音声コマンドから抽出される人口統計と比較し得る。具体的に、メディアガイドアプリケーションは、複数の人口統計のうちの各人口統計を2人以上のユーザのうちの第1のユーザの対応する人口統計に関連付けられたフィールドのコンテンツと比較し得る。例えば、メディアガイドアプリケーションは、音声コマンドから抽出される年齢層(例えば、エントリ104の年齢層フィールド)を受信されたエントリの年齢フィールド(例えば、エントリ124の年齢フィールド)と比較し得る。メディアガイドアプリケーションは、音声コマンドから抽出される年齢層を他のエントリの年齢フィールド(すなわち、家庭内の他のユーザの年齢)と比較し得る。
メディアガイドアプリケーションは、人口統計比較に基づいて、合致するユーザを識別し得る。具体的に、メディアガイドアプリケーションは、複数の人口統計のうちの各人口統計を2人以上のユーザのうちの第1のユーザの対応する人口統計に関連付けられたフィールドのコンテンツと比較することに基づいて、複数の人口統計から第1のユーザに関連付けられた人口統計に合致する人口統計情報の組を生成し得る。例えば、メディアガイドアプリケーションは、第1のユーザおよび第2のユーザを含む組を生成し得る。組は、各ユーザのためのエントリ124を含み得る。
いくつかの実施形態において、メディアガイドアプリケーションは、2人以上のユーザに関連付けられた人口統計情報が複数の人口統計に合致することを決定するとき、以下のアクションを実施し得る。メディアガイドアプリケーションは、複数の人口統計に合致する第1のユーザに関連付けられた人口統計情報の量を複数の人口統計に合致する他のユーザに関連付けられた人口統計情報の量と比較し得る。例えば、メディアガイドアプリケーションは、各エントリ124に関して、音声コマンドからの人口統計情報に合致するフィールド(例えば、性別および年齢フィールド)の数を他のテーブルエントリにおける合致するフィールドの数と比較し得る。例えば、メディアガイドアプリケーションは、比較に基づいて、2つのエントリが、合致する2つのフィールドを有する一方、2つのエントリが、合致するエントリを有していないことを決定し得る。
メディアガイドアプリケーションは、合致する人口統計情報の複数の組を識別し得る。具体的に、メディアガイドアプリケーションは、複数の人口統計に合致する第1のユーザに関連付けられた人口統計情報の量を複数の人口統計に合致する他のユーザに関連付けられた人口統計情報の量と比較することに基づいて、合致する人口統計情報の最高量を伴う2人以上のユーザを識別し得る。例えば、メディアガイドアプリケーションは、2つのエントリ(例えば、エントリ124)が、最高量の合致する情報を構成することを決定し得る。
いくつかの実施形態において、メディアガイドアプリケーションは、メディアアセットに関連付けられたメタデータを複数の人口統計に合致する2人以上のユーザの各々にとって関心があるメディアアセットに関連付けられたメタデータと比較するとき、以下のアクションを実施し得る。メディアガイドアプリケーションは、複数のユーザプロファイルを受信し得、複数のユーザプロファイルにおける各ユーザプロファイルは、2人以上のユーザのうちのユーザに対応し、各ユーザプロファイルは、2人以上のユーザのうちのそれぞれのユーザが好むメディアアセットに対応する複数の特性を含む。例えば、メディアガイドアプリケーションは、メモリから、識別された各ユーザのためのユーザプロファイルを読み出し得る。ユーザプロファイルは、ユーザが好むコンテンツのタイプを示す情報を含み得る。例えば、各ユーザのプロファイルは、ユーザのお気に入りのメディアアセット、好ましいジャンル、好ましい俳優、および他の好適な選好を含み得る。
メディアガイドアプリケーションは、ユーザのプロファイルに基づいて、人口統計情報に基づいて前に識別されたユーザのうちの音声コマンドに合致するユーザを決定し得る。具体的に、メディアガイドアプリケーションは、メディアアセットに関連付けられたメタデータを対応するユーザが好むメディアアセットの特性と比較し得る。例えば、メディアガイドアプリケーションは、メディアアセットに関連付けられたメタデータを読み出し得る。メタデータは、ローカル記憶装置(例えば、プログラムリスト項目データベース)から、または遠隔サーバから読み出され得る。メタデータは、メディアアセットのジャンルを含み得る。メディアガイドアプリケーションは、メディアアセットのジャンルをユーザのプロファイルにおけるユーザの好ましいジャンルと比較し、合致を決定し得る。このプロセスは、メディアアセットに関連付けられた他のメタデータに関して繰り返され得る(例えば、各俳優が、ユーザによって好まれる俳優のリストと比較され得る)。いくつかの実施形態において、コマンドのコンテンツを使用し、ユーザの一部のうちの1人を識別する代わりに、またはそれに加えて、メディアガイドアプリケーションは、識別のためにユーザをプロンプトし得る。例えば、メディアガイドアプリケーションは、発話者が1つを選定することができるように、合致するユーザに対応する2つ以上のユーザ識別子を表示のために生成し得る。いくつかの実施形態において、メディアガイドアプリケーションは、選択肢をユーザに話し得る。メディアガイドアプリケーションは、適切な識別子のユーザ選択を受信し得る。
メディアガイドアプリケーションは、比較に基づいて、各ユーザのプロファイルに関して、メディアアセットのメタデータに合致する特性の量を識別し得る。具体的に、メディアガイドアプリケーションは、メディアアセットに関連付けられたメタデータを対応するユーザが好むメディアアセットの特性と比較することに基づいて、2人以上のユーザのうちの各ユーザのために、合致する特性の量を決定し得る。例えば、1つのプロファイルが、ジャンルに合致し得る一方、別のプロファイルは、ジャンル、ペアレンタルガイダンス評価、およびお気に入りの俳優に合致し得る。
いくつかの実施形態において、メディアガイドアプリケーションは、2人以上のユーザから、合致するメタデータの最高量を伴う者を決定するとき、以下のアクションを実施し得る。メディアガイドアプリケーションは、複数の特性のうちの各特性に関連付けられた重みを読み出し得る。例えば、ジャンル特性は、ペアレンタルガイダンス評価特性より高い重みを有し得る。
メディアガイドアプリケーションは、対応する重みを各特性に適用し、最良合致を決定し得る。具体的に、メディアガイドアプリケーションは、各特性のためのそれぞれの重みを使用して、2人以上のユーザのうちの各ユーザのために、合致する特性の量を計算し得る。例えば、ジャンルのための重みが、0.75であり得る一方、ペアレンタルガイダンス評価のための重みは、0.25であり得る。メディアガイドアプリケーションは、これらの重みを特性に適用することによって、合致する特性の最終量を決定し得る。
メディアガイドアプリケーションは、合致する特性の最高量を伴う合致するユーザを選択し得る。例えば、メディアガイドアプリケーションは、最高数の合致する特性を伴うユーザを音声コマンドの発話者として識別し得る。
いくつかの実施形態において、メディアガイドアプリケーションは、ユーザが識別されたという指示を表示のために生成するとき、以下のアクションを講じ得る。メディアガイドアプリケーションは、記憶装置からユーザのプロファイルを読み出し得る。例えば、メディアガイドアプリケーションは、セットトップボックスまたは遠隔サーバからユーザ設定を読み出し得る。
メディアガイドアプリケーションは、ユーザのプロファイルに基づいて、ユーザがアバタを選択したことを決定し得る。例えば、ユーザのプロファイルは、ユーザが好むアバタの識別を含み得る。メディアガイドアプリケーションは、メディアアセットの一部にオーバーレイされるアバタを表示のために生成し得る。
いくつかの実施形態において、メディアガイドアプリケーションは、ユーザに関連付けられた全てのデバイスにおいて音声シグネチャを記憶し得る。例えば、ユーザは、(例えば、家庭の複数の部屋内の)複数のセットトップボックスに加えて、電子タブレットを有し得る。メディアガイドアプリケーションは、後に使用するために音声シグネチャをデバイスの全てに伝送し得る。
いくつかの実施形態において、メディアガイドアプリケーションは、ユーザのプロファイルを音声シグネチャで更新し得る。具体的に、メディアガイドアプリケーションは、ユーザの音声プロファイルに音声シグネチャおよびメディアアセットの指示を記憶し、後続の音声コマンドを検出すると、後続の音声コマンドに関連付けられた後続の音声シグネチャがその音声シグネチャに合致することを決定し得る。メディアガイドアプリケーションは、ユーザの音声プロファイルに後続の音声コマンドのコンテンツを記憶し得る。メディアガイドアプリケーションは、タブレットおよびユーザに関連付けられた他のデバイスのメモリおよびサーバに情報を記憶し得、サーバは、新たに入手されたデバイスに情報をプッシュし得る。
いくつかの実施形態において、メディアガイドアプリケーションは、家庭の一員ではないユーザを識別していることもある。例えば、家庭におけるユーザの訪問している親戚または友人が、メディアガイドアプリケーションによって実行されるべきコマンドを話していることもある。メディアガイドアプリケーションは、家庭の一員ではないユーザを識別するために、家庭内の全てのユーザが前に識別されているかどうかを決定し得る。例えば、メディアガイドアプリケーションは、家庭内の各ユーザを通して反復し、ユーザのそれぞれのプロファイルを読み出し得る。いくつかの実施形態において、メディアガイドアプリケーションは、単に、ユーザのプロファイルにアクセスし得る。メディアガイドアプリケーションは、ユーザのプロファイルにおけるフラグから、ユーザが識別されたかどうかを決定し得る。家庭内の全てのユーザが、ユーザが識別されたというフラグをプロファイルに有する場合、メディアガイドアプリケーションは、訪問ユーザがシステムを使用していることを決定し得る。しかしながら、家庭の全てのユーザが識別されていない場合、メディアガイドアプリケーションは、決定において使用の頻度を使用し得る。例えば、メディアガイドアプリケーションは、ユーザの声紋をシステムにアクセスするために使用された他の声紋と比較し得る。例えば、メディアガイドアプリケーションは、システムにアクセスするために使用された各声紋およびアクセスの頻度を記憶し得る。コマンドを話しているユーザがシステムの頻繁なユーザではなかった(2回以下)場合、メディアガイドアプリケーションは、ユーザが家庭の一員ではないこと(例えば、訪問者)を決定し得る。対照的に、ユーザが頻繁に(例えば、20回以上)システムを使用していた場合、メディアガイドアプリケーションは、ユーザが家庭の一員であることを決定し得る。メディアガイドアプリケーションは、アクセスの頻度とともにタイミングも使用し得る。例えば、メディアガイドアプリケーションは、特定の月、または過去30日間のアクセスの頻度を決定し得る。いくつかの実施形態において、メディアガイドアプリケーションは、ユーザのデバイスに基づいて、ユーザがゲストであるかどうかを決定し得る。ユーザのデバイスが家庭ネットワークに頻繁に接続されていないものである場合、ユーザは、ゲストであり得る。
いくつかの実施形態において、制御回路は、ユーザの音声入力の頻度に基づいて、ユーザがゲストであるか、家庭の一員であるかを決定し得る。例えば、特定のユーザが家庭内で頻繁に(例えば、1ヶ月あたり10回)音声入力デバイスを使用する場合、制御回路は、ユーザが家庭の一員であることを決定し得る。しかしながら、入力の頻度が少ない(例えば、先月に1回または2回)、メディアガイドアプリケーションは、ユーザが家庭のゲストであることを決定し得る。
ユーザが家庭の一員ではない場合、メディアガイドアプリケーションは、ユーザのためのゲストプロファイルを設定し得る。いくつかの実施形態において、メディアガイドアプリケーションは、ユーザが識別のためにユーザの証明情報を入力するためのプロンプト、または、人口統計情報を入力するためのプロンプトを表示のために生成し得る。さらにいくつかの実施形態において、メディアガイドアプリケーションは、訪問者を識別する他の方法を使用しようとし得る。例えば、メディアガイドアプリケーションは、(上で議論されるように)人口統計データに関してユーザの音声を分析し、家庭の構成員に関連付けられたプロファイル(例えば、ソーシャルメディアプロファイル)を使用し、訪問者を識別しようとし得る。例えば、メディアガイドアプリケーションは、家庭内の各ユーザのプロファイルを通して反復し、各ユーザに関連付けられたソーシャルメディアアカウントを識別し得る。メディアガイドアプリケーションは、各ソーシャルメディアアカウントを通して反復し、例えば、各ユーザのソーシャルメディア関連の年齢および性別を音声コマンド人口統計データと比較することによって、訪問者を識別し得る。
いくつかの実施形態において、メディアガイドアプリケーションは、ユーザのための完全なプロファイルを生成するために、人口統計情報とともに音声コマンドを使用し得る。例えば、メディアガイドアプリケーションは、ユーザからコマンドを受信し、その音声コマンドに基づいてユーザを識別し得る。具体的に、メディアガイドアプリケーションは、メディアガイドアプリケーションに記憶されるユーザに関連付けられた音声サンプルを音声コマンドと比較し、ユーザを識別し得る。メディアガイドアプリケーションは、遠隔場所から家庭のユーザに関連付けられた人口統計情報を読み出し、音声コマンドから抽出される人口統計情報を受信された人口統計情報と比較し得る。例えば、メディアガイドアプリケーションは、人口統計データを読み出し、データ構造120にそれを記憶し得る。メディアガイドアプリケーションは、比較に基づいて、ユーザを識別し得る。例えば、データ構造120のユーザ1は、データ構造100の6~16歳の男性に対応し得る。メディアガイドアプリケーションは、ユーザのプロファイルを可能な限り完全にするために、遠隔サーバから受信される人口統計情報をユーザのプロファイルにコピーし得る。
任意の所与のコンテンツ配信システムにおいてユーザに利用可能なコンテンツの量が、膨大であり得る。その結果、多くのユーザは、ユーザがコンテンツの選択を効率的にナビゲートし、所望し得るコンテンツを容易に識別することを可能にするインターフェースを通したメディアガイドの形態を所望している。そのようなガイドを提供するアプリケーションは、本明細書において、双方向メディアガイドアプリケーションと称されるが、時として、メディアガイドアプリケーションまたはガイドアプリケーションと称されることもある。
双方向メディアガイドアプリケーションは、それらがガイドを提供するコンテンツに応じて、種々の形態をとり得る。1つの典型的なタイプのメディアガイドアプリケーションは、双方向テレビ番組ガイドである。双方向テレビ番組ガイド(時として、電子番組ガイドと称される)は、とりわけ、ユーザが、多くのタイプのコンテンツまたはメディアアセット間をナビゲートし、それを見つけることを可能にする周知のガイドアプリケーションである。双方向メディアガイドアプリケーションは、ユーザが、コンテンツ間をナビゲートし、それを見つけ、選択することを可能にするグラフィカルユーザインターフェース画面を生成し得る。本明細書で参照されるように、用語「メディアアセット」および「コンテンツ」は、テレビ番組のみならず、有料番組、オンデマンド番組(ビデオオンデマンド(VOD)システムにおけるような)、インターネットコンテンツ(例えば、ストリーミングコンテンツ、ダウンロード可能コンテンツ、ウェブキャスト等)、ビデオクリップ、オーディオ、コンテンツ情報、写真、回転画像、ドキュメント、再生リスト、ウェブサイト、記事、書籍、電子書籍、ブログ、チャットセッション、ソーシャルメディア、アプリケーション、ゲーム、および/または任意の他のメディアもしくはマルチメディア、および/または、それらの組み合わせ等の電子的に消費可能なユーザアセットを意味すると理解されたい。ガイドアプリケーションは、ユーザが、コンテンツ間をナビゲートし、それを見つけることも可能にする。本明細書で参照されるように、用語「マルチメディア」は、上で説明される少なくとも2つの異なるコンテンツ形態、例えば、テキスト、オーディオ、画像、ビデオ、または双方向コンテンツ形態を利用するコンテンツを意味すると理解されたい。コンテンツは、ユーザ機器デバイスによって、録画、再生、表示、またはアクセスされ得るが、ライブパーフォーマンスの一部であることもできる。
本明細書に議論される実施形態のいずれかを実施するためのメディアガイドアプリケーションおよび/または任意の命令は、コンピュータ読み取り可能な媒体上にエンコードされ得る。コンピュータ読み取り可能な媒体は、データを記憶することが可能な任意の媒体を含む。コンピュータ読み取り可能な媒体は、限定ではないが、電気もしくは電磁信号の伝搬を含む一過性であり得るか、または、限定ではないが、ハードディスク、フロッピー(登録商標)ディスク、USBドライブ、DVD、CD、メディアカード、レジスタメモリ、プロセッサキャッシュ、ランダムアクセスメモリ(「RAM」)等の揮発性および不揮発性コンピュータメモリもしくは記憶デバイスを含む非一過性であり得る。
インターネット、モバイルコンピューティング、および高速無線ネットワークの出現に伴って、ユーザは、従来は使用しなかったユーザ機器デバイス上でメディアにアクセスするようになっている。本明細書で参照されるように、語句「ユーザ機器デバイス」、「ユーザ機器」、「ユーザデバイス」、「電子デバイス」、「電子機器」、「メディア機器デバイス」、または「メディアデバイス」は、テレビ、スマートTV、セットトップボックス、衛星テレビに対応するための統合型受信機デコーダ(IRD)、デジタル記憶デバイス、デジタルメディア受信機(DMR)、デジタルメディアアダプタ(DMA)、ストリーミングメディアデバイス、DVDプレーヤ、DVDレコーダ、接続型DVD、ローカルメディアサーバ、BLU-RAY(登録商標)プレーヤ、BLU-RAY(登録商標)レコーダ、パーソナルコンピュータ(PC)、ラップトップコンピュータ、タブレットコンピュータ、ウェブTVボックス、パーソナルコンピュータテレビ(PC/TV)、PCメディアサーバ、PCメディアセンター、ハンドヘルドコンピュータ、固定電話、携帯情報端末(PDA)、携帯電話、ポータブルビデオプレーヤ、ポータブル音楽プレーヤ、ポータブルゲーム機、スマートフォン、または任意の他のテレビ機器、コンピューティング機器、もしくは無線デバイス、および/またはそれらの組み合わせ等の上で説明されるコンテンツにアクセスするための任意のデバイスを意味すると理解されたい。いくつかの実施形態において、ユーザ機器デバイスは、正面画面および裏面画面、複数の正面画面、または複数の角度付き画面を有し得る。いくつかの実施形態において、ユーザ機器デバイスは、正面カメラおよび/または裏面カメラを有し得る。これらのユーザ機器デバイス上で、ユーザは、テレビを通して利用可能な同じコンテンツ間をナビゲートし、それを見つけることが可能であり得る。その結果として、メディアガイドは、これらのデバイス上でも利用可能であり得る。提供されるガイドは、テレビのみを通して利用可能なコンテンツ、他のタイプのユーザ機器デバイスのうちの1つ以上のもののみを通して利用可能なコンテンツ、もしくはテレビおよび他のタイプのユーザ機器デバイスのうちの1つ以上のものの両方を通して利用可能なコンテンツのためのものであり得る。メディアガイドアプリケーションは、ユーザ機器デバイス上で、オンラインアプリケーション(すなわち、ウェブサイト上で提供される)として、または独立型アプリケーションもしくはクライアントとして提供され得る。メディアガイドアプリケーションを実装し得る種々のデバイスおよびプラットフォームは、下でより詳細に説明される。
メディアガイドアプリケーションの機能のうちの1つは、メディアガイドデータをユーザに提供することである。本明細書で参照されるように、語句「メディアガイドデータ」または「ガイドデータ」は、コンテンツに関連する任意のデータもしくはガイドアプリケーションを動作させることにおいて使用されるデータを意味すると理解されたい。例えば、ガイドデータは、番組情報、ガイドアプリケーション設定、ユーザ選好、ユーザプロファイル情報、メディアリスト項目、メディア関連情報(例えば、放送時間、放送チャネル、タイトル、内容、評価情報(例えば、ペアレンタルコントロール評価、批評家の評価等)、ジャンルまたはカテゴリ情報、俳優情報、放送会社またはプロバイダのロゴのロゴデータ等)、メディア形式(例えば、標準解像度、高解像度、3D等)、オンデマンド情報、ブログ、ウェブサイト、およびユーザが所望のコンテンツ選択間をナビゲートし、それを見つけるために役立つ任意の他のタイプのガイドデータを含み得る。
図2-3は、メディアガイドデータを提供するために使用され得る例証的表示画面を示す。図2-3に示される表示画面は、任意の好適なユーザ機器デバイスまたはプラットフォーム上に実装され得る。図2-3の表示は、フル画面表示として図示されているが、それらは、表示されているコンテンツ上に完全または部分的にオーバーレイされ得る。ユーザは、表示画面に提供された選択可能なオプション(例えば、メニューオプション、リスト項目オプション、アイコン、ハイパーリンク等)を選択することによって、またはリモートコントロールもしくは他のユーザ入力インターフェースまたはデバイス上の専用ボタン(例えば、「ガイド」ボタン)を押すことによって、コンテンツ情報にアクセスする要望を示し得る。ユーザの指示に応答して、メディアガイドアプリケーションは、グリッド内の時間およびチャネル別、時間別、チャネル別、ソース別、コンテンツタイプ別、カテゴリ別(例えば、映画、スポーツ、ニュース、子供向け、または他の番組カテゴリ)、または他の所定、ユーザ定義、もしくは他の編成基準等のいくつかの方法のうちの1つにおいて編成されたメディアガイドデータを表示画面に提供し得る。
図2は、単一表示内の異なるタイプのコンテンツへのアクセスも可能にする時間およびチャネル別に配列された番組リスト項目表示200の例証的グリッドを示す。表示200は、(1)各チャネル/コンテンツタイプ識別子(列内のセル)が利用可能な異なるチャネルまたはコンテンツのタイプを識別する、チャネル/コンテンツタイプ識別子204の列、および、(2)各時間識別子(行内のセル)が番組の時間帯を識別する時間識別子206の行を伴うグリッド202を含み得る。グリッド202は、番組リスト項目208等の番組リスト項目のセルも含み、各リスト項目は、リスト項目の関連チャネルおよび時間の上に提供される番組のタイトルを提供する。ユーザ入力デバイスを用いて、ユーザは、ハイライト領域210を移動させることによって番組リスト項目を選択することができる。ハイライト領域210によって選択される番組リスト項目に関する情報が、番組情報領域212内に提供され得る。領域212は、例えば、番組タイトル、番組内容、番組が提供される時間(該当する場合)、番組が放送されるチャネル(該当する場合)、番組の評価、および他の所望の情報を含み得る。
線形番組(例えば、所定の時間に複数のユーザ機器デバイスに伝送されるようにスケジュールされ、スケジュールに従って提供されるコンテンツ)にアクセスを提供することに加えて、メディアガイドアプリケーションは、非線形番組(例えば、任意の時間においてユーザ機器デバイスにアクセス可能であり、スケジュールに従って提供されないコンテンツ)へのアクセスも提供する。非線形番組は、オンデマンドコンテンツ(例えば、VOD)、インターネットコンテンツ(例えば、ストリーミングメディア、ダウンロード可能メディア等)、ローカルで記憶されたコンテンツ(例えば、上で説明される任意のユーザ機器デバイスまたは他の記憶デバイス上に記憶されたコンテンツ)、または時間的制約のない他のコンテンツを含む異なるコンテンツソースからのコンテンツを含み得る。オンデマンドコンテンツは、映画または特定のコンテンツプロバイダ(例えば、「The Sopranos」や「Curb Your Enthusiasm」を提供するHBO On Demand)によって提供される映画または任意の他のコンテンツを含み得る。HBO ON DEMANDは、Time Warner Company L. P. et al.によって所有されるサービスマークであり、THE SOPRANOSおよびCURB YOUR ENTHUSIASMは、Home Box Office,Inc.によって所有される商標である。インターネットコンテンツは、チャットセッションまたはウェブキャスト等のウェブイベント、もしくはインターネットウェブサイトまたは他のインターネットアクセス(例えば、FTP)を通して、ストリーミングコンテンツまたはダウンロード可能なコンテンツとしてオンデマンドで利用可能なコンテンツを含み得る。
グリッド202は、オンデマンドリスト項目214、録画コンテンツリスト項目216、およびインターネットコンテンツリスト項目218を含む非線形番組のメディアガイドデータを提供し得る。異なるタイプのコンテンツソースからのコンテンツのためのメディアガイドデータを組み合わせる表示は、時として、「混合メディア」表示と称されることもある。表示200とは異なる表示され得るメディアガイドデータのタイプの種々の順列は、ユーザ選択またはガイドアプリケーション定義に基づき得る(例えば、録画および放送リスト項目のみの表示、オンデマンドおよび放送リスト項目のみの表示等)。例証されるように、リスト項目214、216、および218は、これらのリスト項目の選択が、それぞれ、オンデマンドリスト項目、録画リスト項目、またはインターネットリスト項目専用の表示へのアクセスを提供し得ることを示すように、グリッド202内に表示される時間帯全体に及ぶものとして示されている。いくつかの実施形態において、これらのコンテンツタイプのリスト項目は、グリッド202に直接含まれ得る。ユーザがナビゲーションアイコン220のうちの1つを選択することに応答して、追加のメディアガイドデータが表示され得る(ユーザ入力デバイス上の矢印キーを押すことは、ナビゲーションアイコン220を選択することと同様に表示に影響を及ぼし得る)。
表示200は、ビデオ領域222およびオプション領域226も含み得る。ビデオ領域222は、ユーザが、ユーザに現在利用可能である番組、今後利用可能となる番組、もしくは利用可能であった番組を視聴および/またはプレビューすることを可能にし得る。ビデオ領域222のコンテンツは、グリッド202に表示されるリスト項目のうちの1つに対応することも、それらから独立していることもある。ビデオ領域を含むグリッド表示は、時として、ピクチャインガイド(PIG)表示と称されることもある。PIG表示およびそれらの機能性は、2003年5月13日に発行されたSatterfield et al.の米国特許第6,564,378号、および2001年5月29日に発行されたYuen et al.の米国特許第6,239,794号(それらの全体として参照することによって本明細書に組み込まれる)でより詳細に説明されている。PIG表示は、本明細書に説明される実施形態の他のメディアガイドアプリケーション表示画面に含まれ得る。
オプション領域226は、ユーザが、異なるタイプのコンテンツ、メディアガイドアプリケーション表示、および/またはメディアガイドアプリケーション特徴にアクセスすることを可能にし得る。オプション領域226は、表示200(および本明細書に説明される他の表示画面)の一部であり得るか、または、画面上のオプションを選択すること、もしくはユーザ入力デバイス上の専用または割り当て可能ボタンを押すことによって、ユーザによって呼び出され得る。オプション領域226内の選択可能オプションは、グリッド202内の番組リスト項目に関連する特徴に関し得るか、または、メインメニュー表示から利用可能なオプションを含み得る。番組リスト項目に関連する特徴は、他の放送時間または番組の受信方法を検索すること、番組を録画すること、番組の連続録画を有効化すること、番組および/またはチャネルをお気に入りとして設定すること、番組を購入すること、または他の特徴を含み得る。メインメニュー表示から利用可能なオプションは、検索オプション、VODオプション、ペアレンタルコントロールオプション、インターネットオプション、クラウドベースのオプション、デバイス同期オプション、第2の画面デバイスオプション、種々のタイプのメディアガイドデータ表示にアクセスするオプション、プレミアムサービスをサブスクライブするオプション、ユーザのプロファイルを編集するオプション、ブラウザオーバーレイにアクセスするオプション、または他のオプションを含み得る。
メディアガイドアプリケーションは、ユーザの選好に基づいて個人化され得る。個人化されたメディアガイドアプリケーションは、ユーザが、メディアガイドアプリケーションを用いて個人化された「体験」を生成するように、表示および特徴をカスタマイズすることを可能にする。この個人化された体験は、ユーザがこれらのカスタマイズを入力することを可能にすることによって、および/または、種々のユーザ選好を決定するようにメディアガイドアプリケーションがユーザアクティビティを監視することによって、生成され得る。ユーザは、ログインすることによって、または、別様にガイドアプリケーションに対して自らを識別することによって、それらの個人化されたガイドアプリケーションにアクセスし得る。メディアガイドアプリケーションのカスタマイズは、ユーザプロファイルに従って作成され得る。カスタマイズは、提示方式(例えば、表示の色方式、テキストのフォントサイズ等)、表示されるコンテンツリスト項目の側面(例えば、HDTV番組のみまたは3D番組のみ、お気に入りチャネル選択に基づいたユーザ指定の放送チャネル、チャネルの表示の並び替え、推奨コンテンツ等)、所望の録画特徴(例えば、特定のユーザに対する録画または連続録画、録画品質等)、ペアレンタルコントロール設定、インターネットコンテンツのカスタマイズされた提示(例えば、ソーシャルメディアコンテンツ、電子メール、電子的に配信された記事等の提示)、および他の所望のカスタマイズを変更することを含み得る。
メディアガイドアプリケーションは、ユーザが、ユーザプロファイル情報を提供することを可能にし得るか、または、ユーザプロファイル情報を自動的にコンパイルし得る。メディアガイドアプリケーションは、例えば、ユーザがアクセスするコンテンツ、および/またはユーザがガイドアプリケーションと行い得る他の相互作用を監視し得る。加えて、メディアガイドアプリケーションは、特定のユーザに関連する他のユーザプロファイルの全体または一部を取得し(例えば、www.Tivo.com等のユーザがアクセスするインターネット上の他のウェブサイトから、ユーザがアクセスする他のメディアガイドアプリケーションから、ユーザがアクセスする他の双方向アプリケーションから、ユーザの別のユーザ機器デバイスから等)、および/または、メディアガイドアプリケーションがアクセスし得る他のソースから、ユーザについての情報を取得し得る。結果として、ユーザは、ユーザの異なるユーザ機器デバイスにわたって、統一されたガイドアプリケーション体験を提供されることができる。このタイプのユーザ体験は、図5に関連して下でより詳細に説明される。追加の個人化されたメディアガイドアプリケーション特徴は、2005年7月11日に出願されたEllis et al.の米国特許出願公開第2005/0251827号、2007年1月16日に発行されたBoyer et al.の米国特許第7,165,098号、および2002年2月21日に出願されたEllis et al.の米国特許出願公開第2002/0174430号(それらの全体として参照することによって本明細書に組み込まれる)でより詳細に説明されている。
メディアガイドを提供するための別の表示配列が、図3に示されている。ビデオモザイク表示300は、コンテンツのタイプ、ジャンル、および/または他の編成基準に基づいて編成されたコンテンツ情報のための選択可能オプション302を含む。表示300において、テレビリスト項目オプション304が、選択され、したがって、リスト項目306、308、310、および312を放送番組リスト項目として提供する。表示300において、リスト項目は、カバーアート、コンテンツからの静止画像、ビデオクリップのプレビュー、コンテンツからのライブビデオ、またはリスト項目中のメディアガイドデータによって記述されているコンテンツをユーザに示す他のタイプのコンテンツを含むグラフィック画像を提供し得る。グラフィックリスト項目の各々は、リスト項目に関連付けられたコンテンツに関するさらなる情報を提供するように、テキストも伴い得る。例えば、リスト項目308は、メディア部分314およびテキスト部分316を含む2つ以上の部分を含み得る。メディア部分314および/またはテキスト部分316は、コンテンツをフル画面で視聴するように、またはメディア部分314に表示されるコンテンツに関連する情報を閲覧するように(例えば、ビデオが表示されるチャネルのリスト項目を閲覧するように)、選択可能であり得る。
表示300内のリスト項目は、異なるサイズである(すなわち、リスト項目306は、リスト項目308、310、および312より大きい)が、所望に応じて、全てのリスト項目が同じサイズであり得る。リスト項目は、コンテンツプロバイダの所望に応じて、またはユーザ選好に基づいて、ユーザの関心の程度を示すように、または、あるコンテンツを強調するように、異なるサイズであるか、またはグラフィック的に強調され得る。コンテンツリスト項目をグラフィック的に強調するための種々のシステムおよび方法は、例えば、2009年11月12日に出願されたYatesの米国特許出願公開第2010/0153885号(その全体として参照することによって本明細書に組み込まれる)に議論されている。
ユーザは、それらのユーザ機器デバイスのうちの1つ以上のものから、コンテンツおよびメディアガイドアプリケーション(および上および下で説明されるその表示画面)にアクセスし得る。図4は、例証的ユーザ機器デバイス400の汎用実施形態を示す。ユーザ機器デバイスのより具体的な実装は、図5に関連して下で議論される。ユーザ機器デバイス400は、入出力(以下「I/O」)パス402を介して、コンテンツおよびデータを受信し得る。I/Oパス402は、処理回路406および記憶装置408を含む制御回路404に、コンテンツ(例えば、放送番組、オンデマンド番組、インターネットコンテンツ、ローカルエリアネットワーク(LAN)または広域ネットワーク(WAN)を経由して利用可能なコンテンツ、および/または、他のコンテンツ)およびデータを提供し得る。制御回路404は、I/Oパス402を使用して、コマンド、要求、および他の好適なデータを送受信するために使用され得る。I/Oパス402は、制御回路404(具体的に、処理回路406)を1つ以上の通信パス(下で説明される)に接続し得る。I/O機能は、これらの通信パスのうちの1つ以上のものによって提供され得るが、図面が複雑になり過ぎることを回避するため、図4では単一パスとして示されている。
制御回路404は、処理回路406等の任意の好適な処理回路に基づき得る。本明細書で参照されるように、処理回路は、1つ以上のマイクロプロセッサ、マイクロコントローラ、デジタル信号プロセッサ、プログラマブル論理デバイス、フィールドプログラマブルゲートアレイ(FPGA)、特定用途向け集積回路(ASIC)等に基づく回路を意味すると理解され、マルチコアプロセッサ(例えば、デュアルコア、クアドコア、ヘクサコア、または任意の好適な数のコア)またはスーパーコンピュータを含み得る。いくつかの実施形態において、処理回路は、複数の別個のプロセッサまたは処理ユニット、例えば、複数の同じタイプの処理ユニット(例えば、2つのIntel Core i7プロセッサ)または複数の異なるプロセッサ(例えば、Intel Core i5プロセッサおよびIntel Core i7プロセッサ)にわたって分散され得る。いくつかの実施形態において、制御回路404は、メモリ(すなわち、記憶装置408)に記憶されたメディアガイドアプリケーションに対する命令を実行する。具体的に、制御回路404は、メディアガイドアプリケーションによって、上および下で議論される機能を果たすように命令され得る。例えば、メディアガイドアプリケーションは、制御回路404に、メディアガイド表示を生成するための命令を提供し得る。いくつかの実装において、制御回路404によって実施される任意のアクションは、メディアガイドアプリケーションから受信される命令に基づき得る。
クライアントサーバベースの実施形態において、制御回路404は、ガイドアプリケーションサーバまたは他のネットワークもしくはサーバと通信するための好適な通信回路を含み得る。上で述べられる機能性を実施するための命令は、ガイドアプリケーションサーバ上に記憶され得る。通信回路は、ケーブルモデム、総合デジタル通信網(ISDN)モデム、デジタルサブスクライバ回線(DSL)モデム、電話モデム、イーサネット(登録商標)カード、または他の機器との通信用の無線モデム、もしくは任意の他の好適な通信回路を含み得る。そのような通信は、インターネットまたは任意の他の好適な通信ネットワークもしくはパスを伴い得る(図5に関連してより詳細に説明される)。加えて、通信回路は、ユーザ機器デバイスのピアツーピア通信、または互いに遠隔の場所にあるユーザ機器デバイスの通信を可能にする回路を含み得る(下でより詳細に説明される)。
メモリは、制御回路404の一部である、記憶装置408として提供される、電子記憶デバイスであり得る。本明細書で参照されるように、語句「電子記憶デバイス」または「記憶デバイス」は、ランダムアクセスメモリ、読み取り専用メモリ、ハードドライブ、光学ドライブ、デジタルビデオディスク(DVD)レコーダ、コンパクトディスク(CD)レコーダ、BLU-RAY(登録商標)ディスク(BD)レコーダ、BLU-RAY(登録商標) 3Dディスクレコーダ、デジタルビデオレコーダ(DVR、または時として、パーソナルビデオレコーダもしくはPVRと呼ばれる)、ソリッドステートデバイス、量子記憶デバイス、ゲームコンソール、ゲームメディア、または任意の他の好適な固定もしくはリムーバブル記憶デバイス、および/またはそれらの任意の組み合わせ等の電子データ、コンピュータソフトウェア、もしくはファームウェアを記憶するための任意のデバイスを意味すると理解されたい。記憶装置408は、本明細書に説明される種々のタイプのコンテンツ、および上で説明されるメディアガイドデータを記憶するために使用され得る。不揮発性メモリも、(例えば、ブートアップルーチンおよび他の命令を起動するために)使用され得る。図5に関連して説明されるクラウドベースの記憶装置が、記憶装置408を補完するために使用されるか、または、記憶装置408の代わりに使用され得る。
制御回路404は、1つ以上のアナログチューナ、1つ以上のMPEG-2デコーダ、もしくは他のデジタルデコード回路、高解像度チューナ、または任意の他の好適な同調もしくはビデオ回路、またはそのような回路の組み合わせ等のビデオ生成回路および同調回路を含み得る。(例えば、記憶するために、無線、アナログ、またはデジタル信号をMPEG信号に変換するための)エンコード回路も、提供され得る。制御回路404は、コンテンツをユーザ機器400の好ましい出力形式に上方変換および下方変換するためのスケーリング回路も含み得る。回路404は、デジタル信号とアナログ信号との間で変換するためのデジタル/アナログ変換回路およびアナログ/デジタル変換回路も含み得る。同調およびエンコード回路は、コンテンツを受信して表示すること、再生すること、または録画することを行うために、ユーザ機器デバイスによって使用され得る。同調およびエンコード回路は、ガイドデータを受信するためにも使用され得る。例えば、同調、ビデオ生成、エンコード、デコード、暗号化、解読、スケーリング、およびアナログ/デジタル回路を含む本明細書に説明される回路は、1つ以上の汎用もしくは特殊プロセッサ上で起動するソフトウェアを使用して実装され得る。複数のチューナが、同時同調機能(例えば、視聴および録画機能、ピクチャインピクチャ(PIP)機能、多重チューナ録画機能等)に対処するように提供され得る。記憶装置408が、ユーザ機器400とは別のデバイスとして提供される場合、同調およびエンコード回路(複数のチューナを含む)は、記憶装置408に関連付けられ得る。
ユーザは、ユーザ入力インターフェース410を使用して、命令を制御回路404に送信し得る。ユーザ入力インターフェース410は、リモートコントロール、マウス、トラックボール、キーパッド、キーボード、タッチスクリーン、タッチパッド、スタイラス入力、ジョイスティック、音声認識インターフェース、または他のユーザ入力インターフェース等の任意の好適なユーザインターフェースであり得る。ディスプレイ412は、独立型デバイスとして提供されるか、または、ユーザ機器デバイス400の他の要素と統合され得る。例えば、ディスプレイ412は、タッチスクリーンまたはタッチセンサ式ディスプレイであり得る。そのような状況において、ユーザ入力インターフェース410は、ディスプレイ412と統合されるか、または、組み合わせられ得る。ディスプレイ412は、モニタ、テレビ、モバイルデバイス用液晶ディスプレイ(LCD)、非晶質シリコンディスプレイ、低温ポリシリコンディスプレイ、電子インクディスプレイ、電気泳動ディスプレイ、アクティブマトリクスディスプレイ、エレクトロウェッティングディスプレイ、電気流体ディスプレイ、ブラウン管ディスプレイ、発光ダイオードディスプレイ、エレクトロルミネセントディスプレイ、プラズマディスプレイパネル、高性能アドレッシングディスプレイ、薄膜トランジスタディスプレイ、有機発光ダイオードディスプレイ、表面伝導型電子放出素子ディスプレイ(SED)、レーザテレビ、カーボンナノチューブ、量子ドットディスプレイ、干渉変調器ディスプレイ、もしくは視覚的画像を表示のための任意の他の好適な機器のうちの1つ以上のものであり得る。いくつかの実施形態において、ディスプレイ412は、HDTV対応型であり得る。いくつかの実施形態において、ディスプレイ412は、3Dディスプレイであり得、双方向メディアガイドアプリケーションおよび任意の好適なコンテンツは、3Dで表示され得る。ビデオカードまたはグラフィックカードは、ディスプレイ412への出力を生成し得る。ビデオカードは、3Dシーンおよび2Dグラフィックのレンダリング加速、MPEG-2/MPEG-4デコード、TV出力、または複数のモニタを接続する能力等の種々の機能を提供し得る。ビデオカードは、制御回路404に関連する上で説明される任意の処理回路であり得る。ビデオカードは、制御回路404と統合され得る。スピーカ414は、ユーザ機器デバイス400の他の要素と統合されたものとして提供され得るか、または、独立型ユニットであり得る。ディスプレイ412上に表示されるビデオおよび他のコンテンツのオーディオコンポーネントは、スピーカ414を通して再生され得る。いくつかの実施形態において、オーディオは、スピーカ414を介して音声を処理および出力する、受信機(図示せず)に配布され得る。
ガイドアプリケーションは、任意の好適なアーキテクチャを使用して実装され得る。例えば、それは、ユーザ機器デバイス400上で完全に実装される独立型アプリケーションであり得る。そのようなアプローチにおいて、アプリケーションの命令は、ローカルで(例えば、記憶装置408に)記憶され、アプリケーションによって使用するためのデータは、周期的にダウンロードされる(例えば、帯域外フィードから、インターネットリソースから、または別の好適なアプローチを使用して)。制御回路404は、記憶装置408からアプリケーションの命令を読み出し、本明細書に議論される表示のうちのいずれかを生成するための命令を処理し得る。処理された命令に基づいて、制御回路404は、入力が入力インターフェース410から受信されるときに実施するアクションを決定し得る。例えば、表示上のカーソルの上/下への移動は、入力インターフェース410が上/下ボタンが選択されたことを示すとき、処理された命令によって示され得る。
いくつかの実施形態において、メディアガイドアプリケーションは、クライアントサーバベースのアプリケーションである。ユーザ機器デバイス400上に実装されるシックまたはシンクライアントによって使用するためのデータは、ユーザ機器デバイス400の遠隔にあるサーバに要求を発行することによって、オンデマンドで読み出される。クライアントサーバベースのガイドアプリケーションの一例において、制御回路404は、遠隔サーバによって提供されるウェブページを解釈するウェブブラウザを起動する。例えば、遠隔サーバは、記憶デバイス内にアプリケーションのための命令を記憶し得る。遠隔サーバは、回路(例えば、制御回路404)を使用して、記憶された命令を処理し、上および下で議論される表示を生成し得る。クライアントデバイスは、遠隔サーバによって生成される表示を受信し得、表示のコンテンツを機器デバイス400上でローカルで表示し得る。このように、命令の処理が、サーバによって遠隔で実施される一方、結果として生じる表示は、機器デバイス400上にローカルで提供される。機器デバイス400は、入力インターフェース410を介して、ユーザからの入力を受信し、対応する表示を処理および生成するために、それらの入力を遠隔サーバに伝送し得る。例えば、機器デバイス400は、上/下ボタンが入力インターフェース410を介して選択されたことを示す、通信を遠隔サーバに伝送し得る。遠隔サーバは、その入力に従って命令を処理し、入力に対応するアプリケーションの表示を生成し得る(例えば、カーソルを上/下に移動させる表示)。生成された表示は、次いで、ユーザへの提示のために、機器デバイス400に伝送される。
いくつかの実施形態において、メディアガイドアプリケーションは、インタープリタまたは仮想マシン(制御回路404によって起動される)によって、ダウンロードされ、解釈または別様に起動される。いくつかの実施形態において、ガイドアプリケーションは、ETVバイナリ交換形式(ETV Binary Interchange Format/EBIF)でエンコードされ、好適なフィードの一部として制御回路404によって受信され、制御回路404上で起動するユーザエージェントによって解釈され得る。例えば、ガイドアプリケーションは、EBIFアプリケーションであり得る。いくつかの実施形態において、ガイドアプリケーションは、制御回路404によって実行されるローカル仮想マシンまたは他の好適なミドルウェアによって受信および起動される一連のJAVA(登録商標)ベースのファイルによって定義され得る。そのような実施形態のうちのいくつか(例えば、MPEG-2または他のデジタルメディアエンコードスキームを採用するもの)において、ガイドアプリケーションは、例えば、番組のMPEGオーディオおよびビデオパケットを用いたMPEG-2オブジェクトカルーセルにおいてエンコードおよび伝送され得る。
図4のユーザ機器デバイス400は、ユーザテレビ機器502、ユーザコンピュータ機器504、無線ユーザ通信デバイス506、または非ポータブルゲーム機等のコンテンツにアクセスするために好適な任意の他のタイプのユーザ機器として、図5のシステム500に実装されることができる。簡単にするために、これらのデバイスは、本明細書では総称して、ユーザ機器またはユーザ機器デバイスと称され得、上で説明されるユーザ機器デバイスに実質的に類似し得る。メディアガイドアプリケーションが実装され得るユーザ機器デバイスは、独立型デバイスとして機能し得るか、または、デバイスのネットワークの一部であり得る。デバイスの種々のネットワーク構成が実装され得、下でより詳細に議論される。
図4に関連して上で説明されるシステム特徴のうちの少なくともいくつかを利用するユーザ機器デバイスは、単に、ユーザテレビ機器502、ユーザコンピュータ機器504、または無線ユーザ通信デバイス506として分類されないこともある。例えば、ユーザテレビ機器502は、いくつかのユーザコンピュータ機器504のように、インターネットコンテンツへのアクセスを可能にするインターネット対応型であり得る一方で、ユーザコンピュータ機器504は、あるテレビ機器502のように、テレビ番組へのアクセスを可能にするチューナを含み得る。メディアガイドアプリケーションは、種々の異なるタイプのユーザ機器上で同一レイアウトを有し得るか、または、ユーザ機器の表示能力に合わせられ得る。例えば、ユーザコンピュータ機器504上において、ガイドアプリケーションは、ウェブブラウザによってアクセスされるウェブサイトとして提供され得る。別の例において、ガイドアプリケーションは、無線ユーザ通信デバイス506用に縮小され得る。
システム500において、典型的に、各タイプのユーザ機器デバイスが2つ以上存在するが、図面が複雑になり過ぎることを回避するために、各々のために1つのみが図5に示されている。加えて、各ユーザは、2つ以上のタイプのユーザ機器デバイスを利用し得、各タイプのユーザ機器デバイスのうちの2つ以上のものも利用し得る。
いくつかの実施形態において、ユーザ機器デバイス(例えば、ユーザテレビ機器502、ユーザコンピュータ機器504、無線ユーザ通信デバイス506)は、「第2の画面デバイス」と称され得る。例えば、第2の画面デバイスは、第1のユーザ機器デバイス上に提示されるコンテンツを補完し得る。第2の画面デバイス上に提示されるコンテンツは、第1のデバイス上に提示されるコンテンツを補完する任意の好適なコンテンツであり得る。いくつかの実施形態において、第2の画面デバイスは、第1のデバイスの設定および表示選好を調節するためのインターフェースを提供する。いくつかの実施形態において、第2の画面デバイスは、他の第2の画面デバイスと相互作用するために、またはソーシャルネットワークと相互作用するために構成される。第2の画面デバイスは、第1のデバイスと同じ部屋内に、第1のデバイスと異なる部屋であるが、同じ家または建物内に、もしくは第1のデバイスと異なる建物内に位置することができる。
ユーザは、家庭内デバイスおよび遠隔デバイスにわたって一貫したメディアガイドアプリケーション設定を維持するように、種々の設定も設定し得る。設定は、本明細書に説明されるもののみならず、お気に入りのチャネルおよび番組、番組を推奨するためにガイドアプリケーションが利用する番組選好、表示選好、および他の望ましいガイド設定も含む。例えば、ユーザが、そのオフィスのパーソナルコンピュータ上で、例えば、ウェブサイトwww.Tivo.comの上で、チャネルをお気に入りとして設定した場合、同じチャネルが、ユーザの家庭内デバイス(例えば、ユーザテレビ機器およびユーザコンピュータ機器)上で、および、所望に応じて、ユーザのモバイルデバイス上でお気に入りとして表示されるであろう。したがって、同一または異なるタイプのユーザ機器デバイスであるかどうかにかかわらず、1つのユーザ機器デバイス上で行われる変更は、別のユーザ機器デバイス上のガイド体験を変更することができる。加えて、行われる変更は、ユーザによって入力される設定、および、ガイドアプリケーションによって監視されるユーザアクティビティに基づき得る。
ユーザ機器デバイスは、通信ネットワーク514に結合され得る。すなわち、ユーザテレビ機器502、ユーザコンピュータ機器504、および無線ユーザ通信デバイス506は、それぞれ、通信パス508、510、および512を介して、通信ネットワーク514に結合される。通信ネットワーク514は、インターネット、携帯電話ネットワーク、モバイルボイスまたはデータネットワーク(例えば、4GまたはLTEネットワーク)、ケーブルネットワーク、公衆交換電話ネットワーク、または他のタイプの通信ネットワーク、もしくは通信ネットワークの組み合わせを含む1つ以上のネットワークであり得る。パス508、510、および512は、別個または一緒に、衛星パス、光ファイバパス、ケーブルパス、インターネット通信をサポートするパス(例えば、IPTV)、フリースペース接続(例えば、放送または他の無線信号用)、もしくは任意の他の好適な有線または無線通信パス、もしくはそのようなパスの組み合わせ等の1つ以上の通信パスを含み得る。パス512は、図5に示される例示的実施形態において、無線パスであることを示すように破線で描かれ、パス508および510は、有線パスであることを示すように実線として描かれている(しかし、これらのパスは、所望に応じて、無線パスであり得る)。ユーザ機器デバイスとの通信は、これらの通信パスのうちの1つ以上のものによって提供され得るが、図5において、図面が複雑になり過ぎることを回避するために、単一パスとして示されている。
通信パスは、ユーザ機器デバイスの間には描かれていないが、これらのデバイスは、パス508、510、および512に関連して上で説明されるもの、およびUSBケーブル、IEEE 1394ケーブル、無線パス(例えば、Bluetooth(登録商標)、赤外線、IEEE 802-11x等)等の他の短距離ポイントツーポイント通信パス、もしくは有線または無線パスを介した他の短距離通信等の通信パスを介して、互いに直接通信し得る。BLUETOOTH(登録商標)は、Bluetooth(登録商標) SIG,INC.によって所有される認証マークである。ユーザ機器デバイスは、通信ネットワーク514を介した間接パスを通して、互いに直接通信し得る。
システム500は、通信パス520および522を介して、通信ネットワーク514に結合されたコンテンツソース516およびメディアガイドデータソース518を含む。パス520および522は、パス508、510、および512に関連して上で説明される通信パスのうちのいずれかを含み得る。コンテンツソース516およびメディアガイドデータソース518との通信は、1つ以上の通信パスを介して交信され得るが、図5において、図面が複雑になり過ぎることを回避するために、単一パスとして示される。加えて、コンテンツソース516およびメディアガイドデータソース518の各々が2つ以上存在し得るが、図5において、図面が複雑になり過ぎることを回避するために、各々のために1つのみが示されている。(異なるタイプのこれらのソースの各々が下で議論される)。所望に応じて、コンテンツソース516およびメディアガイドデータソース518は、1つのソースデバイスとして統合され得る。ソース516および518と、ユーザ機器デバイス502、504、および506との間の通信は、通信ネットワーク514を通したものとして示されるが、いくつかの実施形態において、ソース516および518は、パス508、510、および512に関連して上で説明されるもの等の通信パス(図示せず)を介して、ユーザ機器デバイス502、504、および506と直接通信し得る。
コンテンツソース516は、テレビ配信施設、ケーブルシステムヘッドエンド、衛星配信施設、番組ソース(例えば、NBC、ABC、HBO等のテレビ放送会社)、中間配信施設および/またはサーバ、インターネットプロバイダ、オンデマンドメディアサーバ、および他のコンテンツプロバイダを含む1つ以上のタイプのコンテンツ配信機器を含み得る。NBCは、National Broadcasting Company,Inc.によって所有される商標であり、ABCは、American Broadcasting Company,INC.によって所有される商標であり、HBOは、Home Box Office,Inc.によって所有される商標である。コンテンツソース516は、コンテンツの発信元であることも(例えば、テレビ放送会社、ウェブキャストプロバイダ等)、コンテンツの発信元でないこともある(例えば、オンデマンドコンテンツプロバイダ、ダウンロード用放送番組のコンテンツのインターネットプロバイダ等)。コンテンツソース516は、ケーブルソース、衛星プロバイダ、オンデマンドプロバイダ、インターネットプロバイダ、オーバーザトップコンテンツプロバイダ、または他のコンテンツのプロバイダを含み得る。コンテンツソース516は、ユーザ機器デバイスのうちのいずれかから遠隔の場所にある異なるタイプのコンテンツ(ユーザによって選択されるビデオコンテンツを含む)を記憶するために使用される遠隔メディアサーバも含み得る。コンテンツの遠隔記憶のため、および遠隔に記憶されたコンテンツをユーザ機器に提供するためのシステムならびに方法は、2010年7月20日に発行されたEllis et al.の米国特許第7,761,892号(その全体として参照することによって本明細書に組み込まれる)に関連して、より詳細に議論されている。
メディアガイドデータソース518は、上で説明されるメディアガイドデータ等のメディアガイドデータを提供し得る。メディアガイドデータは、任意の好適なアプローチを使用して、ユーザ機器デバイスに提供され得る。いくつかの実施形態において、ガイドアプリケーションは、データフィード(例えば、継続フィードまたはトリクルフィード)を介して、番組ガイドデータを受信する独立型双方向テレビ番組ガイドであり得る。番組スケジュールデータおよび他のガイドデータは、テレビチャネルのサイドバンド上で、帯域内デジタル信号を使用して、帯域外デジタル信号を使用して、または任意の他の好適なデータ伝送技術によって、ユーザ機器に提供され得る。番組スケジュールデータおよび他のメディアガイドデータは、複数のアナログまたはデジタルテレビチャネル上でユーザ機器に提供され得る。
いくつかの実施形態において、メディアガイドデータソース518からのガイドデータは、クライアントサーバアプローチを使用して、ユーザの機器に提供され得る。例えば、ユーザ機器デバイスは、メディアガイドデータをサーバからプルし得るか、または、サーバは、メディアガイドデータをユーザ機器デバイスにプッシュし得る。いくつかの実施形態において、ユーザの機器上に常駐するガイドアプリケーションクライアントは、必要に応じて、例えば、ガイドデータが古くなっているとき、またはユーザ機器デバイスが、データを受信する要求をユーザから受信するとき、ソース518とセッションを開始し、ガイドデータを取得し得る。メディアガイドは、任意の好適な頻度で(例えば、継続的に、毎日、ユーザ規定期間で、システム規定期間で、ユーザ機器からの要求に応答して等)ユーザ機器に提供され得る。メディアガイドデータソース518は、ユーザ機器デバイス502、504、および506に、メディアガイドアプリケーション自体、またはメディアガイドアプリケーションのソフトウェア更新を提供し得る。
いくつかの実施形態において、メディアガイドデータは、視聴者データを含み得る。例えば、視聴者データは、現在および/または履歴ユーザアクティビティ情報(例えば、ユーザが典型的に鑑賞するコンテンツ、ユーザがコンテンツを鑑賞する時刻、ユーザがソーシャルネットワークと相互作用するかどうか、ユーザがソーシャルネットワークと相互作用し、情報をポストする時間、ユーザが典型的に鑑賞するコンテンツのタイプ(例えば、有料TVまたは無料TV)、気分、脳の活動情報等)を含み得る。メディアガイドデータは、サブスクリプションデータも含み得る。例えば、サブスクリプションデータは、所与のユーザがサブスクライブするソースもしくはサービスおよび/または所与のユーザが以前にサブスクライブしていたが、後にアクセスを打ち切ったソースもしくはサービス(例えば、ユーザがプレミアムチャネルをサブスクライブしているかどうか、ユーザがプレミアムレベルのサービスを追加したかどうか、ユーザがインターネット速度を加速させたかどうか)を識別し得る。いくつかの実施形態において、視聴者データおよび/またはサブスクリプションデータは、1年を上回る期間の間の所与のユーザのパターンを識別し得る。メディアガイドデータは、所与のユーザがサービス/ソースへのアクセスを打ち切るであろう可能性を示すスコアを生成するために使用されるモデル(例えば、残存者モデル)を含み得る。例えば、メディアガイドアプリケーションは、所与のユーザが特定のサービスまたはソースへのアクセスを打ち切るであろうかどうかの可能性を示す値またはスコアを生成するためのモデルを使用して、サブスクリプションデータとともに視聴者データを処理し得る。特に、より高いスコアは、ユーザが特定のサービスまたはソースへのアクセスを打ち切るであろう、より高いレベルの信頼性を示し得る。スコアに基づいて、メディアガイドアプリケーションは、ユーザがアクセスを打ち切る可能性が高いであろうものとしてスコアによって示される特定のサービスまたはソースをユーザが維持するように勧誘する宣伝を生成し得る。
メディアガイドアプリケーションは、例えば、ユーザ機器デバイス上に実装される独立型アプリケーションであり得る。例えば、メディアガイドアプリケーションは、記憶装置408に記憶され、ユーザ機器デバイス400の制御回路404によって実行され得るソフトウェアまたは実行可能命令の組として実装され得る。いくつかの実施形態において、メディアガイドアプリケーションは、クライアント-サーバアプリケーションであり得、その場合、クライアントアプリケーションのみが、ユーザ機器デバイス上に常駐し、サーバアプリケーションは、遠隔サーバ上に常駐する。例えば、メディアガイドアプリケーションは、部分的にユーザ機器デバイス400の制御回路404上のクライアントアプリケーションとして、および遠隔サーバの制御回路上で起動するサーバアプリケーション(例えば、メディアガイドデータソース518)として部分的に遠隔サーバ上で、実装され得る。遠隔サーバの制御回路(メディアガイドデータソース518等)によって実行されると、メディアガイドアプリケーションは、制御回路に、ガイドアプリケーション表示を生成し、生成された表示をユーザ機器デバイスに伝送するように命令し得る。サーバアプリケーションは、メディアガイドデータソース518の制御回路に、ユーザ機器上での記憶のためのデータを伝送するように命令し得る。クライアントアプリケーションは、受信のためのユーザ機器の制御回路に、ガイドアプリケーション表示を生成するように命令し得る。
ユーザ機器デバイス502、504、および506に配信されるコンテンツおよび/またはメディアガイドデータは、オーバーザトップ(OTT)コンテンツであり得る。OTTコンテンツ配信は、上で説明される任意のユーザ機器デバイスを含むインターネット対応型ユーザデバイスが、ケーブルまたは衛星接続を経由して受信されるコンテンツに加えて、上で説明される任意のコンテンツを含むインターネットを経由して転送されるコンテンツを受信することを可能にする。OTTコンテンツは、インターネットサービスプロバイダ(ISP)によって提供されるインターネット接続を介して配布されるが、第三者も、コンテンツを配布する。ISPは、視聴能力、著作権、またはコンテンツの再配布に責任がない場合があり、OTTコンテンツプロバイダによって提供されるIPパケットのみを転送し得る。OTTコンテンツプロバイダの例は、IPパケットを介してオーディオおよびビデオを提供する、YOUTUBE(登録商標)、NETFLIX、およびHULUを含む。Youtube(登録商標)は、Google Inc.によって所有される商標であり、Netflixは、Netflix,Inc.によって所有される商標であり、Huluは、Hulu,LLC.によって所有される商標である。OTTコンテンツプロバイダは、加えて、または代替として、上で説明されるメディアガイドデータを提供し得る。コンテンツおよび/またはメディアガイドデータに加えて、OTTコンテンツのプロバイダは、メディアガイドアプリケーション(例えば、ウェブベースのアプリケーションまたはクラウドベースのアプリケーション)を配布することができる、またはコンテンツは、ユーザ機器デバイス上に記憶されたメディアガイドアプリケーションによって表示されることができる。
メディアガイドシステム500は、いくつかのアプローチまたはネットワーク構成を例証することを意図しており、それによって、ユーザ機器デバイスおよびコンテンツおよびガイドデータのソースは、コンテンツにアクセスし、メディアガイドを提供する目的のために、互いに通信し得る。本明細書に説明される実施形態は、これらのアプローチのうちのいずれか1つまたは一部において、もしくはコンテンツを配信し、メディアガイドを提供するための他のアプローチを採用するシステムにおいて、適用され得る。以下の4つのアプローチは、図5の汎用例の具体的例証を提供する。
あるアプローチにおいて、ユーザ機器デバイスは、ホームネットワーク内で互いに通信し得る。ユーザ機器デバイスは、上で説明される短距離ポイントツーポイント通信方式を介して、ホームネットワーク上に提供されるハブまたは他の類似デバイスを通した間接パスを介して、もしくは通信ネットワーク514を介して、互いに直接通信することができる。1つの家庭内の複数の個人の各々が、ホームネットワーク上の異なるユーザ機器デバイスを動作させ得る。結果として、種々のメディアガイド情報または設定が、異なるユーザ機器デバイスの間で通信されることが望ましくあり得る。例えば、2005年7月11日に出願されたEllis et al.の米国特許公開第2005/0251827号でより詳細に説明されるように、ホームネットワーク内の異なるユーザ機器デバイス上で、ユーザが一貫したメディアガイドアプリケーション設定を維持することが望ましくあり得る。ホームネットワーク内の異なるタイプのユーザ機器デバイスも、互いに通信し、コンテンツを伝送し得る。例えば、ユーザは、ユーザコンピュータ機器からポータブルビデオプレーヤまたはポータブル音楽プレーヤにコンテンツを伝送し得る。
第2のアプローチにおいて、ユーザは、複数のタイプのユーザ機器を有し得、それによって、コンテンツにアクセスし、メディアガイドを取得する。例えば、一部のユーザは、家庭内およびモバイルデバイスによってアクセスされるホームネットワークを有し得る。ユーザは、遠隔デバイス上に実装されるメディアガイドアプリケーションを介して、家庭内デバイスを制御し得る。例えば、ユーザは、そのオフィスのパーソナルコンピュータ、またはPDAもしくはウェブ対応携帯電話等のモバイルデバイスを介して、ウェブサイト上のオンラインメディアガイドアプリケーションにアクセスし得る。ユーザは、オンラインガイドアプリケーション上で種々の設定(例えば、録画、リマインダ、または他の設定)を設定して、ユーザの家庭内機器を制御し得る。オンラインガイドは、直接、またはユーザの家庭内機器上のメディアガイドアプリケーションと通信することによって、ユーザの機器を制御し得る。ユーザ機器デバイスが互いに遠隔の場所にあるユーザ機器デバイスの通信のための種々のシステムおよび方法は、例えば、Ellis et al.の2011年10月25日に発行された米国特許第8,046,801号(その全体を参照することによって本明細書に組み込まれる)に議論されている。
第3のアプローチにおいて、家庭内外のユーザ機器デバイスのユーザは、コンテンツソース516と直接通信し、コンテンツにアクセスするために、そのメディアガイドアプリケーションを使用することができる。具体的に、家庭内において、ユーザテレビ機器502およびユーザコンピュータ機器504のユーザは、メディアガイドアプリケーションにアクセスし、所望のコンテンツ間をナビゲートし、それを見つけ得る。ユーザは、無線ユーザ通信デバイス506も使用して、家庭外のメディアガイドアプリケーションにアクセスし、所望のコンテンツ間をナビゲートし、それを見つけ得る。
第4のアプローチにおいて、ユーザ機器デバイスは、クラウドコンピューティング環境内で動作し、クラウドサービスにアクセスし得る。クラウドコンピューティング環境において、コンテンツ共有、記憶、または配布のための種々のタイプのコンピューティングサービス(例えば、ビデオ共有サイトまたはソーシャルネットワーキングサイト)が、「クラウド」と称される、ネットワークアクセス可能コンピューティングおよび記憶リソースの集合によって提供される。例えば、クラウドは、通信ネットワーク514を介したインターネット等のネットワークを介して接続される種々のタイプのユーザおよびデバイスにクラウドベースのサービスを提供する中央にまたは分散場所に位置し得るサーバコンピューティングデバイスの集合を含むことができる。これらのクラウドリソースは、1つ以上のコンテンツソース516および1つ以上のメディアガイドデータソース518を含み得る。加えて、または代替として、遠隔コンピューティングサイトは、ユーザテレビ機器502、ユーザコンピュータ機器504、および無線ユーザ通信デバイス506等の他のユーザ機器デバイスを含み得る。例えば、他のユーザ機器デバイスは、ビデオの記憶されたコピーまたはストリーミングされたビデオへのアクセスを提供し得る。そのような実施形態において、ユーザ機器デバイスは、中央サーバと通信することなく、ピアツーピア様式で動作し得る。
クラウドは、ユーザ機器デバイスのために、他の例の中でもとりわけ、コンテンツ記憶、コンテンツ共有、またはソーシャルネットワーキングサービス等のサービスへのアクセス、および上で説明される任意のコンテンツへのアクセスを提供する。サービスは、クラウドコンピューティングサービスプロバイダを通して、またはオンラインサービスの他のプロバイダを通して、クラウド内で提供されることができる。例えば、クラウドベースのサービスは、コンテンツ記憶サービス、コンテンツ共有サイト、ソーシャルネットワーキングサイト、または他のサービスを含むことができ、それを介して、ユーザ供給コンテンツは、接続されたデバイス上で他者によって視聴するために配布される。これらのクラウドベースのサービスは、ユーザ機器デバイスが、コンテンツをローカルで記憶し、ローカルで記憶されたコンテンツにアクセスするのではなく、コンテンツをクラウドに記憶し、コンテンツをクラウドから受信することを可能にし得る。
ユーザは、カムコーダ、ビデオモード付きデジタルカメラ、オーディオレコーダ、携帯電話、およびハンドヘルドコンピューティングデバイス等の種々のコンテンツ捕捉デバイスを使用して、コンテンツを録画し得る。ユーザは、直接、例えば、ユーザコンピュータ機器504から、またはコンテンツ捕捉特徴を有する無線ユーザ通信デバイス506からのいずれかにおいて、クラウド上のコンテンツ記憶サービスにコンテンツをアップロードすることができる。代替として、ユーザは、最初に、コンテンツをユーザコンピュータ機器504等のユーザ機器デバイスに転送することができる。コンテンツを記憶するユーザ機器デバイスは、通信ネットワーク514上のデータ伝送サービスを使用して、コンテンツをクラウドにアップロードする。いくつかの実施形態において、ユーザ機器デバイス自体が、クラウドリソースであり、他のユーザ機器デバイスは、直接、ユーザがコンテンツを記憶したユーザ機器デバイスから、コンテンツにアクセスすることができる。
クラウドリソースは、例えば、ウェブブラウザ、メディアガイドアプリケーション、デスクトップアプリケーション、モバイルアプリケーション、および/またはそれらのアクセスアプリケーションの任意の組み合わせを使用して、ユーザ機器デバイスによってアクセスされ得る。ユーザ機器デバイスは、アプリケーション配信のために、クラウドコンピューティングに依拠するクラウドクライアントであり得るか、または、ユーザ機器デバイスは、クラウドリソースにアクセスすることなく、ある機能性を有し得る。例えば、ユーザ機器デバイス上で起動するいくつかのアプリケーションは、クラウドアプリケーション、すなわち、インターネットを経由して、サービスとして配信されるアプリケーションであり得る一方で、他のアプリケーションは、ユーザ機器デバイス上に記憶され、起動され得る。いくつかの実施形態において、ユーザデバイスは、コンテンツを複数のクラウドリソースから同時に受信し得る。例えば、ユーザデバイスは、オーディオを1つのクラウドリソースからストリーミングする一方で、コンテンツを第2のクラウドリソースからダウンロードすることができる。または、ユーザデバイスは、より効率的なダウンロードのために、コンテンツを複数のクラウドリソースからダウンロードすることができる。いくつかの実施形態において、ユーザ機器デバイスは、図4に関連して説明される処理回路によって実施される処理動作等の処理動作のために、クラウドリソースを使用することができる。
本明細書で参照されるように、用語「~に応答して」は、「~の結果として開始される」ことを指す。例えば、第2のアクションに応答して実施されている第1のアクションは、第1のアクションと第2のアクションとの間に介在ステップを含み得る。本明細書で参照されるように、用語「~に直接応答して」は、「~によって引き起こされる」ことを指す。例えば、第2のアクションに直接応答して実施されている第1のアクションは、第1のアクションと第2のアクションとの間に介在ステップを含まないこともある。
図6は、本開示のいくつかの実施形態による、音声データおよびメディア消費データに基づいてユーザを識別するための例証的アクションのフローチャートである。602において、制御回路404は、ユーザから受信された音声コマンドから音声シグネチャを生成する。例えば、制御回路404は、ユーザ入力インターフェース410を介して、ユーザから音声入力を受信し、ユーザ入力を分析して音声シグネチャを生成し、記憶装置408に音声シグネチャを記憶し得る。いくつかの実施形態において、制御回路は、遠隔サーバ(例えば、メディアコンテンツソース516および/またはメディアガイドデータソース518に関連付けられたサーバ)に音声シグネチャを記憶し得る。
604において、制御回路404は、音声シグネチャに基づいて、ユーザに関連付けられた複数の音声特性を識別し、複数の音声特性の各々は、ユーザに関連付けられた人口統計データに対応する。例えば、制御回路404は、記憶装置408から記憶された音声シグネチャを読み出し、音声シグネチャにアルゴリズムを実行し、音声特性を識別し得る。
606において、制御回路404は、複数の人口統計を家庭に関連付けられた複数のユーザに関連付けられた複数のプロファイルのうちの各プロファイルにおける人口統計情報と比較する。制御回路は、遠隔サーバ(例えば、メディアコンテンツソース516またはメディアガイドデータソース518に関連付けられた遠隔サーバ)から受信される人口統計情報を用いて、音声シグネチャから抽出される人口統計に比較アルゴリズムを実行し得る。例えば、制御回路は、音声コマンドから抽出される(例えば、データ構造100に記憶された)人口統計データを遠隔ソースから受信される人口統計データ(例えば、データ構造120に記憶された人口統計データ)と比較し得る。
606において、制御回路404は、比較することに基づいて、複数のプロファイルにおける2つ以上のプロファイルが複数の人口統計に合致することを決定する。例えば、制御回路404は、2つ以上のプロファイルが、音声シグネチャから抽出される人口統計に等しく合致する人口統計を含むことを決定し得る。例えば、制御回路404は、外部人口統計データを音声コマンドから抽出される人口統計データ(例えば、データ構造100のデータおよびデータ構造120のデータ)と比較することに基づいて、2つのプロファイルが抽出された人口統計データに等しく合致することを決定し得る。
608において、制御回路404は、比較することに基づいて、複数のプロファイルにおける2つ以上のプロファイルが複数の人口統計に合致することを決定する。例えば、制御回路404は、エントリ124のうちの合致するそれらのエントリをマークし得る。1つのみのプロファイルが合致する場合、メディアガイドアプリケーションは、ユーザ識別が完了したことを決定し、アクション610をスキップし得ることに留意されたい。
610において、複数のプロファイルにおける2つ以上のプロファイルが複数の人口統計に合致することを決定することに応答して、制御回路404は、2つ以上のプロファイルからの音声コマンドのコンテンツに基づいて、ユーザのプロファイルを識別する。例えば、制御回路は、メディアアセットのメタデータに最良に合致するユーザのプロファイルを識別し得る。612において、制御回路404は、ユーザが識別されたことを示す指示を表示のために生成する。例えば、制御回路は、ディスプレイ412上に指示を表示のために生成し得る。
図7は、本開示のいくつかの実施形態による、音声データおよびメディア消費データに基づいてユーザを識別するための例証的アクションの別のフローチャートである。702において、制御回路404は、ユーザから受信された音声コマンドから音声シグネチャを生成する。例えば、制御回路404は、ユーザ入力インターフェース410を介して、ユーザから音声入力を受信し、ユーザ入力を分析して音声シグネチャを生成し、記憶装置408に音声シグネチャを記憶し得る。いくつかの実施形態において、制御回路は、遠隔サーバ(例えば、メディアコンテンツソース516および/またはメディアガイドデータソース518に関連付けられたサーバ)に音声シグネチャを記憶し得る。
704において、制御回路404は、音声シグネチャから、ユーザに関連付けられた複数の音声特性を決定し、複数の音声特性は、複数の人口統計に対応する。例えば、制御回路404は、記憶装置408から記憶された音声シグネチャを読み出し、音声シグネチャにアルゴリズムを実行し、音声特性を識別し得る。
706において、制御回路404は、ユーザの家庭に関連付けられたユーザ情報のための要求を伝送する。例えば、制御回路は、(例えば、I/Oインターフェース402を介して)クエリを遠隔サーバ(例えば、メディアコンテンツソース516またはメディアガイドデータソース518)に伝送し得る。
708において、制御回路404は、ユーザ情報を受信し、ユーザ情報は、家庭内の各ユーザのそれぞれの人口統計情報を備えている。例えば、制御回路は、データ構造(例えば、データ構造120)を受信し、記憶装置408に(例えば、ランダムアクセスメモリに)データ構造を記憶し得る。710において、制御回路404は、複数の人口統計をユーザ情報内の人口統計情報と比較する。例えば、制御回路404は、比較のために(例えば、記憶装置408から)受信された人口統計情報を読み出し得る。
712において、制御回路404は、比較することに基づいて、2人以上のユーザに関連付けられた人口統計情報が複数の人口統計に合致することを決定する。例えば、制御回路は、合致するエントリに(例えば、記憶装置408に)合致のインジケータを記憶し得る。714において、制御回路404は、2人以上のユーザに関連付けられた人口統計情報が複数の人口統計に合致することを決定することに応答して、以下のアクションを実施する。
716において、制御回路404は、音声コマンドがメディアアセットのための要求を含むことを決定する。例えば、制御回路404は、音声コマンドを分析し、要求されるメディアアセットの識別子を抽出し得る。718において、制御回路404は、メディアアセットに関連付けられたメタデータを複数の人口統計に合致する2人以上のユーザの各々にとって関心があるメディアアセットに関連付けられたメタデータと比較する。例えば、制御回路404は、人口統計情報(例えば、年齢層および年齢)の文字列値および/または他の人口統計情報の(例えば、性別の)ブール値を比較し得る。
720において、制御回路404は、メディアアセットに関連付けられたメタデータを複数の人口統計に合致する2人以上のユーザの各々にとって関心があるメディアアセットに関連付けられたメタデータと比較することに基づいて、2人以上のユーザのうちの第1のユーザが最良合致を構成することを決定する。制御回路404は、第1のユーザが最良合致であることを決定することに応答して、ユーザが識別されたという指示を表示のために生成する。例えば、制御回路は、ディスプレイ412上に指示を表示のために生成し得る。
図8は、本開示のいくつかの実施形態による、2人以上のユーザに関連付けられた人口統計情報が複数の人口統計に合致することを決定するための例証的アクションのフローチャートである。802において、制御回路404は、各エントリがユーザに関連付けられた、エントリのテーブルを読み出す。例えば、制御回路は、複数のエントリ124を含むデータ構造120を読み出し得る。804において、制御回路404は、各エントリが家庭ユーザを表す複数のエントリから、前に選択されていないエントリを選択する。例えば、各エントリは、データ構造を介して選択可能であり得る。制御回路は、各エントリを通して反復し得る。
808において、制御回路404は、選択されたエントリ内の各フィールドを音声コマンドから抽出される人口統計情報の対応するフィールドと比較する。例えば、制御回路は、対応するフィールド間で文字列比較または別のタイプの比較を実施し得る。810において、制御回路404は、選択されたエントリの任意のフィールドが、音声コマンドから抽出される人口統計情報の対応するフィールドに合致するかどうかを決定する。例えば、制御回路404は、1つ以上のフィールドが合致することを決定し得る。選択されたエントリのフィールドが人口統計情報に合致しない場合、プロセス800は、アクション814に移行する。選択されたエントリの少なくとも1つのフィールドが人口統計情報の対応するフィールドに合致する場合、プロセス800は、812に移行する。
812において、制御回路404は、選択されたエントリの人口統計情報の対応するフィールドに合致する各フィールドの指示を記憶する。例えば、制御回路は、合致が起こったかどうかの指示を各フィールドに記憶し得る。814において、制御回路404は、複数のエントリにおける前に選択されていないエントリがそれ以上あるかどうかを決定する。複数のエントリにおけるより多くの前に選択されていないエントリがある場合、プロセス800は、別の前に選択されていないエントリが処理のために選択される、アクション804に移行する。複数のエントリにおける前に選択されていないエントリがない場合、プロセス800は、アクション816に移行する。816において、制御回路404は、複数のエントリの各々の合致するフィールドの数を比較することによって、最高量の合致する人口統計情報を伴う2人以上のユーザを識別する。
図9は、本開示のいくつかの実施形態による、音声シグネチャをユーザに合致させるための例証的アクションのフローチャートである。902において、制御回路404は、ユーザの音声プロファイルに音声シグネチャおよびメディアアセットの指示を記憶する。制御回路は、記憶装置408に音声プロファイルを記憶し得る。904において、制御回路404は、後続の音声コマンドを検出する。例えば、制御回路は、ユーザ入力インターフェース410からの音声入力を検出し得る。
906において、制御回路404は、後続の音声コマンドに基づいて、後続の音声シグネチャを生成する。例えば、制御回路404は、もとの音声シグネチャと同じ様式で後続の音声シグネチャを生成し得る。908において、制御回路404は、音声シグネチャを後続の音声シグネチャと比較する。例えば、音声シグネチャは、音声特定のデータに関して分析され得、その音声特定のデータが、比較され得る。
910において、制御回路404は、音声シグネチャが後続の音声シグネチャに合致するかどうかを決定する。制御回路404が、音声シグネチャが後続の音声シグネチャに合致することを決定する場合、プロセス900は、制御回路404が、ユーザの音声プロファイルに後続の音声コマンドのコンテンツを記憶する912に移行する。しかしながら、制御回路404が、音声シグネチャが後続の音声シグネチャに合致しないことを決定する場合、プロセス900は、制御が後続の音声コマンドを記憶する914に移行する。例えば、制御回路404は、識別されていない音声コマンドのためのデータ構造を生成し得る。制御回路は、記憶装置408にそのデータ構造を記憶し得る。
916において、制御回路404は、後続の音声コマンドの音声シグネチャを新たに識別されたユーザの音声シグネチャと周期的に比較する。例えば、新しいユーザがシステムに参加し、識別されると、音声コマンドからの音声シグネチャが、比較され得、合致が見出される場合、ユーザの音声コマンドコンテンツが、ユーザのプロファイルに記憶されるか、または、別様に処理され得る。音声プロファイルが場所の組み合わせで記憶され得ることを留意されたい。例えば、人口統計データを含むユーザのプロファイルは、ユーザデバイス(例えば、ユーザテレビ機器502、ユーザコンピュータ機器504、および/または無線通信デバイス506)上の記憶装置408に記憶され得る。加えて、または代替として、ユーザのプロファイルは、遠隔サーバ(例えば、メディアコンテンツソース516および/またはメディアガイドデータソース518に関連付けられたサーバ)上に記憶され得る。
上で議論されるプロセスは、例証であり、限定を意図するものではない。当業者は、本明細書に議論されるプロセスのアクションが、本発明の範囲から逸脱することなく、省略され、修正され、組み合わせられ、および/または、再配列され得、任意の追加のアクションが、実施され得ることを理解するであろう。より一般的には、上記開示は、例示的であり、限定を意図するものではない。続く請求項のみが、本開示が含むものに関する境界を設定することが意図される。さらに、いずれか1つの実施形態で説明される特徴および限定は、本明細書の任意の他の実施形態に適用され得、一実施形態に関するフローチャートまたは例は、好適な様式で任意の他の実施形態と組み合わせられ、異なる順序で行われ、または、並行して行われ得ることに留意されたい。加えて、本明細書に説明されるシステムおよび方法は、リアルタイムで実施され得る。上で説明されるシステムおよび/または方法が他のシステムおよび/または、方法に適用されるか、または、それらに従って使用され得ることにも留意されたい。

Claims (10)

  1. 音声データおよびメディア消費データに基づいてユーザを識別する方法であって、前記方法は、
    ユーザから受信された音声コマンドから音声シグネチャを生成することと、
    前記音声シグネチャから、前記ユーザに関連付けられた複数の音声特性を決定することであって、前記複数の音声特性は、複数の人口統計に対応する、ことと、
    前記ユーザの家庭に関連付けられたユーザ情報のための要求を伝送することと、
    前記ユーザ情報を受信することであって、前記ユーザ情報は、前記家庭内の各ユーザのそれぞれの人口統計情報を備えている、ことと、
    前記複数の人口統計を前記ユーザ情報内の人口統計情報と比較することと、
    前記比較することに基づいて、2人以上のユーザに関連付けられた人口統計情報が前記複数の人口統計に合致することを決定することと、
    2人以上のユーザに関連付けられた前記人口統計情報が前記複数の人口統計に合致することを決定することに応答して、
    前記音声コマンドがメディアアセットのための要求を備えていることを決定すること
    前記メディアアセットに関連付けられたメタデータを前記複数の人口統計に合致する前記2人以上のユーザの各々にとって関心があるメディアアセットに関連付けられたメタデータと比較すること
    前記メディアアセットに関連付けられた前記メタデータを前記複数の人口統計に合致する前記2人以上のユーザの各々にとって関心がある前記メディアアセットに関連付けられた前記メタデータと比較することに基づいて、前記2人以上のユーザのうちの第1のユーザが最良合致を構成することを決定すること、および
    前記第1のユーザが前記最良合致であることを決定することに応答して、前記ユーザが識別されたという指示を出力のために生成すること
    を行うことと、
    を含む、方法。
  2. 前記ユーザの前記家庭に関連付けられたユーザ情報のための前記要求を伝送することは、
    前記音声コマンドが受信されるユーザ機器デバイスに関連付けられた識別文字列を決定することと、
    記ユーザ情報のためのクエリを生成することであって、前記クエリは、前記識別文字列を備えている、ことと、
    前記クエリを前記ユーザの前記家庭に関連付けられた前記ユーザ情報を記憶している遠隔サーバに伝送することと
    を含む、請求項1に記載の方法。
  3. 前記ユーザ情報を受信することは、データ構造に前記ユーザ情報を記憶することをさらに含み、前記データ構造は、
    複数のエントリであって、前記複数のエントリは、前記家庭内の各ユーザのためのエントリを備えている、複数のエントリと、
    各エントリのための複数のフィールドであって、前記複数のフィールドは、それぞれのユーザに関連付けられた人口統計情報の各項目のためのフィールドを備えている、複数のフィールドと
    を備えている、請求項2に記載の方法。
  4. 前記複数の人口統計を前記ユーザ情報内の前記人口統計情報と比較することは、
    前記複数のエントリから第1のエントリを読み出すことと、
    前記複数の人口統計のうちの各人口統計を前記2人以上のユーザのうちの第1のユーザの対応する人口統計に関連付けられたフィールドのコンテンツと比較することと、
    前記複数の人口統計のうちの各人口統計を前記2人以上のユーザのうちの前記第1のユーザの対応する人口統計に関連付けられた前記フィールドのコンテンツと比較することに基づいて、前記第1のユーザに関連付けられた人口統計に合致する前記複数の人口統計からの人口統計情報の組を生成することと
    を含む、請求項3に記載の方法。
  5. 前記2人以上のユーザに関連付けられた人口統計情報が前記複数の人口統計に合致することを決定することは、
    前記複数の人口統計に合致する前記第1のユーザに関連付けられた人口統計情報の量を前記複数の人口統計に合致する他のユーザに関連付けられた人口統計情報の量と比較することと、
    前記複数の人口統計に合致する前記第1のユーザに関連付けられた人口統計情報の量を前記複数の人口統計に合致する他のユーザに関連付けられた人口統計情報の量と比較することに基づいて、合致する人口統計情報の最高量を伴う2人以上のユーザを識別することと
    を含む、請求項4に記載の方法。
  6. 前記メディアアセットに関連付けられたメタデータを前記複数の人口統計に合致する前記2人以上のユーザの各々にとって関心があるメディアアセットに関連付けられたメタデータと比較することは、
    複数のユーザプロファイルを受信することであって、前記複数のユーザプロファイルにおける各ユーザプロファイルは、前記2人以上のユーザのうちのユーザに対応し、各ユーザプロファイルは、前記2人以上のユーザのうちのそれぞれのユーザが好むメディアアセットに対応する複数の特性を備えている、ことと、
    前記メディアアセットに関連付けられた前記メタデータを前記対応するユーザが好むメディアアセットの特性と比較することと、
    前記メディアアセットに関連付けられた前記メタデータを前記対応するユーザが好むメディアアセットの特性と比較することに基づいて、前記2人以上のユーザのうちの各ユーザのために、合致する特性の量を決定することと
    を含む、請求項1に記載の方法。
  7. 前記2人以上のユーザから、合致するメタデータの最高量を伴う者を決定することは、
    前記複数の特性のうちの各特性に関連付けられた重みを読み出すことと、
    各特性のためのそれぞれの重みを使用して、前記2人以上のユーザのうちの各ユーザのために、合致する特性の量を計算することと、
    合致する特性の最高量を伴う合致するユーザを選択することと
    を含む、請求項6に記載の方法。
  8. 前記ユーザが識別されたという前記指示を表示のために生成することは、
    記憶装置から前記ユーザのプロファイルを読み出すことと、
    前記ユーザの前記プロファイルに基づいて、前記ユーザがアバタを選択したことを決定することと
    を含む、請求項1に記載の方法。
  9. 音声データおよびメディア消費データに基づいてユーザを識別するためのシステムであって、前記システムは、
    通信回路と、
    請求項1~8のいずれかに記載の方法を実行するように構成された制御回路と
    を備えている、システム。
  10. 音声データおよびメディア消費データに基づいてユーザを識別するためのエンコードされた非一過性のコンピュータ読み取り可能な命令を有している非一過性のコンピュータ読み取り可能な媒体であって、前記命令は、制御回路によって実行されると、前記制御回路に請求項1~8のいずれかに記載の方法を実施させる、非一過性のコンピュータ読み取り可能な媒体。
JP2020535629A 2017-12-27 2017-12-27 音声データおよびメディア消費データに基づいてユーザを識別するためのシステムおよび方法 Active JP7127131B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/US2017/068581 WO2019132896A1 (en) 2017-12-27 2017-12-27 Systems and methods for identifying users based on voice data and media consumption data

Publications (2)

Publication Number Publication Date
JP2021516356A JP2021516356A (ja) 2021-07-01
JP7127131B2 true JP7127131B2 (ja) 2022-08-29

Family

ID=61018017

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020535629A Active JP7127131B2 (ja) 2017-12-27 2017-12-27 音声データおよびメディア消費データに基づいてユーザを識別するためのシステムおよび方法

Country Status (9)

Country Link
US (3) US10937431B2 (ja)
EP (2) EP4246508A3 (ja)
JP (1) JP7127131B2 (ja)
KR (1) KR102451348B1 (ja)
CN (1) CN111527541A (ja)
AR (1) AR113680A1 (ja)
AU (1) AU2017444907B2 (ja)
CA (1) CA3083453A1 (ja)
WO (1) WO2019132896A1 (ja)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3963894A4 (en) * 2019-05-01 2023-01-25 The Nielsen Company (US), LLC. NEURAL NETWORK PROCESSING OF RETURN PATH DATA FOR ESTIMATION OF DEMOGRAPHIC DATA OF HOUSEHOLD MEMBERS AND VISITORS
KR20210001529A (ko) * 2019-06-28 2021-01-06 엘지전자 주식회사 로봇, 그와 연결되는 서버, 및 로봇을 이용한 음성 인식 방법
US20210304259A1 (en) * 2020-03-31 2021-09-30 Salesforce.Com, Inc. Methods and systems for delivery of customized content via voice recognition
KR20220021277A (ko) 2020-08-13 2022-02-22 주식회사 엘지에너지솔루션 배터리 관리 시스템, 배터리 관리 방법, 배터리 팩 및 전기 차량
EP4057165A1 (de) * 2021-03-11 2022-09-14 Deutsche Telekom AG Sprachassistenzsteuerung
EP4202738A1 (de) * 2021-12-22 2023-06-28 Deutsche Telekom AG Nutzeridentifikation anhand einer spracheingabe
US11641505B1 (en) * 2022-06-13 2023-05-02 Roku, Inc. Speaker-identification model for controlling operation of a media player

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000250593A (ja) 1999-03-03 2000-09-14 Fujitsu Ltd 話者認識装置及び方法
JP2019514237A (ja) 2016-02-22 2019-05-30 ソノズ インコーポレイテッド メディア再生システムの音声制御

Family Cites Families (35)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6239794B1 (en) 1994-08-31 2001-05-29 E Guide, Inc. Method and system for simultaneously displaying a television program and information about the program
US7613659B1 (en) * 1994-11-28 2009-11-03 Yt Acquisition Corporation System and method for processing tokenless biometric electronic transmissions using an electronic rule module clearinghouse
US6564378B1 (en) 1997-12-08 2003-05-13 United Video Properties, Inc. Program guide system with browsing display
CN1867068A (zh) 1998-07-14 2006-11-22 联合视频制品公司 交互式电视节目导视系统及其方法
AR020608A1 (es) 1998-07-17 2002-05-22 United Video Properties Inc Un metodo y una disposicion para suministrar a un usuario acceso remoto a una guia de programacion interactiva por un enlace de acceso remoto
PT1986425E (pt) 1998-07-17 2014-07-24 United Video Properties Inc Sistema de guia de programas de televisão interactivo que tem múltiplos dispositivos dentro de uma zona habitacional
US7165098B1 (en) 1998-11-10 2007-01-16 United Video Properties, Inc. On-line schedule system with personalization features
CN108053844B (zh) 2001-02-21 2020-12-22 乐威指南公司 具有个人视频记录特征的交互式节目导视器的系统和方法
KR20040105999A (ko) * 2003-06-10 2004-12-17 온오프코리아 주식회사 네트워크 기반 소리 아바타 생성 방법 및 시스템
US20100153885A1 (en) 2005-12-29 2010-06-17 Rovi Technologies Corporation Systems and methods for interacting with advanced displays provided by an interactive media guidance application
US7627641B2 (en) * 2006-03-09 2009-12-01 Watchguard Technologies, Inc. Method and system for recognizing desired email
US20080092156A1 (en) * 2006-09-29 2008-04-17 United Video Properties, Inc. Systems and methods for automatically identifying a user profile
US8442824B2 (en) * 2008-11-26 2013-05-14 Nuance Communications, Inc. Device, system, and method of liveness detection utilizing voice biometrics
US8340974B2 (en) * 2008-12-30 2012-12-25 Motorola Mobility Llc Device, system and method for providing targeted advertisements and content based on user speech data
US20100169809A1 (en) 2008-12-31 2010-07-01 Mccarthy Ann Lerene Method And System For Managing Visually Related Multimedia Information By Means Of Dimensional Classification
KR101420189B1 (ko) * 2010-03-03 2014-07-17 한국전자통신연구원 연령 및 성별을 이용한 사용자 인식 장치 및 방법
CN102404287A (zh) * 2010-09-14 2012-04-04 盛乐信息技术(上海)有限公司 用数据复用法确定声纹认证阈值的声纹认证系统及方法
US9031848B2 (en) * 2012-08-16 2015-05-12 Nuance Communications, Inc. User interface for searching a bundled service content data source
CN104885406B (zh) * 2012-12-18 2019-06-21 三星电子株式会社 用于在家庭网络系统中远程控制家庭设备的方法和设备
US9299350B1 (en) * 2013-03-15 2016-03-29 Amazon Technologies, Inc. Systems and methods for identifying users of devices and customizing devices to users
US9911421B2 (en) 2013-06-10 2018-03-06 Panasonic Intellectual Property Corporation Of America Speaker identification method, speaker identification apparatus, and information management method
US11170089B2 (en) * 2013-08-22 2021-11-09 Staton Techiya, Llc Methods and systems for a voice ID verification database and service in social networking and commercial business transactions
US9426525B2 (en) * 2013-12-31 2016-08-23 The Nielsen Company (Us), Llc. Methods and apparatus to count people in an audience
US10127911B2 (en) * 2014-09-30 2018-11-13 Apple Inc. Speaker identification and unsupervised speaker adaptation techniques
US10165322B2 (en) * 2014-09-30 2018-12-25 Rovi Guides, Inc. Methods and systems for controlling user devices
US10354657B2 (en) * 2015-02-11 2019-07-16 Bang & Olufsen A/S Speaker recognition in multimedia system
US10067985B2 (en) * 2015-03-05 2018-09-04 Telenav, Inc. Computing system with crowd-source mechanism and method of operation thereof
WO2017106072A2 (en) * 2015-12-17 2017-06-22 Technicolor Usa, Inc. Personalized presentation enhancement using augmented reality
US10026403B2 (en) * 2016-08-12 2018-07-17 Paypal, Inc. Location based voice association system
WO2018106971A1 (en) * 2016-12-07 2018-06-14 Interactive Intelligence Group, Inc. System and method for neural network based speaker classification
KR20180074316A (ko) * 2016-12-23 2018-07-03 삼성전자주식회사 장소 정보를 제공하기 위한 시스템 및 이를 지원하는 방법 및 전자 장치
CA3046058A1 (en) * 2016-12-27 2018-07-05 Rovi Guides, Inc. Systems and methods for dynamically adjusting media output based on presence detection of individuals
US20180204133A1 (en) * 2017-01-18 2018-07-19 Facebook, Inc. Demographic prediction for users in an online system with unidirectional connection
US10522154B2 (en) * 2017-02-13 2019-12-31 Google Llc Voice signature for user authentication to electronic device
US10438594B2 (en) * 2017-09-08 2019-10-08 Amazon Technologies, Inc. Administration of privileges by speech for voice assistant system

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000250593A (ja) 1999-03-03 2000-09-14 Fujitsu Ltd 話者認識装置及び方法
JP2019514237A (ja) 2016-02-22 2019-05-30 ソノズ インコーポレイテッド メディア再生システムの音声制御

Also Published As

Publication number Publication date
AU2017444907A1 (en) 2020-06-11
AU2017444907B2 (en) 2023-08-17
EP4246508A2 (en) 2023-09-20
US20230402042A1 (en) 2023-12-14
CN111527541A (zh) 2020-08-11
EP3732675B1 (en) 2023-05-03
US11798565B2 (en) 2023-10-24
KR102451348B1 (ko) 2022-10-06
US20210233542A1 (en) 2021-07-29
US20200395021A1 (en) 2020-12-17
AR113680A1 (es) 2020-05-27
EP3732675A1 (en) 2020-11-04
CA3083453A1 (en) 2019-07-04
KR20200101934A (ko) 2020-08-28
JP2021516356A (ja) 2021-07-01
WO2019132896A1 (en) 2019-07-04
EP4246508A3 (en) 2023-11-15
US10937431B2 (en) 2021-03-02

Similar Documents

Publication Publication Date Title
US11934372B2 (en) Systems and methods for updating a knowledge graph through user input
JP7288938B2 (ja) 第2のユーザの視聴アクティビティに基づいて第2のユーザのための再生リストに含めるための第1のユーザのメディアアセットに対する推奨のための方法およびシステム
JP7127131B2 (ja) 音声データおよびメディア消費データに基づいてユーザを識別するためのシステムおよび方法
JP2023105206A (ja) 会話におけるコンテキスト切替を決定するためのシステムおよび方法
US10893327B2 (en) Methods and systems for recommending media assets based on the geographic location at which the media assets are frequently consumed
US20240107265A1 (en) Systems and methods for intelligent audio output
US20230308711A1 (en) System and method for classifying recorded content for deletion
US20180367857A1 (en) Systems and methods for ranking content sources based on a number of media assets identified to be interesting to a user
US20210004395A1 (en) Methods and systems for playing back indexed conversations based on the presence of other people
US20190034525A1 (en) Methods and systems for replying to queries based on indexed conversations and context

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20201222

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20201222

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20220117

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20220131

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220421

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20220810

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20220817

R150 Certificate of patent or registration of utility model

Ref document number: 7127131

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150