JP2020522019A

JP2020522019A - 複数の音声動作型ユーザデバイスのための音量ベースの応答を生成するためのシステムおよび方法

Info

Publication number: JP2020522019A
Application number: JP2019566117A
Authority: JP
Inventors: マイケルマッカーティー，; グレンイー．ロー，
Original assignee: ロヴィガイズ，インコーポレイテッド
Priority date: 2017-06-02
Filing date: 2018-05-23
Publication date: 2020-07-27
Anticipated expiration: 2038-05-23
Also published as: CN110914900A; JP7239494B2; EP3631796B1; US20200225909A1; WO2018222456A1; US20180349093A1; KR20200015582A; US20230013021A1; CN110914900B; US10564928B2; US11481187B2; EP3631796A1; CA3065888A1

Abstract

システムおよび方法が、音声コマンドの音量レベルに基づく音量レベルにおいて音声コマンドに応答するために、本明細書で提供される。例えば、メディアガイドアプリケーションは、複数の音声動作型ユーザデバイスのうちの第１の音声動作型ユーザデバイスを通して、ユーザによって話される音声コマンドを検出し得る。メディアガイドアプリケーションは、音声コマンドの第１の音量レベルを決定し得る。音声コマンドの音量レベルに基づいて、メディアガイドアプリケーションは、複数の音声動作型ユーザデバイスのうちの第２の音声動作型ユーザデバイスが他の音声動作型ユーザデバイスのうちのいずれよりもユーザに近いことを決定し得る。メディアガイドアプリケーションは、第２の音声動作型ユーザデバイスを通して、音声コマンドの第１の音量レベルに基づいて設定される第２の音量レベルにおいて、可聴応答を生成し得る。

Description

家庭が音声動作型ユーザデバイスを含有することは、ますます一般的になっている。音声動作型デバイスは、それらの応答音量をユーザの音声コマンドの音量に合わせることができる。しかしながら、１つの家庭内の複数の音声動作型ユーザデバイスがますます一般的になると、クエリに応答するべきであるデバイスおよび音量を決定するときに、複数のデバイスの間で調整することがますます困難になる。さらに、応答音量をユーザの音声の音量に合致させることは、いくつかの状況では、ユーザが応答を聞くことを妨げ得る。ユーザが音声コマンドへの応答を所望する度に、手動でデバイスを選定し、応答音量を設定することは、ユーザにとって煩雑であり、最終的に、デバイスをあまり有用ではないものにし得る。

故に、システムおよび方法が、音声コマンドの音量レベルに基づく音量レベルにおいて音声コマンドに応答するために、本明細書に説明される。音声コマンドの音量レベルを使用し、応答音量レベルを決定することは、ユーザが、例えば、音声動作型ユーザデバイスを手動で調節する必要なく、応答音量レベルを変更することを可能にする。一実施例として、長椅子の一方の端部上に第１の音声動作型ユーザデバイス、長椅子の反対端上に第２の音声動作型ユーザデバイスが存在し得る。第１のユーザが、第１のデバイスの最近傍の長椅子の端部に着席し得る一方で、第２のユーザは、第２の音声動作型ユーザデバイスの最近傍の長椅子の反対端に着席し得る。第１のユーザは、第１および第２の音声動作型ユーザデバイスの両方によって受信される音声コマンドを口に出し得る。本明細書に説明されるシステムおよび方法は、各音声動作型ユーザデバイスにおいて受信される音声コマンド音量レベルに基づいて、第１の音声動作型ユーザデバイスがユーザにより近いことを決定してもよい。第１の音声動作型ユーザデバイスは、次いで、音声コマンドの音量レベルに基づく音量レベルにおいて応答してもよい。例えば、第１のユーザおよび第２のユーザは、映画（例えば、「ＳｔａｒＷａｒｓ」）を鑑賞していてもよい。第１のユーザの音声コマンドは、映画の中で発せされた最後の台詞（例えば、「ＭａｙｔｈｅＦｏｒｃｅｂｅｗｉｔｈｙｏｕ」）を繰り返すための囁いた要求であってもよい。第１の音声動作型ユーザデバイスは、最後の台詞（例えば、「ＭａｙｔｈｅＦｏｒｃｅｂｅｗｉｔｈｙｏｕ」）をユーザに囁き返すことによって、応答してもよい。

これらのシステムおよび方法は、メディアガイドアプリケーションによって実装されてもよい。メディアガイドアプリケーションは、複数の音声動作型ユーザデバイスに接続されてもよい。複数の音声動作型ユーザデバイスは、例えば、デバイスＡ、デバイスＢ、およびデバイスＣを含んでもよい。メディアガイドアプリケーションは、複数の音声動作型ユーザデバイスのうちの第１の音声動作型ユーザデバイスを通して、ユーザによって話される音声コマンドを検出してもよい。例えば、メディアガイドアプリケーションは、デバイスＡを通して、ユーザが現在鑑賞している映画を参照して、「最後の台詞を繰り返して」と発したユーザからの音声コマンドを検出してもよい。

メディアガイドアプリケーションは、音声コマンドの第１の音量レベルを決定してもよく、音声コマンドは、第１の音声動作型ユーザデバイスによって受信される。例えば、第１の音量レベルは、第１の音声動作型ユーザデバイス（例えば、デバイスＡ）において検出される音声コマンドの入力音量の平均（例えば、４８ｄｂ）であってもよい。

いくつかの実施形態では、第１の音量レベルを決定するために、メディアガイドアプリケーションは、音声コマンドのフィルタ処理されていない音量レベルを測定してもよい。例えば、音声コマンドのフィルタ処理されていない音量レベルは、６０ｄＢであってもよい。しかしながら、本フィルタ処理されていない音量レベルは、ユーザの近傍で映画を可聴的に放映するテレビ等の背景雑音のレベルを含み得る。メディアガイドアプリケーションは、背景雑音のレベルを決定してもよく、音声コマンドをフィルタ処理し、背景雑音のレベルを除去してもよい。例えば、テレビで放映される映画は、ユーザの音声よりも高い周波数にあり得る。メディアガイドアプリケーションは、音声コマンドの高周波数成分を取り除き、背景雑音を除去してもよい。メディアガイドアプリケーションは、次いで、音声コマンドのフィルタ処理された音量レベルを計算してもよい。例えば、音声コマンドのフィルタ処理された音量レベルは、フィルタ処理されていない音量レベル６０ｄＢと比較して、４８ｄＢであってもよい。

いくつかの音声動作型ユーザデバイスは、ユーザからの音声コマンドを検出してもよい。これらのデバイスはそれぞれ、例えば、ユーザへの近接性に応じて、異なる音量レベルにおいて音声コマンドを受信し得る。したがって、複数の音声動作型ユーザデバイスのうちの各音声動作型ユーザデバイスは、音声コマンドの複数の音量レベルのうちの音量レベルと関連付けられるであろう。メディアガイドアプリケーションは、複数の音量レベルのうちの各音量レベルを複数の音声動作型ユーザデバイスのうちの個別の音声動作型ユーザデバイスと関連付ける、少なくとも１つのデータ構造を受信してもよい。例えば、メディアガイドアプリケーションは、複数の音声動作型ユーザデバイスのうちの各音声動作型ユーザデバイスから、音量レベルおよび個別の音声動作型ユーザデバイスの音声動作型ユーザデバイス識別子を含有する、データ構造を受信してもよい。例えば、メディアガイドアプリケーションは、第２の音声動作型ユーザデバイスから、５２ｄｂの音量レベルおよびデバイス識別子デバイスＢを含有する、データ構造を受信してもよい。例えば、メディアガイドアプリケーションは、第３の音声動作型ユーザデバイスから、５０ｄｂの音量レベルおよびデバイス識別子デバイスＣを含有する、データ構造を受信してもよい。

いくつかの実施形態では、メディアガイドアプリケーションは、第１の音量レベルを複数の音量レベルと比較してもよい。例えば、メディアガイドアプリケーションは、デバイスＡと関連付けられる４８ｄＢを、デバイスＢと関連付けられる５２ｄＢと、デバイスＣと関連付けられる５０ｄＢと比較してもよい。

いくつかの実施形態では、メディアガイドアプリケーションは、第１の音量レベルを複数の音量レベルと比較するステップに基づいて、複数の音量レベルのうちの最大音量レベルを決定してもよい。例えば、複数の音声動作型ユーザデバイスのうちのいずれかによって受信される最大音量レベルは、５２ｄＢであってもよい。複数の音量レベルのうちの最大音量レベルは、複数の音声動作型ユーザデバイスによって受信される音量レベルのうちの最大である。

いくつかの実施形態では、メディアガイドアプリケーションは、最大音量レベルと関連付けられる第２の音声動作型ユーザデバイスに関して、少なくとも１つのデータ構造を検索してもよい。最大音量と関連付けられるユーザデバイスは、デバイスがユーザに近いほど、そのユーザからの音声コマンドがデバイスに大きく聞こえるであろうため、音声コマンドを発行したユーザに最近傍のデバイスであろう。例えば、最大音量レベルが５２ｄＢである場合、メディアガイドアプリケーションは、データ構造を検索し、５２ｄＢ音量レベルと関連付けられる音声動作型ユーザデバイスを見出してもよい。データ構造では、５２ｄＢ音量レベルは、第２の音声動作型ユーザデバイスを表す、デバイス識別子デバイスＢと関連付けられてもよい。デバイスＢは、本実施例では、ユーザに最近傍の音声動作型ユーザデバイスである。

いくつかの実施形態では、メディアガイドアプリケーションは、コマンドを第２の音声動作型ユーザデバイスに伝送してもよい。コマンドは、応答レベルを、最大音量レベルに基づく第２の音量レベルに更新するように、第２の音声動作型ユーザデバイスに命令してもよい。例えば、メディアガイドアプリケーションは、応答レベルを音量レベル５２ｄＢに変更するように、デバイスＢとして識別される第２の音声動作型ユーザデバイスに命令してもよい。例えば、メディアガイドアプリケーションは、代わりに、応答レベルを、最大音量レベルよりもわずかに大きい５３ｄＢに変更するように、デバイスＢとして識別される第２の音声動作型ユーザデバイスに命令してもよい。メディアガイドアプリケーションは、最大音量レベルをわずかに増加させ、このようにして第２の音量を決定し、周囲雑音を考慮してもよい。

いくつかの実施形態では、メディアガイドアプリケーションは、音声コマンドへの可聴応答を生成してもよい。可聴応答は、第２の音声動作型ユーザデバイスを通して、第２の音量レベルにおいて生成されてもよい。例えば、デバイスＢとして識別される第２の音声動作型ユーザデバイスは、音量レベル５３ｄＢにおいて、ユーザが現在鑑賞している映画の最後の台詞（例えば、「ＭａｙｔｈｅＦｏｒｃｅｂｅｗｉｔｈｙｏｕ」）を繰り返してもよい。いくつかの実施形態では、第１および第２の音声動作型ユーザデバイスは、同一のデバイスであってもよく、第１の音量レベルおよび第２の音量は、同一の音量レベルであってもよい。

いくつかの実施形態では、メディアガイドアプリケーションは、音声動作型ユーザデバイス（例えば、デバイスＡ、デバイスＢ、デバイスＣ）が、音声コマンドを検出するために同一の機器、方法、または感度を使用しないことを決定してもよい。したがって、検出される最大音量レベルは、音声コマンドを発行するユーザの最近傍の音声動作型ユーザデバイスに対応しない場合がある。いくつかの実施形態では、メディアガイドアプリケーションは、最大音量レベルを決定するときに音声動作型ユーザデバイスの本差違を考慮し、最大音量レベルを決定することに先立って、それに応じて複数の音量レベルを調節してもよい。いくつかの実施形態では、メディアガイドアプリケーションは、他の要因を使用し、最も近い音声動作型ユーザデバイスを決定してもよい。これらの要因は、例えば、各音声動作型ユーザデバイスと音声コマンドを発行するユーザとの間の空間を測定するための赤外線（ＩＲ）検出を含んでもよい。

いくつかの実施形態では、メディアガイドアプリケーションは、音声コマンドへの可聴応答を聞くことに関心を持つであろう、音声コマンドを発行したユーザ以外のユーザを決定してもよい。そのような実施形態では、複数の音声動作型ユーザデバイスのうちの１つを上回る音声動作型ユーザデバイスが、可聴応答を出力してもよい。これらの応答は、決定されたユーザがそれぞれ、応答を聞くことができるように、同時に、随意に、異なる音量において与えられてもよい。例えば、ユーザＡは、テレビチャネルＨＢＯ上で現在放送されているテレビ番組を尋ねる、音声コマンドを発行してもよい。メディアガイドアプリケーションは、番組が「ＧａｍｅｏｆＴｈｒｏｎｅｓ」であることを決定してもよい。メディアガイドアプリケーションは、第２のユーザ、すなわち、ユーザＢが、番組「ＧａｍｅｏｆＴｈｒｏｎｅｓ」に関心を持っていることを決定してもよい。メディアガイドアプリケーションが、第２の音声動作型ユーザデバイスを通して、ユーザＡからの音声コマンドへの可聴応答（例えば、「ＧａｍｅｏｆＴｈｒｏｎｅｓがＨＢＯで現在放映されています」）を生成するとき、メディアガイドアプリケーションはさらに、ユーザＢの近傍の第３の音声動作型ユーザデバイスを通して、可聴応答を生成してもよい。第２の音声動作型ユーザデバイスを通して生成される可聴応答が、例えば、第２の音量レベル５３ｄＢにおいて生成されてもよい一方で、第３の音声動作型ユーザデバイスを通して生成される可聴応答は、例えば、第３の音量レベル５５ｄＢにおいて生成されてもよい。第２および第３の音量レベルは、例えば、個別のユーザが可聴応答を聞くことができるであろう程度に基づいて、選定されてもよい。

第２の音量レベルを決定するために、いくつかの実施形態では、メディアガイドアプリケーションは、ユーザと関連付けられるユーザプロファイルを識別してもよい。ユーザプロファイルは、ユーザが過去に聴覚を確認した複数のユーザ音量レベルを含有する、聴覚情報データ構造を含有してもよい。メディアガイドアプリケーションは、複数のユーザ音量レベルのうちの最低ユーザ音量レベルを決定してもよい。例えば、ユーザが前もって聴覚を確認した最低音量レベルは、４０ｄＢであってもよい。第２の音量レベル（可聴応答の音量レベル）はさらに、最低ユーザ音量レベルに基づいてもよい。例えば、複数のユーザデバイス（デバイスＡ、デバイスＢ、またはデバイスＣ等）のうちのいずれかによって聞かれる最大音量レベルは、３５ｄＢであってもよい。本実施例では、第２の音量レベルは、ユーザが可聴応答を聞くことが可能であることを確実にするように、４０ｄＢに設定されるであろう。

いくつかの実施形態では、ユーザからの音声コマンドへの応答は、デバイス上に視覚的に表示されてもよい。メディアガイドアプリケーションは、ユーザと関連付けられるディスプレイデバイスを識別してもよい。例えば、メディアガイドアプリケーションは、ユーザプロファイルを通してユーザと関連付けられるテレビとインターフェースをとってもよい。メディアガイドアプリケーションは、可聴応答の視覚表現を表示するために生成してもよい。例えば、メディアガイドアプリケーションは、テレビ上にウィンドウを生成してもよく、ウィンドウ内に応答を表示してもよい。例えば、メディアガイドアプリケーションは、受信されるユーザからの要求が番組の名称についてのクエリであるときに、番組のタイトル「ＧａｍｅｏｆＴｈｒｏｎｅｓ」を表示してもよい。さらに、可聴応答が生成された後、ディスプレイウィンドウは、可聴応答を与えたデバイスへの参照を含んでもよい。例えば、メディアガイドアプリケーションは、「デバイスＢが「ＧａｍｅｏｆＴｈｒｏｎｅｓ」と発しました」を表示してもよい。これは、ユーザが通信しているデバイス、したがって、ユーザの近傍にあるデバイスをユーザに知らせる。

いくつかの実施形態では、メディアガイドアプリケーションは、ユーザプロファイルを使用して、ユーザに聴力障害があることを決定してもよい。例えば、本情報は、聴覚情報データ構造の中に記憶され得る。例えば、ユーザは、いかなる可聴応答も聞くことができない場合がある。この場合、上記の説明と同様に、メディアガイドアプリケーションは、ユーザと関連付けられるディスプレイデバイスを識別してもよい。メディアガイドアプリケーションは、可聴応答の視覚表現を表示するために生成し、視覚表現をディスプレイデバイスに伝送してもよい。例えば、メディアガイドアプリケーションは、視覚表現をユーザと関連付けられる携帯電話に伝送してもよい。

いくつかの実施形態では、メディアガイドアプリケーションは、ユーザが可聴応答を聞いたという確認応答を、ある時間周期にわたって待機してもよい。確認応答がその時間内に受信されない場合、メディアガイドアプリケーションは、第２の音声動作型ユーザデバイスを通して、音声コマンドへの第２の可聴応答を生成してもよい、または可聴応答の視覚表現を表示するために生成し、ユーザデバイス上に表示してもよい。これを遂行するために、メディアガイドアプリケーションは、可聴応答が生成されたときに対応する第１の時間を決定してもよい。例えば、可聴応答が生成されるとき、メディアガイドアプリケーションは、タイムスタンプをデータ構造に保存してもよい。例えば、可聴応答は、午後３時１２分３秒に生成されている場合がある。メディアガイドアプリケーションは、次いで、時間周期を第１の時間に加算することによって、第２の時間を計算してもよい。例えば、時間周期は、２０秒であってもよく、第２の時間は、午後３時１２分２３秒であってもよい。本時間周期は、ユーザの音声コマンドに再び応答する前に、メディアガイドアプリケーションが待機する長さを表す。

ユーザ確認応答を待機するための時間周期は、種々の方法で決定されることができる。いくつかの実施形態では、メディアガイドアプリケーションは、ユーザと関連付けられるユーザプロファイルを識別し、ユーザプロファイルを使用して、応答のための平均時間を決定することによって、時間周期を決定してもよい。例えば、ユーザプロファイルは、ユーザによって話されるキーワードを受信することによって、メディアガイドアプリケーションによって識別されてもよく、キーワードは、具体的ユーザと関連付けられる。ユーザプロファイルはまた、ユーザの発話パターンによって識別されてもよい。ユーザプロファイルは、例えば、ユーザが過去に音声動作型ユーザデバイスに応答するために要した時間量を含有する、第１のデータ構造を含有してもよい。メディアガイドアプリケーションは、これらの過去の応答時間の平均を計算し、ユーザのために応答のための平均時間を決定してもよい。例えば、ユーザは、過去に第２の音声動作型ユーザデバイスに応答するために、１０秒、５秒、および１５秒を要している場合がある。応答を待機するための時間周期は、１０秒がユーザの過去の応答時間の平均であるため、本ユーザのために１０秒に設定され得る。

いくつかの実施形態では、音声動作型ユーザデバイスが時間周期内にユーザから確認応答を受信しない場合、メディアガイドアプリケーションは、別の応答を生成する、または音声コマンドへの最初の可聴応答を繰り返すであろう。確認応答は、可聴応答がユーザによって聞かれたことを示す。例えば、デバイスＢ等の第２の音声動作型ユーザデバイスからの可聴応答は、「ＭａｙｔｈｅＦｏｒｃｅｂｅｗｉｔｈｙｏｕ」であってもよい。ユーザは、「ありがとう、デバイスＢ」と発することによって、本応答を確認してもよい。

確認応答が時間周期内に受信されない場合、第２の可聴応答または可聴応答の視覚表現が、生成されてもよい。例えば、いくつかの実施形態では、メディアガイドアプリケーションは、確認応答が第３の時間に受信されたかどうかに基づいて、オーディオ応答の視覚表現をユーザと関連付けられるディスプレイデバイスに伝送してもよく、第３の時間は、第２の時間の前である。例えば、可聴応答は、午後３時１２分３秒に生成されている場合がある。時間周期が、例えば、２０秒である場合、第２の時間は、午後３時１２分２３秒である。デバイスＢが午後３時１２分２３秒までに確認応答を受信していない場合、メディアガイドアプリケーションは、ユーザと関連付けられるテレビを通して、可聴応答の視覚表現（例えば、「デバイスＢが「ＭａｙｔｈｅＦｏｒｃｅｂｅｗｉｔｈｙｏｕ」と発しました」）を生成してもよい。

いくつかの実施形態では、音声動作型ユーザデバイスが時間周期内にユーザから確認応答を受信しない場合、メディアガイドアプリケーションは、別の可聴応答を生成する。具体的には、メディアガイドアプリケーションは、確認応答が第３の時間に受信されたかどうかに基づいて、第２の音声動作型ユーザデバイスを通して、第２の可聴応答を生成してもよい。第２の可聴応答は、可聴応答と同一であり得、その場合、第２のユーザは、単純に、同一または異なる音量レベルにおいてユーザへの可聴応答を繰り返す。第２の可聴応答はまた、例えば、応答するようにユーザを促してもよい。例えば、デバイスＢが午後３時１２分２３秒までにユーザから確認応答を受信していない場合、メディアガイドアプリケーションは、デバイスＢを通して、「「ＭａｙｔｈｅＦｏｒｃｅｂｅｗｉｔｈｙｏｕ」が聞こえましたか？」を尋ねる第２の可聴応答を生成してもよい。

第２の可聴応答は、第１の応答と同一の音量レベルにおいて、またはいくつかの実施形態では、より大きい音量レベルにおいて、生成されてもよい。例えば、メディアガイドアプリケーションは、第２の可聴応答を生成する第２の音量を上回る、第３の音量レベルを決定してもよい。第３の音量レベルは、例えば、所定の量を加えた第２の音量レベルであり得る。例えば、第２の音量レベルが、５３ｄＢであり得る一方で、第３の音量レベルは、５６ｄＢであり得る。第２の可聴応答が第３の音量レベルにおいて生成されるため、メディアガイドアプリケーションは、５６ｄＢにおいてデバイスＢを通して第２の可聴応答（例えば、「「ＭａｙｔｈｅＦｏｒｃｅｂｅｗｉｔｈｙｏｕ」が聞こえましたか？」）を生成してもよい。

いくつかの側面では、第２の可聴応答を最良に生成するために、メディアガイドアプリケーションは、ユーザと関連付けられるユーザプロファイルを識別してもよい。例えば、メディアガイドアプリケーションは、ユーザによって話されるキーワードを受信することによって、ユーザプロファイルを識別してもよい。ユーザＡは、例えば、音声コマンドを発行する前に、「ユーザＡ」と発してもよい。ユーザプロファイルはまた、例えば、ユーザの発話または発声パターンによって識別されてもよい。

いくつかの実施形態では、メディアガイドアプリケーションは、ユーザプロファイルを使用し、ユーザと関連付けられる平均発話音量レベルを識別してもよい。例えば、ユーザプロファイルは、ユーザが過去に使用した発話音量を含有する、第１のデータ構造を含有してもよい。メディアガイドアプリケーションは、これらの過去の発話音量の平均を計算し、ユーザのための平均発話音量を決定してもよい。例えば、ユーザの平均発話音量は、６０ｄＢであってもよい。

メディアガイドアプリケーションは、次いで、平均発話音量レベルと最大音量レベル（すなわち、ユーザの最近傍の音声動作型ユーザデバイスによって受信される音量レベル）との間の差を決定してもよい。例えば、最大音量レベルは、５２ｄＢであってもよく、ユーザの平均発話音量は、６０ｄＢであってもよい。差は、この場合、８ｄＢである。

第３の音量レベル（第２の可聴応答の音量レベル）は、第２の音量レベルに加算される差に基づいてもよい。例えば、第２の音量レベルは、５３ｄＢであってもよく、差は、８ｄＢであってもよく、第３の音量は、６１ｄＢであってもよい。この場合、第２の音声動作型ユーザデバイスは、６１ｄＢにおいて第２の可聴応答を発行するであろう。

いくつかの実施例では、メディアガイドアプリケーションは、ユーザから確認応答を受信する。確認応答を受信することに応答して、メディアガイドアプリケーションは、ユーザのユーザプロファイルの中に第２の音量レベル（最初の可聴応答の音量レベル）を記憶してもよい。例えば、ユーザプロファイルは、ユーザが過去に聞くことができた複数のユーザ音量レベルを含有する、聴覚情報データ構造を含有してもよい。第２の音量レベルは、本第２のデータ構造の中に記憶されてもよい。

上記に説明されるシステムおよび／または方法は、本開示に説明される他のシステム、方法、および／または装置に適用される、またはそれに従って使用され得ることに留意されたい。

本開示の上記および他の目的および利点は、同様の参照文字が全体を通して同様の部分を指す、添付の図面と併せて考慮される、以下の発明を実施するための形態の検討から明白となるであろう。

図１は、本開示のいくつかの実施形態による、音声コマンドを検出する複数の音声動作型ユーザデバイスの例証的実施例を示す。

図２は、本開示のいくつかの実施形態による、音声動作型ユーザデバイスを通して、音声コマンドへの可聴応答を生成するメディアガイドアプリケーションの例証的実施例を示す。

図３は、本開示のいくつかの実施形態による、可聴応答の視覚表現を表示するために生成するメディアガイドアプリケーションの例証的実施例を示す。

図４は、本開示のいくつかの実施形態による、メディアコンテンツにアクセスする際に使用するための表示画面の例証的実施例を示す。

図５は、本開示のいくつかの実施形態による、メディアコンテンツにアクセスするために使用される表示画面の別の例証的実施例を示す。

図６は、本開示のいくつかの実施形態による、例証的ユーザ機器デバイスのブロック図である。

図７は、本開示のいくつかの実施形態による、例証的メディアシステムのブロック図である。

図８は、本開示のいくつかの実施形態による、ユーザ音声コマンドの音量レベルに基づく音量レベルにおいて、音声動作型ユーザデバイスを通して可聴応答を生成するための例証的ステップのフローチャートである。

図９は、本開示のいくつかの実施形態による、可聴応答がユーザによって確認されなかった場合に、音声コマンドへの第２の可聴応答を生成するための例証的ステップのフローチャートである。

図１０は、本開示のいくつかの実施形態による、可聴応答がユーザによって確認されなかった場合に、音声コマンドへの第２の可聴応答を生成するための例証的ステップのフローチャートである。

図１１は、本開示のいくつかの実施形態による、音声コマンドへの応答の視覚表現をディスプレイデバイスに伝送するための例証的ステップのフローチャートである。

図１２は、本開示のいくつかの実施形態による、第３の音量レベルにおいて第２の可聴応答を生成するための例証的ステップのフローチャートである。

図１３は、本開示のいくつかの実施形態による、音声コマンドをフィルタ処理するための例証的ステップのフローチャートである。

システムおよび方法が、音声コマンドの音量レベルに基づく音量レベルにおいて音声コマンドに応答するために、本明細書に説明される。音声コマンドの音量レベルを使用し、応答音量レベルを決定することは、ユーザが、例えば、音声動作型ユーザデバイスを手動で調節する必要なく、応答音量レベルを変更することを可能にする。

図１は、本開示のいくつかの実施形態による、音声コマンドを検出する複数の音声動作型ユーザデバイスの例証的実施例を示す。長椅子の一方の端部上に第１の音声動作型ユーザデバイス１０２、長椅子の反対端上に第２の音声動作型ユーザデバイス１０４が存在し得る。第１のユーザ１０８が、第１のデバイス１０２の最近傍の長椅子の端部に着席し得る一方で、第２のユーザ１１０は、第２の音声動作型ユーザデバイス１０４の最近傍の長椅子の反対端に着席し得る。第２のユーザ１１０は、第１の音声動作型ユーザデバイス１０２および第２の音声動作型ユーザデバイス１０４の両方によって受信される音声コマンド１０６を口に出し得る。本明細書に説明されるシステムおよび方法は、各音声動作型ユーザデバイス１０２、１０４において受信される音声コマンド音量レベルに基づいて、第２の音声動作型ユーザデバイス１０４が音声コマンド１０６を発行した第２のユーザ１１０により近いことを決定してもよい。第２の音声動作型ユーザデバイス１０４は、次いで、音声コマンド１０６の音量レベルに基づく音量レベルにおいて応答してもよい１１２。例えば、第１のユーザ１０８および第２のユーザ１１０は、映画（例えば、「ＳｔａｒＷａｒｓ」）を鑑賞していてもよい。第２のユーザ１１０の音声コマンド１０６は、映画の中で発せられた最後の台詞（例えば、「ＭａｙｔｈｅＦｏｒｃｅｂｅｗｉｔｈｙｏｕ」）を繰り返すための囁いた要求であってもよい。第２の音声動作型ユーザデバイス１０４は、最後の台詞（例えば、「ＭａｙｔｈｅＦｏｒｃｅｂｅｗｉｔｈｙｏｕ」）を第２のユーザ１１０に囁き返すことによって、応答してもよい１１２。したがって、第１の音声動作型ユーザデバイス１０２は、音声コマンド１０６を受信したが、第２の音声動作型ユーザデバイス１０４は、応答１１２を提供した。

これらのシステムおよび方法は、メディアガイドアプリケーションによって実装されてもよい。メディアガイドアプリケーションは、複数の音声動作型ユーザデバイス１０２、１０４、１１４に接続されてもよい。複数の音声動作型ユーザデバイスは、例えば、第１の音声動作型ユーザデバイス１０２（例えば、デバイスＡ）、第２の音声動作型ユーザデバイス１０４（例えば、デバイスＢ）、および第３の音声動作型ユーザデバイス１１４（例えば、デバイスＣ）を含んでもよい。メディアガイドアプリケーションは、複数の音声動作型ユーザデバイスのうちの第１の音声動作型ユーザデバイス１０２を通して、ユーザによって話される音声コマンド１０６を検出してもよい。例えば、メディアガイドアプリケーションは、第１の音声動作型ユーザデバイス１０２（例えば、デバイスＡ）を通して、ユーザが現在鑑賞している映画を参照して、「最後の台詞を繰り返して」と発するユーザからの音声コマンド１０６を検出してもよい。

メディアガイドアプリケーションは、音声コマンド１０６の第１の音量レベルを決定してもよく、音声コマンドは、第１の音声動作型ユーザデバイス１０２によって受信される。例えば、第１の音量レベルは、第１の音声動作型ユーザデバイス１０２（例えば、デバイスＡ）において検出される音声コマンド１０６の入力音量の平均（例えば、４８ｄｂ）であってもよい。

いくつかの実施形態では、第１の音量レベルを決定するために、メディアガイドアプリケーションは、音声コマンド１０６のフィルタ処理されていない音量レベルを測定してもよい。例えば、音声コマンドのフィルタ処理されていない音量レベルは、６０ｄＢであってもよい。しかしながら、本フィルタ処理されていない音量レベルは、ユーザ１１０の近傍で映画を可聴的に放映するテレビ等の背景雑音のレベルを含み得る。

メディアガイドアプリケーションは、背景雑音のレベルを決定してもよく、音声コマンド１０６をフィルタ処理し、背景雑音のレベルを除去してもよい。例えば、テレビで放映される映画は、ユーザ１１０の音声よりも高い周波数にあり得る。メディアガイドアプリケーションは、音声コマンド１０６の高周波数成分を取り除き、背景雑音を除去してもよい。メディアガイドアプリケーションは、次いで、音声コマンド１０６のフィルタ処理された音量レベルを計算してもよい。例えば、音声コマンドのフィルタ処理された音量レベルは、フィルタ処理されていない音量レベル６０ｄＢと比較して、４８ｄＢであってもよい。

いくつかの音声動作型ユーザデバイス（例えば、デバイスＡ１０２、デバイスＢ１０４、およびデバイスＣ１１４）は、ユーザからの音声コマンド１０６を検出してもよい。これらのデバイス１０２、１０４、１１４はそれぞれ、例えば、音声コマンド１０６を発行するユーザ１１０への近接性に応じて、異なる音量レベルにおいて音声コマンドを受信してもよい。したがって、複数の音声動作型ユーザデバイスのうちの各音声動作型ユーザデバイス１０２、１０４、１１４は、音声コマンド１０６の複数の音量レベルのうちの音量レベルと関連付けられるであろう。メディアガイドアプリケーションは、複数の音量レベルのうちの各音量レベルを複数の音声動作型ユーザデバイスのうちの個別の音声動作型ユーザデバイスと関連付ける、少なくとも１つのデータ構造を受信してもよい。例えば、メディアガイドアプリケーションは、複数の音声動作型ユーザデバイスのうちの各音声動作型ユーザデバイスから、音量レベルおよび個別の音声動作型ユーザデバイスの音声動作型ユーザデバイス識別子を含有する、データ構造を受信してもよい。例えば、メディアガイドアプリケーションは、第２の音声動作型ユーザデバイス１０４から、５２ｄｂの音量レベルおよびデバイス識別子デバイスＢを含有する、データ構造を受信してもよい。例えば、メディアガイドアプリケーションは、第３の音声動作型ユーザデバイス１１４から、５０ｄｂの音量レベルおよびデバイス識別子デバイスＣを含有する、データ構造を受信してもよい。

いくつかの実施形態では、メディアガイドアプリケーションは、第１の音量レベルを複数の音量レベルと比較してもよい。例えば、メディアガイドアプリケーションは、デバイスＡ１０２と関連付けられる４８ｄＢを、デバイスＢ１０４と関連付けられる５２ｄＢと、デバイスＣ１１４と関連付けられる５０ｄＢと比較してもよい。

いくつかの実施形態では、メディアガイドアプリケーションは、第１の音量レベルを複数の音量レベルと比較するステップに基づいて、複数の音量レベルのうちの最大音量レベルを決定してもよい。例えば、複数の音声動作型ユーザデバイスのうちのいずれかによって受信される最大音量レベルは、５２ｄＢであってもよい。複数の音量レベルのうちの最大音量レベルは、（例えば、音声動作型ユーザデバイス１０２、１０４、１１４のうちの）複数の音声動作型ユーザデバイスによって受信される音量レベルのうちの最大である。

いくつかの実施形態では、メディアガイドアプリケーションは、最大音量レベルと関連付けられる第２の音声動作型１０４ユーザデバイスに関して、少なくとも１つのデータ構造を検索してもよい。最大音量と関連付けられるユーザデバイスは、デバイスがユーザに近いほど、そのユーザからの音声コマンドがデバイスに大きく聞こえるであろうため、音声コマンドを発行したユーザに最近傍のデバイスであろう。例えば、最大音量レベルが５２ｄＢである場合、メディアガイドアプリケーションは、データ構造を検索し、５２ｄＢ音量レベルと関連付けられる音声動作型ユーザデバイスを見出してもよい。データ構造では、５２ｄＢ音量レベルは、第２の音声動作型ユーザデバイス１０４を表す、デバイス識別子デバイスＢと関連付けられてもよい。第２の音声動作型ユーザデバイス１０４（例えば、デバイスＢ）は、本実施例では、音声コマンド１０６を発行したユーザ１１０に最近傍の音声動作型ユーザデバイスである。

いくつかの実施形態では、メディアガイドアプリケーションは、コマンドを第２の音声動作型ユーザデバイス１０４に伝送してもよい。コマンドは、応答レベルを、最大音量レベルに基づく第２の音量レベルに更新するように、第２の音声動作型ユーザデバイス１０４に命令してもよい。例えば、メディアガイドアプリケーションは、応答レベルを音量レベル５２ｄＢに変更するように、デバイスＢとして識別される第２の音声動作型ユーザデバイス１０４に命令してもよい。例えば、メディアガイドアプリケーションは、代わりに、応答レベルを、最大音量レベルよりもわずかに大きい５３ｄＢに変更するように、デバイスＢとして識別される第２の音声動作型ユーザデバイス１０４に命令してもよい。メディアガイドアプリケーションは、最大音量レベルをわずかに増加させ、このようにして第２の音量を決定し、周囲雑音を考慮してもよい。

いくつかの実施形態では、メディアガイドアプリケーションは、音声コマンド１０６への可聴応答１１２を生成してもよい。可聴応答１１２は、第２の音声動作型ユーザデバイス１０４を通して、第２の音量レベルにおいて生成されてもよい。例えば、デバイスＢとして識別される第２の音声動作型ユーザデバイス１０４は、音量レベル５３ｄＢにおいて、ユーザが現在鑑賞している映画の最後の台詞（例えば、「ＭａｙｔｈｅＦｏｒｃｅｂｅｗｉｔｈｙｏｕ」）を繰り返してもよい。いくつかの実施形態では、第１の音声動作型デバイスおよび第２の音声動作型ユーザデバイスは、同一のデバイスであってもよく、第１の音量レベルおよび第２の音量は、同一の音量レベルであってもよい。

いくつかの実施形態では、メディアガイドアプリケーションは、音声動作型ユーザデバイス（例えば、第１の音声動作型ユーザデバイス１０２、第２の音声動作型ユーザデバイス１０４、第３の音声動作型ユーザデバイス１１４）が、音声コマンド１０６を検出するために同一の機器、方法、または感度を使用しないことを決定してもよい。したがって、検出される最大音量レベルは、音声コマンド１０６を発行するユーザ１１０の最近傍の音声動作型ユーザデバイスに対応しない場合がある。いくつかの実施形態では、メディアガイドアプリケーションは、最大音量レベルを決定するときに音声動作型ユーザデバイスの本差違を考慮し、それに応じて複数の音量レベルを調節してもよい。いくつかの実施形態では、メディアガイドアプリケーションは、他の要因を使用し、最も近い音声動作型ユーザデバイスを決定してもよい。これらの要因は、例えば、各音声動作型ユーザデバイスと音声コマンドを発行するユーザとの間の空間を測定するための赤外線（ＩＲ）検出を含んでもよい。

いくつかの実施形態では、メディアガイドアプリケーションは、音声コマンド１０６への可聴応答１１２を聞くことに関心を持つであろう、音声コマンド１０６を発行したユーザ１１０以外のユーザを決定してもよい。そのような実施形態では、複数の音声動作型ユーザデバイス１０２、１０４、１１４のうちの１つを上回る音声動作型ユーザデバイスが、可聴応答を出力してもよい。これらの応答は、決定されたユーザがそれぞれ、応答を聞くことができるように、同時に、随意に、異なる音量において与えられてもよい。例えば、第２のユーザ１１０は、テレビチャネルＨＢＯ上で現在放送されているテレビ番組を尋ねる、音声コマンドを発行してもよい。メディアガイドアプリケーションは、番組が「ＧａｍｅｏｆＴｈｒｏｎｅｓ」であることを決定してもよい。メディアガイドアプリケーションは、第１のユーザ１０８が番組「ＧａｍｅｏｆＴｈｒｏｎｅｓ」に関心を持っていることを決定してもよい。メディアガイドアプリケーションが、第２の音声動作型ユーザデバイス１０４を通して、第２のユーザ１１０からの音声コマンドへの可聴応答（例えば、「ＧａｍｅｏｆＴｈｒｏｎｅｓがＨＢＯで現在放映されています」）を生成するとき、メディアガイドアプリケーションはさらに、ユーザ１０８の近傍の第３の音声動作型ユーザデバイス１１４を通して、可聴応答を生成してもよい。第２の音声動作型ユーザデバイス１０４を通して生成される可聴応答が、例えば、第２の音量レベル５３ｄＢにおいて生成されてもよい一方で、第３の音声動作型ユーザデバイス１１４を通して生成される可聴応答は、例えば、第３の音量レベル５５ｄＢにおいて生成されてもよい。第２および第３の音量レベルは、例えば、個別のユーザが可聴応答を聞くことができるであろう程度に基づいて、選定されてもよい。

いくつかの実施形態では、メディアガイドアプリケーションは、ユーザが移動していることを決定してもよい。例えば、メディアガイドアプリケーションは、ユーザが話し始めるとき、およびユーザが話し終えるときに、音声コマンドの音量レベルを測定してもよい。ユーザが音声コマンドを発行し始めるときに第３の音声動作型ユーザデバイス１１４において受信される音量レベルは、ユーザが音声コマンドを発行することを終了するときに第３の音声動作型ユーザデバイス１１４において受信される音量レベルを上回り得る。ユーザが話し始めるときに第２の音声動作型ユーザデバイス１０４において受信される音量レベルは、ユーザが話し終えるときに第２の音声動作型ユーザデバイス１０４において受信される音量レベルよりも穏やかであり得る。メディアガイドアプリケーションは、これらの変化する受信音量レベルを使用して、ユーザが第３の音声動作型ユーザデバイスの近傍から第２の音声動作型ユーザデバイスのより近傍に移動していることを決定してもよい。メディアガイドアプリケーションは、故に、ユーザの移動経路に沿って、複数の音声動作型ユーザデバイスのうちの複数の音声動作型ユーザデバイスを決定してもよい。

いくつかの実施形態では、メディアガイドアプリケーションは、複数の音声動作型ユーザデバイスのうちの複数の音声動作型ユーザデバイスを通して、可聴応答の構成要素を生成してもよい。複数の音声動作型ユーザデバイスは、同時に、または異なる時間に、可聴応答または可聴応答の構成要素を生成してもよい。例えば、音声コマンドは、スペイン語から英語への歌の翻訳を要求してもよい。第３の音声動作型ユーザデバイス１１４は、翻訳された歌の最初の１０秒を再生してもよく（可聴応答）、第１の音声動作型ユーザデバイス１０２は、歌の次の１０秒を再生してもよく、第２の音声動作型ユーザデバイスは、歌の残りの構成要素を再生してもよい。メディアガイドアプリケーションは、同一（例えば、第２の音量レベル）であり、全てのデバイスから本同一音量レベルにおいて応答するように、複数のデバイスのそれぞれの応答音量を調節してもよい。例えば、第２の音量レベルは、５７ｄＢであってもよい。複数の音声動作型ユーザデバイスはそれぞれ、第２の音量レベル５７ｄＢにおいて応答してもよい。上記に説明される実施形態では、可聴応答は、したがって、ユーザの移動経路に沿って辿り、ユーザが異なるデバイスの近傍で移動するにつれて、ユーザが可聴応答をより良好に聞くことを可能にしてもよい。

第２の音量レベルを決定するために、いくつかの実施形態では、ディアガイドアプリケーションは、音声コマンド１０６を発行したユーザ１１０と関連付けられるユーザプロファイルを識別してもよい。ユーザプロファイルは、ユーザ１１０が過去に聴覚を確認した複数のユーザ音量レベルを含有する、聴覚情報データ構造を含有してもよい。メディアガイドアプリケーションは、複数のユーザ音量レベルのうちの最低ユーザ音量レベルを決定してもよい。例えば、ユーザ１１０が前もって聴覚を確認した最低音量レベルは、４０ｄＢであってもよい。第２の音量レベル（可聴応答の音量レベル）はさらに、最低ユーザ音量レベルに基づいてもよい。例えば、複数のユーザデバイス（デバイスＡ１０２、デバイスＢ１０４、またはデバイスＣ１１４等）のうちのいずれかによって聞かれる最大音量レベルは、３５ｄＢであってもよい。本実施例では、第２の音量レベルは、ユーザ１１０が可聴応答を聞くことが可能であることを確実にするように、４０ｄＢに設定されるであろう。

図２は、本開示のいくつかの実施形態による、音声動作型ユーザデバイス２０８を通して、音声コマンド２０４への可聴応答２０６を生成するメディアガイドアプリケーションの例証的実施例を示す。いくつかの実施形態では、メディアガイドアプリケーションは、ユーザ２０２が可聴応答２０６を聞いたという確認応答を、ある時間周期にわたって待機してもよい。確認応答がその時間内に受信されない場合、メディアガイドアプリケーションは、第２の音声動作型ユーザ２０８デバイスを通して、音声コマンド２０４への第２の可聴応答２１０を生成してもよい、または図３に示され、下記に説明されるように、可聴応答の視覚表現を表示するために生成し、ユーザデバイス上に表示してもよい。これを遂行するために、メディアガイドアプリケーションは、可聴応答２０６が生成されたときに対応する第１の時間を決定してもよい。例えば、可聴応答２０６が生成されるとき、メディアガイドアプリケーションは、タイムスタンプをデータ構造に保存してもよい。例えば、可聴応答は、午後３時１２分３秒に生成されている場合がある。メディアガイドアプリケーションは、次いで、時間周期を第１の時間に加算することによって、第２の時間を計算してもよい。例えば、時間周期は、２０秒であってもよく、第２の時間は、午後３時１２分２３秒であってもよい。本時間周期は、ユーザ２０２の音声コマンド２０４に再び応答する前に、メディアガイドアプリケーションが待機する長さを表す。

ユーザ確認応答を待機するための時間周期は、種々の方法で決定されることができる。いくつかの実施形態では、メディアガイドアプリケーションは、ユーザ２０２と関連付けられるユーザプロファイルを識別し、ユーザプロファイルを使用して、応答のための平均時間を決定することによって、時間周期を決定してもよい。例えば、ユーザプロファイルは、ユーザ２０２によって話されるキーワードを受信することによって、メディアガイドアプリケーションによって識別されてもよく、キーワードは、具体的ユーザと関連付けられる。ユーザプロファイルはまた、ユーザ２０２の発話パターンによって識別されてもよい。ユーザプロファイルは、例えば、ユーザ２０２が過去に音声動作型ユーザデバイスに応答するために要した時間量を含有する、第１のデータ構造を含有してもよい。メディアガイドアプリケーションは、これらの過去の応答時間の平均を計算し、ユーザ２０２のために応答のための平均時間を決定してもよい。例えば、ユーザ２０２は、過去に第２の音声動作型ユーザデバイス２０８に応答するために、１０秒、５秒、および１５秒を要している場合がある。応答を待機するための時間周期は、１０秒がユーザの過去の応答時間の平均であるため、本ユーザのために１０秒に設定され得る。

いくつかの実施形態では、音声動作型ユーザデバイス２０８が時間周期内にユーザ２０２から確認応答を受信しない場合、メディアガイドアプリケーションは、別の応答２１０を生成する、または音声コマンドへの最初の可聴応答２０４を繰り返すであろう。確認応答２１２は、可聴応答がユーザによって聞かれたことを示す。例えば、デバイスＢ等の第２の音声動作型ユーザデバイス２０８からの可聴応答２０６は、「ＭａｙｔｈｅＦｏｒｃｅｂｅｗｉｔｈｙｏｕ」であってもよい。ユーザ２０２は、「ありがとう、デバイスＢ」と発することによって、本応答を確認してもよい。

確認応答が時間周期内に受信されない場合、第２の可聴応答２１０または可聴応答２０６の視覚表現が、生成されてもよい。例えば、いくつかの実施形態では、メディアガイドアプリケーションは、確認応答２１２が第３の時間に受信されたかどうかに基づいて、オーディオ応答の視覚表現（ウィンドウ３１０の中で図３に示されるもの等）をユーザと関連付けられるディスプレイデバイス（デバイス３０８において図３に示されるもの等）に伝送してもよく、第３の時間は、第２の時間の前である。例えば、可聴応答２０６は、午後３時１２分３秒に生成されている場合がある。時間周期が、例えば、２０秒である場合、第２の時間は、午後３時１２分２３秒である。デバイスＢが午後３時１２分２３秒までに確認応答を受信していない場合、メディアガイドアプリケーションは、ユーザと関連付けられるテレビを通して、可聴応答２０６の視覚表現（例えば、「デバイスＢが「ＭａｙｔｈｅＦｏｒｃｅｂｅｗｉｔｈｙｏｕ」と発しました」）を生成してもよい。

いくつかの実施形態では、音声動作型ユーザデバイス２０８が時間周期内にユーザから確認応答を受信しない場合、メディアガイドアプリケーションは、別の可聴応答２１０を生成する。具体的には、メディアガイドアプリケーションは、確認応答（確認応答２１２等）が第３の時間に受信されたかどうかに基づいて、第２の音声動作型ユーザデバイス２０８を通して、第２の可聴応答２１０を生成してもよい。第２の可聴応答２１０は、可聴応答２０４と同一であり得、その場合、第２のユーザは、単純に、同一または異なる音量レベルにおいてユーザへの可聴応答を繰り返す。第２の可聴応答２１０はまた、例えば、応答するようにユーザを促してもよい。例えば、第２の音声動作型ユーザデバイス２０８（例えば、デバイスＢ）が午後３時１２分２３秒までに確認応答を受信していない場合、メディアガイドアプリケーションは、第２の音声動作型ユーザデバイス２０８（例えば、デバイスＢ）を通して、「「ＭａｙｔｈｅＦｏｒｃｅｂｅｗｉｔｈｙｏｕ」が聞こえましたか？」を尋ねる第２の可聴応答２１０を生成してもよい。

第２の可聴応答２１０は、第１の応答と同一の音量レベルにおいて、またはいくつかの実施形態では、より大きい音量レベルにおいて、生成されてもよい。例えば、メディアガイドアプリケーションは、第２の可聴応答２１０を生成する第２の音量を上回る、第３の音量レベルを決定してもよい。第３の音量レベルは、例えば、所定の量を加えた第２の音量レベルであり得る。例えば、第２の音量レベルが、５３ｄＢであり得る一方で、第３の音量レベルは、５６ｄＢであり得る。第２の可聴応答２１０が第３の音量レベルにおいて生成されるため、メディアガイドアプリケーションは、５６ｄＢにおいて第２の音声動作型デバイス２０８（例えば、デバイスＢ）を通して第２の可聴応答２１０（例えば、「「ＭａｙｔｈｅＦｏｒｃｅｂｅｗｉｔｈｙｏｕ」が聞こえましたか？」）を生成してもよい。

いくつかの側面では、第２の可聴応答２１０を最良に生成するために、メディアガイドアプリケーションは、ユーザ２０２と関連付けられるユーザプロファイルを識別してもよい。例えば、メディアガイドアプリケーションは、ユーザ２０２によって話されるキーワードを受信することによって、ユーザプロファイルを識別してもよい。ユーザＡは、例えば、音声コマンドを発行する前に、「ユーザＡ」と発してもよい。ユーザプロファイルはまた、例えば、ユーザ２０２の発話または発声パターンによって識別されてもよい。

いくつかの実施形態では、メディアガイドアプリケーションは、ユーザプロファイルを使用し、ユーザ２０２と関連付けられる平均発話音量レベルを識別してもよい。例えば、ユーザプロファイルは、ユーザが過去に使用した発話音量を含有する、第１のデータ構造を含有してもよい。メディアガイドアプリケーションは、これらの過去の発話音量の平均を計算し、ユーザ２０２のための平均発話音量を決定してもよい。例えば、ユーザの平均発話音量は、６０ｄＢであってもよい。

メディアガイドアプリケーションは、次いで、平均発話音量レベルと最大音量レベル（すなわち、ユーザ２０２の最近傍の音声動作型ユーザデバイス２０８によって受信される音量レベル）との間の差を決定してもよい。例えば、最大音量レベルは、５２ｄＢであってもよく、ユーザの平均発話音量は、６０ｄＢであってもよい。差は、この場合、８ｄＢである。

第３の音量レベル（第２の可聴応答の音量レベル２１０）は、第２の音量レベルに加算される差に基づいてもよい。例えば、第２の音量レベルは、５３ｄＢであってもよく、差は、８ｄＢであってもよく、第３の音量は、６１ｄＢであってもよい。この場合、第２の音声動作型ユーザデバイス２０８は、６１ｄＢにおいて第２の可聴応答２１０を発行するであろう。

いくつかの実施例では、メディアガイドアプリケーションは、ユーザから確認応答２１２を受信する。確認応答２１２を受信することに応答して、メディアガイドアプリケーションは、ユーザのユーザプロファイルの中に第２の音量レベル（最初の可聴応答２０６の音量レベル）を記憶してもよい。例えば、ユーザプロファイルは、ユーザ２０２が過去に聞くことができた複数のユーザ音量レベルを含有する、聴覚情報データ構造を含有してもよい。第２の音量レベルは、本第２のデータ構造の中に記憶されてもよい。

図３は、本開示のいくつかの実施形態による、可聴応答の視覚表現を表示するために生成するメディアガイドアプリケーションの例証的実施例を示す。いくつかの実施形態では、ユーザからの音声コマンド３０４への応答は、ディスプレイデバイス３０８上に視覚的に表示されてもよい。メディアガイドアプリケーションは、ユーザ３０２と関連付けられるディスプレイデバイス３０８を識別してもよい。例えば、メディアガイドアプリケーションは、ユーザプロファイルを通してユーザ３０２と関連付けられるテレビとインターフェースをとってもよい。メディアガイドアプリケーションは、可聴応答の視覚表現を表示するために生成してもよい。例えば、メディアガイドアプリケーションは、テレビ上にウィンドウ３１０を生成してもよく、ウィンドウ３１０内に応答を表示してもよい。例えば、メディアガイドアプリケーションは、受信されるユーザ３０２からの要求３０４が番組の名称についてのクエリであるときに、ユーザ３０２が鑑賞している映画の最後の台詞「ＭａｙｔｈｅＦｏｒｃｅｂｅｗｉｔｈｙｏｕ」を表示してもよい。さらに、可聴応答が生成された後、ディスプレイウィンドウ３１０は、可聴応答を与えたデバイス３０６への参照を含んでもよい。例えば、メディアガイドアプリケーションは、「デバイスＢが「ＭａｙｔｈｅＦｏｒｃｅｂｅｗｉｔｈｙｏｕ」と発しました」を表示してもよい。これは、ユーザが通信しているデバイス、したがって、ユーザの近傍にあるデバイスをユーザに知らせる。

いくつかの実施形態では、メディアガイドアプリケーションは、ユーザプロファイルを使用して、ユーザ３０２に聴力障害があることを決定してもよい。例えば、本情報は、聴覚情報データ構造の中に記憶され得る。例えば、ユーザ３０２は、いかなる可聴応答も聞くことができない場合がある。この場合、上記の説明と同様に、メディアガイドアプリケーションは、ユーザと関連付けられるディスプレイデバイス３０８を識別してもよい。メディアガイドアプリケーションは、可聴応答の視覚表現を表示するために生成し、視覚表現をディスプレイデバイス３０８に伝送し、ウィンドウ３１０内で表示してもよい。例えば、メディアガイドアプリケーションは、視覚表現をユーザ３０２と関連付けられるテレビ３０８に伝送してもよい。

本明細書で使用されるように、「連続聴取デバイス」は、電源をオンにされると、ユーザが（例えば、ボタンを押下することによって）入力コマンドに備えるようにデバイスを促す必要なく、オーディオを常に監視し得る、デバイスである。例えば、連続聴取デバイスは、キーワードまたはプロンプト（例えば、「こんにちは、アシスタント」）に関してオーディを常に監視し、能動聴取状態をアクティブ化してもよい、または常に受動聴取状態で全てのオーディオを監視および処理してもよい。本明細書で使用されるように、「受動聴取状態」は、連続聴取デバイスが一時的または持続的にオーディオを録音し続けるが、ユーザが命令を受信する準備をするように連続聴取デバイスを別様に促していない、連続聴取デバイスの動作モードとして定義される。受動状態では、連続聴取デバイスは、オーディオがキーワードまたはプロンプトに応答して処理されるのみである、能動聴取状態と対照的に、全てのオーディオ入力を処理する。いくつかの実施形態では、連続聴取デバイスは、所定の聴取長さにわたってオーディオを記憶する循環バッファの中に、受信されるオーディオを記憶する。例えば、連続聴取デバイスは、５分のオーディオを記憶してもよく、最早期のオーディオ情報は、新しいオーディオが録音されるにつれて削除される。いくつかの実施形態では、全てのオーディオは、持続的に記憶され、日常的なハウスキーピング動作を使用して、またはユーザによって手動で、削除されてもよい。

本明細書で使用されるように、「音声動作型ユーザデバイス」は、常にオーディオ入力およびキーワードを聴取し得る、デバイスである。デバイスへのキーワードアドレスが検出されるとき、音声動作型ユーザデバイスは、オーディオ入力を処理してもよい。音声動作型ユーザデバイスは、上記に説明されるように、連続聴取デバイスと称され得る。音声動作型ユーザデバイスは、受動聴取状態または能動聴取状態を使用してもよい。上記で議論されるいくつかのデバイスは、受動聴取状態を使用し、いくつかは、任意の組み合わせで能動聴取状態を使用してもよい。

任意の所与のコンテンツ配信システムでユーザに利用可能なコンテンツの量が、膨大であり得る。その結果、多くのユーザは、ユーザがコンテンツの選択を効率的にナビゲートし、所望し得るコンテンツを容易に識別することを可能にする、インターフェースを通したメディアガイドの形態を所望している。そのようなガイドを提供するアプリケーションは、本明細書では、双方向メディアガイドアプリケーションと称されるが、時として、メディアガイドアプリケーションまたはガイドアプリケーションと称されることもある。

双方向メディアガイドアプリケーションは、ガイドを提供するコンテンツに応じて、種々の形態をとってもよい。１つの典型的なタイプのメディアガイドアプリケーションは、双方向テレビ番組ガイドである。双方向テレビ番組ガイド（時として、電子番組ガイドと称される）は、とりわけ、ユーザが、多くのタイプのコンテンツまたはメディアアセット間をナビゲートし、それを特定することを可能にする、周知のガイドアプリケーションである。双方向メディアガイドアプリケーションは、ユーザが、コンテンツ間をナビゲートし、それを特定および選択することを可能にする、グラフィカルユーザインターフェース画面を生成してもよい。本明細書で参照されるように、用語「メディアアセット」および「コンテンツ」は、テレビ番組、および有料番組、オンデマンド番組（ビデオオンデマンド（ＶＯＤ）システムにおけるような）、インターネットコンテンツ（例えば、ストリーミングコンテンツ、ダウンロード可能コンテンツ、ウェブキャスト等）、ビデオクリップ、オーディオ、コンテンツ情報、写真、回転画像、ドキュメント、再生一覧、ウェブサイト、記事、書籍、電子書籍、ブログ、チャットセッション、ソーシャルメディア、アプリケーション、ゲーム、および／または任意の他のメディアまたはマルチメディア、および／またはそれらの組み合わせ等の電子的に消費可能なユーザアセットを意味すると理解されたい。ガイドアプリケーションはまた、ユーザが、コンテンツ間をナビゲートし、それを特定することを可能にする。本明細書で参照されるように、用語「マルチメディア」は、上記に説明される少なくとも２つの異なるコンテンツ形態、例えば、テキスト、オーディオ、画像、ビデオ、または双方向コンテンツ形態を利用する、コンテンツを意味すると理解されたい。コンテンツは、ユーザ機器デバイスによって、録画、再生、表示、またはアクセスされてもよいが、また、ライブパーフォーマンスの一部であることもできる。

本明細書で議論される実施形態のいずれかを実施するためのメディアガイドアプリケーションおよび／または任意の命令は、コンピュータ可読媒体上にエンコードされてもよい。コンピュータ可読媒体は、データを記憶することが可能な任意の媒体を含む。コンピュータ可読媒体は、限定ではないが、電気または電磁信号の伝搬を含む、一過性であり得る、または限定ではないが、ハードディスク、フロッピー（登録商標）ディスク、ＵＳＢドライブ、ＤＶＤ、ＣＤ、メディアカード、レジスタメモリ、プロセッサキャッシュ、ランダムアクセスメモリ（「ＲＡＭ」）等の揮発性および不揮発性コンピュータメモリまたは記憶デバイスを含む、非一過性であり得る。

インターネット、モバイルコンピューティング、および高速無線ネットワークの出現に伴って、ユーザは、従来は使用しなかったユーザ機器デバイス上でメディアにアクセスするようになっている。本明細書で参照されるように、語句「ユーザ機器デバイス」、「ユーザ機器」、「ユーザデバイス」、「電子デバイス」、「電子機器」、「メディア機器デバイス」、または「メディアデバイス」は、テレビ、スマートＴＶ、セットトップボックス、衛星テレビに対応するための統合型受信機デコーダ（ＩＲＤ）、デジタル記憶デバイス、デジタルメディア受信機（ＤＭＲ）、デジタルメディアアダプタ（ＤＭＡ）、ストリーミングメディアデバイス、ＤＶＤプレーヤ、ＤＶＤレコーダ、接続型ＤＶＤ、ローカルメディアサーバ、ＢＬＵ−ＲＡＹ（登録商標）プレーヤ、ＢＬＵ−ＲＡＹ（登録商標）レコーダ、パーソナルコンピュータ（ＰＣ）、ラップトップコンピュータ、タブレットコンピュータ、ウェブＴＶボックス、パーソナルコンピュータテレビ（ＰＣ／ＴＶ）、ＰＣメディアサーバ、ＰＣメディアセンター、ハンドヘルドコンピュータ、固定電話、携帯情報端末（ＰＤＡ）、携帯電話、ポータブルビデオプレーヤ、ポータブル音楽プレーヤ、携帯用ゲーム機、スマートフォン、または任意の他のテレビ機器、コンピューティング機器、または無線デバイス、および／またはそれらの組み合わせ等の上記で説明されるコンテンツにアクセスするための任意のデバイスを意味すると理解されたい。いくつかの実施形態では、ユーザ機器デバイスは、正面画面および裏面画面、複数の正面画面、または複数の角度付き画面を有してもよい。いくつかの実施形態では、ユーザ機器デバイスは、正面カメラおよび／または裏面カメラを有してもよい。これらのユーザ機器デバイス上で、ユーザは、テレビを通して利用可能な同一のコンテンツ間をナビゲートし、それを特定することが可能であり得る。その結果として、メディアガイドは、これらのデバイス上でも利用可能であり得る。提供されるガイドは、テレビのみを通して利用可能なコンテンツ、他のタイプのユーザ機器デバイスのうちの１つ以上のもののみを通して利用可能なコンテンツ、またはテレビおよび他のタイプのユーザ機器デバイスのうちの１つ以上のものの両方を通して利用可能なコンテンツのためのものであってもよい。メディアガイドアプリケーションは、ユーザ機器デバイス上で、オンラインアプリケーション（すなわち、ウェブサイト上で提供される）として、または独立型アプリケーションまたはクライアントとして提供されてもよい。メディアガイドアプリケーションを実装し得る、種々のデバイスおよびプラットフォームは、下記でより詳細に説明される。

メディアガイドアプリケーションの機能のうちの１つは、メディアガイドデータをユーザに提供することである。本明細書で参照されるように、語句「メディアガイドデータ」または「ガイドデータ」は、コンテンツに関連する任意のデータまたはガイドアプリケーションを動作させる際に使用されるデータを意味すると理解されたい。例えば、ガイドデータは、番組情報、ガイドアプリケーション設定、ユーザ選好、ユーザプロファイル情報、メディア一覧、メディア関連情報（例えば、放送時間、放送チャネル、タイトル、内容、評価情報（例えば、ペアレンタルコントロール評価、批評家の評価等）、ジャンルまたはカテゴリ情報、俳優情報、放送会社またはプロバイダのロゴのロゴデータ等）、メディア形式（例えば、標準解像度、高解像度、３Ｄ等）、オンデマンド情報、ブログ、ウェブサイト、およびユーザが所望のコンテンツ選択間をナビゲートし、それを特定するために役立つ、任意の他のタイプのガイドデータを含んでもよい。

図４−５は、メディアガイドデータを提供するために使用され得る、例証的表示画面を示す。図４−５に示される表示画面は、任意の好適なユーザ機器デバイスまたはプラットフォーム上に実装されてもよい。図４−５の表示は、フル画面表示として図示されているが、それらはまた、表示されているコンテンツ上に完全または部分的にオーバーレイされてもよい。ユーザは、表示画面内に提供された選択可能なオプション（例えば、メニューオプション、一覧オプション、アイコン、ハイパーリンク等）を選択することによって、またはリモートコントロールまたは他のユーザ入力インターフェースまたはデバイス上の専用ボタン（例えば、「ガイド」ボタン）を押下することによって、コンテンツ情報にアクセスする要望を示してもよい。ユーザのインジケーションに応答して、メディアガイドアプリケーションは、グリッド内の時間およびチャネル別、時間別、チャネル別、ソース別、コンテンツタイプ別、カテゴリ別（例えば、映画、スポーツ、ニュース、子供向け、または他の番組カテゴリ）、または他の所定、ユーザ定義、または他の編成基準等のいくつかの方法のうちの１つにおいて編成されたメディアガイドデータを表示画面に提供してもよい。

図４は、単一表示内の異なるタイプのコンテンツへのアクセスも可能にする、時間およびチャネル別に配列された番組一覧表示４００の例証的グリッドを示す。表示４００は、以下、すなわち、（１）各チャネル／コンテンツタイプ識別子（列内のセル）が利用可能な異なるチャネルまたはコンテンツのタイプを識別する、チャネル／コンテンツタイプ識別子４０４の列、および（２）各時間識別子（行内のセル）が番組の時間帯を識別する、時間識別子４０６の行を伴う、グリッド４０２を含んでもよい。グリッド４０２はまた、番組一覧４０８等の番組一覧のセルも含み、各一覧は、一覧の関連チャネルおよび時間の上に提供される、番組のタイトルを提供する。ユーザ入力デバイスを用いて、ユーザは、ハイライト領域４１０を移動させることによって番組一覧を選択することができる。ハイライト領域４１０によって選択される番組一覧に関する情報が、番組情報領域４１２内に提供されてもよい。領域４１２は、例えば、番組タイトル、番組内容、番組が提供される時間（該当する場合）、番組が放送されるチャネル（該当する場合）、番組の評価、および他の所望の情報を含んでもよい。

線形番組（例えば、所定の時間に複数のユーザ機器デバイスに伝送されるようにスケジュールされ、スケジュールに従って提供されるコンテンツ）にアクセスを提供することに加えて、メディアガイドアプリケーションはまた、非線形番組（例えば、任意の時間においてユーザ機器デバイスにアクセス可能であって、スケジュールに従って提供されないコンテンツ）へのアクセスも提供する。非線形番組は、オンデマンドコンテンツ（例えば、ＶＯＤ）、インターネットコンテンツ（例えば、ストリーミングメディア、ダウンロード可能メディア等）、ローカルで記憶されたコンテンツ（例えば、上記に説明される任意のユーザ機器デバイスまたは他の記憶デバイス上に記憶されたコンテンツ）、または時間的制約のない他のコンテンツを含む、異なるコンテンツソースからのコンテンツを含んでもよい。オンデマンドコンテンツは、特定のコンテンツプロバイダ（例えば、「ＴｈｅＳｏｐｒａｎｏｓ」および「ＣｕｒｂＹｏｕｒＥｎｔｈｕｓｉａｓｍ」を提供するＨＢＯＯｎＤｅｍａｎｄ）によって提供される映画または任意の他のコンテンツを含んでもよい。ＨＢＯＯＮＤＥＭＡＮＤは、ＴｉｍｅＷａｒｎｅｒＣｏｍｐａｎｙＬ．Ｐ．ｅｔａｌ．によって所有されるサービスマークであり、ＴＨＥＳＯＰＲＡＮＯＳおよびＣＵＲＢＹＯＵＲＥＮＴＨＵＳＩＡＳＭは、ＨｏｍｅＢｏｘＯｆｆｉｃｅ，Ｉｎｃ．によって所有される商標である。インターネットコンテンツは、チャットセッションまたはウェブキャスト等のウェブイベント、またはインターネットウェブサイトまたは他のインターネットアクセス（例えば、ＦＴＰ）を通してストリーミングコンテンツまたはダウンロード可能なコンテンツとしてオンデマンドで利用可能なコンテンツを含んでもよい。

グリッド４０２は、オンデマンド一覧４１４、録画コンテンツ一覧４１６、およびインターネットコンテンツ一覧４１８を含む、非線形番組のメディアガイドデータを提供してもよい。異なるタイプのコンテンツソースからのコンテンツのためのメディアガイドデータを組み合わせる表示は、時として、「混合メディア」表示と称されることもある。表示４００とは異なる、表示され得るメディアガイドデータのタイプの種々の順列は、ユーザ選択またはガイドアプリケーション定義に基づいてもよい（例えば、録画および放送一覧のみの表示、オンデマンドおよび放送一覧のみの表示等）。例証されるように、一覧４１４、４１６、および４１８は、これらの一覧の選択が、それぞれ、オンデマンド一覧、録画一覧、またはインターネット一覧専用の表示へのアクセスを提供し得ることを示すように、グリッド４０２内に表示される時間帯全体に及ぶものとして示されている。いくつかの実施形態では、これらのコンテンツタイプの一覧は、グリッド４０２に直接含まれてもよい。ユーザがナビゲーションアイコン４２０のうちの１つを選択することに応答して、付加的メディアガイドデータが表示されてもよい（ユーザ入力デバイス上の矢印キーを押下することは、ナビゲーションアイコン４２０を選択することと同様に表示に影響を及ぼし得る）。

表示４００はまた、ビデオ領域４２２、およびオプション領域４２６を含んでもよい。ビデオ領域４２２は、ユーザが、ユーザに現在利用可能である、今後利用可能となる、または利用可能であった番組を視聴および／またはプレビューすることを可能にしてもよい。ビデオ領域４２２のコンテンツは、グリッド４０２に表示される一覧のうちの１つに対応する、またはそれから独立し得る。ビデオ領域を含むグリッド表示は、時として、ピクチャインガイド（ＰＩＧ）表示と称されることもある。ＰＩＧ表示およびそれらの機能性は、２００３年５月１３日発行のＳａｔｔｅｒｆｉｅｌｄｅｔ．ａｌ．の米国特許第６，５６４，３７８号、および２００１年５月２９日発行のＹｕｅｎｅｔ．ａｌ．の米国特許第６，２３９，７９４号（それらの全体として参照することによって本明細書に組み込まれる）でより詳細に説明されている。ＰＩＧ表示は、本明細書に説明される実施形態の他のメディアガイドアプリケーション表示画面に含まれてもよい。

オプション領域４２６は、ユーザが、異なるタイプのコンテンツ、メディアガイドアプリケーション表示、および／またはメディアガイドアプリケーション特徴にアクセスすることを可能にしてもよい。オプション領域４２６は、表示４００（および本明細書に説明される他の表示画面）の一部であってもよい、または画面上のオプションを選択すること、またはユーザ入力デバイス上の専用または割当可能ボタンを押下することによって、ユーザによって呼び出されてもよい。オプション領域４２６内の選択可能オプションは、グリッド４０２内の番組一覧に関連する特徴に関してもよい、またはメインメニュー表示から利用可能なオプションを含んでもよい。番組一覧に関連する特徴は、他の放送時間または番組の受信方法の検索、番組の録画、番組の連続録画の有効化、番組および／またはチャネルをお気に入りとして設定、番組の購入、または他の特徴を含んでもよい。メインメニュー表示から利用可能なオプションは、検索オプション、ＶＯＤオプション、ペアレンタルコントロールオプション、インターネットオプション、クラウドベースのオプション、デバイス同期オプション、第２の画面デバイスオプション、種々のタイプのメディアガイドデータ表示にアクセスするオプション、プレミアムサービスをサブスクライブするオプション、ユーザのプロファイルを編集するオプション、ブラウザオーバーレイにアクセスするオプション、または他のオプションを含んでもよい。

メディアガイドアプリケーションは、ユーザの選好に基づいて個人化されてもよい。個人化されたメディアガイドアプリケーションは、ユーザが、メディアガイドアプリケーションを用いて個人化された「体験」を生成するように、表示および特徴をカスタマイズすることを可能にする。この個人化された体験は、ユーザがこれらのカスタマイズを入力することを可能にすることによって、および／または種々のユーザ選好を決定するようにメディアガイドアプリケーションがユーザアクティビティを監視することによって、生成されてもよい。ユーザは、ログインすることによって、または別様にガイドアプリケーションに対して自らを識別することによって、それらの個人化されたガイドアプリケーションにアクセスしてもよい。メディアガイドアプリケーションのカスタマイズは、ユーザプロファイルに従って作成されてもよい。カスタマイズは、提示方式（例えば、表示の色方式、テキストのフォントサイズ等）、表示されるコンテンツ一覧の側面（例えば、ＨＤＴＶ番組のみまたは３Ｄ番組のみ、お気に入りチャネル選択に基づいたユーザ指定の放送チャネル、チャネルの表示の並び替え、推奨コンテンツ等）、所望の録画特徴（例えば、特定のユーザに対する録画または連続録画、録画品質等）、ペアレンタルコントロール設定、インターネットコンテンツのカスタマイズされた提示（例えば、ソーシャルメディアコンテンツ、電子メール、電子的に配信された記事等の提示）、および他の所望のカスタマイズを変更させるステップを含んでもよい。

メディアガイドアプリケーションは、ユーザが、ユーザプロファイル情報を提供することを可能にしてもよい、またはユーザプロファイル情報を自動的にコンパイルしてもよい。メディアガイドアプリケーションは、例えば、ユーザがアクセスするコンテンツ、および／またはユーザがガイドアプリケーションと行い得る他の相互作用を監視してもよい。加えて、メディアガイドアプリケーションは、特定のユーザに関連する他のユーザプロファイルの全体または一部を取得し（例えば、ｗｗｗ．Ｔｉｖｏ．ｃｏｍ等のユーザがアクセスするインターネット上の他のウェブサイトから、ユーザがアクセスする他のメディアガイドアプリケーションから、ユーザがアクセスする他の双方向アプリケーションから、ユーザの別のユーザ機器デバイスから等）、および／またはメディアガイドアプリケーションがアクセスし得る他のソースから、ユーザについての情報を取得してもよい。結果として、ユーザは、ユーザの異なるユーザ機器デバイスにわたって、統一されたガイドアプリケーション体験を提供することができる。本タイプのユーザ体験は、図７に関連して下記でより詳細に説明される。付加的な個人化されたメディアガイドアプリケーション特徴は、２００５年７月１１日出願のＥｌｌｉｓｅｔａｌ．の米国特許出願公開第２００５／０２５１８２７号、２００７年１月１６日発行のＢｏｙｅｒｅｔａｌ．の米国特許第７，１６５，０９８号、および２００２年２月２１日出願のＥｌｌｉｓｅｔａｌ．の米国特許出願公開第２００２／０１７４４３０号（それらの全体として参照することによって本明細書に組み込まれる）でより詳細に説明されている。

メディアガイドを提供するための別の表示配列が、図５に示されている。ビデオモザイク表示５００は、コンテンツのタイプ、ジャンル、および／または他の編成基準に基づいて編成されたコンテンツ情報のための選択可能オプション５０２を含む。表示５００では、テレビ一覧オプション５０４が、選択され、したがって、一覧５０６、５０８、５１０、および５１２を放送番組一覧として提供する。表示５００では、一覧は、カバーアート、コンテンツからの静止画像、ビデオクリップのプレビュー、コンテンツからのライブビデオ、または一覧中のメディアガイドデータによって記述されているコンテンツをユーザに示す他のタイプのコンテンツを含む、グラフィック画像を提供してもよい。グラフィック一覧はまた、それぞれ、一覧と関連付けられるコンテンツに関するさらなる情報を提供するように、テキストを伴ってもよい。例えば、一覧５０８は、メディア部分５１４およびテキスト部分５１６を含む、１つを上回る部分を含んでもよい。メディア部分５１４および／またはテキスト部分５１６は、コンテンツをフル画面で視聴するように、またはメディア部分５１４に表示されるコンテンツに関連する情報を閲覧するように（例えば、ビデオが表示されるチャネルの一覧を閲覧するように）、選択可能であり得る。

表示５００内の一覧は、異なるサイズである（すなわち、一覧５０６は、一覧５０８、５１０、および５１２より大きい）が、所望に応じて、全ての一覧が同一のサイズであってもよい。一覧は、コンテンツプロバイダの所望に応じて、またはユーザ選好に基づいて、ユーザの関心の程度を示すように、またはあるコンテンツを強調するように、異なるサイズである、またはグラフィック的に強調されてもよい。コンテンツ一覧をグラフィック的に強調するための種々のシステムおよび方法は、例えば、２００９年１１月１２日に出願されたＹａｔｅｓの米国特許出願公開第２０１０／０１５３８８５号（その全体として参照することによって本明細書に組み込まれる）で議論されている。

ユーザは、そのユーザ機器デバイスのうちの１つ以上のものから、コンテンツおよびメディアガイドアプリケーション（および上記および下記で説明されるその表示画面）にアクセスしてもよい。図６は、例証的ユーザ機器デバイス６００の一般化された実施形態を示す。ユーザ機器デバイスのより具体的な実装は、図７に関連して下記で議論される。ユーザ機器デバイス６００は、入出力（以下「Ｉ／Ｏ」）パス６０２を介して、コンテンツおよびデータを受信してもよい。Ｉ／Ｏパス６０２は、処理回路６０６および記憶装置６０８を含む制御回路６０４に、コンテンツ（例えば、放送番組、オンデマンド番組、インターネットコンテンツ、ローカルエリアネットワーク（ＬＡＮ）または広域ネットワーク（ＷＡＮ）を経由して利用可能なコンテンツ、および／または他のコンテンツ）およびデータを提供してもよい。制御回路６０４は、Ｉ／Ｏパス６０２を使用して、コマンド、要求、および他の好適なデータを送受信するために使用されてもよい。Ｉ／Ｏパス６０２は、制御回路６０４（具体的には、処理回路６０６）を１つ以上の通信パス（下記に説明される）に接続してもよい。Ｉ／Ｏ機能は、これらの通信パスのうちの１つ以上のものによって提供されてもよいが、図面が複雑になり過ぎることを回避するため、図６では単一パスとして示されている。

制御回路６０４は、処理回路６０６等の任意の好適な処理回路に基づいてもよい。本明細書で参照されるように、処理回路は、１つ以上のマイクロプロセッサ、マイクロコントローラ、デジタル信号プロセッサ、プログラマブル論理デバイス、フィールドプログラマブルゲートアレイ（ＦＰＧＡ）、特定用途向け集積回路（ＡＳＩＣ）等に基づく回路を意味すると理解され、マルチコアプロセッサ（例えば、デュアルコア、クアドコア、ヘクサコア、または任意の好適な数のコア）またはスーパーコンピュータを含んでもよい。いくつかの実施形態では、処理回路は、複数の別個のプロセッサまたは処理ユニット、例えば、複数の同一のタイプの処理ユニット（例えば、２つのＩｎｔｅｌＣｏｒｅｉ７プロセッサ）または複数の異なるプロセッサ（例えば、ＩｎｔｅｌＣｏｒｅｉ５プロセッサおよびＩｎｔｅｌＣｏｒｅｉ７プロセッサ）にわたって分散されてもよい。いくつかの実施形態では、制御回路６０４は、メモリ（すなわち、記憶装置６０８）に記憶されたメディアガイドアプリケーションに対する命令を実行する。具体的には、制御回路６０４は、メディアガイドアプリケーションによって、上記および下記で議論される機能を果たすように命令されてもよい。例えば、メディアガイドアプリケーションは、制御回路６０４に、メディアガイド表示を生成するための命令を提供してもよい。いくつかの実装では、制御回路６０４によって実施される任意のアクションは、メディアガイドアプリケーションから受信される命令に基づいてもよい。

クライアントサーバベースの実施形態では、制御回路６０４は、ガイドアプリケーションサーバまたは他のネットワークまたはサーバと通信するための好適な通信回路を含んでもよい。上記に述べられる機能性を実施するための命令は、ガイドアプリケーションサーバ上に記憶されてもよい。通信回路は、ケーブルモデム、総合デジタル通信網（ＩＳＤＮ）モデム、デジタルサブスクライバ回線（ＤＳＬ）モデム、電話モデム、イーサネット（登録商標）カード、または他の機器との通信用の無線モデム、または任意の他の好適な通信回路を含んでもよい。そのような通信は、インターネットまたは任意の他の好適な通信ネットワークまたはパスを伴ってもよい（図７に関連してより詳細に説明される）。加えて、通信回路は、ユーザ機器デバイスのピアツーピア通信、または相互から遠隔の場所にあるユーザ機器デバイスの通信を可能にする回路を含んでもよい（下記でより詳細に説明される）。

メモリは、制御回路６０４の一部である、記憶装置６０８として提供される、電子記憶デバイスであってもよい。本明細書で参照されるように、語句「電子記憶デバイス」または「記憶デバイス」とは、ランダムアクセスメモリ、読取専用メモリ、ハードドライブ、光学ドライブ、デジタルビデオディスク（ＤＶＤ）レコーダ、コンパクトディスク（ＣＤ）レコーダ、ＢＬＵ−ＲＡＹ（登録商標）ディスク（ＢＤ）レコーダ、ＢＬＵ−ＲＡＹ（登録商標）３Ｄディスクレコーダ、デジタルビデオレコーダ（ＤＶＲ、または時として、パーソナルビデオレコーダまたはＰＶＲと呼ばれる場合）、ソリッドステートデバイス、量子記憶デバイス、ゲームコンソール、ゲームメディア、または任意の他の好適な固定またはリムーバブル記憶デバイス、および／またはそれらの任意の組み合わせ等の電子データ、コンピュータソフトウェア、またはファームウェアを記憶するための任意のデバイスを意味すると理解されたい。記憶装置６０８は、本明細書に説明される種々のタイプのコンテンツ、および上記で説明されるメディアガイドデータを記憶するために使用されてもよい。不揮発性メモリもまた、（例えば、ブートアップルーチンおよび他の命令を起動するために）使用されてもよい。図７に関連して説明される、クラウドベースの記憶装置が、記憶装置６０８を補完するために使用される、または記憶装置６０８の代わりに使用されてもよい。

制御回路６０４は、１つ以上のアナログチューナ、１つ以上のＭＰＥＧ−２デコーダ、または他のデジタルデコード回路、高解像度チューナ、または任意の他の好適な同調またはビデオ回路、またはそのような回路の組み合わせ等のビデオ生成回路および同調回路を含んでもよい。（例えば、記憶するために、無線、アナログ、またはデジタル信号をＭＰＥＧ信号に変換するための）エンコード回路もまた、提供されてもよい。制御回路６０４はまた、コンテンツをユーザ機器６００の好ましい出力形式に上方変換および下方変換するためのスケーリング回路を含んでもよい。回路６０４はまた、デジタル信号とアナログ信号との間で変換するためのデジタル／アナログ変換回路およびアナログ／デジタル変換回路を含んでもよい。同調およびエンコード回路は、コンテンツを受信して表示する、再生する、または録画するために、ユーザ機器デバイスによって使用されてもよい。同調およびエンコード回路はまた、ガイドデータを受信するために使用されてもよい。例えば、同調、ビデオ生成、エンコード、デコード、暗号化、解読、スケーリング、およびアナログ／デジタル回路を含む、本明細書に説明される回路は、１つ以上の汎用または特殊プロセッサ上で起動するソフトウェアを使用して実装されてもよい。複数のチューナが、同時同調機能（例えば、視聴および録画機能、ピクチャインピクチャ（ＰＩＰ）機能、多重チューナ録画機能等）に対処するように提供されてもよい。記憶装置６０８が、ユーザ機器６００とは別のデバイスとして提供される場合、同調およびエンコード回路（複数のチューナを含む）は、記憶装置６０８と関連付けられてもよい。

ユーザは、ユーザ入力インターフェース６１０を使用して、命令を制御回路６０４に送信してもよい。ユーザ入力インターフェース６１０は、リモートコントロール、マウス、トラックボール、キーパッド、キーボード、タッチスクリーン、タッチパッド、スタイラス入力、ジョイスティック、音声認識インターフェース、または他のユーザ入力インターフェース等の任意の好適なユーザインターフェースであってもよい。ディスプレイ６１２は、独立型デバイスとして提供される、またはユーザ機器デバイス６００の他の要素と統合されてもよい。例えば、ディスプレイ６１２は、タッチスクリーンまたはタッチセンサ式ディスプレイであってもよい。そのような状況では、ユーザ入力インターフェース６１０は、ディスプレイ６１２と統合される、または組み合わせられてもよい。ディスプレイ６１２は、モニタ、テレビ、モバイルデバイス用液晶ディスプレイ（ＬＣＤ）、非晶質シリコンディスプレイ、低温ポリシリコンディスプレイ、電子インクディスプレイ、電気泳動ディスプレイ、アクティブマトリクスディスプレイ、エレクトロウェッティングディスプレイ、電気流体ディスプレイ、ブラウン管ディスプレイ、発光ダイオードディスプレイ、エレクトロルミネセントディスプレイ、プラズマディスプレイパネル、高性能アドレッシングディスプレイ、薄膜トランジスタディスプレイ、有機発光ダイオードディスプレイ、表面伝導型電子放出素子ディスプレイ（ＳＥＤ）、レーザテレビ、カーボンナノチューブ、量子ドットディスプレイ、干渉変調器ディスプレイ、または視覚的画像を表示するための任意の他の好適な機器のうちの１つ以上のものであってもよい。いくつかの実施形態では、ディスプレイ６１２は、ＨＤＴＶ対応型であり得る。いくつかの実施形態では、ディスプレイ６１２は、３Ｄディスプレイであってもよく、双方向メディアガイドアプリケーションおよび任意の好適なコンテンツは、３Ｄで表示されてもよい。ビデオカードまたはグラフィックカードは、ディスプレイ６１２への出力を生成してもよい。ビデオカードは、３Ｄシーンおよび２Ｄグラフィックのレンダリング加速、ＭＰＥＧ−２／ＭＰＥＧ−４デコード、ＴＶ出力、または複数のモニタを接続する能力等の種々の機能を提供し得る。ビデオカードは、制御回路６０４に関連する上記で説明される任意の処理回路であってもよい。ビデオカードは、制御回路６０４と統合されてもよい。スピーカ６１４は、ユーザ機器デバイス６００の他の要素と統合されたものとして提供されてもよい、または独立型ユニットであってもよい。ディスプレイ６１２上に表示されるビデオおよび他のコンテンツのオーディオコンポーネントは、スピーカ６１４を通して再生されてもよい。いくつかの実施形態では、オーディオは、スピーカ６１４を介して音声を処理および出力する、受信機（図示せず）に配布されてもよい。

ガイドアプリケーションは、任意の好適なアーキテクチャを使用して実装されてもよい。例えば、これは、ユーザ機器デバイス６００上で完全に実装される、独立型アプリケーションであってもよい。そのようなアプローチでは、アプリケーションの命令は、ローカルで（例えば、記憶装置６０８の中に）記憶され、アプリケーションによって使用するためのデータは、周期的にダウンロードされる（例えば、帯域外フィードから、インターネットリソースから、または別の好適なアプローチを使用して）。制御回路６０４は、記憶装置６０８からアプリケーションの命令を読み出し、本明細書で議論される表示のうちのいずれかを生成するための命令を処理してもよい。処理された命令に基づいて、制御回路６０４は、入力が入力インターフェース６１０から受信されるときに実施するアクションを決定してもよい。例えば、表示上のカーソルの上／下への移動は、入力インターフェース６１０が上／下ボタンが選択されたことを示すとき、処理された命令によって示されてもよい。

いくつかの実施形態では、メディアガイドアプリケーションは、クライアントサーバベースのアプリケーションである。ユーザ機器デバイス６００上に実装される、シックまたはシンクライアントによって使用するためのデータは、ユーザ機器デバイス６００の遠隔にあるサーバに要求を発行することによって、オンデマンドで読み出される。クライアントサーバベースのガイドアプリケーションの一実施例では、制御回路６０４は、遠隔サーバによって提供されるウェブページを解釈する、ウェブブラウザを起動する。例えば、遠隔サーバは、記憶デバイス内にアプリケーションのための命令を記憶してもよい。遠隔サーバは、回路（例えば、制御回路６０４）を使用して、記憶された命令を処理し、上記および下記で議論される表示を生成してもよい。クライアントデバイスは、遠隔サーバによって生成される表示を受信してもよく、表示のコンテンツを機器デバイス６００上にローカルで表示してもよい。このように、命令の処理が、サーバによって遠隔で実施される一方、結果として生じる表示は、機器デバイス６００上にローカルで提供される。機器デバイス６００は、入力インターフェース６１０を介して、ユーザからの入力を受信し、対応する表示を処理および生成するために、それらの入力を遠隔サーバに伝送してもよい。例えば、機器デバイス６００は、上／下ボタンが入力インターフェース６１０を介して選択されたことを示す通信を遠隔サーバに伝送してもよい。遠隔サーバは、その入力に従って命令を処理し、入力に対応するアプリケーションの表示を生成してもよい（例えば、カーソルを上／下に移動させる表示）。生成された表示は、次いで、ユーザへの提示のために、機器デバイス６００に伝送される。

いくつかの実施形態では、メディアガイドアプリケーションは、インタープリタまたは仮想マシン（制御回路６０４によって起動される）によって、ダウンロードされ、解釈または別様に起動される。いくつかの実施形態では、ガイドアプリケーションは、ＥＴＶバイナリ交換形式（ＥＴＶＢｉｎａｒｙＩｎｔｅｒｃｈａｎｇｅＦｏｒｍａｔ／ＥＢＩＦ）でエンコードされ、好適なフィードの一部として制御回路６０４によって受信され、制御回路６０４上で起動するユーザエージェントによって解釈されてもよい。例えば、ガイドアプリケーションは、ＥＢＩＦアプリケーションであってもよい。いくつかの実施形態では、ガイドアプリケーションは、制御回路６０４によって実行されるローカル仮想マシンまたは他の好適なミドルウェアによって受信および起動される、一連のＪＡＶＡ（登録商標）ベースのファイルによって定義されてもよい。そのような実施形態のうちのいくつか（例えば、ＭＰＥＧ−２または他のデジタルメディアエンコードスキームを採用するもの）では、ガイドアプリケーションは、例えば、番組のＭＰＥＧオーディオおよびビデオパケットを用いたＭＰＥＧ−２オブジェクトカルーセルにおいてエンコードおよび伝送されてもよい。

図６のユーザ機器デバイス６００は、ユーザテレビ機器７０２、ユーザコンピュータ機器７０４、無線ユーザ通信デバイス７０６、または非携帯用ゲーム機等のコンテンツにアクセスするために好適な任意の他のタイプのユーザ機器として、図７のシステム７００に実装されることができる。簡単にするために、これらのデバイスは、本明細書では総称して、ユーザ機器またはユーザ機器デバイスと称されてもよく、上記で説明されるユーザ機器デバイスに実質的に類似し得る。メディアガイドアプリケーションが実装され得る、ユーザ機器デバイスは、独立型デバイスとして機能してもよい、またはデバイスのネットワークの一部であってもよい。デバイスの種々のネットワーク構成が実装されてもよく、下記でより詳細に議論される。

図６に関連して上記で説明されるシステム特徴のうちの少なくともいくつかを利用する、ユーザ機器デバイスは、単に、ユーザテレビ機器７０２、ユーザコンピュータ機器７０４、または無線ユーザ通信デバイス７０６として分類されなくてもよい。例えば、ユーザテレビ機器７０２は、いくつかのユーザコンピュータ機器７０４のように、インターネットコンテンツへのアクセスを可能にするインターネット対応型であり得る一方で、ユーザコンピュータ機器７０４は、あるテレビ機器７０２のように、テレビ番組へのアクセスを可能にするチューナを含んでもよい。メディアガイドアプリケーションはまた、種々の異なるタイプのユーザ機器上で同一のレイアウトを有してもよい、またはユーザ機器の表示能力に合わせられてもよい。例えば、ユーザコンピュータ機器７０４上では、ガイドアプリケーションは、ウェブブラウザによってアクセスされるウェブサイトとして提供されてもよい。別の実施例では、ガイドアプリケーションは、無線ユーザ通信デバイス７０６用に縮小されてもよい。

システム７００では、典型的には、各タイプのユーザ機器デバイスが１つを上回って存在するが、図面が複雑になり過ぎることを回避するように、それぞれ１つだけが図７に示されている。加えて、各ユーザは、１つを上回るタイプのユーザ機器デバイスと、また、各タイプのユーザ機器デバイスのうちの１つを上回るものとを利用してもよい。

いくつかの実施形態では、ユーザ機器デバイス（例えば、ユーザテレビ機器７０２、ユーザコンピュータ機器７０４、無線ユーザ通信デバイス７０６）は、「第２の画面デバイス」と称されてもよい。例えば、第２の画面デバイスは、第１のユーザ機器デバイス上に提示されるコンテンツを補完してもよい。第２の画面デバイス上に提示されるコンテンツは、第１のデバイス上に提示されるコンテンツを補完する、任意の好適なコンテンツであってもよい。いくつかの実施形態では、第２の画面デバイスは、第１のデバイスの設定および表示選好を調節するためのインターフェースを提供する。いくつかの実施形態では、第２の画面デバイスは、他の第２の画面デバイスと相互作用する、またはソーシャルネットワークと相互作用するために構成される。第２の画面デバイスは、第１のデバイスと同一の部屋内に、第１のデバイスと異なる部屋であるが、同一の家または建物内に、または第１のデバイスと異なる建物内に位置することができる。

ユーザはまた、家庭内デバイスおよび遠隔デバイスにわたって一貫したメディアガイドアプリケーション設定を維持するように、種々の設定を設定してもよい。設定は、本明細書に説明されるもの、およびお気に入りのチャネルおよび番組、番組を推奨するためにガイドアプリケーションが利用する番組選好、表示選好、および他の望ましいガイド設定を含む。例えば、ユーザが、そのオフィスのパーソナルコンピュータ上で、例えば、ウェブサイトｗｗｗ．Ｔｉｖｏ．ｃｏｍの上で、チャネルをお気に入りとして設定した場合、同一のチャネルが、ユーザの家庭内デバイス（例えば、ユーザテレビ機器およびユーザコンピュータ機器）上で、および所望に応じて、ユーザのモバイルデバイス上でお気に入りとして表示されるであろう。したがって、同一または異なるタイプのユーザ機器デバイスであるかどうかにかかわらず、１つのユーザ機器デバイス上で行われる変更は、別のユーザ機器デバイス上のガイド体験を変更することができる。加えて、行われる変更は、ユーザによって入力される設定、およびガイドアプリケーションによって監視されるユーザアクティビティに基づいてもよい。

ユーザ機器デバイスは、通信ネットワーク７１４に結合されてもよい。すなわち、ユーザテレビ機器７０２、ユーザコンピュータ機器７０４、および無線ユーザ通信デバイス７０６は、それぞれ、通信パス７０８、７１０、および７１２を介して、通信ネットワーク７１４に結合される。通信ネットワーク７１４は、インターネット、携帯電話ネットワーク、モバイルボイスまたはデータネットワーク（例えば、４ＧまたはＬＴＥネットワーク）、ケーブルネットワーク、公衆交換電話ネットワーク、または他のタイプの通信ネットワーク、または通信ネットワークの組み合わせを含む、１つ以上のネットワークであってもよい。パス７０８、７１０、および７１２は、別個または一緒に、衛星パス、光ファイバパス、ケーブルパス、インターネット通信をサポートするパス（例えば、ＩＰＴＶ）、フリースペース接続（例えば、放送または他の無線信号用）、または任意の他の好適な有線または無線通信パス、またはそのようなパスの組み合わせ等の１つ以上の通信パスを含んでもよい。パス７１２は、図７に示される例示的実施形態では、無線パスであることを示すように破線で描かれ、パス７０８および７１０は、有線パスであることを示すように実線として描かれている（しかし、これらのパスは、所望に応じて、無線パスであってもよい）。ユーザ機器デバイスとの通信は、これらの通信パスのうちの１つ以上のものによって提供されてもよいが、図７では、図面が複雑になり過ぎることを回避するように、単一パスとして示されている。

通信パスは、ユーザ機器デバイスの間には描かれていないが、これらのデバイスは、パス７０８、７１０、および７１２に関連して上記で説明されるもの、およびＵＳＢケーブル、ＩＥＥＥ１３９４ケーブル、無線パス（例えば、Ｂｌｕｅｔｏｏｔｈ（登録商標）、赤外線、ＩＥＥＥ８０２−１１ｘ等）等の他の短距離ポイントツーポイント通信パス、または有線または無線パスを介した他の短距離通信等の通信パスを介して、相互に直接通信してもよい。ＢＬＵＥＴＯＯＴＨ（登録商標）は、ＢｌｕｅｔｏｏｔｈＳＩＧ，ＩＮＣ．によって所有される認証マークである。ユーザ機器デバイスはまた、通信ネットワーク７１４を介した間接パスを通して、相互に直接通信してもよい。

システム７００は、それぞれ、通信パス７２０および７２２を介して、通信ネットワーク７１４に結合される、コンテンツソース７１６およびメディアガイドデータソース７１８を含む。パス７２０および７２２は、パス７０８、７１０、および７１２に関連して上記で説明される通信パスのうちのいずれかを含んでもよい。コンテンツソース７１６およびメディアガイドデータソース７１８との通信は、１つ以上の通信パスを介して交信されてもよいが、図７では、図面が複雑になり過ぎることを回避するように、単一パスとして示される。加えて、コンテンツソース７１６およびメディアガイドデータソース７１８のそれぞれが１つを上回って存在し得るが、図７では、図面が複雑になり過ぎることを回避するように、それぞれ１つだけが示されている。（異なるタイプのこれらのソースのそれぞれが下記で議論される。）所望に応じて、コンテンツソース７１６およびメディアガイドデータソース７１８は、１つのソースデバイスとして統合されてもよい。ソース７１６および７１８と、ユーザ機器デバイス７０２、７０４、および７０６との間の通信は、通信ネットワーク７１４を通したものとして示されるが、いくつかの実施形態では、ソース７１６および７１８は、パス７０８、７１０、および７１２に関連して上記で説明されるもの等の通信パス（図示せず）を介して、ユーザ機器デバイス７０２、７０４、および７０６と直接通信してもよい。

システム７００はまた、通信パス７２６を経由して通信ネットワーク７１４に結合される、広告ソース７２４を含んでもよい。パス７２６は、パス７０８、７１０、および７１２に関連して上記に説明される通信パスのうちのいずれかを含んでもよい。広告ソース７２４は、具体的ユーザに伝送する広告および条件を決定するための広告論理を含んでもよい。例えば、ケーブルオペレータは、具体的チャネル上の具体的タイムスロット中に広告を挿入する権利を有し得る。したがって、広告ソース７２４は、これらのタイムスロット中に広告をユーザに伝送してもよい。別の実施例として、広告ソースは、特定の番組を視聴することが公知であるユーザの人口統計（例えば、リアリティ番組を視聴する１０代の若者）に基づいて、広告を標的化してもよい。さらに別の実施例として、広告ソースは、メディアアセットを視聴するユーザ機器の場所（例えば、東海岸または西海岸）に応じて、異なる広告を提供してもよい。

いくつかの実施形態では、広告ソース７２４は、標的広告を提供するために、ユーザと関連付けられる広告適合性スコアを含む、ユーザ情報を維持するように構成されてもよい。加えて、または代替として、広告ソース７２４と関連付けられるサーバは、広告適合性スコアを導出するために使用され得る、未加工情報を記憶するように構成されてもよい。いくつかの実施形態では、広告ソース７２４は、未加工情報に関して要求を別のデバイスに伝送し、広告適合性スコアを計算してもよい。広告ソース７２４は、具体的ユーザ（例えば、ユーザの第１のサブセット、第２のサブセット、または第３のサブセット）に関して広告適合性スコアを更新し、標的製品の広告を適切なユーザに伝送してもよい。

コンテンツソース７１６は、テレビ配信施設、ケーブルシステムヘッドエンド、衛星配信施設、番組ソース（例えば、ＮＢＣ、ＡＢＣ、ＨＢＯ等のテレビ放送会社）、中間配信施設および／またはサーバ、インターネットプロバイダ、オンデマンドメディアサーバ、および他のコンテンツプロバイダを含む、１つ以上のタイプのコンテンツ配信機器を含んでもよい。ＮＢＣは、ＮａｔｉｏｎａｌＢｒｏａｄｃａｓｔｉｎｇＣｏｍｐａｎｙ，Ｉｎｃ．によって所有される商標であり、ＡＢＣは、ＡｍｅｒｉｃａｎＢｒｏａｄｃａｓｔｉｎｇＣｏｍｐａｎｙ，ＩＮＣ．によって所有される商標であり、ＨＢＯは、ＨｏｍｅＢｏｘＯｆｆｉｃｅ，Ｉｎｃ．によって所有される商標である。コンテンツソース７１６は、コンテンツの発信元であってもよい（例えば、テレビ放送会社、ウェブキャストプロバイダ等）、またはコンテンツの発信元でなくてもよい（例えば、オンデマンドコンテンツプロバイダ、ダウンロード用放送番組のコンテンツのインターネットプロバイダ等）。コンテンツソース７１６は、ケーブルソース、衛星プロバイダ、オンデマンドプロバイダ、インターネットプロバイダ、オーバーザトップコンテンツプロバイダ、または他のコンテンツのプロバイダを含んでもよい。コンテンツソース７１６はまた、ユーザ機器デバイスのうちのいずれかから遠隔の場所にある、異なるタイプのコンテンツ（ユーザによって選択されるビデオコンテンツを含む）を記憶するために使用される、遠隔メディアサーバを含んでもよい。コンテンツの遠隔記憶のため、および遠隔に記憶されたコンテンツをユーザ機器に提供するためのシステムおよび方法は、２０１０年７月２０日発行のＥｌｌｉｓｅｔａｌ．の米国特許第７，７６１，８９２号（その全体として参照することによって本明細書に組み込まれる）に関連して、より詳細に議論されている。

メディアガイドデータソース７１８は、上記で説明されるメディアガイドデータ等のメディアガイドデータを提供してもよい。メディアガイドデータは、任意の好適なアプローチを使用して、ユーザ機器デバイスに提供されてもよい。いくつかの実施形態では、ガイドアプリケーションは、データフィード（例えば、継続フィードまたはトリクルフィード）を介して、番組ガイドデータを受信する、独立型双方向テレビ番組ガイドであってもよい。番組スケジュールデータおよび他のガイドデータは、テレビチャネルのサイドバンド上で、帯域内デジタル信号を使用して、帯域外デジタル信号を使用して、または任意の他の好適なデータ伝送技術によって、ユーザ機器に提供されてもよい。番組スケジュールデータおよび他のメディアガイドデータは、複数のアナログまたはデジタルテレビチャネル上でユーザ機器に提供されてもよい。

いくつかの実施形態では、メディアガイドデータソース７１８からのガイドデータは、クライアントサーバアプローチを使用して、ユーザの機器に提供されてもよい。例えば、ユーザ機器デバイスは、メディアガイドデータをサーバからプルしてもよい、またはサーバは、メディアガイドデータをユーザ機器デバイスにプッシュしてもよい。いくつかの実施形態では、ユーザの機器上に常駐するガイドアプリケーションクライアントは、必要に応じて、例えば、ガイドデータが、古くなっているとき、またはユーザ機器デバイスが、データを受信する要求をユーザから受信するとき、ソース７１８とセッションを開始し、ガイドデータを取得してもよい。メディアガイドは、任意の好適な頻度で（例えば、継続的に、毎日、ユーザ規定期間で、システム規定期間で、ユーザ機器からの要求に応答して等）ユーザ機器に提供されてもよい。メディアガイドデータソース７１８は、ユーザ機器デバイス７０２、７０４、および７０６に、メディアガイドアプリケーション自体、またはメディアガイドアプリケーションのソフトウェア更新を提供してもよい。

いくつかの実施形態では、メディアガイドデータは、視聴者データを含んでもよい。例えば、視聴者データは、現在および／または履歴ユーザアクティビティ情報（例えば、ユーザが典型的に鑑賞するコンテンツ、ユーザがコンテンツを鑑賞する時刻、ユーザがソーシャルネットワークと相互作用するかどうか、ユーザがソーシャルネットワークと相互作用し、情報をポストする時間、ユーザが典型的に鑑賞するコンテンツのタイプ（例えば、有料ＴＶまたは無料ＴＶ）、気分、脳の活動情報等）を含んでもよい。メディアガイドデータはまた、サブスクリプションデータを含んでもよい。例えば、サブスクリプションデータは、所与のユーザがサブスクライブするソースまたはサービス、および／または所与のユーザが以前にサブスクライブしていたが後にアクセスを打ち切ったソースまたはサービス（例えば、ユーザがプレミアムチャネルをサブスクライブしているかどうか、ユーザがプレミアムレベルのサービスを追加したかどうか、ユーザがインターネット速度を加速させたかどうか）を識別してもよい。いくつかの実施形態では、視聴者データおよび／またはサブスクリプションデータは、１年を上回る周期の間の所与のユーザのパターンを識別してもよい。メディアガイドデータは、所与のユーザがサービス／ソースへのアクセスを打ち切るであろう可能性を示すスコアを生成するために使用される、モデル（例えば、残存者モデル）を含んでもよい。例えば、メディアガイドアプリケーションは、所与のユーザが特定のサービスまたはソースへのアクセスを打ち切るであろうかどうかの可能性を示す、値またはスコアを生成するためのモデルを併用して、サブスクリプションデータとともに視聴者データを処理してもよい。特に、より高いスコアは、ユーザが特定のサービスまたはソースへのアクセスを打ち切るであろう、より高いレベルの信頼性を示し得る。スコアに基づいて、メディアガイドアプリケーションは、ユーザがアクセスを打ち切る可能性が高いであろうものとしてスコアによって示される特定のサービスまたはソースをユーザが維持するように勧誘する宣伝を生成してもよい。

メディアガイドアプリケーションは、例えば、ユーザ機器デバイス上に実装される独立型アプリケーションであってもよい。例えば、メディアガイドアプリケーションは、記憶装置６０８内に記憶され、ユーザ機器デバイス６００の制御回路６０４によって実行され得る、ソフトウェアまたは実行可能命令のセットとして実装されてもよい。いくつかの実施形態では、メディアガイドアプリケーションは、クライアント−サーバアプリケーションであってもよく、その場合、クライアントアプリケーションのみが、ユーザ機器デバイス上に常駐し、サーバアプリケーションは、遠隔サーバ上に常駐する。例えば、メディアガイドアプリケーションは、部分的にユーザ機器デバイス６００の制御回路６０４上のクライアントアプリケーションとして、および遠隔サーバの制御回路上で起動するサーバアプリケーション（例えば、メディアガイドデータソース７１８）として部分的に遠隔サーバ上で、実装されてもよい。遠隔サーバの制御回路（メディアガイドデータソース７１８等）によって実行されると、メディアガイドアプリケーションは、制御回路に、ガイドアプリケーション表示を生成し、生成された表示をユーザ機器デバイスに伝送するように命令してもよい。サーバアプリケーションは、メディアガイドデータソース７１８の制御回路に、ユーザ機器上での記憶のためのデータを伝送するように命令してもよい。クライアントアプリケーションは、受信用ユーザ機器の制御回路に、ガイドアプリケーション表示を生成するように命令してもよい。

ユーザ機器デバイス７０２、７０４、および７０６に配信されるコンテンツおよび／またはメディアガイドデータは、オーバーザトップ（ＯＴＴ）コンテンツであってもよい。ＯＴＴコンテンツ配信は、上記で説明される任意のユーザ機器デバイスを含む、インターネット対応型ユーザデバイスが、ケーブルまたは衛星接続を経由して受信されるコンテンツに加えて、上記で説明される任意のコンテンツを含む、インターネットを経由して転送されるコンテンツを受信することを可能にする。ＯＴＴコンテンツは、インターネットサービスプロバイダ（ＩＳＰ）によって提供されるインターネット接続を介して配布されるが、第三者も、コンテンツを配布する。ＩＳＰは、視聴能力、著作権、またはコンテンツの再配布に責任がない場合があり、ＯＴＴコンテンツプロバイダによって提供されるＩＰパケットのみを転送してもよい。ＯＴＴコンテンツプロバイダの実施例は、ＩＰパケットを介して、オーディオおよびビデオを提供する、ＹＯＵＴＵＢＥ（登録商標）^（Ｒ）、ＮＥＴＦＬＩＸ^（Ｒ）およびＨＵＬＵ^（Ｒ）を含む。Ｙｏｕｔｕｂｅ（登録商標）は、ＧｏｏｇｌｅＩｎｃ．によって所有される商標であり、Ｎｅｔｆｌｉｘは、Ｎｅｔｆｌｉｘ，Ｉｎｃ．によって所有される商標であり、Ｈｕｌｕは、Ｈｕｌｕ，ＬＬＣ．によって所有される商標である。ＯＴＴコンテンツプロバイダは、加えて、または代替として、上記で説明されるメディアガイドデータを提供してもよい。コンテンツおよび／またはメディアガイドデータに加えて、ＯＴＴコンテンツのプロバイダは、メディアガイドアプリケーション（例えば、ウェブベースのアプリケーションまたはクラウドベースのアプリケーション）を配布することができる、またはコンテンツは、ユーザ機器デバイス上に記憶されたメディアガイドアプリケーションによって表示されることができる。

メディアガイドシステム７００は、いくつかのアプローチまたはネットワーク構成を例証することを意図しており、これによって、ユーザ機器デバイスおよびコンテンツおよびガイドデータのソースは、コンテンツにアクセスし、メディアガイドを提供する目的のために、相互に通信してもよい。本明細書に説明される実施形態は、これらのアプローチのうちのいずれか１つまたは一部において、またはコンテンツを配信し、メディアガイドを提供するための他のアプローチを採用するシステムにおいて、適用されてもよい。以下の４つのアプローチは、図７の一般化された実施例の具体的例証を提供する。

あるアプローチでは、ユーザ機器デバイスは、ホームネットワーク内で相互に通信してもよい。ユーザ機器デバイスは、上記で説明される短距離ポイントツーポイント通信方式を介して、ホームネットワーク上に提供されるハブまたは他の類似デバイスを通した間接パスを介して、または通信ネットワーク７１４を介して、相互に直接通信することができる。１つの家庭内の複数の個人のそれぞれが、ホームネットワーク上の異なるユーザ機器デバイスを動作させてもよい。結果として、種々のメディアガイド情報または設定が、異なるユーザ機器デバイスの間で通信されることが望ましくあり得る。例えば、２００５年７月１１日出願のＥｌｌｉｓｅｔａｌ．の米国特許公開第２００５／０２５１８２７号でより詳細に説明されるように、ホームネットワーク内の異なるユーザ機器デバイス上で、ユーザが一貫したメディアガイドアプリケーション設定を維持することが望ましくあり得る。ホームネットワーク内の異なるタイプのユーザ機器デバイスもまた、相互に通信し、コンテンツを伝送してもよい。例えば、ユーザは、ユーザコンピュータ機器から携帯用ビデオプレーヤまたは携帯用音楽プレーヤにコンテンツを伝送してもよい。

第２のアプローチでは、ユーザは、複数のタイプのユーザ機器を有してもよく、これによって、コンテンツにアクセスし、メディアガイドを取得する。例えば、一部のユーザは、家庭内およびモバイルデバイスによってアクセスされる、ホームネットワークを有してもよい。ユーザは、遠隔デバイス上に実装されるメディアガイドアプリケーションを介して、家庭内デバイスを制御してもよい。例えば、ユーザは、そのオフィスのパーソナルコンピュータ、またはＰＤＡまたはウェブ対応携帯電話等のモバイルデバイスを介して、ウェブサイト上のオンラインメディアガイドアプリケーションにアクセスしてもよい。ユーザは、オンラインガイドアプリケーション上で種々の設定（例えば、録画、リマインダ、または他の設定）を設定して、ユーザの家庭内機器を制御してもよい。オンラインガイドは、直接、またはユーザの家庭内機器上のメディアガイドアプリケーションと通信することによって、ユーザの機器を制御してもよい。ユーザ機器デバイスが相互から遠隔の場所にある、ユーザ機器デバイスの通信のための種々のシステムおよび方法は、例えば、Ｅｌｌｉｓｅｔａｌ．の２０１１年１０月２５日発行の米国特許第８，０４６，８０１号（その全体として参照することによって本明細書に組み込まれる）で議論されている。

第３のアプローチでは、家庭内外のユーザ機器デバイスのユーザは、コンテンツソース７１６と直接通信し、コンテンツにアクセスするために、そのメディアガイドアプリケーションを使用することができる。具体的には、家庭内では、ユーザテレビ機器７０２およびユーザコンピュータ機器７０４のユーザは、メディアガイドアプリケーションにアクセスし、所望のコンテンツ間をナビゲートし、それを特定してもよい。ユーザはまた、無線ユーザ通信デバイス７０６を使用して、家庭外のメディアガイドアプリケーションにアクセスし、所望のコンテンツ間をナビゲートし、それを特定してもよい。

第４のアプローチでは、ユーザ機器デバイスは、クラウドコンピューティング環境内で動作し、クラウドサービスにアクセスしてもよい。クラウドコンピューティング環境では、コンテンツ共有、記憶、または配布のための種々のタイプのコンピューティングサービス（例えば、ビデオ共有サイトまたはソーシャルネットワーキングサイト）が、「クラウド」と称される、ネットワークアクセス可能コンピューティングおよび記憶リソースの集合によって提供される。例えば、クラウドは、通信ネットワーク７１４を介したインターネット等のネットワークを介して接続される、種々のタイプのユーザおよびデバイスにクラウドベースのサービスを提供する、中央にまたは分散場所に位置し得る、サーバコンピューティングデバイスの集合を含むことができる。これらのクラウドリソースは、１つ以上のコンテンツソース７１６および１つ以上のメディアガイドデータソース７１８を含んでもよい。加えて、または代替として、遠隔コンピューティングサイトは、ユーザテレビ機器７０２、ユーザコンピュータ機器７０４、および無線ユーザ通信デバイス７０６等の他のユーザ機器デバイスを含んでもよい。例えば、他のユーザ機器デバイスは、ビデオの記憶されたコピーまたはストリーミングされたビデオへのアクセスを提供してもよい。そのような実施形態では、ユーザ機器デバイスは、中央サーバと通信することなく、ピアツーピア様式で動作してもよい。

クラウドは、ユーザ機器デバイスのために、他の実施例の中でもとりわけ、コンテンツ記憶、コンテンツ共有、またはソーシャルネットワーキングサービス等のサービスへのアクセス、および上記で説明される任意のコンテンツへのアクセスを提供する。サービスは、クラウドコンピューティングサービスプロバイダを通して、またはオンラインサービスの他のプロバイダを通して、クラウド内で提供されることができる。例えば、クラウドベースのサービスは、コンテンツ記憶サービス、コンテンツ共有サイト、ソーシャルネットワーキングサイト、または他のサービスを含むことができ、それを介して、ユーザ供給コンテンツは、接続されたデバイス上で他者によって視聴するために配布される。これらのクラウドベースのサービスは、ユーザ機器デバイスが、コンテンツをローカルで記憶し、ローカルで記憶されたコンテンツにアクセスするのではなく、コンテンツをクラウドに記憶し、コンテンツをクラウドから受信することを可能にしてもよい。

ユーザは、カムコーダ、ビデオモード付きデジタルカメラ、オーディオレコーダ、携帯電話、およびハンドヘルドコンピューティングデバイス等の種々のコンテンツ捕捉デバイスを使用して、コンテンツを録画してもよい。ユーザは、直接、例えば、ユーザコンピュータ機器７０４から、またはコンテンツ捕捉特徴を有する無線ユーザ通信デバイス７０６からのいずれかにおいて、クラウド上のコンテンツ記憶サービスにコンテンツをアップロードすることができる。代替として、ユーザは、最初に、コンテンツをユーザコンピュータ機器７０４等のユーザ機器デバイスに転送することができる。コンテンツを記憶するユーザ機器デバイスは、通信ネットワーク７１４上のデータ伝送サービスを使用して、コンテンツをクラウドにアップロードする。いくつかの実施形態では、ユーザ機器デバイス自体が、クラウドリソースであり、他のユーザ機器デバイスは、直接、ユーザがコンテンツを記憶したユーザ機器デバイスから、コンテンツにアクセスすることができる。

クラウドリソースは、例えば、ウェブブラウザ、メディアガイドアプリケーション、デスクトップアプリケーション、モバイルアプリケーション、および／またはそれらのアクセスアプリケーションの任意の組み合わせを使用して、ユーザ機器デバイスによってアクセスされてもよい。ユーザ機器デバイスは、アプリケーション配信のためにクラウドコンピューティングに依拠する、クラウドクライアントであってもよい、またはユーザ機器デバイスは、クラウドリソースにアクセスすることなく、ある機能性を有してもよい。例えば、ユーザ機器デバイス上で起動するいくつかのアプリケーションは、クラウドアプリケーション、すなわち、インターネットを経由してサービスとして配信されるアプリケーションであってもよい一方で、他のアプリケーションは、ユーザ機器デバイス上に記憶され、起動されてもよい。いくつかの実施形態では、ユーザデバイスは、コンテンツを複数のクラウドリソースから同時に受信してもよい。例えば、ユーザデバイスは、オーディオを１つのクラウドリソースからストリーミングする一方で、コンテンツを第２のクラウドリソースからダウンロードすることができる。または、ユーザデバイスは、より効率的なダウンロードのために、コンテンツを複数のクラウドリソースからダウンロードすることができる。いくつかの実施形態では、ユーザ機器デバイスは、図６に関連して説明される処理回路によって実施される処理動作等の処理動作のために、クラウドリソースを使用することができる。

本明細書で参照されるように、用語「〜に応答して」は、「〜の結果として開始される」ことを指す。例えば、第２のアクションに応答して実施されている第１のアクションは、第１のアクションと第２のアクションとの間に介在ステップを含んでもよい。本明細書で参照されるように、用語「〜に直接応答して」は、「〜によって引き起こされる」ことを指す。例えば、第２のアクションに直接応答して実施されている第１のアクションは、第１のアクションと第２のアクションとの間に介在ステップを含まなくてもよい。

図８は、本開示のいくつかの実施形態による、ユーザ音声コマンドの音量レベルに基づく音量レベルにおいて、音声動作型ユーザデバイスを通して可聴応答を生成するための例証的ステップのフローチャートである。例えば、メディアガイドアプリケーションは、プロセス８００の要素を実行するように制御回路６０４に命令してもよい。

プロセス８００は、メディアガイドアプリケーションがユーザによって話される音声コマンドを（例えば、制御回路６０４を介して）検出する、８０２から開始する。メディアガイドアプリケーションは、複数の音声動作型ユーザデバイスのうちの第１の音声動作型ユーザデバイスを通して、音声コマンドを検出してもよい。例えば、メディアガイドアプリケーションは、図１に関する音声動作型ユーザデバイス１０２を通してユーザ１１０からの音声コマンド１０６を検出するステップに関して上記に説明されるものと同様に、音声動作型ユーザデバイスＡを通して、ユーザが現在鑑賞している映画を参照して、「最後の台詞を繰り返して」と発するユーザからの音声コマンドを検出してもよい。

プロセス８００は、メディアガイドアプリケーションが音声コマンドの第１の音量レベルを（例えば、制御回路６０４を介して）決定する、８０４に続く。本音声コマンドは、例えば、音声動作型ユーザデバイスによって受信される。例えば、第１の音量レベルは、図１に関する音声動作型ユーザデバイス１０２における音声コマンド１０６の音量レベルを検出するステップに関して上記に説明されるものと同様に、音声動作型ユーザデバイスにおいて検出される音声コマンドの入力音量の平均であってもよい。

プロセス８００は、メディアガイドアプリケーションが複数の音量レベルを（例えば、制御回路６０４を介して）受信する、８０８に続く。例えば、いくつかの音声動作型ユーザデバイスは、ユーザからの音声コマンドを検出してもよい。これらのデバイスはそれぞれ、例えば、ユーザへの近接性に応じて、異なる音量レベルにおいて音声コマンドを受信し得る。したがって、複数の音声動作型ユーザデバイスのうちの各音声動作型ユーザデバイスは、音声コマンドの複数の音量レベルのうちの音量レベルと関連付けられるであろう。メディアガイドアプリケーションは、複数の音量レベルのうちの各音量レベルを複数の音声動作型ユーザデバイスのうちの個別の音声動作型ユーザデバイスと関連付ける、少なくとも１つのデータ構造を受信してもよい。例えば、メディアガイドアプリケーションは、複数の音声動作型ユーザデバイスのうちの各音声動作型ユーザデバイスから、音量レベルおよび個別の音声動作型ユーザデバイスの音声動作型ユーザデバイス識別子を含有する、データ構造を（例えば、制御回路６０４を介して）受信してもよい。例えば、メディアガイドアプリケーションは、第２の音声動作型ユーザデバイスから、５２ｄｂの音量レベルおよびデバイス識別子デバイスＢを含有する、データ構造を（例えば、制御回路６０４を介して）受信してもよい。例えば、メディアガイドアプリケーションは、第３の音声動作型ユーザデバイスから、５０ｄｂの音量レベルおよびデバイス識別子デバイスＣを含有する、データ構造を（例えば、制御回路６０４を介して）受信してもよい。

プロセス８００は、メディアガイドアプリケーションが複数の音量レベルのうちの最大音量レベルを（例えば、制御回路６０４を介して）決定する、８１０に続く。いくつかの実施形態では、メディアガイドアプリケーションは、第１の音量レベルを複数の音量レベルと比較してもよい。例えば、メディアガイドアプリケーションは、デバイスＡと関連付けられる４８ｄＢを、デバイスＢと関連付けられる５２ｄＢと、デバイスＣと関連付けられる５０ｄＢと比較してもよい。いくつかの実施形態では、メディアガイドアプリケーションは、第１の音量レベルを複数の音量レベルと比較するステップに基づいて、複数の音量レベルのうちの最大音量レベルを（例えば、制御回路６０４を介して）決定してもよい。例えば、複数の音声動作型ユーザデバイスのうちのいずれかによって受信される最大音量レベルは、５２ｄＢであってもよい。複数の音量レベルのうちの最大音量レベルは、複数の音声動作型ユーザデバイスによって受信される音量レベルのうちの最大である。

プロセス８００は、メディアガイドアプリケーションが最大音量レベルと関連付けられる第２の音声動作型デバイスを（例えば、制御回路６０４を介して）決定する、８１２に続く。いくつかの実施形態では、メディアガイドアプリケーションは、最大音量レベルと関連付けられる第２の音声動作型ユーザデバイスに関して、少なくとも１つのデータ構造を（例えば、制御回路６０４を介して）検索してもよい。最大音量と関連付けられるユーザデバイスは、デバイスがユーザに近いほど、そのユーザからの音声コマンドがデバイスに大きく聞こえるであろうため、音声コマンドを発行したユーザに最近傍のデバイスであろう。例えば、最大音量レベルが５２ｄＢである場合、メディアガイドアプリケーションは、データ構造を検索し、５２ｄＢ音量レベルと関連付けられる音声動作型ユーザデバイスを見出してもよい。データ構造では、５２ｄＢ音量レベルは、第２の音声動作型ユーザデバイスを表す、デバイス識別子デバイスＢと関連付けられてもよい。デバイスＢは、本実施例では、ユーザに最近傍の音声動作型ユーザデバイスである。

プロセス８００は、メディアガイドアプリケーションがコマンドを第２の音声動作型ユーザデバイスに（例えば、通信ネットワーク７１４を介して）伝送し、コマンドが、応答音量レベルを第２の音量レベルに更新するように第２の音声動作型ユーザデバイスに命令し、第２の音量レベルが、最大音量レベルに基づく、８１４に続く。いくつかの実施形態では、メディアガイドアプリケーションは、コマンドを第２の音声動作型ユーザデバイスに伝送してもよい。コマンドは、応答レベルを、最大音量レベルに基づく第２の音量レベルに更新するように、第２の音声動作型ユーザデバイスに（例えば、通信ネットワーク７１４を介して）命令してもよい。例えば、メディアガイドアプリケーションは、応答レベルを音量レベル５２ｄＢに変更するように、デバイスＢとして識別される第２の音声動作型ユーザデバイスに命令してもよい。例えば、メディアガイドアプリケーションは、代わりに、応答レベルを、最大音量レベルよりもわずかに大きい５３ｄＢに変更するように、デバイスＢとして識別される第２の音声動作型ユーザデバイスに（例えば、通信ネットワーク７１４を介して）命令してもよい。メディアガイドアプリケーションは、最大音量レベルをわずかに増加させ、このようにして第２の音量を決定し、周囲雑音を考慮してもよい。

プロセス８００は、メディアガイドアプリケーションが、第２の音声動作型ユーザデバイスを通して、第２の音量レベルにおいて可聴応答を（例えば、制御回路６０４を介して）生成する、８１６に続く。いくつかの実施形態では、メディアガイドアプリケーションは、音声コマンドへの可聴応答を生成してもよい。可聴応答は、第２の音声動作型ユーザデバイスを通して、第２の音量レベルにおいて生成されてもよい。例えば、デバイスＢとして識別される第２の音声動作型ユーザデバイスは、音量レベル５３ｄＢにおいて、ユーザが現在鑑賞している映画の最後の台詞（例えば、「ＭａｙｔｈｅＦｏｒｃｅｂｅｗｉｔｈｙｏｕ」）を繰り返してもよい。いくつかの実施形態では、第１および第２の音声動作型ユーザデバイスは、同一のデバイスであってもよく、第１の音量レベルおよび第２の音量は、同一の音量レベルであってもよい。

プロセス９００は、メディアガイドアプリケーションが、可聴応答が生成されたときに対応する第１の時間を（例えば、制御回路６０４を介して）決定する、９０２から開始する。例えば、可聴応答が生成されるとき、メディアガイドアプリケーションは、タイムスタンプをデータ構造に（例えば、記憶装置６０８の中に）（例えば、制御回路６０４を介して）保存してもよい。例えば、可聴応答は、午後３時１２分３秒に生成されている場合がある。

プロセス９００は、メディアガイドアプリケーションが（例えば、制御回路６０４を介して）時間周期を第１の時間に加算し、第２の時間を計算する、９０４に続く。例えば、時間周期は、２０秒であってもよい。第１の時間が午後３時１２分３秒である場合には、第２の時間は、午後３時１２分２３秒であってもよい。本時間周期は、ユーザの音声コマンドに再び応答する前に、メディアガイドアプリケーションが待機する長さを表す。

プロセス９００は、メディアガイドアプリケーションが、確認応答が第２の時間の前に受信されたかどうかを（例えば、制御回路６０４を介して）決定する、９０６に続く。確認応答は、可聴応答がユーザによって聞かれたことを示す。例えば、デバイスＢ等の第２の音声動作型ユーザデバイスからの可聴応答は、「ＭａｙｔｈｅＦｏｒｃｅｂｅｗｉｔｈｙｏｕ」であってもよい。ユーザは、「ありがとう、デバイスＢ」と発することによって、本応答を確認してもよい。

メディアガイドアプリケーションが、確認応答が第２の時間の前に受信されたことを決定する場合、プロセス９００は、プロセス９００が終了する、９０８に続く。メディアガイドアプリケーションが、確認応答が第２の時間の前に受信されなかったことを（例えば、制御回路６０４を介して）決定する場合、プロセス９００は、メディアガイドアプリケーションが第２の可聴応答を生成し得る、９１０に続く。例えば、第２の可聴応答は、可聴応答と同一であり得、その場合、第２のユーザは、単純に、同一または異なる音量レベルにおいてユーザへの可聴応答を繰り返す。第２の可聴応答はまた、例えば、応答するようにユーザを促してもよい。例えば、デバイスＢが午後３時１２分２３秒までに確認応答を受信していない場合、メディアガイドアプリケーションは、デバイスＢを通して、「「ＭａｙｔｈｅＦｏｒｃｅｂｅｗｉｔｈｙｏｕ」が聞こえましたか？」を尋ねる第２の可聴応答を生成してもよい。

プロセス１０００は、メディアガイドアプリケーションが、可聴応答が生成されたときに対応する第１の時間を（例えば、制御回路６０４を介して）決定する、１００２から開始する。例えば、可聴応答が生成されるとき、メディアガイドアプリケーションは、タイムスタンプをデータ構造に（例えば、記憶装置６０８の中に）（例えば、制御回路６０４を介して）保存してもよい。例えば、可聴応答は、午後３時１２分３秒に生成されている場合がある。

プロセス１０００は、メディアガイドアプリケーションが、ユーザプロファイルを使用して、応答のための平均時間を（例えば、制御回路６０４を介して）決定する、１００４に続く。ユーザプロファイルは、例えば、ユーザプロファイルデータベース（例えば、記憶装置６０８の中に記憶されたデータベース）からアクセスされてもよい。例えば、メディアガイドアプリケーションは、ユーザによって話されるキーワードを受信することによって、ユーザプロファイルを（例えば、制御回路６０４を介して）識別してもよく、キーワードは、具体的ユーザと関連付けられる。メディアガイドアプリケーションはまた、ユーザの発話パターンによって、ユーザプロファイルを（例えば、制御回路６０４を介して）識別してもよい。ユーザプロファイルは、例えば、ユーザが過去に音声動作型ユーザデバイスに応答するために要した時間量を含有する、第１のデータ構造を含有してもよい。メディアガイドアプリケーションは、（例えば、制御回路６０４を介して）これらの過去の応答時間の平均を計算し、ユーザのために応答のための平均時間を決定してもよい。例えば、ユーザは、過去に第２の音声動作型ユーザデバイスに応答するために、１０秒、５秒、および１５秒を要している場合がある。応答を待機するための時間周期は、１０秒がユーザの過去の応答時間の平均であるため、本ユーザのために１０秒に設定され得る。

プロセス１０００は、メディアガイドアプリケーションが（例えば、制御回路６０４を介して）平均時間周期を第１の時間に加算し、第２の時間を計算する、１００６に続く。例えば、平均時間周期が１０秒であり、第１の時間が午後３時１２分３秒である場合には、第２の時間は、３時１２分１３秒である。

プロセス１０００は、メディアガイドアプリケーションが、確認応答が第２の時間の前に受信されたかどうかを（例えば、制御回路６０４を介して）決定する、１００８に続く。メディアガイドアプリケーションが、確認応答が第２の時間の前に受信されたことを決定する場合、プロセス１０００は、プロセス１０００が終了する、１０１０に続く。メディアガイドアプリケーションが、確認応答が第２の時間の前に受信されなかったことを決定する場合、プロセス１０００は、メディアガイドアプリケーションが第２の音声動作型ユーザデバイスを通して第２の可聴応答を（例えば、制御回路６０４を介して）生成し得る、１０１２に続く。例えば、第２の可聴応答は、可聴応答と同一であり得、その場合、第２のユーザは、単純に、同一または異なる音量レベルにおいてユーザへの可聴応答を繰り返す。第２の可聴応答はまた、例えば、応答するようにユーザを促してもよい。例えば、デバイスＢが午後３時１２分２３秒までにユーザから確認応答を受信していない場合、メディアガイドアプリケーションは、デバイスＢを通して、「「ＭａｙｔｈｅＦｏｒｃｅｂｅｗｉｔｈｙｏｕ」が聞こえましたか？」を尋ねる第２の可聴応答を生成してもよい。

プロセス１１００は、メディアガイドアプリケーションが、可聴応答が生成されたときに対応する第１の時間を（例えば、制御回路６０４を介して）決定する、１１０２から開始する。例えば、可聴応答が生成されるとき、メディアガイドアプリケーションは、タイムスタンプをデータ構造に（例えば、記憶装置６０８の中に）（例えば、制御回路６０４を介して）保存してもよい。例えば、可聴応答は、午後３時１２分３秒に生成されている場合がある。

プロセス１１００は、メディアガイドアプリケーションが（例えば、制御回路６０４を介して）時間周期を第１の時間に加算し、第２の時間を計算する、１１０４に続く。例えば、時間周期は、２０秒であってもよい。第１の時間が午後３時１２分３秒である場合には、第２の時間は、午後３時１２分２３秒であってもよい。本時間周期は、ユーザの音声コマンドに再び応答する前に、メディアガイドアプリケーションが待機する長さを表す。

プロセス１１００は、メディアガイドアプリケーションが、確認応答が第２の時間の前に受信されたかどうかを（例えば、制御回路６０４を介して）決定する、１１０６に続く。確認応答は、可聴応答がユーザによって聞かれたことを示す。例えば、デバイスＢ等の第２の音声動作型ユーザデバイスからの可聴応答は、「ＭａｙｔｈｅＦｏｒｃｅｂｅｗｉｔｈｙｏｕ」であってもよい。ユーザは、「ありがとう、デバイスＢ」と発することによって、本応答を確認してもよい。

メディアガイドアプリケーションが、確認応答が第２の時間の前に受信されたことを決定する場合、プロセス１１００は、プロセス１１００が終了する、１１０８に続く。メディアガイドアプリケーションが、確認応答が第２の時間の前に受信されなかったことを決定する場合、プロセス１１００は、メディアガイドアプリケーションがユーザと関連付けられるディスプレイデバイスを（例えば、制御回路６０４を介して）識別し得る、１１１０に続く。例えば、メディアガイドアプリケーションは、ユーザプロファイルを通してユーザと関連付けられるテレビと（例えば、通信ネットワーク７１４を介して）インターフェースをとってもよい。プロセス１１００は、メディアガイドアプリケーションが、応答の視覚表現をディスプレイデバイスに（例えば、通信ネットワーク７１４を介して）伝送する、１１１２に続く。例えば、メディアガイドアプリケーションは、テレビ上にウィンドウを生成してもよく、ウィンドウ内に応答を表示してもよい。例えば、メディアガイドアプリケーションは、受信されるユーザからの要求が番組の名称についてのクエリであるときに、番組のタイトル「ＧａｍｅｏｆＴｈｒｏｎｅｓ」を表示してもよい。さらに、可聴応答が生成された後、ディスプレイウィンドウは、可聴応答を与えたデバイスへの参照を含んでもよい。例えば、メディアガイドアプリケーションは、「デバイスＢが「ＧａｍｅｏｆＴｈｒｏｎｅｓ」と発しました」を表示してもよい。これは、ユーザが通信しているデバイス、したがって、ユーザの近傍にあるデバイスをユーザに知らせる。

プロセス１２００は、メディアガイドアプリケーションがユーザと関連付けられるユーザプロファイルを（例えば、制御回路６０４を介して）識別する、１２０２から開始する。例えば、メディアガイドアプリケーションは、ユーザによって話されるキーワードを受信することによって、ユーザプロファイルを（例えば、制御回路６０４を介して）識別してもよい。ユーザＡは、例えば、音声コマンドを発行する前に、「ユーザＡ」と発してもよい。メディアガイドアプリケーションはまた、例えば、ユーザの発話または発声パターンによって、ユーザプロファイルを（例えば、制御回路６０４を介して）識別してもよい。

プロセス１２００は、メディアガイドアプリケーションが、ユーザプロファイルを使用して、ユーザと関連付けられる平均発話音量レベルを（例えば、制御回路６０４を介して）識別する、１２０４に続く。例えば、ユーザプロファイルは、ユーザが過去に使用した発話音量を含有する、第１のデータ構造を含有してもよい。メディアガイドアプリケーションは、（例えば、制御回路６０４を介して）これらの過去の発話音量の平均を計算し、ユーザのための平均発話音量を決定してもよい。例えば、ユーザの平均発話音量は、６０ｄＢであってもよい。

プロセス１２００は、メディアガイドアプリケーションが、平均発話音量レベルと最大音量レベル（すなわち、ユーザの最近傍の音声動作型ユーザデバイスによって受信される音量レベル）との間の差を（例えば、制御回路６０４を介して）決定する、１２０６に続く。例えば、最大音量レベルは、５２ｄＢであってもよく、ユーザの平均発話音量は、６０ｄＢであってもよい。差は、この場合、８ｄＢである。

プロセス１２００は、メディアガイドアプリケーションが、第２の音量レベルに加算される差に基づいて、第３の音量レベルを（例えば、制御回路６０４を介して）決定する、１２０６に続く。例えば、第２の音量レベルは、５３ｄＢであってもよく、差は、８ｄＢであってもよい。第３の音量は、次いで、６１ｄＢであってもよい。

プロセス１２００は、メディアガイドアプリケーションが第３の音量レベルにおいて第２の可聴応答を（例えば、制御回路６０４を介して）生成する、１２０８に続く。例えば、第３の音量レベルは、６１ｄＢであってもよく、メディアガイドアプリケーションは、第２の音声動作型ユーザデバイスを通して、６１ｄＢにおいて第２の可聴応答を（例えば、制御回路６０４を介して）生成してもよい。

プロセス１３００は、メディアガイドアプリケーションが音声コマンドのフィルタ処理されていない音量レベルを（例えば、制御回路６０４を介して）測定する、１３０２から開始する。例えば、音声コマンドのフィルタ処理されていない音量レベルは、６０ｄＢであってもよい。しかしながら、本フィルタ処理されていない音量レベルは、ユーザの近傍で映画を可聴的に放映するテレビ等の背景雑音のレベルを含み得る。

プロセス１３００は、メディアガイドアプリケーションが背景雑音のレベルを（例えば、制御回路６０４を介して）決定する、１３０４に続く。例えば、テレビで放映される映画は、ユーザの音声よりも高い周波数にあり得る。

プロセス１３００は、メディアガイドアプリケーションが、（例えば、制御回路６０４を介して）音声コマンドをフィルタ処理し、背景雑音のレベルを除去する、１３０６に続く。例えば、メディアガイドアプリケーションは、（例えば、制御回路６０４を介して）音声コマンドの高周波数成分を取り除き、背景雑音を除去してもよい。

プロセス１３００は、メディアガイドアプリケーションが音声コマンドのフィルタ処理された音量レベルを（例えば、制御回路６０４を介して）計算する、１３０６に続く。例えば、音声コマンドのフィルタ処理された音量レベルは、フィルタ処理されていない音量レベル６０ｄＢと比較して、４８ｄＢであってもよい。

Claims

方法であって、
複数の音声動作型ユーザデバイスのうちの第１の音声動作型ユーザデバイスを通して、ユーザによって話される音声コマンドを検出することと、
前記音声コマンドの第１の音量レベルを決定することと、
前記音声コマンドの音量レベルに基づいて、前記複数の音声動作型ユーザデバイスのうちの第２の音声動作型ユーザデバイスが、他の音声動作型ユーザデバイスのうちのいずれよりも前記ユーザに近いことを決定することと、
前記第２の音声動作型ユーザデバイスを通して、前記音声コマンドの第１の音量レベルに基づいて設定される第２の音量レベルにおいて、可聴応答を生成することと
を含む、方法。
音声コマンドの音量レベルに基づく音量レベルにおいて前記音声コマンドに応答するための方法であって、前記方法は、
複数の音声動作型ユーザデバイスのうちの第１の音声動作型ユーザデバイスを通して、ユーザによって話される音声コマンドを検出することと、
前記音声コマンドの第１の音量レベルを決定することであって、前記音声コマンドは、前記第１の音声動作型ユーザデバイスによって受信される、ことと、
複数の音量レベルのうちの各音量レベルを複数の音声動作型ユーザデバイスのうちの個別の音声動作型ユーザデバイスと関連付ける少なくとも１つのデータ構造を受信することと、
前記第１の音量レベルを前記複数の音量レベルと比較することと、
前記第１の音量レベルを前記複数の音量レベルと比較することに基づいて、前記複数の音量レベルのうちの最大音量レベルを決定することと、
前記最大音量レベルを前記少なくとも１つのデータ構造と比較し、前記最大音量レベルと関連付けられる第２の音声動作型ユーザデバイスを決定することと、
コマンドを前記第２の音声動作型ユーザデバイスに伝送することであって、前記コマンドは、応答音量レベルを第２の音量レベルに更新するように前記第２の音声動作型ユーザデバイスに命令し、前記第２の音量レベルは、前記最大音量レベルに基づく、ことと、
前記第２の音声動作型ユーザデバイスを通して、前記第２の音量レベルにおいて可聴応答を生成することと
を含む、方法。
前記可聴応答が生成されたときに対応する第１の時間を決定することと、
第２の時間を計算することあって、前記第２の時間は、時間周期に加算される前記第１の時間である、ことと、
確認応答が第３の時間に受信されたかどうかに基づいて、前記第２の音声動作型ユーザデバイスを通して、第２の可聴応答を生成することあって、前記第３の時間は、前記第２の時間の前である、ことと
をさらに含む、請求項２に記載の方法。
前記時間周期を決定することをさらに含み、前記時間周期を決定することは、
前記ユーザと関連付けられるユーザプロファイルを識別することと、
前記ユーザプロファイルを使用して、応答のための平均時間を決定することと
を含む、請求項３に記載の方法。
第２の可聴応答を生成することは、
第３の音量レベルを決定することであって、前記第３の音量レベルは、前記第２の音量レベルを上回る、こと
を含み、
前記第２の可聴応答は、前記第３の音量レベルにおいて生成される、請求項３に記載の方法。
前記ユーザと関連付けられるユーザプロファイルを識別することと、
前記ユーザプロファイルを使用して、前記ユーザと関連付けられる平均発話音量レベルを識別することと、
前記平均発話音量レベルと前記最大音量レベルとの間の差を決定することと
をさらに含み、
第３の音量レベルを決定することは、前記第２の音量レベルに加算される前記差に基づく、請求項３に記載の方法。
前記ユーザから確認応答を受信することであって、前記確認応答は、前記可聴応答が前記ユーザによって聞かれたことを示す、ことと、
前記ユーザと関連付けられるユーザプロファイルを識別することと、
前記確認応答を受信することに応答して、前記ユーザプロファイルの中に前記第２の音量レベルを記憶することと
をさらに含む、請求項２に記載の方法。
前記ユーザと関連付けられるユーザプロファイルを識別することと、
前記ユーザプロファイルを使用して、前記ユーザと関連付けられる複数のユーザ音量レベルを識別することと、
前記複数のユーザ音量レベルのうちの最低ユーザ音量レベルを決定することと
をさらに含み、
前記第２の音量レベルはさらに、前記最低ユーザ音量レベルに基づく、請求項２に記載の方法。
前記可聴応答が生成されたときに対応する第１の時間を決定することと、
第２の時間を計算することであって、前記第２の時間は、時間周期に加算される前記第１の時間である、ことと、
前記ユーザと関連付けられるディスプレイデバイスを識別することと、
前記可聴応答の視覚表現を表示するために生成することと、
確認応答が第３の時間に受信されたかどうかに基づいて、前記視覚表現を前記ディスプレイデバイスに伝送することであって、前記第３の時間は、前記第２の時間の前である、ことと
をさらに含む、請求項２に記載の方法。
前記ユーザと関連付けられるユーザプロファイルを識別することと、
前記ユーザプロファイルを使用して、前記ユーザに聴力障害があることを決定することと、
前記ユーザと関連付けられるディスプレイデバイスを識別することと、
前記可聴応答の視覚表現を表示するために生成することと、
前記視覚表現を前記ディスプレイデバイスに伝送することと
をさらに含む、請求項２に記載の方法。
前記第１の音量レベルを決定することは、
前記音声コマンドのフィルタ処理されていない音量レベルを測定することと、
背景雑音のレベルを決定することと、
前記音声コマンドをフィルタ処理し、前記背景雑音のレベルを除去することと、
前記音声コマンドのフィルタ処理された音量レベルを計算することと
を含む、請求項２に記載の方法。
音声コマンドの音量レベルに基づく音量レベルにおいて前記音声コマンドに応答するためのシステムであって、前記システムは、
制御回路であって、
複数の音声動作型ユーザデバイスのうちの第１の音声動作型ユーザデバイスを通して、ユーザによって話される音声コマンドを検出することと、
前記音声コマンドの第１の音量レベルを決定することであって、前記音声コマンドは、前記第１の音声動作型ユーザデバイスによって受信される、ことと、
複数の音量レベルのうちの各音量レベルを複数の音声動作型ユーザデバイスのうちの個別の音声動作型ユーザデバイスと関連付ける少なくとも１つのデータ構造を受信することと、
前記第１の音量レベルを前記複数の音量レベルと比較することと、
前記第１の音量レベルを前記複数の音量レベルと比較することに基づいて、前記複数の音量レベルのうちの最大音量レベルを決定することと、
前記最大音量レベルを前記少なくとも１つのデータ構造と比較して、前記最大音量レベルと関連付けられる第２の音声動作型ユーザデバイスを決定することと、
コマンドを前記第２の音声動作型ユーザデバイスに伝送することであって、前記コマンドは、応答音量レベルを第２の音量レベルに更新するように前記第２の音声動作型ユーザデバイスに命令し、前記第２の音量レベルは、前記最大音量レベルに基づく、ことと、
前記第２の音声動作型ユーザデバイスを通して、前記第２の音量レベルにおいて可聴応答を生成することと
を行うように構成される、制御回路
を備える、システム。
前記制御回路はさらに、
前記可聴応答が生成されたときに対応する第１の時間を決定することと、
第２の時間を計算することであって、前記第２の時間は、時間周期に加算される前記第１の時間である、ことと、
確認応答が第３の時間に受信されたかどうかに基づいて、前記第２の音声動作型ユーザデバイスを通して、第２の可聴応答を生成することであって、前記第３の時間は、前記第２の時間の前である、ことと
を行うように構成される、請求項１２に記載のシステム。
前記制御回路はさらに、
前記時間周期を決定するように構成され、前記時間周期を決定することは、
前記ユーザと関連付けられるユーザプロファイルを識別することと、
前記ユーザプロファイルを使用して、応答のための平均時間を決定することと
を含む、請求項１３に記載のシステム。
前記制御回路は、
第３の音量レベルを決定することによって、前記第２の可聴応答を生成するように構成され、前記第３の音量レベルは、前記第２の音量レベルを上回り、
前記第２の可聴応答は、前記第３の音量レベルにおいて生成される、請求項１３に記載のシステム。
前記制御回路はさらに、
前記ユーザと関連付けられるユーザプロファイルを識別することと、
前記ユーザプロファイルを使用して、前記ユーザと関連付けられる平均発話音量レベルを識別することと、
前記平均発話音量レベルと前記最大音量レベルとの間の差を決定することと
を行うように構成され、
第３の音量レベルを決定することは、前記第２の音量レベルに加算される前記差に基づく、請求項１３に記載のシステム。
前記制御回路はさらに、
前記ユーザから確認応答を受信することであって、前記確認応答は、前記可聴応答が前記ユーザによって聞かれたことを示す、ことと、
前記ユーザと関連付けられるユーザプロファイルを識別することと、
前記確認応答を受信することに応答して、前記ユーザプロファイルの中に前記第２の音量レベルを記憶することと
を行うように構成される、請求項１２に記載のシステム。
前記制御回路はさらに、
前記ユーザと関連付けられるユーザプロファイルを識別することと、
前記ユーザプロファイルを使用して、前記ユーザと関連付けられる複数のユーザ音量レベルを識別することと、
前記複数のユーザ音量レベルのうちの最低ユーザ音量レベルを決定することと
を行うように構成され、
前記第２の音量レベルはさらに、前記最低ユーザ音量レベルに基づく、請求項１２に記載のシステム。
前記制御回路はさらに、
前記可聴応答が生成されたときに対応する第１の時間を決定することと、
第２の時間を計算することであって、前記第２の時間は、時間周期に加算される前記第１の時間である、ことと、
前記ユーザと関連付けられるディスプレイデバイスを識別することと、
前記可聴応答の視覚表現を表示するために生成することと、
確認応答が第３の時間に受信されたかどうかに基づいて、前記視覚表現を前記ディスプレイデバイスに伝送することであって、前記第３の時間は、前記第２の時間の前である、ことと
を行うように構成される、請求項１２に記載のシステム。
前記制御回路はさらに、
前記ユーザと関連付けられるユーザプロファイルを識別することと、
前記ユーザプロファイルを使用して、前記ユーザに聴力障害があることを決定することと、
前記ユーザと関連付けられるディスプレイデバイスを識別することと、
前記可聴応答の視覚表現を表示するために生成することと、
前記視覚表現を前記ディスプレイデバイスに伝送することと
を行うように構成される、請求項１２に記載のシステム。
前記制御回路は、
前記音声コマンドのフィルタ処理されていない音量レベルを測定することと、
背景雑音のレベルを決定することと、
前記音声コマンドをフィルタ処理し、前記背景雑音のレベルを除去することと、
前記音声コマンドのフィルタ処理された音量レベルを計算することと
によって、前記第１の音量レベルを決定するように構成される、請求項１２に記載のシステム。
音声コマンドの音量レベルに基づく音量レベルにおいて前記音声コマンドに応答するためのシステムであって、前記システムは、
複数の音声動作型ユーザデバイスのうちの第１の音声動作型ユーザデバイスを通して、ユーザによって話される音声コマンドを検出するための手段と、
前記音声コマンドの第１の音量レベルを決定するための手段であって、前記音声コマンドは、前記第１の音声動作型ユーザデバイスによって受信される、手段と、
複数の音量レベルのうちの各音量レベルを複数の音声動作型ユーザデバイスのうちの個別の音声動作型ユーザデバイスと関連付ける少なくとも１つのデータ構造を受信するための手段と、
前記第１の音量レベルを前記複数の音量レベルと比較するための手段と、
前記第１の音量レベルを前記複数の音量レベルと比較することに基づいて、前記複数の音量レベルのうちの最大音量レベルを決定するための手段と、
前記最大音量レベルを前記少なくとも１つのデータ構造と比較し、前記最大音量レベルと関連付けられる第２の音声動作型ユーザデバイスを決定するための手段と、
コマンドを前記第２の音声動作型ユーザデバイスに伝送するための手段であって、前記コマンドは、応答音量レベルを第２の音量レベルに更新するように前記第２の音声動作型ユーザデバイスに命令し、前記第２の音量レベルは、前記最大音量レベルに基づく、手段と、
前記第２の音声動作型ユーザデバイスを通して、前記第２の音量レベルにおいて可聴応答を生成するための手段と
を備える、システム。
前記可聴応答が生成されたときに対応する第１の時間を決定するための手段と、
第２の時間を計算するための手段であって、前記第２の時間は、時間周期に加算される前記第１の時間である、手段と、
確認応答が第３の時間に受信されたかどうかに基づいて、前記第２の音声動作型ユーザデバイスを通して、第２の可聴応答を生成するための手段であって、前記第３の時間は、前記第２の時間の前である、手段と
をさらに備える、請求項２２に記載のシステム。
前記時間周期を決定するための手段をさらに備え、前記時間周期を決定することは、
前記ユーザと関連付けられるユーザプロファイルを識別するための手段と、
前記ユーザプロファイルを使用して、応答のための平均時間を決定するための手段と
を備える、請求項２３に記載のシステム。
第２の可聴応答を生成するための前記手段は、
第３の音量レベルを決定するための手段であって、前記第３の音量レベルは、前記第２の音量レベルを上回る、手段
を備え、
前記第２の可聴応答は、前記第３の音量レベルにおいて生成される、請求項２３に記載のシステム。
前記ユーザと関連付けられるユーザプロファイルを識別するための手段と、
前記ユーザプロファイルを使用して、前記ユーザと関連付けられる平均発話音量レベルを識別するための手段と、
前記平均発話音量レベルと前記最大音量レベルとの間の差を決定するための手段と
をさらに備え、
第３の音量レベルを決定することは、前記第２の音量レベルに加算される前記差に基づく、請求項２３に記載のシステム。
前記ユーザから確認応答を受信するための手段であって、前記確認応答は、前記可聴応答が前記ユーザによって聞かれたことを示す、手段と、
前記ユーザと関連付けられるユーザプロファイルを識別するための手段と、
前記確認応答を受信することに応答して、前記ユーザプロファイルの中に前記第２の音量レベルを記憶するための手段と
をさらに備える、請求項２２に記載のシステム。
前記ユーザと関連付けられるユーザプロファイルを識別するための手段と、
前記ユーザプロファイルを使用して、前記ユーザと関連付けられる複数のユーザ音量レベルを識別するための手段と、
前記複数のユーザ音量レベルのうちの最低ユーザ音量レベルを決定するための手段と
をさらに備え、
前記第２の音量レベルはさらに、前記最低ユーザ音量レベルに基づく、請求項２２に記載のシステム。
前記可聴応答が生成されたときに対応する第１の時間を決定するための手段と、
第２の時間を計算するための手段であって、前記第２の時間は、時間周期に加算される前記第１の時間である、手段と、
前記ユーザと関連付けられるディスプレイデバイスを識別するための手段と、
前記可聴応答の視覚表現を表示するために生成するための手段と、
確認応答が第３の時間に受信されたかどうかに基づいて、前記視覚表現を前記ディスプレイデバイスに伝送するための手段であって、前記第３の時間は、前記第２の時間の前である、手段と
をさらに備える、請求項２２に記載のシステム。
前記ユーザと関連付けられるユーザプロファイルを識別するための手段と、
前記ユーザプロファイルを使用して、前記ユーザに聴力障害があることを決定するための手段と、
前記ユーザと関連付けられるディスプレイデバイスを識別するための手段と、
前記可聴応答の視覚表現を表示するために生成するための手段と、
前記視覚表現を前記ディスプレイデバイスに伝送するための手段と
をさらに備える、請求項２２に記載のシステム。
前記第１の音量レベルを決定することは、
前記音声コマンドのフィルタ処理されていない音量レベルを測定するための手段と、
背景雑音のレベルを決定するための手段と、
前記音声コマンドをフィルタ処理し、前記背景雑音のレベルを除去するための手段と、
前記音声コマンドのフィルタ処理された音量レベルを計算するための手段と
を備える、請求項２２に記載のシステム。
非一過性の機械可読命令を備える非一過性の機械可読媒体であって、前記命令は、音声コマンドの音量レベルに基づく音量レベルにおいて前記音声コマンドに応答するために前記非一過性の機械可読媒体の上にエンコードされており、前記命令は、
複数の音声動作型ユーザデバイスのうちの第１の音声動作型ユーザデバイスを通して、ユーザによって話される音声コマンドを検出するための命令と、
前記音声コマンドの第１の音量レベルを決定するための命令であって、前記音声コマンドは、前記第１の音声動作型ユーザデバイスによって受信される、命令と、
複数の音量レベルのうちの各音量レベルを複数の音声動作型ユーザデバイスのうちの個別の音声動作型ユーザデバイスと関連付ける少なくとも１つのデータ構造を受信するための命令と、
前記第１の音量レベルを前記複数の音量レベルと比較するための命令と、
前記第１の音量レベルを前記複数の音量レベルと比較することに基づいて、前記複数の音量レベルのうちの最大音量レベルを決定するための命令と、
前記最大音量レベルを前記少なくとも１つのデータ構造と比較し、前記最大音量レベルと関連付けられる第２の音声動作型ユーザデバイスを決定するための命令と、
コマンドを前記第２の音声動作型ユーザデバイスに伝送するための命令であって、前記コマンドは、応答音量レベルを第２の音量レベルに更新するように前記第２の音声動作型ユーザデバイスに命令し、前記第２の音量レベルは、前記最大音量レベルに基づく、命令と、
前記第２の音声動作型ユーザデバイスを通して、前記第２の音量レベルにおいて可聴応答を生成するための命令と
を備える、非一過性の機械可読媒体。
前記命令はさらに、
前記可聴応答が生成されたときに対応する第１の時間を決定するための命令と、
第２の時間を計算するための命令であって、前記第２の時間は、時間周期に加算される前記第１の時間である、命令と、
確認応答が第３の時間に受信されたかどうかに基づいて、前記第２の音声動作型ユーザデバイスを通して、第２の可聴応答を生成するための命令であって、前記第３の時間は、前記第２の時間の前である、命令と
を備える、請求項３２に記載の非一過性の機械可読媒体。
前記命令はさらに、
前記時間周期を決定するための命令を備え、
前記時間周期を決定することは、
前記ユーザと関連付けられるユーザプロファイルを識別するための命令と、
前記ユーザプロファイルを使用して、応答のための平均時間を決定するための命令と
を備える、請求項３３に記載の非一過性の機械可読媒体。
前記制御回路は、
第３の音量レベルを決定することによって、前記第２の可聴応答を生成するように構成され、前記第３の音量レベルは、前記第２の音量レベルを上回り、
前記第２の可聴応答は、前記第３の音量レベルにおいて生成される、請求項１３に記載のシステム。
前記命令はさらに、
前記ユーザと関連付けられるユーザプロファイルを識別するための命令と、
前記ユーザプロファイルを使用して、前記ユーザと関連付けられる平均発話音量レベルを識別するための命令と、
前記平均発話音量レベルと前記最大音量レベルとの間の差を決定するための命令と
をさらに備え、
第３の音量レベルを決定することは、前記第２の音量レベルに加算される前記差に基づく、請求項３３に記載の非一過性の機械可読媒体。
前記命令はさらに、
前記ユーザから確認応答を受信するための命令であって、前記確認応答は、前記可聴応答が前記ユーザによって聞かれたことを示す、命令と、
前記ユーザと関連付けられるユーザプロファイルを識別するための命令と、
前記確認応答を受信することに応答して、前記ユーザプロファイルの中に前記第２の音量レベルを記憶するための命令と
を備える、請求項３２に記載の非一過性の機械可読媒体。
前記命令はさらに、
前記ユーザと関連付けられるユーザプロファイルを識別するための命令と、
前記ユーザプロファイルを使用して、前記ユーザと関連付けられる複数のユーザ音量レベルを識別するための命令と、
前記複数のユーザ音量レベルのうちの最低ユーザ音量レベルを決定するための命令と
を備え、
前記第２の音量レベルはさらに、前記最低ユーザ音量レベルに基づく、請求項３２に記載の非一過性の機械可読媒体。
前記命令はさらに、
前記可聴応答が生成されたときに対応する第１の時間を決定するための命令と、
第２の時間を計算するための命令であって、前記第２の時間は、時間周期に加算される前記第１の時間である、命令と、
前記ユーザと関連付けられるディスプレイデバイスを識別するための命令と、
前記可聴応答の視覚表現を表示するために生成するための命令と、
確認応答が第３の時間に受信されたかどうかに基づいて、前記視覚表現を前記ディスプレイデバイスに伝送するための命令であって、前記第３の時間は、前記第２の時間の前である、命令と
を備える、請求項３２に記載の非一過性の機械可読媒体。
前記命令はさらに、
前記ユーザと関連付けられるユーザプロファイルを識別するための命令と、
前記ユーザプロファイルを使用して、前記ユーザに聴力障害があることを決定するための命令と、
前記ユーザと関連付けられるディスプレイデバイスを識別するための命令と、
前記可聴応答の視覚表現を表示するために生成するための命令と、
前記視覚表現を前記ディスプレイデバイスに伝送するための命令と
を備える、請求項３２に記載の非一過性の機械可読媒体。
前記命令はさらに、
前記音声コマンドのフィルタ処理されていない音量レベルを測定するための命令と、
背景雑音のレベルを決定するための命令と、
前記音声コマンドをフィルタ処理し、前記背景雑音のレベルを除去するための命令と、
前記音声コマンドのフィルタ処理された音量レベルを計算するための命令と
を備える、請求項３２に記載の非一過性の機械可読媒体。
音声コマンドの音量レベルに基づく音量レベルにおいて前記音声コマンドに応答するための方法であって、前記方法は、
複数の音声動作型ユーザデバイスのうちの第１の音声動作型ユーザデバイスを通して、ユーザによって話される音声コマンドを検出することと、
前記音声コマンドの第１の音量レベルを決定することと、
前記音声コマンドの音量レベルに基づいて、前記複数の音声動作型ユーザデバイスのうちの第２の音声動作型ユーザデバイスが他の音声動作型ユーザデバイスのうちのいずれよりも前記ユーザに近いことを決定することと、
前記第２の音声動作型ユーザデバイスを通して、前記音声コマンドの第１の音量レベルに基づいて設定される第２の音量レベルにおいて、可聴応答を生成することと
を含む、方法。
前記可聴応答が生成されたときに対応する第１の時間を決定することと、
第２の時間を計算することであって、前記第２の時間は、時間周期に加算される前記第１の時間である、ことと、
確認応答が第３の時間に受信されたかどうかに基づいて、前記第２の音声動作型ユーザデバイスを通して、第２の可聴応答を生成することであって、前記第３の時間は、前記第２の時間の前である、ことと
をさらに含む、請求項４２に記載の方法。
前記時間周期を決定することをさらに含み、前記時間周期を決定することは、
前記ユーザと関連付けられるユーザプロファイルを識別することと、
前記ユーザプロファイルを使用して、応答のための平均時間を決定することと
を含む、請求項４３に記載の方法。
第２の可聴応答を生成することは、
第３の音量レベルを決定することであって、前記第３の音量レベルは、前記第２の音量レベルを上回る、こと
を含み、
前記第２の可聴応答は、前記第３の音量レベルにおいて生成される、請求項４３に記載の方法。
前記ユーザと関連付けられるユーザプロファイルを識別することと、
前記ユーザプロファイルを使用して、前記ユーザと関連付けられる平均発話音量レベルを識別することと、
前記平均発話音量レベルと前記最大音量レベルとの間の差を決定することと
をさらに含み、
第３の音量レベルを決定することは、前記第２の音量レベルに加算される前記差に基づく、請求項４２−４５のいずれかに記載の方法。
前記ユーザから確認応答を受信することであって、前記確認応答は、前記可聴応答が前記ユーザによって聞かれたことを示す、ことと、
前記ユーザと関連付けられるユーザプロファイルを識別することと、
前記確認応答を受信することに応答して、前記ユーザプロファイルの中に前記第２の音量レベルを記憶することと
をさらに含む、請求項４２−４６のいずれかに記載の方法。
前記ユーザと関連付けられるユーザプロファイルを識別することと、
前記ユーザプロファイルを使用して、前記ユーザと関連付けられる複数のユーザ音量レベルを識別することと、
前記複数のユーザ音量レベルのうちの最低ユーザ音量レベルを決定することと
をさらに含み、
前記第２の音量レベルはさらに、前記最低ユーザ音量レベルに基づく、請求項４２−４７のいずれかに記載の方法。
前記可聴応答が生成されたときに対応する第１の時間を決定することと、
第２の時間を計算することであって、前記第２の時間は、時間周期に加算される前記第１の時間である、ことと、
前記ユーザと関連付けられるディスプレイデバイスを識別することと、
前記可聴応答の視覚表現を表示するために生成することと、
確認応答が第３の時間に受信されたかどうかに基づいて、前記視覚表現を前記ディスプレイデバイスに伝送することであって、前記第３の時間は、前記第２の時間の前である、ことと
をさらに含む、請求項４２−４８のいずれかに記載の方法。
前記ユーザと関連付けられるユーザプロファイルを識別することと、
前記ユーザプロファイルを使用して、前記ユーザに聴力障害があることを決定することと、
前記ユーザと関連付けられるディスプレイデバイスを識別することと、
前記可聴応答の視覚表現を表示するために生成することと、
前記視覚表現を前記ディスプレイデバイスに伝送することと
をさらに含む、請求項４２−４９のいずれかに記載の方法。
前記第１の音量レベルを決定することは、
前記音声コマンドのフィルタ処理されていない音量レベルを測定することと、
背景雑音のレベルを決定することと、
前記音声コマンドをフィルタ処理し、前記背景雑音のレベルを除去することと、
前記音声コマンドのフィルタ処理された音量レベルを計算することと
を含む、請求項４２−５０のいずれかに記載の方法。