JP6936318B2

JP6936318B2 - キャプションテキストにおける間違いを訂正するためのシステムおよび方法

Info

Publication number: JP6936318B2
Application number: JP2019517092A
Authority: JP
Inventors: アジャイクマールグプタ，; アビジットサッチダナンドサバーカー，
Original assignee: ロヴィガイズ，インコーポレイテッド
Priority date: 2016-09-30
Filing date: 2016-09-30
Publication date: 2021-09-15
Anticipated expiration: 2036-09-30
Also published as: WO2018063293A1; EP3520427A1; KR20190055204A; US10834439B2; US20210037274A1; AU2016424629A1; US20240089516A1; KR102612355B1; JP2019537307A; CA3038797A1; BR112019006118A2; MX2019003637A; US11863806B2; US20190215545A1; CN110235449A

Description

従来のメディアシステムは、ニュース番組からの発話情報を、字幕またはクローズドキャプションの形態の画面上のキャプションテキストに変換することができる。伝統的に、本プロセスは、人間の速記者によって取り扱われる。より近年では、メディアシステムは、発話情報を解析し、発話自体と実質的に同時に画面上のキャプションテキストとしてそれを表示するために、発話認識技法を使用し始めている。しかしながら、これらのメディアシステムは、それらの辞書サイズによって、または人間の速記者によって限定され、多くの場合、ある専門用語、新たに作成された決まり文句、外国語の名前、または他の言葉および語句を認識することができない。自動発話認識（ＡＳＲ）を使用するメディアシステムはまた、異形同音異義語（発音が似ている言葉）を処理するときに不利である。間違いに満ちたニュースおよびスポーツ番組のための画面上のキャプションテキストを見ることは珍しくない。いくつかの従来のシステムでは、これらの間違いは、経験豊富な人間の速記者によって手動で訂正されなければならない。しかしながら、人間の速記者でさえも、タイピングの瞬間に全てのための正しい言葉またはスペルを把握しない場合があり、誤植を生じることの影響を受けやすくあり得る。

システムおよび方法が、メディアアセットのための画面上のキャプションテキストの中の間違いを自動的に訂正することによって、従来のシステムにおける短所に対処するために説明される。いくつかの実施形態では、メディアガイドアプリケーションは、メディアアセット自体から導出される情報に基づくナレッジグラフにアクセスし、ナレッジグラフ内から間違いのための候補置換または訂正を探すことによって、間違いを訂正する。いくつかの実施形態では、ナレッジグラフにアクセスするために使用されるメディアアセットから導出される情報は、間違いを取り囲むメディアアセットの１つ以上のビデオフレームの中に出現し、光学式文字認識（ＯＣＲ）アルゴリズムを使用することによって等、ビデオフレームにテキストまたは画像認識を実施することによって識別され得る、テキストまたは画像であってもよい。ナレッジグラフにアクセスするために使用される情報はまた、画面上のキャプションテキストの中の部分的に認識された文中のキーワード等の画面上のキャプションテキスト自体の正しく認識された部分から導出されてもよい。いくつかの実施形態では、メディアガイドアプリケーションは、ナレッジグラフにアクセスすることによって、間違いのための１つ以上の潜在的訂正を決定し、最高加重を有する候補訂正を選択するために、間違いへのそれらの音声類似性に基づいて、これらの潜在的訂正を比較検討してもよい。いくつかの実施形態では、メディアガイドアプリケーションはまた、潜在的訂正が最新である程度を示す、それらの個別のタイムスタンプに基づいて、それらを比較検討してもよい。メディアガイドアプリケーションは、次いで、間違いを候補訂正と置換し、間違いのない画面上のキャプションテキストを視聴者に提示してもよい。

例えば、メディアガイドアプリケーションは、以下の文、すなわち、「ＴｈｅｍｅｅｔｉｎｇｂｅｔｗｅｅｎＰｒｅｓｉｄｅｎｔＯｂａｍａａｎｄＰｒｅｓｉｄｅｎｔＸｉＪｉｎｐｉｎｇｕｎｄｅｒｓｃｏｒｅｄ…」の中で、放送されるニュース上に出現する画面上のキャプションテキストに関して、中国国家主席の名前ＸｉＪｉｎｐｉｎｇを書き写す際に間違え得る。メディアガイドアプリケーションのＡＳＲシステムは、名前「ＸｉＪｉｎｐｉｎｇ」を認識することができず、代わりに、上記の文を「ＴｈｅｍｅｅｔｉｎｇｂｅｔｗｅｅｎＰｒｅｓｉｄｅｎｔＯｂａｍａａｎｄＰｒｅｓｉｄｅｎｔＳｈｅ−−Ｊｕｍｐｉｎｇｕｎｄｅｒｓｃｏｒｅｄ…」として書き写し得る。第１のステップとして、メディアガイドアプリケーションは、１つ以上の自然言語処理（ＮＬＰ）規則を書き写された文に適用し、１つ以上の文法規則を順守することができないため、「Ｓｈｅ−−Ｊｕｍｐｉｎｇ」が誤った用語であることを決定してもよい。誤った用語を訂正するために、メディアガイドアプリケーションは、画面上のキャプションテキストの正しく認識された部分から「Ｐｒｅｓｉｄｅｎｔ」等のキーワードを抽出し、用語に基づくナレッジグラフにアクセスしてもよい。メディアガイドアプリケーションはまた、誤った用語を取り囲むビデオフレームにＯＣＲを実施し、ビデオフレームから「Ｃｈｉｎａ」および「ＳｔａｔｅＶｉｓｉｔ」等の文脈用語を認識してもよい。メディアガイドアプリケーションは、画面上のキャプションテキストからの抽出されたキーワードに加えて、これらの文脈用語に基づくナレッジグラフにアクセスしてもよい。ナレッジグラフの中のこれらの用語と関連付けられる節点およびプロパティを分析することによって、メディアガイドアプリケーションは、「ＸｉＪｉｎｐｉｎｇ」および「ＨｕＪｉｎｔａｏ」等の「Ｐｒｅｓｉｄｅｎｔ」、「Ｃｈｉｎａ」、および「ＳｔａｔｅＶｉｓｉｔ」に関連するいくつかの潜在的訂正を識別してもよい。メディアガイドアプリケーションは、次いで、部分的に、２つの言葉が音声的に類似するため、元の書き写された文の中の「Ｓｈｅ−−Ｊｕｍｐｉｎｇ」を「ＸｉＪｉｎｐｉｎｇ」と置換してもよい。本開示のこれらおよび他の側面は、特に図１−４に関連して、下記でさらに詳細に議論される。

いくつかの側面では、説明される本システムおよび方法は、メディアアセットのための画面上のキャプションテキストの中の誤った用語を訂正することを提供する。メディアガイドアプリケーションは、メディアアセットのオーディオストリームを分析し、画面上のキャプションテキストの第１のテキストセグメントを決定してもよい。例えば、メディアガイドアプリケーションは、スポーツニュース解説のオーディオストリームを分析し、それを画面上のキャプションテキストに自動的に書き写してもよい。メディアガイドアプリケーションは、画面上のキャプションテキストの第１のテキストセグメントを「ＩｔｗｉｌｌｂｅｉｎｔｅｒｅｓｔｉｎｇｔｏｓｅｅｈｏｗＴｏｍＢｒａｄｙｐｅｒｆｏｒｍｓｄｅｓｐｉｔｅｂｅｉｎｇｉｎｔｈｅｎｅｗｓｆｏｒｄｉｖｐｌａｔｅｄａｔｅ」であると決定してもよい。いくつかの実施形態では、メディアガイドアプリケーションは、画面上のキャプションテキストの第１のテキストセグメントの中の誤った用語を識別してもよい。例えば、メディアガイドアプリケーションは、「ｄｉｖｐｌａｔｅｄａｔｅ」が第１のテキストセグメントの中の誤った用語であることを識別してもよい。いくつかの実施形態では、メディアガイドアプリケーションは、第１のテキストセグメントに自然言語処理を実施し、複数の文法規則に対して第１のテキストセグメントを比較することによって、誤った用語を識別してもよい。例えば、メディアガイドアプリケーションは、（例えば、「ＮＣＡＡｄｉｖｏｎｅ」のように）言葉「ｄｉｖ」の後に数字が続くことを要求する文法規則に対して上記の文を比較し、文法規則と対立するため、「ｄｉｖｐｌａｔｅｄａｔｅ」が誤った用語であることを決定してもよい。

いくつかの実施形態では、メディアガイドアプリケーションは、第１のテキストセグメントに対応するメディアアセットのビデオストリームから、１つ以上のビデオフレームを抽出してもよい。例えば、メディアガイドアプリケーションは、上記の文がオーディオストリームの中で出現した時間に対応するビデオフレームをメディアアセットから抽出してもよい。ビデオストリームは、インタビューにオーバーレイするバナーの中に以下の文、すなわち、「ＮｅｗｓｏｆｔｈｅＨｏｕｒ：ＰａｔｒｉｏｔｓｑｕａｒｔｅｒｂａｃｋｓｅｒｖｅｓＮＦＬｓｕｓｐｅｎｓｉｏｎ」を表示する、いくつかのビデオフレームを含む、ＴｏｍＢｒａｄｙのニュースインタビューであってもよい。メディアガイドアプリケーションは、文「ＩｔｗｉｌｌｂｅｉｎｔｅｒｅｓｔｉｎｇｔｏｓｅｅｈｏｗＴｏｍＢｒａｄｙｐｅｒｆｏｒｍｓｄｅｓｐｉｔｅｂｅｉｎｇｉｎｔｈｅｎｅｗｓｆｏｒｄｉｖｐｌａｔｅｄａｔｅ」がニュースでアナウンスされるのと実質的に同一の時間に対応するため、これらのビデオフレームを抽出してもよい。

いくつかの実施形態では、メディアガイドアプリケーションは、１つ以上のビデオフレームのうちの第１のビデオフレームを分析し、誤った用語と関連付けられる文脈用語を決定してもよい。例えば、メディアガイドアプリケーションは、バナーオーバーレイを伴うビデオフレームを分析し、バナーからの文脈用語「Ｐａｔｒｉｏｔｓ」および「ＮＦＬｓｕｓｐｅｎｓｉｏｎ」が誤った用語「ｄｉｖｐｌａｔｅｄａｔｅ」と関連付けられることを決定してもよい。いくつかの実施形態では、メディアガイドアプリケーションは、ナレッジグラフにアクセスし、文脈用語および第１のテキストセグメントの一部に基づいて、誤った用語のための候補訂正を識別してもよい。例えば、メディアガイドアプリケーションは、文脈用語「ＮＦＬｓｕｓｐｅｎｓｉｏｎ」および書き写された文「ＩｔｗｉｌｌｂｅｉｎｔｅｒｅｓｔｉｎｇｔｏｓｅｅｈｏｗＴｏｍＢｒａｄｙｐｅｒｆｏｒｍｓｄｅｓｐｉｔｅｂｅｉｎｇｉｎｔｈｅｎｅｗｓｆｏｒ」の一部（「ＴｏｍＢｒａｄｙ」）に基づくナレッジグラフにアクセスしてもよい。

いくつかの実施形態では、メディアガイドアプリケーションは、第１のテキストセグメントの一部からキーワードを抽出してもよい。例えば、誤った用語「ｄｉｖｐｌａｔｅｄａｔｅ」を含有しない第１のテキストセグメントの一部から、メディアガイドアプリケーションは、キーワード「ＴｏｍＢｒａｄｙ」を抽出してもよい。いくつかの実施形態では、メディアガイドアプリケーションは、文脈用語およびキーワードに対応する節点に関して、ナレッジグラフの中で検索してもよい。上記からの実施例を続けると、メディアガイドアプリケーションは、ナレッジグラフの中の文脈用語「ＮＦＬｓｕｓｐｅｎｓｉｏｎ」およびキーワード「ＴｏｍＢｒａｄｙ」に対応する節点を検索してもよい。いくつかの実施形態では、メディアガイドアプリケーションは、文脈用語およびキーワードと関連付けられるプロパティに関して、節点を分析してもよい。例えば、メディアガイドアプリケーションは、「ＴｏｍＢｒａｄｙ」節点を分析し、生年月日（「Ａｕｇ．３，１９７７」）、身長（「６ｆｔ．４ｉｎ．」）、４０ヤードダッシュ時間（「５．２８ｓ」）、およびチーム（「ＮｅｗＥｎｇｌａｎｄＰａｔｒｉｏｔｓ」）等のプロパティを見出し、名前（「ＯｄｅｌｌＢｅｃｋｈａｍＪｒ．」、「ＴｏｍＢｒａｄｙ」、「ＪｏｓｈＢｒｏｗｎ」…）、長さ（「１」、「４」、「１」…）および理由（「Ｃｏｌｌｉｓｉｏｎ」、「Ｄｅｆｌａｔｅｇａｔｅ」、「ＰｅｒｓｏｎａｌＣｏｎｄｕｃｔ」…）を含有する、「ＮＦＬｓｕｓｐｅｎｓｉｏｎ」節点を分析してもよい。いくつかの実施形態では、プロパティはそれぞれ、ナレッジグラフの中の１つ以上の明確に異なる節点に対応し得る。例えば、「ＰｅｒｓｏｎａｌＣｏｎｄｕｃｔ」および「Ｄｅｆｌａｔｅｇａｔｅ」はそれぞれ、節点および別の節点のプロパティであり得る。

いくつかの実施形態では、メディアガイドアプリケーションは、文脈用語およびキーワードと関連付けられるプロパティに基づいて、少なくとも１つの他の節点を決定してもよく、少なくとも１つの他の節点は、候補訂正に対応する。例えば、メディアガイドアプリケーションは、「ＴｏｍＢｒａｄｙ」および「ＮＦＬｓｕｓｐｅｎｓｉｏｎ」の前述のプロパティに基づいて、「Ｄｅｆｌａｔｅｇａｔｅ」節点が誤った用語のための候補訂正であると決定してもよい。いくつかの実施形態では、メディアガイドアプリケーションは、画面上のキャプションテキストの第１のテキストセグメントの中の誤った用語を候補訂正と置換してもよい。例えば、メディアガイドアプリケーションは、第１のテキストセグメントがここで、「ＩｔｗｉｌｌｂｅｉｎｔｅｒｅｓｔｉｎｇｔｏｓｅｅｈｏｗＴｏｍＢｒａｄｙｐｅｒｆｏｒｍｓｄｅｓｐｉｔｅｂｅｉｎｇｉｎｔｈｅｎｅｗｓｆｏｒＤｅｆｌａｔｅｇａｔｅ」と読めるように、誤った用語「ｄｉｖｐｌａｔｅｄａｔｅ」を候補訂正「Ｄｅｆｌａｔｅｇａｔｅ」と置換してもよい。

いくつかの実施形態では、画面上のキャプションテキストの第１のテキストセグメントは、タイムスタンプ付きであり、第１のビデオフレームは、タイムスタンプ付きの第１のテキストセグメントの位置に対応する、メディアアセットの位置において抽出される。例えば、メディアガイドアプリケーションは、画面上のキャプションテキストにタイムスタンプを付け、第１のテキストセグメントに、文が話された絶対時間と同等であるタイムスタンプを与えてもよい。文「Ｉｔｗｉｌｌｂｅｉｎｔｅｒｅｓｔｉｎｇ…」がアナウンスされるのと同時またはほぼ同時に、メディアガイドアプリケーションは、メディアアセットから、上記の実施例で使用されるようなバナーオーバーレイ「ＮｅｗｓｏｆｔｈｅＨｏｕｒ：ＰａｔｒｉｏｔｓｑｕａｒｔｅｒｂａｃｋｓｅｒｖｅｓＮＦＬｓｕｓｐｅｎｓｉｏｎ」を伴うビデオフレーム等の表示されている１つ以上のビデオフレームを抽出してもよい。いくつかのさらなる実施形態では、メディアガイドアプリケーションは、タイムスタンプ付きの第１のテキストセグメントの中の誤った用語の位置と実質的に同時に、１つ以上のビデオフレームを抽出さえしてもよい。

いくつかの実施形態では、メディアガイドアプリケーションは、画面上のキャプションテキストの第２のテキストセグメントの中の誤った用語を識別してもよい。例えば、メディアガイドアプリケーションは、第１のテキストセグメントの直後にアナウンスされる、画面上のキャプションテキスト「Ｆｅｄｅｒａｌｉｎｖｅｓｔｉｇａｔｉｏｎｉｎｔｏｄｉｖｐｌａｔｅｄａｔｅｉｓｏｎｇｏｉｎｇ」の第２のテキストセグメントの中の誤った用語に遭遇し得る。これは、前の訂正を改善または更新する機会を提供し得る。いくつかの実施形態では、メディアガイドアプリケーションは、誤った用語と関連付けられる第２の文脈用語を決定するために、第２のテキストセグメントに対応する第２のビデオフレームを分析してもよい。例えば、メディアガイドアプリケーションは、ＮｅｗＥｎｇｌａｎｄＰａｔｒｉｏｔｓ対ＩｎｄｉａｎａｐｏｌｉｓＣｏｌｔｓの試合を伴うビデオフレーム等の第２のテキストセグメントに対応する第２のビデオフレームを分析してもよく、ビデオフレーム上に表示されるような「Ｃｏｌｔｓ」が誤った用語「ｄｉｖｐｌａｔｅｄａｔｅ」と関連付けられる第２の文脈用語であることを決定する。

いくつかの実施形態では、メディアガイドアプリケーションは、ナレッジグラフにアクセスし、第１の文脈用語、第２の文脈用語、第１のテキストセグメントの一部、および第２のテキストセグメントの一部に基づいて、更新された候補訂正を識別してもよい。これは、例えば、第１の文脈用語および第１のテキストセグメントの一部が誤った用語のための置換の正確な決定につながらなかったため、元の候補訂正が不正確である場合に有用であり得る。例えば、メディアガイドアプリケーションが、候補訂正が「Ｄｅｆｌａｔｅｇａｔｅ」ではなく「ＤｅｔｒｏｉｔＧａｍｅ」であると前もって決定し、それに応じて、誤った用語「ｄｉｖｐｌａｔｅｄａｔｅ」を置換したと仮定すると、メディアガイドアプリケーションは、続いて、ナレッジグラフにアクセスし、メディアアセットから導出されるさらなる情報、例えば、「ＮＦＬｓｕｓｐｅｎｓｉｏｎ」（すなわち、第１の文脈用語）、「Ｃｏｌｔｓ」（すなわち、第２の文脈用語）、「ＴｏｍＢｒａｄｙ」（すなわち、第１のテキストセグメントの一部）、および「Ｆｅｄｅｒａｌｉｎｖｅｓｔｉｇａｔｉｏｎ」（すなわち、第２のテキストセグメントの一部）に基づいて、更新された候補訂正「Ｄｅｆｌａｔｅｇａｔｅ」を識別してもよい。概して、メディアガイドアプリケーションは、ナレッジグラフに適用するためのさらなる情報または手掛かりがあるときに、誤った用語のための候補訂正をより正確に決定することが可能であり得る。

いくつかの実施形態では、メディアガイドアプリケーションは、画面上のキャプションテキストの第２のテキストセグメントの中の誤った用語を更新された候補訂正と置換してもよい。例えば、メディアガイドアプリケーションは、第２のテキストセグメント「Ｆｅｄｅｒａｌｉｎｖｅｓｔｉｇａｔｉｏｎｉｎｔｏｄｉｖｐｌａｔｅｄａｔｅｉｓｏｎｇｏｉｎｇ」の中の誤った用語「ｄｉｖｐｌａｔｅｄａｔｅ」を、今回は「Ｄｅｆｌａｔｅｇａｔｅ」として正しく識別される、更新された候補訂正と置換し、訂正された第２のテキストセグメントを生成してもよい。いくつかの実施形態では、メディアガイドアプリケーションはさらに、第１のテキストセグメントの中の候補訂正を更新された候補訂正と置換してもよい。例えば、メディアガイドアプリケーションは、古い候補訂正「ＤｅｔｒｏｉｔＧａｍｅ」が「Ｄｅｆｌａｔｅｇａｔｅ」を支持して拒否されたと仮定すると、「ＩｔｗｉｌｌｂｅｉｎｔｅｒｅｓｔｉｎｇｔｏｓｅｅｈｏｗＴｏｍＢｒａｄｙｐｅｒｆｏｒｍｓｄｅｓｐｉｔｅｂｅｉｎｇｉｎｔｈｅｎｅｗｓｆｏｒｄｉｖｐｌａｔｅｄａｔｅ」の中の誤った用語を置換し、普遍的訂正を行うことに再び取り掛かってもよい。

いくつかの実施形態では、メディアガイドアプリケーションは、ナレッジグラフから、誤った用語のための複数の潜在的訂正を決定し、決定に基づいて、加重を複数の潜在的訂正のうちの各潜在的訂正に割り当てることによって、ナレッジグラフにアクセスし、誤った用語のための候補訂正を識別してもよい。例えば、上記の実施例において誤った用語のための候補訂正「Ｄｅｆｌａｔｅｇａｔｅ」を識別するために、メディアガイドアプリケーションは、最初に、「Ｑｕａｒｔｅｒｂａｃｋ」、「ＤｅｔｒｏｉｔＧａｍｅ」、および「Ｄｅｆｌａｔｅｇａｔｅ」等の複数の潜在的訂正を決定し、加重を各潜在的訂正に割り当ててもよい。いくつかの実施形態では、メディアガイドアプリケーションは、複数の潜在的訂正のうちのより最近の潜在的訂正のためのより高い加重を割り当ててもよい。例えば、上記で列挙される３つの潜在的訂正のうち、「Ｄｅｆｌａｔｅｇａｔｅ」は、より最近のタイムスタンプと関連付けられてもよい、またはより最近に更新されてもよく、したがって、より高い加重を割り当てられてもよい。いくつかの他の実施形態では、メディアガイドアプリケーションは、複数の潜在的訂正のうちのより「トレンドになっている」潜在的訂正のためのより高い加重を割り当ててもよい。「トレンドになっている」潜在的訂正は、絶対数の観点から、または検索の頻度の観点からのいずれかで、最近の検索において急激に人気を獲得しているキーワードであってもよい。例えば、用語「Ｄｅｆｌａｔｅｇａｔｅ」は、言葉のユニーク検索の数が、過去２週間における最近のイベントまでゼロに近いままであり、その後、「Ｄｅｆｌａｔｅｇａｔｅ」に関するユニーク検索の数が指数関数的に上昇したため、「トレンドになっている」キーワードであってもよい。別の実施例として、用語「Ｄｅｆｌａｔｅｇａｔｅ」に関するユニーク検索の頻度は、最近のイベントまで比較的一定のままになっている場合があり、頻度は、過去２週間にわたって指数関数的に上昇し、用語「Ｄｅｆｌａｔｅｇａｔｅ」を「トレンドになっている」キーワードにした。いくつかのさらなる実施形態では、メディアガイドアプリケーションは、音声アルゴリズムに基づいて、潜在的候補訂正と誤った用語との間の音声類似性スコア（時として、音声距離の逆数として定義されることもある）を決定し、より高い音声類似性スコアを伴う潜在的候補訂正により高い加重を割り当ててもよい。メディアガイドアプリケーションは、発話セグメントを一連のアトミックセグメントに分割し、アトミックセグメント毎に挿入コストおよび削除コストを計算し、挿入コストおよび削除コストを合計して音声距離に到達することによって、音声距離を計算してもよい。例えば、メディアガイドアプリケーションは、標準音声アルゴリズムを３つの潜在的訂正に適用し、潜在的訂正毎に音声類似性スコアを決定し、「ｄｉｖｐｌａｔｅｄａｔｅ」へのそのより高い音声類似性に基づいて、「Ｄｅｆｌａｔｅｇａｔｅ」により高いスコアを割り当ててもよい。本実施例では、メディアガイドアプリケーションは、「Ｄｅｆｌａｔｅｇａｔｅ」を「ｄｉｖｐｌａｔｅｄａｔｅ」に変更するために、２つの削除（「ｆ」および「ｇ」）および３つの挿入（「ｖ」、「ｐ」、および「ｄ」）を要求することを計算してもよい。したがって、メディアガイドアプリケーションは、「Ｄｅｆｌａｔｅｇａｔｅ」のための音声距離が５であると決定してもよい。当業者によって容易に理解されることができるように、他の潜在的訂正、すなわち、「Ｑｕａｒｔｅｒｂａｃｋ」および「ＤｅｔｒｏｉｔＧａｍｅ」のための音声距離は、それぞれ、２３および１７である。その結果として、メディアガイドアプリケーションは、「Ｄｅｆｌａｔｅｇａｔｅ」が（音声距離の逆数として）最高音声類似性スコアを有することを計算してもよい。いくつかの実施形態では、メディアガイドアプリケーションは、候補訂正として最高加重を割り当てられる、潜在的訂正を識別してもよい。例えば、メディアガイドアプリケーションは、上記に従って計算されるように、最高加重を割り当てられているため、３つの潜在的訂正のうちの「Ｄｅｆｌａｔｅｇａｔｅ」を候補訂正として識別してもよい。

いくつかの実施形態では、メディアガイドアプリケーションは、ナレッジグラフの既存の節点を更新することによって、ナレッジグラフにアクセスして候補訂正を識別してもよい。例えば、メディアガイドアプリケーションは、ナレッジグラフから候補訂正を識別することに先立って、ナレッジグラフの中の既存の節点の一部または全てを更新し、それらが最新の情報を含有することを確実にしてもよい。いくつかの実施形態では、既存の節点への各更新は、特定の節点が最後に更新されたときを示すように、タイムスタンプと関連付けられてもよい。例えば、ナレッジグラフの節点Ａ、Ｂ、Ｃ、Ｄ、およびＥのうち、メディアガイドアプリケーションは、所与の時間においてナレッジグラフへのアクセス中に既存の節点Ａ、Ｂ、およびＤを更新してもよいが、節点Ｃがすでに最新の情報を含有しているため、節点Ｃを更新せず、時間的制約により、節点Ｅを更新することができない。ここで、ナレッジグラフの既存の節点Ａ、Ｂ、およびＤは、現在の時間でタイムスタンプを付けられるであろう一方で、節点ＣおよびＥのタイムスタンプは、更新されず、依然として、それらの個別の直近の更新を反映するであろう。このようにして、メディアガイドアプリケーションは、ナレッジグラフを維持し、候補訂正を決定するために有用であるために、最新の情報を含有することを確実にしてもよい。

上記で説明されるシステム、方法、装置、および／または側面は、本開示に説明される他のシステム、方法、装置、および／または側面に適用される、またはそれに従って使用され得ることに留意されたい。
本願明細書は、例えば、以下の項目も提供する。
（項目１）
メディアアセットのための画面上のキャプションテキストの中の誤った用語を訂正するための方法であって、
前記画面上のキャプションテキストのテキストセグメントの中の前記誤った用語を識別することと、
前記テキストセグメントに対応する前記メディアアセットの１つ以上のビデオフレームを識別することと、
前記１つ以上のビデオフレームから、前記誤った用語に関連する文脈用語を識別することと、
ナレッジグラフにアクセスし、前記文脈用語および前記テキストセグメントの一部に基づいて候補訂正を識別することと、
前記誤った用語を前記候補訂正と置換することと
を含む、方法。
（項目２）
メディアアセットの画面上のキャプションテキストの中の誤った用語を訂正するための方法であって、
前記メディアアセットのオーディオストリームを分析し、前記画面上のキャプションテキストの第１のテキストセグメントを決定することと、
前記画面上のキャプションテキストの第１のテキストセグメントの中の誤った用語を識別することと、
前記第１のテキストセグメントに対応する前記メディアアセットのビデオストリームから、１つ以上のビデオフレームを抽出することと、
前記１つ以上のビデオフレームのうちの第１のビデオフレームを分析し、前記誤った用語と関連付けられる文脈用語を決定することと、
ナレッジグラフにアクセスし、前記文脈用語および前記第１のテキストセグメントの一部に基づいて、前記誤った用語のための候補訂正を識別することと、
クローズドキャプションテキストの前記第１のテキストセグメントの中の前記誤った用語を前記候補訂正と置換することと
を含む、方法。
（項目３）
前記第１のテキストセグメントの中の前記誤った用語を識別することはさらに、前記第１のテキストセグメントに自然言語処理を実施し、複数の文法規則に対して前記第１のテキストセグメントを比較することを含む、項目２に記載の方法。
（項目４）
前記画面上のキャプションテキストの前記第１のテキストセグメントは、タイムスタンプ付きであり、前記第１のビデオフレームは、前記タイムスタンプ付きの第１のテキストセグメントの中の前記誤った用語の位置に対応する、前記メディアアセットの位置において抽出される、項目２に記載の方法。
（項目５）
前記ナレッジグラフにアクセスし、前記文脈用語および前記第１のテキストセグメントの一部に基づいて、前記候補訂正を識別することはさらに、
前記第１のテキストセグメントの一部からキーワードを抽出することと、
前記文脈用語および前記キーワードに対応する節点に関して、前記ナレッジグラフの中で検索することと、
前記文脈用語および前記キーワードと関連付けられるプロパティに関して、前記節点を分析することと、
前記文脈用語および前記キーワードと関連付けられるプロパティに基づいて、少なくとも１つの他の節点を決定することであって、前記少なくとも１つの他の節点は、前記候補訂正に対応する、ことと
を含む、項目２に記載の方法。
（項目６）
前記画面上のキャプションテキストの第２のテキストセグメントの中の前記誤った用語を識別することと、
前記第２のテキストセグメントに対応する第２のビデオフレームを分析し、前記誤った用語と関連付けられる第２の文脈用語を決定することと、
前記ナレッジグラフにアクセスし、前記第１の文脈用語、前記第２の文脈用語、前記第１のテキストセグメントの一部、および前記第２のテキストセグメントの一部に基づいて、更新された候補訂正を識別することと、
前記画面上のキャプションテキストの第２のテキストセグメントの中の前記誤った用語を前記更新された候補訂正と置換することと
をさらに含む、項目２に記載の方法。
（項目７）
前記第１のテキストセグメントの中の前記候補訂正を前記更新された候補訂正と置換することをさらに含む、項目６に記載の方法。
（項目８）
前記ナレッジグラフにアクセスし、前記誤った用語のための前記候補訂正を識別することはさらに、
前記ナレッジグラフから、前記誤った用語のための複数の潜在的訂正を決定することと、
前記決定に基づいて、加重を前記複数の潜在的訂正のうちの各潜在的訂正に割り当てることと、
前記候補訂正として、最高加重と関連付けられる潜在的訂正を識別することと
を含む、項目２に記載の方法。
（項目９）
前記複数の潜在的訂正のうちのより最近の潜在的訂正は、より高い加重を割り当てられる、項目８に記載の方法。
（項目１０）
音声アルゴリズムに基づいて、潜在的候補訂正と前記誤った用語との間の音声類似性スコアを決定することと、
より高い音声類似性スコアを伴う前記潜在的候補訂正により高い加重を割り当てることと
をさらに含む、項目８に記載の方法。
（項目１１）
前記ナレッジグラフにアクセスし、前記文脈用語および前記第１のテキストセグメントの一部に基づいて、前記候補訂正を識別することはさらに、前記ナレッジグラフの既存の節点を更新することを含む、項目２に記載の方法。
（項目１２）
メディアアセットの画面上のキャプションテキストの中の誤った用語を訂正するためのシステムであって、
ナレッジグラフを記憶するメモリと、
制御回路であって、
前記メディアアセットのオーディオストリームを分析し、前記画面上のキャプションテキストの第１のテキストセグメントを決定することと、
前記画面上のキャプションテキストの第１のテキストセグメントの中の誤った用語を識別することと、
前記第１のテキストセグメントに対応する前記メディアアセットのビデオストリームから、１つ以上のビデオフレームを抽出することと、
前記１つ以上のビデオフレームのうちの第１のビデオフレームを分析し、前記誤った用語と関連付けられる文脈用語を決定することと、
ナレッジグラフにアクセスし、前記文脈用語および前記第１のテキストセグメントの一部に基づいて、前記誤った用語のための候補訂正を識別することと、
クローズドキャプションテキストの前記第１のテキストセグメントの中の前記誤った用語を前記候補訂正と置換することと
を行うように構成される、制御回路と
を備える、システム。
（項目１３）
前記第１のテキストセグメントの中の前記誤った用語を識別するようにさらに構成される、前記制御回路はさらに、前記第１のテキストセグメントへの処理によって自然言語を実施し、複数の文法規則に対して前記第１のテキストセグメントを比較することを含む、項目１２に記載のシステム。
（項目１４）
前記画面上のキャプションテキストの前記第１のテキストセグメントは、タイムスタンプ付きであり、前記第１のビデオフレームは、前記タイムスタンプ付きの第１のテキストセグメントの中の前記誤った用語の位置に対応する、前記メディアアセットの位置において抽出される、項目１２に記載のシステム。
（項目１５）
前記制御回路はさらに、
前記第１のテキストセグメントの一部からキーワードを抽出することと、
前記文脈用語および前記キーワードに対応する節点に関して、前記ナレッジグラフの中で検索することと、
前記文脈用語および前記キーワードと関連付けられるプロパティに関して、前記節点を分析することと、
前記文脈用語および前記キーワードと関連付けられるプロパティに基づいて、少なくとも１つの他の節点を決定することであって、前記少なくとも１つの他の節点は、前記候補訂正に対応する、ことと
によって、前記ナレッジグラフにアクセスし、前記文脈用語および前記第１のテキストセグメントの一部に基づいて、前記候補訂正を識別するように構成される、項目１２に記載のシステム。
（項目１６）
前記制御回路はさらに、
前記画面上のキャプションテキストの第２のテキストセグメントの中の前記誤った用語を識別することと、
前記第２のテキストセグメントに対応する第２のビデオフレームを分析し、前記誤った用語と関連付けられる第２の文脈用語を決定することと、
前記ナレッジグラフにアクセスし、前記第１の文脈用語、前記第２の文脈用語、前記第１のテキストセグメントの一部、および前記第２のテキストセグメントの一部に基づいて、更新された候補訂正を識別することと、
前記画面上のキャプションテキストの第２のテキストセグメントの中の前記誤った用語を前記更新された候補訂正と置換することと
を行うように構成される、項目１２に記載のシステム。
（項目１７）
前記制御回路はさらに、前記第１のテキストセグメントの中の前記候補訂正を前記更新された候補訂正と置換するように構成される、項目１６に記載のシステム。
（項目１８）
前記制御回路はさらに、
前記ナレッジグラフから、前記誤った用語のための複数の潜在的訂正を決定することと、
前記決定に基づいて、加重を前記複数の潜在的訂正のうちの各潜在的訂正に割り当てることと、
前記候補訂正として、最高加重と関連付けられる潜在的訂正を識別することと
によって、前記ナレッジグラフにアクセスし、前記誤った用語のための前記候補訂正を識別するように構成される、項目１２に記載のシステム。
（項目１９）
前記複数の潜在的訂正のうちのより最近の潜在的訂正は、より高い加重を割り当てられる、項目１８に記載のシステム。
（項目２０）
前記制御回路はさらに、
音声アルゴリズムに基づいて、潜在的候補訂正と前記誤った用語との間の音声類似性スコアを決定することと、
より高い音声類似性スコアを伴う前記潜在的候補訂正により高い加重を割り当てることと
を行うように構成される、項目１８に記載のシステム。
（項目２１）
前記制御回路はさらに、前記ナレッジグラフの既存の節点を更新することによって、前記ナレッジグラフにアクセスし、前記文脈用語および前記第１のテキストセグメントの一部に基づいて、前記候補訂正を識別するように構成される、項目１２に記載のシステム。
（項目２２）
メディアアセットの画面上のキャプションテキストの中の誤った用語を訂正するための装置であって、
前記メディアアセットのオーディオストリームを分析し、前記画面上のキャプションテキストの第１のテキストセグメントを決定するための手段と、
前記画面上のキャプションテキストの第１のテキストセグメントの中の誤った用語を識別するための手段と、
前記第１のテキストセグメントに対応する前記メディアアセットのビデオストリームから、１つ以上のビデオフレームを抽出するための手段と、
前記１つ以上のビデオフレームのうちの第１のビデオフレームを分析し、前記誤った用語と関連付けられる文脈用語を決定するための手段と、
ナレッジグラフにアクセスし、前記文脈用語および前記第１のテキストセグメントの一部に基づいて、前記誤った用語のための候補訂正を識別するための手段と、
クローズドキャプションテキストの前記第１のテキストセグメントの中の前記誤った用語を前記候補訂正と置換するための手段と
を備える、装置。
（項目２３）
前記第１のテキストセグメントの中の前記誤った用語を識別するための前記手段はさらに、前記第１のテキストセグメントに自然言語処理を実施し、複数の文法規則に対して前記第１のテキストセグメントを比較するための手段を備える、項目２２に記載の装置。
（項目２４）
前記画面上のキャプションテキストの前記第１のテキストセグメントは、タイムスタンプ付きであり、前記第１のビデオフレームは、前記タイムスタンプ付きの第１のテキストセグメントの中の前記誤った用語の位置に対応する、前記メディアアセットの位置において抽出される、項目２２に記載の装置。
（項目２５）
前記ナレッジグラフにアクセスし、前記文脈用語および前記第１のテキストセグメントの一部に基づいて、前記候補訂正を識別するための前記手段はさらに、
前記第１のテキストセグメントの一部からキーワードを抽出するための手段と、
前記文脈用語および前記キーワードに対応する節点に関して、前記ナレッジグラフの中で検索するための手段と、
前記文脈用語および前記キーワードと関連付けられるプロパティに関して、前記節点を分析するための手段と、
前記文脈用語および前記キーワードと関連付けられるプロパティに基づいて、少なくとも１つの他の節点を決定するための手段であって、前記少なくとも１つの他の節点は、前記候補訂正に対応する、手段と
を備える、項目２２に記載の装置。
（項目２６）
前記画面上のキャプションテキストの第２のテキストセグメントの中の前記誤った用語を識別するための手段と、
前記第２のテキストセグメントに対応する第２のビデオフレームを分析し、前記誤った用語と関連付けられる第２の文脈用語を決定するための手段と、
前記ナレッジグラフにアクセスし、前記第１の文脈用語、前記第２の文脈用語、前記第１のテキストセグメントの一部、および前記第２のテキストセグメントの一部に基づいて、更新された候補訂正を識別するための手段と、
前記画面上のキャプションテキストの第２のテキストセグメントの中の前記誤った用語を前記更新された候補訂正と置換するための手段と
をさらに備える、項目２２に記載の装置。
（項目２７）
前記第１のテキストセグメントの中の前記候補訂正を前記更新された候補訂正と置換するための手段をさらに備える、項目２６に記載の装置。
（項目２８）
前記ナレッジグラフにアクセスし、前記誤った用語のための前記候補訂正を識別するための前記手段はさらに、
前記ナレッジグラフから、前記誤った用語のための複数の潜在的訂正を決定するための手段と、
前記決定に基づいて、加重を前記複数の潜在的訂正のうちの各潜在的訂正に割り当てるための手段と、
前記候補訂正として、最高加重と関連付けられる潜在的訂正を識別するための手段と
を備える、項目２２に記載の装置。
（項目２９）
前記複数の潜在的訂正のうちのより最近の潜在的訂正は、より高い加重を割り当てられる、項目２８に記載の装置。
（項目３０）
音声アルゴリズムに基づいて、潜在的候補訂正と前記誤った用語との間の音声類似性スコアを決定するための手段と、
より高い音声類似性スコアを伴う前記潜在的候補訂正により高い加重を割り当てるための手段と
をさらに備える、項目２８に記載の装置。
（項目３１）
前記ナレッジグラフにアクセスし、前記文脈用語および前記第１のテキストセグメントの一部に基づいて、前記候補訂正を識別するための前記手段はさらに、前記ナレッジグラフの既存の節点を更新するための手段を備える、項目２２に記載の装置。
（項目３２）
命令を伴うメモリを備える非一過性の機械可読媒体であって、前記命令は、メディアアセットの画面上のキャプションテキストの中の誤った用語を訂正するために前記メモリ上にエンコードされており、前記非一過性の機械可読媒体は、
前記メディアアセットのオーディオストリームを分析し、前記画面上のキャプションテキストの第１のテキストセグメントを決定するための命令と、
前記画面上のキャプションテキストの第１のテキストセグメントの中の誤った用語を識別するための命令と、
前記第１のテキストセグメントに対応する前記メディアアセットのビデオストリームから、１つ以上のビデオフレームを抽出するための命令と、
前記１つ以上のビデオフレームのうちの第１のビデオフレームを分析し、前記誤った用語と関連付けられる文脈用語を決定するための命令と、
ナレッジグラフにアクセスし、前記文脈用語および前記第１のテキストセグメントの一部に基づいて、前記誤った用語のための候補訂正を識別するための命令と、
クローズドキャプションテキストの前記第１のテキストセグメントの中の前記誤った用語を前記候補訂正と置換するための命令と
を備える、非一過性の機械可読媒体。
（項目３３）
前記第１のテキストセグメントの中の前記誤った用語を識別するための前記命令はさらに、前記第１のテキストセグメントに自然言語処理を実施し、複数の文法規則に対して前記第１のテキストセグメントを比較するための命令を備える、項目３２に記載の非一過性の機械可読媒体。
（項目３４）
前記画面上のキャプションテキストの前記第１のテキストセグメントは、タイムスタンプ付きであり、前記第１のビデオフレームは、前記タイムスタンプ付きの第１のテキストセグメントの中の前記誤った用語の位置に対応する、前記メディアアセットの位置において抽出される、項目３２に記載の非一過性の機械可読媒体。
（項目３５）
前記ナレッジグラフにアクセスし、前記文脈用語および前記第１のテキストセグメントの一部に基づいて、前記候補訂正を識別するための前記命令はさらに、
前記第１のテキストセグメントの一部からキーワードを抽出するための命令と、
前記文脈用語および前記キーワードに対応する節点に関して、前記ナレッジグラフの中で検索するための命令と、
前記文脈用語および前記キーワードと関連付けられるプロパティに関して、前記節点を分析するための命令と、
前記文脈用語および前記キーワードと関連付けられるプロパティに基づいて、少なくとも１つの他の節点を決定するための命令であって、前記少なくとも１つの他の節点は、前記候補訂正に対応する、命令と
を備える、項目３２に記載の非一過性の機械可読媒体。
（項目３６）
前記画面上のキャプションテキストの第２のテキストセグメントの中の前記誤った用語を識別するための命令と、
前記第２のテキストセグメントに対応する第２のビデオフレームを分析し、前記誤った用語と関連付けられる第２の文脈用語を決定するための命令と、
前記ナレッジグラフにアクセスし、前記第１の文脈用語、前記第２の文脈用語、前記第１のテキストセグメントの一部、および前記第２のテキストセグメントの一部に基づいて、更新された候補訂正を識別するための命令と、
前記画面上のキャプションテキストの第２のテキストセグメントの中の前記誤った用語を前記更新された候補訂正と置換するための命令と
をさらに備える、項目３２に記載の非一過性の機械可読媒体。
（項目３７）
前記第１のテキストセグメントの中の前記候補訂正を前記更新された候補訂正と置換するための命令をさらに備える、項目３６に記載の非一過性の機械可読媒体。
（項目３８）
前記ナレッジグラフにアクセスし、前記誤った用語のための前記候補訂正を識別するための前記命令はさらに、
前記ナレッジグラフから、前記誤った用語のための複数の潜在的訂正を決定するための命令と、
前記決定に基づいて、加重を前記複数の潜在的訂正のうちの各潜在的訂正に割り当てるための命令と、
前記候補訂正として、最高加重と関連付けられる潜在的訂正を識別するための命令と
を備える、項目３２に記載の非一過性の機械可読媒体。
（項目３９）
前記複数の潜在的訂正のうちのより最近の潜在的訂正は、より高い加重を割り当てられる、項目３８に記載の非一過性の機械可読媒体。
（項目４０）
音声アルゴリズムに基づいて、潜在的候補訂正と前記誤った用語との間の音声類似性スコアを決定するための命令と、
より高い音声類似性スコアを伴う前記潜在的候補訂正により高い加重を割り当てるための命令と
をさらに備える、項目３８に記載の非一過性の機械可読媒体。
（項目４１）
前記ナレッジグラフにアクセスし、前記文脈用語および前記第１のテキストセグメントの一部に基づいて、前記候補訂正を識別するための前記命令はさらに、前記ナレッジグラフの既存の節点を更新するための命令を備える、項目３２に記載の非一過性の機械可読媒体。
（項目４２）
メディアアセットの画面上のキャプションテキストの中の誤った用語を訂正するための方法であって、
前記メディアアセットのオーディオストリームを分析し、前記画面上のキャプションテキストの第１のテキストセグメントを決定することと、
前記画面上のキャプションテキストの第１のテキストセグメントの中の誤った用語を識別することと、
前記第１のテキストセグメントに対応する前記メディアアセットのビデオストリームから、１つ以上のビデオフレームを抽出することと、
前記１つ以上のビデオフレームのうちの第１のビデオフレームを分析し、前記誤った用語と関連付けられる文脈用語を決定することと、
ナレッジグラフにアクセスし、前記文脈用語および前記第１のテキストセグメントの一部に基づいて、前記誤った用語のための候補訂正を識別することと、
クローズドキャプションテキストの前記第１のテキストセグメントの中の前記誤った用語を前記候補訂正と置換することと
を含む、方法。
（項目４３）
前記第１のテキストセグメントの中の前記誤った用語を識別することはさらに、前記第１のテキストセグメントに自然言語処理を実施し、複数の文法規則に対して前記第１のテキストセグメントを比較することを含む、項目４２に記載の方法。
（項目４４）
前記画面上のキャプションテキストの前記第１のテキストセグメントは、タイムスタンプ付きであり、前記第１のビデオフレームは、前記タイムスタンプ付きの第１のテキストセグメントの中の前記誤った用語の位置に対応する、前記メディアアセットの位置において抽出される、項目４２および４３のいずれか１項に記載の方法。
（項目４５）
前記ナレッジグラフにアクセスし、前記文脈用語および前記第１のテキストセグメントの一部に基づいて、前記候補訂正を識別することはさらに、
前記第１のテキストセグメントの一部からキーワードを抽出することと、
前記文脈用語および前記キーワードに対応する節点に関して、前記ナレッジグラフの中で検索することと、
前記文脈用語および前記キーワードと関連付けられるプロパティに関して、前記節点を分析することと、
前記文脈用語および前記キーワードと関連付けられるプロパティに基づいて、少なくとも１つの他の節点を決定することであって、前記少なくとも１つの他の節点は、前記候補訂正に対応する、ことと
を含む、項目４２−４４のいずれか１項に記載の方法。
（項目４６）
前記画面上のキャプションテキストの第２のテキストセグメントの中の前記誤った用語を識別することと、
前記第２のテキストセグメントに対応する第２のビデオフレームを分析し、前記誤った用語と関連付けられる第２の文脈用語を決定することと、
前記ナレッジグラフにアクセスし、前記第１の文脈用語、前記第２の文脈用語、前記第１のテキストセグメントの一部、および前記第２のテキストセグメントの一部に基づいて、更新された候補訂正を識別することと、
前記画面上のキャプションテキストの第２のテキストセグメントの中の前記誤った用語を前記更新された候補訂正と置換することと
をさらに含む、項目４２−４５のいずれか１項に記載の方法。
（項目４７）
前記第１のテキストセグメントの中の前記候補訂正を前記更新された候補訂正と置換することをさらに含む、項目４６に記載の方法。
（項目４８）
前記ナレッジグラフにアクセスし、前記誤った用語のための前記候補訂正を識別することはさらに、
前記ナレッジグラフから、前記誤った用語のための複数の潜在的訂正を決定することと、
前記決定に基づいて、加重を前記複数の潜在的訂正のうちの各潜在的訂正に割り当てることと、
前記候補訂正として、最高加重と関連付けられる潜在的訂正を識別することと
を含む、項目４２−４７のいずれか１項に記載の方法。
（項目４９）
前記複数の潜在的訂正のうちのより最近の潜在的訂正は、より高い加重を割り当てられる、項目４８に記載の方法。
（項目５０）
音声アルゴリズムに基づいて、潜在的候補訂正と前記誤った用語との間の音声類似性スコアを決定することと、
より高い音声類似性スコアを伴う前記潜在的候補訂正により高い加重を割り当てることと
をさらに含む、項目４８に記載の方法。
（項目５１）
前記ナレッジグラフにアクセスし、前記文脈用語および前記第１のテキストセグメントの一部に基づいて、前記候補訂正を識別することはさらに、前記ナレッジグラフの既存の節点を更新することを含む、項目４２−５０のいずれか１項に記載の方法。

本開示の上記および他の目的および利点は、類似参照文字が全体を通して類似部品を指す、添付図面と併せて解釈される、以下の詳細な説明を考慮することによって明白となるであろう。

図１は、本開示のいくつかの実施形態による、メディアガイドアプリケーションによって生成される表示画面の例証的実施例を示す。図２は、本開示のいくつかの実施形態による、テキストセグメントと関連付けられるナレッジグラフの一部の例証的実施形態を示す。図３は、本開示のいくつかの実施形態による、テキストセグメントと関連付けられるナレッジグラフの一部の別の例証的実施形態を示す。図４は、本開示のいくつかの実施形態による、メディアガイドアプリケーションによって生成される表示画面の別の例証的実施例を示す。図５は、本開示のいくつかの実施形態による、メディアガイドアプリケーションによって生成される表示画面のさらに別の例証的実施例を示す。図６は、本開示のいくつかの実施形態による、メディアガイドアプリケーションによって生成される表示画面のさらに別の例証的実施例を示す。図７は、本開示のいくつかの実施形態による、例証的ユーザ機器デバイスのブロック図である。図８は、本開示のいくつかの実施形態による、例証的メディアシステムのブロック図である。図９は、本開示のいくつかの実施形態による、メディアガイドアプリケーションを使用して表示されるメディアアセットのための画面上のキャプションテキストの中の誤った用語を訂正するための例証的プロセスのフローチャートである。図１０は、本開示のいくつかの実施形態による、ナレッジグラフを使用して、メディアアセットのための画面上のキャプションテキストの中の誤った用語を識別および置換するための例証的プロセスのフローチャートである。

システムおよび方法が、メディアアセットのオーディオ転写の画面上のキャプションテキストの中の間違いを自動的に訂正することによって、従来のメディアシステムにおける欠点に対処するために説明される。本システムおよび方法は、ユーザデバイス（例えば、ユーザ機器デバイス７００（図７））、遠隔サーバ（例えば、メディアコンテンツソース８１６またはメディアガイドデータソース８１８（図８））、または別の好適なデバイス上で起動するメディアガイドアプリケーショを介して、実装されてもよい。

いくつかの実施形態では、メディアガイドアプリケーションは、メディアアセット自体から導出される情報に基づくナレッジグラフにアクセスすることによって、間違いを訂正し、ナレッジグラフ内から間違いのための候補置換または訂正を探す。メディアガイドアプリケーションは、メディアガイドアプリケーションのいくつかの部分が１つのデバイス上で実行され、その一方でメディアガイドアプリケーションの他の部分が別のデバイス上で実行されるように、複数のデバイス上で部分的に実装されてもよい。ナレッジグラフは、メディアコンテンツソース８１６またはメディアガイドデータソース８１８等のサーバ上にあってもよい、または維持され、メディアガイドアプリケーションからアクセス可能である任意の他のサーバまたはデータベース上にあってもよい。いくつかの実施形態では、メディアアセットから導出される情報は、間違いを取り囲むメディアアセットのビデオフレームの中に出現し、ビデオフレームにテキストまたは画像認識を実施することによって識別され得る、テキストまたは画像であってもよい。テキストまたは画像認識は、種々の光学式文字認識アルゴリズム、画像認識アルゴリズム、および他の機械学習技法等のいくつかの技法のうちのいずれかを使用して、メディアガイドアプリケーションによって実施されてもよい。加えて、情報はまた、画面上のキャプションテキスト自体の正しく認識された部分から導出されてもよい。ここで、メディアガイドアプリケーションは、すでに正しく認識されている画面上のキャプションテキストの部分に、１つ以上のテキスト解析およびキーワード抽出アルゴリズムを適用してもよい。いくつかの実施形態では、メディアガイドアプリケーションは、画面上のキャプションテキストの一部が自然言語処理（ＮＬＰ）プロセッサを通過し、ＮＬＰプロセッサによって規定される文法規則に従って文法の間違いを返さない場合、該一部を正しく認識されていると見なしてもよい。

いくつかの実施形態では、メディアガイドアプリケーションは、ナレッジグラフにアクセスすることによって、間違いのための１つ以上の潜在的訂正を決定してもよい。ナレッジグラフは、リンクされたデータ形式で配列される節点およびリンクを備えてもよく、それによって、節点は、概念エンティティを示し、リンクは、２つ以上の節点の間の関係を表す。ナレッジグラフは、メディアガイドアプリケーションによって、経時的に収集されるデータを事前投入されてもよく、ナレッジグラフの既存の節点に関連する情報を反映する、新しい節点およびリンクを含むように周期的に更新されてもよい。いくつかの実施形態では、ナレッジグラフは、第三者ナレッジデータベース等の第三者サービスによって維持されてもよく、それによって、メディアガイドアプリケーションは、第三者サービスによって提供されるアプリケーションプログラミングインターフェース（ＡＰＩ）を介して、ナレッジグラフにアクセスすることが可能である。本実装では、第三者サービスは、ナレッジグラフを構築、維持、および更新する責任がある。いくつかの実施形態では、ナレッジグラフは、一般的であり得、任意の時間におけるあらゆることについての情報を含み得る。いくつかの他の実施形態では、メディアガイドアプリケーションは、特定の対象地域、特定の時間周期、および同等物の専用である文脈ナレッジグラフを維持してもよい。これらは、サブナレッジグラフまたは文脈ナレッジグラフと称され得る。本開示のいくつかの実施形態に従って使用され得る、２つの例示的ナレッジグラフが、下記の図２−３に関連して提示および議論される。

間違いのための１つ以上の潜在的訂正を決定するために、メディアガイドアプリケーションは、好適なナレッジグラフにアクセスし、メディアアセットから導出される情報を表す１つ以上の節点を検索してもよい。前述で議論されたように、メディアアセットから導出される情報は、ビデオフレームから決定される１つ以上の文脈用語と、画面上のキャプションテキストから抽出される１つ以上のキーワードとを含んでもよい。いくつかの実施形態では、メディアガイドアプリケーションは、そのような情報を表す１つ以上の節点のうちの少なくとも１つにリンクされる、ナレッジグラフの中の全ての他の節点を調査し、随意に、１つ以上の節点およびそれらの直接隣接する節点とともに内蔵されるサブナレッジグラフを構築してもよい。これらの節点はそれぞれ、間違いのための潜在的訂正を表してもよい。

いくつかの実施形態では、メディアガイドアプリケーションは、最高加重を有する候補訂正を選択するために、間違いへのそれらの音声類似性に基づいて、上記で決定される１つ以上の潜在的訂正を比較検討してもよい。音声類似性以外に、メディアガイドアプリケーションは、それらの対応する節点が最新である程度を示す、それらのタイムスタンプによって等、任意の数の他の基準に基づいて潜在的訂正を比較検討してもよい。いくつかの実施形態では、メディアガイドアプリケーションは、次いで、間違いを候補訂正と置換し、間違いのない画面上のキャプションテキストを視聴者に提示してもよい。

図１は、本開示のいくつかの実施形態による、メディアガイドアプリケーションによって生成される表示画面１００の例証的実施例を示す。表示画面１００では、メディアガイドアプリケーションは、ニュース放送中に画面上のキャプションテキスト１０６の中で、現在の中国国家主席の名前「ＸｉＪｉｎｐｉｎｇ」を書き写す際に間違え得る。理解可能な文を表示するのではなく、メディアガイドアプリケーションは、画面上のキャプションテキスト１０６「ＴｈｅｍｅｅｔｉｎｇｂｅｔｗｅｅｎＰｒｅｓｉｄｅｎｔＯｂａｍａａｎｄＰｒｅｓｉｄｅｎｔＳｈｅ−−Ｊｕｍｐｉｎｇｕｎｄｅｒｓｃｏｒｅｄ…」を表示する。本例証的実施例は、伝統的な自動転写サービスを実装する既存の画面上のキャプションテキストシステム、または問題になっている特定の用語（この場合、現在の中国国家主席の名前）を認識していない人間の速記者を採用するシステムの失敗を実証する。しかしながら、本開示によると、システム８００で実装されるメディアガイドアプリケーションは、１つ以上のＮＬＰ規則を画面上のキャプションテキスト１０６に適用し、１つ以上の文法規則を順守することができないため、「Ｓｈｅ−−Ｊｕｍｐｉｎｇ」１０８が誤った用語であることを決定してもよい。

誤った用語を訂正するために、メディアガイドアプリケーションは、画面上のキャプションテキスト１０６の正しく認識された部分から「Ｐｒｅｓｉｄｅｎｔ」等のキーワードを抽出し、用語に基づくナレッジグラフにアクセスしてもよい。メディアガイドアプリケーションはまた、メディアアセットの中の画面上のキャプションテキスト１０６の位置と同等である、メディアアセットの中の位置に対応する、ビデオフレーム１１０のＯＣＲを実施してもよい。例えば、メディアガイドアプリケーションは、画面上のキャプションテキスト１０６がニュース放送のオーディオストリームの中でアナウンスされるのと実質的に同時に、表示するためにビデオフレーム１１０をディスプレイ７１２上に生成してもよい。ビデオフレーム１１０のＯＣＲに基づいて、メディアガイドアプリケーションは、情報パネル１０２から「Ｃｈｉｎａ」および「ＳｔａｔｅＶｉｓｉｔ」等の文脈用語を認識してもよい。代替として、またはビデオフレーム１１０のＯＣＲ等のテキスト認識を実施することに加えて、メディアガイドアプリケーションは、ビデオフレーム１１０に示される文字の画像認識を実施し、誤った用語と関連付けられる文脈用語をさらに識別してもよい。例えば、ビデオフレーム１１０の中の中国国家主席が接近カメラショットを受ける場合、メディアガイドアプリケーションは、彼の身元に画像認識を実施し、誤った用語「Ｓｈｅ−−Ｊｕｍｐｉｎｇ」の本物の身元に偶然対応する、文脈用語「ＸｉＪｉｎｐｉｎｇ」に到達してもよい。

メディアガイドアプリケーションは、画面上のキャプションテキスト１０６から抽出されるキーワードに加えて、これらの文脈用語に基づくナレッジグラフにアクセスしてもよい。ナレッジグラフの中のこれらの用語と関連付けられる節点およびプロパティを分析することによって、メディアガイドアプリケーションは、「ＸｉＪｉｎｐｉｎｇ」および「ＨｕＪｉｎｔａｏ」等の「Ｐｒｅｓｉｄｅｎｔ」、「Ｃｈｉｎａ」、および「ＳｔａｔｅＶｉｓｉｔ」に関連するいくつかの潜在的訂正を識別してもよい（ＰｒｅｓｉｄｅｎｔＸｉＪｉｎｐｉｎｇａｎｄｆｏｒｍｅｒＰｒｅｓｉｄｅｎｔＨｕＪｉｎｔａｏｈａｖｅｅａｃｈｈｏｓｔｅｄＰｒｅｓｉｄｅｎｔＯｂａｍａ’ｓｓｔａｔｅｖｉｓｉｔｓｔｏＣｈｉｎａｏｎｓｅｐａｒａｔｅｏｃｃａｓｉｏｎｓ）。メディアガイドアプリケーションは、次いで、元のテキストセグメントの中の「Ｓｈｅ−−Ｊｕｍｐｉｎｇ」を「ＸｉＪｉｎｐｉｎｇ」と置換してもよい。

図２は、本開示のいくつかの実施形態による、テキストセグメントと関連付けられるナレッジグラフの一部の例証的実施形態を示す。いくつかの実施形態では、図２に示されるナレッジグラフの例証的部分は、任意の情報または概念を含み得る、一般的なナレッジグラフの一部であってもよい。ナレッジグラフに示される節点２１０、２１２、２１４…２７０は、１つ以上のプロパティをそれぞれ含有する概念に対応する。例えば、節点２１２「ＢａｒａｃｋＯｂａｍａ」は、生年月日、身長、職業、教育、および同等物を含む、いくつかのフィールドまたはプロパティを含んでもよい。節点対の間の接続は、節点が有し得る種々の関係を示す、リンクを表す。例えば、節点２１２は、「ＢａｒａｃｋＯｂａｍａ」が「Ｐｒｅｓｉｄｅｎｔ」であるため、節点２１０にリンクされてもよい。節点２１２はまた、「ＢａｒａｃｋＯｂａｍａ」が以前に「Ｃｈｉｃａｇｏ」に住んで教えていたため、節点２２０にリンクされてもよい。いくつかの実施形態では、節点は、それらの下層データ構造に基づいて、さらに区別またはグループ化されてもよい。例えば、図２のナレッジグラフの例証的部分では、円形の節点２１２、２１４、２４２、および２５２が、人間の個人を表すために使用される一方で、長方形の節点２１０、２２０、２３０、２４０、２５０、２６０、および２７０は、人間の個人に結び付けられないエンティティまたは概念を表すために使用される。異なる節点の本特定の表現（すなわち、円形対長方形の節点）は、例証的にすぎず、決して基本的概念を限定していないことを理解されたい。

図２に示されるように、ナレッジグラフの例証的部分またはサブナレッジグラフにアクセスするために、メディアガイドアプリケーションは、上記で解説されるように、開始節点としてメディアアセットから導出される情報を提供してもよい。例えば、メディアガイドアプリケーションは、「ＢａｒａｃｋＯｂａｍａ」および「ＣｈｉｎｅｓｅＰｒｅｓｉｄｅｎｔ」等の用語を提供することによって、サブナレッジグラフにアクセスしてもよい。「ＢａｒａｃｋＯｂａｍａ」２１２および「ＣｈｉｎｅｓｅＰｒｅｓｉｄｅｎｔ」２５０自体が節点である一方で、メディアガイドアプリケーションは、誤った用語のための潜在的訂正として、全ての他の関連節点（「ＢａｒａｃｋＯｂａｍａ」２１２または「ＣｈｉｎｅｓｅＰｒｅｓｉｄｅｎｔ」２５０への少なくとも１つのリンクを共有する節点）を提起し、評価してもよい。図１に関連して前述で図示されたように、メディアガイドアプリケーションは、音声アルゴリズムに基づいて、より高い加重を誤った用語に音声的に類似する節点に割り当ててもよい。この場合、図２からの「Ｓｈｅ−−Ｊｕｍｐｉｎｇ」に最も近い節点は、「ＸｉＪｉｎｐｉｎｇ」２５２である。その結果として、メディアガイドアプリケーションは、候補訂正として「ＸｉＪｉｎｐｉｎｇ」を選定し、誤った用語「Ｓｈｅ−−Ｊｕｍｐｉｎｇ」を置換してもよい。

図３は、本開示のいくつかの実施形態による、テキストセグメントと関連付けられるナレッジグラフの一部の別の例証的実施形態を示す。図３のナレッジグラフまたはサブナレッジグラフの一部は、いくつかの実施形態では、図２のサブナレッジグラフの文脈特有のバージョンであってもよい。特に、図３のサブナレッジグラフの中の節点は全て、第１のテキストセグメントからの文脈用語およびキーワードによって設定されるように、文脈「Ｃｈｉｎａ」および「Ｐｒｅｓｉｄｅｎｔ」に関連してもよい。効果的に、メディアガイドアプリケーションは、図３のサブナレッジグラフを生成するために、文脈用語またはキーワードに基づく大型の一般的なナレッジグラフをフィルタ処理してもよい。

図３のサブナレッジグラフの節点３１０、３１２、３５０、および３５２は、それぞれ、図２のサブナレッジグラフの節点２１０、２１２、２５０、および２５２に実質的に対応してもよい。付加的節点「ＧｅｏｒｇｅＷ．Ｂｕｓｈ」３１６および「ＧｅｏｒｇｅＨ．Ｗ．Ｂｕｓｈ」３１８は、「Ｐｒｅｓｉｄｅｎｔ」または「Ｃｈｉｎａ」、または両方の概念に関連するため、図３のサブナレッジグラフの中に出現する。例えば、節点「ＧｅｏｒｇｅＨ．Ｗ．Ｂｕｓｈ」３１８は、ＧｅｏｒｇｅＨ．Ｗ．Ｂｕｓｈ大統領が以前に中国への米国特使としての役割を果たしたため、節点「Ｃｈｉｎａ」３６０とリンクを共有してもよい。

以前に議論されたように、節点およびプロパティの概念は、いくつかの実施形態では交換可能である。例えば、節点「ＭｉｃｈｅｌｌｅＯｂａｍａ」３１４は、家族の一員（すなわち、節点「ＢａｒａｃｋＯｂａｍａ」３１２のプロパティ）として節点「ＢａｒａｃｋＯｂａｍａ」３１２の下に同時に登録されてもよく、同時に、それ自体が別個の節点であってもよい。同様に、節点「ＸｉＪｉｎｐｉｎｇ」は、家族の一員として節点「ＰｅｎｇＬｉｙｕａｎ」３５４の下に登録され、同時に、ナレッジグラフの中の他の既存の節点にリンクする独立した節点であってもよい。いくつかの実施形態では、メディアガイドアプリケーションは、潜在的訂正として、ナレッジグラフの中の文脈用語およびキーワードと関連付けられる全ての節点およびプロパティを返し、それらを個別に評価して、誤った用語のための候補訂正を決定してもよい。例えば、図３のサブナレッジグラフに基づいて、メディアガイドアプリケーションは、上記で使用される実施例において、誤った用語「Ｓｈｅ−−Ｊｕｍｐｉｎｇ」のための潜在的訂正として、「ＭｉｃｈｅｌｌｅＯｂａｍａ」３１４、「ＧｅｏｒｇｅＷ．Ｂｕｓｈ」３１６、「ＧｅｏｒｇｅＨ．Ｗ．Ｂｕｓｈ」３１８、「ＸｉＪｉｎｐｉｎｇ」３５２、「ＰｅｎｇＬｉｙｕａｎ」３５４、および「ＨｕＪｉｎｔａｏ」３５６を識別してもよい。これらの潜在的訂正から、メディアガイドアプリケーションは、種々の比較検討機構を適用し、「ＸｉＪｉｎｐｉｎｇ」が候補訂正であると決定してもよい。

図３および４の例証的なもの等のナレッジグラフは、周期的に維持および更新されてもよい。いくつかの実施形態では、メディアガイドアプリケーションは、問い合わせの時点で問い合わせの節点に直接リンクされる、節点およびプロパティを更新してもよい。例えば、メディアガイドアプリケーションは、節点「Ｐｒｅｓｉｄｅｎｔ」３１０に対応する用語「Ｐｒｅｓｉｄｅｎｔ」に基づくナレッジグラフにアクセスしてもよい。本問い合わせでは、メディアガイドアプリケーションは、「ＢａｒａｃｋＯｂａｍａ」３１２、「ＧｅｏｒｇｅＷ．Ｂｕｓｈ」３１６、および「ＧｅｏｒｇｅＨ．Ｗ．Ｂｕｓｈ」３１８等の「Ｐｒｅｓｉｄｅｎｔ」３１０にリンクされる節点を読み出し、それらの節点およびプロパティ情報を更新してもよい。いくつかの実施形態では、そのような更新は、読み出された節点３１０、３１２、３１６、および３１８、および節点３１０、３１２、３１６、および３１８にリンクされる第２級節点を更新する等、リンクされたデータの第２または後続の層を通して実施されてもよい。

いくつかの実施形態では、メディアガイドアプリケーションは、固定された間隔で信頼できるソースをプルおよび調査することによって、ナレッジグラフの全節点を周期的に更新してもよい。いくつかの実施形態では、メディアガイドアプリケーションは、グループ別に節点およびプロパティを更新してもよい。いくつかのさらなる実施形態では、メディアガイドアプリケーションは、節点を信頼できるソースのＡＰＩサービスに直接リンクすることによって等、リアルタイムで更新を実施してもよい。例えば、メディアガイドアプリケーションは、リアルタイム更新を受信するために、オンライン百科事典、ニュースサービス、またはホワイトハウス公式ニュースポータルのＡＰＩに節点「ＢａｒａｃｋＯｂａｍａ」３１２をリンクすることによって、それのための自動更新を実装することができる。特定の節点のためのリアルタイム更新を受信することに応じて、メディアガイドアプリケーションは、節点のための新しいプロパティを入力する、既存のプロパティを更新する、プロパティを削除する、新しいリンクを既存または新しい接点に追加する、または特定の節点にリンクされる新しい節点を作成してもよい。

図４は、本開示のいくつかの実施形態による、メディアガイドアプリケーションによって生成される表示画面の別の例証的実施例を示す。表示画面４００上で、メディアガイドアプリケーションは、候補訂正４０８を適用し、画面上のキャプションテキスト１０６の中の誤った用語１０８を置換している。表示画面４００上の他の全ては、表示画面１００と同一のままであってもよい。いくつかの実施形態では、メディアガイドアプリケーションは、視聴者が正しい画面上のキャプションのみを見るであろうように、画面上のキャプションテキスト１０６を表示することにさえ先立って、誤った用語１０８を候補訂正４０８と置換してもよい。いくつかの実施形態では、メディアガイドアプリケーションは、画面上のキャプションテキスト１０６を表示するのと実質的に同時であるが、画面上のキャプションテキスト１０６が視聴者に表示するために生成された後に、置換を実施してもよい。置換は、殆どの視聴者が気付き得ないように、シームレスかつ瞬間的であり得る。実際に、そのような実装では、メディアガイドアプリケーションは、置換に視聴者の注目を集めることを所望しない場合がある。いくつかの他の実装では、メディアガイドアプリケーションは、訂正された用語に視聴者の注目を集めるために、ハイライトの短いバーストを用いた置換を実施して候補訂正４０８を強調してもよく、これにより、視聴者は、訂正が行われたことを実感せず、誤った用語の意味について困惑させられない。いくつかのさらなる実施形態では、メディアガイドアプリケーションは、誤った用語１０８を置換するために以前に使用された候補訂正が正しくなかったため、画面上のキャプションテキストの中の次のいくつかの文に移行した後に、戻って誤った用語１０８を置換してもよい。そのような実施形態では、メディアガイドアプリケーションは、ハイライトの短いバーストまたは任意の他の強調の手段を使用し、更新された訂正が数文前の画面上のキャプション文に行われたことを視聴者に示してもよい。画面上キャプショニングシステムにおいて訂正された誤った用語を表示する、これらおよび他の手段は、本質的に例証的であり、本開示を本明細書で議論される具体的実施形態に限定しない。

任意の所与のコンテンツ配信システムでユーザに利用可能なコンテンツの量が、膨大であり得る。その結果、多くのユーザは、ユーザがコンテンツの選択を効率的にナビゲートし、所望し得るコンテンツを容易に識別することを可能にする、インターフェースを通したメディアガイドの形態を所望している。そのようなガイドを提供するアプリケーションは、本明細書では、双方向メディアガイドアプリケーションと称されるが、時として、メディアガイドアプリケーションまたはガイドアプリケーションと称されることもある。

本明細書で参照されるように、「双方向メディアガイドアプリケーション」、または「メディアガイドアプリケーション」、または時として、「ガイドアプリケーション」は、ユーザが、コンテンツを消費する、および／またはそれにナビゲートすることを可能にする、アプリケーションである。いくつかの実施形態では、メディアガイドアプリケーションは、オンラインアプリケーション（すなわち、ウェブサイト上で提供される）として、またはサーバまたはユーザデバイス上の独立型アプリケーションとして、提供されてもよい。いくつかの実施形態では、種々のデバイスおよびプラットフォーム上にインストールされる制御回路は、下記でより詳細に説明されるように、メディアガイドアプリケーションを実行してもよい。いくつかの実施形態では、メディアガイドアプリケーションおよび／または本明細書で議論される実施形態のうちのいずれかを実施するための任意の命令は、機械可読媒体上にエンコードされてもよい。機械可読媒体は、データを記憶することが可能な任意の媒体を含む。機械可読媒体は、限定ではないが、電気または電磁信号の伝搬を含む、一過性であり得る、または限定ではないが、ハードディスク、フロッピー（登録商標）ディスク、ＵＳＢドライブ、ＤＶＤ、ＣＤ、メディアカード、レジスタメモリ、プロセッサキャッシュ、ランダムアクセスメモリ（「ＲＡＭ」）等の揮発性および不揮発性コンピュータメモリまたは記憶デバイスを含む、非一過性であり得る。

双方向メディアガイドアプリケーションは、ガイドを提供するコンテンツに応じて、種々の形態をとってもよい。１つの典型的なタイプのメディアガイドアプリケーションは、双方向テレビ番組ガイドである。双方向テレビ番組ガイド（時として、電子番組ガイドと称される）は、とりわけ、ユーザが、多くのタイプのコンテンツまたはメディアアセット間をナビゲートし、それを特定することを可能にする、周知のガイドアプリケーションである。双方向メディアガイドアプリケーションは、ユーザが、コンテンツ間をナビゲートし、それを特定および選択することを可能にする、グラフィカルユーザインターフェース画面を生成してもよい。本明細書で参照されるように、用語「メディアアセット」および「コンテンツ」は、例えば、テレビ番組、および有料番組、オンデマンド番組（ビデオオンデマンド（ＶＯＤ）システムにおけるような）、インターネットコンテンツ（例えば、ストリーミングコンテンツ、ダウンロード可能コンテンツ、ウェブキャスト等）、ビデオクリップ、オーディオ、コンテンツ情報、写真、回転画像、ドキュメント、再生一覧、ウェブサイト、記事、書籍、電子書籍、ブログ、チャットセッション、ソーシャルメディア、アプリケーション、ゲーム、および／または任意の他のメディアまたはマルチメディア、および／またはそれらの組み合わせ等の電子的に消費可能なユーザアセットを意味すると理解されたい。ガイドアプリケーションはまた、ユーザが、コンテンツ間をナビゲートし、それを特定することを可能にする。本明細書で参照されるように、用語「マルチメディア」とは、上記で説明される少なくとも２つの異なるコンテンツ形態、例えば、テキスト、オーディオ、画像、ビデオ、または双方向コンテンツ形態を利用する、コンテンツを意味すると理解されたい。コンテンツは、ユーザ機器デバイスによって、録画、再生、表示、またはアクセスされてもよいが、また、ライブパーフォーマンスの一部であることもできる。

本明細書で議論される実施形態のいずれかを実施するためのメディアガイドアプリケーションおよび／または任意の命令は、機械可読媒体上にエンコードされてもよい。機械可読媒体は、データを記憶することが可能な任意の媒体を含む。機械可読媒体は、限定ではないが、電気または電磁信号の伝搬を含む、一過性であり得る、または限定ではないが、ハードディスク、フロッピー（登録商標）ディスク、ＵＳＢドライブ、ＤＶＤ、ＣＤ、メディアカード、レジスタメモリ、プロセッサキャッシュ、ランダムアクセスメモリ（「ＲＡＭ」）等の揮発性および不揮発性コンピュータメモリまたは記憶デバイスを含む、非一過性であり得る。

インターネット、モバイルコンピューティング、および高速無線ネットワークの出現に伴って、ユーザは、従来は使用しなかったユーザ機器デバイス上でメディアにアクセスするようになっている。本明細書で参照されるように、語句「ユーザ機器デバイス」、「ユーザ機器」、「ユーザデバイス」、「電子デバイス」、「電子機器」、「メディア機器デバイス」、または「メディアデバイス」は、テレビ、スマートＴＶ、セットトップボックス、衛星テレビに対応するための統合型受信機デコーダ（ＩＲＤ）、デジタル記憶デバイス、デジタルメディア受信機（ＤＭＲ）、デジタルメディアアダプタ（ＤＭＡ）、ストリーミングメディアデバイス、ＤＶＤプレーヤ、ＤＶＤレコーダ、接続型ＤＶＤ、ローカルメディアサーバ、ＢＬＵ−ＲＡＹ（登録商標）プレーヤ、ＢＬＵ−ＲＡＹ（登録商標）レコーダ、パーソナルコンピュータ（ＰＣ）、ラップトップコンピュータ、タブレットコンピュータ、ウェブＴＶボックス、パーソナルコンピュータテレビ（ＰＣ／ＴＶ）、ＰＣメディアサーバ、ＰＣメディアセンター、ハンドヘルドコンピュータ、固定電話、携帯情報端末（ＰＤＡ）、携帯電話、ポータブルビデオプレーヤ、ポータブル音楽プレーヤ、ポータブルゲーム機、スマートフォン、または任意の他のテレビ機器、コンピューティング機器、または無線デバイス、および／またはそれらの組み合わせ等の上記で説明されるコンテンツにアクセスするための任意のデバイスを意味すると理解されたい。いくつかの実施形態では、ユーザ機器デバイスは、正面画面および裏面画面、複数の正面画面、または複数の角度付き画面を有してもよい。いくつかの実施形態では、ユーザ機器デバイスは、正面カメラおよび／または裏面カメラを有してもよい。これらのユーザ機器デバイス上で、ユーザは、テレビを通して利用可能な同一のコンテンツ間をナビゲートし、それを特定することが可能であり得る。その結果として、メディアガイドは、これらのデバイス上でも利用可能であり得る。提供されるガイドは、テレビのみを通して利用可能なコンテンツ、他のタイプのユーザ機器デバイスのうちの１つ以上のもののみを通して利用可能なコンテンツ、またはテレビおよび他のタイプのユーザ機器デバイスのうちの１つ以上のものの両方を通して利用可能なコンテンツのためのものであってもよい。メディアガイドアプリケーションは、ユーザ機器デバイス上で、オンラインアプリケーション（すなわち、ウェブサイト上で提供される）として、または独立型アプリケーションまたはクライアントとして提供されてもよい。メディアガイドアプリケーションを実装し得る、種々のデバイスおよびプラットフォームは、下記でより詳細に説明される。

メディアガイドアプリケーションの機能のうちの１つは、メディアガイドデータをユーザに提供することである。本明細書で参照されるように、語句「メディアガイドデータ」または「ガイドデータ」は、コンテンツに関連する任意のデータ、またはガイドアプリケーションを動作させる際に使用されるデータを意味すると理解されたい。例えば、ガイドデータは、番組情報、ガイドアプリケーション設定、ユーザ選好、ユーザプロファイル情報、メディア一覧、メディア関連情報（例えば、放送時間、放送チャネル、タイトル、内容、評価情報（例えば、ペアレンタルコントロール評価、批評家の評価等）、ジャンルまたはカテゴリ情報、俳優情報、放送会社またはプロバイダのロゴのロゴデータ等）、メディア形式（例えば、標準解像度、高解像度、３Ｄ等）、オンデマンド情報、ブログ、ウェブサイト、およびユーザが所望のコンテンツ選択間をナビゲートし、それを特定するために役立つ、任意の他のタイプのガイドデータを含んでもよい。

図５−６は、メディアガイドデータを提供するために使用され得る、例証的表示画面を示す。図５−６に示される表示画面は、任意の好適なユーザ機器デバイスまたはプラットフォーム上に実装されてもよい。図５−６の表示は、フル画面表示として図示されているが、それらはまた、表示されているコンテンツ上に完全または部分的にオーバーレイされてもよい。ユーザは、表示画面に提供された選択可能なオプション（例えば、メニューオプション、一覧オプション、アイコン、ハイパーリンク等）を選択することによって、またはリモートコントロールまたは他のユーザ入力インターフェースまたはデバイス上の専用ボタン（例えば、「ガイド」ボタン）を押下することによって、コンテンツ情報にアクセスする要望を示してもよい。ユーザのインジケーションに応答して、メディアガイドアプリケーションは、グリッド内の時間およびチャネル別、時間別、チャネル別、ソース別、コンテンツタイプ別、カテゴリ別（例えば、映画、スポーツ、ニュース、子供向け、または他の番組カテゴリ）、または他の所定、ユーザ定義、または他の編成基準等のいくつかの方法のうちの１つにおいて編成されたメディアガイドデータを表示画面に提供してもよい。

図５は、単一表示内の異なるタイプのコンテンツへのアクセスも可能にする、時間およびチャネル別に配列された番組一覧表示５００の例証的グリッドを示す。表示５００は、以下、すなわち、（１）各チャネル／コンテンツタイプ識別子（列内のセル）が利用可能な異なるチャネルまたはコンテンツのタイプを識別する、チャネル／コンテンツタイプ識別子の列５０４、および（２）各時間識別子（行内のセル）が番組の時間帯を識別する、時間識別子の行５０６を伴うグリッド５０２を含んでもよい。グリッド５０２はまた、番組一覧５０８等の番組一覧のセルも含み、各一覧は、一覧の関連チャネルおよび時間の上に提供される、番組のタイトルを提供する。ユーザ入力デバイスを用いて、ユーザは、ハイライト領域５１０を移動させることによって、番組一覧を選択することができる。ハイライト領域５１０によって選択される番組一覧に関する情報が、番組情報領域５１２内に提供されてもよい。領域５１２は、例えば、番組タイトル、番組内容、番組が提供される時間（該当する場合）、番組が放送されるチャネル（該当する場合）、番組の評価、および他の所望の情報を含んでもよい。

線形番組（例えば、所定の時間に複数のユーザ機器デバイスに伝送されるようにスケジュールされ、スケジュールに従って提供されるコンテンツ）にアクセスを提供することに加えて、メディアガイドアプリケーションはまた、非線形番組（例えば、任意の時間においてユーザ機器デバイスにアクセス可能であって、スケジュールに従って提供されないコンテンツ）へのアクセスも提供する。非線形番組は、オンデマンドコンテンツ（例えば、ＶＯＤ）、インターネットコンテンツ（例えば、ストリーミングメディア、ダウンロード可能メディア等）、ローカルで記憶されたコンテンツ（例えば、上記で説明される任意のユーザ機器デバイスまたは他の記憶デバイス上に記憶されたコンテンツ）、または時間的制約のない他のコンテンツを含む、異なるコンテンツソースからのコンテンツを含んでもよい。オンデマンドコンテンツは、映画または特定のコンテンツプロバイダ（例えば、「ＴｈｅＳｏｐｒａｎｏｓ」や「ＣｕｒｂＹｏｕｒＥｎｔｈｕｓｉａｓｍ」を提供するＨＢＯＯｎＤｅｍａｎｄ）によって提供される映画または任意の他のコンテンツを含んでもよい。ＨＢＯＯＮＤＥＭＡＮＤは、ＴｉｍｅＷａｒｎｅｒＣｏｍｐａｎｙＬ．Ｐ．らによって所有されるサービスマークであり、ＴＨＥＳＯＰＲＡＮＯＳおよびＣＵＲＢＹＯＵＲＥＮＴＨＵＳＩＡＳＭは、ＨｏｍｅＢｏｘＯｆｆｉｃｅ，Ｉｎｃ．によって所有される商標である。インターネットコンテンツは、チャットセッションまたはウェブキャスト等のウェブイベント、またはインターネットウェブサイトまたは他のインターネットアクセス（例えば、ＦＴＰ）を通して、ストリーミングコンテンツまたはダウンロード可能なコンテンツとしてオンデマンドで利用可能なコンテンツを含んでもよい。

グリッド５０２は、オンデマンド一覧５１４、録画コンテンツ一覧５１６、およびインターネットコンテンツ一覧５１８を含む、非線形番組のメディアガイドデータを提供してもよい。異なるタイプのコンテンツソースからのコンテンツのためのメディアガイドデータを組み合わせる表示は、時として、「混合メディア」表示と称されることもある。表示５００とは異なる、表示され得るメディアガイドデータのタイプの種々の順列は、ユーザ選択またはガイドアプリケーション定義に基づいてもよい（例えば、録画および放送一覧のみの表示、オンデマンドおよび放送一覧のみの表示等）。例証されるように、一覧５１４、５１６、および５１８は、これらの一覧の選択が、それぞれ、オンデマンド一覧、録画一覧、またはインターネット一覧専用の表示へのアクセスを提供し得ることを示すように、グリッド５０２内に表示される時間帯全体に及ぶものとして示されている。いくつかの実施形態では、これらのコンテンツタイプの一覧は、グリッド５０２に直接含まれてもよい。ユーザがナビゲーションアイコン５２０のうちの１つを選択することに応答して、付加的メディアガイドデータが表示されてもよい（ユーザ入力デバイス上の矢印キーを押下することによって、ナビゲーションアイコン５２０を選択することと同様に表示に影響を及ぼし得る）。

表示５００はまた、ビデオ領域５２２と、オプション領域５２６とを含んでもよい。ビデオ領域５２２は、ユーザが、ユーザに現在利用可能である、今後利用可能となる、または利用可能であった番組を視聴および／またはプレビューすることを可能にしてもよい。ビデオ領域５２２のコンテンツは、グリッド５０２内に表示される一覧のうちの１つに対応する、またはそれから独立し得る。ビデオ領域を含むグリッド表示は、時として、ピクチャインガイド（ＰＩＧ）表示と称されることもある。ＰＩＧ表示およびそれらの機能性は、２００３年５月１３日発行のＳａｔｔｅｒｆｉｅｌｄｅｔａｌ．の米国特許第６，５６４，３７８号、および２００１年５月２９日発行のＹｕｅｎｅｔａｌ．の米国特許第６，２３９，７９４号（それらの全体として参照することによって本明細書に組み込まれる）でさらに詳細に説明されている。ＰＩＧ表示は、本明細書に説明される実施形態の他のメディアガイドアプリケーション表示画面に含まれてもよい。

オプション領域５２６は、ユーザが、異なるタイプのコンテンツ、メディアガイドアプリケーション表示、および／またはメディアガイドアプリケーション特徴にアクセスすることを可能にしてもよい。オプション領域５２６は、表示５００（および本明細書に説明される他の表示画面）の一部であってもよい、または画面上のオプションを選択すること、またはユーザ入力デバイス上の専用または割当可能ボタンを押下することによって、ユーザによって呼び出されてもよい。オプション領域５２６内の選択可能オプションは、グリッド５０２内の番組一覧に関連する特徴に関してもよい、またはメインメニュー表示から利用可能なオプションを含んでもよい。番組一覧に関連する特徴は、他の放送時間または番組の受信方法の検索、番組の録画、番組の連続録画の有効化、番組および／またはチャネルをお気に入りとして設定、番組の購入、または他の特徴を含んでもよい。メインメニュー表示から利用可能なオプションは、検索オプション、ＶＯＤオプション、ペアレンタルコントロールオプション、インターネットオプション、クラウドベースのオプション、デバイス同期オプション、第２の画面デバイスオプション、種々のタイプのメディアガイドデータ表示にアクセスするオプション、プレミアムサービスにサブスクライブするオプション、ユーザのプロファイルを編集するオプション、ブラウザオーバーレイにアクセスするオプション、または他のオプションを含んでもよい。

メディアガイドアプリケーションは、ユーザの選好に基づいて個人化されてもよい。個人化されたメディアガイドアプリケーションは、ユーザが、メディアガイドアプリケーションを用いて個人化された「体験」を生成するように、表示および特徴をカスタマイズすることを可能にする。この個人化された体験は、ユーザがこれらのカスタマイズを入力することを可能にすることによって、および／または種々のユーザ選好を決定するようにメディアガイドアプリケーションがユーザアクティビティを監視することによって、生成されてもよい。ユーザは、ログインすることによって、または別様にガイドアプリケーションに対して自らを識別することによって、それらの個人化されたガイドアプリケーションにアクセスしてもよい。メディアガイドアプリケーションのカスタマイズは、ユーザプロファイルに従って作成されてもよい。カスタマイズは、提示方式（例えば、表示の色方式、テキストのフォントサイズ等）、表示されるコンテンツ一覧の側面（例えば、ＨＤＴＶ番組のみまたは３Ｄ番組のみ、お気に入りチャネル選択に基づいたユーザ指定の放送チャネル、チャネルの表示の並び替え、推奨コンテンツ等）、所望の録画特徴（例えば、特定のユーザに対する録画または連続録画、録画品質等）、ペアレンタルコントロール設定、インターネットコンテンツのカスタマイズされた提示（例えば、ソーシャルメディアコンテンツ、電子メール、電子的に配信された記事等の提示）、および他の所望のカスタマイズを変更させるステップを含んでもよい。

メディアガイドアプリケーションは、ユーザが、ユーザプロファイル情報を提供することを可能にしてもよい、またはユーザプロファイル情報を自動的にコンパイルしてもよい。メディアガイドアプリケーションは、例えば、ユーザがアクセスするコンテンツ、および／またはユーザがガイドアプリケーションと行い得る他の相互作用を監視してもよい。加えて、メディアガイドアプリケーションは、特定のユーザに関連する他のユーザプロファイルの全体または一部を取得し（例えば、ｗｗｗ．ａｌｌｒｏｖｉ．ｃｏｍ等のユーザがアクセスするインターネット上の他のウェブサイトから、ユーザがアクセスする他のメディアガイドアプリケーションから、ユーザがアクセスする他の双方向アプリケーションから、ユーザの別のユーザ機器デバイスから等）、および／またはメディアガイドアプリケーションがアクセスし得る他のソースから、ユーザについての情報を取得してもよい。結果として、ユーザは、ユーザの異なるユーザ機器デバイスにわたって、統一されたガイドアプリケーション体験を提供することができる。本タイプのユーザ体験は、図８に関連して、下記でより詳細に説明される。付加的な個人化されたメディアガイドアプリケーション特徴は、２００５年７月１１日出願のＥｌｌｉｓｅｔａｌ．の米国特許出願公開第２００５／０２５１８２７号、２００７年１月１６日発行のＢｏｙｅｒｅｔａｌ．の米国特許第７，１６５，０９８号、および２００２年２月２１日出願のＥｌｌｉｓｅｔａｌ．の米国特許出願公開第２００２／０１７４４３０号（それらの全体として参照することによって本明細書に組み込まれる）でさらに詳細に説明されている。

メディアガイドを提供するための別の表示配列が、図６に示されている。ビデオモザイク表示６００は、コンテンツのタイプ、ジャンル、および／または他の編成基準に基づいて編成されたコンテンツ情報のための選択可能オプション６０２を含む。表示６００では、テレビ一覧オプション６０４が、選択され、したがって、一覧６０６、６０８、６１０、および６１２を放送番組一覧として提供する。表示６００では、一覧は、カバーアート、コンテンツからの静止画像、ビデオクリップのプレビュー、コンテンツからのライブビデオ、または一覧中のメディアガイドデータによって記述されているコンテンツをユーザに示す他のタイプのコンテンツを含む、グラフィック画像を提供してもよい。グラフィック一覧はまた、それぞれ、一覧と関連付けられるコンテンツに関するさらなる情報を提供するように、テキストを伴ってもよい。例えば、一覧６０８は、メディア部分６１４およびテキスト部分６１６を含む、１つを上回る部分を含んでもよい。メディア部分６１４および／またはテキスト部分６１６は、コンテンツをフル画面で視聴するように、またはメディア部分６１４内に表示されるコンテンツに関連する情報を閲覧するように（例えば、ビデオが表示されるチャネルの一覧を閲覧するように）、選択可能であり得る。

表示６００中の一覧は、異なるサイズである（すなわち、一覧６０６は、一覧６０８、６１０、および６１２より大きい）が、所望に応じて、全ての一覧が、同一のサイズであってもよい。一覧は、コンテンツプロバイダの所望に応じて、またはユーザ選好に基づいて、ユーザの関心の程度を示すように、またはあるコンテンツを強調するように、異なるサイズであるか、またはグラフィック的に強調されてもよい。コンテンツ一覧をグラフィック的に強調するための種々のシステムおよび方法は、例えば、２００９年１１月１２日に出願されたＹａｔｅｓの米国特許出願公開第２０１０／０１５３８８５号（その全体として参照することによって本明細書に組み込まれる）で議論されている。

ユーザは、そのユーザ機器デバイスのうちの１つ以上のものから、コンテンツおよびメディアガイドアプリケーション（および上記および下記で説明されるその表示画面）にアクセスしてもよい。図７は、例証的ユーザ機器デバイス７００の一般化された実施形態を示す。ユーザ機器デバイスのより具体的な実装は、図８に関連して下記で議論される。ユーザ機器デバイス７００は、入出力（以下「Ｉ／Ｏ」）パス７０２を介して、コンテンツおよびデータを受信してもよい。Ｉ／Ｏパス７０２は、処理回路７０６および記憶装置７０８を含む制御回路７０４に、コンテンツ（例えば、放送番組、オンデマンド番組、インターネットコンテンツ、ローカルエリアネットワーク（ＬＡＮ）または広域ネットワーク（ＷＡＮ）を経由して利用可能なコンテンツ、および／または他のコンテンツ）およびデータを提供してもよい。制御回路７０４は、Ｉ／Ｏパス７０２を使用して、コマンド、要求、および他の好適なデータを送受信するために使用されてもよい。Ｉ／Ｏパス７０２は、制御回路７０４（具体的には、処理回路７０６）を１つ以上の通信パス（下記で説明される）に接続してもよい。Ｉ／Ｏ機能は、これらの通信パスのうちの１つ以上のものによって提供されてもよいが、図面が複雑になり過ぎることを回避するため、図７では単一パスとして示されている。

制御回路７０４は、処理回路７０６等の任意の好適な処理回路に基づいてもよい。本明細書で参照されるように、処理回路は、１つ以上のマイクロプロセッサ、マイクロコントローラ、デジタル信号プロセッサ、プログラマブル論理デバイス、フィールドプログラマブルゲートアレイ（ＦＰＧＡ）、特定用途向け集積回路（ＡＳＩＣ）等に基づく回路を意味すると理解され、マルチコアプロセッサ（例えば、デュアルコア、クアドコア、ヘクサコア、または任意の好適な数のコア）またはスーパーコンピュータを含んでもよい。いくつかの実施形態では、処理回路は、複数の別個のプロセッサまたは処理ユニット、例えば、複数の同一のタイプの処理ユニット（例えば、２つのＩｎｔｅｌＣｏｒｅｉ７プロセッサ）または複数の異なるプロセッサ（例えば、ＩｎｔｅｌＣｏｒｅｉ５プロセッサおよびＩｎｔｅｌＣｏｒｅｉ７プロセッサ）にわたって分散されてもよい。いくつかの実施形態では、制御回路７０４は、メモリ（すなわち、記憶装置７０８）に記憶されたメディアガイドアプリケーションに対する命令を実行する。具体的には、制御回路７０４は、メディアガイドアプリケーションによって、上記および下記で議論される機能を果たすように命令されてもよい。例えば、メディアガイドアプリケーションは、制御回路７０４に、メディアガイド表示を生成するための命令を提供してもよい。いくつかの実装では、制御回路７０４によって実施される任意のアクションは、メディアガイドアプリケーションから受信される命令に基づいてもよい。

クライアントサーバベースの実施形態では、制御回路７０４は、ガイドアプリケーションサーバまたは他のネットワークまたはサーバと通信するための好適な通信回路を含んでもよい。上記に述べられる機能性を実施するための命令は、ガイドアプリケーションサーバ上に記憶されてもよい。通信回路は、ケーブルモデム、総合デジタル通信網（ＩＳＤＮ）モデム、デジタルサブスクライバ回線（ＤＳＬ）モデム、電話モデム、イーサネット（登録商標）カード、または他の機器との通信用の無線モデム、または任意の他の好適な通信回路を含んでもよい。そのような通信は、インターネットまたは任意の他の好適な通信ネットワークまたはパスを伴ってもよい（図８に関連してさらに詳細に説明される）。加えて、通信回路は、ユーザ機器デバイスのピアツーピア通信、または相互から遠隔の場所にあるユーザ機器デバイスの通信を可能にする回路を含んでもよい（下記でさらに詳細に説明される）。

メモリは、制御回路７０４の一部である、記憶装置７０８として提供される、電子記憶デバイスであってもよい。本明細書で参照されるように、語句「電子記憶デバイス」または「記憶デバイス」とは、ランダムアクセスメモリ、読取専用メモリ、ハードドライブ、光学ドライブ、デジタルビデオディスク（ＤＶＤ）レコーダ、コンパクトディスク（ＣＤ）レコーダ、ＢＬＵ−ＲＡＹ（登録商標）ディスク（ＢＤ）レコーダ、ＢＬＵ−ＲＡＹ（登録商標）３Ｄディスクレコーダ、デジタルビデオレコーダ（ＤＶＲ、または時として、パーソナルビデオレコーダ（ＰＶＲ）と呼ばれる場合もある）、ソリッドステートデバイス、量子記憶デバイス、ゲームコンソール、ゲームメディア、または任意の他の好適な固定またはリムーバブル記憶デバイス、および／またはそれらの任意の組み合わせ等の電子データ、コンピュータソフトウェア、またはファームウェアを記憶するための任意のデバイスを意味すると理解されたい。記憶装置７０８は、本明細書に説明される種々のタイプのコンテンツ、および上記で説明されるメディアガイドデータを記憶するために使用されてもよい。不揮発性メモリもまた、（例えば、ブートアップルーチンおよび他の命令を起動するために）使用されてもよい。図８に関連して説明される、クラウドベースの記憶装置が、記憶装置７０８を補完するために使用される、または記憶装置７０８の代わりに使用されてもよい。

制御回路７０４は、１つ以上のアナログチューナ、１つ以上のＭＰＥＧ−２デコーダ、または他のデジタルデコード回路、高解像度チューナ、または任意の他の好適な同調またはビデオ回路、またはそのような回路の組み合わせ等のビデオ生成回路および同調回路を含んでもよい。（例えば、記憶するために、無線、アナログ、またはデジタル信号をＭＰＥＧ信号に変換するための）エンコード回路もまた、提供されてもよい。制御回路７０４はまた、コンテンツをユーザ機器７００の好ましい出力形式に上方変換および下方変換するためのスケーリング回路を含んでもよい。回路７０４はまた、デジタル信号とアナログ信号との間で変換するためのデジタル／アナログ変換回路およびアナログ／デジタル変換回路を含んでもよい。同調およびエンコード回路は、コンテンツを受信して表示する、再生する、または録画するために、ユーザ機器デバイスによって使用されてもよい。同調およびエンコード回路はまた、ガイドデータを受信するために使用されてもよい。例えば、同調、ビデオ生成、エンコード、デコード、暗号化、解読、スケーリング、およびアナログ／デジタル回路を含む、本明細書に説明される回路は、１つ以上の汎用または特殊プロセッサ上で起動するソフトウェアを使用して実装されてもよい。複数のチューナが、同時同調機能（例えば、視聴および録画機能、ピクチャインピクチャ（ＰＩＰ）機能、多重チューナ録画機能等）に対処するように提供されてもよい。記憶装置７０８が、ユーザ機器７００とは別のデバイスとして提供される場合、同調およびエンコード回路（複数のチューナを含む）は、記憶装置７０８と関連付けられてもよい。

ユーザは、ユーザ入力インターフェース７１０を使用して、命令を制御回路７０４に送信してもよい。ユーザ入力インターフェース７１０は、リモートコントロール、マウス、トラックボール、キーパッド、キーボード、タッチスクリーン、タッチパッド、スタイラス入力、ジョイスティック、音声認識インターフェース、または他のユーザ入力インターフェース等の任意の好適なユーザインターフェースであってもよい。ディスプレイ７１２は、独立型デバイスとして提供される、またはユーザ機器デバイス７００の他の要素と統合されてもよい。例えば、ディスプレイ７１２は、タッチスクリーンまたはタッチセンサ式ディスプレイであってもよい。そのような状況では、ユーザ入力インターフェース７１０は、ディスプレイ７１２と統合される、または組み合わせられてもよい。ディスプレイ７１２は、モニタ、テレビ、モバイルデバイス用液晶ディスプレイ（ＬＣＤ）、非晶質シリコンディスプレイ、低温ポリシリコンディスプレイ、電子インクディスプレイ、電気泳動ディスプレイ、アクティブマトリクスディスプレイ、エレクトロウェッティングディスプレイ、電気流体ディスプレイ、ブラウン管ディスプレイ、発光ダイオードディスプレイ、エレクトロルミネセントディスプレイ、プラズマディスプレイパネル、高性能アドレッシングディスプレイ、薄膜トランジスタディスプレイ、有機発光ダイオードディスプレイ、表面伝導型電子放出素子ディスプレイ（ＳＥＤ）、レーザテレビ、カーボンナノチューブ、量子ドットディスプレイ、干渉変調器ディスプレイ、または視覚的画像を表示するための任意の他の好適な機器のうちの１つ以上のものであってもよい。いくつかの実施形態では、ディスプレイ７１２は、ＨＤＴＶ対応型であり得る。いくつかの実施形態では、ディスプレイ７１２は、３Ｄディスプレイであってもよく、双方向メディアガイドアプリケーションおよび任意の好適なコンテンツは、３Ｄで表示されてもよい。ビデオカードまたはグラフィックカードは、ディスプレイ７１２への出力を生成してもよい。ビデオカードは、３Ｄシーンおよび２Ｄグラフィックのレンダリング加速、ＭＰＥＧ−２／ＭＰＥＧ−４デコード、ＴＶ出力、または複数のモニタを接続する能力等の種々の機能を提供し得る。ビデオカードは、制御回路７０４に関連する上記で説明される任意の処理回路であってもよい。ビデオカードは、制御回路７０４と統合されてもよい。スピーカ７１４は、ユーザ機器デバイス７００の他の要素と統合されたものとして提供されてもよい、または独立型ユニットであってもよい。ディスプレイ７１２上に表示されるビデオおよび他のコンテンツのオーディオコンポーネントは、スピーカ７１４を通して再生されてもよい。いくつかの実施形態では、オーディオは、スピーカ７１４を介して音声を処理および出力する、受信機（図示せず）に配布されてもよい。

ガイドアプリケーションは、任意の好適なアーキテクチャを使用して実装されてもよい。例えば、これは、ユーザ機器デバイス７００上で完全に実装される、独立型アプリケーションであってもよい。そのようなアプローチでは、アプリケーションの命令は、ローカルで（例えば、記憶装置７０８内に）記憶され、アプリケーションによって使用するためのデータは、周期的にダウンロードされる（例えば、帯域外フィードから、インターネットリソースから、または別の好適なアプローチを使用して）。制御回路７０４は、記憶装置７０８からアプリケーションの命令を読み出し、本明細書で議論される表示のうちのいずれかを生成するための命令を処理してもよい。処理された命令に基づいて、制御回路７０４は、入力が入力インターフェース７１０から受信されるときに実施するアクションを決定してもよい。例えば、表示上のカーソルの上／下への移動は、入力インターフェース７１０が上／下ボタンが選択されたことを示すとき、処理された命令によって示されてもよい。

いくつかの実施形態では、メディアガイドアプリケーションは、クライアントサーバベースのアプリケーションである。ユーザ機器デバイス７００上に実装される、シックまたはシンクライアントによって使用するためのデータは、ユーザ機器デバイス７００の遠隔にあるサーバに要求を発行することによって、オンデマンドで読み出される。クライアントサーバベースのガイドアプリケーションの一実施例では、制御回路７０４は、遠隔サーバによって提供されるウェブページを解釈する、ウェブブラウザを起動する。例えば、遠隔サーバは、記憶デバイス内にアプリケーションのための命令を記憶してもよい。遠隔サーバは、回路（例えば、制御回路７０４）を使用して、記憶された命令を処理し、上記および下記で議論される表示を生成してもよい。クライアントデバイスは、遠隔サーバによって生成される表示を受信してもよく、表示のコンテンツを機器デバイス７００上でローカルで表示してもよい。このように、命令の処理が、サーバによって遠隔で実施される一方、結果として生じる表示は、機器デバイス７００上にローカルで提供される。機器デバイス７００は、入力インターフェース７１０を介して、ユーザからの入力を受信し、対応する表示を処理および生成するために、それらの入力を遠隔サーバに伝送してもよい。例えば、機器デバイス７００は、上／下ボタンが入力インターフェース７１０を介して選択されたことを示す通信を遠隔サーバに伝送してもよい。遠隔サーバは、その入力に従って命令を処理し、入力に対応するアプリケーションの表示を生成してもよい（例えば、カーソルを上／下に移動させる表示）。生成された表示は、次いで、ユーザへの提示のために、機器デバイス７００に伝送される。

いくつかの実施形態では、メディアガイドアプリケーションは、インタープリタまたは仮想マシン（制御回路７０４によって起動される）によって、ダウンロードされ、解釈または別様に起動される。いくつかの実施形態では、ガイドアプリケーションは、ＥＴＶバイナリ交換形式（ＥＴＶＢｉｎａｒｙＩｎｔｅｒｃｈａｎｇｅＦｏｒｍａｔ／ＥＢＩＦ）でエンコードされ、好適なフィードの一部として制御回路７０４によって受信され、制御回路７０４上で起動するユーザエージェントによって解釈されてもよい。例えば、ガイドアプリケーションは、ＥＢＩＦアプリケーションであってもよい。いくつかの実施形態では、ガイドアプリケーションは、制御回路７０４によって実行されるローカル仮想マシンまたは他の好適なミドルウェアによって受信および起動される、一連のＪＡＶＡ（登録商標）ベースのファイルによって定義されてもよい。そのような実施形態のうちのいくつか（例えば、ＭＰＥＧ−２または他のデジタルメディアエンコードスキームを採用するもの）では、ガイドアプリケーションは、例えば、番組のＭＰＥＧオーディオおよびビデオパケットを用いたＭＰＥＧ−２オブジェクトカルーセルにおいてエンコードおよび伝送されてもよい。

図７のユーザ機器デバイス７００は、ユーザテレビ機器８０２、ユーザコンピュータ機器８０４、無線ユーザ通信デバイス８０６、または非携帯用ゲーム機等のコンテンツにアクセスするために好適な任意の他のタイプのユーザ機器として、図８のシステム８００に実装されることができる。簡単にするために、これらのデバイスは、本明細書では総称して、ユーザ機器またはユーザ機器デバイスと称されてもよく、上記で説明されるユーザ機器デバイスに実質的に類似し得る。メディアガイドアプリケーションが実装され得る、ユーザ機器デバイスは、独立型デバイスとして機能してもよい、またはデバイスのネットワークの一部であってもよい。デバイスの種々のネットワーク構成が実装されてもよく、下記でさらに詳細に議論される。

図７に関連して上記で説明されるシステム特徴のうちの少なくともいくつかを利用する、ユーザ機器デバイスは、単に、ユーザテレビ機器８０２、ユーザコンピュータ機器８０４、または無線ユーザ通信デバイス８０６として分類されなくてもよい。例えば、ユーザテレビ機器８０２は、いくつかのユーザコンピュータ機器８０４のように、インターネットコンテンツへのアクセスを可能にするインターネット対応型であり得る一方で、ユーザコンピュータ機器８０４は、あるテレビ機器８０２のように、テレビ番組へのアクセスを可能にするチューナを含んでもよい。メディアガイドアプリケーションはまた、種々の異なるタイプのユーザ機器上で同一のレイアウトを有してもよい、またはユーザ機器の表示能力に合わせられてもよい。例えば、ユーザコンピュータ機器８０４上では、ガイドアプリケーションは、ウェブブラウザによってアクセスされるウェブサイトとして提供されてもよい。別の実施例では、ガイドアプリケーションは、無線ユーザ通信デバイス８０６用に縮小されてもよい。

システム８００では、典型的には、各タイプのユーザ機器デバイスが１つを上回って存在するが、図面が複雑になり過ぎることを回避するように、それぞれ１つだけが図８に示されている。加えて、各ユーザは、１つを上回るタイプのユーザ機器デバイスと、また、各タイプのユーザ機器デバイスのうちの１つを上回るものとを利用してもよい。

いくつかの実施形態では、ユーザ機器デバイス（例えば、ユーザテレビ機器８０２、ユーザコンピュータ機器８０４、無線ユーザ通信デバイス８０６）は、「第２の画面デバイス」と称されてもよい。例えば、第２の画面デバイスは、第１のユーザ機器デバイス上に提示されるコンテンツを補完してもよい。第２の画面デバイス上に提示されるコンテンツは、第１のデバイス上に提示されるコンテンツを補完する、任意の好適なコンテンツであってもよい。いくつかの実施形態では、第２の画面デバイスは、第１のデバイスの設定および表示選好を調節するためのインターフェースを提供する。いくつかの実施形態では、第２の画面デバイスは、他の第２の画面デバイスと相互作用する、またはソーシャルネットワークと相互作用するために構成される。第２の画面デバイスは、第１のデバイスと同一の部屋内に、第１のデバイスと異なる部屋であるが、同一の家または建物内に、または第１のデバイスと異なる建物内に位置することができる。

ユーザはまた、家庭内デバイスおよび遠隔デバイスにわたって一貫したメディアガイドアプリケーション設定を維持するように、種々の設定を設定してもよい。設定は、本明細書に説明されるもの、およびお気に入りのチャネルおよび番組、番組を推奨するためにガイドアプリケーションが利用する番組選好、表示選好、および他の望ましいガイド設定を含む。例えば、ユーザが、オフィスのパーソナルコンピュータ上で、例えば、ウェブサイトｗｗｗ．ａｌｌｒｏｖｉ．ｃｏｍの上で、チャネルをお気に入りとして設定した場合、同一のチャネルが、ユーザの家庭内デバイス（例えば、ユーザテレビ機器およびユーザコンピュータ機器）上で、および所望に応じて、ユーザのモバイルデバイス上でお気に入りとして表示されるであろう。したがって、同一タイプのユーザ機器デバイスであるかまたは異なるタイプのユーザ機器デバイスであるかにかかわらず、１つのユーザ機器デバイス上で行われる変更は、別のユーザ機器デバイス上のガイド体験を変更することができる。加えて、行われる変更は、ユーザによって入力される設定、およびガイドアプリケーションによって監視されるユーザアクティビティに基づいてもよい。

ユーザ機器デバイスは、通信ネットワーク８１４に結合されてもよい。すなわち、ユーザテレビ機器８０２、ユーザコンピュータ機器８０４、および無線ユーザ通信デバイス８０６は、それぞれ、通信パス８０８、８１０、および８１２を介して、通信ネットワーク８１４に結合される。通信ネットワーク８１４は、インターネット、携帯電話ネットワーク、モバイルボイスまたはデータネットワーク（例えば、４ＧまたはＬＴＥネットワーク）、ケーブルネットワーク、公衆交換電話ネットワーク、または他のタイプの通信ネットワーク、または通信ネットワークの組み合わせを含む、１つ以上のネットワークであってもよい。パス８０８、８１０、および８１２は、別個または一緒に、衛星パス、光ファイバパス、ケーブルパス、インターネット通信をサポートするパス（例えば、ＩＰＴＶ）、フリースペース接続（例えば、放送または他の無線信号用）、または任意の他の好適な有線または無線通信パス、またはそのようなパスの組み合わせ等の１つ以上の通信パスを含んでもよい。パス８１２は、図８に示される例示的実施形態では、無線パスであることを示すように破線で描かれ、パス８０８および８１０は、有線パスであることを示すように実線として描かれている（しかし、これらのパスは、所望に応じて、無線パスであってもよい）。ユーザ機器デバイスとの通信は、これらの通信パスのうちの１つ以上のものによって提供されてもよいが、図８では、図面が複雑になり過ぎることを回避するように、単一パスとして示されている。

通信パスは、ユーザ機器デバイスの間には描かれていないが、これらのデバイスは、パス８０８、８１０、および８１２に関連して上記で説明されるもの、およびＵＳＢケーブル、ＩＥＥＥ１３９４ケーブル、無線パス（例えば、Ｂｌｕｅｔｏｏｔｈ（登録商標）、赤外線、ＩＥＥＥ８０２−１１ｘ等）等の他の短距離ポイントツーポイント通信パス、または有線または無線パスを介した他の短距離通信等の通信パス等を介して、相互に直接通信してもよい。ＢＬＵＥＴＯＯＴＨ（登録商標）は、Ｂｌｕｅｔｏｏｔｈ（登録商標）ＳＩＧ，ＩＮＣ．によって所有される認証マークである。ユーザ機器デバイスはまた、通信ネットワーク８１４を介した間接パスを通して、相互に直接通信してもよい。

システム８００は、それぞれ、通信パス８２０および８２２を介して、通信ネットワーク８１４に結合される、コンテンツソース８１６およびメディアガイドデータソース８１８を含む。パス８２０および８２２は、パス８０８、８１０、および８１２に関連して上記で説明される通信パスのうちのいずれかを含んでもよい。コンテンツソース８１６およびメディアガイドデータソース８１８との通信は、１つ以上の通信パスを介して交信されてもよいが、図８では、図面が複雑になり過ぎることを回避するように、単一パスとして示される。加えて、コンテンツソース８１６およびメディアガイドデータソース８１８のそれぞれが１つを上回って存在し得るが、図８では、図面が複雑になり過ぎることを回避するように、それぞれ１つだけが示されている。（異なるタイプのこれらのソースのそれぞれが以下で議論される）。所望に応じて、コンテンツソース８１６およびメディアガイドデータソース８１８は、１つのソースデバイスとして統合されてもよい。ソース８１６および８１８と、ユーザ機器デバイス８０２、８０４、および８０６との間の通信は、通信ネットワーク８１４を通したものとして示されるが、いくつかの実施形態では、ソース８１６および８１８は、パス８０８、８１０、および８１２に関連して上記で説明されるもの等の通信パス（図示せず）を介して、ユーザ機器デバイス８０２、８０４、および８０６と直接通信してもよい。

コンテンツソース８１６は、テレビ配信施設、ケーブルシステムヘッドエンド、衛星配信施設、番組ソース（例えば、ＮＢＣ、ＡＢＣ、ＨＢＯ等のテレビ放送会社）、中間配信施設および／またはサーバ、インターネットプロバイダ、オンデマンドメディアサーバ、および他のコンテンツプロバイダを含む、１つ以上のタイプのコンテンツ配信機器を含んでもよい。ＮＢＣは、ＮａｔｉｏｎａｌＢｒｏａｄｃａｓｔｉｎｇＣｏｍｐａｎｙ，Ｉｎｃ．によって所有される商標であり、ＡＢＣは、ＡｍｅｒｉｃａｎＢｒｏａｄｃａｓｔｉｎｇＣｏｍｐａｎｙ，ＩＮＣ．によって所有される商標であり、ＨＢＯは、ＨｏｍｅＢｏｘＯｆｆｉｃｅ，Ｉｎｃ．によって所有される商標である。コンテンツソース８１６は、コンテンツの発信元であってもよい（例えば、テレビ放送会社、ウェブキャストプロバイダ等）、またはコンテンツの発信元でなくてもよい（例えば、オンデマンドコンテンツプロバイダ、ダウンロード用放送番組のコンテンツのインターネットプロバイダ等）。コンテンツソース８１６は、ケーブルソース、衛星プロバイダ、オンデマンドプロバイダ、インターネットプロバイダ、オーバーザトップコンテンツプロバイダ、または他のコンテンツのプロバイダを含んでもよい。コンテンツソース８１６はまた、ユーザ機器デバイスのうちのいずれかから遠隔の場所にある、異なるタイプのコンテンツ（ユーザによって選択されるビデオコンテンツを含む）を記憶するために使用される、遠隔メディアサーバを含んでもよい。コンテンツの遠隔記憶のため、および遠隔に記憶されたコンテンツをユーザ機器に提供するためのシステムおよび方法は、２０１０年７月２０日発行のＥｌｌｉｓｅｔａｌ．の米国特許第７，７６１，８９２号（その全体として参照することによって本明細書に組み込まれる）に関連して、さらに詳細に議論されている。

メディアガイドデータソース８１８は、上記で説明されるメディアガイドデータ等のメディアガイドデータを提供してもよい。メディアガイドデータは、任意の好適なアプローチを使用して、ユーザ機器デバイスに提供されてもよい。いくつかの実施形態では、ガイドアプリケーションは、データフィード（例えば、継続フィードまたはトリクルフィード）を介して、番組ガイドデータを受信する、独立型双方向テレビ番組ガイドであってもよい。番組スケジュールデータおよび他のガイドデータは、テレビチャネルのサイドバンド上で、帯域内デジタル信号を使用して、帯域外デジタル信号を使用して、または任意の他の好適なデータ伝送技術によって、ユーザ機器に提供されてもよい。番組スケジュールデータおよび他のメディアガイドデータは、複数のアナログまたはデジタルテレビチャネル上でユーザ機器に提供されてもよい。

いくつかの実施形態では、メディアガイドデータソース８１８からのガイドデータは、クライアントサーバアプローチを使用して、ユーザの機器に提供されてもよい。例えば、ユーザ機器デバイスは、メディアガイドデータをサーバからプルしてもよい、またはサーバは、メディアガイドデータをユーザ機器デバイスにプッシュしてもよい。いくつかの実施形態では、ユーザの機器上に常駐するガイドアプリケーションクライアントは、必要に応じて、例えば、ガイドデータが古くなっているとき、またはユーザ機器デバイスがデータを受信する要求をユーザから受信するとき、ソース８１８とセッションを開始し、ガイドデータを取得してもよい。メディアガイドは、任意の好適な頻度で（例えば、継続的に、毎日、ユーザ規定期間で、システム規定期間で、ユーザ機器からの要求に応答して等）ユーザ機器に提供されてもよい。メディアガイドデータソース８１８は、ユーザ機器デバイス８０２、８０４、および８０６に、メディアガイドアプリケーション自体、またはメディアガイドアプリケーションのソフトウェア更新を提供してもよい。

いくつかの実施形態では、メディアガイドデータは、視聴者データを含んでもよい。例えば、視聴者データは、現在および／または履歴ユーザアクティビティ情報（例えば、ユーザが典型的に鑑賞するコンテンツ、ユーザがコンテンツを鑑賞する時刻、ユーザがソーシャルネットワークと相互作用するかどうか、ユーザがソーシャルネットワークと相互作用し、情報をポストする時間、ユーザが典型的に鑑賞するコンテンツのタイプ（例えば、有料ＴＶまたは無料ＴＶ）、気分、脳の活動情報等）を含んでもよい。メディアガイドデータはまた、サブスクリプションデータを含んでもよい。例えば、サブスクリプションデータは、所与のユーザがサブスクライブするソースまたはサービスおよび／または所与のユーザが以前にサブスクライブしていたが、後にアクセスを打ち切ったソースもしくサービス（例えば、ユーザがプレミアムチャネルにサブスクライブしているかどうか、ユーザがプレミアムレベルのサービスを追加したかどうか、ユーザがインターネット速度を加速させたかどうか）を識別してもよい。いくつかの実施形態では、視聴者データおよび／またはサブスクリプションデータは、１年を上回る周期の間の所与のユーザのパターンを識別してもよい。メディアガイドデータは、所与のユーザがサービス／ソースへのアクセスを打ち切るであろう可能性を示すスコアを生成するために使用される、モデル（例えば、残存者モデル）を含んでもよい。例えば、メディアガイドアプリケーションは、所与のユーザが特定のサービスまたはソースへのアクセスを打ち切るであろうかどうかの可能性を示す、値またはスコアを生成するためのモデルを使用して、サブスクリプションデータとともに視聴者データを処理してもよい。特に、より高いスコアは、ユーザが特定のサービスまたはソースへのアクセスを打ち切るであろう、より高いレベルの信頼性を示し得る。スコアに基づいて、メディアガイドアプリケーションは、ユーザがアクセスを打ち切る可能性が高いであろうものとしてスコアによって示される特定のサービスまたはソースをユーザが維持するように勧誘する宣伝を生成してもよい。

メディアガイドアプリケーションは、例えば、ユーザ機器デバイス上に実装される独立型アプリケーションであってもよい。例えば、メディアガイドアプリケーションは、記憶装置７０８内に記憶され、ユーザ機器デバイス７００の制御回路７０４によって実行され得る、ソフトウェアまたは実行可能命令のセットとして実装されてもよい。いくつかの実施形態では、メディアガイドアプリケーションは、クライアント−サーバアプリケーションであってもよく、その場合、クライアントアプリケーションのみが、ユーザ機器デバイス上に常駐し、サーバアプリケーションは、遠隔サーバ上に常駐する。例えば、メディアガイドアプリケーションは、部分的に、ユーザ機器デバイス７００の制御回路７０４上のクライアントアプリケーションとして、および遠隔サーバの制御回路上で起動するサーバアプリケーション（例えば、メディアガイドデータソース８１８）として部分的に遠隔サーバ上で、実装されてもよい。遠隔サーバの制御回路（メディアガイドデータソース８１８等）によって実行されると、メディアガイドアプリケーションは、制御回路に、ガイドアプリケーション表示を生成し、生成された表示をユーザ機器デバイスに伝送するように命令してもよい。サーバアプリケーションは、メディアガイドデータソース８１８の制御回路に、ユーザ機器上での記憶のためのデータを伝送するように命令してもよい。クライアントアプリケーションは、受信用ユーザ機器の制御回路に、ガイドアプリケーション表示を生成するように命令してもよい。

ユーザ機器デバイス８０２、８０４、および８０６に配信されるコンテンツおよび／またはメディアガイドデータは、オーバーザトップ（ＯＴＴ）コンテンツであってもよい。ＯＴＴコンテンツ配信は、上記で説明される任意のユーザ機器デバイスを含む、インターネット対応型ユーザデバイスが、ケーブルまたは衛星接続を経由して受信されるコンテンツに加えて、上記で説明される任意のコンテンツを含む、インターネットを経由して転送されるコンテンツを受信することを可能にする。ＯＴＴコンテンツは、インターネットサービスプロバイダ（ＩＳＰ）によって提供されるインターネット接続を介して配信されるが、第三者も、コンテンツを配布する。ＩＳＰは、視聴能力、著作権、またはコンテンツの再配布に責任がない場合があり、ＯＴＴコンテンツプロバイダによって提供されるＩＰパケットのみを転送してもよい。ＯＴＴコンテンツプロバイダの実施例は、ＩＰパケットを介して、オーディオおよびビデオを提供する、ＹＯＵＴＵＢＥ（登録商標）、ＮＥＴＦＬＩＸ、およびＨＵＬＵを含む。Ｙｏｕｔｕｂｅは、ＧｏｏｇｌｅＩｎｃ．によって所有される商標であり、Ｎｅｔｆｌｉｘは、Ｎｅｔｆｌｉｘ，Ｉｎｃ．によって所有される商標であり、Ｈｕｌｕは、Ｈｕｌｕ，ＬＬＣ．によって所有される商標である。ＯＴＴコンテンツプロバイダは、加えて、または代替として、上記で説明されるメディアガイドデータを提供してもよい。コンテンツおよび／またはメディアガイドデータに加えて、ＯＴＴコンテンツのプロバイダは、メディアガイドアプリケーション（例えば、ウェブベースのアプリケーションまたはクラウドベースのアプリケーション）を配布することができる、またはコンテンツは、ユーザ機器デバイス上に記憶されたメディアガイドアプリケーションによって表示されることができる。

メディアガイドシステム８００は、いくつかのアプローチまたはネットワーク構成を例証することを意図しており、これによって、ユーザ機器デバイスおよびコンテンツおよびガイドデータのソースは、コンテンツにアクセスし、メディアガイドを提供する目的のために、相互に通信してもよい。本明細書に説明される実施形態は、これらのアプローチのうちのいずれか１つまたは一部において、またはコンテンツを配信し、メディアガイドを提供するための他のアプローチを採用するシステムにおいて、適用されてもよい。以下の４つのアプローチは、図８の一般化された実施例の具体的例証を提供する。

１つのアプローチでは、ユーザ機器デバイスは、ホームネットワーク内で相互に通信してもよい。ユーザ機器デバイスは、上記で説明される短距離ポイントツーポイント通信方式を介して、ホームネットワーク上に提供されるハブまたは他の類似デバイスを通した間接パスを介して、または通信ネットワーク８１４を介して、相互に直接通信することができる。１つの家庭内の複数の個人のそれぞれが、ホームネットワーク上の異なるユーザ機器デバイスを動作させてもよい。結果として、種々のメディアガイド情報または設定が、異なるユーザ機器デバイスの間で通信されることが望ましくあり得る。例えば、２００５年７月１１日出願のＥｌｌｉｓｅｔａｌ．の米国特許公開第２００５／０２５１８２７号でさらに詳細に説明されるように、ホームネットワーク内の異なるユーザ機器デバイス上で、ユーザが一貫したメディアガイドアプリケーション設定を維持することが望ましくあり得る。ホームネットワーク内の異なるタイプのユーザ機器デバイスもまた、相互に通信し、コンテンツを伝送してもよい。例えば、ユーザは、ユーザコンピュータ機器から携帯用ビデオプレーヤまたは携帯用音楽プレーヤにコンテンツを伝送してもよい。

第２のアプローチでは、ユーザは、複数のタイプのユーザ機器を有してもよく、これによって、コンテンツにアクセスし、メディアガイドを取得する。例えば、一部のユーザは、家庭内およびモバイルデバイスによってアクセスされる、ホームネットワークを有してもよい。ユーザは、遠隔デバイス上に実装されるメディアガイドアプリケーションを介して、家庭内デバイスを制御してもよい。例えば、ユーザは、そのオフィスのパーソナルコンピュータ、またはＰＤＡまたはウェブ対応携帯電話等のモバイルデバイスを介して、ウェブサイト上のオンラインメディアガイドアプリケーションにアクセスしてもよい。ユーザは、オンラインガイドアプリケーション上で種々の設定（例えば、録画、リマインダ、または他の設定）を設定して、ユーザの家庭内機器を制御してもよい。オンラインガイドは、直接、またはユーザの家庭内機器上のメディアガイドアプリケーションと通信することによって、ユーザの機器を制御してもよい。ユーザ機器デバイスが相互から遠隔の場所にある、ユーザ機器デバイスの通信のための種々のシステムおよび方法は、例えば、Ｅｌｌｉｓｅｔａｌ．の２０１１年１０月２５日発行の米国特許第８，０４６，８０１号（その全体を参照することによって本明細書に組み込まれる）で議論されている

第３のアプローチでは、家庭内外のユーザ機器デバイスのユーザは、コンテンツソース８１６と直接通信し、コンテンツにアクセスするために、そのメディアガイドアプリケーションを使用することができる。具体的には、家庭内では、ユーザテレビ機器８０２およびユーザコンピュータ機器８０４のユーザは、メディアガイドアプリケーションにアクセスし、所望のコンテンツ間をナビゲートし、それを特定してもよい。ユーザはまた、無線ユーザ通信デバイス８０６を使用して、家庭外のメディアガイドアプリケーションにアクセスし、所望のコンテンツ間をナビゲートし、それを特定してもよい。

第４のアプローチでは、ユーザ機器デバイスは、クラウドコンピューティング環境内で動作し、クラウドサービスにアクセスしてもよい。クラウドコンピューティング環境では、コンテンツ共有、記憶、または配布のための種々のタイプのコンピューティングサービス（例えば、ビデオ共有サイトまたはソーシャルネットワーキングサイト）が、「クラウド」と称される、ネットワークアクセス可能コンピューティングおよび記憶リソースの集合によって提供される。例えば、クラウドは、通信ネットワーク８１４を介したインターネット等のネットワークを介して接続される、種々のタイプのユーザおよびデバイスにクラウドベースのサービスを提供する、中央にまたは分散場所に位置し得る、サーバコンピューティングデバイスの集合を含むことができる。これらのクラウドリソースは、１つ以上のコンテンツソース８１６と、１つ以上のメディアガイドデータソース８１８とを含んでもよい。加えて、または代替として、遠隔コンピューティングサイトは、ユーザテレビ機器８０２、ユーザコンピュータ機器８０４、および無線ユーザ通信デバイス８０６等の他のユーザ機器デバイスを含んでもよい。例えば、他のユーザ機器デバイスは、ビデオの記憶されたコピーまたはストリーミングされたビデオへのアクセスを提供してもよい。そのような実施形態では、ユーザ機器デバイスは、中央サーバと通信することなく、ピアツーピア様式で動作してもよい。

クラウドは、ユーザ機器デバイスのために、他の実施例の中でもとりわけ、コンテンツ記憶、コンテンツ共有、またはソーシャルネットワーキングサービス等のサービスへのアクセス、および上記で説明される任意のコンテンツへのアクセスを提供する。サービスは、クラウドコンピューティングサービスプロバイダを通して、またはオンラインサービスの他のプロバイダを通して、クラウド内で提供されることができる。例えば、クラウドベースのサービスは、コンテンツ記憶サービス、コンテンツ共有サイト、ソーシャルネットワーキングサイト、または他のサービスを含むことができ、それを介して、ユーザ供給コンテンツは、接続されたデバイス上で他者によって視聴するために配布される。これらのクラウドベースのサービスは、ユーザ機器デバイスが、コンテンツをローカルで記憶し、ローカルで記憶されたコンテンツにアクセスするのではなく、コンテンツをクラウドに記憶し、コンテンツをクラウドから受信することを可能にしてもよい。

ユーザは、カムコーダ、ビデオモード付きデジタルカメラ、オーディオレコーダ、携帯電話、およびハンドヘルドコンピューティングデバイス等の種々のコンテンツ捕捉デバイスを使用して、コンテンツを録画してもよい。ユーザは、直接、例えば、ユーザコンピュータ機器８０４から、またはコンテンツ捕捉特徴を有する、無線ユーザ通信デバイス８０６からのいずれかにおいて、クラウド上のコンテンツ記憶サービスにコンテンツをアップロードすることができる。代替として、ユーザは、最初に、コンテンツをユーザコンピュータ機器８０４等のユーザ機器デバイスに転送することができる。コンテンツを記憶するユーザ機器デバイスは、通信ネットワーク８１４上のデータ伝送サービスを使用して、コンテンツをクラウドにアップロードする。いくつかの実施形態では、ユーザ機器デバイス自体が、クラウドリソースであり、他のユーザ機器デバイスは、直接、ユーザがコンテンツを記憶したユーザ機器デバイスから、コンテンツにアクセスすることができる。

クラウドリソースは、例えば、ウェブブラウザ、メディアガイドアプリケーション、デスクトップアプリケーション、モバイルアプリケーション、および／またはそれらのアクセスアプリケーションの任意の組み合わせを使用して、ユーザ機器デバイスによってアクセスされてもよい。ユーザ機器デバイスは、アプリケーション配信のためにクラウドコンピューティングに依拠する、クラウドクライアントであってもよい、またはユーザ機器デバイスは、クラウドリソースにアクセスすることなく、ある機能性を有してもよい。例えば、ユーザ機器デバイス上で起動するいくつかのアプリケーションは、クラウドアプリケーション、すなわち、インターネットを経由して、サービスとして配信されるアプリケーションであってもよい一方で、他のアプリケーションは、ユーザ機器デバイス上に記憶され、起動されてもよい。いくつかの実施形態では、ユーザデバイスは、コンテンツを複数のクラウドリソースから同時に受信してもよい。例えば、ユーザデバイスは、オーディオを１つのクラウドリソースからストリーミングする一方で、コンテンツを第２のクラウドリソースからダウンロードすることができる。または、ユーザデバイスは、より効率的なダウンロードのために、コンテンツを複数のクラウドリソースからダウンロードすることができる。いくつかの実施形態では、ユーザ機器デバイスは、図７に関連して説明される処理回路によって実施される処理動作等の処理動作のために、クラウドリソースを使用することができる。

本明細書で参照されるように、用語「〜に応答して」は、「〜の結果として開始される」ことを指す。例えば、第２のアクションに応答して実施されている第１のアクションは、第１のアクションと第２のアクションとの間に介在ステップを含んでもよい。本明細書で参照されるように、用語「〜に直接応答して」は、「〜によって引き起こされる」ことを指す。例えば、第２のアクションに直接応答して実施されている第１のアクションは、第１のアクションと第２のアクションとの間に介在ステップを含まなくてもよい。

図９は、本開示のいくつかの実施形態による、制御回路（例えば、制御回路７０４）がメディアガイドアプリケーションを使用して表示されるメディアアセットのための画面上のキャプションテキストの中の誤った用語を訂正するための例証的プロセスのフローチャート９００である。いくつかの実施形態では、本アルゴリズムは、処理回路（例えば、処理回路７０６）によってデコードおよび実行される命令のセットとして、非一過性の記憶媒体（例えば、記憶デバイス７０８）上に、エンコードされてもよい。処理回路は、ひいては、同調、ビデオ生成、エンコード、デコード、暗号化、解読、スケーリング、アナログ／デジタル変換回路、および同等物等の命令を制御回路７０４内に含有される他のサブ回路に提供してもよい。

双方向メディアガイドアプリケーションは、制御回路７０４に、メディアガイドアプリケーション上に提示されるメディアアセットの画面上のキャプションテキストの中の誤った用語を訂正するためのプロセスを初期化させてもよい。ステップ９１０では、メディアガイドアプリケーションは、制御回路７０４に、メディアアセットのオーディオストリームを分析させ、画面上のキャプションテキストの第１のテキストセグメントを決定させてもよい。例えば、メディアガイドアプリケーションは、スポーツニュース解説のオーディオストリームを分析し、それを画面上のキャプションテキストに自動的に書き写してもよい。メディアガイドアプリケーションは、制御回路７０４に、画面上のキャプションテキストの第１のテキストセグメントを「ＩｔｗｉｌｌｂｅｉｎｔｅｒｅｓｔｉｎｇｔｏｓｅｅｈｏｗＴｏｍＢｒａｄｙｐｅｒｆｏｒｍｓｄｅｓｐｉｔｅｂｅｉｎｇｉｎｔｈｅｎｅｗｓｆｏｒｄｉｖｐｌａｔｅｄａｔｅ」であると決定させてもよい。

ステップ９２０では、メディアガイドアプリケーションは、制御回路７０４に、画面上のキャプションテキストの第１のテキストセグメントの中の誤った用語を識別させてもよい。例えば、メディアガイドアプリケーションは、制御回路７０４に、「ｄｉｖｐｌａｔｅｄａｔｅ」が第１のテキストセグメントの中の誤った用語であることを識別させてもよい。いくつかの実施形態では、メディアガイドアプリケーションは、第１のテキストセグメントに自然言語処理を実施し、複数の文法規則に対して第１のテキストセグメントを比較することによって、誤った用語を識別してもよい。例えば、メディアガイドアプリケーションは、（例えば、「ＮＣＡＡｄｉｖｏｎｅ」のように）言葉「ｄｉｖ」の後に数字が続くことを要求する文法規則に対して上記の文を比較し、文法規則と対立するため、「ｄｉｖｐｌａｔｅｄａｔｅ」が誤った用語であることを決定してもよい。

ステップ９３０では、メディアガイドアプリケーションは、制御回路７０４に、第１のテキストセグメントに対応するメディアアセットのビデオストリームから、１つ以上のビデオフレームを抽出させてもよい。例えば、メディアガイドアプリケーションは、制御回路７０４に、上記の文がオーディオストリームの中で出現した時間に対応するビデオフレームをメディアアセットから抽出させてもよい。ビデオストリームは、インタビューにオーバーレイするバナーの中に以下の文、すなわち、「ＮｅｗｓｏｆｔｈｅＨｏｕｒ：ＰａｔｒｉｏｔｓｑｕａｒｔｅｒｂａｃｋｓｅｒｖｅｓＮＦＬｓｕｓｐｅｎｓｉｏｎ」を表示する、いくつかのビデオフレームを含む、ＴｏｍＢｒａｄｙのニュースインタビューであってもよい。メディアガイドアプリケーションは、文「ＩｔｗｉｌｌｂｅｉｎｔｅｒｅｓｔｉｎｇｔｏｓｅｅｈｏｗＴｏｍＢｒａｄｙｐｅｒｆｏｒｍｓｄｅｓｐｉｔｅｂｅｉｎｇｉｎｔｈｅｎｅｗｓｆｏｒｄｉｖｐｌａｔｅｄａｔｅ」がニュースでアナウンスされるのと実質的に同一の時間に対応するため、制御回路７０４に、これらのビデオフレームを抽出させてもよい。

ステップ９４０では、メディアガイドアプリケーションは、制御回路７０４に、１つ以上のビデオフレームのうちの第１のビデオフレームを分析させ、誤った用語と関連付けられる文脈用語を決定させてもよい。例えば、メディアガイドアプリケーションは、制御回路７０４に、バナーオーバーレイを伴うビデオフレームを分析させ、バナーからの文脈用語「Ｐａｔｒｉｏｔｓ」および「ＮＦＬｓｕｓｐｅｎｓｉｏｎ」が誤った用語「ｄｉｖｐｌａｔｅｄａｔｅ」と関連付けられることを決定させてもよい。

ステップ９５０では、メディアガイドアプリケーションは、制御回路７０４に、ナレッジグラフにアクセスさせ、文脈用語および第１のテキストセグメントの一部に基づいて、誤った用語のための候補訂正を識別させてもよい。例えば、メディアガイドアプリケーションは、制御回路７０４に、文脈用語「ＮＦＬｓｕｓｐｅｎｓｉｏｎ」および書き写された文の一部「ＴｏｍＢｒａｄｙ」に基づくナレッジグラフにアクセスさせ、「Ｄｅｆｌａｔｅｇａｔｅ」を誤った用語のための候補訂正として識別させてもよい。いくつかの実施形態では、ナレッジグラフは、記憶装置７０８、メディアコンテンツソース８１６、またはメディアガイドデータソース８１８等の制御回路７０４によってアクセス可能であるデータベースの中に記憶されてもよい。

ステップ９６０では、メディアガイドアプリケーションは、制御回路７０４に、画面上のキャプションテキストの第１のテキストセグメントの中の誤った用語を候補訂正と置換させてもよい。例えば、メディアガイドアプリケーションは、制御回路７０４に、第１のテキストセグメントがここで、「ＩｔｗｉｌｌｂｅｉｎｔｅｒｅｓｔｉｎｇｔｏｓｅｅｈｏｗＴｏｍＢｒａｄｙｐｅｒｆｏｒｍｓｄｅｓｐｉｔｅｂｅｉｎｇｉｎｔｈｅｎｅｗｓｆｏｒＤｅｆｌａｔｅｇａｔｅ」と読めるように、誤った用語「ｄｉｖｐｌａｔｅｄａｔｅ」を候補訂正「Ｄｅｆｌａｔｅｇａｔｅ」と置換させてもよい。

図９のステップまたは説明は、本開示の任意の他の実施形態と併用され得ることが考慮される。加えて、図９のアルゴリズムに関連して説明される説明は、本開示の目的を促すために、代替順序で、または並行して、行われてもよい。例えば、ステップ９５０におけるもの等の条件文および論理評価は、システムまたは方法の遅延を低減させる、または速度を増加させるように、任意の順序で、または並行して、または同時に実施されてもよい。さらなる実施例として、いくつかの実施形態では、いくつかの変数のインスタンスは、複数の論理プロセッサスレッドを使用して、並行して評価されてもよい、またはアルゴリズムは、分岐予測を組み込むことによって増進されてもよい。さらに、図９のプロセスは、適切に構成されたソフトウェアおよびハードウェアの組み合わせの上に実装され得、図７−８に関連して議論されるデバイスまたは機器のうちのいずれかは、プロセスのうちの１つ以上のものを実装するために使用され得ることに留意されたい。

図１０は、本開示のいくつかの実施形態による、制御回路（例えば、制御回路７０４）が、ナレッジグラフを使用して、メディアアセットのための画面上のキャプションテキストの中の誤った用語を識別および置換するための例証的プロセスのフローチャート１０００である。いくつかの実施形態では、本アルゴリズムは、非一過性の記憶媒体（例えば、記憶デバイス７０８）上に、処理回路（例えば、処理回路７０６）によってデコードおよび実行されるための命令のセットとしてエンコードされてもよい。処理回路は、ひいては、同調、ビデオ生成、エンコード、デコード、暗号化、解読、スケーリング、アナログ／デジタル変換回路、および同等物等の命令を制御回路７０４内に含有される他のサブ回路に提供してもよい。

ステップ１００２では、メディアガイドアプリケーションは、制御回路７０４に、メディアアセットのオーディオストリームを分析させ、画面上のキャプションテキストの第１のテキストセグメントを決定させてもよい。

ステップ１００４では、メディアガイドアプリケーションは、制御回路７０４に、第１のテキストセグメントに自然言語処理を実施させ、複数の文法規則に対して第１のテキストセグメントを比較させてもよい。例えば、メディアガイドアプリケーションは、（例えば、「ＮＣＡＡｄｉｖｏｎｅ」のように）言葉「ｄｉｖ」の後に数字が続くことを要求する文法規則に対して、文「ＩｔｗｉｌｌｂｅｉｎｔｅｒｅｓｔｉｎｇｔｏｓｅｅｈｏｗＴｏｍＢｒａｄｙｐｅｒｆｏｒｍｓｄｅｓｐｉｔｅｂｅｉｎｇｉｎｔｈｅｎｅｗｓｆｏｒｄｉｖｐｌａｔｅｄａｔｅ」（図９の実施例で使用されるような）を比較し、文法規則と対立するため、「ｄｉｖｐｌａｔｅｄａｔｅ」が誤った用語であることを決定してもよい。

ステップ１００６では、メディアガイドアプリケーションは、制御回路７０４に、第１のテキストセグメントが誤った用語を含有するかどうかを決定させてもよい。第１のテキストセグメントがいかなる誤った用語も含有しない場合、メディアガイドアプリケーションは、ステップ１００２に戻り、次のオーディオストリームを分析するであろう。しかしながら、第１のテキストセグメントが誤った用語を含有する場合、メディアガイドアプリケーションは、制御回路７０４をステップ１００８に進ませ、誤った用語を訂正しようとするであろう。上記の実施例では、メディアガイドアプリケーションは、文が誤った用語「ｄｉｖｐｌａｔｅｄａｔｅ」を含有することを決定してもよく、したがって、ステップ１００８に進むべきである。

ステップ１００８では、メディアガイドアプリケーションは、制御回路７０４に、第１のテキストセグメントに対応するメディアアセットのビデオストリームから、１つ以上のビデオフレームを抽出させてもよい。例えば、メディアガイドアプリケーションは、制御回路７０４に、上記の文がオーディオストリームの中で出現した時間に対応するビデオフレームをメディアアセットから抽出させてもよい。ビデオストリームは、インタビューにオーバーレイするバナーの中に以下の文、すなわち、「ＮｅｗｓｏｆｔｈｅＨｏｕｒ：ＰａｔｒｉｏｔｓｑｕａｒｔｅｒｂａｃｋｓｅｒｖｅｓＮＦＬｓｕｓｐｅｎｓｉｏｎ」を表示する、いくつかのビデオフレームを含む、ＴｏｍＢｒａｄｙのニュースインタビューであってもよい。メディアガイドアプリケーションは、文「ＩｔｗｉｌｌｂｅｉｎｔｅｒｅｓｔｉｎｇｔｏｓｅｅｈｏｗＴｏｍＢｒａｄｙｐｅｒｆｏｒｍｓｄｅｓｐｉｔｅｂｅｉｎｇｉｎｔｈｅｎｅｗｓｆｏｒｄｉｖｐｌａｔｅｄａｔｅ」がニュースでアナウンスされるのと実質的に同一の時間に対応するため、制御回路７０４に、これらのビデオフレームを抽出させてもよい。

ステップ１０１０では、メディアガイドアプリケーションは、制御回路７０４に、１つ以上のビデオフレームのうちの第１のビデオフレームを分析させ、誤った用語と関連付けられる文脈用語を決定させてもよい。例えば、メディアガイドアプリケーションは、制御回路７０４に、バナーオーバーレイを伴うビデオフレームを分析させ、バナーからの文脈用語「Ｐａｔｒｉｏｔｓ」および「ＮＦＬｓｕｓｐｅｎｓｉｏｎ」が誤った用語「ｄｉｖｐｌａｔｅｄａｔｅ」と関連付けられることを決定させてもよい。

ステップ１０１２では、メディアガイドアプリケーションは、制御回路７０４に、第１のテキストセグメントの一部からキーワードを抽出させてもよい。例えば、誤った用語「ｄｉｖｐｌａｔｅｄａｔｅ」を含有しない第１のテキストセグメントの一部から、メディアガイドアプリケーションは、キーワード「ＴｏｍＢｒａｄｙ」を抽出してもよい。

ステップ１０１４では、メディアガイドアプリケーションは、制御回路７０４に、文脈用語およびキーワードに対応する節点に関して、ナレッジグラフの中で検索させてもよい。上記からの実施例を続けると、メディアガイドアプリケーションは、ナレッジグラフの中の文脈用語「ＮＦＬｓｕｓｐｅｎｓｉｏｎ」およびキーワード「ＴｏｍＢｒａｄｙ」に対応する節点を検索してもよい。

ステップ１０１６では、メディアガイドアプリケーションは、制御回路７０４に、文脈用語およびキーワードと関連付けられるプロパティに関して、節点を分析させてもよい。例えば、メディアガイドアプリケーションは、「ＴｏｍＢｒａｄｙ」節点を分析し、生年月日（「Ａｕｇ．３，１９７７」）、身長（「６ｆｔ．４ｉｎ．」）、４０ヤードダッシュ時間（「５．２８ｓ」）、およびチーム（「ＮｅｗＥｎｇｌａｎｄＰａｔｒｉｏｔｓ」）等のプロパティを見出し、名前（「ＯｄｅｌｌＢｅｃｋｈａｍＪｒ．」、「ＴｏｍＢｒａｄｙ」、「ＪｏｓｈＢｒｏｗｎ」…）、長さ（「１」、「４」、「１」…）および理由（「Ｃｏｌｌｉｓｉｏｎ」、「Ｄｅｆｌａｔｅｇａｔｅ」、「ＰｅｒｓｏｎａｌＣｏｎｄｕｃｔ」…）を含有する、「ＮＦＬｓｕｓｐｅｎｓｉｏｎ」節点を分析してもよい。いくつかの実施形態では、プロパティはそれぞれ、ナレッジグラフの中の１つ以上の明確に異なる節点に対応し得る。例えば、「ＰｅｒｓｏｎａｌＣｏｎｄｕｃｔ」および「Ｄｅｆｌａｔｅｇａｔｅ」はそれぞれ、節点および別の節点のプロパティであり得る。

ステップ１０１８では、メディアガイドアプリケーションは、制御回路７０４に、ナレッジグラフから、誤った用語のための複数の潜在的訂正を決定させてもよい。ステップ１０２０では、メディアガイドアプリケーションは、制御回路７０４に、決定に基づいて、加重を複数の潜在的訂正のうちの各潜在的訂正に割り当てさせてもよい。例えば、上記の実施例において誤った用語のための候補訂正「Ｄｅｆｌａｔｅｇａｔｅ」を識別するために、メディアガイドアプリケーションは、最初に、「Ｑｕａｒｔｅｒｂａｃｋ」、「ＤｅｔｒｏｉｔＧａｍｅ」、および「Ｄｅｆｌａｔｅｇａｔｅ」等の複数の潜在的訂正を決定し、加重を各潜在的訂正に割り当ててもよい。

ステップ１０２２では、メディアガイドアプリケーションは、制御回路７０４に、候補訂正として、最高加重と関連付けられる潜在的訂正を識別させてもよい。例えば、メディアガイドアプリケーションは、最高加重を割り当てられているため、３つの潜在的訂正のうちの「Ｄｅｆｌａｔｅｇａｔｅ」を候補訂正として識別してもよい。

ステップ１０２４では、メディアガイドアプリケーションは、制御回路７０４に、画面上のキャプションテキストの第１のテキストセグメントの中の誤った用語を候補訂正と置換させてもよい。例えば、メディアガイドアプリケーションは、第１のテキストセグメントがここで、「ＩｔｗｉｌｌｂｅｉｎｔｅｒｅｓｔｉｎｇｔｏｓｅｅｈｏｗＴｏｍＢｒａｄｙｐｅｒｆｏｒｍｓｄｅｓｐｉｔｅｂｅｉｎｇｉｎｔｈｅｎｅｗｓｆｏｒＤｅｆｌａｔｅｇａｔｅ」と読めるように、制御回路７０４に、誤った用語「ｄｉｖｐｌａｔｅｄａｔｅ」を候補訂正「Ｄｅｆｌａｔｅｇａｔｅ」と置換させてもよい。

上記で議論されるプロセスは、例証であって、限定を意図するものではない。当業者は、本明細書で議論されるプロセスのステップが、本発明の範囲から逸脱することなく、省略される、修正される、組み合わせられる、および／または再配列されてもよく、任意の付加的ステップが、実施されてもよいことを理解するであろう。より一般的には、上記の開示は、例示的あって、限定を意図するものではない。続く請求項のみが、本発明が含むものに関する境界を設定することが意図される。さらに、いずれか１つの実施形態で説明される特徴および限定は、本明細書の任意の他の実施形態に適用され得、一実施形態に関するフローチャートまたは実施例は、好適な様式で任意の他の実施形態と組み合わせられ、異なる順序で行われ、または並行して行われ得ることに留意されたい。加えて、本明細書で説明されるシステムおよび方法は、リアルタイムで実施されてもよい。また、上記で説明されるシステムおよび／または方法は、他のシステムおよび／または方法に適用される、またはそれらに従って使用され得ることにも留意されたい。

Claims

メディアアセットのための画面上のキャプションテキストの中の誤った用語を訂正するための方法であって、
前記画面上のキャプションテキストの第１のテキストセグメントの中の前記誤った用語を識別することと、
前記第１のテキストセグメントに対応する前記メディアアセットの１つ以上のビデオフレームを識別することと、
前記１つ以上のビデオフレームから、前記誤った用語に関連する第１の文脈用語を識別することと、
ナレッジグラフにアクセスすることにより、前記第１の文脈用語と前記第１のテキストセグメントの一部とに基づいて候補訂正を識別することと、
前記誤った用語を前記候補訂正に置換することと、
前記画面上のキャプションテキストの第２のテキストセグメントの中の前記誤った用語を識別することと、
前記第２のテキストセグメントに対応する第２のビデオフレームを分析することにより、前記誤った用語に関連付けられている第２の文脈用語を決定することと、
前記ナレッジグラフにアクセスすることにより、前記第１の文脈用語と前記第２の文脈用語と前記第１のテキストセグメントの前記一部と前記第２のテキストセグメントの一部とに基づいて、更新された候補訂正を識別することと、
前記画面上のキャプションテキストの前記第２のテキストセグメントの中の前記誤った用語を前記更新された候補訂正に置換することと
を含む、方法。
メディアアセットの画面上のキャプションテキストの中の誤った用語を訂正するための方法であって、
前記メディアアセットのオーディオストリームを分析することにより、前記画面上のキャプションテキストの第１のテキストセグメントを決定することと、
前記画面上のキャプションテキストの前記第１のテキストセグメントの中の誤った用語を識別することと、
前記第１のテキストセグメントに対応する前記メディアアセットのビデオストリームから、１つ以上のビデオフレームを抽出することと、
前記１つ以上のビデオフレームのうちの第１のビデオフレームを分析することにより、前記誤った用語に関連付けられている第１の文脈用語を決定することと、
ナレッジグラフにアクセスすることにより、前記第１の文脈用語と前記第１のテキストセグメントの一部とに基づいて、前記誤った用語のための候補訂正を識別することと、
前記画面上のキャプションテキストの前記第１のテキストセグメントの中の前記誤った用語を前記候補訂正に置換することと、
前記画面上のキャプションテキストの第２のテキストセグメントの中の前記誤った用語を識別することと、
前記第２のテキストセグメントに対応する第２のビデオフレームを分析することにより、前記誤った用語に関連付けられている第２の文脈用語を決定することと、
前記ナレッジグラフにアクセスすることにより、前記第１の文脈用語と前記第２の文脈用語と前記第１のテキストセグメントの前記一部と前記第２のテキストセグメントの一部とに基づいて、更新された候補訂正を識別することと、
前記画面上のキャプションテキストの前記第２のテキストセグメントの中の前記誤った用語を前記更新された候補訂正に置換することと
を含む、方法。
前記第１のテキストセグメントの中の前記誤った用語を識別することは、前記第１のテキストセグメントに対して自然言語処理を実行することにより、複数の文法規則に対して前記第１のテキストセグメントを比較することをさらに含む、請求項２に記載の方法。
前記画面上のキャプションテキストの前記第１のテキストセグメントは、タイムスタンプ付きであり、前記第１のビデオフレームは、前記タイムスタンプ付きの第１のテキストセグメントの中の前記誤った用語の位置に対応する前記メディアアセットの位置において抽出される、請求項２に記載の方法。
前記ナレッジグラフにアクセスすることにより、前記第１の文脈用語と前記第１のテキストセグメントの一部とに基づいて、前記候補訂正を識別することは、
前記第１のテキストセグメントの前記一部からキーワードを抽出することと、
前記第１の文脈用語および前記キーワードに対応する節点に関して、前記ナレッジグラフの中で検索することと、
前記第１の文脈用語および前記キーワードに関連付けられているプロパティに関して、前記節点を分析することと、
前記第１の文脈用語および前記キーワードに関連付けられている前記プロパティに基づいて、少なくとも１つの他の節点を決定することであって、前記少なくとも１つの他の節点は、前記候補訂正に対応する、ことと
をさらに含む、請求項２に記載の方法。
前記方法は、前記第１のテキストセグメントの中の前記候補訂正を前記更新された候補訂正に置換することをさらに含む、請求項２に記載の方法。
前記ナレッジグラフにアクセスすることにより、前記誤った用語のための前記候補訂正を識別することは、
前記ナレッジグラフから、前記誤った用語のための複数の潜在的訂正を決定することと、
前記決定に基づいて、前記複数の潜在的訂正のうちの各潜在的訂正に加重を割り当てることと、
最も高い加重に関連付けられている潜在的訂正を前記候補訂正として識別することと
をさらに含む、請求項２に記載の方法。
前記複数の潜在的訂正のうちのより最近の潜在的訂正は、より高い加重を割り当てられる、請求項７に記載の方法。
前記方法は、
音声アルゴリズムに基づいて、潜在的候補訂正と前記誤った用語との間の音声類似性スコアを決定することと、
より高い音声類似性スコアを伴う前記潜在的候補訂正により高い加重を割り当てることと
をさらに含む、請求項７に記載の方法。
前記ナレッジグラフにアクセスすることにより、前記第１の文脈用語と前記第１のテキストセグメントの前記一部とに基づいて、前記候補訂正を識別することは、前記ナレッジグラフの既存の節点を更新することをさらに含む、請求項２に記載の方法。
メディアアセットの画面上のキャプションテキストの中の誤った用語を訂正するためのシステムであって、前記システムは、
ナレッジグラフを記憶するメモリと、
制御回路と
を備え、
前記制御回路は、
前記メディアアセットのオーディオストリームを分析することにより、前記画面上のキャプションテキストの第１のテキストセグメントを決定することと、
前記画面上のキャプションテキストの前記第１のテキストセグメントの中の誤った用語を識別することと、
前記第１のテキストセグメントに対応する前記メディアアセットのビデオストリームから、１つ以上のビデオフレームを抽出することと、
前記１つ以上のビデオフレームのうちの第１のビデオフレームを分析することにより、前記誤った用語に関連付けられている第１の文脈用語を決定することと、
前記ナレッジグラフにアクセスすることにより、前記第１の文脈用語と前記第１のテキストセグメントの一部とに基づいて、前記誤った用語のための候補訂正を識別することと、
前記画面上のキャプションテキストの前記第１のテキストセグメントの中の前記誤った用語を前記候補訂正に置換することと、
前記画面上のキャプションテキストの第２のテキストセグメントの中の前記誤った用語を識別することと、
前記第２のテキストセグメントに対応する第２のビデオフレームを分析することにより、前記誤った用語に関連付けられている第２の文脈用語を決定することと、
前記ナレッジグラフにアクセスすることにより、前記第１の文脈用語と前記第２の文脈用語と前記第１のテキストセグメントの前記一部と前記第２のテキストセグメントの一部とに基づいて、更新された候補訂正を識別することと、
前記画面上のキャプションテキストの前記第２のテキストセグメントの中の前記誤った用語を前記更新された候補訂正に置換することと
を行うように構成されている、システム。
前記制御回路は、前記第１のテキストセグメントの中の前記誤った用語を識別するようにさらに構成されており、前記第１のテキストセグメントの中の前記誤った用語を識別することは、前記第１のテキストセグメントに対する自然言語処理を実行することにより、複数の文法規則に対して前記第１のテキストセグメントを比較することを含む、請求項１１に記載のシステム。
前記画面上のキャプションテキストの前記第１のテキストセグメントは、タイムスタンプ付きであり、前記第１のビデオフレームは、前記タイムスタンプ付きの第１のテキストセグメントの中の前記誤った用語の位置に対応する前記メディアアセットの位置において抽出される、請求項１１に記載のシステム。
前記制御回路は、
前記第１のテキストセグメントの前記一部からキーワードを抽出することと、
前記第１の文脈用語および前記キーワードに対応する節点に関して、前記ナレッジグラフの中で検索することと、
前記第１の文脈用語および前記キーワードに関連付けられているプロパティに関して、前記節点を分析することと、
前記第１の文脈用語および前記キーワードに関連付けられている前記プロパティに基づいて、少なくとも１つの他の節点を決定することであって、前記少なくとも１つの他の節点は、前記候補訂正に対応する、ことと
によって、前記ナレッジグラフにアクセスすることにより、前記第１の文脈用語と前記第１のテキストセグメントの前記一部とに基づいて、前記候補訂正を識別するようにさらに構成されている、請求項１１に記載のシステム。
前記制御回路は、前記第１のテキストセグメントの中の前記候補訂正を前記更新された候補訂正に置換するようにさらに構成されている、請求項１１に記載のシステム。
前記制御回路は、
前記ナレッジグラフから、前記誤った用語のための複数の潜在的訂正を決定することと、
前記決定に基づいて、前記複数の潜在的訂正のうちの各潜在的訂正に加重を割り当てることと、
最も高い加重に関連付けられている潜在的訂正を前記候補訂正として識別することと
によって、前記ナレッジグラフにアクセスすることにより、前記誤った用語のための前記候補訂正を識別するようにさらに構成されている、請求項１１に記載のシステム。
前記複数の潜在的訂正のうちのより最近の潜在的訂正は、より高い加重を割り当てられる、請求項１６に記載のシステム。
前記制御回路は、
音声アルゴリズムに基づいて、潜在的候補訂正と前記誤った用語との間の音声類似性スコアを決定することと、
より高い音声類似性スコアを伴う前記潜在的候補訂正により高い加重を割り当てることと
を行うようにさらに構成されている、請求項１６に記載のシステム。
前記制御回路は、前記ナレッジグラフの既存の節点を更新することによって、前記ナレッジグラフにアクセスすることにより、前記第１の文脈用語と前記第１のテキストセグメントの前記一部とに基づいて、前記候補訂正を識別するようにさらに構成されている、請求項１１に記載のシステム。