JP2018528731A - インデックス付与されたオーディオ・ビデオ・ストリーム(特に、スポーツ競技)の自然言語によるナビゲーションおよび支援された視聴 - Google Patents
インデックス付与されたオーディオ・ビデオ・ストリーム(特に、スポーツ競技)の自然言語によるナビゲーションおよび支援された視聴 Download PDFInfo
- Publication number
- JP2018528731A JP2018528731A JP2018525525A JP2018525525A JP2018528731A JP 2018528731 A JP2018528731 A JP 2018528731A JP 2018525525 A JP2018525525 A JP 2018525525A JP 2018525525 A JP2018525525 A JP 2018525525A JP 2018528731 A JP2018528731 A JP 2018528731A
- Authority
- JP
- Japan
- Prior art keywords
- audio
- video stream
- stream
- natural language
- index
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 claims abstract description 85
- 230000008569 process Effects 0.000 claims abstract description 21
- 230000001755 vocal effect Effects 0.000 claims abstract description 15
- 238000012545 processing Methods 0.000 claims abstract description 14
- 238000004891 communication Methods 0.000 claims description 9
- 230000003190 augmentative effect Effects 0.000 claims description 7
- 230000008859 change Effects 0.000 claims description 6
- 230000007246 mechanism Effects 0.000 claims description 6
- 230000000694 effects Effects 0.000 claims description 4
- 230000002441 reversible effect Effects 0.000 claims description 3
- 230000000007 visual effect Effects 0.000 claims description 3
- 238000000151 deposition Methods 0.000 claims 1
- 230000000977 initiatory effect Effects 0.000 claims 1
- 230000009471 action Effects 0.000 abstract description 38
- 230000003416 augmentation Effects 0.000 abstract description 2
- 230000001960 triggered effect Effects 0.000 abstract 1
- 238000010586 diagram Methods 0.000 description 13
- 230000006870 function Effects 0.000 description 11
- 230000033001 locomotion Effects 0.000 description 8
- 230000004048 modification Effects 0.000 description 7
- 238000012986 modification Methods 0.000 description 7
- 230000004044 response Effects 0.000 description 7
- 230000001360 synchronised effect Effects 0.000 description 6
- 239000000284 extract Substances 0.000 description 5
- 230000005540 biological transmission Effects 0.000 description 3
- 235000021438 curry Nutrition 0.000 description 3
- 230000003111 delayed effect Effects 0.000 description 3
- 238000001514 detection method Methods 0.000 description 3
- 239000000835 fiber Substances 0.000 description 3
- 239000000203 mixture Substances 0.000 description 3
- 230000006978 adaptation Effects 0.000 description 2
- 230000003466 anti-cipated effect Effects 0.000 description 2
- 230000001413 cellular effect Effects 0.000 description 2
- 230000007123 defense Effects 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 238000009472 formulation Methods 0.000 description 2
- 230000008520 organization Effects 0.000 description 2
- 230000011218 segmentation Effects 0.000 description 2
- 239000013589 supplement Substances 0.000 description 2
- 102000010029 Homer Scaffolding Proteins Human genes 0.000 description 1
- 108010077223 Homer Scaffolding Proteins Proteins 0.000 description 1
- 241000282412 Homo Species 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000003139 buffering effect Effects 0.000 description 1
- 230000001934 delay Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 230000008014 freezing Effects 0.000 description 1
- 238000007710 freezing Methods 0.000 description 1
- 230000014509 gene expression Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 238000004549 pulsed laser deposition Methods 0.000 description 1
- 230000011664 signaling Effects 0.000 description 1
- 239000007858 starting material Substances 0.000 description 1
- 230000001629 suppression Effects 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 238000013518 transcription Methods 0.000 description 1
- 230000035897 transcription Effects 0.000 description 1
- 230000007306 turnover Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/40—Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
- G06F16/41—Indexing; Data structures therefor; Storage structures
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/47—End-user applications
- H04N21/472—End-user interface for requesting content, additional data or services; End-user interface for interacting with content, e.g. for content reservation or setting reminders, for requesting event notification, for manipulating displayed content
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/40—Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
- G06F16/44—Browsing; Visualisation therefor
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/18—Speech classification or search using natural language modelling
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B27/00—Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
- G11B27/10—Indexing; Addressing; Timing or synchronising; Measuring tape travel
- G11B27/19—Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier
- G11B27/28—Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B27/00—Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
- G11B27/10—Indexing; Addressing; Timing or synchronising; Measuring tape travel
- G11B27/19—Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier
- G11B27/28—Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording
- G11B27/30—Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording on the same track as the main recording
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B27/00—Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
- G11B27/10—Indexing; Addressing; Timing or synchronising; Measuring tape travel
- G11B27/34—Indicating arrangements
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/47—End-user applications
- H04N21/472—End-user interface for requesting content, additional data or services; End-user interface for interacting with content, e.g. for content reservation or setting reminders, for requesting event notification, for manipulating displayed content
- H04N21/47217—End-user interface for requesting content, additional data or services; End-user interface for interacting with content, e.g. for content reservation or setting reminders, for requesting event notification, for manipulating displayed content for controlling playback functions for recorded or on-demand content, e.g. using progress bars, mode or play-point indicators or bookmarks
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
Abstract
【選択図】図1
Description
この出願は、2016年7月28日に出願された米国特許出願番号第15/222,924号および2015年7月31日に出願された米国特許出願番号第62/199,933号の優先権を主張し、これらの内容は、全ての目的に対しそれらの全部が本出願書に参照により内含されている。
本発明の実施態様は、オーディオ・ビデオ・ストリーム(省略して「AVストリーム」または「ストリーム」とも呼ぶ)のビデオ・インデックス付与のための種々の方法と、自然言語ユーザー・インタフェースを構成するための種々の方法とを組合せて、口頭のコマンドまたはテキストのコマンドを使用して、対象のAVストリーム内をナビゲートするまたはそれの視聴を向上させることを可能にする。
用語「ユーザー」および「視聴者」は、本出願の全体にわたって取換え可能に使用されるであろう。
(a)適切なデバイスまたは媒体によって記録または表示することができる実際に進行中の電子信号、
(b)ユーザーが視聴することができる、適切なデバイスから得られる同期している音声および画像、または
(c) 上述した電子信号および最終的に同期している音声および画像を再現することができる、同期している音声および画像の格納されている表現。
本発明の重要な部分は、自然言語の時間への参照の扱いである。スポーツ競技のAVストリーム内の特定の時点を人間の自然言語で参照することができる方法には、少なくとも三つの方法、つまり、実時間、ゲーム・クロック時間および規則上のピリオドまたはセグメントが、存在する。本発明の実施態様は、三種類全ての参照を、各々が特定のAVストリームに適用することができる程度および適用する態様で認識しかつサポートする。我々は、簡単にこれらの三種類の参照を説明し、そして図1にそれらの間の関係を示す。
これは、現実の経過時間である。持続時間(例えば、「10分前方にスキップせよ」)、または絶対参照(例えば、「2時間のマークへ行け」)を参照することができる。絶対参照は、所定のマイル・ストーンから計測される。このマイル・ストーンは、AVストリームの開始、イベントまたは競技の規則上の開始(例えば、バスケットボールの試合の開始、徒歩競走におけるスターターのピストル、または野球の試合における審判の「プレーボール!」と言う発声)、または他のいくつかの正規イベントまたは同意されたイベントとすることができる。
いくつかのスポーツ(例えば、アメリカン・フットボール、バスケットボール、ホッケー、サッカー)は、規則上のプレーの時間経過を計測するゲーム・クロックを認識する。このようなスポーツ(例えば、バスケットボール)のほとんどにおいて、ゲーム・クロックは、所定の規則上のピリオドにおける残り時間の量を計測する。したがって、クロックは、このピリオドが終了するポイント・ゼロまでの残り時間をカウント・ダウンする。しかしながら、プロ・サッカーの場合、ゲーム・クロックは、規則上の各ハーフに対して規定されている45分に加えて、レフェリーによって追加される6分までの「延長時間(ロスタイム)」をカウント・アップする。
いくつかのスポーツは、規則上のピリオドまたはセグメントに分割される。例えば、アメリカン・フットボールおよびプロのバスケットボールの試合は、クォーターに分割され、大学バスケットボールおよびサッカーの試合はハーフに分割され、ホッケーはピリオドに分割され、野球はイニングに分割され、ボクシングはラウンドに分割される、等々である。加えて、いくつかのスポーツ競技には「ハーフタイム」と言う概念が認められるが、これは、(クォーターに分割されたスポーツにおいて)第二および第三クォーターを、または(ハーフに分割されたスポーツにおいて)第一および第二ハーフを分離する。クォーターにまたは偶数のピリオドにまたはセグメントに分割されるスポーツは、間接的にハーフにも分割されている。
図1は、これら三種類の時間参照の間の関係を示す。図1は、全米バスケットボール協会(NBA)ゲームを備えるAVストリームの時間参照を示す。実時間への参照に使用されるマイル・ストーンは、四つの12分クォーターの第一クォーターの開始点である。
(a) 10分が、(ユーザーが現在最終のクォーターを視聴していないと仮定して)現在視聴されつつあるクォーターではない次のクォーター内のゲーム・クロックに存在するAVストリーム内のポイントに対応するゲーム・クロック時間への参照、
(b) 10分が、最終のクォーターのゲーム・クロックに存在するAVストリーム内のポイントに対応するゲーム・クロック時間への参照、または、
(c)ゲームの開始点から実時間の10分が既に経過しているAVストリームのポイントに対応する実時間への参照。
このセクションにおいて、我々は、AVストリーム・インデックス付与コンポーネントまたはプロセスによって識別することができる、つまり、AVストリーム・インデックスの範囲内で、マークされ、注釈がつけられまたはインデックス付与されている(我々は、これらの用語を取替え可能で使用するであろう)イベントの具体例を与える。我々は、このようなイベントを「インデックス付与されたイベント」と称するであろう。これらから推論することができるこれらのイベントおよび他の関連付けされたイベントまたはピリオドは、種々の自然言語コマンドに応答するためのベースとすることができる。
1. AVストリームの開始または終了
2. スポーツ競技の開始または終了
3. 経過した絶対的実時間(上記とは異なる場合)への参照のためのマイル・ストーン
4. (特定のマイル・ストーンの前か後の)秒での経過した実時間
5. 規則上のプレーまたは活動(オプションとしてそれに関連するゲーム・クロック時間値を有する)の停止または再開
6. 秒での、経過したまたは残りのゲーム・クロック時間
7. 規則上のピリオドの開始または終了
8. チーム役割の変更(例えば、野球における「打席」対「守備」、フットボールおよび野球における攻撃対防御)、同様に、ある種のスポーツにおけるボールの所有の変更
9. プレーヤー(オプションとして、指名された特定プレーヤー)の退場または参入(すなわち、代替)
10. イベントの記録(およびそのタイプ、例えば、アメリカン・フットボールのフィールド・ゴール対ゴール))
11. オンゴール・ショットの試み(サッカーおよびホッケー)
12. プレーの開始または終了(例えば、アメリカン・フットボールにおけるボールのスナップからアクションの終了まで、または野球における投球からランナーの動きの終了まで)
13. 得点にはならない規則上のイベントの達成(例えば、アメリカン・フットボールにおける最初のダウン)
14. タイムアウト(競技中断時間)の開始または終了
15. コマーシャル・ブレークの開始または終了
16. (オプションとして、指名された特定プレーヤーによってまたはそのプレーヤーに対して)行われるファウルまたはルール違反
17. 罰則の評価(例えば、オプションとして、指名された特定プレーヤーによるまたはそのプレーヤーに対する、バスケットボールにおけるフリースローまたはサッカーにおけるコーナー・キック)
18. トロフィーまたは賞の授与
19. 特定プレーヤーに対するプレーの開始または終了(例えば、指名された特定ゴルファーによりプレーされるホール)
20. (政治的なスピーチ、ニュース番組または情報番組またはトーク・ショーにおけるような)特定トピックの論議の開始または終了
21. 現実の人または(伝記物語またはフィクションの物語におけるような)フィクションのキャラクタのエントリまたは退出
22. アクションまたは(伝記物語またはフィクションの物語におけるような)主題として関連するシーケンスの開始または終了
23. (オプションとして、1人以上の指名された特定参加者またはチーム、またはオプションとして、チーム名によって識別される、例えば、コーチ、レフェリー、審判等の役割によって識別される参加者による、またはこれらに関係する)試合、競争または争いの開始または終了
24. (オプションとして、1人以上の指名された現実の人、フィクションの文字、場所、デバイス、アクションまたは他の識別または選択情報に関係する)エピソード、章または場面の開始または終了
以下に、自然言語インタフェースが受け入れることができかつ本発明の実施態様において実行することができるコマンドの具体例を挙げる。これらのコマンド・リストは、開示することが目的であり、完璧ではないし、限定するものでもない。インデックス付与されたイベントを、AVストリームのプレーバックの検索および制御に使用することができる方法には、より多くのものが存在する。
これらのコマンドは、以前に定義されているAVストリーム内の実時間を参照する。本明細書で列挙されるコマンドの大部分は、絶対的な実時間ではなく相対的な時間を参照する。すなわち、これらのコマンドは、AVストリームの視聴者の現在位置から、実時間の所定の持続時間分またはその持続時間、プレーバックを順方向または逆方向に移動するまたは要請する。しかしながら、実時間を参照する相対的定式化の使用は、典型的ではあるが、決して必要なものではなく、かつコマンドのいくつかは、明示されるまたは間接のマイル・ストーンに対する絶対的な実時間を参照する。
注:明確にするために、各具体例には、「相対的」または「絶対的」とマークされているが、これらのマークは、本具体例のフレーズ部分ではない。
1. 「10分前方にスキップせよ」(相対的)
2. 「15分順方向に進め」(相対的)
3. 「30分前方にジャンプせよ」(相対的)
4. 「10分戻れ」(相対的)
5. 「1分間スローモーションで逆方向に再生せよ」(相対的)
6. 「5分間順方向に早送りせよ」(相対的)
7. 「1時間までビデオをスキップせよ」(絶対的)
8. 「レースの最後の1分を示せ」(絶対的)
9. 「ビデオの途中に行け」(絶対的)
これらのコマンドは、ゲーム・クロック時間を参照し、かつこれらのコマンドは、アメリカン・フットボール、バスケットボール、ホッケー、サッカー等のようなゲーム・クロックを使用するスポーツに関連する。本明細書で列挙されるコマンドの大部分は、絶対的なゲーム・クロック時間への参照である。すなわち、それらは、AVストリームにおいて、視聴者の現在位置からゲーム・クロックの特定の数値まで、プレーバックを順方向または逆方向に移動するまたは要請する。しかしながら、ゲーム・クロック時間への参照の絶対的な定式化の使用は、典型的ではあるが、必要ではなく、かつコマンドのいくつかは、AVストリームの視聴者の現在位置から計測した相対的ゲーム・クロック時間を参照する。
注:明確性のために、各具体例は、「相対的」または「絶対的」とマークされていて、そしていくつかは()書きのコメントも含むが、これらのマークおよびコメントは、フレーズの具体例の部分ではない。
1. 「10分マークへ行け」(絶対的)(潜在的に絶対的実時間参照も)
2. 「ゲームの最後の2分を見せよ」(絶対的)(潜在的に絶対的実時間参照も)
3. 「クロック上の5分へ移動せよ」(絶対的)
4. 「スローモーションで規則上の時間より先行する分を示せ」(相対的)
5. 「ゲーム・クロック時間の2分を順方向にスキップせよ」(相対的)
これらのコマンドは、規則上のピリオドまたはセグメントを参照する。所定のピリオドまたはセグメントに対して使用される名称は、フットボールおよびプロ・バスケットボールが「クォーター」を使用し、大学バスケットボールおよびサッカーが「ハーフ」を使用し、ホッケーが、「ピリオド」を使用し、野球が、「イニング」を使用するように、スポーツによって異なる。
これらのコマンドは、クォーター(例えば、アメリカン・フットボールおよびプロ・バスケットボールが、これに該当する)である規則上のセグメントを参照する。クォーターである規則上のセグメントを有するスポーツは、典型的にはハーフタイムも有する。ここでは、ハーフタイムを参照するいくつかのコマンドも列挙される。
1. 「第二クォーターへジャンプせよ」
2. 「第三クォーターの開始へ行け」
3. 「このクォーターをスキップせよ」
4. 「次のクォーターへ行け」
5. 「ハーフタイムをスキップせよ」
6. 「ハーフタイムへ行け」
7. 「ハーフタイムの終了まで移動せよ」
8. 「第四クォーターの中間点に行け」(第四クォーターの実時間幅に関する中間点またはゲーム・クロックに関する中間点と解釈することもできる(ここでも、曖昧なコマンド等の前述の論議を参照))
これらのコマンドは、ハーフ(例えば、大学バスケットボールおよびサッカーがこれに該当し、更にクォーターである規則上のセグメントを有するスポーツもこれに間接的に該当する)である規則上のセグメントを参照する。
1. 「第二ハーフへ行く」
2. 「第一ハーフの中間点にジャンプする」(同様に、実時間またはゲーム・クロック時間に関する中間点と解釈することがオープンである(ここでも、曖昧なコマンド等の以前の論議を参照))
3. 「このハーフをスキップする」
4. 「第二ハーフを見る」
5. 「ハーフタイムをスキップする」
これらのコマンドは、ピリオド(例えば、ホッケーがこれに該当する)である規則上のセグメントを参照する。
1. 「第二ピリオドへ行け」
2. 「第三ピリオドへ前方にジャンプせよ」
3. 「第三ピリオドを見せろ」
4. 「このピリオドを通り越してスキップせよ」
これらのコマンドは、イニング(例えば、野球がこれに該当する)である規則上のセグメントを参照する。
1. 「第三イニングへ行け」
2. 「第九イニングへジャンプせよ」
3. 「次のイニングの表にジャンプせよ」
4. 「第六イニングの裏へ行け」
5. 「このイニングをスキップせよ」
6. 「第五イニングを見せろ」
7. 「第七イニング・ストレッチへ行け」
これらのコマンドは、「ダウン」(例えば、アメリカン・フットボールがこれに該当する)である規則上のセグメントを参照する。オプションとして、ダウンへの参照は、チームまたはプレーヤーの名前を含むことができる。
1. 「第二ダウンへ行け」
2. 「このダウンをスキップせよ」
3. 「第四ダウンへ行け」
4. 「第一ダウンを再度見せろ」
5. 「私に最後のダウンを示せ」
6. 「スローモーションで最後のダウンを見せろ」
7. 「次の第一ダウンへ行け」
8. 「次の49ersの第一ダウンへ行け」
9. 「Kaepernickの次の第一ダウンへ行け」
いくつかのスポーツ(例えば、アメリカン・フットボール)は、コマンドにおける所有の開始または終了を参照することが有意義である十分に長い「所有」を有する。「所有」は、所定のチームがオフェンスである(つまり、ボールを制御している)ピリオドと定義することができる。オプションとして、ボールの所有への参照は、チームまたはプレーヤーの名前を含むことができる。
1. 「次にPatriotsがボールを所有する場面に行け」
2. 「ボールの所有の次の変更にジャンプせよ」
3. 「次のターンオーバーへ行け」(これは、ボールの所有が変更することと同じである)
4. 「次のTideがボールを所有する場合」(これは、Crimson Tide(University of Alabamaスポーツ・チームの愛称)への参照である)
5. 「Broncosがボールを持つまで順方向に早送りせよ」
プレーの明確な定義を有するスポーツ(例えば、アメリカン・フットボール)に対して、自然言語インタフェースは、これらのプレーへの参照を認識しかつそれに応答することができる。オプションとして、プレーへの参照は、プレー・タイプ、チームの名前またはプレーヤーの名前、プレーバック速度、プレーバック方向またはこれらの任意の組合せを含むことができる。
1. 「次のプレーへ行け」
2. 「最後のプレーの開始に戻れ」
3. 「そのプレーを再度見せろ」
4. 「再度スローモーションでそのプレーを見せろ」
5. 「2つのプレーに戻れ」
6. 「次のSeahawksのプレーを私に示せ」
7. 「Brandon Crawfordのダブル・プレーに行け」
8. 「トリプル・プレーを私に示せ」
ビデオ・プレーバックの制御に使用することができるスポーツ競技には、他にもイベントが存在する。これらのイベントには、得点、タイムアウト、野球におけるピッチャーの交代、サッカーにおけるセットプレーおよびフリーキックが含まれる。
1. 「タイムアウトをスキップせよ」
2. 「このピッチャーの交代を通り越してジャンプせよ」
3. 「次のタッチダウンへ行け」
4. 「Seahawksの最後の得点に戻れ」
5. 「Arsenalのゴールを示せ」
6. 「次のコーナー・キックへ行け」
7. 「Barcelonaの最後のフリーキックを見せろ」
これまでに述べたコマンドは、得点イベントを参照する。本発明の実施態様は、得点には関係しないイベント、すなわち、ある条件が適用される時間の範囲にあるAVストリームの部分を参照するコマンドも処理する。我々は、このような得点に関係しないイベントを「抜粋」と称する。この用語は、得点に関係しないイベントの時間的に不連続な(しかし、主題として統一されている)シーケンスを含むこともできる。オプションとして、抜粋への参照は、動作タイプ、チーム、人またはフィクションのキャラクタの名前、プレーバック速度、プレーバック方向またはこれらの任意の組合せを含むことができる。
1. 「Mickelsonがプレーしたホールのみを私に示せ」
2. 「アイス・ダンスのみを私に示せ」(例えば、おそらく終夜に渡って記録された単一の長い放送が多数のスポーツ競技を備えるOlympicの収録が、これに該当する)
3. 「Serena Williamsのマッチのみ」(例えば、同時に行われる多数の初期段階のマッチの間でカットされた初期段階のWimbledonの収録範囲が、これに該当する)
4. 「49ersがボールを所有している場合のみ」
5. 「私に全てのファンブル(ボールのつかみ損じ)を示せ」
6. 「Curryの3つの―ポインターの全てを私に示せ」
7. 「レフリーとWarriorsのコーチの間の議論を私に示せ」
第一義的にはスポーツ競技は、視聴者の関心を引付けることが主な関心事項ではあるが、AVストリームの中の広告(コマーシャル)が興味を持たれることも知られている。本発明は、広告に関係するコマンドに応答することが可能である。
1. 「私にLiam Neesonのコマーシャルを示せ」
2. 「Morphieの広告へ行け」
3. 「Kim Kardashianを有する広告にスキップせよ」
4. 「Budweiserのコマーシャルを私に示せ」
ある種のコマンドは、AVストリーム全体の視聴特徴を変えることができる。ある種のコマンドは、AVストリームの視聴特徴のみに関係させることができる。ある種のコマンドは、イベントおよび/または抜粋のための検索をAVストリームの視聴特徴に関連する命令に組合せることができる。
1. 「私にコマーシャルのないゲームを示せ」
2. 「コマーシャルをスキップせよ」
3. 「全てのタイムアウトを順方向に早送りせよ」
4. 「私にコマーシャルのみを示せ」
5. 「私にスローモーションでそのファンブル(ボールのつかみ損じ)を示せ」
6. 「Curryの最後のジャンプ・ショットをフリーズ(凍結)せよ」
7. 「ハーフスピードで順方向に再生せよ」
ある種のコマンドは、以下に詳細に述べられる「ライブ・アクションのAVストリームの操作モード」に対するアラートの設定に適用される。この操作モードでは、対象のAVストリームに対するインデックス付与は、AVストリームそれ自身の受領と同時に(またはインデックス付与プロセスの有限の非遅延特性からみて、ほとんど同時に達成させることができるように)処理される。これらのコマンドは、関連付けられたイベントの前にユーザーによって発行させることができ、これにより、進行中のインデックス付与プロセスをモニタし、そして一つ以上の関連付けられたイベントが検出されると、ユーザーにアラートを出すことが可能になる。このコンセプトは、以下でより詳細に説明される。
これらのコマンドは、アラートの登録に関係する。
1. 「このコマーシャル・ブレークが終わったら、それを私に告げろ」
2. 「ゲームが再び始まったら、私にアラートを出せ」
3. 「LeBronがゲームに戻ったら、それを私に電話せよ」
4. 「Michael Phelpsがレースに行こうとする時には、私にアラートを送信せよ」
5. 「リーダー・ボード(得点順にプレーヤーを掲示した掲示板)が変更したら、それを私に知らせろ」(ゴルフ・トーナメントがこれに該当する)
6. 「Warriorsがキャッチ・アップしたら、私に告げろ」
7. 「Razorbacksが、タッチダウンしたら、私にメールせよ」
8. 「ゲームが10ポイントより厳しくなったら、私にアラートを出せ」
9. 「ゲームが接戦となったら、私に告げろ」(ゲームが「接戦である」と判断する基準は、スポーツごとに異なるであろう。そしてその基準は、さらに、視聴者の主観にも関係する。我々は、このアラートおよび類似のアラートに対し、本発明が、スポーツごとに基準を使用することができ、視聴者が、適切なおそらくスポーツごとに基準を設定することを可能にすることができ、視聴者の行動を追跡し、個人化された適切なおそらくスポーツごとの基準を自動的に推論することができ、あるいは上述した技術のある組合せを使用して、適切な基準を決定することができるものと考える。)
10. 「Broncosが得点したら、私に知らせろ」
11. 「ハーフタイムが終わったら、私に知らせろ」
12. 「ハーフタイムが始まったら、メッセージを送信せよ」
13. 「第四クォーターが開始したら、私に告げろ」
14. 「ゲーム・クロックで残りの時間が2分になったら、私に知らせろ」
15. 「彼が、社会保障について話し始めたら、アラートを送信せよ」(政治的な演説(特に、一般教書)がこれに該当する)
16. 「移民についての問題があったら、私にアラートを出せ」(政治討論がこれに該当する)
17. 「Final jeopardy(最後の危険)が始ったら、私にメールせよ」(ゲーム・ショー「Jeopardy(危険)」がこれに該当する)
18. 「Taylor Swiftが演技したら、私に告げろ」
19. 「Appleの広告があったら、私にアラートを出せ」
これらのコマンドは、アラートが出されている状態が既に検出されている場合の制御に関係する。
1. 「アラートに戻れ」
2. 「アラートからプレーを開始せよ」
3. 「アラートから順方向にアクションを示せ」
4. 「アラートの前30秒に戻れ」
5. 「プレーバックを開始せよ」
ある種のコマンドは、上記のカテゴリの何れにも属しない。いくつかの具体例が、ここに列挙される。
1. 「実時間に戻れ」
2. 「通常の視聴に復帰せよ」
3. 「ライブのTVを再度示せ」
4. 「ライブのTVに順方向に早送りせよ」
本発明の実施態様は、AVストリームのインデックス付与が、(実時間でまたはアクション後に)実行される場合、AVストリーム(完了しているまたはライブのアクション)の状況に関して異なる種々の操作モード、およびサポートされているコマンドの範囲および性質(AVストリーム全体のナビゲーション、現在に至るまでのAVストリームのナビゲーション、予想される将来のイベントに対してアラートを発すること)をサポートする。
一操作モードでは、対象となるAVストリームは、すでに完了している形で存在する。これは、「完了しているAVストリームの操作モード」である。この操作モードにおいては、AVストリームに含まれるスポーツ競技およびおそらくそれに関連した如何なる競技後のコメントも、如何なるユーザー・コマンドの処理前に、既に完了している。すなわち、AVストリームは、完了していて、進行中ではない。これは、対象のAVストリームの同時またはほとんど同時の(以下で検討される可能性の)インデックス付与および視聴のライブ入力とは対照的である。
他の操作モードでは、対象となるAVストリームは、スイッチング、バッファリングおよび信号伝播による遅延のみを除いて、ライブ(「実時間で」と同等)で到着することができる。これが、「ライブ・アクションのAVストリームの操作モード」である。この操作モードでは、ユーザーは、スポーツ競技が進行している間に、コマンドを発生させることができる。AVストリームのまだ受信されていない部分に、時間的に順方向にナビゲートすることはできないが、本発明は、ユーザーが、(潜在的には、それに関連付けられていてかつ同様に同時に生成されたAVストリーム・インデックスにより)AVストリームの同時に生成された記録を逆方向にナビゲートすることを可能にする。また、AVストリーム記録を逆方向にナビゲートすると、本発明の実施態様は、それ以降現時点まで(すなわち、現時点までのAVストリーム記録が、制御可能なAVストリーム・リポジトリーの中に存在しているので)記録内を順方向にナビゲートすることをサポートする。
1. 「再度最後のダウンを私に示せ」
2. 「戻って、第二クォーターの開始をピック・アップせよ」(クォーターに分割されるスポーツの第二クォーターの開始後の任意の時間が、これに該当する)
3. 「第三クォーターの2分マークに行け」
4. 「再度ハーフタイム・ショーを再生せよ」
5. 「60秒前方にスキップせよ」(AVストリーム記録を逆方向にナビゲートするコマンドより後が、これに該当する。このコマンドを実行することが、AVストリームの未だ受信されていない部分まで順方向にナビゲートすることを意味する場合、本発明は、ライブAVストリームの表示を再開するのみである)
上述したように、まだ受信されていないAVストリームの部分を前方にスキップすることを要求するコマンドを処理することは、もちろん不可能である。しかしながら、これらのコマンドが生成されると、これらのコマンドが、ユーザーにこれらのイベントを通知することを要請する限り、潜在的なまたは予想される将来のイベントを参照するユーザー・コマンドを本発明によって受信しかつ処理することは、有意義でありかつ有用である。我々は、この機能を「アクション前」のサポートまたは「アラート」サポートと呼び、かつ潜在的に将来のイベントは、「登録されるアラート」、「アラートが出されるイベント」または単に「アラート」を意味する。これらのアラートは、本発明では、該当するユーザー・コマンドによって識別される。アラートが出されたイベントの検出に応じて、ユーザーには、通知がなされる。本発明の実施態様は、後述するように、他の態様で応答することも、他の関連する機能を提供することもできる。
本願明細書において記述される方法、アーキテクチャ、インタフェース、コマンドおよび機能は、追加される領域に一般化させることができる。我々は、この領域を識別し、かついくつかのサンプル・コマンドを示すことによって、以下に、それらの一部を簡略に説明する。
1. 「Obamaが社会保障について話し始める所まで、スキップせよ」
2. 「移民についての質問があったら、私にアラートを出せ」
3. 「討論の内Hillaryの部分のみを私に示せ」
1. 「音声楽のゲストが演奏を開始したら、私に告げよ」
2. 「Keira Knightleyが登場する場面に、ジャンプせよ」
3. 「モノローグをスキップせよ」
1. 「Gandalfが入る場面に、行け」
2. 「武闘シーンを示せ」
1. 「'You Belong With Me'が始まる場面に、ジャンプせよ」
2. 「'Born to Run'を再度再生せよ」
1. 「主演男優賞、主演女優賞、監督賞、および作品部門賞のみを、私に、示せ」
2. 「作曲賞へ行け」
3. 「De Niroが贈呈する場面に行け」
1. 「Dowが20ポイント以上下落したら私に知らせよ」
2. 「ワイルドファイアが101以上に増大したら私にアラートを出せ」
3. 「Greek議会がEUの予算案に対して投票を行ったら私に告げよ」
図11は、実施態様のいくつかのある特徴を実装するために使用することができるコンピューター・システムのブロック図である。このコンピューター・システムは、サーバ・コンピューター、クライアント・コンピューター、パーソナル・コンピューター(PC)、ユーザー・デバイス、タブレットPC、ラップトップ・コンピューター、パーソナル携帯情報機器(PDA)、移動電話、iPhone、iPad、ブラックベリー、プロセッサ、電話、ウェブ機器、ネットワーク・ルータ、スイッチまたはブリッジ、コンソール、ハンド・ヘルド・コンソール、(ハンドヘルド)ゲーム・デバイス、音声楽プレーヤー、任意の携帯、移動、ハンドヘルド・デバイス、装着型デバイス、またはそのマシンによって行われるアクションを特定する命令セット(シーケンシャルまたは非シーケンシャル)を実行することが可能な任意のマシンとすることができる。
前記説明および図面は、説明のためのものであり、限定することを意図したものではない。多数の具体的な詳細が、開示の完全な理解を提供するために記述されている。しかしながら、ある具体例では、周知の詳細は、記載を不明確にすることを避けるために記述されていない。さらに、実施態様の範囲から逸脱することなく、種々の変更をなすこともできる。
Claims (49)
- オーディオ・ビデオ・ストリーム・ソースが、オーディオ・ビデオ・ストリームを生じるステップと、
オーディオ・ビデオ・ストリーム・インデックスを当該オーディオ・ビデオ・ストリームに関連付けるステップであって、前記オーディオ・ビデオ・ストリーム・インデックスが、当該オーディオ・ビデオ・ストリームの中のイベントの記号表現を備える、ステップと、
プロセッサが、ユーザー入力デバイスからユーザー自然言語コマンドを受取るステップと、
当該プロセッサが、当該オーディオ・ビデオ・ストリーム・インデックスを参照することによって、当該ユーザー自然言語コマンドから制御信号を作成するステップと、
当該プロセッサが、当該制御信号を使用して制御可能なオーディオ・ビデオ・ストリーム・レジストリーを制御するステップと、
当該プロセッサが、当該制御可能なオーディオ・ビデオ・ストリーム・レジストリーから、主表示で視聴可能な制御されたオーディオ・ビデオ・ストリームを生成するステップと、
を備える、オーディオ・ビデオ・ストリームの支援された視聴のためのコンピューターの実行方法。 - オーディオ・ビデオ・ストリーム・インデックス生成プロセスを用いて、
当該オーディオ・ビデオ・ストリームの自動分析、
当該オーディオ・ビデオ・ストリームの人間分析、そして、
当該オーディオ・ビデオ・ストリームの自動分析および人間分析の組合せ、
の何れかを備える分析を実行することによって、当該オーディオ・ビデオ・ストリーム・インデックスを生成するステップ
を、更に、備え、
当該分析が、
オーディオ・ビデオ・ストリーム画像のみ、
オーディオ・ビデオ・ストリーム音声のみ、および
オーディオ・ビデオ・ストリーム画像とオーディオ・ビデオ・ストリーム音声の組合せの何れかに実行される、
請求項1に記載の方法。 - 当該オーディオ・ビデオ・ストリームに関連付けられているメタデータを使用して、その精度、効率、特定性またはこれらの任意の組合せに関して、当該オーディオ・ビデオ・ストリーム・インデックス生成プロセスを改善するステップを、更に、備える、請求項2に記載の方法。
- 自動スピーチ認識システム、
自然言語理解システム、および
自動スピーチ認識システムと自然語理解システムの組合せ、
の何れかを備える自然言語インタフェースにより、当該ユーザー自然言語コマンドを処理するステップを、更に、備える、請求項1に記載の方法。 - 各当該ユーザー自然言語コマンドが、ユーザーによって生成される口頭のコマンド、またはユーザーによって生成されるテキストのコマンドの何れかを含む、請求項4に記載の方法。
- 当該オーディオ・ビデオ・ストリームに関連付けられているメタデータを使用して、その精度、効率、特性またはこれらの任意の組合せに関して当該自然言語インタフェースを改善するステップを、更に、備える、請求項4に記載の方法。
- 当該オーディオ・ビデオ・ストリームが、完了していてかつ進行中でない、請求項1に記載の方法。
- 当該オーディオ・ビデオ・ストリーム・インデックスが、当該完了していてかつ進行中でないビデオ・ストリーム内に、すでに存在している、請求項7に記載の方法。
- 当該完了していてかつ進行中でないオーディオ・ビデオ・ストリームが、当該制御可能なオーディオ・ビデオ・ストリーム・リポジトリーに堆積される時、
当該完了していてかつ進行中でないオーディオ・ビデオ・ストリームが、当該制御可能なオーディオ・ビデオ・ストリーム・レジストリーから再生される時、そして、
当該完了していてかつ進行中でないオーディオ・ビデオ・ストリームを当該制御可能なオーディオ・ビデオ・ストリーム・リポジトリーに堆積しかつ当該制御可能なオーディオ・ビデオ・ストリーム・リポジトリーからの当該完了していてかつ進行中でないオーディオ・ビデオ・ストリームをプレーバックする中間の時
の何れかで、当該オーディオ・ビデオ・ストリーム・インデックスを生成するステップを、更に、備える、請求項7に記載の方法。 - 当該オーディオ・ビデオ・ストリームが、ライブでかつ進行中である、請求項1に記載の方法。
- 当該ライブでかつ進行中のオーディオ・ビデオ・ストリームの到着と同時にオーディオ・ビデオ・ストリーム・インデックス付与プロセスを実行することにより、当該オーディオ・ビデオ・ストリーム・インデックスを生成するステップを、更に、備える、請求項10に記載の方法。
- 当該ライブでかつ進行中のオーディオ・ビデオ・ストリームの表示を再開する任意の一つの当該自然言語コマンドを使用するステップを、更に、備える、請求項10に記載の方法。
- 関連付けられているオーディオ・ビデオ・ストリーム・インデックスの範囲内で記録されている指定されたインデックス付与されているイベント、または
関連付けられているオーディオ・ビデオ・ストリーム・インデックスの範囲内で記録されている当該指定されたインデックス付与されているイベントから測定されるまたは推論されるオフセット
の何れかで始まる当該オーディオ・ビデオ・ストリームを、当該オーディオ・ビデオ・ストリーム・リポジトリーが表示することを制御する任意の一つの当該自然言語コマンドを用いるステップを、更に、備える請求項1に記載の方法。 - 当該インデックス付与されているイベントが、
前記オーディオ・ビデオ・ストリームの開始または終了、
コマーシャルの開始または終了、そして
オーディオ・ビデオ・ストリーム・インデックスの範囲内で記録されている他の任意のイベント
の何れかを備える、請求項13に記載の方法。 - 当該オーディオ・ビデオ・ストリームが、スポーツ競技のオーディオ・ビデオ・ストリームを備える、請求項13に記載の方法。
- 当該インデックス付与されているイベントが、
前記スポーツ競技の開始または終了、
明確なマイルストーン・イベントまたは間接的なマイルストーン・イベントから測定される前記オーディオ・ビデオ・ストリームの中の指定された実時間、
明確なマイルストーン・イベントまたは間接的なマイルストーン・イベントから測定されるオーディオ・ビデオ・ストリームの範囲内の指定されたゲーム・クロック時間、
正規のプレーまたはアクティビティの停止または再開、
正規のピリオドの開始または終了、
チーム役割の変更、
プレーヤーの引上げ、投入または交代、
一人以上の指名されたプレーヤーの引上げ、投入または交代、
得点イベント、
指名されたチームまたはサイドによる得点イベント、
指定されたタイプの得点イベント、
指名されたチームまたはサイドによる指定されたタイプの得点イベント、
オンゴール・ショットの試み、
指名されたチームまたはサイドによるオンゴール・ショットの試み、
プレーの開始または終了、
指名されたチーム、サイドまたはプレーヤーによるプレーの開始または終了、
得点にならない規則イベントの成就、
指名されたチームまたはサイドによる得点にならない規則イベントの成就、
タイムアウトの開始または終了、
指名されたチームまたはサイドによるタイムアウトの終了の開始、 ファウリングまたは規則違反の関与、
指名されたチームまたはサイドによるファウルまたは規則違反の遂行、
指名されたプレーヤーによるまたはそれに対するファウルまたは規則違反の遂行、
罰則の評価、
トロフィーまたは賞の授与、そして
当該オーディオ・ビデオ・ストリーム・インデックスの範囲内で記録されている任意の他のイベント
の何れかを備える、請求項15に記載の方法。 - 当該インデックス付与されているイベントが、
戦いの開始または終了、議論または争論、
一つ以上の特定の指名された参加者またはチーム、または機能の役割によって識別される(オプションとして、チーム名によって識別される)参加者による、それらとの、それらを含む、またはそれらの間の戦いの開始または終了、議論または争論、
の何れかを、更に、備える、請求項16に記載の方法。 - 当該オーディオ・ビデオ・ストリームの抜粋を当該オーディオ・ビデオ・ストリーム・リポジトリーが表示することを制御するための任意の一つの当該自然言語コマンドを使用するステップを、更に、備える、請求項1に記載の方法。
- オーディオ・ビデオ・ストリームのプレーバックの方向、
オーディオ・ビデオ・ストリームのプレーバックの速度、そして
それらの組合せ
の何れかを特定する言語を含む当該任意の一つの自然言語コマンドを、更に、備える、請求項18に記載の方法。 - 当該抜粋が、当該オーディオ・ビデオ・ストリームの単一の隣接する持続時間を備える、請求項18に記載の方法。
- 当該抜粋が、当該オーディオ・ビデオ・ストリームの多数の不連続な持続時間を備える、請求項18に記載の方法。
- コマーシャル・コンテンツ、
指名された会社またはサービスのためのコマーシャル・コンテンツ、そして
当該オーディオ・ビデオ・ストリーム・インデックスの範囲内で記録されるまたは当該オーディオ・ビデオ・ストリーム・インデックスの範囲内で記法から推論される任意の他の抜粋
の任意の一つに関して、当該オーディオ・ビデオ・ストリームの当該抜粋を識別するステップを、更に、備える請求項18に記載の方法。 - 当該オーディオ・ビデオ・ストリームが、スポーツ競技のオーディオ・ビデオ・ストリームを備える、請求項20に記載の方法。
- プレー、
所定のタイプのプレー、
指名されたチームまたはサイド、または
指名されたプレーヤーの何れかによって実行されるプレー、
指名されたスポーツ、
指名されたチームまたはサイド、
指名されたプレーヤー、そして
当該オーディオ・ビデオ・ストリーム・インデックスの範囲内で表記されるまたは当該オーディオ・ビデオ・ストリーム・インデックスの範囲内の表記から推論される任意の他の持続時間
の任意の一つによって実行されるプレーの任意の一つに関して、当該オーディオ・ビデオ・ストリームの当該一つの隣接する持続時間を識別するステップを、更に、備える、請求項23に記載の方法。 - 当該オーディオ・ビデオ・ストリームの当該一つの隣接する持続時間が、
戦い、論争または口論、
1人以上の特定の指名された参加者またはチーム、または機能役割によって識別される(オプションとして、チーム名によって識別される)参加者による、それらとの、それらに関する、またはそれらの間の戦い、論争または口論、
の何れかを、更に、備える、請求項24に記載の方法。 - 当該オーディオ・ビデオ・ストリームが、スポーツ競技のオーディオ・ビデオ・ストリームを備える、請求項21に記載の方法。
- 多数のプレー、
所定のタイプの多数のプレー、
指名されたチームまたはサイド、または
指名されたプレーヤー、
の何れかによって実行される多数のプレー、
指名されたスポーツの多数の持続時間、
指名されたチームまたはサイドの多数の持続時間、
指名されたプレーヤーの多数の持続時間、および
当該オーディオ・ビデオ・ストリーム・インデックスの範囲内で表記された、または前記当該オーディオ・ビデオ・ストリーム・インデックスの範囲内の表記から推論された任意の他の多数の持続時間、
の何れか一つに関する当該オーディオ・ビデオ・ストリームの多数の不連続な持続時間を識別するステップを、更に、備える、請求項26に記載の方法。 - 当該オーディオ・ビデオ・ストリームの多数の不連続な持続時間が、
多数の試合、論争または口論、
一つ以上の特定の指名された参加者またはチームまたは機能的な役割によって識別される(オプションとして、チーム名によって識別される)参加者による、それらとの、それらに関わるまたはそれらの間の多数の試合、論争または口論、
の何れかを、更に、含む、請求項27に記載の方法。 - 当該オーディオ・ビデオ・ストリームが、
政治的な演説または討論、
トークショー、
映画、
コンサート、
授賞式、
ニュースまたは情報のショー、または
任意の他の特定の種類のビデオ・コンテンツ
の何れかのオーディオ・ビデオ・ストリームを備える、請求項13の方法。 - 当該オーディオ・ビデオ・ストリーム・リポジトリーを制御する任意の1つの当該自然言語コマンドを使用して、当該オーディオ・ビデオ・ストリームの抜粋の表示を中断するステップであって、
プレーバックの通常の方向が時間において順方向である場合の当該オーディオ・ビデオ・ストリームの当該抜粋の終了、または
プレーバックの前記通常の方向が時間において逆方向である場合の当該オーディオ・ビデオ・ストリームの当該抜粋の開始、
の何れかで当該オーディオ・ビデオ・ストリームの表示を再開する、ステップと、
を、更に、備える、請求項7に記載の方法。 - 当該抜粋が、当該オーディオ・ビデオ・ストリームの単一の隣接する持続時間を備える、請求項30に記載の方法。
- 当該抜粋が、当該オーディオ・ビデオ・ストリームの多数の不連続な持続時間を備える、請求項30に記載の方法。
- 登録されたアラートが保持されるアラート・レジストリーを提供するステップを、更に、備える、請求項10に記載の方法。
- 当該オーディオ・ビデオ・ストリーム・リポジトリーを制御する任意の1つの当該自然言語コマンドを使用して、当該ライブでかつ進行中のオーディオ・ビデオ・ストリームに関連付けられている前記オーディオ・ビデオ・ストリーム・インデックスの範囲内で、一つ以上の関連付けられたインデックス付与されたイベントの前記外観に関連するアラートを登録するステップを、更に、備える、請求項33に記載の方法。
- 前記アラート・レジストリーの前記コンテンツを、当該ライブでかつ進行中のオーディオ・ビデオ・ストリームに関連付けられている当該オーディオ・ビデオ・ストリーム・インデックスと比較して、一つ以上の任意の関連付けられたインデックス付与されたイベントが既に発生しているか否かを決定し、そして既に発生している場合には、アラート通知を生成するステップを、更に、備える、請求項34に記載の方法。
- アラート信号の生成を備える当該アラート通知が、
前記主ディスプレー上の可聴表示、
前記主ディスプレー上の視覚表示、
登録されているまたは接続されているユーザー・アラート・デバイスに対するメッセージまたは通知、および
登録されているまたは接続されている多数のユーザー・アラート・デバイスに対するメッセージまたは通知、
の何れかを備える、請求項35に記載の方法。 - 当該メッセージまたは通知が、
携帯メール、
電子メール・メッセージ、
電話、および
アプリケーションへの信号、
の何れかを備える、請求項36に記載の方法。 - 当該登録されているまたは接続されているユーザー・アラート・デバイスが、
携帯電話、
スマートフォン、
タブレット、
接続された腕時計、および
任意の他のパーソナル・デバイス、
の何れかを備える、請求項36に記載の方法。 - 前記アラート・レジストリーの内容を、当該ライブでかつ進行中のオーディオ・ビデオ・ストリームに関連付けられている当該オーディオ・ビデオ・ストリーム・インデックスと比較するステップと、
任意の一つ以上の関連付けられているインデックス付与されたイベントが既に発生しているか否かを決定するステップであって、既に発生している場合には、ライブでかつ進行中のオーディオ・ビデオ・ストリームの記録が続く間に、ユーザーが、後にオーディオ・ビデオ・ストリームの表示を再開することができるように、
オーディオ・ビデオ・ストリームの表示を中断することと、
上述したオーディオ・ビデオ・ストリーム・インデックスの範囲内に基準マークを作成すること、
の何れかを実行する、ステップとを、更に、備える、請求項34に記載の方法。 - オーディオ・ビデオ・ストリームの当該再開された視聴が、
上述した基準マークに対応する記録されたライブでかつ進行中のオーディオ・ビデオ・ストリームの中の時間、
上述した基準マークに対応する記録されたライブでかつ進行中のオーディオ・ビデオ・ストリームの中の時間の前の指定されたまたは予め設定された時間間隔、そして
任意の一つ以上の関連付けられてインデック付与されているイベントの発生に導いた関連した以前のイベント
の何れかの一つから続行される、請求項39に記載の方法。 - 当該ユーザー・アラート・デバイスが、当該ユーザー・アラート・デバイスが適している接続および表示能力を有しかつ当該ユーザー・アラート・デバイスへの適切な通信経路が存在するときに、オーディオ・ビデオ・ストリームの表示を開始しかつ継続させるステップを、更に、備え、
当該表示されたオーディオ・ビデオ・ストリームが、
ライブでかつ進行中のオーディオ・ビデオ・ストリーム、および
それのタイム―シフトされたバージョン
の何れかを備える、請求項38に記載の方法。 - 当該ユーザー・アラート・デバイスが適切なユーザー入力デバイス能力を有しかつ当該ユーザー・アラート・デバイスからの適切な通信経路が存在する場合に、自然言語コマンドおよびマニュアル・コマンドの何れかにより当該表示されたオーディオ・ビデオ・ストリームを制御するステップを、更に、備え、
当該自然言語コマンドおよびマニュアル・コマンドが、ユーザー入力デバイスとして機能する当該ユーザー・アラート・デバイスによって発行される、請求項41に記載の方法。 - オーディオ・ビデオ・ストリーム・インデックス発生プロセスを用いて、既存のオーディオ・ビデオ・ストリーム・インデックスを増補するステップと、
当該オーディオ・ビデオ・ストリームおよび既存のオーディオ・ビデオ・ストリーム・インデックスの自動分析、
当該オーディオ・ビデオ・ストリームおよび既存のオーディオ・ビデオ・ストリーム・インデックスの人間分析、および
自動分析および当該オーディオ・ビデオ・ストリームおよび既存のオーディオ・ビデオ・ストリーム・インデックスの人間分析の組合せの何れかを備える分析を実行することにより当該オーディオ・ビデオ・ストリーム・インデックスを生成するステップと、
を、更に、備え、
当該分析が、
オーディオ・ビデオ・ストリーム画像のみ、
オーディオ・ビデオ・ストリーム音声のみ、
既存のオーディオ・ビデオ・ストリーム・インデックス、および
オーディオ・ビデオ・ストリーム画像、オーディオ・ビデオ・ストリーム音声および前記既存のオーディオ・ビデオ・ストリーム・インデックスの任意の組合せ、
の何れかに基づいて実行される、請求項1に記載の方法。 - 当該オーディオ・ビデオ・ストリームに関連付けられているメタデータを使用して、その精度、効率、特定性、または任意のこれらの組合せに関して当該オーディオ・ビデオ・ストリーム・インデックス発生プロセスを改善するステップを、更に、備える、請求項43に記載の方法。
- 当該プロセッサが、ユーザー入力デバイスから標準のマニュアル・コマンドを受信するステップと、
当該プロセッサが、当該オーディオ・ビデオ・ストリーム・インデックスを参照することによって当該標準のマニュアル・コマンドから制御信号を作成するステップと、
を、更に、備える、請求項1に記載の方法。 - ボタン、スイッチ、センサ、タッチ・センシティブ・スクリーンまたはスクリーン、またはユーザー入力デバイスの一部を備える他の物理的メカニズムの何れかの操作から生じる当該標準のマニュアル・コマンドを、更に、備える、請求項45に記載の方法。
- 当該プロセッサが、当該オーディオ・ビデオ・ストリーム・インデックスを参照すること無く当該ユーザー自然言語コマンドから制御信号を作成するステップを、更に、備える、請求項1に記載の方法。
- オーディオ・ビデオ・ストリームの支援された視聴のための装置であって、
オーディオ・ビデオ・ストリームを生じるオーディオ・ビデオ・ストリーム・ソースと、
当該オーディオ・ビデオ・ストリームに関連付られていて、当該オーディオ・ビデオ・ストリーム内にイベントの記号表記を備える、オーディオ・ビデオ・ストリームと、
ユーザー入力デバイスからユーザー自然言語コマンドを受信するように構成されていて、当該オーディオ・ビデオ・ストリーム・インデックスを参照することによって当該ユーザー自然言語コマンドから制御信号を作成するように構成されている、プロセッサと、
制御可能なオーディオ・ビデオ・ストリーム・リポジトリーと
を備え、
当該プロセッサが、当該制御信号を使用して、当該制御可能なオーディオ・ビデオ・ストリーム・リポジトリーを制御するように構成されていて、そして、
当該プロセッサが、当該制御可能なオーディオ・ビデオ・ストリーム・リポジトリーから主表示において視聴可能な制御可能なオーディオ・ビデオ・ストリームを生じるように構成されている、
装置。 - 当該プロセッサが、更に、当該オーディオ・ビデオ・ストリーム・インデックスを参照すること無く当該ユーザー自然言語コマンドから制御信号を作成するように構成されている、請求項48に記載の装置。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201562199933P | 2015-07-31 | 2015-07-31 | |
US62/199,933 | 2015-07-31 | ||
US15/222,924 | 2016-07-28 | ||
US15/222,924 US10609454B2 (en) | 2015-07-31 | 2016-07-28 | Natural language navigation and assisted viewing of indexed audio video streams, notably sports contests |
PCT/US2016/044734 WO2017023763A1 (en) | 2015-07-31 | 2016-07-29 | Natural language navigation and assisted viewing of indexed audio video streams, notably sports contests |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020113929A Division JP7109503B2 (ja) | 2015-07-31 | 2020-07-01 | インデックス付与されたオーディオ・ビデオ・ストリーム(特に、スポーツ競技)の自然言語によるナビゲーションおよび支援された視聴 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2018528731A true JP2018528731A (ja) | 2018-09-27 |
Family
ID=57944156
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018525525A Pending JP2018528731A (ja) | 2015-07-31 | 2016-07-29 | インデックス付与されたオーディオ・ビデオ・ストリーム(特に、スポーツ競技)の自然言語によるナビゲーションおよび支援された視聴 |
JP2020113929A Active JP7109503B2 (ja) | 2015-07-31 | 2020-07-01 | インデックス付与されたオーディオ・ビデオ・ストリーム(特に、スポーツ競技)の自然言語によるナビゲーションおよび支援された視聴 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020113929A Active JP7109503B2 (ja) | 2015-07-31 | 2020-07-01 | インデックス付与されたオーディオ・ビデオ・ストリーム(特に、スポーツ競技)の自然言語によるナビゲーションおよび支援された視聴 |
Country Status (7)
Country | Link |
---|---|
US (3) | US10609454B2 (ja) |
EP (1) | EP3329386A4 (ja) |
JP (2) | JP2018528731A (ja) |
KR (3) | KR20220164085A (ja) |
AU (1) | AU2016302930B2 (ja) |
CA (1) | CA2993655C (ja) |
WO (1) | WO2017023763A1 (ja) |
Families Citing this family (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9351060B2 (en) | 2014-02-14 | 2016-05-24 | Sonic Blocks, Inc. | Modular quick-connect A/V system and methods thereof |
US10609454B2 (en) | 2015-07-31 | 2020-03-31 | Promptu Systems Corporation | Natural language navigation and assisted viewing of indexed audio video streams, notably sports contests |
US10567461B2 (en) * | 2016-08-04 | 2020-02-18 | Twitter, Inc. | Low-latency HTTP live streaming |
US10147423B2 (en) * | 2016-09-29 | 2018-12-04 | Intel IP Corporation | Context-aware query recognition for electronic devices |
US10068573B1 (en) * | 2016-12-21 | 2018-09-04 | Amazon Technologies, Inc. | Approaches for voice-activated audio commands |
US11159856B2 (en) | 2017-07-10 | 2021-10-26 | Sony Interactive Entertainment LLC | Non-linear content presentation and experience |
US10728622B2 (en) | 2017-08-25 | 2020-07-28 | Sony Interactive Entertainment LLC | Management of non-linear content presentation and experience |
WO2020018525A1 (en) * | 2018-07-17 | 2020-01-23 | iT SpeeX LLC | Method, system, and computer program product for an intelligent industrial assistant |
US11350172B2 (en) * | 2019-02-01 | 2022-05-31 | Rovi Guides, Inc. | Intelligent display of content based on event monitoring |
US11341186B2 (en) * | 2019-06-19 | 2022-05-24 | International Business Machines Corporation | Cognitive video and audio search aggregation |
US11126682B1 (en) * | 2020-07-06 | 2021-09-21 | International Business Machines Corporation | Hyperlink based multimedia processing |
US11869242B2 (en) | 2020-07-23 | 2024-01-09 | Rovi Guides, Inc. | Systems and methods for recording portion of sports game |
KR20230027224A (ko) | 2020-10-09 | 2023-02-27 | 히다치 아스테모 가부시키가이샤 | 완충기 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001283077A (ja) * | 2000-03-29 | 2001-10-12 | Sony Corp | 情報提供システム及び情報提供方法、並びに、ソフトウェア記憶媒体 |
JP2003204536A (ja) * | 2002-01-07 | 2003-07-18 | Toshiba Corp | コンテンツ配信システム及び方法 |
JP2003532164A (ja) * | 2000-05-03 | 2003-10-28 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | コンテンツ情報の処理を制御する方法 |
JP2004519923A (ja) * | 2001-03-02 | 2004-07-02 | マイクロソフト コーポレイション | デジタルビデオ記録および再生のための拡張テレビジョンサービス |
JP2005033619A (ja) * | 2003-07-08 | 2005-02-03 | Matsushita Electric Ind Co Ltd | コンテンツ管理装置およびコンテンツ管理方法 |
Family Cites Families (24)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5835667A (en) * | 1994-10-14 | 1998-11-10 | Carnegie Mellon University | Method and apparatus for creating a searchable digital video library and a system and method of using such a library |
US5765164A (en) | 1995-12-21 | 1998-06-09 | Intel Corporation | Apparatus and method for management of discontinuous segments of multiple audio, video, and data streams |
US5835567A (en) | 1996-01-29 | 1998-11-10 | Woods; Mark | Telephone line circuit testing jumper plug |
JP2001069437A (ja) * | 1999-08-30 | 2001-03-16 | Promenade:Kk | 画像検索方法、画像再生装置、検索情報記録方法および検索情報記録装置 |
US6601026B2 (en) * | 1999-09-17 | 2003-07-29 | Discern Communications, Inc. | Information retrieval by natural language querying |
US7197160B2 (en) | 2001-03-05 | 2007-03-27 | Digimarc Corporation | Geographic information systems using digital watermarks |
US7536704B2 (en) * | 2001-10-05 | 2009-05-19 | Opentv, Inc. | Method and apparatus automatic pause and resume of playback for a popup on interactive TV |
US7801910B2 (en) | 2005-11-09 | 2010-09-21 | Ramp Holdings, Inc. | Method and apparatus for timed tagging of media content |
US20100005485A1 (en) * | 2005-12-19 | 2010-01-07 | Agency For Science, Technology And Research | Annotation of video footage and personalised video generation |
US8243017B2 (en) * | 2006-09-11 | 2012-08-14 | Apple Inc. | Menu overlay including context dependent menu icon |
US7614505B2 (en) * | 2006-11-08 | 2009-11-10 | Ngk Insulators, Ltd. | Ceramic filter and regenerating method thereof |
US8316408B2 (en) * | 2006-11-22 | 2012-11-20 | Verizon Patent And Licensing Inc. | Audio processing for media content access systems and methods |
US20090222850A1 (en) * | 2008-03-03 | 2009-09-03 | Microsoft Corporation | Advertisement skip view |
US8516533B2 (en) | 2008-11-07 | 2013-08-20 | Digimarc Corporation | Second screen methods and arrangements |
US9036092B2 (en) * | 2013-06-24 | 2015-05-19 | Broadcom Corporation | Video channel change system |
US8972262B1 (en) | 2012-01-18 | 2015-03-03 | Google Inc. | Indexing and search of content in recorded group communications |
US9124856B2 (en) * | 2012-08-31 | 2015-09-01 | Disney Enterprises, Inc. | Method and system for video event detection for contextual annotation and synchronization |
US10051329B2 (en) * | 2012-12-10 | 2018-08-14 | DISH Technologies L.L.C. | Apparatus, systems, and methods for selecting and presenting information about program content |
US9056253B2 (en) * | 2013-05-22 | 2015-06-16 | David S. Thompson | Fantasy sports interleaver |
US20150110462A1 (en) * | 2013-10-21 | 2015-04-23 | Sling Media, Inc. | Dynamic media viewing |
US9215510B2 (en) * | 2013-12-06 | 2015-12-15 | Rovi Guides, Inc. | Systems and methods for automatically tagging a media asset based on verbal input and playback adjustments |
US9338493B2 (en) * | 2014-06-30 | 2016-05-10 | Apple Inc. | Intelligent automated assistant for TV user interactions |
US10659851B2 (en) * | 2014-06-30 | 2020-05-19 | Apple Inc. | Real-time digital assistant knowledge updates |
US10609454B2 (en) | 2015-07-31 | 2020-03-31 | Promptu Systems Corporation | Natural language navigation and assisted viewing of indexed audio video streams, notably sports contests |
-
2016
- 2016-07-28 US US15/222,924 patent/US10609454B2/en active Active
- 2016-07-29 JP JP2018525525A patent/JP2018528731A/ja active Pending
- 2016-07-29 EP EP16833617.0A patent/EP3329386A4/en not_active Withdrawn
- 2016-07-29 WO PCT/US2016/044734 patent/WO2017023763A1/en active Application Filing
- 2016-07-29 CA CA2993655A patent/CA2993655C/en active Active
- 2016-07-29 KR KR1020227041594A patent/KR20220164085A/ko active IP Right Grant
- 2016-07-29 AU AU2016302930A patent/AU2016302930B2/en active Active
- 2016-07-29 KR KR1020207021244A patent/KR102472681B1/ko active IP Right Grant
- 2016-07-29 KR KR1020187005788A patent/KR102138239B1/ko active IP Right Grant
-
2020
- 2020-03-30 US US16/835,047 patent/US11363338B2/en active Active
- 2020-07-01 JP JP2020113929A patent/JP7109503B2/ja active Active
-
2022
- 2022-06-08 US US17/805,958 patent/US20220337909A1/en active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001283077A (ja) * | 2000-03-29 | 2001-10-12 | Sony Corp | 情報提供システム及び情報提供方法、並びに、ソフトウェア記憶媒体 |
JP2003532164A (ja) * | 2000-05-03 | 2003-10-28 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | コンテンツ情報の処理を制御する方法 |
JP2004519923A (ja) * | 2001-03-02 | 2004-07-02 | マイクロソフト コーポレイション | デジタルビデオ記録および再生のための拡張テレビジョンサービス |
JP2003204536A (ja) * | 2002-01-07 | 2003-07-18 | Toshiba Corp | コンテンツ配信システム及び方法 |
JP2005033619A (ja) * | 2003-07-08 | 2005-02-03 | Matsushita Electric Ind Co Ltd | コンテンツ管理装置およびコンテンツ管理方法 |
Non-Patent Citations (3)
Title |
---|
伊藤 能康: "「R&D最前線 音声操作で見たい番組をすぐに見つける対話型意図理解技術」", 東芝レビュー, vol. 70, no. 2, JPN6019007610, 1 February 2015 (2015-02-01), JP, pages 56 - 57, ISSN: 0003988697 * |
山田 一郎(外4名): "「アナウンスコメントを利用したサッカー番組メタデータ自動生成」", 電子情報通信学会技術研究報告, vol. 104, no. 668, JPN6019007612, 18 February 2005 (2005-02-18), JP, pages 37 - 42, ISSN: 0003988698 * |
田中 清(外4名): "「気になるシーンを見逃さないライブ中継システムLiveWatchの構築」", 電子情報通信学会論文誌, vol. 86, no. 5, JPN6019007614, 1 May 2003 (2003-05-01), JP, pages 668 - 677, ISSN: 0003988699 * |
Also Published As
Publication number | Publication date |
---|---|
US20170070783A1 (en) | 2017-03-09 |
EP3329386A1 (en) | 2018-06-06 |
AU2016302930B2 (en) | 2019-07-04 |
US11363338B2 (en) | 2022-06-14 |
KR20200091941A (ko) | 2020-07-31 |
US10609454B2 (en) | 2020-03-31 |
KR20220164085A (ko) | 2022-12-12 |
US20200228868A1 (en) | 2020-07-16 |
CA2993655A1 (en) | 2017-02-09 |
WO2017023763A1 (en) | 2017-02-09 |
KR102472681B1 (ko) | 2022-11-30 |
KR20180066030A (ko) | 2018-06-18 |
EP3329386A4 (en) | 2019-03-13 |
KR102138239B1 (ko) | 2020-07-27 |
JP2020171044A (ja) | 2020-10-15 |
CA2993655C (en) | 2021-03-23 |
AU2016302930A1 (en) | 2018-02-22 |
US20220337909A1 (en) | 2022-10-20 |
JP7109503B2 (ja) | 2022-08-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7109503B2 (ja) | インデックス付与されたオーディオ・ビデオ・ストリーム(特に、スポーツ競技)の自然言語によるナビゲーションおよび支援された視聴 | |
JP6672433B2 (ja) | リアルタイムのデジタルアシスタントの知識更新 | |
US20230040708A1 (en) | Determining One or More Events in Content | |
US11490136B2 (en) | Systems and methods for providing a slow motion video stream concurrently with a normal-speed video stream upon detection of an event | |
CN102522102A (zh) | 基于事件标识的重播的智能确定 | |
US20230336818A1 (en) | Method and apparatus for shared viewing of media content | |
US20140373062A1 (en) | Method and system for providing a permissive auxiliary information user interface |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20180329 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20190305 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20190603 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20190805 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20190903 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20200303 |