JP2019521583A5 - - Google Patents

Download PDF

Info

Publication number
JP2019521583A5
JP2019521583A5 JP2018561468A JP2018561468A JP2019521583A5 JP 2019521583 A5 JP2019521583 A5 JP 2019521583A5 JP 2018561468 A JP2018561468 A JP 2018561468A JP 2018561468 A JP2018561468 A JP 2018561468A JP 2019521583 A5 JP2019521583 A5 JP 2019521583A5
Authority
JP
Japan
Prior art keywords
areas
greatest interest
data
regions
interested
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2018561468A
Other languages
English (en)
Other versions
JP2019521583A (ja
Filing date
Publication date
Priority claimed from US15/591,805 external-priority patent/US10565463B2/en
Application filed filed Critical
Publication of JP2019521583A publication Critical patent/JP2019521583A/ja
Publication of JP2019521583A5 publication Critical patent/JP2019521583A5/ja
Pending legal-status Critical Current

Links

Claims (56)

  1. ビデオについての情報を決定する方法であって、前記方法は、
    クライアントデバイスのプロセッサが、ここで、前記プロセッサは、回路中にインプリメントされ、1つまたは複数の最も関心のある領域を表すデータからビデオデータのイメージの複数の領域のうちの前記1つまたは複数の最も関心のある領域を決定することと、
    前記プロセッサが、前記1つまたは複数の最も関心のある領域を表す前記データを使用して前記1つまたは複数の最も関心のある領域を指定する要求を生成することと、
    前記プロセッサが、サーバデバイスに前記1つまたは複数の最も関心のある領域を指定する前記要求を出力することと、
    前記プロセッサが、前記サーバデバイスから、前記1つまたは複数の最も関心のある領域についてのビデオデータを受信することと、
    前記プロセッサが、前記1つまたは複数の最も関心のある領域を指定する前記要求を出力した後に、前記サーバデバイスに前記イメージの1つまたは複数の他の領域を指定する要求を出力することと、
    前記プロセッサが、前記サーバデバイスから、前記1つまたは複数の他の領域についてのビデオデータを受信することと
    を備える、方法。
  2. 前記プロセッサが、ユーザの視野(FOV)を使用して前記イメージの前記1つまたは複数の他の領域を指定する前記要求を生成すること
    をさらに備える、請求項1に記載の方法。
  3. 前記1つまたは複数の最も関心のある領域を決定することは、補足エンハンスメント情報(SEI)メッセージから最も関心のある領域データを抽出することを備え、前記最も関心のある領域データは、前記1つまたは複数の最も関心のある領域を表す、請求項1に記載の方法。
  4. 前記1つまたは複数の最も関心のある領域を決定することは、ファイルフォーマットヘッダ情報中に含まれるサンプルグループボックスから最も関心のある領域データを抽出することを備え、前記最も関心のある領域データは、前記1つまたは複数の最も関心のある領域を表す、請求項1に記載の方法。
  5. 前記1つまたは複数の最も関心のある領域を決定することは、ファイルフォーマットヘッダ情報中に含まれるサンプルテーブルボックスまたはトラックフラグメントから最も関心のある領域データを抽出することを備え、前記最も関心のある領域データは、前記1つまたは複数の最も関心のある領域を表す、請求項1に記載の方法。
  6. 前記1つまたは複数の最も関心のある領域を決定することは、ファイルフォーマットヘッダ情報中に含まれるセグメントインデックスボックスから最も関心のある領域データを抽出することを備え、前記最も関心のある領域データは、前記1つまたは複数の最も関心のある領域を表す、請求項1に記載の方法。
  7. 前記1つまたは複数の最も関心のある領域を決定することは、HTTPを通した動的適応型ストリーミング(DASH)メディアプレゼンテーション記述(MPD)から最も関心のある領域データを抽出することを備え、前記最も関心のある領域データは、前記1つまたは複数の最も関心のある領域を表す、請求項1に記載の方法。
  8. 前記1つまたは複数の最も関心のある領域を決定することは、前記1つまたは複数の最も関心のある領域の各最も関心のある領域について、ベース領域に対するそれぞれの最も関心のある領域の位置と、前記ベース領域に対する前記それぞれの最も関心のある領域のサイズとを表す複数のシンタックス要素についての複数の値を決定することを備える、請求項1に記載の方法。
  9. 前記複数のシンタックス要素についての前記複数の値を決定することは、前記1つまたは複数の最も関心のある領域の各最も関心のある領域について、
    前記ベース領域に対する前記それぞれの最も関心のある領域の左水平オフセットを表す第1のシンタックス要素についての値を抽出することと、
    前記ベース領域に対する前記それぞれの最も関心のある領域の上部垂直オフセットを表す第2のシンタックス要素についての値を抽出することと、
    前記ベース領域に対する前記それぞれの最も関心のある領域の幅を表す第3のシンタックス要素についての値を抽出することと、
    前記ベース領域に対する前記それぞれの最も関心のある領域の高さを表す第4のシンタックス要素についての値を抽出することと
    を備える、請求項に記載の方法。
  10. 前記1つまたは複数の最も関心のある領域を決定することは、前記イメージの1つまたは複数のタイルを表す1つまたは複数のタイル識別子を抽出することを備え、前記1つまたは複数のタイルは、前記1つまたは複数の最も関心のある領域と空間的にコロケートされる、請求項1に記載の方法。
  11. 前記1つまたは複数の最も関心のある領域を決定することは、前記イメージの前記複数の領域のうちの1つまたは複数の領域を表す1つまたは複数のグループ識別子を抽出することを備える、請求項1に記載の方法。
  12. 前記1つまたは複数の最も関心のある領域を決定することは、1つまたは複数のトラックを表す1つまたは複数のトラック識別子を抽出することを備え、前記1つまたは複数のトラックの各トラックは、前記1つまたは複数の最も関心のある領域についてのビデオコーディングレイヤ(VCL)データを含む、請求項1に記載の方法。
  13. 前記1つまたは複数の最も関心のある領域を決定することは、前記イメージの1つまたは複数のリプレゼンテーションを表す1つまたは複数のリプレゼンテーション識別子を抽出することを備え、前記1つまたは複数のリプレゼンテーションの各リプレゼンテーションは、前記1つまたは複数の最も関心のある領域についてのビデオコーディングレイヤ(VCL)データを含む、請求項1に記載の方法。
  14. 前記1つまたは複数の最も関心のある領域を決定することは、
    1つまたは複数のベースタイルトラックを表す1つまたは複数のベースタイルトラック識別子を抽出することと、
    前記1つまたは複数のベースタイルトラック識別子を使用して前記1つまたは複数のベースタイルトラックから最も関心のある領域データを抽出することと
    を備える、請求項1に記載の方法。
  15. 前記1つまたは複数の最も関心のある領域を決定することは、イメージ順序カウントを表す1つまたは複数のシンタックス要素を決定することを備え、前記イメージ順序カウントは、前記1つまたは複数の最も関心のある領域を表す前記データが前記イメージに適用されることを示す、請求項1に記載の方法。
  16. ビデオデータについての情報を決定するためのデバイスであって、前記デバイスは、
    1つまたは複数の最も関心のある領域を表すデータからビデオデータのイメージの複数の領域のうちの前記1つまたは複数の最も関心のある領域を決定することと、
    前記1つまたは複数の最も関心のある領域を表す前記データを使用して前記1つまたは複数の最も関心のある領域を指定する要求を生成することと、
    サーバデバイスに前記1つまたは複数の最も関心のある領域を指定する前記要求を出力することと、
    前記サーバデバイスから、前記1つまたは複数の最も関心のある領域についてのビデオデータを受信することと、
    前記1つまたは複数の最も関心のある領域を指定する前記要求を出力した後に、前記サーバデバイスに前記イメージの1つまたは複数の他の領域を指定する要求を出力することと、
    前記サーバデバイスから、前記1つまたは複数の他の領域についてのビデオデータを受信することと
    を行うように構成された、回路中にインプリメントされた1つまたは複数のプロセッサを備える、デバイス。
  17. 前記1つまたは複数の最も関心のある領域を決定するために、前記1つまたは複数のプロセッサは、補足エンハンスメント情報(SEI)メッセージから最も関心のある領域データを抽出するようにさらに構成され、前記最も関心のある領域データは、前記1つまたは複数の最も関心のある領域を表す、請求項16に記載のデバイス。
  18. 前記1つまたは複数の最も関心のある領域を決定するために、前記1つまたは複数のプロセッサは、ファイルフォーマットヘッダ情報中に含まれるサンプルグループボックス、サンプルテーブルボックス、トラックフラグメント、またはセグメントインデックスボックスから最も関心のある領域データを抽出するようにさらに構成され、前記最も関心のある領域データは、前記1つまたは複数の最も関心のある領域を表す、請求項16に記載のデバイス。
  19. 前記1つまたは複数の最も関心のある領域を決定するために、前記1つまたは複数のプロセッサは、HTTPを通した動的適応型ストリーミング(DASH)メディアプレゼンテーション記述(MPD)から最も関心のある領域データを抽出するようにさらに構成され、前記最も関心のある領域データは、前記1つまたは複数の最も関心のある領域を表す、請求項16に記載のデバイス。
  20. 前記1つまたは複数の最も関心のある領域を決定するために、前記1つまたは複数のプロセッサは、前記1つまたは複数の最も関心のある領域の各最も関心のある領域について、ベース領域に対するそれぞれの最も関心のある領域の位置と、前記ベース領域に対する前記それぞれの最も関心のある領域のサイズとを表す複数のシンタックス要素についての複数の値を決定するようにさらに構成される、請求項16に記載のデバイス。
  21. 前記複数のシンタックス要素についての前記複数の値を決定するために、前記1つまたは複数のプロセッサは、前記1つまたは複数の最も関心のある領域の各最も関心のある領域について、
    前記ベース領域に対する前記それぞれの最も関心のある領域の左水平オフセットを表す第1のシンタックス要素についての値を抽出することと、
    前記ベース領域に対する前記それぞれの最も関心のある領域の上部垂直オフセットを表す第2のシンタックス要素についての値を抽出することと、
    前記ベース領域に対する前記それぞれの最も関心のある領域の幅を表す第3のシンタックス要素についての値を抽出することと、
    前記ベース領域に対する前記それぞれの最も関心のある領域の高さを表す第4のシンタックス要素についての値を抽出することと
    を行うようにさらに構成される、請求項20に記載のデバイス。
  22. 前記1つまたは複数の最も関心のある領域を決定するために、前記1つまたは複数のプロセッサは、前記イメージの1つまたは複数のタイルを表す1つまたは複数のタイル識別子を抽出するようにさらに構成され、前記1つまたは複数のタイルは、前記1つまたは複数の最も関心のある領域と空間的にコロケートされる、請求項16に記載のデバイス。
  23. 前記1つまたは複数の最も関心のある領域を決定するために、前記1つまたは複数のプロセッサは、前記イメージの前記複数の領域のうちの1つまたは複数の領域を表す1つまたは複数のグループ識別子を抽出するようにさらに構成される、請求項16に記載のデバイス。
  24. 前記1つまたは複数の最も関心のある領域を決定するために、前記1つまたは複数のプロセッサは、1つまたは複数のトラックを表す1つまたは複数のトラック識別子を抽出するようにさらに構成され、前記1つまたは複数のトラックの各トラックは、前記1つまたは複数の最も関心のある領域についてのビデオコーディングレイヤ(VCL)データを含む、請求項16に記載のデバイス。
  25. 前記1つまたは複数の最も関心のある領域を決定するために、前記1つまたは複数のプロセッサは、前記イメージの1つまたは複数のリプレゼンテーションを表す1つまたは複数のリプレゼンテーション識別子を抽出するようにさらに構成され、前記1つまたは複数のリプレゼンテーションの各リプレゼンテーションは、前記1つまたは複数の最も関心のある領域についてのビデオコーディングレイヤ(VCL)データを含む、請求項16に記載のデバイス。
  26. 前記1つまたは複数の最も関心のある領域を決定するために、前記1つまたは複数のプロセッサは、
    1つまたは複数のベースタイルトラックを表す1つまたは複数のベースタイルトラック識別子を抽出することと、
    前記1つまたは複数のベースタイルトラック識別子を使用して前記1つまたは複数のベースタイルトラックから最も関心のある領域データを抽出することと
    を行うようにさらに構成される、請求項16に記載のデバイス。
  27. 前記1つまたは複数の最も関心のある領域を決定するために、前記1つまたは複数のプロセッサは、イメージ順序カウントを表す1つまたは複数のシンタックス要素を決定するようにさらに構成され、前記イメージ順序カウントは、前記1つまたは複数の最も関心のある領域を表す前記データが前記イメージに適用されることを示す、請求項16に記載のデバイス。
  28. ビデオデータについての情報を決定するためのデバイスであって、前記デバイスは、
    1つまたは複数の最も関心のある領域を表すデータからビデオデータのイメージの複数の領域のうちの前記1つまたは複数の最も関心のある領域を決定するための手段と、
    前記1つまたは複数の最も関心のある領域を表す前記データを使用して前記1つまたは複数の最も関心のある領域を指定する要求を生成する手段と、
    サーバデバイスに前記1つまたは複数の最も関心のある領域を指定する前記要求を出力するための手段と、
    前記サーバデバイスから、前記1つまたは複数の最も関心のある領域についてのビデオデータを受信するための手段と、
    前記1つまたは複数の最も関心のある領域を指定する前記要求を出力した後に、前記サーバデバイスに前記イメージの1つまたは複数の他の領域を指定する要求を出力するための手段と、
    前記サーバデバイスから、前記1つまたは複数の他の領域についてのビデオデータを受信するための手段と
    を備える、デバイス。
  29. 実行されると、プロセッサに、
    1つまたは複数の最も関心のある領域を表すデータからビデオデータのイメージの複数の領域のうちの前記1つまたは複数の最も関心のある領域を決定することと、
    前記1つまたは複数の最も関心のある領域を表す前記データを使用して前記1つまたは複数の最も関心のある領域を指定する要求を生成することと、
    サーバデバイスに前記1つまたは複数の最も関心のある領域を指定する前記要求を出力することと、
    前記サーバデバイスから、前記1つまたは複数の最も関心のある領域についてのビデオデータを受信することと、
    前記1つまたは複数の最も関心のある領域を指定する前記要求を出力した後に、前記サーバデバイスに前記イメージの1つまたは複数の他の領域を指定する要求を出力することと、
    前記サーバデバイスから、前記1つまたは複数の他の領域についてのビデオデータを受信することと
    を行わせる命令を記憶した、非一時的コンピュータ可読記憶媒体。
  30. ビデオデータについての情報をシグナリングする方法であって、前記方法は、
    ソースデバイスのプロセッサが、ここで、前記プロセッサは、回路中にインプリメントされ、ビデオデータのイメージの複数の領域のうちの1つまたは複数の最も関心のある領域を決定することと、前記1つまたは複数の最も関心のある領域は、クライアントデバイスによって検索される可能性が最も高い1つまたは複数の領域を備える、
    前記プロセッサが、前記クライアントデバイスに、前記1つまたは複数の最も関心のある領域を表すデータを出力することと、ここにおいて、前記1つまたは複数の最も関心のある領域を表す前記データは、前記ビデオデータを含むビットストリーム中に含まれる、
    前記プロセッサが、前記クライアントデバイスから、前記1つまたは複数の最も関心のある領域についてのビデオデータを求める要求を受信することと、
    前記プロセッサが、前記クライアントデバイスに、前記1つまたは複数の最も関心のある領域を表す前記データを出力した後に、前記1つまたは複数の最も関心のある領域についての前記ビデオデータを出力することと、
    前記プロセッサが、前記クライアントデバイスから、前記イメージの1つまたは複数の他の領域についてのビデオデータを求める要求を受信することと、
    前記プロセッサが、前記クライアントデバイスに、前記1つまたは複数の最も関心のある領域についての前記ビデオデータを出力した後に、前記イメージの前記1つまたは複数の他の領域についての前記ビデオデータを出力することと
    を備える、方法。
  31. 前記1つまたは複数の最も関心のある領域を表す前記データを出力することは、最も関心のある領域データを含む補足エンハンスメント情報(SEI)メッセージを生成することを備え、前記最も関心のある領域データは、前記1つまたは複数の最も関心のある領域を表す、請求項30に記載の方法。
  32. 前記1つまたは複数の最も関心のある領域を表す前記データを出力することは、ファイルフォーマットヘッダ情報中で、最も関心のある領域データを含むサンプルグループボックス、サンプルテーブルボックス、トラックフラグメント、またはセグメントインデックスボックスを生成することを備え、前記最も関心のある領域データは、前記1つまたは複数の最も関心のある領域を表す、請求項30に記載の方法。
  33. 前記1つまたは複数の最も関心のある領域を表す前記データを出力することは、最も関心のある領域データを含むHTTPを通した動的適応型ストリーミング(DASH)メディアプレゼンテーション記述(MPD)を生成することを備え、前記最も関心のある領域データは、前記1つまたは複数の最も関心のある領域を表す、請求項30に記載の方法。
  34. 前記1つまたは複数の最も関心のある領域を表す前記データを出力することは、前記1つまたは複数の最も関心のある領域の各最も関心のある領域について、ベース領域に対するそれぞれの最も関心のある領域の位置と、前記ベース領域に対する前記それぞれの最も関心のある領域のサイズとを表す複数のシンタックス要素についての複数の値を生成する、請求項30に記載の方法。
  35. 前記複数のシンタックス要素についての前記複数の値を出力することは、前記1つまたは複数の最も関心のある領域の各最も関心のある領域について、
    前記ベース領域に対する前記それぞれの最も関心のある領域の左水平オフセットを表す第1のシンタックス要素についての値を生成することと、
    前記ベース領域に対する前記それぞれの最も関心のある領域の上部垂直オフセットを表す第2のシンタックス要素についての値を生成することと、
    前記ベース領域に対する前記それぞれの最も関心のある領域の幅を表す第3のシンタックス要素についての値を生成することと、
    前記ベース領域に対する前記それぞれの最も関心のある領域の高さを表す第4のシンタックス要素についての値を生成することと
    を備える、請求項34に記載の方法。
  36. 前記1つまたは複数の最も関心のある領域を表す前記データを出力することは、前記イメージの1つまたは複数のタイルを表す1つまたは複数のタイル識別子を生成することを備え、前記1つまたは複数のタイルは、前記1つまたは複数の最も関心のある領域と空間的にコロケートされる、請求項30に記載の方法。
  37. 前記1つまたは複数の最も関心のある領域を表す前記データを出力することは、前記イメージの前記複数の領域のうちの1つまたは複数の領域を表す1つまたは複数のグループ識別子を生成することを備える、請求項30に記載の方法。
  38. 前記1つまたは複数の最も関心のある領域を表す前記データを出力することは、1つまたは複数のトラックを表す1つまたは複数のトラック識別子を生成することを備え、前記1つまたは複数のトラックの各トラックは、前記1つまたは複数の最も関心のある領域についてのビデオコーディングレイヤ(VCL)データを含む、請求項30に記載の方法。
  39. 前記1つまたは複数の最も関心のある領域を表す前記データを出力することは、前記イメージの1つまたは複数のリプレゼンテーションを表す1つまたは複数のリプレゼンテーション識別子を生成することを備え、前記1つまたは複数のリプレゼンテーションの各リプレゼンテーションは、前記1つまたは複数の最も関心のある領域についてのビデオコーディングレイヤ(VCL)データを含む、請求項30に記載の方法。
  40. 前記1つまたは複数の最も関心のある領域を表す前記データを出力することは、
    1つまたは複数のベースタイルトラックにおいて最も関心のある領域データを生成することと、
    前記1つまたは複数の最も関心のある領域を表す前記データにおいて、前記1つまたは複数のベースタイルトラックを表す1つまたは複数のベースタイルトラック識別子を生成することと
    を備える、請求項30に記載の方法。
  41. 前記1つまたは複数の最も関心のある領域を表す前記データを出力することは、イメージ順序カウントを表す1つまたは複数のシンタックス要素を生成することを備え、前記イメージ順序カウントは、前記1つまたは複数の最も関心のある領域を表す前記データが前記イメージに適用されることを示す、請求項30に記載の方法。
  42. 前記1つまたは複数の最も関心のある領域を決定することは、ディレクターの意図またはユーザ統計のうちの1つまたは複数を使用して前記1つまたは複数の最も関心のある領域を決定することを備える、請求項30に記載の方法。
  43. ビデオデータについての情報をシグナリングするためのデバイスであって、前記デバイスは、
    ビデオデータのイメージの複数の領域のうちの1つまたは複数の最も関心のある領域を決定することと、前記1つまたは複数の最も関心のある領域は、クライアントデバイスによって検索される可能性が最も高い1つまたは複数の領域を備える、
    前記クライアントデバイスに、前記1つまたは複数の最も関心のある領域を表すデータを出力することと、ここにおいて、前記1つまたは複数の最も関心のある領域を表す前記データは、前記ビデオデータを含むビットストリーム中に含まれる、
    前記クライアントデバイスから、前記1つまたは複数の最も関心のある領域についてのビデオデータを求める要求を受信することと、
    前記クライアントデバイスに、前記1つまたは複数の最も関心のある領域を表す前記データを出力した後に、前記1つまたは複数の最も関心のある領域についての前記ビデオデータを出力することと、
    前記クライアントデバイスから、前記イメージの1つまたは複数の他の領域についてのビデオデータを求める要求を受信することと、
    前記クライアントデバイスに、前記1つまたは複数の最も関心のある領域についての前記ビデオデータを出力した後に、前記イメージの前記1つまたは複数の他の領域についての前記ビデオデータを出力することと
    を行うように構成された、回路中にインプリメントされた1つまたは複数のプロセッサを備える、デバイス。
  44. 前記1つまたは複数の最も関心のある領域を表す前記データを出力するために、前記1つまたは複数のプロセッサは、最も関心のある領域データを含む補足エンハンスメント情報(SEI)メッセージを生成するようにさらに構成され、前記最も関心のある領域データは、前記1つまたは複数の最も関心のある領域を表す、請求項43に記載のデバイス。
  45. 前記1つまたは複数の最も関心のある領域を表す前記データを出力するために、前記1つまたは複数のプロセッサは、ファイルフォーマットヘッダ情報中で、最も関心のある領域データを含むサンプルグループボックス、サンプルテーブルボックス、トラックフラグメント、またはセグメントインデックスボックスを生成するようにさらに構成され、前記最も関心のある領域データは、前記1つまたは複数の最も関心のある領域を表す、請求項43に記載のデバイス。
  46. 前記1つまたは複数の最も関心のある領域を表す前記データを出力するために、前記1つまたは複数のプロセッサは、最も関心のある領域データを含むHTTPを通した動的適応型ストリーミング(DASH)メディアプレゼンテーション記述(MPD)を生成するようにさらに構成され、前記最も関心のある領域データは、前記1つまたは複数の最も関心のある領域を表す、請求項43に記載のデバイス。
  47. 前記1つまたは複数の最も関心のある領域を表す前記データを出力するために、前記1つまたは複数のプロセッサは、前記1つまたは複数の最も関心のある領域の各最も関心のある領域について、ベース領域に対するそれぞれの最も関心のある領域の位置と、前記ベース領域に対する前記それぞれの最も関心のある領域のサイズとを表す複数のシンタックス要素についての複数の値を生成するようにさらに構成される、請求項43に記載のデバイス。
  48. 前記複数のシンタックス要素についての前記複数の値を出力するために、前記1つまたは複数のプロセッサは、
    前記ベース領域に対する前記それぞれの最も関心のある領域の左水平オフセットを表す第1のシンタックス要素についての値を生成することと、
    前記ベース領域に対する前記それぞれの最も関心のある領域の上部垂直オフセットを表す第2のシンタックス要素についての値を生成することと、
    前記ベース領域に対する前記それぞれの最も関心のある領域の幅を表す第3のシンタックス要素についての値を生成することと、
    前記ベース領域に対する前記それぞれの最も関心のある領域の高さを表す第4のシンタックス要素についての値を生成することと
    を行うようにさらに構成される、請求項47に記載のデバイス。
  49. 前記1つまたは複数の最も関心のある領域を表す前記データを出力するために、前記1つまたは複数のプロセッサは、前記イメージの1つまたは複数のタイルを表す1つまたは複数のタイル識別子を生成するようにさらに構成され、前記1つまたは複数のタイルは、前記1つまたは複数の最も関心のある領域と空間的にコロケートされる、請求項43に記載のデバイス。
  50. 前記1つまたは複数の最も関心のある領域を表す前記データを出力するために、前記1つまたは複数のプロセッサは、前記イメージの前記複数の領域のうちの1つまたは複数の領域を表す1つまたは複数のグループ識別子を生成するようにさらに構成される、請求項43に記載のデバイス。
  51. 前記1つまたは複数の最も関心のある領域を表す前記データを出力するために、前記1つまたは複数のプロセッサは、1つまたは複数のトラックを表す1つまたは複数のトラック識別子を生成するようにさらに構成され、前記1つまたは複数のトラックの各トラックは、前記1つまたは複数の最も関心のある領域についてのビデオコーディングレイヤ(VCL)データを含む、請求項43に記載のデバイス。
  52. 前記1つまたは複数の最も関心のある領域を表す前記データを出力するために、前記1つまたは複数のプロセッサは、前記イメージの1つまたは複数のリプレゼンテーションを表す1つまたは複数のリプレゼンテーション識別子を生成するようにさらに構成され、前記1つまたは複数のリプレゼンテーションの各リプレゼンテーションは、前記1つまたは複数の最も関心のある領域についてのビデオコーディングレイヤ(VCL)データを含む、請求項43に記載のデバイス。
  53. 前記1つまたは複数の最も関心のある領域を表す前記データを出力するために、前記1つまたは複数のプロセッサは、
    1つまたは複数のベースタイルトラックにおいて最も関心のある領域データを生成することと、
    前記1つまたは複数の最も関心のある領域を表す前記データにおいて、前記1つまたは複数のベースタイルトラックを表す1つまたは複数のベースタイルトラック識別子を生成することと
    を行うようにさらに構成される、請求項43に記載のデバイス。
  54. 前記1つまたは複数の最も関心のある領域を表す前記データを出力するために、前記1つまたは複数のプロセッサは、イメージ順序カウントを表す1つまたは複数のシンタックス要素を生成するようにさらに構成され、前記イメージ順序カウントは、前記1つまたは複数の最も関心のある領域を表す前記データが前記イメージに適用されることを示す、請求項43に記載のデバイス。
  55. ビデオデータについての情報をシグナリングするためのデバイスであって、前記デバイスは、
    ビデオデータのイメージの複数の領域のうちの1つまたは複数の最も関心のある領域を決定するための手段と、前記1つまたは複数の最も関心のある領域は、クライアントデバイスによって検索される可能性が最も高い1つまたは複数の領域を備える、
    前記クライアントデバイスに、前記1つまたは複数の最も関心のある領域を表すデータを出力するための手段と、ここにおいて、前記1つまたは複数の最も関心のある領域を表す前記データは、前記ビデオデータを含むビットストリーム中に含まれる、
    前記クライアントデバイスから、前記1つまたは複数の最も関心のある領域についてのビデオデータを求める要求を受信するための手段と、
    前記クライアントデバイスに、前記1つまたは複数の最も関心のある領域を表す前記データを出力した後に、前記1つまたは複数の最も関心のある領域についての前記ビデオデータを出力するための手段と、
    前記クライアントデバイスから、前記イメージの1つまたは複数の他の領域についてのビデオデータを求める要求を受信するための手段と、
    前記クライアントデバイスに、前記1つまたは複数の最も関心のある領域についての前記ビデオデータを出力した後に、前記イメージの前記1つまたは複数の他の領域についての前記ビデオデータを出力するための手段と
    を備える、デバイス。
  56. 実行されると、プロセッサに、
    ビデオデータのイメージの複数の領域のうちの1つまたは複数の最も関心のある領域を決定することと、前記1つまたは複数の最も関心のある領域は、クライアントデバイスによって検索される可能性が最も高い1つまたは複数の領域を備える、
    前記クライアントデバイスに、前記1つまたは複数の最も関心のある領域を表すデータを出力することと、ここにおいて、前記1つまたは複数の最も関心のある領域を表す前記データは、前記ビデオデータを含むビットストリーム中に含まれる、
    前記クライアントデバイスから、前記1つまたは複数の最も関心のある領域についてのビデオデータを求める要求を受信することと、
    前記クライアントデバイスに、前記1つまたは複数の最も関心のある領域を表す前記データを出力した後に、前記1つまたは複数の最も関心のある領域についての前記ビデオデータを出力することと、
    前記クライアントデバイスから、前記イメージの1つまたは複数の他の領域についてのビデオデータを求める要求を受信することと、
    前記クライアントデバイスに、前記1つまたは複数の最も関心のある領域についての前記ビデオデータを出力した後に、前記イメージの前記1つまたは複数の他の領域についての前記ビデオデータを出力することと
    を行わせる命令を記憶した、非一時的コンピュータ可読記憶媒体。
JP2018561468A 2016-05-24 2017-05-11 イメージ中の最も関心のある領域の高度なシグナリング Pending JP2019521583A (ja)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201662341017P 2016-05-24 2016-05-24
US62/341,017 2016-05-24
US15/591,805 US10565463B2 (en) 2016-05-24 2017-05-10 Advanced signaling of a most-interested region in an image
US15/591,805 2017-05-10
PCT/US2017/032185 WO2017205069A1 (en) 2016-05-24 2017-05-11 Advanced signaling of a most-interested region in an image

Publications (2)

Publication Number Publication Date
JP2019521583A JP2019521583A (ja) 2019-07-25
JP2019521583A5 true JP2019521583A5 (ja) 2021-04-15

Family

ID=59034850

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018561468A Pending JP2019521583A (ja) 2016-05-24 2017-05-11 イメージ中の最も関心のある領域の高度なシグナリング

Country Status (9)

Country Link
US (1) US10565463B2 (ja)
EP (1) EP3466084A1 (ja)
JP (1) JP2019521583A (ja)
KR (1) KR102342274B1 (ja)
CN (1) CN109155865A (ja)
AU (1) AU2017271981A1 (ja)
BR (1) BR112018073956A2 (ja)
TW (1) TW201742461A (ja)
WO (1) WO2017205069A1 (ja)

Families Citing this family (37)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11108670B2 (en) 2015-09-09 2021-08-31 Vantrix Corporation Streaming network adapted to content selection
US10694249B2 (en) * 2015-09-09 2020-06-23 Vantrix Corporation Method and system for selective content processing based on a panoramic camera and a virtual-reality headset
US11287653B2 (en) 2015-09-09 2022-03-29 Vantrix Corporation Method and system for selective content processing based on a panoramic camera and a virtual-reality headset
US10419770B2 (en) 2015-09-09 2019-09-17 Vantrix Corporation Method and system for panoramic multimedia streaming
US20180176468A1 (en) 2016-12-19 2018-06-21 Qualcomm Incorporated Preferred rendering of signalled regions-of-interest or viewports in virtual reality video
US10999602B2 (en) 2016-12-23 2021-05-04 Apple Inc. Sphere projected motion estimation/compensation and mode decision
US11290755B2 (en) 2017-01-10 2022-03-29 Qualcomm Incorporated Signaling data for prefetching support for streaming media data
US11259046B2 (en) 2017-02-15 2022-02-22 Apple Inc. Processing of equirectangular object data to compensate for distortion by spherical projections
US10924747B2 (en) 2017-02-27 2021-02-16 Apple Inc. Video coding techniques for multi-view video
KR102332525B1 (ko) * 2017-06-01 2021-11-29 삼성전자주식회사 전자 장치 및 그 동작방법
US11093752B2 (en) 2017-06-02 2021-08-17 Apple Inc. Object tracking in multi-view video
US10754242B2 (en) * 2017-06-30 2020-08-25 Apple Inc. Adaptive resolution and projection format in multi-direction video
WO2019070686A1 (en) 2017-10-04 2019-04-11 Vid Scale, Inc. 360 DEGREES MULTIMEDIA VISUALIZATION CUSTOMIZED
US10893261B2 (en) * 2017-12-06 2021-01-12 Dolby Laboratories Licensing Corporation Positional zero latency
CN109996110B (zh) * 2017-12-29 2021-10-22 中兴通讯股份有限公司 一种视频播放方法、终端、服务器及存储介质
WO2019195036A1 (en) 2018-04-03 2019-10-10 Futurewei Technologies, Inc. File format signaling of error mitigation in sub-picture bitstream based viewport dependent video coding
EP3777220A1 (en) * 2018-04-13 2021-02-17 Huawei Technologies Co., Ltd. Immersive media metrics for virtual reality content with multiple viewpoints
US10630990B1 (en) 2018-05-01 2020-04-21 Amazon Technologies, Inc. Encoder output responsive to quality metric information
US10958987B1 (en) * 2018-05-01 2021-03-23 Amazon Technologies, Inc. Matching based on video data
KR20190136417A (ko) * 2018-05-30 2019-12-10 삼성전자주식회사 3차원 360도 영상 데이터의 전송 방법, 그에 따른 디스플레이 장치, 및 그에 따른 영상 저장 장치
US10623791B2 (en) 2018-06-01 2020-04-14 At&T Intellectual Property I, L.P. Field of view prediction in live panoramic video streaming
US10812774B2 (en) 2018-06-06 2020-10-20 At&T Intellectual Property I, L.P. Methods and devices for adapting the rate of video content streaming
US11108841B2 (en) 2018-06-19 2021-08-31 At&T Intellectual Property I, L.P. Apparatus, storage medium and method for heterogeneous segmentation of video streaming
US10616621B2 (en) 2018-06-29 2020-04-07 At&T Intellectual Property I, L.P. Methods and devices for determining multipath routing for panoramic video content
US10708494B2 (en) 2018-08-13 2020-07-07 At&T Intellectual Property I, L.P. Methods, systems and devices for adjusting panoramic video content
US11019361B2 (en) 2018-08-13 2021-05-25 At&T Intellectual Property I, L.P. Methods, systems and devices for adjusting panoramic view of a camera for capturing video content
WO2020068284A1 (en) * 2018-09-26 2020-04-02 Futurewei Technologies, Inc. Virtual reality (vr) viewpoint grouping
US10779014B2 (en) * 2018-10-18 2020-09-15 At&T Intellectual Property I, L.P. Tile scheduler for viewport-adaptive panoramic video streaming
US11323754B2 (en) * 2018-11-20 2022-05-03 At&T Intellectual Property I, L.P. Methods, devices, and systems for updating streaming panoramic video content due to a change in user viewpoint
CN112312159A (zh) * 2019-07-30 2021-02-02 华为技术有限公司 视频的缓存方法和装置
CN110677692B (zh) * 2019-09-27 2022-12-06 腾讯科技(深圳)有限公司 视频解码方法及装置、视频编码方法及装置
CN112511866B (zh) * 2019-12-03 2024-02-23 中兴通讯股份有限公司 媒体资源播放方法、装置、设备和存储介质
US11417076B2 (en) * 2020-09-01 2022-08-16 Qualcomm Incorporated Detecting a sub-image region of interest in an image using pilot signals
US11698794B2 (en) * 2020-09-02 2023-07-11 Ge Aviation Systems Llc Systems and method for flexible access of a regulated system
US11924464B2 (en) 2021-09-20 2024-03-05 Qualcomm Incorporated Processing video data picture size change request and notification messages
WO2023044214A1 (en) * 2021-09-20 2023-03-23 Qualcomm Incorporated Processing video data picture size change request and notification messages
CN115546652B (zh) * 2022-11-29 2023-04-07 城云科技(中国)有限公司 一种多时态目标检测模型及其构建方法、装置及应用

Family Cites Families (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09233467A (ja) * 1996-02-21 1997-09-05 Fujitsu Ltd 画像データ通信装置及び画像データ通信システムにおける通信データ量調整方法
US7613727B2 (en) 2002-02-25 2009-11-03 Sont Corporation Method and apparatus for supporting advanced coding formats in media files
US7058203B2 (en) * 2002-05-14 2006-06-06 Lockheed Martin Corporation Region of interest identification using region of adjacent pixels analysis
JP4111926B2 (ja) * 2004-03-09 2008-07-02 株式会社リコー 画像処理装置、プログラム、記憶媒体及び画像送信方法
CN101313578B (zh) * 2005-09-26 2011-10-19 韩国电子通信研究院 用于在可伸缩视频编码中定义和重构感兴趣区域的方法和装置
US20070165007A1 (en) * 2006-01-13 2007-07-19 Gerald Morrison Interactive input system
US8606952B2 (en) * 2008-01-15 2013-12-10 International Business Machines Corporation Method and system for optimizing bandwidth usage in remote visualization
JP5039627B2 (ja) * 2008-03-31 2012-10-03 株式会社コナミデジタルエンタテインメント ゲーム画像送信装置、ゲーム画像送信装置の制御方法、及びプログラム
KR101437626B1 (ko) * 2009-08-12 2014-09-03 톰슨 라이센싱 화상 시퀀스에서의 관심 영역 기반 아티팩트 저감 시스템 및 방법
CN101699862B (zh) * 2009-11-16 2011-04-13 上海交通大学 Ptz摄像机获取感兴趣区域高分辨率图像的方法
US8571280B2 (en) * 2010-02-22 2013-10-29 Canon Kabushiki Kaisha Transmission of medical image data
JP5763306B2 (ja) * 2010-04-27 2015-08-12 レノボ・イノベーションズ・リミテッド(香港) 動画像通信システム
JP5559360B2 (ja) * 2010-12-13 2014-07-23 インテル コーポレイション データのハイライト及び抽出
US9883203B2 (en) * 2011-11-18 2018-01-30 Qualcomm Incorporated Adaptive overlapped block motion compensation
US9262670B2 (en) * 2012-02-10 2016-02-16 Google Inc. Adaptive region of interest
GB2505912B (en) 2012-09-14 2015-10-07 Canon Kk Method and device for generating a description file, and corresponding streaming method
EP2898695A1 (en) * 2012-09-18 2015-07-29 VID SCALE, Inc. Region of interest video coding using tiles and tile groups
CN109862373B (zh) 2013-07-15 2021-10-15 索尼公司 用于对比特流进行编码的方法和装置
CN106233745B (zh) 2013-07-29 2021-01-15 皇家Kpn公司 向客户端提供瓦片视频流
US10397666B2 (en) * 2014-06-27 2019-08-27 Koninklijke Kpn N.V. Determining a region of interest on the basis of a HEVC-tiled video stream
US10225546B2 (en) 2016-02-26 2019-03-05 Qualcomm Incorporated Independent multi-resolution coding

Similar Documents

Publication Publication Date Title
JP2019521583A5 (ja)
US11805304B2 (en) Method, device, and computer program for generating timed media data
JP2016540410A5 (ja) ファイルの生成方法、ファイルの生成装置、及び、プログラム。
TWI735038B (zh) 將軌道推導用於基於網路的媒體處理的方法和裝置
BR112019019836A2 (pt) sinalização de informações importantes de vídeo em streaming de vídeo em rede usando parâmetros tipo mime
JP2016502804A5 (ja)
RU2014153777A (ru) Способ обеспечения выбора эпизода видеоматериала и устройство для этого
US20190230388A1 (en) Method and apparatus for processing video data
RU2016100862A (ru) Устройство и способ обработки информации
KR102133207B1 (ko) 통신장치, 통신 제어방법 및 통신 시스템
JP2012114909A (ja) メディアデータを符号化および復号する方法およびシステム
JP6541309B2 (ja) 送信装置、送信方法、及びプログラム
JP7439762B2 (ja) 情報処理装置および情報処理方法、並びにプログラム
JP7480773B2 (ja) 情報処理装置、情報処理方法、再生処理装置及び再生処理方法
WO2016002496A1 (ja) 情報処理装置および方法
JP2014032669A5 (ja)
TW201909007A (zh) 使用用於檔案格式邏輯框之一通用描述符處理媒體資料
JP2022019932A (ja) 情報処理装置および情報処理方法
RU2016151372A (ru) Способ и устройство кодирования изображений с эффектом глубины при кодировании видео
JP7287454B2 (ja) 情報処理装置、再生処理装置、情報処理方法及び再生処理方法
RU2020104035A (ru) Способ и устройство обработки мультимедийной информации
CN114009054A (zh) 信息处理装置、信息处理方法、再现处理装置和再现处理方法
RU2015134191A (ru) Устройство составления разметки и способ поддержки многоэкранной услуги
US11677978B2 (en) Omnidirectional video processing method and device, related apparatuses and storage medium
JP2017525244A5 (ja)