JP2020512772A5 - Vrビデオ用に画像解像度を最適化してビデオストリーミングの帯域幅を最適化する画像処理のための方法及びストリーミングサーバ - Google Patents

Vrビデオ用に画像解像度を最適化してビデオストリーミングの帯域幅を最適化する画像処理のための方法及びストリーミングサーバ Download PDF

Info

Publication number
JP2020512772A5
JP2020512772A5 JP2019553044A JP2019553044A JP2020512772A5 JP 2020512772 A5 JP2020512772 A5 JP 2020512772A5 JP 2019553044 A JP2019553044 A JP 2019553044A JP 2019553044 A JP2019553044 A JP 2019553044A JP 2020512772 A5 JP2020512772 A5 JP 2020512772A5
Authority
JP
Japan
Prior art keywords
image
video input
video
viewport
processed
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2019553044A
Other languages
English (en)
Other versions
JP7205485B2 (ja
JP2020512772A (ja
Filing date
Publication date
Priority claimed from US15/935,381 external-priority patent/US10979663B2/en
Application filed filed Critical
Publication of JP2020512772A publication Critical patent/JP2020512772A/ja
Publication of JP2020512772A5 publication Critical patent/JP2020512772A5/ja
Application granted granted Critical
Publication of JP7205485B2 publication Critical patent/JP7205485B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Description

[0139]本明細書では、本発明の好ましい実施形態が示され、説明されたが、そのような実施形態が単に例として提供されているということは、当業者にとって明らかであろう。当業者は、本発明から逸脱することなく、多くの変形、変更、及び代替に思い当たるであろう。本明細書に記載された本発明の実施形態のさまざまな代替手段が、本発明の実践において採用されてよいということが、理解されるべきである。以下の特許請求の範囲が本発明の範囲を定義し、以て、以下の特許請求の範囲内の方法及び構造並びにそれらと同等のものが対象にされるということが意図される。
[発明の項目]
[項目1]
方法であって、
少なくとも8Kの解像度を有するビデオ入力を受信するステップと、
前記受信されたビデオ入力を処理し、少なくともより多くのピクセルを第1の領域に、より少ないピクセルを第2の領域に割り当てる2つ以上のビューポートセグメントにするステップであって、前記受信されたビデオ入力を2つ以上のビューポートセグメントに処理することが並行して実行される、ステップと、
第1の信号伝達情報を生成するステップであって、前記第1の信号伝達情報が外部のメタデータである、ステップと、
第2の信号伝達情報を生成するステップであって、前記第2の信号伝達情報が埋め込まれたメタデータである、ステップと、
を含む、方法。
[項目2]
前記処理されたビデオを再生するステップをさらに含む、項目1に記載の方法。
[項目3]
前記第1の信号伝達情報及び前記第2の信号伝達情報を1つ又は複数のビデオフレームに埋め込むステップをさらに含む、項目1に記載の方法。
[項目4]
前記受信されたビデオ入力をリアルタイムに処理するステップをさらに含む、項目1に記載の方法。
[項目5]
適応ビットレート表現を生成するステップをさらに含む、項目1に記載の方法。
[項目6]
適応ビットレート表現を生成する前記ステップが、立体ビデオの送信を最適化するためのフレーム処理プロセスをさらに含む、項目5に記載の方法。
[項目7]
適切なビューポートをフェッチするために凝視位置モニタと通信するステップと、再生のために、クライアント側で、埋め込まれたフレームメタデータをパースするステップと、をさらに含む、項目1に記載の方法。
[項目8]
ユーザの予測された頭部の位置を計算し、前記予測された頭部の位置に応答して再生要求を調整するステップをさらに含む、項目7に記載の方法。
[項目9]
モデルの状態をフェッチするステップと、前記モデルの状態をトレーニングするステップと、前記モデルの状態を保存するステップと、をさらに含む、項目1に記載の方法。
[項目10]
ストリーミングサーバであって、
メモリと、
コントローラであって、前記コントローラが、
少なくとも8Kの解像度を有するビデオ入力を受信することと、
前記ビデオ入力を処理し、より多くのピクセルを第1の領域に割り当て、その結果、より少ないピクセルが第2の領域に割り当てられる2つ以上のビューポートセグメントにし、前記2つ以上のビューポートセグメントが、並行して作成されることと、
外部のメタデータと、前記ビデオフレームに埋め込まれたメタデータとの両方として信号伝達情報を生成することと、
前記処理されたビデオ入力を、デバイスがストリーミングするための標準的なストリーム発生源フォルダーに配信することと、
を実行するように構成されている、コントローラと、
を備える、ストリーミングサーバ。
[項目11]
前記コントローラが、第1のプロセスとして前記入力ビデオをセグメント化することと、セグメント化されたソースから前記処理タスクを設定することと、を実行するようにさらに構成されている、項目10に記載のストリーミングサーバ。
[項目12]
前記コントローラが、保留中の処理タスクを検出して、それらの処理タスクのみを処理するようにさらに構成されており、そのような複数のサーバが並行して効率的に動作できるようにする、項目10に記載のストリーミングサーバ。
[項目13]
前記コントローラが、立体ビデオの送信をさらに最適化するために、追加の任意選択的フレーム処理を伴って適応ビットレート表現を生成するように、さらに構成されている、項目10に記載のストリーミングサーバ。
[項目14]
方法であって、
2つ以上のビデオフレームを含む少なくとも8Kの解像度を有するビデオ入力をシステムに受信するステップと、
前記受信されたビデオ入力を処理し、少なくともより多くのピクセルを第1の領域に、より少ないピクセルを第2の領域に割り当てる2つ以上のビューポートセグメントにするステップであって、前記受信されたビデオ入力を2つ以上のビューポートセグメントに処理することが並行して実行される、ステップと、
第1の信号伝達情報を外部のメタデータとして生成し、第2の信号伝達情報を前記2つ以上のビデオフレームに埋め込まれたメタデータとして生成するステップと、
処理されたビデオ入力を前記システムからクライアントデバイスに配信するステップと、
を含む、方法。
[項目15]
埋め込まれたメタデータを前記ビデオフレームに追加するステップと、ビューポートの追加の信号伝達情報を生成するステップと、をさらに含む、項目14に記載の方法。
[項目16]
立体ビデオの送信をさらに最適化するために、追加の任意選択的フレーム処理を伴って適応ビットレート表現を生成するステップをさらに含む、項目14に記載の方法。
[項目17]
方法であって、
少なくとも8Kの解像度を有するビデオ入力を受信するステップと、
前記受信されたビデオ入力を処理するステップと、
第1の信号伝達情報を生成するステップであって、前記第1の信号伝達情報が外部のメタデータである、ステップと、
第2の信号伝達情報を生成するステップであって、前記第2の信号伝達情報が埋め込まれたメタデータである、ステップと、
前記第1の信号伝達情報及び前記第2の信号伝達情報を1つ又は複数のビデオフレームに埋め込むステップと、
を含む、方法。
[項目18]
前記処理されたビデオを再生するステップをさらに含む、項目17に記載の方法。
[項目19]
前記受信されたビデオ入力を処理し、少なくともより多くのピクセルを第1の領域に、より少ないピクセルを第2の領域に割り当てる2つ以上のビューポートセグメントにするステップであって、前記受信されたビデオ入力を2つ以上のビューポートセグメントに処理することが並行して実行される、ステップをさらに含む、項目17に記載の方法。
[項目20]
前記受信されたビデオ入力をリアルタイムに処理するステップをさらに含む、項目17に記載の方法。
[項目21]
適応ビットレート表現を生成するステップをさらに含む、項目17に記載の方法。
[項目22]
適応ビットレート表現を生成する前記ステップが、立体ビデオの送信を最適化するためのフレーム処理プロセスをさらに含む、項目21に記載の方法。
[項目23]
適切なビューポートをフェッチするために凝視位置モニタと通信するステップと、再生のために、クライアント側で、埋め込まれたフレームメタデータをパースするステップと、をさらに含む、項目17に記載の方法。
[項目24]
ユーザの予測された頭部の位置を計算し、前記予測された頭部の位置に応答して再生要求を調整するステップをさらに含む、項目23に記載の方法。
[項目25]
モデルの状態をフェッチするステップと、前記モデルの状態をトレーニングするステップと、前記モデルの状態を保存するステップと、をさらに含む、項目17に記載の方法。
[項目26]
ストリーミングサーバであって、
メモリと、
コントローラであって、前記コントローラが、
少なくとも8Kの解像度を有するビデオ入力を受信することと、
前記ビデオ入力を処理することと、
セグメント化されたソースから第1のプロセスとして、前記入力ビデオをセグメント化することと、
外部のメタデータと、前記ビデオフレームに埋め込まれたメタデータとの両方として信号伝達情報を生成することと、
前記処理されたビデオ入力を、デバイスがストリーミングするための標準的なストリーム発生源フォルダーに配信することと、
を実行するように構成されている、コントローラと、
を備える、ストリーミングサーバ。
[項目27]
前記コントローラが、前記ビデオ入力を処理し、より多くのピクセルを第1の領域に割り当て、その結果、より少ないピクセルが第2の領域に割り当てられる2つ以上のビューポートセグメントにし、前記2つ以上のビューポートセグメントが、並行して作成されることを実行するようにさらに構成されている、項目26に記載のストリーミングサーバ。
[項目28]
前記コントローラが、保留中の処理タスクを検出して、それらの処理タスクのみを処理するようにさらに構成されており、そのような複数のサーバが並行して効率的に動作できるようにする、項目26に記載のストリーミングサーバ。
[項目29]
前記コントローラが、立体ビデオの送信をさらに最適化するために、追加の任意選択的フレーム処理を伴って適応ビットレート表現を生成するように、さらに構成されている、項目26に記載のストリーミングサーバ。
[項目30]
方法であって、
2つ以上のビデオフレームを含む少なくとも8Kの解像度を有するビデオ入力をシステムに受信するステップと、
前記受信されたビデオ入力を処理するステップと、
第1の信号伝達情報を生成するステップであって、前記第1の信号伝達情報が外部のメタデータである、ステップと、
第2の信号伝達情報を生成するステップであって、前記第2の信号伝達情報が埋め込まれたメタデータである、ステップと、
前記第1の信号伝達情報及び前記第2の信号伝達情報を1つ又は複数のビデオフレームに埋め込むステップと、
処理されたビデオ入力を前記システムからクライアントデバイスに配信するステップと、
を含む、方法。
[項目31]
埋め込まれたメタデータを前記ビデオフレームに追加するステップと、ビューポートの追加の信号伝達情報を生成するステップと、をさらに含む、項目30に記載の方法。
[項目32]
立体ビデオの送信をさらに最適化するために、追加の任意選択的フレーム処理を伴って適応ビットレート表現を生成するステップをさらに含む、項目31に記載の方法。
[項目33]
方法であって、
少なくとも8Kの解像度を有するビデオ入力を受信するステップと、
前記受信されたビデオ入力を2つ以上のビューポートセグメントに処理するステップと、
第1の信号伝達情報を生成するステップであって、前記第1の信号伝達情報が外部のメタデータである、ステップと、
第2の信号伝達情報を生成するステップであって、前記第2の信号伝達情報が埋め込まれたメタデータである、ステップと、
適切なビューポートをフェッチするために凝視位置モニタと通信するステップと、
を含む、方法。
[項目34]
前記処理されたビデオを再生するステップをさらに含む、項目33に記載の方法。
[項目35]
前記第1の信号伝達情報及び前記第2の信号伝達情報を1つ又は複数のビデオフレームに埋め込むステップをさらに含む、項目33に記載の方法。
[項目36]
前記受信されたビデオ入力をリアルタイムに処理するステップをさらに含む、項目33に記載の方法。
[項目37]
適応ビットレート表現を生成するステップをさらに含む、項目33に記載の方法。
[項目38]
適応ビットレート表現を生成する前記ステップが、立体ビデオの送信を最適化するためのフレーム処理プロセスをさらに含む、項目37に記載の方法。
[項目39]
再生のために、クライアント側で、埋め込まれたフレームメタデータをパースするステップをさらに含む、項目33に記載の方法。
[項目40]
ユーザの予測された頭部の位置を計算し、前記予測された頭部の位置に応答して再生要求を調整するステップをさらに含む、項目39に記載の方法。
[項目41]
モデルの状態をフェッチするステップと、前記モデルの状態をトレーニングするステップと、前記モデルの状態を保存するステップと、をさらに含む、項目33に記載の方法。
[項目42]
ストリーミングサーバであって、
メモリと、
コントローラであって、前記コントローラが、
少なくとも8Kの解像度を有するビデオ入力を受信することと、
前記ビデオ入力を処理することと、
外部のメタデータと、前記ビデオフレームに埋め込まれたメタデータとの両方として信号伝達情報を生成することと、
前記処理されたビデオ入力を、デバイスがストリーミングするための標準的なストリーム発生源フォルダーに配信することと、
適切なビューポートをフェッチするために凝視位置モニタと通信することと、
を実行するように構成されている、コントローラと、
を備える、ストリーミングサーバ。
[項目43]
前記コントローラが、第1のプロセスとして前記入力ビデオをセグメント化することと、セグメント化されたソースから前記処理タスクを設定することと、を実行するようにさらに構成されている、項目42に記載のストリーミングサーバ。
[項目44]
前記コントローラが、保留中の処理タスクを検出して、それらの処理タスクのみを処理するようにさらに構成されており、そのような複数のサーバが並行して効率的に動作できるようにする、項目42に記載のストリーミングサーバ。
[項目45]
前記コントローラが、立体ビデオの送信をさらに最適化するために、追加の任意選択的フレーム処理を伴って適応ビットレート表現を生成するように、さらに構成されている、項目42に記載のストリーミングサーバ。
[項目46]
方法であって、
2つ以上のビデオフレームを含む少なくとも8Kの解像度を有するビデオ入力をシステムに受信するステップと、
前記受信されたビデオを処理するステップと、
第1の信号伝達情報を外部のメタデータとして生成し、第2の信号伝達情報を前記2つ以上のビデオフレームに埋め込まれたメタデータとして生成するステップと、
適切なビューポートをフェッチするために凝視位置モニタと通信するステップと、
を含む、方法。
[項目47]
埋め込まれたメタデータを前記ビデオフレームに追加するステップと、ビューポートの追加の信号伝達情報を生成するステップと、をさらに含む、項目46に記載の方法。
[項目48]
立体ビデオの送信をさらに最適化するために、追加の任意選択的フレーム処理を伴って適応ビットレート表現を生成するステップをさらに含む、項目47に記載の方法。
[項目49]
方法であって、
少なくとも8Kの解像度を有するビデオ入力を受信するステップと、
2つ以上のビデオフレームを含む前記受信されたビデオ入力を処理するステップであって、各ビデオフレームが前半及び後半を含む、ステップと、
第1のビデオフレームの前記前半においてビットレートを増やし、前記第1のビデオフレームの前記後半においてビットレートを減らすステップと、
ビデオ入力全体のエンコードされたビットレートを減らすステップと、
を含む、方法。
[項目50]
前記処理されたビデオを再生するステップをさらに含む、項目49に記載の方法。
[項目51]
第1の信号伝達情報及び第2の信号伝達情報を1つ又は複数のビデオフレームに埋め込むステップをさらに含む、項目49に記載の方法。
[項目52]
前記受信されたビデオ入力をリアルタイムに処理するステップをさらに含む、項目49に記載の方法。
[項目53]
適応ビットレート表現を生成するステップをさらに含む、項目49に記載の方法。
[項目54]
適応ビットレート表現を生成する前記ステップが、立体ビデオの送信を最適化するためのフレーム処理プロセスをさらに含む、項目53に記載の方法。
[項目55]
適切なビューポートをフェッチするために凝視位置モニタと通信するステップと、再生のために、クライアント側で、埋め込まれたフレームメタデータをパースするステップと、をさらに含む、項目49に記載の方法。
[項目56]
ユーザの予測された頭部の位置を計算し、前記予測された頭部の位置に応答して再生要求を調整するステップをさらに含む、項目55に記載の方法。
[項目57]
モデルの状態をフェッチするステップと、前記モデルの状態をトレーニングするステップと、前記モデルの状態を保存するステップと、をさらに含む、項目49に記載の方法。
[項目58]
ストリーミングサーバであって、
メモリと、
コントローラであって、前記コントローラが、
少なくとも8Kの解像度を有するビデオ入力を受信することと、
第1のビデオフレームの前記前半においてビットレートを増やし、前記第1のビデオフレームの前記後半においてビットレートを減らすことと、
ビデオ入力全体のエンコードされたビットレートを減らすことと、
を実行するように構成されている、コントローラと、
を備える、ストリーミングサーバ。
[項目59]
前記コントローラが、第1のプロセスとして前記入力ビデオをセグメント化することと、セグメント化されたソースから前記処理タスクを設定することと、を実行するようにさらに構成されている、項目58に記載のストリーミングサーバ。
[項目60]
前記コントローラが、保留中の処理タスクを検出して、それらの処理タスクのみを処理するようにさらに構成されており、そのような複数のサーバが並行して効率的に動作できるようにする、項目58に記載のストリーミングサーバ。
[項目61]
前記コントローラが、立体ビデオの送信をさらに最適化するために、追加の任意選択的フレーム処理を伴って適応ビットレート表現を生成するように、さらに構成されている、項目58に記載のストリーミングサーバ。
[項目62]
方法であって、
2つ以上のビデオフレームを含む少なくとも8Kの解像度を有するビデオ入力をシステムに受信するステップと、
前記受信されたビデオ入力を処理し、少なくともより多くのピクセルを第1の領域に、より少ないピクセルを第2の領域に割り当てる2つ以上のビューポートセグメントにするステップであって、前記受信されたビデオ入力を2つ以上のビューポートセグメントに処理することが並行して実行される、ステップと、
第1の信号伝達情報を外部のメタデータとして生成し、第2の信号伝達情報を前記2つ以上のビデオフレームに埋め込まれたメタデータとして生成するステップと、
処理されたビデオ入力を前記システムからクライアントデバイスに配信するステップと、
を含む、方法。
[項目63]
埋め込まれたメタデータを前記ビデオフレームに追加するステップと、ビューポートの追加の信号伝達情報を生成するステップと、をさらに含む、項目62に記載の方法。
[項目64]
立体ビデオの送信をさらに最適化するために、追加の任意選択的フレーム処理を伴って適応ビットレート表現を生成するステップをさらに含む、項目63に記載の方法。

Claims (23)

  1. コンピューティングデバイスによって実行される方法であって、
    少なくとも8Kの解像度とソース画像を有する仮想現実ビデオ入力を受信するステップと、
    入力された前記画像の幾何学的変換を有するビューポートに前記受信された仮想現実ビデオ入力を処理するステップであって、
    前記幾何学的変換は、第1の適応ビットレートターゲットについて前記仮想現実ビデオ入力のパノラマ画像全体の第1の頭部位置からの第1のターゲット投影にて再マッピングされた画像を生成し、
    前記再マッピングされた前記画像の一部分にはより大きな解像度が割り当てられ、再マッピングされた前記画像の残りにはより小さな解像度が割り当てられ、
    再マッピングされた前記画像は、
    立体ビデオの送信を最適化するために処理される、ステップと、
    第2の適応ビットレートターゲットにて第2の頭部位置からの第2のビューポートに前記仮想現実ビデオ入力を処理することを繰り返すステップと、
    全ての処理されたビューポートについての第1の信号伝達情報を生成するステップであって、前記第1の信号伝達情報が外部のメタデータである、ステップと、
    前記ビューポートから第2の信号伝達情報を生成するステップであって、前記第2の信号伝達情報が埋め込まれたメタデータである、ステップと、
    を含む、方法。
  2. 前記処理された仮想現実ビデオを再生するステップをさらに含む、請求項1に記載の方法。
  3. 前記第1の信号伝達情報及び前記第2の信号伝達情報を1つ又は複数のビデオフレームにおけるフレーム間隔に埋め込むステップをさらに含む、請求項1に記載の方法。
  4. 前記受信された仮想現実ビデオ入力をリアルタイムに処理するステップをさらに含む、請求項1に記載の方法。
  5. 適切なビューポートをフェッチするために凝視位置モニタと通信するステップと、再生のために、クライアント側で、埋め込まれたフレームメタデータをパースするステップと、をさらに含む、請求項1に記載の方法。
  6. ユーザの予測された頭部の位置を計算し、前記予測された頭部の位置に応答して再生要求を調整するステップをさらに含む、請求項に記載の方法。
  7. 機械学習エンジンにデータを送信するステップと、頭部位置の予測位置を特定するために機械学習モデルの状態をフェッチするステップと、複数のソースからの集約されたデータを用いて前記機械学習モデルの状態をトレーニングするステップと、クライアントデバイスによる後のアクセスのために前記モデルの状態を保存するステップと、をさらに含む、請求項1に記載の方法。
  8. ストリーミングサーバであって、
    メモリと、
    コントローラであって、前記コントローラが、
    2つ以上のビデオフレームを含む少なくとも8Kの解像度とソース画像を有する仮想現実ビデオ入力を受信することと、
    入力された前記画像の幾何学的変換を有するビューポートに前記仮想現実ビデオ入力を処理ることであって、
    前記幾何学的変換は、第1の適応ビットレートターゲットについて前記仮想現実ビデオ入力のパノラマ画像全体の第1の頭部位置からの第1のターゲット投影にて再マッピングされた画像を生成し、
    前記再マッピングされた前記画像の一部分にはより大きな解像度が割り当てられ、再マッピングされた前記画像の残りにはより小さな解像度が割り当てられ、
    再マッピングされた前記画像は、
    立体ビデオの送信を最適化するために処理される、処理することと、
    第2の適応ビットレートターゲットにて第2の頭部位置からの第2のビューポートに前記仮想現実ビデオ入力を再処理することと、
    外部のメタデータと、前記ビデオフレームに埋め込まれたメタデータとの両方として、全ての処理されたビューポートについての信号伝達情報を生成することと、
    前記処理された仮想現実ビデオ入力を、デバイスがストリーミングするための標準的なストリーム発生源フォルダーに配信することと、
    を実行するように構成されている、コントローラと、
    を備える、ストリーミングサーバ。
  9. 前記コントローラが、第1のプロセスとして前記仮想現実ビデオ入力をセグメント化することと、セグメント化されたソースから処理タスクを設定することと、を実行するようにさらに構成されている、請求項に記載のストリーミングサーバ。
  10. 前記コントローラが、保留中の処理タスクを検出するようにさらに構成されており、各プロセスが単一のファイルに割り当てられ、並列プロセスが、まだ処理されていない異なる名前を有する複数のファイルについて生じる、請求項に記載のストリーミングサーバ。
  11. コンピューティングデバイスによって実行される方法であって、
    2つ以上のビデオフレームを含む少なくとも8Kの解像度とソース画像を有する仮想現実ビデオ入力をシステムに受信するステップと、
    入力された前記画像の幾何学的変換を有するビューポートに前記受信された仮想現実ビデオ入力を処理するステップであって、前記幾何学的変換は、第1の適応ビットレートターゲットについて前記仮想現実ビデオ入力のパノラマ画像全体の第1の頭部位置からの第1のターゲット投影にて再マッピングされた画像を生成し、
    前記再マッピングされた前記画像の一部分にはより大きな解像度が割り当てられ、再マッピングされた前記画像の残りにはより小さな解像度が割り当てられ、
    再マッピングされた前記画像は、
    立体ビデオの送信を最適化するために処理される、ステップと、
    第2の適応ビットレートターゲットにて前記仮想現実ビデオ入力の各フレームについてのビューポートに前記仮想現実ビデオ入力を処理することを繰り返すステップと、
    全ての処理されたビューポートについての第1の信号伝達情報を外部のメタデータとして生成し、第2の信号伝達情報を前記2つ以上のビデオフレームに埋め込まれたメタデータとして生成するステップと、
    処理されたビデオ力を前記システムからクライアントデバイスに配信するステップであって、処理された前記ビデオ出力の各フレームが低密度ピクセル領域および高密度ピクセル領域を有する、ステップと、
    を含む、方法。
  12. 埋め込まれたメタデータを前記ビデオフレームに追加するステップと、ビューポートの追加の信号伝達情報を生成するステップと、をさらに含む、請求項11に記載の方法。
  13. コンピューティングデバイスによって実行される方法であって、
    少なくとも8Kの解像度とソース画像を有するビデオ入力を受信するステップと、
    入力された前記画像の幾何学的変換を有するビューポートに前記受信されたビデオ入力を処理するステップであって、
    前記幾何学的変換は、第1の適応ビットレートターゲットについて前記ビデオ入力のパノラマ画像全体の第1の頭部位置からの第1のターゲット投影にて再マッピングされた画像を生成し、
    前記再マッピングされた前記画像の一部分にはより大きな解像度が割り当てられ、再マッピングされた前記画像の残りにはより小さな解像度が割り当てられる、ステップと、
    第2の適応ビットレートターゲットにて第2の頭部位置からの第2のビューポートに前記ビデオ入力を処理することを繰り返すステップと、
    全ての処理されたビューポートについての第1の信号伝達情報を生成するステップであって、前記第1の信号伝達情報が外部のメタデータである、ステップと、
    前記ビューポートから第2の信号伝達情報を生成するステップであって、前記第2の信号伝達情報が埋め込まれたメタデータである、ステップと、
    機械学習エンジンにデータを送信するステップと、頭部位置の予測位置を特定するために機械学習モデルの状態をフェッチするステップと、複数のソースからの集約されたデータを用いて前記機械学習モデルの状態をトレーニングするステップと、クライアントデバイスによる後のアクセスのために前記モデルの状態を保存するステップと、
    を含む、方法。
  14. 前記処理された仮想現実ビデオを再生するステップをさらに含む、請求項13に記載の方法。
  15. 前記第1の信号伝達情報及び前記第2の信号伝達情報を1つ又は複数のビデオフレームにおけるフレーム間隔に埋め込むステップをさらに含む、請求項13に記載の方法。
  16. 前記受信された仮想現実ビデオ入力をリアルタイムに処理するステップをさらに含む、請求項13に記載の方法。
  17. 適切なビューポートをフェッチするために凝視位置モニタと通信するステップと、再生のために、クライアント側で、埋め込まれたフレームメタデータをパースするステップと、をさらに含む、請求項13に記載の方法。
  18. ユーザの予測された頭部の位置を計算し、前記予測された頭部の位置に応答して再生要求を調整するステップをさらに含む、請求項17に記載の方法。
  19. 前記適応ビットレート表現は、立体ビデオの送信を最適化するためのフレーム処理プロセスを有する、請求項13に記載の方法。
  20. ストリーミングサーバであって、
    メモリと、
    コントローラであって、前記コントローラが、
    2つ以上のビデオフレームを含む少なくとも8Kの解像度とソース画像を有するビデオ入力を受信することと、
    入力された前記画像の幾何学的変換を有するビューポートに前記ビデオ入力を処理することであって、
    前記幾何学的変換は、第1の適応ビットレートターゲットについて前記ビデオ入力のパノラマ画像全体の第1の頭部位置からの第1のターゲット投影にて再マッピングされた画像を生成し、
    前記再マッピングされた前記画像の一部分にはより大きな解像度が割り当てられ、再マッピングされた前記画像の残りにはより小さな解像度が割り当てられる、
    処理することと、
    第2の適応ビットレートターゲットにて第2の頭部位置からの第2のビューポートに前記ビデオ入力を再処理することと、
    外部のメタデータと、前記ビデオフレームに埋め込まれたメタデータとの両方として全ての処理されたビューポートについての信号伝達情報を生成することと、
    前記処理されたビデオ入力を、デバイスがストリーミングするための標準的なストリーム発生源フォルダーに配信することと、
    機械学習エンジンにデータを送信し、頭部位置の予測位置を特定するために機械学習モデルの状態をフェッチし、複数のソースからの集約されたデータを用いて前記機械学習モデルの状態をトレーニングし、クライアントデバイスによる後のアクセスのために前記モデルの状態を保存することと、
    を実行するように構成されている、コントローラと、
    を備える、ストリーミングサーバ。
  21. 前記コントローラが、第1のプロセスとして前記ビデオ入力をセグメント化することと、セグメント化されたソースから処理タスクを設定することと、を実行するようにさらに構成されている、請求項20に記載のストリーミングサーバ。
  22. 前記コントローラが、保留中の処理タスクを検出するようにさらに構成されており、各プロセスが単一のファイルに割り当てられ、並列プロセスが、まだ処理されていない異なる名前を有する複数のファイルについて生じる、請求項20に記載のストリーミングサーバ。
  23. 前記コントローラが、立体ビデオの送信をさらに最適化するためフレーム処理プロセス有する適応ビットレート表現を生成するように、さらに構成されている、請求項22に記載のストリーミングサーバ。
JP2019553044A 2017-03-30 2018-03-27 Vrビデオ用に画像解像度を最適化してビデオストリーミングの帯域幅を最適化する画像処理のための方法及びストリーミングサーバ Active JP7205485B2 (ja)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201762478780P 2017-03-30 2017-03-30
US62/478,780 2017-03-30
US15/935,381 US10979663B2 (en) 2017-03-30 2018-03-26 Methods and apparatuses for image processing to optimize image resolution and for optimizing video streaming bandwidth for VR videos
US15/935,381 2018-03-26
PCT/US2018/024465 WO2018183257A1 (en) 2017-03-30 2018-03-27 Methods and apparatuses for image processing to optimize image resolution and for optimizing video streaming bandwidth for vr videos

Publications (3)

Publication Number Publication Date
JP2020512772A JP2020512772A (ja) 2020-04-23
JP2020512772A5 true JP2020512772A5 (ja) 2021-04-30
JP7205485B2 JP7205485B2 (ja) 2023-01-17

Family

ID=63671183

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019553044A Active JP7205485B2 (ja) 2017-03-30 2018-03-27 Vrビデオ用に画像解像度を最適化してビデオストリーミングの帯域幅を最適化する画像処理のための方法及びストリーミングサーバ

Country Status (5)

Country Link
US (1) US10979663B2 (ja)
EP (1) EP3586518A4 (ja)
JP (1) JP7205485B2 (ja)
AU (1) AU2018246131A1 (ja)
WO (1) WO2018183257A1 (ja)

Families Citing this family (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11057643B2 (en) 2017-03-13 2021-07-06 Mediatek Inc. Method and apparatus for generating and encoding projection-based frame that includes at least one padding region and at least one projection face packed in 360-degree virtual reality projection layout
US11004173B2 (en) * 2017-03-13 2021-05-11 Mediatek Inc. Method for processing projection-based frame that includes at least one projection face packed in 360-degree virtual reality projection layout
US10979663B2 (en) 2017-03-30 2021-04-13 Yerba Buena Vr, Inc. Methods and apparatuses for image processing to optimize image resolution and for optimizing video streaming bandwidth for VR videos
US11494870B2 (en) 2017-08-18 2022-11-08 Mediatek Inc. Method and apparatus for reducing artifacts in projection-based frame
CN107613338A (zh) * 2017-09-25 2018-01-19 中兴通讯股份有限公司 视频传输方法、服务器、vr播放终端及计算机可读存储介质
US10834413B2 (en) * 2018-08-24 2020-11-10 Disney Enterprises, Inc. Fast and accurate block matching for computer generated content
CN111818336B (zh) * 2019-04-12 2022-08-26 华为技术有限公司 视频处理方法、装置、存储介质以及通信装置
US10997693B2 (en) * 2019-07-03 2021-05-04 Gopro, Inc. Apparatus and methods for non-uniform processing of image data
US11284141B2 (en) * 2019-12-18 2022-03-22 Yerba Buena Vr, Inc. Methods and apparatuses for producing and consuming synchronized, immersive interactive video-centric experiences
CN115023955A (zh) * 2020-01-29 2022-09-06 诺基亚技术有限公司 用于视频流传输的方法、装置和计算机程序产品
KR20210103867A (ko) 2020-02-14 2021-08-24 삼성전자주식회사 Vr 영상을 스트리밍하는 방법 및 장치
US11245911B1 (en) * 2020-05-12 2022-02-08 Whirlwind 3D, LLC Video encoder/decoder (codec) for real-time applications and size/b and width reduction
US11800184B2 (en) 2021-01-06 2023-10-24 Tencent America LLC Method and apparatus for media scene description
CN112929691B (zh) * 2021-01-29 2022-06-14 复旦大学 多用户全景视频传输方法
CN113038222B (zh) * 2021-03-08 2023-11-10 Oppo广东移动通信有限公司 视频处理方法、装置、电子设备及存储介质
CN113515193B (zh) * 2021-05-17 2023-10-27 聚好看科技股份有限公司 一种模型数据传输方法及装置
US11509836B1 (en) 2021-12-29 2022-11-22 Insight Direct Usa, Inc. Dynamically configured processing of a region of interest dependent upon published video data selected by a runtime configuration file
US11704891B1 (en) 2021-12-29 2023-07-18 Insight Direct Usa, Inc. Dynamically configured extraction, preprocessing, and publishing of a region of interest that is a subset of streaming video data
US11778167B1 (en) 2022-07-26 2023-10-03 Insight Direct Usa, Inc. Method and system for preprocessing optimization of streaming video data
CN117156175B (zh) * 2023-10-30 2024-01-30 山东大学 基于视口预测距离控制的全景视频流QoE优化方法
CN117876430A (zh) * 2024-03-13 2024-04-12 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院) 一种全景图像及视频中的扫视路径预测方法、设备及介质

Family Cites Families (60)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5588022B2 (ja) * 2010-02-22 2014-09-10 ドルビー ラボラトリーズ ライセンシング コーポレイション 表示サブシステムにビデオデータを提供する方法、およびシステム
US20130294513A1 (en) * 2012-05-07 2013-11-07 Qualcomm Incorporated Inter layer merge list construction for video coding
CN106233745B (zh) 2013-07-29 2021-01-15 皇家Kpn公司 向客户端提供瓦片视频流
US10346465B2 (en) * 2013-12-20 2019-07-09 Qualcomm Incorporated Systems, methods, and apparatus for digital composition and/or retrieval
EP2894852A1 (en) 2014-01-14 2015-07-15 Alcatel Lucent Process for increasing the quality of experience for users that watch on their terminals a high definition video stream
US9392212B1 (en) * 2014-04-17 2016-07-12 Visionary Vr, Inc. System and method for presenting virtual reality content to a user
US9986154B2 (en) * 2014-05-21 2018-05-29 Here Global B.V. Developing a panoramic image
KR102611448B1 (ko) * 2014-05-29 2023-12-07 네버마인드 캐피탈 엘엘씨 콘텐트를 전달 및/또는 콘텐트를 재생하기 위한 방법들 및 장치
US20150346812A1 (en) * 2014-05-29 2015-12-03 Nextvr Inc. Methods and apparatus for receiving content and/or playing back content
US10204658B2 (en) 2014-07-14 2019-02-12 Sony Interactive Entertainment Inc. System and method for use in playing back panorama video content
US10397543B2 (en) * 2014-09-03 2019-08-27 Nextvr Inc. Methods and apparatus for capturing, streaming and/or playing back content
WO2016050283A1 (en) * 2014-09-30 2016-04-07 Telefonaktiebolaget L M Ericsson (Publ) Reduced bit rate immersive video
US10104361B2 (en) * 2014-11-14 2018-10-16 Samsung Electronics Co., Ltd. Coding of 360 degree videos using region adaptive smoothing
US20160150212A1 (en) * 2014-11-26 2016-05-26 Sony Corporation Live selective adaptive bandwidth
WO2016118897A1 (en) 2015-01-22 2016-07-28 Kubicam Inc. Video transmission based on independently encoded background updates
CA2977051C (en) * 2015-02-17 2023-02-07 Nextvr Inc. Methods and apparatus for generating and using reduced resolution images and/or communicating such images to a playback or content distribution device
GB2536025B (en) 2015-03-05 2021-03-03 Nokia Technologies Oy Video streaming method
JP6685995B2 (ja) * 2015-03-05 2020-04-22 ソニー株式会社 画像処理装置および画像処理方法
US10075693B2 (en) * 2015-04-29 2018-09-11 Han Jin Embedding calibration metadata into stereoscopic video files
US20160353146A1 (en) * 2015-05-27 2016-12-01 Google Inc. Method and apparatus to reduce spherical video bandwidth to user headset
KR102013403B1 (ko) 2015-05-27 2019-08-22 구글 엘엘씨 구면 영상 스트리밍
US10586469B2 (en) 2015-06-08 2020-03-10 STRIVR Labs, Inc. Training using virtual reality
US11245939B2 (en) 2015-06-26 2022-02-08 Samsung Electronics Co., Ltd. Generating and transmitting metadata for virtual reality
US10491711B2 (en) * 2015-09-10 2019-11-26 EEVO, Inc. Adaptive streaming of virtual reality data
US9681111B1 (en) * 2015-10-22 2017-06-13 Gopro, Inc. Apparatus and methods for embedding metadata into video stream
US9473758B1 (en) 2015-12-06 2016-10-18 Sliver VR Technologies, Inc. Methods and systems for game video recording and virtual reality replay
WO2017116952A1 (en) * 2015-12-29 2017-07-06 Dolby Laboratories Licensing Corporation Viewport independent image coding and rendering
US10282814B2 (en) * 2016-01-07 2019-05-07 Mediatek Inc. Method and apparatus of image formation and compression of cubic images for 360 degree panorama display
US10313745B2 (en) * 2016-01-17 2019-06-04 Bitmovin Gmbh Adaptive streaming of an immersive video scene
US9922387B1 (en) * 2016-01-19 2018-03-20 Gopro, Inc. Storage of metadata and images
US10484621B2 (en) * 2016-02-29 2019-11-19 Gopro, Inc. Systems and methods for compressing video content
US20170274411A1 (en) * 2016-03-22 2017-09-28 Western Tube & Conduit Corporation Wiper system
US10319071B2 (en) * 2016-03-23 2019-06-11 Qualcomm Incorporated Truncated square pyramid geometry and frame packing structure for representing virtual reality video content
US10645362B2 (en) * 2016-04-11 2020-05-05 Gopro, Inc. Systems, methods and apparatus for compressing video content
US11019257B2 (en) * 2016-05-19 2021-05-25 Avago Technologies International Sales Pte. Limited 360 degree video capture and playback
WO2017205648A1 (en) 2016-05-26 2017-11-30 Vid Scale, Inc. Geometric conversion for 360-degree video coding
US10645366B2 (en) * 2016-06-10 2020-05-05 Lucid VR, Inc. Real time re-calibration of stereo cameras
US10368067B2 (en) * 2016-06-15 2019-07-30 Mediatek Inc. Method and apparatus for selective filtering of cubic-face frames
US10277914B2 (en) * 2016-06-23 2019-04-30 Qualcomm Incorporated Measuring spherical image quality metrics based on user field of view
US20180007422A1 (en) * 2016-06-30 2018-01-04 Sony Interactive Entertainment Inc. Apparatus and method for providing and displaying content
EP3378229A4 (en) * 2016-08-23 2018-12-26 SZ DJI Technology Co., Ltd. System and method for improving efficiency in encoding/decoding a curved view video
WO2018038520A1 (ko) * 2016-08-25 2018-03-01 엘지전자 주식회사 전방향 비디오를 전송하는 방법, 전방향 비디오를 수신하는 방법, 전방향 비디오 전송 장치, 전방향 비디오 수신 장치
WO2018044073A1 (en) * 2016-09-01 2018-03-08 Samsung Electronics Co., Ltd. Image streaming method and electronic device for supporting the same
JP6620079B2 (ja) * 2016-09-08 2019-12-11 株式会社ソニー・インタラクティブエンタテインメント 画像処理システム、画像処理方法およびコンピュータプログラム
KR102352933B1 (ko) * 2016-09-09 2022-01-20 삼성전자주식회사 3차원 이미지를 프로세싱하기 위한 방법 및 장치
KR20180029315A (ko) * 2016-09-12 2018-03-21 삼성전자주식회사 가상 현실 컨텐트의 영상을 투영하기 위한 영상 처리 방법 및 장치
US20180098090A1 (en) * 2016-10-04 2018-04-05 Mediatek Inc. Method and Apparatus for Rearranging VR Video Format and Constrained Encoding Parameters
EP3526974B1 (en) * 2016-10-12 2021-06-30 Koninklijke KPN N.V. Processing spherical video data on the basis of a region of interest
US10917564B2 (en) * 2016-10-12 2021-02-09 Qualcomm Incorporated Systems and methods of generating and processing files for partial decoding and most interested regions
US10440361B2 (en) * 2016-11-22 2019-10-08 Pixvana, Inc. Variable image data reduction system and method
EP3334164B1 (en) * 2016-12-09 2019-08-21 Nokia Technologies Oy A method and an apparatus and a computer program product for video encoding and decoding
US10620441B2 (en) * 2016-12-14 2020-04-14 Qualcomm Incorporated Viewport-aware quality metric for 360-degree video
US10313664B2 (en) * 2017-01-11 2019-06-04 Qualcomm Incorporated Adjusting field of view of truncated square pyramid projection for 360-degree video
CN110169069A (zh) * 2017-01-19 2019-08-23 索尼公司 图像处理装置和方法
WO2018156243A1 (en) * 2017-02-22 2018-08-30 Twitter, Inc. Transcoding video
KR102305633B1 (ko) * 2017-03-17 2021-09-28 엘지전자 주식회사 퀄리티 기반 360도 비디오를 송수신하는 방법 및 그 장치
EP3586315A4 (en) * 2017-03-28 2020-04-22 Samsung Electronics Co., Ltd. METHOD AND DEVICE FOR IMAGE DISPLAY BASED ON USER MOVEMENT INFORMATION
KR102277267B1 (ko) * 2017-03-29 2021-07-14 엘지전자 주식회사 360 비디오를 전송하는 방법, 360 비디오를 수신하는 방법, 360 비디오 전송 장치, 360 비디오 수신 장치
US10979663B2 (en) 2017-03-30 2021-04-13 Yerba Buena Vr, Inc. Methods and apparatuses for image processing to optimize image resolution and for optimizing video streaming bandwidth for VR videos
US20190005709A1 (en) * 2017-06-30 2019-01-03 Apple Inc. Techniques for Correction of Visual Artifacts in Multi-View Images

Similar Documents

Publication Publication Date Title
JP2020512772A5 (ja) Vrビデオ用に画像解像度を最適化してビデオストリーミングの帯域幅を最適化する画像処理のための方法及びストリーミングサーバ
JP7205485B2 (ja) Vrビデオ用に画像解像度を最適化してビデオストリーミングの帯域幅を最適化する画像処理のための方法及びストリーミングサーバ
US11303966B2 (en) Content based stream splitting of video data
US10650570B2 (en) Dynamic local temporal-consistent textured mesh compression
US10242462B2 (en) Rate control bit allocation for video streaming based on an attention area of a gamer
GB2572996A (en) Processing video patches for three-dimensional content
US20180341323A1 (en) Methods and apparatuses for handling virtual reality content
US10499066B2 (en) Method and apparatus for improving efficiency of content delivery based on consumption data relative to spatial data
US10638135B1 (en) Confidence-based encoding
US11523144B2 (en) Communication apparatus, communication method, and computer-readable storage medium
DE102020108357A1 (de) Umkodieren vorhergesagter bilder in live-videostream-anwendungen
CN110166796B (zh) 视频帧的处理方法、装置、计算机可读介质及电子设备
US9940732B2 (en) Implementing reduced video stream bandwidth requirements when remotely rendering complex computer graphics scene
WO2018221211A1 (ja) 画像処理装置および方法、ファイル生成装置および方法、並びにプログラム
CN112686165A (zh) 视频中目标对象的识别方法、装置、电子设备及存储介质
GB2558644A (en) Video encoding
US20230007277A1 (en) Immersive video coding using object metadata
US20210075937A1 (en) Reducing judder using motion vectors
JP6804191B2 (ja) ビデオストリームの後処理のための方法及び装置
US10810471B1 (en) Intelligent coalescing of media streams
GB2566478B (en) Probability based 360 degree video stabilisation
US20190394500A1 (en) Transmitting apparatus, transmitting method, receiving apparatus, receiving method, and non-transitory computer readable storage media
TWI735297B (zh) 具有初始化片段之視訊及音訊之寫碼
KR102127846B1 (ko) 영상을 처리하는 방법, 영상을 재생하는 방법 및 그 장치들
US20210112275A1 (en) Methods and apparatus for determining adjustment parameter during encoding of spherical multimedia content