JP2020043559A - ビデオストリーミング方法、ビデオストリーミングシステム、ビデオストリーミング装置およびプログラム - Google Patents

ビデオストリーミング方法、ビデオストリーミングシステム、ビデオストリーミング装置およびプログラム Download PDF

Info

Publication number
JP2020043559A
JP2020043559A JP2019150592A JP2019150592A JP2020043559A JP 2020043559 A JP2020043559 A JP 2020043559A JP 2019150592 A JP2019150592 A JP 2019150592A JP 2019150592 A JP2019150592 A JP 2019150592A JP 2020043559 A JP2020043559 A JP 2020043559A
Authority
JP
Japan
Prior art keywords
section
reconstructed image
data
quality
image frame
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Ceased
Application number
JP2019150592A
Other languages
English (en)
Inventor
文軍 趙
Wenjun Zhao
文軍 趙
蕭▲ぜん▼ 鄭
Xiaozhen Zheng
蕭▲ぜん▼ 鄭
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
SZ DJI Technology Co Ltd
Original Assignee
SZ DJI Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by SZ DJI Technology Co Ltd filed Critical SZ DJI Technology Co Ltd
Publication of JP2020043559A publication Critical patent/JP2020043559A/ja
Ceased legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/597Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding specially adapted for multi-view video sequence encoding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/105Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/107Selection of coding mode or of prediction mode between spatial and temporal predictive coding, e.g. picture refresh
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/114Adapting the group of pictures [GOP] structure, e.g. number of B-frames between two anchor frames
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/119Adaptive subdivision aspects, e.g. subdivision of a picture into rectangular or non-rectangular coding blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/154Measured or subjectively estimated visual quality after decoding, e.g. measurement of distortion
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/162User input
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/167Position within a video image, e.g. region of interest [ROI]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/174Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a slice, e.g. a line of blocks or a group of blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/238Interfacing the downstream path of the transmission network, e.g. adapting the transmission rate of a video stream to network bandwidth; Processing of multiplex streams
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/472End-user interface for requesting content, additional data or services; End-user interface for interacting with content, e.g. for content reservation or setting reminders, for requesting event notification, for manipulating displayed content
    • H04N21/4728End-user interface for requesting content, additional data or services; End-user interface for interacting with content, e.g. for content reservation or setting reminders, for requesting event notification, for manipulating displayed content for selecting a Region Of Interest [ROI], e.g. for requesting a higher resolution version of a selected region

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Databases & Information Systems (AREA)
  • Human Computer Interaction (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Information Transfer Between Computers (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Abstract

【課題】ビデオストリーミングにおけるビットストリーム切換えをサポートする。【解決手段】ビットストリームの切換えを行うために、分散型IDRピクチャ伝送技術を使用し、これにより、伝送されるデータ量の増加によって引き起こされる遅延を減らす。追加的または代替的に、プログレッシブコードストリーム切換え技術を使用し、これにより、ビットストリーム切換えが発生したときでもスムーズなデータストリーム伝送を確実にする。【選択図】図27

Description

[著作権表示]
この特許文書の開示の一部は、著作権保護の対象となる資料を含む。著作権者は、特許庁の特許ファイルまたは記録に見られる、特許文書または特許開示の何人によるファクシミリ複製に異議を唱えないが、そうでない場合はすべての著作権を留保する。
開示された実施形態は、一般にビデオ処理に関し、より詳細には、ただしこれに限定されないが、ビデオストリーミング、符号化および復号化に関する。
ビデオコンテンツの消費は、主として様々な種類のポータブル、ハンドヘルド、またはウェアラブルデバイスの普及により、近年急増している。例えば、仮想現実(VR)または拡張現実(AR)機能を異なるヘッドマウントデバイス(HMD)に統合することができる。
しかしながら、ビデオコンテンツの形態がより洗練されるにつれて、ビデオコンテンツの記憶および送信はますます困難になっている。例えば、ビデオの記憶および伝送のために帯域幅を減らす必要がある。これは、本発明の実施形態が取り組むことを意図している一般的な分野である。
本発明は、ビデオストリーミングをサポートすることができる方法、システム、装置およびプログラムを提供することを目的とする。
本発明の第1の側面によれば、ビデオストリーミング方法が提供され、該方法は、
一連の画像フレーム内の各画像フレームを、少なくとも第1セクションと第2セクションとを含む複数のセクションに分割する方式を使用するステップと、
第1セクションについて符号化品質が異なる第1セットの符号化データを取得し、第2セクションについて符号化品質が異なる第2セットの符号化データを取得するステップと、
前記第1セクションの符号化品質の変化に対応する第1切換え点を決定し、第2セクションの符号化品質の変化に対応する第2切換え点を決定するステップと、
第1切換え点の前の第1の先行符号化品質を有する符号化データと第1切換え点の後の第1の後続符号化品質を有する符号化データとを第1セットの符号化データから選択するステップと、
第2切換え点の前に第2の先行符号化品質を有する符号化データと第2切換え点の後に第2の後符号化品質を有する符号化データとを第2セットの符号化データから選択するステップと、
選択された符号化データをビットストリームに組み込むステップと、
を備える。
本発明の第2の側面によれば、ビデオストリーミングの他の方法が提供され、該方法は、
少なくとも第1セクションおよび第2セクションを含み、分割方式に基づいてそれぞれ複数のセクションに分割された一連の画像フレームを再構成するためのバイナリデータを含むビットストリームを受け取るステップと、
前記バイナリデータから、第1セクションのための第1の再構成画像データと第2セクションのための第1の再構成画像データとを含む第1の再構成画像フレームを生成するステップと、
前記バイナリデータから、第1セクションのための第2の再構成画像データと第2セクションのための第2の再構成画像データとを含む第2の再構成画像フレームを生成するステップと、
を備え、
前記第2セクションについての符号化品質の変化に対応する第2切換え点の前に前記第2の再構成画像フレームがあるとき、第2セクションのための前記第1の再構成画像データは第2の先行符号化品質で再構成され、
前記第1セクションについての符号化品質の変化に対応する第2切換え点の前に前記第2の再構成画像フレームがあるとき、第2セクションのための前記第1の再構成画像データは第2の先行符号化品質で再構成され、
前記第1の再構成画像フレームが前記第1切換え点の後であるときに前記第1セクションの前記第2の再構成画像データが第1の事後符号化品質で再構成されること、および、前記第2の再構成画像フレームが前記第2切換え点の後にあるときに前記第1セクションについての前記第2の再構成画像データは第2の後続符号化品質で再構成されることの少なくともいずれかである。
本発明の第3の側面によれば、上述のビデオストリーミング方法をコンピュータに実行させるプログラムが提供される。
本発明の第4の側面によれば、少なくとも一つのマイクロプロセッサと、少なくとも一つのマイクロプロセッサ上で動作するストリーミングコントローラと、を備えるビデオストリーミングシステムが提供され、該ストリーミングコントローラは、
一連の画像フレーム内の各画像フレームを、少なくとも第1セクションと第2セクションとを含む複数のセクションに分割する方式を使用し、
第1セクションについて符号化品質が異なる第1セットの符号化データを取得し、第2セクションについて符号化品質が異なる第2セットの符号化データを取得し、
前記第1セクションの符号化品質の変化に対応する第1切換え点を決定し、第2セクションの符号化品質の変化に対応する第2切換え点を決定し、
第1切換え点の前の第1の先行符号化品質を有する符号化データと第1切換え点の後の第1の後続符号化品質を有する符号化データとを第1セットの符号化データから選択し、
第2切換え点の前に第2の先行符号化品質を有する符号化データと第2切換え点の後に第2の後符号化品質を有する符号化データとを第2セットの符号化データから選択し、
選択された符号化データをビットストリームに組み込む。
本発明の第5の側面によれば、少なくとも一つのマイクロプロセッサと、少なくとも一つのマイクロプロセッサ上で動作するデコーダと、を備えるビデオストリーミングシステムが提供され、該デコーダは、
少なくとも第1セクションおよび第2セクションを含み、分割方式に基づいてそれぞれ複数のセクションに分割された一連の画像フレームを再構成するためのバイナリデータを含むビットストリームを受け取り、
前記バイナリデータから、第1セクションのための第1の再構成画像データと第2セクションのための第1の再構成画像データとを含む第1の再構成画像フレームを生成し、
前記バイナリデータから、前記第1セクションのための第2の再構成画像データと第2セクションのための第2の再構成画像データとを含む第2の再構成画像フレームを生成し、
前記第2セクションについての符号化品質の変化に対応する第2切換え点の前に前記第2の再構成画像フレームがあるとき、第2セクションのための前記第1の再構成画像データは第2の先行符号化品質で再構成され、
前記第1セクションについての符号化品質の変化に対応する第2切換え点の前に前記第2の再構成画像フレームがあるとき、第2セクションのための前記第1の再構成画像データは第2の先行符号化品質で再構成され、
前記第1の再構成画像フレームが前記第1切換え点の後であるときに前記第1セクションのための前記第2の再構成画像データが第1の事後符号化品質で再構成されること、および、前記第2の再構成画像フレームが前記第2切換え点の後にあるときに前記第1セクションについての前記第2の再構成画像データは第2の後続符号化品質で再構成される、ことの少なくともいずれかである。
さらに、本発明の第6の側面によれば、上述のプログラムを読み出して上述のビデオストリーミング方法を実行するプロセッサを備えるビデオストリーミング装置が提供される。
本発明の様々な実施形態によれば、ビデオストリーミングにおいてビットストリーム切換えを実行するために伝送されるデータ量の増加によって引き起こされる遅延を減少させるために分散IDR(nstantaneous ecoder efresh)ピクチャ(Picture)伝送技術を採用することができる。追加的または代替的に、プログレッシブコードストリーム切換え技術は、ビットストリーム切換えが発生したときでもスムーズなデータストリーム伝送を保証することができる。
本発明の様々な実施形態による、湾曲ビュービデオの符号化/圧縮の例を示す概略フロー図の一例である。 本発明の様々な実施形態による、3次元球面図を2次元平面にマッピングすることができる例示的な四角形投影を示す図の一例である。 本発明の様々な実施形態による、3次元球面図を2次元レイアウトにマッピングする例示的な立方体面投影を示す図の一例である。 本発明の様々な実施形態による、湾曲したビューを2次元(2D)画像にマッピングすることを示す図の一例である。 本発明の様々な実施形態による、例示的ビデオストリーミング環境を示す図の一例である。 (a)および(b)は、本発明の様々な実施形態による、タイルに基づく例示的な画像分割方式を示す図の例である。 本発明の様々な実施形態による、ビデオストリーミングをサポートするための画像フレームシーケンスの符号化を示す図の一例である。 本発明の様々な実施形態による、タイルを用いたビデオストリーミングにおけるビットストリーム切換えのサポートを示す図の一例である。 (a)および(b)は、本発明の様々な実施形態による、タイルを用いたビデオストリーミングにおけるビットストリーム切換えを示す図の例である。 (a)および(b)は、本発明の様々な実施形態による、スライスに基づく例示的な画像分割方式を示す図の例である。 本発明の様々な実施形態による、ビデオストリーミングをサポートするための画像フレームシーケンスの符号化を示す図の一例である。 本発明の様々な実施形態による、スライスを使用してビデオストリーミングにおけるビットストリーム切換えをサポートすることを示す図の一例である。 本発明の様々な実施形態による、スライスを用いたビデオストリーミングにおけるビットストリーム切換えを示す図の一例である。 本発明の様々な実施形態による、ビットストリーム切換えをサポートする例示的ビデオストリーミング環境を示す図の一例である。 本発明の様々な実施形態による、タイルに基づくビデオストリーミングにおける配信型IDRピクチャ送信のサポートを示す図の一例である。 本発明の様々な実施形態による、スライスに基づくビデオストリーミングにおける配信型IDRピクチャ送信のサポートを示す図の一例である。 (a)および(b)は、本発明の様々な実施形態による、異なるタイルに関連する重要度評価に基づいてIDRピクチャ挿入サイクルを構成することを示す図の例である。 図17(a)に示されるような例示的な構成に基づいてサーバ側でビットストリーム切換えを実行することを示す図の一例である。 図17(a)に示されるような例示的な構成に基づいてサーバ側でビットストリーム切換えを実行することを示す図の他の一例である。 図17(b)に示されるような例示的な構成に基づいてサーバ側でビットストリーム切換えを実行することを示す図の一例である。 図17(b)に示されるような例示的な構成に基づいてサーバ側でビットストリーム切換えを実行することを示す図の他の一例である。 本発明の様々な実施形態による、異なるスライスに関連する重要度評価に基づいてIDRピクチャ挿入サイクルを構成することを示す図の一例である。 図22(a)に示されるような例示的な構成に基づいてサーバ側でビットストリーム切換えを実行することを示す図の一例である。 図22(a)に示されるような例示的な構成に基づいてサーバ側でビットストリーム切換えを実行することを示す図の他の一例である。 図22(b)に示されるような例示的な構成に基づいてサーバ側でビットストリーム切換えを実行することを示す図の一例である。 図22(b)に示されるような例示的な構成に基づいてサーバ側でビットストリーム切換えを実行することを示す図の他の一例である。 本発明の様々な実施形態による、ビデオストリーミングにおけるビットストリーム切換えをサポートするためのフローチャートを示す図の一例である。 図17(a)に示すような構成例に基づいて端末側でビットストリーム切換えを実行することを示す図の一例である。 図17(a)に示すような構成例に基づいて端末側でビットストリーム切換えを実行することを示す図の他の一例である。 図17(b)に示されるような例示的な構成に基づいて端末側でビットストリーム切換えを実行することを示す図の一例である。 図17(b)に示されるような例示的な構成に基づいて端末側でビットストリーム切換えを実行することを示す図の他の一例である。 図22(a)に示すような例示的な構成に基づいて端末側でビットストリーム切換えを実行することを示す図の一例である。 図22(a)に示すような例示的な構成に基づいて端末側でビットストリーム切換えを実行することを示す図の他の一例である。 図22(b)に示されるような例示的な構成に基づいて端末側でビットストリーム切換えを実行することを示す図の一例である。 図22(b)に示されるような例示的な構成に基づいて端末側でビットストリーム切換えを実行することを示す図の他の一例である。 本発明の様々な実施形態による、ビデオストリーミングをサポートするためのフローチャートを示す図の一例である。 本発明の様々な実施形態に従った、可動プラットフォーム環境を示す図の一例である。
以下、本発明の実施の形態のいくつかについて図面を参照しながら説明する。図面において同一または対応する要素・部材には同一の参照符号を付し、その重複説明は適宜省略する。また、図中の各部材の形状・サイズについては、説明を容易にするため、適宜に拡大・縮小・省略がなされ、このために現実の縮尺・比率とは合致していない場合がある。また、図面の説明においても、紙面の上下方向に即してそれぞれ「上」「下」の用語を便宜的に用いるために、重力加速度の方向と一致しない場合がある点に留意されたい。また、「実質的に」の用語は、測定誤差をも含む趣旨で使用される。
また、以下で使用される「第1」、「第2」などのような序数を表す用語は、同一又は相応する構成要素を区別するための識別記号に過ぎなく、同一又は相応する構成要素が、こらの「第1」、「第2」などの用語によって何らの限定も受けるものではない。
また、用語「結合」は、各構成要素間の接触関係において、各構成要素間で物理的に直接接触される場合だけを意味するのではなく、他の構成が各構成要素間に介在され、その他の構成に構成要素がそれぞれ接触されている場合まで含む概念である。
(A)ビデオストリーミングシステムおよびビデオストリーミング方法
図1は、本発明の様々な実施形態による、ビデオストリーミングシステムにより実行されるビデオストリーミング方法による曲ビュービデオの符号化/圧縮の例を示す概略フロー図の一例である。図1に示すように、曲面ビュービデオのようなパノラマビュービデオまたはワイドビュービデオの符号化/圧縮は、マッピング101、予測102、変換103、量子化104、およびエントロピー符号化105などの複数のステップを含むことができる。
様々な実施形態によれば、マッピングステップ101において、システムは、様々なビデオ符号化/圧縮技法を利用するために、ビデオシーケンス内の3次元(3D)曲面図を2次元(2D)平面に投影することができる。システムは、湾曲ビュービデオ(例えば、球面ビュービデオ)を記憶し送信するために2次元の矩形画像フォーマットを使用することができる。また、システムは、デジタル画像処理をサポートし、コーデック操作を実行するために2次元の矩形画像フォーマットを使用することができる。
球面図のような湾曲した図を長方形の画像に写像するために異なる方法を採用することができる。たとえば、球面ビューは、正四角形投影に基づいて長方形の画像にマッピングできる。いくつかの実施形態では、正四角形投影は、経線を一定間隔の垂直直線にマッピングすることができ、緯度の円を一定間隔の水平直線にマッピングすることができる。あるいは、球面ビューは、立方体面投影に基づいて長方形の画像にマッピングすることができる。立方体面投影は、その外接立方体に基づいて3D球体表面を近似できる。立方体の6つの面の3D球体表面の投影は、それぞれの投影の相対的な位置や向きなどの立方体の面の配置を定義する、異なる立方体の面のレイアウトを使用して2D画像として配置できる。上述したような直方体投影および立方体面投影とは別に、他の投影機構を利用して3D曲面図を2Dビデオにマッピングすることができる。2Dビデオは、HEVC/H.265、H.264/AVC、AVS1−P2、AVS2−P2、VP8、VP9などのいくつかの一般的に使用されるビデオコーデック規格に基づいて圧縮、符号化、および復号することができる。
様々な実施形態によれば、予測ステップ102は、画像内の冗長な情報を減らすために採用することができる。予測ステップ102は、フレーム内予測およびフレーム間予測を含み得る。フレーム内予測は、ビデオシーケンス内の他のフレームとは無関係に、現在のフレーム内に含まれる情報のみに基づいて実行することができる。フレーム間予測は、基準フレーム、例えば以前に処理されたフレームに基づいて現在のフレームの冗長性を排除することによって実行することができる。
例えば、フレーム間予測のための動き推定を実行するために、フレームを複数の画像ブロックに分割することができる。各画像ブロックは、例えばブロックマッチングアルゴリズムに基づいて、基準フレーム内のブロックにマッチングさせることができる。いくつかの実施形態では、現在のフレーム内の画像ブロックの座標から基準フレーム内の一致した画像ブロックの座標へのオフセットを表す動きベクトルを計算することができる。また、残差、すなわち現在のフレーム内の各画像ブロックと基準フレーム内の整合ブロックとの間の差を計算してグループ化することができる。
さらに、変換ステップ103を適用することによってフレームの冗長性を排除することができる。変換ステップ103において、システムは符号化効率を改善するために残差を処理することができる。例えば、変換係数およびその転置行列をグループ化された残差に適用することによって変換係数を生成することができる。その後、変換係数は、量子化ステップ104において量子化され、エントロピー符号化ステップ105において符号化され得る。次いで、エントロピー符号化ステップ105から生成された情報、ならびに他の符号化情報(たとえば、フレーム内予測モード、動きベクトル)を含むビットストリームを格納し、復号器に送信することができる。
受信側では、デコーダ(例えば図5の符号506参照)は、残差を取得するために、受信されたビットストリームに対して逆の処理(エントロピー復号、逆量子化、および逆変換など)を実行することができる。したがって、画像フレームは、残差および他の受信された復号化情報に基づいて復号化することができる。そして、復号画像を曲面映像の表示に用いることができる。
図2は、本発明の様々な実施形態による、3次元球面図を2次元平面にマッピングすることができる例示的な正四角形投影200を示す。図2に示すように、正四角形投影法を使用して、球体ビュー201を2次元矩形画像202にマッピングすることができる。一方、2次元矩形画像202は、逆の方法で球体ビュー201にマッピングすることができる。
いくつかの実施形態では、マッピングは以下の式に基づいて定義することができる。
x=λ cosφ (式1)
y=φ (式2)
ここで、xは2D平面座標系における水平座標を表し、yは2D平面座標系202における垂直座標を表す。λは中心子午線からの球201の経度を示し、一方、φは標準緯線からの球の緯度を示す。φは射影の縮尺が正しい標準平行線を示す。いくつかの実施形態では、φは0として設定することができ、座標系202の点(0,0)は中心に配置することができる。
図3は、本発明の様々な実施形態による、3次元球面図を2次元レイアウトにマッピングする例示的な立方体面投影300を示す図の一例である。図3に示すように、立方体面投影を使用して、球体ビュー301を2次元レイアウト302にマッピングすることができる。一方、2次元レイアウト302は、逆の方法で球ビュー301にマッピングすることができる。
様々な実施形態によれば、球面301の立方体面投影は立方体310、例えば球301の外接立方体に基づくことができる。マッピング関係を確認するために、球面上および立方体面上のそれぞれの対の交点対の数を得るために、球の中心からレイキャスティングを実行することができる。
図3に示されるように、球面図を格納および伝送するための画像フレームは、立方体310の6つの立方体面、例えば、頂部立方体面、底部立方体面、左側立方体面、右側立方体面、正面立方体および背面立方体を含むことができる。これらの6つの立方体面は、2D平面上に拡張(または投影)されてもよい。
立方体面投影に基づく球面図または楕円体図などの湾曲した図の投影は、例示の目的で提供されており、本開示の範囲を限定することを意図していないことに留意されたい。当業者であれば、本開示の教示の下で様々な修正形態および変形形態を実施することができる。本開示に係る投影の投影フォーマットの例示的な実施形態は、八面体、十二面体、二十面体、または任意の多面体を含み得る。例えば、八面体に基づく近似のために八面上の投影を生成することができ、それら八面上の投影を2D平面上へ拡大および投影の少なくともいずれかを行うことができる。別の例では、12面上の投影は12面体に基づく近似のために生成されてもよく、それら12面上の投影は2D平面上へ拡大および投影の少なくともいずれかがなされてもよい。さらに別の例では、二十面体に基づく近似のために二十面上の投影を生成することができ、それら二十面上の投影を2D平面上へ拡大および投影の少なくともいずれかを行うことができる。さらに別の例では、多面体の様々な面上の楕円形ビューの投影は、楕円形ビューの近似のために生成されてもよく、それらの20面上の投影は、2D平面への拡大および投影の少なくともいずれかがなされ得る。
なお、図3に示す立方体面レイアウトでは、頂部立方体面、底部立方体面、左側立方体面、右側立方体面、正面立方体面および背面立方体面など、異なる立方体面をその相対位置を使用して表すことができることに留意されたい。そのような描写は例示の目的のためだけに提供され、本開示の範囲を限定することを意図するものではない。当業者には、本開示の教示の下で様々な修正形態および変形形態を実施することができる。
様々な実施形態によれば、各立方体面の向きまたは相対位置に応じて、様々な立方体面間の連続関係は、異なる連続関係を使用して表すことができる。
図4は、本発明の様々な実施形態による、湾曲したビューを2次元(2D)画像にマッピングすることを示す図の一例である。図4に示すように、マッピング401は、湾曲ビュー403を2D画像404に対応させるために使用することができる。2D画像404は、それぞれが多面体(例えば立方体)の面に投影された湾曲ビュー403の一部を含む一組の画像領域411〜412を含むことができる。
様々な実施形態によれば、一組の画像領域は、曲面図の上記少なくとも一部分を多面体上の複数の面に投影することによって得ることができる。例えば、球面図403は、球面または球面の一部から一組の立方体面に投影することができる。同様に、湾曲したビューは、楕円体表面、または楕円体表面の一部から、一組の長方形の立方体面に投影することができる。
さらに、湾曲ビュー、例えば球面ビュー403は、異なるレイアウトに基づいて2次元矩形画像404にマッピングすることができる。図4に示すように、2−D画像内における画像領域411〜412の位置および向きなどの相対位置情報を定義するレイアウト402に基づいて、上記組の画像領域411〜412を2−D画像404内に配置することができる。
図4に示すように、球面図403はあらゆる方向に連続している。様々な実施形態によれば、一組の画像領域411〜412は、多面体上の複数の面に湾曲ビュー403の少なくとも一部を投影することによって得ることができる。連続関係は、特定のマッピング401およびレイアウト402に関連する連続関係を使用して表すことができる。幾何学的な制限により、2次元画像404は、球面図403において連続性を完全に維持することができないかもしれない。
様々な実施形態に従って、システムは、球面ビュービデオを符号化/復号する際の効率を向上させるために、画像領域411〜412のセット間の連続性を提供または維持するためのパディング方式を採用することができる。
様々な実施形態に従って、曲面ビュー、例えば球面ビュー403を2次元平面ビューにマッピングするために様々なマッピング機構を使用することができる(すなわち、曲面ビュービデオを2次元平面ビデオにマッピングすることができる)。球面ビデオまたは部分球面ビデオは、複数のカメラまたは魚眼カメラなどのワイドビューカメラによって取り込むことができる。2次元平面ビデオは、球面写像によって得ることができ、部分球面写像によっても得ることができる。マッピング方法は、360度パノラマビデオ、180度パノラマビデオ、または広視野(FOV)を有するビデオの表現を提供するために適用され得る。さらに、マッピング方法によって得られた2次元平面ビデオは、HEVC/H.265、H.264/AVC、AVS1−P2、AVS2−P2、VP8およびVP9などの様々なビデオコーデック規格を使用することによって符号化および圧縮することができる。
様々な実施形態によれば、360度パノラマビデオまたはより広い視野(FOV)を有するビデオなどのパノラマまたはワイドビュービデオは、大量のデータを含み得る。また、そのようなビデオは、高い符号化品質で符号化される必要があり、また高解像度で提示される必要があるかもしれない。したがって、マッピングおよび圧縮後(たとえば、さまざまなビデオコーデック方式を使用した後)であっても、圧縮データのサイズは依然として大きい可能性がある。結果として、パノラマビデオまたはワイドビュービデオの送信は、現在のネットワーク送信条件では依然として困難な課題である。
様々な実施形態に従って、パノラマビデオまたはワイドビュービデオを符号化および圧縮するために様々な手法を使用することができる。例えば、満足できる主観的感覚でパノラマビデオまたはワイドビュービデオをユーザが見ることを確実にしながら、ネットワーク帯域幅の消費を減らすために、ビューポートに基づくアプローチを使用することができる。ここで、パノラマビデオまたはワイドビュービデオは、人間の視覚よりも広いビューをカバーすることができ、ビューポートは、人間の視覚における主要な視点を表すことができ、より注意が必要である。一方、周辺視野でしか観察できない、または人間が観察できないようなビューポートの外側の領域は、あまり注意を払う必要がない場合がある。
図5は、本発明の様々な実施形態による、例示的ビデオストリーミング環境を示す図の一例である。図5に示されるように、一連の画像フレーム(またはピクチャ)を含むことができるビデオ510、例えば、広い視野(FOV)を有するパノラマまたはワイドビュービデオ510は、ストリーミングサーバ501からビデオストリーミング環境500内のユーザ機器(UE)502へストリーミングすることができる。
サーバ側では、エンコーダ508がビデオ510内の一連の画像フレームを符号化し、符号化されたデータを様々なビットストリーム504に組み込んで記憶装置503に格納することができる。
様々な実施形態によれば、ストリーミングコントローラ505は、ユーザ機器(UE)502へのビデオ510のストリーミングを制御することを担当することができる。いくつかの事例では、ストリーミングコントローラ505は、エンコーダまたはエンコーダの構成要素とすることができる。いくつかの事例では、ストリーミングコントローラ505は、エンコーダを含むことができ、またはエンコーダと共に機能することができる。例えば、ストリーミングコントローラ505は、ビューポート情報などのユーザ情報512をユーザ機器(UE)502から受信することができる。そして、ストリーミングコントローラ505は、記憶装置503に記憶されたビットストリーム504に基づいて対応するビットストリーム511を生成し、生成したビットストリーム511をユーザ機器(UE)502に送信することができる。
ユーザ機器(UE)側では、デコーダ506は、ビデオ510内の一連の画像フレームのバイナリデータを含むビットストリーム511を取得することができる。そして、デコーダ506は、復号された情報をユーザが見るためにディスプレイ507に提供する前に、バイナリデータを適宜復号することができる。一方、ユーザ機器(UE)502、またはユーザ機器(UE)502の構成要素(例えばディスプレイ507)は、(例えばユーザの視界が動いたときに)更新されたビューポート情報などの更新されたユーザ情報を取得することができる。そして、そのような更新されたユーザ情報をストリーミングサーバ501に送り返す。したがって、ストリーミングコントローラ505は、ビットストリーム511を再構成してユーザ機器(UE)502に送信することができる。
様々な実施形態によれば、ビデオ510内の各画像フレームを複数のセクションに分割するために異なるタイプの区分方式を使用することができる。例えば、分割方式は、タイルもしくはスライス、またはビデオの符号化および復号化において有益である他の任意の幾何学的分割に基づくことができる。様々な例では、ビデオ510内の各画像フレームは、同じ数のセクションに分割することができる。また、異なる画像フレーム内の対応するセクションは、同じまたは実質的に同様の相対位置に、または実質的に同様の幾何学的サイズで配置することができる(例えば、ビデオ510の画像フレームのそれぞれは、同じまたは実質的に同様の方法で分割できる)。
様々な実施形態によれば、画像フレームを分割する複数のセクションのそれぞれは、複数レベルの符号化品質で構成することができる。例えば、サーバ側では、画像フレームを分割する複数のセクションの各々は、複数レベルの符号化品質で構成することができる。ユーザ機器(UE)側では、画像フレームを分割する複数のセクションのそれぞれは、複数レベルの復号品質を用いて構成することができる。
様々な実施形態によれば、ビデオ510内の画像フレーム内の各セクションの符号化品質は、関心領域(ROI)情報などのユーザの好みに基づいて決定することができる。代替的または追加的に、画像フレーム内の各セクションの符号化品質は、画像フレームのビューポートの位置を示すことができる第1の画像フレームのビューポート情報に基づいて決定することができる。ここで、ビューポートに対応する画像フレーム内のセクションは、ビューポートの外側にある画像フレーム内の他のセクションの符号化品質よりも高いレベルの符号化品質を有するように構成することができる。
図5に示すように、サーバ側では、ビデオ510内の一連の画像フレームに対する複数のビットストリーム504を記憶装置503に記憶することができる。いくつかの例では、格納されたビットストリームのそれぞれは、一連の画像フレーム内の特定のセクションについて、特定の符号化品質を有する符号化データを含み得る。
様々な実施形態に従って、エンコーダ508は、図1に示されるような符号化プロセスを利用することができる。例えば、エンコーダ508は、予測ステップおよび変換ステップなどの様々な符号化ステップを共有することによって、異なる符号化品質を使用してビデオ510内の一連の画像フレームを符号化する準備をすることができる。量子化ステップにおいて、エンコーダ508は、予測および変換結果を共有しながら、一連の画像フレームに異なる量子化パラメータを適用することができる。したがって、エンコーダ508は、異なる符号化品質を有する一連の画像フレームについて複数のビットストリームを取得することができる。
図6(a)および図6(b)は、本発明の様々な実施形態による、タイルに基づく例示的な画像分割方式600を示す図の例である。両図に示すように図6(a)および図6(b)の例では、ビデオ内の画像フレーム(またはピクチャ)を分割するためにいくつかのタイルを使用することができる。
様々な実施形態によれば、画像フレーム内の矩形領域であるタイルを符号化に使用することができる。例えば、様々なビデオコーデック規格では、画像フレームを水平方向および垂直方向にタイルに分割することができる。HEVC/H.265などのいくつかのビデオコーディング規格では、同じ行内のタイルの高さは均一であることが要求されるが、画像フレーム内のタイルの幅は均一である必要はない場合がある。同じ画像フレーム内の異なるタイル内のデータは、相互参照および予測されないことがある(ただし、フィルタリング操作は、同じ画像内の異なるタイルの境界を横切って実行されることがある)。フィルタリング動作は、デブロッキング、サンプル適応オフセット(SAO)、適応ループフィルタ(ALF)などを含むことができる。
図6(a)に示す例では、画像は9つのセクション(または領域)に分割することができる。各セクションは異なる品質でエンコードできる。様々な例では、符号化品質は定量的または定性的のいずれかで定義することができる。例えば、符号化品質は、「高」、「中」、または「低」のうちの1つとして定義されてもよい(それぞれが定量的尺度に関連付けられてもよい)。代替的に又は付加的に、符号化品質は、数字、文字、英数字列、又は他の適切な表現によって表すことができる。様々な例では、符号化品質は、さまざまなコーディング客観的尺度、主観的尺度、およびさまざまなサンプリング比(または解像度)を指すことがある。
図6(a)に示すように、タイル5、すなわち領域(1,1)はビューポートによって覆われている。したがって、タイル5は、「高」品質を割り当てられてもよい。さらに、タイル2、4、6、および8、すなわち領域(0、1)、(1、0)、(1、2)および(2、1)は、ビューポートに対応する領域(1、1)に隣接している。したがって、これらの領域は、たとえそれらが焦点ではないとしても、人間の目に見える(すなわち周辺視野内にある)ので、「中」品質で符号化することができる。また、タイル1、3、7、および9、つまり領域(0,0)、(0,2)、(2,0)、および(2,2)は、ビューポートからより遠くにあり、人間の目で観察できないかもしれない。したがって、これらの領域は「低」品質で符号化されてよい。
また、図6(b)に示す例では、画像を2つの部分または領域に分割することができる。各セクションは異なる品質で符号化することができ、符号化品質は「高」、「中」または「低」のうちの1つとして定義することができる。図6(b)に示されるように、セクションB(例えばタイル)はビューポートによって覆われる。したがって、セクションBは、「高」品質を割り当てられてもよい。さらに、セクションBを囲むセクションAは、「低」または「中」の品質で割り当てられてもよい。
図7は、本発明の様々な実施形態による、ビデオストリーミングをサポートするための画像フレームシーケンスの符号化を示す図の一例である。図7に示すように、画像シーケンス701を符号化し、サーバ700内にビットストリーム702として格納することができる。ここで、各ビットストリームは、サーバ側の単一のセクションに対して特定の品質を備えることができる。例えば、格納されたビットストリーム711は、画像シーケンス内のセクション1に対する品質A(例えば、「高」)を有する符号化データに対応する。
図7に示すように、画像シーケンス701内の画像フレーム(すなわちビデオ)は、9つのセクションに分割することができ、各セクションは、3つの品質(例えば、「高」のA、「中」のC、または「低」のC)で符号化できる。例えば、符号化は、H.264/AVC、H.265/HEVC、AVS1−P2、AVS1−P2などのような様々なビデオコーデック規格に基づくことができる。
様々な実施形態によれば、各ビットストリームは独立して復号されることが可能である。例えば、各ビットストリームは、独立ビデオパラメータセット(VPS)情報、独立シーケンスヘッダ情報、独立シーケンスパラメータセット(SPS)情報、独立ピクチャヘッダ情報、または別個のピクチャパラメータセット(PPS)パラメータを含み得る。
図8は、本発明の様々な実施形態による、タイルを用いたビデオストリーミングにおけるビットストリーム切換えのサポートを示す。図8に示すように、タイルベースの分割方式802を使用して、一連の画像フレーム801の中の画像フレーム811を複数のタイル(例えば、タイル1〜9)に分割することができる。さらに、ストリーミングコントローラは、画像フレーム811内の各タイルについて符号化品質803を決定することができる。さらに、ストリーミングコントローラは、サーバに格納されたビットストリームから、画像フレーム811の各タイルについて決定された符号化品質を有する符号化データ804を取得することができる。次に、ストリーミングコントローラは、所定の順序に従って、送信のために第1の画像フレームの複数のセクション(例えばタイル)の符号化データ804をビットストリーム805に組み込む(例えばカプセル化する)ことができる。場合によっては、所定の順序は、一連の画像フレーム内の各特定のセクション(たとえばタイル)の相対位置に基づいて構成することができる。
様々な実施形態に従って、ストリーミングコントローラは、ユーザ機器(UE)のビューポートに従って、送信される必要がある画像フレーム内の各セクション(例えばタイル)について、格納されたビットストリームから符号化データを動的に選択することができる。
図9(a)を参照すると、タイル5は時点T(N)におけるビューポート821に対応する。したがって、タイル5は、「高」品質(H)を割り当てられてもよい。さらに、タイトル2、4、6、および8のそれぞれに「中」の品質(M)を割り当てることができる。そしてタイル1、3、7、および9のそれぞれは、「低」品質(L)で割り当てることができる。
画像フレーム811内の各タイルに対応する符号化品質を決定した後、ストリーミングコントローラは、サーバ内の対応する格納ビットストリームから、画像フレーム811内の各タイルについて所望の品質を有する符号化データを取得することができる。例えば、図9(a)に示す例では、ストリーミングコントローラは、高品質のビットストリームからタイル5の符号化データ(例えば、図7の710)を取得することができる。また、ストリーミングコントローラは、中品質のビットストリーム(例えば、図7の720)からタイル2、4、6、および8の符号化データを取得することができ、さらに、ストリーミングコントローラは、低品質のビットストリーム(例えば、図7の730)からタイル1、3、7、および9の符号化データを取得することができる。
次いで、ストリーミングコントローラは、異なるタイルについて取得された符号化データを送信用のビットストリーム805にカプセル化することができる。様々な例では、各タイルの符号化データは所定の順序に従ってカプセル化することができる。例えば、所定の順序は、画像フレーム内の左から右へ、上から下への順序を指すラスタ走査順序に基づいて構成することができる。
様々な実施形態によれば、ビューポートに基づくビデオストリーミングアプローチは、視聴における主観的な経験を考慮しながら、パノラマビデオまたはワイドビュービデオについて送信されるデータを効果的に削減することができる。一方、ビューポートが変化すると、すなわち人間の視覚が動くと、ビューポートに対応する画像セクションも変化する可能性がある。
様々な実施形態によれば、ストリーミングコントローラは、ビデオストリーミングでの送信のためにビットストリーム805を生成するために使用される各区分セクションごとに異なる品質のビットストリームを動的に切換えることができる。例えば、ストリーミングコントローラは、後の時点で第2の画像フレームについてビューポート情報を受信することができる。ここで、第2の画像フレーム用のビューポート情報は、第2の画像フレーム用のビューポートの位置を示すことができる。第2の画像フレームは、一連の画像フレーム内で第1の画像フレームに続くか後に続き、第1の画像フレームに対するビューポートの位置は、第2の画像フレームに対するビューポートの位置とは異なり得る。
図9(b)を参照すると、T(M)の時点で、ビューポート822はタイル2に移動することがある。ストリーミングコントローラは、画像フレーム内の各タイルについて符号化品質を調整することができる。図9(b)に示すように、タイル2には「高」品質(H)が割り当てられている。さらに、タイトル1、3、5には「中」品質(M)を割り当てることができ、タイル4、6、7、8、および9を「低」品質(L)で割り当てることができる。
したがって、ストリーミングコントローラは、時点T(M)以降にビットストリーム切換えを実行することができる。画像フレーム内の各タイルの符号化品質を決定した後、ストリーミングコントローラは、サーバ内の対応する格納されたビットストリームから、画像フレーム内の各タイルについて所望の品質を有する符号化データを取得することができる。図9(b)に示す例では、ストリーミングコントローラは、高品質のビットストリームからタイル2の符号化データを取得することができる(例えば、図7の710)。さらに、ストリーミングコントローラは、中品質のビットストリーム(例えば、図7の720)からタイル1、3、および5の符号化データを取得することができ、さらに、ストリーミングコントローラは、低品質のビットストリーム(例えば、図7の730)からタイル4、6、7、8、および9の符号化データを取得することができる。
様々な例では、ビットストリーム切換えはランダムアクセスポイントで実行され得る。例えば、ランダムアクセスポイントは、瞬時復号リフレッシュ(IDR)ピクチャ、クリーンランダムアクセス(CRA)ピクチャ、シーケンスヘッダ、シーケンスヘッダ+1フレームなどであり得る。
図9(b)に示されるように、時点T(M)でビューポートの位置が変化した後、ストリーミングコントローラは、時点T(M)の後の最初のランダムアクセスポイントでビットストリーム切換えを実行することができる。 例えば、ストリーミングコントローラは、第2の画像フレームがランダムアクセスポイントにあり、ビットストリーム内の符号化データを復号する場合、第2の画像フレームについて受信したビューポート情報に基づいて第2の画像フレーム内の各セクションの符号化品質を決定できる。そうでなければ、ストリーミングコントローラは、第1の画像フレーム内の対応するセクションの符号化品質に基づいて、第2の画像フレーム内の各セクションについて符号化品質を決定することができる。このような場合、ストリーミングコントローラは、時点T(M)の後の最初のランダムアクセスポイントまで待機してビットストリーム切換えを実行することができる。
様々な実施形態によれば、上記のスキームを使用して、ストリーミングコントローラは、画像フレーム内の異なるセクションについて、異なる品質を有する符号化データを単一のビットストリーム805に組み込むことができる。複数のビットストリームを送信することに頼るアプローチとは異なり、上記の方式はマルチチャネル同期問題を回避することができる。したがって、ビデオコードストリームを送信するためのシステムレイヤは、例えば、DASH(動的適応ストリーミングオーバーHTTP)、HLS(HTTPライブストリーミング)、MPEG TS(トランスポートストリーム)のシステムプロトコルを使用して同期動作を実行する必要がない。さらに、上記の方式は、各タイルの符号化データの位置が画像フレーム内の各タイルの相対位置に従ってカプセル化されるので、ユーザ機器において複数のチャネルからのデータを組み合わせる必要性を回避することができる。
さらに、インジケータ812を設けてビットストリームと関連付けることができる。様々な実施形態に従って、インジケータ812は、画像フレームのシーケンス内の各画像フレームの特定のセクションに対する符号化予測依存性が前記特定のセクション内に制約されていることを示すことができる。
様々な実施形態では、サーバ側のエンコーダまたはストリーミングコントローラによって提供されるインジケータ812は、デコーダによって受信されるインジケータと同じかまたはそれに関連することができ、すなわち、インジケータは、符号化予測依存性と復号予測依存性のいずれをも示すことができる。
図10は、本発明の様々な実施形態による、スライスに基づく例示的な画像分割方式を示す図の例である。図10 (a)および図10(b)に示すように、ビデオ内の画像フレーム(またはピクチャ)を分割するためにいくつかのスライスを使用することができる。
様々な実施形態において、スライスは、独立したスライスセグメントで始まり、各画像フレームにおいて次の独立したスライスセグメントに先行する0個以上の後続の従属スライスセグメントを含む一連のスライスセグメントであり得る。代替的に、スライスは、一連のコーディングブロックまたは一連のコーディングブロックペアであり得る。
様々な例では、スライスをビデオコーディングに使用することができる。例えば、画像フレームは水平方向に1つのスライスのみを許容する(すなわち、分割は垂直方向には実行され得ない)。同じ画像フレーム内の異なるスライス内のデータを相互参照し予測することはできない(ただし、同じ画像内の異なるタイルの境界を横切ってフィルタリング操作を実行することはできる)。フィルタリング動作は、デブロッキング、サンプル適応オフセット(SAO)、適応ループフィルタ(ALF)などを含む。
図10(a)に示す例では、画像は3つのスライス(または領域)に分割することができる。各スライスは異なる品質で符号化することができる。様々な例では、符号化品質は定量的または定性的のいずれかで定義することができる。例えば、符号化品質は、「高」、「中」および「低」のうちの1つとして定義されてもよい(それぞれが定量的尺度に関連付けられてもよい)。代替的に又は付加的に、符号化品質は、数字、文字、英数字列、又は他の適切な表現によって表すことができる。様々な例では、符号化品質は、さまざまなコーディング客観的尺度、主観的尺度、およびさまざまなサンプリング比(または解像度)を指すことがある。
図10(a)に示すように、スライス2、すなわち領域(1,0)はビューポートによって覆われる。したがって、スライス2は、「高」品質を割り当てられてもよい。さらに、スライス1および3、すなわち領域(0,0)および(2,0)は、ビューポートに対応する領域(1,0)に隣接している。したがって、これらの領域は「中」品質でエンコードできる。
代替的に、図10(b)に示す例では、画像を2つの部分または領域に分割することができる。各セクションは異なる品質で符号化され、符号化品質は「高」、「中」および「低」のうちの1つとして定義され得る。図10(b)に示されるように、セクションB(例えばスライス)はビューポートによって覆われる。したがって、セクションBは「高」品質を割り当てられてもよい。さらに、セクションBを囲むセクションAは、「低」または「中」の品質で割り当てられてもよい。
図11は、本発明の様々な実施形態による、ビデオストリーミングをサポートするための画像フレームシーケンスの符号化を示す図の一例である。図11に示すように、画像シーケンス1101を符号化し、サーバ1100内にビットストリーム1102として格納することができる。ここで、各ビットストリームは、サーバ側の単一のセクションに対して特定の品質を備えることができる。例えば、格納されたビットストリーム1111は、画像シーケンス1101内のセクション1についての品質A(例えば、「高」)を有する符号化データに対応する。
図11に示すように、画像シーケンス1101内の画像フレーム(すなわちビデオ)は3つのセクションに分割することができ、各セクションは3つの品質(例えば「高」、「中」または「低」)で符号化できる。例えば、符号化は、H.264/AVC、H.265/HEVC、AVS1−P2、AVS1−P2などのような様々なビデオコーデック規格に基づくことができる。
様々な実施形態によれば、各ビットストリームは独立して復号されることが可能である。例えば、各ビットストリームは、独立ビデオパラメータセット(VPS)情報、独立シーケンスヘッダ情報、独立シーケンスパラメータセット(SPS)情報、独立ピクチャヘッダ情報、または別個のピクチャパラメータセット(PPS)パラメータを含み得る。
図12は、本発明の様々な実施形態による、スライスを使用してビデオストリーミングにおけるビットストリーム切換えをサポートすることを示す図の一例である。図12に示すように、スライスベースの分割方式1202を使用して、一連の画像フレーム1201の中の画像フレーム1211を複数のスライス(例えばスライス1〜3)に分割することができる。さらに、ストリーミングコントローラは、画像フレーム1211内の各スライスについて符号化品質1203を決定することができる。さらに、ストリーミングコントローラは、サーバに格納されたビットストリームから、画像フレーム1211の各タイルについて決定された符号化品質を有する符号化データ1204を取得することができる。次いで、ストリーミングコントローラは、所定の順序に従って、送信のために第1の画像フレームの複数のセクションの符号化データ1204をビットストリーム1205に組み込む(例えばカプセル化する)ことができる。場合によっては、所定の順序は、一連の画像フレーム内の各特定のセクション(たとえばスライス)の相対位置に基づいて構成することができる。
様々な実施形態に従って、ストリーミングコントローラは、ユーザ機器(UE)のビューポートに従って、送信される必要がある画像フレーム内の各セクションに対して、記憶されたビットストリームから符号化データを動的に選択することができる。
図13(a)を参照すると、スライス2、すなわちスライス(1,0)は、時点T(N)におけるビューポート1211に対応する。したがって、スライス2は、「高」品質(H)を割り当てられてよい。さらに、スライス1および3のそれぞれに「中」品質(M)を割り当てることができる。
画像フレーム1211内の各スライスに対応する符号化品質を決定した後、ストリーミングコントローラは、サーバ内に記憶された対応するビットストリームから、画像フレーム1211内の各スライスについて所望の品質を有する符号化データを取得することができる。例えば、図13(a)に示す例では、ストリーミングコントローラは高品質のビットストリームからスライス2の符号化データを取得することができ(例えば図11の1110)、ストリーミングコントローラは、中品質のビットストリーム(例えば図11の1120)からスライス1および3のための符号化データを取得することができる。
次いで、ストリーミングコントローラは、異なるスライスについて取得された符号化データを送信用のビットストリーム1205にカプセル化することができる。様々な例では、各スライスの符号化データは、所定の順序に従ってカプセル化することができる。例えば、所定の順序は、画像内の上から下への順序を指すラスタ走査順序に基づいて構成することができる。
様々な実施形態によれば、ビューポートに基づくビデオストリーミングアプローチは、視聴における主観的な経験を考慮しながら、360度のビデオまたは大きなFOVを有するビデオについて送信されるデータを効果的に削減することができる。一方、ビューポートが変化すると、すなわち人間の視覚が動くと、ビューポートに対応する画像セクションも変化する可能性がある。
様々な実施形態によれば、ストリーミングコントローラは、ビデオストリーミングにおける送信のためのビットストリーム1205を生成するために使用される各分割セクションについての異なる品質のビットストリーム間で動的に調整を行うことができる。例えば、ストリーミングコントローラは、第2の画像フレームに関するビューポート情報を受信することがある。ここで、第2の画像フレーム用のビューポート情報は、第2の画像フレーム用のビューポートの位置を示すことができる。第2の画像フレームは、一連の画像フレームの中で第1の画像フレームをたどり、第1の画像フレームに対するビューポートの位置は、第2の画像フレームに対するビューポートの位置とは異なる。
図13(b)を参照すると、T(M)の時点で、ビューポート1212はスライス1、すなわちスライス(0、0)にシフトすることができる。ストリーミングコントローラは、画像フレーム内の各スライスについて符号化品質を調整することができる。図13(b)に示すように、スライス1には「高」品質(H)が割り当てられている。さらに、スライス2に「中」の品質(M)を割り当てることができ、スライス3は「低」品質(L)で割り当てることができる。
したがって、ストリーミングコントローラは、時点T(M)以降にビットストリーム切換えを実行することができる。画像フレーム内の各スライスに対応する符号化品質を決定した後、ストリーミングコントローラは、サーバ内で記憶された対応するビットストリームから、画像フレーム内の各スライスについて所望の品質を有する符号化データを取得することができる。例えば、図13(b)に示す例では、ストリーミングコントローラは、高品質のビットストリームからスライス1の符号化データを取得することができる(例えば、図11の1110)。また、ストリーミングコントローラは中品質のビットストリームからスライス2の符号化データを取得することができ(例えば図11の1120)、さらに、ストリーミングコントローラは低品質のビットストリームからスライス3の符号化データを取得することができる(例えば図11の1130)。
様々な例では、ビットストリーム切換えはランダムアクセスポイントで実行され得る。例えば、ランダムアクセスポイントは、瞬時復号リフレッシュ(IDR)ピクチャ、クリーンランダムアクセス(CRA)ピクチャ、シーケンスヘッダ、シーケンスヘッダ+1フレームなどであり得る。
図13(b)に示すように、時点T(M)でビューポートの位置が変化した後、ストリーミングコントローラは時点T(M)の後の最初のランダムアクセスポイントでビットストリーム切換えを実行することができる。例えば、ストリーミングコントローラは、第2の画像フレームがビットストリーム内の符号化データを復号するためのランダムアクセスポイントである場合、第2の画像フレームについて受信したビューポート情報に基づいて第2の画像フレーム内の各セクションの符号化品質を決定することができる。そうでなければ、ストリーミングコントローラは、第1の画像フレーム内の対応するセクションの符号化品質に基づいて第2の画像フレーム内の各セクションの符号化品質を決定することができる。ビットストリームそのような場合、ストリーミングコントローラは、時点T(M)の後の最初のランダムアクセスポイントまで待機してビットストリーム切換えを実行することができる。
様々な実施形態によれば、上記のスキームを使用して、ストリーミングコントローラは、画像フレーム内の異なるセクションについて、異なる品質を有する符号化データを単一のビットストリーム1205に組み込むことができる。複数のビットストリームを送信することに頼るアプローチとは異なり、上記の方式はマルチチャネル同期問題を回避する。したがって、ビデオコードストリームを送信するためのシステムレイヤは、例えば、DASH(HTTPに亘る動的適応ストリーミング)、HLS(HTTPライブストリーミング)、MPEG TS(トランスポートストリーム)のシステムプロトコルを使用して同期化動作を実行する必要がない。さらに、上記の方式は、各タイルの符号化データの位置が画像フレーム内の各タイルの相対位置に従ってカプセル化されるので、ユーザ機器において複数のチャネルからのデータを組み合わせることを回避することができる。
さらに、インジケータ1212を設けてビットストリームと関連付けることができる。様々な実施形態に従って、インジケータ1212は、画像フレームのシーケンス内の各画像フレームの特定のセクションに対する符号化予測依存性が前記特定のセクション内に制約されていることを示すことができる。
様々な実施形態では、サーバ側のエンコーダまたはストリーミングコントローラによって提供されるインジケータ1212は、デコーダによって受信されるインジケータと同じかまたはそれに関連づけられることができ、すなわち、インジケータは符号化および復号化の双方の予測依存性を示すことができる。
図14は、本発明の様々な実施形態による、ビットストリーム切換えをサポートする例示的ビデオストリーミング環境を示す図の一例である。図14に示すように、ビデオストリーミング環境1400において、ビデオ1410をサーバ側(例えばストリーミングサーバ1401)から端末側(例えばユーザ機器(UE)1402)にストリーミングすることができる。
様々な実施形態に従って、サーバ側で、エンコーダ1408は、ビデオ1410内の一連の画像フレームをエンコードし、エンコードされたデータと共に様々なビットストリーム1404を記憶装置1403に格納することができる。例えばパノラマまたはワイドビュービデオなどのビデオ1410は、広い視野(FOV)を有する一連の画像フレーム(またはピクチャ)を含むことができる。ビデオ1410内の個々の画像フレームを複数のセクションに分割するために、異なるタイプの分割方式を使用することができる。分割方式は、例えば、個々の画像フレームをタイルもしくはスライス、またはビデオの符号化および復号化において有益である他の任意の幾何学的分割に分割することができる。様々な例では、ビデオ1410内の個々の画像フレームは、同じまたは実質的に同様の方法で分割することができる。例えば、ビデオ1410内の各画像フレームは、同じ数のセクションに分割することができる。また、異なる画像フレーム内の対応するセクションは、同じまたは実質的に同様の相対位置に配置することができ、同じまたは実質的に同様の幾何学的サイズで構成することができる。
様々な実施形態によれば、画像フレームを分割する複数のセクションのうちの個々のセクションは、複数レベルの符号化品質で構成することができる。例えば、サーバ側では、画像フレームを分割する複数のセクションの各々は、複数レベルの符号化品質で構成することができる。ユーザ機器(UE)側では、画像フレームを分割する複数のセクションのそれぞれは、複数レベルの復号品質を用いて構成することができる。様々な実施形態では、符号化品質および復号化品質は、同じに、または関連する所定の相関を使用して構成され得る。他の実施形態では、符号化品質および復号化品質は別々にかつ独立して構成されてもよい。
様々な実施形態によれば、サーバ側で、ビデオ1410内の画像フレーム内の個々のセクションの符号化品質は、関心領域(ROI)情報などのユーザ選好情報に基づいて決定することができる。代替的または追加的に、画像フレーム内の個々のセクションの符号化品質は、画像フレーム内のビューポートの位置を示す情報などのビューポート情報に基づいて決定することができる。様々な実施形態において、ビューポートに対応する画像フレーム内のセクションは、ビューポートの外側に位置する画像フレームの他のセクションよりも高いレベルの符号化品質を有するように構成され得る。
様々な実施形態に従って、エンコーダ1408は、図1に示されるような符号化プロセスを利用することができる。例えば、エンコーダ1408は、ビデオ1410内の一連の画像フレームを、異なる符号化品質を有する複数のビットストリームに符号化することができる。異なるビットストリームを生成するために、様々な符号化ステップを複数の符号化動作間で共有することができる。例えば、エンコーダ1408は、異なる符号化品質を有する様々なビットストリームを生成するために(例えば、異なる量子化パラメータを使用して)異なる量子化ステップ104を使用しながら、同じ予測ステップ102および変換ステップ103を使用できる。
図14に示すように、サーバ側では、ビデオ1410内の一連の画像フレームに対する複数のビットストリーム1404を記憶装置1403に記憶することができる。様々な例では、格納された個々のビットストリームは、一連の画像フレーム内の特定のセクションに対する特定のレベルの符号化品質を有する符号化データを含み得る。
ユーザ機器(UE)側では、ビデオ1410内の画像フレームのシーケンスのための符号化データを含むビットストリーム1411を処理するためにデコーダ1406を使用することができる。デコーダ1406は、ビットストリーム1411内のバイナリデータをデコードし、それに応じて画像フレームを再構成してから、再構成された画像フレームをディスプレイ1407に提供して表示し、あるいはユーザ(例えばビューア)によって表示される。一方、ユーザ機器(UE)1402、またはユーザ機器(UE)1402の構成要素(例えば、ディスプレイ1407)は、更新されたユーザ情報(例えば、ユーザの視界が動き回るときに更新されたビューポート情報)を取得することができる。そのような更新されたユーザ情報をストリーミングサーバ1401に返す。これにより、ストリーミングコントローラ1405は、ビットストリーム1411を再構成してユーザ機器(UE)1402に送信することができる。例えば、ストリーミングコントローラ1405は、ビットストリーム切換え1420を実行することによってビットストリーム1411を再構成することができる。
様々な実施形態によれば、ストリーミングコントローラ1405は、ユーザ機器(UE)1402へのビデオ1410のストリーミングを制御することを担当することができる。いくつかの事例では、ストリーミングコントローラ1405は、エンコーダまたはエンコーダの構成要素とすることができる。いくつかの事例では、ストリーミングコントローラ1405は、エンコーダを含み得るか、またはエンコーダと一緒に機能し得る。ストリーミングコントローラ1405は、ユーザ機器(UE)1402からユーザ情報1412、例えばユーザ視点情報を受信することができる。例えば、そのようなユーザ視点情報は、ユーザによる視聴領域を示すビューポート情報を含むことができる。次に、ストリーミングコントローラ1405は、受信したユーザ情報1412に基づいて、ビットストリーム1411を作成する(または別のコンポーネントに作成を指示する)ことができる。例えば、ビットストリーム1411は、記憶装置1403内に格納された適切なビットストリーム1404を選択して組み合わせることに基づいて作成することができる。次に、ビットストリーム1411は、最適な視聴体験を提供し達成するためにユーザ機器(UE)1402に送信されることができる。
様々な実施形態によれば、ストリーミングコントローラ1405は受信したユーザ情報に基づいてビットストリーム切換え1420を実行することができる。例えば、視聴者が見回すと、サーバ側で受信されたユーザ情報1412はビューポートの変更を示すことができる。ストリーミングコントローラ1405は、それに応じてストリーム1411内の画像の各セクションについて所望の符号化品質を決定することができる。次に、ストリーミングコントローラ1405は、記憶装置1403内の格納されたビットストリームから、個々の画像フレーム内の様々なセクションに対する所望の符号化品質を有する符号化データを取得(例えば選択)し、これら取得した情報をビットストリーム1411に組み込んでUE1402へ送信することができる。
様々な実施形態によれば、エンコーダ1408およびデコーダ1406のいずれにおいても、ビットストリーム切換え1420が実行される前の画像フレームとビットストリーム切換え1420が実行された後の画像フレームとの間の望ましくない符号化依存性(例えばフレーム間符号化依存性)が生じることを排除するため、事前に決定されたまたは動的に決定される様々な切換え点でビットストリーム切換え1420が実行され得る。様々な実施形態では、ランダムアクセスポイントピクチャの符号化および復号化は一般に別の画像フレームに依存しないため、これらの切換えポイントは様々なコーデック規格で定義されているランダムアクセスポイントとすることができる。例えば、ランダムアクセスポイントピクチャは、瞬時復号リフレッシュ(IDR)ピクチャ、クリーンランダムアクセス(CRA)ピクチャ、シーケンスヘッダ、シーケンスヘッダ+1フレームなどであり得る。
様々な実施形態に従って、上記のスキームを使用して、ストリーミングコントローラ1405は、画像フレームの異なるセクションのための符号化データをビットストリーム1411に組み込むことができる。符号化データは、異なる符号化品質で構成され得る(すなわち、ビットストリーム1411内の画像フレーム内の異なるセクションは、異なるレベルの符号化品質を有し得る)。複数のビットストリームを送信することに頼るアプローチとは異なり、上記の方式はマルチチャネル同期を回避する。例えば、ビデオストリームを送信するためのシステムのレイヤは、例えば、HTTP上の動的適応ストリーミング(DASH)、HTTPライブストリーミング(HLS)、MPEGトランスポートストリーム(TS)などの様々なシステムプロトコルを使用して、同期動作を実行する必要はない。さらに、符号化画像フレーム内の各セクションの位置情報は、画像フレーム内の各セクションの相対位置に従ってカプセル化することができる。したがって、上記の方式は、UE1402において複数のチャネルからの符号化データを組み合わせるためのステップを回避することができる。
様々な実施形態によれば、ビットストリーム切換え1420はランダムアクセスポイントで実行され得る。例えば、システムは、ランダムアクセスポイントの前に先行符号化品質を有する符号化データを選択し、ランダムアクセスポイントの後に後続符号化品質を有する符号化データを選択することができる。次いで、システムは、選択された符号化データ(ランダムアクセスポイントの前の先行符号化品質を有する符号化データおよびランダムアクセスポイントの後の後続符号化品質を有する符号化データを含む)をビットストリーム1411に組み込んでユーザ機器(UE)1402へ送ることができる。
様々な実施形態によれば、ランダムアクセスポイントは、瞬間復号リフレッシュ(IDR)ピクチャを挿入するために使用され得る。様々な実施形態では、IDRピクチャはフレーム内予測に基づいて符号化することができる。したがって、IDRピクチャのための符号化データの量は、フレーム間予測を使用して符号化された画像フレーム(たとえば、挿入されたIDRピクチャの前の画像フレームまたはこれに引き続く画像フレーム)のための符号化データの量よりはるかに多くなり得る。さらに、例示的なビットストリーム切換え手法は、視野角に従って分割され得る画像フレーム内のすべての領域またはセクションが同時にビットストリーム切換えを実行することを必要とし得る(すなわち、すべてのエリアまたはセクションは、視点の変化と同時に符号化するためにフレーム間予測に依存し得る)。その結果、ビットストリームの切換えを行うために必要なビットストリームデータの量は、切換え直前のビットストリームデータの量よりもかなり多くなる可能性がある。大量のストリームデータを、例えば安定した(または一定の)チャネルを介してディスプレイに伝送する必要があるため、IDRピクチャの表示にかなりの遅延を引き起こす可能性がある。したがって、視聴者が視点を変更した後、システムが正しいビットストリームを対応する各視点に切換えるのにかなりの時間がかかる可能性があり、これは視聴経験に悪影響を及ぼす可能性がある。
さらに、視聴者が視点を変更した後、ビデオ1410内の次のIDRピクチャが到着したときにビットストリーム切換え1420を実行することができる。サーバ側では、IDRフレームは定期的に(例えば、先行設定されたまたは動的に決定された時間間隔で)挿入されて、いつでも起こり得る視点の変化に対応することができる。このような時間間隔は、システム全体のパフォーマンスとユーザの視聴体験に大きな影響を与える可能性がある。IDR画像挿入の間の時間間隔が短ければ、ビットストリーム切換えは頻繁に実行され得る。結果として、圧縮ビデオコードストリームは比較的大きいサイズを有することがある。IDR画像挿入の時間間隔が長いと、圧縮ビデオコードストリームのデータ量は少なくなるが、ユーザが視点を変えたときに対応するIDR画像コードストリームが切り替わるまでにかなりの遅延が生じる可能性がある。これはユーザ体験に悪影響を及ぼす可能性がある。
様々な実施形態によれば、ビットストリーム切換えの実行に起因してIDR画像を伝送するためのデータ量が増加することによって引き起こされる遅延を低減するために、分散型IDRピクチャ伝送技術を使用することができる。図14に示すように、サーバ側では、システムは分散型IDR画像転送技術をサポートするために様々な符号化戦略1409を採用することができる。例えば、エンコーダ1408は、伝送されるデータの最大量を減らすことができるように、異なる時点(またはフレーム)でIDRピクチャの異なる領域またはセクションを符号化するように構成することができる。したがって、システムは、さまざまな伝送ボトルネックポイントでの大幅な遅延を減らすことができる。さらに、IDRピクチャ挿入サイクル(または期間)は、異なる領域の重要性に従って、特定の視点の対応する領域に対して生成されるデータ量をさらに減らすように構成することができる。また、IDRピクチャ挿入サイクルは、ビデオ製作者の意図に従ってコンテンツを正確に伝えるために、ユーザの注意(すなわち視点)を導くように構成することができる。
図15は、本発明の様々な実施形態による、タイルに基づくビデオストリーミングにおける配信型IDRピクチャ送信のサポートを示す。図15に示されるように、ビデオストリーム内の個々の画像フレーム1520は、領域などの複数のセクションに分割され得る。例えば、各領域は、様々なビデオコーデック規格に従って1つまたは複数のタイルを含むことができる。様々な実施形態において、画像フレーム1520内の各領域は、異なる符号化品質を有する複数のビットストリームに対応し得る。
様々な実施形態に従って、格納されたビットストリーム1510は、異なる領域に対応する様々なビットストリームグループを含むことができる。図15に示すように、画像フレーム1520内の異なる領域を異なるビットストリームグループに関連付けることができる。例えば、画像フレーム1520内のタイル1はビットストリームグループ1512に関連付けることができる。画像フレーム1520内のタイル2は、ビットストリームグループ1511と関連付けることができる。画像フレーム1520内のタイル5は、ビットストリームグループ1513と関連付けることができる。各ビットストリームグループ、例えばビットストリームグループ1511〜1513は、異なる符号化品質、例えば高(C)、中(B)、および低(A)を有する様々なビットストリームを含むことができる。また、ビットストリームグループ、例えばビットストリームグループ1511〜1513のそれぞれは、様々なランダムアクセスポイントに周期的に挿入され得るIDRピクチャを含み得る。
様々な実施形態に従って、システムは、異なる領域に対して異なるIDRピクチャ挿入サイクルを構成することができる。領域に関連するIDRピクチャ挿入サイクルは、事前に決定されても動的に決定されてもよい特定の間隔で対応するIDRピクチャ部分を挿入するように構成されてもよい。例えば、タイル2に対応するビットストリームグループ1511は、第1の間隔1521を使用して構成され得る。タイル1に対応するビットストリームグループ1512は、第2の間隔1522を使用して構成され得る。タイル5に対応するビットストリームグループ1513は、第3の間隔1523を使用して構成され得る。さらに、画像フレーム1520内の他の様々な領域に対応するより多くのビットストリームグループがあり得る。
様々な実施形態によれば、異なる領域に対応するIDRピクチャ部分は、異なる時点(またはフレーム)で挿入されるように構成することができる。図15に示すように、異なる領域に対するIDR画像挿入サイクル1521〜1523は、(例えば、互いからのオフセットを用いて)異なるように構成することができ、したがってIDR画像挿入は任意の所与の瞬間に1つ以下の領域に対して実行され得る。言い換えれば、領域に対するビットストリーム切換え操作が実行されるとき、システムは、任意の所与の瞬間に、特定の領域に対応するIDRピクチャの一部分のみがビットストリームにおいて伝送され得ることを保証することができる。他の領域に対応するストリーム内のデータは、非IDR画像(すなわち、フレーム間予測を使用して符号化された画像)の一部である。このようにして、システムはボトルネック点での伝送データ量を大幅に削減することができる。
図16は、本発明の様々な実施形態による、スライスに基づくビデオストリーミングにおける配信型IDRピクチャ伝送のサポートを示す。図16に示されるように、ビデオストリーム内の個々の画像フレーム1620は、領域などの複数のセクションに分割され得る。例えば、各領域は、様々なビデオコーデック規格に従って1つまたは複数のスライスを含むことができる。様々な実施形態において、画像フレーム1620内の各領域は、異なる符号化品質を有する複数のビットストリームに対応し得る。
様々な実施形態によれば、記憶されたビットストリーム1610は、異なる領域に対応する様々なビットストリームグループを含むことができる。図16に示すように、画像フレーム1620内の異なる領域を異なるビットストリームグループに関連付けることができる。例えば、画像フレーム1620内のスライス1はビットストリームグループ1611に関連付けることができる。画像フレーム1620内のスライス2は、ビットストリームグループ1612と関連付けることができる。画像フレーム1620内のスライス3は、ビットストリームグループ1613と関連付けることができる。各ビットストリームグループ、例えばビットストリームグループ1611〜1613は、異なる符号化品質、例えば高 (C)、中(B)および低(A)のビットストリームを含むことができる。また、ビットストリームグループ、例えばビットストリームグループ1611〜1613のそれぞれは、様々なランダムアクセスポイントに周期的に現れるIDRピクチャを含む(または挿入される)ことができる。
様々な実施形態に従って、システムは、異なる領域に対して異なるIDRピクチャ挿入サイクルを構成することができる。特定の領域に関連する各IDRピクチャ挿入サイクルは、IDRピクチャの対応する部分を挿入するための間隔で構成され得る。図16に示されるように、スライス1に対応するビットストリームグループ1611は、第1の間隔1621を使用して構成され得る。スライス2に対応するビットストリームグループ1612は、第2の間隔1622を使用して構成され得る。スライス3に対応するビットストリームグループ1613は、第3の間隔1623を使用して構成され得る。さらに、画像フレーム1620内の様々な他の領域(図示せず)に対応する、より多くのビットストリームグループがあり得る。
様々な実施形態によれば、異なる領域に対するIDRピクチャの対応する部分の挿入は、異なる時点(またはフレーム)で発生するように構成することができる。図16に示すように、異なる領域に対するIDR画像挿入サイクル1621〜1623は互いにオフセットしているので、IDR画像挿入は任意の所与の時点で限られた数の領域(例えば1つ以下の領域)に対して実行することができる。言い換えれば、ある領域に対するビットストリーム切換え操作が実行されるとき、システムは、任意の所与の時点で、特定の領域に対応するIDRピクチャの一部のみがビットストリームにおいて伝送され得ることを保証され得る。他の領域に対応するストリーム内の符号化データは、非IDR画像(すなわち、フレーム間予測を使用して符号化された画像)の一部である。このようにして、システムはボトルネック点での伝送データ量を大幅に削減することができる。
様々な実施形態によれば、プログレッシブビットストリーム切換え技術を採用することができる。例えば、プログレッシブビットストリーム切換え技術は、分散型IDRピクチャ伝送技術と共に採用されてもよい。システムは、異なる領域間で最適な帯域幅割り当てを達成するために、異なる領域に対して異なるようにIDRピクチャ挿入サイクルを構成することができる。一例では、異なる領域に異なる重要度を割り当てることができ、これを異なる領域のIDRピクチャ挿入サイクルを設定するための基準として使用することができる。別の例では、プログレッシブビットストリーム切換え技術は、ビデオプロデューサの意図に従って視聴者の注意を向けるために、ビデオプロデューサの意図に従って重要度を設定することができる。
様々な実施形態によれば、復号化プロセスにおいて画像データをリフレッシュするためのサイクルを制御するためにIDRピクチャ挿入サイクルを画像内の異なる領域に対して異なるように構成することができ、それが今度は、領域ごとに伝送される必要がある符号化ビットストリームデータの量に影響を及ぼす。したがって、IDRピクチャ挿入周期が短いほど、より多くの画像がフレーム内予測を使用して符号化され、その結果、符号化プロセスは大量のコードストリームデータを生成することができる。様々な実施形態に従って、異なる領域に対する帯域幅の割り当ては、IDRピクチャを挿入するための期間に従って制御され得る。例えば、重要度の低い領域よりも重要度の高い領域ほど多くの帯域幅を消費できることが好ましい。これにより、ユーザが視点を重要度の低い領域から重要度の高い領域に変更した場合に、重要領域をより短い符号化品質の画像に素早く切換えることができるように、重要領域をより短いIDR画像挿入期間で設定することができる。
様々な実施形態によれば、プログレッシブコードストリーム切換え技術は、ビットストリーム切換えが発生した場合でもスムーズなデータストリーム伝送を保証することができる。異なる領域のビットストリームはプログレッシブ方式で切換えることができる。これにより、任意の時点での伝送帯域幅への影響を確実に制御できる。
図17は、本発明の様々な実施形態による、異なるタイルに関連する重要度評価に基づいてIDRピクチャ挿入サイクルを構成することを示す図の例である。図17(a)および(b)に示すように、画像フレームは複数の部分(例えばタイル1〜9)に分割することができる。さまざまなセクションを構成したり、さまざまな重要度を割り当てたりすることができる。
図17(a)に示す例では、パノラマ図または広角図(例えば、タイル5)の前面または中央領域を高い重要度で構成することができる。他方、後部または周辺領域(例えば、タイル1、3、7および9)は、低い重要度で構成することができる。さらに、他の領域(例えば、タイル3、4、6および8)は、中重要度格付けで構成することができる。対応して、タイル1〜9の各々は、重要度に基づくIDR画像挿入サイクルで構成することができる。例えば、タイル5は最短のIDRピクチャ挿入サイクルで構成することができる。タイル1、3、7および9は、最長のIDRピクチャ挿入サイクルで構成することができる。また、タイル3、4、6および8)は、中程度のIDRピクチャ挿入サイクルで構成することができる。
図17(b)に示す例では、ビデオ製作者は視聴者の注意をビデオの上半分に向けたいと思うかもしれない。従って、タイル2は高い重要度で構成することができる。また、周囲の領域(タイル1、3、4、5、6など)は、中重要度で設定できる。さらに、底部(例えば、タイル7、8および9)は、低い重要度評価で構成することができる。対応して、タイル1〜9のそれぞれは、重要度に基づくIDR画像挿入期間を用いて構成することができる。例えば、タイル2は、最短のIDRピクチャ挿入サイクルで構成することができる。タイル1、3、4、5および6は最長のIDRピクチャ挿入サイクルで構成することができる。そして、タイル7、8および9は、中程度のIDRピクチャ挿入サイクルで構成することができる。
図18〜図19は、図17(a)に示されるような例示的な構成に基づいてサーバ側でビットストリーム切換えを実行することを示す図の一例である。例えば、タイル5は最短のIDRピクチャ挿入サイクルで構成することができる。タイル1、3、7および9は、最長のIDRピクチャ挿入サイクルで構成することができる。また、タイル2、4、6および8は、中程度のIDRピクチャ挿入サイクルで構成することができる。
様々な実施形態によれば、記憶されたビットストリーム1810は、異なるタイルに対応する様々なビットストリームグループを含むことができる。画像フレーム1820内の異なるタイルは、異なるビットストリームグループに関連付けることができる。例えば、画像フレーム1820内のタイル1はビットストリームグループ1812と関連付けることができる。画像フレーム1820内のタイル2は、ビットストリームグループ1811と関連付けることができる。画像フレーム1820内のタイル5は、ビットストリームグループ1813と関連付けることができる。各ビットストリームグループ、例えばビットストリームグループ1811〜1813は、異なる符号化品質、例えば高(C)、中(B)および低(A)のビットストリームを含むことができる。また、ビットストリームグループ、例えばビットストリームグループ1811〜1813のそれぞれは、様々なランダムアクセスポイントに周期的に現れるIDRピクチャを含む(またはそれと共に挿入される)ことができる。
図18に示すように、ビューポートは最初にタイル2に位置してもよい(例えば、ユーザがビューの上部に焦点を合わせているとき)。したがって、タイル2に表示するために(例えば、記憶装置から)高い符号化品質を有する符号化データを選択することができる。さらに、中程度の符号化品質を有する符号化データをタイル1、3および5に対して選択することができる。タイル4、6、7、8および9については、中程度の符号化品質を有する符号化データを選択することができる。
次に、図19に示すように、瞬間T(M)にイベントが発生することがあり、それがビットストリームの切換えをトリガする。たとえば、視聴者がビューポートをビューの上部からビューの前部に移動するときなど、視点がタイル2からタイル5に移動すると、システムはそれに応じて各タイルの符号化品質を更新することができる。
分散IDR画像伝送技術を使用して、ビットストリームの切換えは、異なるタイルに対して別々に実行され得る。様々な実施形態において、ビットストリームの切換えは、各タイルに対するIDRピクチャの対応する部分が到着する順序で各タイルに対して実行されてもよい。図19に示す例では、タイル5のIDRピクチャ部分が最初に到着し、次いでシステムは他のタイルの前にタイル5のビットストリーム切換え1911を実行することができる。IDRピクチャ部分の到着の順序に従って、システムは他の領域に対して漸進的にビットストリーム切換えを実行することができる。例えば、タイル2のIDRピクチャ部分は、タイル1のIDRピクチャ部分の前に到着する。そして、タイル2のビットストリームの切換え1913は、タイル1のビットストリームの切換え1912の前、タイル5のビットストリームの切換え1911の後に行われてもよい。ビットストリームの切換えの結果として、高い符号化品質を有する符号化データをタイル5に対して選択することができる。中程度の符号化品質を有する符号化データは、領域2、4、6および8に対して選択することができる。そして、低程度の符号化品質を有する符号化データを領域1、3、7および9に対して選択することができ、それは視聴体験を最適化する。
図20〜図21は、図17(b)に示されるような例示的な構成に基づいてサーバ側でビットストリーム切換えを実行することを示す図の例である。例えば、タイル2は、最短のIDRピクチャ挿入サイクルで構成することができる。のIDRピクチャ挿入サイクルで構成することができる。タイル1、3、4、5および6は、低程度のIDRピクチャ挿入サイクルで構成することができる。そして、タイル7、8および9は、最長のIDRピクチャ挿入サイクルで構成することができる。
様々な実施形態によれば、記憶されたビットストリーム2010は、異なるタイルに対応する様々なビットストリームグループを含むことができる。画像フレーム2020内の異なるタイルは、異なるビットストリームグループに関連付けることができる。例えば、画像フレーム2020内のタイル1は、ビットストリームグループ2012と関連付けることができる。画像フレーム2020内のタイル2は、ビットストリームグループ2011に関連付けることができる。画像フレーム2020内のタイル5は、ビットストリームグループ2013に関連付けることができる。例えばビットストリームグループ2011〜2013のようなビットストリームグループの各々は、異なる符号化品質、例えば高(C)、中(B)および低(A)のビットストリームを含むことができる。また、ビットストリームグループ2011〜2013などのビットストリームグループのそれぞれは、様々なランダムアクセスポイントに周期的に現れるIDRピクチャを含む(またはそれとともに挿入される)ことができる。
図20に示されるように、ビューポートは最初にタイル5に位置し(例えば、ユーザがビューの前部に焦点を合わせているとき)、その後、タイル5で表示するために高符号化品質の符号化データが(例えば記憶装置から)選択され得る。さらに、中程度の符号化品質を有する符号化データをタイル2、4、6および8に対して選択することができる。また、タイル1、3、7、9については、符号化品質の低い符号化データを選択することができる。
図21に示されるように、イベントが瞬間T(M)に発生することがあり、それがビットストリームの切換えをトリガする。例えば、ビューポイントがタイル5からタイル2に移動すると、例えば視聴者がビューポートをビューの前部からビューの上部にビデオプロデューサの意図どおりに移動させると、それに応じてシステムは各タイルの符号化品質を更新することができる。
分散IDR画像伝送技術を使用して、ビットストリームの切換えは、異なるタイルに対して別々に実行され得る。図21に示されるように、各タイルに対するIDRピクチャのそれぞれの部分が到着する順序で各タイルに対してビットストリーム切換えが実行されてもよい。図21に示される例では、タイル2のIDRピクチャ部分が最初に到着し、次いでシステムは他のタイルの前にタイル2のビットストリーム切換え2111を実行することができる。IDRピクチャ部分の到着の順序に従って、システムは他の領域に対して漸進的にビットストリーム切換えを実行することができる。例えば、タイル5のIDRピクチャ部分は、タイル2のIDRピクチャ部分の後に到着する。そして、タイル2のビットストリーム切換え2111の後に、タイル5のビットストリーム切換ええ2112を行ってもよい。また、タイル7の符号化品質は変化しないので、タイル7のビットストリームの切換えは不要である。ビットストリームの切換えの結果として、高い符号化品質を有する符号化データをタイル2に対して選択することができる。タイル1、3、4、5および6に対しては、中程度の符号化品質を有する符号化データを選択することができる。そして、低程度の符号化品質を有する符号化データをタイル7、8および9に対して選択することができ、それにより視聴体験が最適化される。
上記の例に示されるように、プログレッシブビットストリーム切換え技術を分散IDR画像伝送技術と共に使用することで、システムは、ビットストリーム切換えを実行するための最大帯域幅を減少させながら、重要度の高い領域を大きな遅延なしに迅速にリフレッシュして視聴体験を向上させることができるようにする。
図22は、本発明の様々な実施形態による、異なるスライスに関連する重要度評価に基づいてIDRピクチャ挿入サイクルを構成することを示す図の一例である。図22に示すように、画像フレームは、例えばスライス1〜3のように、複数の部分に分割することができる。さまざまなセクションにさまざまな重要度を割り当てることができる。
図22(a)に示す例では、パノラマビューまたは広角ビューの中央領域(例:スライス2)は、より高い重要度で設定できる。この一方、上部と下部の領域(スライス1とスライス3は)低い重要度で設定できる。対応して、スライス1〜3のそれぞれは、重要度に基づくIDRピクチャ挿入サイクルで構成することができる。例えば、スライス2は最短のIDRピクチャ挿入サイクルで構成することができる。スライス1と3は、より長いIDRピクチャ挿入サイクルで構成できる。
図22(b)に示す例では、ビデオ製作者は視聴者の注意をビデオの上半分に向けることを望むかもしれない。したがって、スライス1は、より高い重要度で構成することができる。他方、残りの領域(例えばスライス2および3)は、より低い重要度で構成することができる。対応して、スライス1〜3のそれぞれは、重要度に基づくIDR画像挿入期間を用いて構成することができる。例えば、スライス1は最短のIDRピクチャ挿入サイクルで構成することができる。スライス2および3は、より長いIDRピクチャ挿入サイクルで構成することができる。
図23〜図24は、図22(a)に示されるような例示的な構成に基づいてサーバ側でビットストリーム切換えを実行することを示す図の例である。例えば、スライス2は最短のIDRピクチャ挿入サイクルで構成することができる。スライス1と3は、より長いIDRピクチャ挿入サイクルで構成できる。
様々な実施形態によれば、記憶されたビットストリーム2310は、異なるタイルに対応する様々なビットストリームグループを含むことができる。画像フレーム2320内の異なるスライスは、異なるビットストリームグループに関連付けることができる。例えば、画像フレーム2320内のスライス1は、ビットストリームグループ2311と関連付けることができる。画像フレーム2320内のスライス2は、ビットストリームグループ2312と関連付けることができる。画像フレーム2320内のスライス3は、ビットストリームグループ2313と関連付けることができる。各ビットストリームグループ、例えばビットストリームグループ2311〜2313は、異なる符号化品質、例えば高(C)、中(B)および低(A)のビットストリームを含むことができる。また、ビットストリームグループ、例えばビットストリームグループ2311〜2313のそれぞれは、様々なランダムアクセスポイントに周期的に現れるIDRピクチャを含む(またはそれと共に挿入される)ことができる。
図23に示すように、ビューポートは最初にスライス1に位置してもよい(例えば、ユーザがビューの上部に焦点を合わせているとき)。したがって、スライス1に表示するために(例えば、記憶装置から)高い符号化品質を有する符号化データを選択することができる。さらに、より低い符号化品質を有する符号化データをスライス2および3に対して選択することができる。
図24に示されるように、イベントが瞬間T(M)に発生することがあり、それがビットストリーム切換えをトリガする。たとえば、視聴者がビューポートをビューの上部からビューの中央部に移動するときなど、視点がスライス1からスライス2に移動すると、システムはそれに応じて各スライスの符号化品質を更新することができる。
分散IDR画像伝送技術を使用して、ビットストリームの切換えは、異なるスライスに対して別々に実行され得る。図24に示されるように、各スライスに対するIDRピクチャのそれぞれの部分が到着する順序で、各スライスに対してビットストリーム切換えが実行されてもよい。例えば、スライス2のIDRピクチャ部分が最初に到着し、次いでシステムは他のスライスの前にスライス2についてビットストリーム切換え2412を実行することができる。次に、他のIDRピクチャ部分の到着の順序に従って、システムは他の領域に対してビットストリームの切換えを漸進的に実行することができる。例えば、スライス1のIDRピクチャ部分はスライス3のIDRピクチャ部分の前に到着する。そして、スライス1のビットストリーム切換え2413は、スライス3のビットストリーム切換え2411の前であってスライス2のビットストリーム切換え2412の後に行ってもよい。したがって、ビットストリームの切換えの結果として、スライス2に対して高い符号化品質を有する符号化データを選択することができる。スライス1および3に対して、より低い符号化品質を有する符号化データを選択することができ、それによって視聴体験が最適化される。
図25〜図26は、図22(b)に示されるような例示的な構成に基づいてサーバ側でビットストリーム切換えを実行することを示す図の例である。例えば、スライス1は最短のIDRピクチャ挿入サイクルで構成することができる。スライス2および3は、より長いIDRピクチャ挿入サイクルで構成できる。
様々な実施形態によれば、記憶されたビットストリーム2510は、異なるタイルに対応する様々なビットストリームグループを含むことができる。画像フレーム2520内の異なるスライスは、異なるビットストリームグループに関連付けることができる。例えば、画像フレーム2520内のスライス1は、ビットストリームグループ2511に関連付けることができる。画像フレーム2520内のスライス2は、ビットストリームグループ2512に関連付けることができる。画像フレーム2520内のスライス3は、ビットストリームグループ2513と関連付けることができる。各ビットストリームグループ、例えばビットストリームグループ2511〜2513は、異なる符号化品質、例えば高(C)、中(B)および低(A)のビットストリームを含むことができる。また、ビットストリームグループ、例えばビットストリームグループ2511〜2513のそれぞれは、様々なランダムアクセスポイントに周期的に現れるIDRピクチャを含む(またはそれと共に挿入される)ことができる。
図25に示すように、ビューポートは最初にスライス2に位置してもよい(例えば、ユーザがビューの前部に焦点を合わせているとき)。したがって、スライス2に表示するために(例えば、記憶装置から)高い符号化品質を有する符号化データを選択することができる。さらに、スライス1および3に対して、より低い符号化品質を有する符号化データを選択することができる。
次に、図26に示すように、瞬間T(M)にイベントが発生することがあり、それがビットストリームの切換えをトリガする。例えば、ビデオ製作者の意図通りに視聴者がビューポートをビューの正面部分からビューの上部部分に移動させた場合、視点はスライス2からスライス1へ移動するので、それに応じてシステムは、各スライスの符号化品質を更新することができる。
分散IDR画像伝送技術を使用し、ビットストリームの切換えは、異なるスライスに対して別々に実行され得る。図26に示されるように、IDRピクチャのそれぞれの部分が到着する順序で個々のスライスに対してビットストリームの切換えが実行されてもよい。図26に示される例では、スライス1のIDRピクチャ部分が最初に到着し、次いでシステムは他のタイルの前にスライス1のビットストリーム切換え2611を実行することができる。IDRピクチャ部分の到着の順序に従って、システムは他の領域に対して漸進的にビットストリーム切換えを実行することができる。例えば、スライス2のIDRピクチャ部分は、スライス1のIDRピクチャ部分の後に到着する。そして、スライス1のビットストリーム切換え2511の後に、スライス2のビットストリーム切換え2512を行ってもよい。また、スライス3では符号化品質に変化がないため、スライス3に対してビットストリームの切換えを行う必要がない。ビットストリームの切換えの結果として、スライス1に対して高い符号化品質を有する符号化データを選択することができる。スライス2および3に対して、より低い符号化品質を有する符号化データを選択することができ、それによって視聴体験が最適化される。
上記の例に示されるように、プログレッシブビットストリーム切り替え技術を分散IDR画像伝送技術と共に使用することで、システムは、ビットストリーム切り替えを実行するための最大帯域幅を減少させながら、重要度の高い領域を大きな遅延なしに迅速にリフレッシュして視聴体験を向上できるようにする。
図27は、本発明の様々な実施形態による、ビデオストリーミングにおけるビットストリーム切換えをサポートするためのフローチャートを示す図の一例である。図27に示すように、ステップ2701において、システムは、一連の画像フレーム内の各画像フレームを複数のセクションに分割する方式を使用することができ、複数のセクションは少なくとも第1セクションと第2セクションとを含む。ステップ2702において、システムは、第1セクションについて異なる符号化品質の第1セットの符号化データを取得することができ、第2セクションについて異なる符号化品質の第2セットの符号化データを取得することができる。ステップ2703において、システムは、第1セクションの符号化品質の変化に対応する第1切換え点を決定し、第2セクションの符号化品質の変化に対応する第2切換え点を決定することができる。ステップ2704において、システムは、第1セットの符号化データから、第1切り替え点の前の第1の先行符号化品質を有する符号化データと、第1切換え点の後の第1の後続符号化品質を有する符号化データとを選択できる。ステップ2705において、システムは、第2切換え点の前の第2の先行符号化品質を有する符号化データと、第2切換え点の後の第2の後続符号化品質を有する符号化データとを第2セットの符号化データから選択することができる。ステップ2706において、システムは選択された符号化データをビットストリームに組み込むことができる。
図28〜図29は、図17(a)に示すような構成例に基づいて端末側でビットストリーム切換えを実行することを示す図の例である。例えば、タイル5は最短のIDRピクチャ挿入サイクルで構成することができる。タイル1、3、7および9は、最長のIDRピクチャ挿入サイクルで構成することができる。また、タイル2、4、6および8は、中程度のIDRピクチャ挿入サイクルで構成することができる。
図28に示すように、ビューポートは最初にタイル2に位置してもよい(例えば、ユーザがビューの上部に焦点を合わせているとき)。したがって、表示のために、高いコーディング品質を有するバイナリデータをタイル2で(たとえばストリーミングサーバから)受信することができる。さらに、中程度の符号化品質を有するバイナリデータが、タイル1、3および5について受信され得る。そして、タイル4、6、7、8および9について、低程度の符号化品質を有するバイナリデータを受信することができる。
図29に示されるように、イベントが瞬間T(M)に発生することがあり、それがビットストリーム切換えをトリガする。例えば、視点がタイル2からタイル5に移動すると(例えば、視聴者がビューポートをビューの上部からビューの前部に移動すると)、システムはそれに応じて各タイルの符号化品質を更新することができる。
分散IDR画像伝送技術を使用して、ビットストリームの切換えは、異なるタイルに対して別々に実行され得る。様々な実施形態において、各タイルに対するIDRピクチャのそれぞれの部分が到着する順序で、タイルに対してビットストリーム切換えを実行することができる。図29に示される例では、タイル5のIDRピクチャ部分が最初に到着し、次いでシステムは他のタイルの前にタイル5のビットストリーム切換え2911を実行することができる。次いで、IDRピクチャ部分の到着の順序に従って、システムは他の領域に対して漸進的にビットストリーム切換えを実行することができる。例えば、タイル2のIDRピクチャ部分は、タイル1のIDRピクチャ部分の前に到着する。そして、タイル2のビットストリーム切換え2912は、タイル1のビットストリーム切換え2913の前であるが、タイル5のビットストリーム切換え2911の後に実行されてもよい。したがって、ビットストリームの切換えおよび復号の結果として、符号化品質の高い画像データをタイル5に表示することができる。タイル2、4、6および8については、中程度の符号化品質の画像データを表示することができる。また、タイル1、3、7および9には、コーディング品質の低い画像データを選択できるため、視聴環境が最適化される。
図30〜図31は、図17(b)に示されるような例示的な構成に基づいて端末側でビットストリーム切換えを実行することを示す図の例である。例えば、タイル2は、最短のIDRピクチャ挿入サイクルで構成することができる。タイル1、3、4、5および6は、中程度のIDRピクチャ挿入サイクルで構成することができる。そして、タイル7、8および9は、最長のIDRピクチャ挿入サイクルで構成することができる。
図30に示されるように、ビューポートは最初にタイル5に位置し(例えば、ユーザがビューの前部に焦点を合わせているとき)、次に高コーディング品質のバイナリデータを(例えばストリーミングサーバから)受信してタイル5に表示することができる。さらに、中程度の符号化品質を有するバイナリデータをタイル2、4、6および8について受信することができる。そして、タイル1、3、7、9については、符号化品質の低い2値データを受信することができる。
図31に示されるように、瞬間T(M)でイベントが発生することがあり、それがビットストリームの切換えをトリガする。例えば、ビューポイントがタイル5からタイル2に移動する、例えばビデオプロデューサの意図どおりに視聴者がビューポートをビューの前部からビューの上部に移動させると、システムはそれに応じて各タイルのコーディング品質を更新することができる。
分散IDR画像伝送技術を使用して、ビットストリームの切換えは、異なるタイルに対して別々に実行され得る。様々な実施形態では、各タイルに対するIDRピクチャのそれぞれの部分が到着する順序で各タイルに対してビットストリーム切換えを実行することができる。図31に示す例では、タイル2のIDRピクチャ部分が最初に到着し、次いでシステムは他のタイルの前にタイル2のビットストリーム切換え3111を実行することができる。それぞれのIDRピクチャ部分の到着の順序に従って、システムは他の領域に対して段階的にビットストリーム切換えを実行することができる。例えば、タイル5のIDRピクチャ部分は、タイル2のIDRピクチャ部分の後に到着する。そして、タイル2のビットストリーム切換え3111の後に、タイル5のビットストリーム切換え3112を行ってもよい。さらに、タイル7では符号化品質に変化がないので、ビットストリームの切換えをタイル7に対して実行する必要はない。ビットストリームの切換えの結果として、符号化品質の高い画像データをタイル2に対して表示することができる。タイル1、3、4、5および6については、中程度の符号化品質の画像データを表示することができる。そして、低程度の符号化品質を有する画像データをタイル7、8および9について表示することができ、それによって視聴体験が最適化される。
上記の例に示されるように、プログレッシブビットストリーム切換え技術を分散IDR画像伝送技術と共に使用することで、システムは、ビットストリーム切換えを実行するための最大帯域幅を減少させながら、重要度の高い領域を大きな遅延なしに迅速にリフレッシュして視聴体験を向上させることができるようにする。
図32〜図33は、図22(a)に示すような例示的な構成に基づいて端末側でビットストリーム切換えを実行することを示す図の例である。例えば、スライス2は最短のIDRピクチャ挿入サイクルで構成することができ、スライス1および3はより長いIDRピクチャ挿入サイクルで構成することができる。
図32に示すように、ビューポートは最初にスライス1に位置してもよい(例えば、ユーザがビューの上部に焦点を合わせているとき)。したがって、スライス1で表示するために(例えばストリーミングサーバから)高い符号化品質を有する画像データを受信することができる。さらに、より低い符号化品質を有する画像データをスライス2および3について受信することができる。
図33に示されるように、瞬間T(M)にイベントが発生することがあり、それがビットストリームの切換えをトリガする。たとえば、視聴者がビューポートをビューの上部からビューの中央部に移動するときなど、視点がスライス1からスライス2に移動すると、システムはそれに応じて各スライスの符号化品質を更新することができる。
分散IDR画像伝送技術を使用して、ビットストリームの切換えは、異なるスライスに対して別々に実行され得る。図33に示されるように、ビットストリーム切換えは、IDRピクチャのそれぞれの部分が到着する順序で個々のスライスに対して実行され得る。図33に示される例では、スライス2のIDRピクチャ部分が最初に到着し、次いでシステムは他のスライスの前にスライス2のビットストリーム切換え3412を実行することができる。次に、他のIDRピクチャ部分の到着の順序に従って、システムは他の領域に対してビットストリームの切換えを漸進的に実行することができる。例えば、スライス1のIDRピクチャ部分はスライス3のIDRピクチャ部分の前に到着する。そして、スライス1のビットストリーム切換え3313は、タイル3のビットストリーム切換え3311の前であるが、スライス2のビットストリーム切換え3312の後に行われてもよい。したがって、ビットストリームの切換えの結果として、スライス2に対して高い符号化品質の画像データを表示することができる。スライス1および3について、中程度の符号化品質を有する画像データを表示することができ、それによって視聴体験が最適化される。
図34〜図35は、図22(b)に示されるような例示的な構成に基づいて端末側でビットストリーム切換えを実行することを示す図の例である。例えば、スライス1は最短のIDRピクチャ挿入サイクルで構成することができる。スライス2および3は、より長いIDRピクチャ挿入サイクルで構成することができる。
図34に示されるように、ビューポートは最初にスライス2に位置し(例えば、ユーザがビューの前部に焦点を合わせているとき)、次に高コーディング品質のバイナリデータを(例えばストリーミングサーバから)受信してスライス2に表示することができる。さらに、より低い符号化品質を有するバイナリデータをスライス1および3について受信することができる。
図35に示されているように、瞬間T(M)でイベントが発生することがあり、それがビットストリームのスイッチングをトリガする。例えば、視点がスライス2からスライス1に移動すると(例えば、ビデオ製作者の意図通りに視聴者がビューポートをビューの前部からビューの上部に移動すると)、システムはそれに応じて各スライスについて符号化品質更新することができる。
分散IDR画像伝送技術を使用して、ビットストリームの切換えは、異なるスライスに対して別々に実行され得る。図35に示されるように、各スライスに対するIDRピクチャのそれぞれの部分が到着する順序で、各タイルに対してビットストリーム切換えを実行することができる。図35に示される例では、スライス1のIDRピクチャ部分が最初に到着し、システムは他のタイルの前にスライス1のビットストリーム切換え3511を実行することができる。IDRピクチャ部分の到着の順序に従って、システムは他の領域に対して漸進的にビットストリーム切換えを実行することができる。例えば、スライス2のIDRピクチャ部分は、スライス1のIDRピクチャ部分の後に到着する。そして、スライス2のビットストリーム切換え3512は、スライス1のビットストリーム切換え3511の後、スライス3のビットストリーム切換え3513の前に行ってもよい。ビットストリームの切換えの結果として、スライス1に対して高い符号化品質の画像データを表示することができる。そして、より低い符号化品質を有する画像データをスライス2および3について表示することができ、それによって視聴体験が最適化される。特に、ビューポートがスライス3から離れるので、スライス3は、中符号化品質から低符号化品質に切換えられ得る。
上記の例に示されるように、プログレッシブビットストリーム切換え技術を分散IDR画像伝送技術と共に使用することで、システムは、ビットストリーム切換えを実行するための最大帯域幅を減少させながら、重要度の高い領域を大きな遅延なしに迅速にリフレッシュして視聴体験の向上を可能にする。
図36は、本発明の様々な実施形態による、ビデオストリーミングをサポートするためのフローチャートを示す図の一例である。図36に示すように、ステップ3601において、システムは、一連の画像フレームを再構成するためのバイナリデータを含むビットストリームを受信することができ、一連の画像フレーム内の各画像フレームは分割方式に基づいて複数のセクションに分割される。複数のセクションは少なくとも第1セクションと第2セクションとを含む。ステップ3602において、システムはバイナリデータから第1の再構成画像フレームを生成することができ、第1の再構成画像フレームは第1セクションのための第1の再構成画像データと、第2セクションのための第1の再構成画像データを含む。第1セクションの符号化品質の変化に対応する第1切換え点の前に第1の再構成画像フレームがある場合、第1セクションの第1の再構成画像データは第1の先行符号化品質で再構成できる。第2の再構成画像フレームが第2セクションの符号化品質の変化に対応する第2切換え点の前にあるとき、第2セクションは第2の先行符号化品質で再構成することができる。ステップ3602において、システムはバイナリデータから第2の再構成画像データを生成することができ、第2の再構成画像フレームは、第1セクションのための第2の再構成画像データと、第2セクションのための第2の再構成画像データとを含む。第1の再構成画像フレームが第1切換え点の後にあるとき、第1セクションのための第2の再構成画像データは第1の事後符号化品質で再構成され、第2の再構成画像フレームが第2切換え点の後にあるとき、第1セクションのための第2の再構成画像データは第2の事後符号化品質で再構成される。
(B)ビデオストリーミング装置
図37は、本発明の様々な実施形態に従った、可動プラットフォーム環境を示す図の一例である。図37に示すように、可動プラットフォーム環境3700内の可動プラットフォーム3718(可動物体とも呼ばれる)は、支持機構3702および搭載物3704を含むことができる。可動プラットフォーム3718は航空機として描くことができるが、この描写は限定を意図するものではなく、任意の適切な種類の可動プラットフォームを使用することができる。当業者は、航空機システムに関して本明細書で説明されている実施形態のいずれもが任意の適切な可動プラットフォーム(例えば、無人航空機(UAV;UNMANNED AERIAL VEHICLE))に適用できることを理解するであろう。いくつかの事例では、搭載物3704は、支持機構3702を必要とせずに可動プラットフォーム3718上に提供され得る。本発明の様々な実施形態によれば、様々な実施形態または特徴は、可動プラットフォーム3718(例えば、UAV)の動作において実施することができ、またはその動作に有益であり得る。
いくつかの実施形態では、可動プラットフォーム3718は、1つまたは複数の移動機構3706(例えば推進機構)、検知システム3708および通信システム3710を含み得る。移動機構3706は、回転子、プロペラ、ブレード、エンジン、モータ、ホイール、アクスル、磁石、ノズル、または動物もしくは人間が移動を実行するために使用することができる任意の機構のうちの1つまたは複数を含むことができる。例えば、可動プラットフォームは、1つ以上の推進機構を有してもよい。移動機構3706は全て同じタイプでもよいし、異なる種類の移動機構であってもよい。移動機構3706は、支持要素(例えば駆動軸)などの任意の適切な手段を使用して、可動プラットフォーム3718に取り付けることができる(またはその逆に可動プラットフォーム3718を移動機構3706に取り付けることもできる)。移動機構3706は、可動プラットフォーム3718の任意の適切な部分に取り付けることができ、例えばその上部、底部、前面、後面、側面、またはそれらの適切な組み合わせなどに取り付け可能である。
いくつかの実施形態では、移動機構3706は、可動プラットフォーム3718の水平移動を必要とせずに(例えば滑走路を下ることなく)可動プラットフォーム3718が地面や物体の表面から垂直に発進しまたは垂直に降りることを可能にする。任意選択で、移動機構3706は、可動プラットフォーム3718が特定の位置および向きの少なくともいずれかで空中に浮かぶことを可能にするように動作可能であり得る。1つ以上の移動機構3706は他の移動機構とは独立して制御されてもよい。代替的に、移動機構3706は同時に制御されるように構成することができる。例えば、可動プラットフォーム3718は、可動プラットフォームに揚力および推力の少なくともいずれかを提供することができる複数の水平配向ロータを有することができる。複数の水平方向ロータは、可動プラットフォーム3718に垂直離陸、垂直着地およびホバリング能力を提供するように作動させることができる。いくつかの実施形態において、1つ以上の水平配向ロータは時計回り方向に回転し得、一方1つ以上の水平回転子は反時計回り方向に回転し得る。例えば、時計回りの回転子の数は、反時計回りの回転子の数と等しくてもよい。各水平ロータの回転速度は、各ロータによって生じる揚力および推力の少なくともいずれかを独立に制御し、それによって可動プラットフォーム3718の空間配置、速度および加速度の少なくとも一つを(例えば、互いに交差する3方向までの並進および該3方向の各々を中心とする3回転までに関して)調整するために変えることができる。
検知システム3708は、(例えば、様々な並進角度および様々な回転角度に関して)可動プラットフォーム3718の空間配置、速度および加速度の少なくともいずれかを検知することができる1つまたは複数のセンサを含むことができる。1つまたは複数のセンサは、GPSセンサ、モーションセンサ、慣性センサ、近接センサ、または画像センサを含む任意のセンサを含み得る。検知システム3708によって提供される感知データは、(例えば、適切な処理ユニットおよび制御モジュールの少なくともいずれかを使用して)可動プラットフォーム3718の空間配置、速度および向きの少なくともいずれかを制御するために使用することができる。あるいは、検知システム108を使用して、気象条件、潜在的な障害物への近接、地理的特徴の位置、人工構造物の位置など、移動可能プラットフォームを囲む環境に関するデータを提供することができる。
通信システム3710は、無線信号3716を介して通信システム3714を有する端末3712との通信を可能にする。通信システム3710、3714は、無線通信に適した任意の数の送信機、受信機および送受信機の少なくともいずれかを含み得る。通信は一方向通信でもよく、それによりデータは一方向にのみ送信され得る。例えば、一方向通信は、データを端末3712に送信する可動プラットフォーム3718のみを含むことができ、またはその逆も可能である。データは、通信システム3710の1つ以上の送信機から通信システム3712の1つ以上の受信機に送信されてもよく、またはその逆でもよい。あるいは、通信は、データが可動プラットフォーム3718と端末3712との間で両方向に送信され得るように、双方向通信であり得る。双方向通信は、通信システム3710の1つ以上の送信機から通信システム3714の1つ以上の受信機へデータを送信することを含むことができ、逆もまた同様である。
いくつかの実施形態では、端末3712は、1つまたは複数の可動プラットフォーム3718、支持機構3702および搭載物3704に制御データを提供することができ、また、1つまたは複数の可動プラットフォーム3718、支持機構3702および搭載物3704からの情報を受信することができる。これらの情報は、例えば、可動プラットフォーム、支持機構または搭載物の位置および動き情報の少なくともいずれか、例えば搭載物カメラによって取得された画像データなど搭載物によって感知されたデータ、および搭載物カメラによって取得された画像データから生成されたデータなどを含む。いくつかの事例では、端末からの制御データは、相対位置、移動、作動、または可動プラットフォーム、支持機構および搭載物の少なくともいずれかを制御するための命令を含み得る。例えば、制御データは、(例えば、移動機構3706の制御を介して)可動プラットフォームの位置および向きの少なくともいずれかを変更すること、又は(例えば、移動機構3706を介して)可動プラットフォームに対し(支持機構3702の制御を介して)搭載物を移動させることができる。端末からの制御データは、カメラまたは他の画像取得装置の動作の制御(たとえば、静止画または動画の撮影、ズームインまたはズームアウト、オンまたはオフ、撮像モードの切換え、画像解像度の変更、焦点の変更、被写界深度の変更、露光時間の変更、視野角または視野の変更)などの搭載物の制御をもたらし得る。
いくつかの例では、可動プラットフォーム、支持機構および搭載物の少なくともいずれかからの通信は、(たとえば、検知システム3708または搭載物3704の)1つまたは複数のセンサからの情報および検知情報の少なくともいずれかに基づいて生成されたデータを含み得る。通信は、1つまたは複数の異なる種類のセンサ(例えば、GPSセンサ、動きセンサ、慣性センサ、近接センサ、または画像センサ)からの検知情報を含むことができる。そのような情報は、可動プラットフォーム、支持機構および搭載物の位置(例えば、位置、向き)、動き、並びに加速度の少なくともいずれかに関するものであり得る。搭載物からのそのような情報は、搭載物によって捕捉されたデータまたは搭載物の感知された状態を含み得る。端末3712によって送信された制御データは、可動プラットフォーム3718、支持機構3702、または搭載物3704のうちの1つまたは複数の状態を制御するように構成され得る。これに代えて、またはこれと組み合わて、支持機構3702および搭載物3704は、端末3712が可動プラットフォーム3718、支持機構3702および搭載物3704のそれぞれと独立して通信および制御できるように、端末3712と通信するように構成された通信モジュールをそれぞれ含むこともできる。
いくつかの実施形態では、可動プラットフォーム3718は、端末3712に加えて、または端末3712の代わりに別の遠隔装置と通信するように構成することができる。端末3712はまた、可動プラットフォーム3718と同様に他の遠隔装置と通信するように構成されてもよい。例えば、可動プラットフォーム3718および端末3712の少なくともいずれかは、他の可動プラットフォーム、または他の可動プラットフォームの支持機構もしくは搭載物と通信することができる。必要に応じて、遠隔装置は第2の端末または他のコンピューティング装置(例えば、コンピュータ、ラップトップ、タブレット、スマートフォン、または他のモバイル装置)であり得る。遠隔装置は、可動プラットフォーム3718へのデータを送信、可動プラットフォーム3718からのデータ受信、端末3712へのデータ送信、および、端末3712からのデータ受信の少なくともいずれかを行うように構成することができる。任意選択で、遠隔装置は、可動プラットフォーム3718および端末3712の少なくともいずれかから受信したデータをウェブサイトまたはサーバにアップロードできるように、インターネットまたは他の電気通信ネットワークに接続することができる。
本発明の多くの特徴は、ハードウェア、ソフトウェア、ファームウェア、またはそれらの組み合わせにおいて、それらを使用して、またはそれらを使用して実行することができる。その結果、上述したビデオストリーミング方法の一連の手順は、プログラムに組み込んで(例えば、1つまたは複数のプロセッサを含む)コンピュータ処理システムを使用して実施することができる。例示的なプロセッサとして、1つまたは複数の汎用のマイクロプロセッサ(例えば、シングルまたはマルチコアプロセッサ)、特定用途向け集積回路、特定用途向け命令セットプロセッサ、グラフィック処理ユニット、物理処理ユニット、デジタル信号処理ユニット、コプロセッサ、ネットワーク処理ユニット、音声処理ユニット、暗号化処理ユニットなどを含み得るが、これらに限定されるものではない。
(C)プログラムおよび記録媒体
上述したビデオストリーミング方法の一連の手順をコンピュータに実行させるプログラムとしてフレキシブルディスクやCD−ROM等の記録媒体に収納し、コンピュータに読込ませて実行させてもよい。
記録媒体は、磁気ディスクや光ディスク、DVD、CD−ROM、マイクロドライブ、および光磁気ディスク等の携帯可能なものに限定されず、ハードディスク装置やリードオンリメモリ(ROM)、ランダムアクセスメモリ(RAM)、EPROM、EEPROM、DRAM、VRAM、フラッシュメモリデバイス、磁気または光学カード、ナノシステム(分子メモリICを含む)、または命令およびデータの少なくともいずれかの格納に適した任意の種類の媒体またはデバイスを含み得るが、これらに限定されない。
また、上述したビデオストリーミング方法の一連の手順を組込んだプログラムをインターネット等の通信回線(無線通信を含む)を介して頒布してもよい。さらに、上述したビデオストリーミング方法の一連の手順を組込んだプログラムを暗号化したり、変調をかけたり、圧縮した状態で、インターネット等の有線回線や無線回線を介して、又は記録媒体に収納して頒布してもよい。
上述した実施形態の特徴は、機械可読媒体(媒体)のいずれか1つに記憶されると、処理システムのハードウェアを制御し、その結果を利用して処理システムが他の機構と対話できるようにするソフトウェアおよびファームウェアの少なくともいずれかに組み込むことができる。そのようなソフトウェアまたはファームウェアは、アプリケーションコード、デバイスドライバ、オペレーティングシステムおよび実行環境/コンテナを含み得るが、それらに限定されない。
実施形態の特徴は、例えば特定用途向け集積回路(ASIC)およびフィールドプログラマブルゲートアレイ(FPGA)デバイスなどのハードウェアコンポーネントを使用してハードウェアで実施することもできる。本明細書に記載されている機能を実行するためのハードウェアステートマシンの実装は、当業者には明らかであろう。
さらに、本発明は、本発明の教示に従ってプログラムされた1つまたは複数のプロセッサ、メモリおよびコンピュータ可読記憶媒体の少なくともいずれかを含む、1つまたは複数の従来の汎用もしくは専用デジタルコンピュータ、コンピューティング装置、機械、またはマイクロプロセッサを使用して都合よく実施できる。ソフトウェア技術の当業者には明らかなように、適切なソフトウェアコーディングは、本開示の教示に基づいて熟練したプログラマによって容易に準備されることができる。
本発明の様々な実施形態を上記で説明してきたが、それらは限定ではなく例として提示されていることを理解されたい。当業者には、本発明の精神および範囲から逸脱することなく、形態および詳細において様々な変更を加えることができることが明らかであろう。
(C)その他
以上、特定の機能の実行およびそれらの関係を示す機能的構成要素を用いて本発明を説明した。これらの機能的構成要素の境界は、説明の便宜上、本明細書においてしばしば任意に定義されている。特定の機能およびそれらの関係が適切に実行される限り、代替の境界を定義することができる。したがって、そのような代替の境界はいずれも本発明の範囲および精神の範囲内である。
本発明の上記説明は、例示および説明を目的として提供されたものである。網羅的であること、または本発明を開示された正確な形態に限定することを意図するものではない。本発明の広さおよび範囲は、上記の例示的な実施形態のいずれによっても限定されるべきではない。当業者には多くの修正形態および変形形態が明らかであろう。修正形態および変形形態は、開示された特徴の任意の関連する組み合わせを含む。実施形態は、本発明の原理およびその実際的な用途を最もよく説明するために選択され説明され、それによって当業者が様々な実施形態および企図される特定の用途に適した様々な修正と共に本発明を理解することができる。本発明の範囲は、添付の特許請求の範囲およびそれらの均等物によって定義されることが意図されている。
以上、添付の図面を参照しながら本発明の実施の形態を説明したが、これらは発明の容易な理解のためになされたものであり、これらをもって本発明の特許請求の範囲を限定するものではない。上述の実施の形態に付与した番号は、記載上の便宜を図るためのものに過ぎず、特に実施形態の優劣を示すものではない。また、フローチャートでは論理的な順序を示したが、特定の状況においては、記載されたステップを異なる順序で実行することもできる。
101:マッピング
102:予測
103:変換
104:量子化
105:エントロピー符号化
200:正四角形投影
300:立方体面投影
500,1400,:ビデオストリーミング環境
501,1401:ストリーミングサーバ
502,1402:ユーザ機器(UE)
503,1403:記憶装置
504,702,1102,1404:記憶されたビットストリーム
505,1405:ストリーミングコントローラ
506,1406:デコーダ
507,1407:ディスプレイ
508,1408:エンコーダ
510,1410:ビデオ
600:画像分割方式
700,1100:サーバ
701:画像シーケンス
710,1110:品質A
720,1120:品質B
730,1130:品質C
802:タイルベースの分割
804,1204:符号化データ
805:ビットストリーム
811,1211:画像フレーム
1420:ビットストリーム切換え
1202:スライスベースの分割
A,B:セクション
T(M):イベント発生の瞬間

Claims (17)

  1. 一連の画像フレーム内の各画像フレームを、少なくとも第1セクションと第2セクションとを含む複数のセクションに分割する方式を使用するステップと、
    第1セクションについて符号化品質が異なる第1セットの符号化データを取得し、第2セクションについて符号化品質が異なる第2セットの符号化データを取得するステップと、
    前記第1セクションの符号化品質の変化に対応する第1切換え点を決定し、第2セクションの符号化品質の変化に対応する第2切換え点を決定するステップと、
    第1切換え点の前の第1の先行符号化品質を有する符号化データと第1切換え点の後の第1の後続符号化品質を有する符号化データとを第1セットの符号化データから選択するステップと、
    第2切換え点の前に第2の先行符号化品質を有する符号化データと第2切換え点の後に第2の後符号化品質を有する符号化データとを第2セットの符号化データから選択するステップと、
    選択された符号化データをビットストリームに組み込むステップと、
    を備える、ビデオストリーミング方法。
  2. 前記第1切換え点において選択された符号化データは、前記第1セクションに対する第1の事後符号化品質を有する第1のリフレッシュ部分を含み、
    前記第2切換え点において選択された符号化データは、第2の後続符号化品質を有する第2のリフレッシュ部分を含む、請求項1に記載のビデオストリーミング方法。
  3. 前記第1のリフレッシュ部分は第1の瞬時デコーダリフレッシュ(IDR)ピクチャの一部分を含み、前記第2のリフレッシュ部分は瞬時デコーダリフレッシュ(IDR)ピクチャの第2の部分を含む、請求項2に記載のビデオストリーミング方法。
  4. 前記第1セクションの符号化品質の変化および前記第2セクションの符号化品質の変化は、イベントによって引き起こされ、
    前記第1セクションについての前記第1切換え点は、前記第2セクションについての前記第2切換え点と異なる、請求項1に記載のビデオストリーミング方法。
  5. 前記第1セクションは、第1セットの周期的ランダムアクセスポイントと関連付けられ、前記第2セクションは、第2セットの周期的ランダムアクセスポイントと関連付けられる、請求項4に記載のビデオストリーミング方法。
  6. 前記第1セクションの前記第1切換え点は、前記イベントの後の前記第1セットの周期的ランダムアクセスポイントの第1のランダムアクセスポイントに基づいて決定され、前記第2セクションの前記第2切換え点は、前記イベント後の前記第2セットの周期的ランダムアクセスポイントの第2ランダムアクセスポイントに基づいて決定される、請求項5に記載のビデオストリーミング方法。
  7. 第1セットの量子化パラメータを用い、前記第1セクションについて異なる符号化品質で前記第1セットの符号化データを生成し、第2セットの量子化パラメータを用い、前記第2セクションについて異なる符号化品質で前記第2セットの符号化データを生成する、ことをさらに備える請求項1に記載のビデオストリーミング方法。
  8. ビデオストリーミング方法であって、
    少なくとも第1セクションおよび第2セクションを含み、分割方式に基づいてそれぞれ複数のセクションに分割された一連の画像フレームを再構成するためのバイナリデータを含むビットストリームを受け取るステップと、
    前記バイナリデータから、第1セクションのための第1の再構成画像データと第2セクションのための第1の再構成画像データとを含む第1の再構成画像フレームを生成するステップと、
    前記バイナリデータから、第1セクションのための第2の再構成画像データと第2セクションのための第2の再構成画像データとを含む第2の再構成画像フレームを生成するステップと、
    を備え、
    前記第2セクションについての符号化品質の変化に対応する第2切換え点の前に前記第2の再構成画像フレームがあるとき、第2セクションのための前記第1の再構成画像データは第2の先行符号化品質で再構成され、
    前記第1セクションについての符号化品質の変化に対応する第2切換え点の前に前記第2の再構成画像フレームがあるとき、第2セクションのための前記第1の再構成画像データは第2の先行符号化品質で再構成され、
    前記第1の再構成画像フレームが第1切換え点の後であるときに前記第1セクションの前記第2の再構成画像データが第1の事後符号化品質で再構成されること、および、前記第2の再構成画像フレームが第2切換え点の後にあるときに前記第1セクションについての前記第2の再構成画像データは第2の後続符号化品質で再構成されることの少なくともいずれかである、ビデオストリーミング方法。
  9. 前記第1セクションは第1セットの周期的ランダムアクセスポイントと関連付けられ、前記第2セクションは第2セットの周期的ランダムアクセスポイントと関連付けられる、請求項8に記載のビデオストリーミング方法。
  10. 前記第1セクションについての前記第1切換え点は、前記第1セットの周期的ランダムアクセスポイントにおける第1のランダムアクセスポイントに基づいて決定され、
    前記第2セクションについての前記第2切換え点は、前記第2セットの周期的ランダムアクセスポイントにおける第2ランダムアクセスに基づいて決定される、請求項9に記載のビデオストリーミング方法。
  11. 前記第1セクションに関連する前記第1セットの周期的ランダムアクセスポイントは第1の間隔で構成され、前記第2セクションに関連する第2の周期的ランダムアクセスポイントは、第1の間隔と異なる第2の間隔で構成される、請求項9に記載の方法。
  12. 前記バイナリデータから第3の再構成画像フレームを生成するステップをさらに含み、第3の再構成画像データが前記第1切換え点の後であって前記第2切換え点の後であるとき、前記第3の再構成画像フレームは、前記第1セクションについての第1の後続符号化品質を有する第3の再構成画像データと、第2セクションについての第2の先行符号化品質を有する第3の再構成画像フレームと、を含む、請求項8に記載のビデオストリーミング方法。
  13. 前記第1セクションについての前記第1の後続符号化品質を有する前記第3の再構成画像データは、フレーム内予測に基づいて再構成され、前記第2セクションについての前記第2の先行符号化品質を有する前記第3の再構成画像データは、フレーム間予測に基づいて再構成される、請求項12に記載のビデオストリーミング方法。
  14. 請求項1から13のいずれか一項に記載のビデオストリーミング方法をコンピュータに実行させるプログラム。
  15. 少なくとも一つのマイクロプロセッサと、
    少なくとも一つのマイクロプロセッサ上で動作するストリーミングコントローラと、
    を備えるビデオストリーミングシステムであって、
    前記ストリーミングコントローラは、
    一連の画像フレーム内の各画像フレームを、少なくとも第1セクションと第2セクションとを含む複数のセクションに分割する方式を使用し、
    第1セクションについて符号化品質が異なる第1セットの符号化データを取得し、第2セクションについて符号化品質が異なる第2セットの符号化データを取得し、
    前記第1セクションの符号化品質の変化に対応する第1切換え点を決定し、第2セクションの符号化品質の変化に対応する第2切換え点を決定し、
    第1切換え点の前の第1の先行符号化品質を有する符号化データと第1切換え点の後の第1の後続符号化品質を有する符号化データとを第1セットの符号化データから選択し、
    第2切換え点の前に第2の先行符号化品質を有する符号化データと第2切換え点の後に第2の後符号化品質を有する符号化データとを第2セットの符号化データから選択し、
    選択された符号化データをビットストリームに組み込む、
    ビデオストリーミングシステム。
  16. 少なくとも一つのマイクロプロセッサと、
    少なくとも一つのマイクロプロセッサ上で動作するデコーダと、
    を備えるビデオストリーミングシステムであって、
    前記デコーダは、
    少なくとも第1セクションおよび第2セクションを含み、分割方式に基づいてそれぞれ複数セクションに分割された一連の画像フレームを再構成するためのバイナリデータを含むビットストリームを受け取り、
    前記バイナリデータから、第1セクションのための第1の再構成画像データと第2セクションのための第1の再構成画像データとを含む第1の再構成画像フレームを生成し、
    前記バイナリデータから、前記第1セクションのための第2の再構成画像データと第2セクションのための第2の再構成画像データとを含む第2の再構成画像フレームを生成し、
    前記第2セクションについての符号化品質の変化に対応する第2切換え点の前に前記第2の再構成画像フレームがあるとき、第2セクションのための前記第1の再構成画像データは第2の先行符号化品質で再構成され、
    前記第1セクションについての符号化品質の変化に対応する第2切換え点の前に前記第2の再構成画像フレームがあるとき、第2セクションのための前記第1の再構成画像データは第2の先行符号化品質で再構成され、
    前記第1の再構成画像フレームが第1切換え点の後であるときに前記第1セクションのための前記第2の再構成画像データが第1の事後符号化品質で再構成されること、および、前記第2の再構成画像フレームが前記第2切換え点の後にあるときに前記第1セクションについての前記第2の再構成画像データは第2の後続符号化品質で再構成される、ことの少なくともいずれかである、
    ビデオストリーミングシステム。
  17. 請求項14に記載のプログラムを読み出して請求項1から13のいずれか一項に記載のビデオストリーミング方法を実行するプロセッサを備えるビデオストリーミング装置。
JP2019150592A 2018-09-11 2019-08-20 ビデオストリーミング方法、ビデオストリーミングシステム、ビデオストリーミング装置およびプログラム Ceased JP2020043559A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CNPCT/CN2018/105108 2018-09-11
PCT/CN2018/105108 WO2020051777A1 (en) 2018-09-11 2018-09-11 System and method for supporting progressive video bit stream swiitching

Publications (1)

Publication Number Publication Date
JP2020043559A true JP2020043559A (ja) 2020-03-19

Family

ID=69777308

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019150592A Ceased JP2020043559A (ja) 2018-09-11 2019-08-20 ビデオストリーミング方法、ビデオストリーミングシステム、ビデオストリーミング装置およびプログラム

Country Status (6)

Country Link
US (1) US20210227227A1 (ja)
EP (1) EP3797515A4 (ja)
JP (1) JP2020043559A (ja)
KR (1) KR20200069350A (ja)
CN (1) CN112673634A (ja)
WO (1) WO2020051777A1 (ja)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017526193A (ja) * 2015-07-31 2017-09-07 エスゼット ディージェイアイ テクノロジー カンパニー リミテッドSz Dji Technology Co.,Ltd ビデオ符号化方法及びシステム
JP2018026670A (ja) * 2016-08-09 2018-02-15 日本電信電話株式会社 映像配信システム、端末装置、配信サーバ、映像配信方法、映像表示方法、映像配信プログラム及び映像表示プログラム
WO2018069412A1 (en) * 2016-10-12 2018-04-19 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Spatially unequal streaming
WO2018107404A1 (en) * 2016-12-14 2018-06-21 SZ DJI Technology Co., Ltd. System and method for supporting video bit stream switching

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB201100397D0 (en) * 2011-01-11 2011-02-23 Univ Gent Fast channel switching
US9042458B2 (en) * 2011-04-01 2015-05-26 Microsoft Technology Licensing, Llc Multi-threaded implementations of deblock filtering
US9813736B2 (en) * 2013-09-27 2017-11-07 Qualcomm Incorporated Inter-view dependency type in MV-HEVC
US9591324B2 (en) * 2013-10-14 2017-03-07 Qualcomm Incorporated Systems and methods for separately defining dependencies for sub-layer based inter-layer prediction
US20150264345A1 (en) * 2014-03-13 2015-09-17 Mitsubishi Electric Research Laboratories, Inc. Method for Coding Videos and Pictures Using Independent Uniform Prediction Mode
KR102511705B1 (ko) * 2015-11-16 2023-03-20 삼성전자주식회사 비디오 인코딩 방법, 이를 수행하는 비디오 인코더 및 이를 포함하는 전자 시스템
US11184624B2 (en) * 2016-05-19 2021-11-23 Qualcomm Incorporated Regional random access in pictures
US20180098131A1 (en) * 2016-09-30 2018-04-05 Avago Technologies General Ip (Singapore) Pte. Ltd. Apparatus and methods for adaptive bit-rate streaming of 360 video
WO2018131813A1 (en) * 2017-01-10 2018-07-19 Samsung Electronics Co., Ltd. Method and apparatus for generating metadata for 3d images

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017526193A (ja) * 2015-07-31 2017-09-07 エスゼット ディージェイアイ テクノロジー カンパニー リミテッドSz Dji Technology Co.,Ltd ビデオ符号化方法及びシステム
JP2018026670A (ja) * 2016-08-09 2018-02-15 日本電信電話株式会社 映像配信システム、端末装置、配信サーバ、映像配信方法、映像表示方法、映像配信プログラム及び映像表示プログラム
WO2018069412A1 (en) * 2016-10-12 2018-04-19 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Spatially unequal streaming
WO2018107404A1 (en) * 2016-12-14 2018-06-21 SZ DJI Technology Co., Ltd. System and method for supporting video bit stream switching

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
DIMITRI PODBORSKI ET AL.: "TILE BASED PANORAMIC STREAMING USING SHIFTED IDR REPRESENTATIONS", PROCEEDINGS OF THE IEEE INTERNATIONAL CONFERENCE ON MULTIMEDIA AND EXPO (ICME) 2017, JPN6020041313, July 2017 (2017-07-01), pages 565 - 570, XP033146652, ISSN: 0004376571, DOI: 10.1109/ICME.2017.8019433 *
ROBERT SKUPIN ET AL.: "HEVC Tile Based Streaming to Head Mounted Displays", 2017 14TH IEEE ANNUAL CONSUMER COMMUNICATIONS & NETWORKING CONFERENCE (CCNC), JPN6020041310, 2017, pages 613 - 615, XP033125686, ISSN: 0004459497, DOI: 10.1109/CCNC.2017.7983191 *
Y. SANCHEZ ET AL.: "RANDOM ACCESS POINT PERIOD OPTIMIZATION FOR VIEWPORT ADAPTIVE TILE BASED STREAMING OF 360°VIDEO", ICIP 2017, JPN6020041311, 2017, pages 1915 - 1919, XP033322861, ISSN: 0004459498, DOI: 10.1109/ICIP.2017.8296615 *
YIXUAN BAN ET AL.: "An Optimal Spatial-temporal Smoothness Approach for Tile-based 360-degree Video Streaming", VCIP 2017, JPN6020041314, December 2017 (2017-12-01), pages 1 - 4, XP033325764, ISSN: 0004376572, DOI: 10.1109/VCIP.2017.8305086 *

Also Published As

Publication number Publication date
CN112673634A (zh) 2021-04-16
EP3797515A1 (en) 2021-03-31
WO2020051777A1 (en) 2020-03-19
US20210227227A1 (en) 2021-07-22
KR20200069350A (ko) 2020-06-16
EP3797515A4 (en) 2021-04-28

Similar Documents

Publication Publication Date Title
JP6501904B2 (ja) 球面ビデオのストリーミング
US10341632B2 (en) Spatial random access enabled video system with a three-dimensional viewing volume
US10567464B2 (en) Video compression with adaptive view-dependent lighting removal
KR102594003B1 (ko) 볼류메트릭 비디오를 인코딩/디코딩하기 위한 방법, 장치 및 스트림
US10469873B2 (en) Encoding and decoding virtual reality video
EP3669333B1 (en) Sequential encoding and decoding of volymetric video
CN110036640B (zh) 用于支持视频比特流切换的系统和方法
US10419737B2 (en) Data structures and delivery methods for expediting virtual reality playback
US10546424B2 (en) Layered content delivery for virtual and augmented reality experiences
EP3249930B1 (en) Method, apparatus and stream of formatting an immersive video for legacy and immersive rendering devices
US20180098090A1 (en) Method and Apparatus for Rearranging VR Video Format and Constrained Encoding Parameters
WO2019073117A1 (en) APPARATUS, METHOD AND COMPUTER PROGRAM FOR VOLUMETRIC VIDEO
US11178383B2 (en) Method, apparatus and stream for volumetric video format
KR20190095253A (ko) 광시야 비디오를 인코딩하기 위한 구면 회전 기법
US11463681B2 (en) Encoding and decoding of volumetric video
JP7177034B2 (ja) レガシー及び没入型レンダリングデバイスのために没入型ビデオをフォーマットする方法、装置、及びストリーム
CN116325769A (zh) 从多个视点流式传输场景的全景视频
EP3540696A1 (en) A method and an apparatus for volumetric video rendering
JP2020043559A (ja) ビデオストリーミング方法、ビデオストリーミングシステム、ビデオストリーミング装置およびプログラム
KR20220054430A (ko) 볼류메트릭 비디오 콘텐츠를 전달하기 위한 방법 및 장치들
CN112088352A (zh) 用于对表示球面多媒体内容的球体进行分块的方法和网络设备

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20190820

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190823

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20201030

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20201104

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210127

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20210309

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210709

C60 Trial request (containing other claim documents, opposition documents)

Free format text: JAPANESE INTERMEDIATE CODE: C60

Effective date: 20210709

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20210719

C21 Notice of transfer of a case for reconsideration by examiners before appeal proceedings

Free format text: JAPANESE INTERMEDIATE CODE: C21

Effective date: 20210720

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20210824

A045 Written measure of dismissal of application [lapsed due to lack of payment]

Free format text: JAPANESE INTERMEDIATE CODE: A045

Effective date: 20211221