JP2021528917A - 点群符号化用の高レベルな構文設計 - Google Patents

点群符号化用の高レベルな構文設計 Download PDF

Info

Publication number
JP2021528917A
JP2021528917A JP2020572509A JP2020572509A JP2021528917A JP 2021528917 A JP2021528917 A JP 2021528917A JP 2020572509 A JP2020572509 A JP 2020572509A JP 2020572509 A JP2020572509 A JP 2020572509A JP 2021528917 A JP2021528917 A JP 2021528917A
Authority
JP
Japan
Prior art keywords
video
coding
pcc
unit
bitstream
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2020572509A
Other languages
English (en)
Other versions
JP7287745B2 (ja
Inventor
ワン、イエ−クイ
Original Assignee
ホアウェイ・テクノロジーズ・カンパニー・リミテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ホアウェイ・テクノロジーズ・カンパニー・リミテッド filed Critical ホアウェイ・テクノロジーズ・カンパニー・リミテッド
Publication of JP2021528917A publication Critical patent/JP2021528917A/ja
Priority to JP2023084578A priority Critical patent/JP2023120197A/ja
Application granted granted Critical
Publication of JP7287745B2 publication Critical patent/JP7287745B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/13Adaptive entropy coding, e.g. adaptive variable length coding [AVLC] or context adaptive binary arithmetic coding [CABAC]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/597Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding specially adapted for multi-view video sequence encoding
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T9/00Image coding
    • G06T9/001Model-based coding, e.g. wire frame
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L65/00Network arrangements, protocols or services for supporting real-time applications in data packet communication
    • H04L65/60Network streaming of media packets
    • H04L65/70Media network packetisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L65/00Network arrangements, protocols or services for supporting real-time applications in data packet communication
    • H04L65/60Network streaming of media packets
    • H04L65/75Media network packet handling
    • H04L65/762Media network packet handling at the source 
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L65/00Network arrangements, protocols or services for supporting real-time applications in data packet communication
    • H04L65/60Network streaming of media packets
    • H04L65/75Media network packet handling
    • H04L65/765Media network packet handling intermediate
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/184Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being bits, e.g. of the compressed video stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/186Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a colour or a chrominance component
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/188Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a video data packet, e.g. a network abstraction layer [NAL] unit
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/235Processing of additional data, e.g. scrambling of additional data or processing content descriptors
    • H04N21/2355Processing of additional data, e.g. scrambling of additional data or processing content descriptors involving reformatting operations of additional data, e.g. HTML pages
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/236Assembling of a multiplex stream, e.g. transport stream, by combining a video stream with other content or additional data, e.g. inserting a URL [Uniform Resource Locator] into a video stream, multiplexing software data into a video stream; Remultiplexing of multiplex streams; Insertion of stuffing bits into the multiplex stream, e.g. to obtain a constant bit-rate; Assembling of a packetised elementary stream
    • H04N21/23605Creation or processing of packetized elementary streams [PES]

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

映像復号器により実施される点群符号化(PCC)の方法である。本方法は、テクスチャ成分又はジオメトリ成分の符号化表現の外側に配置されるフレームヘッダのグループを含む符号化済みビットストリームを受信し、テクスチャ成分又はジオメトリ成分の符号化に用いられるビデオコーデックを識別する段階と、符号化済みビットストリームを復号する段階とを含む。

Description

本開示は概して点群符号化に関するものであり、具体的には、点群符号化用の高レベルな構文に関する。
点群は、エンターテイメント業界、インテリジェント自動車のナビゲーション、地理空間的な検査、現実世界の対象物の3次元(3D)モデリング、仮想化などを含む幅広い用途で利用されている。点群の不均一なサンプリングジオメトリを考慮すると、そのようなデータの記憶及び伝送にはコンパクト表現が有益である。他の3D表示と比較すると、不規則な点群はより一般的であり、より広範囲のセンサ及びデータ取得方法に適用可能である。例えば、仮想現実世界での3D表示又はテレプレゼンス環境でのリモートレンダリングを行う場合、仮想形状のレンダリング及びリアルタイムの命令は、高密度な点群データ集合として処理される。
第1態様は、映像復号器により実施される点群符号化(PCC)の方法に関する。本方法は、テクスチャ成分又はジオメトリ成分の符号化表現の外側に配置されるフレームヘッダのグループを含む符号化済みビットストリームを受信し、テクスチャ成分又はジオメトリ成分の符号化に用いられるビデオコーデックを識別する段階と、符号化済みビットストリームを復号する段階とを含む。
第2態様は、映像符号化器により実施される点群符号化(PCC)の方法に関する。本方法は、テクスチャ成分又はジオメトリ成分の符号化表現の外側に配置されるフレームヘッダのグループを含む符号化済みビットストリームを生成し、テクスチャ成分又はジオメトリ成分の符号化に用いられるビデオコーデックを識別する段階と、符号化済みビットストリームを復号器に伝送する段階とを含む。
本方法は、後述する点群符号化に関連した複数の問題のうちの1つ又は複数を解決する高レベルな構文設計を提供する。したがって、映像符号化の処理及びビデオコーデックは改善され、より効率が良くなるといったようになる。
第1態様又は第2態様そのものによる本方法の第1の実装形態において、符号化表現はPCCネットワーク抽象化層(NAL)ユニットのペイロードに含まれる。
第1態様若しくは第2態様そのものによる本方法の第2の実装形態、又は第1態様若しくは第2態様の前述の任意の実装形態において、PCC NALユニットのペイロードは、ビデオコーデックに対応するジオメトリ成分を含む。
第1態様若しくは第2態様そのものによる本方法の第3の実装形態、又は第1態様若しくは第2態様の前述の任意の実装形態において、PCC NALユニットのペイロードは、ビデオコーデックに対応するテクスチャ成分を含む。
第1態様若しくは第2態様そのものによる本方法の第4の実装形態、又は第1態様若しくは第2態様の前述の任意の実装形態において、ビデオコーデックは高効率映像符号化(HEVC)である。
第1態様若しくは第2態様そのものによる本方法の第5の実装形態、又は第1態様若しくは第2態様の前述の任意の実装形態において、ビデオコーデックは高度映像符号化(AVC)である。
第1態様若しくは第2態様そのものによる本方法の第6の実装形態、又は第1態様若しくは第2態様の前述の任意の実装形態において、ビデオコーデックは汎用映像符号化(VVC)である。
第1態様若しくは第2態様そのものによる本方法の第7の実装形態、又は第1態様若しくは第2態様の前述の任意の実装形態において、ビデオコーデックは本質的映像符号化(EVC)である。
第1態様若しくは第2態様そのものによる本方法の第8の実装形態、又は第1態様若しくは第2態様の前述の任意の実装形態において、ジオメトリ成分は、点群フレームに関連付けられた座標のセットを含む。
第1態様若しくは第2態様そのものによる本方法の第9の実装形態、又は第1態様若しくは第2態様の前述の任意の実装形態において、座標のセットは直交座標である。
第1態様若しくは第2態様そのものによる本方法の第10の実装形態、又は第1態様若しくは第2態様の前述の任意の実装形態において、テクスチャ成分は、点群フレームの輝度サンプル値のセットを含む。
第3態様は、ピクチャを受信して符号化する又はビットストリームを受信して復号するように構成された受信機と、受信機に連結された送信機であって、ビットストリームを復号器に伝送する又は復号済み画像をディスプレイに伝送するように構成された送信機と、受信機又は送信機のうちの少なくとも1つに連結されたメモリであって、命令を格納するように構成されたメモリと、メモリに連結されたプロセッサであって、メモリに格納された命令を実行して、前述の態様又は実装形態のうちのいずれかの方法を行うように構成されたプロセッサとを含む符号化装置に関する。
符号化装置は、後述する点群符号化に関連した複数の問題のうちの1つ又は複数を解決する高レベルな構文設計を利用する。したがって、映像符号化の処理及びビデオコーデックは改善され、より効率が良くなるといったようになる。
第3態様そのものによる装置の第1の実装形態において、本装置はさらに、画像を表示するように構成されたディスプレイを含む。
第4態様は、符号化器と、符号化器と通信する復号器とを含むシステムに関する。符号化器又は復号器は、前述の態様又は実装形態のうちのいずれかの符号化装置を含む。
本システムは、後述する点群符号化に関連した複数の問題のうちの1つ又は複数を解決する高レベルな構文設計を利用する。したがって、映像符号化の処理及びビデオコーデックは改善され、より効率が良くなるといったようになる。
第5態様は、ピクチャを受信して符号化する又はビットストリームを受信して復号するように構成された受信手段と、受信手段に連結された伝送手段であって、ビットストリームを復号器に伝送する又は復号済み画像を表示手段に伝送するように構成された伝送手段と、受信手段又は伝送手段のうちの少なくとも1つに連結された記憶手段であって、命令を格納するように構成された記憶手段と、記憶手段に連結された処理手段であって、記憶手段に格納された命令を実行して、前述の態様又は実装形態のうちのいずれかにおける方法を行うように構成された処理手段とを含む符号化の手段に関する。
符号化の手段は、後述する点群符号化に関連した複数の問題のうちの1つ又は複数を解決する高レベルな構文設計を利用する。したがって、映像符号化の処理及びビデオコーデックは改善され、より効率が良くなるといったようになる。
明確にすることを目的に、前述の複数の実施形態のうちのいずれか1つは、本開示の範囲内の新たな実施形態を作成するために、その他の前述の実施形態のうちの任意の1つ又は複数と組み合わされてよい。
これらの特徴及び他の特徴は、添付の図面及び特許請求の範囲と併せて用いられる以下の詳細な説明によって明確に理解されるであろう。
本開示をより十分に理解するために、ここでは、添付図面及び詳細な説明と併せて用いられる以下の簡潔な説明を参照する。ここで、同じ参照番号は同じ部分を表す。
コンテキストモデリング技法を利用し得る例示的な符号化システムを示すブロック図である。
コンテキストモデリング技法を実装し得る例示的な映像符号化器を示すブロック図である。
コンテキストモデリング技法を実装し得る例示的な映像復号器を示すブロック図である。
PCCと互換性のあるデータ構造体の一実施形態の概略図である。
映像復号器により実装される点群符号化の方法の実施形態である。
映像符号化器により実装される点群符号化の方法の実施形態である。
例示的な映像符号化デバイスの概略図である。
符号化の手段の一実施形態に係る概略図である。
1つ又は複数の実施形態に係る例示的な実装態様が以下に提供されるが、開示されたシステム及び/又は方法は、現時点で知られているのか又は存在しているのかに関係なく、任意の数の技法を用いて実装されてよいことを最初に理解されたい。本開示は、本明細書において図示され説明される例示的な設計例及び実装形態を含む、以下に示される例示的な実装態様、図面、及び技法に決して限定されるべきではなく、添付の特許請求の範囲と共に、その均等物の全範囲内で修正されてよい。
映像符号化規格には、国際電気通信連合の電気通信標準化部門(ITU‐T)のH.261、国際標準化機構(ISO)/国際電気標準会議(IEC)の動画像符号化専門家グループ(MPEG)−1パート2、ITU‐TのH.262又はISO/IECのMPEG−2パート2、ITU−TのH.263、ISO/IECのMPEG−4パート2、ITU‐TのH.264又はISO/IECのMPEG−4パート10としても知られている高度映像符号化(AVC)、及びITU‐TのH.265又はMPEG−Hパート2としても知られている高効率映像符号化(HEVC)が含まれる。AVCには、スケーラブル映像符号化(SVC)、多視点映像符号化(MVC)、及び多視点映像符号化+深度(MVC+D)、並びに3DのAVC(3D−AVC)などの拡張版が含まれる。HEVCには、スケーラブルHEVC(SHVC)、多視点HEVC(MV−HEVC)、及び3DのHEVC(3D−HEVC)などの拡張版が含まれる。
点群とは、3D空間におけるデータ点の集合である。各データ点は、位置(例えば、X、Y、Z)、色(例えば、R、G、B、又はY、U、V)、及び場合によっては透過率、反射率、取得時間などのような他の特性を決定するパラメータで構成される。通常、クラウド内の各点は、その点に付与される同じ数の属性を有する。点群は、リアルタイムの3D没入型テレプレゼンス、インタラクティブな視差を用いて見るコンテンツ仮想現実(VR)、3Dの自由視点スポーツ再生放送、地理的情報システム、文化遺産、大規模な3Dの動的マップに基づく自律的ナビゲーション、及び自動車用途などの様々な用途に用いられてよい。
ISO/IECの動画像符号化専門家グループ(MPEG)は、可逆圧縮及び不可逆圧縮をされた点群データに対する、かなり高い符号化効率とネットワーク環境へのロバスト性とを有する点群符号化に関する新たなコーデック規格の開発を2016年に開始した。このコーデック規格を用いると、点群は、コンピュータデータの形態として操作され、また様々な記憶媒体に格納され、既存のネットワーク及び将来のネットワークを介して送受信され、既存の放送チャネル及び将来の放送チャネルで配信されることが可能になる。
近年、点群符号化(PCC)作業は、PCCカテゴリ1、PCCカテゴリ2、及びPCCカテゴリ3という3つのカテゴリに分類されるようになり、ここでは、2つの別個の作業案が開発されていた。1つはPCCカテゴリ2(PCC Cat2)用であり、もう1つはPCCカテゴリ1及びPCCカテゴリ3(PCC Cat13)用である。PCC Cat2用の最新作業案(WD)は、MPEGの出力ドキュメントN17534に含まれており、PCC Cat13用の最新WDはMPEGの出力ドキュメントN17533に含まれている。
PCC Cat2のWDにおけるPCC Cat2コーデックの設計の根底にある重要な指針は、既存のビデオコーデックを活用し、異なる映像シーケンスの集合として点群データを圧縮することにより、動的な点群のジオメトリ情報及びテクスチャ情報を圧縮することである。具体的には、2つの映像シーケンス(1つは点群データのジオメトリ情報を表しており、もう1つはテクスチャ情報を表している)が生成され、ビデオコーデックを用いて圧縮される。2つの映像シーケンスを解釈するための追加のメタデータ(すなわち、占有マップ及び補助パッチ情報)も、別々に生成され圧縮される。
残念ながら、PCCの既存の設計には欠点がある。例えば、1つの時間インスタンスに関連するデータユニット(すなわち、1つのアクセスユニット(AU))が復号順に連続していない。PCC Cat 2のWDでは、AUごとのテクスチャ情報、ジオメトリ情報、補助情報、及び占有マップのデータユニットは、フレームのグループの単位でインターリーブされる。すなわち、グループ内の全てのフレームのジオメトリデータは一緒になっている。テクスチャデータなどでも、同じであることが多い。PCC Cat 13のWDでは、AUごとのジオメトリのデータユニット及び一般的な属性は、PCCビットストリーム全体のレベルでインターリーブされる(例えば、PCCビットストリーム全体と同じ長さを有するフレームのグループが1つだけある場合、PCC Cat2のWDと同じである)。1つのAUに属するデータユニットをインターリーブすると、本質的にエンドツーエンドの大きな遅延が生じ、この遅延は、アプリケーションシステムの表示期間における少なくともフレームのグループの長さに等しい。
別の欠点は、ビットストリームフォーマットに関する。ビットストリームフォーマットは、0x0003のような開始コードパターンのエミュレーションを可能にするので、開始コードエミュレーションの防止が必要とされるMPEG−2のトランスポートストリーム(TS)を介した伝送に有効ではない。PCC Cat2では、現時点において、group_of_frames_geometry_video_payload( )及びgroup_of_frames_texture_video_payload( )だけが、HEVC又はAVCがジオメトリ成分及びテクスチャ成分の符号化に用いられる場合に、開始コードエミュレーションの防止を所定の位置に有している。PCC Cat13では、開始コードエミュレーションの防止はビットストリームのどこにも設けられていない。
PCC Cat2のWDでは、ジオメトリビットストリーム及びテクスチャビットストリームのコーデック情報の一部(例えば、どのコーデックか、コーデックのプロファイル、レベルなど)が、構造体group_of_frames_geometry_video_payload( )及びgroup_of_frames_texture_video_payload( )の複数のインスタンスに深く埋められている。さらに、補助情報及び占有マップの成分を復号する能力並びに点群再構成の能力を示すプロファイル及びレベルのような情報の一部が欠けている。
本明細書で開示されるのは、点群符号化に関連した前述の問題のうちの1つ又は複数を解決する高レベルな構文設計である。以下でより十分に説明されるように、本開示は、データユニットヘッダ(PCCネットワークアクセス層(NAL)ヘッダとも呼ばれる)に含まれるタイプインジケータを利用して、PCC NALユニットのペイロードにおいてコンテンツのタイプを指定する。さらに、本開示は、フレームヘッダNALユニットのグループを利用して、フレームヘッダパラメータのグループを搬送する。フレームヘッダNALユニットのグループは、それぞれのジオメトリビットストリーム又はテクスチャビットストリームのプロファイル及びレベルを信号で伝えるのにも用いられてよい。
図1は、PCC映像符号化技法を利用し得る例示的な符号化システム10を示すブロック図である。図1に示すように、符号化システム10は、その後に送信先デバイス14により復号される符号化済み映像データを提供する送信元デバイス12を含む。具体的には、送信元デバイス12は、コンピュータ可読媒体16を介して映像データを送信先デバイス14に提供してよい。送信元デバイス12及び送信先デバイス14は、デスクトップコンピュータ、ノートブック(例えば、ラップトップ)コンピュータ、タブレットコンピュータ、セットトップボックス、いわゆる「スマート」フォンなどの携帯電話機、いわゆる「スマート」パッド、テレビ、カメラ、表示デバイス、デジタルメディアプレイヤー、ビデオゲームコンソール、又はビデオストリーミングデバイスなどを含む幅広い範囲のデバイスのうちのいずれかを含んでよい。場合によっては、送信元デバイス12及び送信先デバイス14は、無線通信に対応してよい。
送信先デバイス14は、コンピュータ可読媒体16を介して、復号される符号化済み映像データを受信してよい。コンピュータ可読媒体16は、符号化済み映像データを送信元デバイス12から送信先デバイス14へと移動できる任意のタイプの媒体又はデバイスを有してよい。1つの例において、コンピュータ可読媒体16は、送信元デバイス12が符号化済み映像データを送信先デバイス14へとリアルタイムで直接伝送することを可能にする通信媒体を有してよい。符号化済み映像データは、無線通信プロトコルなどの通信規格に従って変調され、送信先デバイス14に伝送されてよい。通信媒体は、無線周波数(RF)スペクトル又は1つ若しくは複数の物理伝送回線などの任意の無線通信媒体又は有線通信媒体を含んでよい。通信媒体は、ローカルエリアネットワーク、ワイドエリアネットワーク、又はインターネットなどのグローバルネットワークなどの、パケットベースのネットワークの一部を形成してよい。通信媒体は、ルータ、スイッチ、基地局、又は送信元デバイス12から送信先デバイス14への通信を容易にするのに役立ち得る任意の他の機器を含んでよい。
いくつかの例において、符号化済みデータは、出力インタフェース22から記憶デバイスに出力されてよい。同様に、符号化済みデータは、入力インタフェースにより記憶デバイスからアクセスされてよい。記憶デバイスは、ハードドライブ、ブルーレイ(登録商標)ディスク、デジタルビデオディスク(DVD)、コンパクトディスクリードオンリメモリ(CD−ROM)、フラッシュメモリ、揮発性メモリ若しくは不揮発性メモリ、又は符号化済み映像データを格納するための任意の他の好適なデジタル記憶媒体などの様々な分散型又はローカルにアクセスされるデータ記憶媒体のうちのいずれかを含んでよい。さらなる例において、記憶デバイスは、送信元デバイス12により生成される符号化済み映像を格納し得るファイルサーバ又は別の中間記憶デバイスに対応してよい。送信先デバイス14は、ストリーミング又はダウンロードによって、格納された映像データに記憶デバイスからアクセスしてよい。ファイルサーバは、符号化済み映像データを格納し、当該符号化済み映像データを送信先デバイス14に伝送できる任意のタイプのサーバであってよい。例示的なファイルサーバには、(例えば、ウェブサイト向けの)ウェブサーバ、ファイル転送プロトコル(FTP)サーバ、ネットワーク接続型ストレージ(NAS)デバイス、又はローカルディスクドライブが含まれる。送信先デバイス14は、インターネット接続を含む任意の標準的なデータ接続を通じて、符号化済み映像データにアクセスしてよい。これには、無線チャネル(例えば、Wi−Fi(登録商標)接続)、有線接続(例えば、デジタル加入者回線(DSL)、ケーブルモデムなど)、又はファイルサーバに格納された符号化済み映像データにアクセスするのに好適な両方の組み合わせが含まれてよい。記憶デバイスからの符号化済み映像データの伝送は、ストリーミング伝送、ダウンロード伝送、又はこれらの組み合わせであってもよい。
本開示の技法は、必ずしも無線用途又は無線設定に限定されない。これらの技法は、無線テレビ放送、ケーブルテレビ放送、衛星テレビ放送、インターネットストリーミングビデオ放送(動的適応型HTTPストリーミング(DASH)など)、データ記憶媒体上に符号化されたデジタル映像、データ記憶媒体に格納されたデジタル映像の復号、又は他のアプリケーションなどの様々なマルチメディアアプリケーションのうちのいずれかをサポートする映像符号化に適用されてよい。いくつかの例において、符号化システム10は、一方向又は双方向の映像伝送をサポートして、ビデオストリーミング、ビデオ再生、ビデオ放送、及び/又は、ビデオテレフォニーなどのアプリケーションをサポートするように構成されてよい。
図1の例において、送信元デバイス12は、映像ソース18と、映像符号化器20と、出力インタフェース22とを含む。送信先デバイス14は、入力インタフェース28と、映像復号器30と、表示デバイス32とを含む。本開示によれば、送信元デバイス12の映像符号化器20及び/又は送信先デバイス14の映像復号器30は、映像符号化の技法を適用するように構成されてよい。他の実施例では、送信元デバイス及び送信先デバイスが他の構成要素又は装置を含んでよい。例えば、送信元デバイス12は、外部カメラなどの外部の映像ソースから映像データを受信してよい。同様に、送信先デバイス14は、一体化された表示デバイスを含むのではなく、外部の表示デバイスとインタフェースをとってよい。
図示された図1の符号化システム10は、単なる1つの例にすぎない。映像符号化の技法は、任意のデジタル映像符号化デバイス及び/又は復号デバイスにより実行されてよい。本開示の技法は概して、映像符号化デバイスにより実行されるが、これらの技法は、通常「コーデック」と呼ばれる映像符号化器/復号器により実行されてもよい。さらに本開示の技法は、映像プリプロセッサにより実行されてもよい。映像符号化器及び/又は復号器は、グラフィックス処理装置(GPU)又は同様のデバイスであってよい。
送信元デバイス12及び送信先デバイス14は、送信元デバイス12が送信先デバイス14に伝送するために符号化済み映像データを生成する、このような符号化デバイスの単なる例にすぎない。いくつかの例において、送信元デバイス12及び送信先デバイス14は、送信元デバイス12及び送信先デバイス14のそれぞれが映像符号化及び復号の構成要素を含むような実質的に対称的な方式で動作してよい。したがって、符号化システム10は、例えば、ビデオストリーミング、ビデオ再生、ビデオ放送、又はビデオテレフォニー用の映像デバイス12と14との間の一方向又は双方向の映像伝送をサポートしてよい。
送信元デバイス12の映像ソース18は、ビデオカメラなどの映像撮影デバイス、これまでに撮影した映像を含む映像アーカイブ、及び/又は映像コンテンツプロバイダから映像を受信する映像供給インタフェースを含んでよい。さらなる選択肢として、映像ソース18は、コンピュータグラフィックスベースのデータを、ソース映像、又はライブ映像、アーカイブ映像、及びコンピュータ生成映像の組み合わせとして生成してよい。
一部の例では、映像ソース18がビデオカメラである場合、送信元デバイス12及び送信先デバイス14は、いわゆるカメラ付き携帯電話又はテレビ電話を構成してよい。しかしながら上述したように、本開示で説明される技法は一般的に映像符号化に適用可能であってよく、また無線アプリケーション及び/又は有線アプリケーションに適用されてよい。それぞれの場合において、撮影された映像、事前に撮影された映像、又はコンピュータ生成映像は、映像符号化器20により符号化されてよい。符号化済み映像の情報は次に、出力インタフェース22により、コンピュータ可読媒体16に出力されてよい。
コンピュータ可読媒体16は、無線放送若しくは有線ネットワーク伝送などの一時的媒体、又はハードディスク、フラッシュドライブ、コンパクトディスク、デジタルビデオディスク、ブルーレイディスク、若しくは他のコンピュータ可読媒体などの記憶媒体(すなわち、非一時的記憶媒体)を含んでよい。いくつかの例では、ネットワークサーバ(不図示)が、符号化済み映像データを送信元デバイス12から受信し、当該符号化済み映像データを、例えばネットワーク伝送を介して送信先デバイス14に供給してよい。同様に、ディスク打抜き加工設備などの媒体生産設備のコンピューティングデバイスが、符号化済み映像データを送信元デバイス12から受信し、符号化済み映像データを含むディスクを生産してよい。したがって、コンピュータ可読媒体16は、様々な例において、様々な形態の1つ又は複数のコンピュータ可読媒体を含むものと理解されてよい。
送信先デバイス14の入力インタフェース28は、コンピュータ可読媒体16から情報を受信する。コンピュータ可読媒体16の情報は、映像符号化器20により規定され、映像復号器30によっても用いられ、特性並びに/又はブロック及び他の符号化ユニット(例えば、ピクチャのグループ(GOP))の処理を説明する構文要素を含む、構文情報を含んでよい。表示デバイス32は、復号済み映像データをユーザに表示し、ブラウン管(CRT)、液晶ディスプレイ(LCD)、プラズマディスプレイ、有機発光ダイオード(OLED)ディスプレイ、又は別のタイプの表示デバイスなどの様々な表示デバイスのうちのいずれかを有してよい。
映像符号化器20及び映像復号器30は、現在開発中の高効率映像符号化(HEVC)規格などの映像符号化規格に従って動作してよく、またHEVCのテストモデル(HM)に適合してよい。あるいは、映像符号化器20及び映像復号器30は、国際電気通信連合の電気通信標準化部門(ITU‐T)のH.264規格などの、あるいは動画像符号化専門家グループ(MPEG)−4パート10、高度映像符号化(AVC)H.265/HEVCと呼ばれる規格、又はそのような規格の拡張版などの他の専用規格又は業界規格に従って動作してよい。しかしながら、本開示の技法は、任意の特定の符号化規格に限定されない。映像符号化規格の他の例には、MPEG−2及びITU‐TのH.263が含まれる。図1には示していないが、いくつかの態様では、映像符号化器20及び映像復号器30はそれぞれ、音声符号化器及び復号器と一体化されてよく、適切なマルチプレクサ−デマルチプレクサ(MUX−DEMUX)ユニット、又は他のハードウェア及びソフトウェアを含み、共通のデータストリーム又は別個のデータストリーム内の音声及び映像の両方の符号化を処理してよい。妥当な場合、MUX−DEMUXユニットは、ITUのH.223マルチプレクサプロトコル、又はユーザデータグラムプロトコル(UDP)などの他のプロトコルに適合してよい。
映像符号化器20及び映像復号器30はそれぞれ、1つ又は複数のマイクロプロセッサ、デジタル信号プロセッサ(DSP)、特定用途向け集積回路(ASIC)、フィールドプログラマブルゲートアレイ(FPGA)、ディスクリートロジック、ソフトウェア、ハードウェア、ファームウェア、又はこれらの任意の組み合わせなどの様々な好適な符号化器回路のうちのいずれかとして実装されてよい。これらの技法が部分的にソフトウェアで実装される場合、デバイスが、ソフトウェアの命令を好適な非一時的コンピュータ可読媒体に格納し、1つ又は複数のプロセッサを用いるハードウェアで命令を実行して、本開示の技法を実行してよい。映像符号化器20及び映像復号器30のそれぞれは、1つ又は複数の符号化器又は復号器に含まれてよく、そのいずれも一体型符号化器/復号器(コーデック)の一部としてそれぞれのデバイスに統合されてよい。映像符号化器20及び/又は映像復号器30を含むデバイスが、集積回路、マイクロプロセッサ、及び/又は携帯電話などの無線通信デバイスを含んでよい。
図2は、映像符号化技法を実装し得る映像符号化器20の一例を示すブロック図である。映像符号化器20は、映像スライス内の映像ブロックのイントラ符号化及びインター符号化を実行してよい。イントラ符号化は、空間予測に依拠して、所与の映像フレーム又はピクチャ内の映像の空間冗長性を低減又は除去する。インター符号化は、時間予測に依拠して、映像シーケンスの隣接するフレーム又はピクチャ内の映像の時間冗長性を低減又は除去する。イントラモード(Iモード)は、いくつかの空間ベースの符号化モードのうちのいずれかを指してよい。片方向(片予測とも呼ばれる)予測(Pモード)又は双予測(双予測とも呼ばれる)(Bモード)などのインターモードは、いくつかの時間ベースの符号化モードのうちのいずれかを指してよい。
図2に示すように、映像符号化器20は、符号化される映像フレーム内の現在の映像ブロックを受信する。図2の例において、映像符号化器20は、モード選択ユニット40と、参照フレームメモリ64と、加算器50と、変換処理ユニット52と、量子化ユニット54と、エントロピー符号化ユニット56とを含む。次にモード選択ユニット40は、動き補償ユニット44と、動き推定ユニット42と、イントラ予測(イントラ予測とも呼ばれる)ユニット46と、分割ユニット48とを含む。映像符号化器20はまた、映像ブロック再構成のために、逆量子化ユニット58と、逆変換ユニット60と、加算器62とを含む。非ブロック化フィルタ(図2には示されていない)が、ブロック境界をフィルタリングして、再構成済み映像から濃淡のむらがあるアーチファクトを除去するために含まれてもよい。必要であれば、非ブロック化フィルタは通常、加算器62の出力をフィルタリングすることになるであろう。追加のフィルタ(ループ内又はループ後)も、非ブロック化フィルタに加えて用いられてよい。そのようなフィルタは簡略して表現するために示されていないが、必要であれば、(ループ内フィルタとして)加算器50の出力をフィルタリングしてよい。
符号化処理の際に、映像符号化器20は符号化される映像フレーム又はスライスを受信する。フレーム又はスライスは、複数の映像ブロックに分割されてよい。動き推定ユニット42及び動き補償ユニット44は、受信した映像ブロックのインター予測符号化を、1つ又は複数の参照フレーム内の1つ又は複数のブロックと比較することで行い、時間予測を提供する。イントラ予測ユニット46は代替的に、受信した映像ブロックのイントラ予測符号化を、符号化されるブロックと同じフレーム又はスライス内の1つ又は複数の隣接ブロックと比較することで行い、空間予測を提供してよい。映像符号化器20は、複数の符号化パスを実行して、例えば、映像データのブロックごとに適切な符号化モードを選択してよい。
さらに、分割ユニット48は、以前の符号化パスにおける以前の分割方式の評価に基づいて、映像データの各ブロックを複数のサブブロックに分割してよい。例えば、分割ユニット48は最初に、フレーム又はスライスを最大符号化ユニット(LCU)に分割し、レート歪み解析(例えばレート歪み最適化)に基づいて、LCUのそれぞれを複数のサブ符号化ユニット(サブCU)に分割してよい。モード選択ユニット40はさらに、LCUを複数のサブCUに分割することを示すクアッドツリーデータ構造体を生み出してもよい。クアッドツリーのリーフノードCUは、1つ又は複数の予測ユニット(PU)及び1つ又は複数の変換ユニット(TU)を含んでよい。
本開示は、HEVCの文脈においてCU、PU、若しくはTUのうちのいずれか、又は他の規格の文脈において同様のデータ構造体(例えば、H.264/AVCにおける、そのマクロブロック及びサブブロック)を指すのに「ブロック」という用語を用いる。CUは、符号化ノード、符号化ノードに関連付けられたPU及びTUを含む。CUのサイズは符号化ノードのサイズに対応し、形状は正方形である。CUのサイズは、8×8画素から最大64×64画素以上のツリーブロックのサイズまでの範囲に及んでよい。各CUは、1つ又は複数のPU及び1つ又は複数のTUを含んでよい。CUに関連付けられた構文データが、例えば、CUを1つ又は複数のPUに分割することを記述してよい。分割モードは、CUがスキップ又はダイレクトモードで符号化されるのか、イントラ予測モードで符号化されるのか、又はインター予測(インター予測とも呼ばれる)モードで符号化されるのかで、異なってよい。PUは、非正方形の形状になるように分割されてよい。CUに関連付けられた構文データは、例えば、クアッドツリーに従ってCUを1つ又は複数のTUに分割することを記述してもよい。TUは、正方形又は非正方形(例えば、矩形)の形状になり得る。
モード選択ユニット40は、符号化モードのうちの1つ(イントラ符号化モード又はインター符号化モード)を、例えばエラー結果に基づいて選択してよく、結果として得られるイントラ符号化ブロック又はインター符号化ブロックを、残差ブロックデータを生成する加算器50と、符号化済みブロックを参照フレームとして用いるために再構成する加算器62とに提供する。モード選択ユニット40はまた、動きベクトル、イントラモードインジケータ、分割情報、及び他のそのような構文情報などの構文要素をエントロピー符号化ユニット56に提供する。
動き推定ユニット42及び動き補償ユニット44は、高度に統合されてよいが、概念的な説明のために別々に示されている。動き推定ユニット42により行われる動き推定は、映像ブロックの動きを推定する動きベクトルを生成する処理である。動きベクトルは、例えば、参照フレーム(又は他の符号化ユニット)内の予測ブロックに対する、現在の映像フレーム又はピクチャ内の映像ブロックのPUの変位を、現在のブロックが現在のフレーム(又は他の符号化ユニット)内で符号化されることと比較して示してよい。予測ブロックは、画素差分の点で、符号化されるブロックによく一致することが分かっているブロックであり、画素差分は、差分絶対値和(SAD)、差分二乗和(SSD)、又は他の差分メトリクスによって決定されてよい。いくつかの例において、映像符号化器20は、参照フレームメモリ64に格納された参照ピクチャのサブ整数画素位置の値を計算してよい。例えば、映像符号化器20は、参照ピクチャの1/4画素位置、1/8画素位置、又は他の端数画素位置の値を補間してよい。したがって、動き推定ユニット42は、完全画素位置及び端数画素位置に対して動き検索を実行し、端数画素精度を有する動きベクトルを出力してよい。
動き推定ユニット42は、インター符号化スライス内の映像ブロックのPUに対する動きベクトルを、PUの位置と参照ピクチャの予測ブロックの位置とを比較することで計算する。参照ピクチャは、第1の参照ピクチャリスト(リスト0)又は第2の参照ピクチャリスト(リスト1)から選択されてよく、これらのリストのそれぞれは、参照フレームメモリ64に格納された1つ又は複数の参照ピクチャを識別する。動き推定ユニット42は、計算された動きベクトルをエントロピー符号化ユニット56及び動き補償ユニット44に送信する。
動き補償ユニット44により行われる動き補償は、動き推定ユニット42により決定される動きベクトルに基づいて予測ブロックを取得する又は生成することを必要とし得る。ここでも、動き推定ユニット42及び動き補償ユニット44は、いくつかの例において機能的に統合されてよい。動き補償ユニット44は、現在の映像ブロックのPUに対する動きベクトルを受信すると、動きベクトルが複数の参照ピクチャリストのうちの1つにおいて示す予測ブロックの位置を特定してよい。加算器50は、後述するように、符号化された現在の映像ブロックの画素値から予測ブロックの画素値を減算することで残差映像ブロックを形成し、画素差分値を形成する。一般的に、動き推定ユニット42は、輝度成分に対して動き推定を行い、動き補償ユニット44は輝度成分に基づいて計算された動きベクトルをクロマ成分及び輝度成分の両方に用いる。モード選択ユニット40も、映像復号器30が映像スライスの映像ブロックを復号する際に用いるために、映像ブロック及び映像スライスと関連付けられた構文要素を生成してよい。
イントラ予測ユニット46は、上述したように、動き推定ユニット42及び動き補償ユニット44により行われるインター予測の代替として、現在のブロックをイントラ予測してよい。具体的には、イントラ予測ユニット46は、現在のブロックを符号化するのに用いるイントラ予測モードを決定してよい。いくつかの例において、イントラ予測ユニット46は、例えば別個の符号化パスで、様々なイントラ予測モードを用いて現在のブロックを符号化してよく、イントラ予測ユニット46(又はいくつかの例ではモード選択ユニット40)は、テストしたモードから、用いるのに適切なイントラ予測モードを選択してよい。
例えば、イントラ予測ユニット46は、様々なテストされたイントラ予測モードに対して、レート歪み解析を用いてレート歪み値を計算し、テストしたモードの中で最良のレート歪み特性を有するイントラ予測モードを選択してよい。レート歪み解析は概して、符号化済みブロックと、符号化済みブロックを生み出すために符号化された元の符号化前のブロックとの間の歪み(又はエラー)の量、及び符号化済みブロックを生み出すのに用いられるビットレート(すなわち、ビット数)を決定する。イントラ予測ユニット46は、様々な符号化済みブロックの歪み及びレートから比を計算し、どのイントラ予測モードが該当ブロックに対して最良のレート歪み値を示すかを判定してよい。
さらに、イントラ予測ユニット46は、深度モデリングモード(DMM)を用いて、深度マップの深度ブロックを符号化するように構成されてよい。モード選択ユニット40は、利用可能なDMMモードが、イントラ予測モード及び(例えば、レート歪み最適化(RDO)を用いる)その他のDMMモードより良好な符号化結果を生み出すかどうかを判定してよい。深度マップに対応するテクスチャ画像のデータが、参照フレームメモリ64に格納されてよい。動き推定ユニット42及び動き補償ユニット44は、深度マップの深度ブロックをインター予測するように構成されてもよい。
イントラ予測ユニット46は、あるブロックに対してイントラ予測モード(例えば、従来のイントラ予測モード又は複数のDMMモードのうちの1つ)を選択した後に、当該ブロックに対して選択したイントラ予測モードを示す情報をエントロピー符号化ユニット56に供給してよい。エントロピー符号化ユニット56は、選択されたイントラ予測モードを示す情報を符号化してよい。映像符号化器20は、伝送されるビットストリームにコンフィギュレーションデータを含んでよく、コンフィギュレーションデータには、複数のイントラ予測モードインデックステーブル及び複数の修正されたイントラ予測モードインデックステーブル(符号語マッピングテーブルとも呼ばれる)、様々なブロックの符号化コンテキストの定義、並びにコンテキストごとに用いられる最も可能性の高いイントラ予測モード、イントラ予測モードインデックステーブル、及び修正されたイントラ予測モードインデックステーブルのインジケーションを含んでよい。
映像符号化器20は、モード選択ユニット40からの予測データを符号化された元の映像ブロックから減算することで残差映像ブロックを形成する。加算器50は、この減算処理を行う成分又は複数の成分を表す。
変換処理ユニット52は、離散コサイン変換(DCT)又は概念的に同様の変換などの変換を残差ブロックに適用して、残差変換係数値を含む映像ブロックを生成する。変換処理ユニット52は、概念的にDCTと同様の他の変換を実行してよい。ウェーブレット変換、整数変換、サブバンド変換、又は他のタイプの変換も用いられる可能性がある。
変換処理ユニット52は、残差ブロックに変換を適用して、残差変換係数のブロックを生成する。この変換は、画素値ドメインからの残差情報を、周波数ドメインなどの変換ドメインに変換してよい。変換処理ユニット52は、結果として得られる変換係数を量子化ユニット54に送信してよい。量子化ユニット54は、この変換係数を量子化して、ビットレートをさらに低減する。量子化処理は、これらの係数の一部又は全てと関連付けられたビット深度を低減してよい。量子化の程度は、量子化パラメータを調整することで修正されてよい。いくつかの例において、量子化ユニット54は次に、量子化変換係数を含む行列のスキャンを実行してよい。あるいは、エントロピー符号化ユニット56がスキャンを実行してもよい。
量子化に続いて、エントロピー符号化ユニット56は、量子化変換係数をエントロピー符号化する。例えば、エントロピー符号化ユニット56は、コンテキスト適応型変数長符号化(CAVLC)、コンテキスト適応型2値算術符号化(CABAC)、構文ベースのコンテキスト適応型2値算術符号化(SBAC)、確率区間区分エントロピー(PIPE)符号化、又は別のエントロピー符号化技法を実行してよい。コンテキストベースのエントロピー符号化の場合、コンテキストは隣接ブロックに基づいてよい。エントロピー符号化ユニット56によるエントロピー符号化に続いて、符号化済みビットストリームは、別のデバイス(例えば、映像復号器30)に伝送されても、後の伝送又は検索のためにアーカイブされてもよい。
逆量子化ユニット58及び逆変換ユニット60が逆量子化及び逆変換にそれぞれ適用され、例えば、参照ブロックとして後で用いるために、画素ドメインにおいて残差ブロックを再構成する。動き補償ユニット44は、残差ブロックを参照フレームメモリ64の複数のフレームのうちの1つの予測ブロックに追加することにより、参照ブロックを計算してよい。動き補償ユニット44はまた、1つ又は複数の補間フィルタを再構成済み残差ブロックに適用し、動き推定で使用するサブ整数画素値を計算してよい。加算器62は、動き補償ユニット44により生成された再構成済み残差ブロックを動き補償予測ブロックに追加して、参照フレームメモリ64に記憶するために再構成済み映像ブロックを生成する。再構成済み映像ブロックは、次の映像フレームのブロックをインター符号化するために、動き推定ユニット42及び動き補償ユニット44によって参照ブロックとして用いられてよい。
図3は、映像符号化技法を実装し得る映像復号器30の一例を示すブロック図である。図3の例において、映像復号器30は、エントロピー復号ユニット70と、動き補償ユニット72と、イントラ予測ユニット74と、逆量子化ユニット76と、逆変換ユニット78と、参照フレームメモリ82と、加算器80とを含む。映像復号器30は、いくつかの例において、映像符号化器20(図2)に関して説明した符号化パスに概して相補的な復号パスを実行してよい。動き補償ユニット72は、エントロピー復号ユニット70から受信する動きベクトルに基づいて予測データを生成してよく、イントラ予測ユニット74は、エントロピー復号ユニット70から受信するイントラ予測モードインジケータに基づいて予測データを生成してよい。
復号処理の際に、映像復号器30は、符号化済み映像スライスの映像ブロック、及び映像符号化器20からの関連構文要素を表す符号化済み映像ビットストリームを受信する。映像復号器30のエントロピー復号ユニット70は、ビットストリームをエントロピー復号して、量子化された係数、動きベクトル又はイントラ予測モードインジケータ、及び他の構文要素を生成する。エントロピー復号ユニット70は、動きベクトル及び他の構文要素を動き補償ユニット72に転送する。映像復号器30は、映像スライスレベル及び/又は映像ブロックレベルで構文要素を受信してよい。
映像スライスがイントラ符号化(I)スライスとして符号化される場合、イントラ予測ユニット74は、信号で伝えられたイントラ予測モードと現在のフレーム又はピクチャのこれまでに復号されたブロックからのデータとに基づいて、現在の画像スライスの映像ブロックに対する予測データを生成してよい。映像フレームがインター符号化(例えば、B、P、又はGPB)スライスとして符号化される場合、動き補償ユニット72は、エントロピー復号ユニット70から受信する動きベクトルと他の構文要素とに基づいて、現在の画像スライスの映像ブロックに対する予測ブロックを生成する。予測ブロックは、複数の参照ピクチャリストのうちの1つにある複数の参照ピクチャのうちの1つから生成されてよい。映像復号器30は、参照フレームメモリ82に格納された参照ピクチャに基づき、デフォルトの構成技法を用いて、参照フレームリスト(リスト0及びリスト1)を構成してよい。
動き補償ユニット72は、動きベクトル及び他の構文要素を解析することで、現在の画像スライスの映像ブロックに対する予測情報を決定し、当該予測情報を用いて、復号された現在の映像ブロックに対する予測ブロックを生成する。例えば、動き補償ユニット72は、受信した構文要素の一部を用いて、映像スライスの映像ブロックを符号化するのに用いられる予測モード(例えば、イントラ予測又はインター予測)、インター予測スライスのタイプ(例えば、Bスライス、Pスライス、又はGPBスライス)、スライスの複数の参照ピクチャリストのうちの1つ又は複数に対する構成情報、スライスのインター符号化済み映像ブロックごとの動きベクトル、スライスのインター符号化映像ブロックごとのインター予測ステータス、及び現在の画像スライスの映像ブロックを復号するための他の情報を決定する。
動き補償ユニット72は、補間フィルタに基づいて補間も実行してよい。動き補償ユニット72は映像ブロックの符号化の際に映像符号化器20により用いられる補間フィルタを用いて、参照ブロックのサブ整数画素に対する補間値を計算してよい。この場合、動き補償ユニット72は、受信した構文要素から映像符号化器20により用いられる補間フィルタを決定し、当該補間フィルタを用いて予測ブロックを生成してよい。
深度マップに対応するテクスチャ画像のデータが、参照フレームメモリ82に格納されてよい。動き補償ユニット72は、深度マップの深度ブロックをインター予測するように構成されてもよい。
上記を念頭に置いて、本開示の基本概念の一部が説明される。
PCC Cat2では、上述した第1の問題を解決するために、1つの時間インスタンス(例えば、1つのアクセスユニット)に関連するデータユニットは、復号順に連続してビットストリームに配置されるはずである。これらのデータユニットが復号順に連続してビットストリームに配置されると、各データユニットのタイプを識別することで、各データユニットを適切な復号器コンポーネントにルーティングする識別が可能になる。この設計はまた、既存のビデオコーデックを活用して、動的な点群のジオメトリ情報及びテクスチャ情報を圧縮するという、PCC Cat2コーデックの根底にある重要な構想に違反するのを回避できるはずである。
既存のビデオコーデックを活用し、例えば、例としてHEVCを挙げると、ジオメトリ情報及びテクスチャ情報を別々に圧縮し、同時に1つの自己完結型のPCC Cat2ビットストリームを有することができるために、以下の態様は次のように明確に指定されるはずである。すなわち、(1)PCC Cat2ビットストリームからのジオメトリ成分用の適合HEVCビットストリームの抽出/構成、(2)PCC Cat2ビットストリームからのテクスチャ成分用の適合HEVCビットストリームの抽出/構成、及び(3)ジオメトリ成分及びテクスチャ成分用に抽出された適合HEVCビットストリームのそれぞれの適合点(すなわち、プロファイル、階層、レベル)のシグナリング/インジケーションである。
上述した問題を解決するために、且つ上述した制約を全て満たすために、本開示は、PCCの高レベルな構文に関する2つの代替的なセットの方法を提供する。
第1セットの方法では、PCC Cat2のジオメトリ成分及びテクスチャ成分の符号化に用いられ得る全てのビデオコーデックに対して、共通の高レベルな構文が存在する。このセットの方法は、次のように要約される。
図4は、PCCと互換性のあるデータ構造体400を示す。データ構造体400は、符号化器により生成され且つ復号器により受信されるビットストリームの一部を表してよい。図示するように、データユニットヘッダ404(PCC NALユニットヘッダと呼ばれることがある)がデータユニット402(PCC NALユニットと呼ばれることがある)ごとに追加される。1つのデータユニット402と1つのデータユニットヘッダ404とが図4のデータ構造体400に示されているが、実際の応用では、任意の数のデータユニット402及びデータユニットヘッダ404がデータ構造体400に含まれてよい。さらに言えば、データ構造体400を含むビットストリームが一連のデータユニット402を含み、それぞれがデータユニットヘッダ404を含んでよい。
データユニットヘッダ404は、例えば、1つ又は2つのバイトを含んでよい。一実施形態において、各データユニット402は、1つのPCC NALユニットとして形成される。データユニット402はペイロード406を含む。一実施形態において、データユニット406は、補足拡張情報(SEI)メッセージ、シーケンスパラメータセット、ピクチャパラメータセット、スライス情報なども含んでよい。
一実施形態において、データユニット402のペイロード406は、HEVCユニットであってもAVC NALユニットであってもよい。一実施形態において、ペイロード406は、ジオメトリ成分又はテクスチャ成分のデータを含んでよい。一実施形態において、ジオメトリ成分は、点群フレームと関連付けられた直交座標のセットである。一実施形態において、テクスチャ成分は、点群フレームの輝度サンプル値のセットである。HEVCが用いられる場合、データユニット402は、ペイロード406としてHEVC NALユニットを含むPCC NALユニットと呼ばれることがある。AVCが用いられる場合、データユニット402は、ペイロード406としてAVC NALユニットを含むPCC NALユニットと呼ばれることがある。
一実施形態において、データユニットヘッダ404(例えば、PCC NALユニットヘッダ)は、以下に要約されるように設計される。
まず、データユニットヘッダ404はタイプインジケータを含む。タイプインジケータは、例えば、5ビットであってよい。タイプインジケータは、ペイロード406で搬送されるコンテンツのタイプを指定する。例えば、タイプインジケータは、ペイロード406がジオメトリ情報又はテクスチャ情報を含むことを指定してよい。
一実施形態において、予約されたデータユニット(データユニット402と同様であるが、後で用いるために予約されている)の一部は、PCC Cat13のデータユニットに用いられてよい。したがって、本開示の構想は、PCC Cat13にも適用される。そのため、PCC Cat2とPCC Cat13とを1つのコーデック標準仕様書に統一することが可能である。
上述したように、現在のビットストリームフォーマットは、例えば、新たなNALユニット又はPCC NALユニットの開始を信号で伝える開始コードパターンのエミュレーションを可能にする。開始コードパターンは、例えば、0x0003であってよい。現在のビットストリームフォーマットは開始コードパターンのエミュレーションを可能にするので、開始コードは意図せずに信号で伝えられることがある。本開示は、この課題を解決するために、PCC NALユニット構文及びセマンティクス(以下を参照)を提供する。本明細書に示されるPCC NALユニット構文及びセマンティクスによって、開始コードエミュレーションの防止がPCC NALユニットごとに、そのコンテンツに関係なく確実に行われる。したがって、1バイト又は2バイトのデータユニットヘッダ404の最後のバイト(例えば、1バイトであれば、データユニットヘッダそのもの)は、0x00に等しくなるのを禁じられている。
さらに、フレームヘッダ408のグループ(フレームヘッダNALユニットのグループとも呼ばれる)は、フレームヘッダパラメータのグループを搬送するように設計される。さらに、フレームヘッダNALユニットのグループは、例えば、それぞれのジオメトリビットストリーム又はテクスチャビットストリームのプロファイル及びレベルなどの、他の全体的な情報のシグナリングを含む。一実施形態において、プロファイルは、構文の指定サブセット又は符号化ツールのサブセットである。一実施形態において、レベルは、構文要素及び変数が用い得る値に対する制約の規定セットのである。一実施形態において、ビットストリームのプロファイルとレベルとの組み合わせは、ビットストリームの復号に必要な特定の復号能力を表す。さらに、プロファイル及びレベルが、補助情報及び占有マップの復号、並びに(ジオメトリ、テクスチャ、補助情報、及び占有マップの復号結果を利用する)点群再構成処理のためにも規定される場合、当該プロファイル及びレベルもフレームヘッダ408のグループに信号で伝えられる。一実施形態において、PCC補助情報は、パッチ情報、及び(PCC符号化ビットストリームからの点群信号の再構成に用いられる)点局所再構成情報のような情報を指す。一実施形態において、PCC占有マップは、テクスチャ値及び他の属性がサンプリングされる対象物によって3D空間のどの部分が占有されるかに関する情報を意味する。
以下の構文で示されるように、異なるタイプのデータユニット402(PCC NALユニットとも呼ばれる)の順序に関する制約は明確に指定される。さらに、(データユニット402、データユニットヘッダ404などのうちのいくつかを含み得る)アクセスユニット410の開始は明確に指定される。
さらに、それぞれのジオメトリビットストリーム又はテクスチャビットストリームの抽出/構成用の処理は、後述する構文及び/又はセマンティクスに明確に指定される。
第2セットの方法では、異なる全体的な構文が異なるビデオコーデックに用いられる。ジオメトリ及びテクスチャの符号化にHEVCを用いるPCC Cat2は、HEVCに対する修正版として指定され、ジオメトリ及びテクスチャの符号化にAVCを用いるPCC Cat2は、AVCに対する修正版として指定される。このセットの方法は、次のように要約される。
ジオメトリ及びテクスチャの符号化にHEVCを用いるPCC Cat2では、ジオメトリ及びテクスチャは3つの別個の層(例えば、ジオメトリ用にd0及びd1という2つの層、テクスチャ用に1つの層)とみなされる。SEIメッセージ又は新たなタイプのNALユニットが、占有マップ及び補助情報に用いられる。2つの新たなSEIメッセージ(1つは占有マップ用、もう1つは補助情報用)が指定される。別のSEIメッセージ(シーケンスレベル)が、フレームヘッダパラメータのグループ及び他の全体的な情報を搬送するように指定される。このSEIメッセージは、第1セットの方法におけるフレームヘッダ408のグループと同様である。
ジオメトリ及びテクスチャの符号化にAVCを用いるPCC Cat2では、ジオメトリ及びテクスチャは、3つの別個の層(例えば、ジオメトリ用にd0及びd1という2つの層、テクスチャ用に1つの層)とみなされる。SEIメッセージ又は新たなタイプのNALユニットが、占有マップ及び補助パッチ情報に用いられる。個々に符号化された非ベース層の抽出と、適合点のシグナリング(例えば、プロファイル及びレベル)とは、単一層ビットストリームとして指定される。2つの新たなタイプのSEIメッセージ(1つは占有マップ用、もう1つは補助情報用)が指定される。別のSEIメッセージ(シーケンスレベル)が、フレームヘッダパラメータのグループ及び他の全体的な情報を搬送するように指定される。このSEIメッセージは、第1セットの方法におけるフレームヘッダ408のグループと同様である。
上述した第1セットの方法は、以下に開示する定義、略語、構文、及びセマンティクスに基づいて実現され得る。具体的に言及されない態様は、最新のPCC Cat2のWDに見られるものと同じである。
以下の定義が適用される。
ビットストリーム:1つ又は複数のCPSを形成する符号化された点群フレーム及び関連データの表現を構成する一連のビットである。
バイト:8ビットの配列であり、ビット値の配列として書き込まれる又は読み出される場合、配列内の左端及び右端のビットはそれぞれ、最上位ビット及び最下位ビットを表す。
符号化PCCシーケンス(CPS):復号順に、PCCイントラランダムアクセスピクチャ(IRAP)のAU、その後に続くPCC IRAP AUではないゼロ又はゼロより多くのPCC AUを含み、後続の全てのPCC AUまでを含むが、PCC IRAP AUである後続のPCC AUを何も含まない、PCC AUの配列である。
復号順:構文要素が復号処理によって処理される順序である。
復号処理:この仕様書(PCC Cat2のWDとも呼ばれる)に指定される、ビットストリームを読み出し、ビットストリームから復号点群フレームを抽出する処理である。
フレームヘッダNALユニットのグループ:GOF_HEADERに等しいPccNalUnitTypeを有するPCC NALユニットである。
PCC AU:指定された分類ルールに従って互いに関連付けられ、復号順に連続しており、1つの特定の表示時間に関連する全てのPCC NALユニットを含む、PCC NALユニットのセットである。
PCC IRAP AU:フレームヘッダNALユニットのグループを含むPCC AUである。
PCC NALユニット:続くデータのタイプのインジケーションと、必要に応じてエミュレーション防止バイトが組み入れられたRBSPの形態で当該データを含むバイトとを含む構文構造である。
ローバイトシーケンスペイロード(RBSP):PCC NALユニットにカプセル化され、空であるか、又はRBSP停止ビットと0に等しいゼロ又はゼロより多くの後続ビットとが後に続く構文要素を含むデータビット列(SODB)の形態を有する、整数個のバイトを含む構文構造である。
ローバイトシーケンスペイロード(RBSP)停止ビット:RBSP内においてSODBの後に存在する1に等しいビットであり、RBSP内の端部の位置は、RBSP内の最後の非ゼロビットであるRBSP停止ビットをRBSPの端部から検索することにより識別することができる。
SODB:RBSP内においてRBSP停止ビットの前に存在する構文要素を表す複数個のビットの配列であり、左端のビットは先頭の最上位ビットであるとみなされ、右端のビットは最後の最下位ビットであるとみなされる。
構文要素:ビットストリームで表されるデータの要素である。
構文構造:指定された順序でビットストリーム内に一緒に存在するゼロ又はゼロより多くの構文要素である。
映像AU:特定のビデオコーデック当たりのアクセスユニットである。
映像NALユニット:GEOMETRY_D0、GEOMETRY_D1、又はTEXTURE_NALUに等しいPccNalUnitTypeを有するPCC NALユニットである。
以下の略語が適用される。
AU:アクセスユニット
CPS:符号化PCCシーケンス
IRAP:イントラランダムアクセスポイント
NAL:ネットワーク抽象化層
PCC:点群符号化
RBSP:ローバイトシーケンスペイロード
SODB:データビット列
以下では、構文、セマンティクス、及びサブビットストリーム抽出処理を提供する。その関連で、最新のPCC Cat2のWDの7.3項にある構文は、以下の事項に置き換えられる。
PCC NALユニット構文が提供される。具体的には、一般的なPCC NALユニット構文は次の通りである。
Figure 2021528917
PCC NALユニットヘッダ構文は次の通りである。
Figure 2021528917
ローバイトシーケンスペイロード、トレーリングビット、バイトアライメント構文が提供される。具体的には、フレームRBSP構文のグループは次の通りである。
Figure 2021528917
補助情報フレームRBSP構文は次の通りである。
Figure 2021528917
占有マップフレームRBSP構文は次の通りである。
Figure 2021528917
HEVC仕様書の7.3.2.11項にあるRBSPトレーリングビット構文が適用される。同様に、HEVC仕様書の7.3.2.12項にあるバイトアライメント構文が適用される。PCCプロファイル及びレベルの構文は次の通りである。
Figure 2021528917
最新のPCC Cat2のWDの7.4項にあるセマンティクスは、以下の事項及びその副項に置き換えられる。
一般的に、構文構造及びこれらの構造内の構文要素に関連したセマンティクスが、この副項に指定される。構文要素のセマンティクスが表又は表のセットを用いて指定される場合、表に指定されていない任意の値は、他に特に指定がなければ、ビットストリームに存在しないものとする。
PCC NALユニットのセマンティクスが説明される。一般的なPCC NALユニットのセマンティクスの場合、HEVC仕様書の7.4.2.1項にある一般的なNALユニットのセマンティクスが適用される。PCC NALユニットヘッダのセマンティクスは次の通りである。
forbidden_zero_bitは、0に等しいものとする。
pcc_nuh_reserved_zero_2bitsは、この仕様書のこのバージョンに適合するビットストリームでは、0に等しいものとする。pcc_nuh_reserved_zero_2bitsの他の値は、将来の使用のためにISO/IECにより予約されている。復号器は、pcc_nuh_reserved_zero_2bitsの値を無視するものとする。
pcc_nal_unit_type_plus1−1は、変数PccNalUnitTypeの値を指定し、PccNalUnitTypeは、表1に指定されるように(下記を参照)、PCC NALユニットに含まれるRBSPデータ構造体のタイプを指定する。変数NalUnitTypeは、次のように指定される。
PccNalUnitType=pcc_category2_nal_unit_type_plus1−1 (7−1)
セマンティクスが指定されていない、UNSPEC25〜UNSPEC30(両端を含む)の範囲内にあるnal_unit_typeを有するPCC NALユニットは、本明細書に指定される復号処理に影響を与えないものとする。
注1:UNSPEC25〜UNSPEC30の範囲内にあるPCC NALユニットのタイプは、その用途により決定されるように用いられてよい。PccNalUnitTypeのこれらの値に対する復号処理は、本明細書では指定されない。異なる用途では、これらのPCC NALユニットタイプを異なる目的に用いるかもしれないので、これらのPccNalUnitTypeの値を用いてPCC NALユニットを生成する符号化器の設計と、これらのPccNalUnitTypeの値を用いてPCC NALユニットのコンテンツを解釈する復号器の設計とには、特別な注意を払う必要がある。本明細書は、これらの値のいかなる管理も定めていない。これらのPccNalUnitTypeの値は、使用法の「不一致」(例えば、同じPccNalUnitTypeの値に対するPCC NALユニットコンテンツの意味の異なる定義)が重要でない、又はあり得ない、又は管理されている(例えば、制御アプリケーション若しくはトランスポート仕様書で、又はビットストリームが配信される環境を制御することにより、規定されているか又は管理されている)という文脈で使用する場合に限り好適であるかもしれない。
ビットストリームの復号ユニット内のデータ量を決定する以外の目的で、復号器は、PccNalUnitTypeの予約値を用いる全てのPCC NALユニットのコンテンツを無視する(ビットストリームから除去して棄却する)ものとする。
注2:この要件により、この仕様書に対する互換性のある拡張版の将来の定義が可能となる。
Figure 2021528917
注3:識別されたビデオコーデック(例えば、HEVC又はAVC)が、各CPSの第1のPCC AUに存在するフレームヘッダNALユニットのグループに示されている。
RBSP内のSODBのカプセル化(情報伝達)が提供される。その関連で、HEVC仕様書の7.4.2.3項が適用される。
PCC NALユニット及びAU及びCPSへの関連性についての順序が提供される。一般的に、この項は、ビットストリーム内のPCC NALユニットの順序に関する制約を指定する。
これらの制約に従うビットストリーム内のPCC NALユニットのいかなる順序も、本明細書ではPCC NALユニットの復号順と呼ばれる。映像NALユニットではないPCC NALユニットにおいては、7.3項の構文が構文要素の復号順を指定する。映像NALユニットにおいては、識別されたビデオコーデックの仕様書で指定される構文が、構文要素の復号順を指定する。復号器は、PCC NALユニット及びその構文要素を復号順に受信することができる。
PCC NALユニット及びそのPCC AUへの関連性についての順序が提供される。
この項は、PCC NALユニット及びそのPCC AUへの関連性についての順序を指定する。
PCC AUは、フレームヘッダNALユニットの0又は1つのグループ、1つのジオメトリd0映像AU、1つのジオメトリd1映像AU、1つの補助情報フレームNALユニット、1つの占有マップフレームNALユニット、及び1つのテクスチャ映像AUを、列挙されたこの順序で含む。
NALユニットの映像AUへの関連性と、映像AU内のNALユニットの順序とは、識別されたビデオコーデック(例えば、HEVC又はAVC)の仕様書に指定されている。識別されたビデオコーデックは、各CPSの第1のPCC AUに存在するフレームヘッダNALユニットに示されている。
各CPSの第1のPCC AUは、フレームヘッダNALユニットのグループから始まり、フレームヘッダNALユニットの各グループは、新たなPCC AUの開始を指定する。
他のPCC AUは、ジオメトリd0映像AUの第1のNALユニットを含むPCC NALユニットから始まる。言い換えれば、ジオメトリd0映像AUの第1のNALユニットを含むPCC NALユニットは、フレームヘッダNALユニットのグループが前に付かない場合、新たなPCC AUを開始する。
PCC AU及びそのCPSへの関連性についての順序が提供される。
本明細書に適合するビットストリームが、1つ又は複数のCPSで構成される。
CPSは、1つ又は複数のPCC AUを含む。PCC NALユニット及びそのPCC AUへの関連性についての順序が、7.4.2.4.2項に説明されている。
CPSの第1のPCC AUは、PCC IRAP AUである。
ローバイトシーケンスペイロード、トレーリングビット、及びバイトアライメントセマンティックスが提供される。フレームヘッダRBSPセマンティクスのグループは、次の通りである。
identified_codecは、表2に示すジオメトリ成分及びテクスチャ成分の符号化に用いられる識別されたビデオコーデックを指定する。
Figure 2021528917
frame_widthは、ジオメトリ及びテクスチャ映像の、画素内のフレーム幅を示す。これは、occupancyResolutionの倍数であるものとする。
frame_heightは、ジオメトリ及びテクスチャ映像の、画素内のフレーム高を示す。これは、occupancyResolutionの倍数であるものとする。
occupancy_resolutionは、パッチがジオメトリ及びテクスチャ映像にパックされている、画素内の水平垂直解像度を示す。これは、occupancyPrecisionの偶数倍であるものとする。
radius_to_smoothingは、平滑化用の隣接物を検出する半径を示す。radius_to_smoothingの値は、0〜255(両端を含む)の範囲内にあるものとする。
neighbor_count_smoothingは、平滑化に用いられる最大数の隣接物を示す。neighbor_count_smoothingの値は、0〜255(両端を含む)の範囲内にあるものとする。
radius2_boundary_detectionは、境界点検出用の半径を示す。radius2_boundary_detectionの値は、0〜255(両端を含む)の範囲内にあるものとする。
threshold_smoothingは、平滑化閾値を示す。threshold_smoothingの値は、0〜255(両端を含む)の範囲内にあるものとする。
lossless_geometryは、可逆ジオメトリ符号化を示す。1に等しいlossless_geometryの値は、点群ジオメトリ情報が可逆的に符号化されていることを示す。0に等しいlossless_geometryの値は、点群ジオメトリ情報が不可逆方式で符号化されていることを示す。
lossless_textureは、可逆的なテクスチャ符号化を示す。1に等しいlossless_textureの値は、点群テクスチャ情報が可逆的に符号化されていることを示す。0に等しいlossless_textureの値は、点群テクスチャ情報が不可逆方式で符号化されていることを示す。
no_attributesは、属性がジオメトリデータと共に符号化されているかどうかを示す。1に等しいno_attributesの値は、符号化点群ビットストリームがいかなる属性情報も含まないことを示す。0に等しいno_attributesの値は、符号化点群ビットストリームが属性情報を含んでいることを示す。
lossless_geometry_444は、ジオメトリフレームに、4:2:0の映像フォーマットを用いるのか、又は4:4:4の映像フォーマットを用いるのかを示す。1に等しいlossless_geometry_444の値は、ジオメトリ映像が4:4:4フォーマットで符号化されていることを示す。0に等しいlossless_geometry_444の値は、ジオメトリ映像が4:2:0フォーマットで符号化されていることを示す。
absolute_d1_codingは、投影面に最も近い層以外のジオメトリ層がどのように符号化されているかを示す。1に等しいabsolute_d1_codingは、投影面に最も近い層以外のジオメトリ層用に、実際のジオメトリ値が符号化されていることを示す。0に等しいabsolute_d1_codingは、投影面に最も近い層以外のジオメトリ層が別個に符号化されていることを示す。
bin_arithmetic_codingは、2値算術符号化が用いられているかどうかを示す。1に等しいbin_arithmetic_codingの値は、全ての構文要素に2値算術符号化が用いられていることを示す。0に等しいbin_arithmetic_codingの値は、一部の構文要素に非2値算術符号化が用いられていることを示す。
0に等しいgof_header_extension_flagは、フレームヘッダRBSP構文構造のグループにgof_header_extension_data_flag構文要素が何も存在しないことを指定する。1に等しいgof_header_extension_flagは、フレームヘッダRBSP構文構造のグループに存在するgof_header_extension_data_flag構文要素があることを指定する。復号器は、フレームヘッダNALユニットのグループにあるgof_header_extension_flagの値1に続く全てのデータを無視するものとする。
gof_header_extension_data_flagは、任意の値を有してよい。その存在及び値は、復号器の適合性に影響を与えない。復号器は、全てのgof_header_extension_data_flag構文要素を無視するものとする。
補助情報フレームRBSPセマンティクスが提供される。
patch_countは、ジオメトリ及びテクスチャ映像に含まれるパッチの数である。これは、0より大きいものとする。
occupancy_precisionは、占有マップ精度の、画素内の水平垂直解像度である。これは、占有が信号で伝えられるサブブロックサイズに対応する。占有マップの可逆符号化を実現するために、これはサイズ1に設定されるはずである。
max_candidate_countは、パッチ候補リスト内の最大数の候補を指定する。
bit_count_u0は、patch_u0の固定長符号化のビット数を指定する。
bit_count_v0は、patch_v0の固定長符号化のビット数を指定する。
bit_count_u1は、patch_u1の固定長符号化のビット数を指定する。
bit_count_v1は、patch_v1の固定長符号化のビット数を指定する。
bit_count_d1は、patch_d1の固定長符号化のビット数を指定する。
occupancy_aux_stream_sizeは、パッチ情報及び占有マップを符号化するのに用いられるバイト数である。
以下の構文要素は、パッチごとに一度指定される。
patch_u0は、パッチ境界ボックスのサイズ[occupancy_resolution]×[occupancy_resolution]の左上隅にあるサブブロックのx座標を指定する。patch_u0の値は、0〜[frame_width/occupancy_resolution−1](両端を含む)の範囲内にあるものとする。
patch_v0は、パッチ境界ボックスのサイズ[occupancy_resolution]×[occupancy_resolution]の左上隅にあるサブブロックのy座標を指定する。patch_v0の値は、0〜[frame_height/occupancy_resolution−1](両端を含む)の範囲内にあるものとする。
patch_u1は、パッチ点の3D境界ボックスの最小x座標を指定する。patch_u1の値は、0〜[frame_width−1](両端を含む)の範囲内にあるものとする。
patch_v1は、パッチ点の3D境界ボックスの最小y座標である。patch_v1の値は、0〜[frameHeight−1](両端を含む)の範囲内にあるものとする。
patch_d1は、パッチの最小深度を指定する。patch_d1の値は、0〜<255?>(両端を含む)の範囲内にあるものとする。
delta_size_u0は、現在のパッチと以前のパッチとのパッチ幅の差異である。delta_size_u0の値は、<−65536?>〜<65535?>(両端を含む)の範囲内にあるものとする。
delta_size_v0は、現在のパッチと以前のパッチとのパッチ高の差異である。delta_size_v0の値は、<−65536?>〜<65535?>(両端を含む)の範囲内にあるものとする。
normal_axisは、面投影インデックスを指定する。normal_axisの値は、0〜2(両端を含む)の範囲内にあるものとする。0、1、及び2のnormalAxis値はそれぞれ、X、Y、及びZの投影軸に対応する。
以下の構文要素は、ブロックごとに一度指定される。
candidate_indexは、パッチ候補リスト内にあるインデックスである。candidate_indexの値は、0〜max_candidate_count(両端を含む)の範囲内にあるものとする。
patch_indexは、フレームに関連するサイズの降順でソートされたパッチリストに対するインデックスである。
フレーム占有マップセマンティクスのグループが提供される。
以下の構文要素は、空でないブロックに提供される。
is_fullは、サイズ[occupancy_resolution]×[occupancy_resolution]のブロックの現在の占有ブロックが満杯であるかどうかを指定する。1に等しいis_fullは、現在のブロックが満杯であることを指定する。0に等しいis_fullは、現在の占有ブロックが満杯ではないことを指定する。
best_traversal_order_indexは、現在の[occupancy_resolution]×[occupancy_resolution]のブロックのサイズ[occupancy_precision]×[occupancy_precision]のサブブロックに対するスキャン順序を指定する。best_traversal_order_indexの値は、0〜4(両端を含む)の範囲内にあるものとする。
run_count_prefixは、変数runCountMinusTwoの導出に用いられる。
run_count_suffixは、変数runCountMinusTwoの導出に用いられる。run_count_suffixの値は、存在しない場合、0に等しいと推定される。
特定のブロックに対するblockToPatchの値が0に等しくない且つ当該ブロックが満杯ではない場合、runCountMinusTwo+2は、あるブロックに対して信号で伝える実行回数を表す。runCountMinusTwoの値は、0〜([occupancy_resolution]×[occupancy_resolution]−1)(両端を含む)の範囲内にあるものとする。
runCountMinusTwoは次のように導出される。
runCountMinusTwo=(1<<run_count_prefix)−1+run_count_suffix (7−85)
占有は、([occupancyPrecision]×[occupancyPrecision]画素の)第1のサブブロックに対する占有値を指定する。0に等しい占有は、第1のサブブロックが空であることを指定する。1に等しい占有は、第1のサブブロックが占有されていることを指定する。
run_length_idxは、実行長のインジケーションである。runLengthIdxの値は、0〜14(両端を含む)の範囲内にあるものとする。
変数runLengthは、表3を用いて、run_length_idxから導出される。
Figure 2021528917
注:占有マップは、ジオメトリ及びテクスチャ映像の両方により共有される。
HEVC仕様書の7.4.3.11項にあるRBSPトレーリングビットセマンティクスが適用される。HEVC仕様書の7.4.3.12項にあるバイトアライメントセマンティックスも適用される。PCCプロファイル及びレベルのセマンティクスは次の通りである。
pcc_profile_idcは、付録Aに指定するように、CPSが適合するプロファイルを示す。ビットストリームは、付録Aに指定されるもの以外のpcc_profile_idcの値を含まないものとする。pcc_profile_idcの他の値は、ISO/IECによる将来の使用のために予約されている。
pcc_pl_reserved_zero_19bitsは、この仕様書のこのバージョンに適合するビットストリームでは、0に等しいものとする。pcc_pl_reserved_zero_19bitsの他の値は、ISO/IECによる将来の使用のために予約されている。復号器は、pcc_pl_reserved_zero_19bitsの値を無視するものとする。
pcc_level_idcは、付録Aに指定するように、CPSが適合するレベルを示す。ビットストリームは、付録Aに指定されるもの以外のpcc_level_idcの値を含まないものとする。pcc_level_idcの他の値は、ISO/IECによる将来の使用のために予約されている。
10項に指定されるように抽出されるジオメトリHEVCビットストリームが適合するHEVC復号器により復号される場合のアクティブSPSにおいて、hevc_ptl_12bytes_geometryは、general_profile_idcからgeneral_level_idcまで(両端を含む)の12バイトの値に等しいものとする。
10項に指定されるように抽出されるテクスチャHEVCビットストリームが適合するHEVC復号器により復号される場合のアクティブSPSにおいて、hevc_ptl_12bytes_textureは、general_profile_idcからgeneral_level_idcまで(両端を含む)の12バイトの値に等しいものとする。
10項に指定されるように抽出されるジオメトリAVCビットストリームが適合するAVC復号器により復号される場合のアクティブSPSにおいて、avc_pl_3ytes_geometryは、profile_idcからlevel_idcまで(両端を含む)の3バイトの値に等しいものとする。
10項に指定されるように抽出されるテクスチャAVCビットストリームが適合するAVC復号器により復号される場合のアクティブSPSにおいて、avc_pl_3ytes_textureは、profile_idcからlevel_idcまで(両端を含む)の3バイトの値に等しいものとする。
最新のPCC Cat2のWDの104項におけるサブビットストリーム抽出処理は、以下のものに置き換えられる。サブビットストリーム抽出処理では、入力が、ビットストリーム、及びジオメトリd0、ジオメトリd1、又はテクスチャ成分の対象映像成分インジケーションである。この処理の出力は、サブビットストリームである。
一実施形態において、適合するPCCビットストリームと対象映像成分インジケーションの任意の値とを有する、この項で指定される処理の出力である、任意の出力サブビットストリームが、識別されたビデオコーデックごとに適合する映像ビットストリームであるものとするということは、入力ビットストリームのビットストリーム適合性の要件である。
出力サブビットストリームは、以下の順序付き段階によって導出される。
対象映像成分インジケーションの値に応じて、次のことが適用される。
ジオメトリd0成分が示されている場合、GEOMETRY_D0に等しくないPccNalUnitTypeを有する全てのPCC NALユニットを除去する。
そうではなく、ジオメトリd1成分が示されている場合、GEOMETRY_D1に等しくないPccNalUnitTypeを有する全てのPCC NALユニットを除去する。
そうではない場合(テクスチャ成分が示されている場合)、TEXTURE_NALUに等しくないPccNalUnitTypeを有する全てのPCC NALユニットを除去する。
PCC NALユニットごとに、最初のバイトを除去する。
別の実施形態が、以下に提供される。
上記に要約された第1セットの方法の別の実施形態において、PCC NALユニットヘッダ(例えば、図4のデータユニットヘッダ404)は、ジオメトリ成分及びテクスチャ成分の符号化に用いられるコーデックがPCC NALユニットタイプから推定され得るように設計される。例えば、PCC NALユニットヘッダは、以下に要約するように設計される。
PCC NALユニットヘッダには、PCC NALユニットペイロードで搬送されるコンテンツのタイプを指定するタイプインジケータ(例えば、7ビット)が存在する。タイプは、例えば、以下のことに従って決定される。
0:ペイロードはHEVC NALユニットを含む。
1:ペイロードはAVC NALユニットを含む。
2〜63:予約済み。
64:フレームヘッダNALユニットのグループ。
65:補助情報NALユニット。
66:占有マップNALユニット。
67〜126:予約済み。
0〜63(両端を含む)の範囲内にあるPCC NALユニットタイプを有するPCC NALユニットは、映像NALユニットと呼ばれる。
予約済みのPCC NALユニットタイプの一部をPCC Cat13のデータユニットに用いることが可能であり、したがって、PCC Cat2とPCC Cat13とを1つの標準仕様書に統合することができる。
図5は、映像復号器(例えば、映像復号器30)により実装される点群符号化の方法の実施形態500である。方法500は、点群符号化に関連する前述の問題のうちの1つ又は複数を解決するために実行されてよい。
ブロック502では、テクスチャ成分又はジオメトリ成分の符号化表現の一部ではない、又はその符号化表現の外側に配置されるフレームヘッダのグループ(例えば、フレームヘッダ408のグループ)を含み且つテクスチャ成分又はジオメトリ成分の符号化に用いられるビデオコーデックを識別する、符号化済みビットストリーム(例えば、データ構造体400)が受信される。
ブロック504では、符号化済みビットストリームが復号される。復号されたビットストリームは、ユーザに対して表示デバイス上に表示する画像又は映像を生成するのに利用されてよい。
一実施形態において、符号化表現は、PCCネットワーク抽象化層(NAL)ユニットのペイロードに含まれる。一実施形態において、PCC NALユニットのペイロードは、ビデオコーデックに対応するジオメトリ成分を含む。一実施形態において、PCC NALユニットのペイロードは、ビデオコーデックに対応するテクスチャ成分を含む。
一実施形態において、ビデオコーデックは高効率映像符号化(HEVC)である。一実施形態において、ビデオコーデックは高度映像符号化(AVC)である。一実施形態において、ビデオコーデックは汎用映像符号化(VVC)である。一実施形態において、ビデオコーデックは本質的映像符号化(EVC)である。
一実施形態において、ジオメトリ成分は、点群フレームと関連付けられた座標のセットを含む。一実施形態において、座標のセットは直交座標である。
一実施形態において、テクスチャ成分は、点群フレームの輝度サンプル値のセットを含む。
図6は、映像符号化器(例えば、映像符号化器20)により実装される点群符号化の方法の実施形態600である。方法600は、点群符号化に関連する前述の問題のうちの1つ又は複数を解決するために実行されてよい。
ブロック602では、フレームヘッダのグループ(例えば、フレームヘッダ408のグループ)を含む符号化済みビットストリーム(例えば、データ構造体400)が生成される。フレームヘッダのグループは、テクスチャ成分又はジオメトリ成分の符号化表現の外側に配置され、テクスチャ成分又はジオメトリ成分の符号化に用いられるビデオコーデックを識別する。
ブロック604では、符号化済みビットストリームは復号器(例えば、映像復号器30)に伝送される。符号化済みビットストリームは、復号器により受信されると、ユーザに対して表示デバイス上に表示する画像又は映像を生成するために復号されてよい。
一実施形態において、符号化表現は、PCCネットワーク抽象化層(NAL)ユニットのペイロードに含まれる。一実施形態において、PCC NALユニットのペイロードは、ビデオコーデックに対応するジオメトリ成分を含む。一実施形態において、PCC NALユニットのペイロードは、ビデオコーデックに対応するテクスチャ成分を含む。
一実施形態において、ビデオコーデックは高効率映像符号化(HEVC)である。一実施形態において、ビデオコーデックは高度映像符号化(AVC)である。一実施形態において、ビデオコーデックは汎用映像符号化(VVC)である。一実施形態において、ビデオコーデックは本質的映像符号化(EVC)である。
一実施形態において、ジオメトリ成分は、点群フレームと関連付けられた座標のセットを含む。一実施形態において、座標のセットは直交座標である。
一実施形態において、テクスチャ成分は、点群フレームの輝度サンプル値のセットを含む。
図7は、本開示の一実施形態による映像符号化デバイス700(例えば、映像符号化器20、映像復号器30など)の概略図である。映像符号化デバイス700は、本明細書に開示される方法及び処理を実装するのに好適である。映像符号化デバイス700は、データを受信するための入口ポート710及び受信機ユニット(Rx)720と、データを処理するプロセッサ、論理ユニット、又は中央演算処理装置(CPU)730と、データを伝送するための送信機ユニット(Tx)740及び出口ポート750と、データを格納するためのメモリ760とを含む。映像符号化デバイス700は、入口ポート710、受信機ユニット720、送信機ユニット740、及び出口ポート750に連結された、光信号又は電気信号の出口又は入口用の、光/電気(OE)変換コンポーネント及び電気/光(EO)変換コンポーネントも含んでよい。
プロセッサ730は、ハードウェア及びソフトウェアにより実装される。プロセッサ730は、1つ又は複数のCPUチップ、コア(例えば、マルチコアプロセッサとして)、フィールドプログラマブルゲートアレイ(FPGA)、特定用途向け集積回路(ASIC)、及びデジタル信号プロセッサ(DSP)として実装されてよい。プロセッサ730は、入口ポート710、受信機ユニット720、送信機ユニット740、出口ポート750、及びメモリ760と通信する。プロセッサ730は、符号化モジュール770を有する。符号化モジュール770は、上述の開示した実施形態を実装する。したがって、符号化モジュール770を含むことにより、符号化デバイス700の機能に著しい改善がもたらされ、映像符号化デバイス700を異なる状態に変化させられる。あるいは、符号化モジュール770は、メモリ760に格納され且つプロセッサ730により実行される命令として実装される。
映像符号化デバイス700は、ユーザとの間でデータを通信するための入力及び/又は出力(I/O)デバイス780も含んでよい。I/Oデバイス780は、映像データを表示するためのディスプレイ、音声データを出力するためのスピーカなどの出力デバイスを含んでよい。I/Oデバイス780は、キーボード、マウス、トラックボールなどの入力デバイス、及び/又はそのような出力デバイスとやり取りするための対応するインタフェースも含んでよい。
メモリ760は、1つ又は複数のディスクドライブ、テープドライブ、及びソリッドステートドライブを含み、オーバーフローデータ記憶デバイスとしてプログラムを格納し、そのようなプログラムが実行のために選択されるとプログラム実行時に読み出される命令及びデータを格納するのに用いられてよい。メモリ760は、揮発性及び不揮発性であってよく、リードオンリメモリ(ROM)、ランダムアクセスメモリ(RAM)、三値連想メモリ(TCAM)、及びスタティックランダムアクセスメモリ(SRAM)であってよい。
図8は、符号化手段800の一実施形態の概略図である。この実施形態において、符号化手段800は、映像符号化デバイス802(例えば、映像符号化器20又は映像復号器30)に実装される。映像符号化デバイス802は、受信手段801を含む。受信手段801は、符号化するピクチャを受信する、又は復号するビットストリームを受信するように構成される。映像符号化デバイス802は、受信手段801に連結された伝送手段807を含む。伝送手段807は、ビットストリームを復号器に伝送する、又は復号済み画像を表示手段(例えば、複数のI/Oデバイス780のうちの1つ)に伝送するように構成される。
映像符号化デバイス802は、記憶手段803を含む。記憶手段803は、受信手段801又は伝送手段807のうちの少なくとも1つに連結される。記憶手段803は、命令を格納するように構成される。映像符号化デバイス802は、処理手段805も含む。処理手段805は、記憶手段803に連結される。処理手段805は、記憶手段803に格納された命令を実行し、本明細書に開示された方法を行うように構成される。
いくつかの実施形態が本開示に提供されているが、開示されたシステム及び方法は、本開示の精神又は範囲から逸脱することなく、多くの他の特定の形態で具現化されてよいことが理解されるであろう。本実施例は、限定的なものではなく例示的なものとみなされるべきであり、本明細書で提供された詳細に限定する意図はない。例えば、様々な要素又はコンポーネントは、別のシステムにおいて組み合わされても統合されてもよく、あるいは、特定の特徴が省略されても実装されなくてもよい。
さらに、様々な実施形態において別個のもの又は独立したものとして説明され示された、技法、システム、サブシステム、及び方法は、本開示の範囲から逸脱することなく、他のシステム、コンポーネント、技法、又は方法と組み合わされても統合されてもよい。変更、置換、及び修正に関する他の実施例が当業者によって確認可能であり、これらの実施例が、本明細書に開示された精神及び範囲から逸脱することなく作られてよい。
(項目1)
映像復号器により実施される点群符号化(PCC)の方法であって、
テクスチャ成分又はジオメトリ成分の符号化表現の外側に配置されるフレームヘッダのグループを含む符号化済みビットストリームを受信し、上記テクスチャ成分又は上記ジオメトリ成分の符号化に用いられるビデオコーデックを識別する段階と、
上記符号化済みビットストリームを復号する段階と
を備える方法。
(項目2)
映像符号化器により実施される点群符号化(PCC)の方法であって、
テクスチャ成分又はジオメトリ成分の符号化表現の外側に配置されるフレームヘッダのグループを含む符号化済みビットストリームを生成し、上記テクスチャ成分又は上記ジオメトリ成分の符号化に用いられるビデオコーデックを識別する段階と、
上記符号化済みビットストリームを復号器に伝送する段階と
を備える方法。
(項目3)
上記符号化表現は、PCCネットワーク抽象化層(NAL)ユニットのペイロードに含まれる、項目1から2のいずれかに記載の方法。
(項目4)
上記PCC NALユニットの上記ペイロードは、上記ビデオコーデックに対応する上記ジオメトリ成分を含む、項目1から3のいずれかに記載の方法。
(項目5)
上記PCC NALユニットの上記ペイロードは、上記ビデオコーデックに対応する上記テクスチャ成分を含む、項目1から3のいずれかに記載の方法。
(項目6)
上記ビデオコーデックは高効率映像符号化(HEVC)である、項目1から5のいずれかに記載の方法。
(項目7)
上記ビデオコーデックは高度映像符号化(AVC)である、項目1から5のいずれかに記載の方法。
(項目8)
上記ビデオコーデックは汎用映像符号化(VVC)である、項目1から5のいずれかに記載の方法。
(項目9)
上記ビデオコーデックは本質的映像符号化(EVC)である、項目1から5のいずれかに記載の方法。
(項目10)
上記ジオメトリ成分は、点群フレームと関連付けられた座標のセットを含む、項目1から9のいずれかに記載の方法。
(項目11)
上記座標のセットは直交座標である、項目10に記載の方法。
(項目12)
上記テクスチャ成分は、点群フレームの輝度サンプル値のセットを含む、項目1から11のいずれかに記載の方法。
(項目13)
符号化するピクチャを受信する又は復号するビットストリームを受信するように構成された受信機と、
上記受信機に連結された送信機であって、上記送信機は上記ビットストリームを復号器に伝送する又は復号済み画像をディスプレイに伝送するように構成される、送信機と、
上記受信機又は上記送信機のうちの少なくとも1つに連結されたメモリであって、上記メモリは命令を格納するように構成される、メモリと、
上記メモリに連結されたプロセッサであって、上記プロセッサは上記メモリに格納された上記命令を実行して、項目1から12のいずれかに記載の方法を行うように構成される、プロセッサと
を備える符号化装置。
(項目14)
上記符号化装置はさらに、画像を表示するように構成されたディスプレイを備える、項目6に記載の符号化装置。
(項目15)
符号化器と、
上記符号化器と通信する復号器と
を備えるシステムであって、
上記符号化器又は上記復号器は、項目13から14のいずれかに記載の符号化装置を含む、システム。
(項目16)
符号化する手段であって、
符号化するピクチャを受信する又は復号するビットストリームを受信するように構成された受信手段と、
上記受信手段に連結された伝送手段であって、上記伝送手段は上記ビットストリームを復号器に伝送する又は復号済み画像を表示手段に伝送するように構成される、伝送手段と、
上記受信手段又は上記伝送手段のうちの少なくとも1つに連結された記憶手段であって、上記記憶手段は命令を格納するように構成される、記憶手段と、
上記記憶手段に連結された処理手段であって、上記処理手段は上記記憶手段に格納された上記命令を実行して、項目1から12のいずれかに記載の方法を行うように構成される、処理手段と
を備える符号化する手段。

Claims (15)

  1. 映像復号器により実施される点群符号化(PCC)の方法であって、
    テクスチャ成分又はジオメトリ成分の符号化表現を含む符号化済みビットストリームを受信し、前記テクスチャ成分又は前記ジオメトリ成分の符号化に用いられるビデオコーデックを識別する段階と、
    前記符号化済みビットストリームを復号する段階と
    を備える方法。
  2. 映像符号化器により実施される点群符号化(PCC)の方法であって、
    テクスチャ成分又はジオメトリ成分の符号化表現を含む符号化済みビットストリームを生成し、前記テクスチャ成分又は前記ジオメトリ成分の符号化に用いられるビデオコーデックを識別する段階と、
    前記符号化済みビットストリームを復号器に伝送する段階と
    を備える方法。
  3. 前記符号化済みビットストリームは、前記テクスチャ成分又は前記ジオメトリ成分の符号化に用いられる前記ビデオコーデックを識別するパラメータセットを含む、請求項1又は2に記載の方法。
  4. 前記符号化済みビットストリームは、
    前記テクスチャ成分の符号化に用いられる第1のビデオコーデックを示す第1のコーデック識別子(identified_codec)、又は
    前記ジオメトリ成分の符号化に用いられる第2のビデオコーデックを示す第2のコーデック識別子(identified_codec)を含む、請求項1又は2に記載の方法。
  5. 前記符号化表現は、前記符号化済みビットストリームのデータユニットのペイロードに含まれる、請求項1から4のいずれか一項に記載の方法。
  6. 前記符号化済みビットストリームの前記データユニットの前記ペイロードは、前記ビデオコーデックに対応する前記ジオメトリ成分を含む、請求項5に記載の方法。
  7. 前記符号化済みビットストリームの前記データユニットの前記ペイロードは、前記ビデオコーデックに対応する前記テクスチャ成分を含む、請求項5に記載の方法。
  8. 前記符号化済みビットストリームはさらに、占有情報の符号化表現を含む、請求項1から7のいずれか一項に記載の方法。
  9. 前記符号化済みビットストリームはさらに、前記占有情報の符号化に用いられる第3のビデオコーデックを示す第3のコーデック識別子(identified_codec)を含む、請求項8に記載の方法。
  10. 前記ビデオコーデックは、高効率映像符号化(HEVC)、高度映像符号化(AVC)、汎用映像符号化(VVC)、又は本質的映像符号化(EVC)のうちの少なくとも1つを含む、請求項1から3のいずれか一項に記載の方法。
  11. 前記ジオメトリ成分は、点群フレームと関連付けられた座標のセットを含む、請求項1から10のいずれか一項に記載の方法。
  12. 前記座標のセットは直交座標である、請求項11に記載の方法。
  13. 前記テクスチャ成分は、点群フレームの輝度サンプル値のセットを含む、請求項1から12のいずれか一項に記載の方法。
  14. 符号化するピクチャを受信する又は復号するビットストリームを受信するように構成された受信機と、
    前記受信機に連結された送信機であって、前記送信機は前記ビットストリームを復号器に伝送する又は復号済み画像をディスプレイに伝送するように構成される、送信機と、
    前記受信機又は前記送信機のうちの少なくとも1つに連結されたメモリであって、前記メモリは命令を格納するように構成される、メモリと、
    前記メモリに連結されたプロセッサであって、前記プロセッサは前記メモリに格納された前記命令を実行して、項目1から13のいずれか一項に記載の方法を行うように構成される、プロセッサと
    を備える符号化装置。
  15. 前記符号化装置はさらに、画像を表示するように構成されたディスプレイを備える、請求項14に記載の符号化装置。
JP2020572509A 2018-06-26 2019-04-11 点群符号化用の高レベルな構文設計 Active JP7287745B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2023084578A JP2023120197A (ja) 2018-06-26 2023-05-23 点群コーディング用の高レベルな構文設計

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201862690132P 2018-06-26 2018-06-26
US62/690,132 2018-06-26
PCT/US2019/027067 WO2020005365A1 (en) 2018-06-26 2019-04-11 High-level syntax designs for point cloud coding

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2023084578A Division JP2023120197A (ja) 2018-06-26 2023-05-23 点群コーディング用の高レベルな構文設計

Publications (2)

Publication Number Publication Date
JP2021528917A true JP2021528917A (ja) 2021-10-21
JP7287745B2 JP7287745B2 (ja) 2023-06-06

Family

ID=68985126

Family Applications (6)

Application Number Title Priority Date Filing Date
JP2020572509A Active JP7287745B2 (ja) 2018-06-26 2019-04-11 点群符号化用の高レベルな構文設計
JP2020571621A Active JP7111846B2 (ja) 2018-06-26 2019-04-11 点群符号化のための高レベルシンタックス設計
JP2020571849A Active JP7116199B2 (ja) 2018-06-26 2019-04-11 点群符号化用の高レベルな構文設計
JP2022116553A Pending JP2022165994A (ja) 2018-06-26 2022-07-21 点群コーディングのための高レベルシンタックス設計
JP2022120241A Pending JP2022160530A (ja) 2018-06-26 2022-07-28 点群コーディング用の高レベルな構文設計
JP2023084578A Pending JP2023120197A (ja) 2018-06-26 2023-05-23 点群コーディング用の高レベルな構文設計

Family Applications After (5)

Application Number Title Priority Date Filing Date
JP2020571621A Active JP7111846B2 (ja) 2018-06-26 2019-04-11 点群符号化のための高レベルシンタックス設計
JP2020571849A Active JP7116199B2 (ja) 2018-06-26 2019-04-11 点群符号化用の高レベルな構文設計
JP2022116553A Pending JP2022165994A (ja) 2018-06-26 2022-07-21 点群コーディングのための高レベルシンタックス設計
JP2022120241A Pending JP2022160530A (ja) 2018-06-26 2022-07-28 点群コーディング用の高レベルな構文設計
JP2023084578A Pending JP2023120197A (ja) 2018-06-26 2023-05-23 点群コーディング用の高レベルな構文設計

Country Status (8)

Country Link
US (5) US20210112278A1 (ja)
EP (3) EP3804319A4 (ja)
JP (6) JP7287745B2 (ja)
KR (4) KR102486256B1 (ja)
CN (4) CN115665104A (ja)
BR (3) BR112020026646A2 (ja)
SG (3) SG11202012940XA (ja)
WO (3) WO2020005363A1 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7383171B2 (ja) 2020-12-04 2023-11-17 テンセント・アメリカ・エルエルシー 点群コーディングのための方法および装置
JP7490555B2 (ja) 2018-08-08 2024-05-27 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ 三次元データ符号化方法、三次元データ復号方法、三次元データ符号化装置、及び三次元データ復号装置

Families Citing this family (46)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10897269B2 (en) 2017-09-14 2021-01-19 Apple Inc. Hierarchical point cloud compression
US11818401B2 (en) 2017-09-14 2023-11-14 Apple Inc. Point cloud geometry compression using octrees and binary arithmetic encoding with adaptive look-up tables
US10861196B2 (en) 2017-09-14 2020-12-08 Apple Inc. Point cloud compression
US11113845B2 (en) 2017-09-18 2021-09-07 Apple Inc. Point cloud compression using non-cubic projections and masks
US10909725B2 (en) 2017-09-18 2021-02-02 Apple Inc. Point cloud compression
US10699444B2 (en) 2017-11-22 2020-06-30 Apple Inc Point cloud occupancy map compression
US10607373B2 (en) 2017-11-22 2020-03-31 Apple Inc. Point cloud compression with closed-loop color conversion
US11010928B2 (en) 2018-04-10 2021-05-18 Apple Inc. Adaptive distance based point cloud compression
US10909726B2 (en) 2018-04-10 2021-02-02 Apple Inc. Point cloud compression
US10939129B2 (en) 2018-04-10 2021-03-02 Apple Inc. Point cloud compression
US10909727B2 (en) 2018-04-10 2021-02-02 Apple Inc. Hierarchical point cloud compression with smoothing
US11017566B1 (en) 2018-07-02 2021-05-25 Apple Inc. Point cloud compression with adaptive filtering
US11202098B2 (en) 2018-07-05 2021-12-14 Apple Inc. Point cloud compression with multi-resolution video encoding
US11012713B2 (en) 2018-07-12 2021-05-18 Apple Inc. Bit stream structure for compressed point cloud data
KR102589477B1 (ko) * 2018-09-14 2023-10-13 후아웨이 테크놀러지 컴퍼니 리미티드 포인트 클라우드 코딩에서 개선된 속성 계층 및 시그널링
US11386524B2 (en) 2018-09-28 2022-07-12 Apple Inc. Point cloud compression image padding
US11367224B2 (en) * 2018-10-02 2022-06-21 Apple Inc. Occupancy map block-to-patch information compression
US11430155B2 (en) 2018-10-05 2022-08-30 Apple Inc. Quantized depths for projection point cloud compression
US11348284B2 (en) 2019-01-08 2022-05-31 Apple Inc. Auxiliary information signaling and reference management for projection-based point cloud compression
US11057564B2 (en) 2019-03-28 2021-07-06 Apple Inc. Multiple layer flexure for supporting a moving image sensor
US11627314B2 (en) 2019-09-27 2023-04-11 Apple Inc. Video-based point cloud compression with non-normative smoothing
US11562507B2 (en) 2019-09-27 2023-01-24 Apple Inc. Point cloud compression using video encoding with time consistent patches
US11538196B2 (en) 2019-10-02 2022-12-27 Apple Inc. Predictive coding for point cloud compression
US11895307B2 (en) 2019-10-04 2024-02-06 Apple Inc. Block-based predictive coding for point cloud compression
WO2021068923A1 (en) 2019-10-10 2021-04-15 Beijing Bytedance Network Technology Co., Ltd. Deblocking filtering improvements
JP7425207B2 (ja) * 2020-01-07 2024-01-30 エルジー エレクトロニクス インコーポレイティド ポイントクラウドデータ送信装置、ポイントクラウドデータ送信方法、ポイントクラウドデータ受信装置及びポイントクラウドデータ受信方法
US11593967B2 (en) 2020-01-08 2023-02-28 Samsung Electronics Co., Ltd. Attribute transfer in V-PCC
US11356706B2 (en) 2020-01-08 2022-06-07 Qualcomm Incorporated Storage and delivery of video data for video coding
EP4075797A4 (en) * 2020-01-08 2023-05-31 LG Electronics Inc. POINT CLOUD DATA TRANSMITTING DEVICE, POINT CLOUD DATA TRANSMITTING METHOD, POINT CLOUD DATA RECEIVING DEVICE AND POINT CLOUD DATA RECEIVING METHOD
US11798196B2 (en) 2020-01-08 2023-10-24 Apple Inc. Video-based point cloud compression with predicted patches
US11625866B2 (en) 2020-01-09 2023-04-11 Apple Inc. Geometry encoding using octrees and predictive trees
KR102373833B1 (ko) * 2020-01-09 2022-03-14 엘지전자 주식회사 포인트 클라우드 데이터 송신 장치, 포인트 클라우드 데이터 송신 방법, 포인트 클라우드 데이터 수신 장치 및 포인트 클라우드 데이터 수신 방법
US11317117B2 (en) * 2020-03-30 2022-04-26 Tencent America LLC Method of coding attributes for point cloud coding
EP4135320A4 (en) 2020-04-11 2024-06-12 Lg Electronics Inc DEVICE AND METHOD FOR TRANSMITTING POINT CLOUD DATA, DEVICE AND METHOD FOR RECEIVING POINT CLOUD DATA
US11615557B2 (en) 2020-06-24 2023-03-28 Apple Inc. Point cloud compression using octrees with slicing
US11620768B2 (en) 2020-06-24 2023-04-04 Apple Inc. Point cloud geometry compression using octrees with multiple scan orders
US11816868B2 (en) * 2020-08-14 2023-11-14 Tencent America LLC Coding of multiple-component attributes for point cloud coding
US20230345008A1 (en) * 2020-10-30 2023-10-26 Lg Electronics Inc. Point cloud data transmission device, point cloud data transmission method, point cloud data reception device, and point cloud data reception method
US20220179082A1 (en) * 2020-12-08 2022-06-09 Argo AI, LLC Methods and system for analyzing dynamic lidar point cloud data
US11948338B1 (en) 2021-03-29 2024-04-02 Apple Inc. 3D volumetric content encoding using 2D videos and simplified 3D meshes
WO2023054156A1 (ja) * 2021-09-29 2023-04-06 ソニーグループ株式会社 情報処理装置および方法
CN118119974A (zh) * 2021-09-30 2024-05-31 浙江大学 编解码方法、编码器、解码器以及存储介质
WO2023090614A1 (ko) * 2021-11-19 2023-05-25 현대자동차주식회사 라이다 포인트 클라우드 코딩을 위한 방법 및 장치
WO2023131131A1 (en) * 2022-01-04 2023-07-13 Beijing Bytedance Network Technology Co., Ltd. Method, apparatus, and medium for point cloud coding
WO2024064043A1 (en) * 2022-09-19 2024-03-28 Innopeak Technology, Inc. Point cloud decoding method, point cloud encoding method, decoder and encoder
JP2024058010A (ja) * 2022-10-13 2024-04-25 Kddi株式会社 メッシュ復号装置、メッシュ符号化装置、メッシュ復号方法及びプログラム

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120044999A1 (en) * 2010-08-19 2012-02-23 Samsung Electronics Co., Ltd. Method and apparatus for encoding and decoding multilayer videos
JP2015053669A (ja) * 2013-09-05 2015-03-19 韓國電子通信研究院Electronics and Telecommunications Research Institute 映像処理装置及び方法
JP2016067009A (ja) * 2011-07-22 2016-04-28 クゥアルコム・インコーポレイテッドQualcomm Incorporated 内部ビュー動き予測(ivmp)モードをサポートするmvcベースの3dvcコーデック
WO2017082079A1 (ja) * 2015-11-11 2017-05-18 ソニー株式会社 画像処理装置および画像処理方法
US20170347100A1 (en) * 2016-05-28 2017-11-30 Microsoft Technology Licensing, Llc Region-adaptive hierarchical transform and entropy coding for point cloud compression, and corresponding decompression

Family Cites Families (41)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100735359B1 (ko) * 2005-07-04 2007-07-04 삼성전자주식회사 디지털 멀티미디어 방송시스템에서의 데이터 송수신 장치및 방법
US8798148B2 (en) * 2007-06-15 2014-08-05 Physical Optics Corporation Apparatus and method employing pre-ATR-based real-time compression and video frame segmentation
US8204313B2 (en) * 2007-08-30 2012-06-19 Leica Geosystems Ag Rapid, spatial-data viewing and manipulating including data partition and indexing
US20110090921A1 (en) 2008-07-01 2011-04-21 Shemimon Manalikudy Anthru Network abstraction layer (nal)-aware multiplexer
US9060174B2 (en) 2010-12-28 2015-06-16 Fish Dive, Inc. Method and system for selectively breaking prediction in video coding
JP6094973B2 (ja) * 2011-05-20 2017-03-15 サン パテント トラスト 色平面内予測を用いて映像を符号化および復号する方法および装置
KR20140057373A (ko) * 2011-08-30 2014-05-12 노키아 코포레이션 비디오 코딩 및 디코딩을 위한 장치, 방법 및 컴퓨터 프로그램
US9432665B2 (en) * 2011-12-02 2016-08-30 Qualcomm Incorporated Coding least significant bits of picture order count values identifying long-term reference pictures
US10447990B2 (en) * 2012-02-28 2019-10-15 Qualcomm Incorporated Network abstraction layer (NAL) unit header design for three-dimensional video coding
US9762903B2 (en) * 2012-06-01 2017-09-12 Qualcomm Incorporated External pictures in video coding
SG10201510803WA (en) 2012-06-11 2016-01-28 Samsung Electronics Co Ltd Method and Apparatus for Encoding Videos Sharing SAO Parameter According to Color Component
US9602827B2 (en) * 2012-07-02 2017-03-21 Qualcomm Incorporated Video parameter set including an offset syntax element
US20140037005A1 (en) 2012-08-02 2014-02-06 Penne Y. LEE Transcoding video data
KR102046757B1 (ko) 2012-09-28 2019-11-19 소니 주식회사 화상 처리 장치 및 방법
US9615090B2 (en) * 2012-12-28 2017-04-04 Qualcomm Incorporated Parsing syntax elements in three-dimensional video coding
US9900609B2 (en) 2013-01-04 2018-02-20 Nokia Technologies Oy Apparatus, a method and a computer program for video coding and decoding
TWM487509U (zh) 2013-06-19 2014-10-01 杜比實驗室特許公司 音訊處理設備及電子裝置
EP3050294A4 (en) 2013-09-27 2017-08-09 Qualcomm Incorporated Residual coding for depth intra prediction modes
US10104362B2 (en) 2013-10-08 2018-10-16 Sharp Kabushiki Kaisha Image decoding device, image coding device, and coded data
GB2531271A (en) 2014-10-14 2016-04-20 Nokia Technologies Oy An apparatus, a method and a computer program for image sequence coding and decoding
US9955159B2 (en) 2014-10-31 2018-04-24 Google Llc Multi-video decoding with input switching
CN104484852A (zh) * 2014-11-19 2015-04-01 温州大学 一种点云曲面的复合几何图像表示方法
GB2539461B (en) 2015-06-16 2020-01-08 Canon Kk Image data encapsulation
US9646410B2 (en) * 2015-06-30 2017-05-09 Microsoft Technology Licensing, Llc Mixed three dimensional scene reconstruction from plural surface models
US10798422B2 (en) * 2015-10-20 2020-10-06 Intel Corporation Method and system of video coding with post-processing indication
US10482196B2 (en) * 2016-02-26 2019-11-19 Nvidia Corporation Modeling point cloud data using hierarchies of Gaussian mixture models
CN105992008B (zh) * 2016-03-30 2019-08-30 南京邮电大学 一种在多核处理器平台上的多层次多任务并行解码方法
US11025882B2 (en) * 2016-04-25 2021-06-01 HypeVR Live action volumetric video compression/decompression and playback
EP3249921A1 (en) * 2016-05-24 2017-11-29 Thomson Licensing Method, apparatus and stream for immersive video format
GB2550604A (en) 2016-05-24 2017-11-29 Canon Kk Method, device, and computer program for encapsulating and parsing timed media data
US11297346B2 (en) * 2016-05-28 2022-04-05 Microsoft Technology Licensing, Llc Motion-compensated compression of dynamic voxelized point clouds
US10694210B2 (en) * 2016-05-28 2020-06-23 Microsoft Technology Licensing, Llc Scalable point cloud compression with transform, and corresponding decompression
TWI775760B (zh) 2016-07-08 2022-09-01 美商Vid衡器股份有限公司 使用幾何投影360度視訊編碼
US20180053324A1 (en) * 2016-08-19 2018-02-22 Mitsubishi Electric Research Laboratories, Inc. Method for Predictive Coding of Point Cloud Geometries
US10271069B2 (en) * 2016-08-31 2019-04-23 Microsoft Technology Licensing, Llc Selective use of start code emulation prevention
WO2018083378A1 (en) * 2016-11-01 2018-05-11 Nokia Technologies Oy An apparatus, a method and a computer program for video coding and decoding
US11514613B2 (en) * 2017-03-16 2022-11-29 Samsung Electronics Co., Ltd. Point cloud and mesh compression using image/video codecs
US10909725B2 (en) * 2017-09-18 2021-02-02 Apple Inc. Point cloud compression
US11900639B2 (en) 2018-01-19 2024-02-13 Interdigital Vc Holdings, Inc. Processing a point cloud
EP3759925A4 (en) 2018-03-01 2021-11-10 Nokia Technologies Oy DEVICE, METHOD AND COMPUTER PROGRAM FOR VOLUMETRIC VIDEO
US10939129B2 (en) * 2018-04-10 2021-03-02 Apple Inc. Point cloud compression

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120044999A1 (en) * 2010-08-19 2012-02-23 Samsung Electronics Co., Ltd. Method and apparatus for encoding and decoding multilayer videos
JP2016067009A (ja) * 2011-07-22 2016-04-28 クゥアルコム・インコーポレイテッドQualcomm Incorporated 内部ビュー動き予測(ivmp)モードをサポートするmvcベースの3dvcコーデック
JP2015053669A (ja) * 2013-09-05 2015-03-19 韓國電子通信研究院Electronics and Telecommunications Research Institute 映像処理装置及び方法
WO2017082079A1 (ja) * 2015-11-11 2017-05-18 ソニー株式会社 画像処理装置および画像処理方法
US20170347100A1 (en) * 2016-05-28 2017-11-30 Microsoft Technology Licensing, Llc Region-adaptive hierarchical transform and entropy coding for point cloud compression, and corresponding decompression

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7490555B2 (ja) 2018-08-08 2024-05-27 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ 三次元データ符号化方法、三次元データ復号方法、三次元データ符号化装置、及び三次元データ復号装置
JP7383171B2 (ja) 2020-12-04 2023-11-17 テンセント・アメリカ・エルエルシー 点群コーディングのための方法および装置

Also Published As

Publication number Publication date
CN112438047A (zh) 2021-03-02
CN115665104A (zh) 2023-01-31
EP3804275A4 (en) 2021-05-05
SG11202012942TA (en) 2021-01-28
US20210112281A1 (en) 2021-04-15
KR20230031992A (ko) 2023-03-07
US20210112280A1 (en) 2021-04-15
KR102486256B1 (ko) 2023-01-06
JP2023120197A (ja) 2023-08-29
US20210112278A1 (en) 2021-04-15
WO2020005365A8 (en) 2020-10-08
CN112368990B (zh) 2022-09-23
KR20210021072A (ko) 2021-02-24
KR20210022090A (ko) 2021-03-02
EP3804319A4 (en) 2021-06-30
WO2020005363A1 (en) 2020-01-02
US20230328291A1 (en) 2023-10-12
BR112020026591A2 (pt) 2021-03-23
EP3804319A1 (en) 2021-04-14
JP2022165994A (ja) 2022-11-01
WO2020005364A1 (en) 2020-01-02
KR102486371B1 (ko) 2023-01-06
SG11202012937WA (en) 2021-01-28
JP7116199B2 (ja) 2022-08-09
CN112385221A (zh) 2021-02-19
WO2020005365A1 (en) 2020-01-02
JP2022160530A (ja) 2022-10-19
JP7287745B2 (ja) 2023-06-06
CN112368990A (zh) 2021-02-12
US11856230B2 (en) 2023-12-26
EP3804275B1 (en) 2023-03-01
EP3804320A4 (en) 2021-06-30
BR112020026646A2 (pt) 2021-03-23
KR20210022100A (ko) 2021-03-02
EP3804275A1 (en) 2021-04-14
JP2021529460A (ja) 2021-10-28
SG11202012940XA (en) 2021-01-28
CN112385221B (zh) 2022-08-26
US20240196017A1 (en) 2024-06-13
BR112020026618A2 (pt) 2021-03-30
EP3804320A1 (en) 2021-04-14
CN112438047B (zh) 2022-08-09
JP2021530889A (ja) 2021-11-11
US11706458B2 (en) 2023-07-18
JP7111846B2 (ja) 2022-08-02

Similar Documents

Publication Publication Date Title
JP7111846B2 (ja) 点群符号化のための高レベルシンタックス設計
KR102562209B1 (ko) 포인트 클라우드 코딩에서의 효율적인 패치 회전
US12002243B2 (en) Patch data unit coding and decoding for point-cloud coding

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210125

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20220217

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20220301

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220527

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20221011

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230105

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230425

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230523

R150 Certificate of patent or registration of utility model

Ref document number: 7287745

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150