JP7402888B2 - デジタルビデオにおけるパラメータセットシグナリング - Google Patents

デジタルビデオにおけるパラメータセットシグナリング Download PDF

Info

Publication number
JP7402888B2
JP7402888B2 JP2021553369A JP2021553369A JP7402888B2 JP 7402888 B2 JP7402888 B2 JP 7402888B2 JP 2021553369 A JP2021553369 A JP 2021553369A JP 2021553369 A JP2021553369 A JP 2021553369A JP 7402888 B2 JP7402888 B2 JP 7402888B2
Authority
JP
Japan
Prior art keywords
tool
parameter set
parameter
unit
parameters
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2021553369A
Other languages
English (en)
Other versions
JP2022523441A (ja
Inventor
ミン リー,
ピン ウー,
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
ZTE Corp
Original Assignee
ZTE Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ZTE Corp filed Critical ZTE Corp
Publication of JP2022523441A publication Critical patent/JP2022523441A/ja
Application granted granted Critical
Publication of JP7402888B2 publication Critical patent/JP7402888B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/172Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/184Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being bits, e.g. of the compressed video stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/188Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a video data packet, e.g. a network abstraction layer [NAL] unit
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/44Decoders specially adapted therefor, e.g. video decoders which are asymmetric with respect to the encoder
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/80Details of filtering operations specially adapted for video compression, e.g. for pixel interpolation
    • H04N19/82Details of filtering operations specially adapted for video compression, e.g. for pixel interpolation involving filtering within a prediction loop
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Description

本特許文書は、概して、ビデオおよび画像エンコーディングおよびデコーディングを対象とする。
ビデオエンコーディングは、圧縮ツールを使用して、2次元ビデオフレームを、ネットワークを経由して記憶またはトランスポートするためにより効率的である、圧縮されたビットストリーム表現にエンコーディングする。信号をエンコーディングする際により柔軟性を提供し、より良好なビデオコーディング性能を提供する、次世代のビデオコーデックを設計する試みが、現在進行中である。
本書は、少なくとも、パラメータセットのアクティブ化および管理における増加された複雑性を伴わずに、種々のツールのパラメータが柔軟に更新され得るように、パラメータセット内のパラメータをコーディングする方法に関する問題を解決するためのビデオまたは写真エンコーディングおよびデコーディング方法、エンコーディングおよびデコーディングデバイスを開示する。
一例示的側面では、ビットストリーム処理の方法が、開示される。本方法は、第1のパラメータセット識別子をコーディングされたビデオ領域に対応するビットを含有するデータユニットから取得するステップと、ツールフラグを第1のパラメータセット識別子に対応する第1のパラメータセットから取得するステップと、ツールフラグから、ツールフラグに対応するツールのツールパラメータが、コーディングされたビデオ領域をデコーディングするために存在する、または有効にされていることを決定するステップであって、ツールは、ビデオコーディング技法に対応する、ステップと、決定するステップに基づいて、第2のパラメータセット識別子を取得するステップと、ツールパラメータを第2のパラメータセット識別子に対応する第2のパラメータセットから取得するステップと、ツールパラメータを使用して、ビデオ領域をデコーディングするステップとを含む。
別の例示的側面では、ビデオ領域をエンコーディングする方法が、開示される。本方法は、ビデオ領域をエンコーディングする際に使用されるツールのツールパラメータを決定するステップであって、ツールは、ビデオコーディング技法を表す、ステップと、第1のパラメータセット識別子によって識別される、第1のパラメータセットを生成するステップと、第1のパラメータセット内に、ツールに対応するツールフラグを含むステップであって、ツールフラグは、ツールパラメータが、ビデオ領域をエンコーディングするために存在する、または有効にされていることを示す、値に設定される、ステップと、第2のパラメータセット識別子を使用して、第1のパラメータセット内にツールパラメータを含むステップと、ビデオ領域のヘッダ内の第1のパラメータセット識別子をコーディングするステップと、ツールパラメータを使用して、ビデオ領域をコーディングするステップとを含む。
さらに別の例示的側面では、上記に説明される方法を実装するように構成される、プロセッサを備える、ビデオデコーダ装置が、開示される。
さらに別の側面では、上記に説明される方法を実装するように構成される、プロセッサを備える、ビデオエンコーダ装置が、開示される。
別の側面では、コンピュータ可読媒体が、開示される。コンピュータ可読媒体は、その上に記憶されたコードを有し、コードは、プロセッサによって実行されると、プロセッサに、上記に説明される方法を実装させる。
これらおよび他の側面がさらに、本書に説明される。
(項目1)
ビットストリーム処理の方法であって、
第1のパラメータセット識別子をコーディングされたビデオ領域に対応するビットを含有するデータユニットから取得するステップと、
ツールフラグを上記第1のパラメータセット識別子に対応する第1のパラメータセットから取得するステップと、
上記ツールフラグから、上記ツールフラグに対応するツールのツールパラメータが、上記コーディングされたビデオ領域をデコーディングするために存在するかまたは有効にされていることを決定するステップであって、上記ツールは、ビデオコーディング技法に対応する、ステップと、
上記決定するステップに基づいて、第2のパラメータセット識別子を取得するステップと、
上記ツールパラメータを上記第2のパラメータセット識別子に対応する第2のパラメータセットから取得するステップと、
上記ツールパラメータを使用して、上記ビデオ領域をデコーディングするステップと
を含む、方法。
(項目2)
上記ビデオ領域は、ビデオ写真に対応する、項目1に記載の方法。
(項目3)
上記ビデオ領域は、ビデオ写真より小さい、項目1に記載の方法。
(項目4)
上記ビデオコーディング技法は、上記コーディングされたビデオ領域内の複数のコーディングブロックに共通であるコーディングパラメータに基づく、項目1に記載の方法。
(項目5)
別のツールフラグを上記第1のパラメータセットから取得するステップと、
上記ツールフラグから、上記別のツールフラグに対応する別のツールの別のツールパラメータが、上記コーディングされたビデオ領域をデコーディングするために存在するかまたは有効にされていることを決定するステップと、
上記決定するステップに基づいて、第3のパラメータセット識別子を取得するステップと、
上記別のツールパラメータを上記第3のパラメータセット識別子に対応する第3のパラメータセットから取得するステップと
をさらに含み、
上記ビデオ領域をデコーディングするステップは、上記別のツールパラメータを使用して、上記ビデオ領域をデコーディングするステップを含む、項目1に記載の方法。
(項目6)
上記第2のパラメータセット、上記第3のパラメータセット、および上記第1のパラメータセットを含有するネットワーク抽象化層(NAL)ユニットは、同一NALユニットタイプを有する、項目1-4のいずれかに記載の方法。
(項目7)
NALユニットは、同一NALユニットタイプとして、上記第3のパラメータセットを含有する、項目5または6に記載の方法。
(項目8)
上記ネットワーク抽象化層ユニットタイプは、NALユニットヘッダ内の固定長コードワードによって示される、項目7に記載の方法。
(項目9)
上記第2のパラメータセット識別子を取得するステップは、上記第2のパラメータセット識別子を上記第1のパラメータセットから取得するステップを含む、項目1-8のいずれかに記載の方法。
(項目10)
上記第3のパラメータセット識別子は、上記第1のパラメータセットから取得される、項目6に記載の方法。
(項目11)
ビデオ領域をエンコーディングする方法であって、
ビデオ領域をエンコーディングする際に使用されるツールのツールパラメータを決定するステップであって、上記ツールは、ビデオコーディング技法を表す、ステップと、
第1のパラメータセット識別子によって識別される第1のパラメータセットを生成するステップと、
上記第1のパラメータセット内に、上記ツールに対応するツールフラグを含むステップであって、上記ツールフラグは、上記ツールパラメータが、上記ビデオ領域をエンコーディングするために存在するかまたは有効にされていることを示す値に設定される、ステップと、
第2のパラメータセット識別子を使用して、上記第1のパラメータセット内にツールパラメータを含むステップと、
上記ビデオ領域のヘッダ内の第1のパラメータセット識別子をコーディングするステップと、
上記ツールパラメータを使用して、上記ビデオ領域をコーディングするステップと
を含む、方法。
(項目12)
上記含むステップは、
上記ツールパラメータが既存のツールパラメータセット内の既存のツールパラメータと同じ場合、上記第2のパラメータセット識別子を上記既存のパラメータセットのパラメータセット識別子に等しくなるように設定するステップと、
上記ツールパラメータが任意の既存のパラメータセット内の任意の既存のツールパラメータと同じではない場合、上記第1のパラメータセット識別子と異なる値を有する上記第2のパラメータセット識別子を生成し、使用するステップと
を含む、項目11に記載の方法。
(項目13)
上記ビデオ領域は、ビデオ写真に対応する、項目11に記載の方法。
(項目14)
上記ビデオ領域は、ビデオ写真より小さい、項目11に記載の方法。
(項目15)
上記ビデオコーディング技法は、上記コーディングされたビデオ領域内の複数のコーディングブロックに共通であるコーディングパラメータに基づく、項目11に記載の方法。
(項目16)
上記第1のパラメータセット内に、別のツールに対応する別のツールフラグを含むステップであって、上記別のツールフラグは、別のツールに対応する別のツールパラメータが、上記ビデオ領域をエンコーディングするために存在するかまたは有効にされていることを示す値に設定される、ステップと、
第3のパラメータセット識別子を使用して、上記第1のパラメータセット内に別のツールパラメータを含むステップと
をさらに含み、
上記ビデオ領域をコーディングするステップは、上記別のツールパラメータを使用して実施される、項目11-15のいずれかに記載の方法。
(項目17)
上記第2のパラメータセット識別子は、上記第1のパラメータセット内でコーディングされる、項目11に記載の方法。
(項目18)
項目1-10のうちの任意の1つ以上のものに記載の方法を実装するように構成されるプロセッサを備える、ビデオデコーダ装置。
(項目19)
項目11-17のうちの任意の1つ以上のものに記載の方法を実装するように構成されるプロセッサを備える、ビデオエンコーダ装置。
(項目20)
コンピュータ可読媒体であって、上記コンピュータ可読媒体は、その上に記憶されるコードを有し、上記コードは、プロセッサによって実行されると、上記プロセッサに、項目1-17のうちの任意の1つ以上のものに記載の方法を実装させる、コンピュータ可読媒体。
本明細書に説明される付随の図面は、本説明のさらなる理解を提供するために提供され、本書の一部を構成する。
図1Aは、ビットストリーム処理方法の実施例のフローチャートである。
図1Bは、ビデオ領域をエンコーディングする例示的方法のためのフローチャートである。
図2は、本開示における方法を実装する、例示的ビデオまたは写真エンコーダを図示する、略図である。
図3は、写真をタイルグループにパーティション化する実施例を図示する、略図である。
図4は、写真をタイルグループにパーティション化する実施例を図示する、略図である。
図5は、パラメータセット内の複数のツールのパラメータを表すための構文構造の実施例を図示する、略図である。
図6A-6Bは、写真または写真領域のヘッダ内のツールパラメータのためのパラメータセットを参照するための構文構造の実施例を図示する。
図7は、本開示における方法を実装する、例示的ビデオまたは写真デコーダを図示する、略図である。
図8は、本開示における方法を実装する、抽出器の実施例を図示する、略図である。
図9は、少なくとも、本開示に説明される例示的エンコーダを含む、第1の例示的デバイスを図示する、略図である。
図10は、少なくとも、本開示に説明される例示的デコーダを含む、第2の例示的デバイスを図示する、略図である。
図11は、第1の例示的デバイスと、第2の例示的デバイスとを含む、電子システムを図示する、略図である。
図12は、本書に説明される技法を実装するために使用される、ハードウェアプラットフォームの実施例を示す。
節の見出しは、可読性を改良するためのみに本書で使用され、各節内の開示される実施形態および技法の範囲をその節のみに限定しない。ある特徴は、H.264/AVC(高度ビデオコーディング)、H.265/HEVC(高効率ビデオコーディング)およびH.266多用途ビデオコーディング(VVC)規格の実施例を使用して説明される。しかしながら、開示される技法の可用性は、H.264/AVCまたはH.265/HEVCまたはH.266/VVCシステムのみに限定されない。
本特許文書では、ビデオは、1つ以上の写真のシーケンスから成る。時折ビデオ基本ストリームとも称される、ビットストリームが、ビデオまたは写真を処理する、エンコーダによって生成される。ビットストリームはまた、システム層プロセスをビデオまたは写真エンコーダによって生成されたビデオ基本ストリーム上で実施することの出力である、トランスポートストリームまたはメディアファイルであることができる。ビットストリームをデコーディングすることは、ビデオまたは写真をもたらす。システム層プロセスは、ビデオ基本ストリームをカプセル化するためのものである。例えば、ビデオ基本ストリームは、トランスポートストリームまたはメディアファイルの中にペイロードとしてパッキングされる。システム層プロセスはまた、トランスポートストリームまたはメディアファイルを伝送のためにストリームの中に、またはペイロードとしての記憶のためにファイルの中にカプセル化する動作を含む。システム層プロセスにおいて生成されたデータユニットは、システム層データユニットと称される。システム層プロセスにおいてペイロードをカプセル化する間、システム層データユニット内に付加される情報は、システム層情報、例えば、システム層データユニットのヘッダと呼ばれる。ビットストリームを抽出することは、ビットストリームのビットの一部を含有する、サブビットストリーム、および抽出プロセスによる構文要素上への1つ以上の必要な修正を取得する。サブビットストリームをデコーディングすることは、ビデオまたは写真をもたらし、これは、ビットストリームをデコーディングすることによって取得される、ビデオまたは写真と比較して、より低い解像度および/またはより低いフレームレートであり得る。サブビットストリームから取得されるビデオまたは写真はまた、ビットストリームから取得されるビデオまたは写真の領域でもあり得る。
パラメータセットは、部分的に1つ以上の写真をデコーディングする際に共通パラメータを搬送する、ビデオビットストリーム内のデータユニットである。パラメータセットは、そのパラメータセット識別子を規定する、構文要素を有する。概して、デコーダは、スライスヘッダ(例えば、H.264/AVC規格、H.265/HEVC規格)またはタイルグループヘッダ(現在のH.266/VVC WD(作業原案))内の1つ以上のパラメータセット識別子を取得する。すなわち、そのようなパラメータセットは、直接または間接的に、スライスまたはタイルグループによって参照される。デコーディングプロセスでは、デコーダは、スライスまたはタイルグループと称されるものに等しいその識別子を用いて、パラメータセットをアクティブ化する。
ビデオコーデックでは、1つ以上のコーディングツールは、写真適応または写真領域適応の特徴、例えば、適応ループフィルタ(ALF)、スケーリングリスト、サンプル適応オフセット(SAO)等を有する。パラメータセットは、そのようなパラメータが写真内の領域間または複数の写真間で効率的に共有され得るように、そのようなツールのパラメータを効率的に搬送するために使用される。H.266/VVC WDの現在の設計では、適応パラメータセット(APS)が、最初に、ALFパラメータをカプセル化するために採用される。写真間で(または写真内の領域間でさえ)頻繁に変化する特徴を伴う、より多くの情報が、APS内でコーディングされることが予期される。ここで、パラメータセットのアクティブ化および管理における増加された複雑性を伴わずに、種々のツールのパラメータが柔軟に更新され得るように、APS内でパラメータをコーディングする方法に関する問題が生じる。
問題1:
従来的方法に従って、全てのパラメータが、単一APS内でコーディングされる場合、複製されたコーディングされた情報の問題が、生じる。具体的には、ツールAおよびツールBのパラメータが、APS内でコーディングされると仮定する。例えば、後続タイルグループ(または同等に、スライス)が、前者のコーディングされたタイルグループと同一ツールAパラメータを使用するが、異なるツールBパラメータを使用する、シナリオを検討する。この場合、エンコーダは、新しいツールBパラメータを含有するが、繰り返されるツールA情報も含有する、新しいAPSを生成する必要があり、そのようなツールA情報は、ビットの無駄につながる。
問題2:
問題1を解決するために、JCTVC-G332は、複数のAPS識別子を単一スライスヘッダ内でシグナリングする方法を提供する。デコーディングプロセスでは、デコーダは、ツール情報につながるフラグが1に等しい場合、複数のAPSをアクティブ化し、前のアクティブ化されたAPS内で取得された情報を現在のアクティブ化されたAPS内で取得される情報で上書きする。JCTVC-G332における問題は、複数のAPS識別子をスライスヘッダ内に有し、付加的上書き動作を有するものである。エンコーダ実装の観点から、エンコーダは、常時、デコーダが、上記の設計に従って、複数のAPSのアクティブ化の際、同じツールパラメータを得ることができることを確実にするようにAPS内のコーディングツールパラメータを適切に扱うものとされ、これは、算出負担および余剰判断動作をエンコーダにもたらす。
問題3:
別の種類の先行技術は、スライスまたはタイルグループをデコーディングする際に使用されるツール毎に、APSを別個にシグナリングするものである。問題1における実施例を検討する。ツールBが、スライスをコーディングする際に使用される場合、ツールB情報を含有するAPSに対応するAPS識別子が、本APSが依然としてツールA情報を含有するかどうかにかかわらず、エンコーダによって、スライスヘッダ内にシグナリングされる。APSでは、ツールBパラメータが、ツールAパラメータに続いて提示されると仮定する。ここで、問題は、デコーディングプロセスでは、デコーダが、最初に、ツールBパラメータを解析する前に、アクティブ化されたAPS内でツールAパラメータを解析する必要があることである。すなわち、ツールAパラメータは、本スライスをデコーディングする際に必要とされ得ず、ツールAパラメータを解析する動作は、デコーダの算出リソースを無駄にしている。加えて、別の問題は、アクティブ化されたパラメータセット内の部分的情報のみがデコーディングプロセスにおいて有効であるということが、「アクティブ化されたパラメータ内のパラメータが有効である」という一般的概念および動作を覆すことになることである。
問題4:
問題1を解決するために、JCTVC-H0069は、APS参照方法を提供する。第1のAPSは、第1のAPS内の第2のAPSの識別子に等しいref_aps_idをシグナリングすることによって、第2のAPSを参照し得る。スライスヘッダでは、1つのみのAPS識別子が、シグナリングされる。第1のAPSをデコーディングする際、第2のAPSは、アクティブ化され、ツールパラメータを得る。問題は、APS参照スキームによってリンクされたAPSのチェーンが、エンコーダおよびデコーダ実装における複雑性を上昇させることである。コーデックが、APSバッファの記憶および更新を誘導するための参照関係を維持する必要があり、複数のAPSのアクティブ化を用いて参照チェーンをトレーシングすることによってのみ、ツールパラメータ(また、ツールの有効フラグを含み得る)を突き止めることができる。加えて、別の問題は、アクティブ化されたパラメータセット内の部分的情報のみがデコーディングプロセスにおいて有効であることが、「アクティブ化されたパラメータ内のパラメータが有効である」という一般的概念および動作を覆すことになることである。
問題5:
問題1を解決するために、JCTVC-H0505は、単一APS内の1つのみのツールのパラメータのみを提示する、APS設計を提供する。JCTVC-H0505は、グループパラメータセット(GPS)を提供し、APS識別子および他のパラメータセット識別子(例えば、PPS識別子)を集合的にシグナリングする。スライスヘッダでは、GPS識別子は、本スライスをデコーディングするためにアクティブ化されるべきパラメータセットを示すようにシグナリングされる。JCTVC-H0505設計の問題は、新しいパラメータセット(すなわち、GPS)をハンドリングする増加された複雑性である。別の問題は、概して、APS内のパラメータが、他のパラメータセット(例えば、PPS)内のものより頻繁に変化するため、GPSが、APS識別子を頻繁に更新する必要があり、これが、写真毎に変化しないGPS内の他の情報(例えば、PPS識別子)の繰り返しコーディングにつながるという事実にある。第3の問題は、APS内の1つ以上のツールが、写真の領域に適応可能であり得るとき、異なるAPSが、単一写真内の異なる領域に適用され、これがまた、確実に、GPS内のPPS識別子の繰り返しコーディングにつながることである。GPS内の部分的情報の上記の2つの繰り返しコーディングもまた、GPSバッファおよび参照の複雑な管理をもたらす。
パラメータの効率的コーディングのために、パラメータセットは、部分的に1つ以上の写真をデコーディングする際、共通パラメータを搬送するビデオビットストリーム内にデータユニットとして導入される。パラメータセットは、そのパラメータセット識別子を規定する、構文要素を有する。概して、デコーダは、スライスヘッダ(例えば、H.264/AVC規格、H.265/HEVC規格)またはタイルグループヘッダ(現在のH.266/VVC WD(作業原案))内の1つ以上のパラメータセット識別子を取得する。すなわち、そのようなパラメータセットは、直接または間接的に、スライスまたはタイルグループによって参照される。デコーディングプロセスでは、デコーダは、スライスまたはタイルグループと称されるものに等しいその識別子を用いて、パラメータセットをアクティブ化する。
ビデオコーデックでは、1つ以上のコーディングツールまたはコーディング技法は、写真適応または写真領域適応の特徴、例えば、適応ループフィルタ(ALF)、スケーリングリスト、サンプル適応オフセット(SAO)等を有する。パラメータセットは、そのようなパラメータが写真内の領域間または複数の写真間で効率的に共有され得るように、そのようなツールのパラメータを効率的に搬送するために使用される。H.266/VVC WDの現在の設計では、適応パラメータセット(APS)が、最初に、ALFパラメータをカプセル化するために採用される。写真間で(または写真内の領域間でさえ)頻繁に変化する特徴を伴う、より多くの情報が、APS内でコーディングされることが予期される。ここで、パラメータセットのアクティブ化および管理における増加された複雑性を伴わずに、種々のツールのパラメータが柔軟に更新され得るように、パラメータセット内でパラメータをコーディングする方法に関する問題が生じる。本問題は、ビデオコーデックおよびビットストリーム内へのパラメータセットの設計および実装に一般的である。
本明細書に説明される実施形態のある側面によると、写真または写真領域をエンコーディングする際に使用されるツールのツールパラメータを決定するステップと、識別子パラメータを、ツールパラメータを含有するパラメータセットに対応する、パラメータセット識別子に等しくなるように設定するステップと、第1のパラメータセットを生成するステップと、第1のパラメータセット識別子を第1のパラメータセットに割り当てるステップと、第1のパラメータセット内のツールに対応するツールフラグを、ツールパラメータが、提示されている、またはツールが、写真または写真領域をエンコーディングする際に有効にされることを示す、値に等しくなるようにコーディングするステップと、第1のパラメータセット内の識別子パラメータをコーディングするステップであって、第1のパラメータがツールパラメータを含有するパラメータセットと同一タイプである、ステップと、写真または写真領域内のヘッダ内の第1のパラメータセット識別子をコーディングするステップと、ツールパラメータを使用して、写真または写真領域をコーディングするステップとを含む、ビデオまたは写真を処理するためのエンコーディング方法が、提供される。
本明細書に開示される実施形態のある側面によると、ビットストリームを解析し、第1のパラメータセット識別子をコーディングされた写真またはコーディングされた写真領域に対応するビットを含有するデータユニットから取得するステップと、第1のパラメータセット識別子に等しいその識別子を用いて、第1のパラメータセットをアクティブ化するステップと、ツールフラグを第1のパラメータセットから取得するステップと、ツールフラグが、ツールフラグに対応するツールのツールパラメータが、提示されている、またはツールフラグに対応するツールが、コーディングされた写真またはコーディングされた写真領域をデコーディングする際に有効にされることを示す場合、第2のパラメータセット識別子を第1のパラメータセットから取得するステップと、第2のパラメータセット識別子に等しいその識別子を用いて、第1のパラメータセットと同一タイプの第2のパラメータセットをアクティブ化するステップであって、第2のパラメータセット内のインジケーションパラメータは、第2のパラメータセット内に含有されるツールパラメータがツールフラグに対応するツールのツールパラメータのみであることを示す、ステップと、ツールパラメータを第2のパラメータセットから取得するステップと、ツールパラメータを使用して、コーディングされた写真またはコーディングされた写真領域をデコーディングするステップとを含む、ビットストリームを処理し、ビデオまたは写真を再構築するためのデコーディング方法が、提供される。
本明細書に説明される上記の方法および他の技法を用いて、種々のツールのパラメータが、パラメータセットのアクティブ化および管理における増加された複雑性を伴わずに、パラメータセット内で効率的にコーディングされ、柔軟に更新されることができる。
実施形態1
図2は、ビデオまたは写真をコーディングする際に本開示における方法を利用する、エンコーダを図示する、略図である。エンコーダの入力は、ビデオであって、出力は、ビットストリームである。ビデオが、写真のシーケンスから成るため、エンコーダは、事前に設定された順序、すなわち、エンコーディング順序において、写真を1つずつ処理する。エンコーダ順序は、エンコーダのための構成ファイル内に規定された予測構造に従って決定される。ビデオ内の写真のエンコーディング順序(デコーダ側における写真のデコーディング順序に対応する)は、写真の表示順序と同じであってもよい、または異なってもよいことに留意されたい。
パーティションユニット201は、エンコーダの構成に従って、入力ビデオ内の写真をパーティション化する。概して、写真は、1つ以上の最大コーディングブロックにパーティション化されることができる。最大コーディングブロックは、エンコーディングプロセスにおいて最大の許容または構成されるブロックであって、通常、写真内の正方形領域である。写真は、1つ以上のタイルにパーティション化されることができ、タイルは、整数の最大コーディングブロックまたは非整数の最大コーディングブロックを含有してもよい。1つのオプションは、タイルが1つ以上のスライスを含有し得ることである。すなわち、タイルはさらに、1つ以上のスライスにパーティション化されることができ、かつ各スライスは、整数の最大コーディングブロックまたは非整数の最大コーディングブロックを含有してもよい。別のオプションは、スライスが1つ以上のタイルを含有する、またはタイルグループが1つ以上のタイルを含有するものである。すなわち、写真内のある順序(例えば、タイルのラスタ走査順序)における1つ以上のタイルが、タイルグループを形成する。加えて、タイルグループはまた、左上タイルおよび右下タイルの場所を用いて表される、写真内の矩形領域を網羅することができる。以下の説明では、「タイルグループ」が、実施例として使用される。パーティションユニット201は、固定パターンを使用して、写真をパーティション化するように構成されることができる。例えば、パーティションユニット201は、写真をタイルグループにパーティション化し、各タイルグループは、最大コーディングブロックの行を含有する、単一タイルを有する。別の実施例は、パーティションユニット201が、写真を複数のタイルにパーティション化し、写真内のラスタ走査順序におけるタイルをタイルグループに形成するものである。代替として、パーティションユニット201はまた、動的パターンを採用し、写真をタイルグループ、タイル、およびブロックにパーティション化することができる。例えば、最大伝送ユニット(MTU)サイズの制限に適合させるために、パーティションユニット201は、動的タイルグループパーティション化方法を採用し、タイルグループ毎のコーディングビットの数がMTU制限を超えないことを確実にする。
図3は、写真をタイルグループにパーティション化する実施例を図示する、略図である。パーティションユニット201は、16×8の最大コーディングブロック(鎖線に描写される)を伴う写真30を8つのタイル300、310、320、330、340、350、360、および370にパーティション化する。パーティションユニット201は、写真30を3つのタイルグループにパーティション化する。タイルグループ3000は、タイル300を含有し、タイルグループ3100は、タイル310、320、330、340、および350を含有し、タイルグループ3200は、タイル360および370を含有する。図3におけるタイルグループは、写真30内にタイルラスタ走査順序で形成される。
図4は、写真をタイルグループにパーティション化する実施例を図示する、略図である。パーティションユニット201は、16×8の最大コーディングブロック(鎖線に描写される)を伴う写真40を8つのタイル400、410、420、430、440、450、460、および470にパーティション化する。パーティションユニット201は、写真40を2つのタイルグループにパーティション化する。タイルグループ4000は、タイル400、410、440、および450を含有し、タイルグループ4100は、タイル420、430、460、および470を含有する。タイルグループ4000は、左上タイル400および右下タイル450として表され、タイルグループ4100は、左上タイル420および右下タイル470として表される。
1つ以上のタイルグループまたはタイルは、写真領域と称され得る。概して、写真を1つ以上のタイルにパーティション化することは、エンコーダ構成ファイルに従って行われる。パーティションユニット201は、パーティション化パラメータを設定し、タイルへの写真のパーティション化様式を示す。例えば、パーティション化様式は、写真を(ほぼ)等サイズのタイルにパーティション化することであり得る。別の実施例は、パーティション化様式は、行および/または列内のタイル境界の場所を示し、フレキシブルなパーティション化を促進することであり得る。
パーティションユニット201の出力パラメータは、写真のパーティション化様式を示す。
予測ユニット202は、コーディングブロックの予測サンプルを決定する。予測ユニット202は、ブロックパーティションユニット203と、ME(運動推定)ユニット204と、MC(運動補償)ユニット205と、イントラ予測ユニット206とを含む。予測ユニット202の入力は、パーティションユニット201によって出力された最大コーディングブロックと、最大コーディングブロックと関連付けられる属性パラメータ、例えば、タイルグループ内およびタイル内の写真内の最大コーディングブロックの場所とである。予測ユニット202は、最大コーディングブロックを1つ以上のコーディングブロックにパーティション化し、これはまた、より小さいコーディングブロックにさらにパーティション化されることができる。クワッドツリー、バイナリ分割、およびターナリ分割を含む、1つ以上のパーティション化方法が、適用されることができる。予測ユニット202は、パーティション化において取得されるコーディングブロックのための予測サンプルを決定する。随意に、予測ユニット202はさらに、コーディングブロックを1つ以上の予測ブロックにパーティション化し、予測サンプルを決定することができる。予測ユニット202は、DPB(デコーディングされた写真バッファ)ユニット214内の1つ以上の写真をコーディングブロックのインター予測サンプルを決定する際の参照として採用する。予測ユニット202はまた、加算器212によって出力された写真の再構成された部分をコーディングブロックの予測サンプルを導出する際の参照として採用することができる。予測ユニット202は、コーディングブロックの予測サンプルと、例えば、一般的レート歪み最適化(RDO)法を使用することによる、予測ユニット202の出力パラメータでもある、予測サンプルを導出するための関連付けられるパラメータとを決定する。
予測ユニット202の内側では、ブロックパーティションユニット203が、コーディングブロックのパーティション化を決定する。ブロックパーティションユニット203は、最大コーディングブロックを1つ以上のコーディングブロックにパーティション化し、これはまた、より小さいコーディングブロックにさらにパーティション化されることができる。クワッドツリー、バイナリ分割、およびターナリ分割を含む、1つ以上のパーティション化方法が、適用されることができる。随意に、ブロックパーティションユニット203はさらに、コーディングブロックを1つ以上の予測ブロックにパーティション化し、予測サンプルを決定することができる。ブロックパーティションユニット203は、コーディングブロックのパーティション化の決定の際にRDO法を採用することができる。ブロックパーティションユニット203の出力パラメータは、コーディングブロックのパーティション化を示す、1つ以上のパラメータを含む。
MEユニット204およびMCユニット205は、DPB214からの1つ以上のデコーディングされた写真を参照写真として利用して、コーディングブロックのインター予測サンプルを決定する。MEユニット204は、1つ以上の参照写真を含有する、1つ以上の参照リストを構築し、コーディングブロックのための参照写真内の1つ以上のマッチングブロックを決定する。MCユニット205は、マッチングブロック内のサンプルを使用して、予測サンプルを導出し、コーディングブロック内のオリジナルサンプルと予測サンプルとの間の差異(すなわち、残差)を計算する。MEユニット204の出力パラメータは、参照リストインデックス、参照インデックス(refIdx)、運動ベクトル(MV)等を含む、マッチングブロックの場所を示し、参照リストインデックスは、その中にマッチングブロックが位置する、参照写真を含有する、参照リストを示し、参照インデックスは、マッチングブロックを含有する、参照リスト内の参照写真を示し、MVは、コーディングブロックの場所と写真内のピクセルの場所を表すための同じ座標内のマッチングブロックとの間の相対的オフセットを示す。MCユニット205の出力パラメータは、コーディングブロックのインター予測サンプル、およびインター予測サンプルを構築するためのパラメータ、例えば、マッチングブロック内のサンプルのための加重パラメータ、マッチングブロック内のサンプルをフィルタリングするためのフィルタタイプおよびパラメータである。概して、RDO法は、レート歪み(RD)の意味における最適マッチングブロックおよび2つのユニットの対応する出力パラメータを得るために、MEユニット204およびMCユニット205にはともに適用されることができる。
特に、かつ随意に、MEユニット204およびMCユニット205は、コーディングブロックを参照として含有する、現在の写真を使用して、コーディングブロックのイントラ予測サンプルを取得することができる。本開示では、イントラ予測とは、コーディングブロックを含有する写真内のデータのみがコーディングブロックの予測サンプルを導出するための参照として採用されることを意味する。この場合、MEユニット204およびMCユニット205は、現在の写真内の再構成された部分を使用し、再構成された部分は、加算器212の出力からのものである。実施例は、エンコーダが、写真バッファを配分し、加算器212の出力データを(一時的に)記憶するものである。エンコーダのための別の方法は、特殊写真バッファをDPB214内に留保し、加算器212からのデータを保つことである。
イントラ予測ユニット206は、コーディングブロックを参照として含有する現在の写真の再構成された部分を使用して、コーディングブロックのイントラ予測サンプルを取得する。イントラ予測ユニット206は、コーディングブロックの再構成された近傍のサンプルをコーディングブロックのイントラ予測サンプルを導出するためのフィルタの入力としてとり、フィルタは、(例えば、角イントラ予測を使用するときに予測サンプルを計算するための)補間フィルタ、(例えば、DC値を計算するための)低域通過フィルタ、またはすでにコーディングされた(色)コンポーネントを使用して、コンポーネントの予測値(色)を導出するためのクロスコンポーネントフィルタであることができる。特に、イントラ予測ユニット206は、検索動作を実施し、現在の写真内の再構成された部分の範囲内のコーディングブロックのマッチングブロックを得て、マッチングブロック内のサンプルをコーディングブロックのイントラ予測サンプルとして設定することができる。イントラ予測ユニット206は、RDO法を呼び出し、イントラ予測モード(すなわち、コーディングブロックのためのイントラ予測サンプルを計算するための方法)および対応する予測サンプルを決定する。イントラ予測サンプルに加え、イントラ予測ユニット206の出力はまた、使用中のイントラ予測モードを示す、1つ以上のパラメータを含む。
加算器207は、オリジナルサンプルとコーディングブロックの予測サンプルとの間に差異を計算するように構成される。加算器207の出力は、コーディングブロックの残差である。残差は、N×M 2次元行列として表され得、NおよびMは、2つの正の整数であって、NおよびMは、等しいまたは異なる値であることができる。
変換ユニット208は、残差をその入力としてとる。変換ユニット208は、1つ以上の変換方法を残差に適用してもよい。信号処理の観点から、変換方法は、変換行列によって表され得る。随意に、変換ユニット208は、残差のための変換ブロックとなるように、コーディングブロックのものと同一形状およびサイズを伴う矩形ブロック(本開示では、正方形ブロックは、矩形ブロックの特殊例である)を使用することを決定してもよい。随意に、変換ユニット208は、残差をいくつかの矩形ブロック(また、矩形ブロックの幅または高さが1つのサンプルである、特殊例を含んでもよい)にパーティション化し、変換動作をいくつかの矩形上で、順次、例えば、デフォルト順序(例えば、ラスタ走査順序)、所定の順序(例えば、予測モードまたは変換方法に対応する順序)、いくつかの候補順序のための選択された順序に従って実施することを決定してもよい。変換ユニット208は、複数の変換を残差上で実施することを決定してもよい。例えば、変換ユニット208は、最初に、コア変換を残差上で実施し、次いで、二次変換をコア変換を終了後に取得された係数上で実施する。変換ユニット208は、RDO法を利用して、変換パラメータを決定し、これは、残差ブロックに適用される変換プロセス、例えば、残差ブロックの変換ブロック、変換行列、複数の変換等へのパーティション化において使用される実行様式を示す。変換パラメータは、変換ユニット208の出力パラメータ内に含まれる。変換ユニット208の出力パラメータは、変換パラメータと、2次元行列によって表され得る、残差を変換後に取得されたデータ(例えば、変換係数)とを含む。
量子化ユニット209は、残差のその変換後、変換ユニット208によって出力されたデータを量子化する。量子化ユニット209内で使用される量子化器は、スカラー量子化器およびベクトル量子化器の一方または両方であることができる。大部分のビデオエンコーダでは、量子化ユニット209は、スカラー量子化器を採用する。スカラー量子化器の量子化ステップは、ビデオエンコーダ内の量子化パラメータ(QP)によって表される。概して、QPと量子化ステップとの間の同じマッピングは、エンコーダおよび対応するデコーダ内で事前に設定または事前に定義される。
QPの値、例えば、写真レベルQPおよび/またはブロックレベルQPは、エンコーダに適用される構成ファイルに従って設定される、またはエンコーダ内のコーダ制御ユニットによって決定されることができる。例えば、コーダ制御ユニットは、レート制御(RC)法を使用して、写真および/またはブロックの量子化ステップを決定し、次いで、QPと量子化ステップとの間のマッピングに従って、量子化ステップをQPに変換する。
量子化ユニット209のための制御パラメータは、QPである。量子化ユニット209の出力は、2次元行列の形態で表される、1つ以上の量子化された変換係数(すなわち、「レベル」として知られる)である。
逆量子化210は、スケーリング動作を量子化209の出力上で実施し、再構成された係数を得る。逆変換ユニット211は、変換ユニット208からの変換パラメータに従って、逆変換を逆量子化210からの再構成された係数上で実施する。逆変換ユニット211の出力は、再構成された残差である。特に、エンコーダが、ブロックをコーディングする際の量子化をスキップすることを決定する(例えば、エンコーダが、RDO法を実装し、量子化をコーディングブロックに適用するかどうかを決定する)とき、エンコーダは、量子化ユニット209および逆量子化210をバイパスすることによって、変換ユニット208の出力データを逆変換ユニット211に誘導する。
加算器212は、再構成された残差および予測ユニット202からのコーディングブロックの予測サンプルを入力としてとり、コーディングブロックの再構成されたサンプルを計算し、再構成されたサンプルをバッファ(例えば、写真バッファ)の中に入れる。例えば、エンコーダは、写真バッファを配分し、加算器212の出力データを(一時的に)記憶する。エンコーダのための別の方法は、特殊写真バッファをDPB214内に留保し、加算器212からのデータを保つことである。
フィルタリングユニット213は、フィルタリング動作をデコーディングされた写真バッファ内の再構成された写真サンプル上で実施し、デコーディングされた写真を出力する。フィルタリングユニット213は、1つのフィルタまたはいくつかのカスケードフィルタから成ってもよい。例えば、H.265/HEVC規格によると、フィルタリングユニットは、2つのカスケードフィルタ、すなわち、非ブロック化フィルタおよびサンプル適応オフセット(SAO)フィルタから成る。フィルタリングユニット213は、適応ループフィルタ(ALF)を含んでもよい。フィルタリングユニット213はまた、ニューラルネットワークフィルタを含んでもよい。フィルタリングユニット213は、写真内の全てのコーディングブロックの再構成されたサンプルがデコーディングされた写真バッファ内に記憶されると、写真の再構成されたサンプルのフィルタリングを開始してもよく、これは、「写真層フィルタリング」と称され得る。随意に、フィルタリングユニット213のための写真層フィルタリングの代替実装(「ブロック層フィルタリングと称される」)は、再構成されたサンプルが写真内の全ての連続コーディングブロックをエンコーディングする際の参照として使用されない場合、写真内のコーディングブロックの再構成されたサンプルのフィルタリングを開始するものである。ブロック層フィルタリングは、フィルタリングユニット213が、写真の全ての再構成されたサンプルが利用可能になるまで、フィルタリング動作を一時停止し、したがって、スレッド間の時間遅延をエンコーダ内に保存することを要求しない。フィルタリングユニット213は、RDO法を呼び出すことによって、フィルタリングパラメータを決定する。フィルタリングユニット213の出力は、写真のデコーディングされたサンプルであって、フィルタリングパラメータは、フィルタのインジケーション情報、フィルタ係数、フィルタ制御パラメータ等を含む。
エンコーダは、フィルタリングユニット213からデコーディングされた写真をDPB214内に記憶する。エンコーダは、例えば、DPB214内の写真記憶の時間長、DPB214からの写真の出力等、DPB214内の写真上での動作を制御するために使用される、DPB214に適用される、1つ以上の命令を決定してもよい。本開示では、そのような命令は、DPB214の出力パラメータとして捉えられる。
エントロピコーディングユニット215は、バイナリ化およびエントロピコーディングを写真の1つ以上のコーディングパラメータ上で実施し、これは、コーディングパラメータの値をバイナリシンボル「0」および「1」から成るコードワードに変換し、仕様または規格に従って、コードワードをビットストリームの中に書き込む。コーディングパラメータは、テクスチャデータおよび非テクスチャとして分類されてもよい。テクスチャデータは、コーディングブロックの変換係数であって、非テクスチャデータは、エンコーダ内のユニットの出力パラメータ、パラメータセット、ヘッダ、補助情報等を含む、テクスチャデータを除く、コーディングパラメータ内の他のデータである。エントロピコーディングユニット215の出力は、仕様または規格に一致する、ビットストリームである。
エントロピコーディングユニット215は、前述のユニットからの出力パラメータと、ビットストリームに提示されるために必要とされる、コードパラメータとを受信する。本開示では、また、ビデオコーディング技術の分野では、「ツール」は、エンコーディングまたはデコーディングする際のプロセスまたはユニットを指す。ツールは、前述のユニット等の相対的大ユニットであってもよい。ツールはまた、コーディングモード(例えば、マージ、平面等)、フィルタ(例えば、非ブロック化、SAO、ALF、NNフィルタ等)等によって表されるプロセス等の比較的に詳細なプロセスであってもよい。ツールの「ツールパラメータ」は、エンコーダまたはデコーダがツールによって規定されたエンコーディングまたはデコーディング動作を行うための1つ以上のパラメータを指す。例えば、マージモードのツールパラメータは、コーディングブロックのマージインデックスを含む。ALFのツールパラメータは、フィルタ係数を含む。
エンコーディングプロセスでは、ツールは、1つ以上の写真、1つ以上の写真領域(例えば、タイル、タイルグループ)、および1つ以上のコーディングブロックに適応可能であってもよい。ツールパラメータの観点から、ツールが、1つ以上の写真に適応可能である場合、ツールのツールパラメータは、少なくとも、写真内の全てのブロックのために更新しない。概して、ツールが、少なくとも、1つ以上の写真領域に適応可能であるとき、エントロピコーディングユニット215は、共通情報が、少なくとも、写真領域内のコーディングブロック間で共有され、ツールパラメータのコーディングビットを節約するように、ヘッダ内またはパラメータセット内の本ツールのツールパラメータをコーディングするであろう。
ツールAおよびツールBが、少なくとも、1つ以上の写真領域に適応可能である、2つのツールであると仮定する。ツールAおよびツールBの実施例は、フィルタリングユニット213内で使用される種々のフィルタであって、また、スケーリングリスト、参照写真セット(RPS)、参照写真リスト(RPL)等の1つ以上の写真領域に適応可能なそのパラメータを用いたプロセスでもあることができる。ツールAおよびツールBのパラメータツールは、写真または写真領域をエンコーディングする際に決定される。例えば、フィルタリングユニット213は、フィルタのパラメータを決定し、そのようなパラメータをエントロピコーディングユニット215にパスする。
エントロピコーディングユニット215は、ツールAおよびツールBのパラメータツールをパラメータセット内にコーディングする。そのようなパラメータセットは、シーケンスパラメータセット(SPS)、写真パラメータセット(PPS)、適応パラメータセット(APS)、または少なくとも写真または写真領域のための共通パラメータを搬送する、他のパラメータセットであることができる。図5は、パラメータセット内の複数のツールのパラメータを表すための構文構造の実施例を図示する、略図である。図5における太字の構文は、ビットストリーム内に存在する1つ以上のビットのストリングによって表される構文要素であって、u(n)は、n個のビットを使用して、値を符号なし整数として表すことを規定し、nは、自然数であって、固定値または他の構文要素の値に応じた様式において変動する値であることができる。図5におけるtool_A_parameter()およびtool_B_parameter()は、それぞれ、ツールAおよびツールBのためのツールパラメータを表す、2つのデータ構造である。
図5における構文要素の意味論は、以下のように提示される。
parameter_set_idは、他の構文要素による参照のためのパラメータセットを識別する。
info_typeは、パラメータセット内の情報のタイプを規定する。
1に等しいtool_A_flagは、ツールAが使用されることを規定する。0に等しいtool_A_flagは、ツールAが使用されないことを規定する。
1に等しいtool_B_flagは、ツールBが使用されることを規定する。0に等しいtool_B_flagは、ツールBが使用されないことを規定する。
代替として、tool_A_flagおよびtool_B_flagのための意味論は、以下の通りであり得る。
1に等しいtool_A_flagは、tool_A_parameter()の存在を規定する。0に等しいtool_A_flagは、tool_A_parameter()の不在を規定する。
1に等しいtool_B_flagは、tool_B_parameter()の存在を規定する。0に等しいtool_B_flagは、tool_B_parameter()の不在を規定する。
図6A-6Bは、写真または写真領域のヘッダ内のツールパラメータのためのパラメータセットを参照するための構文構造の実施例を図示する。例えば、図6A-6Bにおける構文構造は、タイルグループのヘッダ内で使用されることができる。region_parameter_set_idの意味論は、以下の通りである。
region_parameter_set_idは、使用中のパラメータセットのためのparameter_set_idの値を規定する。region_parameter_set_idに等しいそのパラメータセット識別子を伴うパラメータセットは、0に等しいinfo_typeを有するであろう。
図6Aでは、region_parameter_set_idは、常時、写真または写真領域のヘッダに提示される。図6Bでは、写真または写真領域のヘッダ内のregion_parameter_set_idの存在は、ツールAおよびツールBのうちの少なくとも1つが有効にされるかどうかで条件付けられる。概して、エントロピコーディングユニット215は、tool_A_enable_flagおよびtool_B_enableを複数の写真またはコーディングされたビデオシーケンスのためのパラメータセット内、例えば、SPS内にコーディングする。
図5および図6A-6Bにおける構文構造を使用して、エントロピコーディングユニット215は、ツールAおよびツールBのためのツールパラメータをコーディングする。特に、エンコーダが、ツールパラメータのいずれも更新しない場合、エントロピコーディングユニット215は、region_parameter_set_idを既存のパラメータセットの識別子に等しくなるように設定する。
ステップ101:エントロピコーディングユニット215が、識別子パラメータを、ツールパラメータを含有するパラメータセットに対応する、パラメータセット識別子に等しくなるように設定する。
エントロピコーディングユニット215が、ツールパラメータが既存のパラメータセット内のツールパラメータと同じであるかどうかをチェックする。該当する場合、エントロピコーディングユニット215は、識別子パラメータを、ツールパラメータを含有する既存のパラメータセットに対応する、パラメータセット識別子に等しくなるように設定する。エンコーダにおける例示的実装は、最初に、すでに既存のツールパラメータが写真または写真領域をコーディングするために好適であるかどうかをチェックするものである。例えば、エントロピコーディングユニット215が、ツールAパラメータが、1に等しいそのパラメータセット識別子を伴う、既存のパラメータセット内のものと同じであることを見出す。
そうでなければ、エントロピコーディングユニット215は、第2のパラメータセットを生成し、第2のパラメータセット識別子を第2のパラメータセットに割り当て、第2のパラメータセット内のインジケーションパラメータを、第2のパラメータセット内に含有されるツールパラメータがツールパラメータのみであることを示す、値に設定し、ツールパラメータを第2のパラメータセット内にコーディングする。例えば、エントロピコーディングユニット215が、図5における構文構造に従って、以下のようにツールBパラメータのためのパラメータセットを生成する。
parameter_set_rbsp( ){
parameter_set_id=2
info_type=2
tool_B_parameter()=tool B parameters
one or more extension and byte align bits
ステップ102:エントロピコーディングユニット215が、第1のパラメータセットを生成し、第1のパラメータセット識別子を第1のパラメータセットに割り当て、第1のパラメータセット内のツールに対応するツールフラグを、ツールパラメータが、提示されている、またはツールが、写真または写真領域をエンコーディングする際に有効にされることを示す、値に等しくなるようコーディングし、識別子パラメータを第1のパラメータセット内でコーディングし、第1のパラメータは、ツールパラメータを含有するパラメータセットと同一タイプである。2つのパラメータセットは、RBSP(未加工バイトシーケンスペイロード)データ構造のタイプが、同一値のNALユニットタイプ(すなわち、nal_unit_type)を規定する構文要素とともにNAL(ネットワーク抽象化層)ユニット内に含有される場合、同一タイプであることに留意されたい。解析ユニット701が、ツールパラメータを第2のパラメータセットから取得する。
エントロピコーディングユニット215が、図5における構文構造に従って、以下のように、ツールAおよびツールBのツールパラメータのための第1のパラメータセットを生成する。
parameter_set_rbsp( ){
parameter_set_id=3
info_type=0
tool_A_flag=1
tool_A_parameter_set_id=1
tool_B_flag=1
tool_B_parameter_set_id=2
one or more extension and byte align bits
ステップ103:エントロピコーディングユニット215が、第1のパラメータセット識別子を写真または写真領域のヘッダ内にコーディングする。
エントロピコーディングユニット215が、図6A-6Bにおけるregion_parameter_set_idを3に等しくなるように設定し、region_parameter_set_idを写真または写真領域(例えば、タイルグループ、またはタイル)のヘッダ内にコーディングする。
エンコーダは、写真または写真領域をエンコーディングするプロセスにおいて、ステップ101、102、および103を呼び出すことができることに留意されたい。エンコーダは、次いで、ツールパラメータを使用して、写真または写真領域をコーディングする。エントロピコーディングユニット215はまた、上記に述べられたデータのコーディングビットをビットストリームの中に書き込む。
特に、ツールAおよびツールBの両方のパラメータが、既存のパラメータセットにすでに提示されている場合、上記に述べられたステップ101、102、および103においてツールAパラメータをハンドリングするための方法は、ツールパラメータをパラメータセット内にコーディングするために使用される。
特に、ツールAおよびツールBのパラメータが、既存のパラメータセットに提示されない場合、上記に述べられたステップ101、102、および103においてツールBパラメータをハンドリングするための方法は、ツールパラメータをパラメータセット内にコーディングするために使用される。
実施形態2
図7は、実施形態1において前述のエンコーダによって生成されたビットストリームをデコーディングする際に本開示における方法を利用する、デコーダを図示する、略図である。デコーダの入力は、ビットストリームであって、デコーダの出力は、ビットストリームをデコーディングすることによって取得される、デコーディングされたビデオまたは写真である。
デコーダ内の解析ユニット701は、入力ビットストリームを解析する。解析ユニット701は、規格内に規定されたエントロピデコーディング方法およびバイナリ化方法を使用して、1つ以上のバイナリシンボル(すなわち、「0」および「1」)から成るビットストリーム内の各コードワードを対応するパラメータの数値に変換する。解析ユニット701はまた、1つ以上の利用可能なパラメータに従って、パラメータ値を導出する。例えば、ビットストリーム内に、デコーディングブロックが写真内の第1のものであることを示すフラグが存在するであろうとき、解析ユニット701は、写真領域の第1のデコーディングブロックのアドレスを示すアドレスパラメータを0となるように設定する。
解析ユニット701の入力ビットストリームでは、ツールパラメータを表すための構文構造は、図5および図6A-6Bに図示される。
図5は、パラメータセット内の複数のツールのパラメータを表すための構文構造の実施例を図示する、略図である。図5における構文要素の意味論は、以下のように提示される。
parameter_set_idは、他の構文要素による参照のためのパラメータセットを識別する。
info_typeは、パラメータセット内の情報のタイプを規定する。
1に等しいtool_A_flagは、ツールAが使用されることを規定する。0に等しいtool_A_flagは、ツールAが使用されないことを規定する。
1に等しいtool_B_flagは、ツールBが使用されることを規定する。0に等しいtool_B_flagは、ツールBが使用されないことを規定する。
代替として、tool_A_flagおよびtool_B_flagのための意味論は、以下の通りであり得る。
1に等しいtool_A_flagは、tool_A_parameter()の存在を規定する。0に等しいtool_A_flagは、tool_A_parameter()の不在を規定する。
1に等しいtool_B_flagは、tool_B_parameter()の存在を規定する。0に等しいtool_B_flagは、tool_B_parameter()の不在を規定する。
図6A-6Bは、写真または写真領域のヘッダ内のツールパラメータのためのパラメータセットを参照するための構文構造の実施例を図示する。例えば、図6A-6Bにおける構文構造は、タイルグループのヘッダ内にあることができる。region_parameter_set_idの意味論は、以下の通りである。
region_parameter_set_idは、使用中のパラメータセットのためのparameter_set_idの値を規定する。region_parameter_set_idに等しいそのパラメータセット識別子を伴うパラメータセットは、0に等しいinfo_typeを有するであろう。
図6Aでは、region_parameter_set_idは、常時、写真または写真領域のヘッダに提示される。図6Bでは、写真または写真領域のヘッダ内のregion_parameter_set_idの存在は、ツールAおよびツールBのうちの少なくとも1つが有効にされるかどうかで条件付けられる。
デコーディングプロセスでは、解析ユニット701は、ビットストリームを解析し、第1のパラメータセット識別子をコーディングされた写真またはコーディングされた写真領域に対応するビットを含有するデータユニットから取得する。図6A-6Bにおける構文構造を使用したエンコーダの前述の実施例に対応して、解析ユニット701は、region_parameter_set_id(3に等しい)をコーディングされた写真またはコーディングされた写真領域(例えば、タイルグループ、またはタイル)のヘッダから取得する。
解析ユニット701は、第1のパラメータセット識別子に等しいその識別子を用いて、第1のパラメータセットをアクティブ化する。図5における構文構造を使用したエンコーダの前述の実施例に対応するように、3に等しいそのパラメータ識別子を伴う第1のパラメータセットでは、解析ユニット701は、以下のように、構文要素の値を取得する。
parameter_set_rbsp( ){
parameter_set_id=3
info_type=0
tool_A_flag=1
tool_A_parameter_set_id=1
tool_B_flag=1
tool_B_parameter_set_id=2
one or more extension and byte align bits
ツールフラグが、ツールフラグに対応するツールのツールパラメータが、提示される、またはツールフラグに対応するツールが、コーディングされた写真またはコーディングされた写真領域をデコーディングする際に有効にされることを示す場合、解析ユニット701は、第2のパラメータセット識別子を第1のパラメータセットから取得する。次いで、解析ユニット701は、第2のパラメータセット識別子に等しいその識別子を用いて、第1のパラメータセットと同一タイプである、第2のパラメータセットをアクティブ化し、第2のパラメータセット内のインジケーションパラメータは、第2のパラメータセット内に含有されるツールパラメータがツールフラグに対応するツールのツールパラメータのみであることを示す。2つのパラメータセットは、RBSP(未加工バイトシーケンスペイロード)データ構造のタイプが、同一値のNALユニットタイプ(すなわち、nal_unit_type)を規定する構文要素とともにNAL(ネットワーク抽象化層)ユニット内に含有される場合、同一タイプであることに留意されたい。解析ユニット701が、ツールパラメータを第2のパラメータセットから取得する。
上記の実施例では、ツールAに関して、解析ユニット701は、最初に、tool_A_flagの値をチェックする。tool_A_flagが、1に等しいため、解析ユニット701は、tool_A_parameter_set_idの値(すなわち、1に等しい)を3に等しいparameter_set_idを伴うパラメータセットから取得する。解析ユニット701は、1に等しいそのパラメータセット識別子を用いて、パラメータセットをアクティブ化し、ツールAパラメータを取得する。
ツールBに関して、解析ユニット701は、次いで、3に等しいparameter_set_idを伴うパラメータセットから取得されるtool_B_flagの値をチェックする。tool_B_flagは、1に等しいため、解析ユニット701は、tool_B_parameter_set_idの値(すなわち、2に等しい)を3に等しいparameter_set_idを伴うパラメータセットから取得する。解析ユニット701は、1に等しいそのパラメータセット識別子を用いて、パラメータセットをアクティブ化し、ツールBパラメータを取得する。
加えて、3に等しいparameter_set_idを伴うパラメータセット内のtool_A_flag(またはtool_B_flag)が、3に等しいparameter_set_idを伴うパラメータセットを参照して、ツールA(またはツールB)がコーディングされた写真またはコーディングされた写真領域をデコーディングする際に使用されるかどうかを示す場合、解析ユニット701はまた、本フラグをツールA(またはツールB)パラメータ内に含む。
解析ユニット701は、ツールAパラメータおよびツールBパラメータをデコーダ内の他のユニットにパスし、これらのツールパラメータを使用して、コーディングされた写真またはコーディングされた写真領域をデコーディングする。
解析ユニット701は、デコーディングブロックの予測サンプルを導出するための1つ以上の予測パラメータを予測ユニット702にパスする。本開示では、予測パラメータは、前述のエンコーダ内のパーティション化ユニット201および予測ユニット202の出力パラメータを含む。
解析ユニット701は、デコーディングブロックの残差を再構成するための1つ以上の残差パラメータをスケーリングユニット705および変換ユニット706にパスする。本開示では、残差パラメータは、変換ユニット208および量子化ユニット209の出力パラメータおよび前述のエンコーダ内の量子化ユニット209によって出力された1つ以上の量子化された係数(すなわち、「レベル」)を含む。
解析ユニット701は、写真内の再構成されたサンプルをフィルタリングする(例えば、ループ内にフィルタリング)ためのフィルタリングパラメータをフィルタリングユニット708にパスする。
予測ユニット702は、予測パラメータに従って、デコーディングブロックの予測サンプルを導出する。予測ユニット702は、MCユニット703およびイントラ予測ユニット704から成る。予測ユニット702の入力はまた、加算器707から出力された現在のデコーディング写真(フィルタリングユニット708によって処理されていない)の再構成された部分と、DPB709内の1つ以上のデコーディングされた写真とを含んでもよい。
予測パラメータが、インター予測モードがデコーディングブロックの予測サンプルを導出するために使用されることを示すとき、予測ユニット702は、前述のエンコーダ内のMEユニット204のためのものと同一アプローチを採用し、1つ以上の参照写真リストを構築する。参照リストは、DPB709からの1つ以上の参照写真を含有する。MCユニット703は、参照リストのインジケーション、参照インデックス、および予測パラメータ内のMVに従って、デコーディングブロックのための1つ以上のマッチングブロックを決定し、前述のエンコーダ内のMCユニット205内のもの同一方法と使用して、デコーディングブロックのインター予測サンプルを得る。予測ユニット702は、インター予測サンプルをデコーディングブロックの予測サンプルとして出力する。
特に、随意に、MCユニット703は、デコーディングブロックを含有する現在のデコーディング写真を参照として使用して、デコーディングブロックのイントラ予測サンプルを取得してもよい。本開示では、イントラ予測とは、コーディングブロックを含有する写真内のデータのみがコーディングブロックの予測サンプルを導出するための参照として採用されることを意味する。この場合、MCユニット703は、現在の写真内の再構成された部分を使用し、再構成された部分は、加算器707の出力からのものであって、フィルタリングユニット708によって処理されない。例えば、デコーダは、写真バッファを配分し、加算器707の出力データを(一時的に)記憶する。デコーダのための別の方法は、特殊写真バッファをDPB709内に留保し、加算器707からのデータを保つことである。
予測パラメータが、イントラ予測モードがデコーディングブロックの予測サンプルを導出するために使用されることを示すとき、予測ユニット702は、前述のエンコーダ内のイントラ予測ユニット206内のものと同一アプローチを採用し、イントラ予測ユニット704のための参照サンプルをデコーディングブロックの再構成された近傍のサンプルから決定する。イントラ予測ユニット704は、イントラ予測モード(すなわち、DCモード、平面モード、または角予測モード)を得て、イントラ予測モードの規定されたプロセスに従って、参照サンプルを使用して、デコーディングブロックのイントラ予測サンプルを導出する。イントラ予測モードの同じ導出プロセスは、前述のエンコーダ(すなわち、イントラ予測ユニット206)およびデコーダ(すなわち、イントラ予測ユニット704)内に実装されることに留意されたい。特に、予測パラメータが、デコーディングブロックのための現在のデコーディング写真(デコーディングブロックを含有する)内にマッチングブロック(その場所を含む)を示す場合、イントラ予測ユニット704は、マッチングブロック内のサンプルを使用して、デコーディングブロックのイントラ予測サンプルを導出する。例えば、イントラ予測ユニット704は、イントラ予測サンプルをマッチングブロック内のサンプルに等しくなるように設定する。予測ユニット702は、デコーディングブロックの予測サンプルをイントラ予測ユニット704によって出力されたイントラ予測サンプルに等しくなるように設定する。
デコーダは、逆量子化のプロセスのために、輝度QPおよび彩度QPを含む、QPと、量子化された係数とをスケーリングユニット705にパスし、再構成された係数を出力とし得る。デコーダは、スケーリングユニット705からの再構成された係数と、残差パラメータ内の変換パラメータ(すなわち、前述のエンコーダ内の変換ユニット208の出力内の変換パラメータ)とを変換ユニット706にフィードする。特に、残差パラメータが、ブロックをデコーディングする際にスケーリングをスキップすることを示す場合、デコーダは、スケーリングユニット705をバイパスすることによって、残差パラメータ内の係数を変換ユニット706に誘導する。
変換ユニット706は、規格内に規定される変換プロセスに従って、変換動作を入力係数上で実施する。変換ユニット706内で使用される変換行列は、前述のエンコーダ内の逆変換ユニット211内で使用されるものと同一である。変換ユニット706の出力は、デコーディングブロックの再構成された残差である。
概して、デコーディングプロセスのみが、規格内に規定されるため、ビデオコーディング規格の観点から、デコーディングプロセスにおけるプロセスおよび関連行列は、「変換プロセス」および「変換行列」として規格テキスト内に規定される。したがって、本開示では、デコーダに関する説明は、規格と一致するように、規格テキスト内に規定された変換プロセスを実装するユニットを「変換ユニット」と命名する。しかしながら、本ユニットは、エンコーディングの逆プロセスとしてデコーディングプロセスをとることの考慮点に基づいて、常時、「逆変換ユニット」と命名され得る。
加算器707は、変換ユニット706の出力における再構成された残差および予測ユニット702の出力内の予測サンプルを入力データとしてとり、デコーディングブロックの再構成されたサンプルを計算する。加算器707は、再構成されたサンプルを写真バッファの中に記憶する。例えば、デコーダは、写真バッファを配分し、加算器707の出力データを(一時的に)記憶する。デコーダのための別の方法は、特殊写真バッファをDPB709内に留保し、加算器707からのデータを保つことである。
デコーダは、解析ユニット701からのフィルタリングパラメータをフィルタリングユニット708にパスする。フィルタリング708のためのフィルタリングパラメータは、前述のエンコーダ内のフィルタリングユニット213の出力内のフィルタリングパラメータと同じである。フィルタリングパラメータは、使用されるべき1つ以上のフィルタのインジケーション情報、フィルタ係数、およびフィルタリング制御パラメータを含む。フィルタリングユニット708は、フィルタリングパラメータを使用して、フィルタリングプロセスをデコーディングされた写真バッファ内に記憶される写真の再構成されたサンプル上で実施し、デコーディングされた写真を出力する。フィルタリングユニット708は、1つのフィルタまたはいくつかのカスケードフィルタから成ってもよい。例えば、H.265/HEVC規格によると、フィルタリングユニットは、2つのカスケードフィルタ、すなわち、非ブロック化フィルタおよびサンプル適応オフセット(SAO)フィルタから成る。フィルタリングユニット708は、適応ループフィルタ(ALF)を含んでもよい。フィルタリングユニット708はまた、ニューラルネットワークフィルタを含んでもよい。フィルタリングユニット708は、写真内の全てのコーディングブロックの再構成されたサンプルがデコーディングされた写真バッファ内に記憶されると、写真の再構成されたサンプルのフィルタリングを開始してもよく、これは、「写真層フィルタリング」と称され得る。随意に、フィルタリングユニット708のための写真層フィルタリングの代替実装(「ブロック層フィルタリング」と称される)は、再構成されたサンプルが写真内の全ての連続コーディングブロックをデコーディングする際の参照として使用されない場合、写真内のコーディングブロックの再構成されたサンプルのフィルタリングを開始するものである。ブロック層フィルタリングは、フィルタリングユニット708が、写真の全ての再構成されたサンプルが利用可能になるまで、フィルタリング動作を一時停止し、したがって、スレッド間の時間遅延をデコーダ内に保存することを要求しない。
デコーダは、フィルタリングユニット708によって出力されたデコーディングされた写真をDPB709内に記憶する。加えて、デコーダは、例えば、DPB709内の写真記憶の時間長、DPB709からの写真の出力等、解析ユニット701によって出力された1つ以上の命令に従って、1つ以上の制御動作をDPB709内の写真上で実施してもよい。
実施形態3
図8は、本開示における方法を実装する、ビットストリームプロセッサの実施例を図示する、略図である。
随意に、ビットストリームプロセッサは、抽出器として構成されることができ、これは、サブビットストリームを入力ビットストリームから抽出する。抽出器の入力のうちの1つは、図2における前述のエンコーダによって生成されたビットストリームである。抽出器の別の入力は、アプリケーションデータであって、これは、抽出のための1つ以上の標的写真領域を示す。抽出器の出力は、サブビットストリームであって、これは、図7における前述のデコーダによってデコーディング可能であり得る。本サブビットストリームは、さらに抽出可能である場合、また、抽出器の入力ビットストリームであることができる。
随意に、ビットストリームプロセッサは、スプライサとして構成されることができ、これは、2つ以上のビットストリームを繋ぎ合わせ、繋ぎ合わせられたビットストリームを形成する。スプライサの入力のうちの1つは、図2における前述のエンコーダによって生成された2つ以上のビットストリームである。スプライサの別の入力は、繋ぎ合わせられたビットストリームのデコーディングされた写真に対応する、写真内の入力ストリームのデコーディングされた写真に対応する、写真を提示する方法を示す、アプリケーションデータである。スプライサの出力は、繋ぎ合わせられたビットストリームであって、これは、図7における前述のデコーダによってデコーディング可能であり得る。本繋ぎ合わせられたビットストリームはまた、スプライサの入力ビットストリームであることができる。
さらに、抽出器からのサブビットストリームは、スプライサの入力ビットストリームであることができ、繋ぎ合わせられたビットストリームは、抽出器の入力ビットストリームであることができる。
図5および図6A-6Bにおける構文構造は、抽出器およびスプライサに関わるビットストリーム内で使用される。図5における構文要素の意味論は、以下の通りである。
parameter_set_idは、他の構文要素による参照のためのパラメータセットを識別する。
info_typeは、パラメータセット内の情報のタイプを規定する。
1に等しいtool_A_flagは、tool_A_parameter( )の存在を規定する。0に等しいtool_A_flagは、tool_A_parameter( )の不在を規定する。
1に等しいtool_B_flagは、tool_B_parameter( )の存在を規定する。0に等しいtool_B_flagは、tool_B_parameter( )の不在を規定する。
図6A-6Bにおけるregion_parameter_set_idの意味論は、以下の通りである。
region_parameter_set_idは、使用中のパラメータセットのためのparameter_set_idの値を規定する。region_parameter_set_idに等しいそのパラメータセット識別子を伴うパラメータセットは、0に等しいinfo_typeを有するであろう。
抽出器の例示的実施形態
抽出器の基本機能は、サブビットストリームをオリジナルビットストリームから形成するものである。例えば、ユーザが、高解像度ビデオをそのスマートフォン上のある領域に表示するために、本領域を選択し、スマートフォンが、アプリケーションデータを遠隔デバイス(例えば、遠隔サーバ)または内部処理ユニット(例えば、本スマートフォン上にインストールされるソフトウェアプロシージャ)に送信し、選択された領域(すなわち、標的写真領域)に対応するメディアデータを要求する。遠隔デバイスまたは内部処理ユニット上の抽出器(または同等処理ユニット)は、標的写真領域に対応するサブビットストリームをオリジナル高解像度ビデオに対応するビットストリームから抽出する。別の実施例は、HMD(頭部搭載型デバイス)が、視認者の現在のビューポートを検出し、本ビューポートをレンダリングするためのメディアデータを要求するものである。前の実施例と同様に、HMDはまた、検出されたビューポートの最終レンダリング領域(すなわち、標的写真領域)を網羅するビデオ写真内の領域を示す、アプリケーションデータを生成し、アプリケーションデータを遠隔デバイスまたはその内部処理ユニットに送信する。遠隔デバイスまたは内部処理ユニット上の抽出器(または同等処理ユニット)は、標的写真領域に対応するサブビットストリームをより広いレンダリングビューポートを網羅するビデオに対応するビットストリームから抽出する。
本実施形態では、例示的入力ビットストリームは、図4に図示されるように2つのタイルグループにパーティション化された写真をエンコーディングすることによって前述のエンコーダによって生成される、ビットストリームである。2つのタイルグループは、独立して、デコーディング可能にされる。すなわち、タイルグループをデコーディングすることは、他のタイルグループの任意の情報を参照しない。
抽出器の入力ビットストリームでは、ツールAのみが、タイルグループ4000をデコーディングする際に使用され、ツールBのみが、タイルグループ4100をデコーディングする際に使用される。パラメータセット内のツールAパラメータおよびツールBパラメータが、それぞれ、パラメータセットに提示されるかどうかを示す、意味論tool_A_flagおよびtool_B_flagにおけるように、エンコーダは、以下のように、ツールパラメータを取り込むために、タイルグループによって参照されるための単一パラメータセットを生成する。

parameter_set_rbsp( ){
parameter_set_id=0
info_type=0
tool_A_flag=1
tool_A_parameter_set_id=1
tool_B_flag=1
tool_B_parameter_set_id=2
one or more extension and byte align bits
タイルグループ4000および4100の両方のヘッダでは、region_parameter_set_idは、0に等しくなるように設定される。ツールがタイルグループをデコーディングする際に使用されるかどうかを示す、フラグが、タイルグループヘッダ、他のパラメータセット、または補完情報において利用可能である。
解析ユニット801は、解析ユニット701内のものと類似する処理を起動し、それぞれ、タイルグループ4000および4100によって参照されるパラメータセットを決定する。タイルグループ毎に、解析ユニット801はまた、タイルグループヘッダ内で利用可能である、ツールがタイルグループをデコーディングする際に使用されるかどうかを示す、フラグ、他のパラメータセット、または補完情報を解析する。さらに、解析ユニット801はまた、入力ビットストリームを解析し、タイルグループパラメータを入力ビットストリーム内の1つ以上のデータユニット(例えば、パラメータセットデータユニット)から取得する。タイルグループパラメータは、対応して1つ以上のタイル識別子を伴う、タイルグループおよびタイルへの写真のパーティション化様式を示す。解析ユニット801は、ツールパラメータ情報、タイルグループパラメータ、および抽出のための標的タイルを決定するための他の必要なデータ(例えば、写真幅および高さ)をデータフロー80内に入れ、データフロー80を制御ユニット802に送信する。解析ユニット801はまた、入力ビットストリームを解析し、必要なとき、サブビットストリームを生成するプロセスにおいて、データフロー81を介して、他のデータを形成ユニット803に転送する。解析ユニット801はまた、入力ビットストリームをデータフロー81内に含む。
本開示におけるデータフローは、ソフトウェア実装内の機能の入力パラメータおよび戻りパラメータ、バス上のデータ伝送、およびハードウェア実装内の記憶ユニット間のデータ共有(また、レジスタ間のデータ共有も含む)を指すことに留意されたい。
制御ユニット802は、標的写真領域を、写真内の標的写真領域の場所およびサイズを含む、そのアプリケーションデータの入力から取得する。制御ユニット802は、タイルグループパラメータおよび写真の幅および高さをデータフロー80から取得する。制御ユニット802は、標的写真領域内に位置する1つ以上の標的タイルグループまたはタイルを決定する。本実施例では、標的写真領域は、タイルグループ4000であると仮定する。制御ユニット802は、標的タイルグループのアドレス(例えば、写真40内のタイルグループ4000の第1のタイルのアドレス)および他の情報(例えば、標的写真領域のサイズtargetPicWidthおよびtargetPicHeight)をデータフロー82内に入れる。
形成ユニット803は、データフロー81および82を受信し、データユニットをデータフロー81内で転送される入力ビットストリームから抽出し、必要なとき、標的写真領域のための新しいパラメータに従って、新しいパラメータセットを生成し、次いで、抽出されたデータユニットおよびパラメータセットを構成することによって、サブビットストリームを形成する。形成ユニット803は、抽出ユニット804と、生成ユニット805とを含む。抽出ユニット804が、タイルグループ4000に等しいそのアドレスを用いて、タイルグループを検出すると、抽出ユニット804は、本タイルグループのデータユニットを入力ビットストリームから抽出する。抽出ユニット804はまた、タイルグループ4000によって参照される1つ以上のパラメータセットを抽出する。
生成ユニット805は、タイルグループ4000の抽出されたデータユニットおよび1つ以上のパラメータセットデータユニットを繋ぎ合わせることによって、出力サブビットストリームを生成する。必要に応じて、生成ユニット805はまた、タイルグループアドレス、パラメータセット識別子等を含む、再書込動作をタイルグループヘッダ上で実施する。本実施例では、ツールAのみが、タイルグループ4000をデコーディングする際に使用されるため、生成ユニット805は、以下のように、パラメータセットを0に等しいそのパラメータセット識別子で書き換え、タイルグループ4000をデコーディングする際に使用されない、ツールBパラメータ(すなわち、0に等しいセットtool_B_flag)を除去する。

parameter_set_rbsp( ){
parameter_set_id=0
info_type=0
tool_A_flag=1
tool_A_parameter_set_id=1
tool_B_flag=0
one or more extension and byte align bits
加えて、生成ユニット805はまた、ツールBパラメータを含有するパラメータセットを抽出ユニット804によって転送されるビットストリームから除去する。生成ユニット805は、2に等しいinfo_typeを伴う1つ以上のパラメータセットのデータユニットを除去する。そのような除去動作はまた、生成ユニット805の代わりに、抽出ユニット804内にも実装されることができることに留意されたい。
形成ユニット803は、ビデオコーディング規格の規定されたビットストリーム構造に従って、データユニットを配列し、サブビットストリームを形成する。形成ユニット803の出力は、サブビットストリームであって、これは、図7における前述のデコーダによってデコーディング可能である。
スプライサの例示的実施形態
スプライサの基本機能は、ビットストリームを2つ以上の入力ビットストリームから形成することである。一実施例は、ステレオビデオアプリケーション、例えば、フレーム互換性タイプ(例えば、左右タイプを検討する)の形態における360度全方向ビデオにおけるものである。FOV(ビューポートの視野)ベースのストリーミングでは、視認者の現在のビューポートを網羅する写真領域に対応する、ビットストリームが、レンダリングのために宛先デバイスに送信される。そのようなビットストリームは、左ビューのためのフレーム互換性フォーマットにおける写真の左半分内の左写真領域と、右ビューのためのフレーム互換性フォーマットにおける写真の右半分内の右写真領域とを用いて形成されるであろう。スプライサは、フレーム互換性フォーマット(例えば、左右タイプ)において左写真領域および右写真領域を組み合わせ、新しい繋ぎ合わせられたビットストリームを形成するであろう。
図4における写真40は、繋ぎ合わせられたビットストリームの写真であると仮定する。タイルグループ4000は、左写真領域に対応し、タイルグループ4100は、右写真領域に対応する。タイルグループ4000をデコーディングする際、ツールAのみが、使用される。左ビューのためのタイルグループ4000のためのパラメータセットは、以下の通りである。
parameter_set_rbsp( ){
parameter_set_id=0
info_type=0
tool_A_flag=1
tool_A_parameter_set_id=1
tool_B_flag=0
one or more extension and byte align bits
タイルグループ4100をデコーディングする際、ツールAのみが、使用される。右ビューのためのタイルグループ4100のためのパラメータセットは、以下の通りである。
parameter_set_rbsp( ){
parameter_set_id=1
info_type=0
tool_A_flag=0
tool_B_flag=1
tool_B_parameter_set_id=2
one or more extension and byte align bits
解析ユニット801は、解析ユニット701内のものと類似する処理を起動し、それぞれ、タイルグループ4000および4100によって参照されるパラメータセットを決定する。本実施例では、入力ビットストリームは、フレーム互換性360度全方向ステレオビデオビットストリームから抽出された2つのビットストリームであることができる。タイルグループ毎に、解析ユニット801はまた、タイルグループヘッダ内で利用可能である、ツールがタイルグループをデコーディングする際に使用されるかどうかを示す、フラグ、他のパラメータセット、または補完情報を解析する。解析ユニット801は、ツールパラメータ情報、タイルグループパラメータ、および繋ぎ合わせられたビットストリームのためのパラメータを決定するための他の必要なデータ(例えば、写真幅および高さ)をデータフロー80内に入れ、データフロー80を制御ユニット802に送信する。解析ユニット801はまた、入力ビットストリームを解析し、必要なとき、繋ぎ合わせるプロセスにおいて、データフロー81を介して、他のデータを形成ユニット803に転送する。解析ユニット801はまた、入力ビットストリームをデータフロー81内に含む。
制御ユニット802は、標的写真を、標的写真内の左写真および右写真の場所およびサイズを含む、そのアプリケーションデータの入力から取得する。制御ユニット802は、左写真および右写真の幅および高さをデータフロー80から取得する。本実施例では、制御ユニット802は、左写真の場所を図4におけるタイルグループ4000として、右写真の場所をタイルグループ4100として決定する。制御ユニット802は、標的タイルグループの場所(例えば、写真40内のタイルグループ4000および4100の第1のタイルのアドレス)および他の情報(例えば、標的写真のサイズtargetPicWidthおよびtargetPicHeight)をデータフロー82内に入れる。
形成ユニット803は、データフロー81および82を受信し、データユニットをデータフロー81内で転送される入力ビットストリームから読み出し、必要なとき、標的写真のための新しいパラメータに従って、新しいパラメータセットを生成し、次いで、データユニットおよびパラメータセットを構成することによって、繋ぎ合わせられたビットストリームを形成する。形成ユニット803は、抽出ユニット804と、生成ユニット805とを含む。抽出ユニット804が、タイルグループ4000に等しいそのアドレスを用いて、タイルグループを検出すると、抽出ユニット804は、本タイルグループのデータユニットを入力ビットストリームから抽出する。抽出ユニット804はまた、タイルグループ4000によって参照される1つ以上のパラメータセットを抽出する。特に、本実施例では、左写真の入力ビットストリームは、タイルグループ4000のみを含有するため、抽出ユニット804は、さらなる抽出動作を本入力ビットストリーム上で実施する必要がない。抽出ユニット804は、同一動作をタイルグループ4100上で行う。
生成ユニット805は、タイルグループ4000、タイルグループ4100の抽出されたデータユニット、および1つ以上のパラメータセットデータユニットを繋ぎ合わせることによって、出力ビットストリームを生成する。必要に応じて、生成ユニット805はまた、タイルグループアドレス、パラメータセット識別子等を含む、再書込動作をタイルグループヘッダ上で実施する。本実施例では、生成ユニット805は、タイルグループ4000および4100のヘッダ内のタイルグループアドレスを書き換える。生成ユニット805は、標的写真のサイズおよび図4に図示されるようなタイルグループパーティションを示すタイルグループパラメータおよび他の必要なパラメータ(例えば、Profile/Tier/Level)を用いて、新しいSPSおよびPPSを生成する。生成ユニット805は、タイルグループ4000および4100のデータユニットを同一アクセスユニット内に入れる。生成ユニット805は、以下のように、ツールパラメータのための新しいパラメータセットを生成する。生成ユニット805は、タイルグループヘッダ内のパラメータセット識別子を新しく生成されたパラメータセットの対応する値に設定する。
parameter_set_rbsp( ){
parameter_set_id=0
info_type=0
tool_A_flag=1
tool_A_parameter_set_id=1
tool_B_flag=1
tool_B_parameter_set_id=2
one or more extension and byte align bits
形成ユニット803は、ビデオコーディング規格の規定されたビットストリーム構造に従って、データユニットを配列し、ビットストリームを形成する。形成ユニット803の出力は、繋ぎ合わせられたビットストリームであって、これは、図7における前述のデコーダによってデコーディング可能である。さらに、繋ぎ合わせられたビットストリームはまた、前述の抽出器の入力であって、タイルグループ4000または4100のみを含有する、サブビットストリームを得ることができる。繋ぎ合わせられたビットストリームはまた、本スプライサの入力ビットストリームのうちの1つであって、新しい繋ぎ合わせられたビットストリームを生成することができる。
本実施例では、左写真領域および右写真は両方とも、フレーム互換性ステレオ360度全方向ビデオビットストリームの単一オリジナルビットストリームからのものであって、複製されたパラメータセット識別子は、本オリジナルビットストリーム内には存在しないことに留意されたい。左写真領域および右写真領域が、2つの別個のビットストリームからのものである場合、繋ぎ合わせられたビットストリームを形成するためのパラメータセットは、複製されたパラメータセット識別子を有し得る。本場合に対処するために、スプライサは、パラメータセット識別子をパラメータセットに配列し、パラメータセットおよびタイルグループヘッダ内の対応する構文要素を書き換えるであろう。
実施形態4
図9は、図2に図示されるように、少なくとも例示的ビデオエンコーダまたは写真エンコーダを含有する、第1の例示的デバイスを図示する、略図である。
入手ユニット901は、ビデオおよび写真を捕捉する。入手ユニット901は、自然場面のビデオまたは写真を撮影するために、1つ以上のカメラを装備してもよい。随意に、入手ユニット901は、深度ビデオまたは深度写真を得るためのカメラとともに実装されてもよい。随意に、入手ユニット901は、赤外線カメラのコンポーネントを含んでもよい。随意に、入手ユニット901は、遠隔感知カメラとともに構成されてもよい。入手ユニット901はまた、放射線を使用してオブジェクトを走査することによってビデオまたは写真を生成する、装置またはデバイスであってもよい。
随意に、入手ユニット901は、例えば、自動ホワイトバランス、自動焦点化、自動露光、バックライト補償、鮮明化、雑音除去、スティッチング、アップサンプリング/ダウンサンプリング、フレームレート変換、仮想ビュー合成等、前処理をビデオまたは写真上で実施してもよい。
入手ユニット901はまた、ビデオまたは写真を別のデバイスまたは処理ユニットから受信してもよい。例えば、入手ユニット901は、トランスコーダ内のコンポーネントユニットであることができる。トランスコーダは、1つ以上のデコーディングされた(または部分的にデコーディングされた)写真を入手ユニット901にフィードする。別の実施例は、入手ユニット901は、そのデバイスへのデータリンクを介して、ビデオまたは写真を別のデバイスから得ることである。
入手ユニット901は、ビデオおよび写真に加え、他のメディア情報、例えば、オーディオ信号を捕捉するために使用されてもよいことに留意されたい。入手ユニット901はまた、人工情報、例えば、キャラクタ、テキスト、コンピュータ生成ビデオまたは写真等を受信してもよい。
エンコーダ902は、図2に図示される例示的エンコーダまたは図9におけるソースデバイスの実装である。エンコーダ902の入力は、入手ユニット901によって出力されたビデオまたは写真である。エンコーダ902は、ビデオまたは写真をエンコーディングし、生成されたビデオまたは写真ビットストリームを出力する。
記憶装置/送信ユニット903は、ビデオまたは写真ビットストリームをエンコーダ902から受信し、システム層処理をビットストリーム上で実施する。例えば、記憶装置/送信ユニット903は、トランスポート規格およびメディアファイルフォーマット、例えば、例えば、MPEG-2TS、ISOBMFF、DASH、MMT等に従って、ビットストリームをカプセル化する。記憶装置/送信ユニット903は、第1の例示的デバイスのメモリまたはディスク内へのカプセル化後に取得されるトランスポートストリームまたはメディアファイルを記憶する、または有線または無線ネットワークを介して、トランスポートストリームまたはメディアファイルを送信する。
エンコーダ902からのビデオまたは写真ビットストリームに加え、記憶装置/送信ユニット903の入力はまた、オーディオ、テキスト、画像、グラフィック等を含んでもよいことに留意されたい。記憶装置/送信ユニット903は、そのような異なるタイプのメディアビットストリームをカプセル化することによって、トランスポートまたはメディアファイルを生成する。
本実施形態に説明される第1の例示的デバイスは、ビデオ通信のアプリケーション、例えば、携帯電話、コンピュータ、メディアサーバ、ポータブルモバイル端末、デジタルカメラ、ブロードキャストデバイス、CDN(コンテンツ配信ネットワーク)デバイス、監視カメラ、ビデオ会議デバイス等内でビデオ(または写真)ビットストリームを生成または処理することが可能なデバイスであることができる。
実施形態5
図10は、図7に図示されるように、少なくとも例示的ビデオデコーダまたは写真デコーダを含有する第2の例示的デバイスを図示する、略図である。
受信ユニット1001は、ビットストリームを有線または無線ネットワークから取得することによって、電子デバイス内のメモリまたはディスクを読み取ることによって、またはデータリンクを介して、他のデバイスからのデータをフェッチすることによって、ビデオまたは写真ビットストリームを受信する。
受信ユニット1001の入力はまた、ビデオまたは写真ビットストリームを含有する、トランスポートストリームまたはメディアファイルを含んでもよい。受信ユニット1001は、トランスポートまたはメディアファイルフォーマットの仕様に従って、ビデオまたは写真ビットストリームをトランスポートストリームまたはメディアファイルから抽出する。
受信ユニット1001は、ビデオまたは写真ビットストリームを出力し、デコーダ1002にパスする。ビデオまたは写真ビットストリームに加え、受信ユニット1001の出力はまた、オーディオビットストリーム、キャラクタ、テキスト、画像、グラフィック等を含んでもよいことに留意されたい。受信ユニット1001は、出力を第2の例示的デバイス内の対応する処理ユニットにパスする。例えば、受信ユニット1001は、出力オーディオビットストリームを本デバイス内のオーディオデコーダにパスする。
デコーダ1002は、図7に図示される例示的デコーダの実装である。エンコーダ1002の入力は、受信ユニット1001によって出力されたビデオまたは写真ビットストリームである。デコーダ1002は、ビデオまたは写真ビットストリームをデコーディングし、デコーディングされたビデオまたは写真を出力する。
レンダリングユニット1003は、デコーディングされたビデオまたは写真をデコーダ1002から受信する。レンダリングユニット1003は、デコーディングされたビデオまたは写真を視認者に提示する。レンダリングユニット1003は、第2の例示的デバイスのコンポーネント、例えば、画面であってもよい。レンダリングユニット1003はまた、第2の例示的デバイス、例えば、プロジェクタ、モニタ、TVセット等へのデータリンクを伴う、第2の例示的デバイスと別個のデバイスであってもよい。随意に、レンダリングユニット1003は、例えば、自動ホワイトバランス、自動焦点化、自動露光、バックライト補償、鮮明化、雑音除去、スティッチング、アップサンプリング/ダウンサンプリング、フレームレート変換、仮想ビュー合成等、それを視認者に提示する前に、後処理をデコーディングされたビデオまたは写真上で実施する。
デコーディングされたビデオまたは写真に加え、レンダリングユニット1003の入力は、第2の例示的デバイスの1つ以上のユニットからの他のメディアデータ、例えば、オーディオ、キャラクタ、テキスト、画像、グラフィック等であることができることに留意されたい。レンダリングユニット1003の入力はまた、人工データ、例えば、遠隔教育アプリケーションにおいて注意を誘引するためにスライド上にローカル教師によって描かれる、ラインおよびマークを含んでもよい。レンダリングユニット1003は、異なるタイプのメディアをともに構成し、次いで、構成物を視認者に提示する。
本実施形態に説明される第2の例示的デバイスは、ビデオ通信のアプリケーション、例えば、携帯電話、コンピュータ、セットトップボックス、TVセット、HMD、モニタ、メディアサーバ、ポータブルモバイル端末、デジタルカメラ、ブロードキャストデバイス、CDN(コンテンツ配信ネットワーク)デバイス、監視ビデオ会議デバイス等内でビデオ(または写真)ビットストリームをデコーディングまたは処理することが可能なデバイスであることができる。
実施形態6
図11は、図9における第1の例示的デバイスと、図10における第2の例示的デバイスとを含有する、電子システムを図示する、略図である。
サービスデバイス1101は、図9における第1の例示的デバイスである。
記憶媒体/トランスポートネットワーク1102は、デバイスまたは電子システムの内部メモリリソース、データリンクを介してアクセス可能な外部メモリリソース、有線および/または無線ネットワークから成るデータ伝送ネットワークを含んでもよい。記憶媒体/トランスポートネットワーク1102は、サービスデバイス1101内の記憶/送信ユニット903のための記憶リソースまたはデータ伝送ネットワークを提供する。
宛先デバイス1103は、図10における第2の例示的デバイスである。宛先デバイス1103内の受信ユニット1001は、ビデオまたは写真ビットストリーム、ビデオまたは写真ビットストリームを含有するトランスポートストリーム、またはビデオまたは写真ビットストリームを含有するメディアファイルを記憶媒体/トランスポートネットワーク1102から受信する。
図1Aは、ビデオビットストリームをデコーディングするためにビデオデコーダによって実装される、例示的方法100を示す、フローチャートである。方法100は、第1のパラメータセット識別子をコーディングされたビデオ領域に対応するビットを含有するデータユニットから取得するステップ(102)と、ツールフラグを第1のパラメータセット識別子に対応する第1のパラメータセットから取得するステップ(104)と、ツールフラグから、ツールフラグに対応するツールのツールパラメータが、コーディングされたビデオ領域をデコーディングするために存在する、または有効にされていることを決定するステップ(106)であって、ツールは、ビデオコーディング技法に対応する、ステップと、決定するステップに基づいて、第2のパラメータセット識別子を取得するステップ(108)とを含む。例えば、第2のパラメータセットは、第1のパラメータセットから取得されてもよい。方法100は、ツールパラメータを第2のパラメータセット識別子に対応する第2のパラメータセットから取得するステップ(110)を含む。いくつかの実施形態では、インジケーションパラメータ、例えば、第2のパラメータセット内に含有されるインジケーションパラメータは、第2のパラメータセット内に含有されるツールパラメータがツールフラグに対応するツールのツールパラメータのみあることを示す。例えば、図5、6A、6Bに関して説明されるinfo_typeフィールドは、インジケーションパラメータとして使用されてもよい。その中で複数のツールが同一単一適応パラメータセットを使用してシグナリングされる、適応パラメータセットと比較して、インジケーションパラメータは、パラメータセットに提示される単一ツールのパラメータを具体的に示すために使用され得る。方法100は、ツールパラメータを使用して、ビデオ領域をデコーディングするステップ(112)を含む。
いくつかの実施形態では、方法100は、図5、6A-6Bおよび本明細書で議論される実施例に示されるように、ビットストリーム構文を解析するために実装されてもよい。本書に議論されるように、いくつかの実施形態では、info_typeフィールドは、ビデオ領域のデコーディングにおいて使用するためにシグナリングされた具体的ツールパラメータを解析するために使用されてもよい。例えば、ビットストリーム解析(およびエンコーディング)は、例示的実施形態によってハイライトされるように簡略化され、ツールパラメータの効率的かつ個別化されたシグナリングを可能にし得る。
いくつかの実施形態では、方法100は、ビデオデコーディングのために、複数のパラメータを取得および使用するために使用されてもよい。例えば、方法100はさらに、別のツールフラグを第1のパラメータセットから取得するステップと、ツールフラグから、別のツールフラグに対応する別のツールの別のツールパラメータが、コーディングされたビデオ領域をデコーディングするために存在する、または有効にされていることを決定するステップと、決定するステップに基づいて、第3のパラメータセット識別子を取得するステップと、別のツールパラメータを第3のパラメータセット識別子に対応する第3のパラメータセットから取得するステップとを含んでもよい。ここでは、ビデオ領域をデコーディングするステップは、別のツールパラメータを使用して、ビデオ領域をデコーディングするステップを含む。
いくつかの実施形態では、ビットストリームは、第2のパラメータセット、第3のパラメータセット、および第1のパラメータセットを含有する、ネットワーク抽象化層(NAL)ユニットが、同一NALユニットタイプを有するように構造化されてもよい。例えば、NALユニットは、同一NALユニットタイプとして、第3のパラメータセットを含有する。いくつかの実施形態では、ネットワーク抽象化層ユニットタイプは、NALユニットヘッダ内の固定長コードワードによって示される。
いくつかの実施形態では、第2のパラメータセット識別子を取得するステップは、第2のパラメータセット識別子を第1のパラメータセットから取得するステップを含む。
図1Bは、ビデオコーディングの例示的方法150のためのフローチャートである。方法150は、ビデオ領域をエンコーディングする際に使用されるツールのツールパラメータを決定するステップ(152)であって、ツールは、ビデオコーディング技法を表す、ステップと、第1のパラメータセット識別子によって識別される、第1のパラメータセットを生成するステップ(154)と、第1のパラメータセット内に、ツールに対応するツールフラグを含むステップ(156)であって、ツールフラグは、ツールパラメータが、ビデオ領域をエンコーディングするために存在する、または有効にされていることを示す、値に設定される、ステップと、第2のパラメータセット識別子を使用して、第1のパラメータセット内にツールパラメータを含むステップ(158)と、第1のパラメータセット識別子をビデオ領域のヘッダ内にコーディングするステップ(160)と、ツールパラメータを使用して、ビデオ領域をコーディングするステップ(162)とを含む。
種々の実施形態では、方法150は、部分的に、図5、6Aおよび6Bに描写され、本書に説明される例示的実施形態1-5に議論される、データユニットを構築するために使用されてもよい。開示されるビットストリームの構文は、本明細書に説明される種々のフィールドを使用して、ビデオ領域のためのツールパラメータの独立シグナリングを可能にする。
方法100、150に関して、ビデオ領域は、ビデオ写真全体に対応し得る。ある場合には、ビデオ領域は、より小さいビデオ領域であってもよい。例えば、複数のビデオ領域はともに、ビデオ写真全体を構成してもよい。
方法100、150に関して、いくつかの実施形態では、ビデオコーディング技法は、コーディングされたビデオ領域内の複数のコーディングブロックに共通のコーディングパラメータに基づいてもよい。ビデオコーディング技法またはツールの種々の実施例が、本書に提供される。
いくつかの実施形態では、方法150は、ツールパラメータが既存のツールパラメータセット内の既存のツールパラメータと同じ場合、第2のパラメータセット識別子を既存のパラメータセットのパラメータセット識別子に等しくなるように設定するステップと、ツールパラメータが任意の既存のパラメータセット内の任意の既存のツールパラメータと同じではない場合、第1のパラメータセット識別子と異なる値を有する、第2のパラメータセット識別子を生成するステップとを含んでもよい。
いくつかの実施形態では、方法150は、ビットストリーム内の複数のパラメータを使用およびシグナリングするために実施されてもよい。例えば、本方法は、第1のパラメータセット内に、別のツールに対応する別のツールフラグを含むステップであって、別のツールフラグは、別のツールパラメータが、ビデオ領域をエンコーディングするために存在する、または有効にされている別のツールに対応することを示す、値に設定される、ステップと、第1のパラメータセット内に、第3のパラメータセット識別子を使用することの別のツールパラメータを含むステップとを含む。ビデオ領域をコーディングするステップは、別のツールパラメータを使用して実施される。
図12は、本書に説明されるエンコーダ側またはデコーダ側技法を実装するために使用され得る、例示的装置1200を示す。装置1200は、エンコーダ側またはデコーダ側技法または両方を実施するように構成され得る、プロセッサ1202を含む。装置1200はまた、プロセッサ実行可能命令を記憶するための、かつビデオビットストリームおよび/またはディスプレイデータを記憶するためのメモリ(図示せず)を含んでもよい。装置1200は、変換回路、算術コーディング/デコーディング回路、ルックアップテーブルベースのデータコーディング技法等、ビデオ処理回路網(図示せず)を含んでもよい。ビデオ処理回路網は、部分的に、プロセッサ内に、および/または部分的に、グラフィックプロセッサ、フィールドプログラマブルゲートアレイ(FPGA)等の他の専用回路網内に含まれてもよい。
本実施形態に説明される電子システムは、ビデオ通信、例えば、携帯電話、コンピュータ、IPTV(インターネットプロトコルテレビ)システム、OTT(オーバーザトップ)システム、インターネット上のマルチメディアシステム、デジタルTVブロードキャストシステム、ビデオ監視システム、ポータブルモバイル端末、デジタルカメラ、ビデオ会議システム等のアプリケーション内でビデオ(または写真)ビットストリームを生成、記憶またはトランスポート、およびデコーディングすることが可能なデバイスまたはシステムであることができる。
ある実施形態では、実施形態における具体的実施例が、上記に述べられた実施形態および例示的実装方法に説明される実施例を参照し得るが、実施形態では詳述されないであろう。
明らかに、当業者は、本開示の各モジュールまたは各行為が、汎用コンピューティング装置によって実装されてもよく、モジュールまたは行為が、単一コンピューティング装置上に集中される、または複数のコンピューティング装置によって形成されるネットワーク上に分散されてもよく、随意に、モジュールまたは行為がコンピューティング装置を用いた実行のための記憶装置内に記憶され得る、図示または説明される行為が、いくつかの状況では、図示または本明細書に説明されるものと異なるシーケンスで実行され得る、またはそれぞれ、各集積回路モジュールを形成し得る、または複数のモジュールまたはその中の行為が、実装のために単一集積回路モジュールを形成し得るように、コンピューティング装置のためのプログラムコード実行可能によって実装されてもよい。結果として、本開示は、任意の具体的ハードウェアおよびソフトウェア組み合わせに限定されない。
上記は、本開示の好ましい実施形態にすぎず、本開示を限定することを意図するものではない。当業者にとって、本開示は、種々の修正および変形例を有し得る。本開示の原理内で行われる任意の修正、均等物置換、改良、および同等物は、本開示の添付の請求項によって定義された保護の範囲内であるものとする。
産業上の可用性
上記の説明から、ツールパラメータが、任意の新しいタイプのパラメータセットおよび対応する付加的アクティブ化プロセスを導入せずに、パラメータ間の依存性を伴わずに、別個のパラメータセット内でコーディングされ、タイルグループをエンコーディングまたはデコーディングするためのツールが、ツールパラメータを含有するパラメータセットと同一タイプの別の別個のパラメータセット内で構成されることが分かり得る。ツールのツールパラメータを更新するとき、複製された情報は、パラメータセット内でコーディングされず、アクティブ化されたパラメータセットのチェーンのトレーシングも、コーデックのために要求されない。したがって、種々のツールのパラメータは、パラメータセットのアクティブ化および管理における増加された複雑性を伴わずに、パラメータセット内で効率的にコーディングされ、柔軟に更新されることができる。既存の方法における全ての短所は、前述の方法およびデバイスを使用することによって解決される。
本書に説明される、開示されるおよび他の実施形態、モジュール、および機能動作が、デジタル電子回路で、または本書に開示される構造およびそれらの構造均等物を含む、コンピュータソフトウェア、ファームウェア、またはハードウェアで、またはそれらのうちの1つ以上のものの組み合わせで、実装されることができる。開示されるおよび他の実施形態は、1つ以上のコンピュータプログラム製品、すなわち、データ処理装置による実行のために、またはその動作を制御するために、コンピュータ可読媒体上でエンコードされるコンピュータプログラム命令の1つ以上のモジュールとして、実装されることができる。コンピュータ可読媒体は、機械可読記憶デバイス、機械可読記憶基板、メモリデバイス、機械可読伝搬信号を生じさせる組成物、または1つ以上のそれらの組み合わせであり得る。用語「データ処理装置」は、一例として、プログラマブルプロセッサ、コンピュータ、または複数のプロセッサまたはコンピュータを含む、データを処理するための全ての装置、デバイス、および機械を包含する。本装置は、ハードウェアに加えて、当該コンピュータプログラムのための実行環境を生成するコード、例えば、プロセッサファームウェア、プロトコルスタック、データベース管理システム、オペレーティングシステム、またはそれらのうちの1つ以上のそれらの組み合わせを構成するコードを含むことができる。伝搬信号は、人工的に発生される信号、例えば、好適な受信機装置に伝送するために情報をエンコードするように発生される、機械で発生される電気、光学、または電磁信号である。
コンピュータプログラム(プログラム、ソフトウェア、ソフトウェアアプリケーション、スクリプト、またはコードとしても公知である)が、コンパイラ型またはインタープリタ型言語を含む、任意の形態のプログラミング言語で書かれることができ、独立型プログラムとして、またはコンピューティング環境内の使用のために好適なモジュール、コンポーネント、サブルーチン、または他のユニットとしてを含む、任意の形態で展開されることができる。コンピュータプログラムは、必ずしもファイルシステム内のファイルに対応するわけではない。プログラムは、他のプログラムまたはデータを保持するファイル(例えば、マークアップ言語文書内に記憶された1つ以上のスクリプト)の一部内に、当該プログラム専用の単一のファイル内に、または複数の協調ファイル(例えば、1つ以上のモジュール、サブプログラム、またはコードの一部を記憶するファイル)内に記憶されることができる。コンピュータプログラムは、1つのコンピュータ上で、または1つの地点に位置し、または複数の地点を横断して分散され、通信ネットワークによって相互接続される複数のコンピュータ上で、実行されるように展開されることができる。
本書に説明されるプロセスおよび論理フローは、入力データに作用し、出力を発生させることによって機能を実施するように、1つ以上のコンピュータプログラムを実行する、1つ以上のプログラマブルプロセッサによって、実施されることができる。プロセスおよび論理フローはまた、特殊用途論理回路、例えば、FPGA(フィールドプログラマブルゲートアレイ)またはASIC(特定用途向け集積回路)によって、実施されることもでき、装置もまた、それとして実装されることができる。
コンピュータプログラムの実行のために好適なプロセッサは、一例として、汎用および特殊用途マイクロプロセッサの両方、および任意の種類のデジタルコンピュータのいずれか1つ以上のプロセッサを含む。概して、プロセッサは、読取専用メモリまたはランダムアクセスメモリまたは両方から、命令およびデータを受信するであろう。コンピュータの不可欠な要素は、命令を実施するためのプロセッサ、および命令およびデータを記憶するための1つ以上のメモリデバイスである。概して、コンピュータはまた、データを記憶するための1つ以上の大容量記憶デバイス、例えば、磁気、磁気光学ディスク、または光ディスクを含む、またはそこからデータを受信する、またはそこにデータを転送する、または両方を行うように、動作可能に結合されるであろう。しかしながら、コンピュータは、そのようなデバイスを有する必要はない。コンピュータプログラム命令およびデータを記憶するために好適なコンピュータ可読媒体は、一例として、半導体メモリデバイス、例えば、EPROM、EEPROM、およびフラッシュメモリデバイス、磁気ディスク、例えば、内部ハードディスクまたはリムーバブルディスク、磁気光学ディスク、およびCD-ROMおよびDVD-ROMディスクを含む、あらゆる形態の不揮発性メモリ、媒体、およびメモリデバイスを含む。プロセッサおよびメモリは、特殊用途論理回路によって補完される、またはそれに組み込まれることができる。
本特許文書は、多くの詳細を含有するが、これらは、任意の発明または請求され得るものの範囲への限定としてではなく、むしろ、特定の発明の特定の実施形態に特有であり得る特徴の説明として解釈されるべきである。別個の実施形態との関連で本特許文書に説明されるある特徴もまた、単一の実施形態において組み合わせて実装されることができる。逆に、単一の実施形態との関連で説明される種々の特徴もまた、複数の実施形態において別個に、または任意の好適な副次的組み合わせにおいて実装されることができる。さらに、特徴がある組み合わせにおいて作用するものとして上記に説明され、さらに、そのようなものとして最初に請求され得るが、請求される組み合わせからの1つ以上の特徴は、ある場合には、組み合わせから削除されることができ、請求される組み合わせは、副次的組み合わせまたは副次的組み合わせの変形例を対象とし得る。
同様に、動作は、特定の順序で図面に描写され得るが、これは、望ましい結果を達成するために、そのような動作が示される特定の順序で、または連続的順序で実施されること、または全ての図示される動作が実施されることを要求するものとして理解されるべきではない。さらに、本特許文書に説明される実施形態における種々のシステムコンポーネントの分離は、全ての実施形態においてそのような分離を要求するものとして理解されるべきではい。
いくつかの実装および実施例のみが、説明され、他の実装、向上、および変形例も、本特許文書に説明および図示されるものに基づいて成されることができる。

Claims (15)

  1. ビットストリーム処理の方法であって、前記方法は、
    コーディングされたビデオ領域に対応するビットを含有するデータユニットから第1のパラメータセット識別子を取得することと、
    前記第1のパラメータセット識別子に対応する第1のパラメータセットからツールフラグを取得することと、
    前記第1のパラメータセット識別子に等しい識別子を有する前記第1のパラメータセットをアクティブ化することであって、前記第1のパラメータセットおよび前記データユニットは、重複を有していない、ことと、
    前記ツールフラグから、前記ツールフラグに対応するツールのツールパラメータが、前記コーディングされたビデオ領域をデコーディングするために存在するかまたは有効にされていることを決定することであって、前記ツールは、ビデオコーディング技法に対応する、ことと、
    前記決定することに基づいて、第2のパラメータセット識別子を取得することと、
    前記第2のパラメータセット識別子に等しい識別子を有する第2のパラメータセットをアクティブ化することであって、前記第2のパラメータセットおよび前記データユニットは、重複を有していない、ことと、
    前記第2のパラメータセット識別子に対応する前記第2のパラメータセットから前記ツールパラメータを取得することと、
    前記ツールパラメータを使用して、前記ビデオ領域をデコーディングすることと
    を含む、方法。
  2. 前記ビデオコーディング技法は、前記コーディングされたビデオ領域内の複数のコーディングブロックに共通であるコーディングパラメータに基づく、請求項1に記載の方法。
  3. 前記方法は、
    前記第1のパラメータセットから別のツールフラグを取得することと、
    前記ツールフラグから、前記別のツールフラグに対応する別のツールの別のツールパラメータが、前記コーディングされたビデオ領域をデコーディングするために存在するかまたは有効にされていることを決定することと、
    前記決定することに基づいて、第3のパラメータセット識別子を取得することと、
    前記第3のパラメータセット識別子に対応する第3のパラメータセットから前記別のツールパラメータを取得することと
    をさらに含み、
    前記ビデオ領域をデコーディングすることは、前記別のツールパラメータを使用して、前記ビデオ領域をデコーディングすることを含む、請求項1に記載の方法。
  4. 前記第2のパラメータセットと前記第3のパラメータセットと前記第1のパラメータセットとを含有するネットワーク抽象化層(NAL)ユニットは、同一のNALユニットタイプを有する、請求項に記載の方法。
  5. 前記第3のパラメータセットを含有するNALユニットは、前記第1のパラメータセットを含有するNALユニットと同一のNALユニットタイプである、請求項に記載の方法。
  6. 前記ネットワーク抽象化層ユニットタイプは、NALユニットヘッダ内の固定長コードワードによって示される、請求項4~5のうちのいずれか一項に記載の方法。
  7. 前記第2のパラメータセット識別子を取得することは、前記第1のパラメータセットから前記第2のパラメータセット識別子を取得することを含む、請求項1に記載の方法。
  8. 前記第3のパラメータセット識別子は、前記第1のパラメータセットから取得される、請求項3~6のうちのいずれか一項に記載の方法。
  9. ビデオ領域をエンコーディングする方法であって、前記方法は、
    ビデオ領域をエンコーディングする際に使用されるツールのツールパラメータを決定することであって、前記ツールは、ビデオコーディング技法を表す、ことと、
    第1のパラメータセット識別子によって識別される第1のパラメータセットを生成することと、
    前記第1のパラメータセット内に、前記ツールに対応するツールフラグを含むことであって、前記ツールフラグは、前記ツールパラメータが、前記ビデオ領域をエンコーディングするために存在するかまたは有効にされていることを示す値に設定される、ことと、
    第2のパラメータセット識別子を使用して、前記第1のパラメータセット内に前記ツールパラメータを含むことであって、前記第2のパラメータセット識別子は、前記第1のパラメータセットから取得される、ことと、
    前記ビデオ領域のヘッダ内の前記第1のパラメータセット識別子をコーディングすることと、
    前記ツールパラメータを使用して、前記ビデオ領域をコーディングすることと
    を含む、方法。
  10. 前記含むステップは、
    前記ツールパラメータが既存のツールパラメータセット内の既存のツールパラメータと同じ場合、前記既存のパラメータセットのパラメータセット識別子に等しくなるように前記第2のパラメータセット識別子を設定することと、
    前記ツールパラメータが任意の既存のパラメータセット内の任意の既存のツールパラメータと同じではない場合、前記第1のパラメータセット識別子と異なる値を有する前記第2のパラメータセット識別子を生成し、使用することと
    を含む、請求項9に記載の方法。
  11. 前記ビデオ領域は、ビデオ写真より小さいか、または、前記ビデオ写真に対応する、請求項9に記載の方法。
  12. 前記ビデオコーディング技法は、前記コーディングされたビデオ領域内の複数のコーディングブロックに共通であるコーディングパラメータに基づく、請求項11に記載の方法。
  13. 前記方法は、
    前記第1のパラメータセット内に、別のツールに対応する別のツールフラグを含むことであって、前記別のツールフラグは、別のツールに対応する別のツールパラメータが、前記ビデオ領域をエンコーディングするために存在するかまたは有効にされていることを示す値に設定される、ことと、
    第3のパラメータセット識別子を使用して、前記第1のパラメータセット内に別のツールパラメータを含むことと
    をさらに含み、
    前記ビデオ領域をコーディングすることは、前記別のツールパラメータを使用して行なわれる、請求項9~12のうちのいずれか一項に記載の方法。
  14. 請求項1~13のうちのいずれか一項に記載の方法を実装するように構成されているプロセッサを備える装置。
  15. コードが記憶されているコンピュータ読み取り可能な媒体であって、前記コードは、プロセッサによって実行されると、請求項1~13のうちのいずれか一項に記載の方法を実装することを前記プロセッサに行わせる、コンピュータ読み取り可能な媒体。
JP2021553369A 2019-03-08 2019-03-08 デジタルビデオにおけるパラメータセットシグナリング Active JP7402888B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/CN2019/077548 WO2020181434A1 (en) 2019-03-08 2019-03-08 Parameter set signaling in digital video

Publications (2)

Publication Number Publication Date
JP2022523441A JP2022523441A (ja) 2022-04-22
JP7402888B2 true JP7402888B2 (ja) 2023-12-21

Family

ID=72427174

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2021553369A Active JP7402888B2 (ja) 2019-03-08 2019-03-08 デジタルビデオにおけるパラメータセットシグナリング

Country Status (6)

Country Link
US (1) US20210409779A1 (ja)
EP (1) EP3935856A4 (ja)
JP (1) JP7402888B2 (ja)
KR (1) KR20210134771A (ja)
CN (1) CN113519162B (ja)
WO (1) WO2020181434A1 (ja)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021071196A1 (ko) * 2019-10-10 2021-04-15 삼성전자 주식회사 툴 세트를 이용하는 영상 복호화 장치 및 이에 의한 영상 복호화 방법, 및 영상 부호화 장치 및 이에 의한 영상 부호화 방법
JP7397213B2 (ja) 2020-02-24 2023-12-12 バイトダンス インコーポレイテッド サブピクチャレベルに基づいたパーティション計算
CN115211125A (zh) * 2020-03-03 2022-10-18 字节跳动有限公司 视频编解码中的低频不可分变换信令通知
CN115299051A (zh) 2020-03-11 2022-11-04 抖音视界有限公司 视频编解码的一致性窗口参数
CN115699753A (zh) 2020-05-31 2023-02-03 抖音视界有限公司 具有本地双树模式类型定义的调色板模式
WO2023134731A1 (en) * 2022-01-13 2023-07-20 Mediatek Inc. In-loop neural networks for video coding
WO2023231008A1 (zh) * 2022-06-02 2023-12-07 Oppo广东移动通信有限公司 编解码方法、编码器、解码器以及存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130272372A1 (en) 2012-04-16 2013-10-17 Nokia Corporation Method and apparatus for video coding
US20140294067A1 (en) 2011-11-01 2014-10-02 Ming Li Method and device for encoding and decoding parameter sets at slice level
US20210258598A1 (en) 2018-11-07 2021-08-19 Huawei Technologies Co., Ltd. Header Parameter Set For Video Coding

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5805991B2 (ja) * 2010-05-07 2015-11-10 トムソン ライセンシングThomson Licensing ピクチャ・シーケンスを符号化する方法、それに対応する再構築方法、および当該シーケンスを表す符号化データのストリーム
WO2013031315A1 (ja) * 2011-08-30 2013-03-07 ソニー株式会社 画像処理装置及び画像処理方法
CN103200400B (zh) * 2012-01-09 2018-03-16 中兴通讯股份有限公司 一种图像层和分片层的编解码方法、编解码器和电子设备
US10313696B2 (en) * 2012-03-16 2019-06-04 Lg Electronics Inc Method for storing image information, method for parsing image information and apparatus using same
US9398284B2 (en) * 2012-08-16 2016-07-19 Qualcomm Incorporated Constructing reference picture lists for multi-view or 3DV video coding
CN103686179B (zh) * 2012-09-26 2019-05-07 中兴通讯股份有限公司 使用参数集的编码、解码方法及装置、电子设备
JP2016034050A (ja) * 2012-12-28 2016-03-10 シャープ株式会社 画像復号装置、画像符号化装置および、データ構造
CN104301738B (zh) * 2013-07-18 2018-03-23 乐金电子(中国)研究开发中心有限公司 视频编解码方法及三维视频编解码器
US10382752B2 (en) * 2013-10-15 2019-08-13 Sony Corporation Image processing device and method
WO2016175550A1 (ko) * 2015-04-27 2016-11-03 엘지전자 주식회사 비디오 신호의 처리 방법 및 이를 위한 장치

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140294067A1 (en) 2011-11-01 2014-10-02 Ming Li Method and device for encoding and decoding parameter sets at slice level
JP2014535227A (ja) 2011-11-01 2014-12-25 ゼットティイー コーポレーションZte Corporation スライス層パラメータセットの復号化及び符号化の方法及び装置
US20130272372A1 (en) 2012-04-16 2013-10-17 Nokia Corporation Method and apparatus for video coding
JP2015518683A (ja) 2012-04-16 2015-07-02 ノキア コーポレイション ビデオ符号化方法および装置
US20210258598A1 (en) 2018-11-07 2021-08-19 Huawei Technologies Co., Ltd. Header Parameter Set For Video Coding
JP2022506623A (ja) 2018-11-07 2022-01-17 華為技術有限公司 ビデオエンコーダ、ビデオデコーダ、及び対応する方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Miska M. Hannuksela, et al.,APS error resilience and partial updating,Joint Collaborative Team on Video Coding (JCT-VC) of ITU-T SG 16 WP 3 and ISO/IEC JTC 1/SC 29/WG 11 9th Meeting: Geneva, CH, 27 April - 7 May 2012,JCTVC-I0069r1,2012年04月28日,pp.1-7,庁内DB(送付可)
大久保 榮、他,H.265/HEVC教科書 初版 H.265/HEVC TEXTBOOK,インプレス標準教科書シリーズ,株式会社インプレスジャパン,2013年10月21日,pp.157-162,191-198,庁内DB(送付可)

Also Published As

Publication number Publication date
KR20210134771A (ko) 2021-11-10
CN113519162B (zh) 2023-05-23
CN113519162A (zh) 2021-10-19
EP3935856A4 (en) 2022-07-06
US20210409779A1 (en) 2021-12-30
WO2020181434A1 (en) 2020-09-17
EP3935856A1 (en) 2022-01-12
JP2022523441A (ja) 2022-04-22

Similar Documents

Publication Publication Date Title
JP7402888B2 (ja) デジタルビデオにおけるパラメータセットシグナリング
US11589047B2 (en) Video encoding and decoding methods and apparatus
US20220038721A1 (en) Cross-component quantization in video coding
US11729391B2 (en) Encoder, a decoder and corresponding methods simplifying signaling slice header syntax elements
US20220256196A1 (en) Encoder, decoder and corresponding methods for simplifying signalling picture header
JP2023512694A (ja) 高レベルシンタックスのシグナリングについてのエンコーダ、デコーダ、および対応する方法
JP2023515626A (ja) エンコーダ、デコーダ、および対応するシグナリングの方法、ならびにパラメータセット内のセマンティクス
US20210400295A1 (en) Null tile coding in video coding
WO2021169859A1 (en) A decoder and corresponding methods to signal picture partitioning information for slices
KR20220154792A (ko) 인코더, 디코더 및 대응하는 방법

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20211105

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20211105

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20221227

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20230201

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20230428

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230629

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20230825

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20231114

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20231201

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20231211

R150 Certificate of patent or registration of utility model

Ref document number: 7402888

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150