JP6876822B2 - ルミナンス情報を用いた量子化パラメーター予測 - Google Patents

ルミナンス情報を用いた量子化パラメーター予測 Download PDF

Info

Publication number
JP6876822B2
JP6876822B2 JP2019552262A JP2019552262A JP6876822B2 JP 6876822 B2 JP6876822 B2 JP 6876822B2 JP 2019552262 A JP2019552262 A JP 2019552262A JP 2019552262 A JP2019552262 A JP 2019552262A JP 6876822 B2 JP6876822 B2 JP 6876822B2
Authority
JP
Japan
Prior art keywords
value
delta
lookup table
block
bitstream
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2019552262A
Other languages
English (en)
Other versions
JP2020515190A (ja
Inventor
プゥー,ファンジュン
ルー,タオラン
イン,ペン
チェン,タオ
Original Assignee
ドルビー ラボラトリーズ ライセンシング コーポレイション
ドルビー ラボラトリーズ ライセンシング コーポレイション
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ドルビー ラボラトリーズ ライセンシング コーポレイション, ドルビー ラボラトリーズ ライセンシング コーポレイション filed Critical ドルビー ラボラトリーズ ライセンシング コーポレイション
Publication of JP2020515190A publication Critical patent/JP2020515190A/ja
Application granted granted Critical
Publication of JP6876822B2 publication Critical patent/JP6876822B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/186Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a colour or a chrominance component
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Description

[関連出願の相互参照]
本出願は、2017年3月21日に出願された米国仮出願第62/474,372号の利益及び優先権を主張する。この米国仮出願の開示内容を全て本願に援用する。
本発明は、包括的には、画像に関する。より詳細には、本発明の一実施形態は、ルミナンス(luminance:輝度)情報を用いたビデオ符号化及び/又はビデオ復号化並びに量子化パラメーターの予測のシステム及び方法に関する。
JPEG、AVC(H.264)、及びHEVC(H.265)等の非可逆圧縮方式は、人の視覚系に関係しないと考えられる情報を削減する量子化に依拠している。このため、エンコーダーでは、画像ブロック(又は残差ブロック)が周波数領域に変換された後、周波数領域データは、一般にQPと呼ばれる量子化ファクターを用いて量子化され、その後、可逆符号化方式(lossless coding scheme)を用いて更に符号化される。各ブロックの関連したQP値は、符号化ビットストリームの一部として符号化される。受信機では、デコーダーは、送信されたQP値を用いて周波数領域データを逆量子化し、逆量子化された値は、その後、符号化画像又はビデオシーケンスの近似したものを復元するために用いられる。
既存の画像及びビデオの符号化規格は、ブロードキャストコミュニティに十分に役立ってきた。しかしながら、360度仮想現実画像又はハイダイナミックレンジ(high−dynamic range)画像等の新しいコンテンツは、既存のツールの能力の限度を越えた無理な使い方をしている。本発明者らの理解において、既存の画像及びビデオの符号化技法を改良するために、画像の量子化及び予測の改良された技法を開発する。
本節に記載されている手法は、探求し得る手法ではあるが、必ずしもこれまでに着想または探求されてきた手法ではない。従って、別途示唆のない限り、本節に記載された手法のいずれも、本節に記載されているという理由だけで従来技術としての適格性を有すると考えるべきではない。同様に、別途示唆のない限り、1以上の手法に関して特定される問題が、本節に基づいて、いずれかの先行技術において認識されたことがあると考えるべきではない。
同様の部材に同様の参照符号を付した添付図面の各図において、本発明のある実施形態を限定する事なく例示する。
ビデオ供給パイプラインの一例示のプロセスを示す図である。 隣接(neighbor)符号化ブロックの一例を示す図である。 本発明の一実施形態による輝度ベースのデルタQP符号化のビットストリームパラメーターを求める一例示の符号化プロセスを示す図である。 本発明の一実施形態による輝度ベースのデルタQP符号化のビットストリームパラメーターを求める一例示の符号化プロセスを示す図である。 本発明の一実施形態による輝度ベースのデルタQP予測のデコーダーにおけるビットストリームパラメーターを復号化する一例示のプロセスを示す図である。 本発明の一実施形態による輝度ベースのデルタQP予測のデコーダーにおけるビットストリームパラメーターを復号化する一例示のプロセスを示す図である。
量子化パラメーター(QP)予測の方法を本明細書に記載する。以下の説明においては、便宜上、本発明を完全に理解できるように、多数の詳細事項を説明する。ただし、これらの詳細事項が無くても本発明を実施可能であることは明白であろう。他方、本発明の説明を不必要に煩雑にしたり、不明瞭にしたり、難読化したりしないように、周知の構造およびデバイスの細かな詳細までは説明しない。
概略
本明細書において説明する例示の実施形態は、輝度ベースの量子化パラメーター(QP)予測の方法に関する。一実施形態では、ビデオデコーダーにおいて、プロセッサは、エンコーダーによって符号化されたQP値に関連したシンタックス要素を含む符号化ビットストリームを受信する。デコーダーは、輝度ベースのQP予測が可能であるか否かを示すビットストリーム内の第1のフラグを調べ、輝度ベースのQP予測が可能であると判断すると、デコーダーは、カスタムQPマッピングテーブルがビットストリームに含まれているか否かを示すビットストリーム内の第2のフラグを調べる。このカスタムQPマッピングテーブルは、ルミナンス値を、ベースQP値を基準としたデルタQP値に関連付けたものである。デコーダーは、カスタムQPマッピングテーブルが含まれていることを検出すると、ビットストリーム内のテーブル関連シンタックス要素のセットを用いてカスタムQPマッピングテーブルを読み取る。第2のフラグの値に基づいて、デコーダーは、デフォルトQPマッピングテーブル又はカスタムQPマッピングテーブルのいずれかとして復号化デルタQPマッピングテーブルを選択し、ビットストリーム内の符号化ブロックを復号化するデルタQP値を得る。
一実施形態では、デコーダーは、ビットストリーム内の第3のフラグに従ってデルタQP値を復元する方法を決定する。第3のフラグが第1の値である場合には、デルタQP値は、ビットストリームから抽出される。第3のフラグが第2の値である場合には、ビットストリーム内の現在のブロックについてのデルタQP値は、復号化デルタQPマッピングテーブルと、現在のブロックを復号化するために用いられる予測ブロックにおけるルミナンス値の関数とに基づいて生成され、第3のフラグが第3の値である場合には、ビットストリーム内の現在のブロックにつていのデルタQP値は、復号化デルタQPマッピングテーブルと、現在のブロックを復号化するために用いられる予測ブロックにおけるルミナンス値の関数と、現在のブロックの1つ以上の隣接ブロックにおけるルミナンス値の関数群とに基づいて生成される。
第2の実施形態では、装置が、非一時的機械可読媒体に記憶されたビットストリームを備え、このビットストリームは、圧縮フォーマットにある画像データと、量子化パラメーター(QP)値を決定するシンタックス要素とによって特徴付けられ、QP値を決定するシンタックス要素は、QP値の輝度ベースの予測が可能であるか否かを示す第1のフラグと、カスタムQPマッピングテーブルがビットストリームに含まれているか否かを示す第2のフラグと、第2のフラグが、カスタムQPマッピングテーブルがビットストリームに含まれていることを示しているとき、デコーダーがカスタムQPマッピングテーブルを読み取ることを可能にするテーブル関連要素のセットとを含む。
一実施形態では、シンタックス要素は、カスタムQPマッピングテーブル又はデフォルトQPマッピングテーブル及びビットストリーム内の符号化ブロック値のルミナンス値に基づくQP予測の2つ以上のタイプを示す第3のフラグを含むことができる。カスタムQPマッピングテーブルは、ルミナンス値をデルタQP値に関連付けるものである。
ビデオ符号化
図1は、ビデオキャプチャーからビデオコンテンツ表示までの様々な段を示す従来のビデオ供給パイプライン100の一例示のプロセスを示している。ビデオフレーム102のシーケンスが、画像生成ブロック105を用いてキャプチャー又は生成される。ビデオフレーム102は、デジタル方式で(例えば、デジタルカメラによって)キャプチャーされ、又は、コンピューターによって(例えば、コンピューターアニメーションを用いて)生成されることにより、ビデオデータ107を提供することができる。或いは、ビデオフレーム102は、フィルムカメラによってフィルム上にキャプチャーすることもできる。このフィルムは、デジタルフォーマットに変換されて、ビデオデータ107を提供する。プロダクションフェーズ110では、ビデオデータ107が編集されて、ビデオプロダクションストリーム112を提供する。
プロダクションストリーム112のビデオデータは、次に、ポストプロダクション編集用のブロック115においてプロセッサに提供される。ブロック115のポストプロダクション編集は、ビデオクリエーターの創作意図に従って、画像の特定のエリア内の色又は明るさを調整又は変更して、画質を上げたり、その画像が特定の見え方をするようにしたりすることを含み得る。これは、「カラータイミング(color timing)」又は「カラーグレーディング(color grading)」と呼ばれることがある。他の編集(例えば、シーン選択及びシーケンシング、画像クロッピング、コンピューター生成された視覚的特殊効果の追加等)をブロック115において行い、配給用のプロダクション最終版117を得ることができる。ポストプロダクション編集115の間、ビデオ画像は、リファレンスディスプレイ125上で視聴される。
ポストプロダクション編集115に続いて、最終プロダクションのビデオデータ117は、テレビ受像機、セットトップボックス、映画館等の下流側の復号化デバイス及び再生デバイスに供給する符号化ブロック120に供給することができる。いくつかの実施形態では、符号化ブロック120は、ATSCフォーマット、DVBフォーマット、DVDフォーマット、Blu−Rayフォーマット、及び他の供給フォーマットによって規定されているような、符号化ビットストリーム122を生成するオーディオエンコーダー及びビデオエンコーダーを備えることができる。受信機では、符号化ビットストリーム122は、復号化ユニット130によって復号化され、同一の信号117又は密接に近似した信号を表す復号化信号132が生成される。受信機は、リファレンスディスプレイ125と全く異なる特性を有することができるターゲットディスプレイ140に取り付けることができる。その場合、ディスプレイマッピングされた信号137を生成することによって、ディスプレイ管理ブロック135を用いて復号化信号132のダイナミックレンジをターゲットディスプレイ140の特性にマッピングすることができる。
量子化
従来の画像パイプライン(例えば、100)では、キャプチャーされた画像102は、線形なシーン光を非線形ビデオ信号(例えば、ガンマ符号化RGB又はガンマ符号化YCbCr)に変換する非線形光電気伝達関数(OETF:opto-electronic function)を用いて量子化される。その後、受信機では、この信号は、ディスプレイ140に表示される前に、ビデオ信号値を出力画面色値に変換する電気光伝達関数(EOTF:electro-optical transfer function)によって処理される。そのような非線形関数は、ITU−R Rec.BT.709及びBT.2020に文書化された従来の「ガンマ」曲線と、SMPTE ST 2084及びRec.ITU−R BT.2100に記載されている「PQ」(perceptual quantization:知覚的量子化)曲線とを含む。
ガンマ曲線と比較すると、通常はハイダイナミックレンジ(HDR)の画像に適用されるPQ曲線は、暗いエリアにはより多くの符号語を割り当て、ハイライトにはより少ない符号語を割り当てる。HDR画像の圧縮においては、明るいエリア又はハイライトにより多くのビットを割り当てることが提案されている。AVC及びHEVC等の従来の符号化方式は、ガンマ符号化YCbCrシーケンスに最適化されているので、10ビットエンコーダー120内においてPQ符号化信号を適応させる1つの手法は、符号化の前に再構築関数を入力信号(例えば、117)に適用することである[1][2]。再構築によって、符号語のうちのいくつかはハイライトにシフトされ、このため、符号化効率が改善される。受信機では、デコーダーは、逆再構築関数を復号化信号(例えば、132)に適用して、元の入力を回復する必要がある。再構築関数は、フレームレベル又はシーンレベルにおける調整が必要とされる場合があり、このため、ビットストリームにおけるオーバーヘッドが増加し、圧縮効率が低下する。
AVC又はHEVC等の従来のコーデックでは、量子化パラメーター(QP)は、映像レベル又はスライスレベルにおいて定義された後、次に、符号化ブロックレベルにおいてQP値を増加又は減少させるために用いることができるデルタQP値(例えば、HEVCは、パラメーターcu_qp_delta_abs及びcu_qp_delta_sign_flagを定義し、これらは、組み合わさって、デルタQP値qp_deltaを定義する)のシーケンスを用いて調整される場合がある。デルタQP値は、比較的小さな値であり、したがって、符号化オーバーヘッドは、通常はかなり小さい。それでもやはり、映像解像度は増加し続け、デルタQP値は、サブマクロブロックレベル、符号化ユニットレベル、又は変換ユニットレベルにおいても提供される場合があるので、そのオーバーヘッドをより一層低減することが有益であり得る。
輝度値に基づくQP値の予測
本発明の実施形態によれば、デルタQP値に起因したオーバーヘッドを低減する1つの手法は、デコーダーが、同じデルタQP値を導出するためにエンコーダーによって用いられるものと同じ技法を用いてデルタQP値を予測することを含む。そのようなシナリオでは、エンコーダーは、デルタQP値を送信する必要がなく、したがって、オーバーヘッドは削減される。
一実施形態では、QPは、2つの変数、すなわち、ブロックルミナンス関連情報(例えば、ピークルミナンス又は平均ルミナンス)を示すQPLUMと、レート制御及び適応量子化[3]において用いられているブロックアクティビティ(例えば、分散又は標準偏差)、エッジ情報、動き等の他のブロック特徴量を示すΔQPOTHERとの関数として特徴付けることができる。したがって、以下の式となる。
Figure 0006876822
デルタQP値を導出するために用いられるQP予測値をQPPREDとする(例えば、ビットストリーム内で実際に符号化されているデルタQP値をqp_deltaとすると、qp_delta=QP−QPPRED)。式(1)から、一実施形態では、QPPREDは、以下のように表すこともできる。
Figure 0006876822
2つの場合を考えることにする。すなわち、a)輝度情報のみに基づくQP予測(すなわち、ΔQPPRED-OTHER=0)と、b)輝度及び「他の」情報の双方に基づくQP予測とを考えることにする。これらの2つの場合を次に検討する。
現在のブロックを予測するために用いられるブロックについてのルミナンスの関数をf(L)とする。予測ブロックは、符号化ツリーユニット(CTU)、符号化ユニット(CU)、変換ユニット(TU)、4×4ブロック、又は複数の4×4ブロックを含む符号化ブロック等の任意の適したタイプ及び/又はサイズのものとすることができる。例えば、一実施形態では、f(L)は、平均ルミナンスを表すことができる。他の実施形態では、f(L)は、ピークルミナンス、中央値ルミナンス、又はルミナンスの他の或る関数を表すことができる。f(L)は、エンコーダー及びデコーダーの双方に既知であることが予想される。一実施形態では、QPPRED-LUM(又は、より好都合なものとして、デルタQP)をf(L)の関数として表すことができる。
Figure 0006876822
ここで、dQP_LUT()は、ブロックルミナンス値の関数をデルタQP値にマッピングする関数(又はルックアップテーブル(LUT:look-up-table))を示し、baseQPは、エンコーダー及びデコーダーの双方に既知であるQP値(例えば、スライスレベルにおけるQP値)を示す。
いくつかの符号化規格は、2つのブロック(又は3つ以上のブロック)からブロックを予測することができる(例えば、AVC及びHEVCにおける双予測符号化)。そのような場合、f(L)は、現在のブロックを予測するために用いられる全てのピクセルにおけるルミナンスの関数を表すことができる。
f(L)値からdeltaQP値へのマッピングは、事前に求めて固定しておくこともできるし、ビットストリームシンタックスの一部として定義することもできる。限定ではなく例として、表1([4])は、10ビットデータのそのようなマッピングの一例を提供する。この表において、f(L)=LAVは、現在のブロックを予測するために用いられる1つ以上のブロックにおける平均ルミナンスを表す。
Figure 0006876822
エンコーダーが、他の特徴量にも基づいてQP調整を行うとき、一実施形態では、隣接ブロック、特にデコーダーに既知であると考えられるブロック、例えば、図2に示すように、その左側ブロック209、又はその上側ブロック若しくは最上部ブロック207の情報に基づいて、現在のブロック(例えば、205)のΔQPPRED-OTHERを導出することができる。例えば、以下の式となる。
Figure 0006876822
及び
Figure 0006876822
ここで、f(LABOVE)及びf(LLEFT)は、現在のブロック205の上側ブロック207及び左側ブロック209におけるルミナンス値の関数であり、dQP_LUT()関数は、例えば、表1によって示されるように、輝度の関数に基づいてデルタQP値を求める。したがって、以下の式となる。
Figure 0006876822
好ましい実施形態では、エンコーダーは、デルタQPを明示的に送る(signal)(デフォルト)か、予測ブロックのルミナンスに基づくデルタQPを送るか、又は予測ブロックのルミナンス及び隣接ブロックのQP値の双方に基づくデルタQPを送るかのいずれかの柔軟性を有する。一例として、表2及び表3は、既存のHEVC仕様[5]のセクション7.3.2.2.1における「General sequence parameter set RBSP syntax」及び7.3.2.3.1における「General picture parameter set RBSP syntax」を変更することによるビットストリームシンタックスの例を提供している。既存のHEVCシンタックスを越える新たなビットストリームシンタックス要素は、ボールド体で示されている。
Figure 0006876822
Figure 0006876822
1に等しいluma_qp_prediction_enabled_flagは、luma_QP_map_LUT_idc、mum_pivot_minus1、luma_pivot_value[i]、及びdQP_value[i]のシンタックス要素がSPSに存在することと、luma_qp_prediction_idcがPPSに存在することとを規定する。0に等しいluma_qp_prediction_enabled_flagは、luma_QP_map_LUT_idc、mum_pivot_minus1、luma_pivot_value[i]、及びdQP_value[i]のシンタックス要素がSPSに存在しないことと、luma_qp_prediction_idcがPPSに存在しないこととを規定する。luma_qp_prediction_enabled_flagが存在しないとき、luma_qp_prediction_enabled_flagの値は、0に等しいと推定される。
luma_dQP_map_LUT_idcは、輝度dQPマップルックアップテーブルを規定する。luma_dQP_map_LUT_idの値は、0以上2以下の範囲にあるものとする。0に等しいluma_dQP_map_LUT_idcは、HDRビデオのデフォルト輝度dQP LUTを示す。1に等しいluma_dQP_map_LUT_idcは、PQコンテナー内のSDRビデオのデフォルト輝度dQP LUTを示す。2に等しいluma_dQP_map_LUT_idcは、輝度dQP LUTが以下のように規定されることを示す。luma_dQP_map_LUT_idcが存在しないとき、luma_dQP_map_LUT_idcの値は、0に等しいと推定される。
num_entries_minus1に1を加えたものは、輝度dQPマップルックアップテーブル(例えば、dQP_LUT())内のエントリーの数を規定する。
luma_value[i]は、輝度dQPマップルックアップテーブル内の第iのエントリーの輝度値を規定する。
dQP_value[i]は、輝度dQPマップルックアップテーブル内の第i番目のエントリーのdQP値を規定する。
表1に示すように、通常、デルタQP値は、広範囲のルミナンス値に適用される。デルタQPマッピングテーブル内のエントリーの数を削減するために、1つの実施形態では、luma_value[i+1]>luma_value≧luma_value[i]である場合、dQP_value=dQP_value[i]である。別の実施形態では、デルタQPマッピングテーブルは、明示的な境界値を用いて表すことができ、このため、例えば、デルタQPマッピング値を読み取る表2のコードは、以下のコードに置き換えることができる。
for(i=0; i<num_entries_minus1+1; i++) {
luma_min_value[i]
luma_max_value[i]
dQP_value[i]
}
また、luma_max_value[i]>luma_value≧luma_min_value[i]である場合、dQP_value=dQP_value[i]である。
luma_qp_prediction_idcは、どのようなQP予測方法が用いられるのかを示す。luma_qp_prediction_idcの値は、0以上2以下の範囲にあるものとする。0に等しいluma_qp_prediction_idcは、HEVCにおけるQP予測が用いられることを示す。1に等しいluma_qp_prediction_idcは、QP予測が輝度関連情報しか用いないことを示す。2に等しいluma_qp_prediction_idcは、QP予測が輝度関連情報及び空間隣接情報の双方を用いることを示す。
いくつかの実施形態は、luma_qp_prediction_idcフラグを用いない場合がある。デコーダーは、単に、luma_qp_prediction_enabled_flag又はluma_dQP_map_LUT_idcフラグの値を用いて、所定の方法でQP予測を適用することができる。
図3A及び図3Bは、一実施形態による、ビットストリームを構築する一例示の符号化プロセスを示している。図3Aに示すように、ステップ305において、エンコーダーは、デルタQP値を通信するための、提案する輝度ベースのQP予測方法(輝度dQP)がビットストリームにおいて用いられるか否かを判断する。用いられる場合、luma_qp_prediction_enabled_flagが1に設定される(310)。次に(ステップ315及び325)、エンコーダーは、デフォルトデルタQPルックアップテーブルのうちのいずれかを用いるか否かを判断する。限定ではなく例示の選択肢として、HDRデータのデフォルトテーブル(ステップ320)又はPQ EOTFを用いたSDRデータのデフォルトテーブル(ステップ330)の選択肢が提供される。或いは(ステップ335において)、エンコーダーは、ビットストリームにおいてカスタムデルタQP LUTを符号化することができる。これらのデルタQP LUT定義が与えられると、図3Bに示すように、映像及び/又はスライスごとに、エンコーダーは、QP値を求め、デルタQPを通信する方法、すなわち、a)デフォルト方法を用いて通信する方法(ステップ340及び345)、b)輝度情報のみに基づく予測を用いて通信する方法(ステップ350及び355)(式(3)参照)、又はc)輝度情報及び「他の」(例えば、隣接)情報の双方に基づく予測を用いて通信する方法(式(4)〜(6)参照)(ステップ360)を決定する(337)。
いくつかの実施形態では、デフォルトdQP LUTを選択する選択肢がない場合がある。他の実施形態では、シンタックスは、3つ以上のdQP LUTの使用をサポートすることができる。
図4A及び図4Bは、一実施形態による、ビットストリームを復号化し、輝度ベースのデルタQP予測を適用する一例示のプロセスを示している。図4Aに示すように、デコーダーは、ビットストリームをパースした(405)後、ステップ410において、輝度ベースのQP予測が可能であるか否かを検出する。輝度ベースのQP予測が検出された場合、デコーダーは、デフォルトデルタQPテーブルを用いてビットストリームを復号化することができるのか否か(ステップ415、420、425、及び430)、又は、ビットストリームに埋め込まれた新たなテーブルを用いてビットストリームを復号化することができるのか否か(ステップ435及び440)を判断する必要がある。エンコーダーの選択肢に応じて、異なるデフォルトテーブル、例えば、HDR符号化データのデフォルトテーブル及びSDR符号化データのデフォルトテーブルを定義することができる。
いずれかのデルタQP LUTの構築した後、プロセスは、デルタQP値(C)を実際に求めることに進む。図4Bに示すように、この部分は、全ての映像及び全てのスライスにわたって繰り返すことができる。luma_qp_prediction_idcの値(例えば、0、1、又は2)を検査して(ステップ450、460、及び470参照)、デコーダーは、デルタQPが、a)デフォルト方法を用いて通信されたのか(ステップ450及び455)、b)輝度情報のみに基づく予測を用いて通信されたのか(ステップ460及び465)(式(3)参照)、又はc)輝度情報及び「他の」(例えば、隣接)情報の双方に基づく予測を用いて通信されたのか(式(4)〜(6)参照)(ステップ470及び475)を判断することができる。デルタQP値が与えられると、デコーダーは、以下のように、QP値を生成してブロックを復号化し得る。
Figure 0006876822
引用文献
以下の引用文献の全内容が本明細書に援用される。
[1]J. Froehlich他による国際公開第2016/140954号「Content-Adaptive Perceptual Quantizer for High Dynamic Range Images」
[2]「Comments on Reshaping for HDR/WCG compression」MPEG input document, M37267, October 2015, Geneva, CH
[3]T. Lu他による米国特許出願公開第2016/0134870号「Rate Control Adaptation for High-Dynamic Range Images」
[4]「Conversion and Coding Practices for HDR/WCG Y'CbCr 4:2:0 Video with PQ Transfer Characteristics」Technical Report ISO/IEC 23008-14 (2017)
[5]Rec. H.265「High efficiency video coding」ITU-T, 10/2014
コンピューターシステム実装例
本発明の実施形態は、コンピューターシステム、電子回路およびコンポーネントで構成されたシステム、マイクロコントローラ、フィールドプログラマブルゲートアレイ(FPGA)または他のコンフィギュラブルまたはプログラマブルロジックデバイス(PLD)、離散時間またはデジタル信号プロセッサ(DSP)、特定用途向けIC(ASIC)などの集積回路(IC)デバイス、および/または、このようなシステム、デバイスまたはコンポーネントを1つ以上含む装置、を用いて実施し得る。このコンピューターおよび/またはICは、本明細書に記載のような量子化パラメーター予測に関する命令を行い、制御し、または実行し得る。このコンピューターおよび/またはICは、本明細書に記載の量子化パラメーター予測に関する様々なパラメーターまたは値のいずれを演算してもよい。画像およびビデオ実施形態は、ハードウェア、ソフトウェア、ファームウェア、および、その様々な組み合わせで実施され得る。
本発明の特定の態様は、本発明の方法をプロセッサに行わせるためのソフトウェア命令を実行するコンピュータプロセッサを含む。例えば、ディスプレイ、エンコーダー、セットトップボックス、トランスコーダなどの中の1つ以上のプロセッサは、そのプロセッサがアクセス可能なプログラムメモリ内にあるソフトウェア命令を実行することによって、上記のような量子化パラメーター予測に関する方法を実装し得る。本発明は、プログラム製品形態で提供されてもよい。このプログラム製品は、データプロセッサによって実行された時に本発明の方法をデータプロセッサに実行させるための命令を含む1セットの、コンピューター読み取り可能な信号を格納する任意の非一時的媒体を含み得る。本発明によるプログラム製品は、様々な形態をとり得る。例えば、このプログラム製品は、フロッピーディスク、ハードディスクドライブを含む磁気データ記憶媒体、CD ROM、DVDを含む光学データ記憶媒体、ROM、フラッシュRAMなどを含む電子データ記憶媒体、などの物理的媒体を含み得る。このプログラム製品上のコンピューター可読信号は、任意に、圧縮または暗号化されていてもよい。
上記においてあるコンポーネント(例えば、ソフトウェアモジュール、プロセッサ、アセンブリ、デバイス、回路など)に言及している場合、そのコンポーネントへの言及(「手段」への言及を含む)は、そうでないと明記されている場合を除いて、当該コンポーネントの機能を果たす(例えば、機能的に均等である)あらゆるコンポーネント(上記した本発明の実施形態例に出てくる機能を果たす開示構造に対して構造的に均等ではないコンポーネントも含む)を、当該コンポーネントの均等物として、含むものと解釈されるべきである。
均等物、拡張物、代替物、その他
量子化パラメーター予測に関する実施形態例を上述した。この明細書中において、各実装毎に異なり得る多数の具体的な詳細に言及しながら本発明の実施形態を説明した。従って、本発明が如何なるものかおよび出願人は本発明が如何なるものであると意図しているかについての唯一且つ排他的な指標は、後の訂正を含む、これら請求項が生じる具体的な形態の、本願から生じる1組の請求項である。当該請求項に含まれる用語に対して本明細書中に明示したあらゆる定義が、請求項内で使用される当該用語の意味を決定するものとする。よって、請求項に明示的に記載されていない限定事項、構成要素、特性、特徴、利点または属性は、いかなる形であれ請求の範囲を限定するものではない。従って、本明細書および図面は、限定的ではなく、例示的であると認識されるべきものである。

Claims (9)

  1. 画像および/またはビデオデコーダーにおける、プロセッサを用いた輝度ベースの量子化パラメーター(QP)予測の方法であって、
    エンコーダーによって符号化されたQP値に関連したシンタックス要素を含む符号化ビットストリームを受信することと、
    輝度ベースのQP予測が可能であるか否かを示す前記ビットストリーム内の第1のフラグを調べ、輝度ベースのQP予測が可能であると判断すると、
    カスタムのQPマッピングルックアップテーブルが前記ビットストリームに含まれているか否かを示す前記ビットストリーム内の第2のフラグを調べ、ここで、QPマッピングルックアップテーブルは、ブロックルミナンス値の関数をデルタQP値にマッピングし、前記カスタムのQPマッピングルックアップテーブルが含まれていることを検出すると、前記ビットストリーム内の、QPマッピングルックアップテーブルシンタックスパラメータのセットを含むQPマッピングルックアップテーブルシンタックス要素のセットを用いて前記カスタムのQPマッピングルックアップテーブルを読み取ることと、
    前記第2のフラグの値に基づいて、復号化デルタQPマッピングルックアップテーブルをデフォルトのQPマッピングルックアップテーブル又は前記カスタムのQPマッピングルックアップテーブルとして選択することと、
    前記復号化デルタQPマッピングルックアップテーブルに基づいてデルタQP値を生成することと、ここで、前記デルタQP値を生成することは、
    前記ビットストリーム内の第3のフラグの値に従って前記デルタQP値を復元する方法を決定することをさらに含み、ここで、前記第3のフラグは、前記カスタムのQPマッピングルックアップテーブル又は前記デフォルトのQPマッピングルックアップテーブル、及び前記ビットストリーム内の符号化ブロックにおけるルミナンス値に基づくQP予測の1つ以上のタイプを示し、
    ここで前記QP予測の1つ以上のタイプは、
    前記第3のフラグが第1の値である場合には、前記デルタQP値は前記ビットストリームから抽出される、デフォルトタイプと、
    前記第3のフラグが第2の値である場合には、前記ビットストリーム内の現在のブロックについての前記デルタQP値は、前記復号化デルタQPマッピングルックアップテーブルと、前記現在のブロックを復号化するために用いられる予測ブロックにおけるルミナンス値の関数とに基づいて生成される、第1の予測タイプと、
    前記第3のフラグが第3の値である場合には、前記ビットストリーム内の前記現在のブロックについての前記デルタQP値は、前記復号化デルタQPマッピングルックアップテーブルと、前記現在のブロックを復号化するために用いられる前記予測ブロックにおけるルミナンス値の関数と、前記現在のブロックの1つ以上の隣接ブロックにおけるルミナンス値の関数群とに基づいて生成される、第2の予測タイプと、を含んでおり、
    復元したデルタQP値に基づいて、前記デルタQP値をベースQP値に加算することによってQP値を生成してビットストリーム中における符号化ブロックを復号し、前記ベースQP値は前記エンコーダーおよび前記デコーダーの両方に既知の値を示す、こととを、含み、
    前記第3のフラグが前記第3の値である場合には、前記デルタQP値(deltaQP)は、以下のように生成され、
    Figure 0006876822
    ここで、
    Figure 0006876822
    及び
    Figure 0006876822
    であり、QPABOVEは、前記現在のブロックの上側のブロックのQP値を示し、QPLEFTは、前記現在のブロックの左側のブロックのQP値を示し、dQP_LUT()は、前記復号化デルタQPマッピングルックアップテーブルを示し、f(L)は、前記予測ブロックにおけるルミナンス値の関数を示し、f(LABOVE)は、前記現在のブロックの前記上側のブロックにおけるルミナンス値の関数を示し、f(LLEFT)は、前記現在のブロックの前記左側のブロックにおけるルミナンス値の関数を示す、方法。
  2. 前記ビットストリーム内の前記QPマッピングルックアップテーブルシンタックスパラメータのセットは、テーブルエントリーの数を示す変数と、各テーブルエントリーについて、ルミナンス値及びその対応するデルタQP値とを含む、請求項1に記載の方法。
  3. 前記予測ブロックにおける前記ルミナンス値の関数は、前記予測ブロック内のピクセルのルミナンス値の平均を含む、請求項1に記載の方法。
  4. 前記第3のフラグが前記第2の値である場合には、前記デルタQP値(deltaQP)は、以下のように生成され、
    Figure 0006876822
    ここで、dQP_LUT()は、前記復号化デルタQPマッピングルックアップテーブルを示し、f(L)は、前記現在のブロックを復号化するために用いられる前記予測ブロックにおける前記ルミナンス値の関数を示す、請求項1に記載の方法。
  5. f()は、検討対象ブロック内のピクセルの前記ルミナンス値の平均を示す、請求項1に記載の方法。
  6. 画像および/またはビデオエンコーダーにおいて、プロセッサを用いて符号化ビットストリームを生成する方法であって、前記ビットストリームは、輝度ベースの量子化パラメーター(QP)予測をサポートし、該方法は、
    第1のフラグを、輝度ベースのQP予測が前記ビットストリームにおいて可能であることを示す値に設定することと、
    第2のフラグを、輝度ベースのQP予測がデフォルトのQPマッピングルックアップテーブルを利用するのか、又は、ルミナンス値の範囲をデルタQP値にマッピングするカスタムのQPマッピングルックアップテーブルを利用するのかを示す値に設定することと、ここで、QPマッピングルックアップテーブルは、ブロックルミナンス値の関数をデルタQP値にマッピングし、
    前記カスタムのQPマッピングルックアップテーブルが前記ビットストリームに含まれているとき、デコーダーが前記カスタムのQPマッピングルックアップテーブルを読み取ることができるように、QPマッピングルックアップテーブルシンタックス要素のセットに含まれるQPマッピングルックアップテーブルシンタックスパラメーターのセットに値を設定することと、
    デルタQP値を復元して、復元したデルタQP値をベースQP値に加算することによってQP値を生成するために、第3のフラグを、前記カスタムのQPマッピングルックアップテーブル又はデフォルトのQPマッピングルックアップテーブル、及び前記ビットストリーム内の符号化ブロックにおけるルミナンス値に基づくQP予測の1つ以上のタイプを示す値に設定すること、ここで、ベースQP値は前記エンコーダーおよび前記デコーダーの両方に既知の値を示し、前記QP予測の1つ以上のタイプは、以下を含む:
    前記デルタQP値が前記ビットストリームに埋め込まれている、デフォルトタイプ、
    前記ビットストリーム内の現在のブロックについての前記デルタQP値が、復号化デルタQPマッピングルックアップテーブルと、前記現在のブロックを復号化するために用いられる予測ブロックにおけるルミナンス値の関数とに基づいて生成される、第1の予測タイプであって、前記復号化デルタQPマッピングルックアップテーブルは、前記第2のフラグの値に基づいて決定され、前記デフォルトのQPマッピングルックアップテーブル又は前記カスタムのQPマッピングルックアップテーブルを含む、第1の予測タイプ、および
    前記ビットストリーム内の前記現在のブロックについての前記デルタQP値が、前記復号化デルタQPマッピングルックアップテーブルと、前記現在のブロックを復号化するために用いられる前記予測ブロックにおけるルミナンス値の関数と、前記現在のブロックの1つ以上の隣接ブロックにおけるルミナンス値の関数群とに基づいて生成される、第2の予測タイプであって、ここで、前記デルタQP値(deltaQP)は、以下のように生成され、
    Figure 0006876822
    ここで、
    Figure 0006876822
    及び
    Figure 0006876822
    であり、QPABOVEは、前記現在のブロックの上側のブロックのQP値を示し、QPLEFTは、前記現在のブロックの左側のブロックのQP値を示し、dQP_LUT()は、前記復号化デルタQPマッピングルックアップテーブルを示し、f(L)は、前記予測ブロックにおけるルミナンス値の関数を示し、f(LABOVE)は、前記現在のブロックの前記上側のブロックにおけるルミナンス値の関数を示し、f(LLEFT)は、前記現在のブロックの前記左側のブロックにおけるルミナンス値の関数を示す、第2の予測タイプ、を含む、方法。
  7. 前記ビットストリーム内の前記QPマッピングルックアップテーブルシンタックスパラメーターのセットは、テーブルエントリーの数を示す変数と、各テーブルエントリーについて、ルミナンス値及びその対応するデルタQP値とを含む、請求項6に記載の方法。
  8. プロセッサを備え、請求項1から7のいずれか1項に記載の方法を実行するように構成された装置。
  9. 1つ以上のプロセッサを用いて、請求項1から7のいずれか1項に記載の方法を実行するコンピューター実行可能命令を含むコンピュータプログラム。
JP2019552262A 2017-03-21 2018-03-21 ルミナンス情報を用いた量子化パラメーター予測 Active JP6876822B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201762474372P 2017-03-21 2017-03-21
US62/474,372 2017-03-21
PCT/US2018/023634 WO2018175638A1 (en) 2017-03-21 2018-03-21 Quantization parameter prediction using luminance information

Publications (2)

Publication Number Publication Date
JP2020515190A JP2020515190A (ja) 2020-05-21
JP6876822B2 true JP6876822B2 (ja) 2021-05-26

Family

ID=61913608

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019552262A Active JP6876822B2 (ja) 2017-03-21 2018-03-21 ルミナンス情報を用いた量子化パラメーター予測

Country Status (5)

Country Link
US (1) US11166023B2 (ja)
EP (1) EP3566440B1 (ja)
JP (1) JP6876822B2 (ja)
CN (1) CN110612724B (ja)
WO (1) WO2018175638A1 (ja)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019199025A1 (ko) * 2018-04-09 2019-10-17 에스케이텔레콤 주식회사 영상을 부호화/복호화하는 방법 및 그 장치
US11509937B2 (en) * 2018-04-09 2022-11-22 Sk Telecom Co., Ltd. Method and apparatus for encoding/decoding video
CN114745544B (zh) 2019-05-28 2024-05-28 杜比实验室特许公司 用信号发送量化参数的方法和计算机可读记录介质
US20220377338A1 (en) * 2019-06-23 2022-11-24 Sharp Kabushiki Kaisha Systems and methods for deriving quantization parameters for video blocks in video coding
US11146823B2 (en) 2019-06-25 2021-10-12 Qualcomm Incorporated Signalling chroma quantization parameter (QP) mapping tables
CN113632142A (zh) * 2019-07-02 2021-11-09 腾讯美国有限责任公司 点云压缩的方法和装置
US11082473B1 (en) * 2020-03-15 2021-08-03 Tfi Digital Media Limited Method for complexity reduction in video coding by coding parameters reuse

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108366264B (zh) * 2010-06-04 2022-08-26 索尼公司 图像处理设备和方法
BR112012031160B1 (pt) * 2010-06-10 2022-04-19 Interdigital Vc Holdings, Inc. Método em um decodificador de vídeo, decodificador de vídeo e mídia de armazenamento legível por computador para determinação de preditores de parâmetros de quantização a partir de uma pluralidade de parâmetros de quantização vizinhos
US20120114034A1 (en) * 2010-11-08 2012-05-10 Mediatek Inc. Method and Apparatus of Delta Quantization Parameter Processing for High Efficiency Video Coding
BR122020013607B1 (pt) * 2011-03-11 2023-10-24 Sony Corporation Aparelho e método de processamento de imagem
US10136133B2 (en) 2014-11-11 2018-11-20 Dolby Laboratories Licensing Corporation Rate control adaptation for high-dynamic range images
JP6532222B2 (ja) * 2014-11-28 2019-06-19 キヤノン株式会社 画像符号化装置、画像符号化方法及びプログラム、画像復号装置、画像復号方法及びプログラム
US10419762B2 (en) 2015-03-02 2019-09-17 Dolby Laboratories Licensing Corporation Content-adaptive perceptual quantizer for high dynamic range images
EP3304912A4 (en) * 2015-06-07 2018-06-06 Sharp Kabushiki Kaisha Systems and methods for optimizing video coding based on a luminance transfer function or video color component values
WO2018143289A1 (ja) 2017-02-02 2018-08-09 シャープ株式会社 画像符号化装置及び画像復号装置

Also Published As

Publication number Publication date
US20200029078A1 (en) 2020-01-23
CN110612724A (zh) 2019-12-24
JP2020515190A (ja) 2020-05-21
WO2018175638A1 (en) 2018-09-27
US11166023B2 (en) 2021-11-02
EP3566440B1 (en) 2020-12-02
EP3566440A1 (en) 2019-11-13
CN110612724B (zh) 2021-04-20

Similar Documents

Publication Publication Date Title
JP6876822B2 (ja) ルミナンス情報を用いた量子化パラメーター予測
JP7114653B2 (ja) 高ダイナミックレンジおよび広色域シーケンスを符号化するシステム
US10972756B2 (en) Signal reshaping and coding for HDR and wide color gamut signals
JP6383116B2 (ja) ハイダイナミックレンジ映像符号化における、ループ内ブロックベース画像再構成
CN108028936B9 (zh) 分量用于使用固定点计算实施动态范围调整的方法和设备
KR102031477B1 (ko) 고 동적 범위 (hdr) 및/또는 넓은 컬러 공간 (wcg) 비디오 데이터에의 고정 전달 함수의 콘텐츠-적응적 적용
IL276062B2 (en) Image reshaping in video encoding using rate warping optimization
KR20200037272A (ko) 비디오 코딩에서 크로스-성분 동적 범위 조정 (cc-dra) 의 시스템 및 방법
JP2020526942A (ja) 統合された画像再構成及び映像符号化
KR20190039958A (ko) 피드백 채널에 의한 컬러 영역 적응
TW201924336A (zh) 利用內容適應性空間變化量化之視訊寫碼
KR20180056705A (ko) 높은 동적 범위 비디오 데이터의 재형성 및 적응을 위한 시스템 및 방법
TW201931856A (zh) 用於視訊寫碼之相等範圍及其他dra參數之信號發送機制
KR20170139016A (ko) 높은 동적 범위 및 넓은 색역 비디오 코딩에 대한 동적 범위 조정
TW201931853A (zh) 具有聯合像素/變換為基礎之量化之視頻寫碼之量化參數控制
TWI713354B (zh) 用於顯示器調適之色彩重映射資訊sei信息發信號
US11122270B2 (en) In-loop reshaping with local illumination compensation in image coding
CN116034394A (zh) 假轮廓减轻的自适应流式传输

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20191114

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20191114

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20191114

A975 Report on accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A971005

Effective date: 20200326

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20200414

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20200710

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200803

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20201027

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210216

C60 Trial request (containing other claim documents, opposition documents)

Free format text: JAPANESE INTERMEDIATE CODE: C60

Effective date: 20210216

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20210301

C21 Notice of transfer of a case for reconsideration by examiners before appeal proceedings

Free format text: JAPANESE INTERMEDIATE CODE: C21

Effective date: 20210302

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20210330

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20210426

R150 Certificate of patent or registration of utility model

Ref document number: 6876822

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE

Ref document number: 6876822

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250