JP6595711B2 - 階層的分割内でのブロックレベルの変換選択および黙示的シグナリングを伴う変換コーディングのための方法および装置 - Google Patents

階層的分割内でのブロックレベルの変換選択および黙示的シグナリングを伴う変換コーディングのための方法および装置 Download PDF

Info

Publication number
JP6595711B2
JP6595711B2 JP2018518741A JP2018518741A JP6595711B2 JP 6595711 B2 JP6595711 B2 JP 6595711B2 JP 2018518741 A JP2018518741 A JP 2018518741A JP 2018518741 A JP2018518741 A JP 2018518741A JP 6595711 B2 JP6595711 B2 JP 6595711B2
Authority
JP
Japan
Prior art keywords
information
transform coefficients
concealed
quantized transform
transform
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2018518741A
Other languages
English (en)
Other versions
JP2018530970A (ja
Inventor
コンスタンティノヴィッチ フィリッポフ アレクセイ
アレクセーヴィッチ ルフィツキー ヴァシリー
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Publication of JP2018530970A publication Critical patent/JP2018530970A/ja
Application granted granted Critical
Publication of JP6595711B2 publication Critical patent/JP6595711B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/12Selection from among a plurality of transforms or standards, e.g. selection between discrete cosine transform [DCT] and sub-band transform or selection between H.263 and H.264
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/12Selection from among a plurality of transforms or standards, e.g. selection between discrete cosine transform [DCT] and sub-band transform or selection between H.263 and H.264
    • H04N19/122Selection of transform size, e.g. 8x8 or 2x4x8 DCT; Selection of sub-band transforms of varying structure or type
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/18Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a set of transform coefficients
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/189Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/44Decoders specially adapted therefor, e.g. video decoders which are asymmetric with respect to the encoder
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • H04N19/467Embedding additional information in the video signal during the compression process characterised by the embedded information being invisible, e.g. watermarking
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Discrete Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Description

本発明は、一般に静止ピクチャまたはビデオピクチャであるピクチャのエンコーディングおよびデコーディングの分野に関し、特に量子化された変換係数を用いてソースピクチャを出力ビットストリームにエンコードすること、および逆変換された変換係数を用いて入力ビットストリームをデコードされたピクチャにデコードすることに関する。本発明はさらに、ソースピクチャをエンコードするためのエンコーダ、および逆変換された変換係数を用いて入力ビットストリームをデコードするためのデコーダに関する。最後に、本発明は、このような方法を実行するためのプログラムコードを有するコンピュータプログラムに関する。
デジタルビデオ通信およびストレージアプリケーションは、広範囲のデジタルデバイス、例えば、デジタルカメラ、セルラ無線電話、ラップトップ、放送システム、ビデオ遠隔会議システムなどにより実装される。これらのアプリケーションの最も重要かつ挑戦的なタスクの1つは、ビデオ圧縮である。ビデオ圧縮のタスクは、複雑であり、圧縮効率と計算の複雑性という2つの相反するパラメータによって制約を受ける。ITU−T H.264/AVCまたはITU−T H.265/HEVCなどのビデオコーディング標準は、これらのパラメータ間に良好なトレードオフを提供する。その理由で、ビデオコーディング標準のサポートは、ほぼどのビデオ圧縮アプリケーションにとっても必須要件である。
最先端のビデオコーディング標準は、ソースピクチャのブロックへの分割に基づいている。これらのブロックの処理は、それらのサイズ、空間位置、およびエンコーダによって指定されたコーディングモードに依存する。コーディングモードは、予測のタイプに応じて、イントラ予測モードとインター予測モードとの2つのグループに分類されてもよい。イントラ予測モードは、再構成されるブロックのピクセルの予測値を計算するために、同じピクチャのピクセルを用いて基準サンプルを生成する。イントラ予測は、また空間予測と呼ばれてもよい。インター予測モードは、時間予測のために設計され、現在のピクチャのブロックのピクセルを予測するために、前のピクチャまたは次のピクチャの基準サンプルを用いる。予測段階の後、変換コーディングが元の信号とその予測との間の差異である予測誤差、または残余誤差に対して実行される。次に、変換係数およびサイド情報は、例えば、AVC/H.264およびHEVC/H.265用のContext−Adaptive Binary Arithmetic Coding、CABAC、などのエントロピーコーダを使用してエンコードされる。
明らかに、予測誤差は異なる予測モードに対して異なる統計量を有し、予測される内容に強く依存する。したがって、異なる場合に対する圧縮性能の観点からは、異なる変換が有益である。変換コーディング段階のコーディング効率を向上するために、異なる特定の場合に対して異なるエネルギー圧縮を有する複数の変換が使用されることができる。
第1の例によれば、ISO/IEC 23008−2:2013で定義されている、既知で最近採用されたITU−T H.265/HEVC規格である、2013年11月の「Information technology − High efficiency coding and media delivery in heterogeneous environments − Part 2:High efficiency video coding」は、コーディング効率と計算の複雑性との間の妥当なトレードオフを提供する最先端のビデオコーディングツールのセットを言明している。ITU−T H.265/HEVC規格の概要は、IEEE Transactions on Circuits and System for Video Technology、第22巻、12号、2012年12月号におけるGary J.Sullivanによる論文である、「Overview of the High Efficiency Video Coding (HEVC) Standard」にて与えられており、本論文のすべての内容は参照することにより本明細書に盛り込まれているものとする。
HEVC/H.265ビデオコーディング規格は、ソースピクチャをブロック、例えば、コーディングユニット、CU、に分割することを提供する。CUの各々は、より小さいCU、または予測ユニット、PU、にさらに分割されてもよい。PUは、PUのピクセルに適用される処理のタイプに従って、イントラ予測またはインター予測されてもよい。インター予測の場合、PUは、PUに対して指定された動きベクトルを使用した動き補償によって処理されるピクセルの領域を表す。イントラ予測については、PUは変換ユニット、TU、のセットについて予測モードを指定する。TUは、例えば、4×4、8×8、16×16、32×32個のピクセルのように異なるサイズを有することができ、異なる方法で処理されてもよい。TUについて、変換コーディングが実行される、すなわち、予測誤差が離散コサイン変換、DCT、または離散サイン変換、DSTで変換される−HEVC/H.265規格では、それがイントラコーディングされたブロックに適用され−、そして量子化される。したがって、再構成されたピクセルは、予測精度に影響する可能性がある量子化雑音およびブロッキングアーチファクトを含む。
設計を単純な状態に保つために1つの変換のみを使用する従来の既知のビデオコーディング標準と比較して、HEVC/H.265規格は、イントラコーディングについて2つの変換、すなわち、4×4ブロックに対するDST、および他のブロックに対するDCTを規定する。この変換は、小さなイントラ予測ブロックに対してより好ましいエネルギー圧縮を提供するため、4×4個のブロックに対してDSTが選択される。
さらなる例によれば、JM/KTAにおいて、エッジは滑らかな領域よりも予測が困難であるため、残差は通常、予測の方向に沿って高いエネルギーを有しているため、イントラ予測によって生成される残差を圧縮するために、既知のモード依存型方向性変換、MDDT、が提案されている。それは、一連の予め定義された分離可能な変換からなり、各変換は、予測方向の1つに沿ってエネルギーを圧縮するのに効率的であり、したがってイントラモードの1つを支持する。MDDTのタイプは、選択されたイントラ予測モードと結合されているので、明示的にシグナリングされない。
方向情報も含むインター予測誤差の場合、エッジ方向が明示的に検出されて送信されない限り、MDDTは使用されることができない。しかし、このように導入されたサイド情報は重要であり、全体的なパフォーマンスの改善を損なう。したがって、MDDTは、イントラコーディングされたマクロブロックに対してのみ提案される。
22個の分離可能な変換は、22個のイントラ予測モードに対して予め定義されており、それぞれは、水平変換および垂直変換のための2つの変換行列からなる。すべてのMDDT行列を格納するメモリは約1.5Kbである。変換行列は、すべてイントラコーディングされた大きなビデオシーケンスのセットに基づいて導出される。すべてのブロックは、それらの関連するイントラ予測モードに従って、22個のカテゴリに分類される。ブロックの各カテゴリについて、予測誤差の水平相関行列および垂直相関行列が計算され、そのうちの固有ベクトルが水平変換行列および垂直変換行列を構成するためにそれぞれ使用される。MDDTの行列導出手順は、カルーネン・レーベ変換、KLT、のものに類似しているが、MDDTは分離可能であり、特定のビデオシーケンスの局所統計に合致しないかもしれない一般統計に基づいて設計されているため、MDDTは最適ではない。さらに、整数だけを含むMDDTの基底ベクトルは、固有ベクトルのスケーリングされたかつ丸められたバージョンであり、互いに直交していない。
分離可能な変換が水平エッジおよび垂直エッジを効率的に対処することはよく知られている。なぜなら、基底イメージはチェッカーボードのような水平エッジおよび垂直エッジだけ含むからである。MDDTは−分離可能な変換の一種であるが−、任意の方向に沿ってエネルギーを圧縮するために使用されるが、これはかなり矛盾していると思われる。異なるイントラ予測モードに対するMDDTの基底イメージが調査される。基底イメージはまたチェッカーボードパターンを有するが、ゼロクロスの位置はDCTまたは整数コサイン変換、ICT、のものとは異なることが分かる。
各イントラモードが異なる方向情報を統計的に有するという観察によって動機付けられたMDDTにおいて、イントラモードごとに1つの変換行列が使用される。これは、追加のシグナリング情報またはレート歪み検索を必要としないが、各イントラモード内では、1つの変換行列では、イメージコンテンツの多様性のために残差特性の潜在的な変動に対応できないことがある。
さらなる例によれば、既知のレート歪み最適化変換、RDOT、では、予測残差が異なる基底関数で変換され、最良のものがレート歪み、R−D、性能に関して選択される。RDOTでは、各イントラ方向に対して、オフラインでトレーニングされたK対の異なる垂直および水平変換候補があり、イントラモードごとに全体的にK個の異なる変換パスを生成する。エンコーダは、すべての候補を試行し、最小R−Dコスト値で最適パスを選択する。変換インデックスは、ビットストリームにおいて明示的にシグナリングされる。MDDTと比較すると、RDOTはモードとデータ依存の両方を課すことによって変換をさらに洗練し、したがって、変換領域でより良いエネルギー圧縮が達成されることができる。RDOTは、各変換パスに対して、より多くの変換行列を提供することによってMDDTを拡張することができるが、エンコーダは、変換、量子化、エントロピーコーディング、逆量子化、逆変換および再構成を実行しなければならず、これはエンコーダに高い計算負荷をかける。
この制限を考慮すると、エンコーディングプロセスを協同で加速するために、いくつかの高速RDOTスキームもまた使用されてもよく、IEEE Trans.Circuits Syst.Video Technol.、第22巻、1号、第138〜151ページ、2012年1月号におけるX.Zhao、L.Zhang、S.MaおよびW.Gaoによる、「Video coding with rate−distortion optimized transform」を参照されたし。1つの方法は、不要なRDOTトレイルをスキップするためにDCTのコーディング結果を用いることである。具体的には、DCTはRDOTに先立って実装され、DCTによるR−Dコストが閾値より低い場合、RDOTが実行されるであろう。これは、最適なDCTおよびRDOTベースのコーディングモードが高度に相関するため、DCTがまた良好なコーディング性能を達成することができる場合にのみ、RDOTが実行されるであろうことを示す。他の方法は、輝度コーディングの高速化、LCS、技術をRDOTに適用することである。LCSでは、彩度のDCイントラ予測モードに対する輝度コーディング結果が残りのモードに対して復元される。
イメージコーディングにおける分離可能な方向性2−D DCTに着想を得たトレーニングベースの方法とは異なり、Direction−Adaptive Residual Transform、DART、という新しい構造がProc.IEEE Int.Conf.Image Process.(ICIP)、2010、第185−188ページのR.A.Cohen、S.Klomp、A.Vetro、およびH.Sunによる「Direction−adaptive transform for coding prediction residuals」において提案されている。DARTは、一次変換と二次変換を含む。DARTの一次変換ステージでは、異なる1−D変換が各方向において各指向性パスに沿って使用される。次いで、第1のステージによって生成されたDC係数のみが二次変換ステージにおいてDCTで処理される。いくつかの場合では、短いDCTパスが観察され、これがDCTの性能を制限しうる。この問題に対処するために、パスフォールディングが近隣スキャンからのピクセルを組み合わせることによって実行される。既存のKLTベースのmode dependent directional transformsと比較して、この方法は、トレーニングの実行が不要なため、より柔軟性がある。DART方式は、H.264/KTAソフトウェアに実装されており、MDDTと比較してより優れたコーディング性能が確認されている。
さらなる例によれば、残差変換コーディングの効率を高める他の方法は、enhanced multiple transform、EMT、とも呼ばれるadaptive multiple transform、AMT、を使用することである。Gary Sullivan、Gill Boyce、Jianle Chen、およびElena Alshinaによる「Future video coding:Joint Exploration Model 1(JEM1) for future video coding investigation」、ITU−T SG16 Q6、TD213(WP 3/16)を参照。High−Efficiency Video Coding、HEVC、で使用されているDCT−IIおよび4×4DST−VIIに加えて、AMTは、インターコーディングされたブロックおよびイントラコーディングされたブロック両方の残差コーディングに使用される。それは、HEVCにおける現在の変換以外のDCT/DSTファミリからの複数の選択された変換を利用する。新たに導入された変換行列は、DST−VII、DCT−VIII、DST−I、およびDCT−Vである。
図9は、ATMによる変換コーディングのシグナリングを示す。ATMは64×64未満のCUに適用され、ATMが適用されるか否かは、CU内のすべてのTUについてCUレベルで制御される。ATM対応CU内の各TUについて、使用される水平変換または垂直変換は、選択された変換セットに対するインデックスによってシグナリングされる。各変換セットは、上述の変換行列から2つの変換を選択することによって形成される。
図9に示すように、CUレベルでは、フラグemtCuFlagが使用されて2つの選択肢のうちの1つを選択する。第1の選択肢は、追加ビットを必要としない残差変換コーディングにDCT−II(DCT2_EMT)を適用することである。第2の選択肢は、図9のEMT変換として表される変換セットに含まれる変換の1つを適用することである。
第1の選択肢によれば、所与のCUに含まれるすべてのTUは、DCT−IIを使用して分解される。第2の選択肢によれば、シグナリングの2つの追加ビット−いわゆるemtTuIdx−が各TUに必要とされる。イントラコーディングでは、ルックアップテーブルが使用されて、イントラ予測モードを、2つの変換のみを含む変換セットにマッピングする。インターコーディングでは、{DCT−VIII、DST−VII}の変換セットが常に使用される。したがって、垂直および水平変換の選択をエンコードするには2ビットで十分である。上に列挙したすべてのビットは、コンテキストモデリングを用いるCABACを使用してエンコードされる。
イントラ予測残差の場合、変換セットはイントラ予測モードに基づいて予め定義され、したがって各イントラ予測モードはそれ自体の変換セットを有する。例えば、1つの変換セットは、{DCT−VIII、DST−VII}とすることができる。水平方向の変換のための変換セットは、同じイントラ予測モードの場合でも、垂直変換用の変換セットとは異なってもよいことに留意されたい。しかしながら、すべてのイントラ予測モードに対する異なる変換セットの総数ならびに新たに導入される変換の数は制限される。しかし、インター予測残差の場合、すべてのインターモードおよび水平変換および垂直変換の両方に対して1つの変換セットのみが使用される。
シグナリングがコーディング性能に著しく影響を与えうるため、複数の変換のうちの1つが選択されるべきである任意の変換手順の重要な側面はシグナリングである。HEVC/H.265では、変換タイプは、イントラ予測モードとブロックサイズを解析することによって検出されることができるため、シグナリングは必要とされない。同様に、MMDTは、方向性変換がイントラ予測モードに明白にマッピングされるため、いずれのシグナリングも必要としない。RDOTの場合、変換がレート歪み最適化、RDO、手順において選択され、追加の情報なしでは、すなわち、シグナリングなしではデコーダ側で検出されることができないため、シグナリングが必要とされる。AMTにもシグナリングが必要である。
Figure 0006595711
TUは数個のCGに分割されてもよく、各CGでは最初の非ゼロ量子化変換係数と最後の非ゼロ量子化変換係数の位置が指定される。最初の要素と最後の要素は順序付けられたセットに対してのみ決定されうるため、これらの位置は、特定のスキャン順序のコンテキスト内でのみ指定されうる。
サインデータ秘匿技術は、最後の非ゼロ量子化変換係数および最初の非ゼロ量子化変換係数によって境界が定められた間隔として規定された、所与の値または修正可能な係数のセット内の単一のサインフラグだけを秘匿することを前提とする。この手法は、すべての場合で有効となるわけではないため、所与のCG内で黙示的または明示的なサインコーディングを適用するか否かにかかわらず特別な決定が行われる。
サイン秘匿条件チェックの手順がデコーダ側にある。具体的には、この決定は、変換係数または修正可能な係数の数に基づいている。この数が閾値よりも大きい場合、第1の変換係数の第1のサインは、残差の和のパリティから推論される。それ以外の場合は、米国特許出願公開第20130272424A1号明細書から導き出すことができるように、係数のサインの通常の明示的なデコーディングが実行される。
欧州特許出願公開第2675159A1号明細書には、重複するサブセットを使用するマルチビット情報を秘匿する方法が開示されている。CG内の変換係数の初期セットは、部分的に重複するサブセットに分割され、その結果、重複する領域内の値を修正することによって、部分的に重複するサブセット両方の秘匿されたサインの値が制御されうる。第1のサインビットは、第1のサブセットを使用して決定されたパリティ値に基づいており、第2のサインビットは、第2のサブセットを使用して決定されたパリティ値に基づいている。第1のサブセットおよび第2のサブセットは、係数が両方のサブセットの一部であるという意味で重複する。
上述の欠点および問題を認識した上で、本発明は、最先端技術を改善することを目的とする。特に、本発明の目的は、ピクチャの改善されたコーディングおよびデコーディングのためのエンコーダ、デコーダ、エンコーディング方法およびデコーディング方法を提供することである。
本発明は、特に、エンコーディングおよびデコーディングにおける量子化された変換係数の使用を改善することを意図している。本発明はまた、シグナリングオーバーヘッドを低く維持するために、シグナリングメカニズムに関してエンコーディングおよびデコーディングを改善することも意図する。
本発明の上記の目的は、添付の独立請求項で提供される解決策によって達成される。本発明の有益な実装形態は、それぞれの従属請求項においてさらに規定される。
本発明の第1の態様は、量子化された変換係数を用いてソースピクチャを出力ビットストリームにエンコードするためのエンコーダを提供する。エンコーダは、ソースピクチャから、変換ブロックに位置する入力データを取得するように適合された取得手段を含む。エンコーダは、変換タイプのセットから選択された変換タイプに従って、入力データを変換係数に変換するように適合された変換手段を含む。エンコーダは、量子化された変換係数を生成するために変換係数を量子化するように適合された量子化手段を含む。エンコーダは、変換タイプのセット中の選択された変換タイプを識別するように適合されたインデックス情報を生成し、秘匿されることになる情報を決定するように適合された計算手段を含み、秘匿されることになる情報は少なくともインデックス情報の一部である計算手段を含む。エンコーダは、秘匿されることになる情報を量子化された変換係数中に秘匿するように適合された秘匿手段を含む。
それにより、選択された変換タイプに関する情報を秘匿すること、すなわち、変換タイプのセット中の選択された変換タイプを少なくとも部分的に識別するように適合された情報を秘匿することが提案される。計算手段は、出力ビットストリーム内のインデックス情報の明示的なシグナリングを追加する必要がなくてもよいという点で有益である。有益には、インデックス情報の明示的なシグナリングは、少なくとも低減されうる。出力ビットストリームのビットレートは、結果的に低減されうる。
第1の態様によるエンコーダの第1の実装形態では、秘匿されることになる情報は、インデックス情報であり、変換タイプのセットの中から選択された変換タイプは秘匿された情報に基づいて識別可能である。
それにより、選択された変換タイプを識別するように適合されたすべてのインデックス情報を秘匿することは、選択された変換タイプを識別するために他の情報が必要とされない点で有益である。次に、出力ビットストリーム内に追加の明示的なシグナリングは、必要ではない。
第1の態様によるエンコーダの第2の実装形態では、エンコーダはシグナリング手段を含む。秘匿されることになる情報は、インデックス情報の一部である。シグナリング手段は、出力ビットストリーム内に、インデックス情報の別の部分であるシグナリング情報を追加するように適合され、変換タイプのセットの中から選択された変換タイプが秘匿された情報とシグナリング情報とに基づいて識別可能である。
それにより、インデックス情報の一部のみからなる秘匿された情報は、選択された変換タイプを識別するために必要な明示的なシグナリングの量が低減されうるという点で有益である。換言すれば、選択された変換タイプを含むサブセットを識別するように適合された情報を秘匿することは有益である。出力ビットストリームは、例えば、量子化された変換係数内の秘匿された情報、ならびに明示的なシグナリングとして送信されるシグナリング情報を含んでもよく、シグナリング情報は、量子化された変換係数に加えて出力ビットストリームに加えられる。次に、秘匿された情報は、選択された変換タイプを含むサブセットの識別を可能にし、追加のシグナリング情報は、サブセット内の選択された変換タイプの識別を可能にする。シグナリング情報が、変換タイプのセット全体の中で選択された変換タイプを識別する必要はないため、シグナリング情報のサイズまたは量が低減されうる。
第1の態様によるエンコーダの第3の実装形態では、秘匿手段は、秘匿されることになる情報を秘匿条件に応じて量子化された変換係数中に秘匿するように適合される。
第1の態様によるエンコーダの第4の実装形態では、秘匿条件は、量子化された変換係数に依存するパラメータと閾値との比較を含む。秘匿手段は、秘匿条件をチェックし、秘匿条件が真である場合のみ、秘匿されることになる情報を量子化された変換係数中に秘匿するように適合される。
第1の態様によるエンコーダの第5の実装形態では、秘匿条件が偽である場合、シグナリング手段は、出力ビットストリーム内に、インデックス情報であるシグナリング情報を追加するように適合される。
第1の態様によるエンコーダの第6の実装形態では、エンコーダは、階層的に積層されたデータ構造に従ってソースピクチャを再帰的に分割するように適合された分割手段を含み、データ構造の1つの層が変換ブロックである。第1の代替案によると、秘匿手段は、秘匿されることになる情報の第1の部分をデータ構造の第1の層に秘匿し、秘匿されることになる情報の第2の部分を第1の層とは異なるデータ構造の第2の層に秘匿するように適合される。第2の代替案によると、秘匿されることになる情報は、インデックス情報の一部であり、秘匿手段は、秘匿されることになる情報をデータ構造の第1の層に秘匿するように適合され、シグナリング手段は、出力ビットストリーム内に、第1の層とは異なるデータ構造の第2の層におけるインデックス情報の別の部分であるシグナリング情報を追加するように適合される。
第1の態様によるエンコーダの第7の実装形態では、エンコーダは、階層的に積層されたデータ構造に従ってソースピクチャを再帰的に分割するように適合された分割手段を含み、データ構造の1つの層が変換ブロックである。分割手段は、変換ブロックを複数の係数グループに分割するように適合される。秘匿手段は、秘匿されることになる情報を複数の係数グループの少なくとも1つに位置する量子化された変換係数中に秘匿するように適合される。
第1の態様によるエンコーダの第8の実装形態では、計算手段は、チェック機能を量子化された変換係数に適用してチェック機能の結果を取得するように適合される。計算手段は、チェック機能の結果が秘匿されることになる情報に対応するか否かを判断するように適合される。チェック機能の結果が秘匿されることになる情報に対応しない場合、計算手段は、チェック機能の結果が秘匿されることになる情報に対応するように量子化された変換係数の少なくとも1つを修正するように適合される。
第1の態様によるエンコーダの第9の実装形態では、秘匿されることになる情報は、第1の値および第2の値を有するフラグを含む。第1の値は、変換タイプのセットのデフォルト変換タイプが選択された変換タイプであることを識別する。第2の値は、選択された変換タイプがデフォルト変換タイプのない変換タイプのセットにあるサブセットに含まれることを示す。
本発明の第2の態様は、逆変換された変換係数を用いて入力ビットストリームをデコードされたピクチャにデコードするためのデコーダを提供する。デコーダは、入力ビットストリームから、変換ブロックに位置する量子化された変換係数を取得するように適合された取得手段を含む。デコーダは、変換係数を生成するために量子化された変換係数を逆量子化するように適合された逆量子化手段を含む。デコーダは、量子化された変換係数から秘匿された情報を再構成するように適合された計算手段を含み、秘匿された情報は少なくともインデックス情報の一部である。デコーダは、インデックス情報によって変換タイプのセットの中から識別された変換タイプに従って、変換係数を逆変換された変換係数に逆変換するように適合された逆変換手段を含む。
第2の態様によるデコーダの第1の実装形態では、秘匿された情報は、インデックス情報であり、変換タイプは秘匿された情報に基づいて変換タイプのセットの中から識別される。
第2の態様によるデコーダの第2の実装形態では、デコーダは抽出手段を含む。秘匿された情報は、インデックス情報の一部である。抽出手段は、入力ビットストリームから、インデックス情報の別の部分であるシグナリング情報を抽出するように適合され、変換タイプは秘匿された情報とシグナリング情報とに基づいて変換タイプのセットの中から識別される。
第2の態様によるデコーダの第3の実装形態では、計算手段は、秘匿条件に応じて量子化された変換係数から秘匿された情報を再構成するように適合される。
第2の態様によるデコーダの第4の実装形態では、秘匿条件は、量子化された変換係数に依存するパラメータと閾値との比較を含む。計算手段は、秘匿条件をチェックし、秘匿条件が真である場合のみ、秘匿された情報を量子化された変換係数から再構成するように適合される。
第2の態様によるデコーダの第5の実装形態では、秘匿条件が偽である場合、抽出手段は、入力ビットストリームから、インデックス情報であるシグナリング情報を抽出するように適合される。
第2の態様によるデコーダの第6の実装形態では、デコーダは、階層的に積層されたデータ構造を逆分割することによってデコードされたピクチャを取得するように適合された逆分割手段を含み、データ構造の1つの層が変換ブロックである。第1の代替案によると、計算手段は、秘匿された情報の第1の部分をデータ構造の第1の層から再構成し、秘匿された情報の第2の部分を第1の層とは異なるデータ構造の第2の層から再構成するように適合される。第2の代替案によると、秘匿された情報は、インデックス情報の一部であり、計算手段は、秘匿された情報をデータ構造の第1の層から再構成するように適合され、抽出手段は、入力ビットストリームから、第1の層とは異なるデータ構造の第2の層におけるインデックス情報の別の部分であるシグナリング情報を抽出するように適合される。
第2の態様によるデコーダの第7の実装形態では、デコーダは、階層的に積層されたデータ構造を逆分割することによってデコードされたピクチャを取得するように適合された逆分割手段を含み、データ構造の1つの層が変換ブロックである。逆分割手段は、複数の係数グループを逆分割することによって変換ブロックを取得するように適合される。計算手段は、秘匿された情報を複数の係数グループの少なくとも1つに位置する量子化された変換係数から再構成するように適合される。
第2の態様によるデコーダの第8の実装形態では、計算手段は、チェック機能を量子化された変換係数に適用してチェック機能の結果を取得するように適合され、チェック機能の結果は、秘匿された情報に対応する。
第2の態様によるデコーダの第9の実装形態では、秘匿された情報は、第1の値および第2の値を有するフラグを含み、第1の値は、変換タイプのセットのデフォルト変換タイプが識別された変換タイプであることを識別し、第2の値は、識別された変換タイプがデフォルト変換タイプのない変換タイプのセットにあるサブセットに含まれることを示す。
第1の態様によるエンコーダの機能および第2の態様によるデコーダの機能およびそれらの実装形態のいずれかのいずれかの機能は、プロセッサまたはコンピュータによって実行されてもよく、それらの手段のいずれかは、そのようなプロセッサまたはコンピュータ内のソフトウェアおよび/またはハードウェアとして実装されてもよい。
本発明の第3の態様は、量子化された変換係数を用いてソースピクチャを出力ビットストリームにエンコードするための方法を提供する。本方法は、ソースピクチャから、変換ブロックに位置する入力データを取得するステップを含む。本方法は、変換タイプのセットから選択された変換タイプに従って、入力データを変換係数に変換するステップを含む。本方法は、量子化された変換係数を生成するために変換係数を量子化するステップを含む。本方法は、変換タイプのセット中の選択された変換タイプを識別するように適合されたインデックス情報を生成するステップを含む。本方法は、秘匿されることになる情報を決定するステップであって、秘匿されることになる情報は少なくともインデックス情報の一部であるステップを含む。本方法は、秘匿されることになる情報を量子化された変換係数中に秘匿するステップを含む。
本発明の第3の態様による量子化された変換係数を用いてソースピクチャを出力ビットストリームにエンコードするための方法のさらなる特徴または実装は、本発明の第1の態様およびその異なる実装形態によるエンコーダの機能を実行してもよい。
本発明の第4の態様は、逆変換された変換係数を用いて入力ビットストリームをデコードされたピクチャにデコードするための方法を提供する。本方法は、入力ビットストリームから、変換ブロックに位置する量子化された変換係数を取得するステップを含む。本方法は、変換係数を生成するために量子化された変換係数を逆量子化するステップを含む。本方法は、量子化された変換係数から秘匿された情報を再構成するステップであって、秘匿された情報は少なくともインデックス情報の一部であるステップを含む。本方法は、インデックス情報によって変換タイプのセットの中から識別された変換タイプに従って、変換係数を逆変換された変換係数に逆変換するステップを含む。
第3または第4の態様による方法またはそれらの実装形態のいずれかは、プロセッサまたはコンピュータによって実行されてもよい。
本発明の第4の態様による逆変換された変換係数を用いて入力ビットストリームをデコードされたピクチャにデコードするための方法のさらなる特徴または実装は、本発明の第2の態様およびその異なる実装形態によるデコーダの機能を実行してもよい。
本発明の第5の態様は、コンピュータプログラムであって、コンピュータプログラムがコンピューティングデバイス上で実行すると、本発明の第3の態様によるソースピクチャをエンコードするための方法または本発明の第4の態様による入力ビットストリームをデコードするための方法を実行するためのプログラムコードを有するコンピュータプログラムを提供する。
本発明の重要な態様は、デコーダ側で、何の逆変換が選択されるべきかについての完全なまたは部分的な情報が、チェック機能、例えば、パリティチェック機能を解析された、量子化された変換係数に適用することによって検索されることである。本発明は、選択された変換タイプのシグナリングに関する。具体的には、デコーダ側で、何の逆変換が選択されるべきかについての完全なまたは部分的な情報が、チェック機能、例えば、パリティチェック機能を解析された、量子化された変換係数、QTC、に適用することによって検索される。このタイプの黙示的シグナリングは、秘匿と呼ばれることがある。
本出願で説明されている全ての装置、要素、ユニットおよび手段は、ソフトウェアまたはハードウェア要素またはそれらの任意の種類の組合せで実施されてもよいことに留意されたい。本出願に記載された様々なエンティティによって実行されるすべてのステップ、ならびに様々なエンティティによって実行されるように記載された機能は、それぞれのエンティティがそれぞれのステップおよび機能を実行するように適合または構成されていることを意味するように意図されている。特定の実施形態の以下の説明において、外部エンティティによって完全に形成される特定の機能またはステップが、その特定のステップまたは機能を実行するエンティティの特定の詳細な要素の記載に反映されていない場合であっても、当業者であれば、これらの方法および機能は、それぞれのソフトウェアまたはハードウェア要素、またはそれらの任意の種類の組み合わせで実施することができることは明瞭であろう。
本発明の上記態様および実装施形態は、添付の図面に関連する特定の実施形態の以下の記載において説明される。
図1は、本発明の実施形態によるエンコーダを示す。 図2は、本発明の実施形態によるデコーダを示す。 図3は、本発明のさらなる実施形態によるエンコーダを示す。 図4は、本発明の実施形態によるデコーディング方法のフローチャートを示す。 図5は、本発明のさらなる実施形態によるデコーディング方法のフローチャートを示す。 図6は、本発明のさらなる実施形態によるデコーディング方法のフローチャートを示す。 図7は、本発明の実施形態によるソースピクチャをエンコードする方法を示す。 図8は、本発明のさらなる実施形態による入力ビットストリームをデコードする方法を示す。 図9は、従来例による変換コーディングのシグナリングを示す。
図1は、本発明の実施形態によるエンコーダ100を示し、具体的には、量子化された変換係数112を用いてソースピクチャ101を出力ビットストリーム114にエンコードするためのエンコーダ100を示す。
エンコーダ100は、ソースピクチャ101から、変換ブロックTUに位置する入力データを取得するように適合された取得手段102、104、106を含む。
エンコーダ100は、変換タイプのセットから選択された変換タイプに従って、入力データを変換係数110に変換するように適合された変換手段109を含む。
エンコーダ100は、量子化された変換係数112を生成するために変換係数110を量子化するように適合された量子化手段111を含む。
エンコーダ100は、変換タイプのセット中の選択された変換タイプを識別するように適合されたインデックス情報を生成し、秘匿されることになる情報を決定するように適合された計算手段を含み、秘匿されることになる情報は少なくともインデックス情報の一部である。
エンコーダ100は、秘匿されることになる情報を量子化された変換係数112中に秘匿するように適合された秘匿手段を含む。
図3は、本発明のさらなる実施形態によるエンコーダを示し、具体的には、量子化された変換係数308、313を用いてソースピクチャ301を出力ビットストリーム318にエンコードするためのエンコーダ300を示す。
エンコーダ300は、ソースピクチャ301から、変換ブロックTUに位置する入力データ303を取得するように適合された取得手段302を含む。
エンコーダ300は、変換タイプのセット305、310から選択された変換タイプに従って、入力データ303を変換係数306、311に変換するように適合された変換手段305、310を含む。
エンコーダ300は、量子化された変換係数308、313を生成するために変換係数306、311を量子化するように適合された量子化手段307、312を含む。
エンコーダ300は、変換タイプのセット305、310中の選択された変換タイプを識別するように適合されたインデックス情報を生成し、秘匿されることになる情報を決定するように適合された計算手段315を含み、秘匿されることになる情報は少なくともインデックス情報の一部である。
エンコーダ300は、秘匿されることになる情報を量子化された変換係数308、313中に秘匿するように適合された秘匿手段319を含む。
特に、ソースピクチャは、静止ピクチャまたはビデオのピクチャとしてもよい。
特に、エンコーダは、分割手段を含んでもよい。分割手段は、図1において参照符号102で示される。分割手段は、階層的に積層されたデータ構造に従ってソースピクチャ101を再帰的に分割するように適合されている。データ構造の1つの層が変換ブロックである。分割手段は、ソースピクチャ101の4分木分割を実行するように特に適合されてもよい。
階層的に積層されたデータ構造は、コーディングツリーユニット、CTU、コーディングユニット、CU、予測ユニット、PU、または変換ユニット、TUのうちの少なくとも1つを定義するさらなるレイヤを含んでもよい。CTUは、ピクチャの一部、例えば、64×64ピクセルを含む、事前定義されたサイズのビデオシーケンスのコーディング構造のルートである。CTUは、CUに分割されることができる。CUは、CTUに属するピクチャの一部を含む、事前定義されたサイズのビデオシーケンスの基本的なコーディング構造である。CUは、さらなるCUに分割されることができる。PUは、CUの分割の結果であるコーディング構造である。PUは、PUのピクセルに適用される処理のタイプに従って、イントラ予測またはインター予測されうる。PUは、複数のTUに分割されることができる、または、単一のTUと一致することができる。TUは、変換ブロックの一例である。
特に、取得手段102、104、106、302は、予測ブロックの残差データから変換ブロックの入力データ303を取得するように適合されてもよく、PUは予測ブロックの一例である。入力データ303は、残差データのサブ部分であってもよく、すなわち、変換ブロックTUは、予測ブロックPUのサブブロックであってもよい。したがって、エンコーダは、ビデオのソースピクチャ101をエンコードするように適合されてもよい。
図1において、残差データは、参照符号105、107に対応する。取得手段は、残差データ105、107を取得するためにソースピクチャ101のピクセルのデータ、すなわち予測ブロックに位置するピクセルのデータ、とピクセルに対する予測データとの間に差を構築するように適合された予測手段104、106を含む。予測手段は、好ましくは、イントラ予測モードおよびインター予測モードの両方をサポートし、それに対応してイントラ予測手段104とインター予測手段106とを含む。図1の参照符号103は、ソースピクチャ101がイントラ予測またはインター予測によって処理されてもよいという事実を示す。
特に、取得手段は、あるいは、例えば、階層的に積層化されたデータ構造の1つの層に従って、ソースピクチャ101のピクセルのデータである入力データ303を取得するように適合されてもよい。したがって、エンコーダは、予測ステージを含まず、静止ピクチャであるソースピクチャ101をエンコードするように適合されてもよい。
特に、エンコーダは、入力データ303を変換タイプのセット305、310に送信して、入力データに基づいていくつかの候補変換を実行するためのスイッチャ304を含んでもよい。入力データは、いくつかの並列配置された変換手段305、310によって処理されてもよく、各変換手段は、変換タイプの1つに従って入力データを変換するように適合される。変換タイプのセットは、N個の異なるタイプを含んでもよく、N個の変換タイプは図3において「変換1」および「変換N」として識別される。
各変換手段305、310は、変換係数306、311、ならびに変換係数306、311を得るために使用されるそれぞれの変換タイプを識別するインデックス情報309、314を生成する。変換係数306、311は、量子化された変換係数を得るために量子化手段307、312によって量子化される。
秘匿手段319は、量子化された変換係数308、313の中に秘匿されることになる情報を秘匿するように適合される。計算手段315は、量子化された変換係数308、313および最小レート歪み、RD、コストを提供する、関連するインデックス情報309、314を選択するように適合される。計算手段315は、それに対応して、選択された、量子化された変換係数316を出力し、そしてこの量子化された変換係数316は、好ましくはエントロピー手段317によってエントロピーコード化される。エントロピー手段は、図1において参照符号113によって識別される。
図1および3の実施形態の異なる特徴は、一緒に組み合わせられてもよい。
特に、秘匿手段319は、データ秘匿技術に従って、量子化された変換係数112、308、313に秘匿されることになる情報を秘匿するように適合される。
特に、秘匿手段319は、秘匿条件に応じて、量子化された変換係数112、308、313に、秘匿されることになる情報を秘匿するように適合される。秘匿条件は、量子化された変換係数112、308、313に依存するパラメータと閾値との比較を含んでもよく、秘匿手段319は、秘匿条件をチェックし、秘匿条件が真である場合にのみ、秘匿されることになる情報を量子化された変換係数112、308、313中に秘匿するように適合されてもよい。
秘匿条件は、量子化された変換係数112、308、313と閾値制約との比較とすることができる。例えば、秘匿条件は、以下の条件または他の既知の秘匿条件を含むことができる。
− 非ゼロ量子化変換係数、QTC、の数が閾値より大きい。この場合、TUまたはCG内に存在する非ゼロQTCの数がカウントされる。この数が閾値を超える場合、秘匿条件は真である。
− 閾値がQTCのスキャン中の有意QTCの位置間の最大差よりも小さい。この場合、TUまたはCGまたは複数のCGの、QTCは、スキャンパターンまたはスキャン順序に従ってスキャンされる。有意QTCは、スキャンされたQTCから選択され、有意QTCは、例えば、非ゼロ係数または所与の値を超える係数である。スキャンパターンまたはスキャン順序による有意QTCの位置間の差が計算される。この差が閾値を超える場合、秘匿条件は真である。
− TUのサイズが閾値より大きい。この場合、秘匿条件は、TUのサイズが閾値を超える場合、真である。
特に、計算手段315は、チェック機能の結果を得るために、チェック機能を量子化された変換係数112、308、313に適用し、チェック機能の結果が秘匿されることになる情報に対応するか否かを決定する、そうでない場合には、チェック機能の結果が秘匿されることになる情報に対応するように、量子化された変換係数112、308、313の少なくとも1つを変更するように適合されてもよい。
例えば、チェック機能は、以下の機能または他の既知のチェック機能のうちの1つとしてもよい。
− TUから選択された、いくつかのQTCの最下位ビットに適用されるバイナリパターンを用いたパリティチェック機能、および
− 最後の非ゼロQTCまたは最初の非ゼロQTCの位置インデックスまたは最後の非ゼロQTCおよび最初の非ゼロQTCの位置インデックスの1次結合に適用されるパリティチェック機能。
所与のQTCに適用されるそのようなパリティチェック機能は、所与のQTCのパリティ値をチェックすることにある。秘匿されることになる情報は、1ビットまたは数ビットを含むため、そのようなビットの1つは、所与のQTCのパリティ値によって秘匿されることができる。特に、所与のQTCのパリティ値が、秘匿されることになるビットのパリティと一致する場合、エンコーダにおいて追加の処理は必要とされない。これは、所与のQTCが、ビットストリーム内で未修正の形式でエンコードされることを意味する。一方、所与のQTCのパリティ値が秘匿されることになるビットのパリティと一致しない場合、エンコーダは、それらのパリティが秘匿されることになるビットのパリティと一致するように、所与のQTCを修正するように適合される。これは、例えば、パリティマッチングを得るように所与のQTCのうちの1つの値を修正することによって達成されてもよい。例えば、所与のQTCのうちの1つの最下位ビット、LSB、が修正されてもよい。
一般に、変換タイプに関する情報を秘匿するために、米国特許出願公開第20130272424A1号明細書によれば多重サインビットの秘匿に関して実行される、変換係数の非重複セット内への単一層データの秘匿、または欧州特許出願公開第2675159A1号明細書による変換係数の重複セット内への単一層データの秘匿、または2014年12月のマルタ共和国、バレッタでのIEEE Visual Communications and Image Processing Conference、第262−265ページのAlexey Filippov、Vasily Rufitskiy、およびVladimir Potapovによる「Scalar−quantization−based multi−layer data hiding for video coding applications」に従った階層構造のコーディングユニットへの多層データの秘匿などの異なる既知のメカニズムが使用され得る。
図2は、本発明の実施形態によるデコーダ200、具体的に、逆変換された変換係数を用いて入力ビットストリーム201をデコードされたピクチャ212にデコードするためのデコーダ200を示す。
デコーダは、入力ビットストリーム201から、変換ブロックTUに位置する量子化された変換係数を取得するように適合された取得手段202、204、206を含む。
デコーダは、変換係数210を生成するために量子化された変換係数を逆量子化するように適合された逆量子化手段209を含む。
デコーダは、量子化された変換係数から秘匿された情報を再構成するように適合された計算手段208を含み、秘匿情報はインデックス情報の少なくとも一部である。
デコーダは、インデックス情報を用いて変換タイプのセットの中から識別された変換タイプに従って、変換係数210を逆変換された変換係数212に逆変換するように適合された逆変換手段211を含む。
図2のデコーダ200は、取得手段が入力ビットストリームを処理するためのエントロピーデコーディング手段202を含むという点で、図1のエンコーダ100の対応部分である。それはまた、イントラ予測モードおよびインター予測モードのそれぞれについての予測手段204、206を含み、参照符号203は、イントラ予測およびインター予測との間の選択を示す。予測手段204、206のそれぞれの出力205、207は、逆量子化手段209によって処理される。
図4は、本発明の実施形態によるデコーディング方法のフローチャートを示す。
この実施形態は、デコーダ側で選択された変換タイプを明示的に示すビットストリームシンタックス内の専用シグナリングフラグemtCuFlagおよびemtTuIdxを用いた既知の拡張多重変換、EMT、技術−例えば、ITU−T SG16 Q6、TD 213(WP 3/16)のGary Sullivan、Gill Boyce、Jianle Chen、Elena Alshinaによる「Future video coding:Joint Exploration Model 1(JEM1) for turure video coding investigation」で説明されている−に依存している。
ここで、図14の実施形態では、emtCuFlagがCUレベルまたはPUレベルで明示的にコード化され、emtTuFlagが本発明のエンコーディング方式に従ってQTC内でTUレベルで黙示的にコード化される。言い換えれば、emtTuFlagは、エンコーダによってQTC内に秘匿される情報およびデコーダによってQTCから再構築される情報である。
本方法の開始401の後、emtCuFlagは入力ビットストリームから解析される。次に、emtCuFlagの値がチェックされる403。このemtCuFlagが偽である場合、第1の変換タイプ、例えば、DCT−IIは、CUレベルまたはPUレベルで適用される、すなわち、逆変換手段211は、emtCuFlagを含むCUまたはPUの各TUについて、この第1の変換タイプに従って逆変換を適用する。この第1の変換タイプは、例えば、デフォルトの変換タイプである。このemtCuFlagが真である場合、さらなる変換タイプが逆変換手段211によって使用される。この場合、異なる変換タイプが所与のCUまたはPUのすべてのTUに対して使用可能になる。この実施形態およびすべてのさらなる実施形態において、emtCuFlagは必須ではない。
emtCuFlagフラグが真に設定されている場合、さらなる処理はTUに対してループ内で実行される。ループで処理される現在のTUのインデックスは、「idx」と呼ばれ、0からN−1までスキャンされ、Nは処理されているCUまたはPUにおけるTUの数である。初期化ステップ405では、各TUインデックスについての変換インデックスemtTuIdx(idx)がゼロに設定される。TUループは、秘匿されたフラグが現在処理されているTUのQTCに存在するか否かを示す秘匿条件チェック410で開始する。
秘匿条件410が偽である場合、処理されたTU(emtTuFlag)に対する変換の選択を可能にするフラグの値は、ビットストリームから解析される412。そうでない場合、このフラグの値は、チェック機能を適用することによってQTCから再構築されるか、または導出される411。
したがって、計算手段208は、チェック機能の結果を得るためにQTCにチェック機能を適用し、チェック機能の結果は秘匿された情報に対応するように適合される。この秘匿された情報は、そのまま、選択または識別されることになる変換タイプのインデックスであり得る。
あるいは、図4に示すように、この秘匿された情報「emtTuFlag(idx)= checkFunc()」は、emtTuFlag値が真である場合420、次のステップは水平変換タイプおよび垂直変換タイプを示すビットストリームからの変換タイプインデックスemtTuIdxを解析する422というように選択された変換タイプを識別するように適合される。そうでない場合、emtTuFlag値が偽である場合420、emtTuIdxをゼロに割り当てることによって、デフォルト変換タイプが選択される。
別の実施形態は、図4を参照して説明したのと同じ処理ステップを含むが、秘匿条件410が偽である場合、emtTuFlag値は偽に設定されるという違いがある。特に、次に、デフォルト変換タイプがemtTuIdxをゼロに割り当てることによって選択される。
図5は、本発明のさらなる実施形態によるデコーディング方法のフローチャートを示す。
この実施形態は、図4の実施形態に関して、異なるデフォルト変換を有し、変換の各々は、垂直方向および水平方向の両方に適用され、2つの場合、すなわち、
− 秘匿条件は偽である場合、
− 秘匿条件は真であるが、emtTuIdxはゼロである場合
に応じてそれぞれ選択される。
例えば、秘匿条件510が偽である場合、emtTuIdxは−1であり、DCT2が水平方向および垂直方向の両方に適用される513。他方のケースでは、秘匿条件510が真であるが、emtTuFlagがゼロである場合、DST2が水平方向および垂直方向の両方に適用される523。図5の残りのステップは、図4のステップに対応する。
図6は、本発明のさらなる実施形態によるデコーディング方法のフローチャートを示す。
この実施形態では、追加の条件チェックが導入される。この実施形態の背後にある考え方は、エンコーディングおよびデコーディング中にTUが同じ順序で処理されているという事実に依存している。処理順序内で連続処理された、いくつかのTUがデフォルトの変換タイプを有すると示されている場合、残りのTUは同じデフォルト変換タイプを有するものとみなされ、残りのTUについてのシグナリングは無効にされ、したがってオーバーヘッドを減少する。TUレベルのシグナリングを無効にすることができるこれらの連続的に処理されたTUの数は、閾値TZCによって規定される。
図4の実施形態に対する図6の実施形態の変形例を以下に詳述する。ステップ605において、emtTuFlagがゼロである連続的に処理されたTUの現在の数を保持するカウンタ変数「zero_counter」が「0」に初期化される。ステップ606において、「zero_counter」値が閾値TZCと比較される。「zero_counter」が閾値TZC以上である場合、残りのTUは同じデフォルト変換タイプを有するものとみなされ、emtTuIdxは「0」に設定される607。そうでない場合、図1の参照符号410に対応する秘匿条件チェック610が実行される。図6のフローチャートからわかるように、「zero_counter」とTZCとの比較の結果は、所与のCUまたはPUにおける残りのTUの処理を制御する。図4とは別の変更は、TUが非ゼロのemtTuFlagを有する場合、「zero_counter」がゼロにリセットされる621ことである。そうでない場合、TUがゼロemtTuFlagを有する場合、「zero_counter」がインクリメントされる624。
図5および図6の実施形態が組み合わされてもよい。
別の実施形態では、emtCUFlagは除去されてもよい。変換のためにそのようなCUレベルのフラグを除去することによってもたらされる最も重要な利点は、2つの異なるバリアントのRDコストが考慮されるべき場合に、すなわちフラグの値が0および1の場合にダブルパス方式を避けることによって計算の複雑性を減少し得る可能性にある。一方、CUレベルのフラグの存在は、ある変換が他の変換よりもはるかに頻繁にCUで選択される場合には、シグナリングコストを最小限に抑えることができる。したがって、それぞれの最適化目標、すなわち、複雑性を減少させる、またはコーディング利得を増加させるという目標のいずれに対しても、両方のオプションを使用することができる。
本発明は、DCT−II(DCT2_EMT)を含むすべての変換がTUレベルで利用可能であるときにシグナリングオーバヘッドを減少させる上述の問題を解決する。これは、DCT−II(または予測モード、予測ブロックのサイズなどに影響される他の変換)が使用されるか否かをシグナリングするためにデータ秘匿を用いることによって達成される。マルチメディアコーディングの実施形態における本発明は、以下の利点を提供する。
− それは、次世代ビデオコーディング標準の基盤となるJEMと互換性のあるハイブリッドビデオコーディングフレームワークにおける多くの潜在的なアプリケーションに使用されることができる。
− それは、CABACを用いてこのフラグをエンコードするのと比較して、JEM1と比べて低減されたBDレートと主観的な品質改善をもたらす。
− 各TUは、CUレベルの決定なしに個別に処理されることができる。
− emtCuFlagのような冗長なシグナリング(シンタックス)が避けられることができる。
図7は、本発明の実施形態による量子化された変換係数112を用いてソースピクチャ101を出力ビットストリーム114にエンコードする方法700を示す。
本方法は、変換ブロックTUに位置する入力データ303をソースピクチャ101、301から取得するステップ701を含む。
本方法は、変換タイプのセット305、310から選択された変換タイプに従って、入力データ303を変換係数110、306、311に変換するステップ702を含む。
本方法は、量子化された変換係数112、308、313を生成するために変換係数110、306、311を量子化するステップ703を含む。
本方法は、変換タイプのセット305、310の中から選択された変換タイプを識別するように適合されたインデックス情報を生成するステップ704を含む。
本方法は、秘匿されることになる情報を決定するステップ705を含み、秘匿されることになる情報はインデックス情報の少なくとも一部である。
本方法は、量子化された変換係数112、308、313に秘匿されることになる情報を秘匿するステップ706を含む。
図8は、本発明のさらなる実施形態による、逆変換された変換係数を用いて入力ビットストリーム201をデコードされたピクチャ212にデコードするための方法800を示す。
本方法は、入力ビットストリーム201から、変換ブロックTUに位置する量子化された変換係数を取得するステップ801を含む。
本方法は、変換係数210を生成するために量子化された変換係数を逆量子化するステップ802を含む。
本方法は、量子化された変換係数から秘匿された情報を再構成するステップ803を含み、秘匿された情報はインデックス情報の少なくとも一部である。
本方法は、インデックス情報を用いて変換タイプのセットの中から識別された変換タイプに従って、変換係数210を逆変換された変換係数212に逆変換するステップ804を含む。
本発明は、様々な実施形態に関連して実施例ならびに実装例として説明されてきた。しかしながら、他の変形は、図面、本開示および独立請求項の調査により、当業者によって理解され、特許請求の範囲に記載の発明を実施することによって達成することができるものである。特許請求の範囲および明細書の記載において、「含む」という語は他の要素またはステップを排除するものではなく、不定冠詞「a」または「an」は複数を排除するものではない。単一の要素または他のユニットは、請求項に記載されたいくつかのエンティティまたは項目の機能を達成し得る。特定の手段が相互に異なる従属請求項に記載されているという単なる事実は、これらの手段の組合せが有益な実装例では使用できないことを示唆するものではない。

Claims (17)

  1. 量子化された変換係数(112、308、313)を用いてソースピクチャ(101、
    301)を出力ビットストリーム(114、318)にエンコードするためのエンコーダ
    (100、300)であって、
    前記ソースピクチャ(101、301)から、変換ブロック(TU)に位置する入力デ
    ータ(303)を取得するように適合された取得手段(102、104、106、302
    )と、
    変換タイプのセット(305、310)から選択された変換タイプに従って、前記入力
    データ(303)を変換係数(110、306、311)に変換するように適合された変
    換手段(109、305、310)と、
    前記量子化された変換係数(112、308、313)を生成するために前記変換係数
    (110、306、311)を量子化するように適合された量子化手段(111、307
    、312)と、
    前記変換タイプのセット(305、310)中の前記選択された変換タイプを識別する
    ように適合されたインデックス情報を生成し、秘匿されることになる情報を決定するよう
    に適合された計算手段(315)と
    前記秘匿されることになる情報を前記量子化された変換係数(112、308、313
    )中に秘匿するように適合された秘匿手段(319)であって、前記秘匿されることになる情報は前記インデックス情報の一部である秘匿手段(319)と、
    前記出力ビットストリーム(114、318)内に、前記インデックス情報の別の部分であるシグナリング情報を追加するように適合されたシグナリング手段(320)であって、前記変換タイプのセット(305、310)の中から選択された前記変換タイプが前記秘匿された情報と前記シグナリング情報とに基づいて識別可能であるシグナリング手段(320)と、
    を含むエンコーダ。
  2. 秘匿条件は、前記量子化された変換係数(112、308、313)に依存するパラメータと閾値との比較を含み、
    前記インデックス情報の他の部分(emtCUFlag)が削除された状態で、
    前記比較の結果は、階層的に階層化されたデータ構造CUまたはPU内の残りのTUの処理を制御するために使用されることを特徴とする請求項1に記載のエンコーダ。
  3. 前記秘匿手段(319)は、前記秘匿されることになる情報を秘匿条件に応じて前記量
    子化された変換係数(112、308、313)中に秘匿するように適合され、
    前記秘匿条件は、前記量子化された変換係数(112、308、313)に依存するパ
    ラメータと閾値との比較を含み、
    前記秘匿手段(319)は、前記秘匿条件をチェックし、前記秘匿条件が真である場合
    のみ、前記秘匿されることになる情報を前記量子化された変換係数(112、308、3
    13)中に秘匿するように適合され、
    前記秘匿条件が偽である場合、シグナリング手段(320)は、前記出力ビットストリ
    ーム(114、318)内に、前記インデックス情報であるシグナリング情報を追加する
    ように適合される、ことを特徴とする請求項1に記載のエンコーダ。
  4. 逆変換された変換係数を用いて入力ビットストリーム(201)をデコードされたピク
    チャ(212)にデコードするためのデコーダ(200)であって、
    前記入力ビットストリーム(201)から、変換ブロック(TU)に位置する量子化さ
    れた変換係数を取得するように適合された取得手段(202、204、206)と、
    変換係数(210)を生成するために前記量子化された変換係数を逆量子化するように
    適合された逆量子化手段(209)と、
    前記量子化された変換係数から秘匿された情報を再構成するように適合された計算手段
    (208)であって、前記秘匿された情報はインデックス情報の一部である計算手段(208)と、
    前記インデックス情報によって変換タイプのセットの中から識別された変換タイプに従
    って、前記変換係数(210)を前記逆変換された変換係数(212)に逆変換するよう
    に適合された逆変換手段(211)と
    前記入力ビットストリーム(201)から、前記インデックス情報の別の部分であるシグナリング情報を抽出するように適合された抽出手段であって、前記変換タイプは前記秘匿された情報と前記シグナリング情報とに基づいて前記変換タイプのセットの中から識別される抽出手段と、
    を含むデコーダ。
  5. 秘匿条件は、前記量子化された変換係数に依存するパラメータと閾値との比較を含み、
    インデックス情報の他の部分(emtCUFlag)が削除された状態で、
    前記比較の結果は、階層的に階層化されたデータ構造CUまたはPU内の残りのTUの処理を制御するために使用されることを特徴とする請項4に記載のデコーダ。
  6. 前記計算手段(208)は、秘匿条件に応じて前記量子化された変換係数から前記秘匿された情報を再構成するように適合されることを特徴とする請求項4に記載のデコーダ。
  7. 前記秘匿条件は、前記量子化された変換係数に依存するパラメータと閾値との比較を含
    み、
    前記計算手段(208)は、前記秘匿条件をチェックし、前記秘匿条件が真である場合
    のみ、前記秘匿された情報を前記量子化された変換係数から再構成するように適合される
    ことを特徴とする請求項に記載のデコーダ。
  8. 前記秘匿条件が偽である場合、抽出手段は、前記入力ビットストリーム(201)から
    、前記インデックス情報であるシグナリング情報を抽出するように適合されることを特徴
    とする請求項に記載のデコーダ。
  9. 階層的に積層されたデータ構造(CU、PU、TU、CG)を逆分割することによって
    前記デコードされたピクチャ(212)を取得するように適合された逆分割手段を含み、
    前記データ構造の1つの層が前記変換ブロック(TU)であり、
    前記計算手段(208)は、前記秘匿された情報の第1の部分を前記データ構造(CU
    、PU、TU、CG)の第1の層から再構成し、前記秘匿された情報の第2の部分を前記
    第1の層とは異なる前記データ構造(CU、PU、TU、CG)の第2の層から再構成す
    るように適合され、または
    前記秘匿された情報は、前記インデックス情報の一部(emtTuFlag)であり、
    前記計算手段(208)は、前記秘匿された情報を前記データ構造(CU、PU、TU、
    CG)の第1の層から再構成するように適合され、抽出手段は、前記入力ビットストリー
    ム(201)から、前記第1の層とは異なる前記データ構造(CU、PU、TU、CG)
    の第2の層における前記インデックス情報の別の部分(emtCuFlag、emtTu
    Idx)であるシグナリング情報を抽出するように適合されることを特徴とする請求項4〜8のいずれかに記載のデコーダ。
  10. 階層的に積層されたデータ構造(CU、PU、TU、CG)を逆分割することによって
    前記デコードされたピクチャ(212)を取得するように適合された逆分割手段を含み、
    前記データ構造の1つの層が前記変換ブロック(TU)であり、
    前記逆分割手段は、複数の係数グループ(CG)を逆分割することによって前記変換ブ
    ロック(TU)を取得するように適合され、
    前記計算手段(208)は、前記秘匿された情報を前記複数の係数グループ(CG)の
    少なくとも1つに位置する前記量子化された変換係数から再構成するように適合されるこ
    とを特徴とする請求項4〜9のいずれかに記載のデコーダ。
  11. 前記計算手段(208)は、
    チェック機能を前記量子化された変換係数に適用して前記チェック機能の結果を取得し

    前記チェック機能の結果は、前記秘匿された情報に対応することを特徴とする請求項4〜10のいずれかに記載のデコーダ。
  12. 前記秘匿された情報は、第1の値および第2の値を有するフラグ(emtTuFlag
    )を含み、
    前記第1の値は、変換タイプのセットのデフォルト変換タイプが前記識別された変換タイプであることを識別し、
    前記第2の値は、前記識別された変換タイプが前記デフォルト変換タイプのない前記変
    換タイプのセットにあるサブセットに含まれることを示すことを特徴とする請求項4〜11のいずれかに記載のデコーダ。
  13. 逆変換された変換係数を用いて入力ビットストリーム(201)をデコードされたピク
    チャ(212)にデコードするための方法(800)であって、
    前記入力ビットストリーム(201)から、変換ブロック(TU)に位置する量子化さ
    れた変換係数を取得するステップ(801)と、
    変換係数(210)を生成するために前記量子化された変換係数を逆量子化するステッ
    プ(802)と、
    前記量子化された変換係数から秘匿された情報を再構成するステップであって、前記秘
    匿された情報はインデックス情報の一部であるステップ(803)と、
    前記インデックス情報によって変換タイプのセットの中から識別された変換タイプに従
    って、前記変換係数(210)を前記逆変換された変換係数(212)に逆変換するステ
    ップ(804)と、
    前記入力ビットストリームから、前記インデックス情報の別の部分であるシグナリング情報を抽出するステップであって、前記変換タイプは前記秘匿された情報と前記シグナリング情報とに基づいて変換タイプのセットの中から識別される、抽出するステップと、
    を含む方法。
  14. 秘匿条件に応じて前記量子化された変換係数から前記秘匿された情報を再構成するステップをさらに有し、前記秘匿条件は、閾値に対する前記量子化された変換係数に応じたパラメータとの比較を含むことを特徴とする請求項13に記載の方法(800)。
  15. 前記方法は、チェック機能を前記量子化された変換係数に適用して前記チェック機能の結果を取得するステップであって、前記チェック機能の結果は前記秘匿された情報に対応するステップを含むことを特徴とする請求項13または請求項14に記載の方法(800)。
  16. 前記チェック機能は、バイナリパターンを使用してTUから選択されたいくつかの量子化された変換係数の最下位ビットに適用されるパリティチェック機能であることを特徴とする請求項15に記載の方法(800)。
  17. 前記チェック機能は、最後または最初の非ゼロの量子化された変換係数の位置インデックス、または前記最後と最初の非ゼロの量子化された変換係数位置インデックスの線形結合に適用されるパリティチェック機能であることを特徴とする請求項15に記載の方法(800)。
JP2018518741A 2015-12-23 2015-12-23 階層的分割内でのブロックレベルの変換選択および黙示的シグナリングを伴う変換コーディングのための方法および装置 Active JP6595711B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/RU2015/000921 WO2017111648A1 (en) 2015-12-23 2015-12-23 Method and apparatus for transform coding with block-level transform selection and implicit signaling within hierarchical partitioning

Publications (2)

Publication Number Publication Date
JP2018530970A JP2018530970A (ja) 2018-10-18
JP6595711B2 true JP6595711B2 (ja) 2019-10-23

Family

ID=56464267

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018518741A Active JP6595711B2 (ja) 2015-12-23 2015-12-23 階層的分割内でのブロックレベルの変換選択および黙示的シグナリングを伴う変換コーディングのための方法および装置

Country Status (10)

Country Link
US (1) US20180262777A1 (ja)
EP (1) EP3335422B1 (ja)
JP (1) JP6595711B2 (ja)
KR (1) KR102143908B1 (ja)
CN (1) CN107925763B (ja)
AU (1) AU2015417837B2 (ja)
CA (1) CA2998468C (ja)
MY (1) MY188166A (ja)
RU (1) RU2682838C1 (ja)
WO (1) WO2017111648A1 (ja)

Families Citing this family (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017142319A1 (ko) * 2016-02-16 2017-08-24 삼성전자 주식회사 영상 부호화 방법 및 장치와 영상 복호화 방법 및 장치
US10972733B2 (en) * 2016-07-15 2021-04-06 Qualcomm Incorporated Look-up table for enhanced multiple transform
US10728548B2 (en) 2017-04-04 2020-07-28 Futurewei Technologies, Inc. Processing reference samples used for intra-prediction of a picture block
US10750181B2 (en) * 2017-05-11 2020-08-18 Mediatek Inc. Method and apparatus of adaptive multiple transforms for video coding
WO2019188466A1 (ja) * 2018-03-30 2019-10-03 ソニー株式会社 画像処理装置および方法
US10986340B2 (en) * 2018-06-01 2021-04-20 Qualcomm Incorporated Coding adaptive multiple transform information for video coding
US10666981B2 (en) * 2018-06-29 2020-05-26 Tencent America LLC Method, apparatus and medium for decoding or encoding
US10687081B2 (en) 2018-06-29 2020-06-16 Tencent America LLC Method, apparatus and medium for decoding or encoding
KR102662646B1 (ko) * 2018-07-02 2024-05-03 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 종속 스칼라 양자화에 적합한 변환 계수의 엔트로피 코딩
US11259052B2 (en) * 2018-07-16 2022-02-22 Qualcomm Incorporated Transform variations of multiple separable transform selection
EP3723376A4 (en) * 2018-09-02 2021-01-27 LG Electronics Inc. VIDEO SIGNAL CODING / DECODING PROCESS AND DEVICE FOR THE SAME
EP3854081A4 (en) * 2018-09-20 2022-07-06 Nokia Technologies Oy METHOD AND APPARATUS FOR CODING AND DECODING DIGITAL IMAGE/VIDEO MATERIAL
WO2020073882A1 (en) * 2018-10-08 2020-04-16 Huawei Technologies Co., Ltd. Video decoder and corresponding methods
US10893286B2 (en) * 2018-10-09 2021-01-12 Tencent America LLC Methods and apparatus for low-complexity MTS
US11323748B2 (en) 2018-12-19 2022-05-03 Qualcomm Incorporated Tree-based transform unit (TU) partition for video coding
KR20220027281A (ko) * 2018-12-21 2022-03-07 삼성전자주식회사 영상 부호화 방법 및 장치, 영상 복호화 방법 및 장치
US11363306B2 (en) * 2019-04-05 2022-06-14 Comcast Cable Communications, Llc Methods, systems, and apparatuses for processing video by adaptive rate distortion optimization
CN110072109B (zh) * 2019-04-25 2021-04-09 四川大学 宏块级最小化失真的h.264/avc视频信息隐藏方法
WO2020244661A1 (en) * 2019-06-06 2020-12-10 Beijing Bytedance Network Technology Co., Ltd. Implicit selection of transform candidates
JP6912522B2 (ja) * 2019-06-24 2021-08-04 Kddi株式会社 画像復号装置、画像復号方法及びプログラム
EP4008109A4 (en) 2019-09-02 2022-09-14 Beijing Bytedance Network Technology Co., Ltd. ENCODING MODE DETERMINATION BASED ON COLOR FORMAT
KR102302755B1 (ko) * 2019-12-30 2021-09-16 재단법인 경주스마트미디어센터 Drm 콘텐츠 병렬 패키징 장치 및 이를 포함하는 drm 콘텐츠 병렬 패키징 시스템 및 drm 콘텐츠 병렬 패키징 방법
WO2021137633A2 (ko) * 2019-12-30 2021-07-08 재단법인 경주스마트미디어센터 Drm 콘텐츠 병렬 패키징 장치 및 이를 포함하는 drm 콘텐츠 병렬 패키징 시스템 및 drm 콘텐츠 병렬 패키징 방법
EP4087253A4 (en) * 2019-12-30 2023-01-25 Guangdong Oppo Mobile Telecommunications Corp., Ltd. TRANSFORMATION PROCESS, ENCODER, DECODER, AND STORAGE MEDIA
CN114079772B (zh) * 2020-08-21 2023-04-07 腾讯科技(深圳)有限公司 视频解码方法、装置、计算机可读介质及电子设备
CN113824957B (zh) * 2020-09-27 2022-10-28 腾讯科技(深圳)有限公司 视频编解码方法、装置及电子设备
CN112533000B (zh) * 2020-10-16 2022-08-05 腾讯科技(深圳)有限公司 视频解码方法、装置、计算机可读介质及电子设备

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1022678B1 (en) * 1999-01-25 2011-03-23 Nippon Telegraph And Telephone Corporation Method, apparatus and program storage medium for embedding and detecting a digital watermark
JP2005536800A (ja) * 2002-08-21 2005-12-02 トムソン ライセンシング ユーザ装置におけるデジタルデータへの電子透かし入れ
JP4124366B2 (ja) * 2004-09-17 2008-07-23 大日本印刷株式会社 電子透かしの埋め込み方法および抽出方法
US8149451B2 (en) * 2007-07-18 2012-04-03 Ricoh Company, Ltd. Information processing device, information embedding method, and program
KR101571573B1 (ko) * 2007-09-28 2015-11-24 돌비 레버러토리즈 라이쎈싱 코오포레이션 부가적인 정보 역량을 이용한 멀티미디어 코딩 및 디코딩
KR20220041931A (ko) * 2009-01-27 2022-04-01 인터디지털 매디슨 페턴트 홀딩스 에스에이에스 비디오 인코딩 및 디코딩에서 변환 선택을 위한 방법 및 장치
JP2011049740A (ja) * 2009-08-26 2011-03-10 Sony Corp 画像処理装置および方法
CN102223540B (zh) * 2011-07-01 2012-12-05 宁波大学 一种面向h.264/avc视频的信息隐藏方法
US9313498B2 (en) 2012-04-16 2016-04-12 Qualcomm Incorporated Sign hiding techniques for quantized transform coefficients in video coding
EP2675159B1 (en) 2012-06-15 2018-08-08 BlackBerry Limited Multi-bit information hiding using overlapping subsets
CN104885453B (zh) * 2012-11-29 2018-11-02 Lg 电子株式会社 支持多个层的用于编码/解码图像的方法和设备
US20140286412A1 (en) * 2013-03-25 2014-09-25 Qualcomm Incorporated Intra dc prediction for lossless coding in video coding
CN104683811B (zh) * 2013-11-29 2017-12-29 中国科学院声学研究所 一种基于整数dct系数调制的信息隐藏及提取方法
EP3146720B1 (en) * 2014-04-01 2020-09-30 Huawei Technologies Co., Ltd. Methods and apparatus for data hiding in multi-layer structured coding units
US9208534B2 (en) * 2014-05-07 2015-12-08 Cisco Technology Inc. System and method for embedding data

Also Published As

Publication number Publication date
AU2015417837A1 (en) 2018-03-22
BR112018008131A2 (pt) 2018-11-06
CA2998468C (en) 2021-02-16
CN107925763B (zh) 2020-01-10
US20180262777A1 (en) 2018-09-13
EP3335422A1 (en) 2018-06-20
EP3335422B1 (en) 2021-12-01
AU2015417837B2 (en) 2019-07-18
WO2017111648A1 (en) 2017-06-29
CA2998468A1 (en) 2017-06-29
KR20180048809A (ko) 2018-05-10
CN107925763A (zh) 2018-04-17
JP2018530970A (ja) 2018-10-18
KR102143908B1 (ko) 2020-08-28
RU2682838C1 (ru) 2019-03-21
MY188166A (en) 2021-11-24

Similar Documents

Publication Publication Date Title
JP6595711B2 (ja) 階層的分割内でのブロックレベルの変換選択および黙示的シグナリングを伴う変換コーディングのための方法および装置
Zhao et al. Joint separable and non-separable transforms for next-generation video coding
CN108293113B (zh) 图像编码系统中的基于建模的图像解码方法和设备
JP2021513755A (ja) 変換スキップフラグを利用した映像コーディング方法及び装置
EP3520405A1 (en) Transform selection for video coding
KR102645498B1 (ko) 단일-레벨 변환 분할 및 적응형 서브-블록 변환
CN111819853A (zh) 变换域中预测的信令残差符号
AU2013228045A1 (en) Method, apparatus and system for encoding and decoding video data
CN108605132B (zh) 选择扫描顺序的方法和装置
US20110243220A1 (en) Method and apparatus for encoding and decoding image and method and apparatus for decoding image using adaptive coefficient scan order
JP7214894B2 (ja) イントラ予測ベースの映像コーディングにおける変換
CN111448798A (zh) 基于块形状的视频编码和解码的方法和装置
KR20210134555A (ko) 인트라 예측 기반의 영상 부호화 또는 복호화 장치 및 방법
KR20220077931A (ko) 컨텍스트 적응 변환 세트
WO2010042875A2 (en) Reduced dc gain mismatch and dc leakage in overlap transform processing
CN108605133B (zh) 选择扫描顺序的方法和装置
KR20230109772A (ko) 비디오 코딩 시스템에서 인터 예측 방법 및 장치
US10893274B2 (en) Method for processing video signal on basis of arbitrary partition transform
RU2812248C2 (ru) Способ кодирования изображения на основе преобразования и устройство для его осуществления
RU2806283C2 (ru) Способ кодирования изображения на основе преобразования и устройство для его осуществления
KR20220165273A (ko) 변환에 기반한 영상 코딩 방법 및 그 장치
CN115349258A (zh) 图像编码系统中用于残差编码的图像解码方法及其设备
BR112018008131B1 (pt) Codificador para codificação de uma imagem de fonte, e decodificador e método para decodificar um fluxo de bits de entrada

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20180411

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20180411

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20181207

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20190514

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190814

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20190903

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20190926

R150 Certificate of patent or registration of utility model

Ref document number: 6595711

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250