JP2017501659A - 予測された信号と変換コーディングされた信号とを用いたビデオ信号の予測方法及び装置 - Google Patents

予測された信号と変換コーディングされた信号とを用いたビデオ信号の予測方法及び装置 Download PDF

Info

Publication number
JP2017501659A
JP2017501659A JP2016560329A JP2016560329A JP2017501659A JP 2017501659 A JP2017501659 A JP 2017501659A JP 2016560329 A JP2016560329 A JP 2016560329A JP 2016560329 A JP2016560329 A JP 2016560329A JP 2017501659 A JP2017501659 A JP 2017501659A
Authority
JP
Japan
Prior art keywords
signal
transform
video signal
prediction
quantization
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2016560329A
Other languages
English (en)
Other versions
JP6730191B2 (ja
Inventor
ゴーネン グルリュズ オヌール
ゴーネン グルリュズ オヌール
セッド アミール
セッド アミール
ソフン イェ
ソフン イェ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
LG Electronics Inc
Original Assignee
LG Electronics Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by LG Electronics Inc filed Critical LG Electronics Inc
Publication of JP2017501659A publication Critical patent/JP2017501659A/ja
Application granted granted Critical
Publication of JP6730191B2 publication Critical patent/JP6730191B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/91Entropy coding, e.g. variable length coding [VLC] or arithmetic coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/11Selection of coding mode or of prediction mode among a plurality of spatial predictive coding modes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • H04N19/126Details of normalisation or weighting functions, e.g. normalisation matrices or variable uniform quantisers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/129Scanning of coding units, e.g. zig-zag scan of transform coefficients or flexible macroblock ordering [FMO]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/13Adaptive entropy coding, e.g. adaptive variable length coding [AVLC] or context adaptive binary arithmetic coding [CABAC]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/147Data rate or code amount at the encoder output according to rate distortion criteria
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/15Data rate or code amount at the encoder output by monitoring actual compressed data size at the memory before deciding storage at the transmission buffer
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/154Measured or subjectively estimated visual quality after decoding, e.g. measurement of distortion
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/189Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
    • H04N19/192Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding the adaptation method, adaptation tool or adaptation type being iterative or recursive
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • H04N19/33Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability in the spatial domain
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/44Decoders specially adapted therefor, e.g. video decoders which are asymmetric with respect to the encoder
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/593Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial prediction techniques
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding

Abstract

原映像信号(original video signal)を受信するステップと、上記原映像信号を利用可能な復元信号と比較するステップと、上記比較の結果に基づいて変換コーディングされた修正信号を生成するステップと、上記変換コーディングされた修正信号及び上記利用可能な復元信号に基づいて予測信号を生成するステップと、上記変換コーディングされた修正信号を上記予測信号に合算して信号を復元するステップと、を有する、映像信号をエンコードする方法が本発明において開示される。【選択図】図3

Description

本発明は、ビデオ(映像)(video)信号のエンコード及びデコード方法並びにビデオ信号のエンコード及びデコード装置に関し、特に、予測された信号と変換コーディングされた信号とを用いた予測技術に関する。
圧縮符号化とは、デジタル化した情報を通信回線を介して送信するか、記憶(格納)媒体(storage medium)に適した形で記憶(格納)する(storing)ための一連の信号処理技術を意味する。映像、イメージ、音声などのメディアが圧縮符号化の対象となることができ、特に、映像を対象として圧縮符号化を行う技術をビデオ映像圧縮と称する。
多くのメディア圧縮技術は、予測コーディング及び変換コーディングという2つのアプローチ(approach)方法に基づく。特に、ハイブリッドコーディング(hybrid coding)技術は、以前にデコードされたコンテキスト値(previously decoded context values)を用いてサンプルを空間的に(spatially)予測し、予測エラーを変換コーディングする。このような処理(過程)(process)は、ガウス信号(Gaussian signal)に対して最適なレート歪み(Rate Distortion;RD)値を有するように行われる。
しかし、一般的なビデオ信号は、ガウス信号(Gaussian signal)に適合しない(not suitable)構造を含んでいるため、このような信号をより効率的にコーディングする必要がある。
一方、ブロックの他の部分で発生するエラー毎に互いに重要度が異なり得る。したがって、空間ドメインと周波数ドメインとの両方でエラーを制御できる方法が必要である。
本発明では、エッジ及び方向性構造(edge and directional structure)を有する信号に対してより効率的にコーディングしようとする。
本発明では、予測された信号とともに変換コーディングされた信号を用いて、ビデオ信号を非因果的に(non-causally)予測しようとする。
本発明では、非直交変換に基づいてビデオ信号をコーディングしようとする。
本発明では、歪みを最小にする最適な変換係数を取得しようとする。
本発明では、RD(Rate Distortion)が最適な(Rate Distortion (RD) -optimized)量子化ステップサイズを導出しようとする。
本発明が適用される非因果的コーディング技術を、非直交変換の式及びパラメータ(non-orthogonal transform having a form and parameters)で表現しようとする。
本発明では、空間ドメインと周波数ドメインとの両方で量子化エラーを制御しようとする。
本発明では、空間ドメイン上でエラーの重要度を区別する(異ならせる)(differentiate)ために、さらに他の対角行列を定義しようとする。
本発明では、RD(Rate-Distortion)の観点で最適な対角行列を計算する方法を提案しようとする。
本発明では、空間ドメイン上で量子化エラーをより細かく制御する方法を提案しようとする。
また、本発明は、エッジ及び方向性構造(edge and directional structure)を有する信号に対してより効率的にコーディングできる方法を提案する。
本発明は、予測された信号とともに変換コーディングされた信号を用いてビデオ信号を非因果的に(non-causally)予測する方法を提案する。
また、本発明は、非直交変換に基づいたビデオ信号のコーディング方法を提案しようとする。
また、本発明は、最適な変換係数を取得するための量子化アルゴリズムを提案する。
また、本発明は、最適な量子化ステップサイズを導出する方法を提案する。
また、本発明は、非直交変換の式及びパラメータで表現され得る非因果的コーディング技術を提案する。
また、本発明は、既に復元された全ての信号及びコンテキスト信号(context signal)を用いて最適な予測信号(optimized prediction signal)を生成する方法を提案する。
また、本発明は、空間ドメインと周波数ドメインとの両方で量子化エラーを制御する方法を提案する。
また、本発明は、空間ドメイン上でエラーの重要度を区別するために、さらに他の対角行列を定義する。
また、本発明は、RD(Rate-Distortion)の観点で最適な対角行列を計算する方法を提案する。
また、本発明は、空間ドメイン上で量子化エラーをより細かく制御する方法を提案する。
本発明の一実施形態は、原映像信号(original video signal)を受信するステップと、原映像信号を利用可能な復元信号と比較するステップと、比較の結果に基づいて変換コーディングされた修正信号(correction signal)を生成するステップと、変換コーディングされた修正信号及び利用可能な復元信号に基づいて予測信号を生成するステップと、変換コーディングされた修正信号を予測信号に合算(加算)し(add)て信号を復元するステップと、を有する、映像信号をエンコードする方法を提供する。
本発明の一態様において、方法は、歪み成分とレート成分との合計(sum)を最小にするスケーリングパラメータを決定するステップと、スケーリングパラメータに基づいて変換コーディングされた修正信号に対して量子化を行うステップと、をさらに有する。
本発明の一態様において、歪み成分は、原映像信号と復元信号との間の歪みの総和(total distortion)を指示し、レート成分は、量子化された係数を送信するために要求されるビットの数を指示する。
本発明の一態様において、スケーリングパラメータは、量子化パラメータ値から決定される。
本発明の一態様において、方法は、コーディングされる原映像信号を複数のレイヤに分解するステップをさらに有する。
本発明の一態様において、非直交変換行列は、信号を復元するのに使用される。
本発明の他の実施形態は、最適な量子化された係数(optimal quantized coefficient)を有する映像信号を受信するステップと、最適な量子化された係数に基づいて残差エラーベクトルを取得するステップと、残差信号を予測信号に合算して映像信号を復元するステップと、を有し、最適な量子化された係数は、以前に復元された信号(previously reconstructed signals)の全てに基づいて取得される、映像信号をデコードする方法を提供する。
本発明の一態様において、デコード方法は、映像信号からスケーリングパラメータを抽出するステップと、スケーリングパラメータに基づいて最適な量子化された係数に量子化を行うステップと、をさらに有する。
本発明の他の実施形態は、原映像信号を受信するように構成される受信部と、原映像信号を利用可能な復元信号と比較し、比較の結果に基づいて変換コーディングされた修正信号を生成するように構成される最適化部と、変換コーディングされた修正信号及び利用可能な復元信号に基づいて予測信号を生成するように構成される予測部と、変換コーディングされた修正信号を予測信号に合算して信号を復元するように構成される復元部と、を備える、映像信号をエンコードする装置を提供する。
本発明の一態様において、エンコード装置は、歪み成分とレート成分との合計を最小にするスケーリングパラメータを決定するように構成される最適化部と、スケーリングパラメータに基づいて変換コーディングされた修正信号に量子化を行うように構成される量子化部と、をさらに備えることができる。
本発明の他の実施形態は、最適な量子化された係数を有する映像信号を受信するように構成される受信部と、最適な量子化された係数に基づいて残差エラーベクトルを取得するように構成される逆変換部と、残差信号を予測信号に合算して、映像信号を復元するように構成される復元部と、を備え、最適な量子化された係数は、以前に復元された信号の全てに基づいて取得される、映像信号をデコードする装置を提供する。
本発明の一態様において、デコード装置は、映像信号からスケーリングパラメータを抽出し、スケーリングパラメータに基づいて最適な量子化された係数に量子化を行うように構成される逆量子化部をさらに備える。
本発明は、デコードされた全ての情報を利用することにより、さらに精巧かつ改良された(向上した)(advanced)予測を行うことができる。
また、本発明は、予測された信号とともに変換コーディングされた信号を用いてビデオ信号を非因果的に(non-causally)予測することにより、エッジ及び方向性構造(edge and directional structure)を有する信号に対してより効率的にコーディングすることができる。
また、本発明は、非直交変換の式及びパラメータで表現され得る非因果的コーディング技術を提案することにより、さらに精巧かつ改良された予測を行うことができる。
また、本発明は、最適な変換係数を取得するための量子化アルゴリズムを提案することにより、量子化エラー(歪み)(error)を最小にすることができる。
また、本発明は、最適な量子化ステップサイズを導出する方法を提案することにより、さらに改良されたコーディングを行うことができる。
また、本発明は、既に復元された(復元済みの)全ての信号及びコンテキスト信号(context signal)を用いることにより、最適な予測信号(optimized prediction signal)を生成できる。
また、本発明は、空間ドメインと周波数ドメインとの両方で量子化エラーを制御することにより、さらに改良されたコーディングを行うことができる。
ビデオコーディングが行われるエンコーダの概略ブロック図である。 ビデオコーディングが行われるデコーダの概略ブロック図である。 本発明が適用される実施形態であって、改良されたコーディング方法が適用されるエンコーダの概略ブロック図である。 本発明が適用される実施形態であって、改良されたコーディング方法が適用されるデコーダの概略ブロック図である。 本発明が適用される実施形態であって、以前にコーディングされたピクセルを用いて予測を行う方法を説明するためのレイヤを定義する図である。 本発明が適用される実施形態であって、以前にコーディングされたピクセルを用いて予測を行う方法を説明するためのレイヤを定義する図である。 本発明が適用される実施形態であって、レイヤ単位で以前にコーディングされたピクセルを用いて予測を行う方法を説明するフローチャートである。 本発明が適用される実施形態であって、最適な量子化された係数を取得するための量子化処理を説明するフローチャートである。 本発明が適用される実施形態であって、最適な量子化された係数を取得するための量子化処理を具体的に説明するフローチャートである。 本発明が適用される実施形態であって、最適な量子化ステップサイズを取得する処理を説明するフローチャートである。 本発明が適用される実施形態であって、本発明が適用されるテストイメージを示す図である。 本発明が適用される実施形態であって、テストイメージに対するレートゲイン(rate gain)のパーセンテージを示す図である。 本発明が適用される実施形態であって、改良された予測コーディング方法を説明するための概略フローチャートである。 本発明が適用される実施形態であって、最適な量子化ステップサイズに基づいて量子化を行う方法を説明するための概略フローチャートである。 本発明が適用される実施形態であって、量子化エラー制御による改良されたコーディング方法が適用されるエンコーダの概略ブロック図である。 本発明が適用される実施形態であって、量子化エラー制御による改良されたコーディング方法が適用されるデコーダの概略ブロック図である。 本発明が適用される実施形態であって、RD(Rate-Distortion)の最適化処理を介してスケーリング対角行列(scaling diagonal matrix)を取得する処理を説明するフローチャートである。 本発明が適用される実施形態であって、最適化されたスケーリング行列を用いてコーディングした場合と既存の方式のとおりにコーディングした場合とにおいて、各イメージのコーディングゲイン(coding gain)を比較するグラフである。 本発明が適用される実施形態であって、改良されたコーディング方法が適用されるエンコーダの概略ブロック図である。 本発明が適用される実施形態であって、改良されたコーディング方法が適用されるデコーダの概略ブロック図である。 本発明が適用される実施形態であって、改良されたビデオコーディング方法を説明するための概略フローチャートである。
以下、添付された図面を参照して本発明の実施形態の構成及びその作用を説明し、図面により説明される本発明の構成及び作用は、1つの実施形態として説明されるものであり、これにより、本発明の技術的思想とその中核となる構成及び作用とが制限されるものではない。
また、本発明において使用される用語は、なるべく現在広く使用される一般的な用語を選択したが、特定の場合は、出願人が任意に選定した用語を使用して説明する。そのような場合には、該当部分の詳細説明においてその意味を明確に記載するので、本発明の説明において使用された用語の名称だけで単純に解析されてはならず、その該当用語の意味まで把握して解析されなければならないことを明らかにしておく。
なお、本発明において使用される用語は、発明を説明するために選択された一般的な用語であるが、類似した意味を有する他の用語がある場合、より適切な解析のために代替可能であろう。例えば、信号、データ、サンプル、ピクチャ、フレーム、ブロックなどの場合、各コーディング処理で適宜代替されて解析され得るであろう。
図1及び図2は、各々でビデオコーディングが行われるエンコーダ及びデコーダの概略ブロック図を示す。
上記図1のエンコーダ100は、変換部110、量子化部120、逆量子化部130、逆変換部140、バッファ150、予測部160、及びエントロピエンコード部170を備え、上記図2のデコーダ200は、エントロピデコード部210、逆量子化部220、逆変換部230、バッファ240、及び予測部250を備える。
上記エンコーダ100は、原映像信号(original video signal)を受信し、上記原映像信号から、予測部160が出力した予測信号(predicted signal)を減算して予測エラーを生成する。上記生成された予測エラーは、変換部110に送信され、上記変換部110は、上記予測エラーに変換技法を適用して変換係数を生成する。
例えば、上記変換技法の中には、ブロックベースの変換方法とイメージベースの変換方法とがありうる。上記ブロックベースの変換方法の例としては、離散余弦(コサイン)変換(Discrete Cosine Transform;DCT)、カルーネンレーベ変換(Karhuhen-Loeve Transform;KLT)などを挙げることができる。ここで、上記離散余弦変換DCTとは、空間ドメイン(spatial domain)上の信号を2次元周波数成分に分解(変換)することを示す。ブロック内から左側上端に行くほど低い周波数成分を有し、右側下端に行くほど高い周波数成分を有するパターンをなす。例えば、64個の2次元の周波数成分のうち、最も左側上端に存在する1個のみが直流成分(DC:Direct Current)で、周波数が0である成分であり、残りは交流成分(AC:Alternate Current)で、低い周波数成分から高い周波数成分まで63個で構成される。上記離散余弦変換DCTを行うということは、原映像信号のブロックに含まれた基底成分(64個の基本パターン成分)のそれぞれの大きさを求めることであり、この大きさは、離散余弦変換係数である。
また、上記離散余弦変換DCTは、単に原映像信号成分で表現するために使用される変換であり、逆変換の際、周波数成分から本来の(原)(original)映像信号に完全に復元される。すなわち、映像の表現方法のみを変えることで、重複した情報を含む原映像に含まれた全ての情報を全て記憶する。原映像信号を離散余弦変換DCTする場合、原映像信号の振幅の分布とは異なり、離散余弦変換DCT係数は、0の近くの値に集まって存在するので、これを用いて高い圧縮効果を得ることができる。
量子化部120は、上記生成された変換係数(transform coefficient)を量子化してエントロピエンコード部170に送信し、上記エントロピエンコード部170は、量子化された信号(quantized signal)をエントロピコーディングして出力する。
上記量子化部120は、入力されるデータに対して特定範囲の入力値を1つの代表値にマッピングする。量子化は、次の数式1のように、入力データを量子化ステップサイズで割ることにより計算されることができる。
ここで、Yは、量子化されたデータを表し、Xは、入力データを表し、Qは量子化ステップサイズを表す。Sign()関数は、データの符号を取得するための演算であり、Round()関数は、四捨五入演算を表す。上記量子化ステップサイズは、量子化区間(quantization range)によって表現されることができる。また、本明細書において、上記量子化ステップサイズは、スケーリングパラメータ(scaling parameter)を意味できる。ビデオコーディングの際、上記量子化ステップサイズは、変更されることができ、変更された量子化ステップサイズを用いて圧縮率を調節できる。一方、上記量子化ステップサイズの代わりに、整数値を使用する量子化パラメータを用いることもできる。
量子化処理は、次の数式2のように、入力された変換係数Cを量子化ステップサイズQで割ることにより、量子化された係数C’を取得できる。
[数式2]
C’=C/Q
ここで、C’は、量子化された係数を表し、Cは、入力された変換係数を表し、Qは、量子化ステップサイズを表す。
一方、上記量子化部120から出力された上記量子化された信号(quantized signal)は、予測信号を生成するために用いられることができる。例えば、上記量子化された信号(quantized signal)は、ループ内の逆量子化部130及び逆変換部140を介して逆量子化及び逆変換を適用することにより、予測エラーに復元されることができる。上記復元された予測エラーを予測部160から出力された予測信号(prediction signal)に加えることにより、復元信号(reconstructed signal)が生成され得る。
バッファ150は、上記予測部160による今後の参照(future reference)のために上記復元信号を記憶し、上記予測部160は、上記バッファ150に記憶された以前に復元された信号(previously reconstructed signal)を用いて予測信号(prediction signal)を生成する。
図2のデコーダ200は、上記図1のエンコーダ100から出力された信号を受信し、受信された信号は、エントロピデコード部210を介してエントロピデコードされる。逆量子化部220では、量子化ステップサイズ情報を利用してエントロピデコードされた信号から変換係数を取得し、逆変換部230では、上記変換係数を逆変換して予測エラーを取得する。上記取得された予測エラーを上記予測部250から出力された予測信号(prediction signal)に加えることにより、復元信号(reconstructed signal)が生成される。
上記逆量子化部220は、次の数式3のように、量子化されたデータに逆量子化スケール値Qを掛けることにより計算されることができる。
[数式3]
X’=Y*Q
ここで、X’は、復元されたデータを表し、Yは、量子化されたデータを表し、Qは、逆量子化スケール値を表す。上記Qは、量子化ステップサイズと同様(同一)の(same)値を有することができる。
上記バッファ240は、上記予測部250による今後の参照(future reference)のために上記復元信号を記憶し、上記予測部250は、上記バッファ240に記憶された以前に復元された信号(previously reconstructed signal)を用いて予測信号(prediction signal)を生成する。
本発明は、ハイブリッドビデオコーダでのイントラ予測方法を提供する。圧縮されるサンプル値は、以前にコーディングされたコンテキスト値を用いて予測され、予測エラーは、変換コーディングされる。このような処理は、ガウス(Gaussian)信号に対して最適なRD値を有するように行われることができる。しかし、一般的なビデオ(映像)(video)信号は、ガウス(Gaussian)信号に適合しない多くの信号を含んでいる。したがって、本発明では、上記のような信号をターゲットとして、我々は、予測サンプルとともに変換コーディングされたサンプル及びコンテキスト値を用いて各サンプルを非因果的に(non-causally)予測する技術を提案しようとする。このような非因果的エンコード(non-causal encoding)は、非直交変換(non-orthogonal transform)の式(form)及びパラメータで表現されることができる。
図3及び図4は、本発明が適用される実施形態であって、各々改良されたコーディング方法が適用されるエンコーダ及びデコーダの概略ブロック図を示す。
上記図3のエンコーダ300は、最適化部310、量子化部315、逆変換部320、予測部330、復元部340、バッファ350、及びエントロピエンコード部360を備え、上記図4のデコーダ400は、エントロピデコード部410、逆量子化部420、逆変換部430、復元部440、バッファ450、及び予測部460を備える。
上記最適化部310は、上記バッファ350から、現在ブロックのピクセル情報、以前にデコードされたブロックのピクセル情報、及び量子化ステップサイズ情報のうち、少なくとも1つを取り込む(取る)(フェッチする)(fetch)ことができる。ここで、上記現在ブロックのピクセル情報は、ベクトルで表現された、コーディングされるブロックのピクセル(pixels from the block to be coded arranged into a vector)を表すことができる。上記以前にデコードされたブロックのピクセル情報は、ベクトルで表現された、以前にデコードされたブロックのピクセル(pixels from previously decoded block arranged into a vector)を表すことができる。上記量子化ステップサイズ情報は、ベクトルで表現された量子化ステップサイズを表すことができる。
上記最適化部310は、上記現在ブロックのピクセル情報、上記以前にデコードされたブロックのピクセル情報、及び上記量子化ステップサイズ情報のうち、少なくとも1つに基づいて変換係数C(i、j)を取得できる。ここで、上記変換係数C(i、j)は、量子化された変換係数を意味できる。
上記逆変換部320は、上記取得された変換係数C(i、j)を受信し、逆変換を行うことができる。上記逆変換部320は、受信した変換係数C(i、j)に逆変換を行い、残差(レジデュアル)信号res(i、j)を取得できる。
上記予測部330は、上記バッファ350から、以前にデコードされたブロックのピクセル情報を取り込むことができる。上記予測部330は、以前にデコードされたブロックのピクセル及び以前のレイヤ(previous layer)から復元されたピクセルのうち、少なくとも1つを用いて現在レイヤのピクセルを予測できる。上記予測部330は、上記のような予測を行うことにより、予測信号pred(i、j)を取得できる。ここで、上記現在レイヤのピクセル(layer Lk)は、現在ブロックがB×Bブロックであり、水平成分をj、垂直成分をiとするとき、(k、i)及び(j、k)(i=1、...、B、j=1、...、B、k=1、...、B)に位置するピクセルを表すことができる。このとき、上記以前のレイヤから復元されたピクセルは、以前の全てのレイヤ(layer L1、...、layer Lk-1)の復元されたピクセルを表すことができる。これについては、図5及び図6においてより詳しく説明する。
上記復元部340は、上記予測部330から取得された予測信号pred(i、j)と上記逆変換部320から取得された残差信号res(i、j)とを加えることにより、復元信号rec(i、j)を取得できる。このとき、上記復元信号rec(i、j)は、上記現在レイヤ(layer Lk)に対する復元信号を意味できる。上記復元信号rec(i、j)は、今後、次のレイヤの予測のためにバッファ350に送信される。
一方、上記最適化部310によって取得された変換係数C(i、j)は、量子化部315に送信されることができる。
上記量子化部315は、量子化処理を行い、上記エントロピエンコード部360に上記量子化された変換係数を送信する。
このとき、上記変換係数C(i、j)は、RD(Rate-Distortion)が最適な変換係数を意味できる。そして、上記量子化処理は、上記変換係数C(i、j)を量子化ステップサイズで割ることにより行われることができる。
上記エントロピエンコード部360は、量子化された変換係数を受信し、エントロピエンコードを行うことができる。
上記図4のデコーダ400は、上記図3のエンコーダ300から出力された信号を受信することができる。
上記エントロピデコード部410は、ビットストリームを受信してエントロピデコードを行うことができる。
上記逆量子化部420は、量子化ステップサイズ情報を利用してエントロピデコードされた信号から変換係数を取得できる。
上記逆変換部430は、上記変換係数を逆変換することにより、残差信号res(i、j)を取得できる。
上記復元部440は、上記残差信号res(i、j)と予測部450から取得された予測信号pred(i、j)とを加えることにより、復元信号rec(i、j)を取得できる。上記復元信号rec(i、j)は、バッファ450に送信されて記憶されることができる。そして、上記復元信号rec(i、j)は、次の信号の予測のために、上記予測部450に送信されることができる。
上記図4のデコーダ400内の各部の動作は、上記図3のエンコーダ300において説明した実施形態が適用可能であろう。
本発明が適用されるハイブリッドビデオコーダは、以前にデコードされたサンプル(すなわち、コンテキスト値(i.e., context values))を用いてサンプルを空間的に予測し、予測エラーを変換コーディングすることにより、効率的な予測コーディングを行う。
このようなコーディング方式は、ブロック変換が部分的に最適である信号に対してさえ連続的にブロック変換を利用させるようにする。例えば、上記部分的に最適である信号には、相当なブロック間相関関係(significant inter-block correlations)を有する信号、エッジ及び異なる方向の(他の方向的)特異性(edge and different directional singularities)を有する信号がありうる。したがって、空間的予測動作(spatial prediction operation)は、単純な変換圧縮にさらに順応的な(より適応できる)(more adaptive to simple transform compression)予測信号を生成するので、精巧な予測処理には適応が少し足りない(より適応できない)(less adaptive to an elaborate prediction process)と考えられ得る。予測動作は、コンテキスト値(context values)を用いて行われるので、その効率は、ガウス(Gaussian)信号のような形態を有する基本的な処理に依然として強く依存する(dependent on)ことができる。
具体的な議論のために、コンテキストサンプル(context sample)x0を用いてシーケンスxi(i=1〜N)を圧縮する1次元の例を考慮してみる。
例えば、xは、コンテキストサンプル(context sample)x0を用いて方向性予測を行う対象ブロック(target block)からの水平又は方向性のある一連のピクセルを含む。ここで、上記コンテキストサンプル(context sample)x0は、以前にデコードされたブロックの境界から取得され得る。上記コンテキストサンプル(context sample)x0は、エンコーダ及びデコーダの両方に利用可能であると仮定する。上記コンテキストサンプル(context sample)x0を用いたxiの線形予測をPi(x0)とする場合、残差信号(ri)は、次の数式4のように定義することができる。
[数式4]
i=xi−Pi(x0
上記残差信号(ri)は、エンコード処理によって変換コーディングされ、デコード処理によって変換デコードされる場合、下記の数式5のように表すことができる。
[数式5]
x^i = Pi(x0) + r^i
ここで、 x^i は、復元信号を表す。
最適な線形予測子を取得してKLTを用いる場合、上記処理は、ガウス(Gaussian)シーケンスの圧縮に関して漸近的に最適になることができる。しかし、上記処理は、ガウスモデル(Gaussian modeling)のような多くのイメージ/ビデオ構造の場合に適合しない場合がある。したがって、本発明では、デコード処理中に全てのデコードされた情報を利用するより良好な予測子を用いることにより、上記予測方法をより改善しようとする。本発明は、エッジ及び方向性構造を有するビデオ信号により優れた効果を見せるであろう。
以下では、まず、本発明の1次元の例を介して基本的概念(アイディア)を説明する。その次に、線形予測子に集中して、本発明とDPCMとの(連結)関係(connections)を議論し、等価の非直交変換(equivalent non-orthogonal transform)を導出するであろう。そして、コーデック設計を議論した後、非直交変換を利用した圧縮及びRD(Rate-Distortion)が最適な量子化パラメータの導出について説明する。最後に、本発明が適用されるシミュレーション結果に対する詳細内容を説明する。
デコードを行った後に、上記デコーダは、上記残差サンプルの全てにアクセスすることができる。しかし、上記デコーダは、i番目のサンプル x^iをデコードする場合、x0及びriのみを用いる。特に、 x^i+1をデコードする場合、上記デコーダは、 x^i を既に復元しており、これは、x0と比較して典型的に x^i+1のより良好な予測子である。本発明において、デコードチェーン(decoding chain)は、下記の数式6のように設計されることができる。
上記デコーダは、利用可能な変換デコードされた残差の全てを有するので、このようなチェーン及び拡大された(augmented)予測子Ptが実現可能でありうる。上記対応するエンコードチェーンは、最適にコーディングされた変換係数の選択として記述されることができ、数式6での上記変換デコーダに入力される場合、与えられた目標ビットレートで最小の歪みを有する x^を結果として得る(result in)。
本発明は、非線形予測関数に一般化され得ることに関し、本発明は、計算的には単純な、線形予測子を維持するであろうが、どこでも(あらゆるところの)(everywhere)x0を用いるよりは、むしろ最も近接した利用可能なサンプルを用いて予測を行うであろう。1次元の例に関して、本発明は、数式7を構成できる。
このような場合において、本予測は、単一(統一)予測加重値(prediction weight of unity)を有する線形でありうる。このような設定において、数式7の上記予測Pi(x0)は、単純にPi( x^i-1)で置き換えられ得る。他の加重値及びタイプ(類型)(types)等の線形予測子は、簡単な一般化でありうる。
下記では、DPCM及び等価の非直交変換との関係について説明されるであろう。
数式7は、単一予測加重値で動作している1次DPCMデコーダと類似する。DPCMシステムが因果的にかつ独立して上記残差をエンコードする一方、上記数式7のデコーダは、非因果的にかつ結合(連係)して(jointly)エンコードされた残差のデコードに対応する。これは、数式6で表される変換デコーダの出力であるr^に起因する。変換コーディングを介して残差の依存性及び他のDPCM R−Dの非効率(能率)(inefficiencies)を活用しながら(while exploiting residual dependencies and other DPCM R-D inefficiencies via transform coding)、提案されたシステムは、DPCMシステムの予測精度(正確度)(accuracy)を得ることができる。
数式7は、行列数式8へと導かれることができる。
ここで、Fは、数式9を利用する(N×N)下半(下位)三角予測行列(lower triangular prediction matrix)である。
このような実施形態は、単位成分(unit entries)を有する(N×1)行列である。数式8を、変換コーディングに対応する(accommodate)よう(を収容することと)拡大すれば、本発明は、数式10を結果として得ることができる。
数式10において、T(N×N)は、圧縮(例えば、HEVCでのブロックDCT/DST)で使用される変換であり、c^は、逆量子化された変換係数である。G=FTとする場合、数式10は、数式11を介した非直交変換Gを有する x^−Bx0の変換コーディングに対応する。
このような単純な線形式(形態)で、本発明は、上記非直交変換Gを用いるx−Bx0の変換圧縮となることができる。
モードベースの線形予測子を用いて、提案されたデコードチェーンは、各予測モードに対してF及びB行列を設計し、等価の非直交変換Gを導出して、基準ハイブリッドコーデックに類似するHEVC(HEVCのようなベースラインハイブリッドコーデック)(baseline hybrid codec like HEVC)内に統合されることができる。
このようなデコードチェーンが行う全てのものは、境界サンプルというよりは、むしろ最も近接したサンプルを用いる予測であるから、デコードチェーンは、上記基準と比較して単に増加された周縁の(臨界)(marginal)複雑さを有するであろう。しかし、エンコードチェーンは、上記デコードチェーンのために送信する最適な係数を選択すべきであるため、さらに複雑である。下記において、本発明は、エンコーダが実行すべき繰り返し(反復)量子化アルゴリズムを提供し、レート歪みが最適化された量子化パラメータを導出するであろう(Hereinafter, the present invention will provide an iterative quantization algorithm which the encoder must carry out and derive rate-distortion optimal quantization parameters)。
図5及び図6は、本発明が適用される実施形態であって、以前にコーディングされたピクセルを用いて予測を行う方法を説明するためのレイヤを定義する。
本発明は、以前にコーディングされたピクセルを用いて各サンプルを非因果的に(non-causally)予測する方法を提供する。
このとき、現在ブロックのピクセル及び予測のために用いられる上記以前にコーディングされたピクセルは、様々な方法で決定されることができる。
本発明が適用される一実施形態として、現在ブロックは、少なくとも1つのレイヤ単位で分解(decompose)されることができる。それにより、上記以前にコーディングされたピクセルもレイヤ単位で決定されることができる。
ここで、上記レイヤ単位は、一定の基準によって位置する(位置した)(placed)ピクセルに基づいて様々に定義されることができる。具体的な例として、現在ブロックの最上位左側に位置するピクセルを基準として水平及び垂直方向に配列されたピクセルを1つのレイヤとして定義することができる。そして、上記最上位左側に位置するピクセルの対角線方向に配列されたピクセルを基準として各々連続するレイヤ(consecutive pixels)として定義することができる。
このとき、上記レイヤは、1つのピクセル又は複数のピクセルとして定義されるか、又は、ブロック全体のピクセルとして定義されることができる。また、上記レイヤは、上記図5のように連続するピクセルの集合として定義されることができるが、場合によって、連続しないピクセルの集合として定義されることもできる。
例えば、上記図5に示すように、現在ブロックがB×Bブロックであり、ブロック内のピクセルの位置を(i、j)と仮定する。ここで、i∈{1、2、...、B}、j∈{1、2、...、B}である。このとき、現在ブロックの最上位左側に位置するピクセルを基準として水平及び垂直方向に配列されたピクセルをlayer L1として定義することができる。すなわち、ピクセルの位置(1、j)及び(i、1)に位置するピクセルをlayer L1として定義することができる。
これを一般化すると、ピクセルの位置(k、j)及び(i、k)に位置するピクセルをlayer Lk(k=1、2、...、B)として定義することができる。
本発明が適用される一実施形態として、上記以前にコーディングされたピクセルは、コーディングしようとするレイヤのすぐ以前にコーディングされたレイヤのピクセルを含むことができる。
上記図6に示すように、現在レイヤlayer Lkを予測するために、すぐ以前にコーディングされたレイヤlayer Lk-1を用いることができる。このとき、上記現在レイヤlayer Lkを予測するために、現在ブロックの境界に隣接したピクセルも共に用いることができる。すなわち、上記現在ブロックに隣接した既にデコードされたブロックの隣接ピクセルが上記レイヤlayer Lkを予測するために用いられることができる。
例えば、上記現在レイヤlayer Lkは、全ての以前のレイヤ(layer L1、...、layer Lk-1)の復元されたピクセル及び既にデコードされたブロックの隣接ピクセルに基づいて予測されることができる。
本発明の他の実施形態は、予測形式を提供できる。
上記エンコーダは、coeffs(i、j)、i∈{1、2、...、B}、j∈{1、2、...、B}をベクトルcとして配列(arrange into)できる。これは、数式12で表現されることができる。
[数式12]
C((i−1)*B+(j−1)+1)=coeffs(i、j)
そして、上記エンコーダは、res(i、j)、i∈{1、2、...、B}、j∈{1、2、...、B}をベクトルrとして配列できる。これは、数式13で表現されることができる。
[数式13]
r((i−1)*B+(j−1)+1)=res(i、j)
それから、上記エンコーダは、以前にデコードされたブロックからのピクセルをベクトルyとして配列できる。
このような場合において、数式14のような行列の掛け算を利用して本発明が実現され得る。
また、数式15のような行列の掛け算を利用して本発明が実現され得る。
さらに、数式16のような行列の掛け算を利用して本発明が実現され得る。
さらに、数式17のような行列の掛け算を利用して本発明が実現され得る。
一方、上記図5及び図6において説明された実施形態は、イントラ予測の場合に適用可能であるだけでなく、イントラ予測の様々な予測モードに適用可能である。本発明は、これに限定されず、例えば、上記実施形態は、インター予測の場合にも適用可能である。
図7は、本発明が適用される実施形態であって、レイヤ単位で以前にコーディングされたピクセルを用いて予測を行う方法を説明するフローチャートである。
まず、受信されたビットストリームからエントロピコーディングされた係数を抽出できる。上記エントロピコーディングされた係数に対してエントロピデコードを行い(S710)、逆量子化を行うことにより、変換係数coeffs(i、j)を取得できる(S720)。
上記変換係数に逆変換を行うことにより、残差信号res(i、j)を取得できる(S730)。上記残差信号res(i、j)は、現在レイヤlayer Lkを復元するために用いられる。
一方、現在レイヤlayer Lkにあるピクセルを予測するために、以前にデコードされたブロックのピクセルが用いられ得る。このとき、全ての以前のレイヤ(layer L1、...、layer Lk-1)の復元されたピクセルも共に用いて、上記現在レイヤlayer Lkにあるピクセルを予測できる(S740)。
S740を介して生成された予測信号pred(i、j)は、上記S730で取得された残差信号res(i、j)に加えられて、上記現在レイヤlayer Lkにあるピクセルを復元できる(S750)。このように生成された復元信号rec(i、j)は、次のレイヤの予測のために用いられることができる。
図8は、本発明が適用される実施形態であって、最適な量子化された係数を取得するための量子化処理を説明するフローチャートである。
本発明は、非直交変換を利用する圧縮方法を提供する。
ランダムベクトルx(N×1)を考慮しよう。記載上の便宜のために(For notational convenience)、上記コンテキスト予測がx内で処理(absorb)されると仮定する。上記ベクトルxは、列gi、i=1、...、Nが変換基底(basis)を形成する、上記線形変換G(N×N)を利用して表現される。Gは、フルランクであるが、そうでない場合は一般的であると仮定、すなわち、Gは必ずしも直交でないことがあり、giは必ずしも単位大きさ(ノルム)でないことがあると仮定する(Assume G is full rank but is otherwise general, i.e., G may be not necessarily orthogonal and g± may be not necessarily unit norm)。
[数式18]
x=Gc
数式18において、c(N×1)は、変換係数である。上記係数は、 c^ =Q(c)が算出されるようにスカラー量子化されることができ、その後でエントロピコーディングされることができ、デコーダに送信されることができる。
量子化歪みを最小にすることを目標とする非直交基底Gに関するスカラー量子化問題は、数式19のように作成されることができる。
[数式19]
||x−G c^ ||
本発明は、ビデオコーダとの互換性のために、様々な量子化部に対応できるが、これは、数式20のように仮定されるであろう。
数式20において、ι(N×1)は、整数のベクトルであり、Λは、量子化部ステップサイズの対角行列、すなわち、i番目のステップサイズλi及びクロネッカーデルタ関数δi,jを用いる場合、Λi,jiδi,jである。したがって、数式21が導出され得る。
[数式21]
||x−GΛι||
数式21は、ιに関する最適解法が整数問題を解決することを要求する格子量子化部(lattice quantize)として認識されることができる。数式19の解法のための多くの準(部分)(サブ)最適化技法(suboptimal techniques)が提案された。迅速な解法に対応するために、本発明は、それぞれの係数に関して集中するスカラー量子化問題を順に繰り返して解決することと類似した方法を含めることができる。i番目の係数を除き、全ての係数が量子化されたと仮定する。上記エラーベクトルは、数式22のように定義されることができる。
整数の制約条件を用いずに(Without the integer constraint)、i番目の係数が数式23になるように選択することによって歪みが最小にされ得る。
数式20における均一逆量子化(uniform de-quantization)処理のために、上記最適な量子化された係数は、数式24のように取得されることができる。
これは、下記において説明される量子化アルゴリズムへと導かれることができる。
エンコーダでは、デコーダに送信する最適な量子化された係数を取得するために、繰り返しシミュレーションを行うことができる(S810)。
現在量子化された係数が以前に量子化された係数と比較して一定の条件が満たされる場合、上記現在量子化された係数が最適な量子化された係数に決定され得る。例えば、現在量子化された係数をCnとし、以前に量子化された係数をCn-1とする場合、上記現在量子化された係数と上記以前に量子化された係数との間の差値(Cn-1−Cn)が0に収束されるか否かが確認できる(S820)。上記差値(Cn-1−Cn)が0に収束される場合、上記現在量子化された係数Cnを最適な量子化された係数に決定し、これをデコーダに送信することができる(S830)。しかし、上記差値(Cn-1−Cn)が0に収束されない場合、上記現在量子化された係数Cnは、以前のステップ(S810、S820)を繰り返し行うようにリターンされることができる。
上記一定の条件の他の例として、上記現在量子化された係数と上記以前に量子化された係数との間の差値(Cn-1−Cn)を特定閾値τと比較することにより、最適な量子化された係数を決定できる。例えば、上記差値(Cn-1−Cn)が上記特定閾値τより大きい場合、上記現在量子化された係数Cnは、以前のステップ(S810、S820)を繰り返し行うようにリターンされることができる。それに対し、上記差値(Cn-1−Cn)が上記特定閾値τより小さいか、同じである場合、上記現在量子化された係数Cnは、最適な量子化された係数に決定されて、デコーダに送信されることができる。
上記のような動作は、上記図3のエンコーダで行われることができ、例えば、上記最適化部310で行われることができる。
図9は、本発明が適用される実施形態であって、最適な量子化された係数を取得するための量子化処理を具体的に説明するフローチャートである。
本発明の実施形態によれば、エンコーダは、現在ブロックのピクセル情報、以前にデコードされたブロックのピクセル情報、及び量子化ステップサイズ情報のうち、少なくとも1つに基づいて、最適な量子化された係数を取得できる。これは、上記エンコーダ内の量子化部により行われることができる。
まず、エンコーダは、上記現在ブロックのピクセル情報及び上記以前にデコードされたブロックのピクセル情報に基づいて初期量子化された係数(initial quantized coefficient)を取得できる(S910)。上記初期量子化された係数は、次の数式25のように表すことができる。
[数式25]
0=G-1(x−Hy)
ここで、C0は、初期量子化された係数を表し、xは、現在ブロックのピクセル情報を表し、yは、以前にデコードされたブロックのピクセル情報を表す。ここで、G、Hは、トレーニングセット(training sets)に対して最適化された行列(matrices optimized over training sets)を表す。そして、上記行列Gは、非直交変換行列(non-orthogonal transform matrix)を表すことができる。
上記初期量子化された係数に基づいて、原信号と復元された信号の差を表すエラーベクトルを取得できる(S920)。このとき、上記現在ブロックのピクセル情報x及び上記以前にデコードされたブロックのピクセル情報yが利用され得るし、これは、次の数式26のように表すことができる。
[数式26]
n=x−Hy−G Cn-1
ここで、enは、エラーベクトルを表し、n=0、1、2、...であり、最適な量子化された係数が取得されるまで繰り返されることができる。このような繰り返し処理(iteration process)のために、一時(臨時)ベクトル(temporary vector)を下記の数式27のように定義することができる。
[数式27]
t=en+gkn-1(k)
ここで、tは、一時ベクトル(temporary vector)を表し、gkは、行列Gのk番目の列(column)のベクトルを表す。そして、Cn-1(k)は、(n−1)番目の量子化された係数を表す。
上記一時ベクトル(temporary vector)tと量子化ステップサイズ情報λ(k)とに基づいて、n番目の量子化された係数Cnを取得できる(S930)。このとき、次のような数式28が利用され得る。
[数式28]
n(k)=λ(k)round(gk Tt/λ(k)(gk Tk))
(k=1、2、...、B2
ここで、λ(k)は、k番目の変換係数のために用いられる量子化ステップサイズ(quantization step size that is to be used for the kth transform coefficient)を表す。
そして、上記エラーベクトルenは、次の数式29のように更新(アップデート)される(updated)ことができる(S940)。
[数式29]
n+=gk(Cn-1(k)−Cn(k))
上記のような処理を介して、n番目の量子化された係数Cnが取得される場合、以前に量子化された係数Cn-1と比較して一定の条件が満たされるか否かを確認することにより、上記n番目の量子化された係数Cnを最適な量子化された係数に決定することができる。例えば、上記n番目の量子化された係数Cnと上記以前に量子化された係数Cn-1との間の差値(Cn-1−Cn)が0に収束されるか否かを確認できる(S950)。
上記差値(Cn-1−Cn)が0に収束される場合、上記n番目の量子化された係数Cnを最適な量子化された係数に決定し、これをデコーダに送信することができる(S960)。しかし、上記差値(Cn-1−Cn)が0に収束されない場合、上記n番目の量子化された係数Cnは、以前のステップを繰り返し行うようにリターンされることができる。
上記一定の条件の他の例として、上記現在量子化された係数と上記以前に量子化された係数との間の差値(Cn-1−Cn)を特定閾値τと比較することにより、最適な量子化された係数を決定できる。例えば、次の数式30のように表すことができる。
[数式30]
||Cn−Cn-1||2>τ
上記差値||Cn−Cn-1||2が上記特定閾値τより大きい場合、上記現在量子化された係数Cnは、以前のステップを繰り返し行うようにリターンされることができる。それに対し、上記差値||Cn−Cn-1||2が上記特定閾値τより小さいか、同じである場合、上記現在量子化された係数Cnは、最適な量子化された係数に決定されて、デコーダに送信されることができる。
図10は、本発明が適用される実施形態であって、最適な量子化ステップサイズを取得する処理を説明するフローチャートである。
上記図9において説明したように、エンコーダは、最適な量子化された係数を取得するために量子化を行う処理で、最適な量子化ステップサイズが導出され得る。
まず、量子化パラメータ値から量子化ステップサイズ情報を取得できる(S1010)。例えば、上記量子化ステップサイズ情報は、次の数式31のように表すことができる。
[数式31]
Δ(k)=2(QP-4)/6(k=1、2、...、B2
ここで、Δ(k)は、k番目の量子化ステップサイズを表し、QPは、量子化パラメータを表す。
一方、最適な量子化された係数を取得するために用いられる行列及びベクトルを初期化できる(S1020)。例えば、上記ベクトル及び行列は、各々次の数式32及び33のように表すことができる。
[数式32]
u(k)=1(k=1、2、...、B2
最適化部では、上記k番目の量子化ステップサイズΔ(k)と上記初期化されたベクトルu(k)及び行列
とに基づいて最適な量子化ステップサイズを取得できる(S1030)。このとき、CONVEX OPTIMIZATION(凸最適化)アルゴリズムが用いられ得る。
本発明の実施形態は、最適な量子化ステップサイズを導出する方法を提供できる。
量子化ステップサイズのレート歪みが最適な設計(Rate-Distortion optimal design)は、レート及び歪みに関する扱いやすい(追跡可能な)表現(tractable expressions)がコーデックに依存し、取得し難いため、一般に難しい問題である。このような実施形態において、ステップサイズのベクトル、λを最適化するために、高いレート近似(high rate approximations)が使用され得る。
イメージ及びビデオコーダが成功する、上記変換コーディング方法(recipe)は、スカラーエントロピコーダを活用する(The transform coding recipe followed by successful image and video coders utilize scalar entropy coders)。したがって、
に量子化された係数を伝達するために要求されるレートは、数式34のように近似され得る。
数式34において、H()は、エントロピを表す。係数
は、ステップサイズλiを用いてスカラー量子化されるので、高いビットレートで近似がなされ得る。
数式35において、h(ci)は、連続的な値の係数の微分(differential)エントロピである。したがって、レート制約条件を満たすために、数式36が要求され得る。
Gが正規直交である場合、λに関する平均歪みに対する簡単な近似は、
になるであろうし、これは、均一に分布された量子化エラーを仮定して取得される。
非直交Gを用いる場合、信号ドメインと係数ドメインとの歪みは同一でなく、このような近似を使用できない。全ての量子化がゼロ平均(zero mean)であると仮定する。信号ドメインの平均歪み(signal domain average distortion)は、数式37として作成されることができ、ここで、E[]は、期待値(平均)(expectation)を表し、Tr(.)は、行列の対角成分の和(対角合計)(trace)である。
を用いて、数式37が取得され得る。
数式37において、
は、係数ドメインエラーを表すように設定される。係数ドメインエラーが逆相関(decorrelate)される場合、すなわち、E[ppT]が対角成分πi、i=1、...Nを有する対角行列である(is diagonal with diagonal entries πi, i =1)と仮定する場合、簡単な代数学によって、数式38が算出される。
上記量子化は、上記量子化アルゴリズムを介して行われるので、式(form) π=λi 2/12の近似は有効でない。Πをλと関連付けるために、上記量子化アルゴリズムにより導出される丸め誤差(ラウンドエラー)(rounding error)に集中しよう(let us concentrate on)。収束点で、数式39が取得され得る。
数式39は、次を満たす丸め誤差を導き、
に設定され、上記丸め誤差が均一であると仮定する場合、数式40が取得され得る。
数式42の対角成分を考慮すると、数式43が導出され得る。
は、行列成分が各々G及びHの2乗になるようにする行列を表すとしよう。数式38及び43は、数式44となる。
数式44において、uは、全て−1であるベクトル(vector of all-ones)であり、
したがって、数式45が取得され得る。
上記最適化は、レートの制約条件下の歪み(数式45)の平均を最小にする式で与えられ、数式46を取得することができる(The optimization can be put in the form of the minimization of average distortion (equation 45) subject to the rate constraint to obtain equation 46)。
数式46において、γは、ラグランジュ乗数(Lagrange multiplier)である。数式46の最適化によって、下記の数式47が算出される。
図11及び図12は、本発明が適用される実施形態であって、図11は、本発明が適用されたテストイメージを示し、図12は、テストイメージに対するレートゲイン(rate gain)のパーセンテージを示す。
前述したように、本発明は、予測された信号とともに変換コーディングされた信号を用いてビデオ信号を非因果的に(non-causally)予測することにより、エッジ及び方向性構造(edge and directional structure)を有する信号に対してより効率的にコーディングすることができる。
本シミュレーションでは、ブロック内の1ピクセルの厚さのレイヤに対するイントラ予測が行われ、上記図3〜図10において説明した予測処理及び量子化処理が適用された。
上記図11は、(a)〜(f)までの6個のテストイメージを示し、上記6個のイメージはそれぞれのイメージ特性を有する。
上記6個のテストイメージは、他の一般的なイメージよりエッジ又は方向特異性(edge or directional singularity)のうち、少なくとも1つが明確に現れる信号であるとみることができる。
このようなテストイメージに対するレートゲイン(rate gain)を測定した結果、上記図12(a)のような結果を確認できる。すなわち、上記6個のテストイメージの全てに対して既存のコーデックの効率に比べて改良された(向上した)(advanced)効果を確認できる。
さらに、上記図11(a)、11(b)、11(e)のイメージは、残りのイメージの図11(c)、11(d)、11(f)に比べてより方向特異性が目立つことを確認できる。したがって、上記図12(a)のように、上記図11(a)、11(b)、11(e)のレートゲイン(rate gain)が相対的により高いことを確認できる。
同様に、上記図12(b)のように、ビデオシーケンスに対するシミュレーションの場合にも、既存のコーデックの効率に比べて改良された効果を確認できる。
図13は、本発明が適用される実施形態であって、改良された予測コーディング方法を説明するための概略フローチャートである。
まず、ステップS1310で上記原映像信号が受信される場合、上記エンコーダは、ステップS1320で上記原映像信号を利用可能な復元信号と比較することができる。そして、上記エンコーダは、上記比較の結果に基づいて修正信号を決定することができる。
このような場合において、上記修正信号は、歪み成分とレート成分との合計(sum)を最小にするように決定されることができる。上記歪み成分は、上記原映像信号と復元信号との間の歪みの総和(total distortion)を指示し、そして、上記レート成分は、量子化された係数を送信するために要求されるビットの数を指示する。修正信号を決定するために、上記エンコーダは、デコードシミュレーションを行うことができる。
ステップS1330において、上記エンコーダは、上記比較の結果に基づいて変換コーディングされた修正信号を生成できる。
そして、ステップS1340において、上記エンコーダは、上記変換コーディングされた修正信号及び上記利用可能な復元信号に基づいて予測信号を生成できる。
それから、ステップS1350において、上記エンコーダは、上記変換−コーディングされた修正信号を上記予測信号と合算して信号を復元できる。
図14は、本発明が適用される実施形態であって、最適な量子化ステップサイズに基づいて量子化を行う方法を説明するための概略フローチャートである。
本発明は、最適な量子化された係数を取得するために量子化を行う処理で、最適な量子化ステップサイズを導出する方法を提供する。このように導出された量子化ステップサイズに基づいて量子化を行うことができる。
まず、量子化パラメータ値から量子化ステップサイズ情報を取得でき、このとき、上記量子化ステップサイズ情報は、スケーリングパラメータ(scaling parameter)を意味できる。上記スケーリングパラメータは、RD(Rate-Distortion)最適化アルゴリズムによって取得されることができる。例えば、上記スケーリングパラメータは、歪み成分(distortion component)とレート成分(rate component)との合計を最小にする値に決定されることができる(S1410)。
一方、上記図8〜図10において説明した実施形態によって、変換コーディングされた修正信号(transform-coded correction signal)を取得できる。例えば、上記変換コーディングされた修正信号(transform-coded correction signal)は、最適な変換係数を含むことができる。
上記S1410ステップで決定されたスケーリングパラメータに基づいて、上記変換コーディングされた修正信号に対して量子化を行うことができる(S1420)。
このように量子化された係数がエントロピエンコードされて送信されることができる(S1430)。
図15及び図16は、本発明が適用される実施形態であって、量子化エラー制御による改良されたコーディング方法が適用されるエンコーダ及びデコーダの概略ブロック図を示す。
本発明は、空間的、スペクトル、格子ノーム(norm)の3つの空間で同時に要素(factors)を処理することにより、量子化効果を制御するコーディングパラメータセットを定義する。イメージ圧縮方式の特定タイプ及びトレーニング(training)技術を利用して決定された最適なパラメータを探すことにより、改良された圧縮を提供できる。
前述した図1では、予測コーディング、変換コーディング、及びハイブリッドコーディングのために必要な全ての要素を含んでいる。
予測コーディングは、以前にコーディングされた部分を利用して信号要素を予測し、予測された値と実際値との間の差値をコーディングすることを基にする。コーディングされるデータ(イメージ又はビデオフレーム)を表すために、N次元ベクトルXを用い、それの予測された値を表すために、ベクトルPを用いる。このような予測は、復元されたベクトル
の過去値から形成されたベクトルyを用いて算出される。
まず、予測残差を表す差分ベクトルを下記の数式48のように計算することができる。
[数式48]
d=x−p(y)
次に、このような差は、一般にN×N行列Tにより表現される直交線形変換を利用してさらに(追加的に)(additionally)変換され(transformed)、その後、ベクトル係数は、エントロピコーディングのための整数に転換される(converted)。
整数係数を有するベクトルは、cにより表示され、次の数式49のように定義されることができる。
[数式49]
c=Q(T[x−p])、ci∈Z、i=1、2、...、N
一般に、量子化は、直交スケーリング行列Qを用いて行われ、これは、次の数式50のとおりである。
[数式50]
c=[[QT(x−p)]]
ここで、ダブルブラケット(二重角括弧)(double brackets、[[]])は、次の数式のようにエレメント別の丸め(ラウンド)(per-element rounding)を表す。
最後に、復元されたベクトル
は、次の数式を利用して、エンコーダとデコーダとの両方で計算され得る。
ここで、
は、復元されたベクトル、pは、予測ベクトル、Tは、変換行列、Qは、量子化行列、そしてcは、変換係数を表す。
行列TがDCTなどの変換により定義されるとき、変換の適用は、残差ベクトルdのスペクトル成分を計算することとほとんど同一である。したがって、本発明では、対角行列(diagonal matrix)Qの他の値を用いることにより、周波数ドメインにおける量子化エラーの分布(分配)(distribution)を変更できる。
イメージ又はビデオブロックのベクトル内の全てのエレメントがインターブロック予測時に同じ方式で利用されることはできない。したがって、ブロック境界に存在するいくつかの要素のエラーのため、予測精度が顕著に減少することがある。
そして、DCTのような線形変換は、独立してベクトルに適用されるとき、ブロック境界でブロッキング(ブロック)アーチファクト(blocking artifact)を生成することがある。
これは、ブロックの他の部分で発生するエラー毎に互いに重要度が異なるということと関連がある。本発明は、空間ドメイン上で量子化エラーをより細かく制御する方法を提供することにより、ブロッキングアーチファクトを軽減させることができる。しかし、対角行列(diagonal matrix)Qを用いたアプローチは、単に周波数ドメインでの制御のみを可能とする。したがって、本発明は、空間ドメインと周波数ドメインとの両方で量子化エラーを制御できるようにすることにより、上記のような問題を解決できる。
図15に示すように、本発明が適用されるエンコーダ1500は、最適化部1520、逆量子化部1530、逆変換部1540、バッファ1550、予測部1560、及びエントロピエンコード部1570を備えることができる。ここで、上記逆変換部1540は、空間スケーリング部1545を備えることができる。
図15のエンコーダ1500をみると、最適化部1520では、最適な量子化された変換係数を取得できる。
まず、上記最適化部1520は、トレーニングステップを介して最適な量子化された変換係数を取得できる。例えば、上記最適化部1520は、RD(Rate-Distortion)の観点において、対角行列S、W、Qの最適セットを計算できる。
本発明は、空間ドメイン上のスケーリングファクタである、さらに他の対角行列(diagonal matrix)Sを追加する方法を提供する。この場合、信号復元のための処理は、次の数式53のように変更され得る。
[数式53]
x=p+ST-1-1
これは、数式3のように単純な丸め(rounding)を用いて最適な変換係数を計算するようにする直交条件(orthogonal condition)を変更できる。したがって、本発明は、最適な変換係数を次の数式54に基づいて計算することができる。
ここで、Wは、空間ドメイン上でエラーの重要度を区別するために用いられるさらに他の対角行列を表す。
また、上記対角行列S、W、Qの最適なセットを探すために、本発明は、平均2乗誤差(Mean Squared Error;MSE)などの客観的な歪み測定、又はブロッキングアーチファクトの可視性(視感度)(visibility)などの主観的要素を含むさらに他の歪み測定を利用できる。
そして、イメージ又はビデオフレームをコーディングする前に、付加情報(side information)として対角行列S、W、Qの値をエンコードできる。このとき、デコーダにより認識可能な適切なプロトコルが利用され得る。
逆量子化部1530は、最適な量子化された変換係数に逆量子化を行って変換係数を取得できる。
上記逆変換部1540は、上記変換係数に逆変換を行うことにより、予測エラーベクトルを取得できる。このとき、上記逆変換は、スケール直交行列Sを含むことができる。このように、空間ドメイン上でスケーリング行列を追加することにより、空間ドメイン上でも量子化エラーを制御できる。
上記スケール直交行列Sによるスケーリングは、上記逆変換部1540内の空間スケーリング部1545で行われることができる。また、上記空間スケーリング部1545は、上記逆変換部1540による逆変換処理後に位置することもできる。
上記取得された予測エラーベクトルを予測部1560から出力された予測信号(prediction signal)に加えることにより、復元信号(reconstructed signal)が生成され得る。
バッファ1550は、上記予測部1560による今後の参照(future reference)のために上記復元信号を記憶し、上記予測部1560は、上記バッファ1550に記憶された以前に復元された信号(previously reconstructed signal)を用いて予測信号(prediction signal)を生成する。
一方、上記最適化部1520から取得された最適な量子化された変換係数は、エントロピエンコード部1570に送信され、上記エントロピエンコード部1570は、上記最適な量子化された変換係数をエントロピエンコードして出力することができる。
図16に示すように、本発明が適用されるデコーダ1600は、エントロピデコード部1610、逆量子化部1620、逆変換部1630、バッファ1640、及び予測部1650を備えることができる。ここで、上記逆変換部1630は、空間スケーリング部1635を備えることができる。
図16のデコーダ1600は、上記図15のエンコーダ1500から出力された信号を受信し、受信された信号は、エントロピデコード部1610を介してエントロピデコードされる。
逆量子化部1620では、量子化ステップサイズ情報を利用してエントロピデコードされた信号から変換係数を取得し、逆変換部1630では、上記変換係数を逆変換して予測エラーを取得する。このとき、上記逆変換は、スケール直交行列Sを含むことができる。
上記スケール直交行列Sによるスケーリングは、上記逆変換部1630内の空間スケーリング部1635で行われることができる。上記空間スケーリング部1635は、上記逆変換部1630による逆変換処理後に位置することもできる。また、上記図15において説明した実施形態が適用され得る。
上記取得された予測エラーを上記予測部1650から出力された予測信号(prediction signal)に加えることにより、復元信号(reconstructed signal)が生成される。
バッファ1640は、予測部1650による今後の参照(future reference)のために上記復元信号を記憶し、上記予測部1650は、上記バッファ1640に記憶された以前に復元された信号(previously reconstructed signal)を用いて予測信号(prediction signal)を生成できる。
図17は、本発明が適用される実施形態であって、RD(Rate-Distortion)の最適化処理を介してスケーリング対角行列(scaling diagonal matrix)を取得する処理を説明するフローチャートである。
数式46により定義されるコーディングの式において、c∈ZN、すなわち、コーディングされるデータのベクトルが整数値のみを有することができるので、近似されたピクセルの再生(reproduction)値が取得され得る。
本発明は、付加的なエラーベクトルeを定義し、統計的方法を使用する近似をモデル化できる。
[数式55]
-1-1c=x−p+e
cの各成分の丸め誤差は、上記直交行列Tによる掛け算を介して結合されることができる。高いレート近似に対し、eの成分は、ゼロ平均及び同じ分散(variance)を有する、独立したランダムガウス変数であると仮定することができる。したがって、数式46から取得された値によって、数式56が算出される。
数式56は、エラーがブロック内の全てのピクセルに対してほぼ同じ分布を有するということを意味する。
数式57により定義される新しい処理方式を利用して、残差値のx−pは、適切な再生を取得するために、S−1だけ予めスケーリング(pre-scale)される。
[数式57]
S T-1-1c=S[S-1(x−p)+e]
eの成分は、ゼロ平均及び同じ分散を有する、独立したランダムガウス変数である。
しかし、このような場合において、数式58により与えられるピクセルが再生された。
数式52は、現在、各ピクセルでのエラーが対角行列Sにおけるスケーリング要素に比例して相違した分散を有することを意味する。したがって、Si,iのより大きい値は、相対的により大きいエラー分散を発生させ、その逆も成立する。
下記において、本発明のさらに詳細な説明が提示される。例えば、本発明は、予め定義されたビデオセグメント、例えば、コーディング部、フレーム、タイル、スライスなどに対して適用されることができる。
エンコーダにおいて、次のステップにしたがって本発明が行われ得る。
まず、上記エンコーダは、上記セグメント内のコーディングピクセルブロックに対して使用される行列S、W、及びQを選択できる。
次に、各セグメント内のピクセルをコーディングする前に、上記エンコーダは、行列S及びQに関する情報を圧縮されたビットストリームに付加することができる。例えば、Tは仮定された定数であり、Wは、上記エンコーダによってのみ使用される。
それから、各ピクセルブロックに対して、上記エンコーダは、上記最適ベクトルc∈ZNを探すことができ、その値をエントロピコーディングし、これを上記圧縮されたビットストリップに付加する。
デコーダにおいて、本発明は、次のステップにしたがって行われ得る。
まず、各セグメントでピクセルをデコードする前に、上記デコーダは、上記行列S及びQに関する情報を上記圧縮されたビットストリームから読み取ることができる。
それから、各ピクセルブロックに対して、上記デコーダは、上記ベクトルc∈ZNをエントロピデコードすることができ、数式59を利用して復元されたピクセル値を計算する。
本発明の実施形態は、レート歪み(RD)の最適化処理を介してスケーリング対角行列を取得する処理を提供する。
まず、エンコーダは、トレーニングを介してRD(Rate-Distortion)最適化処理を行うことができる(S1710)。例えば、このようなRD(Rate−Distortion)最適化処理は、上記最適化部1520により行われることができる。
上記RD(Rate-Distortion)最適化処理を介して、対角行列S、W、Qの最適セットを計算できる(S1720)。
上記対角行列S、W、Qの値を付加情報(side information)としてエンコードすることができる(S1730)。
その後、上記図15及び図16において記載した処理によって、ビデオ信号をエンコード又はデコードすることができる(S1740)。
例えば、上記対角行列のうち、スケーリング対角行列Sは、エンコーダ1500の逆変換部1540又はデコーダ1600の逆変換部1630で用いられることにより、空間ドメイン上でも量子化エラーを制御できる。
図18は、本発明が適用される実施形態であって、最適化されたスケーリング行列を用いてコーディングした場合と既存の方式のとおりにコーディングした場合とにおいて、各イメージのコーディングゲイン(coding gain)を比較するグラフである。
上記図18は、エラー伝達の制御とコーディングゲインとの関係を図示することができる。
グラフ上の点線は、一般的なコーデックのコーディングゲインを示し、実線は、最適な対角行列を用いたときのコーディングゲインを示す。
本実施形態の場合、平面予測(planar prediction)及び4×4DCTを用いた場合である。3個のテストイメージ、「Woman」、「Bike」、「Cafe」において全て、最適な対角行列を用いたとき、より良好なコーディング効率見られる点を確認できる。
これは、本発明の一実施形態であり、上記で言及した条件に限定されず、他の条件の実施形態にも適用可能である。
図19及び図20は、本発明が適用される実施形態であって、各々改良されたコーディング方法が適用されるエンコーダ及びデコーダの概略ブロック図を示す。
図19のエンコーダ1900は、最適化部1910、量子化部1920、及びエントロピエンコード部1930を備える。図20のデコーダ2000は、エントロピデコード部2010、逆量子化部2020、逆変換部2030、及び復元部2040を備える。
図19の上記エンコーダ1900を参照すると、上記最適化部1910は、最適化された変換コーディングされた修正信号を取得する。上記最適化部1910は、最適化された変換コーディングされた修正信号を取得するために、下記の実施形態を使用できる。
本発明が適用され得る実施形態を図示するために、まず、信号を復元するための復元関数が次のように定義され得る。
数式60において、
は、復元信号を表し、cは、デコードされた変換コーディング修正信号を表し、yは、コンテキスト信号を表す。R(c、y)は、復元信号を生成するために、c及びyを用いる復元関数を表す。
本実施形態において、復元関数は、以前に復元された値と変換コーディングされた修正信号との間の関係として定義され得る。したがって、上記デコードされた修正信号は、上記復元値のみならず、復元処理全体及び復元関数の選択にも影響を及ぼす。
例えば、修正信号は、次のように定義され得る。
数式61において、eは、修正信号を表し、cは、変換コーディングされた修正信号を表し、Tは、変換行列を表す。また、一部の場合において、上記修正信号は、エラー信号又は予測エラー信号を意味できる。
このような場合において、復元信号は、次のように定義されることができる。
数式62において、
は、復元信号のn番目の成分を表し、eは、上記修正信号を表し、yは、コンテキスト信号を表す。Rnは、復元信号を生成するために、
を用いる復元関数を表す。
一実施形態において、上記復元関数Rnは、次のように定義されることができる。
数式63において、Pnは、予測信号を生成するための上記パラメータの式である1つのタイプの予測関数(a type of prediction function formed of the parameters)を表す。
例えば、上記予測関数は、メディアン(中央値)関数、ランク次数フィルタと非線形関数との組み合わせ、又は線形関数の組み合わせでありうる(The prediction function may be, for example, a median function, a combination of a rank order filter and a nonlinear function, or a combination of linear functions)。さらに、非線形予測関数Pn()は、相違した(異なる)(different)非線形関数でありうる。
本発明の他の実施形態において、量子化部1920は、上記最適化部1910内に含まれることができるか、又は、上記最適化部1910は、変換部を含むことができる。
本発明の他の実施形態において、上記エンコーダ1900及び上記デコーダ2000は、上記非線形予測関数を選択するための候補関数の記憶部を含むことができる。
このような場合において、上記最適化された非線形予測関数は、上記記憶部に記憶された候補関数から選択されることができる。
最適化された非線形予測関数が前述されたように選択される場合、上記最適化部1910は、上記最適化された非線形予測関数を用いて最適化された予測信号を生成できる。そして、上記最適化部1910は、上記最適化された予測信号に基づいて最適化された予測エラー信号を生成でき、上記最適化された予測エラー信号に対する変換コーディングを行うことができる。上記最適化部1910は、上記変換コーディングを介して変換コーディングされた係数を出力できる。このような場合において、上記変換コーディングされた係数は、最適化された変換係数を意味できる。
上記出力変換係数は、上記量子化部1920に送信される。上記量子化部1920は、上記変換係数を量子化し、上記量子化された変換係数を上記エントロピエンコード部1930に送信する。
上記エントロピエンコード部1930は、量子化された変換係数に対してエントロピエンコードを行い、圧縮されたビットストリームを出力できる。
図20の上記デコーダ2000は、図19の上記エンコーダから上記圧縮されたビットストリームを受信することができ、上記エントロピデコード部2010を介してエントロピデコードを行うことができ、上記逆量子化部2020を介して逆量子化を行うことができる。このような場合において、上記逆量子化部2020による信号出力は、最適化された変換係数を意味できる。
上記逆変換部2030は、上記最適化された変換係数を受信し、逆変換処理を行い、逆変換処理を介して予測エラー信号を取得できる。
上記復元部2040は、予測エラー信号と予測信号とを共に合算して復元信号を取得できる。このような場合において、図19を参照して記述される様々な実施形態が、上記予測信号に適用され得る。
図21は、本発明が適用される実施形態であって、改良されたビデオコーディング方法を説明するための概略フローチャートである。
まず、ステップS2110で上記原映像信号が受信される場合、ステップS2120において、上記エンコーダは、上記原映像信号を利用可能な復元信号と比較することができる。そして、ステップS2130において、上記エンコーダは、上記比較の結果に基づいて修正信号を決定できる。
このような場合において、歪み成分とレート成分との合計を最小にするために、上記予測信号が決定され得る。上記歪み成分は、上記原映像信号と復元信号との間の歪みの総和を指示し、上記レート成分は、量子化された係数を送信するために要求されるビットの数を指示する。修正信号を決定するために、上記エンコーダは、デコードシミュレーションを行うことができる。
本発明は、上記信号復元のために使用される復元関数を決定するステップをさらに含むことができ、上記復元関数は、線形成分及び非線形成分のうち、少なくとも1つを含む。
そして、上記復元関数は、上記以前に復元されたサンプル及び上記修正信号の全てに基づいて決定されることができる。
それから、ステップS2140において、上記エンコーダは、信号復元のために送信される変換コーディングされた修正信号を生成できる。ここで、上記変換−コーディングされた修正信号は、逆量子化行列及び逆変換行列により掛けられることができ、ビットレート及び量子化エラーを制御するために、上記逆量子化行列が選択され得る。
さらに、上記変換コーディングされた修正信号は、ピクチャグループに対する修正信号に対応でき、時空間変換コーディングが上記修正信号に印加され得る。
本発明の一実施形態によれば、上記デコーダは、本発明により取得された変換コーディングされた修正信号を含むビットストリームを受信することができ、上記エントロピデコード部を介してエントロピデコードを行うことができ、上記逆量子化部を介して逆量子化を行うことができ、上記逆変換部を介して逆変換を行うことができる。上記デコーダは、上記変換コーディングされた修正信号に対して逆変換を行い、修正信号を取得できる。
それから、上記デコーダは、上記取得された修正信号とコンテキスト信号とを結合する復元関数を用いて復元信号を取得できる。ここで、上記コンテキスト信号は、以前に復元されたサンプルの全てに基づいて取得され得る。
さらに、上記デコーダは、上記信号復元のために使用される復元関数を決定でき、上記復元関数は、線形成分及び非線形成分のうち、少なくとも1つを含むことができる。ここで、上記復元関数は、上記以前に復元されたサンプル及び上記修正信号の全てに基づいて決定されることができる。
上記変換コーディングされた修正信号は、逆量子化行列及び逆変換行列により掛けられることができる。また、上記変換コーディングされた修正信号は、ピクチャグループに対する修正信号に対応でき、時空間変換コーディングが上記修正信号に印加されている。
前述されたように、本発明が適用され得る上記デコーダ及び上記エンコーダは、マルチメディア放送送信/受信装置、移動通信端末機、ホームシネマビデオ装置、デジタルシネマビデオ装置、監視カメラ、ビデオチャット装置(video chatting apparatus)、ビデオ通信などのリアルタイム通信装置、移動ストリーミング装置、記憶媒体、カムコーダ、VoDサービス提供装置、インターネットストリーミングサービス提供装置、3次元(3D)ビデオ装置、テレコンファレンスビデオ装置、及び医療ビデオ装置内に含まれることができ、ビデオ信号及びデータ信号をコーディングするのに使用されることができる。
また、本発明が適用され得る上記デコード/エンコード方法は、コンピュータにより実行され得るプログラムの形で製作されて、コンピュータ読み取り可能な記録媒体に記憶されることができる。本発明に係るデータ構造を有するマルチメディアデータは、コンピュータ読み取り可能な記録媒体に記憶されることができる。
上記コンピュータ読み取り可能な記録媒体は、コンピュータシステムによって読み取ることのできるデータが記憶される全ての種類の記憶装置を含む。上記コンピュータ読み取り可能な記録媒体は、例えば、BD、USB、ROM、RAM、CD−ROM、磁気テープ、フロッピー(登録商標)ディスク、光学データ記憶装置を含むことができる。また、上記コンピュータ読み取り可能な記録(記憶)媒体は、搬送波(例えば、インタネットを介しての送信)の形で実現される媒体を含む。さらに、上記エンコード方法により生成されたビットストリームがコンピュータ読み取り可能な記録媒体内に記憶されるか、又は有無線通信網を介して送信されることができる。
本発明の例示的な実施形態は、例示の目的のために開示されたものであり、当該技術分野における通常の知識を有した者は、添付された請求項に開示された本発明の技術的精神及び範囲内で様々な他の実施形態を向上、変更、置き換え、又は付加することができる。

Claims (20)

  1. 映像信号をエンコードする方法であって、
    原映像信号を受信するステップと、
    前記原映像信号を利用可能な復元信号と比較するステップと、
    前記比較の結果に基づいて変換コーディングされた修正信号を生成するステップと、
    前記変換コーディングされた修正信号及び前記利用可能な復元信号に基づいて予測信号を生成するステップと、
    前記変換コーディングされた修正信号を前記予測信号に合算して信号を復元するステップと、を有する、エンコード方法。
  2. 歪み成分とレート成分との合計を最小にするスケーリングパラメータを決定するステップと、
    前記スケーリングパラメータに基づいて前記変換コーディングされた修正信号に量子化を行うステップと、をさらに有する、請求項1に記載のエンコード方法。
  3. 前記歪み成分は、前記原映像信号と前記復元された信号との間の歪みの総和を指示し、
    前記レート成分は、量子化された係数を送信するために要求されるビットの数を指示する、請求項2に記載のエンコード方法。
  4. 前記スケーリングパラメータは、量子化パラメータ値から決定される、請求項2に記載のエンコード方法。
  5. コーディングされる前記原映像信号を複数のレイヤに分解するステップをさらに有する、請求項1に記載のエンコード方法。
  6. 非直交変換行列は、前記信号を復元するのに使用される、請求項1に記載のエンコード方法。
  7. 映像信号をデコードする方法であって、
    最適な量子化された係数を有する前記映像信号を受信するステップと、
    前記最適な量子化された係数に基づいて残差エラーベクトルを取得するステップと、
    前記残差信号を予測信号に合算して前記映像信号を復元するステップと、
    を有し、
    前記最適な量子化された係数は、以前に復元された信号の全てに基づいて取得される、デコード方法。
  8. 前記映像信号からスケーリングパラメータを抽出するステップと、
    前記スケーリングパラメータに基づいて前記最適な量子化された係数へ量子化を行うステップと、をさらに有する、請求項7に記載のデコード方法。
  9. 前記スケーリングパラメータは、量子化パラメータ値から決定される、請求項8に記載のデコード方法。
  10. デコードされる前記映像信号を複数のレイヤに分解するステップをさらに有する、請求項7に記載のデコード方法。
  11. 非直交変換行列は、前記映像信号を復元するのに使用される、請求項7に記載のデコード方法。
  12. 映像信号をエンコードする装置であって、
    原映像信号を受信するように構成される受信部と、
    前記原映像信号を利用可能な復元信号と比較し、前記比較の結果に基づいて変換コーディングされた修正信号を生成するように構成される最適化部と、
    前記変換コーディングされた修正信号及び前記利用可能な復元信号に基づいて予測信号を生成するように構成される予測部と、
    前記変換コーディングされた修正信号を前記予測信号に合算して信号を復元するように構成される復元部と、を備える、エンコード装置。
  13. 歪み成分とレート成分との合計を最小にするスケーリングパラメータを決定するように構成される前記最適化部と、
    前記スケーリングパラメータに基づいて前記変換コーディングされた修正信号に量子化を行うように構成される量子化部と、をさらに備える、請求項12に記載のエンコード装置。
  14. 前記歪み成分は、前記原映像信号と前記復元された信号との間の歪みの総和を指示し、
    前記レート成分は、量子化された係数を送信するために要求されるビットの数を指示する、請求項13に記載のエンコード装置。
  15. 前記スケーリングパラメータは、量子化パラメータ値から決定される、請求項13に記載のエンコード装置。
  16. コーディングされる前記原映像信号は、複数のレイヤに分解される、請求項12に記載のエンコード装置。
  17. 非直交変換行列は、前記信号を復元するのに使用される、請求項12に記載のエンコード装置。
  18. 映像信号をデコードする装置であって、
    最適な量子化された係数を有する前記映像信号を受信するように構成される受信部と、
    前記最適な量子化された係数に基づいて残差エラーベクトルを取得するように構成される逆変換部と、
    前記残差信号を予測信号に合算して、前記映像信号を復元するように構成される復元部と、を備え、
    前記最適な量子化された係数は、以前に復元された信号の全てに基づいて取得される、デコード装置。
  19. 前記映像信号からスケーリングパラメータを抽出し、前記スケーリングパラメータに基づいて前記最適な量子化された係数へ量子化を行うように構成される逆量子化部をさらに備える、請求項18に記載のデコード装置。
  20. 非直交変換行列は、前記映像信号を復元するのに使用される、請求項18に記載のデコード装置。
JP2016560329A 2013-12-22 2014-12-22 予測された信号と変換コーディングされた信号とを用いたビデオ信号の予測方法及び装置 Active JP6730191B2 (ja)

Applications Claiming Priority (7)

Application Number Priority Date Filing Date Title
US201361919803P 2013-12-22 2013-12-22
US61/919,803 2013-12-22
US201461941499P 2014-02-19 2014-02-19
US201461941498P 2014-02-19 2014-02-19
US61/941,498 2014-02-19
US61/941,499 2014-02-19
PCT/KR2014/012623 WO2015093909A1 (en) 2013-12-22 2014-12-22 Method and apparatus for predicting video signal using predicted signal and transform-coded signal

Publications (2)

Publication Number Publication Date
JP2017501659A true JP2017501659A (ja) 2017-01-12
JP6730191B2 JP6730191B2 (ja) 2020-07-29

Family

ID=53403157

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2016560329A Active JP6730191B2 (ja) 2013-12-22 2014-12-22 予測された信号と変換コーディングされた信号とを用いたビデオ信号の予測方法及び装置
JP2016560328A Pending JP2017509268A (ja) 2013-12-22 2014-12-22 量子化エラーの追加的な制御を利用したビデオ信号のエンコード、デコード方法及び装置

Family Applications After (1)

Application Number Title Priority Date Filing Date
JP2016560328A Pending JP2017509268A (ja) 2013-12-22 2014-12-22 量子化エラーの追加的な制御を利用したビデオ信号のエンコード、デコード方法及び装置

Country Status (6)

Country Link
US (2) US20160360237A1 (ja)
EP (2) EP3085089B1 (ja)
JP (2) JP6730191B2 (ja)
KR (2) KR20160104646A (ja)
CN (2) CN105850136B (ja)
WO (2) WO2015093909A1 (ja)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6571193B2 (ja) * 2014-08-22 2019-09-04 ノバ サウスイースタン ユニバーシティーNova Southeastern University クロネッカー積を使用するデータアダプティブ圧縮およびデータ暗号化
CN108353175B (zh) * 2015-09-21 2021-03-12 Lg 电子株式会社 使用系数引起的预测处理视频信号的方法和装置
US10305717B2 (en) * 2016-02-26 2019-05-28 VertoCOMM, Inc. Devices and methods using the hermetic transform for transmitting and receiving signals using multi-channel signaling
CN111107357B (zh) * 2018-10-25 2022-05-31 杭州海康威视数字技术股份有限公司 一种图像处理的方法、装置、系统及存储介质
US11032574B2 (en) * 2018-12-31 2021-06-08 Tencent America LLC Method and apparatus for video coding
US11343512B1 (en) 2021-01-08 2022-05-24 Samsung Display Co., Ltd. Systems and methods for compression with constraint on maximum absolute error
CN114925805A (zh) * 2022-03-10 2022-08-19 吉林大学 图神经网络模型及其确定方法、图表示方法、介质及终端

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012104926A (ja) * 2010-11-08 2012-05-31 Oki Electric Ind Co Ltd 量子化パラメータ制御装置、量子化パラメータ制御方法、及びプログラム
JP2012147268A (ja) * 2011-01-12 2012-08-02 Ntt Docomo Inc 画像予測符号化方法、画像予測符号化装置、画像予測符号化プログラム、画像予測復号方法、画像予測復号装置及び画像予測復号プログラム
EP2595382A2 (en) * 2011-11-21 2013-05-22 Research In Motion Limited Methods And Devices For Encoding And Decoding Transform Domain Filters
US20130208790A1 (en) * 2010-07-09 2013-08-15 British Broadcasting Corporation Picture coding and decoding

Family Cites Families (38)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TW364107B (en) 1996-03-25 1999-07-11 Trw Inc Method and system for three-dimensional compression of digital video signals
US5867416A (en) 1996-04-02 1999-02-02 Lucent Technologies Inc. Efficient frequency domain analysis of large nonlinear analog circuits using compressed matrix storage
US20040091055A1 (en) * 2002-10-30 2004-05-13 Williams Thomas Holtzman Digital transmission system using non-orthogonal matrices
US7567617B2 (en) 2003-09-07 2009-07-28 Microsoft Corporation Predicting motion vectors for fields of forward-predicted interlaced video frames
US7778474B2 (en) * 2004-10-06 2010-08-17 Nippon Telegraph And Telephone Corporation Scalable encoding method and apparatus, scalable decoding method and apparatus, programs therefor, and storage media for storing the programs
US7817723B2 (en) 2004-12-14 2010-10-19 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E. V. Apparatus and method of optimizing motion estimation parameters for encoding a video signal
KR100913088B1 (ko) * 2005-01-21 2009-08-21 엘지전자 주식회사 베이스 레이어의 내부모드 블록의 예측정보를 이용하여영상신호를 엔코딩/디코딩하는 방법 및 장치
KR100873636B1 (ko) 2005-11-14 2008-12-12 삼성전자주식회사 단일 부호화 모드를 이용하는 영상 부호화/복호화 방법 및장치
GB0600141D0 (en) * 2006-01-05 2006-02-15 British Broadcasting Corp Scalable coding of video signals
US7899263B2 (en) 2006-01-10 2011-03-01 Texas Instruments Incorporated Method and apparatus for processing analytical-form compression noise in images with known statistics
AU2006338425B2 (en) 2006-02-13 2010-12-09 Kabushiki Kaisha Toshiba Moving image encoding/decoding method and device and program
KR101246294B1 (ko) 2006-03-03 2013-03-21 삼성전자주식회사 영상의 인트라 예측 부호화, 복호화 방법 및 장치
US8634462B2 (en) 2007-03-13 2014-01-21 Matthias Narroschke Quantization for hybrid video coding
JP2009020665A (ja) * 2007-07-11 2009-01-29 Canon Inc 情報処理装置、情報処理方法、記憶媒体、プログラム
US8024121B2 (en) 2008-01-25 2011-09-20 Smith International, Inc. Data compression method for use in downhole applications
JP2010057129A (ja) 2008-08-29 2010-03-11 Toshiba Corp 符号化装置、及び復号装置
TW201028018A (en) 2009-01-07 2010-07-16 Ind Tech Res Inst Encoder, decoder, encoding method and decoding method
US20100238997A1 (en) * 2009-03-17 2010-09-23 Yang En-Hui Method and system for optimized video coding
EP2237557A1 (en) * 2009-04-03 2010-10-06 Panasonic Corporation Coding for filter coefficients
US9081733B2 (en) * 2009-06-24 2015-07-14 Qualcomm Incorporated 16-point transform for media data coding
EP2520092A1 (en) * 2009-12-31 2012-11-07 Thomson Licensing Methods and apparatus for adaptive coupled pre-processing and post-processing filters for video encoding and decoding
KR20120086232A (ko) 2011-01-25 2012-08-02 (주)휴맥스 율-왜곡 최적화를 위한 영상 부호화/복호화 방법 및 이를 수행하는 장치
WO2012008514A1 (ja) 2010-07-15 2012-01-19 シャープ株式会社 画像のイントラ予測モード推定装置、画像符号化装置、画像復号装置、及び画像の符号化データ
GB2486726B (en) 2010-12-23 2017-11-29 British Broadcasting Corp Compression of pictures
KR20120098499A (ko) 2011-02-25 2012-09-05 삼성전자주식회사 영상의 변환 방법 및 장치, 및 영상의 역변환 방법 및 장치
US20120218432A1 (en) * 2011-02-28 2012-08-30 Sony Corporation Recursive adaptive intra smoothing for video coding
US20120230422A1 (en) * 2011-03-11 2012-09-13 Korodi Gergely Ferenc Method and System Using Prediction and Error Correction for the Compact Representation of Quantization Matrices In Video Compression
US20120307890A1 (en) 2011-06-02 2012-12-06 Microsoft Corporation Techniques for adaptive rounding offset in video encoding
EP2544450B1 (en) 2011-07-07 2016-04-13 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Model parameter estimation for a rate- or distortion-quantization model function
CN103096053B (zh) * 2011-11-04 2015-10-07 华为技术有限公司 一种变换模式的编解码方法和装置
JP6120490B2 (ja) 2011-11-07 2017-04-26 キヤノン株式会社 画像符号化装置、画像符号化方法及びプログラム、画像復号装置、画像復号方法及びプログラム
US8719321B2 (en) 2011-12-11 2014-05-06 Hong Kong Applied Science and Technology Research Institute Company Limited Adaptive block-size transform using LLMICT
CN102625102B (zh) * 2011-12-22 2014-02-12 北京航空航天大学 一种面向h.264/svc mgs编码的率失真模式选择方法
US9118918B2 (en) 2012-03-06 2015-08-25 National Taiwan University Method for rate-distortion optimized transform and quantization through a closed-form operation
US9392274B2 (en) * 2012-03-22 2016-07-12 Qualcomm Incorporated Inter layer texture prediction for video coding
US20130251028A1 (en) * 2012-03-22 2013-09-26 The Hong Kong University Of Science And Technology Video encoding and decoding with channel prediction and error correction capability
US20150172660A1 (en) 2013-12-17 2015-06-18 Magnum Semiconductor, Inc. Apparatuses and methods for providing optimized quantization weight matrices
US9794575B2 (en) * 2013-12-18 2017-10-17 Magnum Semiconductor, Inc. Apparatuses and methods for optimizing rate-distortion costs in video encoding

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130208790A1 (en) * 2010-07-09 2013-08-15 British Broadcasting Corporation Picture coding and decoding
JP2012104926A (ja) * 2010-11-08 2012-05-31 Oki Electric Ind Co Ltd 量子化パラメータ制御装置、量子化パラメータ制御方法、及びプログラム
JP2012147268A (ja) * 2011-01-12 2012-08-02 Ntt Docomo Inc 画像予測符号化方法、画像予測符号化装置、画像予測符号化プログラム、画像予測復号方法、画像予測復号装置及び画像予測復号プログラム
EP2595382A2 (en) * 2011-11-21 2013-05-22 Research In Motion Limited Methods And Devices For Encoding And Decoding Transform Domain Filters

Also Published As

Publication number Publication date
WO2015093909A1 (en) 2015-06-25
US10856012B2 (en) 2020-12-01
EP3085089A4 (en) 2017-07-05
US20160337646A1 (en) 2016-11-17
EP3085089A1 (en) 2016-10-26
CN105850136B (zh) 2019-10-15
WO2015093908A1 (en) 2015-06-25
EP3085089B1 (en) 2019-11-20
EP3085095A1 (en) 2016-10-26
CN105850124B (zh) 2019-12-31
US20160360237A1 (en) 2016-12-08
KR20160104646A (ko) 2016-09-05
EP3085095A4 (en) 2017-07-05
JP2017509268A (ja) 2017-03-30
KR20160106619A (ko) 2016-09-12
CN105850136A (zh) 2016-08-10
EP3085095B1 (en) 2020-07-08
JP6730191B2 (ja) 2020-07-29
CN105850124A (zh) 2016-08-10

Similar Documents

Publication Publication Date Title
JP6730191B2 (ja) 予測された信号と変換コーディングされた信号とを用いたビデオ信号の予測方法及び装置
JP5957561B2 (ja) 大きいサイズの変換単位を用いた映像符号化、復号化方法及び装置
US10911783B2 (en) Method and apparatus for processing video signal using coefficient-induced reconstruction
KR101418104B1 (ko) 움직임 벡터 해상도 조합을 이용한 움직임 벡터 부호화/복호화 방법 및 장치와 그를 이용한 영상 부호화/복호화 방법 및 장치
WO2017023152A1 (ko) 싱글톤 계수 업데이트를 이용하여 변환을 수행하는 방법 및 장치
US20180278943A1 (en) Method and apparatus for processing video signals using coefficient induced prediction
US10771815B2 (en) Method and apparatus for processing video signals using coefficient induced prediction
US10382792B2 (en) Method and apparatus for encoding and decoding video signal by means of transform-domain prediction
EP3989561A1 (en) Context coding for information on transform kernel set in image coding system
JP2017507538A (ja) 適応予測フィルタを用いて映像信号をエンコード、デコードするための方法及び装置
KR101524664B1 (ko) 참조 프레임 생성 방법 및 장치와 그를 이용한 영상 부호화/복호화 방법 및 장치
KR20180054693A (ko) 비디오 신호의 인코딩, 디코딩 방법 및 그 장치
US10051268B2 (en) Method for encoding, decoding video signal and device therefor
US20200329232A1 (en) Method and device for encoding or decoding video signal by using correlation of respective frequency components in original block and prediction block

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20171213

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20181002

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20190104

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190402

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20190924

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20191224

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200117

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20200609

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20200702

R150 Certificate of patent or registration of utility model

Ref document number: 6730191

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250