JP2018530244A - 選択可能な補間フィルタを用いるビデオ動き補償のための装置および方法 - Google Patents

選択可能な補間フィルタを用いるビデオ動き補償のための装置および方法 Download PDF

Info

Publication number
JP2018530244A
JP2018530244A JP2018515856A JP2018515856A JP2018530244A JP 2018530244 A JP2018530244 A JP 2018530244A JP 2018515856 A JP2018515856 A JP 2018515856A JP 2018515856 A JP2018515856 A JP 2018515856A JP 2018530244 A JP2018530244 A JP 2018530244A
Authority
JP
Japan
Prior art keywords
filter
interpolation
interpolation filter
block
video
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2018515856A
Other languages
English (en)
Inventor
ユリエヴィッチ イコニン セルゲイ
ユリエヴィッチ イコニン セルゲイ
ボリソヴィッチ シチェフ マキシム
ボリソヴィッチ シチェフ マキシム
アレクセヴィッチ ステピン ビクター
アレクセヴィッチ ステピン ビクター
イゴレヴィッチ チェルニャーク ロマン
イゴレヴィッチ チェルニャーク ロマン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Publication of JP2018530244A publication Critical patent/JP2018530244A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/523Motion estimation or motion compensation with sub-pixel accuracy
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/117Filters, e.g. for pre-processing or post-processing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/80Details of filtering operations specially adapted for video compression, e.g. for pixel interpolation
    • H04N19/82Details of filtering operations specially adapted for video compression, e.g. for pixel interpolation involving filtering within a prediction loop
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/85Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
    • H04N19/86Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression involving reduction of coding artifacts, e.g. of blockiness

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Television Systems (AREA)

Abstract

本発明は、動き補償により後続のフレームのビデオストリームを予測符号化して、コード化されたビデオビットストリームにするためのビデオ符号器であって、ビデオストリームの少なくとも1つの参照フレームを記憶するように構成されたフレームバッファ(207)と、分数ピクセル解像度を有する動きベクトルにより参照フレームの参照ブロックから現在のフレームの現在のブロックの予測ブロックを生成するように構成された予測ユニット(210)であって、分数ピクセル解像度は、整数ピクセル位置および分数ピクセル位置を規定する、予測ユニット(210)とを備えるビデオ符号器に関する。予測ユニット(210)は、以下の少なくとも3つの補間フィルタ、すなわち、ぼけ補間フィルタ(302)、タップフィルタ(303)、および当該タップフィルタ(303)の後に続く鮮明化フィルタ(311)のうちの1つを介して分数ピクセル解像度により参照ブロックを補間するように構成される。

Description

本発明は、一般に、ビデオ処理の分野、およびビデオ動き補償のための装置に関し、詳細には、ビデオにおけるフレームを予測する動き補償をサポートするためのビデオ符号器およびビデオ復号器に関する。本発明は、動き補償を使用してビデオストリームを符号化するための方法および復号するための方法にさらに関する。最後に、本発明は、そのような方法を実行するためのプログラムコードを有するコンピュータプログラムに関する。
ビデオ処理の分野において、特に、ハイブリッドビデオ符号化およびハイブリッドビデオ圧縮の分野において、インタ予測およびイントラ予測、ならびに変換符号化を使用することが知られている。そのようなハイブリッドビデオ符号化技術は、H.261、H.263,MPEG−1、2、4、H.264/AVCもしくはH.265/HEVCのような、知られているビデオ圧縮標準において使用される。
図1は、最新技術によるビデオ符号器を示す。ビデオ符号器100は、ビデオストリームのフレームまたはピクチャの入力ブロックを受信するための入力と、コード化されたビデオビットストリームを生成するための出力とを備える。ビデオ符号器100は、ビデオストリームに予測、変換、量子化、およびエントロピ符号化を適用するように適応させられる。変換、量子化、およびエントロピ符号化は、出力としてコード化されたビデオビットストリームを生成するように、それぞれ、変換ユニット101、量子化ユニット102、およびエントロピコード化ユニット103によって行われる。
ビデオストリームは、複数のフレームに対応し、各フレームは、予測ユニット108によってイントラ符号化またはインタ符号化され得るあるサイズのブロックに分割される。例えば、ビデオストリームの第1のフレームのブロックが、予測ユニット108を介してイントラ符号化される。イントラフレームは、同一のフレーム内の情報だけを使用して符号化され、したがって、それは、独立に復号されることができ、かつビットストリームにおけるランダムアクセスのためのエントリポイントを提供することができる。ビデオストリームのその他のフレームのブロックは、予測ユニット108を介してインタ符号化される、すなわち、復元された参照フレームと呼ばれる符号化されたフレームからの情報が時間冗長性を低減するのに使用され、したがって、インタ符号化されたブロックは、復元された参照フレームにおける同一サイズのブロックから予測される。予測ユニット108は、フレームのブロックがイントラ符号化されるか、またはインタ符号化されるかを選択するように適応させられる。
インタ予測を実行するために、符号化された参照フレームが、逆量子化ユニット104、逆変換ユニット105によって処理され、次に、予測ブロックに追加され、ループフィルタリングユニット106によって、復元された参照フレームを獲得するように処理されて、次に、その復元された参照フレームが、時間的インタフレーム予測のために使用されるようにフレームバッファ107に記憶される。
予測ユニット108は、入力として、インタ符号化されるべき、またはイントラ符号化されるべき現在のフレームもしくはピクチャと、フレームバッファ107からの1つもしくは複数の参照フレームもしくは参照ピクチャとを備える。動き推定および動き補償が、予測ユニット108によって適用される。動き推定は、ある費用関数に基づいて動きベクトルおよび参照フレームを獲得するのに使用される。次に、動き補償が、現在のフレームの現在のブロックを、参照フレームの参照ブロックの現在のフレームへの変換に関して記述する。予測ユニット108が、現在のブロックに関する予測ブロックを出力し、予測ブロックは、符号化されるべき現在のブロックとそれの予測ブロックの間の差を最小化する、すなわち、残差ブロックを最小化する。残差ブロックの最小化は、例えば、レート−歪み最適化手順に基づく。
現在のブロックとそれの予測の間の差、すなわち、残差ブロックは、次に、変換ユニット101によって変換される。変換係数は、量子化ユニット102およびエントロピコード化ユニット103によって量子化され、エントロピ符号化される。そのように生成されたコード化されたビデオビットストリームは、イントラ符号化されたブロックと、インタ符号化されたブロックとを備える。
そのようなハイブリッドビデオ符号化は、予測誤差の変換符号化と組み合わされた動き補償された予測を備える。各ブロックに関して、推定された動きベクトルも、コード化されたビデオビットストリームにおいてシグナリングデータとして伝送される。今日の標準、H.264/AVCおよびH.265/HEVCは、動きベクトルに関して1/4ピクセル変位解像度に基づく。分数ピクセル変位を推定し、補償するために、参照ブロックが分数ピクセル位置上で補間されなければならない。補間フィルタが、分数ピクセル位置上でそのような補間されたフレームを獲得するのに使用される。
補間されたブロックの品質は、使用される補間フィルタの特性に強く依存する。ショートタップフィルタ、例えば、バイリニアフィルタが、高い周波数を抑制して、補間されたフレームがぼかされるようにすることがある。ロングタップフィルタのような他のフィルタは、高い周波数を保存するが、鮮明なエッジの近隣においていくらかのリンギングアーチファクトを生成することがある。別の問題は、動き補償が、以前にコード化され、かつ復元されたフレームを参照フレームとして利用することであり、すなわち、参照フレームは、ギブス効果として参照される、変換係数の量子化によってもたらされるアーチファクトを包含することがある。これらのアーチファクトのため、エッジ、ならびにエッジの周囲の区域が歪ませられることもある。
復元された参照ブロックおよび復元された参照フレームは、ビデオ符号器自体によって生成される望ましくない偽のエッジを包含することもある。そのようなアーチファクトは、各ブロックの別個の独立した処理によってもたらされ得る。これに関して、ループフィルタリングユニット106が、これらのブロッキングアーチファクトを緩和することを目的とするデブロッキングフィルタリングを適用するが、ループフィルタリングユニット106は、これらのアーチファクトを部分的に取り除くことしかできない。他のエッジアーチファクトは、平滑な勾配領域の粗い量子化によってもたらされる勾配バンディングと関係していることがあり得る。したがって、参照ブロックおよび参照フレームは、望ましくないエッジを包含し得る。
動き予測の品質は、いくつかの要因に依存する。復元された参照ブロックの品質である、参照ブロックにおけるアーチファクトおよび望ましくないノイズの存在が、動き予測の品質に強く影響する。さらに、補間フィルタが、補間されたエッジの品質、それらのぼけ、および補間されたブロックにおけるリンギングの存在を規定する。また、予測ブロックの内容も、アーチファクトのほとんどはエッジ近くに出現するので、動き予測の品質に影響を及ぼす。
動き補償された予測を向上させるいくつかの技法が、従来技術から知られている。例えば、ビデオ符号化標準H.265/HEVCが、以前のH.264/AVC標準と比べて、より良好な補間品質を提供するより高度な固定線形補間フィルタを用いて提案されている。また、適応ループフィルタリング(ALF)が、ループフィルタリングユニット106において行われることができる。そのようなフィルタリングは、通常、ウィナーベースである、線形適応フィルタを導入して、復元されたブロックと元のブロックの間の差を最小化する。しかし、そのようなループ内フィルタリング技法は、ループ内フィルタが動き補間より前に参照ブロックに適用されるため、動き補間フィルタによってもたらされるアーチファクトを取り除くことができない。
適応補間フィルタ(AIF)は、補間されたブロックと元のブロックの間の差を最小化することによって各分数動き位置に関してウィナーベースの最適な補間フィルタを見出そうと試みる、知られている技法である。見出されたフィルタ係数が、次に、復号器に渡される必要がある。そのような適応フィルタは、線形であり、かつ係数の行列またはベクトルの形態になっている。さらに、各分数動きベクトル位置は、それ自らの最適なフィルタを有する。適応フィルタの形態、および分数位置に関していくつかのフィルタを転送する必要性は、適応補間フィルタリング技法に関して相当なシグナリングオーバーヘッドを暗示する。
前述の欠点および問題を認識して、本発明は、最新技術を向上させることを目的とする。特に、本発明の目的は、後続のフレームのビデオストリームの向上した符号化および復号のためのビデオ符号器、符号化方法、ビデオ復号器、および復号方法を提供することである。
本発明は、予測符号化の品質を向上させることを特に意図する。特に、本発明は、動き補償によってもたらされる、詳細には、分数ピクセル位置上の参照ブロックの補間によってもたらされるアーチファクトを取り除くこと、ならびに参照フレームの量子化アーチファクトを低減することによって予測の品質を向上させることを意図する。本発明のさらなる目的は、コード化されたビデオビットストリームにおけるシグナリングオーバーヘッドを低いレベルに保つことである。
本発明の前述の目的は、添付の独立クレームにおいて提供されるソリューションによって実現される。本発明の有利な実装形態が、それぞれの従属クレームにおいてさらに規定される。
本発明の第1の態様が、動き補償により後続のフレームのビデオストリームを予測符号化して、コード化されたビデオビットストリームにするためのビデオ符号器を提供する。ビデオ符号器は、ビデオストリームの少なくとも1つの参照フレームを記憶するように構成されたフレームバッファを備える。ビデオ符号器は、分数ピクセル解像度を有する動きベクトルにより参照フレームの参照ブロックから現在のフレームの現在のブロックの予測ブロックを生成するように構成された予測ユニットを備え、前記分数ピクセル解像度は、整数ピクセル位置および分数ピクセル位置を規定する。予測ユニットは、以下の少なくとも3つの補間フィルタ、すなわち、ぼけ補間フィルタ、タップフィルタ、および当該タップフィルタの後に続く鮮明化フィルタのうちの1つを介して分数ピクセル解像度により参照ブロックを補間するように構成される。
その結果、予測ユニットの動き補間スキームは、ぼけ補間フィルタ、タップフィルタ、および当該タップフィルタの後に続く鮮明化フィルタである言及される3つの補間フィルタタイプを備える。予測ユニットは、次に、ビデオ内容に依存してフィルタタイプを選択してよい。これら3つのフィルタタイプは、異なるタイプの内容のためのコード化処理中に選択されてよい。
第1の態様によるビデオ符号器の実装形態において、ぼけ補間フィルタと鮮明化フィルタのうちの少なくとも1つは、少なくとも1つの適応パラメータによって制御されるように構成された適応フィルタである。
その結果、参照ブロックは、ビデオの特定の内容に適応させられることができる補間フィルタによって補間され得る。適応は、ビデオ内容の局所的特徴を考慮に入れることができ、要求されるシグナリングオーバーヘッドは、適応および伝送のために1つだけの係数を有する補間フィルタのパラメータ表現が使用されるために制限されることができる。
第1の態様によるビデオ符号器の実装形態において、鮮明化フィルタは、非線形フィルタである。
その結果、そのような非線形鮮明化フィルタのその使用は、動き予測強化のために好ましい。アンシャープマスキング技法のような線形鮮明化またはぼけ除去フィルタに基づく従来のエッジ強化技法は、主観的な品質を高め得るが、動き補間フィルタリングによってもたらされるリンギングアーチファクトを抑制することができない。また、そのような線形鮮明化は、リンギングを増加させて、客観的なパフォーマンス特性を低下させることさえある。他方、提案される非線形鮮明化フィルタは、リンギング除去に関してより良好な結果を提供することができ、このため、有利である。また、鮮明化フィルタに関する、例えば、適応鮮明化フィルタに関する非線形設計の使用は、適応パラメータの数を有利に低減することもでき、このため、シグナリングオーバーヘッドを有利に低減することもできる。
第1の態様によるビデオ符号器の実装形態において、鮮明化フィルタは、単一の適応パラメータによって制御されるように構成される。
その結果、要求されるシグナリングオーバーヘッドは、鮮明化フィルタのために単一の適応パラメータしか使用されないことのためにさらに制限されることができる。特に、予測符号化のために使用されるブロックのサイズは、シグナリングオーバーヘッドを同時に増加させることなしに低減されることができる。
第1の態様によるビデオ符号器の実装形態において、適応鮮明化フィルタは、ソースブロックのエッジマップを生成するように適応させられたエッジマップ計算ユニットを備え、前記ソースブロックは、参照ブロックまたは予測ブロックである。鮮明化フィルタは、ソースブロックのエッジマップをぼかすように適応させられたぼけフィルタを備える。鮮明化フィルタは、ぼかされたエッジマップを高域フィルタリングすることによって、ソースブロックの各位置に関する導関数ベクトルを生成するように適応させられた高域フィルタを備える。鮮明化フィルタは、鮮明化強度係数を用いて導関数ベクトルをスケール変更することによって変位ベクトルを生成するように適応させられたスケール変更ユニットを備える。鮮明化フィルタは、変位ベクトルに基づいて予測ブロックをワープさせるように適応させられたワーピングユニットを備える。
その結果、鮮明化フィルタのこの構造は、リンギングアーチファクトの除去に関してより良好な結果を有利に提供することができる非線形鮮明化フィルタを規定する。
第1の態様によるビデオ符号器の実装形態において、鮮明化フィルタの適応パラメータは、鮮明化強度係数を含む。
その結果、適応パラメータとして鮮明化強度係数を使用することは、シグナリングオーバーヘッドをさらに低減する、1つだけの適応パラメータしか要求されないことを暗示する。
第1の態様によるビデオ符号器の実装形態において、予測ユニットは、残差ブロックを最小化する鮮明化強度係数を選択するように構成され、前記残差ブロックは、現在のブロックと適応鮮明化フィルタによって出力される予測ブロックの間の差である、または、例えば、レート歪み最適化のような費用基準に基づく。
第1の態様によるビデオ符号器の実装形態において、ぼけ補間フィルタは、それの設計の性質のためにリンギングを生成することができない低域フィルタである。
第1の態様によるビデオ符号器の実装形態において、ぼけ補間フィルタは、単一の適応パラメータを備える。
その結果、要求されるシグナリングオーバーヘッドは、ぼけ補間フィルタのために単一の適応パラメータしか使用されないためにさらに制限されることができる。
第1の態様によるビデオ符号器の実装形態において、ぼけ補間フィルタの適応パラメータは、ぼけ係数を含む。
その結果、適応パラメータとしてぼけ係数を使用することは、シグナリングオーバーヘッドをさらに低減する、1つだけの適応パラメータしか要求されないことを暗示する。
第1の態様によるビデオ符号器の実装形態において、ぼけ補間フィルタは、ガウスフィルタまたはバイリニアフィルタであり、かつぼけ補間フィルタがガウスフィルタである場合、ぼけ係数は、ガウス分布の標準偏差である。
その結果、例えば、復元された参照フレームにおいてブロッキングおよび勾配バンディングによってもたらされる望ましくないエッジを、ぼけ補間を適用することによって抑制することが可能である。また、望ましくない高周波数ノイズが、復元された参照フレームにおいて抑制されることができる。
第1の態様によるビデオ符号器の実装形態において、ぼけ補間フィルタは、標準偏差に基づいてガウスフィルタ係数を計算するように構成された計算ユニットと、計算されたガウスフィルタ係数を使用することによって、ぼけ補間フィルタの出力として予測ブロックを生成するように構成されたフィルタリングユニットとを備える。
第1の態様によるビデオ符号器の実装形態において、ビデオ符号器は、異なる標準偏差に基づいてガウスフィルタ係数の事前計算されたセットを記憶するように構成されたユニットと、ガウスフィルタの事前計算されたセットのうちの1つのフィルタを使用することによって、ぼけ補間フィルタの出力として予測ブロックを生成するように構成されたフィルタリングユニットとを備える。
その結果、この事前計算は、最適化手順中に計算リソースが節約されることができるという効果を有する。
第1の態様によるビデオ符号器の実装形態において、予測ユニットは、残差ブロックを最小化するぼけ係数を選択するように構成され、前記残差ブロックは、現在のブロックとぼけ補間フィルタによって出力される予測ブロックの間の差である、または、例えば、レート歪み最適化のような費用基準に基づく。
その結果、動き補償は、最適化手順中にぼけ係数を選択することによってさらに向上させられることができる。
第1の態様によるビデオ符号器の実装形態において、タップフィルタは、シャープなステップ応答を有する固定ロングタップフィルタである。
第1の態様によるビデオ符号器の実装形態において、整数ピクセル位置、および分数ピクセル位置のそれぞれが、少なくとも3つの補間フィルタのうちの前記1つに関連付けられ、および/または、存在する場合、鮮明化フィルタおよび/またはぼけ補間フィルタの適応パラメータの所与の値に関連付けられる。
その結果、ピクセル位置は、3つの補間フィルタのうちの1つ、および、場合により、それぞれの適応パラメータに関連付けられるので、シグナリングオーバーヘッドは、補間フィルタタイプおよび適応パラメータに関するシグナリングポイントとして分数動きベクトル位置が使用されるために低減されることができる。
第1の態様によるビデオ符号器の実装形態において、ビデオ符号器は、コード化されたビデオビットストリームを生成すること、および補間フィルタタイプ、および適応パラメータの前記所与の値、ならびに関連付けられた整数ピクセル位置または分数ピクセル位置を、コード化されたビデオビットストリームにおけるシグナリング情報として指定することを行うように構成されたコード化ユニットを備える。
その結果、復号器に伝送されなければならないシグナリング情報の量が低減されることができ、シグナリングオーバーヘッドが低減されることが可能である。
第1の態様によるビデオ符号器の実装形態において、3つの補間フィルタのなかの補間フィルタの選択は、整数ピクセル位置または分数ピクセル位置に依存し、したがって、所与の整数ピクセル位置または分数ピクセル位置は、所与の補間フィルタの選択、および存在する場合、適応パラメータの選択を暗示する。
その結果、さらなるシグナリングオーバーヘッドを導入することなしに局所的特徴に対する適応を実行することが可能である。
第1の態様によるビデオ符号器の実装形態において、ビデオ符号器は、整数ピクセル位置および分数ピクセル位置の各位置に関して、関連付けられた補間フィルタタイプを規定し、および/または、存在する場合、適応パラメータの値を規定する少なくとも1つの補間フィルタパターンを備える。
その結果、補間フィルタパラメータは、さらなるシグナリングオーバーヘッドを導入することなしに、各補間フィルタタイプを容易に規定することができ、かつ、該当する場合、適応パラメータ値を容易に規定することができる。
その結果、復号器は、ピクセル位置に依存して補間フィルタパターンにおいて規定される補間フィルタを選択することができる。
第1の態様によるビデオ符号器の実装形態において、ビデオ符号器は、複数の補間フィルタパターンを備え、予測ユニットは、複数の補間フィルタパターンのうちの1つを選択するように構成される。
その結果、例えば、複数の補間フィルタパターンが、ビデオストリームを符号化している間、補間フィルタパターンのうちの1つを選択するだけでよいように、前もって計算され、準備されることができる。
第1の態様によるビデオ符号器の実装形態において、ビデオ符号器は、コード化されたビデオビットストリームを生成すること、および前記補間フィルタパターンを、コード化されたビデオビットストリームにおけるシグナリング情報として追加することを行うように構成されたコード化ユニットを備える。
第1の態様によるビデオ符号器の実装形態において、複数の補間フィルタパターンが提供される場合、コード化ユニットは、選択されるべき補間フィルタパターンについての選択情報を、コード化されたビデオビットストリームにおけるシグナリング情報として追加するように構成される。
その結果、この選択情報またはインデックス情報は、復号器によって選択されるべき補間フィルタパターンを示すことができる。復号器が複数の補間フィルタパターンを既に知っている場合、したがって、この選択情報は、シグナリングオーバーヘッドをさらに低減する。
第1の態様によるビデオ符号器の実装形態において、コード化ユニットは、フレームレベルで、GOP(ピクチャのグループ)レベルで、PPS(ピクチャパラメータセット)レベルで、またはSPS(シーケンスパラメータセット)レベルで、フレームの任意の領域または規則的な領域に関して、各予測ブロックに関して選択されるべき補間フィルタパターンについてのシグナリング情報を追加するように構成される。
その結果、シグナリングが最適化されることができるように補間フィルタ情報を所望される粒度に設定することが可能である。
本発明の第2の態様が、動き補償により後続のフレームのビデオストリームを予測符号化して、コード化されたビデオビットストリームにするための方法を提供する。方法は、ビデオストリームの少なくとも1つの参照フレームを記憶することを備える。方法は、分数ピクセル解像度を有する動きベクトルにより参照フレームの参照ブロックから現在のフレームの現在のブロックの予測ブロックを生成することを備える予測ステップを備え、前記分数ピクセル解像度は、整数ピクセル位置および分数ピクセル位置を規定する。予測ステップは、以下の少なくとも3つの補間フィルタ、すなわち、ぼけ補間フィルタ、タップフィルタ、および当該タップフィルタの後に続く鮮明化フィルタのうちの1つを介して分数ピクセル解像度により参照ブロックを補間することをさらに備える。
本発明の第2の態様による方法のさらなる特徴または実装形態は、本発明の第1の態様、またはそれの異なる実装形態によりビデオ符号器の機能を実行することができる。
本発明の第3の態様が、動き補償により後続のフレームのビデオストリームを予測符号化することによって獲得されたコード化されたビデオビットストリームを復号するためのビデオ復号器を提供する。ビデオ復号器は、コード化されたビデオビットストリームから獲得された少なくとも1つの参照フレームを記憶するように構成されたフレームバッファを備える。ビデオ復号器は、分数ピクセル解像度を有する動きベクトルにより参照フレームの参照ブロックから現在のフレームの現在のブロックの予測ブロックを生成するように構成された予測ユニットを備え、前記分数ピクセル解像度は、整数ピクセル位置および分数ピクセル位置を規定する。予測ユニットは、以下の少なくとも3つの補間フィルタ、すなわち、ぼけ補間フィルタ、タップフィルタ、および当該タップフィルタの後に続く鮮明化フィルタのうちの1つを介して分数ピクセル解像度により参照ブロックを補間するように構成される。
その結果、第1の態様によるビデオ符号器に関して獲得される利点は、第3の態様によるビデオ復号器に関しても与えられる。
第3の態様によるビデオ復号器の実装形態において、ぼけ補間フィルタと鮮明化フィルタのうちの少なくとも1つは、少なくとも1つの適応パラメータによって制御されるように構成された適応フィルタである。
その結果、参照ブロックは、ビデオの特定の内容に適応させられることができる補間フィルタによって補間され得る。適応は、ビデオ内容の局所的特徴を考慮に入れることができ、要求されるシグナリングオーバーヘッドは、適応および伝送のために1つだけの係数を有する補間フィルタのパラメータ表現が使用されるために制限されることができる。
第3の態様によるビデオ復号器の実装形態において、3つの補間フィルタのなかの補間フィルタの選択は、整数ピクセル位置または分数ピクセル位置に依存し、したがって、所与の整数ピクセル位置または分数ピクセル位置は、所与の補間フィルタの選択、および/または存在する場合、適応パラメータの値を暗示する。
その結果、補間フィルタタイプおよび適応パラメータに関するシグナリングポイントとして分数動きベクトル位置を使用することは、さらなるシグナリングオーバーヘッドを生成しない。
第3の態様によるビデオ復号器の実装形態において、予測ユニットは、補間フィルタパターンにより3つの補間フィルタのうちの1つを選択するように構成される。前記補間フィルタパターンは、動きベクトルの整数位置、およびそれに関連付けられた分数位置に関して、関連付けられた補間フィルタタイプを規定し、および/または、存在する場合、適応パラメータの値を規定する。
その結果、補間フィルタパラメータは、補間フィルタタイプをそれぞれ容易に規定することができ、かつ、該当する場合、適応パラメータ値を容易に規定することができ、したがって、シグナリングオーバーヘッドがさらに低減されることができる。
第3の態様によるビデオ復号器の実装形態において、ビデオ復号器は、補間フィルタパターンをシグナリング情報として、コード化されたビデオビットストリームから獲得するように構成された復号ユニットを備える。
第3の態様によるビデオ復号器の実装形態において、ビデオ復号器は、複数の補間フィルタパターン、ならびに選択されるべき補間フィルタパターンについての選択情報をシグナリング情報として、コード化されたビデオビットストリームから獲得するように構成された復号ユニットを備える。予測ユニットは、獲得された選択情報により、獲得された補間フィルタパターンのうちの1つを選択すること、および選択された補間フィルタパターンにより3つの補間フィルタのうちの1つを選ぶことを行うように構成される。
その結果、この選択情報またはインデックス情報は、復号器によって選択されるべき補間フィルタパターンを示すことができる。復号器が複数の補間フィルタパターンを知ると、コード化されたビデオビットストリームを介してこの選択情報を伝送するだけでよく、したがって、シグナリングオーバーヘッドがさらに低減されることができる。
第3の態様によるビデオ復号器の実装形態において、予測ユニットは、ビデオ復号器がコード化されたビデオビットストリームを受信する前に複数の補間フィルタパターンを事前記憶するように構成される。ビデオ復号器は、選択されるべき事前記憶された補間フィルタパターンについての選択情報をシグナリング情報として、コード化されたビデオビットストリームから獲得するように構成された復号ユニットを備える。予測ユニットは、獲得された選択情報により事前記憶された補間フィルタパターンのうちの1つを選択すること、および選択された補間フィルタパターンにより3つの補間フィルタのうちの1つを選ぶことを行うように構成される。
その結果、復号器は、複数の補間フィルタパターンを既に知っており、コード化されたビデオビットストリームを介して、この選択情報を伝送するだけでよい。すると、シグナリングオーバーヘッドは、さらに低減されることができる。
第3の態様によるビデオ復号器の実装形態において、復号ユニットは、フレームレベルで、GOP(ピクチャのグループ)レベルで、PPS(ピクチャパラメータセット)レベルで、またはSPS(シーケンスパラメータセット)レベルで、フレームの任意の領域または規則的な領域に関して、各予測ブロックに関して選択されるべき補間フィルタパターンについてのシグナリング情報を獲得するように構成される。
その結果、シグナリングが最適化されることができるように補間フィルタ情報を所望される粒度に設定することが可能である。
本発明の第1の態様による、特に、少なくとも3つの補間フィルタ、およびそれらの構造に関するビデオ符号器のさらなる特徴または実装形態は、本発明の第3の態様によるビデオ復号器にも該当する。
本発明の第4の態様が、動き補償により後続のフレームのビデオストリームを予測符号化することによって獲得されたコード化されたビデオビットストリームを復号するための方法を提供する。方法は、コード化されたビデオビットストリームから獲得された少なくとも1つの参照フレームを記憶することを備える。方法は、分数ピクセル解像度を有する動きベクトルにより参照フレームの参照ブロックから現在のフレームの現在のブロックの予測ブロックを生成することを備える予測ステップを備え、前記分数ピクセル解像度は、整数ピクセル位置および分数ピクセル位置を規定する。予測ステップは、以下の少なくとも3つの補間フィルタ、すなわち、ぼけ補間フィルタ、タップフィルタ、および当該タップフィルタの後に続く鮮明化フィルタのうちの1つを介して分数ピクセル解像度により参照ブロックを補間することをさらに備える。
本発明の第4の態様による方法のさらなる特徴または実装形態は、本発明の第3の態様によるビデオ復号器、およびそれの異なる実装形態の機能を実行することができる。
本発明の第5の態様が、コンピュータプログラムがコンピューティングデバイス上で走るとき、そのような符号化および/または復号方法を実行するためのプログラムコードを有するコンピュータプログラムを提供する。
本発明は、局所的な画像特徴により適応的に調整され得るぼけ補間、従来の補間、および鮮明化補間を含む向上させられた動き補間フィルタリングスキームを適用することに存する動き補償を提案する。動き補間スキームは、コード化処理中に選択され得る異なる3つのフィルタタイプ、すなわち、ぼけフィルタ、固定フィルタ、および鮮明化フィルタを備える。ぼけフィルタおよび鮮明化フィルタは、符号化ピクチャの局所的特徴によりうまく適合するように適応的であってよい。補間フィルタタイプおよび適応パラメータを復号器にシグナリングするために、分数動きベクトル位置を使用することが提案される。
提案される補間フィルタリングスキームを用いると、3つのフィルタタイプを適用することによって符号化ピクチャの局所的特徴に対する適応を実行することが可能である。シグナリングオーバーヘッドを低減し、かつ符号化ピクチャのより小さい領域に対する適応を可能にする、適応のための1つだけの係数を有する適応フィルタのパラメータ表現のために低減されたシグナリングオーバーヘッドが実現されることができる。シグナリングオーバーヘッドは、補間フィルタタイプおよび適応パラメータに関するシグナリングポイントとして分数動きベクトル位置が使用されるためにさらに低減されることができる。適応は、低減されたシグナリングオーバーヘッドのために符号化ピクチャの小さい領域の局所的特徴に対して実行されることができる。動き補間フィルタによってもたらされるエッジのリンギングアーチファクトおよびぼけは、補間されたエッジの品質を保ちながら低減されることができる。また、参照ピクチャにおける変換係数の量子化によってもたらされるエッジのリンギングアーチファクトおよびぼけを低減することも可能である。また、動きぼけによってもたらされるエッジのぼけが低減されることもできる。提案されるスキームは、例えば、復元された参照ピクチャにおいてブロッキングおよび勾配バンディングによってもたらされる望ましくないエッジを、ぼけ補間を適用することによって抑制すること、および復元された参照ピクチャにおける望ましくない高周波数ノイズを、ぼけ補間を適用することによって抑制することができる。また、提案されるスキームは、復元されたピクチャにおけるエッジの主観的な品質を高め、かつぼけた勾配領域および平滑な勾配領域の主観的な品質を高めることもする。提案される補間フィルタリングは、ループ参照フィルタリングまたはループ内参照フィルタリングが行うジョブを実行し、同時に、従来の動き補間フィルタによってもたらされるアーチファクトを画像内容に適応的に低減する。
本出願において説明されるすべてのデバイス、要素、ユニット、および手段は、ソフトウェア要素もしくはハードウェア要素、またはこれらの任意の種類の組合せにおいて実装されることができることに留意されたい。本出願において説明される様々なエンティティによって実行されるすべてのステップ、ならびに様々なエンティティによって実行されるように説明される機能は、それぞれのエンティティが、それぞれのステップおよび機能を実行するように適応させられる、または構成されることを意味するように意図される。特定の実施形態の以下の説明において、永遠のエンティティによって完全に形成されるべき特定の機能またはステップが、その特定のステップまたは機能を実行するそのエンティティの特定の詳細な要素の説明において反映されない場合でさえ、これらの方法および機能は、それぞれのソフトウェア要素もしくはハードウェア要素、またはこれらの任意の種類の組合せにおいて実装されることができることが当業者には明白であろう。
本発明の前述の態様および実装形態は、添付の図面に関連して特定の実施形態の以下の説明において説明される。
最新技術によるビデオ符号器を示す図である。 本発明の実施形態によるビデオ符号器を示す図である。 本発明の実施形態によるビデオ符号器の補間フィルタを示す図である。 本発明の実施形態によるビデオ復号器を示す図である。 本発明の実施形態によるビデオ符号化方法を示す図である。 本発明の実施形態によるビデオ復号方法を示す図である。 本発明によるぼけ補間フィルタの実施形態を示す図である。 本発明による鮮明化フィルタの実施形態を示す図である。 本発明の実施形態によるぼけ補間フィルタに関する補間フィルタパターンを示す図である。 本発明の実施形態による鮮明化フィルタに関する補間フィルタパターンを示す図である。 本発明の実施形態による混合補間フィルタパターンを示す図である。 異なる補間フィルタパターンを有する本発明の実施形態を示す図である。
図2は、本発明の実施形態によるビデオ符号器を示し、特に、動き補償により後続のフレームのビデオストリームを予測符号化して、コード化されたビデオビットストリームにするためのビデオ符号器200を示す。さらに、図3は、本発明の実施形態によるビデオ符号器の補間フィルタを示す。
ビデオ符号器200は、特に、フレームバッファ207と、予測ユニットとを備える。
フレームバッファ207は、ビデオストリームの少なくとも1つの参照フレームまたは参照ピクチャを記憶するように構成される。予測ユニット210は、分数ピクセル解像度を有する動きベクトルにより参照フレームの参照ブロックから現在のフレームの現在のブロックの予測ブロックを生成するように構成される。分数ピクセル解像度は、整数ピクセル位置および分数ピクセル位置を規定する。
さらに、予測ユニット210は、以下の少なくとも3つの補間フィルタ、すなわち、
− ぼけ補間フィルタ302、
− タップフィルタ303、および
− 当該タップフィルタ303の後に続く鮮明化フィルタ311
のうちの1つを介して分数ピクセル解像度により参照ブロックを補間するように構成される。
図3に示される鮮明化フィルタ311は、参照符号208によって図2において参照される。図3のぼけ補間フィルタ302およびタップフィルタ303は、補間フィルタブロック209によって図2に表される。
参照フレームは、ビデオストリームの現在のフレームとは異なり得る。特に、本発明の脈絡において、現在のフレームは、現在、コード化されているビデオストリームのフレームである一方で、参照フレームは、既にコード化されており、かつ次に復元されるビデオストリームのフレームである。以下において、「フレーム」という特徴に対するいずれの参照も、「ピクチャ」という特徴に対する参照によって置き換えられてよい。
現在のフレームは、インタ符号化技法を使用してコード化されてよく、すなわち、現在のフレームは、現在のフレームとは別個である少なくとも1つの参照フレームから予測される。参照フレームは、以前のフレーム、すなわち、後続のフレームのビデオストリーム内の現在のフレームに先立って位置付けられたフレームであることができる。あるいは、前方予測が使用される場合、参照フレームは、将来のフレーム、すなわち、現在のフレームの後に位置付けられたフレームであることができる。複数の参照フレームの場合、少なくとも1つが、そのような以前のフレームであることができ、かつそれらのうちの少なくとも1つが、そのような将来のフレームであることができる。参照フレームは、イントラ符号化されることができ、すなわち、まったくさらなるフレームなしに、まったく他のフレームに依存することもなく符号化されることができ、したがって、それは、独立に復号されることができ、かつそれは、ランダムビデオアクセスのためのエントリポイントの役割をすることができる。
特に、予測ユニット210は、動きベクトルを生成すること、および参照フレームの参照ブロックと現在のフレームの現在のブロックの間の動きを推定することによって動き推定を実行するように適応させられる。動き推定は、ある費用関数が、例えば、レート−歪み最適化であることに基づいてコード化中に実行されて、参照フレームにおける最良の参照ブロックをポイントする動きベクトルを見出す。動き推定の他に、予測ユニット210は、動きベクトルおよび参照ブロックをベースに現在のブロックに関する予測ブロックを生成することによって動き補償を実行するようにさらに適応させられる。
特に、動き予測は、動き推定および動き補償を備える。動きベクトルは、動き推定ユニットを使用することによって生成される。参照ブロックおよび現在のブロックは、好ましくは、参照フレームおよび現在のフレームのそれぞれの区域または部分区域である。そのようなブロックは、長方形のような規則的な形状を有してよく、または不規則な形状を有してよい。あるいは、ブロックは、フレームと同一のサイズを有することができる。現在のブロックと参照ブロックの両方が同一のサイズを有する。ブロックのサイズは、サイド情報またはシグナリングデータとして復号器に伝送されるブロックモード情報を介して規定されることが可能である。ブロックは、フレームの一部分を包含する事前規定されたサイズ、例えば、64×64ピクセルのビデオシーケンスの基本符号化構造である符号化ユニットに対応することができる。
予測ブロックは、参照ブロックに鑑みて現在のブロックに関して生成される。特に、複数の予測ブロックが、複数の参照ブロックに鑑みて現在のフレームの複数の現在のブロックに関して生成されることができる。これらの参照ブロックは、単一の参照フレームの一部であることができ、または異なる参照フレームから選択されることができる。いくつかの予測ブロックが、現在のフレームに関して生成されることができ、かつ現在のフレームに関して生成された予測ブロックが組み合わされて、現在のフレームの予測フレームを獲得することができる。
図2のビデオ符号器200は、特に、ハイブリッドビデオ符号化をサポートするための図1のビデオ符号器100と同様であるさらなるユニットを備える。例えば、ビデオ符号器200は、当技術分野において既に知られているとおり、周波数領域への変換を介して変換係数を生成するため、係数を量子化するため、および量子化された係数を、例えば、シグナリングデータと一緒にエントロピ符号化するための変換ユニット201、量子化ユニット202、およびエントロピエンコーダもしくはエントロピコード化ユニット203である同様のユニットを備える。変換ユニット201の入力は、図2においてビデオブロックとして参照される、現在のフレームの現在のブロックと、予測ユニット210によって出力される予測ブロックの間の差として規定される残差ブロックである。エントロピコード化ユニット203は、コード化されたビデオビットストリームを出力として生成するように適応させられる。
ビデオ符号器200は、逆量子化ユニット204、逆変換ユニット205、およびループフィルタリングユニット206であるさらなる同様のユニットを備える。量子化ユニット202によって生成される量子化された変換係数は、それぞれ、逆量子化ユニット204および逆変換ユニット205によって逆量子化され、逆変換されて、変換ユニット201に供給される残差ブロックに対応する復元された残差ブロックを獲得する。次に、復元された残差ブロックが、残差ブロックを生成するために以前に使用された予測ブロックに追加されて、現在のブロックに対応する復元された現在のブロックを獲得するようになり、この復元された現在のブロックは、図2における復元されたビデオブロックとして参照される。復元された現在のブロックは、ループフィルタリングユニット206によって、ブロックごとの処理および量子化によって導入されるアーチファクトを平滑化するように処理され得る。次に、少なくとも1つの現在のブロック、または、有利には、複数の現在のブロックを備える現在のフレームが、復元された現在のブロックから復元されることができる。この復元された現在のフレームは、ビデオストリームの別のフレームのインタ予測のための参照フレームの役割をするようにフレームバッファ207に記憶されることができる。
本発明によって提案される動き補間スキームは、予測ユニット210に配置され、動き推定および動き補償のために使用されて、分数ピクセル位置および整数ピクセル位置におけるフレームブロックが得られる。図3に示されるとおり、補間スキームは、以下の3つの補間フィルタタイプ、すなわち、
− 例えば、ガウスフィルタまたはバイリニアフィルタのような、有利には、リンギングを生成しないぼけ補間フィルタ302、
− 一般に、リンギングを生成することがあるシャープなステップ応答を有する従来のロングタップフィルタ、例えば、H.265/HEVCからの離散コサイン変換ベースの補間フィルタ(DCT−IF)のようなタップフィルタ303、
− シャープなステップ応答を有する従来のロングタップフィルタと、リンギングを低減し、かつエッジの鮮明さを高める非線形鮮明化フィルタの組合せのような、タップフィルタ303の後に鮮明化フィルタ311が続く組合せ
に基づく。
予測ユニット210、300は、少なくとも3つの補間フィルタのうちの1つを介して分数ピクセル解像度によりフレームバッファ207、307に記憶された参照ブロックを補間するように構成される。
動き推定中、これら3つの補間タイプのうちの1つが、例えば、最小予測誤差を行う決定ユニット305によって、または費用(レート/歪み)基準の最小によって選ばれることができる。
図4は、本発明の実施形態によるビデオ復号器、特に、動き補償により後続のフレームのビデオストリームを予測符号化することによって獲得されたコード化されたビデオビットストリームを復号するためのビデオ復号器400を示す。
ビデオ復号器400は、特に、フレームバッファ407と、予測ユニット410とを備える。フレームバッファ407は、コード化されたビデオビットストリームから獲得された少なくとも1つの参照フレームを記憶するように構成される。予測ユニット410は、分数ピクセル解像度を有する動きベクトルにより参照フレームの参照ブロックから現在のフレームの現在のブロックの予測ブロックを生成するように構成され、分数ピクセル解像度は、整数ピクセル位置および分数ピクセル位置を規定する。予測ユニット410は、以下の少なくとも3つの補間フィルタ、すなわち、
− ぼけ補間フィルタ302、
− タップフィルタ303、および
− 当該タップフィルタ303の後に続く鮮明化フィルタ311
のうちの1つを介して分数ピクセル解像度により参照ブロックを補間するように構成される。
復号器400は、ビデオ符号器300によって生成されたコード化されたビデオビットストリームを復号するように適応させられ、復号器400と符号器300の両方は、同一の予測を生成する。図3に示される鮮明化フィルタ311は、参照符号411によって図4において参照される。図3のぼけ補間フィルタ302およびタップフィルタ303は、補間フィルタブロック409によって図2に表される。
特に、ビデオ復号器400は、例えば、逆量子化ユニット404、逆変換ユニット405、およびループフィルタリングユニット406のようなビデオ符号器200にも存在するさらなるユニットを備えてよく、これらは、それぞれ、ビデオ符号器200の逆量子化ユニット204、逆変換ユニット205、およびループフィルタリングユニット206に対応する。エントロピ復号ユニット403が、受信されたコード化されたビデオビットストリームを復号すること、および量子化された残差変換係数、および、存在する場合、シグナリング情報を対応するように獲得することを行うように適応させられる。量子化された残差変換係数は、逆量子化ユニット404および逆変換ユニット405に供給されて、残差ブロックを生成する。残差ブロックは、予測ブロックに追加され、追加は、ループフィルタリングユニット406に供給されて、復号されたビデオを獲得する。復号されたビデオのフレームは、フレームバッファ407に記憶されることができ、かつインタ予測のための参照フレームの役割をすることができる。
ビデオ符号器200とビデオ復号器400は、ぼけ補間フィルタ302、タップフィルタ303、およびタップフィルタ303と鮮明化フィルタ311の組合せである同様の補間フィルタを備える。有利には、ぼけ補間フィルタ302と鮮明化フィルタ311のうちの少なくとも1つは、少なくとも1つの適応パラメータによって制御されるように構成された適応フィルタである。
符号器側と復号器側で同一の予測を確実にするため、整数ピクセル位置、および分数ピクセル位置のそれぞれが、少なくとも3つの補間フィルタ302、303、303+311のうちの1つに関連付けられ、および/または、存在する場合、鮮明化フィルタ311および/またはぼけ補間フィルタ302の適応パラメータの所与の値に関連付けられる。
符号器200および復号器400に関して、3つの補間フィルタのなかの補間フィルタの選択は、整数ピクセル位置または分数ピクセル位置に依存し、したがって、所与の整数ピクセル位置または分数ピクセル位置は、所与の補間フィルタの選択、および存在する場合、適応パラメータの選択を暗示する。
ビデオ符号器200側で、3つの補間フィルタのなかの補間フィルタの選択は、動き推定中に獲得される動きベクトルによって規定される整数ピクセル位置または分数ピクセル位置に依存する。符号器200のコード化ユニット203は、コード化されたビデオビットストリームを生成すること、および補間フィルタタイプ、および、存在する場合、適応パラメータの所与の値、ならびに関連付けられた整数ピクセル位置または分数ピクセル位置を、コード化されたビデオビットストリームにおけるシグナリング情報として指定することを行うように構成される。さらに、コード化ユニット203は、動きベクトルを、コード化されたビデオビットストリームにおけるシグナリング情報として指定する。
ビデオ復号器400は、コード化されたビデオビットストリームからシグナリング情報を獲得するように構成される。復号器400は、補間フィルタタイプ、および関連付けられたピクセル位置を受信し、特に、各ピクセル位置に関して、関連付けられた補間フィルタタイプを受信する。存在する場合、復号器400は、各ピクセル位置に関する適応パラメータの所与の値も受信する。さらに、ビデオ復号器400は、動き推定中に符号器200によって決定された動きベクトルを、コード化されたビデオビットストリームにおけるシグナリング情報として獲得するように構成される。このため、獲得された動きベクトルを使用して、復号器400は、ピクセル位置、および関連付けられた補間フィルタタイプ、ならびに、存在する場合、関連付けられた適応パラメータ値を推測することができる。したがって、シグナリングオーバーヘッドを低減しながら、符号器側と復号器側で同一の予測が行われることができる。
図5は、本発明の実施形態によるビデオ符号化方法を示し、特に、動き補償により後続のフレームのビデオストリームを予測符号化して、コード化されたビデオビットストリームにするための方法を示す。
方法は、ビデオストリームの少なくとも1つの参照フレームを記憶するステップ501を備える。
方法は、分数ピクセル解像度を有する動きベクトルにより参照フレームの参照ブロックから現在のフレームの現在のブロックの予測ブロックを生成することを備える予測ステップ502をさらに備える。分数ピクセル解像度は、整数ピクセル位置および分数ピクセル位置を規定する。さらに、予測ステップは、以下の少なくとも3つの補間フィルタ、すなわち、
− ぼけ補間フィルタ、
− タップフィルタ、および
− 当該タップフィルタの後に続く鮮明化フィルタ
のうちの1つを介して分数ピクセル解像度により参照ブロックを補間することを備える。
図6は、本発明の実施形態によるビデオ復号方法を示し、特に、動き補償により後続のフレームのビデオストリームを予測符号化することによって獲得されたコード化されたビデオビットストリームを復号するための方法を示す。
方法は、コード化されたビデオビットストリームから獲得された少なくとも1つの参照フレームを記憶するステップ601を備える。
方法は、分数ピクセル解像度を有する動きベクトルにより参照フレームの参照ブロックから現在のフレームの現在のブロックの予測ブロックを生成することを備える予測ステップ602をさらに備える。分数ピクセル解像度は、整数ピクセル位置および分数ピクセル位置を規定する。予測ステップは、以下の少なくとも3つの補間フィルタ、すなわち、
− ぼけ補間フィルタ、
− タップフィルタ、および
− 当該タップフィルタの後に続く鮮明化フィルタ
のうちの1つを介して分数ピクセル解像度により参照ブロックを補間することをさらに備える。
ビデオ符号器200またはビデオ復号器400に関して説明されるさらなる態様および特徴は、符号化方法および復号方法にも該当する。
図7は、本発明によるぼけ補間フィルタの実施形態を示し、特に、ビデオ符号器200のぼけ補間フィルタ302の実施形態を示す。
図7の実施形態において、ぼけ補間フィルタ302は、パラメータ形態におけるガウスフィルタとして実装される。ぼけの量は、ガウスフィルタの1つの適応パラメータσだけによって制御されることができる。この単一の適応パラメータは、フィルタが容易に最適化されることができ、かつ適応ぼけパラメータを転送するためのシグナリングオーバーヘッドが低減されることができるという利点を有する。
ぼけ補間フィルタ302は、動きベクトルを入力として受信する。動きベクトルは、動き推定中に符号器200によって決定される。動きベクトルに基づいて、ユニット701は、動きベクトルのピクセル位置の分数部分を得るように構成される。
さらなるユニット702が、所与のパラメータσを用いてガウスフィルタ係数を計算すること、および分数シフトを獲得することを行うように構成される。ユニット703が、参照ブロック、およびユニット702によって計算された補間フィルタ係数を入力として使用して、動き予測ブロックを獲得するように構成される。次に、ぼけ補間フィルタ302が、予測誤差および費用基準を介して予測効率を計算するように構成される。
予測誤差は、残差ブロックに対応し、元のブロックと予測ブロックの間の差として計算される。
予測効率を最適化するのに、ユニット702は、パラメータσの別の値に関して係数を計算し、したがって、対応する予測ブロックがユニット703によって獲得されることができ、かつ対応する予測効率がぼけ補間フィルタ302によって計算されることができるように構成される。パラメータσの異なる値に関するこれらのステップの反復の後、ぼけ補間フィルタ302が、最良の予測効率を提供するパラメータσを選ぶ。
あるいは、パラメータσの異なる値を用いてガウスぼけフィルタを事前計算すること、および異なる分数位置に関してそれらを記憶することが可能である。このことは、最適化手順中にいくらかの計算リソースを節約することを許す。
ビデオ復号器400は、図7に示される符号器200のぼけ補間フィルタ302と同様のぼけ補間フィルタを備える。ビデオ復号器400のぼけ補間フィルタは、ユニット701、702、および703を同様に備え、動きベクトルを入力として同様に受信する。この動きベクトルは、コード化されたビデオビットストリームからシグナリング情報としてビデオ復号器400によって獲得される。復号器400は、補間フィルタパターンにより動きベクトルの分数部分からフィルタ係数を生成するために使用されるべきパラメータσの値を導き出す。
ビデオ符号器200のぼけ補間フィルタとビデオ復号器400のぼけ補間フィルタの間の差は、好ましくは、予測効率の計算、およびパラメータσの異なる値に関する予測効率の反復計算による予測効率の最適化に存する。
図8は、本発明による適応鮮明化フィルタの実施形態を示し、特に、ビデオ符号器200の適応鮮明化フィルタ311の実施形態を示す。
鮮明化フィルタ311は、好ましくは、非線形フィルタである。線形フィルタの代わりに非線形鮮明化フィルタを使用することが、動き補間フィルタ、および参照ブロックまたは参照フレームの量子化によってもたらされるアーチファクトを取り除くために好ましい。非線形フィルタの選択は、鮮明化フィルタ311の適応パラメータの数を低減することが可能である。特に、非線形フィルタは、1つだけの適応パラメータを利用することができ、したがって、コード化されたビデオビットストリームのシグナリングオーバーヘッドが低減される。本発明は、鮮明化フィルタ311を制御する複数の適応パラメータの使用も範囲に含むが、1つだけの適応パラメータを利用する鮮明化フィルタが、特に有利な実施形態である。
特に、鮮明化フィルタ311は、エッジマップ計算ユニット801、802と、ぼけフィルタ804と、高域フィルタ805と、スケール変更ユニット806と、ワーピングユニット807とを備える。
エッジマップ計算ユニット801、802は、ソースブロックのエッジマップを生成するように適応させられ、ソースブロックは、参照ブロックまたは予測ブロックである。ぼけフィルタ804は、ソースブロックのエッジマップをぼかすように適応させられる。高域フィルタ805は、ぼかされたエッジマップを高域フィルタリングすることによって、ソースブロックの各位置に関して導関数ベクトル(d2x,d2y)を生成するように適応させられる。スケール変更ユニット806は、鮮明化強度係数kを用いて導関数ベクトル(d2x,d2y)をスケール変更することによって変位ベクトル(wx,wy)を生成するように適応させられる。ワーピングユニット807は、変位ベクトル(wx,wy)に基づいて予測ブロックをワープさせるように適応させられる。
その結果、鮮明化フィルタ800を制御する適応パラメータは、鮮明化強度係数kである。図8に示される鮮明化フィルタ800は、1つだけの適応パラメータを有する本発明の実施形態である。
エッジマップ計算ユニット801、802は、ソースブロックの各位置に関する勾配ベクトル(dx,dy)を生成するように適応させられた勾配ベクトルユニット801と、各位置の勾配ベクトル(dx,dy)の長さを計算するように適応させられた勾配ベクトル長ユニット802とを備えて、ソースブロックのエッジマップを生成するようにすることができる。その結果、この構造は、ぼけフィルタ、高域フィルタ、およびスケール変更ユニットによってさらに処理されて、ワーピング変位ベクトルを生成するようにすることができるエッジマップの生成を可能にする。
勾配ベクトルは、以下の式、すなわち、
Figure 2018530244
により対応するプレヴィット(Prewitt)フィルタを適用することによってdxとdyに関して別々に、すなわち、図8において動き予測ブロックと呼ばれるソースブロックの水平方向と垂直方向の両方に関して別々に第1の導関数をとることによって獲得されることができる。
エッジマップは、以下の式、すなわち、
Figure 2018530244
により勾配ベクトル長を計算することによって勾配ベクトル長ユニット802によって獲得されることができる。
有利には、鮮明化フィルタ311は、ソースブロックのエッジマップをクリップするように適応させられたクリッピングユニット803を備え、クリッピングユニット803は、エッジマップ計算ユニット801、802とぼけフィルタ804の間に配置される。その結果、しきい値を用いてエッジマップをクリップすることは、それが、ワーピングベクトルの極端に高い値および極端に低い値の処理を防止するという点で有利である。
クリップされたエッジマップをぼかすステップは、以下、すなわち、
Figure 2018530244
として規定されることができるガウスフィルタの形態でぼけフィルタ804によって獲得されることができる。
高域フィルタは、例えば、以下、すなわち、
Figure 2018530244
によりd2xとd2yに関して別々に第2の導関数を獲得するのに使用される。
変位ベクトル(wx,wy)は、以下の式、すなわち、
wx=k*d2
wy=k*d2
により、係数kを用いて第2の導関数ベクトル(d2x,d2y)をスケール変更することによって獲得され、係数kは、鮮明化強度と見なされることができる。
ワーピングユニット807は、例えば、バイリニア補間フィルタである補間フィルタを含み、分数ピクセル位置におけるサンプル値を獲得する。ワーピングユニット807は、スケール変更ユニット806によって生成された変位ベクトルを使用する。その結果、ビデオ符号器の全体的な品質が向上させられる一方で、同時に、所望される分数ピクセル位置上で参照フレーム/ブロックの補間を提供する。
減算ユニット808が、ワーピングユニット807によって生成された鮮明化された予測ブロックと現在のブロックの間の差を構築するように適応させられ、現在のブロックは、コード化されるべきブロックに対応する。減算ユニット808は、事実上、残差ブロックを生成する。鮮明化フィルタ311は、例えば、残差ブロックを最小化することによって、または、例えば、レート−歪みに基づく費用基準によって最適な鮮明化強度kを見出すように適応させられる。
ビデオ復号器400は、図8に示されるビデオ符号器200の適応鮮明化フィルタ311と同様の適応鮮明化フィルタを備える。ビデオ符号器200の適応鮮明化フィルタとビデオ復号器300の適応鮮明化フィルタの間の差は、好ましくは、減算ユニット808、および残差ブロックのこの最小化に存する。
ビデオ復号器400において、適応パラメータ、例えば、係数kは、減算ユニット808、および残差ブロックの最小化を介して設定されることはない。代わりに、適応パラメータは、補間フィルタパターンにより、好ましくは、動きベクトルの分数部分に依存してビデオ復号器400において設定される。
鮮明化フィルタ400は、ソースブロックから計算された変位ベクトルに基づくワーピングを備え、ソースブロックは、動き予測ブロックとして図8において参照される。
図8に示されない実施形態によれば、ソースブロックは、変位ベクトル(wx,wy)が参照ブロックから導き出されるように、フレームバッファ207に記憶された参照フレームの参照ブロックである。その結果、参照ブロックは、鮮明化変位ベクトルまたはワーピング変位ベクトルとも呼ばれる、変位ベクトルを獲得するためのソースブロックとしても使用される。次に、ワーピングが、獲得された変位ベクトルを使用して予測ブロックに適用される。この実施形態は、エンコーダ側で計算リソースを節約するという点で有利である。
図8の代替の実施形態によれば、ソースブロックは、予測ユニット210によって生成された予測ブロックであり、変位ベクトル(wx,wy)が予測ブロックから導き出されるようになる。
その結果、ソースブロックとして予測ブロックを選ぶことは、予測ブロックのワーピングを行うための適切な変位ベクトルの計算を可能にする。すると、また、鮮明化フィルタは、予測ブロックに関して1つの入力しか要求せず、参照ブロックに関する第2の入力は必要とされない。
図8の実施形態に関して、鮮明化フィルタは、1つだけの係数、例えば、鮮明化強度kだけによって制御されることができる。このことは、適応処理をより容易にし、かつ従来の線形ウィナーベースの適応フィルタと比べて、伝送のためにより少ないシグナリングビットしか要求しない。また、知られている線形フィルタの代わりに非線形鮮明化フィルタを使用することは、動き補間フィルタ、および参照ピクチャの量子化によってもたらされるアーチファクトを取り除くためにより好ましくもある。
図9は、本発明の実施形態によるぼけ補間フィルタの補間フィルタパターンを示す。図9に示される補間フィルタパターンは、整数ピクセル位置の各位置、および分数ピクセル位置の各位置に関して、関連付けられた補間フィルタがぼけ補間フィルタ302であると規定する。さらに、図9のパターンは、各ピクセル位置に関して、適応パラメータの値、例えば、ぼけ係数σの値を規定する。
動きベクトルの分数空間は、いくつかのピクセル位置を備える。H.264/AVCおよびH.265/HEVCのような最新のビデオコーデックにおいて、動きベクトルは、通常、次元Xと次元Yの両方において1/4ピクセル解像度を有する。図9は、そのような1/4ピクセル解像度による本発明の実施形態を示す。この解像度は、4×4=16の可能な位置の合計を暗示する。これらの可能な位置は、正方形「a」として識別された1つの整数位置、ならびに15の分数位置b、c、d、e、f、g、h、i、j、k、l、m、n、o、pを含む。分数位置は、円c、i、kとして識別された3と1/2ピクセル位置、ならびに対応する三角形として識別された12と1/4ピクセル位置を備える。パターンは、各位置に関して、ぼけ係数σに関する値σ1、...、σ16を規定する。
図9の補間フィルタパターンは、コード化されたビデオビットストリームにシグナリング情報として符号器200によって追加されることができ、かつコード化されたビデオビットストリームから復号器400によって対応するように獲得されることができる。図9の補間フィルタパターンによる補間を実行することは、シャープなステップ応答を有する従来の固定フィルタを使用する代わりに、ぼけ補間フィルタが補間のために適用されることを意味する。分数位置に関連付けられたぼけ係数σiは、適応ぼけ補間フィルタに関する適応係数として使用される。
係数σiは、一定であり、かつオフライン訓練によって事前規定される、または、例えば、以前の符号化実験に基づいて選ばれることができる。パターンの異なる分数位置において同一のぼけ係数σiを有することが許される。また、係数σiは、シーケンスレベルで、GOPレベルで、フレームレベルで、または領域レベルで可変であり、かつ適応的であってもよい。その場合、さらなるシグナリングが要求される。
図10は、本発明の実施形態による鮮明化フィルタに関する補間フィルタパターンを示す。
図10の補間フィルタパターンは、図9のパターンと同様であり、かつ整数ピクセル位置の各位置、および分数ピクセル位置の各位置に関して、関連付けられた補間フィルタが鮮明化フィルタ311であることを規定する。さらに、ぼけ補間フィルタのぼけ係数σを規定する代わりに、図10の補間フィルタパターンは、各ピクセル位置に関して、適応パラメータの値、例えば、鮮明化強度係数kの値を規定する。
図9と同様に、係数kiは、一定であり、かつオフライン訓練によって事前規定される、または、例えば、以前の符号化実験に基づいて選ばれることができる。異なる分数位置において同一の鮮明化係数kiを有することが許される。また、係数kiは、シーケンスレベルで、GOPレベルで、フレームレベルで、または領域レベルで可変であり、かつ適応的であってもよい。その場合、さらなるシグナリングが要求される。
図11は、本発明のさらなる実施形態による補間フィルタパターンを示す。
図11に示されるパターンは、事実上、3つすべての補間フィルタタイプを包含する混合補間フィルタパターンである。いくつかの分数ピクセル位置b、e、f、g、h、j、nが、関連付けられたぼけパラメータσを有し、このことは、これらの位置に関して、ぼけ補間フィルタ302が対応するフィルタパラメータσ1、...、σ7を用いて適用されるべきことを意味する。
他のいくつかのピクセル位置l、o、pは、関連付けられた鮮明化強度パラメータkを有し、このことは、タップフィルタ303を用いた、すなわち、従来の固定フィルタタップを用いた補間の後、適応鮮明化フィルタ311が、対応するパラメータ値k1、k2、k3を用いて適用されるべきことを意味する。
他のいくつかのピクセル位置a、c、d、i、k、mは、関連付けられたパラメータをまったく有さない、すなわち、補間フィルタパターンは、これらの位置にパラメータ値をまったく関連付けない。このことは、復号器400によって、これらの位置に関して、タップフィルタ303、すなわち、従来の線形補間フィルタが使用されるように解釈される。
1つの補間フィルタパターンにおいてすべての補間タイプを混合することによって、今や、エンコーダが、画像内容に適応的に各特定の場合に関する最も適切な補間を選ぶことが可能である。
図9、図10、および図11の実施形態において、このように、動きベクトルの分数位置は、補間フィルタタイプにおいて、ならびにぼけ補間フィルタ302および鮮明化フィルタ311に関して、規定された補間フィルタタイプの適応パラメータを規定することができる。補間フィルタパターンは、符号器と復号器の両方によって知られなければならない。それは、事前規定されてよく、または適応的であり、かつサイド情報として、すなわち、コード化されたビデオビットストリームのシグナリング情報として渡されてよい。
図12は、異なる補間フィルタパターンを有する本発明の実施形態を示す。
フレームのいくつかの領域に関して、ぼけ補間フィルタ302または鮮明化フィルタ311を使用することは、必要ないことがある。そのような場合、すべての分数ポイントに関してタップフィルタ303を使用することがより良好である。フレームの他の領域において、ぼけ補間フィルタ302または鮮明化フィルタ311を適用することが最適であり得る。
これらの変形を範囲に含めるのに、フレームのいくつかの局所的領域に関して異なるいくつかの補間フィルタパターンを規定し、例えば、レート歪み最適化のような費用基準に基づいて最良の補間フィルタパターンを選び、所与の領域における動き補間のためにいずれの補間フィルタパターンが使用されるべきかを復号器400にシグナリングすることが提案される。
対応するように、図12は、例えば、異なる2つの補間フィルタパターンが使用されながら、いくつかの領域を備えるフレームを示す。「補間パターン0」として識別された第1のパターンは、各ピクセル位置に関してタップフィルタ303、すなわち、従来の固定補間フィルタが使用されるべきことを規定する一方で、「補間パターン1」として識別された第2のパターンは、図11に示されるとおりの混合補間フィルタパターンである。
図12の実施形態において、符号器200は、2つの領域に関して第1のパターンを選び、フレームの残り4つの領域に関して第2のパターンを選ぶ。コード化処理中、特定の各領域に関して、すなわち、例えば各最大符号化ユニット(LCU)に関して最良の補間フィルタパターンが選ばれることができ、かつ1ビットで復号器にシグナリングされることができ、ビットは、第1の補間フィルタパターンまたは第2の補間フィルタパターンを決定する。
本発明は、例としての様々な実施形態、ならびに実装形態に関連して説明されてきた。しかし、図面、本開示、および独立クレームの検討から、他の変形が、主張される発明を実施する当業者によって理解され、実現されることができる。特許請求の範囲、ならびに説明において、「備える(comprising)」という語は、他の要素も、他のステップも除外せず、「a」または「an」という不定冠詞は、複数を除外しない。単一の要素、または他のユニットが、特許請求の範囲に記載されるいくつかのエンティティまたはアイテムの機能を遂行してよい。ある手段が互いに異なる従属クレームに記載されるという単なる事実は、これらの手段の組合せが有利な実装形態において使用されることができないことを示すわけではない。
本発明は、一般に、ビデオ処理の分野、およびビデオ動き補償のための装置に関し、詳細には、ビデオにおけるフレームを予測する動き補償をサポートするためのビデオ符号器およびビデオ復号器に関する。本発明は、動き補償を使用してビデオストリームを符号化するための方法および復号するための方法にさらに関する。最後に、本発明は、そのような方法を実行するためのプログラムコードを有するコンピュータプログラムに関する。
ビデオ処理の分野において、特に、ハイブリッドビデオ符号化およびハイブリッドビデオ圧縮の分野において、インタ予測およびイントラ予測、ならびに変換符号化を使用することが知られている。そのようなハイブリッドビデオ符号化技術は、H.261、H.263,MPEG−1、2、4、H.264/AVCもしくはH.265/HEVCのような、知られているビデオ圧縮標準において使用される。
図1は、最新技術によるビデオ符号器を示す。ビデオ符号器100は、ビデオストリームのフレームまたはピクチャの入力ブロックを受信するための入力と、コード化されたビデオビットストリームを生成するための出力とを備える。ビデオ符号器100は、ビデオストリームに予測、変換、量子化、およびエントロピ符号化を適用するように適応させられる。変換、量子化、およびエントロピ符号化は、出力としてコード化されたビデオビットストリームを生成するように、それぞれ、変換ユニット101、量子化ユニット102、およびエントロピコード化ユニット103によって行われる。
ビデオストリームは、複数のフレームに対応し、各フレームは、予測ユニット108によってイントラ符号化またはインタ符号化され得るあるサイズのブロックに分割される。例えば、ビデオストリームの第1のフレームのブロックが、予測ユニット108を介してイントラ符号化される。イントラフレームは、同一のフレーム内の情報だけを使用して符号化され、したがって、それは、独立に復号されることができ、かつビットストリームにおけるランダムアクセスのためのエントリポイントを提供することができる。ビデオストリームのその他のフレームのブロックは、予測ユニット108を介してインタ符号化される、すなわち、復元された参照フレームと呼ばれる符号化されたフレームからの情報が時間冗長性を低減するのに使用され、したがって、インタ符号化されたブロックは、復元された参照フレームにおける同一サイズのブロックから予測される。予測ユニット108は、フレームのブロックがイントラ符号化されるか、またはインタ符号化されるかを選択するように適応させられる。
インタ予測を実行するために、符号化された参照フレームが、逆量子化ユニット104、逆変換ユニット105によって処理され、次に、予測ブロックに追加され、ループフィルタリングユニット106によって、復元された参照フレームを獲得するように処理されて、次に、その復元された参照フレームが、時間的インタフレーム予測のために使用されるようにフレームバッファ107に記憶される。
予測ユニット108は、入力として、インタ符号化されるべき、またはイントラ符号化されるべき現在のフレームもしくはピクチャと、フレームバッファ107からの1つもしくは複数の参照フレームもしくは参照ピクチャとを備える。動き推定および動き補償が、予測ユニット108によって適用される。動き推定は、ある費用関数に基づいて動きベクトルおよび参照フレームを獲得するのに使用される。次に、動き補償が、現在のフレームの現在のブロックを、参照フレームの参照ブロックの現在のフレームへの変換に関して記述する。予測ユニット108が、現在のブロックに関する予測ブロックを出力し、予測ブロックは、符号化されるべき現在のブロックとそれの予測ブロックの間の差を最小化する、すなわち、残差ブロックを最小化する。残差ブロックの最小化は、例えば、レート−歪み最適化手順に基づく。
現在のブロックとそれの予測の間の差、すなわち、残差ブロックは、次に、変換ユニット101によって変換される。変換係数は、量子化ユニット102およびエントロピコード化ユニット103によって量子化され、エントロピ符号化される。そのように生成されたコード化されたビデオビットストリームは、イントラ符号化されたブロックと、インタ符号化されたブロックとを備える。
そのようなハイブリッドビデオ符号化は、予測誤差の変換符号化と組み合わされた動き補償された予測を備える。各ブロックに関して、推定された動きベクトルも、コード化されたビデオビットストリームにおいてシグナリングデータとして伝送される。今日の標準、H.264/AVCおよびH.265/HEVCは、動きベクトルに関して1/4ピクセル変位解像度に基づく。分数ピクセル変位を推定し、補償するために、参照ブロックが分数ピクセル位置上で補間されなければならない。補間フィルタが、分数ピクセル位置上でそのような補間されたフレームを獲得するのに使用される。
補間されたブロックの品質は、使用される補間フィルタの特性に強く依存する。ショートタップフィルタ、例えば、バイリニアフィルタが、高い周波数を抑制して、補間されたフレームがぼかされるようにすることがある。ロングタップフィルタのような他のフィルタは、高い周波数を保存するが、鮮明なエッジの近隣においていくらかのリンギングアーチファクトを生成することがある。別の問題は、動き補償が、以前にコード化され、かつ復元されたフレームを参照フレームとして利用することであり、すなわち、参照フレームは、ギブス効果として参照される、変換係数の量子化によってもたらされるアーチファクトを包含することがある。これらのアーチファクトのため、エッジ、ならびにエッジの周囲の区域が歪ませられることもある。
復元された参照ブロックおよび復元された参照フレームは、ビデオ符号器自体によって生成される望ましくない偽のエッジを包含することもある。そのようなアーチファクトは、各ブロックの別個の独立した処理によってもたらされ得る。これに関して、ループフィルタリングユニット106が、これらのブロッキングアーチファクトを緩和することを目的とするデブロッキングフィルタリングを適用するが、ループフィルタリングユニット106は、これらのアーチファクトを部分的に取り除くことしかできない。他のエッジアーチファクトは、平滑な勾配領域の粗い量子化によってもたらされる勾配バンディングと関係していることがあり得る。したがって、参照ブロックおよび参照フレームは、望ましくないエッジを包含し得る。
動き予測の品質は、いくつかの要因に依存する。復元された参照ブロックの品質である、参照ブロックにおけるアーチファクトおよび望ましくないノイズの存在が、動き予測の品質に強く影響する。さらに、補間フィルタが、補間されたエッジの品質、それらのぼけ、および補間されたブロックにおけるリンギングの存在を規定する。また、予測ブロックの内容も、アーチファクトのほとんどはエッジ近くに出現するので、動き予測の品質に影響を及ぼす。
動き補償された予測を向上させるいくつかの技法が、従来技術から知られている。例えば、ビデオ符号化標準H.265/HEVCが、以前のH.264/AVC標準と比べて、より良好な補間品質を提供するより高度な固定線形補間フィルタを用いて提案されている。また、適応ループフィルタリング(ALF)が、ループフィルタリングユニット106において行われることができる。そのようなフィルタリングは、通常、ウィナーベースである、線形適応フィルタを導入して、復元されたブロックと元のブロックの間の差を最小化する。しかし、そのようなループ内フィルタリング技法は、ループ内フィルタが動き補間より前に参照ブロックに適用されるため、動き補間フィルタによってもたらされるアーチファクトを取り除くことができない。
適応補間フィルタ(AIF)は、補間されたブロックと元のブロックの間の差を最小化することによって各分数動き位置に関してウィナーベースの最適な補間フィルタを見出そうと試みる、知られている技法である。見出されたフィルタ係数が、次に、復号器に渡される必要がある。そのような適応フィルタは、線形であり、かつ係数の行列またはベクトルの形態になっている。さらに、各分数動きベクトル位置は、それ自らの最適なフィルタを有する。適応フィルタの形態、および分数位置に関していくつかのフィルタを転送する必要性は、適応補間フィルタリング技法に関して相当なシグナリングオーバーヘッドを暗示する。
前述の欠点および問題を認識して、本発明は、最新技術を向上させることを目的とする。特に、本発明の目的は、後続のフレームのビデオストリームの向上した符号化および復号のためのビデオ符号器、符号化方法、ビデオ復号器、および復号方法を提供することである。
本発明は、予測符号化の品質を向上させることを特に意図する。特に、本発明は、動き補償によってもたらされる、詳細には、分数ピクセル位置上の参照ブロックの補間によってもたらされるアーチファクトを取り除くこと、ならびに参照フレームの量子化アーチファクトを低減することによって予測の品質を向上させることを意図する。本発明のさらなる目的は、コード化されたビデオビットストリームにおけるシグナリングオーバーヘッドを低いレベルに保つことである。
本発明の前述の目的は、添付の独立クレームにおいて提供されるソリューションによって実現される。本発明の有利な実装形態が、それぞれの従属クレームにおいてさらに規定される。
本発明の第1の態様が、動き補償により後続のフレームのビデオストリームを予測符号化して、コード化されたビデオビットストリームにするためのビデオ符号器を提供する。ビデオ符号器は、ビデオストリームの少なくとも1つの参照フレームを記憶するように構成されたフレームバッファを備える。ビデオ符号器は、分数ピクセル解像度を有する動きベクトルにより参照フレームの参照ブロックから現在のフレームの現在のブロックの予測ブロックを生成するように構成された予測ユニットを備え、前記分数ピクセル解像度は、整数ピクセル位置および分数ピクセル位置を規定する。予測ユニットは、以下の少なくとも3つの補間フィルタ、すなわち、ぼけ補間フィルタ、タップフィルタ、および当該タップフィルタの後に続く鮮明化フィルタのうちの1つを介して分数ピクセル解像度により参照ブロックを補間するように構成される。
その結果、予測ユニットの動き補間スキームは、ぼけ補間フィルタ、タップフィルタ、および当該タップフィルタの後に続く鮮明化フィルタである言及される3つの補間フィルタタイプを備える。予測ユニットは、次に、ビデオ内容に依存してフィルタタイプを選択してよい。これら3つのフィルタタイプは、異なるタイプの内容のためのコード化処理中に選択されてよい。
第1の態様によるビデオ符号器の実装形態において、ぼけ補間フィルタと鮮明化フィルタのうちの少なくとも1つは、少なくとも1つの適応パラメータによって制御されるように構成された適応フィルタである。
その結果、参照ブロックは、ビデオの特定の内容に適応させられることができる補間フィルタによって補間され得る。適応は、ビデオ内容の局所的特徴を考慮に入れることができ、要求されるシグナリングオーバーヘッドは、適応および伝送のために1つだけの係数を有する補間フィルタのパラメータ表現が使用されるために制限されることができる。
第1の態様によるビデオ符号器の実装形態において、鮮明化フィルタは、非線形フィルタである。
その結果、そのような非線形鮮明化フィルタのその使用は、動き予測強化のために好ましい。アンシャープマスキング技法のような線形鮮明化またはぼけ除去フィルタに基づく従来のエッジ強化技法は、主観的な品質を高め得るが、動き補間フィルタリングによってもたらされるリンギングアーチファクトを抑制することができない。また、そのような線形鮮明化は、リンギングを増加させて、客観的なパフォーマンス特性を低下させることさえある。他方、提案される非線形鮮明化フィルタは、リンギング除去に関してより良好な結果を提供することができ、このため、有利である。また、鮮明化フィルタに関する、例えば、適応鮮明化フィルタに関する非線形設計の使用は、適応パラメータの数を有利に低減することもでき、このため、シグナリングオーバーヘッドを有利に低減することもできる。
第1の態様によるビデオ符号器の実装形態において、鮮明化フィルタは、単一の適応パラメータによって制御されるように構成される。
その結果、要求されるシグナリングオーバーヘッドは、鮮明化フィルタのために単一の適応パラメータしか使用されないことのためにさらに制限されることができる。特に、予測符号化のために使用されるブロックのサイズは、シグナリングオーバーヘッドを同時に増加させることなしに低減されることができる。
第1の態様によるビデオ符号器の実装形態において、適応鮮明化フィルタは、ソースブロックのエッジマップを生成するように適応させられたエッジマップ計算ユニットを備え、前記ソースブロックは、参照ブロックまたは予測ブロックである。鮮明化フィルタは、ソースブロックのエッジマップをぼかすように適応させられたぼけフィルタを備える。鮮明化フィルタは、ぼかされたエッジマップを高域フィルタリングすることによって、ソースブロックの各位置に関する導関数ベクトルを生成するように適応させられた高域フィルタを備える。鮮明化フィルタは、鮮明化強度係数を用いて導関数ベクトルをスケール変更することによって変位ベクトルを生成するように適応させられたスケール変更ユニットを備える。鮮明化フィルタは、変位ベクトルに基づいて予測ブロックをワープさせるように適応させられたワーピングユニットを備える。
その結果、鮮明化フィルタのこの構造は、リンギングアーチファクトの除去に関してより良好な結果を有利に提供することができる非線形鮮明化フィルタを規定する。
第1の態様によるビデオ符号器の実装形態において、鮮明化フィルタの適応パラメータは、鮮明化強度係数を含む。
その結果、適応パラメータとして鮮明化強度係数を使用することは、シグナリングオーバーヘッドをさらに低減する、1つだけの適応パラメータしか要求されないことを暗示する。
第1の態様によるビデオ符号器の実装形態において、予測ユニットは、残差ブロックを最小化する鮮明化強度係数を選択するように構成され、前記残差ブロックは、現在のブロックと適応鮮明化フィルタによって出力される予測ブロックの間の差である、または、例えば、レート歪み最適化のような費用基準に基づく。
第1の態様によるビデオ符号器の実装形態において、ぼけ補間フィルタは、それの設計の性質のためにリンギングを生成することができない低域フィルタである。
第1の態様によるビデオ符号器の実装形態において、ぼけ補間フィルタは、単一の適応パラメータを備える。
その結果、要求されるシグナリングオーバーヘッドは、ぼけ補間フィルタのために単一の適応パラメータしか使用されないためにさらに制限されることができる。
第1の態様によるビデオ符号器の実装形態において、ぼけ補間フィルタの適応パラメータは、ぼけ係数を含む。
その結果、適応パラメータとしてぼけ係数を使用することは、シグナリングオーバーヘッドをさらに低減する、1つだけの適応パラメータしか要求されないことを暗示する。
第1の態様によるビデオ符号器の実装形態において、ぼけ補間フィルタは、ガウスフィルタまたはバイリニアフィルタであり、かつぼけ補間フィルタがガウスフィルタである場合、ぼけ係数は、ガウス分布の標準偏差である。
その結果、例えば、復元された参照フレームにおいてブロッキングおよび勾配バンディングによってもたらされる望ましくないエッジを、ぼけ補間を適用することによって抑制することが可能である。また、望ましくない高周波数ノイズが、復元された参照フレームにおいて抑制されることができる。
第1の態様によるビデオ符号器の実装形態において、ぼけ補間フィルタは、標準偏差に基づいてガウスフィルタ係数を計算するように構成された計算ユニットと、計算されたガウスフィルタ係数を使用することによって、ぼけ補間フィルタの出力として予測ブロックを生成するように構成されたフィルタリングユニットとを備える。
第1の態様によるビデオ符号器の実装形態において、ビデオ符号器は、異なる標準偏差に基づいてガウスフィルタ係数の事前計算されたセットを記憶するように構成されたユニットと、ガウスフィルタの事前計算されたセットのうちの1つのフィルタを使用することによって、ぼけ補間フィルタの出力として予測ブロックを生成するように構成されたフィルタリングユニットとを備える。
その結果、この事前計算は、最適化手順中に計算リソースが節約されることができるという効果を有する。
第1の態様によるビデオ符号器の実装形態において、予測ユニットは、残差ブロックを最小化するぼけ係数を選択するように構成され、前記残差ブロックは、現在のブロックとぼけ補間フィルタによって出力される予測ブロックの間の差である、または、例えば、レート歪み最適化のような費用基準に基づく。
その結果、動き補償は、最適化手順中にぼけ係数を選択することによってさらに向上させられることができる。
第1の態様によるビデオ符号器の実装形態において、タップフィルタは、シャープなステップ応答を有する固定ロングタップフィルタである。
第1の態様によるビデオ符号器の実装形態において、整数ピクセル位置、および分数ピクセル位置のそれぞれが、少なくとも3つの補間フィルタのうちの前記1つに関連付けられ、および/または、存在する場合、鮮明化フィルタおよび/またはぼけ補間フィルタの適応パラメータの所与の値に関連付けられる。
その結果、ピクセル位置は、3つの補間フィルタのうちの1つ、および、場合により、それぞれの適応パラメータに関連付けられるので、シグナリングオーバーヘッドは、補間フィルタタイプおよび適応パラメータに関するシグナリングポイントとして分数動きベクトル位置が使用されるために低減されることができる。
第1の態様によるビデオ符号器の実装形態において、ビデオ符号器は、コード化されたビデオビットストリームを生成すること、および補間フィルタタイプ、および適応パラメータの前記所与の値、ならびに関連付けられた整数ピクセル位置または分数ピクセル位置を、コード化されたビデオビットストリームにおけるシグナリング情報として指定することを行うように構成されたコード化ユニットを備える。
その結果、復号器に伝送されなければならないシグナリング情報の量が低減されることができ、シグナリングオーバーヘッドが低減されることが可能である。
第1の態様によるビデオ符号器の実装形態において、3つの補間フィルタのなかの補間フィルタの選択は、整数ピクセル位置または分数ピクセル位置に依存し、したがって、所与の整数ピクセル位置または分数ピクセル位置は、所与の補間フィルタの選択、および存在する場合、適応パラメータの選択を暗示する。
その結果、さらなるシグナリングオーバーヘッドを導入することなしに局所的特徴に対する適応を実行することが可能である。
第1の態様によるビデオ符号器の実装形態において、ビデオ符号器は、整数ピクセル位置および分数ピクセル位置の各位置に関して、関連付けられた補間フィルタタイプを規定し、および/または、存在する場合、適応パラメータの値を規定する少なくとも1つの補間フィルタパターンを備える。
その結果、補間フィルタパラメータは、さらなるシグナリングオーバーヘッドを導入することなしに、各補間フィルタタイプを容易に規定することができ、かつ、該当する場合、適応パラメータ値を容易に規定することができる。
その結果、復号器は、ピクセル位置に依存して補間フィルタパターンにおいて規定される補間フィルタを選択することができる。
第1の態様によるビデオ符号器の実装形態において、ビデオ符号器は、複数の補間フィルタパターンを備え、予測ユニットは、複数の補間フィルタパターンのうちの1つを選択するように構成される。
その結果、例えば、複数の補間フィルタパターンが、ビデオストリームを符号化している間、補間フィルタパターンのうちの1つを選択するだけでよいように、前もって計算され、準備されることができる。
第1の態様によるビデオ符号器の実装形態において、ビデオ符号器は、コード化されたビデオビットストリームを生成すること、および前記補間フィルタパターンを、コード化されたビデオビットストリームにおけるシグナリング情報として追加することを行うように構成されたコード化ユニットを備える。
第1の態様によるビデオ符号器の実装形態において、複数の補間フィルタパターンが提供される場合、コード化ユニットは、選択されるべき補間フィルタパターンについての選択情報を、コード化されたビデオビットストリームにおけるシグナリング情報として追加するように構成される。
その結果、この選択情報またはインデックス情報は、復号器によって選択されるべき補間フィルタパターンを示すことができる。復号器が複数の補間フィルタパターンを既に知っている場合、したがって、この選択情報は、シグナリングオーバーヘッドをさらに低減する。
第1の態様によるビデオ符号器の実装形態において、コード化ユニットは、フレームレベルで、GOP(ピクチャのグループ)レベルで、PPS(ピクチャパラメータセット)レベルで、またはSPS(シーケンスパラメータセット)レベルで、フレームの任意の領域または規則的な領域に関して、各予測ブロックに関して選択されるべき補間フィルタパターンについてのシグナリング情報を追加するように構成される。
その結果、シグナリングが最適化されることができるように補間フィルタ情報を所望される粒度に設定することが可能である。
本発明の第2の態様が、動き補償により後続のフレームのビデオストリームを予測符号化して、コード化されたビデオビットストリームにするための方法を提供する。方法は、ビデオストリームの少なくとも1つの参照フレームを記憶することを備える。方法は、分数ピクセル解像度を有する動きベクトルにより参照フレームの参照ブロックから現在のフレームの現在のブロックの予測ブロックを生成することを備える予測ステップを備え、前記分数ピクセル解像度は、整数ピクセル位置および分数ピクセル位置を規定する。予測ステップは、以下の少なくとも3つの補間フィルタ、すなわち、ぼけ補間フィルタ、タップフィルタ、および当該タップフィルタの後に続く鮮明化フィルタのうちの1つを介して分数ピクセル解像度により参照ブロックを補間することをさらに備える。
本発明の第2の態様による方法のさらなる特徴または実装形態は、本発明の第1の態様、またはそれの異なる実装形態によりビデオ符号器の機能を実行することができる。
本発明の第3の態様が、動き補償により後続のフレームのビデオストリームを予測符号化することによって獲得されたコード化されたビデオビットストリームを復号するためのビデオ復号器を提供する。ビデオ復号器は、コード化されたビデオビットストリームから獲得された少なくとも1つの参照フレームを記憶するように構成されたフレームバッファを備える。ビデオ復号器は、分数ピクセル解像度を有する動きベクトルにより参照フレームの参照ブロックから現在のフレームの現在のブロックの予測ブロックを生成するように構成された予測ユニットを備え、前記分数ピクセル解像度は、整数ピクセル位置および分数ピクセル位置を規定する。予測ユニットは、以下の少なくとも3つの補間フィルタ、すなわち、ぼけ補間フィルタ、タップフィルタ、および当該タップフィルタの後に続く鮮明化フィルタのうちの1つを介して分数ピクセル解像度により参照ブロックを補間するように構成される。
その結果、第1の態様によるビデオ符号器に関して獲得される利点は、第3の態様によるビデオ復号器に関しても与えられる。
第3の態様によるビデオ復号器の実装形態において、ぼけ補間フィルタと鮮明化フィルタのうちの少なくとも1つは、少なくとも1つの適応パラメータによって制御されるように構成された適応フィルタである。
その結果、参照ブロックは、ビデオの特定の内容に適応させられることができる補間フィルタによって補間され得る。適応は、ビデオ内容の局所的特徴を考慮に入れることができ、要求されるシグナリングオーバーヘッドは、適応および伝送のために1つだけの係数を有する補間フィルタのパラメータ表現が使用されるために制限されることができる。
第3の態様によるビデオ復号器の実装形態において、3つの補間フィルタのなかの補間フィルタの選択は、整数ピクセル位置または分数ピクセル位置に依存し、したがって、所与の整数ピクセル位置または分数ピクセル位置は、所与の補間フィルタの選択、および/または存在する場合、適応パラメータの値を暗示する。
その結果、補間フィルタタイプおよび適応パラメータに関するシグナリングポイントとして分数動きベクトル位置を使用することは、さらなるシグナリングオーバーヘッドを生成しない。
第3の態様によるビデオ復号器の実装形態において、予測ユニットは、補間フィルタパターンにより3つの補間フィルタのうちの1つを選択するように構成される。前記補間フィルタパターンは、動きベクトルの整数位置、およびそれに関連付けられた分数位置に関して、関連付けられた補間フィルタタイプを規定し、および/または、存在する場合、適応パラメータの値を規定する。
その結果、補間フィルタパラメータは、補間フィルタタイプをそれぞれ容易に規定することができ、かつ、該当する場合、適応パラメータ値を容易に規定することができ、したがって、シグナリングオーバーヘッドがさらに低減されることができる。
第3の態様によるビデオ復号器の実装形態において、ビデオ復号器は、補間フィルタパターンをシグナリング情報として、コード化されたビデオビットストリームから獲得するように構成された復号ユニットを備える。
第3の態様によるビデオ復号器の実装形態において、ビデオ復号器は、複数の補間フィルタパターン、ならびに選択されるべき補間フィルタパターンについての選択情報をシグナリング情報として、コード化されたビデオビットストリームから獲得するように構成された復号ユニットを備える。予測ユニットは、獲得された選択情報により、獲得された補間フィルタパターンのうちの1つを選択すること、および選択された補間フィルタパターンにより3つの補間フィルタのうちの1つを選ぶことを行うように構成される。
その結果、この選択情報またはインデックス情報は、復号器によって選択されるべき補間フィルタパターンを示すことができる。復号器が複数の補間フィルタパターンを知ると、コード化されたビデオビットストリームを介してこの選択情報を伝送するだけでよく、したがって、シグナリングオーバーヘッドがさらに低減されることができる。
第3の態様によるビデオ復号器の実装形態において、予測ユニットは、ビデオ復号器がコード化されたビデオビットストリームを受信する前に複数の補間フィルタパターンを事前記憶するように構成される。ビデオ復号器は、選択されるべき事前記憶された補間フィルタパターンについての選択情報をシグナリング情報として、コード化されたビデオビットストリームから獲得するように構成された復号ユニットを備える。予測ユニットは、獲得された選択情報により事前記憶された補間フィルタパターンのうちの1つを選択すること、および選択された補間フィルタパターンにより3つの補間フィルタのうちの1つを選ぶことを行うように構成される。
その結果、復号器は、複数の補間フィルタパターンを既に知っており、コード化されたビデオビットストリームを介して、この選択情報を伝送するだけでよい。すると、シグナリングオーバーヘッドは、さらに低減されることができる。
第3の態様によるビデオ復号器の実装形態において、復号ユニットは、フレームレベルで、GOP(ピクチャのグループ)レベルで、PPS(ピクチャパラメータセット)レベルで、またはSPS(シーケンスパラメータセット)レベルで、フレームの任意の領域または規則的な領域に関して、各予測ブロックに関して選択されるべき補間フィルタパターンについてのシグナリング情報を獲得するように構成される。
その結果、シグナリングが最適化されることができるように補間フィルタ情報を所望される粒度に設定することが可能である。
本発明の第1の態様による、特に、少なくとも3つの補間フィルタ、およびそれらの構造に関するビデオ符号器のさらなる特徴または実装形態は、本発明の第3の態様によるビデオ復号器にも該当する。
本発明の第4の態様が、動き補償により後続のフレームのビデオストリームを予測符号化することによって獲得されたコード化されたビデオビットストリームを復号するための方法を提供する。方法は、コード化されたビデオビットストリームから獲得された少なくとも1つの参照フレームを記憶することを備える。方法は、分数ピクセル解像度を有する動きベクトルにより参照フレームの参照ブロックから現在のフレームの現在のブロックの予測ブロックを生成することを備える予測ステップを備え、前記分数ピクセル解像度は、整数ピクセル位置および分数ピクセル位置を規定する。予測ステップは、以下の少なくとも3つの補間フィルタ、すなわち、ぼけ補間フィルタ、タップフィルタ、および当該タップフィルタの後に続く鮮明化フィルタのうちの1つを介して分数ピクセル解像度により参照ブロックを補間することをさらに備える。
本発明の第4の態様による方法のさらなる特徴または実装形態は、本発明の第3の態様によるビデオ復号器、およびそれの異なる実装形態の機能を実行することができる。
本発明の第5の態様が、コンピュータプログラムがコンピューティングデバイス上で走るとき、そのような符号化および/または復号方法を実行するためのプログラムコードを有するコンピュータプログラムを提供する。
本発明は、局所的な画像特徴により適応的に調整され得るぼけ補間、従来の補間、および鮮明化補間を含む向上させられた動き補間フィルタリングスキームを適用することに存する動き補償を提案する。動き補間スキームは、コード化処理中に選択され得る異なる3つのフィルタタイプ、すなわち、ぼけフィルタ、固定フィルタ、および鮮明化フィルタを備える。ぼけフィルタおよび鮮明化フィルタは、符号化ピクチャの局所的特徴によりうまく適合するように適応的であってよい。補間フィルタタイプおよび適応パラメータを復号器にシグナリングするために、分数動きベクトル位置を使用することが提案される。
提案される補間フィルタリングスキームを用いると、3つのフィルタタイプを適用することによって符号化ピクチャの局所的特徴に対する適応を実行することが可能である。シグナリングオーバーヘッドを低減し、かつ符号化ピクチャのより小さい領域に対する適応を可能にする、適応のための1つだけの係数を有する適応フィルタのパラメータ表現のために低減されたシグナリングオーバーヘッドが実現されることができる。シグナリングオーバーヘッドは、補間フィルタタイプおよび適応パラメータに関するシグナリングポイントとして分数動きベクトル位置が使用されるためにさらに低減されることができる。適応は、低減されたシグナリングオーバーヘッドのために符号化ピクチャの小さい領域の局所的特徴に対して実行されることができる。動き補間フィルタによってもたらされるエッジのリンギングアーチファクトおよびぼけは、補間されたエッジの品質を保ちながら低減されることができる。また、参照ピクチャにおける変換係数の量子化によってもたらされるエッジのリンギングアーチファクトおよびぼけを低減することも可能である。また、動きぼけによってもたらされるエッジのぼけが低減されることもできる。提案されるスキームは、例えば、復元された参照ピクチャにおいてブロッキングおよび勾配バンディングによってもたらされる望ましくないエッジを、ぼけ補間を適用することによって抑制すること、および復元された参照ピクチャにおける望ましくない高周波数ノイズを、ぼけ補間を適用することによって抑制することができる。また、提案されるスキームは、復元されたピクチャにおけるエッジの主観的な品質を高め、かつぼけた勾配領域および平滑な勾配領域の主観的な品質を高めることもする。提案される補間フィルタリングは、ループ参照フィルタリングまたはループ内参照フィルタリングが行うジョブを実行し、同時に、従来の動き補間フィルタによってもたらされるアーチファクトを画像内容に適応的に低減する。
本出願において説明されるすべてのデバイス、要素、ユニット、および手段は、ソフトウェア要素もしくはハードウェア要素、またはこれらの任意の種類の組合せにおいて実装されることができることに留意されたい。本出願において説明される様々なエンティティによって実行されるすべてのステップ、ならびに様々なエンティティによって実行されるように説明される機能は、それぞれのエンティティが、それぞれのステップおよび機能を実行するように適応させられる、または構成されることを意味するように意図される。特定の実施形態の以下の説明において、外部エンティティによって完全に形成されるべき特定の機能またはステップが、その特定のステップまたは機能を実行するそのエンティティの特定の詳細な要素の説明において反映されない場合でさえ、これらの方法および機能は、それぞれのソフトウェア要素もしくはハードウェア要素、またはこれらの任意の種類の組合せにおいて実装されることができることが当業者には明白であろう。
本発明の前述の態様および実装形態は、添付の図面に関連して特定の実施形態の以下の説明において説明される。
最新技術によるビデオ符号器を示す図である。 本発明の実施形態によるビデオ符号器を示す図である。 本発明の実施形態によるビデオ符号器の補間フィルタを示す図である。 本発明の実施形態によるビデオ復号器を示す図である。 本発明の実施形態によるビデオ符号化方法を示す図である。 本発明の実施形態によるビデオ復号方法を示す図である。 本発明によるぼけ補間フィルタの実施形態を示す図である。 本発明による鮮明化フィルタの実施形態を示す図である。 本発明の実施形態によるぼけ補間フィルタに関する補間フィルタパターンを示す図である。 本発明の実施形態による鮮明化フィルタに関する補間フィルタパターンを示す図である。 本発明の実施形態による混合補間フィルタパターンを示す図である。 異なる補間フィルタパターンを有する本発明の実施形態を示す図である。
図2は、本発明の実施形態によるビデオ符号器を示し、特に、動き補償により後続のフレームのビデオストリームを予測符号化して、コード化されたビデオビットストリームにするためのビデオ符号器200を示す。さらに、図3は、本発明の実施形態によるビデオ符号器の補間フィルタを示す。
ビデオ符号器200は、特に、フレームバッファ207と、予測ユニットとを備える。
フレームバッファ207は、ビデオストリームの少なくとも1つの参照フレームまたは参照ピクチャを記憶するように構成される。予測ユニット210は、分数ピクセル解像度を有する動きベクトルにより参照フレームの参照ブロックから現在のフレームの現在のブロックの予測ブロックを生成するように構成される。分数ピクセル解像度は、整数ピクセル位置および分数ピクセル位置を規定する。
さらに、予測ユニット210は、以下の少なくとも3つの補間フィルタ、すなわち、
− ぼけ補間フィルタ302、
− タップフィルタ303、および
− 当該タップフィルタ303の後に続く鮮明化フィルタ311
のうちの1つを介して分数ピクセル解像度により参照ブロックを補間するように構成される。
図3に示される鮮明化フィルタ311は、参照符号208によって図2において参照される。図3のぼけ補間フィルタ302およびタップフィルタ303は、補間フィルタブロック209によって図2に表される。
参照フレームは、ビデオストリームの現在のフレームとは異なり得る。特に、本発明の脈絡において、現在のフレームは、現在、コード化されているビデオストリームのフレームである一方で、参照フレームは、既にコード化されており、かつ次に復元されるビデオストリームのフレームである。以下において、「フレーム」という特徴に対するいずれの参照も、「ピクチャ」という特徴に対する参照によって置き換えられてよい。
現在のフレームは、インタ符号化技法を使用してコード化されてよく、すなわち、現在のフレームは、現在のフレームとは別個である少なくとも1つの参照フレームから予測される。参照フレームは、以前のフレーム、すなわち、後続のフレームのビデオストリーム内の現在のフレームに先立って位置付けられたフレームであることができる。あるいは、前方予測が使用される場合、参照フレームは、将来のフレーム、すなわち、現在のフレームの後に位置付けられたフレームであることができる。複数の参照フレームの場合、少なくとも1つが、そのような以前のフレームであることができ、かつそれらのうちの少なくとも1つが、そのような将来のフレームであることができる。参照フレームは、イントラ符号化されることができ、すなわち、まったくさらなるフレームなしに、まったく他のフレームに依存することもなく符号化されることができ、したがって、それは、独立に復号されることができ、かつそれは、ランダムビデオアクセスのためのエントリポイントの役割をすることができる。
特に、予測ユニット210は、動きベクトルを生成すること、および参照フレームの参照ブロックと現在のフレームの現在のブロックの間の動きを推定することによって動き推定を実行するように適応させられる。動き推定は、ある費用関数が、例えば、レート−歪み最適化であることに基づいてコード化中に実行されて、参照フレームにおける最良の参照ブロックをポイントする動きベクトルを見出す。動き推定の他に、予測ユニット210は、動きベクトルおよび参照ブロックをベースに現在のブロックに関する予測ブロックを生成することによって動き補償を実行するようにさらに適応させられる。
特に、動き予測は、動き推定および動き補償を備える。動きベクトルは、動き推定ユニットを使用することによって生成される。参照ブロックおよび現在のブロックは、好ましくは、参照フレームおよび現在のフレームのそれぞれの区域または部分区域である。そのようなブロックは、長方形のような規則的な形状を有してよく、または不規則な形状を有してよい。あるいは、ブロックは、フレームと同一のサイズを有することができる。現在のブロックと参照ブロックの両方が同一のサイズを有する。ブロックのサイズは、サイド情報またはシグナリングデータとして復号器に伝送されるブロックモード情報を介して規定されることが可能である。ブロックは、フレームの一部分を包含する事前規定されたサイズ、例えば、64×64ピクセルのビデオシーケンスの基本符号化構造である符号化ユニットに対応することができる。
予測ブロックは、参照ブロックに鑑みて現在のブロックに関して生成される。特に、複数の予測ブロックが、複数の参照ブロックに鑑みて現在のフレームの複数の現在のブロックに関して生成されることができる。これらの参照ブロックは、単一の参照フレームの一部であることができ、または異なる参照フレームから選択されることができる。いくつかの予測ブロックが、現在のフレームに関して生成されることができ、かつ現在のフレームに関して生成された予測ブロックが組み合わされて、現在のフレームの予測フレームを獲得することができる。
図2のビデオ符号器200は、特に、ハイブリッドビデオ符号化をサポートするための図1のビデオ符号器100と同様であるさらなるユニットを備える。例えば、ビデオ符号器200は、当技術分野において既に知られているとおり、周波数領域への変換を介して変換係数を生成するため、係数を量子化するため、および量子化された係数を、例えば、シグナリングデータと一緒にエントロピ符号化するための変換ユニット201、量子化ユニット202、およびエントロピエンコーダもしくはエントロピコード化ユニット203である同様のユニットを備える。変換ユニット201の入力は、図2においてビデオブロックとして参照される、現在のフレームの現在のブロックと、予測ユニット210によって出力される予測ブロックの間の差として規定される残差ブロックである。エントロピコード化ユニット203は、コード化されたビデオビットストリームを出力として生成するように適応させられる。
ビデオ符号器200は、逆量子化ユニット204、逆変換ユニット205、およびループフィルタリングユニット206であるさらなる同様のユニットを備える。量子化ユニット202によって生成される量子化された変換係数は、それぞれ、逆量子化ユニット204および逆変換ユニット205によって逆量子化され、逆変換されて、変換ユニット201に供給される残差ブロックに対応する復元された残差ブロックを獲得する。次に、復元された残差ブロックが、残差ブロックを生成するために以前に使用された予測ブロックに追加されて、現在のブロックに対応する復元された現在のブロックを獲得するようになり、この復元された現在のブロックは、図2における復元されたビデオブロックとして参照される。復元された現在のブロックは、ループフィルタリングユニット206によって、ブロックごとの処理および量子化によって導入されるアーチファクトを平滑化するように処理され得る。次に、少なくとも1つの現在のブロック、または、有利には、複数の現在のブロックを備える現在のフレームが、復元された現在のブロックから復元されることができる。この復元された現在のフレームは、ビデオストリームの別のフレームのインタ予測のための参照フレームの役割をするようにフレームバッファ207に記憶されることができる。
本発明によって提案される動き補間スキームは、予測ユニット210に配置され、動き推定および動き補償のために使用されて、分数ピクセル位置および整数ピクセル位置におけるフレームブロックが得られる。図3に示されるとおり、補間スキームは、以下の3つの補間フィルタタイプ、すなわち、
− 例えば、ガウスフィルタまたはバイリニアフィルタのような、有利には、リンギングを生成しないぼけ補間フィルタ302、
− 一般に、リンギングを生成することがあるシャープなステップ応答を有する従来のロングタップフィルタ、例えば、H.265/HEVCからの離散コサイン変換ベースの補間フィルタ(DCT−IF)のようなタップフィルタ303、
− シャープなステップ応答を有する従来のロングタップフィルタと、リンギングを低減し、かつエッジの鮮明さを高める非線形鮮明化フィルタの組合せのような、タップフィルタ303の後に鮮明化フィルタ311が続く組合せ
に基づく。
予測ユニット210、300は、少なくとも3つの補間フィルタのうちの1つを介して分数ピクセル解像度によりフレームバッファ207、307に記憶された参照ブロックを補間するように構成される。
動き推定中、これら3つの補間タイプのうちの1つが、例えば、最小予測誤差を行う決定ユニット305によって、または費用(レート/歪み)基準の最小によって選ばれることができる。
図4は、本発明の実施形態によるビデオ復号器、特に、動き補償により後続のフレームのビデオストリームを予測符号化することによって獲得されたコード化されたビデオビットストリームを復号するためのビデオ復号器400を示す。
ビデオ復号器400は、特に、フレームバッファ407と、予測ユニット410とを備える。フレームバッファ407は、コード化されたビデオビットストリームから獲得された少なくとも1つの参照フレームを記憶するように構成される。予測ユニット410は、分数ピクセル解像度を有する動きベクトルにより参照フレームの参照ブロックから現在のフレームの現在のブロックの予測ブロックを生成するように構成され、分数ピクセル解像度は、整数ピクセル位置および分数ピクセル位置を規定する。予測ユニット410は、以下の少なくとも3つの補間フィルタ、すなわち、
− ぼけ補間フィルタ302、
− タップフィルタ303、および
− 当該タップフィルタ303の後に続く鮮明化フィルタ311
のうちの1つを介して分数ピクセル解像度により参照ブロックを補間するように構成される。
復号器400は、ビデオ符号器300によって生成されたコード化されたビデオビットストリームを復号するように適応させられ、復号器400と符号器300の両方は、同一の予測を生成する。図3に示される鮮明化フィルタ311は、参照符号411によって図4において参照される。図3のぼけ補間フィルタ302およびタップフィルタ303は、補間フィルタブロック409によって図に表される。
特に、ビデオ復号器400は、例えば、逆量子化ユニット404、逆変換ユニット405、およびループフィルタリングユニット406のようなビデオ符号器200にも存在するさらなるユニットを備えてよく、これらは、それぞれ、ビデオ符号器200の逆量子化ユニット204、逆変換ユニット205、およびループフィルタリングユニット206に対応する。エントロピ復号ユニット403が、受信されたコード化されたビデオビットストリームを復号すること、および量子化された残差変換係数、および、存在する場合、シグナリング情報を対応するように獲得することを行うように適応させられる。量子化された残差変換係数は、逆量子化ユニット404および逆変換ユニット405に供給されて、残差ブロックを生成する。残差ブロックは、予測ブロックに追加され、追加は、ループフィルタリングユニット406に供給されて、復号されたビデオを獲得する。復号されたビデオのフレームは、フレームバッファ407に記憶されることができ、かつインタ予測のための参照フレームの役割をすることができる。
ビデオ符号器200とビデオ復号器400は、ぼけ補間フィルタ302、タップフィルタ303、およびタップフィルタ303と鮮明化フィルタ311の組合せである同様の補間フィルタを備える。有利には、ぼけ補間フィルタ302と鮮明化フィルタ311のうちの少なくとも1つは、少なくとも1つの適応パラメータによって制御されるように構成された適応フィルタである。
符号器側と復号器側で同一の予測を確実にするため、整数ピクセル位置、および分数ピクセル位置のそれぞれが、少なくとも3つの補間フィルタ302、303、303+311のうちの1つに関連付けられ、および/または、存在する場合、鮮明化フィルタ311および/またはぼけ補間フィルタ302の適応パラメータの所与の値に関連付けられる。
符号器200および復号器400に関して、3つの補間フィルタのなかの補間フィルタの選択は、整数ピクセル位置または分数ピクセル位置に依存し、したがって、所与の整数ピクセル位置または分数ピクセル位置は、所与の補間フィルタの選択、および存在する場合、適応パラメータの選択を暗示する。
ビデオ符号器200側で、3つの補間フィルタのなかの補間フィルタの選択は、動き推定中に獲得される動きベクトルによって規定される整数ピクセル位置または分数ピクセル位置に依存する。符号器200のコード化ユニット203は、コード化されたビデオビットストリームを生成すること、および補間フィルタタイプ、および、存在する場合、適応パラメータの所与の値、ならびに関連付けられた整数ピクセル位置または分数ピクセル位置を、コード化されたビデオビットストリームにおけるシグナリング情報として指定することを行うように構成される。さらに、コード化ユニット203は、動きベクトルを、コード化されたビデオビットストリームにおけるシグナリング情報として指定する。
ビデオ復号器400は、コード化されたビデオビットストリームからシグナリング情報を獲得するように構成される。復号器400は、補間フィルタタイプ、および関連付けられたピクセル位置を受信し、特に、各ピクセル位置に関して、関連付けられた補間フィルタタイプを受信する。存在する場合、復号器400は、各ピクセル位置に関する適応パラメータの所与の値も受信する。さらに、ビデオ復号器400は、動き推定中に符号器200によって決定された動きベクトルを、コード化されたビデオビットストリームにおけるシグナリング情報として獲得するように構成される。このため、獲得された動きベクトルを使用して、復号器400は、ピクセル位置、および関連付けられた補間フィルタタイプ、ならびに、存在する場合、関連付けられた適応パラメータ値を推測することができる。したがって、シグナリングオーバーヘッドを低減しながら、符号器側と復号器側で同一の予測が行われることができる。
図5は、本発明の実施形態によるビデオ符号化方法を示し、特に、動き補償により後続のフレームのビデオストリームを予測符号化して、コード化されたビデオビットストリームにするための方法を示す。
方法は、ビデオストリームの少なくとも1つの参照フレームを記憶するステップ501を備える。
方法は、分数ピクセル解像度を有する動きベクトルにより参照フレームの参照ブロックから現在のフレームの現在のブロックの予測ブロックを生成することを備える予測ステップ502をさらに備える。分数ピクセル解像度は、整数ピクセル位置および分数ピクセル位置を規定する。さらに、予測ステップは、以下の少なくとも3つの補間フィルタ、すなわち、
− ぼけ補間フィルタ、
− タップフィルタ、および
− 当該タップフィルタの後に続く鮮明化フィルタ
のうちの1つを介して分数ピクセル解像度により参照ブロックを補間することを備える。
図6は、本発明の実施形態によるビデオ復号方法を示し、特に、動き補償により後続のフレームのビデオストリームを予測符号化することによって獲得されたコード化されたビデオビットストリームを復号するための方法を示す。
方法は、コード化されたビデオビットストリームから獲得された少なくとも1つの参照フレームを記憶するステップ601を備える。
方法は、分数ピクセル解像度を有する動きベクトルにより参照フレームの参照ブロックから現在のフレームの現在のブロックの予測ブロックを生成することを備える予測ステップ602をさらに備える。分数ピクセル解像度は、整数ピクセル位置および分数ピクセル位置を規定する。予測ステップは、以下の少なくとも3つの補間フィルタ、すなわち、
− ぼけ補間フィルタ、
− タップフィルタ、および
− 当該タップフィルタの後に続く鮮明化フィルタ
のうちの1つを介して分数ピクセル解像度により参照ブロックを補間することをさらに備える。
ビデオ符号器200またはビデオ復号器400に関して説明されるさらなる態様および特徴は、符号化方法および復号方法にも該当する。
図7は、本発明によるぼけ補間フィルタの実施形態を示し、特に、ビデオ符号器200のぼけ補間フィルタ302の実施形態を示す。
図7の実施形態において、ぼけ補間フィルタ302は、パラメータ形態におけるガウスフィルタとして実装される。ぼけの量は、ガウスフィルタの1つの適応パラメータσだけによって制御されることができる。この単一の適応パラメータは、フィルタが容易に最適化されることができ、かつ適応ぼけパラメータを転送するためのシグナリングオーバーヘッドが低減されることができるという利点を有する。
ぼけ補間フィルタ302は、動きベクトルを入力として受信する。動きベクトルは、動き推定中に符号器200によって決定される。動きベクトルに基づいて、ユニット701は、動きベクトルのピクセル位置の分数部分を得るように構成される。
さらなるユニット702が、所与のパラメータσを用いてガウスフィルタ係数を計算すること、および分数シフトを獲得することを行うように構成される。ユニット703が、参照ブロック、およびユニット702によって計算された補間フィルタ係数を入力として使用して、動き予測ブロックを獲得するように構成される。次に、ぼけ補間フィルタ302が、予測誤差および費用基準を介して予測効率を計算するように構成される。
予測誤差は、残差ブロックに対応し、元のブロックと予測ブロックの間の差として計算される。
予測効率を最適化するのに、ユニット702は、パラメータσの別の値に関して係数を計算し、したがって、対応する予測ブロックがユニット703によって獲得されることができ、かつ対応する予測効率がぼけ補間フィルタ302によって計算されることができるように構成される。パラメータσの異なる値に関するこれらのステップの反復の後、ぼけ補間フィルタ302が、最良の予測効率を提供するパラメータσを選ぶ。
あるいは、パラメータσの異なる値を用いてガウスぼけフィルタを事前計算すること、および異なる分数位置に関してそれらを記憶することが可能である。このことは、最適化手順中にいくらかの計算リソースを節約することを許す。
ビデオ復号器400は、図7に示される符号器200のぼけ補間フィルタ302と同様のぼけ補間フィルタを備える。ビデオ復号器400のぼけ補間フィルタは、ユニット701、702、および703を同様に備え、動きベクトルを入力として同様に受信する。この動きベクトルは、コード化されたビデオビットストリームからシグナリング情報としてビデオ復号器400によって獲得される。復号器400は、補間フィルタパターンにより動きベクトルの分数部分からフィルタ係数を生成するために使用されるべきパラメータσの値を導き出す。
ビデオ符号器200のぼけ補間フィルタとビデオ復号器400のぼけ補間フィルタの間の差は、好ましくは、予測効率の計算、およびパラメータσの異なる値に関する予測効率の反復計算による予測効率の最適化に存する。
図8は、本発明による適応鮮明化フィルタの実施形態を示し、特に、ビデオ符号器200の適応鮮明化フィルタ311の実施形態を示す。
鮮明化フィルタ311は、好ましくは、非線形フィルタである。線形フィルタの代わりに非線形鮮明化フィルタを使用することが、動き補間フィルタ、および参照ブロックまたは参照フレームの量子化によってもたらされるアーチファクトを取り除くために好ましい。非線形フィルタの選択は、鮮明化フィルタ311の適応パラメータの数を低減することが可能である。特に、非線形フィルタは、1つだけの適応パラメータを利用することができ、したがって、コード化されたビデオビットストリームのシグナリングオーバーヘッドが低減される。本発明は、鮮明化フィルタ311を制御する複数の適応パラメータの使用も範囲に含むが、1つだけの適応パラメータを利用する鮮明化フィルタが、特に有利な実施形態である。
特に、鮮明化フィルタ311は、エッジマップ計算ユニット801、802と、ぼけフィルタ804と、高域フィルタ805と、スケール変更ユニット806と、ワーピングユニット807とを備える。
エッジマップ計算ユニット801、802は、ソースブロックのエッジマップを生成するように適応させられ、ソースブロックは、参照ブロックまたは予測ブロックである。ぼけフィルタ804は、ソースブロックのエッジマップをぼかすように適応させられる。高域フィルタ805は、ぼかされたエッジマップを高域フィルタリングすることによって、ソースブロックの各位置に関して導関数ベクトル(d2x,d2y)を生成するように適応させられる。スケール変更ユニット806は、鮮明化強度係数kを用いて導関数ベクトル(d2x,d2y)をスケール変更することによって変位ベクトル(wx,wy)を生成するように適応させられる。ワーピングユニット807は、変位ベクトル(wx,wy)に基づいて予測ブロックをワープさせるように適応させられる。
その結果、鮮明化フィルタ800を制御する適応パラメータは、鮮明化強度係数kである。図8に示される鮮明化フィルタ800は、1つだけの適応パラメータを有する本発明の実施形態である。
エッジマップ計算ユニット801、802は、ソースブロックの各位置に関する勾配ベクトル(dx,dy)を生成するように適応させられた勾配ベクトルユニット801と、各位置の勾配ベクトル(dx,dy)の長さを計算するように適応させられた勾配ベクトル長ユニット802とを備えて、ソースブロックのエッジマップを生成するようにすることができる。その結果、この構造は、ぼけフィルタ、高域フィルタ、およびスケール変更ユニットによってさらに処理されて、ワーピング変位ベクトルを生成するようにすることができるエッジマップの生成を可能にする。
勾配ベクトルは、以下の式、すなわち、
Figure 2018530244
により対応するプレヴィット(Prewitt)フィルタを適用することによってdxとdyに関して別々に、すなわち、図8において動き予測ブロックと呼ばれるソースブロックの水平方向と垂直方向の両方に関して別々に第1の導関数をとることによって獲得されることができる。
エッジマップは、以下の式、すなわち、
Figure 2018530244
により勾配ベクトル長を計算することによって勾配ベクトル長ユニット802によって獲得されることができる。
有利には、鮮明化フィルタ311は、ソースブロックのエッジマップをクリップするように適応させられたクリッピングユニット803を備え、クリッピングユニット803は、エッジマップ計算ユニット801、802とぼけフィルタ804の間に配置される。その結果、しきい値を用いてエッジマップをクリップすることは、それが、ワーピングベクトルの極端に高い値および極端に低い値の処理を防止するという点で有利である。
クリップされたエッジマップをぼかすステップは、以下、すなわち、
Figure 2018530244
として規定されることができるガウスフィルタの形態でぼけフィルタ804によって獲得されることができる。
高域フィルタは、例えば、以下、すなわち、
Figure 2018530244
によりd2xとd2yに関して別々に第2の導関数を獲得するのに使用される。
変位ベクトル(wx,wy)は、以下の式、すなわち、
wx=k*d2
wy=k*d2
により、係数kを用いて第2の導関数ベクトル(d2x,d2y)をスケール変更することによって獲得され、係数kは、鮮明化強度と見なされることができる。
ワーピングユニット807は、例えば、バイリニア補間フィルタである補間フィルタを含み、分数ピクセル位置におけるサンプル値を獲得する。ワーピングユニット807は、スケール変更ユニット806によって生成された変位ベクトルを使用する。その結果、ビデオ符号器の全体的な品質が向上させられる一方で、同時に、所望される分数ピクセル位置上で参照フレーム/ブロックの補間を提供する。
減算ユニット808が、ワーピングユニット807によって生成された鮮明化された予測ブロックと現在のブロックの間の差を構築するように適応させられ、現在のブロックは、コード化されるべきブロックに対応する。減算ユニット808は、事実上、残差ブロックを生成する。鮮明化フィルタ311は、例えば、残差ブロックを最小化することによって、または、例えば、レート−歪みに基づく費用基準によって最適な鮮明化強度kを見出すように適応させられる。
ビデオ復号器400は、図8に示されるビデオ符号器200の適応鮮明化フィルタ311と同様の適応鮮明化フィルタを備える。ビデオ符号器200の適応鮮明化フィルタとビデオ復号器400の適応鮮明化フィルタの間の差は、好ましくは、減算ユニット808、および残差ブロックのこの最小化に存する。
ビデオ復号器400において、適応パラメータ、例えば、係数kは、減算ユニット808、および残差ブロックの最小化を介して設定されることはない。代わりに、適応パラメータは、補間フィルタパターンにより、好ましくは、動きベクトルの分数部分に依存してビデオ復号器400において設定される。
鮮明化フィルタ400は、ソースブロックから計算された変位ベクトルに基づくワーピングを備え、ソースブロックは、動き予測ブロックとして図8において参照される。
図8に示されない実施形態によれば、ソースブロックは、変位ベクトル(wx,wy)が参照ブロックから導き出されるように、フレームバッファ207に記憶された参照フレームの参照ブロックである。その結果、参照ブロックは、鮮明化変位ベクトルまたはワーピング変位ベクトルとも呼ばれる、変位ベクトルを獲得するためのソースブロックとしても使用される。次に、ワーピングが、獲得された変位ベクトルを使用して予測ブロックに適用される。この実施形態は、エンコーダ側で計算リソースを節約するという点で有利である。
図8の代替の実施形態によれば、ソースブロックは、予測ユニット210によって生成された予測ブロックであり、変位ベクトル(wx,wy)が予測ブロックから導き出されるようになる。
その結果、ソースブロックとして予測ブロックを選ぶことは、予測ブロックのワーピングを行うための適切な変位ベクトルの計算を可能にする。すると、また、鮮明化フィルタは、予測ブロックに関して1つの入力しか要求せず、参照ブロックに関する第2の入力は必要とされない。
図8の実施形態に関して、鮮明化フィルタは、1つだけの係数、例えば、鮮明化強度kだけによって制御されることができる。このことは、適応処理をより容易にし、かつ従来の線形ウィナーベースの適応フィルタと比べて、伝送のためにより少ないシグナリングビットしか要求しない。また、知られている線形フィルタの代わりに非線形鮮明化フィルタを使用することは、動き補間フィルタ、および参照ピクチャの量子化によってもたらされるアーチファクトを取り除くためにより好ましくもある。
図9は、本発明の実施形態によるぼけ補間フィルタの補間フィルタパターンを示す。図9に示される補間フィルタパターンは、整数ピクセル位置の各位置、および分数ピクセル位置の各位置に関して、関連付けられた補間フィルタがぼけ補間フィルタ302であると規定する。さらに、図9のパターンは、各ピクセル位置に関して、適応パラメータの値、例えば、ぼけ係数σの値を規定する。
動きベクトルの分数空間は、いくつかのピクセル位置を備える。H.264/AVCおよびH.265/HEVCのような最新のビデオコーデックにおいて、動きベクトルは、通常、次元Xと次元Yの両方において1/4ピクセル解像度を有する。図9は、そのような1/4ピクセル解像度による本発明の実施形態を示す。この解像度は、4×4=16の可能な位置の合計を暗示する。これらの可能な位置は、正方形「a」として識別された1つの整数位置、ならびに15の分数位置b、c、d、e、f、g、h、i、j、k、l、m、n、o、pを含む。分数位置は、円c、i、kとして識別された3と1/2ピクセル位置、ならびに対応する三角形として識別された12と1/4ピクセル位置を備える。パターンは、各位置に関して、ぼけ係数σに関する値σ1、...、σ16を規定する。
図9の補間フィルタパターンは、コード化されたビデオビットストリームにシグナリング情報として符号器200によって追加されることができ、かつコード化されたビデオビットストリームから復号器400によって対応するように獲得されることができる。図9の補間フィルタパターンによる補間を実行することは、シャープなステップ応答を有する従来の固定フィルタを使用する代わりに、ぼけ補間フィルタが補間のために適用されることを意味する。分数位置に関連付けられたぼけ係数σiは、適応ぼけ補間フィルタに関する適応係数として使用される。
係数σiは、一定であり、かつオフライン訓練によって事前規定される、または、例えば、以前の符号化実験に基づいて選ばれることができる。パターンの異なる分数位置において同一のぼけ係数σiを有することが許される。また、係数σiは、シーケンスレベルで、GOPレベルで、フレームレベルで、または領域レベルで可変であり、かつ適応的であってもよい。その場合、さらなるシグナリングが要求される。
図10は、本発明の実施形態による鮮明化フィルタに関する補間フィルタパターンを示す。
図10の補間フィルタパターンは、図9のパターンと同様であり、かつ整数ピクセル位置の各位置、および分数ピクセル位置の各位置に関して、関連付けられた補間フィルタが鮮明化フィルタ311であることを規定する。さらに、ぼけ補間フィルタのぼけ係数σを規定する代わりに、図10の補間フィルタパターンは、各ピクセル位置に関して、適応パラメータの値、例えば、鮮明化強度係数kの値を規定する。
図9と同様に、係数kiは、一定であり、かつオフライン訓練によって事前規定される、または、例えば、以前の符号化実験に基づいて選ばれることができる。異なる分数位置において同一の鮮明化係数kiを有することが許される。また、係数kiは、シーケンスレベルで、GOPレベルで、フレームレベルで、または領域レベルで可変であり、かつ適応的であってもよい。その場合、さらなるシグナリングが要求される。
図11は、本発明のさらなる実施形態による補間フィルタパターンを示す。
図11に示されるパターンは、事実上、3つすべての補間フィルタタイプを包含する混合補間フィルタパターンである。いくつかの分数ピクセル位置b、e、f、g、h、j、nが、関連付けられたぼけパラメータσを有し、このことは、これらの位置に関して、ぼけ補間フィルタ302が対応するフィルタパラメータσ1、...、σ7を用いて適用されるべきことを意味する。
他のいくつかのピクセル位置l、o、pは、関連付けられた鮮明化強度パラメータkを有し、このことは、タップフィルタ303を用いた、すなわち、従来の固定フィルタタップを用いた補間の後、適応鮮明化フィルタ311が、対応するパラメータ値k1、k2、k3を用いて適用されるべきことを意味する。
他のいくつかのピクセル位置a、c、d、i、k、mは、関連付けられたパラメータをまったく有さない、すなわち、補間フィルタパターンは、これらの位置にパラメータ値をまったく関連付けない。このことは、復号器400によって、これらの位置に関して、タップフィルタ303、すなわち、従来の線形補間フィルタが使用されるように解釈される。
1つの補間フィルタパターンにおいてすべての補間タイプを混合することによって、今や、エンコーダが、画像内容に適応的に各特定の場合に関する最も適切な補間を選ぶことが可能である。
図9、図10、および図11の実施形態において、このように、動きベクトルの分数位置は、補間フィルタタイプにおいて、ならびにぼけ補間フィルタ302および鮮明化フィルタ311に関して、規定された補間フィルタタイプの適応パラメータを規定することができる。補間フィルタパターンは、符号器と復号器の両方によって知られなければならない。それは、事前規定されてよく、または適応的であり、かつサイド情報として、すなわち、コード化されたビデオビットストリームのシグナリング情報として渡されてよい。
図12は、異なる補間フィルタパターンを有する本発明の実施形態を示す。
フレームのいくつかの領域に関して、ぼけ補間フィルタ302または鮮明化フィルタ311を使用することは、必要ないことがある。そのような場合、すべての分数ポイントに関してタップフィルタ303を使用することがより良好である。フレームの他の領域において、ぼけ補間フィルタ302または鮮明化フィルタ311を適用することが最適であり得る。
これらの変形を範囲に含めるのに、フレームのいくつかの局所的領域に関して異なるいくつかの補間フィルタパターンを規定し、例えば、レート歪み最適化のような費用基準に基づいて最良の補間フィルタパターンを選び、所与の領域における動き補間のためにいずれの補間フィルタパターンが使用されるべきかを復号器400にシグナリングすることが提案される。
対応するように、図12は、例えば、異なる2つの補間フィルタパターンが使用されながら、いくつかの領域を備えるフレームを示す。「補間パターン0」として識別された第1のパターンは、各ピクセル位置に関してタップフィルタ303、すなわち、従来の固定補間フィルタが使用されるべきことを規定する一方で、「補間パターン1」として識別された第2のパターンは、図11に示されるとおりの混合補間フィルタパターンである。
図12の実施形態において、符号器200は、2つの領域に関して第1のパターンを選び、フレームの残り4つの領域に関して第2のパターンを選ぶ。コード化処理中、特定の各領域に関して、すなわち、例えば各最大符号化ユニット(LCU)に関して最良の補間フィルタパターンが選ばれることができ、かつ1ビットで復号器にシグナリングされることができ、ビットは、第1の補間フィルタパターンまたは第2の補間フィルタパターンを決定する。
本発明は、例としての様々な実施形態、ならびに実装形態に関連して説明されてきた。しかし、図面、本開示、および独立クレームの検討から、他の変形が、主張される発明を実施する当業者によって理解され、実現されることができる。特許請求の範囲、ならびに説明において、「備える(comprising)」という語は、他の要素も、他のステップも除外せず、「a」または「an」という不定冠詞は、複数を除外しない。単一の要素、または他のユニットが、特許請求の範囲に記載されるいくつかのエンティティまたはアイテムの機能を遂行してよい。ある手段が互いに異なる従属クレームに記載されるという単なる事実は、これらの手段の組合せが有利な実装形態において使用されることができないことを示すわけではない。

Claims (33)

  1. 動き補償により後続のフレームのビデオストリームを予測符号化して、コード化されたビデオビットストリームにするためのビデオ符号器であって、
    − 前記ビデオストリームの少なくとも1つの参照フレームを記憶するように構成されたフレームバッファ(207)と、
    − 分数ピクセル解像度を有する動きベクトルにより前記参照フレームの参照ブロックから現在のフレームの現在のブロックの予測ブロックを生成するように構成された予測ユニット(210)であって、前記分数ピクセル解像度は、整数ピクセル位置および分数ピクセル位置を規定する、予測ユニット(210)と
    を備え、
    前記予測ユニット(210)は、以下の少なくとも3つの補間フィルタ、すなわち、
    − ぼけ補間フィルタ(302)、
    − タップフィルタ(303)、および
    − 前記タップフィルタ(303)の後に続く鮮明化フィルタ(311)
    のうちの1つを介して前記分数ピクセル解像度により前記参照ブロックを補間するように構成される、ビデオ符号器。
  2. 前記ぼけ補間フィルタ(302)と前記鮮明化フィルタ(311)のうちの少なくとも1つは、少なくとも1つの適応パラメータによって制御されるように構成された適応フィルタである請求項1に記載のビデオ符号器。
  3. 前記鮮明化フィルタ(311)は、単一の適応パラメータによって制御されるように構成される請求項2に記載のビデオ符号器。
  4. 前記鮮明化フィルタ(311)は、非線形フィルタである請求項1乃至3のいずれか一項に記載のビデオ符号器。
  5. 前記適応鮮明化フィルタ(311)は、
    − ソースブロックのエッジマップを生成するように適応させられたエッジマップ計算ユニット(801、802)であって、前記ソースブロックは、前記参照ブロックまたは前記予測ブロックである、エッジマップ計算ユニット(801、802)と、
    − 前記ソースブロックの前記エッジマップをぼかすように適応させられたぼけフィルタ(804)と、
    − 前記ぼかされたエッジマップを高域フィルタリングすることによって、前記ソースブロックの各位置に関する導関数ベクトル(d2x,d2y)を生成するように適応させられた高域フィルタ(805)と、
    − 鮮明化強度係数(k)を用いて前記導関数ベクトル(d2x,d2y)をスケール変更することによって変位ベクトル(wx,wy)を生成するように適応させられたスケール変更ユニット(806)と、
    − 前記変位ベクトル(wx,wy)に基づいて前記予測ブロックをワープさせるように適応させられたワーピングユニット(807)と
    を備える請求項1乃至4のいずれか一項に記載のビデオ符号器。
  6. 前記鮮明化フィルタ(311)の前記適応パラメータは、前記鮮明化強度係数(k)を含む、請求項2または3に従属する請求項5に記載のビデオ符号器。
  7. 前記予測ユニットは、残差ブロックを最小化する前記鮮明化強度係数(k)を選択するように構成され、前記残差ブロックは、前記現在のブロックと前記適応鮮明化フィルタ(311)によって出力される前記予測ブロックとの間の差である、または、例えば、レート歪み最適化のような費用基準に基づく請求項5または6に記載のビデオ符号器。
  8. 前記ぼけ補間フィルタ(302)は、単一の適応パラメータを備える請求項2乃至7のいずれか一項に記載のビデオ符号器。
  9. 前記ぼけ補間フィルタ(302)の前記適応パラメータは、ぼけ係数(σ)を含む請求項8に記載のビデオ符号器。
  10. 前記ぼけ補間フィルタ(302)は、ガウスフィルタまたはバイリニアフィルタであり、かつ前記ぼけ補間フィルタ(302)がガウスフィルタである場合、前記ぼけ係数(σ)は、ガウス分布の標準偏差である請求項9に記載のビデオ符号器。
  11. 前記ぼけ補間フィルタ(302)は、
    − 前記標準偏差(σ)に基づいてガウスフィルタ係数を計算するように構成された計算ユニット(402)と、
    − 前記計算されたガウスフィルタ係数を使用することによって、前記ぼけ補間フィルタ(302)の出力として予測ブロックを生成するように構成されたフィルタリングユニット(403)と
    を備える請求項10に記載のビデオ符号器。
  12. − 異なる標準偏差(σ)に基づいてガウスフィルタ係数の事前計算されたセットを記憶するように構成されたユニットと、
    − ガウスフィルタの前記事前計算されたセットのうちの1つのフィルタを使用することによって、前記ぼけ補間フィルタ(302)の出力として予測ブロックを生成するように構成されたフィルタリングユニット(403)と
    を備える請求項10に記載のビデオ符号器。
  13. 前記予測ユニットは、残差ブロックを最小化する前記ぼけ係数(σ)を選択するように構成され、前記残差ブロックは、前記現在のブロックと前記ぼけ補間フィルタ(302)によって出力される前記予測ブロックとの間の差である、または、例えば、レート歪み最適化のような費用基準に基づく請求項9乃至12のいずれか一項に記載のビデオ符号器。
  14. 前記タップフィルタ(303)は、シャープなステップ応答を有する固定ロングタップフィルタである請求項1乃至13のいずれか一項に記載のビデオ符号器。
  15. 前記整数ピクセル位置、および前記分数ピクセル位置のそれぞれが、前記少なくとも3つの補間フィルタ(302、303、303+311)のうちの前記1つに関連付けられ、および/または、存在する場合、前記鮮明化フィルタ(311)および/または前記ぼけ補間フィルタ(302)の前記適応パラメータの所与の値に関連付けられる請求項2乃至14のいずれか一項に記載のビデオ符号器。
  16. 前記コード化されたビデオビットストリームを生成すること、ならびに、補間フィルタタイプおよび前記適応パラメータの前記所与の値、ならびに前記関連付けられた整数ピクセル位置または分数ピクセル位置を、前記コード化されたビデオビットストリームにおけるシグナリング情報として指定することを行うように構成されたコード化ユニット(203)を備える請求項15に記載のビデオ符号器。
  17. 前記3つの補間フィルタのなかからの前記補間フィルタの前記選択は、前記整数ピクセル位置または前記分数ピクセル位置に依存し、したがって、所与の整数ピクセル位置または分数ピクセル位置は、所与の補間フィルタの前記選択、および存在する場合、適応パラメータの選択を暗示する請求項1乃至16のいずれか一項に記載のビデオ符号器。
  18. 前記整数ピクセル位置および前記分数ピクセル位置の各位置に関して、前記関連付けられた補間フィルタタイプを規定し、および/または、存在する場合、前記適応パラメータの前記値を規定する少なくとも1つの補間フィルタパターンを備える請求項1乃至17のいずれか一項に記載のビデオ符号器。
  19. 複数の補間フィルタパターンを備え、
    前記予測ユニット(210)は、前記複数の補間フィルタパターンのうちの1つを選択するように構成される請求項1乃至18のいずれか一項に記載のビデオ符号器。
  20. 前記コード化されたビデオビットストリームを生成すること、および前記補間フィルタパターンを、前記コード化されたビデオビットストリームにおけるシグナリング情報として追加することを行うように構成されたコード化ユニット(203)を備える請求項18または19に記載のビデオ符号器。
  21. 複数の補間フィルタパターンが提供される場合、前記コード化ユニット(203)は、選択される前記補間フィルタパターンについての選択情報を、前記コード化されたビデオビットストリームにおけるシグナリング情報として追加するように構成される請求項18乃至20のいずれか一項に記載のビデオ符号器。
  22. 前記コード化ユニット(203)は、フレームレベルで、GOP(ピクチャのグループ)レベルで、PPS(ピクチャパラメータセット)レベルで、またはSPS(シーケンスパラメータセット)レベルで、前記フレームの任意の領域または規則的な領域に関して、各予測ブロックに関して選択される前記補間フィルタパターンについての前記シグナリング情報を追加するように構成される請求項18乃至21のいずれか一項に記載のビデオ符号器。
  23. 動き補償により後続のフレームのビデオストリームを予測符号化して、コード化されたビデオビットストリームにするための方法であって、
    − 前記ビデオストリームの少なくとも1つの参照フレームを記憶するステップ(501)と、
    − 分数ピクセル解像度を有する動きベクトルにより前記参照フレームの参照ブロックから現在のフレームの現在のブロックの予測ブロックを生成することを備える予測ステップ(502)であって、前記分数ピクセル解像度は、整数ピクセル位置および分数ピクセル位置を規定する、ステップ(502)と、
    を備え、
    前記予測ステップは、以下の少なくとも3つの補間フィルタ、すなわち、
    − ぼけ補間フィルタ、
    − タップフィルタ、および
    − 前記タップフィルタの後に続く鮮明化フィルタ
    のうちの1つを介して前記分数ピクセル解像度により前記参照ブロックを補間するステップをさらに備える、方法。
  24. 動き補償により後続のフレームのビデオストリームを予測符号化することによって獲得されたコード化されたビデオビットストリームを復号するためのビデオ復号器であって、
    − 前記コード化されたビデオビットストリームから獲得された少なくとも1つの参照フレームを記憶するように構成されたフレームバッファ(407)と、
    − 分数ピクセル解像度を有する動きベクトルにより前記参照フレームの参照ブロックから現在のフレームの現在のブロックの予測ブロックを生成するように構成された予測ユニット(410)であって、前記分数ピクセル解像度は、整数ピクセル位置および分数ピクセル位置を規定する、予測ユニット(410)と
    を備え、
    前記予測ユニット(410)は、以下の少なくとも3つの補間フィルタ、すなわち、
    − ぼけ補間フィルタ(302)、
    − タップフィルタ(303)、および
    − 前記タップフィルタ(303)の後に続く鮮明化フィルタ(311)
    のうちの1つを介して前記分数ピクセル解像度により前記参照ブロックを補間するように構成される、ビデオ復号器。
  25. 前記ぼけ補間フィルタ(302)と前記鮮明化フィルタ(311)のうちの少なくとも1つは、少なくとも1つの適応パラメータによって制御されるように構成された適応フィルタである請求項24に記載のビデオ復号器。
  26. 前記3つの補間フィルタのなかからの前記補間フィルタの前記選択は、前記整数ピクセル位置または前記分数ピクセル位置に依存し、したがって、所与の整数ピクセル位置または分数ピクセル位置は、所与の補間フィルタの前記選択、および/または存在する場合、前記適応パラメータの値を暗示する請求項24または25に記載のビデオ復号器。
  27. 前記予測ユニット(410)は、補間フィルタパターンにより前記3つの補間フィルタのうちの前記1つを選択するように構成され、かつ
    前記補間フィルタパターンは、前記動きベクトルの整数位置、およびそれに関連付けられた分数位置に関して、関連付けられた補間フィルタタイプを規定し、および/または、存在する場合、前記適応パラメータの前記値を規定する請求項24乃至26のいずれか一項に記載のビデオ復号器。
  28. 前記補間フィルタパターンをシグナリング情報として、前記コード化されたビデオビットストリームから獲得するように構成された復号ユニット(403)を備える請求項27に記載のビデオ復号器。
  29. 複数の補間フィルタパターン、ならびに選択される前記補間フィルタパターンについての選択情報をシグナリング情報として、前記コード化されたビデオビットストリームから獲得するように構成された復号ユニット(403)を備え、
    前記予測ユニット(410)は、前記獲得された選択情報により、前記獲得された補間フィルタパターンのうちの1つを選択すること、および前記選択された補間フィルタパターンにより前記3つの補間フィルタのうちの前記1つを選ぶことを行うように構成される請求項27に記載のビデオ復号器。
  30. 前記予測ユニット(410)は、前記ビデオ復号器が前記コード化されたビデオビットストリームを受信する前に複数の補間フィルタパターンを事前記憶するように構成され、
    前記ビデオ復号器は、選択される前記事前記憶された補間フィルタパターンについての選択情報をシグナリング情報として、前記コード化されたビデオビットストリームから獲得するように構成された復号ユニット(403)をさらに備え、
    前記予測ユニット(410)は、前記獲得された選択情報により前記事前記憶された補間フィルタパターンのうちの1つを選択すること、および前記選択された補間フィルタパターンにより前記3つの補間フィルタのうちの前記1つを選ぶことを行うように構成される請求項27に記載のビデオ復号器。
  31. 前記復号ユニット(403)は、フレームレベルで、GOP(ピクチャのグループ)レベルで、PPS(ピクチャパラメータセット)レベルで、またはSPS(シーケンスパラメータセット)レベルで、前記フレームの任意の領域または規則的な領域に関して、各予測ブロックに関して選択される前記補間フィルタパターンについての前記シグナリング情報を獲得するように構成される請求項25および請求項28乃至30のいずれか一項に記載のビデオ復号器。
  32. 動き補償により後続のフレームのビデオストリームを予測符号化することによって獲得されたコード化されたビデオビットストリームを復号するための方法であって、
    − 前記コード化されたビデオビットストリームから獲得された少なくとも1つの参照フレームを記憶するステップ(601)と、
    − 分数ピクセル解像度を有する動きベクトルにより前記参照フレームの参照ブロックから現在のフレームの現在のブロックの予測ブロックを生成することを備える予測ステップ(602)であって、前記分数ピクセル解像度は、整数ピクセル位置および分数ピクセル位置を規定する、予測ステップ(602)と
    を備え、
    前記予測ステップは、以下の少なくとも3つの補間フィルタ、すなわち、
    − ぼけ補間フィルタ、
    − タップフィルタ、および
    − 前記タップフィルタの後に続く鮮明化フィルタ
    のうちの1つを介して前記分数ピクセル解像度により前記参照ブロックを補間するステップをさらに備える、方法。
  33. コンピュータプログラムがコンピューティングデバイス上で走ると請求項23または32に記載の方法を実行するためのプログラムコードを有するコンピュータプログラム。
JP2018515856A 2015-09-25 2015-09-25 選択可能な補間フィルタを用いるビデオ動き補償のための装置および方法 Pending JP2018530244A (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/RU2015/000614 WO2017052409A1 (en) 2015-09-25 2015-09-25 Apparatus and method for video motion compensation with selectable interpolation filter

Publications (1)

Publication Number Publication Date
JP2018530244A true JP2018530244A (ja) 2018-10-11

Family

ID=55754395

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018515856A Pending JP2018530244A (ja) 2015-09-25 2015-09-25 選択可能な補間フィルタを用いるビデオ動き補償のための装置および方法

Country Status (13)

Country Link
US (1) US10841605B2 (ja)
EP (1) EP3354028B1 (ja)
JP (1) JP2018530244A (ja)
KR (1) KR102192778B1 (ja)
CN (1) CN107925772B (ja)
AU (1) AU2015410097B2 (ja)
BR (1) BR112018006009B1 (ja)
CA (1) CA2999826C (ja)
MX (1) MX2018003768A (ja)
MY (1) MY187403A (ja)
RU (1) RU2696311C1 (ja)
WO (1) WO2017052409A1 (ja)
ZA (1) ZA201802228B (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2022526244A (ja) * 2019-03-12 2022-05-24 フラウンホーファー-ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン ハイブリッドビデオコード化のためのエンコーダ、デコーダ、方法、およびビデオビットストリーム、ならびにコンピュータプログラム

Families Citing this family (32)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102357142B1 (ko) * 2017-11-07 2022-02-08 후아웨이 테크놀러지 컴퍼니 리미티드 비디오 코딩을 위한 인터 예측 장치 및 방법을 위한 보간 필터
EP3799692A4 (en) * 2018-06-13 2021-08-04 Huawei Technologies Co., Ltd. INTRA ENHANCEMENT AND / OR CONTOUR CORRECTION FILTER FOR VIDEO CODING ON THE BASIS OF A BIT TRAIN FLAG
CN111010568B (zh) * 2018-10-06 2023-09-29 华为技术有限公司 插值滤波器的训练方法、装置及视频图像编解码方法、编解码器
CN113228637B (zh) * 2018-12-17 2024-08-16 北京字节跳动网络技术有限公司 依赖于形状的插值滤波器
WO2020139169A1 (en) * 2018-12-28 2020-07-02 Huawei Technologies Co., Ltd. Method and apparatus of sharpening interpolation filtering for predictive coding
CN113196755A (zh) * 2018-12-30 2021-07-30 北京达佳互联信息技术有限公司 用于三角形预测的视频编解码的方法和装置
US11044480B2 (en) * 2019-01-24 2021-06-22 Google Llc More accurate 2-tap interpolation filters for video compression
WO2020177696A1 (en) 2019-03-05 2020-09-10 Huawei Technologies Co., Ltd. Use of extended samples during search in decoder-side motion refinement
CN110033415B (zh) * 2019-03-20 2023-03-21 东南大学 一种基于Retinex算法的图像去模糊方法
MX2021011814A (es) 2019-03-28 2021-11-12 Huawei Tech Co Ltd Método y aparato para intra alisado.
MX2021011619A (es) 2019-04-01 2021-10-13 Beijing Bytedance Network Tech Co Ltd Uso de filtros de interpolacion para la prediccion de vector de movimiento basada en historia.
KR102609947B1 (ko) 2019-04-02 2023-12-04 베이징 바이트댄스 네트워크 테크놀로지 컴퍼니, 리미티드 양방향 광학 흐름 기반 비디오 코딩 및 디코딩
WO2020211864A1 (en) 2019-04-19 2020-10-22 Beijing Bytedance Network Technology Co., Ltd. Region based gradient calculation in different motion vector refinements
CN113711609B (zh) 2019-04-19 2023-12-01 北京字节跳动网络技术有限公司 利用光流的预测细化过程中的增量运动矢量
KR102653570B1 (ko) * 2019-05-12 2024-04-02 베이징 바이트댄스 네트워크 테크놀로지 컴퍼니, 리미티드 참조 픽처 리샘플링을 위한 신호
BR112022002480A2 (pt) 2019-08-20 2022-04-26 Beijing Bytedance Network Tech Co Ltd Método para processamento de vídeo, aparelho em um sistema de vídeo, e, produto de programa de computador armazenado em uma mídia legível por computador não transitória
CN114223205A (zh) * 2019-08-23 2022-03-22 北京字节跳动网络技术有限公司 参考图片重采样
CN114287135A (zh) 2019-08-23 2022-04-05 北京字节跳动网络技术有限公司 参考图片重采样中的剪切
WO2021056212A1 (zh) * 2019-09-24 2021-04-01 深圳市大疆创新科技有限公司 视频编解码方法和装置
CN110572676B (zh) * 2019-09-27 2023-12-12 腾讯科技(深圳)有限公司 视频编码方法和装置、视频解码方法和装置及存储介质
JP7534395B2 (ja) 2019-09-30 2024-08-14 ホアウェイ・テクノロジーズ・カンパニー・リミテッド インター予測装置用の補間フィルタおよびビデオコーディングのための方法
JP7395727B2 (ja) 2019-10-23 2023-12-11 北京字節跳動網絡技術有限公司 ビデオ・データを処理する方法、装置及び記憶方法
WO2021078177A1 (en) 2019-10-23 2021-04-29 Beijing Bytedance Network Technology Co., Ltd. Signaling for reference picture resampling
KR102617470B1 (ko) * 2019-12-24 2023-12-21 베이징 다지아 인터넷 인포메이션 테크놀로지 컴퍼니 리미티드 참조 픽처 리샘플링을 위한 방법 및 장치
WO2021146933A1 (en) * 2020-01-21 2021-07-29 Alibaba Group Holding Limited Next-generation loop filter implementations for adaptive resolution video coding
KR102254290B1 (ko) 2020-11-18 2021-05-21 한국과학기술원 모션 처리 방법 및 장치
CN112911286B (zh) * 2021-01-29 2022-11-15 杭州电子科技大学 一种分像素插值滤波器的设计方法
KR20220124031A (ko) * 2021-03-02 2022-09-13 삼성전자주식회사 영상 패킷을 송수신하는 전자 장치 및 이의 동작 방법
CN113301347B (zh) * 2021-05-08 2023-05-05 广东工业大学 一种hevc高清视频编码的优化方法
CN117716690A (zh) * 2021-06-25 2024-03-15 抖音视界有限公司 自适应双边滤波器的使用条件
US20230179763A1 (en) * 2021-12-06 2023-06-08 Tencent America LLC Interpolation Filters for Adaptive Motion Vector Difference Resolution
WO2024148540A1 (zh) * 2023-01-11 2024-07-18 Oppo广东移动通信有限公司 编解码方法、解码器、编码器、码流及存储介质

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001057677A (ja) * 1999-06-10 2001-02-27 Fuji Photo Film Co Ltd 画像処理方法および装置並びに記録媒体
JP2003333604A (ja) * 2002-04-10 2003-11-21 Microsoft Corp ベクトル変換方法およびシステム
JP2004007337A (ja) * 2002-04-25 2004-01-08 Sony Corp 画像処理装置およびその方法
JP2006067213A (ja) * 2004-08-26 2006-03-09 Casio Comput Co Ltd 動きベクトル検出装置、および、プログラム
JP2008054267A (ja) * 2006-07-28 2008-03-06 Hitachi Ltd 画像処理装置、画像符号化装置及び画像復号化装置
JP2010507286A (ja) * 2006-10-13 2010-03-04 クゥアルコム・インコーポレイテッド 動き補償予測のための適応フィルタリングを備えたビデオ符号化
JP2010110004A (ja) * 1999-06-04 2010-05-13 Trustees Of Columbia Univ In The City Of New York 空間的に変動する露出を用いて高ダイナミックレンジ画像化をする装置及び方法
US20100284458A1 (en) * 2008-01-08 2010-11-11 Telefonaktiebolaget L M Ericsson (Publ) Adaptive filtering
JP2011527553A (ja) * 2008-07-07 2011-10-27 クゥアルコム・インコーポレイテッド フィルタ選択によるビデオ符号化
JP2014504098A (ja) * 2010-12-21 2014-02-13 インテル・コーポレーション 高い効率の動画符号化のためのコンテンツアダプティブ動き補償フィルタリング
JP2015165726A (ja) * 2010-09-30 2015-09-17 サムスン エレクトロニクス カンパニー リミテッド 動き補償方法及び動き補償装置

Family Cites Families (40)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6175656B1 (en) 1999-03-25 2001-01-16 Sony Corporation Non-linear video sharpening filter
US20020063807A1 (en) 1999-04-19 2002-05-30 Neal Margulis Method for Performing Image Transforms in a Digital Display System
FI117533B (fi) 2000-01-20 2006-11-15 Nokia Corp Menetelmä digitaalisten videokuvien suodattamiseksi
US7266150B2 (en) 2001-07-11 2007-09-04 Dolby Laboratories, Inc. Interpolation of video compression frames
US20130107938A9 (en) 2003-05-28 2013-05-02 Chad Fogg Method And Apparatus For Scalable Video Decoder Using An Enhancement Stream
US7471845B2 (en) 2004-01-06 2008-12-30 Sharp Laboratories Of America, Inc. De-ringing filter
US7397853B2 (en) 2004-04-29 2008-07-08 Mediatek Incorporation Adaptive de-blocking filtering apparatus and method for MPEG video decoder
RU2008106939A (ru) 2005-04-19 2009-08-27 Самсунг Электроникс Ко., Лтд. (KR) Способ и устройство адаптивного выбора контекстной модели для кодирования по энтропии
EP1841230A1 (en) 2006-03-27 2007-10-03 Matsushita Electric Industrial Co., Ltd. Adaptive wiener filter for video coding
US7751873B2 (en) 2006-11-08 2010-07-06 Biotronik Crm Patent Ag Wavelet based feature extraction and dimension reduction for the classification of human cardiac electrogram depolarization waveforms
US8199812B2 (en) 2007-01-09 2012-06-12 Qualcomm Incorporated Adaptive upsampling for scalable video coding
US20080205508A1 (en) 2007-02-22 2008-08-28 Streaming Networks (Pvt.) Ltd. Method and apparatus for low complexity video encoding and decoding
EP2081386A1 (en) 2008-01-18 2009-07-22 Panasonic Corporation High precision edge prediction for intracoding
US8705622B2 (en) 2008-04-10 2014-04-22 Qualcomm Incorporated Interpolation filter support for sub-pixel resolution in video coding
US20090257499A1 (en) * 2008-04-10 2009-10-15 Qualcomm Incorporated Advanced interpolation techniques for motion compensation in video coding
US10123050B2 (en) * 2008-07-11 2018-11-06 Qualcomm Incorporated Filtering video data using a plurality of filters
JP4763026B2 (ja) * 2008-08-27 2011-08-31 シャープ株式会社 画像処理装置、画像形成装置、画像処理方法、画像処理プログラム及びコンピュータ読み取り可能な記録媒体
US9078007B2 (en) 2008-10-03 2015-07-07 Qualcomm Incorporated Digital video coding with interpolation filters and offsets
US10198792B2 (en) 2009-10-14 2019-02-05 Dolby Laboratories Licensing Corporation Method and devices for depth map processing
US8548065B2 (en) 2009-10-22 2013-10-01 The Chinese University Of Hong Kong Parametric interpolation filter for motion-compensated prediction
US9445129B2 (en) 2010-04-13 2016-09-13 Sun Patent Trust Image coding method and image decoding method
US20110299604A1 (en) 2010-06-04 2011-12-08 Apple Inc. Method and apparatus for adaptive video sharpening
US9154807B2 (en) 2010-06-25 2015-10-06 Qualcomm Incorporated Inclusion of switched interpolation filter coefficients in a compressed bit-stream
US9172972B2 (en) * 2011-01-05 2015-10-27 Qualcomm Incorporated Low complexity interpolation filtering with adaptive tap size
TW201301199A (zh) * 2011-02-11 2013-01-01 Vid Scale Inc 視訊及影像放大以邊為基礎之視訊內插
US8780971B1 (en) 2011-04-07 2014-07-15 Google, Inc. System and method of encoding using selectable loop filters
JP5552092B2 (ja) 2011-06-13 2014-07-16 日本電信電話株式会社 動画像符号化装置、動画像符号化方法及び動画像符号化プログラム
US9232233B2 (en) 2011-07-01 2016-01-05 Apple Inc. Adaptive configuration of reference frame buffer based on camera and background motion
US9432700B2 (en) 2011-09-27 2016-08-30 Broadcom Corporation Adaptive loop filtering in accordance with video coding
US9462298B2 (en) 2011-10-21 2016-10-04 Qualcomm Incorporated Loop filtering around slice boundaries or tile boundaries in video coding
US9596463B2 (en) 2012-02-22 2017-03-14 Qualcomm Incorporated Coding of loop filter parameters using a codebook in video coding
WO2013147495A1 (ko) 2012-03-26 2013-10-03 엘지전자 주식회사 스케일러블 비디오 인코딩/디코딩 방법 및 장치
WO2014003379A1 (ko) * 2012-06-24 2014-01-03 엘지전자 주식회사 영상 디코딩 방법 및 이를 이용하는 장치
US9344718B2 (en) 2012-08-08 2016-05-17 Qualcomm Incorporated Adaptive up-sampling filter for scalable video coding
US20140072048A1 (en) 2012-09-13 2014-03-13 Samsung Electronics Co., Ltd Method and apparatus for a switchable de-ringing filter for image/video coding
US9596465B2 (en) 2013-01-04 2017-03-14 Intel Corporation Refining filter for inter layer prediction of scalable video coding
US20140192862A1 (en) 2013-01-07 2014-07-10 Research In Motion Limited Methods and systems for prediction filtering in video coding
US20140254659A1 (en) 2013-03-11 2014-09-11 Mediatek Inc. Video coding method using at least evaluated visual quality and related video coding apparatus
EP2979447B1 (en) 2013-03-28 2018-01-03 Huawei Technologies Co., Ltd. Method for determining predictor blocks for a spatially scalable video codec
US20160105685A1 (en) 2014-10-08 2016-04-14 Qualcomm Incorporated Boundary filtering and cross-component prediction in video coding

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010110004A (ja) * 1999-06-04 2010-05-13 Trustees Of Columbia Univ In The City Of New York 空間的に変動する露出を用いて高ダイナミックレンジ画像化をする装置及び方法
JP2001057677A (ja) * 1999-06-10 2001-02-27 Fuji Photo Film Co Ltd 画像処理方法および装置並びに記録媒体
JP2003333604A (ja) * 2002-04-10 2003-11-21 Microsoft Corp ベクトル変換方法およびシステム
JP2004007337A (ja) * 2002-04-25 2004-01-08 Sony Corp 画像処理装置およびその方法
JP2006067213A (ja) * 2004-08-26 2006-03-09 Casio Comput Co Ltd 動きベクトル検出装置、および、プログラム
JP2008054267A (ja) * 2006-07-28 2008-03-06 Hitachi Ltd 画像処理装置、画像符号化装置及び画像復号化装置
JP2010507286A (ja) * 2006-10-13 2010-03-04 クゥアルコム・インコーポレイテッド 動き補償予測のための適応フィルタリングを備えたビデオ符号化
US20100284458A1 (en) * 2008-01-08 2010-11-11 Telefonaktiebolaget L M Ericsson (Publ) Adaptive filtering
JP2011527553A (ja) * 2008-07-07 2011-10-27 クゥアルコム・インコーポレイテッド フィルタ選択によるビデオ符号化
JP2015165726A (ja) * 2010-09-30 2015-09-17 サムスン エレクトロニクス カンパニー リミテッド 動き補償方法及び動き補償装置
JP2014504098A (ja) * 2010-12-21 2014-02-13 インテル・コーポレーション 高い効率の動画符号化のためのコンテンツアダプティブ動き補償フィルタリング

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
MAXIM SYCHEV, ET AL.: ""SHARPENING FILTER FOR INTERLAYER PREDICTION"", PROCEEDINGS OF 2014 IEEE VISUAL COMMUNICATIONS AND IMAGE PROCESSING CONFERENCE, JPN6019021516, 10 December 2014 (2014-12-10), pages 470 - 473, XP032741195, ISSN: 0004051313, DOI: 10.1109/VCIP.2014.7051608 *
SYCHEV MAXIM, ET AL.: ""Inter-layer prediction modes based on base layer sharpness filter"", DOCUMENT: JCTVC-N0070, vol. version 6, JPN6019021520, 26 July 2013 (2013-07-26), pages 1 - 7, ISSN: 0004051314 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2022526244A (ja) * 2019-03-12 2022-05-24 フラウンホーファー-ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン ハイブリッドビデオコード化のためのエンコーダ、デコーダ、方法、およびビデオビットストリーム、ならびにコンピュータプログラム
JP7358497B2 (ja) 2019-03-12 2023-10-10 フラウンホーファー-ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン ハイブリッドビデオコード化のためのエンコーダ、デコーダ、方法、およびビデオビットストリーム、ならびにコンピュータプログラム
US12010337B2 (en) 2019-03-12 2024-06-11 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Encoders, decoders, methods, and video bit streams, and computer programs for hybrid video coding

Also Published As

Publication number Publication date
WO2017052409A1 (en) 2017-03-30
WO2017052409A8 (en) 2017-10-26
CA2999826A1 (en) 2017-03-30
CN107925772B (zh) 2020-04-14
EP3354028B1 (en) 2021-09-15
RU2696311C1 (ru) 2019-08-01
AU2015410097B2 (en) 2020-01-23
BR112018006009A2 (pt) 2018-10-30
ZA201802228B (en) 2019-01-30
KR20180057676A (ko) 2018-05-30
KR102192778B1 (ko) 2020-12-18
US20180220148A1 (en) 2018-08-02
CA2999826C (en) 2020-10-13
MY187403A (en) 2021-09-22
EP3354028A1 (en) 2018-08-01
MX2018003768A (es) 2018-09-12
US10841605B2 (en) 2020-11-17
CN107925772A (zh) 2018-04-17
AU2015410097A1 (en) 2018-04-26
BR112018006009B1 (pt) 2023-12-12

Similar Documents

Publication Publication Date Title
US10841605B2 (en) Apparatus and method for video motion compensation with selectable interpolation filter
US10820008B2 (en) Apparatus and method for video motion compensation
US10834416B2 (en) Apparatus and method for video motion compensation
US10848784B2 (en) Apparatus and method for video motion compensation
JP6797247B2 (ja) ビデオ動き補償用の装置および方法

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20180502

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20180514

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20180502

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20180511

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20180511

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20181207

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20190611

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190911

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20200303

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20200601

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200803

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20201020