JP5204269B2 - ビデオ・コーデック量子化のための方法および装置 - Google Patents

ビデオ・コーデック量子化のための方法および装置 Download PDF

Info

Publication number
JP5204269B2
JP5204269B2 JP2011127460A JP2011127460A JP5204269B2 JP 5204269 B2 JP5204269 B2 JP 5204269B2 JP 2011127460 A JP2011127460 A JP 2011127460A JP 2011127460 A JP2011127460 A JP 2011127460A JP 5204269 B2 JP5204269 B2 JP 5204269B2
Authority
JP
Japan
Prior art keywords
quantization
distribution
level
coefficient
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2011127460A
Other languages
English (en)
Other versions
JP2011223607A (ja
Inventor
マイケル トウラピス,アレグザンドロス
マクドナルド ボイス,ジル
イン,ペング
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Thomson Licensing SAS
Original Assignee
Thomson Licensing SAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Thomson Licensing SAS filed Critical Thomson Licensing SAS
Publication of JP2011223607A publication Critical patent/JP2011223607A/ja
Application granted granted Critical
Publication of JP5204269B2 publication Critical patent/JP5204269B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/189Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
    • H04N19/192Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding the adaptation method, adaptation tool or adaptation type being iterative or recursive
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • H04N19/126Details of normalisation or weighting functions, e.g. normalisation matrices or variable uniform quantisers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/137Motion inside a coding unit, e.g. average field, frame or block difference
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/14Coding unit complexity, e.g. amount of activity or edge presence estimation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/147Data rate or code amount at the encoder output according to rate distortion criteria
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/154Measured or subjectively estimated visual quality after decoding, e.g. measurement of distortion
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • H04N19/159Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • H04N19/16Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter for a given display mode, e.g. for interlaced or progressive display mode
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/18Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a set of transform coefficients
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/186Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a colour or a chrominance component
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/189Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
    • H04N19/19Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding using optimisation based on Lagrange multipliers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding

Description

関連出願の相互参照
本出願は、2004年6月18日に出願された米国特許仮出願第60/581019号の利益を請求する。
本発明は一般にエンコーダおよびデコーダに関し、より詳細には、ビデオ・エンコーダおよびデコーダにおける量子化のための方法および装置に関する。
現在、MPEG‐2やJVT/H.264/MPEG AVCなど、ほとんどの画像およびビデオ符号化システムおよび規格は、圧縮を実施するために、変換ベースの技法と、それに続く量子化およびエントロピー符号化を使用する。図1に目を向けると、典型的な変換ベースの圧縮システムが参照番号100で一般的に示されている。変換ベースの圧縮システム100への入力は、変換器110の入力と信号通信で接続される。変換器110の出力は、量子化器120の入力と信号通信で接続される。量子化器120の出力は、エンコーダ130の入力と信号通信で接続される。エンコーダ130の出力は、デコーダ140の入力と信号通信で接続される。デコーダ140の出力は、逆量子化器150の入力と信号通信で接続される。逆量子化器150の出力は、逆変換器160の入力と信号通信で接続される。逆変換器160の出力は、システム100の外部利用可能な出力である。鍵となる考えは、離散コサイン変換(DCT)など、このような変換が画像信号を無相関化して、画像ブロックのエネルギーを少数のローパス係数にコンパクト化し、これらの係数は量子化および逆量子化の後でもかなり正確に信号を表すことができるということである。それでもなお、可能な最良の主観的および客観的品質を有するためには、この量子化/逆量子化プロセスを慎重に設計する必要がある。過去の多大な研究は、JPEGおよびMPEGのようなエンコーダで使用される8×8DCTを主に対象としており、量子化プロセスの設計、特に、使用すべき最適な量子化ステップ・サイズ、係数分布、およびデッドゾーニング機構に関しての設計に焦点を合わせてきた。最も重要な観察の1つは、係数分布が、ほとんどの場合に、量子化プロセスのより正確なモデル化および設計を可能にするラプラス分布に従うことであった。H.264を含めた多くの近年のコーデックおよびエンコーダの設計の内では、レート歪み(RD)性能を改善しようとして、この仮定に従っている。
しかし、ラプラス分布は多くの場合(H.264で符号化された何らかの素材を含めて)に当てはまるものの、H.264規格において新しいより小さい(4×4)変換が導入されたため、またこの規格が高精細度TVや同報通信やビデオ会議などを含めた幅広い応用例を考慮するため、このような分布が常に当てはまるわけではない場合もある。具体的にこのような応用例の1つはフィルム・グレイン・コンテンツの符号化であり、この場合、分布は、いくつかの係数についてはガウス分布または一般化ガウス分布を使用した方がよりよく近似することができる。このことは、ラプラス分布をよりよく適合させるのに使用される技法が、このようなコンテンツを符号化するには適切でない場合があり、特に高ビットレート(小さい量子化ステップ・サイズ)では主観的および客観的性能が劣る結果となることを示唆する。過去の研究のいくつかはまた、分布を様々とすることができること(ガウス、コーシー、一般化ガウスなど)も示唆しているが、これらは一般に、量子化プロセスの設計のための、いくぶん複雑なモデルをもたらす。
DCT AC係数の分布は多くの場合に以下のラプラス分布に従うことが、資料で十分に立証されている。
Figure 0005204269
この観察に基づいて、以前の研究では、ソースの実際の係数分布に適合することのできるラプラス分布と、この設計に基づく、重み付き量子化行列、および量子化中に使用されるデッドゾーンを推定しようとした。このようなパラメータを見つけるための最も単純な方法は、以下の標準偏差を使用することである。
Figure 0005204269
この推定は各AC係数について別々に行われ、また、同じプロセスがクロマAC係数にも独立して適用される。
前述のプロセスは、例えば最適な再構築値を選択するためまたは量子化行列を設計するための、量子化プロセスの適応設計を可能にする。このようなプロセスは例えば、以下のように、最小の平均二乗誤差もまた得られる量子化係数(Q)が最初に決定される場合に実施することができる。
Figure 0005204269
上記の値を容易に求めることができ、それにより最良の量子化値を決定してから、知覚的に重み付けされた係数のテーブルを経験的に決定することができることが、主張されている。次いで、最適MSEの各Qに知覚的重み付けを掛けてからそれらを集めて行列にすることによって、基礎行列の決定が実施され、この行列は最終的に、所与のビットレートに適切なようにスケーリングされ丸められる。
それでもなお他の研究は、分布がガウスまたは一般化ガウスに近い、すなわち以下の分布モデルに従うと主張して、ラプラス分布の主張に論駁しようとする。
Figure 0005204269
上式で、Γ(.)は、以下のガンマ関数を表す。
Figure 0005204269
また、νおよびσは正の実数である。n個の整数値についてのΓ(.)は⇒Γ(n)=(n−1)!になり、半整数の引数Γ(n/2)では以下のように別の特殊形を有することに留意されたい。
Figure 0005204269
上式で、n!!は二重階乗である。従って、n=1,3,5,...の場合に最初のいくつかの値は以下のとおりである。
Figure 0005204269
ν=1およびν=2の場合に、上記の一般化ガウスはそれぞれラプラスまたはガウスPDFになることに、すぐに気付く。所与の画像またはシーケンスの統計を適合させるために最尤法を使用して、νおよびσのパラメータを提供し、次いでこれらをラプラスの場合と同様の方式で使用して、最適な量子化値を決定する。
H.264規格は、最近まで、量子化プロセス中にこのようなプロパティの恩恵を受けるためのどんな機構も提供しなかった。より具体的には、この規格は、エンコーダがどのように量子化中に丸めを実施すべきかを指定せず、一様な量子化を使用してデコーダ再構築レベルがどのように計算されるかを指定するだけである。一方、H.264参照ソフトウェアは、どの固定丸めが使用されるか(イントラ符号化なら1/3、インター符号化なら1/6)に基づいてDCとACの両方の係数がラプラス分布を満たすと仮定した。残念ながら、係数がラプラス分布にならないことが頻繁にあり、その結果、特にビットレートおよび解像度がより高い場合には、多くのH.264エンコーダ実装形態において主観的および客観的性能が非常に劣る。これは一部には、この規格が4×4変換だけしか考慮しておらず、従って係数を無相関化する効率がより低かったからであり、また、等しいステップの量子化器およびいくぶん強引なデッドゾーニング・プロセスにより、高ビットレートであってもAC係数のほとんどを捨てる傾向があるからである。このために、この規格において8×8変換が再導入され、また、量子化プロセスのより細かい調整を可能にする量子化行列も採用された。量子化行列プロセスよりも複雑さの低い、再構築された係数値の修正を可能にする代替方法も提案された。この手法に基づくと、以下の形式の式
Figure 0005204269
(Zは最終的な量子化レベルであり、Δは量子化ステップ・サイズであり、fは量子化プロセスのための丸め項として働く)を使用してWに等しい係数の量子化および逆量子化を実施する(図2Aおよび2B参照)代わりに、以下の形式の式を使用して量子化が実施される。
Figure 0005204269
この場合、Θは、最終的な再構築値のオフセッティングを可能にする追加のパラメータである(図3参照)。これは、係数が0に設定されて、その結果として主観的性能さらには客観的性能さえもが場合により低下する確率を、効果的に低減する。図2Aに目を向けると、ステップ・サイズΔおよびf=Δ/2の一様量子化器での、入力信号Wと逆量子化済み出力信号W’との関係が、参照番号200で一般的に示されている。図2Bに目を向けると、ステップ・サイズΔおよびf=Δ/4の一様量子化器での、入力信号Wと逆量子化済み出力信号W’との関係が、参照番号250で一般的に示されている。図3に目を向けると、量子化プロセス内におけるΘ=Δ/4の影響が、参照番号300で一般的に示されている。
ビデオ・エンコーダおよびデコーダにおける量子化のための方法および装置を対象とする本発明によって、従来技術のこれらや他の欠点および不利益に対処する。
本発明の一実施形態によれば、画像ブロックについてのビデオ信号データを符号化するためのエンコーダが提供される。このエンコーダは、画像ブロックについての変換係数を受け取って、変換係数の係数位置および係数分布に基づいて適応的にデッドゾーン量子化を実施するための量子化器を備える。
本発明の別の実施形態によれば、画像ブロックについてのビデオ信号データを符号化する方法が提供される。この方法は、画像ブロックについての変換係数を受け取るステップと、変換係数の係数位置および係数分布に基づいてデッドゾーン量子化を適応的に実施するステップとを含む。
本発明の別の実施形態によれば、画像ブロックについてのビデオ信号データを復号するためのデコーダが提供される。このデコーダは、画像ブロックについての変換係数を受け取って、変換係数の係数位置および係数分布に基づいてデッドゾーン量子化を適応的に実施するための量子化器を備える。
本発明の別の実施形態によれば、画像ブロックについてのビデオ信号データを復号する方法が提供される。この方法は、画像ブロックについての変換係数を受け取るステップと、変換係数の係数位置および係数分布に基づいてデッドゾーン量子化を適応的に実施するステップとを含む。
本発明のこれらや他の実施形態、特徴、および利点は、添付の図面と共に読むべき後続の例示的な実施形態の詳細な記述から明らかになるであろう。
本発明は、例示的な図によって、よりよく理解することができる。
従来技術による典型的な変換ベースの圧縮システムのブロック図である。 ステップ・サイズΔならびにそれぞれf=Δ/2およびf=Δ/4の一様量子化器での、入力信号Wと逆量子化済み出力信号W’との関係のプロットである。 ステップ・サイズΔならびにそれぞれf=Δ/2およびf=Δ/4の一様量子化器での、入力信号Wと逆量子化済み出力信号W’との関係のプロットである。 量子化プロセス内におけるΘ=Δ/4の影響のプロットである。 高テクスチャSDシーケンスのイントラ符号化ブロックについての変換係数の分布に関するプロットである。 レベル1(QP30)の周りの分布に関するプロットである。 図5の分布のレベル1(QP30)の周りの誤差寄与に関するプロットである。 レベル1(QP24)の周りの分布に関するプロットである。 図7の分布のレベル1(QP24)の周りの誤差寄与に関するプロットである。 高テクスチャSDシーケンスのインター符号化ブロックについての変換係数の分布に関するプロットである。 インター・レベル1(QP24)の周りの分布に関するプロットである。 図10の分布のレベル1(QP24)の周りの誤差寄与に関するプロットである。 低テクスチャQCIF解像度シーケンス内のイントラ符号化ブロックについての変換係数の分布に関するプロットである。 イントラ・レベル1(QP24)の周りの分布に関するプロットである。 図13の分布のレベル1(QP24)の周りの誤差寄与に関するプロットである。 低テクスチャQCIF解像度シーケンス内のインター符号化ブロックについての変換係数の分布に関するプロットである。 インター・レベル1(QP24)の周りの分布のプロットである。 図16Aの分布のレベル1(QP24)の周りの誤差寄与を示す図である。 直角台形を使用したfの計算に関する図である。 メジアン選択(エリア等化)によるΘの選択に関するプロットである。 直角台形を使用したΘの計算に関する図である。 ピクチャ・レベルでの変換統計に基づく量子化の方法に関するフローである。 ピクチャ・レベルでの変換統計に基づく量子化の方法に関するフローである。 最適化された量子化のために変換係数を考慮することを伴うエンコーダに関するブロック図である。 最適化された量子化のためにシータ・パラメータおよび変換係数を考慮することを伴うエンコーダに関するブロック図である。 デコーダに関するブロック図である。
本発明は、ビデオ・エンコーダおよびデコーダにおける量子化のための方法および装置を対象とする。
変換ベースの画像およびビデオ符号化ではAC係数がそれらの分布において0の周りではっきりした集中を有する傾向があることを考慮して、良好なレート歪み性能を達成する試みとしてデッドゾーン量子化が使用される。デッドゾーン量子化方法の設計は通常、係数がラプラスまたはガウス(正規)分布に従うと仮定して実施される。残念ながら、ほとんどの場合、区分的分布(対応する各量子化区間に関して)は考慮されず、その結果として性能が低下する可能性がある。さらに、設計は主に客観的測定値に基づき、これはさらに、視覚的アーチファクト、および主観的品質のかなりの低下につながる可能性がある。本発明の原理によれば、デッドゾーン・パラメータを画像特性、量子化ステップ・サイズ、および再構築レベルに応じて適応的に選択することを通して、主観的品質の改善、また多くの場合に客観的品質の改善をも可能にすることのできるいくつかの方法が提供される。これらの方法のいくつかはエンコーダ内での考慮のみを必要とするが、その他の方策はデコーダ設計にも影響し、符号化済みビットストリーム内に追加の情報が存在する必要がある。
本記述には、本発明の原理を示す。従って、本明細書に明示的に記述または図示されていなくても、当業者なら、本発明の原理を組み入れておりその趣旨および範囲に含まれる様々な構成を考案できることになることは理解されるであろう。
本明細書に挙げるすべての例および要件的な用語は、本発明の原理と、当技術を推進するために本発明者によって寄与される概念とを読者が理解するのを助けるための教授目的に向けられており、また、これらの例および条件言語は、このような具体的に挙げる例および条件に限定されないものと解釈されるべきである。
さらに、本明細書における、本発明の原理、実施形態、実施例、ならびにその具体例を挙げるすべての言明は、その構造上と機能上の両方の均等物を包含するものとする。加えて、このような均等物は、現在知られている均等物と将来開発される均等物の両方、すなわち構造にかかわらず同じ機能を実施する任意の開発された要素を含むものとする。
従って例えば、本明細書に提示するブロック図が、本発明の原理を組み入れた例示的な回路の概念図を表すことは、当業者には理解されるであろう。同様に、どんなフローチャート、流れ図、状態遷移図、擬似コードなども、コンピュータ可読媒体中でほぼ表すことができコンピュータまたはプロセッサによって(そうしたコンピュータまたはプロセッサが明示的に示されていなくても)そのように実行することのできる様々なプロセスを表すことは理解されるであろう。
図に示す様々な要素の機能は、専用ハードウェアを使用して、ならびに適切なソフトウェアと共にソフトウェアを実行することのできるハードウェアを使用して、提供することができる。プロセッサによって提供されるときは、これらの機能は単一の専用プロセッサ、単一の共有プロセッサ、または複数の個別プロセッサ(そのいくつかは共有されてよい)によって提供される。さらに、用語「プロセッサ」または「コントローラ」の明示的な使用は、ソフトウェアを実行することのできるハードウェアのみを指すものと解釈すべきではなく、限定ではないがディジタル信号プロセッサ(「DSP」)ハードウェア、ソフトウェア記録用の読取り専用メモリ(「ROM」)、ランダム・アクセス・メモリ(「RAM」)、および不揮発性記憶装置を暗黙的に含むことがある。
従来型および/または特注の、その他のハードウェアを含めることもできる。同様に、図に示すどんなスイッチも概念的なものに過ぎない。これらの機能は、プログラム・ロジックの操作を通して、専用ロジックを通して、プログラム制御と専用ロジックの対話を通して、あるいは手動でも実施することができ、特定の技法は、コンテキストからより具体的に理解されるように、実施者によって選択可能である。
本明細書の特許請求の範囲では、指定された機能を実施するための手段として表現されるどんな要素も、その機能を実施するための任意の方式を包含するものとし、例えば、a)その機能を実施する回路要素の組合せ、またはb)任意の形式のソフトウェア(従ってそのソフトウェアを実行してその機能を実施するための適切な回路と組み合わせられたファームウェアやマイクロコードなどを含む)がこれに含まれる。このような特許請求の範囲によって定義される本発明は、列挙される様々な手段によって提供される機能が、特許請求の範囲の要求する方式で組み合わせられ集められるということに存する。従って、これらの機能を提供することのできるどんな手段も、本明細書に示すものと等価であるとみなされる。
本発明の原理により、デッドゾーンや、レベルごとの量子化領域や、量子化重み付け行列など、変換ベースの画像またはビデオ・エンコーダ内で使用することのできる量子化パラメータを、自動計算するための装置および方法の様々な実施形態を述べる。また、デコーダに送信することができ、量子化プロセス内で追加のフレキシビリティを提供して主観的および/または客観的品質を改善することができる、新しい量子化オフセッティング行列のセットも開示する。
この主題に関するほとんどの研究では、変換ベースのコーデックにおけるAC係数分布はラプラスである傾向があることが主張されている。H.264コーデック内でもこの仮定に従うが、これは量子化プロセスの設計に特に影響する傾向がある。特に、係数WについてのH.264参照ソフトウェア内でのデッドゾーニング・プロセスは、以下のように固定の丸め係数fを考慮して実施される。
Figure 0005204269
上式で、Zはマッピングされる量子化レベルであり、Δは量子化ステップ・サイズである。fを減少させると、再構築値0の周りのデッドゾーン・エリアは本質的に増大し、また他のすべてのレベルでは、量子化領域はfに従って等しくシフトされる。このプロセスは、図2Aおよび図2Bでよりよくわかる。このようなラプラス分布を近似する試みとして、fは、イントラ・スライスではΔ/3に等しく選択され、インター・スライスではΔ/6に等しく選択された。図2Aおよび2Bに目を向けると、ステップ・サイズがΔでありそれぞれf=Δ/2およびf=Δ/4である一様量子化器での、入力信号Wと逆量子化(再構築)された出力信号W’との関係が、参照番号200および250でそれぞれ一般的に示されている。
しかし、この主張は常に当てはまるわけではなくコンテンツおよび係数に大きく依存することを観察することができる(例えば図4〜16B参照)。図4には、高テクスチャSDシーケンスについてのイントラ変換(4×4)係数分布が、参照番号400で一般的に示されている。図5には、このシーケンスについてのレベル1(QP30)の周りのイントラ係数分布が、参照番号500で一般的に示されている。図6に、レベル1の周りの上記の係数分布の誤差寄与を示すが、これは参照番号600で一般的に示されている。しかし、図7に、このシーケンスでより小さい量子化器(QP24)を使用したレベル1の周りのイントラ係数分布を示すが、このイントラ係数分布は参照番号700で一般的に示されている。図6と同様、図8に、レベル1の周りの上記の係数分布の誤差寄与を示すが、これは参照番号800で一般的に示されている。図9には、この高テクスチャSDシーケンスについてのインター変換(4×4)係数分布が、参照番号900で一般的に示されている。この分布について、図10にレベル1(QP24)の周りの分布を示すが、これは参照番号1000で一般的に示されている。図11に移ると、レベル1の周りの上記の係数分布の誤差寄与が、参照番号1100で一般的に示されている。比較として、次に図12に移ると、低テクスチャQCIFシーケンスについてのイントラ変換(4×4)係数分布が、参照番号1200で一般的に示されている。図13には、このシーケンスについてのレベル1(QP24)の周りのイントラ係数分布が、参照番号1300で一般的に示されている。図14に、レベル1の周りの上記の係数分布の誤差寄与を示すが、これは参照番号1400で一般的に示されている。図15には、この低テクスチャQCIFシーケンスについてのインター変換(4×4)係数分布が、参照番号1500で一般的に示されている。この分布について、図16Aにレベル1(QP24)の周りの分布を示すが、これは参照番号1600で一般的に示されている。図16Bに移ると、レベル1の周りの上記の係数分布の誤差寄与が、参照番号1650で一般的に示されている。これらの図では、各変換係数ごとの適切なスケーリングも考慮されたことに留意されたい。図12〜16Bに示したQCIFシーケンスなど、解像度およびディテールの低いコンテンツの場合、係数の分布はラプラスに近いかもしれないが、ある係数から別の係数までに大きな差があることを観察することができる。ラプラス分布を仮定すると、より高次の係数は、より低次の係数よりも速く減衰する傾向がある(より小さい減衰率λ、またはより大きい分散)。このことは直ちに、複数の周波数にまたがって同様の分布モデルを仮定するのではなく、係数をそれらの次数に従って異なる仕方で扱う必要があることを示唆する。これは、高解像度のコンテンツ、特に、ノイズ(例えばフィルム・グレイン・ノイズ)を含む可能性もあるフィルムまたは高テクスチャ・コンテンツではより一層明白になり、係数分布に大きく影響する可能性がある(図4〜11)。このようなノイズは、サンプル間の低度から中度の分散としてそれ自体を表す傾向があり、この分散自体が、分布をガウスにより近い状態にする。明らかに、固定の丸めパラメータfをH.264参照ソフトウェアによって使用されるように使用した場合、このようなパラメータが周波数に従って修正されるとしても、この種の分布は正しく考慮されず、その結果、量子化プロセスは最適でなくなる。特に低度から中度の量子化パラメータ(非常に高度から中度のビットレートに対応する)では、ある量子化レベル内およびその付近(ならびに特にレベル1の周り)の区分的分布は、場合により一様になるかまたは一様に近くなる可能性があることが、実際に観察される(図5、7、10、13)。これらの条件の下では、fの選択はかなりクリティカルになり得る。というのは、デッドゾーンが不適切に大きいと必要以上の係数が0に量子化される可能性があり、これは、客観的品質の低下、およびより大きな主観的品質の低下につながる可能性があるからである。
この問題は、H.264の場合、ベースライン、メイン、拡張プロファイルが整数4×4変換の使用だけしか許容しないことを考えると、よりクリティカルである傾向がある。4×4変換は、ブロッキングおよびリンギング・アーチファクトの低減やビット・イグザクト(bit exact)実装など、いくつかの非常に優れたプロパティを有する傾向があるものの、8×8変換よりも低い無相関化プロパティを有し、また量子化決定の影響をより受けやすい。特に、量子化器値(QP)26を使用して以下のブロックの量子化を実施したいと仮定する(fはΔ/2に等しいと考える)。
Figure 0005204269
この場合、量子化プロセスは以下の結果となる。
Figure 0005204269
元のブロックは高い垂直アクティビティおよび低い水平アクティビティによって記述され、QPはそれほど高くないが、再構築されたブロック中のすべての水平アクティビティは失われることに、すぐに気付く。この特定のブロックの平均二乗誤差(MSE)は比較的低い(7.625)が、このプロセスの主観的影響は、このブロックの知覚的特性が激しく改変されたことを考えると、いくぶん重い可能性がある。より具体的には、再構築後のブロックは、元のブロックと比較していくぶん構造化される傾向があり、従って、見る者にとってより目立ち不快となることが観察される。
上記は、量子化プロセスの直接的な結果であり、特に、係数をレベル1ではなくレベル0に割り当てた結果である。水平または垂直のすべての係数が0に設定された場合は、得られる結果は上記のようになる。しかしこのような結果は、影響を受ける次元におけるいくつかの係数(少なくとも1つ)を、強いて選択的にレベル0ではなく1にすることによって、回避することができる。このようなプロセスは様々な方式で実施することができる。まず初めに、このようなプロセスが必要か否かを判定する必要がある。特に、このような特性は、列方向または行方向の分散(すなわちブロック中のすべての行または列についての分散の合計)が比較的小さい場合に生じる傾向がある。このような値は、以下のように計算することができる。
Figure 0005204269
上式で、xi,jは、それぞれ行および列iおよびjのピクセル値に対応する。T<column_sVar<T、またはT<row_sVar<Tが満たされる場合は、このような特性を考慮するように量子化プロセスを改変することができる。さらに、マクロブロックまたはブロック全体の分散は、以下のように考慮することができる。
Figure 0005204269
上式で、BおよびBは、それぞれブロックの高さおよび幅である。より具体的には、blockVarが異なる値領域に対応する場合、または値T、T、T、Tを相応に適応させることができる場合(例えばblockVarに応じたテーブル・ルックアップを使用して)は、異なる処理を適用することができる。画像全体についてのAC係数の分布統計だけを収集するのではなく、種々の特性を有する領域についての分布も追加で収集することができ、より正確で精緻化された量子化プロセス適応を可能にすることが、実際には推奨される。
4×4変換内で(必要に応じて)人為的に水平または/および垂直分散を導入するための、いくぶん単純な方法は、位置(1,0)または/および(0,1)におけるAC係数がレベル1に設定される確率を強制するかまたは増加させることである。これは、元のf値を使用してこれらの係数が元々0であったことがわかった場合にのみこれらの係数の値fを増加させることによって行うことができる。例えば、上記の特性が満たされる場合(垂直または水平分散)であって、可能なら(1,0)係数を維持することが望まれると仮定した場合、以下のプロセスを実施することができる。
係数W1,0の準備レベル
Figure 0005204269
を以下のように計算する。
Figure 0005204269
上式で、fは準備丸めパラメータである。
Figure 0005204269
であって上記の条件が満たされる場合は、最終レベルZ1,0は以下のように計算される。
Figure 0005204269
上式で、f(f>f)は、この係数がレベル1でマッピングされる優先度を高めるようにして選択される。
この実施形態は、いくつかの場合では主観的品質を改善することができるが、他の場合では主観的品質を損なうことがあり、また客観的品質に対する影響を全く考慮しない。別の手法は、最初にすべての係数について準備量子化を実施することである。これは基本的に、以下のような変換行列wおよび準備量子化行列
Figure 0005204269
をもたらすことになる。
Figure 0005204269
j>0であるすべての列で、
Figure 0005204269
が0の場合、または/およびi>0ですべての
Figure 0005204269
が0の場合は、これらの
Figure 0005204269
の間で、提供されるコストの点から見てレベル1に設定するのが最もよい係数が見つかる。これは、最小化問題であり、以下のように関数Jの最小値(レート歪み最適化技法に類似する)を見つける必要がある。
Figure 0005204269
Distortioni,jは、以下のような種々の歪みメトリックスを使用して設定することができる。
Figure 0005204269
Costi,jは、1つの係数を修正するための実際のビットレート・コストを表すことができ、さらには、走査順で最後の非0の係数からの距離に等しいものとすることもでき、以下の行列形式で記述することができる。
Figure 0005204269
水平と垂直の両方の係数を変更する必要がある場合(すなわちDCを除いたすべての係数が0に量子化された場合)は、他方の次元が0である水平または垂直の係数(すなわち0,jまたはi,0における係数)を改変することからの合同コストを考慮する必要があり、一方、iとjが両方とも0よりも大きい位置(i,j)における単一の係数を修正することは、両方の次元に直接に影響を有することになり、単一のコストを使用することができることに留意されたい。
4×4よりも大きい変換(すなわち8×8)でも、同様の手法に従うことができる。例えば8×8変換の場合、単一の水平または垂直係数だけでなく、これらのうちの2つを維持することが望ましいことがある。というのは、そうすることによって元のテクスチャをより現実的に再構築/表現することができるからである。このような場合、2つ(またはそれ以上)の係数の選択は、やはり合同で(すべての可能な組合せを調べることによって)実施する必要があり、あるいは単純にするために、最初に各係数を別々に最適化することを試みることもでき、各ステップで、前の係数修正をコスト・プロセス内で考慮する。必要なら、4×4の場合に、より多くの係数を同様にして維持することもできる。より具体的には、このプロセスは以下のように実施することができる。
変換行列Wおよび準備量子化行列
Figure 0005204269
は、この場合もやはり以下のように計算される。
Figure 0005204269
Figure 0005204269
に基づいて、単一の係数をレベル0からレベル1に変更するためのコスト行列が計算される。
Figure 0005204269
次いで、最小のRDベースのコストを有する係数、すなわち
Figure 0005204269
が修正される。この結果、以下の新しい行列Z’がもたらされる。
Figure 0005204269
修正すべき第2の係数もやはり、Ji,j=Distortioni,j+λ*Costi,jなどの基準を使用して選択され、この場合、Costi,jは新しいレベル行列Z’に基づいて計算される。このプロセスを、維持する必要のある追加の係数の数に応じて必要なだけ繰り返すことができる。
上記の方法を使用して、いくつかの場合に主観的品質をいくらか改善することができるが、代替方法を利用することもできる。この代替方法は、係数分布に基づいてfをよりよく選択し、生成される歪みを最小限に抑えることによって、主観的と客観的の両方の品質を改善することができる。前と同様、係数W1,0の準備レベル
Figure 0005204269
は、やはり以下のように計算される。
Figure 0005204269
上式で、fは準備丸めパラメータである。
Figure 0005204269
=0であって上記の条件が満たされる場合は、最終レベルZ1,0は以下のように計算される。
Figure 0005204269
上式で、f(f>f)は、この係数がレベル1でマッピングされる優先度を高めるようにして選択される。この場合、fは、係数の分布を調べることによって計算することができる。このような分布は、現在データの事前分析を実施することによって収集することができ、あるいは、現在分布が同タイプの符号化済みブロック(現在または前のピクチャ)の分布と同様のプロパティを有することになると仮定することによって収集することができる。準備レベルが
Figure 0005204269
であると仮定すると、このレベルの周りの分布エリアを計算することができる。これは、分布の正確な統計を考慮することによって、あるいはモデルベースの方法を使用することによって(例えばラプラスまたはガウス分布モデルの使用)行うことができる。所与の分布領域について最適な量子化点を決定するための通常の方法では、分布のほぼ中央点(すなわち分布を2つの等サイズのエリア
Figure 0005204269
に分割する点)として選択することができる。この中央点は、区分的分布がほぼ区分的線形であると仮定することによる近似であることに留意されたい。より正確な方策は、ロイド・マックス(Lloyd Max)法を使用して、誤差を最小限にする点を見つけることである。区分的線形分布を作ることにより、以下のように直角台形(すなわち2つの直角を有する台形)からのプロパティを使用して(図17に見ることができる)fを計算することができる。
Figure 0005204269
図17に目を向けると、直角台形を使用したfの計算が、参照番号1700で一般的に示されている。
また、以下の式もある。
Figure 0005204269
fと平方根内の値は両方とも正である必要があることに留意されたい。
わずかにより複雑ではあるが、シンプソン法や3/8法など、その他の算術積分法を台形法の代わりに使用することもできる。しかし、正確さは劣るがより単純な方策の1つは、最初にx=x=Δに設定することによって、まずエリア
Figure 0005204269
および
Figure 0005204269
を、
Figure 0005204269
および
Figure 0005204269
からそれぞれ計算することである。次いで
Figure 0005204269
が選択されるが、これは最適ではないものの十分によい解である。x=2×fであり、x=2×(1−f)であることに留意されたい。この方法は、係数を主観的に最適化する前述の方法と組み合わせてもよいが、ただしその場合は、そのプロセスにおける
Figure 0005204269
は、新しいf値に基づいて計算される。
しかし、上記の方法は、量子化された各値によって被る歪みを慎重に考慮しない。エリア計算は、被る歪みをほぼ等しく仮定して行われる。この代わりに、より適切な方法は、このような計算の内で実際の歪みを考慮することであろう。すなわち、エリア
Figure 0005204269
および
Figure 0005204269
は、以下のように、よりよく計算されるはずである。
Figure 0005204269
上式で、
Figure 0005204269
は、再構築された値
Figure 0005204269
とxとの間の歪みメトリックとすることができ、平方誤差すなわち
Figure 0005204269
や、絶対誤差すなわち
Figure 0005204269
などとすることができる。frequency(x)は、xに等しい値の係数の数に対応する。この場合もやはり、我々の目標は、
Figure 0005204269
を作ることである。このようなプロパティを達成するための単純な方法は、最初に
Figure 0005204269
を使用して
Figure 0005204269
および
Figure 0005204269
を計算し、fをゆっくりと減少させることによって、このような条件または
Figure 0005204269
の形式の条件が満たされる最初の位置を見つけることであろう。このプロセスを実施するための単純なアルゴリズムは、以下のとおりとすることができる。
ステップ1:
Figure 0005204269
に設定する。
Figure 0005204269
および
Figure 0005204269
を計算する。
ステップ2:
Figure 0005204269
の場合はプロセスを終了する。
ステップ3:f=f−1に設定する。f=0の場合は、f=1に設定してプロセスを終了する。
ステップ4:
Figure 0005204269
および
Figure 0005204269
に設定する。ステップ2に行く。
上記の方法は性能(客観的または主観的、あるいは両方)を改善することができるが、より高いレベルを人為的に導入するこの方法は、元の信号と正確に合致しないことにもなるので、常に望ましいとは限らない。このために、従来技術では、ある間隔で(すなわちスライスごとに)ビットストリーム内で送信でき、すべての係数の再構築値の平行移動(シフト)を基本的に導入する、Θパラメータが導入された(図3参照)。図3に目を向けると、量子化プロセス内でのΘ=Δ/4の影響が、参照番号300で一般的に示されている。図3に関して、f=Δ/4と仮定する。これは、いくつかの係数が0レベルから1レベルに選択的に調節される本発明と似ている。しかし、従来技術では、デコーダがこのような調節を自覚して係数をより正確に再構築できるように、コーデック規格に対する変更が必要とされるが、これは本発明では不要なので、本発明とは異なる。従来技術で提案された方法は、AC係数が(DC係数を含めて)いくぶん異なる分布を有する傾向があることを考慮しない。そうではなく、よりよい手法は、ビットストリームと共に送信される行列Θを設計することであろう。これにより、異なる係数ごとにより細かい精緻化が可能になる。この手法は、従来技術によりH.264およびその他のコーデック内で量子化行列が考慮されるのによく似ている。H.264 FRExt仕様では、現在、12個の異なる量子化重み行列が許容されており、これらは基本的に、変換サイズ(4×4対8×8)、色成分(Y、U、V)、および予測タイプ(イントラ対インター)によって分けられる。というのは、これらは、いくぶん異なる分布特性を含むことのできる基本構成要素だからである。同様に、ここでは12個の異なる量子化オフセッティング行列を定義することができ、これらは、スケーリングの代わりに再構築レベルをシフトする。マクロブロック適応フレーム‐フィールド符号化だけに利用可能である必要があり、フィールドとフレームのマクロブロックを区別することになる、追加の行列を加えることが望ましい場合もある。しかし、すべての再構築値をシフトすることができるものの、最も重要な再構築値はレベル1に関連するものであることが観察される。このことは、RD性能の点では、再構築されるレベルがレベル1である場合はΘパラメータだけを考慮する方がよいことを示唆する。特に、従来技術では、再構築値
Figure 0005204269
は以下のように計算できることが言及された。
Figure 0005204269
上式で、Vijパラメータは、逆変換プロセスから生じ、量子化器値QPに関係する。我々の場合では、
Figure 0005204269
はここで、以下のようにΘが今や係数位置に依存することも考慮して計算することができる。
Figure 0005204269
別の代替方法は、以下のようにΘをレベルに応じて修正することであろう。
Figure 0005204269
例えば、g(Θij,Zij)=Θij>>(Zij−1)を使用することができる。
Θを計算するために、fの計算の場合と同様の手法を使用することができる。ここでの考えは、分布の点から見た中央値に対応する量子化区間Δ内の位置を見つけることであり、あるいは基本的には、Δを2つの等しいエリア領域に分割することにつながる(図18参照)。図18に目を向けると、メジアン選択(エリア等化)によるΘの選択に関するプロットが、参照番号1800で一般的に示されている。これは手動で行うこともでき(すなわち全エリアを計算し、次いでエリアを半分に分割する点を見つける)、あるいはモデル分布を考慮して積分計算を実施することによって行うこともでき、あるいは単純な算術方法を考慮することによって行うこともできる。特に、図18から、我々の区分的分布は、図19からわかるようにやはり直角台形に類似することが、この場合にも観察される。図19に目を向けると、直角台形を使用したΘの計算に関する図が、参照番号1900で一般的に示されている。この場合、全エリアは以下のように計算することができる。
Figure 0005204269
点x=Δ/2+Θは、エリアが2つの等しいエリア領域A/2に分割されるような点として見つかることになる。すなわち
Figure 0005204269
である。
しかし、hは、相似三角形プロパティにより、以下の式にも等しい。
Figure 0005204269
従って、上式のhを置き換えると、以下の結果になる。⇒
Figure 0005204269
負の符号はほとんど意味をなさないので、次いで以下の式になる。
Figure 0005204269
Aも置き換えると、以下の式が得られる。
Figure 0005204269
Θはまた、fの計算で行われたのと同様に、実際の歪みおよび係数頻度を考慮することによって計算することもできる。ただしこの場合は、fを変化させる代わりに、第1の再構築値を変化させる必要がある。すなわち、意図するところは、
Figure 0005204269
のような再構築値
Figure 0005204269
を見つけることである。これもやはり、fの場合と同様の方策を使用して、以下のように行うことができる。
ステップ1:
Figure 0005204269
、Θ=0に設定する。
ステップ2:
Figure 0005204269
および
Figure 0005204269
を計算する。
ステップ3:
Figure 0005204269
の場合はプロセスを終了する。
ステップ3:Θ=Θ+1に設定する。
Figure 0005204269
の場合はプロセスを終了する。
ステップ4:ステップ2に行く。
性能およびΘ値の計算をさらに改善するために、0に設定される係数の数を考慮してもよい。具体的には、特定のAC係数、すなわち強制的に0にされる位置(i,j)のAC係数のパーセンテージを制限することが望ましい場合がある。パーセンテージは、マクロブロックのセット、スライス、ピクチャ、GOPのレベルで、あるいはシーケンス・レベルでも計算することができる。このような決定は、事前定義済みのパーセンテージ値をエンコーダにおいて提供することによって暗黙的に行うこともでき、あるいは、値が0に設定される場合には分散や歪みなど、シーケンスに関するある種の統計を考慮することによって、自動的に行うこともできる。現在の分布モデルを使用するとこのパーセンテージをかなり超過することを分布が示唆する場合は、Θの値をさらに増加させて品質を改善するのが最良であろう。このプロパティを考慮する単純な方法は、0レベルについてこのパーセンテージ関係を満たす係数値を見つけ、上記のΘ計算で使用されるΔ値を相応に増加させることである。例えば、0が位置y(y<Δ/2)でパーセンテージX%を満たすと仮定すると、
Figure 0005204269
に等しい新しいΔ’を使用して、以下のようにΘが計算される。
Figure 0005204269
Θはまた、必要なら、a≦Θ<bなどのように制約することもできる(例えば、aは0に設定することができ、b=Δ/2に設定することができる)。直角台形エリア計算を使用してまた、fを計算するのに必要な
Figure 0005204269
および
Figure 0005204269
のエリアの近似を、これらのエリア内の分布の完全な積分を実施する必要なしに実施することもできることに留意されたい。一般に、台形近似は、これらのエリアを計算するためにどんな間隔でも使用することができる。
最後に、分布はまた、量子化重み付け行列の計算に使用することもできる。重み係数が知覚的分析に基づいてすでにわかっていると仮定すると、重み付け係数はまた、すべての係数について分布を等化しようとすることによってスケーリングすることができる。これは、次のことを考慮することによって実施することができる。すなわち、(a)各係数の最大値、および、所与の値と比較した(例えばDCと比較した)その比率の計算、(b)0から開始する分布の指定パーセンテージ(例えば95%)内の各係数の利用可能な最大値、(c)0から開始する分布の別個の指定パーセンテージPi,j内の各係数の利用可能な最大値である。
すべての係数の分布を考慮することもできるが、通常は、主観的品質の点から見てどの領域がより重要であると考えられるか(通常は低分散特性を有する領域)を決定して、それらの領域だけをこのような計算に使用する方がよい。しかし、このようにすると残りの領域についての性能を損なう可能性もあり、従って代替方法は、画像全体と各領域とについて別々にこれらの計算を実施してからこれらの結果を結合して(すなわち、各領域の重要度、つまり主観的影響や出現数などに基づく、重み付き平均法)、最終的な重み付け行列を計算することであろう。
図20に移ると、ピクチャ・レベルでの変換統計に基づく量子化の方法が、参照番号2000で一般的に示されている。方法2000は、画像データの符号化に関して実施される。
開始ブロック2005は、制御を機能ブロック2010に渡す。機能ブロック2010は、分布配列を初期化し、制御をループ境界ブロック2015に渡す。ループ境界ブロック2015は、ピクチャ符号化ループを開始し、制御を機能ブロック2020に渡す。機能ブロック2020は、符号化の準備として、ピクチャ・レベル量子化パラメータの決定や、ピクチャ決定の実施などを行い、制御をループ境界ブロック2025に渡す。ループ境界ブロック2025は、マクロブロック符号化ループを開始し、制御を機能ブロック2030に渡す。機能ブロック2030は、処理中の現在マクロブロックの量子化パラメータを決定/選択し、制御をループ境界ブロック2035に渡す。ループ境界ブロック2035は、予測モード・ループを開始し、制御を機能ブロック2040に渡す。機能ブロック2040は、現在マクロブロックについてイントラまたはインター予測を実施し、制御をループ境界ブロック2045に渡す。ループ境界ブロック2045は、すべての4×4ブロック(処理中の現在マクロブロック中の)について変換ループを開始し、制御を機能ブロック2050に渡す。機能ブロック2050は、処理中の現在4×4ブロックの変換を実施し、制御を機能ブロック2055に渡す。機能ブロック2055は、1/2のオフセットを使用して現在4×4ブロックを量子化して、あらゆる変換係数についてleveli,jを取得し、制御を機能ブロック2060に渡す。機能ブロック2060は、分布配列をチェックして、leveli,j量子化パラメータおよびi,jに基づいて最適なオフセットfi,jを決定し、制御を機能ブロック2065に渡す。機能ブロック2065は、fi,jを新しいオフセットとして使用して位置i,jにおける係数を再量子化し、制御をループ境界ブロック2070に渡す。ループ境界ブロック2070は、変換ループを終了し、制御をループ境界ブロック2075に渡す。ループ境界ブロック2075は、予測モード・ループを終了し、制御を機能ブロック2080に渡す。機能ブロック2080は、分布配列を更新し、制御をループ境界ブロック2085に渡す。ループ境界ブロック2085は、MB符号化ループを終了し、制御をループ境界ブロック2090に渡す。ループ境界ブロック2090は、ピクチャ符号化ループを終了し、制御を終了ブロック2095に渡す。
図21に移ると、領域の考慮に基づく量子化の方法が、参照番号2100で一般的に示されている。方法2100は、画像データの符号化に関して実施される。
開始ブロック2105は、制御を機能ブロック2110に渡す。機能ブロック2110は、分布配列を初期化し、制御をループ境界ブロック2115に渡す。ループ境界ブロック2115は、ピクチャ符号化ループを開始し、制御を機能ブロック2120に渡す。機能ブロック2120は、符号化の準備として、ピクチャ・レベル量子化パラメータの決定や、ピクチャ決定の実施などを行い、制御を機能ブロック2122に渡す。機能ブロック2122は、コンテンツに基づいて(例えば領域セグメント化方式を使用して)場面を分析し、制御をループ境界ブロック2125に渡す。ループ境界ブロック2125は、マクロブロック符号化ループを開始し、制御を機能ブロック2130に渡す。機能ブロック2130は、処理中の現在マクロブロックの量子化パラメータを決定/選択し、現在マクロブロックに対応する領域を決定し、制御をループ境界ブロック2135に渡す。ループ境界ブロック2135は、予測モード・ループを開始し、制御を機能ブロック2140に渡す。機能ブロック2140は、現在マクロブロックについてイントラまたはインター予測を実施し、制御をループ境界ブロック2145に渡す。ループ境界ブロック2145は、すべての4×4ブロック(処理中の現在マクロブロック中の)について変換ループを開始し、制御を機能ブロック2150に渡す。機能ブロック2150は、処理中の現在4×4ブロックの変換を実施し、制御を機能ブロック2155に渡す。機能ブロック2155は、1/2のオフセットを使用して現在4×4ブロックを量子化して、あらゆる変換係数についてleveli,jを取得し、制御を機能ブロック2160に渡す。機能ブロック2160は、対応する領域について分布配列をチェックして、leveli,j量子化パラメータおよびi,jに基づいて最適なオフセットfi,jを決定し、制御を機能ブロック2165に渡す。機能ブロック2165は、fi,jを新しいオフセットとして使用して位置i,jにおける係数を再量子化し、制御をループ境界ブロック2170に渡す。ループ境界ブロック2170は、変換ループを終了し、制御をループ境界ブロック2175に渡す。ループ境界ブロック2175は、予測モード・ループを終了し、制御を機能ブロック2180に渡す。機能ブロック2180は、対応する領域の分布配列、および利用可能なら大域的な配列を更新し、制御をループ境界ブロック2185に渡す。ループ境界ブロック2185は、MB符号化ループを終了し、制御をループ境界ブロック2190に渡す。ループ境界ブロック2190は、ピクチャ符号化ループを終了し、制御を終了ブロック2195に渡す。
図22に移ると、最適化された量子化のために変換係数を考慮することを伴うエンコーダが、参照番号2200で一般的に示されている。
エンコーダ2200への入力は、領域分析および統計モジュール2210の第1の入力、加算器2215の反転入力、および動き補償器2220の第1の入力と信号通信で接続される。加算器2215の出力は、変換器2225の入力と信号通信で接続される。変換器2225の第1の出力は、領域分析および統計モジュール2210の第2の入力と信号通信で接続される。領域分析および統計モジュール2210の出力は、事前量子化器2230の第1の入力と信号通信で接続される。事前量子化器2230の出力は、量子化器2235の第1の入力と信号通信で接続される。変換器2225の第2の出力は、量子化器2235の第2の入力と信号通信で接続される。変換器2225の第3の出力は、事前量子化器2230の第2の入力と信号通信で接続される。量子化器2235の出力は、可変長コーダ(VLC)2240の第1の入力、および逆量子化器2245の入力と信号通信で接続される。VLC2240の出力は、エンコーダ2200の出力として利用可能である。
動き補償器2220の第1の出力は、加算器2215の非反転入力、および加算器2255の第1の入力と信号通信で接続される。動き補償器2220の第2の入力は、動き推定およびモード決定モジュール2250の第1の出力と信号通信で接続される。逆量子化器2245の出力は、逆変換器2260の入力と信号通信で接続される。逆変換器2260の出力は、加算器2255の第2の入力と信号通信で接続される。加算器2255の出力は、ループ・フィルタ2275の入力と信号通信で接続される。ループ・フィルタ2275の出力は、ピクチャ参照ストア2270の入力と信号通信で接続される。ピクチャ参照ストアの出力は、動き補償器2220の第3の入力、ならびに動き推定およびモード決定モジュール2250の入力と信号通信で接続される。動き推定およびモード決定モジュール2250の第2の出力は、VLC2240の第2の入力と信号通信で接続される。
図23に移ると、最適化された量子化のためにシータ・パラメータおよび変換係数を考慮することを伴うエンコーダが、参照番号2300で一般的に示されている。
エンコーダ2300への入力は、領域分析および統計モジュール2310の第1の入力、加算器2315の反転入力、および動き補償器2320の第1の入力と信号通信で接続される。加算器2315の出力は、変換器2325の入力と信号通信で接続される。変換器2325の第1の出力は、領域分析および統計モジュール2310の第2の入力と信号通信で接続される。領域分析および統計モジュール2310の第1の出力は、事前量子化器2330の第1の入力と信号通信で接続される。事前量子化器2330の出力は、量子化器2335の第1の入力と信号通信で接続される。変換器2325の第2の出力は、量子化器2335の第2の入力と信号通信で接続される。変換器2325の第3の出力は、事前量子化器2330の第2の入力と信号通信で接続される。量子化器2335の出力は、可変長コーダ(VLC)2340の第1の入力、および逆量子化器2345の入力と信号通信で接続される。VLC2340の出力は、エンコーダ2300の出力として利用可能である。
動き補償器2320の第1の出力は、加算器2315の非反転入力、および加算器2355の第1の入力と信号通信で接続される。動き補償器2320の第2の入力は、動き推定およびモード決定モジュール2350の第1の出力と信号通信で接続される。逆量子化器2345の出力は、逆変換器2360の入力と信号通信で接続される。逆変換器2360の出力は、加算器2355の第2の入力と信号通信で接続される。加算器2355の出力は、ループ・フィルタ2375の入力と信号通信で接続される。ループ・フィルタ2375の出力は、ピクチャ参照ストア2370の入力と信号通信で接続される。ピクチャ参照ストアの出力は、動き補償器2320の第3の入力、ならびに動き推定およびモード決定モジュール2350の入力と信号通信で接続される。動き推定およびモード決定モジュール2350の第2の出力は、VLC2340の第2の入力と信号通信で接続される。
領域分析および統計モジュール2310の第2の出力は、シータ導出モジュール2380の入力と信号通信で接続される。シータ導出モジュール2380の第1の出力は、逆量子化器2345の第2の入力と信号通信で接続される。シータ導出モジュール2380の第2の出力は、事前量子化器2330の第3の入力、量子化器2335の第3の入力、およびVLC2340の第3の入力と信号通信で接続される。
図24に移ると、デコーダが参照番号2400で一般的に示されている。デコーダ2400の入力は、シータ導出モジュール2480の入力、および可変長デコーダ(VLD)2440の入力と信号通信で接続される。シータ導出モジュール2480の第1の出力は、逆離散コサイン変換(IDCT)モジュール2499の第1の入力と信号通信で接続される。VLD2440の第1の出力は、動き補償器2420の第1の入力と信号通信で接続される。VLD2440の第2の出力は、量子化器2435の入力と信号通信で接続される。量子化器2435の出力は、IDCTモジュール2499の第2の入力と信号通信で接続される。ICDTモジュール2499の出力は、加算器2488の第1の入力と信号通信で接続される。動き補償器2420の出力は、加算器2488の第2の入力と信号通信で接続される。加算器2488の出力は、ループ・フィルタ2477の入力と信号通信で接続される。ループ・フィルタ2477の出力は、フレーム・バッファ2466の入力と信号通信で接続される。フレーム・バッファ2466の第1の出力は、動き補償器2420の第2の入力と信号通信で接続される。フレーム・バッファ2466の第2の出力は、デコーダ2400の出力として利用可能である。
次に、本発明の様々な例示的実施形態による、本発明に付随する多くの利点/特徴のいくつかについて述べる。例えば、利点/特徴の1つは、係数位置および関連する分布を考慮することによって適応的にデッドゾーン量子化が実施される符号化装置および方法である。別の利点/特徴は、前述の符号化装置および方法であって、符号化モード(イントラまたはインター)、色成分、変換サイズ、ならびに必要ならフィールドおよびフレーム・マクロブロック符号化モードのうちの、少なくとも1つに応じて、適応が実施される符号化装置および方法である。別の利点/特徴は、前述の適応を伴う符号化装置および方法であって、分布統計が種々の場合ごとに別々に収集される符号化装置および方法である。別の利点/特徴は、前述の適応を伴う符号化装置および方法であって、分布統計が領域特性(分散、エッジなど)に基づいて収集される符号化装置および方法である。別の利点/特徴は、前述の符号化装置および方法であって、デッドゾーン量子化が2ステップの方法で実施され、最初に固定のデッドゾーン/丸め制御を使用して準備レベルを決定してから、このレベルに基づいてレベル依存のデッドゾーン/丸め制御を使用して量子化を繰り返す符号化装置および方法である。また、別の利点/特徴は、前述の2ステップのデッドゾーン量子化を伴う符号化装置および方法であって、レベル依存の丸め制御が、そのレベル内の区分的分布に基づいて計算される符号化装置および方法である。さらに、別の利点/特徴は、前述の2ステップのデッドゾーン量子化およびレベル依存の丸め制御を伴う符号化装置および方法であって、再構築済みエリア内の分布集中(分布エリア)を使用して計算が実施される符号化装置および方法である。さらに、別の利点/特徴は、前述の2ステップのデッドゾーン量子化、またレベル依存の丸め制御を伴う符号化装置および方法であって、台形法や単体近似法などの算術積分法を使用してレベル依存の丸め制御が計算される符号化装置および方法である。加えて、別の利点/特徴は、前述の2ステップのデッドゾーン量子化を伴う符号化装置および方法であって、歪みもまた計算内で考慮される符号化装置および方法である。さらに、別の利点/特徴は、前述の符号化装置および方法であって、主観的品質を改善する試みとして、元々レベル0に設定されていたいくつかの係数がそうではなく強制的により高いレベルにされる符号化装置および方法である。また、別の利点/特徴は、前述の係数レベル強制を伴う符号化装置および方法であって、このような決定がレート歪み最適化基準に基づく符号化装置および方法である。さらに、別の利点/特徴は、前述の符号化装置および方法であって、オフセッティング量子化行列Θのセットを送信および考慮することによってデッドゾーン量子化が精緻化される符号化装置および方法である。また、別の利点/特徴は、前述のオフセッティング行列によって精緻化されるデッドゾーン量子化を伴う符号化装置および方法であって、異なるレベルでΘの値が異なる影響を有する符号化装置および方法である。さらに、別の利点/特徴は、前述のオフセッティング行列によって精緻化されるデッドゾーン量子化を伴う符号化装置および方法であって、画像統計および係数分布に基づいてΘが計算される符号化装置および方法である。さらに、別の利点/特徴は、前述のオフセッティング行列によって精緻化されるデッドゾーン量子化、ならびに画像統計および係数分布に基づいて計算されるΘを伴う符号化装置および方法であって、再構築済みエリア内の分布集中(分布エリア)を使用してΘが計算される符号化装置および方法である。加えて、別の利点/特徴は、前述のオフセッティング行列によって精緻化されるデッドゾーン量子化、ならびに画像統計および係数分布と分布集中とに基づいて計算されるΘを伴う符号化装置および方法であって、台形法や単体近似法などの算術積分法を使用してΘが計算される符号化装置および方法である。さらに、別の利点/特徴は、前述のオフセッティング行列によって精緻化されるデッドゾーン量子化、ならびに画像統計および係数分布と分布集中とに基づいて計算されるΘを伴う符号化装置および方法であって、歪みもまたΘの計算で考慮される符号化装置および方法である。さらに、別の利点/特徴は、前述のオフセッティング行列によって精緻化されるデッドゾーン量子化を伴う符号化装置および方法であって、レベル0を使用して符号化されることが可能な係数の最大パーセンテージに応じてΘ計算を調節することのできる符号化装置および方法である。別の利点/特徴は、前述の符号化装置および方法であって、すべての係数についての分布特性に基づいて計算された重み付き量子化行列をデッドゾーン量子化が考慮する符号化装置および方法である。別の利点/特徴は、前述の適応と、領域特性に基づく分布統計収集と、すべての係数についての分布特性に基づいて計算された重み付き行列によるデッドゾーン量子化とを伴う符号化装置および方法であって、「最も重要な領域」の分布だけがこの計算で考慮される符号化装置および方法である。さらに、別の利点/特徴は、前述の適応と、領域特性に基づく分布統計収集と、すべての係数についての分布特性に基づいて計算された重み付き行列によるデッドゾーン量子化とを伴う符号化装置および方法であって、主観的影響と出現統計とに基づく重み付き平均法を使用して、種々の領域すべてが重み付き行列の計算で考慮される符号化装置および方法である。
本発明のこれらや他の特徴および利点は、本明細書の教示に基づいて、当業者によって容易に確かめることができる。本発明の教示は、様々な形式のハードウェア、ソフトウェア、ファームウェア、専用プロセッサ、またはこれらの組合せで実施できることを理解されたい。
本発明の教示は、ハードウェアとソフトウェアの組合せとして実施されることが最も好ましい。さらに、ソフトウェアは、プログラム記憶ユニット上に有形に組み入れられたアプリケーション・プログラムとして実現されることが好ましい。アプリケーション・プログラムは、任意の適したアーキテクチャを備えるマシンにアップロードして、マシンによって実行することができる。マシンは、1つまたは複数の中央処理装置(CPU)、ランダム・アクセス・メモリ(RAM)、および入出力(I/O)インタフェースなどのハードウェアを有するコンピュータ・プラットフォーム上で実現されることが好ましい。コンピュータ・プラットフォームはまた、オペレーティング・システムおよびマイクロ命令コードを備えてもよい。本明細書に述べた様々なプロセスおよび機能は、マイクロ命令コードの一部またはアプリケーション・プログラムの一部、あるいはこれらの任意の組合せであってよく、これらはCPUによって実行することができる。加えて、追加のデータ記憶ユニットや印刷ユニットなど、その他の様々な周辺ユニットがコンピュータ・プラットフォームに接続されてもよい。
添付の図面に示した構成システム・コンポーネントおよび方法のいくつかはソフトウェア中で実現することが好ましいので、システム・コンポーネント間またはプロセス機能ブロック間の実際の接続は、本発明がプログラムされる方式に応じて異なる場合があることも、さらに理解されたい。本明細書の教示が与えられれば、当業者なら本発明のこれらおよび類似の実装形態または構成を企図することができるであろう。
添付の図面を参照して例示的な実施形態を本明細書に述べたが、本発明はこれらの正確な実施形態に限定されず、本発明の範囲または趣旨を逸脱することなく当業者によって様々な変更および修正を実施できることを理解されたい。このような変更および修正はすべて、添付の特許請求の範囲に述べる本発明の範囲に含まれるものとする。

Claims (4)

  1. 画像ブロックについてのビデオ信号データを符号化するためのエンコーダであって、
    前記画像ブロックについての変換係数を受け取って、前記変換係数を量子化レベルに量子化するための量子化器と、
    前記量子化レベルを再構築レベルに逆量子化するための逆量子化器と、
    を備え、
    特定の位置で前記逆量子化器によって使用される丸めパラメータが前記特定の位置での前記量子化レベルによって決定される、前記エンコーダ。
  2. 画像ブロックについてのビデオ信号データを符号化する方法であって、
    前記画像ブロックについての変換係数を受け取るステップと、
    前記変換係数を量子化レベルに量子化するステップと、
    前記量子化レベルを再構築レベルに逆量子化するステップと、
    を含み、
    特定の位置で逆量子化を行うために使用される丸めパラメータが前記特定の位置での前記量子化レベルによって決定される、前記方法。
  3. 画像ブロックについてのビデオ信号データを復号するためのデコーダであって、
    前記画像ブロックについての量子化レベルを受け取って、前記量子化レベルを再構築レベルに逆量子化する逆量子化器を備え、
    特定の位置で前記逆量子化器によって使用される丸めパラメータが前記特定の位置での前記量子化レベルによって決定される、前記デコーダ。
  4. 画像ブロックについてのビデオ信号データを復号する方法であって、
    前記画像ブロックについての量子化レベルを受け取るステップと、
    前記量子化レベルを再構築レベルに逆量子化するステップと、
    を含み、
    特定の位置で逆量子化を行うために使用される丸めパラメータが前記特定の位置での前記量子化レベルによって決定される、前記方法。
JP2011127460A 2004-06-18 2011-06-07 ビデオ・コーデック量子化のための方法および装置 Active JP5204269B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US58101904P 2004-06-18 2004-06-18
US60/581,019 2004-06-18

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2007516530A Division JP5053081B2 (ja) 2004-06-18 2005-06-03 ビデオ・コーデック量子化のための方法および装置

Publications (2)

Publication Number Publication Date
JP2011223607A JP2011223607A (ja) 2011-11-04
JP5204269B2 true JP5204269B2 (ja) 2013-06-05

Family

ID=34971735

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2007516530A Active JP5053081B2 (ja) 2004-06-18 2005-06-03 ビデオ・コーデック量子化のための方法および装置
JP2011127460A Active JP5204269B2 (ja) 2004-06-18 2011-06-07 ビデオ・コーデック量子化のための方法および装置

Family Applications Before (1)

Application Number Title Priority Date Filing Date
JP2007516530A Active JP5053081B2 (ja) 2004-06-18 2005-06-03 ビデオ・コーデック量子化のための方法および装置

Country Status (6)

Country Link
US (1) US8542731B2 (ja)
EP (1) EP1766988A2 (ja)
JP (2) JP5053081B2 (ja)
KR (1) KR101320260B1 (ja)
CN (2) CN102595131B (ja)
WO (1) WO2006007279A2 (ja)

Families Citing this family (50)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4273996B2 (ja) * 2004-02-23 2009-06-03 ソニー株式会社 画像符号化装置及び方法、並びに画像復号装置及び方法
US8422546B2 (en) * 2005-05-25 2013-04-16 Microsoft Corporation Adaptive video encoding using a perceptual model
KR100785855B1 (ko) * 2005-07-19 2007-12-14 한국전자통신연구원 향상된 snr 스케일러빌리티 제공을 위한 양자화 장치 및방법
US7778476B2 (en) * 2005-10-21 2010-08-17 Maxim Integrated Products, Inc. System and method for transform coding randomization
US8059721B2 (en) 2006-04-07 2011-11-15 Microsoft Corporation Estimating sample-domain distortion in the transform domain with rounding compensation
US7995649B2 (en) 2006-04-07 2011-08-09 Microsoft Corporation Quantization adjustment based on texture level
US8503536B2 (en) * 2006-04-07 2013-08-06 Microsoft Corporation Quantization adjustments for DC shift artifacts
US20070237237A1 (en) * 2006-04-07 2007-10-11 Microsoft Corporation Gradient slope detection for video compression
US8711925B2 (en) 2006-05-05 2014-04-29 Microsoft Corporation Flexible quantization
WO2008026145A2 (en) 2006-08-30 2008-03-06 Koninklijke Philips Electronics N.V. Device and method for coding a data signal and device and method for decoding a data signal
US7885476B2 (en) * 2006-12-14 2011-02-08 Sony Corporation System and method for effectively performing an adaptive encoding procedure
US8238424B2 (en) 2007-02-09 2012-08-07 Microsoft Corporation Complexity-based adaptive preprocessing for multiple-pass video compression
US8498335B2 (en) * 2007-03-26 2013-07-30 Microsoft Corporation Adaptive deadzone size adjustment in quantization
US20080240257A1 (en) * 2007-03-26 2008-10-02 Microsoft Corporation Using quantization bias that accounts for relations between transform bins and quantization bins
US8243797B2 (en) 2007-03-30 2012-08-14 Microsoft Corporation Regions of interest for quality adjustments
US8442337B2 (en) 2007-04-18 2013-05-14 Microsoft Corporation Encoding adjustments for animation content
US8331438B2 (en) * 2007-06-05 2012-12-11 Microsoft Corporation Adaptive selection of picture-level quantization parameters for predicted video pictures
EP2232873B1 (en) * 2007-12-19 2012-03-21 Dolby Laboratories Licensing Corporation Adaptive motion estimation
US8189933B2 (en) * 2008-03-31 2012-05-29 Microsoft Corporation Classifying and controlling encoding quality for textured, dark smooth and smooth video content
US20090262801A1 (en) * 2008-04-17 2009-10-22 Qualcomm Incorporated Dead zone parameter selections for rate control in video coding
US8897359B2 (en) 2008-06-03 2014-11-25 Microsoft Corporation Adaptive quantization for enhancement layer video coding
US8326075B2 (en) 2008-09-11 2012-12-04 Google Inc. System and method for video encoding using adaptive loop filter
US8923390B2 (en) * 2009-06-19 2014-12-30 The Hong Kong University Of Science And Technology Scalar quantization using bit-stealing for video processing
WO2011052213A1 (ja) * 2009-10-30 2011-05-05 パナソニック株式会社 画像復号方法、画像符号化方法、それらの装置、プログラムおよび集積回路
TW201143448A (en) * 2009-10-30 2011-12-01 Panasonic Corp Image encoding method, image decoding method, image encoding device and image decoding device
FR2955995B1 (fr) * 2010-02-04 2012-02-17 Canon Kk Procede et dispositif de traitement d'une sequence video
FR2956552B1 (fr) * 2010-02-18 2012-12-28 Canon Kk Procede de codage ou de decodage d'une sequence video, dispositifs associes
FR2957744B1 (fr) * 2010-03-19 2012-05-25 Canon Kk Procede de traitement d'une sequence video et dispositif associe
EP2564354A4 (en) * 2010-04-29 2014-03-12 Icvt Ltd APPARATUS AND METHODS FOR RECOMPRESSION HAVING A MONOTONE RELATIONSHIP BETWEEN COMPRESSION LEVEL AND COMPRESSED IMAGE QUALITY
US8885706B2 (en) 2011-09-16 2014-11-11 Google Inc. Apparatus and methodology for a video codec system with noise reduction capability
US9131073B1 (en) 2012-03-02 2015-09-08 Google Inc. Motion estimation aided noise reduction
US9270986B2 (en) * 2012-04-13 2016-02-23 Qualcomm Incorporated Level decision in rate distortion optimized quantization
US9344729B1 (en) 2012-07-11 2016-05-17 Google Inc. Selective prediction signal filtering
US9445109B2 (en) 2012-10-16 2016-09-13 Microsoft Technology Licensing, Llc Color adaptation in video coding
US20140105278A1 (en) * 2012-10-16 2014-04-17 Microsoft Corporation Color adaptation in video coding
US11470339B2 (en) 2013-08-27 2022-10-11 Qualcomm Incorporated Residual prediction for intra block copying
US9877035B2 (en) 2014-03-17 2018-01-23 Qualcomm Incorporated Quantization processes for residue differential pulse code modulation
EP2980793A1 (en) 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Encoder, decoder, system and methods for encoding and decoding
US10102613B2 (en) 2014-09-25 2018-10-16 Google Llc Frequency-domain denoising
WO2016049894A1 (en) * 2014-09-30 2016-04-07 Mediatek Inc. Scaling in color transform
US10057578B2 (en) * 2014-10-07 2018-08-21 Qualcomm Incorporated QP derivation and offset for adaptive color transform in video coding
GB2534604B (en) * 2015-01-29 2021-11-10 British Broadcasting Corp Video encoding and decoding with adaptive quantisation
KR102636100B1 (ko) * 2016-12-16 2024-02-13 삼성전자주식회사 데드존에 기초하여 양자화를 수행하는 인코더 및 이를 포함하는 비디오 처리 시스템
CN107426572A (zh) * 2016-12-30 2017-12-01 杭州当虹科技有限公司 一种高效快速的视频编码算法
US10735737B1 (en) 2017-03-09 2020-08-04 Google Llc Bit assignment based on spatio-temporal analysis
CN107896330B (zh) * 2017-11-29 2019-08-13 北京大学深圳研究生院 一种用于帧内和帧间预测的滤波方法
SG11202102562WA (en) * 2019-06-25 2021-04-29 Guangdong Oppo Mobile Telecommunications Corp Ltd Image encoding method, image decoding method, encoder, decoder and storage medium
US11375241B2 (en) * 2020-10-20 2022-06-28 Alibaba Group Holding Limited Frequency specific compression and compensation technique in image processing
WO2024015665A1 (en) * 2022-07-12 2024-01-18 Qualcomm Incorporated Bit-rate estimation for video coding with machine learning enhancement
US11825090B1 (en) 2022-07-12 2023-11-21 Qualcomm Incorporated Bit-rate estimation for video coding with machine learning enhancement

Family Cites Families (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04259182A (ja) 1991-02-13 1992-09-14 Matsushita Electric Ind Co Ltd 動き補償予測フレーム間符号化装置
JP2946833B2 (ja) 1991-06-11 1999-09-06 富士通株式会社 画像符号化における量子化方式
KR950005643B1 (ko) 1992-03-19 1995-05-27 국방과학연구소 패킷 교환장치
US5295203A (en) * 1992-03-26 1994-03-15 General Instrument Corporation Method and apparatus for vector coding of video transform coefficients
JP3245977B2 (ja) * 1992-06-30 2002-01-15 ソニー株式会社 ディジタル画像信号の伝送装置
KR960010196B1 (ko) * 1993-06-04 1996-07-26 배순훈 인간의 시각특성을 이용한 디씨(dc) 변환계수 양자화기
US5729294A (en) * 1995-04-05 1998-03-17 International Business Machines Corporation Motion video compression system with novel adaptive quantization
KR0153671B1 (ko) 1995-06-30 1998-11-16 배순훈 고선명 텔레비젼 엔코더의 레이트 콘트롤러
JPH10304363A (ja) * 1997-05-01 1998-11-13 Canon Inc 画像信号処理装置及び方法
JPH10304362A (ja) * 1997-05-01 1998-11-13 Canon Inc 画像信号処理装置及び方法
JP4362886B2 (ja) 1999-04-30 2009-11-11 ソニー株式会社 振動体装置及びその作動方法
US6560584B1 (en) * 1999-07-22 2003-05-06 Advanced Research & Technology Institute Method and apparatus for prediction of system reliability
WO2003015423A1 (en) 2001-08-02 2003-02-20 Sony Corporation Image processing apparatus and method, and image processing program
US7123655B2 (en) * 2001-08-09 2006-10-17 Sharp Laboratories Of America, Inc. Method for reduced bit-depth quantization
US6882685B2 (en) * 2001-09-18 2005-04-19 Microsoft Corporation Block transform and quantization for image and video coding
JP3763276B2 (ja) * 2001-11-27 2006-04-05 ソニー株式会社 信号処理装置および方法、記録装置および方法、ならびに、記録再生装置および方法
JP4254147B2 (ja) * 2001-11-30 2009-04-15 ソニー株式会社 画像情報符号化方法及び装置、並びにプログラム及び記録媒体
DE10300048B4 (de) * 2002-01-05 2005-05-12 Samsung Electronics Co., Ltd., Suwon Verfahren und Vorrichtung zur Bildcodierung und -decodierung
US20030215011A1 (en) * 2002-05-17 2003-11-20 General Instrument Corporation Method and apparatus for transcoding compressed video bitstreams
JP4259182B2 (ja) 2003-05-27 2009-04-30 パナソニック電工株式会社 生体情報計測装置
US7580584B2 (en) * 2003-07-18 2009-08-25 Microsoft Corporation Adaptive multiple quantization

Also Published As

Publication number Publication date
EP1766988A2 (en) 2007-03-28
WO2006007279A3 (en) 2006-05-11
WO2006007279A2 (en) 2006-01-19
CN102595131B (zh) 2015-02-04
US8542731B2 (en) 2013-09-24
US20080080615A1 (en) 2008-04-03
JP2008503918A (ja) 2008-02-07
CN1973547A (zh) 2007-05-30
KR101320260B1 (ko) 2013-10-23
JP5053081B2 (ja) 2012-10-17
CN102595131A (zh) 2012-07-18
KR20120031530A (ko) 2012-04-03
JP2011223607A (ja) 2011-11-04

Similar Documents

Publication Publication Date Title
JP5204269B2 (ja) ビデオ・コーデック量子化のための方法および装置
KR101298389B1 (ko) 비디오 코더 및 디코더 공동 최적화를 위한 방법 및 시스템
JP5801032B2 (ja) インループのアーチファクト除去フィルタリングのための方法および装置
JP5801363B2 (ja) 符号化及び復号化のための装置及び方法並びにコンピュータプログラム
CN107295342B (zh) 视频编码装置
JP5290325B2 (ja) Cabacコーダのためのレート歪みモデリングに基づいた量子化
JP4393875B2 (ja) 複雑さの軽減された復号化に適したシングルレイヤビデオ符号化されたビットストリームを供給するシステム及び方法
JP4847521B2 (ja) 複数の映像規格に従った映像符号化の際のブロックノイズ除去フィルタリング技術
EP1675402A1 (en) Optimisation of a quantisation matrix for image and video coding
US20080240252A1 (en) Simplified deblock filtering for reduced memory access and computational complexity
WO2014139396A1 (en) Video coding method using at least evaluated visual quality and related video coding apparatus
KR102393179B1 (ko) 복원 블록을 생성하는 방법 및 장치
KR101378749B1 (ko) 성김에 기반한 아티팩트 제거 필터링에서 가변 변환들에 응답하여 필터 파라미터 결정 및 선택을 위한 방법과 장치
CN1301370A (zh) 用于减少压缩的视频中的喘息污迹的方法和设备
JP2007536828A (ja) 低ビットレート映像圧縮のための画像エンハンスメント方法及び装置
JP2008205534A (ja) 符号化方式変換装置
JP2012527160A (ja) 映像符号化及び復号化のための、改善された量子化の丸めのオフセットを調節する方法及び装置
WO2021185257A1 (zh) 图像编码方法、图像解码方法及相关装置
KR101193790B1 (ko) 비디오 코덱 양자화를 위한 방법 및 장치
JP2023530630A (ja) ビデオ符号化のための適応量子化器設計
EP1675405A1 (en) Optimisation of a quantisation matrix for image and video coding
JP6200220B2 (ja) 画像処理装置、符号化装置、復号装置、及びプログラム

Legal Events

Date Code Title Description
RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20111213

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20120119

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20121220

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130115

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130214

R150 Certificate of patent or registration of utility model

Ref document number: 5204269

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20160222

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R360 Written notification for declining of transfer of rights

Free format text: JAPANESE INTERMEDIATE CODE: R360

R360 Written notification for declining of transfer of rights

Free format text: JAPANESE INTERMEDIATE CODE: R360

R371 Transfer withdrawn

Free format text: JAPANESE INTERMEDIATE CODE: R371

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250