JP2015530832A - 構文要素のレート歪みを最適化するための装置および方法 - Google Patents

構文要素のレート歪みを最適化するための装置および方法 Download PDF

Info

Publication number
JP2015530832A
JP2015530832A JP2015530171A JP2015530171A JP2015530832A JP 2015530832 A JP2015530832 A JP 2015530832A JP 2015530171 A JP2015530171 A JP 2015530171A JP 2015530171 A JP2015530171 A JP 2015530171A JP 2015530832 A JP2015530832 A JP 2015530832A
Authority
JP
Japan
Prior art keywords
candidates
block
coefficient
encoder
syntax element
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2015530171A
Other languages
English (en)
Inventor
クリストフ ヘベル
クリストフ ヘベル
エリック シー ピアソン
エリック シー ピアソン
パベル ノボトニー
パベル ノボトニー
Original Assignee
マグナム セミコンダクター, インコーポレイテッド
マグナム セミコンダクター, インコーポレイテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by マグナム セミコンダクター, インコーポレイテッド, マグナム セミコンダクター, インコーポレイテッド filed Critical マグナム セミコンダクター, インコーポレイテッド
Publication of JP2015530832A publication Critical patent/JP2015530832A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/147Data rate or code amount at the encoder output according to rate distortion criteria
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/154Measured or subjectively estimated visual quality after decoding, e.g. measurement of distortion
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/18Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a set of transform coefficients
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • H04N19/463Embedding additional information in the video signal during the compression process by compressing encoding parameters before transmission
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/513Processing of motion vectors
    • H04N19/517Processing of motion vectors by encoding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/567Motion estimation based on rate distortion criteria
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

構文要素のレート歪みを最適化するための方法および装置が本明細書に開示される。最適化ブロックは、ビデオ符号器で用いられ得、候補生成ブロックおよび最良費用ブロックを含み得る。最適化ブロックは、それぞれの差動水準に対応する複数の候補を生成するように構成され得る。複数の候補の各々は、DC係数に少なくとも部分的に基づき得、それぞれのレート歪み費用を提供し得る。最良費用ブロックは、候補生成ブロックに結合され得、複数の候補から一候補を基準に従って選択するように構成され得る。

Description

本発明の実施形態は、概して、ビデオ符号化に関し、より具体的には、構文要素のレート歪み最適化に関する。
ビデオ信号または他の媒体信号は、テレビ、放送システム、携帯機器、およびラップトップとデスクトップとの双方のコンピュータを含む様々なデバイスによって用いられ得る。典型的には、デバイスは、多くの場合、信号を符号化された形態から復号化した後にビデオ信号または他の媒体信号の受信に応答してビデオを表示し得る。デバイス間で提供されるビデオ信号は、多くの場合、様々な符号化および/または圧縮の技法のうちの1つ以上を用いて符号化され、ビデオ信号は、典型的には、MPEG−2、MPEG−4、およびH.264/MPEG−4のパート10などの特定の規格に従って復号化されるような様式で符号化される。ビデオ信号または他の媒体信号を符号化して、次に、受信された信号を復号化することによって、デバイス間で伝達する必要のあるデータの量がかなり削減させ得る。
ビデオ符号化は、典型的には、マクロブロックと呼ばれる16×16画素ブロックまたは他の単位のビデオデータを符号化することによって実施される。予測符号化が、予測ブロックおよび残留ブロックを生成するために用いられ得るが、ここで残留ブロックは、予測ブロックと符号化されているブロックとの間の差を表す。予測符号化は、ビデオ信号中の冗長データを除去し、それにより、送出または記憶される必要のあるデータの削減をさらに増進させるために、空間的および/または時間的予測を含み得る。例えば、イントラ符号化は、空間的予測と、フレームまたはスライス中のブロック間での空間的冗長量の減少を対象とする。その一方で、インター符号化は、時間的予測と、連続するフレームまたはスライス内のブロック間の時間的冗長性の量を削減することとを対象とする。インター符号化は、連続するフレームまたはスライスの対応するブロック間での運動を追跡しようとする運動予測を利用し得る。
一般的に、係数および運動ベクトルなどの構文要素は、様々な符号化技法のうちの1つ(例えば、エントロピー符号化)を用いて符号化し、次いで、符号化デバイスと復号化デバイスとの間で伝送され得る。くわえて、いくつかの方式が、構文要素を最適化することをさらに試行し得る。すなわち、多くのビデオ符号化方法が、達成可能なデータレートと復号化された信号中に存在する歪みの量との間での何らかの形態のトレードオフを利用し得る。最も知られている方法は、しかしながら、特定の構文要素しか最適化することが可能である、または、すなわち、リアルタイムの実装に用いることは不可能である。結果として、またとくにより複雑な符号化アルゴリズムの場合、リアルタイムでの構文要素の最適化は、難問を提示している。
概要
構文要素のレート歪みを最適化するための例としての方法、装置、符号器、および最適化ブロックが本明細書に開示される。例としての最適化ブロックは、ビデオ符号器中で用いられ得、候補生成ブロックおよび最良費用ブロックを含み得る。候補生成ブロックは、それぞれの差動水準に対応する複数の候補を生成するように構成され得る。複数の候補の各々は、DC係数に少なくとも部分的に基づき得、それぞれのレート歪み費用を提供し得る。最良費用ブロックは、候補生成ブロックに結合され得、複数の候補から基準に対応する候補を選択するように構成し得る。
例としての符号器は、DC係数を受信し、DC係数に少なくとも部分的に基づいて複数の候補を生成するように構成されるDC最適化ブロックを含み得る。DC最適化ブロックは、複数の候補から基準に対応する候補を選択するようにさらに構成され得る。例としての符号器は、複数のAC係数を受信し、この複数のAC係数を量子化するように構成されるAC量子化ブロックをさらに含み得る。この複数の候補の各々は、それぞれの差動水準に対応し得る。
係数を最適化する方法を含む例としての方法を、本明細書中に開示する。この例としての方法は、差動符号化された構成要素を受信することと、この差動符号化された構成要素に少なくとも部分的に基づいてこの複数の候補を生成することとを含み得る。この複数の候補の各々は、それぞれの差分水準を有し得る。この例としての方法は、複数の候補の各々に対するそれぞれのRDスコアを生成することと、この複数の候補から基準に対応する1つを選択することとをさらに含み得る。
候補を生成する方法を含む例としての方法も、本明細書中に開示する。この例としての方法は、差動符号化された構文要素の差を受信することと、この差動符号化された構文要素の差のビット長を決定することとを含み得る。この例としての方法は、この差動符号化された構文要素の差のビット長に少なくとも部分的に基づいて複数の候補を生成することをさらに含み得る。この例としての方法は、複数の候補に対するそれぞれの複数のレート歪み費用を生成することと、このそれぞれの複数のレート歪み費用に少なくとも部分的に基づいて複数の候補から1つを選択することとをさらに含み得る。
本発明の実施形態に従う符号器のブロック図である。 本発明の実施形態に従う符号器の略ブロック図である。 本発明の実施形態に従う最適化ブロックの略ブロック図である。 本発明の実施形態に従う候補差を生成するための方法のフローチャートである。 本発明の実施形態に従う媒体送達システムの略図である。 本明細書に説明する符号器を利用し得るビデオ分配システムの略図である。
構文要素のレート歪みトレードオフを最適化するための方法および装置を、本明細書中に説明する。レート歪みトレードオフは、例えば、1つ以上の符号化規格にしたがって構文要素に対して最適化され得るおよび/またはこれらの構文要素に対して複数の生成された候補に基づいて最適化され得る。ある詳細を、本発明の実施形態の十分な理解を提供するために以下に記載する。しかしながら、本発明の実施形態が、これらの特定的な詳細なしで、またはさらなるもしくは異なる詳細を以って実行され得ることが当業者にとっては明瞭であろう。そのうえ、本明細書に説明する本発明の特定の実施形態は、例として提供され、したがって、本発明の範囲をこれらの特定的な実施形態に制限するために用いられるべきではない。他の例では、周知のビデオコンポーネント、符号器もしくは復号器のコンポーネント、回路、制御信号、タイミングプロトコル、およびソフトウエア動作は、本発明を不必要に曖昧化することを避けるために詳細には示していない。
図1は、本発明の実施形態に従う符号器100のブロック図である。符号器100は、1つ以上の論理回路、制御論理、論理ゲート、プロセッサ、メモリ、および/またはこれらのなんらかの組み合わせもしくはサブ組み合わせを含み得、例を以下にさらに説明する1つ以上の符号化技法を用いてビデオ信号を符号化および/または圧縮するように構成され得る。符号器100は、例えば、可変ビットレート信号および/または一定ビットレート信号を符号化するように構成され得、一般に、レートには依存しない様式で生成され得るビットストリームを出力するように固定レートで動作し得る。符号器100は、これには限られないが、テレビ、放送システム、携帯デバイス、およびラップトップとデスクトップとの双方のコンピュータを含むビデオ符号化を用いる様々なデバイスのうちの任意のものに実装され得る。少なくとも1つの実施形態では、符号器100は、可変長符号化用符号器(例えば、Huffman符号器もしくはCAVLC符号器)などのエントロピー符号器を含み得るおよび/または例えばマクロブロック水準でデータを符号化するように構成され得る。各々のマクロブロックは、イントラ符号化モード、インター符号化モード、双方向、または、これらの任意の組み合わせもしくはサブ組み合わせで符号化され得る。
例として、符号器100は、1つの実施形態ではビデオデータ(例えば、フレーム)を含み得るビデオ信号を受信して、符号化し得る。このビデオ信号は、MPEG−2、MPEG−4、H.263、H.264、および/またはH.HEVCなどの1つ以上の符号化規格に従って符号化されて、符号化されたビットストリームを提供し得るが、これは、次に、データバスおよび/または、復号器またはコード変換器(図示せず)などのデバイスに提供され得る。以下により詳細に説明されるように、ビデオ信号は、構文要素のレート歪みトレードオフが最適化されるように、符号器100によって符号化され得る。1つの実施形態では、例えば、DC係数のレート歪みトレードオフは、ビデオ信号の1つ以上の成分(例えば、輝度および/またはクロミナンス成分)に対して最適化され得る。
周知なように、構文要素は、例えば、ビデオ信号の圧縮表示を提供するためにビットストリーム中で用いられ得る記号を含み得る。構文要素は、係数、運動ベクトル、および構文階層の様々な水準(例えば、シーケンス、フレーム、またはブロック)などの1つ以上の符号化規格に従って構文を有するビデオ信号の1つ以上の要素を含み得る。そのうえ、レート歪み最適化とは、十分なレートが許容可能な歪み量と共に保たれる特定のレート歪みトレードオフを選択するように設計されたプロセスのことであり得る。レート歪み費用関数は、典型的には、次式で例示されるように、ラムダ因数λ、すなわちλにレートを乗算して、積を歪みに加算したもので表され得る:
Figure 2015530832
式中、Jは、係数などの1つ以上の構文要素に対するレート歪み費用、すなわち「RDスコア」を表す。あるいは、この式は、以下ように表され得る:
Figure 2015530832
一般に、符号化方法は、例えば、所与のビットレートに対するRDスコアを最小化することを目的とし得る。ラムダは、符号器100によって決定され得る、復号器、コード変換器、もしくは論理回路(図示せず)などのデバイスによって提供され得る、またはユーザによって指定され得る。
図2は、本発明の実施形態に従う符号器200の略ブロック図である。符号器200は、図1の符号器100を少なくとも部分的に実装するために用いられ得、MPEG−2符号化規格にさらに準拠し得る。一部の実施形態では、符号器200は、さらに、またはあるいは、H.264符号化規格などの技術上周知の1つ以上の他の符号化規格に準拠し得る。
符号器200は、モード判断ブロック230、予測ブロック220、遅延バッファ202、変換206、量子化ブロック250、エントロピー符号器208、逆量子化ブロック210、逆変換ブロック212、加算器214、および符号化ピクチャバッファ218を含み得る。モード判断ブロック230は、以下に説明するように、入力ベースバンドビデオ信号および復号化ピクチャバッファ信号に少なくとも部分的に基づいて適切な符号化モードを決定するように構成され得るおよび/またはフレームおよび/またはマクロブロックベースで適切な符号化モードを決定し得る。モード判断は、マクロブロックタイプ、イントラモード、インターモード、構文要素(たとえば、運動ベクトル)、および/または量子化パラメータを含み得る。本発明の一部の例では、モード判断ブロック230は、以下にさらに説明するように、量子化ブロック250によって用いられるラムダを提供し得る。モード判断ブロック230はまた、本発明の例に従ってモード判断をする際にラムダを利用し得る。一部の実施形態では、ラムダは、モード判断ブロック230および量子化ブロック250の全体にわたって共通であり得る。
モード判断ブロック230は、MPEG−2符号化規格および/または他の予測方法に従って予測変数を生成するために、予測ブロック220によって利用され得る。予測変数は、減算器204によって、ビデオ信号の遅延バージョンから減算され得る。ビデオ信号の遅延バージョンを用いることで、モード判断ブロック230が動作する時間が提供され得る。減算器204の出力は、剰余、例えば、ブロックとブロックの予測との差であり得る。
変換206は、離散コサイン変換(DCT)などの変換を剰余に実施して、剰余を周波数ドメインに変換するように構成され得る。結果として、変換206は、例えば、ビデオ信号中のデータのスペクトル成分に対応し得る係数ブロックを提供し得る。例えば、係数ブロックは、例えば、ブロックの平均値に対応し得る係数ブロックのゼロ周波数成分に対応するDC係数を含み得る。係数ブロックは、係数ブロックのより高い(非ゼロ)周波数部分に対応する複数のAC係数をさらに含み得る。
量子化ブロック250は、係数ブロックを受信して、係数ブロックの係数(例えば、DC係数およびAC係数)を量子化して、量子化された係数ブロックを生成するように構成され得る。量子化ブロック250によって提供される量子化は、損失が多くあり得るおよび/またはさらにラムダを利用して、係数ブロックの1つ以上の係数に対してレート歪みトレードオフを調整および/または最適化し得る。ラムダは、モード判断ブロック230によって受信され得る、ユーザによって指定され得る、または符号器200の別の要素によって提供され得る。ラムダは、各々のマクロブロックもしくはいずれかの他の単位に対して調整され得、また、符号器200によって符号化された情報に基づき得る(例えば、広告を符号化するビデオ信号は、詳細な場面を符号化するビデオ信号よりも一般に大きいラムダまたは小さいラムダの逆関数を利用し得る)。
すると、エントロピー符号器208は、量子化された係数ブロックを符号化して、符号化されたビットストリームを提供し得る。エントロピー符号器208は、可変長符号化(VLC)符号器などの、当業者には周知のまたは将来開発されるいずれかのエントロピー符号器であり得る。量子化された係数ブロックはまた、逆スケーリングされ、逆量子化ブロック210によって量子化され得る。逆スケーリングされ、量子化された係数は、逆変換ブロック212によって逆変換されて、再構築された剰余を生成するが、これは、加算器214で予測変数に加算されて、再構築されたビデオを生成し得る。再構築されたビデオは、将来のフレーム中で用いられるように符号化ピクチャバッファ218に提供され、さらに、さらなるマクロブロック中イントラ予測または他のモード判断方法のために、符号化ピクチャバッファ218からモード判断ブロック230に提供され得る。
少なくとも1つの実施形態では、量子化ブロック250は、DC最適化ブロック252およびAC量子化ブロック254を含み得る。AC量子化ブロック254は、係数ブロックの1つ以上のAC係数を受信して、現在または将来に技術上周知の任意の数の量子化方法を用いてこのAC係数を量子化するように構成され得る。以下により詳しく説明するように、DC最適化ブロック252は、係数ブロックのDC係数を受信して、DC係数を最適化するように構成され得る。例として、DC最適化ブロック252は、DC係数に基づいて複数の候補を生成して、この複数の候補から1つ以上の基準に従って1つを選択して、最適化されたDC係数を提供するように構成され得る。1つの実施形態では、DC係数を最適化することは、最低のレート歪み費用を有する候補を選択することを含み得る。別の実施形態では、DC係数を最適化することは、所与のブロック集合に対して最低のレート歪み費用を有するDC係数の集合に対応する候補を選択することを含み得る。この最適化は、ラムダなどのラングラジアン費用関数に少なくとも部分的に基づき得る、または、ラムダの逆数、すなわち逆ラムダに少なくとも部分的に基づき得る。ラムダは、例えば、信号の費用(例えば、レート歪み費用)を決定するためのレート倍率であり得る。そのうえ、ラムダは、ビデオ信号に少なくとも部分的に基づいてモード判断ブロック230によって生成され得る、または、リアルタイムで固定化もしくは調整され得る。一部の実施形態では、ラムダは、適応的な様式で(例えば、符号器200の利用可能なリソース、符号化されたビットストリーム、またはビデオ信号に基づいて)調整され得る。
説明されるように、符号器200は、MPEG−2ビデオ符号化規格に従って動作し得る。したがって、MPEG−2ビデオ符号化規格は運動予測および/または補償を用いるため、符号器200は、逆量子化ブロック210、逆変換212、および再構築加算器214を含む帰還ループをさらに含み得る。これらの要素は、符号器200によって実施される符号化プロセスを少なくとも部分的に逆にするように構成される復号器(図示せず)に含まれる要素をミラーリングし得る。くわえて、符号器の帰還ループは、予測ブロック220および復号化ピクチャバッファ218を含み得る。
符号器200の例としての動作では、ビデオ信号(例えば、ベースバンドビデオ信号)は、符号器200に提供され得る。ビデオ信号は、遅延バッファ202およびモード判断ブロック230に提供され得る。減算器204は、遅延バッファ202からビデオ信号を受信して、ビデオ信号から運動予測信号を減算して、剰余信号を生成し得る。剰余信号は、変換206に提供され、DCTなどの順方向変換を用いて処理され得る。説明されるように、変換206は、量子化ブロック250に提供され得る係数ブロックを生成し得るが、量子化ブロック250は、係数ブロックのDC係数を量子化および/または最適化し得る。係数ブロックの量子化は、ラムダまたは逆ラムダに少なくとも部分的に基づき得、量子化された係数は、エントロピー符号器208に提供され、それにより、符号化ビットストリームに符号化され得る。
量子化された係数ブロックは、符号器200の帰還ループにさらに提供され得る。すなわち、量子化された係数ブロックは、それぞれ逆量子化ブロック210、逆変換212、および再構築加算器214で逆量子化され、逆変換され、および加算されて、再構築されたビデオ信号を生成し得る。復号化されたピクチャバッファ218は、再構築されたビデオ信号を受信して、バッファされた再構築ビデオ信号を、モード判断ブロック230および予測ブロック220に提供し得る。再構築されたビデオ信号に少なくとも部分的に基づいて、予測ブロック220は、運動予測信号を加算器204に提供し得る。
したがって、図2の符号器200は、符号化されたビットストリームをビデオ信号に基づいて提供し得るが、この場合、符号化されたビットストリームは、本発明の実施形態に従って最適化されたDC係数を部分的に用いて生成される。符号器200は、半導体技術で動作され、ハードウエア、ソフトウエア、またはこれらの組み合わせで実装され得る。一部の例では、符号器200は、ソフトウエアに実装され得るモード判断ブロック230を例外として、ハードウエアに実装され得る。他の例では、他のブロックもまた、ソフトウエアに実装され得るが、しかしながら、一部の場合、ソフトウエア実装は、リアルタイム動作を達成し得ない。
図3は、本発明の実施形態に従う最適化ブロック300の略ブロック図である。最適化ブロック300は、図2のDC最適化ブロック252を少なくとも部分的に実装するために用いられ得、例えば、MPEG−2、H.264、およびH.HEVC符号化規格のいずれかに準拠し得る。最適化ブロック300は、半導体技術で実装され得、ハードウエア、ソフトウエア、またはこれらの組み合わせで実装され得る。
説明されるように、最適化ブロック300は係数ベクトルのDC係数を受信し、このDC係数の複数の候補を生成し得る。一般に、最適化ブロック300は、DC係数に対して順方向量子化を実施するように動作し得る。この量子化は、例えば、規範的量子化であり得るおよび/またはDC係数を、整数値(例えば、1、2、4、8など)の値で除算することを含み得る。以前の量子化されたDC係数を、現在の量子化されたDC係数から減算して、DC係数差を提供し得る。候補はDC係数差に基づいて生成され得るが、各々の候補は、以前に量子化されたDC係数に加算され、逆量子化され、自乗され、および逆ラムダによって乗算されて、各々の候補の歪み費用を提供し得る。各々の歪み費用は、それぞれのレート費用に加算されて、それぞれのRDスコアを生成し得る。上述したように、別の実施形態では、各々のRDスコアは、それぞれの候補を符号化するレートにラムダを乗算して、そのそれぞれの候補の歪みを加算することによって生成され得る。候補のRDスコアに少なくとも部分的に基づいて、候補が選択されて、最適化されたDC係数として最適化ブロック300から提供され得る。
最適化ブロック300の例としての動作では、係数ブロックのDC係数は最適化ブロック300に、とくに、順方向量子化ブロック302に提供され得る。周知なように、順方向量子化ブロック302は、DC係数を量子化し、一部の実施形態では、符号化規格(例えば、MPEG−2符号化規格)に従っておよび/または量子化パラメータに基づいてDC係数を量子化し得る。このように、量子化された係数は、1つ以上の量子化方法に従って生成され得る。DC係数の量子化は、係数を整数値などの値で除算することを含み得るが、この値の大きさが、DC係数の量子化の精度を決め得る。
量子化されたDC係数は減算器304に提供されるが、ここで、以前のDC係数を受信されたDC係数から減算して、係数差を提供し得る。以前のDC係数は、例えば、レジスタ(図3には図示せず)に記憶され得る、または、外部デバイスから受信され得る。係数差に少なくとも部分的に基づいて、候補生成ブロック350は、複数の候補を生成し得る。説明するように、この複数の候補は、量子化ブロック300がどの候補が最適化されたRDスコアを有するかを決定し得る際に基づくDC係数差の様々な水準に少なくとも部分的に基づいて生成され得る。任意の数の候補が、最適化ブロック300によって同時に考慮され得、少なくとも1つの実施形態では、各々の候補は、異なる差動水準に対応し得る。そのうえ、1つの実施形態では、最大で12の候補が、同時に考慮され得る。
各々の候補のRDスコアを計算するために、量子化ブロック300は、各々の候補のレート費用および歪み費用を計算して、この2つの費用を一緒に合計するように構成され得る。特に、各々の候補は、受信された候補のレートを決定し得るそれぞれのレート費用ブロック314に提供され得る。1つの実施形態では、レート費用ブロックは、レートルックアップテーブルを用いておよび/またはDC係数を符号化して、結果得られる符号化されたDC係数のビットカウントを決定することによって、それぞれのレート費用ブロックを決めるように構成され得る。
各々の候補は、歪み費用を計算するためにさらに用いられ得る。最初に、各々の候補はそれぞれの加算器306に提供され得るが、この加算器はこの候補を以前の量子化されたDC係数差に加算し得る。この候補は、次に、それぞれの逆量子化ブロック308に提供され得るが、このブロックは量子化ブロック302の量子化を逆にし得る。例えば、量子化ブロック302が係数を整数で除算する実施形態では、逆量子化ブロック308は、候補を同じ整数で乗算するように構成され得る。他の実施形態では、逆量子化ブロック308は、量子化ブロック302によって実施される量子化を逆にしない様式で候補を逆量子化するように構成され得る。
いったん候補が逆量子化されると、それを量子化されたDC係数から減算して、この減算の結果を、自乗ブロック310を用いて自乗し得る。自乗された結果に、歪みブロック312を用いて逆ラムダを乗算し、それにより、それぞれの候補の歪み費用を提供し得る。加算器316で、それぞれの候補のレートおよび歪み費用を加算してRDスコアを提供し得るが、このスコアは、次いで最良費用ブロック320に提供され得る。最良費用ブロック320は、各々の候補のRDスコアを受信して候補を選択し、最適化されたDC係数として提供し得る。最良費用ブロック320は、例えば、所与のレートに対する最低のRDスコアおよび/または最低の歪みを有する差動候補を選択し得る、すなわち、以下に説明するように、あるブロック集合に対して最低のレート歪み費用を有するDC係数の集合に対応する候補を選択し得る。
したがって、最適化ブロック300は、最適化されたDC係数を、例えば、図2の変換206などの変換から受信されたDC係数に基づいて提供するために用いられ得る。1つの実施形態では、最適化ブロック300は、ビデオ信号中の各々の成分(例えば、輝度、青色色差(blue−difference chrominance)、および/または赤色色差(red−difference chrominance)の最適化されたDC係数を直列に提供するために用いられ得る。他の実施形態では、複数のDC係数を同時に最適化し得る。例えば、1つの実施形態では、図2のDC最適化ブロック252などのDC最適化ブロックは、各々がビデオ信号成分に対応し得る複数の最適化ブロック300を含み得る。これらの最適化ブロック300の各々は、最適化されたDC係数を同時に提供するため並列に動作するように構成され得る。
そのうえ、複数の最適化ブロック300は、スライスの任意の数のブロックおよび/またはマクロブロックを同時に最適化するために用いられ得る。1つの実施形態では、あらゆるブロック間依存性を克服するために、複数の最適化ブロックを動的プログラミングおよび/またはトレリス構成にしたがって用いて、あるブロック集合に対する最低のレート歪み費用を有するDC係数の集合を同時に発見し得る。こうすることにくわえてまたはこうする代わりに、複数の最適化ブロック300は、動的プログラミングを実装するために、デイジーチェーン構成で配列され得る。一部の例では、DC係数の集合の1つ以上のDC係数は、DC係数の集合がブロックの集合に対するDC係数のあらゆる考えられる組み合わせの最低のRDスコアを有するにもかかわらず、そのそれぞれのブロックの全ての候補のうちの最低のRDスコアを有しないかも知れない。
最適化ブロック300をそれぞれの変換ブロックのDC係数を最適化することに関連して説明されているが、最適化ブロック300は、他の構文要素を最適化するためにもさらに用いられ得ることが当業者には理解されるであろう。すなわち、最適化ブロック300は、例えば、任意の差動符号化された構文要素を含む任意のタイプの構文要素の複数の候補を生成して、次いで、この複数の候補から最低のRDスコアを有する1つを選択するために用いられ得る。例として、最適化ブロック300は、図2のAC量子化ブロック254などのAC量子化ブロックに提供された1つ以上のAC係数を最適化するために用いられ得る。そのうえ、一部の実施形態では、運動ベクトルのレート歪みは、例えば、差動符号化された構文要素を量子化することなくまたはそれから生成された候補を逆量子化することなく、最適化され得る。
最適化ブロック300は、運動ベクトルを最適化するためにさらに用いられ得る。例えば、最適化ブロック300は、MPEG−2規格に従って運動ベクトルのレート歪みを最適化するために用いられ得る。最適化ブロック300をこのように用いることで、例えば、それぞれの運動ベクトル間の差を示す運動ベクトル剰余を伝達するために必要なビットの数および/またはそれぞれの運動ベクトル剰余を符号化するために用いられるビットの数を示す運動符号を削減し得る。同様に、最適化ブロック300はまた、運動ベクトル(例えば、Exp−Golomb符号化された運動ベクトル)および/または量子化パラメータを、H.264符号化規格に従って最適化するためにも用いられ得る。
図4は、本発明の実施形態に従う候補を生成するための方法のフローチャート400である。フローチャート400が示す方法は、図3の候補生成ブロック350によって用いられ得る。少なくとも1つの実施形態では、各々の生成された候補は、候補の配列Candに加算され得るが、いったん全ての候補が生成されると、配列Candに含まれる各々の候補は、候補生成ブロック350によって以下に説明するように考慮され得る。以下説明はDC係数差に基づいて候補を生成することに関してなされるとはいえ、フローチャート400に示す方法は、例えば、運動ベクトルもしくは量子化パラメータに対応する任意の構文要素または構文要素の差の候補を生成するために用いられ得ることが当業者には理解されるであろう。
ステップ405で、係数差が、例えば、図3の加算器304から受信され得る。可変長jが、Huffman符号化、CAVLC、およびCABACなどの現在または将来に技術上周知の任意のエントロピー符号化方法を用いて係数差を表すために必要とされるビットの数に等しい値で初期化され、指数変数iが0に初期化され得る。少なくとも1つの実施形態では、指数変数iは、配列Cand中の位置に対応し得る。ステップ410で、候補生成ブロック350は、jが1を超える値を有するかを決定し得る。すなわち、候補生成ブロック350は、係数差のビット長が1ビットを超えるかを決定し得る。jの値が1を超えない場合、ステップ415で、候補生成ブロック350は、jがゼロの値を有するかを決定し得る。jがゼロに等しければ、ゼロの値を含む候補はステップ435で、候補の配列Candのi番目の位置に追加され得る。配列Candは、次に、ステップ440で、候補生成ブロック350から提供され得る。
jの値がゼロを超える場合、候補がステップ420で生成され得る。この候補は、jの値に等しいビット長を有する二進法の値であり得、すべて「1」をさらに含み、それにより、特定のビット長に対して可能な限り高いビット値を有する候補を提供し得る。例えば、jが4の値を有する場合、候補「1111」が生成され得る。以下にさらに説明されるように、jが1を超える値として初期化される場合、候補をこのように生成することで、ビット長をさらに減少させながらも、以前に生成された候補にできる限り近い2進値を有する候補を提供し得る。これは、例えば、ビットカウントを減少させることなく、増大する歪み費用を有する候補を生成することを回避し得る。
ステップ425で、生成された候補は、配列Candに対して、例えば、この配列のi番目の位置に追加され得るが、ステップ430で、jおよびiの値はそれぞれデクリメントおよびインクリメントされ得る。ステップ415、420、425、および430は、jが0にデクリメントされるまで反復的に繰り返されるが、この場合、ゼロ含む候補は、上述したように、それぞれステップ435および440で配列Candと、候補生成ブロック350から提供された配列とに追加され得る。
jが1を超える値を有するとステップ410で決定された場合、すなわち、受信された係数差のビット長が2ビット以上であれば、ステップ445で、係数差と、1だけインクリメントされた係数差とが、配列Candに候補として追加され得る。ステップ450で、係数差を1だけデクリメントすることでそのビット長が変化するに応じて決定が行われ得る。ビット長が変化しなければ、1だけデクリメントされた係数差を含む候補はステップ455で配列Candに追加され、候補生成ブロック350は、上述したようにステップ430に進み得る。係数差を1だけデクリメントすることでビット長が変化する場合、jはステップ460でデクリメントされ、jの大きさに等しいビット長を有する候補が、上述したようにステップ420で生成され得る。
したがって、複数の候補が候補生成ブロック350によって生成され得るが、生成された候補の各々は、次いで、図3の最適化ブロック300などの最適化ブロックによって評価されて、どの候補が最適化されたレート歪み費用を提供するかを決定し得る。候補は、係数差に基づいたそれぞれの複数の差動水準であり得る。すなわち、説明されるように、候補の差動水準は、例えば、係数差、1だけインクリメントされた係数差、1、0だけデクリメントされた係数差、および/または係数差のビット長未満の全ての可能なビット長に対する可能な限り高い2進値を含み得る。
候補の生成を方法400に関して説明されているが、他の実施形態では、方法400の変更例を含むさらなるおよび/または代替の方法が、候補を生成するために用いられ得る。例えば、1つの実施形態では、方法400はステップ455を省略し、それにより、0の2進値を有する候補を配列Candに追加することを解消し得る。
候補の数は、適応的にさらに決定し得る。1つの実施形態では、候補の数は、特定のマクロブロック中でAC係数を量子化するために用いられる量子化器の規模に依存し得る。量子化器の規模は、例えば、量子化パラメータによって決定され得る。例えば、量子化パラメータはAC係数の精度を決め得、この精度は、候補が係数差から変位し得る最大偏差を決定するために用いられ得る。別の実施形態では、候補の数は、特定の符号化単位(例えば、ブロック、マクロブロック、フレーム)の特徴に依存し得る。この決定で考慮される符号化単位の特徴は、これに限られないが、テクスチャ、明るさ、運動、分散またはこれらのいずれかの組み合わせを含み得る。例として、高い運動コンテンツではより多い歪みが許容され得るが、その結果、係数差からのより大きい偏差を有する候補が評価され得る。
候補の数が適応的に決定される各々の場合において、候補が1つ以上の基準を満たすは、方法400の任意の時点、例えば、ステップ445で決定され得る。候補が、例えば許容可能偏差を満たす場合、この候補は、配列Candに追加され得る。候補が許容可能偏差を満たさない場合、この候補は配列Candには追加されず、したがって、上述したように最適化ブロックによっては評価され得ない。
そのうえ、少なくとも1つの実施形態では、候補の許容数は、図1の符号器100などの符号器、または、符号器と電子通信している1つ以上のデバイスの利用可能なリソースに基づき得る。この決定は、本明細書に説明するあらゆる適応的プロセスを含む適応プロセスの一部として、符号化に先立ってまたは符号化中になされ得る。
図5は、本発明の実施形態に従う媒体送達システムの略図である。媒体送達システム500は、様々な媒体出力部(複数可)504に媒体ソース502を送達するための機構を提供し得る。たった1つの媒体ソース502および媒体出力504を図5に示しているが、任意の数を用い得、本発明の例は、媒体コンテンツを任意の数の媒体出力部に放送するおよび/または別様に送達するために用いられ得ることを理解すべきである。
媒体ソースデータ502は、これに限られないが、ビデオ、オーディオ、データ、またはこれらの組み合わせを含む媒体コンテンツの任意のソースであり得る。媒体ソースデータ502は、カメラ、マイクロフォン、および/または他のキャプチャデバイスを用いてキャプチャされ得る、例えば、オーディオおよび/またはビデオのデータであり得る、または、処理デバイスによって生成もしくは提供され得る。媒体ソースデータ502は、アナログまたはデジタルであり得る。媒体ソースデータ502がアナログデータであるとき、媒体ソースデータ502は、例えば、アナログツーデジタルコンバータ(ADC)を用いてデジタルデータに変換され得る。典型的には、媒体ソースデータ502を伝達するために、あるタイプの圧縮および/または暗号化が望ましいことがあり得る。したがって、これに限られないが、MPEG−2、MPEG−4、H.264、H.HEVC、もしくはこれらの組み合わせ、または他の符号化規格などのビデオ規格に準拠する符号化方法を含む、現在または将来に技術上周知のいずれかの符号化方法を用いて、媒体ソースデータ502を符号化し得る符号器510が提供され得る。符号器510は、図1の符号器100および図2の符号器200を含む本明細書に説明する任意の符号器を用いて実装され得、図4の方法400を実装するためにさらに用いられ得る。
符号化されたデータ512は、衛星514、アンテナ516、および/またはネットワーク518などの通信リンクに提供され得る。ネットワーク518は有線または無線であり得、電気伝送および/または光伝送を用いてさらに通信し得る。アンテナ516は地上アンテナであり得、例えば、従来のAM信号およびFM信号、衛星信号、または技術上周知の他の信号を受信して送信し得る。通信リンクは、符号化されたデータ512を放送し得、一部の例では、符号化されたデータ512を(例えば、再符号化、追加、または符号化されたデータ512から減算することによって)変更して、変更された符号化データ512を放送し得る。通信リンクから提供された符号化データ520は、復号器を含み得るか、またはこれに結合され得る受信機522によって受信され得る。復号器は、符号化されたデータ520を復号化して、図5に示す出力部504で、1つ以上の媒体出力を提供し得る。
受信機522は、これに限られないが、モデム、ルータ、サーバ、セットトップボックス、ラップトップ、デスクトップ、コンピュータ、タブレット、携帯電話などを含む任意の数のデバイスに含まれ得るまたはこれらと通信状態にあり得る。
図5の媒体送達システム500および/または符号器510は、コンテンツ分配業界の様々なセグメントで利用され得る。
図6は、本明細書に説明する符号器を利用し得るビデオ分配システム600の略図である。ビデオ分配システム600は、ビデオ分配業者605を含む。ビデオ分配業者605は、これに限られないが、デジタル衛星ニュース収集システム606、イベント放送607、および遠隔スタジオ608を含み得る。これらのビデオ分配業者605の各々または任意のものは、図5の符号器510などの本明細書に説明する符号器を利用して、媒体ソースデータを符号化して、符号化されたデータを通信リンクに提供し得る。デジタル衛星ニュース収集システム606は、符号化されたデータを衛星602に提供し得る。イベント放送607は、符号化されたデータをアンテナ601に提供し得る。遠隔スタジオ608は、符号化されたデータをネットワーク603上に提供し得る。
プロダクションセグメント610は、コンテンツ発信元612を含み得る。コンテンツ発信元612は、ビデオ分配業者605の任意のものまたは組み合わせから符号化されたデータを受信し得る。コンテンツ発信元612は、受信したコンテンツを利用可能とし得、受信したコンテンツのどれでも編集、組み合わせ、および/または操作して、コンテンツを利用可能とし得る。コンテンツ発信元612は、図5の符号器510などの本明細書に説明する符号器を利用して、符号化されたデータを衛星614(または別の通信リンク)に提供し得る。コンテンツ発信元612は、符号化されたデータをデジタル地上テレビシステム616に対して、ネットワークまたは他の通信リンク上で提供し得る。一部の例では、コンテンツ発信元612は、復号器を利用して、寄稿者(複数可)605から受信されたコンテンツを復号化し得る。コンテンツ発信元612は、次に、データを再復号化して、再復号化されたデータを衛星614に提供し得る。他の例では、コンテンツ発信元612は、受信したデータを復号化せずに、コード変換器を利用して、受信されたデータの復号化形式を変更し得る。
一次分配セグメント620は、デジタル放送システム621、デジタル地上テレビシステム616、および/または顧客システム623を含み得る。デジタル放送システム621は、図5を参照して説明される受信機522などの受信機を含んで、符号化されたデータを衛星614から受信し得る。デジタル地上テレビシステム616は、図5を参照して説明される受信機522などの受信機を含んで、符号化されたデータをコンテンツ発信元612から受信し得る。ケーブルシステム623は、プロダクションセグメント610および/または分配セグメント605から受信され得たまたはされ得なかったそれ自身のコンテンツをホストし得る。例えば、ケーブルシステム623は、それ自身の媒体データ502を、図5を参照して説明されるものとして提供し得る。
デジタル放送システム621は、図5を参照して説明される符号器510などの符号器を含んで、符号化されたデータを衛星625に提供し得る。ケーブルシステム623は、図5を参照して説明される符号器510などの符号器を含んで、符号化されたデータをネットワークまたは他の通信リンク上でケーブルローカルヘッドエンド632に提供し得る。二次分配セグメント630は、例えば、衛星625および/またはケーブルローカルヘッドエンド632を含み得る。
ケーブルローカルヘッドエンド632は、図5を参照して説明される符号器510などの符号器を含んで、符号化されたデータをネットワークまたは他の通信リンク上で、顧客セグメント540中の顧客に提供し得る。衛星625は、信号を顧客セグメント640中の顧客に放送し得る。顧客セグメント640は、コンテンツを復号化し、究極的にはコンテンツをユーザに対して利用可能とするために、受信機522などの受信機と、図5を参照して説明される関連付けられた復号器とを含み得る任意の数のデバイスを含み得る。顧客セグメント640は、セットトップボックス、タブレット、コンピュータ、サーバ、ラップトップ、デスクトップ、携帯電話などのデバイスを含み得る。
したがって、符号化、コード変換、および/または復号化は、ビデオ分配システムのいくつかの時点のうちのいずれかで利用され得る。本発明の実施形態は、これらのセグメントのいずれか、または一部の例では全てで利用され得る。
前述から、本発明の特定の実施形態が例示目的で本明細書に説明されているが、本発明の精神および範囲から逸脱することなく様々な修正がなされ得ることが理解されるであろう。したがって、本発明は、添付の特許請求の範囲を除いて限定されない。

Claims (36)

  1. ビデオ符号器で用いられる最適化ブロックであって、
    それぞれの差動水準に対応する複数の候補を生成するように構成される候補生成ブロックであって、前記複数の候補の各々が、差動符号化された構文要素に少なくとも部分的に基づき、かつそれぞれのレート歪み費用を提供する、候補生成ブロックと、
    前記候補生成ブロックに結合され、前記複数の候補から一候補を基準に従って選択するように構成される最良の費用ブロックと、を備える、最適化ブロック。
  2. 前記基準が、最小のレート歪み費用を含む、請求項1に記載の最適化ブロック。
  3. 前記差動符号化された構文要素を、MPEG−2符号化規格、H.264符号化規格、またはこれらの組み合わせに従って量子化するように構成される順方向量子化ブロックをさらに備える、請求項1に記載の最適化ブロック。
  4. 前記それぞれのレート歪み費用が、ラグランジアン費用関数に少なくとも部分的に基づく、請求項1に記載の最適化ブロック。
  5. 前記複数の候補が、前記差動符号化された構文要素の長さに少なくとも部分的に基づく、請求項1に記載の最適化ブロック。
  6. 前記第1の構文要素が、輝度、青色色差、赤色色差、またはこれらの組み合わせに対応する、請求項1に記載の最適化ブロック。
  7. 前記差動符号化された構文要素が、DC係数を含む、請求項1に記載の最適化ブロック。
  8. 前記候補生成ブロックが、前記複数の候補を適応的に生成するように構成される、請求項1に記載の最適化ブロック。
  9. DC係数を受信して、前記DC係数に少なくとも部分的に基づいて複数の候補を生成するように構成されるDC最適化ブロックであって、前記複数の候補から一候補を基準に従って選択するようにさらに構成される、DC最適化ブロックと、
    複数のAC係数を受信して、前記複数のAC係数を量子化するように構成されるAC量子化ブロックと、を備え、
    前記複数の候補の各々がそれぞれの差動水準に対応する、符号器。
  10. 前記基準が、最小のレート歪み費用を含む、請求項9に記載の符号器。
  11. 前記DC最適化ブロックが、前記DC係数を前記MPEG−2符号化規格に従って量子化するようにさらに構成される、請求項9に記載の符号器。
  12. 前記DC最適化ブロックが、前記DC係数を前記H.264符号化規格に従って量子化するようにさらに構成される、請求項9に記載の符号器。
  13. 前記DC最適化ブロックおよび前記AC量子化ブロックに結合され、前記候補および量子化された複数のAC係数を受信するように構成されるエントロピー符号器であって、前記候補および量子化された複数のAC係数を1つ以上の符号化規格に従って符号化するようにさらに構成される、エントロピー符号器をさらに備える、請求項9に記載の符号器。
  14. 前記DC係数が、輝度係数、青色色差係数、赤色色差係数、またはこれらの組み合わせを含む、請求項9に記載の符号器。
  15. 前記複数の候補のうちの1つが、そのそれぞれのビット長に対する最も高い2進値を含み、前記複数の候補のうちの前記1つの前記ビット長が、前記DC係数のビット長未満である、請求項9に記載の符号器。
  16. 前記係数がイントラ符号化されたマクロブロックに対応する、請求項9に記載の符号器。
  17. 前記複数の候補のうちの1つが前記DC係数を含む、請求項9に記載の符号器。
  18. 前記DC係数ブロックが第1のDC係数ブロックであり、前記DC係数が第1のDC係数であり、前記複数の候補が第1の複数の候補であり、前記第1のDC係数がビデオデータの第1のブロックに対応し、前記符号器が、
    第2のDC係数を受信して、前記第2のDC係数に少なくとも部分的に基づいて第2の複数の係数を生成するように構成される第2のDC係数ブロックであって、前記第2のDC係数がビデオデータの第2のブロックに対応する、第2のDC係数ブロックをさらに備え、
    前記第1のDC係数ブロックが、前記第1および第2の複数の候補に少なくとも部分的に基づいて前記第1の複数の候補のうちの1つを選択するように構成される、請求項9に記載の符号器。
  19. 係数を最適化するための方法であって、
    差動符号化された構文要素を受信することと、
    前記差動符号化された構文要素に少なくとも部分的に基づいて複数の候補を生成することであって、前記複数の候補の各々がそれぞれの差動水準を有する、複数の候補を生成することと、
    前記複数の候補の各々に対するそれぞれのRDスコアを生成することと、
    前記複数の候補のうちの1つを基準に従って選択することと、を含む、方法。
  20. 前記選択することが、最小のRDスコアを有する前記複数の候補のうちの1つを選択することを含む、請求項19に記載の方法。
  21. 前記差動符号化された構文要素がDC係数を含む、請求項19に記載の方法。
  22. 前記複数の候補が、MPEG−2符号化規格、H.264符号化規格、またはこれらの組み合わせに従って生成される、請求項19に記載の方法。
  23. 前記複数の候補の各々に対するそれぞれのRDスコアを前記生成することが、
    前記複数の候補の各々に対する歪み費用を生成することと、
    前記複数の候補の各々に対するレート費用を生成することと、を含む、請求項19に記載の方法。
  24. 前記複数の候補が、前記差動符号化される構文要素の長さに少なくとも部分的に基づく、請求項19に記載の方法。
  25. 前記差動符号化された構文要素が、第1の差動符号化された構文要素であり、前記方法が、
    第2の差動符号化された構文要素を前記第1の差動符号化された構文要素から減算して、係数差を生成することをさらに含む、請求項19に記載の方法。
  26. 各それぞれのRDスコアが、ラグランジアン費用関数の逆数に少なくとも部分的に基づく、請求項19に記載の方法。
  27. 前記複数の候補が、量子化パラメータ、符号化単位の特徴、またはこれらの組み合わせに基づく、請求項19に記載の方法。
  28. 候補を生成するための方法であって、
    差動符号化された構文要素の差を受信することと、
    前記差動符号化された構文要素の差のビット長を決定することと、
    前記差動符号化された構文要素の差の前記長さに少なくとも部分的に基づいて複数の候補を生成することと、
    前記複数の候補に対するそれぞれの複数のレート歪み費用を生成することと、
    前記それぞれの複数のレート歪み費用に少なくとも部分的に基づいて前記複数の候補のうちの1つを選択することと、を含む、方法。
  29. 前記複数の候補のうちの1つが、そのそれぞれのビット長に対する可能な限り高い2進値を含む、請求項28に記載の方法。
  30. 前記複数のレート歪み費用が、ラグランジアン費用関数に少なくとも部分的に基づく、請求項28に記載の方法。
  31. 前記それぞれの複数のレート歪み費用に少なくとも部分的に基づいて前記複数の候補のうちの1つを前記選択することが、
    輝度成分に対応する係数を選択することを含む、請求項28に記載の方法。
  32. 前記複数の候補が第1の複数の候補であり、前記方法が、
    クロミナンス成分に対応する係数に基づいて第2の複数の候補を生成することであって、前記第1および第2の複数の候補が同時に生成される、生成することをさらに含む、請求項31に記載の方法。
  33. 前記差動符号化された構文要素がDC係数を含む、請求項28に記載の方法。
  34. 前記それぞれの複数のレート歪み費用の各々が、MPEG−2符号化規格に少なくとも部分的に基づく、請求項28に記載の方法。
  35. 前記それぞれの複数のレート歪み費用の各々が、H.264符号化規格に少なくとも部分的に基づく、請求項28に記載の方法。
  36. 前記複数の候補が、テクスチャ、明るさ、運動、分散、またはこれらの組み合わせに少なくとも部分的に基づく、請求項28に記載の方法。
JP2015530171A 2012-09-26 2013-09-25 構文要素のレート歪みを最適化するための装置および方法 Pending JP2015530832A (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US13/627,776 US10230956B2 (en) 2012-09-26 2012-09-26 Apparatuses and methods for optimizing rate-distortion of syntax elements
US13/627,776 2012-09-26
PCT/US2013/061635 WO2014052425A1 (en) 2012-09-26 2013-09-25 Apparatuses and methods for optimizing rate-distortion of syntax elements

Publications (1)

Publication Number Publication Date
JP2015530832A true JP2015530832A (ja) 2015-10-15

Family

ID=50338841

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015530171A Pending JP2015530832A (ja) 2012-09-26 2013-09-25 構文要素のレート歪みを最適化するための装置および方法

Country Status (5)

Country Link
US (1) US10230956B2 (ja)
EP (1) EP2901686A4 (ja)
JP (1) JP2015530832A (ja)
CA (1) CA2884825C (ja)
WO (1) WO2014052425A1 (ja)

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10277907B2 (en) 2012-10-25 2019-04-30 Integrated Device Technology, Inc. Rate-distortion optimizers and optimization techniques including joint optimization of multiple color components
US11178407B2 (en) * 2012-11-19 2021-11-16 Texas Instruments Incorporated Adaptive coding unit (CU) partitioning based on image statistics
RU2628133C2 (ru) * 2013-01-07 2017-08-15 Телефонактиеболагет Л М Эрикссон (Пабл) Кодирование и декодирование слайсов в изображениях видеопотока
US9967559B1 (en) 2013-02-11 2018-05-08 Google Llc Motion vector dependent spatial transformation in video coding
US9544597B1 (en) 2013-02-11 2017-01-10 Google Inc. Hybrid transform in video encoding and decoding
US9674530B1 (en) 2013-04-30 2017-06-06 Google Inc. Hybrid transforms in video coding
US9565451B1 (en) 2014-10-31 2017-02-07 Google Inc. Prediction dependent transform coding
JP6476900B2 (ja) * 2015-01-21 2019-03-06 富士通株式会社 動画像符号化装置、動画像符号化方法及び動画像符号化用コンピュータプログラム
US9769499B2 (en) 2015-08-11 2017-09-19 Google Inc. Super-transform video coding
US10277905B2 (en) 2015-09-14 2019-04-30 Google Llc Transform selection for non-baseband signal coding
US9807423B1 (en) 2015-11-24 2017-10-31 Google Inc. Hybrid transform scheme for video coding
FR3047379A1 (fr) * 2016-01-29 2017-08-04 Orange Procede de codage et decodage de donnees, dispositif de codage et decodage de donnees et programmes d'ordinateur correspondants
US11122297B2 (en) 2019-05-03 2021-09-14 Google Llc Using border-aligned block functions for image compression
WO2021188527A1 (en) 2020-03-17 2021-09-23 Bytedance Inc. Using video parameter set in video coding
EP4186239A1 (en) * 2020-11-25 2023-05-31 Hyphy USA, Inc. Encoder and decoder circuits for the transmission of video media using spread spectrum direct sequence modulation

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011176483A (ja) * 2010-02-23 2011-09-08 Oki Electric Industry Co Ltd 量子化装置、プログラム及び方法、並びに、動画像符号化装置

Family Cites Families (73)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR0128881B1 (ko) 1994-04-30 1998-04-10 배순훈 디지틀화상복호화장치
US5778192A (en) * 1995-10-26 1998-07-07 Motorola, Inc. Method and device for optimal bit allocation between different sources of information in digital video compression
US6088392A (en) * 1997-05-30 2000-07-11 Lucent Technologies Inc. Bit rate coder for differential quantization
US6501860B1 (en) * 1998-01-19 2002-12-31 Canon Kabushiki Kaisha Digital signal coding and decoding based on subbands
EP0938235A1 (en) * 1998-02-20 1999-08-25 Canon Kabushiki Kaisha Digital signal coding and decoding
US6519361B1 (en) 1999-11-19 2003-02-11 Xerox Corporation Optimization of color transformation matrix with all positive coefficients
US7146055B2 (en) 2000-05-05 2006-12-05 Hewlett-Packard Development Company, L.P. Image processing decompression apparatus and method of using same different scaling algorithms simultaneously
JP4129788B2 (ja) 2002-10-09 2008-08-06 ソニー株式会社 画像データ処理装置および方法、記録媒体、並びにプログラム
US7042943B2 (en) * 2002-11-08 2006-05-09 Apple Computer, Inc. Method and apparatus for control of rate-distortion tradeoff by mode selection in video encoders
US7194035B2 (en) 2003-01-08 2007-03-20 Apple Computer, Inc. Method and apparatus for improved coding mode selection
JP2006523991A (ja) * 2003-04-18 2006-10-19 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ レート歪みをビデオ符号化に最適化したデータ分割をパラメトリック・レート歪みモデルを用いて行うシステム及び方法
EP1513350A1 (en) 2003-09-03 2005-03-09 Thomson Licensing S.A. Process and arrangement for encoding video pictures
KR101196429B1 (ko) 2004-03-12 2012-11-01 삼성전자주식회사 동영상 트랜스코딩 방법 및 그 장치, 이에 사용되는움직임 벡터 보간방법
WO2006007527A2 (en) * 2004-07-01 2006-01-19 Qualcomm Incorporated Method and apparatus for using frame rate up conversion techniques in scalable video coding
FR2872975A1 (fr) 2004-07-06 2006-01-13 Thomson Licensing Sa Procede et dispositif pour choisir un mode de codage
US7570827B2 (en) * 2004-07-14 2009-08-04 Slipstream Data Inc. Method, system and computer program product for optimization of data compression with cost function
KR100627329B1 (ko) 2004-08-19 2006-09-25 전자부품연구원 H.264 비디오 코덱을 위한 적응형 움직임 예측 및 모드결정 장치 및 그 방법
WO2006096612A2 (en) 2005-03-04 2006-09-14 The Trustees Of Columbia University In The City Of New York System and method for motion estimation and mode decision for low-complexity h.264 decoder
US7830961B2 (en) 2005-06-21 2010-11-09 Seiko Epson Corporation Motion estimation and inter-mode prediction
KR20070011063A (ko) 2005-07-18 2007-01-24 홍승미 압출절단기
US8446954B2 (en) 2005-09-27 2013-05-21 Qualcomm Incorporated Mode selection techniques for multimedia coding
CN103297769B (zh) 2006-01-13 2016-09-07 Ge视频压缩有限责任公司 使用自适应色彩空间变换的画面编码
KR100728031B1 (ko) 2006-01-23 2007-06-14 삼성전자주식회사 가변 블록 크기 움직임 예측을 위한 부호화 모드 결정 방법및 장치
US8208548B2 (en) 2006-02-09 2012-06-26 Qualcomm Incorporated Video encoding
US8155195B2 (en) 2006-04-07 2012-04-10 Microsoft Corporation Switching distortion metrics during motion estimation
KR100794855B1 (ko) * 2006-05-15 2008-01-14 경희대학교 산학협력단 이미지 정보 변이값의 예측 방법과 이를 이용한 다시점영상의 부호화/복호화 방법 및 장치
KR100829169B1 (ko) 2006-07-07 2008-05-13 주식회사 리버트론 H.264 코딩의 압축모드 예측 장치 및 방법
US20080056354A1 (en) 2006-08-29 2008-03-06 Microsoft Corporation Transcoding Hierarchical B-Frames with Rate-Distortion Optimization in the DCT Domain
US8135063B2 (en) 2006-09-08 2012-03-13 Mediatek Inc. Rate control method with frame-layer bit allocation and video encoder
KR100773761B1 (ko) 2006-09-14 2007-11-09 한국전자통신연구원 동영상 부호화 장치 및 방법
US20080126278A1 (en) 2006-11-29 2008-05-29 Alexander Bronstein Parallel processing motion estimation for H.264 video codec
US8331448B2 (en) 2006-12-22 2012-12-11 Qualcomm Incorporated Systems and methods for efficient spatial intra predictabilty determination (or assessment)
US8711926B2 (en) 2007-02-08 2014-04-29 Qualcomm Incorporated Distortion estimation for quantized data
US20080232468A1 (en) 2007-03-21 2008-09-25 Mediatek Inc. Method and apparatus for adaptive gop structure determination
KR100898176B1 (ko) 2007-06-12 2009-05-19 한국전자통신연구원 비디오 인코딩을 위한 인터 모드 결정 방법
TWI386069B (zh) 2007-08-10 2013-02-11 Univ Nat Cheng Kung 資料集編碼系統及方法以及程式產品
KR100905059B1 (ko) 2007-08-16 2009-06-30 한국전자통신연구원 동영상 부호화에 있어서 비트 발생 가능성 예측을 이용한블록 모드 결정 방법 및 장치
US8780988B2 (en) 2008-02-28 2014-07-15 Vixs Systems, Inc. Hierarchical video analysis-based real-time perceptual video coding
US9967590B2 (en) 2008-04-10 2018-05-08 Qualcomm Incorporated Rate-distortion defined interpolation for video coding based on fixed filter or adaptive filter
US8902972B2 (en) * 2008-04-11 2014-12-02 Qualcomm Incorporated Rate-distortion quantization for context-adaptive variable length coding (CAVLC)
JP2010002265A (ja) 2008-06-19 2010-01-07 Fujitsu Ltd レーダ装置、測定方法、及び測定プログラム
US8625681B2 (en) 2008-07-09 2014-01-07 Intel Corporation Rate-distortion cost reducing video encoding techniques
KR101271512B1 (ko) 2008-09-16 2013-06-05 돌비 레버러토리즈 라이쎈싱 코오포레이션 적응형 비디오 인코더 제어 방법
US9479786B2 (en) 2008-09-26 2016-10-25 Dolby Laboratories Licensing Corporation Complexity allocation for video and image coding applications
FR2939593B1 (fr) 2008-12-09 2010-12-31 Canon Kk Procede et dispositif de codage video
US20100238997A1 (en) * 2009-03-17 2010-09-23 Yang En-Hui Method and system for optimized video coding
US8665964B2 (en) 2009-06-30 2014-03-04 Qualcomm Incorporated Video coding based on first order prediction and pre-defined second order prediction mode
US8160136B2 (en) 2009-08-07 2012-04-17 Texas Instruments Incorporated Probabilistic bit-rate and rate-distortion cost estimation for video coding
US20120201475A1 (en) 2009-10-05 2012-08-09 I.C.V.T. Ltd. Method and system for processing an image
CN102045560B (zh) 2009-10-23 2013-08-07 华为技术有限公司 一种视频编解码方法及设备
EP2514206A1 (en) 2009-12-15 2012-10-24 Thomson Licensing Method and apparatus for bi-directional prediction within p-slices
US8532169B2 (en) 2009-12-23 2013-09-10 General Instrument Corporation Rate control for two-pass encoder using adaptive quantization parameters
CN103250412A (zh) 2010-02-02 2013-08-14 数码士有限公司 用于率失真优化的图像编码/解码方法和用于执行该方法的装置
TWI421798B (zh) 2010-04-27 2014-01-01 Novatek Microelectronics Corp 影像壓縮之位元率控制方法及其裝置
KR20120000593A (ko) 2010-06-27 2012-01-04 전정호 이륜 보드
FR2963190B1 (fr) 2010-07-23 2013-04-26 Canon Kk Procede et dispositif de codage d'une sequence d'images
US8600159B2 (en) 2010-08-31 2013-12-03 Apple Inc. Color converting images
CN106851320B (zh) 2010-11-04 2020-06-02 Ge视频压缩有限责任公司 数字存储介质、解码比特流的方法
US9288496B2 (en) 2010-12-03 2016-03-15 Qualcomm Incorporated Video coding using function-based scan order for transform coefficients
US8553769B2 (en) * 2011-01-19 2013-10-08 Blackberry Limited Method and device for improved multi-layer data compression
KR20120084168A (ko) 2011-01-19 2012-07-27 삼성전자주식회사 비디오 인코딩 모드 선택 방법 및 이를 수행하는 비디오 인코딩 장치
EP2721826A4 (en) 2011-06-14 2015-05-06 Zhou Wang METHOD AND SYSTEM FOR OPTIMIZATION OF FLOW-DISTORTION BASED ON STRUCTURAL SIMILARITY FOR PERCEPTUAL VIDEO CODING
US9781449B2 (en) 2011-10-06 2017-10-03 Synopsys, Inc. Rate distortion optimization in image and video encoding
US9161046B2 (en) 2011-10-25 2015-10-13 Qualcomm Incorporated Determining quantization parameters for deblocking filtering for video coding
TWI461066B (zh) 2011-11-03 2014-11-11 Ind Tech Res Inst 彈性調整估算搜尋範圍的移動估算方法及視差估算方法
US9124895B2 (en) 2011-11-04 2015-09-01 Qualcomm Incorporated Video coding with network abstraction layer units that include multiple encoded picture partitions
US20130176390A1 (en) 2012-01-06 2013-07-11 Qualcomm Incorporated Multi-hypothesis disparity vector construction in 3d video coding with depth
JP6787667B2 (ja) 2012-09-21 2020-11-18 ノキア テクノロジーズ オサケユイチア ビデオコーディングのための方法と装置
US10277907B2 (en) 2012-10-25 2019-04-30 Integrated Device Technology, Inc. Rate-distortion optimizers and optimization techniques including joint optimization of multiple color components
JP6290924B2 (ja) 2013-01-07 2018-03-07 ノキア テクノロジーズ オサケユイチア ビデオ・コーディングおよびデコーディングのための方法と装置
US20140219331A1 (en) 2013-02-06 2014-08-07 Magnum Semiconductor, Inc. Apparatuses and methods for performing joint rate-distortion optimization of prediction mode
US20150085922A1 (en) 2013-09-25 2015-03-26 Magnum Semiconductor, Inc. Apparatuses and methods for reducing rate and distortion costs during encoding by modulating a lagrangian parameter
US20150373326A1 (en) 2014-06-19 2015-12-24 Magnum Semiconductor, Inc. Apparatuses and methods for parameter selection during rate-distortion optimization

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011176483A (ja) * 2010-02-23 2011-09-08 Oki Electric Industry Co Ltd 量子化装置、プログラム及び方法、並びに、動画像符号化装置

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
JPN6016009092; 安田浩(外1名)監訳: 「デジタル放送・インターネットのための情報圧縮技術」 初版, 19990610, 第165〜167頁, 共立出版株式会社 *
JPN6016009094; 亀山渉(外1名)監修: 「インプレス標準教科書シリーズ IPTV時代のデジタル放送教科書」 初版, 20100401, 第102〜109,114,120,121,128〜133頁, 株式会社インプレスR&D *
JPN6016009096; 民谷一郎(外5名): '「1チップMPEG2ビデオエンコーダLSI muPD61050」' NEC技報 Vol.52, No.3, 19990325, 第85〜88頁, 日本電気株式会社 *

Also Published As

Publication number Publication date
WO2014052425A1 (en) 2014-04-03
US20140086314A1 (en) 2014-03-27
EP2901686A4 (en) 2016-06-01
CA2884825C (en) 2019-09-17
EP2901686A1 (en) 2015-08-05
US10230956B2 (en) 2019-03-12
CA2884825A1 (en) 2014-04-03

Similar Documents

Publication Publication Date Title
US10230956B2 (en) Apparatuses and methods for optimizing rate-distortion of syntax elements
US9794575B2 (en) Apparatuses and methods for optimizing rate-distortion costs in video encoding
US20140219331A1 (en) Apparatuses and methods for performing joint rate-distortion optimization of prediction mode
US10277907B2 (en) Rate-distortion optimizers and optimization techniques including joint optimization of multiple color components
US20170310999A1 (en) Method and apparatus for rate-distortion optimized coefficient quantization including sign data hiding
US10432931B2 (en) Method for time-dependent visual quality encoding for broadcast services
US20150172660A1 (en) Apparatuses and methods for providing optimized quantization weight matrices
US10021409B2 (en) Apparatuses and methods for estimating bitstream bit counts
US20160007023A1 (en) Apparatuses and methods for adjusting coefficients using dead zones
WO2015195409A1 (en) Apparatuses and methods for parameter selection during rate-distortion optimization
US10264261B2 (en) Entropy encoding initialization for a block dependent upon an unencoded block
US9491475B2 (en) Apparatuses and methods for providing quantized coefficients for video encoding
US20150256832A1 (en) Apparatuses and methods for performing video quantization rate distortion calculations
US20150085922A1 (en) Apparatuses and methods for reducing rate and distortion costs during encoding by modulating a lagrangian parameter
US9392286B2 (en) Apparatuses and methods for providing quantized coefficients for video encoding
KR101375302B1 (ko) 멀티미디어 데이터의 처리 방법 및 그 장치

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20160204

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20160308

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20160606

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20161018