JP5611601B2 - 第2のパスのビデオ符号化における効率的なビデオブロックのモード変更 - Google Patents

第2のパスのビデオ符号化における効率的なビデオブロックのモード変更 Download PDF

Info

Publication number
JP5611601B2
JP5611601B2 JP2009552812A JP2009552812A JP5611601B2 JP 5611601 B2 JP5611601 B2 JP 5611601B2 JP 2009552812 A JP2009552812 A JP 2009552812A JP 2009552812 A JP2009552812 A JP 2009552812A JP 5611601 B2 JP5611601 B2 JP 5611601B2
Authority
JP
Japan
Prior art keywords
mode
video
video block
encoding
pass
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2009552812A
Other languages
English (en)
Other versions
JP2010520714A (ja
Inventor
チェン、ペイソン
バーミディパティ、パニクマー
サブラマニアン、シタラマン・ガナパシー
ロハッギ、アミット
オグズ、セイフラー・ハリト
スワジー、スコット・ティー.
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qualcomm Inc
Original Assignee
Qualcomm Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qualcomm Inc filed Critical Qualcomm Inc
Publication of JP2010520714A publication Critical patent/JP2010520714A/ja
Application granted granted Critical
Publication of JP5611601B2 publication Critical patent/JP5611601B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/189Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
    • H04N19/192Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding the adaptation method, adaptation tool or adaptation type being iterative or recursive
    • H04N19/194Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding the adaptation method, adaptation tool or adaptation type being iterative or recursive involving only two passes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/109Selection of coding mode or of prediction mode among a plurality of temporal predictive coding modes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/147Data rate or code amount at the encoder output according to rate distortion criteria
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/15Data rate or code amount at the encoder output by monitoring actual compressed data size at the memory before deciding storage at the transmission buffer
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/164Feedback from the receiver or from the transmission channel
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/189Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
    • H04N19/19Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding using optimisation based on Lagrange multipliers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Description

関連出願
本願は、2007年3月2日に出願された米国仮出願第60/892,804号の利益に権利を主張しており、その全内容は参照によってここに組み込まれる。
この開示はディジタルビデオ符号化、より具体的には、第1のパスがビデオブロックを符号化するために使用され、第2のパスがビットレートの制約を満たすか又は他の目的を達成するためにその符号化を改善する、マルチパスビデオ符号化に関する。
ディジタルビデオの能力は、ディジタルテレビジョン、ディジタル直接ブロードキャストシステム、無線通信デバイス、無線ブロードキャストシステム、パーソナルディジタルアシスタント(personal digital assistant, PDA)、ラップトップ又はデスクトップコンピュータ、ディジタルカメラ、ディジタルレコーディングデバイス、ビデオゲームデバイス、ビデオゲームコンソール、セルラ又は衛星無線電話などを含む広範囲のデバイスに組み込むことができる。ディジタルビデオデバイスは、ディジタルビデオをより効率的に送信及び受信するために、MPEG−2、MPEG−4、又はH.264/MPEG−4、パート10(Part 10)、アドバンスドビデオコーディング(Advanced Video Coding, AVC)のようなビデオ圧縮技術を実施する。ビデオ圧縮技術は、ビデオシーケンスに固有の冗長を低減又は除去するために空間及び時間予測を行う。
ビデオ符号化において、ビデオ圧縮は多くの場合に空間予測、動き推定及び動き補償を含む。イントラ符号化(intra-coding)は、所与のビデオフレーム内のビデオブロック間の空間冗長を低減又は除去するために空間予測に依存する。インター符号化(inter-coding)は、ビデオシーケンス中の連続するビデオフレームのビデオブロック間の時間冗長を低減又は除去するために時間予測に依存する。インター符号化のために、ビデオ符号器は、2つ以上の隣接フレーム間で対応するビデオブロックの動きを追跡するために動き推定を行う。動き推定は、1つ以上の参照フレーム中の対応する予測ビデオブロックに対するビデオブロックの変位分を示す動きベクトルを生成する。動き補償は、参照フレーム又はスライスから予測ビデオブロックを生成するために動きベクトルを使用する。動き補償の後で、符号化された元のビデオブロックから予測ビデオブロックを差し引くことによって残差情報(residual information)(例えば、残差ビデオブロック)が生成される。ビデオ符号器は通常、残差ブロックの通信に関連するビットレートをさらに低減するために、変換、量子化及び変換係数の符号化処理を適用する。
ビデオ符号化は複数のパスを使用することがある。マルチパスビデオ符号化において、第1のビデオ符号化パスはビデオブロックを符号化するために使用され、第2のビデオ符号化パスはその符号化を変更して改善する。マルチパスビデオ符号化は、ビデオ符号化に関連するビットレートを調整するために使用され得る。従来、第2のパスのビデオ符号化は第1のビデオ符号化パスの符号化工程の全てを再び行い得るが、異なるレベルの量子化を適用してもよい。しかしながら第2の符号化パス中にビデオブロックの全てを完全に符号化し直すと、計算が増加する。
概して、この開示はマルチパスビデオ符号化のシナリオにおける第2のパスのビデオ符号化のための技術を記載している。第2の符号化パスは、例えば、ビットレートの制約を満たし、未使用の帯域幅を利用し、及び/又は他の目的を達成するために、第1のパスにおいて行われた符号化を改善する。この開示によると、第2のパス中に符号化される幾つかのビデオブロックのための符号化モードは、第1のパスにおいてそのようなビデオブロックに使用された符号化モードに対して変更され得る。しかしながら、モード変更されたビデオブロックについて動き情報は変更しない。一例として、双方向予測(bi-directional predictive, B)スライス(又はフレーム)は、いわゆる「スキップ(skipped)」モードといわゆる「直接(direct)」モードとでビデオブロックの符号化をサポートし得る。スキップ及び直接モードの両者において、動き情報は、例えば、近隣ビデオブロックの動き情報に基づいて、復号器において同じやり方で導き出される。しかしながら、スキップモードと直接モードとの違いは、直接モードのビデオブロックが残差情報を含んでいる一方で、スキップモードのビデオブロックが残差情報を含んでいないことである。
この開示によると、第2のパスの符号化は、幾つかのブロックについて動き情報の定義のしかたを変更せずに、そのようなブロックのためのビデオブロックモードを、例えばスキップ又は直接モード間で変更し得る。例えば、ビデオブロックは、復号器における動き情報の導き出し方を変更せずに直接モードからスキップモード又はスキップモードから直接モードに変更され得る。スキップモードから直接モードに変更された任意のビデオブロックに対する残差情報が加えられてもよく、直接モードからスキップモードに変更された任意のビデオブロックに対する残差情報が削除されてもよい。予測(predictive, P)スライス又はフレームについて、スキップモードからインター16×16モードへの第2のパスのモード変更も、この開示の態様から利益を得ることができる。第2のパスの符号化技術は量子化パラメータの調整をさらに含んでもよく、モード変更により、このような量子化パラメータの調整は、モード変更せずに達成されたであろう第2の符号化パスの符号化の改善よりも非常に大きな効果を有することができる。
一例において、この開示は、第1の符号化パスにおいてビデオブロックを符号化し、前記第1の符号化パスは、前記ビデオブロックのための動き情報を定義する前記ビデオブロックのためのビデオ符号化モードを選択することと、第2の符号化パスにおいて前記ビデオブロックを符号化し、前記第2の符号化パスは、前記ビデオブロックに関連する1つ以上の量子化パラメータを調整して、前記調整された量子化パラメータに基づいて、前記ビデオブロックに関連する前記ビデオ符号化モードの少なくとも幾つかを変更し、前記変更されたビデオ符号化モードは前記動き情報を変更しないこととを備える、ビデオ符号化の方法を提供する。
別の例において、この開示は、第1の符号化パスにおいてビデオブロックを符号化し、前記第1の符号化パスは、前記ビデオブロックのための動き情報を定義する前記ビデオブロックのためのビデオ符号化モードを選択し、第2の符号化パスにおいて前記ビデオブロックを符号化し、前記第2の符号化パスは、前記ビデオブロックに関連する1つ以上の量子化パラメータを調整して、前記調整された量子化パラメータに基づいて、前記ビデオブロックに関連する前記ビデオ符号化モードの少なくとも幾つかを変更し、前記変更されたビデオ符号化モードは前記動き情報を変更しない、ビデオ符号器を備える装置を提供する。
別の例において、この開示は、第1の符号化パスにおいてビデオブロックを符号化する手段を備え、前記第1の符号化パスにおいてビデオブロックを符号化する手段は、前記ビデオブロックのための動き情報を定義する前記ビデオブロックのためのビデオ符号化モードを選択する手段を含み、第2の符号化パスにおいて前記ビデオブロックを符号化する手段を備え、前記第2の符号化パスにおいて前記ビデオブロックを符号化する手段は、前記ビデオブロックに関連する1つ以上の量子化パラメータを調整する手段と、前記調整された量子化パラメータに基づいて、前記ビデオブロックに関連する前記ビデオ符号化モードの少なくとも幾つかを変更する手段とを含み、前記変更されたビデオ符号化モードは前記動き情報を変更しない、デバイスを提供する。
この開示に記載されている技術は、ハードウェア、ソフトウェア、ファームウェア、又はその任意の組合せにおいて実施され得る。ソフトウェアにおいて実施される場合に、ソフトウェアは、マイクロプロセッサ、特定用途向け集積回路(application specific integrated circuit, ASIC)、フィールドプログラマブルゲートアレイ(field programmable gate array, FPGA)又はディジタル信号プロセッサ(digital signal processor, DSP)のような1つ以上のプロセッサにおいて実行され得る。この技術を実行するソフトウェアは、最初にコンピュータ読み出し可能媒体に記憶され、プロセッサにロードされて実行され得る。
従って、この開示は、プロセッサにおいて実行されたときに、前記プロセッサに、第1の符号化パスにおいてビデオブロックを符号化させる命令を備え、前記第1の符号化パスは、前記ビデオブロックのための動き情報を定義する前記ビデオブロックのためのビデオ符号化モードを選択し、第2の符号化パスにおいて前記ビデオブロックを符号化させる命令を備え、前記第2の符号化パスは、前記ビデオブロックに関連する1つ以上の量子化パラメータを調整して、前記調整された量子化パラメータに基づいて、前記ビデオブロックに関連する前記ビデオ符号化モードの少なくとも幾つかを変更し、前記変更されたビデオ符号化モードは前記動き情報を変更しない、コンピュータ読み出し可能媒体をさらに考慮している。
幾つかの場合において、コンピュータ読み出し可能媒体は、製造者に販売され及び/又はビデオ符号化デバイスにおいて使用され得るコンピュータプログラム製品の一部を形成し得る。コンピュータプログラム製品はコンピュータ読み出し可能媒体を含むことがあり、幾つかの場合において、パッケージ化されたもの(packaging material)をさらに含むことがある。
開示の1つ以上の態様の詳細は、添付の図面と以下の説明とに示されている。この開示に記載されている技術の他の特徴、目的及び効果は、説明と図面とから、及び請求項から明らかになるであろう。
この開示に従ってビデオ符号化及び復号システムを示す例示的なブロック図。 この開示に従ってマルチパス符号化技術を示すフローダイアグラム。 スキップモードから直接モードに変更される双方向予測(B)スライスのビデオブロックの概念図。 Bスライスのビデオブロックがスキップモードから直接モードに変更される第2のパスの符号化技術を示すフローダイアグラム。 直接モードからスキップモードに変更されるBスライスのビデオブロックの概念図。 Bスライスのビデオブロックが直接モードからスキップモードに変更される第2のパスの符号化技術を示すフローダイアグラム。 スキップモードからインター16×16モードに変更される予測(P)スライスのビデオブロックの概念図。 Pスライスのビデオブロックがスキップモードからインター16×16モードに変更される第2のパスの符号化技術を示すフローダイアグラム。
この開示は、マルチパスビデオ符号化のシナリオにおける第2のパスのビデオ符号化のための技術を記載している。第2のビデオ符号化パスは、ビットレートの制約を満たし、未使用の帯域幅を利用し、又は他の目的を達成するために、第1のパスで行われたビデオ符号化を改善する。この開示において、第2の符号化パスは概して、第1の符号化パスの後の任意の後続の符号化パスを指す。従って、「第2の符号化パス」との語句における「第2」との用語は、第2のパスが第1の符号化パスの後で行われることを除いて、他の符号化パスに対する順序関係を示唆していない。第2の符号化パスは、ここに記載されているように、実際には、第1の符号化パスの後の第3又は第4の符号化パスのような任意の後続の符号化パスであり得る。
この開示によると、第2の符号化パスにおいて幾つかのビデオブロックに使用される符号化モードは、第1のパスにおいて使用された符号化モードに対して変更され得る。しかしながら、モード変更したビデオブロックについて、動き情報は同じままである(すなわち、動き情報は復号器において同じやり方で導き出される)。幾つかの場合において、モード変更したビデオブロックについて、動き情報は変わらないので、第2の符号化パスは、第1の符号化パス中に行われた動きに基づく計算を再使用し得る。
マルチパスビデオ符号化において、第1のパスは、ビデオブロックを符号化するために使用され、第2のパスは、第1のパス中に行われた符号化を改善する。幾つかの場合において、第2のパスの符号化は情報を完全に符号化し直すことがある。しかしながら、効率化及び単純化のために、第2のパスの符号化が、第1のパスで生成された情報の一部を採用して、第1のパス中に生成された符号化された情報の他の部分を改善することがより望ましいかもしれない。例えば、伝搬効果(propagation effect)が取り込まれないことを確実にするために、第1のパスにおいてビデオブロックのために定義された動きベクトル情報が、動きベクトルを計算し直さずに第2のパスにおいて同じビデオブロックに割り当てられ得る。しかしながら、第2のパスに使用される量子化パラメータは、第1のパスに使用された量子化パラメータに対して変更してもよい。
この開示によると、第2のパスの符号化はビデオブロックモードを、例えばスキップ又は直接モード間で変更し得る。直接モードとスキップモードとは、ビデオブロックの動き情報を定義するビデオ符号化モードの2つの例である。とくに、直接モードのビデオブロックとスキップモードのビデオブロックとは、動き情報を含むように符号化されるのではなく、むしろこれらのモードの場合には、動き情報は、近隣ビデオブロックの動き情報に基づいて、復号器において導き出される。一例として、この開示は、第2のパスの符号化においてスキップ及び直接モード間で変更する能力を提案している。例えば、スキップから直接モードへの切り換えは、量子化パラメータの変更が第2のパスの符号化における非常に大きな品質向上効果を確実に与えることを助け得る。一方、直接からスキップモードへの切り換えは、第2のパスにおいて完全に符号化し直すことなくビットレートを低減する簡単なやり方を提供し得る。
スキップモードから直接モードに変更された任意のビデオブロックに対する残差情報が加えられてもよく、直接モードからスキップモードに変更された任意のビデオブロックに対する残差情報が削除されてもよい。これらのモード変更と併せて、量子化パラメータを変更すると、モード変更せずに達成できたであろう第2の符号化パスにおける符号化の向上又は調整をより著しく達成することができる。この開示によって考慮されている特定のモード変更は、動きベクトルにおける変化のために伝搬するビデオフレームにおける変化のような伝搬効果を取り込まない。その理由は、直接及びスキップモードは同様のやり方で、すなわち近隣ビデオブロックの動きベクトルに基づいて、動きベクトルを割り当てるからである。第2の符号化パス中に完全に符号化し直す技術のような従来技術と比較して、計算の複雑さも第2の符号化パスにおいて低減され得る。
様々なタイプのビデオ符号化の単位(例えば、ビデオブロックのフレーム又はビデオブロックのスライス)は、そのタイプのビデオ符号化の単位のビデオブロックを符号化するために使用することができる様々な符号化モードを有し得る。例えばITU H.264では、イントラ(I)フレーム又はスライス、予測(P)フレーム又はスライス、及び双方向予測(B)フレーム又はスライスがある。ビデオ符号化の単位はフレーム又はスライスレベルで定義され得るが、単純化のために、以下の開示では単にIスライス、Pスライス及びBスライスと称する。しかしながら、この開示の技術は、ビデオ符号化の単位がフレームレベルで又は異なるやり方で定義される場合にも適用することができる。
Iスライスは、空間予測とイントラ符号化とによって符号化されるビデオブロックを有する。この場合に、ビデオブロックは、空間冗長を利用するために、同じスライスの他のビデオブロックと比較される。Iスライスのビデオブロックについては、同じスライス内の予測ブロックが、残差情報を定義するために使用される。残差情報は、符号化されるビデオブロックと同じスライス内の予測ブロックとの差を示す。Iスライスは、予測のために他のスライスの情報に依存しないので、一般に(例えば、I、P及びBスライスの中で)最小量の圧縮を示すが、他のスライスよりも本質的によりロバストである。
Pスライスは、時間冗長を利用するために、前に符号化されたスライスのビデオブロックに対する動き推定と動き補償とによって符号化されるビデオブロックを有する。Pスライスのビデオブロックについては、前に符号化されたスライス中の予測ブロックが、残差情報を定義するために使用され得る。繰り返すが、残差情報は、Pスライスの場合は時間冗長を利用するために前に符号化されたスライス内に存在する予測ブロックと、符号化されるビデオブロックとの差を示す情報を指す。
Bスライスは、前に符号化された及び/又は後で符号化されるスライス中に存在するビデオブロックに対する動き推定と動き補償とによって符号化されるビデオブロックを有する。Bスライスのビデオブロックについては、(ビデオシーケンスの正又は負の何れかの時間方向における)異なるスライス中の予測ブロックが、残差情報を定義するために使用され得る。
Iスライスは、他のP又はBスライスのビデオブロックのインター予測のための参照としての役割をし得る。従って、BスライスのうちPのビデオブロックは、Iスライスのビデオブロックを後方参照する動き情報を定義し得る。同様に、Pスライスは、他のPスライス又はBスライスのインター予測のための参照としての役割をし得る。しかしながら、Bスライスは通常参照として使用されないが、ITU H.264に対する幾つかの改善は、幾つかのBスライスが参照としての役割をすることを可能にした。
各タイプのスライス(例えば、Iスライス、Pスライス又はBスライス)は、異なるビデオブロックを符号化するために使用することができる幾つかの可能なモードを定義し得る。例えば、Iスライスのビデオブロックはイントラ16×16、イントラ16×8、イントラ8×16、イントラ8×8、イントラ8×4、イントラ4×8、イントラ4×4などのようなイントラモードを定義し得る。Pスライスのビデオブロックはイントラモードを使用し、さらにインター16×16、インター16×8、インター8×16、インター8×8、インター8×4、インター4×8、インター4×4などのような様々なインターモードを定義し得る。さらに、Pスライスはいわゆる「スキップモード」を定義し得る。スキップモードで符号化されたビデオブロックは、近隣ビデオブロックの動きベクトルに基づいて、動きベクトルを定義し、残差情報を含まない。復号器において、スキップモードのビデオブロックの動きベクトルは、近隣ビデオブロックの動きベクトルに基づいて導き出される。従って、スキップモードのビデオブロックについて、動きベクトル情報を符号化又は伝送する必要はない。
BスライスのビデオブロックはI及びPスライスの様々なモードをサポートし、動きベクトルはビデオシーケンス中の前又は後のスライスを指し得る。Pスライスのビデオブロックのように、Bスライスのビデオブロックはスキップモードを定義し得る。さらに、Bスライスは、「直接モード」と称される別のモードもサポートする。直接モードは幾つかの点でスキップモードに類似しているが、直接モードで符号化されたビデオブロックは残差情報を含む。とくに、直接モードのビデオブロックが、近隣ビデオブロックの動きベクトルに基づいて、動きベクトルを定義するとき、直接モードで符号化されたビデオブロックは任意の動きベクトルを欠くことがある。しかしながら、直接モードのビデオブロックは、動きベクトルによって識別されるビデオブロックと符号化されるビデオブロックとの差を示す残差情報を含んでいる。
この開示によると、第2のパスの符号化は、ビデオブロックのために定義された動き情報(例えば、動きベクトル)を変更せずに、スキップ又は直接モード間でBスライスのビデオブロックのモードを変更し得る。スキップモードから直接モードに変更された任意のビデオブロックに対する残差情報が加えられてもよく、直接モードからスキップモードに変更された任意のビデオブロックに対する残差情報が削除されてもよい。同様の技術が、スキップモードからインター16×16モードに変更するPスライスのビデオブロックにも適用され得る。Pスライスは直接モードをサポートできないので、インター16×16モードの使用は、スキップモードのビデオブロックのための動きベクトルの計算に基づいて導き出される割り当て動きベクトルを用いて、直接モードの代わりに使用され得る。この場合に、(第1の符号化パス中に選択された)スキップモードにおけるPスライスのビデオブロックのために定義された動きベクトルが、第2のパスにおいて16×16モードのビデオブロックに割り当てられる。次に残差情報が、予測ビデオブロックと符号化されるブロックとの差として生成される。この場合に、ビデオブロックはインター16×16モードのブロックとして定義され得るが、その動きベクトルは実際には、第1の符号化パスのスキップモードによって定義された動きベクトルとして計算されている。符号器は、第1の符号化パスのスキップモードによって定義された動きベクトルを、インター16×16モードにおける第2のパスの動きベクトルとして割り当てるだけである。インター16×16モードでは、Pスライスのビデオブロックに残差情報を含むことができる。
符号化に使用される量子化パラメータは、第1の符号化パスに対して第2の符号化パスにおいて調整され得る。しかしながら、通常、スキップモードのビデオブロックは残差情報を欠いているので、(より良い品質を与えるべき)量子化パラメータの低減は、とくにBスライスにあまり著しい効果を与えないことがある。Bスライスにおいてスキップモードを直接モードに変更することによって、量子化パラメータを低減すると、従来の符号化技術に比べてビデオブロックに相当により著しい効果を達成することができる。それは、量子化パラメータの変更によって残差情報における変化が現れるからである。残差情報は直接モードのビデオブロックには含まれているが、スキップモードには含まれていないので、このような残差情報に対する量子化パラメータの変更の効果をより良く利用するために、モード変更が必要とされる。同時に、直接モードのビデオブロックとスキップモードのビデオブロックとは動きベクトルを同様に定義しているので、これらの特定のモード変更は、動き情報の変化によるミスマッチ又は望ましくない伝搬効果をもたらさないであろう。
図1は、ビデオ符号化及び復号システム10を示すブロック図である。図1に示されているように、システム10は、通信チャネル15を介して受信デバイス6に符号化されたビデオを送信するソースデバイス2を含んでいる。ソースデバイス2はビデオソース11、ビデオ符号器12及び変調器/送信器14を含み得る。受信デバイス6は受信器/復調器16、ビデオ復号器18及びディスプレイデバイス20を含み得る。システム10は、ここに記載されているように、2パス符号化技術を適用するように構成され得る。2パス符号化技術では、第2のパスにおいて量子化パラメータの変更とモード変更とがビデオブロックに対して行われるが、動きベクトル情報は変更されない。
図1の例では、通信チャネル15は、無線周波数(radio frequency, RF)スペクトル又は1つ以上の物理的伝送路のような任意の無線又は有線通信媒体、あるいは無線及び有線媒体の任意の組合せを備え得る。通信チャネル15は、ローカルエリアネットワーク、ワイドエリアネットワーク、又はインターネットのようなグローバルネットワークなどのような、パケットベースのネットワークの一部を形成し得る。通信チャネル15は一般に、ソースデバイス2から受信デバイス6にビデオデータを送信するための、任意の適切な通信媒体、又は異なる通信媒体の集まりを表わす。
ソースデバイス2は、受信デバイス6に送信するために、符号化されたビデオデータを生成する。しかしながら、幾つかの場合において、デバイス2、6は実質的に対称的に動作し得る。例えば、デバイス2、6の各々はビデオ符号化及び復号コンポーネントを含み得る。従って、システム10は、例えばビデオのストリーミング、ビデオのブロードキャスティング又はテレビ電話のために、ビデオデバイス2、6間における一方向又は双方向のビデオ送信をサポートし得る。
ソースデバイス2のビデオソース11は、ビデオカメラのようなビデオキャプチャデバイス、前に取得したビデオを収めたビデオアーカイブ、又はビデオコンテンツプロバイダからのビデオ供給を含み得る。別の代案として、ビデオソース11は、コンピュータグラフィックスベースのデータ、例えばソースビデオ、又はライブビデオとコンピュータで生成されたビデオとの組合せを生成し得る。幾つかの場合において、ビデオソース11がビデオカメラである場合に、ソースデバイス2と受信デバイス6とは、いわゆるカメラ付き電話又はテレビ電話を形成し得る。各場合において、取得した、前に取得した又はコンピュータで生成されたビデオは、ビデオソースデバイス2から変調器/送信器14、通信チャネル15及び受信器/復調器16を介してビデオ受信デバイス6のビデオ復号器18に送信するために、ビデオ符号器12によって符号化され得る。ビデオ符号器12は、この開示のマルチパス符号化技術をサポートするために第1のパスの符号器22と第2のパスの符号器24とを含む。受信デバイス6は、ビデオデータを受信して復号すると、ユーザに復号されたビデオデータを表示するためにディスプレイデバイス20を使用する。ディスプレイデバイス20は、陰極線管、液晶ディスプレイ(liquid crystal display, LCD)、プラズマディスプレイ、有機発光ダイオード(organic light emitting diode, OLED)ディスプレイ、又は別のタイプのディスプレイデバイスのような様々なディスプレイデバイスの何れかを備え得る。
幾つかの場合において、ビデオ符号器12とビデオ復号器18とは、空間、時間及び/又は信号対雑音比(signal-to-noise ratio, SNR)のスケーラビリティのためにスケーラブルビデオコーディング(scalable video coding, SVC)をサポートするように構成され得るが、この開示の技術はSVCに制限されない。幾つかの態様において、ビデオ符号器12とビデオ復号器18とは、SVCのために細粒度のSNRスケーラビリティ(fine granularity SNR scalability, FGS)の符号化をサポートするように構成され得る。符号器12と復号器18とは、基本レイヤと1つ以上のスケーラブルな拡張レイヤとの符号化、送信及び復号をサポートすることによって、様々な程度のスケーラビリティをサポートし得る。SVCにおいて、基本レイヤは、ベースラインレベルの品質を有するビデオデータを運ぶ。1つ以上の拡張レイヤは、より高レベルの空間、時間及び/又はSNRをサポートするために追加のデータを運ぶ。基本レイヤは、拡張レイヤの送信よりも確実に送信され得る。例えば、変調信号の最も信頼性の高い部分が、基本レイヤを送信するために使用され得る一方で、変調信号の信頼性の劣る部分は、拡張レイヤを送信するために使用され得る。しかしながら、SVC方式の異なるレイヤは他の多くのやり方で定義され得る。
ビデオ符号器12とビデオ復号器18とは、MPEG−2、MPEG−4、ITU−T H.263、又はITU−T H.264/MPEG−4、パート10、アドバンスドビデオコーディング(AVC)のようなビデオ圧縮標準に従って動作し得る。図2には示されていないが、幾つかの態様において、ビデオ符号器12とビデオ復号器18とは各々、オーディオ符号器と復号器とにそれぞれ統合されてもよく、共通データストリーム又は個別データストリーム中のオーディオとビデオとの両者の符号化を扱うために、適切なMUX−DEMUXユニット、又は他のハードウェア及びソフトウェアを含んでもよい。適宜に、MUX−DEMUXユニットは、ITU H.223マルチプレクサプロトコル、又は他のプロトコル、例えばユーザデータグラムプロトコル(user datagram protocol, UDP)に準拠し得る。
H.264/MPEG−4(AVC)標準は、合同ビデオチーム(Joint Video Team, JVT)として知られている共同提携関係の成果としてISO/IECのムービングピクチャ エキスパートグループ(Moving Picture Experts Group, MPEG)と共にITU−Tのビデオコーディング エキスパートグループ(Video Coding Experts Group, VCEG)によって策定された。幾つかの態様において、この開示に記載されている技術は、一般にH.264標準に準拠するデバイスに適用され得る。H.264標準は、2005年3月のITU−T研究会による、全般的なオーディオビジュアルサービスのためのITU−T勧告のH.264、アドバンスドビデオコーディングに記載されており、ここではH.264標準、H.264規格、あるいはH.264/AVC標準又は規格と称され得る。この技術は他の標準又はビデオ符号化プロトコルにも適用され得る。
ビデオのブロードキャスティングに使用される場合に、この開示に記載されている技術は、技術標準TIA−1099(「FLO」規格)として発行される「Forward Link Only Air Interface Specification for Terrestrial Mobile Multimedia Multicast(地上モバイルマルチメディアマルチキャストのための順方向リンク専用エアインターフェース規格)」である順方向リンク専用(Forward Link Only, FLO)エアインターフェース規格を使用して地上モバイルマルチメディアマルチキャスト(terrestrial mobile multimedia multicast, TM3)システムにおいてリアルタイムのビデオサービスを配信するために拡張型H.264のビデオ符号化に適用され得る。すなわち、通信チャネル15は、FLO規格などに従って無線ビデオ情報をブロードキャストするために使用される無線情報チャネルを備え得る。FLO規格は、ビットストリームのシンタックス及びセマンティクスとFLOエアインターフェースに適した復号プロセスとを定義する例を含む。その代わりに、ビデオは、DVB−H(ディジタルビデオブロードキャスト−ハンドヘルド)、ISDB−T(統合サービスディジタルブロードキャスト−地上)、又はDMB(ディジタルメディアブロードキャスト)のような他の標準に従ってブロードキャストされてもよい。従って、ソースデバイス2はモバイル無線端末、ビデオストリーミングサーバ又はビデオブロードキャストサーバであり得る。しかしながら、この開示に記載されている技術は特定のタイプのブロードキャスト、マルチキャスト又はポイント ツー ポイントシステムに制限されない。ブロードキャストの場合に、ソースデバイス2は、各々が図1の受信デバイス6に類似し得る複数の受信デバイスに幾つかのチャネルのビデオデータをブロードキャストし得る。
他の例において、変調器/送信器14、通信チャネル15及び受信器/復調器16は、イーサネット(登録商標)、電話(例えば、POTS)、ケーブル、電力線及び光ファイバシステムの1つ以上を含む任意の有線又は無線通信システム、及び/又は符号分割多元接続(CDMA又はCDMA2000)通信システム、周波数分割多元接続(frequency division multiple access, FDMA)システム、直交周波数分割多重(orthogonal frequency division multiple, OFDM)接続システム、時分割多元接続(time division multiple access, TDMA)システム、例えばGSM(Global System for Mobile Communication)、GPRS(General packet Radio Service)、又はEDGE(enhanced data GSM environment)、TETRA(Terrestrial Trunked Radio)移動電話システム、広帯域符号分割多重接続(wideband code division multiple access, WCDMA)システム、高データレート1xEV−DO(First generation Evolution Data Only)又は1xEV−DOゴールドマルチキャストシステム、IEEE 802.11システム、MediaFLO(登録商標)システム、DMBシステム、DVB−Hシステム、あるいは2つ以上のデバイス間のデータ通信のための別の方式の1つ以上を備える無線システムに従って通信するように構成され得る。
ビデオ符号器12とビデオ復号器18とは各々、1つ以上のマイクロプロセッサ、ディジタル信号プロセッサ(DSP)、特定用途向け集積回路(ASIC)、フィールドプログラマブルゲートアレイ(FPGA)、ディスクリートな論理、ソフトウェア、ハードウェア、ファームウェア又はその任意の組合せとして実施され得る。ビデオ符号器12とビデオ復号器18との各々が1つ以上の符号器又は復号器に含まれていても、その両者がそれぞれの移動デバイス、加入者デバイス、同報通信デバイス、サーバなどにおいて、結合された符号器/復号器(combined encoder/decoder, CODEC)の一部として統合されていてもよい。さらに、ソースデバイス2と受信デバイス6とは各々、無線通信をサポートするために十分な無線周波数(RF)の無線コンポーネントとアンテナとを含めて、符号化されたビデオの送信及び受信のための適切な変調、復調、周波数変換、フィルタリング、及び増幅器のコンポーネントを適宜に含み得る。しかしながら、説明し易くするために、このようなコンポーネントは、図2の受信デバイス6の受信器/復調器16及びソースデバイス2の変調器/送信器14としてまとめられている。変調器/送信器14及び受信器/復調器16は各々、別々の又は統合されたコンポーネントを備え得る。
ビデオシーケンスは一連のビデオフレームを含む。ビデオ符号器12は、ビデオデータを符号化するために個々のビデオフレーム内の画素ブロックに対して動作する。ビデオブロックは固定又は可変サイズを有し、指定された符号化標準に従ってサイズが異なり得る。幾つかの場合において、各ビデオフレームは符号化の単位であるが、他の場合において、各ビデオフレームは、符号化の単位を形成する一連のスライスに分割され得る。各スライスは一連のマクロブロックを含み、マクロブロックはサブブロックに構成され得る。一例として、ITU−T H.264標準は、イントラ予測をルマ成分については16×16又は4×4及びクロマ成分については8×8のような様々なブロックサイズで、並びにインター予測をルマ成分については16×16、16×8、8×16、8×8、8×4、4×8、4×4及びクロマ成分については対応するスケールサイズのような様々なブロックサイズでサポートする。
より小さなビデオブロックはより良い解像度を提供することができ、より高レベルの詳細を含んでいるビデオフレーム内の場所に使用され得る。一般に、マクロブロック(macroblock, MB)と様々なサブブロックとは、ビデオブロックとみなされ得る。さらに、スライスは、MB及び/又はサブブロックのような一連のビデオブロックとみなされ得る。なお、各スライスはビデオフレームの個別に復号可能な単位であり得る。
イントラ又はインターベースの予測符号化の後で、追加の符号化技術が、送信されたビットストリームに適用され得る。これらの追加の符号化技術は、(離散コサイン変換DCT又はH.264/AVCにおいて使用される4×4又は8×8の整数変換のような)変換技術と、(変換係数の可変長符号化のような)変換係数の符号化とを含み得る。変換係数のブロックはビデオブロックと称され得る。言い換えると、「ビデオブロック」との用語は、情報の領域にかかわらずビデオデータのブロックを指す。従って、ビデオブロックは画素領域又は変換係数領域であり得る。
ビデオ符号器12は第1のパスの符号器22と第2のパスの符号器24とを含み、これらは別々のコンポーネント又はプロセスであってもよく、あるいは共通のコンポーネント又はプロセスに統合されていてもよい。第1のパスの符号器22は、ビデオシーケンスの様々なフレーム又はスライスのビデオブロックを符号化するために第1の符号化パスを行う。次に第2のパスの符号器22は、第1のパス中に行われた符号化を改善する。とくに、効率化及び単純化のために、第2のパスの符号器24は、第1のパスにおいて生成された情報の一部を採用して、第1のパス中に生成された符号化された情報の他の部分を改善する。例えば、第1のパスにおいてインター符号化されたビデオブロックのために定義された動き情報(例えば、動きベクトル)は、伝搬エラーが取り込まれないことを確実にするために、動き情報を計算し直さずに、第2のパスにおいて同じビデオブロックに割り当てられ得る。しかしながら、第2のパスに使用される量子化パラメータは、第1のパスに使用された量子化パラメータに対して変わることがある。
この開示によると、第2のパスの符号器24は、動き情報を変更せずに、あるいはこのような動き情報が復号器18又は受信デバイス6において導き出されるように、ビデオブロックモードを、例えばスキップ又は直接モード間で変更し得る。スキップモードから直接モードに変更された任意のビデオブロックに対する残差情報が加えられてもよく、直接モードからスキップモードに変更された任意のビデオブロックに対する残差情報が削除されてもよい。これらのモード変更と共に、量子化パラメータを変更すると、モード変更せずに達成できたであろう第2の符号化パスにおける符号化の向上又は調整をより著しく達成することができる。直接及びスキップモードは、同様のやり方で、すなわち近隣ビデオブロックの動きベクトルに基づいて、動きベクトルを割り当てるので、この開示により考慮されている特定のモード変更は伝搬効果を取り込まない。
図2は、この開示に従ってビデオ符号化技術を示すフローダイアグラムである。図2に示されているように、第1のパスの符号器22は第1の符号化パスにおいてビデオブロックを符号化する(31)。第1の符号化パス中に、第1のパスの符号器22は様々なビデオブロックのための量子化パラメータを定義し、量子化パラメータに基づいて、符号化モードを選択し得る。量子化パラメータは、符号化に使用される量子化レベルを定義し得る。例えば、より小さい量子化パラメータは、より大きい量子化パラメータよりも高品質と低圧縮とをもたらす。第1のパスにおいて使用される符号化モードは、選択された量子化パラメータによって決まり得る。例えば、ラグランジュ乗数(λ)はλ=2−(QP)又はλ=e−(QP)として定義され得る。なお、「e」は自然対数関数の基数(例えば、e=2.718281828459)を表わし、QPは選択された量子化パラメータを表わす。従って、QPに対する調整が、ラグランジュ乗数をスケールするために使用され得る。ラグランジュ乗数(λ)の異なる値は異なるモード選択をもたらし得る。このように、量子化パラメータに基づいて、符号化モードを選択することができる。
適切な符号化モードを選択すると、第1のパスの符号器22は選択された符号化モードに従ってビデオブロックを符号化する。例えば、イントラ符号化モードがビデオブロックのために選択されると、第1のパスの符号器22は、ビデオブロックを符号化するために空間推定とイントラ符号化とを行う。インター符号化モードがビデオブロックのために選択されると、第1のパスの符号器22は、ビデオブロックを符号化するために動き推定予測と動き補償とを行う。直接符号化モードがビデオブロックのために選択されると、第1のパスの符号器22は、近隣ビデオブロックの動きベクトルに基づいて、そのビデオブロックのための動きベクトルを決定し、ビデオブロックを符号化するために残差情報を生成する。この場合に、直接モードを使用して符号化されたビデオブロックについて、動きベクトル情報は、近隣ビデオブロックの動きベクトルに基づいて、復号器において導き出すことができるので、それを符号化する必要はない。スキップ符号化モードがビデオブロックのために選択されると、第1のパスの符号器22は動き又は残差情報を符号化しない。直接モードを使用して符号化されたビデオブロックのように、スキップモードを使用して符号化されたビデオブロックについて、動きベクトル情報は、近隣ビデオブロックの動きベクトルに基づいて、復号器において導き出すことができる。従って、直接モードによって符号化されたビデオブロックと、スキップモードによって符号化されたビデオブロックとの唯一の違いは、直接モードによって符号化されたビデオブロックは残差情報を含み、一方でスキップモードによって符号化されたビデオブロックは残差情報を欠いているということである。
ビデオブロックが第1のパスにおいて符号化されると(31)、第2のパスの符号器24は第2の符号化パスに対する量子化パラメータを調整する(32)。この場合に、第1の符号化パスで生成されたデータ量が利用可能な帯域幅に対して過剰であるならば、第2のパスにおいて量子化を増加しデータを低減するために、量子化パラメータを大きくしてもよい。その代わりに、第1の符号化パスで生成されたデータ量が利用可能な帯域幅に対して少ないならば、第2のパスにおいて量子化を低減しデータを増加するために、量子化パラメータを小さくしてもよい。
さらに、第2のパスの符号器24は、1つ以上のビデオブロックのために符号化モードを変更する(33)。例えば、以下でより詳しく記載されるように、スキップビデオブロックは、(Bスライスのために)直接ビデオブロック又は(Pスライスのために)インター16×16ビデオブロックに変更され、従って動きベクトルを変更せずにこのようなビデオブロックに対する残差情報を含むことができる。この場合に、量子化パラメータの変更と共にモード変更すると、量子化パラメータの変更のみで達成されたであろう第2のパスの符号化における品質向上よりも有益であり得る。同時に、変更されたモードは動きベクトルの計算に同じやり方を使用するので、モード変更はミスマッチも伝搬効果も取り込まないであろう。例えば、1つのビデオブロックの動きベクトルが変更され、そのビデオブロックが異なるビデオブロックの符号化のために参照ブロックとしてさらに使用されるときに、伝搬効果が現れ得る。この場合に、第1のブロックの動きベクトルの変更は、第2のビデオブロックに影響を与え得る。第1の(参照)ビデオブロックの動きベクトルがXであったと仮定して、第2のビデオブロックが符号化されたかもしれない。第2のビデオブロックが予測参照として第1のビデオブロックに依存する限り、動きベクトルがYに変更されると、それは第1のビデオブロックだけでなく、第2のビデオブロックにも影響を与え得る。このような効果は、ここでは伝搬効果、伝搬エラー又はミスマッチと称され得る。
より多くのデータ圧縮が必要とされる場合に、(Bスライスのための)直接モードのビデオブロックはスキップモードのビデオブロックに変更され得る。これは、このようなビデオブロックに対する残差情報を削除して、ビデオ符号化に必要なデータ量を低減する。しかしながら、これは、希望のビットレートを達成するために必要であり得る品質も低減し得る。希望のビットレートはサービスプロバイダによって設定されるか、サービス品質レベルによって設定されるか、物理的な帯域幅の制約によって設定されるか、又は一般的に任意のやり方で設定され得る。何れの場合においても、第2のパスの符号器24は、ビデオブロックのモードを指定する情報を、直接からスキップに変更して、直接ビデオブロックを符号化するために第1の符号化パス中に生成された残差情報を削除するだけである。
品質向上が要求され、余分な帯域幅がある場合に、(Bスライスのための)スキップモードのビデオブロックは直接モードのビデオブロックに変更され得る。この場合に、残差情報がこのようなビデオブロックのために生成されて含められる。これはビデオ符号化に必要なデータ量を増加し、量子化パラメータの低減に基づいて、量子化パラメータの調整のみを用いて達成できたであろう品質向上よりも非常に大きな品質向上を可能にする。この場合に、第2のパスの符号器24は、ビデオブロックのモードを指定する情報を、直接からスキップに変更して、直接ビデオブロックを符号化するために必要な残差情報を生成するだけである。
調整された量子化パラメータと変更されたモードとを使用して、第2のパスの符号器24は、第2のパスにおけるビデオブロックを符号化する(34)。繰り返すが、これは、ビットレートの制約を満たすか、未使用の帯域幅を利用するか、又は他の目標を達成するために、第1のパスで行われたビデオ符号化を改善する。第2のパスの符号器24は、希望のビットレートの増加又は低減を達成することができるように量子化パラメータの調整とモード変更とについての効果のバランスをまとめてとるために、量子化パラメータの調整(32)、モード変更(33)及び第2のパスの符号化(34)を共に行い得る。変調器/送信器14は、物理レイヤの変調方式に従って符号化された情報を調整して、通信チャネル15によって受信デバイス6に符号化情報を送信することができる(35)。
図3は、スキップモードのマクロブロック38から直接モードのマクロブロック39に変更されるBスライスのビデオブロックの概念図である。図4は、Bスライスのビデオブロックがスキップモードから直接モードに変更される第2のパスの符号化技術を示すフローダイアグラムである。スキップモードのマクロブロック38から直接モードのマクロブロック39に所与のビデオブロックを変換するために、第2のパスの符号器24は、直接モードの所与のビデオブロックに対する残差情報を生成する。スキップマクロブロックと直接マクロブロックとは、(近隣マクロブロックの動き情報に基づいて)同じやり方で復号器において動き情報を導き出すので、スキップから直接モードへの変更は動き推定を含む必要がない。符号化モードを指定する情報は、単にモード変更を反映するために変更され、直接モードのマクロブロックに関連する残差情報が生成される。
より具体的には、図4に示されているように、第2のパスの符号器24は、符号化されるビデオブロックのために新たな量子化パラメータ(QP)を選択する(41)。この場合に、新たなQPは、第1の符号化パス中にビデオブロックの符号化に使用されたものよりも小さくてもよく、より少ない量子化とより良い解像度とをもたらし得る。新たなQPを使用して、第2のパスの符号器24は新たなラグランジュ乗数を計算する(42)。ラグランジュ乗数は、例えば、λ=2−(QP)又はλ=e−(QP)として計算され得る。なお、「e」は自然対数関数の基数を表わし(例えば、e=2.718281828459)、QPは選択された量子化パラメータを表わす。従って、上述の式に従ってラグランジュ乗数をスケールするために、QPに対する調整を使用することができる。ラグランジュ乗数(λ)の異なる値は異なるモード選択をもたらし得る。
スケールされたラグランジュ乗数に基づいて、第2のパスの符号器24は、1つ以上のスキップマクロブロックを直接マクロブロックに変換する(43)。具体的には、費用関数をラグランジュ乗数値に基づいて計算してもよく、符号化レート及び/又は歪みを考慮して直接マクロブロックが有利である場合に、スキップマクロブロックを直接マクロブロックに替えてもよい。例えば、スキップモードから直接モードへの変換は、ラグランジュ乗数によって重み付けされるレート−歪み(rate-distortion, R-D)の費用に基づき得る。スキップモードを直接モードに変換する代わりのもう1つの簡単なやり方では、各スキップマクロブロックの残差を量子化して、量子化後に非ゼロ係数がある場合に、それを直接マクロブロックと宣言する。1つ以上のスキップマクロブロックを直接マクロブロックに変換した後で、第2のパスの符号器24は、変換されたマクロブロックに対する残差情報を符号化する(44)。具体的には、第2のパスの符号器24は、近隣ビデオブロックの動きベクトルに基づいて、動きベクトルを計算し、動きベクトルによって識別された予測ブロックを生成し、予測ブロックと直接マクロブロックとして符号化されたブロックとの差を示す残差情報を符号化し得る。しかしながら、動きベクトル情報は、復号器において生成することができるので、符号化ビットストリームから除いてもよい。
図5は、直接モードのマクロブロック58からスキップモードのマクロブロック59に変更されるBスライスのビデオブロックの概念図である。図6は、Bスライスのビデオブロックが直接モードからスキップモードに変更される第2のパスの符号化技術を示すフローダイアグラムである。直接モードのマクロブロック58からスキップモードのマクロブロック59に所与のビデオブロックを変換するために、第2のパスの符号器24は基本的にモードを変更して、スキップモードにおける所与のビデオブロックに対する残差情報を削除する。
繰り返すが、スキップマクロブロックと直接マクロブロックとは、(近隣マクロブロックの動き情報に基づいて)同じやり方で復号器において動き情報を導き出すので、直接モードからスキップモードへの変更は動き推定を含む必要はない。符号化モードを指定する情報は、単にモード変更を反映するために変更され、直接モードのマクロブロックに関連する残差情報が廃棄される。
図6に示されているように、第2のパスの符号器24は、符号化されるビデオブロックに対する新たな量子化パラメータ(QP)を選択する(61)。この場合に、新たなQPは、第1の符号化パス中にビデオブロックの符号化に使用されたものよりも大きくてもよく、より多くの量子化とより低い品質とをもたらし得る。新たなQPを使用して、第2のパスの符号器24は、例えば、上述の式の1つを使用してラグランジュ乗数をスケールすることによって、新たなラグランジュ乗数を計算する(62)。ラグランジュ乗数の異なる値(λ)は異なるモード選択をもたらし得る。
スケールされたラグランジュ乗数に基づいて、第2のパスの符号器24は、1つ以上の直接マクロブロックをスキップマクロブロックに変換する(63)。費用関数をラグランジュ乗数値に基づいて計算してもよく、スキップマクロブロックが費用を下げる場合に、直接マクロブロックをスキップマクロブロックに替えるべきである。その代わりに、残差情報を欠いた(又は残差情報の閾値レベルに足りない)直接マクロブロックはそのままスキップマクロブロックとして宣言されてもよい。第2のパスの符号器24は、変換されたマクロブロックに対する残差情報を削除する(64)。
図7は、スキップモードのマクロブロック78からインター16×16のマクロブロック79に変更されるPスライスのビデオブロックの概念図である。図8は、Pスライスのビデオブロックがスキップモードからインター16×16モードに変更される第2のパス符号化技術を示すフローダイアグラムである。Bスライスと異なり、Pスライスは直接モードをサポートすることができない。しかしながら、この場合に、Pスライスのためのスキップモードからインター16×16モードへのモード変更は、Bスライスにおけるスキップモードから直接モードへのモード変更と同様の効果を与えるように修正することができる。
スキップモードのマクロブロック78からインター16×16のマクロブロック79に所与のビデオブロックを変換するために、第2のパスの符号器24は、スキップモードのビデオブロックからインターモードのビデオブロックに所与のビデオブロックを変更して、スキップモードのビデオブロックのための動きベクトルの計算に基づいて、インターモードのビデオブロックに動きベクトルを割り当てて、インターモードにおける所与のビデオブロックに対する残差情報を生成する。
より具体的には、図8に示されているように、第2のパスの符号器24は、符号化されるビデオブロックに対する新たな量子化パラメータ(QP)を選択する(81)。この場合に、新たなQPは、第1の符号化パス中にビデオブロックの符号化に使用されたものよりも小さくてもよく、より少ない量子化とより良い品質とをもたらし得る。新たなQPを使用して、第2のパスの符号器24は新たなラグランジュ乗数を計算する(82)。繰り返すが、ラグランジュ乗数は、例えばλ=2−(QP)又はλ=e−(QP)として計算され得る。なお、「e」は自然対数関数の基数を表わし(例えば、e=2.718281828459)、QPは選択された量子化パラメータを表わす。最小費用のモード選択を助けるために、ラグランジュ乗数値に基づいて、費用関数を計算してもよい。新たなQPは上述の式に従ってラグランジュ乗数をスケールし、スケールされたラグランジュ乗数は符号化モードを選択するために使用され、その符号化モードは第1の符号化パスのものと異なる場合と異ならない場合とがある。
スケールされたラグランジュ乗数に基づいて、第2のパスの符号器24は、1つ以上のスキップマクロブロックをインター16×16マクロブロックに変換する(83)。費用関数をラグランジュ乗数値に基づいて計算してもよく、インター16×16マクロブロックが費用を下げる場合に、スキップマクロブロックをインター16×16マクロブロックに替えるべきである。例えば、スキップモードからインター16×16モードへの変換は、ラグランジュ乗数によって重み付けされたレート−歪み(R−D)の費用に基づき得る。その代わりに、スキップモードをインター16×16モードに変換するもう1つの簡単なやり方では、各スキップマクロブロックの残差を量子化し、量子化後に非ゼロ係数がある場合に、それをインター16×16マクロブロックと宣言する。第2のパスの符号器24は、対応するスキップマクロブロックの動きベクトルに基づいて、変換されたインター16×16マクロブロックに動き情報(例えば、動きベクトル)を割り当てる。言い換えると、第2のパスの符号器24はマクロブロックをインター16×16モードで符号化されたと示すが、動きベクトルは、スキップモードによって定義された元の動きベクトルと実際には同じものである。予測ブロックを識別するために動きベクトルを使用して、第2のパスの符号器24は、変換されたインター16×16マクロブロックに対する残差情報を生成して符号化する。
第2のパスの符号器24が、スキップマクロブロックのみに通常使用される計算を使用して、インター16×16モードのマクロブロックのための動きベクトルを計算しても、使用された符号化方式は復号器に分からないので、図8の技術は(例えば、ITU H.264に)準拠する標準を維持する。従って、復号器はインター16×16モードのマクロブロックを復号するだけであり、動きベクトルが符号器によってどのように計算されたかを問題にしないであろう。
ここに記載された技術は、ハードウェア、ソフトウェア、ファームウェア、又はその任意の組合せで実施され得る。モジュール又はコンポーネントとして記載された特徴は、統合された論理デバイスにおいて一緒に、又はディスクリートであるが相互運用可能な論理デバイスとして別々に実施され得る。ソフトウェアにおいて実施される場合に、この技術は、実行されたときに、上述の方法の1つ以上を行う命令を備えるコンピュータ読み出し可能媒体によって少なくとも部分的に実現され得る。コンピュータ読み出し可能媒体は、パッケージ化されたものを含み得るコンピュータプログラム製品の一部を形成し得る。コンピュータ読み出し可能媒体は、ランダムアクセスメモリ(random access memory, RAM)、例えば同期DRAM(synchronous DRAM, SDRAM)、読み出し専用メモリ(read only memory, ROM)、不揮発性ランダムアクセスメモリ(non-volatile random access memory, NVRAM)、電気的に消去可能なプログラム可能な読み出し専用メモリ(electrically erasable programmable read-only memory, EEPROM)、フラッシュメモリ、磁気又は光学データ記憶媒体などを備え得る。この技術は、さらに、又はその代わりに、命令又はデータ構造の形でコードを搬送又は通信し、コンピュータによってアクセス、読み出し及び/又は実行することができるコンピュータ読み出し可能通信媒体によって少なくとも部分的に実現され得る。
コードは、1つ以上のディジタル信号プロセッサ(DSP)、汎用マイクロプロセッサ、特定用途向け集積回路(ASIC)、フィールドプログラマブルゲートアレイ(FPGA)あるいは他の対応する統合された又はディスクリートな論理回路のような1つ以上のプロセッサによって実行され得る。従って、ここで使用されている「プロセッサ」との用語は、ここに記載されている技術を実施するために適した上述の構造又は任意の他の構造を指し得る。さらに、幾つかの態様において、ここに記載されている機能は、符号化と復号とのために構成された、又は結合されたビデオ符号器−復号器(combined video encoder-decoder, CODEC)に組み込まれた、専用のソフトウェアモジュール又はハードウェアモジュール内に提供され得る。
本発明の様々な実施形態が記載された。これら及び他の実施形態は請求項の範囲内である。
以下に、本願出願時の特許請求の範囲に記載された発明を付記する。
[1]第1の符号化パスにおいてビデオブロックを符号化し、前記第1の符号化パスは、前記ビデオブロックのための動き情報を定義する前記ビデオブロックのためのビデオ符号化モードを選択することと、
第2の符号化パスにおいて前記ビデオブロックを符号化し、前記第2の符号化パスは、前記ビデオブロックに関連する1つ以上の量子化パラメータを調整して、前記調整された量子化パラメータに基づいて、前記ビデオブロックに関連する前記ビデオ符号化モードの少なくとも幾つかを変更し、前記変更されたビデオ符号化モードは前記動き情報を変更しないこと
とを備える、ビデオ符号化の方法。
[2]前記第2の符号化パスは、
前記調整された量子化パラメータに基づいて、ラグランジュ乗数値をスケールして、
前記スケールされたラグランジュ乗数値に基づいて、前記ビデオブロックに関連する前記ビデオ符号化モードの少なくとも幾つかを変更する、
[1]の方法。
[3]前記ビデオ符号化モードの少なくとも幾つかはスキップモードから直接モードに変更し、
前記第2の符号化パスは、スキップモードのビデオブロックから直接モードのビデオブロックに所与のビデオブロックを変更して、前記直接モードにおける前記所与のビデオブロックに対する残差情報を生成する、
[1]の方法。
[4]前記ビデオ符号化モードの少なくとも幾つかは直接モードからスキップモードに変更し、
前記第2の符号化パスは、直接モードのビデオブロックからスキップモードのビデオブロックに所与のビデオブロックを変更して、前記スキップモードにおける前記所与のビデオブロックに対する残差情報を削除する、
[1]の方法。
[5]前記ビデオ符号化モードの少なくとも幾つかはスキップモードからインターモードに変更し、
前記第2の符号化パスは、スキップモードのビデオブロックからインターモードのビデオブロックに所与のビデオブロックを変更して、前記スキップモードのビデオブロックのための動きベクトルの計算に基づいて、前記インターモードのビデオブロックに動きベクトルを割り当てて、前記インターモードにおける前記所与のビデオブロックに対する残差情報を生成する、
[1]の方法。
[6]前記第2の符号化パスにおいて符号化された前記ビデオブロックを別のデバイスに送信することをさらに備える、[1]の方法。
[7]前記第2の符号化パスは、前記ビデオブロックの送信に関連するビットレートをまとめて調整するために、前記量子化パラメータを調整し、前記ビデオ符号化モードの少なくとも幾つかを変更する、[6]の方法。
[8]前記第2のパスにおいて前記ビデオブロックを符号化することは、予測(P)スライス又はフレームと双方向予測(B)スライス又はフレームとの16×16マクロブロックを符号化することを含み、前記ビデオ符号化モードの少なくとも幾つかを変更することは、
Bスライス又はフレームの少なくとも幾つかのビデオブロックのためにスキップマクロブロックモードから直接マクロブロックモードに変更することと、
Pスライス又はフレームの少なくとも幾つかのビデオブロックのためにスキップマクロブロックモードからインター16×16マクロブロックモードに変更すること
とを備える、[1]の方法。
[9]第1の符号化パスにおいてビデオブロックを符号化し、前記第1の符号化パスは、前記ビデオブロックのための動き情報を定義する前記ビデオブロックのためのビデオ符号化モードを選択し、
第2の符号化パスにおいて前記ビデオブロックを符号化し、前記第2の符号化パスは、前記ビデオブロックに関連する1つ以上の量子化パラメータを調整して、前記調整された量子化パラメータに基づいて、前記ビデオブロックに関連する前記ビデオ符号化モードの少なくとも幾つかを変更し、前記変更されたビデオ符号化モードは前記動き情報を変更しない、
ビデオ符号器を備える装置。
[10]前記第2の符号化パスは、
前記調整された量子化パラメータに基づいて、ラグランジュ乗数値をスケールして、
前記スケールされたラグランジュ乗数値に基づいて、前記ビデオブロックに関連する前記ビデオ符号化モードの少なくとも幾つかを変更する、
[9]の装置。
[11]前記ビデオ符号化モードの少なくとも幾つかはスキップモードから直接モードに変更し、
前記第2の符号化パスは、スキップモードのビデオブロックから直接モードのビデオブロックに所与のビデオブロックを変更して、前記直接モードにおける前記所与のビデオブロックに対する残差情報を生成する、
[9]の装置。
[12]前記ビデオ符号化モードの少なくとも幾つかは直接モードからスキップモードに変更し、
前記第2の符号化パスは、直接モードのビデオブロックからスキップモードのビデオブロックに所与のビデオブロックを変更して、前記スキップモードにおける前記所与のビデオブロックに対する残差情報を削除する、
[9]の装置。
[13]前記ビデオ符号化モードの少なくとも幾つかはスキップモードからインターモードに変更し、
前記第2の符号化パスは、スキップモードのビデオブロックからインターモードのビデオブロックに所与のビデオブロックを変更して、前記スキップモードのビデオブロックのための動きベクトルの計算に基づいて、前記インターモードのビデオブロックに動きベクトルを割り当てて、前記インターモードにおける前記所与のビデオブロックに対する残差情報を生成する、
[9]の装置。
[14]前記第2の符号化パスにおいて符号化された前記ビデオブロックを変調して別のデバイスに送信する変調器/送信器をさらに備える、[9]の装置。
[15]前記第2の符号化パスは、前記ビデオブロックの送信に関連するビットレートをまとめて調整するために、前記量子化パラメータを調整し、前記ビデオ符号化モードの少なくとも幾つかを変更する、[14]の装置。
[16]前記第2のパスにおいて前記ビデオブロックを符号化することは、予測(P)スライス又はフレームと双方向予測(B)スライス又はフレームとの16×16マクロブロックを符号化することを含み、前記ビデオ符号化モードの少なくとも幾つかを変更することは、
Bスライス又はフレームの少なくとも幾つかのビデオブロックのためにスキップマクロブロックモードから直接マクロブロックモードに変更することと、
Pスライス又はフレームの少なくとも幾つかのビデオブロックのためにスキップマクロブロックモードからインター16×16マクロブロックモードに変更すること
とを備える、[9]の装置。
[17]プロセッサにおいて実行されたときに、前記プロセッサに、
第1の符号化パスにおいてビデオブロックを符号化させる命令を備え、前記第1の符号化パスは、前記ビデオブロックのための動き情報を定義する前記ビデオブロックのためのビデオ符号化モードを選択し、
第2の符号化パスにおいて前記ビデオブロックを符号化させる命令を備え、前記第2の符号化パスは、前記ビデオブロックに関連する1つ以上の量子化パラメータを調整して、前記調整された量子化パラメータに基づいて、前記ビデオブロックに関連する前記ビデオ符号化モードの少なくとも幾つかを変更し、前記変更されたビデオ符号化モードは前記動き情報を変更しない、
コンピュータ読み出し可能媒体。
[18]前記第2の符号化パスは、
前記調整された量子化パラメータに基づいて、ラグランジュ乗数値をスケールして、
前記スケールされたラグランジュ乗数値に基づいて、前記ビデオブロックに関連する前記ビデオ符号化モードの少なくとも幾つかを変更する、
[17]のコンピュータ読み出し可能媒体。
[19]前記ビデオ符号化モードの少なくとも幾つかはスキップモードから直接モードに変更し、
前記第2の符号化パスは、スキップモードのビデオブロックから直接モードのビデオブロックに所与のビデオブロックを変更して、前記直接モードにおける前記所与のビデオブロックに対する残差情報を生成する、
[17]のコンピュータ読み出し可能媒体。
[20]前記ビデオ符号化モードの少なくとも幾つかは直接モードからスキップモードに変更し、
前記第2の符号化パスは、直接モードのビデオブロックからスキップモードのビデオブロックに所与のビデオブロックを変更して、前記スキップモードにおける前記所与のビデオブロックに対する残差情報を削除する、
[17]のコンピュータ読み出し可能媒体。
[21]
前記ビデオ符号化モードの少なくとも幾つかはスキップモードからインターモードに変更し、
前記第2の符号化パスは、スキップモードのビデオブロックからインターモードのビデオブロックに所与のビデオブロックを変更して、前記スキップモードのビデオブロックのための動きベクトルの計算に基づいて、前記インターモードのビデオブロックに動きベクトルを割り当てて、前記インターモードにおける前記所与のビデオブロックに対する残差情報を生成する、
[17]のコンピュータ読み出し可能媒体。
[22]前記第2の符号化パスにおいて符号化された前記ビデオブロックを別のデバイスに送信させる命令をさらに備える、[17]のコンピュータ読み出し可能媒体。
[23]前記第2の符号化パスは、前記ビデオブロックの送信に関連するビットレートをまとめて調整するために、前記量子化パラメータを調整し、前記ビデオ符号化モードの少なくとも幾つかを変更する、[22]のコンピュータ読み出し可能媒体。
[24]前記第2のパスにおいて前記ビデオブロックを符号化することは、予測(P)スライス又はフレームと双方向予測(B)スライス又はフレームとの16×16マクロブロックを符号化することを含み、前記ビデオ符号化モードの少なくとも幾つかを変更することは、
Bスライス又はフレームの少なくとも幾つかのビデオブロックのためにスキップマクロブロックモードから直接マクロブロックモードに変更することと、
Pスライス又はフレームの少なくとも幾つかのビデオブロックのためにスキップマクロブロックモードからインター16×16マクロブロックモードに変更すること
とを備える、[17]のコンピュータ読み出し可能媒体。
[25]第1の符号化パスにおいてビデオブロックを符号化する手段を備え、前記第1の符号化パスにおいてビデオブロックを符号化する手段は、前記ビデオブロックのための動き情報を定義する前記ビデオブロックのためのビデオ符号化モードを選択する手段を含み、
第2の符号化パスにおいて前記ビデオブロックを符号化する手段を備え、前記第2の符号化パスにおいて前記ビデオブロックを符号化する手段は、前記ビデオブロックに関連する1つ以上の量子化パラメータを調整する手段と、前記調整された量子化パラメータに基づいて、前記ビデオブロックに関連する前記ビデオ符号化モードの少なくとも幾つかを変更する手段とを含み、前記変更されたビデオ符号化モードは前記動き情報を変更しない、
デバイス。
[26]前記第2の符号化パスにおいて前記ビデオブロックを符号化する手段は、前記調整された量子化パラメータに基づいて、ラグランジュ乗数値をスケールする手段を含み、前記変更する手段は、前記スケールされたラグランジュ乗数値に基づいて、前記ビデオブロックに関連する前記ビデオ符号化モードの少なくとも幾つかを変更する手段を備える、
[25]のデバイス。
[27]前記ビデオ符号化モードの少なくとも幾つかはスキップモードから直接モードに変更し、
前記第2の符号化パスにおいて前記ビデオブロックを符号化する手段は、スキップモードのビデオブロックから直接モードのビデオブロックに所与のビデオブロックを変更する手段と、前記直接モードにおける前記所与のビデオブロックに対する残差情報を生成する手段とを含む、
[25]のデバイス。
[28]前記ビデオ符号化モードの少なくとも幾つかは直接モードからスキップモードに変更し、
前記第2の符号化パスにおいて前記ビデオブロックを符号化する手段は、直接モードのビデオブロックからスキップモードのビデオブロックに所与のビデオブロックを変更する手段と、前記スキップモードにおける前記所与のビデオブロックに対する残差情報を削除する手段とを含む、
[25]のデバイス。
[29]前記ビデオ符号化モードの少なくとも幾つかはスキップモードからインターモードに変更し、
前記第2の符号化パスにおいて前記ビデオブロックを符号化する手段は、スキップモードのビデオブロックからインターモードのビデオブロックに所与のビデオブロックを変更する手段と、前記スキップモードのビデオブロックのための動きベクトルの計算に基づいて、インターモードのビデオブロックに動きベクトルを割り当てる手段と、前記インターモードにおける前記所与のビデオブロックに対する残差情報を生成する手段とを含む、
[25]のデバイス。
[30]前記第2の符号化パスにおいて符号化された前記ビデオブロックを別のデバイスに送信する手段をさらに備える、[25]のデバイス。
[31]前記第2の符号化パスにおいて前記ビデオブロックを符号化する手段は、前記ビデオブロックの送信に関連するビットレートをまとめて調整するために、前記量子化パラメータを調整する手段と、前記ビデオ符号化モードの少なくとも幾つかを変更する手段とを含む、[30]のデバイス。
[32]前記第2の符号化パスにおいて前記ビデオブロックを符号化する手段は、予測(P)スライス又はフレームと双方向予測(B)スライス又はフレームとの16×16マクロブロックを符号化する手段を含み、前記ビデオ符号化モードの少なくとも幾つかを変更する手段は、
Bスライス又はフレームの少なくとも幾つかのビデオブロックのためにスキップマクロブロックモードから直接マクロブロックモードに変更する手段と、
Pスライス又はフレームの少なくとも幾つかのビデオブロックのためにスキップマクロブロックモードからインター16×16マクロブロックモードに変更する手段
とを備える、[25]のデバイス
10・・・ビデオ符号化及び復号システム、15・・・通信チャネル。

Claims (32)

  1. 第1の符号化パスにおいてビデオブロックを符号化し、前記第1の符号化パスは、前記ビデオブロックのための動き情報を定義する前記ビデオブロックのための複数のビデオ符号化モードのうちの1つを選択することと、
    第2の符号化パスにおいて前記ビデオブロックを符号化し、前記第2の符号化パスは、前記ビデオブロックに関連する1つ以上の量子化パラメータを調整して、前記調整された量子化パラメータに基づいて、前記ビデオブロックに関連する前記選択されたビデオ符号化モードを変更し、前記動き情報を使用し、前記変更されたビデオ符号化モードは前記ビデオブロックのための残差情報に影響するが前記動き情報を変更しないこと
    とを備える、ビデオ符号化の方法。
  2. 前記第2の符号化パスは、
    前記調整された量子化パラメータに基づいて、ラグランジュ乗数値をスケールして、
    前記スケールされたラグランジュ乗数値に基づいて、前記ビデオブロックに関連する前記選択されたビデオ符号化モードを変更する、
    請求項1の方法。
  3. 前記選択されたビデオ符号化モードはスキップモードから直接モードに変更し、
    前記第2の符号化パスは、スキップモードのビデオブロックから直接モードのビデオブロックに所与のビデオブロックを変更して、前記直接モードにおける前記所与のビデオブロックに対する残差情報を生成する、
    請求項1の方法。
  4. 前記選択されたビデオ符号化モードは直接モードからスキップモードに変更し、
    前記第2の符号化パスは、直接モードのビデオブロックからスキップモードのビデオブロックに所与のビデオブロックを変更して、前記スキップモードにおける前記所与のビデオブロックに対する残差情報を削除する、
    請求項1の方法。
  5. 前記選択されたビデオ符号化モードはスキップモードからインターモードに変更し、
    前記第2の符号化パスは、スキップモードのビデオブロックからインターモードのビデオブロックに所与のビデオブロックを変更して、前記スキップモードのビデオブロックのための動きベクトルの計算に基づいて、前記インターモードのビデオブロックに動きベクトルを割り当てて、前記インターモードにおける前記所与のビデオブロックに対する残差情報を生成する、
    請求項1の方法。
  6. 前記第2の符号化パスにおいて符号化された前記ビデオブロックを別のデバイスに送信することをさらに備える、請求項1の方法。
  7. 前記第2の符号化パスは、前記ビデオブロックの送信に関連するビットレートをまとめて調整するために、前記量子化パラメータを調整し、前記選択されたビデオ符号化モードを変更する、請求項6の方法。
  8. 前記第2のパスにおいて前記ビデオブロックを符号化することは、予測(P)スライス又はフレームと双方向予測(B)スライス又はフレームとの16×16マクロブロックを符号化することを含み、前記選択されたビデオ符号化モードを変更することは、
    Bスライス又はフレームの少なくとも幾つかのビデオブロックのためにスキップマクロブロックモードから直接マクロブロックモードに変更することと、
    Pスライス又はフレームの少なくとも幾つかのビデオブロックのためにスキップマクロブロックモードからインター16×16マクロブロックモードに変更すること
    とを備える、請求項1の方法。
  9. 第1の符号化パスにおいてビデオブロックを符号化し、前記第1の符号化パスは、前記ビデオブロックのための動き情報を定義する前記ビデオブロックのための複数のビデオ符号化モードのうちの1つを選択し、
    第2の符号化パスにおいて前記ビデオブロックを符号化し、前記第2の符号化パスは、前記ビデオブロックに関連する1つ以上の量子化パラメータを調整して、前記調整された量子化パラメータに基づいて、前記ビデオブロックに関連する前記選択されたビデオ符号化モードを変更し、前記動き情報を使用し、前記変更されたビデオ符号化モードは前記ビデオブロックのための残差情報に影響するが前記動き情報を変更しない、
    ビデオ符号器を備える装置。
  10. 前記第2の符号化パスは、
    前記調整された量子化パラメータに基づいて、ラグランジュ乗数値をスケールして、
    前記スケールされたラグランジュ乗数値に基づいて、前記ビデオブロックに関連する前記選択されたビデオ符号化モードを変更する、
    請求項9の装置。
  11. 前記選択されたビデオ符号化モードはスキップモードから直接モードに変更し、
    前記第2の符号化パスは、スキップモードのビデオブロックから直接モードのビデオブロックに所与のビデオブロックを変更して、前記直接モードにおける前記所与のビデオブロックに対する残差情報を生成する、
    請求項9の装置。
  12. 前記選択されたビデオ符号化モードは直接モードからスキップモードに変更し、
    前記第2の符号化パスは、直接モードのビデオブロックからスキップモードのビデオブロックに所与のビデオブロックを変更して、前記スキップモードにおける前記所与のビデオブロックに対する残差情報を削除する、
    請求項9の装置。
  13. 前記選択されたビデオ符号化モードはスキップモードからインターモードに変更し、
    前記第2の符号化パスは、スキップモードのビデオブロックからインターモードのビデオブロックに所与のビデオブロックを変更して、前記スキップモードのビデオブロックのための動きベクトルの計算に基づいて、前記インターモードのビデオブロックに動きベクトルを割り当てて、前記インターモードにおける前記所与のビデオブロックに対する残差情報を生成する、
    請求項9の装置。
  14. 前記第2の符号化パスにおいて符号化された前記ビデオブロックを変調して別のデバイスに送信する変調器/送信器をさらに備える、請求項9の装置。
  15. 前記第2の符号化パスは、前記ビデオブロックの送信に関連するビットレートをまとめて調整するために、前記量子化パラメータを調整し、前記選択されたビデオ符号化モードを変更する、請求項14の装置。
  16. 前記第2のパスにおいて前記ビデオブロックを符号化することは、予測(P)スライス又はフレームと双方向予測(B)スライス又はフレームとの16×16マクロブロックを符号化することを含み、前記選択されたビデオ符号化モードを変更することは、
    Bスライス又はフレームの少なくとも幾つかのビデオブロックのためにスキップマクロブロックモードから直接マクロブロックモードに変更することと、
    Pスライス又はフレームの少なくとも幾つかのビデオブロックのためにスキップマクロブロックモードからインター16×16マクロブロックモードに変更すること
    とを備える、請求項9の装置。
  17. プロセッサにおいて実行されたときに、前記プロセッサに、
    第1の符号化パスにおいてビデオブロックを符号化させる命令と、
    第2の符号化パスにおいて前記ビデオブロックを符号化させる命令とを記憶し、
    前記第1の符号化パスは、前記ビデオブロックのための動き情報を定義する前記ビデオブロックのための複数のビデオ符号化モードのうちの1つを選択し、
    前記第2の符号化パスは、前記ビデオブロックに関連する1つ以上の量子化パラメータを調整して、前記調整された量子化パラメータに基づいて、前記ビデオブロックに関連する前記選択されたビデオ符号化モードを変更し、前記動き情報を使用し、前記変更されたビデオ符号化モードは前記ビデオブロックのための残差情報に影響するが前記動き情報を変更しない、
    コンピュータ読み出し可能記憶媒体。
  18. 前記第2の符号化パスは、
    前記調整された量子化パラメータに基づいて、ラグランジュ乗数値をスケールして、
    前記スケールされたラグランジュ乗数値に基づいて、前記ビデオブロックに関連する前記選択されたビデオ符号化モードを変更する、
    請求項17のコンピュータ読み出し可能記憶媒体。
  19. 前記選択されたビデオ符号化モードはスキップモードから直接モードに変更し、
    前記第2の符号化パスは、スキップモードのビデオブロックから直接モードのビデオブロックに所与のビデオブロックを変更して、前記直接モードにおける前記所与のビデオブロックに対する残差情報を生成する、
    請求項17のコンピュータ読み出し可能記憶媒体。
  20. 前記選択されたビデオ符号化モードは直接モードからスキップモードに変更し、
    前記第2の符号化パスは、直接モードのビデオブロックからスキップモードのビデオブロックに所与のビデオブロックを変更して、前記スキップモードにおける前記所与のビデオブロックに対する残差情報を削除する、
    請求項17のコンピュータ読み出し可能記憶媒体。
  21. 前記選択されたビデオ符号化モードはスキップモードからインターモードに変更し、
    前記第2の符号化パスは、スキップモードのビデオブロックからインターモードのビデオブロックに所与のビデオブロックを変更して、前記スキップモードのビデオブロックのための動きベクトルの計算に基づいて、前記インターモードのビデオブロックに動きベクトルを割り当てて、前記インターモードにおける前記所与のビデオブロックに対する残差情報を生成する、
    請求項17のコンピュータ読み出し可能記憶媒体。
  22. 前記プロセッサに、前記第2の符号化パスにおいて符号化された前記ビデオブロックを別のデバイスに送信させる命令をさらに記憶する、請求項17のコンピュータ読み出し可能記憶媒体。
  23. 前記第2の符号化パスは、前記ビデオブロックの送信に関連するビットレートをまとめて調整するために、前記量子化パラメータを調整し、前記選択されたビデオ符号化モードを変更する、請求項22のコンピュータ読み出し可能記憶媒体。
  24. 前記プロセッサに、前記第2のパスにおいて前記ビデオブロックを符号化させる命令は、前記プロセッサに、予測(P)スライス又はフレームと双方向予測(B)スライス又はフレームとの16×16マクロブロックを符号化させる命令を含み、前記選択されたビデオ符号化モードを変更することは、
    Bスライス又はフレームの少なくとも幾つかのビデオブロックのためにスキップマクロブロックモードから直接マクロブロックモードに変更することと、
    Pスライス又はフレームの少なくとも幾つかのビデオブロックのためにスキップマクロブロックモードからインター16×16マクロブロックモードに変更すること
    とを備える、請求項17のコンピュータ読み出し可能記憶媒体。
  25. 第1の符号化パスにおいてビデオブロックを符号化する手段を備え、前記第1の符号化パスにおいてビデオブロックを符号化する手段は、前記ビデオブロックのための動き情報を定義する前記ビデオブロックのための複数のビデオ符号化モードのうちの1つを選択する手段を含み、
    第2の符号化パスにおいて前記ビデオブロックを符号化する手段を備え、前記第2の符号化パスにおいて前記ビデオブロックを符号化する手段は、前記ビデオブロックに関連する1つ以上の量子化パラメータを調整する手段と、前記調整された量子化パラメータに基づいて、前記ビデオブロックに関連する前記選択されたビデオ符号化モードを変更する手段と、前記動き情報を使用する手段とを含み、前記変更されたビデオ符号化モードは前記ビデオブロックのための残差情報に影響するが前記動き情報を変更しない、
    デバイス。
  26. 前記第2の符号化パスにおいて前記ビデオブロックを符号化する手段は、前記調整された量子化パラメータに基づいて、ラグランジュ乗数値をスケールする手段を含み、前記変更する手段は、前記スケールされたラグランジュ乗数値に基づいて、前記ビデオブロックに関連する前記選択されたビデオ符号化モードを変更する手段を備える、
    請求項25のデバイス。
  27. 前記選択されたビデオ符号化モードはスキップモードから直接モードに変更し、
    前記第2の符号化パスにおいて前記ビデオブロックを符号化する手段は、スキップモードのビデオブロックから直接モードのビデオブロックに所与のビデオブロックを変更する手段と、前記直接モードにおける前記所与のビデオブロックに対する残差情報を生成する手段とを含む、
    請求項25のデバイス。
  28. 前記選択されたビデオ符号化モードは直接モードからスキップモードに変更し、
    前記第2の符号化パスにおいて前記ビデオブロックを符号化する手段は、直接モードのビデオブロックからスキップモードのビデオブロックに所与のビデオブロックを変更する手段と、前記スキップモードにおける前記所与のビデオブロックに対する残差情報を削除する手段とを含む、
    請求項25のデバイス。
  29. 前記選択されたビデオ符号化モードはスキップモードからインターモードに変更し、
    前記第2の符号化パスにおいて前記ビデオブロックを符号化する手段は、スキップモードのビデオブロックからインターモードのビデオブロックに所与のビデオブロックを変更する手段と、前記スキップモードのビデオブロックのための動きベクトルの計算に基づいて、前記インターモードのビデオブロックに動きベクトルを割り当てる手段と、前記インターモードにおける前記所与のビデオブロックに対する残差情報を生成する手段とを含む、
    請求項25のデバイス。
  30. 前記第2の符号化パスにおいて符号化された前記ビデオブロックを別のデバイスに送信する手段をさらに備える、請求項25のデバイス。
  31. 前記第2の符号化パスにおいて前記ビデオブロックを符号化する手段は、前記ビデオブロックの送信に関連するビットレートをまとめて調整するために、前記量子化パラメータを調整する手段と、前記選択されたビデオ符号化モードを変更する手段とを含む、請求項30のデバイス。
  32. 前記第2の符号化パスにおいて前記ビデオブロックを符号化する手段は、予測(P)スライス又はフレームと双方向予測(B)スライス又はフレームとの16×16マクロブロックを符号化する手段を含み、前記選択されたビデオ符号化モードを変更する手段は、
    Bスライス又はフレームの少なくとも幾つかのビデオブロックのためにスキップマクロブロックモードから直接マクロブロックモードに変更する手段と、
    Pスライス又はフレームの少なくとも幾つかのビデオブロックのためにスキップマクロブロックモードからインター16×16マクロブロックモードに変更する手段
    とを備える、請求項25のデバイス。
JP2009552812A 2007-03-02 2008-02-29 第2のパスのビデオ符号化における効率的なビデオブロックのモード変更 Active JP5611601B2 (ja)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US89280407P 2007-03-02 2007-03-02
US60/892,804 2007-03-02
US11/777,395 2007-07-13
US11/777,395 US8594187B2 (en) 2007-03-02 2007-07-13 Efficient video block mode changes in second pass video coding
PCT/US2008/055553 WO2008109471A1 (en) 2007-03-02 2008-02-29 Efficient video block mode changes in second pass video coding

Publications (2)

Publication Number Publication Date
JP2010520714A JP2010520714A (ja) 2010-06-10
JP5611601B2 true JP5611601B2 (ja) 2014-10-22

Family

ID=39733048

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009552812A Active JP5611601B2 (ja) 2007-03-02 2008-02-29 第2のパスのビデオ符号化における効率的なビデオブロックのモード変更

Country Status (7)

Country Link
US (1) US8594187B2 (ja)
EP (1) EP2132938B1 (ja)
JP (1) JP5611601B2 (ja)
KR (1) KR101058758B1 (ja)
CN (1) CN101622880B (ja)
TW (1) TW200904197A (ja)
WO (1) WO2008109471A1 (ja)

Families Citing this family (62)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1829027A1 (en) * 2004-12-15 2007-09-05 Telefonaktiebolaget LM Ericsson (publ) Method and device for encoding mode changing of encoded data streams
CN101496387B (zh) 2006-03-06 2012-09-05 思科技术公司 用于移动无线网络中的接入认证的系统和方法
WO2008156548A1 (en) * 2007-06-12 2008-12-24 Thomson Licensing Methods and apparatus supporting multi-pass video syntax structure for slice data
US20090074075A1 (en) * 2007-09-14 2009-03-19 The Hong Kong University Of Science And Technology Efficient real-time rate control for video compression processes
US8077772B2 (en) * 2007-11-09 2011-12-13 Cisco Technology, Inc. Coding background blocks in video coding that includes coding as skipped
US8797377B2 (en) 2008-02-14 2014-08-05 Cisco Technology, Inc. Method and system for videoconference configuration
US8355041B2 (en) 2008-02-14 2013-01-15 Cisco Technology, Inc. Telepresence system for 360 degree video conferencing
US8319819B2 (en) 2008-03-26 2012-11-27 Cisco Technology, Inc. Virtual round-table videoconference
US8390667B2 (en) 2008-04-15 2013-03-05 Cisco Technology, Inc. Pop-up PIP for people not in picture
CN102165772B (zh) * 2008-09-16 2013-07-24 杜比实验室特许公司 自适应视频编码器控制
US8694658B2 (en) 2008-09-19 2014-04-08 Cisco Technology, Inc. System and method for enabling communication sessions in a network environment
US8477175B2 (en) 2009-03-09 2013-07-02 Cisco Technology, Inc. System and method for providing three dimensional imaging in a network environment
US8659637B2 (en) 2009-03-09 2014-02-25 Cisco Technology, Inc. System and method for providing three dimensional video conferencing in a network environment
US8659639B2 (en) 2009-05-29 2014-02-25 Cisco Technology, Inc. System and method for extending communications between participants in a conferencing environment
EP2285111A1 (en) * 2009-08-07 2011-02-16 Canon Kabushiki Kaisha Method for sending compressed data representing a digital image and corresponding device
US9082297B2 (en) 2009-08-11 2015-07-14 Cisco Technology, Inc. System and method for verifying parameters in an audiovisual environment
ES2681209T3 (es) 2009-09-10 2018-09-12 Guangdong Oppo Mobile Telecommunications Corp., Ltd. Técnicas de aceleración para una cuantificación optimizada de tasa de distorsión
US8532169B2 (en) * 2009-12-23 2013-09-10 General Instrument Corporation Rate control for two-pass encoder using adaptive quantization parameters
US8681858B2 (en) * 2009-12-23 2014-03-25 General Instrument Corporation Rate control for two-pass encoder
US20120314768A1 (en) * 2010-02-23 2012-12-13 Samsung Electronics Co., Ltd. Method and device for encoding/decoding a prediction image in a layered coding structure
US9225916B2 (en) 2010-03-18 2015-12-29 Cisco Technology, Inc. System and method for enhancing video images in a conferencing environment
US9313452B2 (en) 2010-05-17 2016-04-12 Cisco Technology, Inc. System and method for providing retracting optics in a video conferencing environment
US8553763B2 (en) 2010-06-10 2013-10-08 Sony Corporation Iterative computation of adaptive interpolation filter
US8896655B2 (en) 2010-08-31 2014-11-25 Cisco Technology, Inc. System and method for providing depth adaptive video conferencing
US8599934B2 (en) 2010-09-08 2013-12-03 Cisco Technology, Inc. System and method for skip coding during video conferencing in a network environment
US8599865B2 (en) 2010-10-26 2013-12-03 Cisco Technology, Inc. System and method for provisioning flows in a mobile network environment
US8699457B2 (en) 2010-11-03 2014-04-15 Cisco Technology, Inc. System and method for managing flows in a mobile network environment
US9338394B2 (en) 2010-11-15 2016-05-10 Cisco Technology, Inc. System and method for providing enhanced audio in a video environment
US8730297B2 (en) 2010-11-15 2014-05-20 Cisco Technology, Inc. System and method for providing camera functions in a video environment
US8902244B2 (en) 2010-11-15 2014-12-02 Cisco Technology, Inc. System and method for providing enhanced graphics in a video environment
US9143725B2 (en) 2010-11-15 2015-09-22 Cisco Technology, Inc. System and method for providing enhanced graphics in a video environment
US8542264B2 (en) 2010-11-18 2013-09-24 Cisco Technology, Inc. System and method for managing optics in a video environment
US8723914B2 (en) 2010-11-19 2014-05-13 Cisco Technology, Inc. System and method for providing enhanced video processing in a network environment
US9111138B2 (en) 2010-11-30 2015-08-18 Cisco Technology, Inc. System and method for gesture interface control
USD678894S1 (en) 2010-12-16 2013-03-26 Cisco Technology, Inc. Display screen with graphical user interface
USD678307S1 (en) 2010-12-16 2013-03-19 Cisco Technology, Inc. Display screen with graphical user interface
USD678320S1 (en) 2010-12-16 2013-03-19 Cisco Technology, Inc. Display screen with graphical user interface
USD682864S1 (en) 2010-12-16 2013-05-21 Cisco Technology, Inc. Display screen with graphical user interface
USD678308S1 (en) 2010-12-16 2013-03-19 Cisco Technology, Inc. Display screen with graphical user interface
USD682293S1 (en) 2010-12-16 2013-05-14 Cisco Technology, Inc. Display screen with graphical user interface
USD682294S1 (en) 2010-12-16 2013-05-14 Cisco Technology, Inc. Display screen with graphical user interface
USD682854S1 (en) 2010-12-16 2013-05-21 Cisco Technology, Inc. Display screen for graphical user interface
US8692862B2 (en) 2011-02-28 2014-04-08 Cisco Technology, Inc. System and method for selection of video data in a video conference environment
EP2509315B1 (en) * 2011-04-04 2016-08-17 Nxp B.V. Video decoding switchable between two modes of inverse motion compensation
US8670019B2 (en) 2011-04-28 2014-03-11 Cisco Technology, Inc. System and method for providing enhanced eye gaze in a video conferencing environment
US8786631B1 (en) 2011-04-30 2014-07-22 Cisco Technology, Inc. System and method for transferring transparency information in a video environment
US8934026B2 (en) 2011-05-12 2015-01-13 Cisco Technology, Inc. System and method for video coding in a dynamic environment
US9781449B2 (en) * 2011-10-06 2017-10-03 Synopsys, Inc. Rate distortion optimization in image and video encoding
US9338463B2 (en) 2011-10-06 2016-05-10 Synopsys, Inc. Visual quality measure for real-time video processing
US8947493B2 (en) 2011-11-16 2015-02-03 Cisco Technology, Inc. System and method for alerting a participant in a video conference
US8682087B2 (en) 2011-12-19 2014-03-25 Cisco Technology, Inc. System and method for depth-guided image filtering in a video conference environment
CN103327284B (zh) * 2012-12-18 2018-11-06 南京中兴软件有限责任公司 无损视频的传输方法、装置及视频通讯系统
US9843621B2 (en) 2013-05-17 2017-12-12 Cisco Technology, Inc. Calendaring activities based on communication processing
US20140362927A1 (en) * 2013-06-07 2014-12-11 Apple Inc. Video codec flashing effect reduction
BR102015001999A2 (pt) * 2015-01-28 2019-02-26 De Souza Leite Pinho Mauro instrumento para comunicação virtual interativa
US10313675B1 (en) 2015-01-30 2019-06-04 Google Llc Adaptive multi-pass video encoder control
US11496747B2 (en) * 2017-03-22 2022-11-08 Qualcomm Incorporated Intra-prediction mode propagation
US10778938B2 (en) * 2018-12-20 2020-09-15 Hulu, LLC Video chunk combination optimization
CN109862362A (zh) * 2018-12-29 2019-06-07 深圳市网心科技有限公司 一种视频的mpeg2编码方法、系统、介质及设备
WO2021063308A1 (en) * 2019-10-03 2021-04-08 Huawei Technologies Co., Ltd. Coding process for geometric partition mode
CN113132757B (zh) * 2021-04-21 2022-07-05 北京汇钧科技有限公司 数据处理方法和装置
WO2022222988A1 (en) * 2021-04-21 2022-10-27 Beijing Bytedance Network Technology Co., Ltd. Method, device, and medium for video processing

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5144424A (en) * 1991-10-15 1992-09-01 Thomson Consumer Electronics, Inc. Apparatus for video data quantization control
US6160846A (en) * 1995-10-25 2000-12-12 Sarnoff Corporation Apparatus and method for optimizing the rate control in a coding system
JP2001086512A (ja) 1999-09-14 2001-03-30 Nec Corp 可変ビットレート符号化装置
US20030215011A1 (en) * 2002-05-17 2003-11-20 General Instrument Corporation Method and apparatus for transcoding compressed video bitstreams
AU2003280512A1 (en) * 2002-07-01 2004-01-19 E G Technology Inc. Efficient compression and transport of video over a network
US7280700B2 (en) * 2002-07-05 2007-10-09 Microsoft Corporation Optimization techniques for data compression
CN1206864C (zh) 2002-07-22 2005-06-15 中国科学院计算技术研究所 结合率失真优化的码率控制的方法及其装置
BRPI0411765A (pt) 2003-06-25 2006-08-08 Thomson Licensing codificação de decisão modal rápida para inter-quadros
JP2006080925A (ja) 2004-09-09 2006-03-23 Toshiba Corp 動画符号化装置、動画符号化方法および動画符号化プログラム
CA2508428A1 (fr) 2005-05-20 2006-11-20 Hydro-Quebec Detection, localisation et interpretation de decharge partielle

Also Published As

Publication number Publication date
CN101622880B (zh) 2013-09-25
JP2010520714A (ja) 2010-06-10
CN101622880A (zh) 2010-01-06
EP2132938B1 (en) 2015-06-10
EP2132938A1 (en) 2009-12-16
TW200904197A (en) 2009-01-16
US20080212677A1 (en) 2008-09-04
US8594187B2 (en) 2013-11-26
KR20090123914A (ko) 2009-12-02
KR101058758B1 (ko) 2011-08-24
WO2008109471A1 (en) 2008-09-12

Similar Documents

Publication Publication Date Title
JP5611601B2 (ja) 第2のパスのビデオ符号化における効率的なビデオブロックのモード変更
CA2665648C (en) Variable length coding table selection based on video block type for refinement coefficient coding
JP5795416B2 (ja) スケーラブルビット深度のためのスケーラブルビデオコーディング手法
CA2701200C (en) Adaptive coding of video block header information
TWI397320B (zh) 用於精細化係數編碼以區塊類型統計為基礎之可變長度編碼表選擇
CA2677973C (en) Combined run-length coding of refinement and significant coefficients in scalable video coding enhancement layers
JP5384694B2 (ja) 多層ビデオ設計のためのレート制御
RU2409004C1 (ru) Методы кодирования переменной длины для структур кодированных блоков
KR101377883B1 (ko) 비디오 인코딩에서 넌-제로 라운딩 및 예측 모드 선택 기법들
KR20100137004A (ko) 비디오 코딩에서 레이트 제어를 위한 데드 존 파라미터 선택
Brites et al. Distributed video coding: Assessing the HEVC upgrade

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20110906

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20111018

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20120118

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20120125

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120209

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20121002

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20140128

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20140131

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140328

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140903

R150 Certificate of patent or registration of utility model

Ref document number: 5611601

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250