JP2006516375A - 改良型符号化モード選択の方法および装置 - Google Patents

改良型符号化モード選択の方法および装置 Download PDF

Info

Publication number
JP2006516375A
JP2006516375A JP2006500826A JP2006500826A JP2006516375A JP 2006516375 A JP2006516375 A JP 2006516375A JP 2006500826 A JP2006500826 A JP 2006500826A JP 2006500826 A JP2006500826 A JP 2006500826A JP 2006516375 A JP2006516375 A JP 2006516375A
Authority
JP
Japan
Prior art keywords
value
mode
encoding
lagrangian
calculating
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2006500826A
Other languages
English (en)
Other versions
JP2006516375A5 (ja
JP4480713B2 (ja
Inventor
ドゥミトラス、アドリアーナ
ハスケル、バリン、ジー.
プリ、アチュール
Original Assignee
アップル コンピュータ、インコーポレイテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by アップル コンピュータ、インコーポレイテッド filed Critical アップル コンピュータ、インコーポレイテッド
Publication of JP2006516375A publication Critical patent/JP2006516375A/ja
Publication of JP2006516375A5 publication Critical patent/JP2006516375A5/ja
Application granted granted Critical
Publication of JP4480713B2 publication Critical patent/JP4480713B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/154Measured or subjectively estimated visual quality after decoding, e.g. measurement of distortion
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/105Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/147Data rate or code amount at the encoder output according to rate distortion criteria
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/189Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
    • H04N19/19Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding using optimisation based on Lagrange multipliers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/513Processing of motion vectors
    • H04N19/517Processing of motion vectors by encoding
    • H04N19/52Processing of motion vectors by encoding by predictive encoding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

H.264(MPEG−4/Part 10)の枠内のB画像内の直接モード拡張およびP画像内のスキップ・モード拡張の新規の方法が開示される。直接モードとスキップ・モードの拡張は、ラグランジアン値のクラスタ化と、アウトライアの除去と、符号化モード選択のための速度歪最適化の際のラグランジュ乗数のより小さい値の指定とによって達成される。高品質サンプル・ビデオ・シーケンスを用いた実験結果は、ピーク信号対雑音比(PSNR)のわずかな損失で本発明の方法を用いてビット・レートを低減できることを示している。2つの異なる実験を行うことで、ピーク信号対雑音比が変化してもいかなる主観的な画像損失も観察できないことが実証された。(非規範的)MPEG−4/Part 10エンコーダで現在採用されている既存の速度歪の最適化方法に関連して、本発明の方法は簡単で有用な拡張機能を表す。より重要なことには、復号化された画像に許容できないアーティファクトが混入するので量子化パラメータの値を増やすなどの他の解決策は適用できないが、本発明の方法は復号化ビデオ・シーケンス内に観察できる歪を混入させることなくビット・レート低減を達成する。さらに、本発明はH.264の枠組みを利用するという事実にも関わらず、本発明の符号化方法は符号化モード選択のために速度歪最適化を使用する任意のビデオ符号化システムに適用可能である。

Description

(関連出願)
本特許出願は、2003年1月8日出願の「Method and Apparatus for Improved Coding Mode Selection」(改良型符号化モード選択の方法および装置)と題された米国仮特許出願第60/439062号の利益を主張する。
(技術分野)
本発明は、マルチメディア圧縮システムの分野に関する。特に、本発明は、符号化モード選択を改良する方法およびシステムを開示する。
ディジタル・ベースの電子媒体フォーマットはついに大幅にアナログ電子媒体フォーマットに取って代わる段階に達した。ディジタル・コンパクト・ディスク(CD)はかなり以前にアナログのビニール製レコードに取って代わっている。アナログ磁気カセット・テープはますます稀になっている。ミニディスクおよびMP3(MPEGオーディオ・レイヤ3)などの第2世代および第3世代ディジタル・オーディオ・システムはコンパクト・ディスクの第1世代ディジタル・オーディオ・フォーマットから市場シェアを奪いつつある。
ビデオ媒体はオーディオ媒体と比較してディジタル記憶装置および伝送フォーマットへの移行が遅れている。このディジタルへの移行の遅さの理由は、主として画像をディジタル形式で正確に表現するのに必要な大量のディジタル情報が原因である。画像を正確に表現するのに必要な大量のディジタル情報は、極めて大容量のディジタル記憶システムおよび高帯域伝送システムを必要とする。
しかし、画像はディジタル記憶装置および伝送フォーマットに急速に移行しつつある。より高速のコンピュータ・プロセッサ、高密度記憶システム、および新しい効率的な圧縮および符号化アルゴリズムによって、ディジタル・ビデオ伝送および記憶装置は消費者価格にまで引き下げられた。ディジタル・ビデオ・システムであるDVD(デジタル多用途ディスク)は、数年にわたって最もよく売れている消費者向け電子製品の1つである。DVDは、その高品質の画像、極めて高品質の音響、利便性および他の特徴によって、好んで選ばれる事前録画されたビデオ再生システムとしてビデオカセット・レコーダ(VCR)に急速に取って代わっている。古くなったアナログNTSC(全米テレビジョン方式委員会)のビデオ伝送システムは現在、ディジタルATSC(高度テレビジョン方式委員会)のビデオ伝送システムに移行しつつある。
コンピュータ・システムは数年間、さまざまな異なるディジタル・ビデオ符号化フォーマットを使用してきた。コンピュータ・システムによって使用されてきた最良のディジタル・ビデオ圧縮および符号化システムには、頭字語MPEGで一般に知られる動画映像専門家グループ(Motion Pictures Expert Group)が支援するディジタル・ビデオ・システムが含まれる。MPEGの3つの最も知られ、使用されているディジタル・ビデオ・フォーマットは、MPEG−1、MPEG−2、およびMPEG−4である。ビデオCDおよび消費者グレードのディジタル・ビデオ編集システムは初期のMPEG−1フォーマットを使用する。デジタル多用途ディスク(DVD)およびディッシュ・ネットワーク・ブランドの直接放送衛星(DBS)テレビジョン放送システムはMPEG−2ディジタル・ビデオ圧縮および符号化システムを使用する。MPEG−4符号化システムは、最新のコンピュータ・ベースのディジタル・ビデオ・エンコーダおよびそれに関連するディジタル・ビデオ・プレーヤに急速に採用されている。
符号化モード選択を改良する方法およびシステムが開示される。本開示では、H.264(MPEG−4/Part 10)の枠内のB画像の直接モード拡張およびP画像のスキップ・モード拡張の新規の方法が開示される。
直接モードおよびスキップ・モード拡張は、既存の圧縮方式にいくつかの変更を加えることで達成される。特に、本発明のシステムは歪値内のアウトライアを除去するステップと、符号化モード選択の速度歪最適化のラグランジュ乗数のより小さい値を指定するステップと、符号化モード選択の前にラグランジアン値をクラスタ化するステップとを導入する。一実施形態では、Huberコスト関数を使用して異なる符号化モードでの歪を計算し、アウトライアを除去する。本発明の一実施形態では、システムはラグランジュ乗数を参考のH.264(MPEG−4/Part 10)の実施態様よりも量子化値Qの関数として緩やかに変化するように変更する。ラグランジアンのクラスタ化はビット・レート低減のためのモード0符号化モードを支持するために使用される。
高品質ビデオ・シーケンスを用いた実験結果は、ビット・レートの低減がピーク信号対雑音比(PSNR)のわずかな損失の犠牲を払って本発明の方法を用いて得られることを示している。2つの異なる実験を行うことで、ピーク信号対雑音比が変化したにも関わらず主観的な画像損失がないということが検証された。
(非規範的)MPEG−4/Part 10エンコーダで現在採用されている既存の速度歪の最適化方法に関連して、本発明の方法は簡単で有用な拡張機能を表す。より重要なことには、量子化パラメータの値をさらに増やすなどの他の解決策が適用できない時には、復号化された画像には許容不能のアーティファクトが混入するので、本発明の方法は復号化シーケンスに観察できる歪を導入することなくビット・レート低減を達成する。
本発明の他の目的、特徴および利点は、添付の図面および下記の詳細な説明を読めば明らかになるだろう。
(図面の簡単な説明)
本発明の目的、特徴および利点は、以下の詳細な説明を読めば当業者には明らかとなるであろう。
図1は、変数γのHuberコスト関数を示すグラフである。
図2Aは、対象範囲の量子化パラメータ(Q)値の関数である元の、および修正ラグランジュ乗数λmodeの変化を示す図である。
図2Bは、対象範囲の量子化パラメータ(Q)値の関数であるBフレームの元の、および修正ラグランジュ乗数λmodeの変化を示す図である。
図2Cは、対象範囲の量子化パラメータ(Q)値の関数である元の、および修正ラグランジュ乗数λmotionの変化を示す図である。
図3は、符号化モードの選択方法を示す流れ図である。
符号化モード選択を改良する方法およびシステムスが開示される。以下の説明では、説明のために、本発明を十分に理解するための特定の用語を使用する。しかし、本発明を実施するために具体的な詳細は必要ないことは当業者には明らかであろう。
序論
MPEG−4/Part 10、Joint Video Team(JVT)、Advanced Video Coding(AVC)としても知られる先進のH.264ビデオ符号化標準およびH.26Lは、既存のMPEG標準に準拠する最先端のビデオ符号化方式より高度な動画圧縮を提供する目標を掲げた動画映像専門家グループ(Motion Picture Experts Group)(MPEG)および国際電気通信連合(ITU)によって共同開発されてきた。2003年の国際標準になると思われるH.264の対象分野は、テレビ会議、ディジタル記憶媒体、テレビジョン放送、インターネット・ストリーム伝送および通信を含む(が、それに限定されない)。
他のビデオ符号化標準と同様に、(その本文または付属書で)H.264標準は速度歪(RD)決定の枠組みを採用する。特に、H.264標準は符号化モード選択および動き予測の速度歪最適化を採用する。この開示では、第1の焦点はH.264標準の枠内の符号化モード選択に向けられる。
大半のディジタル・ビデオ符号化方式では、ビデオ・シーケンスの各ビデオ・フレームは画素ブロックと呼ばれる画素のサブセットに分割される。H.264標準では、画素ブロックはさまざまなサイズを有する(16×16画素に等しいサイズの画素ブロックは従来マクロブロックとして知られる)。符号化モード選択の問題は、非公式には「ビデオ・フレーム内の各画素ブロックを符号化するすべての可能な符号化方法(または符号化モード)のうち最良のものを選択する手順」と定義できる。符号化モード選択の問題はいくつかの異なった方法でビデオ・エンコーダによって解決できる。符号化モード選択の問題を解決する1つの可能な方法は速度歪最適化の使用である。
H.264ビデオ符号化標準の枠内で各画素ブロックを符号化するために選択できる多数の異なる符号化モードがある。モード0はBフレーム内の「直接モード」として、またPフレーム内の「スキップ・モード」として知られる。別の符号化モードは、B画像またはP画像内の16×16、16×8および8×16画素、8×8、8×4、4×8、4×4画素に等しいサイズの画素ブロックを使用する。
直接モード(B画像のモード0)では、デコーダに動き情報は送信されない。その代わり、予測システムを用いて動き情報が生成される。したがって、直接モードは、隣接する空間または時間情報を用いる優れた動きベクトル予測を可能にするシーケンスのビット・レートの節約を提供できる。しかし、実験結果は、H.264の直接モード選択はビデオ・シーケンスによっては予測されただけの数の選択画素ブロックを生成しないことを示している。
本開示は、H.264標準の枠内の双方向予測画像(B画像またはBフレームとして知られる)内の直接モード(モード0)の選択を拡張する方法を提案する。Pフレームに適用された場合、本発明の符号化方法はスキップ・モード(またはモード0)選択の拡張を達成する。直接モードとスキップ・モードの拡張は、ラグランジアン値のクラスタ化と、アウトライアの除去と、符号化モード選択のための速度歪最適化の際のラグランジュ乗数のより小さい値の指定とによって達成される。
高品質サンプル・ビデオ・シーケンスを用いた実験結果は、本発明の圧縮ビットストリームのビット・レートが参考のH.264コーデックを用いて得た圧縮ビットストリームより速度が低減していることを示す。このビット・レート低減はビットストリームのピーク信号対雑音比(PSNR)のわずかな損失に関連する。しかし、2つの実験は、ピーク信号対雑音比の変化にはいかなる主観的な画像損失も対応しないことを示している。より重要なことには、復号化された画像に許容できないアーティファクトが混入するので量子化パラメータの値をさらに増やすなどの他の可能な解決策は適用できないが、本発明の方法は復号化ビデオ・シーケンス内に観察できる歪を混入させることなくさらなるビット・レート低減を有意に達成する。さらに、本発明はH.264の枠組みを利用するという事実にも関わらず、本発明の符号化方法は速度歪最適化を使用する任意のビデオ符号化システムに適用可能である。
本明細書の残りの構成は以下の通りである。まず、ビデオ圧縮の概要の部で、H.264標準の速度歪最適化の枠組みに関連する基本概念を述べる。次いで、提案する直接モード拡張方法の部で本発明が提案する符号化方法を詳述する。最後に、実験結果の部と結論の部でそれぞれ実験結果と結論を述べる。
ビデオ圧縮の概要
本明細書で前述したように、各ビデオ・フレームはH.264標準の画素ブロックのセットに分割される。これらの画素ブロックは動き補償予測符号化を用いて符号化できる。予測画素ブロックは、その符号化のために前の画像からの情報を用いないイントラ(I)画素ブロック(I画素ブロック)、1つの前の画像の情報を用いる片方向予測(P)画素ブロック(P画素ブロック)、または1つの前の画像と1つの後の画像との情報を用いる双方向予測(B)画素ブロック(B画素ブロック)である。
P画像内のP画素ブロックごとに、1つの動きベクトルが計算される。(なお、各ビデオ画像内で画素ブロックは多くの方法で符号化できる。例えば、画素ブロックはより小さいサブブロックに分割して、各サブブロックごとに動きベクトルを計算し送信できる。サブブロックの形状は変わることがあり、正方形でなくてもよい。)コンピュータの動きベクトルを用いて、上述の前の画像内の画素を平行移動して予測画素ブロックを形成できる。次に、ビデオ画像内の実際の画素ブロックと予測画素ブロックとの差が送信のために符号化される。(この差を用いて予測画素ブロックと実際の画素ブロックの小さな差を修正する。)
各動きベクトルは、また予測符号化によって送信できる。すなわち、動きベクトルの予測はすでに送信済みの近くの動きベクトルを用いて形成でき、次いで実際の動きベクトルと予測動きベクトルとの差が送信のために符号化される。
各B画素ブロックで、2つの動きベクトルが通常計算され、1つの動きベクトルは上記前の画像、1つの動きベクトルは後の画像に使用される。(ただし、P画像またはB画像内で、一部の画素ブロックは動き補償がないほうが符号化がうまくいく。そのような画素はイントラ画素ブロックとして符号化できる。B画像内で、一部の画素ブロックは前方または後方片方向動き補償があったほうが符号化がうまくいく。そのような画素は、予測に前の画像を使うか後の画像を使うかによって前方予測または後方予測として符号化できる。)2つのB画素ブロック動きベクトルから、2つの予測画素ブロックが計算される。次いで2つの予測画素ブロックは組み合わされて最終予測画素ブロックを形成する。上記のように、ビデオ画像内の実際の画素ブロックと予測ブロックとの差が送信のために符号化される。
P画素ブロックの場合、B画素ブロックの各動きベクトルは予測符号化によって送信できる。すなわち、予測動きベクトルは送信済みの近くの動きベクトルを用いて形成できる。次いで、実際の動きベクトルと予測動きベクトルとの差が送信のために符号化される。
しかし、B画素ブロックでは、記憶された画像の同位置の、または近くの画素ブロック内の動きベクトルから動きベクトルを補間する余地がある。(動きベクトル予測が現在の画素ブロックの同位置のブロックの動きベクトルを用いて構成される時には、直接モード・タイプは時間的な直接モードとして知られる。動きベクトル予測が現在の画素ブロックの空間的に隣接する画素ブロックを用いて構成される時には、直接モード・タイプは空間的な直接モードとして知られる。)次に、補間された値は予測動きベクトルと、送信のために符号化された実際の動きベクトルと予測動きベクトルとの差として使用できる。そのような補間はエンコーダとデコーダの両方で実行される。(ただし、エンコーダは常にデコーダを有するので、エンコーダは再構成されたビデオ画像の表示状態を正確に認識できる。)
場合によっては、補間された動きベクトルはいかなる修正差もなしに十分に使用できる。その場合、全く動きベクトル・データを送信する必要はない。これはH.264(およびH.263)標準では直接モードと呼ばれている。直接モード選択は、記録用カメラが固定した背景を低速でパンする時に特に有効である。実際、動きベクトル補間はそのまま十分に使用できる。すなわち、これらのB画素ブロック動きベクトルについて差分情報を送信する必要がない。スキップ・モード(P画像のモード0)では、動きベクトル予測は16×16直接モードと同じに構成され、動きベクトル・ビットの送信は実行されない。
送信に先立って、画素ブロックまたはサブブロックの予測誤差(差)が、通常、変換され、量子化され、エントロピー符号化されてビット数が減らされる。予測誤差は、元の所望の画素ブロックと直接モードによる符号化後の復号化された予測画素ブロックとの平均平方誤差として計算され、直接モードで符号化される。しかし、予測誤差はスキップ・モードで符号化および送信されない。変換に使用されるサブブロックのサイズと形状とは動き補償に使用されるサブブロックのサイズと形状と同じではない。例えば、8×8の画素または4×4の画素は一般に変換に使用されるが、16×16の画素、16×8の画素、8×16の画素、またはそれより小さいサイズは動き補償に一般に使用される。動き補償および変換サブブロックのサイズおよび形状は画素ブロックによって変化する。
各画素ブロックを符号化する最良の符号化モードの選択は、圧縮ビットストリームのビット・レートRと復号化されたビデオ・シーケンスの内の歪Dに極めて直接影響を与えるH.264標準の決定の1つである。符号化モードの選択の目標は、ビット・レート制約R( ̄p)≦Rmax( ̄pは調整可能な符号化パラメータのベクトル、Rmaxは最大許容ビット・レート)を受ける歪D( ̄p)を最小限にする符号化モードMを選択することである。制約つき最適化問題は、下式で与えられるラグランジュの方程式J( ̄p,λ)を用いて制約なし最適化問題に変換できる。
Figure 2006516375
ただし、λは速度歪トレードオフを制御するラグランジュ乗数である。符号化モード決定問題はJ( ̄p,λ)の最小化となる。これは下式で表される。
Figure 2006516375
上記ラグランジュの方程式は、許容可能な符号化モードごとに以下のステップを実行することで評価できる。
(a)歪Dを元の画素ブロックと特定の符号化モードを用いた符号化および復号化後の再構成された画素ブロックとの間の誤差のL規範として計算する。
(b)ビット・レートRを、動きベクトルおよび変換係数を符号化するのに必要な総ビット数として計算する。
(c)式(1)を用いてラグランジアンJを計算する。
最後に、すべての符号化モードについてラグランジアンJの値を計算した後に得られた最小ラグランジアンJは、式(2)で表す最小化問題を解決する符号化モードMを示す。
H.264ビデオ圧縮標準では、符号化モードの決定は8×8以下の画素ブロックを用いて実行され、次いでそれより大きいサイズについて符号化モードが決定される。さらに、最適化プロセスの複雑さを低減しようとして、最小化の決定は固定量子化値Qで実行され、ラグランジュ乗数はしばしば(例えば)0.85×Q/2または0.85×2Q/3に等しい値に選択される。ただし、Qは量子化パラメータである。複数のB画像の場合、はるかに大きい値が選択されることが多い。もちろん、この複雑さの低減によって速度歪平面内のラグランジアンJの最小値の検索も制約される。
提案する直接モード拡張方法
本発明のシステムは、Bフレーム内の直接モード選択およびPフレーム内のスキップ・モード選択の拡張の方法を提案する。本発明のシステムは、コスト値のクラスタ化、アウトライアの低減、およびラグランジュ乗数の指定を使用する。一実施形態では、このシステムは4つのステップを用いる方法を実行する。以下、図3を参照しながらこれらの方法ステップについて詳述する。
第1に、現在の画素ブロックは各々の可能な符号化モードMについて符号化および復号化され、歪Dはステップ310および320で述べたように計算される。一実施形態では、歪Dは元の画素ブロック内の画素と符号化された画素ブロック内の画素との誤差のHuber関数値の総計として計算される。Huber関数は、図1に示され、下式で与えられる。
Figure 2006516375
ただし、xは画素ブロックの1つの画素の誤差、βはパラメータである。見て分かるように、βより小さい誤差値について、Huber関数の値は平方誤差によって与えられる値に等しい。βより大きい誤差値について、Huber関数の値は同じ誤差値の平方誤差の値より小さい。
第2に、ステップ330で述べたように、各符号化モードのビット・レートRが計算される。一実施形態では、このシステムは、ビット・レートRを、画素ブロックの動きベクトルおよび変換係数を符号化するのに必要な総ビット数として計算する。
第3に、本発明のシステムは、ステップ340で述べたように、式(1)を用いて符号化モードのラグランジアンを計算する。一実施形態では、システムは、ラグランジュ乗数λの値が、量子化パラメータの関数として、H.264標準バージョン4.1の非規範部で提案されている元のラグランジジアンλよりも緩やかに変化するようにこれを選択する。量子化値Qの関数であるラグランジアンλの提案された変化を図2A、図2B、および図2Cに示す。ラグランジュ乗数λを参考実施態様のλよりも緩やかに変化させることで、本発明のシステムはラグランジュの方程式(1)のビット・レート構成要素Rよりも歪構成要素Dにより重点を置く。このラグランジュ乗数λへの移行の結果、ビット・レートRがわずかに増加しても出力ラグランジアン値Jへの影響は少なくなる。(また、ビット・レートRが以下の節で説明するラグランジアン・クラスタに与える影響は低減する。)
第4に、すべてのJについてJM*をJの最小値とする(式(1)を用いて)(ただし、Mは可能な符号化モードの1つ)。JM*を生成する符号化モードと同じ符号化モード(M)を選択する代わりに、システムは計算されたラグランジアンJの値を以下のようにクラスタ化する。Sを、計算されたラグランジアン値が以下の条件を満たす符号化モードkの集合とする。
Figure 2006516375
ただし、イプシロン(「ε」)は選択された誤差値、Jはすべてのモードで最小のJである。符号化モード0が集合Sの要素の場合、システムは画素ブロックを符号化するために使用する符号化モードとして符号化モード0を選択する。そうでない場合、システムはJM*(最小のJ値を生成する符号化モードM)に対応する符号化モードMを選択する。
上記ステップは参考(非規範的)H.264エンコーダと比べて新規の構成要素を利用する。特に、本発明はHuberコスト関数を用いて歪、修正ラグランジュ乗数、およびラグランジアン値のクラスタ化を計算する。
Huberコスト関数は堅牢なM推定器(estimator)に属する。これらの関数の重要な特性はアウトライアの影響を低減する能力である。より詳細には、画素ブロック内にアウトライアが存在する場合、Huberコスト関数がそれらを平均平方誤差関数の場合(二次式)よりも少なく重み付けし(一次式)、その画素ブロックについて選択された符号化モードをおそらく隣接マクロブロックの符号化モードと同じにする。
修正ラグランジュ乗数λは量子化パラメータQの関数としてより緩やかに変化するため、ビット・レート構成要素RよりもラグランジアンJの歪構成要素により重点を置く。(本明細書では、「ラムダ」またはラムダ記号「λ」は符号化モード決定プロセスで使用されるラグランジュ乗数を示す。動きベクトル選択プロセスで使用される乗数は異なる。)
最後に、前述したラグランジアン値のクラスタ化は符号化モード0を選択する。したがって、本発明のシステムによって、それぞれB画素ブロックおよびP画素ブロックについて直接モードまたはスキップ・モードを用いてより多くの画素ブロックを符号化することができる。
実験の結果
実験で使用したビデオ試験セットは映画シーケンス「エジプトの発見」、「風と共に去りぬ」、および「イングリッシュ・ペーシェント」から抜粋した9つのカラー・ビデオ・クリップからなる。これらのビデオ・シーケンスの具体的な特徴を表1に示す。
Figure 2006516375
ビデオ・フレームはそれぞれYUVフォーマットで表現され、ビデオ・フレーム速度はすべてのビデオ・シーケンスで23.976フレーム/秒(fps)に等しい。本発明で提案する方法の有効性は圧縮ビデオ・シーケンスのビット・レートRと復号化されたビデオ・シーケンスの画像品質とを用いて評価されている。後者はビデオ・シーケンスの目視点検とピーク信号対雑音比(PSNR)値によって評価されている。
提案する直接モード拡張方法の節に記載した本発明の符号化方法の新規の構成要素はその速度および歪への影響に関して互いに補う。本発明の方法は、ビット・レートの全面的な低減とピーク信号対雑音比のわずかな低減とを生成する。本発明のシステムは以下の節に述べる2つの実験を用いて評価されている。
全シーケンスについての固定量子化パラメータ
第1の実験は全てのビデオ・シーケンスで等しく、それぞれIフレーム、Pフレーム、BフレームでQ、Q+1、Q+3に等しい量子化パラメータQを選択する。表2に示すように、ビット・レートの低減は本発明の符号化方法を使用すると9%であるが、ピーク信号対雑音比(PSNR)の損失は約0.12dBである。参考の方法を用いて符号化した場合とは対照的に、本発明の符号化方法を用いて符号化したビデオ・シーケンスには歪は見られない。
Figure 2006516375
シーケンスごとの最大量子化パラメータ
本発明の符号化方法の有用性をさらに評価するために、第2の実験が設計され実行された。ビット・レートRとピーク信号対雑音比の値が共に減少する時の一般的な説明は、ビデオ・シーケンスの事前フィルタリング、量子化値Qの値の増加など多数の方法が同じ結果を生むという説明である。この実験の目標は、これらの解決策がビデオ品質を大幅に損ねることなく適用できない時に、本発明の方法はビット・レートを低減できるということを示すことである。
第1に、各試験ビデオ・シーケンスで、ビット・レートは歪が観察できる状態になるQmax+1になるまで量子化パラメータの値を増加させることで参考の方法を用いて最大限低減される。次に、本システムは、Qmax(歪がまだ観察できる状態でない最大値)および参考の方法を用いてビデオ・シーケンスを符号化および復号化し、表3に示すビット・レートとピーク信号対雑音比(PSNR)値とを生成する。各シーケンスで、Qmaxの値は異なり、それぞれIフレーム、Pフレーム、Bフレームでも異なる。画像損失なしにビット・レートの低減をこうして最大限に達成したことで、本発明の符号化方法は同じ値Qmaxのシーケンスの符号化に適用される。
Figure 2006516375
表3に示すように、本発明の方法は、ビット・レートを最大13.3%と大幅に低減でき、かつ、ピーク信号対雑音比(PSNR)の損失は約0.29dBである。フルフレーム速度でのシーケンスの目視点検(任意のBフレーム関連のアーティファクトを評価するための)によって、このビット・レートの低減によって復号化されたビデオ・シーケンス内に可視アーティファクトが混入しないことが分かる。本発明の方法を使用する時には、量子化パラメータの値をQmaxより増やすことができ、画像損失なしにビット・レートを低減することができる。
結論
本発明は、H.264(MPEG−4/Part 10)ビデオ圧縮標準の枠内のB画像内の直接モード拡張およびP画像内のスキップ・モード拡張の方法を提案した。本発明のシステムはHuberコスト関数を用いて歪、修正ラグランジュ乗数、およびラグランジアン値のクラスタ化を計算し、画素ブロックを符号化するための符号化モードを選択する。試験によって、本発明の方法を用いて、主観的な画像品質の低下を招くことなくピーク信号対雑音比(PSNR)のわずかな損失でビット・レートを大幅に低減することができることが分かった。これらの特徴によって、本発明の方法は、量子化パラメータの値をこれ以上増やすといったその他の解決策が適用できない場合に拡張機能として符号化モード決定の速度歪最適化の枠組みを採用する任意のビデオ符号化システムでのビット・レートの低減に特に有用である。
以上、ディジタル画像拡張を実行する方法および装置について説明した。本発明の範囲を逸脱することなしに、当業者は本発明の要素の材料および構成を変更し修正することができる。
変数γのHuberコスト関数を示すグラフである。 対象範囲の量子化パラメータ(Q)値の関数である元の、および修正ラグランジュ乗数λmodeの変化を示す図である。 対象範囲の量子化パラメータ(Q)値の関数であるBフレームの元の、および修正ラグランジュ乗数λmodeの変化を示す図である。 対象範囲の量子化パラメータ(Q)値の関数である元の、および修正ラグランジュ乗数λmotionの変化を示す図である。 符号化モードの選択方法を示す流れ図である。
符号の説明
310,320,330,340,350 ステップ

Claims (19)

  1. ビデオ圧縮および符号化システムでモード選択を実行する方法であって、
    各々の可能な符号化モードで符号化および復号化するステップと、
    符号化モードごとにアウトライアの影響を低減する歪値を計算するステップと、
    符号化モードごとにビット・レート値を計算するステップと、
    前記歪値、前記ビット・レート値、およびラグランジュ乗数を用いて符号化モードごとにラグランジアン値を計算するステップと、
    前記ラグランジアン値を用いて符号化モードを選択するステップとを含む方法。
  2. 前記歪値を計算するステップがHuber関数を使用するステップを含む請求項1に記載の方法。
  3. 前記ビット・レートを計算するステップが動きベクトルのセットおよび変換係数のセットを符号化するのに必要な総ビット数を含む請求項1に記載の方法。
  4. 前記ラグランジュ乗数が量子化値の関数としての緩やかに変化するラグランジュ乗数を含む請求項1に記載の方法。
  5. 前記ラグランジアン値を使用する符号化モードを選択するステップが、前記ラグランジアン値をクラスタ化するステップと、モード0符号化方法が特定のクラスタ内にある場合に前記モード0符号化方法を選択するステップとを含む請求項1に記載の方法。
  6. 前記特定のクラスタが最小ラグランジアン値を生成する符号化モードを含む請求項5に記載の方法。
  7. ビデオ圧縮および符号化システムでモード選択を実行する方法であって、
    各々の可能な符号化モードで符号化および復号化するステップと、
    符号化モードごとに歪値を計算するステップと、
    符号化モードごとにビット・レート値を計算するステップと、
    前記歪値、前記ビット・レート値、およびラグランジュ乗数を用いて符号化モードごとにラグランジアン値を計算するステップであって、前記ラグランジュ乗数が量子化値の関数としての緩やかに変化するラグランジュ乗数を含むステップと、
    前記ラグランジアン値を用いて符号化モードを選択するステップとを含む方法。
  8. 前記歪値がアウトライアの影響を低減する請求項7に記載の方法。
  9. 前記歪値を計算するステップがHuber関数を使用するステップを含む請求項7に記載の方法。
  10. 前記ビット・レート値を計算するステップが動きベクトルのセットおよび変換係数のセットを符号化するのに必要な総ビット数を含む請求項7に記載の方法。
  11. 前記ラグランジアン値を使用する符号化モードを選択するステップが、前記ラグランジアン値をクラスタ化するステップと、モード0符号化方法が特定のクラスタ内にある場合に前記モード0符号化方法を選択するステップとを含む請求項7に記載の方法。
  12. 前記特定のクラスタが最小ラグランジアン値を生成する符号化モードを含む請求項5に記載の方法。
  13. ビデオ圧縮および符号化システムでモード選択を実行する方法であって、
    各々の可能な符号化モードで符号化および復号化するステップと、
    符号化モードごとに歪値を計算するステップと、
    符号化モードごとにビット・レート値を計算するステップと、
    前記歪値、前記ビット・レート値、およびラグランジュ乗数を用いて符号化モードごとにラグランジアン値を計算するステップと、
    前記ラグランジアン値をクラスタ化するステップと、
    モード0符号化方法が特定のクラスタ内にある場合に前記モード0符号化方法を選択することで前記ラグランジアン値を選択するステップとを含む方法。
  14. 前記歪値がアウトライアの影響を低減する請求項13に記載の方法。
  15. 前記歪値を計算するステップがHuber関数を使用するステップを含む請求項13に記載の方法。
  16. 前記ビット・レート値を計算するステップが動きベクトルのセットおよび変換係数のセットを符号化するのに必要な総ビット数を含む請求項13に記載の方法。
  17. 前記ラグランジュ乗数が量子化値の関数として緩やかに変化するラグランジュ乗数を含む請求項13に記載の方法。
  18. 前記特定のクラスタが最小ラグランジアン値を生成する符号化モードを含む請求項13に記載の方法。
  19. 前記方法が、
    モード0符号化方法が特定のクラスタ内にない場合に最小ラグランジアン値を生成する符号化モードを選択するステップをさらに含む請求項13に記載の方法。
JP2006500826A 2003-01-08 2004-01-07 改良型符号化モード選択の方法および装置 Expired - Fee Related JP4480713B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US43906203P 2003-01-08 2003-01-08
US10/614,929 US7194035B2 (en) 2003-01-08 2003-07-07 Method and apparatus for improved coding mode selection
PCT/US2004/000316 WO2004064414A2 (en) 2003-01-08 2004-01-07 Method and apparatus for improved coding mode selection

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2008011920A Division JP5021507B2 (ja) 2003-01-08 2008-01-22 改良型符号化モード選択の方法および装置

Publications (3)

Publication Number Publication Date
JP2006516375A true JP2006516375A (ja) 2006-06-29
JP2006516375A5 JP2006516375A5 (ja) 2008-03-13
JP4480713B2 JP4480713B2 (ja) 2010-06-16

Family

ID=32685543

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2006500826A Expired - Fee Related JP4480713B2 (ja) 2003-01-08 2004-01-07 改良型符号化モード選択の方法および装置
JP2008011920A Expired - Fee Related JP5021507B2 (ja) 2003-01-08 2008-01-22 改良型符号化モード選択の方法および装置

Family Applications After (1)

Application Number Title Priority Date Filing Date
JP2008011920A Expired - Fee Related JP5021507B2 (ja) 2003-01-08 2008-01-22 改良型符号化モード選択の方法および装置

Country Status (5)

Country Link
US (3) US7194035B2 (ja)
EP (1) EP1584200A2 (ja)
JP (2) JP4480713B2 (ja)
KR (2) KR101061275B1 (ja)
WO (1) WO2004064414A2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009071837A (ja) * 2007-09-14 2009-04-02 Sony Corp 人間の視覚的許容度に基づくビデオ符号化の符号化ツールの選択

Families Citing this family (59)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6735253B1 (en) 1997-05-16 2004-05-11 The Trustees Of Columbia University In The City Of New York Methods and architecture for indexing and editing compressed video over the world wide web
US7143434B1 (en) 1998-11-06 2006-11-28 Seungyup Paek Video description system and method
US7339992B2 (en) 2001-12-06 2008-03-04 The Trustees Of Columbia University In The City Of New York System and method for extracting text captions from video and generating video summaries
US7042943B2 (en) 2002-11-08 2006-05-09 Apple Computer, Inc. Method and apparatus for control of rate-distortion tradeoff by mode selection in video encoders
US7194035B2 (en) 2003-01-08 2007-03-20 Apple Computer, Inc. Method and apparatus for improved coding mode selection
US7324595B2 (en) * 2003-09-22 2008-01-29 Lsi Logic Corporation Method and/or apparatus for reducing the complexity of non-reference frame encoding using selective reconstruction
JP4031455B2 (ja) * 2004-03-29 2008-01-09 株式会社東芝 画像符号化装置
US7570827B2 (en) * 2004-07-14 2009-08-04 Slipstream Data Inc. Method, system and computer program product for optimization of data compression with cost function
EP1790167B1 (en) * 2004-09-16 2010-01-06 Thomson Licensing Method and apparatus for fast mode decision for interframes
KR100664929B1 (ko) * 2004-10-21 2007-01-04 삼성전자주식회사 다 계층 기반의 비디오 코더에서 모션 벡터를 효율적으로압축하는 방법 및 장치
WO2006080662A1 (en) * 2004-10-21 2006-08-03 Samsung Electronics Co., Ltd. Method and apparatus for effectively compressing motion vectors in video coder based on multi-layer
EP1808025B1 (en) * 2004-11-04 2016-03-09 Thomson Licensing Method and apparatus for fast mode decision of b-frames in a video encoder
US7764740B2 (en) * 2004-11-24 2010-07-27 Electronics And Telecommunications Research Institute Fast block mode determining method for motion estimation, and apparatus thereof
US7751478B2 (en) * 2005-01-21 2010-07-06 Seiko Epson Corporation Prediction intra-mode selection in an encoder
WO2006096612A2 (en) * 2005-03-04 2006-09-14 The Trustees Of Columbia University In The City Of New York System and method for motion estimation and mode decision for low-complexity h.264 decoder
WO2006104357A1 (en) * 2005-04-01 2006-10-05 Samsung Electronics Co., Ltd. Method for compressing/decompressing motion vectors of unsynchronized picture and apparatus using the same
KR100763179B1 (ko) * 2005-04-01 2007-10-04 삼성전자주식회사 비동기 픽쳐의 모션 벡터를 압축/복원하는 방법 및 그방법을 이용한 장치
US8208536B2 (en) * 2005-04-28 2012-06-26 Apple Inc. Method and apparatus for encoding using single pass rate controller
US8054882B2 (en) * 2005-05-13 2011-11-08 Streaming Networks (Pvt.) Ltd. Method and system for providing bi-directionally predicted video coding
JPWO2006123606A1 (ja) * 2005-05-16 2008-12-25 パイオニア株式会社 レート変換器
US7830961B2 (en) * 2005-06-21 2010-11-09 Seiko Epson Corporation Motion estimation and inter-mode prediction
US8094716B1 (en) * 2005-08-25 2012-01-10 Maxim Integrated Products, Inc. Method and apparatus of adaptive lambda estimation in Lagrangian rate-distortion optimization for video coding
US7944965B2 (en) * 2005-12-19 2011-05-17 Seiko Epson Corporation Transform domain based distortion cost estimation
US8170102B2 (en) * 2005-12-19 2012-05-01 Seiko Epson Corporation Macroblock homogeneity analysis and inter mode prediction
US7843995B2 (en) * 2005-12-19 2010-11-30 Seiko Epson Corporation Temporal and spatial analysis of a video macroblock
KR100781525B1 (ko) * 2006-04-06 2007-12-03 삼성전자주식회사 가중 평균합을 이용하여 fgs 계층을 인코딩 및디코딩하는 방법 및 장치
US7401062B2 (en) * 2006-06-13 2008-07-15 International Business Machines Corporation Method for resource allocation among classifiers in classification systems
US8265172B2 (en) 2006-08-30 2012-09-11 Thomson Licensing Method and apparatus for analytical and empirical hybrid encoding distortion modeling
KR100845303B1 (ko) * 2006-09-29 2008-07-10 한국전자통신연구원 고속 부호화를 위한 되먹임 구조를 가진 동영상 압축부호화 장치 및 최적 모드 결정 방법
US8358699B2 (en) * 2007-04-09 2013-01-22 Cavium, Inc. Method and system for selection of reference picture and mode decision
US8175150B1 (en) * 2007-05-18 2012-05-08 Maxim Integrated Products, Inc. Methods and/or apparatus for implementing rate distortion optimization in video compression
US8315296B2 (en) 2007-05-21 2012-11-20 Research In Motion Limited Method for testing a radio frequency (RF) receiver and related methods
KR101172430B1 (ko) * 2007-08-17 2012-08-08 삼성전자주식회사 비트율 제어 방법 및 그 장치
US20090052540A1 (en) * 2007-08-23 2009-02-26 Imagine Communication Ltd. Quality based video encoding
FR2925819A1 (fr) * 2007-12-21 2009-06-26 Thomson Licensing Sas Procede de codage double passe par macrobloc
US8295356B2 (en) * 2008-03-07 2012-10-23 International Business Machines Corporation Method and system for coding mode selection in video compression systems
KR101431545B1 (ko) 2008-03-17 2014-08-20 삼성전자주식회사 영상의 부호화, 복호화 방법 및 장치
WO2009126785A2 (en) 2008-04-10 2009-10-15 The Trustees Of Columbia University In The City Of New York Systems and methods for image archaeology
US20090274213A1 (en) * 2008-04-30 2009-11-05 Omnivision Technologies, Inc. Apparatus and method for computationally efficient intra prediction in a video coder
US20090274211A1 (en) * 2008-04-30 2009-11-05 Omnivision Technologies, Inc. Apparatus and method for high quality intra mode prediction in a video coder
US8451719B2 (en) * 2008-05-16 2013-05-28 Imagine Communications Ltd. Video stream admission
WO2009155281A1 (en) 2008-06-17 2009-12-23 The Trustees Of Columbia University In The City Of New York System and method for dynamically and interactively searching media data
WO2010033565A1 (en) * 2008-09-16 2010-03-25 Dolby Laboratories Licensing Corporation Adaptive video encoder control
US8671069B2 (en) 2008-12-22 2014-03-11 The Trustees Of Columbia University, In The City Of New York Rapid image annotation via brain state decoding and visual pattern mining
US8498493B1 (en) 2009-06-02 2013-07-30 Imagination Technologies Limited Directional cross hair search system and method for determining a preferred motion vector
US10477249B2 (en) * 2009-06-05 2019-11-12 Apple Inc. Video processing for masking coding artifacts using dynamic noise maps
EP3399745A1 (en) 2009-09-10 2018-11-07 Guangdong OPPO Mobile Telecommunications Corp., Ltd. Speedup techniques for rate distortion optimized quantization
EP2520092A1 (en) * 2009-12-31 2012-11-07 Thomson Licensing Methods and apparatus for adaptive coupled pre-processing and post-processing filters for video encoding and decoding
KR101418104B1 (ko) * 2010-03-08 2014-07-16 에스케이 텔레콤주식회사 움직임 벡터 해상도 조합을 이용한 움직임 벡터 부호화/복호화 방법 및 장치와 그를 이용한 영상 부호화/복호화 방법 및 장치
KR101099257B1 (ko) 2010-03-12 2011-12-27 호서대학교 산학협력단 H.264/avc에서 매크로 블록의 부호화 모드 고속 결정방법
US9781449B2 (en) * 2011-10-06 2017-10-03 Synopsys, Inc. Rate distortion optimization in image and video encoding
US9338463B2 (en) 2011-10-06 2016-05-10 Synopsys, Inc. Visual quality measure for real-time video processing
US10230956B2 (en) 2012-09-26 2019-03-12 Integrated Device Technology, Inc. Apparatuses and methods for optimizing rate-distortion of syntax elements
US20140219331A1 (en) * 2013-02-06 2014-08-07 Magnum Semiconductor, Inc. Apparatuses and methods for performing joint rate-distortion optimization of prediction mode
US9819962B2 (en) * 2015-04-06 2017-11-14 Ati Technologies Ulc Efficient low-complexity video compression
CA2986600A1 (en) * 2016-11-24 2018-05-24 Ecole De Technologie Superieure Method and system for parallel rate-constrained motion estimation in video coding
GB2557997B (en) * 2016-12-21 2019-05-01 Apical Ltd Encoding and Decoding of image data
CN109982082B (zh) * 2019-05-05 2022-11-15 山东大学 一种基于局部纹理特性的hevc多失真准则率失真优化方法
CN114760473A (zh) * 2021-01-08 2022-07-15 三星显示有限公司 用于执行速率失真优化的系统和方法

Family Cites Families (30)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5592302A (en) 1992-03-23 1997-01-07 Canon Kabushiki Kaisha Coding method for coding pixel blocks and apparatus therefor
EP0768008B1 (en) 1995-04-25 2000-07-05 Koninklijke Philips Electronics N.V. Device and method for coding video pictures
JPH10502791A (ja) 1995-04-25 1998-03-10 フィリップス エレクトロニクス ネムローゼ フェンノートシャップ 映画像符号化装置および方法
US5778192A (en) * 1995-10-26 1998-07-07 Motorola, Inc. Method and device for optimal bit allocation between different sources of information in digital video compression
US5872598A (en) * 1995-12-26 1999-02-16 C-Cube Microsystems Scene change detection using quantization scale factor rate control
US5929916A (en) * 1995-12-26 1999-07-27 Legall; Didier J. Variable bit rate encoding
US5801779A (en) * 1995-12-26 1998-09-01 C-Cube Microsystems, Inc. Rate control with panic mode
US5867221A (en) * 1996-03-29 1999-02-02 Interated Systems, Inc. Method and system for the fractal compression of data using an integrated circuit for discrete cosine transform compression/decompression
US5790131A (en) 1996-05-15 1998-08-04 Iterated Systems, Inc. System and method for lossy compression of data with output file size control
FR2753330B1 (fr) * 1996-09-06 1998-11-27 Thomson Multimedia Sa Procede de quantification pour codage video
US6111991A (en) * 1998-01-16 2000-08-29 Sharp Laboratories Of America Method and apparatus for optimizing quantizer values in an image encoder
US6493385B1 (en) * 1997-10-23 2002-12-10 Mitsubishi Denki Kabushiki Kaisha Image encoding method, image encoder, image decoding method, and image decoder
US6278735B1 (en) * 1998-03-19 2001-08-21 International Business Machines Corporation Real-time single pass variable bit rate control strategy and encoder
US6289129B1 (en) 1998-06-19 2001-09-11 Motorola, Inc. Video rate buffer for use with push dataflow
CN1184820C (zh) 1999-01-15 2005-01-12 皇家菲利浦电子有限公司 编码和噪声过滤图象序列
US6414992B1 (en) 1999-01-27 2002-07-02 Sun Microsystems, Inc. Optimal encoding of motion compensated video
US6760482B1 (en) * 1999-02-19 2004-07-06 Unisearch Limited Method for visual optimisation of embedded block codes to exploit visual masking phenomena
US6574279B1 (en) * 2000-02-02 2003-06-03 Mitsubishi Electric Research Laboratories, Inc. Video transcoding using syntactic and semantic clues
US6493386B1 (en) 2000-02-02 2002-12-10 Mitsubishi Electric Research Laboratories, Inc. Object based bitstream transcoder
US6490320B1 (en) * 2000-02-02 2002-12-03 Mitsubishi Electric Research Laboratories Inc. Adaptable bitstream video delivery system
US6687294B2 (en) 2001-04-27 2004-02-03 Koninklijke Philips Electronics N.V. Distortion quantizer model for video encoding
US6975680B2 (en) * 2001-07-12 2005-12-13 Dolby Laboratories, Inc. Macroblock mode decision biasing for video compression systems
EP1296524A1 (en) * 2001-09-20 2003-03-26 STMicroelectronics S.r.l. Process and apparatus for the compression of digital video signals, a system and a computer program product therefor
EP1347649A1 (en) * 2002-03-18 2003-09-24 Lg Electronics Inc. B picture mode determining method and apparatus in video coding system
KR100468726B1 (ko) 2002-04-18 2005-01-29 삼성전자주식회사 실시간 가변 비트율 제어를 수행하는 부호화 장치 및 방법
EP1520431B1 (en) 2002-07-01 2018-12-26 E G Technology Inc. Efficient compression and transport of video over a network
US7042943B2 (en) 2002-11-08 2006-05-09 Apple Computer, Inc. Method and apparatus for control of rate-distortion tradeoff by mode selection in video encoders
EP1933569A3 (en) 2002-11-08 2010-07-07 Apple Inc. Method and apparatus for control of rate-distortion tradeoff by using lagrange multiplier and/or quantizer value
EP1936995A3 (en) 2003-01-08 2011-01-19 Apple Inc. Method and apparatus for improved coding mode selection
US7194035B2 (en) * 2003-01-08 2007-03-20 Apple Computer, Inc. Method and apparatus for improved coding mode selection

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009071837A (ja) * 2007-09-14 2009-04-02 Sony Corp 人間の視覚的許容度に基づくビデオ符号化の符号化ツールの選択

Also Published As

Publication number Publication date
JP2008141787A (ja) 2008-06-19
US20040131121A1 (en) 2004-07-08
KR100919557B1 (ko) 2009-10-01
WO2004064414A3 (en) 2004-11-18
JP4480713B2 (ja) 2010-06-16
US8781002B2 (en) 2014-07-15
KR101061275B1 (ko) 2011-08-31
US20140362903A1 (en) 2014-12-11
KR20050098243A (ko) 2005-10-11
WO2004064414A2 (en) 2004-07-29
JP5021507B2 (ja) 2012-09-12
US20070127579A1 (en) 2007-06-07
US7194035B2 (en) 2007-03-20
EP1584200A2 (en) 2005-10-12
KR20090018719A (ko) 2009-02-20

Similar Documents

Publication Publication Date Title
JP5021507B2 (ja) 改良型符号化モード選択の方法および装置
JP5021502B2 (ja) ビデオ・エンコーダのモード選択によるレート歪みトレードオフの制御方法および装置
RU2409005C2 (ru) Способ масштабируемого кодирования и декодирования видеосигнала
JP4391809B2 (ja) 画像のシーケンスを適応的に符号化するシステムおよび方法
JP5918328B2 (ja) 画像符号化方法及び画像復号方法
KR100950743B1 (ko) 화상 정보 부호화 장치 및 방법, 및 화상 정보 복호 장치및 방법
JP2011045128A (ja) ビデオ符号化/復号化用の動き補償装置及びその方法
JP2012209965A (ja) 残差生成方法及び装置、並びに復元画面生成方法及び装置
JP2005515730A (ja) 符号化情報及び局所空間特性を用いて鮮鋭度を強調するシステム及び方法
JP4391810B2 (ja) 画像のシーケンスを適応的に符号化するシステムおよび方法
US20100020883A1 (en) Transcoder, transcoding method, decoder, and decoding method
JP2005513968A (ja) 映像鮮明度の向上における一時的な整合性の改善
JP2007525921A (ja) ビデオ符号化方法及び装置
KR20110089378A (ko) 디지털 비디오 부호화를 위한 가변 정확도 화상간 타이밍 지정 방법 및 장치
JP4421734B2 (ja) 符号化データ変換方法,及びデータ記録媒体
JP2007134755A (ja) 動画像符号化装置及び画像記録再生装置
EP1936995A2 (en) Method and apparatus for improved coding mode selection
WO2010023782A1 (ja) 画像表示装置、録画再生装置、及び画像処理方法
JP4674767B2 (ja) 動画像編集方法および装置
JP4561701B2 (ja) 動画像符号化装置
Tran Video Coding
Koto et al. Adaptive bi-predictive video coding using temporal extrapolation
Issa et al. Performance analysis of Dirac video codec with H. 264/AVC
Vijayakumar Low Complexity H. 264 To VC-1 Transcoder
JP2007184682A (ja) 画像符号化装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070104

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070119

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20071218

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20071227

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20071227

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20080116

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20080116

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080122

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20080122

A975 Report on accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A971005

Effective date: 20080312

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080415

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20080715

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20080723

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080815

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20081216

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20090316

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20090324

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20090416

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20090423

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20090518

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20090525

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090605

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090605

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20091027

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100127

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100302

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100316

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130326

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130326

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140326

Year of fee payment: 4

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees