JP2000506687A - 知覚量を用いて符号化を最適化し自動操作可能な画像圧縮を実行する装置及び方法 - Google Patents

知覚量を用いて符号化を最適化し自動操作可能な画像圧縮を実行する装置及び方法

Info

Publication number
JP2000506687A
JP2000506687A JP9522342A JP52234297A JP2000506687A JP 2000506687 A JP2000506687 A JP 2000506687A JP 9522342 A JP9522342 A JP 9522342A JP 52234297 A JP52234297 A JP 52234297A JP 2000506687 A JP2000506687 A JP 2000506687A
Authority
JP
Japan
Prior art keywords
image
fidelity
encoded
map
encoding
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP9522342A
Other languages
English (en)
Inventor
ピーターソン,ハイディ,エー.
リー,ジャンウー
Original Assignee
サーノフ コーポレイション
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by サーノフ コーポレイション filed Critical サーノフ コーポレイション
Publication of JP2000506687A publication Critical patent/JP2000506687A/ja
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/189Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
    • H04N19/196Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding being specially adapted for the computation of encoding parameters, e.g. by averaging previously computed encoding parameters
    • H04N19/198Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding being specially adapted for the computation of encoding parameters, e.g. by averaging previously computed encoding parameters including smoothing of a sequence of encoding parameters, e.g. by averaging, by choice of the maximum, minimum or median value
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • H04N19/126Details of normalisation or weighting functions, e.g. normalisation matrices or variable uniform quantisers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/142Detection of scene cut or scene change
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/147Data rate or code amount at the encoder output according to rate distortion criteria
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/154Measured or subjectively estimated visual quality after decoding, e.g. measurement of distortion
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/172Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/179Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a scene or a shot
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/189Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
    • H04N19/192Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding the adaptation method, adaptation tool or adaptation type being iterative or recursive
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/189Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
    • H04N19/196Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding being specially adapted for the computation of encoding parameters, e.g. by averaging previously computed encoding parameters
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/42Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/85Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
    • H04N19/87Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression involving scene cut or scene change detection in combination with video compression
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Theoretical Computer Science (AREA)
  • Computing Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

(57)【要約】 符号化される画像又はビデオ(104)の内容を分析することによって得られる知覚量に応じて符号化パラメータを調整する方法及び装置。すなわち、オリジナル画像(102)(又は、画像シーケンス)を再生された画像(110)と比較し、定量的な知覚差の計測値(112)を用いて比較結果を処理することによって知覚量が生成される(112)。差の計測値から、再生された画像の「忠実度」を表現する知覚量が得られる。この量が符号化パラメータ(108)を制御するのに使用され、それによって、画像の符号化を反復的に調整することができる。更に、この方法及び装置は、自動操作可能な画像圧縮システムを提供するために使用される。

Description

【発明の詳細な説明】 知覚量を用いて符号化を最適化し自動操作可能な画像圧縮を実行する 装置及び方法 本出願は、1996年3月29日出願の米国特許予備出願第60/014,2 66号、1996年3月29日出願の米国特許予備出願第60/014,272 号、及び、1996年3月29日出願の米国特許予備出願第60/014,27 3号による利益を主張するものである。 本発明は、画像又は画像シーケンスを最適符号化するための装置とそれに付随 する方法に関する。より詳細には、本発明は、指定された符号化レートを維持す るとともに、知覚量(perceptual metric)に基づいて画像全体の忠実度を最適 化するために、画像エンコーダに用いられる符号化パラメータを選択する方法及 び装置に関する。 発明の背景 異なった製造元のディジタルビデオ機器の相互運用性(interoperability)を 達成するために、動画像専門家グループ(MPEG)が、ISO/IEC国際標 準11172(1994年)(一般にはMPEG−1と呼ばれる)及びISO/ IEC国際標準13818(1995年1月20日の規格案)(一般にはMPE G−2と呼ばれる)を作成した。これらは、その全体が本明細書に援用されてい る。これらの規格の1つの目的は、卓上ビデオ出版、テレビ会議、ディジタル記 録媒体、及び、テレビジョン放送などの複数の異なる用途及びサービスを収容す るために十分な柔軟性を有する標準復号化方法を確立することである。 MPEG規格は、MPEG準拠ビットストリームを生成するための符号化文法 を特定しているが、効果的なビットストリームを生成するのに必要とされる特定 のアルゴリズムは規定していない。このように、多くの符号化パラメータに割り 当てられた値は種々に変化することが可能であり、それによって、広い範囲の利 用形態及び相互運用をサポートする。このMPEG規格によれば、MPEGエン コーダの設計者は、彼ら自身の特定のMPEGアルゴリズムを開発及び実施する 場合に、画像前処理、動き椎定、符号化モード決定、スケーラビリティ、及び、 レート制御などのような領域においてかなりの柔軟性を持つことが許されている 。この柔軟性が、様々なMPEG準拠符号化アルゴリズムの開発及び実施を助長 し、それによって、市場での製品差別化をもたらすのである。しかしながら、M PEGエンコーダの共通の目的は、定められたビットレートとして復号化された ビデオにおける歪みを最小限にすることである。 符号化レート制御の領域においては、MPEG規格は、エンコーダのビットレ ートを制御するための特定のアルゴリズムを規定していない。デコーダの入力バ ッファがオーバフローもアンダフローもしないようにビットレートを調整し、デ コーダの出力側で高忠実度のビデオを生成するように量子化スケールを調整する ためのレート制御処理を考案するのはエンコーダの設計者の仕事である。 復号化された画像の「外観」を改善するためには、圧縮解除(decompressed) されたビデオにおけるより重要な領域が、あまり重要でない領域よりも良好な忠 実度を有することが望ましい。 例えば、背景の前で話をしている人物から構成されるビデオシーンでは、復号 化されたビデオの視聴者は、話をしている人物に対してより興味があり、ゆえに 、それは背景情報よりも重要であろう。従って、シーンの重要な領域を表現する ために不均衡により多くの符号化ビットが使用され、かつ、あまり重要でない背 景情報を表現するために不均衡により少ない符号化ビットが使用されるようにエ ンコーダを「操作する(steer)」能力を有することは有益なことである。換言 すると、圧縮において、必須のエンコーダパラメータであるオーバタイム及び空 間位置を変化させることによって、結果として得られる圧縮解除画像の忠実度を 調整することが望まれる。このことは、一般的には、ユーザ操作画像圧縮と呼ば れる。 ユーザ操作画像圧縮に現在使用されている方法は反復処理である。例えば、エ ンコーダユーザのような「圧縮エンジニア」は、適切なエンコーダパラメータと して一組の値を指定し、画像を圧縮し、その結果として得られる圧縮解除された 画像を観察し、その画像はどこが空間的及び時間的に所望の画像より良く見える か或いは悪く見えるかを判定する。そして、それに応じて、圧縮エンジニアは、 エンコーダパラメータを調整し、圧縮解除された画像の様々な空間的及び時間的 領域における視覚的な忠実度に所望の変化を与える。 この方法の1つの問題は、この処理で使用される目標画像忠実度量(objectiv e image fidelity metric)がないために、画像忠実度を測定して画像忠実度の 所望の空間的及び時間的分布が達成されたかどうかを判定するための唯一の方法 は、圧縮エンジニアが圧縮解除された画像全体を実際に確かめることである。更 にまた、圧縮された情報が単一の画像ではなく画像シーケンス(例えば、ビデオ )であれば、圧縮エンジニアはビデオシーケンス全体を再評価しなければならな い。ユーザ操作画像圧縮のためのこの手動の方法はきわめて主観的なものであり 、そのために、一貫性がなく、時間がかかり、圧縮エンジニアを疲れさせるもの である。更に、この処理は、圧縮されるべきそれそれの画像又は画像シーケンス ごとに「最初から」反復されなければならない。更にまた、この方法は、圧縮エ ンジニアが、復号化された画像の忠実度に所望の変化を与えるためにはどのエン コーダパラメータが調整されるべきであるかを判断するために、圧縮アルゴリズ ムのかなりの専門的技術及び知識を有していることが必要である。このエンコー ダパラメータの調整は、試行錯誤によって頻繁になされなければならない。 従って、人間の視覚システムがどのように画像を観察するかを考慮して、すな わち、知覚画像忠実度を考慮して画像が最適に符号化されるように、知覚量に基 づいて画像符号化パラメータを動的に調整し、かつ、操作可能な画像圧縮を自動 的に実行する装置及び方法がこの技術分野において必要とされている。 発明の概要 本発明は、符号化される画像の内容を分析することによって得られる知覚量に 応じて画像符号化パラメータを選択する方法及び装置に関する。すなわち、オリ ジナル画像を再生された画像と比較し、定量的な知覚差の量を用いてその比較結 果を処理することによって、1以上の符号化パラメータ、例えばエンコーダの量 子化スケールが選択される。この量は、再生された画像の「忠実度」を表現し、 画像の符号化を最適化するために符号化パラメータを更新するのに使用される。 操作可能な画像圧縮を容易にするために、本発明は、忠実度量に基づいたエン コーダを使用し、入力画像を符号化するとともに忠実度マップを生成する。忠実 度マップは、ユーザが定義した重要度マップと比較される。忠実度マップと重要 度マップとが実質的に一致しなければ、システムは符号化パラメータを調整して 入力画像を再符号化する。符号化処理はもう1つの忠実度マップを生成し、そし て、それが重要度マップと比較されて2つのマップがどの程度まで一致している かが判定される。忠実度マップと重要度マップとが十分な程度まで一致するまで 、この反復処理がエンコーダパラメータを調整する。その時点において、符号化 された画像は、重要度マップによって指定されるように、高い忠実度に符号化さ れたある領域とより低い忠実度に符号化されたある領域とを有する。 図面の簡単な説明 添付された図面とともに以下の詳細な説明を考察することによって本発明の教 示内容が容易に理解できるであろう。 図1は、本発明によるエンコーダパラメータ選択器を組み込んだ画像エンコー ダのブロック構成図である。 図2は、図1に示される画像エンコーダの動作を説明するフローチャートであ る。 図3は、本発明の第二実施形態のブロック構成図であり、本発明による量子化 レートコントローラを組み込んだブロックに基づく画像符号化システムである。 図4は、図3に示される本発明の第二実施形態の動作を説明するフローチャー トである。 図5は、本発明の第3の実施形態のブロック構成図である。 図6は、本発明の第4の実施形態のブロック構成図である。 図7は、本発明による操作可能な圧縮ルーチンのフローチャートである。 図8は、本発明の符号化パラメータを調整するために用いられた具体的な関数 のグラフである。 理解を容易にするために、各図面を通して共通する同一の構成部材は、可能な 限り同じ符号で示す。詳細な説明 図1は、本発明によるエンコーダパラメータの選択が組み込まれた画像エンコ ーダシステム100を示す図である。具体的には、システム100は、画像エン コーダ104、エンコーダパラメータ選択器108、及び、知覚忠実度量発生器 112を含む。画像エンコーダ104は、例えば、静止画符号化専門グループ( JPEG)エンコーダ、GIF、PICT)及び、それらに類似するものなどの ような単一の画像エンコーダか、或いは、例えば、MPEG規格に準拠して動作 するブロックに基づく画像エンコーダのような画像シーケンス(ビデオ)のため のエンコーダであってもよい。この明細書の全体にわたって、画像シーケンス、 画像、及び、ビデオという用語は、それぞれ置き換えて使用することができる。 その最も広い解釈において、本発明は、知覚忠実度量に基づいた符号化パラメー タ選択から恩恵を得るであろう画像エンコーダ又は画像シーケンスエンコーダの どのような形態とでも協動する。 より詳細には、経路102に沿ったエンコーダ102への入力は画像又は画像 シーケンス(ビデオ)であり、経路106に沿った出力は入力画像のビットスト リーム表現である。更に、このエンコーダは、復号化された画像(「再生された 」画像としても知られる)を生成し、それは、エンコーダにおいて符号化されて 、更に、復号化された画像である。この再生された画像が、知覚忠実度量発生器 112に結合される。また、入力経路102は、知覚忠実度量発生器112に結 合される。知覚忠実度量発生器112は、エンコーダパラメータ選択器108に 結合される。そして、この選択器108はエンコーダ104に結合される。パラ メータ選択器108は、それ単独か或いは他のパラメータと組み合わせてすべて のパラメータを変更することができ、それが再生される画像の忠実度に影響を及 ぼす。例えば、パラメータには、エンコーダ量子化スケール、符号化ブロックサ イズ、ビットレート、及び、それらに類似するものが含まれ得る。 知覚忠実度量発生器112は、知覚量を生成するためにどのような種類の定量 的な知覚差の計測値を使用してもよい。そのような定量的な知覚差の計測値の1 つの例としては、弁別しきい値(Just Noticeable Difference:JND)マッ プがある。ビデオを符号化するための定量的な知覚差の計測値として使用するこ とのできる空間的及び時問的JNDマップ、すなわち、画像忠実度の2次元表現 が、本明細書に援用されている1996年6月17日出願の米国特許出願第08 /668,015号明細書に開示されている。その他の定量的な知覚差の計測と しては、A.B.Watson(ed.),Digital Images and Human Vision,MIT Pre ss,1993年の179〜206頁に記載された、S.Dalyによる「The Visible Differences Predictor:An algorithm for the Assessment of ImageQu ality(可視的な差分予測装置:画像品質を評価するためのアルゴリズム)」、 及び Society of Information Display International Symposium Diges t of Technical Papers,Vol.24(1993年)の317〜320頁に記載さ れた、S.Dalyによる「Quantitative Performance Assessment of an Algor ithm for the Determination of Image Quality(画像晶質を判定するた めのアルゴリズムの定量的な性能評価)」に開示されたものがある。 図2は、図1に示すエンコーダシステムの動作ルーチン200のフローチャー トである。ルーチン200は開始ブロック202から始まり、ステップ204に 進み、そこでエンコーダパラメータが選択される。このルーチンの第1回目の処 理によって、ステップ204は一組の初期パラメータ値を選択する。ステップ2 06において、ビデオが符号化される。ステップ208において、ビデオに対し て(又は、個々の画像に対して)忠実度量が生成される。ステップ210におい て、知覚忠実度量発生器112が、再生された画像をオリジナル画像と比較し、 再生された画像の忠実度を表現する忠実度の計測値(量)を生成する。すなわち 、このルーチンは、再生された画像がオリジナルのビデオを正確に表現している かどうかを判定するものである。エンコーダパラメータ選択器108は、この量 を使用して、1以上の調整可能なエンコーダパラメータに対して特定のパラメー タ値を選択する。ステップ210において、ルーチン200は、忠実度量が特定 の忠実度条件を満足するかどうかを問い合わせる。この条件は、ルーチンが反復 される回数の限度、忠実度の均一性の計測値、或いは、それらに類似するもので あってもよい。忠実度量が条件を満足しなければ、ルーチンは、経路212に沿 ってステップ204に戻る。ステップ204において、ルーチンは、ビデオを符 号化した後のステップ210の忠実度条件を満足させるためにパラメータ値を更 新する。ステップ210において、条件が満足されたならば、ルーチンは、「は い」の経路に沿ってこの処理を終了する。すなわち、ビデオシーケンスが最適に 符号化される。 図3は、本発明の第二実施形態のブロック構成図であり、本発明による符号化 技術を組み込んだブロックに基づく符号化システム300(具体的には、ビデオ を符号化するためのMPEG型エンコーダ)である。この実施形態においては、 本発明によって調整される符号化パラメータは、エンコーダ量子化スケールであ る。上述したように、当業者には、以下に記述される方法によってエンコーダの 他のパラメータも同様に調整できることが理解できるであろう。 システム300は、一般的にはディスクドライブか又はその他の画像シーケン ス発生源等の画像記憶装置(図示しない)から提供される少なくとも2つの画像 (第1の画像及び第2の画像)からなるシーケンスを符号化する。シーケンスは 、一組の初期量子化スケールを用いて符号化される。次に、符号化された画像に 対して特定の知覚量の値を実現するために、量子化スケールを最適化する反復処 理を用いてビデオの各画像が反復して符号化される。 具体的には、システム300は、減算器304、離散コサイン変換(DCT) 発生器308、量子化器312、可変長エンコーダ(VLC)316、逆量子化 器318、逆DCT320、加算器330、及び、動き推定補償ユニット322 を含んだ従来のMPEG型エンコーダを形成する複数の構成要素を含む。本発明 は、知覚量発生器326及び量子化スケール発生器328を含んだ量子化スケー ルコントローラ324によって具体化される。 ポート302におけるシステム300への入力信号は、それぞれが複数のブロ ックに分割されている前処理された画像シーケンス(ビデオ)であり、ビデオ「 クリップ(clip)」全体からのブロックが、システムへの入力として順次に提供 されると仮定する。MPEG規格においては、これらの画素ブロックは、例えば 、16×16の画素ブロックのようなマクロブロックとして一般に知られている 。以下の開示においては、MPEG規格の専門用語が使用されるが、マクロブロ ック又はブロックという用語は、符号化の基本単位として使用されるあらゆるサ イズ或いはあらゆる形状の画素ブロックを表現しようとするものであることを理 解されたい。大まかに言えば、「マクロブロック」は、単一画素と同じ程度に小 さいものであってもよく、或いは、ビデオフレーム全体と同じ程度に大きいもの であってもよい。 システム300は、経路314に沿った量子化された信号から予測マクロブロ ック(予測画像)を計算する。それぞれの予測マクロブロックは、わかりやすく 言えば、送信された出力信号の受信機が受信した信号を復号化するのと同じよう に、経路314に沿った量子化された信号を復号化することによって生成される 。減算器304は、入力マクロブロックから予測マクロブロックを減算すること によって、残差信号(当該技術分野においては、単に残差又は残差マクロブロッ クとも呼ばれる)を経路306に生成する。例えば、第1の画像及び第2の画像 を含んだ入力画像シーケンスであれば、初期量子化スケールを用いて、第1の画 像からのマクロブロックが符号化される。そして、「逆方向」動き補償技術を用 いるMPEG規格によれば、第1の画像に同じように配置されたマクロブロック と理想的には同一であるべき予測マクロブロックを生成するために、第2の画像 からのマクロブロックが使用される(動き補償がなされる)。予測マクロブロッ クと第1の画像のマクロブロックとの間のどのような差でもそれが残差マクロブ ロックを形成する。この符号化処理は、システムへの入力を形成する画像シーケ ンスの各画像に存在するすべてのマクロブロックに対してなされる。もちろん、 符号化されるべき画像が、いわゆる(MPEG規格で規定されるような)I−フ レームであれば、動き補償はなにもなされずに、その画像を符号化している間、 動き推定補償ユニット322は非動作状態である。 各残差マクロブロックは、それらが形成されると、DCT発生器308を用い て符号化される。DCTは、DCT発生器への入力信号を表現する係数を生成す る。MPEGエンコーダで使用される従来の符号化処理はDCT処理を用いるが 、本発明は、同様に、ウェーブレット変換のような別の種類の信号変換によって も動作する。 量子化器312は、DCT係数を量子化し、可変長エンコーダ316への入力 において、量子化された係数からなるブロックを生成する。本発明による量子化 スケールコントローラ324は、DCT係数を量子化するのに使用される量子化 スケール(ステップサイズ)を制御する。更に、可変長エンコーダ316が、量 子化された係数値を符号化し、MPEG規格に準拠する符号化されたビットスト リームを生成する。 動き補償に用いられる正しい予測マクロブロックと有効な動きベクトルとを生 成するためには、エンコーダは、復号化された画像にアクセスする必要がある。 そのようなアクセスをなすために、(経路314に沿った)量子化器の出力が、 逆量子化器318と逆DCT320との両方に供給される。逆DCTの出力は、 理想的には、DCT308への入力(例えば、残差マクロブロック)と同一であ る。正確な復号化マクロブロック(再生されたマクロブロック)を生成するため に、システムは、逆DCTの出力と以前に生成された予測マクロブロックとを加 算する(加算器330において)。動き推定補償ユニット322は、再生された マクロブロックを使用して、やがて現れる入力画像のための予測マクロブロック を生成するのに使用される動きベクトルを生成する。 一般的には、動きベクトルを生成するために、動き推定補償ユニット322は 、以前の画像におけるマクロブロックと現在の入力マクロブロックとの間の実質 的な一致を探索する。以前の画像は、一般には、アンカー(anchor)画像と呼ば れる。MPEG規格においては、アンカー画像は、2つのマクロブロックの間に ある画像群(GOP)として知られる画像シーケンスの中のI−フレーム又はP −フレームとして知られているものである。動きベクトルは、一致が検出された マクロブロック間の相対的な位置を表現するベクトルである。量子化スケールを 最適化するのに使用される反復処理の間、動きベクトルは変化しない。このよう に、動き推定は、反復処理の第1回目に実行されさえすればよい。そして、予測 画像が、フレーム記憶装置323に記憶され、本発明による反復処理において繰 り返し使用される。 本発明で使用することのできるMPEGエンコーダシステムの1つの例として は、Milpitas,CaliforniaのLSI Logic,Inc.,からのModel L64120のような1つ の集積回路として市販されている従来のシステムがある。 従来のエンコーダの組に加えて、本発明によるシステムは、知覚量に基づいた 一組の量子化スケール値を生成する量子化スケールコントローラ324が組み込 まれている。「一組の」量子化スケール値は、画像シーケンスにおける各マクロ ブロックごとに1つのスケール値を有するアレイを含む。量子化スケールコント ローラは、知覚量発生器326と量子化スケール発生器328とを含む。発生器 326は、再生されたマクロブロック、及ひオリジナルのマクロブロックを分析 して、人間の目が再生されたビデオをどのように知覚するかを予測する画像シー ケンスに対する知覚量を決定する。例えば、この量は、再生されたビデオに対す る忠実度の計測値である。各入力画像のマクロブロックが処理されると、発生器 326は、マクロブロックの量を量記憶装置310に記憶する。知覚量の値に応 じて、量子化スケール発生器328は、画像シーケンスに対する一組の新しい量 子化スケール値を生成し、それが、残差マクロブロックを符号化することを可能 にし、それによって、量子化スケールコントローラは、画像シーケンスの知覚量 が最適化される。一組の新しい量子化スケールを用いて、画像シーケンス全体が 、再度、マクロブロックごとに符号化される。符号化される画像シーケンス全体 に対しての知覚量が停止条件を満足するまで、この反復処理を用いて、ビデオに 対する量子化スケールが繰り返し計算される。 本発明の第一実施形態の場合と同様に、知覚量発生器326は、知覚量を生成 するためにどのような種類の定量的な知覚差の計測値を用いてもよい。 知覚量を考慮して、量子化スケール発生器328は、所定のマッピング関数を 使用して量子化スケールを調整する。図8は、本発明による第二実施形態に用い られた具体的な例としてのマッピング関数である。マクロブロックiに対する新 しい量子化スケールをQnew,i、マクロブロックiに対する古い量子化スケール をQold,iで表せば、 Qnew,i=Qold,i+f(Xi,Xgoal)となる。 ここで、Xiは、マクロブロックiに対する知覚量であり、 Xgoalは、画像シーケンス全体に対する知覚量の目標値である。 このように、ある特定のマクロブロックに対する新しい量子化スケールQnew, i は、そのマクロブロックに対する古い量子化スケールQold,iに、そのマクロブ ロックに対する知覚量Xiが画像シーケンス全体に対する忠実度の目標Xgoalに どのくらい近似しているかを表現するf(Xi,Xgoal)の値を加えたものから なる関数である。具体的な例としての関数f(Xi,Xgoal)が図8に示される 。もちろん、エンコーダの利用形態に応じて、新しい量子化スケールと古い量子 化スケールとの間の別の関係式が使用されてもよい。 図8に示される関数を用いれば、マクロブロックが高い忠実度を有する場合に 、本発明は、量子化スケールを減少させることによってそのマクロブロックの忠 実度を減少させ、それとは逆に、低い忠実度を有するマクロブロックに対しては 忠実度を増大させる。画像に存在するすべてのマクロブロックを反復して処理し た後、復号化された画像は、十分に均一な忠実度を有する。 別の方法として、量子化スケール発生器は、量子化スケール(古いQスケール )に倍率を掛けることによって、知覚量を考慮して量子化スケールを調整する。 この倍率は、「マクロブロック関連(macroblock-wise)」の知覚量を用いて計 算される。すなわち、ただ1つの量の値が、マクロブロック全体の「忠実度」を 表現する。量は、マクロブロックの中の「画素関連(pixel-wise)」の量の最大 値又は平均値であってもよい。換言すると、知覚量発生器は、画素単位の忠実度 計測値として知覚量を計算し、画素単位の計測値は、すべての画素単位の知覚量 を平均することによってか、又は、マクロブロック全体に対する量として単純に 最大の画素単位の量を選ぶことによって、マクロブロック単位の計測値に変換さ れなければならない。各マクロブロックに対する量は、量記憶装置310に記憶 される。 以下の説明のために、i番目のマクロブロックに対する知覚量をXiで表し、 画像全体に対する平均の量の値をE[X]で表す。倍率は、XiとE[X]の関 数である。反復処理は、すべてのiに対するそれぞれの量の値Xiを調整して、 画像に対する平均の量の値に平均化することを試みる。換言すると、この処理は 、画像全体にわたって十分に均一な画像忠実度を実現する。この関数は、f(Xi ,E[X])として表され、次の性質を有する。 (1)Xi>Xjであれば、 f(Xi,E[X])<f(Xj,E[X]) (2)関数の範囲は、α<f(Xi,E[X])<βであるようなα及びβの 2つの有限数によって制限される。 ここで、Xi及びXjは、マクロブロックの知覚量の値であり、i≠jであり、 i及びjは、0からN−1まで範囲にある整数値であり、N−1は、画像におけ るマクロブロックの総数である。 倍率導出関数は、次の式で表される。 f(Xi,E[X])= (aXi+bE[X]+c)/(bXi+aE[X]+d) ここで、a<bである。 例えば、c=d=0であるとき、この関数は、上述の条件(1)及び(2)を 満足する。なぜなら、この関数は、Xiに関しての減少関数であり、かつ、範囲 が、 a/b<f(Xi,E[X])<b/a に制限されているからである。 そして、古い量子化スケール(Qold,i)と倍率関数とから新しい量子化スケ ール(Qnew,i)を計算するのにi番目のマクロブロックに対する倍率が使用さ れる。この関係式は、 Qnew,i=f(Xi,E[X])Qold,i となる。 このように、上の関係式は、与えられたマクロブロックに対する知覚量が比較 的に大きいときには量子化スケールを必ず減少させ、マクロブロックに対する知 覚量が比較的に小さいときには量子化スケールを増加させる。このように、本発 明は、マクロブロックが高い忠実度を有する場合には、量子化スケールを減少さ せることによって忠実度を減少させ、低い忠実度を有するマクロブロックに対し てはその逆である。画像に存在するすべてのマクロブロックを反復して処理した 後、復号化された画像は、十分に均一な忠実度を有する。 いったん決定されてしまえば、画像シーケンス全体を再符号化するのに新しい 量子化スケールが使用され、更新された再生マクロブロックが生成される。これ らの更新された再生マクロブロックから、システムは、各マクロブロックに対す る新しい知覚量を計算する。新しい知覚量が所定の停止条件を満足しなければ、 画像は、一組の更新された量子化スケールによって再符号化される。この反復処 理は、マクロブロックに対する知覚量が停止条件を満足するまで繰り返される。 Xiとfとの間には逆数の関係(inverse relationship)があるので、処理は、 無限に多くの繰り返しの後には最適な量子化スケールに収束する。しかしながら 、計算サイクルを節約するために、一般には、反復は約10回まで実行した後に 停止される。 1つの停止条件としては、例えば、画像シーケンスに対してのすべての知覚量 が、目標とする量の値のあるしきい値の範囲内にある場合に処理を終了すること である。もう1つの停止条件は、知覚量のフレーム平均の減少率が画像シーケン ス全体に対しての所定のしきい値以下であることを利用することである。フレー ム平均は、シーケンス内の単一画像におけるすべてのマクロブロックに対しての 量の値を加算し、シーケンス全体のマクロブロックの総数で除算することによっ て計算される。平均は、反復処理を実行するたびごとに計算される。減少率(例 えば、平均曲線の傾き)がしきい値以下であれば処理は停止される。しきい値が 0である場合、このアルゴリズムは、最適解に収束すると考えられる。Xiの変 形(variant)を付加してそれの変動(variance)をあるしきい値内に制限する ことによって、この最小化問題に更なる制約を付加することができる。それによ って、すべての量の値が知覚量の平均値のまわりの予め定められた領域内にあれ ば 処理が停止される。 多くの通信システムにおいて、エンコーダは、「固定ビットレート符号化」を 用いなければならず、また、所定のマクロブロックすなわち画像を符号化するの に使用されるビット数を規定する厳しいビット割当(bit budget)を 満足しなければならない。このように、この量子化処理に適用されるその他の制 約は、ある特定の画像を符号化するのに使用されるビット数がその画像のための ビット割当の範囲内にあることを保証する。また、ビット割当の制約は、知覚量 の最小化問題にも課せられるべきである。その結果として、新しい量子化スケー ル(Qnew,i)は、マクロブロックを符号化するのに使用される実際のビット数 がそのマクロブロックのためのビット割当を越えないように調整される。 図4は、本発明による量子化スケールコントローラの動作ルーチンを示す図で ある。このルーチンは、ステップ402において開始し、ステップ404に進み 、そこで、一組の初期量子化スケールが量子化器及び逆量子化器に対して設定さ れる。ステップ406において、初期量子化スケールを用いて残差マクロブロッ クが処理される。ステップ412において、このルーチンは、画像シーケンスに おけるすべてのマクロブロックが処理されたかどうかを問い合わせる。問い合わ せの答えが「いいえ」であれば、ルーチンは、ステップ414において、次の入 力マクロブロックを処理のために取り込む。ステップ412における問い合わせ の答えが「はい」であれば、処理はステップ408に進む。 ステップ408において、上述したように、画像忠実度の定量的な知覚差の計 測値又はそれに類似する計測値を用いて、知覚量が計算される。ステップ410 において、ルーチンはそれぞれのマクロブロックごとの知覚量を記憶する。 ステップ420において、ルーチンは、知覚量が停止条件を満足するかどうか を問い合わせる。停止条件は、多くの条件の中のどれでもよく、それらの条件に は、ルーチン反復回数の制限値、平均の量の値の減少率と比較されるしきい値レ ベル、画像シーケンス全体にわたる知覚量の均一性の計測値、そして、それらに 類似するものなどが含まれる。停止条件が満足されなければ、ルーチン400は 、ステップ422に進み、例えば図8の関数を用いて、その量子化スケールの組 を調整する。ステップ424において、ルーチンは、入力画像シーケンスの第1 番目のマクロブロックを検索し、経路412に沿ってブロック406に戻り、画 像シーケンスの符号化を繰り返す。 一方、ステップ420において、停止条件が満足されたならば、ルーチンは、 停止ブロック428に進み、そこで、ルーチンは停止する。 量子化スケールコントローラは、典型的には、図2に示される上述のルーチン を実行するようにプログラムされた汎用マイクロプロセッサである。また、量子 化スケールコントローラは、特定用途向け集積回路(ASIC)であってもよい 。マイタロプロセッサ又はASICは、MPEGエンコーダハードウェアと協働 して図3に示される符号化システムを形成する。或いは、図3に示されるシステ ム全体が、汎用コンピュータにおいてメモリーに記憶され選択的に実行される複 数の機能ルーチンとして実現されてもよい。 図5は、本発明の第3の実施形態を含んだ画像エンコーダ500のブロック構 成図である。画像シーケンスではなく単一の画像だけを符号化するので動き推定 補償ユニットがないことを除けば、この実施形態は第二実施形態に類似している 。入力画像を符号化するのに使用される処理は、上述したものと同じである。し かしながら、入力画像はいかなる時間的情報も含まないので、定量的な知覚差の 計測値は、1996年6月17日出願の米国特許出願第08/668,015号 明細書、そして、A.B.Watson(ed),Digital Images and Human Vision,MIT Press,1993年、179〜206頁に記載された S.Daly による「TheVisi ble Differences Predictor:An algorithm for the Assessment of Imag e Quality (可視的な差分予測装置:画像品質を評価するためのアルゴリズム )」、及び、Society of Information Display International Symposium Digest of Technica1 Papers,Vol.24(1993年)、317〜320 頁に記載された S.Daly による「Quantitative Performance Assessment of an Algorithm for the Determination of Image Quality(画像品質を判 定するためのアルゴリズムの定量的な性能評価)」に開示されているような空間 的モデルを利用してもよい。 上述したエンコーダは、知覚量を用いてきわめて正確な符号化ビデオ及び符号 化静止画像を生成するが、連続的なフレーム及びそれらのマクロブロック、すな わち、以前のフレームと現在のフレームとはお互いに時間的に強い相関があると 仮定することによって、上述の実施形態は単純化することができる。この一般的 な仮定には1つの例外が存在する。すなわち、ビデオシーケンス内でシーンチェ ンジが発生する場合である。ほとんどの場合において強い相関があると仮定すれ ば、図3に示されるエンコーダは、単純化されて図6に示されるエンコーダを形 成することができる。エンコーダのこの第4の実施形態は、非反復的な態様で動 作する。このように、知覚忠実度量は、図3に示される実施形態のように、現在 のフレームに対して計算されるのではなく、以前のフレームに対して計算される 。その結果として、図6に示される発明は、量を計算するのに反復的方法は使用 しない。 詳細には、図6は、量子化スケールのような符号化パラメータを更新するため に知覚量を使用する単純化されたエンコーダシステムのブロック構成図を示す。 図3のシステム300で使用されたものと同一の図6における構成要素は、同一 の参照符号を有することに注意されたい。しかしながら、重要なことに、図6は 、まだ開示されていないいくつかの構成要素を含む。これらの構成要素には、シ ーンチェンジ検出器602、量子化スケール中断スイッチ604、フレームバッ ファ606、及び、フレームバッファ608がある。 入力ビデオシーケンスにおける2つの連続的なフレームの間には強い相関が存 在するという仮定であるので、シーンチェンジ検出器は、シーンチェンジが検出 されたときに量子化スケール更新回路を切り離さなければならない。シーンチェ ンジは、従来は、現在のフレームと以前のフレームとの間の差を計測することに よって検出される。シーンチェンジが発生したとき、現在のフレームの量子化ス ケールを変更するのに以前のフレームの知覚計測値を使用することは意味をなさ ない。なぜなら、これらの2つのフレーム間には相関がないからである。このよ うに、シーンチェンジ検出器602が、現在のフレームと以前のフレームとの間 に意義のある差を検出したとき、シーンチェンジ検出器602は、中断スイッチ 604を使用して量子化スケール更新回路を切り離す。 現在のフレーム(又は、マクロブロック)はフレームバッファ606に記憶さ れるので、知覚量発生器への入力は、常に、以前のフレームである。同様に、動 き推定補償ユニット322は、フレームバッファ608に結合される予測画像を 発生する。フレームバッファ608は1つのフレームに対しての予測画像を保持 するので、その出力は、以前に再生された画像である(現在の画像に比較すれば )。このように、知覚量発生器は、以前の再生画像及び以前のフレームに作用し 、以前のフレームに対する知覚計測値を生成し、そして、それが、現在のフレー ムのために以前のフレームによって量子化スケールを更新するのに使用される。 その結果として、更新された量子化スケールを生成する処理において反復が存在 しない。 量子化スケールの値は、スイッチ604を介して量子化器312に結合される 。回路にあるその他の構成要素は、図3を参照して上述したように動作する。 図7は、ユーザ操作可能画像圧縮ルーチン700のフローチャートである。こ のルーチンは、画像シーケンス全体又は個々の画像に適用される量を計算するの ではなく上述の図4に示されるルーチンを支援し、それによって、量が、ある画 像領域の画像圧縮忠実度を改善し別の領域の忠実度を低下させるように「操作」 される。例えば、「前景」画像の内容は高い忠実度で圧縮され、「背景」画像の 内容は低い忠実度で圧縮されることが可能である。このルーチンは、ステップ7 01によって開始し、ステップ702に進み、そこで、量子化スケールのような 符号化パラメータが初期化される。ステップ704において、忠実度量に基づい たエンコーダは、まず最初に、ビデオシーケンスの1つのフレーム全体か又は静 止画像のフレーム全体を符号化する。或いは、ビデオ「クリップ」における全部 の画像シーケンスが処理され符号化される。一組の初期エンコーダパラメータを 用いて忠実度量エンコーダが符号化されたビットストリームを生成するとき、エ ンコーダは、ビデオに存在する各画素(又は、各画素ブロック)のビデオ忠実度 を表現する忠実度マップを生成する。エンコーダが画像シーケンスを処理すれば 、シーケンスのそれぞれの画像に対して、忠実度マップがビデオフレームレート で生成される。従って、画像(ビデオ)シーケンスに対して、忠実度マップは空 間的及び時間的成分を有する。忠実度マップは、上述したように、図4のステッ プ406、408、410、412、及び、414を用いて生成されて記憶され る。 ステップ706において、忠実度マップが重要度マップと比較され、2つのマ ップ間の差が判定される。重要度マップは、重要度マップ発生器714によって 提供される。画像シーケンスが符号化されると、画像単位に比較がなされる。す なわち、各フレームが、忠実度マップ及び重要度マップに対応づけられる。 重要度マップは、現在符号化されている画像の予め定義されたマップである。 マップを生成するために、ユーザすなわち圧縮エンジニアは、「重要」と思われ 、かつ、最大の忠実度で符号化されるべき画像領域を選択する。ユーザがオリジ ナル画像シーケンスを観察し、各フレームごとに、ユーザが最も重要な領域を際 立たせた通りに、重要度マップは、それの最も単純な形態においては、フレーム 単位で作成される。それぞれの領域にある特定の重要度レベルを与えてもよい。 この重要度レベルは、例えば、1〜10の範囲を有するものであってもよい。1 0は、最大の忠実度で符号化されるべき最も重要な領域(或いは複数の領域)で あることを示し、1は、可能な最小の忠実度で符号化されるべき最も重要でない 領域(或いは複数の領域)であることを示してもよい。従って、多くの領域は1 〜10の間の値となり、それらの重要度レベルに応じて、それぞれ、より小さい か又はより大きい忠実度で符号化される。 典型的には、重要度マップはグラフィックインタフェースを用いて生成され、 そこでは、ユーザは、位置決め装置を用いて、符号化される画像を表現するグラ フィックインタフェース上の領域を選択することができる。このグラフィックイ ンタフェースを介して、システムは、重要度マップを自動的に生成する。「重要 」という意味は、画像又はビデオが使用されている利用形態に依存するものであ り、一般には主観的なものであることに注意されたい。本発明のアーキテクチャ は、ビデオシーケンス内の空間的−時間的な領域によって重要度が定量的に指定 できるならば、重要度のいかなる定義に対しても機能する。 エンコーダが現在の画像に符号化ビットを適切に割り付けたかどうかを判定す るために、忠実度マップ及び重要度マップがブロック単位で比較され、それによ って、これらのブロックの重要度に対応したそれぞれのブロックごとの忠実度量 が生成される。ステップ708において、ルーチンは、2つのマップが実質的に 一致するかどうかを問い合わせる。2つのマップが満足すべき程度まで一致しな ければ、ステップ710において、エンコーダに自動調整がなされる。これらの パラメータに対しての変更は、重要度マップによって特徴づけられる所望の忠実 度分布を実現するために、空間的−時間的に符号化ビットを画像シーケンス又は ビデオシーケンス全体に再分配することによって実行される。要するに、各マク ロブロックの量子化スケールが、マクロブロックの重要度を反映するように変更 される。そして、画像が、システムによって指定された新しいパラメータを用い て再符号化され、それが、新しい忠実度マップを生成し、そして、それが重要度 マップと比較される。忠実度マップと重要度マップとが実質的に一致すれば、シ ステムは、ステップ712において処理を終了する。一方、忠実度マップと重要 度マップとが依然として一致条件を満足するのに十分であるような程度まで一致 しなければ、システムは、パラメータ調整ブロック710に戻り、再度、エンコ ーダパラメータを調整する。この反復処理は、最後には、ユーザによって規定さ れた重要度レベルを満足するようにビデオを符号化することになる。 上述において、エンコーダは、いったん画像が圧縮解除されると、画像の「忠 実度」を表現する忠実度マップを生成する。忠実度量は、典型的には、オリジナ ルのビデオと圧縮解除されたビデオとの間の識別可能な差を表現するものである 。しかしながら、本発明のシステムは、「忠実度」の別の計測値を用いて動作し 、それらには、画像リンギング、モアレパターン、及び、その他の画像アーティ ファクト(artifact:人工産物)の存在を検出することが含まれる。いったんア ーティファクトが検出されると、システムは、1以上の符号化パラメータを調整 し、復号化されたビデオにおいてその個々のアーティファクトを抑制する。一般 的な意味では、忠実度マップは、圧縮解除された画像におけるアーティファクト の存在を表現し、システムは、これらのアーティファクトの発生を抑制又は防止 するためにエンコーダパラメータを調整する。 このシステムに加えて、ある特定のビデオシーケンスに対して重要度マップを 規定する処理を自動化するための利用可能な多くの有効な技術が存在する。例え ば、まず最初にビデオシーケンスをオブジェクトにセグメント化するのに使用さ れる自動画像セグメント化技術を使用することができ、このオブジェクトは、例 えば、画像の前景で動くオブジェクトに対しての画像の背景にあるオブジェクト のよ うに、ユーザにとって異なる重要度のレベルを有してもよい。そのような技術の 1つは、発明の名称が「Parallel Pipelined Image Procesing System(並 列パイプライン化された画像処理システム)」である共通に譲渡された1996 年2月23日出願の米国特許出願第08/606,171号に記述され、ここに参 照により取り込まれる。その他の画像セグメント化技術には、発明の名称が「Me thod and System for Rendering and Combining Images(画像をレンダリ ングし組み合わせる方法及びシステム)」である共通に譲渡された1995年7 月10日出願の米国特許出願第08/499,934号明細書、及び、Proceedin gs of the European Conference on Computer Vision-92,Sp ringer-Verlag,(1992年)の Bergen らによる「Hierarchical Model-base d Motion Estimation(階層モデルに基づく動きの推定)」に開示される画像 処理システムがある。 更にまた、重要度マップの生成は、部分的に自動化されてもよい。ビデオフレ ームにおけるフレームNに対しての重要度マップを考えると、その重要度マップ をフレームN+1に対しての類似する重要度マップに変換するのに領域追跡技術 に基づいた自動動き推定が使用される。フレームN+1に対してのこの推定され た重要度マップは、直接に使用されてもよく、或いは、ユーザによって適切に変 更されてもよい。変換されたそのような重要度マップは、エンコーダによって生 成することのできる動きベクトルを移出する(export)ことによって、また、そ れらの動きベクトルを使用して重要度マップをずらすことによって、符号化され た画像シーケンス内のオブジェクトの動きを調整することを容易にすることがで きる。 本発明による教示を具体化した様々な実施形態を本明細書で詳細に示し、説明 したが、当業者は、多くの別の様々な実施形態を容易に考えだすことができるで あろう。しかし、それも本発明の教示内容に組み込まれている。
───────────────────────────────────────────────────── フロントページの続き (31)優先権主張番号 60/014,273 (32)優先日 平成8年3月29日(1996.3.29) (33)優先権主張国 米国(US) (81)指定国 EP(AT,BE,CH,DE, DK,ES,FI,FR,GB,GR,IE,IT,L U,MC,NL,PT,SE),CA,JP,KR,M X

Claims (1)

  1. 【特許請求の範囲】 1.エンコーダの動作を最適化するために画像エンコーダ(104)の符号化パ ラメータを調整する装置であって、 符号化された画像の忠実度を表現する量を決定するための知覚量発生器(11 2)と、 前記知覚量に応答して前記符号化パラメータに対する値を選択するための、前 記知覚量発生器に結合されたエンコーダパラメータ選択器(108)と、 を備えた装置。 2.前記符号化パラメータが、前記画像エンコーダのための量子化スケールであ る請求項1に記載の装置。 3.前記知覚量発生器が、入力画像を再生された画像と比較することによって前 記量を決定し、再生された画像は、符号化され復号化された入力画像である請求 項1に記載の装置。 4.前記知覚量発生器が、前記符号化された画像に対して複数の量を生成し、符 号化された画像の複数の領域に対する忠実度を表現し、前記複数の量は忠実度マ ップを形成する請求項1に記載の装置。 5.他の領域よりも高い忠実度で符号化されるべき画像の領域を定義する重要度 マップを生成する重要度マップ発生器(714)を更に備え、該重要度マップが 、前記忠実度マップと比較され、重要度マップによって定義されるように他の領 域よりも高い忠実度で画像の特定領域が符号化されるように符号化を操作する請 求項4に記載の装置。 6.現在の入力画像が以前の入力画像と実質的に異なることを検出し、前記現在 の入力画像が前記以前の入力画像と実質的に異なることが検出されたときに前記 量子化スケールの前記値の選択を中断させる画像差検出器(602)を更に備え た請求項1に記載の装置。 7.画像を符号化する方法であって、 a)符号化画像を生成するために、符号化パラメータに対する初期値を用いて 入力画像を符号化するステップと、 b)復号化画像を生成するために、前記符号化画像を復号化するステップと、 c)前記復号化画像を前記入力画像と比較するステップと、 d)前記比較の結果に応答して、前記符号化画像に対する忠実度量を計算する ステップと、 e)前記忠実度量に応答して、前記符号化パラメータの値を変更するステップ と、 を備えた方法。 8.前記忠実度量が所定の忠実度条件を満足するまで前記ステップa)〜d)を 反復するステップを更に備えた請求項7に記載の方法。 9.前記符号化画像の複数の領域それぞれに対する複数の忠実度量を計算するス テップを更に備え、前記複数の忠実度量は忠実度マップを形成する請求項8に記 載の方法。 10.前記入力画像の他の領域よりも高い忠実度で符号化されるべき前記入力画 像の領域を定義する重要度マップを提供するステップと、 異なった符号化パラメータ値を用いてより高い忠実度で符号化されるべき領域 を決定するために、前記重要度マップを前記忠実度マップと比較するステップと を更に備えた請求項9に記載の方法。 11.前記符号化パラメータが量子化スケールである請求項7に記載の方法。 12.前記符号化するステップが、各マクロブロックに割り付けられた前記符号 化パラメータの値を用いて、画像シーケンスを示す複数のマクロブロックを符号 化し、計算するステップが、各マクロブロックに対する忠実度量を生成する請求 項7に記載の方法。 13.現在の入力画像が以前の入力画像と実質的に異なることが画像シーケンス において検出されたときに、変更するステップが中断される請求項7に記載の方 法。
JP9522342A 1996-03-29 1997-03-28 知覚量を用いて符号化を最適化し自動操作可能な画像圧縮を実行する装置及び方法 Pending JP2000506687A (ja)

Applications Claiming Priority (7)

Application Number Priority Date Filing Date Title
US1427296P 1996-03-29 1996-03-29
US1426696P 1996-03-29 1996-03-29
US1427396P 1996-03-29 1996-03-29
US60/014,266 1996-03-29
US60/014,272 1996-03-29
US60/014,273 1996-03-29
PCT/US1997/005312 WO1997037322A1 (en) 1996-03-29 1997-03-28 Apparatus and method for optimizing encoding and performing automated steerable image compression using a perceptual metric

Publications (1)

Publication Number Publication Date
JP2000506687A true JP2000506687A (ja) 2000-05-30

Family

ID=27360053

Family Applications (1)

Application Number Title Priority Date Filing Date
JP9522342A Pending JP2000506687A (ja) 1996-03-29 1997-03-28 知覚量を用いて符号化を最適化し自動操作可能な画像圧縮を実行する装置及び方法

Country Status (5)

Country Link
US (1) US6529631B1 (ja)
EP (1) EP0901666A4 (ja)
JP (1) JP2000506687A (ja)
KR (1) KR20000005110A (ja)
WO (1) WO1997037322A1 (ja)

Cited By (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003037505A (ja) * 2001-07-26 2003-02-07 Nhk Engineering Services Inc 量子化装置及び量子化プログラム並びに符号化装置及び符号化プログラム
JP2006060790A (ja) * 2004-07-12 2006-03-02 Microsoft Corp 動き補償時間フィルタリングにおける適応アップデート
JP2008523706A (ja) * 2004-12-14 2008-07-03 サムスン エレクトロニクス カンパニー リミテッド 映像符号化及び復号化装置とその方法
JP2009543515A (ja) * 2006-07-10 2009-12-03 トムソン ライセンシング マルチパス・ビデオ・エンコーダにおけるパフォーマンス向上のための方法および装置
JP2010515392A (ja) * 2007-01-04 2010-05-06 ブリティッシュ・テレコミュニケーションズ・パブリック・リミテッド・カンパニー 映像信号符号化
JP2010515344A (ja) * 2006-12-28 2010-05-06 トムソン ライセンシング 自動的な視覚的なアーチファクトの分析及び視覚的なアーチファクトの低減の方法及び装置
JP2011504042A (ja) * 2007-11-16 2011-01-27 トムソン ライセンシング ビデオをエンコードするシステムおよび方法
US8213503B2 (en) 2008-09-05 2012-07-03 Microsoft Corporation Skip modes for inter-layer residual video coding and decoding
US8340177B2 (en) 2004-07-12 2012-12-25 Microsoft Corporation Embedded base layer codec for 3D sub-band coding
US8374238B2 (en) 2004-07-13 2013-02-12 Microsoft Corporation Spatial scalability in 3D sub-band decoding of SDMCTF-encoded video
JP2013507083A (ja) * 2009-10-05 2013-02-28 アイ.シー.ヴイ.ティー リミテッド デジタル画像を再圧縮するための装置および方法
US8493513B2 (en) 2006-01-06 2013-07-23 Microsoft Corporation Resampling and picture resizing operations for multi-resolution video coding and decoding
US8711948B2 (en) 2008-03-21 2014-04-29 Microsoft Corporation Motion-compensated prediction of inter-layer residuals
US8953673B2 (en) 2008-02-29 2015-02-10 Microsoft Corporation Scalable video coding and decoding with sample bit depth and chroma high-pass residual layers
US9571856B2 (en) 2008-08-25 2017-02-14 Microsoft Technology Licensing, Llc Conversion operations in scalable video encoding and decoding
JP2018509083A (ja) * 2015-02-13 2018-03-29 ネットフリックス・インコーポレイテッドNetflix, Inc. 符号化中に生じた誤差を識別する技術

Families Citing this family (57)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB9803580D0 (en) * 1998-02-21 1998-04-15 Nds Ltd Determining visually noticeable differences between two images
GB9819689D0 (en) 1998-09-10 1998-11-04 Nds Ltd Decoding symbols representing digital words
GB9819648D0 (en) * 1998-09-10 1998-11-04 Nds Ltd Determining visually noticeable differences between two images
US6414992B1 (en) * 1999-01-27 2002-07-02 Sun Microsystems, Inc. Optimal encoding of motion compensated video
US20030142875A1 (en) * 1999-02-04 2003-07-31 Goertzen Kenbe D. Quality priority
US6760482B1 (en) * 1999-02-19 2004-07-06 Unisearch Limited Method for visual optimisation of embedded block codes to exploit visual masking phenomena
FR2792798B1 (fr) 1999-04-26 2001-05-25 Thomson Multimedia Sa Procede et dispositif de quantification pour compression video
WO2001020912A1 (en) * 1999-09-14 2001-03-22 Koninklijke Philips Electronics N.V. Method and device for identifying block artifacts in digital video pictures
US6879648B2 (en) * 2000-01-31 2005-04-12 Texas Instruments Incorporated Turbo decoder stopping based on mean and variance of extrinsics
US7308140B2 (en) * 2000-05-31 2007-12-11 Samsung Electronics Co., Ltd. Method and device for measuring similarity between images
FR2811832B1 (fr) * 2000-07-13 2003-09-26 Canon Kk Procedes, dispositifs et appareils d'optimisation adaptative pour la transmission de signaux codes
US6621865B1 (en) * 2000-09-18 2003-09-16 Powerlayer Microsystems, Inc. Method and system for encoding and decoding moving and still pictures
US6771822B1 (en) * 2000-09-22 2004-08-03 Ge Medical Systems Global Technology Company, Llc Method and apparatus for storing image frame with user-selected compression
US6751360B1 (en) * 2000-11-14 2004-06-15 Tektronix, Inc. Fast video temporal alignment estimation
US6822675B2 (en) * 2001-07-03 2004-11-23 Koninklijke Philips Electronics N.V. Method of measuring digital video quality
US7024045B2 (en) * 2001-08-21 2006-04-04 Sun Microsystems, Inc. Dynamic bandwidth adaptive image compression/decompression scheme
US6763068B2 (en) 2001-12-28 2004-07-13 Nokia Corporation Method and apparatus for selecting macroblock quantization parameters in a video encoder
AU2003247711A1 (en) * 2002-07-09 2004-01-23 Aware, Inc. Iterative compression parameters control for a sequence of images
US20040028139A1 (en) * 2002-08-06 2004-02-12 Andre Zaccarin Video encoding
US7903892B2 (en) * 2002-10-29 2011-03-08 Ati Technologies Ulc Image analysis for image compression suitability and real-time selection
GB0229396D0 (en) * 2002-12-17 2003-01-22 British Telecomm Signal processing
US7643679B2 (en) 2003-02-13 2010-01-05 Ati Technologies Ulc Method and apparatus for block based image compression with multiple non-uniform block encodings
US8111928B2 (en) 2003-02-13 2012-02-07 Ati Technologies Ulc Method and apparatus for compression of multi-sampled anti-aliasing color data
US7764833B2 (en) * 2003-02-13 2010-07-27 Ati Technologies Ulc Method and apparatus for anti-aliasing using floating point subpixel color values and compression of same
WO2004109586A1 (en) 2003-06-05 2004-12-16 Aware, Inc. Image quality control techniques
US7889792B2 (en) 2003-12-24 2011-02-15 Apple Inc. Method and system for video encoding using a variable number of B frames
US20050286629A1 (en) * 2004-06-25 2005-12-29 Adriana Dumitras Coding of scene cuts in video sequences using non-reference frames
WO2006052577A2 (en) * 2004-11-04 2006-05-18 Thomson Licensing Method and apparatus for fast mode decision of b-frames in a video encoder
EP1677252A1 (en) * 2005-01-03 2006-07-05 Thomson Licensing Method and apparatus for calculating a lambda value controlling the coding mode in a video encoder.
US7606429B2 (en) * 2005-03-25 2009-10-20 Ati Technologies Ulc Block-based image compression method and apparatus
JP5123166B2 (ja) * 2005-04-04 2013-01-16 トムソン ライセンシング 量子化きざみを局所的に調整する方法
CN101156453B (zh) * 2005-04-05 2012-07-18 汤姆森许可贸易公司 局部调整量化阶的方法和编码图像序列的方法和设备
US7668380B2 (en) * 2005-05-18 2010-02-23 Dts, Inc. Rate control of scalably coded images
US20060280242A1 (en) * 2005-06-13 2006-12-14 Nokia Corporation System and method for providing one-pass rate control for encoders
FR2889381A1 (fr) * 2005-07-28 2007-02-02 Thomson Licensing Sas Procede et dispositif de determination de parametres de quantification dans une image
US7940992B2 (en) * 2007-03-05 2011-05-10 Siemens Aktiengesellschaft Visual discrimination model for single image applications
US8031937B2 (en) * 2007-04-04 2011-10-04 Telefonaktiebolaget Lm Ericsson (Publ) Frame buffer compression and decompression method for graphics rendering
US8725504B1 (en) 2007-06-06 2014-05-13 Nvidia Corporation Inverse quantization in audio decoding
JP4915317B2 (ja) * 2007-09-05 2012-04-11 ソニー株式会社 画像処理装置、および画像処理方法、並びにコンピュータ・プログラム
US8687875B2 (en) * 2007-12-03 2014-04-01 Nvidia Corporation Comparator based acceleration for media quantization
US8934539B2 (en) * 2007-12-03 2015-01-13 Nvidia Corporation Vector processor acceleration for media quantization
US8704834B2 (en) * 2007-12-03 2014-04-22 Nvidia Corporation Synchronization of video input data streams and video output data streams
EP2101503A1 (en) * 2008-03-11 2009-09-16 British Telecommunications Public Limited Company Video coding
EP2200319A1 (en) 2008-12-10 2010-06-23 BRITISH TELECOMMUNICATIONS public limited company Multiplexed video streaming
EP2219342A1 (en) 2009-02-12 2010-08-18 BRITISH TELECOMMUNICATIONS public limited company Bandwidth allocation control in multiple video streaming
US9894361B2 (en) 2009-03-31 2018-02-13 Citrix Systems, Inc. Framework for quality-aware video optimization
US9749713B2 (en) 2009-10-15 2017-08-29 Citrix Systems, Inc. Budget encoding
CN103828369B (zh) 2011-06-10 2018-09-07 茨特里克斯系统公司 质量感知视频优化中的宏块级自适应量化
KR101362696B1 (ko) * 2011-10-19 2014-02-17 전북대학교산학협력단 하이브리드 아키텍쳐가 적용된 신호 변환 장치, 신호 변환 방법 및 기록매체
US20130195206A1 (en) * 2012-01-31 2013-08-01 General Instrument Corporation Video coding using eye tracking maps
GB2499844B (en) * 2012-03-02 2014-12-17 Canon Kk Methods for encoding and decoding an image, and corresponding devices
GB2525170A (en) 2014-04-07 2015-10-21 Nokia Technologies Oy Stereo viewing
FR3020736B1 (fr) * 2014-04-30 2016-05-13 B<>Com Procede d'evaluation de qualite d'une sequence d'images numeriques codees decodees, procede de codage, dispositifs et programmes d'ordinateurs associes
US10129559B2 (en) 2016-06-22 2018-11-13 Microsoft Technology Licensing, Llc Image compression
WO2019105535A1 (en) * 2017-11-28 2019-06-06 Opticom Dipl.-Ing. Michael Keyhl Gmbh Device and method for providing an encoded version of a media signal
CN108600756B (zh) * 2018-05-04 2019-10-29 上海大学 基于蒙特卡洛法马尔可夫链的编码参数自适应调整方法
US11228786B2 (en) * 2019-07-11 2022-01-18 Google Llc Compressing frame based on errors of previous frames

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA1252569A (en) * 1985-09-13 1989-04-11 Akihiro Furukawa Method and device of coding a digital video signal for reproduction of pictures with a high quality even upon occurrence of a drastical change between the pictures
EP0300775B1 (en) 1987-07-21 1995-05-31 Matsushita Electric Industrial Co., Ltd. Signal encoding and decoding method and device
JPH082107B2 (ja) * 1990-03-02 1996-01-10 国際電信電話株式会社 動画像のハイブリッド符号化方法及びその装置
US5038209A (en) * 1990-09-27 1991-08-06 At&T Bell Laboratories Adaptive buffer/quantizer control for transform video coders
US5249053A (en) * 1991-02-05 1993-09-28 Dycam Inc. Filmless digital camera with selective image compression
KR930003757A (ko) * 1991-07-31 1993-02-24 오오가 노리오 영상 신호 전송 장치 및 방법
US5214507A (en) * 1991-11-08 1993-05-25 At&T Bell Laboratories Video signal quantization for an mpeg like coding environment
JPH05219385A (ja) * 1992-02-07 1993-08-27 Hudson Soft Co Ltd 画像圧縮・伸張方法および装置
US5329379A (en) 1992-10-22 1994-07-12 International Business Machines Corporation System and method of measuring fidelity of decompressed video signals and images
US5686964A (en) * 1995-12-04 1997-11-11 Tabatabai; Ali Bit rate control mechanism for digital image and video data compression

Cited By (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4594561B2 (ja) * 2001-07-26 2010-12-08 財団法人エヌエイチケイエンジニアリングサービス 符号化装置及び符号化プログラム
JP2003037505A (ja) * 2001-07-26 2003-02-07 Nhk Engineering Services Inc 量子化装置及び量子化プログラム並びに符号化装置及び符号化プログラム
US8442108B2 (en) 2004-07-12 2013-05-14 Microsoft Corporation Adaptive updates in motion-compensated temporal filtering
JP2006060790A (ja) * 2004-07-12 2006-03-02 Microsoft Corp 動き補償時間フィルタリングにおける適応アップデート
US8340177B2 (en) 2004-07-12 2012-12-25 Microsoft Corporation Embedded base layer codec for 3D sub-band coding
US8374238B2 (en) 2004-07-13 2013-02-12 Microsoft Corporation Spatial scalability in 3D sub-band decoding of SDMCTF-encoded video
JP2008523706A (ja) * 2004-12-14 2008-07-03 サムスン エレクトロニクス カンパニー リミテッド 映像符号化及び復号化装置とその方法
US9008451B2 (en) 2004-12-14 2015-04-14 Samsung Electronics Co., Ltd. Apparatus for encoding and decoding image and method thereof
US8780272B2 (en) 2006-01-06 2014-07-15 Microsoft Corporation Resampling and picture resizing operations for multi-resolution video coding and decoding
US9319729B2 (en) 2006-01-06 2016-04-19 Microsoft Technology Licensing, Llc Resampling and picture resizing operations for multi-resolution video coding and decoding
US8493513B2 (en) 2006-01-06 2013-07-23 Microsoft Corporation Resampling and picture resizing operations for multi-resolution video coding and decoding
JP2009543515A (ja) * 2006-07-10 2009-12-03 トムソン ライセンシング マルチパス・ビデオ・エンコーダにおけるパフォーマンス向上のための方法および装置
JP2010515344A (ja) * 2006-12-28 2010-05-06 トムソン ライセンシング 自動的な視覚的なアーチファクトの分析及び視覚的なアーチファクトの低減の方法及び装置
JP2010515392A (ja) * 2007-01-04 2010-05-06 ブリティッシュ・テレコミュニケーションズ・パブリック・リミテッド・カンパニー 映像信号符号化
JP2011504042A (ja) * 2007-11-16 2011-01-27 トムソン ライセンシング ビデオをエンコードするシステムおよび方法
US9098902B2 (en) 2007-11-16 2015-08-04 Thomson Licensing System and method for encoding video
US8953673B2 (en) 2008-02-29 2015-02-10 Microsoft Corporation Scalable video coding and decoding with sample bit depth and chroma high-pass residual layers
US8964854B2 (en) 2008-03-21 2015-02-24 Microsoft Corporation Motion-compensated prediction of inter-layer residuals
US8711948B2 (en) 2008-03-21 2014-04-29 Microsoft Corporation Motion-compensated prediction of inter-layer residuals
US10250905B2 (en) 2008-08-25 2019-04-02 Microsoft Technology Licensing, Llc Conversion operations in scalable video encoding and decoding
US9571856B2 (en) 2008-08-25 2017-02-14 Microsoft Technology Licensing, Llc Conversion operations in scalable video encoding and decoding
US8213503B2 (en) 2008-09-05 2012-07-03 Microsoft Corporation Skip modes for inter-layer residual video coding and decoding
JP2013507083A (ja) * 2009-10-05 2013-02-28 アイ.シー.ヴイ.ティー リミテッド デジタル画像を再圧縮するための装置および方法
JP2018509083A (ja) * 2015-02-13 2018-03-29 ネットフリックス・インコーポレイテッドNetflix, Inc. 符号化中に生じた誤差を識別する技術
US10674180B2 (en) 2015-02-13 2020-06-02 Netflix, Inc. Techniques for identifying errors introduced during encoding

Also Published As

Publication number Publication date
KR20000005110A (ko) 2000-01-25
EP0901666A1 (en) 1999-03-17
US6529631B1 (en) 2003-03-04
EP0901666A4 (en) 2001-08-29
WO1997037322A1 (en) 1997-10-09

Similar Documents

Publication Publication Date Title
JP2000506687A (ja) 知覚量を用いて符号化を最適化し自動操作可能な画像圧縮を実行する装置及び方法
US8498335B2 (en) Adaptive deadzone size adjustment in quantization
KR101643790B1 (ko) 적응적 비디오 스트리밍용의 가변 비트 레이트 및 동적 해상도를 이용한 다중 비트 레이트 비디오 인코딩
KR101744654B1 (ko) 모션 기반 동적 해상도 다중 비트 레이트 비디오 인코딩
US6192081B1 (en) Apparatus and method for selecting a coding mode in a block-based coding system
US8189933B2 (en) Classifying and controlling encoding quality for textured, dark smooth and smooth video content
JP4187405B2 (ja) 符号化方式におけるオブジェクトベースのレート制御装置及びその方法
CN104885455B (zh) 一种用于视频编码的计算机实现的方法及装置
KR100305941B1 (ko) 실시간 단일 패스 가변 비트 레이트 제어 방법 및 그 인코더
US6389072B1 (en) Motion analysis based buffer regulation scheme
US20020186890A1 (en) Dynamic filtering for lossy compression
US20080240257A1 (en) Using quantization bias that accounts for relations between transform bins and quantization bins
JPH118855A (ja) デジタル・ビデオ信号エンコーダ及び符号化方法
JP4221655B2 (ja) 符号化装置および符号化方法、プログラム、並びに記録媒体
JP3778960B2 (ja) 動画像符号化方法及び装置
JP2003037843A (ja) 画像処理装置および方法、記録媒体、並びにプログラム
US6160848A (en) Conditional replenishment device for a video encoder
KR20080108538A (ko) 비디오 코딩 방법
JP4532607B2 (ja) ブロック・ベースのコード化システムにおいてコード化モードを選択するための装置および方法
US7804897B1 (en) Method for implementing an improved quantizer in a multimedia compression and encoding system
JP2001526850A (ja) 画像符号化器における量子化値の最適化方法及び装置
JP3149673B2 (ja) 映像符号化装置、映像符号化方法、映像再生装置及び光ディスク
JPH09224262A (ja) 映像符号化方法及び装置
JP4228739B2 (ja) 符号化装置および符号化方法、プログラム、並びに記録媒体
KR100595144B1 (ko) 적응형 양자화 제어 방법.