JP2651097B2 - 量子化パラメータ生成方法および装置 - Google Patents

量子化パラメータ生成方法および装置

Info

Publication number
JP2651097B2
JP2651097B2 JP4321449A JP32144992A JP2651097B2 JP 2651097 B2 JP2651097 B2 JP 2651097B2 JP 4321449 A JP4321449 A JP 4321449A JP 32144992 A JP32144992 A JP 32144992A JP 2651097 B2 JP2651097 B2 JP 2651097B2
Authority
JP
Japan
Prior art keywords
sub
frame
pns
macroblock
psychovisual
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP4321449A
Other languages
English (en)
Other versions
JPH0670311A (ja
Inventor
ピュリ アチュル
アラヴィンド ランガラヤン
ジィオフリー ハスケル バリン
ハン ヒュ−ミン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
AT&T Corp
Original Assignee
AT&T Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by AT&T Corp filed Critical AT&T Corp
Publication of JPH0670311A publication Critical patent/JPH0670311A/ja
Application granted granted Critical
Publication of JP2651097B2 publication Critical patent/JP2651097B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/80Details of filtering operations specially adapted for video compression, e.g. for pixel interpolation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/112Selection of coding mode or of prediction mode according to a given display mode, e.g. for interlaced or progressive display mode
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • H04N19/126Details of normalisation or weighting functions, e.g. normalisation matrices or variable uniform quantisers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/154Measured or subjectively estimated visual quality after decoding, e.g. measurement of distortion
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/189Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
    • H04N19/192Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding the adaptation method, adaptation tool or adaptation type being iterative or recursive
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/152Data rate or code amount at the encoder output by measuring the fullness of the transmission buffer

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、ビデオ画像処理に関
し、特に、再生画像の品質および符号化された画像のビ
ット速度を制御するための符号器量子化ステップサイズ
の調整に関する。
【0002】
【従来の技術】ビデオ信号が量子化される態様は、符号
化される信号のビット速度およびその符号化された信号
から再生される画像の品質を決定する。おそらく、これ
に関連して最も重要なことは、量子化ステップサイズで
ある。これは、いわゆる量子化パラメータの所定のマッ
ピングから導出され、符号化信号の生成に使用される量
子化の粗密を直接制御する。従って、所定の目的ビット
速度に対する最高の画像品質を達成するためには、量子
化パラメータが適切に選択される必要がある。
【0003】
【発明が解決しようとする課題】量子化パラメータの選
択への従来のアプローチには、統計に基づくもの、画像
全体またはその一部が複数回処理されることを必要とす
る計算を要求するもの、または、人間の視覚システムの
モデルを使用するものがある。これらの従来のアプロー
チは複雑であるか、大量のメモリを必要とするか、また
は、多大な遅延を導入するものである。さらに、このよ
うな従来の解決法は一般的に、画像の非等質領域(例え
ばエッジ)の性質を無視している。さらに、従来の解決
法には、効果的に単一の量子化パラメータを使用するも
のがない。しかし、単一の量子化パラメータは、国際標
準化機構(ISO)標準「勧告草案11173−2」に
記載された動画像専門家グループ(MPEG)のビデオ
符号化構文によって実際に要求される。
【0004】
【課題を解決するための手段】従来の量子化技術にとも
なう上記の難点は、本発明の原理によれば克服される。
本発明によれば、画像の領域の符号化に使用する量子化
パラメータを、a)所定の複数の知覚ノイズ感度(PN
S)クラスのうちの1つへのその領域の分類、b)その
画像の符号化バージョンに対して達成し得る心理視覚品
質のレベル(このレベルは、複数の所定レベルのうちか
ら選択される)、c)PNSクラス、心理視覚品質レベ
ル、および量子化パラメータ値の間の関係の、事前格納
された、経験的に導出されたモデル、の3者から決定す
る。
【0005】PNSは、領域の観察者が耐えられるノイ
ズの量、すなわち、ノイズに対するその領域の知覚的感
度を示す。PNSクラスは、画像の領域において見いだ
される視覚特性の値の範囲に基づいて決定される。PN
Sクラスが基にする特性には、空間的活動度、運動速
度、領域の明るさ、特定のコンテクストにおける領域の
重要性、領域内のエッジの存在、および、領域のテクス
チュア(例えば「平坦」から「高度にきめ細かい」ま
で)がある。
【0006】画像の領域の特性の組合せを含むPNSク
ラスもまた定義できる。使用されるPNSクラスは、実
施者によって選択され、経験的に決定される。符号化画
像の心理視覚品質とは、符号化画像から再構成される画
像のバージョンの、観察者によって知覚される品質であ
る。これは、画像の複雑さおよび画像を符号化するのに
使用可能なビット速度から決定される。もちろん、画像
の異なる領域が異なる量子化パラメータ値で符号化され
ることも可能である。
【0007】実施例では、領域は、画像が分割されてで
きるマクロブロックおよびサブブロックである。また、
PNSクラス、心理視覚品質レベル、量子化ステップサ
イズ、画像の複雑さ、および、使用可能ビット速度の間
の関係が経験的に導出される。さらに、これらの関係
は、テーブルの集合として符号化される。これらのテー
ブルは、所与の許容ビット速度に対する符号化画像の心
理視覚品質を最大化するように設計される。
【0008】本発明の1目的によれば、PNSクラス、
心理視覚品質、および、量子化パラメータを関連づける
テーブルには、各心理視覚品質レベルに対し、各PNS
クラスへの量子化パラメータの割当が格納される。特定
の心理視覚品質レベルに対する各割当は、その心理視覚
品質レベルを達成する符号化画像を生じることが期待さ
れている。しかし、異なる品質レベルに対して、符号化
画像を生じるビット数は異なることもある。従って、画
像が、意図された心理視覚品質レベルを達成するように
符号化される際には、符号化画像中の予想されるビット
数の評価が算出される。
【0009】これらのビット数評価を算出するために、
複数の統計的活動度クラスのうちの1つへの、サブブロ
ックの独立の分類が使用される。サブブロックの偏差
が、サブブロックの統計的活動度を測定するための基準
として使用される。本発明の1目的によれば、サブブロ
ックの統計的活動度クラスおよび使用される量子化パラ
メータが与えられると、そのサブブロックを符号化する
ために生成されると予想されるビット数を決定するため
に、いわゆる「ビットテーブル」が使用される。
【0010】このビットテーブル、および、PNSクラ
スと統計的活動度クラスの間の画像のサブブロックの分
布のヒストグラムが、意図された品質レベルに対して画
像全体を符号化するために使用されるビット数の上記の
評価を算出するために使用される。画像に対して所望さ
れる目的ビット数に最も近い、その画像に対する実際の
ビット数を生じる心理視覚品質レベルが、その画像を符
号化するために選択される。
【0011】画像の符号化の進行中に、さらに目的に評
価を接近して整合させるように量子化パラメータの列の
調整ができるように、実際に生成されるビット数の評価
が、画像全体を符号化するための目的ビット数と比較さ
れる。この整合は、符号化信号の実際のビット速度を、
その信号に対する目的ビット速度に整合させることに対
応する。さらに、各画像に対して使用されるすべての量
子化パラメータ、および、対応する量子化ステップサイ
ズは、その画像の全ブロックを通じて1パスのみで決定
される。そのために、前画像が、現画像のサブブロック
の確率分布関数を評価するために使用される。
【0012】
【実施例】図1には、単純化されたブロック図によっ
て、本発明の原理を使用した、運動補償予測/補間ビデ
オ符号器で使用される適応知覚量子化器100を示す。
適応知覚量子化器100の動作の理解を助けるため、減
算器101および離散コサイン変換器(DCT)110
をも示す。これらは運動補償予測/補間ビデオ符号器
(図示せず)の一部である。
【0013】原始ビデオ信号VIDINは、画像を含む
フレームの列であり、減算器101および知覚ノイズ感
度(PNS)分類器105に供給される。信号VIDI
Nのフレーム間差分符号化フレーム(これは、予測符号
化および補間符号化フレームの両方を包含する)に対し
て、減算器101には、信号VIDINとして供給され
ているフレームの予測バージョンを表す信号PREDも
供給される。
【0014】信号VIDINのフレームがフレーム内符
号化されている場合、PREDはヌル画像、すなわち、
すべて0である。減算器101は、PREDのフレーム
を、PREDのフレームが表す信号VIDIN内のフレ
ームから減算し、予測エラー信号PREDERRのフレ
ームを生成する。従って、フレーム間差分符号化フレー
ムに対して、信号PREDERRは、信号PREDに加
算される際に、画素(ペル)単位で信号VIDINを生
じる画像を表す。信号VIDINのフレームがフレーム
内符号化されている場合、信号PREDERRは信号V
IDINと同一である。
【0015】信号VIDINおよびPREDERRの画
素は、画素の2次元配列であるサブブロックへとグルー
プ化される。典型的な輝度サブブロックサイズは8×8
ペルである。この8×8ペルのサブブロックはまたマク
ロブロックへとグループ化される。例えば、マクロブロ
ックは4個の、16×16のペル配列に配置された、隣
接する輝度サブブロック、および、その輝度サブブロッ
クと共存するすべての色サブブロックを含む。輝度マク
ロブロックおよびサブブロックのみが、下記の本発明の
実施例における処理中に使用される。
【0016】DCT110は、信号PREDERRを離
散コサイン領域に変換し、信号DCTERRとして量子
化器120に供給される変換係数を生成する。量子化器
120によって量子化されるのは信号PREDERRの
変換係数である。DCT110は、この離散コサイン変
換を実行する際に、信号PREDERRのペルの上記の
サブブロックに作用する。DCT110は、変換係数の
出力8×8サブブロックを生じる。8×8ペルのサブブ
ロックがマクロブロックに上記のようにグループ化され
るのと同様に、これらの変換係数の8×8サブブロック
もまた変換係数のマクロブロックへとグループ化され
る。
【0017】量子化器120は、基底量子化器ステップ
サイズ行列を格納するメモリ125を含む。基底量子化
器ステップサイズは、基底量子化器ステップサイズ行列
の成分であり、1つの基底ステップサイズが、信号DC
TERRの各サブブロックの変換係数のうちの1つに対
応してそれを量子化するために使用されるように配列さ
れる。従って、基底量子化器ステップサイズ行列は8×
8行列である。
【0018】信号DCTERRに加えて、量子化器12
0は、入力として、PNS分類器105から、量子化パ
ラメータqpをも受信する。量子化器120は、基底量
子化器ステップサイズ行列および量子化パラメータqp
を使用して、信号DCTERRQを生成する。信号DC
TERRQは、変換されたエラー信号DCTERRの量
子化バージョンであり、出力として供給される。信号D
CTERRの各係数を量子化するために使用される実際
の量子化器ステップサイズは、qpの値に、基底量子化
器ステップサイズ行列の各成分を乗じることによって算
出される。
【0019】PNS分類器105は、信号VIDINの
各マクロブロックを、所定の複数の知覚ノイズ感度(P
NS)クラスのうちの1つに分類する。PNSは、領域
の観察者が耐えられるノイズの量、すなわち、ノイズに
対するその領域の知覚的感度を示す。PNSクラスは、
画像の領域において見いだされる視覚特性の値の範囲に
基づいて決定される。その理由は、人間の眼のノイズに
対する感度は、ノイズが出現する領域の視覚的特性の性
質によって変動するためである。PNSクラスが基にす
る特性には、空間的活動度、運動速度、運動の連続性、
領域の明るさ、特定のコンテクストにおける領域の重要
性、領域内のエッジの存在、および、領域のテクスチュ
ア(例えば「平坦」から「高度にきめ細かい」まで)が
ある。画像の領域の特性の組合せを含むPNSクラスも
また定義できる。
【0020】適応知覚量子化器100の1つの目標は、
ノイズのうちできるだけ多くの部分が最も見えにくい場
所に出現するように量子化から生じるノイズの配置を調
整しながら、同時に、画像のノイズ感度の高い領域が相
対的に精細に量子化されることを保証することである。
従って、ブロック性が生じる(すなわち、サブブロック
境界が知覚可能となる)平坦および低詳細領域は、相対
的に精細に量子化されなければならない。しかし、にぎ
やかできめ細かい領域は、ノイズが見えにくく、相対的
に粗く量子化することができる。MPEG標準に対応す
る実施例では、1つだけの量子化パラメータqpが各マ
クロブロックに対して計算されればよい。
【0021】本発明の原理によれば、PNS分類器10
5は、マクロブロックが分類されたPNS分類、およ
び、符号化されているフレーム中の画像の符号化バージ
ョンに対して達成可能と予想される所定の心理視覚品質
レベルQの両方の関数として、各マクロブロックに対す
る量子化パラメータqpを決定する。心理視覚品質レベ
ルは、PNS分類器105によって、品質決定ユニット
130からの入力として受信される。フレーム中の画像
の心理視覚品質レベルの決定について以下でさらに説明
する。
【0022】図示の実施例では、Q、qpおよびPNS
クラスの間の関係が、PNS分類器105内のqpテー
ブル135に格納される。qpテーブルの例を表1に示
す。一般的に、このテーブルは、実施者が定義したPN
S分類の数と同数の列を有する。好適な実施例では、こ
のテーブルは20個の列を有する。実施例および本発明
の原理を説明するには、表1に示すテーブルのような少
数のクラスを有するテーブルで十分である。
【0023】
【表1】
【0024】表1は、行のインデックスが心理視覚品質
レベルQであり、列のインデックスがPNSクラスとな
るように配列されている。フレームに対するQは、後で
さらに説明するように、最終的に生じる目的ビット数に
対して、生成されるビット数における不整合を保証する
ために調整されることがあるが、現時点では、説明を明
確にするため、Qはフレーム全体の符号化中は一定であ
ると仮定する。
【0025】qpテーブルで使用されるPNSクラスの
数および型は、通常、実際の画像による実験に基づいて
選択される。さらに、qpテーブル内のqpの値は、一般
的に、個々のアプリケーションに期待される画像の品質
および型の範囲に対して実験的に決定される。このよう
な実験の目的は、特定の心理視覚品質レベルでのすべて
のPNSクラスに対するqpの値が、画像の内容(例え
ば、なめらかさ、運動速度、明るさなど)に関わらず、
その心理視覚品質レベルに対して符号化された画像全体
を通じてほぼ等しい知覚ノイズを生成するような、qp
テーブルを決定することである。
【0026】qpテーブルに入れるqpの値を決定するた
めのこのような実験の1つでは、符号器および復号器が
同様に、チャネルビット速度に制約を加えることなく、
固定心理視覚品質レベルで動作することを要求する。Q
=0は、qpが計算されているアプリケーションに対す
る最小の心理視覚品質である。表1のQ=0の行のqp
値は、最初は、できる限り一様な知覚ノイズの画像が達
成されるように試行錯誤によって導出される。
【0027】従って、代表画像に対し、観察者が、画像
中に存在するノイズが画像全体に一様に分布していると
知覚したと指示するまで、qpは、一度に1つまたは組
み合わせて調整される。各PNSクラスに対するqp
値はqpテーブルに記録される。この手順は、画像の集
合にわたって、各PNSクラスに対するqp値が画像ご
とに本質的に変化しないようになり、その集合の各画像
の知覚ノイズが、画像全体にわたって一様に分布してい
ると指示されるまで、反復される。
【0028】次の高さの心理視覚品質レベル(表1のQ
=1)に対するqp値に対する最初の推測として、前の
心理視覚品質レベルの各qp値が1だけ減少される。こ
の結果、量子化ステップサイズは効果的に減少し、再構
成画像の心理視覚品質レベルは増大する。特定のPNS
クラスに対応して、画像のある部分が、その画像の残り
の部分よりも少ないノイズを有すると知覚される場合、
そのPNSの列のqp値は、知覚ノイズの一様分布がそ
の画像全体にわたって達成されるまで減少される。
【0029】同様に、特定のPNSクラスに対応して、
画像のある部分が、その画像の残りの部分よりも多くの
ノイズを有すると知覚される場合、そのPNSの列のq
p値は、知覚ノイズの一様分布がその画像全体にわたっ
て達成されるまで増加される。知覚ノイズが、画像、ま
たは画像の集合の全体にわたって一様になると、上記の
ように、各PNSクラスに対する新しいqp値がqpテー
ブルに記録される。この手順は、テーブルがすべて満た
されるまで、qpテーブルの各行に対して反復される。
【0030】符号化中に、PNS分類器105は、符号
化されている信号VIDINの各マクロブロックを、そ
れが最も適合する利用可能なPNSクラスのうちの1つ
に分類する。スイッチ140は位置1にあり、本発明の
目的によれば、マクロブロックが分類されたPNSクラ
スがqpテーブルに供給される。スイッチ140の位置
は、下記のすべての他のスイッチと同様に、量子化器コ
ントローラ(図示せず)の制御下にある。
【0031】本発明の原理によれば、品質決定ユニット
130からスイッチ190を通じて供給される、フレー
ムに対して予想されるQ値のインデックス値を有する行
と、マクロブロックが分類されたPNSクラスに等しい
インデックス値を有する列の交点が決定される。本発明
の1つの目的によれば、決定された交点におけるqp
が、上記のように、マクロブロックを符号化するために
使用され、この目的のために、その値は量子化器120
に供給される。
【0032】適応知覚量子化器100の一実施例では、
PNSクラスは、ほとんど、マクロブロック内の空間活
動度に基づく。これは、マクロブロックの偏差はそのマ
クロブロックの空間活動度の基本的指示子であり、従っ
て、マクロブロックが属するPNSクラスの基本的指示
子であるためである。マクロブロックの偏差は、そのマ
クロブロック内に含まれる4個の輝度8×8サブブロッ
クの偏差を平均することによって計算することができ
る。マクロブロックの各サブブロックの偏差を、左から
右へ、および、上から下へ、それぞれ、va、vb、vc
およびvdとする。また、マクロブロックのサブブロッ
クのうちの最大および最小偏差vmax、vmin、ならび
に、マクロブロックの平均偏差vavが決定される。
【0033】マクロブロックが、低詳細領域、テクスチ
ュア領域、またはエッジの存在を示す場合があるいくつ
かの異なる種類の領域を含む領域を含むか否かを決定す
るために、その中のサブブロックの偏差を検査すること
によって、マクロブロック内に存在する活動度レベルが
PNS分類器105で分析される。低詳細領域またはテ
クスチュア領域のみを含むマクロブロックは等質マクロ
ブロックと呼ばれ、そのマクロブロックの偏差に基づい
て直ちにPNSクラスに分類可能である。等質と宣言さ
れる条件を満たさないマクロブロックは非等質と宣言さ
れる。
【0034】マクロブロックが等質であるかどうかを決
定するためにいくつかのテストが実行可能である。等質
マクロブロックの性質は、その中の4個のサブブロック
の偏差の値が相互に「近い」ことである。本実施例で、
マクロブロックに対して実行される第1のテストは低詳
細テストである。このテストは、マクロブロック全体が
低詳細マクロブロックのうちの1つであるかどうかを決
定する。
【0035】低詳細テストを通過し、低詳細マクロブロ
ックとして分類されるためには、次の2つの条件がとも
に満たされなければならない。 (i)vav<T1 (ii)vmax<T2 ただし、T1およびT2は0〜255の範囲の値を有する
8ビットピクセルに対する所定のしきい値である。しき
い値T1の典型値は45である。しきい値T2は一般的に
1の4倍である。
【0036】マクロブロックが等質性に対する低詳細テ
ストを通過しない場合、そのマクロブロックが等質テク
スチュアマクロブロックであるかどうかを決定するため
に、そのマクロブロックに対してテクスチュアテストが
実行される。テクスチュアテストを通過し、等質テクス
チュアマクロブロックとして分類されるために、条件
(iii)および条件(iv)または(v)のいずれか
が満たされなければならない。
【0037】(iii)vmin>T1 (iv)3つの比vmax/vsbkのうちの2つがvmax
sbk<T3であり、第3の比が<T4である。 (v)3つのすべての比が、vmax/vsbk<T5 ただし、vsbkは、偏差がvmax未満である個々のサブブ
ロックの偏差の値である。
【0038】一般的に、T3は2.5、T4は4.0、T
5は3.25である。上で実行される除算において、サ
ブブロックの偏差がしきい値T0より小さい場合、それ
はT0にセットされる。これは、0による除算を回避す
るとともに、より意味のある比テストを可能にする。T
0の典型値は10である。これらのテストで使用される
しきい値は、非等質と分類されるマクロブロックの数に
対して、等質と分類されるマクロブロックの数を制御す
るように修正することも可能である。しきい値T3、T4
およびT5が増大すると、等質と宣言されるマクロブロ
ックの数は比例して増大する。
【0039】本実施例では、等質マクロブロックには、
ほとんどその偏差に基づいてPNSクラスが割り当てら
れる。マクロブロック偏差の可能範囲は所定の16クラ
スに分割され、1つのPNSクラスには各間隔が対応す
る。これらの間隔を定義するしきい値を表2に与える。
等質マクロブロックのPNSクラスは、そのマクロブロ
ックの偏差が存在する間隔によって決定される。本実施
例の基本的な16個のPNSクラスをC0,...,C
15と表す。PNSしきい値は、低偏差端では接近し、そ
こでは精細な解像度が有利である。
【0040】PNSしきい値は実験によって決定するこ
とも可能である。このような実験は、かなり接近して間
隔づけられたしきい値を有する多数のPNSクラスから
開始される。そして、上記のように、qp値が決定され
る。その後、qp行列の隣接列が、ほとんど等しいか否
か検査される。ほとんど等しい場合、対応する2つのP
NSクラスが1つに合併される。隣接列の合併は、すべ
ての列が相互に十分に異なり、さらに合併が実行できな
くなるまで継続される。
【0041】
【表2】
【0042】本実施例では、実験的に導出された表2の
偏差しきい値は、単純な再帰的プロセスを使用して記述
できることが分かっている。Liを、第i番目の偏差間
隔の上端の偏差しきい値とする。ただし、iは1〜16
である。Δiは、Li−Li-1に等しいと定義される。初
期条件は、L0=0およびΔ0=Δ1=5と設定され、 漸化式 Δi=Δi-1+Δ´i-2 およびΔiの定義によってすべてのLiの値が生成され
る。この式で、Δ´は次のように定義される。 2〜9のiに対して、Δ´i-2=Δi-2 10〜16のiに対して、Δ´i-2=[Δi-2/10]*
【0043】マクロブロックが低詳細テストおよびテク
スチュアテストのいずれも満たさない場合、非等質と宣
言される。非等質マクロブロックは、情景内の対象のエ
ッジまたはその付近に生じやすい。この位置での知覚ノ
イズ感度は、エッジ鮮鋭度、対象サイズ、全体の明るさ
などを含む多くの因子に依存する。従って、非等質エッ
ジマクロブロックに対しては、定義可能なさまざまのP
NSクラスが存在する。
【0044】しかし、このようなマクロブロックを分類
する単純であるが有効な方法は、サブブロックのPNS
クラスとして最小サブブロック偏差vminが入る偏差範
囲に対応するPNSクラスを表2から使用することであ
ることが実験的に分かっている。これは、量子化プロセ
スによって引き起こされるノイズが、フレームが符号化
される心理視覚品質レベルによって許容されるようなマ
クロブロックの最もノイズ感度の高いサブブロックを量
子化するのに、このようなqpで十分であるためであ
る。
【0045】さらに、量子化されるマクロブロックの残
りのサブブロックは、実際に必要であるよりも精細に量
子化される。その理由は、それらもまた偏差vminのサ
ブブロックに対して使用されるのと同一のqp値で量子
化されるためである。しかし、このような結果は、これ
ら残りのサブブロックを符号化するのに、必要以上に多
くのビットを必要とするにも関わらず、受容可能であ
る。その理由は、フレームの心理視覚品質レベルによっ
て許容される以上には、それらのサブブロック内で近く
されるノイズの増大がないためである。
【0046】上記の技術の例として、非等質マクロブロ
ックが、隣接する2個のサブブロックを含む低詳細領
域、および、隣接する2個のサブブロックを含むテクス
チュア領域を含む場合、低詳細領域がvminを有する。
その理由は、低詳細領域はテクスチュア領域よりも低い
偏差を有するためである。マクロブロックは、マクロブ
ロック全体が等質であって4個のサブブロックが低詳細
領域内のサブブロックと同一である場合、すなわち、マ
クロブロック偏差がvminである場合の結果であるPN
Sクラスに分類される。
【0047】結果として、マクロブロック全体に対して
選択されるqpは、画像が符号化される心理視覚品質レ
ベルに対して受容可能なノイズのレベル以上の付加知覚
可能ノイズを導入しないほどに必要な精細度で低詳細領
域を量子化するのに十分なものである。しかし、この同
じqp値が、マクロブロックのテクスチュア領域に対し
ても使用される。テクスチュア領域は、実際に使用され
るよりも大きいqp値にも耐え得るため、その心理視覚
品質レベルで実際に許容されるよりも小さいノイズを有
するように簡単に符号化される。従って、vminに対応
するPNSクラスを使用することは慎重な選択である。
【0048】等質マクロブロックの内容は、低偏差PN
Sクラスのうちの1つに属するマクロブロック内の滑ら
かさから、中偏差PNSクラスのうちの1つに属するマ
クロブロック内の精細テクスチュア、そして、高偏差P
NSクラスのうちの1つに属するマクロブロックの粗テ
クスチュアまでの範囲にわたる。上記のように、低偏差
PNSクラスは一般的にノイズに対する感度が高い。
【0049】しかし、こうした低偏差PNSクラスに
は、非常に低いまたは非常に高い明るさを有する場合
に、同レベルの空間的活動度を有するが普通の明るさし
か有しないPNSクラスに対するよりも低いノイズ感度
を特に示すPNSクラスにさらに分類可能なものもあ
る。情景中の運動速度または前景/背景のようなコンテ
クストの面などの他の因子もまた、付加PNSクラスを
定義することによって考慮に入れることができ、そのう
ちのいくつかは表2で定義されたものと重複する偏差範
囲を有することもある。
【0050】本発明の1つの目的によれば、任意の種類
の付加PNSクラスが、表1に付加列を追加する。例え
ば、表1で、PNSクラスC3aは低詳細であるが非常に
高いまたは非常に低い明るさのPNSクラスに対応し、
3bは、C3aと同じ空間的活動度レベルを有するが普通
の明るさであるPNSクラスに対応する。このようなク
ラスを定義するために使用される方法は、上記の方法と
同様であり、作成される付加クラスは付加列として表1
に追加される。
【0051】C3aおよびC3bのように、特定の偏差レベ
ルに対して複数のPNSクラスが存在する場合には、非
等質マクロブロックが符号化される際に、ノイズに対し
て感度の高いPNSクラス(例えばPNSクラスC3b
が選択されるべきである。上記のように、これはさらに
慎重な選択である。その理由は、これは、最もノイズ感
度の高いサブブロックを含む、マクロブロックのすべて
のサブブロックが、フレームが符号化される心理視覚品
質レベルによって許容されるよりも高いノイズが知覚さ
れることを許容しないように符号化されることを保証す
るためである。
【0052】予測エラー信号PREDERRが、ビット
評価器ユニット115に供給される。本発明の1つの目
的によれば、符号化される画像の心理視覚品質に対し
て、フレームを符号化するのに必要なビット数を後で評
価することができるように、信号PREDERRのコン
テクストに基づいて、すべてのマクロブロックの各サブ
ブロックが統計的活動度クラス(SAC)に割り当てら
れる。
【0053】統計的活動度クラスの1つのサブグループ
(偏差モデル活動度分類(VMAC)サブグループとい
う)は、信号PREDERRのサブブロック偏差のみに
基づく統計的活動度クラスを含む。VMACサブグルー
プ内の各SACは、表3に示すように、信号PREDE
RRの偏差の範囲に対応する。VMACサブグループ統
計的活動度クラスに対する表3は、PNSクラスに対す
る表2に類似するが、このような類似性は単なる実施時
の選択の結果である。表3は、等質マクロブロック内に
含まれるサブブロックに対するSAC分類を実行するた
めに、SAC分類器170によって使用される。
【0054】
【表3】
【0055】PREDERR信号内に鋭い不連続が存在
する場合、統計的活動度クラスのもう1つのサブグルー
プが、改善された結果を与えることができる。このよう
なサブグループ(エッジモデル活動度分類(EMAC)
サブグループという)は以下で定義する。従って、統計
的活動度クラスは2つのサブグループ、すなわち、相対
的に連続な領域に対するVMAC、および、高度の不連
続性を含む領域に対するEMACに分割される。
【0056】本実施例では、高い不連続性の領域は、信
号VIDINのサブブロックの偏差の代わりに信号PR
EDERRのサブブロックの偏差が使用されることを除
いては、上記のPNS分類における等質/非等質分節化
と同様の方法を使用して検出される。連続偏差の領域で
生じるサブブロックはVMACと指定され、そのサブブ
ロックの偏差が入る偏差領域に対応するSACを決定す
ることによってSAC分類を実行するために、SAC分
類器170によって表3が使用される。不連続偏差の領
域で生じるサブブロックに対しては、さらに処理が下記
のように実行される。その他の周知の不連続/エッジ領
域の検出方法もまた使用可能である。
【0057】高い不連続性/エッジ領域に対しては、E
MACサブグループに属する4つの統計的活動度クラス
が定義される。最初の3つのEMACクラス(E0
2)は、サブブロックの偏差に依存する。E0は、15
0〜649の偏差強度を有するサブブロック内の弱エッ
ジを表し、E1は、650〜1899の偏差強度を有す
るサブブロック内の標準エッジを表す。
【0058】E2は、1900以上の偏差強度を有する
サブブロック内の強エッジを表す。第4のEMACクラ
スE3は、650より大きい偏差強度差を有する水平ま
たは垂直エッジに対して使用される。これらの統計的活
動度クラスを表4に示す。この表は、下記のように、高
い不連続性/エッジの領域にあるサブブロックのSAC
分類を実行するためにSAC分類器170によって使用
される。
【0059】
【表4】
【0060】サブブロック分類に使用されるプロセス
は、テクスチュアからエッジを区別することができるこ
とを必要とする。このために、4個のサブブロック偏差
が、非等質マクロブロック内の位置に関して評価され
る。
【0061】サブブロックは、VMACまたはEMAC
サブグループのいずれかのSACに属することができ
る。図2に、サブブロック204、206、208およ
び210に分割されたマクロブロック201の例を示
す。各サブブロック204、206、208および21
0はまた、対応するPREDERR偏差va、vb
c、およびvdをもそれぞれ有する。数値例を与えるた
めに、va=900、vb=40、vc=2000、およ
びvd=100とする。
【0062】サブブロック偏差は、サブブロック偏差の
対比較を使用することによってソートされる。6回のこ
のような比較が実行される。3回はvmaxを決定するた
めであり、2回はvminのためであり、最後の2回はv
midhおよびvmidl、すなわち、中の上偏差値および中の
下偏差値のためである。再び図3にマクロブロック20
1を示す。各サブブロック204、206、208およ
び210は、上で与えられた数値例に従って、ソートさ
れた後適当にラベル付けされている。
【0063】再び、上記のように、サブブロック偏差の
値が、上記のしきい値T0より小さい場合、それはT0
設定される。3個の偏差比r0=vmidl/vmin、r1
midh/vmidl、およびr2=vmax/vmidhが計算され
る。これらの比は、それらのうちからrmax、rmid、お
よびrminを決定するために2回の対比較によってソー
トされる。図4に、偏差比403を含む配列401を示
す。上で与えられた数値例に対する比ソートの結果を示
す配列401も示されている。
【0064】第1ステップとして、偏差vminを有する
サブブロックが最初に、その偏差および表3によって決
定されるVMACサブグループ内の統計的活動度クラス
のうちの1つに割り当てられる。また、偏差vmaxを有
するサブブロックは最初に、その偏差および表4によっ
て決定されるEMACサブグループ内の統計的活動度ク
ラスのうちの1つに割り当てられる。従って、数値例で
は、サブブロック206が、VMACサブクラスのうち
からV3というSACに割り当てられ、サブブロック2
08が、EMACサブクラスのうちからE2というSA
Cに割り当てられる。
【0065】その後、偏差比がrminである2つのサブ
ブロックが合併されて第1領域を生成する。図3に、そ
の偏差の比がrminであるサブブロック204および2
08を合併して生成された第1領域301を示す。第1
領域のサブブロックのうちの1つが偏差vmaxを有する
場合、この領域は最初にエッジ領域と宣言され、その中
の2つのサブブロックはいずれもEMACサブグループ
内の統計的活動度クラスのうちの1つに割り当てられ
る。
【0066】サブブロック208は偏差vmaxを有する
ため、第1領域301はエッジ領域と宣言され、従っ
て、サブブロック204および208はEとラベル付け
される。最初に、それぞれが分類されるEMACサブグ
ループの特定のSACがサブブロックの偏差および表4
から決定される。しかし、この初期SACは下記のよう
に変更され得る。数値例では、この初期SACはE3
ある。
【0067】また、第1領域のサブブロックのうちの1
つが偏差vminを有する場合、各サブブロックは、各偏
差および表3に従って、VMACクラスのうちの1つに
割り当てられる。このようなサブブロックはVとラベル
付けされる。領域が偏差vmidhおよびvmidlのみのサブ
ブロックを含む場合、そのサブブロックを分類するため
にさらに検査が必要となる。
【0068】偏差比rmidを有するサブブロックは第2
領域へと合併され、その2つのサブブロックには、その
うちの1つが以前に割り当てられたVMACサブグルー
プまたはEMACサブグループのいずれかの同じサブグ
ループの統計的活動度クラスに割り当てられる。数値例
では、r0=rmidであり、サブブロック206および2
10が第2領域303に含められる。サブブロック20
6は既にサブブロックVMACのSACに分類されてい
るため、サブブロック210もまたそうなり、従って、
Vとラベル付けされる。数値例では、サブブロック21
0はV5というSACに分類される。
【0069】偏差比がrminである2つのサブブロック
がEMACサブグループのSACに分類され、いずれの
サブグループもE0クラスでなく、rmin<2であり、そ
のサブブロックが{204,206}、{208,21
0}、{204,208}または{206,210}で
ある場合、強水平または垂直エッジが存在すると決定さ
れる。このような状況では、偏差比がrminである各サ
ブブロックはE3クラスに割り当てられる。数値例で
は、vaが900から1900に変化すると、垂直エッ
ジに対するすべての条件がサブブロック204および2
08に存在することになる。従って、各サブブロック2
04および208はE3というSACに割り当てられる
ことになる。
【0070】図5に、非等質マクロブロックの3つの可
能な型、および、マクロブロックのサブブロックのEM
AC(E)およびVMAC(V)サブグループ内の統計
的活動度クラスへの割当のすべての許容される組合せを
示す。特に、マクロブロック501、503、505、
507、509、511、513および515は、強水
平または垂直エッジを有する候補である。その理由は、
番号づけられた各マクロブロックは、EMACサブグル
ープの統計的活動度クラスに分類された隣接サブブロッ
クを含むためである。
【0071】図1に戻って、現フレームに対するQを決
定するために、ヒストグラムカウンタ(HIST)14
5は、符号化開始前に特定のPNSクラスにも存在する
各SAC内のサブブロック数の評価を含まなければなら
ない。この評価は、HIST145とともに含まれるヒ
ストグラムテーブルHIS[PNS][SAC]に保持
される。従って、評価はヒストグラムテーブルのテーブ
ルエントリであり、ヒストグラムテーブルの行はPNS
クラスによってインデックスづけられ、列は統計的活動
度クラスによってインデックスづけられる。
【0072】実施例では、HIST145に格納された
ヒストグラム値は、前フレームが符号化されている間に
計算される。ヒストグラムテーブルに格納されたすべて
の値が、前フレームの符号化の開始前にHIST145
によって0にクリアされる。スイッチ140、155、
160、165および190は、前フレームが符号化さ
れているときには位置1にある。前フレームの各マクロ
ブロックは、処理されると、スイッチ165を通じてP
NSクラスをHIST145に供給するPNS分類器1
05によって、所定のPNSクラスのうちの1つに分類
される。
【0073】同様に、各マクロブロックの各サブブロッ
クに対し、SAC分類器170は、スイッチ160を通
じてHIST145に供給されるSACを生成する。ヒ
ストグラムテーブルの各行および列の交点には、既に処
理され、同じ特定のPNSクラスおよび同じ特定の統計
的活動度クラスの両方に分類された前フレームのサブブ
ロック数が格納される。各サブブロックが処理される
と、今サブブロックが分類されたSACおよびPNSク
ラスのそれぞれに対応する行および列の交点のヒストグ
ラムテーブルの位置がインクリメントされる。前フレー
ムの符号化の終了までに生成されヒストグラムテーブル
に格納される値は、その後、現フレームに対する特定の
PNSクラスにも存在する各SAC内のサブブロック数
の評価として使用される。
【0074】心理視覚品質レベルの選択は、各フレーム
に対し、そのフレームの符号化の開始前に1度実行され
る。その際、品質決定ユニット130は、運動補償予測
/補間ビデオ符号器(図示せず)から、符号化されるフ
レームの目的ビット数、および、ビット評価器115か
ら、可能な各心理視覚品質レベルが使用される際にフレ
ームを符号化するのに必要となるビット数の評価を、入
力として受信する。品質決定ユニット130は、各心理
視覚品質レベルの評価されたビット数を、フレームの目
的ビット数と比較し、目的ビット数以下で最も近い評価
に対応する心理視覚品質レベルを選択する。
【0075】各心理視覚品質レベルで現フレームを符号
化することによって生成されるビット数を評価するため
に、ビット評価器115は、a)特定のPNSクラスに
も存在する各統計的活動度クラス(SAC)内のサブブ
ロック数の評価である、ヒストグラムテーブルに格納さ
れた値、b)特定の統計的活動度クラス内のサブブロッ
クが特定のqpで符号化される場合に生成される評価ビ
ット数を示す事前格納ビットテーブル150(表5)、
および、c)PNS分類器105によって供給されるq
p値、を使用する。
【0076】このような評価を決定するために、スイッ
チ140、155、160、165および190はすべ
て位置2にされる。特定の心理視覚品質レベルQ´に対
して、フレームを符号化するのに必要なビット数の評価
は次式で与えられる。
【数1】ただし、PNSindxは、複数のPNSクラス全
体を走る変数であり、SACindxは、複数の統計的活動
度クラス全体を走る変数であり、HIS[PNSindx
[SACindx]は、ヒストグラムテーブルからの対応す
る値である。
【0077】PNSindxおよびSACindxの値は、すべ
てのPNSクラスおよびすべての統計的活動度クラスに
わたる二重和を実行するように、それぞれPNSind
x175およびSACindx180によって供給され
る。qp_TABLE[Q´][PNSindx]は、心理
視覚品質レベルQ´に対するqpの値に対応する。Q´
の値は、心理視覚品質レベルの全範囲にわたる。ビット
数は、各Q´値に対して1度計算される。Q´はQ´i
ndx185によって供給される。PNSindx17
5、SACindx180およびQ´indx185に
よる値の供給のタイミングは、コントローラ(図示せ
ず)によって同期される。このような同期は当業者に周
知である。
【0078】表5に、省略したビットテーブル150の
例を示す。このようなテーブルの生成方法は当業者にと
って直ちに明らかである。
【0079】
【表5】
【0080】指定されたビット数以内で画像を符号化す
る最善の努力にも関わらず、実際に生成されるビット数
が仕様を(おそらく大幅に)超過することが起こり得
る。これは一般的に、ヒストグラムテーブルがPNSク
ラスおよび統計的活動度クラスにおけるサブブロックの
分布の評価に過ぎず、そのような評価は、特に情景変化
の際に正しくないことがあるという事実の結果である。
【0081】運動補償予測/補間ビデオ符号器(図示せ
ず)の一般的なバッファのオーバフローを防ぐため、バ
ッファのあふれが規則的間隔(例えばフレームごとに5
回)PNS分類器105によって監視される。符号器バ
ッファのあふれの指示が信号バッファあふれとしてPN
S分類器105によって受信される。バッファあふれに
依存して、符号化されているフレームに対するqpテー
ブルへのインデックスとして使用されているQが、累進
的かつ順序正しく調整される。Qに対するこの調整の性
質および方向は、バッファのあふれとともに変化する。
使用されるQを減少させる結果、量子化が粗くなり、観
察者によって知覚される心理視覚品質を犠牲にしてより
少ないビットが生成される。しかし、心理視覚品質にお
けるこのような順序正しい減少は、バッファのオーバフ
ローを許容するよりも望ましい。
【0082】以上は、本発明の原理の単なる例示であ
る。従って、適応知覚量子化器100のさまざまな要素
が離散的な機能要素として示されているが、それらの各
機能は一般的に、当業者に周知の方法で、プロセッサで
実行される適当なプログラムコードによって実現され
る。
【0083】例えば、このような一実施例では、メモリ
125に格納される量子化ステップサイズ行列は、各フ
レームに対して1度記憶装置(図示せず)からダウンロ
ードすることができる。従って、行列は、フレームごと
に同一である必要はない。さらに、複数のqpテーブル
135がPNS分類器105に格納されることが可能で
ある。特定のフレームを符号化するのにどの格納テーブ
ルを使用するかは、その特定フレームに使用される符号
化の種類に依存することができる。
【0084】従って、フレーム内符号化フレーム(I)
が第1qpテーブルを有し、運動補償予測(P)符号化
フレームが第2qpテーブルを有し、運動補間(B)フ
レームが第3qpテーブルを有するということが可能で
ある。他の実施例では、信号PREDERRがPNS分
類においてVIDINに加えて、またはその代わりに使
用されることができる。これは、PNS分類器105へ
の破線入力によって示されている。
【0085】また他の実施例では、符号化されるフレー
ムは2パスプロセスによって処理されることも可能であ
る。2パスを実現するため、フレームに対応する信号V
IDINの部分が一時的にメモリにバッファリングされ
る。第1パス中に、符号化されるフレームのPNSクラ
スおよび統計的活動度クラスにおけるサブブロックの実
際の分布が決定されヒストグラムテーブルに格納され
る。
【0086】その結果、各心理視覚品質レベルに対して
フレームを符号化するのに必要な評価ビット数が実際の
ビット数となる。従って、最適一致の心理視覚品質レベ
ルが品質決定ユニット130によって選択された後、フ
レームの実際の符号化(第2パス)中に生成されるビッ
ト数は、第1パス中にその心理視覚品質レベルに対して
決定された数そのものである。従って、補正の必要がな
い。
【0087】さらに他の実施例では、HIST145は
実際には複数のヒストグラムテーブルを含み、また、ヒ
ストグラムテーブルは複数の領域を含むことが可能であ
る。このような実施例では、1つのヒストグラムにはフ
レーム型(例えばI、PおよびBフレーム)ごとに格納
される。特定のフレームのビット数の計算に実際に使用
されるヒストグラムは、同じ型のフレームに対して格納
されたものとなる。
【0088】
【発明の効果】以上述べたごとく、本発明によれば、量
子化パラメータが従来よりも簡単な方法で適切に選択さ
れる。本発明によれば、大量のメモリは必要でなく、画
像が複数回処理されることも必要でなく、導入される遅
延も従来に比べて短い。また、画像の非等質領域(例え
ばエッジ)の性質も考慮される。本発明の方法および装
置は、単一の量子化パラメータを効果的に使用するた
め、MPEGによるビデオ符号化に適したものである。
【図面の簡単な説明】
【図1】本発明の原理による、適応知覚量子化器の、単
純化したブロック図である。
【図2】サブブロックに分割されたマクロブロックの例
である。
【図3】図2に示すものと同一のマクロブロックにおい
て、そのサブブロックが、ソート後に適切にラベル付け
された図である。
【図4】偏差比を含む2つの配列である。
【図5】非等質マクロブロックの3つの可能な型、およ
び、そのサブブロックの、EMACおよびVMACサブ
グループ内の統計的活動度クラスへの割当のすべての許
容される組合せである。
【符号の説明】
100 適応知覚量子化器 101 減算器 105 知覚ノイズ感度(PNS)分類器 110 離散コサイン変換器(DCT) 115 ビット評価器ユニット 120 量子化器 125 メモリ 130 品質決定ユニット 135 qpテーブル 140、155、160、165、190 スイッチ 145 ヒストグラムカウンタ(HIST) 150 事前格納ビットテーブル 170 SAC分類器 201 マクロブロック 204、206、208、210 サブブロック 401 配列 403 偏差比
───────────────────────────────────────────────────── フロントページの続き (72)発明者 ランガラヤン アラヴィンド アメリカ合衆国 07747 ニュージャー ジー マタワン、マタワン テラス 104 (72)発明者 バリン ジィオフリー ハスケル アメリカ合衆国 07724 ニュージャー ジー ティントン フォールズ、グレン ウッド ドライヴ 82 (72)発明者 ヒュ−ミン ハン アメリカ合衆国 07751 ニュージャー ジー モルガンヴィル、ヨークシャー ドライヴ 135 (56)参考文献 特開 平3−16489(JP,A) 特開 平2−305191(JP,A) 特表 平2−503733(JP,A)

Claims (12)

    (57)【特許請求の範囲】
  1. 【請求項1】 ビデオ符号器が、フレームからなるビデ
    オ信号の少なくとも一部を処理する際にそのビデオ符号
    器によって使用される量子化パラメータを生成する際に
    使用する方法において、 前記フレームのうちの特定の1つを複数の領域に分割す
    るステップと、 各領域を所定の複数の知覚ノイズ感度クラスのうちの1
    つに分類するステップと、 前記フレームに対する目的心理視覚品質レベルを所定の
    複数の目的心理視覚品質レベルのうちから選択するステ
    ップと、 前記各領域の知覚ノイズ感度クラスおよび前記目的心理
    視覚品質レベルの関数として、前記各領域の量子化パラ
    メータを提供するステップとからなることを特徴とする
    量子化パラメータ生成方法。
  2. 【請求項2】 分類ステップが、 各領域に対する知覚ノイズ感度レベルを決定するステッ
    プと、 各知覚ノイズ感度レベルを、所定の複数の知覚ノイズ感
    度クラスのうちの対応する1つにマッピングするステッ
    プとからなることを特徴とする請求項1の方法。
  3. 【請求項3】 選択ステップが、目的心理視覚品質レベ
    ルを、フレームのビデオ信号の評価複雑度およびフレー
    ムを符号化するために指定されるビット数に関連づける
    所定の関数を使用することを特徴とする請求項1の方
    法。
  4. 【請求項4】 領域がマクロブロックであり、決定ステ
    ップが、各マクロブロックに対する知覚ノイズ感度レベ
    ルを決定し、それによって、付加ノイズを有するマクロ
    ブロックを知覚する観察者にそのノイズの付加が与える
    妨害効果に関してマクロブロックに付加することができ
    るノイズの量によって各マクロブロックを特徴づけるこ
    とを特徴とする請求項2の方法。
  5. 【請求項5】 前記領域が2種類からなり、第1種の領
    域はマクロブロックであり、第2種の領域はサブブロッ
    クであり、複数のサブブロックが合わせてマクロブロッ
    クを形成するようにグループ化され、選択ステップが、 各サブブロックを複数の統計的活動度クラスのうちの1
    つに分類するステップと、 複数の心理視覚品質レベルのそれぞれにおいてフレーム
    を符号化するのに必要なビット数の評価を算出するステ
    ップと、 前記評価を、前記フレームを符号化するのに使用可能な
    所定の目的ビット数と比較するステップと、 前記目的ビット数を超えない最も近い評価を心理視覚品
    質レベルを取得するステップとからなることを特徴とす
    る請求項1の方法。
  6. 【請求項6】 算出ステップの各評価が、特定の心理視
    覚品質レベルQ´に対して、 【数1】 によって与えられる(ただし、PNSindxは、複数の知
    覚ノイズ感度クラス全体を走る変数であり、SACindx
    は、複数の統計的活動度クラス全体を走る変数であり、
    p_TABLE[Q´][PNSindx]は、心理視覚
    品質レベルQ´を達成するために符号化されなければな
    らない知覚ノイズ感度クラスPNSindxに属するマクロ
    ブロックを符号化する際に使用される量子化パラメータ
    の値に対応し、HIS[PNSindx][SACindx
    は、知覚ノイズ感度クラスPNSindxにも存在する統計
    的活動度クラスSACindx内のサブブロック数の評価で
    ある)ことを特徴とする請求項5の方法。
  7. 【請求項7】 フレームからなるビデオ信号の少なくと
    も一部の量子化に使用される装置において、 前記フレームが所定の複数の知覚ノイズ感度クラスのう
    ちの1つに分割される第1領域を分類する第1分類手段
    (105)と、 前記フレームを符号化するために、所定の複数の心理視
    覚品質レベルから目的心理視覚品質レベルを選択する手
    段(130、115)と、 前記各領域に対する量子化パラメータを決定する手段
    (120)とからなり、決定手段が、前記各領域が第1
    分類手段によって分類される知覚ノイズ感度クラスに応
    答し、目的心理視覚品質レベルが前記フレームに対して
    選択手段によって選択されることを特徴とする量子化パ
    ラメータ生成装置。
  8. 【請求項8】 選択手段が、 所定の複数の心理視覚品質レベルのそれぞれを有する前
    記フレームを符号化するのに必要なビット数の評価を生
    成する手段(115)と、 前記フレームを符号化するのに使用可能な所定の目的ビ
    ット数を受信する手段と、 前記目的ビット数に最も近い評価を有する心理視覚品質
    レベルを取得する手段(130)とからなることを特徴
    とする請求項7の装置。
  9. 【請求項9】 選択手段が、 所定の複数の心理視覚品質レベルのそれぞれを有する前
    記フレームを符号化するのに必要なビット数の評価を生
    成する手段(115)と、 前記フレームを符号化するのに使用可能な所定の目的ビ
    ット数を受信する手段と、 前記目的ビット数を超過せずにそれに最も近い評価を有
    する心理視覚品質レベルを取得する手段(130)とか
    らなることを特徴とする請求項7の装置。
  10. 【請求項10】 評価生成手段が、 前記フレームが所定の複数の統計的活動度クラスのうち
    の1つに分割される第2領域を分類する第2分類手段
    (180)と、 第1および第2分類手段に応答して、特定の心理視覚品
    質レベルが達成されるように、第1領域のうちの1つの
    中に含まれる第2領域のうちの1つの符号化によって生
    成されるビット数を決定する手段(150)とからなる
    ことを特徴とする請求項8または9の装置。
  11. 【請求項11】 第1領域がマクロブロックであり第2
    領域がサブブロックであることを特徴とする請求項10
    の装置。
  12. 【請求項12】 前記量子化パラメータを出力として供
    給する手段(155)と、 前記量子化パラメータに応答して、前記ビデオ信号の符
    号化形式の一部を量子化する量子化手段(120)とを
    さらに有することを特徴とする請求項7の装置。
JP4321449A 1991-11-08 1992-11-06 量子化パラメータ生成方法および装置 Expired - Lifetime JP2651097B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US790285 1991-11-08
US07/790,285 US5214507A (en) 1991-11-08 1991-11-08 Video signal quantization for an mpeg like coding environment

Publications (2)

Publication Number Publication Date
JPH0670311A JPH0670311A (ja) 1994-03-11
JP2651097B2 true JP2651097B2 (ja) 1997-09-10

Family

ID=25150225

Family Applications (1)

Application Number Title Priority Date Filing Date
JP4321449A Expired - Lifetime JP2651097B2 (ja) 1991-11-08 1992-11-06 量子化パラメータ生成方法および装置

Country Status (4)

Country Link
US (1) US5214507A (ja)
EP (1) EP0541302A2 (ja)
JP (1) JP2651097B2 (ja)
CA (1) CA2081405A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004215257A (ja) * 2002-12-27 2004-07-29 Samsung Electronics Co Ltd Dct基盤の改善された動映像符号化方法及びその装置

Families Citing this family (125)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB9405914D0 (en) * 1994-03-24 1994-05-11 Discovision Ass Video decompression
EP0576749B1 (en) 1992-06-30 1999-06-02 Discovision Associates Data pipeline system
US5640208A (en) * 1991-06-27 1997-06-17 Sony Corporation Video signal encoding in accordance with stored parameters
JP3189861B2 (ja) * 1992-11-13 2001-07-16 ソニー株式会社 動画像符号化装置および方法
EP0557007A2 (en) * 1992-02-15 1993-08-25 Sony Corporation Picture processing apparatus
US6112017A (en) 1992-06-30 2000-08-29 Discovision Associates Pipeline processing machine having a plurality of reconfigurable processing stages interconnected by a two-wire interface bus
US5768561A (en) 1992-06-30 1998-06-16 Discovision Associates Tokens-based adaptive video processing arrangement
US6330665B1 (en) 1992-06-30 2001-12-11 Discovision Associates Video parser
US5809270A (en) 1992-06-30 1998-09-15 Discovision Associates Inverse quantizer
US6079009A (en) 1992-06-30 2000-06-20 Discovision Associates Coding standard token in a system compromising a plurality of pipeline stages
US6047112A (en) 1992-06-30 2000-04-04 Discovision Associates Technique for initiating processing of a data stream of encoded video information
US5603012A (en) * 1992-06-30 1997-02-11 Discovision Associates Start code detector
US7095783B1 (en) 1992-06-30 2006-08-22 Discovision Associates Multistandard video decoder and decompression system for processing encoded bit streams including start codes and methods relating thereto
US5835740A (en) 1992-06-30 1998-11-10 Discovision Associates Data pipeline system and data encoding method
US6067417A (en) 1992-06-30 2000-05-23 Discovision Associates Picture start token
FR2695743A1 (fr) * 1992-09-16 1994-03-18 Philips Electronique Lab Système de traitement d'images texturées, analyseur de textures et synthétiseur de textures.
US5613015A (en) * 1992-11-12 1997-03-18 Fuji Xerox Co., Ltd. Image signal analyzing system and coding system
JPH06165151A (ja) * 1992-11-25 1994-06-10 Matsushita Electric Ind Co Ltd 映像符号量制御装置
US5414780A (en) * 1993-01-27 1995-05-09 Immix Method and apparatus for image data transformation
KR950002458A (ko) * 1993-06-02 1995-01-04 이헌조 영상신호의 압축/신장 장치
US5878273A (en) * 1993-06-24 1999-03-02 Discovision Associates System for microprogrammable state machine in video parser disabling portion of processing stages responsive to sequence-- end token generating by token generator responsive to received data
US5861894A (en) 1993-06-24 1999-01-19 Discovision Associates Buffer manager
US5699544A (en) * 1993-06-24 1997-12-16 Discovision Associates Method and apparatus for using a fixed width word for addressing variable width data
US5805914A (en) 1993-06-24 1998-09-08 Discovision Associates Data pipeline system and data encoding method
CN1075321C (zh) * 1993-08-30 2001-11-21 索尼公司 图像编码装置及方法
KR950010632A (ko) * 1993-09-17 1995-04-28 배순훈 동영상부호화기
BE1007807A3 (nl) * 1993-11-30 1995-10-24 Philips Electronics Nv Inrichting voor het coderen van een videosignaal.
BE1007808A3 (nl) * 1993-11-30 1995-10-24 Philips Electronics Nv Inrichting voor het coderen van een videosignaal.
US5592226A (en) * 1994-01-26 1997-01-07 Btg Usa Inc. Method and apparatus for video data compression using temporally adaptive motion interpolation
CA2145363C (en) * 1994-03-24 1999-07-13 Anthony Mark Jones Ram interface
CA2145365C (en) * 1994-03-24 1999-04-27 Anthony M. Jones Method for accessing banks of dram
CA2145379C (en) * 1994-03-24 1999-06-08 William P. Robbins Method and apparatus for addressing memory
KR100307618B1 (ko) * 1994-05-31 2001-11-30 윤종용 영상부호화방법및장치
GB9417138D0 (en) * 1994-08-23 1994-10-12 Discovision Ass Data rate conversion
US6222881B1 (en) 1994-10-18 2001-04-24 Intel Corporation Using numbers of non-zero quantized transform signals and signal differences to determine when to encode video signals using inter-frame or intra-frame encoding
US5802213A (en) * 1994-10-18 1998-09-01 Intel Corporation Encoding video signals using local quantization levels
CA2157066C (en) * 1994-10-21 1999-09-21 Nelson Botsford Iii Method for controlling a compressed data buffer
US5734419A (en) * 1994-10-21 1998-03-31 Lucent Technologies Inc. Method of encoder control
KR0170937B1 (ko) * 1994-12-14 1999-03-20 배순훈 영상 데이타 부호화 장치
EP0735772A3 (en) * 1995-03-27 1998-04-01 Hewlett-Packard Company Method for selecting JPEG quantization tables for low bandwidth applications
JP3353604B2 (ja) * 1995-08-09 2002-12-03 ソニー株式会社 動画像符号化方法及び装置、並びに信号記録媒体
US5926569A (en) * 1995-09-28 1999-07-20 Intel Corporation Bitrate damper for selecting quantization levels for image encoding
GB2306830B (en) * 1995-10-30 2000-05-24 Sony Uk Ltd Video data compression
KR100355375B1 (ko) * 1995-11-01 2002-12-26 삼성전자 주식회사 영상부호화장치에있어서양자화간격결정방법및회로
US5727036A (en) * 1995-11-22 1998-03-10 Mitsubishi Semiconductor America, Inc. High bit rate start code searching and detecting circuit and method
US5848195A (en) * 1995-12-06 1998-12-08 Intel Corporation Selection of huffman tables for signal encoding
JPH11502394A (ja) * 1996-01-12 1999-02-23 フィリップス、エレクトロニクス、ネムローゼ、フェンノートシャップ 広帯域デジタル情報信号を送信するための送信機とその方法、及び受信機
US5745178A (en) * 1996-01-22 1998-04-28 Lucent Technologies Inc. Global rate control for model-assisted coding of low bit rate video
US6100931A (en) * 1996-03-19 2000-08-08 Sony Corporation Method and apparatus for controlling a target amount of code and for compressing video data
JP2000506687A (ja) * 1996-03-29 2000-05-30 サーノフ コーポレイション 知覚量を用いて符号化を最適化し自動操作可能な画像圧縮を実行する装置及び方法
JP3977426B2 (ja) * 1996-04-18 2007-09-19 ノキア コーポレイション ビデオデータ用エンコーダ及びデコーダ
US5848266A (en) * 1996-06-20 1998-12-08 Intel Corporation Dynamic data rate adjustment to maintain throughput of a time varying signal
KR100238066B1 (ko) * 1996-06-26 2000-01-15 윤종용 양자화활동도를 이용한 비트 발생량 제어방법 및 그 영상 부호화장치
FR2753330B1 (fr) * 1996-09-06 1998-11-27 Thomson Multimedia Sa Procede de quantification pour codage video
KR100297830B1 (ko) * 1996-11-09 2001-08-07 윤종용 영상단위별 비트발생량 조절 장치 및 방법
US6134269A (en) * 1996-09-25 2000-10-17 At&T Corp Fixed or adaptive deinterleaved transform coding for image coding and intra coding of video
US6094453A (en) * 1996-10-11 2000-07-25 Digital Accelerator Corporation Digital data compression with quad-tree coding of header file
JP3355964B2 (ja) * 1996-10-29 2002-12-09 ケイディーディーアイ株式会社 適応直交変換モード判定方法
US6011872A (en) * 1996-11-08 2000-01-04 Sharp Laboratories Of America, Inc. Method of generalized content-scalable shape representation and coding
FR2756398B1 (fr) * 1996-11-28 1999-06-25 Thomson Multimedia Sa Procede de codage avec information de region
US6381364B1 (en) * 1996-12-31 2002-04-30 Intel Corporation Content texture sensitive picture/video encoder/decoder
FR2758198B1 (fr) * 1997-01-08 2001-09-28 Telediffusion Fse Procede d'estimation de la perception locale des distorsions de quantification dans une image fixe
US6091767A (en) 1997-02-03 2000-07-18 Westerman; Larry Alan System for improving efficiency of video encoders
DE69837003T2 (de) * 1997-02-12 2007-10-18 Mediatek Inc. Vorrichtung und verfahren zur optimierung der bitratensteurung in einem kodiersystem
JP3588970B2 (ja) * 1997-04-30 2004-11-17 ソニー株式会社 信号符号化方法、信号符号化装置、信号記録媒体及び信号伝送方法
US6023296A (en) 1997-07-10 2000-02-08 Sarnoff Corporation Apparatus and method for object based rate control in a coding system
US6937659B1 (en) * 1997-11-14 2005-08-30 Ac Capital Management, Inc. Apparatus and method for compressing video information
IL122361A0 (en) * 1997-11-29 1998-04-05 Algotec Systems Ltd Image compression method
JP3209171B2 (ja) 1998-01-08 2001-09-17 日本電気株式会社 動画像符号化装置
US6252905B1 (en) 1998-02-05 2001-06-26 International Business Machines Corporation Real-time evaluation of compressed picture quality within a digital video encoder
JP3738574B2 (ja) * 1998-09-18 2006-01-25 富士ゼロックス株式会社 画像情報符号化装置
US6895051B2 (en) 1998-10-15 2005-05-17 Nokia Mobile Phones Limited Video data encoder and decoder
ATE333759T1 (de) * 1998-11-17 2006-08-15 Koninkl Kpn Nv Verfahren und anordnung zum ausrichten von eingangs- und ausgangsvideobildfolgen zur messung der videoqualität
US6389072B1 (en) 1998-12-23 2002-05-14 U.S. Philips Corp. Motion analysis based buffer regulation scheme
WO2000040032A1 (en) * 1998-12-23 2000-07-06 Koninklijke Philips Electronics N.V. Adaptive buffer and quantizer regulation scheme for bandwidth scalability of video data
US6366705B1 (en) * 1999-01-28 2002-04-02 Lucent Technologies Inc. Perceptual preprocessing techniques to reduce complexity of video coders
FR2792798B1 (fr) * 1999-04-26 2001-05-25 Thomson Multimedia Sa Procede et dispositif de quantification pour compression video
US6363113B1 (en) * 1999-06-07 2002-03-26 Lucent Technologies Inc. Methods and apparatus for context-based perceptual quantization
US6639942B1 (en) * 1999-10-21 2003-10-28 Toshiba America Electronic Components, Inc. Method and apparatus for estimating and controlling the number of bits
EP2309751A2 (en) * 2000-03-17 2011-04-13 Panasonic Corporation Image signal encoding device and method
US6661927B1 (en) * 2000-07-27 2003-12-09 Motorola, Inc. System and method for efficiently encoding an image by prioritizing groups of spatially correlated coefficients based on an activity measure
US6947486B2 (en) * 2001-03-23 2005-09-20 Visioprime Method and system for a highly efficient low bit rate video codec
US6831947B2 (en) * 2001-03-23 2004-12-14 Sharp Laboratories Of America, Inc. Adaptive quantization based on bit rate prediction and prediction error energy
KR100921063B1 (ko) * 2001-08-02 2009-10-08 소니 가부시끼 가이샤 화상 처리 장치 및 방법, 화상 처리 프로그램을 기록한 기록 매체, 양자화 제어 장치 및 방법, 및 양자화 제어 프로그램을 기록한 기록 매체
US7944971B1 (en) * 2002-07-14 2011-05-17 Apple Inc. Encoding video
US8023563B2 (en) * 2002-10-04 2011-09-20 Stmicroelectronics S.R.L. Method and system for processing signals via perceptive vectorial quantization, computer program product therefor
EP1406447A1 (en) * 2002-10-04 2004-04-07 STMicroelectronics S.r.l. Method and system for processing signals via perceptive vectorial quantization, computer program product therefor
FR2847411B1 (fr) * 2002-11-15 2005-01-14 Telediffusion De France Tdf Procede et systeme de mesure des degradations d'une image video introduites par un codage a reduction de debit
KR100584552B1 (ko) * 2003-01-14 2006-05-30 삼성전자주식회사 동영상 부호화 및 복호화 방법과 그 장치
CN1757237A (zh) * 2003-03-03 2006-04-05 皇家飞利浦电子股份有限公司 视频编码
US20040202249A1 (en) * 2003-04-08 2004-10-14 Newsoft Technology Corporation Real-time MPEG video encoding method of maintaining synchronization between video and audio
US7889792B2 (en) * 2003-12-24 2011-02-15 Apple Inc. Method and system for video encoding using a variable number of B frames
US7453938B2 (en) * 2004-02-06 2008-11-18 Apple Inc. Target bitrate estimator, picture activity and buffer management in rate control for video coder
US7986731B2 (en) * 2004-02-06 2011-07-26 Apple Inc. H.264/AVC coder incorporating rate and quality controller
US7492820B2 (en) * 2004-02-06 2009-02-17 Apple Inc. Rate control for video coder employing adaptive linear regression bits modeling
US7869503B2 (en) 2004-02-06 2011-01-11 Apple Inc. Rate and quality controller for H.264/AVC video coder and scene analyzer therefor
US7869500B2 (en) * 2004-04-27 2011-01-11 Broadcom Corporation Video encoder and method for detecting and encoding noise
US7949051B2 (en) * 2004-05-26 2011-05-24 Broadcom Corporation Mosquito noise detection and reduction
KR20050119422A (ko) * 2004-06-16 2005-12-21 삼성전자주식회사 움직임 보상에 기반한 입력 영상의 노이즈 예측 및 그장치와, 이를 사용한 노이즈 제거 및 동영상 부호화 방법,이를 수행하기 위한 프로그램이 기록된 기록 매체
US20050286629A1 (en) * 2004-06-25 2005-12-29 Adriana Dumitras Coding of scene cuts in video sequences using non-reference frames
FR2878395A1 (fr) * 2004-11-23 2006-05-26 Paul Bazzaz Procede de traitement de signal video
FR2878384A1 (fr) * 2004-11-23 2006-05-26 Paul Bazzaz Compression video par modification de quantification par zones d'images
JP4804107B2 (ja) * 2004-12-14 2011-11-02 キヤノン株式会社 画像符号化装置、画像符号化方法及びそのプログラム
US8437403B2 (en) 2005-01-05 2013-05-07 Jean-Yves Babonneau Device and method for analysing images by calculating the variance for each pixel of a high-frequency image
FR2880498A1 (fr) * 2005-01-05 2006-07-07 Nextream France Sa Dispositif et procede d'analyse d'images
GB2425423A (en) * 2005-04-07 2006-10-25 British Broadcasting Corp Variable quantising for compression encoding
WO2006107280A1 (en) * 2005-04-08 2006-10-12 Agency For Science, Technology And Research Method for encoding a picture, computer program product and encoder
KR100622304B1 (ko) * 2005-09-28 2006-09-12 삼성전자주식회사 동영상 복호화 방법과 그 장치
US8306918B2 (en) * 2005-10-11 2012-11-06 Apple Inc. Use of media storage structure with multiple pieces of content in a content-distribution system
US8126283B1 (en) 2005-10-13 2012-02-28 Maxim Integrated Products, Inc. Video encoding statistics extraction using non-exclusive content categories
US8149909B1 (en) 2005-10-13 2012-04-03 Maxim Integrated Products, Inc. Video encoding control using non-exclusive content categories
US8081682B1 (en) 2005-10-13 2011-12-20 Maxim Integrated Products, Inc. Video encoding mode decisions according to content categories
US8170102B2 (en) * 2005-12-19 2012-05-01 Seiko Epson Corporation Macroblock homogeneity analysis and inter mode prediction
KR100790149B1 (ko) * 2006-07-27 2008-01-02 삼성전자주식회사 비디오 인코딩 데이터율 제어 방법
CN101523441B (zh) * 2006-09-29 2012-01-18 汤姆逊许可证公司 空间活动量度和用于评价空间活动量度的方法
US8228998B2 (en) * 2006-10-10 2012-07-24 Nippon Telegraph And Telephone Corporation Intra prediction encoding control method and apparatus, program therefor, and storage medium which stores the program
CN101436301B (zh) * 2008-12-04 2012-01-18 上海大学 视频编码中特征运动区域的检测方法
US20120039389A1 (en) * 2009-04-28 2012-02-16 Telefonaktiebolaget L M Ericsson Distortion weighing
JPWO2010146772A1 (ja) * 2009-06-19 2012-11-29 三菱電機株式会社 画像符号化装置、画像復号装置、画像符号化方法及び画像復号方法
WO2011081639A2 (en) 2009-12-14 2011-07-07 Thomson Licensing Object-aware video encoding strategies
US9361707B2 (en) * 2010-09-15 2016-06-07 Sharp Laboratories Of America, Inc. Methods and systems for detection and estimation of compression noise
JP5917117B2 (ja) * 2011-12-07 2016-05-11 株式会社日立国際電気 画像符号化装置及び画像符号化方法
EP2791897B1 (en) * 2011-12-09 2018-10-10 Intel Corporation Control of video processing algorithms based on measured perceptual quality characteristics
CN107820084B (zh) * 2016-09-13 2020-02-07 北京金山云网络技术有限公司 一种视频感知编码方法及装置
CN111200734B (zh) 2018-11-19 2022-03-11 浙江宇视科技有限公司 视频编码方法及装置

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4780761A (en) * 1987-06-02 1988-10-25 Eastman Kodak Company Digital image compression and transmission system visually weighted transform coefficients
US4774574A (en) * 1987-06-02 1988-09-27 Eastman Kodak Company Adaptive block transform image coding method and apparatus
JPH02226886A (ja) * 1989-02-28 1990-09-10 Sony Corp データ伝送装置及び伝送方法
CA2014935C (en) * 1989-05-04 1996-02-06 James D. Johnston Perceptually-adapted image coding system
JPH0316489A (ja) * 1989-06-14 1991-01-24 Hitachi Ltd 画像符号化方式
EP0789494B1 (en) * 1989-12-25 2002-04-10 Mitsubishi Denki Kabushiki Kaisha Coding apparatus
US5136377A (en) * 1990-12-11 1992-08-04 At&T Bell Laboratories Adaptive non-linear quantizer
US5113256A (en) * 1991-02-08 1992-05-12 Zenith Electronics Corporation Method of perceptually modeling a video image signal

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004215257A (ja) * 2002-12-27 2004-07-29 Samsung Electronics Co Ltd Dct基盤の改善された動映像符号化方法及びその装置

Also Published As

Publication number Publication date
US5214507A (en) 1993-05-25
EP0541302A2 (en) 1993-05-12
JPH0670311A (ja) 1994-03-11
EP0541302A3 (ja) 1994-01-19
CA2081405A1 (en) 1993-05-09

Similar Documents

Publication Publication Date Title
JP2651097B2 (ja) 量子化パラメータ生成方法および装置
EP2005754B1 (en) Quantization adjustment based on texture level
US8130828B2 (en) Adjusting quantization to preserve non-zero AC coefficients
US8442337B2 (en) Encoding adjustments for animation content
EP2005755B1 (en) Quantization adjustments for dc shift artifacts
KR100298416B1 (ko) 구획 분류 및 적응 비트 할당을 위한 방법 및 장치
US6173069B1 (en) Method for adapting quantization in video coding using face detection and visual eccentricity weighting
EP0797349B1 (en) Signal adaptive postprocessing system for reducing blocking effects and ringing noise
USRE37091E1 (en) Motion compensated prediction interframe coding system
KR100307618B1 (ko) 영상부호화방법및장치
US20070237237A1 (en) Gradient slope detection for video compression
US6782135B1 (en) Apparatus and methods for adaptive digital video quantization
US20110182356A1 (en) A method for the estimation of spatio-temporal homogeneity in video sequences
US7310445B2 (en) Classification of image blocks by region contrast significance and uses therefor in selective image enhancement in video and image coding
US20060256858A1 (en) Method and system for rate control in a video encoder
JP2000350211A (ja) 動画像符号化方法及び動画像符号化装置
JP2004023288A (ja) 動画像符号化のための前処理方式
JP2507215B2 (ja) 画像符号化装置
JP4033292B2 (ja) 動画像符号化のための量子化制御方式
JP3517455B2 (ja) 画像符号化方法及び装置
JP2502862B2 (ja) 画像符号化方法及び画像符号化装置
Choi et al. Adaptive image quantization using total variation classification
Fan et al. Adaptive image sequence coding based on global and local compensability analysis
KR20210061298A (ko) 인지 특성에 기반한 영상 처리 및 인지 화질 향상 방법 및 장치
JPH05219496A (ja) 画像符号化装置及び動画像符号化装置

Legal Events

Date Code Title Description
R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080516

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080516

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080516

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090516

Year of fee payment: 12

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090516

Year of fee payment: 12

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100516

Year of fee payment: 13

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110516

Year of fee payment: 14

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120516

Year of fee payment: 15

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130516

Year of fee payment: 16

EXPY Cancellation because of completion of term
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130516

Year of fee payment: 16