JP2002517176A - デジタル動きビデオ信号のコード化と復号の方法および装置 - Google Patents
デジタル動きビデオ信号のコード化と復号の方法および装置Info
- Publication number
- JP2002517176A JP2002517176A JP50730892A JP50730892A JP2002517176A JP 2002517176 A JP2002517176 A JP 2002517176A JP 50730892 A JP50730892 A JP 50730892A JP 50730892 A JP50730892 A JP 50730892A JP 2002517176 A JP2002517176 A JP 2002517176A
- Authority
- JP
- Japan
- Prior art keywords
- image
- frame
- area
- value
- pixel
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 198
- 230000033001 locomotion Effects 0.000 title claims description 74
- 238000013139 quantization Methods 0.000 claims description 32
- 239000013598 vector Substances 0.000 claims description 17
- 238000000354 decomposition reaction Methods 0.000 claims description 10
- 230000006837 decompression Effects 0.000 claims description 5
- 238000000638 solvent extraction Methods 0.000 claims description 2
- 230000008569 process Effects 0.000 abstract description 75
- 230000003190 augmentative effect Effects 0.000 abstract 1
- 238000007906 compression Methods 0.000 description 63
- 230000006835 compression Effects 0.000 description 50
- 238000012360 testing method Methods 0.000 description 45
- 238000010586 diagram Methods 0.000 description 43
- 238000012545 processing Methods 0.000 description 43
- 230000000875 corresponding effect Effects 0.000 description 38
- 239000000872 buffer Substances 0.000 description 31
- 230000006870 function Effects 0.000 description 25
- 230000002829 reductive effect Effects 0.000 description 23
- 238000003860 storage Methods 0.000 description 21
- 238000004458 analytical method Methods 0.000 description 18
- 230000000694 effects Effects 0.000 description 17
- 230000009471 action Effects 0.000 description 15
- 230000001419 dependent effect Effects 0.000 description 13
- 238000009826 distribution Methods 0.000 description 13
- 230000007704 transition Effects 0.000 description 12
- 230000008901 benefit Effects 0.000 description 11
- 230000009467 reduction Effects 0.000 description 11
- 230000003044 adaptive effect Effects 0.000 description 10
- 238000006243 chemical reaction Methods 0.000 description 9
- 238000001914 filtration Methods 0.000 description 9
- 230000005540 biological transmission Effects 0.000 description 8
- 238000012937 correction Methods 0.000 description 8
- 238000005070 sampling Methods 0.000 description 8
- 230000005236 sound signal Effects 0.000 description 8
- 238000004364 calculation method Methods 0.000 description 7
- 238000006073 displacement reaction Methods 0.000 description 7
- 230000011218 segmentation Effects 0.000 description 7
- 230000007423 decrease Effects 0.000 description 6
- 238000005259 measurement Methods 0.000 description 6
- 230000003993 interaction Effects 0.000 description 5
- 238000013459 approach Methods 0.000 description 4
- 239000002131 composite material Substances 0.000 description 4
- 238000013016 damping Methods 0.000 description 4
- 230000003111 delayed effect Effects 0.000 description 4
- 238000007689 inspection Methods 0.000 description 4
- 230000001788 irregular Effects 0.000 description 4
- 238000011084 recovery Methods 0.000 description 4
- 230000004044 response Effects 0.000 description 4
- 230000000007 visual effect Effects 0.000 description 4
- 238000003491 array Methods 0.000 description 3
- 230000008859 change Effects 0.000 description 3
- 239000011159 matrix material Substances 0.000 description 3
- 230000035945 sensitivity Effects 0.000 description 3
- 238000012935 Averaging Methods 0.000 description 2
- XEEYBQQBJWHFJM-UHFFFAOYSA-N Iron Chemical compound [Fe] XEEYBQQBJWHFJM-UHFFFAOYSA-N 0.000 description 2
- 230000001174 ascending effect Effects 0.000 description 2
- 230000006399 behavior Effects 0.000 description 2
- 230000015572 biosynthetic process Effects 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 239000004744 fabric Substances 0.000 description 2
- 238000003709 image segmentation Methods 0.000 description 2
- 238000003384 imaging method Methods 0.000 description 2
- 230000002452 interceptive effect Effects 0.000 description 2
- 230000002441 reversible effect Effects 0.000 description 2
- 239000007787 solid Substances 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- 241001385733 Aesculus indica Species 0.000 description 1
- 235000003899 Brassica oleracea var acephala Nutrition 0.000 description 1
- 235000012905 Brassica oleracea var viridis Nutrition 0.000 description 1
- 244000064816 Brassica oleracea var. acephala Species 0.000 description 1
- 108091026890 Coding region Proteins 0.000 description 1
- 241000257465 Echinoidea Species 0.000 description 1
- 241001165575 Hylotelephium telephium subsp. maximum Species 0.000 description 1
- 241000406668 Loxodonta cyclotis Species 0.000 description 1
- 239000000654 additive Substances 0.000 description 1
- 230000000996 additive effect Effects 0.000 description 1
- 230000008033 biological extinction Effects 0.000 description 1
- 230000003139 buffering effect Effects 0.000 description 1
- 230000001427 coherent effect Effects 0.000 description 1
- 239000003086 colorant Substances 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 230000001276 controlling effect Effects 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000003708 edge detection Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000005562 fading Methods 0.000 description 1
- 239000000945 filler Substances 0.000 description 1
- 210000003128 head Anatomy 0.000 description 1
- 238000010348 incorporation Methods 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 229910052742 iron Inorganic materials 0.000 description 1
- 238000012886 linear function Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000005192 partition Methods 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 238000012805 post-processing Methods 0.000 description 1
- 230000007261 regionalization Effects 0.000 description 1
- 238000009877 rendering Methods 0.000 description 1
- 230000003252 repetitive effect Effects 0.000 description 1
- 230000008672 reprogramming Effects 0.000 description 1
- 239000004576 sand Substances 0.000 description 1
- 238000010187 selection method Methods 0.000 description 1
- 230000002459 sustained effect Effects 0.000 description 1
- 239000011800 void material Substances 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
- 238000013316 zoning Methods 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/186—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a colour or a chrominance component
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
- H04N19/53—Multi-resolution motion estimation; Hierarchical motion estimation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/60—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
- H04N19/61—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/60—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
- H04N19/63—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N5/00—Details of television systems
- H04N5/76—Television signal recording
- H04N5/91—Television signal processing therefor
- H04N5/92—Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback
- H04N5/926—Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback by pulse code modulation
- H04N5/9261—Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback by pulse code modulation involving data reduction
- H04N5/9262—Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback by pulse code modulation involving data reduction using predictive coding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N7/00—Television systems
- H04N7/24—Systems for the transmission of television signals using pulse code modulation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N9/00—Details of colour television systems
- H04N9/79—Processing of colour television signals in connection with recording
- H04N9/80—Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback
- H04N9/804—Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback involving pulse code modulation of the colour picture signal components
- H04N9/806—Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback involving pulse code modulation of the colour picture signal components with processing of the sound signal
- H04N9/8063—Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback involving pulse code modulation of the colour picture signal components with processing of the sound signal using time division multiplex of the PCM audio and PCM video signals
- H04N9/8066—Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback involving pulse code modulation of the colour picture signal components with processing of the sound signal using time division multiplex of the PCM audio and PCM video signals with insertion of the PCM audio signals in the vertical blanking interval of the PCM video signal
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N5/00—Details of television systems
- H04N5/76—Television signal recording
- H04N5/84—Television signal recording using optical recording
- H04N5/85—Television signal recording using optical recording on discs or drums
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
(57)【要約】
デジタルビデオ信号の少なくとも1つの選択された画像が複数の解像度のレベルでコード化される。各解像度のレベルについて、その解像度レベルの基準画像中の各ピクセルの値を、その解像度レベルの選択された画像中の各対応するピクセルの値から減算することによって補正画像が形成される。この補正画像は量子化され、コード化される。デコーダが各解像度レベルについて、コード化され量子化された補正画像を復号する。最も低い解像度を持つ復号された補正画像中の各ピクセルの値が、同じ解像度の基準画像の各対応するピクセルの値に加算されて、最も低い解像度の出力画像が形成される。この出力画像は次に高い解像度のレベルに拡張される。拡張された出力画像中の各ピクセルの値は、同じ解像度レベルの復号された補正画像中の各対応するピクセルの値に加算されて、その解像度レベルの出力画像が形成される。このプロセスが、全解像度まで拡張された拡張出力画像の各ピクセル値が、全解像度の復号された補正画像中の各対応するピクセルの値に加算されて、後の表示のためにメモリに記憶される最終画像が形成されるまで、継続される。
Description
【発明の詳細な説明】
デジタル動きビデオ信号のコード化と復号
の方法および装置 関連出願との相互関係
この出願は、現米国特許第4,868,653号となった1987年10月5日付米国特許出
願第07/104,457号の継続出願である1989年9月15日出願の米国特許出願第07/4
08085号の一部継続出願である。
発明の技術分野
この発明は、ビデオ信号の処理に、具体的にはフル・カラー・ビデオ信号を表
している圧縮されたデジタル・ビデオ信号を供給するシステムおよび復号するシ
ステムに関するものである。
発明の背景
デジタル・ビデオ信号を、コンパクト・ディスク(CD)のような比較的狭帯
域の媒体に記録し易くするために圧縮技法が必要であることは、既に知られてい
る。高橋氏その他が米国特許第4520401号に開示したシステムでは、デジタル・
オーディオ・ディスクに記録するために差分パルス符号変調(DPCM)法でデ
ジタル・ビデオ信号をコード化している。この公知のシステムでは、ビデオ・フ
レームのルミナンス(Y)成分とクロミナンス(R−Y、B−Y)成分とは、別
々にDPCM法で圧縮されている。この両成分は、スクリーン上で互いに隣接す
る特定数の行または列をなす画素データ・グループ
に、或る回路によって分割される。同期信号、画像モード識別信号および画像情
報量識別コードを有するヘッダ信号が供給される。このヘッダ信号は、上記の分
割された画素データ・グループの開始位置に付加されて、デジタル・ルミナンス
、2種類のデジタル色差信号およびヘッダ信号が時間シーケンシャルに多重化お
よび記録される信号フォーマットを有するデジタル・ビデオ出力を生成する。
上記高橋氏その他によるシステムの一実例においては、デジタル・ビデオの静
止フレームが記録され、フレーム当たり約4秒のレートで更新される。この圧縮
されたデータを、各グループが完全なカラー情報を含む線グループに分割すると
、前のフレームを表示している間線グループがシーケンシャル(逐次)更新され
て部分的に動きのある画像を生成する偽似の動き効果を与える。
本出願の親出願である米国出願第07/408085に記載されているシステムは、比
較的狭帯域の媒体を使用して記録または伝送するに適した、全動き(モーション
)のカラー・ビデオ信号を表す圧縮されたデジタル・ビデオ信号を生成する要求
、およびその様な圧縮された信号を復号して全動きビデオ画像を通常のビデオ・
フレーム・レートで表示可能とする要求に、応じることに関するものである。そ
のシステムは、大部分の画像をコード化しまた復号するには有効であるが、たと
えば、大量の(大幅の)速い、かつ/或いは不規則な(アンコーディネイテ
ッド)動き、すなわち画像の比較的大きな部分に亘って実質的に一様に同一方向
に起こるものでない動きのような、或る種の画像に対しては、或る程度面倒なこ
とがあることが判った。その様な画像は、コード化することが難しいことが判っ
た。その理由は、上記のシステムが採用した線形フィル(fill)技法は、可成りの
量の不規則な細部の動きを含んだ画像に対して使用するには余りにも不充分なコ
ード化法であるからであった。その様な画像に対しては、個々のピクセルのそれ
ぞれをコード化することが望ましいが、上記親出願に開示されているシステムは
、各ピクセルのコード化に2分の1ビットを平均することしかできないことが多
い。その様な理由で、細部に可成りの量の動きがある画像のような、選ばれた画
像を有効に圧縮しまたその圧縮復元(デコンプレッションすなわち圧縮状態を元
に戻すこと)を可能とするような機能を上記のシステムに付加することが望まし
い。
発明の要約
この発明は、比較的狭帯域の媒体を使用して記録または伝送するに適当したフ
ル動きカラー・ビデオ信号を表す圧縮されたデジタル・ビデオ信号で、かつ少な
くとも通常のビデオ・フレーム・レートに等しい速度で圧縮復元可能な圧縮され
たデジタル・ビデオ信号を供給するための、圧縮システムに対する要望に応える
ことに関するものである。ここに記述する一実施例では、コンパクト・ディスク
型読み取り専用メモリ(CD−ROM)記録
媒体に、毎秒当たり30フレームで全動きカラー・デジタル・ビデオ記録を行う場
合に、1時間以上の記録時間を達成することができた。
この発明の1つの特徴として、デジタル動きビデオ信号の第1フレームと第2
フレームは、相異なる圧縮法によって圧縮され、各圧縮法を示す識別コードを含
んだ出力信号が形成される。
この発明の別の特徴として、デジタル・ビデオ信号の各フレームは複数の領域
を形成するように分割され、各領域は別々に解析され、数種の圧縮法のうち、コ
ード化される領域の特性に特有の適切なコード形式を与える、選ばれた方法によ
ってコード化される。
この発明のまた別の特徴として、デジタル動きビデオ信号は、フレーム当たり
のバイト数および圧縮された信号のフレーム当たりの復号時間の推測値の関数と
して制御される圧縮閾値を使用して圧縮される。
この発明の更にまた別の特徴として、ビデオ・フレームは、個々にコード化さ
れる複数の領域を形成するように繰返し分割され、その分割の方向すなわち垂直
方向か水平方向かは、それらの領域に関連するピクセル・パラメータの分布状態
を比較することによって決定される。
この発明の更に別の特徴として、デジタル・ビデオ信号の、少なくとも1つの
選択されたフレームでまた選択された画像とも名付けるフレームが、多数の(マ
ルチプル)解像度レベルでコード化される。各解像度レベルに
対して、その解像度レベルの基準画像中の各ピクセルの値を、その解像度レベル
の上記選択された画像中の各対応ピクセルの値から差し引くことによって、補正
画像が形成される。この補正画像は量子化されてコード化される。各解像度レベ
ルに対して、その解像度レベルの量子化された補正画像中の各ピクセルの値を、
同じ解像度レベルを有する基準画像中の各対応ピクセルの値に加算することによ
って、出力画像が形成される。最低解像度レベルの基準画像は、すべて同じ値を
有するピクセルのアレイで構成されている。より高い解像度レベルの基準画像は
、次に低い解像度レベルの出力画像をそのより高い解像度レベルへ拡張すること
によって形成される。デコーダは、各解像度レベルに対して、コード化され量子
化された補正画像を復号する。最低の解像度を有する復号された補正画像中の各
ピクセルの値は、同じ解像度を有する基準画像の各対応するピクセルの値に加算
されて、最低解像度の出力画像を形成する。この出力画像は次に高い解像度レベ
ルに拡張される。この拡張された出力画像中の各ピクセルの値は、同一解像度レ
ベルの復号された補正画像中の各対応するピクセルの値に加算されて、その解像
度レベルの出力画像を形成する。このプロセスは、既にフル解像度まで拡張され
ている拡張出力画像中の各ピクセル値が、フル解像度の復号された補正画像中の
各対応ピクセルの値に加算されて後で表示するためにメモリ中に記憶される最終
画像を形成するまで、続けら
れる。
図面の簡単な説明
この発明の、上記したおよびそれ以外の特徴は添付図面に示されている。各図
を通じて同様な要素には同様な参照符号を付けて示してある。
第1図は、記録媒体としてコンパクト・ディスク型読み取り専用メモリ(CD
−ROM)を使って、全動きビデオ・多チャンネル・デジタル・オーディオおよ
び補助(たとえば、相互作用的な)データの記録と再生を行う、この発明を実施
したデジタル・ビデオ相互作用システムのブロック図である。
第2図は第1図のシステムの記録部に使用されるデジタル・ビデオ・エンコー
ダのブロック図である。
第3図〜第9図は、第2図のエンコーダ中の種々の処理段におけるデジタル・
ビデオ信号フォーマットを示す図である。
第10図〜第12図は、第2図のエンコーダにおける過大寸法とされた(オーバサ
イズド)フレームを処理する2つの方法を示す図である。
第13図は、第2図のエンコーダで使用するためのパディングおよびディザリン
グを与えるフォーマッタのブロック図である。
第14図は、第2図のエンコーダで使用される事前圧縮(プリコンプレッション
)処理器のブロック図である。
第15図は、第14図の処理器の一部の詳細を示すブロッ
ク図である。
第16図は、フレーム内およびフレーム間領域特定(リージョン−スペシフィッ
ク)コード化、領域面積による量子化およびフレーム・セグメント化可変長コー
ド化を与える、第2図のエンコーダで使用されるデジタル・ビデオ圧縮器のブロ
ック図である。
第17図は、静止ビデオ・フレームおよび動きビデオ・シーケンスの第1フレー
ムを圧縮するための第16図の圧縮器に使用されるフレーム内コーダの動作を示す
フローチャートである。
第18図は、第16図の圧縮器で使用される画像エッジ解析を示す領域図である。
第19図は、第16図の圧縮器で使用するための、分割(スプリット)/フィルを
与える粗さエスチメータのブロック図である。
第20図〜第23図は、第16図の圧縮器で使用される双一次的(バイリニヤ)絶対
フィル・コード化を示す領域図である。
第24図は、境界エラーの大きさを示す領域図である。
第25図は、第2図のエンコーダで使用されるオーディオ圧縮器のブロック図で
ある。
第26図は、クワッド・トリー(quad-tree)領域化(リジョナライゼーション)
を示す図である。
第27図は、第16図の圧縮器における画像の2進トリー領域化を示す図である。
第28図と第29図は、第27図の領域化された画像の分割/フィルコード化の図の
実例である。
第30図と第31図は、それぞれ第28図と第29図のコード化図のためのトリー・コ
ードの例である。
第32A図〜第32J図は、最も好ましい領域分割方向を決定するためのエッジ分
布解析を示す領域図である。
第33A図は、コンピュータ装置のための、または領域内の水平および垂直エッ
ジの分布の解析によって第16図の圧縮器で最も好ましい分割方向を決定するため
の、フローチャートである。
第33B図は、第33A図の装置のためのパラメータのテーブル・リストである。
第34A図および第34B図は、第16図の圧縮器における領域分割の2つの形態を
示す図である。
第35A図〜第35E図は、第16図の圧縮器における重み付けされたメジアン・フ
ィルタ作用を示す図である。
第36A図〜第36C図は、第16図のエンコーダで使用するための非線形低域通過
フィルタ作用を示す図である。
第37図は、多項式の適合性比較によって最も好ましい分割方向を見出す手法を
示す図である。
第38図は、第37図の分割方向方法を実行するコンピュータ装置のフローチャー
トである。
第39図は、動きビデオ・シーケンスの第2フレームおよびそれに続く全フレー
ムをコード化するための、第16図の圧縮器に使用されるフレーム間コーダの動作
を示す
フローチャートである。
第40図は、第39図のフレーム間コーダにおける領域変換を示す図である。
第41図および第42図は、それぞれ、第39図のフレーム間コーダにおける最良の
領域サーチ方向の選択を示すベクトル図とフローチャートである。
第43図は、第39図のフレーム間コーダで使用される領域変換および相対的コー
ド化を示す図である。
第44図は、第16図の圧縮器で使用される領域面積依存適応型量子化方法を示す
表である。
第45図は、第44図の面積依存量子化法を行う第16図の装置の動作を示すフロー
チャートである。
第46図は、第16図の圧縮器で使用するためのストリーム・セグメント化可変長
コーダのブロック図である。
第47図は、第16図の圧縮器によって供給されるデータ・ストリームのフォーマ
ットを示す図である。
第48図は、第1図の再生システム8で使用される圧縮されたデジタル・ビデオ
信号のデコーダのブロック図である。
第49図、第50図および第51図は、第48図の絶対、相対的、ダイアド(1対)お
よびDPCMコード化領域のための第48図のデコーダの領域位置メモリに記憶さ
れたデータをリストした表の例である。
第52図は、第48図のデコーダで使用するためのメモリ構成を示すブロック図で
ある。
第53図は、第48図のデコーダによるフレーム間コード化領域の相対的領域復号
作用を示す図である。
第54図は、第53図の相対的復号を行う装置のブロック図である。
第55図は、フレーム内コード化領域の第48図のデコーダにおける絶対領域復号
作用を示す図である。
第56図は、第55図の絶対復号作用を行う装置のブロック図である。
第57図は、第48図のデコーダにおける領域のDPCM復号作用を示す図である
。
第58図は、第57図の領域DPCM復号作用を行う装置のブロック図である。
第59図は、第48図のデコーダにおけるピクセル・データの逆量子化(デカンタ
イジング)のための面積依存適応型量子化値をリストした表である。
第60図は、第48図のデコーダにおける面積依存逆量子化(エリア・デペンデン
ド・デカンタイゼーション)を行う装置のブロック図である。
第61図と第62図は、第48図のデコーダにおけるダイアド復号作用を示す図であ
る。
第63図は、第48図のデコーダで使用するダイアド・デコーダのブロック図であ
る。
第64図は、この発明による選択された画像に対するコード化法のブロック図で
ある。
第65図は、ナル領域および非ナル領域に分割された量
子化された補正画像の例を示す図である。
第66図は、第65図に示された典型的な量子化された補正画像の諸領域を説明す
る領域表を示す図である。
第67図は、この発明による選択された画像に対する復号法のブロック図である
。
詳細な説明
第1図のデジタル・ビデオ相互作用システムは記録システム6と再生システム
8で構成されている。記録システムは、信号源10、12および14を有し、これらの
信号源はそれぞれ多チャンネル音声信号S1、カラー動きビデオ信号S2および
補助データ信号S3を供給するものである。エンコーダ16は、信号S1、S2お
よびS3をコード化し合成して、CD−ROMレコーダ18によってコンパクト・
ディスク型読み取り専用メモリ(CD−ROM)ディスク20に記録されるデジタ
ル記録信号S4(以下、ビットストリームという)を形成する。補助データ信号
S3は、ビデオまたはオーディオ信号に関連した相互作用データ或いはこれらオ
ーディオまたはビデオ・データとは無関係の他の何等かの形式のデジタル・デー
タである。
ビット・ストリームS4の平均データ・レートは、1.2メガビット毎秒の標準
CD−ROM記録/再生ビット・レートと等しくなるように、コード化パラメー
タを選択することによって制御される。このパラメータは、後述するように、最
長1時間のデジタル・コード化され
た全動きカラー・ビデオ・データ、多チャンネル・デジタル・オーディオ・デー
タおよび補助データを、CD−ROMディスク20に記録することができるように
、選択される。CD−ROMディスク・プレーヤの比較的低いチャンネル容量に
適合するようにこの記録信号のデジタル全動きカラー・ビデオ部分をコード化す
るには、非常に大幅なデータの低減が必要である。特定の例においては、このデ
ータ低減は、典型的なビデオ・フレーム・レート30FPS(フレーム/秒)につ
いて約150:1のオーダである。通常のビデオ圧縮技術に付帯する目に見えるよ
うなアーティファクツ(不自然さ)を除きつつこの厳しい要求に応えるために、
エンコーダ16は、ビデオ信号S2をカラー・フレームのシーケンシャル成分形態
に変換してその各成分の各フレームが別々に後述するように或る数の特に適した
プロセスを受けるようにする。概略を列挙すれば、それらのプロセスは、可変サ
ブ・サンプリング、ここで領域特定コード化という方法を採用する可変フレーム
間およびフレーム内圧縮、面積依存適応型量子化、セグメント化可変長コード化
、逆フレーム・シーケンス・リフォーマット、パディングおよびフレーム・ディ
ザリング等を含んでいる。
個々のプロセスの選択、各々によって与えられるデータ低減の分担の選択、お
よび可変圧縮パラメータ(たとえば、閾値、動作モードおよび特に圧縮を止める
時)の選択は、CD−ROMデジタル・オーディオ・テープ
(DAT)またはその他の帯域幅の制限された媒体に記録するために全働きカラ
ー・ビデオをコード化するという目的に合致するような、厳しい選択を表してい
る。その様な選択は、CD−ROM媒体のチャンネル容量だけでなくそれ以上の
ものに依存して決まる。それらは、また、ビデオ・フレーム・レート、所望の空
間的解像度、ビデオ画像内容の或る特定の特性などの変数に依存し、また最終的
に画像を再構築するために使用するデコーダのパラメータに依存している。後述
するように、各個々のビデオ・フレームは成分形態に変換され、各成分は分割さ
れ、多数の、画素(ピクセル)の領域またはピクセルのブロックを形成するよう
にされる。各領域は次に個々にカスタム・コード化される。このプロセスを、以
下「領域特定コード化」と名付ける。各領域に対するこのコード化は、再生シス
テム8中のビデオ・デコーダが、このデコーダに課せられた復号作業をリアル・
タイムで、すなわち1ビデオ・フレーム期間内(可変)で全て完了するという厳
しい要求に合致できるように、グループをなすコードの中から選択される。
記録システム6の、上述のおよび他の特徴は、第2図〜第47図、第61図、第62
図、第64図〜第66図に関連して詳細に説明する。再生システム8の詳細は第48図
〜第63図および第67図について後述する。
第2図において、エンコーダ16は、信号源10からのオーディオ信号S1、信号
源12からのビデオ信号S2、お
よび信号源14からの補助データ信号S3を、それぞれ受け入れる、入力端子202
、204および206を持っている。オーディオ処理の概要を説明すると、信号S1は
、チャンネルの選択およびアナログ・デジタル(A/D)変換を受け、フレーム
からフレームへとエラーが伝わらないような対策を講じて圧縮され、ビットスト
リームS4の各ビデオ・フレーム中に含まれてオーディオ/ビデオの同期が得ら
れるようにオーディオ・データのブロックとして、後で回復できるように記憶さ
れる。
詳しく説明すると、オーディオ信号S1は、チャンネル選択器とデジタル・ア
ナログ(D/A)変換器ユニット208に供給される。ユニット208は、コード化す
べきヂャンネル数とチャンネル・サンプリング・レートを選択するための操作員
用の制御器(図示されていない)を持っている。モノラル音声の記録には1チャ
ンネルを、ステレオの場合は2つのチャンネルを、ステレオ/バイリンガルの場
合は4つのチャンネルを等という具合に選択する。現在高品質のオーディオ記録
に使用されているザンプリング・レートは31.25KHzで、これは15KHzのオーディ
オ帯域幅を保証している。このレートは、標準品質用にはその2分の1に、また
肉声級のオーディオ用にはその4分の1に、することができる。
デジタル化されたオーディオ信号S5は、適応型差分バルス・コード変調(A
DPCM)エンコーダ210によって記録のために低減される。このエンコーダ210
は、
信号S5のサンプル相互間の差をコード化して圧縮されたデジタル・オーディオ
信号S6を形成する。相連続するオーディオ・サンプルは屡々高度の相関性を持
っているので、このサンプル間の差をコード化するにはより少数のビットしか必
要としない。ここで「適応型」という語は、このエンコーダが、広いダイナミッ
ク域に亘って微細な分解能を与えるように、コード化された差のビットの重要度
(シグニフィカンス)を先にコード化された差の関数として変化させる形式のも
のであることを意味するものとする。
エンコーダ210は、在来型の設計のものでよいけれども、全体的なオーディオ
/ビデオのコード化の目的から、オーディオ・サンプルを充分な解像度で周期的
にコード化するように、周期的なベースでバイパスするかリセットする手段が講
じられていることが、非常に望ましい。たとえば、エンコーダ210(第25図)は2
56バイトごとに1回ずつリセットされる。このオーディオ信号は、ビット・スト
リームS4中に、ビデオ・データの各ブロックに対し、オーディオ・データのブ
ロックが1個含まれるように、最終的にブロック形態に編成されることを想起さ
れたい。このオーディオ・データのブロックの形成(フォーメーション)と信号
S6を記憶するバッファ記憶器212を介して維持される。後で、このオーディオ
およびビデオ・データを、次に説明するように、合成するとき、フォーマッタ25
0がこの記憶されている信号(S
7)をフレームごとのベースで周期的に回復する。現在使用されている典型的な
オーディオ・ブロックの大きさ(サイズ)は、30FPSのビデオ・フレーム・レ
ートおよび肉声級のオーディオに対して、130および134バイトである。このオー
ディオ・ブロックの大きさは、サンプリング・レート、記録すべきオーディオ・
チャンネルの数、およびフォーマッタ250内のオーディオ・ディザリングに依存
する。
DPCMエンコーダ210を周期的にリセットまたはバイパスする1つの理由は
、CD−ROM伝送システム中で発生する可能性のあるオーディオ・エラーが1
つのフレームから次のフレームへと伝播することを防止するためである。
この特徴は、また、編集点としてどのフレームでも選出できるように、後で行
うシーケンスの編集をし易くする。この特徴は、第25図に示されたように、圧縮
されたオーディオ信号S6のバイト・カウント(バイト・カウンタ216で生成さ
れた)がバイト・リミット信号源218によってセットされたバイト・リミットを
超えたとき、オーディオDPCMエンコーダ211のリセット入力Rにリセット信
号を供給する比較器214によって実現することができる。
ビデオコード化の概略
第2図においてビデオコード化を行う主たる要素は、事前圧縮処理器220、デ
ジタル・ビデオ圧縮器230およ
び出力信号フォーマッタ250で、これらは第3図〜第47図と第64図〜第66図を参
照して、詳細に説明されている。概略を説明すれば、処理器220はビデオ信号S
2を非標準フォーマットに変換する。この変換された非標準フォーマットは、可
変量のデータ低減を与え、その後の圧縮を容易化し、空間的−時間的解像度を制
御する可変フレーム・レート処理に関するシステムの或る種の特徴に寄与するも
のである。幾つかの画像は、後で完全に異なったレートで表示するために1つの
フレーム・レートで変換される。
圧縮器230は、大まかに言えば、フレームを特定の「最適」値にコード化する
ためにデジタル・データの量を減少させるための、4つの処理形式を採用してい
る。上記の値は、CD−ROMチャンネル容量に関連しているが、フレーム・レ
ート、所要の空間的−時間的解像度、およびその他エラー伝播および視覚的条件
などを含む数個の変数の関数として変化するものである。上記の処理形式は、静
止フレームに対する、および動きビデオ・シーケンスの最初のフレームと選択さ
れたフレームに対する、フレーム内領域特定コード化を含んでいる。フレーム間
領域特定コード化は、動きビデオ・シーケンスの第2および後続フレームに対し
て使用される。コード化されたフレームは、更に圧縮器230内において、この明
細書中で面積依存適応型量子化およびセグメント化ストリーム可変長コード化と
、それぞれ名付けた2つのプロセ
スによって、またデータの低減が行われる。これらのプロセスは、上記した所要
の最的値に達するまで、各ビデオ・フレームに対して施される。フレームの或る
シーケンスは、最適の圧縮値に達するように、圧縮閾値を変えて、繰返し圧縮さ
れることもある。
ときどき、余りにも大き過ぎて、明らかに目立つ程のアーティファクツを導入
することなしに圧縮パラメータを変えることにより所望バイト・カウントまで低
減させ得ない「不可能な」フレームに出会うこともある。その様に過大なフレー
ムは、オーディオ、ビデオ、補助(たとえば、相互作用的)および他のデータを
合成して記録用ビット・ストリーム信号S4を作り出すフォーマッタ250内で、
特別の処理を受ける。具体的には、フォーマッタ250は最後のフレームから最初
のフレームへと逆向きにフレームを分析して、短いフレームからスペースを借り
、過大なフレームの余分なデータを保持する。フォーマッタ250が与える他の機
能には、パディング・データを過小フレームに加算し、フレーム当たりのデータ
のバイト数をディザリングして、CD−ROMシステムをその最大チャンネル容
量で動作するように維持し、また再生期間中のポーズ(休止)が無いようにする
。CD−ROMプレーヤの回復時間(探索モードの潜在性)を長くかつ予測でき
ないようにし得るので、ポーズを避けることができる。
ときどき、表示されるビデオの品質を向上させるため
に、特別の処理をするため画像を選択することが望ましいことがある。その様な
画像の一例は、相当な量の、速い、かつ/または不規則な動きすなわち画像の比
較的大きな部分に亘って実質的に一様に同一方向に発生しないような動き、を含
む画像である。以下、被選択画像と名付けるこの画像は、以下説明するように多
数の解像度レベルでコード化される。画像は、たとえば復号されたデジタル動き
ビデオ信号の視感的品質といった様な、質的な基準をベースにして選択される。
画像は、また、たとえば平均2乗差MSDがいつ所定の閾値を超えるか、という
様な、量的な基準をベースとして選択することもできる。この発明に従って特別
の処理を受けるための画像の選択に使用でき上記以外の量的基準には、それに限
られる訳ではないが、差画像(ディファレンス・イメージ)のピーク値がいつ所
定の閾値を超えるか、または差画像の平均絶対値がいつ所定閾値を超えるか、が
含まれる。
ビデオ処理の詳細は、「ビデオの事前圧縮処理」、「ビデオの圧縮処理」、「
事後圧縮処理」、「再生システム」および「ビデオの復号」、と見出しを付けた
以下の5項において説明する。
ビデオの事前圧縮処理
事前の圧縮処理器220は、入力端子204(第2図において)に結合されていて、
標準ビデオ信号S2を、引き続きエンコーダ16で採用される特定形式の圧縮およ
びフォーマッティング関数に特に適合した非標準形に変換す
る。具体的には、ビデオS2の各フレームは、この事前圧縮処理器220において
変換されて、1つのルミナンス・サブフレームと1対のカラー差信号サブフレー
ムとより成る3個の別々の成分フレームを形成する形になる。この各カラー差サ
ブフレームは、原ビデオ・フレームについてサブサンプルされ或いはされていな
いルミナンス・サブフレームに対して、或る所定量だけサブサンプルされる。こ
の原ビデオ信号は、アナログまたはデジタルでも良く、また成分形式、合成形式
またはその他の適当な形式たとえば多重化アナログ成分(MAC)形式のもので
良い。
第3図、第4図および第5図は、信号S2を、第3図にその1フレームを示し
たNTSC標準合成ビデオ信号であるとした場合の、ビデオ信号S2の1フレー
ムの事前圧縮処理を示している。第4図は、事前圧縮処理の中間段階を示し、こ
の段階では、合成信号は同期およびブランキングの両期間を除き、かつ各RGB
フィールドの有効ビデオ部分を表すRGB画素(ピクセル)アレイを形成するよ
うにデジタル化された、RGB成分形式に復号されている。この図示されたアレ
イのディメンジョンは、各RGB成分について、水平512ピクセル×垂直240ピク
セルである。
第5図は、事前圧縮処理の最終段階を示し、この段階では、第4図のデジタル
RGBアレイが既に変換されて、大きさが256×240ピクセルの単一のルミナンス
信号サ
ブフレーム(Y)と、各々大きさが64×60ピクセルである2つの色差信号サブフ
レーム(IおよびQ)を形成している。この3つのサブフレームは、後続する個
別化された「カスタム」圧縮のためにメモリ(後述する)に記憶される。第3図
、第4図および第5図を比較すれば、デジタルRGBの形式で737280バイトを必
要とする信号S2の1フレーム(第3図)が、サブ・サンプリング、変換および
フォーマッティングの後では69120バイトに低減され、すなわち、30FPSの所
定レートに対して約11:1の率でフレームに対する有効なデータ低減がなされた
ことが判る。
フレーム・レートの関数として第5図のサブフレームの大きさを変えてコード
化されたフレームの時間的空間的な解像度を変え得るように、第2図では操作員
用の制御ユニット220が設けられている。システムのこの特徴は、次の様にして
行われる信号の次の圧縮に関係している。このCD−R0M記録システムは、前
述のように約1.2メガビット毎秒のビット・レートを保つことができる。30FP
S(毎秒当たりのフレーム)のビデオの場合、このチャンネル容量は、フレーム
当たり5125.12バイトのビデオ・バイト・カウント(8−ビット/バイト)に相
当する。この5125.12バイト毎フレームのうち、典型的にはフレーム当たり約450
0バイトがビデオ用に利用され、残りはオーディオおよび他のデータ用に使用さ
れる。ビデオ圧縮器(後述する)は、所定レートが30FPSの
場合、フォーマットされたYIQサブフレームを上記とは別の約15:1の率で69
120から4500バイト毎フレームに圧縮することによって、この要求に応じる。再
生フレーム・レートを2分の1にすると、各フレームについて復号に2倍の時間
(15分の1秒)を利用でき、各フレームのコード化に9000バイトを利用すること
ができる。この復号時間と画像データ量の増加は、種々の方法で画質の改善に使
用することができる。たとえば、コード化された画像中のピクセル数を増加させ
ること、或いはより高いフレーム・レート(30FPS)におけると同数のピクセ
ルをより正確にコード化すること、ができる。
第14図は、前述した可変サブ・サンプリングおよびフォーマット変換機能を行
う、事前圧縮処理器220の特定の構成を示す処理器220は、合成ビデオ信号をRG
B成分の形に変換するRGBデコーダ1402を具えている。RGB成分は、アンチ
・エイリアシング(2MHz)低域通過フィルタ(LPF:1404、1406、1408)を
介して、プログラム可能なグラフィクス・ワークステーション1410の入力に印加
される。ワークステーションとして適当なものはアデージ(Adage)3000カラー・
ラスタ・ディスプレイ・システムである。第2図における、操作員の制御ユニッ
ト222は、フィールド、線およびピクセルの「スキップ・リスト」を、アンチ・
エイリアス・フィルタ係数およびサンプル・レート制御データと共に、ワークス
テーション1410に供給する端子ユニット222'(第14図に
おいて)を持っている。このワークステーションによって、Y、IおよびQサン
プルのデータ低減されたサブフレームが生成され、ディスク記憶器1412中に記憶
される。
第15図は、第5図の非標準サブ・フレーム信号フォーマットを作り出すためビ
デオ信号S2を処理する場合に使用されるワークステーション1410の特別にプロ
グラムされた構成を示すブロック図である。フィルタ1404〜1408で生成されるア
ンチ・エイリアス濾波処理されたアナログRGB信号が各アナログ・デジタル変
換器1502〜1506に供給される。これらの変換器は、このワークステーションのタ
イミングおよび制御ユニット1530に結合された端子222'によって制御される、有
効線期間当たり512ピクセルを供給するように選択されたレートで、上記の信号
をデジタル化する。デジタル化されたRGB信号(第4図)は2バンクのスイッ
チ1510と1514によって、サブ・サンプルされる。スイッチ1510は、RGB信号の
1つおきのフィールドをスキップするようにユニット1530によってタイミングを
とられる。スイッチ1514は、1つおきのピクセルをスキップして、得られるデジ
タル化されたサブ・サンプルされたRGB信号がそれぞれ、フレーム当たり256
×240ピクセルのアレイより成るようにされる。
マトリックス1516はサブ・サンプルされたRGB信号をYIQ形式に変換する
。このIおよびQ色信号は、ルミナンス信号Yに対して、垂直および水平の両方
につい
て、それぞれ4:1でサブ・サンプルされる。これは、水平アンチ・エイリアス
低域通過フィルタ1518(500KHz)、垂直アンチ・エイリアシング低域通過フィル
タ1520(画像高さ当たり線60本)、線4本中の3本をスキップするスイッチ1522
、および4ピクセル中の3ピクセルをスキップするスイッチ1524によって、行わ
れる。このフォーマット化されたY、IおよびQサブフレーム信号(第5図)は
、次に、ディスク記憶器(たとえば、ハードディスク・ドライブ)1412中の各サ
ブフレーム位置に記憶されて、後で行われる回復および圧縮にそなえる。
前述した様に、濾波およびサブ・サンプリングのパラメータはフレーム・レー
トによって決まる可変のものである。第14図および第15図の特定例の場合はこの
フレーム・レートは30FPSであるものとしている。異なったフレーム・レート
の場合には、操作員は、ユニット1530のタイミングをとりかつ制御するために、
端子222'を通じて、適切なアンチ・エイリス・フィルタ係数、スキップ・リスト
、および変換周波数を、入力する。しかし如何なるフレーム・レートまたは解像
度であっても、原信号は如何なる形式(アナログまたはデジタル、成分、合成ま
たはMACなど)であれ、ルミナンス成分Yと、このルミナンス成分に対して垂
直水平の両方向についてサブ・サンプルされ濾波された1対の色差成分より成る
形式になるように、第5図に示されるように変換されることが重要である。色差
成分IとQは、ここでは一例とし
て使用されている。代わりに、このカラー成分は、R−YおよびB−Y、または
UとVという様な別の形式であってもよい。
この発明の好ましい実施例で、更に選択した画像の多数解像度コード化法を採
用した形では、第14図の事前圧縮処理器220は、RGBデコーダ1408の代わりに
YUV線順次出力をYUV線並列出力にするMACデコーダを入れ、第15図のR
GB/YIQマトリックスを除き、かつ第5図のルミナンスおよび色差成分の各
(別々の)サブフレームを作るに要するサブ・サンプリングのパラメータを変え
ることによって、MAC形式のビデオ入力信号を処理するように変形される。こ
れ以外の変形も可能であることは理解できよう。たとえば、この信号源は、濾波
処理をする前にYIQまたはYUV成分に復号することもできる。RGBかYI
Qの何れかをサンプリングすることもできる。
ビデオ圧縮処理
事前圧縮処理の後で、このY、IおよびQビデオ・サブフレームは、個別に圧
縮するために、ディスク記憶器1412から、1時に1つずつ回復される。このサブ
フレームの順次回復処理は第2図に、サブフレーム選択器スイソチ224によって
、記号的に示されている。図示された位置では、スイッチ224は、動きビデオ・
シーケンスのすべてのYサブフレームを圧縮器230に供給し、同圧縮器230は完全
なサブフレームを圧縮してバッファ記憶器
232中に記憶させる。スイッチ224は、次いで進められて、シーケンスのすべての
Iサブフレームについて上記の圧縮プロセスが繰返される。最後に、シーケンス
のすべてのQサブフレームに圧縮が施されて、カラー・フレームのシーケンスの
圧縮の最初の段階が完結する。或いはまた、シーケンスの1つの完全なフレーム
のY、IおよびQサブフレームを選択して、シーケンスの次のフレームへ進む前
に圧縮するように、スイッチを進めることもできる。
圧縮された信号S9は、第7図に示されたように、それぞれサブフレーム(Y
、IまたはQ)に対する圧縮データが後続しているビットストリーム・ヘッダ(
H)より成る、3つの個別(インデビジュアル)に圧縮されたサブフレームを含
んでいる。このヘッダは、データがどのサブフレームに対応するか、サブフレー
ムの大きさ(水平方向および垂直方向のピクセルの数)、診断目的のための検査
合計、およびデコーダが使用する種々の表、を表している。更に、信号S9の形
式(フォーマット)の詳細については第46図と第47図を参照して後で説明する。
第7図の圧縮されたデータは、以後、ビデオ・データ「ストリーム」と呼ぶ。
YIQサブフレームを個別に圧縮して圧縮デジタル・ビデオ「ストリーム」S
9を形成する圧縮器230の特徴は、圧縮効率を大幅に向上させる。1つの理由は
、各サブフレームは同一画像を表しているが、それぞれ画像の
相異なるカラー特性量を表しているので、それらは互いに歴然と違うことがある
。たとえば、或る画像は肌色を含んでいなことがある。他の画像は青−緑色を含
んでいないこともある。その他の画像は色を全く含まないことがある。個別サブ
フレーム圧縮についての別の理由はその画像を表すコードの統計的分布に関係し
ている。1つの圧縮段階として可変長コードが採用される。可変長コード化され
るデータの周波数分布または統計に従って選択される。Y、IおよびQのコード
化されたサブフレームの統計は異なっているから、各サブフレームに適当した個
別の可変長コードが採用される。実際に、各サブフレームに対しては後述するよ
うに多数の別々の統計的コードがある。
圧縮過程の後、圧縮されたビデオ・ストリーム(S10)は、バッファ記憶器23
2から回復されて、バイト・カウント・モニタ234に、および復号時間モニタ236
に印加される。これらは、ビデオ・シーケンスの各個別フレームについて、デー
タ・バイトの数と復号時間を確認する。各フレームにはオーディオおよび補助デ
ータが加えられるであろうから、平均バイト・カウントは、ビット・ストリーム
S4において毎フレーム当たり許容されるバイトの総数よりも少ないことになる
。CD−ROMから30FPSで再生するためにビデオ信号をコード化する場合、
フレーム当たり利用可能な平均バイト数は5125.12である。この数は、CD−R
OMのチャンネル容量をビデオ
・フレーム・レートで割算して決定される。モニタ234は、ビデオ・フレームの
シーケンスを通じて累算された平均バイト・カウントを生成する(或いはまた、
モニタ234はフレーム・バイ・フレームのベースでバイトをカウントするように
構成することもできる)。このカウントは、圧縮閾値制御ユニット238の圧縮閾
値をセットして信号S10の平均バイト・カウントをフレーム当たり4500バイトに
維持するのに使用される。これによって、後で加えられるオーディオおよび他の
データに対する、フレーム中の余裕ができる。破線は、この閉ループ動作を表し
ており、これはエンコーダ16のこの構成では手動で行われている。
既に説明したように、4500バイトに低減できない過大なビデオ・フレームは、
より早期のフレームからスペースを借りることによって、リフォーマッティング
期間中に処理される。このメカニズムについては、ビデオ事後圧縮の項で、後述
する。復号時間モニタ236は、圧縮されたデジタル・ビデオ信号S10の各サブ・
フレームの圧縮復元(デコンプレス)するに要する時間を測定する。この測定は
、信号S10を、再生システム8の処理器30のようなデコーダに供給してその処理
器の復号時間を測定することによって、行われる。一例として再生レートが30F
PSの場合、1フレームの復号時間は30分の1秒を超えてはならない。このモニ
タが、それよりも大きな復号時間を検知したときは、閾値制御器238の閾値を調
整
してこの過大フレームの復号時間を減少させるようにする。
或いはまた別のやり方として、この復号時間の連続的な平均値を単に30分の1
秒よりも短く維持するように、閾値制御器238を調節することもできる。その様
な方法によれば、もし許容復号時間を超えたとしても、圧縮を繰返す必要はない
。換言すれば、個々のフレームが許容されるものでない場合でも、その平均はな
お容認できる。後述するように、この再生システムは、「短い」フレーム(すな
わち復号に30分の1秒以下しか要しないフレーム)から復号時間を借りるという
技法を使用することによって、再生レートに何の影響も与えること無しに、上記
の様な復号時間の一時的な超過に対処することができる。この過大なフレームの
コード化の上記別のやり方は、平均復号時間が30分の1秒未満で再生システムに
充分なバッファ記憶(ストレージ)がある場合に応用する。この再生システムが
必要とするバッファ記憶の量は、フォーマッタ250内でモニタされていて、もし
それが超過されると、更に復号時間を短くするように閾値制御器が調整される。
復号時間モニタを使用するこの代替法は、長い復号時間を要するフレームの更に
正確なコード化が可能となるためで好ましい方法である。
この復号時間モニタは、ビデオ処理器30の既知の復号時間をベースとしてエス
チメータで構成することもできる。復号プロセスを注意深く調べると、それは、
それぞ
れが完了までに最大の時間長を必要とする或る決まった数のきちんと定められた
演算(オペレーション、“A”、“B”等)から成るものであることが判る。エ
ンコーダには、正確なビット・ストリームが与えられ、このビット・ストリーム
はデコーダで処理されることになる。従って、エンコーダは、各サブフレームに
ついて正確に何回上記の演算を行うべきかを決定することができる。復号時間の
垂直値Tは、次の積の単純な総和である。
この加算において、各項“Ai”は特定の復号作用が行われる総回数を表し、
項“Ki”はその動作(アクション)の最大復号時間を表している。その様な動
作の例としては、相対的復号、絶対復号、DPCM、ダイアド復号、およびクア
ッド復号などがある。更に、各復号動作は、復号される領域内のどこにピクセル
があるかによって決まる数個の動作で構成されている。その様なエスチメータを
使用しやすくするために、デジタル・ビデオ圧縮器230は、各サブフレームに付
属するAiカウントをバッファ記憶器232に記憶する。それらは、モニタ234およ
び236から記憶器232への接続(図示省略)によって取り戻される。復号時間を推
測するために式(1)を使用する一例として、合計される積は、(1)各フィル・デー
タを各第1の定数倍した形で表された領域の数であり、(2)各形式の領域内に含
まれているピクセル数を各第2の定数倍したピクセル数であり、かつ(3)各形式
の領域内に
含まれているピクセル行の数の第3の定数倍の行数である。復号されるすべての
領域に共通のステップを表すために積の総和に或る定数項を加えることもできる
。
第16図は、デジタル・ビデオ圧縮器230の簡略ブロック図であって、この圧縮
器230は、スイッチ224からYIQの選択されたサブフレーム信号S8を受け入れ
る入力端子1602と制御器238から閾値制御信号S11を受け取る別の入力端子1604
とを持っている。この第16図には、第2図のモード・スイッチ240がスイッチ240
'として記号表示されている。このモード・スイッチ240'は、図示の位置(上昇
)では、ビデオ・サブフレーム信号S8をフレーム内領域特定コーダ1610し供給
し、同コーダ1610は領域特定コード化信号S12を発生する。この信号S12はモー
ド・スイッチ240'を介して面積依存適応型量子化器1630に供給される。量子化さ
れた領域コード化信号S14は、バッファ232(第2図)に記憶するための圧縮さ
れた信号S9を生成する最終圧縮ステップとして、ストリーム・セグメント化可
変長コーダ1640に供給される。スイッチ240'の位置を逆にすると、ビデオ入力信
号S8が、フレーム間領域特定コーダ1620に供給され、量子化のために領域間コ
ード化信号S13が選択される。これら両エンコーダ1610および1620は閾値制御信
号S11を受け取るように結合されている。
動作について説明すると、静止フレームおよび動きビデオ・シーケンスの第1
フレームと選択されたフレーム
を、フレーム内コーダ1610を使ってコード化するために、モード・スイッチ240'
は上昇(UP)位置にセットする。概略を説明すると、コーダ1610は、そのフレ
ームを、或る数の以下「領域」という同様なピクセルの小グループに分割する。
この各領域に対して、その領域のすべてのピクセルの値を表すコードが生成され
る。この技法によって非常に大幅なデータ低減(圧縮)ができる。その理由は、
どこに領域があるか、それはどの位の大きさか、およびその領域のピクセルを表
すのにどの様な“フィル”値が使用されるか等を特定するために、極く少数のコ
ードのバイトしか必要としないからである。更に、各領域について使用される特
定のコード化法は、各領域の細部の特性に基づいて適切に選ばれる。個々の画像
に対して直接でなく実際に画像内の個々の領域についてのコード化法を調整する
この技法(ここでは、領域特定コード化)は、可能な圧縮の量を大幅に増加させ
る。(1)領域の見付け方、(2)領域のコード化または“フィル”する方法、(3)“
良”フィル値と“不良”フィル値の見分け方、および(4)“不良”フィルをどう
すべきか、に関する詳細は、第17図〜第38図、第65図および第66図を参照して説
明する。
動きビデオ・シーケンスの2番目のフレームおよび後続する非選択フレームを
、フレーム間コーダ1620を使ってコード化する場合は、スイッチ240'をその下降
位置におく。この異なったコード化モードは、一旦第1フレー
ムがコーダ1610によってコード化されると、第2および以降のフレームはフレー
ム相互間(フレーム・ツウ・フレーム)の領域の差を使用する相対的ベースでコ
ード化できるので、使用されるのである。この領域の差の相対的コード化の1つ
の利点は、より小さな数が生成され、より小さな数は、小さな数には短いコード
が割り当てられる可変長コード化法によって、少ないビットを使って表すことが
できるからである。(1)前のフレームおける対応する領域を探す最良の方向をど
うして見付けるか、(2)もし見付けたらその領域をどの様にコード化するか、(3)
もし対応する領域が存在しなかったらどうすべきか、等に関する詳細は、第39図
〜第43図、および第61図、第62図を参照して説明する。
領域特定コード化信号S12とS13は、この明細書中で「面積依存」適応型量子
化という処理を量子化器1630で受ける。量子化器1630は更にデータの低減を行う
。フレームはピクセルの1領域にコード化されることを想起されたい。各領域の
大きさは画像全体の細部によって変わる。たとえば、高度の細部を持つ面積には
、それぞれ少数ピクセルの小領域が多数依存することになる。逆に、細部の少な
い面積にはより少数の領域があることになる。しかし、それらの領域はそれぞれ
数十また更に数百個のピクセルを含んでいる。量子化器1630は、小さな領域は大
きな領域よりも一層粗く量子化される(従って、必要とするビット数は少ない)
という様に領域面積(すなわ
ち、その領域中のピクセルの数)の関数として領域データを可変量子化すること
によって、データの低減を行っでいる。このプロセス、およびこの量子化を実質
的に目に見えないものとする心理的視覚効果については、第44図と第45図に関連
して後述する。
この量子化された領域特定コード化信号S14は可変長コーダ1640中で、更に付
加データ低減(圧縮)作用を受ける。簡単に言えば、画像を記述するデータはど
ちらかと言えば複雑である。それは、領域はどの様に分割されフィルされたか、
領域はどの様にシフトされたか、を記述するデータ、双一次多項係数の形でフィ
ル値を記述するパラメータ、およびDPCM、ダイアドおよびクワッドコード化
された形式の別のデータを含んでいる。重要なことは、各ビデオ・ストリームは
多くの形式のデータを含んでいるということである。それら相異なる形式のデー
タは、各ビデオ・ストリームの個別の「セグメント」を作るようにフォーマット
される。コーダ1640は、ビデオ・ストリームの各個々のセグメントについてデー
タの統計的発生を調べて、各セグメント内で最も頻繁に発生するデータに対して
最も短いコードを割当てる。これは、ストリームを構成しているY、IおよびQ
のサブフレームの各々に対して別々に行われる。好ましい応用においては、相異
なる形式の領域特定コードは、いわばゼロに向けてバイアスされて、小さな数は
大きな数よりも発生頻度が高く、従ってコーダ1640によって短い可変
長コードが割当てられる。前述の「ストリーム・セグメント化された」可変長コ
ード化については、第46図と第47図を参照して説明する。
第16図の圧縮器230は、第17図〜第47図に関連して説明されているように、デ
ジタル・コンピュータをプログラムすることによって構成されたものである。こ
のコンピュータとしては、デジタル・エクイプメント社(Digital Equipment Co
rp.)製の型式VAX 11/785を選択して使用した。典型的な動きビデオ・シー
ケンスに対して、フレーム当たり数分間の圧縮速度を得ることができた。圧縮器
230の主たる目的は、速度ではなく、むしろ最終的に表示される画像の高品質に
ある。この目的は、その大部分がここで「領域特定」コード化と名付けた、後述
するコード化法を使用することによって達成される。
領域特定コード化は、次の2つの動作(アクション)、すなわち、(1)画像を
数個の領域に分割する(領域化する)、および(2)各領域に対する「最適の」フ
ィル・パラメータを選択する、より成るものである。これら2つの動作は、第17
図について説明されるように、同時的に行われる。
第27図〜第31図は、2進トリー分解と呼ばれる領域化プロセスの概略を示して
いる。この簡単化した例において、領域2702は4個のサブ領域(2704、2706、27
08、2710)から成り、その中のピクセルは一様なグレー・レ
ベルを持っているものとする。(たとえば、とり得る256個のグレー・レベルの
範囲から141、112、90および98のレベル)。このサブフレームのピクセル値の分
布は典型的なものではなく、2進トリー領域化をどの様に応用するか、および分
解の結果をどの様に効率的にコード化できるか、を例示するためだけのものであ
る。より一般的なケースでは、「フィル」(すなわち領域のピクセル値を表すコ
ード)は、一次式Ax+By+Cで示される。ここに、係数Aは(X)方向にお
ける勾配または明るさの傾度を表し、Bは垂直(Y)方向の傾度を表わし、また
Cは領域全体の明るさの一定または均一なレベルを表している。第27図の例では
、フィル多項式でAx+By+Cの項AおよびBは共にゼロである。
2進トリー分解は、領域を2つに分割し、次に形成されたサブ領域を効率的に
コード化できるまで、上記の2分割によって生じた各サブ領域を2つに分割し続
ける。第17図についての後の説明で、いつサブ領域を分割すべきか、水平か垂直
かどの方向に分割すべきか、を決定するための多数の方法を述べる。第27図の場
合はその決定は容易である。第27図で分割1と付記した最初の分割は、その領域
を2つの相等しい半部に水平方向に分割する。上側の半部2704は単一の値141で
効率的にコード化できるが、下側の半部は更に分解することが必要である。更に
垂直方向の分割である分割2において、上記の残った面積を2分する。右側半部
(2706)は値112によって効
率的にコード化できるので、それ以上分割することはない。しかし左側半部は更
に水平方向に2つのサブ領域2708と2710に分割することが必要で、それらは値90
と98によって効率的にコード化される。
上記以外の領域化法も可能である。たとえば、クワッド・トリー分解法では、
1つの分解方向を採る代わりに、互いに両方の分割方向を使用する。この方法に
よると第26図に示すような領域化が行われ、すなわち領域2602は4個の領域2604
〜2608を形成するように細分割され、その中の1つ(2608)は更に4個の領域を
形成するように細分される。2進トリー領域化法は好ましいモードである。その
理由は、通常、領域数がより少なく従ってビット数が少ないと共に復号時間が短
くなることが、判ったからである。
第28図と第30図とは、第27図の例における、絶対フィル値のコード化と領域位
置を示している。ここで使用する用語「絶対」は、コード化されつつある領域の
領域データからのみ得られるフィル値を意味する。ここで使用する用語「相対的
」はフレーム相互間(フレーム・ツウ・フレーム)の領域の差に基づく領域のフ
ィル値を意味する。第28図のコード化図の逆トリー状構造は、領域2702の順次の
分割を表しており、各ブランチが2つのブランチを形成するように分割されるこ
とから、2進トリーと呼ばれる。このトリーの頂点(一番上の)ノード(結節)
は画像全体を表している。1つの領域が分割さ
れる度ごとに新しい2つのノード値が形成される。トリーのターミナル・ノード
は領域フィル値でコード化されでいる。
完全なトリーを記述するコード(第30図)は、従って、2つの形式のデータ、
すなわち、フィル値である「値(バリュウ)」と、分割またはフィル命令である
「動作(アクション)」である。この「動作」と「値」は同じコード「空間」を
使ってコード化される。すなわち、それらはそれぞれ可変長コード化された、負
でない(非負)数である。しかし、動作と値との間をその前後関係(コンテキス
ト)すなわちコード・シーケンス中におけるその動作または値の位置、に基づい
て区別することは、常に可能である。たとえば、第28図の例では、「フィル」動
作が出て来ると、次の数は値になる筈である。この値の後の次の項目は別の動作
でなければならない、という具合になる。
より詳細に言えば、トリー記述データは次のルールに従って配列される。分割
される各ノードに関して、頂点ノード(水平分割の場合)に属する、または左側
ノード(垂直分割の場合)に関与する、すべてのデータがリストされ、それに他
のノードに関するすべてのデータが後続する。この形は、固有の反復性の手順(
プロシジャ)であって、トリーのルート(根)ノードから始まって、トリーのす
べてのターミナル・ノードに到達するまでトリー中のノードに関して順次行われ
る。第28図に例示し
た一例トリーの場合には、この手順によって第30図に示すトリー・コードが得ら
れる。この短いコードは、原画像の寸法と共に、すべての領域の大きさ(サイズ
)と位置および画像2702中のすべてのピクセルの値を特定するのに必要なすべて
の情報を与えるものである。HおよびVの記号は水平および垂直の分割を意味し
ている。記号Fはフィル動作を表している。
第29図は、第27図の領域に対する2進トリー・データをコード化する別の、か
つ好ましいフォーマットを示しでいる。このフォーマットは、フィル・データが
、終端ノードの実際の値としてではなくノード差としてコード化されるという点
で、第28図の方法とは異なっている。この方法は、実際のフィルを回復するため
にデコーダ中で計算を行う必要があるが、コード化された値が数値として小さい
という利点を持っている。たとえば、第30図の値141、90、98、112を、第31図の
値−7、−37、18、8と比較対照すればよく判る。この値は可変長コードを用い
てコード化されているので、この方法はコード化効率が高い。それは、この方法
は値の統計を小さな数に向けてより強く重み付けするからである。
第29図に示された2進トリーが得られるこのコード化手順は、次の様に行われ
る。最初に、第28図の2進トリーを生成するコード化プロセスを行う。次に、同
一ブランチ点からのターミナル・ノードにおける1対のフィル値の差を求め、か
つ平均する。この差値はそのブランチ
点に割当てられる。この差値は続いてこのトリー記述においてコード化される値
である。上記の平均値もそのブランチ点に割当てられるが、その目的はこのトリ
ーを逆に上に向かって作動する他のノード値またはブランチ点値を決定するため
だけである。すなわち、この平均値は並列するブランチの対応するノードからの
絶対値または平均値と平均化されまた減算処理される。その差値はコード化され
るべき値としてそのブランチ点に割当てられ、新しい平均値はトリーを階層的に
上方に作動する次の差値および平均値を決定するために使用される。差は、右側
のノード値またはブランチ値から左側のノード値またはブランチ値を減算するこ
とによって決定される。
図示の例では、ターミナル・ノード値90をターミナル値98から減算して差値+
8を算出し、これを「分割3」と付記したブランチ点に割当てる。ノード値の平
均である(90+98)/2=94も角カッコで示す如くこのブランチ点に与えられる
。ブランチ点「分割3」におけるこの平均値94は、ターミナル・ノード値112と
の間の減算処理および平均化が行われ、差+18と平均103を発生する。これらの
値は「分割2」と名付けたブランチ点に割当てられる。このプロセスは、最初の
ブランチ点に到達するまでトリー全体を上向きに、実行される。
頂点ノードを値128と基準化することによってこのトリーの頂点ノードにおい
て更にコード化効率が得られる。すなわち、頂点ノードに対して設定された平均
値から値
128を減算する。この例では、頂点ノードまたは頂点ブランチについての平均値
は121である。121から128を差引いて、値−7が得られる。この値を、コード化
されたトリー記述の最初の点に与える。
このトリー記述は第31図の行「A」に例示されており、発生順番に、値−7、
以下順次続く第1分割の方向「H」、第1のブランチに与えられた差値、左側ブ
ランチをフィルするための命令、次の分割の方向「V」、そのブランチ点に与え
られた差値等を含んでいる。このコードは、第30図と同数の命令を含んでいるが
、数値はより小さな値である。
復号に際しては、最初の2つのノード(141とブランチ点「分割2」)の平均
値を、+128に−7を加算して、RとLをそれぞれ右と左のノードまたは平均値
として(R+L)/2に等しい答121を得るという計算を行う。コードとして伝
送された差値−37は、(R−L)すなわちR−L=37に等しい。しかし(R+L
)/2=121である。これらの式を解けば、141に等しい左側ノード値Lと、103
に等しい右側ブランチの平均値Rを、同時に得ることができる。このプロセスは
、トリーを下方に向かって続けられる。時には、上記の平均化プロセスで奇数を
2で割算する必要がある。これには、エンコーダとデコーダが同じ切捨て法また
は丸め法を行うようにして、対処することができる。
上述の2進トリー・コード化法では負の数をコード化
する必要がある。これは、次の様なやり方で行われる。すなわち、正(またはゼ
ロ)数Pは正の数2Pでコード化し、負数Nは正の数2N−1でコード化する。
正と負の数は、すべての正の値(2P)は偶数でありまたすべての負の値(2N
−1)は奇数であるから、区別するこどができる。この技法によれば、一定ビッ
ト幅のコードワードの最上位ビット位置に符号ビットを配置することを避けられ
、従って小さな値に対して符号ビットと値のビットとの間の余分なビットを省略
することができる。このコード化形式を使用すると、トリーコードは、第31図の
コード行「B」の値をとる。
更に、効率的な方法として、「動作(アクション)」と「値(バリュウ)」と
を相異なる可変長コードを用いでコード化することが有効であると判った。異な
った動作(アクション)は極く僅かしか無いし、また可能な値はより沢山あるの
で、それらの統計は可成り異なっている。従って、別々の可変長コードを使用す
ると、幾らか余分にコードの節約をすることができる。
上記の説明は、特に定数の絶対フィルを含んだ画像に当てはまる。実際に、現
用されているフィルには5つの形、すなわち、絶対、相対的、DPCM、アイア
ドおよびクワッドがある。その各々は、別々の固有の動作コードを持っている。
上記したノード値は絶対フィルに当てはまるだけである。他の4つのフィル形式
に対するフィル値は、後で分割/フィル・セグメントと組合わされて
全体的なビデオ・ビット・ストリームを形成する相異なるコード・セグメントに
別々にコード化される。多数のコード・セグメントを使用することは、次の「セ
グメント化されたストリーム可変長コード化」の項と第46図、第47図において説
明する。
垂直分割Vと水平分割Hの発生の確率はほぼ等しい。この情報をコード化する
別のやり方として平均に使用するビットがより少ない方法が判った。大部分の分
割はより長い寸法を分割している(たとえば、第34A図の領域3402と3406)。そ
の様な分割は単純分割(シンプル・スプリット)と呼ばれ、Sとコード化される
。領域の各寸法が等しくかつそれが水平に分割されるときは、単純分割Sとして
コード化される。この領域寸法は判っているし、もしそれらが等しいものであれ
ば、その分割コードSは水平分割と解釈されるから、このコード化はデコーダに
とって、あいまいなものではない。単純分割でない分割は、どれも代替分割(オ
ルターネイト・スプリット)と呼び、Aとしてコード化される(たとえば、第34
B図に示す領域3406と3408)。単純分割が発生する確率はより大であるから、可
変長エンコーダは、単純分割を表すためにより短いコードを指定することによっ
て、平均についてより少数のビットを使用することができる。このコード化法に
よって、第29図のトリーは第31図のC行を通してコード化される。このやり方は
、コードの大きさを減少させ得るが、単純分割コードおよび代替分割コー
ド(SおよびA)から垂直および水平分割動作(VおよびH)を推測する必要が
あるので、復号時間が増大するどいう不利がある。
相対的コード化またはダイアド・コード化された領域を含んだ画像(後述する
)の場合、領域シフト値(X0、Y0)も、2つのシフト値が後続する別の動作(
シフトという)を使って、分割/フィル・トリー記述中にコード化される。以下
説明するように、シフト値は、与えられたフレームの或る領域と前のフレームの
それに対応するフレームとの間の水平方向のオフセット(X0)および垂直方向
のオフセット(Y0)の大きさである。このシフトは、1つの領域のフレーム相
互間の動きの大きさである。これらの値は、更にコード化を効率的にするために
、別々にではなくトリー記述中でコード化される。多くの領域が同じX0、Y0値
を持つ傾向があるので、このシフト動作は、そのノードおよびそのノードのすべ
ての子ノードに上記のX0、Y0値を適用することを意味すると定義される。都合
の良いことに、この方法で、同じシフトを有する複数の領域に対する各シフト値
は1回だけコード化すれば良いことになる。
第17図と第18図〜第38図は、これらに関連するもので、すべての静止フレーム
と動きビデオ・シーケンスの最初のフレームをコード化するフレーム内コーダ16
10の詳細を示している。第17図はコーダ1610によって行われるコード化プロセス
中の各ステップを示すフローチャートで
ある。この、コーダ1610のソフトウェア構成は現在好ましいものである。しかし
、個々の処理機能はこのフローチャート中に示された各機能を行う個々の装置要
素によって容易に実現できることは、諒解されよう。その様なハードウェアの構
成の特定例が第18図〜第38図に含まれでいる。
フレーム内コード化(第17図)の第1ステップは、スタート・ステップ(1702
)であって、これは静止フレームのためにまたは動きシーケンスの第1フレーム
のために、モードスイッチ240'を上昇位置に置くことで開始される。これと同時
に、スイッチ224(第2図)を、Yサブフレームを選択するように位置づける。
すべてのYサブフレームは、スイッチ224がIサブフレームをまた最後にQサブ
フレームを選択する前に、圧縮されることになる。
概観するとこの第17図は4つの主たる動作を持っている。ステップ1703では事
前濾波が行われる。サブ領域の積重ねと選択はステップ1730、1732および1704で
行われる。これは、その大きさに関係なくすべてのサブ領域に同じ方法を適用で
きるようにするプロセス(後述する)である。線形フィルコード化は、ステップ
1706から1716によって行われ、領域は平面(Ax+By+C)としてコード化す
るに適当かどうか、もし適当なら、コード化の詳細はどうあるべきか、を決定す
る。線形フィルコード化法に適していない領域に対しては、ステップ1722と
1724によって行われるDPCMコード化が使用される。ステップ1720は、結果と
して得られるコード化について事後処理を行って更にコードの大きさと復号時間
とを減殺する。ステップ1734と1736によって行われる処理は、静止フレームのシ
ーケンスの終了点または動きシーケンスの最初のフレームの終了点をチェックす
ることである。
第17図における最初の動作は、ビデオ信号S8の「画像」にフィルタ1703を適
用することである。濾波作用によって不要な細部が除かれ、圧縮プロセスの速度
が改善され、コードの大きさが小さくなり、そしてより大きな領域が生成される
傾向があるのでその復号時間が短くなる。単純な低減通過フィルタは画像を不鮮
明にする傾向があるので、小振幅のノイズは除去するが大振幅の情報は保存する
非線形フィルタが好ましい。この目的に使用できるフィルタとしては多くの種類
のものがあるが、好ましい形態は、重み付けされたメジアン・フィルタと変形線
形低域通過フィルタである。この変形については第36図を参照して次に説明する
。
第35A図〜第35E図は、重み付けされたメジアン・フィルタを例示している。
第35A図は濾波されるピクセル3502と、このピクセルに最も近い8個の近傍(ネ
イバー)を示す。第35B図は、ピクセル3502を濾波して第35C図中に示された1
つのピクセル3506に対する重み付けされた値(12)を生成するための、重み係数
のアレイを示している。この重み付け法は第35D図に示されている。最
初に、ピクセル3502とその8個の近傍の値が、上昇順にリストされる(3503)。
重み付けされないメジアンは、11ユニットの値を持っているように見える。これ
らの値のうちの半分は高くまた他の半分は低い。第35B図からの重み値(3504)
が順番に配列された値3503の下方にリストされている。重み値は、配列リスト35
08を形成するように、各値を繰返す回数を決定する。この例では、4隅のピクセ
ル(11、9、1、17)は重み1を与えられて、リスト3508中に1回リストされる
。中心線上のピクセル(12、5、10、13)は重み2を与えられてリスト3508中に
2回リストされる。中央のピクセル(15)は濾波されるべきもので、重み5を与
えられ、リスト3508中に5回リストされる。重み付けされたメジアン値(12)は
、リスト3508の中で、重み付けされた値の半数はそれより小さく、他の半数はそ
れより大きいという様な値である。この値(12)は、第35C図に示される(3506
)ように、領域3503の中央ピクセルの濾波された値である。残りの他のピクセル
は、各ピクセルとその隣接8近傍に重み付けアレイ3504を適用することによって
、上記と同様にして決定される。
第35B図の重みは、リスト3508をほどよい短さに保つように例示する目的で選
んだものである。平均的シーンの一例重みが第35E図に示されており、この形で
は隅の重み値が2、中心線上の重み値が4および中央ピクセルの重み値が13であ
る。これらの重み値は、エッジの遷移
を保持しながら制御された方向性のある空間細部の再方向付けが得られるように
変更することができる。たとえば、隅の重みを変えることによって、濾波された
値に対する対角方向の寄与を変更することができる。垂直および水平の寄与は、
それぞれ上部および下部または左側および右側の重みの値によって決定される。
従って、重み付けされたメジアンは、メジアン濾波されたものであるためエッジ
が保存されていることに加えて、重み付け係数のために選択的な方向特性を示す
ことができる。
第36A図はエッジ遷移を保存しつつ重要でないディテールを除去する濾波ステ
ップ1703で使用するのに適した修正された低域通過フイルタを示す。このフイル
タは線形トランスバーサルフイルタ3602と修正器3620(共に点線で示す仮想線で
囲まれている)の組合わせからなる。簡単に云えば、修正器はエッジを検出し、
低域通過フイルタの入力信号と出力信号とをエッジ振幅の関数として選択的に混
合するために使用される“ダンピングファクタD”を発生し、それによってより
大きな信号遷移を保存しつつ小さな変化を抑制する。フイルタ3602は縦続接続さ
れたピクセル遅延素子3604および3606からなり、これらの遅延素子は入力端子36
08に供給された入力信号を1ピクセル期間、2ピクセル期間だけそれぞれ遅延さ
せる。加算器3610は、入力信号(重み=1/4)、1ピクセル遅延された信号(
重み=1/2)、2ピクセル遅延された信号(重み=1/4)の重み付け和(重
み付けさ
れた和)を形成することによって低域通過濾波された信号を生成する。修正器36
20は、加算器3610の低域通過濾波された信号を遅延素子3604によって供給された
非濾波1ピクセル遅延入力信号から減算することによって遷移を検出する減算器
3622を含んでいる。減算器3622の出力は非線形検出器3624に供給され、該非線形
検出器3624は乗算器3626および3628を制御するための相補制御信号Dと1−Dを
発生する。乗算器3624および3626はそれぞれ濾波されたピクセル遅延信号と非濾
波ピクセル遅延信号どを乗算する。加算器3630は乗算された信号を加算して端子
3632に出力信号を発生する。検出器3624は、アドレスとして供給された減算器36
22からの差に応答して値Dと(1−D)を出力するようにプログラムされたRO
Mでよい。
第36B図は、減算器3622の出力(差信号)の関数として制御信号D(以下では
ダンピングファクタと称す)と1−Dとを生成する検出器3624の非線形特性を示
す。画像の小さなディテール(細部)の特徴の小さな差特性に対しては、ダンピ
ングファクタDは1に近い。従って、乗算器3626は出力として加算器3610の濾波
された信号を選択する。大きな遷移に対しては、Dの値が小さくなり、従って信
号1−Dが大きくなり、乗算器3628は出力としてより多くの非濾波信号を選択す
る。非常に大きな遷移(Dは0に近い)に対しては、フィルタ3602は実質的にバ
イパスされて、大きなエッジの全振幅を忠実に保存す
る。このことはさらに第36C図に示されている。第36C図で、3640は白丸(○)
で表される入力ピクセルに対するステップ状遷移の発生を表わす。点線3642は、
大きなピクセル変化、小さなピクセル変化の双方を平滑する傾向がある通常の低
域通過フイルタの応答を示す。黒丸(●)は第36A図の修正されたフィルタの応
答を示す。遷移領域に近づくピクセル、遷移領域から離れるピクセルに対しては
ダンピングファクタDは低く、それによって小さなピクセル変化(ディテール)
は濾波される。遷移領域ではダンピングファクタは低く、そのためフイルタをバ
イパスして急峻な遷移を保存する。
第17図に戻って、ステップ1704、1730および1732は後続する解析に対する領域
を選択し、リストアップする。この処理は2つの可能な効果の1つをもっている
。ステップ1716あるいは1724を経由してその領域のコード化を行い、それによっ
てそれ以上の解析から領域の除去を行い、あるいは現在の領域を分割ステップ17
24で分割して、各半分を共にさらに検査を行うためのリストに載せる。各分割に
より領域の寸法を減少させる。領域が充分に小さくなると、最小寸法領域1722用
の検査が行われる。この検査によって無制限な分割が防止され、これによってす
べての領域の最終的なコード化が行われる。
最初、領域選択ステップ1704は全画像のサブフレームを1個の単一領域として
処理する。この処理期間中、分割ステップ1726〜1732が生じ、処理する必要のあ
る2個
のサブ領域が生成される傾向がある。ボックス1730および1732はステップ1704で
除去されるのを待つ領域のリストに2つの領域を“押し込む”。この“押し込み
”は、領域一致(位置)が領域リストに記憶されるということを意味する。次の
時間選択領域1704が使用されて、そのリストの頂部領域が以下に説明するように
コード化される。領域が処理される順序は、その領域がこのリストに載せられる
順序によって決定される。水平分割ステップ1732については、下部の半分の領域
と上部の半分の領域がそれぞれリストに加えられて、先ず上部の半分がコード化
される。垂直分割1730については、右側の半分の領域と左側の半分の領域がリス
トに加えられて、先ず左側の半分の領域がコード化される。どのようにして領域
が検査されるかという規則的な順序つけはビデオプロセッサ30(第1図)に知ら
され、各画像を表すために使用されるコードの順序を解読するために復号期間中
上記ビデオプロセッサによって使用される。
線形フィルコード化は後程説明するようにステップ1704〜1716で行われる。領
域特定コード化は個々の領域に対する最適のコード化方法を選択する能力がある
という点からその効果が得られる。線形フィルコード化は大きな領域を非常に少
ないビットで表現することができるので、最初に試みられる。若し線形フィルコ
ード化が不可能であれば、領域は分割ステップ1726で分割され、各サブ領域に対
して線形フィルコード化が再び試みられる。
線形フィル技術を用いて領域をコード化するのに必要なビット数は領域の寸法が
大きくなっても増加しないので、これは大きな領域に対する優れたコード化法で
あることが判る。生成されたサブ領域が最小寸法(試験ステップ1722)以下に低
下した場合のみ他のコード化技法が使用される。
2乗平均誤差測定(MSE)法は、線形フィルコード化が満足できるか否かを
決定する(ステップ1714)ために使用される1つの方法である。この測定は全体
の領域にわたる平均であるから、平らな表面からのずれが大きく、可視的に明ら
かであり、MSEの満足度がまだ低い領域の局在化部分が存在する可能性がある
。この問題を解消するために、線形フィルコード化(1710)が試みられる前に粗
さ推測装置1706が領域に適用される。領域がこの試験で不合格になり(1708)、
最小寸法でなければ(試験1722)、それは分割されて(1726〜1732)、同じ処理
がそのように形成された得られたサブ領域に対して施される。
この例では、領域の粗さはその領域のエッジを検出することによって決定され
る。第18図は隣接するピクセル間の灰レベルの大きな変化に基づくエッジの簡単
な定義を示している。第19図はエッジ検出を行なう装置のブロック図である。
第18図で、領域1802は4行、4列のピクセルからなる。ルミナンス(Y)信号
の値は16ピクセル用として示され
ている。定義によってエッジは隣接するピクセルの値が閾値(閾値制御238を経
由する入力)以上に異なる上記ピクセル相互間に存在するものとする。代表的な
閾値は8ビットに量子化された(すなわち、黒からピーク白まで256のレベルス
ケール)Y信号に対して25ユニットである。一例として、10輝度ユニットレベル
を使用すると、第18図では、2個の垂直エッジ(V)と3個の水平エッジ(H)
とが存在することが判る。
もし領域1802が行2と3との間で水平方向に“スプリット”すなわち“分割”
されれておれば、すなわち(分割)されておれば、いずれも水平エッジを含まな
い2つの領域が形成される。行3および行4のピクセルは輝度が僅か3から5ま
での範囲にあり、それはエッジの閾値以下である。従って、領域1802の水平方向
の分割によって水平方向にエッジをも57−1たない2つの領域と、全部で8個の
ピクセルに対するY信号の値を適正に表わす“4”の“フィル”値でコード化さ
れる1個の領域(行3と行4)とを生成する。しかしながら、行1と行2はなお
垂直方向のエッジVをもっている。この領域を列2と列3との間で垂直方向に分
割することにより、さらに2個の領域が構成され、いずれの領域にもエッジは含
まれない。一様な値のピクセル“23”を含む4×4の領域ば単一の値で満たされ
ている。ピクセル値1、3、9および12をもった4×4の領域は水平あるいは垂
直のエッジをもたないが、顕著な“勾配”が存在するために単一
の値で満たされない。このような領域を満たすためにはステップ1710を介して平
坦な表面の充満(フィル)を必要とする。
フィル処理は領域のピクセル値の双一次多項式(Ax×By+C)の推測値の
係数A、BおよびCを見つけるための最小2乗法を使用してステップ1710で開始
される。境界誤差およびMSE誤差の測定はステップ1711で行われ、ステップ17
12および1714のの試験はフィル値が許容性を決定するために実行される。
ステップ1708、1712あるいは1714におけるいずれかの試験の結果の故に線形フ
ィルが満足できるものでなければ、次のステップは通常領域の分割ステップ1726
である。しかしながら、ステップ1722における試験では、領域の寸法が既に小さ
いときは分割を阻止する。これは次の2つの理由により行われる。第1の理由は
、線形フィルコード化用のコードの寸法は名目上領域の面積に無関係であること
による。しかしながら、一旦領域がある予め設定された値以下に低下すると、他
のコード化法はより少数のビットを必要とする。第2の理由は新しい領域を復号
する必要があるときは何時でもエンコーダ(第48図)中で遅延が生ずるからであ
る。もし画像が多数の比較的小さい領域によって表されるときは、この遅延は30
FPSのような率で画像を復号する必要性と干渉を起こすのに充分の大きさにな
る。
最小寸法試験の結果、最小寸法領域が指示されると、
ステップ1724は領域をDPCM(差分パルス符号変調)フォーマットで領域をコ
ード化する。このコード化法では、すべてのピクセルとその左側の隣接ピクセル
との間の差が伝送される。しかしながら、領域の各ラインの最初のピクセルの左
隣にピクセルは存在しないので、最初のピクセル自体とそれの上に隣接するピク
セルとの間の差として伝送される。領域の第1行の最初のピクセルの左側、上側
にはピクセルは存在しないので、この場合はその最初のピクセルと中間灰色値、
すなわち128との差として伝送される。生成された差は非線形量子化装置を通過
させることによってデータをさらに減少させることが出来る。復号のために、非
線形量子化レベルを表わすテーブルが圧縮されたビデオ・ビットストリームのヘ
ッダ部分のエンコーダに伝送される。
多数の量子化装置が使用される。これは、領域特定コード化がコード化技術を
個々の領域に整合させる事が出来るという理由で実用的である。これらの量子化
テーブルは差のダイナミックレンジに関して異なっている。DPCMエンコーダ
1724は各領域の統計を試験し、どの量子化装置のテーブルがその領域により適合
しているかを決定し、どの逆量子化テーブルがそれを復号するのに使用すべきか
を特定するコードを発生する。
第19図は粗さ試験を行うための装置を示している。後程説明する第32図および
第33図は分割方向を決定する装置を示している。第19図で、領域データはメモリ
1902に
蓄積される。減算器1904および1906はそれぞれ領域ピクセルの行方向減算、列方
向減算を行なう。閾値検出器1908および1910はピクセルの差を閾値Th(例えば
、10と仮定する)と比較して水平、垂直のエッジを検出する。これらのエッジは
次いでカウンタ1912および1914でカウントされてエッジメモリ1916に記憶される
。記憶されたエッジデータはゼロ検出器1920に供給される。検出器1920の高出力
(HIGH)は領域には水平方向あるいは垂直方向のエッジが存在しないことを
表わし、領域に与えるフィル値(あるいは複数のフィル値)を発見する処理を開
始する。もしエッジが存在すれば、メモリ1916中のエッジデータは分割論理回路
(第33A図)に供給されて、後程説明するように分割の方向を発見する。
別の粗さの定義も可能である。例えば、多数点補間技法によって隣接ピクセル
間の勾配を推測し、もしその勾配がある閾値よりも大でしかも領域全体にわたっ
て一様でなければ表面は粗面である。
第17図に戻って、試験ステップ1708で領域内でエッジの存在が発見されないと
仮定すると、群として領域の全てのピクセルを表わすフィル値を発見するための
処理が開始される。これはステップ1720において最小2乗法による推測値を使用
してその領域に対するピクセル値の双一次多項(Ax+By+C)推測値の係数
A、BおよびCを発生することによって行われる。推測されたピクセル値は領域
のすべてのピクセルの実際の値と比較されて
推測値の近さ、すなわち適合度(フィット)が決定される。フィル値は、2つの
試験すなわち“境界エラー”試験1712と“平均2乗エラー”試験1714を満足する
多項式の係数A、BおよびCからなる。
第20図〜第24図は多項式フィル値がどのようにして発見され、フィル値につい
ての満足度を検査するための2つの試験がどのようにして実行されるかを詳細に
示している。第20図は領域2002のすべてのピクセルが同じ値(5ユニット)をも
っている最も基本的な場合を表している。水平方向(X方向)には明るさの勾配
はないから、水平方向の明るさの勾配すなわち傾斜を示す係数“A”はゼロに等
しい。同様に垂直方向にも明るさの勾配はないから、垂直方向の勾配を表わす係
数“B”はゼロである。残る係数“C”は5ユニットの一定値すなわち一様な信
号レベルを表わす多項式の係数である。この単純な場合を表わすコードはABS
005として表されており、実際の信号値に基づく領域コードをフレーム毎の
差に基づく領域コード(以下では“相対”コードと称す)と区別するために、以
下では“絶対”コード化と称されるものを表している。領域2002の復号はその領
域におけるあらゆるピクセルに値5を割り当てることからなる。
第21図で、領域2102はX方向の1単位ピクセル当たりの水平方向の明るさの勾
配を含んでいる。左上隅からスタートして値は4、5、6であり、フィル多項式
Ax+By+Cの係数は、左上ピクセルを基準レベルにとって
係数C=1、B=0、C=4である。従って、コードはABS 104である。
これは左上隅のピクセルに値4を割当て、各水平方向ピクセルにピクセル当たり
1単位分の明るさの勾配修正を加えることによって復号される。第21図では垂直
方向には勾配はないので、後続する行は第1行の複製になっている。第22図は勾
配が水平ではなく垂直方向になっている点を除けば第21図と同様である。
第23図では、領域2302は水平方向、垂直方向の双方の方向に勾配をもっている
。左上隅のピクセルを基準としてとると、多項式の係数Cは5に等しく、明るさ
はX方向にピクセル当たり1単位づつ増加し、Y方向に−1づつ変化している。
従って、コードはABS 1-15である。第1ピクセルに値5を割当て、その
値を水平方向にピクセル当たり1単位づつ増加させることによって復号が行われ
る。第2、第3の行についてもスタートのピクセルを垂直勾配値だけ減少させた
後、同様に列当たり1ピクセル値づつ減少させることによって復号される。
上述の例は、多項式Ax+By+C中の勾配値A、Bが常に整数である場合を
示している。しかしながら、実際の画像中で生じる大抵の勾配は整数ではなく、
実際には通常1以下の絶対値であることが判っている。従って、AおよびBの各
値は1/256の単位、すなわち勾配の分数部分を表わす最下位8ビットをもった
2進数で特定される。
第20図〜第23図では多項式コード化は正確である。す
なわち、例示された所定の値に対して、たまたま復号時に復号された領域は元の
領域と同じ値をもっている。実際にはこのような理想的な状況は極めて稀にしか
生じない。このような理由から、領域が最終的に復号されたときに双一次多項式
フィル値が実際のピクセル値の妥当な近似レプリカを生成しているか否かについ
て決定するための測定が必要である。このために平均2乗エラー(MSE)試験
および第24図に示すような多項式の適合性の境界エラー試験が使用される。
第24図は、多項式フィルが正確でなく、適合性についでの満足度が試験される
特定の場合を示している。領域2402は、それが画像に現れるときのピクセル値の
領域である。アレイ2404はAx+By+Cの形式の多項式を使用して生成された
対応する値の群を示し、その係数値は領域2402のデータに基づく最小2乗解析法
を使用して決定される。アレイ2404は一様な水平方向の勾配1と一様な垂直方向
の勾配1とを示している。アレイ2406は、実際のピクセル値と対応する発生され
たピクセル値との間の誤差に相当する。MSEはアレイ2406の値の2乗の平均値
の平方根をとることによって得られる。この特定の例ではMSEは1であり、こ
の値は閾値と比較されてフィルデータが満足できるものであるか拒否すべきもの
であるかを決定する。
境界エラーはこの領域の境界を構成する12ピクセルの解析に基づくものである
。もし対向する領域間で偽のエ
ッジを発生させないようにしようとすれば、境界エラーば領域内側のエラーより
もより厳しい公差が要求されるということが判った。1つの可能な境界試験とし
てアレイ2406中の各境界の差分を表わす値を予め設定された閾値、例えば10と比
較して、いずれかの差分がこの閾値を超過すると、その係数を拒否する。
境界試験の好ましい実施例では値の一貫性(コヒーレント)を見つけることで
ある。値がコヒーレントであれば、すなわち隣接ピクセルが同じ符号のエラーを
もっているときは、境界エラーは顕著になることが判った。アレイ2406の頂部、
底部および左側に沿う差分の値のように差分がランダムであるときは、再生され
た画像に偽エッジが発生する可能性は少ない。好ましい実施例では、境界推測器
1711は同じ符号をもった境界エラーの連続するブロックを識別する。長さが第2
図の閾値制御ユニット238からの閾値よりも大で、典型的には2であるブロック
の部分である境界ピクセルのみについて考慮すればよい。例えば、第24図のアレ
イ2406では、右側境界に関連する+1の値をもったエラーの値のブロックのみに
ついて考えた場合は、境界エラー推測値“1”が発生される。このようなコヒー
レントなピクセルの平均ブロックのエラーの値は閾値と比較され、エラーが閾値
を超過すれば、フィルは拒絶される。
要約すれば、ステップ1712、1714における試験は、多項式Ax+By+Cによ
って表される適合性(フィッ
ト)が受入れ可能であるか否かを決定するために実行される。ステップ1714にお
ける試験では、平坦な表面からの平均のずれが高すぎるので、出力は否定である
。換言ずれば、MSE試験は、本質的にコード化されたピクセル値(Ax+By
+C)と実際のピクセル値との適合性の程度を測定するものである。MSEの閾
値は閾値制御ユニット238に対する入力として選択されて使用され、典型的には
4である。ステップ1712の試験では、境界に沿うエラーが、復号され且つ表示さ
れたときに隣接する領域間の可視遷移を導入する傾向があるときは、否定出力を
発生する。また、境界の閾値は閾値制御ユニット238の入力として使用され、典
型的には20である。
第17図に戻って、一旦領域を分割することが決定されると、その領域はその最
善の分割方向を見つけるために解析される。ステップ1728における試験により垂
直方向の分割が必要と指示されると、ステップ1730でその領域は左半分の領域と
右半分の領域に分割される。ステップ1728における試験により水平方向の分割が
必要と指示されると、ステップ1732でその領域は上側半分の領域と下側半分の領
域とに分割される。分割が水平方向であると、ステップ1704で分割領域の上側領
域を次の領域として選択して圧縮処理が繰り返される。もし、分割が垂直方向で
あると、ステップ1704で分割領域の左側の領域を選択して圧縮処理が繰り返され
る。この分割および圧縮処理は、分割処理によって生成された全ての領域がコー
ド化
される(ステップ1705)まで継続する。前述のようにステップ1720で再併合(リ
マージ)が行われ、ルミナンス信号(Y)のサブフレームに対するフレーム内圧
縮動作ば終了する。残るIおよびQ成分のサブフレームに対する圧縮処理を繰り
返すことによって完全なカラーフレームがコード化される。もし追加の静止フレ
ームがコード化されるべきであれば、最後のフレーム試験ステップ1734の結果と
してステップ1735で次のフレームが選択され、その処理が繰り返される。
第17図におけるステップ1726で分割すべき領域の分割方向を発見することは、
(1)エッジ分布解析、あるいは(2)多項式適合解析によって行われる。これら
の各処理、および分割方向の指示を与えるための特定の装置についでは以下に第
32図〜第38図を参照して説明する。
エッジ分布解析は、領域を分割する理由が領域にエッジが存在する(例えば、
第17図におけるステップ1708における粗さ試験の欠如)場合に対する最も好まし
い分割の方向を発見するために使用される。第32A図〜第32J図は、エッジ分布
解析を使用して分割すべき領域の例を示すものである。後程説明する第33A図お
よび第33B図は解析がどのようにして実行されるかを示している。
第32A図〜第32E図は、水平方向の分割よりも垂直方向の分割の方が好ましい
ことを示している。第32A図でば、領域3202は領域の垂直2等分線上に存在する
2つの垂直方向エッジを含んでいる。この領域を水平方向に分
割しても何も得られない。というのは、各サブ領域はなをエッジを含んでいるが
、垂直方向の分割によっていずれにもエッジを含まない2つの領域(1と3、お
よび2と4)が生成されるからである。第32B図では、領域3204の右側半分にエ
ッジは存在しないから、垂直分割によってエッジを持たない1個のサブ領域が生
成される。第32C図の領域3206についても同様に垂直方向の分割が好ましい。第
32D図では、領域3208中に多数の垂直エッジが存在する。ここではエッジのない
領域は生成されないが、垂直方向に分割したほうがこれを水平方向に分割した場
合よりもエッジが除去される可能性が大きいので、垂直方向の分割のほうが好ま
しい。第32E図では、領域3210は幾つかの水平方向、垂直方向のエッジを含むの
で、はっきりとした利点はない。この場合はアスペクト比解析が使用される。特
に領域3210は高さよりも幅が大であるので、垂直方向の分割によりより正方形に
近いサブ領域が生成される可能性があるので、垂直方向の分割が選択される。平
均して、エッジ解析によりはっきりとした効果が出ない通常の画像についてはよ
り小さな領域が生成される。第32F図〜第32J図の領域3212〜3220は、先に説明
した領域3202〜3210の垂直方向の分割に関して説明した同じ理由で水平方向に分
割される。
上記の説明から明らかなように、分割方向の決定に関係をもつ多数の要素があ
ることが判る。実際には、現実の画像は第32A図〜第32J図に示したような比較
的簡単
な例よりも遙に多くのエッジの分布をもっているので、実際には分割の決定は上
記の例で見られる程簡単ではない。第33A図のフローチャートおよびそれに関連
する第33B図のテーブルは、典型的なビデオ画像の領域を分割するに当たって遭
遇する複雑なエッジ分布を考慮して分割方向を発見する方法を示している。
第33A図で、分割方向の解析はスタート(3302)して分割すべき領域の4つの
象限のエッジを検出するステップ3304に入る。第32A図および第32F図に示すよ
うに、象限は左上を1、右上を2、左下を3、右下を4と表わす。次のステップ
3306で第33B図のテーブルにリストアップしたような4つの関数V13、V24、H
12、H34が発生される。関数V13は、左半分の領域(すなわち、象限1と3)に
おけるエッジに関連する多数の項(第33B図の列1)の和に等しい。関数V24は
、領域の右半分(象限2と4)に対する多数のエッジ分布項の和からなる。同様
に関数H12、H34は領域の上半分、下半分に対する項の和に関連している。特定
の項については以下に説明する。
ステップ3308で掛算が行われて、ここでは垂直係数VF、水平方向係数HFと
称する係数を生成する。垂直係数VFは領域の高さHに関数V13とV24とを乗じ
たものに等しい。水平方向係数HFは領域の幅Wと関数H12とH24との関に等し
い。係数HFとVFはステップ3310で比較され、もしVFがHFよりも小であれ
ば、垂直方向
の分割が行われてプログラムは終了し(3316)、VFがHFよりも大であるとき
は領域は水平方向に分割されてプログラムは終了する。
動作について説明すると、VFをHFよりも小さくする傾向のある係数につい
ては垂直方向の分割が好ましい。例えば、ステップ3308から、もしエッジ解析係
数V13およびV24がH12およびH24に等しければ、その高さHがその幅よりも小
であれば垂直方向の分割が好ましい。この状態は第32E図の例に相当し、エッジ
解析では明確な効果が存在しなかったが、アスペクト比試験によりより正方形に
近いサブ領域を得るのに垂直方向の分割が好ましいことが判る。
発生ステップ3306で計算された第33B図の係数は、領域内の垂直方向、水平方
向のエッジ分布が一様でない場合に重要になる。V13(左半分)あるいはV24(
右半分)を小さくする傾向のある係数は垂直方向の分割が好ましい。例えば、象
限1における垂直方向のエッジの数V1が象限3の垂直方向のエッジの数V3に
等しいと、係数V1−V3=0になり、垂直方向の分割が好ましいということに
なる。垂直方向と水平方向のエッジの差の係数V1−V3、H1−H3、V2−
V4、H2−H4、等は全ての象限に含まれている。これらの係数はすべて第33
B図で2乗されてそれらに加算された重みを与える。項H0およびV0はそれぞ
れ垂直方向、水平方向のエッジの数を表わし、これらは分割によって除去される
(す
なわち、エッジが分割線上にくる)。エッジの除去はまた重要であることが判り
、そこでこれらの項は2乗されで分割方向の試験でそれらの重みを増大させる。
残る係数H1、H2、V1、V2等は象限当たりのエッジの数を表している。例
えば、もし左右の各半分に多数の水平方向のエッジが存在すると、水平方向の分
割が好ましい(例えば、第32I図)。第33B図のテーブルの他の適用例も明らか
である。例えば、こゝに図示されたものとは異なった重みを付けることも可能で
ある。また、領域をさらに細かくサブ分割することもでき、この場合は分割方向
の解析に対する別の項をテーブルに付加することができる。
上述の説明は、分割に対する理由がステップ1708におげる粗さ試験の結果、Y
ES出力であると仮定した場合である。分割の理由がMES試験(ステップ1714
)あるいは境界エラー試験(ステップ1712)を欠いた線形フィルコード化フィル
であれば、分割方向を選択するために別の方法が適している。
第37図は分割方向を決定するための多項式適合の解析を示している。第17図か
ら明らかなように、平均2乗エラー(MSE)あるいは双一次多項式Ax+By
+Cの境界エラー試験のいずれもが不満足である場合は、領域は常に分割される
。第37図では、双一次多項式の垂直部分(By+C)が垂直ルミナンスの値YV
(すなわち、行方向のルミナンス値の平均)と比較される。また、水
平方向部分(Ax+C)は水平方向のルミナンス値(すなわち、列方向のルミナ
ンス値の平均)と比較される。より良い“適合性”(すなわち、より低いMSE
)を与える比較結果が分割方向として選択される。
この方法を実施するコンピュータようのフローチャートが第38図に示されてい
る。Ax+CとYHとの適合性、By+CとYVとの適合性の測定はステップ3802
、3804で行われる。ステップ3806における試験により、第37図の例に示すように
、垂直方向の適合性(すなわち、MSE)が水平方向の適合性よりも良好であれ
ば、垂直方向の分割ステップ3810を選択する。逆に水平方向の適合性が垂直方向
の適合性よりも良好であれば、水平方向の分割を選択し、プログラムは終了する
(DONE)。
分割方向を発見するためのこの方法の利点は、エラーの殆どがその領域の1/
2で生ずるならば、しばしば“適合可能な”領域が得られるという点である。第
37図の例では、垂直方向の適合性が良好で、水平方向の誤差の殆どが画像の右半
分の側にある。従って、この場合は垂直方向の分割が好ましく、エラー(水平方
向)が殆ど右側にあるので、領域3702の左側はさらに分割する必要ば殆どない。
第17図に戻って、すべての領域がコード化されていると、再併合ステップ1720
でプロセスが継続する。再併合ステップ1720で画像のすべての領域について発生
されたコード化を検査し、それに対して幾つかの後処理を施し
てあるコードを除去し、復号時間を改善する。同じ寸法の2個の隣接する領域が
同じDPCM量子化テーブルでコード化されるならば、分割処理を避けることが
出来る。ステップ1720の再併合処理により2個のより小さい領域を大きな領域と
置換するようにコード化ストリームを修正する。2個の領域を再結合することに
よって形成された大きな領域は、その後隣接する同じ寸法にDPCM化されたコ
ード化領域とさらに再結合するための動作に関与することができる。
第64図〜第66図は選択された画像をコード化するフレーム内デコーダ1610を詳
細に示す図である。前述のように、表示されたビデオの質を向上させるために特
別な処理を施すために、大量の急速および/または不規則な動きを含む画像のよ
うなある種の形式の画像を選択することが望ましい。選択された画像と称される
このような画像は、多レベル解像度でコード化される。各解像度レベルに対して
、その解像度レベルをもった基準画像中の各ピクセルの値を、その解像度レベル
の選択された画像中の各対応するピクセルの値から減算することによって補正画
像が生成される。次いでその解像度レベルの補正画像は量子化され、コード化さ
れる。
第64図を参照すると、同図には本発明に従って選択された画像をコード化する
方法の好ましい実施例を説明するブロック図が示されている。以下ではレベル0
の選択された画像6402と称する全解像度の選択された画像が、
以下ではレベル1の選択された画像6404と称されるより低い解像度をもった選択
された画像に分解される。レベル1の選択された画像6404は、以下ではレベル2
の選択された画像6406と称されるさらに低い解像度の選択された画像に分解され
る。レベル2の選択された画像6406はさらに低い解像度の選択された画像に分解
され、このさらに低い選択された画像は、好ましい実施例では、以下レベル3の
選択された画像6408と称される最も低い解像度の選択された画像である。好まし
い実施例では、レベル1の選択された画像6404は、全解像度のレベル0の選択さ
れた画像6402のピクセル数の約1/4ピクセルを有し、レベル2の選択された画
像6406は、全解像度のレベル0の選択された画像6402のピクセル数の約1/16ピ
クセルを有し、レベル3の選択された画像6408は、全解像度のレベル0の選択さ
れた画像6402のピクセル数の約1/64ピクセルを有する。この好ましい実施例で
は、選択された画像は3つのより低い解像度の画像に分解されるが、選択された
画像をより少ない解像度レベルの画像に、あるいはより多くの解像度レベルに分
解することもこの発明の範囲内に含まれることは云うまでもない。従って、本発
明は、選択された画像を少なくとも1個のより低い解像度の画像に分解するとい
う考え方をすべて含むものである。
レベル3の補正画像6410はレベル3の基準画像中の各ピクセルの値をレベル3
の選択された画像6408中の対応
する各値から減算することによって形成される。レベル3の基準画像6412はすべ
てが同じ値を有するピクセルのアレイからなる。好ましい実施例では、選択され
た領域6402、6404、6406および6408中の可能なピクセル値の範囲は0乃至255で
ある。レベル3の基準画像6412のピクセル値は全ピクセル値の範囲の中間点であ
ることが望ましい。従って、レベル3の基準画像6412の各ピクセルの値は128で
ある。その結果、レベル3の補正画像中のピクセル値は以下では差分値Dと称し
、−128から+127の範囲の符号と値をもっている。レベル3の補正画像6410中の
各ピクセルの差分値Dは6414で量子化され、レベル3の量子化された補正画像64
16を形成する。レベル3の量子化された補正画像6416は次に説明するように6418
でコード化される。
上記の他に、最も低い解像度の基準画像のピクセル値の別の定数が、選択され
た画像中の実際のピクセル値に基づいて選択されてもよく、この選択された定数
はビットストリーム中に転送される。例えば、選択された画像中の実際のピクセ
ル値の平均値を選択してビットストリーム中に転送してもよい。
レベル3の出力画像は、レベル3の量子化された補正画像6416の各ピクセルの
値をレベル3の基準画像6412中の対応する各ピクセルの値に加算することによっ
て形成される。レベル3の出力画像6420は拡張されて、拡張されたレベル3の出
力画像6422が形成される。拡張によっ
て生成された空のピクセル位置は好ましくは線形フィルコード化補間によって決
定された値をもったピクセルによって満たされる。これは、例えば、空のピクセ
ル位置の両側のピクセルの値を加え合わせ、得られた和の値を2で割り、その商
を空のピクセル位置に挿入することによって達成される。しかしながら、上記以
外の補間方法も使用することができ、それらの方法もこの発明の範囲内に含まれ
ることは云うまでもない。例えば、多項式補間は補正画像中のピクセルの平均寸
法を小さくする傾向があり、それによってビット率を減少させることができる。
好ましい実施例では、各低いレベルの解像度は、より高い解像度のレベルのピク
セルの数の1/4のピクセルを含んでいる。しかしながら、各低い解像度レベル
のピクセルの数は、2、3、5、その他非整数値比を含む係数によって減少させ
ることができ、これらもこの発明の範囲内に含まれるものであることは云うまで
もない。このような場合は、多項式補間が特に有効である。
レベル2の補正画像6426は、好ましい実施例では、拡張されたレベル3の出力
画像6422であるレベル2の基準画像の各ピクセルの値をレベル2の選択された画
像6406中の各対応するピクセルの値から減算することによって形成される。符号
が付された差分値Dであるレベル2の補正画像6426の各ピクセルの値としては−
255乃至+255の範囲内の値を採ることができるが、−128乃至+127の範囲外の値
はクリップされるので、差分値Dは−
128と+127の範囲内に制限される。差分値Dは6430で量子化されて、レベル2の
量子化された補正画像6432が生成される。レベル2の量子化された補正画像6432
は次に説明するように6434でコード化される。
レベル2の出力画像6436は、レベル2の量子化された補正画像6432の各ピクセ
ルの符号の付された差分値Dを拡張されたレベル3の出力画像6422の各対応する
ピクセルの値に算術的に加えることによって形成される。レベル2の出力画像64
32は拡張されて、拡張されたレベル2の出力画像6440が形成される。拡張された
レベル2の出力画像中の空のピクセル位置は、レベル3の出力画像6420の拡張に
関して先に説明した方法と同様な方法で満たされる。レベル1の補正画像6442は
、好ましい実施例では、拡張されたレベル2の出力画像6440であるレベル1の基
準画像の各ピクセル値をレベル1の選択された画像6404中の各対応するピクセル
の値から減算することによって形成される。好ましい実施例では、−128乃至+1
27の範囲内にある符号の付された差分値Dであるレベル1の補正画像6442中の各
ピクセル値は6444で量子化されてレベル1の量子化された補正画像6446が形成さ
れ、これは以下に説明するように6448でコード化される。
レベル1の出力画像6450は、レベル1の量子化された補正画像6446中の各ピク
セルの符号の付された差分値Dを拡張されたレベル2の出力画像6440中の対応す
る各ピクセル値に算術的に加算することによって形成される。
レベル1の出力画像6450は拡張されて6454で出力画像が生成される。拡張された
レベル1の出力画像の空のピクセル位置は、レベル3の出力画像6420の拡張に関
して先に説明したようにして満たされる。全解像度のレベル0の補正画像6456は
、好ましい実施例では拡張されたレベル1の出力画像6454である全解像度レベル
0の基準画像中の各ピクセルの値をレベル0の選択された画像6402中の各対応す
るピクセルの値から減算することによって形成される。レベル0の補正画像6456
中の各ピクセルの値は、同様に、好ましい実施例では、−128から+127の範囲内
の符号が付された差分値Dであり、6458で量子化されて次に説明するように6462
でコード化されたレベル0の量子化された補正画像6460が生成される。
上に述べたこの発明の好ましい実施例の説明では、各解像度レベルの量子化さ
れた補正画像は次に低い解像度レベルの拡張された出力画像を基礎としている。
しかしながら、特定の解像度レベルにおける量子化された補正画像は、2あるい
はそれ以上の低い解像度のレベルから拡張された出力画像を基礎とするものでも
よく、このようなものも本発明の範囲内に含まれるものである。例えば、レベル
3の出力画像をレベル1の解像度に拡張することもできる。次いで、レベル1の
補正画像は拡張されたレベル3の出力画像(この場合、レベル1の基準画像であ
る)中の各ピクセルの値をレベル1の選択された画像の各対応するピクセルの値
から減算することによって
形成される。
上述の説明では、全解像度補正画像が形成され、量子化され、コード化される
が、全解像度におけるこのような画像処理は高解像度の結果を得るうえで必要で
はないし、好ましいものでもない。従って、この発明の他の好ましい実施例では
、全解像度よりも低い解像度のレベルで処理が行われる。例えば、全解像度基準
画像を形成するためのレベル1の画像は形成されず、また拡張されない。また、
全解像度量子化補正画像を形成するためのレベル0の補正画像は形成されないし
、量子化も行われず、最終画像は次のようにして得られる。また、この別の好ま
しい実施例では、選択された画像は全解像度よりも低い解像度の2つのレベルに
のみ分解される。すなわち、全解像度のレベル0の選択された画像はレベル1の
選択された画像6404とレベル2の選択された画像6406とに分解される。その結果
、レベル2はこの実施例では最も低いレベルである。従って、レベル2の基準画
像は、先にレベル3の基準画像6412について述べたようにすべて同じ値をもった
ピクセルのアレイからなる。
異なった解像度レベルの量子化補正画像は次のようにしてコード化される。各
レベルに対する量子化された補正画像は、ナルおよび非ナル領域にグループ分け
されたm×nのピクセルに分けられる。好ましい実施例では、m=8、n=8で
ある。ナル領域は全ピクセル値がゼロに量子化された領域である。非ナル領域で
は、少なくと
も1個のピクセルが非ゼロの量子化された値をもっている。非ナル領域は、コー
ド形式、例えば、クワッド(quad)、ダイアド(dyad)あるいはDPC
Mのような形式の好ましくはベクトル量子化コードを使用してコード化される。
特定の領域に対しては、これらのコード形式のあるものが好ましい。これは同じ
数のコード化ビットに対してより良好な質の画像を得ることができるからである
。ベクトルは1あるいはそれ以上のピクセル値を表わし、1つは特別な場合であ
る。例えば、モナド(monads)、ダイアド、クワッドは、それぞれ1、2
、4ピクセルのベクトルを表わす。ベクトルは直接適用することもできるし、空
間予測を採用することもできる。例えば、DOCMはモナド用として使用するこ
とができ、この場合は、各モナドは直前のモナドによって予測される。この点に
関して、DPCMはモナドを使用した形式のベクトル量子化コードの特別な事例
と考えられる。
各レベルに対する量子化補正画像は線形フィルおよび非ナル領域に分割され、
このようなものも本発明の範囲内に含まれる。領域がこのように分割される場合
は、ナル領域は線形フィルの特別な事例であると考えられる。静止画像のコード
化については当技術分野で周知の他の技法を使用することができ、例えば、離散
コサイン変換(DCT)技法を使用することができ、このようなものも本発明の
範囲内に含まれることは云うまでもない。好
ましい実施例では、使用されるコードの形式は、ビットスロリーム中で明確に説
明されている。従って、デコーダはビットストリーム中のコードを読み取ること
によっで解像度の各レベルに関して使用されるコードの形式を認識する。これに
よってあらゆる解像度レベルをコード化するのに任意の適当な形式のコードを使
用することが可能になる。
好ましい実施例では、レベル3の最低レベルの解像度をもった量子化された出
力画像は上述のような一般的なコード化処理の特別な場合としてコード化される
。すなわち、全体がレベル3の量子化された補正画像は、予め設定されたコード
形式を使用してコード化された非ナル領域として処理される。好ましい実施例で
は、予め設定されたコード形式は本明細書中で詳細に説明されているDPCMで
ある。しかしながら、最低解像度レベルの量子化された補正画像は、より高い解
像度の量子化された補正画像レベルに関して後程説明するようにナルと非ナルと
に分割することができ、これも当然本発明の範囲に含まれるものである。また、
DPCMのようなコード形式を予め設定する代わりに、本発明の別の実施例では
、DPCM、ダイアド、クワッドのような異なるベクトル量子化コード形式を使
用し、その状況下で最適の形式のコードを適宜決定して各非ナル領域をコード化
し、最終的に採用されたコード化形式を識別するためのコードを伝送する。
好ましい実施例では、8×8のピクセルのブロックは、好ましくは本明細書中
で詳細に説明されているコード化技法と同様な2進トリーコード化技法を使用し
てナル領域と非ナル領域とにグループ分けされる。大きな相違点は、2進トリー
コード化技法では量子化された補正画像を採用しており、画像はナル領域中のピ
クセルの数を最大にし、生成された領域の全体の数を最小にするような態様で画
像を分割するという点である。好ましい実施例では、分割は8×8のピクセルの
ブロックの境界に沿っでのみ行われ、ブロックを貫通して分割することはできな
い。その結果、1あるいはそれ以上の非ナルピクセルは非ナル領域全体にわたっ
て存在する。2進トリーコード化が好ましいが、クワッドトリー分解のような他
の領域形成方法も使用することができ、このような方法も本願発明の範囲に含ま
れることは云うまでもない。
第65図に示された例では、画像は各種の寸法の7個のナル(N)と非ナル(N
N)とに分割されている。各ナル領域Nは全てのピクセル値がゼロに量子化され
たピクセルブロックのみを含んでいる。各非ナル領域NNは、非ゼロの量子化さ
れた値をもった少なくとも1個のピクセルが存在する少なくとも1個のピクセル
ブロックを含んでいる。
この例の目的のために、全解像度画像は水平方向に256個のピクセル×垂直方
向に240個のピクセルのアレイからなると仮定する。領域6502は幅が128個のピク
セ
ルと高さが120個のピクセルの長方形である。領域6502の左上隅のピクセルは位
置0、0を占めている。領域6504は幅が128個のピクセルと高さが64個のピクセ
ルの長方形である。領域6504の左上隅の位置は128、0である。領域6506は幅が6
4個のピクセル、高さが56個のピクセルの長方形で、この領域6506の左上隅のピ
クセルはピクセル位置128、64を占めている。領域6508は幅が64個のピクセルと
高さが56個のピクセルの長方形で、この領域6508の左上隅のピクセルはピクセル
位置192、64にある。領域6510は幅が64個のピクセルと高さが120個のピクセルの
長方形で、この領域6510の左上隅のピクセルはピクセル位置0、120にある。領
域6512は幅が64個のピクセルと高さが120個のピクセルの長方形で、この領域651
2の左上隅のピクセルはピクセル位置64、120にある。領域6514は幅が128個のピ
クセルと高さが120個のピクセルの長方形で、この領域6514の左上隅のピクセル
はピクセル位置128、120にある。
このような8の倍数でない寸法をもったピクセルアレイに対しては、下および
/または右境界に沿う8×8のピクセルブロックは好ましい実施例では切断され
てしまう。例えば、第65図に示されたアレイがルミナンス成分に対するピクセル
値のアレイであると仮定すると、サブサンプルされたUおよびV成分に対するア
レイは好ましい実施例では4のサブサンプリング係数を仮定すると、64×60であ
る。すなわち、UおよびVの各成分はそのア
レイ中にルミナンス成分のアレイの1/16のピクセルをもっている。60個のピク
セルの垂直方向のアレイの寸法ば8の制数倍でないので、UおよびV成分アレイ
の各々のピクセルブロックの下側行は8×4の各ピクセルに切断される。
好ましい実施例では、領域のテーブルは、その領域の左上隅のピクセルの垂直
方向の位置、水平方向の位置、その領域の高さ、その領域の幅、その領域がナル
Nの領域か非ナルNNの領域か、さらに非ナル領域に対して採用されたコードの
形式によって各領域を識別するような形に形成されている。この領域テーブルの
情報は2進トリーを使ってコード化され、ビットストリーム中に挿入される。第
65図に示された領域を識別する領域テーブルの例が第66図に示されている。領域
6502は、第66図のテーブルでは、左上のピクセルの位置が0、0、幅が128個、
高さが120個、およびこれがナル領域(N)であるとして示されている。領域650
6については、これが非ナル領域であることからさらにコード化形式が入力指示
DPCMを含んでいる。他の領域も第66図に示されたテーブルで識別されている
。第66図に示された領域テーブルの左側の列はこの詳細な説明のためにのみ使用
されるもので、本発明に従って形成された領域テーブルの部分ではない。ナル領
域のピクセルはすべてゼロに量子化されでいるから、ナル領域のピクセル値は言
外に含まれている。すなわち、デコーダはナル領域中の各ピクセル位置
に対して自動的にゼロの値を与える。各解像度レベルの非ナル領域は適当なコー
ド形式を使用してコード化される。
前述のように、レベル3の補正画像全体は単一の非ナル領域として取り扱われ
、本明細書中で詳細に説明されでいるDPCMコード化技法を用いてコード化さ
れる。より高い解像度の量子化された補正画像の非ナル領域は適当なコード形式
を使用してコード化される。好ましい実施例では、最低レベルと全解像度の中間
の解像度レベルの量子化された補正画像の各非ナル領域は同様に本明細書中で詳
細に説明されている好ましくはダイアドコード形式と同じコード形式を用いてコ
ード化される。
全解像度レベルのゼロに量子化された補正画像の非ナル領域は他のコード化形
式、好ましくはクワッドを使用してコード化される。クワッドコード化技法はこ
こで詳細に説明されているダイアドコード化技法と同様で、基本的な差は各クワ
ッド指示番号が2ではなく4のピクセル値を示すという点である。各4のピクセ
ル値の組とそれに関連するクワッド指示番号はクワッドテーブルにリストアップ
されている。クワッドテーブルはデジタル・ビデオ・データ・ストリーム中に挿
入される。本発明の好ましい実施例では、最低解像度レベル、全解像度レベル、
最低解像度レベルと全解像度レベルの中間の解像度レベルに対して別々のコード
形式が適用されているが、全ての解像度レベルに対して同じコード形式を適用し
て
もよいし、異なる解像度レベルに対して異なるコード形式、あるいは各解像度レ
ベル中の異なる領域に対して異なるコード形式を適用してもよく、これらの変形
例はすベて本発明に含まれることは云うまでもない。
第39図〜第43図は第16図のフレーム内コーダ1620の動作を詳細に説明するもの
である。前述のように、フレーム内コード化は、典型的な動きビデオシーケンス
中のフレーム間に存在する相関性あるいは冗長性の効果を得るために動きビデオ
シーケンスの第2あるいは後続するフレームに対して使用される。先行するフレ
ームの領域がそのときのフレームでコード化された領域にかなりの精度で対応し
ているということが判れば、フレーム内コーダ1610で行われた絶対値ではなく差
分のみをコード化すればよいという点で有効である。前述のように、フレーム内
コード化は、差分値はより少数のビットでコード化することができる小さい数に
なる傾向があるという点で有利である。場面内でパン(カメラを上下左右に動か
すこと)したり対象物が動くことにより領域が移動すると、さらに別のコード、
すなわちオフセット値X0、Y0が必要になる。オフセット値X0、Y0は、移動す
る対象物がそのときのフレームと先行するフレームとの間で垂直方向、垂直方向
に変換される量を表している。
第40図は動き効果を示す図である。同図で実線4004はそのときのフレームの特
定の領域を示す。領域4002は領域4004中の情報に対応する画像情報を含む先行す
るフレ
ームの領域を示す。対応する領域4002に対して領域4004はX0方向、Y0方向に移
動している。全体としてコーダ1620の1つの仕事は領域4004(以下ではターゲッ
ト領域と称す)を、領域4004と4002との間の差分を表わす双1次多項式Ax+B
y+Cとしてコード化することである。領域X0とY0の位置の差分(以下ではオ
フセットと称す)もまたコード化されて、デコーダを付勢して先行する画像の位
置設定を行い、その差分を上記先行する画像の位置に加えてターゲット画像を再
構成する。この形式のコード化を、以下ではコーダ1610の“絶対”線形フィルコ
ード化と区別するために“相対”線形フィルコード化と称す。コーダ1620は上記
の他にそのときのフレーム中のターゲット画像に対応する先行するフレーム中の
位置決め領域“C”に対する高速サーチルーチンを与え、もし適当な先行領域が
発見されなければ、代替デフォルトコード化を与えるという他の機能をもってい
る。
第39図はコーダ1620によって実行されるフレーム内コード化処理の各ステップ
を詳細に示すフローチャートである。この“ソフトウエア”の実行は現在のとこ
ろ好ましいものである。個々の処理機能はフローチャートに示す機能を与える個
々の装置の素子によって容易に実行されることは明らかである。フレーム内コー
ド化は、第16図のモードスイッチ240’を押して下側の位置に切り換えることに
よってスタート3902で開始され、動きビデオシーケンスの第2のフレームのコー
ド化を開始する。ス
イッチ240’は以前はフレーム内コーダ1610を使用して第1フレームをコード化
するための上側位置にあったので、先行フレームは既にコード化されて第2図の
バッファ記憶器232に記憶されており、またコード化されるべきそのときのフレ
ームと比較するために非コード化形式で記憶されている。
フレーム内コード化はY、I、Qサブフレームについて各別に行われる。フレ
ーム内コード化が開始された後、次のステップ3904でターゲット(T)および対
応する(C)先行領域の選択が行われる。ターゲット画像は、正確に同じ寸法で
且つ最初そのターゲット領域と同じ先行するフレーム中の正確に同じ位置(X、
Y座標)にあるべき対応する領域を選択することによって対応する領域の選択を
制御する。以下に説明するように、次いでフレーム毎の動きを補償するためにタ
ーゲット領域の座標の近くでサーチが実行される。
ターゲット領域は静止フレームの“絶対”フィルコード化のための領域選択と
同様に選択される。最初は全画像領域がターゲット領域として選択される。もし
この領域が充分にコード化されなければ、これはコード化のために次いで試験さ
れるサブ領域に分割される。
一旦ターゲット領域が選択されると、そのときの領域が全画像か、分割動作に
よって領域リスト(3904)に置かれた領域の1つかには関係なく、その後の処理
は同じである。ステップ3908での処理のために領域が利用でき
れば、この領域についてすでに動きの補償が行われたか否か決定するためにステ
ップ3910で試験される。もし動き補償が完了しておれば、この処理を繰り返す必
要はなく、処理ステップは直接ステップ3930にスキップする。後程動き補償につ
いて説明するように、ステップ3928において“T”領域と“C”領域の“相対”
変位を表わすコードが発生される。このコードは、所定の領域および分割によっ
て後程それから引き出されたサブ領域について1回だけコードストーム中に含め
られる。これによってコード化ビットストリームの寸法を減少させるのを助ける
。このことは2進トリーの分解に関する多くの効果のうちの1つである。
ステップ3910で動き補償がまだ行われていないと決定されると、ステップ3920
における動き補償処理が開始される。
簡単に云えば、ステップ3920における処理はその時のフレームのターゲット“
T”に最もよく整合した先行フレームをサーチすることからなる。もし動きがな
ければ、領域CおよびTは同じ座標にある。もし動きがあると、領域Cは領域T
に対してX0、Y0の大きさだけオフセットあるいは移動している。ターゲット領
域の対応するピクセル値と移動した“C”に対する最良の選択との間の平均2乗
差分(MSD)が計算される。MSDの値はステップ3922において第2図の閾値
制御ユニット238から入力された閾値と比較され、この比較の結果、移動し
た領域に対するこの最良の選択がターゲット領域に対して満足できる整合を与え
ることができなければ、ステップ3924でターゲット領域は最小寸法に対してチェ
ックされる。ターゲット領域が最小寸法よりも大であれば、これはステップ3926
で分割されて分割領域に関して動き補償が行われる。ターゲット画像に対する整
合性が満足できる移動領域が発見される(すなわち、ステップ3922における試験
をパスする)か、ターゲット領域が最小であれば、ステップ3928でX0、Y0の変
位がコード化されて領域指示コードに領域オフセットを与える。ステップ3924を
経てステップ3928に到達し、またステップ3922における試験で満足されなければ
、変位領域はターゲット領域を正確に示していないということになる。このよう
な状況は、カメラをパンし、従って先行ピクセルが存在しないときに生ずる。第
39図における後続する処理により、おそらく“絶対”DPCMを経て最良の領域
を表わす。
次に第40図、第41図、第42図、第43図を参照して動き補償について詳細に説明
する。ステップ3920における動き補償の目的はターゲット領域に最も近似した領
域“C”のオフセットすなわち変位を決定することである。第42図に示す処理は
適合性の程度を表わす測定値を最小にする変位をサーチすることに関し、名目上
は2つの領“C”のオフセットすなわち変位を決定することである。第42図に示
す処理は適合性の程度を表わす測定値を最小
にする変位をサーチすることに関し、名目上は2つの領域間の平均2乗差(MS
D)を適合性の程度を表わす目安として使用する。特定のターゲット領域が大き
な数のピクセル値を含む可能性があり、このためMSDの数値決定に非常に長時
間を要する。そこで、もし平均2乗差分がピクセルの適当に選択された部分集合
についてのみ計算されれば、この計算を行なうのに要する時間は最終結果に大き
な影響を与えることなく大幅に短縮することができる。
第42図における第1のステップは、ステップ4210におけるMSD計算用の代表
ピクセル群を決定することである。ランダムであるが領域全体にわたって一様に
分布しているピクセルをピックアップするというやりかたは有効であることが証
明されている。部分集合中に必要な代表ピクセルの数は大雑把にいって領域の面
積の平方根に依存している。さらに正確にいえば、必要な数は式K!Aで決定さ
れる。ここでKは閾値制御ユニット238を介して導入されるパラメータであり、
通常約10である。また、Aは領域の面積を表わす。代表ピクセルが領域全体を通
じて一様に分布していることを保証刷るために、領賊はK!Aの等しい寸法のサ
ブ領域て構成されており、ピクセルはこれらのサブ領域の各々からランダムに選
択されると仮定する。
次に“T”および“C”領域に対して簡単な低域通過フィルタによる濾波処理
が施される。このような低域通
過フイルタ4204はランダムな効果に対する影響の小さい代表ピクセルを利用して
いる。この濾波処理動作は動き補償に対してのみ行われ、濾波された領域はその
領域の後続する処理の前に棄てられる。
サーチの第1段階ではサーチの解像度を1ピクセルに設定することによって開
始される(4220)。より大きな解像度のためにはターゲット領域と対応する“C
”領域との間の変位を知ることが望ましいが、1ピクセル解像度で開始すること
は2つの利点がある。第1の利点は、短い時間でMSDの値を求めることにより
大きな変換を行うことができるという点である。第2の利点は、MSDに対する
計算時間が早くなるという点である。ピクセルの分数変位に対するMSDの計算
にはピクセル相互間の補間のための付加ステップを必要とするから後者のMSD
の計算時間が早くなることは真である。
MSDの次の試験的数値決定が開始点4230から8個の異なる方向に行われる。
これらの8個の可能な方向が第41図に示されている。MSDで最大の減少を与え
る方向が追跡される。実際には最適方向を選択するのに8個のMSDの計算を行
なう必要はない。アルゴリズムは、開始点の近傍ではMSDはほぼ直線関数であ
ると仮定している。従って、もし方向Kが減少すれば、方向Rは増大することが
期待され、そのMSDの数値は決定されない。同様にU方向に減少すれば、D方
向の数値決定は抑制される。最後に1つの斜め方向の評価のみが必要になり、
先ず最善の水平方向、垂直方向が決定され、次いでそれらの間の斜め方向が試験
される。このやり方はしばしば大体正しい方向を示す。さらに、たとえ誤った方
向を示しても、プロセスにおける他のステップで最終的には適切な方向のサーチ
を示すことができる。
通常、これらの色々な方向が試験され、他の方向よりもMSDを減少させる方
向が発見される。このような方同が存在すると、局部最小値試験(4240)はNO
で、ステップ4260のサーチヘ進む。この点で、“C”領域が、ステップ4230で最
小のMSDを生成する方向に沿ってのみ試験される。試験領域は、MSDが減少
しつづける限り選択された方向で1ピクセル解像度で検査される。このプロセス
は第41図で2重矢印で示されている。変換処理によりMSDがさらに減少するこ
とがなければ、ステップ4230は新しいサーチの方向を発見するために繰り返され
る。この処理はMSDがさらに減少することがなくなるまで繰り返される。そこ
で解像度は1/8ピクセル(4240、4250、4270)に向上し、再びMSDがさらに
減少するのが停止するまでこのより高い解像度でのサーチプロセスが繰り返され
、X0、Y0の値が可能な次のコード化3928のために記憶されて終了する。
“C”領域におけるピクセル値は1つの全ピクセル解像度でのみ使用可能であ
る。例えば、1/8解像度で“C”フレームの領域サーチすることは、もしピク
セル値が1/8のピクセル間隔の解像度で利用できる場合に
おいてのみ意味がある。これらのピクセル値は1/8ピクセルの増分で値を生成
するために補間によって発生される。これらの値を生成するために使用すること
ができる補間アルゴリズムとしては、1次補間、2次補間、3次補間等、多数の
補間アルゴリズムがある。
第43図は、動き補償を行なうプロセスおよび“相対”コード化をさらに説明し
ており、またそれによって得られる実質的なデータ減少を説明している。この例
では、左行するフレームのC領域4304は一様な明るさ(5ユニット)であると仮
定している。領域4302は、ピクセル当たりの水平方向、垂直方向の勾配が−1、
+1であることを除けば同様である。減算処理(4306)により、コード化するの
に比較的小さい値のピクセルをもった差分Iで表される画像4308が得られる。図
示のように、コードは明るさ(C)と、勾配(A、B)と、領域オフセットコー
ドX0、Y0からなる。
ターゲット領域に対する動き補償が完了すると、処理はステップ3930で継続し
て行われる。ステップ3930はターゲット領域に関して行われるコード化の形式を
決定する。先ず、ターゲット領域と選択された“C”領域の対応するピクセル値
の差分からなる領域が発生される(第43図)。この発生された領域内における差
分値が閾値、典型的には30よりも大であれば、このターゲット領域は“相対”コ
ード化としてクラス分けされ、また“相対”コード化用に選択される。“相対”
コード化を採用した
ことによる効果は、より小さいコードの値fをもった大きな領域が得られ、それ
によってより小さいコード寸法が得られ、コード化時間が短縮されるという点で
ある。この場合、ステップ3930は“相対”(REL)と記された決定パスに出力
を発生する。
第39図に戻って、発生された領域に閾値よりも大きな差分値が存在すると、タ
ーゲット領域は“相対”としてはクラス分けされない。しかしながら、その部分
は“相対”コード化によってうまくよく処理されると考えられる。ここではステ
ップ3930は試験的分割を行い、得られた2個のサブ領域を試験する。この試験的
分割は単純分割(第35A図)を使用している。これらのサブ領域が閾値条件を満
足すると、ステップ3930はMIXEDと記された決定パスを経て分割ステップ39
38に供給される出力を発生し、それによって寸法が半分の2個の領域が別々に処
理される。ステップ3930における分割処理もまた単純な分割である。
ステップ3938における分割処理の前に最小寸法試験(3936)が行われる。ステ
ップ3938における分割によって領域を最小寸法以下に減少させると、最小寸法試
験(3936)はそのターゲット領域を“絶対”としてクラス分けする。これはコー
ドの寸法、復号時間の双方にとって非能率的な非常に小さい平坦なフィル領域が
発生するのを防止することができる。
試験分割領域のいずれの半分も“相対”として明確に
クラス分けすることができるサブ領域を生成しない可能性がある。その場合は試
験的分割は各サブ領域について実行される(3930)。この処理は2つの事象のう
ちの一方が発生するまで継続される。サブ領域が明確に“相対”であることが発
見されると、ステップ3930はMIXED決定パスに出力を発生する。サブ領域が
発見されなければ、生成された領域が最小領域の寸法試験が行われなくなるまで
試験的分割が継続して行われる。もしこのような事態、すなわち最小寸法よりも
大きな試験的サブ領域が発見されなければ、従って明確に“相対”であることが
発見されなければ、ターゲットは“絶対”としてクラス分けされ、ステップ3930
は“絶対”決定パスABSを経てステップ3934へ出力を供給する。
もしMIXEDパスに出力が発生すると、領域はステップ3938で分割される。
これらの各サブ領域は最終的にはステップ3930で再び処理される。MIXED出
力に出力を発生する理由は“相対”としてクラス分けされる試験領域が存在した
ということであるので、ステップ3938における分割は最終的にはその領域を生成
する。
その領域が一旦クラス分けされると、それはステップ3932およびステップ3934で
“相対”フラグ、“絶対”フラグによって識別され、後続するステップ3952およ
びステップ3968におけるフィル処理で使用される。
“相対”領域は、ステップ3928におけるX0、Y0オフセット値のコード化の後
で、ステップ3930における領
域クラス分けの前にステップ3929で低域通過濾波される。この点における低域通
過濾波により、大きな領域が“相対”としてクラス分けされ、それによってコー
ドの寸法を小さくする可能性が増大し且つ復号時間を増大するような異常な細分
化が防止される。領域が、“絶対”領域の寸法を増大する傾向のあるクラス分け
された絶対値である場合も、ターゲット画像は濾波される。この点に関しては、
付加非線形フィルタが非常に有効であることが判った。目はコード化された差分
値と“C”領域のピクセル値との和を見ているので、目は差分値領域中の細部の
消失に対しては感度が低い。従って、人間の視覚系に基づいて濾波に対する重み
付けをすることは極めて有効である。人間の目は、差分画像の一部のエラーに対
する感度は他の部分に対する感度よりも低い理由は2つあり、これらの2つの理
由は共にピクセル毎を基準とした濾波の領域を決定するために使用される。第1
に、ターゲット領域が明るい差分領域の部分はターゲット領域が暗い部分よりも
強く濾波され。第2に、ターゲット領域が“多忙(busy)”すなわち細かい差分
領域の部分はターゲット領域が比較的滑らかな部分よりも強く濾波される。すな
わち、ターゲット領域がゆっくりと変化すると、その差分領域のエラーは、ター
ゲット領域の細部が失われている場合よりも視覚的に遙に明確になる。ある点に
おける多忙さの程度は隣接ピクセル値を減算することによって推測され、それに
よって局部的勾配の測定値が得ら
れる。上述の点から明るい画像および/また多忙な画像に対するダンピング係数
Dを大きくするために、第36A図のデコーダ3624を修正することもできる。
次の処理ステップは、平坦な表面:Ax+By+Cによってその領域を試み、
表すことである。ステップ3930がその領域を“相対”あるいは“絶対”のいずれ
でクラス分けされているかによってステップ3952は差分領域あるいはターゲット
領域のいずれかに対して適用される。この処理は本質的には第17図の1706〜1716
について先に説明した処理と同じである。
その領域がステップ3942における粗さ閾値試験を受けなければ、その領域は最
小寸法ステップ3964で試験される。その領域が最小寸法よりも大であると、ステ
ップ3966で分割処理を受け、新しいターゲット領域が選択ステップ3904用に発生
される。逆にその領域の寸法が閾値以下てあれば、その領域が“絶対”としてあ
るいは“相対”としてのいずれでクラス分けされているかによって2つの技法の
うちの一方が続けられる。“絶対”領域に対しては、その領域のステップ3970に
おけるDPCMコード化が実行され、これは前述のフレーム内コード化で使用さ
れる技法と実質的に同じである。
“相対”領域に対しては、ダイアドコード化と称される別の技法が実行される
。この技法はほぼ平坦であるが、手坦な表面として適正にコード化されるのを阻
止する2、3の例外的なピクセルをもった領域に対して最適である。
ダイアドコード化については第61図を参照して次に説明する。第61図はターゲッ
ト領域6110の8個のピクセルの代表領域と、先行フレームの最も良く整合した対
応する領域6120とを示す。エンコーダは、1対の値R、Sを対応するピクセルC1
、D1にそれぞれ加えることによってターゲット画像ピクセルA1、B1を発生す
る。1対の値R、Sをここではダイアドと称す。デコーダはデータストリームか
らのコード値を使用することによってダイアド・メモリ・テーブル中の1対の値
R、Sを見つけて、ダイアド・メモリに供給するためのアドレス値を発生する。
第62図はダイアド(dyad)コード化処理を示す。11個のダイアド点(黒点
)がRS座標系の対角線上にプロットされている。ダイアド点の座標は閾値制御
器238によって圧縮器230に入力される。ダイアド点はK1〜K11の番号が付されて
おり、差の値R、Sの対をコード化するために用いられるのはダイアド番号(そ
の座標値ではなく)である。これは実際のピクセルの差分の値をRS平面内の点
(P)としてプロットし、コード番号として最も近いダイアド点Kを選択するこ
とにより行うことができる。一例として、第61図において、ピクセルA1とB1が
コード化されるものとする。初めに、前のフィールドのC1がA1から減算されて
値R1が得られる。次いでD1がB1から減じられて差分の値S1が得られる。説明
の目的で、R1=10、S1=13とする。こ
れらの値は第62図において点P(10,13)の座標として用いられ、RS平面にプ
ロットされる。図示のように、点P(10,13)に最も近いダイアドは、座標R=
14、S=14のダイアド#K6である。従って、領域6110(第61図)のA1B1をダ
イアド指示子K6を伝送することによってコード化することができる。(K6の
テーブル・ルックアップによって)復号されると、A1とB1ピクセルは元の値よ
りも幾らか明るくなるだけである。即ち、ピクセルA1の真の値はC1+10であり
、ピクセルB1の真の値はD1+13である。ダイアドK6を用いると、復号された
値は、ピクセル対A1B1の真の値に非常に近いC1+14とD1+14となる。
優れたダイアド復号画像は、前述のダイアド選択法を改変することにより得ら
れることが分かった。例示したものでは、ダイアドK6は、復号されると、「真
の」差分が伝送された場合よりも幾らか明るいピクセル対A1B1を与えるように
見える。真のピクセル差よりも小さな差を生じるダイアドを選択するほうが、復
号画像を「過補償」即ちピーキングするようなもの(K6のような)を選択する
よりも視覚的に目立ちにくい。従って、前述の例では、ピクセル対Pのコード化
にはK6を選ぶよりもダイアドK5を選ぶほうが、この例ではコード化エラーは
明らかに幾らか大きくなるが、良い。より小さなダイアドを選択する別の理由は
、それによってダイアド周波数分布がより小さな値に向けてスキューし、それ
によって、可変長エンコーダ1640の使用が可能となるためである。
第62図に示すダイアド領域特定コード化の別の特徴は、ダイアドK1−K11が
ピクセル差RS平面の左右の対角線に沿って等間隔とされていないことである。
即ち、原点近くのダイアドの相互間隔は、原点から離れたダイアド相互間の間隔
よりも小さい。その効果は、小さいピクセル対差(R,S)のコード化に対し、
より多くのダイアドが利用でき、従って、差A−C及びB−Dが小さくなれば、
それだけコード化の精度が改善されることである。このことは、人の目というの
は、ダイアドの値が小さい時のダイアド値のエラーに、より敏感であるためであ
る。
ダイアドコード化の正確さはダイアドK1の数を増すことによって高くするこ
とができることは明らかである。例えば、ダイアドは図示の45°に沿う対角線の
代わりに、2本の対角線(例えば、30°及び60°)に沿って決めてもよい。一般
に、多数のダイアドテーブルが利用可能であり、領域データに最もよく適合する
テーブルが選ばれる。使用する特定のテーブルは、コード化されたデータの一部
として示される。
要約すると、ステップ3904はステップ3960、3970あるいは3980でコード化する
ための領域を提供する。その領域がコード化されない場合には、その領域は3926
、3938あるいは3966で分割(split)され、分離されたサブ領域
がコード化される。最終的には、最小サイズテスト(3924)、(3936)及び(39
64)は全ての領域が強制的にコード化されるようにする。
全ての領域がコード化されると、全領域がコード化された状態が検出される(
3908)。次いで、処理は再併合(remerge)動作(3990)に移る。この再併合処理
は、その画像の全領域に対して生成されたコード化を検査し、可能であれば、隣
接するクワッド(quad)コード化された領域、隣接するダイアドコード化領域、及
び隣接するDPCMコード化領域を併合させる。このプロセスは第17図のステップ17
20に関して論じた再併合動作と同様である。
再併合(3990)の後、このプロセスはシーケンス中の更に別のフレームについ
てチェックを行う(3982)。それ以上フレームがない場合は、シーケンス中の全
フレームが圧縮されたこととなり、第39図のプロセスから出る(3998)。まだフ
レームがある場合は、次のフレームが圧縮のために用意され(3984)、プロセス
が繰り返される。
第16図に返って、フレーム内及びフレーム間コード化後の次の圧縮にはコード
化された信号S12とS13を面積依存適応型量子化器1630に供給することが含まれ
る。前述したように、この量子化器はコード化されたデータを領域の面積の関数
として量子化する。この量子化器は、Ax+By+C線形フィル(fill)の係数”
C”のみに適用される。係数AとBは典型的には1より小さいので、
これらの係数の面積依存量子化は不要であることが分かった。大きい領域の平均
明るさ”C”は正規には全8ビットで表される。もっと小さい領域はより少ない
ビット、従ってより短いコードワードを用いて逐次量子化される。
第44図は領域の大きさと領域フィル値を表すために用いられるビット数をリス
トしたテーブルである。32ピクセル以上の領域については、8ビットが用いられ
、それによって、256の明るさレベルからなる微細な解像度が得られる。16乃至3
1ピクセルの領域に対しては、7ビットで128レベルの解像度が与えられる。面積
が2分の1になる度に、1ビットずつ少なくされる。1ピクセル領域は3ビット
に量子化され、18の明るさレベルという粗い解像度が与えられる。
前述のことから、1ピクセル領域の各々について、5ビット、各2ピクセル領
域について4ビット、・・・が節約されることがわかる。面積依存適応型量子化
は、全ての領域フィル値に対して全解像度値(8ビットのバイト)を割り当てる
場合に比して、更にデータの減縮が可能である。更に、可変量子化が視覚的に見
て許容可能であることが分かった。それは、可視性がより高い大きな領域が細か
く量子化され、それによって全体として高解像度に見えるためである。より小さ
い粗く量子化された領域は、言うなれば、大きな高解像度領域の存在によって心
理−視覚的にマスクされる。
第45図は第44図の面積依存量子化の実施をフローチャ
ートで示す。このプロセスは領域データメモリからある領域についての高さと幅
のデータを取り(4502)、領域の面積を計算する4506ことによって開始される。
領域の面積(4506)は面積テスト4508と4512-4518によってテストされ対応する
量子化器が選択され4520-4528、領域の「面積」が32ピクセルから減少するに伴
ってビット数が順次減少するようにされる。
第16図に戻って、記述されるべき圧縮器230の最後の要素は「ストリームセグ
メント化された」可変長コード1640と称するものを含む。ここで使用した「スト
リームセグメント化された」という語は各ビデオフレームに対し、複数の可変長
コードを使用することに関連して用いられている。ここで記述する例における各
単一の圧縮されたデジタルビデオフレームについて、最低18の異なる可変長コー
ドが生成される。
周知のように、可変長コードはより頻繁に生じるいイベントに対してはより短
いコードを割り当てることによってデータ減縮を行う。どの様な可変長コードで
も、単一では、別々に圧縮されたY、I及びQ画像を効果的にコード化すること
ができないことが分かった。これは、Y、I及びQサブフレームの各々の統計(
スタティスティックス)が異なるためである。更に、どの様な可変長コードでも
、単一では、サブフレームの別々のデータ要素を効果的にコード化することはで
きないことが分かった。従って、そのようなサブフレームの各セグメントに
は異なる可変長コードが用いられる。
総合してみると、6つの異なる可変長コードが単一のサブフレームを含む顕著
に異なるデータを記述するのに効果的であることが分かった。この理由で、各主
要データの範疇(カテゴリ)の統計(即ち、発生頻度)が各ビデオフレームスト
リームごとに計算される。サブフレームは3つ(Y、I、Q)あるので、最低18
の統計的復号化用「テーブル」が各ビデオストリーム中に含まれている。
第47図は1つのビデオストリームの圧縮されたサブフレームのデータフォーマ
ットの詳細を示す。圧縮されたビデオストリームのY、I及びQ部分に対し同一
のフォーマットが用いられている。
前述したように、「ヘッダ」セグメントは、サブフレームの形式(YかIかQ
か)、その大きさ(即ち、解像度)、0検査合計(0 check sum)、及びサブフ
レームの復号時に用いられる3つのテーブル(DPCM、ダイアド及びクワッド
)に対するポインタを含んでいる。データの残りのセグメントの復号に用いられ
る特定の可変長コードを記述するコードテーブルがヘッダに続く。効率化のため
に、これらのテーブル記述はそれ自体が暗黙の(即ち、エンコーダとデコーダに
よって合意がなされた)コードテーブルを用いてコード化されている。次のセク
ションは、「ビデオ圧縮処理」の項で既に説明したように、「動作(アクション
)」及び「値」を含む2進トリ
ー(木)記述を含んでいる。これに続いて「相対データ」セクションがあり、こ
れには全相対的双線形(bilinear)フィルに対する係数が含まれている。「絶対デ
ータ」セクションは絶対双線形フィルに対するA、B係数のみが含まれている。
C係数はトリー記述中に含まれている。次のセクションは全DPCM領域に対す
るDPCMデータ(1ピクセルにつき1つの値)を含んでいる。その後のセクシ
ョンは全ダイアド領域についての「ダイアド」データ(2ピクセルにつき1つの
値)を含んでおり、最後のセクションは全クワッド領域についての「クワッド」
データ(4ピクセルにつき1つの値)を含んでいる。最後の4つのセグメントの
各々の中のデータの順序は暗黙のもので、領域データは2進トリーの復号によっ
て領域が生成されるであろう順序に基づいて順序づけられており、ピクセルに基
づく値(DPCM、ダイアド及びクワッド)は通常のラスタ走査順序(頂部ライ
ンから底部ラインへ、及び各ライン中の左から右へ)で順序付けられている。
第46図は「ストリーム・セグメント化」可変長コーダ1640のブロック図である
。量子化器1630からの領域コード化され、量子化されたビデオ信号S14は図示
のようにメモリ1642に記憶される。選択スイッチ1644がクワッドフィルデータ、
ダイアドフィルデータ、DPCMフィルデータ、絶対(ABSOLUTE)フィルデータ
、相対(RELATIVE)フィルデータ、トリー(TREE)記述データ及びストリ
ームヘッダ(HEADER)データ(データ源1646)を可変長コーダ1650に供給するため
に選択する。コーダ1650は、より頻繁に生起するデータコードワードに対して最
も短いコードを割り当てて、種々のタイプのデータをコード化し、記憶装置1654
に可変長コード化されたデータを記憶する。マルチプレクス・スイッチ1644は第
47図に示す順序で記憶データを選択して、バッファ記憶装置232に供給するため
の圧縮されたデジタルビデオ出力信号S9を形成する。データ源1646によって供
給されるヘッダデータはマルチプレクス・スイッチ1656によって加えられる。
更に詳しく説明すると、可変長エンコーダ1650は他のデータ形式とは独立して
、各データ形式を検査し、サブフレーム全体にわたって各データ形式中のデータ
の統計を求める。例えば、データの各コードワードの生起の相対的な頻度が、デ
ータのセット中のコードワードの、例えば値の、範囲と共に確かめられる。この
情報を用いて、複数の可変長コードセットの中で、各データ形式を最も効率的に
可変長コード化できる1つが選択される。この複数のコードセットが素子1652に
記憶される。あるコードセットが選択されると、コーダ1650は選択されたコード
セットをスイッチ1644によって記憶装置1652から引き出し、対応するデータ形式
のコード化にとりかかる。
更に、今度は、その特定の可変長コードセットが、可変長コード化され、デー
タストリームに付加されて更な
るデータ減縮が行われる。しかし、この場合、可変長コード化は、予め定められ
た(暗黙)可変長コードセットを用いて行われる。これは、第46図においては、
低いスイッチ位置にある時に、記憶装置1652の出力を可変長エンコーダ1650に結
合するスイッチ1644によって行われる。
例えば、可変長エンコーディングは2パス処理であっで、コーダ1650が初めに
コード統計とデータ形式の各々に対する可変長コードセットとを生成する。第2
のパスでは、記憶装置1642中のそれぞれのデータ形式と統計記憶装置1652中のコ
ードセットが可変長コード化される。
ストリームセグメント化によって、圧縮されたビデオデータの復号時間が短縮
されるという重要な利点が得られる。これは、ストリームセグメント化は異なる
コードフォーマットの異なる統計に対処するために復号処理中に、可変長デコー
ダ(後述する)を再プログラムする回数を最少にすることによる結果である。即
ち、DPCMデータの全てを共にグループ化することにより、可変長デコーダは
、全DPCM領域の復号中に1度プログラムするだけでよい。これと同じ利点が
、第47図のトリーデータや他の可変長コード化データだけでなく、他のコードフ
ォーマット(相対、絶対、ダイアド及びクワッド)についても得られる。
事後圧縮処理
画像のシーケンスが圧縮されると、フォーマッタは全動きビデオの再生に備え
て更に処理を行う。この処理は
第13図に示されている。概略的に述べると、圧縮されたビデオデータS10は圧
縮されたオーディオデータS8及び任意の補助データS3と組合わされて、CD-R
OM18に記録するために調整されねばならない。
CD-ROMは、高記憶容量(100メガバイト以上)と比較的低い持続可能データ率
(CD-ROMでは1.23メガビット/秒)を持つクラスの装置の代表的なものとして示
されている。他の磁気記録媒体や光学的記録媒体も適している。
第8図及び第9図はオーディオデータS8がビデオデータS10と、更に、後
述する他のデータとインタリーブされる様子を示す。第8図は論理フレームを示
す。(形容詞である論理なる語は、論理フレームが、例えば24FPSの再生時に
は、1秒の1/30異なることを示唆する。)一般に、論理フレームは1つの画像が
表示される期間中に必要とされる全データのセットである。第8図は1つの画像
を構成するに充分なビデオデータと、その画像が表示される時に生成されるべき
充分なオーディオデータを持った論理フレームを示している。1つの論理フレー
ムの大きさは入力装置からの持続データ率(CD-R0Mの場合は、1.2288メガビット
/秒)と、画像再生率、普通は33.3666ミリ秒毎に1、によって決まる。従って
、30FPSの再生では、論理フレームの大きさは平均して5125.12バイトでなけ
ればならない。
第13図はこの平均の率をいかにして得るかを示す。これは3段階処理である。
第1段階では、データが幾つか
の源から捕獲(キャプチャ)され、インタリーブされたデータのストリームとし
てディスク1350に書込まれる。第2及び第3の段階では、このストリームが読出
され、ディザスイッチ1390を通して処理され、ディスクに再記録される。予備的
に概観すると、第1段階はデータを収集して、インタリーブされたオーディオ及
びビデオデータを含む単一のデータのストリームS4を生成するために必要な処
理の大部分を実施する。段階2と3は残りの問題の全てを処理し、特に重要なこ
ととして、過大サイズのフレームの可能性に対処する。
第1段階において、制御ユニット1310がオーディオディザラ(ディザ装置)13
60に指示して、スイッチ1320がこのユニット1310に結合される度に、オーディオ
データの特定された量を通過させるようにする。オーディオディザ1360は次の問
題に対処する。オーディオ再生システム32は、ある特定のかつ明確に限定された
率でビットを取り込む。オーディオの質が人の声程度のものである場合には、こ
れは31.25キロビット/秒にセットできる。CD-ROMプレーヤ22からの最高可能デ
ータ率を維持するためには、S16中のオーディオデータ率はこれに正確に適合
しなければならない。S16からのデータ率が低すぎると、データを待つために
音声処理器32は一時停止する。データ率が高すぎると、再生待ちのために、オー
ディオデータがホストコンピュータ28中に溜まってしまう。オーディオディザラ
1360は第8図のデジタル・オーディ
オ・データブロックの平均サイズが、次の関係によって与えられる適正なサイズ
となるようにする。
S・(D+1)/D・T=B
ここで、Bは1フレーム当たりのオーディオバイトの数であり、DはADPCM
リセット(例えば、ADPCMエンコーダは256サンプル毎に1度リセットされ
る)相互間のオーディオADPCMサンプルの数であり、Tはビデオフレーム率
の周期(ミリ秒)である。30FPSのフレーム率、31.25キロビット/秒のデー
タ率、256のリセット頻度、及び33.36ミリ秒のフレーム周期に対しては、Bの平
均値は130.847バイト/フレームに等しい。
オーディオディザラ1360は各論理フレームについて130または134バイトを通過
させる。(ブロックサイズはホスト・コンピュータ28中でのデータの動きの効率
を良くするために、4の倍数に丸められる。)この判断をするために、ディザラ
1360は、それまでに転送したバイトの数の移動平均(ランニング・アヴァレージ
)を維持する。この移動平均が130.847よりも低い時は、オーディオディザラ136
0は134バイトを通過させる。移動平均が130.847よりも大きい時は、オーディオ
ディザラは130バイトを通過させる。この特定の値130.847は制御素子1310から送
られ、希望の再生率及び再生オーディオビット率の関数である。
スイッチ1370は補助データの性質に応じて制御素子1310によって制御される。
動きビデオが再生される時に
は、ある補助データがなければならず、これは第1段階で処理される。補助デー
タの一例は、予め選択された時にオーディオの音量をフェードさせるためのホス
トコンピュータに対する埋め込まれた指令である。他の補助データは、第2段階
で信号ストリーム中に組み込むためにスイッチ1330によって通過させられる。そ
のような他の補助データはオーディオあるいはビデオ信号に対し厳密な時間関係
は持ってはおらず、従って、ビットストリーム中の便利な位置に、即ち、正規の
バイト数よりも少ないバイトを含んでいる符号化されたビデオフレームに含めら
れる。この補助データは、動きビデオシーケンスの再生の副次的効果として、ホ
ストコンピュータ28のメモリにロードすることができる。
段階1において、順次連続する論理フレームに対して、スイッチ1320は順次、
ビデオデータS10、オーディオディザラ1360の出力、及びスイッチ1370の出力
と切り換えられる。スイッチ1320は、論理フレーム中の個々のデータ部分の長さ
と位置(ポインタ)(第8図)を記述するヘッダデータ源1361の出力を選択する
。段階1では、論理フレームには「フィラ(filler)」(即ち、パディング)はな
い。更に、圧縮ビデオが異なるサイズを持っていることがあり、オーディオディ
ザリングが行われており、また補助データの量が1つの論理フレームと次の論理
フレームで異なっている可能性があるために、各論理フレームの長さは異なって
いる可能性がある。そのシー
ケンスの全論理フレームに対するデータはディスク記憶装置1350に書込まれ、段
階1が終わる。
段階1が完了すると、制御素子1310が段階2を開始させる。この段階では、段
階1で収集されたデータがディスク1350から逆に読出され、スイッチ1390がその
シーケンスの個々のフレームにパディングデータ、即ち付加的な補助データを挿
入するループ1351を介して再記録される。この処理は、先に「逆フレーム・シー
ケンス・リフォーマット」と呼んでいたものである。即ち、段階2において、シ
ステム、即ち、コンピュータは、最初に、最後のフレームを処理し、次いで最後
から2番目のフレーム等と処理する。段階2の目的は、論理フレームの平均サイ
ズが第9図に(30FPSビデオについて)示すように、5125.12と成るようにパディ
ングデータを生成することである。
先ず、最も単純な、過大サイズフレームが無い場合を考えてみる。この場合は
、制御ユニットは、それが見つけたオーディオ、ビデオ及び補助の各データの長
さを付加し、充分な数の0値のパディングバイトを挿入して、論理フレームのサ
イズを5124バイトまたは5128バイトまで上げる。ディザリングスイッチ1390に対
する制御論理は、オーディオディザラ1350のものと同様に働く。この制御論理は
それまでに生成された論理フレームのサイズの移動平均(running average)を維
持し、5125.12の平均を維持する5124または5128のいずれかを選択する。こ
の平均値の所要の大きさは、記録媒体のデータ率と、一秒当たりの画像で表した
所望の再生速度とに基づいて制御器1310によって設定される。
過大サイズフレームがなければパディング挿入は段階1で行うことができた筈
であるが、それを段階2で行う理由は、過大サイズのフレームをより良好に処理
するためである。第10図、第11図及び第12図は過大サイズのフレームの処理の背
後にある基本的原理を説明する。第10図は、ある論理フレームのシーケンスが段
階1の終わりで持つ可能性のあるサイズを示す。明らかに、フレーム3は5125.1
2バイトに入れるには大きすぎる。
第11図はこの問題に対する1つの可能な解決方法を示す。過大フレームが検出
されると、フォーマッタが閾値制御ユニット238に対し、過大サイズのフレーム
を防止するに充分に小さくなるように、そのフレームを充分に再圧縮するよう要
求する信号を送る。そのような再圧縮の結果が第11図に示されている。図を簡単
にするために、5125.12の論理フレームサイズの代わりに5000の論理フレームサ
イズが示されている。
一般に、過大サイズのフレームは、シーケンス全体が復号され、フォーマッタ
に送られた後まで、検出できない。その理由は、論理フレームの全体のサイズは
ビデオ圧縮器30が直接利用できない情報に左右されるためである。例えば、それ
は補助データの大きなブロックが存在することにより生じることがある。
第12図に示し、第13図に実施されているアプローチはソーケンスの再圧縮を強
制しないので、より良い解決法である。そのような付加的な圧縮を行うと、感知
しうるような画質の低下が生じるが、第12図のアプローチはこれを防止する。各
フレームに対する圧縮データは、1/30秒の間隔で到着する必要があるが、ある点
(後述する)迄は、もっと早く到着しても問題とはならない。従って、フレーム
3に対するデータは、正規にはフレーム2に関連するスペースを使用することが
できる。
一般に、次のようなやり方が採られる。各フレームが最後から始めて読出され
、検査される。そのフレームが1つのフレームに対するその時のディザサイズに
適合する場合は、丁度充分なパディングが付加されて(スイッチ1390)そのフレ
ームをそのサイズにする。適合しない場合は、そのフレームはファイル中に置か
れ、時間的に先行するフレームからスペースを借りてくることによって早めにロ
ーディングが開始される。次に、時間的に先行するフレームが検査される。その
フレームからスペースが借用されているにも係わらず、そのフレームがその正規
のフレーム割当に適合する場合もある。このケースが第12図に、フレーム2と3
の両方がこれらの2つのフレームに関係するスペースに適合するものとして示さ
れている。しかし、一般には、時間的に先行するフレームは、それ自身が過大サ
イズでなかったとしても、適合しない場合がある。その場合は、ファイル中に置
かれ、丁
度処理されたフレームに先立ってロードされる。この状況では、各バイトが必要
とされるために、パディングは生成されない。このようなやり方を続けると、次
の2つの一方が生起する。あるフレームが開始する筈であると想定された位置に
、適合するフレームが見つかるか、あるいは、プロセスはそのシーケンスの1番
目のフレームに到達する。
初めの場合は、フレーム当たり1の一定の速度で入力装置からデータを読出す
ことができるフレームのサブシーケンスがある。フレームのいくつかのものは、
ホストコンピュータ28のメモリ中に早めにローディングを開始するが、どのフレ
ームも遅れて到着することはない。
第2のケースでは、一見したところでは、一定した30FPSを維持するように
1番目のフレームを開始することは不可能である。この問題は第3の段階(phase
)によって解決される。第2段階の処理の結果、フォーマッタはそのファイル用
に付加的なバイトが幾ら生成されたかを知る。第3段階では、フォーマッタは第
2段階で生成されたファイルを読み、S4ビットストリームを生成する。この段
階で、フォーマッタはパディングを探し、それを消去する。この処理は段階2で
見出された過剰バイトに等しい量のパディングが消去されるまで続けられる。そ
の結果、ファイルはリアルタイムで再生可能となる。あまり起こらないが、段階
3で充分なパディングが見つからない場合、制御器1310が閾値制御器238に対し
て、
そのシーケンスを圧縮してより小さいコードにする必要がある旨を知らせる。
制御器1310は段階2と3において、2つの重要な統計を計算する。第1に、再
生を開始する前に、ある量のCD-ROMデータを予めローディングする必要がある。
せいよき1310が段階3で、各フレームが到着した時をそのフレームが到着する筈
である時と比較してこれを計算する。第2に、シーケンスの中間位置のサブシー
ケンスが段階2において相互にブロック化された時は、幾つかのフレームが非常
に早期に生起することがある。制御器1310は各フレームがいつ到着するか、従っ
て、これらの早期のフレームに対してどれだけの一時的な記憶容量が必要かを正
確に知らせることができる。これらの2つの重要な統計は再生システムに送られ
て、再生に先立ってホストコンピュータのメモリの割当を制御する。ホストメモ
リが不充分な時は、制御器1310は閾値制御器に更なる圧縮が必要であることを知
らせる。
上記の説明では、スイッチ1330を考慮に入れなかった。パディングが挿入され
ると、基本的にはS4ビットストリームに使用されないスペースが導入される。
このスペースは新しいフレームが所望の時に到着するようにするためにそこに置
いておかねばならない。ホストコンピュータが何を行っているかに従って、ある
動きのあるビデオの再生の副次的効果としてロードできる補助データがある場合
もある。そのようなデータが存在する場合は、
制御器1310はスイッチ1370と1330に対して、等価量のパディングの代わりにこの
補助データを用いるように指示する。
再生システム
第1図の再生システム8は、CD-ROM制御器24にバッファされ、ホストコンピュ
ータ28のバス26に供給される再生されたオーディオ/ビデオビットストリーム信
号S15を供給するためにディスク20を演奏するCD-ROM再生器22を含んでいる。
ここで注意すべきは、ビットストリームS15の「フレーム・ヘッダ」データは
、そのビットストリーム中の圧縮されたオーディオデータ(S7)、圧縮された
ビデオデータ(S10)、及び補助データの位置を示すという点である。コンピ
ュータ28はフレームヘッダ識別データに応答して、ビットストリームS15のオ
ーディオ部分(S16)とビデオ部分(S17)をバス26を通して各ビデオプロ
セッサ(30)とオーディオプロセッサ(32)に送る。補助データ(S18)があ
る場合は、この補助データは、例えば、システムのインタラクティブ・アプリケ
ーションで用いるために、ホストコンピュータの主メモリ中に記憶される。一例
をあげると、この補助データは、ある特定の静止フレームあるいは動きビデオシ
ーケンスの、ディスク20上の位置に関するアドレス情報を含む。静止フレームの
1乃至数フレームを急いで選択することが必要となった時は、ユーザは入/出力
装置38によってその選択を入力し、ホストコン
ピュータはそれに応答して、CD-ROM制御器24によって再生器22に適当なシーク指
令を送る。
音声プロセッサ32は、スピーカユニット34に1乃至それ以上のアナログ音声信
号S19を連続的に供給するために、ビットストリームS15のオーディオ部分
をバッファし復号する。ビデオプロセッサ30はビットストリームS15のビデオ
部分(S17)のバッファリング、復号、及び飛越し走査変換を行う。処理され
たビデオ信号S20は、30フレーム/秒で、例えば、2:1飛越し走査RGB成分
形式で表示器36に供給されて、全動き(フルモーション)カラービデオが表示さ
れるようにする。システム全体に対するユーザのインタラクション(制御)は入
/出力ユニット38(例えば、キーボード、モニタ、「ジョイスティック」、「マ
ウス」等)によって与えられる。
ビデオ復号
第48図に詳細に示すビデオプロセッサ30が、端子4802における圧縮されたデジ
タルビデオ信号S17の各フレームを復号して、フルモーション・カラービデオ
信号S20(RGB)を飛越し走査形式で、60フィールド/秒で表示ユニット36
(第1図)に供給する。プロセッサ30は、種々のプロセッサ素子に結合されたタ
イミング及び制御バス4812によってメモリ読出し/書込み動作やデコーダの選択
(スイッチ制御)のような機能を制御するための全てのタイミング信号を生成す
るタイミング及び制
御ユニット4810を含んでいる。図面の簡素化のために、バス4812は全体として矢
印で示してある。タイミング及び制御に関するヘッダ情報(例えば、フレーム率
、フレームサイズ、データポインタ等)は入力端子4802に結合されているヘッダ
検出器4814を介してユニット4810に供給される。ユニット4810によって制御され
るマルチプレクス・スイッチ4816が、圧縮されたY、I及びQデータ(S20)
を信号S17から分離し、それを圧縮された形で、ビデオ・ランダム・アクセス
・メモリ4820(点線で示す)の位置4822に記憶させる。スイッチ4816はまた信号
S17から統計的コードテーブルデータS22を分離し、それを可変長デコーダ
4830に供給する。デコーダ4830は統計的データを復号して、ビデオRAM4820の
位置4822から圧縮されたデータS20が読出される時に可変長デコーダ4830によ
って使用されるようにするために、復号された統計的データをRAM4832に記憶
させる。
前述したように圧縮Y、I及びQデータをローディングした後、1フレームの
復号プロセスが開始される。1フレームの復号には、同じプロセスが3回、即ち
、各サブフレーム(Y、I、及びQ)に対して1回、実行される。次の説明が1
フレームの復号に対するものである。
1つのサブフレームのデコンプレッションにおける1番目のステップは、2進
トリー記述の「分解(parse)」することである。即ち、スプリット及びフィルを
用いてトリーを記述するトリーデータが、領域の位置及びサイ
ズ及びフィル形式の明示リストに変換される。これはトリーデータをトリーデコ
ーダ4842に供給することによっで行われる。トリーデコーダ4842はトリーを詳細
に検討して、トリーの各ターミナル・ノードに、その領域リストに関係するデー
タを出力する。このリストはビデオRAM4820中の領域位置テーブル4824に記憶
される。
領域テーブルの概略的なフォーマットが第49図に示されている。各セルについ
て、その「形式」(相対か、絶対か、DPCMか、ダイアドか、クワッドか)が
、その左上コーナの座標(X,Y)とそのサイズ(H,W)と共にリストされて
いる。セルが相対的セルかダイアドセルである場合、この場合は領域シフト補間
器4858が用いられるであろうが、オフセット値(X0,Y0)も記憶される。これ
らの値は、その時の画像中の領域とその前の画像中の対応する領域との間の相対
的な偏位を表す。セルが絶対的なものである場合は、絶対フィル値(これは、フ
ィル多項式Ax+By+C中の値Cに等価である)も記憶される。
第50図は画像の一例を示し、それに対応するトリーデコーダからの出力である
領域テーブルを第51図に示す。この画像は各々可能な形式の2つの領域からなっ
ている。2進トリーを辿る順序があるために、ある特定の形式のセルの全てが領
域テーブルでグループ化されているとは限らない。
幾つかの形式のセル(例えば、ダイアド)は対をなす
ピクセルに作用するので、全てのセルが偶数に等しい寸法(HとW)を持つこと
が望ましい。各分割(スプリット)毎に1つの寸法(次元)が2分の1に分割さ
れる単純な2進トリー分割では、元の画像寸法が2の幕でなければ、すぐに奇数
の寸法を持つ領域に達してしまう。これでは余りに制限がきついので、改良型分
割法が用いられる。この方法では、分割する必要がある寸法Dが2つの値2In
t(D/4)とD−2Int(D/4)を生成する。ここで、Int(D/4)
は商D/4の整数部である。この方法でもほぼ中央で分割を行うが、元の画像の
寸法が偶数であるかぎり、全てのセル寸法が偶数寸法となるようにできる。この
制限は3つのサブフレームの全てに等しく当てはまり、しかも、I及びQサブフ
レームは係数4でサブサンプルされるので、このことは全画像寸法が8の倍数で
なければならないということを意味する。
第65図は量子化された補正画像の例を示し、トリーデコーダによって出力され
る対応領域テーブルを第66図に示す。前述したように、このような画像の分割は
8×8ピクセルブロックの境界線に沿って行われる。その結果、そのような分割
によって分割面積が2等分されるとは限らない。そのような分割は、この発明の
2進トリー符号化法の一部をなす。
第48図に返って、ビデオRAM4820は2つのビットマップを含んでおり、1つ
は復号されているその時のフレ
ームのピクセルを記憶するためのもの(マップ4826)であり、他方(マップ4828
)はその前に復号され、表示ユニット36(第1図)上での表示に用いうるフレー
ムのピクセルを記憶するためのものである。ビットマップ4826を造るために、位
置4822における圧縮されたフィルデータと位置4824における領域位置データがス
イッチ4850を通して、フィルデータの「形式」、即ち、DPCMか、絶対か、相
対か、あるいはクワッドかに応じて、4つのデコーダ4852、4854、4855、4856及
び4857の中の選択された1つに供給される。位置4822におけるフィルデータは、
最初、ユニット4830において可変長復号され、(スイッチ4840)デコーダ選択ス
イッチ4850に供給される。スイッチ4850の制御は、DPCMフィルデータをデコ
ーダ4852に、絶対フィルデータをデコーダ4854に、ダイアドフィルデータをデコ
ーダ4855に、クワッドフィルデータをデコーダ4857に、相対フィルデータをデコ
ーダ4856に指向させる領域フィル形式検出器4851によって供給される。
絶対デコーダ及び相対デコーダ(4854、4856)は面積検出器4853によって供給
される領域「面積」(即ち、ある領域中のピクセルの数を表すデータを受ける。
このデータは、後述するように、32ピクセルよりも少ないピクセルを持つ領域に
ついて、領域のサイズに基づいて量子化されているフィルデータを「逆量子化」
する時に用いられる。ビットマップ4842は、ダイアド及び相対デコー
ダ4855と4856からアドレスデータを受けて、その前のフレームの領域ピクセルデ
ータを領域シフト補間器4858を介してデコーダ4855と4856に供給する。ビットマ
ップ4826が生成されている時に、ビットマップ4828はユニット36上に表示する用
意ができている。これは、複数の入/出力ポートとバッファを有するビデオRA
Mを選択することにより一層容易になる。あるいは、図示のように、ビットマッ
プ4828の内容を表示の目的で別の表示バッファ4829に移してもよい。
IデータとQデータは、Yピクセルに対して垂直水平両方向に4:1でサブサ
ンプルされるので、I及びQピクセルアレー(各々64×60)をYアレーのサイズ
(256×240)に補間して戻すために、補間器4860が設けられている。Y、I及び
Qデータは初めにフレーム・リピータ4862に供給される。フレーム・リピータは
(30FPSの場合)ビットマップ4829を2回読出してフレーム率を2倍にし、そ
の結果得られた60Hzのフィールド周波数のYIQ信号を飛越し走査形式にする
。24FPSのビデオの場合は、リピータ4862は2-3-2-3繰り返しシーケンスを用
いて復号フレームを繰り返させる。ルミナンス信号Yと補間されたI及びQ信号
はデジタル−アナログ(D/A)変換器及びマトリクスユニット4804に供給され
る。このユニット4804は表示ユニット36のためのRGBアナログ出力信号S20を
形成する。
第53図は相対復号のプロセスを示している。その時の
フレーム5302中の各ピクセルP(x,y)の値は多項式関数Ax+By+Cの値
を前のフレーム5304中の対応するピクセルP’(x,y)に加算することによっ
て求められる。座標xとyは領域の上左隅を基準にして測定される。前のフレー
ム中の領域5304の位置は、領域5302に対する領域5304の空間的偏位を1/8ピクセ
ルの単位で表したオフセット値X0とY0によって求められる。
第54図は相対デコーダ4856の詳細なブロック図である。領域位置テーブル4824
からのX、Y、H、W、X0及びY0の値がラッチ5402にラッチされる。座標X、
Yがアドレスカウンタユニット5404に加えられて、このカウンタを、ビットマッ
プ4826中の復号されるべき領域の上左隅に初期化する。高さ及び幅の値H、Wは
水平及び垂直方向のカウンタの限界を特定し、アドレスカウンタが領域5302中の
各ピクセルのアドレスを順次ステップ状に変化するようにする。
X0及びY0の値は、小数ピクセル精度で領域偏位を表す。これらの値の整数部
はアドレスオフセット加算器5406に送られて、アドレスカウンタ5404からのアド
レスに加えられる。これによって得られたアドレスは前のフレームの領域5304中
のピクセルをアドレスするために、ビットマップ4828に供給される。X0及びY0
の値の小数部は領域シフト補間器に供給され、ビットマップ4828中の実際のピク
セル間の中間位置の補間値を生成する。
相対デコーダ4856の次の段階で、相対フィル多項値
Ax+By+Cがシフトされた領域データに加えられ、新しい領域5302がビット
マップ4826に記憶される。係数A、B及びCはビットストリームから読出され、
前述した面積をベースにした値の量子化を復号するために逆量子化器5472に供給
される。逆量子化の後、係数がフィル論理ユニット5470に加えられる。このユニ
ットはこれらの3つの係数と、アドレスカウンタ5404からのxとyの値とを取り
、フィル多項式の3つの項を出力する。x及びy値は、フィル値の項を求めるた
めに論理ユニット5470で使用される領域座標である。次いで、これら得られた3
つの項が、加算器5460、5462及び5464を用いて、前の領域データと加算され、ビ
ットマップ4826に記憶される。係数WAとWBは小数であり、従って、第54図の
加算器によって出力されるフィル値も小数である。この値は、ビットマップ4826
に書き込む前に切り捨て処理されて整数とされる。
第55図は絶対領域の復号を説明するものである。この場合、考慮すべき前の領
域というものはない。各ピクセルP(x,y)の値は多項式Ax+By+Cの値
であり、xとyはその領域の左上隅に関して測定した座標である。Cの値はトリ
ー記述でコード化されているので、領域位置テーブル中に記憶されているが、A
とBの値はビットストリームの「絶対フィル」セグメントに含まれていることを
想起されたい。
第56図は絶対デコーダ4854のブロック図である。これ
は相対デコーダ4856に類似するが、先行のビットマップ、即ち、領域補間器は用
いない。値A、B及びCは、必要時に逆量子化器5672によって逆量子化され、フ
ィル論理ユニット5606によって処理されてフィル多項式の各項を生成する。これ
らの項は加算器によって加算され、その結果は、切り捨て処理されて整数とされ
た後、ビットマップ4826に書き込まれる。アドレスカウンタ5604がこの処理を制
御して、X、Y、H、Wによって規定される矩形領域内の全ての位置におけるピ
クセル値が生成される。
第57図はDPCM復号のプロセスを説明するものである。領域5702のピクセル
値(P’)は差分値Dをそのピクセルの左側に隣接するピクセルの値(P)に加
えることにより得られる。領域の左端にある、従って、その左に隣接するピクセ
ルを持たないピクセル(例えば、図中のQ’)は、その上のピクセル(Q)に値
Dを加算することにより復号される。それの上に位置するピクセルもそれの左に
隣接するピクセルも持たない領域の左上隅のピクセルは、定数128に値Dを加算
することにより復号される。全てのD値はビットストリームのDPCMセグメン
トに含まれていることを想起されたい。
第58図はDPCMデコーダ4852のブロック図である。テーブル4824からのX、
Y、H及びWの値はラッチ5802に記憶され、形成中の領域5702中の全てのピクセ
ルについてのピクセルアドレスを生成するためにアドレス制御器5804によって用
いられる。制御器5804は、差分値Dと
加算されるピクセルPを供給するためにビットマップ4826から読みだすためのピ
クセルアドレスも発生する。可変長デコーダ4830(第48図)からのDPCMデー
タは、必要とあれば、差分値Dを供給するDPCM逆量子化器5808に供給される
。これらの値は、加算器5805を用いて、ビットマップ4826から読出されたピクセ
ル値に(または、それがその領域の1番目のピクセルである場合には、128に)
加算されて、ビットマップ4826の領域5702に書き込まれる新しいピクセル値が生
成される。
第61図はダイアド領域を復号するプロセスを示す。その時のフレーム6110中の
ピクセルの値は値(R、S)の対を、先行のフレーム6120の対応する領域中のピ
クセル(C、D)の対に加算して、その時のフレーム中のピクセル(A、B)の
対を生成することにより求める。相対フィル領域におけると同様、先行フレーム
の領域6120の位置は、領域6110に対する領域6120の空間的偏位を小数ピクセル単
位で表すオフセット値X0とY0によって求められる。
第63図は相対デコーダ4855の詳細なブロック図である。領域位置テーブル4824
からのX、Y、H、W、X0及びY0の値はラッチ6330にラッチされる。座標X、
Yはアドレスカウンタユニット6332に供給されて、カウンタを復号されるべき領
域の上左隅に初期化する。H、W値はアドレスカウンタによって水平及び垂直に
カウントされるピクセルの数を決めるために用いられる。
X0及びY0の値はアドレスオフセット加算器6334に供給され、ビットマップ48
28と補間器4858のそれぞれに対する整数及び小数のオフセットアドレスが生成さ
れる。ターゲット領域に対するピクセル値を生成するために、シフトされた領域
のデータC、Dがビットマップ4828から読出され、領域シフト補間器4858を通し
て処理されて、加算器6350と6352を用いてダイアド値R、Sに加算される。これ
によって得られる値A、Bはビットマップ4826に書き込まれる。
ダイアド値は、先ず、デコーダ4830を用いてビットストリームからの値を可変
長復号し、それをダイアドメモリ6320中のダイアドを指示するためにテーブルア
ドレス発生器6310に供給することによって生成する。例えば、可変長復号の後の
値が3であるとすると、これによってダイアド対#3がダイアドメモリから読出
される。
選択された画像を復号する際に、複数の解像度レベルを持つ補正画像が、前述
したように、ビデオシーケンス・データストリームのビットストリーム部分にコ
ード化され挿入されていた複数レベルの量子化された補正画像を復号することに
よって形成される。第67図に示す推奨実施例において、レベル3の補正画像6702
が、コード化されたレベル3の量子化補正画像の復号(6704)によって形成され
る。レベル2の補正画像6706はコード化されたレベル2の量子化された画像を復
号(6708)することによって形成される。レベル1の補正画像6710はコード化
されたレベル1の量子化補正画像を復号(6712)することによって形成され、レ
ベル0捕正画像6714はコード化されたレベル0の量子化補正画像を復号(6716)
して形成される。
推奨実施例では、デコーダは、復号された2進トリー記述データを用いて領域
テーブルを再構築する。次いで、その領域テーブルを領域フィルデータと共に用
いて、各解像度レベルの量子化された補正画像を構築する。補正画像は、再構築
された領域テーブルを用いて構築することが好ましいが、直接、復号された2進
トリー記述データと領域フィルデータとから構築することもでき、これもこの発
明の範囲内と考えている。
デコーダは、量子化された補正画像の各々をそのレベルに対するビットストリ
ーム中で指定されたコード化形式に従って復号する。例えば、前に述べたように
、最低レベルの解像度(レベル3)を持った補正画像の画像領域全体が、推奨実
施例では、この詳細な説明中の他の部分で説明されているDPCMコード化技法
を用いて、単一の非ナル(non-null)領域としてコード化される。従って、レベ
ル3の補正画像に対する圧縮フィルデータはDPCMデコーダ4852(第48図参照
)に加えられる。次いで、DPCMデコーダ4852はDPCMデータを復号して、
レベル3の補正画像6702からなるピクセルの差分値Dを形成する。
レベル0の量子化された補正画像の非ナル領域は、前
に述べたように、クワッドコード化技法を用いてコード化される。従って、レベ
ル0の補正画像に対する領域位置データ及び圧縮フィルデータはクワッドデコー
ダ4857(第48図参照)に加えられる。クワッドデコーダ4857はクワッドデータを
復号して、0レベルの補正画像6714の非ナル領域を構成するピクセルの差分値D
を形成する。フル(全)解像度レベル0の補正画像6714の残りの部分を構成する
ナル領域中のピクセルの位置はゼロで満たされる(フィルされる)。
前に述べたように、レベル2の量子化補正画像の非ナル領域は、この詳細な説
明中の他の部分で述べられているように、ダイアドコード化法を用いてコード化
される。従って、レベル2の補正画像に対する領域位置データと圧縮フィルデー
タは、ダイアドデータを復号して、レベル2の補正画像6706の非ナル領域からな
るピクセルの差分値Dを形成するダイアドデコーダ4855に加えられる。レベル2
の補正画像の残部を構成するナル領域のピクセル位置はゼロで満たされる(フィ
ルされる)。推奨実施例では、レベル1の量子化補正画像の非ナル領域もダイア
ドコード化法を用いてコード化されるので、レベル1の補正画像は、レベル2の
補正画像の復号について述べた手順に従って復号される。
この発明の一般的なケースにおいては、各解像度レベルに対する出力画像はそ
の解像度レベルの補正画像の差分値Dを、同じレベルの解像度を有する基準画像
のピク
セル値に加算することによって形成される。第67図に示されている推奨実施例で
は、レベル3の出力画像6718は、レベル3の補正画像6702の差分値Dを、全ての
ピクセルが同じ値、推奨実施例では128、を持つピクセルのアレーからなるレベ
ル3の基準画像6720に加算することによって形成される。
レベル3の出力画像6718は拡張されて、拡張レベル3出力画像6722を形成する
。拡張により生じた空いたピクセル位置は、計算によって決められる値を持った
ピクセルによって満たされる。推奨実施例では、上記ピクセル値は、空所のピク
セル位置の両側のピクセルの値を加算し、その和を2で除算し、その結果をその
空いたピクセル位置に挿入することによって行う一次補間によって求められる。
拡張されたレベル3の出力画像6722は、後述するように、レベル2の基準画像と
して働く。
レベル2の出力画像6724はレベル2の補正画像6702の差分値Dを、推奨実施例
では拡張されたレベル3の出力画像6722であるレベル2の基準画像の対応するピ
クセル値に加算することによって形成される。レベル2の出力画像6724は拡張さ
れて拡張レベル2出力画像6726が形成される。拡張されたレベル2出力画像6726
中の空所となったピクセル位置は、レベル3出力画像6718の拡張に関して前に述
べたようにして埋められる。
レベル1の出力画像6728はレベル1補正画像6710の差分値Dを、推奨実施例で
は拡張されたレベル2の出力画
像6726であるレベル1基準画像に加算することによって形成される。レベル1の
出力画像6728は拡張されて、拡張されたレベル1の出力画像6730が形成される。
拡張レベル1出力画像6730中の空所のピクセル位置は、レベル3出力画像6718の
拡張に関して前に述べたようにして埋められる(フィルされる)。フル解像度の
最終画像6732はレベル0の補正画像6714の差分値Dを、推奨実施例では拡張され
たレベル1出力画像6730であるレベル0基準画像に加算することによって形成さ
れる。この最終画像6732は後の表示のためにメモリ中に記憶される。
この時点で、注意すべきは、前に述べたように、フル解像度のレベル0量子化
補正画像は、この発明のもう一つの推奨実施例では、形成されされず、コード化
されず、ビットストリーム中で伝送されることはない。従って、このもう一つの
推奨実施例では、次に低い解像度レベルから拡張された出力画像が最終画像を形
成する。また、レベル2がこの推奨実施例においては最も低い解像度レベルであ
る場合があるので、レベル3の補正画像の復号は不要であり、レベル2の基準画
像は、レベル3の基準画像6720に関して前に述べた様な全てのピクセルが同じ値
を持つようなピクセルのアレーからなる。
第59図は32ピクセルよりも小さな領域に対する量子化値をリストしたテーブル
である。1ピクセルの領域が、8レベルの明るさを表す3ビットの解像度に量子
化されたことを想起されたい。面積が2倍になる度に、1ピク
セル当たり8ビットのフルビデオ解像度まで、1ビット多い正確度が用いられる
。このようにすることによって、小さな領域を表すに要するビットの数が減じら
れる。このデータの復号あるいは「逆量子化」は、フィル値が計算される時に、
ビットに対して適切な2進重み(桁)を与えるために左にシフトさせる必要があ
る。
第60図は第59図の左シフト「逆量子化器」動作を実施するためのブロック図で
ある。領域位置テーブル4824からの領域の高さ(H)と幅(W)はラッチ6002と
6004にラッチされ、面積検出器4853(点線で示す)の乗算器6006によって乗算さ
れる。この乗算器は、面積(第59図)の関数としてのシフト値を得るために、面
積ルックアップテーブル6008に対しアドレスコードを供給する。これらの値はビ
ットシフタ6010に供給される。左寄せされるべき量子化された可変長フィルデー
タは、データをテーブル6008によって与えられるシフト値に従って左にシフトす
るビットシフタのデータ入力に供給される。
復号時間モニタ236の説明において、復号時間は先行の画像から借用すること
ができるので、時には長い復号画像があっても受け入れられる旨を述べた。この
考え方を、ビデオRAM4820の更なる詳細を示す第52図の文脈において更に説明
する。このメモリは、その時復号されているフレームが記憶されるバッファ4826
、その前に復号されたフレームを記憶するためのバッファ4828、グラフィックス
・バッファ5202、パイプライン・バッファ
5204、及び表示バッファ4829を含む多数の表示バッファを含んでいる。これらの
バッファの各々はデコンプレッション処理された画像全体を保持するに充分な大
きさを持つ。前に述べたように、復号プロセスはビットマップ4828に記憶されて
いる先行画像からのデータを用いて、ビットマップ4826に記憶されている次の画
像即ちその時の画像の復号を行う。第52図において、バッファ5202に収容されて
いるフレームは表示バッファ4828に収容されていたフレームの直前で復号され、
表示バッファ4829に収容されているフレームはビットマップ5204に収容されたフ
レームの直前で、というように、復号された。即ち、バッファ4829から表示され
ている画像は、必ずしも復号プロセスで使用されている画像とは限らず、実際、
数フレーム時間前に復号されたものである場合がある。
複数の表示バッファを用いる利点は、ホストソフトウェアがグラフィックスを
、それが見られる前に、表示器上に描くことができる点である。このような変更
は、復号の過程中であるために、ビットマップ4826上ではできない。4828のピク
セルは復号時に用いられるので、ビットマップ4828中では描くことができず、ま
た、これはグラフィックス・ピクセルによって乱されることはない。描画プロセ
スは表示器36上で見えるために、グラフィックスはバッファ4829内で描かれては
ならない。グラフィックスをバッファ5202中で描くことはこれらの問題のどれを
も伴わない。
多数表示器バッファを用いる別の理由は、これによって復号時間の借用が容易
になるためである。ビデオRAMに幾つかの付加的なバッファを用いることによ
り、表示のためにあるバッファが選択される時間を復号プロセスから独立するあ
るいは非同期とすることができる。画像のパイプラインが無くなってしまわない
限り、フレームリピータ4862は表示画像に目に見えるポーズや空白を生じさせる
ことなく動作することができる。この原理は第13図のディザリングのボックスと
同様である。リピータ4862は画像の表示速度の移動平均(running average)を
維持し、その時の画像を保持しあるいは次の画像に進み、その移動平均を所望の
再生速度に近くなるように保持する。この点は可変速度再生のアプリケーション
では特に有用である。例えば、ユーザは、あるフレームあるいは一連のフレーム
の細部を見るために30FPSで記録された題材の再生フレーム率を低下させたり、
あるいは、停止させたりしたい場合がある。30FPSで記録されたビデオを一連の
静止フレームとして見る場合は、CD-ROM再生器を一時停止(ポーズ)させ、バッ
ファパイプラインの内容を、一時に1フレームずつ選択的に表示させる。CD-ROM
はスタート・ストップモードで動作させて、表示パイプラインが空にならないよ
うにする。
フォーマッタ250(第2図)は表示バッファのパイプラインを空にしないよう
な設計とされている。復号時間モニタ236によって生成された値に基づいて、フ
ォーマ
ッタは再生中の表示バッファパイプラインの振る舞いをシミュレーションし、パ
イプラインの枯渇を防止するコード化フレーム最小サイズを決定することができ
る。この値が表示バッファ用にホストで使用できるメモリよりも大きい場合は、
制御器1310を用いて閾値制御器238に、短い復号時間を得るために、より高い閾
値を用いて圧縮が繰り返されることを知らせる。
個々に記述したシステムの例では、圧縮された信号のための伝送媒体としてCD
-ROMを使用した。これに代えて、たの伝送媒体、例えば、デジタル磁気ディスク
やテープを用いてもよい。またフルサイズの(例えば、12インチ)光ディスクや容
量記憶型のディスクを伝送用に用いることができる。また、圧縮信号の伝送は他
の手段、例えば、衛星送信システムやサイクル送信システムによって行ってもよ
い。更に、絶対領域あるいは相対領域用の一次(線形)フィルデータは両方とも
、式Ax+By+Cの係数A、B、Cで表される。ここで想起すべきは、絶対フ
ィルデータの係数は実際のピクセル値に関係付けられており、一方、相対フィル
データは、ターゲット領域中のピクセルと前のフレームの対応する領域中のピク
セルの間の差分値に関係付けられているということである。
─────────────────────────────────────────────────────
フロントページの続き
(81)指定国 EP(AT,BE,CH,DE,
DK,ES,FR,GB,GR,IT,LU,MC,N
L,SE),OA(BF,BJ,CF,CG,CI,CM
,GA,GN,ML,MR,SN,TD,TG),AT
,AU,BB,BG,BR,CA,CH,DE,DK,
FI,GB,HU,JP,KP,KR,LK,LU,M
G,MW,NL,NO,RO,RU,SD,SE
【要約の続き】
される。
Claims (1)
- 【特許請求の範囲】 1.a.デジタル動きビデオ信号のフレームのシーケンスから少なくとも1つの フレームを選択するステップと、 b.各選択されたフレームを少なくとも1つのより低い解像度のレベルに分解 するステップと、 c.上記選択されたフレームの各々の少なくとも1つの低い解像度レベルをコ ード化するステップと、 d.上記デジタル動きビデオ信号の選択されなかったフレームの各々を、全解 像度レベルのみを用いてコード化するステップと、 を含む、デジタル動きビデオ信号をコード化する方法。 2.ステップcが、少なくとも1つのより低い解像度レベルをコード化するが、 上記選択されたフレームの各々の全解像度レベルのコード化は行わない、請求項 1に記載の方法。 3.ステップcが、コード化される上記選択されたフレームの各解像度レベルに ついて、 i.基準画像中のピクセル値を上記選択されたフレームのその解像度のレベル における対応するピクセル値から減算することにより、ピクセル値のアレーから なる補正画像を形成するステップと、 ii.上記補正画像中のピクセル値を量子化して、量子化された補正画像を形成 するステップと、 iii.上記量子化された補正画像をコード化するステッ プと、 を含んでいる、請求項1に記載の方法。 4.上記選択されたフレームの最も低い解像度のレベルに対するステップiが、 全てが同じ値を持つピクセルのアレーからなる基準フレームを供給するステップ を含んでいる、請求項3に記載の方法。 5.上記選択されたフレームの最も低い解像度のレベルよりも高い解像度のレベ ルの各々に対して、上記ステップiが、 (1)より低い解像度のレベルを持つ出力画像を、そのより低い解像度のレベ ルの量子化された補正画像のピクセル値をそのより低い解像度のレベルの基準画 像のピクセル値に加算することにより形成するステップと、 (2)上記高い解像度のレベルの基準画像を、ステップ(1)で形成された出 力画像を上記より高い解像度のレベルに拡張することによって形成するステップ と、 を含んでいる、請求項4に記載の方法。 6.ステップiiiが、上記量子化された補正画像を領域に分割し、各領域につい てその位置、サイズ及びフィルデータを記述する領域パラメータを生成するステ ップを含んでいる、請求項3に記載の方法。 7.上記量子化された補正画像を領域に分割するステップが、上記画像をナル及 び非ナル領域、あるいはナル及び線形フィル領域に分割するステップを含んでい る、請求項6に記載の方法。 8.上記領域記述が2進トリー分解法を用いてコード化される、請求項7に記載 の方法。 9.上記非ナル領域が、ベクトル量子化法または離散コサイン変換法を用いてコ ード化される、請求項8に記載の方法。 10.ベクトル量子化を用いるコード化がダイアド、クワッドあるいはDPCM を用いるコード化を含んでいる、請求項9に記載の方法。 11.ステップdが、 i.選択されなかった各フレームを領域に分割し、上記フレーム内のそれぞれ の領域の位置とサイズを記述する領域パラメータを生成するステップと、 ii.選択されなかった静止フレームまたは選択されなかったフレームのシーケ ンスの第1のフレームに対して、 (1)それぞれの領域を記述する絶対フィルデータを求めるステップと、 (2)絶対フィルデータを求めることができない領域のそれぞれを記述する DPCMフィルデータを求めるステップと、 (3)上記絶対フィルデータと、上記DPCMフィルデータと、対応する領 域記述パラメータとを可変長コード化するステップと、 (4)上記可変長コード化された絶対フィルデータ、DPCMフィルデータ 及び対応する領域記述パラメータからのデコンプレッション時間の推測値を求め るス テップと、 (5)上記推測値がある予め定められた値よりも小さい時は、上記可変長コ ード化されたフィルデータと対応領域パラメータを供給し、そうでない場合は、 上記絶対フィルデータを求める際に異なる公差を用いてステップiとステップ( 1)〜(5)を繰り返すステップと、 iii.一連の選択されなかったフレームに対し、 (1)各領域中のピクセル値を、前に生起したフレームからの同サイズの領 域中の対応するピクセル値と比較して、それぞれのピクセル差分を生成するステ ップと、 (2)それぞれの領域についてピクセル差分を記述する相対フィルデータを 求めるステップと、 (3)相対フィルデータを求めることが出来ないそれぞれの領域について、 ダイアドフィルデータを求めるステップと、 (4)相対フィルデータもダイアドフィルデータも求めることができないそ れぞれの領域について、DPCMフィルデータを求めるステップと、 (5)上記相対フィルデータ、上記ダイアドフィルデータ、上記DPCMフ ィルデータ及び対応する領域パラメータを可変長コード化するステップと、 を含んでいる、請求項1に記載の方法。 12.ステップcが、 i.コード化される各解像度レベルをナル領域と非ナル領域に分割するステッ プと、 ii.2進トリー分解法を用いて上記領域をコード化するステップと、 iii.上記非ナル領域中のピクセル値を記述するベクトル値を求めるステップ と、 iv.上記ベクトル値を量子化するステップと、 を含んでいる、請求項1に記載の方法。 13.上記ベクトル値がダイアド、クワッド及びDPCMを含んでいる、請求項 12に記載の方法。 14.ステップaが、 i.上記デジタル動きビデオ信号の各フレームについて、動き補償された差分 画像を形成するステップと、 ii.上記動き補償された差分画像に関係する選択されたパラメータの値を求め るステップと、 iii.上記選択されたパラメータの閾値を選択するステップと、 iv.フレームのシーケンスから、上記予め定められた閾値を超えるパラメータ 値を持つフレームを選択するステップと、 を含んでいる、請求項1に記載の方法。 15.a.デジタル動きビデオ信号のフレームのシーケンスから少なくとも1つ のフレームを選択するステップと、 b.各選択されたフレームを静止画像としてコード化 するステップであって、 (1)各選択されたフレームを少なくとも1つのより低い解像度のレベルに 分解するステップと、 (2)全解像度レベルはコード化せずに、より低い解像度のレベルの少なく とも1つをコード化するステップと、 を含むステップと、 c.少なくとも全解像度レベルを用いて、上記デジタル動きビデオ信号の各選 択されなかったフレームをコード化するステップと、 を含む、デジタル動きビデオ信号のコード化方法。 16.コード化される上記選択されたフレームの各解像度のレベルについて、ス テップb−(2)が、 i.基準画像中のピクセル値を上記選択されたフレームのその解像度のレベル における対応するピクセル値から減算することにより、ピクセル値のアレーから なる補正画像を形成するステップと、 ii.上記補正画像中のピクセル値を量子化して、量子化された補正画像を形成 するステップと、 iii.上記量子化された補正画像をコード化するステップと、 を含んでいる、請求項15に記載の方法。 17.上記選択されたフレームの最も低い解像度のレベルに対するステップiが 、全てが同じ値を持つピクセルのアレーからなる基準フレームを供給するステッ プを含 んでいる、請求項16に記載の方法。 18.上記選択されたフレームの最も低い解像度のレベルよりも高い解像度のレ ベルの各々に対して、上記ステップiが、 (1)より低い解像度のレベルを持つ出力画像を、そのより低い解像度のレベ ルの量子化された補正画像のピクセル値をそのより低い解像度のレベルの基準画 像のピクセル値に加算することにより形成するステップと、 (2)上記より高い解像度のレベルの基準画像を、ステップ(1)で形成され た出力画像を上記より高い解像度のレベルに拡張することによって形成するステ ップと、 を含んでいる、請求項17に記載の方法。 19.ステップiiiが、上記量子化された補正画像を領域に分割し、各領域につ いてその位置、サイズ及びフィルデータを記述する領域パラメータを生成するス テップを含んでいる、請求項16に記載の方法。 20.上記量子化された補正画像を領域に分割するステップが、上記画像をナル 及び非ナル領域、あるいはナル及び線形フィル領域に分割するステップを含んで いる、請求項19に記載の方法。 21.上記領域記述が2進トリー分解法を用いてコード化される、請求項18に 記載の方法。 22.上記非ナル領域が、ベクトル量子化法または離散コサイン変換法を用いて コード化される、請求項19に記載の方法。 23.ベクトル量子化を用いるコード化がダイアド、クワッドあるいはDPCM を用いるコード化を含んでいる、請求項22に記載の方法。 24.ステップcが、 i.選択されなかった各フレームを領域に分割し、上記フレーム内のそれぞれ の領域の位置とサイズを記述する領域パラメータを生成するステップと、 ii.選択されなかった静止フレームまたは選択されなかったフレームのシーケ ンスの第1のフレームに対して、 (1)それぞれの領域を記述する絶対フィルデータを求めるステップと、 (2)絶対フィルデータを求めることができない領域のそれぞれを記述する DPCMフィルデータを求めるステップと、 (3)上記絶対フィルデータと、上記DPCMフィルデータと、対応する領 域記述パラメータとを可変長コード化するステップと、 (4)上記可変長コード化された絶対フィルデータ、DPCMフィルデータ 及び対応する領域記述パラメータからのデコンプレッション時間の推測値を求め るステップと、 (5)上記推測値がある予め定められた値よりも小さい時は、上記可変長コ ード化されたフィルデータと対応領域パラメータを供給し、そうでない場合は、 上記絶対フィルデータを求める際に異なる公差を用いて ステップiとステップ(1)〜(5)を繰り返すステップと、 iii.一連の選択されなかったフレームに対し、 (1)各領域中のピクセル値を、前に生起したフレームからの同サイズの領 域中の対応するピクセル値と比較して、それぞれのピクセル差分を生成するステ ップと、 (2)それぞれの領域についてピクセル差分を記述する相対フィルデータを 求めるステップと、 (3)相対フィルデータを求めることが出来ないそれぞれの領域について、 ダイアドフィルデータを求めるステップと、 (4)相対フィルデータもダイアドフィルデータも求めることが出来ないそ れぞれの領域について、DPCMフィルデータを求めるステップと、 (5)上記相対フィルデータ、上記ダイアドフィルデータ、上記DPCMフ ィルデータ及び対応する領域パラメータを可変長コード化するステップと、 を含んでいる、請求項15に記載の方法。 25.ステップb(2)が、 i.コード化される各解像度レベルをナル領域と非ナル領域に分割するステッ プと、 ii.2進トリー分解法を用いて上記領域をコード化するステップと、 iii.上記非ナル領域中のピクセル値を記述するベクト ル値を求めるステップと、 iv.上記ベクトル値を量子化するステップと、 を含んでいる、請求項15に記載の方法。 26.上記ベクトル値がダイアド、クワッド及びDPCMを含んでいる、請求項 25に記載の方法。 14.ステップaが、 i.上記デジタル動きビデオ信号の各フレームについで、動き補償された差分 画像を形成するステップと、 ii.上記動き補償された差分画像に関係する選択されたパラメータの値を求め るステップと、 iii.上記選択されたパラメータの閾値を選択するステップと、 iv.フレームのシーケンスから、上記予め定められた閾値を超えるパラメータ 値を持つフレームを選択するステップと、 を含んでいる、請求項15に記載の方法。 28.a.デジタル動きビデオ信号のフレームのシーケンスから少なくとも1つ のフレームを選択する手段と、 b.各選択されたフレームを少なくとも1つのより低い解像度のレベルに分解 する手段と、 c.上記選択されたフレームの各々の少なくとも1つの低い解像度レベルをコ ード化する手段と、 d.上記デジタル動きビデオ信号の選択されなかったフレームの各々を、全解 像度レベルのみを用いてコード化する手段と、 を含む、デジタル動きビデオ信号をコード化する装置。 29.フレームのシーケンスからの少なくとも1つの選択されたフレームが、そ の時コード化される少なくとも1つのより低い解像度のレベルに分解されており 、各選択されなかったフレームが全解像度レベルのみでコード化されているデジ タル動きビデオ信号を復号する方法であって、 a.各選択されたフレームの各解像度のレベルを復号して、その解像度のレベ ルを持つピクセル値のアレーからなる補正画像を形成するステップと、 b.解像度の各レベルの出力画像を、その解像度のレベルを持つ基準画像中の ピクセル値を同じ解像度のレベルへの補正画像の拡張のピクセル値に加算するこ とによって形成するステップと、 c.上記選択されなかったフレームを復号するステップと、 を含む、デジタル動きビデオ信号を復号する方法。 30.a.フレームのシーケンスからの少なくとも1つの選択されたフレームが 、その時コード化される少なくども1つのより低い解像度のレベルに分解されて おり、各選択されなかったフレームが全解像度レベルのみでコード化されている デジタル動きビデオ信号を供給する手段と、 b.各選択されたフレームの各解像度のレベルを復号して、その解像度のレベ ルを持つピクセル値のアレーか らなる補正画像を形成する手段と、 c.解像度の各レベルの出力画像を、その解像度のレベルを持つ基準画像中の ピクセル値を同じ解像度のレベルへの補正画像の拡張のピクセル値に加算するこ とによって形成する手段と、 d.上記選択されなかったフレームを復号する手段と、 を含む、デジタル動きビデオ信号を復号する装置。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US07/657,708 US5122873A (en) | 1987-10-05 | 1991-02-19 | Method and apparatus for selectively encoding and decoding a digital motion video signal at multiple resolution levels |
US657,708 | 1991-02-19 | ||
PCT/US1992/001229 WO1992015173A1 (en) | 1991-02-19 | 1992-02-13 | Method and apparatus for encoding and decoding a digital motion video signal |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2002517176A true JP2002517176A (ja) | 2002-06-11 |
Family
ID=24638340
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP50730892A Pending JP2002517176A (ja) | 1991-02-19 | 1992-02-13 | デジタル動きビデオ信号のコード化と復号の方法および装置 |
Country Status (5)
Country | Link |
---|---|
US (1) | US5122873A (ja) |
EP (1) | EP0574502A1 (ja) |
JP (1) | JP2002517176A (ja) |
AU (1) | AU1469992A (ja) |
WO (1) | WO1992015173A1 (ja) |
Families Citing this family (220)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB9405914D0 (en) * | 1994-03-24 | 1994-05-11 | Discovision Ass | Video decompression |
US5781666A (en) * | 1990-04-17 | 1998-07-14 | Canon Kabushiki Kaisha | Image processing method and apparatus suitable for both high-resolution and low-resolution image data |
US5781196A (en) * | 1990-10-19 | 1998-07-14 | Eidos Plc Of The Boat House | Video compression by extracting pixel changes exceeding thresholds |
US5384776A (en) * | 1991-02-22 | 1995-01-24 | Erricsson Ge Mobile Communications Inc. | Audio routing within trunked radio frequency multisite switch |
US5870497A (en) * | 1991-03-15 | 1999-02-09 | C-Cube Microsystems | Decoder for compressed video signals |
US5534917A (en) * | 1991-05-09 | 1996-07-09 | Very Vivid, Inc. | Video image based control system |
US5265180A (en) * | 1991-06-13 | 1993-11-23 | Intel Corporation | Method of encoding a sequence of images of a digital motion video signal |
JPH0514562A (ja) * | 1991-07-02 | 1993-01-22 | Matsushita Electric Ind Co Ltd | デイジタル複写機 |
US5255090A (en) * | 1991-11-19 | 1993-10-19 | Scientific-Atlanta, Inc. | Progressive transmission of vector quantized data |
AU3609093A (en) * | 1992-01-29 | 1993-09-01 | Scabbard Technology, Inc. | Digital audiovisual signal for 35mm equivalent television |
JP2757668B2 (ja) * | 1992-03-11 | 1998-05-25 | 国際電信電話株式会社 | 画像解析装置 |
US5511151A (en) * | 1992-06-10 | 1996-04-23 | Canon Information Systems, Inc. | Method and apparatus for unwinding image data |
US6079009A (en) * | 1992-06-30 | 2000-06-20 | Discovision Associates | Coding standard token in a system compromising a plurality of pipeline stages |
US5309522A (en) * | 1992-06-30 | 1994-05-03 | Environmental Research Institute Of Michigan | Stereoscopic determination of terrain elevation |
US6330665B1 (en) | 1992-06-30 | 2001-12-11 | Discovision Associates | Video parser |
US5768561A (en) * | 1992-06-30 | 1998-06-16 | Discovision Associates | Tokens-based adaptive video processing arrangement |
US6047112A (en) * | 1992-06-30 | 2000-04-04 | Discovision Associates | Technique for initiating processing of a data stream of encoded video information |
US6263422B1 (en) * | 1992-06-30 | 2001-07-17 | Discovision Associates | Pipeline processing machine with interactive stages operable in response to tokens and system and methods relating thereto |
DE69229338T2 (de) * | 1992-06-30 | 1999-12-16 | Discovision Associates, Irvine | Datenpipelinesystem |
US6112017A (en) * | 1992-06-30 | 2000-08-29 | Discovision Associates | Pipeline processing machine having a plurality of reconfigurable processing stages interconnected by a two-wire interface bus |
JPH0622339A (ja) * | 1992-06-30 | 1994-01-28 | Canon Inc | 映像信号記録装置 |
US6067417A (en) * | 1992-06-30 | 2000-05-23 | Discovision Associates | Picture start token |
US7095783B1 (en) | 1992-06-30 | 2006-08-22 | Discovision Associates | Multistandard video decoder and decompression system for processing encoded bit streams including start codes and methods relating thereto |
US5809270A (en) * | 1992-06-30 | 1998-09-15 | Discovision Associates | Inverse quantizer |
US5784631A (en) * | 1992-06-30 | 1998-07-21 | Discovision Associates | Huffman decoder |
US6181826B1 (en) * | 1992-07-22 | 2001-01-30 | Eastman Kodak Company | Method and associated apparatus for achieving additional signal level resolution from a quantized digital representation of an image |
FR2700037B1 (fr) * | 1992-12-24 | 1995-01-27 | Thomson Csf | Dispositif d'estimation hiérarchique du mouvement de séquence d'images. |
US5768424A (en) * | 1993-01-15 | 1998-06-16 | Canon, Inc. | Compression factor adjustment to facilitate image display |
US5444489A (en) * | 1993-02-11 | 1995-08-22 | Georgia Tech Research Corporation | Vector quantization video encoder using hierarchical cache memory scheme |
US5467413A (en) * | 1993-05-20 | 1995-11-14 | Radius Inc. | Method and apparatus for vector quantization for real-time playback on low cost personal computers |
US5768629A (en) * | 1993-06-24 | 1998-06-16 | Discovision Associates | Token-based adaptive video processing arrangement |
US5699544A (en) * | 1993-06-24 | 1997-12-16 | Discovision Associates | Method and apparatus for using a fixed width word for addressing variable width data |
US5805914A (en) * | 1993-06-24 | 1998-09-08 | Discovision Associates | Data pipeline system and data encoding method |
US5861894A (en) * | 1993-06-24 | 1999-01-19 | Discovision Associates | Buffer manager |
KR100292138B1 (ko) * | 1993-07-12 | 2002-06-20 | 이데이 노부유끼 | 디지탈비디오신호용송신기및수신기 |
AU7519594A (en) * | 1993-08-02 | 1995-02-28 | Aware, Inc. | Multimedia playblack system |
EP0639033B1 (en) * | 1993-08-13 | 1999-06-09 | Nec Corporation | Video/audio compression and reproduction device |
WO1995007005A1 (en) * | 1993-08-30 | 1995-03-09 | Sony Corporation | Device and method for encoding image |
US5473741A (en) * | 1993-08-30 | 1995-12-05 | Graphic Systems Technology, Inc. | Method for determining the time to perform raster image processing |
JP3640405B2 (ja) * | 1993-09-07 | 2005-04-20 | ソニー株式会社 | 画像情報符号化装置および復号装置 |
US6084978A (en) * | 1993-12-16 | 2000-07-04 | Eastman Kodak Company | Hierarchical storage and display of digital images used in constructing three-dimensional image hard copy |
US5640159A (en) * | 1994-01-03 | 1997-06-17 | International Business Machines Corporation | Quantization method for image data compression employing context modeling algorithm |
FR2715527B1 (fr) * | 1994-01-21 | 1996-02-23 | Thomson Csf | Procédé et dispositif d'analyse et de synthèse en sous bandes adaptatifs. |
CA2145363C (en) * | 1994-03-24 | 1999-07-13 | Anthony Mark Jones | Ram interface |
CA2145365C (en) * | 1994-03-24 | 1999-04-27 | Anthony M. Jones | Method for accessing banks of dram |
CA2145379C (en) * | 1994-03-24 | 1999-06-08 | William P. Robbins | Method and apparatus for addressing memory |
US6005623A (en) * | 1994-06-08 | 1999-12-21 | Matsushita Electric Industrial Co., Ltd. | Image conversion apparatus for transforming compressed image data of different resolutions wherein side information is scaled |
GB9417138D0 (en) | 1994-08-23 | 1994-10-12 | Discovision Ass | Data rate conversion |
US5781184A (en) * | 1994-09-23 | 1998-07-14 | Wasserman; Steve C. | Real time decompression and post-decompress manipulation of compressed full motion video |
US5666475A (en) * | 1995-01-03 | 1997-09-09 | University Of Washington | Method and system for editing multiresolution images at fractional-levels of resolution using a wavelet representation |
US5727089A (en) * | 1995-01-05 | 1998-03-10 | Eastman Kodak Company | Method and apparatus for multiple quality transaction card images |
US5577180A (en) * | 1995-01-05 | 1996-11-19 | The 3Do Company | Zone data streaming for 3-dimensional video environment |
US5835637A (en) * | 1995-03-20 | 1998-11-10 | Eastman Kodak Company | Method and apparatus for sharpening an image by scaling spatial residual components during image reconstruction |
JPH08271980A (ja) * | 1995-03-30 | 1996-10-18 | Minolta Co Ltd | 画像読取装置 |
US5742892A (en) * | 1995-04-18 | 1998-04-21 | Sun Microsystems, Inc. | Decoder for a software-implemented end-to-end scalable video delivery system |
EP0750428B1 (en) * | 1995-06-22 | 2004-03-31 | Canon Kabushiki Kaisha | Image processing apparatus and method |
US5793892A (en) * | 1995-06-27 | 1998-08-11 | Motorola, Inc. | Method and system for compressing a pixel map signal using dynamic quantization |
US5742707A (en) * | 1995-06-27 | 1998-04-21 | Motorola, Inc. | Method and system for compressing a pixel map signal using a hybrid polynomial coefficient signal |
US5727084A (en) * | 1995-06-27 | 1998-03-10 | Motorola, Inc. | Method and system for compressing a pixel map signal using block overlap |
US5768427A (en) * | 1995-06-27 | 1998-06-16 | Motorola, Inc. | Method and system for compressing a video signal using nonlinear interpolation |
JP3347591B2 (ja) * | 1995-07-31 | 2002-11-20 | キヤノン株式会社 | 画像処理方法及び装置 |
JP3516534B2 (ja) * | 1995-08-31 | 2004-04-05 | シャープ株式会社 | 映像情報符号化装置及び映像情報復号化装置 |
WO1997016926A1 (en) * | 1995-10-31 | 1997-05-09 | Sarnoff Corporation | Method and apparatus for determining ambient conditions from an image sequence |
IL117133A (en) | 1996-02-14 | 1999-07-14 | Olivr Corp Ltd | Method and system for providing on-line virtual reality movies |
US5801778A (en) * | 1996-05-23 | 1998-09-01 | C-Cube Microsystems, Inc. | Video encoding with multi-stage projection motion estimation |
US6101276A (en) * | 1996-06-21 | 2000-08-08 | Compaq Computer Corporation | Method and apparatus for performing two pass quality video compression through pipelining and buffer management |
US6292591B1 (en) * | 1996-07-17 | 2001-09-18 | Sony Coporation | Image coding and decoding using mapping coefficients corresponding to class information of pixel blocks |
AU718453B2 (en) | 1996-07-17 | 2000-04-13 | Sony Corporation | Image coding and decoding using mapping coefficients corresponding to class information of pixel blocks |
TW359919B (en) | 1996-07-17 | 1999-06-01 | Sony Corp | Image coding apparatus, image coding method, image decoding method, image decoding apparatus, image data transmitting method and recording medium |
AU714554B2 (en) | 1996-07-17 | 2000-01-06 | Sony Corporation | Image coding and decoding using mapping coefficients corresponding to class information of pixel blocks |
US6381369B1 (en) | 1996-07-17 | 2002-04-30 | Sony Corporation | Image coding apparatus, image coding method, image decoding method, image decoding apparatus, image data transmitting method and recording medium |
JPH1091795A (ja) * | 1996-09-12 | 1998-04-10 | Toshiba Corp | 移動物体検出装置及び移動物体検出方法 |
US6269190B1 (en) | 1996-09-24 | 2001-07-31 | Electronics For Imaging, Inc. | Computer system for processing images using a virtual frame buffer |
US5995724A (en) * | 1996-11-01 | 1999-11-30 | Mikkelsen; Carl | Image process system and process using personalization techniques |
US6094453A (en) * | 1996-10-11 | 2000-07-25 | Digital Accelerator Corporation | Digital data compression with quad-tree coding of header file |
US5861920A (en) * | 1996-11-08 | 1999-01-19 | Hughes Electronics Corporation | Hierarchical low latency video compression |
US5995671A (en) * | 1996-11-08 | 1999-11-30 | Hughes Electronics Corporation | Efficient representation of texture for gray scale alpha maps |
US6037983A (en) * | 1996-11-08 | 2000-03-14 | Hughes Electronics Corporation | High quality reduced latency transmission of video objects |
US6195079B1 (en) | 1996-11-18 | 2001-02-27 | Sage, Inc. | On-screen user interface for a video adapter circuit |
US6078361A (en) * | 1996-11-18 | 2000-06-20 | Sage, Inc | Video adapter circuit for conversion of an analog video signal to a digital display image |
US6480541B1 (en) | 1996-11-27 | 2002-11-12 | Realnetworks, Inc. | Method and apparatus for providing scalable pre-compressed digital video with reduced quantization based artifacts |
EP2175659B1 (en) * | 1996-12-04 | 2012-11-14 | Panasonic Corporation | Optical disk for high resolution and three-dimensional video recording, optical disk reproduction apparatus, and optical disk recording apparatus |
US6078958A (en) * | 1997-01-31 | 2000-06-20 | Hughes Electronics Corporation | System for allocating available bandwidth of a concentrated media output |
US6005620A (en) * | 1997-01-31 | 1999-12-21 | Hughes Electronics Corporation | Statistical multiplexer for live and pre-compressed video |
US6091455A (en) * | 1997-01-31 | 2000-07-18 | Hughes Electronics Corporation | Statistical multiplexer for recording video |
US6097435A (en) * | 1997-01-31 | 2000-08-01 | Hughes Electronics Corporation | Video system with selectable bit rate reduction |
US6084910A (en) * | 1997-01-31 | 2000-07-04 | Hughes Electronics Corporation | Statistical multiplexer for video signals |
US6188436B1 (en) | 1997-01-31 | 2001-02-13 | Hughes Electronics Corporation | Video broadcast system with video data shifting |
EP0901735A1 (en) * | 1997-03-12 | 1999-03-17 | Matsushita Electric Industrial Co., Ltd | Hdtv downconversion system |
US6539120B1 (en) * | 1997-03-12 | 2003-03-25 | Matsushita Electric Industrial Co., Ltd. | MPEG decoder providing multiple standard output signals |
US6335760B1 (en) * | 1997-03-27 | 2002-01-01 | Asahi Kogaku Kogyo Kabsushiki Kaisha | Image signal reproduction device |
DE69815086T2 (de) * | 1997-03-27 | 2004-04-01 | Hewlett-Packard Co. (N.D.Ges.D.Staates Delaware), Palo Alto | Adressendecodiersystem |
US6535878B1 (en) * | 1997-05-02 | 2003-03-18 | Roxio, Inc. | Method and system for providing on-line interactivity over a server-client network |
US5968120A (en) * | 1997-05-02 | 1999-10-19 | Olivr Corporation Ltd. | Method and system for providing on-line interactivity over a server-client network |
US6064771A (en) * | 1997-06-23 | 2000-05-16 | Real-Time Geometry Corp. | System and method for asynchronous, adaptive moving picture compression, and decompression |
US6167155A (en) * | 1997-07-28 | 2000-12-26 | Physical Optics Corporation | Method of isomorphic singular manifold projection and still/video imagery compression |
US6581170B1 (en) | 1997-10-23 | 2003-06-17 | Sony Corporation | Source coding to provide for robust error recovery during transmission losses |
US6163868A (en) | 1997-10-23 | 2000-12-19 | Sony Corporation | Apparatus and method for providing robust error recovery for errors that occur in a lossy transmission environment |
US6282684B1 (en) | 1997-10-23 | 2001-08-28 | Sony Corporation | Apparatus and method for recovery of data in a lossy transmission environment |
JP3915855B2 (ja) | 1997-12-19 | 2007-05-16 | ソニー株式会社 | 画像符号化装置および画像符号化方法、並びに学習装置および学習方法 |
US6337882B1 (en) | 1998-03-06 | 2002-01-08 | Lucent Technologies Inc. | Method and apparatus for generating unlimited selected image views from a larger image |
KR100354531B1 (ko) * | 1998-05-06 | 2005-12-21 | 삼성전자 주식회사 | 실시간 복호화를 위한 무손실 부호화 및 복호화 시스템 |
US6804294B1 (en) * | 1998-08-11 | 2004-10-12 | Lucent Technologies Inc. | Method and apparatus for video frame selection for improved coding quality at low bit-rates |
US6285784B1 (en) | 1998-09-28 | 2001-09-04 | Eastman Kodak Company | Method of applying manipulations to an extended color gamut digital image |
US6335983B1 (en) | 1998-09-28 | 2002-01-01 | Eastman Kodak Company | Representing an extended color gamut digital image in a limited color gamut color space |
US6282312B1 (en) | 1998-09-28 | 2001-08-28 | Eastman Kodak Company | System using one or more residual image(s) to represent an extended color gamut digital image |
US6282311B1 (en) | 1998-09-28 | 2001-08-28 | Eastman Kodak Company | Using a residual image to represent an extended color gamut digital image |
US6438556B1 (en) * | 1998-12-11 | 2002-08-20 | International Business Machines Corporation | Method and system for compressing data which allows access to data without full uncompression |
US7010737B2 (en) * | 1999-02-12 | 2006-03-07 | Sony Corporation | Method and apparatus for error data recovery |
US6178266B1 (en) | 1999-02-12 | 2001-01-23 | Sony Corporation | Method and apparatus for the recovery of compression constants in the encoded domain |
US6292876B1 (en) | 1999-02-12 | 2001-09-18 | Hewlett-Packard Co | Method for providing access protection for SCSI storage devices |
US6535148B1 (en) | 1999-02-12 | 2003-03-18 | Sony Corporation | Method and apparatus for truncated decoding |
US6192161B1 (en) | 1999-02-12 | 2001-02-20 | Sony Corporation | Method and apparatus for adaptive filter tap selection according to a class |
US6519369B1 (en) | 1999-02-12 | 2003-02-11 | Sony Corporation | Method and apparatus for filter tap expansion |
US6418548B1 (en) | 1999-02-12 | 2002-07-09 | Sony Corporation | Method and apparatus for preprocessing for peripheral erroneous data |
US6170074B1 (en) | 1999-02-12 | 2001-01-02 | Sony Corporation | Source coding to provide for robust error recovery |
US6621936B1 (en) | 1999-02-12 | 2003-09-16 | Sony Corporation | Method and apparatus for spatial class reduction |
US6154761A (en) * | 1999-02-12 | 2000-11-28 | Sony Corporation | Classified adaptive multiple processing system |
US6307979B1 (en) | 1999-02-12 | 2001-10-23 | Sony Corporation | Classified adaptive error recovery method and apparatus |
US6151416A (en) * | 1999-02-12 | 2000-11-21 | Sony Corporation | Method and apparatus for adaptive class tap selection according to multiple classification |
US6363118B1 (en) | 1999-02-12 | 2002-03-26 | Sony Corporation | Apparatus and method for the recovery of compression constants in the encoded domain |
US6591398B1 (en) | 1999-02-12 | 2003-07-08 | Sony Corporation | Multiple processing system |
US6307560B1 (en) | 1999-02-12 | 2001-10-23 | Sony Corporation | Classified adaptive spatio-temporal format conversion method and apparatus |
US7730300B2 (en) | 1999-03-30 | 2010-06-01 | Sony Corporation | Method and apparatus for protecting the transfer of data |
US7565546B2 (en) | 1999-03-30 | 2009-07-21 | Sony Corporation | System, method and apparatus for secure digital content transmission |
US6697489B1 (en) | 1999-03-30 | 2004-02-24 | Sony Corporation | Method and apparatus for securing control words |
US6636639B1 (en) * | 1999-04-01 | 2003-10-21 | Canon Kabushiki Kaisha | Image recording apparatus, image recording method and storage medium |
JP2000308021A (ja) * | 1999-04-20 | 2000-11-02 | Niigata Seimitsu Kk | 画像処理回路 |
JP3527137B2 (ja) * | 1999-06-03 | 2004-05-17 | Kddi株式会社 | 冗長2重化伝送における画像障害検出装置 |
US6549672B1 (en) | 1999-06-29 | 2003-04-15 | Sony Corporation | Method and apparatus for recovery of encoded data using central value |
US6473876B1 (en) | 1999-06-29 | 2002-10-29 | Sony Corporation | Method and apparatus for encoding of bitstreams using rotation |
US6389562B1 (en) | 1999-06-29 | 2002-05-14 | Sony Corporation | Source code shuffling to provide for robust error recovery |
US6493842B1 (en) | 1999-06-29 | 2002-12-10 | Sony Corporation | Time-varying randomization for data synchronization and implicit information transmission |
US6795585B1 (en) | 1999-07-16 | 2004-09-21 | Eastman Kodak Company | Representing digital images in a plurality of image processing states |
US6512838B1 (en) * | 1999-09-22 | 2003-01-28 | Canesta, Inc. | Methods for enhancing performance and data acquired from three-dimensional image systems |
US6351494B1 (en) | 1999-09-24 | 2002-02-26 | Sony Corporation | Classified adaptive error recovery method and apparatus |
US6522785B1 (en) | 1999-09-24 | 2003-02-18 | Sony Corporation | Classified adaptive error recovery method and apparatus |
US7039614B1 (en) | 1999-11-09 | 2006-05-02 | Sony Corporation | Method for simulcrypting scrambled data to a plurality of conditional access devices |
US6539517B1 (en) | 1999-11-09 | 2003-03-25 | Sony Corporation | Data transformation for explicit transmission of control information |
US6754371B1 (en) | 1999-12-07 | 2004-06-22 | Sony Corporation | Method and apparatus for past and future motion classification |
US6301393B1 (en) | 2000-01-21 | 2001-10-09 | Eastman Kodak Company | Using a residual image formed from a clipped limited color gamut digital image to represent an extended color gamut digital image |
US7225164B1 (en) | 2000-02-15 | 2007-05-29 | Sony Corporation | Method and apparatus for implementing revocation in broadcast networks |
US6597811B1 (en) * | 2000-03-27 | 2003-07-22 | Eduard Batkilim | Method and device for image digitized data compression and decompression |
US6822760B1 (en) | 2000-04-05 | 2004-11-23 | Eastman Kodak Company | Method of processing and paying for an extended color gamut digital image |
US9609278B2 (en) | 2000-04-07 | 2017-03-28 | Koplar Interactive Systems International, Llc | Method and system for auxiliary data detection and delivery |
JP2002064821A (ja) * | 2000-06-06 | 2002-02-28 | Office Noa:Kk | 動画像情報の圧縮方法およびそのシステム |
US20020136538A1 (en) * | 2001-03-22 | 2002-09-26 | Koninklijke Philips Electronics N.V. | Smart quality setting for personal TV recording |
US7110664B2 (en) * | 2001-04-20 | 2006-09-19 | Front Porch Digital, Inc. | Methods and apparatus for indexing and archiving encoded audio-video data |
US7035468B2 (en) * | 2001-04-20 | 2006-04-25 | Front Porch Digital Inc. | Methods and apparatus for archiving, indexing and accessing audio and video data |
US6947598B2 (en) | 2001-04-20 | 2005-09-20 | Front Porch Digital Inc. | Methods and apparatus for generating, including and using information relating to archived audio/video data |
US7747853B2 (en) | 2001-06-06 | 2010-06-29 | Sony Corporation | IP delivery of secure digital content |
US7350082B2 (en) | 2001-06-06 | 2008-03-25 | Sony Corporation | Upgrading of encryption |
US7895616B2 (en) | 2001-06-06 | 2011-02-22 | Sony Corporation | Reconstitution of program streams split across multiple packet identifiers |
US7151831B2 (en) | 2001-06-06 | 2006-12-19 | Sony Corporation | Partial encryption and PID mapping |
JP2003134352A (ja) * | 2001-10-26 | 2003-05-09 | Konica Corp | 画像処理方法及び装置並びにプログラム |
US7823174B2 (en) | 2002-01-02 | 2010-10-26 | Sony Corporation | Macro-block based content replacement by PID mapping |
US7233669B2 (en) | 2002-01-02 | 2007-06-19 | Sony Corporation | Selective encryption to enable multiple decryption keys |
US7242773B2 (en) | 2002-09-09 | 2007-07-10 | Sony Corporation | Multiple partial encryption using retuning |
US7376233B2 (en) | 2002-01-02 | 2008-05-20 | Sony Corporation | Video slice and active region based multiple partial encryption |
US7215770B2 (en) | 2002-01-02 | 2007-05-08 | Sony Corporation | System and method for partially encrypted multimedia stream |
US7155012B2 (en) | 2002-01-02 | 2006-12-26 | Sony Corporation | Slice mask and moat pattern partial encryption |
US7302059B2 (en) | 2002-01-02 | 2007-11-27 | Sony Corporation | Star pattern partial encryption |
US7765567B2 (en) | 2002-01-02 | 2010-07-27 | Sony Corporation | Content replacement by PID mapping |
US7292691B2 (en) | 2002-01-02 | 2007-11-06 | Sony Corporation | Progressive video refresh slice detection |
US7218738B2 (en) | 2002-01-02 | 2007-05-15 | Sony Corporation | Encryption and content control in a digital broadcast system |
US7170936B2 (en) * | 2002-03-28 | 2007-01-30 | Intel Corporation | Transcoding apparatus, system, and method |
US7302006B2 (en) | 2002-04-30 | 2007-11-27 | Hewlett-Packard Development Company, L.P. | Compression of images and image sequences through adaptive partitioning |
US7530084B2 (en) | 2002-05-28 | 2009-05-05 | Sony Corporation | Method and apparatus for synchronizing dynamic graphics |
US8818896B2 (en) | 2002-09-09 | 2014-08-26 | Sony Corporation | Selective encryption with coverage encryption |
US7724907B2 (en) | 2002-11-05 | 2010-05-25 | Sony Corporation | Mechanism for protecting the transfer of digital content |
US8572408B2 (en) | 2002-11-05 | 2013-10-29 | Sony Corporation | Digital rights management of a digital device |
US8667525B2 (en) | 2002-12-13 | 2014-03-04 | Sony Corporation | Targeted advertisement selection from a digital stream |
US8645988B2 (en) | 2002-12-13 | 2014-02-04 | Sony Corporation | Content personalization for digital content |
US20040165586A1 (en) * | 2003-02-24 | 2004-08-26 | Read Christopher Jensen | PID filters based network routing |
US7409702B2 (en) | 2003-03-20 | 2008-08-05 | Sony Corporation | Auxiliary program association table |
US7292692B2 (en) | 2003-03-25 | 2007-11-06 | Sony Corporation | Content scrambling with minimal impact on legacy devices |
US7129987B1 (en) * | 2003-07-02 | 2006-10-31 | Raymond John Westwater | Method for converting the resolution and frame rate of video data using Discrete Cosine Transforms |
US7286667B1 (en) | 2003-09-15 | 2007-10-23 | Sony Corporation | Decryption system |
US7263187B2 (en) | 2003-10-31 | 2007-08-28 | Sony Corporation | Batch mode session-based encryption of video on demand content |
US7853980B2 (en) | 2003-10-31 | 2010-12-14 | Sony Corporation | Bi-directional indices for trick mode video-on-demand |
US7346163B2 (en) | 2003-10-31 | 2008-03-18 | Sony Corporation | Dynamic composition of pre-encrypted video on demand content |
US7620180B2 (en) | 2003-11-03 | 2009-11-17 | Sony Corporation | Preparation of content for multiple conditional access methods in video on demand |
US7343013B2 (en) | 2003-12-16 | 2008-03-11 | Sony Corporation | Composite session-based encryption of video on demand content |
EP1538844A3 (en) * | 2003-11-26 | 2006-05-31 | Samsung Electronics Co., Ltd. | Color image residue transformation and encoding method |
EP1769400B1 (en) * | 2004-06-25 | 2018-03-07 | Oracle International Corporation | Method and system for automated migration of media archives |
US20060039020A1 (en) * | 2004-08-20 | 2006-02-23 | Canon Kabushiki Kaisha | Image supply device, control method thereof and printing system |
KR100616618B1 (ko) * | 2004-09-03 | 2006-08-28 | 삼성전기주식회사 | 고주파 모듈레이터 |
KR101174131B1 (ko) * | 2004-10-14 | 2012-08-14 | 삼성전자주식회사 | 멀티미디어 방송 수신시의 에러 검출 방법 및 장치 |
US8744184B2 (en) * | 2004-10-22 | 2014-06-03 | Autodesk, Inc. | Graphics processing method and system |
KR100647294B1 (ko) * | 2004-11-09 | 2006-11-23 | 삼성전자주식회사 | 화상 데이터 부호화 및 복호화 방법 및 장치 |
US7895617B2 (en) | 2004-12-15 | 2011-02-22 | Sony Corporation | Content substitution editor |
US8041190B2 (en) | 2004-12-15 | 2011-10-18 | Sony Corporation | System and method for the creation, synchronization and delivery of alternate content |
US7894531B1 (en) * | 2005-02-15 | 2011-02-22 | Grandeye Ltd. | Method of compression for wide angle digital video |
WO2006125342A1 (fr) * | 2005-05-25 | 2006-11-30 | Lin, Hui | Procede de compression d'information pour fichier audio numerique |
KR100873636B1 (ko) * | 2005-11-14 | 2008-12-12 | 삼성전자주식회사 | 단일 부호화 모드를 이용하는 영상 부호화/복호화 방법 및장치 |
US20070189621A1 (en) * | 2006-02-15 | 2007-08-16 | Aten International Co., Ltd | Image transmission system |
US8185921B2 (en) | 2006-02-28 | 2012-05-22 | Sony Corporation | Parental control of displayed content using closed captioning |
US7555464B2 (en) | 2006-03-01 | 2009-06-30 | Sony Corporation | Multiple DRM management |
US7639883B2 (en) * | 2006-04-18 | 2009-12-29 | Nokia Corporation | Method, device, mobile terminal and computer program product for providing variable compression of data files |
US7519507B1 (en) * | 2006-08-24 | 2009-04-14 | Nvidia Corporation | System, method, and computer program product for quantitative video benchmarking |
JP4358215B2 (ja) * | 2006-09-27 | 2009-11-04 | 株式会社東芝 | 動画像符号化装置及びその方法 |
US8212805B1 (en) | 2007-01-05 | 2012-07-03 | Kenneth Banschick | System and method for parametric display of modular aesthetic designs |
US20090010533A1 (en) * | 2007-07-05 | 2009-01-08 | Mediatek Inc. | Method and apparatus for displaying an encoded image |
US8798133B2 (en) * | 2007-11-29 | 2014-08-05 | Koplar Interactive Systems International L.L.C. | Dual channel encoding and detection |
US8391638B2 (en) * | 2008-06-04 | 2013-03-05 | Microsoft Corporation | Hybrid image format |
US8325796B2 (en) | 2008-09-11 | 2012-12-04 | Google Inc. | System and method for video coding using adaptive segmentation |
JP5241410B2 (ja) * | 2008-09-29 | 2013-07-17 | 株式会社キーエンス | 画像処理装置、画像処理方法及びコンピュータプログラム |
US8484368B2 (en) * | 2009-10-02 | 2013-07-09 | Disney Enterprises, Inc. | Method and system for optimizing download and instantaneous viewing of media files |
JP2011139276A (ja) * | 2009-12-28 | 2011-07-14 | Sony Computer Entertainment Inc | 画像処理装置および画像処理方法 |
US8908048B2 (en) * | 2010-08-24 | 2014-12-09 | Crestron Electronics Inc. | Digital video pixel tester |
KR101383775B1 (ko) * | 2011-05-20 | 2014-04-14 | 주식회사 케이티 | 화면 내 예측 방법 및 장치 |
CN103733628A (zh) * | 2011-08-08 | 2014-04-16 | 摩托罗拉移动有限责任公司 | 变换单元分割的残差树结构 |
US9392272B1 (en) | 2014-06-02 | 2016-07-12 | Google Inc. | Video coding using adaptive source variance based partitioning |
US9578324B1 (en) | 2014-06-27 | 2017-02-21 | Google Inc. | Video coding using statistical-based spatially differentiated partitioning |
KR101912769B1 (ko) * | 2014-10-24 | 2018-10-29 | 엘지전자 주식회사 | 그래프 템플릿으로부터 유도된 변환을 이용하여 비디오 신호를 디코딩/인코딩하는 방법 및 장치 |
WO2016190690A1 (ko) * | 2015-05-26 | 2016-12-01 | 엘지전자(주) | 적응적인 분리가능한 그래프 기반 변환을 이용하여 비디오 신호를 처리하는 방법 및 장치 |
US10303498B2 (en) | 2015-10-01 | 2019-05-28 | Microsoft Technology Licensing, Llc | Performance optimizations for emulators |
US11042422B1 (en) | 2020-08-31 | 2021-06-22 | Microsoft Technology Licensing, Llc | Hybrid binaries supporting code stream folding |
US11403100B2 (en) | 2020-08-31 | 2022-08-02 | Microsoft Technology Licensing, Llc | Dual architecture function pointers having consistent reference addresses |
US11231918B1 (en) | 2020-08-31 | 2022-01-25 | Microsoft Technologly Licensing, LLC | Native emulation compatible application binary interface for supporting emulation of foreign code |
Family Cites Families (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4268861A (en) * | 1978-09-18 | 1981-05-19 | Massachusetts Institute Of Technology | Image coding |
US4520401A (en) * | 1982-04-16 | 1985-05-28 | Victor Company Of Japan, Ltd. | Digital video signal recording system and reproducing apparatus |
GB8329109D0 (en) * | 1983-11-01 | 1983-12-07 | Rca Corp | Perceived signal-to-noise ratio of displayed images |
GB8429879D0 (en) * | 1984-11-27 | 1985-01-03 | Rca Corp | Signal processing apparatus |
GB8518803D0 (en) * | 1985-07-25 | 1985-08-29 | Rca Corp | Locating target patterns within images |
US4709394A (en) * | 1985-08-23 | 1987-11-24 | Rca Corporation | Multiplexed real-time pyramid signal processing system |
NL8701261A (nl) * | 1987-05-27 | 1988-12-16 | Philips Nv | Televisie-overdrachtsysteem met pyramidale kodeer/dekodeerschakeling. |
US5079630A (en) * | 1987-10-05 | 1992-01-07 | Intel Corporation | Adaptive video compression system |
US4868653A (en) * | 1987-10-05 | 1989-09-19 | Intel Corporation | Adaptive digital video compression system |
US4785349A (en) * | 1987-10-05 | 1988-11-15 | Technology Inc. 64 | Digital video decompression system |
NL8801155A (nl) * | 1988-05-03 | 1989-12-01 | Philips Nv | Televisie-overdrachtsysteem met hybride kodeerschakeling. |
US5048111A (en) * | 1989-11-06 | 1991-09-10 | Eastman Kodak Company | Hybrid subband-based hierarchical storage and display method for high resolution digital images in a multiuse environment |
US5050230A (en) * | 1989-11-29 | 1991-09-17 | Eastman Kodak Company | Hybrid residual-based hierarchical storage and display method for high resolution digital images in a multiuse environment |
-
1991
- 1991-02-19 US US07/657,708 patent/US5122873A/en not_active Expired - Lifetime
-
1992
- 1992-02-13 JP JP50730892A patent/JP2002517176A/ja active Pending
- 1992-02-13 AU AU14699/92A patent/AU1469992A/en not_active Abandoned
- 1992-02-13 WO PCT/US1992/001229 patent/WO1992015173A1/en not_active Application Discontinuation
- 1992-02-13 EP EP92907413A patent/EP0574502A1/en not_active Withdrawn
Also Published As
Publication number | Publication date |
---|---|
WO1992015173A1 (en) | 1992-09-03 |
EP0574502A1 (en) | 1993-12-22 |
AU1469992A (en) | 1992-09-15 |
US5122873A (en) | 1992-06-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2002517176A (ja) | デジタル動きビデオ信号のコード化と復号の方法および装置 | |
US4868653A (en) | Adaptive digital video compression system | |
US5079630A (en) | Adaptive video compression system | |
US4918523A (en) | Digital video formatting and transmission system and method | |
US5225904A (en) | Adaptive digital video compression system | |
US4785349A (en) | Digital video decompression system | |
US6006276A (en) | Enhanced video data compression in intelligent video information management system | |
US5228098A (en) | Adaptive spatio-temporal compression/decompression of video image signals | |
EP0499303B1 (en) | Method and apparatus for shuffling and deshuffling data | |
JPH05234260A (ja) | ディジタルvtr | |
JPH08237669A (ja) | 画像信号処理装置、画像信号処理方法および画像信号復号化装置 | |
US5613091A (en) | Data compression | |
WO1993020652A1 (en) | Method and apparatus for compressing and decompressing a sequence of digital video images using sync frames | |
US20120093227A1 (en) | Data compression method and data compression device | |
JP3384727B2 (ja) | 画像復号装置 | |
JPH0678297A (ja) | ディジタルビデオ信号の符号化方法 | |
AU625594B2 (en) | Digital video decompression system | |
CA2326674C (en) | Video compression in information system | |
AU622880B2 (en) | Digital video transmission system | |
AU624089B2 (en) | Digital video compression system | |
JPH10313455A (ja) | 監視画像記録装置およびその再生装置 | |
JPH0686257A (ja) | 画像符号化装置 | |
JPH0795530A (ja) | 画像圧縮記録再生装置 |