JPH08275149A - データ符号化方法 - Google Patents
データ符号化方法Info
- Publication number
- JPH08275149A JPH08275149A JP8036725A JP3672596A JPH08275149A JP H08275149 A JPH08275149 A JP H08275149A JP 8036725 A JP8036725 A JP 8036725A JP 3672596 A JP3672596 A JP 3672596A JP H08275149 A JPH08275149 A JP H08275149A
- Authority
- JP
- Japan
- Prior art keywords
- data
- picture
- instruction
- field
- discrete cosine
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N11/00—Colour television systems
- H04N11/04—Colour television systems using pulse code modulation
- H04N11/042—Codec means
- H04N11/044—Codec means involving transform coding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/132—Sampling, masking or truncation of coding units, e.g. adaptive resampling, frame skipping, frame interpolation or high-frequency transform coefficient masking
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/186—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a colour or a chrominance component
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/42—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation
- H04N19/423—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation characterised by memory arrangements
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/587—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal sub-sampling or interpolation, e.g. decimation or subsequent interpolation of pictures in a video sequence
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/60—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
- H04N19/61—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
(57)【要約】
【課題】 符号化プロセス、特に離散余弦変換符号化プ
ロセスの速度を向上するシステムを提供する。 【解決手段】 ルミナンス成分及びクロミナンス成分を
有するデジタル・ビデオ・イメージ・データを符号化す
る方法が開示され、クロミナンス成分がルミナンス成分
の空間分解能の1/4に符号化される。
ロセスの速度を向上するシステムを提供する。 【解決手段】 ルミナンス成分及びクロミナンス成分を
有するデジタル・ビデオ・イメージ・データを符号化す
る方法が開示され、クロミナンス成分がルミナンス成分
の空間分解能の1/4に符号化される。
Description
【0001】
【発明の属する技術分野】本発明はビデオ符号器に関
し、特に、例えば離散余弦変換符号化ビデオ信号などの
ビデオ信号を符号化し、更に圧縮することを目的とする
ビデオ符号器に関する。本発明は特に、デジタル・ビデ
オ信号の符号化のための動的に区分化可能なデジタル・
ビデオ・プロセッサに関する。ここで使用される動的に
区分化可能なデジタル・ビデオ・プロセッサは、n単位
プロセッサ(例えば4バイト幅プロセッサ)として、ま
たn個の1単位プロセッサ(例えば4個の1バイト幅プ
ロセッサ)として機能することを意味する。本発明の方
法、装置及びシステムは、同報信号、有線テレビ信号、
及びデジタル・ネットワーク信号を符号化する際に、ま
た高品位テレビ、対話式テレビ、マルチメディア、ビデ
オ・オン・デマンド、ビデオ会議、及びデジタル・ビデ
オ記録において、ビデオ信号を圧縮するために有用であ
る。本発明の方法及び装置は、特にルミナンス(輝度)
成分及びクロミナンス(色差)成分を有するデジタル・
ビデオ・イメージ・データの符号化方法に関し、クロミ
ナンス成分がルミナンス成分の空間分解能の1/4に符
号化される。
し、特に、例えば離散余弦変換符号化ビデオ信号などの
ビデオ信号を符号化し、更に圧縮することを目的とする
ビデオ符号器に関する。本発明は特に、デジタル・ビデ
オ信号の符号化のための動的に区分化可能なデジタル・
ビデオ・プロセッサに関する。ここで使用される動的に
区分化可能なデジタル・ビデオ・プロセッサは、n単位
プロセッサ(例えば4バイト幅プロセッサ)として、ま
たn個の1単位プロセッサ(例えば4個の1バイト幅プ
ロセッサ)として機能することを意味する。本発明の方
法、装置及びシステムは、同報信号、有線テレビ信号、
及びデジタル・ネットワーク信号を符号化する際に、ま
た高品位テレビ、対話式テレビ、マルチメディア、ビデ
オ・オン・デマンド、ビデオ会議、及びデジタル・ビデ
オ記録において、ビデオ信号を圧縮するために有用であ
る。本発明の方法及び装置は、特にルミナンス(輝度)
成分及びクロミナンス(色差)成分を有するデジタル・
ビデオ・イメージ・データの符号化方法に関し、クロミ
ナンス成分がルミナンス成分の空間分解能の1/4に符
号化される。
【0002】
【従来の技術】MPEG−2草案規格(MPEGはMovi
ng Picture Experts' Groupの略称)は、デジタル・ビ
デオ・アプリケーションにおける圧縮/伸長規格であ
る。この規格は、無損失圧縮によりフォローされる本来
的な有損失圧縮による実質的な帯域幅の低減に帰する符
号化方法を記述する。符号化され、圧縮されるデジタル
・ビデオ・データは、実質的にMPEG−2草案規格準
拠の復号器により伸長され、復号化される。
ng Picture Experts' Groupの略称)は、デジタル・ビ
デオ・アプリケーションにおける圧縮/伸長規格であ
る。この規格は、無損失圧縮によりフォローされる本来
的な有損失圧縮による実質的な帯域幅の低減に帰する符
号化方法を記述する。符号化され、圧縮されるデジタル
・ビデオ・データは、実質的にMPEG−2草案規格準
拠の復号器により伸長され、復号化される。
【0003】MPEG−2草案規格については、例えば
C.A.Gonzales及びE.Viscitoによる"Motion Video Ad
aptive Quantization In The Transform Domain"、IEEE
Trans Circuits Syst Video Technol、Volume 1、No.
4、Dec.1991、pp.374-378、E.Viscito及びC.A.Gon
zalesによる"Encoding of Motion Video Sequencesfor
the MPEG Environment Using Arithmetic Coding"、SPI
E、Vol.1360、pp.1572-1576、(1990)、D.LeGallに
よる"MPEG:A Video Compression Standardfor Multime
dia Applications"、Communications of the ACM、Vo
l.34、No.4、(April 1991)、pp.46-58、S.Purcel
l及びD.Galbiによる"C Cube MPEG Video Processor"、
SPIE、v.1659、(1992)、pp.24-29、及びD.J.LeGa
llによる"MPEG Video Compression Algorithm"、Signal
Process Image Commun、v.4、n.2、(1992)、pp.1
29-140などで述べられている。
C.A.Gonzales及びE.Viscitoによる"Motion Video Ad
aptive Quantization In The Transform Domain"、IEEE
Trans Circuits Syst Video Technol、Volume 1、No.
4、Dec.1991、pp.374-378、E.Viscito及びC.A.Gon
zalesによる"Encoding of Motion Video Sequencesfor
the MPEG Environment Using Arithmetic Coding"、SPI
E、Vol.1360、pp.1572-1576、(1990)、D.LeGallに
よる"MPEG:A Video Compression Standardfor Multime
dia Applications"、Communications of the ACM、Vo
l.34、No.4、(April 1991)、pp.46-58、S.Purcel
l及びD.Galbiによる"C Cube MPEG Video Processor"、
SPIE、v.1659、(1992)、pp.24-29、及びD.J.LeGa
llによる"MPEG Video Compression Algorithm"、Signal
Process Image Commun、v.4、n.2、(1992)、pp.1
29-140などで述べられている。
【0004】MPEG−2草案規格は、フレーム内符号
化だけでは達成不能な圧縮を達成する一方で、純粋なフ
レーム内符号化のランダム・アクセスの利点を保存する
超高圧縮技術を指定する。MPEG−2草案規格におけ
る周波数領域フレーム内符号化と補間的/予測的フレー
ム間符号化との組み合わせは、フレーム内符号化だけの
場合とフレーム間符号化だけの場合の間のバランスを保
つ結果となる。
化だけでは達成不能な圧縮を達成する一方で、純粋なフ
レーム内符号化のランダム・アクセスの利点を保存する
超高圧縮技術を指定する。MPEG−2草案規格におけ
る周波数領域フレーム内符号化と補間的/予測的フレー
ム間符号化との組み合わせは、フレーム内符号化だけの
場合とフレーム間符号化だけの場合の間のバランスを保
つ結果となる。
【0005】MPEG−2草案規格は、動き補正される
補間的かつ予測的符号化のために時間的冗長性を利用す
る。すなわち、局所的に現ピクチャが過去及び(また
は)将来におけるピクチャの変換としてモデル化されう
る。ここで"局所的"とは、変位の大きさ及び方向がピク
チャ内の至る所で同一でないことを意味する。
補間的かつ予測的符号化のために時間的冗長性を利用す
る。すなわち、局所的に現ピクチャが過去及び(また
は)将来におけるピクチャの変換としてモデル化されう
る。ここで"局所的"とは、変位の大きさ及び方向がピク
チャ内の至る所で同一でないことを意味する。
【0006】MPEG−2草案規格は、予測的かつ補間
的フレーム間符号化及び周波数領域フレーム内符号化を
指定し、時間的冗長性の低減のためのブロック・ベース
の動き補正と、空間的冗長性の低減のための離散的余弦
変換ベースの圧縮とを有する。MPEG−2草案規格の
下では、動き補正は予測符号化、補間的符号化、及び可
変長符号化動きベクトルにより達成される。動きに関す
る情報は、16×16ブロックにもとづき空間情報と一
緒に伝送される。またこれはハフマン・コードなどの可
変長コードにより圧縮される。
的フレーム間符号化及び周波数領域フレーム内符号化を
指定し、時間的冗長性の低減のためのブロック・ベース
の動き補正と、空間的冗長性の低減のための離散的余弦
変換ベースの圧縮とを有する。MPEG−2草案規格の
下では、動き補正は予測符号化、補間的符号化、及び可
変長符号化動きベクトルにより達成される。動きに関す
る情報は、16×16ブロックにもとづき空間情報と一
緒に伝送される。またこれはハフマン・コードなどの可
変長コードにより圧縮される。
【0007】MPEG−2草案規格は、様々な予測的か
つ補間的ツールの使用を通じ、時間的冗長性の低減を提
供する。これが図1に示される。図1は3つのタイプの
フレームまたはピクチャを示し、それらは内部ピクチ
ャ"I"、予測ピクチャ"P"、及び双方向補間ピクチャ"
B"である。
つ補間的ツールの使用を通じ、時間的冗長性の低減を提
供する。これが図1に示される。図1は3つのタイプの
フレームまたはピクチャを示し、それらは内部ピクチ
ャ"I"、予測ピクチャ"P"、及び双方向補間ピクチャ"
B"である。
【0008】内部ピクチャ"I"は適度な圧縮を提供し、
ビデオ・テープまたはCD−ROMの場合には、ランダ
ム・アクセスのためのアクセス・ポイントに相当する。
都合上、1つの内部ピクチャ"I"は約0.5秒毎に提供
される。内部ピクチャ"I"は自身からのみ情報を獲得
し、予測ピクチャ"P"または双方向補間ピクチャ"B"か
らは情報を受信しない。場面カット(scene cut)は、
好適には内部ピクチャ"I"において発生する。
ビデオ・テープまたはCD−ROMの場合には、ランダ
ム・アクセスのためのアクセス・ポイントに相当する。
都合上、1つの内部ピクチャ"I"は約0.5秒毎に提供
される。内部ピクチャ"I"は自身からのみ情報を獲得
し、予測ピクチャ"P"または双方向補間ピクチャ"B"か
らは情報を受信しない。場面カット(scene cut)は、
好適には内部ピクチャ"I"において発生する。
【0009】予測ピクチャ"P"は過去のピクチャに関し
て符号化される。予測ピクチャ"P"は将来のピクチ
ャ("P"及び"B"の両ピクチャ)の基準として使用され
る。
て符号化される。予測ピクチャ"P"は将来のピクチ
ャ("P"及び"B"の両ピクチャ)の基準として使用され
る。
【0010】双方向符号化ピクチャ"B"は最も高い圧縮
率を有する。これらは復元のために過去のピクチャ及び
将来のピクチャの両方を要求する。双方向ピクチャ"B"
は基準としては決して使用されない。
率を有する。これらは復元のために過去のピクチャ及び
将来のピクチャの両方を要求する。双方向ピクチャ"B"
は基準としては決して使用されない。
【0011】動き補正はピクチャ間の冗長性につなが
る。内部ピクチャ"I"からの予測ピクチャ"P"の形成、
及び1対の過去及び将来ピクチャからの双方向符号化ピ
クチャ"B"の形成は、MPEG−2草案規格技術の主要
な特長である。
る。内部ピクチャ"I"からの予測ピクチャ"P"の形成、
及び1対の過去及び将来ピクチャからの双方向符号化ピ
クチャ"B"の形成は、MPEG−2草案規格技術の主要
な特長である。
【0012】MPEG−2草案規格の下での動き補正単
位はマクロブロック単位である。MPEG−2草案規格
マクロブロックは16×16画素マクロブロックであ
る。動き情報は、前方予測マクロブロックに対する1ベ
クトル、後方予測マクロブロックに対する1ベクトル、
双方向予測マクロブロックに対する2ベクトルを含む。
各16×16マクロブロックに関連付けられる動き情報
は、基準マクロブロック内に存在する動き情報に関し差
別的に符号化される。このように、16×16マクロブ
ロックの画素が、過去または将来ピクチャからの16×
16マクロブロックの画素の変換により予測される。
位はマクロブロック単位である。MPEG−2草案規格
マクロブロックは16×16画素マクロブロックであ
る。動き情報は、前方予測マクロブロックに対する1ベ
クトル、後方予測マクロブロックに対する1ベクトル、
双方向予測マクロブロックに対する2ベクトルを含む。
各16×16マクロブロックに関連付けられる動き情報
は、基準マクロブロック内に存在する動き情報に関し差
別的に符号化される。このように、16×16マクロブ
ロックの画素が、過去または将来ピクチャからの16×
16マクロブロックの画素の変換により予測される。
【0013】原始画素と予測画素との差が対応ビット・
ストリーム内に含まれる。復号器は、復元ブロックを生
成するために修正項を予測画素のブロックに追加する。
ストリーム内に含まれる。復号器は、復元ブロックを生
成するために修正項を予測画素のブロックに追加する。
【0014】上述のように、また図1に示されるよう
に、予測ピクチャ"P"の各16×16画素ブロックが、
最も近い過去の内部ピクチャ"I"、または最も近い過去
の予測ピクチャ"P"に関して符号化される。
に、予測ピクチャ"P"の各16×16画素ブロックが、
最も近い過去の内部ピクチャ"I"、または最も近い過去
の予測ピクチャ"P"に関して符号化される。
【0015】更に、上述され、図1に示されるように、
双方向ピクチャ"B"の各16×16画素ブロックは、最
も近い過去の"I"または"P"ピクチャからの前方予測に
より、または最も近い将来の"I"または"P"からの後方
予測により、或いはまた双方向的に、最も近い過去の"
I"または"P"ピクチャと最も近い将来の"I"または"
P"ピクチャの両方を用いて符号化される。双方向予測
は最小ノイズ予測である。
双方向ピクチャ"B"の各16×16画素ブロックは、最
も近い過去の"I"または"P"ピクチャからの前方予測に
より、または最も近い将来の"I"または"P"からの後方
予測により、或いはまた双方向的に、最も近い過去の"
I"または"P"ピクチャと最も近い将来の"I"または"
P"ピクチャの両方を用いて符号化される。双方向予測
は最小ノイズ予測である。
【0016】動き情報は、予測子(predictor)として
使用される基準ピクチャの部分を示すために、各16×
16画素ブロックと共に送信される。
使用される基準ピクチャの部分を示すために、各16×
16画素ブロックと共に送信される。
【0017】上述のように、動きベクトルが過去の隣接
ブロックの動きベクトルに関し、差別的に符号化され
る。差別的動きベクトルを符号化するために可変長符号
化が使用され、あるブロックの動きベクトルが先行ブロ
ックの動きベクトルにほぼ等しい一般的な場合では、動
きベクトルを符号化するために少数のビットだけが必要
とされる。
ブロックの動きベクトルに関し、差別的に符号化され
る。差別的動きベクトルを符号化するために可変長符号
化が使用され、あるブロックの動きベクトルが先行ブロ
ックの動きベクトルにほぼ等しい一般的な場合では、動
きベクトルを符号化するために少数のビットだけが必要
とされる。
【0018】空間的冗長性はピクチャ内の冗長性であ
る。上述の動き補正プロセスのブロック・ベースの性質
により、MPEG−2草案規格では空間的冗長性を低減
するブロック・ベースの方法を使用することが望ましか
った。選択の方法は離散余弦変換、及びピクチャの離散
余弦変換符号化である。離散余弦変換符号化は、更に静
止レベルの圧縮を達成するために重み付けスカラ量子化
及びラン・レングス符号化と結合される。
る。上述の動き補正プロセスのブロック・ベースの性質
により、MPEG−2草案規格では空間的冗長性を低減
するブロック・ベースの方法を使用することが望ましか
った。選択の方法は離散余弦変換、及びピクチャの離散
余弦変換符号化である。離散余弦変換符号化は、更に静
止レベルの圧縮を達成するために重み付けスカラ量子化
及びラン・レングス符号化と結合される。
【0019】離散余弦変換は直交変換である。直交変換
は周波数領域解釈を有するので、フィルタ・バンク(fi
lter bank)指向である。離散余弦変換はまた局所化さ
れる。すなわち、符号化プロセスが、64個の変換係数
またはサブバンドを計算するために十分な8×8空間ウ
ィンドウ上でサンプリングする。
は周波数領域解釈を有するので、フィルタ・バンク(fi
lter bank)指向である。離散余弦変換はまた局所化さ
れる。すなわち、符号化プロセスが、64個の変換係数
またはサブバンドを計算するために十分な8×8空間ウ
ィンドウ上でサンプリングする。
【0020】離散余弦変換の別の利点は、高速符号化及
び復号化アルゴリズムが使用可能なことである。更に、
離散余弦変換のサブバンド分解は、精神的視覚的基準
(psychovisual criteria)の効果的な使用を可能にす
るように振る舞う。
び復号化アルゴリズムが使用可能なことである。更に、
離散余弦変換のサブバンド分解は、精神的視覚的基準
(psychovisual criteria)の効果的な使用を可能にす
るように振る舞う。
【0021】変換後、多くの周波数係数、特に高い空間
周波数の係数は0である。これらの係数は図2に示され
るようにジグザグに編成され、走行振幅(run-amplitud
e)(ランレベル)対に変換される。各対はゼロ係数の
数及び非ゼロ係数の振幅を示す。これは可変長コードに
より符号化される。
周波数の係数は0である。これらの係数は図2に示され
るようにジグザグに編成され、走行振幅(run-amplitud
e)(ランレベル)対に変換される。各対はゼロ係数の
数及び非ゼロ係数の振幅を示す。これは可変長コードに
より符号化される。
【0022】離散余弦変換符号化は、図2に示されるよ
うに3つのステージにおいて実行される。第1のステー
ジは離散余弦変換係数の計算である。第2のステージは
係数の量子化である。第3のステージは、データをジグ
ザグ走査順序に再編成した後の量子化変換係数の(走行
振幅)対への変換である。
うに3つのステージにおいて実行される。第1のステー
ジは離散余弦変換係数の計算である。第2のステージは
係数の量子化である。第3のステージは、データをジグ
ザグ走査順序に再編成した後の量子化変換係数の(走行
振幅)対への変換である。
【0023】量子化は非常に高度な圧縮及び高出力ビッ
ト・レートを可能にし、高いピクチャ品質を保持する。
ト・レートを可能にし、高いピクチャ品質を保持する。
【0024】量子化は適応的であり、内部ピクチャ"I"
は"ブロッキング"を回避するように、密な量子化を有す
る。このことは、内部ピクチャ"I"が全ての周波数にお
いてエネルギーを含むために重要である。それに対し
て、"P"及び"B"ピクチャはもっぱら高い周波数エネル
ギーを含み、粗な量子化により符号化される。
は"ブロッキング"を回避するように、密な量子化を有す
る。このことは、内部ピクチャ"I"が全ての周波数にお
いてエネルギーを含むために重要である。それに対し
て、"P"及び"B"ピクチャはもっぱら高い周波数エネル
ギーを含み、粗な量子化により符号化される。
【0025】MPEG−2草案規格は、構文及びビット
・ストリームの層化構造を指定する。ビット・ストリー
ムは論理的に別個のエンティティに分離されて、曖昧性
を阻止し、復号化を容易にする。6つの層が下記の表1
に示される。
・ストリームの層化構造を指定する。ビット・ストリー
ムは論理的に別個のエンティティに分離されて、曖昧性
を阻止し、復号化を容易にする。6つの層が下記の表1
に示される。
【表1】 MPEG−2草案規格層 "層" "目的" シーケンス層 ランダム・アクセス単位及びコンテキスト ピクチャ・グループ層 ランダム・アクセス単位及びビデオ符号化 ピクチャ層 1次符号化単位 スライス層 再同期単位 マクロブロック層 動き補正単位 ブロック層 DCT単位
【0026】符号化はハードウェアまたはソフトウェア
により達成されうる。ハードウェア符号化は、一般にソ
フトウェア符号化よりも高速である。しかしながら、ビ
デオ・イメージのビット・レート及び伝送媒体の狭い帯
域幅を考慮すると、ハードウェア符号化であっても遅
い。この理由の1つは、離散余弦変換の形成及びその全
ての係数の計算において多くのステップが要求されるか
らである。
により達成されうる。ハードウェア符号化は、一般にソ
フトウェア符号化よりも高速である。しかしながら、ビ
デオ・イメージのビット・レート及び伝送媒体の狭い帯
域幅を考慮すると、ハードウェア符号化であっても遅
い。この理由の1つは、離散余弦変換の形成及びその全
ての係数の計算において多くのステップが要求されるか
らである。
【0027】
【発明が解決しようとする課題】本発明の目的は、符号
化プロセス、特に離散余弦変換符号化プロセスの速度を
向上するシステムを提供することである。
化プロセス、特に離散余弦変換符号化プロセスの速度を
向上するシステムを提供することである。
【0028】本発明の別の目的は、ピクチャの符号化に
要求されるクロック・サイクル数を低減することであ
る。
要求されるクロック・サイクル数を低減することであ
る。
【0029】
【課題を解決するための手段】本発明のこれらの及びそ
の他の目的が、本発明のデジタル信号符号器システムに
より獲得される。本システムは、事前処理され部分的に
符号化された非圧縮マクロブロックを受信し、それらの
離散余弦変換を形成するために有用である。本発明のプ
ロセッサは、量子化器、可変長コード符号器、及びFI
FOデータ出力バッファなどの符号器システムの他の要
素と協動して、統合システムを提供する。
の他の目的が、本発明のデジタル信号符号器システムに
より獲得される。本システムは、事前処理され部分的に
符号化された非圧縮マクロブロックを受信し、それらの
離散余弦変換を形成するために有用である。本発明のプ
ロセッサは、量子化器、可変長コード符号器、及びFI
FOデータ出力バッファなどの符号器システムの他の要
素と協動して、統合システムを提供する。
【0030】本発明のプロセッサは、デジタル・ビデオ
符号器プロセッサ内で離散余弦変換符号化のために使用
される。離散余弦変換符号化は、次の符号化ステップ、
すなわち(1)離散余弦変換フィールドまたはフレーム
のタイプを決定するステップ、及び(2)個々の画素を
アドレス指定するステップであって、(i)連続する奇
数及び偶数フィールド・ライン上の垂直方向に隣接する
画素を指定するステップ、(ii)最初に連続奇数フィ
ールド・ライン上の垂直方向に隣接する画素を指定し、
次に連続偶数フィールド・ライン上の同様の画素を指定
するステップ、または(iii)最初に連続偶数フィー
ルド・ライン上の垂直方向に隣接する画素を指定し、次
に連続奇数フィールド・ライン上の同様の画素を指定す
るステップを含む。これらの減算は、(i)連続ライン
間、(ii)奇数ライン間、または(iii)偶数ライ
ン間で実行されうる。次のステップでは上記減算の最小
の分散(variance)を見い出し、離散余弦変換符号化タ
イプを決定する。減算は、複数のデータパスを有する動
的に区分化可能なプロセッサにおいて実行される。デー
タパスが実行オペコードの活動により、(i)単一幅デ
ータパス、及び(ii)複数の狭いデータパスに区分化
されて2画素間の差の絶対値を計算し、減算結果を累算
する。
符号器プロセッサ内で離散余弦変換符号化のために使用
される。離散余弦変換符号化は、次の符号化ステップ、
すなわち(1)離散余弦変換フィールドまたはフレーム
のタイプを決定するステップ、及び(2)個々の画素を
アドレス指定するステップであって、(i)連続する奇
数及び偶数フィールド・ライン上の垂直方向に隣接する
画素を指定するステップ、(ii)最初に連続奇数フィ
ールド・ライン上の垂直方向に隣接する画素を指定し、
次に連続偶数フィールド・ライン上の同様の画素を指定
するステップ、または(iii)最初に連続偶数フィー
ルド・ライン上の垂直方向に隣接する画素を指定し、次
に連続奇数フィールド・ライン上の同様の画素を指定す
るステップを含む。これらの減算は、(i)連続ライン
間、(ii)奇数ライン間、または(iii)偶数ライ
ン間で実行されうる。次のステップでは上記減算の最小
の分散(variance)を見い出し、離散余弦変換符号化タ
イプを決定する。減算は、複数のデータパスを有する動
的に区分化可能なプロセッサにおいて実行される。デー
タパスが実行オペコードの活動により、(i)単一幅デ
ータパス、及び(ii)複数の狭いデータパスに区分化
されて2画素間の差の絶対値を計算し、減算結果を累算
する。
【0031】本発明の別の態様によれば、デジタル・イ
メージ符号器において符号化の間のメモリ帯域幅要求を
最小化するメモリ管理方法が提供される。本方法は、時
間的及び空間的冗長性を有するモーション・ビデオ・デ
ータと共に使用され、そこではクロミナンス及びルミナ
ンス・データが一時的に記憶される。開示される方法に
よれば、クロミナンス及びルミナンス・データがメモリ
内の別のロケーションに記憶される。ルミナンス・デー
タはメモリからフェッチされて、動き予測のために使用
される唯一のイメージ・データである。クロミナンス・
データは、イメージ復元のために、クロミナンス−ルミ
ナンス対としてメモリからフェッチされる。復元された
イメージはメモリに記憶され、動き予測のためにメモリ
からフェッチされる。
メージ符号器において符号化の間のメモリ帯域幅要求を
最小化するメモリ管理方法が提供される。本方法は、時
間的及び空間的冗長性を有するモーション・ビデオ・デ
ータと共に使用され、そこではクロミナンス及びルミナ
ンス・データが一時的に記憶される。開示される方法に
よれば、クロミナンス及びルミナンス・データがメモリ
内の別のロケーションに記憶される。ルミナンス・デー
タはメモリからフェッチされて、動き予測のために使用
される唯一のイメージ・データである。クロミナンス・
データは、イメージ復元のために、クロミナンス−ルミ
ナンス対としてメモリからフェッチされる。復元された
イメージはメモリに記憶され、動き予測のためにメモリ
からフェッチされる。
【0032】更に本発明の別の態様によれば、ルミナン
ス及びクロミナンス成分を有するデジタル・ビデオ・イ
メージ・データを符号化する方法が提供され、クロミナ
ンス成分がルミナンス成分の空間分解能の1/4に符号
化される。
ス及びクロミナンス成分を有するデジタル・ビデオ・イ
メージ・データを符号化する方法が提供され、クロミナ
ンス成分がルミナンス成分の空間分解能の1/4に符号
化される。
【0033】更に本発明の別の態様によれば、デジタル
・ビデオ・イメージの離散余弦変換方法が提供される。
開示される方法では、フィールド分散及びフレーム分散
が計算される。フィールド分散がフレーム分散よりも小
さい場合、フィールド離散余弦変換タイプの変換が実行
される。代わりに、フレーム分散がフィールド分散より
も小さい場合には、フレーム離散余弦変換タイプの変換
が実行される。
・ビデオ・イメージの離散余弦変換方法が提供される。
開示される方法では、フィールド分散及びフレーム分散
が計算される。フィールド分散がフレーム分散よりも小
さい場合、フィールド離散余弦変換タイプの変換が実行
される。代わりに、フレーム分散がフィールド分散より
も小さい場合には、フレーム離散余弦変換タイプの変換
が実行される。
【0034】更に本発明の別の態様によれば、ビットス
トリーム・ヘッダを符号化する方法が提供され、そこで
はビットストリーム・ヘッダのテンプレートがバッファ
に記憶される。テンプレートはプログラマブル命令によ
りアドレス指定可能であり、プロセッサは各ヘッダ・タ
イプに対応するビットを含むステータス・レジスタを有
する。ステータス・レジスタは、ビットストリームの符
号化に必要なヘッダを示すデータ・パターンの符号化プ
ロセスの間に変更されうる。このようにして、ビットが
1にセットされるとき、予め定義されたヘッダ・タイプ
が生成されてビットストリームに転送され、ヘッダが、
ヘッダ・タイプに関連付けられるヘッダ・バッファ・テ
ンプレート・エントリを処理することにより生成され
る。
トリーム・ヘッダを符号化する方法が提供され、そこで
はビットストリーム・ヘッダのテンプレートがバッファ
に記憶される。テンプレートはプログラマブル命令によ
りアドレス指定可能であり、プロセッサは各ヘッダ・タ
イプに対応するビットを含むステータス・レジスタを有
する。ステータス・レジスタは、ビットストリームの符
号化に必要なヘッダを示すデータ・パターンの符号化プ
ロセスの間に変更されうる。このようにして、ビットが
1にセットされるとき、予め定義されたヘッダ・タイプ
が生成されてビットストリームに転送され、ヘッダが、
ヘッダ・タイプに関連付けられるヘッダ・バッファ・テ
ンプレート・エントリを処理することにより生成され
る。
【0035】本発明の更に別の態様によれば、符号器に
おいて、低フレーム・レートのデジタル・ビデオ・ソー
ス・イメージを高フレーム・レートのデジタル・ビデオ
・ターゲット・イメージに符号化する方法が提供され
る。そこでは、繰り返しフィールドが高フレーム・レー
トのデジタル・ビデオ中間イメージに導入される。
おいて、低フレーム・レートのデジタル・ビデオ・ソー
ス・イメージを高フレーム・レートのデジタル・ビデオ
・ターゲット・イメージに符号化する方法が提供され
る。そこでは、繰り返しフィールドが高フレーム・レー
トのデジタル・ビデオ中間イメージに導入される。
【0036】
【発明の実施の形態】デジタル・ビデオ・ピクチャ内の
あらゆる画素は、1バイトのルミナンス及び1バイトの
クロミナンス情報により表現される。これは4:2:2
MPEG規格において指定される。720×480画素
の最大ピクチャ・サイズ及び30ピクチャ/秒の伝送レ
ートでは、ビデオ・イメージの記憶は大量のメモリを必
要とする。更に、ビデオ・イメージを伝送媒体を介して
伝送するために、高い帯域幅が要求される。デジタル・
ビデオ圧縮は、メモリ要求及び伝送媒体帯域幅要求を低
減するために導入される。圧縮の最終結果によれば、デ
ジタル・ビデオ・イメージのデータ・バイトは、オリジ
ナル・ピクチャよりも少ないものの、可能な限りの多く
の情報を有する。
あらゆる画素は、1バイトのルミナンス及び1バイトの
クロミナンス情報により表現される。これは4:2:2
MPEG規格において指定される。720×480画素
の最大ピクチャ・サイズ及び30ピクチャ/秒の伝送レ
ートでは、ビデオ・イメージの記憶は大量のメモリを必
要とする。更に、ビデオ・イメージを伝送媒体を介して
伝送するために、高い帯域幅が要求される。デジタル・
ビデオ圧縮は、メモリ要求及び伝送媒体帯域幅要求を低
減するために導入される。圧縮の最終結果によれば、デ
ジタル・ビデオ・イメージのデータ・バイトは、オリジ
ナル・ピクチャよりも少ないものの、可能な限りの多く
の情報を有する。
【0037】ビデオ圧縮の1ステップは、ピクチャの1
セグメント当たりの量子化値を決定することである。量
子化の概念は、セグメント内の各画素の値をステップサ
イズにより低減し、できるだけ多くの0が生成されるよ
うにすることである。一般に、続く圧縮及び符号化技術
の結果、0はその表現のために少ないデータ・ビットを
要求する。量子化ファクタまたは定数の値が人間の視覚
モデルにもとづき選択される。量子化値の選択は、セグ
メント内のあらゆる画素を巻き込む計算を要求する。
4:2:2MPEG規格では、1マクロブロック当たり
256バイトのルミナンス・データが存在する。あらゆ
る画素を巻き込むためには256回の演算が要求され
る。計算を高速化するために演算が並列に実行される。
セグメント当たりの量子化値を決定することである。量
子化の概念は、セグメント内の各画素の値をステップサ
イズにより低減し、できるだけ多くの0が生成されるよ
うにすることである。一般に、続く圧縮及び符号化技術
の結果、0はその表現のために少ないデータ・ビットを
要求する。量子化ファクタまたは定数の値が人間の視覚
モデルにもとづき選択される。量子化値の選択は、セグ
メント内のあらゆる画素を巻き込む計算を要求する。
4:2:2MPEG規格では、1マクロブロック当たり
256バイトのルミナンス・データが存在する。あらゆ
る画素を巻き込むためには256回の演算が要求され
る。計算を高速化するために演算が並列に実行される。
【0038】本発明のプロセッサ11はマイクロコード
を記憶する命令記憶21を有する。プロセッサ11は4
バイト幅算術論理演算ユニット(ALU)31を有し、
これは4個の1バイトALU33、35、37及び39
から構成される。プロセッサ11は、2レベル・セット
の汎用ワーキング・レジスタ41、特殊目的レジスタ4
3のグループ、命令アドレス・スタック、及び条件レジ
スタ45を有する。
を記憶する命令記憶21を有する。プロセッサ11は4
バイト幅算術論理演算ユニット(ALU)31を有し、
これは4個の1バイトALU33、35、37及び39
から構成される。プロセッサ11は、2レベル・セット
の汎用ワーキング・レジスタ41、特殊目的レジスタ4
3のグループ、命令アドレス・スタック、及び条件レジ
スタ45を有する。
【0039】プロセッサ11は、パイプラインALU3
1内で4バイト幅の算術論理演算を実行することができ
る。パイプラインALU31は、4個の個々の1バイト
ALU33、35、37及び39から構成される。これ
らの4個の特殊算術論理演算ユニット(ALU)33、
35、37及び39は算術論理演算のコアである。プロ
セッサ・オペレーションは次の4パイプライン・サイク
ル内で発生する。 1.フェッチ 2.解読 3.実行 4.書戻し
1内で4バイト幅の算術論理演算を実行することができ
る。パイプラインALU31は、4個の個々の1バイト
ALU33、35、37及び39から構成される。これ
らの4個の特殊算術論理演算ユニット(ALU)33、
35、37及び39は算術論理演算のコアである。プロ
セッサ・オペレーションは次の4パイプライン・サイク
ル内で発生する。 1.フェッチ 2.解読 3.実行 4.書戻し
【0040】マイクロコード命令が最初に命令記憶21
からフェッチされ、次に解読される。ALU制御装置3
0は、解読された命令、及びデータ・パイプライン化に
おける以前の命令の結果にもとづき、レジスタ/メモリ
・インタフェース・ユニット47及び命令フェッチ/解
読ユニット23のそれぞれから、ALU制御ユニット3
0を介してALU33、35、37及び39にデータ/
制御信号を提供する。
からフェッチされ、次に解読される。ALU制御装置3
0は、解読された命令、及びデータ・パイプライン化に
おける以前の命令の結果にもとづき、レジスタ/メモリ
・インタフェース・ユニット47及び命令フェッチ/解
読ユニット23のそれぞれから、ALU制御ユニット3
0を介してALU33、35、37及び39にデータ/
制御信号を提供する。
【0041】プロセッサ11は、レジスタ/メモリ・イ
ンタフェース・ユニット47からのレジスタ/メモリ・
データ、または専用画素バス49を介してプロセッサに
送信される画素データのいずれかに対して作用すること
ができる。分岐/ループ命令は、別の分岐/ループ・プ
ロセッサ・ユニット25により実行される。
ンタフェース・ユニット47からのレジスタ/メモリ・
データ、または専用画素バス49を介してプロセッサに
送信される画素データのいずれかに対して作用すること
ができる。分岐/ループ命令は、別の分岐/ループ・プ
ロセッサ・ユニット25により実行される。
【0042】データはALU33、35、37及び39
により実行サイクルにおいて処理され、書戻しサイクル
の間に、レジスタ/メモリ・インタフェース・ユニット
47を介してレジスタ/メモリ41、43及び45に記
憶される。プロセッサ11は、プロセッサ11の内部に
ある2レベル・セットの汎用ワーキング・レジスタ4
1、及び特殊目的レジスタ43のグループをアクセスで
きる。外部ソースからレジスタ/メモリをアクセスする
ために、画素バス49も提供される。プロセッサ11の
ブロック図が、図3に示される。
により実行サイクルにおいて処理され、書戻しサイクル
の間に、レジスタ/メモリ・インタフェース・ユニット
47を介してレジスタ/メモリ41、43及び45に記
憶される。プロセッサ11は、プロセッサ11の内部に
ある2レベル・セットの汎用ワーキング・レジスタ4
1、及び特殊目的レジスタ43のグループをアクセスで
きる。外部ソースからレジスタ/メモリをアクセスする
ために、画素バス49も提供される。プロセッサ11の
ブロック図が、図3に示される。
【0043】各命令は27ビット幅である。このプロセ
ッサ11では、複数の命令形式が定義される。典型的な
命令は、オペコード、モード・ビット、宛先フィール
ド、及び2つのソース・フィールドを有する。オペコー
ドは、プロセッサにより実行される機能を示すために使
用される。
ッサ11では、複数の命令形式が定義される。典型的な
命令は、オペコード、モード・ビット、宛先フィール
ド、及び2つのソース・フィールドを有する。オペコー
ドは、プロセッサにより実行される機能を示すために使
用される。
【0044】モード・ビットはプロセッサに、命令に対
して如何に作用すべきかを伝える。"UNI"と"LP"の
2つのモードが存在する。"UNI"モードは1つの4バ
イト・オペレーションとして作用し、"LP(論理区
分)"モードは、互いに独立な4個の1バイト・オペレ
ーションとして作用する。ソース・フィールドは、オペ
レーションへの入力のロケーションを指定する。宛先フ
ィールドは、オペレーション結果を記憶するロケーショ
ンを指定する。
して如何に作用すべきかを伝える。"UNI"と"LP"の
2つのモードが存在する。"UNI"モードは1つの4バ
イト・オペレーションとして作用し、"LP(論理区
分)"モードは、互いに独立な4個の1バイト・オペレ
ーションとして作用する。ソース・フィールドは、オペ
レーションへの入力のロケーションを指定する。宛先フ
ィールドは、オペレーション結果を記憶するロケーショ
ンを指定する。
【0045】算術論理演算ユニット31は、4個の1バ
イト独立型算術論理演算ユニット(ALU)33、3
5、37及び39から成る。命令が4バイト・オペレー
ションを指定する場合、各ユニットの最上位ビットから
のキャリーが、次により高位のユニットに伝播される。
イト独立型算術論理演算ユニット(ALU)33、3
5、37及び39から成る。命令が4バイト・オペレー
ションを指定する場合、各ユニットの最上位ビットから
のキャリーが、次により高位のユニットに伝播される。
【0046】各算術論理演算ユニット内には累算機能が
存在する。1ALU当たりの累算器は16ビット幅であ
る。加算累算命令は、加算結果と前回データとの累算を
累算器内で可能にするように体系化される。加算回路
は、2つの8ビット入力を16ビット累算器に加算す
る。この機能は最大256ビットの入力データの累算を
可能にする。
存在する。1ALU当たりの累算器は16ビット幅であ
る。加算累算命令は、加算結果と前回データとの累算を
累算器内で可能にするように体系化される。加算回路
は、2つの8ビット入力を16ビット累算器に加算す
る。この機能は最大256ビットの入力データの累算を
可能にする。
【0047】8個の8×8乗算器がプロセッサに導入さ
れ、1ALU当たり2個が割当てられる。32×32乗
算演算もプロセッサ内において体系化される。
れ、1ALU当たり2個が割当てられる。32×32乗
算演算もプロセッサ内において体系化される。
【0048】32×32乗算のサブセットは32×16
乗算である。各ユニット内の2個の8×8乗算器が結合
され、8×16乗算器を形成する。更に隣接ユニットの
2個の8×16乗算器が結合され、単一の16×16乗
算器を形成する。入力オペランドが解析され、H×L及
びL×L乗算を可能にする。2つの16×16乗算の結
果が結合され、32×16乗算を形成する。この設計は
回路の最大再利用性を可能にする。
乗算である。各ユニット内の2個の8×8乗算器が結合
され、8×16乗算器を形成する。更に隣接ユニットの
2個の8×16乗算器が結合され、単一の16×16乗
算器を形成する。入力オペランドが解析され、H×L及
びL×L乗算を可能にする。2つの16×16乗算の結
果が結合され、32×16乗算を形成する。この設計は
回路の最大再利用性を可能にする。
【0049】MPEG−2で採用される圧縮技術の1つ
は、離散余弦変換(DCT)符号化である。このプロセ
スは、空間領域イメージ・データを周波数領域イメージ
・データに変換するために使用される。ピクチャ・イメ
ージが、8×8画素の小サブセットとして、DCTプロ
セスに供給される。8×8画素ブロックはマクロブロッ
クとして定義される。
は、離散余弦変換(DCT)符号化である。このプロセ
スは、空間領域イメージ・データを周波数領域イメージ
・データに変換するために使用される。ピクチャ・イメ
ージが、8×8画素の小サブセットとして、DCTプロ
セスに供給される。8×8画素ブロックはマクロブロッ
クとして定義される。
【0050】DCTプロセスに画素の連続ラインが供給
される場合、この技術はフレームDCTタイプとして定
義される。代わりに、1つ置きのラインの画素イメージ
・データが連結され、8×8DCT入力を形成する場
合、この技術はフィールドDCTタイプとして定義され
る。一般に、しばしばインタレース式ピクチャにおいて
発生するように、ピクチャの2つのフィールド間で動き
が存在する場合、画素データは連続ライン間で大きな差
を有する。フィールド間で動きが存在しない場合には、
画素データの連続ライン間にはほとんど分散が存在しな
い。通常、画素分散が小さいほど達成されうる圧縮効率
は高くなる。
される場合、この技術はフレームDCTタイプとして定
義される。代わりに、1つ置きのラインの画素イメージ
・データが連結され、8×8DCT入力を形成する場
合、この技術はフィールドDCTタイプとして定義され
る。一般に、しばしばインタレース式ピクチャにおいて
発生するように、ピクチャの2つのフィールド間で動き
が存在する場合、画素データは連続ライン間で大きな差
を有する。フィールド間で動きが存在しない場合には、
画素データの連続ライン間にはほとんど分散が存在しな
い。通常、画素分散が小さいほど達成されうる圧縮効率
は高くなる。
【0051】符号器は、入力画素イメージの分散を計算
することによりDCTタイプ(例えばフィールドまたは
フレーム)を決定する。入力はアドレス指定モード設定
命令により指定されるアドレス・モードに従い、フェッ
チされる。この命令は6つの固有のアドレス・モードの
1つを設定する。'モード1'は、マクロブロック内の連
続する奇数及び偶数フィールド・ライン上の垂直方向に
隣接する画素をアドレス指定する。'モード2'は、最初
に連続奇数フィールド・ライン上の2つの垂直方向に隣
接する画素をアドレス指定し、次に連続偶数フィールド
・ラインに切り替える。'モード3'は、最初に連続偶数
フィールド・ライン上の2つの垂直方向に隣接する画素
をアドレス指定し、次に連続奇数フィールド・ラインに
切り替える。モード4、5及び6は、マクロブロックの
各奇数または偶数ライン内の1画素が、2画素の代わり
にアドレス指定される以外は、モード1、2及び3とそ
れぞれ同じである。1画素アドレス指定モードは、DC
Tタイプの計算では使用されない。
することによりDCTタイプ(例えばフィールドまたは
フレーム)を決定する。入力はアドレス指定モード設定
命令により指定されるアドレス・モードに従い、フェッ
チされる。この命令は6つの固有のアドレス・モードの
1つを設定する。'モード1'は、マクロブロック内の連
続する奇数及び偶数フィールド・ライン上の垂直方向に
隣接する画素をアドレス指定する。'モード2'は、最初
に連続奇数フィールド・ライン上の2つの垂直方向に隣
接する画素をアドレス指定し、次に連続偶数フィールド
・ラインに切り替える。'モード3'は、最初に連続偶数
フィールド・ライン上の2つの垂直方向に隣接する画素
をアドレス指定し、次に連続奇数フィールド・ラインに
切り替える。モード4、5及び6は、マクロブロックの
各奇数または偶数ライン内の1画素が、2画素の代わり
にアドレス指定される以外は、モード1、2及び3とそ
れぞれ同じである。1画素アドレス指定モードは、DC
Tタイプの計算では使用されない。
【0052】DCTタイプの計算は、図4に示されるよ
うに3つの異なる減算を含む。これらは連続ライン間の
減算、奇数ライン間の減算、及び偶数ライン間の減算で
ある。
うに3つの異なる減算を含む。これらは連続ライン間の
減算、奇数ライン間の減算、及び偶数ライン間の減算で
ある。
【0053】上記減算の最小の分散が、DCT符号化タ
イプを決定するために使用される。この画素分散の計算
はあらゆる画素を巻き込み、計算集中的である。各マク
ロブロック当たり256画素が存在し、フレームDCT
計算につき128回の減算及び128回の加算が要求さ
れ、フィールドDCT計算につき別の128回の減算及
び128回の加算が要求される。最終ステップでは、4
つの累算値の合計が累算器加算命令ACCSUMにより
加算される。より小さなフレームDCTまたはフィール
ドDCTの分散を決定するために、比較命令が必要とな
る。従来、使用されたプロセッサでは、この決定は51
2回の計算を要求する。本発明のプロセッサでは、1サ
イクル内で4回の計算の実行を指定するためにモード・
ビットが使用される。この計算を実行するために要求さ
れるサイクル数は4分の1に改良され、128サイクル
が計算の実行に要求されることになる。絶対値減算(SU
BABS)命令及び加算累算器(ADDACC)命令の組み合わせ
により、64サイクルだけが要求される。
イプを決定するために使用される。この画素分散の計算
はあらゆる画素を巻き込み、計算集中的である。各マク
ロブロック当たり256画素が存在し、フレームDCT
計算につき128回の減算及び128回の加算が要求さ
れ、フィールドDCT計算につき別の128回の減算及
び128回の加算が要求される。最終ステップでは、4
つの累算値の合計が累算器加算命令ACCSUMにより
加算される。より小さなフレームDCTまたはフィール
ドDCTの分散を決定するために、比較命令が必要とな
る。従来、使用されたプロセッサでは、この決定は51
2回の計算を要求する。本発明のプロセッサでは、1サ
イクル内で4回の計算の実行を指定するためにモード・
ビットが使用される。この計算を実行するために要求さ
れるサイクル数は4分の1に改良され、128サイクル
が計算の実行に要求されることになる。絶対値減算(SU
BABS)命令及び加算累算器(ADDACC)命令の組み合わせ
により、64サイクルだけが要求される。
【0054】分散の計算には、SUBABSとADDA
CCの2つの命令が要求されるだけである。これら2つ
の命令はサブルーチンを形成し、マクロブロック内の全
ての画素が使用されるまでループされる。ループはフレ
ームDCT計算において1度使用され、フィールドDC
T計算において再度使用される。SUBABS命令は2
画素間の差の絶対値を計算するために使用される。AD
DACC命令はSUBABS命令の結果を累算するため
に使用される。
CCの2つの命令が要求されるだけである。これら2つ
の命令はサブルーチンを形成し、マクロブロック内の全
ての画素が使用されるまでループされる。ループはフレ
ームDCT計算において1度使用され、フィールドDC
T計算において再度使用される。SUBABS命令は2
画素間の差の絶対値を計算するために使用される。AD
DACC命令はSUBABS命令の結果を累算するため
に使用される。
【0055】SUBABSの結果をADDACCの入力
にパイプライン化することにより、中間メモリ読出しま
たは書込み命令が必要とされない。このオペレーション
・モードでは、上記命令が1計算当たりに要求されるサ
イクル数を低減することにより性能を改良する。
にパイプライン化することにより、中間メモリ読出しま
たは書込み命令が必要とされない。このオペレーション
・モードでは、上記命令が1計算当たりに要求されるサ
イクル数を低減することにより性能を改良する。
【0056】本発明のプロセッサ11は、デジタル・ビ
デオ符号器プロセッサ内で離散余弦変換符号化のために
使用される。離散余弦変換符号化は、次の符号化ステッ
プ、すなわち(1)離散余弦変換フィールドまたはフレ
ームのタイプを決定するステップ、及び(2)個々の画
素をアドレス指定するステップであって、(i)連続す
る奇数及び偶数フィールド・ライン上の垂直方向に隣接
する画素を指定するステップ、(ii)最初に連続奇数
フィールド・ライン上の垂直方向に隣接する画素を指定
し、次に連続偶数フィールド・ライン上の同様の画素を
指定するステップ、または(iii)最初に連続偶数フ
ィールド・ライン上の垂直方向に隣接する画素を指定
し、次に連続奇数フィールド・ライン上の同様の画素を
指定するステップを含む。これらの減算は、(i)連続
ライン間、(ii)奇数ライン間、または(iii)偶
数ライン間で実行されうる。次のステップでは、上記減
算の最小の分散を見い出し、離散余弦変換符号化タイプ
を決定する。減算は、複数のデータパス33、35、3
7、39を有する動的に区分化可能なプロセッサにおい
て実行される。データパス33、35、37、39が、
実行オペコードの活動により、(i)単一幅データパス
31、及び(ii)複数の狭いデータパスに区分化され
て、2画素間の差の絶対値を計算し、減算結果を累算す
る。
デオ符号器プロセッサ内で離散余弦変換符号化のために
使用される。離散余弦変換符号化は、次の符号化ステッ
プ、すなわち(1)離散余弦変換フィールドまたはフレ
ームのタイプを決定するステップ、及び(2)個々の画
素をアドレス指定するステップであって、(i)連続す
る奇数及び偶数フィールド・ライン上の垂直方向に隣接
する画素を指定するステップ、(ii)最初に連続奇数
フィールド・ライン上の垂直方向に隣接する画素を指定
し、次に連続偶数フィールド・ライン上の同様の画素を
指定するステップ、または(iii)最初に連続偶数フ
ィールド・ライン上の垂直方向に隣接する画素を指定
し、次に連続奇数フィールド・ライン上の同様の画素を
指定するステップを含む。これらの減算は、(i)連続
ライン間、(ii)奇数ライン間、または(iii)偶
数ライン間で実行されうる。次のステップでは、上記減
算の最小の分散を見い出し、離散余弦変換符号化タイプ
を決定する。減算は、複数のデータパス33、35、3
7、39を有する動的に区分化可能なプロセッサにおい
て実行される。データパス33、35、37、39が、
実行オペコードの活動により、(i)単一幅データパス
31、及び(ii)複数の狭いデータパスに区分化され
て、2画素間の差の絶対値を計算し、減算結果を累算す
る。
【0057】DCT係数の計算に続く別の圧縮技術は量
子化である。量子化は1マクロブロック当たりのステッ
プサイズを決定するプロセスである。ステップサイズは
マクロブロックの光強度分散にもとづく。マクロブロッ
クの光強度の平均が最初に計算される。各ブロックの分
散が次に計算される。マクロブロックのステップサイズ
を選択するために最小の分散が使用される。ここで述べ
られるプロセッサでは、平均強度がADDACC及びシ
フト命令により計算されうる。ADDACC命令は1命
令のサブルーチンを形成し、8×8ブロック内の全ての
画素が使用されるまでループされる。累算結果が右シフ
ト命令により64で除算される。
子化である。量子化は1マクロブロック当たりのステッ
プサイズを決定するプロセスである。ステップサイズは
マクロブロックの光強度分散にもとづく。マクロブロッ
クの光強度の平均が最初に計算される。各ブロックの分
散が次に計算される。マクロブロックのステップサイズ
を選択するために最小の分散が使用される。ここで述べ
られるプロセッサでは、平均強度がADDACC及びシ
フト命令により計算されうる。ADDACC命令は1命
令のサブルーチンを形成し、8×8ブロック内の全ての
画素が使用されるまでループされる。累算結果が右シフ
ト命令により64で除算される。
【0058】LPモード・オプションは、性能改良のた
めに使用される。全てのルミナンス画素の加算は、4個
のALU33、35、37、39により並列に実行され
る。次に各グループの平均が、結果に対して右シフトを
実行することにより計算される。
めに使用される。全てのルミナンス画素の加算は、4個
のALU33、35、37、39により並列に実行され
る。次に各グループの平均が、結果に対して右シフトを
実行することにより計算される。
【0059】分散強度がSUBABS及びADDACC
命令により計算される。SUBABS命令はブロックの
平均からの各画素データの差を決定するために使用され
る。ADDACC命令は各ブロック内の差を累算するた
めに使用される。4ブロック間の最小の累算が、マクロ
ブロックのステップサイズを決定するために使用され
る。LPモードを選択することにより4ブロックの計算
が同時に実行される。
命令により計算される。SUBABS命令はブロックの
平均からの各画素データの差を決定するために使用され
る。ADDACC命令は各ブロック内の差を累算するた
めに使用される。4ブロック間の最小の累算が、マクロ
ブロックのステップサイズを決定するために使用され
る。LPモードを選択することにより4ブロックの計算
が同時に実行される。
【0060】プロセッサ11内の命令及び実行ユニット
設計のアーキテクチャが、単一の4バイト・データフロ
ーの動的な区分化を可能にし、単一の4バイト・データ
フロー・ユニットとして、または4個の1バイト実行ユ
ニットとして動作させる。動的な区分化能力はプロセッ
サ出力を向上させ、それにより符号化プロセス、特に離
散余弦変換符号化プロセスの速度を向上させ、ピクチャ
を符号化するために要するクロック・サイクル数を低減
するシステムを提供する。
設計のアーキテクチャが、単一の4バイト・データフロ
ーの動的な区分化を可能にし、単一の4バイト・データ
フロー・ユニットとして、または4個の1バイト実行ユ
ニットとして動作させる。動的な区分化能力はプロセッ
サ出力を向上させ、それにより符号化プロセス、特に離
散余弦変換符号化プロセスの速度を向上させ、ピクチャ
を符号化するために要するクロック・サイクル数を低減
するシステムを提供する。
【0061】色変換のための方法及び装置:MPEG−
2規格はビデオ入力ソースを422または420形式に
指定する。YUV色空間ではほとんどの高周波成分がY
成分に集中する。しかしながら、人間の視力(visual a
cuity)は、高周波クロミナンス成分には最も感度が低
く、低周波ルミナンス成分には最も感度が高い。この理
由から、ビデオ・ソースがRGBから422または42
0色形式に圧縮される場合、ビデオ・ソースの高い圧縮
が獲得されうる。420への色変換は水平及び垂直の両
次元における低減を要求し、ルミナンス成分の空間分解
能の1/4のクロミナンス成分を生成する。
2規格はビデオ入力ソースを422または420形式に
指定する。YUV色空間ではほとんどの高周波成分がY
成分に集中する。しかしながら、人間の視力(visual a
cuity)は、高周波クロミナンス成分には最も感度が低
く、低周波ルミナンス成分には最も感度が高い。この理
由から、ビデオ・ソースがRGBから422または42
0色形式に圧縮される場合、ビデオ・ソースの高い圧縮
が獲得されうる。420への色変換は水平及び垂直の両
次元における低減を要求し、ルミナンス成分の空間分解
能の1/4のクロミナンス成分を生成する。
【0062】進歩的なビデオでは、フィールド間で動き
は存在しない。クロミナンス成分を低減するためにリニ
ア・フィルタが使用されうる。インタレース式フル・モ
ーション・ビデオでは時間差が存在し、従ってフレーム
構造ピクチャ内の2つのフィールド間で動きが存在す
る。2つの隣接フィールドのクロミナンス成分はほとん
ど相関が無いので、リニア・フィルタが人為結果(arti
facts)を生成する。従って、クロミナンス低減におい
て動き補正が考慮されなければならない。
は存在しない。クロミナンス成分を低減するためにリニ
ア・フィルタが使用されうる。インタレース式フル・モ
ーション・ビデオでは時間差が存在し、従ってフレーム
構造ピクチャ内の2つのフィールド間で動きが存在す
る。2つの隣接フィールドのクロミナンス成分はほとん
ど相関が無いので、リニア・フィルタが人為結果(arti
facts)を生成する。従って、クロミナンス低減におい
て動き補正が考慮されなければならない。
【0063】ここで述べられる本発明では、1フィール
ドのクロミナンス成分だけが使用される。1フィールド
のクロミナンス情報が両方のルミナンス・フィールドに
供給される。この方法ではクロミナンス動き補正が必要
とされない。1フィールドを排除することにより垂直成
分も低減される。フィールドの全ての水平成分は時間間
隔内に存在するので動きは存在せず、水平成分を低減す
るためにリニア・フィルタが使用される。
ドのクロミナンス成分だけが使用される。1フィールド
のクロミナンス情報が両方のルミナンス・フィールドに
供給される。この方法ではクロミナンス動き補正が必要
とされない。1フィールドを排除することにより垂直成
分も低減される。フィールドの全ての水平成分は時間間
隔内に存在するので動きは存在せず、水平成分を低減す
るためにリニア・フィルタが使用される。
【0064】色低減はこの経済的なフィルタにより達成
され、ビデオ圧縮を向上させる。
され、ビデオ圧縮を向上させる。
【0065】フィールド及びフレーム符号化:イメージ
圧縮の1つの形式は、空間的冗長性と呼ばれる冗長デー
タの除去により達成される。この形式の冗長性は隣接画
素データ間の相関情報により発生する。
圧縮の1つの形式は、空間的冗長性と呼ばれる冗長デー
タの除去により達成される。この形式の冗長性は隣接画
素データ間の相関情報により発生する。
【0066】インタレース式フル・モーション・ビデオ
ではフィールド間で時間差が存在し、従って隣接フィー
ルド間に動きが存在する。この動きはフレーム内の隣接
ライン間で不連続性を生む。
ではフィールド間で時間差が存在し、従って隣接フィー
ルド間に動きが存在する。この動きはフレーム内の隣接
ライン間で不連続性を生む。
【0067】MPEG−2規格は、より良好な圧縮を達
成するために、フィールド及びフレーム離散余弦変換タ
イプの使用を可能にする。フレーム処理は、動きが存在
しないか、ほとんど存在しないときに良好に作用する。
フレーム形式にはより多くのラインが存在し、従って圧
縮率を向上するためのより多くの相関が存在する。しか
しながら、フィールド形式処理は垂直方向の詳細な動き
に対してより良好に作用する。このような場合では、フ
レーム・データよりもフィールド・データがより相関付
けられる。
成するために、フィールド及びフレーム離散余弦変換タ
イプの使用を可能にする。フレーム処理は、動きが存在
しないか、ほとんど存在しないときに良好に作用する。
フレーム形式にはより多くのラインが存在し、従って圧
縮率を向上するためのより多くの相関が存在する。しか
しながら、フィールド形式処理は垂直方向の詳細な動き
に対してより良好に作用する。このような場合では、フ
レーム・データよりもフィールド・データがより相関付
けられる。
【0068】離散余弦変換タイプの決定、すなわちフィ
ールドまたはフレーム決定は各マクロブロックに対して
計算される。本発明の符号化方法は観測にもとづき、ピ
クチャの2つのフィールドが2つの異なる時間に由来す
る場合、フィールド内の隣接ライン間のデータがフレー
ム内の隣接ラインのデータよりも一般に値的により近
い。
ールドまたはフレーム決定は各マクロブロックに対して
計算される。本発明の符号化方法は観測にもとづき、ピ
クチャの2つのフィールドが2つの異なる時間に由来す
る場合、フィールド内の隣接ライン間のデータがフレー
ム内の隣接ラインのデータよりも一般に値的により近
い。
【0069】符号器は、マクロブロックのフレーム構造
の隣接ライン間の合計差(total differences)を計算
し、次にマクロブロック内のフィールド構造の隣接ライ
ンの合計差を計算する。フィールド総分散の方が小さい
と、フィールド離散余弦変換タイプが選択される。しか
しながらフレーム総分散の方が小さいと、フレーム離散
余弦変換タイプが選択される。
の隣接ライン間の合計差(total differences)を計算
し、次にマクロブロック内のフィールド構造の隣接ライ
ンの合計差を計算する。フィールド総分散の方が小さい
と、フィールド離散余弦変換タイプが選択される。しか
しながらフレーム総分散の方が小さいと、フレーム離散
余弦変換タイプが選択される。
【0070】フレーム分散は、フレーム構造内の隣接ラ
イン間の絶対差の合計により計算される。フレーム構造
内のラインは、1、2、3、...のように昇順に番号
付けられるものとする。フレーム分散は、ライン1とラ
イン2、ライン3とライン4などの絶対差の合計であ
る。
イン間の絶対差の合計により計算される。フレーム構造
内のラインは、1、2、3、...のように昇順に番号
付けられるものとする。フレーム分散は、ライン1とラ
イン2、ライン3とライン4などの絶対差の合計であ
る。
【0071】フィールド分散は2つの部分、すなわちフ
ィールド1及びフィールド2において計算される。フィ
ールド1は、フレーム構造内の隣接奇数ライン間の絶対
差の合計である。上記と同様の番号付けによりフィール
ド1分散は、ライン1と3、ライン5と7などの絶対差
の合計である。フィールド2は、偶数ライン番号が使用
される以外はフィールド1と同様に計算される。フィー
ルド2分散は、ライン2と4、ライン6と8などの絶対
差の合計である。
ィールド1及びフィールド2において計算される。フィ
ールド1は、フレーム構造内の隣接奇数ライン間の絶対
差の合計である。上記と同様の番号付けによりフィール
ド1分散は、ライン1と3、ライン5と7などの絶対差
の合計である。フィールド2は、偶数ライン番号が使用
される以外はフィールド1と同様に計算される。フィー
ルド2分散は、ライン2と4、ライン6と8などの絶対
差の合計である。
【0072】フレーム分散がフィールド1+フィールド
2よりも小さいと、フレーム離散余弦変換が選択され
る。それ以外ではフィールド離散余弦変換が選択され
る。
2よりも小さいと、フレーム離散余弦変換が選択され
る。それ以外ではフィールド離散余弦変換が選択され
る。
【0073】MPEGヘッダの生成:MPEG−2規格
で定義されるビットストリーム・ヘッダは、接続ビット
ストリームに関する情報を含む。ヘッダの構文は復号器
に符号化ピクチャの復元方法を伝えるために使用される
ので、厳密でなければならない。ヘッダの使用はアプリ
ケーション依存である。特定のアプリケーション要求に
対する容易な適応化を可能にする柔軟な設計が要求され
る。貴重な時間がピクチャの符号化から奪われないよう
に、性能も重要である。
で定義されるビットストリーム・ヘッダは、接続ビット
ストリームに関する情報を含む。ヘッダの構文は復号器
に符号化ピクチャの復元方法を伝えるために使用される
ので、厳密でなければならない。ヘッダの使用はアプリ
ケーション依存である。特定のアプリケーション要求に
対する容易な適応化を可能にする柔軟な設計が要求され
る。貴重な時間がピクチャの符号化から奪われないよう
に、性能も重要である。
【0074】本発明の符号器では、プレロードされるテ
ンプレートがプログラマブル命令のセットと共に使用さ
れて、ヘッダ・ビットストリームを生成する。190×
27ビットのオンチップ・ヘッダ・バッファが、MPE
G−2規格において指定されるヘッダ・タイプのテンプ
レートMP@MLを含む。このバッファは、外部プロセ
ッサからパワーオン・リセット時に初期化される。
ンプレートがプログラマブル命令のセットと共に使用さ
れて、ヘッダ・ビットストリームを生成する。190×
27ビットのオンチップ・ヘッダ・バッファが、MPE
G−2規格において指定されるヘッダ・タイプのテンプ
レートMP@MLを含む。このバッファは、外部プロセ
ッサからパワーオン・リセット時に初期化される。
【0075】各ヘッダ・タイプはバッファ内の複数エン
トリを占有する。本発明のヘッダ発生器はステータス・
レジスタを含み、これはヘッダ・バッファと協動する本
発明のプロセッサにより書込み可能である。ステータス
・レジスタは、各ヘッダ・タイプに対応して1ビットを
含む。符号化プロセスの間、ステータス・レジスタは、
必要とされるヘッダ・タイプを示すデータ・パターンに
より変更される。"シップ・ヘッダ(ship header)"コ
マンドが発行されるとき、ヘッダ発生器がステータス・
レジスタを左から右に1度に1ビットずつ処理する。あ
るビットが1にセットされると、予め定義されたヘッダ
・タイプが生成され、ビットストリームに転送(ship)
される。ヘッダは、ヘッダ・タイプに関連付けられるヘ
ッダ・バッファ・テンプレート・エントリを処理するこ
とにより生成される。
トリを占有する。本発明のヘッダ発生器はステータス・
レジスタを含み、これはヘッダ・バッファと協動する本
発明のプロセッサにより書込み可能である。ステータス
・レジスタは、各ヘッダ・タイプに対応して1ビットを
含む。符号化プロセスの間、ステータス・レジスタは、
必要とされるヘッダ・タイプを示すデータ・パターンに
より変更される。"シップ・ヘッダ(ship header)"コ
マンドが発行されるとき、ヘッダ発生器がステータス・
レジスタを左から右に1度に1ビットずつ処理する。あ
るビットが1にセットされると、予め定義されたヘッダ
・タイプが生成され、ビットストリームに転送(ship)
される。ヘッダは、ヘッダ・タイプに関連付けられるヘ
ッダ・バッファ・テンプレート・エントリを処理するこ
とにより生成される。
【0076】ヘッダ・バッファ内の各エントリは次のフ
ィールドを含む。 1.有効 2.長さ 3.コマンド 4.データ
ィールドを含む。 1.有効 2.長さ 3.コマンド 4.データ
【0077】初期化の間、全ての有効ビットは"オフ"に
設定される。有効ビットは、関連データが1アプリケー
ションにつきビットストリーム内で必要とされるとき、
マイクロコードによってのみ設定される。"シップ・ヘ
ッダ"処理の間、"有効"フィールドが"オン"であれば"デ
ータ"・フィールドの内容がビットストリーム内に置か
れる。
設定される。有効ビットは、関連データが1アプリケー
ションにつきビットストリーム内で必要とされるとき、
マイクロコードによってのみ設定される。"シップ・ヘ
ッダ"処理の間、"有効"フィールドが"オン"であれば"デ
ータ"・フィールドの内容がビットストリーム内に置か
れる。
【0078】"長さ"フィールドは初期化プロセスの間に
ロードされる。これは"有効"ビットが"オン"の時に、ビ
ットストリームに転送される"データ"・フィールド内の
データの長さを示すために使用される。
ロードされる。これは"有効"ビットが"オン"の時に、ビ
ットストリームに転送される"データ"・フィールド内の
データの長さを示すために使用される。
【0079】"コマンド"・フィールドには3ビットが存
在する。"コマンド"・フィールドは、プロセッサのヘッ
ダ発生器にデータのロケーション、データの生成方法、
及びビットストリームに挿入されるデータ量を伝えるた
めに使用される。"コマンド"・コードは次の様に定義さ
れる。 001 データ・フィールドの内容をビットストリーム
に転送。 010 20ビットの0をデータ・フィールドの内容に
連結し、ビットストリームに転送。 011 データ・バッファ内の次の64バイト・データ
をビットストリームに転送。 100 マクロブロック・データをビットストリームに
転送。 101 2つの連続データ・エントリの内容をビットス
トリームに転送。 110 データ・フィールドの内容をビットストリーム
に転送し、有効ビットをリセット。 111 ユーザ・データをビットストリームに転送。 000コードは未定義である。
在する。"コマンド"・フィールドは、プロセッサのヘッ
ダ発生器にデータのロケーション、データの生成方法、
及びビットストリームに挿入されるデータ量を伝えるた
めに使用される。"コマンド"・コードは次の様に定義さ
れる。 001 データ・フィールドの内容をビットストリーム
に転送。 010 20ビットの0をデータ・フィールドの内容に
連結し、ビットストリームに転送。 011 データ・バッファ内の次の64バイト・データ
をビットストリームに転送。 100 マクロブロック・データをビットストリームに
転送。 101 2つの連続データ・エントリの内容をビットス
トリームに転送。 110 データ・フィールドの内容をビットストリーム
に転送し、有効ビットをリセット。 111 ユーザ・データをビットストリームに転送。 000コードは未定義である。
【0080】データ・フィールドの内容は外部プロセッ
サにより初期化され、後にマイクロコードにより変更さ
れうる。
サにより初期化され、後にマイクロコードにより変更さ
れうる。
【0081】ヘッダ・バッファの内容は、外部または内
部プロセッサのいずれかにより書込み可能である。これ
は柔軟性を提供する。内部プロセッサ、すなわち本発明
のプロセッサは、シップ・ヘッダ・コマンドが発行され
るときに幾つかのレジスタをセット・アップしなければ
ならないだけである。ヘッダ・ハードウェアがヘッダを
生成し、これをビットストリームに転送する間、プロセ
ッサは他の作業を処理するように解放されるので性能が
改良される。
部プロセッサのいずれかにより書込み可能である。これ
は柔軟性を提供する。内部プロセッサ、すなわち本発明
のプロセッサは、シップ・ヘッダ・コマンドが発行され
るときに幾つかのレジスタをセット・アップしなければ
ならないだけである。ヘッダ・ハードウェアがヘッダを
生成し、これをビットストリームに転送する間、プロセ
ッサは他の作業を処理するように解放されるので性能が
改良される。
【0082】メモリ構成:時間的冗長性は時間に渡る冗
長なイメージ情報、すなわち類似であったり、時間に渡
りフレーム間で繰り返されるデータである。動き予測
は、ビデオ・イメージの時間的冗長性を低減するために
使用されるプロセスである。動き予測は、イメージ・シ
ーケンス内のオブジェクトの動きを決定するプロセスで
ある。時間的冗長性の除去は、MPEG−2規格の主要
部分でもある。しかしながら、MPEG−2規格は動き
予測を達成する方法については指定していない。MPE
G−2規格は、MPEG−2準拠の復号化を可能にする
ために必要なヘッダ、ビットストリーム・アーキテクチ
ャ、及びプロトコルを指定するに過ぎない。
長なイメージ情報、すなわち類似であったり、時間に渡
りフレーム間で繰り返されるデータである。動き予測
は、ビデオ・イメージの時間的冗長性を低減するために
使用されるプロセスである。動き予測は、イメージ・シ
ーケンス内のオブジェクトの動きを決定するプロセスで
ある。時間的冗長性の除去は、MPEG−2規格の主要
部分でもある。しかしながら、MPEG−2規格は動き
予測を達成する方法については指定していない。MPE
G−2規格は、MPEG−2準拠の復号化を可能にする
ために必要なヘッダ、ビットストリーム・アーキテクチ
ャ、及びプロトコルを指定するに過ぎない。
【0083】動き予測は符号器に3つの課題を提供す
る。それらはメモリ帯域幅、計算要求、及びノイズであ
る。本発明によれば、動き予測のために領域的ブロック
・マッチングが使用される。領域的ブロック・マッチン
グは、フレームの小領域へのセグメント化、及び基準フ
レーム内の可能な領域間で最適なマッチを生成する変位
(displacement)の探索を含む。フレームのサイズはM
PEG−2規格で定義されるように、水平方向に720
画素行、垂直方向に480画素ラインとして定義され
る。1ピクチャ当たりのデータ量は、符号器チップ内に
含むには余りにも大き過ぎるのでこれは外部メモリに記
憶される。動き予測機能には3つの主要ステップが要求
される。それらはメモリからのデータ検索、データ計
算、及び予測選択である。
る。それらはメモリ帯域幅、計算要求、及びノイズであ
る。本発明によれば、動き予測のために領域的ブロック
・マッチングが使用される。領域的ブロック・マッチン
グは、フレームの小領域へのセグメント化、及び基準フ
レーム内の可能な領域間で最適なマッチを生成する変位
(displacement)の探索を含む。フレームのサイズはM
PEG−2規格で定義されるように、水平方向に720
画素行、垂直方向に480画素ラインとして定義され
る。1ピクチャ当たりのデータ量は、符号器チップ内に
含むには余りにも大き過ぎるのでこれは外部メモリに記
憶される。動き予測機能には3つの主要ステップが要求
される。それらはメモリからのデータ検索、データ計
算、及び予測選択である。
【0084】外部メモリから検索されるデータの量は探
索ウィンドウに直接比例する。大きな探索ウィンドウ
は、大量のデータ内でより近いマッチを見い出す高い確
率を提供するので、メモリ帯域幅に対するより大きな要
求を生成する。小さな探索ウィンドウについては逆のこ
とが言え、メモリ帯域幅に対する要求は小さいがより近
いマッチを見い出す確率は低い。
索ウィンドウに直接比例する。大きな探索ウィンドウ
は、大量のデータ内でより近いマッチを見い出す高い確
率を提供するので、メモリ帯域幅に対するより大きな要
求を生成する。小さな探索ウィンドウについては逆のこ
とが言え、メモリ帯域幅に対する要求は小さいがより近
いマッチを見い出す確率は低い。
【0085】メモリ帯域幅を最大化するために本発明の
符号器メモリ制御システム及び方法は、別々のルミナン
ス及びクロミナンス・ロケーションを記憶するルミナン
ス及びクロミナンス対(UV対)、メモリ・アクセス優
先順位付け、並びにルミナンス及びクロミナンスのため
の物理的に別個のメモリを含む。
符号器メモリ制御システム及び方法は、別々のルミナン
ス及びクロミナンス・ロケーションを記憶するルミナン
ス及びクロミナンス対(UV対)、メモリ・アクセス優
先順位付け、並びにルミナンス及びクロミナンスのため
の物理的に別個のメモリを含む。
【0086】ルミナンス及びクロミナンス・データが別
々のロケーションに記憶される。ルミナンス及びクロミ
ナンス・データの両方において動きが発生する。しかし
ながらルミナンス及びクロミナンスの動きは互いに追跡
し合う。計算要求を最小化するためにルミナンス・デー
タだけが動き予測において使用される。画素データが外
部メモリから検索されるとき、メモリ・アクセス時間は
列アドレス選択(CAS)時間、及び行アドレス選択
(RAS)時間に依存する。各新たなRASアクセスに
対してはRAS内の隣接CASよりも長い遅延が要求さ
れる。この理由から、ルミナンス・データがクロミナン
ス・データとは別に記憶される。このことは動き予測の
間の隣接CASを最大化する。クロミナンス・データが
UV対としてメモリ制御に送信され、DRAMに記憶さ
れ、そこからフェッチされるので、ピクチャ記憶または
マクロブロック(MB)・フェッチの処理時におけるメ
モリ帯域幅が節約される。
々のロケーションに記憶される。ルミナンス及びクロミ
ナンス・データの両方において動きが発生する。しかし
ながらルミナンス及びクロミナンスの動きは互いに追跡
し合う。計算要求を最小化するためにルミナンス・デー
タだけが動き予測において使用される。画素データが外
部メモリから検索されるとき、メモリ・アクセス時間は
列アドレス選択(CAS)時間、及び行アドレス選択
(RAS)時間に依存する。各新たなRASアクセスに
対してはRAS内の隣接CASよりも長い遅延が要求さ
れる。この理由から、ルミナンス・データがクロミナン
ス・データとは別に記憶される。このことは動き予測の
間の隣接CASを最大化する。クロミナンス・データが
UV対としてメモリ制御に送信され、DRAMに記憶さ
れ、そこからフェッチされるので、ピクチャ記憶または
マクロブロック(MB)・フェッチの処理時におけるメ
モリ帯域幅が節約される。
【0087】MPEG−2規格で定義されるように、ピ
クチャは小さなサブイメージまたはマクロブロックに分
割される。マクロブロックは互いに独立に符号化され
る。マクロブロックは水平方向に16画素、垂直方向に
16ラインとして定義される。更に、マクロブロック内
の画素単位が全画素(full pel)または半画素(half p
el)のいずれかであるように定義される。ここでx及び
yをピクチャ内の隣接画素とすると半画素は次の様に定
義される。次式内の記号"/"は丸みを伴う除算を意味す
る。
クチャは小さなサブイメージまたはマクロブロックに分
割される。マクロブロックは互いに独立に符号化され
る。マクロブロックは水平方向に16画素、垂直方向に
16ラインとして定義される。更に、マクロブロック内
の画素単位が全画素(full pel)または半画素(half p
el)のいずれかであるように定義される。ここでx及び
yをピクチャ内の隣接画素とすると半画素は次の様に定
義される。次式内の記号"/"は丸みを伴う除算を意味す
る。
【数1】(x+y)/2
【0088】16画素をハーフ単位で形成するために、
符号器は17バイトを外部メモリから検索しなければな
らない。4バイト幅の入力メモリ・バス設計では、17
バイトのデータを検索するために5回のメモリ・アクセ
スが必要となる。しかしながら最後のアクセスでは1バ
イトだけが有用である。これはルミナンス及びクロミナ
ンス・データ(U及びV)に当てはまる。U及びVを対
として記憶することにより、1ラインのクロミナンス・
データに対応して9回のメモリ・アクセスだけしか要求
されない。それに対してルミナンス及びクロミナンス
(U及びV)が別々のメモリ・ロケーションに記憶され
る場合には、10回のメモリ・アクセスが要求される。
符号器は17バイトを外部メモリから検索しなければな
らない。4バイト幅の入力メモリ・バス設計では、17
バイトのデータを検索するために5回のメモリ・アクセ
スが必要となる。しかしながら最後のアクセスでは1バ
イトだけが有用である。これはルミナンス及びクロミナ
ンス・データ(U及びV)に当てはまる。U及びVを対
として記憶することにより、1ラインのクロミナンス・
データに対応して9回のメモリ・アクセスだけしか要求
されない。それに対してルミナンス及びクロミナンス
(U及びV)が別々のメモリ・ロケーションに記憶され
る場合には、10回のメモリ・アクセスが要求される。
【0089】符号器では、符号化を開始するために十分
なデータが保存されるまで、入力イメージが蓄積され
る。次に符号化プロセスの間にデータが外部メモリから
フェッチされる。符号化データからイメージが復元され
る。この復元されたイメージもまた外部メモリに保存さ
れる。外部メモリ内の復元イメージは、続くピクチャの
動き予測のための基準データとして後に検索される。符
号化プロセスの間、画素データ片が複数回記憶され、フ
ェッチされる。衝突を最小化するため、本発明の符号器
内の外部メモリは異なるセグメントに物理的に分離され
る。各セグメントは、複数のメモリ・セグメントが同時
に動作しうるように独自の制御及びデータパスを有す
る。セグメントは符号器内でのそれらのデータ・フロー
にもとづき選択される。入力イメージがあるメモリ・セ
グメントに保存され、復元イメージが別のメモリ・セグ
メントに保存される。
なデータが保存されるまで、入力イメージが蓄積され
る。次に符号化プロセスの間にデータが外部メモリから
フェッチされる。符号化データからイメージが復元され
る。この復元されたイメージもまた外部メモリに保存さ
れる。外部メモリ内の復元イメージは、続くピクチャの
動き予測のための基準データとして後に検索される。符
号化プロセスの間、画素データ片が複数回記憶され、フ
ェッチされる。衝突を最小化するため、本発明の符号器
内の外部メモリは異なるセグメントに物理的に分離され
る。各セグメントは、複数のメモリ・セグメントが同時
に動作しうるように独自の制御及びデータパスを有す
る。セグメントは符号器内でのそれらのデータ・フロー
にもとづき選択される。入力イメージがあるメモリ・セ
グメントに保存され、復元イメージが別のメモリ・セグ
メントに保存される。
【0090】復元された基準データのフェッチ及び記憶
の実行の際、DRAMがメモリ・アクセスを優先順位付
けすることにより帯域幅を節約する。ピクチャ・タイ
プ、IPまたはIPBモード、デュアル・プライム(du
al prime)、及び基準フィールド数などのピクチャの符
号化パラメータが、改良探索パス内の各ユニットがマク
ロブロック当たりに有するフェッチ回数の予測を支援す
る。1ユニット当たりのフェッチ回数が予測されるとメ
モリ制御がDRAMフェッチを実行し、そのピクチャの
パターンを記憶する。全ての異なる符号化過程における
パターンが予め定義され、チップを通じて最大データ・
フローを提供するように状態マシンにマップされる。各
ユニットが必要時にデータを受信できるようにDRAM
フェッチ及び記憶をマップすることにより、最大データ
・フローが達成される。基準データは、改良ユニットが
以前のフェッチ・データによりビジーとなると判断され
るとき、DRAMに記憶し戻される。メモリ・アクセス
は、マクロブロック処理における休止を回避するように
可能な限り合理化される。こうした休止は、データの受
信以前に別のフェッチまたはマクロブロック記憶を終了
するために、メモリ制御を待機しなければならないユニ
ットによる。
の実行の際、DRAMがメモリ・アクセスを優先順位付
けすることにより帯域幅を節約する。ピクチャ・タイ
プ、IPまたはIPBモード、デュアル・プライム(du
al prime)、及び基準フィールド数などのピクチャの符
号化パラメータが、改良探索パス内の各ユニットがマク
ロブロック当たりに有するフェッチ回数の予測を支援す
る。1ユニット当たりのフェッチ回数が予測されるとメ
モリ制御がDRAMフェッチを実行し、そのピクチャの
パターンを記憶する。全ての異なる符号化過程における
パターンが予め定義され、チップを通じて最大データ・
フローを提供するように状態マシンにマップされる。各
ユニットが必要時にデータを受信できるようにDRAM
フェッチ及び記憶をマップすることにより、最大データ
・フローが達成される。基準データは、改良ユニットが
以前のフェッチ・データによりビジーとなると判断され
るとき、DRAMに記憶し戻される。メモリ・アクセス
は、マクロブロック処理における休止を回避するように
可能な限り合理化される。こうした休止は、データの受
信以前に別のフェッチまたはマクロブロック記憶を終了
するために、メモリ制御を待機しなければならないユニ
ットによる。
【0091】上記特長の組み合わせが帯域幅を最大化
し、本発明の符号器設計におけるメモリ要求を最小化す
る。
し、本発明の符号器設計におけるメモリ要求を最小化す
る。
【0092】まとめとして、本発明の構成に関して以下
の事項を開示する。
の事項を開示する。
【0093】(1)ルミナンス成分及びクロミナンス成
分を有するデジタル・ビデオ・イメージ・データを符号
化する方法であって、上記クロミナンス成分を上記ルミ
ナンス成分の空間分解能の1/4に符号化する、方法。
分を有するデジタル・ビデオ・イメージ・データを符号
化する方法であって、上記クロミナンス成分を上記ルミ
ナンス成分の空間分解能の1/4に符号化する、方法。
【図1】ピクチャ・グループを形成する内部フレーム、
予測フレーム、及び双方向フレームの関係を示す図であ
る。
予測フレーム、及び双方向フレームの関係を示す図であ
る。
【図2】離散余弦変換符号化の3つのステージのフロー
チャートを示す図である。
チャートを示す図である。
【図3】本発明の動的に区分化可能なデジタル・ビデオ
符号器プロセッサのブロック図である。
符号器プロセッサのブロック図である。
【図4】連続ライン間、奇数ライン間、及び偶数ライン
間での画素の減算を示す図である。
間での画素の減算を示す図である。
11 プロセッサ 21 命令記憶 23 命令フェッチ/解読ユニット 25 分岐/ループ・プロセッサ・ユニット 31 算術論理演算ユニット(ALU) 33、35、37、39 1バイトALU 41 汎用ワーキング・レジスタ 43 特殊目的レジスタ 45 条件レジスタ 47 レジスタ/メモリ・インタフェース・ユニット 49 インタフェース・バス
───────────────────────────────────────────────────── フロントページの続き (72)発明者 ジェームズ・デビッド・グリーンフィール ド アメリカ合衆国13904、ニューヨーク州ビ ンガムトン、ウォルフィンガー・ウェイ 34 (72)発明者 ダイアン・マリィ・マウアスバーグ アメリカ合衆国13827、ニューヨーク州オ ゥエゴ、ウッドヘブン・ドライブ 335 (72)発明者 アグネス・イー・ガイ アメリカ合衆国13760、ニューヨーク州エ ンドウェル、パートリッジ・プレース 725
Claims (1)
- 【請求項1】ルミナンス成分及びクロミナンス成分を有
するデジタル・ビデオ・イメージ・データを符号化する
方法であって、 上記クロミナンス成分を上記ルミナンス成分の空間分解
能の1/4に符号化する、方法。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US411127 | 1995-03-27 | ||
US08/411,127 US6198767B1 (en) | 1995-03-27 | 1995-03-27 | Apparatus for color component compression |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH08275149A true JPH08275149A (ja) | 1996-10-18 |
Family
ID=23627682
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP8036725A Pending JPH08275149A (ja) | 1995-03-27 | 1996-02-23 | データ符号化方法 |
Country Status (2)
Country | Link |
---|---|
US (1) | US6198767B1 (ja) |
JP (1) | JPH08275149A (ja) |
Families Citing this family (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7424677B2 (en) * | 1999-09-16 | 2008-09-09 | Sharp Laboratories Of America, Inc. | Audiovisual information management system with usage preferences |
JP3810268B2 (ja) * | 2000-04-07 | 2006-08-16 | シャープ株式会社 | オーディオビジュアルシステム |
US8028314B1 (en) * | 2000-05-26 | 2011-09-27 | Sharp Laboratories Of America, Inc. | Audiovisual information management system |
US7647340B2 (en) | 2000-06-28 | 2010-01-12 | Sharp Laboratories Of America, Inc. | Metadata in JPEG 2000 file format |
US8020183B2 (en) * | 2000-09-14 | 2011-09-13 | Sharp Laboratories Of America, Inc. | Audiovisual management system |
US20030061610A1 (en) * | 2001-03-27 | 2003-03-27 | Errico James H. | Audiovisual management system |
US7904814B2 (en) * | 2001-04-19 | 2011-03-08 | Sharp Laboratories Of America, Inc. | System for presenting audio-video content |
US20030121040A1 (en) * | 2001-07-02 | 2003-06-26 | Ferman A. Mufit | Audiovisual management system |
US7474698B2 (en) * | 2001-10-19 | 2009-01-06 | Sharp Laboratories Of America, Inc. | Identification of replay segments |
US8214741B2 (en) * | 2002-03-19 | 2012-07-03 | Sharp Laboratories Of America, Inc. | Synchronization of video and data |
US7657907B2 (en) * | 2002-09-30 | 2010-02-02 | Sharp Laboratories Of America, Inc. | Automatic user profiling |
US20040197088A1 (en) * | 2003-03-31 | 2004-10-07 | Ferman Ahmet Mufit | System for presenting audio-video content |
US8949899B2 (en) * | 2005-03-04 | 2015-02-03 | Sharp Laboratories Of America, Inc. | Collaborative recommendation system |
US7594245B2 (en) * | 2004-03-04 | 2009-09-22 | Sharp Laboratories Of America, Inc. | Networked video devices |
US8356317B2 (en) | 2004-03-04 | 2013-01-15 | Sharp Laboratories Of America, Inc. | Presence based technology |
JP4273420B2 (ja) * | 2004-12-06 | 2009-06-03 | ソニー株式会社 | 映像信号処理装置及び映像信号の伝送方法 |
US8689253B2 (en) * | 2006-03-03 | 2014-04-01 | Sharp Laboratories Of America, Inc. | Method and system for configuring media-playing sets |
US8116371B2 (en) * | 2006-03-08 | 2012-02-14 | Texas Instruments Incorporated | VLC technique for layered video coding using distinct element grouping |
Family Cites Families (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5113242A (en) | 1987-07-24 | 1992-05-12 | North American Philips Corporation | Two-line MAC high definition television system |
GB2230673A (en) * | 1989-04-14 | 1990-10-24 | Philips Electronic Associated | Generating a series of dpcm code words for storing colour image data |
JP2782631B2 (ja) * | 1989-12-14 | 1998-08-06 | キヤノン株式会社 | 画像信号処理方法 |
US4999705A (en) * | 1990-05-03 | 1991-03-12 | At&T Bell Laboratories | Three dimensional motion compensated video coding |
FR2676608B1 (fr) * | 1991-05-17 | 1993-09-03 | France Telecom | Procede de codage d'images en couleurs a fort taux de compression sans filtrage, procede de decodage, codeur, decodeur et application correspondants. |
US5231484A (en) * | 1991-11-08 | 1993-07-27 | International Business Machines Corporation | Motion video compression system with adaptive bit allocation and quantization |
US5227878A (en) * | 1991-11-15 | 1993-07-13 | At&T Bell Laboratories | Adaptive coding and decoding of frames and fields of video |
US5253041A (en) | 1992-05-26 | 1993-10-12 | General Electric Company | Digital television signal compression apparatus |
DE69328346T2 (de) * | 1992-12-22 | 2000-10-12 | Koninklijke Philips Electronics N.V., Eindhoven | Vorrichtung zur Kodierung von digitalen Fernbildsignalen |
JP3163830B2 (ja) * | 1993-03-29 | 2001-05-08 | ソニー株式会社 | 画像信号伝送方法及び装置 |
US5398072A (en) | 1993-10-25 | 1995-03-14 | Lsi Logic Corporation | Management of channel buffer in video decoders |
US5526054A (en) * | 1995-03-27 | 1996-06-11 | International Business Machines Corporation | Apparatus for header generation |
-
1995
- 1995-03-27 US US08/411,127 patent/US6198767B1/en not_active Expired - Lifetime
-
1996
- 1996-02-23 JP JP8036725A patent/JPH08275149A/ja active Pending
Also Published As
Publication number | Publication date |
---|---|
US6198767B1 (en) | 2001-03-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3142772B2 (ja) | プロセッサ及び転送方法 | |
US5737020A (en) | Adaptive field/frame encoding of discrete cosine transform | |
KR100196019B1 (ko) | 스케일러블 mpeg2 컴플라이언트 비디오 인코더 | |
US5576765A (en) | Video decoder | |
KR100294999B1 (ko) | 디지탈비디오데이타스트림의시간적인압축방법및탐색프로세서 | |
US8218640B2 (en) | Picture decoding using same-picture reference for pixel reconstruction | |
JPH08275149A (ja) | データ符号化方法 | |
US6996186B2 (en) | Programmable horizontal filter with noise reduction and image scaling for video encoding system | |
US5768429A (en) | Apparatus and method for accelerating digital video decompression by performing operations in parallel | |
JPH118849A (ja) | ピクチャの符号化方法および符号化装置 | |
JPH0799659A (ja) | 非消耗的動き予測法 | |
JPH06326996A (ja) | 圧縮されたビデオデータをデコードする方法及び装置 | |
US5748240A (en) | Optimal array addressing control structure comprising an I-frame only video encoder and a frame difference unit which includes an address counter for addressing memory addresses | |
US5650823A (en) | Half pel motion estimation method for B pictures | |
JP3703299B2 (ja) | ピクチャ中央の画質を最適化するためのビデオ符号化方法、システムおよびコンピュータ・プログラム製品 | |
JP3615241B2 (ja) | ビデオデータデコーダのアーキテクチャ | |
JPH07240844A (ja) | 画像データ処理装置および画像データ処理方法 | |
US5644504A (en) | Dynamically partitionable digital video encoder processor | |
KR20060113666A (ko) | 양자화 잡음 전파 효과의 감소를 위한 최적의 시공간 변환 | |
EP1677542A2 (en) | Method and system for video motion processing | |
JPH08275173A (ja) | デジタル符号化方法 | |
US9094686B2 (en) | Systems and methods for faster throughput for compressed video data decoding | |
US5978033A (en) | Motion picture encoder | |
KR0183165B1 (ko) | 휘도 데이타의 움직임 보상을 위한 참조 움직임 벡터 및 참조 어드레스 생성회로 | |
JP3653799B2 (ja) | 画像符号化装置 |