JP3445919B2

JP3445919B2 - デジタル映像信号の三次元圧縮方法及びシステム

Info

Publication number: JP3445919B2
Application number: JP10801497A
Authority: JP
Inventors: ダブリューニーセンジョセフ
Original assignee: ティアールダブリューインコーポレイテッド
Priority date: 1996-03-25
Filing date: 1997-03-21
Publication date: 2003-09-16
Anticipated expiration: 2017-03-21
Also published as: EP0798928A2; JPH1075446A; EP0798928A3; TW364107B; KR100262236B1; US5936669A; US5933193A

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は、一般に、デジタル
映像信号の圧縮に係り、より詳細には、高い圧縮比、最
小の信号歪みを示すデジタル映像信号の三次元圧縮方法
に係る。

【０００２】

【従来の技術】現在の映像用途では、多量のデータを高
いビットレートで且つ最小量の信号歪で送信することが
必要とされる。例えば、ＶＣＲグレードの映像（ＳＩ
Ｆ）、放送用のテレビジョン映像（ＣＣＩＲ−６０１）
及び高解像度テレビジョン（ＨＤＴＶ）のような白黒デ
ジタル映像のための非圧縮データビットレートは、各
々、１６Ｍｂｐｓ、６７Ｍｂｐｓ及び２４０Ｍｂｐｓで
ある。非圧縮状態では、これらデータビットレートは、
このような映像信号を商業的に実現可能な形態で送信し
そして処理するには高過ぎる。それ故、このような映像
信号を実用的な仕方で処理するために、この映像信号を
送信の前に圧縮しなければならない。

【０００３】映像をベースとする用途及び製品の増加に
伴い、標準的な映像信号圧縮構造を形成する要望が業界
に幅広く生じている。「動画専門グループ」（ＭＰＥ
Ｇ）として非公式に知られているインターナショナル・
スタンダード・オーガナイゼーション（ＩＳＯ）の傘下
のグループが、デジタル映像及び音声圧縮に関する規格
を制定するために創立された。その後、ＭＰＥＧは、圧
縮された映像信号ビット流の内容と、そのビット流を送
信後に圧縮解除する方法とを定義することにより標準化
されたシンタックスを作成した。しかしながら、圧縮方
法については定義されておらず、従って、個々の製造者
は、その定義された規格内でデータビット流を実際に圧
縮する種々の方法を開発することが許されている。

【０００４】ＭＰＥＧは、今日までに、デジタル映像業
界で広く使用される２つのシンタックスを定義した。Ｍ
ＰＥＧ−１として知られているシンタックスは、広範囲
なビットレート及びサンプルレートに適用できるように
定義されている。特に、ＭＰＥＧ−１は、ＣＤ／ＲＯＭ
の用途、及び送信レートが約１．５Ｍｂ／ｓの他の非飛
び越し映像の用途に使用するのに適している。ＭＰＥＧ
−２として知られている第２のシンタックスは、放送映
像の表示、及びコードビットレートが４ないし９Ｍｂ／
ｓの他の映像信号用途に対して定義されている。又、Ｍ
ＰＥＧ−２シンタックスは、ＨＤＴＶの用途や、飛び越
し映像の充分なコード化を必要とする他の用途にも適用
できる。

【０００５】

【発明が解決しようとする課題】上記のＭＰＥＧ−１及
びＭＰＥＧ−２シンタックスは、充分な性能特性を示す
が、デジタル映像が進化し続けている上に、現在のＭＰ
ＥＧ映像シンタックスの定義がそれに関連した制約を有
するために、更なる技術的進歩が要求される。例えば、
時間的に変化しない映像ピクセルに対しデータビットレ
ート送信を最小にすることにより映像圧縮を増大するの
に使用できる現象、即ち時間的冗長性は、映像信号の圧
縮を最大にする効率的な方法である。現在のＭＰＥＧ−
１及び２のデータ圧縮ベースの方法は、時間的な圧縮を
使用している。しかしながら、ＭＰＥＧ−１及び２に基
づく時間的な圧縮は、フレームごとの判断に基づくもの
で、この方法は、時間的圧縮の利点を完全に活用しな
い。特に、商業規格のＭＰＥＧ−１及びＭＰＥＧ−２シ
ンタックスは、時間的な冗長性を部分的にしか使用しな
い。加えて、現在のＭＰＥＧシンタックスは、多数の最
適化オプション（予想フレーム、バイリニアフレーム及
びフレーム内変数のような）を計算し、送信しそしてＭ
ＰＥＧ信号圧縮解除装置によりデコードすることを必要
とする。これらの多数の変数を使用すると、データ圧縮
に対する計算時間及び複雑さの両方が増大する。又、多
数の現在のＭＰＥＧ実施シンタックスは、３０：１のよ
うな高い関連ビットレート圧縮を示すが、益々複雑で且
つデータに集中した映像用途では、リアルタイム処理の
ための高い圧縮率が必要とされる。２００：１のような
高い圧縮比を請求した圧縮方法も存在するが、このよう
な方法は、映像フレームシーケンスでピクセルのアレー
をサブサンプルし（即ち、１つおきのフレームを破棄
し）、そして高い圧縮を得るための他の簡易手段を使用
している。

【０００６】高いビットレートの送信を達成する要求が
増え続けているのに伴い、ＭＰＥＧ−１及び２に基づく
規格により現在使用されている以上に時間的冗長性を完
全に利用して高い圧縮比を得ることにより現在のＭＰＥ
Ｇ−１又はＭＰＥＧ−２規格より低い送信レートを示す
映像信号データ圧縮方法が要望される。同時に、計算の
複雑さが現在の方法より少なく且つＭＰＥＧ−１及びＭ
ＰＥＧ−２規格に合致する現在実施されているビデオシ
ステムに適合するようなデータ圧縮方法が要望される。

【０００７】

【課題を解決するための手段】本発明によれば、デジタ
ル映像信号を圧縮する２つの方法が提供される。両方の
方法は、現在のＭＰＥＧ規格よりも高い圧縮比を示すと
同時に、あまり計算に集中しない。特に、本発明の映像
信号圧縮方法は、標準的なＭＰＥＧの二次元空間量子化
マトリクスに加えて、時間的次元の量子化ベクトルを使
用し、人間の目には分からない関連信号歪で圧縮率を最
適化する。両方の方法は、ＭＰＥＧ対応フォーマットで
使用するのに適しており、従って、これら方法を現在の
デジタル映像信号の用途に使用することができる。

【０００８】本発明の解決策において、第１の方法は、
デジタル映像信号を圧縮するためのものである。この方
法は、映像信号データ圧縮動作を実行する圧縮装置を用
意する段階を含む。映像信号は、この圧縮装置に受け取
られ、複数の映像信号フレームからの空間的及び時間的
データを含む。圧縮装置は、空間的及び時間的データを
データ量子化のためにコンディショニングし、そしてそ
のコンディショニングされたデータを量子化し、変換さ
れた空間的データが変換された時間的データに関連する
ようにされる。次いで、量子化されたデータから最適な
変換レート及び信号歪レベルが決定される。変換された
空間的データは、その後、変換された時間的データに対
する順序から関連性が断たれ、その後、変換された空間
的及び時間的データのマトリクスは、データ送信のため
のジグザグ構成ブロックにおけるマトリクスへとフォー
マットされる。

【０００９】第２のデータ圧縮方法も提供される。第２
の方法は、映像圧縮動作を実行するための信号圧縮装置
を用意することを含む。複数の映像フレームを含む映像
信号データが信号圧縮装置に入力される。圧縮装置は、
空間的及び時間的位置ドメインから三次元周波数ドメイ
ンへの映像信号データの三次元変換を実行する。次い
で、圧縮装置は、複数の三次元量子化マトリクスを形成
し、各マトリクスは、映像信号における１つの時間的周
波数からの変換データに対応する量子化係数を含む。複
数の量子化マトリクスの各々は、各時間的周波数に対
し、時間的量子化ベクトル成分が量子化係数の各々に関
連されるような第３の次元を含む。次いで、圧縮装置
は、量子化マトリクスにおけるデータから映像フレーム
に対し最大送信レート及び最適な信号歪パラメータを計
算する。最適に量子化されたデータは、時間的次元にお
いて量子化解除されそして時間的逆変換される（一次元
変換）。これにより得られる空間的変換は、ＭＰＥＧ規
定に従いジグザグに順序付けされて送信される。

【００１０】

【発明の実施の形態】本発明の他の目的及び効果は、添
付図面を参照した以下の詳細な説明から明らかとなろ
う。一般に図１及び２を参照すれば、本発明の好ましい
実施形態が具現化されたシステムが１０ａ及び１０ｂで
一般的に示されている。このシステムにおいて、本発明
による高圧縮データ方法の１つが具現化される。これら
のデータ圧縮方法は、三次元量子化マトリクスの使用に
より実施される時間的（ｔｅｍｐｏｒａｌ）圧縮を使用
する。本発明の方法は、第３の時間的次元を二次元の空
間的量子化マトリクスに付加する。時間的量子化ベクト
ルは、データのフレームを表すＭＰＥＧの二次元空間的
マトリクスにおいて係数を乗算する。時間的ドメインの
次元をＭＰＥＧの空間的係数マトリクスに追加すること
により、予想、バイリニア及びフレーム内変数といった
上記ＭＰＥＧに基づくデータ圧縮方法におけるレート／
歪最適化計算に関連した変数が排除される。というの
は、時間的量子化の値は、本発明の圧縮方法においてレ
ート／歪最適化パラメータを計算するのに必要な唯一の
変数だからである。その結果、現在のＭＰＥＧに基づく
データ圧縮方法に比して、圧縮方法及びシステムの複雑
さが相当に減少され、そしてデータ圧縮比が相当に増加
される。

【００１１】特に、図１を参照すれば、映像信号は、映
像信号ソース１２において発生される。この映像信号ソ
ースは、デジタル映像信号又はアナログ映像信号のいず
れのソースでもよく、アナログ映像信号は、アナログ／
デジタル映像フレームグラバ１４のような手段により後
でデジタル形態に変換されることが意図される。このよ
うな映像信号ソースは、ビデオカセットレコーダ（ＶＣ
Ｒ）、ＣＤＲＯＭ、放送テレビ信号発生器、高解像度
テレビ信号発生器、或いは何らかの形式のコンピュータ
ネットワークアプリケーション又は他のリアルタイムデ
ジタルビデオソースを含むが、これに限定されるもので
はない。映像信号ソース１２及び／又は映像フレームグ
ラバ１４から発生されたデジタル映像信号は、一般的に
１６で示された信号圧縮装置へ入力される。この信号圧
縮装置は、プロセッサ１８、メモリ２０及び電源２２を
備えている。中央のハードドライブ２４のような外部記
憶媒体がＣＰＵに作動的に接続されて、更に別の計算及
び記憶能力を圧縮装置に付加することができる。

【００１２】好ましくは、上記の信号圧縮装置は、サン
・スパーク（ＳｕｎＳｐａｒｃ）１０ワークステーシ
ョンによって実施される。しかしながら、インテル社の
Ｐｅｎｔｉｕｍ（登録商標）プロセッサチップを有する
ＩＢＭ又はＩＢＭ対応のパーソナルコンピュータ、又は
同等の処理能力を有する他の処理ユニットのような他の
コンピュータを使用して、本発明のデータ圧縮方法を実
施できることが明らかであろう。本発明の方法は、ＡＮ
ＳＩＣプログラミング言語を使用して実施することが
できる。しかしながら、他のコンピュータ言語を用いて
本発明を実施できることも理解されたい。

【００１３】プロセッサ１８に加えて、信号圧縮装置
は、以下に述べるように本発明の好ましい方法に基づき
離散的コサイン変換（ＤＣＴ）を実行するためのアプリ
ケーション指向の集積回路（ＡＳＩＣ）３０も備えてい
る。又、信号圧縮装置１６は、以下に詳細に述べるよう
に、データ送信のためのヒストグラムを形成するヒスト
グラムチップ３２も備えている。

【００１４】図２には、信号受信器が一般的に１０ｂで
示されている。この信号受信器は、一般的に４０で示さ
れた信号圧縮解除装置を備えている。信号圧縮装置の場
合と同様に、この信号圧縮解除装置は、サン・スパーク
１０ワークステーション、インテル社のＰｅｎｔｉｕｍ
（登録商標）プロセッサを有するＩＢＭパーソナルコン
ピュータ、又は同様の処理能力を有する他の処理ユニッ
トである。圧縮装置と圧縮解除装置は、実際には、同じ
処理ユニットでもよいことを理解されたい。圧縮解除装
置は、信号圧縮装置１６から送信された圧縮された映像
フレームを再構成するように逆変換を実行するプロセッ
サ４２を備えている。特に、ＡＳＩＣ４４は、これらの
逆変換を実行する。又、プロセッサ４２は、良く知られ
た形式のメモリ４６及び電源４８を備えている。又、送
信され再構成された映像フレームを表示するためにビデ
オモニタ５０がプロセッサ４２に接続される。このビデ
オモニタは、良く知られた形式のものであり、テレビ、
コンピュータディスプレイ或いは他の市販のピクセルベ
ースのビデオスクリーンでよい。

【００１５】図３を参照すれば、映像信号ソース１２に
より発生された映像フレームの一連のグループが５２で
一般的に示されている。映像フレームの各々は、良く知
られたように、５４において時間表示ｔ＝０、ｔ＝１等
々で示されたように時間的に連続するピクセル配列を表
す。本発明の方法によれば、各映像フレームに含まれた
ピクセルデータは、ＡＳＩＣによる二次元の離散的コサ
イン変換（ＤＣＴ）関数により空間的位置ドメインから
空間的周波数ドメインに変換される。

【００１６】更に、二次元的に変換された空間データに
基づいてＡＳＩＣ３０により一次元ＤＣＴが実行され
て、空間的変換係数の各々に対し「時間的周波数タグ」
を効果的に形成し、これにより、図４に５６で一般的に
示されそして５７においてｗ＝１、ｗ＝２等々で示され
た映像フレームデータの係数変換を生じる。但し、ｗは
離散的な時間的周波数ドメインの増加を指示する。これ
らの係数は、以下に述べるように量子化される。離散的
コサイン変換関数は、本発明の方法の実施に対して、カ
ーハネンローベ（ＫａｒｈｕｎｅｎＬｏｅｖｅ）変換
として知られている理想的な変換を厳密に近似するとい
う点で望ましく、この変換は、信号処理の分野では、数
学的に最適な仕方で回答を計算するようにランダムプロ
セスの項と項との間に既知の相関係数を伴うランダムプ
ロセスの理想的な変換として知られている。複数の映像
フレームの二次元の空間的ＤＣＴは、「時間タグ」イン
デックスｔによりインデックスされる。但し、Ｎはピクセルブロックの片側におけるピクセルの
数であり、そしてＤ（ｕ）＝２／√Ｎｕ＝０の場合、Ｄ（ｖ）＝２／√Ｎｖ＝０の場合、Ｄ（ｕ）＝２√２／Ｎｕ＞０の場合、及びＤ（ｖ）＝２√２／Ｎｖ＞０の場合、である。

【００１７】図５に示すように、一次元及び二次元変換
がＡＳＩＣ３０により実行された後に、各映像フレーム
に対して得られるデータが、５８で一般的に示す三次元
量子化マトリクスにおいて量子化される。得られるマト
リクスの各々は、図５の５９において矢印Ｕで示された
行当たり８個の係数と、６０において矢印Ｖで示された
列当たり８個の係数と、６１において矢印Ｗで示された
方向の各空間的係数に関連した時間的量子化ベクトルと
を備えている。三次元量子化マトリクスは、ＭＰＥＧの
二次元空間的マトリクスからの６４個のＣｕｖ量子化係
数と、時間的ベクトル素子により表されそして一次元の
離散的コサイン変換から導出された時間的スケーリング
項とを乗算することにより形成される。その式は、次の
ように表される。Ｑ_３Ｄ＝ｑ_ＷＱ_ＭＰＥＧ但し、ｑ_Ｗ＝（ｑ_ｗ０、ｑ_ｗ１、・・・ｑ_ｗ７）は、以
下に述べるレート・歪最適化方法から導出された時間的
スケーリング項である。従って、８個のフレームシーケ
ンスにおいて特定の映像フレームを表す各マトリクス
は、マトリクス５８において一般的に示されたように項
_ｕｖｗにより各々一般的に表された６４個の三次元係
数を含む。二次元のＤＣＴの場合に、ＤＣ値は、空間的
ドメインにおいて０、０項であり、当該映像フレームに
おけるピクセル強度の平均値を表す。残りの６３個の係
数即ちＡＣ値は、時間的に連続するフレームにおけるピ
クセル間の差に関連される。

【００１８】図６を参照すれば、本発明の第１の実施形
態による第１のデータ圧縮方法を実施する好ましい方法
が６２で一般的に示されており、これについて以下に説
明する。６３で示すように、映像フレームの元のシーケ
ンスが圧縮装置１６に入力される。このフレームのシー
ケンスは、良く知られた従来のＭＰＥＧシンタックスで
行われるように、ステップ６４において動きの補償分析
を受ける。動き補償の一般的な数学的表示は、次の通り
である。フレーム０（Ｓ_０）からマクロブロックに対す
るフレームｎ（ｓ_ｎ）におけるマクロブロック（１６ｘ
１６ピクセル）の動き補償のための変位Δｘ_ｎ及びΔｙ
_ｎは、フレームＳ_ｃにおけるピクセルの窓内の全ての考
えられるΔｘ_ｎ、Δｙ_ｎに対し次のようになる。

【００１９】ステップ６６において、上記の二次元離散
的コサイン変換（ＤＣＴ）がフレーム内に含まれたデー
タに対して実行され、空間的位置ドメインから空間的周
波数ドメインへデータを変換する。ステップ６８におい
て、一次元離散的コサイン変換が時間的次元において上
記の映像フレームのデータに対して実行され、時間的周
波数ドメインにおける係数が形成される。変換係数の三
次元離散的コサイン変換グループは、８ｘ８のマトリク
スのグループとして順序付けされ、マトリクスの数は、
処理されるフレームのグループに使用されるフレームの
数に等しい。

【００２０】データに対して実行される空間的及び時間
的ドメインにおける上記の離散的コサイン変換の後に、
プロセッサは、ステップ７０において、各時間的周波数
におけるレートを最適化する時間的量子化ベクトル成分
を決定することにより、メモリ２０の映像データのフレ
ームの各グループに対し三次元量子化マトリクスを適応
的に形成する。

【００２１】又、ステップ７０において、この方法は、
送信される映像フレームの特定のシーケンスに対し最適
な歪又はエラーを計算する。更に、ステップ７０におい
て、最適な送信ビットレートも、以下に詳細に述べるよ
うに計算される。最適な歪及びビットレート送信の計算
に続いて、ステップ７２において、この方法は、ステッ
プ７０で形成されたマトリクスの係数を、それら係数か
ら時間的スケーリングファクタＣ_ｗを除去することによ
り、量子化解除する。ステップ７４において、この方法
は、逆一次元ＤＣＴを実行して時間的ドメインから係数
を除去し、これにより、マトリクスを、信号データの空
間的位置を表す係数を伴う二次元ＭＰＥＧマトリクスに
復帰させる。本発明による圧縮方法は、三次元マトリク
スを量子化解除し、そして送信に続いて係数に対して逆
一次元ＤＣＴ機能を実行し、三次元ＤＣＴの時間的圧縮
の利点を取り入れると共に、信号圧縮解除装置がフレー
ム内コード化フレームをＭＰＥＧ対応形態で受け取るよ
うな仕方でデータを送信する。

【００２２】ステップ７６において、プロセッサは、特
定の処理されたフレームグループに対し各係数がゼロで
ある確率を決定し、そしてそれに応じて係数を、従来の
ＭＰＥＧデータ圧縮方法に使用されるジグザグ送信ブロ
ック順序で配列する。このジグザグ順序の送信ブロック
に係数が配置されるのに続いて、データは、ステップ７
８において、信号圧縮解除装置４２へ送信される。送信
に続いて、ジグザグ順序にされたデータブロックは、ス
テップ８０において、信号圧縮解除装置により二次元Ｍ
ＰＥＧ空間位置係数マトリクスに戻るように再フォーマ
ットされる。その後、ステップ８２において、信号圧縮
解除装置のプロセッサ４２は、逆二次元離散的コサイン
変換を実行し、空間的周波数ドメインＣ_ｕｖｔの映像デ
ータを空間的位置ドメインに復帰させる。但し、Ｎは８で、ピクセルブロックの片側のサイズであ
り、そしてＤ（ｕ）及びＤ（ｖ）は既に定義されてい
る。ステップ８３において、この方法は、動き補償の重
みをデータから除去する。ステップ８４において、再構
成された映像フレームが形成され、ビデオモニタ２６に
出力される。

【００２３】上記の圧縮方法においては、この方法が現
在のＭＰＥＧ対応の映像システムにおいて実施されて、
約４０：１の圧縮率を達成することが示されたが、これ
は、現在のＭＰＥＧ−２シンタックスの典型的な３０：
１の圧縮率に比して著しい増加である。上記の三次元Ｄ
ＣＴをベースとする方法は、４ないし８の映像フレーム
を時間的に圧縮し、従って、商業標準のＭＰＥＧ−１及
び２シンタックスよりも潜在的に高い圧縮性能を有す
る。このＭＰＥＧ−１及び２シンタックスは、典型的
に、時間的冗長性を最適化するために８個未満のフレー
ムを使用し、そして一度に２フレームの時間的圧縮しか
使用しない。時間的圧縮を最適化した後に、ＭＰＥＧ対
応のアルゴリズムが、ＭＰＥＧに適合する二次元データ
フォーマットを残して、時間的次元をデータ送信の前に
圧縮解除する。従って、送信及び圧縮レートは、時間的
圧縮解除又は量子化解除及び逆変換が実行された後に決
定される。

【００２４】この点において、上記方法では、全ての時
間的周波数歪を同じ値にセットするか、又は各時間的周
波数に割り当てられた所与の目標レートに対して歪を最
小にするように時間的スケーリングパラメータを選択で
きることが明らかであろう。

【００２５】図７を参照すれば、本発明の好ましい実施
形態による第２のデータ圧縮方法が一般的に９０で示さ
れている。この第２のデータ圧縮方法は、映像フレーム
係数が三次元的に変換された後に送信順序の最適化に着
手するのであって、第１のデータ圧縮方法ＤＣＴにおい
てステップ６４で逆時間的変換が実施された後にＭＰＥ
Ｇのジグザグ順序を使用するものではない。ステップ９
２において、元の映像フレームが映像信号源１２から圧
縮装置に入力される。プロセッサ１８は、最初に、ステ
ップ９４においてフレームに対し動き補償を実行する。
ステップ９６及び９８において、この方法は、上記第１
の圧縮解除方法の場合と同様に、二次元の空間的及び一
次元の時間的ＤＣＴ変換を映像データに対して各々実行
する。更に、ステップ１００において、上記第１の方法
の場合と同様に、三次元の量子化マトリクスが適応的に
形成される。

【００２６】しかしながら、第２の方法は、ステップ１
０１において、ヒストグラムチップ３２が三次元マトリ
クスにおける量子化された係数のヒストグラムを形成す
る点で相違し、従って、この方法は、三次元係数送信順
序（即ち、三次元のジグザグ順序）ブロックを適応的に
形成する。従って、ヒストグラムチップは、ヒストグラ
ムが収集する情報に基づいて１つの三次元マトリクスを
別の三次元マトリクスに変換するために圧縮装置によっ
て使用されるヒストグラムを発生する。空間的一時間的
周波数の増加に基づく順序付け、即ちは、送信順序に対するＭＰＥＧ解決策を表す。本発明の
データ圧縮方法は、送信順序を確率_ｕｖｗ＝０に適応
させ、従って、フレームの各グループごとに三次元のゼ
ロ連続長さを最適化することによりＭＰＥＧ方法を改善
する。従って、圧縮されたビット流は、最小の確率がゼ
ロである係数が最初に送信され、最小の確率がゼロであ
る係数が確率が増加する順に送信されるように順序付け
される。ジグザグ順序において、量子化解除された係数
の第１マトリクスの第１行は、最小数のゼロをもつフレ
ームの処理されたグループからの列である。量子化解除
された係数の第１マトリクスの第２行は、２番目に少な
い数のゼロをもつフレームの処理されたグループからの
列である。第１マトリクスの残りの行は、列におけるゼ
ロ係数の数に関して同様の順序で埋められる。第２マト
リクスの行は、非ゼロの係数をもつ残りの列がある場合
に埋められる。ブロック終了キャラクタは、非ゼロの係
数をもつ新たなマトリクスシステムの最後の行が送信さ
れた後に送信される。これは、エネルギーをもたずに送
信されるデータであってゼロ値をもつ係数で表されるデ
ータの量を最小にする。圧縮解除装置は、その後、他端
において、送信されたビット流の残りにゼロを埋めた後
に、データの圧縮解除を開始する。

【００２７】空間的一時間的周波数の増加に伴うＭＰＥ
Ｇ同様の順序付けは、データ送信の際に三次元のジグザ
グブロックが送信されるために失われる。というのは、
このブロックは、逆一次元変換が行われる前に再順序付
けしなければならないからである。しかしながら、高圧
縮の方法で送信されるゼロの数を切断しそして三次元ブ
ロックにおいてデータを送信することにより、ゼロ連続
長さが２つの異なる方向に増加され、これにより、ＭＰ
ＥＧ対応の方法よりも圧縮性が約５倍も増加する。

【００２８】三次元のジグザグ順序のブロックが実施さ
れるのに続いて、ステップ１０２においてマトリクス係
数が送信される。信号データを送信した後に、この方法
は、ステップ１０４において、三次元のジグザグ送信順
序ブロックを復帰させ、その後、逆一次元及び逆二次元
のＤＣＴ変換を各々ステップ１０６及び１０８において
実行することができる。その後、動き補償が除去され、
そしてステップ１１０及び１１２において、映像フレー
ムが再構成されそしてビデオモニタ２６へ出力される。

【００２９】以上のことから明らかなように、一般に、
上記両方の方法に時間次元の量子化マトリクスを使用す
ることにより、圧縮比を最適化できると同時に、信号歪
の量を人間の目で分からないレベルに維持することがで
きる。かくて、信号圧縮が最大にされる一方、計算の複
雑さが最小にされた。

【００３０】図８を参照すれば、上記データ圧縮方法に
より行われる送信レートの計算を示すフローチャートが
一般的に１２０で示されている。送信レートは、係数の
擬似確率分布に基づきエントロピー計算を用いて計算さ
れ、実際のＭＰＥＧシンタックス計算には基づかない。
エントロピー計算は、送信レートを若干過大に推定す
る。エントロピー計算は、量子化された全ての係数を加
味するが、ＭＰＥＧ方法は、係数がＭＰＥＧ規格により
定められたある最小又は最大限界を越える場合に係数を
切断する。ハフマンコードを用いたレート決定のための
式は、次の通りである。但し、ｐは、非ゼロ変換係数の確率ベクトルであり、Ｌ
_ｉは、ゼロ連続長さ＋１であり、そしてｐ_ｉは、ｉ個の
ゼロの和の確率である。インターネットにおいて一般に
入手できるＭＰＥＧソフトウェアを、エントロピー計算
に代わって使用することができる。

【００３１】ステップ１２２に示されたように、映像信
号データが入力される。このデータは、上記第１及び第
２の方法の各々ステップ６０及び９８で得られた三次元
量子化マトリクスを埋める三次元量子化係数に相関して
いる。ステップ１２４において、量子化装置は、小さな
増分で徐々にステップアップされる。各時間的周波数に
おいて、時間的量子化装置のスケーリング項が、その時
間的周波数におけるレート・歪性能の最適化から決定さ
れる。ステップ１２６において、歪レートが計算され
る。最適なは、送信レート対時間的量子化成分ｑｗを
プロットすることにより計算される。このようなプロッ
トは、図１０に１２７で一般的に示すように、最小のレ
ート値をもつ曲線を形成する。ステップ１２８におい
て、プロセッサは、この形成された曲線１２７のポイン
トを次々に選択することによりの最小値が見つかった
かどうか決定する。ステップ１３０において、この方法
は、プロセッサがの最小値を見つけたかどうか決定す
る。プロセッサが最小値を見つけた場合には、値ｑｗ
は、値（ｑｗ）を最小にするようにセットされる。
は、フレームのグループに対する平均レートの近似であ
り、これは、通常はフレームのグループの第１フレーム
に対するレートである。レートの最適化に対しては、フ
レームのグループのレートを表すのに１フレームを使用
すれば通常は充分である。最小値が見つからない場合に
は、この方法は、ステップ１２８へ戻り、の最小値を
サーチし続ける。ステップ１３０に続いて、この方法
は、ステップ１３２へ進み、各（ｑｗ）の全送信レー
トがｑｗに対して計算されるまでステップ１２４ないし
１３２がｑ_ｗ１、ｑ_ｗ２、・・・に対して繰り返され
る。ステップ１３４において、この方法は、ｑ_ｗの次の
値がｑ_ｗ８に等しいかどうか決定する。もしそうであれ
ば、この方法は、次のグループのフレームが圧縮される
まで終了となる。ｑ_ｗ８が計算されていない場合には、
この方法は、ステップ１２４へ復帰し、更なる送信レー
ト計算が行われる。

【００３２】同様に、図９に示すように、信号歪の最適
化計算を実行する好ましい方法が１５０で示されてい
る。ステップ１５２において、スケーリングファクタｑ
_ｗが増加される。歪レートＤは、ステップ１５４で示す
ように、プロセッサ１８において送信レートの計算と並
列に計算される。歪レートは、次のように計算される。図示されたように、歪レートは、時間的量子化ベクトル
の重み付けファクタを伴ったり伴わなかったりする係数
間の差の平方である。特定の係数に対する個々のエラー
作用の各々の和が量子化による全歪エラーを与える。
は、真の圧縮率の推定値であり、これは、レート最適化
手順の間に時間的量子化ベクトルの項をセットするのに
使用される性能尺度である。は、次のように計算され
る。ｑｗ値における１組の量子化された係数が作られ、
三次元量子化係数が時間的に量子化解除され、逆一次元
ＤＣＴ変換が行われる。次いで、フレームの対するレー
トが決定され、に等しくセットされる。このプロセス
は、各時間的周波数に対して最小のがセットされるま
で繰り返される。

【００３３】ステップ１５６において、この方法は、Ｄ
（ｑ_ｗ）が人間の視覚系統のスレッシュホールドより大
きいかどうか決定する。歪がスレッシュホールドより大
きい場合には、この方法はステップ１５２へ戻り、Ｄ
（ｑ_ｗ）の値が人間の視覚系統のスレッシュホールドよ
り大きくなるまで歪が計算される。このような値になる
と、ステップ１５８に示すように、ｑ_ｗの繰り返しが停
止される。

【００３４】ステップ１６０において、次の映像フレー
ムに対する次の空間的送信マトリクスの歪レートが計算
される。ステップ１６２において、この方法は、８個の
映像フレームより成るグループが圧縮されると仮定すれ
ば、ｗ＝０からｗ＝７までの全てのｗの値に対しＤ（ｑ
_ｗ）が計算されたかどうか決定する。この方法が終了し
た場合には、次のグループのフレームからのデータが処
理のために入力されるまで、この方法は終了となる。こ
の方法が終了しない場合には、ステップ１５２へ戻り、
次のｑ_ｗに対する歪レートの計算を続行する。

【００３５】この点において、本発明の方法に対し通常
はｑ_ｗ０及びｑ_ｗ１のみが実際に歪レート及びビットレ
ート送信計算に測定可能な作用を及ぼすだけであること
が明らかとなろう。従って、ｑ_ｗ２ないしｑ_ｗ７の値
は、上記データ圧縮方法を更に簡単化するためにデフォ
ールト値にセットすることができる。又、本発明の圧縮
方法のレート／歪シーケンスは、ＤＣ及びＡＣの両係数
を別々に最適化することによって改善できることも明ら
かとなろう。又、レート／歪最適化方法は、ラグランジ
ェ乗数方法を用いても改善することができる。

【００３６】本発明の方法は、時間的冗長性により時間
的圧縮の使用を最大にし、これにより、データ圧縮に必
要な量子化変数の数、ひいては、データ圧縮動作の複雑
さを最小にする。本発明のデータ圧縮方法は、現在のＭ
ＰＥＧ−１及びＭＰＥＧ−２に基づくデータ圧縮方法に
比して高い圧縮比を示すと同時に、データ圧縮の複雑さ
を最小にする。

【００３７】以上の説明、添付図面及び特許請求の範囲
から、当業者であれば、本発明の他の種々の効果が明ら
かとなろう。

【図面の簡単な説明】

【図１】本発明の信号圧縮方法が実施される信号圧縮装
置のブロック図である。

【図２】本発明の信号圧縮方法が実施される信号圧縮解
除装置のブロック図である。

【図３】本発明のデータ圧縮方法により圧縮されるべき
データを含む一連の映像フレームのグループを示した図
である。

【図４】図３の映像フレームに含まれたデータに対して
離散的コサイン変換を実行した後の一連の二次元変換フ
レームを示す図である。

【図５】図３の映像フレームに含まれたデータに対して
一次元の離散的コサイン変換を実行した後の三次元係数
を含む三次元量子化マトリクスを示す図である。

【図６】本発明の第１の圧縮方法を実施する好ましい方
法を示したフローチャートである。

【図７】本発明の第２のデータ圧縮方法を実施する好ま
しい方法を示したフローチャートである。

【図８】本発明のデータ圧縮方法に使用するための最適
な送信レートを計算する好ましい方法を示したフローチ
ャートである。

【図９】本発明のデータ圧縮方法に使用するための最適
な歪レートを計算する好ましい方法を示したフローチャ
ートである。

【図１０】データ送信レート対時間的周波数量子化ベク
トル重み付けファクタのグラフ分析図である。

【符号の説明】

１０ａ、１０ｂ本発明の方法を実施するシステム１２映像信号源１４アナログ／デジタル映像フレームグラバ１６信号圧縮装置１８プロセッサ２０メモリ２２電源２４ハードドライブ３０ＡＳＩＣ３２ヒストグラムチップ４０信号圧縮解除装置４２プロセッサ４４ＡＳＩＣ４６メモリ４８電源５０ビデオモニタ

フロントページの続き (56)参考文献特開平３−217183（ＪＰ，Ａ) 特開平５−68244（ＪＰ，Ａ) 特開平２−72720（ＪＰ，Ａ) 特開平５−219490（ＪＰ，Ａ) 特開平５−244581（ＪＰ，Ａ) 特開平６−86248（ＪＰ，Ａ) １．電子情報通信学会論文誌、Ｊ78− Ａ［７］（1995−７−25）ｐ．839−847 （適応型３次元走査を用いた画像変換符号化、図４参照) ２．ＩＥＥＥＴＲＡＮＳＡＣＴＩＯＮＳＯＮＧＥＯＳＣＩＥＮＣＥＡＮＤＲＥＭＯＴＥＳＥＮＳＩＮＧＶＯＬ．33［１］（1995．１）Ｐ．26− 34（Ｐ．30のＢ．ＳｉｄｅＩｎｆｏｒｍａｔｉｏｎａｎｄＲａｔｅＡｌｌｏｃａｔｉｏｎ参照) (58)調査した分野(Int.Cl.⁷，ＤＢ名) H04N 7/24 - 7/68

Claims

(57)【特許請求の範囲】

【請求項１】映像信号データを圧縮する信号圧縮装置
を用意し、複数の映像信号フレームからの空間的及び時間的データ
を含む映像信号を前記の信号圧縮装置で受け取り、空間的位置ドメインから空間的周波数ドメインへ前記の
空間的データを変換し、そして時間的位置ドメインから
時間的周波数ドメインへ前記の時間的データを変換する
ことにより、前記の空間的データと時間的データを異な
るドメインに変換し、その変換された空間的及び時間的データを量子化して前
記の変換された空間的データを前記の変換された時間的
データと組み合わせ、前記の変換され、量子化された時間的データの量子化を
解除して前記の変換された空間的データから前記の変換
された時間的データを取り除き、そして前記の変換され
た空間的データをジグザグ構成ブロックのマトリックス
にフォーマットし、その場合前記の変換された空間的デ
ータをジグザグ構成ブロックに配列する順序は増大する
空間的周波数に基づいていることを特徴とする映像信号
データを圧縮する方法。
【請求項２】前記のジグザグ構成ブロックを信号圧縮
解除装置に送信する段階と、送信されたジグザグ構成ブロックから前記の映像信号デ
ータを再構成する段階とを更に含む請求項１に記載の方
法。
【請求項３】前記の映像信号データを再構成する段階
は、前記のドメイン変換された空間的データの前記のジグザ
グ構成ブロックを復帰させる段階と、前記のドメイン変換された空間的データに逆変換を行っ
て、前記の映像信号フレームを再構成する段階とを含む
請求項２に記載の方法。
【請求項４】前記の空間データをドメイン変換する段
階は、前記のデータの二次元の離散的コサイン変換を実行する
ことを含み、前記の時間的データをドメイン変換する段階は前記のデ
ータの一次元の離散的コサイン変換を実行することを含
む請求項１に記載の方法。
【請求項５】映像データの複数のフレームを含む映像
信号を受ける信号入力と、映像信号圧縮装置と、送信器
と、信号圧縮解除装置とを備え、前記の映像信号圧縮装置は、二次元変換を使って空間ドメインデータを周波数ドメイ
ンデータに変換し、そして一次元離散余弦変換を使って
時間ドメインデータを周波数ドメインデータに変換する
プロセッサを含み、このプロセッサは、前記の変換され
た空間的及び時間的データを、メモリの量子化マトリッ
クスへロードして量子化を行い、そしてこの量子化マト
リックスにおける前記のデータに基づいて信号歪みと送
信レート最適化計算を実行し、前記のプロセッサは、前記の時間的データの量子化を解
除し、そして前記の信号歪と送信レート最適化計算の実
行の後に前記の時間的データに対して逆変換を実施し、前記のプロセッサは、その後、前記の量子化された空間
的データを、それの送信の前にジグザグ送信順序ブロッ
クの形に構成し、その場合前記の変換された空間的デー
タをジグザグ構成ブロックに配列する順序は増大する空
間的周波数に基づいており、前記の送信器は前記の圧縮された映像信号データを前記
のプロセッサから送信し、そして前記の信号圧縮解除装
置は、前記のプロセッサから送信された前記のデータを
受け、そして前記のジグザグ送信順序から前記のデータ
を再構成した後に、前記のデータの逆変換を行って、前
記の映像データフレームを再構成することを特徴とする
映像信号データを送信するシステム。